Google เผยวิสัยทัศน์ที่น่าประทับใจในการบูรณาการ AI เข้ากับ Gmail, Photos และอื่นๆ

หนึ่งวันหลังจาก OpenAI จัดแสดงโมเดล ChatGPT ที่ปรับปรุงแล้ว Google ได้เปิดเผยวิสัยทัศน์ในการบูรณาการ AI เข้ากับผลิตภัณฑ์ในชีวิตประจำวันในการประชุมนักพัฒนา Google I/O การอัปเดตเหล่านี้มีเป้าหมายเพื่อขยายไปไกลกว่าธุรกิจโฆษณาหลักของ Google รวมถึงอุปกรณ์ใหม่และเครื่องมือที่ขับเคลื่อนด้วย AI Sundar Pichai ซีอีโอของ Google ตั้งข้อสังเกตว่า “AI” ได้รับการกล่าวถึง 120 ครั้งในระหว่างการนำเสนอ ติดตามโดยแพลตฟอร์ม AI ของพวกเขา Gemini คำปราศรัยของ Google แสดงให้เห็นถึงบทบาทของ AI ในงานประจำวัน เช่น การแบ่งปันข้อมูล การโต้ตอบ การค้นหาวัตถุ การจัดตารางเวลา การซื้อของ และการใช้อุปกรณ์ Android โดยมีเป้าหมายที่จะบูรณาการ AI เข้ากับทุกด้านของชีวิต

Pichaiเปิดงานโชว์ฟีเจอร์ใหม่ของโมเดล AI ล่าสุดของ Google Gemini 1.5 Pro “Ask Photos” คือการให้ข้อมูลเชิงลึกเกี่ยวกับรูปภาพหรือเหตุการณ์เฉพาะ เช่น การถามถึงช่วงเวลาเมื่อลูกสาวของพวกเขาเรียนรู้ที่จะว่ายน้ำหรือการช่วยจำหมายเลขป้ายทะเบียนของผู้ใช้ โดยการเรียกดูรูปภาพที่บันทึกไว้ นอกจากนี้ เขายังแสดงให้เห็นว่า Gemini 1.5 Pro สามารถสรุปอีเมลล่าสุดจากโรงเรียนของเด็กได้โดยการวิเคราะห์ไฟล์แนบ เน้นประเด็นสำคัญ และสร้างรายการดำเนินการได้อย่างชาญฉลาด สิ่งนี้เกิดขึ้นหนึ่งวันหลังจากที่ OpenAI เปิดตัว GPT-4o โดยมีเป้าหมายที่จะปรับปรุง ChatGPT ให้เป็นผู้ช่วยดิจิทัลที่จัดการการสนทนาแบบเรียลไทม์และการโต้ตอบตามการมองเห็น Google ยังแสดงให้เห็นถึงความสามารถของ Gemini 1.5 Pro ในการประมวลผลข้อความ เสียง และรูปภาพ โดยนำเสนอ “เพื่อนร่วมทีมเสมือนจริง” สำหรับการจัดการงาน

บริษัทได้แสดงการปรับปรุงการค้นหา โดยอนุญาตให้ผู้ใช้สามารถถามคำถามที่ต้องการและรับคำตอบประเภทต่างๆ ตั้งแต่แบบละเอียดไปจนถึงแบบสรุป นอกจากนี้ยังเปิดตัวฟีเจอร์ต่างๆ เช่น การแนะนำร้านอาหารที่เหมาะกับเด็ก และการวินิจฉัยปัญหาอุปกรณ์ผ่าน Google Lens โดยมีจุดประสงค์เพื่อทำให้การค้นหาใน Google ง่ายขึ้น นอกจากนี้ Google ยังเผยถึงProject Astra จากห้องปฏิบัติการ DeepMind AI ซึ่งจะช่วยให้ AI สามารถช่วยเหลือชีวิตประจำวันของผู้ใช้โดยใช้กล้องโทรศัพท์เพื่อตีความข้อมูลเกี่ยวกับสิ่งในโลกความเป็นจริง และ มีการวางแผนบูรณาการฟังก์ชัน AI เข้ากับโทรศัพท์มากขึ้น ช่วยให้งานต่างๆ เช่น การลากและวางรูปภาพที่สร้างโดย AI เครื่องมือ Android ใหม่จะตรวจจับกิจกรรมการโทรที่น่าสงสัย นักวิเคราะห์ Jacob Bourne จาก Emarketer กล่าวถึงการมุ่งเน้นไปที่ AI ในการประชุม

Bourneมองว่าการรับเครื่องมือใหม่นี้เป็นการทดสอบความสามารถในการปรับตัวของ Google ในยุค AI ยุคสร้างสรรค์ Google วางแผนที่จะปรับปรุงการป้องกันการใช้งานในทางที่ผิด โดยขยายฟีเจอร์ SynthID เพื่อตรวจจับเนื้อหาที่สร้างโดย AI บริษัทกำลังร่วมมือกับผู้เชี่ยวชาญเพื่อปรับปรุงโมเดลใหม่ๆ แม้จะมีการเพิ่ม AI เป็นสองเท่า แต่ Google ก็เผชิญกับความท้าทาย เช่น การฟันเฟืองต่อความไม่ถูกต้องในเครื่องมือ AI กำเนิด Gemini Google หยุดการสร้างภาพของ Gemini ชั่วคราวหลังจากวิพากษ์วิจารณ์ถึงผลลัพธ์ที่ไม่ดี มีรายงานว่า Apple กำลังพิจารณาที่จะรวมระบบ Gemini AI ของ Google เข้ากับ iPhone และฟีเจอร์ iOS 18 ในอนาคต พวกเขากำลังพูดคุยกับ OpenAI ผู้สร้าง ChatGPT อีกด้วย

Google unveils an impressive vision for integrating AI with Gmail, Photos, and more. 

A day after OpenAI showcased an improved ChatGPT model, Google revealed its vision for integrating AI into everyday products at the Google I/O developer conference. These updates, aimed at expanding beyond Google’s core advertising business, include new devices and AI-powered tools. Google CEO Sundar Pichai noted that “AI” was mentioned 120 times during the presentation, tracked by their AI platform Gemini. Google’s keynote demonstrated AI’s role in daily tasks like sharing information, interacting, locating objects, organising schedules, shopping, and using Android devices, aiming to integrate AI into all aspects of life.

Pichai opened the event by showcasing new features of Google’s latest AI model, Gemini 1.5 Pro. “Ask Photos” allows deeper insights into photos or specific events, like when their daughter learned to swim or recall their licence plate number, by browsing through saved pictures. Additionally, he showcased how Gemini 1.5 Pro can summarise recent emails from a child’s school by analysing attachments, highlighting key points, and generating action items.

 This came a day after OpenAI introduced GPT-4o, aiming to enhance ChatGPT into a digital assistant handling real-time conversations and vision-based interactions. Google also demonstrated Gemini’s ability to process text, voice, and images, presenting a virtual “teammate” for task management.

The company showcased search improvements, allowing users to ask natural or focused questions and receive various types of responses, from detailed to summarised. It also unveiled features like recommending kid-friendly restaurants and diagnosing gadget issues via Google Lens, aiming to simplify Google searches. Additionally, Google teased Project Astra from its DeepMind AI lab, which uses phone cameras to interpret real-world information. Integration of more AI functions into phones is planned, enabling tasks like dragging and dropping AI-generated images. A new Android tool will detect suspicious call activity. Analyst Jacob Bourne from Emarketer noted the expected focus on AI at the conference.

He sees the reception of the new tools as a test for Google’s adaptability to the generative AI era. Google plans to enhance safeguards against misuse, expanding its SynthID feature to detect AI-generated content. The company is partnering with experts to improve its new models. Despite doubling down on AI, Google faced challenges, such as backlash over inaccuracies in its generative AI tool, Gemini. Google paused Gemini’s image generation after criticism for biassed outputs. Apple is reportedly considering integrating Google’s Gemini AI engine into future iPhones and iOS 18 features. They are also in talks with OpenAI, the creator of ChatGPT.

By CNN NEWS