章節連結
Google I/O 2025 開發者大會於稍早正式登場,本屆不出意外大量聚焦在 AI 與相關領域。除了推出新的 AI 訂閱方案、Gemini 模型技術的進展、AI 在各產品中的整合,以及硬體領域的創新應用。另外宣示重返智慧眼鏡市場,提供更輕巧、舒適的配帶體驗與 Android XR 應用。此外還有強調更真實更立體的遠距離視訊通話解決方案 Google Beam。
新的 AI 訂閱方案與模型更新
Google 推出了名為 Google AI Ultra 的全新訂閱方案。此方案每月訂閱費用高達 249.99 美元,提供完整且最先進的人工智慧模型資源。前三個月提供五折優惠,每月僅收取 124.99 美元費用。訂閱者可以使用最新的 Gemini 模型與相關技術應用服務。Google AI Ultra 方案包含無限使用人工智慧影片創作工具 Flow,以及新版 Veo 3 影片生成工具。此外,還可使用 Gemini 的 Deep Search 深度搜尋功能,並在 Gemini 2.5 Pro 模型中使用 Deep Think 功能進行深度推論。此方案還包含網頁瀏覽代理人工智慧功能「Project Mariner」,並可在 Chrome 瀏覽器或 Gmail、Google Docs 等服務使用完整的 Gemini 服務。
原本的 Google AI Premium 方案已更名為 Google AI Pro。此方案每月費用為 19.99 美元。仍提供第一個月免費試用。
在 Gemini 模型方面,Google 在 Gemini 2.5 Pro 中加入了 Deep Think 功能。此功能讓模型在實際回答使用者提問前,會進一步深層思考再作回答。Deep Think 功能目前是預覽版本。Gemini 2.5 Flash 也有更新,主要改善了執行速度、反應速率,並減少詞元消耗量。此外,也提升了推論、多模態運作、程式編輯、前後長文連貫等應用效能。Gemini 2.5 Flash 預計在今年 6 月初開放所有人使用。Gemini 的文字轉語音 (TTS) 功能變得更加自然,目前已支援包含英語、義大利語、韓語、日語、越語、西班牙語、俄語、法語、土耳其語在內的 24 種語言,並能在特定語言使用狀態下快速切換。
AI 技術在 Google 服務中的整合與應用
Google 推出作為通用人工智慧雛形設計的 「Project Astra」。Project Astra 可識讀螢幕顯示內容,並透過 Gemini 人工智慧回答相關問題。它目前能處理更複雜的任務,例如協助查詢說明書、尋找組裝影片、判斷零件,甚至協助撥打電話詢問店家資訊。Google 將持續精進 Project Astra,使其成為日常生活中的自然互動助理服務。
先前僅限 Pixel 系列手機使用的 Gemini Live 螢幕識讀功能,現在將開放所有相容的 Android 手機及相容的 iOS 裝置使用。使用者可透過 Gemini 人工智慧分析手機相機鏡頭拍攝畫面或螢幕顯示內容。在未來幾週內,Gemini Live 功能將進一步與 Google Maps、Google 行事曆、Keep 等服務連動。當使用者向 Gemini Live 提問時,系統會查看使用者儲存在這些服務中的個人資料,提供更貼切、實用的解答。Google 強調這類服務中的隱私主要由使用者自行控制,且所有運算都在裝置端完成。
Google 也計畫擴大 Gemini Live 的識讀能力,使其能認識更廣泛的「世界」,並驅動未來的通用人工智慧或機器人等實體裝置運作。以 Google Lens 為基礎打造的 Google Search Live 功能,可透過手機鏡頭拍攝景象,並由 Gemini 服務協助搜尋相關解答。使用者需手動點選 Google Lens 的「Live」圖示或將服務切換成 AI Mode 形式來使用此功能。
先前已開放所有美國境內英語使用者使用的 Google Search 「AI Mode」功能,目前已換成以 Gemini 2.5 Pro 模型運作。與先前採用 Gemini 2.0 模型相比,性能大幅提升,並加入更多應用功能。例如,可以透過 Google Search 搜尋特定服飾並配合個人照片進行數位「試穿」。甚至能透過人工智慧協助追蹤價格變化,在商品降價時幫忙下單並透過 Google Pay 完成結帳。
新版 Gmail 結合 Gemini 應用後,將能彙整使用者在不同 Google 服務間存放的資料 (需事先取得同意)。這使得 Gmail 的自動回覆信件功能更為聰明,甚至能讓 Gemini 模仿使用者常用詞彙回覆信件。使用者也能透過 Gemini 管理 Gmail 內的信件,例如過濾並刪除三年前未讀的信件。新版 Gmail 功能將開放 Google Workspace 服務用戶使用,預計在今年夏季開放。
Google 也將 Gemini 帶到 Chrome 瀏覽器。目前 Gemini 僅能回答單一分頁內的內容,但未來將支援分析更多分頁顯示內容。Gemini 也將進駐手錶、車載系統等平台。Google Meet 線上視訊功能加入了即時口譯功能。這讓使用者能在各自以不同語言溝通時,透過人工智慧將口說內容轉換成不同語言,並以使用者口語陳述音色呈現。目前先支援英語與西班牙語,之後會增加更多語言。
Flow
Google 推出結合人工智慧、名為 Flow 的全新影片創作工具。Flow 整合了 Imagen 影像生成和 Veo 影片生成功能。使用者可透過輸入文字描述生成不同分鏡畫面,並產生動態影片,或延展影片長度、調整細節。生成影像畫質清晰自然。Flow 目前先在美國境內向 Google AI Pro 等訂閱方案用戶提供。同時宣布推出的 Veo 3 影片生成工具,加入了可產生聲音內容的功能。產生的聲音內容標榜符合真實場景。Veo 3 目前先在美國境內向 Google AI Pro 等訂閱方案用戶提供,也可透過 Google Cloud 的 Vertex AI 平台取用。
Imagen 4 圖像生成工具也進行更新,標榜能處理更多影像細節,甚至產生高達 2K 解析度影像。為避免過多人工智慧生成內容造成影響,Google 除了在人工智慧工具產生的內容加入 SynthID 數位浮水印,同時也提供可識別 SynthID 的工具資源,並將其對外開源。
Google Beam:更真實的遠距視訊解決方案
Google 在 2021 年提出的 Project Starline 項目,現宣布將以 「Google Beam」 作為正式名稱。這是一個讓人與遠方親友更真實地「面對面」互動的遠距視訊解決方案。改良後的設計只需一台電視和更少攝影機,佔用空間也縮小到一般小型辦公包廂大小。它使用上方、左右兩側總計 6 組鏡頭捕捉使用者身影,並透過人工智慧與 Google Cloud 協同運算,讓拍攝影像在對方螢幕上呈現宛如真人般的 3D 立體影像,並可隨觀看角度改變光影。Google Beam 將在今年稍晚時候由 HP 向特定客戶提供。目前在美國境內已向包含勤業眾信、Salesforce、Citadel 等特定客戶提供。接下來也會與 Zoom 等業者及解決方案業者合作,向全球更多企業、組織提供。
宣示重返智慧眼鏡市場
雖然與三星、Qualcomm 合作 Project Moohan 虛擬視覺頭戴裝置預計今年底前進入市場,但 Google 認為 Project Moohan 更適合在居家環境使用。因此 Google 也宣布將再次佈局更輕巧、時尚的智慧眼鏡市場,並與 Gentle Monster、Warby Parker 合作,共同打造外型時尚且適合配戴的 Android XR 智慧眼鏡。
這類穿戴裝置將以貼近一般眼鏡為主,並會搭載 Gemini 人工智慧技術。智慧眼鏡能隨使用者目光所見提供相關指引,例如顯示即時導航地圖,或進行即時翻譯對話。智慧眼鏡配置內嵌顯示器,讓使用者無須拿出手機即可檢視內容,甚至透過 Gemini 完成信件重點摘要播報。使用者能更容易空出雙手,透過對話方式操作絕大多數功能。Google 在智慧眼鏡市場有多年經驗,預計未來幾個月內會公布更多消息。
延伸閱讀
- Google宣布Gemini正式支援Wear OS智慧手錶,跨品牌均可升級
- 三星公布Galaxy Z Fold7、Z Flip7、Watch8台灣上市資訊,即日起開放預購
- 不擠牙膏!三星推出大改款Z Fold7和Z Flip7摺疊手機,以及Galaxy Watch8系列智慧錶
- 夏普在台發表輕艦機AQUOS R10與入門機種AQUOS wish5
- vivo X Fold5大摺疊機在台發表:輕薄機身內建6000mAh電池與高通8G3等旗艦規格
- Gogoro Network推出「$0月租」資費方案,騎多少付多少,全車系限時設定費全免