Google 今年的 I/O 開發者大會一口氣發布了大量內容,CEO 在開場即定調:AI 產業已進入新階段,重點不再是技術本身,而是讓 AI 真正在產品層面創造價值。以下是本次大會的完整整理。
規模數據
Token 處理量是衡量 AI 採用規模最直接的指標。兩年前,Google 各產品每月合計處理 9.7 兆 tokens;去年 I/O 時成長至約 480 兆;今年直接跳升至每月超過 3.2 千兆(quadrillion),七倍增幅。
開發者與企業側數據同樣顯著:每月有超過 850 萬名開發者使用 Google 模型構建應用;模型 API 目前每分鐘處理約 190 億 tokens;過去 12 個月中,超過 375 家 Google Cloud 客戶各自處理了超過 1 兆 tokens。
Google 目前擁有 13 個月活躍用戶超過 10 億的產品,其中 5 個超過 30 億。AI Overviews 月活躍用戶達 25 億;AI Mode 在推出後僅一年便突破 10 億月活,用戶使用行為也從單次查詢演變為持續對話。Gemini 應用去年 I/O 時月活為 4 億,今年超過 9 億,日請求量增長超過七倍。Nano Banana 圖像生成模型累計生成圖像超過 500 億張。
基礎設施
2022 年 Google 年度資本支出為 310 億美元,今年預計將達到約 1,800 億至 1,900 億美元,約為六倍。
晶片層面,Google 發布第八代 TPU,首次採用雙晶片策略,訓練與推理分別配置專屬架構:
TPU 8t 用於大規模預訓練,原始算力約為上一代的三倍。結合 JAX 與 Pathways,訓練不再局限於單一資料中心,可跨多地分散式進行。全球可存取的 TPU 數量超過 100 萬顆,形成全球最大規模訓練叢集,模型訓練時間從數月縮短至數週。
TPU 8i 專為推理設計,進行全面速度優化。兩款晶片的能源效率均約為前代的兩倍。
新模型
Gemini Omni
AI 正從文字預測轉向現實模擬。Gemini Omni 是 Google 發布的多模態世界模型,可接受任意模態輸入並生成任意模態輸出,初始版本主要輸出影片,後續將支援圖像與文字。Gemini Omni Flash 即日起在 Gemini 應用、Google Flow 及 YouTube Shorts 上線,API 存取將在未來數週開放給開發者與企業客戶。
主要能力包括:透過自然語言對話逐步編輯影片,每條指令基於前一條疊加;對重力、動能、流體動力學等物理法則有更準確的理解;支援圖像、文字、影片、音訊同時作為輸入;以及讓用戶創建自己的數位分身。
不過,部分用戶初測後指出,Omni 的視頻生成效果目前遜於 Seedance 2.0。
Gemini 3.5 Flash
Google 今日發布 Gemini 3.5 Flash,定位為兼具前沿智能與輕量性能的下一代模型。
與 3.1 Pro 相比,3.5 Flash 在多項基準測試上表現更優,包括 Terminal-Bench 2.1(76.2%)、GDPval-AA(1656 Elo)、MCP Atlas(83.6%),以及多模態理解的 CharXiv Reasoning(84.2%)。速度方面,每秒輸出 tokens 數量是其他前沿模型的四倍。
價格方面,3.5 Flash 的成本不到同級前沿模型的一半。Google 估算,若頂尖企業將 80% 的工作負載從其他前沿模型切換至 3.5 Flash,每年可節省超過 10 億美元。
Gemini 3.5 Flash 即日起對所有用戶與 API 開放;Gemini 3.5 Pro 目前在 Google 內部使用,下個月將對外發布。
Antigravity 2.0:Agent 開發平台
Antigravity 從 AI 程式設計環境擴展為完整的自主 AI Agent 開發與管理平台。Antigravity 2.0 是一款新的獨立桌面應用,作為 Agent 互動的中央樞紐,使用者可在此協調各類 Agent 處理不同任務。速度方面,此版本使用經過特別優化的 Flash,比其他前沿模型快 12 倍。
Gemini Spark:全天候個人 AI Agent
Gemini 應用即將推出個人 AI Agent—Gemini Spark—在用戶授權下代為在數位世界中採取行動。
主要特性:運行於 Google Cloud 專屬虛擬機器,提供 7×24 小時持續運作;由 Gemini 3.5 與 Antigravity 驅動,可在背景處理長時間任務;初期整合 Google 自有工具,未來數週將透過 MCP 整合第三方工具;支援在 Gemini 應用內互動,未來亦可透過電子郵件與即時訊息操作;今年稍晚將在 Android 上透過新 UI 介面 Android Halo 查看 Agent 即時進度;今年夏天,Spark 將直接在 Chrome 中運行,成為跨頁面的 Agent 瀏覽器。
Spark 本週起對受信任的測試用戶開放,Beta 版下週向美國 Google AI Ultra 訂閱者推出。
搜尋的 Agent 化
資訊 Agent:用戶可設置個人化 AI Agent 持續在背景運行,主動尋找必要資訊並在適當時機協助採取行動。今年夏天起向 Google AI Pro 與 Ultra 訂閱者推出。
生成式 UI:結合 Gemini 3.5 Flash 與 Antigravity,搜尋將為每個問題動態生成定制化介面,包括個人化版面與互動視覺內容。今年夏天對所有用戶免費開放。
持久化看板:針對需要持續追蹤的長期任務,搜尋允許用戶建立自定義看板或追蹤工具,類似為特定任務量身打造的迷你應用。未來數月起向美國 Google AI Pro 與 Ultra 訂閱者開放。
其他發布內容
Daily Brief:整合收件匣、日曆與任務,生成個人化每日摘要,並提供優先排序與下一步建議。
Google Flow:面向所有用戶的新 Agent,支援規劃與處理複雜任務,可在 Flow 內直接進行各類創意工具的 vibe coding。
Google Pics:基於最新 Nano Banana 模型的 AI 圖像創作與編輯工具,將圖像中每個元素視為獨立物件,支援精確創建、替換與調整特定細節。目前向受信任的 Beta 用戶開放,今年夏天晚些時候推出至 Google AI Pro 與 Ultra 的 Workspace 訂閱者。
智能眼鏡:分為音訊眼鏡(類似耳機形態,提供語音提示)與顯示眼鏡(可顯示資訊)兩種類型,均支援免手操作 Gemini。音訊眼鏡將於今年秋天上市。
Gemini for Science:面向科學研究的 AI 工具集,整合 Gemini 深度推理、Deep Think 與 Deep Research,新增 Science Skills,透過 Antigravity 等 Agent 平台連接超過 30 個主要生命科學資料庫與工具。
從 TPU 8i 到 Gemini 3.5,再到 Antigravity 與 Spark,Google 今年 I/O 呈現的是一套從晶片到應用、全面走向 Agent 化的完整體系。









非常精準及詳細,謝謝分享!
看完後感覺為未來充滿期待