Google I/O 2026 全面回顧

從晶片到應用的 AI Agent 化

May 20, 2026

Google 今年的 I/O 開發者大會一口氣發布了大量內容，CEO 在開場即定調：AI 產業已進入新階段，重點不再是技術本身，而是讓 AI 真正在產品層面創造價值。以下是本次大會的完整整理。

規模數據

Token 處理量是衡量 AI 採用規模最直接的指標。兩年前，Google 各產品每月合計處理 9.7 兆 tokens；去年 I/O 時成長至約 480 兆；今年直接跳升至每月超過 3.2 千兆（quadrillion），七倍增幅。

開發者與企業側數據同樣顯著：每月有超過 850 萬名開發者使用 Google 模型構建應用；模型 API 目前每分鐘處理約 190 億 tokens；過去 12 個月中，超過 375 家 Google Cloud 客戶各自處理了超過 1 兆 tokens。

Google 目前擁有 13 個月活躍用戶超過 10 億的產品，其中 5 個超過 30 億。AI Overviews 月活躍用戶達 25 億；AI Mode 在推出後僅一年便突破 10 億月活，用戶使用行為也從單次查詢演變為持續對話。Gemini 應用去年 I/O 時月活為 4 億，今年超過 9 億，日請求量增長超過七倍。Nano Banana 圖像生成模型累計生成圖像超過 500 億張。

基礎設施

2022 年 Google 年度資本支出為 310 億美元，今年預計將達到約 1,800 億至 1,900 億美元，約為六倍。

晶片層面，Google 發布第八代 TPU，首次採用雙晶片策略，訓練與推理分別配置專屬架構：

TPU 8t 用於大規模預訓練，原始算力約為上一代的三倍。結合 JAX 與 Pathways，訓練不再局限於單一資料中心，可跨多地分散式進行。全球可存取的 TPU 數量超過 100 萬顆，形成全球最大規模訓練叢集，模型訓練時間從數月縮短至數週。

TPU 8i 專為推理設計，進行全面速度優化。兩款晶片的能源效率均約為前代的兩倍。

新模型

Gemini Omni

AI 正從文字預測轉向現實模擬。Gemini Omni 是 Google 發布的多模態世界模型，可接受任意模態輸入並生成任意模態輸出，初始版本主要輸出影片，後續將支援圖像與文字。Gemini Omni Flash 即日起在 Gemini 應用、Google Flow 及 YouTube Shorts 上線，API 存取將在未來數週開放給開發者與企業客戶。

主要能力包括：透過自然語言對話逐步編輯影片，每條指令基於前一條疊加；對重力、動能、流體動力學等物理法則有更準確的理解；支援圖像、文字、影片、音訊同時作為輸入；以及讓用戶創建自己的數位分身。

不過，部分用戶初測後指出，Omni 的視頻生成效果目前遜於 Seedance 2.0。

Gemini 3.5 Flash

Google 今日發布 Gemini 3.5 Flash，定位為兼具前沿智能與輕量性能的下一代模型。

與 3.1 Pro 相比，3.5 Flash 在多項基準測試上表現更優，包括 Terminal-Bench 2.1（76.2%）、GDPval-AA（1656 Elo）、MCP Atlas（83.6%），以及多模態理解的 CharXiv Reasoning（84.2%）。速度方面，每秒輸出 tokens 數量是其他前沿模型的四倍。

價格方面，3.5 Flash 的成本不到同級前沿模型的一半。Google 估算，若頂尖企業將 80% 的工作負載從其他前沿模型切換至 3.5 Flash，每年可節省超過 10 億美元。

Gemini 3.5 Flash 即日起對所有用戶與 API 開放；Gemini 3.5 Pro 目前在 Google 內部使用，下個月將對外發布。

Antigravity 2.0：Agent 開發平台

Antigravity 從 AI 程式設計環境擴展為完整的自主 AI Agent 開發與管理平台。Antigravity 2.0 是一款新的獨立桌面應用，作為 Agent 互動的中央樞紐，使用者可在此協調各類 Agent 處理不同任務。速度方面，此版本使用經過特別優化的 Flash，比其他前沿模型快 12 倍。

Gemini Spark：全天候個人 AI Agent

Gemini 應用即將推出個人 AI Agent—Gemini Spark—在用戶授權下代為在數位世界中採取行動。

主要特性：運行於 Google Cloud 專屬虛擬機器，提供 7×24 小時持續運作；由 Gemini 3.5 與 Antigravity 驅動，可在背景處理長時間任務；初期整合 Google 自有工具，未來數週將透過 MCP 整合第三方工具；支援在 Gemini 應用內互動，未來亦可透過電子郵件與即時訊息操作；今年稍晚將在 Android 上透過新 UI 介面 Android Halo 查看 Agent 即時進度；今年夏天，Spark 將直接在 Chrome 中運行，成為跨頁面的 Agent 瀏覽器。

Spark 本週起對受信任的測試用戶開放，Beta 版下週向美國 Google AI Ultra 訂閱者推出。

搜尋的 Agent 化

資訊 Agent：用戶可設置個人化 AI Agent 持續在背景運行，主動尋找必要資訊並在適當時機協助採取行動。今年夏天起向 Google AI Pro 與 Ultra 訂閱者推出。

生成式 UI：結合 Gemini 3.5 Flash 與 Antigravity，搜尋將為每個問題動態生成定制化介面，包括個人化版面與互動視覺內容。今年夏天對所有用戶免費開放。

持久化看板：針對需要持續追蹤的長期任務，搜尋允許用戶建立自定義看板或追蹤工具，類似為特定任務量身打造的迷你應用。未來數月起向美國 Google AI Pro 與 Ultra 訂閱者開放。

其他發布內容

Daily Brief：整合收件匣、日曆與任務，生成個人化每日摘要，並提供優先排序與下一步建議。

Google Flow：面向所有用戶的新 Agent，支援規劃與處理複雜任務，可在 Flow 內直接進行各類創意工具的 vibe coding。

Google Pics：基於最新 Nano Banana 模型的 AI 圖像創作與編輯工具，將圖像中每個元素視為獨立物件，支援精確創建、替換與調整特定細節。目前向受信任的 Beta 用戶開放，今年夏天晚些時候推出至 Google AI Pro 與 Ultra 的 Workspace 訂閱者。

智能眼鏡：分為音訊眼鏡（類似耳機形態，提供語音提示）與顯示眼鏡（可顯示資訊）兩種類型，均支援免手操作 Gemini。音訊眼鏡將於今年秋天上市。

Gemini for Science：面向科學研究的 AI 工具集，整合 Gemini 深度推理、Deep Think 與 Deep Research，新增 Science Skills，透過 Antigravity 等 Agent 平台連接超過 30 個主要生命科學資料庫與工具。

從 TPU 8i 到 Gemini 3.5，再到 Antigravity 與 Spark，Google 今年 I/O 呈現的是一套從晶片到應用、全面走向 Agent 化的完整體系。

Discussion about this post

Ready for more?