2026-06-10 — views
Google 將 Gemini 3.5 Pro 推入最終預覽階段:200 萬 Token 上下文與 Deep Think 推理
為什麼值得讀 定價與免費試用期是開發者最該先確認的兩件事。以每百萬 token 輸入 $15/輸出 $60 的定價,Pro 是被設計來認真使用的,不是拿來試用的。
Gemini 3.5 Pro 進入最終 Vertex 企業版預覽,具備 200 萬 token 上下文視窗與 Deep Think 推理;GA 正式發布預計在 2026 年 6 月即將到來。
發生了什麼
Google 的 Gemini 3.5 Pro 已進入正式發布前的最後限定企業版預覽階段。Sundar Pichai 在 5 月 19 日的 Google I/O 上發布這款模型,並告訴現場觀眾「給我們到下個月的時間」。截至 6 月 10 日,部分 Vertex AI 企業版客戶自 5 月下旬起已獲得存取權,但 Google 官方 API 更新日誌中尚未出現公開的模型 ID,意味著廣泛上線仍未到來——儘管 GA 公告預計隨時可能發布。
此命名標誌著一個世代性的轉變:Gemini 3.5 Pro 承擔了 Gemini Ultra 原先的角色,成為 Google 全新的頂尖模型,定位高於 5 月 19 日發布的 Gemini 3.5 Flash。
確認的規格
| 功能 | 細節 |
|---|---|
| 上下文視窗 | 200 萬 token |
| 推理模式 | Deep Think(延伸推理時間運算) |
| 多模態 | 文字、圖片、音訊、影片 |
| 預期輸入定價 | 每百萬 token 約 $15 |
| 預期輸出定價 | 每百萬 token 約 $60 |
| Flash 參考價格 | 輸入 $1.50 / 輸出 $9.00 每百萬 token |
200 萬 token 上下文視窗是長文件與多儲存庫工作負載的核心亮點。Deep Think 類似於 OpenAI o 系列的思維鏈路徑:模型在回覆前會花費額外的推理時間運算。對於延遲可接受、精確度至關重要的任務——法律文件審閱、多步驟程式碼推理、高難度數學——此模式是預期的入場點。
定價差距是核心取捨
以 Flash 約十倍的成本,Pro 針對真正需要前沿推理深度或延伸上下文的工作負載。Flash 在 I/O 的代理程式碼評估中已超越 Gemini 3.1 Pro;選擇等待 Pro 還是使用 Flash 發布的開發者,現在面臨真實的取捨:Flash 已可用、價格具競爭力、在代理任務上已經夠強。Pro 則為那些超出 Flash 能力的任務提供餘裕——定價也暗示 Google 預期這類任務是市場的重要組成部分。
開發者現在應該做什麼
首先,確認你的工作負載是否真的需要 200 萬上下文或延伸推理。Flash 已能以極低成本處理大多數程式碼、摘要與代理任務。其次,密切關注 API 更新日誌——當 gemini-3-5-pro 模型 ID 出現時,免費預覽期通常同步啟動。第三,如果你已在 Vertex AI 企業版上,請確認帳戶是否有預覽存取權限;有幾個團隊自 5 月下旬起就在使用 Pro。
結論:Gemini 3.5 Pro 是 Google 有史以來發布的最強模型。對大多數開發者來說,問題不是要不要用,而是你的工作負載是否值得支付相對 Flash 的溢價。
來源
- Gemini 3.5 model family — Google AI blog ↗
- Google Gemini 3.5 Pro nears June launch — TechTimes ↗
- Gemini API changelog — Google AI for Developers ↗