2026-06-10 — views

Google 將 Gemini 3.5 Pro 推入最終預覽階段：200 萬 Token 上下文與 Deep Think 推理

為什麼值得讀定價與免費試用期是開發者最該先確認的兩件事。以每百萬 token 輸入 $15／輸出 $60 的定價，Pro 是被設計來認真使用的，不是拿來試用的。

Gemini 3.5 Pro 進入最終 Vertex 企業版預覽，具備 200 萬 token 上下文視窗與 Deep Think 推理；GA 正式發布預計在 2026 年 6 月即將到來。

發生了什麼

Google 的 Gemini 3.5 Pro 已進入正式發布前的最後限定企業版預覽階段。Sundar Pichai 在 5 月 19 日的 Google I/O 上發布這款模型，並告訴現場觀眾「給我們到下個月的時間」。截至 6 月 10 日，部分 Vertex AI 企業版客戶自 5 月下旬起已獲得存取權，但 Google 官方 API 更新日誌中尚未出現公開的模型 ID，意味著廣泛上線仍未到來——儘管 GA 公告預計隨時可能發布。

此命名標誌著一個世代性的轉變：Gemini 3.5 Pro 承擔了 Gemini Ultra 原先的角色，成為 Google 全新的頂尖模型，定位高於 5 月 19 日發布的 Gemini 3.5 Flash。

確認的規格

功能	細節
上下文視窗	200 萬 token
推理模式	Deep Think（延伸推理時間運算）
多模態	文字、圖片、音訊、影片
預期輸入定價	每百萬 token 約 $15
預期輸出定價	每百萬 token 約 $60
Flash 參考價格	輸入 $1.50 / 輸出 $9.00 每百萬 token

200 萬 token 上下文視窗是長文件與多儲存庫工作負載的核心亮點。Deep Think 類似於 OpenAI o 系列的思維鏈路徑：模型在回覆前會花費額外的推理時間運算。對於延遲可接受、精確度至關重要的任務——法律文件審閱、多步驟程式碼推理、高難度數學——此模式是預期的入場點。

定價差距是核心取捨

以 Flash 約十倍的成本，Pro 針對真正需要前沿推理深度或延伸上下文的工作負載。Flash 在 I/O 的代理程式碼評估中已超越 Gemini 3.1 Pro；選擇等待 Pro 還是使用 Flash 發布的開發者，現在面臨真實的取捨：Flash 已可用、價格具競爭力、在代理任務上已經夠強。Pro 則為那些超出 Flash 能力的任務提供餘裕——定價也暗示 Google 預期這類任務是市場的重要組成部分。

開發者現在應該做什麼

首先，確認你的工作負載是否真的需要 200 萬上下文或延伸推理。Flash 已能以極低成本處理大多數程式碼、摘要與代理任務。其次，密切關注 API 更新日誌——當 gemini-3-5-pro 模型 ID 出現時，免費預覽期通常同步啟動。第三，如果你已在 Vertex AI 企業版上，請確認帳戶是否有預覽存取權限；有幾個團隊自 5 月下旬起就在使用 Pro。

結論：Gemini 3.5 Pro 是 Google 有史以來發布的最強模型。對大多數開發者來說，問題不是要不要用，而是你的工作負載是否值得支付相對 Flash 的溢價。