2026-06-10 — views

Google 将 Gemini 3.5 Pro 推入最终预览阶段：200 万 Token 上下文与 Deep Think 推理

为什么值得读定价与免费试用期是开发者最该先确认的两件事。以每百万 token 输入 $15／输出 $60 的定价，Pro 是被设计来认真使用的，而非试用。

Gemini 3.5 Pro 进入最终 Vertex 企业版预览，具备 200 万 token 上下文窗口与 Deep Think 推理；GA 正式发布预计在 2026 年 6 月即将到来。

发生了什么

Google 的 Gemini 3.5 Pro 已进入正式发布前的最后限定企业版预览阶段。Sundar Pichai 在 5 月 19 日的 Google I/O 上发布这款模型，并告诉现场观众”给我们到下个月的时间”。截至 6 月 10 日，部分 Vertex AI 企业版客户自 5 月下旬起已获得访问权，但 Google 官方 API 更新日志中尚未出现公开的模型 ID，意味着广泛上线仍未到来——尽管 GA 公告预计随时可能发布。

此命名标志着一个世代性的转变：Gemini 3.5 Pro 承担了 Gemini Ultra 原先的角色，成为 Google 全新的顶尖模型，定位高于 5 月 19 日发布的 Gemini 3.5 Flash。

确认的规格

功能	细节
上下文窗口	200 万 token
推理模式	Deep Think（延伸推理时间计算）
多模态	文字、图片、音频、视频
预期输入定价	每百万 token 约 $15
预期输出定价	每百万 token 约 $60
Flash 参考价格	输入 $1.50 / 输出 $9.00 每百万 token

200 万 token 上下文窗口是长文档与多存储库工作负载的核心亮点。Deep Think 类似于 OpenAI o 系列的思维链路径：模型在回复前会花费额外的推理时间计算。对于延迟可接受、精确度至关重要的任务——法律文档审阅、多步骤代码推理、高难度数学——此模式是预期的入场点。

定价差距是核心取舍

以 Flash 约十倍的成本，Pro 针对真正需要前沿推理深度或延伸上下文的工作负载。选择等待 Pro 还是使用 Flash 发布的开发者，现在面临真实的取舍：Flash 已可用、价格具竞争力、在智能体任务上已经够强。Pro 则为那些超出 Flash 能力的任务提供余裕。

开发者现在应该做什么

密切关注 API 更新日志——当 gemini-3-5-pro 模型 ID 出现时，免费预览期通常同步启动。如果你已在 Vertex AI 企业版上，请确认账户是否有预览访问权限。

结论：Gemini 3.5 Pro 是 Google 有史以来发布的最强模型。对大多数开发者而言，问题不是要不要用，而是你的工作负载是否值得支付相对 Flash 的溢价。