2026-06-10 — views
Google 将 Gemini 3.5 Pro 推入最终预览阶段:200 万 Token 上下文与 Deep Think 推理
为什么值得读 定价与免费试用期是开发者最该先确认的两件事。以每百万 token 输入 $15/输出 $60 的定价,Pro 是被设计来认真使用的,而非试用。
Gemini 3.5 Pro 进入最终 Vertex 企业版预览,具备 200 万 token 上下文窗口与 Deep Think 推理;GA 正式发布预计在 2026 年 6 月即将到来。
发生了什么
Google 的 Gemini 3.5 Pro 已进入正式发布前的最后限定企业版预览阶段。Sundar Pichai 在 5 月 19 日的 Google I/O 上发布这款模型,并告诉现场观众”给我们到下个月的时间”。截至 6 月 10 日,部分 Vertex AI 企业版客户自 5 月下旬起已获得访问权,但 Google 官方 API 更新日志中尚未出现公开的模型 ID,意味着广泛上线仍未到来——尽管 GA 公告预计随时可能发布。
此命名标志着一个世代性的转变:Gemini 3.5 Pro 承担了 Gemini Ultra 原先的角色,成为 Google 全新的顶尖模型,定位高于 5 月 19 日发布的 Gemini 3.5 Flash。
确认的规格
| 功能 | 细节 |
|---|---|
| 上下文窗口 | 200 万 token |
| 推理模式 | Deep Think(延伸推理时间计算) |
| 多模态 | 文字、图片、音频、视频 |
| 预期输入定价 | 每百万 token 约 $15 |
| 预期输出定价 | 每百万 token 约 $60 |
| Flash 参考价格 | 输入 $1.50 / 输出 $9.00 每百万 token |
200 万 token 上下文窗口是长文档与多存储库工作负载的核心亮点。Deep Think 类似于 OpenAI o 系列的思维链路径:模型在回复前会花费额外的推理时间计算。对于延迟可接受、精确度至关重要的任务——法律文档审阅、多步骤代码推理、高难度数学——此模式是预期的入场点。
定价差距是核心取舍
以 Flash 约十倍的成本,Pro 针对真正需要前沿推理深度或延伸上下文的工作负载。选择等待 Pro 还是使用 Flash 发布的开发者,现在面临真实的取舍:Flash 已可用、价格具竞争力、在智能体任务上已经够强。Pro 则为那些超出 Flash 能力的任务提供余裕。
开发者现在应该做什么
密切关注 API 更新日志——当 gemini-3-5-pro 模型 ID 出现时,免费预览期通常同步启动。如果你已在 Vertex AI 企业版上,请确认账户是否有预览访问权限。
结论:Gemini 3.5 Pro 是 Google 有史以来发布的最强模型。对大多数开发者而言,问题不是要不要用,而是你的工作负载是否值得支付相对 Flash 的溢价。
来源
- Gemini 3.5 model family — Google AI blog ↗
- Google Gemini 3.5 Pro nears June launch — TechTimes ↗
- Gemini API changelog — Google AI for Developers ↗