Skip to content
AI-Daily-Builder

2026-06-10 views

Google 将 Gemini 3.5 Pro 推入最终预览阶段:200 万 Token 上下文与 Deep Think 推理

为什么值得读 定价与免费试用期是开发者最该先确认的两件事。以每百万 token 输入 $15/输出 $60 的定价,Pro 是被设计来认真使用的,而非试用。

Gemini 3.5 Pro 进入最终 Vertex 企业版预览,具备 200 万 token 上下文窗口与 Deep Think 推理;GA 正式发布预计在 2026 年 6 月即将到来。

发生了什么

Google 的 Gemini 3.5 Pro 已进入正式发布前的最后限定企业版预览阶段。Sundar Pichai 在 5 月 19 日的 Google I/O 上发布这款模型,并告诉现场观众”给我们到下个月的时间”。截至 6 月 10 日,部分 Vertex AI 企业版客户自 5 月下旬起已获得访问权,但 Google 官方 API 更新日志中尚未出现公开的模型 ID,意味着广泛上线仍未到来——尽管 GA 公告预计随时可能发布。

此命名标志着一个世代性的转变:Gemini 3.5 Pro 承担了 Gemini Ultra 原先的角色,成为 Google 全新的顶尖模型,定位高于 5 月 19 日发布的 Gemini 3.5 Flash。

确认的规格

功能细节
上下文窗口200 万 token
推理模式Deep Think(延伸推理时间计算)
多模态文字、图片、音频、视频
预期输入定价每百万 token 约 $15
预期输出定价每百万 token 约 $60
Flash 参考价格输入 $1.50 / 输出 $9.00 每百万 token

200 万 token 上下文窗口是长文档与多存储库工作负载的核心亮点。Deep Think 类似于 OpenAI o 系列的思维链路径:模型在回复前会花费额外的推理时间计算。对于延迟可接受、精确度至关重要的任务——法律文档审阅、多步骤代码推理、高难度数学——此模式是预期的入场点。

定价差距是核心取舍

以 Flash 约十倍的成本,Pro 针对真正需要前沿推理深度或延伸上下文的工作负载。选择等待 Pro 还是使用 Flash 发布的开发者,现在面临真实的取舍:Flash 已可用、价格具竞争力、在智能体任务上已经够强。Pro 则为那些超出 Flash 能力的任务提供余裕。

开发者现在应该做什么

密切关注 API 更新日志——当 gemini-3-5-pro 模型 ID 出现时,免费预览期通常同步启动。如果你已在 Vertex AI 企业版上,请确认账户是否有预览访问权限。

结论:Gemini 3.5 Pro 是 Google 有史以来发布的最强模型。对大多数开发者而言,问题不是要不要用,而是你的工作负载是否值得支付相对 Flash 的溢价。


来源

标签

请喝咖啡