Gemini 2.5 Flash-Lite模型稳定版发布

2025年7月22日集团产品经理产品经理某机构DeepMind今天，发布了Gemini 2.5 Flash-Lite的稳定版本，这是Gemini 2.5模型家族中速度最快、成本最低的模型（输入每100万token $0.10，输出每100万token $0.40）。构建2.5 Flash-Lite旨在推动单位成本的智能水平，具备原生推理能力，可根据需要为更高要求的用例开启。基于2.5 Pro和2.

codeshare1135

356人浏览 · 2026-05-08 06:00:41

codeshare1135 · 2026-05-08 06:00:41 发布

Gemini 2.5 Flash-Lite现已稳定并正式可用

2025年7月22日

Logan Kilpatrick
集团产品经理

Zach Gleicher
产品经理
某机构DeepMind

今天，发布了Gemini 2.5 Flash-Lite的稳定版本，这是Gemini 2.5模型家族中速度最快、成本最低的模型（输入每100万token $0.10，输出每100万token $0.40）。构建2.5 Flash-Lite旨在推动单位成本的智能水平，具备原生推理能力，可根据需要为更高要求的用例开启。基于2.5 Pro和2.5 Flash的势头，该模型完善了2.5模型集，为大规模生产使用做好了准备。

最具成本效益和速度最快的2.5模型

Gemini 2.5 Flash-Lite在性能和成本之间取得了平衡，同时不牺牲质量，特别是在翻译和分类等对延迟敏感的任务上。其突出特点如下：

同类最佳速度：在广泛的提示样本上，Gemini 2.5 Flash-Lite的延迟低于2.0 Flash-Lite和2.0 Flash。
成本效率：这是成本最低的2.5模型，定价为输入每100万token $0.10，输出每100万token $0.40，可以经济地处理大量请求。与预览版发布相比，音频输入价格也降低了40%。
小而智能：在包括编程、数学、科学、推理和多模态理解在内的广泛基准测试中，整体质量均高于2.0 Flash-Lite。
功能齐全：使用2.5 Flash-Lite构建时，可访问100万token的上下文窗口、可控制的思考预算，并支持原生工具，如使用某搜索引擎进行 grounding、代码执行和URL上下文。

Gemini 2.5 Flash-Lite的实际应用

自2.5 Flash-Lite发布以来，已经看到一些非常成功的部署，以下是一些优选案例：

Satlyt 正在构建一个去中心化的空间计算平台，将改变卫星数据的处理和使用方式，用于在轨遥测的实时摘要、自主任务管理和卫星间通信解析。2.5 Flash-Lite的速度使关键机载诊断的延迟降低了45%，功耗比其基准模型降低了30%。
HeyGen 使用AI为视频内容创建头像，并利用Gemini 2.5 Flash-Lite自动进行视频规划、分析和优化内容，以及将视频翻译成超过180种语言。这使他们能够为用户提供全球化的个性化体验。
DocsHound 通过使用Gemini 2.5 Flash-Lite处理长视频并以低延迟提取数千张截图，将产品演示转化为文档。这比传统方法更快地将录像转换为全面的文档和用于AI代理的训练数据。
Evertune 帮助品牌了解自己在各AI模型中的表现。Gemini 2.5 Flash-Lite对他们来说是一个改变游戏规则的工具，极大地加速了分析和报告生成。其快速性能使他们能够快速扫描和合成大量模型输出，为客户提供动态、及时的见解。

可以通过在代码中指定“gemini-2.5-flash-lite”来开始使用。如果正在使用预览版本，可以切换到“gemini-2.5-flash-lite”，这是相同的底层模型。计划于8月25日移除Flash-Lite的预览别名。

准备好开始构建了吗？立即在Google AI Studio和Vertex AI中尝试Gemini 2.5 Flash-Lite的稳定版本。FINISHED
更多精彩内容请关注我的个人公众号公众号（办公AI智能小助手）或者我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号（网络安全技术点滴分享）