Gemini 2.5 Flash-Lite现已稳定并正式可用

2025年7月22日

Logan Kilpatrick
集团产品经理

Zach Gleicher
产品经理
某机构DeepMind

今天,发布了Gemini 2.5 Flash-Lite的稳定版本,这是Gemini 2.5模型家族中速度最快、成本最低的模型(输入每100万token $0.10,输出每100万token $0.40)。构建2.5 Flash-Lite旨在推动单位成本的智能水平,具备原生推理能力,可根据需要为更高要求的用例开启。基于2.5 Pro和2.5 Flash的势头,该模型完善了2.5模型集,为大规模生产使用做好了准备。

最具成本效益和速度最快的2.5模型

Gemini 2.5 Flash-Lite在性能和成本之间取得了平衡,同时不牺牲质量,特别是在翻译和分类等对延迟敏感的任务上。其突出特点如下:

  • 同类最佳速度:在广泛的提示样本上,Gemini 2.5 Flash-Lite的延迟低于2.0 Flash-Lite和2.0 Flash。
  • 成本效率:这是成本最低的2.5模型,定价为输入每100万token $0.10,输出每100万token $0.40,可以经济地处理大量请求。与预览版发布相比,音频输入价格也降低了40%。
  • 小而智能:在包括编程、数学、科学、推理和多模态理解在内的广泛基准测试中,整体质量均高于2.0 Flash-Lite。
  • 功能齐全:使用2.5 Flash-Lite构建时,可访问100万token的上下文窗口、可控制的思考预算,并支持原生工具,如使用某搜索引擎进行 grounding、代码执行和URL上下文。

Gemini 2.5 Flash-Lite的实际应用

自2.5 Flash-Lite发布以来,已经看到一些非常成功的部署,以下是一些优选案例:

  • Satlyt 正在构建一个去中心化的空间计算平台,将改变卫星数据的处理和使用方式,用于在轨遥测的实时摘要、自主任务管理和卫星间通信解析。2.5 Flash-Lite的速度使关键机载诊断的延迟降低了45%,功耗比其基准模型降低了30%。
  • HeyGen 使用AI为视频内容创建头像,并利用Gemini 2.5 Flash-Lite自动进行视频规划、分析和优化内容,以及将视频翻译成超过180种语言。这使他们能够为用户提供全球化的个性化体验。
  • DocsHound 通过使用Gemini 2.5 Flash-Lite处理长视频并以低延迟提取数千张截图,将产品演示转化为文档。这比传统方法更快地将录像转换为全面的文档和用于AI代理的训练数据。
  • Evertune 帮助品牌了解自己在各AI模型中的表现。Gemini 2.5 Flash-Lite对他们来说是一个改变游戏规则的工具,极大地加速了分析和报告生成。其快速性能使他们能够快速扫描和合成大量模型输出,为客户提供动态、及时的见解。

可以通过在代码中指定“gemini-2.5-flash-lite”来开始使用。如果正在使用预览版本,可以切换到“gemini-2.5-flash-lite”,这是相同的底层模型。计划于8月25日移除Flash-Lite的预览别名。

准备好开始构建了吗?立即在Google AI Studio和Vertex AI中尝试Gemini 2.5 Flash-Lite的稳定版本。FINISHED
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐