谷歌推理最快、成本效益最高 AI 模型:Gemini 2.5 Flash-Lite 亮相,全面升级编码、翻译、推理
6 月 18 日消息,谷歌公司今天(6 月 18 日)发布博文,在宣布 Gemini 2.5 Flash 和 Gemini 2.5 Pro 模型进入稳定阶段之外,还推出全新轻量级模型 Gemini 2.5 Flash-Lite。
援引博文介绍,谷歌官方表示,Gemini 2.5 Flash 和 Gemini 2.5 Pro 两款模型已通过大规模测试,可稳定支持生产级应用开发。Spline、Rooms 等公司,以及 Snap、SmartBear 等企业,已在过去数周内使用最新版本开发实际应用。
谷歌表示 Gemini 2.5 系列以平衡“成本-速度-性能”为核心设计目标,兼顾高效推理与经济性,伴随着稳定版上线,确保开发者能以更高信心构建复杂系统。
谷歌同步推出 Gemini 2.5 Flash-Lite 的预览版本,这是目前该系列中成本效益最高、推理速度最快的模型。
测试显示,Flash-Lite 在代码编写、科学计算、多模态分析等任务中,综合质量超越前代 2.0 Flash-Lite;其延迟表现也优于 2.0 版本,在翻译、分类等需要快速响应的场景中尤为突出。
该模型继承 Gemini 2.5 系列核心能力,包括灵活控制推理预算、连接外部工具(如谷歌搜索、代码执行)以及支持 100 万 token 超长上下文处理。
开发者可通过 Google AI Studio、Vertex AI 平台访问 2.5 Flash 和 Pro 的稳定版本,以及 Flash-Lite 的预览版本。此外,Gemini 应用端也已集成 2.5 Flash 和 Pro,而谷歌搜索则部署了定制化版本的 Flash-Lite 和 Flash 模型以提升服务效率。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,所有文章均包含本声明。