2025年6月18日,谷歌公司发布博文,宣布Gemini 2.5 Flash和Gemini 2.5 Pro模型进入稳定阶段,同时推出全新轻量级模型Gemini 2.5 Flash - Lite。具体情况如下:Gemini 2.5 Flash和Pro稳定版:这两款模型已通过大规模测试,可稳定支持生产级应用开发。Spline、Rooms等公司,以及Snap、SmartBear等企业,已在过去数周内使用最新版本开发实际应用。谷歌表示Gemini 2.5系列以平衡“成本-速度-性能”为核心设计目标,伴随着稳定版上线,确保开发者能以更高信心构建复杂系统。Gemini 2.5 Flash - Lite预览版:这是目前Gemini 2.5系列中成本效益最高、推理速度最快的模型。测试显示,Flash - Lite在代码编写、科学计算、多模态分析等任务中,综合质量超越前代2.0 Flash - Lite;其延迟表现也优于2.0版本,在翻译、分类等需要快速响应的场景中尤为突出。该模型继承Gemini 2.5系列核心能力,包括灵活控制推理预算、连接外部工具(如谷歌搜索、代码执行)以及支持100万token超长上下文处理。开发者可通过Google AI Studio、Vertex AI平台访问2.5 Flash和Pro的稳定版本,以及Flash - Lite的预览版本。此外,Gemini应用端也已集成2.5 Flash和Pro,而谷歌搜索则部署了定制化版本的Flash - Lite和Flash模型以提升服务效率。
|
|