没等到OpenAI12连炸结束,谷歌直接正面硬刚,正式发布 Gemini 2.0系列 AI 模型首个版本 Gemini 2.0 Flash。据谷歌称,其速度较上一代提升两倍,并超越1.5 Pro 专业版。新模型支持多模态输入与输出,包括文本、图像、音频、视频的原生生成,同时提供强大的工具调用能力,如 Google 搜索、代码执行及第三方函数集成。
比起功能上的提升,谷歌直接将 Gemini 2.0定义为:为新智能体时代构建的下一代模型,或许更值得关注。Deepmind CEO Demis Hassabis 也表示:“2025年将是 AI 智能体的时代,Gemini 2.0将是支撑我们基于智能体工作的最新一代模型。”
Gemini 2.0 Flash 的开发者实验版现已上线,支持多模态输入及文本输出功能。早期合作伙伴还可试用文本转语音及图像生成等高级功能。全面版本计划于2024年1月推出,支持更多模型尺寸及场景。
不止大模型,全新功能 Deep Research 今日起也将向 Gemini Advanced 用户开放。该功能支持高级推理与长上下文理解,用于复杂主题研究及报告撰写。同时,AI Overviews 将借助 Gemini 2.0的能力,扩展至更复杂问题与多语言适配,进一步提升用户体验。(袁宁)
[免责声明]如需转载请注明原创来源;本站部分文章和图片来源网络编辑,如存在版权问题请发送邮件至398879136@qq.com,我们会在3个工作日内处理。非原创标注的文章,观点仅代表作者本人,不代表炎黄立场。