谷歌宣布推出“代理”Gemini 2.0,支持图像和音频

不甘落后 去年底,谷歌刚刚发布了新的AI模型Gemini 2.0。

周三,谷歌介绍Gemini 2.0 Flash,下一代AI模型家族的第一个成员。 Gemini 2.0 Flash 在公告中被描述为开发人员的“主力模型”,能够大规模提供强大的性能。 Flash 支持图像和音频生成,与 Google 搜索进行本机集成,可以编写代码,并可与第三方应用程序配合使用。除了 Gemini 2.0 Flash 的发布外,Google 还推出了,这是 Gemini 的一项功能,可以浏览网页并根据初始提示编写研究报告。

Gemini 2.0 Flash 是 Gemini 1.0 的一个进步,它改进了推理、更长的上下文窗口、理解复杂指令的能力以及本机工具的使用——所有这些都旨在使模型更加代理,换句话说,能够执行代表用户执行多步骤任务。

可混搭光速

作为其中的一部分,谷歌表示 Gemini 2.0 将可用于 Project Astra,这是一个用于测试通用人工智能助手的研究原型。谷歌还分享了其他研究原型:专为探索“人机交互”而设计的 Project Mariner 和面向开发人员的 Project Jules。

Gemini 2.0 Flash 可通过 Gemini API 作为“实验模型”使用,可在 Google AI Studio 和 Vertex AI 中访问。但普通用户也可以在 Gemini 桌面应用程序中尝试其改进的聊天功能,移动应用程序支持即将推出。