谷歌宣布推出“代理”Gemini 2.0，支持图像和音频

不甘落后去年底，谷歌刚刚发布了新的AI模型Gemini 2.0。

周三，谷歌介绍Gemini 2.0 Flash，下一代AI模型家族的第一个成员。 Gemini 2.0 Flash 在公告中被描述为开发人员的“主力模型”，能够大规模提供强大的性能。 Flash 支持图像和音频生成，与 Google 搜索进行本机集成，可以编写代码，并可与第三方应用程序配合使用。除了 Gemini 2.0 Flash 的发布外，Google 还推出了，这是 Gemini 的一项功能，可以浏览网页并根据初始提示编写研究报告。

Gemini 2.0 Flash 是 Gemini 1.0 的一个进步，它改进了推理、更长的上下文窗口、理解复杂指令的能力以及本机工具的使用——所有这些都旨在使模型更加代理，换句话说，能够执行代表用户执行多步骤任务。

可混搭光速

作为其中的一部分，谷歌表示 Gemini 2.0 将可用于 Project Astra，这是一个用于测试通用人工智能助手的研究原型。谷歌还分享了其他研究原型：专为探索“人机交互”而设计的 Project Mariner 和面向开发人员的 Project Jules。

Gemini 2.0 Flash 可通过 Gemini API 作为“实验模型”使用，可在 Google AI Studio 和 Vertex AI 中访问。但普通用户也可以在 Gemini 桌面应用程序中尝试其改进的聊天功能，移动应用程序支持即将推出。