Mas.quest

OpenAI 推出 Operator AI 代理，可为您浏览网页

Blogs

2025-01-23

来认识一下 Operator，OpenAI 的新 AI 代理。图片来源：OpenAI

，OpenAI的能够自主执行多步骤任务的代理已经到来。

这ChatGPT制作者推出了Operator的预览模式周四，详细介绍了它的工作原理和功能。操作员可以浏览网络，执行诸如计算取消订单的退款以及在内部销售数据库中查找具有特定标准的客户等任务。它还可以购买杂货和发送电子邮件。

在计算机上，Operator 可以执行各种任务，例如下载文件、合并 PDF、分析电子表格和导出图像。

OpenAI 是的。上周，该公司推出了ChatGPT，它允许用户自动发送未来的提示，例如发送每日科技新闻简报或安排提醒。虽然其中许多任务已经可以通过谷歌快讯和日历等基本工具来实现，但这只是人工智能机器人为用户做跑腿工作的早期例子。结合 Operator 的发布及其自主承担更复杂任务的能力，您可以开始看到利用其核心产品。

可混搭光速

支持 Operator 的模型是计算机使用代理 (CUA)，它结合了 GPT-4o 的视觉模式，通过带有图形用户界面 (GUI) 的屏幕截图来“查看”用户屏幕上的内容，使 Operator 能够与屏幕进行交互（单击按钮、打字、滚动等）。

操作员在行动，正在寻找优胜美地带野餐桌的露营地。图片来源：OpenAI

OpenAI 与 Operator 的安全方法

显然，对于像 Operator 这样的半自主人工智能代理来说，安全是一个大问题。 OpenAI 表示，它已经通过几种不同的方式考虑了风险。操作员通过阻止有害或非法任务来减少滥用，并且无法访问赌博和成人娱乐网站以及毒品或枪支零售商等黑名单网站。

当您使用 Operator 时，OpenAI 会在您身后监视。该公告称，“自动安全检查器会实时审查用户交互，这些检查器旨在确保遵守使用政策，并能够针对禁止的活动发出警告或阻止”，并且该公司已经开发了“自动检测和阻止”功能。人工审查管道，以确定优先政策领域的禁止使用，包括儿童安全和欺骗活动。”

由于操作员在没有人工监督的情况下可能会犯下代价高昂的错误，因此模型将“在提交订单、发送电子邮件等之前要求确认，以便用户可以在模型的工作永久生效之前仔细检查模型的工作。”操作员目前也受到“银行交易等高风险任务”的限制。

操作员可用性

现在我们开始看到 OpenAI 的新高级订阅，。预览模式下的 Operator 仅在美国适用于每月支付 200 美元的 Pro 用户。但随着时间的推移，OpenAI 预计将向 Plus、Team 和 Enterprise 用户扩展可用性。

Cecily 是 Mashable 的科技记者，负责报道人工智能、苹果和新兴科技趋势。在哥伦比亚新闻学院获得硕士学位之前，她在 Unreasonable Group 和 B Lab 的初创公司和社会影响力企业工作了几年。在此之前，她与他人共同创办了一家针对南美、欧洲和亚洲新兴创业中心的创业咨询公司。你可以在 Twitter 上找到她：@cecily_mauran。

这些新闻通讯可能包含广告、优惠或附属链接。单击“订阅”即表示您确认您已年满 16 岁并同意我们的使用条款和隐私政策。