來認識 Operator,OpenAI 的新 AI 代理程式。 圖片來源:OpenAI
,OpenAI的能夠自主執行多步驟任務的代理已經到來。
這ChatGPT製作者推出了Operator的預覽模式週四,詳細介紹了它的工作原理和功能。操作員可以瀏覽網絡,執行諸如計算取消訂單的退款以及在內部銷售資料庫中尋找具有特定標準的客戶等任務。它還可以購買雜貨和發送電子郵件。
在電腦上,Operator 可以執行各種任務,例如下載檔案、合併 PDF、分析電子表格和匯出影像。
OpenAI 是的。上週,該公司推出了ChatGPT,它允許用戶自動發送未來的提示,例如發送每日科技新聞簡報或安排提醒。雖然其中許多任務已經可以透過谷歌快訊和日曆等基本工具來實現,但這只是人工智慧機器人為用戶做跑腿工作的早期例子。結合 Operator 的發布及其自主承擔更複雜任務的能力,您可以開始看到利用其核心產品。
可混搭光速
支援Operator 的模型是電腦使用代理(CUA),它結合了GPT-4o 的視覺模式,透過圖形使用者介面(GUI) 的螢幕截圖來「查看」使用者螢幕上的內容,使Operator 能夠與螢幕進行互動(點擊按鈕、打字、滾動等)。
操作員在行動,正在尋找優勝美地帶野餐桌的露營地。 圖片來源:OpenAI
OpenAI 與 Operator 的安全方法
顯然,對於像 Operator 這樣的半自主人工智慧代理來說,安全是一個大問題。 OpenAI 表示,它已經透過幾種不同的方式考慮了風險。操作員透過阻止有害或非法任務來減少濫用,並且無法存取賭博和成人娛樂網站以及毒品或槍支零售商等黑名單網站。
當您使用 Operator 時,OpenAI 會在您身後監視。該公告稱,“自動安全檢查器會即時審查用戶交互,這些檢查器旨在確保遵守使用政策,並能夠針對禁止的活動發出警告或阻止”,並且該公司已經開發了“自動檢測和阻止”功能。
由於操作員在沒有人工監督的情況下可能會犯下代價高昂的錯誤,因此模型將「在提交訂單、發送電子郵件等之前要求確認,以便用戶可以在模型的工作永久生效之前仔細檢查模型的工作。操作員目前也受到「銀行交易等高風險任務」的限制。
操作員可用性
現在我們開始看到 OpenAI 的新高級訂閱,。預覽模式的 Operator 僅在美國適用於每月支付 200 美元的 Pro 用戶。但隨著時間的推移,OpenAI 預計將向 Plus、Team 和 Enterprise 用戶擴展可用性。
Cecily 是 Mashable 的科技記者,負責通報人工智慧、蘋果和新興科技趨勢。在哥倫比亞新聞學院獲得碩士學位之前,她在 Unreasonable Group 和 B Lab 的新創公司和社會影響力企業工作了幾年。在此之前,她與他人共同創辦了一家針對南美洲、歐洲和亞洲新興創業中心的創業顧問公司。你可以在 Twitter 上找到她:@cecily_mauran。