人類的AI特工克勞德(Claude)正在玩神奇寶貝

上個月,耗資615億美元的AI初創公司Anthropic設立了遊戲生產率。遊戲直播在抽搐上並不是什麼新鮮事神奇寶貝紅

我們現在一個月,,,,直播仍在。但是,克勞德有沒有進步這麼多。而且,以這種速度,人類的AI代理可能永遠不會像以往任何時候一樣是最好的。

根據擬人的說法,第一次發射“ Claude扮演神奇寶貝”項目,其AI代理Claude的先前版本在某些非常基本的任務上失敗了。例如,根據擬人化的說法,克勞德3.5試圖逃離2024年6月的幾乎每場戰鬥。

擬人化的幾個月零幾個版本的克勞德(Claude)說,發生了明顯的變化。 2025年2月,人類為克勞德(Claude)3.7十四行詩(Claude 3.7 Sonnet)旋轉了扮演神奇寶貝。

“幾個小時之內,克勞德擊敗了布羅克。幾天后,它擊敗了薄霧,”擬人說。 “進步較老的模型幾乎沒有實現的希望。”

可混合的輕速速度

Anthropic說,與AI代理商的先前版本不同,Claude 3.7十四行詩可以提前計劃,記住目標並從錯誤中學習。它還構建了知識庫,看到屏幕和模擬按鈕按下。

但是,最初在遊戲中取得的Claude 3.7十四行詩似乎已經停滯不前。

例如,直播觀眾看著如第3.7條所示78小時在遊戲中瀏覽月亮。在Reddit上,遊戲玩家估計的通常只需要幾個小時才能在同一階段前進。

可以看到克勞德(Claude)在圈子中絆倒,絆倒相同的道路,並經常在試圖繞過遊戲時撞到牆壁。

直播引人入勝,尤其是當文本框列出克勞德(Claude)的“思考”時,當AI經紀人試圖弄清楚下一步要做什麼時。

根據人類工程師在接受采訪時ARS Technica,克勞德(Claude)在涉及文本的遊戲方面(例如《神奇寶貝)戰鬥》(PokémonBattles)的遊戲方面更加輕鬆。但是,它在遊戲的更視覺方面掙扎,例如在地圖上從城鎮四處移動。

Claude 3.7十四行詩在遊戲中比以前的Claude模特進展得多,因此取得了進展。但是,對於那些警告AI很快就能佔領世界的人,我們還不到現實。克勞德(Claude)仍然有151個神奇寶貝。