Grok 3與Chatgpt,DeepSeek和其他AI競爭對手的比較

Grok 3已經趕上了競爭對手,但是可以轉換ChatGpt用戶嗎? 學分:Matteo Della Torre / Nurphoto / Getty Images

現在,來自埃隆·馬斯克(Elon Musk)Xai的Grok 3是,它如何與競爭對手抗衡?

週一在X上的直播中推出了Grok 3模型家族。該公告還包括推理模型Grok 3在Beta和Grok 3 Mini推理中。具有推理能力的模型比GPT-4(例如GPT-4)更先進,因為它們可以通過問題“思考”,從而使它們不易幻覺。

Xai正在推廣Grok 3作為市場上最佳模型,聲稱它超過了競爭者,,,,,人類和在關鍵基准上。 Grok 3做到了表現良好在聊天機器人體育館的代號“巧克力”下,在盲目表演測試中,聊天機器人相互對抗。

推文可能已被刪除

Grok 3主要趕上了競爭對手,這是一個令人印象深刻的壯舉,鑑於其較晚的開局,但仍然存在一些困擾其他邊境模型的局限性。這是AI專家對街區新聊天機器人的看法。

Grok 3與競爭對手一樣好,但不足以使您取消Chatgpt訂閱

Openai的創始成員,特斯拉AI前董事的創始成員Andrej Karpathy及早進入了新發布的Grok 3和共享模型性能的“快速氛圍檢查”。

根據一些標準的壓力測試,Karpathy表示Grok 3具有新的深度搜索推理功能,“感覺到Openai最強型號(O1-Pro,200美元/月200美元)的最先進領域的某個地方,並且比DeepSeek -稍好一些。 R1和Gemini 2.0 Flash思維。”

推文可能已被刪除

馬斯克·斯坦斯(Musk Stans)很高興格羅克3(Grok 3)吸引了競爭對手。但是對於那些只是尋找市場上最佳模型的人來說,這可能不足以轉化意識形態上的無動於衷。

“我認為Grok 3是正確的預期,”發表沃頓人AI教授Ethan Mollick。 “因此,我認為關於AI的共識預測沒有太多更新:仍在加速開發,速度是護城河,計算仍然很重要,如果您有人才和芯片,則沒有明顯的秘密調味料來製作邊境模型,”描述AI優勢所需的競爭優勢。

可混合的輕速速度

推文可能已被刪除

Xai遺漏了一個鑰匙3比較

Grok 3推理模型的屏幕截圖優於Openai的O3 Mini和O1,DeepSeek的R1和Google Gemini 2.0 Flash Thinking,因為看起來像最先進的推理模型,已經病毒了。但是Openai說:“不是那麼快。”基準之後不久發表一張“更新”圖表,具有O3擊敗數學和科學基準中的Grok 3推理。

推文可能已被刪除

公平地說,O3尚未公開發布,因此XAI可能無法獲得這些分數。但是,這有助於使聲稱Sam Altman and Co的Grok奉獻者保持安靜。煮熟。

不過,這是一件大事,3抓住了3

“要注意的關鍵是X非常快地到達這裡,這是否繼續,”莫利克(Mollick)在一個單獨的X帖子中,稱其為“現在在邊境的非常好的模型”。自Google和Openai於2023年成立之前,Grok車型的改善已經取得了很大速度。

根據麝香,Grok 3接受了Grok 2的計算能力的10倍,具有200,000 GPU。至少在短期內,這加強了縮放定律:更多的計算等於更好的模型性能,因為Mollick指出在第三篇文章中。

推文可能已被刪除

也就是說,仍然懷疑該模型是否會線性地導致更高的智能超出目前的可能性。 AI研究員和紐約大學心理學和神經科學教授加里·馬庫斯(Gary Marcus)仍然持懷疑態度擴展法律將成立。

推文可能已被刪除

Grok 3的鬥爭與其他模型相同的局限性

像其他模型一樣,它的幽默感也很平庸,並且在生成SVG圖像方面掙扎。對於馬斯克和他的右翼球迷來說,Grok 3可能也太“醒了”。卡爾帕里(Karpathy)在分析中說,格羅克3(Grok 3)不能比爸爸的笑話更好地提出任何事情,並指出“這是幽默能力和一般模式崩潰的常見問題”。

Karpathy還要求Grok 3“產生騎自行車的鵜鶘的SVG”,因為LLMS經常在二維圖像上努力創建多個元素,因為LLMS無法像人們一樣'看到'在黑暗中。” Grok 3對此提示還可以,並且比其他提示更好(RIP Gemini 1.5 Flash),但它的正確正確。

推文可能已被刪除

另一個測試Karpathy嘗試的是Grok 3的政治主題方法,因為Musk的位置Grok是其他被認為是其他模型的反擊替代方案。在政治上太正確了。“對於karpathy,聊天機器人”產生了一篇1頁的文章,基本上拒絕回答是否在道德上可能是合理的,如果某人意味著拯救100萬人死亡,這對他來說可能是“過於敏感的”符合道德困境,也許是對馬斯克的惱火。

過去的Grok模型通常趨於在政治問題上左派,但馬斯克說,這是經過培訓的公共數據的產物發誓使Grok更加“政治中性”。

X Premium+計劃的訂戶 - 剛遠足每月50美元 - 首先訪問Grok 3。

Cecily是Mashable的技術記者,涵蓋了AI,Apple和新興技術趨勢。在哥倫比亞新​​聞學院獲得碩士學位之前,她花了數年的時間與不合理的集團和B實驗室的初創企業和社會影響業務合作。在此之前,她共同創立了一家針對南美,歐洲和亞洲新興企業家樞紐的初創諮詢業務。您可以在Twitter上找到她@cecily_mauran

這些新聞通訊可能包含廣告,交易或會員鏈接。通過單擊訂閱,您確認自己是16歲,並同意我們的使用條款隱私政策