Grok 3与Chatgpt,DeepSeek和其他AI竞争对手的比较

Grok 3已经赶上了竞争对手,但是可以转换ChatGpt用户吗? 学分:Matteo Della Torre / Nurphoto / Getty Images

现在,来自埃隆·马斯克(Elon Musk)Xai的Grok 3是,它如何与竞争对手抗衡?

周一在X上的直播中推出了Grok 3模型家族。该公告还包括推理模型Grok 3在Beta和Grok 3 Mini推理中。具有推理能力的模型比GPT-4(例如GPT-4)更先进,因为它们可以通过问题“思考”,从而使它们不易幻觉。

Xai正在推广Grok 3作为市场上最佳模型,声称它超过了竞争者,,,,,人类和在关键基准上。 Grok 3做到了表现良好在聊天机器人体育馆的代号“巧克力”下,在盲目表演测试中,聊天机器人相互对抗。

推文可能已被删除

Grok 3主要赶上了竞争对手,这是一个令人印象深刻的壮举,鉴于其较晚的开局,但仍然存在一些困扰其他边境模型的局限性。这是AI专家对街区新聊天机器人的看法。

Grok 3与竞争对手一样好,但不足以使您取消Chatgpt订阅

Openai的创始成员,特斯拉AI前董事的创始成员Andrej Karpathy及早进入了新发布的Grok 3和共享模型性能的“快速氛围检查”。

根据一些标准的压力测试,Karpathy表示Grok 3具有新的深度搜索推理功能,“感觉到Openai最强型号(O1-Pro,200美元/月200美元)的最先进领域的某个地方,并且比DeepSeek-稍好一些。 R1和Gemini 2.0 Flash思维。”

推文可能已被删除

马斯克·斯坦斯(Musk Stans)很高兴格罗克3(Grok 3)吸引了竞争对手。但是对于那些只是寻找市场上最佳模型的人来说,这可能不足以转化意识形态上的无动于衷。

“我认为Grok 3是正确的预期,”发表沃顿人AI教授Ethan Mollick。 “因此,我认为关于AI的共识预测没有太多更新:仍在加速开发,速度是护城河,计算仍然很重要,如果您有人才和芯片,则没有明显的秘密调味料来制作边境模型,”描述AI优势所需的竞争优势。

可混合的轻速速度

推文可能已被删除

Xai遗漏了一个钥匙3比较

Grok 3推理模型的屏幕截图优于Openai的O3 Mini和O1,DeepSeek的R1和Google Gemini 2.0 Flash Thinking,因为看起来像最先进的推理模型,已经病毒了。但是Openai说:“不是那么快。”基准之后不久发表一张“更新”图表,具有O3击败数学和科学基准中的Grok 3推理。

推文可能已被删除

公平地说,O3尚未公开发布,因此XAI可能无法获得这些分数。但是,这有助于使声称Sam Altman and Co的Grok奉献者保持安静。煮熟。

不过,这是一件大事,3抓住了3

“要注意的关键是X非常快地到达这里,这是否继续,”莫利克(Mollick)在一个单独的X帖子中,称其为“现在在边境的非常好的模型”。自Google和Openai于2023年成立之前,Grok车型的改善已经取得了很大速度。

根据麝香,Grok 3接受了Grok 2的计算能力的10倍,具有200,000 GPU。至少在短期内,这加强了缩放定律:更多的计算等于更好的模型性能,因为Mollick指出在第三篇文章中。

推文可能已被删除

也就是说,仍然怀疑该模型是否会线性地导致更高的智能超出目前的可能性。 AI研究员和纽约大学心理学和神经科学教授加里·马库斯(Gary Marcus)仍然持怀疑态度扩展法律将成立。

推文可能已被删除

Grok 3的斗争与其他模型相同的局限性

像其他模型一样,它的幽默感也很平庸,并且在生成SVG图像方面挣扎。对于马斯克和他的右翼球迷来说,Grok 3可能也太“醒了”。卡尔帕里(Karpathy)在分析中说,格罗克3(Grok 3)不能比爸爸的笑话更好地提出任何事情,并指出“这是幽默能力和一般模式崩溃的常见问题”。

Karpathy还要求Grok 3“产生骑自行车的鹈鹕的SVG”,因为LLMS经常在二维图像上努力创建多个元素,因为LLMS无法像人们一样'看到'在黑暗中。” Grok 3对此提示还可以,并且比其他提示更好(RIP Gemini 1.5 Flash),但它的正确正确。

推文可能已被删除

另一个测试Karpathy尝试的是Grok 3的政治主题方法,因为Musk的位置Grok是其他被认为是其他模型的反击替代方案。在政治上太正确了。“对于karpathy,聊天机器人”产生了一篇1页的文章,基本上拒绝回答是否在道德上可能是合理的,如果某人意味着拯救100万人死亡,这对他来说可能是“过于敏感的”符合道德困境,也许是对马斯克的恼火。

过去的Grok模型通常趋于在政治问题上左派,但马斯克说,这是经过培训的公共数据的产物发誓使Grok更加“政治中性”。

X Premium+计划的订户 - 刚远足每月50美元 - 首先访问Grok 3。

Cecily是Mashable的技术记者,涵盖了AI,Apple和新兴技术趋势。在哥伦比亚新​​闻学院获得硕士学位之前,她花了数年的时间与不合理的集团和B实验室的初创企业和社会影响业务合作。在此之前,她共同创立了一家针对南美,欧洲和亚洲新兴企业家枢纽的初创咨询业务。您可以在Twitter上找到她@cecily_mauran

这些新闻通讯可能包含广告,交易或会员链接。通过单击订阅,您确认自己是16岁,并同意我们的使用条款隐私政策