DeepSeek AI 可能比 OpenAI 最聪明的 AI 更聪明,你现在就可以尝试一下

这东西很聪明,而且很便宜。 图片来源:DeepSeek

有一个新的城里的玩家,你可能想关注这个。

周一,中国人工智能公司深度搜索推出了一种新的开源大型语言模型,称为 DeepSeek R1。

根据 DeepSeek 的说法,R1 胜过其他流行的 LLM(大型语言模型),例如在几个重要基准,它是特别好数学、编码和推理任务。

推文可能已被删除

DeepSeek R1 实际上是 DeepSeek R1 Zero 的改进,它是一个 LLM,没有使用传统使用的称为监督微调的方法进行训练。这使得它在某些任务中非常有能力,但正如 DeepSeek 自己所说,Zero 的“可读性和语言混合性很差”。输入 R1,它通过在使用强化学习进行训练之前合并“多阶段训练和冷启动数据”来解决这些问题。

可混搭光速

撇开神秘的技术语言不谈(详细信息是在线的如果您有兴趣),您应该了解有关 DeepSeek R1 的几个关键事项。首先,它是开源的,这意味着它需要接受专家的审查,这应该会减轻人们对隐私和安全的担忧。其次,它可以作为网络应用程序免费使用,而 API 访问则需要付费。很便宜(一百万个输入代币为 0.14 美元,相比之下开放人工智能最强大的推理模型 o1) 售价 7.5 美元。

最重要的是,这东西功能非常非常强大。为了测试它,我立即将它扔进深水区,要求它编写一个相当复杂的网络应用程序,该应用程序需要解析公开数据,并为游客创建一个包含旅行和天气信息的动态网站。令人惊讶的是,DeepSeek 立即生成了完全可接受的 HTML 代码,并且能够根据我的输入进一步完善网站,同时一路改进和优化代码。

我会做所有这些......明天。 图片来源:Stan Schroeder / Mashable / DeepSeek

我还要求它在五分钟内提高我的棋艺,它回复了一些条理清晰且非常有用的提示(我的棋艺没有提高,只是因为我懒得真正去执行 DeepSeek 的建议) 。

然后我要求 DeepSeek 用三句话来证明它有多聪明。我的举动很糟糕,因为我作为人类,还不够聪明,无法验证甚至完全理解这三个句子中的任何一个。请注意,在下面的屏幕截图中,您可以看到 DeepSeek 在计算出答案时的“思维过程”,这可能比答案本身更令人着迷。

我们明白了,你很聪明。 图片来源:Stan Schroeder / Mashable / DeepSeek

使用起来令人印象深刻。但作为ZDnet 指出在这一切的背景下,训练成本比一些竞争模型低几个数量级,而且芯片的功能不如美国人工智能公司现有的芯片。因此,DeepSeek 表明,具有推理能力的极其聪明的人工智能的训练或使用成本并不一定非常昂贵。

Stan 是 Mashable 的高级编辑,自 2007 年起就在那里工作。他拥有比你更多的电池供电小玩意和乐队 T 恤。他写了下一个突破性的事情。通常,这是一部电话、一枚硬币或一辆汽车。他的最终目标是了解一切。

这些新闻通讯可能包含广告、优惠或附属链接。单击“订阅”即表示您确认您已年满 16 岁并同意我们的使用条款隐私政策