DeepSeek AI 可能比 OpenAI 最聪明的 AI 更聪明，你现在就可以尝试一下

这东西很聪明，而且很便宜。图片来源：DeepSeek

有一个新的城里的玩家，你可能想关注这个。

周一，中国人工智能公司深度搜索推出了一种新的开源大型语言模型，称为 DeepSeek R1。

根据 DeepSeek 的说法，R1 胜过其他流行的 LLM（大型语言模型），例如在几个重要基准，它是特别好数学、编码和推理任务。

推文可能已被删除

DeepSeek R1 实际上是 DeepSeek R1 Zero 的改进，它是一个 LLM，没有使用传统使用的称为监督微调的方法进行训练。这使得它在某些任务中非常有能力，但正如 DeepSeek 自己所说，Zero 的“可读性和语言混合性很差”。输入 R1，它通过在使用强化学习进行训练之前合并“多阶段训练和冷启动数据”来解决这些问题。

可混搭光速

撇开神秘的技术语言不谈（详细信息是在线的如果您有兴趣），您应该了解有关 DeepSeek R1 的几个关键事项。首先，它是开源的，这意味着它需要接受专家的审查，这应该会减轻人们对隐私和安全的担忧。其次，它可以作为网络应用程序免费使用，而 API 访问则需要付费。很便宜（一百万个输入代币为 0.14 美元，相比之下开放人工智能最强大的推理模型 o1) 售价 7.5 美元。

最重要的是，这东西功能非常非常强大。为了测试它，我立即将它扔进深水区，要求它编写一个相当复杂的网络应用程序，该应用程序需要解析公开数据，并为游客创建一个包含旅行和天气信息的动态网站。令人惊讶的是，DeepSeek 立即生成了完全可接受的 HTML 代码，并且能够根据我的输入进一步完善网站，同时一路改进和优化代码。