DeepSeek AI：您需要了解的有关Chatgpt竞争对手

为什么每个人都突然谈论DeepSeek？学分：贾斯汀·沙利文 /盖蒂图像

在一个星期中，的R1大语言模型具有在App Store上，，并对Openai构成了严重的威胁，并扩展了美国人工智能行业的统治地位。

上周一，中国人工智能公司DeepSeek发行了一个名为DeepSeek R1的开源LLM，成为自Chatgpt以来最热闹的AI聊天机器人。据称，它比Openai的型号一样好（甚至不是更好），据称使用的筹码少于其竞争对手。这是您需要了解的有关DeepSeek R1的知识，以及为什么每个人都突然谈论它。

DeepSeek R1声称在关键基准中超过OpenAI模型

随着DeepSeek R1的发布，该公司发布了有关其功能的报告，包括在行业标准基准方面的性能。 DeepSeek声称其LLM在高级数学和编码测试（AIME 2024，MATH-500，SWE-BENCHENSED）上击败OpenAI的推理模型O1，并在另一个编程基准（CodeForces），研究生级科学（GPQA Diamond），GPQA Diamond）上赢得了O1的低于O1。和一般知识（MMLU）。

Mashable的Stan Schroeder通过要求它“编码一个相当复杂的Web应用程序，需要解析公开可用的数据，并为游客提供旅行和天气信息的动态网站，并对其功能印象深刻。

在这一点上，存在与OpenAI模型相当的几个LLM，例如众多的Claude，Meta的开源美洲驼和Google Gemini。但是，DeepSeek R1的表现以及其他因素，使其成为强大的竞争者。

可混合的轻速速度

与Openai模型不同，DeepSeek R1是开源

由于DeepSeek R1是开源的，因此任何人都可以出于自己的目的访问和调整它。它还允许程序员看在引擎盖下，看看其工作原理。开源模型对于扩展AI的使用和使AI功能民主化至关重要，因为程序员可以构建它们，而不是需要数百万美元的计算能力才能建立自己的能力。

与Google和Openai相比，Meta通过将Llama作为开源来采用这种方法，而Google和Openai被开源倡导者批评为守门。 Google的Gemini模型是封闭的来源，但确实有一个开源模型家族称为。

使用便宜，建造便宜

DeepSeek R1具有免费的Web应用程序版本，可通过CHAT.Deepseek.com访问，并且API的成本大大低于OpenAI的API访问其最高级模型。它的推理模型的价格为100万个缓存输入令牌，而OpenAI的O1型号为每百万个缓存输入令牌，为0.14美元。这绝对是毫不奇怪的是，程序员涌向它。

对于AI行业内部人士和科技投资者来说，DeepSeek R1最重要的成就是（据称）建造它所需的计算能力很少。根据Deepseek工程师的说法《纽约时报》，R1模型仅需要2,000个NVIDIA芯片。与报告截至2023年，Openai的车型需要10,000个NVIDIA GPU，因此无疑是更多的。

这是一个非常大胆的主张，但是如果是真的，它质疑需要多少投资才能开发像这样的数据中心目前正在进行中。股市当然注意到DeepSeek R1所谓的成本效率，NVIDIA周一股价下跌了13％。

DeepSeek R1是Apple App Store上的新国王

显然，用户已经注意到DeepSeek R1的能力。到周一，该街区的新孩子将Apple App Store成为第一名免费应用程序，将Chatgpt替换为“免费应用程序”。

谁知道DeepSeek R1的势头是否会继续下去，但它肯定重新点燃了AI比赛，并将比赛带到了全球高度。

Cecily是Mashable的技术记者，涵盖了AI，Apple和新兴技术趋势。在哥伦比亚新闻学院获得硕士学位之前，她花了数年的时间与不合理的集团和B实验室的初创企业和社会影响业务合作。在此之前，她共同创立了一家针对南美，欧洲和亚洲新兴企业家枢纽的初创咨询业务。您可以在Twitter上找到她@cecily_mauran。

这些新闻通讯可能包含广告，交易或会员链接。通过单击订阅，您确认自己是16岁，并同意我们的使用条款和隐私政策。