为什么每个人都突然谈论DeepSeek? 学分:贾斯汀·沙利文 /盖蒂图像
在一个星期中,的R1大语言模型具有在App Store上,,并对Openai构成了严重的威胁,并扩展了美国人工智能行业的统治地位。
上周一,中国人工智能公司DeepSeek发行了一个名为DeepSeek R1的开源LLM,成为自Chatgpt以来最热闹的AI聊天机器人。据称,它比Openai的型号一样好(甚至不是更好),据称使用的筹码少于其竞争对手。这是您需要了解的有关DeepSeek R1的知识,以及为什么每个人都突然谈论它。
DeepSeek R1声称在关键基准中超过OpenAI模型
随着DeepSeek R1的发布,该公司发布了有关其功能的报告,包括在行业标准基准方面的性能。 DeepSeek声称其LLM在高级数学和编码测试(AIME 2024,MATH-500,SWE-BENCHENSED)上击败OpenAI的推理模型O1,并在另一个编程基准(CodeForces),研究生级科学(GPQA Diamond),GPQA Diamond)上赢得了O1的低于O1。和一般知识(MMLU)。
Mashable的Stan Schroeder通过要求它“编码一个相当复杂的Web应用程序,需要解析公开可用的数据,并为游客提供旅行和天气信息的动态网站,并对其功能印象深刻。
在这一点上,存在与OpenAI模型相当的几个LLM,例如众多的Claude,Meta的开源美洲驼和Google Gemini。但是,DeepSeek R1的表现以及其他因素,使其成为强大的竞争者。
可混合的轻速速度
与Openai模型不同,DeepSeek R1是开源
由于DeepSeek R1是开源的,因此任何人都可以出于自己的目的访问和调整它。它还允许程序员看在引擎盖下,看看其工作原理。开源模型对于扩展AI的使用和使AI功能民主化至关重要,因为程序员可以构建它们,而不是需要数百万美元的计算能力才能建立自己的能力。
与Google和Openai相比,Meta通过将Llama作为开源来采用这种方法,而Google和Openai被开源倡导者批评为守门。 Google的Gemini模型是封闭的来源,但确实有一个开源模型家族称为。
使用便宜,建造便宜
DeepSeek R1具有免费的Web应用程序版本,可通过CHAT.Deepseek.com访问,并且API的成本大大低于OpenAI的API访问其最高级模型。它的推理模型的价格为100万个缓存输入令牌,而OpenAI的O1型号为每百万个缓存输入令牌,为0.14美元。这绝对是毫不奇怪的是,程序员涌向它。
对于AI行业内部人士和科技投资者来说,DeepSeek R1最重要的成就是(据称)建造它所需的计算能力很少。根据Deepseek工程师的说法《纽约时报》,R1模型仅需要2,000个NVIDIA芯片。与报告截至2023年,Openai的车型需要10,000个NVIDIA GPU,因此无疑是更多的。
这是一个非常大胆的主张,但是如果是真的,它质疑需要多少投资才能开发像这样的数据中心目前正在进行中。股市当然注意到DeepSeek R1所谓的成本效率,NVIDIA周一股价下跌了13%。
DeepSeek R1是Apple App Store上的新国王
显然,用户已经注意到DeepSeek R1的能力。到周一,该街区的新孩子将Apple App Store成为第一名免费应用程序,将Chatgpt替换为“免费应用程序”。
谁知道DeepSeek R1的势头是否会继续下去,但它肯定重新点燃了AI比赛,并将比赛带到了全球高度。
Cecily是Mashable的技术记者,涵盖了AI,Apple和新兴技术趋势。在哥伦比亚新闻学院获得硕士学位之前,她花了数年的时间与不合理的集团和B实验室的初创企业和社会影响业务合作。在此之前,她共同创立了一家针对南美,欧洲和亚洲新兴企业家枢纽的初创咨询业务。您可以在Twitter上找到她@cecily_mauran。