DeepSeek AI：您需要了解的有關Chatgpt競爭對手

為什麼每個人都突然談論DeepSeek？學分：賈斯汀·沙利文 /蓋蒂圖像

在一個星期中，的R1大語言模型具有在App Store上，，並對Openai構成了嚴重的威脅，並擴展了美國人工智能行業的統治地位。

上週一，中國人工智能公司DeepSeek發行了一個名為DeepSeek R1的開源LLM，成為自Chatgpt以來最熱鬧的AI聊天機器人。據稱，它比Openai的型號一樣好（甚至不是更好），據稱使用的籌碼少於其競爭對手。這是您需要了解的有關DeepSeek R1的知識，以及為什麼每個人都突然談論它。

DeepSeek R1聲稱在關鍵基準中超過OpenAI模型

隨著DeepSeek R1的發布，該公司發布了有關其功能的報告，包括在行業標準基準方面的性能。 DeepSeek聲稱其LLM在高級數學和編碼測試（AIME 2024，MATH-500，SWE-BENCHENSED）上擊敗OpenAI的推理模型O1，並在另一個編程基準（CodeForces），研究生級科學（GPQA Diamond），GPQA Diamond ）上贏得了O1的低於O1。和一般知識（MMLU）。

Mashable的Stan Schroeder通過要求它“編碼一個相當複雜的Web應用程序，需要解析公開可用的數據，並為遊客提供旅行和天氣信息的動態網站，並對其功能印象深刻。

在這一點上，存在與OpenAI模型相當的幾個LLM，例如眾多的Claude，Meta的開源美洲駝和Google Gemini。但是，DeepSeek R1的表現以及其他因素，使其成為強大的競爭者。

可混合的輕速速度

與Openai模型不同，DeepSeek R1是開源

由於DeepSeek R1是開源的，因此任何人都可以出於自己的目的訪問和調整它。它還允許程序員看在引擎蓋下，看看其工作原理。開源模型對於擴展AI的使用和使AI功能民主化至關重要，因為程序員可以構建它們，而不是需要數百萬美元的計算能力才能建立自己的能力。

與Google和Openai相比，Meta通過將Llama作為開源來採用這種方法，而Google和Openai被開源倡導者批評為守門。 Google的Gemini模型是封閉的來源，但確實有一個開源模型家族稱為。

使用便宜，建造便宜

DeepSeek R1具有免費的Web應用程序版本，可通過CHAT.Deepseek.com訪問，並且API的成本大大低於OpenAI的API訪問其最高級模型。它的推理模型的價格為100萬個緩存輸入令牌，而OpenAI的O1型號為每百萬個緩存輸入令牌，為0.14美元。這絕對是毫不奇怪的是，程序員湧向它。

對於AI行業內部人士和科技投資者來說，DeepSeek R1最重要的成就是（據稱）建造它所需的計算能力很少。根據Deepseek工程師的說法《紐約時報》，R1模型僅需要2,000個NVIDIA芯片。與報告截至2023年，Openai的車型需要10,000個NVIDIA GPU，因此無疑是更多的。

這是一個非常大膽的主張，但是如果是真的，它質疑需要多少投資才能開發像這樣的數據中心目前正在進行中。股市當然注意到DeepSeek R1所謂的成本效率，NVIDIA週一股價下跌了13％。

DeepSeek R1是Apple App Store上的新國王

顯然，用戶已經註意到DeepSeek R1的能力。到週一，該街區的新孩子將Apple App Store成為第一名免費應用程序，將Chatgpt替換為“免費應用程序”。

誰知道DeepSeek R1的勢頭是否會繼續下去，但它肯定重新點燃了AI比賽，並將比賽帶到了全球高度。

Cecily是Mashable的技術記者，涵蓋了AI，Apple和新興技術趨勢。在哥倫比亞新聞學院獲得碩士學位之前，她花了數年的時間與不合理的集團和B實驗室的初創企業和社會影響業務合作。在此之前，她共同創立了一家針對南美，歐洲和亞洲新興企業家樞紐的初創諮詢業務。您可以在Twitter上找到她@cecily_mauran。

這些新聞通訊可能包含廣告，交易或會員鏈接。通過單擊訂閱，您確認自己是16歲，並同意我們的使用條款和隱私政策。