DeepSeek AI:您需要了解的有關Chatgpt競爭對手

為什麼每個人都突然談論DeepSeek? 學分:賈斯汀·沙利文 /蓋蒂圖像

在一個星期中,的R1大語言模型具有在App Store上,,並對Openai構成了嚴重的威脅,並擴展了美國人工智能行業的統治地位。

上週一,中國人工智能公司DeepSeek發行了一個名為DeepSeek R1的開源LLM,成為自Chatgpt以來最熱鬧的AI聊天機器人。據稱,它比Openai的型號一樣好(甚至不是更好),據稱使用的籌碼少於其競爭對手。這是您需要了解的有關DeepSeek R1的知識,以及為什麼每個人都突然談論它。

DeepSeek R1聲稱在關鍵基準中超過OpenAI模型

隨著DeepSeek R1的發布,該公司發布了有關其功能的報告,包括在行業標準基準方面的性能。 DeepSeek聲稱其LLM在高級數學和編碼測試(AIME 2024,MATH-500,SWE-BENCHENSED)上擊敗OpenAI的推理模型O1,並在另一個編程基準(CodeForces),研究生級科學(GPQA Diamond),GPQA Diamond )上贏得了O1的低於O1。和一般知識(MMLU)。

Mashable的Stan Schroeder通過要求它“編碼一個相當複雜的Web應用程序,需要解析公開可用的數據,並為遊客提供旅行和天氣信息的動態網站,並對其功能印象深刻。

在這一點上,存在與OpenAI模型相當的幾個LLM,例如眾多的Claude,Meta的開源美洲駝和Google Gemini。但是,DeepSeek R1的表現以及其他因素,使其成為強大的競爭者。

可混合的輕速速度

與Openai模型不同,DeepSeek R1是開源

由於DeepSeek R1是開源的,因此任何人都可以出於自己的目的訪問和調整它。它還允許程序員看在引擎蓋下,看看其工作原理。開源模型對於擴展AI的使用和使AI功能民主化至關重要,因為程序員可以構建它們,而不是需要數百萬美元的計算能力才能建立自己的能力。

與Google和Openai相比,Meta通過將Llama作為開源來採用這種方法,而Google和Openai被開源倡導者批評為守門。 Google的Gemini模型是封閉的來源,但確實有一個開源模型家族稱為。

使用便宜,建造便宜

DeepSeek R1具有免費的Web應用程序版本,可通過CHAT.Deepseek.com訪問,並且API的成本大大低於OpenAI的API訪問其最高級模型。它的推理模型的價格為100萬個緩存輸入令牌,而OpenAI的O1型號為每百萬個緩存輸入令牌,為0.14美元。這絕對是毫不奇怪的是,程序員湧向它。

對於AI行業內部人士和科技投資者來說,DeepSeek R1最重要的成就是(據稱)建造它所需的計算能力很少。根據Deepseek工程師的說法《紐約時報》,R1模型僅需要2,000個NVIDIA芯片。與報告截至2023年,Openai的車型需要10,000個NVIDIA GPU,因此無疑是更多的。

這是一個非常大膽的主張,但是如果是真的,它質疑需要多少投資才能開發像這樣的數據中心目前正在進行中。股市當然注意到DeepSeek R1所謂的成本效率,NVIDIA週一股價下跌了13%。

DeepSeek R1是Apple App Store上的新國王

顯然,用戶已經註意到DeepSeek R1的能力。到週一,該街區的新孩子將Apple App Store成為第一名免費應用程序,將Chatgpt替換為“免費應用程序”。

誰知道DeepSeek R1的勢頭是否會繼續下去,但它肯定重新點燃了AI比賽,並將比賽帶到了全球高度。

Cecily是Mashable的技術記者,涵蓋了AI,Apple和新興技術趨勢。在哥倫比亞新​​聞學院獲得碩士學位之前,她花了數年的時間與不合理的集團和B實驗室的初創企業和社會影響業務合作。在此之前,她共同創立了一家針對南美,歐洲和亞洲新興企業家樞紐的初創諮詢業務。您可以在Twitter上找到她@cecily_mauran

這些新聞通訊可能包含廣告,交易或會員鏈接。通過單擊訂閱,您確認自己是16歲,並同意我們的使用條款隱私政策