中國AI大模型強勢崛起 DeepSeek成斯坦福、MIT研究首選

中國國產大模型公司深度求索(DeepSeek)近日在短短一個月內接連推出V3和R1兩款大模型,迅速引發全球矚目。內媒《澎湃新聞》報道,DeepSeek-R1在數學、程式碼、自然語言推理等多項任務的效能已達到OpenAI GPT-4o模型的水平,且以低成本、高效能和開放性贏得了廣泛讚譽,甚至成為斯坦福大學和麻省理工學院研究人員的首選模型。
超高價效比挑戰OpenAI
DeepSeek-R1在1月20日正式發布後,迅速在國際大模型排名榜Chatbot Arena上攀升至全類別大模型第三位,與OpenAI的ChatGPT-4o並列。同時,在風格控制類模型(StyleCtrl)分類中,R1與OpenAI o1模型並列第一。更令人震驚的是,DeepSeek-R1的訓練成本僅為557.6萬美元,使用2048塊針對中國市場的英偉達H800 GPU集群執行55天完成,而這一資料僅是OpenAI GPT-4o訓練成本的不到十分之一。
報道指出,DeepSeek還將R1的訓練技術完全公開,並蒸餾出6個小模型向社群開源,允許開發者利用這些模型進行衍生訓練。同時,DeepSeek-R1以「物美價廉」的特性受到海外開發者社群熱捧,其API定價對每百萬輸入token收取0.55美元,輸出token收取2.19美元,相較於OpenAI o1模型每百萬token分別15美元和60美元的定價,便宜了超過96%。
海外學界與硅谷反響熱烈
據硅谷知名投資機構A16z的合夥人Anjney Midha表示,DeepSeek-R1「幾乎在一夜之間成為美國頂尖大學研究人員的首選模型」,包括斯坦福與麻省理工學院在內的機構都已開始採用。此外,法國企業家阿諾德.貝特朗(Arnaud Bertrand)在社交媒體上指出,DeepSeek的成就表明中國在技術和創新方面已趕上甚至超越美國,儘管美國試圖透過限制措施來阻止這一進展。
一名Meta員工則在匿名論壇Teamblind上發帖稱,DeepSeek-R1的出現讓Meta內部「火燒屁股」。該員工提到,DeepSeek-R1的訓練成本不到550萬美元,而Meta生成式AI部門的每位領導的薪資卻超過這一數字。
專家點評:中國AI加速趕超
「AI教父」傑佛瑞.辛頓(Geoffrey Hinton)在1月21日的一次專訪中表示,美國試圖通過限制英偉達晶片等措施來減緩中國AI發展,但這可能適得其反,只會促使中國加速發展自己的技術。「他們可能會落後幾年,但最終會趕上」,辛頓說。
DeepSeek-R1的成功不僅在國際學術界和產業界引起轟動,還再度引發了中美AI競爭的討論。隨着中國AI技術的崛起,全球科技格局可能迎來重大變革。