中國AI大模型強勢崛起　DeepSeek成斯坦福、MIT研究首選

中國國產大模型公司深度求索（DeepSeek）近日在短短一個月內接連推出V3和R1兩款大模型，迅速引發全球矚目。內媒《澎湃新聞》報道，DeepSeek-R1在數學、程式碼、自然語言推理等多項任務的效能已達到OpenAI GPT-4o模型的水平，且以低成本、高效能和開放性贏得了廣泛讚譽，甚至成為斯坦福大學和麻省理工學院研究人員的首選模型。

超高價效比挑戰OpenAI

DeepSeek-R1在1月20日正式發布後，迅速在國際大模型排名榜Chatbot Arena上攀升至全類別大模型第三位，與OpenAI的ChatGPT-4o並列。同時，在風格控制類模型（StyleCtrl）分類中，R1與OpenAI o1模型並列第一。更令人震驚的是，DeepSeek-R1的訓練成本僅為557.6萬美元，使用2048塊針對中國市場的英偉達H800 GPU集群執行55天完成，而這一資料僅是OpenAI GPT-4o訓練成本的不到十分之一。

中國幻方量化旗下的子公司DeepSeek1月20日發布最新開源模型DeepSeek-V3。

報道指出，DeepSeek還將R1的訓練技術完全公開，並蒸餾出6個小模型向社群開源，允許開發者利用這些模型進行衍生訓練。同時，DeepSeek-R1以「物美價廉」的特性受到海外開發者社群熱捧，其API定價對每百萬輸入token收取0.55美元，輸出token收取2.19美元，相較於OpenAI o1模型每百萬token分別15美元和60美元的定價，便宜了超過96%。

海外學界與硅谷反響熱烈

據硅谷知名投資機構A16z的合夥人Anjney Midha表示，DeepSeek-R1「幾乎在一夜之間成為美國頂尖大學研究人員的首選模型」，包括斯坦福與麻省理工學院在內的機構都已開始採用。此外，法國企業家阿諾德．貝特朗（Arnaud Bertrand）在社交媒體上指出，DeepSeek的成就表明中國在技術和創新方面已趕上甚至超越美國，儘管美國試圖透過限制措施來阻止這一進展。

AI競賽的世紀，香港缺席抑或只是遲到？

一名Meta員工則在匿名論壇Teamblind上發帖稱，DeepSeek-R1的出現讓Meta內部「火燒屁股」。該員工提到，DeepSeek-R1的訓練成本不到550萬美元，而Meta生成式AI部門的每位領導的薪資卻超過這一數字。

DeepSeek飆升至美區蘋果應用榜第三。（觀察者網）

專家點評：中國AI加速趕超

「AI教父」傑佛瑞．辛頓（Geoffrey Hinton）在1月21日的一次專訪中表示，美國試圖通過限制英偉達晶片等措施來減緩中國AI發展，但這可能適得其反，只會促使中國加速發展自己的技術。「他們可能會落後幾年，但最終會趕上」，辛頓說。

DeepSeek-R1的成功不僅在國際學術界和產業界引起轟動，還再度引發了中美AI競爭的討論。隨着中國AI技術的崛起，全球科技格局可能迎來重大變革。

DeepSeek震散美股　Nvidia瀉一成　納指挫逾600點失守兩萬關 DeepSeek｜北京子公司52個崗位招聘最高月薪9萬　實習生日薪千元 DeepSeek｜85後創辦人梁文鋒經歷曝光　用AI炒股掌千億私募基金

中國AI大模型強勢崛起 DeepSeek成斯坦福、MIT研究首選

超高價效比挑戰OpenAI

海外學界與硅谷反響熱烈

專家點評：中國AI加速趕超

中國AI大模型強勢崛起　DeepSeek成斯坦福、MIT研究首選