Deepseek爆紅震撼科技界:中國超英趕美問鼎全球AI霸主地位?

Deepseek爆紅震撼科技界:中國超英趕美問鼎全球AI霸主地位?
撰文:聯合早報
出版:更新:

中國人工智能(AI)初創公司深度求索(DeepSeek)過去一個月橫空出世,只用了600萬美元及低功能晶片,就實現ChatGPT創始者美國AI領頭羊公司OpenAI投入不下10億美元及採用高階晶才做出的頂尖AI大模型成果,震撼全球科技圈。

這也引發輿論質疑美國在AI領域的領先地位不穩,過去數年通過「小院高牆」策略限制AI晶片輸華效果甚微。

本文獲《聯合早報》授權轉載。

圖為2025年1月27日拍攝的圖片,顯示Deepseek的標誌。(Reuters)
圖為2025年1月27日拍攝的圖片,顯示Deepseek的標誌。(Reuters)

深度求索1月20日在美國總統特朗普(Donald Trump)就職當天,推出新一代開源大模型DeepSeek-R1(簡稱R1),是一個月來二度推出以極低成本訓練出的廉價AI大模型。R1僅用三十分之一成本,效能竟比肩OpenAI上月初新釋出的GPT-o1大模型正式版,被認為是大模型行業最大黑馬,引發一些業界人士喊出「DeepSeek接班OpenAI」的口號。

深度求索還被不少外國網民稱為「神秘的東方力量」,關注中國是否能在對美科技戰中突圍,在AI大模型賽道上實現超英趕美,問鼎第一把交椅。

Nvidia打造AI王國的美夢,或許會因中美科技戰而遭遇極大阻礙。(Reuters)

深度求索以小博大

被稱為「AI界拼多多」的深度求索,去年12月才推出DeepSeek V3模型嶄露頭角。不到一個月,深度求索又震動全球AI圈。有別於上次,新問世的R1不僅繼續維持低成本,技術上也實現模型具備推理思考能力的重大突破。
在美國大模型排名榜Chatbot Arena上,R1的基準測試排名已升至全類別大模型第三,在風格控制類模型分類中與GPT-o1並列第一。

R1很快吸引國際科技大佬目光。美國AI晶片巨頭英偉達高階AI研究科學家範麟熙上星期一通過社交平台X發文,表示看好深度求索前景,指一家非美國公司正在延續OpenAI最初使命,即通過真正開放的前沿研究賦能全人類,認為這是「歷史時刻」。

圖為2023年2月3日路透社拍攝設計圖片,可見OpenAI標誌。(Reuters)

深度求索來勢洶洶在美國硅谷也引發不安。
彭博社引述美國科技巨頭谷歌母公司Alphabet Inc總裁兼首席投資官波拉特1月21日坦言,美國無法保證在開發AI的競賽中一直領先中國。
美國微軟執行長納德拉22日在達沃斯世界經濟論壇上說,深度求索新模型令人印象深刻,呼籲非常嚴肅看待中國AI發展。
美國匿名平台teamblind24日流傳一條引述臉書母公司Meta員工的貼文,稱目前Meta內部因深度求索模型已進入「恐慌模式」。

中國國產遊戲大作《黑神話:悟空》製作人、遊戲科學創始人馮驥,26日形容深度求索的成功是「震撼的突破」「國運等級的成果」。他希望深度求索R1會讓人對當前最先進的AI祛魅,讓AI逐漸變成人們生活中的水和電。

《黑神話:悟空》在TGA連奪兩獎。

中國官媒《經濟日報》26日發文指出,大模型創新不一定要依賴最先進的硬體,「瘦身」反而促進AI技術的創新和突破。

深度求索工程师透露,他们的AI系统只需约2000块英伟达生产的二流H800计算机晶片,美国大公司则需多达1.6万块一流晶片。

深度求索目前在太平洋兩岸爆紅。蘋果應用商店免費榜27日顯示,深度求索在美區和中國區雙雙奪魁,超越領頭羊ChatGPT。訪問量激增還導致深度求索26日出現短時閃崩現象。
深度求索的效應27日也傳導到股市,全球各地受到不同程度衝擊。日經指數受科技股拖累下挫1%,向英偉達供貨的日本半導體測試裝置巨頭Advantest股價重挫8.5%。荷蘭光刻機巨頭阿斯麥(ASML)早盤也重挫多達9.4%。
中國市場反應同樣喜憂參半。滬深300指數AI股指下跌2.2%,大數據股則上漲4%。

中國AI領域群雄逐鹿

自ChatGPT2022年問世掀起AI革命浪潮以來,許多專家和投資者一度認為,如果AI企業不投入數億美元購買AI專用晶片,就難以縮小與行業領軍者的差距。
深度求索的另辟蹊徑打破這種迷思,其大模型表現引發西方輿論嘩然,指美國的出口管制迫使中國研究人員,使用網上免費的各種工具來發揮創造力。
中國AI領域目前仍是群雄逐鹿的格局。阿里巴巴、百度、騰訊等科技領軍企業都投入大量資金和資源,為旗下AI項目爭奪硬體和客戶。與國際知名AI專家李開復前年5月組建的起步公司零一萬物(01.AI)一樣,深度求索以開源生態系統先快速招募最大數量的使用者,而後才制定盈利策略。

DeepSeek飆升至美區蘋果應用榜第三。(觀察者網)

通過推出更實惠的模型,深度求索已把中國AI開發商成本降低,在過去一年半大型企業開打價格戰期間脱穎而出。

中國央視《新聞聯播》畫面顯示,深度求索創始人梁文鋒(40歲)20日參加中國總理李強主持召開的座談會,對《政府工作報告》發表意見,顯示北京高層對這家初創企業的重視。

深度求索創始人梁文鋒(40歲,前排右)1月20日參加中國總理李強主持召開的座談會,對《政府工作報告》發表意見。(央視《新聞聯播》)

據報道,梁文鋒來自廣東湛江,浙江大學碩士畢業後留在杭州創業,2015年創立對衝基金「幻方量化」,一度成為中國首家突破千億元人民幣的私募量化大廠。2023年全球AI熱潮爆發,梁文鋒宣佈轉變賽道,同年7月成立深度求索。
梁文鋒掌舵的深度求索並不採取跟隨策略,而是堅持在模型結構層面做突破性的創新。行業人士指出,深度求索人才密度極高,其139名研發人員大多由中國本土培養,許多是清華北大應屆生、在讀生。面試過的應屆生評價,深度求索「只招1%的天才,去做99%中國公司做不到的事情」。

梁文鋒去年7月在中國自媒體「暗湧Waves」的採訪中說,中國的AI不可能永遠跟隨,需要有人站到技術的前沿。

美國AI霸主之位不穩?

中美科技戰僵持不下,北京日益成熟的科技技術持續引發華盛頓擔憂。拜登政府上周臨去前對用於AI的先進晶片宣佈新出口措施,進一步限制中國獲得相關產品。

美國總統特朗普重返白宮隔天,選在AI領域宣佈首個投資重頭戲:由日本軟銀集團、OpenAI和美國科技巨頭甲骨文三家企業投資5000億美元,打造名為「星際之門」(Stargate)的項目,用在美國建設支持AI發展的基礎設施,被輿論拿來與1980年代時任美國總統里根推出與前蘇聯爭奪太空的「星球大戰」計劃相提並論。

美國總統特朗普(左)1月21日在白宮宣佈「星際之門」(Stargate)項目,甲骨文公司董事長埃里森(Larry Ellison)在旁聆聽。(法新社)
據報道,星際之門首期10座資料中心建在德克薩斯州,目標是將美國創建成「算力帝國」。特朗普還宣佈能源緊急狀態,為星際之門供能。

特朗普23日再頒布與AI有關的行政命令,要使美國成為AI世界之都,並點名中國是AI競爭者。

一些美國專家認為,AI競爭已進入「拼基建」階段,美國相較中國的硬體優勢,將因特朗普政府此次宣佈的AI基建佈局再次拉大。但也有跡象顯示,中國正通過開源技術,在關鍵AI技術指標上趕超美國企業。

Meta在2023年免費分享名為LLama的AI模型、與世界各地企業和研究人員共享基礎程式碼後,AI開源生態系統開始蓬勃發展。但有不少高管和專家認為,美國大公司不應開源其技術,以防被用來傳播虛假訊息或造成其他嚴重危害。

有專家則警告,如果監管機構扼殺開源技術在美國的進步,中國將獲得顯著優勢。如果最好的開源技術來自中國,美國開發人員將基於這些技術構建他們的系統,長遠可能會讓中國成為研發AI的中心,對美國可能是巨大的危險。

儘管深度求索目前看似成功以小博大,但這個AI模型並非完美無瑕。與所有其他中國AI模型一樣,深度求索對北京當局認為敏感的話題進行自我審查。其雲基礎設施也可能因突如其來的訪問流量暴增而備受考驗。

中美在特朗普2.0時代的AI博弈已經落子,華盛頓能否應對來自北京的不對稱競爭,還有待觀察深度求索以小博大的模式,能否持續根本顛覆AI模型領域。最終鹿死誰手,還很難說。


正在加載