AI競賽的世紀,香港缺席抑或只是遲到?

杭州企業深度求索推出最新的人工智能DeepSeek-R1一星期以來,為人工智能、創新科技界以至金融市場帶來重大衝擊。根據柏克萊加州大學研究人員營運的Chatbot Arena排名,R1已經擠上第三名,與ChatGPT最高分的模型並列,僅次於Google兩個最前沿的Gemini模型。深度求索上個月推出的V3亦位列第八,比xAI的Grok和Anthropic的Claude都要優勝。
DeepSeek震撼之處不只因為表現出色,關鍵更在於背景。根據深度求索的公布,V3模型花費了接近560萬美元。這相當於GPT模型訓練成本的不到十分之一,而Anthropic研發一個模型的費用也要一億至十億美元不等。而且面對高階晶片的禁運,V3用的是2048塊英偉達(輝達)用於內地市場的低配版H800 GPU,訓練時間僅55天。這是為什麼DeepSeek被稱為「AI界的拼多多」,其創辦人梁文峰上星期甚至獲邀參加國務院總理李强主持的座談會,以創科企業家的身份發言。
量化投資起家 南下香港持牌
事實上,梁文峰與香港並不遙遠。這不是指地理上,他在廣東省長大,是湛江人。梁文峰自從在浙江大學修讀機器視覺以後,基本上都在杭州打滾,包括跟同樣是淅大畢業的朋友在於2015年創立投資公司幻方。他們以電腦計算來進行交易,花了六年時間達到千億元管理規模,是內地所謂「量化四大天王」之一。
說梁文峰與香港不遙遠,是因為幻方資本早於2019年已來香港拓展業務,在證監會規管下持牌提供資產管理。當然,這是因為幻方取得境外投資者的身份重返A股市場,所享有的自主程度較高,但這同時說明了香港作為背靠內地、面向國際的金融中心,始終有其優越之處。當年梁文峰在上海一個論壇上曾經指出,投資者分技術面和基本面兩種流派,而他們專攻的量化程序主要是賺技術面流派原本賺的錢,而且對沖基金橋水也是做宏觀量化。
由應用金融科技 到研發人工智能
不過梁文峰沒有止步於量化投資,反而透過幻方資本的班底,另外成立人工智能公司深度求索,由原本的應用層面退後一步到科研層面,投資近二億元設立搭載1100加速卡的「螢火一號」,支持人工智能的運算。兩年後「螢火二號」的成本增加到十億元,搭載約一萬張英偉達A100顯示卡。及至2023年,他們已經完全轉型到研發人工智能的領域,而且是內地除了商湯、百度、騰訊、字節跳動和阿里五大巨頭以外,唯一擁有超過一萬張A100顯示卡的公司。
餘下的就是歷史——去年5月發表V2,價格僅GPT-4 Turbo的百分之一;同年12月V3成為人工智能界新寵兒,表現擠進十大之列;上星期推出R1,效能甚至力壓OpenAI o1。矽谷不少人為此驚訝,體會到資源限制反而激發了創新能力。梁文峰就自言中國不能只是搭便車,也要逐步成為貢獻者。
香港趕建超算中心 河套園區尚待建成
回看香港,我們雖然錯過了大疆,金融投資又沒有衍生出人工智能研發,但這屆政府還是提出了建立人工智能超算中心,預計可以提供每秒浮點運算三千千萬億次(即3000 petaFLOPS)的算力,並撥款30億元資助本地大學、研發機構及企業善用超算中心,應用算力賦能技術創新和產業發展。當局相信超算中心及人工智能實驗室將會引領香港邁進人工智能新時代,又謂美國的任何貿易限制也不會動搖香港發展成為國際創科中心的堅定決心。但香港發展創科的具體KPI是什麼?我們何時會有——或者會不會有——自主研發的ChatGPT、DeepSeek?一間深度求索、一個人工智能模型,不正是創科發展不受動搖的最佳證明嗎?只不過故事中的主角是杭州而非我們。
河套香港園區第一期第一批次的大樓陸續完工並投入服務,但要匯聚海內外頂尖的研發團隊和優秀的創科企業,從科學園和數碼港的例子可知,遠不是建設了園區和硬件就足以成事。更何況長遠而言,河套合作區是要成為世界級科技創新樞紐,也就是媲美美國矽谷的水平。但特朗普甫重返白宮,就揚言為了勝過中國,他將積極推動美國發展人工智能及其基建。香港在廿一世紀的AI競賽中將會是缺席抑或只是遲到,視乎我們是否先讀懂杭州和深圳是如何締造一間又一間創科奇蹟。