從幻方到DeepSeek 梁文鋒的情懷是什麼?

從幻方到DeepSeek 梁文鋒的情懷是什麼?
撰文:外部來稿(中國)
出版:更新:

本文獲「秦朔朋友圈」微信公眾號授權轉載

中國人工智能系統Deepseek與Open AI的ChatGPT的APP標誌。
中國人工智能系統Deepseek與Open AI的ChatGPT的APP標誌。

梁文鋒是懂布施的,而且實踐得很好。

身為幻方量化、DeepSeek的創始人,其背後的精神世界讓人好奇。

人們驚詫於這麼一款震驚硅谷乃至全球的大模型,居然誕生於中國的一家私募投資公司,而且技術團隊是清一色的中國畢業生。

人總是要有點情懷的。

好比馬斯克造火箭,是為了延續人類的文明。梁文鋒的情懷是什麼?

關於DeepSeek這款產品的討論已經太多,唯有關於梁文鋒的精神特質,還可以繼續探究與學習。

寫這篇文章,還真有點冥冥中註定。大約四年前,筆者在杭州徑山寺參加一個短期的禪修,偶遇了一名神秘的來客。後來得知,他是浙江大學計算機專業的一位資深教授,現已身居高位。

翻開梁文鋒的簡歷,正是浙江大學訊息與電子工程學院的本科生、碩士生。

也許,有關「布施、精進、追求圓滿」的DNA在梁文鋒學生時代已經刻下。

布施者:一隻平凡的小豬

2022年,幻方量化對外公布了公司的慈善捐贈情況。公司合計捐款近4億元,其中,一位取名「一隻平凡的小豬」的員工捐款1.38億。

據某報記者調查,該員工在上海某慈善平台的付款姓名為「梁*鋒」,與梁文鋒姓名高度吻合。

如此低調的巨額捐贈,絕非偶然為之,這背後是一顆對世間苦難感同身受的心。

當然,也有不少股民在評論區表達其「不滿」:這是量化基金「割韭菜」割來的錢。

他們甚至認為,量化機構的慈善捐贈,不過是一種對「割韭菜」行為的心理補償。

對此觀點,筆者不敢苟同。

量化交易,作為一種依託數學模型和計算機演算法的交易策略,確實容易引發爭議。但將其簡單粗暴地定義為「割韭菜」,無疑是片面且缺乏依據的。

量化交易的本質是通過對海量資料的分析和處理,捕捉市場中的價格偏差和投資機會,以此獲取收益。在這個過程中,它也為市場提供了流動性,增強了市場的效率。只要監管部門把好一些關鍵的環節,量化交易在未來仍然有發展空間。

今年1月20日,國務院總理李強主持召開專家、企業家和教科文衛體等領域代表座談會,聽取對《政府工作報告(徵求意見稿)》的意見建議,梁文鋒在會上發言。

梁文鋒及其團隊的慈善之舉,更多是一種公司文化的營造與個人情懷的抒發。

事實上,在私募圈,捐贈已經成為一種文化。長期與金錢打交道的人,總希望借助一些渠道來尋求精神層面的提升,以獲得內心的寧靜。

而在前兩年,幻方量化已經在主動收縮管理規模,甚至退出了一些交易策略,把主要精力向更純粹的科技公司方向發展。

筆者也在從事與私募相關的工作,能體會私募人的酸甜苦辣。梁文鋒作為一家私募投資公司的創始人,身上同時承載了「企業家精神」「交易員自律」與「受託人責任」。

也許,這三個要素的集合,為他在近幾年往DeepSeek的轉型,打下了更好的基礎。

布道者:給予其實是一種額外的榮譽

為了寫這篇文章,筆者與軟件行業的朋友開展了不少交流。他們告訴我,軟件行業有個詞叫「布道」,意思是把新的技術傳播到整個社群。

一些軟件工程師甚至直接用「某某技術布道者」作為社交媒體的昵稱。

這一精神特質,在梁文鋒身上也展露無疑。

「我經常思考的是,一個東西能不能讓社會的執行效率變高,以及你能否在它的產業分工鏈條上找到擅長的位置。只要終局是讓社會效率更高,就是成立的。」

「在顛覆性的技術面前,閉源形成的護城河是短暫的。即使OpenAI閉源,也無法阻止被別人趕超。所以我們把價值沉澱在團隊上,我們的同事在這個過程中得到成長,積累很多know-how,形成可以創新的組織和文化,就是我們的護城河。」

「開源,發論文,其實並沒有失去什麼。對於技術人員來說,被follow是很有成就感的事。其實,開源更像一個文化行為,而非商業行為。給予其實是一種額外的榮譽。一個公司這麼做也會有文化的吸引力。」

從商業模式來看,DeepSeek目前主要圍繞大模型展開多元業務。其中包括模型即服務(MaaS)模式,通過向企業和開發者提供API介面,收取呼叫費用。如最新發布的推理大模型DeepSeek-R1,憑藉遠低於OpenAI等行業巨頭的價格吸引了眾多對成本敏感的客戶,使得中小企業也能輕鬆接入大模型服務,降低了AI應用的門檻,從而擴大了客戶群體。而從使用效果看,DeepSeek並不遜於OpenAI、Meta等公司的大模型,且在一些代表智慧的指標方面還略勝一籌。

近日,DeepSeek的下載量迅速躋身美國蘋果免費應用商城的榜首。

這種「給予」的思維,「低成本、高效用」的模式,給美國科技界長久以來「大力出奇跡」的傳統帶來了極大衝擊,甚至影響到了股市。

1月27日,美國納斯達克綜合指數下跌3.07%。其中,英偉達跌約17%,單日市值蒸發5890億美元,創歷史上最大單日個股蒸發規模。博通跌17.4%,阿斯麥跌5.75%,台積電跌13.33%。

市場評論稱,DeepSeek近期發布的R1推理大模型和DeepSeek-V3模型,在效能接近OpenAI、Meta等主流產品的同時,訓練成本極低(僅600萬美元),遠低於美國科技巨頭動輒數十億至百億美元的投入。

這一突破直接動搖了市場對AI行業高資本支出邏輯的信心,投資者質疑美國科技公司的高投入是否必要。

此外,DeepSeek使用英偉達H800晶片(效能受限版本)完成訓練,表明即使硬體條件有限,也能通過演算法最佳化實現高效模型開發。這削弱了市場對高階AI晶片(如英偉達H100)需求持續增長的預期,導致英偉達、博通等晶片股重挫。

市場還擔憂DeepSeek的開源策略可能加速技術擴散,降低行業壁壘,進一步威脅美國科技巨頭的壟斷地位。微軟CEO納德拉、Meta CEO朱克伯格均表示高度關注其進展,並調整研發策略。

而恰在1月27日這一天,DeepSeek公布了一系列多模態AI模型,稱可在影像生成和分析上全面超越OpenAI的相關產品。且這些模型已經可以公開下載,採用開源協議,意味着可無限制用於商業場景。

對此,硅谷的一位做「文生圖」創業的朋友很開心地告訴筆者:「這對於我們是一件好事。可以大大降低我們的成本。」

最後一排右邊第6個是梁文鋒。(南方日報)

技術信仰:金錢只是一個工具

梁文鋒是一名純粹的技術工作者,早年進軍私募行業,算是形勢造就。畢竟這是一個提倡「科技+金融」的年代,但回歸初心,他還是嚮往那個最終的技術理想。

「我們覺得現在最重要的是參與到全球創新的浪潮裏去。過去很多年,中國公司習慣了別人做技術創新,我們拿過來做應用變現,但這並非是一種理所當然。這一波浪潮裏,我們的出發點,就不是趁機賺一筆,而是走到技術的前沿,去推動整個生態發展。」

「我們認為隨着經濟發展,中國也要逐步成為貢獻者,而不是一直搭便車。過去三十多年IT浪潮裏,我們基本沒有參與到真正的技術創新裏。」

從梁文鋒接受媒體的專訪可以看出,這份對技術的終極追求,才是他真正的事業方向。金錢,可能只是一個工具。

這一點,也體現在他的用人標準上。

「我們選人的標準一直都是熱愛和好奇心,所以很多人會有一些奇特的經歷,很有意思。很多人對做研究的渴望,遠超對錢的在意。」

硅谷著名風投家Marc Andreessen評價DeepSeek-R1稱:「作為開源項目,這是對世界的一份深遠饋贈 (As open source, a profound gift to the world)。」

業內人士評價稱,量化投資是DeepSeek的早期「孵化器」。幻方量化是上一輪機器學習的產物。DeepSeek最重要的事是推動人工智能的發展。錢和商業化的優先順序都不高。

他們認為,比技術更重要的是願景。梁文鋒是有抱負的,DeepSeek不在乎形態,AGI才是他的終極目標。

2024年,浙江大學公布了與杭州徑山寺合作的「徑山藏古籍檢索系統」的初期階段成果。該成果可通過《徑山藏》古籍資料庫實現藏經原貌查閲、觀賞功能。據了解,這一成果也是培養了梁文鋒的訊息與電子工程學院的傑作。

也許,科技界的東方神秘力量正是源於東方獨特的文明財富。

當中國企業家奔赴「詩與遠方」,心裏懷揣慈悲,兼濟天下,是需要這麼一份情懷。


正在加載