半導體研究機構:DeepSeek硬體投資或逾5億美元

半導體研究機構:DeepSeek硬體投資或逾5億美元
撰文:成依華
出版:更新:

中國人工智能(AI)公司DeepSeek推出的新模型DeepSeek-R1因價效比高而廣受關注,成本多少成為外界焦點,半導體研究機構SemiAnalysis發表報告,估計DeepSeek公司歷年來的硬體投資支出為遠高於5億美元(約39億港元)。

DeepSeek在2024年12月公布的文件中,透露其模型DeepSeek V3的訓練成本為557.6萬美元(約4,349萬港元),低廉的成本引起關注。文件註明成本僅包括V3的官方訓練(official training),不包括與架構、演演算法或資料相關的先前研究和消融實驗(ablation experiments)的成本。

作為一家中國AI初創公司,DeepSeek在海外遭到諸多質疑。(Reuters)
作為一家中國AI初創公司,DeepSeek在海外遭到諸多質疑。(Reuters)

半導體研究與諮詢機構SemiAnalysis發表報告,估計DeepSeek公司的歷來硬體投資支出為遠高於5億美元(約39億港元),並指研發成本和整體成本也相當可觀,稱為模型訓練製作「合成資料」需要大量的計算力。

報告稱「為開發新的架構方法,在模型開發過程中,需要花費大量資金來測試新想法、新的架構理念和消融(ablations)。」

2023年時,外界估計OpenAI的GPT-4訓練成本達到6300萬美元(約4.9億港元)。

正在加載