半導體研究機構:DeepSeek硬體投資或逾5億美元

撰文:成依華
出版:更新:
中國人工智能(AI)公司DeepSeek推出的新模型DeepSeek-R1因價效比高而廣受關注,成本多少成為外界焦點,半導體研究機構SemiAnalysis發表報告,估計DeepSeek公司歷年來的硬體投資支出為遠高於5億美元(約39億港元)。
DeepSeek在2024年12月公布的文件中,透露其模型DeepSeek V3的訓練成本為557.6萬美元(約4,349萬港元),低廉的成本引起關注。文件註明成本僅包括V3的官方訓練(official training),不包括與架構、演演算法或資料相關的先前研究和消融實驗(ablation experiments)的成本。

半導體研究與諮詢機構SemiAnalysis發表報告,估計DeepSeek公司的歷來硬體投資支出為遠高於5億美元(約39億港元),並指研發成本和整體成本也相當可觀,稱為模型訓練製作「合成資料」需要大量的計算力。
報告稱「為開發新的架構方法,在模型開發過程中,需要花費大量資金來測試新想法、新的架構理念和消融(ablations)。」
2023年時,外界估計OpenAI的GPT-4訓練成本達到6300萬美元(約4.9億港元)。
DeepSeek觸動多國神經 美國德州政府與NASA禁部門使用 荷蘭調查特朗普晤黃仁勳 路透社:兩人討論DeepSeek及AI晶片出口DeepSeek衝擊市場 OpenAI行政總裁:公司領先地位被削弱