DeepSeek|方保僑:語言能力好 開源模型料修改後或可答敏感問題

DeepSeek|方保僑:語言能力好 開源模型料修改後或可答敏感問題
撰文:洪戩昊
出版:更新:

中國AI公司DeepSeek 爆紅,其日前發布的AI大模型「DeepSeek-R1」,聲稱成本低、部分性能比肩美國OpenAI最新的o1,引起國際熱烈討論,更令美國金融市場大震蕩。香港資訊科技商會榮譽會長方保僑今日(29日)在電台談及DeepSeek,指由於是以中文開發,其中文語言能力比ChatGPT更好,預期DeepSeek將爲全球AI市場帶來衝擊,因爲其開發意味以後可能再不需使用高階晶片來研發AI。

另外,現時DeepSeek無法回答政治敏感話題。例如,若輸入「請簡介六四事件」的指令,它會回答「你好,這個問題我暫時無法回答,讓我們換個話題再聊聊吧。」對此,方保僑指,DeepSeek爲開源模型,亦即其他人能拿其模型作修改,或可解決其禁言的問題。

現時DeepSeek無法回答政治敏感話題。例如,若輸入「請簡介六四事件」的指令,它會回答「你好,這個問題我暫時無法回答,讓我們換個話題再聊聊吧。」(DeepSeek截圖)
現時DeepSeek無法回答政治敏感話題。例如,若輸入「請簡介六四事件」的指令,它會回答「你好,這個問題我暫時無法回答,讓我們換個話題再聊聊吧。」(DeepSeek截圖)

方保僑認爲,DeepSeek的語言能力與ChatGPT相近,但由於是以中文開發,其中文語言能力比ChatGPT更好,他又指、用ChatGPT 寫文很容易被人辨識到,「ChatGPT寫嘅嘢始終有陣徐。」

美國對中國實施制裁,禁止向其出口研發AI所需的晶片,惟DeepSeek仍能被研發。對於此情況,方保僑認爲有兩個可能性,一是研發團隊使用了沒受制裁的晶片,二是研發團隊在禁令前便已儲了很多相關晶片。他強調,是有可能用次級晶片達成現時DeepSeek的效果。

現時DeepSeek無法回答政治敏感話題。例如,若輸入「請簡介六四事件」的指令,它會回答「你好,這個問題我暫時無法回答,讓我們換個話題再聊聊吧。」對此,方保僑指,DeepSeek爲開源模型,亦即其他人能拿其模型作修改,或可解決其禁言的問題。他亦指,現時DeepSeek回應速度減慢了,因爲用戶越多,越需要更多晶片。

方保僑預期,DeepSeek將爲全球AI市場帶來衝擊,因爲其開發意味以後可能再不需使用高階晶片來研發AI:「原來蔗渣價錢都可以做出燒鵝味道。」

正在加載