速讀公民:DeepSeek 低成本衝擊AI市場
【明報專訊】■新聞撮要
中國人工智能公司深度求索(DeepSeek)2025年1月20日發布最新大語言模型DeepSeek-R1,以低成本高效能引發全球熱議,推出20天每日活躍用戶數(DAU)已達2000萬人,成為全球DAU增速最快公司。根據多項第三方評測,DeepSeek-R1以極低成本實現與OpenAI 2024年底才發布的最新模型「o1」同等性能。
DeepSeek於2024年底釋出開源大型語言模型DeepSeek-V3,到2025年1月20日公布DeepSeek-R1模型正式版。DeepSeek發布前者時宣稱,依靠2048顆英偉達(NVIDIA)晶片H800完成6710億參數模型的訓練,成本約560萬美元(約4368萬港元),遠低於其他模型的訓練成本。據《華爾街日報》,AI開發商Anthropic首席執行官Dario Amodei表示,構建一個模型的成本在1億至10億美元(約7.8億至78億港元)之間。
為美國總統特朗普提供科技行業顧問服務的矽谷著名風險投資人Marc Andreessen在社交平台X稱,DeepSeek-R1是他見過「最令人驚歎、最令人印象深刻的突破之一」,其言論加上西方主流媒體爭相報道,令DeepSeek在三兩天內聲名大噪。
國產遊戲《黑神話:悟空》製造商遊戲科學創始人馮驥表示,DeepSeek「可能是國運級別的科技成果」。他說DeepSeek令人震撼的突破來自純粹的中國公司,團隊成員全部來自本土,沒有海外經歷。他表示,DeepSeek-R1能讓公眾更了解AI,任何人可免費使用,甚至有適用於手機的迷你模型,有望令AI成為如水電一般的生活必需品。
OpenAI於2025年1月31日推出輕量級人工智能模型o3-mini,更首度讓用戶免費使用推理模型。OpenAI行政總裁奧爾特曼(Sam Altman)於產品推出的網上答問環節承認,DeepSeek削弱OpenAI在人工智能的領先地位。
過往科技界對於訓練大型語言模型,都相信規模定律(Scaling Law),即數據、參數、運算資源愈多,模型的能力和效果會愈好。據報OpenAI本來預期在2024年推出的GPT-5,每次為期半年的訓練中,運算成本高達約5億美元(約39億港元),未來訓練成本更可能攀升。不過,業界漸對這個定律有疑問。今次DeepSeek-V3出現,或令業界重新演繹這個定律。
(主要學習重點:綜合國力的提升、全球新科技發展概略)
■知識增益
多地政府部門禁用DeepSeek 中國稱從不違法採集數據
美國得州州長2025年1月31日宣布,禁止州官員於政府設備使用DeepSeek,成為首個以這種方式限制DeepSeek的美國州份。韓國多個政府部門以至金融等民營機構於2月初陸續暫時禁用DeepSeek。澳洲政府亦宣布禁止DeepSeek在政府系統和設備上安裝及使用,聲稱該應用對澳洲國家安全構成「無法接受的風險」。
中國外交部發言人郭嘉昆強調,中國政府高度重視並依法保護數據隱私和安全,從來沒有也不會要求企業或個人以違法形式採集或存儲數據。郭嘉昆稱,中方一貫反對泛化國家安全概念、將經貿科技問題政治化的做法。
●模擬試題
1. 參考資料,指出及解釋中國人工智能公司深度求索(DeepSeek)推出的語言模型DeepSeek-R1後引起的兩項關注點。 (6分)
2. 「發展人工智能對提升中國的綜合國力是必要的。」試參考資料及就你所知,解釋這項聲稱。(8分)
(本網發表的文章若提出批評,旨在指出相關制度、政策或措施存在錯誤或缺點,目的是促使矯正或消除這些錯誤或缺點,循合法途徑予以改善,絕無意圖煽動他人對政府或其他社群產生憎恨、不滿或敵意。)
[公民學堂 第091期]