速讀公民：DeepSeek 低成本衝擊AI市場

[2025.02.27] 發表

【明報專訊】■新聞撮要

中國人工智能公司深度求索(DeepSeek)2025年1月20日發布最新大語言模型DeepSeek-R1，以低成本高效能引發全球熱議，推出20天每日活躍用戶數(DAU)已達2000萬人，成為全球DAU增速最快公司。根據多項第三方評測，DeepSeek-R1以極低成本實現與OpenAI 2024年底才發布的最新模型「o1」同等性能。

DeepSeek於2024年底釋出開源大型語言模型DeepSeek-V3，到2025年1月20日公布DeepSeek-R1模型正式版。DeepSeek發布前者時宣稱，依靠2048顆英偉達(NVIDIA)晶片H800完成6710億參數模型的訓練，成本約560萬美元(約4368萬港元)，遠低於其他模型的訓練成本。據《華爾街日報》，AI開發商Anthropic首席執行官Dario Amodei表示，構建一個模型的成本在1億至10億美元(約7.8億至78億港元)之間。

為美國總統特朗普提供科技行業顧問服務的矽谷著名風險投資人Marc Andreessen在社交平台X稱，DeepSeek-R1是他見過「最令人驚歎、最令人印象深刻的突破之一」，其言論加上西方主流媒體爭相報道，令DeepSeek在三兩天內聲名大噪。

國產遊戲《黑神話：悟空》製造商遊戲科學創始人馮驥表示，DeepSeek「可能是國運級別的科技成果」。他說DeepSeek令人震撼的突破來自純粹的中國公司，團隊成員全部來自本土，沒有海外經歷。他表示，DeepSeek-R1能讓公眾更了解AI，任何人可免費使用，甚至有適用於手機的迷你模型，有望令AI成為如水電一般的生活必需品。

OpenAI於2025年1月31日推出輕量級人工智能模型o3-mini，更首度讓用戶免費使用推理模型。OpenAI行政總裁奧爾特曼(Sam Altman)於產品推出的網上答問環節承認，DeepSeek削弱OpenAI在人工智能的領先地位。

過往科技界對於訓練大型語言模型，都相信規模定律(Scaling Law)，即數據、參數、運算資源愈多，模型的能力和效果會愈好。據報OpenAI本來預期在2024年推出的GPT-5，每次為期半年的訓練中，運算成本高達約5億美元(約39億港元)，未來訓練成本更可能攀升。不過，業界漸對這個定律有疑問。今次DeepSeek-V3出現，或令業界重新演繹這個定律。

(主要學習重點：綜合國力的提升、全球新科技發展概略)

■知識增益

多地政府部門禁用DeepSeek 中國稱從不違法採集數據

美國得州州長2025年1月31日宣布，禁止州官員於政府設備使用DeepSeek，成為首個以這種方式限制DeepSeek的美國州份。韓國多個政府部門以至金融等民營機構於2月初陸續暫時禁用DeepSeek。澳洲政府亦宣布禁止DeepSeek在政府系統和設備上安裝及使用，聲稱該應用對澳洲國家安全構成「無法接受的風險」。

中國外交部發言人郭嘉昆強調，中國政府高度重視並依法保護數據隱私和安全，從來沒有也不會要求企業或個人以違法形式採集或存儲數據。郭嘉昆稱，中方一貫反對泛化國家安全概念、將經貿科技問題政治化的做法。

●模擬試題

1. 參考資料，指出及解釋中國人工智能公司深度求索(DeepSeek)推出的語言模型DeepSeek-R1後引起的兩項關注點。 (6分)

2. 「發展人工智能對提升中國的綜合國力是必要的。」試參考資料及就你所知，解釋這項聲稱。(8分)

(本網發表的文章若提出批評，旨在指出相關制度、政策或措施存在錯誤或缺點，目的是促使矯正或消除這些錯誤或缺點，循合法途徑予以改善，絕無意圖煽動他人對政府或其他社群產生憎恨、不滿或敵意。)

[公民學堂第091期]