DeepSeek低成本衝擊 AI股蒸發9萬億 登歐美App Store榜首 稱遭網攻停境外註冊
【明報專訊】中國人工智能公司深度求索(DeepSeek)上周一(20日)發布最新大語言模型DeepSeek-R1,在美國熱度持續C升。根據多項第三方評測,DeepSeek-R1以極低成本實現與OpenAI去年底才發布的最新模型「o1」同等性能,令市場相信發展AI毋須再投入大量成本。美國上市的晶片龍頭股Nvidia(英偉達)昨晚股價大跌13%(見另稿)。據彭博統計,歐美上市AI相關股份市值昨天蒸發1.2萬億美元(約9.36萬億港元)。DeepSeek昨日深夜宣布,由於受到惡意攻擊,暫時限制內地+86手機以外的新註冊。
性能同最新ChatGPT
DeepSeek昨日在歐美多國蘋果應用商店App Store登頂,力壓長期霸榜的另一款人工智能軟件、OpenAI開發的ChatGPT。昨日上午11時許,DeepSeek官網一度顯示「DeepSeek網頁/API不可用」,截至發稿,功能已恢復。DeepSeek最新公布:「近期DeepSeek線上服務受到大規模惡意攻擊,為持續提供服務,暫時限制了+86手機號以外的註冊方式,已註冊用戶可以正常登錄,感謝理解和支持。」
DeepSeek去年底釋出開源大型語言模型DeepSeek V3,到本月20公布DeepSeek-R1模型正式版,引發全球熱議。對於一款中國大模型來說,能夠在美國力壓ChatGPT,業界評論是歷史性一刻。
模型成本最少8億 今4368萬
DeepSeek發布DeepSeek-V3時宣稱,依靠2048顆英偉達晶片H800完成6710億參數模型的訓練,成本約560萬美元(約4368萬港元),遠低於其他模型的訓練成本。據《華爾街日報》,AI開發商Anthropic首席執行官Dario Amodei去年表示,構建一個模型的成本在1億至10億美元(約7.8億至78億港元)之間。
為美國總統特朗普提供科技行業顧問服務的矽谷著名風險投資人Marc Andreessen上周五在社交平台「X」發帖稱,DeepSeek-R1是他見過「最令人驚歎、最令人印象深刻的突破之一」,其言論加上西方主流媒體在周末爭相報道,令DeepSeek在三兩天內聲名大噪。
矽谷一家利用生成式AI預測財務回報的企業創始人Anthony Poo表示,公司已從Anthropic的Claude模型改用DeepSeek,兩者性能相近,但後者成本只是Claude約四分之一。
採開源模型 免費用
馮驥:國運級科技成果
國產遊戲「黑神話:悟空」製造商遊戲科學創始人馮驥表示,DeepSeek「可能是國運級別的科技成果」。他說DeepSeek令人震撼的突破來自純粹的中國公司,團隊成員全部來自本土,沒有海外經歷。他表示,DeepSeek-R1能夠讓公憫韝F解AI,任何人可免費使用,甚至有適用於手機的迷你模型,有望令AI成為如同水電一般的生活必需品。
團隊全中國人 破美晶片限制
新華社文章指出,中國AI領域快速發展,讓美國打壓政策盡顯尷尬。美國近年限制對華出口用於訓練AI的高性能晶片,包括英偉達A100、H100等。
圖靈獎得主、Meta首席AI科學家楊立昆(Yann LeCun)上周六表示,DeepSeek的橫空出世,並非「中國在AI領域超越美國」,而是意味開源模型超越了封閉模型。他認為DeepSeek誕生於前人的成果,又向後人提供繼續發展的基礎,所有人都能從中獲益,正是開源的力量。Meta一向支持AI以開源形式發展,Open AI則採取封閉模式。
■明報報料熱線﹕inews@mingpao.com / 9181 4676