AI模型多開源 「蒸餾技術」漏洞難堵
中國科企DeepSeek(深度求索)被指違規以「蒸餾技術」(distillation)從OpenAI等美國公司擷取數據,訓練旗下人工智能(AI)模型,惟有專家指要堵塞相關漏洞極其困難,尤其許多AI模型都採取開源形式,供大眾免費下載及自由使用。
美國特朗普政府的AI及虛擬貨幣「沙皇」薩克斯周二(28日)在霍士新聞訪問中解釋,在蒸餾過程中,新AI模型向現有模型提問數百萬條問題,學習其知識及模仿其推理過程。路透社周三指,上述技術意味研發新模型時不需重頭開始,可節省大量算力、時間等成本。AI業界普遍容許並使用蒸餾技術,但OpenAI等個別巨擘有服務條款,限制潛在競爭對手取用其數據和技術。
路透社引述專家指,DeepSeek的創新突顯只需少於100萬個較大AI模型的數據樣本,便已能大幅改進小型模型的表現,而OpenAI旗下ChatGPT有數以億計用戶,數十萬條數據的流量實在難以偵測;另Meta的Llama等平台亦可免費下載,並於私人數據中心使用,令發現違反服務條款的行為變得困難;被禁使用OpenAI的企業實際上仍可透過客戶取用該程式。有熟知AI研究的消息人士向路透社表示,美國上屆政府曾研擬套用針對金融服務的嚴格客戶監管要求來規管AI使用,惟特朗普現政府未必歡迎有關做法。
美國紐約網絡保安公司Wiz周三在網誌稱,發現DeepSeek有安全漏洞,令用戶可取得逾一百萬條敏感數據,包括電腦軟件金鑰和聊天紀錄,而DeepSeek其後已修補。英國《金融時報》周三報道,日本軟銀正討論向OpenAI追加投資最多250億美元,用於美國史上最大的Stargate人工智能基建計劃。如成事軟銀投資額將高達400億美元,超越微軟成為OpenAI最大金主。
(路透社/華爾街日報/金融時報)