作品未經授權被用作訓練生成AI 創作者及出版商促聯邦採行動應對
【明報專訊】本國創作者和出版商投訴,其內容在未經授權而且往往沒有報告的情況下被用作訓練生成式人工智能(Generative AI),並促請聯邦政府採取行動應對,但科技公司堅稱,此舉並不侵犯版權,並指就該做法設限勢將窒礙有關技術的發展。
雙方在最新發布一份關於版權和人工智能的諮詢文件中闡述各自的觀點,有關諮詢工作是由聯邦政府進行,以研究本國版權法應如何應付諸如人工智能公司OpenAI旗下聊天機械人ChatGPT等生成式人工智能系統的出現。生成式人工智能可根據簡單提示自動產生創造性的內容,例如圖像、音樂、文字等,但前提是系統必須先研究大量現有內容。
加拿大非牟利組織Access Copyright代表作家、視覺藝術家和出版商,它在呈交政府的意見書中指出,大多數其至可能所有大型語言模型(LLM)「目前均從未經授權使用和複製受版權保護的作品中獲益」,存在黑箱作業。該組織指:「儘管版權持有知道有關情況,但鑑於他們跟人工智能平台之間的資訊不對稱,他們無法確定誰人進行有關行為,誰人的作品被使用,也沒有機制阻止有關情況發生。」
加拿大音樂協會(Music Canada)代表全國主要唱片公司,它去年稱,一首以Drake、The Weeknd聲音為原型的AI生成歌曲在網絡上爆紅,事件「明確反映一件事,那就是人工智能模型和系統已在未經授權的情況下,從數據或版權持有人的專有數據庫攝取大量數據」。
美國正就生成式人工智能系統使用受版權保護的資料提出多宗訴訟,加拿大媒體製片人協會(Canadian Media Producers Association)認為,有關官司說明缺乏透明度所引發的問題,促請聯邦政府落實透明度的規定。
不過,人工智能公司堅稱,版權持有人要求的透明度是不切實際。微軟公司(Microsoft)向渥京表示,培訓大型人工智能系統涉及「大量」數據,公司不應保留有關紀錄或披露作訓練用途的內容,它更認為,此舉不屬「分析作品、學習概念和事實的侵權行為」。