專家倡藉軟件識別資料 要求版權人表明使用條件
【明報專訊】政府擬就人工智能(AI)發展修訂《版權條例》,AI自然語言處理(Natural Language Processing)研究者、立法會議員黃錦輝認為,AI開發者「遵守法律是必然」,重點在如何理順流程,以在尊重版權下使用資料作AI訓練,例如開發者可運用軟件識別資料來源,政府亦可要求版權持有人透過版權宣告(Creative Commons)表明使用條件,以資開發者識別。
中小企難承擔大量版權費
可協議牟利後始分配利潤
黃錦輝接受本報訪問表示,現時大學已有用於識別抄襲的系統,認為AI開發者可先以軟件掃描材料及標識來源,在找出版權內容後,再判斷數據能否使用,若能夠用又需否付費。黃建議在商業層面,中小企開發前期未必可承擔大量版權費,可先與版權擁有人協議,在系統能夠牟利後才分配利潤;政府亦可鼓勵甚至硬性規定版權擁有人先作版權宣告,這亦有助AI開發者及早識別,以免誤用內容。
有意見關注版權內容用作訓練後能否刪走,黃錦輝表示,現時科技界正研究讓機器忘記(unlearn)所學內容,但成熟度有限,較容易的做法是抽走有版權問題的內容,讓系統重做訓練。
香港資訊科技商會榮譽會長方保僑預料隨笓I發展,版權擁有人用於維護版權的成本亦會提高。政府官員昨在立法會提到,可透過科技加強保障版權,方保僑指出,現時有「數碼水印」技術,可透過在檔案內加入一些經加密的編碼,當有人挪用作品,版權人可藉此痕[,作為日後追究的證據;但他指有關技術多用於圖片和影片等,如要為大量作品加入數碼水印,會構成額外成本,至於一般的版權文章或文字,相關技術未必適用。