「AI會議助手」實時辨識翻譯兼撮要
【明報專訊】中文大學博智感知交互研究中心(CPII)總監蒙美玲教授表示,她們在今年初開始研發一套「人工智能會議助手」(AI Meeting Assistant)軟件,主要是在辨識廣東話時,使用自行開發的語音辨識模型。至於翻譯功能等,則可以使用市場上技術成熟的軟件。這是考慮到,香港人說的廣東話的語境確實較為獨特,也較多中英夾雜,甚至和廣州人說的廣東話也有分別。
港人廣東話語境獨特 有別於廣州
現時,人工智能會議助手未開始商業化,但其原型已經可以示範到多種實用功能,包括將語音實時轉換為文字和翻譯,實時製作會議記錄和撮要,還可以自由設定撮要的長度;在會議紀錄中,將不同發言者的段落分割標示,自動找出和統計會議內容中的關鍵詞和重要實體(例如機構、人物、地方、產品),提供智能分析報告等。她們相信,當人工智能會議助手正式推出後,將可以為一些頻密舉行會議的企業(包括跨國企業)、官方機構、學術機構、國際組織、大型會議主辦機構等,提供高效和智能的會議管理服務,大幅提高生產力。另外,雖然最初開發人工智能會議助手時,主要是想應用在會議方面,但相信影視發行商、電視台、視頻網站等,未來也是其潛在用戶。
兩小時電影 10分鐘可產出字幕
現時,以人工智能會議助手來處理一套兩小時長的電影,只需約10分鐘,就可以產生出其中英文字幕。即是說,處理時間約相當於電影播放時間的十二分之一,可以比一面播放、一面實時處理還要快。不過,暫時來說,比較難預測人工智能會議助手的收費水平和收費方式,因為該中心認為,最理想的推出方式,是為想應用這產品的機構提供度身訂做的服務,以進行針對性優化工作。
另外,人工智能會議助手暫時應用於3種語言以內的會議表現較佳,若超過3種語言,辨識和翻譯的準確率則會下降,這方面未來還需要較多研發工作來改良。