AI代勞抄筆記 視頻提取文字檔
【明報專訊】新冠肺炎疫情爆發,網上視頻課程愈趨流行,但學生要由零開始自製筆記,很花時間。有初創公司就運用人工智能(AI),開發出一套自動從視頻提取所有有效文字筆記的技術,包括語音信息,以及畫面內曾經出現的文字,提升學習效率和用戶體驗。這服務現已免費試用,預料兩個月後將會開始收費。
明報記者 薛偉傑
雲影天光科技國際有限公司運營總監李芊表示,公司在去年4月開始研究,在雲端利用人工智能和自然語言處理(NLP)技術,從視頻中快速提取所有有效文字筆記的技術。他們有感網絡視頻課程日益普及,但學生若要自行做筆記,將視頻中的文字信息全部記錄很花時間。
視頻中的語音信息靠語音辨識技術來處理,而字幕、彈幕及其他文字靠影像辨識技術來處理,文字信息可以同時分別提取,不會互相干擾。
公司的服務稱為「十行筆記」,用戶使用時,只需在其網站(https://videoai.perspectivar.com)提供一段視頻超連結,或者將整段視頻上載,暫時支援YouTube和bilibili。至於十行筆記從這段視頻提取所有有效文字筆記的處理時間,大約是視頻長度三分之一至二分之一。若是幾分鐘的短片,處理時間就會和播放時間相若。
至於語言和文字方面,計劃支援英語、普通話、廣東話,以及中文字、英文字。初期限英語和普通話,並先開發內地市場,然後再開拓外國市場。至於提取文字準確程度,去年底已逾八成。由於十行筆記採用機器學習技術來設計,理論上,隨茖洏峇H次愈多,準確率將愈來愈高。
初限英語普通話 準確度逾八成
十行筆記計劃主攻各種網上課程的教育機構和學習者。若能夠和開設網上課程的教育機構達成合作協議,直接收費最理想。公司可以在網上課程界面加上一個按鈕,學生上課後,按一下可以產生筆記,以方便日後溫習。李芊表示,理論上十行筆記能夠處理所有以普通話或英語講述的網上視頻課程,不過,若畫面上出現太多數理化符號,有可能辨識得不太準確。
除網上教育行業,公司覺得,十行筆記亦十分適合傳媒工作者使用。因為記者可以從各種新聞短片、視頻訪問、網上發布會或網上研討會,快速提取文字,以方便寫稿,或為短片配上字幕。
月費百元可處理全高清視頻
因為新冠病毒肺炎疫情,多個地區的學校和補習社都曾經被迫暫時停課,學校老師和補習導師透過網絡授課;商界很多發布會和研討會亦改為網上。因此,公司近月開始讓人免費試用十行筆記,吸引不少人注意和使用。十行筆記暫時只支援20分鐘以內視頻,每名用戶可以免費處理視頻總長度限於60分鐘,之後要付款。公司計劃在8月開始收費,方式包括出售點數和月費計劃兩種,月費再分為數十元和約100元兩級,百元月費可以處理的視頻總長度較長,以及可以處理全高清視頻。
以網站形式提供服務之外,公司計劃在稍後推出十行筆記的手機App及微信小程序,方便智能手機用戶使用。另外,近月很多人使用視像會議軟件Zoom開會,所以打算設計一個插件程式,讓機構用戶安裝,當用Zoom開會後,只要在畫面上按一個鍵,就可以自動產生會議紀錄。