視頻有背景音樂 無法使用
【明報專訊】李芊畢業於香港科技大學及加州大學洛杉磯分校,曾在工程和金融領域工作,喜歡研究運用各種人工智能技術和大數據技術,協助提升工作效率以及預測未來趨勢。他和兩名朋友合作創辦雲影天光科技,申請到創新科技署「大學科技初創企業資助計劃」(TSSSU)。
記者實測 內地視頻準確度高
去年9月,雲影天光科技曾經入選「創科香港基金會」(HKXF)主辦的「X-PLAN創科超人團模擬路演及投資人診所」,在廣州介紹商業計劃。該次路演之後,廣州一家創業培育機構主動邀請該公司參加其培育計劃,所以已於去年底在廣州開設分公司。
記者試用過十行筆記,同樣是來自YouTube普通話視頻短片,以內地的處理效果最好。例如,記者在十行筆記的網站界面中貼上一段源於內地紀錄片《厲害了,我的國》短片連結,提取出文字信息準確率超過95%。在該網站界面選「下載」,得到一個微軟docx格式檔案,將有關文字信息與對應的截圖順序地排列好。不過,改用另一段短片,馬來西亞華人網紅說普通話,準確率不到九成。
稍後網站提醒背景音樂限制
記者試驗過在該網站界面中貼上一些流行曲短片的連結,有時會顯示「未有偵測到的音頻文字」,有時會照常提取文字,但差不多每句都錯誤。
李芊解釋,因為流行曲短片除人聲之外,亦有背景音樂,而十行筆記在設計時,未考慮到將人聲和音樂聲分離,所以準確率會未如人意,公司稍後會在網站加上說明,提醒用戶這個限制。