現時很多科網巨擘都主打語音助理服務,透過人工智能(AI)分析用戶說話並作相應回應。彭博社報道,佔美國六成同類產品市場的亞馬遜智能喇叭,其內置的語音助理Alexa會不時暗中錄下周邊聲音,讓其位於全球各地的數以千計員工及外判團隊進行分析和標記,以教導語音助理改善了解人類語言,惹來私隱關注。有受訪員工透露,他們聽過各種類型的聲音,包括兒童尖叫求救聲,甚至懷疑性侵事件的聲音。
錄音轉文字 稱助改善辨識
彭博社引述7名消息人士報道,為改善Alexa的語音辨識功能,亞馬遜(Amazon)目前有數以千計員工及外判公司員工,專門收聽智能喇叭Echo所收集到的聲音,將內容化成文字、標註並輸入資料庫,以訓練AI軟件加強分辨各地口音,這些員工位於全球多國,除美國外,還包括印度、羅馬尼亞和哥斯達黎加等。兩名亞馬遜員工透露,他們每天工作9小時,一天每人會收聽多達1000個語音片段。另一名員工表示,他們聽到的大部分內容都很普通,但偶爾也會有些用戶「肯定不願被人聽到」的內容,例如一名女子疑似在洗澡時五音不全地哼歌、孩童尖叫求救,甚至是與犯罪有關的語音內容,有兩名員工聲稱聽過懷疑性侵的錄音。
沒觸發指令也錄音
亞馬遜強調員工不會得知錄音用戶的身分,彭博社取得的截圖顯示,錄音檔雖然沒有用戶姓名和地址,但標有用戶的戶口號碼、名字和產品的序號,而一旦涉及執法機構調查,亞馬遜有可能會提供這些語音資料,之前就有Alexa錄音被當成呈堂證據的案例。消息人士更承認,員工之間會在公司內部聊天群組分享錄音。
網媒BuzzFeed News稱,今次事件的爭議在於亞馬遜在私隱政策中只表示Alexa會向公司傳送數據,但未提到公司會如何使用這些數據;在「常見問題」中,亞馬遜也聲稱Alexa不會擅自錄音,只有在聽到關鍵字如「Alexa」、「Amazon」等字眼才會觸發運作。但彭博社引述消息人士稱,每名員工平均每天會聽到多達100個沒有觸發指令而錄下的錄音,顯示Alexa會不時誤錄。
亞馬遜:資料加密 員工不知客戶身分
亞馬遜發聲明回應稱,他們僅「標註」非常小量、且有助於改善語音辨識功能的錄音內容,目的只是為了提升用戶體驗。亞馬遜強調,相關員工沒有任何渠道獲得與用戶身分相關的資料,且所有資訊都有加密,確保用戶私隱不會外泄,公司絕不容忍任何濫用Alexa資料的行為。
專家多對科網公司靠員工聽錄音不感意外。軟件保安公司Varonis首席技術官韋奇(Brian Vecci)說:「AI和機器學習都是由人類建立。亞馬遜要建立一個成功收聽人類指令的機器,唯一的方法就是由人類去調控該機器。」美國密歇根大學教授肖布(Florian Schaub)亦說:「我們只是以為那些機器有魔法學習,實際上仍需人類介入。」(彭博社/BuzzFeed News/消費者報告)