元宇宙會議方案 冀打破語言地域限制
【明報專訊】近年,先後出現了多個演唱會以「元宇宙」概念為賣點。有本地科技公司認為,與其局限在少數演唱會上使用,倒不如將有關技術標準化、普及化,擴大應用到大型會議、研討會甚至創業比賽等,以協助打破語言和地域限制,以及加強參加者的互動體驗。有關方案已開發完成,未來兩個月將會有兩個活動率先使用。
明報記者 薛偉傑
MUXIC Limited行政總裁鄒健宏表示,最初是因為該公司接到生意,為演唱會開發技術,以加強互動,「例如,觀眾可以(在網上)向歌手派心心、留言鼓勵或點唱。甚至,觀眾間也可以『虛擬擁抱』等」。
當時他覺得,每接到一單這種生意,公司都要花大半年開發,但這種生意不是常有,好像不太划算;是否可以將有關技術標準化、普及化、重用,以擴大市場和應用範圍?他想到,大型會議模式和演唱會相近,但數目和舉行頻率高得多。而且,現時很多研討會都同時在線下和線上舉行,該公司以往為演唱會開發、茩奏篧窱畢X的技術,正派上用場,於是決定將相關技術作進一步整合、開發、優化和標準化,成為一套「元宇宙會議方案」。
支援多種語言 數字化身與真人同步
鄒健宏指出,元宇宙會議方案有幾個特點。第一,透過語音辨識和翻譯技術,支援多種語言,暫時為英語、廣東話、普通話。講者以任何其中一種語言演說,系統可自動辨識,即時翻譯,讓現場大屏幕同時出現多種語言字幕,方便現場觀眾。至於在網上收看的觀眾,可在登入時選定一種語言,之後所有講者演說都會自動翻譯。網上同時參與的觀眾,最多可達5000人或以上。理論上,方案可支援很多種語言,但廣東話和其他語言互譯較複雜,為保持較高準確率,該公司初期只支援英語、廣東話、普通話。
第二,網上觀眾可選擇觀看講者真人或「數字化身」。數字化身的動作和真人相同,以及接近同步。因為元宇宙會議方案會使用人工智能技術分析講者的動作,然後控制其數字化身做出相同動作。
第三,當講者正在演說時,任何觀眾都可以透過網上發問,讓講者選擇是否回應。而且,考慮到講者逗留的時間有限,元宇宙會議方案特別有一個「左右腦」功能,可以在會議之後代替講者,來繼續回答網上的問題(事先需獲得講者的同意和授權)。
「左右腦」功能代講者回答問題
「左右腦」是指會用到兩個人工智能大型語言模型(LLM),來代替講者回答問題。第一個大型語言模型是該公司自行開發和訓練的,視作「右腦」,講者需要事先將其講稿或者簡報檔案交給該公司,讓該公司對這個大型語言模型進行「加操」;第二個是ChatGPT,視作「左腦」。
實際運作時,觀眾在網上發問而講者未有回答的問題,會先傳給「右腦」;若「右腦」能夠全部答到,就即時輸出答案。若「右腦」有資料不齊全或不肯定(尤其涉及最新經濟或金融數據等),未能完全回答,則會交給「左腦」去找。之後,「左腦」再將有關資料傳送回「右腦」。「右腦」對那些資料篩選,將具有政治、宗教、暴力或色情敏感字句過濾,結合它原有答案,才輸出成最終答案。
這個「左右腦」功能,一方面有如讓講者「分身」,滿足到大批想發問的觀眾;另一方面也相當穩陣。時間方面,即使是用到「右腦→左腦→右腦」這個模式,亦只需兩至三秒,已可輸出答案。而且,在網上發問的觀眾還可以自由選擇,公開或不公開問題;若選不公開,只有他自己能夠看到問題和答案。所以,理論上,可以讓數千個觀眾都有不同的體驗。
元宇宙會議方案現已完成開發,將會應用在12月一個財經界頒獎禮,以及明年1月一個上市公司年會。鄒健宏表示,現時仍然有些屬於試推性質,該公司未定下正式收費計算方式,所以對這兩個活動主辦機構收費只屬「象徵式」。但他相信,只要證實到運作暢順,將來可能會有不少活動採用,每個月幾場也不出奇。
尤其是涉及到科技、學術的研討會,未必很多人可抽時間搭飛機到場出席。若採用元宇宙會議方案,可讓不同國家的人參與和認知,甚至部分講者也不必親身出席。此外,大型展覽會、創業比賽等同樣適合採用,尤其是連續數日舉行的「黑客松」比賽。
今年7月中舉行的「虛擬經濟博覽及會議」,已應用這個方案的技術。當時,參加開幕禮的現場觀眾可進入一個投票網站,自由輸入字詞。最多人輸入、屏幕上出現頻率最高的幾個字詞,就被AI系統採用,成為創作歌曲的主題。然後,AI系統即時生成了一首英文歌,由主辦機構負責人的數字化身唱出來。