• 2025.10.06
    星期一

AI年代:自研AI模型+LLM 解決運作成本問題

[2025.10.06] 發表

【明報專訊】MotoNerv的?「視覺理解?人?工智能模型?」包括兩個部分,分別稱為Vision AI(視覺AI)和Reasoning AI(推理AI)。Vision AI為該公司使用過百萬條短片自行訓練出來的人工智能模型,作用類似人類的眼睛。Reasoning AI是市場上某個主流的人工智能語言大模型(LLM)(若有需要,可以隨時更換另一個),作用類似人類的大腦。

Vision AI負責將影像內的人類、動物、植物、昆蟲?、物件?、汽車、家具?、背景?、環境??,以及行為動作、交互等詳盡細節?,轉化成LLM能夠高效讀取的「檢索增強生成」(RAG)文本格式。然後,Reasoning AI讀入這些文本資料,分析有沒有和監察要求相符的情G。若有的話,便標記下來。?

MotoNerv共同創辦人兼行政總裁馮鑫傑解釋,若要LLM直接分析影片,它也辦得到,但這樣做的算力要求和運作成本極高。分析幾分鐘短片,要幾十至幾百美元。若直接使用LLM來全日24小時分析多個鏡頭的影像,成本沒有機構能夠負擔。所以,該公司才構思出這個二部曲方案,由2023年初開始研發,到2024年初推出市場。現時該公司亦有就這個方案申請專利。

該公司網頁(www.motonerv.tech/demo2)上,亦可以看到幾條短片,以及視覺理解?人?工智能模型?的運作示範,一般人亦可以隨意輸入問題。

不過,馮鑫傑承認,視覺理解?人?工智能模型?這個方案只適合整體理解影像畫面的應用。它和單一範圍專精的人工智能模型其實是各擅勝場,兩者好像十項全能運動員和單項運動員的對比。舉例說,若用戶需要辨認每個人臉,找出一些失蹤人士或恐怖分子等,當然應該採用專攻人臉辨識的人工智能模型。

更多港聞
灣區熱搜:非遺表匠出山  帶老店回家
【明報專訊】中華文化5000年歷史中,雖有不少手藝傳統湮沒於時間長河,但亦有眾多工匠孜孜不倦只為守護一份精神,傳承一門工藝。大灣區版今明兩日... 詳情
灣區熱搜:見證改革開放後行業興盛  嘆今市場與傳承困境
【明報專訊】亨達鐘表的前身為眾鐘表店創立於1955年,隸屬於中國百貨公司廣州分公司,歷經公私合營(1958年)、集體所有制(1967年)和個... 詳情
【明報專訊】「古鐘表修復技藝」去年納入荔灣區第八批非遺項目,項目傳承人周建和解釋:「技藝的價值在於,不同品牌手表的內部構造都是一個微觀世界,... 詳情
【Emily】葉文娟潘Y生做親家  特首到賀  李:夫婦傾偈  幾時發言女方話事
【明報專訊】政府高層日前有喜事,Emily聞說,特首辦主任葉文娟(Carol)上周五嫁女,其女兒Sammi同Y生創建主席潘Y生個仔Pears... 詳情
【Emily】遊港日客增35% 《城寨》街景現東瀛吸客
【明報專訊】香港吸引唔少日本旅客,旅發局宣布今年1至8月錄得超過47萬人次日本旅客,按年升超過35%;當中8月有超過7.6萬人次,按年升近五... 詳情

明報網站 · 版權所有 · 不得轉載
Copyright © 2021 mingpaocanada.com All rights reserved.
Ming Pao Daily News A wholly owned subsidiary of Ming Pao Enterprise Corporation Ltd.
Vancouver Chinese Newspaper

5368 Parkwood Place, Richmond B.C. V6V 2N1 | Tel.: (604) 231-8998 | Fax: (604) 231-9881/9884 | Advertising Hotline Tel.: (604) 231-8992