偕沙特入AI戰團 阿聯酋推阿拉伯語語言模型
人工智能的競賽不限於歐美及亞洲多國,部分中東國家亦積極發展自身的AI工具,在沙特阿拉伯與阿聯酋在搶購Nvidia高階晶片引發外界關注之際,阿聯酋周三(8月30日)更發表號稱全球最高質素的阿拉伯語AI程式,表明要在海灣地區推動使用生成式人工智能(generative AI)。
該款大型語言模型(LLM)名為Jais,為一種建基於大量阿拉伯語及英語數據的開源雙語模型,由阿聯酋王室成員兼國安顧問塔赫農(Sheikh Tahnoon bin Zayed al-Nahyan)領導的AI公司G42、穆罕默德·本·扎耶德人工智能大學(MBZUAI)及加州AI公司Cerebras合作研發。
團隊花21天時間訓練AI,推出前亦經測試清除「有害」、「敏感」及不代表開發團隊價值觀的不當生成內容。
Jais並非阿聯酋的首個大型語言模型,國營技術創新研究所今年推出另一大型語言模型Falcon。Jais的開發者聲稱若以阿拉伯語準確度為基準,Jais表現較Falcon及其他大型語言模型好。與大多數以美國為中心的大型語言模型比較,Jais能更準確了解阿拉伯地區文化和背景。
G42旗下的AI應用研究單位Inception行政總裁傑克遜(Andrew Jackson)稱,阿聯酋一直是AI領域的先驅,又指大多數大型語言模型都以英語為主,而阿拉伯語是世上最多人使用的語言之一,認為阿拉伯語社群應擁有自家的大型語言模型。(金融時報)