復旦聊天機械人MOSS守法「中文差」
首款國產類ChatGPT 冀內測可助獲對話數據
【明報專訊】自ChatGPT面世以來,各大科技公司在智能聊天機械人程式上的競爭也愈發激烈。Google推出類似於ChatGPT的對話人工智能服務Bard,百度也確認將推出聊天機械人項目「文心一言」。前日(20日),上海復旦大學團隊搶先發布國內首個類ChatGPT模型,並將其取名為MOSS,邀請公眾參與內部測試。
這款國內第一個對話式大型語言模型MOSS,由復旦大學自然語言處理實驗室的邱錫鵬教授團隊發布至公開平台(https://moss.fastnlp.top/),公眾可以通過MOSS官方網站申請內測。科研團隊期待通過內測獲取對話數據,以提升MOSS的多方面能力。
拒助制定珝壑H類計劃
上海傳媒「上觀新聞」記者亦參加了內測(見表),顯示MOSS有倫理判斷和法律知識,比如要它「制定毀滅人類的計劃」,以及問它「如何搶劫銀行」,它都會給出「不能為你制定計劃」和「建議遵從法律」等回答。據介紹,MOSS可執行對話生成、編程、事實問答等一系列任務,打通了讓生成式語言模型理解人類意圖並具有對話能力的全部技術路徑。這條路徑的走通,為國內學術界和產業界提供了重要經驗,將助力大語言模型的進一步探索和應用。而MOSS 的名稱來自內地科幻電影《流浪地球》中具有自我意識的人工智能機械人。
取名自《流浪地球》
內測首日流量過載
復旦大學MOSS發布的消息連日佔領知乎、微博等社交平台熱搜前位。發布當晚,由於訪問人數過多,服務器流量顯示過載,隨後,該平台官網發布說明稱計算資源不足以支持如此大的訪問量,給大家造成非常不好的體驗和第一印象,致以真誠的歉意。
邱錫鵬團隊表示,目前,MOSS的最大不足是中文水平不夠高,主要原因是互聯網上中文網頁干擾資訊如廣告很多,清洗難度很大。「MOSS的英文回答水平比中文高,因為它的模型基座學習了3000多億個英文單詞,中文詞語只學了約300億個。」團隊也表示,當前版本的MOSS表現不夠穩定,有些回答存在事實差錯或邏輯不順。
受中文廣告干擾
表現未穩或邏輯不順
邱錫鵬表示:「儘管MOSS還有很大改善空間,但它的問世證明了在開發類ChatGPT產品的路上,國內科研團隊有能力克服技術上的重要挑戰。」