DeepSeek關鍵開發者 「天才少女」羅福莉爆紅
【明報專訊】中國人工智能公司深度求索(DeepSeek)備受全球關注,除掀起大眾對DeepSeek及其始創人梁文鋒關注外,曾參與語言模型DeepSeek-V2研發的關鍵開發者之一、被稱為AI「天才少女」的羅福莉亦成為關注焦點。有內地媒體報道指出,小米創辦人雷軍去年甚至以高達千萬人民幣年薪,向她挖角並領導小米AI大模型團隊。
DeepSeek掘起震撼全球。美國總統特朗普表周三(28日)表示,DeepSeek能以更少的資源提供與現有人工智慧模型相同的效能,威脅美國主導AI熱潮的地位。
北大碩士8論文登AI頂尖會議
綜合內地媒體報道,現年約30歲的羅福莉,2013年高中畢業,後來在北京師範大學攻讀電腦專業,碩士畢業於北京大學計算語言學專業。2019年,她於北大讀碩士期間,在AI領域頂尖國際會議ACL發表8篇論文,並登上「知乎」熱搜。
碩士畢業後,羅福莉加入阿里達摩院作人工智慧研究,從事預訓練語言模型相關的工作,負責阿里達摩院AliceMind開發項目,主導開發多語言預訓練模型VECO。
2022年,羅福莉加入幻方量化從事深度學習相關策略建模與演算法研究,後來跳槽到DeepSeek擔任深度學習研究員,參與研發MoE模型(混合專家模型)DeepSeek-V2。
去年5月,在DeepSeek-V2發布以後,羅福莉在知乎上撰文,表示「單論DeepSeek-V2模型的中文水平,是真實處在國內外閉源模型的第一梯隊」,又指相比GPT4,DeepSeek-V2屬「性價比之王」。
自稱是羅福莉的高中老師李波去年12月接受內地媒體訪問時,引述當年僅29歲的羅福莉說仍未答應是否加入小米。李波在訪問時表示,羅福莉在研究生畢業後工作一年左右結婚,夫婦在杭州已經買了物業。
(澎湃新聞/證券時報)