AI 模型功能佳價格卻超佛 陸新創公司 DeepSeek 有何來頭?
2024年12月27日,DeepSeek發佈新一代大語言模型「DeepSeek-V3」。(圖/取自DeepSeek官網)
小米的大模型團隊近期傳出正在搭建GPU萬卡集羣,由小米集團創辦人雷軍以人民幣千萬年薪親自挖角1995年出生的「AI天才少女」羅福莉,引發市場議論。雷軍之所以看中羅福莉,就在於她曾是AI新創公司「DeepSeek」的團隊成員,並擔任其大模型「DeepSeek-V2」的關鍵開發者之一。
雷軍曾表示,小米做大模型看中的是輕量化和本地部署。如何在燒錢的大模型業務中平衡成本,無疑是雷軍考慮的核心問題。DeepSeek的模型以高性價比著稱,更被戲稱是「AI界的拼多多」,其訓練成本顯著低於同類模型,被視爲當前人工智慧技術與發展路徑的新方向。