☰

小扎自曝願開源100億美元模型！2025年AGI沒戲，能源短缺成最大瓶頸

新智元報道

編輯：編輯部

【新智元導讀】在最新的播客訪談中，小扎又做了一把「開源英雄」，大方表示：花費100億美元研發的模型，如果對人類安全且有益的話，他會選擇開源。此外，他還表示是個悲觀主義者，因爲能源瓶頸，我們離AGI還有幾十年的距離。

如果你手頭有一個價值100億美元的AI模型，通過了安全測試且讓所有人受益，你願意將它開源嗎？

這個問題會讓許多人陷入良久的思考，但小扎沒有猶豫，他的回答是——我願意！

這個驚人的言論，出自最近小紮在Dwarkesh Patel播客中的談話。

此外，這期乾貨滿滿的談話中，他還曝出了不少內幕消息，比如Meta爲何會未卜先知，在2022年就大量買進H100；爲何自己會篤信元宇宙等等。

而且，跟Sam Altman、馬斯克等高歌猛進的樂觀主義者不同，小扎對於AGI的短期實現是持悲觀態度的。

在他看來，人類根本不可能在2025年之前實現AGI，因爲最大的瓶頸就是能源限制。要解決能源問題，我們還需要幾十年時間。

開源價值100億美元的AI模型，我願意

當主持人Patel問道：如果Meta砸了100億美元開發出一個模型，它完全安全，甚至評估值還可以對模型微調，你會開源嗎？

小扎堅定不移地表示：會。

主持人魯豫臉表示不信：「花了100億美元研發費用的模型，真的說開源就開源？」

小扎表示，Meta會對此進行評估的，畢竟公司一向以開源英雄著稱，在開源方面有悠久的歷史，擁有PyTorch、React和開放計算等項目。

在開放計算項目中，Meta將所有服務器、網絡交換機和數據中心的設計都開源了。這樣，整個行業都以他們的設計爲標準，直接讓供應鏈圍繞這種設計建立起來。

這就大大降低了價格，直接爲相關人員節省了數十億美元。

而且，開源就能集思廣益，如果有人能找到更便宜的運行方法，提升10%的效率，那就能直接節省數十億甚至數百億美元，這本身就是很值錢的，因此開源好處多多。

不過，他也承認：如果模型成爲產品時，情況就變得複雜了。此時，就需要仔細權衡開源在經濟上的利弊，不過，目前Meta並不處於這種情況。

這是顯而易見的，因爲Meta絕對不會把Instagram的代碼開源。

蘋果和谷歌是糟糕的守門人

同時，小扎也痛批了競爭對手一把。

他表示，移動生態最糟糕的一點就是，我們可以開發什麼，是由蘋果和谷歌這兩個守門人把門的。

因爲每當Meta構建出一些產品，這倆就會分走一大筆錢。

更讓小扎不滿的是，很多次Meta想要推出新產品或新功能，蘋果都會說不行。

小扎直呼：如果世界裡只有這幾家運行封閉模型的公司，它們將直接控制API！

就是爲了打破這種局面，Meta深信自己去構建一個模型是值得的。

對此，Ate-a-Pi開玩笑道：因爲扎克伯格是個好人！

當然，他確實是個好人。但更重要的是這背後商業上的考量：

1. 允許在Meta之外進行社交產品的調試：

2. Meta面臨的最大威脅是character.ai：

3. 摧毀競爭對手：

4. 分佈式研發：

不得不說，小扎的這波操作可謂是體現了他對社交無人能及的理解，彷彿就像來自另一個星球一樣。

除此之外，在2023年第四季度財報中，小扎也曾詳細說明過了以上內容。

寒冬已來，25年前不可能實現AGI

關於AGI的短期實現，小扎是持悲觀態度的。

在他看來，2025年之前是不可能實現AGI的，最大的瓶頸，就是能源限制。

能源將限制AI的發展，而如果要解決這些問題，可能需要幾十年時間。

雖然坐擁至少數萬塊英偉達GPU，但小扎卻覺得，單純把計算集羣造大，早晚會遇到邊際效應的那一點，感覺有點在內涵Sam Altman。

在採訪中，他表示如今世界上最棘手的事情就是：雖然Llama-3的8B比Llama-2的70B更好，但指數曲線還能持續多久？

儘管如此，他也認爲投資100億美元，甚至1000億美元，來建設基礎設施是值得的，或許會讓我們得到一些驚人的東西。

是的，如今GPU的供應限制，已經讓很多公司投入大量資金來構建基礎設施。

在到達某一點的時候，投入更多資本的性價比就變低了。

而且在到達這一點之前，我們就會遇到能源的限制。因爲目前還沒人建立過一千兆瓦的單一訓練集羣。

在過去十年中，每單位能量的原始計算量每兩年翻一番，老黃也意識到了這一點

主持人提問道：如果你有1萬億美元呢？

小扎表示，這還是取決於指數曲線會走多遠。

現在的數據中心，規模大概是50兆瓦或100兆瓦，特別大型的能達到150兆瓦。

但300兆瓦、500兆瓦甚至1吉瓦的數據中心，需要花費數年時間才建成，如果是1吉瓦，就需要一個核電廠的能源。

此外，也存在架構瓶頸。

小扎認爲，如果持續給Llama-3 70B提供更多數據，或者通過token進行優化，它會持續改進。

不過，我們在此基礎上構建的東西，不可能無限進步。

也就是說，小扎基本陷入了漸進主義的陷阱，他不相信GPT-4的性能可以提升100倍，或AGI在短期內能實現。

如果GPT-5的性能是GPT-4的10到100倍，那當前的MMLU之類的基準測試，根本就不起作用。

那該如何衡量，模型創造的價值是否超過了部署成本呢？

總之，放出這種言論的小扎，現在並沒有在籌集資金。而Sam Altman、馬斯克、Dario Amodei等瘋狂籌資的大佬，都預計AI模型能力將大幅提高。

這其中有多少是真實水分，有多少是炒作需要，我們就不得而知了。

只能說，相比之下小扎目前看起來更像個老實人。

22年買入大量GPU，是未卜先知？

在2022年公司股價遭遇重創之際，小扎還是鋌而走險，購買了大批H100。

當年第三季度財報顯示，Meta資本支出高達320億-330億美元。

其中一部分大多流向數據中心、服務器和網絡基礎設施構建，以及在元宇宙上的鉅額投入。

而現在看來，他好像擁有一種未卜先知的能力。

在採訪中，小扎解釋道，「當時Meta正大力發展短視頻工具Reels，因此需要更多的GPU來訓模型」。

「這也是我們提供服務的一次重大轉變，我們不再針對你所關注的人或頁面的內容進行排名，而是開始大力推薦『非關聯內容』的內容」。

也就是說，向用戶展示候選內容的語料庫，有時會從幾千個擴大到數億個。

若想在這一數量級數據中完成訓練推理，就需要一個完全不同的基礎設施。

「因此，我們要訂購足夠多的GPU，以滿足我們在Reels、內容排序和信息流等方面的需求。還要額外多購買一倍」。

另外，小扎曾在年初宣佈，計劃到年底要部署35萬塊英偉達H100。

他透露了更多的細節，這將是一個非常大的艦隊。Meta內部將爲訓練LLM打造兩個單集羣，一個配備22,000塊H100，另一個集羣配備24,000塊。

因爲模型推理對Meta來說，是至關重要的一件大事，需要爲Facebook、Ins等自家應用的用戶提供服務。

用小扎的原話來說，就是：

GPT-4級開源模型，今年晚些發佈

小扎還提到，對於Llama 3，主要專注於使用大量代碼進行訓練。在代碼中訓練模型，有助於其在不同的領域中進行推理。

與此同時，Llama 3是專爲工具使用而設計。

「我們的開發者不需要手寫所有代碼，就可以讓模型使用谷歌並進行搜索」。

他還提到了，下一代模型Llama 4將針對智能體行爲而打造。

其實，整個AI圈更加期待的是，媲美GPT-4級別的開源模型Llama 3-405B能夠發佈。

小扎稱，4050億參數的Llama 3將具備更強的多模態能力，支持多種語言，以及更大的上下文窗口，並計劃在今年晚些時候推出。

就目前訓練結果而言，405B已經在大規模多任務語言理解的基準測試（MMLU）中，取得了大約85分的成績。

其實Llama3發佈三天後，已經有1000個微調模型在Hugging Face上發佈。

1000個微調Llama 3模型，中文佔8個

HF的創始人Clement Delangue非常期待，下週結束前，或許會有1萬個開源Llama3變體上線。

其中，網友@meng__shao總結了，截止目前中文的微調模型已達到6個。

目前，最小版本的額Llama-3 8B已經在改變世界，不僅能在消費級設備上運行，還開闢了大量領域的應用。

那麼，未來的Llama模型，或許是能夠解決用戶所有用例的Llama 10發佈那天，是否足以取代現實中的程序員？

小扎表示，「我不確定我們是否正在取代人類程序猿，因爲Meta正在給人們提供工具來做更多的事情」。

對元宇宙的信仰從何而來

雖然燒了300億美元不止，但小扎對元宇宙似乎依然沒有放棄。

主持人提出了一個尖銳的問題：就是市場對你大加指責，你也要堅定去做元宇宙。這種篤定，究竟來源於什麼？是什麼樣的價值觀或直覺，讓你如此篤信元宇宙？

小扎表示，自己只是單純喜歡建造東西。

他喜歡圍繞人們的交流、表達和工作來構建產品，這跟他大學時的專業有關。他學的是計算機科學和心理學，而建造元宇宙，就是兩門專業的交叉點。

這是一種深刻的內驅力，讓他覺得自己如果不做點新東西，就像犯了錯一樣。

而且，無論身處何處，元宇宙都能讓你感受到與人的聯結，在小扎看來，這是一個殺手鐗。

技術的一個教訓是，要儘可能將物理約束領域的東西轉移到軟件中，因爲軟件更容易構建和迭代。

不是每個人都有數據中心，但很多人都可以寫代碼，並且使用和修改源代碼。

而元宇宙版本的軟件，就是實現現實的數字存在。在社交、溝通、醫療行業等，元宇宙都會作用巨大。

而且，在爲AI投資1000億美元，或者爲元宇宙投入鉅額資金時，商業計劃就能表明：如果產品奏效，這是很好的投資。

即使在生活中，小扎也是這樣的。在考愛島，他建了一個牧場，負責設計所有建築。

「如果要養出世界上最好的牛，該怎麼設計呢？這就是我。」

參考資料：

https://twitter.com/8teAPi/status/1781480713394737238

https://the-decoder.com/why-meta-ceo-mark-zuckerberg-is-willing-to-give-away-a-10-billion-ai-model/

小扎自曝願開源100億美元模型！2025年AGI沒戲，能源短缺成最大瓶頸

相關資訊