黃仁勳:AI算力集羣會擴展到100萬芯片,沒有任何物理定律可阻止

英偉達市值重回第一之際,黃仁勳再次接受採訪。

除了談自己和英偉達,還吹了一波馬斯克,再再再次讚賞xAI只花19天建起10萬卡H100超級集羣。

傳聞英偉達正在考慮投資xAI,或許此言不虛。

在這場訪談中他提出,沒有任何物理定律可以阻止AI數據中心擴展到一百萬芯片。

爲此他還提出了超級摩爾定律,從每兩年性能翻倍,變成每年翻兩到三倍。

並指路了具體實現途徑,軟硬件協同設計和數據中心級創新。

圍觀網友表示:很驚人,但更驚人的是我毫不懷疑他們真的能做到。

這是老黃第二次參加訪談節目No Priors,距離上次時隔一年。

在這場36分鐘的訪談中,老黃還透露了更多行業內幕和對未來的設想:

以下是採訪全文編譯整理。

英偉達未來十年的賭注

主持人:

英偉達已經走過了30年,展望未來的十年,您認爲還有哪些重要的賭注需要下?接下來是否只需擴大規模?在從現有架構中榨取更多計算和內存方面,我們是否遇到了限制?您目前的關注重點是什麼?

黃仁勳:

如果退一步思考我們所取得的成就,我們已經從編程走向了機器學習,從編寫軟件工具到創建一個全新的生態系統。

所有這些最初都運行在爲人類編程設計的CPU上,如今則運行在爲AI編程設計的GPU上,主要是機器學習。

世界已經改變,我們進行計算的方式、整個技術棧都發生了變化。

我們能夠解決的問題的規模也發生了巨大變化,如果你能在一塊GPU上並行化你的軟件,你就爲在整個集羣、甚至多個集羣或數據中心上並行化奠定了基礎。

我認爲,我們已經爲將計算擴展到無人想象過的水平做好了準備,並在這個水平上開發軟件。

接下來的十年裡,我們希望每年在整體規模上(而非單個芯片上)將性能提升兩到三倍,從而使成本和能耗每年降低兩到三倍。

當你每年都翻倍或三倍增長,幾年下來,這種複合增長會非常驚人。

我們能超越人們對摩爾定律的理解,即每兩年性能翻倍,我們將進入某種“超級摩爾定律”的曲線。

如何超越摩爾定律

主持人:

你認爲是什麼讓這一切比摩爾定律發生得更快?我知道摩爾定律有點自我實現的性質,先提出了這個想法,然後人們努力去實現它。

黃仁勳:

(摩爾定律)有兩個基本的技術支柱。一個是Dennard Scaling,另一個是Carver Mead’s VLSI Scaling。

這些都是嚴格的方法,但相關技術確實已經到了瓶頸。因此,我們現在需要一種新的擴展方式。

首先,新的縮放方式顯然涉及到(軟硬件)協同設計。

除非你能修改或改變算法以反映系統的架構,或者改變系統以適應新軟件的架構,來回迭代,否則你毫無希望。

但如果你能同時控制這兩方面,你就可以做一些事情,比如從FP64到FP32,再到BFLOAT,再到FP8,甚至FP4,甚至更小的精度。

所以我認爲,協同設計是其中非常重要的一部分。

第二部分,我們稱之爲全棧優化,是數據中心級別的創新。

我們現在處理的大多數計算挑戰,其中一個最令人興奮的當然是推理時間的擴展,基本上是以極低的延遲生成token,進行樹搜索,鏈式思維,可能在腦海中進行一些模擬,反思自己的答案。

AI將自我提示,默默地生成文本,並希望在一秒鐘內做出響應。唯一能做到這一點的方法是你的延遲極低。

與此同時,數據中心仍然需要產生高吞吐量的token,因爲你仍然希望降低成本,保持高吞吐量,實現回報。

這兩個基本要求——低延遲和高吞吐量——是彼此矛盾的。

爲了創造在兩者上都非常出色的東西,我們必須去發明一些新東西,NVLink正是我們實現這一目標的方式。”

訓練和推理基礎設施的相互轉換

主持人:

您的大客戶中,有多少人在考慮基礎設施在大規模訓練和推理之間的相互轉換?

黃仁勳:

現在的基礎設施是解耦的。

Sam(Altman)剛剛告訴我,他最近退役了Volta。他們有Pascal,有Ampere,各種不同配置的Blackwell即將到來。

有些是爲風冷優化的,有些是爲液冷優化的,你的服務需要利用所有這些。

英偉達的優勢在於,今天爲訓練構建的基礎設施,明天將非常適合用於推理。我相信,大部分的ChatGPT服務都是在最近用於訓練的同類型系統上進行推理的。

如果你能在上面訓練,你就能在上面推理。

你完全有信心這些投資會得到回報,然後投入新的基礎設施來擴大規模。

而且英偉達和整個生態系統將致力於改進算法,使你的基礎設施在短短一年內性能提高五倍,這種進展永遠不會改變。

因此,人們將這樣看待他們的基礎設施:

是的,儘管今天爲訓練而構建它,同時會知道它將在推理方面也會非常出色。

而推理將是多尺度的。

首先,爲了蒸餾出更小的模型,擁有一個更大的模型作爲源頭是很好的。因此,你仍然會創造這些令人難以置信的前沿模型,它們將用於開創性的工作,用來生成合成數據,用大模型來教授小模型,蒸餾出更小的模型。

但最終,你會有從巨型到小型的各種模型。小型模型將在特定任務上非常有效,雖然泛化能力不如大模型,但在那個任務上表現非常出色。我們將在一個小小的領域中看到超越人類的任務,由一個小小的模型完成。也許這不是一個小語言模型,而是一個微型語言模型,Tiny Language Model,或者其他什麼。

所以我認爲我們會看到各種大小的模型,我們的希望是,就像今天的軟件一樣。

構建和交付完整的數據中心

主持人:

英偉達爲客戶提供的支持正在像更大的規模發展,從單個芯片到服務器,再到機架,再到NV72,您如何看待這一進程?接下來會是什麼?英偉達是否應該做整個數據中心?

黃仁勳:

事實上,我們確實構建了完整的數據中心。

我們的做事方式是,如果你要開發軟件,你需要完整形式的計算機。我們不會只做幻燈片演示然後交付芯片,我們構建整個數據中心。

在完成整個數據中心之前,你怎麼知道軟件是否正常工作?在整個數據中心建成之前,你怎麼知道你的網絡是否正常工作,以及你期望的效率是否達到了?

這就是爲什麼通常看到某些產品的實際性能遠低於他們在幻燈片上展示的峰值性能的原因。

計算已經不像過去那樣。我常說,新的計算單位是數據中心。

對於我們來說,這就是你必須交付的東西,這就是我們現在構建的東西,我們構建整個系統,並且以完整的形式構建它。

然後以各種組合進行測試,風冷的x86,液冷的Grace,以太網,Infiniband,加上NVLink,不加NVLink,等等。

我們構建每一種配置,我們公司現在有五臺超級計算機,明年我們很容易再建五臺。

如果你對軟件很認真,你就會構建自己的計算機,並且我們以“數據中心即產品”的方式構建它們。

儘管我們不直接銷售數據中心作爲產品,但我們必須像對待產品一樣對待它。

關於它的規劃、建立、優化、調整、保持運行的一切,目標是讓它像打開你的嶄新iPhone一樣,一切都能正常工作。

當然,這背後有技術的奇蹟,但我們現在有能力做到這一點。

因此,如果你對數據中心感興趣,只需要給我一個空間,一些電力和冷卻系統,我們將在30天內幫助你建立起來。這是非常了不起的。

xAI的超級集羣

主持人:

最近有一個令人印象深刻的案例,就是你們爲xAI迅速建立了一個集羣。如果你願意,請談談這個案例,因爲無論是規模還是速度都令人震驚。

黃仁勳:

很多功勞要歸功於馬斯克。

首先,決定去做這件事,選擇場地,引入冷卻和電力,然後決定建立一個擁有10萬個GPU的超級集羣,這是有史以來最大的規模。

然後倒推日程,我們一起規劃他要啓動系統的日期,這個日期是在幾個月前確定的。

所有的組件、OEM、系統、我們與他們團隊的軟件集成、所有的網絡模擬,我們都預先以數字孿生的方式模擬了他的網絡配置。我們預先準備了他的供應鏈,預先安排了所有的網絡佈線。我們甚至建立了一個小規模的版本作爲參考,以便在所有設備到達之前進行測試。

到所有設備到達的時候,一切都已經準備就緒,所有的練習都完成了,所有的模擬都完成了,然後是大規模的集成,龐大的團隊在一起晝夜不停地工作,幾周內集羣就啓動了。

這真的是他(馬斯克)的意志力和他能夠思考機械、電氣問題並克服巨大障礙的證明。

主持人:

如果你展望未來,達到20萬、50萬、100萬的超級集羣,您認爲最大的障礙是什麼?資本、能源、供應?

黃仁勳:

你剛纔提到的這些因素,沒有一件是輕鬆的。

是否值得追求這樣的規模擴展?毋庸置疑是值得的。

要達到我們想象中的那種計算機,能夠輕鬆地完成我們要求它做的事情,具有某種通用智能。甚至我們可以爭論它是否真的具有通用智能,但即使接近它也是一個奇蹟。

我認爲有五到六個團隊在努力嘗試實現這一目標,有OpenAI、Anthropic、xAI,當然還有谷歌、Meta、微軟等公司。

這個前沿領域,在攀登這座山峰的過程中,接下來的幾步是至關重要的。誰不想成爲登上這座山峰的第一人?

我認爲,重新發明智能的獎賞太過重要,無法不去嘗試。

我認爲,沒有物理定律的限制,但一切都會很難。

AI芯片設計和英偉達的運作方式

主持人:

一年前,當我們一起交談時,我們問過您,英偉達在人工智能和其他領域中,您對哪些應用程序最感興趣,接下來將爲客戶提供哪些服務,您談到了您最極端客戶的一些科學應用。

在過去的一年中,這已經成爲更主流的觀點。人工智能在科學中的應用是否依然最令您興奮?

黃仁勳:

我很高興在英偉達有AI“芯片設計師”,有AI“軟件工程師”。

它們非常高效,如果沒有它們,我們無法構建Hopper。

它們與人類相比可以探索更大的空間,因爲它們有無限的時間,它們在超級計算機上運行。我們的人類工程師時間有限,無法探索儘可能多的空間,也無法組合地探索空間。

我無法在自己探索的同時,涵蓋你的探索和其他人的探索。

我們的芯片如此之大,它們並不是作爲一個芯片設計的,而是像一千個芯片那樣設計的。我們必須分別優化每一個。

你真的想要優化更多的模塊,跨模塊協同設計,優化更大的空間。

沒有人工智能,我們的工程師無法做到,我們沒有足夠的時間。

主持人:

自從我們上次交談以來,還有一件事發生了變化。我查了一下,當時英偉達的市值約爲5000億美元,如今已超過3萬億美元。在過去的18個月裡增加了2.5萬億美元的市值,相當於每月增加了1000多億美元。

今天早些時候我來到英偉達公司,感受到了公司的活力,就像15年前我在谷歌時一樣,能感受到公司的能量和興奮。

在這段時間裡,有什麼變化嗎?或者說,有什麼不同之處,無論是英偉達的運作方式,還是您對世界的看法,或者您可以採取的賭注的規模?

黃仁勳:

公司無法像股價那樣快速變化,所以在很多方面,我們並沒有太大改變。

我認爲,我們需要退一步,問問自己,我們在做什麼?

從行業角度來看,我們重新發明了計算。它已經60年沒有被重新發明過了,這是一件多麼重要的事情。

在過去的10年裡,我們將計算的邊際成本降低了大約一百萬倍,以至於我們可以說,讓計算機去窮舉地編寫軟件吧。

某種程度上,我們可以說,我們也在芯片設計中說了同樣的話。我們希望計算機去發現一些我們自己無法做到的關於芯片的東西,探索我們的芯片,並以我們無法做到的方式優化它。

因此,人們開始意識到,我們重新發明了計算。

但這究竟意味着什麼?突然之間,我們創造了一個稱爲“智能”的東西,那麼計算髮生了什麼變化呢?

我們從數據中心開始。

數據中心是存儲文件的多租戶場所。而我們正在創建的新型數據中心並不是傳統的數據中心。它們不是多租戶的,往往是單租戶的。它們不存儲任何文件,只是在生成一些東西——它們在生成tokens。

這些tokens被重新組合成看似智能的東西,而這種智能有各種不同的形式,可能是機器人的動作表達,可能是氨基酸的序列,可能是化學鏈,或者各種有趣的東西。

那麼,我們究竟在做什麼?我們創造了一種新工具,一種新的機器,在很多方面,它是“生成式人工智能”這個形容詞的名詞形式。

與其說是生成式人工智能,不如說是一個人工智能工廠。它是一個生成人工智能的工廠,而且我們正在以極大的規模來實現這一點。

人們開始意識到,這可能是一個新行業。它生成tokens,生成數字,但這些數字以相當有價值的方式組成。那麼,哪些行業會從中受益?

然後,你再退一步,問自己英偉達在做什麼。

一方面,我們重新發明了我們所知道的計算,因此有價值數萬億美元的基礎設施需要現代化,這是其中一層。

更大的層面是,我們正在構建的這個工具不僅僅是爲了我們正在現代化的數據中心,而是用於生產一些新的商品。這個新商品行業能有多大?很難說,但可能價值數萬億美元。

所以,如果你退一步看,我們不再製造計算機了,我們在製造工廠。

每個地方都需要它,每個公司都需要它。你能舉出一個公司或行業說“你知道嗎,我們不需要生產智能,我們已經擁有足夠多了”嗎?

所以,我認爲這是一個重大理念,這是一種抽象的產業視角。

有一天,人們會意識到,在很多方面,半導體行業並不是關於製造芯片,而是關於爲社會構建基礎結構。然後,突然之間,大家都會說:“啊,我明白了,這是件大事。”

具身智能

主持人:

您現在如何看待“具身化”?

黃仁勳:

我非常興奮的一點是,在很多方面,我們接近於人工通用智能,但我們也接近於人工通用機器人。token就是token,問題是你能否將其token化。

當然,正如你們所知,token化並不容易。但如果你能夠將事物token化,與大型語言模型和其他模態對齊,假如可以生成一個視頻,內容是我伸手去拿咖啡杯,爲什麼我不能提示機器人生成能夠拿起咖啡杯的token呢?

直覺上,你會認爲對於計算機來說,問題陳述是相當相似的。所以,我認爲我們非常接近了,這令人難以置信的興奮。

現在,有兩個“棕地”(Brownfield)機器人系統——“棕地”意味着你不需要改變環境——即自動駕駛汽車和具身機器人。

通過汽車和人形機器人,我們實際上可以在不改變世界的情況下將機器人帶到世界上,因爲我們已經爲這兩樣東西構建了世界。

也許馬斯克專注於這兩種形式的機器人並非巧合,因爲它們可能具有巨大的潛在規模。

所以,我認爲這是令人興奮的,但其數字版本同樣令人興奮。

我們正在談論的是數字員工或AI員工。毫無疑問,我們將擁有各種各樣的AI員工。未來將擁有生物智能和人工智能,我們以相同的方式去提示(Prompt)它們。

我大多數時候都是提示我的員工,向他們提供背景,要求他們執行任務,他們會去招募其他團隊成員,然後回來,我們來回溝通。這與各種AI員工有何不同呢?

所以,我們將擁有人工智能營銷人員、人工智能芯片設計師、人工智能供應鏈人員等等。

我希望有一天,英偉達在生物智能層面上變得更大,但在人工智能層面上變得大得多。這是我們未來的公司。

主持人:

如果我們一年後再來和您交談,您認爲公司哪個部分最具人工智能化?

黃仁勳:

我希望是芯片設計,這是最重要的部分。因爲它對我們的影響最大,也是我們可以產生最大影響力的地方,這是一個極其困難的問題。

我們與Synopsys和Cadence合作。我完全可以想象他們擁有AI芯片設計師給我租用,他們對特定的模塊有所瞭解,熟練使用特定的工具,我們將根據需要僱傭一大批他們的人工智能設計師,在芯片設計的對應階段幫助我們。

也許我會租用一百萬個Synopsys的工程師來幫助我,然後再租用一百萬個Cadence的工程師來幫助我。對他們來說,這是一個多麼令人興奮的未來,他們擁有所有這些智能體,在他們的工具平臺之上並與其他平臺協作。

你也會在SAP和ServiceNow那裡這樣做。人們說這些SaaS平臺將被顛覆,我實際上認爲相反,他們正坐在金礦上,如Salesforce、SAP等將因專業智能體繁榮發展。

Salesforce有Lightning,SAP有ABAP,每個人都有自己的語言,對嗎?我們有CUDA,還有用於Omniverse的OpenUSD。

誰會創建一個在OpenUSD上非常出色AI智能體?我們會,因爲沒有人比我們更關心它。

因此,我認爲在很多方面,這些平臺將涌現出大量的智能體,我們將把它們彼此引介,它們將協同合作,解決問題。

AI for Science

主持人:

您看到有許多人在人工智能的各個領域工作,您認爲有哪些被低估的領域,或者您希望更多的企業家、工程師或商業人士參與哪些方面的工作?

黃仁勳:

首先,我認爲被誤解和低估的是在水面之下的活動,即在人工智能和機器學習影響下的突破性科學、計算機科學和工程學。

我認爲,你無法走進任何一個科學系、理論數學系,而不看到人工智能和機器學習,以及我們今天所談論的這些工作將如何在明天帶來變革。

如果你把世界上的所有工程師、所有科學家聚在一起,並且你認爲他們今天的工作方式是未來的早期跡象,那麼你將在短時間內看到人工智能的海嘯,機器學習的海嘯,改變我們所做的一切。

請記住,我看到了計算機視覺的早期跡象,看到Alex、Ilya和Hinton的工作(AlexNet),看到Yann LeCun,當然還有斯坦福的吳恩達。

我們很幸運地從貓的視覺推斷出了計算機科學和計算的深刻變革,這樣的推斷對我們來說是幸運的。

現在我們被它所激勵,以至於改變了我們所有的做事方式。

但這花了多長時間?從觀察到那個玩具般的AlexNet,按今天的標準它被認爲是一個玩具,到在物體識別方面達到超越人類的能力,只用了幾年時間。

現在正在發生的是所有科學領域變革的浪潮,沒有一個科學領域被落下。

我想非常明確地說,從量子計算到量子化學,所有科學領域都參與了我們正在討論的(AI協作)方法。

如果我們再給自己兩三年時間,世界將會改變,將不會有一篇論文、一項科學或工程突破,其基礎不是生成式人工智能。我現在非常確定這一點。

對於很多關於這是否是曇花一現的問題,你只需要回到第一原理,觀察實際發生的事情。

計算堆棧,也就是我們進行計算的方式,已經改變。編寫軟件的方式已經改變,這是非常核心的東西。

軟件是人類編碼知識的方式,這是我們編碼算法的方式。我們現在以非常不同的方式編碼它,這將影響一切,其他任何東西都將不同於以往。

所以,我認爲,我是在和已經理解這一點的人交談,我們都看到了同樣的事情。

你們所合作的所有初創公司,我所合作的科學家和工程師,沒有人會被落下。

我們將帶着所有人一起前進。

黃仁勳每天都在用AI

黃仁勳:

我自己每天都在使用AI,我不知道你們怎麼樣,但AI現在是我的導師。

我學習任何東西都會先去找AI。

爲什麼要用困難的方式去學習呢?直接去找AI,直接去找ChatGPT,或者有時我會用Perplexity,這取決於我問題的表述方式,我就從那裡開始學習。然後,如果你願意,你可以深入研究。

但天哪,這真是太棒了。幾乎所有我知道的東西,我都會再三確認。即使對於一個事實,我認爲的基本真理,而且我是專家,我仍然會去找AI,檢查、再檢查。

這太棒了,現在我做幾乎所有的事情都涉及到AI。

One More Thing

最新爆料,根據最近即將出版的張忠謀傳記,2013年左右臺積電曾詢問黃仁勳是否有興趣接任CEO,但老黃拒絕了。

10多年前,英偉達還不是像今天這樣的龐然大物。但剛剛推出Kepler架構GPU系列,新的Tegra系列移動芯片,以及Shield遊戲機,並繼續進軍數據中心。

當時黃仁勳對英偉達未來充滿信心,宣佈在公司現有總部以西建造一個更大的總部。

臺積電不得不選擇Plan B,從內部提拔兩名工程師高管並培養成商人,建立雙領導制,分別擔任董事長和CEO。作爲對比,黃仁勳一直在英偉達同時擔任董事長兼CEO。

現在,黃仁勳對數據中心和人工智能的戰略願景幫助英偉達成爲全球市值最高的公司。