英特爾突襲英偉達H100,新AI芯片訓練快40%,推理快50%

英特爾,開始正面硬剛英偉達了。

就在深夜,英特爾CEO帕特·基辛格手舞足蹈地亮出了最新AI芯片——Gaudi 3:

他爲什麼開心到現場直接蹦迪?

看下Gaudi 3的性能結果,就一目瞭然了:

不僅如此,雖然基辛格沒有在現場給出直接的數據,但他還表示:

如此直面對標英偉達,到底效果如何,我們繼續往下看。

英特爾表示,Gaudi 3已經在Llama上做了測試,可以有效地訓練或部署AI大模型,包括文生圖的Stable Diffusion和語音識別的Whisper等等。

在現場,基辛格也展示了集成最新英特爾芯片的AI PC,能夠快速處理的多項任務,例如快速處理郵件:

再如語音處理:

以及圖像渲染:

英特爾演示操作的同事還非常調皮地展示了用AI PC生成的卡通版基辛格:

據瞭解,Gaudi 3採用5納米工藝製造,與歷代Gaudi其它性能上的具體對比,如下表所示:

英特爾表示,Gaudi 3芯片將在今年的第三季度向客戶大規模提供,包括戴爾、惠普和超微電腦在內的公司將使用該芯片。

至於具體的價格,目前英特爾方面還並未透露。

不過更令人意外的是,Gaudi 3還只是在這次英特爾Vision活動中發佈的產品之一。

沒錯,去年年底英特爾剛剛上市第五代Xeon,僅時隔數個月,第六代Xeon又來了!

(英特爾這次還真沒有擠牙膏)

在現場,基辛格還親切地叫它“little baby”:

第六代Xeon包含兩種架構,分別是Sierra Forest和Granite Rapids。

Sierra Forest基於英特爾更小、低功耗的E-cores,而Granite Rapids則由更大但性能更高的P-cores 組成。

基辛格在現場稱二者像雙胞胎:

更具體而言,Sierra Forest架構的英特爾Xeon 6處理器,其機架密度提高2.7倍。

客戶能以近3:1的比例替換舊系統,大幅降低能耗,幫助其實現可持續發展目標。

而Sierra Forest架構的英特爾Xeon 6處理器包含了對MXFP4數據格式的軟件支持。

與使用FP16的第四代Xeon處理器相比,可將下一個token的延遲時間最多縮短6.5倍,能夠運行700億參數的Llama-2模型。

至於英特爾Xeon 6處理大模型的速度到底有多快,基辛格做了更加直接的對比。

他將第四代、第五代和最新的第六代Xeon放到了一起,來了一個現場速度的大比拼。

從直觀的生成速度來看,第六代Xeon明顯要比“前任們”快上許多。

具體到精確的延時數值,第六代Xeon運行Llama 2 70B只有82ms。

同等條件下,第六代Xeon與“前任們”的延時數值對比如下:

據瞭解,Sierra Forest架構的第六代Xeon處理器將於今年第二季度推出。

這場硬剛英偉達的發佈會,同樣也激起了不少網友們的熱議。

例如Gaudi 3封裝的一處細節,即使用HBM2e存儲芯片,有網友對此表示驚訝:

而最先進的HBM3e英特爾原本也計劃採用,但很可能因爲供應不足,這次沒能搶到足夠的訂單。

對此,這位網友進一步表示:

實際上,製造優勢也是英特爾在半導體領域的關鍵優勢之一,作爲半導體產業的開創者之一,英特爾幾乎擁有芯片產業的所有資源和要素能力。

但何時能夠和英偉達全面一較高下?這也是不少網友關注的問題:

或許答案只有交給時間來回答。

但無論如何,英特爾此次的發佈,確實是給AIGC時代的算力,多提供了一項“快好省”的選擇。

參考鏈接:[1]https://www.anandtech.com/show/21342/intel-introduces-gaudi-3-accelerator-going-bigger-and-aiming-higher[2]https://www.servethehome.com/intel-vision-2024-keynote-live-coverage/[3]https://news.ycombinator.com/item?id=39981032