☰

英特爾突襲英偉達H100，新AI芯片訓練快40%，推理快50%

英特爾，開始正面硬剛英偉達了。

就在深夜，英特爾CEO帕特·基辛格手舞足蹈地亮出了最新AI芯片——Gaudi 3：

他爲什麼開心到現場直接蹦迪？

看下Gaudi 3的性能結果，就一目瞭然了：

不僅如此，雖然基辛格沒有在現場給出直接的數據，但他還表示：

如此直面對標英偉達，到底效果如何，我們繼續往下看。

英特爾表示，Gaudi 3已經在Llama上做了測試，可以有效地訓練或部署AI大模型，包括文生圖的Stable Diffusion和語音識別的Whisper等等。

在現場，基辛格也展示了集成最新英特爾芯片的AI PC，能夠快速處理的多項任務，例如快速處理郵件：

再如語音處理：

以及圖像渲染：

英特爾演示操作的同事還非常調皮地展示了用AI PC生成的卡通版基辛格：

據瞭解，Gaudi 3採用5納米工藝製造，與歷代Gaudi其它性能上的具體對比，如下表所示：

英特爾表示，Gaudi 3芯片將在今年的第三季度向客戶大規模提供，包括戴爾、惠普和超微電腦在內的公司將使用該芯片。

至於具體的價格，目前英特爾方面還並未透露。

不過更令人意外的是，Gaudi 3還只是在這次英特爾Vision活動中發佈的產品之一。

沒錯，去年年底英特爾剛剛上市第五代Xeon，僅時隔數個月，第六代Xeon又來了！

（英特爾這次還真沒有擠牙膏）

在現場，基辛格還親切地叫它“little baby”：

第六代Xeon包含兩種架構，分別是Sierra Forest和Granite Rapids。

Sierra Forest基於英特爾更小、低功耗的E-cores，而Granite Rapids則由更大但性能更高的P-cores 組成。

基辛格在現場稱二者像雙胞胎：

更具體而言，Sierra Forest架構的英特爾Xeon 6處理器，其機架密度提高2.7倍。

客戶能以近3:1的比例替換舊系統，大幅降低能耗，幫助其實現可持續發展目標。

而Sierra Forest架構的英特爾Xeon 6處理器包含了對MXFP4數據格式的軟件支持。

與使用FP16的第四代Xeon處理器相比，可將下一個token的延遲時間最多縮短6.5倍，能夠運行700億參數的Llama-2模型。

至於英特爾Xeon 6處理大模型的速度到底有多快，基辛格做了更加直接的對比。

他將第四代、第五代和最新的第六代Xeon放到了一起，來了一個現場速度的大比拼。

從直觀的生成速度來看，第六代Xeon明顯要比“前任們”快上許多。

具體到精確的延時數值，第六代Xeon運行Llama 2 70B只有82ms。

同等條件下，第六代Xeon與“前任們”的延時數值對比如下：

據瞭解，Sierra Forest架構的第六代Xeon處理器將於今年第二季度推出。

這場硬剛英偉達的發佈會，同樣也激起了不少網友們的熱議。

例如Gaudi 3封裝的一處細節，即使用HBM2e存儲芯片，有網友對此表示驚訝：

而最先進的HBM3e英特爾原本也計劃採用，但很可能因爲供應不足，這次沒能搶到足夠的訂單。

對此，這位網友進一步表示：

實際上，製造優勢也是英特爾在半導體領域的關鍵優勢之一，作爲半導體產業的開創者之一，英特爾幾乎擁有芯片產業的所有資源和要素能力。

但何時能夠和英偉達全面一較高下？這也是不少網友關注的問題：

或許答案只有交給時間來回答。

但無論如何，英特爾此次的發佈，確實是給AIGC時代的算力，多提供了一項“快好省”的選擇。

參考鏈接：[1]https://www.anandtech.com/show/21342/intel-introduces-gaudi-3-accelerator-going-bigger-and-aiming-higher[2]https://www.servethehome.com/intel-vision-2024-keynote-live-coverage/[3]https://news.ycombinator.com/item?id=39981032

英特爾突襲英偉達H100，新AI芯片訓練快40%，推理快50%

相關資訊