AI晶片不止NVIDIA 科技巨頭與新創期望迎頭趕上

林宗輝╱北美智權報 編輯部

AI之所以能夠如此盛行,背後有幾個重要原因。首先,機器學習與深度學習演算法的重大進步,讓AI系統能夠從大量資料中自主學習、提煉出有價值的見解。這些算法的突破,例如卷積神經網路(CNN)在影像識別方面的卓越表現,大幅提升了AI的感知和理解能力。其次,網際網路時代累積的大量資料,爲AI提供了豐富的"養分"。

據估計,全球每天產生的數據量高達2.5艾位元組(EB),這爲AI模型的訓練提供了龐大的資料基礎。再者,運算能力的持續提升,尤其是GPU的廣泛應用,讓複雜的AI模型得以訓練與執行。

以Nvidia的H100 GPU爲例,其單精度浮點運算能力高達14 TFLOPS,是前代A100的3倍之多。最後,AI在各行各業的應用情境不斷擴展,從智慧製造、自動駕駛到醫療診斷等,AI正在創造巨大的商業價值。據麥肯錫全球研究院估計,到2030年,AI可爲全球經濟貢獻13兆美元的產出。

然而傳統的晶片架構已經難以滿足AI運算的特殊需求。與傳統的程式設計模式不同,AI模型通常需要大量的平行運算和資料傳輸。這就催生了一系列專爲AI設計的晶片,例如Nvidia的GPU、Google的TPU等。

這些AI晶片在矩陣運算、記憶體頻寬等方面進行了最佳化,大幅提升了AI運算的速度和效率。以Google的TPU爲例,其第一代產品就實現了在機器學習推論任務上,比現有的GPU和CPU快15到30倍。隨着AI應用的爆發,AI晶片市場也迎來了爆發式成長。

目前,Nvidia憑藉在GPU領域的多年積累,在AI晶片市場佔據領先地位。Nvidia的GPU不僅爲AI模型訓練提供了強大的運算能力,也爲AI開發者提供了完整的軟體工具與生態系統,例如CUDA平臺和cuDNN函式庫。而Nvidia最新推出的GH200超級晶片,單精度浮點運算能力高達150 TFLOPS,更將進一步鞏固其在AI晶片領域的優勢。據Nvidia預估,到2024年,其資料中心業務每季收入有望突破150億美元,AI晶片功不可沒。

AI晶片的競爭格局

不過,Nvidia並非AI晶片市場的唯一玩家。科技巨頭們紛紛意識到AI晶片的戰略價值,開始投入巨資研發自己的AI晶片。亞馬遜發表了名爲Inferentia的AI推論晶片,單晶片可提供每秒128兆次的推論能力(TOPS),並支援多種機器學習框架。谷歌也推出了TPUv4,其單晶片峰值運算量高達200 TFLOPS,並透過封裝技術,將多達4096個TPU晶片整合爲一個EXA POD系統。臉書則發表了名爲HANABI的AI訓練ASIC晶片,號稱是「世界上最快的AI訓練晶片」。微軟也正在打造自己的AI超級電腦,其中就包含了自行研發的AI晶片。此外,中國手機大廠華爲,也推出自家的Ascend系列AI晶片,由於技術不成熟,且製程受限,目前主打賣點與Nvidia的A100性能相當,但性能不是最大賣點,而是該晶片是中國國產,可避開歐美的制裁手段。

傳統晶片廠商也不甘示弱。英特爾收購了AI晶片新創Habana Labs,並推出了號稱效能領先的Ponte Vecchio GPU,單GPU理論峰值高達600 TFLOPS。超微半導體則發佈了Instinct系列GPU,MI300X的矩陣運算能力高達380 TFLOPS,此前斥資350億美元收購賽靈思(Xilinx),也是意在強化AI與邊緣運算領域的佈局。

除科技巨頭和傳統晶片廠商,一批AI晶片的新創公司也正在異軍突起。例如英國的Graphcore主打IPU(Intelligence Processing Unit),其二代產品GC200的峰值運算能力高達250 TFLOPS,獲得了超過4.5億美元的融資。美國新創Cerebras Systems則打造了有史以來最大的晶片——晶片級水冷系統WSE(Wafer Scale Engine),搭載了1.2兆個電晶體,讓AI運算達到了前所未有的規模。Groq則由前Google工程師創立,專注於打造專用於推論的低功耗TPU,在ResNet-50基準測試中,其峰值推論能力高達21700 IPS/瓦。

隨着各路玩家競相投入,AI晶片市場呈現百家爭鳴之勢。據統計,2019年全球AI晶片初創公司數量已超過80家,總融資額超過35億美元。根據研究機構預估,到2025年,ASIC晶片將在AI晶片市場中佔據43%的比重,GPU佔29%,FPGA佔19%,CPU佔9%。

AI晶片的未來發展

展望未來,AI晶片的創新仍在持續。除了運算能力的提升,AI晶片在架構、功耗、整合度等方面還有很大的最佳化空間。例如,通過先進的封裝技術,多個AI晶片可緊密整合,大幅提升系統頻寬和能效。AI專用的記憶體技術,如高頻寬記憶體(HBM)、壓縮記憶體等,也將得到更廣泛的應用。

同時,隨着5G和物聯網的發展,AI晶片在邊緣運算領域的應用前景十分廣闊。例如自動駕駛汽車、智慧城市等情境,都需要在終端裝置上進行即時的AI推論。爲此,各家廠商紛紛推出了專用於邊緣推論的AI晶片,如Nvidia的Jetson系列、Intel的Movidius、Google的Edge TPU等。這些終端AI晶片往往採用極低功耗設計,可嵌入各類終端裝置,實現前所未有的智慧化應用。

除了技術創新,AI晶片的生態系統建設也至關重要。Nvidia的CUDA平臺經過多年發展,已經形成了龐大的開發者社羣和豐富的軟體資源,這是其競爭力的重要保證。以CUDA平臺爲例,其生態系統涵蓋了1400餘個GPU加速應用,500多個高校和研究機構,以及逾20萬名開發者。

其他廠商也紛紛效仿,圍繞自己的AI晶片建構生態系統,爭取開發者的支持。Google推出了基於TPU的TensorFlow深度學習框架,並開源了相關程式碼;AMD收購了開源機器學習平臺Xilinx;Intel推出了OneAPI開發工具套件,試圖統一CPU、GPU和AI加速器的程式開發介面。未來,AI晶片市場很可能呈現"羣雄逐鹿"的局面,不同的晶片在性能、功耗、成本等方面各有擅長,滿足不同的應用需求。

結論:

AI晶片競賽正如火如荼地展開,Nvidia憑藉先發與生態優勢暫時領先,但科技巨頭、傳統晶片廠商、新創公司構成了AI晶片的多元競爭格局。AI晶片的創新與生態系統建設,將很大程度上決定未來AI產業的發展方向。對於半導體公司來說,AI浪潮既是巨大的市場機會,也是不小的挑戰。

MIT Techreview 中文版研究經理

財訊雙週刊撰述委員

美國波士頓Arthur wood 投資顧問公司分析師

※如欲轉載本文,請與北美智權報聯絡

延伸閱讀&電子報訂閱連結:

【更多內容請見《北美智權報》353期;歡迎訂閱《北美智權報》電子報】