☰

AI晶片不止NVIDIA 科技巨頭與新創期望迎頭趕上

林宗輝╱北美智權報　編輯部

AI之所以能夠如此盛行，背後有幾個重要原因。首先，機器學習與深度學習演算法的重大進步，讓AI系統能夠從大量資料中自主學習、提煉出有價值的見解。這些算法的突破，例如卷積神經網路(CNN)在影像識別方面的卓越表現，大幅提升了AI的感知和理解能力。其次，網際網路時代累積的大量資料，爲AI提供了豐富的"養分"。

據估計，全球每天產生的數據量高達2.5艾位元組(EB)，這爲AI模型的訓練提供了龐大的資料基礎。再者，運算能力的持續提升，尤其是GPU的廣泛應用，讓複雜的AI模型得以訓練與執行。

以Nvidia的H100 GPU爲例，其單精度浮點運算能力高達14 TFLOPS，是前代A100的3倍之多。最後，AI在各行各業的應用情境不斷擴展，從智慧製造、自動駕駛到醫療診斷等，AI正在創造巨大的商業價值。據麥肯錫全球研究院估計，到2030年，AI可爲全球經濟貢獻13兆美元的產出。

然而傳統的晶片架構已經難以滿足AI運算的特殊需求。與傳統的程式設計模式不同，AI模型通常需要大量的平行運算和資料傳輸。這就催生了一系列專爲AI設計的晶片，例如Nvidia的GPU、Google的TPU等。

這些AI晶片在矩陣運算、記憶體頻寬等方面進行了最佳化，大幅提升了AI運算的速度和效率。以Google的TPU爲例，其第一代產品就實現了在機器學習推論任務上，比現有的GPU和CPU快15到30倍。隨着AI應用的爆發，AI晶片市場也迎來了爆發式成長。

目前，Nvidia憑藉在GPU領域的多年積累，在AI晶片市場佔據領先地位。Nvidia的GPU不僅爲AI模型訓練提供了強大的運算能力，也爲AI開發者提供了完整的軟體工具與生態系統，例如CUDA平臺和cuDNN函式庫。而Nvidia最新推出的GH200超級晶片，單精度浮點運算能力高達150 TFLOPS，更將進一步鞏固其在AI晶片領域的優勢。據Nvidia預估，到2024年，其資料中心業務每季收入有望突破150億美元，AI晶片功不可沒。

AI晶片的競爭格局

不過，Nvidia並非AI晶片市場的唯一玩家。科技巨頭們紛紛意識到AI晶片的戰略價值，開始投入巨資研發自己的AI晶片。亞馬遜發表了名爲Inferentia的AI推論晶片，單晶片可提供每秒128兆次的推論能力(TOPS)，並支援多種機器學習框架。谷歌也推出了TPUv4，其單晶片峰值運算量高達200 TFLOPS，並透過封裝技術，將多達4096個TPU晶片整合爲一個EXA POD系統。臉書則發表了名爲HANABI的AI訓練ASIC晶片，號稱是「世界上最快的AI訓練晶片」。微軟也正在打造自己的AI超級電腦，其中就包含了自行研發的AI晶片。此外，中國手機大廠華爲，也推出自家的Ascend系列AI晶片，由於技術不成熟，且製程受限，目前主打賣點與Nvidia的A100性能相當，但性能不是最大賣點，而是該晶片是中國國產，可避開歐美的制裁手段。

傳統晶片廠商也不甘示弱。英特爾收購了AI晶片新創Habana Labs，並推出了號稱效能領先的Ponte Vecchio GPU，單GPU理論峰值高達600 TFLOPS。超微半導體則發佈了Instinct系列GPU，MI300X的矩陣運算能力高達380 TFLOPS，此前斥資350億美元收購賽靈思(Xilinx)，也是意在強化AI與邊緣運算領域的佈局。

除科技巨頭和傳統晶片廠商，一批AI晶片的新創公司也正在異軍突起。例如英國的Graphcore主打IPU(Intelligence Processing Unit)，其二代產品GC200的峰值運算能力高達250 TFLOPS，獲得了超過4.5億美元的融資。美國新創Cerebras Systems則打造了有史以來最大的晶片——晶片級水冷系統WSE(Wafer Scale Engine)，搭載了1.2兆個電晶體，讓AI運算達到了前所未有的規模。Groq則由前Google工程師創立，專注於打造專用於推論的低功耗TPU，在ResNet-50基準測試中，其峰值推論能力高達21700 IPS/瓦。

隨着各路玩家競相投入，AI晶片市場呈現百家爭鳴之勢。據統計，2019年全球AI晶片初創公司數量已超過80家，總融資額超過35億美元。根據研究機構預估，到2025年，ASIC晶片將在AI晶片市場中佔據43%的比重，GPU佔29%，FPGA佔19%，CPU佔9%。

AI晶片的未來發展

展望未來，AI晶片的創新仍在持續。除了運算能力的提升，AI晶片在架構、功耗、整合度等方面還有很大的最佳化空間。例如，通過先進的封裝技術，多個AI晶片可緊密整合，大幅提升系統頻寬和能效。AI專用的記憶體技術，如高頻寬記憶體(HBM)、壓縮記憶體等，也將得到更廣泛的應用。

同時，隨着5G和物聯網的發展，AI晶片在邊緣運算領域的應用前景十分廣闊。例如自動駕駛汽車、智慧城市等情境，都需要在終端裝置上進行即時的AI推論。爲此，各家廠商紛紛推出了專用於邊緣推論的AI晶片，如Nvidia的Jetson系列、Intel的Movidius、Google的Edge TPU等。這些終端AI晶片往往採用極低功耗設計，可嵌入各類終端裝置，實現前所未有的智慧化應用。

除了技術創新，AI晶片的生態系統建設也至關重要。Nvidia的CUDA平臺經過多年發展，已經形成了龐大的開發者社羣和豐富的軟體資源，這是其競爭力的重要保證。以CUDA平臺爲例，其生態系統涵蓋了1400餘個GPU加速應用，500多個高校和研究機構，以及逾20萬名開發者。

其他廠商也紛紛效仿，圍繞自己的AI晶片建構生態系統，爭取開發者的支持。Google推出了基於TPU的TensorFlow深度學習框架，並開源了相關程式碼；AMD收購了開源機器學習平臺Xilinx；Intel推出了OneAPI開發工具套件，試圖統一CPU、GPU和AI加速器的程式開發介面。未來，AI晶片市場很可能呈現"羣雄逐鹿"的局面，不同的晶片在性能、功耗、成本等方面各有擅長，滿足不同的應用需求。

結論:

AI晶片競賽正如火如荼地展開，Nvidia憑藉先發與生態優勢暫時領先，但科技巨頭、傳統晶片廠商、新創公司構成了AI晶片的多元競爭格局。AI晶片的創新與生態系統建設，將很大程度上決定未來AI產業的發展方向。對於半導體公司來說，AI浪潮既是巨大的市場機會，也是不小的挑戰。

MIT Techreview 中文版研究經理

財訊雙週刊撰述委員

美國波士頓Arthur wood 投資顧問公司分析師

※如欲轉載本文，請與北美智權報聯絡

AI晶片不止NVIDIA 科技巨頭與新創期望迎頭趕上

相關資訊