輝達塞爆臺積3、4奈米

AI年度盛事輝達GTC(GPU Technology Conference)大會於美西時間3月17日登場。圖/美聯社

輝達GPU設計藍圖

AI年度盛事輝達GTC(GPU Technology Conference)大會於美西時間3月17日登場,市場估H200及B100將提前發表搶市。據瞭解,H200及次世代B100將分別採臺積電4奈米及3奈米制程,H200將於第二季上市,B100採Chiplet設計架構傳已下單投片。法人指出輝達訂單強強滾,臺積電3、4奈米產能幾近滿載,首季營運淡季不淡。

針對輝達新世代晶片訂單塞爆臺積電先進製程一事,臺積電表示,產能製程仍依照上次法說會所述內容,不再做說明。

輝達日前強調,生成式AI及大型語言模型計算非常密集,需要多個GPU組成,然從客戶購買到推論模型上線,需要幾個季度的時間;換言之,今年看到的推論應用,是來自去年購買的GPU,意味着隨着模型參數成長,GPU需求勢必延續跟着擴大。

除GPU數量增加外,輝達GPU效率也將在今年大幅提升,Blackwell系列的B100就是被市場視爲下一世代輝達GPU利器,除了是首款採臺積電3奈米打造外,更是第一款以Chiplet及CoWoS-L形式封裝的輝達產品,解決高耗電量與散熱問題,單卡效率及電晶體密度,預估又將超車AMD首季推出的MI300系列。

半導體業者指出,臺積電2023年即提前因應產能吃緊的現象,尤其針對先進封裝CoWoS產能,除移機挪出龍潭廠空間外,竹南AP6也如火如荼啓用;據供應鏈透露,原本今年下半年動工之銅鑼廠,已規劃提早於第二季進行,目標就是力拚2027年上半年,能夠提供月產11萬片12吋晶圓的3D Fabric量能。

臺積電先進製程也持續滿載,臺積電2月產能利用率持續超過9成,AI需求不減。供應鏈表示,AI、HPC等應用一片晶圓能產出之晶片僅爲消費性產品的四分之一,生產製造難度更高、更復雜;臺積電能達到穩定量產,對晶片業者來說,非常重要。

此外,在H200轉向新記憶體HBM,也將面臨產能限制。H200到B100積極與雲端服務供應商(CSP)進行新平臺銜接,輝達強調,數據中心功率密度是關鍵,多數CSP提前2~3年確保數據中心容量,必須提前規劃。

除CSP業者外,較小型的語言模型開發商,因無法負擔ASIC開案費用,多數將使用輝達解決方案,積少成多下,也將成訂單主力,臺積電目前HPC/AI應用平臺佔營收比重達43%,已與智慧型手機齊平。(相關新聞見A3)