350塊H100取代4萬CPU!臺積電應用英偉達平臺,加速計算掀起半導體制造變革
美東時間10月8日週二在華盛頓舉行的“英偉達AI峰會”期間,英偉達強調了同臺積電在加速計算領域合作的成績:英偉達名爲cuLitho 的計算光刻平臺正在臺積電投入生產,加速計算進一步大幅提升了計算光刻這一芯片製造基石步驟的速度,並降低能耗。
英偉達稱,cuLitho 將加速計算引入計算光刻領域。將 cuLitho 投入生產使臺積電能夠加快下一代芯片技術的開發,而目前的生產流程正接近物理學的極限。臺積電應用cuLitho進行生產可以提高製造下一代先進半導體芯片的速度,並突破物理限制。
計算光刻是電腦芯片製造的關鍵步驟。ASML對它的定義是,利用計算機建模、仿真和數據分析等手段,預測、校正、優化和驗證光刻工藝在一系列圖案、工藝和系統條件下的成像性能。它涉及電磁物理、光化學、計算幾何、迭代優化和分佈式計算這些複雜的計算,是整個半導體設計和製造過程中計算最密集的工作負載。晶圓代工廠通常會專門爲這些計算設立大型數據中心。而現在先進芯片的尺寸越來越小,降至3nm及以下,需要計算光刻更加精準,計算光刻所需的時間也越來越多。沒有更強大的計算光刻很難實現複雜的掩模版設計。計算光刻歷來是將新技術節點和電腦架構推向市場的瓶頸。
去年的英偉達開發者大會GTC上,英偉達發佈了基於GPU構建的cuLitho計算光刻技術軟件庫,被稱爲改變計算光刻領域遊戲規則的軟件。cuLitho的核心是英偉達科學家發明的一組並行算法,計算光刻工藝的所有部分都可以並行運行。原來需要4萬個CPU系統才能完成的工作,現在僅需用500個英偉達DGX H100系統即可完成。使用cuLitho的晶圓廠每天的光掩模產量可增加3-5倍,而耗電量可以比當前配置降低9倍。
本週二英偉達重申了今年GTC大會上披露的成績,每年,先進的代工廠要爲計算光刻耗費數百億小時CPU計算時間,一個芯片掩模組通常可能需要 3000 萬小時或更多的 CPU 計算時間,因此代工廠必須有大型數據中心。而通過加速計算,350 套英偉達H100 Tensor Core GPU 的系統現在就可以取代 4萬套CPU 系統,加快了生產時速度,同時降低了成本、空間要求和功耗。
臺積電CEO魏哲家在今年的英偉達GTC大會上表示,通過與英偉達一同將 GPU 加速計算整合到臺積電的工作流中臺積電大幅提升了性能、增加了吞吐量、縮短了週期時間,並減少了功耗。
英偉達今年的GTC大會披露,自去年推出以來,cuLitho 爲臺積電的創新圖案化技術帶來了新的機遇。在共享工作流上進行的 cuLitho 測試顯示,英偉達和臺積電共同將曲線流程速度和傳統曼哈頓式流程速度分別提升了 45 倍和近 60 倍。這兩種流程的不同點在於曲線流程的光掩模形狀爲曲線,曼哈頓式流程的光掩模形狀被限制爲水平或垂直。
本週二英偉達還提到其開發的生成式 AI 應用算法。事實證明,這種算法提升了cuLitho 平臺的價值。在 cuLitho 加快流程速度的基礎上,新的生成式 AI 工作流將速度又提升了兩倍。應用生成式 AI 可以創建近乎完美的反向光掩模或反向解決方案,解決計算光刻中光的衍射問題,然後再通過傳統的嚴格物理方法推導出最終的光掩模,從而將整個光學鄰近效應校正 (OPC) 流程加快兩倍。
OPC在半導體光刻中的應用已有三十年曆史。英偉達稱,三十年來,很少有像加速計算和AI這兩種技術這樣,爲OPC帶來如此迅速的轉變。這些技術讓物理模擬更精確,並且實現了曾經資源密集型的數學技術。
目前晶圓廠工藝的許多變化都需要對 OPC 進行修改,這增加了計算量,並給晶圓廠的開發週期帶來瓶頸。計算光刻技術的速度大幅提升加快了晶圓廠創建每個掩膜的速度,從而縮短了開發新技術節點的總週期。更重要的是,它讓過去無法實現的新計算成爲可能。
英偉達舉例稱,二十年前科學文獻就提出了逆向光刻技術,但由於計算時間過長,因此在很大程度上無法在全芯片規模上實現準確計算。有了 cuLitho,情況就不再如此。領先的代工廠將用它來提升逆向和曲線解決方案,這將有助於創造下一代強大的半導體。