半導體彎道上如何超車?陸缺最先進晶片照樣開發尖端人工智慧

中國科技公司正在加快研究,尋求在不依賴最先進晶片的情況下開發尖端AI技術,而且已經獲得了相當的成果。(圖/Shutterstock)

美國對中國的半導體限制措施似乎未能抑制大陸科技公司參與尖端人工智慧(AI)研發,據研究人員分析,中國科技公司正在加快研究,尋求在不依賴最先進晶片的情況下開發尖端AI。其中有些相關實驗已經看到了前景,或許能讓中國科技界克服美國半導體制裁帶來的困境。

《華爾街日報》報導說,目前華爲、百度、阿里巴巴等多家公司都在設法更有效利用現有電腦設備上的晶片。雖然利用這些變通方法來追趕美國頂尖AI公司仍是一個重大挑戰,但是有些實驗已讓他們看到了前景。

目前類似ChatGPT模型商業化的競賽日益升溫,全球各地的公司都急需更強大的晶片,並在想方設法更有效地利用晶片的運算能力,以壓低激增的AI開發成本。行業分析師表示,關鍵在於美國的制裁已令陸企難以獲取英偉達(Nvidia)等公司製造的最先進製程晶片,而且爲了打造類似ChatGPT的產品,這些中國公司正在迅速消耗現有的美國晶片庫存。

報導說,幾年下來,美國的半導體限制政策導致大陸企業無法獲得最先進晶片,例如AI開發行業最受歡迎的英偉達A100晶片,以及今年3月份發佈的新一代版本H100,後者可以提供更強大運算能力。英偉達爲了晶片限制規定,特意設計了降級版晶片專供中國市場,分別爲A800和H800。這2種修改後的晶片都降低了晶片之間通信的能力。

這些產品爲開發小型AI模型提供了有效的替代方案,例如字節跳動旗下短視頻應用TikTok進行推薦的算法,但這種障礙會扼殺較大型AI模型開發。

美國祭出對華晶片制裁一個月後,OpenAI發佈ChatGPT,在全球引發了一波生成式AI的開發熱潮。瑞銀分析師估計,訓練這種大型AI模型需要5000至10000塊A100晶片。

一位出席AI行業會議的人士透露,一家與中國政府有關聯的半導體行業協會發布的調查報告顯示,發現中國大約有4萬至5萬枚A100晶片可用於訓練大型AI模型在美國頒佈制裁令之前儲備了A100的阿里巴巴和百度等中國公司,已在內部嚴格限制使用庫存的先進製程晶片,將它們留給計算最密集的任務使用。

據開源研究論文和知情人士的說法,百度近年來一直在尋求將國產晶片納入其AI開發,然而,許多國產晶片對於訓練大模型來說仍然不可靠,因爲它們非常容易崩潰。

新加坡國立大學教授尤洋表示,許多中國公司現在正在研究組合3、4枚性能相對較差的晶片來替代英偉達最先進的處理器。但這種組合低性能晶片的成本很高,如果一家美國公司需要1000個H100晶片來訓練一個大語言模型,那麼一家中國公司可能需要至少3000個H800晶片才能實現同樣的結果。

尤洋說,這正促使一些公司加速開發技術,使用不同類型的晶片來訓練大規模AI模型。此前這一研究領域在硬體資源有限、渴望降低成本的中國公司中已經很普遍。

與此同時,中國公司也正在研究使用各種軟件技術來降低訓練大規模AI模型的計算強度,這種方法已在全球範圍內加速推廣。雖然其中許多方法在全球研究界仍處於不斷完善的過程中,但中國研究人員已取得了一些成果。