比英偉達快20倍!哈佛輟學生髮布大模型芯片 屬於AI的“礦機革命”要來了?

《科創板日報》6月27日訊(編輯 朱凌)你還記得加密貨幣的礦機嗎?2013年,專爲比特幣挖礦而設計的ASIC芯片問世,與之前占主導地位的CPU和GPU相比,ASIC的挖礦效率實現了質的飛躍,革命性地改變比特幣挖礦格局。

而近日,一家叫做Etched的硅谷初創公司憑藉其用於AI的ASIC芯片,從最底層的架構層面爲主流AI大模型公司所採用的Transformer計算提供更優性價比的選擇,在AI硬件領域掀起了波瀾。

Etched由哈佛輟學生Gavin Uberti和Chris Zhu於2022 年創立,他們開發了一款名爲Sohu的專爲Transformer模型設計ASIC芯片。

Etched聲稱,Sohu芯片推理Llama-3 70B的速度比英偉達的H100快20倍,而功耗卻大大降低。

Etched剛剛獲得了1.2億美元的新融資,由 Primary Venture Partners 和 Positive Sum Ventures 領投,Peter Thiel、Github首席執行官Thomas Dohmke和前Coinbase首席技術官Balaji Srinivasan等知名投資者也參與了本輪融資。

隨着Transformer模型不斷推動生成式AI突破,Sohu芯片被認爲有望在AI推理側打破英偉達GPU一家獨大的格局,重塑AI計算的格局。

專用於Transformer

GPU中包含多種運算單元,如FP64、FP32、INT、TensorCore等結構。處理任意CUDA代碼需要複雜的編譯器,芯片開發商往往需要在軟件開發上投入了超過數十億美元的成本,但成效有限。

而Etched則縮小了焦點。通過專用於運行Transformers,Etched可以簡化軟件開發,並側重TensorCore,針對性地提升AI運算能力。

由於大多數AI公司使用特定的Transformer推理庫,如TensorRT-LLM、vLLM或HuggingFace的TGI,這些框架足以滿足大多數需求。

而文本、圖像或視頻等不同應用中的Transformer模型基本相似,這使得客戶可以在不改變核心模型代碼的情況下調整模型超參數。

頂尖AI公司通常需要定製解決方案,聘請工程師對GPU內核進行精心優化。而Etched通過開放從驅動程序到內核的整個軟件棧,消除逆向工程的需要。這種開放性允許工程師根據需要實施定製Transformer層,提高了靈活性。

此外,Sohu芯片減少了用於存儲器的空間,而將更多空間用於計算用途的晶體管,並通過只有一個大內核的設計,減少了用來協調不同內核的低效計算。

不過,如果迅速出現替代Transformer的新算法,則Sohu芯片將失去價值。“我們正在人工智能領域下最大的賭注,”Gavin Uberti在接受採訪時說。”如果Transformer消失了,我們就會死。但如果它們繼續存在,我們就是有史以來最大的公司。”

ASIC競爭格局開放

事實上,大型雲廠商也在通過自研或代研ASIC加入AI軍備競賽。當下,海外ASIC設計巨頭的財報已然出現了一些積極的變化。根據博通2024財年一季報,該季度,公司網絡業務收入爲33億美元,同比增長46%,主要得益於2家超大規模客戶對定製人工智能加速器的強勁需求。

博通預計AI佔2024財年半導體收入的25%,現上調指引至35%,超過100億美元,其中70%是AI加速器。

近日就有消息稱,字節跳動正與博通合作開發一款5納米用於AI的ASIC芯片,並由臺積電生產,但字節跳動否認了該消息。

國盛證券在3月20日的研報中指出,從全局來看,ASIC放量與對應的算力降本,是大模型走向一個更大產業的必經之路,但AI的算力敘事足夠宏大,與比特幣的一輪代替便成終局不同,我們認爲在AI芯片的發展上,將會經歷多輪螺旋上升式的發展,最終達到全社會的AGI,新的模型與算法通過通用性GPU被發現和初步開發,通過專用ASIC將需求繁榮,繁榮的生態吸引更多用戶與參與者,最終培育出新的、更強的算法,循環往復,螺旋上升,最終達成AGI的宏偉目標。

國盛證券建議關注一線晶圓廠、ASIC設計龍頭、散熱廠商、ASIC芯片公司、服務器。其中,對於ASIC芯片公司,推薦寒武紀、芯原股份、嘉楠科技。