服務器競賽升溫,CPU芯片賽道迎來熱錢

​在數字化浪潮的推動下,服務器市場持續蓬勃發展,各大廠商紛紛加大投入,力求在這場激烈的競爭中佔據一席之地。

服務器市場,強勁增長

AI的到來,引爆了服務器市場。

TechInsights最新數據顯示,到2028年,服務器市場規模將達到2730億美元,年複合增長率爲18%。要知道,在2022年,全球服務器市場規模爲1215.8億美元,這一數值在當下時點已不容小覷,然而這僅僅是2028年的一半。

到2028年,專爲AI應用設計的服務器將佔市場份額的59%,複合年增長率爲49%。

再看中國市場。

中國正成爲全球最主要的服務器增長市場。2021年中國服務器市場規模達到250.9億美元;2022年中國服務器市場規模爲273.4億美元。

根據IDC、浪潮信息、清華大學全球產業研究院聯合編制的《2022—2023全球計算力指數評估報告》顯示,2022年,中國整體服務器市場規模保持6.9%的正增長,佔全球市場比重達25%,2017年至2022年的複合增長率達48.8%。

AI服務器方面,IDC預計2023年中國AI服務器市場規模將達到91億美元,同比增長82.5%;2027年將達到134億美元,年均複合增長率爲21.8%。

在服務器市場持續繁榮的當下,CPU的地位愈發凸顯。CPU作爲其核心部件,其性能和功耗直接影響着服務器的整體表現,也因此成爲市場關注的焦點。

服務器CPU架構之爭

與GPU不同,CPU主要完成的是通用計算和邏輯控制的工作,打個比方,如果GPU是一個高效的執行者,那麼CPU可以看做一個能力全面的調度者。

CPU作爲計算機系統運算和控制的核心,是信息處理、程序運行的最終執行單元。

目前CPU行業主要由三大生態體系主導:

一是基於x86指令系統和Windows操作系統的Wintel體系,主要用於服務器與電腦等;在Wintel體系中,CPU廠商生產芯片,操作系統廠商提供操作系統。

二是基於Arm指令系統和Android操作系統的AA體系,主要用於低功耗和高度節能的應用,例如雲計算服務器和邊緣計算設備。在AA體系中,CPU廠商對芯片或系統廠商進行指令系統或IP核授權,操作系統廠商提供基礎版操作系統,由整機廠商定製專用芯片和發行版操作系統。

在算力多元化的新時代,儘管x86架構依然佔據着服務器CPU市場超九成的份額,穩坐行業巨頭之位,但競爭從未停止。

近年來,ARM也正加速進入服務器領域,這一表現在中國市場尤爲明顯。按照Gartner的數據,2023年一季度全球Arm服務器出貨量佔比是7%,如果以全球出貨量330.5萬臺來估算,那麼Arm服務器出貨量大約在23.135萬臺左右,其中約40%即9.254萬臺是出口到了中國市場,在中國服務器市場整體出貨量達89.7萬臺的背景下,佔到了10.32%。

除了我們熟知的x86和Arm,RISC-V這一新興架構正以其開放、靈活的特性,爲服務器芯片提供更加廣闊的發展機遇。RISC-V以其模塊化、可擴展的設計,允許開發者根據具體需求定製指令集,從而打造出高效、節能且高度適配特定應用場景的服務器芯片。

一起看看不同賽道的競爭格局。

服務器CPU芯片,激戰打響

x86架構

首先看x86架構。基於x86架構的服務器CPU市場中的主要玩家有英特爾、AMD以及中國大陸的海光、兆芯等。

AMD在最近幾年的表現極爲強勁。根據MercuryResearch最新發布的x86處理器市場份額數據顯示,2024年第一季度AMD在服務器、桌面和移動端均獲得了更高的市場份額,分別達23.6%、23.9%、19.3%。

值得注意的是,在2021年第一季度AMD服務器市場份額只有8.9%。

英特爾是x86服務器CPU領域毫無爭議的霸主,不過,即便是有着多年深厚積累的英特爾,也不得不面對來自AMD的市場侵蝕。

國產廠商海光主攻服務器芯片,而兆芯則個人PC、服務器都有涉及。

海光信息是國產高端CPU的領軍者。海光CPU主要面向複雜邏輯計算、多任務調度等通用處理器應用場景需求,兼容國際主流x86處理器架構和技術路線。海光CPU已經有海光一號、海光二號、海光三號實現商業化,公司目前在售的海光CPU產品主要爲海光三號。

從應用場景角度看,公司將海光CPU產品分爲7000、5000和3000三個系列,不同系列具有不同的性能。7000系列主要應用於高端服務器,主要面向數據中心、雲計算等複雜應用領域。5000系列主要面向政務、企業和教育領域的信息化建設中的中低端服務器需求。3000系列主要應用於工作站和邊緣計算服務器,面向入門級計算領域。其中7000系列CPU是海光收入的主要構成。

兆芯也是x86服務器CPU市場的參與者,目前兆芯已經形成了開先系列桌面處理器和開勝系列服務器處理器兩大產品線。服務器處理器的產品系列有開勝KH-40000系列處理器、開勝KH-30000系列處理器、開勝KH-20000系列處理器、開勝ZX-C+FC-1080/1081系列處理器。

開勝 KH-40000系列服務器處理器,採用"永豐"自主內核微架構,支持自主互連技術ZPI3.0,單顆處理器集成最高32核心,具備64MB高速緩存,支持8通道DDR4內存,適用於雲計算、大數據分析、視頻處理、數據庫備份、高性能存儲,以及超融合一體機等解決方案的搭建和部署。

基於x86架構和生態優勢,兆芯在黨政和商用領域應用廣泛,尤其在PC產業上使用Wintel生態,優勢明顯。不過由於架構版權問題,導致兆芯過去的產品性能相較同期競品仍有所差距;在後續的推進中,兆芯不僅着眼於性能優化,還堅定地致力於提升自主可控能力,奮力追趕行業步伐。

今年年初,基於兆芯自研處理器開勝KH-40000/32的雙路通用超雲服務器正式落地,型號爲R3210Z11。

隨着中國政府對半導體產業的持續支持,以及國內外市場需求的增長,兆芯CPU有望在全球CPU市場中佔據一席之地。

Arm架構入局者愈來愈多

再看Arm架構。基於Arm架構的服務器CPU市場中的主要玩家有華爲鯤鵬、飛騰等。

在通用計算處理器領域,華爲鯤鵬在2014年發佈鯤鵬912處理器,2016年發佈鯤鵬916處理器。2019年1月華爲正式發佈鯤鵬920芯片。

鯤鵬920是目前業界領先的ARM-based處理器。該處理器採用7nm製造工藝,由華爲公司自主設計完成。通過優化分支預測算法、提升運算單元數量、改進內存子系統架構等一系列微架構設計,大幅提高處理器性能。典型主頻下,SPECintBenchmark評分超過930,超出業界標杆25%。同時,能效比優於業界標杆30%。鯤鵬920以更低功耗爲數據中心提供更強性能。

得益於強大的計算能力、高併發處理能力和優秀的能效比,鯤鵬服務器主要應用於雲計算、大數據分析、數據庫、AI訓練與推理等多種場景,並構建了從底層芯片到操作系統、再到上層應用軟件的全棧國產化解決方案。

中國移動2021-2022年PC服務器集採項目中,採用海光芯片的服務器達59982臺,佔比20.90%,採用鯤鵬芯片的服務器達58901臺,佔比20.53%,鯤鵬與海光服務器招標數量接近1:1,整體國產服務器佔比高達41.43%。

不僅是中國移動,在中國電信AI算力服務器(2023-2024年)集採項目中,國產服務器的採購數量佔比亦達47.5%。從金額來看,超80億元的採購總額中,鯤鵬服務器約佔28億元。今年3月,中國移動2024年PC服務器集採中標公告顯示,華爲鯤鵬再次佔據較大份額。

飛騰是PKS(飛騰P、麒麟K、安全S)生態體系主導者,其黨政市場佔有率高。飛騰芯片產品具有譜系全、性能高、生態完善、自主化程度高等特點,目前主要包括高性能服務器CPU(飛騰騰雲S系列)、高效能桌面CPU(飛騰騰銳D系列)、高端嵌入式CPU(飛騰騰瓏E系列)和飛騰套片四大系列,爲從端到雲的各型設備提供核心算力支撐。

基於飛騰CPU的產品在國內政務辦公、金融、電信、電力、能源、軌交、教育和醫療等行業信息系統領域已實現批量應用。

同時,飛騰聯合5000家生態夥伴,打造3200餘種硬件方案,適配近30000款軟件,兼容200萬級移動APP,構建了國內最龐大的信息產業生態,有力支撐了中國自主信息體系的發展。飛騰在全國政府信創中標超過300萬片,市佔率超過50%,有力支撐了國家信創工程推進,並逐步向更復雜的電子政務、智慧政府領域延伸。在電信行業,搭載飛騰CPU的服務器在三大運營商的雲資源池中得到廣泛部署,服務了大量國產化項目。

近年來,ARM架構的興起下,許多巨頭紛紛開始自研ARM架構的服務器芯片,包括國外的亞馬遜、谷歌甚至微軟,國內的騰訊、阿里巴巴等。

ARM能夠擠進服務器市場的核心優勢在於,基於ARM的服務器可以支持多樣化和快速變化的工作負載,並且更具可擴展性和成本效益;其次,對於不同的利基型市場能夠提供更高的定製化,生態系統也更靈活;另外,ARM架構服務器體積相對較小,符合現今微型數據中心的需求。

技術變化帶來的機會是全球性的,不限於地域,不限於公司規模,除了這些龍頭企業還有諸多初創公司邁進ARM CPU的圈子,包括啓靈芯、鴻鈞微、遇賢微等。

然而,Arm在服務器CPU這條道路上還有很多困難需要面對,在這之中自然也有不少初創公司倒在這波熱潮中,比如前面提到的啓靈芯。這些公司需要克服技術、市場、生態等多方面的挑戰,才能在競爭激烈的服務器市場中立足。

自研指令集的龍芯和申威

除了以上兩大架構,中國芯片市場還有一些廠商通過其他架構不斷研發與創新並取得了不錯的成績,比如分別走MIPS、Alpha路線的龍芯中科和申威,他們不僅通過獨特的架構設計推出了高性能的芯片產品,而且在自主可控方面也取得了較高的水平。

龍芯中科是中國科學院計算所自主研發的通用CPU,採用自主LoongISA指令系統,兼容MIPS指令,所有IP模塊皆爲自主設計,擁有片內安全機制,可信性高。龍芯處理器以32位核64位單核及多核CPU/SOC爲主,主要面向高端嵌入式、個人電腦、服務器和高性能機等應用。

龍芯產品體系分爲三大系列,龍芯1號系列爲低功耗、低成本的專用嵌入式SoC或MCU處理器,主要面向嵌入式專用應用領域,如物聯終端、儀器設備、數據採集等,主要根據需求定製;龍芯2號系列爲低功耗通用處理器,採用單芯片SoC設計,應用場景面向工業控制與終端等領域,如網絡設備、行業終端、智能製造等,定位於Intel的凌動系列;龍芯3號系列爲高性能通用處理器,通常集成4個及以上64位高性能處理器核,與橋片配套使用,應用場景面向桌面和服務器等信息化領域,對標Intel的酷睿/至強系列。

申威處理器以Alpha指令集爲基礎進行拓展,高度自主可控。申威在研發出第一代基於Alpha指令集的CPU後,將指令集替換爲自研的自主可控申威64位指令集,完全區別於原有Alpha指令集。申威處理器專注於高性能計算,尤其是在服務器領域,浮點運算算力與同期外國處理器相當。申威SW26010是中國首個採用國產自研架構且性能強大的計算機芯片。

申威在服務器領域向上至超算領域的應用場景中性能強大,優勢較爲明顯。2016年6月20日,搭載了40960顆申威SW26010並運行國產操作系統神威睿思的神威太湖之光獲得全球超級計算機第一名,神威太湖之光峰值計算速度達每秒12.54億億次,是全球首臺峰值計算速度超過十億億次的超級計算機,持續性能爲每秒9.3億億次,軟件硬件並行,均爲申威自主設計。

越來越多廠商擁抱RISC-V

RISC-V架構在最近兩年異常火熱。一位三年前重點關注ArmCPU創業公司的投資人表示:"我很久沒看ArmCPU的創業公司了,現在CPU的創業方向是RISC-V。"

RISC-V如何成爲一衆廠商的追捧呢?

中國工程院院士倪光南在達摩院玄鐵RISC-V生態大會上提到,對比x86,RISC-V可能從以下兩個方面實現超越:

其一,今天x86架構仍壟斷着服務器和桌面領域,這是因爲過去幾十年裡,x86架構在這些領域形成了強大的生態,以至於其他架構因生態較爲薄弱而不能取代它,假以時日這種情況會發生變化。另一方面,現在的x86架構也已經不是純粹的CISC了,實際上在它內部也用硬件將某些CISC指令轉化爲它內部的RISC指令再予以執行。

其二, 在後PC時代,CPU架構的競爭力不僅要體現在性能上,還需在芯片面積、能耗、價格、研發週期、生態支持等等方面全方位地體現出來。以此衡量,x86架構不但在新興領域沒有優勢,而且在傳統領域市場總量也不會有多大增長,甚至其份額也可能被RISC-V所蠶食。

從市場的視角審視,RISC-V不僅契合了中國對於芯片自主研發與掌控的戰略需求,同時也爲專用服務器市場帶來了前所未有的定製化機遇。隨着技術發展的深入,當傳統CPU的性能提升遭遇瓶頸時,市場將逐漸轉向更爲精細化和專業化的定製化需求,這將成爲RISC-V服務器進一步拓展其應用領域的契機。

目前國內外已有不少公司進入了RISC-V服務器賽道,不過其中部分公司主要涉及服務器中的AI加速芯片。IP公司包括阿里達摩院、SiFive、Ventana、Tenstorrent等;芯片公司包括算能、進迭時空、希姆計算、藍芯算力、微核芯、超睿科技等。

2019年7月,阿里達摩院面向高性能市場發佈了RISC-V處理器核—玄鐵C910,後來基於玄鐵C910設計了曳影1520SoC。

2021年12月,SiFive發佈了IP核P650,據瞭解,該產品配有128KB一級緩存、2MB二級緩存、16MB三級緩存(16核)等配置,性能指標爲11.xSPECInt/GHz,對標ARMCortex-A77,可用於數據中心等場景。

去年3月,北京算能科技發佈了首款國產64核RISC-V服務器處理器SOPHONSG2042,隨後在8月的第三屆滴水湖中國RISC-V產業論壇上又首次披露了其新一代的RISC-V服務器芯片——SOPHONSG2044的相關信息。VentanaMicroSystems成立於2018年,總部位於美國庫比蒂諾。2022年12月,Ventana公司就曾發佈了全球首款基於RISC-V架構的服務器CPU——VeyronV1。而在2023RISC-V峰會上,Ventana又發佈了其第二代服務器CPU——VeyronV2,在指令擴展、內核設計、互聯標準、製程工藝等衆多方面進行了全面升級,官方宣稱其性能超越了AMD的高端服務器芯片Epyc9754,堪稱最強RISC-V服務器CPU。

目前,開源RISC-V在中國具有超大規模的市場、豐富的應用場景和龐大的工程師羣體推動下,已成爲中國最受歡迎的CPU芯片架構之一。然而RISC-V和x86、ARM生態上還是有一些差距,無論從軟件規模上還是性能優化程度上,都還沒有達到x86和ARM的水平。因此,RISC-V進入服務器市場還存在諸多挑戰。

從創新性、成本乃至性能等角度來看,其實Arm以及未來的RISC-V都會是極具競爭力的服務器CPU架構,可現今的服務器仍是一個固執且切入週期較長的市場,x86目前尚未觸及設計和工藝的瓶頸,即便有了AI加速器、DPU等組件的加入,服務器架構並沒有發生劇變,所以x86在未來的十年內依然將佔據主導地位。只不過隨着設計方法、製造工藝的同步,Arm已經在該領域開啓了較爲成熟的商業化進程,隨着時間的推移,市場份額會逐漸升高。

倪光南曾多次表示,中國在芯片產業發展過程中應當重視RISC-V架構。至於何時RISC-V能真正有望來到"三分天下",業內人士表示如果Arm授權體系出現一些變數,同時RISC-V的高性能進展更順利、核性能提升很快,生態進展也很順利的前提下,很快Arm就會與RISC-V正面交鋒。

當然,RISC-V作爲後來者,面臨的挑戰還有很多。除了生態構建依然在完善進程中,這種開源架構也要避免類似此前MIPS架構所帶來的分散化、碎片化難題。

國產CPU迎來窗口期

中信證券表示,未來三年可能是國產算力芯片發展關鍵窗口期,目前國產算力硬件理論性能可接近國際主流,"生態優勢有望形成正反饋循環,進而支撐市場地位持續領先"。

在2023年11月28日舉行的2023龍芯產品發佈暨用戶大會上,新一代通用處理器龍芯3A6000發佈。北京市經信局副局長顧瑾栩表示,龍芯此次發佈的自主通用處理器3A6000性能追平國際先進水平,作爲北京市技術創新企業的代表,其全面發力加速實現自主信息技術的重大跨越,爲實現科技自立自強提供堅實支撐。

工業和信息化部電子信息司副司長史惠康表示,3A6000處理器的推出說明國產CPU在自主可控程度和產品性能上已雙雙達到新高度,也證明了國內有能力在自研CPU架構上做出一流的產品。並希望能加快先進封裝、內存一體化集成等相關的技術攻關,不斷推出具有國際競爭力的產品。