英特爾酷睿Ultra 200S雙平臺首測:“框框”少了、性能大漲

【【【前言:大家期待已久的英特爾全新桌面CPU測評,它來了】】】

2024年10月10日,英特爾方面正式公佈了全新的、換用新架構的酷睿Ultra 200S系列桌面CPU產品線。

它的發佈不僅意味着英特爾的整個主流家用CPU產品線,正式完成了從“酷睿i”系列到“酷睿Ultra”的品牌序列轉變,同時也是繼12代酷睿之後,英特爾主流桌面CPU久違地迎來了全新的架構和製程設計。

很顯然,對於這一代的全新產品,無論是上游的各大板卡廠商、還是諸多消費者,都表現出了極高的期待和興奮度。此前我們三易生活也已經用相關內容爲大家帶來了酷睿Ultra 200S系列新架構的技術分析《英特爾酷睿Ultra 200S系列解析:架構煥新,能效稱王》,以及與之搭配的華碩ROG STRIX Z890-E GAMING WIFI主板圖賞。

既然如此,那麼今天的內容自然就是大家期盼已久的性能實測了。

【【【平臺簡介:Ultra9和Ultra5,我們組了兩套不同定位的測試平臺】】】

此次我們三易生活的測試對象,是英特爾酷睿Ultra 200S桌面處理器家族裡,兩款定位截然不同的成員。它們分別是作爲本世代(到目前爲止)旗艦的酷睿Ultra9 285K,以及明顯更偏“大衆化”的酷睿Ultra5 245K。

從具體參數上來看,酷睿Ultra9 285K擁有8P+16E的核心組合,總共24核心24線程。其中P核主頻3.7GHz-5.7GHz、E核主頻3.2GHz-4.6GHz,同時擁有40MB的L2緩存和36MB的L3緩存。

相比之下,酷睿Ultra5 245K則是6P+8E的核心配置,總共14核心14線程。P核主頻爲4.2GHz-5.2GHz,E核則是3.6GHz-4.6GHz,緩存方面配備了26MB的L2緩存以及24MB的L3緩存。

此外,酷睿Ultra 200S系列還全系標配具備13TOPs算力的英特爾第三代NPU,也就是之前移動版酷睿Ultra 100系列裡相同架構的NPU,但主頻應該有一定幅度的提升。

最後,無論酷睿Ultra9 285K、還是酷睿Ultra5 245K,都配備了一顆新的“Intel Graphics”核顯。其架構同樣源自初代酷睿Ultra移動版,也就是桌面版ARC獨顯去掉XMX單元之後的初代Xe架構。不過因爲是桌面CPU,所以核顯只保留了4組執行單元,總計64ALUs、32TMUs、16ROPs的配置。其中在Ultra9上,這顆新核顯的峰值主頻略高、可達2GHz,而在Ultra5版本中,它的峰值主頻則降到1.9GHz,但基本上也可以認爲沒啥區別,主要還是提供一個附帶的“亮機卡”,以及在部分場景作爲視頻編解碼單元和AI協同加速單元使用。

當然,除了這兩顆CPU,我們也爲它們找了些適合各自定位的配件。其中,酷睿Ultra9搭配的是華碩ROG STRIX Z890-E GAMING WIFI。此外還包括DDR5-7600高頻內存、PCIE5.0的英睿達T705 SSD、RTX4080S顯卡,以及華碩ROG 龍神三代 Extreme 360水冷。

酷睿Ultra5這邊,我們選擇了七彩虹iGAME Z890 FLOW主板,搭配影馳名人堂DDR5-7600內存、PCIE4.0 2TB SSD,以及RTX4070S顯卡,以及相對常規的風冷散熱器。

有的朋友可能會說,這兩套平臺的外圍配置並不統一,那不是沒法對比了嗎?請注意,雖然我們給兩款CPU搭配了不同的SSD和獨顯,但內存規格卻基本相同。因此涉及到純粹CPU性能的考察項目,這兩個平臺之間依然具備可比性。同時,在遊戲以及部分生產力項目上,我們並不會將兩個平臺進行直接比較,這是因爲兩者的市場定位其實有着很大差異,不考慮價格因素強行進行對比並無意義。

【【【內存和緩存測試:設計變化巨大,帶寬敏感型應用大幅受益】】】

接下來,我們正式進入對酷睿 Ultra 200S系列的性能實測。

酷睿Ultra 5 245K 緩存性能

酷睿Ultra 9 285K 緩存性能

首先,我們測試了這兩顆CPU分別搭配DDR5-7600內存時的內存和緩存性能。可以看到,作爲新架構目前已經公佈的高低“兩端”,酷睿Ultra 9和酷睿Ultra5在搭配相同內存時,所發揮出的內存讀寫速度差異很小。這表明Ultra 5的內存控制器體質可能得到了提升,至少不會像過去那樣、存在比較明顯的頻率限制了。

酷睿Ultra 5 245K 內存讀取

酷睿Ultra 9 285K 內存讀取

不過相比內存控制器性能的接近,酷睿Ultra 200S系列的不同定位處理器在緩存性能上,則體現出了巨大的差異。可以看到,Ultra 9 285K的L1緩存性能比Ultra 5 245K高出大約50%,同時L3緩存性能更是比Ultra 5有着翻倍級別的提升。但與此同時,兩者的L2緩存性能差異則沒有那麼大。

從各項數據的比例來看,似乎說明在目前版本的AIDA64裡,我們測得的L1和L2帶寬更像是“僅有P核”的跑分結果,L3緩存的帶寬測速才更好地體現了核心數量和主頻上的差異。

那麼如果與前代對比,酷睿Ultra 200S系列的緩存性能表現又會如何呢?

我們找來了前代旗艦、酷睿i9-14900K的內存和緩存測試成績,來進行對比。此時可以很明顯地看到,相比酷睿i9-14900K,酷睿Ultra9 285K採用了完全不同的緩存設計策略,其L1緩存寫入帶寬相比前代增加了50%,L3緩存的速度更是提升超過100%。但與此同時,後者的L2緩存讀取帶寬降低了大約60%,同時內存寫入和讀取速度也降低了大約10%。

這似乎說明新款處理器在整個數據處理的邏輯上,更着重於依賴L3緩存。其實這是一個很好理解的設計思路,因爲相比於內存,L3緩存有着低得多的功耗。因此當英特爾方面爲酷睿Ultra 200S系列賦予更大的緩存(特別是三緩)時,這本身其實就是一種“降功耗”的措施。

不過衆所周知,對於日常使用場景來說,不同的用途往往對於緩存和內存性能會有不同的依賴程度。比如在多媒體創建場景,更高的內存帶寬往往就會帶來顯著的性能增益。那麼當英特爾在他們的新架構裡針對緩存和內存性能進行了大幅調整後,又會帶來怎樣的影響呢?

酷睿Ultra 5 245K 照片編輯模擬

酷睿Ultra 9 285K 照片編輯模擬

從AIDA64的這兩個測試項目中可以看到,雖然Ultra5和Ultra9這次由於核心數量、頻率的差異,在指令分支預測性能上差異甚大,但它們在純粹的浮點多媒體運算測試中,卻有着十分相近的表現。而且兩者的浮點多媒體模擬性能均比上代的24核酷睿i9提升了高達40%之多。換句話說,稍慢一點點的內存速度,完全沒有成爲新款處理器的性能瓶頸。

【【【並行性能測試:單核性能爆炸式提升,去掉超線程影響很小】】】

測完了緩存和內存設計的變化對於酷睿Ultra 200S系列帶來的影響,我們接下來就來探究它這次新的核心設計。

酷睿Ultra 5 245K 分支預測

酷睿Ultra 9 285K 分支預測

首先,是AIDA64內置的分支預測評估項目。可以看到,此時Ultra 5和Ultra 9之間出現了很大的差異。當然這裡面有個“倖存者偏差”的問題。因爲AIDA64這個項目裡的參考成績全都是歷代旗艦CPU,所以Ultra 5的成績反而難以直接進行對比。如果拿Ultra9 285K去進行比對便不難發現,新架構的分支預測性能大抵比前代同樣8P+16E規格的酷睿i9,提升了接近20%。

當然,大家都知道,在這次的新架構裡英特爾爲了提高能效比,不只是大幅修改了緩存架構,同時還取消了超線程。那麼這對於新款處理器的多核性能,會帶來怎樣的影響呢?

酷睿Ultra 5 245K CPU-Z跑分

酷睿Ultra 9 285K CPU-Z跑分

在CPU-Z的測試中,由於酷睿Ultra 200S系列CPU取消了超線程,所以它們的成績可能確實有一點點“吃虧”。特別是對於酷睿Ultra5 245K來說,可以看到它的表現基本上也就是12代酷睿i9的水平。

酷睿Ultra 5 245K CineBench R23

酷睿Ultra 9 285K CineBench R23

但如果換用負載更重、更接近實際工況的CineBench R23就會發現,新架構的性能提升實際意義要遠遠超過了表面上的“框框減少”。特別是對於專業生產力應用需求的用戶來說,即便是14核的Ultra 5,實測渲染性能也超過了24核的舊款Xeon,而24核的Ultra9更是碾壓競品的32核線程撕裂者50%以上,這個吸引力就實在是太大了。

此外,無論從CINEBENCH的重負載渲染、還是7ZIP的解壓縮測試數據來看,酷睿Ultra 9和酷睿Ultra 5之間的跑分成績差異,基本符合它們的核心數量以及頻率之間的對應關係。換句話說,在目前的操作系統和驅動環境下,新架構的酷睿Ultra 200S系列桌面處理器在大小核調度方面的效率已然不存在問題,所有核心在需要的時候都是可以“全力全開”。

最後,使用CrossMark對這兩套平臺的整機性能進行了大致的評估。需要注意的是,由於兩個平臺的SSD、顯卡配置並不一樣,整體細節成本也分別與它們的定位相對應。所以這裡重要的並非整機成績之間的對比,而是CPU在更多樣化、並不見得滿載的測試場景下的比較。

【【【AI體驗與測試:給桌面處理器加NPU,並非爲了搶顯卡的飯碗】】】

接下來,我們來了解酷睿Ultra 200S系列此次的AI計算體系。

有看過我們此前架構分析內容的朋友可能還記得,酷睿Ultra 200S系列這次的AI計算體系是由三個計算部件和三種代碼架構組成,即運行AVX-ANNI指令的CPU、運行DP4a指令的GPU,以及運行MAC陣列的NPU。

但與其他家類似“異構AI”體系的不同之處在於,英特爾是有一個自家的統一API,可將CPU、GPU、NPU的算力都統合在內。而通過這套OpenVINO框架,我們也就確實可以在GeekBench AI中,分別測得酷睿Ultra 200S系列裡不同AI運算組件的相對性能等級。

酷睿Ultra 5 245K CPU AI性能

酷睿Ultra 5 245K GPU AI性能

酷睿Ultra 5 245K NPU AI性能

以酷睿Ultra 5 245K爲例,通過GeekBench AI可以清楚地看到它在OpenVINO框架下有三個AI運算設備。從各自的性能等級來看,NPU在半精度推理場景中可以發揮出比CPU、GPU更好的性能,從這一點來說,其實酷睿Ultra 200S系列這次配備的NPU也沒那麼“小”。

除此之外通過安兔兔AI大模型評測可以看到,酷睿Ultra5 245K與酷睿Ultra9 285K的純CPU AI性能差異。不難發現,前者大約有後者70%的CPU AI性能水平。稍加計算不難發現,在目前酷睿Ultra 200S系列裡,單顆P核的AI性能大約相當於8顆E核的水平。當然,這僅僅是從單一測試結果倒推出的簡單結論,大家姑妄聽之就好。

那麼可能有的朋友看到這裡會有疑問,畢竟桌面版CPU和移動平臺不一樣,現在絕大多數的桌面PC用戶往往都會搭配中高端、甚至是旗艦級顯卡來使用,那麼在這種情況下,強化CPU本身的AI算力、專門塞進一顆NPU又是否有意義呢?

純CPU AVX指令驅動的340億參數本地對話大模型

基於英特爾OpenVINO框架實現的本地AI繪圖和本地AI對話助手

首先,哪怕是隻從現有的PC端側AI應用來看,也不是所有AI應用都只依賴於GPU。對於CPU、特別是對於英特爾的OpenVINO體系來說,它其實有不少支持的本地AI用例。比如部分多媒體愛好者可能會很熟悉的PhotoShop“神經網絡濾鏡”,就可以智能地調用GPU和CPU的算力去執行。所以不能說因爲獨立顯卡的AI性能很強,其他計算部件的AI功能就沒必要了。

況且從英特爾方面此前透露的一些信息來看,他們也很清楚桌面PC在AI算力方面主要還是依賴獨立顯卡,所以這也是爲何酷睿Ultra 200S系列的NPU規格不很高的原因。因爲這顆NPU未來主要的任務只是負責處理比如攝像頭特效、麥克風消噪,以及語音助手這類,需要長時間運作、但AI運算壓力又不是特別大的任務。在這種情況下,如果沒有NPU、全靠獨顯去運算的話,就會帶來大得多的功耗和發熱,而且還可能會拖累電腦的遊戲性能。

【【【遊戲測試:網遊和3A優化已經到位,Ultra5即可暢玩】】】

最後就該來看看可能很多玩家朋友都會關心的問題,也就是酷睿Ultra 200S系列的遊戲性能了。

首先在3DMARK的CPU遊戲測試項目中,考慮到目前絕大多數的3A大作也纔不過6線程-8線程優化,所以即便是6P+8E的酷睿Ultra5 245K,其P覈計算資源理論上也是完全夠用的。更多並行線程的考察或許可以作爲“戰未來”的依據,但對於當前的遊戲來說其實意義不大。

當然,這裡作爲參考,我們依然列出了之前酷睿i9-14900K的測試數據。可以明顯看到,更高的單核效率讓Ultra 9幾乎在所有的線程併發場景下,表現都要優於上一代旗艦。

接下來是遊戲加加的整機遊戲性能測試。還是那句話,由於這兩套平臺在獨顯、內存等方面並不相同,所以兩者之間不具備直接對比綜合性能的意義。

酷睿Ultra 5 245K 《最終幻想》14 7.0 1080P最高畫質

酷睿Ultra 9 285K 《最終幻想》14 7.0 1080P最高畫質

不過這並不妨礙我們使用相同的遊戲和畫質設定,來對兩套平臺進行考驗。在《最終幻想》14 7.0版本的Benchmark中,重點在於最後的得分是否有足夠高的評價。從結果來說,兩套平臺應對這個堆特效的網遊普遍都沒啥壓力。

酷睿Ultra 5 245K 《古墓麗影·暗影》4K高畫質

酷睿Ultra 5 245K 《古墓麗影·暗影》4K最高畫質

酷睿Ultra 9 285K 《古墓麗影·暗影》4K高畫質

酷睿Ultra 9 285K 《古墓麗影·暗影》4K最高畫質

然後我們進入單機遊戲測試環節,第一個登場的遊戲是《古墓麗影·暗影》。此時我們有意拉高了測試的畫面分辨率,並使用高畫質和最高畫質兩種模式,分別考察CPU性能差異,以及相應平臺所能提供的遊戲極限性能。可以看到,哪怕是酷睿Ultra5搭配RTX4070Ti,在《古墓麗影·暗影》裡“拉滿畫質”都沒什麼問題,就別提定位更高的Ultra9+RTX4080S了。

酷睿Ultra 5 245K《裝甲核心6》2K光追

酷睿Ultra 9 285K《裝甲核心6》2K光追

《裝甲核心6》的優化水準似乎更好一些,所以我們嘗試開啓了2K+光追的全最高畫質模式。稍微令人感到意外的是,酷睿Ultra 5這套平臺在遊戲裡與定位更高的Ultra 9平臺完全沒有拉開差距,甚至在開頭部分的幀率更高、畫面更穩定。看起來不僅GPU、就連6P+8E的CPU,對於這款畫面相當絢麗的機戰遊戲來說,似乎都顯得有點“過剩”了。

酷睿Ultra 5 245K《黑神話·悟空》4K 超高 光追中

酷睿Ultra 9 285K《黑神話·悟空》4K 超高 光追中

當然,也不能忘了我們國內遊戲界引以爲傲的《黑神話·悟空》。雖然此前我們三易生活已經測試過多個平臺在這款遊戲裡的性能表現了,但在全新的酷睿Ultra 200S平臺上,我們希望能夠體驗到更極致的畫面享受。所以4K+超高畫質+光追的設定也就順理成章。從結果來說,不管Ultra 5、還是Ultra 9,都能很流暢地運行這款3A大作,即便是在開啓光追的情況下,Benchmark的4K分辨率高畫質成績也沒有低於60幀。

酷睿Ultra 5 245K 《賽博朋克2077》2K 超級光追

酷睿Ultra 5 245K 《賽博朋克2077》4K 超級光追

酷睿Ultra 9 285K 《賽博朋克2077》2K 超級光追

酷睿Ultra 9 285K 《賽博朋克2077》4K 超級光追

在最後一個遊戲測試項目中,我們測試了2K和4K分辨率下這兩個平臺的幀率表現。有意思的是,酷睿Ultra5再一次出現了在遊戲測試中幀率高於Ultra9平臺的情況。不過在《賽博朋克2077》這個遊戲裡,不同顯卡的自動DLSS等級其實是不一樣的,所以這反而沒什麼好奇怪。畢竟幀率有這麼高了,不管是哪個平臺,流暢且高畫質地遊戲都毫無問題。

【【【總結:英特爾這次找對了方向,新平臺表現靠譜】】】

說實在的,在此前對Arrow Lake進行架構解析之後,我們三易生活雖然對於新處理器大幅改進的核心設計很是好奇,同時也對英特爾敢於在酷睿Ultra 200S系列強調能效比的做法多有肯定。但對於變化如此之大的產品究竟在實際測試、使用中的性能,確實一開始誰也沒個底。

但從此次的測試結果來看,一方面在全新的架構設計下,酷睿Ultra 200S系列表現出了大幅提升的單核性能,同時爲了提高能效而設計的緩存系統,以及取消超線程的決定,哪怕是在強烈依賴多線程性能的渲染、多媒體編輯相關測試中,也沒有表現出副作用。從某種程度上來說,這也間接證明了超線程這個古老的技術在現代處理器中,或許確實到了應該被改變的時刻。

另一方面,儘管目前在桌面CPU領域,直接集成NPU的產品確實還不多,但隨着酷睿Ultra 200S系列此次的推進,它更大的意義在於填補了過去“主流桌面CPU”幾乎完全沒有NPU硬件的空白。換句話說,對於AIPC的軟件適配、特別是面向NPU編程的生態推廣,可能纔是這一代酷睿桌面CPU在相關領域的意義所在。

最後從實際的遊戲測試成績來看,不管是相對老一點的遊戲、還是最新大作,無論網遊、還是單機遊戲,酷睿Ultra 200S系列最令我們驚喜的一點,在於它目前已經可以表現出很好的優化狀態。哪怕是Ultra 5,在所有的遊戲項目中也沒有因爲6個P核的配置,而出現核心遷移相關的延遲、卡頓等問題。

事實上,根據英特爾此前透露的一些信息顯示,桌面版的酷睿Ultra 200S系列儘管這次“能效比”是改進重點,但其線程調度邏輯還是會更偏向桌面PC的特徵,也就是儘可能地使用P核去主動、更快地完成任務。或許正是靠着這樣未雨綢繆的設計,酷睿Ultra 200S系列在表面上線程減少、峰值主頻也降低了的情況下,遊戲性能和遊戲兼容性都完全沒有“打折扣”。

再加上本身更高效的新架構,無論是對於追求效率的生產力用戶,還是想要更快、更穩定平臺的玩家朋友來說,英特爾全新的這一代桌面平臺,可能都會是接下來最好的選擇。