因中國缺席而奪冠的美國超級電腦問題多 陸媒:效率僅6 成

今年因中國缺席而讓美國奪回超級電腦第一名的橡樹嶺國家實驗室前沿(Frontier)超級電腦問題不斷,整體運算效率只能達到設計目標的60%。(圖/美國橡樹嶺國家實驗室)

今年5月因中國缺席而讓美國奪回超級電腦第一名的橡樹嶺國家實驗室前沿(Frontier)超級電腦問題不斷,原訂2022年投入運行,卻因故障不斷而延遲至2023年。據陸媒報導,這部全球第一臺進入百億億次運算的Frontier超級電腦被曝自上線之初就問題重重,除了故障不斷之外,整體運算效率只能達到設計目標的60%,而且目前尚未弄清楚問題出在哪裡。

據《快科技》報導,今年6月,全球第一臺百億億次超級電腦Frontier公開亮相,採用AMD Trento EPYC 7A53處理器與AMD Instinct MI250X GPU加速卡的組合,這也是AMD時隔10年重返超級電腦的巔峰之作,其性能相當於其後第2到第7名的總和。

報導說,Frontier超級電腦部署在美國能源部橡樹嶺國家實驗室,最初計劃2022年內全面投入運行,後來推遲到2023年,但現在卻被曝出自上線之初就存在嚴重的問題,每天都故障不斷。

Frontier系統可能於今年秋天提前交付,將在明年按期向科學界開放。(圖/美國國家橡樹嶺實驗室)

據表示,Frontier超算規劃的FP64雙精度浮點性能爲1.685EFlops(168.5億億次計算/每秒),但目前只能勉強跑到1EFlops,也就是隻能達到設計目標的60%。

造成此現象的具體原因仍不詳,有一種說法是HPE Cray機櫃使用的Slingshot網路互連繫統與HPE集羣存在衝突,另一種說法是Slingshot互連繫統與AMD計算平臺存在衝突,但究竟是哪個原因仍不得而知。

美國能源部百億億次運算項目對外聯絡負責人Mike Bernhardt聲明稱,感謝HPE、AMD的努力,Frontier系統可能於今年秋天提前交付,目前正在進行安裝和集成,這是一項繁重、複雜的任務,但目前進展順利,將在明年按期向科學界開放。

由美國田納西州橡樹嶺國家實驗室的巨型電腦Frontier,在今年5月爲美國奪回了超級電腦運算速度世界第一的寶座,在超級電腦排名測試中,成爲首臺取得每秒百億億次運算性能的電腦。它是美國能源部於多年前投資18億美元打造3部「百億億次級」電腦系統的其中之一,預料它能在科學、醫學和其他領域發揮重大作用,是超級電腦工程的重要里程碑。

超級電腦專家指出,這項每秒百億億次運算性能競賽中,Frontier比不上中國的2個電腦系統「神威」與「天河」,但今年這2個系統都沒有提交測試結果供超級電腦500強排名評選,原因可能是美中的緊張關係。分析人士透露,中國的超級電腦已達到百億億次級的水準,很多人推測中國不希望引來美國的進一步制裁,所以未再參加評選。