Zenlayer陳秀忠:通往AGI有三大挑戰,即時交互、數據保護、算力限制丨GenAICon 2024

智東西作者 GenAICon 2024

2024中國生成式AI大會於4月18-19日在北京舉行,在大會第二天的主會場AI Infra專場上,Zenlayer行業拓展總監陳秀忠以《大數據、大算力與大模型驅動下的全球廣域網挑戰與策略》爲題發表演講。

大數據、大算力、大模型推動AI能力涌現,正在改變當代人們與世界互動的方式。要充分發揮AI的潛力,需要高效、安全、可靠的全球網絡支撐。

然而,當前全球廣域網在滿足AI應用在對數據流動、算力配備和網絡性能的需求方面,依然面臨挑戰。數據流動的高效與安全、算力資源的優化配置與協同工作,以及訓練與推理節點之間網絡性能的優化,成爲當前全球廣域網亟待解決的問題。

對此,陳秀忠認爲通往更高級AGI,挑戰在於更即時的交互、更廣的數據、更廣的算力。因此,面向AGI的全球邊緣雲方案,不僅需要考慮支持實時交互的全球網絡、數據本地存儲和全球流動,同時,也要覆蓋大量的邊緣節點。

陳秀忠談道,安全合規的跨境專線是企業連接全球的第一跳。一大挑戰在於,數據合規性讓全球數據監管力度加大,一旦數據本地化,企業又將何去何從?

以下爲陳秀忠的演講實錄:

我有一個問題想和大家討論:CPU和GPU之間的本質區別是什麼?我認爲最重要的一點是,GPU專注於圖形處理。

現在,我們一起快速地探索AIGC或全球網絡的整體情況。以下是大致的議程:現在的情況如何,存在什麼挑戰,我們的方案又是什麼?

一、AI能力爲何涌現?“大”力出奇跡

今天關於AI基礎設施的主題的演講有很多,包括網絡、數據以及模型的訓練和推理等。全球邊緣網絡中主要的資源集中在算力和數據方面。

這張畫是我孩子繪製的作品,因爲要參加比賽,所以需要給這幅畫取個名字。我把這項工作交給了ChatGPT。在此之前,我們曾爲這個問題爭吵不休,不知道該給這幅畫取什麼名字。爲什麼ChatGPT有這樣的能力?實際上,AI技術已經在學術界和工業界發展了四十多年。然而我們是在過去的一兩年中才覺得AI非常酷。

我們來看看這個圖。

第一,手機很多。現在全球手機數量已經高達86億部。每一部手機都在扮演着將物理世界數字化的角色,從而創造了大量的數據。

第二,NVIDIA很厲害。NVIDIA在GPU領域有着幾十年的深厚積累,並且有個定律——每6個月,GPU的能力將翻倍。這一速度是摩爾定律的3倍。

第三,大模型。這些“大”模型已經創造了許多奇蹟,並且它們的能力正在不斷涌現。

回顧過去,去年很多人開始使用ChatGPT,但是逐漸地,ChatGPT的活躍度卻在回落。此外,在我與許多人溝通時,我發現人們真正敢將工作交給ChatGPT,是因爲仍然有機會進行確認。我們也研究了DeepMind團隊對於AGI(通用人工智能)的分層。

目前,ChatGPT仍處於非常初級的階段,即L1階段。還有許多級別需要攀升,因此實現AGI的道路還非常遙遠。

剛纔提到,AI涌現的三個主要的因素是大數據、大算力和大模型。現在再來思考一個問題,當AIGC變得非常出色時,當一個與真人幾乎一模一樣的虛擬人與我進行對話和互動時,接下來會發生什麼?我需要與這個虛擬人進行快速的交互,這是一個非常重要的因素。

二、通往更高級AGI,面臨三大挑戰

我們總結了幾個挑戰。

第一個挑戰是更即時的交互。如果AIGC要給人帶來非常出色的體驗,那麼即時交互就會成爲其中的關鍵。當我觀看短視頻或長視頻時,這些內容並非UGC或者PGC產生,因此是缺乏新鮮感的,就像是經過冷凍處理的內容。

這張圖表展示了人與人之間的互動以及人與內容之間的互動。最終,所有這些都指向一個共同點,那就是人。只不過,這個“人”是一個機器。如果這個機器人真的能夠與人類如此相似,那麼這將是一種非常好的體驗,而這也就意味着即時交互在全球範圍內是通往AGI的重要挑戰。

第二個挑戰是更廣的數據。儘管我們已經將目前可以獲取的所有數據都提供給了大模型,包括所有的書籍、學者發佈的論文以及各種各樣的數據,但仍然存在很多數據難以提供給大模型,比如一些政府數據和封閉平臺的數據就很難被獲取。

那麼,我們如何才能將這些數據提供給大模型呢?我們注意到全球範圍內的一個最大難題是,各國都有自己的數據隱私保護法規,因此數據在全球範圍內的流動面臨着很大的挑戰。

第三個挑戰是更廣的算力。當在美國一個州進行10萬張H100訓練時,可能導致電網癱瘓。這意味着我們需要儘量分散計算力,以緩解電力限制的壓力。

在推理階段,我們對計算力的需求更高,因爲每次推理都會消耗一定的資源,而推理與用戶請求數量直接相關。未來,無論是因爲推理需要更接近用戶,還是推理次數增加,都需要關注推理部分的計算能力。

根據這三個挑戰,可以得出一些小的結論。

首先,對於更即時的交互,需要建立全球範圍內的即時交互網絡。二是需要更廣的數據,思考如何生成和流動這些數據,以及如何解決各國對數據隱私的保護。三是需要更廣泛的計算能力,同時我們也要考慮到,推理和訓練的計算能力應儘量分開。

三、語言、地理、戰爭,全球網絡碎片化的三大挑戰

我們說網絡很重要,尤其是全球範圍內的網絡至關重要。儘管我們訪問外網時可能會遇到性能挑戰,但國內網絡通達性非常好。

然而,全球範圍內的網絡卻是碎片化的。這是因爲全球各國之間的網絡互通主要依靠海底光纜,而這些海底光纜還面臨着諸多問題,導致全球網絡出現了許多挑戰。

第一張圖展示了東南亞國家的網絡情況。儘管東南亞的面積和人口僅爲中國的一半,但卻有十幾個國家,且語言也各不相同。例如,泰國和越南這兩個毗鄰的國家之間的互聯通信需要70多毫秒,因爲它們需要通過新加坡進行中轉。

第二張圖展示了南美洲的情況。南美洲的地理格局有些奇特,東邊是巴西,西邊是秘魯,儘管它們的物理距離很近,但由於地理因素,如南北延伸的山脈和亞馬遜熱帶雨林的存在,導致陸地光纜無法通行,必須繞過整個南美洲一圈才能實現互聯。

第三個因素是戰爭,特別是在中東市場。我們可以清楚地看到以色列到阿聯酋之間的網絡需要160毫秒,儘管它們的物理距離可能只有十幾毫秒。這三個因素共同決定了全球網絡與中國國內網絡之間存在着非常大的差異。

四、安全合規的跨境專線,中國企業走向國際市場的第一跳

現在所有客戶在海外部署關鍵應用的需求就是專線。中國企業要走向國際市場,跨境專線是非常重要的一部分。這張圖展示了中國整個跨境陸纜和海纜的佈局,主要從上海、廣東、香港以及北京前往俄羅斯,或者新疆。

這張圖展示了全球各個國家對個人隱私的重視程度,導致許多數據無法直接離開其所在國家。

最近我和一位從事汽車行業的朋友聊過,他們在歐洲產生了大量數據,但如果要用這些數據進行研究,他們必須親自前往歐洲進行處理。

然而,數據合規性讓全球數據監管力度加大,一旦數據本地化,企業又該如何解決?

有一個案例,同樣是一家汽車企業,他們在全球產生大量數據,需要在各地進行本地存儲。因此,他要回到杭州,用一些全球加速的方案讓數據快速傳回杭州。

大家對時延有沒有概念?這張圖展示的是以德國法蘭克福爲中心,覆蓋整個歐洲的互聯網時間情況,當網絡通往東歐時,延遲時間急劇增加,超過了30或50毫秒。由於公有云很難在每個國家都設置邊緣節點,因此需要大量的邊緣節點來覆蓋這些地區,比如土耳其、保加利亞等,以提高真正即時交互的體驗。

簡而言之,我們公司在全球各地都設有一些邊緣服務,可以幫助用戶在當地獲取算力,東南亞、中東地區我們都有覆蓋,在東南亞的十幾個國家和每個國家的首都也都有當地節點,在南美洲和非洲也有完整的覆蓋。至於歐美地區,這是傳統網絡覆蓋比較好的地方,例如美國的美東、美西地區都有廣泛的覆蓋,歐洲的保加利亞和莫斯科也有覆蓋。

我們公司已經服務中國企業出海十多年了,我們的logo佈滿了整面牆,包括最早的遊戲、汽車企業,以及大型公有云,都是我們出海的主要客戶。

總結一下,AI已經爲我們做了一些事情,但要實現真正的AGI還有很長的路要走。在通往真正AGI的路上,有許多挑戰,如需要更多的數據、更廣泛的算力,以及全球範圍內即時交互的網絡。我們公司則可以在這方面幫助大家。

以上是陳秀忠演講內容的完整整理。