大模型首次上天 AI天地一體化提上日程

本報記者 李玉洋 上海報道

在今年國慶假期期間,“全球首次衛星在軌運行AI大模型技術驗證”這樣一條關於“AI大模型上天”的新聞引發人們關注。

新華社10月6日報道,成都國星宇航科技股份有限公司(以下簡稱“國星宇航”)於近日對衛星AI大模型進行了在軌運行試驗,覆蓋不同溫度工況及各類推理問答類型,任務執行均獲得成功。

《中國經營報》記者瞭解到,用AI大模型賦能衛星產業已是一種業界共識。“在沒有AI大模型之前,做衛星遙感的標準流程是衛星上天之後把獲得的數據下發到地面接收站,接收站再把數據進行預處理,即處理成一張連續的圖片或是滿足分析需求的圖片,然後人工去找想要的信息。”衛星遙感領域資深從業者沙愛軍對記者表示,當衛星數量增加後,單純靠人是沒法業務化運行的,且不穩定。

中國科學院長春光學精密機械與物理研究所圖像部主任孫海江曾表示,隨着衛星規模增大,全球每天獲取的觀測數據已經以PB量級測算,傳統手動、單一領域的遙感信息提取方法難以適應海量遙感數據的快速解譯需求。

記者注意到,包括螞蟻集團、阿里達摩院、商湯集團以及有華爲助力的鵬城實驗室在內的公司和研究室都在開發遙感大模型。9月下旬,由中國科學院空天信息創新研究院科研團隊聯合鵬城實驗室研發的全球首個百億參數級遙感基礎模型“空天·靈眸”3.0版發佈,其不僅是我國首個面向多模態遙感數據生成式基礎模型,也是首個專爲遙感領域打造的行業基礎模型。

“以我們自身發展戰略來看,(AI大模型上衛星)是非常重要的一環,也是我們後續發展階梯的啓動。”國星宇航CEO王磊向記者這樣闡釋大模型上衛星的意義。而沙愛軍則認爲,衛星上用大模型可能解決以下問題,“第一個是衛星的自控問題,即衛星的飛行安全問題,可把它看作衛星要解決自動駕駛的執行力問題,第二個是做地面信息採集時信息提取的問題”。

全球首次衛星在軌運行AI大模型

據瞭解,今年9月24日10時31分,由國星宇航與香港中文大學共同研發的全球首顆AI大模型科學衛星在山東海陽搭乘捷龍三號運載火箭成功發射入軌。

9月25日20時46分,試驗團隊通過地面站以遙控指令形式發送AI任務至衛星;21時11分,衛星在大西洋北部上空通過星載高性能算力載荷成功啓動運行AI大模型,AI大模型太空在軌運行過程及結果通過衛星自帶的在軌可視化存證系統——“星屏”系統實時展示;22時20分,試驗團隊通過地面站接收到首次試驗完整數據。

自9月25日至10月5日,該衛星總計執行了13次AI大模型在軌運行試驗,覆蓋了不同溫度工況及多種推理問答類型,圓滿完成衛星在軌運行AI大模型技術驗證的各項預定目標。

本次技術試驗的成功,也意味着全球首次衛星在軌運行AI大模型技術驗證的成功。

記者注意到,在軌運行試驗期間,該衛星AI大模型回答了“你會選擇什麼超能力?”“國慶節有什麼想對祖國說的話?”“國慶節旅遊目的地有什麼推薦?”等一系列問題。官網顯示,國星宇航是國內領先的AI衛星互聯網科技公司,由衛星互聯網領域的原高校科研院所、互聯網領軍人才創辦。截至目前,國星宇航已完成13次太空任務。

國星宇航通過低成本快響應衛星研製技術體系、全棧AI衛星網絡技術體系、高機動快速重訪衛星技術體系,形成了面向不同應用場景的B端、G端、C端衛星互聯網產品,已服務上百家政企客戶。

根據企查查,國星宇航成立於2018年5月,已有5輪融資,近期一筆融資發生在2023年,融資金額超5億元,由洪泰基金領投,泰山城建集團、青島海發集團、嘉興嘉秀集團、策源資本、蕪湖產投跟投。

在國星宇航看來,大模型上衛星主要實現哪些功能?

對此,國星宇航方面這樣表示:“通過星上算力載荷,開展AI大模型的在軌推理、訓練技術驗證,爲‘天數天算’和下一步的‘地數天算’做好技術積累,推動我國乃至全球AI天地一體化的商業化進程。”

鏈路帶寬是最大瓶頸

據悉,“天數天算”是指衛星在太空中獲得的數據無須傳回地面,在太空中即可完成計算,依靠的是AI衛星搭載的算力載荷和用之不竭的太陽能;“地數天算”是指將地面的算力需求傳輸到太空中的算力節點,通過AI衛星搭載的算力載荷進行數據計算。

此外,國星宇航還有着更遠大的“征途”。“人工智能與衛星互聯網,是中美兩國在地球和太空中競爭最激烈、發展最迅速的超級賽道。”國星宇航方面表示,我國迫切需要抓住目前中美在星座組網規模、運載能力等方面存在巨大差距,但單星能力尚未形成代差的時間窗口,以最快速度、最大力度、超常規投入研發AI大模型衛星,“搶先構建天基算力網絡,爲我國在新一輪信息革命和國際競爭中贏得主動權,實現換道超車”。

在沙愛軍看來,所謂的遙感大模型或星載計算、星載智能,直接說就是在想把地面上的雲計算搬到天上去,但現實還遠沒有達到實際需求的程度。

“天數天算的主要問題,在於從天上把數據傳到地面的成本高或是效率不夠高。”沙愛軍說,“天上雲計算也好,或者星載計算也好,最大的瓶頸無非是從天到地的一個通訊鏈路的帶寬不夠。或者說,是天地之間通聯的機會沒那麼多。”

不過,星載AI仍具有商業應用的想象空間。“比如用衛星採集了遙感影像之後,客戶可能不需要整個衛星影像數據,只要裡面的船隻數量和位置信息,把這些信息通過短報文的形式直接下發到手機上。”沙愛軍指出,海運、保險、期貨這些應用場景關心船隻在港數量、規模以及載貨的量、港口碼頭的貨物堆積量,可以統計後用一些模型、算法去預測價格的走勢。

關鍵在於是否有壁壘優勢

大模型上衛星,儘管可以用大模型上手機來類比,但也有不同之處。“其實衛星上和地面上的東西,差別主要在於以下兩個問題:一是外太空的射線問題,它造成了一些電子設備要加固才能使用;二是功耗問題,地面上可以狂堆硬件,大力出奇跡,但衛星供能主要靠太陽能電板,就意味着有一個上限。”沙愛軍表示。

據沙愛軍透露,FPGA芯片是目前提供星載AI算力的硬件主流,而把地面常說的CPU、GPU上載衛星是一個趨勢。他表示,國外有幾家做星載計算的創業公司,員工規模都不大,可能全部約有五六人,做法基本上都是在英特爾這些公司的AI芯片基礎上進行加固或封裝,將其變成一個標準件,再出售給衛星公司用。

比如,如果一家做材料的公司,能夠把電子屏蔽做得很好,把英偉達的GPU進行封裝,然後用衛星送到太空去。

就大模型而言,沙愛軍認爲遙感這個領域其實有大量的開源模型可以借鑑,包括多模態大模型。“遙感要解決的問題就幾個:一是目標識別,二是分類,三是變化的識別。”他指出,只要有大量的樣本數據,目標識別就能做得好。

至於衛星上爲什麼要用大模型?沙愛軍表示,衛星遙感這個領域肯定逃離不了對大模型的需求,而衛星的自動駕駛和地面信息採集時的信息提取,是他認爲最可能落地的兩個場景。

2023年12月,一些科研院所和商業航天公司陸續推出人工智能遙感大模型,引發業內關注。2023年,中國科學院空天院發佈了Satlas模型,復旦大學也發佈了GRAFT模型,模型的數據和參數的規模越來越大,性能越來越強。

在今年的世界人工智能大會(2024 WAIC)上,螞蟻集團遙感大模型負責人王劍介紹,螞蟻集團基於螞蟻百靈大模型平臺,已經研發了20億參數多模態遙感模型SkySense。通過在數據、模型架構和無監督預訓練算法等方面的技術創新,SkySense在土地利用監測、地物變化檢測等7種常見遙感感知任務上可以貢獻技術能力。

從遙感模型的發展趨勢來看,呈現出三大趨勢:從支持單模態的數據到融合多模態的數據;從只能覆蓋單一數據源的影像到可以融合多數據源的影像;從僅支持單張靜態影像的解譯到融合整個時序影像的信息。

沙愛軍指出,雖然業界現在都在說衛星+大模型,但有真正投入的可能不多。在他看來,這種投入關鍵在於有沒有壁壘優勢。“做的時候要找到哪些東西是可以做,有些壁壘很容易被大公司打破。我覺得最重要的可能就是數據的壁壘、樣本的壁壘,這纔是最核心的部分。”他以自己的從業經歷來說,很多衛星公司掌握大量數據,但只是把數據存在數據庫裡,並沒有把數據進行清洗或標註,“數據能不能成爲一一對應的樣本,掌握數據和掌握樣本不是一個概念”。