理想7月內全量推送無圖NOA!端到端+VLM全新自動駕駛技術首發

智能駕駛帶動了全國範圍內大大小小的試驗園區,產生了龐大的產業。智能駕駛代表着頂尖科技人才的聚攏,也代表吸引資本的寵愛,車企不斷推高智能駕駛的聲量,誰的聲音大誰就享有相當可觀的話語權。

然而一個新興產業的興衰,顯然不是用戶最關心的,甚至有用戶會反感這門大生意。

那麼問題來了,如何一邊抓產業,一邊抓住用戶的心?

關於部分人羣對智能駕駛的反感,一線主流智能車企似乎已經找到了完美的解決之道:把智駕與主動安全進行綁定。

這種綁定並非表面文章,例如智駕領域不斷升級的AEB,或者針對“前車消失場景”研發的主動避讓,都是在解決安全問題,而非炫技。

早期,智駕一線隊伍中並沒有理想汽車。而今,時機似乎已然成熟,理想All-in的態度也拿出來了。

「無圖NOA」全量推送

7月5日,理想汽車召開2024智能駕駛夏季發佈會,宣佈於7月內向理想AD Max用戶全量推送「無圖NOA」,並打出“全國都能開”的Slogan。此外,推送功能還包含全自動AES自動緊急轉向、全方位低速AEB自動緊急制動。

同時,理想汽車發佈了基於端到端模型、VLM視覺語言模型和世界模型的全新自動駕駛技術架構,並開啓新架構的早鳥計劃。

5-6月期間,「無圖NOA」已經陸續展開體驗,規模陸續擴大。

事實上,對於理想智駕部門的技術控來說,“無圖NOA”並不是一個貼切的功能描述,而在行業中這個詞彙已經普及,再創一個新名稱的意義也就不大了。

無圖NOA不再依賴數月更新一次的高精地圖,支持在全國範圍內廣泛的區域使用,藉助理想的時空聯合規劃能力,絲滑的繞行體驗讓人印象深刻。無圖NOA具備超遠視距的導航選路能力,具備分米級微操能力(例如主動避讓),能夠適用於複雜路口。

另外,即將推送的AES自動緊急轉向可實現全自動觸發,不依賴人工輔助扭力;全方位低速AEB再度拓展存在主動安全風險的場景,能夠減少低速挪車場景下的剮蹭事故風險。

發佈會中,理想汽車產品部高級副總裁範皓宇表示:

“理想汽車已經在全國各城市積累了超100萬公里的無圖NOA行駛里程,全量推送後,24萬名理想AD Max車主都將用上當前國內領先的智能駕駛產品。”

接下來,無圖NOA將主要在4項重大能力方面進行升級。

首先,基於感知、理解和道路結構構建能力的提升,無圖NOA能夠擺脫對先驗信息的依賴。全國範圍內,導航覆蓋的區域均支持NOA,衚衕窄路和鄉村小路也可以開啓功能。

其次,基於“時空聯合規劃”,車輛對道路障礙物的避讓、繞行將更加絲滑。通過持續預測與他車的空間關係,時空聯合規劃能夠規劃合理的可行駛軌跡。基於海量樣本學習,系統能快速篩選軌跡,果斷且保證安全地執行繞行操作。

複雜城市路口場景下,無圖NOA的選路能力也得到顯著提升,基於BEV視覺模型+導航匹配算法,系統支持實時感知變化的路沿、路面箭頭標識、路口特徵,並將車道結構和導航特徵充分融合。

通過激光雷達+視覺融合,系統可識別更大範圍內的不規則障礙物,感知精度也更高,從而對其他交通參與者實現更早、更準的預判。車輛能與其他交通參與者保持合理距離,加速減速的時機也將更加得當。

主動安全不分,理想汽車建立了完善的“安全風險場景庫”,根據頻次和危險程度進行分類,以提升風險場景覆蓋度。

車速度較快時,主動安全系統的反應時機很短,部分情況下即使觸發AEB也難以及時剎停。爲了應對AEB無法規避的“物理極限場景”,理想推出了全自動觸發的AES自動緊急轉向。

針對泊車和低速行車場景,全方位低速AEB能夠提供360度主動安全防護,在相對複雜的地庫環境,全方位低速AEB能夠有效識別前、後、側向的碰撞風險,及時緊急制動。

端到端模型+VLM視覺語言模型

全新的智駕架構由端到端模型、VLM視覺語言模型和世界模型共同構成。

端到端模型主要用於處理常規駕駛行爲,傳感器輸入到行駛軌跡輸出,只經過一個模型,信息傳遞、推理計算、模型迭代更高效,駕駛行爲也更擬人。

VLM視覺語言模型具備強大的邏輯思考能力,能夠理解導航地圖、複雜路況和交通規則,以應對未知場景。同時,系統將在基於世界模型構建的場景中進行學習和測試。構建的測試場景,既符合人類世界的真實規律,也具備強大的泛化能力。

理想汽車的全新智駕駛技術架構,一定程度上受到諾貝爾獎得主丹尼爾·卡尼曼的「快慢系統理論」啓發,善於模擬人類的思考與決策,形成更擬人的解決方案。

新架構分爲快系統與慢系統:

快系統:善於處理簡單的任務,類似人類的直覺,應對覆蓋95%的常規場景。

慢系統:類似人類深入的理解與學習,形成複雜的邏輯和計算,用於解決複雜未知的5%場景。

快系統與慢系統配合,確保大部分場景下的高效率,和少數場景下的高上限。

端到端模型的輸入,主要由攝像頭+激光雷達構成,多傳感器特徵經過CNN主幹網絡提取融合,投影至BEV空間。

理想汽車還設計了“記憶模塊”,具備時間+空間維度的記憶能力。模型輸入中,理想還加入了狀態信息和導航信息,經過Transformer模型的編碼,結合BEV特徵共同解碼,得出通用障礙物、動態障礙物及道路結構,規劃出行車軌跡。

多任務輸出在一體化模型中實現,中間沒有多餘的規則介入,端到端模型在傳遞信息、計算推理、模型迭代方面均具有優勢。實際駕駛中,端到端模型能夠展現出更強的超視距導航能力、道路結構理解能力、通用障礙物理解能力,以及更加擬人化的路徑規劃能力。

理想的VLM視覺語言模型的參數量達到了22億,對複雜交通環境有強大的理解能力。

VLM模型能夠識別光線強弱、路面平整度等信息,還能夠配合車機系統修正導航路線。VLM模型能理解公交車道、潮汐車道等複雜規則,以作出合理決策。

理想的世界模型結合了重建和生成兩種技術路徑,將真實數據通過3DGS進行重建,並使用生成模型補充新的視角。

場景重建時,動靜態要素被分離,靜態環境重建、動態物體進行重建和視角生成,經過場景重新渲染形成三維世界。生成模型具有強泛化能力,車流、天氣、光照等條件均支持自定義改變,生成符合真實規律的新場景。

重建和生成兩者結合所構建的場景,爲智駕系統的學習和測試創造了更好的環境,使系統具備高效的閉環迭代能力。

1

自從“自動駕駛”的概念被車企擺上高位,公衆對這個技術領域的爭議就從未停止。

激進的人羣認爲,智能科技將以手機淘汰膠捲的姿態改變汽車,而保守的人羣糾結於出了問題究竟是車負責,還是人負責。不論如何,人工駕駛或自動駕駛都存在風險,後續自動駕駛的字眼也逐漸淡出視野,普遍已經演化成今天的智能駕駛、智駕等詞彙。

以往,智駕是一門燒錢的大工程,從某種程度來說,智駕投資甚至是一家車企的廣告費,是搶市場、卷同行的武器。不過智能電動汽車行業已經颳起一股新風,被逐漸納入主動安全的智能駕駛也越來越具備親和的一面,相信以後大家越來越不會討厭智駕這件事。