這一次視覺智駕是不是真的可以把激光雷達幹掉了?
從激光雷達路線轉型到視覺路線,感知能力反而大幅提升,小鵬視覺智駕進化的秘訣就在於雲端大模型和LOFIC架構的落地。而隨着造車成本的下降,性價比優勢顯然會推動更多的主機廠跟隨加入,視覺智能有沒有可能超越雷視融合方案成爲市場主流,小鵬P7+的市場表現十分關鍵。
文丨智駕網 金山、李木魚編輯 | 浪浪山與明知山
儘管路上配備激光雷達的車輛越來越多,但加入視覺感知路線的玩家陣營正在更具規模化。
今年夏天何小鵬在美國體驗了一輪特斯拉的FSD之後,宣佈將小鵬的雷視融合智駕方案全面切換到視覺感知路線。
所謂全面,即是未來小鵬新推出的車型都不再配備激光雷達。
這與部分品牌將視覺智駕做爲智駕的低配方案完全不同。
01.視覺智駕的陣營正空前強大
做爲小鵬未來十年的開山之作,小鵬P7+成爲小 鵬AI鷹眼視覺方案落地的首款車型。
小鵬汽車成爲繼特斯拉、極越之後,第三個高調宣佈僅採用視覺感知智駕的智能汽車品牌。
而在此之前,蔚來樂道品牌的首款車型L60,以及智界S7、新問界M5(參數丨圖片)、深藍S07都推出了基於華爲乾崑ADS SE系統的視覺感知智駕系統。
而在供應商層面,華爲乾崑、百度阿波羅、大疆車載、商湯絕影、智駕科技MAXIEYE、Nullmax都是視覺感知智駕技術的供應商。
而在10月11日特斯拉發佈的無人駕駛出租車Cybercab也是一款“不需要激光雷達做感知冗餘”的L4級無人駕駛車輛。
儘管多家智駕科技公司曾向智駕網表示,視覺感知就是無人駕駛的終極解決方案,但激光雷達做爲感知冗餘配置在L4、L5級無人駕駛車輛上的配置還是不可取代的,但馬斯克對於Robotaxi上能過視覺方案實現完全自動駕駛的路線非常有信心:“使用AI和計算視覺,不需要昂貴的設備,就可以在無監督的情況下實現FSD。”
這無疑進一步提振了視覺感知派的信心。
那麼視覺感知路線真的能實現其所宣稱的能力嗎?鑑於特斯拉的FSD尚沒有明確的入華時間表,國內能驗證視覺智駕天花板的就是小鵬P7+。
當下無論是樂道L60還是鴻蒙智行系的智界S7、新問界M7在城市高階智駕方面宣稱的皆是快速路NOA,小鵬P7+則是直接面向城市所有場景的NOA。
日前智駕網在廣州市區,特別是在夜間場景 體驗了小鵬P7+,這款車在掉頭、無保護左轉、緊急避讓逆行車輛、臨時變道等場景表現出極強的超越人類駕駛員的能力。
在夜間模式下,小鵬P7+對目標物的識別,道路狀況的分析做到了與白天幾無差別的自動行駛。
廣州做爲小鵬汽車的大本營,可以想象小鵬汽車對這座城市的道路信息十分熟悉,但即便如此,這樣的驚豔表現依然讓人相信,視覺感知智駕的上限對於激光雷達已沒有不得已的依賴。
那麼小鵬視覺智駕是如何克服傳統的攝像頭對陰暗、逆光、靜態物場景等的應對,實現全場景、隨時隨地開啓的?
綜合來看,小鵬的視覺智駕能力是新技術應用的結果。
1、在硬件上保證算力和感知冗餘:2顆英偉達Orin-X智駕芯片,算力爲508TOPS,攝像頭達到了11顆,多於傳統的7顆;
2、端到端的雲端大模型,依託強大的雲端算力,增強了智駕系統對道路場景的理解能力,判斷時間更短,更能應對突發狀況;
3、新技術架構LOFIC架構大大提升了攝像頭的全場景感知能力,讓智駕看得更清晰、更準確。
小鵬P7+的技術工程師向智駕網表示,視覺感知路線不僅省掉了激光雷達的成本,在決策效率上也要更快,因爲省去了激光雷達感知信息的融合過程。而從人類駕駛的形式來看,也不需要雷達來輔助,所以在技術上只要擁有了足夠強大的視覺感知能力,就可以實現高階智駕,級別甚至可以達到L4級。
在10月24日的小鵬的“1024科技日”,小鵬汽車的智駕團隊詳細解釋了AI鷹眼視覺方案的兩大核心技術,雲端大模型和LOFIC架構方案。
02.雲端大模型加持,視覺感知能力進化
按照小鵬官方的說法,在採用了雲端大模型之後,訓練效率已提升了2.6倍,2025年小鵬雲端的算力將會達到10EFlops以上。
基於這個表現,小鵬高層判斷:自動駕駛的新一輪競爭正在雲端展開。
小鵬汽車副總裁、自動駕駛負責人李力耘表示,目前行業有三種主流的端到端發展路線:
一種是通過大量規則小模型堆疊的 “大模型”,其需要大量的優秀規則工程師;
一種是“車端大模型”,即直接將端到端模型部署於車輛上,雖然見效快,但受限於車端算力,且隨着後期訓練數據量的增加,容易陷入瓶頸;
最後一種便是雲端大模型,其參數量是車端模型的幾十倍甚至數百倍,這是單純的車端大模型所不可企及的。
李力耘表示,前兩種端到端的技術路線都能帶來一定成效,但云端大模型纔是制勝關鍵,小鵬雲端大模型的參數量將多達車端參數量的80倍,雲端大模型能夠全面吸納智駕數據,不遺漏重點信息細節。通過大參數量的訓練,能夠儘可能地窮盡智能駕駛中的長尾問題,以覆蓋更多駕駛場景,使XNGP實現L3級的智駕體驗。
李力耘提到的所謂“長尾問題”,就是指在自動駕駛過程中那些發生概率較低、但種類繁多的特殊場景所帶來的潛在風險。
當下,目前自動駕駛的底層架構和大部分技術問題已解決,但剩下的約5%的長尾問題成了關鍵。
這些問題涵蓋各種零碎、極端的情況和難以預測的人類行爲,例如:帶有凸出貨物的卡車、打傘的行人、倒在路中央的樹木,以及異形車輛、亂穿馬路的行人和自行車、雨雪等極端天氣、極暗的行車環境等。
自動駕駛依靠攝像頭、激光雷達、毫米波雷達等傳感器感知環境並做出決策但這些傳感器在某些情況下存在侷限。例如:
在惡劣天氣中可見光攝像頭可能衰減直至失效,
超聲波雷達在遠距離探測精度較差,
激光雷達在雪天和風沙天易受影響,在對向眩光、陽光及信號干擾、黑夜無燈路段等情況下也會出現不同程度的問題。
導致長尾問題的本質其實是信息不足,解決方法就是從補充信息的角度去處理。
根據官方數據,小鵬雲端大模型可極致發揮攝像頭高信息量輸入,8倍提升有效視覺信息量。相較於激光雷達方案,AI鷹眼視覺方案的攝像頭信息量是前者的80倍,而攝像頭能夠感知的語義和顏色信息是其100倍,攝像頭的反應速度也是其3倍。
這些數據表明,在擁有云端大模型加持之後,其視覺感知能力已經遠遠超越了激光雷達,因此也就不再需要它的輔助。
系統通過視覺感知方案獲得了更多的信息量,長尾問題的解決也就更加高效和可靠。
可以說,這正是現階段視覺感知技術開始呈現超越激光雷達感知能力的基礎。
李力耘表示,對於輕雷達、輕地圖的智駕方案而言,高算力大模型既是基礎也是門檻。
他表示,小鵬的雲端大模型是國內首個泛機器人領域的基礎大模型,不僅可以應用在自動駕駛領域,機器人、飛行汽車等領域均適用。 它 讓小鵬成爲了全球唯二能做到不依賴高精度地圖、激光雷達,實現用一套軟件適配全車系的車企。
按照官方公佈的規劃,小鵬P7+及後續車型也因此不再區分Max和Pro版本,全系都能標配AI智駕。
03.LOFIC架構落地,AI鷹眼視覺方案實力倍增
在談及由小鵬P7+首發搭載的AI鷹眼視覺方案時,官方特別強調了其採用了行業首個單像素LOFIC架構方案。
這一技術的優勢,是在逆光、大光差、暗光等環境下的信息採集能力更強。並且該架構方案的視覺感知範圍也更大,達到了1.8個標準足球場,甚至能夠清晰分辨顏色、文字等語義信息。
LOFIC技術的全稱是“Lateral overflow integrated capacitor”,即橫向溢出集成式電容技術,這項技術的誕生是爲了滿足CMOS圖像傳感器對高動態範圍的需求。
CMOS圖像傳感器的動態範圍越高,視覺感知系統就能“看得更準更清晰”。
CMOS的成像原理主要是通過把光線轉換成電荷,進而形成畫面,如果我們用一個“桶”來承載單個像素所轉換出來的電荷,那這個桶能容納電荷的多少就決定了這個像素成像的明暗細節程度。如果桶裡是空的,那此時的畫面就是全黑的,也就是曝光不足;如果桶裡的電荷數量多到溢出了桶外,那這時的畫面就是一片白色,也就是曝光過度。
在LOFIC技術出現之前,要提高動態範圍有許多方式,例如多次曝光或大小像素等。
據小鵬工程師介紹,之前的視覺技術是同步記錄兩張圖像,一個曝光比較亮的,一個曝光比較暗的,之後通過算法將二者進行合成,從而構成完整的感知圖像。這樣做的缺點,是遇到運動速度比較快的目標物時會有延遲,並且有色彩串擾和產生閃爍等問題。
▲圖片來自:3d tof的《HDR技術詳細解析》
LOFIC技術的原理,就是對承載電荷的“桶”進行擴容,LOFIC電容用於收集橫向溢出的電荷。當電荷數量超過像素CFD原本能承載的最大限度,多餘的電荷就不會溢出損失掉,而是會流到相鄰的“桶”裡。之後通過讀取“桶”裡的電荷,再結合數字算法技術,就能夠獲得更高的動態範圍,成像也就更加細膩、清晰。
而這也是小鵬宣稱LOFIC架構方案信息採集能力更強、感知範圍更大,能夠清晰分辨語義信息的原因。
04.視覺智駕的更大優勢是降低了造成成本
在有了雲端大模型和LOFIC架構加持之後,智駕網在實際路測過程中,真實感受到了AI天璣5.4.0系統的智駕能力。
當然試駕車輛和量產落地車輛的技術表現可能存在一定的變化。
在 小鵬汽車發佈的數據顯示,AI天璣5.4.0系統的“擬人性”提升了4倍,變道成功率提升了53%,繞行成功率提升了155%。
但我們的真實感受是,這一系統與當下衆多采用雷視融合方案的城市高階智駕相比沒有短板,甚至超過不少一線陣營的體驗。
而這一系統的另一優勢,在於大大降低了造車成本,讓小鵬汽車在市場上更有性價比優勢。
這讓何小鵬敢於在這款車上全系標配這一功能,而不再區分所謂的Pro、Max等版本。
據瞭解,小鵬P7+是小鵬汽車首款實現技術成本降低25%目標的車型,預計其利潤率將達到兩位數。而此前何小鵬曾透露:“投資人希望這款車的毛利率到20%。”
而隨着造車成本的下降,其強大的性價比優勢顯然會推動更多的主機廠跟隨加入,視覺智駕有沒有可能超越雷視融合方案成爲市場主流,小鵬P7+的市場表現十分關鍵。
【關注智能駕駛,關注智駕視頻號】
關注汽車的智駕時代上智駕網(http://autor.com.cn)合作or新聞線索提供,聯繫郵箱:editor@autor.com.cn