對話理想智駕郎鹹朋、賈鵬,一個後進生,怎麼提前交卷了?

智能駕駛,一場昂貴的競賽開始。決定排位、決定未來。文丨程曼祺 竇亞娟編輯丨宋瑋先後任職於特斯拉和小鵬的谷俊麗博士說,中國智能駕駛研發進度至少落後特斯拉 1.5 -2 年。理想智駕副總裁郎鹹朋認爲,差距沒那麼大,產品體驗上理想最多落後半年。理想強調自己做智駕的優勢是車多、數據多,小鵬創始人何小鵬則說:“如果有人說它有很多車、很多數據” 就能做好自動駕駛,“千萬別信,絕對是胡扯”。價格戰還在燃燒{出處:wuhan.heyiyushi.com},中國汽車新勢力們又集體擠入了一個新戰場——智能駕駛,充滿分歧、爭議、你追我趕。不是所有車企都買得起這張入場券。智能駕駛 30 億研發投入起步,逐年遞增。理想說,現在一年租卡要 10 億人民幣,將來要 10 億美元。新勢力如此瘋狂、不甘落後,是因爲他們看到了特斯拉 FSD V12(特斯拉 2024 年 1 月開始大規模推送的完全自動駕駛新版本)的巨大進步,也看到了智駕能力對消費決策的影響。去年 9 月,華爲宣佈年底推出全國都能開的無圖方案,問界同期圍繞智駕猛烈宣傳。短短一個月,一直徘徊在數千銷量的問界月銷量破萬,年底更是衝上 3 萬大關。在華爲宣佈激進智駕計劃不久,理想召開 2023 秋季戰略會,明確智能駕駛是核心戰略,絕不能輸。CEO 李想說,“2024 年要成爲智駕的絕對頭部”。此後,理想加速迭代,雙線並進:一邊使用 NPN(Neural Prior Net,先驗神經算法,使用部分道路和地圖的先驗信息,幫助識別道路特徵,減少對高精地圖的依賴),終於趕在去年底開了百城 NOA;同期從去年 10 月預研無圖 NOA,四個月後開始千人內測,今年 7 月全量推送。來到今年夏季,沒有喘息時間,新勢力們投入下一場戰役:端到端(end to end),一個大部分消費者不明就裡的技術術語,成爲兵家必爭之地。端到端的意義在於,它讓智能駕駛研發進入了 AI 時代——不再依賴大量人工編程,只要用更多數據訓練模型,系統就會不斷變強,表現可能超過人類司機。馬斯克認爲,這讓人類離完全自動駕駛近了一大截。理想在本週開啓了 “端到端 +VLM(視覺語言大模型)” 新架構的千人內測,稱這是更先進的 one model 和全球首個雙系統落地。One model 指自動駕駛的感知和決策模塊都由一個模型完成,輸入的是傳感器數據,輸出的是駕駛軌跡。自動駕駛有感知、規劃與決策和控制三個模塊,靠感知 “看”,靠決策 “思考” 怎麼開車,靠控制模塊完成駕駛行爲。端到端技術就是從感知到決策,整個過程都用一個大模型實現。這前後,蔚來 7 月初宣佈量產端到端 AEB(緊急制動功能);小鵬本週重申自己是全球唯二實現端到端大模型量產落地的車企,另一家當然是特斯拉。如果算上供應商,今年還有華爲與 Momenta 完成了端到端上車。[圖文:wuhan.kmlssmyxgs.com]理想 2021 年纔開始自研智能駕駛,比蔚來、小鵬晚兩年。理想目前的進度,就好比一個後進生突然知道了答案,然後提前交了卷。在這個時刻,我們對話了理想智能駕駛副總裁郎鹹朋與理想智能駕駛技術研發負責人賈鵬。他們解釋了這一切是如何實現的。郎鹹朋是一位愛用希臘神話命名關鍵項目的智駕一號位,一位模式識別與智能系統博士。他在理想完成的戰役包括 “衛城”“伊利亞特”“泰坦”。2018 年,郎鹹朋從百度加入理想任自動駕駛總監,後晉升副總裁。【來源:wuhan.boloth.com】賈鵬是一位年輕的技術研發負責人,曾是英偉達中國第一批做智能駕駛的人。他看到這家芯片巨頭最早提出了自動駕駛的端到端、大模型,但發現只有車企才能把這些真正落地。全力投入端到端的各家公司,路線表述和進展不盡相同,但共享一個野心、一個技術方向:最終實現 L4 級自動駕駛。我們看到今天關於智能駕駛、端到端的狂熱,既是因爲技術信仰,也是爲了競爭,爲了用戶心智和銷量榜。這是一場昂貴的競賽。代價不僅是招人、買 GPU、訓練模型的鉅額開支。在 L4 真正實現之前,坐在司機位置的還是人,安全、可靠、穩定,這些纔是用戶對當前智能駕駛的檢驗標準。後進生交卷《晚點》:理想 2021 年纔開始自研智能駕駛,比小鵬、蔚來都晚,一直是追趕狀態。直到今年,直接從 NPN 切到無圖 NOA,再到本週端到端開始千人內測。有人評論說,怎麼後進生突然就提前交卷了?郎鹹朋:可能是屌絲逆襲。我們去年一年就做了三代,從有圖到 “先驗信息” NPN,到無圖,都在做。今年 6 月又把端到端架構驗證出來,同時還提出了快慢系統架構,快系統是端到端,是面對日常駕駛快速處理信息的能力;慢系統是 VLM (視覺語言模型),是面對複雜場景的能力。而且我們的端到端是 one model,輸入是傳感器,輸出是行駛軌跡,全部由一個模型實現,中間沒有任何規則。除了特斯拉,其他整車廠都只是在某個環節實現端到端。《晚點》:你們的第一個關鍵進展——從 NPN 方案到無圖,去年 10 月開始驗證,今年 2 月內測,7 月就全量推送了。只用了 4 個月時間就切換完成,聽上去很不可思議,怎麼做到的?郎鹹朋:我們就是比別人效率高、速度快。比如中間省了很多的決策流程。從決定要做,到定方案,到把團隊拉起來,可能也就一週時間。如果是傳統車企,也許項目啓動就要 3 個月,《晚點》:你們爲此捨棄了什麼?郎鹹朋:可能是個人的休息吧。大家都知道公司的目標,我們沒有任何退路。賈鵬:也習慣了。我 2020 年從英偉達離職加入理想,一直以來我們面臨的環境就是——我們是個後進生,天天被家長罵。《晚點》:這個家長是李想嗎?賈鵬:是用戶。《晚點》:看起來你們智駕技術路線的方向很清晰——就是學特斯拉,那具體是怎麼學的?郎鹹朋:大家會認爲技術研發需要時間,但往往需要的不是研發時間,而是試錯時間。特斯拉確實是一個很好的標杆,他試錯走不通的地方,我們就不走了。特斯拉 FSD 的演進和迭代讓我們看到了無圖也能成功。選 NPN 還是無圖?既然特斯拉跑出來了,那我們就選無圖,所以我們幾個月就實現了切換。但特斯拉對我們最大的啓發,還是在於怎麼去走自動駕駛研發從 0 到 1 、從 1 到 10 的階段。特斯拉最早也是用供應商 Mobileye 的方案做智能駕駛,很快發現供應商不能滿足它的要求,所以從 2016 年開始自研,中間經歷一個震盪期,最終達到了 Mobileye 的效果。2019 年,它自研 FSD 芯片,有硬件來支撐它做 AI 的研發,此後就是端到端的出現,它本質上是用 AI 的能力來做智能駕駛。《晚點》:V12 的核心是端到端,事實上特斯拉 2023 年初推送的 V11 版本就實現了無圖,當時你們爲什麼不直接學呢?郎鹹朋:這就像大家都覺得高數很重要,但你要不會四則運算,怎麼能學好高數?我和吳新宙(前小鵬智能駕駛負責人)也交流過這一點。我們都認爲整個過程可以加速,但不能跳過。大家都在做端到端,但從有圖、NPN、無圖到端到端,每一步都不能省。跳過這些步驟,實際上你跳過了很多技術的理解。如果去年下半年我們不試圖做百城 NOA,那我們對於 NPN 跑不通就不會有這麼清晰的認識。僅從規模看,全國高速只有三四十萬公里,但城市有幾百萬公里,要想全國都鋪開,這個圖根本做不完。《晚點》:但你之前說,大的判斷不是能不能的問題,而是敢不敢做的問題。郎鹹朋:也不是不能做,如果真要做,就是打資源戰。反正要搞就是上千人去鋪規模。賈鵬:我們內部開玩笑,說這條路最後會把自己做成一個地圖公司。《晚點》:那後來加速靠的是什麼?郎鹹朋:組織效率一直是理想的優勢。從 NPN 到無圖,再到端到端,這幾次都是很大的切換,但我們說切就切了。研發和交付的配合效率很重要,技術要突破上限,難的是做選擇,但做完選擇後,交付要負責提升下限。去年下半年公司戰略會,李想明確提出 RD(研發)和 PD(量產交付)一起做,研發思路明確後,我們團隊內部永遠都有 PD、RD 兩條線。去年 11、12 月做無圖,到今年 1 月,差不多可以交付了, RD 立刻轉 PD,2 月先給 5.1 版本,繼續交付,到現在 5.2 版本,然後 Beta 1、Beta 2、Beta 3,把它打磨好。賈鵬:我認爲是快速試錯。我們的流程是:找一個封閉區域,短時間來驗證範式,先達到這個範式能達到的上限,一個區域跑通就立馬往外擴,同步加上安全兜底策略,之後慢慢鋪開。全國去試這個範式是不是 work,不 work 就迅速加數據、改策略。到產品驗收環節,從鳥蛋到早鳥到千人內測,我們讓用戶和我們一起去做產品的測試和迭代。《晚點》:聽起來很冒險,你們當時怎麼就確定用這個流程就一定能跑通?郎鹹朋:風險很大,但我們一直是這麼過來的。我們第一款車理想 ONE 用了 Mobileye 的智駕方案。後來做理想 ONE 改款快交付時,Mobileye 說不合作了,不能給白盒交付。那時已經是 2021 年,我們認爲如果這時候還不掌握輔助駕駛技術,肯定不行。所以做了一個艱難的決定——自己做。如果做不出來,那是我們能力差。但如果說今天慫了,還是用了供應商,那我們可能就沒有將來了。我們 “被迫” 摸索出一條很不一樣的研發流程, 5 月交付,3 月必須出原型,到 2021 年 5 月 25 日,理想 ONE 發佈會前一天,我們還有一堆 bug 沒解,發佈會當天上午才最終改完。這就是我們現在流程的雛形:先小面積驗證,然後提升能力、修補 bug、穩定質量。當時團隊只有 100 人,第一個月就走了 40 人。有人跟我說,“別人用一、兩年才能交付的東西,憑什麼我們三個月就能交付?你不要自欺欺人。”《晚點》:同樣是無圖,小鵬去年開城速度比你們今年慢,測試人員更多,小鵬說每去一個地方開城,都要實地測試至少四輪,這才能保證安全,不給用戶開盲盒。你們這套快速研發、交付,再從鳥蛋到千人內測的方法,怎麼保證安全?郎鹹朋:現在自動駕駛系統的評測方式跟之前很不一樣。之前的智駕,先設計功能再研發,要一項項測試功能來驗證。而現在數據驅動的自動駕駛,是以能力而不是功能爲核心,“能力” 只能通過 “考試” 來評估。我們用世界模型 + 影子模式來考試。世界模型重建和生成真實場景,車在裡面跑,相當於模擬考,評估研發過程中的能力。通過模擬考試後,我們用早鳥 、內測車輛,影子模式做實車考試,[圖文:wuhan.acp876.com]如果考不過,就持續迭代,直到通過爲止。《晚點》:如果命題作文有答案,那理想能跑得比別人快,但答案不會永遠有,多數技術問題可能是開放式問題。郎鹹朋:大家今天看到的是所謂命題作文我們追趕速度比較快,但追上之後我們可能更快,因爲整個體系搭建起來了。不是說我們 2021 年纔開始自研,就可以交付比同行差的產品。從我們交付的第一天開始,就要跟班上最優秀的學生去比成績。這也意味着,如果用對方的學習方法去學,我一定學不過他。所以我們就是要用自己的方式做事。瀕臨無人區《晚點》:端到端不是新概念,英偉達、Waymo 幾年前都提出過端到端,但爲什麼把這件事做成並推廣的是特斯拉?賈鵬:因爲它既提出了技術的思路,又給大家看到了使用效果。郎鹹朋:特斯拉的很多人是因爲相信纔看見,但更多人是因爲看見才相信。《晚點》:如果沒有特斯拉在前面探路,理想會落後更長時間嗎?郎鹹朋:算法上我們是晚,因爲原先條件不足、資源不夠。但數據積累和研發體系建設上並不晚,所以才能趕上。從一開始,我們就清楚特斯拉的理念——數據驅動是對的,那我們就按照它來搭建研發底層。在 2019 年第一代理想 ONE 上,我們做了數據閉環系統——波塞冬,一套採集、挖掘、標註、訓練數據的工具鏈。我們當時沒有資源自研,但也在 Mobileye 的攝像頭旁邊多放了一個攝像頭,這就是來收集和分析問題的。舉個例子,路測遇到問題,傳統方法是隨車人員記下來,再開到同樣場景復現。我們是遇到問題,數據能同步回到後臺了,測試還沒結束,數據已經被分析,甚至問題已經開始被解決。傳統企業要幾天甚至一週做的事,我們可能一小時就完成了。數據積累上,理想用戶使用自動駕駛的總里程數已經超過 20 億公里,其中近 10 億公里是用的 NOA。特斯拉做得早,保有量也更大,里程數更長。《晚點》:這更多是李想的堅持,還是你的?郎鹹朋:我們是一致的。我 2018 年來理想面試時李想問我,最終實現 L4,要解決的最主要問題是什麼?我說是數據——沒有數據閉環體系,不管是樣本還是問題,分析效率都不高。人可以挖,算法可以搞,但數據問題不解決,一定做不好。《晚點》:蔚來前不久剛量產端到端 AEB;小鵬本週開發佈會說它們是全球唯二自研量產端到端的車企,另一家毫無疑問是特斯拉。各家的端到端到底有什麼區別?賈鵬:目前有公司的架構跟我們 7 月剛全量推的無圖類似,感知是一個模型,決策是一個模型,中間再串起來,他們剛把這事做完。也有公司已經發布的也是分段的端到端。特斯拉則是從感知到決策都是一個模型。而我們的最新版本也實現了將感知到決策融合成一個模型,本週已經開啓了千人測試。《晚點》:感知、決策 one model 的端到端和分段式端到端的區別是什麼?是誰比誰更領先嗎?郎鹹朋:還是看目標是什麼,分段式更適合 L2 + 級輔助駕駛,one model 才真正可以做 L3、L4 級自動駕駛。因爲分段端到端雖然在決策模塊內部用數據驅動取代了一些規則,但整個流程裡還是有規則,本質上和以前的智能駕駛架構類似,研發流程也類似,仍然分模塊。而 one model 裡不含任何規則,傳感器數據進來,規劃軌跡出來,是純數據驅動。《晚點》:可否一句話解釋下端到端的最大價值是什麼{出處:wuhan.jhcyyqzs.com}?賈鵬:從用戶角度,駕駛行爲更像人了,細節操控更絲滑。研發上看,迭代效率更高。郎鹹朋:端到端是第一次用純數據驅動來做自動駕駛,研發方式從以功能、場景出發變成了提升系統能力,真正進入了人工智能時代:只要讓系統不斷變強,它就會有超出預期的表現。《晚點》:如何用更短時間訓練出一個更聰明的模型?賈鵬:數據,尤其是優質數據很重要。我們從 80 萬車主的 200 億公里數據中篩出最好的數據,訓練了超過 100 萬公里的數據,年底超過 500 萬公里。第二是訓練方法,在模仿學習的基礎上,我們加了強化學習,讓模型知道什麼是錯的。郎鹹朋:最後是算力,理想有等同 5000 張 A100、A800 算力的 GPU。如果租卡,一年要 10 億,這需要健康的利潤來支持。《晚點》:你們反覆強調有數據所以能趕上,但本週何小鵬說,“如果有人說它有很多車、很多數據” 就能做好自動駕駛,“千萬別信,絕對是胡扯”。郎鹹朋:我們也希望大家能客觀地對待產品。但現在還處於愛迪生和特斯拉證明直流電好還是交流電好的時代,一個人把交流電用作電刑,另一個演示用交流電穿越人體也沒事。《晚點》:特斯拉的數據最多,算力投入也最大,這是否意味着它無法被超越?賈鵬:目前特斯拉的限制是硬件,因爲 HW 3.0(特斯拉第三代智能駕駛硬件)的算力是 144 TOPS,能支持的模型參數不會特別大,加太多數據,會出現 “災難性遺忘”。這也是爲什麼 V12.4 更新後,有些場景變好了,有些卻變差了,如空曠場景開始亂變道。《晚點》:但換一個角度來看,FSD 能夠在 2018 年上車的 HW 3.0 上絲滑跑起來,說明特斯拉軟硬結合的能力很強。賈鵬:確實很強。但我認爲 FSD 進入中國有挑戰。一是美國道路大部分相對簡單;二是特斯拉在美國能拿到道路拓撲信息,而這在國內是拿不到的。所以 FSD 其實是輕圖,而我們是真的無圖,沒有任何地圖先驗信息。《晚點》:今年 7 月,先後任職過特斯拉和小鵬的谷俊麗博士說,“特斯拉的研發進度領先國內智能駕駛 1.5-2 年”。你是否同意?郎鹹朋:不太同意。無圖版本代表了有規則的上限。端到端代表了數據驅動的上限,它中間沒有任何規則,就一個模型。但無圖、端到端都走不到自動駕駛,因爲它還是在解決長尾問題,沒遇到過的情況就處理不了。要走到 L4,必須讓系統學會處理未知場景。這個能力,我們認爲必須用 VLM 來解決,而不是端到端。所以我們的新架構是端到端 +VLM,前者是對應快思考的系統 1——處理要快速反應的大部分駕駛場景;後者是做慢思考和長時決策的系統 2——它能學到一些常識以應對未知情況,比如識別沒見過的非常規紅綠燈,各種形式的潮汐車道標識,學校周邊特徵等等,提前告訴車不能進入或要減速。系統 1 + 系統 2,理想是第一個做這個架構的。賈鵬:從公開信息看,特斯拉目前的技術架構沒有 VLM。《晚點》:英偉達和軟銀投資的英國自動駕駛公司 Wayve 今年 4 月發佈的 Lingo-2 ,也是在車端加入了語言大模型,你們是受 Wayve 啓發嗎?郎鹹朋:它沒有系統 1 ,Wayve 的 Lingo-2 和雲端模型都是多模態大語言模型,類似 VLM。它的思路是一個模型解決系統 1 加系統 2 。但在量產時會發現,Orin 的算力擺在那兒,支撐不了系統 2 的大模型。Wayve 能做,是因爲它不是量產車,在車後面背了一個服務器才能跑 Lingo-2。賈鵬:我們最早受的啓發是 Google 的機器人系統 RT-1 和 RT-2,它是一個 VLA(Visual-Language-action) 模型,最後行爲也是由模型輸出。它可能是一個終局:如果我硬件足夠好,理論上能把 VLA 跑到實時。《晚點》:所以靈感不來自汽車行業,來自機器人?郎鹹朋:因爲我們把自動駕駛看作一個人工智能的典型應用。這套雙系統方案實際是提出了一個通用具身智能架構,它在車上是自動駕駛,在機器人上就是智能機器人。《晚點》:你們提出的 “端到端 +VLM” 架構,前者來自特斯拉,【來源:wuhan.jymama.net】後者來自 Google RT 的啓發,而且 VLM 的論文還是和清華大學合作的。是否說明現階段你們更習慣組合創新?郎鹹朋:和清華趙行老師合作時,我們是觀點相互碰撞,也不是他提觀點,我們來實現。《晚點》:你們把自動駕駛視爲通用具身智能的一部分,它是否也有 Scaling Laws ,以及你是否相信 Scaling Laws?郎鹹朋:端到端的 Scaling Laws 不會特別明顯,因爲參數有限,可能千萬級數據就喂滿了,再加就開始遺忘,我們已經能從特斯拉 FSD V12.4 上看到這個現象。但 VLM 的 Scaling Laws 肯定存在,它可以做到幾百億甚至幾千億參數。只要數據夠多、參數夠大,性能就會漲。這條路對我們吸引力很大。【來源:wuhan.zjnblhkj.com】《晚點》:如果 VLM 能在車上跑得足夠快、延時足夠低,是否就不需要系統 1 了?{出處:wuhan.ddgz123.com}賈鵬:理論上是的。現在我們 VLM 在車上能做到 3.4 HZ(注:HZ 是單位時間內週期性事件發生的次數,數值越大,時延越小),它是一個 2.2B(22 億)參數的模型,但要能替代端到端,需要跑到十幾 HZ,對應 100-200 毫秒的時延,這是人的反應速度。某些場景對時延的要求還會更高,比如 AEB(緊急制動)。《晚點》:這套架構有多獨特?華爲也在講系統 1 和 2;小鵬的 “大語言模型 XBrain” 也是處理未知場景的,是否類似你們說的系統 2?郎鹹朋:我們是第一個在業界提出雙系統的;以及我們的 VLM 是在量產的車端芯片 Orin X 上部署,之前其它公司類似的嘗試是在工控機上。不管是 one model 的端到端還是 VLM,這個架構已經交付,在做千人測試了。《晚點》:你們也提到在做雲端的世界模型,這在整個架構中起到什麼作用?賈鵬:這是我們的系統 3。雲端世界模型做兩件事:一是 VLM 可以用雲端的世界模型蒸餾出來,就是先在雲端訓練一個超大模型,比如 Meta 最近發佈的 400 B 參數的 Lamma 3.1,再去蒸餾一個 8 B 的模型,這比從頭訓練 8 B 模型效果更好。二是世界模型可以考察系統 1、系統 2 的能力。我們在做端到端無圖的過程中發現全國驗證非常難,有 1000 萬公里的路,之前只能鋪人力去測。《晚點》:特斯拉也在研究世界模型。但行業需要這麼多世界模型嗎?畢竟我們只有一個世界。郎鹹朋:0 到 1 的過程中,會有很多路線和嘗試。就像我們也不需要這麼多電動車品牌,但高峰時有幾百家。《晚點》:之前行業內認爲中國智駕的排名是華爲、Momenta、小鵬、理想,這個排名什麼時候會改寫?以及下一個改變智駕排名的賽點是什麼?郎鹹朋:已經改寫了。再往後,各團隊都會到無人區:無圖解決了全國都能開,端到端會讓全國都能開得還不錯,那接下來就是 L4。量產 L4 到底怎麼做?一開始肯定是百花齊放,再收斂。但大家也不會再回到同一個起跑線,因爲數據和算力差距只會越來越大。覆盤理想智駕六次關鍵戰役《晚點》:聽說你很會給戰役取名。郎鹹朋:我們對待取名是認真的。智駕團隊打過六大關鍵戰役,第一戰是衛城計劃,然後是伊利亞特計劃和奧德賽計劃,荷馬史詩上下部;接着泰坦計劃、金蘋果計劃,泰坦之戰後,新神打敗了舊神。再到現在的達摩克里斯計劃,也就是端到端項目,這個項目有挑戰、很危險,如果做不好,達摩克里斯之劍會掉下來。《晚點》:每次戰役遇到的最大挑戰和收穫各是什麼?郎鹹朋:衛城計劃是我們第一個自研項目——在 2021 年 5 月發佈的理想 ONE 上交付 AEB、ACC 自適應巡航、車道保持這些基礎功能,這些技術都很成熟,但給我們的時間只有 90 天,拼的就是強有力的執行。從那一天開始,我們就想着如何才能快速追上別人。2022 年我們開始伊利亞特計劃 —— 在 L9 車型上交付 Orin X 項目。之前在地平線 J3 上的算法不適用了, 我們要在 Orin 上要重新開發系統。還趕上疫情,芯片斷供,博世無法提供足夠的角毫米波雷達芯片。我們不得不做了一個選擇,去掉角毫米波雷達,用純視覺方案做盲區檢測、避障等功能。最後用三個月交付了方案,比友商交付 Orin 的時間早了幾個月。和伊利亞特同期,賈鵬負責開發基於地平線 J5 的 Pro 平臺,也就是奧德賽計劃。最大挑戰是人少。當時整個團隊只有 500 人,2021 年,小鵬和蔚來都有上千人,華爲當時號稱 2000 多人。2023 年,我們的 Orin 平臺已經比較穩定了,在硬件上追平了,下一場仗我們判斷是城市 NOA,能贏的纔有資格進入第一梯隊。這個叫泰坦計劃。金蘋果計劃是在 2023 年上海車展上提出的百城 NOA,也出自希臘神話,是大力神赫拉克里斯去找金蘋果,但金蘋果被百頭巨龍看守,我們要得到金蘋果,就要把巨龍的頭一個個砍下來,把百城一個個都解決掉。達摩克里斯計劃是今年開始研發的端到端項目,意味着做不好達摩克里斯之劍就會掉落。《晚點》:其他公司現在也沒有拿掉四顆角毫米波雷達,你們考慮過拿掉後對系統的安全性影響麼?郎鹹朋:我們拿掉毫米波雷達有兩個原因,一是保交付,當時博世角雷達芯片斷供,不得不作出選擇[圖文:wuhan.heyefoods.com]。要麼用視覺代替雷達,要麼就交付不出來。二是技術選擇,當時特斯拉要走純視覺的方案,視覺更接近於人類認知周圍環境的能力。如果車身上同時有角毫米波雷達和視覺傳感器,兩者發生分歧時,需要用到人寫的規則邏輯去判斷它【來源:wuhan.whxqp.com】,難免會有錯誤。還有一個附加的好處是技術降本,省了大概 5 個億。但要用幾個攝像頭來替代角毫米波雷達,技術難度和風險是非常大的。我們做了很多測試,最終結果是準確率和成功率比帶角雷達的還略微增加了一點點。《晚點》:你提到之前資源不夠的問題。現在這個問題解決了嗎?郎鹹朋:我們去年九月的秋季戰略會提出了 “三大戰略”,第一戰略就是智能駕駛戰略。所以下半年開始招了好多人。公司的要求和預期也提升了,不管是百城還是別的,需要趕上頭部梯隊。《晚點》:所以此前智駕並不是理想的核心戰略?郎鹹朋:這次是正式明確了。《晚點》:這是因爲你們意識到,智駕對產品銷量的影響,和華爲的距離在拉大?賈鵬:是的,所以 2023 年秋季戰略會確定理想今年要做到智駕的絕對頭部,因爲我們判斷整個行業的買車邏輯會變成智駕爲先。《晚點》:六次戰役,你們沉澱下來的東西是什麼?郎鹹朋:想贏,就要用怎麼贏來思考。也就是以終爲始,找到必要性,想清楚解決一個問題要做到什麼。去掉角雷達、NPN 切無圖都是例子。《晚點》:理想難道不是以競爭爲出發點嗎?比如去年百城計劃的賽跑。郎鹹朋:去年華爲宣佈要推出全國都能開的 ADS(華爲的無圖 NOA 方案) 之後,我們過於強調競爭和對標華爲的一些指標,如接管率等,反而忽視了用戶體驗,這也是今年春季戰略會上被大家批評的一點。後來我們反思,所有產品驗收與交付應該以用戶評價爲出發點。《晚點》:你們怎麼設計智駕研發和產品組織來應對今天的高強度競爭?郎鹹朋:我們的智能駕駛是一個橫縱結合的組織,我負責縱向業務部門,做研發和交付。但最終產品的組織、執行和經營,包括外部競爭對標和研發資源投入,都是由智能駕駛 PDT(Product Development Team,跨職能的產品開發團隊)來操盤。我會參與一些人才戰略和計劃制定,一旦計劃定下來,我們就堅定地執行好。《晚點》:去年秋季理想大規模招人,智駕團隊從 700 多人擴張到 1000 多人,今年 5 月又裁了兩三百人,6 月又召回一些關鍵崗位員工。短時間從招人到裁人再到召回,說明了什麼?郎鹹朋:本質是技術迭代了。以前智駕系統裡有大量規則,需要人工編程、管理進度、做測試。但端到端更多是 AI 模型,上述崗位大幅減少。後來再召回少數人,更多還是基於業務需求進行的調整。其實特斯拉智駕團隊一直是 200 到 300 人,交付了全球最大的自動駕駛車隊。《晚點》:特斯拉的端到端,是一個印度技術人員 Dhaval Shroff 在內部最先提出來,自下而上被採納。理想的研發組織是否有自下而上創新的土壤{出處:wuhan.mjzgsc.com}?郎鹹朋:其實 VLM 這些想法就是來自於我們的預研和研發團隊。我們也沒有很早規劃出來這麼一個雙系統。《晚點》:怎麼評價你們的人才儲備?小鵬之前有吳新宙,蔚來有任少卿。有人認爲,理想智駕團隊一直缺少這種技術大牛。郎鹹朋:到了這個級別,技術能力和拿結果的能力都重要。我們的技術 leader,包括我、賈鵬、王佳佳,很多都是 14、15 年就在做自動駕駛。我們現在新招的人也比較強,今年 200 多個應屆生大多是 QS100(英國 QS 世界高校排名)前 50 的學生。而且我們有算力、數據儲備,這是人才成長的土壤。《晚點》:你雖然進入智駕領域很早,但最初在百度是做地圖相關的算法,不是智能駕駛本身。郎鹹朋:百度的經歷很重要。那段經歷讓我在管理上遇到任何事不會慫,我相信找到合適方法,一定可以用更短時間做出更好的效果。我在百度第一個項目和理想第一代自研相似,都是週期特別緊。我 2013 年 4 月底加入百度,4 個月後就要在百度大會上上線街景項目。這個團隊一開始只有 4 個人,最後我們做到了大會前一天的零點完成了上線。這裡面兩個關鍵。一是要用新技術。做街景,要模糊車牌和人臉,當年的常規做法是人工來做;而我們用了視覺算法,更快,更準確,還省了一大批人。另一個就是數據。這個算法我們本來想和百度 IDL 的餘凱(後創立地平線)、倪凱(後創立禾多)團隊合作,但他們的東西在這個場景也只有 86% 的準確率,我們後來自己做到了車牌 99%、人臉 97%,關鍵就是我們標了大幾萬張數據。算法上我們肯定不如他們,那是世界上算法最好的一批人。但這只是 80 分到 90 分的差距;而場景數據上,我們多了一個數量級。所以後來面試時,李想問我,要解決自動駕駛,最主要的問題是什麼?我會說是數據。《晚點》:這幾年中,很多人頂不住壓力、或者不相信理想能做成這件事選擇離職,爲什麼最後你們留下了?郎鹹朋:我們這羣人就是想把 L4 這件事做成,而我認爲這件事只有在理想才能做到。賈鵬:來理想之前我在英偉達待了 5 年,無論端到端還是大模型,是英偉達最早提出來,但當時就是不落地。到了車企,終於有機會把自動駕駛做成一個閉環了,很爽。題圖來源:《天才槍手》