不願給 不適用 不敢用 汽車數據共享 只是個幻想?
近日,由中國智能網聯汽車產業創新聯盟提出、電子科技大學牽頭的《智能網聯汽車數據安全共享模型與規範》CSAE標準已完成徵求意見稿和編制說明,現面向全體會員及其他有關單位廣泛徵求意見。
衆所周知,“軟件定義汽車”已經成爲汽車產業的共識。數據於軟件的重要性不言而喻。隨着汽車智能化水平的不斷提高,汽車產生的大數據越來越多。如何有效地利用這些數據,讓其進一步加快汽車產業智能化轉型,成爲時下汽車產業重點關注的課題。
?數據共享大有裨益
數據體量越大,可供利用的有效數據就越多。數據共享無疑是獲得海量數據的捷徑。
據知名汽車零部件公司內部人士黃俊介紹,車企與車企之間的數據共享能加快汽車智能網聯水平的提升。比如在自動駕駛測試過程中,很多場景數據的共享是非常有意義的。A、B兩家車企都在一段公路上進行測試,A車企在測試過程中路遇一隻野鹿,而B車企累計測試了100km甚至1000km也沒有遇到,這個出現野鹿的數據對於B車企來說就非常寶貴,這樣的數據可以豐富B車企的場景庫,推動B車企的算法不斷迭代。
而車企與用戶之間的數據共享,也能助力車企智能化水平更上一層樓。車主在駕駛智能汽車時會產生大量數據,但他們對於車輛收集信息的過程往往是無感的,甚至是不知情,這就導致用戶與車輛缺乏互動。事實上,當車企及時將車主的車輛數據反饋給車主,車主將其駕駛體驗分享給車企,單車智能的發展進程就會大大提速。
仍以車主在公路上偶遇野鹿爲例,一種結果是車輛檢測到一個不能識別的場景並上傳;另一種情況是,車主主動觸發上傳該場景,並進行標註。顯然,第二種數據於車企更有用處。後臺會基於該數據進行進一步訓練、豐富算法,使車輛在未來能夠處理這樣的場景。
中國汽車工程研究院股份有限公司總監陳濤認爲,數據共享很有必要。未來是大數據時代,尤其是網絡通信技術應用以及雲的算力、存儲能力大大提升之後,下一步很多科技創新、研發與應用服務,都要基於大數據來實現。要讓整個交通系統更智能,光抓單車智能顯然不夠。這需要全局優化,需要更多元的數據,包括車輛的數據乃至大交通系統的數據。
?國內數據共享相對滯後
事實上,汽車行業關於數據共享的理念早已萌生。這方面,美國的步伐邁得更大一些。去年,美國汽車安全監管機構公佈了一項自願性工作,以收集和提供有關現有自動駕駛汽車測試的全國性數據。美國國家公路交通安全管理局也推出了“自動車輛透明度和參與度的安全測試計劃”(AV TEST Initiative),以提供“一個在線的,面向公衆的平臺,以共享自動駕駛系統的道路測試活動。”以前那些經過測試的自動駕駛汽車現在可以作爲AV TEST Initiative的一部分,自願向NHTSA提交信息,NHTSA將提供查看信息的服務。
全球自動駕駛汽車軟件公司Oxbotica正與思科公司(Cisco)合作搭建一個開放漫遊平臺。該平臺能夠讓自動駕駛車隊無縫、安全地共享大容量數據,同時能以低成本的方式行駛。該測試平臺經過設計,可完全擴展,能夠部署在不同的車隊網絡中,無論車隊規模如何,所處何地,都能安全且便宜地下載數據。
通用汽車也在和寶馬合作研發區塊鏈技術,希望通過該技術實現自己和其他汽車製造商之間自動駕駛汽車數據的共享。這都是爲了解鎖存儲在孤島中的寶貴數據,最終讓自動駕駛汽車更快上路。在移動開放區塊鏈倡議(MOBI)的支持下,這一領域的數據共享探索性工作正在進行。
而國內市場的情況是,早前幾年,百度曾公開一些數據集,供同行訓練和測試使用。但百度一家企業收集的數據量有限,後續又沒有更多企業來繼續完善這一數據庫,國內數據共享的工作便不了了之了。
不過近來,數據共享又有新動態。《智能網聯汽車數據安全共享模型與規範》CSAE標準的推出,對智能網聯汽車的內置屬性數據和行駛數據進行規範化。模型對數據安全隱私級別進行分級,對數據內容進行分類,使得大規模數據的價值挖掘成爲可能,在保障數據安全的前提下,獲得更高的商業價值。
?面臨技術、商業、法規難題
可以看到,國內在智能汽車數據共享方面,仍處於起步階段。事實上,要做到數據共享非常難。在紐勱科技相關負責人看來,基於目前的硬件設備和雲端建設,並沒有達到讓車輛數據共享的程度。另外,數據共享的概念很廣泛,怎樣的數據需要共享?共享之後,數據如何支持算法和技術的優化?對於這些問題,行業內其實並沒有定義清楚。
同時,國內自動駕駛落地路線分支很多,有的着眼於Robotaxi,有的着眼於前裝量產,路線不同對數據的要求和需求也就不同,共享得來的數據能否滿足實際需求是一個需要思考的問題。以滴滴爲例,它掌握了龐大的數據,但這些數據怎麼提供給科技公司優化自動駕駛算法,如何爲政府部門優化道路系統做出貢獻,涉及技術、商業等多維度。總體而言,數據的能動性目前還比較有限。
的確,數據的定義非常廣泛。如果需要圖片數據,那麼共享得到的文字數據就是無用的。此外,因爲傳感器、算法不同,車輛產生的數據差異很大,共享得到的數據就需要進一步處理才能“爲我所用”,但處理後的數據還有多大價值很難判斷。雖然每家車企都把數據看得至關重要,但對於自己到底要什麼樣的數據,用這些數據做什麼,他們還缺乏清晰的認知。
汽車之家車聯網商務總經理易曉峰分析,數據共享的前提是數據分層。以高精度地圖相關數據爲例,底層基礎數據客觀描述了道路基礎信息,可以共享,但車企之間的數據定義格式不盡相同,可能導致共享後也無法共用。中間層的數據算法是數據使用的方案,也可以在一定範圍內共享。但最上層的自定義特殊場景屬於商業化的範疇,代表了車輛自動駕駛功能和應用場景,這是車企的核心競爭力,這是他們無論如何也不能對外開放的。
當下,智能網聯的核心數據基本掌握在車企手中。可以說,車企是數據共享的主體。陳濤認爲,那些偏向於研發類的數據、涉及到車輛內部算法策略和邏輯、關於核心技術機密的數據,車企必然不願意共享,因爲這是形成產品壁壘的關鍵所在。
而與用戶應用和用戶服務緊密關聯的數據,如位置等可以考慮共享,但面臨用戶隱私泄露問題,需要進行“脫敏”處理。另外,有關車輛基本運動的數據如加速、轉向等,也可以共享,但再向內縱深如傳感系統數據,企業則會謹慎開放。
可以說,數據是未來汽車行業競爭的核心資源,車企花費巨大資金和精力在數據的採集、標註、處理上,要求企業無償提供寶貴的、甚至包含有機密商業信息的數據,這確實令企業爲難。雖然汽車企業共享數據的行爲非常有意義,特別是對於無人駕駛這種需要大量且多樣數據的技術,但汽車企業的高層擔心這會削弱自身優勢,並不願意分享,這就使得共享數據資源變得難上加難。
即便某一家企業把自家的數據共享出來,在“黑暗森林法則”的重要概念——“猜疑鏈”的作用下,其它企業真的敢用嗎?要知道,在自動駕駛技術中,最重要的就是安全性。
而拋開技術與競爭層面的因素,黃俊認爲數據共享也存在法律方面的風險。因爲智能網聯傳感器必然會掃描道路特徵,我國自然資源部相關部門將其定義爲測繪行爲,從國家安全的法律法規角度來講,有些數據是不能採集、無法處理的,更談不上分享,這或許是非技術層面的一個很大障礙。
?標準統一是共享前提
有人打了這樣一個簡單的比喻,數據是車企的私有財產,就好比你有10元錢,爲什麼要和別人分享?這就涉及到共享的動機和數據的劃分,公共數據可以共享,但需要建立共享機制;私有數據事實上也可以共享,但要建立市場化的數據交易機制。
當前,因各車企使用不同的數據處理模式,使得汽車行業中存在數據格式不統一、內容記錄不全面,甚至局部數據存儲混亂的問題。這些海量的汽車數據具有極大的挖掘價值,但對數據應用方來說,分散且複雜多樣的數據無法直接使用。常規的數據整合手段不僅會消耗大量的人力與資源,並會使數據安全受到威脅。
陳濤認爲,所謂互聯互通,數據的標準、接口、協議相同,是數據共享的第一步。一輛汽車在上海、北京、重慶等不同城市,測試獲取的數據必須能上傳到同一後臺,不能因爲城市不同,數據的範式就不同。“就好比大家都要說普通話,而不是我說普通話,但你說粵語。”陳濤說。
智能網聯汽車共享數據模型與規範的提出,可以填補當前市場的標準空白。通過建立統一規範的數據格式,指導各車企進行科學規範的數據處理,減少人力與資源的消耗以提升經濟價值。使用智能網聯汽車共享數據模型,可以提升行業內的數據流通效率並保障數據的隱私安全,充分利用汽車行業數據中所蘊含的價值。
標準統一後,商業模式自然就會衍生出來。在陳濤看來,數據也分爲2C和2B。2C數據是直接服務於消費者的,爲駕駛和出行服務創造價值;2B數據一類是支撐研發、使車輛性能更優,還有一類是保證物流調度更順暢,效率更高更經濟。當然還有一類數據是滿足政府監管的訴求,支持交通管控和安全管控。這三方面的數據都有價值,關鍵在於如何交易或者交換。
很多數據目前掌握在車企手中,其實車企也未必能夠充分利用,但衆人皆知數據在未來會產生大量價值和增值服務。雖然可以共享一部分數據,但爲什麼要共享、共享給誰,這種商業模式還沒有探索清楚。陳濤分析,這是一個市場化的環境和機制,如何分配利益,誰爲主、誰爲輔,數據是交換還是買賣,數據如何變現、價值幾何,一環扣一環的路徑目前還沒理順。
?需政府或協會牽頭
北京大學互聯網發展研究中心洪延青博士曾發表觀點認爲,在路測數據的共享中,事故數據應當認作是公共品,因爲它是用生命、鮮血換來的,應當共享出來,不讓同樣的錯誤一再出現。
險情數據應鼓勵共享,對訓練算法非常有意義,能夠迅速提升整個行業的水平,政府應該以政策優惠的形式鼓勵企業把險情數據開放出來。正常行駛數據也鼓勵共享,但應該在企業之間共享,不需要通過政府。不過,無論哪種形式的共享都需要一個強有力的組織者。
黃俊介紹說,國外很多民間組織、非營利組織或者行業組織,在數據共享方面能夠起到很大作用,比如說德國汽車工業聯合會、美國智能交通運輸協會。但國內行業組織的話語權相比國外較弱,所以更適合由政府部門牽頭或者政府下屬的大數據公司、事業單位來牽頭。
“其實標準的制定不是非常難,技術層面幾乎沒有障礙。只要企業有意願做標準,就很容易統一,關鍵在於如何調動大家共享的積極性。這是一個文化問題。國內車企之間的合作偏向保守,車企覺得數據是很重要的資源,不願意共享;具有互聯網精神的IT企業想共享,但又調動不起來這些擁有大數據的車企巨頭。”黃俊遺憾地說。
易曉峰也認爲,一些數據的共享的確有助於行業進步,如地圖數據,但這種共享也有前提,即車企的技術成熟度相當。如果每家企業的數據質量、成本參差不齊,硬要談共享,也很困難。而且這種共享還需要行業協會、行業聯盟類組織牽頭,靠企業自發共享不太現實。畢竟,眼下每個企業還處在不斷提升自身技術能力的階段,精力主要集中在採用什麼樣的技術路線去實現更高級別的自動駕駛功能且商業落地。
愛馳汽車大數據平臺部總監李海軍補充,數據共享可以實現,只是牽頭組織必須是非營利性的。數據並非簡單收集後再分發,而是收集後必須經過加工處理,處理過的數據看不出來自哪些車企和車型,而是提煉出一些共性,成爲反向賦能汽車智能化的手段。如果能達到這樣的效果,車企是有積極性參與數據共享的。當然還有一個難題,就是這個牽頭的組織首先要考慮自己如何活下來。