自動駕駛汽車依然面臨一個(gè)尷尬的問題:
號稱自動駕駛,這些汽車到底什么時(shí)候不用人類駕駛?
這個(gè)問題的最終解釋權(quán)在道路交通管理部門。
放下各種法律法規(guī)不談,汽車和科技巨頭們在技術(shù)端依然沒能實(shí)現(xiàn)全自動駕駛。
因此,除了在公路上持續(xù)測試,自動駕駛公司還求助于模擬,試圖在虛擬環(huán)境中試遍各種情況,將現(xiàn)實(shí)世界中不常出現(xiàn)的變量也一一化解。
通常來說,我們通過考試,就能拿到駕照通行全國。但換到自動駕駛汽車上,這一套就行不通了。
這些車輛的獲得相關(guān)能力時(shí)需要「因城施策」,而且必須進(jìn)行更為詳盡的場景測試,甚至精確到某個(gè)十字路口。
為了進(jìn)入這個(gè)價(jià)值 7 萬億美元的超級市場,業(yè)內(nèi)各家公司在測試上卯足力氣,以便贏得公眾和監(jiān)管者的信任,而模擬測試顯然是他們證明自己的最佳展示平臺。
汽車之心(微信 ID:Auto-bit)以模擬為切入點(diǎn),整理總結(jié)了來自包括汽車廠商、科技巨頭、新創(chuàng)企業(yè)在內(nèi)的公司專家的觀點(diǎn)。
這些業(yè)內(nèi)頂級的專家正花費(fèi)巨額資金回答一個(gè)問題,即我們到底該測試些什么?
圖 1:模擬與現(xiàn)實(shí)中的十字路口
1、沒有模擬,就沒有自動駕駛汽車
拿通用自動駕駛團(tuán)隊(duì) Cruise 來說,Cruise 的虛擬測試車每天要在模擬器中運(yùn)行 20 萬個(gè)小時(shí)。
至于公認(rèn)的行業(yè)領(lǐng)頭羊 Waymo,在模擬器里已經(jīng)累積了超過 100 億英里的測試?yán)锍獭?
自動駕駛汽車在模擬場景中訓(xùn)練圖片來自51VR自動駕駛仿真平臺
對自動駕駛公司來說,尤其是訓(xùn)練神經(jīng)網(wǎng)絡(luò)時(shí),模擬器的重要性越來越強(qiáng)了。
為什么放著現(xiàn)實(shí)世界的數(shù)據(jù)不用而求助于模擬?原因有三:
1. 在現(xiàn)實(shí)世界采集數(shù)據(jù)是有危險(xiǎn)的;
實(shí)車測試無法滿足自動駕駛的測試?yán)锍桃蠛蛨鼍案采w度要求。模擬是保障自動駕駛汽車安全不可或缺的測試手段。
行業(yè)內(nèi)專家學(xué)者認(rèn)為,驗(yàn)證自動駕駛汽車的安全性需經(jīng)過上億公里的測試?yán)锍谭e累,如蘭德公司認(rèn)為自動駕駛需要幾億公里的里程測試數(shù)據(jù)來確保安全性,寶馬認(rèn)為自動駕駛研發(fā)至少需要達(dá)到 2.5 億公里的測試。
2. 許多假設(shè)和反事實(shí)情況在現(xiàn)實(shí)中是無法企及的;
與實(shí)車測試相比,仿真模擬測試可以在短時(shí)間內(nèi)對罕見案例進(jìn)行多次復(fù)現(xiàn),加速自動駕駛汽車的生產(chǎn)周期,節(jié)約研發(fā)成本,積累測試?yán)锍獭?
3. 采集更為豐富數(shù)據(jù)的要求。
這是因?yàn)楝F(xiàn)實(shí)世界中數(shù)據(jù)采集的速度有限。
可以這么說,現(xiàn)在沒有哪家自動駕駛公司不用模擬器。
對測試軟件來說,模擬器是絕對的殺手級工具,在某些情況下它還能訓(xùn)練神經(jīng)網(wǎng)絡(luò)。
自動駕駛技術(shù)不過關(guān),后果可能是車毀人亡
那么,這些公司是如何利用自動駕駛模擬測試反哺到真實(shí)的場景中去的?
與 Waymo 類似,Zoox 也有「無保護(hù)左轉(zhuǎn)困難」的煩惱。
于是,Zoox 團(tuán)隊(duì)開發(fā)了一個(gè)人工左轉(zhuǎn)信號燈,然后灌入模擬環(huán)境。
Zoox 聯(lián)合創(chuàng)始人 Jesse Levinson 透露稱,不久之后 Zoox 的自動駕駛系統(tǒng)識別起現(xiàn)實(shí)世界的左轉(zhuǎn)信號燈就順暢多了。
今年早些時(shí)候,Lyft 注意到自己的測試車一旦被其他車加塞,就會急剎車。
于是,Lyft 的工程師將這一場景放入模擬器。據(jù) Lyft 自動駕駛負(fù)責(zé)人 Luc Vincent 介紹,這樣的方法不但速度快,成本低,自動駕駛系統(tǒng)「一驚一乍」的毛病也得到了改善。
Aurora 也非常依賴模擬,通過記錄人類駕駛員的駕駛習(xí)慣,然后在模擬器中與自動駕駛系統(tǒng)進(jìn)行對比。
Aurora 聯(lián)合創(chuàng)始人 Sterling Anderson 說,在路測前會專門提醒司機(jī),必須像專業(yè)司機(jī)那樣去駕駛。
與其他公司一樣,特斯拉也不敢輕視模擬器。特斯拉 CEO Elon Musk 表示,「世界太復(fù)雜,說不清什么時(shí)候就會有極端情況登門造訪?!?
好消息是,模擬器里場景幾乎是無限的。但大多數(shù)公司并不愿透露自己到底測試了多少場景。
安波福是個(gè)特例,據(jù)汽車之心了解,安波福已經(jīng)在模擬器中構(gòu)建了超過 4 萬個(gè)場景。
有行業(yè)人士表示,想要實(shí)現(xiàn) 100% 的完美是不可能的。但在讓自動駕駛系統(tǒng)更安全的過程中,我們得保證一切安全可靠。
模擬也有短板
既然自動駕駛模擬測試可以反哺到真實(shí)場景中去,那么模擬能替代現(xiàn)實(shí)世界中大規(guī)模的數(shù)據(jù)采集工作嗎?
答案是:不能。
原因在于,模擬無法擁有與現(xiàn)實(shí)世界相同的經(jīng)驗(yàn)知識,而其中一些經(jīng)驗(yàn)知識對駕駛來說又必不可少。
舉例來說,模擬器中沒有其他道路參與者如:車輛、行人與自行車等行為習(xí)慣的經(jīng)驗(yàn)知識。
這個(gè)問題可以分為兩部分:
行為預(yù)測:在道路參與者做出下一步動作前預(yù)知他們的行為。
溝通與互動:了解道路參與者對自動駕駛汽車的行為會作何反應(yīng),同時(shí)知曉該如何做出相應(yīng)反應(yīng),以實(shí)現(xiàn)雙贏的結(jié)果。
人類的行為表現(xiàn)是一個(gè)經(jīng)驗(yàn)問題,需要經(jīng)驗(yàn)數(shù)據(jù)來解答。
也就是說,類似游戲中那樣簡單化的人類行為模型,對付一些有限的駕駛環(huán)境還行,但隨著場景變得更密集,城市擁擠、混亂、復(fù)雜、交互等一系列條件疊加時(shí),為人類行為建模的難度會幾何級增長,簡化模型的預(yù)測能力也會直線下降。
而自動駕駛汽車需要精確的經(jīng)驗(yàn)現(xiàn)象模型。
舉例來說,如果一輛自動駕駛汽車在路口左轉(zhuǎn),面對迎面駛來的車輛,它必須判斷到底對方會不會減速?減多少速?
這類知識從紙上談兵般的分析中得不出來,這完全是經(jīng)驗(yàn)。
這也是為什么馭勢科技的一位工程師向汽車之心解釋:模擬的技術(shù)難點(diǎn)之一在于「真」。如果做得不夠逼真、不夠貼近現(xiàn)實(shí),那么依托于模擬之上的自動駕駛系統(tǒng)開發(fā)也會變得失真,最終無法應(yīng)用于現(xiàn)實(shí)世界。
作為「不差數(shù)據(jù)」的頭部公司,Waymo 選擇用手上積累的測試數(shù)據(jù)訓(xùn)練人工智能系統(tǒng),以更好地模仿真實(shí)司機(jī)與行人。
在模擬測試中,Waymo 甚至?xí)y試模擬的人類駕駛員與行人是否會撞向?qū)Ψ剑源藖砼袛嗄M的場景是否足夠真實(shí)。
Waymo 首席科學(xué)家 Drago Anguelov 解釋,這個(gè)領(lǐng)域其實(shí)才剛剛萌芽。如果你見的模擬器多了,就會發(fā)現(xiàn)它們中許多模擬出的世界并不真實(shí),因而會影響測試效果。
就拿 Uber 來說,最近 Uber 在測試停著的車后站人的場景,結(jié)果顯示模擬器中的車根本不會像現(xiàn)實(shí)中一樣減速。
工程師對模擬器精度進(jìn)行校準(zhǔn)時(shí)發(fā)現(xiàn),原來車輛只注意到了前方交通信號燈的顏色。綠燈亮起,車輛自然會加速行駛。
Uber 趕緊對這一問題進(jìn)行了調(diào)整,以保證車輛表現(xiàn)得像現(xiàn)實(shí)世界中一樣(靠近紅綠燈才開始識別)。
采集現(xiàn)實(shí)世界的數(shù)據(jù)
訓(xùn)練行為預(yù)測的數(shù)據(jù)可以被動地從現(xiàn)實(shí)世界中采集,只要車輛配好攝像頭、計(jì)算機(jī)和互聯(lián)網(wǎng)就行。此后,觀察、預(yù)測、標(biāo)記錯(cuò)誤并上傳等就可以完成。
訓(xùn)練溝通與互動的數(shù)據(jù)也能被動采集,只要我們記錄下駕駛員駕駛時(shí)的輸入,如轉(zhuǎn)向、加速、剎車和燈光信號等。
在業(yè)內(nèi),我們稱之為模仿學(xué)習(xí)。
人類駕駛員會手把手向神經(jīng)網(wǎng)絡(luò)展示如何與現(xiàn)實(shí)世界的道路參與者進(jìn)行溝通與互動,而神經(jīng)網(wǎng)絡(luò)只需要在情境變量相同時(shí)執(zhí)行此前學(xué)到的動作即可。
從理論上來講,這些有用的數(shù)據(jù)我們也可主動進(jìn)行采集。
例如,自動駕駛汽車或駕駛員輔助系統(tǒng)做出某一判斷后,如果人類駕駛員給予否定(接管方向盤),那么這次糾正就會成為模仿學(xué)習(xí)的重要材料。
當(dāng)然,如果換到強(qiáng)化學(xué)習(xí)的語境下,系統(tǒng)就能在不斷減少人類干預(yù)的情況下等到獎勵(lì)。
如果哪家自動駕駛公司能讓神經(jīng)網(wǎng)絡(luò)精確模仿人類駕駛員的行為,在模擬時(shí)就能精確很多。
完成這一步后,他們就能利用模擬的方法訓(xùn)練神經(jīng)網(wǎng)絡(luò)如何進(jìn)行駕駛強(qiáng)化學(xué)習(xí)模式。
不過想要實(shí)現(xiàn)這一目標(biāo),還是得先從現(xiàn)實(shí)世界采集海量數(shù)據(jù)。
模擬器里并沒有駕駛的真知灼見
想學(xué)會駕駛,自動駕駛汽車需要準(zhǔn)確預(yù)測其他道路參與者的一舉一動,同時(shí)還能與他們進(jìn)行溝通和互動,特別是其他車上的人類駕駛員。
想做好預(yù)測工作,就得從經(jīng)驗(yàn)出發(fā)觀察其他道路參與者,而成功的溝通與互動則需要對其他道路參與者的一舉一動了如指掌,這同樣需要經(jīng)驗(yàn)。
所以說,模擬器里并沒有駕駛的真知灼見,除非它是由經(jīng)驗(yàn)數(shù)據(jù)訓(xùn)練出來的神經(jīng)網(wǎng)絡(luò)。
想向模仿學(xué)習(xí)與強(qiáng)化學(xué)習(xí)借力,自動駕駛汽車可能得在路上行駛上百年,因?yàn)橄到y(tǒng)對經(jīng)驗(yàn)的需求量實(shí)在太過龐大,一個(gè)幾百輛車的測試車隊(duì)只能算杯水車薪。
當(dāng)然,即使自動駕駛公司手上有數(shù)百萬輛新車,也不一定能完美實(shí)現(xiàn)全自動駕駛,但它們帶來的數(shù)據(jù)肯定可靠性要強(qiáng)得多。
來源:汽車之心