特斯拉的“純視覺”路線,不是所有人都學得來互聯(lián)網(wǎng)+

                  汽車之心 2023-11-13 12:58
                  分享到:
                  導讀

                  BEV+Transformer+占用網(wǎng)絡(luò)技術(shù)路線的大熱,再次將激光雷達推向風口浪尖。

                  BEV+Transformer+占用網(wǎng)絡(luò)技術(shù)路線的大熱,再次將激光雷達推向風口浪尖。 BEV+Transformer+占用網(wǎng)絡(luò)技術(shù)路線的大熱,再次將激光雷達推向風口浪尖。 激光雷達該不該被拋棄? 對車企來說,這是一個艱難的抉擇:是堅定不移跟隨特斯拉走具有「性價比」的純視覺路線,還是采用看起來「成本稍高」的激光雷達融合方案? 要回答這個問題并不難——尤其是當你洞悉事情的真相是反常識的時候。 比如,去除激光雷達,看起來減掉的是智能駕駛系統(tǒng)的 BOM 成本,整車成本也隨之下降了,但冰山之下的隱性成本增加了多少,你計算過嗎? 再比如,占用網(wǎng)絡(luò)的白名單可以覆蓋包括機動車、行人、兩輪車、錐桶、水馬、路面、樹木等十幾個常見的「道路物體」,但白名單之外的物體,它能看見嗎? 在城市 NOA 大規(guī)模落地前夕,整個智能駕駛行業(yè)需要重新審視純視覺方案背后的成本和技術(shù)難易程度,以及激光雷達的核心價值。 「抄特斯拉作業(yè)」是否是最佳選擇?在城市 NOA 落地浪潮下,車企如何集中優(yōu)勢發(fā)揮所長? 這些都是需要被優(yōu)先考慮的問題。 01 模仿特斯拉,不該忽略純視覺路線背后的「隱性成本」 「4 顆以下,請別說話。」這可能是此前汽車行業(yè)「卷」激光雷達最出圈的表達。 到今天,激光雷達仍然是絕大部分頭部車企新車的標配。從蔚小理,再到華為(問界、阿維塔)、極氪、零跑,激光雷達在國內(nèi)能夠快速量產(chǎn)上車,很大程度上是由他們直接或間接推動的。 激光雷達的風靡,來自其帶給消費者的科技感和安全感。 而當「降本」的旋風刮來,在特斯拉跑通純視覺方案之后,「去激光雷達」的聲音又此起彼伏。 短期看,拿掉激光雷達,「降本效果」立現(xiàn)。 然而從長期看,車企需要為這一選擇投入更多的研發(fā)資源。 禾賽科技戰(zhàn)略負責人施葉舟認為,「在考慮成本的時候,不能夠只看到硬件成本,實際上更要考慮背后所需要各種研發(fā)服務(wù)和資源投入,也就是『全成本』——除了冰山上面的顯性成本(硬件、BOM 成本),還有大量被忽視的隱性成本。」 這里所稱的純視覺技術(shù)路線中的「隱性成本」,包括算法、路測、云計算、數(shù)據(jù)標注、仿真訓練和系統(tǒng)軟件等。 特斯拉前 AI 高級總監(jiān) Andrej Karpathy 曾在公開演講時說到:「純視覺能夠精準感知深度、速度、加速度信息,實現(xiàn)純視覺是一件困難的事情,還需要大量數(shù)據(jù)。」 換句話說,特斯拉作業(yè)并不好抄,門檻和壁壘極高。 這主要體現(xiàn)在三個方面: 一是海量數(shù)據(jù)。 特斯拉的自動駕駛算法是業(yè)內(nèi)公認能力最強、投入最大、研發(fā)最早的。截至目前,特斯拉 FSD 累積行駛里程已超 5 億英里,Autopilot 使用里程已經(jīng)超過 90 億英里。 特斯拉的自動駕駛系統(tǒng)每天可以接收到車隊回傳的 1600 億幀視頻數(shù)據(jù),支持神經(jīng)網(wǎng)絡(luò)訓練。眾所周知,數(shù)據(jù)積累取決于累計交付量和行駛里程,如此大的數(shù)據(jù)體量,也意味著需要投入大量的時間成本。 其次是自研芯片。 特斯拉自 2014 年開始自研芯片之路,2019 年發(fā)布了 FSD 自研芯片。 為了提升數(shù)據(jù)處理能力,為進一步的深度學習量身定制,2021 年 8 月,特斯拉發(fā)布了用于神經(jīng)網(wǎng)絡(luò)訓練的自研芯片 D1,D1 芯片基于 7nm 工藝打造,算力可達 362TFLOPS。 D1 芯片具備較強的可擴展性,25 個芯片可組成一個計算模塊,而 120 個計算模塊可以組成外界熟知的「Dojo ExaPOD」超級計算機。 第三是圍繞算法訓練搭建的超算中心。 在特斯拉自建的大數(shù)據(jù)中心中,使用了 14,000 片 GPU 芯片,其中 10000 片用于 AI 訓練的 H100,4000 片用于數(shù)據(jù)標注。 據(jù)了解,一片 H100 芯片官方售價 3.5 萬美元,盡管在黑市被炒到 30~40 萬元人民幣,依然是「一片難求」。 特斯拉上線 H100 GPU 集群的同時,還激活了自研的超級計算機群組 Dojo ExaPOD,開啟云端算力競賽,以支持自動駕駛技術(shù)的更新迭代。 Dojo 于 2023 年 7 月開始生產(chǎn)部署,馬斯克曾表示,到 2024 年,特斯拉還將向 Dojo 再投資 10 億美元。預計到 2024 年 10 月,Dojo 算力會達到 100Exa-Flops。 從這個角度看,光是算法訓練的芯片投入就十分驚人,達到數(shù)十億元。 基于這樣的數(shù)據(jù),我們可以做一個簡單的數(shù)學推算: 假設(shè)要開發(fā)一個特斯拉式純視覺路線的高階智能駕駛系統(tǒng),這個方案總投入大約在 200 億元。 試想一下,要壓低這個成本需要多大規(guī)模的銷量? ——當汽車銷量到 2000 萬輛時,每輛車的自動駕駛成本可以降到 1000 元。 ——而當汽車銷量只有幾十萬、上百萬輛時,這筆投入該如何攤銷? 當前,特斯拉累計銷量超過 400 萬輛,其所釋放的規(guī)模效應讓友商們難以企及。因此,特斯拉選擇視覺路線,不只是「算法能力強」,更是建立在巨大的保有量、車載芯片自研、數(shù)據(jù)回環(huán)和自動化標注、自建超算中心訓練模型等一系列能力之上的綜合實力。 02 占用網(wǎng)絡(luò)不是「萬能鑰匙」,激光雷達仍是「最佳助攻」 2016 年 1 月 20 日,在輔助駕駛狀態(tài)下,一輛特斯拉撞上了一堵靜止的水泥隔離墻上。這是特斯拉首起「自動駕駛」事故。 當時,對特斯拉的唱衰之聲不絕于耳。但經(jīng)過 7 年探索,特斯拉如今在自動駕駛領(lǐng)域一騎絕塵。當特斯拉跑通自動駕駛之后,其他車企開始轉(zhuǎn)向了「大模型」路線,沿著特斯拉從 BEV 向占用網(wǎng)絡(luò)迭代之路進化。 不過,即便不惜成本投入堆起來的「占用網(wǎng)絡(luò)」,對于通用障礙物的識別仍然無法做到「天衣無縫」。 占用網(wǎng)絡(luò),是一套基于神經(jīng)網(wǎng)絡(luò)的算法,是在時序?qū)R、多幀數(shù)據(jù)融合下構(gòu)建的 4D 網(wǎng)絡(luò)。 「因為拼接了很多算法,涉及到多幀融合。不可避免就會有一定程度的延時。」對于國內(nèi)車企來說,在車端有限的算力之下,如何兼顧「高精度」和「低延時」存在諸多考驗。 更重要的是,占用網(wǎng)絡(luò)技術(shù)會因視覺缺失 3D 信息而導致漏檢、誤檢。 為了視覺算法輸出結(jié)果比較準確,需要源源不斷的數(shù)據(jù)輸入和迭代以提高精準度。 在車輛覆蓋沒有到一定規(guī)模前,尚且無法獲得更多數(shù)據(jù)——這正是不少車企現(xiàn)階段對「去掉激光雷達」保持謹慎,而選擇「攝像頭+激光雷達」融合感知路線的原因。 相比于算法,激光雷達具備「硬件本能」,不需要經(jīng)過大量復雜的計算和假設(shè),以及數(shù)據(jù)訓練就可以得到純視覺方案需要的某些數(shù)值。 相比純視覺方案,激光雷達能夠應對不易處理的 corner case(邊緣場景),彌補攝像頭可能出現(xiàn)的誤判。 在融合方案中,激光雷達存在多個公認的核心優(yōu)勢: 一是「抗干擾」,不懼夜間環(huán)境。 據(jù) MIT 團隊 2022 年的研究結(jié)果表明,配備了激光雷達的融合方法將夜間的感知精度提高 3 倍。 二是「真三維」,精度更高。 激光雷達基于三維坐標,能精確到厘米級別為算法提供地面和物體的相對位置。地面上的高低不平的路況,一些低矮物體,激光雷達也能夠捕捉到。 三是「高置信度」,識別物體數(shù)量更多。 純視覺方案會建立覆蓋常見「道路物體」(機動車、行人、兩輪車、錐桶、水馬、路面、樹木等)的白名單。白名單之外,可能「視而不見」。 通過激光雷達直接獲取實時 3D 數(shù)據(jù)后,車輛可以直接判斷障礙物是否存在,為占用網(wǎng)絡(luò)提供真值輸入,在融合方案里作有力補充,提升系統(tǒng)安全性。 此外,激光雷達的反應速度更快。在中國城市內(nèi)存在復雜路況,比如鬧市區(qū)里車輛突然的加塞、變道等,激光雷達相比攝像頭的反應速度更快,能夠準確判斷對方移動速度。 值得一提的是,在最近行業(yè)大熱的話題「如何降低 AEB 的誤觸發(fā)率」上,激光雷達也可以幫助避免一些常見的安全隱患。 施葉舟表示,「AEB 的誤觸發(fā),背后的本質(zhì)原因是感知精度不夠高。在激光雷達加持下,周圍感知精度的提升,誤觸發(fā)可以大大減少」。以搭載激光雷達的理想 L9 Max 為例,采用多傳感器融合方案之后,每 10 萬公里的誤觸發(fā)次數(shù)遠遠低于行業(yè)均值。 綜合來看,占用網(wǎng)絡(luò)技術(shù)不是一個解鎖通用障礙物識別的萬能鑰匙,而激光雷達在提升安全性的過程中,有著舉足輕重的作用。 03 激光雷達融合方案,高階智能駕駛落地的「助跑器」 城市 NOA 正在迎來一個高光時刻——問界新 M7 累計大定已超過 8 萬臺,其中超過 60% 用戶選擇了智駕版(激光雷達版);小鵬新 G9 激光雷達版本選配比例高達 80%。 在此之前,一款車的智能駕駛搭載率只能達到 20%~30% 左右。問界和小鵬新車的智能駕駛選配率,遠遠超過了行業(yè)預期。 城市 NOA 迅速落地的背后,給廣大的消費者體驗帶來根本變化是最主要的驅(qū)動力。 要實現(xiàn)更大范圍的自動駕駛的覆蓋,要切入真正的高頻和剛需場景,先走到距離用戶最近的地方。 數(shù)據(jù)顯示,汽車平均有 71% 的里程是在城市道路行駛,對應時間占車主總駕車時長的 90%。而華為和小鵬得以更快落地城市 NOA,激光雷達功不可沒。 智能駕駛權(quán)威測評機構(gòu) nuScences 的數(shù)據(jù)顯示: 截止 2023 年上半年,純視覺方案(攝像頭)和融合方案(激光雷達+攝像頭)對目標物追蹤準確度(AMOTA)上仍有較大差距:二者相差接近 20 個百分點(56% VS. 75%)。 預計到 2025 年,純視覺方案準確度的均值會達到 70%~71%。這一數(shù)字相比配備激光雷達的融合方案在 22 年的準確度落后了 3 年時間。 換個角度來看,激光雷達融合方案可以讓高階智能駕駛落地時間縮短 3 年。 輕舟智航產(chǎn)品負責人許諾直言,現(xiàn)階段單純依靠視覺方案,很難應對中國城市道路中的各類 Corner Case。「激光雷達,是以投入換時間,加速城市 NOA 落地的捷徑。」 「當你做視覺方案時,系統(tǒng)遇到未知或者通用障礙物識別時,激光雷達方案的優(yōu)勢是突出的。像路上突然掉下來的物體,例如紙箱、木箱等,通過激光雷達能夠感應到。而且激光雷達可以告訴你,前面有障礙物,也會告訴你做分類處理。」許諾說道。 由此看來,激光雷達不僅是智能汽車里的「隱形安全氣囊」,更是輔助車企量產(chǎn)落地城市 NOA 的捷徑。 在國內(nèi)市場,蔚來、理想、小鵬、仰望、智己、極氪、問界、阿維塔等汽品牌,在已經(jīng)量產(chǎn)或即將上市的車型中,都配備了激光雷達。 在海外,布局 L3 智能駕駛功能的頭部車企也都配備了激光雷達,包括已經(jīng)獲得 L3 監(jiān)管批準的奔馳,以及正在布局的寶馬、沃爾沃等。 下一步,高階輔助駕駛?cè)粢虼蟊娛袌龀掷m(xù)滲透,系統(tǒng)成本有望繼續(xù)下探。 施葉舟表示,禾賽正在通過核心零部件芯片化等技術(shù)降本手段,以及放大規(guī)模效應的優(yōu)勢,為城市 NOA 持續(xù)落地服務(wù)。目前,禾賽已將激光雷達的價格從幾年前的幾十萬元,降到了現(xiàn)在的幾千元,做到了十倍以下。 到那時,激光雷達的高成本,或許也不再是阻礙其大規(guī)模上車的門檻。 車企是否都要走特斯拉的純視覺方案,最終要量力而為。而從現(xiàn)階段來看,激光雷達不僅可以成為城市 NOA 落地的「助跑器」,在未來也能夠繼續(xù)發(fā)揮其獨特價值,做自動駕駛領(lǐng)域的「最強助攻」。
                  激光 雷達 特斯拉 駕駛 視覺
                  分享到:

                  1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會明確標注作者和來源;
                  2.TMT觀察網(wǎng)的原創(chuàng)文章,請轉(zhuǎn)載時務(wù)必注明文章作者和"來源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控熑危?br> 3.作者投稿可能會經(jīng)TMT觀察網(wǎng)編輯修改或補充。