
No code, only neural networks! Tesla FSD's major update, what's different about V12?

11 月 25 日,媒體報道,特斯拉已開始向員工推出全自動駕駛(FSD)V12 版本,更新版本號為 2023.38.10。
11 月 25 日,媒體報道,特斯拉已開始向員工推出全自動駕駛(FSD)V12 版本,更新版本號為 2023.38.10。很快,特斯拉 CEO 馬斯克也在 X 上確認了這一消息。

本月早些時候,馬斯克宣佈特斯拉 FSD V12 自動駕駛將在 2 周內上線試用,但市場普遍對這一時間點表示懷疑。現在看來,FSD V12 版本正步入面向客户前的最後一步,或許能夠在今年問世。
為何大家會如此期待特斯拉的 FSD V12?
最為重要的原因便是,特斯拉反覆強調的,FSD V12 將實現全新的 “端到端自動駕駛”,第一次開始使用神經網絡進行車輛控制,包括控制轉向、加速和制動,不再需要此前超過 30 萬行的代碼,而是進一步依賴神經網絡,減少了對硬編碼編程的依賴。
馬斯克在此前的試駕直播中表示,FSD Beta V12 是有史以來第一個端到端 AI 自動駕駛系統(Full AI End-to-End),從頭到尾都是通過 AI 實現。我們沒有編程,沒有程序員寫一行代碼來識別道路、行人等概念,全部交給了神經網絡自己思考。V12 的 C++ 代碼只有 2000 行,而 V11 有 30 萬行。
簡單理解就是,V12 把攝像頭獲取的圖像數據輸入到神經網絡,網絡能夠直接輸出車輛控制指令(如轉向、加速、制動等),更像是一個人類的大腦,99% 的決策都是由神經網絡給出的,不需要高精地圖、不需要激光雷達,僅僅依靠車身的攝像頭視覺輸入,就能分析思考,輸出控制策略。
媒體分析認為,FSD V12 版本的推出將成為特斯拉在 AI 和自動駕駛方面的關鍵時刻。這不僅僅是技術實力,還關乎將 AI 與人類行為如何更好融合。
對於新架構的技術細節和潛在影響,市場仍有較多疑惑和分歧。根據特斯拉對外披露的信息及馬斯克在 X 上發佈的信息,中信證券認為,特斯拉內部目前有兩條 “端到端” 路線同步在研:1)級聯式端到端神經網絡;2)World Model,而 FSD V12 是前者的可能性較大,有望於明年初落地,以更好地實現 L3 能力。
"端到端自動駕駛"有何不同?
在 FSD V12 之前,特斯拉的自動駕駛系統一直依賴於規則判斷。
靠着汽車的攝像頭識別車道、行人、車輛、標誌和交通信號燈等,然後通過特斯拉工程師們手動編寫的數十萬行 C++ 代碼來應對各種情況,比如紅燈停、綠燈行、在沒有足夠快的車輛衝撞時才通過十字路口等等。
但現在,作為特斯拉自動駕駛系統最重要的一次升級,FSD v12 只是通過給神經網絡 “喂” 視頻,讓它不斷學習,優化參數,在分析數十億幀人類如何駕駛汽車的視頻自學了駕駛。
中信證券指出,從技術本質來看,級聯式端到端神經網絡,系統從輸入到輸出,全程使用神經網絡算法,無需任何人工規則介入。當前,自動駕駛模型多為模塊化架構,感知預測、規劃、控制等不同任務分屬於多個不同的小模型,且下游規控環節普遍仍以規則為主。
而 “端到端” 神經網絡在輸入圖像後,可直接輸出轉向、剎車、加速等控制指令。為提升訓練效果,“端到端” 的大神經網絡可能由多個小的子神經網絡級聯而成。
但與傳統模塊化架構用 “規則” 連接模塊不同,級聯式神經網絡的子模塊是以 “神經網絡” 的方式自行訓練堆疊,因此可通過數據驅動優化整個端到端模型,避免 “局部最優,而非全局最優” 的困境。
端到端/神經網絡的核心好處在於模型迭代的關鍵由 “工程師” 變為了更易於規模化的 “數據和算力”,因而訓練效率和性能上限有望得到顯著提升。落到實處,中信證券認為,端到端方案所展示出的性能潛力有望大幅提升自動駕駛系統的接管水平,從而實現真正無可爭議的 L3 能力(例如達到每週接管 1 次)。
但端到端模型的 “黑盒” 問題目前產業界尚未有十分成熟的解決方案,因此中信證券認為,其最終能否邁向追求極致安全性的 L4 全無人駕駛仍待觀望。
