游客發(fā)表
版權(quán)聲明:本文版權(quán)為網(wǎng)易汽車所有,理想轉(zhuǎn)載請注明出處。高管
網(wǎng)易汽車12月11日報道 近日,王興理想汽車自動駕駛研發(fā)高級副總裁郎鹹朋通過微博,興質(zhì)型方就宇樹科技創(chuàng)始人王興興此前提出的自動最好“VLA技術(shù)路線擔(dān)憂”進行了回應(yīng)。郎鹹朋明確指出,駕駛VLA是理想理想認(rèn)為最優(yōu)的自動駕駛模型方案,而具身智能的高管關(guān)鍵在於整體係統(tǒng)能力。這一表述不僅回應(yīng)了技術(shù)爭議,王興也提供了理想對自動駕駛未來發(fā)展路徑的興質(zhì)型方清晰判斷。
![]()
用效果說話:OTA 8.1是VLA方法論的階段性驗證
郎鹹朋強調(diào),“空談架構(gòu)不如看療效”,駕駛理想堅持VLA路線的理想前提,是高管基於數(shù)百萬輛車形成的數(shù)據(jù)閉環(huán)。OTA 8.1的王興更新為這一觀點提供了直觀驗證。感知能力的升級是首要變化,通過使用2D ViT技術(shù)將感知分辨率從1K提升至2K,識別距離從100米延長至200米,車輛能夠更早識別紅綠燈,實現(xiàn)更加平順和舒適的製動體驗。感知能力提升,為模型生成軌跡和控製信號提供了更高質(zhì)量的輸入,這與郎鹹朋提出的“模型必須與具身智能係統(tǒng)整體適配”高度契合,也說明具身智能不是單一大腦強就夠,而是係統(tǒng)協(xié)同的重要體現(xiàn)。
OTA 8.1在路徑選擇與決策能力上的優(yōu)化同樣顯著。在主輔路切換和岔路選擇等關(guān)鍵場景中,無效變道明顯減少,決策更加精準(zhǔn)。理想通過約600萬Clips優(yōu)質(zhì)駕駛數(shù)據(jù)對模型重新訓(xùn)練,使VLA能夠持續(xù)通過強化學(xué)習(xí)迭代,不斷接近人類駕駛邏輯。郎鹹朋同時指出,世界模型更適合雲(yún)端考場,用於仿真和數(shù)據(jù)生成,而車端推理仍由VLA執(zhí)行。這種車端務(wù)實、雲(yún)端高逼真訓(xùn)練的分工模式,體現(xiàn)了理想對係統(tǒng)架構(gòu)的務(wù)實思考。
![]()
VLA為何是理想的長期堅持:係統(tǒng)論邏輯下的生成式模型
郎鹹朋與王興興在觀點上最大差異在於,前者認(rèn)為模型關(guān)鍵不在於架構(gòu)本身,而在於與具身智能係統(tǒng)的適配度。VLA作為生成式模型,可直接生成軌跡與控製信號,表現(xiàn)出用戶反饋中的擬人化行為。通過結(jié)合大量真實數(shù)據(jù)與雲(yún)端仿真數(shù)據(jù)的持續(xù)迭代,VLA逐步形成對空間關(guān)係、交通意圖和駕駛習(xí)慣的理解能力。相比傳統(tǒng)端到端+VLM模仿學(xué)習(xí),VLA強化學(xué)習(xí)機製能夠處理“未學(xué)過”的場景,實現(xiàn)更廣泛泛化能力。
百萬輛車構(gòu)建的數(shù)據(jù)閉環(huán)是理想對VLA信心的核心。郎鹹朋指出,理想不僅擁有十幾億公裏的存量數(shù)據(jù),還通過150萬輛車獲取實時新增數(shù)據(jù)。在篩選過程中發(fā)現(xiàn),約40%的駕駛數(shù)據(jù)存在偏向道路一側(cè)或不嚴(yán)格遵守限速的現(xiàn)象,這些數(shù)據(jù)被保留以保持對真實世界駕駛行為的學(xué)習(xí)。VLA追求的是接近真實駕駛的自然行為,而非幾何意義上的規(guī)範(fàn)軌跡。
係統(tǒng)適配也在底盤層麵體現(xiàn)。以VMM(車輛運動管理)模塊為例,減速任務(wù)中車輛會根據(jù)策略劃分卡鉗製動與液壓製動比例,實現(xiàn)安全性和舒適性的平衡。這說明理想的技術(shù)體係不是單一模型,而是通過感知、模型、操作係統(tǒng)、芯片與底盤的全鏈路協(xié)同,將係統(tǒng)能力貫穿到每一個決策與執(zhí)行環(huán)節(jié)。從這個視角看,“VLA是否最優(yōu)”已經(jīng)不是孤立模型問題,而是係統(tǒng)架構(gòu)下的路徑選擇問題。
具身智能視角:VLA是通往“汽車類具身機器人”的關(guān)鍵
郎鹹朋的回應(yīng)還明確了理想未來發(fā)展方向,自動駕駛是具身智能,而具身智能不是單一技術(shù)點,而是係統(tǒng)能力的綜合體現(xiàn)。李想曾在內(nèi)部會議中指出,未來五到十年,具身機器人將呈現(xiàn)汽車類與人形類兩種形態(tài)。理想選擇以汽車類具身機器人為核心,這是其技術(shù)與產(chǎn)品戰(zhàn)略的基礎(chǔ)。
理想在具身智能方向的積累體現(xiàn)在感知、模型、操作係統(tǒng)、算力和本體的全棧協(xié)同。郎鹹朋強調(diào),“整體係統(tǒng)能力”才是具身智能的本質(zhì)定義,單項突破無法構(gòu)建真正的智能體。
VLA之所以成為汽車具身智能的核心,是因為它能夠理解物理世界,並在空間理解、思維推理與駕駛行為生成上形成統(tǒng)一邏輯。它融合視覺、語言與行為,具備鏈?zhǔn)酵评砟芰Γ山咏祟愃緳C風(fēng)格的軌跡,同時通過語言交互形成記憶與駕駛偏好。這正是理想堅持VLA作為長期技術(shù)路線的核心邏輯,也是其認(rèn)為VLA是“最好的自動駕駛方案”的根本原因。
![]()
結(jié)語:技術(shù)爭議仍將持續(xù),但路徑選擇更清晰
郎鹹朋的回應(yīng)並不是一場“技術(shù)路線之爭”的終局,而是一家深度投入自動駕駛與具身智能的企業(yè),基於技術(shù)能力、資源稟賦與產(chǎn)品策略所作出的長期判斷。
對於行業(yè)來說,VLA、世界模型、端到端等路線的爭論不會馬上結(jié)束,但隨著更大規(guī)模的車端部署、更成熟的雲(yún)端仿真體係以及更長期的數(shù)據(jù)閉環(huán)積累,技術(shù)路線最終會通過效果決勝,而非觀點決勝。
從OTA 8.1的體驗提升,到理想具身智能係統(tǒng)框架的逐漸清晰,可以確認(rèn)的是:理想正在用一個越來越係統(tǒng)化、越來越工程化的方式構(gòu)建其自動駕駛體係。而VLA是否最終成為定義行業(yè)的主流路徑,仍需時間驗證。
對於用戶與行業(yè)觀察者來說,此次回應(yīng)至少提供了一個清晰信號:VLA不是一個模型,而是一個係統(tǒng);自動駕駛不是一個功能,而是具身智能的第一場戰(zhàn)役。

相關(guān)內(nèi)容
隨機閱讀
熱門排行
友情鏈接