在AI大模型兴起以前,车企谈智能驾驶,一般都将重点放在算法或者芯片算力上。但是随着AI大模型的迅速铺开,自动驾驶的技术路径开始飞速,从CNN、RNN、GAN到Transformer大模型转变,曾经主流的轻高精地图城区智驾,逐渐被“端对端”所取代。
从抢先吃螃蟹的特斯拉,到跟随而至的问界、理想、小鹏,端对端智驾正在像雨后春笋一般,迅速在智能车江湖迅速展开。
端对端成智驾新风口
据公开信息透露,小米端到端全场景智能驾驶,于不久前开启定向内测;零跑B系列和C系列将于2025年实现自研端到端大模型智驾系统上车;蔚来计划明年1月推送用于智能驾驶的端到端大模型架构。在此之前,理想、问界、小鹏、比亚迪等诸多车企,都纷纷公布了自家的端对端解决方案。不难看出,在当下这个时点,端对端智驾解决方案,早已经成为了车企必选的智驾路径。
首先,从技术上来看,端对端技术迭代较快、路径短、信息损耗小,对加速L4级智能驾驶到来非常有帮助。“端到端”模型将感知、规划与控制三大模块整合在一起,消除了模块间的界限,简化了系统架构,提高了运行效率。整合后的模型能够更快地处理数据,提高系统的响应速度,加速智驾的去高精地图化。
基于这一点,特斯拉首先将端对端技术应用在了FSD V12上,并取得了显著的成绩,让行业内外的从业者和用户,前所未有地感受到了这种技术的魅力。比如,小鹏汽车董事长何小鹏认为,端到端大模型将让自动辅助驾驶过渡,到完全自动驾驶的时间大幅缩短,2025年小鹏汽车就能在中国实现类L4智驾体验。轻舟智航CEO于骞认为,端到端技术逐渐把非机器学习的部分挤得越来越小,整个系统完全通过数据驱动来实现智能驾驶能力……
虽然从当前来看,端对端或许并非最优解,但它能够处理传统路径难以解决的极端案例,并且代表了一种减少人工编码依赖更高效的思路。或许正是基于此,行业内外前所未有地在端对端技术方案上,达成了空前一致。
其次,从成本上来考虑,端对端技术在成本上比感知模型更省钱。其实,早前国内只有30万以上的车型才会匹配智驾模式,而在更低的价格段则几乎没有。说到底主要还是之前的技术不成熟,导致智驾的成本过高所致。但在行业去高精地图和硬件之后,相关的智驾方案变得越来越亲民。
比如,大疆表示7000元就能解决城市NOA,且电车油车都能用;行业第一批AI+双目方案,4000元就能实现领航辅助功能。模块化智驾上,元戎启行已经将整套智驾解决方案成本下探到2000美元,同样是激光雷达+摄像头,硬件成本已经下探至7000美元。
相比以上方案,端对端方案的成本更省,依靠纯视觉方案其去掉了所有激光雷达,变成了纯软件驱动的技术,技术可以不断迭代、成本可以无限下探,这正是特斯拉可以不断降价的原因所在。在技术与成本叠加之下,端对端的技术方案,自然就成了国内智驾路线的核心趋势。
华为、小鹏们较量的新战场
事实上,与前几年消费者普遍对国内智驾方案存疑不同,随着近两年国内智驾水平的上升,特别是端到端带来的新的算法和模型的应用,正在给消费者带来前所未有的全新体验,这就使得市面上汽车是否标配智驾,越来越成为消费者选择电动车的重要标志。在此背景下,端对端技术方案日益成为华为、小鹏等车企角逐的新焦点。
一方面,通过升级端对端智驾方案,可以从价格与用户体验上吸引消费者,从而帮助车企卖更多的车。根据乘联会联合科瑞咨询发布的数据,2024年1~8月,中国新能源乘用车L2级及以上的ADAS功能装车率达到66.6%,同比大幅提升21.0个百分点。另据盖世汽车研究院配置数据,今年1~8月,国内市场高速NOA累计配套量已超93万套,对应渗透率达7%,城市NOA也开始规模化上车,渗透率已达1.3%。
按照业内人士估计,明年将是自动驾驶的决胜年,NOA等高级智能驾驶功能,将普及至10万元左右的车型,预计明年NOA的市场渗透率将超过40%。不难预见,随着更具成本优势的智驾方案落地,城市NOA下沉到10万元级的车型越来越近,并逐渐呈现出一个普及化的趋势。对于车企来说,谁的智驾方案好、体验佳、车型性价比高,谁就可以大量卖车,谁就能够赢得市场。
从这个角度上来看,无论是小鹏MONA M03等新智驾车型的爆发,还是蔚来、理想等车企新规划的大众车型,都在朝着这一方向去努力。于车企而言,在电动化、性能、续航差不多的情况下,智驾已经成为车企影响消费者心智的关键变量。低成本的智驾方案,则能够兼顾大众需求与车企卖车的需求,极大增强车企的市占率,并且通过走量的“智能车”,帮助车企快速积累高质量、有价值的专业数据,为更高级的智驾方案打下坚实的基础。
另一方面,通过升级端对端技术,加快整个车企智驾能力的升级,倒逼车企升级汽车的底层算力能力。从行业经验来看,端对端技术的落地,不仅面临技术路线和数据的考验,还面临庞大的算力需求考验。以端对端做的最成功的特斯拉为例,在2024Q1财报电话会上,特斯拉表示,公司已经有35000张H100 GPU,并计划在2024年内增加到85000张H100以上,达到和谷歌、亚马逊同一梯队。
在这一规模预期之下,马斯克近期表示特斯拉已经不再算力紧张。国内,小鹏“ 扶摇 ”自动驾驶智算中心,算力可达600PFLOPS(以英伟达A100 GPU的FP32算力推算,约等于3万张A100 GPU),并宣布今年投入1亿美元用于算力建设,未来每年将进一步加大投资。商汤大装置已经布局全国一体化的智算网络,拥有4.5万块GPU,总体算力规模达12000PFLOPS,2024年底将达到18000PFLOPS。而从目前国内的情况来看,大多数研发端对端的自动驾驶公司的训练算力,仍停留在千卡级别。
不难预见,随着端对端智驾技术的逐步深入,数据、算力的竞赛,将成为接下来所有车企竞争的重点。
新阶段的现实考验
随着端对端技术路线逐渐发展成主流趋势,车企的竞争焦点也发生了转变,已经不再单纯地比拼城区NOA功能的开城数量,而是更加注重为用户提供优质的驾驶体验。在次背景下,从“车位到车位”日益成为车企竞争的新焦点,与此同时数据激增、商业化挑战、新技术风险等也正在成为新的挑战,考验着每一个车企。
首先,随着围绕用户体验展开的VLA模型升级,汽车所用的算力在快速飙升,其对硬件算力和数据资源闭环的要求也越来越高。前文提到随着技术的不断发展,端对端2.0逐步进入围绕用户体验而展开的新阶段,在该阶段此前备受瞩目的“端到端+VLM(视觉语言模型)”,开始向“VLA模型”迭代。
作为一个融合视觉、语言和动作的多模态模型,旨在提高模型的泛化能力和判断推理能力,可以简单看作是端到端+VLM系统的一个全面融合体。相比以前的VLM系统,它背后对资源的消耗更大、对数据闭环的要求也更高。有观点认为,部署VLA模型对芯片算力的要求,提升到英伟达DRIVE Thor级别,算力达750 TOPS。相比之下,当前高阶智驾的算力硬件通常配备的是2颗英伟达OrinX芯片,总算力为508 TOPS,差的可不是一星半点。
除了算力挑战之外,数据问题带来的挑战远超外界想象。小马智行的CTO楼天城曾表示,想要训练出高性能的端到端模型,数据质量的要求比一般性能模型高出几个数量级。单论数据而言,目前国内车企的数据储备基本均落后于特斯拉,还处于初期阶段。加之对数据质量的要求,国内车企离数据积累的“长跑终点”仍“遥遥无期”。
其次,随着端对端技术的持续升级,在堆数据、堆算力等诸多高门槛操作之下,车企的试错成本在逐步升高,商业化也面临市场检验。前文提到,随着端对端技术的升级,车企端对端对算力、数据的闭环考验越来越高,车企为此付出的代价也越来越大,车企入场需要考虑效率与成本的平衡问题。
另外,即便是完成了开发交付,端对端的验证落地也面临诸多考验。车企直接实车验证显然成本过于高昂,基于云端测试可能与实际情况并不匹配。在市场层面,消费者也存在着一种矛盾心理:一方面,消费者对于汽车“智能化”和自动驾驶的兴趣与期望在上升;另一方面,它们的支付意愿却在普遍下降。所以,即便完成了端对端智驾的量产,倘若市场不买单,一切愿望也将化为乌有。
从这个角度上来说,端对端智驾的进阶,不单单是技术、数据的比拼,更需要市场对其商业化的实际认可。
文章评论(0条评论)
登录后参与讨论