小鹏成“最像特斯拉的中国公司”?

资讯 » 新科技 2025-11-13

2025.11.13


本文字数:4836,阅读时长大约8分钟

作者 |新皮层NewNewThing 吴一凡

封图 |何小鹏

上个月,小鹏汽车的市值短暂超过了理想汽车,成为国内市值最高的造车新势力公司。然而「汽车」这个词,是两家公司都想快速甩掉的。

小鹏想要甩掉它的速度比理想还要快。

11月5日,小鹏汽车在广州举办科技日,slogan从去年的「未来出行探索者,面向全球的AI汽车公司」,升级为「物理AI世界的出行探索者,面向全球的具身智能公司」——仅仅是汽车的AI化已不足以满足这家公司对自身战略和市值的渴望。科技日中,小鹏汽车发布了第二代VLA模型,以及包括Robotaxi、第二代IRON人形机器人和飞行汽车在内的三大具身智能产品。

何小鹏认为,继互联网、移动互联网、数字AI时代后,数字世界和物理世界的融合将催生「物理AI」,机器将逐步拥有理解、交互和改变世界的能力。在这个概念下,小鹏汽车的业务涵盖物理AI时代的技术底座,从模型到芯片,从基础设施到上层终端,比如汽车、Robotaxi、人形机器人和飞行汽车。

这一战略版图被市场解读为小鹏汽车是最像特斯拉的中国公司。目前,特斯拉的市值已达到1.4万亿美元,小鹏汽车的市值214亿美元,和理想汽车差不多,高于蔚来汽车的170亿美元(注:以上市值数据截至2025年11月7日美股收盘)。

证明了其二代IRON人形机器人里没有真人之后,小鹏美股股价在11月6日盘中一度涨超14%,市值再度超越理想。

公司成立10年后,小鹏终于站到了一个多重意义上的高点——今年其汽车销量也大涨,销售规模超过此前领先于它的理想。然而对这家公司来说,接下来不确定的事比确定的更多:首先是其11月5日发布的第二代VLA到底是什么,然后是人形机器人IRON会走猫步到底是不是足够重要的创新,以及把未经量产验证的VLA模型放在Robotaxi上是否真的可行。

能够发布demo和能够量产是两回事,对智驾系统、Robotaxi和人形机器人都是如此。发布会结束后的媒体群访中,何小鹏也好几次提到,「最难的是能不能量产」。

接下来的2026年,也就是何小鹏给出的量产目标年份(包括第二代VLA、人形机器人、飞行汽车),将是小鹏汽车的关键一年。

第二代VLA到底是什么?

何小鹏在发布会上透露,去年,团队经过激烈讨论之后,决定并行开发两套智驾方案:第一代VLA和第二代VLA。前者的方案是V到L再到A,后者是V+L到A,也就是把L转移到了输入端。


何小鹏说二代VLA去掉了L,其实并没有。

他解释称,第一代VLA模型中间涉及两次语言转换,这会带来大量信息损耗,比如一段1200多字的文字描述也无法精准地「翻译」一个十几秒的视频,而以视觉为核心——把模型看到的世界直接转换成运动轨迹——仍然是不能放弃的方案。

于是,小鹏成立了两个研发团队,其中第二代VLA的研发由刘先明负责。到了今年二季度,在投入了3万张卡的算力、用了1亿视频Clips(何小鹏称,这个数据量相当于一个普通人驾驶6.5万年遇到的极限场景之和)、烧了20多亿元训练费用后,第二代VLA跑通,小鹏内部便停掉了第一代VLA的开发工作。

不过,第二代VLA「拿掉L」的说法让人感到困惑。「拿掉L」,本质上是回到了传统的VA模型,只不过模型架构可能从CNN切换成了Transformer。但实际上,小鹏的二代VLA并没有真的抛弃L,在何小鹏给出的模型架构图中,L被当作V的并行信号,同时输入给了模型,产出Action(动作)。但是这个作为输入的L是什么,何小鹏并没有在发布会上解释。

一个合理猜测是,L仍然来自对V的转译,只不过小鹏汽车并没有像初代VLA模型那样直接让转译产生的L输入运动轨迹、形成Action,而是再次利用了来自V的信号,让V信号和L信号共同对决策A产生作用,从而既利用了L的推理能力,又避免了仅仅将L作为决策表征时会产生从V到L的「转译」过程中的信息损耗。


特斯拉在ICCV 2025上分享的架构与小鹏二代VLA类似。

这个架构的逻辑与特斯拉自动驾驶副总裁Ashok Elluswamy今年10月在ICCV 2025上分享的架构类似。尽管特斯拉并没有表明这是否是他们最新一代技术架构,也没有公开更多细节,但从分享中可以看到,特斯拉也没有完全抛弃与V相关的多模态信号,而是让这种多模态信号一方面产生L作为中间表征,另一方面生成全景分割、3D占用、3D高斯表征等比原始多模态信号更高维的信号,然后让这类多模态感知信号与L的自然语言解释一起,共同决定输出的Action。

何小鹏在发布会结束后的媒体群访中给出的说法可以进一步验证以上猜测。「我们说V+L,(转译环节)没有变成人类的语言跟格式,而是变成了一个物理世界的新语言,所以它不是人类可见、可认知的语言。」他说。在特斯拉的FSD框架中,作为中间表征的L和多模态感知信号的融合信号,就是一种非人类语言。


袁婷婷分享的小鹏二代VLA中,世界模型是其一部分。

11月7日的上海进博会上,小鹏汽车自动驾驶产品高级总监袁婷婷分享了她对小鹏二代VLA架构的理解,其发言进一步支持了其架构与特斯拉FSD的相似性。袁婷婷称,「小鹏的二代VLA既是VLA模型,也是世界模型」。在其展示的PPT中,世界模型是作为二代VLA的一个记录器存在的:当V和L作出车辆运动轨迹和动作决策时,这个决策会被记录到世界模型中;同时,与这个决策一同被记录的,还有决策前的车辆状态,即V和L形成的感知信号。也就是说,小鹏二代VLA在用其VLA数据训练世界模型。


特斯拉也将世界模型与智驾模型做了结合。

特斯拉也在这么做,并且,它更进一步,会将世界模型预测的下一步世界状态输入给智驾系统,用以对智驾系统进行进一步评估和训练。

但除了架构上的不同,何小鹏并没有解释二代VLA为什么比一代VLA更好,以及它具备的哪些能力是第一代VLA不具备的。他只声称,「新一代VLA让小鹏自动驾驶的升级换代节点提前了近两年」,而且,二代VLA能在小路等复杂场景中表现得更好,在复杂小路的其平均接管里程将提升13倍,20公里的复杂小路仅需要接管1次。此外,他还提到,团队在测试中发现,二代VLA涌现出了未特意开发的能力,比如在红灯即将变绿的过程中,车辆开始缓慢地向前「蠕动」,以及看到路上有人招手就会自动停下。

在高速NGP(Navigation Guided Pilot,导航辅助驾驶)、城区NGP后,小鹏将上线「小路NGP」。明年第一季度,小鹏汽车将面向Ultra车型全量推送第二代VLA。另外,团队正在评估将第二代VLA迁移至Max车型的可行性。

造车新势力中第一个进军Robotaxi,但这项生意连特斯拉都尚未跑通

小鹏VLA模型的另一个落地场景是Robotaxi。

本次科技日上,小鹏汽车宣布将在2026年推出3款Robotaxi车型,同时启动Robotaxi的试运营,成为国内第一家进入Robotaxi市场的新势力车企。此前,蔚来汽车CEO李斌在2024年蔚来创新科技日上明确表示蔚来不会涉足Robotaxi领域,他并不看好这一商业模式;理想汽车CEO李想也在2024理想AI Talk节目中称自己不想做Robotaxi,想把精力放在私人用车上。

据何小鹏介绍,小鹏的Robotaxi针对L4智驾系统设计,采用前装量产模式,搭载第二代VLA模型,不依赖高精地图和激光雷达——这是当前行业内最激进的方案,全球车企中可以对标的只有特斯拉。


小鹏计划明年推出3款Robotaxi车型。

今年6月,特斯拉在美国德克萨斯州的奥斯汀市启动了Robotaxi的试运营,首批投入的运营车辆为改装后的Model Y,专门设计的Cybercab车型预计明年4月量产。其搭载的智驾方案仍处于保密状态,市场普遍推测,该车队运行的是一个专为L4设计的独立软件分支,技术水平领先于最近向公众推送的FSD v14版本。马斯克曾在2024年第四季度财报电话会议上提及Robotaxi业务时,使用了无监督FSD(Unsupervised FSD)这个概念。

另外,有研究员指出,FSD v14新增的「下车点选择」(Arrival Options)功能很可能是由Robotaxi项目中「下放」的。并且,FSD v14已具备路牌识别、复杂交通流预判等推理能力,其底层架构大概率包含VLA相关设计。

但特斯拉Robotaxi的实际进度还达不到L4,公司管理层在今年第三季度财报电话会议上透露,其Robotaxi车辆目前仍配有安全员。

资本市场对特斯拉Robotaxi的态度两极分化,将其视为高风险、高回报的典型。多家机构曾给出Robotaxi业务的独立估值,最高可达数千亿美元,但特斯拉必须向监管部门拿出FSD可以「无人」的安全性证明,而它坚持的纯视觉方案在技术可靠性上能否优于Waymo等玩家的多传感器融合路线,至今仍无定论。

这些横亘在前的技术、监管、路线之争的难题,小鹏同样无法回避。从L2辅助驾驶到商业上可行的、无人的L4自动驾驶,并非渐进式的过渡,而是要跨过技术与商业上的鸿沟。

商业模式上,小鹏表示不会扮演运营商的角色。目前,高德已与小鹏达成合作,后续小鹏的Robotaxi车辆将接入高德出行平台。另外,小鹏还计划推出私人模式的L4汽车,它与Robotaxi同源,拥有相同的硬件配置、安全冗余和智驾能力,面向C端用户销售,可以进一步分摊BOM(Bill of Materials)成本和研发费用。

去年小鹏还想让机器人进工厂打工,今年它推翻了这个战略

同样将搭载二代VLA模型的第二代IRON机器人则成了小鹏今年科技日最出圈的产品。它有性别设定、有仿人脊椎、仿生肌肉与全包覆的「皮肤」,能在台上轻盈、优雅地走猫步,引发了一场「IRON是不是真人」的大讨论,直到何小鹏第二天让露出机械骨骼的IRON重新登台走了一遍,争议才平息。资本市场的反应同样强烈:发布会当晚下跌近4%的小鹏美股股价,次日盘中一度涨超14%。


如果擅长提供情绪价值的雷军有弟子,何小鹏可以算一个。

事实上,小鹏人形机器人现阶段侧重的技术方向,并非行业内公认的难度最高的领域。人形机器人行业核心聚焦locomotion(移动控制)和manipulation(交互控制)两大技术范畴,IRON凭借「猫步」展现的是locomotion领域的优势,而更多玩家在攻坚manipulation技术,包括抓、夹、叠等精细操作——难度更大,多应用于工业、家庭中的生产场景。

何小鹏也不是没想过让机器人进入工业场景。去年,他还在科技日上表示,第一代小鹏IRON将进入小鹏P7+汽车工厂拧螺丝,然而今年他已经打消了这个念头。「打螺丝是我们两三年前认为人形机器人最容易进入的场景,但是试了一年多,(我们发现)它不是。机器人最难的硬件是手部,机器人进工厂之后,不到一个月手就坏了。一个手有多贵?可以请一个工人(干)几年。」他在今年的科技日上说。

马斯克就在为Optimus的手而头疼。他在特斯拉第三季度的财报电话会议上称,Optimus的手和前臂是一项极其艰巨的工程挑战,「从机电角度来看,前臂和手比机器人的其余部分更难,但实际上,为了制造一个有用的通用机器人,你确实需要一只不可思议的手。」

这导致Optimus的量产一直延期。最初,特斯拉计划今年量产5000台Optimus,但由于技术难题和供应链等问题,该计划不断调整,产量目标先降至2000台,直到今年7月只实际生产了几百台,并中途停产。据The Information报道,停产的原因在于机器人手部和前臂设计遇到重大技术难题,同时已生产的机器人存在关节电机过热、传动装置寿命短、续航能力差等硬件技术缺陷。

根据特斯拉最新公布的时间表,Optimus第三代原型机的发布将延期至明年第一季度,明年年底前完成第一条人形机器人产线的建设并启动量产,年产能100万台。第二条产线的产能规划是1000万台,用于生产第四代Optimus,但这一目标十分遥远。至于第三条产线,「可能会建在火星」,马斯克在几天前的股东大会上开玩笑说。

可以说,小鹏暂时绕开了这道难题,先把更多的精力放在了机器人的外观和移动上,「在人形机器人上,不同的公司会选择不同的商业化方案,在我们公司有一些规则,就是让我们的机器人不要有太多用手的操作,以及我们也想在机器人的智慧或者是智力方面,做一些循序渐进的发展。」何小鹏在采访中说。

他也明确表达了想要IRON尽快商业化的想法,但不是宇树那种能跑步、能跳舞的商业场景。「(机器人)可以做成非常好的秀,但不是我们真正要商业的目的。」何小鹏说,小鹏汽车做机器人项目最难和最重要的是「如何把它商业量产」,而「不是能够去融资」。基于这种战略选择,IRON将率先落地导览、导购、导巡等服务场景。他认为,在中国市场,综合考虑工作效率、技术成熟度和商业成本等因素,工厂并非人形机器人初期落地的最优场景;让人形机器人做家务的难度也极大——既无法保障安全性,也很难泛化。而要能完成拧螺丝、做家务这类任务,可能还要3到5年。

或许对小鹏来说,未来终究要直面并解决灵巧手的技术与制造问题。从locomotion到manipulation,后者才是制约整个人形机器人行业走向通用化、实用化的核心瓶颈。

微信编辑| 七三

第一财经持续追踪财经热点。若您掌握公司动态、行业趋势、金融事件等有价值的线索,欢迎提供。专用邮箱:bianjibu@yicai.com

(注:我们会对线索进行核实。您的隐私将严格保密。)



免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。由用户投稿,经过编辑审核收录,不代表头部财经观点和立场。
证券投资市场有风险,投资需谨慎!请勿添加文章的手机号码、公众号等信息,谨防上当受骗!如若本网有任何内容侵犯您的权益,请及时联系我们。