理想汽车2026 GTC发布MindVLA-o1模型,让车具备理解3D空间能力

资讯 » 新科技 2026-03-19

3 月 17 日,在 2026 GTC 大会上,理想汽车基座模型负责人詹锟正式发布下一代自动驾驶模型 MindVLA-o1。该模型统一了空间理解、思考推理以及驾驶行为,实现对 3D 空间的完整理解,且同一套 VLA 模型可同时控制车辆与机器人,将自动驾驶定义为物理 AI 的发展起点。


针对行业传统方案的技术瓶颈,理想汽车打造原生 3D ViT 视觉模型。传统 BEV 方案将场景压缩为俯视图,丢失关键高度信息;OCC 占用网络虽为 3D 架构,却缺少核心语义信息,无法判断物体可碰撞属性。MindVLA-o1 的 3D ViT 可通过视频流直接还原 3D 空间的位置、点云、语义与像素信息,训练中融合视觉的丰富语义与激光雷达的精准几何数据,引入前馈式 3DGS 表示对静动态场景分别建模,通过自监督学习实现场景未来状态预测,为决策输出高质量 3D 世界表征。

算力层面,理想自研马赫 100 芯片在标准大规模矩阵乘任务上性能较上一代提升 3 倍,为新架构车规级落地提供核心算力保障。

同时,该模型搭载新一代多模态思考框架,融合语言推理与空间推演能力,引入 System-2 显式推理机制与预测式隐世界模型,可在隐空间内高效完成未来场景模拟与复杂场景决策推演。

此外,理想汽车已搭建完整的具身智能 AI 框架,通过统一的数据引擎、VLA 模型、仿真系统与强化学习基础设施,实现模型跨智能体复用,推动基础模型向通用物理世界智能体持续演化。



免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。由用户投稿,经过编辑审核收录,不代表头部财经观点和立场。
证券投资市场有风险,投资需谨慎!请勿添加文章的手机号码、公众号等信息,谨防上当受骗!如若本网有任何内容侵犯您的权益,请及时联系我们。