作者|甲小姐
“我们现在确实是具身行业估值的‘撑伞人’。”采访伊始,彭志辉语气平静,却句句不虚。
这家成立仅两年的公司——智元机器人,已完成10轮融资,估值150亿元。这是一场高速度、高风险、高技术浓度的创业实验。在行业共识尚未形成、核心路径仍在分叉的今天,智元选择了最难的路线:全栈自研、自建工厂、自养生态。
很多人说他们“太大、太快、太不讲常识”,也有人评价他们“最有野心,也最危险”。而彭志辉说:“全栈战略不是做选择题,而是我们主动去选择最难的一道题。”
他是智元机器人联合创始人、CTO,也是“稚晖君”——那个在B站靠视频赢得280万粉丝尊重,如今试图在真实世界兑现通用机器人的人。当具身智能走入第二阶段的量产期,这家公司已经开始交卷。
这一轮对话中,我们聊融资,也聊产业变盘、技术收敛、开源生态、情绪价值、工程落地、AGI路径。他将表达本身看作“一个信息压缩和解码的过程”。
采访从当晚10:30开始,聊至午夜,是他近来仅有的空闲时段。
本文,甲小姐再次对话彭志辉。
1.谈近况:“我们现在确实是具身行业估值的‘撑伞人’。”
甲小姐:智元机器人刚刚完成B+轮融资,从2023年2月成立以来一共完成了10轮融资,估值已达150亿元,这是如何做到的?
彭志辉:首先感谢投资人的肯定,我们现在确实是具身行业估值的“撑伞人”,代表了目前国内具身创业公司最高的估值水平,可能是因为几点:
首先我们成立之初就明确了全栈自研、快速量产的战略方向;在技术路线上强调实用性和可复制性,希望真正能在生产力场景创造价值;还有我们团队比较多元化,全栈能力是靠团队来实现,这种能力比较稀缺,也让投资人比较看好。
甲小姐:每一轮融资时,你们的“核心叙事”有变化吗?
彭志辉:肯定不同阶段是不一样的。
刚成立时,我们需要证明我们能做机器人,主要靠技术原型和创始团队的背景;到了A轮就讲我们不止能做机器人,而且能够量产,我们执行得很不错,也得到了资本市场的认可;B轮及之后的阶段,我们要讲的是商业化——不仅能够量产,而且要能够有订单,有场景,有商业闭环。
整个叙事是从“能不能做到”,到“能不能量产”,最后到“能不能卖出去”这样的逻辑。
甲小姐:你们的投资人里除了财务投资人,还有比亚迪、上汽投资、长飞光纤、立景创新、百度风投、三花控股、腾讯、京东等产业资本,目前这些产业资本有给你们真实的订单吗?
彭志辉:肯定有,我们本身就希望以产投方为主,主要不是为了钱,因为我们确实不太缺钱,更多还是看重产业方的资源,他们有很多制造业的场景。但具体订单客户是商业机密不太好说。
甲小姐:虽然融资节奏密集,但智元对外释放的股权却并不多,持股最多的高瓴资本持股不到7%,其他投资人持股都不到3%,这种“广撒但不控”的策略是出于什么考量?是为了估值增长吗?
彭志辉:还是希望尽量把朋友做多。如果只是为了拿钱,只要我们愿意打开这个口子,融资肯定更简单。但融资也要看融资质量,我们还是希望投资人既是我们的股东,也能成为我们的客户或者资源提供方。此外如果把股份稀释得太多,也不是高质量的融资。所以我们现在也有意地控制融资节奏,要靠自身价值增长来支撑。
甲小姐:市面上的投资人对具身智能的看法有很多分歧和担忧。首先的担忧是技术路线的正确性——许多技术尚未得到市场验证。
彭志辉:我们的观察是,大语言模型的相关技术一般会在晚一年左右落到具身这个赛道。
前两年Transformer技术成熟了,大语言模型快速发展,现在基于Transformer的VLA(注:Vision-Language-Action,具身智能领域一种端到端的技术框架)成为了主流;大模型的Pre-Training在数据上遇到瓶颈了开始走Post-Training,RL成为重要的技术途径,再过一段时间就会落到具身上。
整个节奏比较清晰。大家可以通过观察大模型的发展来预判具身的一些技术路径。
甲小姐:另一种担忧是商业化时间表——成本、技术成熟度、商业化节奏是否协调?
彭志辉:商业化很考验团队基因,有的团队适合做B端,有的偏向于C端,基因不一样,打法就不一样。总的来说,现在已经到了快要交卷的时间点了。
甲小姐:下一个担忧是资金——资金消耗速度快,资本回报周期长,后续融资能否一直支撑?
彭志辉:其实相比于大模型,具身行业的资金消耗速度已经非常克制了。
做基座模型投入会非常大,但最后能活下来的很少。相比他们,我们的投入其实并不算特别大。
关于回报周期大家也有预期,具身要能成熟落地还要一段时间。自动驾驶比通用机器人难度更低,发展了这么多年其实都还没有非常成熟,所以具身肯定还要更往后一些,这个大家是有预期的。
甲小姐:还有一种担忧是是中美技术摩擦下高端芯片、传感器等核心零部件的供应链风险。
彭志辉:AI芯片更多的卡点是训练侧而不是推理侧。机器人现在更需要推理侧,每台机器人搭载一个边缘芯片。他怕的是你拿到他的训练芯片,做出更强的模型,这对他们威胁比较大。但推理侧反而是拓展他们的应用市场,他们是不会去卡的。当然,我们也在对接一些国产替代方案,比如AI芯片,我之前在昇腾团队,我们和华为昇腾以及其他国产厂商都有接触。
甲小姐:据不完全统计,从2024年7月至今,智元至少出资设立了8家合资公司,不少合资方为上市企业。此外,智元投资了6家具身智能产业链公司,有刚成立一年左右的初创企业,也有2家为上市企业控股的子公司。有人担心这会导致你们精力分散,此外与众多合资方组建公司可能带来潜在风险,如研发动作变形、迎合资方或客户需求而非市场需求等。你怎么看?
彭志辉:这是一个生态型产业,不是所有东西我们一家就能做完,我们也倾向于把生态伙伴培养起来,也能彼此促进。此外,资方没给我们什么压力,反而当我们发现有些团队很有潜力,也会介绍给我们的投资人。
甲小姐:整体而言,现在国内具身智能尤其人形机器人的融资环境如何?你给这个赛道现在的热度打几分?(满分10分)
彭志辉:我觉得现在的热度是8分。早两年热度非常高,甚至还有很多概念股,现在有一点点降温,大家价值理性回归了,更多会看能不能商业化,能不能真正带来价值。所以我们还是要保持清醒,保持冷静。
2.谈战略:“全栈战略不是做选择题,而是我们主动去选择最难的一道题。”
甲小姐:人形机器人发展至今,哪些“硬共识”已经浮现?哪些方面尚未形成共识?
彭志辉:共识是大家已经知道把大模型跟机器人结合是必须要走的路径;本体设计一定要充分考虑可量产性、可维护性,因为波士顿动力已经证明了一个本体如果成本两百万美金,根本不具备任何商业价值;还有算法和硬件必须协同优化和设计,才能真正体现具身的价值,而不是变成一个传统的自动化设备。
没有形成共识的是,本体方面,机器人是不是非得长得像人?两条腿的价值到底在哪?智能方面,是不是必须得走类人的认知路径?它的大脑范式是沿用大语言模型这条路径,还是会有新的范式会出来?
甲小姐:大脑范式,你是怎么看的?
彭志辉:它还没到工程问题的阶段,还是个科学问题,所以大家都还在探索。
我们对技术路径是开放的——我们既有非常务实的技术路径,比如用传统方法做感知,做简单的规划,到最后一厘米去执行的时候改成用数据驱动的端到端方法;同时我们也在做技术储备,在训自己的世界模型,让AI理解物理法则,具备物理的先验知识,这是更长远的技术路径;还有大小脑的融合,通往AGI的路,这些就长更远了,但我们也有一些技术储备。
甲小姐:有没有一个“你认为对、但行业还没接受”的方向,是你会赌一把的?
彭志辉:比如全栈,目前行业里我们是唯一一家做全栈布局的机器人公司。
甲小姐:智元机器人“开始即全栈”,软件、硬件、大脑、小脑、云系统等都做,甚至涉足控制器、伺服系统等底层件;直接在上海临港建厂投产;两年时间形成了“远征”“灵犀”“精灵”三个系列产品;既注重工业场景,也布局商业应用,还想着家用场景……主线支线皆投入,是否意味着你们在战略上从来不做“选择题”?
彭志辉:全栈是因为我们第一天就坚决认定通用机器人不是一个局部问题,而是一个系统工程。
如果你只做灵巧手,或者只做一个模型,你可能成为一个模块化的供应商,但如果要真正做出走进我们日常生活的机器人,必须要打通从感知决策到执行,从本体到大小脑的全栈闭环链路。
全栈战略不是做选择题,而是我们主动去选择最难的一道题。你也可以理解为是一种技术信仰,只有我们自己掌握核心,才能定义未来。
甲小姐:“什么都做”、“大而全”是很多创业案例的失败原因,所有人都在强调focus,为什么你们的选择这么“反共识”?
彭志辉:我们不是什么都做,而是该做的都做。我们会在关键环节上不做外包依赖,而是控制所有核心环节,因为这些环节之间是高度耦合的,不是一个可以局部优化的问题。
你不能把大小脑分开看,只有一个很强的大脑,结果四肢根本不协调,是打不穿场景的;你也不能把本体跟数据脱节,本体的构型、传感器的布置决定了数据的格式,这些都要耦合在一起。把这一趴外包给一家供应商,你会发现整体就达不到最优效果。这种整体性决定了我们必须全栈。
甲小姐:比如仅灵巧手这个赛道就涌现了非常多公司。假设做出全世界最优秀的灵巧手,不能满足你的愿景?
彭志辉:灵巧手我们也在自研,但我们觉得梦想要更大一些。我们的愿景是用智能机器创造无限生产力,只做一个核心零部件供应商和这样的愿景是没法匹配的。
甲小姐:在你们官网的价值观里,有句话“各领域均以成为行业内最佳为己任”,这句话现实吗?
彭志辉:求其上者得其中,求其中者得其下。如果想都不敢想,更不用说做成了。每一个模块、每一条技术路线我们都要有非常清晰的目标和路径,也要有敢想、敢做的精神。
甲小姐:全栈战略对资金储备是很大考验,你有信心后续的融资能支撑这种“大厂式打法”吗?
彭志辉:我们资金情况还是比较健康的,滚动式的融资能够支撑我们哪怕两到三年没有任何商业化收入,都能维持整个团队的运作。
甲小姐:你们既强调全栈自研,又开源了AimRT框架和灵犀X1设计等等,这是否会导致技术优势外溢?安卓开源、苹果闭环,智元想成为安卓还是苹果?
彭志辉:我们的做法更偏向苹果,软硬件都有很强的自主掌控力,但我们也不排斥对外开放。整个市场确实有足够大的体量,我们一家肯定吃不下,我们也希望培育更多的第三方伙伴和开发者。我觉得需要两者结合,从核心技术的掌控性来说,我们更像苹果,在生态方面我们更像安卓。
甲小姐:你们是否想过先打造苹果,之后再慢慢变成安卓,一定要同时做吗?
彭志辉:更可行的应该是先通过安卓去做生态,去实现自身的影响力,最后再考虑要不要封闭一些。
甲小姐:技术本身要靠开源生态来反哺?
彭志辉:对。
甲小姐:智元机器人是一家产品公司,还是一家平台公司?
彭志辉:我们应该是具备平台能力的产品公司。我们的核心任务还是做产品,把机器人卖出去,能干活,能体现场景的价值。但过程中我们也在逐步积累底层技术的标准、生态接口的能力。我们希望未来能够成为一个开放的机器人平台,前提是产品先跑通。
3.谈市场:“长线目标是瞄准生产能力的价值场景,但中间也有一些‘沿途下蛋’的策略。”
甲小姐:具身智能的市场很像一片巨大的森林,不同角色从不同方向出发,大家要在某个点汇合,但这个点的坐标是不确定的,市场在什么时候才会形成比较清晰的坐标?
彭志辉:我觉得坐标不是一个单点,它会是多点开花的状态。比如一些友商,仅科研教育都能打通整个产品逻辑,也属于被成功验证的落地点。
我们虽然长线目标是瞄准生产能力的价值场景,但中间也有一些“沿途下蛋”的策略:比如一些数据成果可以作为产品形态,卖数据服务,提供数据平台;再比如去年我们下线了1000台,很多去到了B2C的交互服务场景;最终肯定希望机器人能够进家庭,这才是未来可能达到万亿规模的巨大场景,实现马斯克所说的机器人数量超过人类。
甲小姐:有人认为,人形机器人需要有一到两家可以真正引领行业的企业,必须先一家独大,才能百花齐放。就像大语言模型的技术路线是收敛的,DeepSeek才能引爆市场。你认同吗?
彭志辉:大语言模型的技术路线是比较收敛的,目标客户也是重叠的,agent背后用哪个模型用户是感知不到的,模型是可以替换的。但机器人可以有不同硬件形态,针对不同场景、不同功能、不同的智能水平都可以形成差异化,不一定非得一家独大。
当然我们也希望某家巨头能真正把一个非常大的场景跑通,向大家证明现在已经到了商业化阶段,比如大家对特斯拉都非常期待。
甲小姐:你期待巨头去跑通而不是自己吗?
彭志辉:在国内可能是我们,但从整个行业来看,特斯拉从资源储备、技术能力、整体规模都是最有优势的,是行业标杆。
甲小姐:之前一位机器人领域的CEO和我讲,你看起来这是个万亿市场,但真正落到场景可能是一万个一亿的市场,是非常碎片化的。你认同这个观点吗?
彭志辉:早期会有这样的情况,但最终我们做的是通用机器人,我们希望有统一的硬件本体形态,统一的软件框架,统一的开发工具链,能统一的都统一,然后交由不同的解决方案集成商或第三方开发者,让他们去适配不同的场景。我们肯定不希望自己针对每个细分市场做定制化、做非标。
甲小姐:引领新兴行业的企业不仅要技术业务领先,也要完成行业定义,譬如iPhone定义了智能手机。你认为,谁会成为人形机器人真正意义上的“定义者”?
彭志辉:我们坚持要做全栈的原因之一,就是一定只有全栈的公司才有资格、有能力去定义一个全新的产品形态。
苹果从操作系统到芯片都自己做,特斯拉也是全栈都自己做,通用机器人也是一样的,我们是有条件去定义这个产品形态的。
甲小姐:人形机器人带来了很多“炫技”明场面,前空翻、后空翻、720度回旋踢、表演功夫,却普遍存在“视频demo惊艳,实际应用困难”的痛点。你怎么看视频demo营销的现象?
彭志辉:根本原因是在实验室拍视频是结构化的环境,而现实场景是非结构化的、开放的,这对本体和算法的泛化性、鲁棒性要求高得多。
我们不会为了炫技而去拍demo视频,除非这个技能对我们最后落地有价值。比如让机器人去做后空翻可能没有意义,但如果你的机器人摔倒摔不坏,还能爬起来,价值就远高于前者,这种我们就会去做,过程中如果效果比较好,也会放出一些PR视频。
甲小姐:从马拉松到格斗,人们在创造各种让人形机器人PK的场景,你觉得哪些靠谱,哪些只是噱头?哪些你们愿意参加?
彭志辉:节目效果都挺好的。马拉松要体现本体的稳定性和续航能力,不能说完全没有价值。拳击赛要体现运控能力,虽然大家看到机器人背后是人拿着遥控器,好像在打游戏,但里面也涉及很多动态环境和随机事件,比如什么时候会被对方踹一脚,什么时候被绊了一下还要保持平衡,这需要机器人本体的稳定性和运控的鲁棒性,这也是有价值的。
这些PK我们倒不一定都愿意参加,我们不会专门为这种比赛花很多精力去准备,但相关技术我们始终在跟进。
甲小姐:行业似乎还没有出现公认的benchmark,你怎么评价一款人形机器人?
彭志辉:我们自己提出来的叫“1+3”,一个本体,三个智能。一个本体是硬件水平,三个智能是运动智能、交互智能、作业智能。运动智能是基础,交互智能和作业智能分别体现情绪价值和生产力价值。
甲小姐:在国内,人形机器人有两股推力,一方面是政府自上而下的推动,另一方面是市场自下而上的推动,两股力哪个更大?
彭志辉:确实国内政府比较重视,像《2025年国务院政府工作报告》也首次把具身智能纳入,目前看来是政策推动在前,市场驱动在后。政府给了我们基础设施、政策支持、资金支持,但是真正推动整个行业往前走的还是真实的订单,和客户验证的需求。
甲小姐:二者所推动的方向是一致的吗?
彭志辉:当然是一致的。
4.谈技术:“技术路线的正确性不是来自死磕到底,而是能在关键时刻冷静判断,快速转向。”
甲小姐:人形机器人涉及的技术栈很广。这些问题里,工程问题、技术问题、科学问题占比大概多少?
彭志辉:不同阶段是动态发展的,明年初可能就开始“集中交卷”,在一些可落地场景上就到了工程化验收的阶段;而世界模型和一些更长远的技术储备,可能还要3-5年,这其中一半是工程问题一半是科学问题;最后是AGI,整个智能的范式还没有收敛,还是科学问题。
甲小姐:从技术成熟度来看,满分10分,你给现在的本体和智能各打几分?
彭志辉:本体目前可能七八分左右,特别是在国内,本体供应链有比较强的优势,我们也形成了标准的核心零部件,供应链也逐渐被培养起来了,一家供应商给我们做核心关节,相关技术也可以复用到其他公司,这块的门槛会越来越低。现在要做的是收敛到产品形态,我们现在有全尺寸的类人形态,也有灵犀这种1米2、1米3的小尺寸形态,未来是不是需要这么多产品形态呢?还是都收敛到一个形态?这个还在探索。
智能方面我觉得才刚起步。
甲小姐:智元定义了具身智能技术从G1到G5的演进路线(基础自动化→AGI),目前公司处于G2-G3阶段。你认为在实现G4(端到端操作大模型)和G5(AGI)的过程中,最难啃的技术“硬骨头”是哪一块?
彭志辉:最难啃的肯定是智能化水平。这方面我们投入了很多资源,我们做了整个行业最大的开源仿真和真机数据集,光去年就投了几百台本体专门做数据采集,我们也在研发自己的基座模型。智能化的门槛虽然高,但如果真正突破了,也最容易成为核心壁垒。
甲小姐:智能的天花板在哪里还不明确,你们有没有设置节点目标?
彭志辉:未来三到五年内,我们希望达到G4。再往后,因为技术的不确定性比较高,预测的价值就不大了。
甲小姐:智元启元大模型(Genie Operator-1,简称GO-1)提出了ViLLA架构(Vision-Language-Latent-Action)。这一架构的设计灵感是什么?
彭志辉:潜空间不是个很新鲜的概念,在CV等感知类算法里也有用到,大语言模型里也有相关概念,我们很自然地就把它联想到一起,实验下来比市面上其他方法效果更好。
甲小姐:GO-1的“小样本快速泛化”能力宣称可降低后训练成本,面对从未见过的物体或环境,如何保证成功率?
彭志辉:我们的ViLLA也属于VLA的衍生方法,所有VLA类方法都一个问题,比较容易过拟合到某些特定技能上,这是它的范式决定的——动作泛化和语言能力之间存在显著的trade-off,当你设置action更泛化时,language能力会显著下降,这是大家普遍看到的问题。所以ViLLA肯定不是我们具身探索的终点。我们也在尝试其他方向,VLA本身也在持续迭代。
未来我觉得可能是用一个方法把一个场景真正打穿,然后我们把全流程串通,而不是一开始就追求一个模型完全泛化,但每个任务的成功率都不太高,这反而很难落地。
甲小姐:伴随AI走入物理世界,有一个关键争议——物理知识的获取方式(数据驱动学习 VS 物理规则嵌入),比如Figure属于典型的数据驱动派。你更倾向于什么?
彭志辉:还是得融合。如果完全依赖数据驱动,在开放场景下的泛化能力会比较差,如果是纯物理建模,它又会比较慢,而且灵活性不够。所以我们尝试的是“以模型为先验,以数据为优化”——用物理规则约束空间,约束动作逻辑,通过数据驱动来解决最后一小段的泛化性。这个思路在抓取、插拔等任务已经看到一些效果。
甲小姐:LLM+Agent也能“干活”,你觉得Agent和机器人是什么关系?互补?竞争?替代?
彭志辉:我们可以把机器人看作agent的身体。用MCP来比喻,机器人就是MCP的一个server,agent可以作为client去调用server的能力,去跟物理世界交互。所以它们是协同,不是替代。
甲小姐:你对你们技术路线正确性的把握度有多大?有还存在摇摆的部分吗?
彭志辉:肯定有不确定性,我有七成信心,三成开放。技术路线肯定不是一成不变的,最重要的还是实事求是。我们会在半年内评估技术路径的可行性,如果发现某个模块长期无法闭环,会果断更换技术方案,甚至把它砍掉。技术路线的正确性不是来自死磕到底,而是能在关键时刻冷静判断,快速转向。
甲小姐:智元在数据方面投入力度很大,包括真机数据集建设、仿真数据平台开发、数据采集工厂建设等等,你们还发布了百万真机数据集开源项目AgiBot World,这里的成本和收益能算的过来吗?
彭志辉:我们不是为了开源而去做数据集,我们技术迭代本身就需要数据,只是顺手开源去提升我们的技术影响力。当然,我们开源的肯定是小部分,如果开源了100万,我们自己拥有的数据肯定更多。做数据建设本身就不是为了ROI。
甲小姐:“百万条真机数据量”对于行业来说只是杯水车薪,特斯拉的人形机器人Optimus至少需要数百万小时的数据才能完全准备好在特斯拉工厂工作,可能需要至少5亿美元的数据采集成本。如何彻底解决高质量真机数据稀缺的问题?
彭志辉:这是个问题,百万连零头都够不上,所以我们明年的投入会有数量级的提升,现在是刚刚起步。此外我们也不希望所有数据都是自己去生成,我们也在找一些商业模式,找一些合作伙伴,最终希望由整个行业共同来做数据贡献。
甲小姐:你们开源项目的社区参与度怎么样?有多少人在你们的开源生态里?
彭志辉:效果还挺好,我们的灵犀本体、运控框架的开源在GitHub上有几千个star,我们的数据集开源也经常霸榜。
甲小姐:有人说开源是在“做声量”或“做给投资人看”,你怎么看这种说法?
彭志辉:当然不是纯粹为了做声量,我们希望构建一个开放的生态,顺便通过社区反馈让我们更快迭代产品和模型——这个是根本,不是为了做给谁看。
甲小姐:X-Lab是智元于2024年6月成立的一个实验室,又叫“稚晖君实验室”,“稚晖君实验室”在做什么?
彭志辉:很多很多事。X-lab定位是公司创新的领头羊,X2就是从X-lab孵化的,还有新的哪吒机器人X2-N,后面还有很多形态。不止本体,我们在具身的三个智能方面也有很多创新工作。X-lab是全公司创新密度最高的一个部门。
甲小姐:有多少人在X-lab?
彭志辉:我有意控制数量,目前不超过20人。
5.谈商业:“注意力经济也是经济,情绪价值也是价值。”
甲小姐:机器人产业的“主赛道”已经成型了吗?
彭志辉:应该还没有,但是快了。明年差不多就开始交卷了,大家就能比较清晰地判断哪些是现阶段真正能落地的,大家都会往这方面聚焦。
甲小姐:主赛道可能是什么?
彭志辉:一个是制造业的生产力场景,另一个是交互智能的情绪价值场景。你也看到了拳击赛、马拉松,甚至可能会形成一些机器人IP,很多人愿意为情绪价值买单。
甲小姐:媒体报道智元机器人在2025年1月6日实现了第1000台通用具身机器人下线,这1000台机器人是哪款产品?
彭志辉:这已经是去年年底的数据了,现在还在持续出货。去年年底那1000台,精灵G1(面向数采)占差不多一半,远征A2(全尺寸人形机器人)占差不多一半,今年会更多。今年还有一个变量,我们新的灵犀产品线会上比较大的量。
甲小姐:这1000台机器人有订单了吗?是什么场景?
彭志辉:基本都是有明确的意向订单或者签约订单。场景有很多是B2C,我们交付给客户,客户结合自己的数据和需求做二次开发,再面向C端去提供一些交互服务的情绪价值。
甲小姐:你反复提及“情绪价值”场景,这和你们最开始的预期一致吗?
彭志辉:确实比我们想的要大一些。我们一开始更多是聚焦于生产力制造的场景。
甲小姐:结果发现情绪价值先行。
彭志辉:对,它是短平快,长期来看不好说,短期确实有需求。
甲小姐:去年你说,人形机器人最快落地的是 “PPT”,Pick(抓取)、Place(放置)和 Transfer(转运)。现在看情绪价值是不是更快的落地场景?
彭志辉:是的。注意力经济也是经济,情绪价值也是价值。
甲小姐:目前你们在售产品的定价和成本是什么关系?
彭志辉:B端和B2C的不同合作模式定价策略是不一样的,不会像C端做统一定价。成本跟量有很大关系,上千台和上万台的成本差距会非常大。
甲小姐:有没有一个“单位成本”的下降目标?
彭志辉:成本目标肯定是有的,这个是保密的,但肯定会比大家想的要低一些。
甲小姐:智元从成立到量产只用了一年多,这个节奏在你看来是快是慢?
彭志辉:既是很快的也是合理的。我们不是盲目追求冒进速度,而是在关键时间点做合理的决策,确保质量和可靠性才敢真正量产。整个进程符合我们的预期,也为我们未来的技术迭代和规模化量产打了很好的基础。
甲小姐:行业总体处于“小批量试产”阶段,在技术快速迭代、路线尚未收敛的今天,快速量产会带来不小的试错成本,万一量产产品低于客户预期怎么办?你们怎么设定容错机制?
彭志辉:其实整个制造业都会有这样的问题,比较通用的策略是“小批量验证+快速迭代”,以及模块化的设计等方式。我们主要还是订单驱动投产,有真实需求才会去推进量产。
甲小姐:既然你们迭代这么快,也许客户会想等一等,等半年、一年,能获得更好、更便宜的产品——是什么驱动客户此刻就下单?
彭志辉:所有数码产品大家都知道买新不买旧,但你不能说每代产品出来没人买,会有一些策略——一个是“现款可用”,现在的产品已经能够解决他们的部分痛点,他们就愿意买单;另一个是“未来可期”,我们提供完整的产品升级路径,包括软件OTA,包括硬件模块的一些更换。
甲小姐:量产背后,最难的一道坎是什么?
彭志辉:最难的是这完全是一个新兴产业,没有参考。我们在跟所有供应商共同成长。我们的核心零部件之前没有哪家能做到非常成熟的供应,我们就跟供应商共同研发,最后做到足够稳定、足够成熟、成本足够低。这是量产背后最难的题。
甲小姐:整体而言,哪些你们会自研,哪些会采购供应商?判断逻辑是什么?
彭志辉:有个原则是,市面上的标品能不能满足我们的技术标准?是不是成熟?成本是不是可控?是不是可量产?有没有协同演进的可能性?会有一些标准来确定是自研还是合作。
甲小姐:如果一个供应商达到了你们的标准,你们会倾向于直接采购吗?
彭志辉:也看情况,如果是非常核心的,我们可能出于可供应性和成本控制等还是会考虑自研,要看综合的性价比。
甲小姐:宇树的商业模式很简单,主打一款产品、卖机器、约定周期供货、坚持走标品路线、拒绝定制化、不做场景化探索。你们的商业模式的是什么逻辑?
彭志辉:我们应该是个三角模型,技术驱动+订单拉动+生态共建。
技术驱动指的是,技术上我们坚持全栈路线,未来只要发现某一点得到市场验证,我们能快速把所有资源都投入上去,很快跑出MVP;订单拉动,比如刚才提到的情绪价值场景,是由真实订单驱动的;生态共建,各种开源,以及行业标准的制定,我们都非常积极地去推动。
甲小姐:有观点认为,机器人公司一个大项目的成功,“工程占八、算法占二”。你是否认同?
彭志辉:不同阶段不一样,早期会被算法主导,你一定要有独到性和创新性,否则这件事为什么是你来做?落地阶段是工程主导。
甲小姐:今年目标营收是多少,怎么实现?
彭志辉:去年我们大概有一个亿的营收,今年目标是数倍增长。实现路径方面,一是订单确实有增长,包括已有客户的续签,也包括新产品的拓展;二是我们的产品矩阵在完善,从单一的本体销售可扩展到解决方案加服务的模式;此外是生态合作落地,我们甚至会主动投资一些生态伙伴,从数采中心、数据服务等等共建一些价值场景。
甲小姐:你觉得哪一天,智元才算真正站稳了?打通第一个场景?出货量过万?还是自循环盈利?
彭志辉:应该都不是。我们的标准还是要回归价值——我们的产品和技术对客户产生了不可替代的价值,我们具备了持续进化的能力,在某个核心场景下客户愿意长期采购我们的产品,愿意迭代升级,而我们也能靠盈利去持续投入研发,这时候可能就算站稳了。
甲小姐:你们的壁垒和护城河是什么?
彭志辉:一是全栈的技术体系;二是系统工程化的执行力;三是数据和模型的协同闭环,我们构建了基于机器人本体的大规模数据采集能力,这为我们的模型迭代和最后形成真正的智能壁垒提供了持续的燃料。
甲小姐:我们做一下情景模拟,如果未来出现以下情景,你会怎么办?场景A:家庭机器人市场爆发,但需放弃工业客户定制化需求。
彭志辉:我们一开始就非常坚定,不做定制化需求。
甲小姐:场景B:特斯拉Optimus降价至10万元,迫使行业价格战。
彭志辉:特斯拉如果能降到10万,说明这个行业真的成熟了,对我们是好消息,而且它80%的供应链都在国内,如果它能降到这么低,我们理论上能降到更低。
甲小姐:场景C:ViLLA架构被证明难以适配G4阶段任务。
彭志辉:持续迭代。技术肯定要实事求是,不是一锤子买卖,而是要敏捷动态地调整。
6.谈组织:“建立一个有全栈能力的公司比自己拥有全栈能力难多了。”
甲小姐:有人评价,宇树想做陆地上的“大疆”,智元想做具身智能领域的“华为”。你认同吗?
彭志辉:哈,这个类比有一定道理。大疆是一个极致产品和供应链效率驱动的公司,华为是技术全栈加生态构建的代表。这么一看确实是这个情况。
甲小姐:听说智元内部有一些老华为人。华为擅长后发优势,比如iPhone将智能手机定义清楚了,华为入场做手机,理想定义了新车,华为后来居上。华为擅长在技术收敛期通过工程化能力后来居上,但人形机器人仍处技术发散期,智元如何避免过于华为化?
彭志辉:整个行业是非常新的,我们在做的其实是先发优势,在技术范式没定型之前就下注了,而不是等别人定义好标准再入场。虽然有的公司认为谁家本体做好了直接抄就好了,但我们希望自己能参与定义这个行业。
甲小姐:哪些企业的经验是你会借鉴的?
彭志辉:像华为的产品研发流程是非常成熟且经过验证的,我们不是生搬硬套,而会取长补短,结合实际情况做一些优化和简化。我们也会借鉴特斯拉等高技术密度的公司,比如第一性原理、快速试错、极限压缩成本等工程文化,我们都会学习,也有像DeepMind、OpenAI这些在AI方面非常有前瞻性和系统性布局的公司,我们也会用他们的一些方法论。
甲小姐:智元今天有多少人?
彭志辉:算上工厂的蓝领工人和各种外包、实习生,可能有1000左右,还在持续扩展。
甲小姐:你的时间怎么分配?
彭志辉:我还是非常专注于技术,哪怕现在管理各方面非常忙,还是会投将近一半时间在技术,包括技术战略制定和一线技术细节、工程落地。
甲小姐:你是个全栈型工程师,自己拥有全栈能力,和建立一个有全栈能力的公司,哪个更难?
彭志辉:肯定后者更难。掌握很多技术是我的本职,但从组织层面要形成全栈的协同能力,需要解决系统集成、团队共识、流程效率等等各维度的问题,不是人多就能实现的。
甲小姐:你觉得理所当然的全栈选择,对团队而言是压力吗?
彭志辉:是有这个压力。当然我们招人的要求是很高的,要技术背景比较硬,也要追求极致,符合公司的价值观,所以这个压力是我们共同去面对的,大家都乐于挑战,既是压力也是动力吧。
甲小姐:一个快速壮大的新鲜团队如何有效协同?
彭志辉:我们非常重视技术共识的建设,也会做一些模块化的组织架构设计,让各个组自主闭环的同时,也能快速跟其他模块进行对接交流。当然组织的成熟是个动态过程,随着公司规模到不同阶段,会有不同的策略和方法。
甲小姐:在宇树科技,王兴兴依然是最高掌权者,集CEO与CTO于一身。在智元机器人,你和CEO邓泰华是怎么分工的?
彭志辉:我跟邓总非常互补,我更偏技术,邓总更偏商业,分工非常清晰。邓总更多负责公司整体运营、战略融资、生态合作等等,我聚焦在技术路线、产品定义、工程落地等等。我们的目标一开始就是一致的,才会决定一起做这件事。
7.谈自己:“既然选择做公众人物,就必须接受被期待的代价。”
甲小姐:你是坐拥280多万粉丝的B站UP主,是公众眼中的“野生钢铁侠”“华为天才少年”“全栈工程师”。网红身份带来的关注度和技术公信力,对你是压力吗?
彭志辉:说实话是有些压力。做B站也是偶然事件,纯粹是出于兴趣分享一些DIY作品,结果越做越大。后来每次发视频前还要想一下这个内容能不能代表我现在的水平,会不会让别人误解我的技术风格等等,还会有些顾虑。
甲小姐:偶像包袱?
彭志辉:哈哈,有那么一点点。
甲小姐:有没有不想活在滤镜里的时候?
彭志辉:肯定没有人想一直活在滤镜里。我其实更新已经很克制了,创业之前每年也就更新两三个视频,创业之后更新频率更低了。我也想过干脆这个账号就不维护了,掉粉就掉粉吧,但另一方面我也意识到广大群众对我的关注也是一种责任——如果能用我的影响力让更多人了解AI、机器人的价值,它就不只是“网红”两个字那么简单。既然选择做公众人物,就必须接受被期待的代价。
我们内部讲,最好的状态是处在聚光灯的边缘,不要在正中心,也不要让大家完全看不到你。
甲小姐:今天,公司和你,谁在拉着谁走?
彭志辉:早期我的个人品牌确实帮助公司更快地建立起认知和信任,包括人才招聘、产品曝光等等。但现在公司的发展也在推动我个人不断去升级认知,督促我走出舒适区。早期是我带着智元起步,现在是智元推着我走,彼此都在成长。
甲小姐:如果你明天离开智元,公司还能跑下去吗?
彭志辉:现在公司离了谁都不会活不下去。但确实我个人的一些特质,比如工程师文化和很多想法已经比较深度地融合到了我们的产品以及技术战略里,还是会有我的痕迹在。
甲小姐:你在B站既能做产品,又能做内容,不仅强于工程师角色,也强于“工程师的表达能力”,这种表达能力对智元机器人的重要性有多大?
彭志辉:还是很重要的。我是个i人,我的表达能力也经历了锻炼的过程,在做自媒体的过程中有很大提升,现在公司也会推着我往这个方向去,因为你作为管理者,不能不去对外表达,你技术再牛,如果讲不清楚它的价值、逻辑和潜力,就很难吸引到合适的人才、投资或者合作伙伴。尤其当下我们做的事没有前人可以参考,也没有行业标准,表达能力不仅是对外传播,也是对内统一认知的过程。
我本质上是一个工程师,我觉得表达本身也是一种工程能力——你要把复杂的问题结构化,用通俗的语言讲清楚,这本质上是一个信息压缩和解码的过程。
甲小姐:创业两年,哪些超出你的预期?哪些低于你的预期?
彭志辉:超出预期的是:量产速度比我们想象的快,市场需求比我们想象的大。一开始我们甚至还有一个支线做清洁机器人,现在就逐步把它分离出去,因为通用机器人的发展比我们想象的快;团队的成长也比我想的快,早期很多技术骨干现在都成为能独当一面的负责人;此外,客户的接受度比我们预想的更积极,现在都是客户催着我们发货,催着我们迭代,而不是我们做出来没人要。
低于预期的是:生产力进制造场景的难度比我们想的更大,AI的泛化能力对操作精度、可靠性等各方面的要求还有待突破,但目前也有阶段性进展。
甲小姐:很久以后,当人们回望智元机器人这家公司,你希望它是如何被记住的?
彭志辉:当然希望能推出很多爆款产品,但我希望大家记住的不是某一个产品,而是智元机器人是一家真正能够推动人形机器人从科幻走向现实的公司。在未来把技术闭环打通、让机器人走进真实场景的那个关键节点,我们也许不是最早的那个,但是是走得最稳、最远的那一个。
未来有一天,当人们看到机器人走进工厂,走进家庭,那个时候人们会说,噢,原来当年那家公司就是在做这件事。这就可以了。
相关文章
2025-06-236阅读
2025-06-236阅读
2025-06-236阅读
2025-06-236阅读
2025-06-236阅读
2025-06-236阅读
2025-06-236阅读
2025-06-236阅读
2025-06-236阅读
2025-06-236阅读