
作者|玄宁
邮箱|wangzhaoyang@pingwest.com
2024年4月,Humane AI Pin正式发货。
这枚别在胸口的小方块,几乎拥有当时AI硬件故事里所有的buzzword:没有屏幕,没有键盘,不用打开App,也不用低头看手机。你对它说话,它回答;你把手伸出来,它把界面投到掌心。

它不是第一个AI硬件,但它是第一个把野心全扔到你面前的AI硬件——手机太旧了,屏幕太旧了,下一代计算设备应该直接“长在人身上”。
它一诞生就吸引了万千关注,成为现象级的产品。然后,接下来,它很快就失败了。
不到一年后,惠普收购了Humane的部分资产,AI Pin停止销售,云服务关闭。一个曾经被很多人视为“后手机时代”信号的明星硬件,最后变成了AI硬件行业最昂贵的一次提醒:
Humane失败不是因为它不够未来,而是因为它没有回答AI到底需要什么硬件。
把大模型塞进一个新壳子里,不等于做出了新计算设备;把手机拿掉,也不等于用户就进入了未来。
不过这之后AI硬件没有降温。OpenAI还在做硬件,并且找来了Jony Ive。苹果没有说手机会被AI消灭,而是在Apple Intelligence里继续强调个人上下文、屏幕理解、跨App行动。meta继续押注AI眼镜。PLAUD这样的AI录音设备公司,则在一个窄得多的场景里,把硬件加订阅的模式跑了出来。
到了今年618,中国市场刚刚又给出了一个值得琢磨的信号。
独立开发者、AI Coding玩家、副业创业者等“最潮AI玩家”,正在集体给自己囤装备。Mac Mini、本地Agent设备、AI输入法、AI麦克风、AI眼镜、AI戒指,都成了这一轮AI消费里的新装备。但真正跑出来的,不是这里面那些科幻的设备。
今年618 AI硬件赛道的现象级单品,是同时拿下天猫、抖音、京东三大平台AI录音设备销量第一的钉钉A1。2025年8月首次亮相的钉钉A1,用了10个月时间便成为了国内AI录音卡赛道的第一。
这是AI硬件今天越来越明确的一个趋势——不是越像未来越容易成功,而是越能为AI提供真实数据环境,越容易先被大家买单。
1为AI做的硬件
AI录音赛道最早跑出来的是PLAUD。
PLAUD很早就意识到,这个品类不能只卖录音笔。它真正卖的是一个“把对话变成资产”的系统:硬件负责采集,App负责整理,模板负责把不同场景里的话转成会议纪要、访谈摘要、课堂笔记、客户记录、播客素材。
这是一条漂亮的单点产品路线。
但到了中国办公市场,问题会变复杂。
中国用户当然也需要记录、总结、转写。但在很多中国企业里,一次会议结束以后,用户真正需要的不是一篇漂亮纪要,而是接下来谁做什么,什么时候做完,怎么进群同步,怎么进待办,怎么沉淀到项目知识库,怎么进入CRM,怎么让下一次会议接得上这一次。
信息在这里不是孤立存在的。它必须流转。
所以PLAUD和钉钉A1的根本差异,不是硬件参数差异,而是产品路线差异。
PLAUD卖的是“记录”,钉钉A1卖的是“完成整个工作”。
前者解决信息丢失,后者解决工作推进。一个会议结束后,用户真正想要的不是一篇漂亮纪要,而是谁负责、什么时候做、怎么追踪、下次怎么接着开。
钉钉A1不是国产PLAUD,它是钉钉长出来的一只AI耳朵。销量登顶的背后,它做对的第一件事,是把硬件从一开始就设计成AI的输入器官,而不是人的记录工具。
很多AI硬件的产品逻辑,是先做一个新形态,再去寻找这个新形态到底能干什么。于是它们会有漂亮demo、强新鲜感,也很容易在用户买回去一周后变成抽屉里的电子收藏品。
钉钉A1的路径反过来。
它先选了一个AI 最缺、工作里又最高频的数据入口:声音。会议、拜访、咨询、面试、采访、电话沟通,每天都在发生。这里有客户需求,有项目决策,有口头承诺,有组织里的真实状态。过去这些信息靠人记、靠录音文件、靠事后小记,天然会丢失、变形、断流。

A1没有尝试去硬创造一个新需求,而是给AI补一块长期缺失的数据环境。这也是“为AI做硬件”和“为人做硬件”的区别。
为人做硬件,关注的是用户能不能更方便地记录。为AI做硬件,关注的是AI能不能持续拿到可理解、可结构化、可流转的现场数据。
这意味着,AI硬件的核心不再是“多一个入口”,而是“多一种数据环境”。过去的硬件把人的动作变得更方便,AI时代的硬件则要把现实世界变得更可计算。声音等数据进入模型之后,应该变成任务、关系、责任、风险、客户需求和下一步动作。一款AI硬件能把采集到的信息变成AI可使用、可追踪、可再次调用的数据,它才真正开始服务AI Agent。
更进一步,钉钉没有让这些数据停在“记录”里。如果只是个人使用,AI录音卡的价值是少写纪要、少丢信息;但钉钉A1的变化发生在数据进入组织之后。
以销售拜访为例,过去销售回去写小记,质量全靠个人习惯,管理者看到的往往是加工过、甚至失真的二手信息。现在,听记可以记录客户原声,AI提取需求、预算、竞品、下一步动作,再进入AI表格。100次拜访不再是100份散落纪要,而可以汇总成一张组织可分析、可追踪的客户信息表。
招聘面试也是一样。多轮面试的信息可以被沉淀和共享,避免重复提问,候选人的能力点、风险点和面评也能进入系统。
录音生成纪要只是内容生产;接入钉钉流转体系后,它才真正变成组织可用的数据。
所以,钉钉A1真正对应的趋势,不是“录音硬件会大卖”,而是AI硬件会越来越多地从单点工具,变成AI Agent进入一个复杂组织里工作流的入口。
这也解释了它为什么能在618全周期里同时拿下天猫、抖音、京东三大平台AI录音设备第一。相比于“一张会录音的卡”,它更多在卖的是一套“录音—理解—结构化—流转”的工作链路。硬件只是入口,后面的钉钉体系才是它真正被持续使用的原因。
2一个AI硬件背后的系统性投入
在618大卖,首先说明这是一款过硬的硬件产品。从硬件参数上看,钉钉A1的确有很多可以讲的地方。
A1做成卡片形态,只有3.8mm厚,可以贴在手机背后;它有6麦克风阵列,支持长时间连续录音。A1 Pro进一步加了触控屏、磁吸设计、2980mAh电池,还可以给手机反向充电,面向高频出差和商务场景。它还使用了MEMS指向麦克风,强化远距离拾音和抗干扰能力,用来应对大会议室、论坛、开放办公区这些复杂环境。
这些“硬”的部分,给一款好的AI硬件提供了基础,但今天作为一个为最大限度发挥AI能力而生的产品,与AI“软”的部分的结合也很关键。
为了让A1采到的声音真正可用,钉钉和通义在语音模型训练上做了巨大投入。这里面最重的是数据。高质量语音语料不像网页文本那样可以轻易获得,一个方言要做好,可能就需要上万小时高质量语料;行业词汇、会议场景、销售拜访、远场噪声,又都需要专门采集、标注和训练。数据之外,还有算力和算法投入。
据我们了解,钉钉听记背后这套语音模型的投入达到数十亿级别。
这也是AI硬件最容易被低估的地方。
外界看到的是一张3.8mm厚的录音卡,但真正支撑它成为AI硬件的,是背后那套为真实工作场景训练出来的模型能力。没有这部分投入,A1就只是一个更薄的录音笔;有了这部分投入,它才可能把声音变成AI能使用的数据。
此前钉钉内部的测试里,它的准确率从80%左右提升到97%,当时这个数字的意义不是多了17个百分点,而是产品从“可用”跨到“可信”。
一个聊天机器人答错一句话,用户有时会原谅它。但一个录音转写工具把会议里最关键的一句话识别错了,用户很难原谅。因为这里的错误不是“回答不够好”,而是工作事实被扭曲了。
所以,语音识别不是听记的基础功能。语音识别就是A1这类AI硬件的地基。
作为事实上阿里在AI时代第一个被市场验证的硬件产品,它带来的真实场景、真实语音、真实企业工作流里的复杂数据会反过来帮助钉钉听记、阿里整个基础模型体系里的语音模块,以及整个集团的AI基座能力继续迭代。AI硬件对于阿里来说一直都是一条从场景到模型、从硬件到基座能力的回路。这条链路一旦成立,AI硬件就不再只是外设,它会变成AI进入工作流的入口。

现在回头看Humane,会更容易理解AI硬件的问题。Humane AI Pin不是不够大胆,恰恰相反,它太想直接跳到一个没有手机、没有屏幕、没有App的新世界。但用户的真实生活没有同步跃迁,AI也没有拿到足够稳定的数据环境。
它看起来像未来,但没能帮助当下的AI真正开始做事。
这也是钉钉A1提供的行业样本。它没有试图取代手机,也没有重新发明一个设备宇宙,而是选了一个真实存在的高频入口,然后把新的数据环境接进模型、听记、待办、AI表格、知识库和组织工作流。
它带来的启发是,AI硬件不应该只是独立设备,它必须是协同生态的一部分,而且很可能是一个长在软件生态和组织流程里的产品。
今天的AI硬件已经彻底离开了概念阶段,每一个新产品都需要在真实的市场接受阶段性的验证。在这个过程里,新硬件入口的雏形才会逐渐显露出来。
相关文章
2026-06-230阅读
2026-06-230阅读
2026-06-230阅读
2026-06-230阅读
2026-06-230阅读
2026-06-230阅读
2026-06-230阅读
2026-06-230阅读
2026-06-230阅读
2026-06-230阅读