6 月 5 日消息,本周早些时候,人工智能开发平台 Hugging Face 发布了一款名为 SmolVLA 的开源机器人 AI 模型。据 Hugging Face 称,SmolVLA 在虚拟和现实环境中均优于许多规模更大的机器人模型。
注意到,Hugging Face 在其博客文章中表示:“SmolVLA 致力于普及视觉 - 语言 - 行动(VLA)模型的使用,并加速通用机器人智能体的研究进程。”SmolVLA 不仅是一个轻量级但功能强大的模型,更是一种用于训练和评估通用机器人技术的方法。
SmolVLA 是 Hugging Face 迅速拓展的低成本机器人软硬件生态系统的一部分。去年,该公司推出了 LeRobot,这是一套专注于机器人的模型、数据集和工具。近期,Hugging Face 收购了总部位于法国的机器人初创公司 Pollen Robotics,并推出了一系列可供购买的廉价机器人系统,包括人形机器人。
SmolVLA 拥有 4.5 亿个参数,这些参数有时也被称为“权重”,是模型内部决定其行为的组件。该模型是基于 Hugging Face AI 开发平台上共享的 LeRobot 社区数据集(专门标记的机器人数据集)进行训练的。Hugging Face 表示,SmolVLA 的规模小到可以在单个消费级 GPU 上运行,甚至可以在 MacBook 上运行,并且可以在包括该公司自身机器人系统在内的“经济实惠”的硬件上进行测试和部署。
有趣的是,SmolVLA 还支持“异步推理堆栈”,Hugging Face 称这一功能可以使模型将机器人行动的处理与视觉和听觉的处理分离。正如该公司在博客中解释的那样:“由于这种分离,机器人能够在快速变化的环境中更快地做出响应。”
SmolVLA 已可在 Hugging Face 官方网站上下载。已经有用户在社交平台 X 上声称,他们利用该模型控制了第三方机械臂。
值得注意的是,Hugging Face 并非开放机器人领域唯一的参与者。英伟达拥有一套用于开放机器人的工具集,而初创公司 K-Scale Labs 正在开发其所谓的“开源人形机器人”组件。此外,该领域的其他实力强劲的公司包括 Dyna Robotics、杰夫・贝索斯支持的 Physical Intelligence,以及 RLWRLD。
相关文章
2025-06-064阅读
2025-06-064阅读
2025-06-064阅读
2025-06-064阅读
2025-06-064阅读
2025-06-064阅读
2025-06-064阅读
2025-06-064阅读
2025-06-064阅读
2025-06-064阅读