如果说,2025年开年的行业爆点,是由DeepSeek带来的深度思考模式。
那么今年年初这股通用AI Agent(智能体)浪潮,则与MCP(模型上下文协议)一起,成为接下来一段时间各家厂商着重去思考、发掘和推广的关键。
就这段时间,字节出品的 Agent 产品「扣子空间」开启了开放测试。说得直白一点,就是终于不用排队,也不用折腾邀请码,直接进入到和豆包一样,每个人只要拿账号登录一下就能用的常态化状态了。
(图源:自制)
挺好的,毕竟直到开放测试我也愣是没挤进去过……
总之,趁着这次开放测试的机会,我也是赶紧进去「扣子空间」里面测了一波,在单日限制的任务上限用完之前,我是先把最近上线的功能和Agent都好好体验了一番,顺便把我平时那些琐碎的工作任务也都扔给它试了一下,最让我眼前一亮的,还得是最近更新的「AI播客」功能!
至于它到底能做什么,在哪些方面前途可期?跟着我看下去就知道了。
现在想用「扣子空间」,操作还真挺简单的。
打开「扣子空间」官网 (https://space.coze.cn/) ,登录账号,然后就会自动进入到这个异常简洁的主界面。
(图源:自制)
而我要做的第一件事,就是让它帮我生成一档播客。
看过我过去文章的读者应该知道,小雷一直都是中文播客/电台的忠实听众,特别是在驾驶、运动、打扫卫生的时候,没有一段富有感情且有趣的播客,干活的动力起码得锐减个50%,有的时候甚至就懒得动手了。
有句话说得好,“看客成不了把式,心热终须落手来”。这播客听多了,自己也动过录个播客的心思,只可惜工作太繁忙、台本没着落、嗓子又不好,每次稍有动心,就会被自己拿更多的借口给硬压下去,到头了还是“摸了”了事。
这不是正好,可以拿刚更新的「扣子空间」来折腾一波。
为了测试AI转播客的效果,我特地准备了三种不同的测试场景。
首先是第一种场景,我们随便在微信公众号里头找一篇文章,就拿「扣子空间」最近发的Agent搜图这篇文章做例子,直接给它提供对应文章的网址链接,然后向它提出简单直接的要求就行了,就像这样:
https://mp.weixin.qq.com/s/aJhiRs8LQbdI2XYk6qAQWg,根据这篇推送内容,生成5分钟以内的双人播客、输出一个音频文件可以看到,「扣子空间」会自动分析这个任务的步骤,然后依次执行读取网页、编写双人播客脚本,最后调用gen_podcast工具生成播客音频文件,总共耗时大约2~3分钟,你就能得到一段由两个AI主持人进行“深度探讨”的中文音频播客。
(图源:自制)
这是小雷的测试案例,感兴趣的读者可以自己点击去听一下:
https://space.coze.cn/s/ngw8qpfsl7A/
本播客由扣子空间(coze.cn)一键生成。
接下来,第二种场景,则是我本人提供文本,文本内容是我大学混游戏论坛时,为了水经验而写的《CRPG简述》,共计5000字左右的内容,刚好可以看一下这种游戏类亚文化内容转写的效果如何。
同样,感兴趣的可以点进去收听:
https://space.coze.cn/s/aF8L0Az2HVA/
本播客由扣子空间(coze.cn)一键生成。
最后是第三种场景,本人称之为空手套白狼,也就是我这边只提供一个有争议的论点,让扣子空间自己凭空生成播客的脚本,然后再自动完成一键转播客的操作,算是所有场景之中使用门槛最低、实现难度最高的一种。
论点这边,我选的是今年在二次元圈子里颇有争议的一个话题,“Ave Mujica算是一部烂片吗?”
https://space.coze.cn/s/EMMiAUqRMfg/
插入音频,本播客由扣子空间(coze.cn)一键生成。
三段播音都完成了,接下来是我的感受部分了。
从播音上来说,「扣子空间」生成的中文AI播客,可能是目前我体验过的同类产品里拟人程度最高的。
这是我的个人经验啊,目前市面上的中文AI播客普遍存在着脚本死板、互动不足的问题,就你听它的内容,你会发现两边的主持人虽然说话会有抑扬顿挫,但是对话的推进却是极其机械化的,这种反差感会让人非常的不适。
而「扣子空间」不同,它的播客功能显然对人类的聊天方式略有研究,特意让这场对话没那么的“连贯”,两位主播都会有一定程度上的停顿、思考和试着掌握插话的时机,让这个内容看上去更有“人味”了一点。
(图源:自制)
在我看来,他们的互动模式甚至令人联想到传统的相声表演:一个主讲,一个捧哏,还见缝插针地进行点评和总结,不仅节奏流畅,提炼的观点也还算准确和简洁,使得整个过程基本没有什么照本宣科的生硬感。
要说还有什么小瑕疵,那偶尔会出现较长的停顿和音调的拉高,这个之后应该还要优化一下。
从内容上来说,「扣子空间」很会抓重点,它可以将稿件打碎,并用口语化表达,在两人一唱一和中表达出来。
以第二段播客为例,女主播从《神界:原罪2》这款游戏作为引入,然后男主播负责进行讲解,二人围绕着CRPG游戏类型的定义、CRPG游戏的起源以及发展过程,讲得那叫一个头头是道,生成的网页最后还附上了CRPG的发展简史。
(图源:自制)
至于第三段播客,更是从开头到结尾全部都由「扣子空间」自己操刀,当我听到男主播真的在那里分析Ave Mujica究竟为什么塌房、所有的角色都变成了推动剧情的工具人和官方一以贯之的烂炒是不是祸根的时候,你能想到我脸上的表情有多难绷得住。
对了,对应每个AI播客,「扣子空间」还会自动生成一个标准化的播放界面。
从各种意义上来说,这体验都有点超纲了。
当然,作为「初稿」,目前扣子AI脚本的严谨性有余,趣味性一般;可控性也比较有限,目前仅支持调节播放速度和播放进度,不支持自定义主播A、B的声线,也无法实现音频编辑、音效库之类的专业播客功能,但最终的成品已经足够令人惊讶。
写完文章,随手生成一段放在里头,这个效果我觉得已经是绰绰有余了。
用过之前内测版「扣子空间」的人,对探索模式和规划模式应该都不陌生。
事实上,两个选项的功能都有文字描述,如果拿现在最潮的电车来举例的话,探索模式就是L3级自动驾驶,而规划模式充其量就是L2级辅助驾驶,基本上就是完全自动和半自动之间的区别,前者更加省事,后者可控性更强。
问题是仅通过文字描述,大部分人可能很难理解两个选项生成的步骤和结果会有哪些不同,而突如其来的选项反而可能会让人更加疑惑。
接下来,我要告诉各位选择困难症患者一个好消息。
你们不需要再犹豫选哪个了,因为现在「扣子空间」上线了自动模式,可以自动根据任务复杂程度,帮你从两个选项中选一个模式来进行操作。
(图源:自制)
所以接下来的操作,自然也都是在自动模式下进行的。
既然号称是「实习生」,那肯定得先把我的任务给它分过去一些。
刚好我最近在做一个手机横评企划,需要制作一张选品之间的配置比较表格,这杂活就直接扔给它了。
以往想要实现这个效果,我需要自己一个一个页面翻过去,收集对应的产品参数、记录当前的产品价格,甚至还要自己去设计表格的视觉效果,哪怕有了大模型,也不过是得到一堆文本,依然需要自己查验、整理、筛选、设计。
就这样一张表格,有点耐心的读者可能还会看看,没有耐心的读者基本上一秒钟就翻过去了,多少让人有点悲伤。
如果把这个任务交给「扣子空间」呢?
那你会在三分钟内,得到像这样一份参数信息异常详尽的表格文件,甚至可以导出为PDF文档方便二次创作。
(图源:自制)
要换我来折腾这个,没小半天绝对折腾不出来。
其中面对vivo S30 Pro这款未发布的产品,「扣子空间」居然会去主动搜集既有的爆料信息,着实令人惊讶。
更牛的是,这还没完!我又想,能不能再完善一下,把这个表格做成一个完整的前端项目,做出一个可互动的手机参数对比网站?!
答案是可行的,它真的帮我构建了一个效果相当可以的可互动网站。
(图源:自制)
手机打开效果更佳,强烈建议大家去体验一下:
https://space.coze.cn/s/rcvtAsEzpGU/
虽然整体生成经历了不短的时间(将近20分钟),但对于一个完全不懂网页制作的用户而言,扣子智能体已经很好地解决了工具有无的问题。
最后,来个相对长期的任务。
我本人是个二偶迷,正好可以让「扣子空间」帮我每天早上汇总Lovelive、Bangdream等企划的最新消息和日程安排。
先来看一下生成的过程:
可以看出,「扣子空间」会把处理思路和过程分成,步骤,并分别调用对应的工具来完成任务。
(图源:自制)
至于生成的结果,从视觉观感上还是很有说服力的。
「扣子空间」甚至可以借助前面提到过的Agent搜图,把相关的图片给贴上去,自动帮你形成一个二次元门户网站的效果。
(图源:自制)
网址我放在这里了,大家感兴趣的也可以去看一下:
https://space.coze.cn/s/CcibG40i5ws/
你还别说,在上述所有任务处理过程中,「扣子空间」都能做到完全自动运行,用户不需要知道它到底使用了哪个智能体,调用了什么MCP服务,最终往往也能得出个不错的结果,这点真的令人非常惊讶。
最后,来总结一下吧。
个人觉得,目前「扣子空间」端出来的体验,确实挺令人惊喜的,甚至能称得上一句前途可期。
惊喜之处在于,「扣子空间」的响应率异常高。整个体验下来,我只遇到过一次停止响应的情况,过往需要一点基础和时间才能搭建的AI工作流,它几分钟就完成了,而且流程更清晰、执行更丝滑。
在我看来,AI本来就应该这样,用户提出需求,AI交付结果。
它就像是你身边的一个24小时待命的"实习生",写方案、做调研、查数据,甚至复杂的播客和图文网页都能一键生成,真的可以让它帮你完成80%的工作……
不得不说,哪怕我当年实习的时候也没有牛马到这种程度。
当然,「扣子空间」目前呈现出来的效果还不能称之为尽善尽美,但这也正是实习生有趣的地方,它会一边和你协同工作,一边从你身上学习,逐渐熟悉你的工作习惯和要求,理解你的目的动机和思维逻辑,并完善自己的工作能力。
可以预见的是,未来的大模型应用必将从「回答问题」走向「任务执行」,通用Agent将通过深度思考、自主规划、执行和验证复杂任务,最终做到直接交付用户所需的完整成果,而非仅提供建议那么简单。
到了那时,没有自己的AI实习生,或许真的会让你我的工作寸步难行。
相关文章
2025-05-300阅读
2025-05-300阅读
2025-05-300阅读
2025-05-300阅读
2025-05-300阅读
2025-05-300阅读
2025-05-300阅读
2025-05-300阅读
2025-05-300阅读
2025-05-300阅读