跟机器人学“太极拳”、让数字分身上台讲产品……这一次,科大讯飞又玩出了哪些“交互新花样”?

资讯 » 科技探索 2025-06-17

过去几十年,人机交互的方式不断演变。从最初的键盘命令,到图形界面、触屏操作,再到语音唤醒与自然对话,每一次变革,都在让技术变得更“人性化”。

而现在,随着大模型技术的加速发展,我们正在进入一个全新的阶段:人与机器的交流,正在从“响应式”迈向“理解式”。不再只是听得懂、答得上,而是能持续记住你说过的话、体会你说话的情绪、甚至主动调整回应方式——或许,这才是真正的智能交互。

在这场变革中,作为国内 AI 领域的领跑者,科大讯飞再次走到了前沿:6 月 12 日,在一场以「交互领航 智启新章」为主题的智能交互产品升级发布会中,科大讯飞重磅带来了一系列最新成果。

那么接下来,就让我们来看看在科大讯飞眼中,未来交互的新范式是怎样的?

十年技术迭代,AIUI 开启大模型焕新交互

正如科大讯飞开放平台总经理赵艳军在发布会开场所说:

“讯飞开放平台陪伴大家度过了 15 年,这 15 年,其实也是我们中国 AI 发展的 15 年。”

从语音识别起步,到如今布局通用 AI 大模型,讯飞开放平台已经在 AI 领域深耕 15 年:从 2010 年发布首个行业语音云,到 2015 年推出首个人机交互开放平台AIUI,再到 2023 年星火大模型的横空出世,正式开启大语言模型时代——科大讯飞始终站在 AI 发展前沿,推动着人机交互方式的持续进化。

其中,AIUI 开放平台以讯飞星火大模型为核心,汇聚了降噪算法、语音识别、图像识别、数字虚拟人交互、硬件开发等全链路人机交互软硬件核心能力,让产品不仅能听会说,而且能理解会思考。

如今,在大模型浪潮的推动下,讯飞开放平台已汇聚全球生态合作伙伴超 1150 万,近三年复合增长率超过 40%。不仅用户数量迅速增长,其活跃度也显著提升:与大模型发布前相比,如今 AIUI 平台日均调用开发者数量增长了 43.8%,日均 AI 服务调用量也增长了 85.6%。

与此同时,近年来 AIUI平台、虚拟人交互平台在智能硬件和数字人领域也不断取得突破:

●大模型发布后,几乎所有智能终端领域都实现了快速增长。智能硬件的交互体验大幅升级,也让 2025 年 AIUI 平台上智能硬件开发者增长 31.3%,超过全量开发者增长率;

●在数字人赛道,相比 2023 年,2024 年虚拟人创作数量增长了 16.6 倍,数字人每日交互次数也增长了 6.5 倍,显示出其使用价值持续上升。

正是基于这样的积累与沉淀,在本次发布会上,科大讯飞正式推出了全新的 AIUI 升级版本——一个面向未来的一站式人机交互开发平台,全面支持多模态、多场景、多终端的智能交互需求。

很多人认为大模型就是“聊天”,但实际上人机交互的需求远不止于此。除了对话,还有形如家居控制、媒体点播、车载导航等任务,这些需求集合了工具属性、娱乐属性与对话属性。因此总体而言:人机交互是一个涵盖感知、理解、响应与记忆的复杂系统性工程。

基于此,全新升级的 AIUI平台实现全链路交互贯穿调优:从设备端声学处理到云端智能理解,再到内容响应与定制开发,让机器拥有情绪识别、创意生成与深度语义理解等类人多模态能力,从而生成出更加自然、有针对性的回应。

简单来说,新一代 AIUI平台使人机交互功能全面、效果优越、安全有保障——而这一点,在面向儿童场景的交互方案上得到了充分体现。

“在大模型发布后,我们发现在每天交互时长最多的是儿童场景,儿童每天的交互时长增长了 7 倍以上,这说明儿童是真的愿意去和机器聊天。”

从 AIUI 平台数据显示来看,儿童用户的交互活跃度显著提升。然而与成人用户相比,儿童的表达方式存在显著差异——表达模糊、语义不明确甚至存在歧义。

为此,讯飞基于儿童语料定制优化,训练出了专属的儿童识别大模型和儿童理解大模型,以进一步提升识别准确率和语义理解能力。在对话风格方面,也特别优化了语气和交互体验,让系统的回答更加有趣、友好,并具备引导性,从而能与孩子建立更自然的互动关系。

此外,围绕“寓教于乐”的理念,AIUI 平台还最新提供了丰富的儿童内容资源,例如:

●构建了多个经典儿童 IP,孩子只需一句话即可与喜欢的角色对话,极大提升其了互动意愿与参与度;

●支持“故事共创”功能,孩子可以与儿童大模型共同编写一个属于他们的故事,甚至还能一起猜谜语、玩脑筋急转弯等;

●构建了大量适用于早教的技能模块,包括语言发展、科学启蒙、社会认知等方向,帮助儿童在有趣的交互过程中实现全面成长;

●还接入了多个优质的儿童信源,包括儿童音乐、儿童故事等资源库。

此外,讯飞表示也高度重视儿童心理健康。其儿童大模型在交互中以鼓励和正向反馈为主,帮助孩子建立自信心。当系统检测到孩子可能存在情绪波动或心理压力时,会进行温和引导;若判断为潜在高风险事件(如校园冲突),AI 会尝试引导孩子表达并提出建议,必要时也将通知家长介入。另外,为保障儿童内容的安全性,AIUI 平台中所有儿童内容也均经过严格审核,确保儿童在 AI 的陪伴下快乐成长。

赵艳军强调:“儿童的表达方式丰富多样,他们也非常愿意与 AI 大模型进行对话。但只有在真正做了产品之后,我们才会真正地发现儿童的世界是怎么样的。”

除了儿童场景之外,此次发布会上还重点介绍了 AIUI平台针对智能眼镜场景和家庭泛屏场景下的定向优化。

其中,为了推动智能眼镜真正走进现实,讯飞正式推出三麦阵列降噪技术。

为什么是三麦呢?常规的语音降噪在技术上通过双麦克风即可实现,但讯飞指出:在日常使用环境中,智能眼镜不仅要过滤环境噪声,还要识别佩戴者是否为当前说话人,确保只响应佩戴者的语音指令;同时,在面对面翻译等场景中,还需要拾取对面说话者的声音,实现双向语义理解——因此,三麦阵列正是为了解决“只听你说”与“听懂别人说”的双重任务。

在活动现场,讯飞还特别展示了关于智能眼镜的多项实用功能,如食物热量监测、展会导览讲解、与国际友人的无障碍交流等,全面展现了 AI 赋能可穿戴设备的广阔前景。

而在家庭应用场景中,AIUI 平台也围绕影音、饮食、健康、家居等核心需求,打造了一系列实用且富有趣味性的 AI 智能体,以全面提升家庭生活的智能化程度。

“机器人超脑”全面升级,带来机器人的“开口神器”

早在 2022 年,讯飞便推出了“机器人超脑”平台,旨在为结构复杂、场景多样的机器人提供“不仅能听会说,还能理解和执行任务”的智能化大脑。

据讯飞官方披露,发展至今“机器人超脑”平台已吸引超过 500 家机器人客户接入,覆盖人形机器人、四足机器人、轮式机器人等多种形态,大多数的机器人厂商都选用了讯飞的“机器人超脑”平台。

在此次发布会上,讯飞宣布“机器人超脑”平台也全面升级。

首先是“多人多模态交互”能力,力求让机器人可以识别多个说话人并实现多人同时交互。据介绍,在三人同时发声的测试场景下,“机器人超脑”平台的语音分离准确率已达到 87%,语音识别准确率超过 90%。

其次,考虑到实际应用中经常面临断网或弱网环境,“机器人超脑”平台还推出了“全离线交互套件”,所有语音识别、语义理解与语音合成都可在本地端完成,为关键场景提供更稳定、可靠的交互能力。

尤其值得一提的是,讯飞还带来了一款专为无语音模组的机器人打造的“语音背包”产品:当用户购买的机器人缺乏对话能力时,只需将其安装在机器人上,机器人就能立即拥有语音交互功能。

为了展示这款“语音背包”的互动效果,在发布会现场,讯飞特别选择了其合作伙伴——宇数科技的 G1 机器人作为示范对象。

这台已经预装“语音背包”的 G1 机器人,一登场便以充满活力的语音互动打招呼,引起了现场观众的热烈反应。除了能够自然进行人机对话,它还展示了一套颇具“科技风”的动作表演——“赛博朋克太极拳”:

不仅“身手敏捷”,它的“情商”也颇为在线。在面对“如何与女同事相处”的提问时,它也不慌不忙地“输出秘籍”:

据介绍,这款“语音背包”内置全链路交互能力,不仅能实现精准识音,还能在复杂环境中保持高质量的交互体验。正如讯飞所说:“这个背包,就像是机器人的开口神器,能让沉默的硬件秒变社交达人。”

一句话+一张图片即可生成数字分身,移动数字人惊艳亮相

紧接着,讯飞又重点展示了其在数字人领域的技术进展与平台能力。

当前,讯飞数字人已广泛落地于金融、媒体、教育等多个行业领域,市占率稳居第一。其技术水平也获得权威认可:讯飞数字人通过了中国信通院大模型数字人基础能力 L5 认证(最高等级),内容生成能力也达到了“卓越级”。

依托于大语言模型、多模态建模等核心 AI 技术,如今讯飞实现了“一句话、一张图片,即可生成一个数字人分身”的能力。

在现场演示环节中,讯飞为观众完整还原了“定制一个数字人分身”的全过程:只需录制一句简短语音并上传一张照片,系统便能迅速完成声音复刻与形象生成。甚至,赵艳军还让其数字分身“小赵总”(以赵艳军的声音和照片为原型)亲自介绍了讯飞虚拟人平台:

据介绍,目前讯飞开放平台已向开发者免费开放“超拟人”数字人定制服务,结合 SaaS 平台能力,可实现快速嵌入大屏问述、客服、导览、虚拟主持、数字人直播等多样场景。正如“小赵总”在视频中所说:“让虚拟人成为人类的伙伴。”随着讯飞在 AI 驱动的语音、视觉、认知等多模态能力上的持续突破,数字人正从“看得见的未来”变为“用得起的现实”。

不仅如此,在本次发布会上,讯飞还推出了一款全新的移动数字人,可以做移动式的交互。现场演示中,移动数字人“小雨”在接收指令后,按照预设路径自主移动至发布区域,引发观众连连惊叹。

随后,在与现场观众的互动环节中,“小雨”也展现出良好的人机交互体验感。当被问到“你和其他数字人有什么不同”时,小雨自信地介绍道:“我可以自动移动,然后在展厅里我能把产品故事讲的生动有趣,博物馆导览也不在话下;我能带您穿越时空,跟兵马俑唠嗑;在图书馆、商场等场所,我都可以进行服务引导。”

虽然演示时间有限,但“小雨”的出场无疑成为现场焦点之一,这也预示着数字人形态正在从“固定交互”迈向“全场景融合”的新阶段。

星辰 Agent平台“专业版”发布,直击企业痛点

除了以上内容,讯飞还有另一个重要的开发平台:讯飞星辰 Agent 平台。

得益于近两年来深度推理能力的不断增强,讯飞星火大模型在处理复杂任务、任务拆解与规划执行等方面展现了强大的能力,使得许多复杂的场景现在可以通过自动化方式解决——而星辰 Agent 平台正是讯飞针对这一趋势推出的一站式开发平台,它提供了诸如 RAG、AI 插件等专业工具,旨在帮助开发者缩短应用开发路径。

在本次发布会上,科大讯飞正式发布了面向企业的星辰 Agent 平台专业版。

面向企业级需求,首次发布的星辰 Agent 专业版的推出进一步彰显讯飞对产业痛点的回应。通过扩容资源池、强化高阶功能,平台为企业提供从用量保障到定制化服务的全链路支持。尤其在模型与 prompt 的协同优化上,专业版通过结构化数据反馈与效果追踪,将原本模糊的“经验主义”升级为可量化的科学流程。

在借助星辰 Agent 平台“快速开发一个具备发票/运单信息提取能力的智能体”的演示过程中,讯飞强调:“我们相信所有的用户和开发者,都可以在星辰 Agent 平台上基于自己的业务流程,去构建一个属于自己的 Agent 应用。”

但在大模型加速落地的过程中,通用大模型在某些细分场景中,往往难以完全满足企业的定制化需求。为此,讯飞推出了星辰 MaaS 平台,为企业用户提供从模型选择、数据训练到部署运维的一站式服务,帮助企业打造专属的微调大模型。

从集成星火、DeepSeek 等多元模型,到提供国产化算力支撑的 99.97% 服务稳定性,MaaS 平台不仅降低了微调门槛,更以全生命周期管理确保模型从训练到推理的无缝衔接。这种“即用即销”的自主托管模式,让中小企业也能拥有媲美大厂的模型迭代能力,让再小的场景需求也能拥有专属模型服务。

在平台架构上,星辰 MaaS 已与星辰Agent 开发平台深度融合,实现了从底层大模型到上层智能体应用的完整闭环开发能力。开发者在构建智能体应用时,不仅可以调用通用能力,还能集成经过微调的专属模型,实现更高精度、更强适应性的智能化服务。

目前,星辰开发平台已经汇聚超过 30 万名开发者,广泛覆盖办公、生活、导览、客服、政务等多个典型场景,成为国产大模型生态中极具活力的开发社区之一。

“十大标杆应用方案”——众多场景中的冰山一角

最后,在 AI 加速重塑工作模式的当下,科大讯飞以大模型为核心,围绕办公、人力资源、企业数字化等核心场景,打造了“十大标杆应用方案”,全面助力各类组织实现效率跃升与智能化转型。

在职场办公中,升级后的讯飞智文从 PPT 工具扩展为智能文档平台,支持多类型文档生成、协同编辑与图文智能生成;讯飞绘文则面向内容创作者,提供从选题到发布的全流程AI创作服务,提升内容效率与质量;星火纪要实现会议全过程智能化,自动生成纪要,显著减轻人工整理负担;讯飞绘镜通过一键视频生成支持营销培训场景,释放创意效率。

在人力资源领域,讯飞智聘以简历解析、AI 面试等功能大幅降低初筛成本,并通过胜任力模型提升人才匹配精准度;星火陪练则为一线岗位提供高效实训方案,可基于企业知识库自动生成课程并支持移动端对练,评分准确率达 90% 以上,每年对练场次超过 1000 万场。

企业数字化方面,讯飞推出招投标大模型与星火知识库,分别用于自动生成标书、智能评标与复杂知识问答,已在多家央国企落地;星火快答则通过虚拟人和多模态交互,实现产品边讲边演示。

此外,在更广泛的行业与社会场景中,讯飞的大模型技术也在持续落地,包括:线下营销、政务服务、文旅讲解、公共服务、轨道交通、海外场景等等。

期待智能交互新时代!

从此次发布会的产品升级可以看出,随着大模型能力不断突破与交互方式持续进化,科大讯飞正在加速推动人机交互方式的革新,不断探索更具自然性、沉浸感和适应性的智能交互形态。

正如赵艳军在发布会最后的展望:

“这些只是我们众多场景中的冰山一角,其实每一个场景都值得用大模型再重新做一遍。未来,我们会继续将用最好的产品、技术和服务,帮助开发者做出更多有创意、好用的产品。”

无论是职场办公、行业落地,还是社会服务,科大讯飞正以智能化、可对话、可执行的产品体系,构筑下一代人机交互的标准,将 AI 融入人们的日常工作与生活,让智能更有温度,让交互更具智慧。

未来已来,让我们共同期待一个由智能交互驱动的全新工作与生活方式。



免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。由用户投稿,经过编辑审核收录,不代表头部财经观点和立场。
证券投资市场有风险,投资需谨慎!请勿添加文章的手机号码、公众号等信息,谨防上当受骗!如若本网有任何内容侵犯您的权益,请及时联系我们。