通义千问发布新一代端到端旗舰模型Qwen2.5-Omni：看听说写样样精通-新科技-资讯-头部财经

通义千问发布新一代端到端旗舰模型Qwen2.5-Omni：看听说写样样精通

资讯 » 新科技 2025-03-27

快科技3月27日消息，阿里云宣布今天发布新一代端到端多模态旗舰模型Qwen2.5-Omni。

该模型专为全方位多模态感知设计，能够无缝处理文本、图像、音频和视频等多种输入形式，并通过实时流式响应同时生成文本与自然语音合成输出。

据介绍，Qwen2.5-Omni采用Thinker-Talker双核架构。

其中，Thinker 模块如同大脑，负责处理文本、音频、视频等多模态输入，生成高层语义表征及对应文本内容。

而Talker模块则类似发声器官，以流式方式接收Thinker实时输出的语义表征与文本，流畅合成离散语音单元。

测试中，Qwen2.5-Omni在包括图像，音频，音视频等各种模态下的表现都优于类似大小的单模态模型以及封闭源模型，例如Qwen2.5-VL-7B、Qwen2-Audio和Gemini-1.5-pro。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。由用户投稿，经过编辑审核收录，不代表头部财经观点和立场。
证券投资市场有风险，投资需谨慎！请勿添加文章的手机号码、公众号等信息，谨防上当受骗！如若本网有任何内容侵犯您的权益，请及时联系我们。

票务平台StubHub冲刺纽交所：年营收17.7亿美元估值或达165亿美元

2025-03-3011阅读
OPPO Find X8s轻薄小直屏小得很强得狠看完准心动

2025-03-3011阅读
“老黄”最爱：Denny's 餐厅推出“英伟达早餐”，仅 4.93 美元起

2025-03-3011阅读
比尔盖茨预言10年内AI将取代两大职业！三种工作不会被取代

2025-03-3011阅读
微软 Xbox 精英手柄 2 代被亚马逊打上“经常退货”标签

2025-03-3011阅读
填补国内空白，我国首台光纤剥除、切割、熔接一体化设备研制成功

2025-03-3011阅读
智元机器人联合武汉打造光谷东智，预计今年发布两款人形机器人

2025-03-3011阅读
中国电建“智成一号”智能巡检机器人首次亮相

2025-03-3011阅读
化工品涨价获高度关注！2家A股公司获140家机构调研

2025-03-3011阅读
ROP单元丢失RTX 5090仍在卖：一点不便宜、还不能换货

2025-03-3011阅读