阿里发布混合推理开源模型Qwen3 支持快/慢两种思考模式-新零售-资讯-头部财经

阿里发布混合推理开源模型Qwen3 支持快/慢两种思考模式

资讯 » 新零售 2025-05-16

4月29日，阿里巴巴正式发布新一代通义千问大语言模型Qwen3，一举成为全球最强开源模型。

Qwen3最大的亮点在于其独特的混合推理架构。这是国内首个将“快思考”与“慢思考”集成进同一个模型的尝试。通过这种创新设计，Qwen3既能够针对复杂问题进行多步骤的深度推理，也能对简单任务进行快速响应。这种架构大大节省了算力消耗，有效平衡了性能和效率。

据悉，Qwen3拥有强大的多语言处理能力，支持包括简体中文、繁体中文、粤语在内的119种语言和方言。这一特性极大地拓展了Qwen3的应用范围，使其能够更好地服务于全球用户，满足不同语言环境下的需求。

为了满足不同用户的需求，阿里云开源了8款不同规模的Qwen3模型。其中包括两个MoE(Mixture of Experts)模型：Qwen3-235B-A22B和Qwen3-30B-A3B，分别拥有2350亿和300亿总参数，以及220亿和30亿激活参数。此外，还有六个Dense模型：Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。这些模型均在Apache 2.0许可下开源，用户可以根据自己的需求选择合适的模型。

Qwen3系列模型已通过GitHub和阿里云ModelScope平台开源，并采用Apache 2.0许可，支持免费商用。特别是其旗舰模型Qwen3-235B-A22B，仅需4张H20即可部署，显存占用仅为同类模型的1/3，大大降低了部署成本和使用门槛。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。由用户投稿，经过编辑审核收录，不代表头部财经观点和立场。
证券投资市场有风险，投资需谨慎！请勿添加文章的手机号码、公众号等信息，谨防上当受骗！如若本网有任何内容侵犯您的权益，请及时联系我们。

新华全媒+｜“热”力全开消费新场景激发夏日文旅新活力

2025-06-276阅读
七月惠民新政：国家发改委启动第三批家电以旧换新，补贴激活消费

2025-06-276阅读
RNG旗下软泥怪公司被执行20.9万

2025-06-276阅读
北京经开区科技创新股权基金二期登记成立出资额14.49亿

2025-06-276阅读
于正实控服装公司转型影视公司

2025-06-276阅读
李铁名下仕伯特公司经营异常

2025-06-276阅读
李明德工作室被税务部门公告

2025-06-276阅读
大量小米YU7订单现身二手交易平台：转让最高加价1.8万元

2025-06-276阅读
去年出价被嫌低，CoreWeave再度谋求收购Core Scientific

2025-06-276阅读
小米AI眼镜首发体验：对于国内用户，这可能是更好的Meta Ray-Ban

2025-06-276阅读