腾讯混元自研深度思考模型T1发布：吐字快、能秒回-新科技-资讯-头部财经

腾讯混元自研深度思考模型T1发布：吐字快、能秒回

资讯 » 新科技 2025-03-22

3 月 21 日消息，从腾讯混元微信公众号获悉，今日腾讯混元正式推出自研深度思考模型混元 T1 正式版。

据官方介绍，「T1」吐字快、能秒回，还擅长超长文处理，是腾讯自研的强推理模型。通过大规模强化学习，并结合数学、逻辑推理、科学和代码等理科难题的专项优化，混元 T1 正式版进一步提升了推理能力。

在体现推理模型基础能力的常见 benchmark 上，如大语言模型评估增强数据集 MMLU-PRO 中，混元 T1 取得 87.2 分，仅次于 o1。在 Ceval、AIME、Zebra Logic 等中英文知识及竞赛级数学、逻辑推理的公开基准测试中，混元 T1 的成绩也达到业界领先推理模型的水平。

「T1」还在多项对齐任务、指令跟随任务和工具利用任务中展现出了非常强的适应性。

注：表格中，其它模型的评测指标来自官方评测结果，官方评测结果中没有的部分来自混元内部评测平台结果

官方称，混元 T1 正式版沿用了混元 Turbo S 的创新架构，采用 Hybrid-Mamba-Transformer 融合模式。这是工业界首次将混合 Mamba 架构无损应用于超大型推理模型。这一架构有效降低了传统 Transformer 结构的计算复杂度，减少了 KV-Cache 的内存占用，从而显著降低了训练和推理成本。

官方还称，混元 T1 在超长文本推理领域也展现出独特优势。基于出色的长文捕捉能力，混元 T1 能有效解决长文推理中常见的上下文丢失和长距离信息依赖问题。同时，混合 Mamba 架构针对长序列处理进行了专项优化，通过高效的计算方式，在确保长文本信息捕捉能力的同时大幅降低资源消耗，在相近的激活参数量下，实现了解码速度提升 2 倍。

腾讯混元 T1 目前已经上线：https://llm.hunyuan.tencent.com/#/chat/ hy-t1

API 使用方面，混元 T1 已在腾讯云官网上线，输入价格为每百万 tokens 1 元，输出价格为每百万 tokens 4 元。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。由用户投稿，经过编辑审核收录，不代表头部财经观点和立场。
证券投资市场有风险，投资需谨慎！请勿添加文章的手机号码、公众号等信息，谨防上当受骗！如若本网有任何内容侵犯您的权益，请及时联系我们。

做最有烟火气的AI，老板电器发布新一代食神大模型

2025-03-2210阅读
无锡地铁要“腾云驾雾”，探索轨交行业大模型方案

2025-03-2210阅读
华为正式入局机器人！3家核心供应商或将成最大赢家！

2025-03-2210阅读
阿里云与亚洲十所高校与机构达成合作培养AI人才

2025-03-2210阅读
华为正式入局机器人！3家核心供应商或将成最大赢家！

2025-03-2210阅读
中国结算释放利好，信用债ETF可质押式回购，9只基金符合规模门槛，已有公募着手申请

2025-03-2210阅读
刘强东最新发声：知识、技术不该是压榨最底层兄弟们的工具

2025-03-2210阅读
华为Pura X手感如何这个女玩家的比喻绝了：这不就黑莓吗

2025-03-2210阅读
蔚来2024年净亏损同比扩大8.1% 毛利率提升至12%

2025-03-2210阅读
王腾：下个月发布一款大部分用户都能买得起的好产品

2025-03-2210阅读