苹果联合推出 AI 交错推理方法，Qwen2.5 模型响应速度快 80%-新零售-资讯-头部财经

苹果联合推出 AI 交错推理方法，Qwen2.5 模型响应速度快 80%

资讯 » 新零售 2025-05-30

5 月 30 日消息，科技媒体 marktechpost 昨日（5 月 29 日）发布博文，报道称苹果公司携手杜克大学，提出交错推理（Interleaved Reasoning）的全新强化学习（Reinforcement learning，RL）方法，进一步提升大语言模型的推理能力。

主流大语言模型在处理多步复杂问题时，常采用“先思考后回答”的长链式推理方式。然而，这种方法存在两大痛点：一是响应时间过长，难以满足实时交互需求；二是早期推理步骤出错可能导致最终答案偏差。

研究人员指出，与人类在对话中随时分享部分想法不同，模型往往等到推理全部完成才输出结果，导致效率不高。

苹果公司携手杜克大学，研发了交错推理技术，让模型在推理过程中交替进行内部思考和输出中间答案（sub-answer），从而提升速度与实用性。

交错推理基于强化学习（RL）框架，采用特殊的训练模板，包含和 < answer > 标签，确保模型在达到关键推理节点时输出中间结果。

研究团队设计了基于规则的奖励机制，包括格式、最终准确率和条件性中间准确率，确保模型注重整体正确性。

测试中，交错推理在 Qwen2.5 模型（1.5B 和 7B 参数）上表现优异，响应速度提升超 80%，准确率提高高达 19.3%。

此外，该方法仅在问答（QA）和逻辑数据集上训练，却能在 MATH、GPQA、MMLU 等更具挑战性的基准测试中展现强大泛化能力。

研究还尝试了多种奖励策略，如全或无、部分积分和时间折扣奖励，其中条件性和时间折扣奖励效果最佳，显著优于传统方法。

附上参考地址

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。由用户投稿，经过编辑审核收录，不代表头部财经观点和立场。
证券投资市场有风险，投资需谨慎！请勿添加文章的手机号码、公众号等信息，谨防上当受骗！如若本网有任何内容侵犯您的权益，请及时联系我们。

山东青岛：“微醺巴士”开拓文旅消费新场景

2025-07-1724阅读
牛市就到这了？

2025-07-1724阅读
拉布布暑期降温，中国潮玩出海弯道超车，谁是下一个顶流IP

2025-07-1724阅读
南城香创始人汪国玉：平台消费券激发消费热情，门店收入利润均提升

2025-07-1624阅读
盛银消金 25% 股权再被冻结！新董事长年初刚上任

2025-07-1624阅读
伊利出席第八届中澳工商界首席执行官圆桌会助力中澳经贸合作提速升级

2025-07-1624阅读
商查平台企业信息查询新范式：水滴信用企业查询MCP

2025-07-1624阅读
从“闪购”到“观望”：Prime Day被拉长的背后，是消费者与平台的“双重博弈”

2025-07-1624阅读
澎湃漫评｜通信企业为何“推销热售后冷”

2025-07-1624阅读
“电商西进”助力豫企破浪：一枚鱼油的3000公里“暖心”之旅

2025-07-1624阅读