苹果研究称AI推理模型缺乏真正思考能力-新零售-资讯-头部财经

苹果研究称AI推理模型缺乏真正思考能力

资讯 » 新零售 2025-06-09

苹果近期发布了一篇研究论文，指出当前主流的推理模型其实并不具备真正的思考能力。不论是DeepSeek、o3-mini还是Claude 3.7，这些模型所展现的“推理”行为本质上仍属于模式匹配的范畴，所谓的逻辑推导过程也只是一种表象。

为了更科学地评估模型在推理方面的实际表现，研究人员构建了四类结构化谜题任务：汉诺塔问题、跳棋交换问题、过河问题以及积木世界。这四类任务均可通过调整参数实现对难度的精确控制，从而系统性地测试模型在不同复杂度下的应对表现。

实验结果显示，当问题复杂度逐步提升时，模型一开始会表现出一定的适应能力，表现为生成回应前的等待时间变长。然而，随着任务进一步复杂化，模型的推理深度反而开始减弱，即使仍有大量可用的token预算，它们却在最关键的时刻停止了深入分析。当问题复杂度超过某个临界值时，不论是推理模型还是标准模型，都无法维持基本的解题能力，整体准确率迅速降至零，显示出明显的性能崩溃现象。

这篇论文发布后，在网络上引发了讨论。有用户发表评论称：“一家坐拥最多资金支持的科技公司，在两年内都没有推出令人信服的技术成果，现在反过来质疑其他人的进展。”

此外，虽然论文揭示了当前模型在推理能力上的局限性，但也有人认为其意图并非单纯否定现有成果，而是希望引起业界对更有效推理机制与评估方法的关注和投入。苹果在2024年全球开发者大会上首次展示了其智能系统Apple Intelligence，但在过去一年中，该系统多项功能经历了推迟上线、功能不完善甚至被撤回的情况。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。由用户投稿，经过编辑审核收录，不代表头部财经观点和立场。
证券投资市场有风险，投资需谨慎！请勿添加文章的手机号码、公众号等信息，谨防上当受骗！如若本网有任何内容侵犯您的权益，请及时联系我们。

苹果WWDC看什么？郭明錤：能做到这个就算及格

2025-06-090阅读
China's Delivery Subsidy War Heats Up as Tea and Coffee Lead the Charge

2025-06-090阅读
6月9日A股分析：创业板指领涨1.07%，两市成交额突破1.28万亿，主力微幅净流入3.9亿，减肥药概念暴涨5.51%

2025-06-090阅读
用户当心 Switch2电池鼓包存起火风险！任天堂：已启动调查

2025-06-090阅读
最长30天！全国已有27个省份延长婚假，专家：建议统一标准解决跨地区婚姻问题

2025-06-090阅读
礼业新纪元：第33届深圳礼品展缔造30万买家的全球商贸盛宴

2025-06-090阅读
鸿日山海跑鸿日汽车集团三十周年庆圆满举办

2025-06-090阅读
全球化再提速！DKE东方科脉越南基地竣工投产仪式圆满举行

2025-06-090阅读
石恒臣峰会期间观摩国内国际合作成果展：共探数字中国与全球创新融合新路径

2025-06-090阅读
为什么OpenAI们开始化身「购物狂」？

2025-06-090阅读