高考题，AI大模型不能解，也不敢解-新零售-资讯-头部财经

高考题，AI大模型不能解，也不敢解

资讯 » 新零售 2025-06-09

图片由AI生成

高考，中文世界权威度和认可度最高的标准化考试，世界上最公平的大型选拔考试之一，还在如期进行中。

这项考试制度成熟、人数众多、标准统一，各科命题经过多轮审定，阅卷过程统一标准、分数精确。考试考取的分数背后，看似是对知识点和做题能力的展示，实则揭示的是其抽象逻辑、信息整合、快速运算和写作表达等能力。

尤其是逻辑思考和推理能力，是学生时期被重点训练的素养，是绩优生引以为傲的资本，进入社会用来吃饭的看家本事，而当今年大模型深度思考能力全面开花之际，想必大多数学霸会产生一种别样的复杂的心情。

当然了，高考的特殊性，使其成为了大模型能力的天然试金石。高考期间，哪家大模型解题能力强，综合评分到底可以上几本学校，成为很多人津津乐道的话题，今年类似相关的测评文章也零星出现了。

而当随机测试了下市面上主流通用大模型解答高考题时，结果却出人意料——这些大模型压根没有想要参加高考。

上传了高考全国卷I数学试题后，有的大模型显示无法上传，有的则表示无法识别。而一同被“禁言”的解读的，还有往年的高考数学题。

高考期间（6月7日-10日），主流国产模型厂商对今年高考数学题的回应

事实上，不只是数学难题，国产大模型已经屏蔽掉了K12阶段学科（语文、数学、英语、物理、化学、生物、历史、地理、政治）内容的部分推理与解析能力。具体而言是，图片识题（拍题）功能禁用，高考真题关键词屏蔽，甚至禁止回答具体某年高考题目。

高考期间（6月7日-10日），相比其他大模型应用，DeepSeek对高考以及高考题相关的话题限制更为严格，而给出略显详细的提示词后，也会给出丰富的答案。

也就是说，在今年高考期间，主流的国产模型厂商，都主动或被动对高考采取了限制措施，这在国产大模型发展进程里还是头一回。

实际上，ChatGPT、Claude等国外的大模型可以解答今年高考相关题目，并且以高水平完成推理过程。而大多数国产通用大模型，已经在多项技术指标上持续逼近全球顶级水平，甚至在某些垂直细分场景呈现领先的趋势，也意味着它们是具备足够的能力来解答这些题目的。

很显然，这一次功能“降级”，本质上是一次策略性的行为，也是平台技术治理与内容安全机制的体现。

当前，多数模型处理高考题的模式是，当识别到题干结构类似高考题（选择题、大题、简答题），会直接返回“不支持”或“无法识别”。而图片上传识别时，系统会直接禁掉OCR模块或限制调用次数。与此同时，也对“高考”，“高考真题”等关键词自动限流。这是大模型的内容风险识别系统在发挥作用。

这一场高考期间“特别监管”，目前各大厂商未主动发布官方声明。而最直接的原因，恐怕是为了防止高考考试作弊。因为多数模型厂商直接在页面给出文字提示，无法支持相关功能，是“为了保证高考公平公正”，“为了确保高考的公平性”，“重要考试期间，换个话题试试”等。

但事实上，目前没有公开报道显示，国内已经有利用AI大模型在考场作弊的案例（国外大学已有识别学生利用ChatGPT作弊而被开除的案例），但确实已经存在一些大模型相关的考试虚假信息和诈骗行为，并且已经被监管部门重点关注。

这里涉及的是，今年高考前，教育部、中央网信办、公安部查处了部分商家。这些商家利用一些考生、家长的投机心理，将押题当成牟利工具，通过宣称“神预测”“精准押题”、炒作“名师押题”“AI押题”等虚假宣传手段，诱导考生、家长购买所谓的“高考押题卷”“高考猜题库”“备考攻略”等。

与此同时，当AI大模型进入更多硬件设备而非只是手机时，与考试有关的新问题也随之浮现。今年4月，《央视新闻》发出了一个疑问，“AI眼镜成考试作弊‘神器’怎么防？”而Rokid创始人、CEO祝铭明就这一问题答复是，“可能最简单的方法就是屏蔽信号或者把功能关掉”。

回到高考本身，这是我国最重要的考试之一，已经纳入国家治理的重要领域，现代教育测试学的标准性和普适性，使得高考一直被看作是教育公平与社会稳定的制度性支柱。高考题目及其解析涉及国家教育考试制度，具有高度敏感性和保密等级，任何失误或越界可能被定性为破坏考试秩序。

而一旦出现泄题或作弊的情况，都会被视为国家级事件。大模型有可能被考生用于作弊，而错误解答了真实或类似的高考试题，会持续引发公众的质疑。

事实上，监管层在今年已经明令禁止AI技术干扰正常的高考秩序。5月30日，教育部会同中央网信办、公安部发布了消息联合查处涉高考违法有害信息，重点整治的是，炒作夸大涉考不实信息，借AI技术生成发布涉考虚假信息，以及，干扰舆论和误导公众等行为。

在考试期间，涉及高考试题相关行为，可能被认定为是协助作弊，或者扰乱考试秩序，平台将面临监管和法律风险。主流国产大模型目前仍在“合规优先”的阶段，在监管本就密集的K12教育领域，冒险展示技术能力，将面临政策、伦理和市场风险多重压力。

而其实，如果从技术侧考虑，模型厂商限制相关功能，也未必是全然是“被迫”的行为。因为AI大模型的幻觉问题始终难解，同一个提问和提示词情况下，多次生成的内容也不全然一致，尤其是数理等更标准化的科目，纯属将模型能力的弱项暴露给公众。

尽管有些模型厂商已经以“解答高考题的准确率”为卖点宣传自身，但是，更多厂商为避免出现“AI答案”和“官方答案”不一致的尴尬，全部禁止作答高考题，不失为一种较为理性的决策。

不过，大模型的平台自律与避险机制，在高考结束后，就会陆续恢复对K12内容的部分支持，因为市场需求永远都在那里。

一个有意思的现象是，今年高考期间，“高考期间能用的AI”在社交平台上引起了小范围的讨论，而关注这一话题的，却是大学生群体。“正在复习的大学生天塌了”，“救救大学生吧”，“高考最大的受害者出现”，因为当前也正值大学期末考试季。

这些在社交媒体上小范围的“怨声载道”，段子式的调侃，说明的是，大模型已经深深地介入了大学生的学习、成长的主线任务。

不同于K12的解题答疑，大模型在高等教育中使用场景更为丰富，但也面临着最为激烈的争议。一些学校明令禁止使用，但随着大模型的发展，有的学校和教师也鼓励学生，以负责任的方式用AI辅助学习与研究，并允许在明确声明的前提下适度使用AI。

即便如此，考试场景也是被各方排除在外的一个共识场景。

如何划定学生使用AI的边界，使用场景自然是核心要义。大模型可成为启发式学习伙伴，尤其是深度思考普及之后。而在考试场景中，尤其是K12阶段，大模型一旦越界，必然会对公平性构成实质破坏。

可以预期的是，未来一段时间，高考期间，国产大模型厂商相关功能依旧会“策略性限制”。但从长远来看，“AI+教育”的变革不会停止。AI教师已经是各大主流教育科技公司正在探索的方向之一。

教育大模型或者通用大模型的教育相关应用，正确的方向是，以启发式学习的方式，构建知识图谱导航，成为教师教学和学生学习的辅助工具，而非一次次简单答案投喂，成为考试题目的解答机器。（本文首发于，作者｜李程程）

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。由用户投稿，经过编辑审核收录，不代表头部财经观点和立场。
证券投资市场有风险，投资需谨慎！请勿添加文章的手机号码、公众号等信息，谨防上当受骗！如若本网有任何内容侵犯您的权益，请及时联系我们。

苹果上线 games.apple.com 域名，佐证 WWDC25 强调游戏传言

2025-06-100阅读
全球首款 720Hz 显示器 SDC 光魂“闪电 540-Meta”曝光

2025-06-100阅读
芯片龙头世纪联姻，3000亿市值海光信息“合体”900亿中科曙光

2025-06-100阅读
卧安机器人冲刺港股：年营收6亿大疆教父李泽湘批量打造上市企业

2025-06-090阅读
药捷安康通过上市聆讯：年亏损2.75亿吴永谦控制34%股权

2025-06-090阅读
圣贝拉通过上市聆讯：年营收8亿经调整利润4226万同比增103%

2025-06-090阅读
【公告精选】菲林格尔将停牌核查股价异动情况；亿纬锂能筹划发行H股并在香港联交所上市

2025-06-090阅读
Waveshare 推两款开发板：ESP32、自带圆形屏，可用于智能家居

2025-06-090阅读
小米手环 10 宣传图曝光：1.72 寸 OLED 屏幕，21 天续航

2025-06-090阅读
基于树莓派 5 的开发学习套件，Elecrow CrowPi 3 开启众筹

2025-06-090阅读