Kimi K2思考模型来了！实测3分钟做精美网页，IMO数学题翻车-新科技-资讯-头部财经

Kimi K2思考模型来了！实测3分钟做精美网页，IMO数学题翻车

资讯 » 新科技 2025-11-06

智东西
作者云鹏
编辑李水青

智东西11月6日消息，刚刚，月之暗面正式发布了Kimi-k2 thinking模型，其为具有通用Agentic能力和推理能力的思考模型，擅长深度推理，可以通过多轮工具调用，解决各类复杂的难题。

▲月之暗面官方发布页面

Kimi K2首次发布是在7月11日，该模型总参数10000亿，激活参数320亿。Kimi K2-0905于9月5日发布，其核心升级了Agentic Coding能力、支持256K上下文、API支持60-100Token/s的输出速度、支持Claude Code。

价格方面，kimi-k2-thinking每百万tokens的输入价格（缓存未命中）为4元、输出价格为16元；“高速版”kimi-k2-thinking-turbo每百万tokens的输入价格（缓存未命中）为8元、输出价格为58元，适用于需要深度推理和追求极致高速的场景。

▲Kimi K2系列模型价格

在实际体验环节，我们主要测试了Kimi-k2 thinking在编程、数学和逻辑推理能力三个方面的表现。

在编程方面，我们令其生成一个开源模型分享网站的HTML网页原型，包括顶部导航栏、主体展示区、设计风格要求，还要求其构思两个特色功能。

从生成结果来看，我们对网页主要部分提出的要求都可以很好地被执行，包括导航栏有哪些部分、主题展示区由哪些模块组成，简洁现代的设计风格也有较好体现，一键复现、模型对比这两个特色功能也做了出来。

▲网页编程

整体网页的完成度是比较高的，并且不论是搜索框、按钮、筛选标签都是可以实际选中交互操作的，点击后会有对应的提示，比如点击上传模型，会提示需要准备的问题件、文件大小限制等信息。

▲网页按钮功能说明

生成网页项目的tokens总计消耗为9K，大约花费了3分钟左右的时间。不过在尝试多次生成结果时，偶尔会遇到崩溃状况。

在数学能力方面，今年国际数学奥林匹克竞赛（IMO）第六题被认为最具挑战性：

Kimi-k2 thinking在解题过程中，思考过程有21188字，经过4分钟左右时间，给出了错误答案4048块，正确答案为2112块。

▲Kimi-k2 thinking解答2025 IMO数学竞赛题第六题

这一过程总共消耗了23.5K的tokens。

在切换为高速版kimi-k2-thinking-turbo后，模型仍然给出了同样的4048错误答案，花费时间明显缩短至2分钟左右，但tokens消耗数却提升至38.5K。

▲Kimi-k2 thinking-turbo解答2025 IMO数学竞赛题第六题

对于另一道IMO数学竞赛题，Kimi-k2 thinking在经历了10多分钟的深度思考后，最终停止了思考，思考过程47684字，但并未给出答案。再次尝试后，思考过程同样卡住在了47940字上，未能给出答案。

▲Kimi-k2 thinking解答2025 IMO数学竞赛题第四题

由于Kimi-k2 thinking不支持图片输入自动识别公式，因此一些复杂的数学题目很难输入。

在常识逻辑推理方面，对于一般的问题，Kimi-k2 thinking可以很快给出答案，并且可以轻松绕开逻辑陷阱。

▲Kimi-k2 thinking解答逻辑推理问题

对于更进一步的逻辑推理考察题目，Kimi-k2 thinking也可以在1分钟左右的时间内给出答案，准确率较高，消耗tokens为16.6K。

▲Kimi-k2 thinking解答逻辑推理问题

结语：“思考”模型之战愈发焦灼

11月4日，阿里刚刚发布了Qwen 3系列中最强推理模型Qwen3-Max-Thinking早期预览版，Kimi今天就发布了自家K2系列的思考模型，同样主打深度推理能力。

在Agentic AI成为主流趋势之下，模型的思考推理能力愈发受到重视，这也是模型能否解决复杂现实问题的关键。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。由用户投稿，经过编辑审核收录，不代表头部财经观点和立场。
证券投资市场有风险，投资需谨慎！请勿添加文章的手机号码、公众号等信息，谨防上当受骗！如若本网有任何内容侵犯您的权益，请及时联系我们。

赴港上市首日大跌！文远知行与小马智行二级市场再遇冷，Robotaxi的“ChatGPT时刻”尚未到来

2025-11-070阅读
董宇辉单飞1年3个月，“东方小孙”也离席东方甄选，俞敏洪还剩下谁？

2025-11-070阅读
小红书“拿下”支付牌照，全资子公司收购东方支付，最高月薪6万招聘支付业务后端开发

2025-11-070阅读
宾利预告家族首款电动汽车：像飞驰一样舒适，也像欧陆GT一样灵活

2025-11-070阅读
打通“政产学研医资” 上海脑机接口发展再提速

2025-11-070阅读
谷歌“性能最强”的AI芯片，来了

2025-11-070阅读
“双十一”买的衣服啥情况？挂超大吊牌、还上锁……

2025-11-070阅读
《科技院士谈》第六期：是“动力电池的安全”还是“动力电车的安全”

2025-11-070阅读
聚焦人工智能 “互联网之光”博览会启幕

2025-11-070阅读
首款星闪耳机来了！搭载华为自研麒麟A3芯片，降噪效果暴涨220%

2025-11-070阅读