Kimi K2思考模型来了!实测3分钟做精美网页,IMO数学题翻车

资讯 » 新科技 2025-11-06


智东西
作者 云鹏
编辑 李水青

智东西11月6日消息,刚刚,月之暗面正式发布了Kimi-k2 thinking模型,其为具有通用Agentic能力和推理能力的思考模型,擅长深度推理,可以通过多轮工具调用,解决各类复杂的难题。


▲月之暗面官方发布页面

Kimi K2首次发布是在7月11日,该模型总参数10000亿,激活参数320亿。Kimi K2-0905于9月5日发布,其核心升级了Agentic Coding能力、支持256K上下文、API支持60-100Token/s的输出速度、支持Claude Code。

价格方面,kimi-k2-thinking每百万tokens的输入价格(缓存未命中)为4元、输出价格为16元;“高速版”kimi-k2-thinking-turbo每百万tokens的输入价格(缓存未命中)为8元、输出价格为58元,适用于需要深度推理和追求极致高速的场景。


▲Kimi K2系列模型价格

在实际体验环节,我们主要测试了Kimi-k2 thinking在编程、数学和逻辑推理能力三个方面的表现。

在编程方面,我们令其生成一个开源模型分享网站的HTML网页原型,包括顶部导航栏、主体展示区、设计风格要求,还要求其构思两个特色功能。

从生成结果来看,我们对网页主要部分提出的要求都可以很好地被执行,包括导航栏有哪些部分、主题展示区由哪些模块组成,简洁现代的设计风格也有较好体现,一键复现、模型对比这两个特色功能也做了出来。


▲网页编程

整体网页的完成度是比较高的,并且不论是搜索框、按钮、筛选标签都是可以实际选中交互操作的,点击后会有对应的提示,比如点击上传模型,会提示需要准备的问题件、文件大小限制等信息。


▲网页按钮功能说明

生成网页项目的tokens总计消耗为9K,大约花费了3分钟左右的时间。不过在尝试多次生成结果时,偶尔会遇到崩溃状况。


在数学能力方面,今年国际数学奥林匹克竞赛(IMO)第六题被认为最具挑战性:


Kimi-k2 thinking在解题过程中,思考过程有21188字,经过4分钟左右时间,给出了错误答案4048块,正确答案为2112块。


▲Kimi-k2 thinking解答2025 IMO数学竞赛题第六题

这一过程总共消耗了23.5K的tokens。

在切换为高速版kimi-k2-thinking-turbo后,模型仍然给出了同样的4048错误答案,花费时间明显缩短至2分钟左右,但tokens消耗数却提升至38.5K。


▲Kimi-k2 thinking-turbo解答2025 IMO数学竞赛题第六题

对于另一道IMO数学竞赛题,Kimi-k2 thinking在经历了10多分钟的深度思考后,最终停止了思考,思考过程47684字,但并未给出答案。再次尝试后,思考过程同样卡住在了47940字上,未能给出答案。


▲Kimi-k2 thinking解答2025 IMO数学竞赛题第四题

由于Kimi-k2 thinking不支持图片输入自动识别公式,因此一些复杂的数学题目很难输入。

在常识逻辑推理方面,对于一般的问题,Kimi-k2 thinking可以很快给出答案,并且可以轻松绕开逻辑陷阱。


▲Kimi-k2 thinking解答逻辑推理问题

对于更进一步的逻辑推理考察题目,Kimi-k2 thinking也可以在1分钟左右的时间内给出答案,准确率较高,消耗tokens为16.6K。


▲Kimi-k2 thinking解答逻辑推理问题

结语:“思考”模型之战愈发焦灼

11月4日,阿里刚刚发布了Qwen 3系列中最强推理模型Qwen3-Max-Thinking早期预览版,Kimi今天就发布了自家K2系列的思考模型,同样主打深度推理能力。

在Agentic AI成为主流趋势之下,模型的思考推理能力愈发受到重视,这也是模型能否解决复杂现实问题的关键。



免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。由用户投稿,经过编辑审核收录,不代表头部财经观点和立场。
证券投资市场有风险,投资需谨慎!请勿添加文章的手机号码、公众号等信息,谨防上当受骗!如若本网有任何内容侵犯您的权益,请及时联系我们。