全球中文大模型战力榜发布：前三被海外包揽国产有惊喜-新科技-资讯-头部财经

全球中文大模型战力榜发布：前三被海外包揽国产有惊喜

资讯 » 新科技 2026-02-04

快科技2月4日消息，今天，SuperCLUE发布2025年年度中文大模型基准测评报告。

23个国内外模型参与角逐，覆盖数学推理、科学推理、代码生成等六大核心维度。

从结果来看，海外闭源模型依旧占据头部位置，Anthropic旗下的Claude-Opus-4.5-Reasoning以68.25分位居榜首。

谷歌的Gemini-3-Pro-Preview和OpenAI的GPT-5.2(high)分别以65.59分、64.32分紧随其后，包揽前三名。

不过，国产大模型正加速从跟跑向并跑迈进。国内开源最佳模型Kimi-K2.5-Thinking 和闭源最佳模型Qwen3-Max-Thinking，分别以61.50分、60.61分位列全球第四和第六。

在部分细分领域，国产模型表现亮眼，比如Kimi-K2.5-Thinking在代码生成任务中以53.33分夺冠，Qwen3-Max-Thinking在数学推理任务中与Gemini-3-Pro-Preview同获80.87分，并列全球第一。

从整体格局看，海内外开闭源模型差异显著。闭源阵营呈现海外领先、国产追赶态势，开源阵营则是国产主导、海外式微，国内开源模型Top5均大幅领先海外开源模型。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。由用户投稿，经过编辑审核收录，不代表头部财经观点和立场。
证券投资市场有风险，投资需谨慎！请勿添加文章的手机号码、公众号等信息，谨防上当受骗！如若本网有任何内容侵犯您的权益，请及时联系我们。

人类最后的2000天，文科生绝地反击？

2026-02-044阅读
脑机海河实验室：全国首个“中医脑机接口”装备“神工-华佗”落地

2026-02-044阅读
硅谷又炸了，Clawdbot开始雇佣人类！2万人排队卖身，时薪狂飙3500

2026-02-044阅读
比亚迪方程豹“镁7”谍照曝光：掀背设计，尾灯造型独特

2026-02-044阅读
被微信封杀链接后，腾讯元宝AI红包分享已更改为“口令红包”

2026-02-044阅读
微信封禁自家“兄弟”红包，打的什么牌？

2026-02-044阅读
马斯克团队近期“摸底”中国光伏产业链已有异质结设备厂签单

2026-02-044阅读
丰田大六座“电动汉兰达”内饰公布：超大中控屏+全景天幕

2026-02-044阅读
腾讯股价暴跌

2026-02-044阅读
消息称福特、吉利商谈合作：借助福特的产能、吉利的智驾“双赢”

2026-02-044阅读