国际象棋最强 AI 鸣锣开赛:首日战果公布,OpenAI 的 o3等晋级

资讯 » 新科技 2025-08-06

IT之家 8 月 6 日消息,科技媒体 webpronews 昨日(8 月 5 日)发布博文,报道称谷歌 DeepMind 于 8 月 5~7 日在 Kaggle 的 Game Arena 平台上,举办“AI 国际象棋”比赛,邀请 OpenAI、Anthropic、谷歌、Kimi、Deepseek 在内的顶尖模型一较高下。

DeepMind 表示,本次“AI 国际象棋”比赛的目的,是检验顶级 AI 模型的推理能力。本次活动将于 8 月 5~7 日举行,每日举办一轮比赛,由国际象棋大师 Hikaru Nakamura 和流媒体播主 Levy Rozman 解说。

在 AI 发展的重要时刻,这场象棋对决提供了一个严格的测试,以评估 AI 的预见和策略调整能力,文本基础的格式解决了许多大型语言模型在视觉象棋盘表示上的难题,提供了一个更公平的推理能力测试。


IT之家附上本次参赛选手如下:

Gemini 2.5 Pro(Google)Gemini 2.5 Flash(Google)o3(OpenAI)o4-mini(OpenAI)Claude 4 Opus(Anthropic)Grok 4(xAI)DeepSeek R1Kimi k2(Moonshot AI)

根据首日战况,OpenAI 的 o4 mini 胜过 Deepseek-R1、OpenAI 的 o3 超过 Kimi K2 Instruct 模型、谷歌的 Gemini 2.5 Pro 胜过 Claude Opus 4、xAI 的 Grok4 模型超过谷歌的 Gemini 2.5 Flash。




免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。由用户投稿,经过编辑审核收录,不代表头部财经观点和立场。
证券投资市场有风险,投资需谨慎!请勿添加文章的手机号码、公众号等信息,谨防上当受骗!如若本网有任何内容侵犯您的权益,请及时联系我们。