文心4.0在SuperBench评测中表现亮眼，多项指标领先-新科技-资讯-头部财经

文心4.0在SuperBench评测中表现亮眼，多项指标领先

资讯 » 新科技 2024-04-23

4月23日消息，清华大学基础模型研究中心最近公布了2024年3月版的《SuperBench大模型综合能力评测报告》，该报告全面评估了14个在海内外具有影响力的模型。

在这份报告中，文心4.0的卓越表现引起了广泛关注。其整体性能已经接近了国际顶级模型，且正逐步缩小与全球领先模型的差距，显然已经成为了国内领先的模型。在人类对齐能力的评测中，文心4.0展现了出色的实力，毫无争议地位居国内首位。同时，在中文推理和中文语言能力的评测中，文心4.0也是一骑绝尘，与其他模型相比，其优势十分明显。特别在中文理解的评测环节，文心4.0的得分比第二名的GLM-4高出了0.41分，显示了其在中文处理上的深厚功底。

此外，在语义理解的数学能力评测中，文心4.0与Claude-3模型并列全球首位，而知名的的GPT-4系列模型则紧随其后，位列第四和第五。其他模型的得分大多集中在55分左右，与领先群体存在显著的差距。在阅读理解能力的评测中，文心4.0同样大放异彩。它不仅超越了GPT-4 Turbo和Claude-3，还超越了GLM-4，斩获了最高分。

报告还提到，自去年3月16日文心一言首次公开亮相以来，其在短短的时间内就实现了用户数量的突破，目前已经超过了2亿用户。同时，每天的API调用量也异常活跃，已经超过了2亿次。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。由用户投稿，经过编辑审核收录，不代表头部财经观点和立场。
证券投资市场有风险，投资需谨慎！请勿添加文章的手机号码、公众号等信息，谨防上当受骗！如若本网有任何内容侵犯您的权益，请及时联系我们。

因苹果反对，塔塔集团收购 vivo 印度业务多数股权计划搁浅

2024-07-3122阅读
荣耀旗舰手机影像体验升级：新增流光快门、三种影像风格等功能

2024-07-3122阅读
上半年，谁在替一级市场负重前行｜创投家

2024-07-3122阅读
小米无线鼠标舒适版开售，首发 49 元

2024-07-3122阅读
AYANEO Pocket DMG 竖屏复古掌机发布，首发 2399 元起

2024-07-3122阅读
AYANEO Pocket MICRO 掌机发布，首发 1299 元起

2024-07-3122阅读
AMD 锐龙 9000 系列处理器价格揭晓：279~599 美元

2024-07-3122阅读
华硕 ROG 夜魔 EXTREME 机械键盘 8 月 1 日 0 点预售。3599 元

2024-07-3122阅读
阿里巴巴将推出人工智能对话式采购引擎，预计 9 月发布

2024-07-3122阅读
资本再出手，商业航天加速发展

2024-07-3122阅读