![]()
从聊天问答到编程办公,再到执行复杂任务,人工智能正在快速进入大规模应用阶段。与此同时,支撑人工智能运行的底层算力,也面临新的压力。国家数据局数据显示,截至今年3月,我国日均词元调用量已突破140万亿,较2024年初增长超1000倍。近期,部分国产大模型应用也出现了算力紧张的情况。算力为何变得稀缺?
智能推理时代 灵活算力供给需求激增
![]()
记者来到深圳的这家3D模型应用团队,该团队开发了一款应用软件,可以像拍照片一样,为我们快速生成一张包含空间环境的3D照片。虽然只是这样一个看似简单的应用效果,背后其实需要调用大量的算力。团队介绍,目前,他们的主要成本就是算力。
![]()
智能应用Remy联合创始人 王正南:我们的收入减算力等于我们的毛利,所以算力是我们成本的全部。
团队负责人介绍,作为一个面向用户端的软件,他们更希望能像水龙头接水一样,对算力随用随取。而现有的简单承包机房的模式,并不适合用户的弹性算力需求。
智能应用Remy联合创始人 王正南:我们平时需要的算力,一种是瞬时算力,Remy在刚上线的时候最高峰的算力需求是我们平时的100倍以上,如果我以这个峰值需求为底线,再去囤任何更多的算力,其实都是一种浪费。
![]()
这种突然走红的现象,在大模型应用中屡见不鲜。春节后,随着“龙虾”等智能体应用的突然火爆,人工智能从简单问答,走向编程、办公、内容生成等更复杂的任务处理。和过去相比,这类新应用会在后台持续调用模型,完成理解、执行、反馈等一整套流程,单个任务对应的词元消耗被成倍放大,给算力供给带来了不小的压力,甚至有大模型厂家一度出现算力供给不上的情况。
![]()
月之暗面Kimi企业业务负责人 黄震昕:今年过年之后,整个词元市场发生了很大的变化,像编程场景,包括“小龙虾”的场景迎来了非常大的爆发,全行业在算力层面遇到了供不应求的状态。
算力消耗正在从过去集中式、高密度、持续运行的训练任务,转向分布式、高并发、需要实时响应的推理需求。在采访中记者发现,这种突发的多元化算力需求,与现有的算力供给模式发生了矛盾。以某头部云厂商为例,算力“按量付费”的价格折算到小时,仍是包月价格的数倍。这种租用方式不仅拉高了中小企业的使用成本,还极易造成算力资源的浪费。
![]()
中国信息通信研究院云计算与数字化研究所副所长 李洁:之前算力需求主要围绕大模型训练展开,而现在向训练与推理并重、推理应用加速落地的方向进行演进,这种变化对于算力供给体系提出了新的要求。训练阶段用户往往采用长期租用或自建集群的方式,而推理应用更强调按需调用、弹性扩缩、实时响应。
弹性调取 技术创新推动算力调度更智能
一边是激增的瞬时算力需求,一边是成本和性价比的综合考量。算力调用如何才能更加充分和有效?“共享算力”这一新模式应运而生。它是如何像打车软件一样,实现算力调用的呢?
在深圳清华大学研究院弹性算力调度研发中心,记者看到了一个“弹性算力网络”,通过算力热力图,我们可以清晰地看到目前智能体时代,算力需求呈现出的冷热不均的特性。
![]()
深圳清华大学研究院弹性算力调度研发中心主任 付智:可以看到,一天内资源的使用其实是有一个明显的波动的,凌晨3点基本上没什么人用,但是到了上午就有一个很明显的波峰。第二个点就是比如说突然一下起很大的量,我们的算力得能够敏捷迅速地跟上,对他们的业务支撑是有关键作用的。
而这种毫秒级调用的能力对于用户来说,就像拧开自来水龙头,随取随用,并不用管水房在哪里。同时,由于调用的是全国各地不同机房甚至个人的闲置算力,成本可以控制在非常低的水平。
深圳清华大学研究院弹性算力调度研发中心主任 付智:其实就需要非常精细的调度策略和算法,这样能够对需求进行比较精准预测,对供给也能进行比较精准预测。在这两个基础之上就实现了先筛选出能用的机器再去优选出适合你的机器,然后用一小部分热备,能够让你这个机器掉线服务不掉线来保障服务的稳定性。
![]()
目前平台上线两年来,已经满足了全国各地用户380多万次的调度需求。
政策加速推出 促进算力应用高效普惠
作为人工智能时代的重要“燃料”,算力已经成为支撑产业运行和应用落地的数字基础设施。记者调研发现,算力的合理调配不仅是技术难题,同样也是一个需要从政策层面推动解决的难题。目前围绕算力资源调度的政策和试点工作正在推进。
![]()
记者来到河北省廊坊市,为破解算力资源“看得到、调不动”的难题,作为全国数据基础设施先行先试试点,这里正在推进河北省一体化算力网平台建设。记者看到,目前河北省已在全国率先上线了省级监测平台,全量接入河北省内在运数据中心的监测数据,并积极推进算力池化、资源并网、模式创新。
![]()
河北省廊坊市数城集团总经理 邢岩波:通过这个试点,先把算力中心先互联再成网,同步来发展和培育市场。从产业发展的角度来说,为供方和需方进行精准匹配,降低它的使用成本。
近年来,我国算力基础设施建设持续提速。信通院数据显示,截至2025年底,我国已建成万卡级智算集群42个。但由于所属单位、算力形态和架构多样,各地智算中心往往处于零散且不连通的状态。
清华大学高性能计算研究所所长 翟季冬:我们现在也在牵头去构建一些国家标准,包括叫异构芯片的统一编程,包括编译,其实核心就是说怎么把不同的算力有效提供统一的接口,然后对外提供词元。从技术层面上,其实你也需要有一套统一的接口,能够把不同的算力有效整合。
![]()
一方面摸清算力家底,一方面打通算力供给的技术和政策屏障。工信部启动“毫秒用算”专项行动,拟在全国50个地区构建城域“1毫秒时延圈”,确保算力的高速运载与实时响应。此外,近期启动的“普惠算力赋能中小企业发展专项行动”首次提出了“算力银行”“算力超市”等创新模式,支持企业存入闲置资源、按需提取算力,推动中小企业需求与算力资源供给精准对接。
中国信通院云计算与数字化研究所副所长 李洁:推动从资源交付向能力交付的转变,如果企业和个人都可以通过标准化的服务便捷地获得算力的时候,就会释放出更大的创新合力。
原标题:《大模型火了,算力够用吗?记者带你看看背后的“供应商”》
栏目主编:顾万全
文字编辑:董思韵
本文作者:央视新闻客户端
相关文章
2026-04-110阅读
2026-04-110阅读
2026-04-110阅读
2026-04-110阅读
2026-04-110阅读
2026-04-110阅读
2026-04-110阅读
2026-04-110阅读
2026-04-110阅读
2026-04-110阅读