重估大模型发展成本曲线,异构智算如何破解AI落地新挑战?

资讯 » 新科技 2025-03-31

近两年,AI大模型的加速发展,加快了对算力的需求。相关数据显示,大模型的发展将人工智能从1.0时代进化到2.0时代,每年对算力的需求增速是10倍。当前,以大模型为基础特征的AI 2.0时代已经到来,“大模型+大算力+大数据”成为新一代人工智能发展的基本范式。

AI应用场景不断丰富,AI大模型加速更迭,AI算力需求也迎来持续扩张,《算力基础设施高质量发展行动计划》提出,到2025年中国的智能算力占比将达到35%。不过,从算力基础设施的角度来看,仍不能非常好地满足行业对算力的需求的。

过去算力还是以通用算力为基础,在大模型爆发之前,通用算力每年算力的增长是符合摩尔时代的摩尔定律的。到了2008年以后开始有了人工智能的需求,以深度学习作为发展,每年的增速已经出现了一定的高速增长,从每18个月翻一番,变成每6个月翻一番。

今年春节期间,DeepSeek的火爆,对中美AI之间的竞争以及算力的格局都造成了巨大的改变。中科院计算所研究员张云泉指出,DeepSeek的诞生标志着在AI领域出现了新的技术突破,尤其是在低算力训练和高效率模型优化方面,这将推动AI技术向更高效和普惠的方向发展。

“人工智能正在不断涌现,正在重塑我们的生产方式、生活方式,还有数据治理方式,深刻影响了传统的生产方式和生产关系,DeepSeek就是这个里面的代表,它前所未有拉低了大模型部署的成本,把它的覆盖面极大的拓展,用较低水平达到国际领先水平,打破了美国在最近一段时间对我们算力的围剿。这一突破,促使全球市场重新评估大模型发展的成本曲线,推动国内芯片、云计算等基础设施加速升级。”

与此同时,谈及这一轮DeepSeek带来的冲击和影响,燧弘华创执行总裁唐锋认为,要打破AI迷信,过去谈到AI大家想到的都是美国领先,中国紧随,实际上我们现在正以不可阻挡之势,不管是从芯片、从应用,在重塑全球人工智能领域的话语权。

针对最近一段时间行业内关于算力过剩的话题,他也给出了自己的看法,称DeepSeek出来之后其实让推理的算力需求大量增长。做这个行业大家要树立AI信仰,算力是源源不断的,是不够的,未来它的增长不是线性的,是指数的。

“原来我们智算中心在去年的时候大部分都是一些续建,还有一部分是大模型试用的推理,DeepSeek出来之后整个推理就爆发了,各行各业都有算力应用,比如在医疗、政务、教育、智能制造。”

值得一提的是,DeepSeek掀起的AI应用革命与算力瓶颈突破,让作为“中国算谷”的庆阳,受到了前所未有的关注。据介绍,庆阳作为全国一体化算力网络国家枢纽节点和国家数据中心集群,是“东数西算”工程的重要枢纽。唐锋介绍道,也在跟庆阳市政府做一个投资建设规划,未来在庆阳可能会投资超过128个亿,来建设整个算力基础建设。

可以确定的一点是,人工智能是新质生产力重要的驱动力,智算中心是新时代人工智能重要的基础设施之一。只是,在算力层面,国内的智算中心依然面临一些问题。虽然总的性能达到了世界第二,但在高端智算上仍然是紧缺、存在结构性的问题的,跟国际领先水平还有很多差距。

AI 2.0时代的到来,所谓算力好用,是通过提供从芯片到应用的端到端整体算力优化,实现算力效率和算力性能的大幅提升,满足多样化复杂应用的升级需求。应对算力方面的挑战,张云泉认为,一是要加强人才培养,建立我们自己的标准体系。二是在平台化建设上要加力,通过平台进行赋能,给更多创业者赋能,通过这个平台建设可以建设它的创新生态,让大家在一个生态上、平台上共同发展,来借力,来降低成本和开销。

据了解,作为AI基础设施提供商,联想已经构建了“一横五纵”的战略,旨在通过联想万全异构智算平台,打造服务器、存储、数据网络、软件及超融合、边缘计算“五纵”产品能力。其中,“一横”是对“五纵”能力的全面升级,万全异构智算平台是AI 2.0时代大模型训练和推理的基础设施底座,对于今天整体布局的基础设施进行重新的改造和升级,实现真正的AI导向。

联想中国基础设施业务群战略总监黄山介绍称,万全异构智算平台能够统一纳管异构算力,实现对异构计算集群的高效管理调度和可用性保障,让客户获取融合、稳定的通用、智能和科学算力。

去年4月,异构智算产业生态联盟成立。在DeepSeek大模型引领AI浪潮的当下,联想与异构智算产业生态联盟持续推动技术创新与产业落地。2025年,联想与燧弘华创共同携手推动在庆阳绿色智算中心突破性部署多元异构算力调度平台,标志着异构算力在超大规模智算场景中完成从技术攻坚到产业化应用的跨越。

联想中国基础设施业务群战略总监黄山

“我们跟燧弘在第一时间,在庆阳这边做DeepSeek部署,第一天我们在用2台机器,先布了一个满血的671B。在春节结束之后,今天我们可以在1台机器上去支撑千人企业对DeepSeek满血版的应用。”黄山说道,“目前为止DeepSeek已开源的方法在推理上联想都已经用了,并且进行了二次开发,会比开源的方法更加优化。在DeepSeek没开源的,在传输层优化里面的一些通信言语优化等,还有一些专家调度上面联想会做出自己有差异化的调优能力。”

据悉,联想及其生态伙伴在庆阳搭建的联想万全异构智算平台,在管理142节点千卡进行DeepSeek后训练时,以调优技术使得训练MFU达60%以上,在训练期间人为加入多类故障后进行故障断点续训的时间小于1分钟。联想AI服务器可以全速运转满血版DeepSeek R1大模型,极限吞吐量可超8000 tokens/s。

此外,在算力的发展过程中,经营模式也发生了一些变化,原来2B端可能更多向2C端来变化。面对当下千行百业的新需求,黄山进一步指出,算力的需求其实并未减少,在近期来说从预训练算力的需求转向了后训练和推理。今年会和智算中心一起要服务千行百业,各个行业都会要推理服务、要智能体开发平台,所以今年会在生态中进一步扩大,并且从低到高做好行业标准。(本文首发于,作者|杜志强,编辑|钟毅)



免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。由用户投稿,经过编辑审核收录,不代表头部财经观点和立场。
证券投资市场有风险,投资需谨慎!请勿添加文章的手机号码、公众号等信息,谨防上当受骗!如若本网有任何内容侵犯您的权益,请及时联系我们。