杨红霞:跑通大模型“最后一公里”,让AI不再只是“富人的玩具”

资讯 » 新科技 2025-08-27

特朗普宣称“美国将赢得AI竞赛”,2025年,中美头部互联网企业在人工智能领域的投资差距近5倍。在这场关乎国力的科技竞赛中,中国如何破局?

香港理工大学人工智能高等研究院执行院长杨红霞,曾任IBM全球研发中心Watson研究员、雅虎公司首席数据科学家,以及阿里巴巴和字节跳动大语言模型研发技术专家等职。如今她与团队怀揣一个共同的“信仰”:跑通大模型落地的“最后一公里”,让生成式AI不再是“富人的玩具”。

从与张文宏合作预测下一场传染病大流行,到深入医院用“小模型”破解癌症诊断难题,未来人工智能还将有哪些突破?《问答神州》专访香港理工大学人工智能高等研究院执行院长杨红霞。

OpenAI最新模型有什么特别之处?

2025年8月,OpenAI推出最新版AI模型“GPT-5”,首席执行官萨姆·奥尔特曼称,这是“世界上最好的模型”。“GPT-5”上线后,众多用户反馈,它虽在专业回答上有提升,但情感交互温度、个性及想象力不及GPT-4o。

吴小莉:OpenAI的GPT-5出来后,大家抱以很大的期待,到底GPT-5有什么样的特殊性?

杨红霞:大模型的整体能力其实是三个维度,第一层是聊天和记忆,这个其实不难做;第二层的能力是推理和规划,就相对比较有挑战了;理论上GPT-5应该是它的第三层维度能力,比较特别,解决的是多模态,但实话讲,多模态其实是比较难解决的,原因是语言经过了人类几千年的锤炼,不管是中国人、美国人还是阿拉伯人也好;不管有人说话冗长一点,还是简短一点,但是信息的含量是相对比较对齐的。

但是多模态这件事情不是这样子的,举个简单例子,哪怕是同样尺寸的图片,比方说都是256mm乘以256mm的尺寸,但是你放大看可能就是一个茶杯、一个标签就足够了,缩小看可能是整个香港理工大学,甚至整个香港,有很多的细节,需要很长的一段话。但是互联网上这么多的数据,怎么精准地把这张图片和对应的文本信息抽取出来,这是一件很难的事情,而且这个问题到目前为止没有解决得很好。

吴小莉:所以GPT-5,它解决了吗?

杨红霞:目前来说还没有。

吴小莉:GPT-5相对于GPT4o,为什么语言能力或者情感交互能力变弱了呢?

杨红霞:模型是一个不限制领域的,无穷领域的多任务学习。如果当一个模型就是这么大的时候,让它多吞吐某一方面的数据进来,另外一方面的能力,一定要有一定的损失,所以这是一个很难平衡的事情。

对人工智能的投入,美企是中企的5倍

是差钱吗?

有数据显示,过去5年,包括微软、亚马逊在内的4家美国科技巨头,AI资本开支合计达到5.36万亿人民币,但是包括腾讯、阿里在内的7家中国互联网头部公司,AI资本开支合计仅为6300亿人民币。

吴小莉:美国的四大互联网公司都投入了大量的资金,2025年大概是2.5万亿人民币,国内的大厂加起来大概也就是5千亿人民币,你觉得为什么差距这么大?是我们没有钱吗?还是投入的方向不一样?

杨红霞:其实在2020年左右,所有的互联网大厂都到了一个降本增效的阶段,意思是大家没有看到巨大技术突破的情况下,做同样的事情可能减少资本投入。我觉得一个比较大的差距是什么呢?比方说生成式人工智能出现后,美国的股市包括像英伟达,最近应该是达到了5万亿的美金估值了。

吴小莉:所以跟市值很有关系。

杨红霞:非常有关系,因为有钱才能去投钱。我是2016年中的时候回国的,当时整体感觉,如果我再不回国,我的技术是会落后的,中国的发展是非常非常快的,包括很多产品的研发。

吴小莉:主要是应用端非常成功。

杨红霞:所以我觉得我的选择是非常正确的。但是另一方面得让各大互联网公司去花钱,敢花钱,除了它自己赚钱之外,一个非常直接的因素也是它的估值本身,大家有没有非常好的信心。

吴小莉:特朗普提到目前看起来,在人工智能的竞赛中,美国已经是实质性的领先,你同意吗?

杨红霞:我可能不太同意特朗普总统说的,但是我还是要讲,做到现在最核心的技术突破,其实还是美国带来的,这一点我们是一定要承认的。但是我相信接下来10到100,未来最大机会点可能不是在互联网,是在深入产业化当中,这块其实中国有巨大的优势。包括我前两天参加人工智能工程应用大会,里面有非常多的院士在讲,生成式人工智能怎么给产业化带来迭代和升级,我觉得中国这条路选得是很对的。

我自己对生成式人工智能的总结分为了三个阶段,0到1、1到10和10到100,0到1就是深度学习模型架构的出现;1到10,大家都知道的是ChatGPT的出现,另外一个是谷歌,可能很多人觉得,谷歌这一波的生成式人工智能做得不尽如人意,我觉得跟它自己的局限性有关,我觉得最大的一个问题就是,为什么生成式人工智能一定要对它的搜索引擎带来巨大的提升。在大厂里工作,你就一定要验证,我这个巨大的技术,花了这么多钱,一定要给我的核心业务要带来巨大的增值,所以这里面一定是有悖论的;10到100里,包括咱们国家的DeepSeek、千问、豆包做得非常好。

吴小莉:你说过一句话,在美国是一直崇尚着暴力算力,在暴力算力的背景下,中国和美国的企业在人工智能领域的投资,超过4倍差距,这会影响到未来人工智能的发展,甚至影响中美国力吗?

杨红霞:我觉得首先不一定他花1美金,我也花1美金,就能得到一样的结果。比方说像DeepSeek,可能他花1美金,我只花10美分就可以跟他做到一样好,就是大家怎么充分发挥自己的聪明才智,我相信我们是可以做到的。另一方面,如果在算力同样保证的情况下,也许会做到更大的突破,我觉得算力是我们必须要解决的。我相信未来一定会有突破,大家要有一点耐心。

吴小莉:也就是说,我们虽然不要暴力算力,但是必要的算力是需要的。你提到过芯片差距可以在未来的3到5年能够赶得上,为什么你可以这样说?

杨红霞:因为芯片对于大模型来讲,主要是两个阶段,训练芯片和推理芯片,实话讲国内的推理芯片做得挺好的,但是最大挑战是训练芯片,我相信3到5年至少可以达到一个非常好的水平。

当AI+癌症治疗=?

未来每个癌症患者都会有个AI随访医生

目前杨红霞团队正在开发一款聚焦于特定领域的小语言模型,同时她正在与中山大学附属肿瘤医院、山东省肿瘤医院合作,推进这款模型的落地,将人工智能应用于复杂的癌症治疗领域。

杨红霞:今天大家看到的大模型突破,其实都是在大家生活息息相关的各方面,原因是今天所有训练大模型的数据都是互联网上的公开数据,但是到目前为止,我们没有听说过在高精尖领域得到重大突破,比如对非常复杂的癌症做诊断。

吴小莉:在美国也没有?

杨红霞:美国其实有一些。今年年初到现在,谷歌已经连续在《自然》的正刊上,发了好几篇大语言模型在医疗方面的进展。谷歌当时为了做这件事,专门买了一个医院,我相信它接下来会在医疗方面得到一些重大突破。

我们也是选择医疗作为很重要的场景,但我们不是选一些普遍的医疗问题,因为我觉得大模型是个“大杀器”,不是什么场景都要用大模型,我们选的是最有挑战的癌症。

癌症是终身疾病,可能永远都会伴随着这个人,而且它很复杂,数据量也是巨大的,有分子、血液、影像各个级别,还有就是文字级别的各种诊断,我之前都没有想象到它的数据量会这么大。比方说DeepSeek在预训练阶段用了20T的数据。我们最近跟一些医院聊,他们有拍字节级别的。(1拍字节=1024TB)

吴小莉:而且只是一到两家医院就有这么多。

杨红霞:是的。其实有大量本地化数据不在现在这些训练的大模型当中的,所以这也是我们没有听到过在这些高精尖、复杂的领域上带来巨大突破的原因。

吴小莉:但是我一直听到在很多的领域,比如说法律、医疗,AI都开始帮助判案、诊断。

杨红霞:我们不能说互联网上完全没有法律的知识和数据,包括很多的教科书、论文等等,医疗也有,我们也会在互联网上处理大量公开通用的高质量数据,但是不涉及到癌症,因为太复杂了。举个最简单例子,它一定不会代替一个特别厉害的癌症医生,现在还没有那个水平。其实今天最难的事情是,数据上云对他们来讲挑战性非常大,数据隐私特别重要;第二个挑战是把数据上传到云,成本是巨高的,包括计算、存储等等,我们提供的解决方案是本地化部署,数据不出域。

吴小莉:也就是说你只是帮它建立模型,数据是留在医院里面。

杨红霞:没错。数据的拥有权和隐私权永远是医院本身的,但算力对于医院来讲还是很贵的,所以我们要解决的第一个最有挑战性的问题是,在算力非常有限的情况下,怎么帮它完成本地化大模型的训练。我们叫低比特预训练,我们其实现在解决的是领域小模型。2024年底麻省理工学院和meta联合发表了一篇文章,说每一个参数可以存储2比特的信息,70亿的模型训练足够充分的时候,理论上可以存储所有英文的教科书和知识。如果只是一个领域模型,小模型就足够了。

吴小莉:你们可以比DeepSeek跟OpenAI还厉害?

杨红霞:我们在做这样的探索,非常有挑战性。

吴小莉:接下来它的应用是什么?

杨红霞:其实有好几层的应用。比方说我们跟中山大学附属肿瘤医院的合作,因为整个大湾区鼻咽癌发病率非常高的,而且马骏院士团队最近在鼻咽癌方面持续地进行一些突破。

我们现在正在做的是,端到端的、全流程的癌症诊断,可以认为是未来每一个病人,可以有一个随访的医生天天跟着他,对他未来的全流程进行预测和诊断,因为医生很忙,不可能每一个病人都盯着,但对于AI来讲,它可以做到。

和山东省肿瘤医院合作的是针对放疗,在治理癌症中,放疗是非常重要的手段,但是在做放疗之前,医生要干一件叫“靶区勾画”的事情。现在正常器官的勾画已经很好的商业化了,但是因为靶区勾画太复杂,还没有得到商业化。所以现在医生对每一个病人的靶区勾画,要花30到50分钟的时间,我们现在跟他们一起来做的就是自动靶区勾画,我们能不能通过辅助,把这个时间的成本降到10到20分钟,让医生能看更多的病人,这是我们在做的事。

杨红霞:我算是国内做大模型最早的一波人,所以我知道现在大模型离最后落地,有一个所谓的“最后一公里”。我们有自己的想法,希望把它做成。要跟很多人、时间在竞争,所以要做得快、做得好,执行力要强。但是我觉得比较好的一个点是我团队的所有的同学、老师们,包括我们在学校合作的老师们,大家还是有一个共同的信仰。

吴小莉:你们的共同的信仰是什么?

杨红霞:解决大模型落地“最后一公里”,真正地让每个人都可以去使用生成式人工智能。现在的大模型还是一个“富人的玩具”。生成式人工智能,而不单单只是掌握在少数的大公司或一些人手里。

制作人:韩烟

编导:郑书筠

编辑:金芃



免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。由用户投稿,经过编辑审核收录,不代表头部财经观点和立场。
证券投资市场有风险,投资需谨慎!请勿添加文章的手机号码、公众号等信息,谨防上当受骗!如若本网有任何内容侵犯您的权益,请及时联系我们。