在数据价值日益凸显的当下,数据的流通成为释放其潜力的关键。在这个过程中,数据提供方最大的担忧一直难以解决——数据离开自己的管理领域后,如何保障其不被外部的系统运维方泄露或滥用?
11月7日,2025世界互联网大会乌镇峰会开幕,蚂蚁集团旗下蚂蚁密算获得峰会颁发的“世界互联网大会杰出贡献奖”,该技术有望解决上述问题。蚂蚁集团副总裁兼首席技术安全官、蚂蚁密算董事长韦韬介绍,密态计算是基于密码学、可信硬件和系统安全相关技术的新一代隐私保护计算技术,计算过程数据“可用不可见”,计算结果保持密态化,可防止数据泄露和滥用等。
![]()
蚂蚁密算董事长韦韬。南都摄
以下是和韦韬的对话:
南都:如何理解密态计算?
韦韬:密态计算的主要作用是帮助数据要素跨主体、跨行业、跨地域流通。当你把数据供给出去时,依然能够对这部分数据实现有效的密态管控,不会失去控制权。之前传统的明文计算做不到这一点,这是使用密态计算才能达到的效果。
如今大量的数据是依靠传统程序处理,虽然技术成熟,但对于复杂数据场景的处理能力有限,行业普遍在数据治理层面尚有大量工作需要补课。未来全新的计算方式,是由大模型所驱动的高阶智能体来实现。可以理解为,大模型是新的CPU,而智能体是未来新的操作系统,特别要通过工程化体系提供专业可靠性保障。这样的处理机制不再需要依赖人工审核,能够降低大模型处理任务过程中对人的依赖,带来质的飞跃。
我相信这种变化会给整个行业带来巨大变革。在当前数据领域,有着非常严重的劳动力匮乏问题,很多数据就像原矿石,质量不佳,需要加工和提炼。未来3-5年,大模型会在数据应用领域率先取得突破性成就,填补之前的空白。
总体而言,蚂蚁密算会坚持两个定位。一个是通过密态计算保障数据、智能体能够安全、有效地流动、应用、融合。另一方面,有了这样的“安全底座”,数据和模型可以被更高效地应用起来,落实“数模一体”——海量专业数据构成大模型与专业智能体的基石,同时,这些智能体也成为挖掘数据价值的核心引擎。
南都:密态计算的核心价值具体如何体现?怎么理解数据不会“失控”?
韦韬:首先要认清的是,数据流通的一大风险来自于不同机构的系统平台运维者,而非外部攻击者。即使是权限很高的超级管理者,你如何保证他不会为了谋利,而把数据都偷走?以前用的“外挂式”安全防护措施也无法解决这个问题,原因在于系统的攻击防范部署、策略配置,甚至账号密码都是这些管理员设置的,相当于你的数据都在他们手上——他们要拿的话,你是挡不住的。
而蚂蚁密算为这个难题提供了更好的解决方案,就是将整个云计算的PaaS层及以上全部重构。建立全新的可信体系,包括可信的密钥管理、身份账号管理、应用管理、日志管理等等,同时强化对虚拟机、操作系统等可信和密态支持。比如,所有数据一旦涉及从密态切换为明文析出的需求,只能在密态数据网关处发生,而且会触发严格的审核程序,通过数据“血缘”溯及各个数据源方做确认。通过这种非常严谨的安排,支撑海量数据的高效能、跨领域融合流转,从而实现“离开了我的资产域以后,我依然能够对它进行有效管控”的效果。
南都:密算应用未来的市场空间可能有多大?
韦韬:十年前王坚博士提出“云计算”时,被很多人当成“骗子”。现在我们稍好一些,之前谈密算时,整个行业也是将信将疑,觉得我们选择了一条很艰难的路。经过不断摸索,目前密态计算成本已降至明文计算成本的1.5倍以下,而密态大模型推理成本更降至传统明文推理的1.2倍以内。
我认为,未来一定是金融、医疗这类高价值、高敏感行业先投入密算领域,并构建基础设施。当基础设施建设完毕,后面很多行业都可以用起来。以传统的冷链行业为例,最早冷链是用于运输荔枝,后来用于运输车厘子,成本下降以后,现在连土豆运输也能使用冷链。同理,未来密算的覆盖面也会非常大。
近期,我们在国家数标委WG6(国家数据标准化委员会数据基础设施标准工作组)成立了一个SG2密态计算研究工作组,致力于推动密态计算标准化工作。我认为,今年可以视为密态计算市场化规模应用爆发的元年。
南都:新技术有望解决困扰用户已久的大模型幻觉问题吗?
韦韬:幻觉是大模型有智力的一个重要体现。它产生的原因在于,大模型本质上是人类知识的一个“压缩”,人类对其运行规则的掌握程度越高,压缩效果就越好。但“事实”是不能压缩的,“事实”充满了随机性,所以会出现压缩后的失真现象。
我注意到,很多时候用户会把大模型的可靠性问题简单归因为幻觉,但其实并非如此。比如,用户向大模型提出的问题规模太大,可能导致其可靠性“崩塌”。我们曾测试过,大模型在解答“多位数×多位数”“4位数×4位数”数学题时表现非常好,人类很难做到。不过,在解答“8位数×8位数”题目时,大模型就崩塌掉了,准确率不足20%——这种情况就属于规模化失控。因此在使用过程中,对问题的“分拆”非常关键。
幻觉产生的原因还可能与用户未给足描述有关,导致它在推理过程中出错。特别是当前大模型的态度普遍很“迎合”,无论问什么都会给用户一个结果,当数据不足时当然只能“胡说八道”。所以,很多时候大家苛责大模型有幻觉,往往是人有幻觉,人没有正确地用工程化方式使用大模型。
面对这种情况,我们提出的应对措施是构建融合编程语言与自然语言的高阶程序,对问题处理过程进行有效拆分,并在框架层面对大模型每一步推理结果进行有效核验,对场景、数据以及关键术语作出补充和完善,这样可以让整体的可靠性超过99%,达到行业应用的专业要求。我认为这个方向有巨大的潜力,一旦解决了可靠性问题,大模型的处理结果就不再需要人工审核。这会让整个数据领域能效提升10倍甚至100倍以上,真正带来行业变革。
采写:南都N视频记者 樊文扬 发自乌镇
相关文章
2025-11-090阅读
2025-11-090阅读
2025-11-090阅读
2025-11-090阅读
2025-11-090阅读
2025-11-090阅读
2025-11-090阅读
2025-11-090阅读
2025-11-090阅读
2025-11-090阅读