当人与AI意见相左,沪上一批AI原生企业选择“听AI的”,结果出人意料

资讯 » 新科技 2025-09-17


让人和AI(人工智能)共做一道题,答案相左,听谁的?一般来说,当然由人把关,但对于智能原生企业来说,他们选择“听AI的”。

不久前国务院发布的《关于深入实施“人工智能+”行动的意见》中,“智能原生”首次出现在官方文件中,被定义为“底层架构和运行逻辑基于人工智能”。


成立于2021年的天鹜科技,就是一家智能原生企业。他们拥有基于全球最大的蛋白质序列数据集进行预训练的AI蛋白质设计大模型,只要半天时间,该模型就能按照需求挖掘或设计出一批蛋白质,它们中的一些可能从未被人发现过,但天鹜科技的员工会非常认真地将AI挑选的结果放到真实场景中去验证。多年的经验给了他们信心,而结果也往往令人惊喜。

智能原生,就是把AI当成企业的核心基因,它们往往能带来颠覆式变化,而非效率的简单提升。当AI与真实世界的融合加速,或许未来“听AI的”会是一种常态。

AI的选择颠覆教科书

蛋白质由20种天然氨基酸组成,蛋白质数据库里序列的平均长度,约为361个氨基酸。仅改变其中1个氨基酸,就有6859种可能;改变2个,可能性飙升到2300多万种;改变3个,更是达到533亿种。想找到或设计出一个功能优异的蛋白质无异于大海捞针。过去,科学家一旦捞到了“针”,就会特别珍惜,他们还会将“针”与“针”相互排列组合,以期让结果更好。

AI则不然,它不仅关注好的,也关注坏的。天鹜科技首席技术官刘灏,就遇到过一个改变他认知的案例。教科书上说,蛋白质内部的相互作用越强,蛋白质的稳定性就越高,所以,面对AI大模型给出的结果,刘灏很意外——AI要他先破坏蛋白质内部作用力再结合。但他还是按照AI的思路做了,因为他刚见证团队中一位没有生物学背景的工程师,只是把客户提供的序列输入AI大模型,就成功改造出符合要求的酶。最终,AI没有令人失望,刘灏得到了更稳定的蛋白质,比之前所有做实验产出的都好。

“这种现象在自然界中也存在,叫做‘上位效应’,比如在爬山时,先走一段下山路再登顶,比直接登顶更快更省力,但如果没有AI助力,人们根本不知道应该在哪里、怎样去组合好与坏。”刘灏说。

这样的案例多了,天鹜科技对AI的信任度越来越高,现在当人和AI产生分歧,天鹜人会选择“听AI的”。

AI处理失败的熟练度优于人类

在另一家智能原生企业晶泰科技,同样的情况也在上演。晶泰科技内部会定期组织“AI科学家”和人类科学家比赛,在最近几次AI反应预测能力比拼中,针对某两种类型的反应预测上,晶泰科技自研的AI垂类模型准确率均超过80%,与人类科学家旗鼓相当;但在对失败反应预测的识别率上,AI准确率则超过50%,是人类的一倍以上。


晶泰AI设备。晶泰供图

人类与AI在成功与失败反应预测能力上的差别,也许与数据有关。浙江大学化学系研究员、博士生导师洪鑫表示,合成化学理论上可合成的中小分子数量高达10的60次方,这是一个远超宇宙中恒星数量的天文数字。自古以来,化学家都渴望成功,他们依赖已有的知识地图和敏锐的直觉,在实践中不断调整路线。这句话的潜台词是,科学家处理成功的结果都忙不过来,几乎不可能去关注失败的结果。

但在晶泰科技的智能实验室里,机器人一丝不苟记录下每一个数据,它并不偏爱得到好结果的数据,而是对好坏一视同仁。于是,失败数据与成功数据一起构建了一个更为完整的数据库。AI可以通过对“失败经验”的挖掘,找到从未被人类注意过的更优解。

晶泰科技联合创始人、首席执行官马健注意到了这个现象,他说:“我们会更加关注那些无法完成实验的‘失败经验’与大模型的关系,它们非常重要。”

大模型幻觉或来自数据不够

今年的Oceanbase开发者大会上,蚂蚁集团首席技术官何征宇表示,缺乏足够的数据将导致AI产生“幻觉”,这种现象在当前的技术环境中愈发明显。

天鹜科技选择“听AI的”,最大底气就来自于其坐拥包含近90亿条序列、数亿个功能标签的全球最大蛋白质数据集,这些序列不仅涵盖常规生物,还包括从深海、火山口等极端环境中采集到的耐高温、耐强酸/强碱的蛋白质,几乎囊括自然界所有的蛋白语料。

在与金赛药业的合作中,对方希望找到一个耐强碱蛋白质,天鹜科技借助AI大模型,很快就找到数十个结果。经过在真实场景中测试,最后胜出的蛋白质,耐碱性能提高四倍,使用寿命延长一倍。目前,该蛋白质已完成多个批次的5000升放大生产,成为全球首个实现工业化生产的大模型设计蛋白质。

最近爆火的“纳米香蕉”图像模型在图片的色调、氛围、画面布局和视觉重点等方面表现出惊人的图片一致性,在连续20次编辑操作中,字符一致性准确率保持在95%以上。据谷歌方面介绍,融入丰富的真实世界知识,是其理解能力达到新高度的主要原因——它能够铭记上一幅作品的内容,同时也深刻理解对话的背景和逻辑。

人形机器人也在渴求更多数据。仅一个倒水的动作,机器人就需要吸收上万条数据才能学会,而一位数据采集师每天仅能采集约150条数据。在智元机器人合伙人兼具身业务部总裁姚卯青看来,不研究大模型的具身智能公司没有未来。目前,全球机器人动作数据相较于大语言模型的“核爆点”还差3至4个数量级,智元希望两年内能采集到1亿条。



免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。由用户投稿,经过编辑审核收录,不代表头部财经观点和立场。
证券投资市场有风险,投资需谨慎!请勿添加文章的手机号码、公众号等信息,谨防上当受骗!如若本网有任何内容侵犯您的权益,请及时联系我们。