苹果开源大模型OpenELM来了,用在下一代iPhone上

资讯 » 新科技 2024-04-27

据每经网,苹果近日在AI代码社区Hugging Face上发布了OpenELM大模型。这是一个由不同参数大小构成的一系列开源大型语言模型,可运行在端侧设备上。

可能用在下一代iPhone上。据了解,该系列模型包含2.7亿、4.5亿、11亿和30亿共4个不同参数版本。基于较小的参数量,这些模型可在端侧设备上独立运行,而不必连接云端服务器。

具体而言,其一共包括4个预训练模型和4个指令调优模型。这些模型可运行在笔记本电脑甚至智能手机上,苹果举例称,其中一台是配备M2 Max芯片、64GB RAM,运行macOS 14.4.1的MacBook Pro。

苹果发布OpenELM,意味着它正式加入开源大模型,尤其是端侧大模型的赛道之中,正如谷歌、微软、三星等科技公司正在做的那样,而这一动作也进一步揭开苹果生成式AI战略的神秘面纱。

彻底放弃造车以后,苹果在生成式AI上的表现将是决定其下个十年科技领域地位的最大筹码。在2024苹果股东大会上,苹果CEO蒂姆・库克表示,今年将在生成式AI领域实现重大进展。该公司一部分造车团队成员也开始转向生成式AI。

微软、谷歌等科技巨头们已经打得火热,苹果也不可能沉寂太久。就在上个月,苹果研究团队已经发布一篇名为《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》的论文,正式公布在多模态大模型领域的研究成果。

MM1是一个具有最高300亿参数(另外还有30亿和70亿)的多模态大模型系列,由dense(密集)模型和MoE(混合专家)架构变体组成。该系列大模型在数个多模态基准、上下文预测、多图像和思维链推理等方面均有不错表现。

相较于AI大模型行业前沿激战正酣的千亿、万亿参数级别大模型,苹果目前的大模型显然不是一个以AGI(通用人工智能)为目标的产品,但其阶段性目标也明确在百亿参数内的高性能表现上,即如何将AI大模型的能力更好与端侧设备的本地运行能力相融合——这也是技术适应产品并推动产品的基本逻辑体现。




免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。由用户投稿,经过编辑审核收录,不代表头部财经观点和立场。
证券投资市场有风险,投资需谨慎!请勿添加文章的手机号码、公众号等信息,谨防上当受骗!如若本网有任何内容侵犯您的权益,请及时联系我们。