Apple Intelligence 本周刚刚推出测试版,现在该公司发布了对其部分人工智能功能如何创建的深入概述。一个关键花絮?苹果公司的两款基础型号是使用谷歌制造的芯片创建的。
首次深入了解Apple Intelligence的发展
苹果倾向于回避分享其产品开发内部实践的许多细节。然而,凭借人工智能和机器学习功能,该公司很早就公布了其研究成果供所有人查看。
最新出版物的标题是“Apple Intelligence 基础语言模型”,这是自 WWDC 介绍 Apple Intelligence 以来的首批论文之一。
该文档是由研究人员编写并为研究人员编写的,因此它不是最容易解析的。然而,一个引人注目的花絮涉及用于训练两个 Apple Intelligence 语言模型的芯片。
在本报告中,我们将详细介绍其中两个模型——AFM-on-device(AFM 代表 Apple Foundation Model)(一个 30 亿参数的语言模型)和 AFM-server(一个更大的基于服务器的语言模型)的构建和实现过程。适合高效、准确和负责任地执行专门任务。这两个基础模型是 Apple 创建的更大的生成模型系列的一部分,旨在支持用户和开发人员;这包括一个将智能构建到 Xcode 中的编码模型(基于 AFM 语言模型),以及一个帮助用户直观地表达自己的扩散模型,例如在消息应用程序中。
使用谷歌芯片训练苹果模型
提到的两个模型(AFM-on-device 和 AFM-server)并未使用 Apple 内部的 Apple Silicon 芯片进行训练。
相反,苹果公司转而使用 Google Tensor 芯片(就像 Pixel 手机中的芯片一样)来训练其模型。根据该论文,需要大量张量芯片来完成这项工作。
- 设备上的 AFM 在训练中需要 2,048 个 TPUv5p 芯片
- 较大的 AFM 服务器模型需要 8,192 个 TPUv4 芯片
有趣的是,苹果使用了谷歌的 Tensor 芯片,而不是其他公司倾向于依赖的 Nvidia 芯片。
这篇论文没有对此进行解释,但也许未来的出版物会对此进行解释。
我们应该如何看待这个消息?如果没有苹果公司提供更多细节,我们很难知道该怎么想。
了解苹果公司倾向于尽可能多地在内部完成工作后,该公司很可能已经不再使用 Google Tensor 进行模型训练,而是使用 Apple Silicon 的高级版本。
无论如何,这确实意味着 iPhone 通过 Apple Intelligence 变得更加智能,这在一定程度上要归功于谷歌。
免责声明
部分内容(图片、文章)翻译/转载自国内外资讯/自媒体平台。文中内容不代表本站立场,如有侵权或其它,请联系 macmao.com@gmail.com,我们会第一时间配合删除。(转载请注明来源自:www.macmao.com)