与流行的观点相反,苹果似乎在人工智能领域处于领先地位,在某些情况下似乎远远领先于竞争对手。这一消息来自苹果的一份白皮书,该白皮书并未引起太多关注,但应该受到关注。
关于 Apple 基础模型(该公司自主开发的 LLM(大语言模型),为 Apple Intelligence 提供支持)的白皮书揭示了两个重要事实:它的设计最安全,并且与 Meta 的 Llama 和 OpenAI 的 GPT-4 都具有很强的竞争力。这似乎揭穿了有关苹果人工智能努力的一个大神话:该公司隐私第一的理念会阻碍它的发展。
与 OpenAI、Meta、Mistral AI 等顶级法学硕士相比,苹果基金会模型在写作和总结测试方面的能力同样出色。由于苹果公司制定了严格的有害内容删除准则,经过人工评估的测试多次将其基础模型评为最安全的模型,并且遥遥领先。
看起来 Apple Intelligence 可能会有一个良好的开端。
Apple Intelligence:既安全又精明
今年早些时候,许多头条新闻声称苹果正在输掉人工智能竞赛,因为它没有自己的法学硕士。苹果公司在年度 WWDC 程序员大会上展示了 Siri 与 ChatGPT 的集成,从而引发了争议。这意味着 OpenAI 正在为所有 Apple Intelligence 提供支持,但事实并非如此。
Apple Intelligence 是一个广泛的营销术语,包含了一系列新的人工智能功能。它将适用于所有主要软件平台——iOS、iPadOS 和 macOS。苹果在 WWDC24 上宣布了首批功能:更智能、更强大的 Siri;生成和总结文本的书写工具;消息和其他应用程序中的图像生成。
Apple 基金会模型 (AFM) 为所有这些功能提供支持。 Foundation 模型之于 Apple Intelligence 就像 GPT-4 之于 ChatGPT、Whisper 和其他人工智能服务。这意味着基础模型的能力和实力将与所有 Apple Intelligence 功能的运行效果直接相关。
由 150 多名 Apple 员工撰写的学术白皮书详细概述了基金会模型的培训、性能和评估。
Apple Intelligence 比你想象的更聪明
在人工评估测试中,Apple Foundation 模型和其他竞争模型收到了 1,393 个提示。它针对在设备上运行的顶级开源 LLM 和在云中运行的商业 LLM 分别进行了测试。
在每个领域,无论是在设备上还是在云端,结果都是相似的。与最新、最出色的 Llama-3 和 GPT-4 相比,苹果略显落后。与其他比赛相比,这是一场激烈的比赛。 Apple Intelligence 在超过 50% 的时间内击败了 Mistral 和 GPT-3.5。
额外的基准测试显示出更好的结果。 Apple Intelligence 在文本摘要方面的能力同样出色,无论是在设备上还是在云中,都以微弱的优势位列第一。文本生成和合成被广泛认为是 OpenAI 的 ChatGPT 的基础,但仅比苹果自己的技术稍有领先。
更负责任、更安全的人工智能
当谈到生成不歧视、仇恨、排他、有害、性、非法或暴力的内容时,苹果基金会的模式是最安全的。在人类评估测试中,AFM-on-device 产生有害内容的频率几乎是第二好的设备的一半,大约是 Meta 的 Llama-3 的三分之一。 AFM-server 的表现甚至更好,得分比 GPT-4 高 4.5 倍以上。
在十分之九的人类偏好测试中,Apple 基金会模型的输出在超过 50% 的情况下被认为更安全。在所有 10 项测试中,至少 23% 的情况是平局。
苹果严格剔除训练数据中的有害内容。根据白皮书,输入数据经过“广泛的质量过滤”以确保安全和亵渎,“使用启发式和基于模型的分类器”。清理训练数据会对模型的输出产生巨大影响——它无法复制未显示的内容。
该领域的其他参与者因在 YouTube 视频、Reddit 上的所有内容以及网络上的所有内容(基本上是他们能得到的所有内容)上训练人工智能而受到严厉批评。苹果公司在这方面也并非完全没有受到批评,因为该公司只是在它已经被用来抓取网络之后才透露了其 Applebot-Extended 网络抓取工具。然而,在消费者方面,用户比其他人更信任Apple Intelligence书写工具。
采取行动
iOS 18.1 和 macOS Sequoia 15.1 的最新测试版仅具有书写和图像编辑工具,但还会有更多功能。在未来的版本中,Siri 将能够理解您手机上的应用程序、接受简单语言命令并代表您执行它们。
这个功能的工作效果如何的试金石可以在工具使用测试中看到,其中“给定用户请求和带有描述的潜在工具列表,模型可以选择以操作系统可以理解的格式发出工具调用” 。与其他基准测试不同,AFM-on-device 在这方面非常擅长,因此与其他基于服务器的 LLM 相比,它仍然具有竞争力。 AFM 服务器的平均性能是同类中最好的。
论文中概述的其他测试表明,Foundation 模型在工具使用和遵循说明方面是同类最佳的。
苹果在人工智能竞赛中并没有落后
人们普遍认为,苹果在人工智能竞赛中落后了很多年,这主要是因为没有自己的法学硕士。
事实上,Apple Intelligence 建立在坚实的基础之上:基金会模型。根据研究,它同样强大且安全得多。苹果在人工智能方面一点也不落后。
免责声明
部分内容(图片、文章)翻译/转载自国内外资讯/自媒体平台。文中内容不代表本站立场,如有侵权或其它,请联系 macmao.com@gmail.com,我们会第一时间配合删除。(转载请注明来源自:www.macmao.com)