随着苹果公司努力为今年晚些时候推出的 Apple Intelligence 测试版做好准备,一份新报告称该公司在训练其人工智能模型时使用 YouTube 视频作为数据源。
苹果只是一家被认为在训练人工智能时使用第三方收集的数据的公司,Nvidia 和 Anthropic 也被认为使用了相同的信息。该数据集名为 YouTube Subtitles,由 EleutherAI 收集,并根据该平台上一些大腕(包括 MKBHD 和 MrBeast)创建的视频转录内容创建。
虽然该数据集不是使用实际视频本身而是使用其文字记录创建的,但人们仍然认为该行为违反了 YouTube 的服务条款。
一切都与字幕有关
《连线》报道指出,该数据集是该机构发布的名为“Pile”的汇编的一部分,互联网上的任何人都可以访问和开放该数据集。
一项调查发现,受益公司之一的苹果公司使用了来自 48,000 个频道的 173,536 个 YouTube 视频的字幕来训练数据。据认为,苹果使用 Pile 来训练 OpenELM,该模型于 4 月份宣布,就在苹果宣布 Apple Intelligence 将与 iOS 18 一起推出的几周前。该产品由多个新的人工智能功能组成,可跨多个应用程序和服务生成文本和图像。
可以理解的是,YouTube 用户对此消息并不满意。 “没有人来找我说,‘我们想用这个,’”大卫帕克曼秀的主持人大卫帕克曼说。其他人则认为以这种方式使用字幕数据是盗窃,并指出同样的技术很可能在未来被用来抢走创作者的工作。
Apple Intelligence 将于今年晚些时候推出(尽管仍处于测试阶段),同时推出 iOS 18 以及 Mac、iPad、Mac、Apple Watch、Apple TV 和 Apple Vision Pro 的软件更新。
几分钟内掌握你的 iPhone
macmao 的专家团队拥有数十年的 Apple 设备经验,可提供针对性的建议和指导。和macmao一起了解更多!
免责声明
部分内容(图片、文章)翻译/转载自国内外资讯/自媒体平台。文中内容不代表本站立场,如有侵权或其它,请联系 macmao.com@gmail.com,我们会第一时间配合删除。(转载请注明来源自:www.macmao.com)