根据周四的一份新报告,许多知名新闻媒体和社交媒体平台都选择退出苹果通过网站抓取的人工智能训练数据收集。
苹果通过一款名为 Applebot-Extended 的新工具来实现这一目标,该 iPhone 巨头在不到三个月前推出了该工具。如果主要内容网站选择退出 Apple AI 抓取,这可能会对 Apple Intelligence 的持续发展产生影响。
一些最大的网站选择退出 Apple AI 抓取
据《连线》报道,阻止苹果人工智能数据收集的公司包括 Facebook、Instagram、Craigslist、Tumblr、《纽约时报》、《金融时报》、《大西洋月刊》、Vox Media、《今日美国》网络和《康泰纳仕》。对机器人爬虫的“冷遇”——既然此类工具有助于训练人工智能——表明机器人爬虫已经进入了“知识产权和网络未来的冲突区”。
苹果延长了退出选项
与某些内容抓取工具不同,Applebot-Extended 允许网站所有者阻止其数据用于 Apple 的 AI 训练。但即便如此,最初的 Applebot 仍然可以抓取他们的网站以改进搜索功能。最近,相关问题出现了争议,苹果否认了未经同意就使用 YouTube 视频训练人工智能的指控。
因此,一些主要网站似乎正在利用人工智能抓取工具的选择退出,这可能会对 Apple Intelligence 不利。网站所有者可以通过更新 robots.txt 文件来阻止 Applebot-Extended,这是一种用于管理网络爬虫的长期协议。
坚持建立伙伴关系?
即便如此,分析显示,目前约有 6% 至 7% 的高流量网站正在屏蔽 Applebot-Extended,其中新闻和媒体机构占大多数。 Applebot-Extended 太新了,以至于一些网站还没有解决它的使用问题。但一些出版商似乎正在采取战略方法,可能会在合作协议签订之前保留数据。
为此,康泰纳仕等一些媒体公司在与某些人工智能机器人的创造者建立合作伙伴关系后,已经解锁了这些机器人。
人工智能抓取也有批评者
《纽约时报》批评这些人工智能数据收集工具的选择退出性质,认为无论技术封锁措施如何,版权法都应该保护其内容。
正如《连线》文章所讨论的那样,传统上不起眼的 robots.txt 文件已成为人工智能训练数据的战场,反映了人工智能时代知识产权方面更广泛的紧张局势。
有人想知道:如果 Apple Intelligence 在广泛发布后飙升,许多主要网站是否会大声疾呼以确保自己参与其中?苹果可能即将与出版商达成更多合作。
免责声明
部分内容(图片、文章)翻译/转载自国内外资讯/自媒体平台。文中内容不代表本站立场,如有侵权或其它,请联系 macmao.com@gmail.com,我们会第一时间配合删除。(转载请注明来源自:www.macmao.com)