因 AI 企业从存档抓取数据,Reddit 禁止互联网档案馆对非首页索引
人阅读 2025-08-13 17:57:53
感谢网友 Nuc_F 的线索投递!
8 月 13 日消息,参考外媒 The Verge 当地时间 11 日报道,海外大型社区论坛 Reddit 宣布禁止互联网档案馆 (Internet Archive) 对该论坛非首页的绝大多数页面进行索引存档。
Reddit 发言人在向媒体解释这一变化时表示,这是因为一些 AI 企业以违反平台政策的方式通过互联网档案馆的存档页面抓取该企业数据。Reddit 允许企业付费抓取 AI 所需的数据,但经由互联网档案馆间接访问显然绕过了这一规定。
互联网档案馆旗下网页时光机 (Wayback Machine) 总监在声明中表示,该组织与 Reddit 有着长期合作关系,并正继续就此事持续展开讨论。
相关阅读:
《Reddit 起诉 AI 初创公司 Anthropic:去年 7 月以来发起超 10 万次违规访问》
《Reddit CEO:微软等公司必须付费才能抓取数据》
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,所有文章均包含本声明。