## 《纽约时报》《卫报》等23家媒体封杀互联网档案馆，AI数据圈地运动威胁数字历史
数字黑暗时代正从预言走向现实。近日，《连线》杂志披露，《USA Today》、《纽约时报》、《卫报》等至少23家全球主流新闻媒体，已开始屏蔽互联网档案馆（Internet Archive）旗下“时光机”（Wayback Machine）的网络爬虫。这一行动并非孤例，而是继谷歌、百度、必应等主流搜索引擎取消网页快照功能后，对公共网络存档发起的又一次系统性围堵。其直接后果是，大量正在消失的网页将失去最后一道备份屏障，互联网的公共记忆面临被彻底抹去的风险。

这场封杀的核心矛盾，在于新闻机构对人工智能公司滥用数据的深层恐惧。《卫报》商务与授权总监罗伯特·哈恩明确表示，封禁爬虫是出于“担忧人工智能公司可能滥用为存档目的抓取的内容”。讽刺的是，封杀者自身正是历史存档的受益者：《USA Today》不久前一篇揭露美国移民与海关执法局的深度调查，其关键证据正是基于“时光机”抓取的历史页面数据。互联网档案馆负责人马克·格雷厄姆对此吐槽道：“他们能完成这篇报道正是因为‘时光机’的存在，可他们却在封禁访问权限。”

此次事件标志着互联网信息保存的危机进入新阶段。以往信息散佚多因平台成本考量，而如今则演变为一场由AI数据争夺驱动的“圈地运动”。作为全球最重要的非营利数字图书馆，互联网档案馆近年来已因“Great 78项目”等版权纠纷与索尼等巨头对簿公堂。如今，在AI训练数据成为核心战略资产的背景下，新闻媒体为保护自身内容资产而筑起高墙，却可能意外加速人类数字历史的整体流失。皮尤研究中心2023年的报告已显示，过去十年间高达25%的网页已无法访问。当公共存档渠道被逐一掐断，温特·瑟夫所警告的“数字黑暗时代”——即未来人类可能根本没有21世纪历史记录——正变得触手可及。
---
- **Source**: 36氪最新 (RSSHub)
- **Sector**: The Network
- **Tags**: 人工智能, 数据存档, 新闻媒体, 网络爬虫, 数字遗产
- **Credibility**: unverified
- **Published**: 2026-04-20 03:03:02
- **ID**: 71664
- **URL**: https://whisperx.ai/zh/intel/71664