如何从 Wayback Machine 中删除网站?

在本文中,我们重点介绍了 如何从 Wayback 机器中删除网站.

有几个 在线存储库 保存可公开访问的互联网资料,供学者和历史学家以及公众将来使用。 为了全面性,这些档案馆和数字图书馆渴望成为这些内容的可信存储库。

然而,某些作者和 出版商可以要求他们的材料 不包含在可公开访问的档案或数字馆藏中。 如下所述,档案管理员可以在事先通知或不通知的情况下,根据此类请求限制或删除部分馆藏。

本文件的政策建议是通过 Archive P 主持的会议制定的,该会议汇集了各种商业和非商业组织的代表,以公开透明的方式讨论数据完整性和数据删除这一棘手问题可能的。

如何从 Wayback Machine / Archive.org 中删除网站?

要从 Internet Archive/Wayback Machine/Archive.org 中删除您的网站,请遵循以下五个简单且行之有效的方法。

要从 Archive.org 中删除您的网站,您需要遵循以下五个步骤:

如何从 Wayback 机器中删除网站

阻止 Internet Archive、Wayback Machine 和 Archive.org 爬虫通过更新您网站的 robots.txt 文件。 应检查版权声明。

可以通过 DMCA 删除通知与您希望删除的站点/页面的 URL 联系 Internet Archive / Wayback Machine / Archive.org。

查找显示域所有权最早日期的旧发票。

向 Internet Archive / Wayback Machine / Archive.org Crawler 发送一封礼貌的电子邮件,附上 2. 和 3.。

等待 3 到 5 天。

请参阅下面提供的信息,以帮助完成每个简单的步骤以从 Archive.org 和相关连接中删除您的网站。

谈到 Internet Archive,我得到了不同的结果,这是我最大的抱怨之一。 站点升级有时会导致我的 robots.txt 文件被删除,我发现自己又回到了 Archive.org。 我希望 Archive.org 有一个像 Google/Bing 这样的网站管理员工具,允许发布者在执行删除之前验证域的所有权。

第 1 步:Robots.txt 用于阻止网站访问 Wayback Machine、Archive.org 或 Internet Archive。

如果您真的很好奇,可以找到有关 robots.txt 的更多信息。

Archive.org 对如何处理 robots.txt 意见不一,但他们这样做是出于对文件的尊重。

不要从现有的 robots.txt 文件中删除任何内容; 把这个放在最后。

ia archiver Disallow: /复制用户代理

如需编辑 robots.txt 文件方面的帮助,请联系您的网络托管服务商或开发人员。

使用免费的 Archive.org Blocker WordPress 插件,您可以完全阻止 Archive.org 在您的网站上运行。 就像安装和激活一样简单。 如果您已经使用 robots.txt 插件。

存档组织 wordpress 插件拦截器

在进行这些修改的同时仔细检查您网站的版权声明是个好主意。 这通常由大多数内容管理系统自动完成。

第 2 步:Internet Archive/Wayback Machine/Arche.org DMCA 删除通知

数字千年版权法案 首字母缩写词 DMCA. 在美国,这是一项旨在帮助版权所有者更好地保护其知识产权的法律。

使用 数字千年版权法案 (DMCA) 删除 Wayback Machine、Archive.org 和 Internet Archive 等网站的内容。

如果您正在处理涉及存档信息的严重情况,最好咨询律师。 但是,这不是法律建议,因此如果您不确定任何事情,请咨询法律建议。

根据已阅读这些说明的其他人的说法,您可以跳过此 DMCA 步骤。 对我有用的可能对你不起作用。

我利用 Who Is Hosting This 的免费 DMCA 生成器来创建 DMCA 删除通知。 用这个 DMCA 删除通知 如果您选择这样做,请改为使用知识产权总部的生成器。

值得重复:DMCA 通知是法律文件,因此在起草时要格外小心。

使用 DMCA 表格很简单,但您应该输入尽可能多的 Archive.org 网站 URL,这些 URL 与您控制该域的时间和已从中删除的内容相对应。

第 3 步:向 Internet Archive/Wayback Machine/Archive.org 展示域名所有权的历史

从中删除整个域或网站 Archive.org,您可能需要提供域注册证书的副本。 DNS 记录更新、网站代码或文件上传不会自动验证 Archive.org 上文件的所有权。 为了证明所有权,您需要找到您的旧发票或收据 托管域.

域名所有权

您需要登录到您的帐户以获取大多数托管公司提供的发票历史记录。 最坏的情况是您必须向托管公司的会计部门发送电子邮件。

为...做好准备 Archive.org 请求更多信息 如果您尝试跳过此步骤并查看会发生什么。 使用与域关联的电子邮件地址是避免此问题的一种方法。

因此,我强烈建议您在请求时附上证明您所有权的文件。 这可能是 Archive.org 的一个问题,因为他们检查公共域数据以验证您的域是否已更改主机、注册商等。 如果您忘记了初始注册或主机,我的免费域名历史检查将帮助您唤起记忆。

无法从 互联网档案馆 如果您不拥有该域。

第 4 步:向 Internet Archive、Wayback Machine 或 Archive.org 发送电子邮件,请求将您的网站从他们的数据库中删除。

在完成第 1-3 步之前,请勿向 Archive.org 的删除请求电子邮件地址发送电子邮件。

如果电子邮件来自您在邮件中交流的域,则更好。 例如,如果你想删除 Google.com,你需要一个 @google.com 电子邮件地址 去做吧。 Archive.org 可能需要额外的验证程序来回复来自与您正在寻找的域不同的电子邮件地址的请求。

当您发送请求时,Gmail、Outlook.com 和其他免费电子邮件服务几乎肯定会减慢速度。 您可以使用此材料来支持您的请求,这是我建议步骤 3 的原因之一。

对于 Archive.org 删除请求或域删除,这里有一些推荐词:

将 [Your Name] 替换为您自己的名字,将 [Your Domain] 替换为您的网站名称。

[开始日期] 包含您希望撤销域的日期和域所有权证明。

不要试图一下子做完所有事情; 相反,单独向每个域发送通知。

联系原因

请从正文的 Internet 存档副本中删除 [您的域]

您好

我很高兴自我介绍为[你的名字]。

[您的域] 站点/域应立即从 web.archive.org 和 Internet Archive Wayback Machine 中删除。
我们的 robots.txt 文件的 disallow: / 用户代理代码: ia 归档器没有被遵守。 本网站的版权声明位于此处。 [您的域名]

从 [Start Date] 到今天(包括今天)以及未来的每一天,我都在寻求删除 [Your Domain]。

包含我拥有 [您的域] 的 DMCA 通知和证明。

感谢您的快速回复。

[你的名字]复制

不要忘记附上您在第 2 步和第 3 步中准备的 DMCA 通知和所有权证据!

第 5 步:监控 Archive.org 的更新。

提交电子邮件后,您将不得不等待。 在过去,短则 24 小时,长则几天,我都会收到回复。

请记住,Archive.org 的总部位于加利福尼亚州以外,因此在与他们联系时请务必考虑美国太平洋时间和周末以及重要的美国节假日。

另请参阅:

结论

保持冷静、礼貌,但同时要有力。 如果您在三天内没有收到公司的消息,您可能需要发送一封有礼貌的跟进电子邮件。

如果您按照上述步骤操作,您会在五天内收到回复。 在他们做出反应后,Archive.org 需要大约一周的时间才能从网站上删除内容。

关于阿伦辛格

我是 Arun Singh,一位经验丰富的服务器管理极客,在处理托管服务器方面拥有超过 8 年的记录。 我目前在印度孟买的一家私营公司工作,同时还负责以下公司的服务器管理: BloggersIdeas.com。 除了我在服务器管理方面的专业知识外,我还喜欢分享我在数字营销方面的知识。 凭借对这两个领域的热情,我努力提供最佳的服务器性能,并偶尔在不断发展的数字营销领域贡献见解。 我对卓越的追求促使我提供高效的解决方案并为企业的成功做出贡献。

相关文章

发表评论