Jitendra Vaswani

Tìm kiếm
Đóng hộp tìm kiếm này.

Làm cách nào để xóa trang web khỏi Wayback Machine?

Trong bài viết này, chúng tôi đã giới thiệu Cách xóa trang web khỏi Wayback Machine.

Có một số kho trực tuyến lưu các tài liệu Internet có thể truy cập công khai để các học giả và nhà sử học cũng như công chúng sử dụng trong tương lai. Hướng tới tính toàn diện, các kho lưu trữ và thư viện số này mong muốn trở thành những kho lưu trữ đáng tin cậy cho nội dung này.

Tuy nhiên, một số tác giả và nhà xuất bản có thể yêu cầu tài liệu của họ không được bao gồm trong các kho lưu trữ hoặc bộ sưu tập kỹ thuật số có thể truy cập công khai. Các nhà lưu trữ có thể hạn chế hoặc xóa các phần tài sản của họ để đáp ứng các yêu cầu đó, có hoặc không có thông báo trước, như được mô tả dưới đây.

Các đề xuất chính sách của tài liệu này được phát triển thông qua một cuộc họp do Archive P tổ chức, trong đó tập hợp các đại diện của nhiều tổ chức thương mại và phi thương mại để thảo luận về chủ đề nhức nhối về tính toàn vẹn của dữ liệu và xóa dữ liệu theo cách cởi mở và minh bạch như khả thi.

Làm cách nào để xóa một trang web khỏi Wayback Machine / Archive.org?

Để xóa trang web của bạn khỏi Lưu trữ Internet/Wayback Machine/Archive.org, hãy làm theo năm phương pháp đơn giản và đã được chứng minh sau đây.

Dưới đây là năm bước bạn cần thực hiện để xóa trang web của mình khỏi Archive.org:

Cách xóa trang web khỏi Wayback Machine

Chặn Internet Archive, Wayback Machine và Archive.org Trình thu thập thông tin bằng cách cập nhật tệp robots. txt của trang web của bạn. Thông báo bản quyền nên được kiểm tra.

Có thể liên hệ với Lưu trữ Internet / Wayback Machine / Archive.org qua Thông báo gỡ xuống DMCA kèm theo URL của các trang/trang bạn muốn xóa.

Tìm hóa đơn cũ hiển thị ngày sở hữu miền sớm nhất.

Gửi một email lịch sự tới Internet Archive / Wayback Machine / Archive.org Crawler với 2. và 3. được đính kèm.

Chờ 3 đến 5 ngày.

Vui lòng xem thông tin được cung cấp bên dưới để được hỗ trợ hoàn thành từng bước đơn giản nhằm xóa trang web của bạn khỏi Archive.org và các kết nối có liên quan.

Khi nói đến Lưu trữ Internet, tôi đã có nhiều kết quả khác nhau và đó là một trong những mối quan tâm lớn nhất của tôi. Việc nâng cấp trang web đôi khi khiến tệp robots. txt của tôi bị xóa sạch và tôi thấy mình quay lại Archive.org. Tôi ước Archive.org có công cụ quản trị trang web như Google/Bing cho phép nhà xuất bản xác minh quyền sở hữu tên miền trước khi thực hiện gỡ xuống.

Bước 1: Robots.txt được sử dụng để chặn một trang web khỏi Wayback Machine, Archive.org hoặc Internet Archive.

Bạn có thể tìm hiểu thêm về robots.txt nếu bạn thực sự tò mò.

Archive.org không biết cách xử lý tệp robots.txt, nhưng họ làm như vậy vì tôn trọng tệp.

Không xóa bất kỳ thứ gì khỏi tệp robots. txt hiện tại của bạn; chỉ cần đặt điều này ở cuối.

trình lưu trữ ia Không cho phép: /Sao chép tác nhân người dùng

Để được hỗ trợ chỉnh sửa tệp robots. txt của bạn, hãy liên hệ với nhà phát triển hoặc công ty lưu trữ web của bạn.

Sử dụng plugin WordPress Trình chặn Archive.org miễn phí, bạn hoàn toàn có thể ngăn Archive.org hoạt động trên trang web của mình. Nó đơn giản như cài đặt và kích hoạt. Thêm mã ở trên vào cuối tệp robots. txt hiện tại của bạn nếu bạn đã sử dụng plugin robots.txt.

lưu trữ trình chặn plugin org wordpress

Bạn nên kiểm tra kỹ thông báo bản quyền trên trang web của mình cùng lúc với việc thực hiện các sửa đổi này. Điều này thường được thực hiện tự động bởi hầu hết các hệ thống quản lý nội dung.

Bước 2: Lưu trữ Internet/Wayback Machine/Arche.org Thông báo gỡ xuống DMCA

Sản phẩm Luật bản quyền thiên niên kỷ kỹ thuật số đi theo từ viết tắt DMCA. Tại Hoa Kỳ, đó là một bộ luật được thiết kế để hỗ trợ chủ sở hữu bản quyền bảo vệ tốt hơn tài sản trí tuệ của họ.

Sử dụng Đạo luật bản quyền kỹ thuật số thiên niên kỷ (DMCA) để xóa nội dung khỏi các trang web như Wayback Machine, Archive.org và Internet Archive.

Bạn nên tham khảo ý kiến ​​luật sư nếu bạn đang giải quyết một tình huống nghiêm trọng liên quan đến thông tin được lưu trữ. Tuy nhiên, đây không phải là lời khuyên pháp lý, vì vậy nếu bạn không chắc chắn về bất cứ điều gì, hãy tham khảo ý kiến ​​của ai đó.

Theo những người khác đã đọc các hướng dẫn này, bạn có thể bỏ qua bước DMCA này. Những gì làm việc cho tôi có thể không làm việc cho bạn.

Tôi đã sử dụng Who Is Hosting Trình tạo DMCA miễn phí này để tạo thông báo gỡ xuống DMCA. Dùng cái này Thông báo gỡ xuống DMCA thay vào đó, trình tạo từ HQ Sở hữu trí tuệ, nếu bạn chọn làm như vậy.

Cần nhắc lại: Thông báo DMCA là tài liệu pháp lý, vì vậy hãy hết sức thận trọng khi soạn thảo chúng.

Sử dụng biểu mẫu DMCA rất đơn giản nhưng bạn nên nhập càng nhiều URL trang web Archive.org càng tốt tương ứng với thời gian bạn kiểm soát miền và nội dung đã bị xóa khỏi miền đó.

Bước 3: Hiển thị Lưu trữ Internet/Wayback Machine/Archive.org Lịch sử sở hữu miền

Để xóa toàn bộ miền hoặc trang web khỏi Archive.org, bạn có thể được yêu cầu cung cấp một bản sao chứng chỉ đăng ký miền của mình. Cập nhật bản ghi DNS, mã của trang web hoặc tải tệp lên không tự động xác minh quyền sở hữu tệp trên Archive.org. Để chứng minh quyền sở hữu, bạn sẽ cần tìm hóa đơn hoặc biên lai cũ từ bạn tên miền được lưu trữ.

Quyền sở hữu tên miền

Bạn sẽ cần đăng nhập vào tài khoản của mình để lấy lịch sử hóa đơn do hầu hết các công ty lưu trữ cung cấp. Trường hợp xấu nhất là bạn sẽ phải gửi email đến bộ phận tài khoản của công ty lưu trữ.

Hãy chuẩn bị cho Archive.org để yêu cầu thêm thông tin nếu bạn cố gắng bỏ qua bước này và xem điều gì sẽ xảy ra. Sử dụng địa chỉ email được kết nối với miền là một cách để tránh sự cố.

Do đó, tôi thực sự khuyên bạn nên đính kèm tài liệu chứng minh quyền sở hữu của mình với yêu cầu của bạn. Đây có thể là một vấn đề với Archive.org vì họ kiểm tra dữ liệu miền công khai để xác minh rằng miền của bạn đã thay đổi máy chủ, nhà đăng ký, v.v. Công cụ kiểm tra lịch sử tên miền miễn phí của tôi sẽ giúp khơi dậy trí nhớ của bạn nếu bạn quên đăng ký hoặc máy chủ lưu trữ ban đầu của mình.

Không thể xóa một trang web khỏi Internet Archive nếu bạn không sở hữu tên miền.

Bước 4: Gửi email đến Internet Archive, Wayback Machine hoặc Archive.org yêu cầu xóa trang web của bạn khỏi cơ sở dữ liệu của họ.

Không gửi email đến địa chỉ email yêu cầu xóa của Archive.org cho đến khi bạn hoàn thành Bước 1-3.

Sẽ tốt hơn nếu email bắt nguồn từ tên miền mà bạn đang liên lạc trong thư. Ví dụ, nếu bạn muốn xóa Google.com, bạn sẽ cần một địa chỉ email @google.com để làm điều đó. Có thể Archive.org sẽ yêu cầu các thủ tục xác minh bổ sung để trả lời yêu cầu từ một địa chỉ email khác với tên miền bạn đang tìm kiếm.

Gmail, Outlook.com và các dịch vụ email miễn phí khác gần như chắc chắn sẽ làm chậm mọi thứ khi bạn gửi yêu cầu. Bạn có thể sử dụng tài liệu này để hỗ trợ yêu cầu của mình, đó là một trong những lý do tôi đề xuất Bước 3.

Đối với Yêu cầu Gỡ bỏ Archive.org hoặc Xóa tên miền, đây là một số từ được khuyến nghị:

Thay thế [Tên của bạn] bằng tên riêng của bạn và [Miền của bạn] bằng tên trang web của bạn.

[Ngày bắt đầu] với ngày mà bạn muốn miền được rút lại và bằng chứng về quyền sở hữu miền.

Đừng cố gắng làm tất cả cùng một lúc; thay vào đó, hãy gửi thông báo đến từng miền riêng lẻ.

Tiêu Đề

Vui lòng xóa [Tên miền của bạn] khỏi Lưu trữ Internet Bản sao của cơ thể

Xin chào

Tôi rất vui được tự giới thiệu mình là [Tên của bạn].

Trang web/miền của [Miền của bạn] phải được xóa khỏi web.archive.org và Internet Archive Wayback Machine ngay lập tức.
Không cho phép tệp robots.txt của chúng tôi: / mã cho Tác nhân người dùng: ia trình lưu trữ không được tuân theo. Thông báo bản quyền của trang web này được đặt tại đây. [Tên miền của bạn]

Từ [Ngày bắt đầu] cho đến và bao gồm cả hôm nay và mọi ngày trong tương lai, tôi đang tìm cách xóa [Miền của bạn].

Bao gồm thông báo DMCA và bằng chứng rằng tôi sở hữu [Miền của bạn].

Tôi đánh giá cao cách bạn trả lời nhanh chóng.

[Tên của bạn]Sao chép

Đừng quên bao gồm thông báo DMCA và bằng chứng về quyền sở hữu mà bạn đã chuẩn bị ở Bước 2 và Bước 3!

Bước 5: Theo dõi Archive.org để cập nhật.

Bạn sẽ phải đợi sau khi gửi email. Tôi đã nhận được phản hồi trong ít nhất là 24 giờ và lâu nhất là vài ngày trước đây.

Hãy nhớ rằng Archive.org có trụ sở chính bên ngoài California, vì vậy hãy đảm bảo tính đến Giờ Thái Bình Dương của Hoa Kỳ và các ngày cuối tuần cũng như các ngày lễ quan trọng của Hoa Kỳ khi liên hệ với họ.

Cũng đọc:

Kết luận

Hãy bình tĩnh và lịch sự, nhưng đồng thời cũng phải mạnh mẽ. Nếu bạn không nhận được phản hồi từ công ty trong vòng ba ngày, bạn có thể muốn gửi một email theo dõi lịch sự.

Nếu làm theo các bước trên, bạn có thể nhận được phản hồi trong vòng năm ngày. Sau khi họ phản ứng, Archive.org mất khoảng một tuần để xóa nội dung khỏi trang web.

Về arun singh

Tôi là Arun Singh, một chuyên gia quản lý máy chủ có kinh nghiệm với thành tích hơn 8 năm trong việc xử lý các máy chủ lưu trữ. Tôi hiện đang làm việc tại Mumbai, Ấn Độ, nơi tôi làm việc trong một công ty tư nhân và tôi cũng quản lý máy chủ tại BloggerIdeas.com. Bên cạnh chuyên môn về quản lý máy chủ, tôi cũng thích chia sẻ kiến ​​thức của mình về tiếp thị kỹ thuật số. Với niềm đam mê dành cho cả hai lĩnh vực, tôi cố gắng cung cấp hiệu suất máy chủ tối ưu và thỉnh thoảng đóng góp những hiểu biết sâu sắc về lĩnh vực tiếp thị kỹ thuật số không ngừng phát triển. Sự cống hiến của tôi cho sự xuất sắc thúc đẩy tôi cung cấp các giải pháp hiệu quả và đóng góp vào sự thành công của các doanh nghiệp.

bài viết liên quan

Để lại một bình luận