Internet Archiveのサイト削除方法

サイト管理

 Internet Archiveをご存じですか? 1996年からネット上に存在するサイトのHTMLファイルをごっそり保存している団体です。閲覧は半年から1年経過したものしかできませんが、現在なんと400億ページも保管されています。

 先日「幻想画廊」のアドレスを入力して調べてみました。2004年のトップページが8回分保管されていたんですが、そしたら、あなた、びっくり仰天(死語)。

 「真があって運の尽き」は、もともと「幻想画廊」のトップページに書いていたミニ日記「Small Talk」だったんですが、Internet Archiveに保管されている幻想画廊のSmall Talkが全然知らない人の日記になっているんですよ。フレームの中に入ってるので、偶然見た方は「これ麻理さんの日記なんだ」と勘違いしちゃいますよ。

 当時私は、自分でCGI日記を作るのが面倒で「ロケットBBS」というレンタルサービスの掲示板を改造し、日記として利用していました。

 しばらくして使い勝手の良い自前のCGI日記に変えたので、ロケットBBSは解約しました。しかしその後契約された方がたまたま私の使っていたものと全く同じナンバーと同じIDだったのでこんな事態に。こんなことってあるのねえ。

 ネットをあちこち見て回ると、Internet Archiveに反対している人が結構います。使いようによっては便利で意義あるサイトなんだけど、頼んだわけでもないのに勝手にページをコピーしていくのって、いろんな法律にひっかかりそうな気がします。過去のサイトなんて恥ずかしくて見たくない人もいるでしょうし。

 困ってる方のために、こちらに記載されているInternet Archiveから自分のサイトを削除する方法を書いておきます。

 自分のサイトの一番上のディレクトリ(index.htmlがあるところ)に「robots.txt」というファイルを作ります。そこに

User-agent: ia_archiver
Disallow: /

 と記入して、robots.txtをサーバにアップ。そしてこちらのフォームに自分のサイトアドレスを入力して「Crawl My Site」ボタンを押す。以上! robots.txtをアップできない人は、wayback2@archive.orgにメールを送ればよいそうです。

 もしだめだったら私もメールを出してみますが、すぐに対応してくれるのかヒジョーに疑問。だって400億ページでしょ。削除依頼メールだってどっさり来るだろうし。だいたい全世界的にページを集めているのに、削除依頼ページが英語って。英語が分からない人はどうすりゃいいのよ。Internet Archiveって不親切ねえ。

 とりあえず待つだけ待ってみますが、不幸中の幸いとしては、表示されている別人の日記がエッチ系やグロ系でなかったこと。それだけでも良かった。「それ、私じゃないですから。本当に違いますから!」と必死で説明しなくちゃいけないところでしたよ。ま、見る人はほとんどいないでしょうが、やっぱり、ねえ。

【追記】……とこの記事をアップしてすぐにクローラーが来て、すんなりサイトが削除されました。うはーびっくり。早業。(10/27)

今日のサイト

「■だまし絵■(面白画像 オヤジーデハウス)」

 だまし絵がたくさん。有名なものから、初めて見るものまで。

2005年 10月 27日(木)

広告