MJ12botに悩まされる

Viewed: 10:16:32 in December 6, 2019

Posted: March 8, 2014
WordPressの記事をアーカイブ化したものです。

この記事を書いた人
「牧岡ふうふ堂」オーナー。博士(工学)。
酒都圏在住。
某地方の国立系工業大学でアシスタントをしていました。 専門は有機反応・金属錯体(主に希土類)・π共役系。
twitterアカウントは@makiokafufudo(お仕事用)、@ymakioka(個人用)です。

運営しているwww.nanoniele.jpが時々”503 Service Temporary Available”を出してアクセスできなくなることがあり、どうしたものかと思っていました。

そこで、アクセスログを付けるようPerlでスクリプトを作成し、走らせてみると…

MJ12bot。こやつです。数秒毎にアクセスして来てたのでした。

Webのアドレス(http://www.majestic12.co.uk/projects/dsearch/mj12bot.php)がログに記されてましたので、覗いてみると…

アクセスやめておきたければ、robots.txt というファイルに

User-agent: MJ12bot
Disallow: /

と書いておき、webコンテンツを置いてあるディレクトリに放り込んどけ、と。

アクセスはしてもいいが、こんなに頻繁なアクセスを許したくないのなら

User-Agent: MJ12bot
Crawl-Delay: 5

とrobots.txt というファイルに入れておけ、との説明。

…というわけで、やっておきました。

ところで、このMJ12bot、どこからアクセスしてくるのかですが、私のサイトではDeutsche Telekom(ドイツ)からのが圧倒的に多いですね。Level 3 Communications(米国)やChina Telecom(中国)からのも多いです。国内ではADSLの価格破壊で一世を風靡したあのプロバイダからが主なアクセス元です。

興味深いのは、China Telecomからアクセスして収集したwebのデータを元に、Deutsche Telekomからアクセスして来ているケースがあること。どういうメカニズムなのかは謎です。

あと、上記のMJ12botのオフィシャルサイト中の、http://www.majestic12.co.uk/projects/dsearch/badbot-1.08.php には、MJ12botのニセモノ(Fake MJ12bot v1.0.8)に関する記述もあり、2008年の時点で「ニセモノは長期間現れていない」とありますが、ニセモノはTrojan.Win32.Agent.dqyやTrojan.Win32.Zapchast.dv等のウィルスであるとの報告もあるようです。

ログ中にMJ12bot/v1.0.8等とある場合には、よそ様のコンピュータのウィルスから悪意あるアクセスがなされている可能性があり、しかもこやつのブロックはrobots.txtでは効かないかもしれないので、.htaccessでブロックする等した方がいいかもです。

.htaccessの書き方は上記サイトにあります(英語ですが例が出てます)。

 

あわせてどうぞ

アーカイブ化したWordPress記事
よく読まれている記事をアーカイブ化しました。

「あなた、相撲で賭けてるの?」
賭けてたらお縄ですって。

[Perl] 3.9 + 5.1 = 9.0 が減点対象な話
何を習ったかを思い出せ。

[Perl] 画像の形式を判別する (PNG/JPEG/BMP/GIF)
忘れないように記録を残しました。

[お猿さん] 国道2号線沿いにある例の看板の意味
広島でちょっと有名なあれです。

イノシシ肉でチャーシューを作りました
中華街で売られているチャーシューの味に近くなると思います。

PerlとJavascriptの連携でウェブコンテンツを表示させる方法
JavascriptとPerlを組み合わせ、アクセスランキングなどをWebに表示させたいときなどに使います。

餅つき機のモーターが止まった(ºωº)
忘れないように書き留めておきました。

Avogadroで分子モデリング
分子の三次元モデルを描くのに、私はAvogadroを使ってます。

H4Oの構造が見つかった(ただしですね
分子ではないですよ。

H4Oの構造が見つかった (2)
分子ではないですよ。

[水素水] H6Oのエネルギー計算をやってみた
むりくりにやりました。