Googleやり過ぎだテメー(-_-#)

何度か書いているが、この雑文はGoogle避けがしてある。理由はリンク先に書いているとおり。そして、対策もそこに書いてある。

ところが、先日から「mixiの新規約」というサーチワードでGoogleから来る人が少なくない。おかしいなと思ったら、「mixiの新規約」でぐぐると、トップに出て来る。俺、SEOの神? www

と喜ぶわけはなく、うっとおしいこと限りがない。

ブクマのリンクから来られるのは、ありがたいことである。こんな雑文でも、「査読」されて評価を受けたと思えば、読まれる価値もあるだろう。また、ブクマに限らず、いろいろなリンクでここに到達して来るのはありがたい。この辺のことも前に書いた

しかし、それらにも書いているように、サーチエンジンからのリンクは私は有害だと思っている。これもいろいろなエントリで書いた。だから、robot.txtを書いたりnofollowを入れたりしている。

ところが、Googleはどうやら<a>タグがあると、その間にある文字列でインデクスを作ってしまうようだ。だから、<a>タグの文字列で検索すると、当該エントリにヒットしてしまう。つまりタイトルの中にある文字列は検索対象となってしまうのだ。これはリンク先にアクセス制限がかかっていても同じ。たとえば「マイミクのおごちゃん」でぐぐってみると、ちゃんとmixiへのリンクがヒットする。

タイトルはなるべくキャッチーになるように頭をひねるものだ。と同時に内容について言及している。だから、タイトルで検索可能になっているということは、本文からインデクスを生成しているのと、ほとんど同じようなことになってしまう。つまり、

隠してないのも同然

ということになる。

ここで私がなぜ隠したいかということはどうでもいい。とにかく各エントリをサーチエンジンから隠しておきたいのだ。

ところが、隠してないところに<a>タグがあると、これが台無しだ。本体は隠していても、リンクがあるだけで本体のインデクスが作られてしまう。つまり全く隠したことにならないのだ。

冷静に考えてみれば、robot.txtにしてもnofollowにしても「そこから先には行かないよ」という意味でしかないから、外に出ている情報からインデクスを作るというのは、間違いじゃない。でも、robot.txtにしろnofollowにしろ、「このページでインデクスを作らないでね」という意思表示だ。ということは、いくら正しい動作だとは言え、実体のページにアクセスを禁じられているのに、リンク文字列でインデクスを作るというのは

違法とは認識していない(C)官僚

というのと同じことではないか? だいたい、「外からのリンク」なんてのは、こっちからどうしようもないから、こちらで出来る対策はここまでなのだ。

まぁ高々雑文のことでしかないから、「絶対にインデクス作るな。作ったら罰金な!」とまでは言わないし、そこまで言うのならもっと確実な対策をとる。とは言え、わざわざサーチエンジンに対して見せないような宣言をしているページに対して、無理やりにリンクを張るというのは果して正しい動きなんだろうか? 私も実際に検索してみるまでは、nofollowと書かれたページは全くリンクされないと思っていたし、同じように思っている人は少なくないのではなかろうか?

べ、別に、サーチエンジンなんかから来て欲しくなんかないんだからねっ!

Googleやり過ぎだテメー(-_-#)” への3件のコメント

  1. 「この雑文はGoogle避けがしてある。」のリンクがちょっと変です(http://httpになってる)。

    …これだけだとあんまりなので、ついでに。以前ここのどこかで書かれていた「変なダジャレの書いてある行燈」は「地口行燈(じぐちあんどん)」というものです。

  2. リンク直しました。ありがとうございました。

    > 「変なダジャレの書いてある行燈」は「地口行燈(じぐちあんどん)」

    ほー。これでいろいろ調べようがある。どうもありがとうございました。

    > Live Search も見つけちゃう

    結局、Googleに限らず普通の動作がそういうものだと認識するべきなんでしょうかね。

    しかし、そうなると「カジュアルな対策」は不可能だということになってしまう。

コメントは受け付けていません。