etchのXenは負荷に弱いらしい

またサーバがコケていた。

最後のコンソールを見ると、kernel panicらしい。etchだからカーネルは2.6.18だ。これがXen 3.0の上で動いている。

このサーバは負荷が高い。常に10近いload aveだ。いろいろ工夫するのだが、運用的に限界がある。cgiとか自由に使わせていると、結構お行儀悪いのがあったりして、そいつらが負荷を上げる。ユーザのレイヤになるから、こっちからはいじりようがない。出来るのは、CPUやメモリやネットワークと言った、ハードウェアに属するものを強化することくらい。

掲示板やblogも多数あるようだ。そして、そこにspamが投げ込まれる。落ちる時間帯はだいたい同じだし、ログを見る限りではspamが投げ込まれたあたりでコケているので、多分まぁその辺で高負荷になっている。

ファイルシステムの本体はファイルサーバにあるので、アクセスが増えるとファイルサーバ側のネットワークが厳しくなる。その辺でいろいろなキューがたまって、ある程度を超えるとドスンという感じ。本来ならそんなことくらいでは落ちないで、ひたすらload aveが上がって行くのだけど、どうやらetchでXenという組合せだと、程々のところでコケるようだ。Xenがpanicメッセージを出してハングアップしている。

今時、2.6.18だってのも困りものだし、Xen 3.0系がうまくその辺を何とかしようという姿勢がないってのも困りもの。まぁもうちょっとしたらlennyに上げるので、そっちに期待したいところ。ちょっと前にホスト環境だけ一時的にlennyにしたんだけど、その時はダメダメだった。

ユーザーランドに関してはセキュリティパッチだけで十分だけど、カーネル回りだけでも最新追従してくれていると、いろいろ安定もさせやすいんだが。今時「Linuxはちょっと古いハードウェアの方が安定」なんて、意味ないって。新しいハードウェアの方が、圧倒的にパフォーマンスもコストも消費電力も少ないんだから。