Xen爆発しろ!

またもXenのトラブルで落ちる。

落ちた時にFS(Reiser)を壊したものだから、なんだかんだで14時間も止めるハメに。

とりあえずまとめとしてメモ書いとく。

昼頃起きたら、どうもサーバが止まっているようだったのだけど、shellを叩くと反応がある。じゃあshutdownすりゃいーじゃんと思うのだが、shutdownはまるっきり出来ない。しょうがないので、ホストからxm destroyする。原因がどこにあるかはわからないが、とりあえず止まる。

fsckをかけると、ジャーナルの処理がされる。当然のようにそれでは完了してくれなくて、–rebuild-treeなぞを要求する。まぁここまではよくあること。あまり驚かない。ところが、/homeにあたるlvをfsckすると、途中でabortする。思いっきりアセる。

とは言え、そこでメゲずにもう一度–rebuild-treeをすると正常終了する。どうせささいなバグが元でabortなんだから、メゲずにやってみるのが正しいw

もちろんlost+foundに大量にファイルが出来る。まぁしょうがない。何とか出来そうなものは何とかして、vm再起動する。

lost+foundの中身を整理しようと、ゲスト上でlsすると止まってしまった。しょうがないので、またxm destroyする。当然のようにfsck。

ところが/homeのlvはfsck中にshellごと飛ぶ。まぁ–rebuild-treeもあまり信用出来ないので、同じサイズのlvをもう1つ作って、元の/homeのlvはread only mountして、新しいlvにcpする。fsckをしないとread only mountに失敗することがあるのだけど、fsckしておけば問題なく出来る。

cpは問題なく終了したので、vm再起動 <- 今ここ

あとは、lost+foundの中身を整理して復旧作業完了。

/homeは400GBくらいあるので、何をしてもそれなりに時間がかかる。

しかしまぁ、何度も書いているんだけど、ちょっと負荷が重くなるとうちのXenは死んでしまう。他ではXenが不安定で嘆いてる話はあまり聞いたことがないんだけど、みんなどんな状態で使っているのだろう。うちはそれなりにいろいろ実験してから本番投入しているので、設定がおかしいとかってことは多分ないと思うのだけど。

今時Xenは珍しいものじゃないと思うのだけど、意外なほど情報がない。Ver 3.0以前のものはそれなりにあるのだけど、そのうちのほとんどはdistroの標準設定みたいなのを動かして、動いた動いたと喜んでいるレベルのものなので、運用管理の参考になるものは極めて少ない。さもなくば、「Xen用カーネルをソースから作りました」的なもの。いずれにしても、「運用」まで書かれたものがない。

日本語で書かれていることを諦めて英語のものを探しても、あまりない。ましてや、Ver 3.2とかになると、もっと少ない。FLOSSの常識の通り、添付ドキュメントもあまりアテにならない。

さらに、Xenと組み合わせて使うボリュームの仮想化とか分散化についてのいい資料もあまりない。nfsが使いものにならないのは実証済みだし、NBDもあまりアテにならない。iSCSIも、適当にファイルサーバ上にtargetを作っても、どうもパフォーマンスが出せない。OCFS(Oracle Cluster File System)もイマイチ動きが悪い。みんなどうやってるんだろうなぁ。同じホスト上で動かすのでも、どのfs typeが良いかという資料はあまりない。あっても古い。

こういったことをちゃんとまとめたら、それだけで十分コンサルのネタになりそうなんだがな。実際、仮想化って便利だからやらない手はないと思うし。

Google Reader Yahoo Facebook Twitter Digg FriendFeed Delicious Google Translate
This entry was posted on12月 21st, 2008 at 2:14:34. You can follow any responses to this entry through the RSS 2.0. Both comments and pings are currently closed.

Comments are closed.

  • 私について

    ただのプログラマです、ハッカーではありません。

    秋葉で暮し秋葉で仕事してますが、秋葉系は嫌いです。物事を冷静に分析することは好きですが、ニヒリストは嫌いです。

    秋葉でちっこい会社をやってます。 こーゆーことがお仕事です。

    詳しいことは、自己紹介のページでも見て下さい。また、mixiの方でもいろいろわかるかも知れません。twitterは@ogochanですが、たいしたこと言ってません。近頃はShorplug内の別館で日記書いたりもしてます。だいたいここのコピーだったりしますが、ログインするとコメントがつけられます。

    日経ITProに連載(生越昌己のオープンソースGTD)を書いています。「ちゃんと書いた文章」が読みたい人は、そっちを読む方がいいと思います。

  • このページについて

    ここは私の雑文の置き場です。WordPressを使っていますが、いわゆるblogのつもりで書いているわけではありません。「覗き見のできるチラ裏」くらいの意味しかありません。

    もしかしたら有用なことがあるかも知れません。あるいはむかつくことも書いてあるかもしれません。それらはみな「そんなものだ」と思っておくに留めましょう。

    コメントを書くのは構いませんが、「反論」の類はよそでやって下さい。同意する気のない人達と議論する気は全くありませんので、議論したければよそで勝手にやって下さい。

    と言っても、「読むな」「広めるな」というわけでもありません。リンク、ブクマの類は御自由に。

  • カテゴリ

  • 過去の記事

  • メタ情報