飯を買いに出掛けてる隙に瞬停があったようだ。
瞬停があった時は、全部のコンピュータが落ちるわけじゃない。落ちるのは、電源の相対的に小さい奴だ。そんなわけだから、離席中のデスクトップとか、ロードバランサのような負荷の軽い、想定消費電力も小さいものは落ちない。落ちるのはもちろんファイルサーバだ orz
そこでまたRAIDが… というのがお定まりのパターン。とは言え、もうたいていの障害は経験したので、ちっとやそっとのことでは途方にくれることもない。今回は「保管用領域」はたまたま定期的なscanがかかっていただけだった。
アクセスの多い領域はパーティションが1つ飛んでいただけ。これも縮退モードで起動はしちゃっているので、パーティション切り直して再add。どうもこのパーティション情報を忘れるというのは、何かの転みで定常的に起きることのようだ。たいていこんなのはカーネルのしょうもないバグなんだが、直す方も慣れちゃっているので、深刻なことはない。
今回困ってしまったのは、手が出せれば一瞬で直るようなものばかりであるにも関わらず、initプロセスの中でいろいろ起きているものだから、手が出せなかったということ。特にscanのかかっているデバイスはmountするのに極端に時間がかかるので、それを待つのが退屈で退屈で。「赤川次郎」が1冊読み終わってしまって、まだ終わらなかった。しかし、久しぶりに読んだ小説ってのが赤川次郎だってのが、なかなかアレだな。
initプロセスの中で何かが起きていると、shellが動かせないから何も出来ない。どっかで中断なり割込みなりかけられるようになっていれば、復旧の時とか便利なんだがな。よくある「ネットが死んでるからMTAの起動に時間かかり過ぎる」みたいなのも、適当にskip出来るといいのに。
まー、一番けしからんのは、停電させて知らん顔してる奴なんだが。これで二度目なんだよなぁ。停電させて何も言って来ないってのは。UPSで自衛ってのも正しいとは思うのだけど、東京の一般的な停電確率から言えば
ムダ使い
と言っても過言ではなかろう。問題は、一般的な停電確率よりも高い確率で瞬停が起きるこの環境だということで。
とは言え、サービス安定性とか考えた時に、UPSはやっぱりいらないんじゃないかという気がする。サービスが止まってしまう原因を考えたら、停電なんてのは今やほとんど無視して良い事象だ。他の要因の方がはるかに大きい。それこそ「RAIDが飛んだ」の類だと、下手すると1週間くらい止まる。それと比べりゃ停電からの復旧なんてのは、今日みないなアクシデントがあったにせよ、数時間かかる方が稀だ。たいていは長くても10分もあれば復旧する。それを思うと、用途にもよるけれど、UPS云々以前にやるべきことはたくさんあるわけで。
そりゃー自分以外のものが原因で落ちるのは不快なだけではあるけどね。
こんばんわ、いつも楽しく読ませていただいております。
さて、
>東京の一般的な停電確率から言えば
>ムダ使い
>と言っても過言ではなかろう。
とありますが、自宅(東京の真ん中の区)サーバの upsd のログを見てみると、
半月に一度ほど数秒~数分の寸断があるようです。
24h稼働のマシンならば、テーブルタップ代わりに、1万円程度のUPSを入れておくのが吉かと思いますが・・・
追伸:
upsd のログは、
http://hondou.homedns.org/cgi-bin/upsstats.cgi?host=127.0.0.1&temp=C
から観ることができます。
なんと! そんなに高頻度に? そんな場所だったらUPSの意味もありますね。
とは言え、それちょっと何かがおかしくないですか? ちょっと多過ぎな気がする。「ちょっと多くないかい?」と思っているここでも、年に1回程度ですよ。何かわけがあるのかしらん。