|
Archive for the ‘Linux’ Category
OCFS2化失敗ファイルサーバの動作がどうも気に入らないので、nfsをやめて他の分散ファイルシステムにしようと検討している。その候補でOCFS2(Oracle Cluster FS)を実験したのだが、見事に失敗。 無理やりのRAID復旧毎週恒例という感じで、ファイルサーバがクラッシュ。 「毎週恒例」と言うよりは、リブートする度にと言っても過言じゃない。ログを見る限りDEの異常ではなく、「突然ディスクが応答しなくなった」という感じの現象が起きている。 どうやらPMP(ポートマルチプレクサ)が犯人らしい。 サーバ復旧ファイルサーバのRAIDがすっとぶ。 あれやこれや、かなりインチキなことをしつつ、なんとかほぼ全てのファイルを救い出す。RAID5で2本飛んでいる旨のメッセージが出た時には、目の前が暗くなった。幸いなことに、本当のハードウェア障害ではなかったので、無理やりの復旧で元に戻した。 サーバの調子が悪いついでに私の調子も悪くて寝てたんだけど、寝てる間に過負荷状態でハングアップしていた。 ここのサーバは、ファイルサーバ(kabigon)に全てのユーザファイルを置いて、本体のサーバ(gaien)が諸々のdaemonとかユーザプロセスを動かすような構成になっている。本体のサーバは、Xenが動いていて、2つのinstance(gaien-U1, gaien-U2)になっている。ファイルサーバはnfsになっている。 X86_64の落し穴ファイルサーバの続き。 ハードウェアを組み上げて、電源を入れてみる。ちょっとした配線ミスを直して無事起動する。起動したら、HDDを認識させるわけだが、認識しない。 dmesgを見る限り、インターフェイスを認識しているのだが、HDDがまるで見えていない。配線ミスした時に壊したかと思い、あれやこれや配線をいじったり、SATAカードを交換してみたりとかするのだが、動かない。HDDの箱が悪いのかと思い、直接つないでみても動かない。マザーに元々あるインターフェイスにHDDを繋ぐと動くので、HDDは壊れていない。だからつまりは、インターフェイスカードがまともに動いていない。 |
|