2009年2月3日の日記の1番目の記事へのコメント
■サーバ修理
時間が取れたので実家までひとっ走りして行ってきました.ひとっ走りといっても片道2時間くらいですが・・・.まず HDD を交換してサーバを復旧させ,その後サーバが兼ねているルータ機能と DHCP サーバ部分を無線 LAN の AP (手持ちの NEC の WR6670S を提供) に移して,サーバがまたクラッシュした際にも最低限のネット環境は維持できるようにする計画.SSD とかファンレスマシンとかにすりゃいいじゃんという話もありますが,まあひとまずは手持ちの部材でやるということで・・・.
到着後,さっそく HDD 交換作業開始.まずは /dev/hda の特定のパーティションが壊れたのか,それとも完全にディスクごと壊れてしまったのかをチェック.電源を投入.とりあえず異音はないようです.GRUB も上がってきました.この辺は無事ということですね.カーネルが上がって /dev/hda1 の fsck 開始・・・ゴクリ.・・・/dev/hda5・・・/dev/hda8・・・/dev/hda9 ・・・あれ? /dev/hda 全部通ったよ? そして拡張ベイの方に突っ込んである /dev/hdc の方も問題なく終了.何それ.
そのまま普通にデーモン類が上がってプロンプトが出てきました.えー.ディスククラッシュしてたんじゃなかったのか!?
ログインして /var/log の下を見てみたところ,syslog にこんなメッセージが残ってました.
Feb 1 12:38:20 kernel: hda: dma_timer_expiry: dma status == 0x20 Feb 1 12:38:40 kernel: hda: timeout waiting for DMA Feb 1 12:38:40 kernel: hda: timeout waiting for DMA Feb 1 12:38:40 kernel: hda: (__ide_dma_test_irq) called while not waiting Feb 1 12:38:40 kernel: hda: status timeout: status=0xd0 { Busy } Feb 1 12:38:40 kernel: Feb 1 12:38:40 kernel: hda: drive not ready for command Feb 1 12:38:40 kernel: ide0: reset: success Feb 1 12:39:13 kernel: hda: dma_timer_expiry: dma status == 0x21
これより後の時刻のログがほとんどないので,これが関係あるのかな? 1月にも何度か同じようなメッセージが出ているようですが・・・.なんかディスクエラーというよりマシン側のドライバか何かの問題? うーん.
何だかよくわかりませんが,とりあえずサーバの方は何事もなかったのかのように普通に上がって動いているので,ひとまずは HDD の交換は見送ることにしました.それでも交換しておいた方が安心じゃない?と思われるかもしれませんが,交換用の HDD 自体,たまたま手元にあった出所すらよく思い出せない得体の知れないものなので・・・.
2009年2月3日の日記の1番目の記事へのコメント
[コメントを書く]