こちらも参加していますのでよろしくお願いします。
朝、起きたら、たまたま、24時間稼働しているマシンのハードディスクが死んでました。
カラカラ異音がする状態になっていて
データを、三重に自動でバックアップするシステムに使われている機械なので
データが、消失する事は無かったが
前の職場は、データについて、災害、バックアップとかの防災意識が全くなかった。
停電についても、無関心で
無停電装置は、なくても大丈夫。確かに、普段、お世話になることは、ほとんどの場合ない。
いや、ない方が、本当は、良い。
で、散々、必要が無いと言われた、挙げ句の果てに
変電所の火災事故で、電気が止まる羽目に
早速、お世話になる羽目に。
ファイルをクローズして、正常な状態で、シャットダウンまで、もってくれって
そう、無停電装置が無いと、いきなり、機器が停止され
物理的な影響は、もちろんだが、論理的にも、データ、ファイルが破壊される場合がある。
特に、近年では、システムが仮想化され、一台の物理コンピュータに複数のシステムが共存する環境も珍しくない。
そういう場合も、構成データが、すっ飛んで、再起動した時も、起動が出来ない状態になったり
リカバリー不能なエラー
っていうやつで、気絶しそうになるだろう。
そんなわけで、バックアップは重要だが
色々なシステム管理者のバックアップを見ていて、やばいなって思うことがある。
通常、24時間稼働しているマシンのバックアップの場合。
いや、稼働中のマシンの場合、特にサーバーっていうやつで
複数の人が、同時にアクセスするとかの場合、特にだが
稼働をしながら、バックアップをする。
ここで、ちょっと、考えたら、わかりそうなんだが
バックアップ中に、データが、書き換わって
システムの整合性が、とれなくなって
いざ障害が起こったときに、バックアップからの、リストアの時
エラーが起こって、バックアップの意味ないじゃんっていう状態に陥る事がある。
そこまで、考えていないシステム管理者って、意外に多い。
障害が起こってから、問題に気がつくというパターンになったりする。