危機管理の重要性
台風やら火山の噴火といった災害が続いていますね。しかし、最も怖いのはやはり地震です。阪神大震災のときにはあまり被害はありませんでしたが、友人の中には自宅が半壊したり、とかなりの被害を受けた話を聞いてショックを受けました。また、電気・水道・ガス・電話などのいわゆるライフラインが切断された場合に、どう対処すべきか予めルールを決めておかないといけません。そんな思いもあって、防災グッズを再確認しようと考えています。
仕事の上での危機管理も重要になっています。私が行っている研究開発では大量のシミュレーション計算を行います。そのシステムが正常に動かなくなってしまうと、仕事はまったくストップしてしまうわけで、大変な問題になるわけです。しかし、たいてい不幸は最も起こって欲しくないときに起こってしまうものです。
職場での危機管理は少し後手に回ってしまいました。というのも、研究用のファイルサーバのディスクにエラーが出始め、たいへんなピンチなのです。基幹業務向けのシステムは完璧なバックアップ体制が整っていますが、研究開発向けにはコストを最小限に抑えるべく、バックアップシステムを敢えて搭載しませんでした。(1TB の膨大なデータなので、全てをバックアップするためのコストを膨大になってしまうため) そこで、信頼性向上のためにRAID10 (ミラーリングとストラインピング)を採用した、いくつかのディスクのいくつかにエラーが発生するようになりました。ペアのディスクが同時に死ぬと、最悪の場合、データ飛んでしまいます。自動でディスクの再構成を行うためか、サーバのパフォーマンスも劇的に下がってしまいました。
このような自体は十分予測されたわけで、その対策を怠っていたのが問題だったのです。そうはいってもまずは最も重要なデータ(再構築が非常に難しいもの)のバックアップを取ることが最優先ですから、その作業に昨日今日とかかりきりになっていました。ようやく作業が一段落し、次のステップのことが考えられる余裕が出てきました。
完全復旧したあとは、これまでプログラムソースにしか適用していなかった履歴管理システムをデータファイル(主として計算のための入力ファイル)にも適用するべく、システムの構築をはじめました。具体的には Subversion というシステムを用います。これまで CVS を使っていたのですが、Subversion の方がメリットがあるため乗り換えることにしました。具体的な話はまた機会をみて書きたいと思います。
コメント
RSS feed for comments on this post.
TrackBack URL : http://noukai-navi.com/modules/wordpress/archives/2004/09/02/70/trackback/
この投稿には、まだコメントが付いていません
コメントの投稿
改行や段落は自動です
URLとE-mailは自動的にリンクされますので、<a>タグは不要です。
HTML allowed: <a href="" title="" rel=""> <abbr title=""> <acronym title=""> <b> <code> <em> <i> <strike> <strong>











