問題を解決するか、予防するか

今回の東京awsの問題を考えると、障害対策が取られていない企業が多い。Amazon.co.jpでもAWSを利用しているけど障害が発生していない。

簡単に言うとAWSで障害が発生した場合に別のサーバに自動に切り替えるように設定できる。障害が発生した企業はそれをされていないだけです。

 

例えばサーバの部品が故障しても予備の部品に自動で切り替えるような機能は多くのサーバ機種にある。たま、1台のサーバに障害が発生しても自動に別のサーバに切り替わるようにサーバクラスタを構築することもでkる。これらの手段を取らずにサーバに障害が発生してサービスが停止したらサーバの品質が悪いのではなく、システムを設計/構築した人が悪いのだる。

 

インターネットにはネットワークの一部に障害が発生したら自動的に別のネットワークに切り替わる機能がある。そもそもインターネットとは米国の軍がそのようなネットワークを構築するために研究されて作られた。インターネットサービスが停止するのはインターネットに問題があるのではなく、サービスを設計/構築した人に問題がある。

 

最近思うことは、事前に障害が発生しないように予めて予防する手段を取るよりも、障害が発生してから対応する手順を重視しているように思える。これではいつになりましたも良いサービスを構築することはできない。