システムの可用性の向上について、システムの可用性を強化させるためには、
冗長化、監視、RAID、バックアップなどの概念があります。
冗長化
システムの可用性を保つために、機器やケーブルを二重化することです。
予備機の用意などにより、障害発生後なんらかの作業、一定の時間を経てから予備システムに切り替わることをコールドスタンバイ。
逆に、障害発生後、瞬時に切り替わることをホットスタンバイと呼びます。
方式として主に以下のようなものがあります。
・デュプレックスシステム
予備系のシステムを用意しておき、
障害発生時には、運用者が予備系に切り替えて稼働させるシステムです。
・デュアルシステム
二つのシステムが常時並行稼働しておき、
片系に障害が発生したとしても、もう一方のシステムのみで継続稼働するシステムです。
・フォールトトレラント
機器や回線などすべてのシステムに待機系を用意し、
障害発生時にも影響を及ぼすことなく継続稼働するシステムです。
・マルチプロセッサ
複数のCPUを同時に使用して、処理能力の向上や、
CPU故障時にも、もう一方のCPUのみで継続稼働するシステムです。
・クラスタリング
複数の機器を接続しておきながら、
あたかも1台の機器に見せかける技術です。
一方の障害発生時にも、もう一方の機器のみで継続稼働することが可能です。
監視
ネットワーク機器やサーバなどを監視するために、
様々な運用監視ツールがあります。
ZabbixやHinemos,logstorageなどほかにも、たくさんのツールがあります。
これらを使用し、ネットワーク機器のPing監視や、サーバのCUP、メモリ、ディスクなどのリソース監視、問題が発生した場合はメール通知などを行います。
また、「SNMP」は管理のために用いられるプロトコルであり、
機器に問題が発生した場合に、Trap(エラーを通知)する仕組みもよく使用されます。
RAID
RAIDとはハードディスクの冗長化技術です。
一般的に0〜6までの7段階があります。
よく使用されるのは、RAID5と、
RAID0と1を組み合わせたRAID10です。
RAID5・・・3台以上のHDDにデータを分割して複数のディスクに保存するとともに、
データを保護するパリティデータも複数ディスクに保存する方
RAID10・・・データを複数のディスクに分けて書き込む(ストライピング)するRAID0と
同じ内容を二つのディスクに同時にコピー(ミラーリング)するRAID1を組み合わせた方式
バックアップ
バックアップはシステムに障害などが発生した場合に、
正常に復旧させるために非常に重要な概念です。
バックアップの実施にあたっては、バックアップの対象、バックアップ手順や頻度、保存期間など十分に検討した上で、構築する必要があります。
また、SANと呼ばれるサーバ・ストレージ間を結ぶ高速ネットワークを構築することが一般的です。
SANには、ファイバーチャネルという技術を使用するFC-SANや、
TCP/IPで接続するIP-SANがあります。
コメント