ソリューション

ミッションクリティカルなシステムを支える
ピュア・ストレージ社のActiveCluster技術

企業における命題であるBC/DR(Business Continuity / Disaster Recovery : 災害復旧と事業継続)やITSCM(ITService Continuity management:ITサービス継続性管理)など高い可用性が要求されるミッションクリティカルなアプリケーションは、一般的にシステムの冗長化やレプリケーション等の方法で保護されていますがRPO(Recovery Point Objective:目標復旧時点) とRTO(Recovery Time Objective:目標復旧時間)の設定と実現は常にシステム設計者の悩みです。
ピュア・ストレージのActiveCluster技術は“RPO /RTO ゼロ” を簡単に実現することが可能な技術です。

 

本資料は下記よりダウンロードいただけますPDFダウンロードはこちら

コンポーネントは全て冗長化。それでも全体がダウンすることを想定するのが ミッションクリティカルへの最適な対応

これまで、東京エレクトロンデバイスが販売してきた数多くのピュア・ストレージ製品において、機器が完全に停止した実績はありません。しかしながら、お客様によっては過去のストレージ運用の中で、冗長構成にもかかわらず災害やシステム障害によってストレージが停止してしまったという経験から、不安をお持ちの方も少なくありませんでした。今回ご紹介するActiveClusterはそのような不安やお悩みをお持ちのお客様に評価・導入いただいているソリューションです。システムの信頼性・堅牢性を高めつつ、より安全・簡単に導入可能なそのActiveCluster 技術について紹介します。

ActiveCluster 3つのKEY POINT

真のActive/Active Solution

RPO/RTOゼロの実現

Mediatorの設計、構築不要

これまでの同期レプリケーションでは、データを複製するが実際使用しているボリュームは一つで、同様の物が対向ストレージにスタンバイとして配置するのが一般的な手法でした。

ピュア・ストレージ社のActiveClusterは互いのアレイにて同期レプリケーションを用いてデータを共有するまでは過去のアーキテクチャと同等ですが、互いのアレイのボリュームは実際にActive/Activeであり、Read/Writeが可能な状態となっています。よってホストから見ると、実際2基あるストレージはあたかも1基に見え、コントローラヘッドが増えたように振舞います。そのため非同期レプリケーションのようにレプリカより復元などもなく、完全同期レプリケーションにより“ゼロ RPO/RTO”を実現します。

 また、ActiveClusterではMediatorという仲裁者によって監視・管理が常に行われており、片側のアレイなどに障害が発生した際は瞬時に誰がオーナーになるべきかを判断し、ストレージへのRead/Writeを継続することができます。Mediatorはピュア・ストレージのCloudサポート基盤であるCloudAssistに配置されており、お客様はMediatorの管理、構築、メンテナンスをすることなく使用できます。

構成の主なコンポーネントは下図のようになっています。

Pure Storage_01_0926

ピンチアウトで拡大

構成方法は主に二通り

ピンチアウトで拡大

同一データセンター(以下、DC)やキャンパスにおいて、機器故障を加味した構成でRTT(Round Trip Time)が極小の場合はホストからは両アレイともOptimizeされたパスと認識され、マルチパスI/Oにて両アレイに均等にRead/Writeが実行されます。 Writeは両アレイに書き込まれてコミットを返すため、アレイは常に同等のデータを保持します。

Pure Storage_03_0926

ピンチアウトで拡大

Metroエリアの構成では各ホストにPreferred Arrayをピュア・ストレージ上で設定します。Writeは両アレイに書き込みを行う必要があります。ReadにおいてはOptimizedのパスが設定されるため直近のアレイから読むためReadの性能ペナルティはありません。

各障害時の挙動について

1) 冗長化されたレプリケーション通信経路がダウンした場合

Pure Storage_04_0926

ピンチアウトで拡大

同一DCでは両系のスイッチがダウンしている事と同等であり、珍しい状況ですが、メトロHAではサイト間の通信ができないケースが想定されるため、このような事態になった場合、アレイはCloudAssist上のMediatorに通信を行い、先に通信が実施できたほうのアレイがオンラインとして動作し、もう片方はオフラインとなります。 そのため、DCキャンパス構成では単にクラスタ内のコントローラヘッドが減った挙動となり、メトロ構成ではNon-Optimizedパスが使用された形で通信が継続されます。

 

 

2) 冗長化されたMediator通信経路がダウンした場合

 

Mediatorアクセスは冗長性を持たせるために各コントローラの2ポートのマネージメントネットワークポートを使用し通信を実施します。この冗長化されたマネージメント通信ができない場合でも、レプリケーションの通信経路を使用し、互いのアレイのステータスを確認し、両アレイにてI/Oが継続されます。

 

 

3) 各障害時の挙動まとめ

各障害時の挙動まとめ

ピンチアウトで拡大

基本的に一つの障害では継続か縮退動作にてストレージ機能の継続提供が可能です。
クラスタとして停止するのは以下の2通りの場合があります。

・片方のアレイが完全停止(冗長のコントローラダウン) & 冗長されたMediator通信のダウン
・冗長化されたレプリケーション通信ダウン &冗長されたMediator通信のダウン

つまり、冗長化された各々の2つの部位が同時に障害とならない限りクラスタは動作します。

 

 

4) 片アレイでの動作したあとのデータの同期方法

Pure Storage_05_0926

ピンチアウトで拡大

片方のアレイが復旧する際は、最初にアレイ間の差分を埋めるべく、非同期レプリケーションにて同期を開始します。その後、データが同期する直前で両アレイに書き込みを実施し同期レプリケーションの機能として動作を自動的に切り替え、Active/Activeとして動作を再開します。

まとめ

ActiveClusterはお客様でのストレージ運用を極小化し、システム全体の保護レベルを最大化する機能です。

近年、データは価値という時代となっており、常時オンラインでサービス停止が一切許されないというお客様に評価され、当該機能を利用したピュア・ストレージの導入事例が増加しています。

ミッションクリティカルなシステムを運用されているお客様は、一つの選択肢として当該機能を検討してみてはいかがでしょうか。

 

ピュア・ストレージの
詳細はこちら

 

ピュア・ストレージの
お問い合わせはこちら

.general_lay.__white { background-color: transparent; }