ストレージ

Pure Storage FlashArray ActiveClusterの動作仕様

Pure Storage FlashArray(FA)製品のActiveClusterについて、動作仕様をご紹介します。

データのバックアップ

FA製品のバックアップは、操作がシンプルで簡単なうえ、サービスや運用に負荷をかけることなく、安全にデータを保護できます。FAのバックアップ手段としては、以下のような種類があります。

SnapshotやそのSnapshotの保護ポリシーを一括管理できるProtection Group、バックアップの手段の一つである、Async Replicationについてご説明したブログはこちらとなります。

参考:FlashArrayのSnapshotについて:https://cn.teldevice.co.jp/blog/p60502/

参考:FlashArrayのProtection Group:https://cn.teldevice.co.jp/blog/p62832/

参考:FlashArrayのAsync Replication:https://cn.teldevice.co.jp/blog/p62883/

今回はこのうちActiveClusterに焦点を当てて記載します。今後のブログで、そのほかのバックアップ手段やRAID構成などについても記載予定です。

ActiveCluster

ActiveClusterは、FAの2アレイ間を完全同期することで、Active/Activeのクラスタを構成し、透過的なFailoverを実現する機能です。ゼロRPO(目標復旧時点:Recovery Point Objective)、ゼロRTO(目標復旧時間:Recovery Time Objective)を実現できます。ミラーされた両アレイのVolumeは、どちらのアレイからもRead・Writeが可能で、2台のFAで、1セットのストレージとして稼働するイメージとなります。アレイ単位での障害時にもサービス影響なく片アレイ単体で動作し、復旧時も、操作などは不要で自動的に再同期します。また、基本的な管理操作は、どちらかのアレイで実施すると、自動的にもう片側のアレイにも設定が反映される仕様であるため、管理もシンプルです。ActiveClusterは、ライセンスフリーで利用可能な機能となります。

また、Async ReplicatonからActiveClusterへの移行もオンラインで実施できます。さらに、ActiveClusterの2アレイから、別のFAにレプリケーション接続することで、ActiveClusterで完全同期するVolumeを運用しながら、Async Replicaton形式でそのVolumeのSnapshotを別のFAに転送させるといった、より強固なDR(災害復旧:Disaster Recovery)対策を実現することも可能です。

ActiveClusterの動作仕様

ActiveClusterの動作仕様を図に示します。

ActiveClusterは、2つのFAを、レプリケーション用のネットワークで接続すること、およびPure1へ接続することで実現できます。ActiveClusterを構成するにあたってのキーワードは、図中にもある、MediatorとPodです。

・ Mediator

ActiveClusterでは、Pure Storage社のCloud基盤であるPure1 Cloud上のMediatorという機能を利用します。両アレイをPure1に接続するのみで使用できる機能です。Mediatorは、スプリットブレイン防止のための機能です(スプリットブレイン:レプリケーションネットワーク障害時など、2台のアレイの状態が不明なときに、どちらがメインとして動くアレイになるかを決め、データの不整合を防ぐ)。ActiveClusterとして2台のFAが通常稼働している時は、5分間隔でMediatorとの疎通確認を実施しています。お互いのアレイの状態がわからなくなった時に、それぞれのアレイがMediatorとの通信を行うことで(Mediator Race)、どちらがメインで動くアレイとなるかをMediatorが決定するようなアーキテクチャです。なお、VMware ESXi版として、OVA(Open Virtual Appliance)が提供されているため、Pure1疎通ができない環境下では、Mediatorをオンプレミスで構築し、仮想マシンとしてMediatorを運用することも可能ですが、管理・運用・メンテナンスが不要な、Pure1 Cloud上のMediatorの利用を推奨いたします。

参考:Pure1・PhoneHome機能・RemoteAssist機能とは:https://cn.teldevice.co.jp/blog/p57559/

・ Pod

ActiveClusterのVolumeは、2台のFAで同一のVolumeを持つような形で動作します。このVolumeを2台のFAでまとめて見せるための設定をPodと呼びます。ホストからPodのVolumeに書き込みを実施すると、ホストのMPIO(MultiPass Input Output)によって、両アレイのFC・iSCSIポートに対して均等にIOが実施されます。片側のアレイに届いたIOは、レプリケーションのネットワークを介して、もう片方のアレイへ書き込みを実施することで、ホスト側に書き込み完了のACKを返します。PodのVolumeは、ホスト側から見ると1つのLUN(Logical Unit Number)として見えているため、どちらのアレイに書き込まれたかは関係なく、データの書き込みが実施できる形となります。

ネットワーク設定

ActiveClusterに必要なネットワーク設定は、管理ネットワークの設定とレプリケーションネットワークの設定です。

・ 管理ネットワークの設定

ActiveClusterでは、管理ネットワーク用のIPアドレスが1アレイ当たり5個必要となります。X、CR4・5モデルでは、各CTのETH4と5ポートを使用して、管理ポートを設定します。物理的なXCR4モデルのポート構成については、下記のブログをご確認ください。

参考:FlashArray Xシリーズの詳細:https://cn.teldevice.co.jp/blog/p57997/

それぞれのポートに設定するIPアドレスに加え、仮想IPアドレスとなる、VirtualのIPアドレスを設定する必要があります。1アレイ当たり最低5個のIPアドレスが必要要件となるため、XCR4・5モデルでは、Vir4と各CTのETH4・5ポートのIPアドレス設定は必須ですが、Vir5の作成は任意となります。通信要件として必要となるポート番号は443です。

・ レプリケーションネットワークの設定

XCR4・5モデルでは、標準で搭載されている、各CTのETH2と3ポートを使用してレプリケーションポートを設定します。それぞれのポートにIPアドレスを設定する必要があるため、レプリケーションに使用するIPアドレスは、1アレイ当たり4つのIPアドレスです。ポートのMTU(Maximum Transmission Unit)はデフォルトの1500が推奨です。また、ETHスイッチを介して接続することが必要となります(アレイ間を直接接続する構成は非サポートとなります)。通信要件として必要となるポート番号は8117です。なお、仕様上、レプリケーション通信そのものはFAのPrimary CT(コントローラ:Controller)のみで行われます。これは、他のレプリケーション機能であるAsync ReplicationやActiveDRでも同様です。

さらに重要な要件として、両アレイのレプリケーションポートのRTT(Round Trip Time)が11ms以内である必要があります。すなわち、両アレイのレプリケーションポート間のPingが11ms以内で返ってくればよい、という要件となります。FAのCLI(Command Line Interface)にて、Pingの状態を確認することが可能です。コマンドは、purenetwork eth ping --count 5 –interface [自身のレプリケーションポート:ct0.eth2など] [対向アレイのレプリケーションポートのIPアドレス]で実施できます。

この例では、Pingは0.3ms以下で返ってきているため、要件のRTT=11ms以下を満たしています。

下記に、ActiveCluster構成での、ネットワークの構成例を記載します。

その他の仕様や注意点

・ アレイ間でのPurityの互換性がある必要性があり、ActiveClusterでは同一Purityバージョンでの稼働を推奨いたします。

・ 一部異なるHWのモデル同士でのActiveCluster構成はサポートされていません。詳細は下記Pure Storage社のKB(Knowledge Base)をご確認ください。KBの閲覧にはPure1アカウントが必要です。お持ちでない場合は、Pure1アカウントを作成いたしますので、保守窓口までご連絡ください。

https://support.purestorage.com/bundle/m_asynchronous/page/FlashArray/PurityFA/Replication/ActiveDR/Implementation/library/common_content/r_hardware_interoperability_for_replication_features.html

・ ActiveCluster化するアレイ全体の容量の使用量は80%以下である必要があります。

・ 今回のご紹介にて、既存で利用中のFAをActiveClusterで構築したい、とご検討いただける場合、当社へお問い合わせください。

最後に

今回はFA製品のActiveClusterについて動作仕様を記載しました。今後のブログでも、ActiveDRやCloudSnapなど、他の筐体にバックアップする機能や、ActiveClusterの障害時の動作などについて記載予定となります。

この記事に関連する製品・サービス

この記事に関連する記事