オールフラッシュの普及を加速させるテクノロジー: 重複排除・圧縮 | 東京エレクトロンデバイス

なるほどオールフラッシュアレイを徹底解明

基本からわかるオールフラッシュアレイ

オールフラッシュの普及を加速させるテクノロジー: 重複排除・圧縮

過去10年間におけるストレージの技術革新には、重複排除・圧縮に代表されるデータ削減技術が深く関わり、テープからディスク、ディスクからフラッシュへと、ストレージデバイスの移行を促しています。オールフラッシュアレイの普及も、このデータ削減技術によってもたらされているといっても過言ではありません。今回は、データ削減技術と、VDIにおけるPure Storage FlashArrayでのデータ削減効果を紹介します。

データ削減技術によるストレージデバイスの世代交代

データ削減技術のコアとなる重複排除は2000年代初頭に確立され、バックアップ・アーカイブの分野において製品が市場に登場しました。それまで、バックアップ・アーカイブのストレージデバイスには安価な磁気テープが利用されていましたが、重複排除を採用したバックアップアプライアンスの登場により、ハードディスクを利用した高速なバックアップ・アーカイブを安価に実現できるようになりました。また、差分データの転送のみで実現できるストレージ間のレプリケーションが可能になり、災害対策としてのデータの遠隔地保管が普及しました。

そして今、サーバー仮想化やデータベースで利用されるプライマリストレージにおいても、データ削減技術が同様にディスクからフラッシュへの移行を促しています。

データ削減効果のパターン

データ削減効果は、格納されるデータのパターンに依存します。バックアップの場合は、週次フルバックアップを複数世代保管し、世代間の差分は5%以下であるというデータパターンであるため、データ削減率20:1~50:1という重複排除による高いデータ削減効果を得ることができました。

一方、オールフラッシュアレイで利用されるケースは、データベース・サーバー仮想化・VDIといった用途になります。これらの用途に対し、どのようなデータ削減効果が期待できるのか、またPure Storage FlashArrayでの平均データ削減率について紹介します。

・データベース
データベースファイル内に重複するデータは少ないため、重複排除によるデータ削減効果は一般に低いと言われています。しかし、圧縮による効果で、平均2:1~4:1のデータ削減率を得られるケースが一般的です。

サーバー仮想化
サーバー仮想化では、クローン機能を利用して複製された仮想マシンが複数格納されます。各仮想マシンのOS領域は共通であり、重複排除の効果を発揮します。さらに、各仮想マシン内に格納されているデータベースやファイルなどに対しては圧縮による効果があるため、平均のデータ削減率は4:1~6:1となるのが一般的です。

VDI
VDIの場合、格納される仮想マシン数も数百~数千となるため、サーバー仮想化と比べて重複排除による高い効果が得られます。(平均のデータ削減率 6:1~10:1)

したがって、オールフラッシュアレイで利用されるデータベースや仮想化のケースでは、重複排除に加えて圧縮による相乗効果がデータ削減率を高める鍵となります。また、仮想化における仮想ディスクでは、あらかじめ領域を確保するためにゼロデータで埋められた領域もあり、そのような領域を取り除くパターン除去と呼ばれる機能もあります。

Pure Storageでのデータ削減効果

Pure Storageのボリュームをマウントしているデータストアに対し、VDIでの実際のデータ削減効果を測定しました。

< プロビジョニング構成 >
・マスターイメージ: Windows 7
・仮想ディスク: 32GB (Thick Eager Zero)
・プロビジョニング方式: リンククローン
・デスクトップ数: 100

まず、マスターイメージのOSインストール直後の使用容量を、VMのOS・ハイパーバイザーのデータストア・ストレージそれぞれのレベルで見ていきましょう。

VMのOSレベルで使用容量を確認すると、約10.7GBであることが分かります。

 

このVMが格納されているデータストアでは構成情報などのファイルも含め、約33GB格納されていると表示されている一方、Pure Storage上で格納されている容量は約5.5GBでした。

これは、Cドライブの使用容量である約10.7GBに対して圧縮で約半分になっていることを示しており、Pure Storage上のデータ削減率も2.2:1を示しています。また、パターン除去によりZeroでフォーマットされた約21GBの空き領域も削減されていることが分かります。

次にクローン機能で100VMを複製し、起動した後に取得した容量表示です。データストア上の格納容量が348GBなのに対し、Pure Storage上の格納容量は 8.4GBと、マスターイメージのみの場合と比較して2.9GBしか増えていないことが分かります。

また、データ削減率は11:1を示していますが、今回の検証構成から効果の内訳は次の通りになります。

  データ削減率 備考
重複排除 5:1 マスターイメージと4つのレプリカ間が重複しているため、1/5となる。
圧縮 2.2:1 マスターイメージに対する圧縮によるデータ削減効果 (前述)
トータルのデータ削減率 5:1 × 2.2:1 = 11:1 重複排除後のデータに対し圧縮をするため、重複排除率×圧縮率となる

今回はリンククローンでのデータ削減効果を紹介しましたが、フルクローンでプロビジョニングした際はマスターイメージから複製されたVM数が多くなるため、さらなるデータ削減効果が期待できます。

オールフラッシュアレイにおけるデータ削減機能は、搭載している容量を効率的に使うことによって容量コストを抑えるだけではなく、設置スペースや消費電力を抑えることによる全体的なコスト削減にもつながっていきます。実際の効果は事例でご紹介していますので、ぜひご覧ください。

導入事例 ソフトバンク株式会社 様

ソフトバンク株式会社様が社内・グループ企業・DaaS向けに提供する国内最大級のVDI環境に、Pure Storage FlashArrayが活用されています。リンククローン方式でプロビジョニングされた仮想デスクトップは、ストレージレベルでのインライン重複排除機能と圧縮機能によって格納データ量は8分の1になりました。また、オールフラッシュアレイによる高い性能と併せ、必要ラック数も50%削減することができました。

 

※ソフトバンク株式会社様事例は こちら

関連する情報

「重複排除」に関連する製品・サービス