新世代オールフラッシュストレージの導入による性能ボトルネックの解消
昨今の仮想化環境の普及によりサーバー・ストレージの利用環境が大きく変化している中、新たな課題が上がっています。 仮想化OSを搭載した物理サーバー上で仮想マシンが複数稼働し、複数のサーバー間でストレージが共有される仮想化環境において高度にランダム化されたアクセスは共有ストレージにとって大変な負荷になります。 従来のHDDベースのストレージでは性能限界が発生し、ストレージがシステム全体のボトルネックになってしまうのです。 そこで登場したのが新世代のオールフラッシュストレージ、Pure Storage 社の開発したコスト効率に優れた高性能ストレージ Flash Array FA-400 シリーズです。
IT機器の進化とHDD性能とのギャップ
近年のクラウドコンピューティングやSNSの普及によって、直接間接に我々のビジネスや日常生活におけるコンピューティングパワーの利用は、ますます重要な地位を占めるようになりました。増大するコンピューティングリソースへの要求を支えるために、過去数十年間、半導体業界は先進的な技術開発に対して継続的な投資を行い、ムーアの法則と称されるように、およそ1年半に半導体の密度を2倍にする比率で高密度化と高性能化を図ってきました。
一方で、増え続けるデータの記録を支えるためにハードディスク業界のほうも、HDDの高密度化に継続的に取り組み、こちらの方もムーアの法則に近い比率で記憶密度の向上を続けてきました。その結果、2013年1月時点で最大容量として4TBのHDD製品を見るまでに至ったのです。しかしながら、HDDに対してランダムアクセスを行った時の性能(ランダムIOPS: Input Output Per Second)という点に関しては、残念ながら過去ほとんど改善が見られていません。
図1に過去およそ10年間のCPU性能とHDDのランダムIOPSの変化をまとめました。CPUに関しては、マルチコア化やメモリバンド幅改善などで、ソケットあたりの性能が約29倍に改善しています。これに対して、HDDのランダムIOPSはたったの3%しか改善していません。この間にHDDの容量は16倍になっていますので、容量当たりのIOPSを考えると逆に1/16に悪化しているということになってしまいます。
仮想化環境はI/Oミキサー
この間にサーバーの使われ方も大きく変化してきました。それは仮想化環境の普及です。CPU性能の著しい改善とメモリの単価下落によって、多くのサーバーが仮想化OS下で使用されるようになりました。現在仮想サーバーの数は物理サーバーの台数をはるかに上回る伸び率で増加しています。
仮想化環境では仮想化OS(ハイパーバイザ)を搭載した物理サーバー上で仮想マシン(VM)が複数稼働します。また、ストレージはさらに複数の物理サーバー間で共有ストレージとしてシェアされます。それぞれの仮想マシンがハイパーバイザ経由で共有ストレージに対して勝手にI/O要求を発行しますので、共有ストレージに対しては、かなりランダム性の高いアクセスが集中してしまうことになります。仮想化レイヤーがまさにI/Oのミキサーとして働くわけです。このように高度にランダム化されたアクセスは共有ストレージにとって、実は大変な負荷になり、ストレージの性能限界によってシステム全体の性能やサーバーの統合が制限されてしまう問題が頻繁に発生しています。まさに、共有ストレージがシステム全体のボトルネックになっているのです。
ランダムアクセスは機械的に動作するHDDにとっては、最も苦手とするアクセスパターンで、HDDを搭載した共有ストレージでは、高度な仮想化環境に対して、なかなか性能要求を達成することが困難でした。それを解決するのがNANDフラッシュを記録媒体としたSSD(Solid State Drive)です。表1に示すようにSSDはHDDに比較して圧倒的な高性能を示します。
HDD/SSD種別 | 理論上のIOPS |
SATA 7,200RPM | 80 |
SAS 15,000RPM | 210 |
SSD (SLC) | 100,000 |
表1:エンタープライズ向け製品の理論上のランダムIOPS(READ)
HDDの代わりにSSDを搭載したストレージシステムを構築して、仮想化環境の共有ストレージとして使用してやれば、前述のI/Oボトルネックが解消するのですが、SSDの容量単価はHDDに比べて格段に高く、システムコストの観点から、なかなか普及が進みませんでした。
新世代オールフラッシュストレージの登場
そこで登場したのが新世代のオールフラッシュストレージ、Pure Storage 社の開発した、Flash Array FA-400シリーズです(図3参照)。この製品は、記憶媒体としてMLCのSSDを使用しながら、インラインで重複排除とデータの圧縮を行うことで、実効容量の5倍以上のデータを記録することができます。これによって、NANDフラッシュの高性能を享受しながらも、容量単価をHDD並みに抑えることに成功しました。
ハードウエアは高品質な既製品を採用して安定を図り、コントローラも含めた冗長化でSPOF(Single Point Of Failure)を排除し高可用性を達成しています。性能面ではブロックサイズ8KBのランダムI/Oで400,000IOPSを達成しており、HDDベースのストレージシステムでは到達できない次元の高度な性能を提供します。またホストサーバーからのレーテンシ(アクセス時間)は平均で1mSec以下に抑えるよう設計されています。
独自設計のRAID-3DというRAID方式を採用してRAID-6にさらに二重のデータ保護をかけており、データの保全性も万全。また、Flash Careと称する方式でNANDフラッシュにアクセスし、MLCのSSDを採用してコストを抑えながらも、高速性と長寿命性を達成しています。
製品の操作に関しては洗練されたGUIと古典的なCLIが用意されており、SSDの本数や物理的な位置及び物理容量を気にすることなく、シンプルな操作で仮想化されたボリュームを定義し、ホストにマウントすることが可能です。ホストインターフェイスはFC8Gか10G iSCSIを選択可能で、通常のSANストレージと同じように使用することができます。
FA-400シリーズを導入するメリットの一つとして、消費電力の削減が挙げられます。同じIOPSを実現するのに、HDDに比較して圧倒的に少ない設置スペースと消費電力しか必要とせず、またストレージの高性能によって必要になるサーバーの数も減少することから、システムのスループットを維持した上でTCOの削減も望めます。
特に効果的な3つの分野と導入例
FA-400シリーズは圧縮と重複排除によって容量単価を抑えているため、特に効果的な適用分野として、サーバー仮想化、データベースと解析、デスクトップ仮想化(VDI:Virtual Desktop Infrastructure)の3分野が挙げられています。米国ではすでに100セット以上が稼働しており、各分野でエンドユーザーにメリットを提供しています。
製品の導入例として、メーカーのサイトでは米国でのユーザー事例がいくつか紹介されています。eMeter(Siemensの一部門)で仮想サーバー及びデータベース用として、yodle社でデータベースの解析用として、教育機関のSTIで2,000ユーザーを超えるVDIサービス用として、TripPak(Xeroxの一部門)でOLTP及び仮想サーバー用としてなどの例が紹介されています。圧縮と重複排除によるデータの圧縮率は、既存ユーザーの平均で5.7分の1、アプリケーション別ではデータベースの場合で2~4分の1、VMやVDIの場合で4~10分の1という実績が報告されています。また、メーカーによるとVDIの場合で20~30分の1に圧縮できた事例もあるそうです。
実際の圧縮率はユーザデータの種類やアプリケーションによって異なりますが、上記3分野での一般的な圧縮率として当社では5分の1以上と想定しており、ストレージシェルフ(SSDを収容する筐体)あたり20TB、最大構成では約80TBのデータを記録できるものと見積もっています。
すべてのエンタープライズユーザにオールフラッシュのストレージを
ますます負荷が増大するシステムのストレージボトルネックの解消に、高性能でHDD並みの容量単価を実現した新世代オールフラッシュストレージFA-400シリーズの採用を検討されてはいかがでしょう。