自動ストレージ・ティアリング
高パフォーマンスと低コストは両立するか?

著者:Phil Goodwin

Storage Magazine 2011 年5 号より


80年代当時のライトビールのコマーシャルを覚えておられるだろうか。「最高においし い!」のか「お腹に溜まらない!」のか、意見が対立する二人が叫び合う、というやつだ。 訳註*1 このコマーシャルのコンセプトは、ビールが風味を損なうことなく、カロリーを減ら すことができる、という事。おそらく、自動ストレージ・ティアリング(AST: automated storage tiering) を推進する人たちも同様のアプローチをしているのだろう。AST の二つの目標、高パフォ ーマンスと低コスト、はまさに対極に位置しているように見える。歴史的に、より高いI/O パフォーマンス(データ・スループット)を求めるのであれば、ハイエンドのファイバー チャネル(FC)ストレージやディスク装置を買うのが通例だった。予算が厳しければ、IP ストレージやSATA ディスクを選ばざるを得なかった。

 

実際のところ、ほとんどの会社では、予算の制約の下でアプリケーションのスループッ ト要求をどうにかして満たすために、高パフォーマンスと低コスト、どちらのタイプのス トレージも使っている。この事は、階層化された(tiered)ストレージの何たるかを見事に表し ている。そして、ティアリング(階層化)の管理をいかに行うかとは、詰まるところ、ス タッフがデファクトの手動ティアリングを選択するか、自動化システムを導入するか、と いうことだ。ますます複雑になっていくデータストレージ環境、データの増加、そして、 毎度おなじみの貧弱なストレージ利用、といった状況を考えれば、手動によるティアリン グ管理が、長期間持ちこたえ得る方法だとは、到底思えない。

 

 

微妙なバランス:コストとパフォーマンス

 

ストレージ・ベンダーが自社のAST ソリューションを語るとき、全員が高いパフォーマ ンスと低コストをアピールする。高パフォーマンスと低コスト、という対立概念を考える と、彼らベンダーは、物理法則を覆すような方法をどうにかして発見したのだろうか、な どという疑問が起こる。しかし、ニュートン科学にとって幸いなことに、答えはノー、だ。 実際には、AST が高パフォーマンスと低コストを両方同時に提供する事は不可能だ。AST ができることは、アプリケーションが必要とするパフォーマンスを、可能な限り低い価格 で提供することだ。つまり、AST とは二つの目標の間でバランスを取る事なのだ。

 

 

ストレージ・ティアリングおさらい

 

ほとんどのIT プロフェッショナルが、ストレージ・ティアリングの何たるかを大体は 理解している。しかし、ここでこの概念を簡単におさらいしておく事は無駄ではないだろ う。ティアは、ベースとなる媒体のパフォーマンスの特徴によって定義される。半導体デ ィスク(SSD)とフラッシュメモリーはティア0、と呼ばれる。毎秒1万5 千回転(15K rpm) のような高速FC ディスクはティア1、毎秒1万回転のFC やSAS ディスクはティア2、毎 秒1万回転未満のSATA ディスクはティア3。これらは、絶対的な規定ではないが、一般的 なティアの差別化要因である。

 

ティアの実装には、二種類の方法がある。最初の方法は、ストレージ内の実装で、単一 のストレージの中に2 種類あるいはそれ以上の媒体が混在する。2 番目の方法は、ストレー ジ間の実装だ。この方法では、異なる種類の媒体を内蔵したストレージが、スムーズなデ ータ移動のために関連づけられる。一つのシステム構成の中に、この二つの方法を同時に 持つことも可能である。

 

 

ティアリング処理の自動化

 

ストレージ・ティアリングもAST も新しい技術ではない。実際、HP は自動ストレージ・ ティアリングを1996 年にリリースしている。にもかかわらず、AST 採用の動きは比較的遅 かった。初期の実装では、データを分類し、ティア間のデータ移動を管理するポリシーの 作成が必要とされたからである。ほとんどの場合、データは年齢という、価値を判断する 属性としては、決してベストといえないものによって移動された。

 

現在のAST の実装は、ブロック・サイズ4KB から1GB の間のデータ・チャンク(かた まり)の使用量を計算する、洗練されたアルゴリズムを用いる。ブロックの大きさは、ベ ンダーや設定によって変わってくる。この計算は、データ・チャ ンクに対しての要求量の絶対的な定義がないため、他のチャン クと比較したアクセス量に応じて行われる。データはアクセス頻度が高い間は高いティア に移動され、アクセス頻度が下がると、低いティアに移される。アルゴリズムの質は、製 品の価値を決め、ブロックの大きさは、作業負荷のシステムへの適合性を決める。一般的 に、小さいブロック・サイズはランダムI/O に適しており、大きいブロック・サイズはシー クエンシャルI/O に適している。

 

 

自動ティアリング:購入時の留意点

 

自社のデータストレージ環境のために自動ティアリングを購入する予定ですか? であ れば、以下のポイントを覚えておいて下さい。

 

自社で使っているアプリケーションのデータ使用特性を理解すること
管理ツールが、長時間かけてシステムをチューニングするのに向いているもの かどうか、よく吟味すること。
提案されているASTの機能を、既存のツールやベンダー製品にどう組み込んでいくのか を判断する。
「設定するだけ、後は忘れても大丈夫(set-and-forget)」か、カスタマイズ可能か、どち らのAST 製品を選ぶのかを決める。
AST は、デバイスのコスト節約を測定できる、まさに「パフォーマンスを出してなんぼ」 の技術である。

 

 

 

名のあるベンダーも新興のベンダーも、AST の機能を提供している。Dell Compellent のような新興のベンダーは、自動ストレージ・ティアリングを製品アーキテクチャーの土 台にしている。同社はStorage CenterシリーズとFluid Dataアーキテクチャーを持って いるが、ストレージアレイのアーキテクチャーは一種類のみで、AST がそこに組み込まれている。Fluid Data アーキテクチャーのデータ移動ブロック・サイズは、比較的粒度が細 かい2MBである。

 

同様に、Avere Systems Inc.のFXT アプライアンスにおいて、オプション機能としての AST は存在しない。しかしこの製品は、どんなNAS またはJBOD でもティア3 として使 用する機能を持っている。すなわち、この様な形でAvere 社はストレージ間ティアリング とストレージ内ティアリングを提供しているのだ。さらに、Avere 社は独自のファイルシス テムを持ち、FXT製品のアルゴリズムにおいて、データ移動管理のもうひとつの指標とな っている。FXT は「set-and-forget」タイプの製品で、ユーザーが移動ポリシーを修正する ことはできない。しかし、作業負荷の変化に対応するために、ティアを個別に拡張することは可能になっている。

 

Arnold Worldwide 社のCIO、Greg Folsom にとって、簡単さは重要な問題である。Folsom によれば、Dell のCompellent システムは、インストールや管理が「目をみはる程簡単」 だと言う。ボストンに本社をおく広告代理店のArnold Worldwide 社は、3 階層のティアに 対して2 つの異なるストレージポリシーを設定して使っている。「全てが簡単にできてるか コメント [y9]: 新参者のAST が、既存ベン ダーとどう仲良くやっていくか、みたいな ことを行っているのでしょうか? コメント [y10]: Price-to-performance、ど う訳したものか。 コメント [y11]: 原文ではplay に なっています。気の利いた訳がないものから、ストレージ管理者がオフィスにいないときは、僕でも管理のやり方について詳しく説 明してやれるくらいだよ。」Folsom は冗談を言う。

 

Arnold Worldwide 社のシニア・システムマネージャー、Chris Elam はDell Compellent のAST ポリシーを、最初デフォルトのままで使い始めたが、その後、時間をかけてカスタ マイズしてきた。Dell Compellent のEnterprise Manager ユーティリティーのおかげで、 Elam は使用パターンの特定を楽に行うことができた。「Enterprise Manager は、システム の中でデータがどのようにアクセスされているかを見極めるのに、とても役に立ちます。 この情報をもとに、我々はいくつかのアプリケーション用にティア1-2 のポリシーを、また 別のアプリケーション用にはティア2-3 のポリシーを作りました。我々は、このシステムを 使い始めて4 年になりますが、その間ポリシー変更の必要に迫られたことは一度もありま せんでした。」Elam は言う。新規ボリュームが作られる時、ボリュームはどれか一つのポ リシーに簡単に割り当てられる。

 

 

SSD がティアリングを補完する

 

Xiotech Corp.は、前述の製品とはまた別の「set-and-forget」タイプのAST 製品を提供 する。Xiotech のHybrid ISE 製品は、14.4TB のSSD とハードディスクを3U の筐体に内 蔵している。14.4TB のうち1TB はSSD で、残りは900GB の毎秒1 万回転のSAS ディス ク(ティア2)により構成されている。Continuous Adaptive Data Placement と呼ばれる コントローラー機能を司るソフトウェアが、設置したと同時に、データ配置を自動的に管 理してくれる。同社は、I/O の動きをモニタリングするISE Analyzer というユーティリテ ィーを提供しているが、ユーザーがパラメーターや設定の変更を行うことは一切できない ようになっている。同社では、Hybrid ISE はチューニングを全く必要としない製品として 設計したためだ、と説明している。

 

設定の変更が可能なアーキテクチャーを持つ製品のなかで、NetApp 社はパフォーマンス と容量を別々に拡張できる機能を強調する。同社のFlash Cache(PAM II)は、他社のシ リーズで言うところのティア0 SSD と類似した製品である。いくら多くのティアをサポー トしたとしても、大抵ティアは二つに簡略化できる、とNetApp は主張する。Flash Cache とティア2 か3 だ。これは、彼らがデータというものは「ホット」か「コールド」のどち らかになる傾向があり、その中間というケースは滅多にない、ということを発見したから だ。バッファー・キャッシュは、パフォーマンス低下を避けるための書き込み先として使 われる。

 

データ移動のブロック・サイズとして、最も多く使われる粒度は4KB である。このアーキテクチャーは、他のアーキテクチャーに比べてより多くのフラッシュ・ディスクが必要 になる(全体容量の10%から20%)が、比較的高価なティア1 ディスクを無くし、コール ド・データをSATA に移動することにより、全体としてはより安価で同等のパフォーマン スを実現することができる。さらに、NetApp はAST を重複排除やディスクの圧縮と組み 合わせ、より大きな容量効率を提供する。データはWAFL ファイルシステムとData Ontap によって管理されているので、データがホットになり、下位のティアからティア0 に引き上げられたとき、「リハイドレート訳註*2」する必要がない。NetApp 全製品に共通して、こ のAST 機能がついている。

 

ジュネーブにある欧州原子核研究機構(CERN)は、Oracle RAC データベースにNetApp のFlash Cache を使っている。「Flash Cache を使う前は、ストレージ使用の状況に関係な く、すべてIOPS をベースにシステムを組まなければなりませんでした。今ようやく、我々 はIOPS と容量の両方を最適化できるようになりました。我々は、高価なFC ディスクから より安価なSATA ディスクへと移行しました。これにより、研究機構の費用を相当額、節 約できたのです。」CERN IT 部のEric Gracher は語る。Gracher は、NetApp のシステム が、作業負荷への適応能力が高いために、結果として管理が簡単になることに気づいた。 フラッシュメモリーはサーバーにあるよりもストレージにある方が、全体のパフォーマン スが上がる、ということをGracher は経験的に発見している。「データをキャッシュするな ら、パッチやアップデートのために再起動が頻繁に発生するデータベース・サーバーより、 システムが安定しているNetApp にキャッシュする方が合理的だ。ストレージ・サーバー 上のデータ・キャッシュはすでに『暖められて』いるからね。これによって、再起動のた びに発生する、サーバーベースのコールド・キャッシュの貧弱なパフォーマンスの時間帯 を無くすことができるんだ。」Gracher は言う。

 

EMC のFully Automated Storage Tiering (FAST)は、上記システムとはまた別の、柔軟 な設定変更ができるシステムの例である。FAST はインストール・ウィザードを持っており、 単純な構成に対してデフォルトの設定を実装する。EMC によれば、大半のユーザーの 「set-and-forget」のシステムにはこの機能で十分だと言う。その他のユーザーは、FAST Tier Advisor を活用している。長い時間をかけて、データ使用に関する統計情報を集めるユ ーティリティーだ。これらの統計情報は、特定のアプリケーションに対して最適なポリシ ーを適用する時に利用することができる。ユーザーはまた、読み込みの傾向が、ランダム かシークエンシャルかによって、データ移動のブロック・サイズを786KB から1GB の範 囲で設定することができる。

 

EMC では、AST を使い始めるユーザーに対して、容量の約3%をティア0、20%をティ ア1、77%をティア3 とする事を推奨している。Tier Advisor によって使用状況を、じっく り時間をかけて追跡していくと、やがてティア1 の容量は、上位のティアと下位のティアのバッファー程度のサイズに最小化されていく。いずれにしても、Tier Advisor は実 際の使用パターンに基づいて、ユーザーが各ティアの最適化の手助けをしてくれる。

 

 

ストレージ筐体間ティアリング

 

日立データシステムズ(HDS)のAST は、全製品においてストレージ筐体間ティアリン グ用に同一のツールをサポートしている。このツールは、まず、抽象化による仮想化と、 パーティション毎の作業負荷から始まる。実際、HDS ではデータのクラス分けよりもアプ リケーションと作業負荷のクラス分けを行うことを推奨している。「ユーザーがAST を使 い始めるとき、最初から複雑なティアリング戦略を組むべきではない。あまりに沢山のテ ィアを使ったり、個々のアプリケーションを最適化しすぎるのも駄目。」と、HDS のソフト ウェア部門バイス・プレジデントのSean Moser は語る。HDS は3 つのティアをサポート しているが、実際のところ、真ん中のティアは上位のティアと下位のティアの「ショック・ アブソーバー」になってしまう。

 

HDS は、構成管理、チューニング管理、ティアード・ストレージ管理が入ったData Center Management スイートを販売している。この製品は、ボリューム、ストレージ・プール、 SLA、ピーク期間、の各情報をアラートやダッシュボードに表示する。これらのツールを 使うことで、ユーザーはじっくり時間をかけてシステムの微調整を行うことができる。ま た、他ベンダーのストレージをストレージ・プールに組み込み、そこで古いストレージを 再利用しデータ・アーカイブ先として利用することも可能だ。HDS の製品では、回転数の 遅いディスクをアーカイブ・ティアに使うことで、電源と冷却の要件を削減することがで きる。

 

HP はAST にたいして、他社に比べて保守的なアプローチをしている。おそらく、いく つかのストレージがパートナーや買収によってHP の製品になっていることが理由だろう が、AST 機能は製品ライン毎に異なる。ハイエンドのP9500 は、HDS のOEM であり、 HDS のAST の実装と非常に似ており、他のストレージを仮想化するためにP9500 を使う ことができる。

 

HP の3PAR シリーズはAST の分野では、約1 年前にその機能をリリースしたばかりの 比較的新参者である。3PAR は3 つのティアを持っているが、どのような構成を組むかは ユーザー次第だ。HP では、まずアプリケーションの使用パターンをモニタリングしてから、 どのティアをどの大きさで実装するか決めるよう、推奨している。同社のAdaptive Optimization は、ティアのモニタリングとサイジングを支援するツールとして販売されている。

 

IBM のEasy Tier製品は、同社のStorwize V7000、DS8700、DS8800、およびSAN Volume Controller 製品でサポートされている。現在、Easy Tier は2 つのティアをサポートしてい るが、どれか1つはSSD でなければならない。この製品は、24 時間毎にパフォーマンスを 指標に基づき分析し、データの最適な移動プランを作成する。データの移動は1GB 毎に行 われる。パフォーマンスを阻害しないよう、移動は5 分間に1 回以上は行われないように なっている。Easy Tier は、ストレージの一機能となっており、オプションとしてのコスト はかからない。

 

 

自動ティアリング市場は発展途上

 

AST にとっての良いニュースは、この市場が多くの選択肢(製品)を持ち、活気にあふ れている、ということだろう。悪いニュースは、その選択肢の多さによって、導入の比較 検討するということよりも、むしろ混乱が起こっていることだ。ネブラスカ州 オマハ市に本社をおくDCIG 社の主席アナリスト兼社長のJerome Wendt は、適切なソリュ ーションを評価するための実践的なアドバイスを行っている。「まず、ユーザーは、アプリ ケーションのパフォーマンス要求とAST 製品のアーキテクチャーをマッチさせなければな りません。その作業には、移動されるデータのブロック・サイズや移動の頻度、データが どのようにティア間を移動するか、についての理解が含まれます。」Wendt は語る。さらに 彼は、通常のファイルシステムはAST にとって極めて安全な対象だが、Microsoft Exchange やその他のデータベースについては慎重なアプローチが必要だ、とアドバイスしている。

 

 

著者略歴:Phil Goodwin はストレージのコンサルタント兼フリーランス・ライター 。

 

*1 訳注:「ミラー・ライト」を指しているようです。"Great taste, less filling"で動画を検索すると、当該CM が出てきます。(あまりオフィスでは見ない方がよいかも...)

*2 訳注:「リハイドレート」 "重複排除や圧縮処理されたデータを、もとの状態に戻すこと" と思われ ます。

 

All Rights Reserved, Copyright 2000 - 2011, TechTarget | Read our Privacy Statement

 

*この翻訳記事の翻訳著作権はJDSF が所有しています。 このページに掲載されている記事・写真・図表などの無断転載を禁じます。