RAIDに取って替わるもの(後編)
Storage Magazine 2010年5月号より
RAID革新型
数社のベンダが、従来のRAID問題に対処すべく、RAIDの信頼性を活かしながら短所のいくつかを解消する増分的なアプローチをとっている(下記の「RAID強化技術」を参照)。IBMのEVENODD(EMCがSymmetrix DMXに実装)とNetAppのRAID-DP(NetAppのFASとVシリーズに実装)は、アルゴリズムのオーバーヘッドを減らしつつパフォーマンスを向上させることでRAID6を強化した。
NEC Corp.のRAID-TM(Triple Mirror)(Dシリーズシステムに実装)は、プライマリドライブとミラードライブの両方に障害が起きた場合または修復不能な読み取りエラーが生じた場合のデータ消失のリスク、というRAID1の問題を解消することを目指している。RAID-TMは3台の異なるHDDに同時にデータを書き込むため、HDD 2台の障害が起きた場合または同じミラー内で修復不能な読み取りエラーが生じた場合でも、アプリは引き続きデータにアクセスでき、ドライブのリビルド中にパフォーマンスが低下することもない。長所はパフォーマンスが低下しにくいこと、短所は実効容量が大幅に減ることだ。
RAID-XはIBM XIV Storage Systemの革新技術で、ワイドストライプを使用して、パフォーマンス低下とデータ消失リスクというRAIDの問題を緩和しようとするものだ。これは基本的にはRAID10の変化形で、インテリジェントなリスクアルゴリズムを使用してブロックミラーをアレイ全体にランダムに分散させる。このアプローチにより、XIVでは2TBもの大容量HDDでも30分未満でデータを再構築できる。他のミラーリング技術と同様に、実効容量が減ることが短所だ。
Hewlett-Packard Co.のLeftHand NetworksとPivot3 Inc.は、それぞれ自社のx86ベースのクラスタ化されたiSCSIストレージ向けに、似たようなNetwork RAIDの変化形を提供している。Network RAIDは、RAIDの概念を利用したものだが、最小構成単位としてディスクドライブの代わりにストレージノードを使用する。そのため、Network RAIDレベルに応じて1個から4個のデータミラーで、論理ボリュームのデータブロックをクラスタ全体に分散できる。継続的なブロックレベルでの自己修復型ノード稼働状態チェックにより、障害が起きる前にデータを別のノードにコピーして修復できる。その結果、パフォーマンス低下の原因となるリビルドが必要になるHDDの障害または修復不能な読み取りエラーが生じる可能性が低くなる。ただし他のミラーリング技術と同様に、ストレージ実効容量が減る。
以上は「RAID革新型」技術のごく一部だ。そのほかにも、RAID7(トリプルパリティ以上)やTSHOVER(トリプルパリティ)など、現在準備段階にある技術がある。
RAID変容型
RAIDを生まれ変わらせようとする代替技術もある。そのような技術の典型的なものは、RAIDを使用して、何らかの形でその上の階層で機能するものだ。RAIDの良い部分はそのまま引き継ぎ、それ以外の部分を修正しようという考え方だ。変容型技術の例としては、自己修復型ストレージやBeyondRAIDなどがある。
自己修復型ストレージ:Xiotech Corp.のIntelligent Storage Elements(ISE)は、自己修復型ストレージの好例だ。ISEはRAIDとHDDを密接に統合し、それらを組み合わせて1つのストレージ要素としている。
XiotechのISEは、リビルドの67%から90%をなくすことで、RAIDに伴うリビルド問題の大半を解決することを目指している。まず、メーカーが使用しているHDD再調整アルゴリズムと同様のものを使用して、障害が起きる前にHDDを事前修復することで、HDDの障害を減らす。また、高度な振動制御と、DataPacと呼ばれる密閉されたシステムによって、外部環境の影響によるHDDの障害を減らす。障害が起きると、密閉されたDataPac内でメーカーが使用している手法と同様の手法で、コンポーネントを修復する機能を起動する。電力サイクルを解析し、コンポーネントを再補正し、HDDを再生し、必要な場合にはデータを他のセクターまたは他のHDDに移行する。それでも障害が解消しない場合は、修復不能なセクターのみを分離した上で、障害が起きたHDDセクターについてのみデータの再構築を開始する。よって、リビルドの数が遥かに少なくなり、リビルドが必要になった場合でも再構築するデータの量はかなり少ない。加えて、すべて自動化されているため、障害が起きたドライブを取り出すための手作業は一切不要だ。その結果、修理不能なコンポーネントのみが撤去され、工場で再生したHDDと同等の状態となる。この変容型技術の短所は、総所有コストは低くなる(Xiotechは保証期間を5年間としている)ものの、初期費用が高くなることだ。
Atrato Inc.のVelocity1000(V1000)は、Fault Detection, Isolation and Recovery(FDIR)と呼ばれる自己修復技術を、Atrato Virtualization Engine(AVE)と組み合わせて使用している。FDIRはコンポーネントとシステムの稼働状態を監視し、自己診断と自動的な自己修復の機能を追加する。ただしXiotechのようにHDDの必要な部分のみを再生または再調整しようとするわけではない。この技術では、160台の2.5インチSATAドライブをSAID(Self-maintaining Array of Independent Disks)と呼ばれる3Uシステムに格納する。ORT(Operational Reliability Testing)の大規模なSATAドライブパフォーマンスデータベースを使用し、インストールされているドライブの実際のパフォーマンスを監視してSATA HDDの異常を検出する。Atratoも、HDDの障害に対処する際に、まず障害が起きたHDDセクターを修復しようと試みる(ただしメーカーレベルの再調整、再生、またはコンポーネント再補正ではない)。障害または修復不能な読み取りエラーを修復できない場合、そのセクターを分離し、影響を受けたデータのみを再構築して仮想予備容量に再マッピングする。ディスクドライブが完全に故障した場合、そのディスクドライブを再構築して仮想予備容量に再マッピングする。Atratoは、仮想ドライブ内の影響を受けたデータのみを再構築することで、リビルドの数を減らしリビルド時間を短縮する。Atratoは同社の技術の保証期間を3年間としている。
DataDirect Networks Inc.のDDN S2A技術でも、ディスク障害に対して部分修復アプローチをとっており、HDDの稼働を停止する前に数段階のHDDリカバリを試みる。まず、異常が見られる各HDDへのすべての書き込みをジャーナリングし、その後リカバリ処理を試みる。リカバリ処理が正常に完了すると、HDDのうちわずかな部分についてのみ、ジャーナリングされた情報を使用したリビルドが必要となるため、リビルド時間が短くなりサポートデスクへの修理依頼を回避できる。
Panasas Inc.のActiveScan技術は、HDDとその内容を継続的に監視して問題を検出する。ActiveScanはデータオブジェクト、RAIDパリティ、ディスクメディア、およびディスクドライブ属性を監視する。潜在的な問題を検出すると、データを同じディスクの予備ブロックに移動する。SMART(Self-Monitoring Analysis and Reporting Technology)属性統計解析を使用して将来のHDD障害を予測するため、障害が起きる前にデータ保護措置を実行できる。HDD障害が予測されると、ユーザが設定したポリシーに基づいて事前にデータを他のHDDに移行するため、再構築が必要となるケースが減る(場合によってはなくなる)。
LSI Corp.とNECの技術はいずれも、RAIDグループ内の他のドライブで継続稼働させながらHDDセクターのエラーを検出する。代替セクターの割り当てが可能な場合は、当初のHDDを復帰させて、全面的なリビルドを避ける。パフォーマンスは検出と修復のプロセス全体を通じて維持される。この技術は、リビルドの数を減らしパフォーマンスの維持に役立つ限定的な自己修復技術といえる。
3PARのInSpire Architectureは、高度なHDDエラー分離機能を活用して再構築が必要なデータの量を減らすことで高いパフォーマンスレベルを維持すると共に、大量並列処理の能力を活かして高速なリビルド(通常30分未満)を実現することを目指している。このシステムは多対多のドライブ関係において「チャンクレット」を使用する。前述の大量並列処理能力により、RAIDセットを複数のドライブシャーシに分離し、1つのシャーシに障害が起きた場合のデータ消失のリスクを最小限にとどめる。
BeyondRAID:Data Robotics Inc.のBeyondRAIDは、RAIDの上の階層で機能し、RAIDが管理者に意識されないようにする。同技術はRAIDを固定的なオフラインプロセスから動的なオンラインプロセスに変えるものだ。本質的には自己管理型技術であるBeyondRAIDは、任意の時点で必要とされているデータ保護に応じてRAIDセットを選択する。といっても、BeyondRAIDが突出した技術である本当の理由は、RAIDの問題への対処方法だ。同技術は1台または2台のHDDの障害発生時にデータを保護し、データの自動自己修復機能(ストレージの自己修復ではなく)を内蔵している。データブロックはすべてのドライブに分散されるため、データの再構築が非常に高速だ。このシステムは「データ認識型」であるため、ドライブサイズの混在、ドライブの順序変更、リビルド時間の比例配分が可能だ。SATAドライブ8台で構成されているため、小規模から中規模の企業(SMB)にとっては特に魅力的で、本当の意味で「スイッチを入れて接続したらあとは何もしなくて良い」ストレージシステムといえる。
RAIDのパラダイムシフト:消失訂正符号 (Erasure Code)*訳注
消失訂正符号は、データを認識不能な情報チャンクに分割し、各チャンクに情報を付加して、チャンクのいくつかのサブセットから完全なデータセットを復元できるようにするものだ。チャンクはデータセンター内、都市内、地域内、または世界中の任意の場所にある複数のストレージサイトに分散できる。
個々のチャンクには元データセットを復元できるほどの情報は含まれていないため、消失訂正符号にはデータセキュリティが組み込まれているといえる。データセット全体を完全に復元するには複数のストレージノードからの十分な大きさのチャンクサブセットが必要であり、必要なチャンクの数は、各チャンクに割り当てられた付加情報の量に応じて決まる。付加情報が多いほど、データセット全体を復元するために必要なチャンクの数は少なくなる。
消失訂正符号は、元データの再構築に必要なものがチャンクのサブセットのみであるため、自然災害や技術上の障害に対する耐障害性を備えている。実際、消失訂正符号があれば、ホスティングデバイス、サーバ、ストレージ要素、HDD、およびネットワークからなるシステム全体の中で同時に複数の障害が起きた場合でも、データにリアルタイムでアクセスできる。
FEC(Forward Error Correction)とも呼ばれる消失訂正符号化を行うストレージは、RAIDとはまったく異なるアプローチだ。消失訂正符号は、前述のRAID問題をすべて解消する。このアプローチはまだ新しく、現時点では3社のベンダのみが消失訂正符号を利用した製品を提供している。Cleversafe Inc.のdsNet、EMC Corp.のAtmos、およびNECのHYDRAstorだ。
消失訂正符号は、小さいデータセットよりも大きいデータセットに適しているように見える。データセットのレプリケーションを行う必要がなく、複数の地域にデータを分散できるため、特にクラウドストレージや分散ストレージに適している。
RAIDの進化
従来のRAIDに関する諸問題はよく知られており、ディスクの大容量化に伴いますます深刻化している。今回紹介したRAIDの代替技術はそれらの問題の多くに対処している。またこのほかにも近いうちに新しいアプローチが登場するだろう。特定の環境に最適なものを選ぶには、調査、テスト、試験導入が必要であり、忍耐力と、従来と異なるアプローチに関してリスクをとる意思が求められる。
|
略歴:Marc Staimer氏は、オレゴン州ビーヴァートンにあるDragon Slayer Consultingの創業者にしてシニアアナリスト。
同社はハイテク製品の戦略的計画立案、製品開発、市場開発を主力とするコンサルティング会社。
連絡先はmarcstaimer@mac.com。
訳注:2013年12月ストレージマガジン11月号『ビッグデータ解析用ストレージ』の訳出を機に、従来「冗長符号」だった訳を「消失訂正符号」に修正。
All Rights Reserved, Copyright 2000 ? 2010, TechTarget
*この翻訳記事の翻訳著作権はJDSFが所有しています。
このページに掲載されている記事・写真・図表などの無断転載を禁じます。