RAIDに取って替わるもの(後編)

著者:Marc Staimer
Storage Magazine 2010年5月号より


RAID革新型

 

数社のベンダが、従来のRAID問題に対処すべく、RAIDの信頼性を活かしながら短所のいくつかを解消する増分的なアプローチをとっている(下記の「RAID強化技術」を参照)。IBMのEVENODD(EMCがSymmetrix DMXに実装)とNetAppのRAID-DP(NetAppのFASとVシリーズに実装)は、アルゴリズムのオーバーヘッドを減らしつつパフォーマンスを向上させることでRAID6を強化した。

 

NEC Corp.のRAID-TM(Triple Mirror)(Dシリーズシステムに実装)は、プライマリドライブとミラードライブの両方に障害が起きた場合または修復不能な読み取りエラーが生じた場合のデータ消失のリスク、というRAID1の問題を解消することを目指している。RAID-TMは3台の異なるHDDに同時にデータを書き込むため、HDD 2台の障害が起きた場合または同じミラー内で修復不能な読み取りエラーが生じた場合でも、アプリは引き続きデータにアクセスでき、ドライブのリビルド中にパフォーマンスが低下することもない。長所はパフォーマンスが低下しにくいこと、短所は実効容量が大幅に減ることだ。

 

RAID-XはIBM XIV Storage Systemの革新技術で、ワイドストライプを使用して、パフォーマンス低下とデータ消失リスクというRAIDの問題を緩和しようとするものだ。これは基本的にはRAID10の変化形で、インテリジェントなリスクアルゴリズムを使用してブロックミラーをアレイ全体にランダムに分散させる。このアプローチにより、XIVでは2TBもの大容量HDDでも30分未満でデータを再構築できる。他のミラーリング技術と同様に、実効容量が減ることが短所だ。

 

Hewlett-Packard Co.のLeftHand NetworksとPivot3 Inc.は、それぞれ自社のx86ベースのクラスタ化されたiSCSIストレージ向けに、似たようなNetwork RAIDの変化形を提供している。Network RAIDは、RAIDの概念を利用したものだが、最小構成単位としてディスクドライブの代わりにストレージノードを使用する。そのため、Network RAIDレベルに応じて1個から4個のデータミラーで、論理ボリュームのデータブロックをクラスタ全体に分散できる。継続的なブロックレベルでの自己修復型ノード稼働状態チェックにより、障害が起きる前にデータを別のノードにコピーして修復できる。その結果、パフォーマンス低下の原因となるリビルドが必要になるHDDの障害または修復不能な読み取りエラーが生じる可能性が低くなる。ただし他のミラーリング技術と同様に、ストレージ実効容量が減る。

 

以上は「RAID革新型」技術のごく一部だ。そのほかにも、RAID7(トリプルパリティ以上)やTSHOVER(トリプルパリティ)など、現在準備段階にある技術がある。

 

RAID変容型

 

RAIDを生まれ変わらせようとする代替技術もある。そのような技術の典型的なものは、RAIDを使用して、何らかの形でその上の階層で機能するものだ。RAIDの良い部分はそのまま引き継ぎ、それ以外の部分を修正しようという考え方だ。変容型技術の例としては、自己修復型ストレージやBeyondRAIDなどがある。

 

自己修復型ストレージ:Xiotech Corp.のIntelligent Storage Elements(ISE)は、自己修復型ストレージの好例だ。ISEはRAIDとHDDを密接に統合し、それらを組み合わせて1つのストレージ要素としている。

 

XiotechのISEは、リビルドの67%から90%をなくすことで、RAIDに伴うリビルド問題の大半を解決することを目指している。まず、メーカーが使用しているHDD再調整アルゴリズムと同様のものを使用して、障害が起きる前にHDDを事前修復することで、HDDの障害を減らす。また、高度な振動制御と、DataPacと呼ばれる密閉されたシステムによって、外部環境の影響によるHDDの障害を減らす。障害が起きると、密閉されたDataPac内でメーカーが使用している手法と同様の手法で、コンポーネントを修復する機能を起動する。電力サイクルを解析し、コンポーネントを再補正し、HDDを再生し、必要な場合にはデータを他のセクターまたは他のHDDに移行する。それでも障害が解消しない場合は、修復不能なセクターのみを分離した上で、障害が起きたHDDセクターについてのみデータの再構築を開始する。よって、リビルドの数が遥かに少なくなり、リビルドが必要になった場合でも再構築するデータの量はかなり少ない。加えて、すべて自動化されているため、障害が起きたドライブを取り出すための手作業は一切不要だ。その結果、修理不能なコンポーネントのみが撤去され、工場で再生したHDDと同等の状態となる。この変容型技術の短所は、総所有コストは低くなる(Xiotechは保証期間を5年間としている)ものの、初期費用が高くなることだ。

 

Atrato Inc.のVelocity1000(V1000)は、Fault Detection, Isolation and Recovery(FDIR)と呼ばれる自己修復技術を、Atrato Virtualization Engine(AVE)と組み合わせて使用している。FDIRはコンポーネントとシステムの稼働状態を監視し、自己診断と自動的な自己修復の機能を追加する。ただしXiotechのようにHDDの必要な部分のみを再生または再調整しようとするわけではない。この技術では、160台の2.5インチSATAドライブをSAID(Self-maintaining Array of Independent Disks)と呼ばれる3Uシステムに格納する。ORT(Operational Reliability Testing)の大規模なSATAドライブパフォーマンスデータベースを使用し、インストールされているドライブの実際のパフォーマンスを監視してSATA HDDの異常を検出する。Atratoも、HDDの障害に対処する際に、まず障害が起きたHDDセクターを修復しようと試みる(ただしメーカーレベルの再調整、再生、またはコンポーネント再補正ではない)。障害または修復不能な読み取りエラーを修復できない場合、そのセクターを分離し、影響を受けたデータのみを再構築して仮想予備容量に再マッピングする。ディスクドライブが完全に故障した場合、そのディスクドライブを再構築して仮想予備容量に再マッピングする。Atratoは、仮想ドライブ内の影響を受けたデータのみを再構築することで、リビルドの数を減らしリビルド時間を短縮する。Atratoは同社の技術の保証期間を3年間としている。

 

DataDirect Networks Inc.のDDN S2A技術でも、ディスク障害に対して部分修復アプローチをとっており、HDDの稼働を停止する前に数段階のHDDリカバリを試みる。まず、異常が見られる各HDDへのすべての書き込みをジャーナリングし、その後リカバリ処理を試みる。リカバリ処理が正常に完了すると、HDDのうちわずかな部分についてのみ、ジャーナリングされた情報を使用したリビルドが必要となるため、リビルド時間が短くなりサポートデスクへの修理依頼を回避できる。

 

Panasas Inc.のActiveScan技術は、HDDとその内容を継続的に監視して問題を検出する。ActiveScanはデータオブジェクト、RAIDパリティ、ディスクメディア、およびディスクドライブ属性を監視する。潜在的な問題を検出すると、データを同じディスクの予備ブロックに移動する。SMART(Self-Monitoring Analysis and Reporting Technology)属性統計解析を使用して将来のHDD障害を予測するため、障害が起きる前にデータ保護措置を実行できる。HDD障害が予測されると、ユーザが設定したポリシーに基づいて事前にデータを他のHDDに移行するため、再構築が必要となるケースが減る(場合によってはなくなる)。

 

LSI Corp.とNECの技術はいずれも、RAIDグループ内の他のドライブで継続稼働させながらHDDセクターのエラーを検出する。代替セクターの割り当てが可能な場合は、当初のHDDを復帰させて、全面的なリビルドを避ける。パフォーマンスは検出と修復のプロセス全体を通じて維持される。この技術は、リビルドの数を減らしパフォーマンスの維持に役立つ限定的な自己修復技術といえる。

 

3PARのInSpire Architectureは、高度なHDDエラー分離機能を活用して再構築が必要なデータの量を減らすことで高いパフォーマンスレベルを維持すると共に、大量並列処理の能力を活かして高速なリビルド(通常30分未満)を実現することを目指している。このシステムは多対多のドライブ関係において「チャンクレット」を使用する。前述の大量並列処理能力により、RAIDセットを複数のドライブシャーシに分離し、1つのシャーシに障害が起きた場合のデータ消失のリスクを最小限にとどめる。

 

BeyondRAID:Data Robotics Inc.のBeyondRAIDは、RAIDの上の階層で機能し、RAIDが管理者に意識されないようにする。同技術はRAIDを固定的なオフラインプロセスから動的なオンラインプロセスに変えるものだ。本質的には自己管理型技術であるBeyondRAIDは、任意の時点で必要とされているデータ保護に応じてRAIDセットを選択する。といっても、BeyondRAIDが突出した技術である本当の理由は、RAIDの問題への対処方法だ。同技術は1台または2台のHDDの障害発生時にデータを保護し、データの自動自己修復機能(ストレージの自己修復ではなく)を内蔵している。データブロックはすべてのドライブに分散されるため、データの再構築が非常に高速だ。このシステムは「データ認識型」であるため、ドライブサイズの混在、ドライブの順序変更、リビルド時間の比例配分が可能だ。SATAドライブ8台で構成されているため、小規模から中規模の企業(SMB)にとっては特に魅力的で、本当の意味で「スイッチを入れて接続したらあとは何もしなくて良い」ストレージシステムといえる。

 

RAIDのパラダイムシフト:消失訂正符号 (Erasure Code)*訳注

 

消失訂正符号は、データを認識不能な情報チャンクに分割し、各チャンクに情報を付加して、チャンクのいくつかのサブセットから完全なデータセットを復元できるようにするものだ。チャンクはデータセンター内、都市内、地域内、または世界中の任意の場所にある複数のストレージサイトに分散できる。

 

個々のチャンクには元データセットを復元できるほどの情報は含まれていないため、消失訂正符号にはデータセキュリティが組み込まれているといえる。データセット全体を完全に復元するには複数のストレージノードからの十分な大きさのチャンクサブセットが必要であり、必要なチャンクの数は、各チャンクに割り当てられた付加情報の量に応じて決まる。付加情報が多いほど、データセット全体を復元するために必要なチャンクの数は少なくなる。

 

消失訂正符号は、元データの再構築に必要なものがチャンクのサブセットのみであるため、自然災害や技術上の障害に対する耐障害性を備えている。実際、消失訂正符号があれば、ホスティングデバイス、サーバ、ストレージ要素、HDD、およびネットワークからなるシステム全体の中で同時に複数の障害が起きた場合でも、データにリアルタイムでアクセスできる。

 

FEC(Forward Error Correction)とも呼ばれる消失訂正符号化を行うストレージは、RAIDとはまったく異なるアプローチだ。消失訂正符号は、前述のRAID問題をすべて解消する。このアプローチはまだ新しく、現時点では3社のベンダのみが消失訂正符号を利用した製品を提供している。Cleversafe Inc.のdsNet、EMC Corp.のAtmos、およびNECのHYDRAstorだ。

 

消失訂正符号は、小さいデータセットよりも大きいデータセットに適しているように見える。データセットのレプリケーションを行う必要がなく、複数の地域にデータを分散できるため、特にクラウドストレージや分散ストレージに適している。

 

RAIDの進化

 

従来のRAIDに関する諸問題はよく知られており、ディスクの大容量化に伴いますます深刻化している。今回紹介したRAIDの代替技術はそれらの問題の多くに対処している。またこのほかにも近いうちに新しいアプローチが登場するだろう。特定の環境に最適なものを選ぶには、調査、テスト、試験導入が必要であり、忍耐力と、従来と異なるアプローチに関してリスクをとる意思が求められる。

 

 

RAID強化技術

属性 RAIDレベル 説明 データ保護可能な最大HDD故障数 ベンダ
RAID革新型 RAID 6
EVENODD
追加の冗長HDDを2台のみ使用しシンプルな排他的論理和演算で構成されるIBMの革新技術。標準的なRAID5コントローラでよく使用されるパリティ用ハードウェアのみで済む点が長所。このため、より広く使用されているリードソロモン符号の演算に比べて排他的論理和演算の数が約50%(ドライブ15台の場合)減る。RAID6と同様、ハードディスクドライブ(HDD)2台の同時リビルド時にパフォーマンス低下の問題あり。長所はXORをベースにしている点。短所は、特定の対角ブロック内に、書き込み性能が短時間急激に低下するホットスポットが数か所あること。 2 EMC
RAID-DP
(行/対角パリティ方式)
RAID4グループ内のHDDの行パリティを保存、RDPグループ内のHDDの対角パリティを追加のパリティHDDに格納。2つのRDP(行/対角)パリティストライプで、RAIDグループ内のHDD2台に障害が起きた場合でもデータを保護。パフォーマンスはシングルパリティのRAID4またはRAID5とほぼ同じで、標準的なRAID6よりも高いが、RAID6と同様、HDD2台の同時リビルド時にパフォーマンス低下の問題あり。 2 NetApp
RAID-TM
(RAID Triple Mirror)
RAID-TMは、RAID1並みの速度と、RAID6並みの高信頼性および二重HDD障害に対する保護を実現。RAID-TMはHDD3台に同時にデータを書き込む。HDD2台の障害または同一ミラー内の修復不能な読み取りエラー時でも、アプリケーションはデータに引き続きアクセスでき、ドライブのリビルド中もパフォーマンス低下なし。 2 NEC
RAID-X RAID-Xは予備HDDが不要で、ストレージシステム内の既存HDDに予備容量があれば足りる。オブジェクトは任意の2種のHDD間でミラーリング可能(ドライブのサイズや速度を合わせる必要はない)。データがミラーリングされているためリビルドパフォーマンスはきわめて高速。この技術はRAID1またはRAID10にランダム分散の保護を追加したもの。第2のドライブ障害が起きるとデータ消失のおそれがあり、このリスクはミラーリングを増やすことでしか緩和できない。ストレージ実効容量はミラーの数に応じて制限される(最小で半分に)。 2以上(ミラーの数による) IBM(XIV)
Network RAID 論理ボリュームのブロックをクラスタ全体に分散し、各アプリケーションデータの要件に最適な信頼性レベルをボリューム単位で設定可能。論理ボリュームのNetwork RAIDレベルに応じて、各ブロックのコピーを1個から4個クラスタ全体にストライピングする。ボリュームのRAIDレベルはデータの可用性の中断なく変更可能(自動再ストライピング)。また修復不能な読み取りエラーの可能性を減らすため、ブロックレベルでの事前自己修復が可能。ただし、各ブロックコピーによってストレージ実効容量が減る。 4 GridStor、Hewlett-Packard LeftHand、Pivot3
RAID変容型 自己修復型ストレージ 部分修復ストレージとも呼ばれる。HDD障害と不要なRAIDデータリビルドの大半をなくす、または減らすための一連の自動修復シーケンスを使用。修復不能なHDDセクターのみを分離し、そのセクターで失われたデータのみをリビルド。従来のRAIDに比べて初期費用が高いが、総所有コストは大幅に低くなる。部分修復ストレージには、障害箇所限定機能のための未使用HDDプールが必要。 2 Atrato、DataDirect Networks、Panasas、LSI、NEC、3PAR、Xiotech
BeyondRAID BeyondRAIDは本質的にRAIDの上の階層で機能する仮想化エンジンで、必要なデータ保護レベルに応じて適切なRAIDアルゴリズムを選択。複数のデータ保護手法の間で実際に切り替えが可能なブロックを書き込む。ストレージ容量の追加が必要な場合は、追加のHDDを挿入するか小容量HDDを大容量のものに交換可能。管理がシンプルで、冗長性レベルをクリック1回で単一ディスクから二重ディスクに切り替え可能。二重のドライブ障害時にデータを保護し、管理者に意識されない自動データ修復機能を追加。データ認識型であるため、ドライブサイズの混在、ドライブの順序変更、リビルド時間の比例配分、自己管理が可能。ドライブ8台までの小規模なシステムでのみ利用可能。 2 Data Robotics
パラダイムシフト型RAID代替技術 消失訂正符号 FEC(Forward Error Correction)の一形式とも呼ばれる消失訂正符号化は、保存されたオブジェクトに情報を付加して、あらゆるデータセットを情報全体のサブセットから完全に復元できるようにするもの。複数のスライス(ストレージオブジェクト)つまりデータセットのサブセットを複数のストレージまたはサーバノードに分散。ストレージオブジェクトへの付加情報が増えると、データセットの耐障害性が向上し、より多くのコンポーネント(ディスクドライブ、ストレージオブジェクト、サーバノード)の障害時にデータを保護し、なおかつ完全なデータセットを復元可能。他方で各ストレージオブジェクトへの情報付加によりストレージ実効容量が減る。消失訂正符号を利用したストレージの最大の問題は、特に小容量の書き込みで書き込み性能が低下すること。 オブジェクトへの付加情報の量による Cleversafe、EMC、NEC
※Storage Magazine 2010年5月号より

 

 

略歴:Marc Staimer氏は、オレゴン州ビーヴァートンにあるDragon Slayer Consultingの創業者にしてシニアアナリスト。
同社はハイテク製品の戦略的計画立案、製品開発、市場開発を主力とするコンサルティング会社。
連絡先はmarcstaimer@mac.com


訳注:2013年12月ストレージマガジン11月号『ビッグデータ解析用ストレージ』の訳出を機に、従来「冗長符号」だった訳を「消失訂正符号」に修正。

 

All Rights Reserved, Copyright 2000 ? 2010, TechTarget
*この翻訳記事の翻訳著作権はJDSFが所有しています。
このページに掲載されている記事・写真・図表などの無断転載を禁じます。

February 2010