レプリケーションの選択肢

著者:Jacob Gsoedl
Storage Magazine 2009年4月号より

 

データレプリケーションは重要なデータを守り、迅速なリカバリを保証するのに卓越した手段である。ストレージか、ネットワークか、サーバか、どこにレプリケーションを導入するべきかを見極めよう。

データレプリケーションはデータ保護の手段として、世界貿易センターがテロ攻撃を受けた最初の年である1993年に、ストレージシステムにはじめて登場してから、引き続き採用が進んでいる。それは時とともに、従来のテープバックアップよりも目標復旧時点(RPO)と目標復旧時間(RTO)が短くなければならないアプリケーションの運用バックアップとしてだけでなく、ディザスタリカバリのコンポーネントとしても不可欠なものになった。企業でも、遠隔オフィスや支社のデータ保護にデータレプリケーションを採用している。ハブ・アンド・スポークアーキテクチャでは、支社のデータを中央のデータセンターにレプリケーションできるので、支社内でテープバックアップをするという面倒な作業が要らなくなる。

レプリケーションサービスの採用が進んでいるのは、データレプリケーション製品が多彩に揃ってきたことや、価格も手頃になり、ネットワークの高速化と低価格化が進み、かつレプリケーション技術自体がおおむね成熟していることが原動力となっている。「当社の顧客の中で、レプリケーションによるデータ保護をトップ3の優先順位の1つにあげる方は60%に及びます。数年前とは大違いです」と語るのは、ヒューレットパッカード(HP)の系列会社であるEDSのストレージサービス部のグローバルプロダクトマネージャーのティム・バウアーズ氏である。

レプリケーションにも違いがある

マクロレベルでは、データレプリケーションとは、ある1つのストレージロケーションからデータを別の1つ以上のローカルまたはリモートのストレージシステムにコピーすることである。だが、この基本機能以外の側面をみると、データレプリケーション製品はいくつかのキーポイントで違いがあることが分かる。

場所:製品間の主な差別化の1つは、どこでレプリケーションが行われるかにある。レプリケーションのサービスやソフトウェアはストレージや、ネットワーク、またはホスト(サーバ)上で稼働することができる。現在のところストレージ型がレプリケーション市場で支配的といえる。

米国マサチューセッツ州フレーミンガムにあるIDCのストレージソフトウェア・リサーチマネージャーのジェームズ・ベイカー氏によれば「当社が行った最新の調査では、2007年には、ストレージベースのレプリケーションの全世界の売上の83.7%はストレージからストレージへのレプリケーションが占め、その次はホスト型レプリケーションで11.5%、ネットワーク型のレプリケーションは4.8%です。」だが、その調査ではホスト型、ネットワーク型のレプリケーションも追い上げているのが分かる。2012年まで、年平均成長率(CAGR)でホスト型レプリケーションは18.2%、ネットワーク型は15.4%の成長を見せると予想されている。どちらも、年平均成長率が10%と予測されるストレージ型レプリケーションより急速に伸びると見られている。

モード:レプリケーションには、一次ストレージと二次ストレージに同時にデータが書き込まれる、いわば「同期型」と、レプリケーションターゲットへのレプリケーションに若干の遅延がある「非同期型」とがある。同期型では、一次ストレージシステムは、レプリケーションターゲットでデータ書込が成功したことを認識した後にだけ、I/O書込をコミットする。同期型レプリケーションは十分なネットワーク帯域と低いレイテンシが要求される。そして、サポートされるレプリケーションの距離は50kmから300kmまでと幅がある。同期型はRPOとRTOがゼロでなければならないアプリケーションで主に採用されている。例えば、一次ストレージとターゲットシステムの間で100%の同期を要求するハイアベイラビリティクラスタや基幹業務アプリケーションなどである。逆に、非同期型レプリケーションはまず一次ストレージにデータを書き込み、その後、実装のアプローチは色々だが、レプリケーションするデータをメモリまたはディスクのジャーナルにコミットする。そして、リアルタイムかスケジュールされた間隔で、データをレプリケーションターゲットにコピーする。同期型と違い、長距離で、かつ帯域が小さくても機能するように作られている。ストレージ型、ネットワーク型のレプリケーション製品は大部分が同期と非同期両方をサポートしているが、ホスト型の製品は非同期レプリケーションだけに対応している。

タイプ:レプリケーション製品はボリューム上または論理ユニット番号(LUN)上のデータブロックをレプリケーションできる。レプリケーションは、ファイルレベルでも可能である。ブロックレベルとファイルレベルのレプリケーションをサポートするネットワークストレージ(NAS)を除いて、ストレージ型レプリケーションは普通ブロックレベルである。ネットワーク型レプリケーションにも同じことがあてはまる。対照的に、ほとんどのホスト型レプリケーションはファイルシステムのレベルで動作する。ブロックベースのレプリケーションはプラットフォームを認識せず、OSが混在していてもシームレスに動作する。ファイルベースのレプリケーションはOSに依存する度合いが非常に高く、商用のホスト型のレプリケーション製品はほとんどがWindows用である。ブロックベースのレプリケーション製品はファイルベースとは違い、接続されたプラットフォーム、ファイルシステム、アプリケーションなどを認識しないため、どのような種類のアプリケーションと連携・統合するにも、スナップショットなどの補助的なサービスに依存してしまう。そのため、レプリケーションをサポートするストレージの多くは、程度の差はあるもののファイルシステムやExchangeやSQL Serverのデータベースなどの主要アプリケーションに対応するスナップショット機能を提供している。


データレプリケーションのトレンド

こういったデータレプリケーションのトレンドはデータ保護やディザスタリカバリを徐々に変えつつある。

・レプリケーションベースのデータ保護を採用するケースが増えている。
・レプリケーションベースのデータ保護は従来からのデータ保護と同化しつつあり、バックアップ製品はレプリカとスナップショットをバックアップと一緒に管理する機能を備えつつある。
・レプリケーションとアプリケーションを統合してアプリケーションとの一貫性があるリカバリを提供する製品が伸びている。
・レプリケーションベースのデータ保護が仮想化サーバ環境を保護するための重要なオプションになってきている。
・Storage-as-a-Service(SaaS)とクラウドコンピューティングが普及するにしたがい、ホスト型レプリケーション製品に人気が出ている。
・レプリケーションは利用できる帯域に依存するので、貴重なWAN帯域を保護するために広域ネットワーク(WAN)最適化機能がレプリケーションと組み合わせて使われている。こうした製品を出している企業は、ブルーコートシステムズ、シスコシステムズ、シトリックスシステムズ、F5ネットワークス、ジュニパーネットワークス、パケッティア(現在ブルーコートシステムズの子会社)、リバーベッドテクノロジー、シルバーピークシステムズなどである。



ストレージ型のレプリケーション
ストレージ型のレプリケーションでは、レプリケーションソフトウェアがストレージコントローラ上で実行される。この方式は中規模から大規模な企業でもっとも普及しているが、これは大企業でデータレプリケーション機能を備えるハイエンドのストレージの導入が進んでいるためである。

ストレージ型レプリケーションは15年以上の歴史があり、もっとも成熟して信頼性の高い方式である。そのスケーラビリティはストレージコントローラの処理能力にのみ制約される。EMC Corp.のレプリケーションソリューション・プロダクトマーケティングディレクターのリック・ウォルズワース氏は「顧客は多数のストレージプロセッサにデータレプリケーションを分散させることで、我が社のClariionSymmetrixのストレージにてレプリケーション性能を稼いでいます」と述べる。

レプリケーションソフトウェアはストレージ上に配置されているので、サーバを多数備える環境に相応しい。その理由は、オペレーティングシステムに依存しないこと、WindowsとUnix系システムやメインフレーム(ハイエンドストレージ)などをサポートすること、ライセンス料が付属するサーバ数でなくストレージ容量で決まること、そして付属サーバの管理作業が要らないこと、などである。レプリケーションの負荷はストレージコントローラに移されるので、サーバに処理オーバーヘッドは発生しない。そのため、ストレージ型レプリケーションは基幹業務やハイエンドトランザクションのアプリケーションに適しているといえる。

ストレージ型レプリケーションの最大の欠点は、混在ストレージ環境をサポートしないことである。しかも、ストレージにストレージ仮想化オプションが - 日立データシステムズがUniversal Storage Platform(USP)に提供しているように - 付いていない限り、ストレージ型レプリケーションは類似するストレージモデルとの間でしか機能しない。ベンダー依存度の高さを別にしても、ストレージ型レプリケーションの初期費用は比較的高く、多くの場所に対応しなければならない企業では特に高価になる可能性がある。一般的に、ストレージ型は単一のストレージベンダーに統一している企業でもっとも機能する。

中規模からハイエンドまでのストレージベンダーは、ほぼすべてレプリケーション機能を提供している。こういう大手ストレージベンダーのレプリケーション製品は市場に浸透しており、シェアを占めている。

・EMCのSymmetrix Remote Data Facility(SRDF)の同期/非同期レプリケーションとEMCのMirrorView のClariionシステムの同期/非同期レプリケーションソリューション
・日立データシステムズの同期レプリケーションTrueCopyと非同期レプリケーションソフトウェアUniversal Replicator
・HPのXPとEVAストレージ用の同期/非同期レプリケーションHP StorageWorks XP Continuous AccessおよびContinuous Access EVA
・IBMの同期レプリケーションMetro Mirrorと非同期レプリケーションGlobal Mirror
・NetAppのブロックベース同期/非同期レプリケーションSnapMirrorとファイルベース用レプリケーションのSnapVault

これらのレプリケーション製品は多くの面で似通っているが、技術的に詳しく分析すると微妙な違いがあることが分かる。例えば、同期レプリケーション中に一次ストレージとターゲットストレージのハンドシェイクを処理する能力は、製品がサポートできる距離を大きく左右する。「Metro Mirrorは1回のハンドシェイクでターゲットシステムにデータを書き込むことができるため、300 kmまでの距離に対応できます」と語るのは、IBMのコンサルティングITアーキテクトのヴィク・ペルツ氏である。この距離は、他のベンダーの主張する50 kmから200 kmを大きく上回る。

非同期レプリケーションの実装にも違いがある。EMCはレプリケーションするデータをメモリにバッファするが、IBMのMetro Mirrorはいわゆるビットマップで変更を追跡、継続的に送信し、定期的にソースとターゲットを再同期化して両者を同期した状態に保っている。一方、日立データシステムズのUniversal Replicatorソフトウェアはディスクに保存された変更ジャーナルを使っている。

日立データシステムズ・ソリューションプロダクトマーケティング・ビジネスコンティニュイティ・シニアディレクターのクリストフ・バートランド氏は次のように語る。「ソースから出されたのではなく、レプリケーションターゲットが引き出したディスクベースの変更ジャーナルを組み合わせると、極めて回復力の高いシステムができあがり、長期的な分裂状態からでも自動的に復帰できる能力が付きます。レプリケーションターゲットのストレージから変更が引き出されるので、貴重なプロセッシングサイクルを一次ストレージから二次ターゲットストレージにオフロードできます。」



データレプリケーション方式の比較
  レプリケーションタイプ
  ストレージ型 ホスト型 ネットワーク型
異機種環境でのサポート
・類似ストレージ間のみで機能する

・ストレージに依存せず、ネットワーク接続およびダイレクト接続のストレージで機能する

・ストレージやプラットフォームに依存しない
性能と拡張性 ・ストレージに依存する
・ハイエンドストレージでは非常に良い
良い
・サーバに負荷かかる
・管理性の面で、拡張性に制限あり
非常に良い
コスト ・類似ストレージが必要
・高い導入コスト
・箇所が増えるごとに高くなる
・ハードウェア不要 低い導入コスト
・サーバの台数が増えるごとに高くなる
・インテリジェントスイッチまたは、インライン型アプライアンスが必要
・高い導入コスト
・拠点が増えるごとに高くなる
複雑性 中から高 中から高
モード 同期、非同期 非同期 同期、非同期
主要なレプリケーションタイプ 論理ユニット番号(LUN)またはボリュームブロックレベル ファイルシステム 論理ユニット番号(LUN)またはボリュームブロックレベル

ホスト型レプリケーション

ホスト型レプリケーション製品では、レプリケーションソフトウェアはサーバ上で実行されるので、ストレージ型やネットワーク型とは異なり、ハードウェアの追加コンポーネントは必要とされない。そのため、ホスト型は現在もっとも安価で導入の容易な方式である。

「ホスト型レプリケーションを導入するには、ソースとターゲットのサーバにレプリケーションソフトウェアをインストールするだけで良いのです」Double-Takeソフトウェアのソリューションエンジニアリング・ディレクターのボブ・ロードブッシュ氏はこう指摘している。異機種環境に向いていて、ネットワーク接続ストレージやダイレクト接続ストレージを含めて、ストレージのきわめて幅広い選択肢をサポートする。ほぼすべての製品はWindowsをサポートするものの、LinuxとUnixのサポートは弱いので、ホスト型レプリケーション製品を選択するときには、プラットフォームのサポートが重要な評価基準の1つになる。

ホスト型の欠点は、サーバに新たな処理のオーバーヘッドがかかること、およびインストールされたレプリケーションソフトウェアが想定されない動作を招くことがある、ということである。「重要な役割を担うハイエンドサーバについては、ITマネージャーはホスト型レプリケーションよりもストレージ型を好む傾向があります。なぜなら、ストレージ型はサーバリソースをそのアプリケーション専用の状態にして、アプリケーションをレプリケーションソフトウェアに内在しうる、バグや欠陥にさらさないからです」米国マサチューセッツ州ミルフォードのエンタープライズ・ストラテジー・グループのアナリスト、ローレン・ホワイトハウス氏はこう述べる。さらに、ライセンス費用とシステム管理業務がサーバ数に比例して増えていくので、サーバ数の多い環境ではストレージ型やネットワーク型の方が有利である。また、ホスト型レプリケーションの可視性はおおむねソースとターゲットのサーバだけに限定される。これはストレージ型やネットワーク型の中央管理アーキテクチャがレプリケーションインフラを全体的に把握できるのとは大きく異なる点である。

ホスト型レプリケーションのターゲット市場は主に高価なレプリケーションを導入する資金のない中小企業である。ホスト型の登場により、数年前までは大企業にしかなかったデータ保護とディザスタリカバリのアーキテクチャを中小企業が持てるようになった。CA、Double-Take、InMage Systems、Neverfail、SteelEye Technologyなどは、中小企業にレプリケーションベースのDRとデータ保護を、ストレージ型やネットワーク型のレプリケーションに比べればほんのわずかの費用での提供を可能にしたベンダーである。基本的にこれらの製品はデータをある場所から別の場所にレプリケーションするものだが、その効率、帯域使用量、管理、ハイアベイラビリティ・フェイルオーバー機能、プラットフォームのサポート、アプリケーションの統合などの点で差がある。どの製品が環境にもっとも合うかは、綿密な評価をしなければ分からない。

スタンドアロンの製品とは別に、バックアップソフトウェアのベンダーはホスト型レプリケーションのバックアップスイートへの融合を進めており、実益のあるリモート・ブランチ・オフィスのデータ保護市場に参入しようとしている。

「DRとデータ保護は融合し、レプリケーションはスタンドアロンの製品ではなく、機能の1つと見なされるようになるでしょう」と言うのはシマンテックのデータプロテクショングループ・プロダクトマーケティング・シニアディレクターのマーティ・ワード氏である。今やバックアップソフトウェアベンダーのほとんどはバックアップスイートにホスト型レプリケーションのオプションを付けている。例を挙げれば、バックボーン・ソフトウエアのNetVault: Real-Time Data Protector、コムボルトのContinuous Data Replicator(CDR)、EMCのRepliStor、シマンテックのBackup Exec Continuous Protection Server(CPS)、スタンドアロンの製品およびNetBackupのオプションのどちらでも利用できるシマンテックの重複排除機能付きNetBackup PureDiskなどである。

既存のバックアップとレプリケーションを融合することのメリットは主に、レプリカとバックアップを同じツールで管理できるという点だ。ホスト型レプリケーションオプションは別として、バックアップソフトウェアベンダーは、顧客が同じツールでレプリカとバックアップを管理できるよう、自社のバックアップスイートを大手のストレージとネットワーク型レプリケーションと統合する作業を進めている。

コムボルトのプロダクトマーケティング・バイスプレジデントのブライアン・ブロックウェイ氏は「Continuous Data Replicatorと同じく、サポートするストレージのストレージ型レプリカはバックアップアプリケーションのインデックスとカタログと統合されているので、ユーザは当社のアプリケーションで右クリックするだけでストレージ型スナップショットをリストアできます。」シマンテックのVeritas NetBackupも40以上のストレージと仮想テープライブラリを統合しており、EMCのNetWorkerはEMCのRecoverPointネットワーク型レプリケーション製品と強固に統合することができる。



データレプリケーションソリューションの選択


1. データレプリケーション手段を選ぶには、まずビジネスインパクト分析を行って目標復旧時間(RTO)と目標復旧時点(RPO)を決める。

2. データ損失をどうしても避けなければ(RTOがゼロでなければ)ならないアプリケーションには、同期型レプリケーションが必要である。アプリケーションのI/O性能を引き下げる同期型レプリケーションのレイテンシに注意しよう。レイテンシや帯域が不安定になるリスクがある場合、または距離が一定(50km~300km)以上離れている場合は、非同期レプリケーションにした方がよい。

3. レプリケーションのモードとは別に、アプリケーション性能がレプリケーションプラットフォームの影響を受ける場合がある。ホスト型レプリケーションは貴重なプロセッサ、メモリ、およびI/Oのリソースをアプリケーションと奪い合う。

4. 必要帯域、帯域コストへの影響、およびデータレプリケーションが他のアプリケーションやユーザに与える影響をはっきりと理解しよう。圧縮、帯域制限、時間別使用帯域設定など、帯域に関わるレプリケーションの機能を知り、うまく利用しよう。帯域の節約のために広域ネットワーク(WAN)最適化機器を検討するのも良い。

5. 異種混在環境をサポートするレプリケーション製品は、高価でない、またはレガシーのストレージをサポートするので、コストを大きく削減できるかもしれない。ベンダー依存も減らすことができる。

6. ストレージ型レプリケーションのベンダー依存の欠点は、レプリケーションとストレージプラットフォームの強固な統合と容易なサポートで相殺できる。また、複数のベンダーの設定が問題の原因になるリスクをなくすことができる。



ネットワーク型レプリケーション
ネットワーク型レプリケーションでは、レプリケーションはストレージとサーバを結ぶネットワーク上で行われる。I/Oはインライン型アプライアンスかファイバチャネル(FC)ファブリックで分割される。I/Oスプリッタは着信する書込I/Oの宛先アドレスを見て、それがレプリケーションボリュームの一部である場合は、I/Oのコピーをレプリケーションターゲットに転送する。ネットワーク型レプリケーションはストレージ型とホスト型の長所を併せ持っている。レプリケーションの負荷をサーバとストレージにかけず、多数のサーバプラットフォームやストレージにまたがって動作するので、異機種混在度の高い環境には理想的である。ネットワーク型レプリケーション製品のほとんどはストレージ仮想化機能をオプションかコア製品の一部として持っている。

現在のネットワーク型レプリケーションはインライン型アプライアンスまたはファブリックをベースにしている。インライン型アプライアンスでは、すべてのI/Oがレプリケーションデバイスを通過する必要がある。技術的には、アプライアンスは着信するI/Oをすべて終わらせて新しいI/Oを開始し、一次ストレージに転送する。書込I/Oの場合はレプリケーションのストレージターゲットに転送する。インライン方式は性能とスケーラビリティに問題がある。インライン方式の申し子はIBMのSAN Volume Controller(SVC)である。

アーキテクチャをスケーラブルにして、豊富なキャッシュを用意することで、その性能とスケーラビリティの制約の課題は克服されてきた。それに加えて、複雑なファブリック方式の実装と比べてインラインアプライアンスが単純であることが一因となり、ネットワーク型レプリケーションと仮想化の市場で成功した製品の1つとなった。

ファブリック型のレプリケーションは、I/Oの分割と転送がFCファブリック内で実行される。FCスイッチングを利用し、データと制御経路を分割することで、性能とスケーラビリティが最も優れた方式である。ファブリック型レプリケーション製品はブロケードコミュニケーションズシステムズとシスコシステムズのインテリジェントスイッチが主流である。ブロケードとシスコは両方ともローカルデータセンターレプリケーションとしてData Mobility Manager(DMM)を提供しているが、EMCやファルコンストアソフトウエアなどのサードパーティベンダーがブロケードやシスコのインテリジェントスイッチ上で動作するファブリック型レプリケーションでもっと優れた製品をリリースしている。代表例はEMCのRecoverPointで、ファブリック型の非同期継続的データ保護(CDP)を提供し、アプリケーション統合度はホスト型のCDP製品と比肩しうる。メリットは明らかだが、ファブリック型レプリケーションの採用は進んでいない。「スイッチ型のレプリケーションと仮想化は宣伝ばかりが派手だったが、実際に使っている人もいて、これからもっと普及していくだろう」米国ミネソタ州スティルウォーターにあるストレージIOグループの創業者でありシニアアナリストのグレッグ・シュルツ氏はそう述べる。

LSIコーポレーションのStoreAge Storage Virtualization Manager(SVM)は、インライン型アプライアンスと高価なインテリジェントスイッチに依存するファブリック型製品の中間に位置する。LSIのData Path Moduleは、既存のファイバチャネルスイッチに差し込んでスイッチ型の転送を行うもので、インテリジェントスイッチが要らなくなる。これとSVMを組み合わせることで、IBMのSVCの単純さとパス分割アーキテクチャのスケーラビリティを両立させることができる。HPは協力姿勢を見せているようで、LSIの製品をHP StorageWorks SAN Virtualization Services Platform(SVSP)としてリリースしている。これはホスト型とストレージ型のレプリケーション製品をネットワーク型レプリケーションと仮想化製品で補完するためのものである。

ストレージ型、ホスト型、ネットワーク型の市場シェアは時とともに変化していくだろう。しかし、どの方式にも適所がある。どれにもそれぞれ長所と短所があり、具体的な環境と状況から、どこでレプリケーションされるのがいちばん良いか決まるだろう。

略歴:Jacob Gsoedlはフリーランスのライターで業務システムの取締役。メールアドレスはjgsoedl@yahoo.com



STORAGE MAGAZINE4月号

All Rights Reserved, Copyright 2000 - 2009, TechTarget
*この翻訳記事の翻訳著作権はJDSFが所有しています。 このページに掲載されている記事・写真・図表などの無断転載を禁じます。