ソフトウェア・レプリケーションでハードウェアの鎖を断つ(後編)
著者:Chris Evans
Storage Magazine 2014年10月号より
レプリケーション・アプライアンス
専用のレプリケーション・アプライアンスを使えば、ストレージアレイ間のコピー作業を、別なハードウェア装置か物理または仮想のサーバー上で稼動するソフトウェアに肩代わりさせることができる。この方法の好例は、EMCのRecoverPoint(Kashya Inc.より買収)である。RecoverPointのソフトウェアは実際にデータパスの中に常駐し、個々のライトI/Oをキャプチャーし、そのデータをリモートコピーに適用されるリモートサイトの(稼動系と)同等のアプライアンスに(ジャーナル処理によるローカル保護付で)コピーする。 この処理を使えば、ベンダーのアレイと違って、データ整合性を保ちつつ、データの出し入れをきわめて容易に管理でき、組み込み型アレイベース・レプリケーションの長所が全て使えるようになる。しかし、多くの問題は未解決のまま残る。特に、このソリューションでは、データが実質的にアレイレベルで移動するためデータ整合性に関連する部分が問題になる。
ハイパーバイザ内レプリケーション
レプリケーションに関連する従来のいくつかの機能を取り払ってみることは、データを管理しているアプリケーションにより近づく、ということを意味する。仮想システムにとって、そのアプリケーションとは、VMwareのvSphere や MicrosoftのHyper-Vなどのハイパーバイザを意味する。ハイパーバイザはデータの中身を理解している(最低限、それがVMだということは知っている)。ゆえに、ある地点から別な地点へ、データを非常に細かい粒度で(例えば、LUN全体ではなく、VM単位で)レプリケートすることについて、ハイパーバイザは有利な位置にいる。
VMwareもMicrosoftも、自社ハイパーバイザ内でのレプリケーション技術を提供している。VMware vSphere は、vCenter System Recovery Managerによって管理されるvSphere Replicationを用意している。Hyper-Vは、System Center Virtual Machine Manager (SCVMM)によって管理されるHyper-V Replica にレプリケーションを実装している。
もちろん、レプリケーションの作業は依然としてどこかで実行されなければならず、この場合その責任はハイパーバイザに押し戻され、ハイパーバイザはCPU、メモリー、ネットワークを必要に応じて増やすはめになる。また、これらのソリューションはタダではないので、ハイパーバイザをレプリケーションに使うことは、コストの増加も引き連れてくる。 レプリケーション・アプライアンスと同様、ハイパーバイザもあるデータをより廉価なストレージにコピーする、もしくは高価なアレイの全機能は要求されない、異なるベンダーのストレージにコピーする機能を提供する。とはいえ、プライマリー・アレイとターゲット・アレイの役割を分けないと、安価でパフォーマンスの低いストレージにレプリケートしても全く節約にならないこともありうる。(例えば、レプリケートしていないテストデータは、災害時に無くなるだけだ)
VM内レプリケーション
ハイパーバイザの機能を使わずにレプリケーションを実行するもう一つの選択肢は、VMの使用だ。これは二通りの方法で実現できる。ひとつめは、いくつかのソリューションが使っている方法で、一つのVMに複数の仮想マシンからのデータをキャプチャーさせる。もうひとつの方法では、レプシケーションアプリが、外部または直付けのストレージに実際にデータが保存される際、代理(プロキシー)データ保存先の役割をVMに与えている。「データ保存仮想マシン」は、全てのI/Oトラフィックを監視するため、ローカルストレージにコミットするのと同様に書き込みI/Oを他の場所へと複製(レプリケート)することができる。
Zerto Inc,のReplication for VMware 等の製品は、VMware APIを使って書き込みI/Oの監視とキャプチャーを行い、Zerto社がVirtual Replication Appliances(VRAs)と呼ぶソースとターゲットのホスト上の仮想アプライアンスを使ってデータを他の場所へとレプリケートする。Atlantis Computing Inc.のILIO USXは、どんなタイプのストレージでも、VMのストレージ・リソースとしてプールする機能を持ち、高い可用性を確保するために、システム間でデータをレプリケートできる。
VMベースのレプリケーションは、ハイパーバイザのリソースを消費するため、当然ながらクラスターに仮想マシンが追加された際には、注意深く監視する必要がある。また、レプリケートしているVMがレプリケーション要求についていけるように、優先順位をつけることも必要だ。
LVMでのレプリケーション
ロジカル・ボリューム・マネージャー(LVM)は、物理的ストレージ・リソースとLUNおよびボリュームの形で表される論理データの中間に位置する。LVMは、ホストと物理ストレージ間の全I/Oを監視する完璧な場所を示している。Data CoreのSANsymphony-VやStarWind Software Inc.のVirtual SANは物理ストレージ・リソースから論理ボリュームを抽出する仕組みを実装し、そこに同期ミラーリングや、非同期レプリケーション、準継続的データ保護などの先進的機能を付加している。これらのソリューションは、ストレージ構築、設計にさらに複雑さを加えることになるが、それくらいは様々な先進的機能を得るためには、許容の範囲内かもしれない。
新しいソリューション
もちろん、たかだかここ10年の技術であるポイント・ツー・ポイントのレプリケーションの使用について、懐疑的な考えをする人たちもいる。オブジェクトストレージのベンダーは、単純なミラーリングや消失訂正符号(前方エラー訂正としても知られる)などのデータ分析技術を使って、データ保護を実装している。消失訂正符号のアルゴリズムは、複数の冗長化したデータの断片を地理的に分散させ、それらの断片の一部だけからデータの復旧を可能にする。データ保護とレプリケーションは効率的に、リードおよびライト処理に組み込まれている。
(機能は優れているものの)パフォーマンスの低さが、これまでのソリューションの欠点として目立っていたかも知れない。しかし、Scality Inc.やCleversafe Inc.は、パフォーマンス向上のためにフラッシュを自社製のarchitectureに組み込んでいる(どちらの製品もソフトウェアのみで供給可能だ)。Cephのようなオープンソースプロジェクトは、ミラーリング(データ・レプリカ)や消失訂正符号を使ってブロック、ファイル、オブジェクトデータを保存することができる分散データストアを構築中だ。この技術はまだ歴史が浅いが、Inktank(Cephの開発とサポートを行う会社)がRed Hat Inc.に買収された今、数年内にこの製品が著しい成長を遂げる事が期待できそうだ。
クラウド
最後になったが、プライベートおよびパブリッククラウド基盤の使用が増えていることは認めざるを得ないだろう。ソフトウェアベースのレプリケーションは、アレイベースのレプリケーションで出来そうなことより、もっと現実的な方法でデータをクラウド基盤から出し入れできる可能性を持っている。帯域によっては全VMの移動は現実的ではないかも知れないが、ソフトウェアベースのソリューションはプライベートおよびパブリッククラウド環境でのデータ移動に対して最大限の柔軟性を提供してくれる。
いくつかのハードウェアベンダーは、クラウドサービスプロバイダーとともにコロケーションにハードウェアを置く、というソリューションを提供している。我々がソフトウェアベースのレプリケーションが支配する異機種混在の世界へ移ろうとしている時、これらのソリューションは短期的な解決策に過ぎない。
(完)
著者略歴:Chris Evansは独立系コンサルタント兼Langton Blueの設立メンバー。
Copyright 2000 - 2014, TechTarget. All Rights Reserved,
*この翻訳記事の翻訳著作権はJDSFが所有しています。
このページに掲載されている記事・写真・図表などの無断転載を禁じます。