ールマガジン掲載記事

重複排除時代のディザスタリカバリ対策

著者:Lauren Whitehouse
Storage Magazine 2009年6月号より

 

データ重複排除機能がセカンダリストレージに導入されるなら、大きな利点が生まれる。データセットのサイズを縮小でき、より低い帯域幅でもレプリケーションが可能になることだ。

ストレージのプロであれば、「保護までの時間」(time to protection)という言葉にはなじみがあるだろう。保護までの時間とは、バックアップの開始から、バックアップコピーがディザスタリカバリ(DR)のためにオフサイトの場所に到着するまでの間に必要な全作業のプロセス完了に要する時間のことだ。テープベースのDRスキームの場合は、バックアップを実行し、オフサイト用のテープコピーを用意し、そのテープコピーをリモートの場所に移送するのに要する時間がこれに含まれる。

ディスクベースのDRストラテジーの場合は、ディスクにバックアップして、レプリケーションを通じてオフサイトにデータを移動するのにかかる時間がこれにあたるだろう。この場合、保護までの時間は、転送するデータの量と利用可能な帯域幅に左右される。セカンダリストレージにデータ重複排除技術を導入する大きな利点の1つは、データセットのサイズを縮小でき、比較的低い帯域幅でもレプリケーションが可能になることだ。これによって、データの外部保管の自動化にかかる時間を短縮し、コストも削減できる。

重複排除技術が有用であることはわかったが、この技術になにか不都合な面があるのだろうか。たとえば、重複データを特定して排除するプロセスを追加することで、バックアップの開始からレプリケーションの開始までのパフォーマンスに影響が生じる可能性がある。バックアッププロセス中に(インラインで、データがディスクに書き込まれる前に)重複排除処理を実行すれば、バックアップのパフォーマンスに影響が生じるおそれがあり、一方バックアッププロセス完了後に(ポストプロセスで)重複排除処理を実行すれば、レプリケーションが遅れてしまうおそれがある。

DR対策への道
リカバリという観点からいうと、その過程の中で重視するべき2つの時点がある。ローカルでの保護、つまり運用のリカバリのために稼働中のデータがオンサイトにコピーされる時点と、DRのためにオフサイトにコピーが置かれる時点がある。

Data Domain , Hewlett-Packard(HP)(StorageWorks D2D Backup System)、IBM (Diligent)、NECの製品などは、インライン重複排除機能を備えたシステムであり、データがディスクに到達したらすぐにレプリケーションを開始するよう効率を向上させ、保護までの時間を短縮する。他方、ポストプロセス方式では異なるアプローチをとっている。ExaGird Systems、FalconStor Software、HP(Virtual Library System)、Sepatonといったベンダーは、ディスクへのバックアップをワイヤスピードで完了させることがより重要であり、バックアップウィンドウ外で重複排除処理を開始することにより、バックアップについてはより高いレベルのSLA(Service Level Agreement)を保証できる、と主張している。レプリケーションの開始時点はベンダーによってさまざまであり、数分以内に開始するところもあれば、もっと間をおいて開始するところもある。

EMCとQuantumの製品では、重複排除処理のタイミングを管理者が決定できるため、両社はインライン方式とポストプロセス方式の両方に該当することになる。選択が可能であることにより、特定のバックアップワークロードに適用される方法を設定できるようになっている。それぞれのアプローチを柔軟に選択できるのは有効なことである。たとえば、重複データが多量に発生すると予想されるワークロードには、インライン重複排除処理を選択することが考えられる。他方ワークロードに新しいデータが多い場合や、バックアップウィンドウが短い場合などには、ポストプロセスの方が適しているかもしれない。

そのほかにもう1点考慮すべき事項は、「リカバリまでの時間」(time to recovery)だ。リカバリまでの時間とはつまり、データがセカンダリサイトにコピーされた後、重複排除処理後のDR用コピーからデータをリストアするのにどのくらいの時間が必要か、またどのくらい迅速にデータを読み取り、アプリケーションを使用可能な状態にまで再構築することができるか、ということだ。ベンダーによっては、これを想定して特に重複排除処理前のフルバックアップイメージを保持するところもある。このアプローチは、より迅速なリカバリを実現するのに役立つが、追加のストレージ容量が必要になるだろう。

プロセスの高速化
シマンテックのVeritas NetBackup 6.5のユーザにとっては、Symantec OpenStorage(OST)オプションが役に立つかもしれない。Veritas NetBackup OSTをOST対応重複排除ストレージシステム(現時点でData Domain ,Falconstor、Quantumが認定済み)と組み合わせて使用すると、複製バックアップイメージの作成と管理、別サイトへのバックアップコピーの移送、および長期保存のためのテープベースのコピーの一括作成に伴う課題の多くを解消できる。ベンダーのデバイスのOSTインターフェースディスクストレージユニットに書き込まれたバックアップデータは、引き続きVeritas NetBackupで認識、管理される。同製品の「重複排除の最適化」技術により、セカンダリサイトに保存されるレプリカを作成する際のパフォーマンスが向上する。たとえば、最初にOSTインターフェースの認定を受けたベンダーであるDataDomainには、OST環境におけるレプリケーションパフォーマンスを75%以上向上させた実績がある。

データ重複排除機能を使い、ストレージ容量を最適化することでのビジネス上の利点は、十分に認識されている。しかしそれだけでなく、その技術は、いったんディザスタリカバリの事態が現実に起これば、その高い効率を有効に発揮させることができる。重複排除機能への投資を決定する際には、ローカル重複排除処理とオンサイトでの運用リカバリという点で製品を吟味することに加え、オフサイトでのDR対策からみた有効性も追求することが賢明であろう。

著者プロフィール:ローレン・ホワイトハウスは、米国マサチューセッツ州ミルフォードのエンタープライズ・ストラテジー・グループのアナリストで、専門分野はバックアップおよびリカバリのソフトウェアとレプリケーションソリューション。

STORAGE MAGAZINE4月号

All Rights Reserved, Copyright 2000 - 2009, TechTarget
*この翻訳記事の翻訳著作権はJDSFが所有しています。 このページに掲載されている記事・写真・図表などの無断転載を禁じます。