De-dupe機能の搭載製品のタイプにもいろいろあります。 まず、製品の提供形態です。
①アプライアンス型
②ソフトウェア型
アプライアンス型は多くのストレージベンダーが提供する製品の形で、De-dupeヘッドとストレージ部分がセットになったハードウェアとして提供されます。NASやVTLとしてシステムから利用されます。
ソフトウェア型はバックアップソフトウェア製品として提供され、汎用的なサーバ+ストレージにインストールして利用します。アプライアンスのDe-dupeエンジン部分をソフトウェアとしてOEM提供するメーカもあるため、それと区別する上ではバックアップツール型と呼んだ方が良いかもしれません。
De-dupe製品では、重複排除処理が行なわれる場所によって利用方法の向き、不向きがでてきます。
①ターゲット型
②ソース型
ターゲット型はデータを格納する側で重複排除する形式です。アプライアンス製品はほぼ全てこの形式で処理します。格納するためのデータの転送は既存のバックアップシステムを利用することが出来、組み込みやすいシステムといえます。
ソース型はデータを吸い上げる側で重複排除する形式です。ソフトウェア型製品で専用エージェントがソース側にインストールされます。このため、エージェント型ともいえるでしょう。ソース側となるサーバにエージェントの導入が必要となりますが、転送するデータ量を削減することが可能なため、遠隔サイトのWAN越しバックアップなどに有効に機能します。
重複排除処理がいつ実行されるかで区別すると次のようになります。
①インライン型
②ポストプロセス型
③ハイブリッド型
インライン型はデータの格納と同時にDe-dupe処理が行なわれるタイプです。De-dupe処理前のデータを一時的に保持する必要がなく、格納領域サイズが効率的に利用できますが、データ格納処理の負荷と同時にDe-dupe処理の負荷も考慮したシステム設計が必要です。
ポストプロセス型は、De-dupe前のデータを一度格納し、あとからDe-dupe処理するタイプです。
両方の機能を併せ持ったタイプをハイブリッド型と呼ぶことがあります。
De-dupe機能搭載製品の利用形態でも特徴があります。
①プライマリストレージ型
②ニアラインストレージ型
多くの製品がバックアップデータを格納することを目的としていますが、アプライアンス型の中にはプライマリストレージ用途のNASとして利用できる製品が提供されています。通常のNAS型De-dupe製品はIOPSが確保できないため、プライマリ用途をサポートしていません。
De-dupe製品は小さく格納することが出来るため、格納容量の効率化と帯域を圧迫しない転送が可能となります。さらに、ソース型De-dupe製品では定期的なフルバックアップが必要なくなり、バックアップ、リストア時間の短縮にも貢献します。
①リモートオフィスのWAN越しバックアップ
②プライマリデータ領域の効率化
③バックアップデータ領域の効率化
④DRサイトへのWAN越しデータ転送
恋塚正隆の連載コラムITアーキテクトのひとりごと
恋塚正隆の連載コラムストレージガバナンスとは
恋塚正隆の連載コラムクライアント・バックアップ
JEITA連載寄稿
「Storage Magazine」翻訳記事