鍵を握るアーカイブシステム(前編)


Jon William Toigo
Storage Magazine 2014年5月号より

データのアーカイブは、今日の環境において今までに無いほど重要になっている。アーカイブシステムは、確実かつ適切にデータを保存し、ストレージシステムのスペースを節約し、さらにはバックアップの負荷を軽減してくれる。

 

今日、データストレージ容量の増加率が未曾有の勢いで加速することを予測していない業界アナリストを探すとなったら、相当苦労するだろう。ビッグデータプロジェクトや仮想サーバーのフェールオーバー戦略を支える無制限のデータレプリケーション、ますますリッチに(そして大きく)なるデジタルメディアの保存の必要性、数十年あるいはそれ以上の期間のデータ保存を必要とする純粋に法的な要請、理由は何であっても、ストレージ容量への欲望は果てしない。

残念ながら、ITの予算はそうではない。

ここ数年、ストレージアレイの購入はITハードウェア支出全体に占める割合を増やしてきた。典型的なITハードウェア年間予算の33%から77%の間であり、この比率は依頼する業界コンサルタントによって変わってくる。しかし、この容量増加の総攻撃に対しITの塹壕の中で作業している者たちにとっては、自分たちがどんなに頑張っても、所詮はタイタニック号の甲板でデッキチェアを並び変えているようなものだという感覚が付きまとう。ほとんど管理されていないストレージ基盤を横切って、管理されていないデータを正しい場所にご案内しようとしても、管理されていないデータが余りにも多すぎる。データの災害は容易に視覚化できる、などと言っている場合ではない。それは「起こりうること」の範疇にゆうに入っていて、ひょっとすると、もはや起こりかけているのかもしれないのだ。

 

大容量ディスクは解決策ではない

データ増加の課題とは、単なる容量割当の事だと言うベンダーもいくつかあるようだが、実はそれだけではない。少し前まで、ストレージ業界はおよそ18ヶ月毎にディスク容量を倍にする一方で、ディスクドライブのギガバイトあたりのコストを毎年50%削減していた。しかし、この傾向はこの1~2年で大幅にスローダウンした。ひとつには、業界が半導体(フラッシュ)ストレージを売り込みたいと思ったからであり、もう一つの理由は現状のディスク生産ラインに使われてきた容量増加手法を阻む重大な技術的、経済的ハードルが現れてきたからだ。ここ数年、我々は熱アシスト磁気記録(HAMR: Heat-Assisted Magnetic Recording)、ビットパターンメディア(BPM: Bit-PatternedMedia)、超音波アシスト磁気記録方式(AAMR: Acoustically Assisted Magnetic Recording)などの劇的にドライブ容量を増やす技術を耳にしてきた。しかし、これらはまだ商用のディスクドライブに実装されるまでには至っていない。最新の容量についての改良は、ドライブケースにヘリウムガスを充填し、プラッター数を増やして6TBを実現したものだったが、世間の反応は冷ややかだった。

ディスク容量拡張の勢いが弱まるにつれ、従来と同じ大きさのディスクスペースに、データを小さくして詰め込むソフトウェアツールが、当然だが、たくさん出てきた。ツールには、インライン圧縮や様々なタイプのデータ重複排除などがデータを小さくする手法として使われている。しかし、これらストレージアプライアンス上の高価な機能は、急増する容量への要求の前では、小手先の解決策にしかなっていない。多くの人が同意するように、データ増加によって起きている問題は、付加価値型のソリューションによって、物語の最後の最後でヒーローが登場してめでたしめでたしと解決することにはならないだろう。

データ増加に立ち向かうためには、我々は容量割当の効率改善よりも容量使用の効率化にもっと目を向けなければならない。我々は適切なデータを適切なストレージ媒体に配置しなければならない。このことが意味するのは、再参照の頻度が高いデータは、半導体やエンタープライズクラスのディスクのような高速の(そして通常高価な)媒体に保存され、頻度が低いデータは、廉価な大容量ディスクかさらに廉価なテープに配置される、ということだ。
これを効率的に行うためにデータセンターでは古い考え方をもう一度見直す必要がある。それが、アーカイブ、だ。

 

アーカイブのイメージの埃を払う

データアーカイブは今日、いくつかの難題を抱えている。そのひとつは、非常に多くの場合アーカイブが、バックアップや階層ストレージ管理のような難解な習慣であり、ITの敏捷性やダイナミズムに貢献する革新的プロジェクトにはそぐわない煩雑な仕事という見方をされることだ。

この見方にも一理はある。アーカイブは通常、サードパーティソフトウエアによって実行されるメンテナンス処理のひとつなのだ。サードパーティーソフトは一定の期間内に、保管期間や移行ポリシーに基づき、データをあるタイプのストレージから別のタイプのストレージへと移動させる。最終的に、大概のデータは、テープ、光系メディア、大容量ディスクなどのコールドストレージに向かい、そこで媒体そのものがゴミになるまでほとんどアクセスされることもなく保管される。

ITのオペレーターは、このようなデータの置き換えを、本番環境のディスクのスペースを確保するために不活発なデータを移していると考えているが、通常アーカイブには、それ以外にも知的データの保存や法令順守など、れっきとした理由のある業務が存在する。とはいえ、一旦アーカイブされてしまうと、そのデータは日々の業務にとって何の価値もない、という多くのITオペレーターが持っているイメージを払拭するのは難しい。

結論:データのアーカイブは、ごみ出しのようなもの。必要な仕事だが心が躍るたぐいのものではない。

 

アーカイブの導入は一歩ずつ

これらの負のイメージに加えて、アーカイブで往々にして大変なのは、その導入である。アーカイブを正しく行うには、データ移行のソフトウェアを購入する以外に沢山の事を行わなければならない。データのアーカイブで骨が折れるのは、移行のための準備作業だ。データを分析、分類し、実際の環境でのデータアクセス状況を監視してデータをいつ移行すべきか決めなければならない。

データの分類以外にも、ストレージプラットフォームも、パフォーマンス、容量、アクセス速度、コストなどの基準に基づいて、分析、分類する必要がある。この分析はITプランナーが、データ移行で使用するストレージの番付表を作成するのに役立つ。

時間が経つにつれて、一般的にデータは高速ディスクから(低速)大容量ディスクへと移され、次に長期保管用のテープや光メディアに移される。しかし、アナリストによれば、現在の厳しい経済状況にもかかわらず、ディスクは長期あるいはアーカイブのもっとも深い階層のプラットフォームとしての役割を負っているという。最近、コネチカット州スタンフォードに本社を置くガートナー社は、エンタープライズ情報アーカイブ市場を表したMagic Quadrant(訳註:ガートナー社が使用しているグラフ)を作成した。そこではアーカイブのプラットフォームとして重複排除機能つきディスクアレイが描かれている。2つの技術、ディスクと重複排除は、保守的なアーカイブ管理者が最も忌み嫌うものだ。

データとストレージターゲットの分類が終わると、次に来るのが、ポリシーに基づいたデータ移行のためのストレージ基盤の設定作業だ。これは通常、ベンダーのサーバーアプライアンスにつけられることが多いアーカイブソフトウェアの役割である。CommVault、IBM、Symantecやその他のベンダーがアーカイブ機能を含めたデータ管理ソフトウェアを出している。しかし、これらの製品を使うには、あなたのデータ資産をベンダー独自のデータ管理手法に委ねる覚悟が必要だ。

プランナーの中には、災害復旧データバックアップソフトウェアをアーカイブツールとして使う者もいる。バックアップソフトはデータの容れ物と容れ物に入ったデータの古さを示すタイムスタンプを提供してくれるからだ。とはいえ、このような手法は痛烈な批判を受けている。バックアップはアーカイブとは随分違っている。特に顕著なのは、粒度別にデータを選択し提示する最も重要な部分、データ分類を中心としたポリシーとトリガー(データを基盤のあちこちに移動するきっかけとなる事象)のサポートだ。この違いがいかに重要かは以下のようなケースが起こって初めて思い知らされることになる。法的データ開示手続きの一環としてアーカイブが効率的にアクセスされ、使われなければならない時や、事業活動の履歴調査を支援しなければならない時、などである。

その一方で、より簡易でよりオープンな長期間データアーカイブ手法の模索も続いている。住宅金融業、メディア&エンターテイメント(M&E)、ヘルスケア・イメージング、さらには、いくつかの政府研究プロジェクトが、アーカイブの定義と処理を改良していく「実験室」となってきた。大半の企業において、プランナーがアーカイブ機能として求めているのは、バックグラウンドで稼働し、自動でメンテナンスを行い、定期的にステータスレポートができる「ファイアー・アンド・フォーゲット(自動追尾機能)」処理だ。しかし、データそのものが飯のタネであるような業界では、アーカイブは、変更がかからないながらも生きているデータに対して、低コストでリードに最適化したプラットフォームを提供する、より重要な役割を担ってきた。

アーカイブ技術が実際に進歩を遂げたのは、ビデオやオーディオのポストプロダクションの現場、作品をデジタル情報で保存している放送局などのデータ資産保存のるつぼにおいてだ。このような進歩には、アーカイブストレージ用メディアの改善と多様化、将来にわたって使えるデータフォーマット、従来とは異なるアーカイブ運用の策定などが含まれる。

 

著者略歴:Jon William ToigoはIT歴30年のベテラン。Toigo Partners InternationalのCEO兼主要執行役員、Data Management Instituteの会長でもある。

 

 

Copyright 2000 - 2014, TechTarget. All Rights Reserved,

*この翻訳記事の翻訳著作権はJDSFが所有しています。
このページに掲載されている記事・写真・図表などの無断転載を禁じます。