JEITA磁気記録媒体標準化専門委員会コラム 「米国データセンタの最新事情 2」

現代のデータセンターではテープストレージはやはり欠かすことのできないものになりつつあるようです。今回の章では、データセンターのデータ保護に必要な要件を具体的に解説し、テープストレージに期待されている役割について説明したいと思います。

 
最近行われたInformation Weekの調査によると、328ユーザーのうち3/4が1TB以上のデータを管理していることがわかりました。かなりのデータ量ですよね。さて次に問題になるのは、これらのデータをどこに保管するかということです。以下その鍵となる3つの要素について説明していきたいと思います。


要素その1:低コストのストレージ
 
今後も増え続けるデータを単純に次から次へとディスクを増設して保存するのはあまり賢い方法とはいえません。なぜならそのような運用はコスト的に高くつくからです。
ここで重要なのは、コスト計算はハードウェアの購入コストだけでなく、消費電力、空調、さらにはデータセンターのフロア管理コスト、メンテナンスコストなども考慮する必要があるということです。
一般にアクセスされるデータの80%以上は作成されてから90日以内のものであると言われています。最近University of Santa Cruzにより実施された調査の結果ではNASに保存された90%以上のデータが二度とアクセスされていないこと、また6.5%のデータがたった1回しかアクセスされていないといったことが明らかになりました。
それにもかかわらず法規制等さまざまな理由からこれらのデータも長期的に保管しなくてはならないのですが、それらを全てディスクに保管するのではコストがかかりすぎます。その結果として出てきた概念がtiered storage architectures(階層ストレージ構成)という考え方です。簡単に言えば頻繁にアクセスされるデータはアクセス時間の短いデバイスに(数秒程度)、そうでないものはアーカイブデータとしてテープのような低コストのデバイスに保存するということです。
容量コストは一般的に代表的なテープ媒体であるLTO4カートリッジでGbyteあたり8セント(約8円)とかなり安いのですが、電力コストを含むTCO(total cost of ownership)で考えた場合、その差はさらに大きくなります。なぜならばシステムディスクの場合、データアクセスがあると無いとに関わらず常時ディスクを回転させる必要がありますが、テープの場合はデータの保存時と読み出し時以外はテープカートリッジはライブラリの中に保管されているだけなので、余計な電力は必要ないのです。
データアーカイブの運用方法の調査としてはClipper Groupの調査レポートが有名ですが、ここではtiered storage architectureを採用しているデータセンターでの5年間のデータ保管運用方法について、ディスクのみの運用(D2D)とディスクとテープのハイブリッド(D2D2T)運用の比較をハードウェアとメディアの購入コスト、さらには電力とデータセンターのフロア面積を考慮して行っています。
Clipper Groupの試算の結果、データアーカイブにかかる購入費用は、ディスク(SATA)のみでのシステム構成場合は、テープを組み合わせた場合に比べて23倍以上もコスト高になるとの結果が出ました。さらにこれに電力コスト等を考慮すると、なんと290倍もの開きが発生するという結果も出ています。


要素その2:複数階層のデータ保護

データ保護は異なる複数の壊滅的なデータ損失のリスクを、どれだけ緩和できるかということに尽きます。 それらはハードウェアかもしれませんし、人為的なミスかもしれません。さらにはソフトウェアの問題、盗難、コンピュータウイルス、自然災害といずれもひとつのテクノロジーで補えるものではありません。
ちなみに上記はPepperdine大学のDr David M Smith氏の調査結果での順番で、ハードウェアが40%に対して人為的ミスが29%とかなり多く、以下13%、9%、6%、3%という割合です。 オフライン、オフサイト保管できるテープは人為的ミス、盗難、コンピュータウイルス、自然災害といった要因に対して強さを発揮できると言えるでしょう。 以下はより安全なデータ保護を行う上で必要な3つの項目です。


1.複数階層でのデータ保護
 
理想的には3つのコピーを異なる場所に保管することが推奨されています。またそのうち1つは地震とか洪水といった災害に対する復旧用に、遠隔地にデータを保管することが必要です。


2.最低でも1つのオフラインコピーを作る

これはシステムの分離を実現するためのもので、コンピュータウイルス、意図的な破壊工作、人為的なミスといったリスクからデータを保護するのに有効です。


3.アクセスの無いデータの保護

「情報漏洩」という言葉は最近良く耳にしますが、これがおきた時は単純にデータの紛失にとどまらず、社会的信用度の失墜、訴訟等により会社の存続に関わる事態に発展する可能性すらあります。
KPMGの調査結果によると、世界中で情報紛失の影響を受けた人々の人数は2008年の9200万人から2009年には1億9千万人にも跳ね上がっており、この流れはさらに加速すると見られています。 そのような背景から漏洩したデータを読めないようにする「暗号化」はデータセキュリティー戦略の最も重要な機能となってきています。
そのような中、LTO4テープドライブでは低コストでパフォーマンスに影響の無い暗号化機能を実現し注目を集めています。


要素その3:長期にわたるデータ保存性

いかなるアーカイブソリューションを選択する場合でも、保管メディアは十分なメディア寿命があるものを選択することが重要です。一般的にはテープメディアはディスクの4~6倍の寿命があるといわれています。JEITAでの加速テストでもLTOメディアは19年以上の保管寿命が確認されています。
またもうひとつ重要なことは、増加するデータ量に対して簡単にかつ低コストで容量が拡張できることです。テープライブラリの場合は単純にカートリッジを増やすことや、新しい世代のテープドライブに交換することで簡単に容量の拡張が可能です。もちろんテープメディアのコストパフォーマンスの高さは言うまでも無いことです。

 ここまで説明してきましたように、データセンターにおけるテープの役割は以下のように変わりつつあります。

リカバリー時間に余裕がある運用でのバックアップ
古いデータ(アーカイブ)のディスクベースバックアップからの移行
長期保管データの保存 法令順守のための高信頼性、低コストアーカイブ
システムからの分離、災害対策のためのオフサイト保管

 
テープ以外のテクノロジーで上記要件を満たせるものは現在のところ見つかっていません。それが今尚多くの米国企業がテープの開発、採用に投資を続けている証拠でもあるのです。 中小企業の多い日本でもストレージ統合の波は迫ってきています。データセンター先進国米国でのこのようなうねりが日本のIT産業に到来するのは意外と早いのかもしれません。





(社)電子情報技術産業協会(JEITA) テープストレージ専門委員会
日本ヒューレットパッカード(株) 井上 陽治