JEITA連載寄稿

JEITAテープストレージ専門委員会コラム
2011年のデジタルデータ量は1.8ZBに!
−増大し続けるデジタルデータとアーカイブの必然性−

今年6月にIDCから発行されたレポートによると、今後デジタルデータは2年ごとに2倍のスピードで増加し続け、2011年内に生成されるデジタルデータの総量は1.8ZBに達すると予測されている。これをどのように保管、管理するか、非常に頭の痛い問題である。

 

 

2011年のデジタルデータ量は1.8ZBに!

 

あまり見慣れないこの単位、ZB = Zetta BytesとはExa Bytesの1,000倍、つまりPeta Bytesの1,000,000倍、更にいうならGBの1,000,000,000,000倍である。 ここまでくるとゼロの一つや二つ足りなくてもいいんじゃないかと思うような、「もういっぱい!」の世界である。 Exa Bytesですらあまり聞くことは無かったのにその更に上の単位まで目にする機会が多くなってきたのだ。

データの出所はIDC。 2007年から始まった IDC Digital Universeの調査は現在毎年行われ、今年の6月に発行されたレポートでは、全世界のデジタルデータの総量は2年ごとに2倍のペースで増加し、2011年に生成または複製されるデータ量は1.8 ZBに達すると予測している。尚、このペースはムーアの法則のペースよりも速い。 以下、それ以外の要点を列記する。

次の10年間で

• サーバーの数(仮想サーバー含む)は10倍になる
• エンタープライズデータセンターで管理されるデータ量は50倍以上、ファイル数は75倍以上になる
• 一方、このようなデータを取り扱うITの専門家の増加は1.5倍以下に留まる
• 一つの1MBのメールを4人に送ると50MBのデータが生成される*1
• データの90%が非構造化データになる

データは増え続けるが管理コストはかけられない。つまり管理の容易な「自動化」がキーワードとなる。もちろん管理コストのプレッシャーはクラウドなどのサービスを利用するきっかけともなる。

 

 

90%が非構造化データ!?

 

このレポートで興味深いのは今後の10年間で生成されるデータの90%が非構造化データになると予測している点である。YouTube、Facebook、Twitterなどの急拡大と、デジタルネイティブと呼ばれる人々が今後も増え続ける世の中では意外な数字でもないかもしれないが、やはりインパクトのある数字である。これらのほとんどが企業とかで生成される業務系のデータではなく、ビデオ、写真、メール、SNSなどの個人データになるのだろうがさてそれはどこに保管しておくのか?

これらのデータはほとんど公開されたデータであるためセキュリティ度が低い。つまりパブリッククラウドやホスティングサービス、コンテンツデポと呼ばれるようなところに安価に預けることになるのだろう。当然これらのプロバイダーは大量のデータを如何に安価に、ただし安全に保存、管理することに腐心することになる。いろいろな技術があるがもっともわかりやすいのがデータの階層化、アーカイブという概念の導入だろう。ホットデータとコールドデータなどという表現もあるようにあまり使わないデータは低コストのアーカイブの箱に入れておくということだ。

 

 

LTOの出荷予測は70%引き上げられた!

 

安価という切り口ではデデュープ、シンプロビジョニングなどもあるが、やはりテープにはかなわない。コストの大半であるフロアコスト、電力コスト、空調コストを考慮すればなおさらである。さらに長期にデータを保管つまりアーカイブしようとすればその差は開く一方だ。今年6月に発行されたIDCのレポートでは、2011年から2014年のLTOドライブの出荷台数予測を、今年5月に発行したレポートの数字から70%上方修正された。その数字を引き上げたのはテープライブラリで特に500〜1000巻クラスの伸び率が高い。それはすなわち「自動化」された「安価」なストレージデバイスが要求されているということなのであろう。

 

 

*1: 一人に送るだけで4人分のデータが重複し、さらにそれらがバックアップされたりパイプラインで複製されたりというものも含む。



一般社団法人 電子情報技術産業協会(JEITA) テープストレージ専門委員会 (※)
日本ヒューレットパッカード(株) 井上 陽治
※:旧名称:磁気記録媒体標準化専門委員会