JEITAテープストレージ専門委員会コラム
「データの冗長性はどこまで必要か? その2」
〜RAIDから分散ストレージへ〜

 

ハードディスクの黎明期、究極まで故障率の低減を目指していた日本にとって、 RAIDを発想した欧米企業のアプローチはまさに青天の霹靂ではなかったのではないかと思う。そのRAIDも長い時間を経て、より信頼性の高いRAID6まで発展してきてはいるが、その場合性能を求めるためにはより多くのディスクにストライピングすることが望ましい。 一方そのトレードオフとして復旧が複雑で、時間がかかり、結果的に性能が低下するというデメリットもある。特に最近のハイパースケール型のストレージへの要求は、従来のディスクアレイRAIDという概念ではもう追いつかないところまで来ているように感じられる。

 

このような問題を解決するために、RAIDに代わって注目を浴びているのは分散ファイルシステムである。これは低価格なディスクでクラスタリングするわけだが単純にコピーを3つも4つも作るわけであるから当然容量も単純に3倍4倍になるわけで、非常に容量効率が悪いという難点がある。データ容量が指数関数的に増えつつある現在ではなおさら気になる。そこで最近開発されたのが、この分散ファイルシステム上でRAIDのような機能を持たせる技術である。なんと4重障害にまでに対応し、容量のオーバーヘッドはたったの40%である。

 

さてこれでデータの保護は完璧! と思いきや、実は大きな落とし穴がある。いくら冗長化してもオンラインデータはオペミスや、ソフトウェアバグに対しては、ほとんど無力であるということである。
良い例がGoogleのGmailの事件であろう。数万人から数十万人のメールデータが消失した原因はソフトウェアのバグであったため、当然複数あるはずのすべてのコピーデータも同時に消失した。Googleが信頼できるクラウド業者であることを証明したのは、彼らが消失したデータを、唯一オフラインで保管していたテープから復旧したとアナウンスしたことだろう。彼らはプロであり、データの複数サイトでのリプリケーションでは十分でないことが分かっていたのである。これを無償サービスであるGmailで行っていたところがまた心憎い。

 

最近報告された、あるセキュリティソフト会社のレポートでは、データのブリーチの原因のなんと1/3が人為的ミスであったそうだ。バグのないソフトウェア、ミスを一生しない人間など期待すること自体に無理があるわけであるから、彼らのアプローチは極めて合理的であるといえる。

 

まだまだクラウドの普及率も低く、玉石混淆の日本のクラウドサービス。ポテンシャルが高いだけに、ワールドクラスの質の高いデータ保護サービスを提供するクラウドプロバイダーが増えて欲しいものである。


一般社団法人 電子情報技術産業協会(JEITA) テープストレージ専門委員会
日本ヒューレットパッカード(株) 井上 陽治