JEITAテープストレージ専門委員会コラム
「アーカイブの定義について再考してみる」(その1)

 

 

10年前には聞きなれなかった言葉「アーカイブ」。当時はバックアップと何が違うのか分からない人も多かったと思うが、斯く言う私もその一人であった。アーカイブを辞書で調べると、「書庫」、「記録保管所」、「公文書」なかには「古文書」なんていう訳もある。いかにも古臭そうだ。当時は、もう使用価値のないもの、これは言い過ぎとしても、使われる頻度が極めて低いものというイメージがあったが、現在はその定義も過去のものになりつつある。 なんでも簡単に作成、複製、検索できるデジタル世代にとって、これからは、処理中、または未完成のデータつまりLiveデータ以外はすべて「アーカイブデータ」 と呼ばれるようになるのでは無いか?

 

人類最大の発明のひとつである「文字」が発明されるまでは、密教のように口伝え でデータをアーカイブし、文字が発明されてからは手書きで、更に15世紀のグーテンベルクの活版印刷機の登場で一気にデータの複製が容易になった。 そして現代コンピュータの発明とインターネットの普及により、ありとあらゆるものがデジタル化され、今はビッグデータの時代、さっきまで最新だった情報が既に過去のものであり陳腐化する、まさにこれはアーカイブなのでは無いか?

 

乱暴な見方をすれば、ロールバック用のスナップショットもアーカイブである。 つまり今後のデータは二極化、LiveデータとStaticデータつまり「アーカイブ」に集約されるというのが筆者の予想である。

 

さて、これだけ情報があふれてくると、従来のパラダイムは通用しない。企業内のデータでさえ、非構造化データが80%を占めるといわれている現在で、本来構造化データの処理に最適化されたITシステムは、あたらしい仕組み、つまり、分析、最適化、分散処理されるシステムに移行してきている。データの保管も従来の階層構造ではなく、フラットな構造が望ましいのでは無いのか? 電話交換機時代からインターネット時代になり、階層型からネットワーク型に変わってきたように。

 

このように、データ処理の仕方が根本的に変化しているわけだから、従来の常識的なアーカイブの手法も疑ってみる必要があるのでは無いだろうか? つまり今まで最適と考えられてきた、ポリシーベースのティアードストレージという概念の再検証である。

 

続きは次回



 一般社団法人 電子情報技術産業協会(JEITA) テープストレージ専門委員会 (※)
日本ヒューレットパッカード(株) 井上 陽治
※:旧名称:磁気記録媒体標準化専門委員会