JEITAテープストレージ専門委員会コラム
「コンピュータ用テープによるデジタルデータの長期保存のすすめ
-日本写真学会主催 写真アーカイブセミナーでの講演より-」
デジタルデータの歴史はデジタルコンピュータの歴史と言っても過言ではない。そのデジタルコンピュータと共に記録メディアとして共に進歩を続けてきた磁気テープは大容量で長期保存に適したメディアとして現在も広く使われている。今回のコラムでは、先日11月1日から2日間開催された日本写真学会主催、写真アーカイブセミナーでの講演内容を紹介する。
歴史的に価値のある写真から、家族とのスナップショット、それぞれの価値の基準は様々だが大切な写真をできるだけそのままの状態で将来まで残したいという気持ちは誰にでもあるものである。 現在は銀塩写真からデジカメに、フィルムからビデオテープさらには半導体に記録するところまで進んだ画像のデジタル保存だが、進む高解像化、手軽にコストを気にせずに撮影することができる環境などの背景から、際限なく拡大するファイル数とその容量、これをどうやって長期に保存していくのかはあまり悠長に構えていられない大きな課題であろう。
実は後世に過去の資産をデジタル化して未来永劫残していこうという課題はIT産業の中でも大きな課題となっている。 そのためデジタルデータの取り扱いになれたIT産業の技術を用いて、あらゆるデジタルデータを保存していくというのは非常に理にかなっているのである。
ここからは、現在のIT業界で何が起こっているか、またそのなかで今後デジタルデータの長期保存(アーカイブ)の課題に対してどのように解決していこうとしているのかについて解説していこう。
• デジタルデータの氾濫 - ビッグデータ時代の到来
もはや流行語大賞にでもなりそうなこのフレーズ、ビッグデータは拡大し続けてしているスマートフォン、SNS、YouTubeやセンサー群からのデータを分析・利用することに焦点が当てられがちだが、まずその前提条件として拡大し続ける無秩序なデジタルデータをどこに格納して、どのように取り出し、どのように長期に保護していくのか、それ自体が大きな課題なのである。
以前のコラムでも説明したが2015年にはデジタルデータはゼッタバイトクラスにまで膨らむと予想されている。ゼッタバイト? 聞いたことが無い人のために分かりやすく説明すると、世界中の砂浜の砂の数ということらしい。 またまたわかりにくくなった......
ただし生成されるデジタルデータの多くは一時的なデータである。 簡単に分けると「期間限定」「半永久保存」、これらへの二極化が進む。
ここで取り上げる「半永久保存」データには、安全に半永久に保存できる仕組みづくりが必要で、階層管理、ポリシー管理というコンセプトが重要になってくるであろう。
また単に保管するだけでは意味が無いので、再利用を考えた、「検索性」「アクセス性」が高いアーカイブシステムが要求される。 もちろん「半永久」というのだからコストもかなり重要である。
• コンピュータ用テープメディアの活用
さて、デジタルデータの歴史はデジタルコンピュータの歴史という説明を最初にしたが、世界最初のコンピュータといわれているENIAC(1946年)から遅れること5年、1951年に製品化された世界最初のコンピュータテープ装置(UNIVAC-1付属)から現在まで約60年間テープはコンピュータ記録装置として活用されてきた。その実績もさることながら、近年では大容量データの長期アーカイブという分野での活用が注目されてきている。 その理由は以下の5点である。
1. 信頼性 | … | 60年の実績、メンテナンス性に優れる、加速試験で19年以上のライフ |
2. 大容量・コンパクト | … | LTO5カートリッジはVHSの半分サイズでHDビデオ50時間分、4MBの写真375,000枚を記録可能 |
3. 高速な転送速度 | … | LTO5の場合、2時間HDビデオを約6分で、4MBの写真を1分間に2100枚コピー可能 |
4. 低コスト | … | 容量あたりのコスト、消費電力は最少クラス。保管時電気代不要 |
5. 将来性 | … | 第8世代までのLTOロードマップ、テープのファイルシステム化によりいっそう使いやすく身近に |
• デジタルデータの長期保存という課題
まずデジタルデータを長期に保存したいというその目的を明確にする必要がある。その目的とはずばり「データの再利用」である。将来に亘ってデータを再利用可能にするためには、3つのステップが必要となる。
1. | データをデジタルデータ化する (デジタルデータ=コンピュータデータ) | |
2. | コンピュータが扱える形にしたデータを保存し続ける | |
3. | 保存してあるデジタルデータからもとのデータ・情報を再生する |
これらのステップが将来に亘って実行可能でなければならない。
つまり将来に亘りデータを再利用するには、最初のデジタルデータ化の段階でどのように保管するかを慎重に決める必要がある。ここをおろそかにすると後から後悔することになりかねないのである。 もちろんデータレート(解像度)なども重要であるが、デジタルデータは単なる0と1の数字の羅列なので、それを将来必要なときに解釈できるようにしておく必要がある。またタイムスタンプ、作成者、ファイルのフォーマットなどのメタデータには何が適切かというのも十分に考える必要がある。
「解釈できる」というのはたとえばロゼッタストーンなどが分かりやすい例だろう。ロゼッタストーンは世界最古の文字の書かれた石盤だと思っている人も少なくないかもしれないが、実際これだけ有名になったのはそれまで解釈ができていなかったヒエログリフの解読に役に立ったからである。 そこにはヒエログリフ(神聖文字)、デモティック(民衆文字)、コイネー(ギリシャ文字)の3種類の文字で同じ内容が記載されていたから「解釈できた」ということなのである。つまり後世でもデータの読み方が分かるようにする仕組みをデータと一緒に保管しておくことが重要なのである。
• 長期保存=マイグレーション+自動化
さて長期に保存すると一言に言ってもいくつかの手法がある。たとえば以下の3つの手法である。
1. | ミュージアム手法 … メディアはそのまま保存。システムもそのまま保存。記録当時のまま保存・保守を続ける。 | |
2. | エミュレーション手法 … メディアはそのまま保存。システムは更新するが古いメディアも読めるように作る。 | |
3. | マイグレーション手法 … 古いメディアから新しいメディアへ。システムも更新。 |
1.は今のものをそのまま使うわけだから最も簡単に思えるが、高い拝観料を取らないとやっていけなくなりそうな手法である。本当に博物館で保存するもの向きである。
2.は1.と同じでメディアに対して博物館並みの手間隙をかけて保存することになる。たとえば真空保存に完璧な空調システムなど、コスト的にも困難だし、再利用も簡単にはできそうも無い。ハードウェアが下位互換を持たせるとしてもどれくらい長く生産し続けることができるのだろう。もはや伝統芸能の領域である。
結局現実的な手法は3.ということになる。
さてマイグレーションするメリットについて少し話そう。まずはメディアの容量。時間と共に記録メディアの容量は増え続けてきたし、今後も増え続けることが期待できる。つまりデジタルデータの増加量に比例もしくはそれより速いスピードで容量が増えていくため、保管のためのスペースが際限なく増えるということが無い。 次に転送レートつまりはマイグレーション(コピー)にかかる時間である。これが常に一定であればデータ量が増えれば増えるほどマイグレーション作業が追いつかなくなる。 これも最新のハードウェアとメディアを使うことで回避できる。
さらに今後はIDCが予測しているように、管理コストの削減が進んでいく。コスト削減の最も簡単な方法、それは家内制手工業から大量生産時代へと移り変わったように自動化することである。 自動化するには自動化に適したマイグレーションのためのデータフォーマット(メタデータとコンテンツの格納方法)が必要になる。現在当委員会で取り組んでいるのはそのフォーマットの策定である。 これが完成すれば将来に亘りデータのマイグレーションが自動的に行われ、ユーザーは何も意識することもなく必要なデータを必要なときに簡単に取り出せるのである。
• 放送映像業界での活用例
従来の個別のアナログデータ、デジタルデータをコンピュータ用のデータに置き換える、つまりは「ファイル化」することに最も積極的なのが放送映像業界であろう。
要求は実は他の分野でも同じ、低コスト、高速な転送速度、大容量・コンパクト、そして将来性である。 それらの要素をすべて兼ね備えたコンピュータ用テープが選ばれてきているのも当然のことなのだろう。
• 最新IT技術のあらゆる分野への活用
そのほかに大容量デジタルデータを半永久的に保管したいという要求がある分野としては以下のようなものがある。こういった分野でも、今後ITの利用、テープストレージの利用が加速するだろう。
• 医療 | …電子カルテ、グラフィックデータの高解像化 | |
• 監視カメラ | …カメラ台数の増加、高解像度化、カラー化、Webカメラ等による 低価格化、導入の容易化 | |
• 研究機関 | … 測定デバイス、システムの進化、莫大な捨てられないデータ |
以上説明してきたように、長期デジタルアーカイブには分野を問わず最新ITテクノロジーの活用が有効であるのは間違いなく、その記録メディアとして、長期保存に適したコンピュータテープの活用が注目されているのである。
一般社団法人 電子情報技術産業協会(JEITA) テープストレージ専門委員会 (※)
日本ヒューレットパッカード(株) 井上 陽治
※:旧名称:磁気記録媒体標準化専門委員会
JEITAテープストレージ専門委員会「テープ出荷容量ほぼ4000ペタバイトに!ディスク容量に肉薄」
JEITAテープストレージ専門委員会「2010年度委員会活動報告と今後の活動」
JEITAテープストレージ専門委員会「テープシステム技術資料のご紹介」
「ビデオデコーダーとLTOの違いとは?」 -JDSF・JAVCOM・JEITA 2011年夏季技術交流セミナーでの講演概要-
2011年のデジタルデータ量は1.8ZBに! -増大し続けるデジタルデータとアーカイブの必然性-
「テープストレージの暗号化に関するチェックリスト」 -データを暗号化して安全に保管するためのポイントとは-
「計画停電、電力総量規制の製造メーカーへの影響」 -東日本大震災からの計画停電及び夏季電力総量規制の製造への影響-
「JEITAテープストレージ専門委員会ホームページの使い方」
「コンピュータ用テープによるデジタルデータの長期保存のすすめ -日本写真学会主催 写真アーカイブセミナーでの講演より-」