2022年のデータストレージ動向を予測する

Storage Magazine 2022年2月号より
Marc Staimer

企業によって収集されたデータの貯蔵庫を常に整理、分析、保護する必要性によって、テクノロジーは新たな段階へと進んだ。以下に挙げる4つの予測は、あなたのウォッチリストに入っているだろうか?

テクノロジーは、それを取り囲む周辺の世界と関わることで初めて意味を持つ。データストレージの技術も同様である。千ドルの節約をするために百万ドルかかってしまうソリューションは、ほとんど無価値だ。

新しいテクノロジーが成功するかどうかを決めるのは、それが解決してくれる問題の中身、およびその技術の正味の価値、そしてそれが現在使われているものよりもどれだけ優れているか、というところに落ち着く。その観点から、以下に2022年注目すべきデータストレージのトレンドを述べる。

データストレージ・パフォーマンスをめぐる攻防が激化する

最初のデータストレージのトレンドは、アプリケーションのレスポンスタイムを抑えるために、常により低いレイテンシが必要になっている事だ。レイテンシの低減は、ジョブ完了時間に影響を与え、さらには高い生産性、即実行可能なデータベースへのインサイト提供時間の短縮、市場参入時間の短縮、マーケットシェアの増大、収益獲得時間の短縮へとつながっていく。ラストバイト・レイテンシの低減は、ハイ・パフォーマンス・コンピューティングにおけるMPI(Message Passing Interface*訳注1)において非常に重要である。

訳注1:並列コンピューティングを利用するための標準化された規格。複数のCPUが情報をバイト列からなるメッセージとして送受信することで協調動作を行えるようにする。

IOPSの増大は、ストレージとデータベースの統合を促進する。データベースサーバーの数が減れば、コア数も減少する。これは、パフォーマンスが増大しながら基盤コストが低減する、ということだ。またこれによって、より低いコストでより多くのアプリケーション開発と人気上昇中のブロックチェーン・アプリケーションのスピードアップも可能になる。

より高速な分析、機械学習、ディープラーニング、AIニューラルネットワークを実現するために、企業は常により大きなスループットを求めることになった。結果として、より短い時間で、即実行可能なインサイト、市場への参入、収益の獲得が可能となる。

現在のデータストレージのパフォーマンスは、いくつかの高パフォーマンス・データストレージ技術の急速な普及によって実現されている。例えば、NVMe-oFは多くのデータストレージ製品で使われる機会を着実に伸ばしている。主な選択肢は以下の3つだ。

  1. InfiniBand
  2. ファイバチャネル
  3. RDMA over Converged Ethernet(RoCE)

しかし、これらのネットワークには通常、新規のスイッチやネットワーク・インターフェース・カード(NIC)の基盤が必要になる。NVMe/TCPは最新の選択肢で、標準のEthernetネットワークのTCP/IP上で動作するので、ネットワーク基盤を更新する必要が無い。この選択肢は、実装するのも一番簡単だ。案の定、一般のCIO、CFO、ITプロの中では、これが最も人気が高いようだ。

企業のデータストレージのパフォーマンスを向上させるために、普及しつつあるその他の技術は以下の通りである。

  1. データストレージ・コントローラとフラッシュSSDにおけるPCIe Gen 4、場合によってはGen 5の迅速なデプロイメント。PCIe Gen 4はGen 3の倍の帯域、Gen 5はGen 4の倍の帯域を持つ。
  2. 大幅にレイテンシを低減する100 Gbpsから400 Gbpsまでの広帯域NICの使用。最も高い帯域のNICでは、PCIe Gen 4またはGen 5が必要とされる。
  3. NVMe-oFのようにリソースを大量に消費する処理をオフロードする、データ・プロセッシング・ユニット(DPU)の使用。DPUは、ルーティング、さらにはスイッチングまでも行うことにより、データストレージのパフォーマンスを大幅に向上させた。DPUは広帯域のNICや一部のデータストレージ製品で見かけるようになった。
  4. コントローラーに別種の不揮発性メモリを採用した、これまでより高速のNVMeフラッシュSSDの実装*訳注2。これにより、ドライブのレイテンシが低減しIOPSとスループットが増大する。
  5. AMD、Arm、Intelの最新のCPUと高パフォーマンス・ストレージコントローラーの使用。

パフォーマンスは、人を中毒にしてしまうところがある。一体、いつになったら満足するのか?実を言うと、永久に満足することはない。パフォーマンスが新しいレベルに到達すると、満足感が湧く。次にアプリケーションが、この新しいパフォーマンスを利用し始め、結局はより高いパフォーマンスを要求するようになる。この永久に続くデータストレージの戦いは、2022年ますます加速しそうだ。

訳注2:例えば、IBMのSSDはEverspin Technologiesが開発したMRAM(磁気抵抗メモリ:Magnetoresistive RAM)を内部のコントローラーに使っている。その他、最新の不揮発性メモリとしては、STT-RAM、PCM、NRAMなどがある。ストレージマガジン2019年10月号の記事「NANDフラッシュの後を継ぐ技術は?」に不揮発性メモリの解説がある。 

データストレージのサイバー・レジリエンスが業界の必須機能になる

これがデータストレージのトレンドになったのは、ランサムウェアが進化したためだ。ランサムウェアはよりずる賢くなって、バックアップ・データ、ストレージ・スナップショット、レプリカを、巧みに削除したり破壊したりできるようになった。さらに、保管ポリシーを変更したり、レポジトリの削除を許可したり、単にディレクトリを削除する、といったこともできる。狡猾な泥棒の手口だ。

貴社に最適なのはどの不変ストレージ?

データストレージ・ベンダーは、バックアップ・データが保存されている、ボリューム、ファイルシステム、オブジェクト・バケットをポリシーが定義した保管期間中、書き換えできないようにする、不変ストレージ機能を追加することにより、これに対抗してきた。データに影響を与える全てのポリシー変更に対して、多段階、多要素の認証機能を追加したベンダーもある。これによって、ランサムウェアがバックアップされたデータを毀損することを効果的に防ぐことができる。この方法は絶対的なものではないし、サイバーディフェンスとしてこの方法だけを使う、というのも間違っている。とはいえ、ディフェンスのレイヤーにこの方法が加わったことで、サイバー犯罪はさらにやりにくくなった。不変ストレージは、2022年のデータストレージ製品にとって必須の機能になりそうだ。

非構造化データ管理はデータストレージのゲームチェンジャーになるだろう

一部の読者は、「非構造化データ管理って何なん?」と首をかしげるかも知れない。ヒントとなるのは、便利な管理構造と非構造化データに対応した柔軟性だ。基本的に非構造化データ管理は、非構造化データに対して、データベースのような管理、検索、クエリ、制御機能を提供する。

非構造化データの管理は、決して新しくない。スキーマ・オプショナル・データベース(一般的には、NoSQLとして知られているが、実際はSQLが使える。)はドキュメントまたはオブジェクトベースになって、非構造化データに管理機能を提供する。とはいえ、セルフガバニングAIの機械学習や自律型データ管理の登場も、直接データストレージに影響を与えている。

構造化データと非構造化データ 主な相違点

データストレージ・ベンダーは、ここ数年製品に非構造化データ管理機能を実装してきた。問題なのは、これらの実装がデータストレージ・セントリックであって、データセントリックではない、という点だ。それだと、ベンダー独自のデータストレージ製品に何らかのS3互換オブジェクト・ストレージ統合をつけただけで終わり、ということになりがちだ。マルチベンダーに対応しているものは滅多になく、ユーザーをベンダーのデータストレージ製品に縛り付けてしまっている。ユーザーが、お金をたくさん払うことに頓着せず、将来ともデータストレージを選ばないのであれば、これでも回っていくのだろう。これが、非構造化データがこれまでデータストレージの大きなトレンドになってこなかった主要な原因である。しかし、状況は変わろうとしている。

データストレージから非構造化データ管理機能を抽出した、新たな製品群がこの2,3年の間に出てきたのだ。一部の製品は、データパスの外側に常駐し、ある製品はデータパスの中に常駐、そしていくつかの製品は両方の方式を取り入れている。これらの製品は、ストレージシステムやベンダーを選ばない。これらの製品はまた、オリジナル・データを、プライマリーストレージおよびS3オブジェクト・ストレージ、さらにはテープとの間で、アーカイブ、コピー、移動、削除(通常は階層管理のスタブなしで)することができる。一部の製品は、これをシンボリック・リンクで行い、別な製品はグローバル・ネームスペースで行っている。一部の製品は、メタデータのコレクト、ハーベスト、パース、管理機能を持っている。その他の製品にはこのような機能は無い。

これらの製品は、数百ペタバイト、さらにはエクサバイトまでの、信じられないほどの拡張性を持っている。何より良いのは、現在のファイルやオブジェクト・ストレージからデータを移行させる必要がないことだ。データを発見し、データが存在する場所をマップする。次にデータはアーカイブされ、特定のデータを必要とするデータストレージに移され、地理上の別な場所へとコピーされる。さらに、企業はこれら非構造化管理製品のコストを正当化できる。

この新しいタイプの非構造化データ管理製品が非常に期待できるのは、データストレージ購入の決定を変えるそのやり方だ。異なるベンダーのデータストレージ製品を導入できるので、企業は所与のアプリケーションのために最良のストレージを使える。データの価値とライフサイクルに基づいて、データは高価なデータストレージ製品の中の異なるティアに移動するのではなく、より安価なデータストレージ製品へと移動する。これらの製品は、非構造化データ管理だけではなく、ライフサイクル管理、データ保護、レプリケーションなどの多くのデータストレージ・サービスも抽象化(訳注:特定のデータストレージ・システムからソフトウェアを分離)する。レプリケーション単体でも、異なるデータストレージ、タイプ、ベンダー、メディアにデータをコピーできるようになる。

これら、次世代非構造化データ管理製品は、22dot6、Aparavi Software、Datadobi、Data Dynamics、Hammerspace、iXsystems、Quantum、Spectra Logic、StrongBox Data Solutionsなどのベンダーから販売されており、2022年のデータストレージの大きなトレンドになりそうだ。

データストレージ製品向けクラウド的エラスティック(伸縮自在)価格システム

パブリッククラウドストレージが、データストレージ市場においてシェアを伸ばしつつあることは、周知の事実だ。エラスティックなオンデマンド料金は、企業が使ったストレージの容量に応じて請求される。ユーザーは、この先どうなるか分からないニーズに対応するために前もってデータストレージを買わなくてもよいので、リスクはクラウドストレージ・プロバイダー側が負うことになる。通常、コストはよけいにかかるが、いつもそうだとは限らない。

消費型価格システムの長所と短所

データストレージ製品ベンダーが、クラウドストレージとうまく渡り合う最良の方法は、オンプレミスで同一の価格システムのサービスを提供することだ。Dell、HPE、Infinidat、NetApp、Pure Storageといったベンダーは皆、このクラウド的エラスティック価格システムによるサービスを持っている。2022年には、このようなベンダーがさらに増えるだろう。

この価格システムは、明らかにユーザーとベンダーの間がwin-winになるものだ。win-winの状況は、ほぼ間違いなくトレンドになっていく。

来年、これらの予測がどれくらい正しかったのか、確認してもらいたい。

著者略歴:Marc Staimer氏は、オレゴン州ビーヴァートン市に本社を置くDragon Slayer Consultingの創業者兼シニアアナリスト。

 

Copyright 2000 - 2022, TechTarget. All Rights Reserved, *この翻訳記事の翻訳著作権は JDSF が所有しています。
このページに掲載されている記事・写真・図表などの無断転載を禁じます。