内部ストレージクラウドの実体に迫る

著者:Alan Radding
Storage Magazine 2009年10月号より


今やほとんどあらゆるベンダが、何らかのクラウドストレージ製品やサービスを大々的に宣伝している。この記事では、一体何が内部ストレージクラウドを構成しているのか、その実体を考察する。

「現在、プライベートストレージクラウドなどというものは存在しない」。そう断言するのは、パブリッククラウドストレージベンダNirvanix Inc.でコンサルティング部門担当ディレクターを務めるStephen Foskett氏だ。そうかもしれないが、実際には、2009年8月に米国連邦政府の一般調達局(GSA)が、プライベートストレージクラウドらしきものの見積もり依頼(RFQ)を発行している。

しかし、GSAがプライベートストレージクラウド(つまり内部ストレージクラウド)と考えているものは、大半の企業が持つ内部クラウドのイメージとは大きく異なっている可能性がある。RFQには次のように記載されている。「これらのサービスの初回調達は、GSAにより、GSA Cloud Computing Storefrontというサイトを通じて進められる予定である。このサイトは、政府機関の購買部門が、GSAが管理運営するCloud Computing Storefrontという共通のWebポータルを通じて、必要に応じて(クレジットカードまたはその他の許容可能な支払い手段を使用して)IaaS(Infrastructure as a Service)サービスを購入できるようにするものである」

内部ストレージクラウドについて一般に認められた定義というものは存在しないといっても、GSAのRFQでは、内部ストレージクラウドとはまったく別のものについて述べているように思われる。連邦政府機関の要求は、内部ストレージクラウドでもパブリックストレージクラウドでもなく、連邦政府機関が内部利用の目的でパブリッククラウドストレージサービスを購入しこれらにアクセスすることができるポータルまたはゲートウェイなのであって、それをCloud Computing Storefrontと呼んでいるのだ。RFQへの回答を作成しているNirvanixのFoskett氏でさえも、これには当惑しているようだ。

政府は、ある面においては、適切な進め方をしているように思われる。内部ストレージクラウドの定義が何であれ、内部ストレージクラウドがストレージコストの削減とストレージプロセスの簡素化を約束してくれるものであることには変わりない。GSAによると、「クラウドコンピューティングでは、サーバ、データベース、およびアプリケーションの仮想化に基づく市販の技術を利用することにより設備投資コストを削減できるため、ITインフラのコスト削減が可能である」という。GSAの取り組みは、ストレージクラウドとコンピュータークラウドの両方を対象としている。

内部ストレージクラウドの問題は、そのようなものが存在しないということではなく、内部ストレージクラウドだといえる可能性があるものに、あまりにも多くのバージョンがあることだ。StorageIO Group(米国ミネソタ州スティルウォーター)の創業者でシニアアナリストのGreg Schulz氏は次のように述べている。「クラウドとは、抽象化のレイヤのことだ。ほとんどあらゆるストレージ製品は、内部ストレージクラウドの一部として構成することができる。結局はそれぞれの定義次第ということになる。ベンダは、自社が販売しているものに合うようにストレージクラウドを定義するだろう」

内部ストレージクラウドについて広く認められた定義というものは存在しないが、業界アナリストたちは、内部ストレージクラウドを作り出すために必要な要素を特定し、これらの要素を結び付けるための方法を説明してきた。クラウドは神秘的なものに見えるが、実際には「誰でも作ることができる」と、Illuminata Inc.(米国ニューハンプシャー州ナシュア)の主席ITアドバイザーであるJohn Webster氏は言う。内部クラウドストレージは、脳外科手術とは違うのだ。

内部ストレージクラウドは現在では珍しい存在だが、そのセールスポイントがどのようなものになるかは明らかだ。「パフォーマンス対コストの問題だ。内部ストレージクラウドはコストに重点を置いている」と、Ocarina Networksの製品担当バイスプレジデントであるCarter George氏は述べている。それとは対照的に、高機能のストレージアレイ、ストレージエリアネットワーク(SAN)、高性能のディスクドライブ、緻密なバックアップと復旧機能からなる従来のストレージは、パフォーマンスとデータ保護に重点を置いている。

しかし、米国オレゴン州ベンドで独立ストレージコンサルタントとして活動するAbbott Schindler氏によると、低コストであることを必ずしも第1の重点項目とする必要はないという。「今日、コストは誰にとっても最優先事項だ。それは、大半のユーザが、アーカイブストレージまたはデータ保護を考えてクラウドを使い始めるため、安いがその分遅い設計になっているからだ。しかし、クラウドの概念に本質的に備わっているものの中に、クラウドはトランザクション系のデータには使用できないとする根拠となるようなものはない」(Schindler氏)

内部ストレージクラウドの定義

内部ストレージクラウドは、その構成要素がファイアウォールの内部に置かれることを除けば、パブリックストレージクラウド、つまりネットワーク上のサービスとして提供されるストレージと同じだと言うことも可能かもしれない。しかしそのような定義でも、完全に正確とはいえない。例えばパブリックストレージクラウドプロバイダは、ストレージ容量の一部を確保して、ある特定の顧客の専用にすることができる。つまり顧客にとってこれは内部ストレージクラウドではないが、プライベートストレージクラウドだといえる(下記の「さまざまなタイプのストレージクラウド」を参照)。

さまざまなタイプのストレージクラウド

パブリックストレージクラウド
AmazonのSimple Storage Service(S3)やNirvanix Inc.のStorage Delivery Networkのようなサービスは、低コストで大容量のファイルストレージを提供している。マルチテナンシーにより、プロバイダは各顧客のストレージとアプリを、それぞれ個別にプライベートな状態に維持することができる。パブリックストレージクラウドの一部を切り出して、プライベートストレージクラウドに相当するものを作り出すことができる。

プライベートストレージクラウド
プライベートストレージクラウドでは、1つの企業がインフラを所有または管理し、そこでアプリケーションをどのように配置するかを管理する。展開先は、エンタープライズデータセンターやコロケーション施設の中など。プライベートクラウドは、企業の自社IT組織やサービスプロバイダが構築し、管理する。

内部ストレージクラウド
内部ストレージクラウドは、組織のファイアウォールの内部に置かれる点を除いて、プライベートストレージクラウドとほぼ同じだ。コンサルタントまたはシステム構築業者の支援を得て構築されることもあるが、ホスティングと保守はIT部門が行う。

ハイブリッドストレージクラウド
ハイブリッドストレージクラウドは、パブリッククラウドとプライベート/内部クラウドの特性を組み合わせたもの。主に、外部プロビジョニングされたストレージに一時的にオンデマンドでアクセスする目的で使用される。パブリッククラウドのストレージ容量でプライベートまたは内部クラウドを強化できるため、企業は作業負荷の急激な変動または予定されたピークに直面してもサービスレベルを維持できる。ただし、ハイブリッドクラウドでは、パブリッククラウドとプライベートクラウドの間でどのようにアプリケーションを分散させるかの決定が複雑になる。

出典:Sun Microsystems Inc.


業界アナリストやコンサルタントは、内部ストレージクラウドを具体的に定義するよりも、その特性を述べるほうを好む。

例えば、重点が置かれているのは明らかに、低コストであることと、拡張が容易であることだ。CommVaultの製品開発担当バイスプレジデントであるAnand Prahlad氏は、「ストレージクラウドでは、経済的な側面が大きい。低コストが期待されているだけでなく、使った分だけ支払う仕組みだ」と言っている。簡単に言えば、内部ストレージクラウドは、安価なストレージを提供することを期待されているのだ。

そして、安価なストレージというだけでなく、遅いストレージでもある。しかし、Schindler氏のようなコンサルタントたちは、内部ストレージクラウドでも、ストレージパフォーマンスが比較的高いものや多様なサービスレベルのものがあることを認めてはいる。

管理が容易であることも、差別化要因だ。「内部ストレージクラウドを利用する人は、ストレージの複雑さを取り除くことを望んでいる」と、i365, A Seagate Companyの最高技術責任者(CTO)であるDavid Allen氏は言う。そうすれば、プライベートストレージクラウドは、管理が容易で、1人の管理者だけで数百台のノードと数ペタバイトのストレージに対処できる。といっても、管理者の職務は、少数の単純なタスクに限定されるかもしれない。

最後に、プライベートストレージクラウドへのアクセス方法が、主な差別化要因となる可能性がある。アクセスプロトコルの主流はHTTPとなるだろう。「HTTPまたはHTTPS接続と、Webブラウザだけあれば良いというのが望ましい」と、SentryBlue(米国ノースダコタ州ファーゴ)のCTOであるKen Satkunam氏は提案している。

「内部ストレージクラウドの大きな特徴は、プロトコルではなくAPI経由でアクセスできる点だ。ちょうどWebサイトのように、プログラム可能なAPIが装備されるだろう。HTTP上でRESTが使われるかもしれない」とNirvanixのFoskett氏は述べている。REST(Representational State Transfer)とは、ファイバチャネル(FC)と異なり、すべての通信にそれぞれステートを含めるステートレスプロトコルのことだ。RESTは、HTTPを使用してWebサービスにアクセスできるようにする。ストレージクラウドでは、サービスとして提供されるストレージリソースにアクセスするためにRESTが使用されるだろう。

Sun Microsystems Inc.は、最近発表したホワイトペーパーの中で、ストレージクラウドにおけるこのようなプログラム可能性の利点を主張している。「サーバ、ストレージ、およびネットワークのリソースを物理的に展開してアプリケーションをサポートするのではなく、同じ仮想コンポーネントをどのように構成および相互接続するかを開発者が指定する。指定される内容には、仮想マシンのイメージやアプリケーションのデータをどのようにストレージクラウドに保存し、ストレージクラウドから読み出すかも含まれる。APIを通じてコンポーネントがいつどのように展開されるかを指定するのも開発者だ」

しかし、業界ではまだクラウドAPIが標準化されていない、とStorageIO GroupのSchulz氏は指摘している。各クラウドプロバイダが独自のAPIを提供している状況である。しかし、2009年7月下旬に、Rackspace Hostingが、同社のパブリッククラウドソリューションCloud ServersとCloud FilesのAPI仕様を、Creative Commons 3.0 Attributionライセンスの下で公開した。このことによって、最終的に、内部ストレージクラウドの構築を望む人たちがオープンなAPIをベースに構築を始められるようになる可能性がある。

最後の特性、マルチテナンシーは、パブリックストレージクラウドを定義付けるものだ。CommVaultのPrahlad氏は、「マルチテナンシーは、ストレージクラウドの重要な部分で、それは内部ストレージクラウドにとっても例外ではない」と述べている。内部またはプライベートストレージクラウドを利用した場合、マルチテナンシーによって、組織は必要に応じて部門、プロジェクト、ワークグループを分けることができるだろう。

では一体、内部ストレージクラウドとは何だろうか。一般に合意がとれている定義は、会社が所有または少なくとも管理するプライベートストレージ容量であって、HTTP接続を介してプログラマチックにアクセス可能で、容易に管理できるマルチテナンシーを備えた、低コストで拡張性に優れたストレージを提供できるもの、ということになるようだ。ParaScale Inc.は、内部ストレージクラウドは小規模(ノード数3台から5台程度)であっても良いが、それでいてクラウドストレージの経済性と、クラウドの利点である管理容易性と拡張性を提供するものだ、と付け加えている。

内部ストレージクラウドのオプション

内部ストレージクラウドを馴染みのあるもののように感じる人もいるかもしれない。確かにそうだ。コンサルタントのSchindler氏は、「ストレージグリッドが姿を変えてプライベートストレージクラウドとなった」と言っている。ストレージグリッドの前には、ユーティリティコンピューティングという、コンピューティングリソースとストレージリソースを従量課金サービスとしてパッケージ化したものがあった。テクノロジーとアーキテクチャは異なるが、いずれの概念もよく似ている。「それらは要するに、望むデータに、望む場所から望む時に、望むコストでアクセスできるという、いわばストレージの天国のようなものを目指す概念である」とSchindler氏は付け加えている。実際のストレージデバイスが何であるとか、ネットワーク上のどこにデバイスが置かれるかには関係ない。

内部ストレージクラウドはまた、ネットワーク接続型ストレージ(NAS)クラスタにもよく似ているが、いくつか注意すべき点がある。CommVaultのPrahlad氏は、「クラスタ化されたNASが真の意味でのストレージクラウドのサイズまで拡張可能なのかどうか私にはよくわからない」と述べている。内部ストレージクラウドは小規模から始めることができるが、企業はデバイスを追加することにより拡張していくことを望むだろう。

内部ストレージクラウド製品に関しては、現在の選択の幅は、内部ストレージクラウドをどのように定義するかによって、非常に狭くもなれば、かなり広くもなる。具体的な製品としては、EMC Corp.がAtmosを提供している。同社はこれを情報の保存と配信のための製品だと説明している。Atmosでは、企業の希望するサービスレベルに応じて、グローバルネットワークを通じて企業データの保存とレプリケーションを行う。ビジネスポリシー、ポリシーベースの自動化、およびメタデータを使用して、広大なストレージクラウド内で企業データを管理し、高い運用効率、管理の複雑さの緩和、およびコスト削減を実現できる。

EMCは、Atmosをプライベートストレージクラウドとして導入した顧客としてAT&Tを挙げている。しかしAT&Tは、実際にはこれをプライベートクラウドとして使用しているわけではない。AT&Tは代わりに、Atmosを通じて自社の顧客にストレージに関連するサービスを提供する予定なのだ。この使用方法は、むしろパブリッククラウドの再販業者に似ているといえる。

一般の予想と異なり、Atmosの背後にはEMCの巨大なストレージアレイがあるわけではない。「そのようなことをしたらコストが高くつきすぎるだろう」とNirvanixのFoskett氏は述べている。その代わりに、Atmosの拡張性に優れた容量はJBODの形で提供されている。Atmosを利用すると、データセンター内に、APIとNASインターフェースを備えたボックスに相当するものを手に入れることができる。すなわち、Atmosのパブリックストレージクラウドの一部をプライベートクラウドとして利用することができるのである。

ParaScaleは、内部ストレージクラウドの構築と管理に特化したソフトウェアを提供している。クラウドサービスプロバイダと異なり、同社は企業が自社独自のストレージクラウドの構築に利用できるツールのみを販売している。同社のソフトウェアは、標準的なx86ベースのLinuxサーバ上で動作し、複数のサーバ上の直接接続ディスクを集約させて、単一の名前空間内にあるペタバイト規模のファイルストレージに一元化する。

AtmosとParaScaleを除くと、商用の内部ストレージクラウド製品は非常に少ない。Foskett氏は、「それらの製品以降、プライベートクラウドをうたっている製品はどれも、本当の意味でクラウドとはいえない」と言う。そういった製品を提供しているベンダは、ある程度まで仮想化を組み込んだストレージ製品を提供しているだけで、それをクラウドとして提示しているのだ。「多くの場合、そのようなベンダは自社の通常の製品に『クラウド』という名前を付けているだけだ」と同氏は付け加えた。同様に、ほとんどあらゆるNASクラスタも、内部ストレージクラウドのように見せることが可能だ。

内部ストレージクラウドの構築

「内部クラウドではDIYが大流行だ」とコンサルタントのSchindler氏は語っている。内部クラウドの自作が人気になっているのは、IlluminataのWebster氏が指摘しているように、単にプライベートストレージクラウドを作ることがさほど難しくないからだ(下記の「内部ストレージクラウドの必須コンポーネント」を参照)。
 

内部ストレージクラウドの必須コンポーネント

内部ストレージクラウドを自前で構築するために必要なものをリストにしてみた。

  グローバルなファイル、またはクラスタ化されたファイル(ネットワーク接続型ストレージ)システム(仮想化機能と管理機能を含む)
  コモディティサーバと低コストストレージ(SAS DAS、JBOD、PCIe RAID)
  コスト効果の高いネットワーク帯域幅サービス
  アプリケーションのニーズに応じたクラウドパーソナリティインターフェース(NFS、SMTP/POP、HTTP、DICOM、REST、SOAP、XML)
  オブジェクトまたはメタデータの管理レイヤ(適切なデータ保護とセキュリティツールを含む)

出典:StorageIO Group、Greg Schulz氏

プライベートストレージクラウドを設計し構築する方法は数多くある。最もシンプルな方法は、「NASクラスタ、できればグローバルファイルシステムを備えたものをベースにして、クラウド(Web)のフロントエンドに置くことだ」とi365のAllen氏は言う。



内部プライベートクラウドを背後で支える実際のストレージは、場合によってさまざまだ。おそらく、プライベートクラウドの一部としてストレージアレイを使用する人は稀だろう。「大半の人は、コモディティサーバを使用して、ディスクスロットに低コストのドライブを装着するだろう」(NirvanixのFoskett氏)

あるいは、「Linuxのサーバブレードとディスクを満載したラックまたはブレードのキャビネットを使用する方法もある。ローカル接続ディスクを使用できるため、SANストレージに比べてはるかに低コストで済む」とSentryBlueのSatkunam氏は述べる。

拡張性に優れた内部ストレージクラウドを構築するための鍵となるのは、「多数の小さなボックスから始め、その後ボックスを追加して拡張していくことだ」とCommVaultのPrahlad氏は述べている。データのレプリケーションを多数のノードに分散することにより、冗長性が確保されてデータが保護される。サービス品質(QoS)を確保するために、ノードによって異なるサービスパフォーマンス特性を持たせることができる。

すべての要素を結び付けるものは、「単一の名前空間を表すグローバルファイルシステムだ」とPrahladは述べている。これには、仮想化とメタデータのレイヤも必要となる場合がある。

内部ストレージクラウドの管理はシンプルでなければならない。Ocarina NetworksのGeorge氏は、「モデルとしてAmazonやFacebookなどのWebサイトを見るべきだ。ファイルストレージ全体にHTTPでアクセスできることが望ましい」と説明している。シンプルにするために、ファイル管理オプションを作成、読み取り、更新、削除、および移動/コピーに限定するといいだろう。

内部ストレージクラウドは、組織の階層1のストレージに取って代わるものではない。稼働中のデータは引き続き、高パフォーマンスのFC SANまたはプライマリiSCSI SANの上で実行され、バックアップおよび保護される。代わりに、内部クラウドは、電子メール、アーカイブ、メディア、およびコンプライアンスデータはもちろんのこと、プライマリディスクス領域を消費しバックアップと復旧の戦略を複雑化させているすべてのファイルベースのデータに使用されることになる。これらのデータはアクティブなまま、広く使用され、変更されるため、階層1の稼働中ストレージに伴うコスト、パフォーマンス、およびサービスレベルが不要な方法で保存および共有されなければならない。

TheInfoPro(米国ニューヨーク市)による最新のWave調査(2009年1月から5月まで)では、クラウド全般に対する関心についてアンケートを実施した。TheInfoProのストレージ調査担当マネージングディレクターであるRobert Stevenson氏は、「関心レベルはさほど高くなく、12~15%程度のようだ。大半(の回答者)が、クラウドについての計画はないと答えた」と述べている。大企業は、現時点では内部ストレージクラウドまたはクラウドコンピューティングを強く望んではいないようだ。

とはいえ、大企業は既にディスクが接続された仮想化サーバをネットワーク上に置いているのだから、内部ストレージクラウドの真似事をしているといえるのに、それに気づいていないのかもしれない。そこから本格的な内部ストレージクラウドまで、あとほんの小さな1歩だ。

略歴:Alan Raddingは、たびたび『Storage Magazine』に寄稿している。

STORAGE MAGAZINE 10月号

All Rights Reserved, Copyright 2000 - 2009, TechTarget
*この翻訳記事の翻訳著作権はJDSFが所有しています。
このページに掲載されている記事・写真・図表などの無断転載を禁じます。