ビッグデータは本当にビッグになるのか？－医療データのエコシステム 何が必要？－

JEITAテープストレージ専門委員会コラ
「ビッグデータは本当にビッグになるのか？
－医療データのエコシステム何が必要？－」

■医療先進国米国　５０州の約８０％は医療従事者がトップ

米国の産業別労働従事者統計推移を見ていると、医療産業の巨大さをつくづく思い知らされる。１９９０年時点では、労働従事者の一番多い産業は製造業で、全米のおよそ８０％の州が製造業関連従事者が一番多いという統計であったのが、２３年後の２０１３年の統計では、約８０％の州で医療産業従事者がトップとなっている。製造業がトップの州は東海岸、特に自動車産業の聖地、五大湖周辺のミシガン州と近隣だけになってしまった。面白いのは宿泊、飲食産業がトップの州は１９９０年も２０１３年も変わっていない。ご想像の通りラスベガスのあるネバダ州とハワイ州である。

そんな医療先進国米国で最近発行された「Data-Driven Health Care」というレポートがあるので、そこからいくつかエッセンスを紹介してみたい。これはMITが発行しているレポートで、主に今後の医療におけるビッグデータ活用がテーマとなっている。

■医療ビッグデータ　そのエコシステム

前回のコラムでもいくつか紹介したが、医療ビッグデータとして考えられているものは以下の７つである。

１．	電子医療データ研究、テストデータ、薬の処方箋データ、電子カルテ等
２．	公共医療データ国内または州内（日本の場合は都道府県）の公開医療データ
３．	環境データセンサーデータからの生活習慣特性の分析、位置情報と気象データのマッピング等
４．	医療保険関連データ薬剤、治療方法の使用傾向
５．	遺伝子データ低コストシーケンサーの登場により、より多くの遺伝子データを採取可能に遺伝子と薬剤や治療方法の適合、不適合を予測可能に
６．	モバイル機器からの健康データ行動記録だけでなく、体温、脈拍、血圧、将来的には血糖値に至るまで、患者の身体からのデータを記録する現在でも１０万以上あるといわれる健康関連モバイルアプリからのデータ、さらには今後「ウェアラブル」デバイスの普及がデータ量を押し上げる
７．	家族の医療データ遺伝による病気の発症を事前に予測したり、予防したりすることが可能になる

上記７つのデータを分析アルゴリズムと予測モデリングから、傾向と洞察を得ることになるのだが、その結果は以下の３つに展開される。

１．	患者より正確でパーソナライズされた診断により、ホリスティック医療が可能に
２．	医者最適な治療方法を選択できるサポートツールが開発される（これは遠隔地治療にも応用できるのではないだろうか？）
３．	研究機関多くの患者からの詳細データとそれらに付随されるデータが病気や治療の研究に役立つ

■ビッグデータ活用の投資は始まっているのか？

そうはいってもビッグデータ自体がバズワードとも言われている状況で、上記のような仕組みを実現するために投資をするのには、二の足を踏む人も多いだろう。しかしながら、世界の医療関連ＩＴ企業の買収金額を見ると、２０１４年のＱ１の金額は、前の四半期である２０１３年Ｑ４から３倍以上の＄４Ｂ（ビリオン）、日本円で４０００億円以上に跳ね上がっている。前回のコラムにも書いたのだが、実は医療へのビッグデータ活用は患者の早期治癒、予防による健康状態の維持という側面だけではなく、ひたすら増え続けている医療費の削減効果が見込まれている。ちなみに米国のヘルスケアセクターは年率８％、およそ年間＄３００Ｂ（約３０兆円）の医療費削減を行っている。医療が一大産業として成り立っている反面、医療費の削減は国家の財政の健全化には早急に着手しなければいけない課題でもあるのだろう。

■データフローとストレージ

さて、上記の７種類のデータから価値のあるアウトプットを出すまでのデータフローを考えてみよう。単純化したフローは以下のようになると考えられる。

１．センサー、電子カルテ等からの構造化データを分析エンジンへ入力、使わないデータはアーカイブ

２．画像等の非構造化データはメタデータを付与してそのメタデータを分析エンジンへ、それ以外はアーカイブ

ここで重要なのが、非構造化データのほとんどは構造化データにすることが困難だということである。最近では音声認識の識別率の目覚ましい改善に伴い、音声のテクストファイルつまりは構造化データ化も進んできたが、コンテキスト（文脈）を抽出できるアプリケーションもまだ限られているため、精度はまだまだである。たとえば「はし」は「橋」なのか「端」なのか「箸」なのか、前後の文脈から判断する必要がある。

画像に関してはさらに困難であろう。顔認識自体の精度が上がっても、それを構造化データで表すのは簡単ではない。パターンマッチングのような違ったアプローチのほうが向いているのかもしれない。

３．分析したデータからアウトプットを出し、患者、医者、研究者にインサイトを与える

ここでもデータの蓄積つまりアーカイブが必要である。アウトプットの正確性、得られたインサイトからの患者、医者、研究者の行動のトラッキングも必要で、これがループするためさらに大量のデータが生み出される。

では上記データフローにはどのようなストレージが求められるのだろうか？　まずはあらゆるデバイスから集められたデータを分析して結果をレポートする、高速でスケールアウト型のストレージ、インメモリーストレージのようなものが必要であろう。一方で構造化データにするのが困難な非構造化データ、分析に使われなかったデータ、さらには最終的な分析結果からの行動パターン等も捨てるのはもったいない。さらに保存期間も長期になることが想定される。患者の過去の詳細なデータ、さらには遺伝学的な見地からの数世代分の家族の医療データも保存しておく必要があるからだ。当然インメモリーには保存しておけない。低コストで低消費電力、容量効率の高いストレージが適している。つまりここでも高性能ストレージと低コストストレージの二極化が進むと考えられる。

■今のうちに準備しておくこと

最近電子カルテも普及して、ＰＡＣＳデータ等を効率良く活用できるようにＩＴ化を進めてきている医療関連施設も多いと思われるが、果たしてどれくらいの割合になるのだろうか？大型の医療施設であれば予算もあるが、規模が小さいところではファイル化はできていても、それらの統合までできていないのが現状だろう。そして今後データの種類は増え、複雑になり、その量も飛躍的に大きくなることは想像に難くない。今できること、それは散在したデータを低コストで、さらにあとから有効活用するために取り出しやすい形で保存しておくことではないだろか。最も手軽で経済的な保存方法はテープとＬＴＦＳの活用だろう。経済的で信頼性の高いテープをＵＳＢドライブと同じような使い勝手で使えるのだから。

一般社団法人電子情報技術産業協会(JEITA) テープストレージ専門委員会
日本ヒューレットパッカード(株) 井上陽治

ストレージ仮想化でデータ損失は防げるのか？
ダークデータとは！？ビッグデータと何が違う？
ビッグデータ時代のデータマネージメントとは？
F1チームがITベンダーになる日
ビッグデータ時代の超整理術とは？
ビッグデータは本当にビッグになるのか？輸送産業編
ビッグデータは本当にビッグになるのか？医療、ライフサイエンス編
ビッグデータは本当にビッグになるのか？－医療データのエコシステム何が必要？－
ビッグデータは本当にビッグになるのか？空からのデータが世界を変える！？
ビッグデータは本当にビッグになるのか？大容量低コストストレージの本命は！？
ビッグデータは本当にビッグになるのか？メディア業界4Kの次は8K？それとも？
ビッグデータは本当にビッグになるのか？メディア業界4Kの次は8K？それとも？その2

リンクが張られていない、タイトルだけの記事は、最新号のメルマガ記事です。
次回のメルマガが配信された時点で記事にリンクが張られます。
メルマガ登録すると次回から最新記事を読むことができます。
メルマガ登録は無料、非会員でも登録できます。登録はこちら

JEITAテープストレージ専門委員会コラ 「ビッグデータは本当にビッグになるのか？ －医療データのエコシステム 何が必要？－」

JEITAテープストレージ専門委員会コラ
「ビッグデータは本当にビッグになるのか？
－医療データのエコシステム何が必要？－」