月刊J-LIS 2020年8月号

「“ウィズコロナ時代”におけるビッグデータ駆動型社会

COVID-19対策には
国を越えたビッグデータ活用が必須

── 新型コロナウイルス感染症(COVID-19)対策として、わが国でも官民を挙げてのビッグデータ活用の取り組みが行われています。ビッグデータの活用について、コロナ禍以前と現在では何がどのように変化したと見ていますか。

喜連川所長  最近、総合科学技術・イノベーション会議(CSTI)から国立情報学研究所(NII)に対して「EUがCOVID-19に関するデータポータル構築を計画しているが日本としても貢献できないか」との打診がありました。これはG7関連での動きですが、COVID-19は、たとえPCR検査で陰性になるまで回復したとしても予後が悪いとの報告もあるなど、多様な疾病様態があることから、国の壁を越えて徹底的にデータを収集することが必須になります。一国だけのデータでは不十分なので、グローバルな協力体制が不可避と言えるのです。
 「ビッグデータ」という言葉に関して誤解があるとよく感じるのが、誰かがビッグデータを持っていて、そこにITベンダーやAIベンダーが出向いて「何かお手伝いしましょうか?」というパターンがビッグデータ活用の“王道”であると、多くの人がイメージしがちな点です。確かに以前であればそれも当てはまったかもしれませんが、もはやそのようなビジネスは古くなっています。つまり、“はじめにデータありき”ではなく、“自分たちは何をやりたいのか?”をまず明らかにしたうえで、それに向かって「データを創る」ことこそが、ビッグデータ活用の本質となっているわけです。COVID-19対策に当てはめれば、国の壁を越えて、皆で有用なデータを創ることの重要性が広く認識されるようになったことこそが、ウィズコロナ時代における大きなシフトだと言えます。

コロナ渦での豪雨災害で見えてきた
自治体との連携チャネルの必要性

── 自治体におけるCOVID-19対策へのビッグデータ活用についてはいかがでしょうか。

喜連川所長  今年の梅雨の時期には、九州地方を中心に豪雨による大規模な水害が発生し、多くの地域で深刻な被害が発生しました。この際に、複雑で難しい状況となったのが、住民の避難場所です。避難所ではCOVID-19対策も必要となるため、従来に比べると1人当たりに対して圧倒的に大きな空間を確保しなければないことから、分散避難が叫ばれています。東京大学の我々の研究室では急遽、全国47都道府県1,741の自治体それぞれに対して、ハザードマップ情報、避難所情報、レーダ情報、衛星情報、河川ウェブカム情報などを集約した Webサイト「市町村向け災害情報共有システム(bosAI)」を用意しつつあります。
 システムの開発を進める中で分かったのが、参照した昨年までの避難所情報と現状ではかなり異なっていることです。この点については、各自治体と連携しながら新しい情報へと更新していく作業を進めたいと思いますが、そのために必要になる自治体との連携チャネルの確立が容易ではないということも判明しつつあります。コロナ禍においては、機動的にシステムを構築し、自治体と連携して瞬時に稼働させることが、強く求められてくると感じています。
 そのときに、全国の自治体の方々には、ぜひ大学をご活用いただきたいですね。全国規模のシステムを構築する大きな理由の1つが、災害時に得らえるビッグデータを共有できることです。すなわち自治体間で災害に立ち向かう経験知を互いに共有することこそが、ウィズコロナ時代において最も重要なことではないかと考えています。
 少し話は変わりますが、NIIでは3月26日から、全国の大学における遠隔授業に関するオンラインのシンポジウムをほぼ毎週行っています。最初の回で我々が参加者に対して言ったのは、「ここに答えを求めに来ないでください。遠隔授業の準備を超短期間に完了しなくてはなりませんが、このような事態は想定外であり、誰にも経験がなく知見やノウハウも持ち合わせていません。しかし、これから北大、東北大、東大、名大、京大、阪大、九大という大きな大学がどんどんと試行錯誤をして失敗をし、その経験をお伝えし、皆さんが同じ失敗をしないで済むようにしたいと思っています。日本の高等教育が止まらないように皆で頑張りましょう」ということでした。
 シンポジウムの参加者は回を追うごとに増え、2,000人を超えることもありました。ここで自治体の方々に言いたいのが、すでにある静的なビッグデータではなく、皆でビッグデータを動的に作りあげていく試みこそが重要であるということです。そのためのアプローチはケースバイケースだと思いますが、自治体のビッグデータ活用においても目指す方向には共通するところが多いはずだと信じています。Society5.0とは、言い換えますとデータ駆動型社会です。是非、自治体におかれましては、ビッグデータの生成と活用を積極的にお進めください。

COVID-19のAI診断も可能となる
ビッグデータ基盤を開発中

── 今回のCOVID-19対策にビッグデータを活用している自治体等の事例から、特に興味深い取り組みを紹介してください。

喜連川所長  三重県や岐阜県等とは、医療データの中のいわゆるレセプト情報を自治体の担当者が分析できる環境を築いてきました。これも一種の医療ビッグデータで、東大の我々の研究室に解析基盤が構築されています。自治体では、端末から直接、データにアクセスして、医療資源の適正配分など多様な目的に活用してもらっています。このビッグデータ利用基盤は大変好評で、患者がどこからどこへ通院しているかといった患者の地理的な通院動態等を匿名化して可視化したりするなどの多様なアプリが開発されています。これにより、インフルエンザウイルスといった、感染症の様態を的確に捕捉することが可能となります。コロナ禍によって地域の医療体制が被っている影響についても分析を進めています。
 また、NIIでは放射線学会と連携して、放射線画像を学術情報ネットワークSINETを経由して研究所のクラウド上に収集しており、その総数はすでに1億枚にも達しています。ここに “COVID-19”とタグが付けられた画像が日々次々に投入されてきており、患者ごとの PCR検査の結果情報も付与されています。現在、AIを用いた肺炎画像診断システムをまさに開発しているところです。ポイントはしっかりしたビッグデータ基盤を作っておくことによって、たとえ想定外の事態が発生しても、ビッグデータの迅速な利活用によって早急な対策を打つことが可能となるのです。データ駆動型の医療体制構築が今後自治体のコアコンピタンスとなることでしょう。

ウィズコロナ時代は
データ共有の時代に

── ビッグデータ活用が推進されることで、社会のあり方はどう変わっていくと見ていますか。

喜連川所長  今回のコロナ禍を通じて、データのシェア(共有)が極めて重要であり、それ以外に人類が生き延びる道がないことが世界的に明らかになりました。“コロナ以前”は、データが極めて重要な資産だった時代のため、「データは、他人には公開せず、自分たちだけで活用しよう」といった傾向が強かったのです。しかし世界保健機関(WHO)でも、世界中の研究者に向けて、COVID-19関連の論文を発表する際には、事前に必ずWHOにデータを共有するよう依頼しました。それに呼応して、論文誌を出版している各社も、「データをWHOに提出していない論文は受け取れません」と明言する事態にまでなっています。
 これは一例に過ぎませんが、このように、これから社会課題を解決するためにはより広くデータを共有する必要があります。誰もが当たり前にデータ共有の重要性を認識して行動できる世界へと進化してほしいと心から願っていますし、またそうなることを信じています。

── 最後にウィズコロナ時代の社会のあり方やデジタルテクノロジーの活用方法についてのビジョンをお聞かせください。

喜連川所長  ITシステムは、道路やトンネルと同じか、場合によってはそれ以上に維持のための手間やコストがかかるものであるという事実を、社会の多くの人々が理解することが大切でしょう。これまでの自治体では、独自のITシステムを構築することが存在感を示す手段のように捉えられてきたのではないかと思います。これは、企業をはじめ他の業態でも同様ですが、今日はもうそのような時代ではありません。
 例えば国内の銀行業界でも、地方銀行ではできるだけ同じシステムを共有しようと、一つのシステムに沢山のバーチャルマシンを立ち上げることで、圧倒的なコストと運用負荷の軽減を達成しています。大学においても、論文や紀要などの成果を整理して格納する機関リポジトリというソフトウェアを、これまで各大学が独自に作ってきましたが、ある段階から、このソフトは競争領域ではないと気付くようになりました。このソフトに手間をかけるのは非効率的であり、より独創的な作業にこそリソースを投資することが重要だと多くの大学が考えるに至ったのです。NIIは誰でも簡単に使えるリポジトリソフトを開発しまして、現在では、3分の2以上の大学が、NIIの提供する共通ソフトウェアに移行しています。
 私は自治体のITシステムを熟知しているわけではありませんが、できる限り、共通の機能は同一のソフトウェアや同一の基盤を共有することで、維持のためのコストや作業負荷を大幅に低減できるはずであると考えます。そうすれば、それぞれの自治体固有の問題にかかわる分野により多くのリソースを集中して注力することも可能となるはずです。
 さらに、このようなアプローチを積み重ねることによって、様々なデータが自然と標準化されていくことも期待できます。皆が独自にシステムを作っていたままでは、そこに格納されているデータの共有は著しく難しくなってしまいます。私はデータやデータベース活用の研究に40年近く携わってきていますが、そのような不具合を何度も見てきました。そして、ようやく、政府がデータ駆動型社会を推進すると表明する時代となりました。今後も、今回のコロナ禍に匹敵するような災いが繰り返し世界を襲うかもしれません。自治体の方々もその前提に立ったうえで、Society5.0、すなわちデータ駆動型社会を目指して、共有すべきIT 基盤(共通領域)と競争領域(独自領域)をしっかりと見つめ直し、しっかりとした「データ駆動型のIT基盤」の構築を一歩一歩推進いただければと祈念いたします。