クローズアップ close-up

交通ビッグデータをモデル化し、未来の都市を構想する。

櫻井鉄也(さくらいてつや)

データ関係性数値解析チーム・リーダー
筑波大学 システム情報工学研究科 教授

1961年岐阜県生まれ。1986年名古屋大学大学院工学研究科博士課程前期課程修了、博士(工学)。現在、筑波大学大学院システム情報工学研究科教授・筑波大学人工知能科学センター長。専攻は数値解析学。高性能アルゴリズム、データ解析、画像解析、ニューラルネットワーク計算などへの応用を研究する。

現代を生きる私たちは「データ」に囲まれながら、そして自らもデータを生み出しながら生活をしている。スマホを使うことで発生する位置データ、病院の診療データ、移動のデータ……、日々の活動において生成され続けるデータは、個人のプライバシー情報を含むことから、その利用には慎重さを期すことが必要だ。データ関係性数値解析チーム・リーダーの櫻井鉄也教授は、そうしたプライバシーデータの秘匿性を守りながら、AIが有効活用するためのアルゴリズムの開発を進める。未来のモビリティ社会にもつながるその研究について話を聞いた。

※本記事は「モビリティ基盤数理研究ラボ」の前身となる「モビリティ基盤数理研究ユニット」時のものになります

元データを保護したAI学習アルゴリズムの開発。

——まず初めに、先生が専門とされている研究分野について教えていただけますか?

数値計算に基づくコンピュータのアルゴリズム開発と、高性能ソフトウェア開発を専門にしています。近年、AI(人工知能)は、ものづくり、医療、金融など非常に幅広い産業に取り入れられるようになりました。私はそのAIの基礎技術である、機械学習やデータ解析を高性能化するための方法を研究しています。
コンピュータの上で動いているデータは数値で表すことができます。そのため、数値をいかに効率よく計算できるかで、コンピュータの性能は大きく変わってきます。そこでより効率的な機械学習の計算アルゴリズムの開発を進めるとともに、それを利用したソフトウェアの開発も行っています。

——最近の応用分野としては、どのような領域を研究されていますか?

例えば最近、海外の研究チームと共同で研究を進めているのは、「安全性・秘匿性を考慮した次世代AIプラットフォーム」の開発です。例としては、病院が保有している患者のデータをプライバシーに配慮しながら解析する技術があります。患者のデータは極めて高度なプライバシー情報を含んでいますので、部外者が病院の外に持ち出すことはできません。その一方で、多くの病院が保有するデータを組織を超えて統合的に活用することができれば、単独のデータでは見えなかったことを発見できることが期待できます。そこで我々は、プライバシー情報を保護しながら患者の分散したデータ用いてAIが解析できるアルゴリズムの構築を進めています。
病院の入院データのような、組織で分散したデータを大量に集めて活用するときには、そのデータを他の第三者が手に入れたときのセキュリティを考える必要があります。つまりデータから、元となったデータを再現したり予測したりできないまま活用する技術を確立する必要があるのです。そのために変換を行ったデータを用いた機械学習のアルゴリズムを研究しています。よく「暗号」と比較されますが、暗号の場合は「カギ」がわかれば元のデータを再現できてしまいます。私たちが開発しているアルゴリズムは一方向で、再現できないのが特徴です。
関連して最近開発しているのが、新型コロナウイルスの地域ごとの感染者のデータから感染の広がりを予測するシミュレータです。感染者数の推移から地域間の「人の移動情報」を構築し、それを用いて地域ごとの感染の発生状況を予想できることを目指しています。

櫻井先生は、病院の入院等のデータを安全に活用するためにデータコラボレーション解析技術の開発に取り組んでいる

実際の大都市交通データを解析し未来を構想する。

——それはとても時宜にかなった、世の中に求められる研究ですね。

新型コロナの感染は、人の移動によって広がっていきます。この事実を逆に考えれば、現時点の「地域ごとの感染者数」の推移を分析することで、「人の移動」を予測できることになります。私たちは地域ごとの感染者データ、陽性者数から、次にどの地域で感染が増えるか予想するモデルを組み立て、シミュレーションが行えるようにしました。
これは、例えば感染者数のようなデータがモビリティのモデル構築のセンサーとしても使えることを示しています。こういったデータの活用は他でも応用ができ、新型コロナの次の感染拡大地域の予想が可能となります。感染状況の未来予測の精度が上がれば、エリアごとに感染対策をコントロールできるようになるでしょう。
私たちはこうした研究によって積み上げた「人の移動」と「その影響」のモデルを、将来的には未来のモビリティ社会へ応用することを検討しています。現在はそのための基礎的な手法とアルゴリズムを構築している段階です。

——モビリティ関連では、どのような研究を進めているのでしょうか。

海外の公開されている複数の交通に関するデータを用いて、車や人の移動を予測するアルゴリズムを検討しています。時間帯やその日の天気によって、街全体で人の流れや車がどのように変化するかを解析し、モデル化することを試みています。同じ都市の中でもビジネス街と住宅街では特性が変わりますが、地域の特徴を反映した交通ネットワークを表現できないかと考えているところです。
そうした現実の都市のモビリティのデータをモデル化し、アルゴリズムを構築することは、未来のモビリティ社会の構築にも役立てることができるはずです。たとえば今は駅がない場所に、新たな駅やタクシー乗り場、バス停を作ったら人や車の流れがどう変わるか。これまでよりも遥かに精緻に予測することができるようになるでしょう。さらに雨や雪、気温のような気象条件や、スポーツ等のイベントなどもパラメータ化することで、都市の交通にどのような影響を与えるか予想できるようになると思います。

モビリティデータのモデル化は、都市開発など多くの分野で活用できると櫻井先生は説明する

計算能力を高速化するアルゴリズムの開発。

——交通のビッグデータを解析することで、未来のより効率的な都市交通のかたちを具体的に構想できるようになるわけですね。先程、ソフトウェアも開発していると伺いましたが、どのようなプログラムを開発しているのでしょうか?

AIによるデータ解析において、「固有値計算」と呼ばれる計算手法が使われます。特異値分解や固有値計算を用いて行う計算の目的は、簡単にいえば「多くのデータを解析することで、データに潜んでいる『傾向や特徴』を見つけ出すこと」です。たとえば、身長と体重のデータをとると「身長が大きくなるに従って体重も増える」という法則性を見つけることができ、そのグラフは右肩上がりの線を描きます。この場合、扱うデータの種類は2つなので単純ですが、パラメータが3つ、4つ、5つ……と増えていくに従い、法則を見出す計算は非常に複雑となっていきます。
固有値計算はデータ解析の基本となる計算手法ですが、データ量が多くなると計算量が多くなり、高性能のコンピュータでも処理に時間がかかります。そのためいかに計算機の能力を引き出し、少ないメモリでも計算ができるようにするか、アルゴリズムを工夫することが重要となるわけです。
計算量をなるべく少なくするには、アルゴリズムの開発とともに、コンピュータのCPUの能力をいかにうまく引き出すかも重要です。コンピュータは常にフル性能で動いているわけではなく、一時的に機能を止めて他の処理を待っている状態のときがあります。その「待ち」の時間を可能な限り無くせば、無駄なくCPUを動かすことができるのです。また複数のコンピュータ同士を連携して計算することで1台では不可能な量の計算ができますが、つながったコンピュータのすべてが最適な効率で動く方法も検討する必要があります。

——トヨタとの連携について期待することがあれば教えてください。

いまの段階では、将来のモビリティ社会を数理的に構想していくための基礎的な研究を行っているところです。今後はさらに具体的な成果へとつなげていくために、トヨタが持っている実際の交通ビッグデータなどを活用して、アルゴリズムの構築を行っていきたいと考えています。モビリティの精密なモデルができると、それを単に移動の予測などに使うだけでなく、他のデータやモデルを組み合わせることでそこに新たな価値が生み出せる可能性があります。現時点で進めている研究の応用だけでなく、新たな可能性そのものを、データの海のなかから見つけていきたいと思います。

——最後に、櫻井先生がこのプロジェクトを通じて構想する、未来のモビリティ社会の姿について教えていただけますか?

技術の進化によって「モビリティ」という概念そのものをどう捉えるかが、大きく変化していくだろうと考えています。例えばコロナ禍によって、オンラインで会議することは普通になりましたが、以前であれば時間を決めて全員が会議室まで物理的に「移動」していたわけです。そう考えると「ヒトやモノの移動」だけでなく、情報やエネルギー(電力)の移動も、新たなモビリティとして捉えることができます。これからはさまざまな場が、さまざまな経路でつながり、動いていくことをモビリティと捉える時代になっていくでしょう。そういった未来の状況の中で、アルゴリズムによって「移動」を予測し、そこから新たな価値を生み出したいというのが私の研究のモチベーションとなっています。