数理的定式化による新しい機械学習システムと統計分析に基づく一体型ビッグデータ処理
デジタルトランスフォーメーション研究部門とは
現代の科学技術活動には、ビッグデータと呼ばれる莫大なデータから意味のある情報を抽出するデータマイニングの技術が極めて重要であり、ミクロレベルでは遺伝子・分子設計から、マクロレベルでは地球環境まで、それらのビックデータのデータマイニングは、今や計算機科学、統計学、応用数学、システム工学といった複数の分野の協調なくして一歩も進まない状況になっています。本研究部門の前身である超分散知能システム研究部門では、研究部門独自の人工知能システムを改良、拡張しながら、他の機械学習システムと組み合わせて、酪農、生命系、交通システム、災害避難といった現実的な問題に応用を試みてきました。その過程で、これらのシステムの性能を十分発揮し、有効に問題を解決するためには、従来の取組みでは限界が見えてきました。ビッグデータをより効率的に、より精密に処理し、新たな技術革新を生み出すためには、新しい理論に基づく人工知能を含むシステムの拡張を進めるとともに、入力データおよびシステムが加工したデータを、数理的に分析し、論理的な根拠を見出し、システムにフィードバックする必要があります。
デジタルトランスフォーメーション研究部門では、その「デジタルトランスフォーメーション」が意味するとおり、さらに複雑な多くのデータを効率的に処理し、精度の高い結果を得るために、各レベルおよび側面の専門家が、数理的な基盤の上に連携し、融合した一体型の分析システムを実現することによって、データマイニング手法に変革をもたらすことを目指しています。現在の本部門には、16 名の研究者が数理科学、情報工学、認知科学、バイオインフォマティックス、システム工学の分野から集まっており、相互関係によって研究を推進しています。
研究体制
本研究部門は、各メンバが、図1 に示すように、理論レベル、基盤レベル、応用レベルに分かれ、各レベルで研究を進めながら、他のレベルからの支援やフィードバックを受ける体制を実現します。特に、理論レベルと理論レベルからの支援を強化している点が特徴です。
(1)応用レベル
それぞれの応用分野に精通したメンバ(大和田、西山、安井、松澤、大村、植松)がもつ知見から応用の問題点を探り、最適な基盤システムを用いて問題の解決法を導き、得られた結果の妥当性を検証します。特に、応用の性質によって、大和田、安井、大村、松澤が、問題をモデル化します。そして、研究代表者、西山、桂田、植松が中心に、モデルを応用システムとして実現します。応用システムから得られた結果は、その妥当性を石垣、石井、安藤が分析します。
(2)基盤レベル
メンバ(大和田、朽津、西山、宮本、桂田、熊澤、松澤、大村、玄、諸橋、熊澤、神林)によって、人工知能や機械学習といった基盤技術における直接的な性能向上や、新しいアプローチの実現を進めます。松澤が、分散システムやセンサネットワークにおけるネットワークの性能向上および、分散資源の効率的な探索アルゴリズムの開発に取り組みます。西山は、人工知能のさらなる分散処理によって性能の向上に取り組みます。研究代表者は、プログラム中のループ文を中心にGPU による命令レベル並列性の向上に取り組みます。宮本、玄、熊澤、神林は、機械学習におけるさらなる精度向上を目指します。 朽津と諸橋は、生物の仕組みに基づく新しい学習モデルの実現を目指します。基盤レベルで実現される基盤技術と基盤システムについては、その妥当性を、石井、安藤、研究代表者がそれぞれ検証します。
(3)理論レベル
メンバ(伊藤、松本、宮本、秦野)が一体となって、深層学習や機械学習など工学的に成功しつつも、理論的に不明な部分が多い手法に、理論的裏付けを与えることを試み、その過程で得られる知見を基に、これまでにない新しい手法やシステムモデルを提案していきます。
目標とする成果
メンバが、3 層構造の各レベルで研究開発を進めながら、互いに成果をフィードバックする体制を実現します。この体制によって、システムの改良と分析のスパイラルに基づく精度と性能の向上を実現し、一体化したビッグデータ処理を目指します。
研究テーマ
現在進行中の2つのプロジェクトを紹介します。
(1)「がんゲノミクスデータサイエンス医療」プロジェクト
国立がん研究センター先端医療開発センター(NCC-EPOC)と東京理科大学との共同で行っているプロジェクトです(図1)。応用レベルとして、がんの予防、健康寿命の延長とがん患者の生活の質向上、社会復帰の実現といった目標を設定し、基盤レベルとして、それぞれの問題に特化した、データサイエンス手法(数理統計、機械学習、情報処理、統計解析)とがん生物学的実験手法を融合させた手法を開発中です。
(2)「 人工知能による脳卒中予防システムの開発・実用化」プロジェクト
医療ビッグデータと工学ビッグデータを利用して、人工知能(AI) による患者個々の脳卒中予防を目的とした、医師の診断・治療補助を可能とするシステムを開発中です。本プロジェクトはNEDO のプロジェクトとしてスタートし、医療情報に基づくAI αと、医療情報と工学情報に基づくAI βの2種類の説明可能AI を実現しています。