平成302018)年度 重点型研究実施報告書

 

課題番号

30−共研−4301

分野分類

統計数理研究所内分野分類

f

主要研究分野分類

3

研究課題名

人工知能技術を用いた医療ビッグデータに対する新たな疾患因子解析モデルの開発と応用

重点テーマ

統計的機械学習の新展開

フリガナ

代表者氏名

オオオカ タダオ

大岡 忠生

ローマ字

Ooka Tadao

所属機関

山梨大学大学院

所属部局

社会医学講座

職  名

助教

配分経費

研究費

40千円

旅 費

0千円

研究参加者数

3 人

 

研究目的と成果(経過)の概要

【研究目的】
本研究計画の目的は、大きく以下の3点である。
1) 既存手法の問題点を解決する医療ビッグデータ解析用機械学習モデルの開発
2) 機械学習モデルで用いられた説明変数の重要性に対する定量的な評価法の確立
3) 大規模健康診断データへの開発モデル適用による、疾患発生に影響を及ぼす因子の同定

【研究成果の概要】
平成30年度は以下の項目を実施/達成した。
・機械学習モデルを適用する医療データ(健康診断データ)の収集とデータクリーニング
・Random Forestを用いた予測により、疫学における既存手法(ロジスティック回帰分析)よりも高精度に糖尿病リスクを予測することが出来た。
・Random ForestのVariable Importanceを算出する事で、説明変数の重要性に対する定量的な評価法を提示し、その適用により妥当性の高い糖尿病リスク因子を同定することが出来た。

平成31年度は以下の項目の実施を予定している。
・平成30年度の結果での論文発表
・Deep Learningを用いた同様の評価の実施、リスク因子の同定
・糖尿病以外のアウトカムを設定した際のRandom Forest適用

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

2019/2/1 第29回 日本疫学会学術総会 P-010「健康診断結果からAI(人工知能)技術を用いて糖尿病高リスク群を同定する方法の検討」大岡 忠生、横道 洋司、山縣 然太朗
2019/1/17 統計数理研究所 共同利用研究 研究集会「統計的機械学習の新展開」
「予防医療分野における疫学データへの機械学習技術活用について
〜ランダムフォレストを用いた血液データからの糖尿病発症予測を例に〜」
大岡 忠生

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

特に開催なし

 

研究参加者一覧

氏名

所属機関

城野 悠志

山梨大学