動的治療計画と強化学習:最近の動向Ⅰ

概要

生物統計の分野では個人化医療の内容で被験者の軌跡データから動的な治療レジメ(Dynamic Treatment Regime)を求める研究が盛んになっている. 長期治療に伴う治療の計画を動的に行うときの最適な治療計画を見つけることが目的となる.このためには統計的な問題を反事実仮想に基づく潜在結果変数の推定や予測がキーとなる.本講座では強化学習の基礎を復習しながら,特に重み付けアウトカム学習とその周辺の最近の提案についてを詳解したい.

開催要項

日 時 2020年10月26日(月)13:30~16:30
会 場 Webにて開催いたします。
講 師 江口 真透 特任教授(統計数理研究所)
参加申込 お申し込みについては こちら からお願いいたします(2020年9月28日(月)12:00頃より開始予定です)。

参考書

・Chakraborty, B., and Moodie, E. E. Statistical methods for dynamic treatment regimes. New York: Springer, 2013.
・Sutton, R. S., and Barto, A. G. Reinforcement learning: An introduction. MIT press, 2018.