バナー

第10回 統計的機械学習セミナー (2013.3.22)

第10回 統計的機械学習セミナー/The 10th Statistical Machine Learning Seminar

日時 2013年3月22日(金) 15:00-17:00
会場 統計数理研究所 セミナー室5(3階D313)

タイトル:構造正則化学習と劣モジュラ性
発表者:河原 吉伸(大阪大学産業科学研究所 助教,科学技術振興機構(さきがけ))

概要:
機械学習で扱うデータ中には、往々にして学習に利用可能な離散構造が存在する場合が多い。代表的なものは、変数間のグラフ構造やグループ構造、または階層的構造などである。近年、このような構造を正則化学習の中で明示的に利用するための、構造正則化学習と呼ばれる枠組みが考案され盛んに議論されている。特にF.Bach(NIPS’10-11)は、機械学習で議論される構造正則化ノルムのほとんどは、劣モジュラ関数の連続緩和(Lovász拡張)となっている事を示している。劣モジュラ関数は、離散的な凸性を持つ集合関数として知られる。
本講演では、構造正則化と劣モジュラ性の関係を概説すると共に、この関係から得られるいくつかの学習上の有用性について議論する。まず、劣モジュラ関数のあるサブクラスを構造正則化として用いる事で、グラフカットによる極めて高速な学習アルゴリズムが得られる事について述べる。実際、機械学習で扱われる構造正則化ノルムのほとんどはそのサブクラスを考えれば十分であり、特定の学習(相関ベースの特徴選択や主成分分析など)においては、問題を最小カットとして定式化する事も可能となる。またこのような枠組みを考える事により、極めて高速なアルゴリズムが得られるのみでなく、異なる正則化の強さに対する解の軌跡(いわゆる正則化パス)が容易に計算可能となる事についても述べる。本講演の最後では、このような枠組みをゲノムワイド解析や大規模な画像処理などの応用へ適用した例についても紹介する。

タイトル:直接方策探索法の統計解析
発表者:植野 剛(科学技術振興機構 湊離散構造処理系プロジェクト 研究員)

概要:
強化学習はサンプリングを規範としたマルコフ決定過程の解法の1つである.強化学習の最大の特徴は,他のマルコフ決定過程と異なり,対象とするシステムのダイナミクスの推定を必要とせず,最適行動方策を獲得できる点である. そのため,ロボット制御,オペレーションズ・リサーチ,ゲームAI設計など強い非線形性を持つ複雑な意思決定問題の解法として近年,活発に議論されている.強化学習の解決すべき問題の1つとして,強化学習法の理論的,特に統計的な評価を行うことがあげられる.これまで強化学習法の性能評価は計算機実験など経験的に行われることが殆どであり,理論的な評価はあまり行われていない.この要因の1つとして, 強化学習が最適制御を基礎に数理が展開されており, 強化学習の統計的な解釈がなされていないことが考えられる. 本発表では強化学習の重要アルゴリズムの1つである直接方策探索法について統計学習の観点から再定式化し,その理論的な性質を明らかにする.