数学・数理科学と共に拓く豊かな未来 数学・数理科学と諸科学・産業の恊働による研究を促進するための「議論の場」を提供
項目 内容
研究集会等の名称 統計的機械学習の数理とその応用
該当する重点テーマ ビッグデータ、複雑な現象やシステム等の構造の解明 、最適化と制御の数理
キーワード 機械学習 、高次元データ 、確率モデル 、最適化
主催機関
  • 統計数理研究所
運営責任者
  • 福水 健次
  • 伊藤 聡
開催日時 2013/03/01 09:45 ~ 2013/03/01 17:45
開催場所 統計数理研究所・2階大会議室
最終プログラム 9:45-10:00
開会挨拶

10:00-11:00
「海洋生物多様性の解析のための機械学習アプローチ」
江口真透(統数研)

11:00-12:00
「実問題が切り開く機械学習研究」
井手剛(IBM)

昼休み

13:30-14:30
「疎表現に基づく情報処理」
池田思朗(統数研)

14:30-15:30
「凸最適化に基づくスパース学習の理論とアルゴリズム」
冨岡亮太(東大)

休憩(15分)

15:45-16:45
「ポアソン因子分析とトピックモデル」
山田武士(NTT)

16:45-17:30
「単語の意味空間のベイズ学習」
持橋大地(統数研)

17:30-17:45
閉会挨拶

18:00-
懇親会
参加者(総数、内訳) 68名(大学・研究所34名,企業20名,学生10名,その他4名)
当日の論点

 「データ科学」基盤技術としての機械学習を深く考察するために,応用面と数理面にまたがる6つの講演を行ってもらい,議論を深めた.

江口先生,井手先生には,応用面からの機械学習への課題に関して論じていただいた.

池田先生,冨岡先生には,近年関心を集めている方法のひとつである「スパース性」を用いたデータ解析に関して,それぞれ応用,理論からの観点で議論をいただいた.

山田先生,持橋先生には,これも近年特に研究が盛んである,ノンパラメトリックベイズに関した研究の先端を紹介いただいた.

 

 

研究の現状と課題(既にできていること、できていないことの切り分け)

江口先生は,海洋生物の資源評価に対する統計的・機械学習的アプローチに関して,研究の現状と問題点を議論された.生態系のデータは機械学習の興味深い応用であるが,データ取得の不確定性や強いバイアスなどにより,様々な挑戦的なデータ科学の課題が存在している.

井手先生は,ケニアで行った,webカメラによる低レベル画像からの車の台数推定の研究を紹介された.デバイスが変わることによって,データ解析に関する困難な課題が発生する例である.

池田先生は,いくつかの物理計測データに対するスパース表現を用いた情報処理の研究を紹介された.

冨岡先生は,重複がある場合の group Lassoの2つの方法(構造的/加法的)に関して,双対性に基づく統一的な理論的アプローチを示された.

山田先生,持橋先生は,ノンパラメトリックベイズにおける最近の研究として,離散的データの階層的なモデリングにおいて,背後に連続的な構造を導入した際のアルゴリズムの構築の重要性を示された.

新たに明らかになった課題、今後解決すべきこと
  • 近年のデータは,データ取得の不確実性やバイアスなどの問題を含んでいることが多く,そのような状況に対して機械学習的なアプローチによって,どのような理論や方法が構築可能であるかを,考察することは重要な課題である.
  • 機械学習は,理論上きれいな仮定をデータに課して考察することが多いが,現実の低品質のデータなどにどのようなアプローチが有効かを,理論的に考察していく必要がある.
  • スパース性に関しては,すでに活発な研究があるが,物理計測データなど多くの応用での現実的アルゴリズムと,より発展的な理論展開の両面が重要と考えられる.
  • ノンパラメトリックベイズに関しては,離散と連続を融合したモデルとアルゴリズムの開発が重要と考えられる.
今後の展開・フォローアップ

今回の研究会を受けて,明らかとなった課題に関して,より専門的なワークショップなどを開催していきたいと考える.