講演要旨
海洋生物に限らず,生態学データ,環境データなどの解析において幾つか定評のある解析手法が開発されてきている.例えば,ロジスティック回帰の内容で混合効果モデル,一般化線形加法モデルなどの方法が広く定着している.一方で生態学において機械学習によるパターン認識や最大エントロピー法などの適用もあり,機械学習による新展開の機運が高まっている.本発表では,それらの事例を紹介し,特に海洋生物の資源評価指標の開発について問題点を整理して今後の発展について考察する.
本講演では、数理科学と産業との協働の実例について、IBM研究部門での取り組みを、ビジネス面、組織面、研究面からお話します。実問題は、アカデミアにあるベンチマークデータよりずっとずっと多彩で、本来、研究パラダイムを揺り動かすくらいの荒々しい力を秘めています。その荒々しさを楽しむことが、産業との協働をすすめる上で重要な点です。本講演では、具体的な実問題を例にとり、それがいかにビジネス面、研究面で大きな広がりを持つかについてお話したいと思います。たとえば、「Webカメラで車の台数を数える」という素朴なタスクにおいて、無限ガウス混合モデル等の「高級な」モデルが、実世界の泥臭い制約を満たすためにいかに使われ、それが実世界へどのようなインパクトを与えうるかについてお話します。
近年,圧縮センシングやLASSOなどに代表される疎表現を用いた情報処理が
様々な分野で盛んに研究されている.本講演では,こうした手法に限らずに疎表現を広くとらえ,ベイズ統計との関係について説明し,応用分野や,実用上の問題点について,特に物理計測データの解析法に関する例をあげて説明する.
最近さまざまな文脈で注目されているスパース性に基づく学習を加法的なスパース性に基づくものと構造的なスパース性に基づくものに分類し,それらに対する最適化アルゴリズムを議論する.この中で疎に結合した動的ネットワークの推定問題や,カーネル関数の線形結合を学習する問題(マルチカーネル学習)について述べる.さらに,講演者が最近力を入れている凸最適化に基づくテンソル分解に関し,両者からのアプローチについて述べる.
近年、大規模データ解析の重要性が注目されている。なかでも、従来の固定観念や経験則にとらわれず、データそのものが持つ本質的な潜在構造を抽出し、重要情報を取捨選択しつつデータを俯瞰的に理解したり、将来を予測、補完することが重要である。そのための代表的なツールとして、非負行列分解やトピックモデルおよびその拡張がよく知られている。本講演では、Zhou 等の最近の研究を紹介し、NBP (Negative Binomial Processes) を用いることで、非負行列分解や LDA (Latent Dirichlet Allocation) 、HDP (Hierarchical DirichletProcesses) 等をポアソン因子分析の枠組みの中で統一的に理解し、整理、拡張することを試みる。
TBA.