第58巻第2号141−155(2010)  特集「統計的機械学習」  [総合報告]

密度比に基づく機械学習の新たなアプローチ

東京工業大学大学院 杉山 将

要旨

本論文では,我々が最近導入した統計的機械学習の新しい枠組みを紹介する.この枠組みの特徴は,様々な機械学習問題を確率密度関数の比の推定問題に帰着させるところにある.そして,困難な確率密度関数の推定を経由せずに,確率密度比を直接推定することにより,精度良く学習を行う.この密度比推定の枠組みには,非定常環境適応,異常値検出,次元削減,独立成分分析,因果推定,条件付き確率推定など様々な機械学習の問題が含まれるため,極めて汎用的である.

キーワード:密度比,非定常環境適応,異常値検出,次元削減,独立成分分析,因果推定,条件付き確率推定.


第58巻第2号157−166(2010)  特集「統計的機械学習」  [研究ノート]

2クラス判別器の組み合せによる多クラス判別統計モデルとパラメータ推定

統計数理研究所 池田 思朗

要旨

機械学習の分野では,2クラス判別器を組み合せて多クラスの判別器を作る様々な試みがなされている.Error Correcting Output Codes(ECOC)と呼ばれる方法が頻繁に用いられているが,それぞれの2クラス判別器が軟判定を返す場合には ECOC の他にもBradley-Terry(BT)モデルを用いる方法が提案されている.本稿ではこのBTモデルを用いる組み合せ法を統計モデルとして考え,既存の方法の改善法のひとつを示す.

キーワード:Bradley-Terry モデル,多クラス判別,最尤推定.


第58巻第2号167−183(2010)  特集「統計的機械学習」  [研究詳解]

指数型分布族の空間におけるデータ解析法について

産業技術総合研究所 赤穂 昭太郎
奈良先端科学技術大学院大学 渡辺 一帆
東京大学大学院 岡田 真人

要旨

次元圧縮のために広く用いられている主成分分析は正規分布を仮定したもとで最適なものであるが,非正規的なデータに対しては必ずしも適切な低次元構造を抽出できない.本稿では,データが指数型分布族から生成されたもの,あるいは指数型分布族のパラメータとして与えられている場合の次元圧縮法の枠組みについて,著者らが行ってきた情報幾何的アプローチを中心に解説する.また,指数型分布族に属さない混合分布についても,指数型分布族の空間に埋め込む手法について述べる.さらに,確率モデルを導入し,ベイズ推定を行う拡張法や,それに基づいた次元圧縮とクラスタリングの同時最適化を行う手法についても述べる.

キーワード:主成分分析,情報幾何,双対性,次元圧縮,クラスタリング,ベイズ推定.


第58巻第2号185−206(2010)  特集「統計的機械学習」  [研究詳解]

正定値カーネルによるノンパラメトリック推論

統計数理研究所 福水 健次

要旨

正定値カーネルないしは再生核ヒルベルト空間を用いたデータ解析の方法論である,いわゆる「カーネル法」は,データを再生核ヒルベルトに写像し,この空間(特徴空間)において線形のデータ解析手法を適用する点に特徴があり,さまざまな手法のカーネル化が提案されてきた.最近になって,再生核ヒルベルト空間において平均や分散といった基本的な統計量を考えることによって,分布の均一性,独立性,条件付独立性といった統計的概念が,カーネル法によって扱えることがわかってきた.本論文では,この新しいノンパラメトリック推論の方法論の基本的な考え方を説明し,特に独立性や条件付独立性に関して今まで得られている結果の概要を解説する.

キーワード:正定値カーネル,再生核,ヒルベルト空間,ノンパラメトリック,独立性,条件付独立性.


第58巻第2号207−221(2010)    [研究ノート]

2次と3次の積率を用いたマルチレベルモデルの提案

統計数理研究所 尾崎 幸謙
埼玉学園大学 中村 健太郎
お茶の水女子大学 室橋 弘人

要旨

マルチレベルモデルは多段抽出データに対する適切な分析手法であり,社会調査や教育調査を含む社会科学研究においてしばしば使用されている.一方,構造方程式モデリング(SEM; Structural Equation Modeling)も社会科学の分野で広く使用されている分析手法であるが,SEMは多母集団解析を応用することでマルチレベルモデルを表現することが可能である.SEMではこれまで(平均と)分散・共分散の情報を利用したモデリングがなされていたが,近年になって歪度や尖度を利用したnnSEM(non-normal Structural Equation Modeling)と呼ばれる手法が開発された.この手法は,非正規分布に従う変数を分析可能なだけでなく,変数間の因果の方向性を2変数の横断データから統計的に判断可能であるという利点がある.本論文では,nnSEMの枠組みで2段抽出の場合のマルチレベルモデルを表現し,各階層(抽出単位レベル)において因果の方向性を判断可能な統計モデルの開発を行い,シミュレーション研究でモデルの性質を調べた.

キーワード:マルチレベルモデル,2段抽出,SEM,nnSEM.