平成302018)年度 一般研究2実施報告書

 

課題番号

30−共研−2068

分野分類

統計数理研究所内分野分類

h

主要研究分野分類

2

研究課題名

判別・予測解析におけるサンプルサイズ設計: 学習曲線の推定

フリガナ

代表者氏名

マツイ シゲユキ

松井 茂之

ローマ字

Matsui Shigeyuki

所属機関

名古屋大学

所属部局

医学系研究科生物統計学分野

職  名

教授

配分経費

研究費

40千円

旅 費

85千円

研究参加者数

6 人

 

 

研究目的と成果(経過)の概要

目的:医学分野などで多く遭遇する比較的少数のサンプルの高次元データを用いた判別解析におけるサンプルサイズ設計の方法について検討する。

成果概要:
 先行研究は、高次元データの構造に対して大胆な単純化を加えた統計モデルに基づくアプローチと、モデルを仮定しない標本再抽出に基づくアプローチのいずれかであるのに対して、本研究はこれらのハイブリットなアプローチを考える。具体的には、主成分分析やクラスタリングなどのunsupervisedな方法により、独立とみなせる合成特徴量を生成し(数千程度)、合成特徴量全体に対して適当な階層モデルを当てはめる。推定モデルに基づいて、合成特徴量と判別ラベル変数の同時分布から、様々なサンプルサイズを持ったデータセットを生成し、これをテストデータとして用いることで判別精度のサンプルサイズによる変化を評価する(学習曲線の推定)。シミュレーション実験により総じて予想通りのパフォーマンスが得られたが、小サンプル下では階層モデルの推定がやや安定しない傾向が認められた。そこで、各特徴量の分散推定の安定化などの対処について検討した。

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

特にありません。

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

研究会の開催なし。

 

研究参加者一覧

氏名

所属機関

井桁 正尭

兵庫医科大学

小森 理

福井大学

西野 穣

東京医科歯科大学

逸見 昌之

統計数理研究所

松井 孝太

名古屋大学