植木優夫客員教授(長崎大)によるセミナー

【日時】
2025年12月19日(金)16:00〜17:00
【場所】
統計数理研究所 セミナー室5
【講演者】
植木 優夫(長崎大学,統数研リスク基盤数理 客員教授)
【タイトル】
K-meansクラスタリングにおけるクラスタ数選択のための過小分散調整ベイズ情報量規準:ゲノム研究への応用
【概要】
K-meansクラスタリング後に得られる標本分散の過小推定調整を導入した過小分散調整ベイズ情報量規準(deflation-adjusted Bayesian information criterion, daBIC)を提案する。まず、K-meansクラスタリングにおいて、分散推定値の期待下限値を導出し、それを分散推定値の調整係数として用いる。 次に、この過小分散を調整した分散推定値を正規モデルに基づくベイズ情報量規準(BIC)に適用し、クラスタ数の選択に利用する。 シミュレーション研究の結果、提案するdaBICは、分散を調整しない標準的なBIC、Gap統計量、平均シルエット幅、prediction strength、ガウス混合モデルといった既存手法と比較して、より優れた性能を示す状況があることが確認された。 さらに、1000 Genomes Project の全ゲノムシーケンスデータに適用し、ゲノム研究における実データに対する上記クラスタリング手法の挙動を示す。