第53巻第2号189−200(2005)  特集「計算推論―モデリング・数理・アルゴリズム―」  [研究詳解]

正定値カーネルによる回帰問題における
次元削減法

統計数理研究所 福水 健次

要旨

本論文は,Fukumizu et al. (2004)にしたがって,正定値カーネルを用いた,回帰問題における新しい次元削減法に関する著者らの研究を解説する.説明変数 $X$ を用いて従属変数 $Y$ を説明する回帰の問題設定において,$X$ に含まれる $Y$ の情報をすべて保持するような説明変数空間の低次元部分空間を「有効部分空間」と呼ぶことにし,この部分空間を見つける次元削減の問題を考える.まず,この問題を条件付独立性を用いて定式化し,さらにこの条件付独立性が再生核ヒルベルト空間上の共分散作用素を用いて特徴づけられることを示す.この理論的事実を用いて,与えられた有限サンプルから有効部分空間を推定するための方法を導き,実データに適用した例を示す.本論文で解説する方法は,これまでに提案された同種の方法とは異なり,$X$ や $Y$ の条件付確率,周辺分布および次元などに強い制約を必要としないため,幅広いデータに適用可能である.

キーワード:カーネル法,正定値カーネル,ヒルベルト空間,次元削減,変数選択,回帰.

全文pdf閲覧前画面に戻る


第53巻第2号201−210(2005)  特集「計算推論―モデリング・数理・アルゴリズム―」  [研究詳解]

dPLRMを用いた話者識別

統計数理研究所 松井 知子
早稲田大学大学院  理工学研究科 田邉 國士

要旨

本稿では帰納的学習機械,dual Penalized Logistic Regression Machine (dPLRM)を用いたテキスト独立型話者識別法について報告する.dPLRMを利用して,学習データだけから識別的な話者特徴を捉えることを試みる.本方法では,従来の事前知識に基づく特徴抽出処理を必要としない.話者10名が異なる3時期に発声した音声による識別実験において,256次元の対数パワースペクトルを直接用いたdPLRM法は,26次元のメルケプストラム(Mel-frequency cepstral coefficient; MFCC)を用いた混合ガウス分布モデル(Gaussian mixture model; GMM)に基づく従来法と比べて,同等以上の性能であることを示す.また,特に学習データ量が少ない場合には,dPLRM法はGMM法よりも識別率が高いことを示す.

キーワード:話者認識,話者識別,カーネル回帰,dual Penalized Logistic Regression Machine, 帰納的学習機械,特徴抽出.

全文pdf閲覧前画面に戻る


第53巻第2号211−229(2005)  特集「計算推論―モデリング・数理・アルゴリズム―」  [研究詳解]

データ同化:その概念と計算アルゴリズム

総合研究大学院大学/科学技術振興機構(JST) 中村 和幸
統計数理研究所/科学技術振興機構(JST) 上野 玄太
統計数理研究所/科学技術振興機構(JST) 樋口 知之

要旨

気象学・海洋学において活用されているデータ同化について,その概念と状態空間モデルによる表現について紹介する.また,データ同化の中でよく用いられている手法であるアンサンブルカルマンフィルタについて,粒子フィルタとの関連に注目して議論する.小規模なシステムに対する数値実験により,非線形観測をもつ問題に対して粒子フィルタを適用した場合に,アンサンブルカルマンフィルタに対して優位性を持つことを示し,さらに実際の非線形観測をもつ問題に対する適用可能性について議論する.

キーワード:データ同化,粒子フィルタ,アンサンブルカルマンフィルタ,状態空間モデル.

全文pdf閲覧前画面に戻る


第53巻第2号231−259(2005)  特集「計算推論―モデリング・数理・アルゴリズム―」  [研究詳解]

ナース・スケジューリング
――調査・モデル化・アルゴリズム――

成蹊大学 池上 敦子

要旨

日本における病院の数は1万を超すとも言われ,毎月約3万部署でナース勤務表作成の仕事が発生していると考えられる.このスケジューリング問題は,看護の質を守るとともにナースの労働負荷を十分考慮しなければならないことから,非常に多くの種類の制約が存在し,解くことが困難な組合せ問題となっている.この論文では,現場調査に基づくモデル化から適用までの「問題解決の全過程」を紹介することにより,本研究の最近の成果を報告する.先ず,ナース・スケジューリングを数理計画モデルで記述することにより,問題の拘束条件マトリックスがブロック対角構造を持つことを明らかにする.そして,その構造を利用した「部分問題軸アプローチ(Subproblem-centric Approach)」という考え方を提案し,これに基づくアルゴリズムで問題を解く.アルゴリズムは,実際の病棟の問題に対し非常に質の良い勤務表を効率良く与えることができた.提案するモデルとアプローチは,海外のナース・スケジューリングはもちろん,医療,介護,サービス業等の中でも,勤務の質が特に要求されるようなスタッフ・スケジューリングに適用可能である.

キーワード:ナース・スケジューリング,アンケート調査,数理計画モデル,ブロック対角構造問題,タブサーチ.

全文pdf閲覧前画面に戻る


第53巻第2号261−284(2005)  特集「計算推論―モデリング・数理・アルゴリズム―」  [原著論文]

販売年別廃車ハザードモデルに基づく
乗用車の年次需要予測

総合研究大学院大学 藤崎 陽
早稲田大学大学院 田邉 國士

要旨

本論文では乗用車の販売及び廃車の年次データの解析に基づく需要予測の新しい方法を提案する.各メーカーやクラスの車齢別保有データに基づいて,同一年販売車の廃車過程を解析し,廃車車齢の分布(以下廃車分布と呼ぶ)がハザード率の空間ではロジスティック函数で近似できるという共通な構造を持つことをまず明らかにする.そして,ハザード函数がロジスティック函数となるような分布をロジスティックハザード分布と名付け,その性質を調べ,実際の廃車データに最尤法を用いて当てはめ,廃車分布を推定する.更に,ハザード率の空間でロジスティック函数を修飾する摂動項を導入することによりモデルを精密化し,推定法を改良する.得られた推定廃車分布と各年次の販売台数から各年次の廃車台数を推定し,乗用車需要が1年先の廃車台数に緩やかに漸減して1に近づく比例函数を乗じたものでよく近似できることを明らかにする.これらの事実に基づき乗用車の需要予測のモデルを構築し,1994年,1996年,2001年の時点の需要予測を行ないその妥当性を検証する.解析結果に基づいて,1996年に行なわれた車検制度の改正の影響についても議論する.

キーワード:乗用車需要予測,廃車分布,同一年の販売車の廃車過程, ロジスティックハザード分布,車検,重層廃車台数.

全文pdf閲覧前画面に戻る


第53巻第2号285−295(2005)  特集「計算推論―モデリング・数理・アルゴリズム―」  [原著論文]

ヌジ人名史料による家系図の作成について

統計数理研究所 上田 澄江
琵琶湖博物館 牧野 久実
統計数理研究所 伊藤 栄明

要旨

古代メソポタミアのヌジ遺跡から出土した粘土板に記された個人名のデータが,一冊の書物ヌジ人名史料にまとめられている.これにもとづいてデータベースを作成し,家系図を自動的に作成してゆく計算アルゴリズムを考案する.計算機の能力を活用することにより,考古学や文献史学の分野における従来の結果を再検討できるだけでなく,いままで知られていなかったと考えられる家系図もえられる.これはヌジ社会についての知見に新たな見解を加える可能性もある.

キーワード:ヌジ人名史料,データベース作成,計算アルゴリズム,家系図の推定.

全文pdf閲覧前画面に戻る


第53巻第2号297−315(2005)  特集「計算推論―モデリング・数理・アルゴリズム―」  [研究詳解]

2次錐計画問題による磁気シールドの
ロバスト最適化

統計数理研究所 土谷 隆
鉄道技術総合研究所 笹川 卓

要旨

本論文では凸計画の新潮流の代表例の一つである2次錐計画を取り上げ,超電導磁気浮上式列車の磁気シールド最適設計問題への応用を紹介する.超電導磁気浮上式列車は超電導磁石によって浮上・推進するため,車体を強磁性体のシールドで覆い,車内を強力な磁場から遮蔽する必要がある.一方,車体はできるだけ軽いことが望ましい.そこで,磁場を考慮してシールドの厚みを場所によって調整し,車内へ磁場が漏洩しないという条件下でシールド重量を最小化する問題を考える.適切なモデル化により,この問題は2次錐計画問題として定式化できる.本論文では代表的な内点法の一つである主双対内点法を実装して2次錐計画問題を解くことにより最適設計を行う.そして,さらに解法の高速性と頑健性を生かして確率的シミュレーションによるロバスト最適化を行った結果,および最尤法によるロバスト性能の事後評価について報告する.

キーワード:2次錐計画,内点法,超電導磁気浮上式列車,最適設計,ロバスト最適化,磁気シールド.

全文pdf閲覧前画面に戻る


第53巻第2号317−329(2005)  特集「計算推論―モデリング・数理・アルゴリズム―」  [原著論文]

飽和集合列挙アルゴリズムを用いた
大規模データベースからのルール発見手法

国立情報学研究所 宇野 毅明
北海道大学 有村 博紀

要旨

データベースの分析を通じた学習・知識発見は科学・産業の中で重要な位置を占める.学習・知識発見手法のひとつに,データベースから特徴的なパターン・ルールを列挙し,その中から役に立つ知識を探し出すというものがある.しかし,データベースが巨大であると,これらパターン・ルールの列挙には非常に長い時間が必要となり,また役に立たない不必要なパターンが大量に現れる.本稿では,筆者らが開発した飽和集合列挙アルゴリズム LCM を用いて効率良くルール発見を行う手法を提案する.飽和集合は意味が等しいパターンを代表するものであり,飽和集合に注目することにより,大量の不必要なパターンに関する処理を省略し,計算速度の向上と出力される解の数の減少を同時に行うことができる.また,飽和集合から高速にルールを生成し,その精度(確からしさ)を計算する手法も合わせて提案する.これにより,確からしい,またはある種の特徴的なルールのみを短時間で列挙することができるようになった.

キーワード:頻出集合,飽和集合,アソシエーションルール,アルゴリズム,データマイニング,機械学習.

全文pdf閲覧前画面に戻る


第53巻第2号331−348(2005)  特集「計算推論―モデリング・数理・アルゴリズム―」  [原著論文]

GMRES法による最小二乗問題の解法

国立情報学研究所/総合研究大学院大学 速水 謙
株式会社  ビジネスデザイン研究所 伊藤 徳史

要旨

大規模疎な$m \times n$行列$A$を係数行列とする最小二乗問題に対する主流の反復法は,正規方程式に対して(前処理付き)共役勾配法を適用するCGLS法である.
本論文ではまず,代案として元の最小二乗問題を,$n \times m$行列$B$を用いて,正方行列$AB$または$BA$を係数行列にもつ等価な最小二乗問題に変形し,非対称正方行列を係数行列とする連立一次方程式用のロバストなクリロフ部分空間反復法である一般化最小残差法(GMRES)を適用する手法を提案する.
次に,$m \ge n$(優決定),$<n$(劣決定),およびランク落ちも含めた一般の場合に対して,これらの手法が任意の右辺項$\bb$に対して破綻することなく最小二乗解を与えるための行列$B$に関する十分条件を導く.そして,$B$の例として不完全QR分解の一つであるIMGS($l$)法を提案する.
最後に,フルランクな優決定および劣決定問題に対する数値実験により,条件の悪い問題では(対角スケーリングに相当する)IMGS(0)法を用いた提案手法の方が従来の前処理付きCGLS法より速く最小二乗解を与えることを示す.

キーワード:最小二乗問題,クリロフ部分空間反復法,CGLS法,GMRES法,特異な系,前処理.

全文pdf閲覧前画面に戻る


第53巻第2号349−360(2005)  特集「計算推論―モデリング・数理・アルゴリズム―」  [原著論文]

2次錐計画のサブクラスに対する
単体法的アルゴリズムにおけるピボット選択
規則について

電気通信大学大学院 栗田 圭介
電気通信大学 村松 正和

要旨

Muramatsu(2003)によって提案された,2次錐計画のあるサブクラスに対するピボット・アルゴリズムを実装する.またその実装を用いて様々なピボット選択規則に関する数値実験を行なう.その結果,ピボット選択規則がアルゴリズムの実用的な効率に大きな影響を与えることがわかった.また,Muramatsu(2003)によって提案されたピボット演算を一部改良することで,最適解に至る反復回数が改善されることを数値実験により示す.

キーワード:2次錐計画,ピボット,単体法.

全文pdf閲覧前画面に戻る


第53巻第2号361−373(2005)  特集「計算推論―モデリング・数理・アルゴリズム―」  [研究ノート]

双対逐次2次計画および切除平面法による
状態制約最適制御問題の解法

統計数理研究所 伊藤 聡

要旨

双対逐次2次計画と切除平面法に基づく状態不等式制約つき非線形最適制御問題の数値解法について述べる.本解法は切除平面法に基づいて緩和された有限個の汎関数状態不等式制約を持つ最適制御問題に対して双対逐次2次計画法を適用するものであり,これにより元の状態不等式制約つき最適制御問題は一連の有限次元2次計画問題に変換される.本手法は状態不等式制約条件に対する乗数の非減少階段関数による逐次近似に基づく解法とみることもでき,特に高次の状態制約つき問題に対して有効であると考えられる.

キーワード:最適制御問題,状態制約,逐次2次計画,切除平面法.

全文pdf閲覧前画面に戻る


第53巻第2号375−389(2005)  特集「計算推論―モデリング・数理・アルゴリズム―」  [原著論文]

パーセント点に集計されたデータからの密度関数の推定
――バイアス・パズルの考察――

慶應義塾大学 小暮 厚之
岐阜大学 寒河江 雅彦

要旨

統計資料が公開される際に,原データの取り得る範囲をいくつかの区間に分割し,各区間ごとの度数データにまとめられることが多い.代表的な分割法に,各区間の長さが等しくなるように分割する方法と各区間の度数が等しくなるように分割する方法とがある.後者の分割法は,データを十分位数のようなパーセント点に集計することであり,データが密な領域では区間幅が狭く,疎な領域では区間幅が広くなるという特性を持つ.しかし,密度関数推定という観点から考えるとき,この等度数分割による度数表示が著しく大きなバイアスを引き起こす可能性についてはあまり知られていないようである.本稿では,このバイアス問題を理論的に考察し,そのひとつの対処法として,パーセント点に基づくビン化カーネル密度推定法を提案する.提案した手法の漸近的な性質を導くとともに,そのパフォーマンスをシミュレーションによって例示する.

キーワード:パーセント点,度数データ,ヒストグラム,カーネル推定量,バイアス.

全文pdf閲覧前画面に戻る


第53巻第2号391−404(2005)  特集「計算推論―モデリング・数理・アルゴリズム―」  [研究ノート]

層別最小二乗法
――重み付き最小二乗法の極限――

統計数理研究所 土谷 隆

要旨

重み付き最小二乗法は通常の最小二乗法のごく単純な一般化であり,適切な座標変換を施せば通常の最小二乗法に帰着する.ところが重みの間の比を無限大にした極限−これは重みに辞書式順序による大小関係が想定されている場合として考えることもできる−は座標変換によって取り扱うことができない例外的な場合である.実は,この意味での重み付き最小二乗解の極限が存在することが知られている.これを層別最小二乗解と呼ぶ.本論文では,重み付き最小二乗解と層別最小二乗解の差のノルムを「重み付き最小二乗問題の重みの比」と「最小二乗問題を定義する係数行列に関するある種の条件数」の関数として評価する.

キーワード:重み付き最小二乗法,条件数,内点法,層別最小二乗法.

全文pdf閲覧前画面に戻る