第47巻第1号3-27(1999)  特集「統計基礎理論」 [原著論文]

モデル選択理論の新展開

統計数理研究所 下平英寿

要旨

確率モデルに基づくデータ解析の有効性は,様々な分野の応用を通して示されてきた.しかし対象に関する事前知識だけから適切なモデルをひとつに決めることは一般に困難であり,データに基づいてモデルを選択する方法が必要になる.赤池は予測の観点からモデルの良さを評価するための情報量規準を提案し,データ解析におけるモデリングの重要性を説いた.現在では,情報量規準は種々のものが提案されており,使われる状況に応じてそれらを使い分ける必要がある.本稿では,推測方式に応じた情報量規準の導出を議論し,またモデル選択の一致性についても調べる.一致性はサンプルサイズが大きくなる極限での問題だが,実際のデータ解析ではサンプルサイズは有限である.従ってどの規準を使うにしてもそのサンプリングエラーを考慮して,モデル選択の信頼性(又は不確実性)を定量的に評価することが重要である.このためのいくつかの方法(ブートストラップ選択確率,モデル選択検定,多重比較によるモデルの信頼集合)を議論する.さらに,探索的モデル構築のために,予測分布の相対的な関係を直接視覚化するためのグラフィカルな方法の有効性を,重回帰の変数選択や遺伝データ解析を数値例にあげて示す.

キーワード:情報量規準,AIC,予測分布,変数選択,ベイズモデル,多重比較法.


第47巻第1号29-48(1999)  特集「統計基礎理論」 [研究詳解]

概パラメトリック推測
――柔らかなモデルの構築――

統計数理研究所 江口真透

要旨

パラメトリックな方法論とノンパラメトリックな方法論のギャップを埋めるためにセミパラメトリック推測の理論が発展しつつある.本論では,そのようなアプローチの一つである概パラメトリック推測について紹介する.その方法は,最尤法とパラメトリックモデルの強固な関係を緩和させるためにモデルをそのチューブ近傍の中に拡げ,データへの仮定を緩和させる.特長はパラメトリック推測の有効性を失わずに,より柔らかな仮定の下でも性能が保たれる点にある.その適用例として次の3例を紹介する:(1)密度推定のための局所尤度法,(2)自己組織化ルールによる尤度法,特に主成分分析法のロバスト推論,(3)観測バイアスの感度分析のための選択性パラメーターの尤度解析.いくつかの数値例を通してこの概パラメトリック推測論の良さを示す.

キーワード:概パラメトリックス,観測バイアス,局所尤度,自己組織化ルール,主成分分析,選択性パラメーター.


第47巻第1号49-61(1999)  特集「統計基礎理論」 [原著論文]

擬似尤度の構築と非線型回帰モデルへの応用

統計数理研究所 汪 金芳

要旨

スコア推定関数は母数空間上の勾配ベクトル場を成している.勾配ベクトル場を取り扱うことは便利である.例えば,勾配場の沈点(源点),すなわち,尤度方程式の解は,尤度関数の局所最大値(最小値)として解釈できる.一般に,擬似スコアのような2次のモーメントに基づいて構成される推定関数は勾配場ではない.この場合,推定方程式による推測は尤度推論と本質的な違いがある.例えば,推定方程式の根がある統計的に意味をもつスカラー関数の極値としての解釈ができなくなる.したがって,推定方程式の多重根から一致推定値とそうでないものを見分けるようなことは更に困難である.本論文では,推定関数の不可積分問題を紹介するとともに,Wang(1999, Ann. Inst. Statist. Math., 51(to appear))で提案されたHelmholtz型擬似尤度を概観し,その正当性について更に議論した後,ブートストラップ法を用いた擬似尤度比検定に基づく多重根の選択法を提案する.例として,測定誤差がある場合のロジスティック回帰モデルへの応用を示す.

キーワード:ブートストラップ法,推定関数,一般化線型模型,変数誤差モデル,多重根,ベクトル場.


第47巻第1号63-69(1999)  特集「統計基礎理論」 [研究ノート]

不変確率モデルの特徴付け

統計数理研究所 紙屋英彦

要旨

不変性に基づく統計的推測理論に於いては,通常,基礎となる分布が不変確率モデルと呼ばれる分布族に属するという仮定の下で,議論が展開される.本稿では,不変確率モデルの特徴付けの問題を取り上げる.そして,標本空間・パラメタ空間が作用群と同型ではない一般的な設定に於いて,密度関数の関数形を明示的に指定するという形で,不変確率モデルの特徴付けを与える.

キーワード:不変確率モデル,群の作用,軌道,グローバル・クロス・セクション,オービタル分解,最大不変量.


第47巻第1号71-79(1999)  特集「統計基礎理論」 [研究ノート]

標識実験におけるPaulik-Seber推定に対する考察
――局外母数が存在する時の補助性・十分性から――

東京水産大学 山田作太郎・北門利英

要旨

不完全報告を含む標識実験による資源量の推定問題を考える.このモデルには,報告率および資源量の2つのパラメータが含まれる.この問題に対する既存の研究では,前者は条件付分布,後者は周辺分布を基に推定が議論されてきた.この論文では,これらの推定方法に対する正当化を,局外母数が存在する時の補助性・十分性という観点から行った.

キーワード:補助性,十分性,局外母数,不完全観測,標識実験.


第47巻第1号81-90(1999)  特集「統計基礎理論」 [原著論文]

事前分布が曖昧な場合のBayes検定の限界

統計数理研究所 柳本武美

要旨

統計的検定に対する批判の一つに,Lindleyのパラドックスがある.検定では有意水準αを決めて,帰無仮説の下で確率αでのみその仮説を棄却する.しかし標本サイズnが大きいときには一致性がある方が良いとする批判である.モデル選択でも同様の議論がある.  本稿では,この批判はデータの情報量が大きい一方,事前情報の情報量が相対的に小さい場合の扱い方であることを明確にする.例えば母数の推定量の分散に比べて事前分布の分散が大きい場合である.この場合を事前分布が曖昧であると呼ぶ.事前分布が曖昧な場合には直観的に考えても事前分布を利用するメリットはない.更にこの場合が余り現実的でないこと,標本サイズに対する配慮が乏しいこと,更に事後分布の解釈が困難であることを示した.結論として科学的推論のためには事前分布が曖昧な場合のBayes検定が有益でないことを主張した.

キーワード:事後分布,検定の一致性,モデル選択,信頼区間,統計的検定.


第47巻第1号91-104(1999)  特集「統計基礎理論」 [研究ノート]

高次マルコフ連鎖における離散確率分布について

統計数理研究所 内田雅之

要旨

X-m+1, X-m+2,..., X0, X1, X2,... を時間一様な{0, 1}-値のm-th order Markov chainとする.このマルコフ従属列X1, X2,... における幾何分布とオーダーkの幾何分布を求める.また,マルコフ従属列X1, X2,..., Xnにおける二項分布とオーダーkの二項分布の導出を行なう.ここで,オーダーkの二項分布には次の4つの連の数え方を採用する.つまり,長さkの成功連をオーバーラップしないで数える数え方,長さk以上の成功連を数える数え方,長さkの成功連をオーバーラップして数える数え方,そしてちょうど長さkの成功連を数える数え方である.そこで,上の4種類の数え方によるオーダーkの二項分布に対して,統一的な表現を与え,さらに,二項分布とオーダーkの二項分布との関係を明らかにする.

キーワード:幾何分布,二項分布,オーダーkの幾何分布,オーダーkの二項分布,確率母関数,マルコフ連鎖.


第47巻第1号105-118(1999)  特集「統計基礎理論」 [研究詳解]

確率生成母関数の活用

統計数理研究所 平野勝臣
大阪大学大学院 安芸重雄

要旨

独立ベルヌーイ試行の系列をマルコフ従属系列に拡張したとき,成功連に関する離散分布の問題は確率生成母関数(pgf)を用いて解析できることを示す.成功連に関する待ち時間問題の例では,条件付きpgfについての線形方程式を漸次構成し,これらを解くことによって解析する方法を示す.またpgfを求める一つの方法として,この母関数の母関数を解析することによって,もとの母関数を求める方法(蝦蟇の油法)の具体例,pgfが有理関数で与えられたとき,この母関数を持つ分布の確率を計算するための漸化式,成功連に関する離散分布の問題をマルコフチェインへ埋め込む方法,などが報告される.

キーワード:確率生成母関数,連の分布論,マルコフ従属試行,待ち時間問題.


第47巻第1号119-142(1999)  特集「統計基礎理論」 [原著論文]

不完全ガンマ関数比の評価不等式

統計数理研究所 松縄 規
中央大学大学院 武井智裕

要旨

統計学の基礎理論をはじめ自然科学の理論の多くの分野で非常にしばしば遭遇する不完全ガンマ関数比についての近似の評価を様々な状況の下で系統的に与える.各近似はできるだけ精密に上下からの不等式を用いて行えるように与えられている.本稿では,不完全ガンマ関数のパラメータが[a]正整数の場合,[b]一般の正の実数の場合,について詳しい近似解析が行われている.両者の上下界の導出はかなり異なる形でなされている.[a]に関して,重要な三つの型の存在とそれぞれに対する精度の高い上下界が与えられている.[b]については,不完全ガンマ関数比の主要変数が大きい時と小さい時の二通りについて考察されている.従来これはという結果がなかったと思われる前者の場合について,詳しい評価不等式が導出されている.応用として,正規分布の裾確率を理論的に評価する有用な上下界が与えられている.[b]で主要変数が小さい時についても精度の良い新しい二重評価不等式が与えられている.得られた諸不等式の精度を視覚的に把握するために,関連する数値計算やグラフも示されている.

キーワード:不完全ガンマ関数比,近似理論,二重評価不等式,Maclaurin公式,逆階乗級数,絶対収束級数,Ramanujan予想.


第47巻第1号143-156(1999)  特集「統計基礎理論」 [研究詳解]

正則変動性で特徴付けられる分布族の分解問題(U)

統計数理研究所 志村隆彰

要旨

正則変動性で特徴付けされる分布族に対し,Mellin-Stieltjes 合成積(MS-合成積 と記す) 及び,その意味での分解について考察した.[0, \infty) 上の分布 μ, ν のMS-合成積とはX, Y をそれぞれ μ, ν に従う独立な確率変数としたときの積 XY の分布をいい,μ \circ ν で表す.μ, ν を μ \circ ν の因子と呼ぶ.α 次の切断積率が緩慢変動する分布の全体を M(α) (α>0),分布の裾が指数 -α の正則変動する分布の全体を D(α) (α > 0) とする.これらはともにMS-合成積について閉じた分布族であるが,主な関心はこれらに属する分布の因子が元の分布族に属するのかということにある.M(α) の部分族のいくつかについてはそれに属する分布の全ての因子が M(α) に入ることがいえる.ところが,M(α) 自身については 必ずしもそれに属する分布の全ての因子が M(α) に属するとは限らない.このことは それ自身は M(α) には属さないが,α 次の積率が発散する任意の M(α) の分布との MS-合成積 が常に M(α) に入るような分布が存在することによって示される.一方,D(α) については α=0 と α>0 で結果がかなり異なる.μ \circ ν \in D(α) を仮定したとき,α=0 ならば,ν の ε(>0) 次の積率が有限であることから, μ \in D(0) がいえる.ところが,α>0 の場合は ν の台が有限集合であっても D(α) に属さない分布とのMS-合成積が D(α) に入ることがありうることが分った.

キーワード:正則変動関数,Mellin-Stieltjes 合成積,分布の裾,切断積率,分布の分解.


第47巻第1号157-174(1999)  特集「統計基礎理論」 [研究詳解]

マルチンゲール確率場に対するエントロピー法と
その統計的応用

統計数理研究所 西山陽一

要旨

エントロピー法は,集合や関数によって添字づけられたI.I.D.データの経験分布過程に対する大数の法則や中心極限定理を確立するために,1980年代に研究された.さらに,最近のいくつかの論文はエントロピー法が他の統計的問題にも有用であることを示してきている.しかしながら,この方法のある部分はI.I.D.でないデータにも適用出来る可能性を秘めているにも拘わらず,マルチンゲールの枠組みでの体系的な研究はまだなされていない.マルチンゲールは重要な概念であることを考慮し,我々は文献のこのギャップを埋めるためのステップをつくることを意図する.

1節ではOssianderの中心極限定理の一般化に関する直感的な説明を通じて,エントロピー法の一般化のポイントがどこにあるかを解説する.簡明のため,本稿の残りの部分は連続マルチンゲールに限定して話を進める.2節では,本研究の鍵となるquadratic modulusという量を導入し,その言葉で最大不等式を与える.3節では弱収束定理を与える.それらを用いてカーネル推定量の局所確率場の漸近挙動,いくつかのM-推定量の収束率,積分型推定量の漸近正規性などを導出する.

キーワード:マルチンゲール,最大不等式,中心極限定理,カーネル推定量,変化点,最尤推定量.


第47巻第1号175-199(1999)  特集「統計基礎理論」 [研究詳解]

Malliavin解析と統計的漸近理論

名古屋大学 阪本雄二
東京大学 吉田朋広

要旨

漸近展開の導出においては,確率変数の分布の滑らかさをどのように捉えるかが問題になるが,連続時間確率過程の汎関数を扱うためには,無限次元解析が必要になり,Malliavin解析が解決の鍵となる.Malliavin解析では部分積分の公式が重要な役割を演じるが,我々は有限次元の場合から始め,この理論の雛形について考察する.つぎに,Malliavin解析の基礎に関して解説し,一般化Wiener汎関数の漸近展開の理論およびその統計学への応用について述べる.さらに,縮小推定量にたいする展開公式もこのような一般論から導けることを示す.

キーワード:Steinの等式,部分積分の公式,Sobolev空間,一般化Wiener汎関数,拡散過程,縮小推定量.


第47巻第1号201-221(1999)  特集「統計基礎理論」 [研究詳解]

正規確率場の最大値の分布
――tubeの方法とEuler標数の方法――

統計数理研究所 栗木哲
東京大学 竹村彰通

要旨

Xt),t \in I,を平均0,分散1の正規確率場でXt) = Σi =1p φitzi と表されるものとする.ここでzi は独立な標準正規変量,φit)は I 上の滑らかな関数である.また同じ記号を用いて確率場 Ut) = Σi =1p φityi を定義する.ただし(y1,..., yp)を単位球面上の一様分布に従う長さ1の確率ベクトルとする.本論文では最初に,これらの確率場の最大値の分布の上側裾確率を求めるためのtubeの方法について解説する.次に,同じ目的のためのもう一つの方法であるEuler標数の方法の考え方を説明する.さらに確率場 Xt),Ut)の場合においてはEuler標数の方法はtubeの方法に帰着されることを示す.またそのことからtubeの方法によって得られる裾確率の漸近展開の係数と添字集合のEuler標数との間の関係式を証明する.最後に例題として,対称正規分布の最大固有値分布の裾確率の漸近展開を示す.

キーワード:Gauss-Bonnetの定理,Karhunen-Loeve展開,積分幾何学,裾確率,tube公式,漸近展開.


第47巻第1号223-241(1999)  [原著論文]

前震を事前識別する統計モデルと
その予測評価法

統計数理研究所 尾形良彦
統計数理研究所(外来研究員) 宇津徳治

要旨

ある所で地震活動が始まる.それは段違いに大きな地震の前震かもしれないし,ほぼ同規模の地震が続く群発型地震かもしれない.しかし中でも,先頭が最大の地震である本震・余震型が7〜8割を占め最も多い.もし,これらのなかで前震型であることが,なんらかの情報で高い確率で予測できるならば防災上の価値は高い.本稿では,活動中の地震群(複数の地震)の時間・空間的集中度とマグニチュード列の増減パタンに関する効果的な識別情報に基づいて,この条件付き確率をリアルタイムで予測する統計モデルを構成した.前震型の平均頻度は6〜7%であるが,このモデルによる予測確率の変動は0〜30%程度である.この確率予測の有効性は二項確率試行のAICの比較や分割表のAIC比較によって示すことができた.これとは別に,最初の地震が起きた時点でも,この地震が前震である確率の地域性(震央位置の関数)をベイズ型平滑法によって推定できる.この場合の前震型の平均頻度は4%弱であるが,平滑化された地域性による条件付き確率の変動は1〜10%である.さらに,これらの2つの確率予測(条件つき確率)を複合予測公式によって組み合わせれば更に有効な確率予測になっていることが確かめられた.

キーワード:マグニチュード差,震央間距離,ロジットモデル,地震発生時刻差,確率予測,複合予測公式.