総研大ジャーナル No.12 2007秋)

「赤池統計学の世界」 ノーカット版

 

 

 

統計地震学と赤池さん

 


 

 

総合研究大学院大学教授統計科学専攻長/情報・システム研究機構統計数理研究所教授

 


赤池さんと統計数理研究所

 

1973年秋,今と変わらない年寄り風の男が研究室に現れた。「君が本尾のところから来た新入りさんですか」これが赤池さんとの出会いであった。「本尾」とは私のゼミ教授の本尾実先生で,赤池さんとは若い時統数研で同僚の間柄であった。戦中戦後に青年期を過ごした世代の先生方はたいてい学生から「先生」と呼ばれるのを嫌がった。本尾さんは私に「少し変わった研究所だが研究する時間はたっぷりありますよ」と就職を勧めてくれたのであった。

私が大学院で学び研究したのは確率論,とくに確率過程論,統計力学・エルゴード理論と,時の学界の流れでは理論的成果が目覚しく蓄積され,自然界の確率現象について数学的昇華がなされた分野であった。それに比べて統数研では,現実との取り組みの死屍累々とした失敗の結果や遅々として進まない研究進捗の報告などが当時の私には目に付き,統計学研究の流れが全く見えない状態だったのである。アメリカから輸入された数理統計学も数学として深いものとは思えなかった。

しかし今となっては,成熟し昇華しきった伝統的な科学分野に比べ,ここで取り組まれていたものが我々の寄与できる余地の大きな分野だったということであった。統数研の先輩たちは世界で流行するアカデミズムに染まることなく、ユニークな問題に悪戦苦闘していたのが「変わった」研究所と思われていた一つの理由であることも分かった。そして赤池さんが研究所に踏み止まって打ち立てた新しい流れも、当時のアカデミズムからすれば異端であった。

 

AICとの出会い

 

日常直接的に指導を受けていたわけではないが,赤池さんの統計学への考え方の変遷は私の腑に落ちた。研究会でもセミナーでも赤池さんは議論好きであった。自分の研究が行き詰ると,同僚・後輩に議論を吹っ掛けるのである。私が研究所に入って初めて統計学の論文を書いた時の共著者の稲垣宣生さんは最尤法(後述)の漸近理論を専門としており,これは入所当時の私にとって身近な課題であった。赤池さんは稲垣さんに「時系列を含め統計モデルの推定法は最小2乗法で事足りる。なぜ最尤法なのか」と迫ったと言われる。この頃、赤池さんは時系列の最適な予測と制御のためにデータのどの位の過去の履歴に遡るべきか,その次数の決定に最小二乗法による予測誤差の2乗平均の推定量である最終予測誤差(FPE)を提案され,これが実用上著しく有効であった。しかし,フィードバックを有する相互相関のある多変量の時系列をどのように自然な形でFPEのように評価することになるのか。これが問題だったようである。

赤池さんが嗅ぎ付けたとおり,最尤法がその手掛かりを与えた。尤度は確率予測すべき分布密度関数にデータを代入したときのパラメタの関数で,これを最大化するパラメタ値が最尤推定値である。正規分布を予測誤差とする場合,対数尤度の最大化は最小2乗法になる(因みに,ガウスは逆に最小2乗法と最尤法の一致するものとして関数方程式を解いて正規分布を導いている)。 

予測誤差の2乗平均に対応するものは予測の良さを測る平均エントロピーであり,目指すはその最大化である。これはデータから将来を予測する最良のモデルを探るものである。統計学の古典的な尤度比検定や最尤法が優れて機能しているのも,これらがエントロピー最大化の原理に適っているためであった。赤池情報量基準(AIC)は平均エントロピーを最大対数尤度で補正したものである。AICによって多変量時系列でのFPEの一般化は自ら定まるし,その他のどんな統計モデルでも適用できる。AICは与えられたデータのもとでモデルの良さを予測の観点から評価するという極めて明快な解釈を持っており、データを扱う人々の支持を受けている。

AICを提案した当初から赤池さんは次のような考えを表明している。「統計モデルの相次ぐ提案無くしては統計科学の将来は考えられない」と。このように、周囲の若手研究者に各種統計的モデルの構築を促した。私は「統計モデル」と題する数理科学の特集の編集のお手伝いをし、点配置のデータからギブス分布の相互作用ポテンシャルを推定するようなモデルなどについて論じた。

 

点過程

 

1976年,英国シェフィールドに滞在していた清水良一さんの紹介で、赤池さんは時系列解析とは異なった分野の研究者を招き、引き合わせてくれた。ウェリントンVictoria大学のDavid Vere-Jones教授は点過程の理論とモデルで地震データに取り組んだ先駆者として知られていた。点過程は災害、故障、疾病、出生死亡の発生、神経スパイク列のように不規則かつ突発的な発生時刻列を抽象化した確率過程である。なかでも「条件付き強度関数」という新概念は、モデリングの観点から赤池さんの注目を浴びた。これは、事象(点)の発生し易さの瞬間的な強さである。時刻tまでの発生履歴や関連情報に依存して点の発生率が変化する。

これをモデル化し、パラメタを最尤法で推定することで、事象発生率(強度,危険度)を予測するのである。ここで最尤法が点過程モデルを含め広く実用化できたのは、赤池グループにおいて、最大対数尤度を計算するための,実用的な非線型最適化アルゴリズムが普及していたからである。このようなポテンシャルのもとで、最尤法と結びついた点過程の新しい統計モデルの理論と応用の研究が始まった。

 

地震活動研究との関わり

 

数年後,私はウェリントンに招かれるなど、Vere-Jonesさんとの長い付き合いが始まったわけであるが、彼は地震国同士の好で私に地震活動の研究を勧めたものである。しかし、地震発生には点過程では計り知れないメカニズムがあり、研究の評価が一生のうちに判明できるのかを考えると,取り組む研究対象としては余りに冒険的であった。むしろ赤池さんが制御工学の分野で繰り返し挑戦できたように、実験可能で直ちに研究結果の当否が出そうな神経系のシステム解析や、信頼性・待ち行列などにおける研究対象を探したものだった。しかし、企業秘密によるデータや情報の非公開もあって、駆け出しの統計屋の望むような実際研究の手懸かりは見つからなかった。

結局、気象庁などで膨大に蓄積公表されている地震発生データを相手に点過程の統計モデルの研究をすることに意を決め、地震研究者がどのようにデータを解析しているのかを学ぶために地震学会に出入りをするようになった。これにはもうひとつの理由があった。駆け出しの研究員であった頃の私に対して、赤池さんが「統計屋は本来行商人の如きものである。統計的方法という品物を売り歩き、役に立つ品物を作るための材料を仕入れるのに現場に足を運ぶのを惜しむな」また「統計屋の功績には新しい方法の提案や理論的解明など様々であるが、最高のものは科学技術の分野で統計学の応用の幅をひろげた時である」と語ったのが私の腑に落ちていたからである。事実、それまで赤池さんは、情報関連学会や制御関連学会に出向いて時系列解析の応用の幅を広げる努力をされ、その結果統計科学にとって重要な問題を取り込まれたのである。そのような赤池さんの思いは統計数理研究所の所長を退任されるときに私に残した言葉「尾形君、頼むから若い人や学生には本物の問題に取り組むように指導してくれ」にも現れている。しかし、今の世知辛い教育科学政策の中これは益々困難なことになっている。

 

地震活動の因果関係や季節性など

 

データが豊富にあっても問題意識が空疎であれば意味のある解析は望めない。私が求めて地震研究者と交わったのは、そういった問題意識と難しさが何処にあるかを知るためであった。地震活動の分野で昔から問題とされていたものは、地震発生の周期性や地域的関連性、地震の移動、地震活動のパタン分類、地震の規模(マグニチュード)分布の変化などがある。現在ではこれらの物理学的根拠が明らかになりつつあるが、当時はデータ解析そのものが疑問や議論を呼んでいた。主な理由は、余震や群発地震のような地震発生の続発性の扱いにあった。上記の諸問題に取り組むためには、地震の続発性を条件付き強度関数に組み込んだ点過程モデルが不可避であると考えた。

とくに地震発生の地域的関連性については数多くの報告事例があったが、宇津徳治博士の論文は興味を引いた。(1) 飛騨地域直下の深発地震発生の前後それぞれ半年間に起きた関東地域の地震の発生数がそれ以外の期間に起きたものより有意に多いのである。偶然の所作と見做すにはその確率はあまりに小さく、互いの地域の地震発生に何らかの物理的な関係がある事を示唆したものである。この報告は列島の下に沈み込む太平洋プレートの存在によって現実性を帯びていた。

私の興味は、その関係を具に調べることであった。どちらかの一方通行の因果関係なのか、双方向の励起なのか、それとも、直接的な相互関係ではないが何か第三の原因で両方共に励起されている帰結であるのか、という問題である。このことを相互相関関数で調べても,上述の問題を識別する結果は得られない。

条件付き強度関数に続発性の性質や上記の各仮説をモデル化し、データに対するそれぞれのモデルの適合性をAICによって比較した結果、深発地震が浅発地震を励起しているらしいことが分かった。同様に,この問題に使ったような点過程モデルによって各種異常現象の発生の地震発生への統計的因果関係を議論し、多かれ少なかれ前兆現象たりうるか否かを調べることができる。

赤池さんやVere-Jonesさんのつながりで尾池和夫さん(現京大学長)にも研究上のご交誼を頂き,地震活動についての様々な問題点を私に説いて頂いたものである。尾池さんは当時,降雨が地震の発生の引き金になりうる場合の研究をしておられた。西南日本などでの統計をとり、年間降雨量の変化率と地震発生数の年変化が良く似ていることを示している。このメカニズムは地殻中の断層内の水圧の増加が地震(断層運動)の引き金になるというものである。

この現象をデータで実証するには2つの難しさがあった。第一は、地震発生の続発性である。大きめの地震が起きると多くの余震が付くため、月別の度数がその影響を大きく受けてしまう。第二に、季節性を見るためには長期間の地震データが必要である。しかし、長期間には観測網の充実などによって地震の検出数に変化が出てきてデータが不均質となる。

そこで,条件付き強度関数を周期性と続発性と検出率の変化を示すトレンドの成分の和で表現し、各成分の次数をAICで決めることで有効な解析ができることを示した。全世界の地震帯を海域と陸域の100近い領域に分割した尾池グループの解析によると、中緯度の陸域で地震発生率に季節性があることが示され、これが当該地域の降雨量や地下水の変化に対応していること、低緯度の地域や海域の地震活動には季節性がみられないことが確認されている。

 

余震と大森宇津の公式

 

余震減衰の定量的な関係を初めて論じたのは大森房吉博士である。1894年,濃尾地震などの余震の頻度についてその減衰のしかたを調べて「物理現象の減衰だから当然指数関数だろうと考えて当てはめてみたが良く合わない、然るに双曲線だとよく適合する」と述べている。さらに1957年,宇津博士は単位時間あたりの余震頻度の減衰が

     (1)

 

の形になることを示した。ここでtは本震の発生時刻からの経過時間である。宇津博士は、余震の頻度n(t)と経過時間tを両対数方眼紙にプロットし、その減衰が直線上に乗ることを示し、直線の傾きを指数pの推定として得た。今でこそフラクタル次元の推定などで両対数プロットは良く使われているが、当時は全く創意的な方法であった。これがなくては余震活動の詳細な研究は進まなかったろう。

その後 (1) 式を条件付き強度関数と考え、余震発生を非定常ポアソン過程と見做し、発生時刻の記録をそのまま使う最尤法を提案した。今ではこれが余震活動のパラメタをK, c, pを求める標準的な方法になっている。現在,大地震が起きると、日本やカルフォルニアでは、直ちに (1) 式とマグニチュードの分布法則を計算して余震の確率予報が出されることになっている。

 

地震活動の標準モデル

 

いったん地震が起きると,その断層周辺の破壊応力が極端に高まり,多数の地震が誘発される。これが余震と呼ばれるもので,大きい地震には多くの余震が発生し,小さい地震でもそれなりの余震を誘発する。これらの地震活動を、各地震に対する(1) 式の大森宇津公式の重ね合わせとして表現し,余震数の大小がその地震の大きさ(マグニチュードMi)に関係した、次の条件付き強度関数を考えた。

 

   (2)

 

これは,疫学における確率分枝過程に遡り,点過程のモデリングとして様々な形が考えられたが,宇津博士によって研究された諸経験則に沿うものがAICで最も優れていた。Epidemic-Type Aftershock Sequence (ETAS) モデルと名づけられたこのモデルは地震活動の顔ともいうべき地域性を捉えることができ,地震活動の標準モデルとして国際的に受け入れられている。(2)

標準モデルを「ものさし」として使い、地震活動パタンの変化を検出することが特に大事である。たとえば標準モデルによって予測されたものより実際の地震発生が有意に少なくなる場合を静穏化現象と言うが,大地震や大余震の前に見られる例が多いので、これを有効に使った確率的予測を目指している。

他方,なぜ静穏化するのか。この解明のため、ETASモデルを解析ツールとして使い,地殻弾性体中の断層系をめぐるストレス変化と摩擦と破壊の理論と地震のメカニズムデータを手掛かりとして,或る仮説を支持する実例を蓄積している。これにGPSによる地殻の伸び縮みのデータ解析を併せて,大地震予測に関する手掛かりを探している。

 

ベイズモデルについて

 

1970年代末,例によって赤池さんがベイズ統計家を標榜している人達に議論を挑んでいた。これで,我々の間には,赤池さんがベイズに取り憑かれているらしい,との噂が立った。我々にとってベイズ統計はゲテモノであり魑魅魍魎であった。先験分布という概念をめぐって頻度主義と主観主義の間の絶え間ない哲学論争があり,それらは非生産的かつ不毛な議論にしか思われなかったからである。

最小AIC法の思想はなるべく少ないパラメタの簡素な最大尤度モデルで予測するというものであった。ところが,これと全く違った推定方式の一例が赤池さんを虜にしたらしい。それはチホノフ(TikhonovA.N.)の正則化と呼ばれる,パラメタ数がデータ数を上回る逆問題であった。最小2乗法でこれを解くためにはパラメタの変動を大きくしないという制約をつければ,安定した推定が可能であるというものである。ただし,どの程度の強さの制約をつけたら良いのかは全く匙加減である。

赤池さんはこの制約と匙加減を先験分布のモデリングの問題と捉えたのである。匙加減は超パラメタとして先験分布を特徴づけ,最適な匙加減を求めるために,前述のエントロピー最大化原理に基づいて理論を展開した。ベイズモデルの予測力を測る赤池ベイズ情報量規準(ABIC)はAICのベイズ版である。科学的経験や仮説に基づく先験的制約を自由自在にモデリングでき,その良し悪しがABICで比較できるのである。赤池さんは直ぐさま経済指標や測地データを,それぞれ,季節変動や地球潮汐に伴う変動とトレンド成分などに分解して見せた。計算機プリンターから出力結果を取り出すとき赤池さんは「データよりパラメタが多くても推定できるのですよ」と傍に居た技官に嬉しそうに語ったと言う。

データが豊富であればあるほど,その情報を十分汲み取るために、非定常または非一様なモデルを考慮する必要があり,そのために大規模な統計モデルが避けられない様になってきた。地震活動を計測するベイズ的時空間モデル(3)を開発し,地域的多様性や非定常性を定量的に捉え、地震活動と地殻内の応力分布や強度分布などとの関係の研究は地震予測の実用化に有力である。これには大量のパラメタが要り,ABICベイズ法の助けを必要とする。

一方,活断層発掘データのように不確定な,たった数件のエベント情報に対して,先験モデルに基づいた大地震の確率予測が実施されているが,ベイズ法はその不確定性を忠実に示すことができる。

 

 

 

*********

 

筆者プロフィール

尾形良彦(おがた・よしひこ)

 

統計モデルによってデータから本質を露出する。これは望遠鏡や顕微鏡のように辛うじて見えるものや見えないものをはっきり見えるようにする科学的方法としての役割を果たすものです。点過程を中心に各種統計モデルを考え,統計的方法の威力を示すように心がけ,地震活動研究、そして地震の予測に対する貢献を目指しています。

 

 

 

 

**********

 

Updated on 10 October 2007