研究紹介

非線型大気海洋結合データ同化の第二段階:最尤法へ

 時間発展を解くシミュレーションモデルを観測データに当てはめる作業をデータ同化といいます。データ同化は時系列解析の発展形であり、その特色は大規模・複雑なシステムモデル、多地点での観測データを扱う点にあります。このため、近似方法や計算アルゴリズムを考える必要がでてきます。現在のスーパーコンピュータといえども、確率分布の粒子近似に超多数の粒子を用いるとメモリに乗りませんし、常識的な時間内で計算を完了させるためにアルゴリズムに気を配る必要があります。我々データ同化グループでは、大気・海洋、津波、潮汐、宇宙空間、ゲノム情報という5つの領域を対象として、同化手法と応用の研究を進めています。

 さて、昨年春からラニーニャ現象が続いています。ラニーニャ現象とは、太平洋赤道域の東部の海面水温が平年より0.5度以上下がる現象です。日本では夏は猛暑になり、冬は寒くなる傾向があります。確かに昨年の夏は各地で観測史上最高気温が更新され、暑い夏でした。ただ、続く冬は厳寒であったかというと、それほどでもありませんでした。今年の夏はどうでしょうか?

顔写真

上野 玄太
予測発見戦略研究センター

 海水温が下がるラニーニャ現象、反対に上がるエルニーニョ現象は、海洋と大気の結合相互作用を含めたシミュレーションモデルにより、それなりに再現されます。我々の研究では、シミュレーションモデルに海面水位変動のデータを同化し、実際にはシミュレーションモデルほどは周期的でないエルニーニョ現象を正確に予測することを目的としています。

 データ同化の手順は、時系列解析で用いられる状態空間モデルの適用順そのものです。本稿では前稿(上野2005)に続いて、一通りのデータ同化計算ができるようになったあとで、尤度の最大化によるハイパーパラメータ(ノイズの共分散行列)の推定にまつわるハードルを述べることにします。

 最尤法なのだから、当然尤度の値を求めることが必要になるのですが、実はこれが曲者なのです。尤度は観測ノイズの確率分布により定式化されます。正規分布を仮定した場合、尤度は共分散行列の行列式の対数と逆行列を含んだ形で表されますが、それらが存在するための条件として、共分散行列が正値定符号行列であることが大前提となっています。ところが、この条件を満たす行列を「自分の好みに合うように」作成するのは実は容易ではありません。

 これまで、観測ノイズの共分散行列として、データからトレンドを除いた残差系列の標本共分散行列を使っていました。しかしこの行列はランク不足なのです。海面水位の観測システムの歴史はまだ浅く、観測地点数と比べて時点数が少ないことがその原因で、いわゆる新NP 問題(N を個体数、P を変量数としたときの大小関係N«P)の状況です。

 最も簡単な回避策は、対角成分だけを残し対角行列とすることですが、データが表す現象の多くを再現できるとはとても言いがたいシミュレーションモデルであることを鑑みると、観測ノイズを対角とするのはおこがましく感じます。次善策として、共分散行列の要素の値をガウス型関数などを用いて表現するといった処置をとる案もありますが、これでもデータの空間的な構造を相当に無視した仮定と思われます。

 そこで、共分散選択の考え方を応用し、ランク不足である標本共分散行列の構造をある程度維持しながらも、正則となる行列の設定法を与えました。変量間の条件つき独立性をパラメータ化することで、新たな共分散行列の推定をするのです。図は仮定した条件つき独立性を表す逆行列と、それに対応する正則な共分散行列を示しています。

図

ページトップへ