コラム

ギャンブルを繰り返す日々

中野 慎也(モデリング研究系)

 以前、韓国に行った時、食事をしていたレストランで日本語の達者な(ように見えた)店員に「コピーはいりますか?」と尋ねられて戸惑ったことがある。よくよく確認してみると、食後にコーヒーが欲しいかどうかを尋ねられていたのだった。韓国でコーヒーを意味する言葉が日本人の私にはコピーと聞こえたということだったらしい。コーヒーは英語ではcoffee、日本語のコーヒーの元になったとされるオランダ語ではkoffieと言う。私は専門家ではないが、日本語でも韓国語でもfに相当する音がなかったため、言葉を輸入したときに、自分たちの発音体系の中で似た音を当てはめた結果、こうなったのではないかと想像する。もっとも、日本語の「ヒ」という文字は、江戸時代より前には「フィ」にような音で発音されていたと聞くので、日本語自身の変化も多少関係しているのかもしれないが。

 いずれにしても、外来語が輸入されるときには、元々の発音を自分たちの言語の発音体系に当てはめるしかない。実際には、元の言語で発音される音が、手持ちの発音体系に一致しない場合も出てくるため、うまく元の音を表現できないこともある。一歩進んで、外国語として話そうとするときには、元の発音に近づくよう訓練を行うが、元の言語の発音を完璧に再現するのは非母国語話者には難しい場合もあり、時に試行錯誤を繰り返しながら意思疎通を図る必要が出てくることもある。

 さて、私の所属するデータ同化研究開発センターでは、「データ同化」という手法を研究している。データ同化とは、自然の法則などに基づいて現象の挙動を表現するシミュレーションモデルと、実際の観測データとをうまく合わせる(同化させる)手続きを意味する。シミュレーションモデルには、物理法則に基づいた高精度なものもあるが、どんな高精度なモデルでも完璧ではなく、どうしても実際の現象とは合わない部分が出てくる。データと合うようにシミュレーションモデルを調整すれば、再現の精度は向上できるが、シミュレーションモデルで表現できる以上のことはできない。これは、日本語話者が日本語の発音で外国語を話そうとしても、そのままではうまく意思疎通ができないのと似たような話である。そこで、データ同化では、シミュレーションモデルの不完全な部分も修正する手続き、つまり発音を修正して意思疎通できるようにするための訓練に相当する手続きも重要となってくる。

 コンピュータの発達した現在、コンピュータで試行錯誤を繰り返すことが、シミュレーションモデルを修正するために有効な手段の一つとなっている。コンピュータ上で乱数を用いて試行錯誤を繰り返す手法をモンテカルロ法と呼ぶが、統計数理研究所ではモンテカルロ法を用いたデータ同化手法を中心的な研究テーマの一つとして進めている。闇雲に博打を打ってもなかなかうまくは行かないが、適切に戦略を立てて効率的な訓練を行うことで、元の能力以上のものを引き出すことを目指している。

データ同化研究開発センターのホームページには、モンテカルロ法を活用していることに因んで、モンテカルロのカジノの写真が埋め込まれている。モンテカルロ法によるデータ同化手法の挙動を可視化した図。

ページトップへ