ミクロな物体の設計と統計学


統計数理研究所 予測制御研究系 伊庭幸人


本講演では、タンパク質のおもちゃ(格子上のHPモデル) を例にして、ミクロな物体の形状をどのように設計する かという問題を論じる。タンパク質については、アミノ 算の1次元配置を与えて、安定な形状を求めるという問題 (folding問題)が良く知られているが、ここで論じる問題 はその逆問題(inverse folding問題)である。すなわち、 ターゲットとなる形状(とアミノ酸間の相互作用)を与えて、 与えられた形状が安定な形状になるようなアミノ酸の配 列を求めるわけである。

巨視的な物体を設計するに当たっては、各部分を設計し それを組合わせて作るのが一般的である。これに対して ミクロな物体の設計では簡単に部分に分けて考えられな い点に難しさがある。また、設計の目標(最適化すべき 関数は何か)ということも必ずしも自明ではない。

最近、DeutschとKuroskyは設計の目標として「十分低い温度 での物体(タンパク質)の形状の確率分布がターゲットとなる 形状の上にできるだけ集中するような要素(アミノ酸)の 配置を探す」という規準を提案した。この規準は、 ターゲットがエネルギー最小の状態の一つであるだけ でなく他に同じエネルギーの状態が少ないこと、解がわずかな熱揺らぎに対して 安定であること、などの要求を採り入れて考えられたものである。

この規準が統計学の立場から興味深いのは、この定式化に よる設計問題は、 複雑な確率分布に対する最尤推定の問題 (たとえば種村と尾形による点配置パターンの解析) に形式的によく似ているという点である。実際、ターゲット をデータ、アミノ酸配置をパラメータに対応させれば、 どちらも与えられた事象の確率を最大にするようなもの を求める問題になっている。これらはまた、(Deutschらが すでに指摘しているが)ある種のニューラルネットの 学習のための規準とも類似している。

講演では、設計問題の概略を説明したのち、最尤推定やニューラルネット とのアナロジーから構成されたオリジナルのアルゴリズム (学習方程式法)を紹介する。また、時間があれば、タンパク質の 統計物理や進化に関する話題、他の設計の規準などにも触れる。


統計数理研究所のホームページへ

伊庭のホームページへ


iba@ism.ac.jp, September, 1997