平成111999)年度 一般研究2実施報告書

 

課題番号

11−共研−2052

専門分類

7

研究課題名

分子系統樹推定の諸問題

フリガナ

代表者氏名

ハセガワ マサミ

長谷川 政美

ローマ字

Hasegawa Masami

所属機関

統計数理研究所

所属部局

予測制御研究系

職  名

教授

所在地

TEL

FAX

E-mail

URL

配分経費

研究費

0千円

旅 費

0千円

研究参加者数

11 人

 

 

 

研究目的と成果(経過)の概要

葉緑体DNAにコードされた蛋白質の一般的可逆マルコフモデルを開発した。最近多くの種から得られ
た葉緑体ゲノム・データから、置換確率行列を最尤法によって推定し、これをMOLPHYに組み込んだ。
以下に挙げるような生物系統学におけるさまざまな問題解決を通じて、解析方法の問題点を明らかに
し、解析法の改善にも貢献した。
1.ミトコンドリアDNAを用いた哺乳類の系統進化に関する研究:特にコウモリの起源について。
2.SINE flanking配列の解析とクジラの起源に関する研究。
3.爬虫類、特にカメ類の系統的な位置に関する研究
予測制御研究系・長谷川政美
 DNAの塩基配列を決定するための実験技術の近年における急速な進歩と、ゲ
ノム・プロジェクトをはじめとした生物科学における大規模なプロジェクトにより、
DNAの塩基配列データが大量に生産されるようになってきた。ところが、実験技術
の進歩に比べて、洪水のように生み出されるデータを解析し、生物科学にとって意
味のある情報を抽出するためのデータ解析技術の進歩が著しく立ち後れているのが
現状である。そのため、せっかくのデータが有効に活かされていないきらいがあり、
この面での進歩が望まれていた。本研究は、統計科学の立場からこのための新しい
データ解析法を確立することによって生物科学に貢献するとともに、統計科学の新
たな研究領域の開拓を目指したものである。
 このようなデータ解析において重要なものとして、分子進化学的視点がある。
生物学のあらゆる問題は、進化的な視点を抜きにしては成り立たない。生物の持っ
ているそれぞれの遺伝子は進化の産物であり、遺伝子の機能を理解するためにも、
進化の問題は避けられない。ゲノム・プロジェクトの成果が、本当に活かされるの
は、他の生物のデータとの比較を通じてである。比較することによって、生物のし
くみの普遍性と共に多様性が明らかになる。生物の普遍性と多様性のどちらも、生
物進化という観点からはじめてとらえることができるものである。そもそも、一つ
の生物種の遺伝子を調べても、そこから得られる情報は限られたものに過ぎない。
複数の生物の遺伝子を比較することによって得られる情報、つまり分子進化学的な
視点から得られる情報は、一つの生物の遺伝子だけから得られる情報に比べて桁違
いに多くなるのである。
 分子進化学的な解析の基本は、分子系統樹の推定である。これは、現存生物か
ら得られるDNAデータをもとにして過去の歴史を推定するということである。そ
もそも系統関係をしっかりと把握しない限り、ほとんどの進化的な議論は意味を持
たないのである。比較形態学に基づいたこれまでの系統学には同義反復的な議論が
多かった。そのような循環論から抜け出すためには、形態とは独立で、しかも形態
進化によくある収斂進化があまり効いてこないようなDNAなどの分子データに基
づいた分子系統学が有効である。しかしながら、直接的には確かめることのできな
い過去の進化の歴史を、現存生物のDNAデータから推測しようとするのだから、問
題は簡単ではない。分子系統樹を推定するにあたって、進化過程におけるDNAの
塩基置換や蛋白質のアミノ酸置換に関する何らかの仮定が必要である。分子進化過
程には、確率的な側面が重要である。なぜならば、DNA上の突然変異は多かれ少な
かれランダムに起こるものであり、突然変異遺伝子が集団に広まって固定するのも
、機会的な浮動による場合が多いと考えられるからである。このように、確率的な
進化過程の産物である現存生物のDNAデータから、進化の歴史を推定することは、
まさに統計的な推測になる。このような問題に対する統計科学における標準的な方
法が、確率モデルに基づく最尤法である。
 われわれは、最尤法による分子系統樹推定プログラム・パッケージMOLPHY
を開発し、1992年以来一般に公開してきた。MOLPHYは現在世界各地の研究者に
よって利用されており、これを使った論文も最近急速に増えてきた。しかしながら、
MOLPHYにはまだまだ改良を加えなければならない余地が多く残されている。問
題は大きく分けて2つある。一つは、最尤法で系統樹を推定するには、可能な系統
樹のトポロジーのうちで尤度が最大になるものを選び出さなければならないが、種
の数が増えると、可能な系統樹の数が、爆発的に増えるということがある。このよ
うな困難に対処するために、MOLPHYでは近似尤度法や局所的再配置法などを開
発したが、急速にデータが増えている現状で実用的な方法であるためには、これだ
けでは不十分である。もう一つの問題は、モデリングである。分子系統樹推定に際
しては、DNAの塩基置換や蛋白質のアミノ酸置換に関する確率モデルが必要である
が、これは必然的に実際の過程の単純化になる。しかしながら、仮定したモデルが
実際の過程と大きく違った場合には、偏った

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

Appropriate likelihood ratio tests and marginal distributions for evolutionary tree models with
constraints on parameters.
R.Ota,P.J.Waddell,M.Hasegawa,H.Shimodaira and H.Kishino(2000)
Mol.Biol.Evol.,17:798--803
Plastid genome phylogeny and a model of amino acid substitution for proteins encoded by chloroplast
DNA.
J.Adachi,P.Waddell,W.Martin and M.Hasegawa(2000)
J.Mol.Evol.,50:348--358
Model dependence of the phylogenetic inference:Relationship among carnivores,perissodactyls and
cetartiodactyls as inferred from mitochondrial genome sequences.
Y.Cao,K.S.Kim,J.H.Ha and M.Hasegawa(1999)
Genes Genet.Syst.,74:211-217

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

 

研究参加者一覧

氏名

所属機関

足立 淳

University of Oxford

Austin, Christopher

統計数理研究所

Ota, Rissa

総合研究大学院大学

岸野 洋久

東京大学

Shedlock, Andrew

統計数理研究所

下平 英寿

統計数理研究所

Cao, Ying

統計数理研究所

橋本 哲男

統計数理研究所

Butler,Marguerite

統計数理研究所

Lum, Koji

統計数理研究所