平成61994)年度 共同研究A実施報告書

 

課題番号

6−共研−74

専門分類

7

研究課題名

分子系統樹推定法の開発

フリガナ

代表者氏名

ハセガワ マサミ

長谷川 政美

ローマ字

所属機関

統計数理研究所

所属部局

予測制御研究系

職  名

教授

所在地

TEL

FAX

E-mail

URL

配分経費

研究費

0千円

旅 費

0千円

研究参加者数

9 人

 

 

 

研究目的と成果(経過)の概要

遺伝子構造データ(塩基、アミノ酸の配列データ)に基づき、最尤法により分子系統樹を推定するための統計的方法の開発を行うとともに、解析ソフトウエアを整備する。さらに、開発された方法を分子系統学上重要と思われる具体的な問題に積極的に適用し、生物の系統進化や遺伝子進化に関する知見を得ることにより、この分野における統計的方法の有効性を確立することを目指す。


遺伝子構造データ(塩基、アミノ酸配列のデータ)をもとに、最尤法により分子系統樹を推定するための統計的方法の開発とその応用を行なうことを目的として研究を進めている。本年度は以下に示すような成果を得た。
(1)最尤法で仮定する塩基やアミノ酸置換の確率モデルとして、これまで用いてきたものに加え新しいものを導入し、それらをAICに基づいて評価した。
(2)分子系統樹推定における最尤法の最大の欠点は、OTUの数が増えると膨大な計算時間がかかるということであるが、これを克服するために、トポロジー探索法をさまざまな視点から検討し効率のよいスクリーニング法を開発した。現在、一度に200OTU以上を取り扱える状態になっている。
(3)データ解析のためのソフトウエアの整備を行ない、多くのユーザーに配布した。
(4)開発された方法を分子系統学上重要な問題、すなわち、ヒトの起源、脊椎動物内部の系統関係、高等真核生物の分岐過程、真核生物の起源と初期進化の過程、古細菌の系統的位置、などに具体的に適用し生物学的に新しい知見を得た。
(5)具体的なデータ解析上の問題点として、1つの遺伝子に基づく結論の不安定性、アウトグループの相違が解析結果に及ぼす影響、塩基のGC含有量の偏りが解析結果を誤らせる危険性などを指摘した。


 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

Cao, Y., Adachi, J., Yano, T., and Hasegawa, M., Phylogenetic place of Guinea pigs: no support of the rodent-polyphyly hypothesis from maximum-likelihood analyses of multiple protein sequences, Molecular Biology and Evolution, Vol. 11, No. 4, 1994
Cao, Y., Adachi, J., Janke, A., Paabo, S., and Hasegawa, M., Phylogenetic relationships among eutherian orders estimated from inferred sequences of mitochondrial proteins: instability of a tree based on a single gene, Journal of Molecular Evolution, Vol. 39, 1994
Adachi, J. and Hasegawa, M., Phylogeny of whales: dependence of the inference on species sampling, Molecular Biology and Evolution, Vol. 12, No. 1, 1995

Hashimoto, T., Nakamura, Y., and Hasegawa, M., Phylogenetic place of a mitochondrion-lacking protozoan, Giardia lamblia, inferred from amino acid sequences of conservative proteins, 10th ISEP meeting, 1994,8,9
足立淳,長谷川政美,塩基およびアミノ酸置換確率行列の最尤推定,日本遺伝学会第66回大会,1994,10,9

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

1)最尤法で仮定する塩基やアミノ酸置換に関する確率モデルとしてこれまでに考案したものの他に新たなものの導入を試みる。とくにアミノ酸置換に関しては、置換の傾向がタンパク質の種類によって異なるので、ミトコンドリア、葉緑体などのオルガネラにコードされたタンパク質や、核にコードされた各種のタンパク質ファミリーごとに置換モデルを構築する。
2)分子系統樹の推定における最尤法の現在の欠点は、種の数が増えると膨大な計算時間がかかるということである。そこで、すべてのトポロジーに対する最尤法の計算を行うのではなく、最尤法の近似となるような簡便法を開発し、スクリーニングの結果有望であるようなトポロジーについてのみ最尤法での計算を行うという方法を考える。トポロジーの探索に際しては、組合わせ的最適化の手法を導入する。
3)実際のデータ解析により開発された方法の有効性を検討する。
4)分子系統学上の具体的な問題への適用を行う。大規模データの処理、計算を行うため、統計数理研究所における共同研究体制が必要である。


 

研究参加者一覧

氏名

所属機関

足立 淳

オックスフォード大学

岡田 典弘

東京工業大学

岸野 洋久

東京大学

Cao Ying

統計数理研究所

土谷 隆

統計数理研究所

橋本 哲男

統計数理研究所

細谷 将彦

琉球大学

矢野 隆昭

昭和大学