第56巻第1号3−18(2008)  特集「分子進化と統計科学」  [研究詳解]

滑らかでない境界をもつ領域のための
マルチスケール・ブートストラップ法の理論と実装

東京工業大学 下平 英寿

要旨

データ解析から得られる結果の信頼度を計算するためにブートストラップ法が広く利用されている.その信頼度はブートストラップ確率と呼ばれ,仮説検定の$p$-値として解釈するとバイアスがあることが知られている.そこでバイアス補正をおこなって精度の高い信頼度を計算するためにマルチスケール・ブートストラップ法が考案された.当初は仮説境界が滑らかであることを前提としていたが,現在では境界が滑らかでない場合に一般化された.分子系統樹推定および階層型クラスタリングの実例を通して,このアルゴリズムの理論と実装を解説する.

キーワード:近似的に不偏な検定,ブートストラップ確率,バイアス補正,スケール変換則,系統樹推定.


第56巻第1号19−35(2008)  特集「分子進化と統計科学」  [研究詳解]

ゲノム系統学的手法の応用と課題
—真獣類の起源に関する解析を例として—

東京工業大学大学院 西原 秀典
東京工業大学大学院 岡田 典弘
復旦大学 長谷川 政美

要旨

近年のゲノムプロジェクトの急速な進行とともに,様々な生物種に関して全ゲノム規模のデータを用いた系統樹推定(Phylogenomics)がおこなわれるようになってきた.配列データ量の増加が系統解析に有用であることは言うまでもないが,もし系統樹推定の際に仮定する進化モデルに偏りがあった場合,誤った結論を導いてしまうことがある.本稿では,大量の遺伝子配列を結合させたデータセットの解析(Concatenate model)ではおそらく誤りであろう系統仮説を強く支持したが,遺伝子ごとに異なる進化モデルを仮定した場合(Separate model)はその系統樹推定の偏りが激減するという極端な例を紹介する.本研究では2,789個の遺伝子配列(1Mbp以上)のデータセットを用い,真獣類の初期進化,すなわちアフリカ獣類,貧歯類,北方獣類の間の系統関係に関して最尤法を用いた解析をおこなった.その結果,従来の一般的な解析方法である塩基配列のConcatenate modelではアフリカ獣類と貧歯類の単系統性が100%のブートストラップ(BP)値を伴って支持されたが,遺伝子間で異なる進化速度・進化パターンを仮定するSeparate modelではその仮説がほとんど支持されなかった.この結果から,遺伝子配列データが膨大であっても全配列に対して同一の進化モデルを仮定してしまうと誤った結論を導くことになってしまうことがあり,それを避けるためには進化速度・進化パターンが遺伝子ごとに異なることを仮定するSeparate modelを適用すべきであることが示された.

キーワード:真獣類の初期進化,分子系統樹の最尤推定,ゲノム系統学,Separate model.


第56巻第1号37−54(2008)  特集「分子進化と統計科学」  [研究詳解]

コドンモデルを用いた分岐年代のベイズ推定

東京大学 徐 泰健
東京大学 岸野 洋久
North Carolina State UniversityJeffrey L. Thorne

要旨

進化研究において,種の分岐,環境による淘汰圧とそれに対する適応の推定は中心的な役割を担う.我々は2004年,分岐年代と同義・非同義置換速度の変動を同時推定する階層ベイズモデルを発表した.この方法は進化速度の一定性を仮定せず,これら2種類の分子進化速度に2変量幾何ブラウン運動の事前分布を導入する.本稿ではさらにこのモデルを拡張し,複数の遺伝子を解析する推定法を開発した.これにより,分岐年代の推定精度が向上するとともに,分子進化速度の変動の固有性と共通性,遺伝子間の相関を見ることで,背景にある因子に迫り,遺伝子間の共進化を検出する可能性が開かれた.ここでは,我々のベイズ推定法を説明し,哺乳類のミトコンドリアゲノムにコードされる12種類のタンパク質遺伝子を解析する.

キーワード:分子時計,分岐年代,コドンモデル,適応進化,ベイズ法,階層モデル.


第56巻第1号55−66(2008)  特集「分子進化と統計科学」  [研究詳解]

遺伝子型の分子進化と表現型の適応進化

高知大学 渡部 輝明
東京大学 徐 泰健
東京大学 岸野 洋久

要旨

本稿では,著者たちの最近の研究をベースとして,配列の分子進化から淘汰圧を受けた表現型の適応進化へのつながりを,定量的に説明する試みを紹介する.合体過程と分子進化の統計モデルを通して,宿主内のHIV集団に配列進化と集団の大きさの間の負の相関が見られることを示す.この負の相関は,分子進化の多くが中立または弱有害の突然変異で駆動されているとする説と矛盾しない.続いて,タンパク質構造のデータベースの情報を利用して,配列の構造への適合度を経験尤度の形で定義し,HIVのV3ループにおける微細構造の感染後の変異の大きさが分子進化速度と正に相関することを見る.さらに,タンパク質複合体の結合能を,結合状態と自由状態の尤度比で定義し,インフルエンザウイルスHAと4種類の抗体との結合能の長期変化を推定する.淘汰圧の強さとパターンが表現型のダイナミックスに影響を与えていることを見る.

キーワード:配列進化,構造進化,合体過程,分子進化.


第56巻第1号67−79(2008)  特集「分子進化と統計科学」  [原著論文]

トーラス型学習領域を持つ自己組織化マップ法を用いたゲノム配列の系統関係

総合研究大学院大学 洞田 慎一
長浜バイオ大学 池村 淑道
総合研究大学院大学 湯川 哲之

要旨

ニューラルネットワーク・アルゴリズムを応用した自己組織化マップ法(SOM)によるクラスタ分類をゲノム配列に応用し,クラスタ間の相対関係からゲノム間の系統関係を議論する.SOMをゲノム配列解析に適用すると,断片配列の連文字頻度分布のクラスタ分類から,大量の入力データに対しても効率よく系統群の分類が行えることが知られている.本研究では,分類されたクラスタの相対関係から入力したゲノム配列の間に存在する系統関係を考察する目的のために,クラスタ間の相対関係を評価可能なトーラス型SOMを用いた解析方法を紹介する.これにより,クラスタ間の相対関係が明確化し,近接するクラスタの距離解析からゲノム配列の系統解析が可能となる.実際にインフルエンザウィルスに対する推定をSOM解析により評価した.

キーワード:SOM,自己組織化マップ,バイオインフォマティクス,ゲノム配列,連文字頻度解析.


第56巻第1号81−99(2008)  特集「分子進化と統計科学」  [研究詳解]

鰭脚類の起源と進化

復旦大学/総合研究大学院大学 米澤 隆弘
国立科学博物館 甲能 直樹
復旦大学/総合研究大学院大学/統計数理研究所 長谷川 政美

要旨

鰭脚(ききゃく)類は,鰭状の四肢を持つ食肉目の中の系統群であるが,その起源と内部の系統関係に関しては統一見解が得られていないのが現状である.本稿では,その研究史を概説し,分子配列データによる系統樹推定と共に古生物学的・地史学的観点からも考察を行う.同時に,分子系統樹推定におけるモデル選択の重要性を議論する.

キーワード:鰭脚類,アシカ科,アザラシ科,セイウチ科,分子系統樹推定,分岐年代推定.


第56巻第1号101−116(2008)  特集「分子進化と統計科学」  [研究詳解]

霊長類のミトコンドリアDNAにおける進化速度

統計数理研究所/現 京都大学 松井 淳
University of AntananarivoFelix Rakotondraparany
宝来 聰 (2004年8月10日逝去)
統計数理研究所/復旦大学 長谷川 政美

要旨

我々は,ヴェローシファカ(Propithecus verreauxii )の糞サンプルから,そのミトコンドリアDNA全塩基配列を決定し,14種の霊長目のデータと共に解析を試みた.アミノ酸配列から得られた系統樹で,明らかに真猿類の枝の長さが原猿類の枝に比べて長くなっていた.最尤法で分子時計が成り立つか検定すると,真猿類の進化速度は原猿類のものと有意に異なり,増大していた.

これには(i)真猿類で非同義置換・同義置換サイトの両方の変異率が増大している,(ii)変異率は変わらないが,真猿類でアミノ酸置換(非同義置換)に進化速度の増大がおこっている,の2通りの可能性が考えられる.

これらを区別するために,系統樹のそれぞれの枝で,非同義置換率$dN$ と同義置換率$dS$ の比$\omega$($=dN/dS$)を推定した.$\omega$が1をこえる($dN/dS>1$)場合,自然選択の重要な目安となるが,$\omega$が1をこえるような枝はみつからなかった.しかしながら,真猿類の$\omega$は原猿類のそれよりも2倍以上大きいことが見出された.こうして真猿類のアミノ酸置換速度が増大したことが示唆された.ここから,真猿類のミトコンドリアタンパク質の機能的制約が緩んだ,あるいはさらに適応的な進化がおこっている可能性が考えられる.

キーワード:霊長目,ミトコンドリアDNA,進化速度,同義置換,非同義置換,適応進化.


第56巻第1号117−131(2008)  特集「分子進化と統計科学」  [研究詳解]

歯鯨亜目の単系統性に関するこれまでの研究とSINE法によるその再検証

東京工業大学大学院 二階堂 雅人
東京工業大学大学院 Oliver Piskurek
東京工業大学大学院 岡田 典弘

要旨

歯鯨亜目の単系統性は形態学的にゆるぎないものと考えられてきた.しかし1990年半ばから台頭し始めた分子系統学的な解析では,歯鯨亜目は単系統群を形成しないとするものが大半であり,分子,形態による研究者間で激しい議論が続いていた.その中で我々のグループはこれまでにマッコウクジラやイルカなどが含まれるハクジラ類に共通なSINE挿入遺伝子座を3座位単離し,歯鯨亜目の単系統性をDNAレベルで提唱してきた.しかし我々の研究以外にDNAレベルで歯鯨亜目の単系統性を十分な統計的な信頼度をもって支持しているものは未だになく,我々のSINE研究における方法上のバイアスを指摘する声もあった.そこで我々はSINE法の方法論的なバイアスの可能性を完全に排除して,再度歯鯨亜目の単系統性を検証した.その結果,歯鯨亜目の単系統性を示唆する遺伝子座がさらに9座位単離され,さらにはそれと相反するようなデータは得られなかった.この事より,DNAレベルにおいても歯鯨亜目の単系統性が強く示唆されるとともに,既存の配列比較による系統推定法によりこれらのグループの系統推定が非常に困難であることが示唆され,10年以上続いた歯鯨亜目単系統議論に終止符をうつことができた.

キーワード:SINE,歯鯨亜目,マッコウクジラ,ゲノムライブラリースクリーニング.


第56巻第1号133−144(2008)  特集「分子進化と統計科学」  [研究詳解]

ミトコンドリアDNA全長配列に基づいた
ペンギン目に関する系統解析

東京工業大学大学院 渡辺 麻衣子
東京工業大学大学院 岡田 典弘
復旦大学 長谷川 政美

要旨

本稿では,著者等自身によるミトコンドリアDNA全長配列に基づく系統解析を主軸として,鳥類におけるペンギン目の系統学的位置を明らかにすることを目的とした分子系統学的研究について詳述する.これらの研究の結果,現生のペンギン類に最も近縁である種は何かということを解明するための新たな課題が明らかとなったのでこれを考察する.

キーワード:分子系統樹推定,最尤法,ミトコンドリアDNA,ペンギン,コウノトリ.


第56巻第1号145−164(2008)  特集「分子進化と統計科学」  [研究詳解]

複数遺伝子の結合データに基づく分子系統樹の推測
—真核生物の大系統の解析を例として—

筑波大学大学院/筑波大学 橋本 哲男
大阪大学 有末 伸子
筑波大学大学院 坂口 美亜子
筑波大学大学院/筑波大学 稲垣 祐司

要旨

複数の遺伝子のもつ情報を結合して最尤法により分子進化系統樹に関する推測を行うための方法論の概略を述べ,真核生物の大系統の問題に関するデータ解析の実例を示した.

結合のための統計モデルとして,単に個々の遺伝子(もしくは全データセットを構成する個々の‘区分’)の連結データに対して1セットの枝長を推定する「連結モデル」,個別の遺伝子(区分)それぞれについて独立に枝長の推定を行う「分離モデル」,枝長が遺伝子(区分)間で比例しているという仮定を置く「比例モデル」の3つのモデルを取り上げ,真核生物29種からなる53個のリボソームタンパク質全5,842座位のデータに適用した.枝長の推定法とデータの分割法に関して,異なる6種類のモデルによる解析をAICにより比較した結果,リボソームの大小サブユニット区分による分離モデルのAIC値が最も低く,このモデルの適合が最も良いことが明らかとなった.遺伝子区分による分離モデルのAIC値は最も高く,パラメータが過剰であると考えられた.このことから,53個のリボソームタンパク質間で進化パターンが比較的均質である可能性が示唆された.系統樹の樹型の選択という観点からは,6種類の解析結果に大差はなく,今回のリボソームタンパク質による解析結果は頑健なものと考えられた.

キーワード:分子系統樹の推測,最尤法,複数遺伝子による解析,真核生物,大系統,リボソームタンパク質.