第60巻第2号239−250(2012)  特集「多様性と進化の統計解析」  [研究詳解]

ネットワーク構造の統計的な推定手法について

東京大学大学院/科学技術振興機構さきがけ 増田 直紀

要旨

ここ15年ほど,ネットワークの研究が盛んになり,ネットワーク科学,複雑ネットワークといった研究分野で呼ばれるようになってきている.ここで言うネットワークとは,グラフ理論の指すグラフと同義である.様々な種類の実際のグラフがデータとして入手できるようになってきたことなどを背景として,統計物理学,応用数学,ウェブ工学などの分野の研究者が主になって研究が始まり,現在は様々な研究領域を巻き込んで研究が拡大している.データを相手とする以上,統計科学は様々な形でこれらのネットワーク研究に応用されうる.本稿では,ネットワークの構造をデータから最尤推定する2つの方法について簡単に紹介する.1つ目は Newman と Leicht が提案したネットワーク構造の最尤推定手法である.この手法では,1つのグラフがいくつかのグループに分割され,同じグループに属する頂点は統計的な意味で同じような所へ直接リンクしやすいと仮定した上で,結合確率や頂点のグループ分けを規定する変数の値を最尤推定する.2つ目は,最大エントロピー法による相互作用の推定手法である.これは古典的な方法ではあるが,近年,多点で同時記録される神経活動データ解析への応用とそれにまつわる理論の発展が進んでいる.

キーワード:グラフ,ネットワーク,コミュニティ構造,EM アルゴリズム,イジングモデル.


第60巻第2号251−262(2012)  特集「多様性と進化の統計解析」  [総合報告]

有限集団における進化ゲーム理論の発展

総合研究大学院大学/科学技術振興機構さきがけ 大槻 久

要旨

従来の進化ゲーム理論では無限集団が想定され,決定論的な動学が用いられることがほとんどだった.Nowak et al.(2004)の研究をきっかけとして,近年有限集団における進化ゲーム理論が急速に発展を遂げつつある.そこでは遺伝的浮動が本質的な役割を果たし,戦略の固定確率が進化的有利度の指標となる.確率性を含んだ動学を用いることで,従来の理論ではできなかった予測を立てることが可能になった.例えば,複数のESS(進化的に安定な戦略)が存在する場合に,有限集団の進化ゲーム理論を用いればどのESSが最も実現しやすいかを理論的に予測することができるようになった.

本稿ではNowak et al.(2004)による基本モデルを紹介し,その様々な拡張について紹介する.

キーワード:進化ゲーム,有限集団,固定確率,ESS,1/3-法則.


第60巻第2号263−278(2012)  特集「多様性と進化の統計解析」  [研究詳解]

α多様性の測定と確率文字列の理論

京都大学化学研究所 小谷野 仁

要旨

ある領域に生息する生物の群集がどれぐらい多様な種や個体からなっているかをα多様性と言う.本稿では,これまでに提案されてきた様々なα多様性の測定方法を分類し,重要なものを概観した上で,文字列の集合上に Levenshtein 距離を定義して距離空間とし,そこで確率論を展開することによって,配列レベルでα多様性を測定するための方法を提案した著者らの最近の研究を紹介する.この研究においては,位置の尺度として,平均の代わりにコンセンサス配列が,散らばりの尺度として,分散の代わりにコンセンサス配列からの Levenshtein 距離の平均が採用され,これらに対して展開された漸近理論が測定方法の数理的基礎になっている.最後に,動植物と比較してα多様性の測定が困難であった微生物群集に対する著者らの方法の応用について述べる.

キーワード:α多様性,16S リボソーム RNA 遺伝子配列,確率文字列,コンセンサス 配列,Levenshtein 距離,階層分散.


第60巻第2号279−288(2012)  特集「多様性と進化の統計解析」  [研究詳解]

分子系統学における代数的方法

University of Kentucky Ruriko Yoshida
(訳:間野修平)

要旨

近年,現代生物学と高等数学の間で多くの共同研究がなされている.成長しつつある代数統計学は,組み合わせ論,計算代数,多面体幾何の方法を統計的計算とモデリングに適用する分野であるが,計算生物学との間に多くの重要な関係が確立している.系統学は,系統学的不変量,樹空間の幾何,系統の再構築の解析など,代数統計学の豊富な応用対象を提供してきた.本詳解の目的は,この分野の導入,さらに知るための網羅的ではない手引き,さらに代数的手法が分子系統学の文脈で用いられている具体的な事例をいくつか与えることにある.

キーワード:代数統計学,系統学.


第60巻第2号289−303(2012)  特集「多様性と進化の統計解析」  [研究ノート]

配列組成の不均一性が分子系統解析の頑健性に及ぼす影響:タンパク質コード遺伝子を想定したシミュレーションによる評価

筑波大学 石川 奏太
筑波大学 橋本 哲男

要旨

遺伝子配列の塩基・アミノ酸組成が生物間において極端に不均一であるとき,組成の均一性を仮定する一般的な分子系統解析は誤った進化系統樹の推測結果をもたらすことが多い.本研究ではこの問題を定量的に評価するために,タンパク質コード遺伝子に基づく解析を想定し,シミュレーション実験による検証を行った.まず,コドンの第一,第二,第三座位それぞれのアデニン+チミン含量(AT含量)が生物間で不均一なタンパク質コード遺伝子の配列データおよびモデル系統樹を用意し,コドン置換モデルを用いて最尤法により枝長などのパラメータを推定した.その際,系統樹上で各コドン座位の塩基組成が不均一であることを許容する置換モデルを使用した.最尤推定されたパラメータを用いて,コドン置換モデルに基づきモンテカルロシミュレーション法による配列生成を行うことで,塩基組成およびアミノ酸組成が配列間で不均一な仮想的配列データを生成した.得られたデータに対し,各系統での配列組成の均一性を仮定する一般的な置換モデルによる解析を行った結果,塩基配列・アミノ酸配列いずれに基づく解析でも,真の系統樹は殆ど復元されず,AT含量やアミノ酸組成の類似した配列が互いに近縁関係にあることを示す系統樹(アーティファクト)が高頻度で誘導された.本研究は,タンパク質コード遺伝子における生物間での配列組成の不均一性が一般的な分子系統解析の精度にどれほどの悪影響を与えるかという問題に対し,初めての定量的評価を与えたものである.

キーワード:分子系統樹の推測,最尤法,塩基・アミノ酸組成の不均一性,コドン置換モデル,シミュレーション,モデル不整合.


第60巻第2号305−316(2012)  特集「多様性と進化の統計解析」  [研究詳解]

ウイルスタンパク質変異にかかる多様化圧の空間分布

高知大学 渡部 輝明
東京大学 岸野 洋久

要旨

タンパク質は従来から備えている機能を変化させたり,新規に機能を獲得したりすることで環境に適応する能力を有している.この環境適応はアミノ酸配列置換によってもたらされるが,アミノ酸配列の置換は遺伝子上で起こった突然変異が淘汰された結果である.そのため突然変異の淘汰は環境に特有の選択圧のもとで行われ,進化の過程において変化する環境に依存していくものと考えられる.つまりタンパク質適応進化について理解するためには,選択圧の時空間的な揺らぎを解明することが重要となる.我々は階層ベイズモデルを通して,タンパク質表面における選択圧の空間分布を検出する方法を開発した.この方法は磁性体物理の分野で理論的枠組みが確立したイジング模型を用いて構築されており,選択圧の空間集積性の強さと広さを決める超パラメータは周辺尤度を最大化することで決定可能である.事前分布のモデルは正規化が困難であるため,熱力学的積分のアイデアを利用した方法により対数周辺尤度を計算する.この方法をインフルエンザウイルスのヘマグルチニンタンパク質に適用し,選択圧の空間分布を検出した.

キーワード:分子進化,選択圧,空間分布,階層ベイズモデル,イジング模型.


第60巻第2号317−325(2012)  特集「多様性と進化の統計解析」  [研究ノート]

Extended Haplotype Homozygosity(EHH)を用いる正の自然選択検出法の検出力比較

筑波大学大学院 大橋 順

要旨

最近作用した自然選択の痕跡を検出する目的で,REHH法やiHS法など,extended haplotype homozygosity(EHH)を用いる検定手法が広く利用されている.しかし,REHH法の検定統計量は,頻繁に正の無限大に発散するという欠点がある.そこで本研究では,EHHの定義を変更することで,検定統計量が発散することのない新たなREHH法(改良REHH法)を提案する.合体(合祖)シミュレーションにより,自然選択強度やテストアリルの到達頻度が異なるいくつかのパラメタセットに対し,0.01cM間隔で連鎖する101個のSNPからなるハプロタイプデータを作製した.作製したハプロタイプデータにREHH法,改良REHH法,iHS法を適用し,それらの検出力を求めた.検出力を比較したところ,ほとんどのパラメタセットに対して,REHH法の検出力がもっとも低かった.また,テストアリルの集団頻度が低い場合はiHS法の検出力が最も高く,頻度が高い場合は改良REHH法の検出力が最も高いことがわかった.今回の結果は,テストアリルの集団頻度に応じて,改良REHH法とiHS法を使い分ければ,検出力の増加が見込めることを示唆する.

キーワード:単塩基多型(SNP),自然選択,extended haplotype homozygosity(EHH),integrated EHH(iHH),integrated haplotype score (iHS),relative EHH(REHH).


第60巻第2号327−339(2012)  特集「多様性と進化の統計解析」  [総合報告]

Wright-Fisher拡散モデルの一般化と関連する話題

佐賀大学大学院 半田 賢司

要旨

Wright-Fisher拡散モデルは集団遺伝学における最も基本的なモデルの一つである.その数学的定式化と付随する問題を議論したFeller(1951)の論文が出てから60年が経過した.その間,同モデルの研究は多様な一般化が生み出されたり様々な文脈との関連が明らかになるなどして,大きな‘進化’を遂げてきた.本稿では,そのような事柄のいくつかを解説する.

キーワード:集団遺伝学,拡散過程,分枝過程,測度値拡散過程, 定常分布.


第60巻第2号341−352(2012)  特集「多様性と進化の統計解析」  [研究詳解]

小分散漸近理論を用いた集団遺伝学的研究

統計数理研究所 三浦 千明

要旨

本稿では,集団遺伝学の概要について解説すると共に,集団内に生じた突然変異体の頻度の推移的な変化を解析的に表示する為に,小分散漸近理論を応用した著者自身による研究を紹介する.これによって今まで解析的な表示がなかった複雑なモデルに対しても近似的な公式が与えられるようになった.集団遺伝のモデルは台が常に有界なのに対して,漸近展開は正規分布に沿った形で与えられる.それゆえ突然変異率が低い場合に,近似公式はうまく働かない.しかし時間があまり経過していない場合や突然変異率が高い場合には,近似公式はよく機能する事が確認できた.

キーワード:小分散漸近理論,頻度分布,正規近似.