遺伝子多様性の統計解析グループ
バイオインフォマティクスの統計的課題である‘ p >> n ’ 問題に挑戦する.
バイオテクノロジーの急速な発展に伴い特徴次元 (パラメータ数) p は膨大となる一方で,観測数 n は被験者のインフォームドコンセントの問題,さらには生命倫理の問題まで深刻に関連するので一定数より大きくすることは困難である.
統計的な思考からありとあらゆるアプローチを尽くし,この問題の解決へ一歩でも近づくことを目指す.しかし,従来の統計理論の枠組みは漸近論に於いては,p は一定のもとで n → ∞ が基本である. このため新しい統計理論の枠組みを作ることから始めなくてはいけないが,現実には一塩基多型マイクロアレイプロテオームのデータが日々,世界的な規模で急速な勢いで得られている.理論と現実との整合性を保ちながら結果を出すことが我々の急務である.
        グル−プメンバー:
               江口  真透藤澤  洋徳栗木   哲池田  思朗,伏木  忠義,加藤昇吾
  
   


関連文献
     [8] Identifying haplotype block structure by using ancestor-derived model. H. Fujisawa, M. Isomura, S. Eguchi, M. Ushijima, S. Miyata, Y. Miki, M. Matsuura. To apper in J. Human Genetics, 2007. [abs] [preprint]

[7] Common peak approach using mass spectrometry data sets for predicting the effects of anticancer drugs on breast cancer. M. Ushijima, S. Miyata, S. Eguchi, M. Kawakita, M. Yoshimoto, T. Iwase, F. Akiyama, G. Sakamoto, K. Nagasaki, Y. Miki, T. Noda, Y. Hoshikawa and M. Matsuura. To apper in Cancer Informatics, 2007. [abs] [preprint]

[6] GroupAdaBoost: accurate prediction and selsection of important genes. T. Takenouchi, M. Ushijima, S. Eguchi. To appear IPSJ Transactions on Bioinformatics, 2007. [abst] [preprint
]

[5] Identification of biomarkers from mass spectrometry data using a "common" peak approach. T. Fushiki, H. Fujisawa and S. Eguchi. BMC Bioinformatics (2006) 7:358. [abst] [preprint]

[4] ゲノムデータ解析のための統計的方法を目指して. 江口真透. 特集 「予測と発見」 統計数理 54, 375-403, 2006 [abst] [pdf].

[3]DNA チップデータ解析において統計学の役割は何か? バイオテクノロジージャーナル 5,430-435, 羊土社, 江口真透. (2005) [pdf].

[2] GroupAdaBoost for selecting important genes. T. Takenouchi, M. Ushijima, S. Eguchi, Fifth IEEE Symposium on Bioinformatics and Bioengineering, 218-221 (2005). [abst] [pdf]

[1] Genotyping of single nucleotide polymorphism using model-based clustering.  H. Fujisawa, S. Eguchi, M. Ushijima, S. Miyata, Y. Miki, T. Muto and M. Matsuura. Bioinformatics 20 (2004) 718-726. [abst] [preprint]