平成282016)年度 一般研究2実施報告書

 

課題番号

28−共研−2050

分野分類

統計数理研究所内分野分類

g

主要研究分野分類

3

研究課題名

Discrete PCA を用いたライフサイエンス分野データの分解・高解像度化法の検討と周辺技術の開発

フリガナ

代表者氏名

ウメダ タカヨシ

梅田 高呂

ローマ字

Umeda Takayoshi

所属機関

東京大学

所属部局

先端科学技術研究センター

職  名

特任研究員

配分経費

研究費

40千円

旅 費

0千円

研究参加者数

2 人

 

 

研究目的と成果(経過)の概要

近年、急激な増加を見せるNGSデータ、DNAマイクロアレイデータを生物学的な現象と整合性を持たせた状態での統計学的手法を用いて高解像度化・分解する方法を提案した。分解結果は予想通り生物学的な整合性の崩壊は現行ではみられず、現在普及している計測機器の有効な利用法になり得ることが示唆された。

実験に用いた検体は、酵母DNAマイクロアレイデータ及び癌NGSデータである。癌データは医学研究に用いられる標準的な手法にて加工されたものを使用した。

酵母データは細胞周期の状態を計測するために10年ほど前に行われたものであり公開されている、近年普及している単細胞解析技術より精確なものが低コストで得られる可能性が示唆された。NGSデータは疎な計測になりがちで且つ計測が独立のため確率的なノイズが生じやすいがDNAマイクロアレイの方が群としての計測と考えればノイズの構成要因が減ることは利点と言える。DNAマイクロアレイ技術を再評価しても良いかもしれない。
今後の課題として出て来た分解データの順序系統付けが挙げられる。生物学的には高解像度化も有意義であるが、関係性がなければ解釈に使用できない。これを数理的に推測する方法の開発が望まれる。

癌データは代表者が所属する研究室が別の目的で計測したものを同僚の好意により提供して頂いた。ただし未発表データのため詳細は伏せる。複数の臓器で発生した癌を事前情報なしで臓器の判別等への使用可能性が示唆された。類似目的で使用されるプログラムより短時間で済み優れている可能性が示唆された。

本研究で用いた分解手法の数理モデルの欠点として、未計測データおよび存在しない数値の取り扱いに関しては依然課題が残る。現状では近似値や概要をとるのには十分実用的であると考えられるが、生物学的・物質として存在しない、転写されていないRNAなどの取り扱いが確率的に取り扱われる点においては検討が必要であろう。より柔軟で現象に即してモデル及び推測法の開発が望まれる。

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

* Buntine, W., Jakaulin, A.: Discrete principal component analysis. Technical report, HIIT (2005)

他多数

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

研究会は開催しておりません。

 

研究参加者一覧

氏名

所属機関

間野 修平

統計数理研究所