平成272015)年度 一般研究2実施報告書

 

課題番号

27−共研−2023

分野分類

統計数理研究所内分野分類

c

主要研究分野分類

4

研究課題名

疾患原因となるDNA塩基対互変異性体を識別するためのナノバイオセンサー分子の統計科学的探索

フリガナ

代表者氏名

ホンゴウ ケンタ

本郷 研太

ローマ字

Hongo Kenta

所属機関

北陸先端科学技術大学院大学

所属部局

情報科学研究科

職  名

助教

配分経費

研究費

40千円

旅 費

28千円

研究参加者数

4 人

 

 

研究目的と成果(経過)の概要

 近年、電子状態計算や分子動力学計算などのシミュレーション技術が進展し、実験と比較できるほどの信頼性の高い計算結果が得られるようになってきた。しかしながら、昨今の大型計算機の性能をフル活用しても、広大な化合物空間に存在する天文学的数の候補分子に対して、その物性量を現実的な時間内に算出することは凡そ不可能である。から所望の分子を探索することは容易でない。本研究は、近年、大きな進展を遂げている統計的アプローチに基づき、広大な化合物空間から所望の物性を持つ分子を探索する枠組みの構築を目的とする。具体的な問題設定として、ナノバイオセンサー分子探索を目標とする。ナノバイオセンサー機能を有する分子を探索できれば、特定疾患の検出や遺伝子診断など、多くの応用研究展開が期待できる。
 本提案手法の開発は、(1) (未知)化合物の物性予測を行うための応答曲線の算出(順問題)と (2) (1)の応用曲線を利用した、所望物性実現のための分子設計(逆問題)の2つからなる。本年度は、順問題における物性予測モデル構築に必要となるデータ・セットを第一原理計算(B3LYP/6-31G**レベル)により生成した。これらのデータ・セットを利用して、ナノバイオセンセー分子の探索に必要となるHOMO-LUMOギャップを予測する統計モデルを構築した(予測性能:MAE=0.28eV)。この統計モデルを尤度としてベイズの定理により反転させて、事後分布を構築し、逐次モンテカルロ法により、所望のHOMO-LUMOギャップを持つ分子を探索した。本研究では、化合物構造のSMILES表記に基づく自然言語処理モデルを利用して「化合物らしさ」を化合物データベースから学習して、事前分布としている。実証計算として、所与のHOMO-LUMOギャップ領域に対して、領域外に存在するフェノール分子のような簡単な分子から出発しても、非常に効率よく、所望の領域に属する分子を探索することができた。これらの成果については、国内学会や研究会にて発表を行っており、また、現在、原著論文に取りまとめている。

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

1) "統計的言語モデルに基づく化学構造の特徴抽出と分子設計への応用",◯池端久貴、本郷研太、磯村哲、前園涼、吉田亮,科研費シンポジウム「統計学と機械学習における数理とモデリング」,東工大、東京都,2016/2/21-2016/2/22
2) "言語モデルベースの化学構造生成手法の提案と生体活性分子をターゲットにしたInverse-QSARモデルへの適用",◯池端久貴、本郷研太、磯村哲、前園涼、吉田亮,情報処理学会第45回バイオ情報学研究会,能美市、石川県,2016/3/18-2016/3/19
3) "ガウス過程の混合エキスパートモデルによる化学構造からの物性予測とその逆問題",◯池端久貴、本郷研太、磯村哲、前園涼、吉田亮,2015年度統計関連学会連合大会,岡山大、岡山県岡山市,2015/9/6-2015/9/9
4) "ガウス過程の混合エキスパートモデルによる化学構造からの物性予測とその逆問題",◯池端久貴、本郷研太、磯村哲、前園涼、吉田亮,統計サマーセミナー2015,下関市、山口県,2015/8/5-2015/8/8

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

該当せず。

 

研究参加者一覧

氏名

所属機関

池端 久貴

総合研究大学院大学

前園 涼

北陸先端科学技術大学院大学

吉田 亮

統計数理研究所