平成282016)年度 一般研究1実施報告書

 

課題番号

28−共研−1025

分野分類

統計数理研究所内分野分類

h

主要研究分野分類

3

研究課題名

タンパク質電子構造におけるデータマイニング研究

フリガナ

代表者氏名

サトウ フミトシ

佐藤 文俊

ローマ字

Sato Fumitoshi

所属機関

東京大学

所属部局

生産技術研究所

職  名

教授

 

 

研究目的と成果(経過)の概要

 我々はタンパク質などの巨大分子の電子状態をありのまま計算する量子化学計算プログラムProteinDFの開発を行っている。
本プログラムは、Gauss型基底関数展開に基づく密度汎関数法を採用しており、
世界で最も大きなカノニカル全電子波動関数計算を達成したプログラムである。
また、大規模分子量子化学計算に必要な初期値を構築するQCLO法プログラムを開発し、インターネット上で公開している。
このように、タンパク質の電子状態解明に必要な基盤技術が整いつつある。
次のステップとして、立体構造が明らかとなっているタンパク質の電子状態をそれぞれ算出し、
それらをデータベース化することによって、タンパク質の機能と電子状態の関係を解明したい。
この関係性はタンパク質工学における性能改良・新規機能付加に大きく寄与するものと期待される。
 タンパク質の電子状態を系統的に求め、タンパク質構造との関連性を探ることは、タンパク質工学の発展に重要な役割を果たすと考えられる。
本研究では、量子論に基づくタンパク質電子状態計算の高速化ならびに自動化と、
タンパク質特有の構造に注目したデータマイニング技術の開発を目的とする。
これは、タンパク質の電子状態インフォマティクスともいえる。

本年度は以下の項目を実施した。
1. タンパク質全電子計算のハイスループット化・半自動化
最新のスパコンを利用してもタンパク質のカノニカル全電子計算は多くの時間と経験を要する。
ProteinDFエンジンのさらなる高速化や構造最適化アルゴリズムの改良を図るとともに、
失敗・再計算を少なくした半自動タンパク質全電子計算法の開発を行った。
2.タンパク質波動関数・電子状態データと原子電荷のデータマイニング技術の開発
ドメインなどのタンパク質特有の構造は、アミノ酸配列と立体構造情報から分類されてきたが、
大量のタンパク質電子構造データを解析することで、電子構造に基づくタンパク質固有構造を新たに分類することができると期待される。
その過程で、全電子計算により得られる真の電荷分布と構造との相関も明らかとなる。
多数の巨大なタンパク質電子構造データに対するデータベース開発を行うとともに、
タンパク質構造や機能の視点から電子構造データをクラスタリングする手法を開発する。

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

1. 平野敏行, 佐藤文俊, "罰則付き回帰法に基づくタンパク質原子電荷の計算と性質", 第39回ケモインフォマティクス討論会 (2016)
2. T.Hirano, F.Sato, "A theoretical study of glucose oxidase using canonical molecular orbital calculation", The 57th Sanibel Symposium, US, 2017
3. http://proteindf.github.io/
4. http://satolab.iis.u-tokyo.ac.jp/

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

研究会の開催なし。

 

研究参加者一覧

氏名

所属機関

王 笛申

東京大学

金 泰煥

東京大学

平野 敏行

東京大学