第69巻第1号5−33(2021)  特集「マテリアルズインフォマティクスの最前線」  [総合報告]

マテリアルズインフォマティクス概説

統計数理研究所 吉田 亮

要旨

マテリアルズインフォマティクスの問題の多くは,順問題と逆問題の形式に帰着する.順問題の目的は,系の入力に対する出力の予測である.例えば,入力変数は材料の構造,出力変数は物性に相当する.これに対し,逆問題では文字通り逆方向の予測を行う.すなわち,出力の目標値を所与とし,それを達成する入力変数を予測する.データ科学の文脈では,このワークフローは材料の"表現・学習・生成"を行うことに相当する.記述子と呼ばれる特徴ベクトルを用いて材料の構造を"表現"し,データのパターンに基づいて構造から物性の数学的写像を"学習"する.さらに,モデルの逆写像を求めて所望の物性を有する材料を"生成"し,有望な候補を同定する.解析対象の変数は,分子,組成,結晶,混合物,プロセス,合成経路など,問題に応じて多様な形式をとる.本稿は,材料の表現・学習・生成という概念に基づき,マテリアルズインフォマティクスの諸問題と解析手法を概説する.

キーワード:物性,材料設計,合成,逆問題,記述子,生成モデル.


第69巻第1号35−47(2021)  特集「マテリアルズインフォマティクスの最前線」  [総合報告]

機械学習による機能性分子の自動設計:高熱伝導高分子材料の探索

統計数理研究所 吉田 亮
統計数理研究所 ウ ステファン
東京工業大学 森川 淳子

要旨

ベイズ推論や機械学習の解析技術を適用し,所望の特性を持つ化学構造を設計する.実験やシミュレーションから得られたデータを用いて,構造から特性の順方向の予測モデルを構築する.これに条件付き確率のベイズ則を適用し,特性から構造の逆方向の予測モデルを導く.さらに,このモデルから仮説分子を発生させることで,所望の特性を有する有望な候補を同定する.我々は,このようなアプローチを実践し,熱伝導率が0.41W/mKに達する可塑性プラスチックポリマーを発見した.これは典型的な無配向のポリアミド系高分子と比較して約80%の性能向上に相当する.本稿では,データ科学の非専門家を対象にベイズ推論に基づく分子設計アルゴリズムの技術解説を行い,高分子熱物性の研究への適用例を解説する.

キーワード:分子設計,ベイズ推論,転移学習,ポリマー,熱伝導率.


第69巻第1号49−63(2021)  特集「マテリアルズインフォマティクスの最前線」  [総合報告]

材料研究における転移学習の応用

統計数理研究所 劉 暢
統計数理研究所/東京薬科大学 山田 寛尚
統計数理研究所/総合研究大学院大学 ウ ステファン

要旨


材料研究のデータ量は,機械学習の他の応用分野に比べると圧倒的に少ない.このスモールデータの壁を乗り越えるために,転移学習を活用する.化学的特性,電気的特性,熱力学的特性,機械特性など,材料特性の間には物理化学的な依存関係が存在している.限られたデータからある特性を予測するために,十分なデータが利用可能な代理特性のモデルを事前に学習し,このモデルを目標物性の予測に利用する.このように他のドメインから獲得したモデルや特徴表現を目標ドメインの予測に利用することで,非常に少ないデータでも高い予測能力を持つモデルを構築できることがある.本稿では,高分子や無機材料を含む様々な問題設定で転移学習を適用し,その潜在的能力をデモンストレーションする.特に,転移学習を適用することで,訓練データ集合の分布の範囲を大きく逸脱した領域において予測能力を獲得した事例を報告する.

キーワード:転移学習,物性予測,スモールデータ,有機材料,ポリマー,無機材料.


第69巻第1号65−82(2021)  特集「マテリアルズインフォマティクスの最前線」  [総合報告]

高分子インフォマティクスの諸問題

統計数理研究所/総合研究大学院大学 ウ ステファン
統計数理研究所/東京薬科大学 山田 寛尚
統計数理研究所 林 慶浩
東京工業大学 ザメンゴ マッシミリアーノ

要旨

高分子はモノマー分子の設計やプロセス制御により様々な物理化学的特性を発現する.多様な機能を有する高分子の用途は,プラスチックやゴムのような日用品から電子材料や光学材料の部材など,極めて多岐に渡る.このような多機能性により,高分子は現代社会に欠かすことができない材料となっている.高分子インフォマティクスは,高分子科学,コンピュータサイエンス,機械学習の接点から生まれた学際領域である.高分子物性データと機械学習を組み合わせることで,機能性高分子の設計や材料創生のプロセスを加速させることが高分子インフォマティクスに課されたミッションである.近年,高分子材料の研究にデータ駆動型アプローチを導入する事例が増えてきているが,利用可能なデータが少ないことや統一的な構造表現の方法が欠如していること,高分子の構造物性相関が複雑な階層性を有することなど,様々な技術的・社会的課題が顕在化しつつある.本研究では,高分子物性データベース,高分子構造の数値表現,材料特性の予測,設計という四つの観点から,高分子インフォマティクスの現状と展望を論じる.

キーワード:高分子インフォマティクス,機械学習,ハイスループットスクリーニング,逆設計,実験計画法.


第69巻第1号83−97(2021)  特集「マテリアルズインフォマティクスの最前線」  [総合報告]

反応予測と合成経路設計の機械学習

統計数理研究所 郭 中梁

要旨

有機合成において,反応物から生成物を予測することを反応予測という.一方,合成目標の最終生成物から逆方向に反応経路を設計することを合成経路設計という.反応予測と合成経路の自動設計は50年以上前から研究されてきたが,近年,有機合成の研究分野に機械学習の先進技術が導入されたことで,モデルの予測精度が著しく向上した.本稿では,2017年以降に発表された化学反応を対象とする機械学習の解析技術を解説する.特に化学反応の順方向と逆方向予測の問題設定の違いに注目しながら,当該分野の研究動向を概説していく.また,我々のグループが発表したベイズ推論に基づく合成経路設計手法を簡単に紹介する.

キーワード:反応予測,合成経路設計,機械学習,ベイズ推論.


第69巻第1号99−118(2021)  [研究ノート]

ソーシャルメディア上のテキスト情報を考慮した社会ネットワーク分析モデル
—次数異質性モデルへの拡張—

東北大学 五十嵐 未来
東北大学 照井 伸彦

要旨

近年,社会ネットワークをモデル化して分析する際に,ネットワーク情報だけでなく,人々がソーシャルメディア上などで生成するテキスト情報を考慮してコミュニティ構造を捉えることの重要性が増している.テキスト情報を考慮することにより,ネットワーク上で密にエッジが形成されている構造の中に,人々が持つ興味や関心に応じた複数のまとまりが存在するというような複雑なコミュニティ構造を持つ社会ネットワークの分析が可能となる.本研究では,これをモデル化した先行研究によるネットワークデータとテキストデータの同時利用モデルを拡張し,社会ネットワークにおいて一般的な性質であるエッジの生成されやすさがノードごとに異なる次数異質性を考慮したモデルを提案する.Twitterを用いた実証分析では,テキスト情報の活用及び次数異質性の考慮が予測性能に与える影響を検証するため,複数の比較モデルと共に比較実験を行い,提案モデルが優れた予測性能を持つことを示した.

キーワード:社会ネットワーク分析,コミュニティ検出,テキスト解析,トピックモデリング,ベイズ推定,ノード次数異質性.