今年4月、統計数理研究所に新たなセンターが誕生した。医学・健康科学領域における先進的なデータサイエンスの研究・教育を推進することを目的とする医療健康データ科学研究センターだ。ここでは、研究プロジェクトの一つ「マルチモーダル生体信号データの時空間解析プロジェクト」の概要とともに、同センターの方向性を紹介する。
統計教育・研究支援とデータサイエンスの高度化が使命

医学の世界で、科学的根拠に基づく医療の実践(EBM:Evidence-Based Medicine)が提唱されはじめたのは1990年代のこと。以降、その普及とともに、医療統計学の重要性はますます高まっている。
ところが、日本の医学アカデミアでは統計教育の体制づくりが遅れ、統計学の専門家が極端に不足しているのが実情だ。例えば、海外の医学ジャーナルに論文を投稿した日本人研究者が、レビュアーから統計解析を求められたものの対応ができないというケースも少なくない。このままでは、臨床研究における日本の情報発信力の低下にもつながるとの懸念がある。
こうした状況を受けて今年4月、統計数理研究所に新たに設立されたのが、「医療健康データ科学研究センター」だ。組織体制は9人の所内教員と、12人の客員教授、7人の客員准教授、2人の外来研究員からなる総勢30人。センター長には、医学統計の第一人者である伊藤陽一教授が迎えられた。
「現代の医学アカデミアで行われる臨床研究・臨床試験では、高度な統計解析手法を用いたデータ解析が必須なものになっています。先端医学研究の国際競争をリードするためにも、統計教育や研究支援体制の整備と、データサイエンス研究の高度化は喫緊の課題。当センターは、この2点を最大のミッションとしています」。伊藤センター長はそう現状を見据え、使命を語る。
教育面では、全国の大学の医療・健康科学分野の研究者を対象としたデータサイエンスの教育コースと公開講座を実施する。初年度の2018年度は、生物統計学基礎、疫学・公衆衛生統計、臨床研究統計、生体データ時空間解析の全4コースを開講。公開講座は前期に2講座を予定しており、すでに5月に実施した「臨床研究・疫学研究における傾向スコアを用いた統計解析」は、受け付け開始後すぐに満席となるほどの人気を博した(図1)。

呼吸を司るニューロンのネットワーク機構を解明

このプロジェクトの中で、三分一が兵庫医科大学、ドイツのゲッティンゲン大学と連携して取り組んでいるのが、「呼吸リズムを形成するニューロンネットワーク機構の解明」。動物が呼吸をするとき、脳幹のニューロンがどのような機構で動作し、呼吸を作りだしているかを明らかにする研究だ。
計測には、「カルシウムイメージング法」を用いる。マウスの脳幹を600ミクロン程度の厚さにスライスした標本に蛍光色素を添加し、ニューロンの活動による細胞内カルシウム濃度の変化をイメージングデータ(動画)で記録する方法だ。
三分一は説明する。「起きている間は呼吸を意識的にコントロールすることもできます。しかし、眠っている間を含め通常は脳幹でニューロンが自律的にネットワークをつくり、無意識的に呼吸リズムが形成されています」
だが、スライス標本の動画だけでは、細胞がいつ自発的な呼吸を引き起こす活動をしているのかを特定できない。そこで、標本に電極を置き、数十〜数百個の細胞の局所場電位データを取得する。波形の中で、バーストの起こっている時点が、細胞が同期して呼吸活動を引き起こす指令を出すタイミングだ。そのときの画像を解析すれば、呼吸時のニューロンの活動の様子が分かる(図2)。

この実験のため、三分一は共同研究者で生理学が専門の兵庫医科大学尾家慶彦助教と共にゲッティンゲン大学へ赴いた。同大学は細胞種ごとに異なる蛍光特性を示す特殊な遺伝子改変マウスを保有しているからだ。
事前処理のブレ補正やノイズ除去、視覚化にも統計ノウハウ
こうして実験は無事に終わり、データは得られた。ただし、解析には、画像データから呼吸に関係するニューロンを検出しなければならない。「じつは、ここからがデータの事前処理の長い道のりの始まりでした」と三分一は振り返る。
まず、動画のブレ補正が必要だ。スライス標本の撮影時には、灌流液の流動やドリフトと呼ばれる顕微鏡ステージ自体の動きによって、観察面が動いてしまう。X方向とY方向、さらに回転が加わるズレが生じることから、画像マッチングの最適計算により、画像を変換しなければならない。
どの画像を補正の基準とするか、アルゴリズムをどうするかなどの判断には、本来の専門ではない画像解析のノウハウを駆使した。また、数値解析ソフトにバグが見つかり、開発元とともにその解消にあたるなど、予想外の事態にも見舞われた。「3年ほどかかって、ようやく補正の全自動化ができました」と三分一は言う。
ブレ補正の次は、ノイズ除去の作業だ。呼吸バーストの周波数帯域をフィルターとして、電位データから呼吸以外の信号(ノイズ)を除去する。同時に、画像からもニューロン以外のノイズを除去。これには、画像上に窓を移動させ、枠内のデータを平均の点に置き換えることで平滑化する「移動平均化」を組み合わせ、その他最適化プロセスにも様々な工夫を施した。これが、「時空間フィルタリング」の手法だ。
こうしてノイズを除いた画像データからニューロンを検出し、さらに統計的処理により呼吸に関連する興奮性ニューロン、グリシン抑制性ニューロン、GABA抑制性ニューロンの3種類のニューロンを特定する。「これら3種のニューロンはさらに活性化特性により複数のタイプに分類されます。それらがどのように呼吸リズムの形成をしているのか、いくつかの説はありますが、まだまだ未解明な点が多い。実験的なアプローチと統計学的なアプローチの協働として研究を行っているところです」(三分一)。
前述のように、実験に使ったマウスは細胞種ごとに異なる蛍光特性を示す。動画を1枚ずつの静止画として切り出した上で、それぞれの画像を2値化し、重ね合わせることで1つの画像に3種の分布を表現する。これら一連のプロセスは三分一がこのイメージングデータ解析のために開発した事前処理と視覚化法だ。
統数研伝統のテクニックを駆使しニューロン間の因果性を探る
解析ではまず、事前処理で得られたすべての活動性ニューロンの中から、呼吸性ニューロンを抽出する。これには、局所場電位データと個々の細胞の活動を示す細胞内カルシウム濃度変化のデータとの間で相互相関解析を行い、統計的に有意なニューロンを検出した。
そしていよいよ、検出された呼吸性ニューロン間の因果性を推定する。まずは手始めに代表的な時系列モデルである自己回帰(AR)モデルと外生変数型自己回帰(AR-X)モデルを特定のニューロンに適用し、他のニューロンからの因果性を評価した。AR-Xモデルは、あるニューロンyに対する自己回帰モデルに、他のニューロンxからの入力を考慮したモデルだ。もし、AR-Xモデルの方がARモデルより当てはまりがよければ、他のニューロンxからの影響があると解釈することができる。
「時系列モデルの当てはまりの良さの評価には、統数研の元所長である故・赤池弘次先生が考案した赤池情報量規準(AIC)を使いました。これは、統数研の伝統的なテクニックです」と三分一は言う。これにより、ターゲットとしたニューロンとその他の活動性ニューロンの2体間の因果性を推定し、視覚化することに成功した(図3)。

AR-Xモデルでは、1個ずつのニューロンの関係性を明らかにした。三分一は、今後さらに、すべてのニューロンを一度にモデル化する多変量ARモデルへと拡張するという。その過程にはまた様々な工夫とノウハウが必要であるが、モデルのパラメータを調べることで、ニューロンのネットワーク構造が解明できるのだ。
「呼吸は生体メカニズムの根幹を成すもの。この研究成果は将来、海馬における記憶の仕組みなど、脳のシステムはもちろん、地球環境システムなど、時空間解析や因果性の推定が必要な分野に幅広く応用できるはずです」と三分一は話す。
認知システムの解明や熱中症対策システムに寄与
マルチモーダル生体信号データの時空間解析プロジェクトには、群馬大学大学院保健学研究科の菊地千一郎教授、大阪大学大学院基礎工学研究科の清野健教授、山口東京理科大学共通教育センターの木村良一准教授が客員として参加している。
菊地教授の「ヒトの認知機能と精神科領域におけるリハビリテーションの研究」は、じゃんけんテストなどさまざまな実験から得た脳波や脳組織の画像などから、精神疾患のメカニズムを明らかにするもの(図4)。

清野教授の「生体信号解析、モニタリング、予測、計測システムの開発」は、ウェアラブル生体センサが生む可能性を研究。繊維メーカーのクラボウとの産学連携プロジェクトで、インナーウェアから生体情報を取得し、熱中症リスクを管理するサイバーフィジカルシステムを構築した(図5)。

木村准教授の「電気生理実験、アルツハイマー病モデル動物を用いた認知システムに関する研究」は、海馬の信号の伝わり方と認知機能の関係性から、健常な脳とアルツハイマー病の脳の違いなどを明らかにするものだ(図6)。

いずれも、高度な統計解析が求められる研究内容であり、医療健康データ科学研究センターを通じた統数研との連携に、大きな期待がかかっている。
(広報室)