数学・数理科学と共に拓く豊かな未来 数学・数理科学と諸科学・産業の恊働による研究を促進するための「議論の場」を提供
項目 内容
研究集会等の名称 統計科学の新展開と産業界・社会への応用
採択番号 2014W03
該当する重点テーマ ビッグデータ、複雑な現象やシステム等の構造の解明 、過去の経験的事実、人間の行動等の定式化 、計測・予測・可視化の数理 、リスク管理の数理
キーワード ビッグデータ 、スポーツ統計科学 、公的統計 、データ中心政策科学 、法・裁判 、保険 、医療・生態系データ
主催機関
  • 東京大学大学院経済学研究科
運営責任者
  • 大森 裕浩
  • 西郷 浩
開催日時 2014/09/14 10:00 ~ 2014/09/15 17:30
開催場所 東京大学本郷キャンパス 教育学部棟 156講義室
 本郷キャンパス http://www.u-tokyo.ac.jp/campusmap/map01_02_j.html
 教育学部棟 http://www.u-tokyo.ac.jp/campusmap/cam01_09_01_j.html
最終プログラム

「統計科学の新展開と産業界・社会への応用」プログラム
  (http://coop-math2014.e.u-tokyo.ac.jp/)


第1日目:9月14日(日)
 

10:00~10:10

 挨拶 文部科学省 研究振興局 基礎研究振興課 融合領域研究推進官 粟辻康博 (数学イノベーションユニット次長)

 数学協働プログラムの活動紹介 伊藤 聡(統計数理研究所)

 

10:10~12:00 スポーツにおけるビッグデータの活⽤

 オーガナイザー:酒折 文武(日本統計学会スポーツ統計分科会・中央⼤)

 座長:酒折 文武(日本統計学会スポーツ統計分科会・中央⼤)

1 リオデジャネイロオリンピックに向けたアナリスト活動

 千葉 洋平(日本スポーツ振興センター)

2 プロ野球の守備力を評価するUltimate Zone Rating(UZR)算出の試み

 金沢 慧(データスタジアム(株))

3 ラグビーチームにおけるデータ活用事例と課題

 須藤 惇(データスタジアム(株))

4 プロサッカークラブの現場におけるデータ活用事例と課題

 久永 啓(データスタジアム(株))

 

13:00~15:00 公的統計におけるオープンデータ化の取組

 オーガナイザー:坂下 信之(統計センター)

 座長:渡辺 美智子(慶應義塾大)

 1 オープンデータの概念と日本の取組

  植原 啓介(慶應義塾大)

 2 公的統計におけるリモートアクセスと秘密保護について―イギリスの事例を中心に―

  伊藤 伸介(中央大)

 3 公的統計におけるオープンデータの利用方策:API機能及びGIS機能

  西村 正貴(統計センター)

 4 質的変数に関わる擬似ミクロデータについて

  滝澤 有美(統計センター)

  

15:30~17:30 データ中⼼政策科学の実践と展開

 オーガナイザー:北川 源四郎(情報・システム研究機構)・椿 広計(統計数理研究所)

 座長:椿 広計(統計数理研究所)

 1 データ中心政策科学-我が国の取組みと情報・システム研究機構プロジェクト

  椿 広計(統計数理研究所)・北川 源四郎(情報・システム研究機構)

 2 法務省式ケースアセスメントツール(MJCA)

  小林 万洋(八王子少年鑑別所)・西田 篤史(法務省)・森 丈弓(甲南女子大)

 3 地域ごとの原因・動機別自殺統計に基づく自殺予防総合対策の為の自殺リスクに関する研究

  久保田 貴文(多摩大)・椿 広計(統計数理研究所)

 4 データ中心観光政策

  津田 博史(同志社大)

 5 総合討論


 
第2日目:9月15日(月)
 

10:00~12:00 法・裁判と統計学

 オーガナイザー:石黒 真木夫(統計数理研究所名誉教授)

 座長:石黒 真木夫(統計数理研究所名誉教授)

1 合理的討論と統計学

 石黒 真木夫(統計数理研究所名誉教授)

2 法廷における統計

 中村 多美子(リブラ法律事務所)

3 不確実性下の意思決定

 椿 広計(統計数理研究所)

4 裁判における科学的な証拠/統計学の知見の評価と利用

 弥永 真生(筑波大)

5 法と統計学

 宮本 道子(秋田県立大)

6 事実の認定を支える証拠と公的な判断 

 柳本 武美(中央大)

 

13:00~15:00 統計科学と保険

 オーガナイザー:小暮 厚之(慶應義塾大)・田中 周二(日本大)

 座長:小暮 厚之(慶應義塾大)

1 公的年金再設計の提案<介護年金給付の導入>

 田中 周二(日本大)

2 長寿リスクのモデリングと評価―ベイズ・アプローチ-

 小暮 厚之(慶應義塾大)

3 死亡リスクの細分化と分散の探索

 井川 孝之(あらた監査法人)

4 年金制度を制御する統計を再訪する

 清水 信広(早稲田大)

 

15:30~17:30 計算機統計学による大規模医療・生態系データ解析

 オーガナイザー:石橋 雄一(スタットラボ)・石岡 文生(岡山大)

 座長:南 弘征(北海道大)

1 病理診断における画像とテキストの解析

 原 敦子(北里大)・石橋 雄一(スタットラボ)

2 福島第一原子力発電所事故に伴う放射性物質モニタリングポストデータの時空間集積性の検討

 石岡 文生(岡山大)・栗原 考次(岡山大)

3 遺伝・精神保健データに対する集積性手法の実践

 冨田 誠(東京医科歯科大)・石岡 文生(岡山大)・久保田 貴文(多摩大)・西山 毅(愛知医科大)・栗原 考次(岡山大)

4 大規模自殺統計の時間的・空間的解析

 久保田 貴文(多摩大)・石岡 文生(岡山大)・冨田 誠(東京医科歯科大)・椿 広計(統計数理研究所)

5 空間的階層構造を利用したサーモンの生息場評価法

 小田 牧子(防衛医科大)・Saija Koljonen(フィンランド国立環境研究所)・Timo Huttula(フィンランド国立環境研究所)・Petteri Alho(トゥルク大学)・水藤 寛(岡山大)・栗原 考次(岡山大)

参加者数 数学・数理科学:23、 諸科学:51、 産業界:30、 その他:17
当日の論点

「スポーツにおけるビッグデータの活用」スポーツの現場やメディア関連において、データがどのように収集、活用されているかを、フェンシング、野球、サッカー、ラグビーを例として報告がなされ、討論した。具体的には、フェンシングでは試合データの収集・分析による対戦相手の弱点やよりよい戦略の提案を選手にフィードバック、プロ野球では選手の守備力を適切に評価する試み、ラグビーでは映像とデータを活用した選手の改善点の発見、プロサッカーではデータにもとづいた戦略などが取り上げられた。各競技の戦術決定やコーチング、チーム編成などにおける数学・統計学のさらなる活用の余地と期待度が再確認された。

「公的統計におけるオープンデータ化の取組」オープンデータ、特に公的統計分野における日本の取り組み状況と海外事例(特にイギリス)との比較が行われた。また、公的分野において現在提供されている機能と今後の構想が紹介され、例として、API機能、GPS機能、擬似ミクロデータなどが取り上げられた。

「データ中⼼政策科学の実践と展開」日本の政策決定を証拠に基づくものにする動きについて、特に統計科学がどのように貢献しているか、あるいは今後貢献しうるかという点について、法務省少年矯正分野と総合自殺対策分野の現状と観光政策分野における必要な情報収集について議論した。具体的には、法務省では6000人の非行少年を調査して少年に再非行のおそれがあるかを診断するツールを開発していること、総合自殺対策分野では市民の自殺を減らすため地域ごとの自殺原因の違いを分析し各地域にあわせた対策を立てようとしていること、観光政策分野では、ホテルの予約ができるウェブサイトのデータを分析し、どのようなプランが人気なのかを明らかにすること、といった事例が紹介された。

「法・裁判と統計学」法廷における意思決定と、(ベイズ的推論を含む) 統計的推論に基づく合理的討論・統計的決定理論との関係や、法廷における事実認定のための統計学的知見の利用、裁判官の統計学的証拠に対する適切な批判的検証能力、について議論が行われた。また、裁判において統計手法が用いられた過去の事例の紹介や、法科大学院における統計学履修・社会で共有できる証拠を構築する際の統計学の必要性に関しても議論された。

「統計科学と保険」公的年金制度に介護年金システムを組み込む可能性を探るために、介護区分間の確率推移行列・介護区分ごとの死亡率を推定して考察を行ったほか、従来のリスク・プーリングでは対応できない長寿リスクを,ベイズ統計モデリングや個人の異質性・コーホート効果を考慮した拡張について議論した。また、基礎年金の水準の設定について、物価スライド・賃金変動・マクロ経済スライドをめぐる問題を議論した。

「計算機統計学による大規模医療・生態系データ解析」病理データ・遺伝データ・自殺統計・原発事故後放射線データ・サーモン生態データなど大規模な実データを統計解析し、実用的な結果を得ることができた。具体的には、病理診断書のテキストマイニングおよび病理組織の画像解析による客観的な病理診断システムの提案、放射性物質のモニタリングポストデータを用いた放射性物質の時空間集積性の複数のスキャン法による分析、遺伝データ・自殺者データ等の集積性に関する研究紹介、自殺統計における集積性や原因・動機の経時推移の分析、空間的階層構造を利用したサーモンの生息場評価手法について議論が行われた。

研究の現状と課題(既にできていること、できていないことの切り分け)

「スポーツにおけるビッグデータの活用」さまざまな集計値(スタッツ)を組み合わせた指標の作成、プレイ履歴データに基づく単純集計、現場の経験に基づくプレイの特徴抽出とその検証など、現場においてデータを活用しようとする動きは広まりつつあり、様々な構造のデータが取得されはじめている。しかし、適切かつ高度な数理モデル・統計モデルを活用するには至っておらず、今後の発展の余地が非常に大きいといえる。

「公的統計におけるオープンデータ化の取組」日本のオープンデータは、G8アクションプランへの対応は一通りできていると評価されるが、英語のコンテンツが少ないのが問題である。公的統計については、エクセルをレイアウトに使っているため、電子データとしての使い勝手に難がある。API機能及びGPS機能については現在試行提供中である。擬似ミクロデータは、量的変数を中心とするものについては全国消費実態調査に基づいてすでに提供しており、質的変数を中心とするものについて就業構造基本調査を用いて研究中である。

「データ中⼼政策科学の実践と展開」法務省は、法務省式アセスメントツールを心理学的知見と共に関連データ収集とCox回帰などの統計的方法に基づき開発し、リスク予測と指導に活かす利用を開始している。自殺対策では、自殺対策のための統計とその統計的可視化技術を提供し、地域の特徴を活かした対策立案に役立たせている。観光分野では、公的統計情報を補うためにサイバースペースからの情報収集技術を開発し、年次統計情報とリンケージし、統計モデリングを用いて情報の偏りを修正することで、精度の良い日次統計情報を生成できる可能性が示された。

「法・裁判と統計学」統計科学の側での理論的、技術的準備はかなり高いレベルに達しており、法曹の世界で利用可能と思われる技術や方法の蓄積が進んでいるにもかかわらず、この事実が法曹の世界に知られていない。統計科学の側にこの研究成果の蓄積を効率的に法曹界に伝える工夫と努力が欠けていたと言わざるを得ないが、法曹の側にも外部に技術援助を求める努力が欠けていた疑いがある。

「統計科学と保険」現実のリスクは複雑多様化しており、伝統的な保険リスクとは異質な新たなリスクが顕在化している。例えば、長寿リスクは、リスクプーリングでは消去できないシステマティック・リスクである。いいかえれば、保険リスク理論の基礎とされてきた大数の法則が成立しないリスクが顕在化しており、これに対処する手段として時系列分析やベイズ法などの統計手法が活用されるようになってきている。

「計算機統計学による大規模医療・生態系データ解析」各々の実データは、様々な視点から解析を行う必要があり、最終的な解析結果を得られているという状況にはない。今後もさらにデータが測定されることで新しいデータが追加されることが期待され、それにともない、解析方法もさらに改良が必要となる。各研究は今後も継続しており、新しい成果が期待される。

新たに明らかになった課題、今後解決すべきこと

「スポーツにおけるビッグデータの活用」野球における FIELD f/x データ、サッカーにおけるトラッキングデータなどがまさに活用のフェーズになりつつあり、今後の数理モデル・統計モデルの活用が大きく期待されていることが明らかになった。また、それ以外にも、フェンシングなどにおいても特徴抽出などデータ分析の可能性が期待されていることがわかった。

「公的統計におけるオープンデータ化の取組」エクセル方眼紙のようなe-Statの使い勝手の問題については解決する方向で検討している。擬似ミクロデータに含まれるノイズをどの程度にするかについては議論の余地がある。擬似ミクロデータの作成方法として、データスワッピングを用いる方法も考えられるから、集計表から出発することを前提としているため、このような作成方法になっている。

「データ中⼼政策科学の実践と展開」人間・行動の男女差・年齢差などをリスク予測モデルに組み込むこと、現場にあるテキスト情報の効果的利用など、政策決定をリスクとエビデンスに基づく科学的なものにすることに資する統計的方法の高度化、ならびにそのモデルに投入する情報の多様性をどのように実現するか、さらに高度化したモデルを政策実践の現場が使えるかといったことに対しては官学で集中的な検討が必要である。

「法・裁判と統計学」法・裁判の世界と統計科学の世界双方の努力で情報疎通のインターフェースを整備することが必要である。統計学の側においては、法・裁判の場で使いやすい形に統計的情報を用意することに留意して研究を進めることが必要であり、法曹の側では統計的情報の正しい利用法に習熟する必要がある。

「統計科学と保険」統計的な手法を活用する上で最も大きな障害は、関連データの不足である。介護や年金に関するデータは多くは公的なデータであり、現状ではその一部しか利用できない。民間研究者でも関連データを利用できる環境を整備することが重要な課題と考える。

「計算機統計学による大規模医療・生態系データ解析」原発事故後の放射線データ解析については、一般の質問者から、今回は解析されていないプルトニウムなどの環境・人体に有害な影響を及ぼすデータの統計解析を期待されるとのことで、この種のデータ解析も検討していく必要がある。

今後の展開・フォローアップ

講演者の了解が得られたものについては、ウェブサイトにて資料を公開する(http://coop-math2014.e.u-tokyo.ac.jp/)。それぞれのセッションの今後の展開・フォローアップについては以下の通りである。

「スポーツにおけるビッグデータの活用」今回をきっかけにして、より深い情報交換、さらには共同研究を推進する。実データの取得ならびに効果的な分析をおこなうためには、現場との協力が不可欠である。

「公的統計におけるオープンデータ化の取組」API機能及びGPS機能については現在試行提供中であるが、提供データの拡充及び機能の向上を図り、今年度中に本格運用を開始する予定である。

「データ中⼼政策科学の実践と展開」情報・システム研究機構データ中心人間社会学のプロジェクトで平成26年度まではこの種の検討を続けて、証拠に基づく政策科学に関わる統計科学的実践のケースなどを蓄積してゆきたい。

「法・裁判と統計学」従前から双方で開かれている研究会への「相互乗り入れ」で勉強するのが有力な方法となると考えられるが、現実の訴訟の場で統計的論証の実績を積み上げて行くことも考えられる。

「統計科学と保険」保険年金リスクに限らず、統計科学が現代の保険に果たすべき役割は大きい。今後さらに研究を進め、その成果を積極的に公表していきたいと考えている。

「計算機統計学による大規模医療・生態系データ解析」今回の各研究は、年2回程度定期的に研究会を開催し意見交換している。今後も同様に定期的に意見交換し、研究を発展させていきたいと考えている。