数学・数理科学と共に拓く豊かな未来 数学・数理科学と諸科学・産業の恊働による研究を促進するための「議論の場」を提供
項目 内容
研究集会等の名称 統計科学の最先端と産業界・諸科学への展開
該当する重点テーマ ビッグデータ、複雑な現象やシステム等の構造の解明 、過去の経験的事実、人間の行動等の定式化 、計測・予測・可視化の数理 、リスク管理の数理
キーワード ビッグデータ、高頻度金融市場データ、保険数理、ゲノム解析、スポーツ統計
主催機関
  • 大阪大学金融・保険教育研究センター
運営責任者
  • 大屋 幸輔
開催日時 2013/09/09 10:00 ~ 2013/09/10 12:00
開催場所 大阪大学豊中キャンパス 全学教育推進機構 管理・講義棟 A棟1階A104
最終プログラム

「統計科学の最先端と産業界・諸科学への展開」

  • 日時: 2013年09月09日(月)~10日(火)
  • 場所: 大阪大学(豊中キャンパス) 全学教育推進機構 全学教育管理・講義A棟 A104講義室
  • 参加費: 無料
  • アクセス:会場までのアクセスは「大阪大学 全学教育推進機構のアクセス」のページをご覧下さい。
    http://www.celas.osaka-u.ac.jp/access
    以下のページの下部もご参照ください。
    http://jfssa.jp/taikai/2013/access.html


    プログラム:
    9月9日(月) 10:00~12:00
  • 数学協働プログラムの活動紹介 伊藤 聡(統計数理研究所)
     
  • 「ビッグデータサイエンスとエンジニアリング」
     オーガナイザー:大屋 幸輔 (大阪大)・水田 正弘 (北海道大)
     座長:水田 正弘 (北海道大)

    9月9日(月) 13:00~15:00
  • 「確率微分方程式モデルの金融・保険数理統計」
     オーガナイザー:内田 雅之 (大阪大)
     座長:内田 雅之 (大阪大)
     指定討論者:荻原 哲平 (大阪大)

    9月9日(月) 15:30~17:30
  • 「スポーツ統計と統計科学の融合」
     オーガナイザー:竹内 光悦 (実践女子大)・酒折 文武 (中央大)
     座長:田村 義保 (統計数理研究所)
     指定討論者:鳥越 規央 (東海大)

    9月10日(火) 10:00~12:00
  • 「計算機統計学からのゲノムデータ解析」
     オーガナイザー:冨田 誠 (東京医科歯科大)
     座長:冨田 誠 (東京医科歯科大)
     指定討論者:上辻 茂男 ((株)スタージェン)


    プログラム詳細は以下のページをご覧ください。
    http://www-csfi.sigmath.es.osaka-u.ac.jp/structure/activity/workshop.php?id=17
参加者(総数、内訳) 4セッション延べ人数300(アンケート回答数119, 内訳:大学等研究者58, 産業界20, ポスドク・学生26, その他15)
当日の論点

「ビッグデータサイエンスとエンジニアリング」統計学の専門家にとって、「ビッグデータ」をどのようにとらえ、どのように活用するかが論点となった。ビッグデータを「従来のデータベース技術では対応できないデータ」と定義することが多い。データの処理・解析に対して長い歴史を有する統計家として、ビッグデータの位置づけ、可視化、SNSデータやゲノムデータに対する実際の解析について報告・議論がなされた。

「確率微分方程式モデルの金融・保険数理統計」膨大な量として観測される高頻度データを前提とした、疑似尤度解析や局所安定分布近似によるアプローチ、複数系列間の先行遅行関係を特定化する推定量、ノイズ環境下でのボラティリティ推定、保険数理における離散観測モデルによるアプローチの有用性などを論点とする5つの報告が行われた。

「スポーツ統計と統計科学の融合」セッションは5つの報告で構成された。全体を通しては、日本のプロ野球データやサッカー競技において観測された実際のスポーツデータに対して、学術的,実務的視点による分析を行い、その結果を通じて、どのようにスポーツデータを活用できるかについて議論が行われた。

「計算機統計学からのゲノムデータ解析」日々、大量なデータへと膨張を続ける各種のゲノムデータについて、SNP-SNPでの相互作用モデルとその解析手法、ゲノム情報、ケミカル情報、薬理情報から薬物ターゲット分子を探索する手法、膨大な数の遺伝子の考えられる組合せでの疾患の有無に関係する遺伝子クラスターの検出をとりあげた報告が行われ、その分析手法の難しさやアプローチに関する事が論点となった。

研究の現状と課題(既にできていること、できていないことの切り分け)

「ビッグデータサイエンスとエンジニアリング」データサイエンスの枠組みは既に提唱されている。いくつかのビッグデータに対する可視化、解析法などについて成果が得られている。しかし、より一般的なビッグデータに対する、これらの手法は発展の余地がある。

「確率微分方程式モデルの金融・保険数理統計」以下、報告ごとに示す。第1報告では、高頻度データによるボラティリティ推定の正則条件下での一次の漸近的性質は明らかにされているが、疑似ベイズ推定量の高次の漸近理論の確立が課題としてあげられた。第2報告については、分析手法は確立されたが、分析結果の解釈、マルチラグへの対応などが今後の課題とされた。第3報告では漸近分布論は明らかにされたが、大偏差確率評価とモーメント収束の証明、漸近有効性の証明が次の課題として示された。第4報告では、フーリエ変換を用いた損害保険破産確率の推定方法は示されたが、さらに高速フーリエ変換の利用、裾が厚い分布への対応が検討課題とされた。第5報告については、先行研究で提案された推定量との比較が行われたが、今後、取引時刻の相関の考慮、他のノイズロバストな推定量との比較が課題とされた。

「スポーツ統計と統計科学の融合」スポーツデータの測定は既に商業的に行われており、十分な情報量をもつデータが取得できている。実際のスポーツの試合においても、これらのデータを用いて、戦略の意思決定に利用されている。しかしながらこれらのデータはまだ一部の特定の専門家のみでの 利用となっており、さらに発展的な分析方法の開発についても課題となっている。

「計算機統計学からのゲノムデータ解析」第1報告では、30万から100万個のSNPsでの全ての相互作用の組合せは500億個から5000億個の組合せになることが示唆されたが、これに事前フィルターを介すことで、計算量を抑えられることが提案された。ただし、レアなSNPをターゲットにするような発現モデルには更なる工夫が必要とされるだろうことも示唆された。第2報告においては、ゲノム情報、ケミカル情報、薬理情報の多量なパラメータの情報を、カーネル法に基づく距離学習の手法で扱うことが提案され、その網羅的に予測した結果が示された。第3報告、第4報告では、13,682個の遺伝子情報に対して、2つずつではなく複数の遺伝子をクラスターとするような検出について、その解決法を提案された。第3報告ではサーキュラースキャン法での結果、第4報告ではエシェロンスキャン法での結果を示され、おそらくエシェロンスキャン法での結果が良いだろうと結論づけた。また、これらの手法を用いる前に、遺伝子ネットワークの精査などが残る問題となっている。

新たに明らかになった課題、今後解決すべきこと

「ビッグデータサイエンスとエンジニアリング」多様なビッグデータに対応した可視化、ビッグデータの高度活用法などの課題が明確化した。

「確率微分方程式モデルの金融・保険数理統計」 上記の課題としてあげられた個別事項のほかに、系列の先行遅行関係に関しては、指定討論者によって、リードラグ推定が示す 0.1秒程度の先行が何を表すのか、市場規制との関連から今後の検討事項としてあげられた。

「スポーツ統計と統計科学の融合」 スポーツデータ分析においては、既に実用レベルに達した指標や分析手法も確立しているが、客観性を踏まえ、より指標や手法の妥当性や汎用性を向上することが必要である。そのためには単に統計専門家の知識だけでなく、実際にそのスポーツに関わっている実務家の経験も不可欠である。そのためにも関係者間の情報交換を行える会合がさらに必要である。

「計算機統計学からのゲノムデータ解析」

  • 超大量のゲノムデータにおける相互作用、薬理情報などからの分子構造探索、遺伝子クラスターの検出などは、そもそも困難を極めることが全講演者・討論者の一致した意見だった。
  • 希少疾患や薬物服用による重篤な副作用はレアなSNPが原因と言われているが、これをターゲットとした相互作用の検出に取り組めると良い。
  • 臨床研究から創薬のターゲットや重篤な副作用に関連するゲノム情報が得られたが、Drug re-positioningが可能であるか、各製薬企業のDBでearly-phaseでdrop outした化合物があるか、などが課題として挙げられた。 ・遺伝子クラスターの検出を総当たりで行わずに済む、エシェロン・スキャン法はこの分野での唯一無二な解決法となりそうだが、本当の意味で優れているかを確かめるためにはシミュレーションでの検討が必要だろうと考えられた。
今後の展開・フォローアップ
  • 講演者の了解が得られたものに限るが、大阪大学金融・保険教育研究センターウェブページにて当日の講演に用いられた資料を公開する(http://www-csfi.sigmath.es.osaka-u.ac.jp/structure/activity/workshop.php?id=17)。
  • 4つのセッションでとりあげられた問題で、参加者の関心の高さに応じて、少人数形式によるより深い考察・議論が行える場を持つことを検討している。
  • ビッグデータサイエンスとエンジニアリングのセッションに関連する分野では、統計関連学会連合に属するいくつかの学会で、引き続きビッグデータをテーマとした活動(大会・シンポジウムでのセッションなど)がおこなわれている。
  • スポーツ統計の分野に関しては、この発展は、商用スポーツへの適用に限らず、スポーツ全般の発展への寄与も期待できる。また身近なデータの分析への科学的アプローチとして,教育的な活用も視野に入れられる。これらのことを踏まえ、スポーツ統計はもちろんのこと、統計教育における事例研究等にも活動の場を広げ、情報交換ができる会合を引き続き開催し、この分野の発展への寄与を目指す。