「ビッグデータサイエンスとエンジニアリング」データサイエンスの枠組みは既に提唱されている。いくつかのビッグデータに対する可視化、解析法などについて成果が得られている。しかし、より一般的なビッグデータに対する、これらの手法は発展の余地がある。
「確率微分方程式モデルの金融・保険数理統計」以下、報告ごとに示す。第1報告では、高頻度データによるボラティリティ推定の正則条件下での一次の漸近的性質は明らかにされているが、疑似ベイズ推定量の高次の漸近理論の確立が課題としてあげられた。第2報告については、分析手法は確立されたが、分析結果の解釈、マルチラグへの対応などが今後の課題とされた。第3報告では漸近分布論は明らかにされたが、大偏差確率評価とモーメント収束の証明、漸近有効性の証明が次の課題として示された。第4報告では、フーリエ変換を用いた損害保険破産確率の推定方法は示されたが、さらに高速フーリエ変換の利用、裾が厚い分布への対応が検討課題とされた。第5報告については、先行研究で提案された推定量との比較が行われたが、今後、取引時刻の相関の考慮、他のノイズロバストな推定量との比較が課題とされた。
「スポーツ統計と統計科学の融合」スポーツデータの測定は既に商業的に行われており、十分な情報量をもつデータが取得できている。実際のスポーツの試合においても、これらのデータを用いて、戦略の意思決定に利用されている。しかしながらこれらのデータはまだ一部の特定の専門家のみでの 利用となっており、さらに発展的な分析方法の開発についても課題となっている。
「計算機統計学からのゲノムデータ解析」第1報告では、30万から100万個のSNPsでの全ての相互作用の組合せは500億個から5000億個の組合せになることが示唆されたが、これに事前フィルターを介すことで、計算量を抑えられることが提案された。ただし、レアなSNPをターゲットにするような発現モデルには更なる工夫が必要とされるだろうことも示唆された。第2報告においては、ゲノム情報、ケミカル情報、薬理情報の多量なパラメータの情報を、カーネル法に基づく距離学習の手法で扱うことが提案され、その網羅的に予測した結果が示された。第3報告、第4報告では、13,682個の遺伝子情報に対して、2つずつではなく複数の遺伝子をクラスターとするような検出について、その解決法を提案された。第3報告ではサーキュラースキャン法での結果、第4報告ではエシェロンスキャン法での結果を示され、おそらくエシェロンスキャン法での結果が良いだろうと結論づけた。また、これらの手法を用いる前に、遺伝子ネットワークの精査などが残る問題となっている。 |