平成272015)年度 一般研究1実施報告書

 

課題番号

27−共研−1011

分野分類

統計数理研究所内分野分類

d

主要研究分野分類

5

研究課題名

新規データ数理統計フレームワークの構築

フリガナ

代表者氏名

ハヤシ タカフミ

林 隆史

ローマ字

Hayashi Takafumi

所属機関

会津大学

所属部局

コンピュータ理工学部

職  名

教授

 

 

研究目的と成果(経過)の概要

本研究の目的:
センサーデータや社会調査データなど、社会の様々なところでデータとその解析結果が利用されている。そ
の一部では、従来の統計数理科学・工学や計測工学、信号処理などが想定していなかったようなデータの処
理や解析とその結果の利用が行われている。
従来は、データの計測・収集・調査、データの分別、データ解析などは、相互の関連は意識されていたもの
の、統一的な整理は十分ではなかった。そこで、データに関する一連のプロセス全体を見直し、分野によら
ずに共通な数理を見出すための研究を行う。データ設計とその結果の利用までを統一的に見直すことで、種
々のデータが混在しているようなデータ解析のためのデータ分離前処理の開発、必要とされる精度を得るた
めにはどのような計測や解析が必要かについての数理的指針などを明かにすることを目指している。
気象、環境などの観測や健康情報ネットワークなどで広く用いられているセンサーネットでは様々なセンサ
ーを様々な環境で用いたデータを集約する。そのため、前述したような問題が存在している。集められたデ
ータの誤差は機器や設置環境に依存して一様ではなく、収集されたセンサーデータの値 は、その場で状況
把握に使われるだけではないにも関わらず、そのデータとその解析結果が広く用いられている。
前述したデータに関わるプロセス全体を見直すことが必要不可欠である。
そして、その実現を支援する統計処理基盤の構築とその運用とサービスの広い提供が必要である。
そのような統計処理情報基盤には、以下の機能が必要であると考える。
・センサーデータの収集に関するデータ設計パターンの提供
・ 統計処理をするデータの測定誤差や、前処理によって生じた誤差を含めて、統計処理の結果の誤差の可
視化を支援する仕組み。
・ データ引数やパラメータなどの与え方で利用方法を誘導しないように工夫された機能を既存のシステム
には手を加えずに、前処理・後処理として提供するしくみ。
・ 個人情報など秘匿すべき情報を外部に漏洩しないようにする方法の提供。
本共同利用研究では、上記の実現すべき仕組みを、
・ topic-based messaging, content-based messaging によって、センサーの種類や設置環境についての情報
をもとに、センサーデータを仕分けしてデータストアにおくるメッセージング基盤
・ 処理結果から不要な情報を自動的に除いて伝送するメッセージング・ネットワーク
1
・ 精度情報と元データ、統計処理結果などを自動的にマッシュアップして提示する機能
・ 統計の専門家ではないユーザが、1)目的や得られたデータに応じて、適切な統計処理を選んで、適切
なパラメータを入力することを支援する仕組み、2)統計処理の結果を適切に利用することを支援する仕組
みの構築を検討する。
我々は、実験計画法などを用いた匿名化の検討を始めているが、それを
さらに発展させるとともに、OECE個人情報8原則や医療に関するヘルシンキ宣言に基づいた情報提供を可
能にする情報基盤と統計サービスの検討を行う。
あわせて、
・情報主体や権限のあるユーザが、データにアクセスすることを可能にするために、1)認証・認可・アカ
ウンティングサービスとデータベース関連サービスの疎結合連携、2)情報主体へのプッシュ型情報提供方
法、3)データの修正記録を全て残すようなデータベース、4)長期間利用可能なデータベース実現のため
の技術・運用・制度面からの多面的な検討を行う。これらの課題に中長期的に取り組む予定である。
今までの情報基盤の研究成果をもとに共同研究者と連携しながら、上記課題の検討を進めていく。

本研究の成果: 
本研究の目的を達成するために、
1)相異なる性質や分布を有するデータをあらかじめ分別してデータ処理を行う仕組み
2)データの種類に応じたデータ処理を施す仕組み
3)個人情報を保護しながら必要な情報を得ることのできる仕組み
などの検討を行った。これらの仕組みでは、データの区分けや区分け後のデータ処理の他に、データの区分けに応じてデータをデータ解析サーバに送るネットワークや個人情報などをフィルタリングしてデータを送る仕組みが必要である。この仕組のために、メッセージングルータを核としたメッセージング基盤を用いて、種々の異なるデータを分類するための情報基盤について、以下の検討を行った。
・リアルタイムデータやストリームデータについて、データ取得時の種々の銃砲(データ所得に用いた手法、その精度や用いられた装置、データ・フォーマット、データ精度など)とやデータの統計解析結果の目的、利用可能な分析手法などに応じて、データを区分けし、それぞれ適切なデータ解析サーバに伝送する仕組みの検討を行った。Topic-based filteringとContent-aware filtering を中心としたMessage Filteringによるデータの区分けとそれに応じたデータ伝送経路の制御とプロセス間通信などを組み合わせて、データをリアルタイムに分類・区分けして適切な統計解析サーバに送ったり、直接データ処理を行うものである。
この検討の過程で、分散処理を用いたデータ解析や、データ源、データ解析方法、データ解析結果の利用目的などをグラフデータベースで管理する方法などの検討を開始した。

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

1. Li Z., Ding S., Hayashi T., Chen W., Li Y. Li, "An efficient algorithm for dictionary learning with a mixed-norm regularizer for sparsity based on proximal operator", Signal Processing and Communication Systems (ICSPCS), 2015 9th International Conference on, pp. 1-5, 2015
2. Yamazaki, D. Yoshino, H. Fukuhara and T. Hayashi, "A Comprehensive Data Processing Approach to the Future Smart Gri", 2015 International Conference on Renewable Energy Research and Applications (ICRERA), Palermo, 2015, pp. 1033-1037, DOI: 10.1109/ICRERA.2015.7418567, 2015
3. Tamoi K., Hayashi T., Y. Watanabe, "Security analysis of audio secret sharing scheme encrypting audio secrets", Awareness Science and Technology (iCAST), 2015 IEEE 7th International Conference on, Qinhuangdao, pp. 130-134, DOI: 10.1109/ICAwST.2015.7314034, 2015

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

研究会は開催していない。

 

研究参加者一覧

氏名

所属機関

大野 ゆう子

大阪大学

澤 亮治

会津大学

田中 秀幸

東京大学

椿 広計

統計数理研究所