平成272015)年度 一般研究2実施報告書

 

課題番号

27−共研−2030

分野分類

統計数理研究所内分野分類

d

主要研究分野分類

7

研究課題名

官庁統計データの公開と利用における理論の構築と他分野への応用

フリガナ

代表者氏名

サイ シドウ

佐井 至道

ローマ字

Sai Shido

所属機関

岡山商科大学

所属部局

経済学部 経済学科

職  名

教授

配分経費

研究費

40千円

旅 費

165千円

研究参加者数

10 人

 

 

研究目的と成果(経過)の概要

 本研究の主な目的は以下の4点であった。

(1)個票データについて,秘匿方法,リスク評価方法,データの有用性の数量化についてそれぞれ理論の拡充を図るとともに,それらの融合を行う。
(2)表形式データについて,情報量を残しながら秘匿を行う手法の確立を目指す。
(3)疑似個票データについて,元データに直接ノイズを加えるような方法など新たな手法の検討を行い,実データへの適用を図る。
(4)地方自治体,企業,各種団体などで所有している個票データについて,適切な公開方法や対処方法を見いだすことをサポートする研究を行う。また,他分野における個票データの生成方法,秘匿方法,公開方法について,問題整理と個別の解決策を提示する。

 このうち(1)については,渋谷,大和,星野らによって,ピットマンモデル,イーベンスモデルなどの確率分割の理論を中心に,今年度も着実に研究が進められた。これらの成果については,渋谷,星野,佐井と間野が講師となり,2016年2月29日,3月1日に開催された統計数理研究所公開講座「確率分割の統計解析」においても広く周知を行った。また,伊藤らによって,個票データの有用性の指標とリスクの指標を同時に考慮した分析についても引き続き検討が進められた。
 (2)については,大きな進展はなかったが,現在も引き続き検討が行われている。
 (3)については,独立行政法人統計センターにおいて,伊藤の提案した方法を含む形で疑似個票データ(擬似ミクロデータ)の提供が行われており,これとは別に,個票データのいくつかの項目に直接ノイズを加える方法についても伊藤,佐井によって研究が行われ,方法の有用性について基礎的な資料ができあがりつつある。
 (4)については,がん登録データの公開を目指したプロジェクトが国立がん研究センターにおいて一昨年度スタートし,佐井が個票データの作成,秘匿,リスク評価の研究スタッフとして参加している。これは400万人のがん患者の新たなデータベースを構築し公開につなげるための研究である。今年度は,試作版の個票データについて,公開方法と第三者が持つ情報について様々なシナリオを想定し,それぞれについて安全な公表方法についての報告を行った。
 これらの研究成果については,2015年9月に行われた統計関連学会連合大会などの学会やシンポジウムにおいて報告を行うとともに,2015年12月に開催した研究集会などでも報告,討論を行った。

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

 今年度(一部は来年度),この研究に関連して新たに発表された論文(発表決定を含む)は6編であった。

1. ノイズが挿入された個票データのリスク評価, 佐井至道, 岡山商大論叢, 査読無, 52, 2016, 採択済み.
2. Estimating the upper limit of lifetime probability distribution, based on data of Japanese centenarians, Hanayama, N. and Sibuya, M., The Journals of Gerontology, series A, 査読有, 採択済み. (doi.10.1093/Gerona/glv113)
3. Applying the quasi-multinomial distribution, Hoshino, N., 24th International Workshop on Matrices and Statistics, IWMS-2015, Hainan Normal University, China, 2015.(招待講演)
4. 親の属性から見た同居する子供の就業と生活行動, 伊藤伸介, 統計, 査読無, 第66巻, 8月号,55-59, 2015.
5. 政府統計データの匿名化について-パーソナルデータの利活用における基盤整備との関連を中心に-,伊藤伸介, 中央大学経済研究所年報, 査読無, 第46号, 457-478, 2015.
6. Consistency of Bayes factor for nonnested model selection when the model dimension grows, Wang, M. and Maruyama, Y., Bernoulli, 査読有, 採択済み.

 2016年2月29日,3月1日には,2度目となる統計数理研究所公開講座「確率分割の統計解析」を開催し,本研究参加者のうち佐井,渋谷,星野と,間野が講師を務めた。
 なお本研究で開催した研究集会,研究会については,下記のホームページでも情報を公開している。

http://www.osu.ac.jp/~sai/

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

 2015年12月11日に統計数理研究所において,共同利用研究,一般研究2,27-共研-2064「確率分割による統計解析」(研究代表者:間野修平)と合同で下記の研究集会を開催した。

研究集会「官庁統計データの公開における諸問題の研究と他分野への応用」
日時: 2015年12月11日 10:00〜17:20
場所: 統計数理研究所・セミナー室2
参加者: 23名
報告者: 10名

 また,主に確率分割に焦点を絞った研究会を,共同利用研究,一般研究2,27-共研-2064と合同で2回開催した。

研究会「確率分割の統計解析」
日時: 2015年9月7日 18:00〜20:00
場所: 岡山市内
参加者: 4名
報告者: 4名

研究会「確率分割の統計解析」
日時: 2016年1月28日 10:00〜17:00
場所: 統計数理研究所・サテライトオフィス
参加者: 4名
報告者: 4名

 

研究参加者一覧

氏名

所属機関

伊藤 伸介

中央大学

渋谷 政昭

慶応義塾大学

瀧 敦弘

広島大学

竹村 彰通

東京大学

田村 義保

統計数理研究所

星野 伸明

金沢大学

丸山 祐造

東京大学

大和 元

鹿児島大学

和合 肇

統計研究会