平成292017)年度 一般研究2実施報告書

 

課題番号

29−共研−2028

分野分類

統計数理研究所内分野分類

d

主要研究分野分類

7

研究課題名

公的大規模データの利用におけるプライバシー保護の理論と応用

フリガナ

代表者氏名

サイ シドウ

佐井 至道

ローマ字

Sai Shido

所属機関

岡山商科大学

所属部局

経済学部 経済学科

職  名

教授

配分経費

研究費

40千円

旅 費

142千円

研究参加者数

11 人

 

 

研究目的と成果(経過)の概要

 本研究の主な目的は以下の4点であった。

(1) 個票データについて,秘匿方法,リスク評価方法,データの有用性の数量化について,それぞれ理論の拡充を図るとともに,それらの融合を行う。
(2) 表形式データについて,情報量を残しながら秘匿を行う手法の確立を目指す。
(3) 疑似個票データについて,元データに直接ノイズを加えるような方法など新たな手法の検討を行い,実データへの適用を図る。
(4) 地方自治体,企業,各種団体などで所有している個票データについて,適切な公開方法や対処方法を見いだすことをサポートする研究を行う。また,他分野における個票データの生成方法,秘匿方法,公開方法について,問題整理と個別の解決策を提示する。

 このうち(1)については,渋谷,大和,星野,間野と,次年度から本研究に加わることが決定している佃らによって,ピットマンモデル,ユーエンスモデル,ディリクレ過程など,確率分割の理論とその周辺の領域について,今年度も着実に研究が進められた。この点はこれまでと同様,本研究による最も貢献の大きい部分である。また,秘匿方法とリスク評価との関係についても星野らによって研究が進められている。さらに,伊藤らによって,海外における秘匿方法とリスク評価方法についての詳細な報告もなされ,それらの結果も考慮に入れて,国勢調査の個票データなどに対する秘匿方法についての検討も行われている。

 (2)については,瀧らによって,表形式データに対する秘匿措置についての諸外国の現状が研究集会で紹介されたものの,新たな研究成果として目立ったものはない。

 (3)については,独立行政法人統計センターにおいて,伊藤の提案した方法を含む形で疑似個票データ(現在は一般用ミクロデータと呼ばれる)の提供が行われており,現在も改良が進められている。これとは別に,個票データのいくつかの項目に直接ノイズを加える方法についても伊藤,佐井によって引き続き研究が行われ,特に離散型,連続型などのキー変数の違いによるリスクへの影響なども明らかになった。また,研究協力者の小林によってIPF法を用いた疑似個票データの作成法についても研究が進められた。さらに疑似個票データに関しても,伊藤らによって諸外国の現状についての情報が幅広く集められた。

 (4)については,昨年度に引き続き,他分野の研究グループとの交流が活発に行われた。特に情報処理学会内の組織であるPWS(プライバシーワークショップ)とは研究会,研究集会,ワークショップにおいて頻繁に意見交換などの交流が行われ,2017年9月に行われた統計関連学会連合大会では伊藤,佐井がオーガナイザーとなって,企画セッション「大規模データの利活用におけるプライバシー保護をめぐって」を設け,本研究グループから伊藤,星野が講演を行うとともに,情報処理学会から3名の講演者を招待した。2017年10月に行われたコンピュータセキュリティーシンポジウム(CSS2017)内のPWS2017では,企画セッション「ミクロデータ・統計データのプライバシ保護技術規準」が設けられ,伊藤が講演を行うとともに,佐井,星野が招待講演を行った。来年度も,2018年9月開催の統計関連学会連合大会と2018年10月開催のCSS2018において,再度,企画セッションを設ける予定で,既に人選などを終えている。

 本研究の成果については,2017年9月に行われた統計関連学会連合大会などの学会や国内外の各種シンポジウム,研究集会などにおいて報告を行うとともに,2017年12月に主催した研究集会,2018年1月に開催した国際Workshopなどでも報告し,討論や意見交換を行った。

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

 今年度(一部は来年度),この研究に関連して新たに発表された論文(発表決定を含む)は21編であった。そのうち主要なものを挙げる。

1. 佐井至道, 曖昧な母集団情報を考慮に入れたノイズを含む個票データのリスク評価, 岡山商大論叢, 査読無, 53, 27-57, 2017.

2. 佐井至道, 個票データのキー変数の型とリスクとの関係, 岡山商大論叢, 査読無, 54, 2018.(掲載決定)

3. Segers, J., Sibuya, M. and Tsukahara, H., The empirical beta copula, Journal of Multivariate Analysis, 査読有, 155, 35-51. 2017.

4. Mano, S., Partition structure and the A-hypergeometric distribution associated with the rational normal curve, Electronic Journal of Statistics, 査読有, 11, 4452-4487, 2017.

5. Ito, S, Hoshino, N, Akutsu, F. and Kikuchi, R., Investigating new methods for creating anonymized microdata based on Japanese census data, Paper presented at Joint UNECE/Eurostat Work Session on Statistical Data Confidentiality, Ministry of Foreign Affairs, 査読無, 1-16, 2017.

6. 伊藤伸介, 公的統計における行政記録データの利活用について - デンマーク,オランダとイギリスの現状 -, 経済学論纂(中央大学), 査読無, 58, 1-17, 2017.

7. 伊藤伸介, 星野なおみ, 阿久津文香, 菊池亮, 国勢調査の匿名化ミクロデータの作成方法に関する新たな取り組み, 製表技術参考資料, 査読無, No.37, 1-27, 2018.

8. 伊藤伸介, 公的統計ミクロデータの利活用における匿名化措置のあり方について, 日本統計学会誌, 査読有, 47, 77-101, 2018.(印刷中)

9. 稲葉由之, 国勢調査に基づく災害対策の指標に関する研究, 総務省統計研修所リサーチペーパー, 査読無, 第38号, 1-23, 2017.

10. 稲葉由之, 攪乱的方法を用いて作成する匿名データに関する基礎研究, 総務省統計研修所リサーチペーパー, 査読無, 第39号, 1-17, 2017.

11. Tsukuda, K., Functional central limit theorems in L^2(0,1) for logarithmic combinatorial assemblies, Bernoulli, 査読有, 24, 1033-1052, 2018.

12. Yamato, H, Shifted binomial approximations for Ewens sampling formula, Bulletin of Informatics and Cybernetics, 査読有, 49, 81-88, 2017.

13. Yamato, H., Poisson approximations for sum of Bernoulli random variables and its application to Ewens sampling formula, Journal of the Japan Statistical Society, 査読有, 47, 187-196, 2017.

14. Wang, M. and Maruyama, Y., Posterior consistency of g-prior for variable selection with a growing number of parameters, Journal of Statistical Planning and Inference, 査読有, 2017.
https://doi.org/10.1016/j.jspi.2017.10.007 DOI

15. Maruyama, Y. and Strawderman, W. E., A sharp boundary for SURE-based admissibility for the normal means problem under unknown scale, Journal of Multivariate Analysis, 査読有, 162, 134-151, 2017.

16. Hashiguchi, H., Takayama, N. and Takemura, A., Distribution of the ratio of two Wishart matrices and cumulative probability evaluation by the holonomic gradient method, Journal of Multivariate Analysis, 165, 270-278, 2018.


 また,学会,研究集会等で発表された報告は39件であった。そのうち主要なものを挙げる。

1. 佐井至道, ノイズが挿入された個票データの変数の型によるリスクの差について, 2017年統計関連学会連合大会, 2017年9月4日, 南山大学名古屋キャンパス(名古屋市昭和区).

2. 星野伸明, 匿名データの個票開示リスク, 2017年統計関連学会連合大会, 2017年9月4日, 南山大学名古屋キャンパス(名古屋市昭和区).

3. 伊藤伸介, 公的統計ミクロデータの利活用における匿名化措置のあり方について,
2017年統計関連学会連合大会, 2017年9月4日, 南山大学名古屋キャンパス(名古屋市昭和区).

4. 丸山祐造, 分散未知の多変量正規分布の平均ベクトル推定における許容的なベイズ共変推定量, 2017年統計関連学会連合大会, 2017年9月5日, 南山大学名古屋キャンパス(名古屋市昭和区).

5. 佃康司, ランダム置換・Ewens抽出公式とブラウン運動についての一考察, 2017年統計関連学会連合大会, 2017年9月6日, 南山大学名古屋キャンパス(名古屋市昭和区).

6.大和元, Poisson approximation for sum of Bernoulli random variables and its application to Ewens sampling formula, 2017年統計関連学会連合大会, 2017年9月6日, 南山大学名古屋キャンパス(名古屋市昭和区).

7. 伊藤伸介, 公的統計ミクロデータにおける匿名化措置の国際的動向, CSS2017, 2018年10月24日, 山形キャッスルホテル(山形市).

8. 佐井至道, 非攪乱的手法および攪乱的手法による個票データの秘匿方法とリスク評価方法について, CSS2017, 招待講演, 2018年10月24日, 山形キャッスルホテル(山形市).

9. 星野伸明, ミクロデータの匿名性審査について, CSS2017, 招待講演, 2018年10月24日, 山形キャッスルホテル(山形市).

10. 小林良行, 公表統計表をもとにした教育用擬似個別データの作成方法 - IPF法を用いて -, 研究集会「公的大規模データの利用におけるプライバシー保護の理論と応用」, 2017年12月14日, 統計数理研究所(東京都立川市).

11. 大和元, Ewens sampling formula の分割の個数とポアソン分布, 研究集会「公的大規模データの利用におけるプライバシー保護の理論と応用」, 2017年12月14日, 統計数理研究所(東京都立川市).

12. 佐井至道, 個票データに挿入するノイズの型によるリスクの差について, 研究集会「公的大規模データの利用におけるプライバシー保護の理論と応用」, 2017年12月14日, 統計数理研究所(東京都立川市).

13. 渋谷政昭, 確率分割の推測, 研究集会「公的大規模データの利用におけるプライバシー保護の理論と応用」, 2017年12月14日, 統計数理研究所(東京都立川市).

14. 佃康司, 間野修平, Poisson-Dirichlet 分布からの標本にみられる情報をプールするうえでの逆転現象, 研究集会「公的大規模データの利用におけるプライバシー保護の理論と応用」, 2017年12月14日, 統計数理研究所(東京都立川市).

15. 間野修平, 交換可能でない確率分割からの抽出, 研究集会「公的大規模データの利用におけるプライバシー保護の理論と応用」, 2017年12月14日, 統計数理研究所(東京都立川市).

16. 星野伸明, 離散変数の攪乱, 研究集会「公的大規模データの利用におけるプライバシー保護の理論と応用」, 2017年12月15日, 統計数理研究所(東京都立川市).

17. 丸山祐造, 重回帰分析の決定係数とt値を保存するデータ秘匿法, 研究集会「公的大規模データの利用におけるプライバシー保護の理論と応用」, 2017年12月15日, 統計数理研究所(東京都立川市).

18. 伊藤伸介, 星野なおみ, 吉武透, 阿久津文香, 菊池亮, 攪乱的手法が適用された匿名化ミクロデータの有用性と秘匿性の評価, 研究集会「公的大規模データの利用におけるプライバシー保護の理論と応用」, 2017年12月15日, 統計数理研究所(東京都立川市).

19. 瀧敦弘, 表形式の秘匿に関する最近の話題から, 研究集会「公的大規模データの利用におけるプライバシー保護の理論と応用」, 2017年12月15日, 統計数理研究所(東京都立川市).

20. Ito, S., A quantitative assessment of anonymized microdata created through perturbative methods, Kanazawa Workshop on SDC, 2018年1月21日, Kanazawa University Satellite Plaza (Kanazawa).

21. Maruyama, Y., SDC of regression analysis for preserving R^2 and t-values, Kanazawa Workshop on SDC, 2018年1月21日, Kanazawa University Satellite Plaza (Kanazawa).

22. Sai, S., Risk assessment for microdata perturbed by adding noise, Kanazawa Workshop on SDC, 2018年1月21日, Kanazawa University Satellite Plaza (Kanazawa).

23. Hoshino, N., Perturbation with generalized multinomial distributions, Kanazawa Workshop on SDC, 2018年1月21日, Kanazawa University Satellite Plaza (Kanazawa).


 なお本研究で開催した研究集会,研究会に関する情報は,下記のホームページで公開している。

http://www.osu.ac.jp/~sai/

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

研究集会「公的大規模データの利用におけるプライバシー保護の理論と応用」
日時: 2017年12月14日(木)10:00〜17:10,15日(金)10:00〜17:10
場所: 統計数理研究所・セミナー室5
参加者数: 35名
報告者数: 18名

研究会「公的大規模データの利用におけるプライバシー保護の理論と応用」
日時: 2017年7月20日(土)10:00〜17:00
場所: 岡山大学東京オフィス
参加者数: 10名
報告者数: 5名

Kanazawa Workshop on SDC
日時: 2018年1月21日(日)10:00〜15:00
場所: 金沢大学サテライトプラザ
参加者数: 10名
報告者数: 5名

 

研究参加者一覧

氏名

所属機関

伊藤 伸介

中央大学

稲葉 由之

明星大学

渋谷 政昭

慶応義塾大学

瀧 敦弘

広島大学

竹村 彰通

滋賀大学

田村 義保

統計数理研究所

星野 伸明

金沢大学

間野 修平

統計数理研究所

丸山 祐造

東京大学

大和 元

鹿児島大学