平成252013)年度 重点型研究実施報告書

 

課題番号

25−共研−4306

分野分類

統計数理研究所内分野分類

f

主要研究分野分類

7

研究課題名

マーケティング場面で生じるビッグデータに対する統計モデリングと推定手法の開発

重点テーマ

ビッグデータの統計数理

フリガナ

代表者氏名

ホシノ タカヒロ

星野 崇宏

ローマ字

Hoshino Takahiro

所属機関

名古屋大学

所属部局

大学院経済学研究科

職  名

准教授

配分経費

研究費

40千円

旅 費

142千円

研究参加者数

4 人

 

研究目的と成果(経過)の概要

近年様々な「ビッグデータ」が取得されるようになり、世界的な注目を集めている。
現状ではビックデータに対して利用されている種々の機械学習的な手法のほとんどはビッグデータの背後に存在する人間行動やメカニズムを無視した汎用的な手法に過ぎない。
したがって汎用的な機械学習的な手法を利用して得られたモデルは、たとえばマーケティング戦略を立案する実務家にとっては解釈できない非線形モデルであり、そこから意味を見いだし現象を説明し、実務的にどのようなアクションを行うべきかの意思決定に寄与するものには程遠く、予測モデルとしても利用できないという批判を非常によく聞く。
マーケティング等の実務や、経済政策などにビックデータからの情報を生かすには、これまでの研究で蓄積されてきた消費者行動研究や行動経済学、ミクロ経済学などの様々な知見に整合したパラメトリックなモデルを適用する必要があるが、データの大規模性から通常の推定法では計算量の点から容易でなかったり、データの取得時に生じるバイアスの除去が必要となる。
そこで本研究では、特にマーケティング分野に応用される離散選択モデルや潜在変数モデルなどにおいて、統計科学での理論研究の治験を活用し、大規模データにおいてもバイアスを除去しながら安定して推定が可能となるような解析法の開発と機械学習的な手法との比較を行った。
具体的には指数型ラプラス近似と傾向スコア調整を用いた解析法の開発を統計数理研究所内の共同研究者らとともに行った。また、ビックデータを取得する際に不可避であるセレクションバイアスなどの問題に対応するモデリングの開発、つまり関心のあるモデルについてはパラメトリックのままとし、セレクションバイアスの部分をノンパラメトリックで推定するセミパラメトリックモデルと計算量の少ない推定法の開発を進めた。
開発された手法に対してシミュレーションによる精度検証を行うとともに、例えば代表者が有する都合2億件ほどのWeb閲覧データや、大規模な購買データ、購買場面での位置情報データなどマーケティング場面でのビックデータに対して、提案手法を適用した。
同一のビックデータに対して、開発した手法と機械学習的な諸手法を適用することで、汎用的な機械学習法の問題点をモデルの解釈という観点から浮き彫りにする。消費者の人間行動や情報処理メカニズムを考慮したモデルベースの手法は汎化誤差の点で機械学習的手法に勝ると考えられるが、どのような場合にそのような予想が実現しうるのかについて、利用する変数とモデルの複雑さを加味しながら議論を行った。
成果は統計学会誌に掲載された。

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

継続時間と離散選択の同時分析のための変量効果モデルとその選択バイアス補正: Webログデータからの潜在顧客への広告販促戦略立案

星野崇宏

日本統計学会誌 43 41-58 2013年9月

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

2013年12月2日に統計数理研究所にて当該領域の発表会がありそこで発表を行った。

 

研究参加者一覧

氏名

所属機関

岡田 謙介

専修大学

宮崎 慧

関西大学