平成292017)年度 重点型研究実施報告書

 

課題番号

29−共研−4205

分野分類

統計数理研究所内分野分類

f

主要研究分野分類

2

研究課題名

文献引用ネットワークに現れるグループ構造の解明

重点テーマ

学術文献データ分析の新たな統計科学的アプローチ

フリガナ

代表者氏名

ミズタカ ショウゴ

水高 将吾

ローマ字

Mizutaka Shogo

所属機関

統計数理研究所

所属部局

統計思考院

職  名

特任研究員

配分経費

研究費

40千円

旅 費

0千円

研究参加者数

4 人

 

研究目的と成果(経過)の概要

ビブリオメトリクスの主な考察対象は個々の論文や著者であり、それらの分析は詳細な現状の把握のために有益である。一方、現状を要約してとらえたり将来像を予測したりするためには、個々の要素を越えた研究トピックや研究者グループの定量的評価が重要となる。よって本研究では学術文献データをネットワークとしてとらえ、そこに現れるグループ構造に注目してきた。近年のネットワーク科学において、グループ構造を特定する手法が数多く提案されている一方で、それらの手法は統計科学的な基礎付けを欠いている。そこで本共同利用を通じてそれらの手法を統計科学的に深化させることにより、学術文献データが内包する複雑な構造を解明することを目指し、研究を行った。
平成28年度から29年度前半にかけては、研究代表者(当時)のグループによる先行研究 [Takaguchi and Yoshida, Royal Society Open Science (2016)] を論文間の引用関係ネットワークに適用し、抽出された論文のグループ構造について分析を行った。先行研究の手法は、有向グラフ中の三角形パターンが凝集する部分をグループ構造として取り出すものである。引用関係ネットワークでは、ある1つの論文を共に引用する2論文で両者の間にも引用関係があるという構造に対応する。複数の独立な論文引用関係ネットワークデータに手法を適用した結果として、以下のことが明らかとなった。まず、異なる複数のデータにおいて、当該手法によって確かにグループ構造が見いだされた。このことは、当該手法の定義する三角形パターンの凝集が、引用関係ネットワークにおけるグループ構造の候補として一般性をもつことを示唆する。次に、当該手法によって抽出されたグループ構造の中で被引用が集中する論文は、引用関係ネットワーク全体でも被引用件数が多いという意味で重要な論文であることが確認された。ここでのグループ構造の定義より、グループに含まれる論文はこの重要論文を共引用しており、その意味でここでのグループは1つの研究トピックに含まれる論文のまとまりを表しているといえる。最後に、当該手法に含まれるパラメータを変更することにより、パラメータの値に応じて異なる意味で重要な論文が検出された。ここでのパラメータは、抽出するグループに要求する三角形パターンの凝集度合いの高さである。このパラメータを可能な範囲で最大に設定すると、上述のような「1つの重要論文をすべての他の論文が引用する」というグループ構造が得られる。一方、パラメータの値を小さく設定すると、「凝集した2つのサブグループを、サブグループには含まれない1つの論文が橋渡しする」というグループ構造が見られた。この橋渡し役の論文自体は被引用件数が比較的多くはない。しかし、それを引用する2つの研究トピックの共通のソースになっているという意味で、重要な論文である。このパラメータを変えることにより見るべきグループ構造を変更できるという特徴は、当該手法を引用関係ネットワークに適用する上での利点であるといえる。
以上の研究内容は、国内で開催された国際ワークショップにおいて招待講演を行い([1])、国内学会において口頭発表を行った([2])。
29年度後半には、各ノードがもつ次数や重みなどの特徴量をネットワーク上のランダムウォーカーを利用してベイズ推定する手法 [Kion-Crosby and Morozov, arXiv (2017)] を有向ネットワークに適用できるように推論手法を拡張した。この拡張により、論文引用関係ネットワークなど大規模有向ネットワークの構造的特徴を従来よりも短時間で推定する基盤を構築したといえる。30年度から採択されている共同利用では、本手法の実ネットワークへの適用と三角形モチーフ等を抽出する手法への拡張を行う。また、論文引用ネットワーク内の分野間の凝集過程等をネットワーク構造の継時変化から明らかにすることを目指すが、その際にもデータの大きさと照らし合わせて、推論手法を開発する。

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

[1] Taro Takaguchi,
"Finding group structure in citation graphs",
ISM High Performance Computing Conference 2016 / ISM Workshop: Statistical approach for IR (Institutional Research),
The National Art Center, Tokyo, October 5th, 2016.

[2] 高口太朗,
『論文引用関係ネットワークにおけるグループ構造』,
日本物理学会第72回年次大会(大阪大),2017年 3月18日

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

研究会等は開催していない。

 

研究参加者一覧

氏名

所属機関

幸若 完壮

University of Bristol

増田 直紀

University of Bristol