平成292017)年度 重点型研究実施報告書

 

課題番号

29−共研−4201

分野分類

統計数理研究所内分野分類

b

主要研究分野分類

7

研究課題名

学術文献DBにおける著者識別問題と研究組織評価への応用に関する研究

重点テーマ

学術文献データ分析の新たな統計科学的アプローチ

フリガナ

代表者氏名

フジノ トモカズ

藤野 友和

ローマ字

Fujino Tomokazu

所属機関

福岡女子大学

所属部局

国際文理学部

職  名

准教授

配分経費

研究費

40千円

旅 費

233千円

研究参加者数

6 人

 

研究目的と成果(経過)の概要

研究組織の研究力を評価する場合,その組織に所属する研究者の研究業績が基本的なデータとなる.そのデータを収集する方法として,研究者に業績リストの作成を依頼することが考えられるが,作成する研究者ごとにリストの作成基準が異なったり,リストに不備があったりすることが予想される.そこで,学術文献データベースからその組織の研究者の業績を機械的に抽出すると効率がよいと思われる.しかしながら,学術文献データベースに含まれる著者情報には,論文に掲載されている所属情報が紐付けられているのが一般的であり,組織名で検索しただけでは,その組織に所属する以前に執筆した論文がヒットせず,組織に所属する研究者全員の完全な業績リストを作成するのは困難である.そこで,研究者の氏名で検索すると,もれなく業績を収集することはできるが,同姓同名の研究者の業績も検索結果に含まれてしまう.

本研究では,組織に所属する研究者リストの名前に基づいて,学術文献データベースから抽出した論文のアブストラクト(ただし,組織が明示されているもの)を著者ごとに集約したテキストに対してLDA(Latent Dirichlet Allocation)を適用し,著者のトピック推定を行った.このトピックに基づいて,同姓同名の著者で組織が未知の論文について,トピックの一致度を算出して著者識別を行った.これにより,Recallが75%,Accuracyが68%の性能を得た.今後さらなる精度向上が必要であるが,当該組織に所属しない同姓同名の著者による論文をリストから除外するために利用できる可能性が示唆された.


 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

Tomokazu Fujino(2017) Author Name Identification for Evaluating an Institute's Research Performance 10th Conference of the IASC-ARS, Auckland, New Zealand

Tomokazu Fujino, Keisuke Honda, Hiroka Hamada(2017) Visualizing Citation Networks for Assessment of Research Performance in Academic Institutions 15th Conference of the International Federations of Classification Society(IFCS2017),Tokai University (Japan)

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

日本計算機統計学会スタディーグループ「IR(Institutional Research)のための統計的モデル構築に関する研究」- 統数研H.29
重点テーマ2合同研究集会
日時:2018年3月16日(金)13:30-18:00
会場: 福岡女子大学 講義棟C103教室
https://ura3.c.ism.ac.jp/ir-web/reports/2017/20180316.html

 

研究参加者一覧

氏名

所属機関

服部 恒太

徳島大学

船山 貴光

東海大学大学院

山本 由和

徳島文理大学

山本 義郎

東海大学