平成252013)年度 一般研究2実施報告書

 

課題番号

25−共研−2028

分野分類

統計数理研究所内分野分類

d

主要研究分野分類

6

研究課題名

統計解析言語Rを活用したデジタルヒューマニティーズ研究

フリガナ

代表者氏名

タバタ トモジ

田畑 智司

ローマ字

Tabata Tomoji

所属機関

大阪大学

所属部局

大学院言語文化研究科・言語文化専攻・言語情報科学講座

職  名

准教授

配分経費

研究費

40千円

旅 費

264千円

研究参加者数

13 人

 

 

研究目的と成果(経過)の概要

本共同利用研究は,言語工学,計量言語学・コーパス言語学,多変量解析,機械学習など関連諸分野の知見を有機的に統合したマイニング方法論を開発し,統計解析言語Rを高度に活用したデジタルヒューマニティーズ研究の可能性を探る試みである。このプロジェクトは大きく分けて二つの層で構成されている。一つは基盤となる電子化人文学資料の開発構築,もう一つは電子化人文学資料から抽出したデータの統計学的分析研究である。

研究基盤整備に関しては,英・仏・ギリシャ語の文学作品,聖書などの電子化,現代英・独・仏語の大規模汎用コーパスの編纂,マークアップ言語XMLによるセマンティック・ウェブの構築など,研究基盤となる言語資料の電子化やマークアップ法,データ解析ツールの開発などが必要である。平成25年度は約1500万語からなる英国近代小説コーパスの構築整備,フランス詩ならびにイタリアンソネットの脚韻データ,新約聖書の諸校訂本間比較のためのデータベース構築,英語理学療法論文コーパスの編纂などを実施した。

一方,各種コーパスならびに構築した人文学データベースの統計学的解析の個別研究として,平成25年度は現代英語書き言葉コーパス・話し言葉コーパスとの比較によって英語母語話者ならびに英語非母語話者のエッセイコーパスそれぞれの特徴を記述する研究(今尾),ソネ(ソネット)の脚韻分析研究(岩根),井原西鶴浮世草子の数量分析(上阪),British National Corpus・Corpus of Contemporary American Englishをもとに英語比較構文およびスケール形容詞の使用傾向を記述するための量的研究(木山),日英対訳コロケーションの抽出(後藤),英語学習者の習熟度尺度の統計学的検討(小林),露字雑誌『ルベージュ』における日本の呼称変化(杉山),British National Corpus・Corpus of Contemporary American Englishをもとにした英語接尾辞-ishの考察(達賀),DickensとCollinsの共著作品における文体変異の特定(田畑),英語理学療法論文の特徴語抽出(八野),近代新約聖書校訂本間比較のためのWebアプリケーション開発(三宅)など広範囲にわたる人文学的テーマを追求した。各研究で扱う人文学データならびに現象は多岐にわたるものの,分析の方法論として,多変量解析や機械学習アルゴリズムを適用したマイニング方法論を共有しており,各研究の分析手法と知見が他の研究課題と密接にリンクし,相互補完的関係を構築することができたのは本共同利用研究の大きな成果であった。

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

統計数理研究所共同研究リポート264『人文学データのマイニング』
 後藤 一章 「単語と統語標識の混合VOユニットに基づく日英対訳コロケーションの抽出」
 今尾 康裕 「学習者の接続副詞の使用を探る?単語?文?分析単位で違いは生じるか?」
 岩根  久 「イタリアソネットの自動押韻ラベル付与?ペトラルカ『カンツォニエーレ』のソネット?」
 Tomoji Tabata Stylometry of Collaboration:Pinpointing style changes in the text of mixed authorship

共同利用研究班合同研究会「言語研究と統計2014」
http://language.sakura.ne.jp/s/stat.html#stat2014

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

(1) 2013年9月9--10日西南学院大学にて名古屋工業大学小山研究班,名古屋工業大学石川有香研究班,神戸大学石川慎一郎研究班,北九州大学長研究班と大阪大学田畑研究班との合同研究報告会を行った。参加者は各研究班のメンバー,統計数理研究所・前田忠彦准教授の計20名程。

(2) 2014年3月29--30日統計数理研究所にて合同研究報告会『言語研究と統計2014』を開催した。参加者は約50名であった。

 

研究参加者一覧

氏名

所属機関

今尾 康裕

大阪大学

岩根 久

大阪大学

上阪 彩香

同志社大学

木山 直毅

大阪大学

後藤 一章

摂南大学

小林 雄一郎

日本学術振興会特別研究員

杉山 真央

大阪大学

達賀 美咲

大阪大学

八野 幸子

大阪大学

前田 忠彦

統計数理研究所

三宅 真紀

大阪大学

森 真幸

大阪大学