平成24(2012)年度 一般研究2実施報告書
課題番号 |
24−共研−2028 |
分野分類 |
統計数理研究所内分野分類 |
d |
||||||
主要研究分野分類 |
6 |
|||||||||
研究課題名 |
統計学的マイニング技術を応用したデジタルヒューマニティーズ研究 |
|||||||||
フリガナ 代表者氏名 |
タバタ トモジ 田畑 智司 |
ローマ字 |
Tabata Tomoji |
|||||||
所属機関 |
大阪大学 |
|||||||||
所属部局 |
大学院言語文化研究科・言語文化専攻・言語情報科学講座 |
|||||||||
職 名 |
准教授 |
|||||||||
配分経費 |
研究費 |
40千円 |
旅 費 |
362千円 |
研究参加者数 |
11 人 |
研究目的と成果(経過)の概要 |
本共同研究では,統計学的マイニングの手法を人文学の諸問題のうち,とくにテクスト研究,著者推定研究,比較言語学,文学作品研究,文献学などに応用し,従来型の紙媒体や手作業による分類整理,言語直観や内省だけでは観察分析が困難な現象の解析を試みた。当プロジェクトの研究対象としては,語彙,コロケーション,意味構造などのレベルにおける言語使用の実態研究,文書間類似度を計量するための手法の考察,文学作品の言語特徴の抽出や,作家の執筆年代による言語変異や作家間の文体差の問題などの考察を挙げることができる。特に,ランダムフォレスト,決定木,対応分析,主成分分析,判別分析等のツールを用いたテクストの特徴抽出のための方法論を比較検討し,デジタル時代の人文学研究の方向性を模索した萌芽的側面ならびに実験的側面を備えた研究であったといえる。 |
当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等) |
統計数理研究所共同研究リポート298『統計学的マイニング技術を応用したテクスト研究』 |
研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。 |
1. 研究発表・講演会「計量的言語研究の諸相」 |
研究参加者一覧 |
|
氏名 |
所属機関 |
今尾 康裕 |
大阪大学 |
岩根 久 |
大阪大学 |
木山 直毅 |
大阪大学 |
後藤 一章 |
摂南大学 |
小林 雄一郎 |
大阪大学 |
澁谷 竜昇 |
大阪大学 |
八野 幸子 |
大阪大学 |
前田 忠彦 |
統計数理研究所 |
三宅 真紀 |
大阪大学 |
森 真幸 |
大阪大学 |