平成18(2006)年度 一般研究2実施報告書
課題番号 |
18−共研−2051 |
専門分類 |
8 |
|||||
研究課題名 |
多変量解析を用いたテキスト分析研究 |
|||||||
フリガナ 代表者氏名 |
タバタ トモジ 田畑 智司 |
ローマ字 |
Tabata, Tomoji |
|||||
所属機関 |
大阪大学 |
|||||||
所属部局 |
大学院言語文化研究科 |
|||||||
職 名 |
助教授 |
|||||||
所在地 |
|
|||||||
TEL |
|
FAX |
|
|||||
|
|
|||||||
URL |
|
|||||||
配分経費 |
研究費 |
50千円 |
旅 費 |
260千円 |
研究参加者数 |
7 人 |
研究目的と成果(経過)の概要 |
本共同研究は,言語工学,計量言語学・コーパス言語学,多変量解析など関連諸分野の知見を有機的に統合したテキスト分析の方法論を開発し,量的観点からテキストにアプローチする可能性を探る試みである。このプロジェクトは大きく分けて二つの層で構成されている。一つは研究基盤となる電子化言語資料(コーパス)やセマンティック・ウェブからのデータ抽出法の開発,もう一つは抽出したデータの統計学的分析である。言語データの統計学的解析の事例としては,語彙,コロケーション,意味構造などのレベルにおける言語使用の実態研究,言語使用域間の言語変異や文体差の問題などの考察が挙げられる。本研究では特に,対応分析,主成分分析,判別分析等,多変量解析のツールを用いたテキストの言語特徴抽出のための方法論を比較検討し,データマイニング,テキストマイニングなどの応用事例を視野に入れた高精度のテキスト分析法・文体分析法の提案を目的とした。 |
当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等) |
本年度研究成果を中心として,共同研究リポートNo.201「多変量解析を用いたテキスト分析研究」(2007年3月刊行)をまとめた。所収論文は下記の通り。 |
研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。 |
平成18年8月7日(月),他二件の統計数理研究所共同利用研究課題(課題番号5004「日英語の基本語抽出における統計手法の研究」研究代表者:神戸大学国際コミュニケーションセンター/総合人間科学研究科・助教授・石川慎一郎,課題番号2052「レベル別ESPコーパスの特徴語を確定する統計手法」研究代表者:名古屋工業大学情報メディア教育センター・教授・小山由紀恵)と本研究課題との合同研究会を統計数理研究所にて開催した(参加者数12名) |
研究参加者一覧 |
|
氏名 |
所属機関 |
石部 尚登 |
大阪大学 |
岩根 久 |
大阪大学 |
緒方 典裕 |
大阪大学 |
紙谷 一彦 |
大阪大学 |
後藤 一章 |
大阪大学 |
前田 忠彦 |
統計数理研究所 |