平成22(2010)年度 重点型研究実施報告書
| 課題番号 | 22−共研−4204 | 分野分類 | 統計数理研究所内分野分類 | d | ||||||
| 主要研究分野分類 | 6 | |||||||||
| 研究課題名 | 多変量アプローチによるテキストの計量研究 | |||||||||
| 重点テーマ | 言語と統計 | |||||||||
| フリガナ 代表者氏名 | タバタ トモジ 田畑 智司 | ローマ字 | Tabata, Tomoji | |||||||
| 所属機関 | 大阪大学 | |||||||||
| 所属部局 | 大学院言語文化研究科 言語情報科学講座 | |||||||||
| 職 名 | 准教授 | |||||||||
| 配分経費 | 研究費 | 0千円 | 旅 費 | 0千円 | 研究参加者数 | 7 人 | ||||
| 研究目的と成果(経過)の概要 | 
| 本共同研究は,計算機科学,自然言語処理,計量言語学・コーパス言語学,多変量解析など諸分野の知見を有機的に統合した,量的観点からテクストにアプローチする可能性を探る試みである。当プロジェクトの研究対象としては,語彙,コロケーション,意味構造などのレベルにおける言語使用の実態研究,高度な数理モデルに基づくテキストマイニング,文学作品の言語特徴の抽出や,使用域間の言語変異や文体差の問題などの考察を挙げることができる。特に,対応分析,主成分分析,判別分析等,多変量解析のツールを用いたテクストの言語特徴抽出のための方法論を比較検討し,データマイニング,テキストマイニングなどの応用事例を視野に入れた高精度のテクスト分析法・文体分析法の提案を目的としている。 | 
| 当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等) | 
| 澁谷 竜昇「いわゆる"to be削除"のコーパス分析〜大規模コーパスCOCAの分析を通じて | 
| 研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。 | 
| 平成22年8月31日?9月1日,他4件の統計数理研究所共同利用研究課題「重点テーマ2:言語と統計」(課題番号4203「科学技術コーパスの特徴語句抽出とその応用」研究代表者:小山 由紀江・名古屋工業大学大学院工学研究科・教授,(課題番号4206「テキスト・ジャンルに見る文体特徴の計量的分析」研究代表者:石川 有香・名古屋工業大学大学院工学研究科・准教授,課題番号4209「コーパスを用いた記述的言語研究と統計」研究代表者:神戸大学国際コミュニケーションセンター/国際文化学研究科・准教授・石川 慎一郎,課題番号4210「イギリスの巨大コーパスにおける新聞サブコーパスの統計学的言語比較研究」研究代表者:高見 敏子・北海道大学大学院メディア・コミュニケーション研究院・准教授)と本研究課題との合同研究会を統計数理研究所にて開催した(参加者数20名) | 
| 研究参加者一覧 | |
| 氏名 | 所属機関 | 
| 岩根 久 | 大阪大学 | 
| 後藤 一章 | 摂南大学 | 
| 小林 雄一郎 | 大阪大学 | 
| 前田 忠彦 | 統計数理研究所 | 
| 三木 望 | 大阪大学 | 
| 三宅 真紀 | 大阪大学 |