平成6(1994)年度 共同研究A実施報告書
| 課題番号 | 6−共研−94 | 専門分類 | 8 | |||||
| 研究課題名 | タグ付き英語文章コーパスの統計的解析 | |||||||
| フリガナ 代表者氏名 | タカハシ カオル 高橋 薫 | ローマ字 | 
 | |||||
| 所属機関 | 豊田工業高等専門学校 | |||||||
| 所属部局 | 
 | |||||||
| 職 名 | 助教授 | |||||||
| 所在地 | 
 | |||||||
| TEL | 
 | FAX | 
 | |||||
|  | 
 | |||||||
| URL | 
 | |||||||
| 配分経費 | 研究費 | 0千円 | 旅 費 | 0千円 | 研究参加者数 | 5 人 | ||
| 研究目的と成果(経過)の概要 | 
| 15種類のカテゴリーからなる百万語の英文コーパス(LOB Corpus)のそれぞれの単語に付与されているタグ(品詞情報に関する134種類の記号)に注目し、様々な文体的特徴の数量化をコンピュータを用いて行うことを目的とする。このことによって、従来の語彙レベルの解析が句、節の解析にまで高められることが期待できる。 | 
| 当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等) | 
| *高橋  薫「文法範疇標示コーパスにおける文体的特徴の推測」コーパス研究会紀要、2号 1995年3月 | 
| 研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。 | 
| 百万語の各単語の品詞情報を示すタグが論説文、随筆、学術書、各小説等、15種類のカテゴリーでいかなる連結をしているのかを統計的に分析し、比較する。それにより、文体的な特徴が明らかになることを予測して研究を進めている。今までのところ、タグの頻度に注目し、多変量統計解析を行った結果、口語文と文語文には明らかな差異が現れることが判明した。 | 
| 研究参加者一覧 | |
| 氏名 | 所属機関 | 
| 駒澤 勉 | 統計数理研究所 | 
| Jin Ming-Zhe | 札幌学院大学 | 
| 古橋 聰 | 中京大学 | 
| 村上 征勝 | 統計数理研究所 |