平成111999)年度 一般研究2実施報告書

 

課題番号

11−共研−2059

専門分類

8

研究課題名

多変量統計解析法により現れた尺度の言語学的解釈について

フリガナ

代表者氏名

タカハシ カオル

高橋 薫

ローマ字

Takahashi Kaoru

所属機関

豊田工業高等専門学校

所属部局

職  名

助教授

所在地

TEL

FAX

E-mail

URL

配分経費

研究費

0千円

旅 費

0千円

研究参加者数

3 人

 

 

 

研究目的と成果(経過)の概要

イギリス英語の英語文章資料集(LOB Corpus)を用いて、百万語に付加された139種類の文法範疇標
示の生起頻度を、小説、論説文などの15種類に分類されたテキストジャンルごとにカウント後、正規
化して、数量化?類の多変量統計解析を行った。
 その結果、3つの成分について言語学的な解釈が得られ、それぞれの尺度上で、テキストジャンルの
類似性を測ることができた。
 本研究では、寄与率が低いために検討を無視していた第3成分について、再度言語的解釈を与える
ことができた。それは、LOB Corpusの100倍の規模を持つBritish National Corpusにおいて、3つの
成分から同様の解析結果を得られたことと、問題の第3成分の負荷率が比較的高かったことで、LOB
Corpusの第3成分の言語学的解釈について、さらに考察を押し進めるべきであるという示唆を得たこ
とによる。
 各成分は、文法範疇標示とテキストジャンルの相対的位置より、第1成分を、「物語的文章型」対
「論述的文章型」、第2成分を「特殊主題型」対「一般的主題型」、第3成分を現在、過去といった
時制に関する尺度として解釈することができた。
 特に第3成分の言語学的解釈を裏付ける意味で、テキストカテゴリーとの関連に注目すると、ルポ
ルタージュでは動詞の過去形の頻度が高いこと、逆に批評文等では、現在形の動詞の使用頻度が高く、その
ことによりこの成分を時制軸と見なすことができたことにある。

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

・Linguistic Interpretations of the Powerful Dimensions in a written English Corpus:
Multi-Feature and Multi-Dimensional Analyses
{Koaru Takahashi,Journal of Toyota National College of Technology(1999)pp183-192}
・英語コーパスを用いた類型論
{高橋薫、人文学と情報処理,勉誠出版(199 9)(pp44-50)}
{A Linguistic Interpretation of the Third Powerful Dimension in the LOB Corpus}
{Kaoru Takahashi,English Corpus Studies,Japan Association for English Corpus Studies (1999)}
・A study of Text Typology:Multi-Feature and Multi-Dimensional Analyses
{Kaoru Takahashi,Technical Report of University centre for computing corpus research on language
in Lancaster University(1997)
・http://www.comp.lancs.ac.uk/computing/research/ucrel/tech_papers.html#10
・Typology of Resiters in a Written English Corpus:Multi-Feature and Multi-Dimensional Analyses
{Kaoru Takahashi,A thesis submitted to the University of Manchester Institute of Science and
Technology for the degree of MPhil(1997)}

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

 

研究参加者一覧

氏名

所属機関

神谷 昌明

豊田工業高等専門学校

村上 征勝

統計数理研究所