平成152003)年度 一般研究2実施報告書

 

課題番号

15−共研−2041

専門分類

8

研究課題名

英語コーパスを用いた意味類型論の考察

フリガナ

代表者氏名

タカハシ カオル

高橋 薫

ローマ字

Takahashi Kaoru

所属機関

豊田工業高等専門学校

所属部局

一般学科

職  名

助教授

所在地

TEL

FAX

E-mail

URL

配分経費

研究費

0千円

旅 費

0千円

研究参加者数

4 人

 

 

 

研究目的と成果(経過)の概要

本研究では、1億語の規模を持つ British National Corpus の解析を中心に、統語的情
報を頻度により数量化して、多変量統計解析法によって分析し、結果の対して言語学
的な解釈を与えた。
 本研究では、意味情報をコーパスよりどのように抽出して、類型化するかも別のテ
ーマであった。
 研究は、社会階層に関する分類変数によりサブコーポラを構築して、それぞれのコ
ーポラのタグ(文法範疇標示)の頻度をカウントして、数量化?類の解析を行った。
 すなわち、サブコーポラ間のクロス集計表が頻度形式のデータ行列である。
 これにより、社会階層を階層順に区分する第一因子が出現した。それを社会階層を
規定する尺度とみなした。
 さらに、この尺度は、さまざまな単語の関連から、文章が casual,formal の程度を表
す単語としてみなすことができた。
 次にこの尺度の特徴を示しているとみなされるタグより、それに関連する単語につ
いて、同様の手法で解析を行った結果、社会階層とそこで用いられる単語の関係をあ
る程度見出すことができた。同時に、用いられる単語の casual,formal の程度を確認す
ることができた。
 具体的には、助動詞、否定語、感嘆詞等があげられる。
 たとえば、ay,cor,tar and ayは、社会階層の低いスピーチコミュニティーでカジュ
アルに用いられ、これに対して hmm,aargh,hm は社会階層の高いスピーチコミュニ
ティでフォーマルに用いられることが判明した。

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

論文
・ Text Typology in English Corpora -Multi-Feature and Multi-Dimensional Analyses-
{Kaoru Takahashi,The Institute of Statistics Mathematics Cooperative Research Report
162(2003)}
報告書
・統計数理研究所共同研究リポート162
英語コーパスにおけるテクスト類型論
?多変量統計解析法による?
・平成13年度〜平成15年度科学研究費補助金(基盤研究(C)(1))研究成果報告書)
応用言語学的視点による英語コーパスのテキストジャンルの再考
学会発表

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

 

研究参加者一覧

氏名

所属機関

伊藤 彰浩

愛知学院大学

村上 征勝

統計数理研究所

山下 淳子

名古屋大学