平成182006)年度 一般研究2実施報告書

 

課題番号

18−共研−2050

専門分類

8

研究課題名

数量化III類を用いた大規模英語コーパスの言語的尺度の解釈法と注意点について

フリガナ

代表者氏名

タカハシ カオル

高橋 薫

ローマ字

Kaoru Takahashi

所属機関

豊田工業高等専門学校

所属部局

一般学科

職  名

助教授

所在地

TEL

FAX

E-mail

URL

配分経費

研究費

50千円

旅 費

40千円

研究参加者数

3 人

 

 

 

研究目的と成果(経過)の概要

1億語からなるイギリス英語の文章資料集、the British National Corpus(以降BNC)を言語
的レジスターの観点から、多種の言語特徴の頻度の差異を多変量統計解析法により解析して、そこ
に出現する尺度を語用論の観点から社会言語学的に解釈した。前年度である平成17年度では、各
語彙に付加されている文法範疇標示(タグ)の出現頻度を解析したが、本年度は、特徴的なタグを
特定した後に、関連する語を抽出して、styleの具体的な概念である、formal/informal,
prestigious/vernacular,habitualといった指標との関連を見出すことができた。
 その成果は、ランカスター大学のPhD論文として発表される予定である。
 なお、当初設定した目標については、以下のような具体的な成果となった。
 目的1(寄与率と尺度の解釈法を確立する)については、数量化?類の分析の結果現れる尺度の
寄与率によって、その尺度に与える言語学的な解釈に工夫が必要であるが、寄与率が高くても必ず
しも十分な解釈が得られない、また解釈をしても、十分な立証ができないことがあった。これにつ
いては、言語学者、社会言語学者がこれまで提唱した理論を再確認して、符号するものがないか確
認する必要性がある。
 目的2(尺度の因子得点間の相関に注目して解釈する)については、別種のレジスターを分析す
る中で、固体の因子得点に高い類似性が見られることがある。その場合、尺度に同一の解釈を与え
ることで尺度の解釈が容易になった。
 目的3(頻度が低い固体が極端な特徴となる問題点を排除する)については、語彙レベルで解析
した場合、頻度が極めて低い語について以下のように考える。機能語に注目して解析したこれまで
の観点とは違って、語彙レベルの解析は、そのレジスターのトピックに係る語が高い頻度として現
れるが、全体としては低い頻度である。1億語のBNCを2つの社会言語学的な変数でサブコーポ
ラに構築すると、時として10万語ほどの小規模なセルとなり、その中で頻度が10であるとか、
2,3であるかについては、そのレジスター内のトピックを反映してという観点で十分意味がある
と考え、さらなる考察を進めた結果、言語学的にも説得力をもつ結果も多く現れた。
 これらの結果をさらに詳細に吟味してジャーナル等へ投稿予定である。

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

論文
・A study of Text Types in the British National Corpus{Kaoru Takahashi,CLARITAS Vol 19
(2005)}
・Typology of Registers in the British National Corpus:Multi-Feature and
Multi-Dimensional Analyses--{Kaoru Takahashi,Upgrade Document,Department of
Linguistics and Modern English Language Lancaster University(2005)}
・A study of Register Variation in the British National Corpus{Kaoru Takahashi,
Literary and Linguistic Computing Vol 21,No 1(2005)}
報告書
・英語コーパスを利用したコロケーションの成立過程に関する統語論的研究(基盤研究
(C)(2))研究成果報告書、研究代表者:神谷昌明
・統計数理研究所共同研究リポート162英語コーパスにおけるテクスト類型論?多変量統計解
析法による?
・平成13年度〜平成15年度科学研究費補助金(基盤研究(C)(1))研究成果報告書)
 応用言語学的視点による英語コーパスのテキストジャンルの再考
学会発表
社会言語学的視点によるBNCの解 析 高橋 薫 英語コーパス学会第21回 大会 2003年 4月
社会言語学的視点による英語コーパ スの分析 高橋 薫 第31回日本行動計量学会大 会 2003年 9月
A Study of Register Variation in the British National Corpus Takahashi, Kaoru ICAME23(Verona,Italy) 2004年 5月
A study of Text Types in the British National Corpus 高橋 薫 愛知教育大学英語英文学会 第12回研究発表会 2005年 9月

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

 

研究参加者一覧

氏名

所属機関

山下 淳子

名古屋大学

吉野 諒三

統計数理研究所