平成61994)年度 共同研究A実施報告書

 

課題番号

6−共研−88

専門分類

8

研究課題名

源氏物語の計量分析

フリガナ

代表者氏名

ムラカミ マサカツ

村上 征勝

ローマ字

所属機関

統計数理研究所

所属部局

領域統計研究系

職  名

教授

所在地

TEL

FAX

E-mail

URL

配分経費

研究費

0千円

旅 費

0千円

研究参加者数

7 人

 

 

 

研究目的と成果(経過)の概要

源氏物語は、平安時代の文献の中でももっとも多くの異なり語を持つ物語であり、量的にも質的にも平安時代日本語の宝庫といえる。本研究は、源氏物語を、統計的手法を用いて言語的特徴を計量分析し、現在まで未解決のまま至っている著者複数説や、成立過程における後期挿入説などを検証していくと同時に、他の平安期の文献にも応用できる方法を確立し、平安期日本語の特徴を明確にしてゆくものである。


本研究は、「源氏物語」の作者、成立過程をめぐる諸問題を、従来の成立過程論論争ではなく、コンピュータを用いてより詳細でかつ正確な計量分析を行い、解決を試みようとするものであり、本年度は、
(1)すでに昨年度までに作成されていた、中央公論社の「源氏物語大成」(池田亀鑑編著)を底本とし、単語分割し品詞情報を付加した「源氏物語」54巻のデータベース(約40万語)について、単語認定、品詞認定などの最終的なチェックを行い、自立語(約22万語)に関して語彙用例総索引(約5500頁)を作成し出版した。
(2)作者に関する問題を解決するため、「源氏物語」を模倣して書かれたとされる「手枕」、「雲隠六帖」及び「山路の露」を入力し、単語分割し、品詞情報を付加する作業を行った。
(3)成立過程に関する問題を解決するため、「紫式部日記」及び「紫式部集」を入力し、(2)と同様なデータベースを構築する作業を行った。
(4)「源氏物語」54巻のデータベースを用い、各巻の初出単語の分布、延べ語数に対する異なり語数の割合など、次年度以降の研究に必要となる基礎的な統計量を算出した。


 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

1.村上征勝 「源氏物語と社会調査」日本マーケティング・リサーチ協会報 No.12 1994年6月
2.上田英代,上田裕一,村上征勝 『源氏物語大成』の品詞情報付きフルテキストデータベースの作成について 情報知識学会誌 Vol.4,No.2 1994年
1.上田英代,村上征勝,今西祐一郎,樺島忠夫,上田裕一 源氏物語語彙用例総索引 自立語篇 全五巻 勉誠社,1994年12月25日
1.上田英代,上田裕一,樺島忠夫,今西祐一郎,村上征勝 源氏物語大成の用語索引作成について,情報知識学会,1994年5月
2.村上征勝,上田英代  源氏物語語彙用例総合索引について 日本索引家協会第17回大会,1994年7月
3.村上征勝,上田英代,上田裕一,今西祐一郎,樺島忠夫 源氏物語の計量分析(2),日本行動計量学会第22回大会,1994年8月
4.上田英代,村上征勝,今西祐一郎,樺島忠夫,上田裕一 源氏物語語彙用例総索引 −自立語篇− について 第7回文献情報のデータベースとその利用に関する研究会,1995年3月

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

源氏物語の各巻における各品詞の使用頻度、接続関係、文の長さ、和歌の使用率などの各種の情報を用い、計量的な特徴を把握するため平成3年より研究を開始した。4年目の今年は、前年度までに作成した単語分割済みの品詞付きのデータベースを用い、各種言語の出現率、各品詞の接続関係等々の情報を計量分析し、著者複数説、後期挿入説に対する一つの回答を出して行く。更に「紫式部日記」、「山路の露」、「雲隠六帖」のデータ入力、校正、分かち書きなどを行い、併せて考察する。又、この作業の過程で開発される言語検索システムは、日本語文献全般にわたり、広く活用可能なものである。


 

研究参加者一覧

氏名

所属機関

今西 裕一郎

九州大学

上田 英代

古典総合研究所

上田 裕一

もとぶ野毛病院

樺島 忠夫

 

岸野 洋久

東京大学

Jin Ming-Zhe

札幌学院大学