平成7(1995)年度 共同研究A実施報告書
課題番号 |
7−共研−98 |
専門分類 |
8 |
|||||
研究課題名 |
現代日本文の統計的研究 |
|||||||
フリガナ 代表者氏名 |
ジン ミンズオ Jin Ming-Zhe |
ローマ字 |
|
|||||
所属機関 |
札幌学院大学 |
|||||||
所属部局 |
社会情報学部 |
|||||||
職 名 |
助教授 |
|||||||
所在地 |
|
|||||||
TEL |
|
FAX |
|
|||||
|
|
|||||||
URL |
|
|||||||
配分経費 |
研究費 |
0千円 |
旅 費 |
0千円 |
研究参加者数 |
2 人 |
研究目的と成果(経過)の概要 |
日本文(書き言葉)の機械処理では,日本文において,どのような情報が書き手によって変化し,どのような情報は書き手と関係なく安定しているかに関する情報は不可欠である。本研究では,機械的な構文解析・翻訳・文の生成・文章のパターン認識などの研究に必要な情報の統計的特性を明らかにする。 |
当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等) |
(1)金 明哲: 小説文における文節の係り受け距離の分布の統計的特徴,計量国語学,第20巻4号,pp.168-179(1996,3). |
研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。 |
本研究は,品詞・文節接続関係などの情報が付加されている現代日本文データベースが必要である。村上教授と共同で作成した機械可読な3人の日本現代文データベースはあるが,その中の一人の作品は4編しかないため,ある情報については十分に安定した情報が得られない。したがって,データベースの量を徐々に増やす必要がある。今年度は上述の4編しかない作家の作品をさらに4〜5編入力し(品詞コード,文節の接続関係を含む),すでに作成されたデータベースと統合し,文節の係り受けに関する情報について統計分析を行う。 |
研究参加者一覧 |
|
氏名 |
所属機関 |
村上 征勝 |
統計数理研究所 |