平成212009)年度 重点型研究実施報告書

 

課題番号

21−共研−4302

分野分類

統計数理研究所内分野分類

d

主要研究分野分類

6

研究課題名

大学入学者選抜における選考書類の類型化と要約に関する研究

重点テーマ

言語と統計

フリガナ

代表者氏名

ヨシムラ オサム

吉村 宰

ローマ字

YOSHIMURA Osamu

所属機関

長崎大学

所属部局

アドミッションセンター

職  名

准教授

配分経費

研究費

0千円

旅 費

0千円

研究参加者数

2 人

 

研究目的と成果(経過)の概要

 本研究は,申請者が所属する大学で課しているAO入試における「自己推薦書」を材料として,選考書類の内容の類型化とその評価との関連を検討することを目的とするものである。
 申請者は,過去において調査における自由記述などで得られる比較的短いテキストデータの解析を何度も経験している。日本語テキストデータの解析は,文の分かち書き,構成要素の出現頻度データの生成,その頻度データの分析という手順で行うことが一般的である。
 しかし,大学入学者選抜での選考資料として用いる書類は最低でも400字と長く,これまで用いてきた方法ではうまく類型化できないことが分かった。データの性質上,少数のメンバーからなる少数のグループとその他大勢という類型となってしまうのである。このその他大勢をさらに階層的に類型化する解析手順を発見,開発することが本研究における第一のゴールである。そのためには,長い文章を要約する必要があるかも知れない。この点については着想を得たばかりの段階なので,探査的に方法を探る必要がある。
本年度は,105名から得られた3種類の比較的長いテキストを探索的に分析した。具体的には,テキスト×語の頻度行列を作成し,各種属性と語の出現頻度との連関を観察する,同行列の対応分析の結果を用いて属性を特徴付ける,対応分析の結果を利用してクラスター分析を行いテキストの評価との関連を観察する,などを行った。
テキストの評価がテキストの統計的な分類結果と連関があることは明確にはならなかった。評価との連関の調べ方をさらに工夫すること,他のテキストの分類の方法を試みることなどが課題として残された。

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)


研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

「言語と統計」第1回研究報告会
日時:2010年3月2日
場所:統計数理研究所
参加者数:25名

 

研究参加者一覧

氏名

所属機関

前田 忠彦

統計数理研究所