様式Ｃ－２－１

平成30（2018）年度　一般研究１実施報告書

課題番号	30－共研－1027	分野分類		統計数理研究所内分野分類		h
				主要研究分野分類		2
研究課題名	深層学習による画像処理と自然言語処理の融合
フリガナ代表者氏名	モチハシダイチ持橋大地		ローマ字		Mochihashi Daichi
所属機関	統計数理研究所
所属部局	数理・推論研究系
職　　名	准教授

研究目的と成果（経過）の概要

自然言語処理においては長く、デジタル化されたテキストデータが対象として使われてきた。しかし、古い書籍や新聞、法律文書や書道作品、果ては楔形文字の粘土板に至るまで、写真として画像化された貴重な文書データは大量に存在し、その有用性ははるかに大きい。本研究ではこのために、画像を高精度に取り扱うことのできる深層学習の手法を自然言語処理と結びつけることにより、文書の画像データから直接自然言語処理を可能にするための方法論について基礎的な研究を行う。具体的には、画像からの本文領域抽出、抽出した本文からのOCR、背景の汚れや印鑑などの統計的除去、フォントの取り扱い、新聞等の場合の読み順の推定など多岐に渡る研究課題がある。
初年度は、画像からの本文領域抽出によって本文テキストを抽出できるようにすることを目標として研究を行っている。

当該研究に関する情報源（論文発表、学会発表、プレプリント、ホームページ等）

「CNNを用いた近代文献画像からのテキスト領域抽出」. 永野雄大, 幡谷龍一郎, 持橋大地, 増田勝也. 電子情報通信学会 PRMU研究会, PRMU2018-47, pp.73-78, 2018.

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

採択日以降では、
日付：2018/10/26、2018/12/12、2019/1/8
場所：東京大学第二本部棟
テーマ：レイアウト解析について
参加者数：4名～5名 (Ahn氏が参加の場合あり)

研究参加者一覧
氏名	所属機関
筒井瑳斗志	インディアナ大学
永野雄大	東京大学
幡谷龍一郎	東京大学
増田勝也	東京大学