JP2002189984A

JP2002189984A - 文書読取装置

Info

Publication number: JP2002189984A
Application number: JP2000388071A
Authority: JP
Inventors: Yoshimi Nouji; 善美能塒
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 2000-12-21
Filing date: 2000-12-21
Publication date: 2002-07-05

Abstract

(57)【要約】【課題】簡単な操作で必要な部分のみ抽出することの
できる文書読取装置を実現する。【解決手段】必要な部分がマーキングされた文書１０
０の画像データを画像入力処理部１で読み取る。マーキ
ング領域抽出処理部２は、画像データから色成分の相違
に基づいてマーキング領域を抽出する。文字検索領域決
定処理部３は、抽出されたマーキング領域を含む矩形領
域を設定する。行・文字切出し処理部４は、設定された
矩形領域内の文字を切り出す。対象文字決定処理部５
は、行・文字切出し処理部４で切り出された文字と、マ
ーキング領域抽出処理部２で抽出されたマーキング領域
との重なり部分を抽出し、この重なり部分の文字を処理
対象文字として設定する。文字認識処理部６は、対象文
字決定処理部５で設定された文字を文字認識辞書７を用
いて文字認識処理する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、文書画像からマー
キングされた文字を抽出する文書読取装置に関する。

【０００２】

【従来の技術】企業の基幹業務系のドキュメントイメー
ジ処理システムでは、文字認識専用の帳票を作成し、大
量に処理することが一般的である。システムは帳票フォ
ーマットに従い、指定された領域に対して、文字認識処
理などの処理を実行する。近年、文字認識専用に作成さ
れた帳票ではない、既存または一般帳票に対して、同様
のイメージ処理を行おうとするシステムが出現してい
る。このような帳票においても、事前に帳票フォーマッ
トを作成しておくことが一般的であるが、表解析や項目
探索などといった技術を応用して、読取対象とすべき領
域を画像上から抽出するという試みが種々の機関等で行
われてきている。しかし、このような技術は為替などの
一部の帳票に限られており、一般に実用的なレベルとは
言い難い。

【０００３】文書入力系のドキュメントイメージ処理シ
ステムで、情報の抽出保存や再利用を目的に必要な部分
のみを電子化する場合、文書の全体イメージをディスプ
レイ上に表示し、マウス等のポインティングデバイスを
使用して矩形枠を描画することで必要な部分を囲む方法
が一般的である。このような問題点に対し、例えば、特
開平９−６５１１９号公報等に示されるように、原稿上
にマーカで処理対象となる領域を指示し、このマーカ領
域に基づいて必要な部分を抽出する技術があった。

【０００４】

【発明が解決しようとする課題】しかしながら、上記従
来の技術では、マーカで囲まれた閉領域に外接する矩形
領域を処理対象としているため、必要のない文字までも
抽出されてしまうという問題点があった。例えば、必要
な部分が、文書中の複数行に亘り、かつ、行中に部分的
な抽出箇所を含むような部分であった場合でも、処理対
象が矩形領域であるため、マーキングされていない抽出
する必要のない文字までも結果として出力してしまい、
正確な文字抽出結果が得られないという問題点があっ
た。もし、このような従来の方法を用いて必要な文字の
みを正確に抽出しようとすれば、行毎にマーキングした
り文字毎にマーキングするといった処理を行わなくては
ならず、非常に手間のかかる作業を要求されることにな
る。

【０００５】

【課題を解決するための手段】本発明は、前述の課題を
解決するため次の構成を採用する。〈構成１〉読取対象となる文書の画像データを読み取る
画像入力処理部と、文書上のマーキング領域を、文書上
の他の領域とマーキング領域の色成分の相違に基づいて
抽出するマーキング領域抽出処理部と、マーキング領域
抽出処理部によって抽出されたマーキング領域を含む矩
形領域を設定する文字検索領域決定処理部と、文書中
の、文字検索領域決定処理部で設定された矩形領域内の
文字を切り出す行・文字切出し処理部と、行・文字切出
し処理部で切り出された文字と、マーキング領域抽出処
理部で抽出されたマーキング領域との重なり部分を抽出
し、この重なり部分の文字を処理対象文字とする対象文
字決定処理部とからなることを特徴とする文書読取装
置。

【０００６】〈構成２〉読取対象となる文書の画像デー
タを読み取る画像入力処理部と、文書上のマーキング領
域を、文書上の他の領域とマーキング領域の色成分の相
違に基づいて抽出するマーキング領域抽出処理部と、マ
ーキング領域抽出処理部によって抽出されたマーキング
領域を含む罫線で囲まれた領域を抽出するセル抽出処理
部と、セル抽出処理部で抽出された領域内の文字を処理
対象文字として文字認識を行う文字認識処理部とからな
ることを特徴とする文書読取装置。

【０００７】

【発明の実施の形態】以下、本発明の実施の形態を具体
例を用いて詳細に説明する。《具体例１》〈構成〉図１は、本発明の文書読取装置の具体例１の構
成図である。図の装置は、画像入力処理部１、マーキン
グ領域抽出処理部２、文字検索領域決定処理部３、行・
文字切出し処理部４、対象文字決定処理部５、文字認識
処理部６、文字認識辞書７、画像データ格納メモリ８、
マーキング領域抽出結果格納メモリ９、文字検索領域位
置格納メモリ１０、行・文字切出し結果格納メモリ１
１、対象文字位置格納メモリ１２、文字認識結果格納メ
モリ１３からなる。

【０００８】画像入力処理部１は、イメージスキャナ等
からなり、マーキングした帳票等の文書１００の画像を
画像データとして読み取り、これを画像データ格納メモ
リ８に格納する機能部である。画像データ格納メモリ８
は、画像入力処理部１で読み取った画像データを格納す
るためのメモリである。マーキング領域抽出処理部２
は、画像データ格納メモリ８に格納されている画像デー
タからマーキング領域の位置とサイズを抽出する機能を
有している。マーキング領域抽出結果格納メモリ９は、
マーキング領域抽出処理部２で抽出したマーキング領域
の位置・サイズ情報を格納するメモリである。文字検索
領域決定処理部３は、マーキング領域抽出結果格納メモ
リ９に格納されたマーキング領域の位置・サイズから、
文字の抽出（行切出し、文字切出し）を行う領域を決定
する機能部である。この領域とは、マーキング領域を含
み、文字の縦サイズ以内の所定のサイズの余裕を持った
矩形領域である。文字検索領域位置格納メモリ１０は、
文字検索領域決定処理部３で決定した領域の位置・サイ
ズ情報を格納するメモリである。

【０００９】行・文字切出し処理部４は、文字検索領域
内で、一般的な文字認識装置と同じように、行切出し、
文字切出しを順に行う機能部である。行・文字切出し結
果格納メモリ１１は、行・文字切出し処理部４にて切り
出された行・文字切出し結果を格納するためのメモリで
ある。対象文字決定処理部５は、行・文字切出し結果格
納メモリ１１に格納された行・文字切出し結果とマーキ
ング領域抽出結果格納メモリ９に格納されたマーキング
領域との重なりを検出し、マーキングされた文字かどう
かを判定する機能部である。対象文字位置格納メモリ１
２は、マーキングされた文字であると判定された文字の
座標情報を格納するメモリである。文字認識処理部６
は、対象文字位置格納メモリ１２に格納された文字座標
部分の画像を文字認識する機能部である。文字認識結果
格納メモリ１３は、文字認識処理部６にて文字認識した
結果を格納するためのメモリである。文字認識辞書７
は、文字認識処理部６にて用いる認識辞書である。

【００１０】尚、上記マーキング領域抽出処理部２〜文
字認識処理部６は、それぞれの処理に対応したソフトウ
ェアとこれを実行するプロセッサやメモリ等のハードウ
ェアで構成されている。また、画像データ格納メモリ８
〜文字認識結果格納メモリ１３は、それぞれ専用のメモ
リ、または、メモリ内の各領域で構成されている。

【００１１】〈動作〉次に、上記具体例１の動作を説明
する。図２は、具体例１の処理説明図であり、図面中の
処理番号が下記の説明と対応している。

【００１２】［処理］文書１００上の文字認識対象部
分（文字列・領域）を赤マーカで彩色する。マーキング
は文字全体をカバーする形で彩色してもよいし、文字の
半分程度をカバーする形でもよい（但し、マーキング部
分が文字領域にある程度重なっていることが必要）。
尚、図２中、マーキング部分は網掛けで示している。

【００１３】このような文書１００を画像入力処理部１
でその画像を読み取り、画像データ格納メモリ８に格納
する。画像入力処理部１では、マーキング領域を抽出す
るため、入力画像はカラー画像１面のみ、または、モノ
クロ画像の場合、マーカの色成分のみを抽出したモノク
ロ画像とマーカの色成分を除いたモノクロ画像の２面が
必要である。即ち、モノクロ画像の場合、マーカが赤色
の場合は、赤抽出画像と赤ドロップアウト画像が必要と
いうことになる。また、モノクロ画像とすれば、データ
量が少なくなるため、それ以降の演算量を減少させるこ
とができる。

【００１４】［処理］画像データ格納メモリ８に格納
された文書の画像データを読み出し、マーキング領域抽
出処理部２により、赤のマーキング領域を色成分によっ
て抽出する。カラー画像の場合は、マーカと同じ色成分
のみを抽出する処理を行う。モノクロ画像の場合はマー
カの色成分のみを抽出した画像を使用してマーキング領
域を抽出する。一般にマーキング処理は、縦方向のサイ
ズがほぼ一定で横長のボーダー型領域をとるものとす
る。このようなボーダー型を著しく逸脱したものについ
ては、ゴミとして除去する処理を行う。また、ボーダー
型領域内で、かすれ、抜けがある場合はこれを補い、マ
ーキング領域として矩形領域を形成する。このようにし
て抽出したマーキング領域のデータをマーキング領域抽
出結果格納メモリ９に格納する。

【００１５】［処理］文字検索領域決定処理部３は、
マーキング領域抽出結果格納メモリ９に格納されている
マーキング領域のデータに基づいて文字検索領域を決定
する。ここでは、マーキング領域を含む矩形領域を設定
する。また、マーキング領域が近傍に複数存在する場合
は、一つの領域にまとめる処理を行う。マーキング領域
は、必ずしも文字全体をカバーしていないという前提で
あるため、１文字分以内に相当するサイズの余剰領域を
加える。図中の点線枠が設定した矩形領域である。そし
て、このような矩形領域のデータを文字検索領域位置格
納メモリ１０に格納する。

【００１６】［処理］行・文字切出し処理部４は、文
字検索領域位置格納メモリ１０に格納されている矩形領
域のデータに基づき、当該矩形領域内の行切出し・文字
切出しを行う。この例では、点線枠に示すように１行目
の文字列と３〜５行目の文字列とが切り出され、各文字
の座標データが行・文字切出し結果格納メモリ１１に格
納される。

【００１７】［処理］対象文字決定処理部５は、上記
処理で切り出した文字の座標と処理で抽出したマー
キング領域を１文字ずつ比較し、重なる部分を検出す
る。ここで、マーキング領域との重なりがある文字を対
象文字列として決定する。これにより、マーキングされ
た１行目の文字列と、３〜５行目のマーキング領域に重
なる文字列が抽出される（図中、アンダーラインで示す
文字列）。そして、これらの文字列の位置データが対象
文字位置格納メモリ１２に格納される。

【００１８】その後は、文字認識処理部６により、文字
認識辞書７を用いて文字認識を行う。これにより、１行
目の文字列“ＣＡＳＥの定義”と、３〜５行目の文字列
“構造化分析・設技法に基づいた開発支援ツール群を駆
使して、生産性を高めようとするアプローチ”とが文字
認識されて抽出される。

【００１９】〈効果〉以上のように具体例１によれば、
マーキング領域を含む矩形領域の文字を処理対象として
切り出し、この切り出した文字のうち、マーキング領域
と重なる文字のみを対象文字として決定するようにした
ので、簡単な操作で必要な部分のみを電子化することが
できる。従って、大量の文書を入力処理する場合でも、
予め処理対象領域・文字をマーキングしておくことで、
文書の一括処理が可能となる。例えば、マーキングする
担当者と、文書読取装置の操作担当者を別にすれば、全
体の処理時間と費用を更に短縮・低減することができ
る。

【００２０】《具体例２》具体例２は、表形式といった
罫線が存在する文書であっても容易かつ正確に必要な部
分のみを抽出できるようにしたものである。

【００２１】〈構成〉図３は、具体例２の文書読取装置
の構成図である。図の装置は、画像入力処理部２１、マ
ーキング領域抽出処理部２２、セル抽出処理部２３、文
字認識処理部２４、文字認識辞書２５、画像データ格納
メモリ２６、マーキング領域抽出結果格納メモリ２７、
処理対象領域抽出結果格納メモリ２８、文字認識結果格
納メモリ２９からなる。

【００２２】画像入力処理部２１は、具体例１の画像入
力処理部１と同様に、イメージスキャナ等からなり、マ
ーカで彩色した帳票等の文書１００の画像を画像データ
として読み取り、これを画像データ格納メモリ２６に格
納する機能部である。また、画像データ格納メモリ２６
は、具体例１の画像データ格納メモリ８と同様である。
マーキング領域抽出処理部２２は、具体例１のマーキン
グ領域抽出処理部２と同様に、画像データ格納メモリ２
６に格納されている画像データからマーキング領域の位
置とサイズを抽出する機能を有している。マーキング領
域抽出結果格納メモリ２７は、具体例１のマーキング領
域抽出結果格納メモリ９と同様である。

【００２３】セル抽出処理部２３は、マーキング領域抽
出結果格納メモリ２７に格納されたマーキング位置に基
づき、その位置から外側方向に向かって罫線を抽出し、
４方向（垂直・水平方向）に罫線が検出された場合、こ
の領域を処理対象となるセルとして抽出する機能部であ
る。処理対象領域抽出結果格納メモリ２８は、セル抽出
処理部２３で抽出されたセル領域の位置・サイズ情報を
格納するメモリである。文字認識処理部２４は、処理対
象領域抽出結果格納メモリ２８に格納されたセル領域の
画像を文字認識する機能部である。文字認識辞書２５
は、文字認識処理部２４にて用いる認識辞書である。文
字認識結果格納メモリ２９は、文字認識処理部２４にて
文字認識した結果を格納するためのメモリである。

【００２４】尚、上記マーキング領域抽出処理部２２〜
文字認識処理部２４は、それぞれの処理に対応したソフ
トウェアとこれを実行するプロセッサやメモリ等のハー
ドウェアで構成されている。また、画像データ格納メモ
リ２６〜文字認識結果格納メモリ２９は、それぞれ専用
のメモリ、または、メモリ内の各領域で構成されてい
る。

【００２５】〈動作〉次に、上記具体例２の動作を説明
する。図４は、具体例２の処理説明図であり、図面中の
処理番号が下記の説明と対応している。

【００２６】［処理］文書１００上の文字認識対象セ
ルを赤マーカで彩色する。マーキング処理はセル全体を
カバーする形で彩色してもよいし、セルの一部でもよい
（但し、セルの内側に閉じていることが必要）。尚、図
４中、マーキング部分は網掛けで示している。

【００２７】このような文書１００を画像入力処理部１
でその画像を読み取る。マーキング部分を抽出するた
め、入力画像はカラー画像１面のみ、または、モノクロ
画像の場合、マーカの色成分のみを抽出したモノクロ画
像とマーカの色成分を除いたモノクロ画像の２面が必要
である。即ち、モノクロ画像の場合、マーカが赤色の場
合は、赤抽出画像と赤ドロップアウト画像が必要という
ことになる。

【００２８】［処理］マーキング領域抽出処理部２に
より、赤マーキング領域を色成分によって抽出する。カ
ラー画像の場合は、マーカと同じ色成分のみを抽出する
処理を行う。モノクロ画像の場合はマーカの色成分のみ
を抽出した画像を使用してマーキング領域を抽出する。
マーキング領域はあるサイズ以上の大きさを有するもの
とし、そのサイズに満たないものはゴミとして対象から
削除する。

【００２９】［処理］セル抽出処理部２３により、マ
ーキング領域を含むセル領域を決定する。ここでは、マ
ーキング領域の中心から、垂直・水平の４方向に罫線の
有無を検索する。罫線が見つかれば、その位置までを処
理対象領域として決定する。そして、この処理対象領域
のデータを処理対象領域抽出結果格納メモリ２８に格納
する。

【００３０】［処理］文字認識処理部２４は、処理対
象領域抽出結果格納メモリ２８に格納された処理対象領
域のデータに対して、文字認識辞書２５を用いて文字認
識を行う。図中、点線内のセル領域が文字認識対象とな
る部分である。これにより、必要な部分のみ文字認識結
果を得ることができる。

【００３１】〈効果〉以上のように具体例２によれば、
マーキング領域を含む罫線で囲まれた領域を抽出し、こ
の領域を文字認識するようにしたので、簡単な操作で必
要な部分のみを電子化することができる。従って、大量
の文書を入力処理する場合でも、予め処理対象領域・文
字列をマーキングしておくことで、文書の一括処理が可
能となる。例えば、マーキングする担当者と、文書読取
装置の操作担当者を別にすれば、全体の処理時間と費用
を更に短縮・低減することができる。

【００３２】また、具体例２では、図４に示すように、
罫線で囲まれた領域内であれば、認識対象の文字にマー
キングする必要がない。従って、文字に重ならないよう
マーキングすれば、文字上にマーキングすることによる
改ざんの恐れもない等、不正防止に寄与することができ
る。

【００３３】尚、上記具体例１、２ではマーカとして赤
のマーカとしたが、これに限定されるものではなく、文
字と異なる色であればどのような色であってもよい。

【図面の簡単な説明】

【図１】本発明の文書読取装置の具体例１の構成図であ
る。

【図２】本発明の文書読取装置の具体例１の処理説明図
である。

【図３】本発明の文書読取装置の具体例２の構成図であ
る。

【図４】本発明の文書読取装置の具体例２の処理説明図
である。

【符号の説明】

１、２１画像入力処理部２、２２マーキング領域抽出処理部３文字検索領域決定処理部４行・文字切出し処理部５対象文字決定処理部６文字認識処理部２３セル抽出処理部２４文字認識処理部

Claims

【特許請求の範囲】

【請求項１】読取対象となる文書の画像データを読み
取る画像入力処理部と、前記文書上のマーキング領域を、当該文書上の他の領域
と前記マーキング領域の色成分の相違に基づいて抽出す
るマーキング領域抽出処理部と、前記マーキング領域抽出処理部によって抽出されたマー
キング領域を含む矩形領域を設定する文字検索領域決定
処理部と、前記文書中の、前記文字検索領域決定処理部で設定され
た矩形領域内の文字を切り出す行・文字切出し処理部
と、前記行・文字切出し処理部で切り出された文字と、前記
マーキング領域抽出処理部で抽出されたマーキング領域
との重なり部分を抽出し、この重なり部分の文字を処理
対象文字とする対象文字決定処理部とからなることを特
徴とする文書読取装置。
【請求項２】読取対象となる文書の画像データを読み
取る画像入力処理部と、前記文書上のマーキング領域を、当該文書上の他の領域
と前記マーキング領域の色成分の相違に基づいて抽出す
るマーキング領域抽出処理部と、前記マーキング領域抽出処理部によって抽出されたマー
キング領域を含む罫線で囲まれた領域を抽出するセル抽
出処理部と、前記セル抽出処理部で抽出された領域内の文字を処理対
象文字として文字認識を行う文字認識処理部とからなる
ことを特徴とする文書読取装置。