JP2579356B2 - 文書読取装置 - Google Patents

文書読取装置

Info

Publication number
JP2579356B2
JP2579356B2 JP1006879A JP687989A JP2579356B2 JP 2579356 B2 JP2579356 B2 JP 2579356B2 JP 1006879 A JP1006879 A JP 1006879A JP 687989 A JP687989 A JP 687989A JP 2579356 B2 JP2579356 B2 JP 2579356B2
Authority
JP
Japan
Prior art keywords
reading
document image
arbitrary
rectangle
circumscribed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP1006879A
Other languages
English (en)
Other versions
JPH02187883A (ja
Inventor
一巳 松浦
文夫 依田
啓二 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP1006879A priority Critical patent/JP2579356B2/ja
Publication of JPH02187883A publication Critical patent/JPH02187883A/ja
Application granted granted Critical
Publication of JP2579356B2 publication Critical patent/JP2579356B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 [産業上の利用分野] この発明は、文書を光学的に走査し、光電変換して得
られた文書画像から文字列中の文字を切り出して認識す
ることにより文書を読取る文書読取装置に係わり、特に
文字列切り出し処理に関するものである。
[従来の技術] 第7図は、例えば「印刷文書の文字列切り出し」(昭
和63年電子情報通信学会秋季全国大会予稿集D−202)
に記載されたような従来の文書読取装置を示すブロック
構成図である。
図において、1は用紙等に印刷された文書を光学的に
走査し、光電変換して文書画像を得る文書画像入力手
段、2は文書画像入力手段1で得られた文書画像を走査
し、黒画素の連結成分から成る領域を黒領域として検出
する黒領域検出手段、3は黒領域検出手段2で得られた
黒領域群を走査し、同一段組中の本文文字列群から成る
段領域を検出する段領域検出手段、4は段領域検出手段
3で得られた各段領域内で本文文字列の領域を検出する
本文文字列検出手段、5は本文文字列検出手段4で検出
した各本文文字列の領域で個々の文字を切り出して認識
する文字切り出し・認識手段である。なお、上記文書画
像入力手段1はイメージ・スキャナにより実現され、黒
領域検出手段2〜文字切り出し・認識手段5は画像メモ
リを備えたコンピュータ・システムにより実現される。
第8図から第11図までに示した図は、上記第7図に示
した従来の文書読取装置の具体的な動作例を示す図であ
る。
第8図の6は文書画像入力手段1によって入力された
文書画像、第9図の7は黒領域検出手段2で得られた黒
領域群から求めた矩形群、第10図の8は段領域検出手段
3で得られた段領域、第11図の9は本文文字列検出手段
4で得られた本文文字列から求めた矩形群である。
又、第12図の10は、ディスプレイ等の表示装置に表示
された文書画像6上で、マウス等の指示装置を用いて読
取範囲の右上端と左下端の2点を指示することによっ
て、読取範囲を部分的に指示した結果を表示した表示装
置の画面である。
次に動作について説明する。
文書画像入力手段1では、文書を光学的に走査して光
電変換し、文字部が黒画素であり,背景部が白画素であ
る2値の文書画像6を得る。
黒領域検出手段2では、入力された上記2値の文書画
像6に対してラベリング等の画像処理を行うことによ
り、黒画素の連結成分から成る黒領域を検出し、検出し
た各黒領域の外形矩形を求めて矩形群7を得る。この
時、罫線の除去も行う。
段領域検出手段3では、黒領域検出手段2で得られた
上記矩形群7を走査し、矩形の幅が読取るべき本文文字
列の幅に近くて、且つ、その矩形の上端及び下端がそれ
ぞれ隣接する矩形の上端及び下端とほぼ等しい場合、こ
れらの矩形に対応する黒領域を結合した領域を段領域8
として検出する。
本文文字列検出手段4では、段領域検出手段3で得ら
れた上記段領域8毎に黒領域検出手段2で得られた矩形
群7を走査し、本文文字列と判定した矩形群9に対応す
る黒領域を順次並べる。
文字切り出し・認識手段5では、本文文字列検出手段
4で本文文字列と判定された黒領域毎に個々の文字パタ
ーンを切り出して認識する。
[発明が解決しようとする課題] 従来の文書読取装置は以上のように構成されていたの
で、段領域検出手段や本文文字列検出手段で段領域や本
文文字列の検出を誤った場合、修正に手間がかかるとい
った問題点があった。例えば、見出しや図の一部を本文
文字列と誤って判定した場合や本文文字列を検出できな
かった場合、指示された読取範囲内の全ての文字を修正
する必要があり、認識結果の修正を行う為の文字の削除
や挿入に多くの時間がかかるといった問題点があった。
更に、検出した全ての本文文字列の領域の認識結果が
出力されるので、その内の一部分だけが必要な場合は不
必要な部分を削除しなければならないといった問題点が
あった。これに対処する方法としては、第12図に示すよ
うに、文書画像を表示装置に表示して読取範囲を指定
し、指定された範囲の文書画像だけを処理する方法があ
るが、この方法では、文書画像上での正確な位置を指示
する必要がある為に、解像度の大きな表示装置を用いる
必要があり、装置が高価になるといった問題点があっ
た。
この発明は上記のような問題点を解消するためになさ
れたもので、簡単に読取るべき文字列の領域の入力がで
きる文書読取装置を得ることを目的とする。
[課題を解決するための手段] この発明の請求項1に係る文書読取装置は、文書を光
学的な走査にもとづき光電変換して文書画像を得る文書
画像入力手段と、この文書画像入力手段で得られた文書
画像から黒画素が密集する黒領域の外接矩形を検出する
黒領域検出手段と、この黒領域検出手段で検出された複
数の外接矩形を表示装置の画面上に表示する表示手段
と、上記表示装置の画面上に表示された複数の外接矩形
の中で、読取るべき任意の外接矩形を指示するに際し
て、画面上において、任意の外接矩形内の任意の1点を
指示する指示手段と、この指示手段で指示された任意の
外接矩形を、読取るべき外接矩形として決定する読取領
域決定手段と、この読取領域決定手段で決定された外接
矩形に対応する文字列を、上記文書画像入力手段で得ら
れた文書画像から切り出して認識する文字切り出し認識
手段と、を備えたものである。
また、請求項2に係る文書読取装置は、上記文書画像
入力手段と、黒領域検出手段と、表示手段と、表示装置
の画面上に表示された複数の外接矩形の中で、読取りの
開始とすべき任意の外接矩形と,読取りの終了とすべき
任意の外接矩形と,を指示するに際して、画面上におい
て、上記任意の各外接矩形内の任意の1点を指示する指
示手段と、この指示手段で指示された、読取りの開始と
すべき任意の外接矩形と,読取りの終了とすべき任意の
外接矩形と,で選定される外接矩形群を、読取るべき外
接矩形群として決定する読取領域決定手段と、この読取
領域決定手段で決定された外接矩形群に対応する文字列
を、上記文書画像入力手段で得られた文書画像から切り
出して認識する文字切り出し認識手段と、を備えたもの
である。
[作用] 請求項1による装置では、表示手段は、表示装置の画
面上に、黒領域検出手段で検出された複数の外接矩形を
表示する。そして、操作者は、指示手段で、表示装置の
画面上に表示された外接矩形の中で、読取るべき任意の
外接矩形内の任意の1点を指示する。この指示手段で任
意の1点が指示された任意の外接矩形が、読取領域決定
手段により、読取るべき外接矩形として決定される。そ
して、文字切り出し認識手段では、決定された外接矩形
に対応する文字列が、文書画像から切り出されて認識さ
れる。
請求項2による装置では、表示装置は、表示装置の画
面上に、黒領域検出手段で検出された複数の外接矩形を
表示する。そして、操作者は、指示手段で、表示装置の
画面上に表示された外接矩形の中で、読取りの開始とす
べき任意の外接矩形と,読取りの終了とすべき任意の外
接矩形と,を指示する。この場合、読取り開始とすべき
任意の外接矩形内の任意の1点と,読取りの終了とすべ
き任意の外接矩形内の任意の1点,すなわち、画面上で
2点を指示する。この指示手段で指示された読取りの開
始とすべき任意の外接矩形と,読取りの終了とすべき任
意の外接矩形と,で選定される外接矩形群が、読取領域
決定手段により、読取るべき外接矩形群として決定され
る。そして、文字切り出し認識手段では、決定された外
接矩形群に対応する文字列が、文書画像から切り出され
て認識される。
[実施例] 以下、この発明の一実施例を図について説明する。
第1図は実施例の文書読取装置を示すブロック構成図
であり、前記第7図に示した従来例と同一又は相当部分
には同一符号を付してその説明は省略する。
図において、11は黒領域検出手段2で検出された黒領
域の外接矩形をディスプレイ等の表示装置に表示する表
示手段、12は表示手段11で表示された矩形群の中から読
取るべき黒領域に対応する矩形をマウス等の指示装置で
指示する指示手段、13は指示手段12で指示された矩形群
とその指示順序に基づいて読取るべき黒領域とその読取
順序を決定する読取領域決定手段である。なお、上記表
示手段11,指示手段12及び読取領域決定手段13は、ディ
スプレイ等の表示装置やマウス等の指示装置を備えたコ
ンピュータ・システムにより実現される。
第2図から第6図までに示した図は、上記第1図に示
した文書読取装置の具体的な動作例を示す図である。
第2図の7は黒領域検出手段2で検出した黒領域の外
接矩形を表示手段11により表示装置に表示した矩形群、
第3図の14はオペレータが指示手段12により,表示装置
に表示された矩形群7の中から読取を開始する黒領域に
対応する矩形を指示し、表示手段11が指示された矩形を
反転表示した画面、第4図の15はオペレータが指示手段
12により,表示装置に表示された矩形群の中から読取を
終了する黒領域に対応する矩形を指示し、表示手段11が
指示された矩形を反転表示した画面、第5図の16は前記
画面14及び画面15におけるオペレータの指示に基づいて
読取領域決定手段13が読取るべき黒領域群を決定し、表
示手段11が読取領域に決定された黒領域に対応する表示
装置に表示された矩形を反転表示した画面、第6図の17
は読取領域決定手段13により読取領域と決定され、文字
切り出し・認識手段5に送られる黒領域群に対応する矩
形群である。
次に動作について説明する。
表示手段11は、黒領域検出手段2で検出した黒領域の
外接矩形群7をディスプレイ等の表示装置に表示する。
オペレータは、表示装置に表示された矩形群7の中から
読取るべき黒領域に対応する矩形を指示手段12の指示装
置を用いて指示する。この指示方法は、先ず、オペレー
タが読取を開始する黒領域に対応する表示装置に表示さ
れた矩形を指示手段12を用いて指示すると、表示手段11
は指示された矩形を反転表示した画面14を表示装置に表
示する。次に、オペレータが読取を終了する黒領域に対
応する表示装置に表示された矩形を指示手段12の指示装
置を用いて指示すると、表示手段11は指示された矩形を
反転表示した画面15を表示装置に表示する。これらの指
示は、指示すべき矩形内の任意の1点をマウス等で指示
することにより行う。この後、読取領域決定手段13はオ
ペレータによって指示された矩形間に存在する全ての矩
形を読取領域に対応する矩形として検出する。そして、
表示手段11は検出された矩形群を反転表示した画面16を
表示装置に表示する。読取領域決定手段13は、反転表示
した矩形群17に対応する黒領域群を読取領域群として、
読取開始黒領域から読取終了黒領域の方向にある読取対
象の黒領域を文字切り出し・認識手段5に順次転送す
る。
なお、上記実施例では、指示手段は読取範囲にある読
取領域の指定を2つの矩形を指示することにより行って
いるが、読取領域に対応する矩形を1個ずつ読取順序に
従って指示しても良い。
又、表示手段は、黒領域検出手段で検出された黒領域
の外接矩形だけを表示しているが、外接矩形内又は黒領
域内の文書画像を重ね合わせて表示しても良い。
更に、黒領域検出手段は、文書画像上で黒画素が密集
する領域を検出できる手段であれば良く、文書画像を走
査して求めた黒画素の周辺分布値を用いて黒領域を求め
る手段等の周知の手段を用いても良い。
[発明の効果] 以上説明したように、この発明の請求項1に係る文書
読取装置は、文書画像入力手段と、黒領域の外接矩形を
検出する黒領域検出手段と、複数の外接矩形を表示装置
の画面上に表示する表示手段と、表示装置の画面上に表
示された複数の外接矩形の中で、読取るべき任意の外接
矩形を指示するに際して、画面上において、任意の外接
矩形内の任意の1点を指示する指示手段と、この指示手
段で指示された任意の外接矩形を、読取るべき外接矩形
として決定する読取領域決定手段と、この読取領域決定
手段で決定された外接矩形に対応する文字列を文書画像
から切り出して認識する文字切り出し認識手段と、を備
えて成るので、読取領域を容易に指示できる。また、読
取領域を指示するのに、画面上で正確な位置を指示する
必要がないので、解像度の大きな表示装置が必要ない安
価な装置となる。さらに、この安価な装置において、黒
領域を外接矩形毎に指示できるので、認識結果の修正も
容易となり、また、読取領域を細かく指示することも容
易となる。
また、請求項2に係る文書読取装置は、上記文書画像
入力手段と、黒領域検出手段と、表示手段と、表示装置
の画面上に表示された複数の外接矩形の中で、読取りの
開始とすべき任意の外接矩形と,読取りの終了とすべき
任意の外接矩形と,を指示するに際して、画面上におい
て、上記任意の各外接矩形内の任意の1点を指示する指
示手段と、この指示手段で指示された、読取りの開始と
すべき任意の外接矩形と,読取りの終了とすべき任意の
外接矩形と,で選定される外接矩形群を、読取るべき外
接矩形群として決定する読取領域決定手段と、この読取
領域決定手段で決定された外接矩形に対応する文字列
を、上記文書画像入力手段で得られた文書画像から切り
出して認識する文字切り出し認識手段と、を備えて成る
ので、読取りの開始とすべき任意の外接矩形内の任意の
1点と,読取りの終了とすべき任意の外接矩形内の任意
の1点,すなわち、画面上で2点を指示するだけで、広
範囲の読取領域を容易に設定できるという効果を、解像
度を大きな表示装置の必要ない安価な装置にて実現でき
る。
【図面の簡単な説明】
第1図はこの発明に係る文書読取装置の一実施例を示す
ブロック構成図、第2図ないし第6図は実施例の動作例
を示す図、第7図は従来の文書読取装置を示すブロック
構成図、第8図ないし第12図は従来の文書読取装置の動
作例を示すブロック構成図である。 1は文書画像入力手段、2は黒領域検出手段、5は文字
切り出し・認識手段、11は表示手段、12は指示手段、13
は読取領域決定手段。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭62−298887(JP,A) 特開 昭63−109591(JP,A) 特開 昭62−243084(JP,A)

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】文書を光学的な走査にもとづき光電変換し
    て文書画像を得る文書画像入力手段と、 この文書画像入力手段で得られた文書画像から黒画素が
    密集する黒領域の外接矩形を検出する黒領域検出手段
    と、 この黒領域検出手段で検出された複数の外接矩形を表示
    装置の画面上に表示する表示手段と、 上記表示装置の画面上に表示された複数の外接矩形の中
    で、読取るべき任意の外接矩形を指示するに際して、画
    面上において、上記任意の外接矩形内の任意の1点を指
    示する指示手段と、 この指示手段で指示された上記任意の外接矩形を、読取
    るべき外接矩形として決定する読取領域決定手段と、 この読取領域決定手段で決定された外接矩形に対応する
    文字列を、上記文書画像入力手段で得られた文書画像か
    ら切り出して認識する文字切り出し認識手段と、 を備えたことを特徴とする文書読取装置。
  2. 【請求項2】文書を光学的な走査にもとづき光電変換し
    て文書画像を得る文書画像入力手段と、 この文書画像入力手段で得られた文書画像から黒画素が
    密集する黒領域の外接矩形を検出する黒領域検出手段
    と、 この黒領域検出手段で検出された複数の外接矩形を表示
    装置の画面上に表示する表示手段と、 上記表示装置の画面上に表示された複数の外接矩形の中
    で、読取りの開始とすべき任意の外接矩形と,読取りの
    終了とすべき任意の外接矩形と,を指示するように際し
    て、画面上において、上記任意の各外接矩形内の任意の
    1点を指示する指示手段と、 この指示手段で指示された、読取りの開始とすべき任意
    の外接矩形と,読取りの終了とすべき任意の外接矩形
    と,で選定される外接矩形群を、読取るべき外接矩形群
    として決定する読取領域決定手段と、 この読取領域決定手段で決定された外接矩形群に対応す
    る文字列を、上記文書画像入力手段で得られた文書画像
    から切り出して認識する文字切り出し認識手段と、 を備えたことを特徴とする文書読取装置。
JP1006879A 1989-01-13 1989-01-13 文書読取装置 Expired - Fee Related JP2579356B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1006879A JP2579356B2 (ja) 1989-01-13 1989-01-13 文書読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1006879A JP2579356B2 (ja) 1989-01-13 1989-01-13 文書読取装置

Publications (2)

Publication Number Publication Date
JPH02187883A JPH02187883A (ja) 1990-07-24
JP2579356B2 true JP2579356B2 (ja) 1997-02-05

Family

ID=11650511

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1006879A Expired - Fee Related JP2579356B2 (ja) 1989-01-13 1989-01-13 文書読取装置

Country Status (1)

Country Link
JP (1) JP2579356B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0388087A (ja) * 1989-08-31 1991-04-12 Toshiba Corp 文書読取装置
JP2008171356A (ja) * 2007-01-15 2008-07-24 Ricoh Co Ltd 画像処理装置、画像形成装置、画像処理方法、画像処理プログラムおよび記録媒体

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58169682A (ja) * 1982-03-31 1983-10-06 Toshiba Corp 文字画像処理装置
JPS60163171A (ja) * 1984-02-06 1985-08-26 Hitachi Ltd 文章読取装置
JPS61198375A (ja) * 1985-02-28 1986-09-02 Toshiba Corp 光学的文字読取装置
JPS62226287A (ja) * 1986-03-28 1987-10-05 Hitachi Ltd 文書画像の領域分割方式
JPS62243084A (ja) * 1986-04-16 1987-10-23 Oki Electric Ind Co Ltd 文字切出し方式
JPH07120386B2 (ja) * 1986-06-18 1995-12-20 日本電気株式会社 文字認識装置
JP2661898B2 (ja) * 1986-08-01 1997-10-08 松下電器産業株式会社 文字認識装置
JPS63109591A (ja) * 1986-10-27 1988-05-14 Sharp Corp 光学的文字読取装置
JPS6419487A (en) * 1987-07-15 1989-01-23 Matsushita Electric Ind Co Ltd Character recognizing device

Also Published As

Publication number Publication date
JPH02187883A (ja) 1990-07-24

Similar Documents

Publication Publication Date Title
JP3756719B2 (ja) 文書修飾装置及び画像処理装置
US5075895A (en) Method and apparatus for recognizing table area formed in binary image of document
JPH0721320A (ja) 自動スクリプト決定装置
JP2579356B2 (ja) 文書読取装置
JP3006466B2 (ja) 文字入力装置
JP3171626B2 (ja) 文字認識の処理領域・処理条件指定方法
JP3698867B2 (ja) 円形パターン判定方法、装置および記録媒体
JPS6337487A (ja) 文字認識装置
JP2734628B2 (ja) 文字認識装置
JP2800192B2 (ja) 高速文字図形分離装置
JPH07160811A (ja) 文字認識装置
JP2000011192A (ja) 画像間位置合わせ方法
JPH0564396B2 (ja)
JPH0766413B2 (ja) 文書文字方向検出装置
JP3221969B2 (ja) 文字認識装置
JPH05151350A (ja) 画像データの位置歪み補正方法
JP2004213215A (ja) 画像入力方法及び画像入力装置
JPH01270107A (ja) 数値制御加工装置のプログラム作成装置
JP2954218B2 (ja) 画像処理方法及び装置
JPH02193278A (ja) 画像処理装置
JPH0473192B2 (ja)
JP4230478B2 (ja) 文書処理装置、方法およびプログラム
JPS63316563A (ja) 画像読取装置
JP2926842B2 (ja) 文字切出し回路
JPH0459669B2 (ja)

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees