JPH07120386B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH07120386B2
JPH07120386B2 JP61143389A JP14338986A JPH07120386B2 JP H07120386 B2 JPH07120386 B2 JP H07120386B2 JP 61143389 A JP61143389 A JP 61143389A JP 14338986 A JP14338986 A JP 14338986A JP H07120386 B2 JPH07120386 B2 JP H07120386B2
Authority
JP
Japan
Prior art keywords
character string
character
image
range
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61143389A
Other languages
English (en)
Other versions
JPS62298887A (ja
Inventor
博行 上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP61143389A priority Critical patent/JPH07120386B2/ja
Publication of JPS62298887A publication Critical patent/JPS62298887A/ja
Publication of JPH07120386B2 publication Critical patent/JPH07120386B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は編集用の画像を見ながら認識対象の範囲を指定
し、指定範囲内だけの文字認識を行う文字認識装置に関
する。
(従来の技術) 文字認識装置の光源変換部としては、一次元ラインセン
サに光を導く光学系を機械的に移動する方法が一般に採
用されている。編集用の画像と重ねてマウスやキーボー
ドなどの入力手段で制御される範囲を示す枠を表示しな
から認識対象領域を決め枠内の画像に対して文字認識を
行うときには、走査にかかる時間を短くするために、ま
づ1回の走査により求めた高い分解能の2値画像を高速
で読出しが可能な主記憶部あるいは容量の大きい補助記
憶部に記憶しておく。通常、表示部に表示出来るドット
数に比較して記憶した画像のドット数が多いので、つぎ
に記憶している画像をまびき得られる画像を編集画像と
し、表示された編集画像上での枠位置から原画像での位
置を求め、記憶されている原画像での文字列検出および
文字認識をおこなっていた。また記憶容量を減すために
画像を圧縮して記憶し、必要なとき伸張して使用する方
法もある。
(発明が解決しようとする問題点) しかしながら前記方法では、最初から認識に不要な部分
も含めて走査・光電変換して得られた2値画像を記憶す
る必要があり、大容量の画像記憶手段を備えていなけれ
ばならない。圧縮伸張する方法では一般には特殊なハー
ドウエアでなされる圧縮伸張手段を必要とする。
本発明は、大きな容量の画像記憶手段と圧縮伸張手段と
が不要な文字認識装置の提供を目的とする。
(問題点を解決するための手段) 上記目的を達成するために、本発明は、固定された帳票
の指定範囲を指定の分解能で走査・光電変換し2値画像
を得る光電変換手段と、前記光電変換手段からの低い分
解能で得られた2値画像を記憶する編集画像記憶手段
と、前記編集画像記憶手段の2値画像と認識対象の範囲
とを重ねて表示する表示手段と、前記表示手段に表示さ
れる認識対象の範囲を決める座標位置と分解能とを入力
する入力手段と、前記入力手段で指定された範囲に対応
する前記編集画像記憶手段内の2値画像より各文字列の
上端、下端、左端、及び、右端の座標位置を検出し各位
置の座標値を出力する文字列位置検出手段と、前記文字
列位置検出手段からの各文字列ごとの範囲を決める上下
左右の4つの座標値を記憶する文字列位置記憶手段と、
前記文字列位置記憶手段の座標値を入力し前記光電変換
手段から出力される前記座標値で囲まれた範囲内の高い
分解能の2値画像を記憶する文字列画像記憶手段と、前
記文字列画像記憶手段からの2値画像に対して文字切り
出しと切り出された各画像に対しての文字認識とを行い
認識結果を出力する文字認識手段と、前記文字認識手段
からの認識結果を記憶する認識結果記憶手段と、全体を
制御する制御手段とを設けたものである。
また、上記目的を達成するために、本発明は、固定され
た帳票の指定範囲を指定の分解能で走査・光電変換し2
値画像を得る光電変換手段と、前記光電変換手段からの
低い分解能で得られた2値画像を記憶する編集画像記憶
手段と、前記編集画像記憶手段の2値画像と認識対象の
範囲とを重ねて表示する表示手段と、前記表示手段に表
示される認識対象の範囲を決める座標位置と分解能とを
入力する入力手段と、前記入力手段で指定された範囲に
対応する前記編集画像記憶手段内の2値画像より各文字
列の上端、下端、左端、及び、右端の座標位置を検出し
各位置の座標値を出力する文字列位置検出手段と、前記
文字列位置検出手段からの各文字列ごとの範囲を決める
上下左右の4つの座標値を記憶する文字列位置記憶手段
と、前記文字列位置記憶手段の各文字列の範囲を決める
座標値から作られる領域が前記文字列位置記憶手段の記
憶部に1回で入る文字列の組合せを求め最小の組数にお
ける各組の領域を決める4つの座標値と各組での各文字
列の範囲を決める座標値とを出力する領域計算手段と、
前記文字列位置記憶手段の座標値を前記光電変換手段に
入力し前記領域計算手段からの前記座標値で囲まれた範
囲内の高い分解能の2値画像を記憶する文字列画像記憶
手段と、前記文字列画像記憶手段からの2値画像に対し
て前記文字列位置記憶手段からの各文字列の4つの座標
値により文字列の切り出しと切り出された文字列での文
字切り出し及び切り出された各画像に対しての文字認識
とを行い認識結果を出力する文字認識手段と、前記文字
認識手段からの認識結果を記憶する認識結果記憶手段
と、全体を制御する制御手段とを設けたものである。
(作用) 光電変換部の走査位置が高い精度で制御でき固定されて
いる帳票自体を画像記憶手段とみなすと、特定領域にあ
る画像を読出し記憶することは光電変換部の走査位置を
制御し2値画像を得て記憶することに相当する。また文
字列の範囲を示す座標検出には、画像を水平と垂直との
方向に投影し得られるヒストグラムにいき値処理を施し
て求める方法が一般に使われているが、低し分解能の画
像からの投影情報からでも求めることができる。従って
認識対象範囲を決める際には低い分解能の画像があれば
よく、帳票全部を高い分解能で入力し記憶している必要
はない。文字列の範囲を示す座標が得られると、その座
標値を用いて光電変換部の位置と分解能とを制御し一文
字列分の画像を入力する方法にすると、個々の文字認識
に用いる高い分解能での画像には少なくとも一文字列分
が記憶できる画像記憶手段を用意すればよい。
一文字列分を記憶する画像記憶手段に必要な記憶容量は
帳票の最大幅と最大文字高さ及び光電変換部の分解能に
より決まるが、認識対象範囲の幅が帳票の幅と比較して
半分以下であれば複数文字列分の画像を記憶することは
可能である。そこで予め検出された各文字列の範囲を組
み合わし画像記憶手段の記憶容量と分解能を条件に1回
の光電変換部の制御で取り込める範囲の組を求めてお
き、範囲ごとに画像取り込みを行うと一文字分の画像を
読み出す時間を実質的に短縮できる。1回で取り込まれ
た画像上での各文字列の範囲は範囲を決めるのに組み合
わせた文字列の位置により計算できる。第3図は文字列
から作られる範囲の一例を説明するための図である。
(a)の20は認識対象範囲、11から17までは認識対象範
囲20内から検出された各文字列の範囲を、また(b)は
画像記憶手段に記憶できる容量に対応する文字列換算の
範囲を表しているとする。各文字列範囲の幅は範囲
(b)の幅の半分以下であるので、範囲(b)の面積以
下の条件で文字列の範囲を組み合わすと、範囲の組21,2
2,23が作れる。この範囲の組ごとに光電変換部を制御す
ると、制御の回数は3回ですみ、文字列ごとの制御回数
7回より少ない。従って前述のような機械的な制御が一
般的である光電変換部の制御回数が少なくなると、全体
としての処理時間を短縮できる。
(実施例) 本発明を実施例を参照して詳細に説明する。
第1図は本発明の文字認識装置の一実施例を示すブロッ
ク図である。制御手段1から出力される分解能を選ぶ符
号と範囲を決める4点の座標値からなる制御信号101に
より、光電変換手段2から2値画像の信号201と202とが
出力される。制御手段1から低い分解能を選ぶ符号と全
部の領域に相当する4点の座標値とを表す制御信号101
により光電変換手段2からは低い分解能で得られた2値
画像が信号201として出力される。光電変換手段2の走
査部がCCDに代表されるような線状の光電変換素子、例
えばCCDラインセンサ、に光を導く光学系をステップモ
ータにつなぎ移動させる形式では、分解能の制御は光電
変換素子からの映像信号に対するサンプリング間隔とラ
インイメージを取込む間隔とを制御することに相当す
る。編集画像記憶手段3は、制御手段1からの制御信号
102により光電変換手段2からの2値画像を編集用の画
像として記憶する。表示手段4は、制御手段1からの制
御信号103により編集画像記憶手段3の2値画像を表示
する。また表示手段4には入力手段5からの4点の座標
の信号501で作られる枠を表示する。表示された枠内を
認識対象の範囲とし、入力手段5によりその範囲走査の
際の分解能を選択する符号が入力されると、その分解能
選択の符号が信号502として制御手段1に出力される。
ここで、認識対象の範囲は、その範囲を規定する4角の
座標値で決る。表示画像上で文字認識を行わせる範囲を
囲む2点を指示し、指示された2点を対角の角とする矩
形の4角の座標値を得る。この4点の座標値が入力手段
5からの4点の座標となる。編集の際は見えるだけでよ
いので低い分解能の画像ですむが、文字認識の際には編
集で使った画像よりも高い分解能の画像が必要である。
次に制御手段1は座標の信号501を受けると、文字列位
置検出手段6に対して4点の座標値と文字列検出開始の
制御信号104を出力する。文字位置検出手段6は前記制
御信号104を入力すると、編集画像記憶手段3から4点
の座標内画像に対応する記憶している画像を読みだし文
字列の検出を行う。文字列の検出方法としては、「スプ
リット検出法に基づく頁画像の構造解析」(辻、浅井:
電子通信学会技術研究報告、PRL85-17,1985年6月21
日)にあるように、画像の水平と垂直方向の投影情報を
利用する方法があり一般的であるのでここでは文字列検
出の詳細な説明は省略する。文字列位置検出手段6から
は、各文字列での範囲を決める4点の座標値が順次、信
号601として出力される。
制御手段1は入力される各文字列の4点の座標値である
信号601を記憶し、まず分解能を選ぶ信号502と最初の1
文字列の4点の座標値の信号601とを制御信号101として
出力する。光電変換手段2からは高い分解能の2値画像
の信号202が出力されるので、文字列画像記憶手段7は
制御手段1からの記憶開始の制御信号105により2値画
像の信号202を記憶する。制御手段1は前記制御信号101
により光電変換手段2の1文字列分の走査を制御後に、
文字認識開始の制御信号106を文字認識手段8に出力す
る。文字認識手段8は前記制御信号106を入力すると、
文字列画像記憶手段7から1文字列分の画像を読みだし
文字切出しと切出された画像に対する文字認識を行う。
文字切出しの方法として、さまざまな方法が知られてい
る。たとえば「分散最小基準に基づく適応型文字分離方
式」(辻、浅井:電子通信学会論文誌、Vol.J68-D,No.
8,1985年8月)にあるような文字ピッチを推定し、推定
ピッチをもとに最適化手法を利用して最適な切出し位置
を決定する方法があり、このような方法を使うと文字切
出しができる。また文字認識の方法も多くの方法が知ら
れている。ここでは適当な方法の1つたとえば特願昭60
-270214「文字認識方式」の複数個の判別分析を使う方
法を利用するとし、文字認識方式の詳細な説明はここで
省略する。認識結果記憶手段9は制御手段1からの前記
制御信号106の後に出力される記憶開始の制御信号107に
より文字認識手段8からの認識結果を順次記憶する。認
識結果記憶手段9は文字認識手段8からの文字認識結果
の出力が終了しその結果の記憶が終わると終了信号901
を制御手段1に出力する。
制御手段1は信号901を入力すると、記憶している文字
列ごとに4点の座標値のうちで2番目の4点の座標値と
分解能を選ぶ符号とを制御信号101として光電変換手段
2に出力する。上記処理が繰り返されて、2番目の文字
列分の文字認識結果が認識結果記憶手段9に記憶され
る。同様にして、認識対象の範囲全体に対する文字認識
結果がもとまり、認識結果記憶手段9に記憶される。
文字列の画像を記憶できる容量が1文字列分の画像より
大きい場合には、前述のように、容量により1回の走査
部の制御で入れられる文字列の組みを求め各組の範囲を
決める4点の座標を記憶しておき、その座標値で光電変
換手段2を制御すると、頻繁に制御する必要がなくなり
画像の入力にかかる時間を短縮できる。
第2図は文字列画像を記憶できる容量が1文字列分より
大きい場合の本発明の文字認識装置の一実施例を示すブ
ロック図である。制御手段1から出力される分解能を選
ぶ符号と範囲を表す4点の座標値からなる制御信号101
により、光電変換手段2から2値画像の信号201と202と
が出力される。制御手段1から低い分解能を選ぶ符号と
全部の領域に相当する4点の座標値とを表す制御信号10
1により光電変換手段2からは低い分解能で得られた2
値画像が信号201として出力される。編集画像記憶手段
3は、制御手段1からの制御信号102により光電変換手
段2からの2値画像を編集用の画像として記憶する。表
示手段4は、制御手段1からの制御信号103により編集
画像記憶手段3の2値画像を表示する。また表示手段4
には入力手段5からの4点の座標の信号501で作られる
枠を表示する。表示された枠内が認識対象の範囲として
入力手段5によりその範囲走査の際の分解能を選択する
符号が入力され、信号502として制御手段1に出力され
る。制御手段1は座標の501を受けると、文字列位置検
出手段6に対して4点の座標値と文字列検出開始の信号
104を出力する。文字列位置検出手段6は信号104を入力
すると、編集画像記憶手段3から4点を座標内に対応す
る画像を読みだし文字列の検出を行い、各文字列での範
囲を決める4点の座標値を順次、信号601として出力さ
れる。
領域計算手段10は、まず制御手段1からの分解能を表す
信号105と文字列位置検出手段6からの各文字列の4点
の座標値である信号601とを記憶する。次に記憶した各
文字列の範囲を決める4つの座標を組合わせ、あらかじ
め記憶している文字列画像記憶手段7の容量と記憶した
符号から決まる分解能とを条件に1回の走査で取込める
組合わせを求め、各組合せで作られた範囲を表す4点の
座標値と元の各文字列の範囲を決める4点の座標値を信
号1001として出力する。制御手段1は前記信号1001を記
憶し、まず分解能を選ぶ信号502と最初の組の4点の座
標値の信号601とを制御信号101として出力する。光電変
換手段2からは高い分解能の2値画像の信号202が出力
されるので、文字列画像記憶手段7は制御手段1からの
制御信号106により2値画像の信号202を記憶する。制御
手段1は最初の組の各文字列の4点の座標値の信号107
を文字認識手段8に出力する。文字認識手段8は前記信
号107を用いて文字列の切出し、文字切出し及び切出さ
れた画像に対する文字認識を行う。認識結果記憶手段9
は制御手段1からの制御信号108により文字認識手段8
からの認識結果を順次記憶する。認識結果記憶手段9は
文字認識手段8からの文字認識結果の出力が終了しその
結果の記憶が終ると終了信号901を制御手段1に出力す
る。
制御手段1は前記信号901を入力すると、記憶している
組ごとの4点の座標値のうちで2番目の4点の座標値と
分解能を選ぶ符号とを制御信号101として光電変換手段
2に出力する。上記処理が繰り返されて、2番目の組分
の文字認識結果が認識結果記憶手段9に記憶される。同
様にして、認識対象の範囲全体に対する文字認識結果が
もとまり、認識結果記憶手段9に記憶される。
上述の説明における手段は、メモリ、マイクロプロセッ
サ、ディスプレイ、キーボード(又はマウス)、スキャ
ナからなるパーソナルコンピュータシステムで行えるこ
とは言うまでもない。
(発明の効果) 以上説明したように本発明によれば大きな容量の画像記
憶手段と圧縮伸張回路とが不要となる効果がある。
【図面の簡単な説明】
第1図、第2図は本発明の文字認識装置の一実施例を示
すブロック図、第3図は文字列から作られる範囲の一例
を示す図である。 図において、1は制御手段、2は光電変換手段、3は編
集画像記憶手段、4は表示手段、5は入力手段、6は文
字列位置検出手段、7は文字列画像記憶手段、8は文字
認識手段、9は認識結果記憶手段、10は領域計算手段で
ある。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】固定された帳票の指定範囲を指定の分解能
    で走査・光電変換し2値画像を得る光電変換手段と、前
    記光電変換手段からの低い分解能で得られた2値画像を
    記憶する編集画像記憶手段と、前記編集画像記憶手段の
    2値画像と認識対象の範囲とを重ねて表示する表示手段
    と、前記表示手段に表示される認識対象の範囲を決める
    座標位置と分解能とを入力する入力手段と、前記入力手
    段で指定された範囲に対応する前記編集画像記憶手段内
    の2値画像より各文字列の上端、下端、左端、及び、右
    端の座標位置を検出し各位置の座標値を出力する文字列
    位置検出手段と、前記文字列位置検出手段からの各文字
    列ごとの範囲を決める上下左右の4つの座標値を記憶す
    る文字列位置記憶手段と、前記文字列位置記憶手段の座
    標値を入力し前記光電変換手段から出力される前記座標
    値で囲まれた範囲内の高い分解能の2値画像を記憶する
    文字列画像記憶手段と、前記文字列画像記憶手段からの
    2値画像に対して文字切り出しと切り出された各画像に
    対しての文字認識とを行い認識結果を出力する文字認識
    手段と、前記文字認識手段からの認識結果を記憶する認
    識結果記憶手段と、全体を制御する制御手段とを備える
    ことを特徴とする文字認識装置。
  2. 【請求項2】固定された帳票の指定範囲を指定の分解能
    で走査・光電変換し2値画像を得る光電変換手段と、前
    記光電変換手段からの低い分解能で得られた2値画像を
    記憶する編集画像記憶手段と、前記編集画像記憶手段の
    2値画像と認識対象の範囲とを重ねて表示する表示手段
    と、前記表示手段に表示される認識対象の範囲を決める
    座標位置と分解能とを入力する入力手段と、前記入力手
    段で指定された範囲に対応する前記編集画像記憶手段内
    の2値画像より各文字列の上端、下端、左端、及び、右
    端の座標位置を検出し各位置の座標値を出力する文字列
    位置検出手段と、前記文字列位置検出手段からの各文字
    列ごとの範囲を決める上下左右の4つの座標値を記憶す
    る文字列位置記憶手段と、前記文字列位置記憶手段の各
    文字列の範囲を決める座標値から作られる領域が前記文
    字列位置記憶手段の記憶部に1回で入る文字列の組合せ
    を求め最小の組数における各組の領域を決める4つの座
    標位置と各組での各文字列の範囲を決める座標値とを出
    力する領域計算手段と、前記文字列位置記憶手段の座標
    値を前記光電変換手段に入力し前記領域計算手段からの
    前記座標値で囲まれた範囲内の高い分解能の2値画像を
    記憶する文字列画像記憶手段と、前記文字列画像記憶手
    段からの2値画像に対して前記文字列位置記憶手段から
    の各文字列の4つの座標値により文字列の切り出しと切
    り出された文字列での文字切り出し及び切り出された各
    画像に対しての文字認識とを行い認識結果を出力する文
    字認識手段と、前記文字認識手段からの認識結果を記憶
    する認識結果記憶手段と、全体を制御する制御手段とを
    備えることを特徴とする文字認識装置。
JP61143389A 1986-06-18 1986-06-18 文字認識装置 Expired - Lifetime JPH07120386B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61143389A JPH07120386B2 (ja) 1986-06-18 1986-06-18 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61143389A JPH07120386B2 (ja) 1986-06-18 1986-06-18 文字認識装置

Publications (2)

Publication Number Publication Date
JPS62298887A JPS62298887A (ja) 1987-12-25
JPH07120386B2 true JPH07120386B2 (ja) 1995-12-20

Family

ID=15337628

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61143389A Expired - Lifetime JPH07120386B2 (ja) 1986-06-18 1986-06-18 文字認識装置

Country Status (1)

Country Link
JP (1) JPH07120386B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2579356B2 (ja) * 1989-01-13 1997-02-05 三菱電機株式会社 文書読取装置
US5361309A (en) * 1989-09-07 1994-11-01 Canon Kabushiki Kaisha Character recognition apparatus and method with low-resolution storage for character extraction

Also Published As

Publication number Publication date
JPS62298887A (ja) 1987-12-25

Similar Documents

Publication Publication Date Title
US5048107A (en) Table region identification method
JP2001203876A (ja) 文書修飾装置及び画像処理装置
US6690492B2 (en) Image processing method and apparatus
US6175664B1 (en) Optical character reader with tangent detection for detecting tilt of image data
US5563964A (en) Method and apparatus for processing a plurality of designated areas of an image
JPH07120386B2 (ja) 文字認識装置
US5361309A (en) Character recognition apparatus and method with low-resolution storage for character extraction
JP3281469B2 (ja) 文書画像の傾き検出方法および装置
JP2803736B2 (ja) 文字認識方式
JP2800205B2 (ja) 画像処理装置
JP3052438B2 (ja) 表認識装置
JPH0679348B2 (ja) 行切り出し方法
JP3923104B2 (ja) 表処理方法および表処理装置
JP2887803B2 (ja) 文書画像処理装置
JP3502130B2 (ja) 表認識装置および表認識方法
JP2926842B2 (ja) 文字切出し回路
JP2931041B2 (ja) 表内文字認識方法
JPH087042A (ja) 画像認識方法およびその装置
JP3100619B2 (ja) 写真領域抽出装置
JP3167551B2 (ja) 文字認識装置
JP2878327B2 (ja) 文字切り出し装置
JP2954218B2 (ja) 画像処理方法及び装置
JPS63137383A (ja) 文字読取装置
JPH04276888A (ja) 文字読取装置
JP3031565B2 (ja) 表領域判定方法