JPH02297687A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH02297687A
JPH02297687A JP1117576A JP11757689A JPH02297687A JP H02297687 A JPH02297687 A JP H02297687A JP 1117576 A JP1117576 A JP 1117576A JP 11757689 A JP11757689 A JP 11757689A JP H02297687 A JPH02297687 A JP H02297687A
Authority
JP
Japan
Prior art keywords
area
character
recognition
character recognition
boundary line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1117576A
Other languages
English (en)
Other versions
JP2734628B2 (ja
Inventor
Hirohisa Goto
後藤 裕久
Yoshiyuki Yamashita
山下 義征
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP1117576A priority Critical patent/JP2734628B2/ja
Publication of JPH02297687A publication Critical patent/JPH02297687A/ja
Application granted granted Critical
Publication of JP2734628B2 publication Critical patent/JP2734628B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は印刷文書や記入枠のない手書文書を読取る文字
認識装置に関する。
(従来の技術) 郵便番号読取装置を始めとする従来の文字認識装置は、
文字を記入する記入枠が設けられた帳票や予め定められ
た書式の印刷文書を読取対象としている。
近年、日本語情報システムが普及するにつれ、様々な日
本語データを入力するため従来の装置のように予め定め
られた書式の帳票だけでなく、一般の印刷文書や記入枠
のない手書文書を読取る文字認識装置に対する期待と必
要性が急速に高まってきている。
これらの文書では段組みがあったり、写真、図形が混在
していることが一般的であり、又、未だ文字/図形/画
像を自動分離する汎用技術が確立されていないという状
況の中でg″「文字認識概論」、橋本新一部著、昭和5
7年3月20日、電気通信協会発行、P、 164〜P
、166、llに記載されるように、認識対象とする文
書をタブレットにのせ、タブレット上で文字領域を指定
した後にその文書を認識する方法や認識対象とする文書
を例えばCRT等の画像表示装置に表示し、マウスやラ
イトベン等の座標入力装置で文字領域を指定し文字を認
識する方法が実用化されている。
ここで、マウスを用いて認識対象領域の指定を行って文
字を認識する動作を説明する。
まず、認識対象とする領域21を指定するためマウスを
動かして第2図に示す文書23が表示された画面22上
のカーソルを始点PAの位置に移動し、マウスに設けら
れたボタンを押す。ボタンを押したままマウスを動かし
カーソルを終点PRの位置まで移動し、ボタンを離ずと
始点PAと終点P8で定められる矩形領域が得られ、た
だちに前記矩形領域について文字の認識を行なう。
このようなマウス等によって領域を指定し、領域指定な
゛終了すると自動的に認識動作を行う方法以外に、第1
のオペレーションとして領域の指定を行ない、領域指定
後、第2のオペレーションとして認識動作を起動する方
法があるが、領域指定と認識のオペレーションかそれぞ
れ別であり、2回オペレーションをする必要があるため
、マウスの移動量及び移動回数か多く様々な書式の印刷
文書を次々に読取るような文字認識装置の通常の使用法
においては、オペレーションが煩雑になり操作性が非常
に悪かった。そのため、領域指定後ただちに認識を開始
する方法が広く使用され°Cいる。
(発明が解決しようとする課題) しかしながら、上記従来の方法では文字領域の指定にお
いて、マウスで領域を指定する際に、オペレータがマウ
スの操作を誤って、または、誤りと気付かずに第3図に
示すような文字領域の境界線が文字にかかるように領域
指定をしてしまった場合に、領域指定を行なった後、た
だちに文字波。
識を行なうような従来の方法では、文字認識終了後に、
結果を見てはじめて領域指定で文字にかかっていたこと
に気付いたり、認識の途中で領域指定の誤りに気付いて
も認識を中断させることができずに、認識の終了まで待
たなければならないという問題点があった。例えば認識
速度が5文字/秒とすると。第3図の例の指定領域では
、約200文字あり全文字の認識終了には約40秒かか
る。領域指定は、高々4〜5秒で行えるため、約10倍
の時間を無駄にして再び領域指定を行なわなければなら
ない。認識結果は、行の途中までのため、修正も大変面
倒であった。
また、タブレットを座標指定に使用して文字領域を指定
する方法では、タブレット上に用紙を置いて、その用紙
の上で領域指定を行なうが、用紙のセットの位置がずれ
ていた場合にも、文字領域の指定をする境界線が文”t
−かかってしまい、上記と同様の問題点があった。
このように、マウスで文字領域の指定後、ただちに、文
字領域内の文字を認識するといったような従来の方法で
は、指定誤りを認識を終るのを待って、再び、文字領域
を指定し、再び認識を行わなければならず、また、タブ
レットによる領域指定の方法は認識結果を見てはじめて
指定誤りが判るといったように、処理に時間がかかり、
操作性が非常に悪いという問題点があった。
本発明はこれらの問題点を解決するためのもので、指定
した領域の境界線上を走査して走査線」二の特徴を抽出
しこの特徴に基づいて、文字認識動作への移行の制限を
行なうようにした、領域指定の誤りの自動検出機能を持
つ操作性の優れた文字認識装置を提供することを目的と
する。
(課題を解決するための手段) 本発明は前記問題点を解決するために、媒体−Eの文書
の内認識対象とする領域を指定する領域指定手段と、こ
の領域指定手段により指定された領域の境界線上の特徴
を抽出し、この特徴が所定の条件を満たさない場合文字
認識処理への移行を制限する手段と、領域指定手段によ
り指定された領域内の認識対象に対して文字認識を行な
う文字認識手段とを具備することに特徴がある。
(作用) 以上のような構成を有する本発明によれば、オペレータ
はタブレット、マウス等を具備する領域指定手段によっ
”C媒体上の文書の内認識対象とする領域を指定する。
この領域指定手段により指定された領域の境界線上の特
徴が抽出され、この特徴が所定の条件を満たさない場合
文字認識処理への移行を制限する。当該領域の境界線上
の特徴が所定の条件を満たす場合、またはオペレータの
継続の指示があった場合には領域指定手段により指定さ
れた領域内の認識対象に対して文字認識を行なう。
したがって、本発明は前記問題点を解決でき、領域指定
の誤りの自動検出機能を持つ操作性の優れた文字認識装
置を提供できる。
(実施例) 以下、本発明の一実施例を図面に基づいて説明する。
第1図は本発明の一実施例の構成を示すブロック図であ
る。同図において、1は画像バッファ、2は検出部、3
は文字認識制御部、4は文字認識部、5は制御部、6は
領域指定部、7は表示部、8は画像信号入力、9はキー
ボードである。なお、画像信号人力8は第1図に図示し
ていない走査光電変換部により入力文書が変換された2
値化画像信号であり、画像バッファ1に入力され格納さ
れる。以降の説明において、文字線上の画素を黒画素、
文字背景部の画素を白画素と称す。
次に、本実施例の動作について説明する。
まず、制御部5は画像バッファ1に格納された画像デー
タを表示部7に表示する。オペレータは表示部7に表示
された画像を見ながら領域指定部6のマウスを動かし認
識対象領域の始点にカーソルを移動しボタンを押すと、
領域指定部6は画像バッファ内の領域の始点座標を領域
指定部6から制御部5へ出力する。制御部5は表示部7
に始点Fi標を出力する。表示部7は表示面の制御部5
から受取った始点座標の位置にマークを表示する。
ここで、表示部7は画面上に始点座標と画面上のカーソ
ルで定められる矩形領域を表示する。
さらに、オペレータがボタンを押したままマウスを動か
して認識対象領域の終点にカーソルを移動し、ボタンを
離すと、領域指定部6は画像バッファ内の終点座標を制
御部5へ出力するとともに領域指定終了の信号を制御部
5へ出力する。
制御部5は領域指定部6から出力された終点座標と領域
指定終了信号を受取ると、始点の座標アドレスと終点の
座標アドレスを文字認識制御部3に出力し、処理開始信
号を出力する。文字認識制御部3は処理開始信号を受取
ると検出部2へ始点座標アドレスと終点座標アドレスを
出力し、検出起動信号を検出部2に出力する。検出部2
は検出起動信号を受取ると、始点座標アドレスと終点座
標アドレスで定まる矩形領域の4つの頂点の座標を求め
、画像バッファ1から出力された画像データ内の4つの
頂点の座標アドレスをもとに、矩形領域の4辺を上辺、
右辺、下辺、左辺の順に、左から右、上から下へ走査し
ながら走査線上の黒画素数B。を計数する。走査中に黒
画素数B。を予め設定された閾値nt (本実施例では
文書の汚れや付着したゴミなどの影響を受けないように
Bt=8とする)と比較し、Bn<Btならば走査を継
続する。4辺全て走査が終了すると、検出部2は走査終
了信号を文字認識制御部3に出力し、文字認識制御部3
は走査終了信号を受取ると、認識部4に始点と終点の座
標と認識開始信号を出力する。認識部4は認識開始信号
を受取ると、画像バッファ1内の始点と終点で定まる矩
形領域の認識を開始する。
そして、前記矩形領域を走査し、水平方向の黒画素数の
周辺分布を作成し矩形領域内の文字行の切出しを行い、
切出した文字行ごとに垂直方向に黒画素の周辺分布を作
成し、−文字ずつ切出す。
さらに−文字ずつ切出された文字パターンの特徴を抽出
し、文字認識部4内の図示されていない辞書と比較照合
し、認識結果として文字名出力を制御部5に出力する。
制御部5は、文字認識部4から受取った文字名出力を表
示部7に出力する。表示部7は制御部5から受取った文
字名出力を表示する。
一方、検出部2で始点と終点で定まる矩形領域の4辺を
それぞれ走査し、走査しながら計数した黒画素数B。が
閾値B、と比較してBn>Btとなった場合、検出部2
は文字認識制御部3にエラー検出信号を出力し、処理を
中止する。文字認識制御部3はエラー検出信号を受取る
と制御部5にエラー検出信号を出力する。制御部5は文
字認識制御部3からエラー検出信号を受取ると表示部7
に「領域指定誤り」のメツセージを表示し、キーボード
からの継続信号または領域指定部6からの領域指定の信
号を待つ。ここでオペレータは処理を継続するか領域の
再指定を行なうかを判断する。処理を継続する場合は、
キーボード9の継続キーを押す。
キーボード9で継続キーが押され、継続信号が出力され
ると、制御部5は文字認識制御部3に認識開始信号を出
力し、文字認識制御部3は文字認識部4に始点、終点の
座標と認識開始信号を出力し、文字認識部4は前記矩形
領域内の認識を行なう。その後の動作は先に説明したも
のと同様である。
また、領域の再指定を行う場合は、オペレータは領域指
定から始めることとなる。
したがって、本実施例によれば、例えば第3図の領域指
定については、従来の方法では文字認識の終了まで約4
0秒程度かかりその間オペレータは待つ必要があったが
、領域の境界線上の黒画素数と所定の値を比較する機能
を持つ文字部に領域境界がかかった様な領域指定の誤り
を自動的に検出し、処理を中断しているので領域指定の
誤りをすぐに訂正することができ大幅に操作性及び処理
速度を向上させることができる。
なお、本実施例では、文字に境界線かかかっているかど
うかの判定を黒画素数により行なっているが、文字線と
の交差数を検出しても同様な効果が得られることは明白
である。その場合の交差の検出は、白画素から黒画素へ
の変化をもって行なうとよい。この交差数は黒ランの個
数と等しいことは言うまでもない。
また、本発明の別の実施例として領域指定部にタブレッ
ト、ライトベン等を使用しても同様の効果が得られる。
ライトベンを使用した場合はマウスと同様に表示部上の
文書画像をみて領域指定を行なう。タブレットを使用し
て領域指定を行なう場合は、オペレータが領域指定部の
タブレット上に認識する文書をのせ、タブレット上の文
書を見ながらタブレットベンで認識対象領域の左上の点
を押すと第1図の領域指定部6から制御部5へ領域の左
上の点の座標を出力する。次に、オペレータがタブレッ
トベンをタブレットから離し、認識対象領域の右下の点
をタブレットベンで押すと、領域指定部6は認識対象領
域の右下の点の座標を制御部5に出力するとともに領域
指定終了の信号を制御部5へ出力する。領域指定終了後
の動作については上述の実施例と同様である。
(発明の効果) 以上説明したように、本発明によれば、領域指定部で指
定された領域の境界線上を走査して境界線上の特徴を抽
出し当該特徴が所定の条件を満足しない場合、文字認識
動作への移行を制御するようにしたので、認識対象の領
域指定でオペレータが領域の境界線が文字にかかったま
ま領域を指定し認識終了後にはじめて領域指定に誤りが
あったことがわかるという問題点や操作性を大幅に向上
させることができる文字認識装置を提供できる。
【図面の簡単な説明】
第1図は本発明の一実施例の構成を示すブロック図、第
2図は読取対象の文書の一例を示す図、第3図は領域指
定動作後の矩形領域を示す図である。 1・・・画像バッファ、 2・・・検出部、 3・・・文字認識制御部、 4・・・文字認識部、 5・・・制御部、 6・・・領域指定部、 7・・・表示部、 8・・・画像信号入力、 9・・・キーボード。

Claims (1)

  1. 【特許請求の範囲】 媒体上の文書の内認識対象とする領域を指定する領域指
    定手段と、 該領域指定手段により指定された領域の境界線上の特徴
    を抽出し、該特徴が所定の条件を満たさない場合文字認
    識処理への移行を制限する手段と、 前記領域指定手段により指定された領域内の認識対象に
    対して文字認識を行なう文字認識手段とを具備すること
    を特徴とする文字認識装置。
JP1117576A 1989-05-12 1989-05-12 文字認識装置 Expired - Fee Related JP2734628B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1117576A JP2734628B2 (ja) 1989-05-12 1989-05-12 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1117576A JP2734628B2 (ja) 1989-05-12 1989-05-12 文字認識装置

Publications (2)

Publication Number Publication Date
JPH02297687A true JPH02297687A (ja) 1990-12-10
JP2734628B2 JP2734628B2 (ja) 1998-04-02

Family

ID=14715241

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1117576A Expired - Fee Related JP2734628B2 (ja) 1989-05-12 1989-05-12 文字認識装置

Country Status (1)

Country Link
JP (1) JP2734628B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000251012A (ja) * 1999-03-01 2000-09-14 Hitachi Ltd 帳票処理方法およびシステム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6235988A (ja) * 1985-08-09 1987-02-16 Fujitsu Ltd 入力方式

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6235988A (ja) * 1985-08-09 1987-02-16 Fujitsu Ltd 入力方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000251012A (ja) * 1999-03-01 2000-09-14 Hitachi Ltd 帳票処理方法およびシステム

Also Published As

Publication number Publication date
JP2734628B2 (ja) 1998-04-02

Similar Documents

Publication Publication Date Title
US5025484A (en) Character reader device
US4823395A (en) Image information recognition apparatus
JP3756719B2 (ja) 文書修飾装置及び画像処理装置
US5123062A (en) OCR for sequentially displaying document layout according to recognition process
JP2001175807A (ja) テキスト領域選択方法
GB2378073A (en) Paper document to computer interface.
JP3443146B2 (ja) 画像合成方法および画像記録装置
WO2001003416A1 (fr) Dispositif et procede d'elimination de bordure, et dispositif de creation
JPH03214378A (ja) 文字認識装置
JP2734628B2 (ja) 文字認識装置
JP3113747B2 (ja) 文字認識装置及び文字認識方法
JP3171626B2 (ja) 文字認識の処理領域・処理条件指定方法
EP0783149B1 (en) Clipboard for interactive desktop system
JP3095470B2 (ja) 文字認識装置
EP0840199A2 (en) Screen-based interface for interactive desktop system
JPH0355867B2 (ja)
JP2579356B2 (ja) 文書読取装置
JP2001155139A (ja) カメラ付きペン型入力装置用記憶媒体
JPH0762859B2 (ja) 文字パターン認識修正装置
JPH05128302A (ja) 文字認識方法及びその装置
JPH0473192B2 (ja)
JP3221969B2 (ja) 文字認識装置
JPH02193278A (ja) 画像処理装置
JPH0459669B2 (ja)
JP3089604B2 (ja) スキュー検出方法、文字認識方法及び文字認識装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees