JPH0562017A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0562017A
JPH0562017A JP3219070A JP21907091A JPH0562017A JP H0562017 A JPH0562017 A JP H0562017A JP 3219070 A JP3219070 A JP 3219070A JP 21907091 A JP21907091 A JP 21907091A JP H0562017 A JPH0562017 A JP H0562017A
Authority
JP
Japan
Prior art keywords
character
line width
pattern
unit
size
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3219070A
Other languages
English (en)
Other versions
JP2747136B2 (ja
Inventor
Koji Ito
晃治 伊東
Yoshiyuki Yamashita
義征 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP3219070A priority Critical patent/JP2747136B2/ja
Publication of JPH0562017A publication Critical patent/JPH0562017A/ja
Application granted granted Critical
Publication of JP2747136B2 publication Critical patent/JP2747136B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 [目的] 文字サイズが種々の文字を正規化して同一の
文字認識装置で認識する際に正規化による文字線の欠落
や空白のつぶれに起因する誤読をなくす或いは減少させ
ること。 [構成] 文字枠検出部40はパタンレジスタ30に格
納されている文字パタンの文字サイズを求める。線幅計
算部80はパタンレジスタ30に格納されている文字パ
タンの線幅を算出する。線幅決定部90は前記算出され
た線幅が前記文字サイズに応じ予め規定された線幅の範
囲外の場合にパタンレジスタ30に格納されている着目
文字パタンについての認識結果を棄却とする旨の指示信
号を出力する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は文字認識装置に関す
る。
【0002】
【従来の技術】新聞、書籍、雑誌等の一般印刷文書で
は、本文の文字サイズと、見出しまたは表題の文字サイ
ズとが大きく異なる。これら文字サイズの異なる文字の
認識を同一装置によりすなわち同一の認識方法及び回路
を用いて行なうためには、文字パタンの大きさを正規化
しこの正規化した文字パタンについて認識処理を行なう
必要がある。
【0003】文字サイズが基準値より大きい場合の文字
パタンの正規化の一つの方法として文字パタンを単純に
間引く方法があった。具体的には、元の文字パタンを1
/2、1/3、1/4等の正規化定数倍に縮少したパタ
ンに変換する方法である。
【0004】実際のところ、一般の印刷文書では、主た
る字体は明朝体とされまた本文の文字サイズは約3mm
及び見出しや表題の文字サイズはほぼ12mm以上とさ
れることが多い。そして文字認識装置では一般に、文字
サイズ3mmの文字パタンを格納する正規化パタンメモ
リ(通常は文字認識装置の認識部に設けられている。)
には通常64×64画素或は128×128画素の容量
を有するものが用いられる。このため、文字サイズ12
mmの文字パタンを認識する場合は文字パタンは1/4
に圧縮(正規化)され正規化パタンメモリに格納され
る。
【0005】この方法によれば、正規化の処理を行なう
ための処理及びハードウエアを追加するのみでその他の
処理及びハードウエアは各文字サイズ共通にできる。こ
のため、文字認識装置の処理速度を早くできまたハード
ウェアの規模を小さくすることができた。
【0006】
【発明が解決しようとする課題】しかしながら、文字サ
イズ12mmの明朝体文字の水平ストロークの線幅は
0.3mm程度である。従って、この種の文字から一般
に用いられる解像度300dpiのスキャナーで得た文
字パタンの水平ストロークの線幅は3画素となるので、
文字サイズ12mmの明朝体文字の文字パタンを単純に
1/4に間引くと水平ストロークが欠落することがある
という問題点が生じる(詳細は後述する。)。
【0007】また見出しや表題にはゴシック体、特別に
デザインした字体等の極端に線幅の太い文字を使用する
ことも多い。一般に文字線が太くなるに応じて文字線間
の空白は狭くなる傾向があるので、極端に線幅が太い文
字では文字線間の空白の幅が狭くなりすぎる。このた
め、このような文字を単純に間引くと、空白がつぶれる
ことがあるという問題点が生じる。
【0008】このような問題点は、文字サイズが違う場
合や活字体の種類が違う場合のみに限らず文書を印刷す
る際の印刷濃度の違いによるかすれ文字やつぶれ文字を
量子化した文字パタンでも同様に生じる。印刷濃度の違
いは新聞において顕著である。
【0009】上述の水平ストロークが欠落すること、空
白がつぶれることの各問題点について図を参照しより詳
細に説明する。
【0010】図6(A)及び(B)は水平ストローク欠
落の説明に供する図である。特に図6(A)は明朝体文
字の一例を、また図6(B)は図6(A)に示した文字
をスキャナで読み取り文字切り出しを行なうことでパタ
ンレジスタに格納された「書」の文字のデータのうちの
一部分(図6(A)の一点鎖線で囲んだ部分)の水平ス
トロークを拡大して示した図である。線幅が3画素の水
平ストロークとなっている例である。なお、通常パタン
レジスタは、文字切り出し部の後段に設けられ、認識部
の正規化パタンメモリの容量より大きいメモリで構成さ
れているものである。
【0011】図6(B)では、スキャナ読取り時の画素
位置を点線の格子点で及び1/4に間引きした時の画素
位置を直線の格子点で表し、さらに白黒2値に量子化さ
れた文字パタンの黒画素(文字線部)を黒丸印を付した
格子点で及び白画素(文字背景部)を無印の格子点で表
してある。パタンレジスタ上にはスキャナの主走査位置
を表すX軸及びスキャナの副走査位置を表すY軸を設定
しており、X軸及びY軸に平行な点線TX 及びTY を交
差させてスキャナの読取り画素位置に対応する位置に点
線の格子点を設定している。
【0012】単純に1/4に間引きを行なう場合、パタ
ン上に設定したX−Y座標系の原点から数えて4本目毎
の点線TX 及びTY を実線JX 及びJY として選択し、
これら実線の格子点に存在する白画素或は黒画素をその
まま間引きにより正規化した文字パタンの画素として採
用する。
【0013】従って図6(B)に示すように、線幅3画
素の水平ストロークが隣接する直線JX 間に位置する場
合、間引き後の文字パタンには線幅3画素の水平ストロ
ークに対応する黒画素が残らず、この結果、水平ストロ
ークは欠落する。
【0014】また、図7(A)及び(B)は文字間の空
白のつぶれの説明に供する図である。特に、図7(A)
はゴシック体文字の一例を、また図7(B)は図7
(A)に示したゴシック体文字を図6(B)の記載方法
と同様な方法で示した図である。なお、図7(B)にお
いて図6(B)に示す構成成分と同様の構成成分につい
ては同一の符号を付して示してある。
【0015】図7(B)に示すように、幅3画素の空白
が隣接する直線JX間に位置する場合、間引き後の文字
パタンには幅3画素の空白に対応する白点が残らず、こ
の結果、文字線間の空白はつぶれる。
【0016】図6及び図7を用いて説明したような問題
点が生じると、正規化した文字パタンは正確な文字パタ
ンでなくなるので、文字認識の誤読や棄却が増加し認識
精度が悪くなる。認識結果の誤読は、後の修正の際にオ
ペレータが認識結果を読まなければ発見できないため、
誤読が増加することは認識処理全体の効率を低下させる
ので改善が望まれる。
【0017】この発明はこのような点に鑑みなされたも
のであり従ってこの発明の目的は、正規化による文字線
の欠落や空白のつぶれに起因する誤読をなくす或いは減
少させることができる文字認識装置を提供することにあ
る。
【0018】
【課題を解決するための手段】この目的の達成を図るた
め、この発明によれば、文字媒体の量子化された画像デ
ータから一文字単位に文字パタンを切出す文字切出し部
と、各文字パタン毎に文字外接枠を検出し、該文字外接
枠の位置から前述の文字パタンの文字サイズを求める文
字枠検出部と、該文字サイズに応じた正規化定数を設定
する正規化定数決定部と、該正規化定数に基づいて前述
の文字パタンを正規化する正規化部と、正規化された文
字パタンの認識を行なう認識部とを具える文字認識装置
において、前述の文字パタンの線幅を算出する線幅計算
部と、該線幅計算部によって算出された線幅が前述の文
字サイズに応じ予め規定された線幅の範囲外の場合に着
目文字パタンについての認識結果を棄却とする旨の指示
信号を出力する線幅判定部とを具えたことを特徴とす
る。
【0019】なお、この発明の実施に当たり、前述の線
幅判定部は前記線幅計算部によって算出された線幅が前
記文字サイズに応じ予め規定された線幅の範囲外の場合
に警告信号を出力する構成としても良い。もちろん、認
識結果を棄却とする旨の指示信号を出力することと警告
信号を出力することとを共に行なう構成であっても良
い。
【0020】さらにこの発明の実施に当たり、線幅が第
一の所定幅C1 以下である文字パタンの文字線を太くす
る太め処理、及び、線幅が第二の所定幅C2 以上である
文字パタンの文字線を細くする細め処理の双方又は一方
の処理を行なう線幅変換部をさらに具える構成とするの
が好適である。ここで、C1 、C2 は、詳細は後述する
が、互いが同じ値でも異なる値でも良い。
【0021】
【作用】このような構成によれば、正規化することによ
り水平ストロークが欠落したり、空白がつぶれる危険性
が高い文字、例えば文字認識装置が認識対象として想定
していた文字サイズ、活字体、文字濃度から逸脱するよ
うな文字の認識結果は棄却とされるので、誤読の発生が
なくなるか低減される。
【0022】また、警告信号を発する構成の場合は、正
規化することにより水平ストロークが欠落したり、空白
がつぶれる危険性の高い文字毎にオペレータに対し注意
を促すことが可能になる。
【0023】また、線幅変換部をさらに具える構成とし
た場合、線幅判定部で正常と判定された文字パタンを文
字認識に好適な線幅の文字パタンにさらに変換できるの
で、より誤読の発生を低減できる。
【0024】
【実施例】以下、図面を参照してこの発明の文字認識装
置の実施例について説明する。しかしながら、説明に用
いる各図はこの発明を理解できる程度に概略的に示して
あるにすぎない。
【0025】1.第1実施例 図1はこの発明の第1実施例の文字認識装置の説明に供
する機能ブロック図である。
【0026】この第1実施例の文字認識装置は、帳票、
印刷文書などの文字媒体からの光信号Lを入力し量子化
された画像データを得る光電変換部10と、該画像デー
タから一文字単位に文字パタンを切出す文字切出し部2
0と、切出した文字パタンを格納するパタンレジスタ3
0と、各文字パタン毎に文字外接枠を検出し文字外接枠
の位置から文字パタンの文字サイズを求める文字枠検出
部40と、文字サイズに応じた正規化定数を設定する正
規化定数決定部50と、設定された正規化定数に基づい
て文字パタンを正規化する正規化部60と、正規化され
た文字パタンの認識を行なう認識部70と、認識部70
での認識結果(文字名)を出力する出力端子70aとを
具え、さらに文字パタンの線幅を算出する線幅計算部8
0と、該線幅計算部80によって算出された線幅が文字
枠検出部40で検出した文字サイズに応じ予め規定され
た線幅の範囲外の場合に着目文字パタンの認識結果を棄
却とする旨の指示信号を出力する線幅判定部90とを具
える。
【0027】さらにこの第1実施例の文字認識装置は、
上述の各構成成分の他に、線幅が第一の所定幅C1 以下
である文字パタンの文字線を太くする太め処理部100
a及び線幅が第二の所定幅C2 以上である文字パタンの
文字線を細くする第二の処理を行なう細め処理部100
bを有する線幅変換部100と、正規化部60に対し太
め処理部100aで処理したデータ、細め処理部100
bで処理したデータ及びパタンレジスタのデータの何れ
か一つを文字パタンとして入力するデータ切り換え部1
10と、線幅計算部80から入力される信号及び線幅判
定部90から入力される信号に応じデータ選択部に対し
指示信号を出力しかつ線幅変換部100での処理を切り
換える処理選択部120とを具える。
【0028】出力端子70aは、例えばプリンタ、ディ
スプレイ、コンピュタ、音声合成装置などの好適な装置
に接続できる。
【0029】以下、この第1実施例の文字認識装置の詳
細について動作と共に説明する。
【0030】光電変換部10は認識処理対象となる文字
媒体を光学的に走査して文字媒体からの光信号Lを入力
し、この光信号Lを光電変換しさらに例えば白黒2値に
量子化した画像データに変換する。
【0031】文字切出し部20は図示しない画像メモリ
に光電変換部10からの画像データを保存し、この画像
データを走査して画像データから一文字単位に文字パタ
ンを切出し、切出した文字パタンをパタンレジスタ30
に保存する。ここで、パタンレジスタは認識対象の文字
媒体中の大きな文字サイズの文字の画像データをも充分
格納できる容量を有するものとしてある。
【0032】文字枠検出部40はパタンレジスタ30の
文字パタンを走査して当該パタンの文字外接枠を検出す
る。パタンレジスタ30上にはX−Y座標系を設定して
あり、この座標系で表される文字外接枠の上端、下端、
左端及び右端位置YT 、YB 、XL 及びXR を検出す
る。上端、下端位置YT 、YB はY軸方向における文字
外接枠の始端、終端位置を、また左端、右端位置XL
R はX軸方向における文字外接枠の始端、終端位置を
表すものであり、文字枠検出部40は上端、下端位置Y
T 、YB から文字パタンの高さを算出し、さらに左端、
右端位置XL 、XR から文字パタンの幅を算出する。
【0033】正規化定数決定部50は各文字毎に文字パ
タンの高さ及び幅から正規化定数を決定する。ここでパ
タンレジスタ30に格納された文字パタンを着目文字パ
タンと称するとすれば、まず、着目文字パタンの高さ及
び幅のうち値が大きい方を当該パタンの文字サイズSと
して検出する。ここで処理対象となる帳票において文字
サイズの最小値が例えば3mmであることが予めわかっ
ているものとすれば、例えば、3≦S<6のときN=
1、6≦S<9のときN=1/2、9≦S<12のとき
N=1/3、…以下3n≦S<3(n+1)のときN=
1/n(nは自然数)となるように3mm単位に文字サ
イズSを分類し、その分類に応じた正規化定数Nを着目
文字パタンに付与する。
【0034】光電変換部10を解像度300dpiのス
キャナで構成しこれにより画像データを得た場合、着目
文字パタンの文字サイズが3mmであれば当該文字パタ
ンの大きさは35×35画素程度、また文字サイズが6
mmであれば文字パタンの大きさは70×70画素程度
となり、従ってこの場合に上述のように正規化定数Nを
付与するようにすれば、文字パタンの大きさを文字サイ
ズに関わりなく35×35〜70×70画素の大きさに
正規化することができ従って正規化後の文字パタンを格
納するパタンメモリ(図示を省略。)の容量を128×
128画素以内とすることができる。なお、正規化後の
パタンメモリは通常は認識部70に設けてある。
【0035】線幅計算部80はパタンレジスタ30の着
目文字パタンを走査し当該パタンの線幅を算出する。線
幅の算出を従来周知の任意好適な方法により行なってよ
いがこの実施例では、例えば、線幅計算部80を従来周
知のフィルタ回路と同様のシフトレジスタ構成とし、後
記の表1中の(1)式に示す近似式に従って線幅Wを算
出するようにする。ただし、(1)式においてQは2×
2の窓の全ての点が黒画素となった総個数であり、Aは
文字パタン中の黒画素総個数である。
【0036】線幅判定部90は線幅計算部80によって
算出された線幅が文字枠検出部40で求めた文字サイズ
(この実施例では文字枠幅及び高さの何れか大きい方で
ある。)に応じ予め規定された線幅の範囲外の場合は、
今認識処理を行なおうとしてパタンレジスタ30に格納
してある文字パタン(これを「着目文字パタン」と称す
る。)の認識結果を棄却とする旨の指示信号(以下、
「認識棄却信号」と称する。)を認識部70に出力す
る。具体的には、300dpiの解像度のスキャナで文
字媒体を走査する前提において、文字サイズが3mm以
上6mm未満である場合は線幅が1未満または8以上の
場合に認識棄却信号を出力し、文字サイズが6mm以上
9mm未満である場合は線幅が4未満または15以上の
場合に認識棄却信号を出力し、文字サイズが9mm以上
12mm未満である場合は線幅が9未満または20以上
の場合に認識棄却信号を出力する構成としてある。
【0037】認識部70は、線幅判定部90より認識棄
却信号を受信した場合は着目文字パタンについての認識
処理を終了する。文字認識装置は次の文字の認識処理動
作を開始する。
【0038】処理選択部120は、データ切り換え部1
10に対し、パタンレジスタ30内の着目文字パタンを
そのまま選択するか、着目文字パタンについて太め処理
または細め処理した文字パタンを選択するかの指示信号
を出力する。さらに、太め処理又は細め処理が必要な場
合は線幅変換部100にその旨の指示信号を出力する。
【0039】処理選択部120からのデータ変換部11
0及び又は線幅変換部100への上記指示信号は、この
実施例の場合、線幅計算部線80により算出された線幅
Wと、正規化定数決定部50により決定された正規化定
数Nとに基づいて決定する。具体的には、処理選択部1
20、これらW及びNに基づいて太め処理の実行回数M
CNT及び細め処理の実行回数NCNTを後述する方法
でそれぞれ計算する。そして、MCNT及びNCNTが
共に0(零)の場合はデータ切り換え部110にパタン
レジスタ30内の着目文字パタンを選択する旨の指示信
号を出し、その他の場合は線幅変更部100にMCNT
或いはNCNTの数に応じた太め処理又は細め処理を実
行する旨の指示を出し及びデータ選択部110に線幅変
換部100で太め処理又は細め処理された文字パタンを
選択する旨の指示信号を出す。
【0040】ここで、この実施例の場合太め処理の実行
回数MCNTは太め処理後の線幅(これは着目文字パタ
ンの線幅Wと正規化定数Nとを乗じることで求まる。)
が予め定めた所定幅C1 以上(C1 に等しいか近い方が
好ましい)となるように決定する。具体的にはこの所定
幅C1 と線幅Wと正規化定数Nとを用い後記表1の
(2)式により算出する。ただし、所定幅C1 は文字パ
タンを正規化部で正規化する際にストローク欠落を実質
的になくせる線幅として予め統計的に調べて決定した値
でありこの実施例では3としている。また、MCNTは
0以上の整数であって、(2)式に従って算出したMC
NTが負の値のときはMCNT=0とする。また、算出
したMCNTが整数でない場合には例えば小数点以下を
切り上げ、切り捨て或は四捨五入することにより、算出
したMCNTを整数化する。また、(2)式においてM
upは太め処理を1回実行することにより太められる線幅
(画素数換算)である。例えば、文字線の縁の1画素分
だけ外周の全白画素を黒画素に置き換える太め処理では
Mupは2となり、文字線の縁の1画素分だけ外周の上側
とか右側とかの各白画素を黒画素に置き換える太め処理
ではMupは1となる。
【0041】また、この実施例の場合細め処理の実行回
数NCNTは後記表1の(3)式により算出する。ただ
し、NCNTは0以上の整数であって、(3)式に従っ
て算出したNCNTが負の値のときはNCNT=0とす
る。また、算出したNCNTが整数でない場合には例え
ばMCNT同様に整数化する。なお、(3)式におい
て、C2 は予め定めた所定幅である。このC2 は、文字
パタンを正規化部で正規化する際に空白つぶれを実質的
になくせる線幅として予め統計的に調べて決定した値で
ありこの実施例では3としている。また、Mdnは細め処
理を1回実行することにより細められる線幅(画素数換
算)である。例えば、文字線の最も縁の全黒画素を白画
素に置き換える細め処理ではMdnは2となり、文字線の
最も縁の全画素の例えば上縁とか右縁とかの各黒画素を
白画素に置き換える細め処理ではMdnは1となる。
【0042】線幅選択部100の太め処理部100a
は、処理選択部120で算出された太め処理実行回数M
CNTが1以上の場合その数に応じた回数の太め処理を
実行する。この実施例の太め処理部100aは、周知の
フィルタ回路と同様にシフトレジスタ構成としてあり、
例えば3×3の窓を用いて文字線を太める処理を行な
う。図2、図3(A)及び(B)を参照して太め処理の
詳細を説明する。ここで、図2は3×3の窓を示す図で
ある。図3(A)は太め処理前の文字線を示す図であり
所定幅C以下の線幅Wを有する文字線(垂直ストロー
ク)とこの文字線の縁に隣接する白画素の全部とを示す
図である。図3(B)は太め処理によって得た文字線を
示す図である。図3(A)及び(B)において白丸は白
画素を、黒丸は黒画素を及び丸のなかに点を付した白丸
は白画素から黒画素に変更された画素を表す。
【0043】太め処理部100aは、3×3の窓(図2
参照)の着目画素a9 が白画素で周囲の画素a1 〜a8
のいずれかの画素が黒画素のとき着目画素a9 を黒画素
に変更し、所定幅C以下の文字線の縁に隣接する白画素
を全て黒画素とし、線幅を2増加させる(図3(A)及
び(B)参照)。
【0044】また、線幅選択部100の細め処理部10
0bは、処理選択部120で算出された細め処理実行回
数NCNTが1以上の場合その数に応じた回数の細め処
理を実行する。この実施例の細め処理部100bは、フ
ィルタ回路と同様にシフトレジスタ構成としてある。図
2、図4(A)及び(B)を参照して細め処理の詳細を
説明する。ここで、図4(A)は細め処理前の文字線を
示す図であり所定幅Cより太い線幅Wを有する文字線
(垂直ストローク)とこの文字線の縁に隣接する白画素
の全部とを示す図である。図4(B)は細め処理によっ
て得た文字線を示す図である。図4(A)及び(B)に
おいて白丸は白画素を、黒丸は黒画素を及び丸のなかに
Xを付した白丸は黒画素から白画素に変更された画素を
表す。
【0045】細め処理部100bは、3×3の窓(図2
参照)の着目画素a9 が黒画素でしかも周囲の画素a1
〜a8 を順次に走査したときに白画素の次に黒画素が現
れる回数H1 と黒画素の次に白画素が現れる回数H2
を計数しこれら計数値の和H1 +H2 がH1 +H2 =2
となるとき着目画素a9 を白画素に変更し、所定幅C以
上の文字線の縁に位置する黒画素を全て白画素とし、線
幅を2減少させる(図4(A)及び(B)参照)。
【0046】データ切換部110は処理選択部120か
ら入力される指示信号に応じ、パタンレジスタ30の着
目文字パタンそのもの、太め処理部100aにより作成
された太めパタン、または、細め処理部100bにより
作成された細めパタンのいずれかを入力し、入力したパ
タンを正規化部60へ出力する。
【0047】この実施例の正規化部60はデータ切換部
110から入力した着目文字パタン、太めパタン或は細
めパタンに対し従来と同様に間引き処理を行なってパタ
ンを正規化するものであり、N=1のときはデータ切換
部110から入力したパタンをそのまま認識部70へ出
力し、0<N<1のときはデータ切換部110から入力
したパタンをN倍に縮小したパタンを認識部70へ出力
する。以下、正規化部60が出力したパタンを正規化パ
タンと称する。
【0048】認識部70は、線幅判定部90より認識棄
却信号Sr が入力された場合を除いて、正規化パタンか
ら文字特徴を抽出し、文字特徴を図示しない辞書と照合
して文字認識を行ない、この認識結果(例えば文字名)
を出力端子70aより次段の装置へ出力する。
【0049】2.第2実施例 第1実施例の文字認識装置では、線幅判定部は認識棄却
信号を出力する構成であった。しかし、線幅判定部は他
の構成でも良い。
【0050】この第2実施例の文字認識装置では、図5
に示すように、これが具える線幅判定部以外の各構成成
分の構成を第1実施例と同様にし、線幅判定部90a
を、線幅計算部80によって算出された線幅が文字枠検
出部で検出された文字サイズに応じ予め規定された線幅
の範囲外の場合に警告信号を出力する構成としてある。
この警告信号SA は例えばブザーを鳴動させるための信
号等として使用できオペレータに誤読の危険性が高い文
字である旨を知らせることができる。
【0051】上述においてはこの発明の文字認識装置の
各実施例について説明したがこの発明は上述の実施例に
限られるものではなく例えば以下に説明するよう変更を
加えることができる。
【0052】例えば、実施例の文字認識装置では、処理
選択部120は、太め処理実行回数MCNT及び細め処
理実行回数NCNTの数値に応じて着目文字パタン、太
めパタン及び細めパタンのいずれを正規化用パタンとす
る構成であったが、着目文字パタンの線幅Wを予め与え
られた設定値と比較し、この比較結果に応じて上記3種
のパタンから正規化用パタンを選択するようにしてもよ
い。例えば、W<10であれば着目文字パタンに対し太
め処理を2回繰返して得た太めパタンを正規化に用いる
パタンとし、20≦Wであれば着目文字パタンに対し細
め処理を2回繰返して得た細めパタンを正規化に用いる
パタンとし、10≦W<20であれば着目文字パタンを
正規化に用いるパタンとすればよい。
【0053】また上述した実施例では、正規化定数Nの
各値に全て共通の値の第一の所定幅C1 、第二の所定幅
2 を用いるようにしたが、これら所定幅C1 、C2
値を正規化定数Nの値の大きさに応じて変化させるよう
にしてもよい。例えば正規化定数N=1のときにはC1
=C2 =3、N=1/2のときにはC1 =C2 =4、N
=1/3のときにはC1 =C2 =5、……とすればよ
い。もちろんこのようにする場合もC1 、C2の値はた
がいに同じでも異なっても良い。
【0054】また、線幅Wは(1)式で定義される以外
の線幅を用いてもよいし、パタンの正規化にも間引き以
外の従来周知の方法を用いることができる。
【0055】
【発明の効果】上述した説明からも明らかなように、こ
の発明の文字認識装置によれば、正規化することにより
水平ストロークが欠落したり、空白がつぶれる危険性が
高い文字の認識結果は棄却とされるので、誤読の発生が
なくなるか低減される。
【0056】また、警告信号を発する構成の場合は、正
規化することにより水平ストロークが欠落したり、空白
がつぶれる危険性の高い文字毎にオペレータに対し注意
を促すことが可能になる。
【0057】また、線幅変換部をさらに具える構成とし
た場合、線幅判定部で正常と判定された文字パタンを文
字認識に好適な線幅の文字パタンにさらに変換できるの
で、より誤読の発生を低減できる。
【0058】これがため、誤読の発見のためのオペレー
タによる認識結果のチェック処理が軽減でき、認識処理
全体の効率を向上させることができる。
【表1】
【0059】
【図面の簡単な説明】
【図1】この発明の第1実施例の文字認識装置の説明に
供するブロック図である。
【図2】実施例の説明に供する図であり、太め処理及び
細め処理で用いる3×3の窓の説明図である。
【図3】(A)及び(B)は太め処理前後の文字線の説
明図である。
【図4】(A)及び(B)は細め処理前後の文字線の説
明図である。
【図5】この発明の第2実施例の文字認識装置の説明に
供するブロック図である。
【図6】(A)及び(B)は文字の水平ストローク欠落
の説明図である。
【図7】(A)及び(B)は文字の空白のつぶれの説明
に供する図である。
【符号の説明】
L:文字媒体からの光信号 10:光電変換部 20:文字切出し部 30:パタンレジスタ 40:文字枠検出部 50:正規化定数決定部 60:正規化部 70:認識部 70a:出力端子 80:線幅計算部 90,90a:線幅判定部 100:線幅変換部 100a:太め処理部 100b:細め処理部 110:データ切り換え部 120:処理選択部 SA :警告信号

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 文字媒体の量子化された画像データから
    一文字単位に文字パタンを切出す文字切出し部と、各文
    字パタン毎に文字外接枠を検出し、該文字外接枠の位置
    から前記文字パタンの文字サイズを求める文字枠検出部
    と、該文字サイズに応じた正規化定数を設定する正規化
    定数決定部と、該正規化定数に基づいて前記文字パタン
    を正規化する正規化部と、正規化された文字パタンの認
    識を行なう認識部とを具える文字認識装置において、 前記文字パタンの線幅を算出する線幅計算部と、 該線幅計算部によって算出された線幅が前記文字サイズ
    に応じ予め規定された線幅の範囲外の場合に着目文字パ
    タンについての認識結果を棄却とする旨の指示信号を出
    力する線幅判定部とを具えたことを特徴とする文字認識
    装置。
  2. 【請求項2】 請求項1に記載の文字認識装置におい
    て、 前記線幅判定部は前記線幅計算部によって算出された線
    幅が前記文字サイズに応じ予め規定された線幅の範囲外
    の場合に警告信号を出力する構成であることを特徴とす
    る文字認識装置。
  3. 【請求項3】 請求項1または2に記載の文字認識装置
    において、 線幅が第一の所定幅以下である文字パタンの文字線を太
    くする太め処理、及び、線幅が第二の所定幅以上である
    文字パタンの文字線を細くする細め処理の双方または一
    方の処理を行なう線幅変換部をさらに具えることを特徴
    とする文字認識装置。
JP3219070A 1991-08-30 1991-08-30 文字認識装置 Expired - Lifetime JP2747136B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3219070A JP2747136B2 (ja) 1991-08-30 1991-08-30 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3219070A JP2747136B2 (ja) 1991-08-30 1991-08-30 文字認識装置

Publications (2)

Publication Number Publication Date
JPH0562017A true JPH0562017A (ja) 1993-03-12
JP2747136B2 JP2747136B2 (ja) 1998-05-06

Family

ID=16729799

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3219070A Expired - Lifetime JP2747136B2 (ja) 1991-08-30 1991-08-30 文字認識装置

Country Status (1)

Country Link
JP (1) JP2747136B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001216470A (ja) * 2000-01-31 2001-08-10 Keyence Corp パターンマッチング方法及び装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001216470A (ja) * 2000-01-31 2001-08-10 Keyence Corp パターンマッチング方法及び装置

Also Published As

Publication number Publication date
JP2747136B2 (ja) 1998-05-06

Similar Documents

Publication Publication Date Title
US6970601B1 (en) Form search apparatus and method
JPH04225485A (ja) バーコードを認識する方法
JPH03122773A (ja) 画像形成装置
JPH05282490A (ja) 語形形成方法
Yin Skew detection and block classification of printed documents
US5271067A (en) Optical character recognition apparatus
JPH07322057A (ja) 2進入力画像の解像度の増大方法及びその増大装置、ならびに2進入力画像の外観の改良方法
US6088478A (en) Method and apparatus for distinguishing bold face characters
US6983071B2 (en) Character segmentation device, character segmentation method used thereby, and program therefor
JP2747136B2 (ja) 文字認識装置
JPH03214281A (ja) 文字認識装置
CN117710985B (zh) 光学字符识别方法、装置及智能终端
JPH07239899A (ja) 光学的文字読取装置
JPH03276380A (ja) 文字認識装置
JP2902097B2 (ja) 情報処理装置及び文字認識装置
JPH05159062A (ja) 文書認識装置
JP2708604B2 (ja) 文字認識方法
KR20010083265A (ko) 다국어 인쇄체 문서인식을 위한 문자 특징 추출 장치 및그 방법
JPH05174179A (ja) 文書画像処理装置
JP3197464B2 (ja) 文字認識方法および文字認識装置
JPH10171924A (ja) 文字認識装置
JP2980636B2 (ja) 文字認識装置
JP2918363B2 (ja) 文字分類方法及び文字認識装置
JP3127413B2 (ja) 文字認識装置
JPH05189604A (ja) 光学的文字読取装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19980203