JPH07287740A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH07287740A
JPH07287740A JP6104598A JP10459894A JPH07287740A JP H07287740 A JPH07287740 A JP H07287740A JP 6104598 A JP6104598 A JP 6104598A JP 10459894 A JP10459894 A JP 10459894A JP H07287740 A JPH07287740 A JP H07287740A
Authority
JP
Japan
Prior art keywords
intersection
pixel
intersections
character
pixels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6104598A
Other languages
English (en)
Inventor
Yukio Kumazawa
幸夫 熊澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP6104598A priority Critical patent/JPH07287740A/ja
Publication of JPH07287740A publication Critical patent/JPH07287740A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 文字認識装置における大分類処理の距離計算
時間を短縮し、入力文字画像がノイズ等を含んでいる場
合も正確に認識できることを目的とする。 【構成】 1次分類装置2に入力された文字画像は、文
字画像格納メモリ4に一旦格納される。文字画像格納メ
モリ4に格納されたデータは、細線化回路5にて細線化
処理が行なわれる。細線化された文字画像は、細線化回
路5から交点検出回路6へ出力される。交点検出回路6
は、入力画像の画素ごとに交点か否かの判定を行う。交
点であると判定したならば、交点検出回路6内のカウン
タをカウントアップすることによって交点数を計数す
る。候補選択回路7は、交点検出回路6から入力した交
点数をもとに、特徴量辞書8から該当する交点をもつ複
数の文字コードを認識結果として2次分類装置へ出力す
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、入力文字画像の特徴か
ら複数の文字コード群を1次分類候補として出力する大
分類を用いる文字認識装置に関する。
【0002】
【従来の技術】従来公知の文字認識装置としては、入力
文字画像と辞書登録された文字画像との特徴量の距離計
算により距離の小さな幾つかの文字候補を選択して大分
類するものがある。特に、特開昭59−100990号
には走査線と方向コードとの交差回数と、その交差位置
からなるストローク交差特徴を用いるパターン認識装置
が記載されている。特開昭63−126082号、特開
昭63−131287号には、黒から白又は白から黒へ
変化する境界部の画素の個数を用いる文字認識方式が記
載されている。特開平1−233678号には、特徴量
の特徴成分毎のばらつきを基に特徴量の中から認識候補
文字相互の違いを示すのに適した特徴成分を用いる文字
認識装置が記載されている。特開平4−88592号に
は、黒画素及びストロークの分布の特性量の累積値を用
いた文字認識方式が記載されている。
【0003】
【発明が解決しようとする課題】しかしながら、従来に
おいては、入力文字画像の特徴量と辞書登録された文字
画像との特徴量の距離計算により距離の小さな幾つかの
文字候補を大分類し選択して出力していたので、大分類
での計算量が多く処理時間を要するという欠点があっ
た。そこで、この発明は、大分類での距離計算時間を短
縮し、大分類を高速化することを課題とする。一般的
に、高速化を行うと、認識率が低くなるという傾向があ
る。そこで、本発明では、高速化してもノイズを含んだ
文字画像等に対して正確な文字認識を行えるようにする
ことをもさらに課題とする。
【0004】
【課題を解決するための手段】第1の発明である文字認
識装置は、入力された文字画像を細線化する細線化手段
と、前記細線化手段により細線化された文字画像の交点
を計数する交点計数手段と、交点数毎に候補となる複数
の文字コード候補を登録した分類辞書と、前記交点計数
手段により計数された交点数に基づいて前記分類辞書に
登録された複数の文字コード候補を選択する候補選択手
段とを備える。第2の発明である文字認識装置は、第1
の発明である文字認識装置の前記交点計数手段が、対象
とする画素とは第1の距離にある周辺画素を走査し黒画
素から白画素又は白画素から黒画素への反転を計数し、
その反転回数が一定の閾値以上である場合は、前記第1
の距離より大である第2の距離にある周辺画素を走査し
黒画素から白画素又は白画素から黒画素への反転を計数
し、その反転回数に基づいて交点であるか否かを判定
し、交点を計数する。第3の発明である文字認識装置
は、第1の発明である文字認識装置の前記交点計数手段
が、対象とする画素の座標とそれまでに交点と判定した
画素の座標との距離に基づいて前記対象とする画素が交
点であるか否かを判定し、交点を計数する。
【0005】
【作用】入力文字画像を、細線化手段により細線化し交
点を求めやすくする。そして、その細線化された画像を
用いて交点計数手段により入力文字画像の交点数を求め
る。候補選択手段がこの交点数を受け取り、特徴量辞書
より複数の候補文字コードを選択し2次分類手段へ出力
する。2次分類手段では、複数の候補文字コードの中か
ら最終的な文字認識を行う。このとき、候補選択手段で
は距離計算を行う必要がないので、処理スピードを向上
させることができるものである。
【0006】
【実施例】
(第1実施例)図1は、本発明の第1実施例である文字
認識装置の全体構成図である。認識が行われる文字画像
は、実際の紙文書をスキャナで読み込むことにより、前
処理装置1に入力される。スキャナで読み込むことの他
に、ハードディスク等の記憶媒体にファイルとして既に
記憶されている文字画像ファイルを読み込むことによ
り、又はネットワーク等による通信等で前処理装置1に
入力することも可能である。
【0007】まず入力された文字画像は、前処理装置1
において、ノイズ除去やスムーシング等の一般的に文字
認識における入力画像に対する補正処理が行われる。こ
の前処理された文字画像は、前処理装置1から1次分類
装置2および2次分類装置3へ入力し、それぞれの分類
装置において固有の特徴量が求められ、それぞれの処理
がされる。
【0008】図2は1次分類装置2の内部構成図を示
す。この1次分類装置2に入力された文字画像は、文字
画像格納メモリ4に一旦格納される。文字画像格納メモ
リ4に格納されたデータは、細線化回路5にて細線化処
理が行なわれる。この細線化手法としては、大沢裕ほ
か”図面の認識と理解”,昭晃堂,p.45に詳しい。
細線化された文字画像は、細線化回路5から交点検出回
路6へ出力される。交点検出回路6は、入力画像データ
を画素ごとに交点か否かの判定を行う。その順序は1ラ
イン内は主走査順、ライン単位は副走査順である。そし
て、交点であると判定したならば交点検出回路6内の図
示していないカウンタをカウントアップすることによっ
て交点数を数える。交点か否かの判定は、第1実施例で
は、3×3のマスクパターンを用いている。つまり、交
点となり得る3×3のマスクパターンを全て予め用意し
ておき、パターンマッチングにて交点か否かの判定を行
っているのである。
【0009】例えば図3(a)に示すような”A”とい
う文字画像が1次分類装置2の文字画像格納メモリ4へ
入力された場合、細線化回路5にて図3(b)のように
細線化される。その後、図3(b)の画像データを交点
検出回路6へ入力し、図3(c)に示すように画像”
A”の交点が検出される。図3(c)では、黒く塗りつ
ぶされた位置(座標)が交点を示している。検出された
交点は、交点検出回路6内でカウントされ、その値は交
点情報として候補選択回路7へ出力される。図3(a)
の文字画像”A”の場合、交点情報として”2”を候補
選択回路7へ出力される。候補選択回路7は、交点検出
回路6から入力した交点数をもとに、特徴量辞書8から
該当する交点をもつ文字コードを認識結果として2次分
類装置3へ出力する。
【0010】図4は、特徴量辞書8に格納されているデ
ータの様子を示したものである。特徴量辞書8は、交点
数ごとに登録語である文字コード情報を格納している。
図4にもあるように、例えば交点数”0”に対しては、
登録語として、”一”、”二”等があること、交点数”
1”に対しては、登録語として、”十”、”B”等があ
ること、交点数”2”に対しては、登録語として、”
五”、”A”等があることを示している。
【0011】2次分類装置3は、前処理装置1から入力
した文字画像からある特徴量(たとえばメッシュ特徴
量、電子通信学会技術研究報告Vol.78, No.
49,PRL79−13, 「マルチフォント印刷漢字
の分類」, 1978年6月19日発行)を求め、1次
分類装置2の候補選択回路7から入力した複数の候補文
字コードの2次分類装置3内にある特徴量辞書の特徴量
との距離計算を行う。そして、最も距離値の小さかった
特徴量の文字コード1個を、認識結果として出力する。
または、距離値の小さかった上位n個の文字コードを、
認識結果として出力することもできる。なお、nは自然
数である。
【0012】(第2実施例)本発明における第2実施例
を説明する。全体構成は実施例1にて説明した図1と同
じ構成である。図5、図6、図7をもとに本発明を説明
する。1次分類装置2内で、第1実施例にて説明した図
2と同一のものは、同じ符号を付している。特徴量辞書
58の内容が図2の特徴量辞書8と異なる。
【0013】例えば、オリジナル画像に対するノイズ、
かすれ、又は文字の書体等による入力画像の変動等によ
り図6(a)に示す”A”という文字画像が1次分類装
置2へ入力されたとき、細線化回路5にて図6(b)の
ように細線化される。その後、図6(b)の画像データ
は交点検出回路6へ入力され、図6(c)に示すように
画像”A”の交点が検出される。図6(c)では、黒く
塗りつぶされた位置(座標)が交点を示している。検出
された交点は、交点検出回路6内で図示しないカウンタ
でカウントされ、その値は、交点情報として候補選択回
路7へ出力される。図6(a)の文字画像”A”の場合
は、交点情報として”1”を候補選択回路7へ出力され
る。候補選択回路7は、交点検出回路6から入力した交
点情報である交点数をもとに、画像の変動に備えて登録
語である文字コードを複数の交点数に登録した特徴量辞
書58から該当する交点を持ついくつかの文字コードを
認識結果として2次分類装置3へ出力する。
【0014】図7は、特徴量辞書58に格納されている
辞書の様子を示したものである。特徴量辞書58は、交
点数ごとの文字コード情報を格納している。特徴量辞書
58が特徴量辞書8と異なる点は、同じ登録語を異なる
交点数として複数登録されていることである。これは、
交点数が変動することを予め統計的手法により求めてお
き、複数の交点数に登録することによって特徴量辞書5
8を作成しておく。または、経験的に求めた交点数の変
動を考慮して特徴量辞書58を作成しておくことも可能
である。例えば、“A“という文字は書き順からも交点
数は1又は2となる可能性が高い。これによって、文字
コード“A“は交点数0と交点数1に登録されるのであ
る。
【0015】2次分類装置3は、前処理装置1から入力
した文字画像からある特徴量(たとえばメッシュ特徴
量)を求め、1次分類装置2の候補選択回路7から入力
した複数の候補文字コードの2次分類装置3内にある特
徴量辞書の特徴量との距離計算を行う。そして最も距離
値の小さかった(または上位n個の)特徴量の文字コー
ドを、認識結果として出力する。
【0016】(第3実施例)第3の実施例を説明する。
全体の動作は、第1実施例又は第2実施例と同様であ
る。相違する箇所は交点検出回路6であり、以下、その
動作を図8〜図11をもとに説明する。
【0017】第1実施例及び第2実施例では、注目画素
が交点であるか否か判定するとき、パターンマッチング
にて行うようにしている。このようにすると、マスクの
大きさが5×5画素のときに非常に多くのパターンと比
較する必要がある。つまり、5×5画素内であらゆる交
点のパターンをマスクとして用意し、そのマスクと文字
画像との比較が必要になるからである。また、マスクの
大きさが3×3画素では、交点と判定できないパターン
がある。つまり、3×3画素ほどの大きさのマスクで
は、判定できる視点が狭いため、交点となるべき点を交
点でないと判定したり、その逆があるからである。
【0018】図8は、細線化回路5、交点検出回路6及
び候補選択回路7がそれぞれバスにつながれた構成と、
交点検出回路6内の構成を示す。細線化された画像デー
タは、細線化回路5から交点検出回路6内のメモリ77
に格納される。CPU76は、各画素データを順に交点
であるか否かを判定する。もしある画素が交点であるの
なら、その画素からは3方以上に線(画素)が伸びてい
るはずである。交点は、2つの線の交わりによって生じ
るからである。CPU76は3方以上に線(画素)が伸
びているかを調べるため、次の動作を行う。この動作を
示すフローチャートを図11に示す。
【0019】ステップS1にて、CPU76は、CPU
76内の図示しないレジスタ1を”0”に設定する。こ
のレジスタ1は、交点数をカウントするためのものであ
る。
【0020】ステップS2にて、交点であるか判定する
必要のある画素の周辺5×5画素のデータをCPU76
内の図示しないレジスタ2に格納する。5×5画素の各
画素に図9(b)のように符号を付けたとき、CPU7
6のレジスタ2内の様子を図10に示す。つまり、5×
5画素の周辺画素の左上から順に右方向へ走査し、そし
て1行終了したならば次の行を同様に走査した画素の値
が、CPU76内の図示しないレジスタ2に最下位ビッ
トから順に格納されるのである。d13が対象とする画
素となる。もちろん、この順番は逆であってもよく、そ
の開始画素は5×5画素(d1〜d25)であればどれ
でもよい。
【0021】ステップS3にて、CPU76内の図示し
ないカウンタの値を”0”に設定する。このカウンタ
は、ステップS5にて、対象とする画素の周辺3×3画
素の”0”から”1”(または”1”から”0”のどち
らか)へ変化した回数をカウントするものである。
【0022】ステップS4にて、CPU76は対象とす
る画素(図9(a)では、d13の画素)の周辺3×3
画素の値を順に走査するため、その走査の開始点を定め
る。例えば、左上の画素であるd7とする。もちろん、
対象とする画素の周辺3×3画素であれば、どの画素で
あってもよい。ステップS5にて、CPU76内のレジ
スタ2内のビットを、d7→d8→d9→d14→d1
9→d18→d17→d12→d7の順で調べる。この
ときアクセスした画素が”0”から”1”(または”
1”から”0”のどちらか)に変わったならば、CPU
76内のカウンタを+1増加する。つまり、白画素から
黒画素(または黒画素から白画素)に変化することは線
を横切ったとみなして、その線をカウントすることにな
る。
【0023】ステップS6では、各画素を調べ終わった
とき、カウンタの値が3以上であるか否かを判断する。
そして、カウンタの値が3以上であるならば、ステップ
S7以降の第2段階の調査を行う。カウンタの値が2以
下のとき、その画素は交点でなかったと判定し、ステッ
プS12へ進み、次の画素が交点であるか否かの判定を
繰り返す。
【0024】カウンタの値が3以上のとき、CPU76
は第2段階として、ステップS7にてカウンタを0に再
設定する。このカウンタは、この第2段階の調査では、
ステップS9にて、対象とする画素の周辺5×5画素
の”0”から”1”(または”1”から”0”のどちら
か)へ変化した回数をカウントするものである。ステッ
プS8にて、対象となっている画素の図9(b)に示す
ように、周辺5×5画素の左上の画素であるd1を開始
点とする。もちろん、開始点の位置は5×5画素の周辺
画素であればどこでもよい。
【0025】次に,ステップS9にて、周辺5×5画素
の隣り合う画素を順にアクセスする(d1→d2→d3
→d4→d5→d10→d15→d20→d25→d2
4→d23→d22→d21→d16→d11→d6→
d1)。CPU76はステップS5と同様に画素がどち
らかに反転する数をカウントする。ステップS10に
て、ステップS6と同様にカウンタの値が3以上である
か否かを判断する。
【0026】そして、ステップS11にて、ステップS
10の判断がYesであれば、レジスタ1の値を+1増
加する。つまり、ステップS9の第2段階でのカウンタ
の値が3以上であれば、対象画素は交点であったとして
レジスタ1の値を+1増加するのである。また、ステッ
プS10の判断がNoであれば、カウンタの値が2以下
であれば、対象画素は交点でなかったとし、ステップS
12へ進み、次の画素が交点であるか否かの判定を繰り
返す。
【0027】ステップS11の処理後、ステップS6の
判断がNoの場合又はステップS10の判断がNoの場
合、ステップS12へ進み、次の画素の判定を開始す
る。以上の処理をすべての画素について行い(または文
字画像の最も外側の画素は省略してもよい)、トータル
の交点数、つまり、レジスタ1の値を候補選択回路7へ
送る。
【0028】(第4実施例)第4実施例を説明する。原
画像では2直線のみが交わっているにもかかわらず、画
像にノイズが混入した場合及び細線化処理の影響で、図
14の様に2つの交点が出現することがある。つまり、
実際の交点は1個であるが、第3実施例では2個の交点
があると判断してしまう問題がある。この場合、2個の
交点はその交点間の距離が近いことが特徴である。そこ
で、この特徴を利用して第4実施例では本問題を解決す
るものである。つまり、交点の可能性のあるものの周辺
に既に交点と判断されたものがあるか否かを調べ、あれ
ばその点は交点ではないとし、なければその点は交点で
あると判断するのである。ここで、周辺とは対象画素を
中心とした2画素以内であって既に判断された画素を示
す。もちろん、周辺2画素ではなく、それ以上であって
もよい。ただし、この周辺の距離を大きくしてしまう
と、近くにある交点を1つとしてしまうことがありえ
る。そこで、12画素/mmの解像度程度では、周辺2
画素が最もよい。この周辺2画素の場合のフローチャー
トを図12、図13に示す。
【0029】ここで、バッファ0、バッファ1、バッフ
ァ2とは、対象となる文字画像の1行(水平方向)分の
交点情報を記憶できるラインバッファである。バッファ
0は、対象画素がある行の交点情報を記憶し、バッファ
1は、対象画素がある行の1行前の交点情報を記憶し、
バッファ2は、対象画素がある行の2行前の交点情報を
記憶するようになっている。
【0030】ステップS21では、先ず初期設定とし
て、行方向で1行前/2行前の交点情報を格納するバッ
ファ1とバッファ2に、データが格納されていないこと
を示すためのNULLコードを入れる。また、直前に発
見された交点座標のx座標を記憶するx1座標レジスタ
に初期値“1“を設定し、同様に直前に発見された交点
座標のy座標を記憶するy1座標レジスタに初期値“1
“を設定する。対象となる画素のy座標を記憶するy0
座標レジスタに初期値“1“を設定する。
【0031】ステップS22では、行方向の初期設定を
行う。つまり、交点かを判断した結果を格納するバッフ
ァ0内の全てにNULLコードを入れ、対象画素である
x座標の値を格納するx0座標レジスタに“1“を設定
する。ステップS23では、x0座標レジスタ、y0座
標レジスタにより示される対象画素の画素データを入力
する。
【0032】ステップS24では、実施例3の文字認識
装置の手法、つまり図11のステップS2からステップ
S11までの処理により、交点の可能性があるか否か判
断する。そして、ここで、実施例3の文字認識装置の手
法と相違する点は、交点の可能性があると判断した場合
はバッファ0内の現在のx0座標レジスタの値が示す箇
所に交点であることを示す“1“を記入することであ
る。これは、実施例3では交点として判断するが、細線
化処理の影響で実際は交点でないものも検出してしまう
ことを排除するための準備的な処理である。そして、交
点の可能性があると判断されたならステップS25の処
理を行い、交点でないならステップS210の処理を行
う。
【0033】ステップS25では、対象画素が交点の可
能性のあるとき、現在の対象画素の垂直方向であるy座
標の値を保持するy0座標レジスタの値から直前に検出
した交点の垂直方向であるy座標の値を保持するy1座
標レジスタの値の差を求め、2行前までに交点があった
か否かを判断する((y0−y1)≦2)。その結果の
値が2より大きければ(つまり、ステップS25の判断
結果がNoの場合)、対象画素の周辺に交点はないと判
断し、ステップS215へ進む。つまり、この場合は、
ステップS24で交点の可能性のある画素は真の交点で
あると判断されたのである。一方、その結果の値が2以
下であれば(つまり、ステップS25の判断結果がYe
sの場合)、対象画素の周辺に交点がある可能性がある
のでステップS26の処理を行う。
【0034】ステップS215では、現在の対象画素の
x座標であるx0座標レジスタの値をx1座標レジスタ
に転記し、そして対象画素のy座標であるy0座標レジ
スタの値をy1座標レジスタに転記する。つまり、現在
の対象画素は交点であると判断したので、次の対象画素
を判定する場合には、現在の対象画素が直前の交点とな
る。そして、ステップS210の処理へ進む。
【0035】ステップS26では、現在の対象画素の水
平方向であるx座標の値を保持するx0座標レジスタの
値から直前に検出した交点の水平方向であるx座標の値
を保持するx1座標レジスタの値の差を求め、2画素前
までに交点があったか否かを判断する((x0−x1)
≦2)。その結果の値が2より大きければ(つまり、ス
テップS26の判断結果がNoの場合)、ステップS2
7の処理を行う。その結果の値が2以下であるときは
(つまり、ステップS26の判断結果がYesの場
合)、対象画素の周辺2画素以内に交点が他にもあるの
で、x0,y0座標で示される対象画素は交点ではない
と判断し、ステップS29の処理を行う。
【0036】ステップS27では、1行前の水平方向の
交点情報を保持しているバッファ1内を調べ、対象座標
の水平方向の前後2画素に交点があるか否かを判断す
る。つまり、バッファ1内の対象座標のx座標に対応す
る前後2画素(つまり5画素)に1があるか否かを調べ
る。1が無かった場合(つまり、ステップS27の判断
結果がNoの場合)は、1行前の行には交点が無かった
と判断してステップS28の処理を行う。1があった場
合(つまり、ステップS27の判断結果がYesの場
合)は、1行前の行の2画素以内に交点が他にもあるの
で、x0,y0座標の画素データは交点ではないと判断
し、ステップS29の処理を行う。
【0037】ステップS28では、2行前の水平方向の
交点情報を保持しているバッファ2内を調べ、対象座標
の水平方向の前後2画素に交点があるか否かを判断す
る。つまり、バッファ2内の対象座標のx座標に対応す
る前後2画素(つまり5画素)に1があるか否かを調べ
る。1が無かった場合(つまり、ステップS28の判断
結果がNoの場合)は、2行前の行には交点が無かった
と判断(つまり、対象画素の周辺には交点は無く、対象
画素が交点である)しステップS215の処理へ進む。
バッファ2内に1があった場合(つまり、ステップS2
8の判断結果がYesの場合)は、2行前の行の2画素
以内に交点が他にもあるので、x0,y0座標の画素デ
ータは交点ではないと判断し、ステップS29の処理を
行う。
【0038】ステップS215では、前記したステップ
S25でNoの場合と同様にする。現在の対象画素のx
座標であるx0座標レジスタの値をx1座標レジスタに
転記し、そして対象画素のy座標であるy0座標レジス
タの値をy1座標レジスタに転記する。つまり、現在の
対象画素は交点であると判断したので、次の対象画素を
判定する場合には、現在の対象画素が直前の交点とな
る。そして、ステップS210の処理へ進む。
【0039】ステップS29では、現在の対象画素であ
るx0,y0座標で示される画素は交点でないと判断
し、バッファ0内の現在のx0座標レジスタの値が示す
箇所に交点ではないことを示すNULLデータを入れ
る。このように設定し直すのは、ステップS24にて交
点である可能性があると判断され該当箇所に“1“が設
定されていたからである。ステップS210では、次の
画素を判定するため、x0座標レジスタの値を更新、1
カウントアップする。
【0040】ステップS211では、x0座標レジスタ
の値が画像の水平方向の長さより大きくなったか否かを
判断する。すなわち、水平方向の処理が終了したかを判
断することになる。もし終了していなければステップS
23の処理へ戻り、終了していればステップS212の
処理を行う。ステップS212では、次の行に移るた
め、y0座標レジスタの値を更新、つまり1カウントア
ップする。ステップS213では、y0座標の値が画像
の垂直方向の長さより大きくなったかを否かを判断す
る。すなわち、全部の処理が終了したかを判断すること
になる。もし終了していなければステップS214の処
理を行い、終了していれば処理を終える。ステップS2
14では、バッファ2にバッファ1を、バッファ1にバ
ッファ0のデータを転記し、次の行の判定の準備を行
う。そして、ステップS22の処理へ戻る。
【0041】第4実施例によって、画像のノイズ又は細
線化処理の影響により本来1個の交点が2個の交点とな
ってしまうことを防止し、文字認識率の向上が図られて
いる。
【0042】
【発明の効果】以上述べたように、この発明によれば、
入力した文字画像の特徴である交点数を求めれば、辞書
に登録された複数の文字と距離計算を行わないで複数の
候補を選択でき、全ての文字候補との距離計算を行わな
くてもよいので、候補を高速に抽出できるという効果を
奏する。また、かすれが発生する等の認識しようとする
文字画像の画質が良くない場合、又は前処理装置により
画像処理しても正しい文字の形状を抽出できない等の状
況に対処し正しい候補を抽出できる。
【図面の簡単な説明】
【図1】本発明の一実施例である文字認識装置の全体構
成図である。
【図2】第1実施例の1次分類装置の構成図である。
【図3】第1実施例における認識動作を説明する図であ
る。
【図4】第1実施例の特徴量辞書を説明する図である。
【図5】第2実施例の1次分類装置の構成図である。
【図6】第2実施例における認識動作を説明する図であ
る。
【図7】第2実施例の特徴量辞書を説明する図である。
【図8】第3実施例の交点検出回路の構成図である。
【図9】第3実施例の交点検出画素を説明する図であ
る。
【図10】第3実施例のレジスタ内の画素配列を説明す
る図である。
【図11】第3実施例の交点数を求める処理のフローチ
ャートである。
【図12】第4実施例の交点数を求める処理の第1フロ
ーチャートである。
【図13】第4実施例の交点数を求める処理の第2フロ
ーチャートである。
【図14】交点が2個となってしまう場合を説明する図
である。
【符号の説明】
1 前処理装置、2 1次分類装置、3 2次分類装
置、4 文字画像格納メモリ、5 細線化回路、6 交
点検出回路、7 候補選択回路、8 特徴量辞書、58
特徴量辞書、76 CPU、77 メモリ。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 入力された文字画像を細線化する細線化
    手段と、前記細線化手段により細線化された文字画像の
    交点を計数する交点計数手段と、交点数毎に候補となる
    複数の文字コード候補を登録した分類辞書と、前記交点
    計数手段により計数された交点数に基づいて前記分類辞
    書に登録された複数の文字コード候補を選択する候補選
    択手段とを具備することを特徴とした文字認識装置。
  2. 【請求項2】 前記交点計数手段は、対象とする画素と
    は第1の距離にある周辺画素を走査し黒画素から白画素
    又は白画素から黒画素への反転を計数し、その反転回数
    が一定の閾値以上である場合は、前記第1の距離より大
    である第2の距離にある周辺画素を走査し黒画素から白
    画素又は白画素から黒画素への反転を計数し、その反転
    回数に基づいて交点であるか否かを判定し、交点を計数
    することを特徴とする特許請求の範囲第1項記載の文字
    認識装置。
  3. 【請求項3】 前記交点計数手段は、対象とする画素の
    座標とそれまでに交点と判定した画素の座標との距離に
    基づいて前記対象とする画素が交点であるか否かを判定
    し、交点を計数することを特徴とする特許請求の範囲第
    1項記載の文字認識装置。
JP6104598A 1994-04-19 1994-04-19 文字認識装置 Pending JPH07287740A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6104598A JPH07287740A (ja) 1994-04-19 1994-04-19 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6104598A JPH07287740A (ja) 1994-04-19 1994-04-19 文字認識装置

Publications (1)

Publication Number Publication Date
JPH07287740A true JPH07287740A (ja) 1995-10-31

Family

ID=14384869

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6104598A Pending JPH07287740A (ja) 1994-04-19 1994-04-19 文字認識装置

Country Status (1)

Country Link
JP (1) JPH07287740A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002334301A (ja) * 2001-05-11 2002-11-22 Nippon Digital Kenkyusho:Kk 2値イメージの特徴点抽出方法及び特徴点抽出プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002334301A (ja) * 2001-05-11 2002-11-22 Nippon Digital Kenkyusho:Kk 2値イメージの特徴点抽出方法及び特徴点抽出プログラム

Similar Documents

Publication Publication Date Title
JP3308032B2 (ja) スキュー補正方法およびスキュー角検出方法およびスキュー補正装置およびスキュー角検出装置
JP3259993B2 (ja) 語形測定方法及び画像信号処理方法
JPH05242292A (ja) 分離方法
JPH0772905B2 (ja) 記号列の認識方法
EP0381773B1 (en) Character recognition apparatus
JP2001283152A (ja) 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
EP0674794B1 (en) Method for classification of images using distribution maps
US5625710A (en) Character recognition apparatus using modification of a characteristic quantity
JPH11312220A (ja) 正規化されたグレ―スケ―ル画像の分類駆動型閾値処理
US5937093A (en) Pattern recognition methods and apparatus to reduce processing time by groupnise comparison of features and coordinated dynamic elimination of candidates
JPH07287740A (ja) 文字認識装置
EP0923045B1 (en) Image recognition through localized interpretation
CN109409370B (zh) 一种远程桌面字符识别方法和装置
CN114627457A (zh) 一种票面信息识别方法及装置
JP2832928B2 (ja) 文字認識方法
US11710331B2 (en) Systems and methods for separating ligature characters in digitized document images
JP2938276B2 (ja) 文字認識装置
KR100332752B1 (ko) 문자인식방법
JP3710164B2 (ja) 画像処理装置及び方法
KR940011699B1 (ko) 2진 영상의 윤곽선 추출방법
JP3277977B2 (ja) 文字認識方法
JP2827288B2 (ja) 文字認識装置
JPH03126188A (ja) 文字認識装置
JPH08147314A (ja) 認識型文書ファイリング装置及びその制御方法
JP2882056B2 (ja) 特定パターンの識別方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040519

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060131

A131 Notification of reasons for refusal

Effective date: 20060207

Free format text: JAPANESE INTERMEDIATE CODE: A131

A521 Written amendment

Effective date: 20060404

Free format text: JAPANESE INTERMEDIATE CODE: A523

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060919

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061002

R150 Certificate of patent (=grant) or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101020

Year of fee payment: 4

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101020

Year of fee payment: 4

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 5

Free format text: PAYMENT UNTIL: 20111020

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121020

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees