JPH0877293A - 文字認識装置および文字認識用辞書作成方法 - Google Patents

文字認識装置および文字認識用辞書作成方法

Info

Publication number
JPH0877293A
JPH0877293A JP6211132A JP21113294A JPH0877293A JP H0877293 A JPH0877293 A JP H0877293A JP 6211132 A JP6211132 A JP 6211132A JP 21113294 A JP21113294 A JP 21113294A JP H0877293 A JPH0877293 A JP H0877293A
Authority
JP
Japan
Prior art keywords
character pattern
character
dictionary
created
extracting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6211132A
Other languages
English (en)
Inventor
Toru Honma
亨 本間
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP6211132A priority Critical patent/JPH0877293A/ja
Publication of JPH0877293A publication Critical patent/JPH0877293A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】辞書を小規模化することができるとともに、辞
書参照の処理時間の短縮化が図れ、高能率で、認識精度
の向上が図れる文字認識装置を提供する。 【構成】構造解析的手法を用いた文字認識を行なう文字
認識装置であって、入力されるサンプル文字パターンを
2値化し、この2値化された文字パターンを平滑化し、
この平滑化された文字パターンに対して輪郭追跡を行な
うことにより方向コード列を作成し、この作成された方
向コード列の輪郭の外接矩形を求めることにより、その
外接矩形の包含関係から文字パターンのホールを抽出す
るとともに、上記作成された方向コード列の差分を求
め、この求めた差分があらかじめ設定される閾値以上の
値をとる範囲の最大値をとる点を文字パターンの凸点と
して抽出し、この抽出されたホール数および凸点数を辞
書に登録されているサンプル文字パターンのホール数お
よび凸点数と照合することにより文字認識を行なう。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、たとえば、郵便物宛名
自動読取区分機などの郵便物処理装置において、郵便物
上の宛名情報を光学的に読取る光学的文字読取装置に用
いられ、構造解析的手法を用いた文字認識を行なう文字
認識装置に関する。また、本発明は、上記文字認識装置
に用いられる文字認識用辞書作成方法に関する。
【0002】
【従来の技術】文字を自動的に認識する光学的文字読取
装置においては、印刷活字から手書き文字、英数字から
漢字に至るまで認識技術が発達しており、たとえば、郵
便物宛名自動読取区分機などの郵便物処理装置、ドキュ
メントリーダ、帳票読取装置などの応用製品が数多く普
及している。
【0003】このような光学的文字読取装置における文
字認識の手法には、大きく分けて、パターンマッチング
的な手法と構造解析的な手法とがある。パターンマッチ
ング的手法は、印刷活字のように、変形の少ない文字の
認識に優れ、それを手書き文字の認識へと応用してき
た。しかし、類似文字の識別が困難なこと、手書きなど
変形の大きい文字を正しく識別することが困難なことか
ら、構造解析的手法が注目されている。また、パターン
マッチング的手法と構造解析的手法とを組合わせること
により、お互いの相補的な特徴を生かした高精度な認識
も最近試みられている。
【0004】
【発明が解決しようとする課題】上記のような構造解析
的手法による文字認識においては、文字パターンの変形
の多様性を全て辞書に記述しなければならない。たとえ
ば、ある文字のループ部(穴部)の辞書を作成しようと
した場合、ループである場合、ループが途中で切れてい
る場合、ループを形成する片方のストロークが突出して
いる場合、両方のストロークが突出している場合など、
それらを全て辞書に登録する必要がある。そのため、辞
書が大規模になり、認識時においてマッチングに時間が
かかり、処理時間が大きくなるという問題がある。
【0005】また、辞書の作成は、作成者が1つ1つの
変形ルールを記述する必要があるため、大変な手間がか
かり、しかも、異なる文字種で同様なルールを記述して
しまい、認識精度が低下する可能性もある。
【0006】そこで、本発明は、辞書を小規模化するこ
とができるとともに、辞書参照の処理時間の短縮化が図
れ、高能率で、認識精度の向上が図れる文字認識装置お
よび文字認識用辞書作成方法を提供することを目的とす
る。
【0007】
【課題を解決するための手段】本発明の文字認識装置
は、構造解析的手法を用いた文字認識を行なう文字認識
装置であって、入力される認識対象文字パターンを2値
化する2値化手段と、この2値化手段で2値化された文
字パターンを平滑化する平滑化手段と、この平滑化手段
で平滑化された文字パターンに対して輪郭追跡を行なう
ことにより方向コード列を作成する方向コード作成手段
と、この方向コード作成手段で作成された方向コード列
の輪郭の外接矩形を求めることにより、その外接矩形の
包含関係から文字パターンの穴部を抽出する穴部抽出手
段と、前記方向コード作成手段で作成された方向コード
列の差分を求め、この求めた差分があらかじめ設定され
る閾値以上の値をとる範囲の最大値をとる点を文字パタ
ーンの端点として抽出する端点抽出手段と、前記穴部抽
出手段で抽出された穴部数および前記端点抽出手段で抽
出された端点数を辞書に登録されているサンプル文字パ
ターンの穴部数および端点数と照合することにより文字
認識を行なう認識手段とを具備している。
【0008】また、本発明の文字認識装置は、構造解析
的手法を用いた文字認識を行なう文字認識装置であっ
て、入力される認識対象文字パターンを2値化する2値
化手段と、この2値化手段で2値化された文字パターン
を平滑化する平滑化手段と、この平滑化手段で平滑化さ
れた文字パターンに対して輪郭追跡を行なうことにより
方向コード列を作成する方向コード作成手段と、この方
向コード作成手段で作成された方向コード列の輪郭の外
接矩形を求めることにより、その外接矩形の包含関係か
ら文字パターンの穴部を抽出する穴部抽出手段と、前記
方向コード作成手段で作成された方向コード列の差分を
求め、この求めた差分があらかじめ設定される閾値以上
の値をとる範囲の最大値をとる点を文字パターンの端点
として抽出する端点抽出手段と、この端点抽出手段で抽
出された端点と辞書に登録されているサンプル文字パタ
ーンの端点との対応をとり、それぞれの端点について位
置、曲率、ストローク方向の類似度を算出する第1の算
出手段と、前記穴部抽出手段で抽出された穴部と辞書に
登録されているサンプル文字パターンの穴部との対応を
とり、それぞれの位置の類似度を算出する第2の算出手
段と、この第1,第2の算出手段の各算出結果により認
識対象文字パターンと辞書パターンとの類似度を算出す
る第3の算出手段とを具備している。
【0009】また、本発明の文字認識装置は、構造解析
的手法を用いた文字認識を行なう文字認識装置であっ
て、入力される認識対象文字パターンを2値化する2値
化手段と、この2値化手段で2値化された文字パターン
を平滑化する平滑化手段と、この平滑化手段で平滑化さ
れた文字パターンに対して輪郭追跡を行なうことにより
方向コード列を作成する方向コード作成手段と、この方
向コード作成手段で作成された方向コード列の輪郭の外
接矩形を求めることにより、その外接矩形の包含関係か
ら文字パターンの穴部を抽出する穴部抽出手段と、前記
方向コード作成手段で作成された方向コード列の差分を
求め、この求めた差分があらかじめ設定される閾値以上
の値をとる範囲の最大値をとる点を文字パターンの端点
として抽出する端点抽出手段と、この端点抽出手段で抽
出された端点と辞書に登録されているサンプル文字パタ
ーンの端点との対応をとり、それぞれの端点について位
置、曲率、ストローク方向の類似度の評価値を標準偏差
を考慮して算出する第1の算出手段と、前記穴部抽出手
段で抽出された穴部と辞書に登録されているサンプル文
字パターンの穴部との対応をとり、それぞれの位置の類
似度の評価値を標準偏差を考慮して算出する第2の算出
手段と、この第1,第2の算出手段の各算出結果により
認識対象文字パターンと辞書パターンとの類似度の評価
値を算出する第3の算出手段とを具備している。
【0010】また、本発明の文字認識装置は、構造解析
的手法を用いた文字認識を行なう文字認識装置であっ
て、入力される認識対象文字パターンを2値化する2値
化手段と、この2値化手段で2値化された文字パターン
を平滑化する平滑化手段と、この平滑化手段で平滑化さ
れた文字パターンに対して輪郭追跡を行なうことにより
方向コード列を作成する方向コード作成手段と、この方
向コード作成手段で作成された方向コード列の輪郭の外
接矩形を求めることにより、その外接矩形の包含関係か
ら文字パターンの穴部を抽出する穴部抽出手段と、前記
方向コード作成手段で作成された方向コード列の差分を
求め、この求めた差分があらかじめ設定される閾値以上
の値をとる範囲の最大値をとる点を文字パターンの端点
として抽出する端点抽出手段と、この端点抽出手段で抽
出された端点同志の距離等により文字パターンの穴部の
一部が切断されていると考えられる場合は、その部位を
接続することにより、穴部接続後の穴部数と穴部接続前
の穴部数の2通りを得る手段と、この手段で得られた2
通りの穴部数について、それぞれ辞書パターンの参照を
行なうことにより評価を行ない、評価点の大きい方を答
えとする手段とを具備している。
【0011】また、本発明の文字認識装置は、構造解析
的手法を用いた文字認識を行なう文字認識装置であっ
て、入力される認識対象文字パターンを2値化する2値
化手段と、この2値化手段で2値化された文字パターン
を平滑化する平滑化手段と、この平滑化手段で平滑化さ
れた文字パターンに対して輪郭追跡を行なうことにより
方向コード列を作成する方向コード作成手段と、この方
向コード作成手段で作成された方向コード列の輪郭の外
接矩形を求めることにより、その外接矩形の包含関係か
ら文字パターンの穴部を抽出する穴部抽出手段と、前記
方向コード作成手段で作成された方向コード列の差分を
求め、この求めた差分があらかじめ設定される閾値以上
の値をとる範囲の最大値をとる点を文字パターンの端点
として抽出する第1の端点抽出手段と、この第1の端点
抽出手段で抽出された端点数について、参照する辞書に
登録されているサンプル文字パターンの端点数よりも少
ない場合、前記第1の端点抽出手段の閾値を所定値まで
低くし、その閾値を越える点があれば、その中で最大値
をとる点を追加点として抽出する第2の端点抽出手段
と、この第2の端点抽出手段で抽出された端点を前記第
1の端点抽出手段で抽出された端点に含めた場合と含め
ない場合について、それぞれ辞書パターンの参照を行な
うことにより評価を行ない、評価点の大きい方を答えと
する手段とを具備している。
【0012】また、本発明の文字認識用辞書作成方法
は、構造解析的手法を用いた文字認識に用いる辞書を作
成する文字認識用辞書作成方法であって、入力されるサ
ンプル文字パターンを2値化し、この2値化された文字
パターンを平滑化し、この平滑化された文字パターンに
対して輪郭追跡を行なうことにより方向コード列を作成
し、この作成された方向コード列の輪郭の外接矩形を求
めることにより、その外接矩形の包含関係から文字パタ
ーンの穴部を抽出するとともに、前記作成された方向コ
ード列の差分を求め、この求めた差分があらかじめ設定
される閾値以上の値をとる範囲の最大値をとる点を文字
パターンの端点として抽出し、この抽出された穴部数お
よび端点数を特徴点として辞書を作成することを特徴と
する。
【0013】また、本発明の文字認識用辞書作成方法
は、構造解析的手法を用いた文字認識に用いる辞書を作
成する文字認識用辞書作成方法であって、入力されるサ
ンプル文字パターンを2値化し、この2値化された文字
パターンを平滑化し、この平滑化された文字パターンに
対して輪郭追跡を行なうことにより方向コード列を作成
し、この作成された方向コード列の輪郭の外接矩形を求
めることにより、その外接矩形の包含関係から文字パタ
ーンの穴部を抽出するとともに、前記作成された方向コ
ード列の差分を求め、この求めた差分があらかじめ設定
される閾値以上の値をとる範囲の最大値をとる点を文字
パターンの端点として抽出し、この抽出された穴部数お
よび端点数から文字種ごとに穴部数および端点数の頻度
分布表を作成し、この作成された頻度分布表から最も頻
度の多い穴部数および端点数の組合わせを選択し、この
選択された組合わせを持つ文字パターンから辞書を作成
することを特徴とする。
【0014】また、本発明の文字認識用辞書作成方法
は、構造解析的手法を用いた文字認識に用いる辞書を作
成する文字認識用辞書作成方法であって、入力されるサ
ンプル文字パターンを2値化し、この2値化された文字
パターンを平滑化し、この平滑化された文字パターンに
対して輪郭追跡を行なうことにより方向コード列を作成
し、この作成された方向コード列の輪郭の外接矩形を求
めることにより、その外接矩形の包含関係から文字パタ
ーンの穴部を抽出するとともに、前記作成された方向コ
ード列の差分を求め、この求めた差分があらかじめ設定
される閾値以上の値をとる範囲の最大値をとる点を文字
パターンの端点として抽出し、この抽出された穴部数お
よび端点数から文字種ごとに穴部数および端点数の頻度
分布表を作成し、この作成された頻度分布表から最も頻
度の多い穴部数および端点数の組合わせを選択し、この
選択された組合わせを持つ文字パターンについて、4方
向のうちのいずれか1つの方向の端点に注目し、残りの
3つの方向の端点について輪郭追跡の順番を維持しなが
ら該辞書との対応付けを行なって辞書を作成することを
特徴とする。
【0015】さらに、本発明の文字認識用辞書作成方法
は、構造解析的手法を用いた文字認識に用いる辞書を作
成する文字認識用辞書作成方法であって、入力されるサ
ンプル文字パターンを2値化し、この2値化された文字
パターンを平滑化し、この平滑化された文字パターンに
対して輪郭追跡を行なうことにより方向コード列を作成
し、この作成された方向コード列の輪郭の外接矩形を求
めることにより、その外接矩形の包含関係から文字パタ
ーンの穴部を抽出するとともに、前記作成された方向コ
ード列の差分を求め、この求めた差分があらかじめ設定
される閾値以上の値をとる範囲の最大値をとる点を文字
パターンの端点として抽出し、この抽出された穴部数お
よび端点数から文字種ごとに穴部数および端点数の頻度
分布表を作成し、この作成された頻度分布表から最も頻
度の多い穴部数および端点数の組合わせを選択し、この
選択された組合わせを持つ文字パターンについて、対応
する端点の位置、曲率、ストローク方向、および、穴部
の位置について、その平均値および標準偏差を算出し、
その算出結果を登録することにより辞書を作成すること
を特徴とする。
【0016】
【作用】本発明によれば、従来のように文字パターンの
変形の多様性を全て辞書に記述するのではなく、認識対
象文字パターンの変形を認識処理過程で吸収することが
できるので、辞書作成の自動化が図れるとともに、辞書
を小規模化することができる。したがって、辞書参照の
処理時間の短縮化が図れ、高能率で、認識精度の向上が
図れる。
【0017】
【実施例】以下、本発明の一実施例について図面を参照
して説明する。図1は、本実施例に係る文字認識装置が
適用される光学的文字読取装置、たとえば、郵便物上に
記載された宛名情報を光学的に読取って区分する郵便物
宛名自動読取区分機、あるいは、帳票上に記載された文
字を光学的に読取る帳票読取装置に用いられる光学的文
字読取装置の構成を概略的に示すものである。
【0018】読取対象物Pは、図示しない搬送手段によ
って搬送されるものとする。搬送される読取対象物P上
の画像は、光電変換部1によって電気信号に変換され
る。光電変換部1は、いずれも図示しないが、読取対象
物P上を照明する光源、読取対象物P上からの反射光を
結像するレンズなどの光学系、光学系で結像された画像
を光電変換する自己走査形でCCD形のラインセンサな
どによって構成されている。
【0019】光電変換部1によって電気信号に変換され
た入力画像は、画像処理部2によって処理される。すな
わち、画像処理部2では、光電変換部1の出力信号に対
して、2値化処理、あるいは、微分処理などが行なわ
れ、その出力は読取領域検出部3に送られる。読取領域
検出部3は、ラベリングや射影などの周知技術を用いて
読取りの対象となる領域を検出する。ここに、読取対象
領域とは、たとえば、郵便物宛名自動読取区分機であれ
ば、宛名情報が記載されている宛名領域のことであり、
帳票読取装置であれば、顧客番号あるいは金額欄などの
情報領域のことである。
【0020】読取領域検出部3の出力は、文字検出切出
部4に送られる。文字検出切出部4は、検出された読取
対象領域において、周知のラベリングや射影情報などを
用いて文字行を切出し、切出した文字行から文字を1文
字ごとに分離し、その切出された文字は認識部5に送ら
れる。認識部5は、文字検出切出部4からの文字を辞書
6と照合することにより、文字認識を行なう。
【0021】認識部5の認識結果は、知識処理部7に送
られ、ここで知識辞書8との単語照合などを行なって組
立てられる。ここに、知識辞書8とは、読取対象物Pに
応じた単語照合のための辞書であり、たとえば、郵便物
宛名自動読取区分機であれば、住所情報が格納されてお
り、認識精度を向上させることができる。
【0022】知識処理部7の処理結果は、読取結果処理
部9に送られ、ここで本装置の出力が出される。それ
は、たとえば、郵便物宛名自動読取区分機であれば、宛
先別に分けられた区分口に郵便物を区分搬送するという
処理であり、帳票読取装置であれば、読取結果をディス
プレイの画面に表示し、ファイルに保存するという処理
になる。
【0023】本発明は、上記認識部5および辞書6の作
成方法に係るものであり、上述したような光学的文字読
取装置の全てに応用可能である。以下、辞書作成および
文字認識の処理に分けて具体的に説明する。
【0024】まず、辞書作成の手順について説明する。
辞書作成は、以下の2つの手順からなっている。第1の
手順は、サンプル文字パターンの中から代表となる学習
パターンを選択する手順であり、第2の手順は、その選
択された学習パターンから辞書を作成する手順である。
【0025】まず、第1の手順について図2に示すフロ
ーチャートを参照して説明する。第1の手順は、文字種
ごとの学習パターンを選択する手順であり、その学習パ
ターンを選択するのは、辞書を小規模化するためであ
る。ある文字種の入力画像数をNとすると(S1)、最
初の入力画像から順番に以下の処理を行なう。
【0026】始めに、入力画像(サンプル文字パター
ン)を2値化する(S2)。この2値化された画像の一
例を図3(a)に示す。次に、正確な特徴抽出を阻害す
る微小な輪郭形状の変形を除去するために、上記2値化
画像に対して平滑化処理を行なう(S3)。この平滑化
された画像の一例を図3(b)に示す。なお、平滑化処
理は、ガウス分布の重みをもつマスク処理などによって
行なわれるが、高速化あるいはアルゴリズムの単純化な
どの理由で、平滑化処理を省略するという例も考えられ
る。
【0027】次に、平滑化された画像からエッジが抽出
され、たとえば、図4に示すように、最も左上のエッジ
画素を始点として、輪郭追跡される。輪郭追跡は、たと
えば、図5に示すような8方向量子化コードを用いて行
なわれる。注目画素から8方向に隣接している画素のう
ち、8方向量子化コードの例えば「3」の方向から時計
回りに見て、一番初めに当たるエッジ画素を次の注目画
素とする。そして、注目画素から次の注目画素への方向
コードを求める(S4)。なお、図4は、図3(b)の
a部を拡大して示している。
【0028】このようにして輪郭を追跡し(図4参
照)、始点まで戻ったら、その輪郭の追跡を終了する。
このような輪郭追跡を行なうことにより、図4に符号1
1で示すような方向コード列が得られる。
【0029】こうして得られた輪郭は、文字パターンの
外側にあるものとホールを形成するものとに分けられる
ので、次にホール抽出処理が行なわれる(S5)。この
ホール抽出を図示したのが図6である。同図におけるエ
ッジ画像から2つの輪郭12,13を得ることができ
る。したがって、それぞれの輪郭12,13について外
接長方形14,15を求め、互いに包含関係があるかど
うかを調べる。本図の例では、長方形14が長方形15
を包含しているので、輪郭12は外側の輪郭、輪郭13
は内側一番目にある輪郭ということがわかる。
【0030】このように、最も外側に位置する外接長方
形を持つ輪郭、および、2,4,6,…と偶数番目に包
含される外接長方形を持つ輪郭はホールではなく、1,
2,3,5,…と奇数番目に包含される外接長方形を持
つ輪郭はホールとして抽出することができる。このよう
にして得られたホール数がいくつあるか数えておく。
【0031】次に、こうして得られたホールを除く輪郭
のうち、最も周長の大きい輪郭の方向コード列を重み付
け平均化処理することにより、方向コード列のグラフを
滑らかにしておく。そのグラフから、方向コード差分列
を作成する(S6)。図7(a)に方向コード列のグラ
フを示し、図7(b)に方向コード差分列のグラフを示
す。方向コード差分列は、文字パターンの推定線幅を考
慮した一定の間隔で方向コードの差分をとったものであ
る。推定線幅は、平滑化画像における輪郭で囲まれた黒
画素数を輪郭の周長の1/2で割るなどの処理によって
近似的に求めることができる。
【0032】ここでは、方向コード列を重み付け平均化
して端点(以下、凸点と称す)を抽出し易いようにして
いるが、方向コード列はそのままで、方向コード差分列
を重み付け平均化する、あるいは、重み付け平均化を行
なわないという例も考えられる。
【0033】こうして得られた方向コード差分列は、図
7(b)から明らかなように、正の部分は凸部、負の部
分は凹部を表している。次に、この方向コード差分列か
ら凸点抽出を行なう(S7)。その様子を示したのが図
8である。図8(b)に示す方向コード差分列のグラフ
に閾値TH1を設定する。この閾値TH1は「0」以上
の値で、不適当な凸点が多数抽出されない適当な値を実
験的にあらかじめ求めておくものとする。
【0034】そして、閾値TH1を越える方向コード差
分列の中で、最大値を取る点を凸点21〜24として抽
出する。図8(b)の各凸点21〜24は、図8(a)
に示す文字パターンの各凸点31〜34にそれぞれ相当
する。すなわち、凸点21は凸点31、凸点22は凸点
32、凸点23は凸点33、凸点24は凸点34にそれ
ぞれ対応している。なお、凸点25,35については認
識手順の項で述べることとする。
【0035】次に、こうして得られたホールおよび凸点
の数を求める。これを入力画像N個について繰り返し、
凸点およびホール数の組合わせ頻度分布表を作成する
(S8)。そして、この作成した頻度分布表を参考にし
て、各文字種ごとの代表となる凸点およびホール数の組
合わせを選択する(S9)。これは、最大頻度となる組
合わせを1つ選択することがよいと思われるが、より高
い認識性能を得るために、複数選択することもできる。
あるいは、必ずしも最大頻度となる組合わせを選択しな
いという場合も考えられる。一例としては、数字の
「1」について、最大頻度となる組合わせはホール数
「0」、凸点数「2」の組合わせであるが、画数「2」
で書かれる鍵の付いた「1」を認識し易くするために、
ホール数「0」、凸点数「4」の辞書テンプレートを付
加するということがある。
【0036】次に、第2の手順について図9に示すフロ
ーチャートを参照して説明する。第2の手順は、上記の
ようにして得られた凸点およびホール数の組合わせを持
つ入力画像から辞書を作成する手順である。ここでは、
選択された凸点およびホール数の組合わせごとに1つの
辞書テンプレートを作成する。したがって、1つの文字
種について組合わせが複数存在する場合は、その組合わ
せごとに辞書テンプレートを作成する。
【0037】ある文字種について、入力画像数をNとす
ると(S11)、最初の入力画像から順番に、図2に示
した学習パターンを選択する方法と同様に、まず2値化
処理を行ない(S12)、次に平滑化処理を行ない(S
13)、次に方向コード列を作成し(S14)、次にホ
ールを抽出し(S15)、次に方向コード差分列を作成
し(S16)、次に凸点抽出を行なう(S17)。
【0038】次に、抽出された凸点およびホール数が目
的の辞書の凸点およびホール数と一致するかどうかを検
証する(S18)。この検証の結果、もし一致する場合
は、各凸点の位置、曲率、ストローク方向、ホールの位
置をそれぞれ求める。凸点の位置は、文字パターンの外
接長方形の縦横の長さをそれぞれ「1」とし、基準点を
外接長方形の左上の頂点とし、そこからのオフセット量
から求める。ホールの位置は、ホールの中心座標などと
する。
【0039】凸点の曲率およびストロークの方向は、た
とえば、図10に示すようにして求められる。この図
は、輪郭の一部を表したものである。推定線幅を考慮し
た一定のテンプレートの数だけ凸点41から離れた輪郭
点から、推定線幅を考慮した一定の点の数だけの方向コ
ード列の平均を求める。こうにして得られた第1のスト
ローク方向42および第2のストローク方向43が作る
挟み角を曲率44とする。また、第1のストローク方向
42と第2のストローク方向43との平均の方向をスト
ローク方向45とする。
【0040】次に、上記のようにして求めた凸点の位
置、曲率、ストローク方向、ホールの位置の各値は保存
しておく(S19)。このとき、各文字パターンごと
に、最も上にある凸点を1番の凸点とし、その凸点から
輪郭追跡された順番に2番、3番という具合に凸点に番
号を付加していく。
【0041】次に、各文字種について、各番号の凸点の
位置、曲率、ストローク方向の平均および標準偏差を算
出する(S20)。ただし、たとえば、数字「4」、
「5」、「7」のように、最も上にある凸点がどの凸点
に対応するのかが文字パターンによって変動し易い文字
種については、最も下にある凸点を1番の凸点とする。
【0042】ホールについては、上にあるものから順番
に番号を付加し、同様に各番号のホールの位置の平均お
よび標準偏差を算出する(S20)。こうして算出した
各平均値および標準偏差値を辞書に登録する(S2
1)。そして、全ての代表組合わせについて辞書が作成
される。
【0043】次に、上記したようにして作成された辞書
6を用いた、認識部5における文字認識処理について、
図11および図12に示すフローチャートを参照して説
明する。
【0044】入力画像(認識対象文字パターン)に対し
て、図2に示した学習パターンを選択する方法と同様
に、まず2値化処理を行ない(S31)、次に平滑化処
理を行ない(S32)、次に方向コード列を作成し(S
33)、次にホールを抽出し(S34)、次に方向コー
ド差分列を作成し(S35)、次に凸点抽出を行なう
(S36)。
【0045】次に、文字のかすれ、文字の変形などによ
り、ホールであるべきストロークが分断されている場合
には、ループを接続する。それは、たとえば、抽出され
た凸点同志が近いかどうか、凸点と輪郭が接近している
かどうかなどを調べることにより、ループ接続が可能で
あるか否かを検証する(S37)。ループ接続可能な場
合には、ループを一定の線幅を持った黒画素で接続し、
方向コード列をそれに合わせて修正する。このようにし
て得られたループ接続後のホール数とループ接続前のホ
ール数の2通りを入力画像のホール数とする(S3
8)。
【0046】次に、辞書テンプレートとの比較を行な
う。ここでは、テンプレートの数をMとする(S3
9)。入力画像のホール数が、対象辞書のホール数と同
じ数である場合(S40)に、以下の処理を行なう。
【0047】まず、入力画像の凸点と辞書の凸点との対
応をとる。対応の取り方は、輪郭追跡における凸点の順
番を保存しながら、ホールおよび凸点の類似度fを計算
し(S41)、類似度fの値が最大となる組合わせを、
その辞書テンプレートに対する対応とする。辞書と入力
画像の凸点数が異なる場合は、対応しない点があっても
よいものとする。上記類似度fは、入力画像のホールの
位置、凸点の位置、曲率、ストロークの方向の値と辞書
テンプレートの平均値との差を、標準偏差を考慮に入れ
て評価した値であり、入力画像と辞書の凸点数の差異も
評価値に含まれる。
【0048】ここで、入力画像の凸点数が辞書の凸点数
よりも少ない場合(S42)、凸点抽出の閾値を所定値
まで下げて凸点の追加を行なう。これは、凸点抽出の曖
昧さを許容するためである。図8に凸点の追加の様子を
示す。図8(b)の方向コード差分列のグラフにおい
て、閾値TH1をTH2の値まで下げ、その閾値TH2
を越える部分の中で最大となる点を取る。そして、その
点の中で、最大となる1つの点25を選択し、それを追
加点とする。この凸点25は、輪郭線では、図8(a)
の文字パターンにおける凸点35に相当する。
【0049】このようにして追加点が抽出できた場合、
それを凸点として追加し(S43)、その追加点も含め
て辞書の凸点との対応をとり、ホールおよび凸点の類似
度f′を計算する(S44)。そして、f′>fの場合
(S45)、f′を類似度fとする(S46)。
【0050】以上の手順を全ての辞書テンプレートにお
いて処理し、類似度の大きさによる順位を基にその認識
結果とする(S47)。なお、この認識結果を基に、た
とえば、DP(ダイナミック・プログラミング)マッチ
ング、あるいは、ヒルン・マルコフ・モデル(Hidden M
arcov Model )のような周知技術を用いて、凸点以外の
輪郭形状のマッチングを行ない、より精度の高い認識結
果を得ることも可能である。
【0051】また、パターンマッチング的手法の認識結
果と照らし合わせ、相補的な認識性能を利用した高精度
認識も可能である。このように、上記実施例によれば、
従来のように文字パターンの変形の多様性を全て辞書に
記述するのではなく、認識対象文字パターンの変形を認
識処理過程で吸収することができるので、辞書作成の自
動化が図れるとともに、辞書を小規模化することができ
る。したがって、メモリの節約、辞書参照の処理時間の
短縮化が図れ、高能率で、認識精度の向上が図れる。
【0052】また、文字パターンから抽出する特徴点を
ホールと凸点などに限定しているため、アルゴリズムの
単純化が図れる。また、特徴点の組合わせを人為的に選
択することにより、求める文字パターンを認識させる操
作が可能である。
【0053】また、凸点抽出パラメータに曖昧さを認め
ることにより、より正確に特徴点を抽出することができ
る。また、ループ接続のアルゴリズムにより、文字のか
すれ、文字の変形に強い認識が可能になる。さらに、ル
ープ接続前のパターンとの比較を行なうことにより、誤
ってループ接続する場合を防止することができる。
【0054】
【発明の効果】以上詳述したように本発明によれば、辞
書を小規模化することができるとともに、辞書参照の処
理時間の短縮化が図れ、高能率で、認識精度の向上が図
れる文字認識装置および文字認識用辞書作成方法を提供
できる。
【図面の簡単な説明】
【図1】本発明の一実施例に係る光学的文字読取装置の
構成を概略的に示すブロック図。
【図2】辞書作成のための第1の手順を説明するフロー
チャート。
【図3】2値化画像および平滑化画像の一例を示す図。
【図4】輪郭追跡を説明するための図。
【図5】輪郭追跡を行なうための8方向量子化コードを
示す図。
【図6】ホール抽出を説明するための図。
【図7】方向コード列および方向コード差分列のグラフ
を示す図。
【図8】凸点抽出を説明するための図。
【図9】辞書作成のための第2の手順を説明するフロー
チャート。
【図10】ストローク方向の抽出を説明するための図。
【図11】文字認識処理を説明するフローチャート。
【図12】文字認識処理を説明するフローチャート。
【符号の説明】
P……読取対象物 1……光電変換部 2……画像処理部 3……読取領域検出部 4……文字検出切出部 5……認識部 6……辞書 7……知識処理部 8……知識辞書 9……読取結果処理部 11……方向コード列 12,13……輪郭 14,15……外接長方形 TH1,TH2……閾値 21〜25……方向コード差分列の凸点(端点) 31〜35……文字パターンの凸点(端点) 41……凸点(端点) 42……第1のストローク方向 43……第2のストローク方向 44……曲率 45……ストローク方向

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 構造解析的手法を用いた文字認識を行な
    う文字認識装置であって、 入力される認識対象文字パターンを2値化する2値化手
    段と、 この2値化手段で2値化された文字パターンを平滑化す
    る平滑化手段と、 この平滑化手段で平滑化された文字パターンに対して輪
    郭追跡を行なうことにより方向コード列を作成する方向
    コード作成手段と、 この方向コード作成手段で作成された方向コード列の輪
    郭の外接矩形を求めることにより、その外接矩形の包含
    関係から文字パターンの穴部を抽出する穴部抽出手段
    と、 前記方向コード作成手段で作成された方向コード列の差
    分を求め、この求めた差分があらかじめ設定される閾値
    以上の値をとる範囲の最大値をとる点を文字パターンの
    端点として抽出する端点抽出手段と、 前記穴部抽出手段で抽出された穴部数および前記端点抽
    出手段で抽出された端点数を辞書に登録されているサン
    プル文字パターンの穴部数および端点数と照合すること
    により文字認識を行なう認識手段と、 を具備したことを特徴とする文字認識装置。
  2. 【請求項2】 構造解析的手法を用いた文字認識を行な
    う文字認識装置であって、 入力される認識対象文字パターンを2値化する2値化手
    段と、 この2値化手段で2値化された文字パターンを平滑化す
    る平滑化手段と、 この平滑化手段で平滑化された文字パターンに対して輪
    郭追跡を行なうことにより方向コード列を作成する方向
    コード作成手段と、 この方向コード作成手段で作成された方向コード列の輪
    郭の外接矩形を求めることにより、その外接矩形の包含
    関係から文字パターンの穴部を抽出する穴部抽出手段
    と、 前記方向コード作成手段で作成された方向コード列の差
    分を求め、この求めた差分があらかじめ設定される閾値
    以上の値をとる範囲の最大値をとる点を文字パターンの
    端点として抽出する端点抽出手段と、 この端点抽出手段で抽出された端点と辞書に登録されて
    いるサンプル文字パターンの端点との対応をとり、それ
    ぞれの端点について位置、曲率、ストローク方向の類似
    度を算出する第1の算出手段と、 前記穴部抽出手段で抽出された穴部と辞書に登録されて
    いるサンプル文字パターンの穴部との対応をとり、それ
    ぞれの位置の類似度を算出する第2の算出手段と、 この第1,第2の算出手段の各算出結果により認識対象
    文字パターンと辞書パターンとの類似度を算出する第3
    の算出手段と、 を具備したことを特徴とする文字認識装置。
  3. 【請求項3】 構造解析的手法を用いた文字認識を行な
    う文字認識装置であって、 入力される認識対象文字パターンを2値化する2値化手
    段と、 この2値化手段で2値化された文字パターンを平滑化す
    る平滑化手段と、 この平滑化手段で平滑化された文字パターンに対して輪
    郭追跡を行なうことにより方向コード列を作成する方向
    コード作成手段と、 この方向コード作成手段で作成された方向コード列の輪
    郭の外接矩形を求めることにより、その外接矩形の包含
    関係から文字パターンの穴部を抽出する穴部抽出手段
    と、 前記方向コード作成手段で作成された方向コード列の差
    分を求め、この求めた差分があらかじめ設定される閾値
    以上の値をとる範囲の最大値をとる点を文字パターンの
    端点として抽出する端点抽出手段と、 この端点抽出手段で抽出された端点と辞書に登録されて
    いるサンプル文字パターンの端点との対応をとり、それ
    ぞれの端点について位置、曲率、ストローク方向の類似
    度の評価値を標準偏差を考慮して算出する第1の算出手
    段と、 前記穴部抽出手段で抽出された穴部と辞書に登録されて
    いるサンプル文字パターンの穴部との対応をとり、それ
    ぞれの位置の類似度の評価値を標準偏差を考慮して算出
    する第2の算出手段と、 この第1,第2の算出手段の各算出結果により認識対象
    文字パターンと辞書パターンとの類似度の評価値を算出
    する第3の算出手段と、 を具備したことを特徴とする文字認識装置。
  4. 【請求項4】 構造解析的手法を用いた文字認識を行な
    う文字認識装置であって、 入力される認識対象文字パターンを2値化する2値化手
    段と、 この2値化手段で2値化された文字パターンを平滑化す
    る平滑化手段と、 この平滑化手段で平滑化された文字パターンに対して輪
    郭追跡を行なうことにより方向コード列を作成する方向
    コード作成手段と、 この方向コード作成手段で作成された方向コード列の輪
    郭の外接矩形を求めることにより、その外接矩形の包含
    関係から文字パターンの穴部を抽出する穴部抽出手段
    と、 前記方向コード作成手段で作成された方向コード列の差
    分を求め、この求めた差分があらかじめ設定される閾値
    以上の値をとる範囲の最大値をとる点を文字パターンの
    端点として抽出する端点抽出手段と、 この端点抽出手段で抽出された端点同志の距離等により
    文字パターンの穴部の一部が切断されていると考えられ
    る場合は、その部位を接続することにより、穴部接続後
    の穴部数と穴部接続前の穴部数の2通りを得る手段と、 この手段で得られた2通りの穴部数について、それぞれ
    辞書パターンの参照を行なうことにより評価を行ない、
    評価点の大きい方を答えとする手段と、 を具備したことを特徴とする文字認識装置。
  5. 【請求項5】 構造解析的手法を用いた文字認識を行な
    う文字認識装置であって、 入力される認識対象文字パターンを2値化する2値化手
    段と、 この2値化手段で2値化された文字パターンを平滑化す
    る平滑化手段と、 この平滑化手段で平滑化された文字パターンに対して輪
    郭追跡を行なうことにより方向コード列を作成する方向
    コード作成手段と、 この方向コード作成手段で作成された方向コード列の輪
    郭の外接矩形を求めることにより、その外接矩形の包含
    関係から文字パターンの穴部を抽出する穴部抽出手段
    と、 前記方向コード作成手段で作成された方向コード列の差
    分を求め、この求めた差分があらかじめ設定される閾値
    以上の値をとる範囲の最大値をとる点を文字パターンの
    端点として抽出する第1の端点抽出手段と、 この第1の端点抽出手段で抽出された端点数について、
    参照する辞書に登録されているサンプル文字パターンの
    端点数よりも少ない場合、前記第1の端点抽出手段の閾
    値を所定値まで低くし、その閾値を越える点があれば、
    その中で最大値をとる点を追加点として抽出する第2の
    端点抽出手段と、 この第2の端点抽出手段で抽出された端点を前記第1の
    端点抽出手段で抽出された端点に含めた場合と含めない
    場合について、それぞれ辞書パターンの参照を行なうこ
    とにより評価を行ない、評価点の大きい方を答えとする
    手段と、 を具備したことを特徴とする文字認識装置。
  6. 【請求項6】 構造解析的手法を用いた文字認識に用い
    る辞書を作成する文字認識用辞書作成方法であって、 入力されるサンプル文字パターンを2値化し、この2値
    化された文字パターンを平滑化し、この平滑化された文
    字パターンに対して輪郭追跡を行なうことにより方向コ
    ード列を作成し、この作成された方向コード列の輪郭の
    外接矩形を求めることにより、その外接矩形の包含関係
    から文字パターンの穴部を抽出するとともに、前記作成
    された方向コード列の差分を求め、この求めた差分があ
    らかじめ設定される閾値以上の値をとる範囲の最大値を
    とる点を文字パターンの端点として抽出し、この抽出さ
    れた穴部数および端点数を特徴点として辞書を作成する
    ことを特徴とする文字認識用辞書作成方法。
  7. 【請求項7】 構造解析的手法を用いた文字認識に用い
    る辞書を作成する文字認識用辞書作成方法であって、 入力されるサンプル文字パターンを2値化し、この2値
    化された文字パターンを平滑化し、この平滑化された文
    字パターンに対して輪郭追跡を行なうことにより方向コ
    ード列を作成し、この作成された方向コード列の輪郭の
    外接矩形を求めることにより、その外接矩形の包含関係
    から文字パターンの穴部を抽出するとともに、前記作成
    された方向コード列の差分を求め、この求めた差分があ
    らかじめ設定される閾値以上の値をとる範囲の最大値を
    とる点を文字パターンの端点として抽出し、この抽出さ
    れた穴部数および端点数から文字種ごとに穴部数および
    端点数の頻度分布表を作成し、この作成された頻度分布
    表から最も頻度の多い穴部数および端点数の組合わせを
    選択し、この選択された組合わせを持つ文字パターンか
    ら辞書を作成することを特徴とする文字認識用辞書作成
    方法。
  8. 【請求項8】 構造解析的手法を用いた文字認識に用い
    る辞書を作成する文字認識用辞書作成方法であって、 入力されるサンプル文字パターンを2値化し、この2値
    化された文字パターンを平滑化し、この平滑化された文
    字パターンに対して輪郭追跡を行なうことにより方向コ
    ード列を作成し、この作成された方向コード列の輪郭の
    外接矩形を求めることにより、その外接矩形の包含関係
    から文字パターンの穴部を抽出するとともに、前記作成
    された方向コード列の差分を求め、この求めた差分があ
    らかじめ設定される閾値以上の値をとる範囲の最大値を
    とる点を文字パターンの端点として抽出し、この抽出さ
    れた穴部数および端点数から文字種ごとに穴部数および
    端点数の頻度分布表を作成し、この作成された頻度分布
    表から最も頻度の多い穴部数および端点数の組合わせを
    選択し、この選択された組合わせを持つ文字パターンに
    ついて、4方向のうちのいずれか1つの方向の端点に注
    目し、残りの3つの方向の端点について輪郭追跡の順番
    を維持しながら該辞書との対応付けを行なって辞書を作
    成することを特徴とする文字認識用辞書作成方法。
  9. 【請求項9】 構造解析的手法を用いた文字認識に用い
    る辞書を作成する文字認識用辞書作成方法であって、 入力されるサンプル文字パターンを2値化し、この2値
    化された文字パターンを平滑化し、この平滑化された文
    字パターンに対して輪郭追跡を行なうことにより方向コ
    ード列を作成し、この作成された方向コード列の輪郭の
    外接矩形を求めることにより、その外接矩形の包含関係
    から文字パターンの穴部を抽出するとともに、前記作成
    された方向コード列の差分を求め、この求めた差分があ
    らかじめ設定される閾値以上の値をとる範囲の最大値を
    とる点を文字パターンの端点として抽出し、この抽出さ
    れた穴部数および端点数から文字種ごとに穴部数および
    端点数の頻度分布表を作成し、この作成された頻度分布
    表から最も頻度の多い穴部数および端点数の組合わせを
    選択し、この選択された組合わせを持つ文字パターンに
    ついて、対応する端点の位置、曲率、ストローク方向、
    および、穴部の位置について、その平均値および標準偏
    差を算出し、その算出結果を登録することにより辞書を
    作成することを特徴とする文字認識用辞書作成方法。
JP6211132A 1994-09-05 1994-09-05 文字認識装置および文字認識用辞書作成方法 Pending JPH0877293A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6211132A JPH0877293A (ja) 1994-09-05 1994-09-05 文字認識装置および文字認識用辞書作成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6211132A JPH0877293A (ja) 1994-09-05 1994-09-05 文字認識装置および文字認識用辞書作成方法

Publications (1)

Publication Number Publication Date
JPH0877293A true JPH0877293A (ja) 1996-03-22

Family

ID=16600922

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6211132A Pending JPH0877293A (ja) 1994-09-05 1994-09-05 文字認識装置および文字認識用辞書作成方法

Country Status (1)

Country Link
JP (1) JPH0877293A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001236465A (ja) * 2000-02-22 2001-08-31 Japan Cash Machine Co Ltd 手書き文字認識装置
JP2007317033A (ja) * 2006-05-26 2007-12-06 Sharp Manufacturing System Corp 文字画像の照合方法および照合装置ならびにプログラム
CN110709830A (zh) * 2017-05-16 2020-01-17 富士通株式会社 解析程序、解析方法以及解析装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001236465A (ja) * 2000-02-22 2001-08-31 Japan Cash Machine Co Ltd 手書き文字認識装置
JP4519240B2 (ja) * 2000-02-22 2010-08-04 日本金銭機械株式会社 手書き文字認識装置
JP2007317033A (ja) * 2006-05-26 2007-12-06 Sharp Manufacturing System Corp 文字画像の照合方法および照合装置ならびにプログラム
CN110709830A (zh) * 2017-05-16 2020-01-17 富士通株式会社 解析程序、解析方法以及解析装置
CN110709830B (zh) * 2017-05-16 2022-11-22 富士通株式会社 储存有解析程序的记录介质、解析方法以及解析装置

Similar Documents

Publication Publication Date Title
US5410611A (en) Method for identifying word bounding boxes in text
US7120318B2 (en) Automatic document reading system for technical drawings
KR100658119B1 (ko) 문자 인식 장치 및 방법
JP3345224B2 (ja) パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置
US20150339525A1 (en) Process of handwriting recognition and related apparatus
KR19980023917A (ko) 패턴 인식 장치 및 방법
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
US4891750A (en) Optical character recognition by forming and detecting matrices of geo features
JPH01253077A (ja) 文字列検出方法
Ali et al. An efficient character segmentation algorithm for recognition of Arabic handwritten script
Boukerma et al. A novel Arabic baseline estimation algorithm based on sub-words treatment
Zhou et al. Discrimination of characters by a multi-stage recognition process
JP2007058882A (ja) パターン認識装置
Kerrick et al. Microprocessor-based recognition of handprinted characters from a tablet input
JP2898562B2 (ja) ナンバープレート決定方法
JP4543675B2 (ja) 文字・図形の認識方法
JPH0877293A (ja) 文字認識装置および文字認識用辞書作成方法
KR20090111202A (ko) 한글의 기본 구성요소인 수평선, 수직선, 사선, 원의개수와 특성치를 이용한 한글인식 방법 및 장치
Jia et al. Grayscale-projection based optimal character segmentation for camera-captured faint text recognition
JPH11328309A (ja) 光学的文字読み取り方法とその装置
JP2965165B2 (ja) パターン認識方法及び認識用辞書作成方法
Ahmed Signage recognition based wayfinding system for the visually impaired
JPH0656625B2 (ja) 特徴抽出方式
JP2671984B2 (ja) 情報認識装置
JP2007026470A (ja) パターン認識装置