JPH0715703B2

JPH0715703B2 - 文字読取方式

Info

Publication number: JPH0715703B2
Application number: JP61110682A
Authority: JP
Inventors: 保夫本郷
Original assignee: Fuji Electric Co Ltd
Current assignee: Fuji Electric Co Ltd
Priority date: 1986-05-16
Filing date: 1986-05-16
Publication date: 1995-02-22
Anticipated expiration: 2010-02-22
Also published as: JPS62267889A; US4887303A

Description

【発明の詳細な説明】〔産業上の利用分野〕この発明は、読取対象である文字，図形をテレビカメラ
などの光電変換素子を介して入力し、その特徴を学習し
て文字別の辞書パターンを自動的に作成し、この辞書を
用いて未知文字の読取りを行なう文字読取方式に関す
る。

〔従来の技術〕

この種の読取方式として、例えばビツトマトリツクスを
用いるものが知られている。

これは、未知パターンを所定大きさの外接四角形により
切り出してこの四角形を複数のメツシユに分割し、各メ
ツシユ内に文字パターンが存在するか否かに応じて２値
化することにより、未知文字を“1",“0"パターンから
なるビツトマトリツクスで表現する一方、標準パターン
についても種々の許容量を加味したビツトマトリツクス
で表現し、両ビツトマトリツクスの間で種々の演算をし
てその一致度を調べ、これにより文字読取を行うもので
ある。

〔発明が解決しようとする問題点〕

しかしながら、かゝる方式には以下の如き問題点があ
る。

（１）文字パターンに着目して求めたビツトマトリツ
クスを用いているため、例えば「６」と「５」のように
類似した文字の読取りを誤ることがある。

（２）辞書パターンの登録を人手で行つているため、
文字の登録が面倒であつた。

（３）文字パターンの特徴であるビツトマトリツクス
を実ラインで集計していため、辞書パターンと実ライン
での文字パターンとの違いが検出できず、その結果辞書
パターンを補正することができない。

したがつて、この発明は文字の誤読が少なく、かつ辞書
文字登録とその修正が容易な文字読取方式を提供するこ
とを目的とする。

〔問題点を解決するための手段〕

文字のストロークだけでなく背景に対応するビツトマト
リツクスを特徴量として抽出することで類似な文字の誤
読を少なくし、文字ごとの辞書パターンを学習により自
動的に作成することで文字登録を簡単にし、さらに実ラ
インでの相補的ビツトマトリツクスを集計して辞書パタ
ーンを補正可能とすることで学習時と実ラインでの判定
時におけるパターンの差違を検出し、総合的判定性能を
向上させる。

〔作用〕

この発明では、ビツトマトリツクスの定義を拡張して、
従来のストローク成分だけでなく背景成分に対応するも
のも特徴量として使用する。一般に、ビツトマトリツク
スは正規化されるため、元のサイズより小さくなる場合
には拡大の効果がある。その結果、類似の文字（例えば
５と６）の識別力が劣化する。これを防ぐために相補的
ビツトマトリツクスを抽出してストロークの拡大に対し
背景の拡大を行うことで、文字パターンの差違を失わな
い特徴を抽出しようとするものである。

また、読取対象となる文字パターンについて相補的ビツ
トマトリツクスを測定して累積マトリツクスを求め、そ
れをもとに辞書パターンを自動的に作成する。この累積
マトリツクスを求めるに当たつては、２値化しいき値を
面積変化量の許容範囲内で変化させて、模擬的な文字パ
ターンのバラツキを計測するようにしている。辞書パタ
ーンをもとに未知文字パターンを読取る際には、分類処
理などにより候補文字カテゴリーを段階的に削減し、演
算時間を短縮するようにしている。

さらに、認識結果をもとに各カテゴリーごとに相補的ビ
ツトマトリツクスを集計し、集計した累積マトリツクス
をもとに再度辞書パターンを計算することで、辞書パタ
ーンの補正を行うようにしている。また、その他の距離
なども集計しているので、学習時と読取時でのパターン
の違いを定量的に評価することができる。

〔実施例〕

第１図はこの発明の実施例を示す構成図である。同図に
おいて、１は対象文字、２はテレビカメラの如き撮像装
置、３は可変２値化回路、４は特徴抽出回路、５は画像
メモリ、６はマイクロプロセツサの如き処理装置、７は
しきい値発生回路、８はメモリ、９は辞書パターンメモ
リ、10は入出力インタフイエイスである。

テレビカメラ２は、刻印文字などの対象文字１を撮像す
る。テレビカメラ２からの電気信号は可変２値化回路３
にて２値化されて、２値画像信号になる。２値画像のセ
グメント情報が特徴抽出回路４にて抽出され、DMAモー
ドにて画像メモリ５に書き込まれる。ここで、セグメン
トとは水平走査線上での各画素のランのことであり、セ
グメント情報としてはセグメント長、セグメント右端座
標値、主境界長、副境界長、連結情報等があり、これら
が画像メモリ５に書き込まれる。マイクロプロセツサ６
はシステムバスBSにつながつている画像メモリ５をアク
セスすることができ、それにより連結性解析や文字読取
処理を行う。マイクロプロセツサ６は入出力インタフエ
イス10を介して外部からの指令により画像を入力した
り、学習，読取り，集計，補正などの各処理を行う。ま
た、画像入力の際にしきい値発生回路７を通じて、可変
２値化しきい値THを可変２値化回路３へ指定するとがで
きる。マイクロプロセツサ６はこのように２値化しきい
値を変更しながら画像データを読み込み、辞書パターン
を作成して辞書パターン用メモリ９に記憶する。メモリ
８は、もろもろの処理に使用する一時記憶として使用さ
れる。文字パターンの認識時には、判定開始信号S₁によ
り画像を入力し、読取り後読取結果出力信号S₂として外
部へ出力する。なお、２値化しきい値THは入出力インタ
ーウエースを通じて外部から与えられる場合と、面積ヒ
ストグラムから自動的に決定される場合とがある。

第1A図に、第１図のテレビカメラ２で撮像した文字の２
値画像の例を示す。文字パターンは有効画面Ｐ内にあ
り、直行座標形X,Yにより各パターンの画素（黒画素）P
_Cの座標が表現され、これらパターン画素P_Cの集合とし
てパターンが表現される。また文字パターンの背景は背
景画素（白画素）P_Bとして表わされる。文字パターンは
ストローク成分である黒画素と、背景である白画素とで
相補的に記述できる。

マイクロプロセツサ６が標準文字パターンから辞書パタ
ーンを作成する学習処理フローを、第２図に示す。２値
化しきい値をしきい値発生回路７に設定して（第２図
参照）、学習対象の文字パターンの画素データを取込む
（第２図参照）。次いで連結性を解析し（第２図参
照）、セグメントにラベル付けを行う。これにより連結
しているセグメントには、同一番号がラベルとして付け
られる。この同一ラベルのセグメント集合を単にパター
ンと呼び、各パターンに関する外接枠座標値（Y_T,Y_B,
X_L,X_R）や面積（A_C）、周囲長（L_B）などを求める。次
に、文字パターンの幅（W_C），高さ（H_C）により、文字
パターンを切り出す（第２図参照）。文字パターンの
面積（A_C）は、文字パターンに属するパターンの面積の
総和として表わされる。指定された文字の最初の画像取
込み時の文字パターンの面積をA_C0とすると、ｎ回目の
文字パターンの面積A_Cnの変化量δ_Anは次式で表わされ
る。

面積変化量（δ_An）が上限値（δ_AU）より小さければ文
字パターンの相補的ビツトマトリツクスを求め、そうで
なければ２値化しきい値を設定し直して再度、画像取込
みから処理を行う（第２図参照）。

第2A図に、相補的ビツトマトリツクスB_S,B_Bの作成例を
示す。文字パターンPAは、例えば幅W_C＝25画素，高さH_C
＝35画素であるが、その正規化サイズＷ×Ｈを10×14に
した場合の例を示すのが同図である。メツシユ内に黒画
素があれば値を１、黒画素がなげれば値を０とする。こ
のようにして作成した２値行列をストロークビツトマト
リツクスB_Sと呼ぶ。第2A図（ロ）に、同（イ）に対応す
るストロークビツトマトリツクスB_Sを示す。これに対し
て、メツシユ内に白画素があれば値を１とし、なければ
０として作成した２値行列を背景ビツトマトリツクスB_B
と呼ぶ。第2A図（ハ）に、同（イ）に対応する背景ビツ
トマトリツクスB_Bを示す。図から分るように、正規化サ
イズ（10×14）が元の文字パターンのサイズ（25×35）
より小さい場合には、正規化処理により見掛け上ストロ
ークビツトマトリツクスでは黒画素を拡大し、背景ビツ
トマトリツクスでは白画素を拡大することになる。スト
ロークビツトマトリツクスB_Sと背景ビツトマトリツクス
B_Bとを合わせて相補的ビツトマトリツクスと呼ぶが、こ
れを求めるのが第２図のステツプである。

この相補的ビツトマトリツクスは２値行列であり、スト
ローク成分（B_S（i,j））と背景成分（B_B（i,j））につ
いて、各行列要素を累積してそれぞれストローク累積マ
トリツクスC_Sと背景累積マトリツクスC_Bとを求める（第
２図参照）。そのためには複数回の学習が必要である
が、この学習回数N_Lを10回とした場合の累積マトリツク
スの例を第2B付（イ），（ロ）にそれぞれ示す。

これらの文字パターンの相補的累積マトリツクスから基
本ビツトマトリツクスB₀を第３図の処理手順に従つて求
める。ここでは、基本ビツトマトリツクスB₀のビツト
（R_B）を、の如く定義し、基本ビツトマトリツクスのビツト率
（R_B）がR₁以下となるように、２値行列へ変換する基準
値N₁を一定値から１ずつ増やしていつて、最初にR₁以下
となるビツトマトリツクスを基本ビツトマトリツクスと
している。従つて、同一の累積マトリツクスでもR₁とN₁
の値を変えれば基本ビツトマトリツクスも変わることに
なる。文字パターンによつて本当のビツト率は異なるの
で、全文字に対するビツト率の上限値としてR₁の値を決
める。また、基準値N₁は学習の際の２値化しきい値の変
動による文字線幅の変動を模擬しようとするものであ
る。

第2B図（イ）に示すストローク累積マトリツクスC_Sか
ら、N₁＝5,R₁＝0.8として求めた基本ビツトマトリツク
スB_0Sの例を第3A図（イ）に示す。また、第2B図（ロ）
に示す背景成分C_Bについて、N₁＝7,R₁＝0.8として求め
た基本ビツトマトリツクスB_0Bの例を第3A図（ロ）に示
す。時に、N₁＝1,R₁＝1.0として求めたビツトマトリツ
クスは最大ビツト率の基本ビツトマトリツクスであるの
で、これを臨界ビツトマトリツクスと呼ぶ。臨界ビツト
マトリツクスB_CS,B_CBを第3B図（イ），（ロ）にそれぞ
れ示す。

基本ビツトマトリツクス（B_0S,B_0B）と臨界ビツトマト
リツクス（B_CS,B_CB）から、辞書パターンを求める処理
手順を第４図に示す。

まず、基本ビツトマトリツクスから各行列要素の水平ラ
ン数（N_H）を求める。水平ラン数N_Hは着目する行列要素
（B_0S（i,j）またはB_0B（i,j））の行方向に連なる値１
の要素数である。もし、着目する要素の値が０であれば
連なりはないので、水平ラン数N_Hはゼロとなる。同様
に、垂直ラン数（N_V）は列方向に連なる値１の要素数で
ある。ストローク基本ビツトマトリツクスB_0Sの水平ラ
ン数N_Hの行列と垂直ラン数N_Vの行列とをそれぞれ第4A図
（イ），（ロ）に示す。また、背景基本ビツトマトリツ
クスB_0Bの水平，垂直ラン数の行列をそれぞれ第4B図
（イ），（ロ）に示す。

以上の処理が第４図のステツプ，にて行われる。次
に、着目する基本ビツトマトリツクスのN_HとN_VがN₂以上
であれば、水平と垂直ビットマトリツクスの着目してい
る行列要素を１とする（第４図，，，参照）。
N_HがN₂未満でN_VがN₂以上でかつN_HがN₃を越えれば、B_Hを
１とする（第４図，，参照）。また、N_HがN₂未満
でN_VもN₂未満でかつN_HがN₃を越えれば、B_H＝１とする
（第４図，，，参照）。N_H＜N₂、N_V＜N₂、N_H＞
N_VでかつN_V＞N₃ならば、B_V＝１とする（第４図，，
，，参照）。N_H≧N₂,N_V＜N₂でかつN₃＜N_VならばB
_V＝１とする（第４図，，，参照）。N_H＜N₂、N
_V＜N₂、N_H＝N_V,N₃＜N_Vならば、B_H（i,j）＝B_V（i,j）＝
１とする（（第４図，，，，，参照）。そ
れ以外では、B_HとB_Vの各行列要素はゼロクリヤのままで
ある。

以上の水平ビツトマトリツクスB_Hと垂直ビツトマトリツ
クスB_Vを決める基準値N₂とN₃とは、文字パターンの線幅
から決定する。N₂は線幅以上であるかを調べる値であ
り、N₃はノイズ線などを除去するために用いられる値で
ある。N₂＝5,N₃＝１として、ストローク基本ビツトマト
リツクスに関する水平B_HS,垂直B_VSビツトマトリツクス
を求めた例を第4C図（イ），（ロ）に示す。同様に、背
景基本ビツトマトリツクスに関して求めた水平B_HB,垂直
B_VBビツトマトリツクスを第4D図（イ），（ロ）に示
す。

水平，垂直ビツトマトリツクス（B_H,B_V）を求めた後
に、マスクビツトマトリツクスB_Mを求める。このマスク
ビツトマトリツクスB_Mを求めるために汚れビツトを定義
する。ここでは、臨界ビツトマトリツクスB_CS,B_CBに対
して汚れビツトマトリツクスB_DSC,B_DBCを求める。この
とき、ずらし処理を水平（S_H），垂直（S_V）の各方向に
それぞれ行つて、汚れビツトマトリツクスを求める。こ
のずらし領域の例を第4E図（イ），（ロ）に示す。水平
方向ずらし量S_Hはビツトマトリツクスの第ｉ行をS
_H（ｉ）までずらすことを意味し、垂直方向ずらし量S_V
はビツトマトリツクスの第ｊ列をS_V（ｊ）までずらすこ
とを意味する。臨界ビツトマトリツクスに関する汚れビ
ツトマトリツクスB_DSC,B_DBCを次式で定義する。

第3B図（イ）のストローク臨界ビツトマトリツクスに関
する汚れビツトマトリツクスB_DSCの例を、第4F図（イ）
に示す。第3B図（ロ）の背景臨界ビツトマトリツクスに
関する汚れビツトマトリツクスB_DBCをの例を第4F図
（ロ）に示す。また、これら汚れビツトマトリツクスの
各要素を反転したものがマスクビツトマトリツクス
B_MSC,B_MBCであり、その例を第4G図（イ），（ロ）に示
す。

以上の処理が第４図のステップ，，，で行わ
れ、辞書パターンの作成が完了する。

文字パターンの辞書作成過程をデータの流れで示したの
が、第５図である。

まず、学習対象文字のビツトマトリツクスをN_L回、スロ
ーク成分B_Sと背景成分B_Bとに分けてそれぞれ測定する
（第５図，参照）。N_L回を累積を行つて、ストロー
ク累積マトリツクスC_Sと背景累積マトリツクスC_Bとを求
める（第５図，参照）。各累積マトリツクスから基
本ビツトマトリツクスB_0S,B_0Bと臨界ビツトマトリツク
スB_CS,B_CBを求める（第５図，，，参照）。基
本ビツトマトリツクスB_0S,B_0Bから水平ラン数と垂直ラ
ン数を求めて水平（B_HS,B_HB），垂直（B_VS,B_VB）ビツト
マトリツクスを求める（第５図，参照）。さらに、
臨界ビツトマトリツクスB_CS,B_CBからマスクビツトマト
リツクスB_MS,B_MBを求める（第５図，参照）。そし
て、N_L回学習した文字パターンから文字パターン統計量
を求める（第５図参照）。文字パターン統計量として
は平均幅_C,平均高さ_C,平均面積_C,正規化比_Ｗ×
λ_H,面積重み平均閾値t_A,閾値メデアンt_M等がある。

統計量は次式で求められる。

ここに、W_N×H_Nは正規化サイズ、t_C（ｉ）は２値化しい
き値であ。辞書パターン・データの中には水平，垂直，
マスクビツトマトリツクスと文字パターン統計量があ
り、統計量のパラメータの中には初期２値化しきい値t₀
や面積変化量がδ_A0となるときの臨界しきい値t₁,t₂等
が含まれていて、自動読取での２値化制御用パラメータ
として使用される。

以上の如き学習処理により認識対象となる文字カテゴリ
ーについてそれぞれ辞書パターンを作成し、第１図の辞
書パターンメモリ９に格納する。次に判定開始信号S₁に
より、マイクロプロセツサ６は読取処理を行う。読取処
理フローを第６図に示す。

まず、未知文字画像についてデータ入力を行い（第６図
参照）、セグメント情報を画像メモリ５の入力して連
結性解析を行う（第６図参照）。そして、パターン情
報を得て文字パターンの幅_C,高さ_Ｃをもとにして、
文字パターン切出し行う（第６図参照）。かゝる処理
は各文字パターンごとに行われる。

次いで、文字パターンの正規化処理を行うために、正規
化比率決定を行う（第６図参照）。第6A図に正規化比
率の決定処理フローを示す。

まず、文字パターンの幅W₁（画素）と高さH₁（画素）と
を求める（第6A図参照）。次に、縦長比R₁を次式から
求める（第6A図参照）。

幅，高さの各基準値W₀,H₀に対して、縦長比基準値R₀はH
₀/W₀とする。

文字パターンの場合通常は縦長であるので、縦長比基準
値R₀は1.0〜2.0の値である。次のステツプにて行なわ
れるR₁/R₀＞D₁の判定は、基準の文字パターン枠（W₀×H
₀）に対して、未知文字が縦長か横長であるかを判定す
るものである。縦長比の下限地D₁は、通常は0.8〜1.2の
値である。縦長であれば次のステツプで高さ倍率を求めた後、幅推定を行う（第6A図参照）。幅推定値
W₂＝α_Ｈ・W₀が|W₂−W₁|≦D₂であれば（第6A図参
照）、正規化比率λ_W1,λ_H1を未知文字パターンの幅W₁
と高さH₁からそれぞれ求める（第6A図参照）。もし
も、幅推定値上限値D₂を越える場合には、推定幅W₂と高
さH₁から正規化比率を決める（第6A図参照）。同様
に、未知文字パターンが横長の場合は幅基準値W₀から幅
倍率を求め（第6A図参照）、高さの推定を行う（第6A図
参照）。高さ推定値H₂＝α_WH₁が|H₂−H₁|≦D₃を満たす
場合には（第6A図参照）、W₁とH₁とから正規化比率を
決める一方（第6A図参照）、高さ推定上限値D₃を越え
る場合には、W₁とH₂とから正規化比率を決める（第6A図
参照）。

正規化比率（λ_W1,λ_H1）を決定した後、未知文字パタ
ーンの外接枠の左側と上側を正規化サイズW_N×H_Nのメツ
シユの左側と上側とを合わせて相補的ビツトマトリツク
スB_S,B_Bを求める（第６図参照）。次いで、下記（1
2）式の如く定義されるストローク汚れビツトマトリツ
クスB_DS（i,j）を求め、次の（13）式で表わされるスト
ローク汚れ量D_MSを求める（第６図参照）。

このストローク汚れ量D_MSを全ての文字カテゴリーにつ
いて求め、これらについて分類処理Ｉを行なう（第６図
参照）。

分類処理Ｉのフローを第6B図に示す。これは、全文字カ
テゴリーのD_MSを昇べきの順に並べた後（第6B図参
照）、小さいものから順に設定値D_MS1より小さいか否か
を調べ（第6B図参照）、小さければ第１候補文字とし
て格納する（第6B図参照）。このとき、上限設定値D
_MS1を小さくすれば候補文字数が少なくなり演算時間を
短縮することができる。以上の如き処理が全文字につい
て行われゝば、分類処理Ｉは終了する（第6B図参
照）。

次に、以下の如くしてストローク切れ量が演算され（第
６図参照）。

まず、ストロークの縦切れビツトマトリツクスB_CVSを次
式で求める。

次に、ストローク横切れビツトマトリツクスB_CHSを次式
で求める。

さらに、ストロークの切れビツトマトリツクスB_KSを次
式で求める。

そして、ストロークの切れ量D_CSを次式で定義する。

このストローク切れ量D_CSを全ての文字カテゴリーにつ
いて求め、これについて分類処理IIを行う（第６図参
照）。

分類処理IIの処理フローを第6C図に示す。これは、上記
第１候補文字について、 D_S＝D_MS＋D_CS にて示されるストロークの不一致量を昇べきの順に並べ
た後（第6C図，参照）、この不一致量D_Sがその上限
設定値D_S1以下で（第6C図参照）、かつその数がN_CH1
以下のとき（第6C図参照）、これらを第２候補文字と
してその文字カテゴリーと不一致量とをメモリに格納す
る処理である（第6C図参照）。以上の如き処理が第１
候補文字の全てについて行なわれゝば、分類処理IIは終
了する（第6C図参照）。

以上ではストローク成分の汚れ量，切れ量について説明
したが、背景成分についても上記と同様の演算が次式に
とづいて行なわれる（第６図参照）。

なお、（14）′〜（17）′式にダツシユを付したのは、
これらがそれぞれ（14）〜（17）式に対応する量である
からである。また、以上の如き各種の量またはマトリツ
クスの生成過程を図示すると、第6D図の如くなる。その
結果得られる汚れ量，切れ量は文字読取を行う場合の評
価指数として用いられる。

次に、確認処理が行なわれる（第６図参照）。認識処
理フローチヤートを第6E図に示す。

まず、先に求められた第２候補文字について、背景不一
致量D_B（＝D_MB＋D_CB）と不一致総量D_T（＝D_S＋D_B）とを
求め（第6E図，参照）、次いで不一致総量D_Tが最小
となる文字カテゴリーK₁とそのときの不一致総量D_T1と
を求める（第6E図参照）。このK₁文字を除いたものに
ついて、不一致総量D_Tが最小となる文字カテゴリーK₂と
そのD_T2とを求める（第6E図参照）。その結果、D_T1≦
D_T3でかつ|D_T2−D_T1|≦D_T4とを満足するとき（第6E図
，参照）、未知文字の読取結果はK₁となり（第6E図
参照）、それを満たさないときはリジエクトされる
（第6E図参照）。さらに、文字カテゴリーK₁について
読取回数N_Cと、リジエクトした回数N_Rとをカウントす
る。そして、すべての未知文字について以上の如き認識
処理を行い、その結果を出力信号S₂（第１図参照）とし
て出力する。

最後に、判定内容集計を行う（第６図参照）。判定処
理内容の集計処理フローを第6F図に示す。

すなわち、文字K₁についてD_MS,D_CS,D_S,D_MB,D_CB,D_B,D_Tを
集計する（第6F図参照）。そして、文字K₁について相
補的ビツトマトリツクスの累積を行う（第6F図参
照）。これらの集計データは、学習により作成した辞書
パターンの修正に使用される。つまり、第２図の学習で
示した基本ビツトマトリツクス演算と辞書パターン作成
とを、集計データの累積マトリツクスについても行うこ
とにより、さらに信頼のできる辞書パターンを得ること
が可能となる。このようにして、辞書パターンの修正を
行う。また、リジエクト率などから辞書パターンが正し
く修正されたか否かを評価することができる。

〔発明の効果〕

この発明によれば、文字特徴としてストローク成分と背
景成分との相補的ビツトマトリツクスを抽出するように
したため、ストロークだけのビツトマトリツクスでは失
われるような文字の局所的な部分の差異も抽出すること
ができ、類似文字の誤読が少なくなる。また、文字ごと
に辞書パターンを学習により自動的に作成するだけでな
く、判定時の文字の特徴量や結果を文字カテゴリーごと
に集計するようにしているため、それらを集計した相補
的な累積マトリツクスからさらに実ラインに即応した辞
書パターンを作成することができ、それにより更に漸近
的に認識率の性能を向上させることができる。さらに、
学習時に２値化しきい値を変えることで模擬的に線幅の
バラツキを生じさせて相補的累積マトリツクスを得るよ
うにしているため、辞書パターンは文字パターンの太い
場合と細い場合の両方を包含することになり、より一層
認識率が向上する。

【図面の簡単な説明】

第１図はこの発明の実施例を示す構成図、第1A図は文字
の画像例を示す説明図、第２図は１つの文字の学習処理
を示すフローチヤート、第2A図は相補的ビツトマトリツ
クスを説明するための説明図、第2B図は累積マトリツク
スの例を説明するための説明図、第３図は累積マトリツ
クスから基本ビツトマトリツクスを作成する過程を示す
フローチヤート、第3A図は基本ビツトマトリツクスの例
を説明するための説明図、第3B図は臨界マトリツクスの
例を説明するための説明図、第４図は辞書パターンの作
成過程を示すフローチヤート、第4A図はストローク基本
ビツトマトリツクスの水平，垂直ラン数を説明するため
の説明図、第4B図は背景基本ビツトマトリツクスの水
平，垂直ラン数を説明するための説明図、第4C図はスト
ローク成分の水平，垂直ビツトマトリツクスを説明する
ための説明図、第4D図は背景成分の水平，垂直ビツトマ
トリツクスを説明するための説明図、第4E図は水平，垂
直ビツトマトリツクスのずらし領域を説明するための説
明図、第4F図は臨界マトリツクスに関するストローク汚
れビツトマトリツクスの例を説明するための説明図、第
4G図は臨界マトリツクスに関する背景汚れビツトマトリ
ツクスの例を説明するための説明図、第５図は辞書作成
処理にて生成される各種マトリツクスを示す説明図、第
６図は読取処理を示すフローチヤート、第6A図は正規化
比率の決定処理を示すフローチヤート、第6B図は分類処
理Ｉを示すフローチヤート、第6C図は分類処理IIを示す
フローチヤート、第6D図は評価指数を説明するための説
明図、第6E図は認識処理を示すフローチヤート、第6F図
は集計処理を示すフローチヤートである。符号説明１……対象文字、２……撮像装置（テレビカメラ）、３
……可変２値化回路、４……特徴抽出回路、５……画像
メモリ、６……処理装置（マイクロプロセツサ）、７…
…しきい値発生回路、８……メモリ、９……辞書パター
ンメモリ、10……入出力インタフエイス

Claims

【特許請求の範囲】

【請求項１】学習または認識の対象となる文字パターン
を二次元走査撮像手段により走査して得られるビデオ信
号を所定にしきい値レベルで２値化する２値化手段と、
該２値化された文字パターンをセグメント化してその各
種特徴量を抽出する特徴量抽出手段と、該各種特徴量を
記憶する記憶手段と、該各種特徴量に基づき所定の演
算，処理を行う演算処理手段とを備え、該演算処理手段により、標準の各文字パターンについて、文字パターンを複数の
線分でメッシュ状に要素に分割し、要素内に黒画素があ
ればその画素を“1"としたストローク成分のビットマト
リックスと、要素内に白画素があればその要素を“1"と
した背景成分のビットマトリックスとをそれぞれ取り出
す処理を２値化レベルを順次変更して各２値化レベル毎
に行い、その都度得られるビットマトリックスのストロ
ーク成分と背景成分とを各成分毎に累積し、累積値が所
定値以上となる要素を“1"とし基本ビットマトリックス
と、累積値が１以上となる要素を“1"とした臨界ビット
マトリックスとを各成分毎に求め、該各成分毎の基本ビットマトリックスについて、行，列
方向に連なる値“1"の要素数である水平ラン数，垂直ラ
ン数を設定値と比較し、その比較結果に基づいてその要
素を“1"とする処理を行って水平マトリックス，垂直マ
トリックスを求め、前記臨界ビットマトリックスを水平，垂直方向にずらし
処理を行ったのち反転してマスクビットマトリックスを
求め、前記水平，垂直およびマスクビットマトリックスを文字
カテゴリー別に辞書パターンとして所定のメモリに前も
って格納する処理を行ない、未知の文字パターンを複数の線分でメッシュ状の要素に
分割し、要素内に黒画素があればその要素を“1"とした
スローク成分のビットマトリックスと、要素内に白画素
があればその要素を“1"とした背景成分のビットマトリ
ックスとをそれぞれ取り出し、しかる後、未知パターンのストローク成分，背景成分ビ
ットマトリックスのそれぞれについて、辞書パターンの
各成分別水平，垂直マトリックスとの論理積演算を行う
ことにより辞書パターンに対する切れ量を求めるととも
に、辞書パターンの各成分別水平，垂直マトリックス及
びマスクビットマトリックスとの間で論理積演算を行う
ことにより辞書パターン対する汚れ量を求め、ストロー
ク成分と背景成分についてそれぞれ切れ量との分から不
一致総量を求め、この不一致総量を予め設定された判定
値と比較し、この比較結果に基づいて未知文字パターン
を認識することを特徴とする文字読取方式。
【請求項２】特許請求の範囲第１項に記載の文字読取方
式において、前記未知文字パターンに関する処理データを文字カテゴ
リー別に集計し、該集計結果をもとに新たな辞書パター
ンを演算することにより、学習済みの辞書パターンの補
正を行うことを特徴とする文字読取方式。