JPH0715703B2 - 文字読取方式 - Google Patents

文字読取方式

Info

Publication number
JPH0715703B2
JPH0715703B2 JP61110682A JP11068286A JPH0715703B2 JP H0715703 B2 JPH0715703 B2 JP H0715703B2 JP 61110682 A JP61110682 A JP 61110682A JP 11068286 A JP11068286 A JP 11068286A JP H0715703 B2 JPH0715703 B2 JP H0715703B2
Authority
JP
Japan
Prior art keywords
character
pattern
component
bit matrix
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61110682A
Other languages
English (en)
Other versions
JPS62267889A (ja
Inventor
保夫 本郷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuji Electric Co Ltd
Original Assignee
Fuji Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Electric Co Ltd filed Critical Fuji Electric Co Ltd
Priority to JP61110682A priority Critical patent/JPH0715703B2/ja
Publication of JPS62267889A publication Critical patent/JPS62267889A/ja
Priority to US07/310,488 priority patent/US4887303A/en
Publication of JPH0715703B2 publication Critical patent/JPH0715703B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/28Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は、読取対象である文字,図形をテレビカメラ
などの光電変換素子を介して入力し、その特徴を学習し
て文字別の辞書パターンを自動的に作成し、この辞書を
用いて未知文字の読取りを行なう文字読取方式に関す
る。
〔従来の技術〕
この種の読取方式として、例えばビツトマトリツクスを
用いるものが知られている。
これは、未知パターンを所定大きさの外接四角形により
切り出してこの四角形を複数のメツシユに分割し、各メ
ツシユ内に文字パターンが存在するか否かに応じて2値
化することにより、未知文字を“1",“0"パターンから
なるビツトマトリツクスで表現する一方、標準パターン
についても種々の許容量を加味したビツトマトリツクス
で表現し、両ビツトマトリツクスの間で種々の演算をし
てその一致度を調べ、これにより文字読取を行うもので
ある。
〔発明が解決しようとする問題点〕
しかしながら、かゝる方式には以下の如き問題点があ
る。
(1) 文字パターンに着目して求めたビツトマトリツ
クスを用いているため、例えば「6」と「5」のように
類似した文字の読取りを誤ることがある。
(2) 辞書パターンの登録を人手で行つているため、
文字の登録が面倒であつた。
(3) 文字パターンの特徴であるビツトマトリツクス
を実ラインで集計していため、辞書パターンと実ライン
での文字パターンとの違いが検出できず、その結果辞書
パターンを補正することができない。
したがつて、この発明は文字の誤読が少なく、かつ辞書
文字登録とその修正が容易な文字読取方式を提供するこ
とを目的とする。
〔問題点を解決するための手段〕
文字のストロークだけでなく背景に対応するビツトマト
リツクスを特徴量として抽出することで類似な文字の誤
読を少なくし、文字ごとの辞書パターンを学習により自
動的に作成することで文字登録を簡単にし、さらに実ラ
インでの相補的ビツトマトリツクスを集計して辞書パタ
ーンを補正可能とすることで学習時と実ラインでの判定
時におけるパターンの差違を検出し、総合的判定性能を
向上させる。
〔作用〕
この発明では、ビツトマトリツクスの定義を拡張して、
従来のストローク成分だけでなく背景成分に対応するも
のも特徴量として使用する。一般に、ビツトマトリツク
スは正規化されるため、元のサイズより小さくなる場合
には拡大の効果がある。その結果、類似の文字(例えば
5と6)の識別力が劣化する。これを防ぐために相補的
ビツトマトリツクスを抽出してストロークの拡大に対し
背景の拡大を行うことで、文字パターンの差違を失わな
い特徴を抽出しようとするものである。
また、読取対象となる文字パターンについて相補的ビツ
トマトリツクスを測定して累積マトリツクスを求め、そ
れをもとに辞書パターンを自動的に作成する。この累積
マトリツクスを求めるに当たつては、2値化しいき値を
面積変化量の許容範囲内で変化させて、模擬的な文字パ
ターンのバラツキを計測するようにしている。辞書パタ
ーンをもとに未知文字パターンを読取る際には、分類処
理などにより候補文字カテゴリーを段階的に削減し、演
算時間を短縮するようにしている。
さらに、認識結果をもとに各カテゴリーごとに相補的ビ
ツトマトリツクスを集計し、集計した累積マトリツクス
をもとに再度辞書パターンを計算することで、辞書パタ
ーンの補正を行うようにしている。また、その他の距離
なども集計しているので、学習時と読取時でのパターン
の違いを定量的に評価することができる。
〔実施例〕
第1図はこの発明の実施例を示す構成図である。同図に
おいて、1は対象文字、2はテレビカメラの如き撮像装
置、3は可変2値化回路、4は特徴抽出回路、5は画像
メモリ、6はマイクロプロセツサの如き処理装置、7は
しきい値発生回路、8はメモリ、9は辞書パターンメモ
リ、10は入出力インタフイエイスである。
テレビカメラ2は、刻印文字などの対象文字1を撮像す
る。テレビカメラ2からの電気信号は可変2値化回路3
にて2値化されて、2値画像信号になる。2値画像のセ
グメント情報が特徴抽出回路4にて抽出され、DMAモー
ドにて画像メモリ5に書き込まれる。ここで、セグメン
トとは水平走査線上での各画素のランのことであり、セ
グメント情報としてはセグメント長、セグメント右端座
標値、主境界長、副境界長、連結情報等があり、これら
が画像メモリ5に書き込まれる。マイクロプロセツサ6
はシステムバスBSにつながつている画像メモリ5をアク
セスすることができ、それにより連結性解析や文字読取
処理を行う。マイクロプロセツサ6は入出力インタフエ
イス10を介して外部からの指令により画像を入力した
り、学習,読取り,集計,補正などの各処理を行う。ま
た、画像入力の際にしきい値発生回路7を通じて、可変
2値化しきい値THを可変2値化回路3へ指定するとがで
きる。マイクロプロセツサ6はこのように2値化しきい
値を変更しながら画像データを読み込み、辞書パターン
を作成して辞書パターン用メモリ9に記憶する。メモリ
8は、もろもろの処理に使用する一時記憶として使用さ
れる。文字パターンの認識時には、判定開始信号S1によ
り画像を入力し、読取り後読取結果出力信号S2として外
部へ出力する。なお、2値化しきい値THは入出力インタ
ーウエースを通じて外部から与えられる場合と、面積ヒ
ストグラムから自動的に決定される場合とがある。
第1A図に、第1図のテレビカメラ2で撮像した文字の2
値画像の例を示す。文字パターンは有効画面P内にあ
り、直行座標形X,Yにより各パターンの画素(黒画素)P
Cの座標が表現され、これらパターン画素PCの集合とし
てパターンが表現される。また文字パターンの背景は背
景画素(白画素)PBとして表わされる。文字パターンは
ストローク成分である黒画素と、背景である白画素とで
相補的に記述できる。
マイクロプロセツサ6が標準文字パターンから辞書パタ
ーンを作成する学習処理フローを、第2図に示す。2値
化しきい値をしきい値発生回路7に設定して(第2図
参照)、学習対象の文字パターンの画素データを取込む
(第2図参照)。次いで連結性を解析し(第2図参
照)、セグメントにラベル付けを行う。これにより連結
しているセグメントには、同一番号がラベルとして付け
られる。この同一ラベルのセグメント集合を単にパター
ンと呼び、各パターンに関する外接枠座標値(YT,YB,
XL,XR)や面積(AC)、周囲長(LB)などを求める。次
に、文字パターンの幅(WC),高さ(HC)により、文字
パターンを切り出す(第2図参照)。文字パターンの
面積(AC)は、文字パターンに属するパターンの面積の
総和として表わされる。指定された文字の最初の画像取
込み時の文字パターンの面積をAC0とすると、n回目の
文字パターンの面積ACnの変化量δAnは次式で表わされ
る。
面積変化量(δAn)が上限値(δAU)より小さければ文
字パターンの相補的ビツトマトリツクスを求め、そうで
なければ2値化しきい値を設定し直して再度、画像取込
みから処理を行う(第2図参照)。
第2A図に、相補的ビツトマトリツクスBS,BBの作成例を
示す。文字パターンPAは、例えば幅WC=25画素,高さHC
=35画素であるが、その正規化サイズW×Hを10×14に
した場合の例を示すのが同図である。メツシユ内に黒画
素があれば値を1、黒画素がなげれば値を0とする。こ
のようにして作成した2値行列をストロークビツトマト
リツクスBSと呼ぶ。第2A図(ロ)に、同(イ)に対応す
るストロークビツトマトリツクスBSを示す。これに対し
て、メツシユ内に白画素があれば値を1とし、なければ
0として作成した2値行列を背景ビツトマトリツクスBB
と呼ぶ。第2A図(ハ)に、同(イ)に対応する背景ビツ
トマトリツクスBBを示す。図から分るように、正規化サ
イズ(10×14)が元の文字パターンのサイズ(25×35)
より小さい場合には、正規化処理により見掛け上ストロ
ークビツトマトリツクスでは黒画素を拡大し、背景ビツ
トマトリツクスでは白画素を拡大することになる。スト
ロークビツトマトリツクスBSと背景ビツトマトリツクス
BBとを合わせて相補的ビツトマトリツクスと呼ぶが、こ
れを求めるのが第2図のステツプである。
この相補的ビツトマトリツクスは2値行列であり、スト
ローク成分(BS(i,j))と背景成分(BB(i,j))につ
いて、各行列要素を累積してそれぞれストローク累積マ
トリツクスCSと背景累積マトリツクスCBとを求める(第
2図参照)。そのためには複数回の学習が必要である
が、この学習回数NLを10回とした場合の累積マトリツク
スの例を第2B付(イ),(ロ)にそれぞれ示す。
これらの文字パターンの相補的累積マトリツクスから基
本ビツトマトリツクスB0を第3図の処理手順に従つて求
める。ここでは、基本ビツトマトリツクスB0のビツト
(RB)を、 の如く定義し、基本ビツトマトリツクスのビツト率
(RB)がR1以下となるように、2値行列へ変換する基準
値N1を一定値から1ずつ増やしていつて、最初にR1以下
となるビツトマトリツクスを基本ビツトマトリツクスと
している。従つて、同一の累積マトリツクスでもR1とN1
の値を変えれば基本ビツトマトリツクスも変わることに
なる。文字パターンによつて本当のビツト率は異なるの
で、全文字に対するビツト率の上限値としてR1の値を決
める。また、基準値N1は学習の際の2値化しきい値の変
動による文字線幅の変動を模擬しようとするものであ
る。
第2B図(イ)に示すストローク累積マトリツクスCS
ら、N1=5,R1=0.8として求めた基本ビツトマトリツク
スB0Sの例を第3A図(イ)に示す。また、第2B図(ロ)
に示す背景成分CBについて、N1=7,R1=0.8として求め
た基本ビツトマトリツクスB0Bの例を第3A図(ロ)に示
す。時に、N1=1,R1=1.0として求めたビツトマトリツ
クスは最大ビツト率の基本ビツトマトリツクスであるの
で、これを臨界ビツトマトリツクスと呼ぶ。臨界ビツト
マトリツクスBCS,BCBを第3B図(イ),(ロ)にそれぞ
れ示す。
基本ビツトマトリツクス(B0S,B0B)と臨界ビツトマト
リツクス(BCS,BCB)から、辞書パターンを求める処理
手順を第4図に示す。
まず、基本ビツトマトリツクスから各行列要素の水平ラ
ン数(NH)を求める。水平ラン数NHは着目する行列要素
(B0S(i,j)またはB0B(i,j))の行方向に連なる値1
の要素数である。もし、着目する要素の値が0であれば
連なりはないので、水平ラン数NHはゼロとなる。同様
に、垂直ラン数(NV)は列方向に連なる値1の要素数で
ある。ストローク基本ビツトマトリツクスB0Sの水平ラ
ン数NHの行列と垂直ラン数NVの行列とをそれぞれ第4A図
(イ),(ロ)に示す。また、背景基本ビツトマトリツ
クスB0Bの水平,垂直ラン数の行列をそれぞれ第4B図
(イ),(ロ)に示す。
以上の処理が第4図のステツプ,にて行われる。次
に、着目する基本ビツトマトリツクスのNHとNVがN2以上
であれば、水平と垂直ビットマトリツクスの着目してい
る行列要素を1とする(第4図,,,参照)。
NHがN2未満でNVがN2以上でかつNHがN3を越えれば、BH
1とする(第4図,,参照)。また、NHがN2未満
でNVもN2未満でかつNHがN3を越えれば、BH=1とする
(第4図,,,参照)。NH<N2、NV<N2、NH
NVでかつNV>N3ならば、BV=1とする(第4図,,
,,参照)。NH≧N2,NV<N2でかつN3<NVならばB
V=1とする(第4図,,,参照)。NH<N2、N
V<N2、NH=NV,N3<NVならば、BH(i,j)=BV(i,j)=
1とする((第4図,,,,,参照)。そ
れ以外では、BHとBVの各行列要素はゼロクリヤのままで
ある。
以上の水平ビツトマトリツクスBHと垂直ビツトマトリツ
クスBVを決める基準値N2とN3とは、文字パターンの線幅
から決定する。N2は線幅以上であるかを調べる値であ
り、N3はノイズ線などを除去するために用いられる値で
ある。N2=5,N3=1として、ストローク基本ビツトマト
リツクスに関する水平BHS,垂直BVSビツトマトリツクス
を求めた例を第4C図(イ),(ロ)に示す。同様に、背
景基本ビツトマトリツクスに関して求めた水平BHB,垂直
BVBビツトマトリツクスを第4D図(イ),(ロ)に示
す。
水平,垂直ビツトマトリツクス(BH,BV)を求めた後
に、マスクビツトマトリツクスBMを求める。このマスク
ビツトマトリツクスBMを求めるために汚れビツトを定義
する。ここでは、臨界ビツトマトリツクスBCS,BCBに対
して汚れビツトマトリツクスBDSC,BDBCを求める。この
とき、ずらし処理を水平(SH),垂直(SV)の各方向に
それぞれ行つて、汚れビツトマトリツクスを求める。こ
のずらし領域の例を第4E図(イ),(ロ)に示す。水平
方向ずらし量SHはビツトマトリツクスの第i行をS
H(i)までずらすことを意味し、垂直方向ずらし量SV
はビツトマトリツクスの第j列をSV(j)までずらすこ
とを意味する。臨界ビツトマトリツクスに関する汚れビ
ツトマトリツクスBDSC,BDBCを次式で定義する。
第3B図(イ)のストローク臨界ビツトマトリツクスに関
する汚れビツトマトリツクスBDSCの例を、第4F図(イ)
に示す。第3B図(ロ)の背景臨界ビツトマトリツクスに
関する汚れビツトマトリツクスBDBCをの例を第4F図
(ロ)に示す。また、これら汚れビツトマトリツクスの
各要素を反転したものがマスクビツトマトリツクス
BMSC,BMBCであり、その例を第4G図(イ),(ロ)に示
す。
以上の処理が第4図のステップ,,,で行わ
れ、辞書パターンの作成が完了する。
文字パターンの辞書作成過程をデータの流れで示したの
が、第5図である。
まず、学習対象文字のビツトマトリツクスをNL回、スロ
ーク成分BSと背景成分BBとに分けてそれぞれ測定する
(第5図,参照)。NL回を累積を行つて、ストロー
ク累積マトリツクスCSと背景累積マトリツクスCBとを求
める(第5図,参照)。各累積マトリツクスから基
本ビツトマトリツクスB0S,B0Bと臨界ビツトマトリツク
スBCS,BCBを求める(第5図,,,参照)。基
本ビツトマトリツクスB0S,B0Bから水平ラン数と垂直ラ
ン数を求めて水平(BHS,BHB),垂直(BVS,BVB)ビツト
マトリツクスを求める(第5図,参照)。さらに、
臨界ビツトマトリツクスBCS,BCBからマスクビツトマト
リツクスBMS,BMBを求める(第5図,参照)。そし
て、NL回学習した文字パターンから文字パターン統計量
を求める(第5図参照)。文字パターン統計量として
は平均幅C,平均高さC,平均面積C,正規化比×
λH,面積重み平均閾値tA,閾値メデアンtM等がある。
統計量は次式で求められる。
ここに、WN×HNは正規化サイズ、tC(i)は2値化しい
き値であ。辞書パターン・データの中には水平,垂直,
マスクビツトマトリツクスと文字パターン統計量があ
り、統計量のパラメータの中には初期2値化しきい値t0
や面積変化量がδA0となるときの臨界しきい値t1,t2
が含まれていて、自動読取での2値化制御用パラメータ
として使用される。
以上の如き学習処理により認識対象となる文字カテゴリ
ーについてそれぞれ辞書パターンを作成し、第1図の辞
書パターンメモリ9に格納する。次に判定開始信号S1
より、マイクロプロセツサ6は読取処理を行う。読取処
理フローを第6図に示す。
まず、未知文字画像についてデータ入力を行い(第6図
参照)、セグメント情報を画像メモリ5の入力して連
結性解析を行う(第6図参照)。そして、パターン情
報を得て文字パターンの幅C,高さをもとにして、
文字パターン切出し行う(第6図参照)。かゝる処理
は各文字パターンごとに行われる。
次いで、文字パターンの正規化処理を行うために、正規
化比率決定を行う(第6図参照)。第6A図に正規化比
率の決定処理フローを示す。
まず、文字パターンの幅W1(画素)と高さH1(画素)と
を求める(第6A図参照)。次に、縦長比R1を次式から
求める(第6A図参照)。
幅,高さの各基準値W0,H0に対して、縦長比基準値R0はH
0/W0とする。
文字パターンの場合通常は縦長であるので、縦長比基準
値R0は1.0〜2.0の値である。次のステツプにて行なわ
れるR1/R0>D1の判定は、基準の文字パターン枠(W0×H
0)に対して、未知文字が縦長か横長であるかを判定す
るものである。縦長比の下限地D1は、通常は0.8〜1.2の
値である。縦長であれば次のステツプで高さ倍率 を求めた後、幅推定を行う(第6A図参照)。幅推定値
W2=α・W0が|W2−W1|≦D2であれば(第6A図参
照)、正規化比率λW1H1を未知文字パターンの幅W1
と高さH1からそれぞれ求める(第6A図参照)。もし
も、幅推定値上限値D2を越える場合には、推定幅W2と高
さH1から正規化比率を決める(第6A図参照)。同様
に、未知文字パターンが横長の場合は幅基準値W0から幅
倍率 を求め(第6A図参照)、高さの推定を行う(第6A図
参照)。高さ推定値H2=αWH1が|H2−H1|≦D3を満たす
場合には(第6A図参照)、W1とH1とから正規化比率を
決める一方(第6A図参照)、高さ推定上限値D3を越え
る場合には、W1とH2とから正規化比率を決める(第6A図
参照)。
正規化比率(λW1H1)を決定した後、未知文字パタ
ーンの外接枠の左側と上側を正規化サイズWN×HNのメツ
シユの左側と上側とを合わせて相補的ビツトマトリツク
スBS,BBを求める(第6図参照)。次いで、下記(1
2)式の如く定義されるストローク汚れビツトマトリツ
クスBDS(i,j)を求め、次の(13)式で表わされるスト
ローク汚れ量DMSを求める(第6図参照)。
このストローク汚れ量DMSを全ての文字カテゴリーにつ
いて求め、これらについて分類処理Iを行なう(第6図
参照)。
分類処理Iのフローを第6B図に示す。これは、全文字カ
テゴリーのDMSを昇べきの順に並べた後(第6B図参
照)、小さいものから順に設定値DMS1より小さいか否か
を調べ(第6B図参照)、小さければ第1候補文字とし
て格納する(第6B図参照)。このとき、上限設定値D
MS1を小さくすれば候補文字数が少なくなり演算時間を
短縮することができる。以上の如き処理が全文字につい
て行われゝば、分類処理Iは終了する(第6B図参
照)。
次に、以下の如くしてストローク切れ量が演算され(第
6図参照)。
まず、ストロークの縦切れビツトマトリツクスBCVSを次
式で求める。
次に、ストローク横切れビツトマトリツクスBCHSを次式
で求める。
さらに、ストロークの切れビツトマトリツクスBKSを次
式で求める。
そして、ストロークの切れ量DCSを次式で定義する。
このストローク切れ量DCSを全ての文字カテゴリーにつ
いて求め、これについて分類処理IIを行う(第6図参
照)。
分類処理IIの処理フローを第6C図に示す。これは、上記
第1候補文字について、 DS=DMS+DCS にて示されるストロークの不一致量を昇べきの順に並べ
た後(第6C図,参照)、この不一致量DSがその上限
設定値DS1以下で(第6C図参照)、かつその数がNCH1
以下のとき(第6C図参照)、これらを第2候補文字と
してその文字カテゴリーと不一致量とをメモリに格納す
る処理である(第6C図参照)。以上の如き処理が第1
候補文字の全てについて行なわれゝば、分類処理IIは終
了する(第6C図参照)。
以上ではストローク成分の汚れ量,切れ量について説明
したが、背景成分についても上記と同様の演算が次式に
とづいて行なわれる(第6図参照)。
なお、(14)′〜(17)′式にダツシユを付したのは、
これらがそれぞれ(14)〜(17)式に対応する量である
からである。また、以上の如き各種の量またはマトリツ
クスの生成過程を図示すると、第6D図の如くなる。その
結果得られる汚れ量,切れ量は文字読取を行う場合の評
価指数として用いられる。
次に、確認処理が行なわれる(第6図参照)。認識処
理フローチヤートを第6E図に示す。
まず、先に求められた第2候補文字について、背景不一
致量DB(=DMB+DCB)と不一致総量DT(=DS+DB)とを
求め(第6E図,参照)、次いで不一致総量DTが最小
となる文字カテゴリーK1とそのときの不一致総量DT1
を求める(第6E図参照)。このK1文字を除いたものに
ついて、不一致総量DTが最小となる文字カテゴリーK2
そのDT2とを求める(第6E図参照)。その結果、DT1
DT3でかつ|DT2−DT1|≦DT4とを満足するとき(第6E図
,参照)、未知文字の読取結果はK1となり(第6E図
参照)、それを満たさないときはリジエクトされる
(第6E図参照)。さらに、文字カテゴリーK1について
読取回数NCと、リジエクトした回数NRとをカウントす
る。そして、すべての未知文字について以上の如き認識
処理を行い、その結果を出力信号S2(第1図参照)とし
て出力する。
最後に、判定内容集計を行う(第6図参照)。判定処
理内容の集計処理フローを第6F図に示す。
すなわち、文字K1についてDMS,DCS,DS,DMB,DCB,DB,DT
集計する(第6F図参照)。そして、文字K1について相
補的ビツトマトリツクスの累積を行う(第6F図参
照)。これらの集計データは、学習により作成した辞書
パターンの修正に使用される。つまり、第2図の学習で
示した基本ビツトマトリツクス演算と辞書パターン作成
とを、集計データの累積マトリツクスについても行うこ
とにより、さらに信頼のできる辞書パターンを得ること
が可能となる。このようにして、辞書パターンの修正を
行う。また、リジエクト率などから辞書パターンが正し
く修正されたか否かを評価することができる。
〔発明の効果〕
この発明によれば、文字特徴としてストローク成分と背
景成分との相補的ビツトマトリツクスを抽出するように
したため、ストロークだけのビツトマトリツクスでは失
われるような文字の局所的な部分の差異も抽出すること
ができ、類似文字の誤読が少なくなる。また、文字ごと
に辞書パターンを学習により自動的に作成するだけでな
く、判定時の文字の特徴量や結果を文字カテゴリーごと
に集計するようにしているため、それらを集計した相補
的な累積マトリツクスからさらに実ラインに即応した辞
書パターンを作成することができ、それにより更に漸近
的に認識率の性能を向上させることができる。さらに、
学習時に2値化しきい値を変えることで模擬的に線幅の
バラツキを生じさせて相補的累積マトリツクスを得るよ
うにしているため、辞書パターンは文字パターンの太い
場合と細い場合の両方を包含することになり、より一層
認識率が向上する。
【図面の簡単な説明】
第1図はこの発明の実施例を示す構成図、第1A図は文字
の画像例を示す説明図、第2図は1つの文字の学習処理
を示すフローチヤート、第2A図は相補的ビツトマトリツ
クスを説明するための説明図、第2B図は累積マトリツク
スの例を説明するための説明図、第3図は累積マトリツ
クスから基本ビツトマトリツクスを作成する過程を示す
フローチヤート、第3A図は基本ビツトマトリツクスの例
を説明するための説明図、第3B図は臨界マトリツクスの
例を説明するための説明図、第4図は辞書パターンの作
成過程を示すフローチヤート、第4A図はストローク基本
ビツトマトリツクスの水平,垂直ラン数を説明するため
の説明図、第4B図は背景基本ビツトマトリツクスの水
平,垂直ラン数を説明するための説明図、第4C図はスト
ローク成分の水平,垂直ビツトマトリツクスを説明する
ための説明図、第4D図は背景成分の水平,垂直ビツトマ
トリツクスを説明するための説明図、第4E図は水平,垂
直ビツトマトリツクスのずらし領域を説明するための説
明図、第4F図は臨界マトリツクスに関するストローク汚
れビツトマトリツクスの例を説明するための説明図、第
4G図は臨界マトリツクスに関する背景汚れビツトマトリ
ツクスの例を説明するための説明図、第5図は辞書作成
処理にて生成される各種マトリツクスを示す説明図、第
6図は読取処理を示すフローチヤート、第6A図は正規化
比率の決定処理を示すフローチヤート、第6B図は分類処
理Iを示すフローチヤート、第6C図は分類処理IIを示す
フローチヤート、第6D図は評価指数を説明するための説
明図、第6E図は認識処理を示すフローチヤート、第6F図
は集計処理を示すフローチヤートである。 符号説明 1……対象文字、2……撮像装置(テレビカメラ)、3
……可変2値化回路、4……特徴抽出回路、5……画像
メモリ、6……処理装置(マイクロプロセツサ)、7…
…しきい値発生回路、8……メモリ、9……辞書パター
ンメモリ、10……入出力インタフエイス

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】学習または認識の対象となる文字パターン
    を二次元走査撮像手段により走査して得られるビデオ信
    号を所定にしきい値レベルで2値化する2値化手段と、
    該2値化された文字パターンをセグメント化してその各
    種特徴量を抽出する特徴量抽出手段と、該各種特徴量を
    記憶する記憶手段と、該各種特徴量に基づき所定の演
    算,処理を行う演算処理手段とを備え、 該演算処理手段により、 標準の各文字パターンについて、文字パターンを複数の
    線分でメッシュ状に要素に分割し、要素内に黒画素があ
    ればその画素を“1"としたストローク成分のビットマト
    リックスと、要素内に白画素があればその要素を“1"と
    した背景成分のビットマトリックスとをそれぞれ取り出
    す処理を2値化レベルを順次変更して各2値化レベル毎
    に行い、その都度得られるビットマトリックスのストロ
    ーク成分と背景成分とを各成分毎に累積し、累積値が所
    定値以上となる要素を“1"とし基本ビットマトリックス
    と、累積値が1以上となる要素を“1"とした臨界ビット
    マトリックスとを各成分毎に求め、 該各成分毎の基本ビットマトリックスについて、行,列
    方向に連なる値“1"の要素数である水平ラン数,垂直ラ
    ン数を設定値と比較し、その比較結果に基づいてその要
    素を“1"とする処理を行って水平マトリックス,垂直マ
    トリックスを求め、 前記臨界ビットマトリックスを水平,垂直方向にずらし
    処理を行ったのち反転してマスクビットマトリックスを
    求め、 前記水平,垂直およびマスクビットマトリックスを文字
    カテゴリー別に辞書パターンとして所定のメモリに前も
    って格納する処理を行ない、 未知の文字パターンを複数の線分でメッシュ状の要素に
    分割し、要素内に黒画素があればその要素を“1"とした
    スローク成分のビットマトリックスと、要素内に白画素
    があればその要素を“1"とした背景成分のビットマトリ
    ックスとをそれぞれ取り出し、 しかる後、未知パターンのストローク成分,背景成分ビ
    ットマトリックスのそれぞれについて、辞書パターンの
    各成分別水平,垂直マトリックスとの論理積演算を行う
    ことにより辞書パターンに対する切れ量を求めるととも
    に、辞書パターンの各成分別水平,垂直マトリックス及
    びマスクビットマトリックスとの間で論理積演算を行う
    ことにより辞書パターン対する汚れ量を求め、ストロー
    ク成分と背景成分についてそれぞれ切れ量との分から不
    一致総量を求め、この不一致総量を予め設定された判定
    値と比較し、この比較結果に基づいて未知文字パターン
    を認識することを特徴とする文字読取方式。
  2. 【請求項2】特許請求の範囲第1項に記載の文字読取方
    式において、 前記未知文字パターンに関する処理データを文字カテゴ
    リー別に集計し、該集計結果をもとに新たな辞書パター
    ンを演算することにより、学習済みの辞書パターンの補
    正を行うことを特徴とする文字読取方式。
JP61110682A 1986-05-16 1986-05-16 文字読取方式 Expired - Lifetime JPH0715703B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP61110682A JPH0715703B2 (ja) 1986-05-16 1986-05-16 文字読取方式
US07/310,488 US4887303A (en) 1986-05-16 1989-02-14 Character reading method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61110682A JPH0715703B2 (ja) 1986-05-16 1986-05-16 文字読取方式

Publications (2)

Publication Number Publication Date
JPS62267889A JPS62267889A (ja) 1987-11-20
JPH0715703B2 true JPH0715703B2 (ja) 1995-02-22

Family

ID=14541777

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61110682A Expired - Lifetime JPH0715703B2 (ja) 1986-05-16 1986-05-16 文字読取方式

Country Status (2)

Country Link
US (1) US4887303A (ja)
JP (1) JPH0715703B2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0381773B1 (en) * 1988-07-20 1998-06-10 Fujitsu Limited Character recognition apparatus
US5625710A (en) * 1988-07-20 1997-04-29 Fujitsu Limited Character recognition apparatus using modification of a characteristic quantity
US5214719A (en) * 1989-02-28 1993-05-25 Phoenix Imaging Computer-based system and method for character recognition
US5144683A (en) * 1989-04-28 1992-09-01 Hitachi, Ltd. Character recognition equipment
JP2552728B2 (ja) * 1989-05-31 1996-11-13 富士通株式会社 赤外線監視システム
US5125039A (en) * 1989-06-16 1992-06-23 Hawkins Jeffrey C Object recognition system
US5216725A (en) * 1990-10-31 1993-06-01 Environmental Research Institute Of Michigan Apparatus and method for separating handwritten characters by line and word
US5142589A (en) * 1990-12-21 1992-08-25 Environmental Research Institute Of Michigan Method for repairing images for optical character recognition performing different repair operations based on measured image characteristics
US5272766A (en) * 1991-01-14 1993-12-21 Ncr Corporation OCR system for recognizing user-specified custom fonts in addition to standard fonts using three-layer templates
JPH0772906B2 (ja) * 1991-07-10 1995-08-02 富士ゼロックス株式会社 文書認識装置
DE69315990T2 (de) * 1993-07-01 1998-07-02 Ibm Mustererkennung durch Erzeugung und Benutzung zonenweiser Merkmale und Anti-Merkmale
GB2281997B (en) * 1993-09-20 1997-10-15 Ricoh Kk Method and apparatus for improving a text image by using character regeneration
CN104317418A (zh) * 2014-10-17 2015-01-28 郭世忠 不知发音汉字拼音输入法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4308523A (en) * 1980-02-04 1981-12-29 Compuscan, Incorporated Apparatus and method for character recognition
JPS59790A (ja) * 1982-06-28 1984-01-05 Fuji Electric Co Ltd パタ−ン識別装置
JPS59136874A (ja) * 1983-01-26 1984-08-06 Fuji Electric Co Ltd パタ−ン識別装置
JPS6033675A (ja) * 1983-08-04 1985-02-21 Fuji Electric Co Ltd 文字読取装置

Also Published As

Publication number Publication date
JPS62267889A (ja) 1987-11-20
US4887303A (en) 1989-12-12

Similar Documents

Publication Publication Date Title
CN110807496B (zh) 一种密集目标检测方法
CN107590447A (zh) 一种文字标题识别方法及装置
JPH0715703B2 (ja) 文字読取方式
CN110598566A (zh) 图像处理方法、装置、终端和计算机可读存储介质
JP2903923B2 (ja) 車番認識装置
JPH0436433B2 (ja)
CN115880683B (zh) 一种基于深度学习的城市内涝积水智能水位检测方法
JPH0256708B2 (ja)
CN113569859B (zh) 一种图像处理方法、装置、电子设备及存储介质
CN109902751B (zh) 融合卷积神经网络和半字模板匹配的表盘数字字符识别法
JPH0256707B2 (ja)
CN116645325A (zh) 光伏板的缺陷标注方法、装置、介质及电子设备
CN111047614A (zh) 一种基于特征提取的复杂场景图像的目标角点提取方法
CN112308061B (zh) 一种车牌字符识别方法及装置
CN114926829A (zh) 一种证件检测方法、装置、电子设备及存储介质
JP2001126192A (ja) 駐車場の駐車スペースの駐/空車判定方法
CN112597934A (zh) 图像目标检测在打包机面积计算中的应用
JP2004094427A (ja) 帳票画像処理装置及び該装置を実現するためのプログラム
CN110598697A (zh) 一种基于粗细字符定位的集装箱箱号定位方法
CN118552571B (zh) 针对蓝藻图像的分割方法、识别方法、介质和设备
CN115965622B (zh) 一种遥感瓦片数据的变化检测方法和装置
CN114550289B (zh) 一种行为识别方法、系统及电子设备
JP3275475B2 (ja) 文字配列が既知の対象文字列の認識装置
CN114092872A (zh) 一种流浪狗检测方法
CN117496454A (zh) 基于图像识别的斑马线检测方法及系统