JPS5843071A - 文字認識方式 - Google Patents
文字認識方式Info
- Publication number
- JPS5843071A JPS5843071A JP56140337A JP14033781A JPS5843071A JP S5843071 A JPS5843071 A JP S5843071A JP 56140337 A JP56140337 A JP 56140337A JP 14033781 A JP14033781 A JP 14033781A JP S5843071 A JPS5843071 A JP S5843071A
- Authority
- JP
- Japan
- Prior art keywords
- character
- pattern
- circuit
- normalized
- supplied
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000005070 sampling Methods 0.000 claims abstract description 36
- 238000000034 method Methods 0.000 claims description 4
- 238000009941 weaving Methods 0.000 claims description 2
- 238000010606 normalization Methods 0.000 description 26
- 238000010586 diagram Methods 0.000 description 11
- 238000001514 detection method Methods 0.000 description 10
- 206010064127 Solar lentigo Diseases 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/1801—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
本発明は光学的文字読取装置(以下OCRと略称する)
における文字g織方式に関するものである。
における文字g織方式に関するものである。
OCRにおiて文字認識を行なうに際し、濁点・学濁点
・コンマ・♂リオP等の微少文字(=文字大きさの小唱
い文字)は英字・数字・カナ等の標準文字(=標準的な
大きさの文字)と区別されて正規化がなされなければな
らなio そこで、従来は、文字パターンの垂直射影・水平射影に
より車紋文字パターンが標準文字か微少性なっていた。
・コンマ・♂リオP等の微少文字(=文字大きさの小唱
い文字)は英字・数字・カナ等の標準文字(=標準的な
大きさの文字)と区別されて正規化がなされなければな
らなio そこで、従来は、文字パターンの垂直射影・水平射影に
より車紋文字パターンが標準文字か微少性なっていた。
しかしながら、帳票記入者によって微少文字を比較的大
きく記入する者もあり、文字大きさのみKよって微少文
字か否かの判断をすると、誤読率中リジェクト率の増大
を招くおそれがある。
きく記入する者もあり、文字大きさのみKよって微少文
字か否かの判断をすると、誤読率中リジェクト率の増大
を招くおそれがある。
本発明はこの様な欠点に輸みなされたものであり、文字
大きさの正規化をなされた正規化ノ臂ターンの文字線幅
を加味して当該文字パターンか微少文字か否かを判断し
て、文字g誠を行なうことにより認識精度の向上を図る
ことを・目的りする。
大きさの正規化をなされた正規化ノ臂ターンの文字線幅
を加味して当該文字パターンか微少文字か否かを判断し
て、文字g誠を行なうことにより認識精度の向上を図る
ことを・目的りする。
説明する。
第1図は本発明の一実施例を示すブロック1であり、N
中1#−i大きさ検出回路、2Fi正規化回路、3#i
サンプリングツ9タ一ン回路、4ij黒点計数回路、5
Fi判定回路、゛6#i文字認繊部を各々示している。
中1#−i大きさ検出回路、2Fi正規化回路、3#i
サンプリングツ9タ一ン回路、4ij黒点計数回路、5
Fi判定回路、゛6#i文字認繊部を各々示している。
大きさ検出回路1は、第2図に示される如く、文字パタ
ーンaの水平射影11及び垂直射影12を求めることに
より、文字パターンaの大キサヲ検出し、文字ノ9ター
ンaの大きさを示す情報を正規化回路2及び判定回路5
に供給する回路である。
ーンaの水平射影11及び垂直射影12を求めることに
より、文字パターンaの大キサヲ検出し、文字ノ9ター
ンaの大きさを示す情報を正規化回路2及び判定回路5
に供給する回路である。
正規化回路2#′i文字/(ターンaの正規化を行ない
正規化パターンbをサンプリングパターン回路3に供給
する回路である。正規化回路2Fi大きさ検出回路1か
ら供給された文字・々ターンaの大きさを示す情報に従
って文字−ぞターンaの大きさの正規化を行なうととも
に、判定回路5から文字パターンaが倣少文字である旨
の情報を受けつけると文字ノセターンaの位数の正規化
を行なう様になされている。
正規化パターンbをサンプリングパターン回路3に供給
する回路である。正規化回路2Fi大きさ検出回路1か
ら供給された文字・々ターンaの大きさを示す情報に従
って文字−ぞターンaの大きさの正規化を行なうととも
に、判定回路5から文字パターンaが倣少文字である旨
の情報を受けつけると文字ノセターンaの位数の正規化
を行なう様になされている。
サンプリングツ臂ターン回路3Ifi、第2図の如きi
スクノクターンを具備しており、このマスクツ臂ターン
を正規化)4ターンb上で移動させながらマスクIり一
部と正規化パターンbとの積和を順次求めて、サンプリ
ングツぐターンCを作成する回路である。、 マスクパターンの太きさけ本実施例では第3図のm<s
xsとして説明する。又、このマスクパターンのノリー
ン要素には、第3図の如く、中央にい〈程重みが増す様
に重み係数がっけ−られている。
スクノクターンを具備しており、このマスクツ臂ターン
を正規化)4ターンb上で移動させながらマスクIり一
部と正規化パターンbとの積和を順次求めて、サンプリ
ングツぐターンCを作成する回路である。、 マスクパターンの太きさけ本実施例では第3図のm<s
xsとして説明する。又、このマスクパターンのノリー
ン要素には、第3図の如く、中央にい〈程重みが増す様
に重み係数がっけ−られている。
・ 次に積和の求め方であるが、マスクパターンのpe
p−ン要素をMlj・正規化パターンbのノ臂ターン要
素をC1jと定義した場合、サンプリング・り一部回路
3によって求められる積和FigM1j・C1jと定義
される。
p−ン要素をMlj・正規化パターンbのノ臂ターン要
素をC1jと定義した場合、サンプリング・り一部回路
3によって求められる積和FigM1j・C1jと定義
される。
例えば、第4図は正規化Iり一部bの一部分を 12進
表示したものであり、これと第5図のマスク・リーン島
の積和を求めると答えは「19」となる。
表示したものであり、これと第5図のマスク・リーン島
の積和を求めると答えは「19」となる。
この積和は、正規化パターンがオールrOJからオール
「1」まで「0」〜「36」の値をとりうるが、本実施
例にお−ては、サンプリングツ9ターフ回路sFi、第
1表の如く積和を「0」〜rFJの16進数で表わし、
サンプリングパターンCのノをターン要素とするものと
する。
「1」まで「0」〜「36」の値をとりうるが、本実施
例にお−ては、サンプリングツ9ターフ回路sFi、第
1表の如く積和を「0」〜rFJの16進数で表わし、
サンプリングパターンCのノをターン要素とするものと
する。
第1表
淳Vi
次に1マスク/ぞターンの正規化1’eターンb上でf
)移動に関する法則について述べる。
)移動に関する法則について述べる。
マスクパターンは、正規化パターンb上を上下左右に一
部重複しながら同一ピッチで移動される。
部重複しながら同一ピッチで移動される。
移動ピッチは大きい種処理速度は向上し、逆に小さい程
サンプリングパターンのデータとしての精度は向上する
。従って移動ピッチは速度と精度とのバランスを考慮し
て決定されるものであり、本実施例で#−t3ピットず
つ移動させるものとして説明をする。
サンプリングパターンのデータとしての精度は向上する
。従って移動ピッチは速度と精度とのバランスを考慮し
て決定されるものであり、本実施例で#−t3ピットず
つ移動させるものとして説明をする。
黒点計数回路4Fi、サンプリングツ9ターフ回路3か
ら供給されたサンシリンダパターンCの/eターン要素
中所定レベル以上のパターン要素の数をカウントし計数
値dを判定回路5に供給する回路である。
ら供給されたサンシリンダパターンCの/eターン要素
中所定レベル以上のパターン要素の数をカウントし計数
値dを判定回路5に供給する回路である。
黒点計数回路4#i、具体的には第5図の如く、プロセ
ッサにより所定値を設定されるレジスタ41、V’)X
141の出力とサンプリングパターンcとを比較する比
較器42、比較器42の出力をカウントするカウンタ4
3により構成される。
ッサにより所定値を設定されるレジスタ41、V’)X
141の出力とサンプリングパターンcとを比較する比
較器42、比較器42の出力をカウントするカウンタ4
3により構成される。
判定回路5は焦点計数回路4から供給された計数値d及
び大きさ検出回路1から供給される文字大きさを示す情
報により、正規化パターンbが標準文9字か微少文字か
を識別し、識別結果を正規化回路2及び文字認識部6に
供給する回路である。
び大きさ検出回路1から供給される文字大きさを示す情
報により、正規化パターンbが標準文9字か微少文字か
を識別し、識別結果を正規化回路2及び文字認識部6に
供給する回路である。
文字認識部6tl−1判定回路5から正規化・ぞターン
bが標準文字であることを示す旨の情報を供給されると
、その時に供給されているサンプリングパター70によ
り文字M職を行なうものである。
bが標準文字であることを示す旨の情報を供給されると
、その時に供給されているサンプリングパター70によ
り文字M職を行なうものである。
次に標準文字の認識時と微少文字の認識時に分けて動作
を説明する。
を説明する。
先ず標準文字の認識時を説明する。
第6図Fi標準文字である数字の「2」を示す文字パタ
ーンaであり、この文字パターンaFi大きさ検出回路
1及び正規化回路2に供給される。
ーンaであり、この文字パターンaFi大きさ検出回路
1及び正規化回路2に供給される。
文字パターンa#i大きさ検出回路1により水平射影及
び垂直射影をとられ一七の結束大きさ検出回路1から文
字大きさを示す情報がIF規化回路2へ供給される。
び垂直射影をとられ一七の結束大きさ検出回路1から文
字大きさを示す情報がIF規化回路2へ供給される。
正規化(ロ)#82は、大きさ検出回路1から供給され
九文字大きさを示す情報を参照して文字パターンal(
文字大きさの正規化を施し、その結果、第7図の如き正
規化)々ターンbがサンプリングパターン回p@5に供
給される。
九文字大きさを示す情報を参照して文字パターンal(
文字大きさの正規化を施し、その結果、第7図の如き正
規化)々ターンbがサンプリングパターン回p@5に供
給される。
サンプリングツ譬ターン回N3は、第7図の正規化ノ臂
ターンbの左上隅かう、マスクツぞターンを3ピツPず
つずらしながらマスクパターンと正規化パターンbの積
和を求め、第8図の焔きサンプリング/ぐターンCを黒
点計数回路4及び文字認識部6に供給する。
ターンbの左上隅かう、マスクツぞターンを3ピツPず
つずらしながらマスクパターンと正規化パターンbの積
和を求め、第8図の焔きサンプリング/ぐターンCを黒
点計数回路4及び文字認識部6に供給する。
黒点計数回路4内のレジスタ41に例えばE(H)とい
う値が格納されていたとすると、サンプリングパターン
C中のg(H)以上のパターン要素の数は、81!9図
の如く「4」であるので、黒点計数【1路4から判定回
路5に供給される計数4Ikdけ「4」となる。 □ その結果、判定回路5は文字パターンaが標準文字を表
現しているものと判断し、その旨を文字認識部6に伝え
る。
う値が格納されていたとすると、サンプリングパターン
C中のg(H)以上のパターン要素の数は、81!9図
の如く「4」であるので、黒点計数【1路4から判定回
路5に供給される計数4Ikdけ「4」となる。 □ その結果、判定回路5は文字パターンaが標準文字を表
現しているものと判断し、その旨を文字認識部6に伝え
る。
その結果文字臆繊5SF1ナノプリングツ櫂メーン回路
3から供給された第8図のサンプリングツクターンCに
より文字認識を行なう。
3から供給された第8図のサンプリングツクターンCに
より文字認識を行なう。
次に微少文字の認識時を説明する。
第10図Fi微少文字である濁点を示す文字・臂ターン
aであり、この文字/臂ターンaけ大きさ検出回路1及
び正規化回路2に供給される。
aであり、この文字/臂ターンaけ大きさ検出回路1及
び正規化回路2に供給される。
次に大きさ検出回路1から給10図の文字−ぐターンa
の文字大きさを示す情報が正規化回路2に供給上れる。
の文字大きさを示す情報が正規化回路2に供給上れる。
続いて正規化回路2によって、文字パターンaに対する
文字大きさの正規化がなされ、第11図の如き正規化ノ
ぞターンbがサンプリングパターン回路3に供給される
。
文字大きさの正規化がなされ、第11図の如き正規化ノ
ぞターンbがサンプリングパターン回路3に供給される
。
ここで第11図を注視すると、微少文字に文字大きさの
正規化を施した場合、拡大倍率が簡くなる為、正規化パ
ターンの文字線幅は太くなることが理解できる。
正規化を施した場合、拡大倍率が簡くなる為、正規化パ
ターンの文字線幅は太くなることが理解できる。
その結果サンプリングツクターン向銘3によって作成さ
れ黒点計数回路4及び文字認識部6に供給されるサンプ
リングツぞターンCの各パターン要素の7値は第12図
の如く高くなる。
れ黒点計数回路4及び文字認識部6に供給されるサンプ
リングツぞターンCの各パターン要素の7値は第12図
の如く高くなる。
黒点計数回路4に供給された第12図のサンプリングツ
ぞターンCの/セターン要紫中111 (T1 )以上
のもののalPi、Iri第1′5図の如<r12Jあ
るので、黒点計数回路4から判定回路5に供給される計
数値dの値tjr12Jとなる。
ぞターンCの/セターン要紫中111 (T1 )以上
のもののalPi、Iri第1′5図の如<r12Jあ
るので、黒点計数回路4から判定回路5に供給される計
数値dの値tjr12Jとなる。
その結果、判定回路5F1文字ノ々ターンaが微少文字
を表現しているものと判断し、その旨を文字認識部6及
び正規化部2に伝える。。
を表現しているものと判断し、その旨を文字認識部6及
び正規化部2に伝える。。
その結果、文字認識部6tiサンプリング/ぐターン回
路3から供給された第12図のサンプリング、Rターン
を放棄し、次に供給されるサンプリングjぞターンを待
つ。
路3から供給された第12図のサンプリング、Rターン
を放棄し、次に供給されるサンプリングjぞターンを待
つ。
一万、正規化回路2は第10図の文字パターンaに対し
、文字位置の正規化を施し、第14図の正ffl化ノぞ
ターンbをサンプリングツぞターフ回路3に供給する。
、文字位置の正規化を施し、第14図の正ffl化ノぞ
ターンbをサンプリングツぞターフ回路3に供給する。
その結果、サンプリングパターン回路3によって第15
図の如きサンプリングパターンCが作成iれて、このサ
ンプリングパターンCけ文字認識部6に供給される。
。
図の如きサンプリングパターンCが作成iれて、このサ
ンプリングパターンCけ文字認識部6に供給される。
。
文字認識部6はこの様にして供給された第15図のサン
プリングツぞターンCにより文字認識を行なう。
プリングツぞターンCにより文字認識を行なう。
以上説明しfr、様に本発明においては文字大きさの正
規化をなされた正規化−々ターンの文字線幅を考慮して
、当該文字か微少文字か否かの判断がされるので、本発
明によれば、多少大きく記入されたrIJIり文字であ
っても正確に数少文字であると判断され、よって誤読率
やりジエクト率が低減される。
規化をなされた正規化−々ターンの文字線幅を考慮して
、当該文字か微少文字か否かの判断がされるので、本発
明によれば、多少大きく記入されたrIJIり文字であ
っても正確に数少文字であると判断され、よって誤読率
やりジエクト率が低減される。
従って本発明によれば、0CR−により人力されたデー
タの信頼性が向上し、父、誤読やりジエクト修正の為の
オペレータの負担も軽減される。
タの信頼性が向上し、父、誤読やりジエクト修正の為の
オペレータの負担も軽減される。
屯図面の簡単な説明 、
第1図は本発明の一実施例のブロック図。
第2図は射影をとる様子、4示しfc白。
第3図はマスクノソ・ターンの一例を示す図。
第4図は正規化ノ々ターンの一部を示す図。
第5図6黒点計数回路の構成を示すブロック図。
第6図は数字の2を示す文字ノセターンを示す図0第7
図は第6白の文字パターンから得られる正規化・セター
ンを示す図。
図は第6白の文字パターンから得られる正規化・セター
ンを示す図。
第8図は第7図の正規化、Rターンから得られるサンプ
リングパター/を示す図。
リングパター/を示す図。
第9図は第8図のサンプリングツぞターン中E(H)以
上の、Cター/要素の位置を示す図。
上の、Cター/要素の位置を示す図。
第10因は濁点を示す文字パターンを示す図。
第11図は第10図の文字パターンから得られる正規化
ノeターンを示す図。
ノeターンを示す図。
第12図は第11因の正規化パターンから得られるサン
プリングパターンを示す図。
プリングパターンを示す図。
第16図は第12図のす/シリングパターン中のg(H
)以上の、Jlターン要素の位置を示す図。
)以上の、Jlターン要素の位置を示す図。
第14図は第10図の文字/4’ターンに文字位置の正
規化を施した正規化teターンを示す図。
規化を施した正規化teターンを示す図。
第15図は第1..4、図の正規化ノRターンから得ら
れるサンプリングツぐターンを示す一部1・・・大きさ
検出回路 2・・・正規化回路 6・・・サンプリングツぞターン回部 4・・・黒点計数回路 5・・・’1.lj定回路 6・・・文字認識部 a・・・文字パターン b・・・正規化パターン C・・・サンプリングパターン d・・・計数(暖■ (7317) 代理人 弁理士 則近憲佑(他1ろ) 第1図 第2図 第3図 第4図 第6図 第71刊 す 第8図 第10b 第11図 す 第12図 第13図 第14 第15
れるサンプリングツぐターンを示す一部1・・・大きさ
検出回路 2・・・正規化回路 6・・・サンプリングツぞターン回部 4・・・黒点計数回路 5・・・’1.lj定回路 6・・・文字認識部 a・・・文字パターン b・・・正規化パターン C・・・サンプリングパターン d・・・計数(暖■ (7317) 代理人 弁理士 則近憲佑(他1ろ) 第1図 第2図 第3図 第4図 第6図 第71刊 す 第8図 第10b 第11図 す 第12図 第13図 第14 第15
Claims (1)
- (1) 大きさの正規化をされ九正規化パターンの文
字線幅を求めることにより、前記正規化/々ターンが標
準文字か微少文字かを識別して、文字認識を行なうこと
を特徴′とする文字認識方式。 (2、特許請求の範囲第1項記載の文字M織方式におい
て、予め用意された7子クツターンと文字大きさの正規
化をなされた正規化JRパターン積和を求めることによ
りサンプリングノセターンを作成し、該サンプリングJ
Rターンのパターン要素中所定レベル以上のパターン要
撫の個数を求めることにより前記正規化JRパターン文
字線輪を求めることを%黴とする文字i%!!鑓方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP56140337A JPS5843071A (ja) | 1981-09-08 | 1981-09-08 | 文字認識方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP56140337A JPS5843071A (ja) | 1981-09-08 | 1981-09-08 | 文字認識方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS5843071A true JPS5843071A (ja) | 1983-03-12 |
Family
ID=15266475
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP56140337A Pending JPS5843071A (ja) | 1981-09-08 | 1981-09-08 | 文字認識方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS5843071A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6132187A (ja) * | 1984-07-19 | 1986-02-14 | インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション | 文字認識方式 |
-
1981
- 1981-09-08 JP JP56140337A patent/JPS5843071A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6132187A (ja) * | 1984-07-19 | 1986-02-14 | インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション | 文字認識方式 |
JPH0516632B2 (ja) * | 1984-07-19 | 1993-03-04 | Intaanashonaru Bijinesu Mashiinzu Corp |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4481665A (en) | Character segmentation method | |
CN109658584B (zh) | 一种票据信息识别方法及装置 | |
US5396566A (en) | Estimation of baseline, line spacing and character height for handwriting recognition | |
JPS60204086A (ja) | 物体識別装置 | |
SE520682C2 (sv) | Rekonstruering av ett virtuellt raster | |
CN107067533A (zh) | 一种纸币鉴别的方法及装置 | |
JP2000202371A (ja) | 宛名領域検出装置 | |
CN107158701A (zh) | 出射力度的提示方法和装置 | |
JP3372111B2 (ja) | ワットアワーメータ文字認識装置 | |
JPS5843071A (ja) | 文字認識方式 | |
CN110287970A (zh) | 一种基于cam与掩盖的弱监督物体定位方法 | |
JPS6223350B2 (ja) | ||
JP5619111B2 (ja) | 画像判定装置およびプログラム | |
JP2003108922A (ja) | 文字列読み取り装置及び文字列読み取り方法 | |
JP3365538B2 (ja) | オンライン文字認識方法および装置 | |
JP4105376B2 (ja) | 図形検出回路 | |
JPH09106440A (ja) | 手書き文字認識の特徴点検出方法 | |
JP2510722B2 (ja) | 英文の大文字,小文字の判別方法 | |
JPH0844822A (ja) | 文字認識装置 | |
JPS61100874A (ja) | 光学文字読取装置 | |
JPS58189764A (ja) | 包含多角形検出方式 | |
JP2559688B2 (ja) | パタ−ン認識装置 | |
CN117690137A (zh) | 一种基于深度学习的轻量型集装箱编号识别方法 | |
JPH05128309A (ja) | 文字認識におけるエツジ検出方法 | |
JPS5635279A (en) | Deciding system for reading subject line |