JPS62166483A - 文字認識装置の認識文字選択方法 - Google Patents
文字認識装置の認識文字選択方法Info
- Publication number
- JPS62166483A JPS62166483A JP61009453A JP945386A JPS62166483A JP S62166483 A JPS62166483 A JP S62166483A JP 61009453 A JP61009453 A JP 61009453A JP 945386 A JP945386 A JP 945386A JP S62166483 A JPS62166483 A JP S62166483A
- Authority
- JP
- Japan
- Prior art keywords
- character
- distance
- candidate
- characters
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title description 4
- 238000010187 selection method Methods 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 2
- 230000003247 decreasing effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔技術分野〕
本発明は文字認識装置における認識文字選択方法に関す
る。
る。
文字認識装置においては、一般に入力文字パタ−ンの特
徴をとらえ、その特徴量とあらかじめ用意した辞書の特
徴量との演算結果(距離)の大小を比較して認識文字を
決定する。即ち、入力文字パターンの特徴量をPl(、
辞書(テンプレート)の特徴量をD Hとした時、距離
D = l D u P Hlを求め、D < T
II(T oはりジェクトのスレショート)となるテン
プレートを候補文字とし、その中で耐n(D)のものを
選択する。
徴をとらえ、その特徴量とあらかじめ用意した辞書の特
徴量との演算結果(距離)の大小を比較して認識文字を
決定する。即ち、入力文字パターンの特徴量をPl(、
辞書(テンプレート)の特徴量をD Hとした時、距離
D = l D u P Hlを求め、D < T
II(T oはりジェクトのスレショート)となるテン
プレートを候補文字とし、その中で耐n(D)のものを
選択する。
この従来技術では、リジェクトスレショールドの設定が
リジェクト率及び誤読率に大きな影響を与えること\な
る。例えば、リジェクトスレショールドを小さくすると
、誤読率は低くなるがリジェクト率が高くなる。逆にリ
ジェクトスレショールドを大きくすると、リジェクト率
は下がるが、候補文字が増えるため、結果として誤読率
も増加する。光学文字読取袋W (OCR)などとして
は、誤読率の低い方が望ましいが、とはいってもリジェ
クト率が高すぎると実用にならず、リジェクトスレショ
ールドをどのように設定するかNが大きな問題となる。
リジェクト率及び誤読率に大きな影響を与えること\な
る。例えば、リジェクトスレショールドを小さくすると
、誤読率は低くなるがリジェクト率が高くなる。逆にリ
ジェクトスレショールドを大きくすると、リジェクト率
は下がるが、候補文字が増えるため、結果として誤読率
も増加する。光学文字読取袋W (OCR)などとして
は、誤読率の低い方が望ましいが、とはいってもリジェ
クト率が高すぎると実用にならず、リジェクトスレショ
ールドをどのように設定するかNが大きな問題となる。
本発明の目的は、OCR等の文字認識装置における文字
認識率の向上を図ることにある。
認識率の向上を図ることにある。
本発明は、算出された距離りについて、まず成る程度大
きい第1のリジェクトスレショールドTH0を設定して
リジェクト率を低くし、次にTI(1よりきびしい第2
のリジェクトスレショールドT H2を設定して誤読を
防ぎ、T H1とT H2の間の候補文字に対しては、
距離の最小のものを第1位D 1.次に小さいものを第
2位D2と定め、第1位と第2位の距離の差D2 D
+を第3のリジェクトスレショールドT H3と比較す
ることにより、全体として認識率の向−Lを実現するも
のである。以下、図面により本発明の一実施例について
説明する。
きい第1のリジェクトスレショールドTH0を設定して
リジェクト率を低くし、次にTI(1よりきびしい第2
のリジェクトスレショールドT H2を設定して誤読を
防ぎ、T H1とT H2の間の候補文字に対しては、
距離の最小のものを第1位D 1.次に小さいものを第
2位D2と定め、第1位と第2位の距離の差D2 D
+を第3のリジェクトスレショールドT H3と比較す
ることにより、全体として認識率の向−Lを実現するも
のである。以下、図面により本発明の一実施例について
説明する。
第1図は本発明で対象とする文字認識装置の一実施例の
ブロック図である。
ブロック図である。
第1図において、原稿等は光学的画像読取装置10で読
み取られて2値化され、原画像メモリ5=3− 0に格納される。処理装置(CPU)30は、メモリ5
0に格納された原入力文字パターンを読み出し、プログ
ラムメモリ(ROM)40の特徴抽出処理プログラム4
1の支援の下で入力文字の特徴を抽出し、その特徴量P
Hをデータメモリ(RAM)60の特徴量格納領域61
に格納する。特徴量PHの求め方には既に種々の方法が
あり、また、これは本発明の要旨とするところでないの
で、これ以上の説明は省略する。データメモリ60のリ
ジェクトスレショールド格納領域62,63゜64には
、それぞれリジエクトスレショールドTHs 、 T
H2−T H3がキーボード20より入力されて格納さ
れている。二〜で、T’ HsとT H2の間にはT
H1> T H2の関係があるとする。TH3はT H
8,T H2とは独立に設定する。
み取られて2値化され、原画像メモリ5=3− 0に格納される。処理装置(CPU)30は、メモリ5
0に格納された原入力文字パターンを読み出し、プログ
ラムメモリ(ROM)40の特徴抽出処理プログラム4
1の支援の下で入力文字の特徴を抽出し、その特徴量P
Hをデータメモリ(RAM)60の特徴量格納領域61
に格納する。特徴量PHの求め方には既に種々の方法が
あり、また、これは本発明の要旨とするところでないの
で、これ以上の説明は省略する。データメモリ60のリ
ジェクトスレショールド格納領域62,63゜64には
、それぞれリジエクトスレショールドTHs 、 T
H2−T H3がキーボード20より入力されて格納さ
れている。二〜で、T’ HsとT H2の間にはT
H1> T H2の関係があるとする。TH3はT H
8,T H2とは独立に設定する。
さて、処理装[20はプログラムメモリ40の認識処理
プログラム42の支援の下で、データメモリの領域61
に格納された入力文字パターンの特徴量PHと辞書メモ
リ70にあらかじめ用意された辞書(テンプレート)の
特徴量DHとの距離Dを順に求め、その大小を比較して
認識文字を決定する。本発明はこの認識処理に特徴を有
するものであり、以下、これについて詳述する。
プログラム42の支援の下で、データメモリの領域61
に格納された入力文字パターンの特徴量PHと辞書メモ
リ70にあらかじめ用意された辞書(テンプレート)の
特徴量DHとの距離Dを順に求め、その大小を比較して
認識文字を決定する。本発明はこの認識処理に特徴を有
するものであり、以下、これについて詳述する。
第2図は本発明による認識文字選択の処理フローの一実
施例を示す。まず、入力文字パターンの特徴量PHと辞
書の特徴量DHとの距離D=lD□−PH1を順に算出
する(ステップ101)。
施例を示す。まず、入力文字パターンの特徴量PHと辞
書の特徴量DHとの距離D=lD□−PH1を順に算出
する(ステップ101)。
次に、この距離りとある程度大きい値をもつ第1のリジ
ェクトスレショールドT HIを比較しくステップ10
2)、THI≧Dなる文字を第1の候補文字群とする。
ェクトスレショールドT HIを比較しくステップ10
2)、THI≧Dなる文字を第1の候補文字群とする。
T H1< Dである文字は、この時点でリジェクトす
る(ステップ107)。
る(ステップ107)。
次に、第1の候補文字群について、それらの距離りをT
H1よりきびしい第2のリジェクトスレショールドT
H2(即ち、T H2< T H□)と比較する(ステ
ップ103)。そして、TH2≧Dなる文字を第2の候
補文字群とし、この第2の候補文字群の中で最小距離の
ものを認識文字として選択する(ステップ108)。第
2の候補文字群が存在しない時、即ち、第1の候補文字
群が全てT H2< Dである時、第1の候補文字群中
の距離の小さい方から2文字を第1位候補、第2位候補
として選択する(ステップ104)。こ2で、第1位候
補文字の距離をり1、第2位候補文字の距離をD2とす
る。次に、この選択した第1位候補文字と第2位候補文
字の距離の差D2 D+について第3のリジェクトス
レショールドTH,と比較する(ステップ105)。こ
の時、D2 DI≧1゛H3であれば、距離D1の第
1位候補文字を認識文字として選択しくステップ108
)、D2D r < T H3であれば、当該入力文字
パターンは認識不能としてリジェクトする(ステップ1
゜6)。
H1よりきびしい第2のリジェクトスレショールドT
H2(即ち、T H2< T H□)と比較する(ステ
ップ103)。そして、TH2≧Dなる文字を第2の候
補文字群とし、この第2の候補文字群の中で最小距離の
ものを認識文字として選択する(ステップ108)。第
2の候補文字群が存在しない時、即ち、第1の候補文字
群が全てT H2< Dである時、第1の候補文字群中
の距離の小さい方から2文字を第1位候補、第2位候補
として選択する(ステップ104)。こ2で、第1位候
補文字の距離をり1、第2位候補文字の距離をD2とす
る。次に、この選択した第1位候補文字と第2位候補文
字の距離の差D2 D+について第3のリジェクトス
レショールドTH,と比較する(ステップ105)。こ
の時、D2 DI≧1゛H3であれば、距離D1の第
1位候補文字を認識文字として選択しくステップ108
)、D2D r < T H3であれば、当該入力文字
パターンは認識不能としてリジェクトする(ステップ1
゜6)。
このように、THl、TH2、THaの3段のりジエク
トスレショールドによる候補文字選択により、ある程度
大きいスレショートT T(lによりリジェクト率を低
くおさえながら、T H1に比べてきびしいスレショー
トT H2により誤読を防ぐと\もに、その中間の曖昧
な候補文字群のものに対しては、第1位と第2位の候補
文字の距離の差をみることにより、リジェクト率を低く
することが可能になる。
トスレショールドによる候補文字選択により、ある程度
大きいスレショートT T(lによりリジェクト率を低
くおさえながら、T H1に比べてきびしいスレショー
トT H2により誤読を防ぐと\もに、その中間の曖昧
な候補文字群のものに対しては、第1位と第2位の候補
文字の距離の差をみることにより、リジェクト率を低く
することが可能になる。
第3図は本発明による認識文字選択の他の実施例の処理
フローを示したものである。第2図と異なる点は、D
2 D l<T I(3の時、別の特徴抽出等の特殊
処理を施こし、それについて認識処理を行って認識文字
を選択するようにしたことであり、これにより認識率が
さらに向上する。
フローを示したものである。第2図と異なる点は、D
2 D l<T I(3の時、別の特徴抽出等の特殊
処理を施こし、それについて認識処理を行って認識文字
を選択するようにしたことであり、これにより認識率が
さらに向上する。
以上の説明から明らかな如く、本発明によれば、3段の
りジエクトスレショールドによる候補文字選択により、
リジェクト率および誤読率をともに低くおさえることが
でき、全体として認識率の向上が期待される。
りジエクトスレショールドによる候補文字選択により、
リジェクト率および誤読率をともに低くおさえることが
でき、全体として認識率の向上が期待される。
第1図は本発明で対象とする文字認識装置の一実施例の
ブロック図、第2図及び第3図は本発明による候補文字
選択の処理フロー図である。 10・・・光学的画像読取装置、 20・・・キーボード、 30・・処理装置、40・・
プログラムメモリ、 41・・・認識処理プログラム、
50・・・原画像メモリ、60・・・データメモリ、
61・・・特徴量格納領域、62.63.64・・・
リジエクトスレショールド格納領域、 70・・・辞書
メモリ。 第U図
ブロック図、第2図及び第3図は本発明による候補文字
選択の処理フロー図である。 10・・・光学的画像読取装置、 20・・・キーボード、 30・・処理装置、40・・
プログラムメモリ、 41・・・認識処理プログラム、
50・・・原画像メモリ、60・・・データメモリ、
61・・・特徴量格納領域、62.63.64・・・
リジエクトスレショールド格納領域、 70・・・辞書
メモリ。 第U図
Claims (3)
- (1)入力文字の特徴を抽出し、その特徴量とあらかじ
め用意した辞書の特徴量を比較演算し、その距離Dの大
小により入力文字を認識する文字認識装置において、 イ、前記距離Dを第1のリジェクトスレショールドTH
_1と比較し、少なくともTH_1<Dである文字はリ
ジェクトし、残りの文字を第1の候補文字群とすること
、 ロ、前記第1の候補文字群について、その距離Dを前記
TH_1より小さい第2のリジェクトスレショールドT
H_2と比較し、少なくともTH_2>Dである文字を
第2の候補文字群とし、その中で最小距離のものを最終
認識文字として選択すること、ハ、前記第2の候補文字
群が存在しない時、前記第1の候補文字群の中から距離
の小さい順に第1位と第2位の候補文字を選び、それら
の距離D_1、D_2の差D_2−D_1を第3のリジ
ェクトスレショールドTH_3と比較し、少なくともD
_2−D_1>TH_3であれば、前記第1の候補文字
を最終認識文字として選択すること、 を特徴とする文字認識装置の認識文字選択方法。 - (2)前記第3のリジェクトスレショールドと比較し、
D_2−D_1<TH_3である時、当該入力文字を認
識不可能とすることを特徴する特許請求の範囲第1項記
載の文字認識装置の認識文字選択方法。 - (3)前記第3のリジェクトスレショールドと比較し、
D_2−D_1<TH_3である時、他の処理による文
字認識を試みることを特徴とする特許請求の範囲第1項
記載の文字認識装置の認識文字選択方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61009453A JPS62166483A (ja) | 1986-01-20 | 1986-01-20 | 文字認識装置の認識文字選択方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61009453A JPS62166483A (ja) | 1986-01-20 | 1986-01-20 | 文字認識装置の認識文字選択方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS62166483A true JPS62166483A (ja) | 1987-07-22 |
Family
ID=11720708
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61009453A Pending JPS62166483A (ja) | 1986-01-20 | 1986-01-20 | 文字認識装置の認識文字選択方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS62166483A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0373084A (ja) * | 1989-04-28 | 1991-03-28 | Hitachi Ltd | 文字認識方法及びその装置 |
JP2014115781A (ja) * | 2012-12-07 | 2014-06-26 | Hitachi Information & Telecommunication Engineering Ltd | 文字認識装置及び方法、文字認識プログラム |
-
1986
- 1986-01-20 JP JP61009453A patent/JPS62166483A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0373084A (ja) * | 1989-04-28 | 1991-03-28 | Hitachi Ltd | 文字認識方法及びその装置 |
JP2014115781A (ja) * | 2012-12-07 | 2014-06-26 | Hitachi Information & Telecommunication Engineering Ltd | 文字認識装置及び方法、文字認識プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4989258A (en) | Character recognition apparatus | |
US8761514B2 (en) | Character recognition apparatus and method based on character orientation | |
CN102982349B (zh) | 一种图像识别方法及装置 | |
US10438083B1 (en) | Method and system for processing candidate strings generated by an optical character recognition process | |
JPH1139493A (ja) | 距離及び方向に鑑みたパターン整合装置及びその方法 | |
CN111797685B (zh) | 表格结构的识别方法及装置 | |
JPS62166483A (ja) | 文字認識装置の認識文字選択方法 | |
Saiga et al. | An OCR system for business cards | |
JP3344062B2 (ja) | カタカナ手書き文字切り出し回路 | |
JPS59158482A (ja) | 文字認識装置 | |
JPH03126188A (ja) | 文字認識装置 | |
JPS629958B2 (ja) | ||
JP3466903B2 (ja) | 文字認識用マルチテンプレート辞書作成方法 | |
JP2973898B2 (ja) | 文字認識方法及び装置 | |
JPH09330378A (ja) | パターン辞書比較方法 | |
CN114385893A (zh) | 一种基于节点提取的网页类别判定方法、装置及终端设备 | |
JPS63269267A (ja) | 文字認識方法 | |
JPS6089289A (ja) | 文字認識方式 | |
JPH04260980A (ja) | 図形認識装置 | |
Gao et al. | Character recognition in low quality document images using local and global features | |
CN116110077A (zh) | 遮挡条件下基于块划分姿态辅助对齐的行人重识别方法 | |
KR19990011492A (ko) | 단어의 음소 구조에 따른 단어 그룹 형성 방법 | |
JPS6410875B2 (ja) | ||
JPH0330100A (ja) | ナンバープレートの車種コード認識方法 | |
JPS6252912B2 (ja) |