JPH0375890A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPH0375890A JPH0375890A JP1211369A JP21136989A JPH0375890A JP H0375890 A JPH0375890 A JP H0375890A JP 1211369 A JP1211369 A JP 1211369A JP 21136989 A JP21136989 A JP 21136989A JP H0375890 A JPH0375890 A JP H0375890A
- Authority
- JP
- Japan
- Prior art keywords
- standard pattern
- pattern
- dictionary
- representative
- constituent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000000470 constituent Substances 0.000 claims abstract description 20
- 238000000034 method Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 abstract description 12
- 238000001514 detection method Methods 0.000 abstract description 5
- 230000006835 compression Effects 0.000 abstract description 3
- 238000007906 compression Methods 0.000 abstract description 3
- 238000007796 conventional method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 241000723343 Cichorium Species 0.000 description 1
- 235000007542 Cichorium intybus Nutrition 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
この発明は、文字9図形などのパターン認識、特に多く
のカテゴリをもつパターンを認識するための装置に関す
る。
のカテゴリをもつパターンを認識するための装置に関す
る。
従来、漢字などの多くのカテゴリをもつパターンをマツ
チング法にて認識する場合、演算量が膨大となるため第
4図にステップ■で示すように、認識を行なう特徴空間
を部分的に限定したり、圧縮した次元で候補カテゴリを
絞る分類処理を行ない、その分類候補に対し本来の特徴
空間を用いて認識処理を行なうようにしている。なお、
第4図のステップ■は未知パターンを光電変換して入力
するステップを、ステップ■は人力画像からその特徴量
を抽出するステップを、ステップ■は分類候補に対して
認識処理するステップを、またステップ■は最終結果を
出力するステップをそれぞれ示しており、従来から良く
知られているものである。
チング法にて認識する場合、演算量が膨大となるため第
4図にステップ■で示すように、認識を行なう特徴空間
を部分的に限定したり、圧縮した次元で候補カテゴリを
絞る分類処理を行ない、その分類候補に対し本来の特徴
空間を用いて認識処理を行なうようにしている。なお、
第4図のステップ■は未知パターンを光電変換して入力
するステップを、ステップ■は人力画像からその特徴量
を抽出するステップを、ステップ■は分類候補に対して
認識処理するステップを、またステップ■は最終結果を
出力するステップをそれぞれ示しており、従来から良く
知られているものである。
しかしながら、このような手法では特徴量を削減するた
めに分類から漏れてしまうと、認識処理の候補として現
われれば正しく認識ができる場合でもこれができなくな
ってしまい、誤った結果を出力するという問題がある。
めに分類から漏れてしまうと、認識処理の候補として現
われれば正しく認識ができる場合でもこれができなくな
ってしまい、誤った結果を出力するという問題がある。
したがって、この発明の課題は、特徴空間を限定したり
圧縮したりし2(いで演寡量を減少さ一已、しかも「忍
識積度を向上させることにある。
圧縮したりし2(いで演寡量を減少さ一已、しかも「忍
識積度を向上させることにある。
代表標準パターン辞書と、この代表標?il;パタンの
近傍のカテゴリからなる構成標ij:パターン辞書と、
代表標準パターンコードと構成標準パタンコードとを対
応付ける幻応標準パターンラーーフルとを備え、次元の
削減や圧縮をしていない′lJI′徴空間で住空間準パ
ターン辞書による未知パターンの分類処理を行なった後
、1位の代表標tjl+パクンに対応する構成標準パタ
ーン辞書とマツチングをとって未知パターンを認識する
。
近傍のカテゴリからなる構成標ij:パターン辞書と、
代表標準パターンコードと構成標準パタンコードとを対
応付ける幻応標準パターンラーーフルとを備え、次元の
削減や圧縮をしていない′lJI′徴空間で住空間準パ
ターン辞書による未知パターンの分類処理を行なった後
、1位の代表標tjl+パクンに対応する構成標準パタ
ーン辞書とマツチングをとって未知パターンを認識する
。
D次元ヘラ1〜ル空
カテゴリを表わず標準パターンによってm個の部分空間
に分けられる。2つの標準パターンをSS2とすれば、
双方から等しい類似度をZ〈ずヘクー〇をWliたず(
ただし、「・−1をイ」シてヘクトル量を示す)。これ
(、I、ノルl、の正規化を行なった2つの標’rlニ
パターンの差分−・、クトルど直交するn次元超平面を
表わす。この識別境界面はm個のカテゴリては最大mc
2個存在するが、実質的にはこれより少ない。そこで、
この発明でし1m個の標〈1t:パターン( Sl+
S2+ ・・Sn)の中から代表的な標準パターン
としてに個1 rl+ r2+ ・・・rttlを選
び、各々のr8についてこれを代表している構成標準パ
ターンC84を(S、)の中から2個(C。
に分けられる。2つの標準パターンをSS2とすれば、
双方から等しい類似度をZ〈ずヘクー〇をWliたず(
ただし、「・−1をイ」シてヘクトル量を示す)。これ
(、I、ノルl、の正規化を行なった2つの標’rlニ
パターンの差分−・、クトルど直交するn次元超平面を
表わす。この識別境界面はm個のカテゴリては最大mc
2個存在するが、実質的にはこれより少ない。そこで、
この発明でし1m個の標〈1t:パターン( Sl+
S2+ ・・Sn)の中から代表的な標準パターン
としてに個1 rl+ r2+ ・・・rttlを選
び、各々のr8についてこれを代表している構成標準パ
ターンC84を(S、)の中から2個(C。
C82,・・・C8,)決定する。つまり、未知パター
ンについてまずに個の代表標〈Il.パターン(r;)
(1≦i≦k)とマツチングをとり、その中で最大
の類似度を示ずr.を検出する。次に、このr,の構成
4% Bpパターンfcij) (]≦j≦l)との
マツチングをとり、最大のJIJ度を示すC04を最柊
粘果とする。これにより、演算量を少なくしつつ認識精
度を向トさセることがijJ能となる。
ンについてまずに個の代表標〈Il.パターン(r;)
(1≦i≦k)とマツチングをとり、その中で最大
の類似度を示ずr.を検出する。次に、このr,の構成
4% Bpパターンfcij) (]≦j≦l)との
マツチングをとり、最大のJIJ度を示すC04を最柊
粘果とする。これにより、演算量を少なくしつつ認識精
度を向トさセることがijJ能となる。
第1図にこの発明の実施例を示す。同図において、IG
.1未知パターンバツフアノ七り、2は類似度演算回路
、3は辞書読出し回路、4は代表標〈111パターン辞
四、5は構成標〈1チパターン辞書、6↓,1最大値検
出回路、7は対応構成標〈1!,パターンコード、8は
認識結果ハソファメモリてあ2)。
.1未知パターンバツフアノ七り、2は類似度演算回路
、3は辞書読出し回路、4は代表標〈111パターン辞
四、5は構成標〈1チパターン辞書、6↓,1最大値検
出回路、7は対応構成標〈1!,パターンコード、8は
認識結果ハソファメモリてあ2)。
まず、未知パターンバッファ1より、未知バタンaが類
似度演算回路2に送られる。次に、辞書読出し回路3ば
代表標準パターン辞書4より代表標準パターンbを読み
出し、標4!:ペクーンCとして回路2に送る。回路2
では未知パターンaと標準パターンCとの類似度を求め
、類似度演算結果eを最大値検出回路6に送る。回路6
は最大類似度をもつパターンコードを検出して、代表標
(II:パター71位のコートfを辞書読出し回路3に
送る。回路3はml − F fに従い、対応構成標準
パターンテーブル7よりコードfを構成する標〈1!V
パターンコードの組である対応構成標準パターンT1−
ドgを読み出す一方、コード8の構成標(414パクン
dを構成標準パターン辞書5より読ゐ出し、標準パター
ンCとして回路2に送る。回路2はパターンaとパター
ンCとの頚(Il度を求め、類似度演算結果Cを最大値
検出回路6に送る。回路66よその結果Cより最大類似
度を検出し、これを最終認識結果りとして認識結果ハソ
ファ8へ送る。
似度演算回路2に送られる。次に、辞書読出し回路3ば
代表標準パターン辞書4より代表標準パターンbを読み
出し、標4!:ペクーンCとして回路2に送る。回路2
では未知パターンaと標準パターンCとの類似度を求め
、類似度演算結果eを最大値検出回路6に送る。回路6
は最大類似度をもつパターンコードを検出して、代表標
(II:パター71位のコートfを辞書読出し回路3に
送る。回路3はml − F fに従い、対応構成標準
パターンテーブル7よりコードfを構成する標〈1!V
パターンコードの組である対応構成標準パターンT1−
ドgを読み出す一方、コード8の構成標(414パクン
dを構成標準パターン辞書5より読ゐ出し、標準パター
ンCとして回路2に送る。回路2はパターンaとパター
ンCとの頚(Il度を求め、類似度演算結果Cを最大値
検出回路6に送る。回路66よその結果Cより最大類似
度を検出し、これを最終認識結果りとして認識結果ハソ
ファ8へ送る。
第2図は、以上の動作を示ず〕[1−チャー1・である
。ずなわら、上記の如き代表標準パターン乙こよる分類
処理をステップ■にて行なう点、また構成標準パターン
による認識処伸をステップ■にて行なう点が新たに加わ
っただけで、その他は従来と同様なので詳細1.L省略
する。
。ずなわら、上記の如き代表標準パターン乙こよる分類
処理をステップ■にて行なう点、また構成標準パターン
による認識処伸をステップ■にて行なう点が新たに加わ
っただけで、その他は従来と同様なので詳細1.L省略
する。
第3図は代表標準パターン(r,)および構成標準パタ
ーン(Ci.++を決定する方法を説明するためのフロ
ーチャ=1・である。
ーン(Ci.++を決定する方法を説明するためのフロ
ーチャ=1・である。
まず、全標準パターン(S,)の中から任意のm個を代
表標z11パターン(r,)の初期値とする(■参照)
。次に、残りの標準パターン(b,)・・(b,l b
i S R1 (ただし、S= (SitR−f
r.))のす、と(r.)との類似度を求め、その中で
最大の類似度を示ずrpを検出し、b、を代表標準パタ
ーンrpの構成標準パターンC9、とする。こうして、
(b,)に属する(r,)を永めて、r、の構成標〈
1f・パターン(Ci、lを暫定的に決める(■参照)
。
表標z11パターン(r,)の初期値とする(■参照)
。次に、残りの標準パターン(b,)・・(b,l b
i S R1 (ただし、S= (SitR−f
r.))のす、と(r.)との類似度を求め、その中で
最大の類似度を示ずrpを検出し、b、を代表標準パタ
ーンrpの構成標準パターンC9、とする。こうして、
(b,)に属する(r,)を永めて、r、の構成標〈
1f・パターン(Ci、lを暫定的に決める(■参照)
。
次に、m個の構成標準パターン(Cij) (1≦1
≦m)の中で構成要素の数Jの最大価J、31、最’J
′V(l’j J m ; nを算出し、Imax
Jmin<e (eば整数)を満たせば、ずなわら(
r、)かほぼ同数の構成標〈II;パターンを代表した
標!I11パターンとなれば、処理を絆了する(■、■
参照)。そうでなiノれぽ、(r、)の組み替えを行な
って以上の処理を繰り返す(■参照)。
≦m)の中で構成要素の数Jの最大価J、31、最’J
′V(l’j J m ; nを算出し、Imax
Jmin<e (eば整数)を満たせば、ずなわら(
r、)かほぼ同数の構成標〈II;パターンを代表した
標!I11パターンとなれば、処理を絆了する(■、■
参照)。そうでなiノれぽ、(r、)の組み替えを行な
って以上の処理を繰り返す(■参照)。
この発明によれば、代表標〈1(パターンによる分類処
理を行なった後、1位になった代表標準バタンの構成標
準パターンに幻して認識処理を行なうよ・うにしたので
、特徴空間の次元の削減や正相1にともなう分類漏れの
現象が少なくなり、演算量を減少しつつ最1冬言忍識率
をj)δめることかできる第1]点が得られる。
理を行なった後、1位になった代表標準バタンの構成標
準パターンに幻して認識処理を行なうよ・うにしたので
、特徴空間の次元の削減や正相1にともなう分類漏れの
現象が少なくなり、演算量を減少しつつ最1冬言忍識率
をj)δめることかできる第1]点が得られる。
例えば、いま対象力チコリパターン数m−4000、代
表標姻パターン数200.特1抄空間を16X16X8
−2048S次元、従来の次元圧縮による分類のための
空間を8X8X4−256次元とした場合の演算量は、 従来の手法1000X256次元 本手法 ・200x20718次元 となり、200x2048/4.0OOx256−21
5に短縮されることか分かる。
表標姻パターン数200.特1抄空間を16X16X8
−2048S次元、従来の次元圧縮による分類のための
空間を8X8X4−256次元とした場合の演算量は、 従来の手法1000X256次元 本手法 ・200x20718次元 となり、200x2048/4.0OOx256−21
5に短縮されることか分かる。
つまり、この発明では多数のカテゴリパターンをそれよ
りも少ない字種の代表標準パターンにクラスクリングす
る点が特徴であり、クラスタリングの数を減らずことに
より、従来の分類処理のノ\−ト規模のままで性能を著
しく向上さ−(主ることが可能になる、というわしすで
必る。
りも少ない字種の代表標準パターンにクラスクリングす
る点が特徴であり、クラスタリングの数を減らずことに
より、従来の分類処理のノ\−ト規模のままで性能を著
しく向上さ−(主ることが可能になる、というわしすで
必る。
第1図はこの発明の実施例を示すブロック図、第2図は
この発明の詳細な説明するためのフロチャー1−8第3
図は代表標準パターンと構成標準パターンを決定する方
法を説明するためのフローチャー1・、第4図は文字認
識の従来方法を説明するためのフローチャー1・である
。 符−冒説明 1・・・未知パターンバッフアノモリ、2・・・知似度
演算回路、3・・・辞書読出し回路、4・代表標準パタ
ーン辞書、5・・+ii成標〈1(パターン辞1−1」
、6・・・最大価検出回路、7・・・対応構成標(1(
パターンう−−ソル、8・・・S忍識杆i果ハソファメ
モリ。
この発明の詳細な説明するためのフロチャー1−8第3
図は代表標準パターンと構成標準パターンを決定する方
法を説明するためのフローチャー1・、第4図は文字認
識の従来方法を説明するためのフローチャー1・である
。 符−冒説明 1・・・未知パターンバッフアノモリ、2・・・知似度
演算回路、3・・・辞書読出し回路、4・代表標準パタ
ーン辞書、5・・+ii成標〈1(パターン辞1−1」
、6・・・最大価検出回路、7・・・対応構成標(1(
パターンう−−ソル、8・・・S忍識杆i果ハソファメ
モリ。
Claims (1)
- 1)代表標準パターン辞書と、この代表標準パターンの
近傍のカテゴリからなる構成標準パターン辞書と、代表
標準パターンコードと構成標準パターンコードとを対応
付ける対応標準パターンテーブルとを備え、次元の削減
や圧縮をしていない特徴空間で代表標準パターン辞書に
よる未知パターンの分類処理を行なった後、1位の代表
標準パターンに対応する構成標準パターン辞書とマッチ
ングをとって未知パターンを認識することを特徴とする
文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1211369A JPH0375890A (ja) | 1989-08-18 | 1989-08-18 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1211369A JPH0375890A (ja) | 1989-08-18 | 1989-08-18 | 文字認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0375890A true JPH0375890A (ja) | 1991-03-29 |
Family
ID=16604826
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1211369A Pending JPH0375890A (ja) | 1989-08-18 | 1989-08-18 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0375890A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6263316A (ja) * | 1986-06-04 | 1987-03-20 | Murata Mach Ltd | 無人車の誘導装置 |
-
1989
- 1989-08-18 JP JP1211369A patent/JPH0375890A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6263316A (ja) * | 1986-06-04 | 1987-03-20 | Murata Mach Ltd | 無人車の誘導装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0325233B1 (en) | Character string recognition system | |
JP2005242579A (ja) | 文書処理装置、文書処理方法、および文書処理プログラム | |
US9047655B2 (en) | Computer vision-based methods for enhanced JBIG2 and generic bitonal compression | |
JPS5991582A (ja) | 文字読取装置 | |
JPH0375890A (ja) | 文字認識装置 | |
JPS5814710B2 (ja) | パタ−ン分類装置 | |
JPH024033B2 (ja) | ||
JPS6315383A (ja) | パタン照合装置 | |
JPH0766423B2 (ja) | 文字認識装置 | |
JP2851865B2 (ja) | 文字認識装置 | |
JP2728117B2 (ja) | 文字認識装置 | |
JP2792063B2 (ja) | 文字認識辞書作成方式 | |
JPH0259504B2 (ja) | ||
JP2570311B2 (ja) | 文字列認識装置 | |
JPS60138689A (ja) | 文字認識方法 | |
CN117975489A (zh) | 繁体字的识别方法、系统及存储介质 | |
JPH07160885A (ja) | カラー画像認識方法 | |
JPS62281089A (ja) | 画像処理方法 | |
KR19990010213A (ko) | 매칭 속도를 개선한 문자 인식방법 | |
JPS61148585A (ja) | 文字認識装置 | |
JPS63208182A (ja) | パタ−ン認識装置 | |
JPH01282691A (ja) | 文字認識方式 | |
JPS59188783A (ja) | 文字判定処理方式 | |
JPS6116381A (ja) | 光学式文字読取装置 | |
JPS62281094A (ja) | パタ−ン情報認識方法 |