JPH05135205A - Character recognition device - Google Patents
Character recognition deviceInfo
- Publication number
- JPH05135205A JPH05135205A JP3322579A JP32257991A JPH05135205A JP H05135205 A JPH05135205 A JP H05135205A JP 3322579 A JP3322579 A JP 3322579A JP 32257991 A JP32257991 A JP 32257991A JP H05135205 A JPH05135205 A JP H05135205A
- Authority
- JP
- Japan
- Prior art keywords
- character
- circuit
- pattern
- similarity
- discrimination
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Character Discrimination (AREA)
Abstract
Description
【0001】[0001]
【産業上の利用分野】本発明は文字認識装置に関し、詳
しくは、多段階のパターンマッチングによる判別処理を
おこなう文字認識装置に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character recognition device, and more particularly to a character recognition device for performing discrimination processing by multi-step pattern matching.
【0002】[0002]
【従来の技術】一般的なパターンマッチング手法を用い
る文字認識装置の処理は、図5に示すフローチャートの
ように行われる。先ず、入力された文書画像から1文字
づつ画像を切り出す。次いで、この文字画像について特
定の画像変換を施して特徴となるパターンを抽出する。
ここで、用いられた画像変換により得られるパターンの
特徴を、予め字種ごとに格納してある辞書部を参照し
て、辞書パターンとの間で順次パターンマッチングによ
る比較をおこない、最も類似している字種を認識結果と
して出力する。2. Description of the Related Art The processing of a character recognition device using a general pattern matching method is performed as shown in the flowchart of FIG. First, an image is cut out from the input document image character by character. Next, a specific image conversion is performed on this character image to extract a characteristic pattern.
Here, the feature of the pattern obtained by the image conversion used is referred to the dictionary part stored in advance for each character type, and compared with the dictionary pattern by sequential pattern matching to find the most similar. Outputs the existing character type as the recognition result.
【0003】この字種判別処理は、演算量の削減と判別
精度向上のため複数の段階に分けて行われる。つまり、
初めは大まかなパターンマッチング処理により、次はさ
らに詳細なパターンマッチング処理をするというように
して候補が絞り込まれる。このフローチャートでは、分
類処理と認識処理との2段階により字種の判別が行われ
る。なお、字種の判別を複数の段階により行う場合、判
別処理ごとにそれぞれ異なる手法で抽出したパターンを
用いることにより認識精度を向上させている。This character type discrimination processing is performed in a plurality of stages in order to reduce the amount of calculation and improve the discrimination accuracy. That is,
The candidates are narrowed down by first performing rough pattern matching processing and then performing more detailed pattern matching processing. In this flowchart, the character type is discriminated by two steps of classification processing and recognition processing. When the character type is discriminated in a plurality of steps, the recognition accuracy is improved by using patterns extracted by different methods for each discriminating process.
【0004】図6は、従来用いられている字種判別を行
うための回路構成を示すブロック図である。図に示され
るように、分類処理部1は、認識しようとする文字画像
から特徴抽出回路3により抽出された特徴パターンを格
納する分類特徴用記憶装置11と、辞書パターンを格納
した分類辞書用記憶装置12と、記憶装置12の辞書パ
ターンを記憶装置11に格納されている認識対象の特徴
パターンと順に比較してそれぞれの類似度を求めるパタ
ーンマッチング回路13と、比較された辞書パターンに
ついて文字コード発生回路4から送られてくる文字コー
ドをその類似度の順に整列させるソート回路14とから
構成される。FIG. 6 is a block diagram showing a circuit configuration for performing conventionally used character type discrimination. As shown in the figure, the classification processing unit 1 includes a classification feature storage device 11 that stores a feature pattern extracted by the feature extraction circuit 3 from a character image to be recognized, and a classification dictionary storage that stores a dictionary pattern. The device 12, a pattern matching circuit 13 that sequentially compares the dictionary pattern of the storage device 12 with the recognition target feature pattern stored in the storage device 11 to obtain the degree of similarity, and character code generation for the compared dictionary pattern. The sorting circuit 14 arranges the character codes sent from the circuit 4 in the order of similarity.
【0005】この分類処理部1により分類処理された結
果は、複数の候補文字の文字コードとして類似度の順番
とともに出力されていったんワークメモリ5へ格納さ
れ、次いで認識処理部2とアドレス発生回路6へ送られ
る。アドレス発生回路6は、候補文字の各文字コードか
ら、それぞれ該当する認識処理用記憶装置22のアドレ
スを生成して認識処理部2へ送る。認識処理部2は、分
類処理部1とほぼ同様に構成されており、同様な判別処
理を実行し、その処理結果として最も類似度の大きい文
字コードが選択・出力される。なお、ソート回路24へ
は、ワークメモリ5内の文字コードがそのまま入力され
る。The results of the classification processing by the classification processing unit 1 are output as character codes of a plurality of candidate characters together with the order of similarity, and are temporarily stored in the work memory 5, and then the recognition processing unit 2 and the address generation circuit 6 are provided. Sent to. The address generation circuit 6 generates an address of the corresponding recognition processing storage device 22 from each character code of the candidate character and sends it to the recognition processing unit 2. The recognition processing unit 2 is configured almost the same as the classification processing unit 1, executes the same discrimination processing, and selects and outputs the character code with the highest similarity as the processing result. The character code in the work memory 5 is directly input to the sort circuit 24.
【0006】[0006]
【発明が解決しようとする課題】ところで、上述した従
来の文字認識装置は、認識率の向上と演算量の削減のた
め字種判別処理の段数を増やそうとすると、増やした段
数分の判別回路が必要となり、回路規模が大きくなって
しまう問題がある。これらの回路をゲートアレイ等のA
SICで構成する場合も、文字候補のコードを受渡しす
るワークメモリについてもそれぞれ数千ゲート必要とな
り、非効率的である等の問題があった。本発明は上記問
題点を解決するためになされたもので、その目的とする
ところは、比較的小規模な回路構成であってしかも高精
度な文字認識装置を提供することにある。By the way, in the above-mentioned conventional character recognition device, when an attempt is made to increase the number of stages of the character type discrimination processing in order to improve the recognition rate and reduce the amount of calculation, the discrimination circuits corresponding to the increased number of stages are used. However, there is a problem that the circuit scale becomes large. These circuits are
Even when the SIC is used, several thousand gates are required for each work memory for passing the character candidate code, which is inefficient. The present invention has been made to solve the above problems, and an object of the present invention is to provide a highly accurate character recognition device having a relatively small circuit configuration.
【0007】[0007]
【課題を解決するための手段】上記目的を達成するため
に、第1の発明は、光学的に入力された文字画像から、
互いに異なる方法を用いて複数種類の特徴パターンを抽
出するパターン抽出手段と、異なる抽出方法ごとに得ら
れる特徴パターンを予め文字コードとともに格納した辞
書部と、辞書部の特徴パターンを順に呼び出し、抽出し
た特徴パターンと比較して類似度を求めるパターンマッ
チング回路と、類似度の大きい文字コードを保持すると
ともに類似度に応じて文字コードの順番を差し替えるソ
ート回路とを備えた文字認識装置において、パターンマ
ッチング回路で求められた類似度に判別段階を表すコー
ドを付加する手段と、同一文字画像から得られた複数種
類の文字パターンについて、1対のパターンマッチング
回路およびソート回路を繰り返し用いて多段回の文字判
別をおこなわせる手段とを備えたことを特徴とする。In order to achieve the above-mentioned object, a first invention is that an optically input character image
Pattern extracting means for extracting a plurality of types of characteristic patterns using mutually different methods, a dictionary unit in which the characteristic patterns obtained for each of the different extraction methods are stored in advance with a character code, and the characteristic patterns of the dictionary unit are sequentially called and extracted. A pattern matching circuit comprising a pattern matching circuit for obtaining a similarity by comparing with a characteristic pattern and a sort circuit for holding a character code having a high similarity and changing the order of the character codes according to the similarity. A means for adding a code indicating a discrimination step to the degree of similarity determined in step S1, and a plurality of types of character patterns obtained from the same character image are repeatedly used by a pair of pattern matching circuits and sort circuits to perform character discrimination. And a means for performing.
【0008】第2の発明は、第1の発明において、抽出
した特徴パターンを多次元ベクトルとして表わす手段を
備えたことを特徴とする。A second invention is characterized in that in the first invention, there is provided means for expressing the extracted feature pattern as a multidimensional vector.
【0009】[0009]
【作用】本発明においては、パターン抽出手段により抽
出された文字画像の特徴パターンは多次元ベクトルとし
て表される。また、パターンマッチング回路で求められ
た類似度に判別段階を表すコードが付加されて判別段階
の識別が可能になる。さらに、1対のパターンマッチン
グ回路およびソート回路が繰り返し使用されて、抽出特
徴パターンの種類ごとに多段回の文字判別がおこなわれ
る。In the present invention, the characteristic pattern of the character image extracted by the pattern extracting means is represented as a multidimensional vector. In addition, a code indicating a discrimination step is added to the similarity obtained by the pattern matching circuit, so that the discrimination step can be identified. Furthermore, a pair of pattern matching circuits and sort circuits are repeatedly used to perform multistage character determination for each type of extracted feature pattern.
【0010】[0010]
【実施例】以下、図に沿って本発明の実施例を説明す
る。図1は本発明を適用した文字認識装置の要部の構成
を示すブロック図である。図において、31は特徴抽出
回路であり、認識しようとする文字画像から、判別段階
ごとに異なる手法を用いて特徴パターンを抽出し、その
特徴パターンを多次元ベクトルとして表し特徴用記憶装
置34へ送る。アドレス発生回路32は、判別段階識別
コードと候補文字コードに基づき、辞書パターン参照用
のアドレスを生成して、辞書用記憶装置33および特徴
用記憶装置34へ送る。とくに、文字画像を最初に判別
処理する際は、このアドレス発生回路32が辞書用記憶
装置33の全ての字種についてのアドレスを順次発生す
る。Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram showing a configuration of a main part of a character recognition device to which the present invention is applied. In the figure, 31 is a feature extraction circuit, which extracts a feature pattern from a character image to be recognized by using a different method for each discrimination step, represents the feature pattern as a multidimensional vector, and sends it to the feature storage device 34. .. The address generation circuit 32 generates an address for referring to the dictionary pattern based on the discrimination stage identification code and the candidate character code, and sends it to the dictionary storage device 33 and the characteristic storage device 34. In particular, when the character image is first discriminated, the address generation circuit 32 sequentially generates addresses for all the character types in the dictionary storage device 33.
【0011】辞書部としての辞書用記憶装置33は、各
字種ごとの代表的な特徴パターンが各判別段階別に辞書
パターンとして格納されており、アドレスが指定される
と該当する辞書パターンを多次元ベクトルとして、パタ
ーンマッチング回路35へ送る。この実施例では辞書用
記憶装置33に各判別段階別の辞書パターンを格納した
ことにより、記憶装置が小型化される。特徴用記憶装置
34は、認識対象の文字画像についての特徴パターンを
各判別段階別に多次元ベクトルとして一時記憶し、判別
段階順に特徴パターンをパターンマッチング回路35へ
送る。The dictionary storage device 33 as a dictionary unit stores typical characteristic patterns for each character type as dictionary patterns for each discrimination step, and when an address is designated, the corresponding dictionary pattern is multidimensional. It is sent to the pattern matching circuit 35 as a vector. In this embodiment, by storing the dictionary pattern for each discrimination stage in the dictionary storage device 33, the storage device can be downsized. The characteristic storage device 34 temporarily stores the characteristic pattern of the character image to be recognized as a multidimensional vector for each discrimination step, and sends the characteristic pattern to the pattern matching circuit 35 in the discrimination step order.
【0012】パターンマッチング回路35は、多次元ベ
クトルとして入力された特徴パターンを、順次入力され
る辞書パターンと比較し、後述するアルゴリズムにより
類似度を算出してソート回路39へ送る。判別段階識別
回路36は、その時点で行われている判別処理の段階を
判別段階識別コードとして、アドレス発生回路32,セ
レクタ38およびソート回路39へ送る。文字コード発
生回路37は、パターンマッチング回路35からソート
回路39へ類似度が送られるごとに、その比較された辞
書パターンの文字コードを生成してセレクタ38へ送
る。The pattern matching circuit 35 compares the feature pattern input as a multidimensional vector with the dictionary patterns sequentially input, calculates the degree of similarity by an algorithm described later, and sends it to the sorting circuit 39. The discrimination stage identification circuit 36 sends the stage of the discrimination process being performed at that time to the address generation circuit 32, the selector 38 and the sorting circuit 39 as a discrimination stage identification code. The character code generation circuit 37 generates a character code of the compared dictionary pattern and sends it to the selector 38 every time the similarity is sent from the pattern matching circuit 35 to the sort circuit 39.
【0013】セレクタ38は、入力された判別段階識別
コードの内容が初回の判別処理であれば文字コード発生
回路37から出力された文字コードをソート回路39へ
送り、判別段階識別コードの内容が初回の判別処理でな
ければソート回路39から出力される候補文字の文字コ
ードをソート回路39へ送る。ソート回路39は、類似
度が大きい辞書パターンについて、その類似度を大きい
順に整列させ次段の判別処理で用いられる上位N位の候
補文字の文字コードを保持し、その文字コードをアドレ
ス発生回路32、セレクタ38および外部へ送る。The selector 38 sends the character code output from the character code generation circuit 37 to the sort circuit 39 if the content of the input discrimination stage identification code is the first discrimination processing, and the content of the discrimination stage identification code is the first time. If not, the character code of the candidate character output from the sorting circuit 39 is sent to the sorting circuit 39. The sorting circuit 39 arranges the dictionary patterns having a high degree of similarity in descending order of the degree of similarity, holds the character codes of the upper N candidate characters used in the discrimination process in the next stage, and stores the character codes in the address generating circuit 32. , Selector 38 and the outside.
【0014】次に、パターンマッチング回路35におけ
る類似度を求める処理について説明する。類似度は、2
つのパターン間のマッチングの度合いを表す数値であ
り、類似度の大きいほど2つのパターンは似ていること
を示す。本発明では、各判別段階で用いる特徴パターン
を多次元空間内のベクトルとして考えることにより、類
似度Sjが数1から求められる。Next, the process of obtaining the degree of similarity in the pattern matching circuit 35 will be described. The similarity is 2
It is a numerical value indicating the degree of matching between two patterns, and the higher the degree of similarity, the more similar the two patterns are. In the present invention, the similarity Sj is obtained from the equation 1 by considering the feature pattern used in each discrimination step as a vector in the multidimensional space.
【0015】[0015]
【数1】 [Equation 1]
【0016】なお、式中の|A|、|B|はベクトルの
絶対値を表し、(A・B)はベクトルA,Bの内積を表
す。ここで、A=(a1,a2,・・・an)、B=
(b1,b2,・・・bn)とすれば、それぞれ数2,
数3,数4の関係が得られる。In the equation, | A | and | B | represent the absolute value of the vector, and (AB) represents the inner product of the vectors A and B. Here, A = (a1, a2, ... An), B =
If (b1, b2, ... bn), then the number 2,
The relationships of Equations 3 and 4 are obtained.
【0017】[0017]
【数2】 [Equation 2]
【0018】[0018]
【数3】 [Equation 3]
【0019】[0019]
【数4】 [Equation 4]
【0020】また、入力文字画像から抽出した特徴パタ
ーンをAとし、字種Jの辞書パターンをBjとすると、
パターンマッチング回路35はすべての候補文字の辞書
パターンBjに対して数1の演算を繰り返す。ここで|
A|は1回の判別処理の間一定であり、また、|Bj|
は既知であるから、Gj=1/|Bj|として辞書用記
憶装置の中に予め書き込んでおくと、実際の判別式は、
数5のようになる。When the characteristic pattern extracted from the input character image is A and the dictionary pattern of the character type J is Bj,
The pattern matching circuit 35 repeats the operation of Expression 1 for the dictionary patterns Bj of all candidate characters. Where |
A | is constant during one discrimination process, and | Bj |
Is already known, so if Gj = 1 / | Bj | is written in the dictionary storage device in advance, the actual discriminant is
It becomes like the number 5.
【0021】[0021]
【数5】 [Equation 5]
【0022】これらの結果から、パターンマッチング回
路35の内部構成は図2のようになる。すなわち、積和
演算器41では、数4によりai,biが入力されて内
積が求められる。さらに、乗算器42では、数5により
Gjと積和演算器41からの内積とから類似度Sjが求
められる。このようにして、特徴パターンを多次元ベク
トルとして表し、それらの内積を求めることにより類似
度を求める場合、ベクトルの次元数にとらわれることな
く類似度が求められる。そのため、実際の多段階判別処
理において類似度を求める場合、各判別段階ごとに比較
する特徴パターンがそれぞれ異なる次元数のベクトルと
して表されていても、パターンマッチング回路35を共
有することが可能になる。From these results, the internal structure of the pattern matching circuit 35 is as shown in FIG. That is, in the product-sum calculator 41, ai and bi are input by the equation 4 and the inner product is obtained. Further, in the multiplier 42, the similarity Sj is obtained from Gj and the inner product from the product-sum calculator 41 according to Equation 5. In this way, when the feature pattern is represented as a multidimensional vector and the similarity is obtained by obtaining the inner product of them, the similarity can be obtained regardless of the number of dimensions of the vector. Therefore, when the degree of similarity is obtained in the actual multi-step discrimination process, the pattern matching circuit 35 can be shared even if the characteristic patterns to be compared for each discrimination step are represented as vectors having different numbers of dimensions. ..
【0023】次に、ソート回路39について説明する。
図3はソート回路39の構成を示すブロック図であり、
図4はソート回路39を構成するソートユニット51の
内部構成を示すブロック図である。このソート回路39
については、既に本出願人により出願されたものである
(特開昭62−237523号)。このソート回路39
は、候補文字の個数と同数のN個のソートユニット51
により構成されており、さらにソートユニット51は、
それぞれ図4のようにデータ保存用のラッチ回路52、
データ比較用のコンパレータ53、およびデータセレク
タ54から構成される。Next, the sorting circuit 39 will be described.
FIG. 3 is a block diagram showing the configuration of the sort circuit 39.
FIG. 4 is a block diagram showing the internal configuration of the sorting unit 51 that constitutes the sorting circuit 39. This sort circuit 39
Is already filed by the present applicant (JP-A-62-237523). This sort circuit 39
Is N sort units 51, which is the same as the number of candidate characters.
The sorting unit 51 further comprises
As shown in FIG. 4, respectively, a latch circuit 52 for storing data,
It is composed of a comparator 53 for data comparison and a data selector 54.
【0024】ソートユニット51が例えば上位からM番
目(1≦M≦N)に位置するものとすると、ソートユニ
ット51は類似度が第M位のデータ(類似度、文字コー
ド等)を保持している。新しくソート回路39内にデー
タが入力されると、両者の類似度が比較される。新たに
入力されたデータの類似度がそれまで保持されていたデ
ータよりも大きければ第M位のデータを下位ユニット
(M+1)へ転送し、同時に上位ユニット(M−1)か
ら転送されたデータを第M位のデータとして取り込み保
持する。反対に、第M位のデータの方が大きければ、第
M位のデータを保持したまま、新しくソート回路39に
入力されたデータを下位のユニットへ転送する。これら
の動作を全てのソートユニット51が同時に行うことに
より、ソート回路39全体でのデータ並べ替え動作が実
現される。Assuming that the sorting unit 51 is located, for example, Mth (1≤M≤N) from the top, the sorting unit 51 holds data whose similarity is Mth (similarity, character code, etc.). There is. When data is newly input into the sorting circuit 39, the similarities between the two are compared. If the similarity of the newly input data is larger than the data held until then, the Mth data is transferred to the lower unit (M + 1), and at the same time, the data transferred from the upper unit (M-1) is transferred. It is captured and held as Mth data. On the contrary, if the Mth data is larger, the data newly input to the sort circuit 39 is transferred to the lower unit while the Mth data is held. When all sort units 51 perform these operations at the same time, the data rearrangement operation of the entire sort circuit 39 is realized.
【0025】また、ソート回路39は、前回の判別処理
の結果を保持したままでその回のデータの並べ替え動作
を行う必要がある。そのためには、判別段階の異なるデ
ータが互いに混じり合わないように、判別段階識別コー
ドを類似度の上位ビットとしてデータに付加するととも
に、その回の識別コードを前回の識別コードよりも大き
な数値として表しておく。例えば、4段階の判別処理を
行う場合、1回目の識別コードを“0”として、2回目
以降を順にインクリメントしてそれぞれ“1”,
“2”,“3”とする。このようにすると、各段階で判
別処理されて得られたデータは処理段階が識別され、デ
ータの混じり合いを防ぐことが可能になる。Further, the sorting circuit 39 needs to carry out the data rearranging operation for the current time while holding the result of the previous discrimination processing. For that purpose, the discrimination stage identification code is added to the data as the higher order bit of the similarity so that the data of different discrimination stages are not mixed with each other, and the discrimination code of that time is expressed as a numerical value larger than the previous discrimination code. Keep it. For example, when performing a four-step discrimination process, the identification code for the first time is set to "0", and the second and subsequent times are sequentially incremented to "1",
Set to "2" and "3". By doing so, the processing stage is identified for the data obtained by the discrimination process at each stage, and it becomes possible to prevent the data from being mixed.
【0026】さらには、文字候補として保持された最下
位Nの文字コードをソート回路39から出力されるよう
にしておき、これをそのときにパターンマッチング処理
を行う字種の文字コードとして用いれば、新しいデータ
をソート回路39に入力することにより、次の処理のた
めの文字コードが押し出されて出力されて、文字候補の
参照が容易になる。このように実施例では、比較する特
徴パターンを多次元ベクトルとして表すことにより、次
元数だけが異なる同様の類似度演算により字種を判別で
き、同一のパターンマッチング回路35およびソート回
路39を繰り返し使用して、抽出パターンの種類ごとに
多段回の判別処理をおこなうことが可能になる。また、
パターンマッチング回路35で求めた類似度に判別段階
を表すコードを付加することにより、異なった判別段階
のデータが混ざり合わないようにすることができる。そ
れにより、認識率の向上と演算量の削減のため字種判別
処理の段数を増やす場合でも、何ら回路規模を大きくす
る必要がなくなり、文字認識装置の回路部分を大幅に小
型化できるようになる。Furthermore, if the lowest N character code held as a character candidate is output from the sorting circuit 39 and this is used as the character code of the character type for which the pattern matching processing is performed at that time, By inputting new data to the sorting circuit 39, the character code for the next process is pushed out and output, and it becomes easy to refer to the character candidates. As described above, in the embodiment, by expressing the characteristic patterns to be compared as a multidimensional vector, the character type can be discriminated by the similar similarity calculation which is different only in the number of dimensions, and the same pattern matching circuit 35 and sort circuit 39 are repeatedly used. Then, it is possible to perform the multistage determination process for each type of extraction pattern. Also,
By adding a code representing a discrimination step to the similarity obtained by the pattern matching circuit 35, it is possible to prevent data of different discrimination steps from being mixed together. As a result, even if the number of stages of character type discrimination processing is increased to improve the recognition rate and reduce the amount of calculation, there is no need to increase the circuit scale at all, and the circuit portion of the character recognition device can be significantly downsized. ..
【0027】[0027]
【発明の効果】以上述べたように本発明によれば、パタ
ーン抽出手段により抽出された文字画像の特徴パターン
を多次元ベクトルとして表すとともに、パターンマッチ
ング回路で求めた類似度に判別段階を表すコードを付加
したことにより、1対のパターンマッチング回路および
ソート回路を繰り返し使用して、抽出パターンの種類ご
とに多段回の文字判別をおこなうことが可能になる。そ
れにより、回路を比較的小規模な構成にしたままで高精
度の文字認識が可能になる。As described above, according to the present invention, the characteristic pattern of the character image extracted by the pattern extracting means is represented as a multidimensional vector, and the similarity degree obtained by the pattern matching circuit indicates the discrimination step. With the addition of, it becomes possible to repeatedly use a pair of pattern matching circuits and sort circuits to perform multistage character determination for each type of extraction pattern. As a result, highly accurate character recognition is possible with the circuit kept in a relatively small size.
【図1】本発明の実施例の要部の構成を示すブロック図
である。FIG. 1 is a block diagram showing a configuration of a main part of an embodiment of the present invention.
【図2】パターンマッチング回路の内部構成を示すブロ
ック図である。FIG. 2 is a block diagram showing an internal configuration of a pattern matching circuit.
【図3】ソート回路の構成を示すブロック図である。FIG. 3 is a block diagram showing a configuration of a sorting circuit.
【図4】ソートユニットの内部構成を示すブロック図で
ある。FIG. 4 is a block diagram showing an internal configuration of a sorting unit.
【図5】本発明が適用される文字認識装置の全体の処理
動作を示すフローチャートである。FIG. 5 is a flowchart showing the overall processing operation of the character recognition device to which the present invention is applied.
【図6】従来例の回路構成を示すブロック図である。FIG. 6 is a block diagram showing a circuit configuration of a conventional example.
31 特徴抽出回路 32 アドレス発生回路 33 辞書用記憶装置 34 特徴用記憶装置 35 パターンマッチング回路 36 判別段階識別回路 37 文字コード発生回路 38 セレクタ 39 ソート回路 41 積和演算器 42 乗算器 51 ソートユニット 52 ラッチ回路 53 コンパレータ 54 データセレクタ 31 Feature Extraction Circuit 32 Address Generation Circuit 33 Dictionary Storage Device 34 Feature Storage Device 35 Pattern Matching Circuit 36 Discrimination Stage Discrimination Circuit 37 Character Code Generation Circuit 38 Selector 39 Sorting Circuit 41 Product Sum Operator 42 Multiplier 51 Sorting Unit 52 Latch Circuit 53 Comparator 54 Data selector
フロントページの続き (72)発明者 本郷 保夫 東京都日野市富士町1番地 富士フアコム 制御株式会社内Front page continuation (72) Inventor Yasuo Hongo 1 Fuji-cho, Hino-shi, Tokyo Inside Fuji-Fuacom Control Co., Ltd.
Claims (2)
に異なる方法を用いて複数種類の特徴パターンを抽出す
るパターン抽出手段と、 異なる抽出方法ごとに得られる特徴パターンを予め文字
コードとともに格納した辞書部と、 辞書部の特徴パターンを順に呼び出し、抽出した特徴パ
ターンと比較して類似度を求めるパターンマッチング回
路と、 類似度の大きい文字コードを保持するとともに類似度に
応じて文字コードの順番を差し替えるソート回路と、 を備えた文字認識装置において、 パターンマッチング回路で求められた類似度に判別段階
を表すコードを付加する手段と、 同一文字画像から得られた複数種類の文字パターンにつ
いて、1対のパターンマッチング回路およびソート回路
を繰り返し用いて多段回の文字判別をおこなわせる手段
と、 を備えたことを特徴とする文字認識装置。1. A pattern extracting means for extracting a plurality of types of characteristic patterns from optically input character images by using different methods, and a characteristic pattern obtained for each of the different extracting methods are stored in advance together with a character code. The dictionary part and the pattern matching circuit that calls the feature patterns of the dictionary part in order and calculates the similarity by comparing with the extracted feature pattern, holds the character code with a high similarity, and changes the order of the character code according to the similarity. In a character recognition device including a sorting circuit for replacement, a means for adding a code indicating a discrimination step to the similarity obtained by the pattern matching circuit, and a pair of plural types of character patterns obtained from the same character image. Repeatedly use the pattern matching circuit and the sort circuit of to perform multi-stage character recognition A character recognition device comprising means and.
段を備えたことを特徴とする文字認識装置。2. The character recognition device according to claim 1, further comprising means for expressing the extracted feature pattern as a multidimensional vector.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3322579A JPH05135205A (en) | 1991-11-11 | 1991-11-11 | Character recognition device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3322579A JPH05135205A (en) | 1991-11-11 | 1991-11-11 | Character recognition device |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH05135205A true JPH05135205A (en) | 1993-06-01 |
Family
ID=18145269
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3322579A Withdrawn JPH05135205A (en) | 1991-11-11 | 1991-11-11 | Character recognition device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH05135205A (en) |
-
1991
- 1991-11-11 JP JP3322579A patent/JPH05135205A/en not_active Withdrawn
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0510634B1 (en) | Data base retrieval system | |
JP3077765B2 (en) | System and method for reducing search range of lexical dictionary | |
US4959870A (en) | Character recognition apparatus having means for compressing feature data | |
EP0325233B1 (en) | Character string recognition system | |
JP3689455B2 (en) | Information processing method and apparatus | |
JPH096924A (en) | Device and method for comparing electronic handwriting pattern with stored string | |
Kaukoranta et al. | A fast exact GLA based on code vector activity detection | |
US6035063A (en) | Online character recognition system with improved standard strokes processing efficiency | |
US5689584A (en) | Method of and apparatus for pattern recognition and method of creating pattern recognition dictionary | |
KR100671099B1 (en) | Method for comparing similarity of two images and method and apparatus for searching images using the same | |
JP3258063B2 (en) | Database search system and method | |
JP2001337993A (en) | Retrieval device and method for retrieving information by use of character recognition result | |
JP3151730B2 (en) | Database search system | |
JPH05135205A (en) | Character recognition device | |
EP0997839B1 (en) | Word recognizing apparatus and method for dynamically generating feature amount of word | |
EP1010128B1 (en) | Method for performing character recognition on a pixel matrix | |
JP3361564B2 (en) | High-speed matching method and apparatus | |
JP2993540B2 (en) | Ascending integer sequence data compression and decoding system | |
JP3706646B2 (en) | OCR control method and classification method and apparatus | |
JP2002183667A (en) | Character-recognizing device and recording medium | |
JP3115459B2 (en) | Method of constructing and retrieving character recognition dictionary | |
JP2890753B2 (en) | Feature selection method | |
JPH05225248A (en) | Data base retrieval system | |
Nardini et al. | Efficient and Effective Multi-Vector Dense Retrieval with EMVB | |
JP3666909B2 (en) | Character recognition apparatus and method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 19990204 |