JPH11224309A - Character recognition method and device - Google Patents

Character recognition method and device

Info

Publication number
JPH11224309A
JPH11224309A JP10026907A JP2690798A JPH11224309A JP H11224309 A JPH11224309 A JP H11224309A JP 10026907 A JP10026907 A JP 10026907A JP 2690798 A JP2690798 A JP 2690798A JP H11224309 A JPH11224309 A JP H11224309A
Authority
JP
Japan
Prior art keywords
classification
features
large classification
candidates
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10026907A
Other languages
Japanese (ja)
Inventor
Yoshimasa Kimura
義政 木村
Minoru Mori
稔 森
Teruo Akiyama
照雄 秋山
Toru Wakahara
徹 若原
Nobuo Miyamoto
信夫 宮本
Kenji Ogura
健司 小倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP10026907A priority Critical patent/JPH11224309A/en
Publication of JPH11224309A publication Critical patent/JPH11224309A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PROBLEM TO BE SOLVED: To perform classification at a high speed while keeping a broad classification rate at a fixed value by successively changing an initial value so as to minimize an operation amount required for hierarchical broad classification. SOLUTION: Relating to a broad classification part 4, a first stage classification circuit 41 calculates a distance between the n1 pieces (n0 >n1 ) of features specified in a broad classification constitution decision part 9 in the n0 pieces of the features of an input character pattern obtained from a feature extraction part 3 and the n1 pieces of the features of respective categories stored in a broad classification dictionary 5 and narrows the categories to c. pieces in the ascending order of the distance. A second stage classification circuit 42 calculates the distance between the n2 pieces (n0 >n2 >n1 ) pieces of the features specified in the broad classification constitution decision part 9 from the n0 pieces of the features and the n2 pieces of the features of the c1 pieces of the categories outputted from the first stage classification circuit 41 and narrows the categories to c2 pieces (c2 <c1 ) in the ascending order of the distance. The hierarchical broad classification of reducing a candidate number while increasing a feature number through the number of stages is performed similarly thereafter.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、文字認識方法およ
びその装置、特に高速に大分類を行うことのできる文字
認識方法およびその装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character recognition method and apparatus, and more particularly, to a character recognition method and apparatus capable of performing large-scale classification at high speed.

【0002】[0002]

【従来の技術】従来の文字認識方法および装置では入力
文字パターンとカテゴリ毎に作成した辞書との照合をと
ることにより認識する方法が多く採られている。認識対
象とする字種が数字、記号等のように数十のオーダであ
る場合には入力文字パターンとすべてのカテゴリとの間
で照合演算を施しても計算時間は比較的短い時間に留ま
るが、漢字の如く字種数が数千のオーダとなると計算時
間は単純に見積っても数字、記号の場合の百倍以上とな
る。
2. Description of the Related Art In a conventional character recognition method and apparatus, a method of recognizing an input character pattern by comparing the input character pattern with a dictionary created for each category is adopted in many cases. If the character type to be recognized is of the order of several tens, such as numbers and symbols, the calculation time is relatively short even if the collation operation is performed between the input character pattern and all categories. If the number of character types is in the order of thousands, such as kanji, the calculation time is more than one hundred times that of numbers and symbols, even if it is simply estimated.

【0003】[0003]

【発明が解決しようとする課題】そこで計算時間を短縮
すべく、まず大分類を行って候補を比較的少数に絞り、
次に絞られた候補に対して識別を行う処理法が採られて
いる。
Therefore, in order to reduce the calculation time, first, a large classification is performed to narrow down the candidates to a relatively small number.
Next, a processing method for identifying the narrowed candidates is adopted.

【0004】大分類における公知の方法としては、識別
木や組合せ論理に見られる如く入力文字パターンから抽
出された特徴の中で予め指定された特徴と閾値との間で
論理演算を行い、前記論理を満足したカテゴリを分類結
果とする方法がある。当該方法は処理が高速であるとい
う長所を有するが、特定の特徴の閾値論理により大分類
が行われるため、変形等により該特徴の特徴値が変動し
閾値外の値をとるようになると前記論理は満足しなくな
り、誤分類となる問題点がある。
[0004] As a well-known method in the large classification, a logic operation is performed between a predetermined feature and a threshold value among features extracted from an input character pattern as seen in an identification tree or combinational logic. There is a method in which a category satisfying is used as a classification result. Although this method has the advantage that the processing is fast, since the major classification is performed by the threshold logic of a specific feature, if the feature value of the feature fluctuates due to deformation or the like and takes a value outside the threshold, the logic is reduced. Is no longer satisfied, resulting in misclassification.

【0005】前記問題点の解決策として閾値を緩和して
論理の数を増やす方法、満足しない論理の数が予め定め
られた値に達するまでは当該カテゴリを候補として残し
ておく方法等がある。しかし、当該解決策は論理が大規
模化するため、処理時間の増大を招くうえ、特徴値の突
発的な変動に対応できる原理とはなっておらず、安定な
分類は依然として困難である。
As a solution to the above problem, there are a method of increasing the number of logics by relaxing the threshold value, and a method of leaving the category as a candidate until the number of unsatisfied logics reaches a predetermined value. However, since the solution has a large logic, the processing time is increased, and the solution is not based on a principle capable of coping with a sudden change in a feature value, and stable classification is still difficult.

【0006】別の公知の方法としては入力パターンから
得られた比較的多数の特徴と標準パターンとの間で距
離、類似度等を計算することにより大分類を行う方法が
ある。当該方法では、複数の特徴を用いた総合的判定と
なるため、少数個の特徴値が変動してもその他の多数個
の特徴値の変動が小さければ両者を合算した値は正常な
変動範囲内に留まり、安定な分類ができる長所がある。
しかし、距離、類似度等のベクトル演算は閾値論理に比
べて計算時間を要するという問題点がある。
As another known method, there is a method of performing a large classification by calculating a distance, a similarity, and the like between a relatively large number of features obtained from an input pattern and a standard pattern. In this method, since comprehensive judgment using a plurality of features is performed, even if a small number of feature values fluctuate, if the variation of other many feature values is small, the sum of the two values is within a normal variation range. And has the advantage of stable classification.
However, there is a problem in that vector operations such as distance and similarity require a longer calculation time than threshold logic.

【0007】計算時間の削減法として、分類回路を複数
個直列接続して階層構造を採るようにし、まず最前段の
階層では少数個の特徴を用いて粗く候補を絞り、次の階
層では特徴数を増加して精細な分類を行いさらに候補を
絞り、以降、前記処理の繰り返しにより最後段の階層に
おいて所望の候補数を得る階層的大分類法がある。しか
し、当該方法には各階層の特徴数を大きくし候補数を多
くとれば大分類率は高くなるものの計算時間は長くな
り、逆に特徴数を小さくし候補数を少なくとれば計算時
間は短いが大分類率が低下するという相矛盾する性質が
ある。また、各階層の分類率も相互に関連しており、各
階層の分類にかかる負荷を如何に適正配置するかは容易
ではない。
As a method of reducing the calculation time, a plurality of classification circuits are connected in series to adopt a hierarchical structure. First, the first hierarchical level roughly narrows down candidates using a small number of features, and the next hierarchical level reduces the number of features. There is a hierarchical large classification method that obtains a desired number of candidates in the last hierarchical level by repeating the above processing to further narrow down candidates by increasing the number of candidates. However, in this method, if the number of features in each layer is increased and the number of candidates is increased, the large classification rate is increased, but the calculation time is increased. However, there is a contradictory property that the large classification rate decreases. In addition, the classification rates of the respective layers are also related to each other, and it is not easy to appropriately arrange the load on the classification of the respective layers.

【0008】以上述べたように前記方法の階層内、階層
間には複雑な関係が存在するので、大分類率を一定値に
保持し、かつ、計算時間を最小化するための各段の使用
特徴数と絞り込む候補数の最適解を求めるという大分類
部の設計方法は確立されていないと言う問題点がある。
また、文字認識装置の用途によっては認識速度は遅速で
あっても誤読の極力低減が要求される場合から、誤読は
多くとも高速認識が要求される場合まで種々の要請があ
るものの、大分類部の調整により前記要請に応えるには
困難という問題点もあった。
As described above, since there is a complicated relationship between hierarchies in and between hierarchies of the above method, the use of each stage for maintaining the large classification rate at a constant value and minimizing the calculation time is used. There is a problem that a method of designing a large classification unit for finding an optimal solution of the number of features and the number of candidates to be narrowed down has not been established.
Also, depending on the application of the character recognition device, there are various requests from the case where the recognition speed is as low as possible, even if the recognition speed is slow, to the case where at most high speed recognition is required for the misreading. There is also a problem that it is difficult to respond to the above request by adjusting the above.

【0009】本発明は前記問題点を解決するためになさ
れたものであり、その目的とするところは大分類率を一
定値に保持しつつ高速に分類でき、かつ、高精度認識あ
るいは高速認識といった種々の要請に対応できる文字認
識方法および装置を提供することにある。
SUMMARY OF THE INVENTION The present invention has been made to solve the above-mentioned problems, and it is an object of the present invention to perform high-speed classification while maintaining a large classification rate at a constant value, and perform high-precision recognition or high-speed recognition. An object of the present invention is to provide a character recognition method and apparatus that can respond to various requests.

【0010】[0010]

【課題を解決するための手段】本発明は上記目的を達成
するため、入力文字パターンの特徴の全部または一部と
標準辞書の特徴の全部または一部との間で分類尺度を計
算することにより分類対象とする候補数を減少させる分
類回路を階層構造を成すように構成し、前段の階層から
後段の階層へと処理が進行するに伴い該分類回路の分類
に使用する特徴数を増加させながら分類対象とする候補
数を減少させていく階層的大分類手段と、前記階層的大
分類法における各階層の特徴数と候補数の設定とは、ま
ず各階層の特徴数と候補数との初期値を設定しており、
次に大分類率を予め定められた一定値に保持するという
拘束条件の下で前記階層的大分類に要する演算量を最小
化すべく前記初期値を逐次変更することにより行う大分
類構成決定手段と、前記階層的大分類法における各階層
の特徴数と候補数の設定とは、大分類率の目標値が指定
された場合には該目標値を前記一定値に置換し前記逐次
変更するようにされ、大分類処理速度の目標値が指定さ
れた場合には予め得られている大分類処理速度と大分類
率との関係から前記一定値を求め前記逐次変更するよう
にされ、かつ、前記2種類の指定を選択できるトレード
オフ機能設定手段と、を具備することを最も主要な特徴
とする。
The present invention achieves the above object by calculating a classification measure between all or some of the features of an input character pattern and all or some of the features of a standard dictionary. A classification circuit for reducing the number of candidates to be classified is configured to form a hierarchical structure, and the number of features used for classification of the classification circuit is increased while the processing proceeds from a preceding layer to a subsequent layer. Hierarchical large classification means for reducing the number of candidates to be classified and setting of the number of features and the number of candidates of each layer in the hierarchical large classification method are performed by first setting the initial number of features and the number of candidates in each layer. Value is set,
Next, a large classification configuration determining unit that sequentially changes the initial value so as to minimize the amount of computation required for the hierarchical large classification under the constraint that the large classification rate is held at a predetermined constant value. The setting of the number of features and the number of candidates for each layer in the hierarchical large classification method is such that when a target value of the large classification rate is specified, the target value is replaced with the fixed value and the sequential change is performed. When the target value of the large classification processing speed is designated, the constant value is obtained from the relationship between the previously obtained large classification processing speed and the large classification rate, and the value is sequentially changed. And a trade-off function setting means capable of selecting a type designation.

【0011】本発明の大分類構成決定手段は初期設定さ
れた各階層の特徴数と候補数とを逐次変更することによ
り準最適な特徴数と候補数とを発見する原理となってい
るので、階層内、階層間に複雑な関係が存在する場合で
も大分類部を容易に構築することができる。また、トレ
ードオフ機能設定手段により所望の大分類率あるいは処
理速度を選択して指定することにより前記性能を満足す
る大分類部を構築することができるので用途に応じたチ
ューニングが可能となる。
The principle of the large classification configuration determining means of the present invention is based on the principle of finding the sub-optimal feature number and candidate number by sequentially changing the initially set number of features and number of candidates in each hierarchy. Even when there is a complicated relationship between hierarchies or between hierarchies, a large classification unit can be easily constructed. Further, by selecting and specifying a desired large classification rate or processing speed by the trade-off function setting means, a large classification unit satisfying the above performance can be constructed, so that tuning according to the application can be performed.

【0012】[0012]

【発明の実施の形態】次に、本発明の実施例について図
面を参照して説明する。図1は本発明の一実施例を示す
文字認識装置のブロック構成図である。
Next, an embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram of a character recognition apparatus according to an embodiment of the present invention.

【0013】本実施例の文字認識装置は、文字パターン
入力部1と、前処理部2と、特徴抽出部3と、大分類部
4と、大分類辞書5と、識別部6と、識別辞書7と、認
識結果メモリ部8と、大分類構成決定部9と、トレード
オフ機能設定部10とから構成されている。
The character recognition device of this embodiment includes a character pattern input unit 1, a preprocessing unit 2, a feature extraction unit 3, a large classification unit 4, a large classification dictionary 5, a classification unit 6, a classification dictionary, 7, a recognition result memory unit 8, a large classification configuration determining unit 9, and a trade-off function setting unit 10.

【0014】文字パターン入力部1はスキャナ,テレビ
カメラ等の入力装置により文字パターンを取込み、前処
理部2は正規化・雑音除去等を行い、特徴抽出部3は認
識に使用するための特徴を抽出する。大分類部4は前記
文字パターンの特徴と大分類辞書5に格納されている特
徴との間でカテゴリ毎に距離計算を行い、得られた候補
を出力する。識別部6は大分類部4から出力された候補
を対象として前記文字パターンの特徴と識別辞書7に格
納されている特徴との間で距離計算を行い、得られた候
補を最終結果として認識結果メモリ部8に出力する。
A character pattern input unit 1 captures a character pattern by an input device such as a scanner or a television camera, a preprocessing unit 2 performs normalization and noise removal, and a feature extraction unit 3 stores features to be used for recognition. Extract. The major classification unit 4 calculates a distance for each category between the features of the character pattern and the features stored in the major classification dictionary 5, and outputs the obtained candidates. The identification unit 6 calculates a distance between the features of the character pattern and the features stored in the identification dictionary 7 for the candidates output from the large classification unit 4 and uses the obtained candidates as the final result as the recognition result. Output to the memory unit 8.

【0015】次に、本発明の大分類部4の動作を図2を
用いて説明する。図2は本発明の一実施例を示す大分類
部4の機能ブロック図であって、第1段分類回路41、
第2段分類回路42、…、第k段分類回路43、…、第
K段分類回路44から成る。
Next, the operation of the large classification unit 4 of the present invention will be described with reference to FIG. FIG. 2 is a functional block diagram of the large classifying unit 4 showing one embodiment of the present invention.
, A k-th stage classification circuit 43,..., A K-th stage classification circuit 44.

【0016】第1段分類回路41は特徴抽出部3から得
られた入力文字パターンのn0 個の特徴の中で大分類構
成決定部9で指定されたn1 個(n0 >n1 )の特徴
と、大分類辞書5に格納された各カテゴリの前記n1
の特徴との間で距離を計算し、該距離の昇順にカテゴリ
をc1 個に絞る。第2段分類回路42は前記n0 個の特
徴の中から大分類構成決定部9で指定された特徴n2
(n0 >n2 >n1 )と第1段分類回路41から出力さ
れたc1 個のカテゴリの前記n2 個の特徴との間で距離
を計算し、該距離の昇順にカテゴリをc2 個(c2 <c
1 )に絞る。
The first-stage classification circuit 41 selects n 1 (n 0 > n 1 ) specified by the large classification configuration determination unit 9 out of the n 0 features of the input character pattern obtained from the feature extraction unit 3. And the n 1 features of each category stored in the large classification dictionary 5 are calculated, and the categories are narrowed down to c 1 in ascending order of the distance. The second-stage classification circuit 42 outputs the n 2 features (n 0 > n 2 > n 1 ) designated by the large-class configuration determining unit 9 from the n 0 features, and outputs them from the first-stage classification circuit 41. A distance is calculated between the n 2 features of the c 1 categories and the categories are c 2 (c 2 <c) in ascending order of the distance.
1 ).

【0017】以下同様に、第k段分類回路43ではnk
個の特徴を用いてck 個の候補を得る操作を繰り返す。
前記処理においてはn1 <n2 <…<nk <…<nK
1>c2 >…>ck >…>cK となっており、段数を
経るに従って特徴数を増加させながら候補数を減少させ
る階層的大分類となっている。最終段の第K段分類回路
44からはcK 個の候補が出力される。
Similarly, in the k-th classifying circuit 43, n k
The operation of obtaining ck candidates using the above features is repeated.
In the process n 1 <n 2 <... < n k <... <n K,
c 1> c 2> ... has a> c k>...> c K , has a hierarchical major classification to reduce the number of candidates with increasing number of features in accordance undergo stages. C K candidates are output from the K-th classifying circuit 44 at the last stage.

【0018】いま、認識対象カテゴリ数をc0 、入力文
字パターンから得られた1個の特徴と辞書に格納されて
いる1個の特徴との間の距離計算に要する時間をΔtと
すると、階層的大分類を行わないときの距離計算時間T
0 は T0 =n0 ・c0 ・Δt (1) である。いま、第k段分類回路43で使用するnk 個の
特徴は前段の第(k−1)段分類回路nk-1 個の特徴を
包含しているものとする。このとき階層的大分類に要す
る距離計算時間Tは
Assuming that the number of categories to be recognized is c 0 and the time required to calculate the distance between one feature obtained from the input character pattern and one feature stored in the dictionary is Δt, Distance calculation time T when no major classification is performed
0 is T 0 = n 0 · c 0 · Δt (1). Now, n k-number of features to be used in the k-th stage classification circuit 43 is assumed to include the front of the (k-1) stage classification circuit n k-1 one feature. At this time, the distance calculation time T required for the hierarchical large classification is

【0019】[0019]

【数1】 (Equation 1)

【0020】となる。右辺第2項がnk ・ck-1 ではな
く(nk −nk-1 )・ck-1 となっているのはnk-1
の特徴の距離計算は既に前段で終了していることによ
る。距離計算時間の高速化率ηは次式で定義されるTに
対するT0 の比で表される。
## EQU1 ## Second term is not the n k · c k-1 ( n k -n k-1) · c k-1 and turned by the n k-1 or distance calculation feature of What is already completed in the preceding stage It depends. Distance speed ratio computation time η is expressed by the ratio of T 0 to T, which is defined by the following equation.

【0021】 η=T0 /T (3) 階層的大分類による処理量削減の効果を見るために、一
例として、K=3とし、n0 =500, c0 =3,500, n
1 =200, c1 =500, n2 =300, c2 =300, n3
=500 を用いると、式(1)〜(3)の計算によりη=
2.5 となり、距離計算に関しては2.5 倍の高速化が図ら
れることが分かる。
Η = T 0 / T (3) In order to see the effect of the processing amount reduction by the hierarchical large classification, as an example, K = 3, n 0 = 500, c 0 = 3,500, n
1 = 200, c 1 = 500 , n 2 = 300, c 2 = 300, n 3
= 500, η = 500 by the calculation of equations (1) to (3).
2.5, which means that the speed of distance calculation can be increased by 2.5 times.

【0022】次に、大分類構成決定部9の動作を図3、
図4、図5を用いて説明する。図3は本発明の一実施例
を示す大分類構成決定部9の機能ブロック図であって、
初期値設定回路91、演算量計算回路92、大分類パラ
メータ設定回路93、分類率テーブル94から成る。
Next, the operation of the large classification configuration determining unit 9 will be described with reference to FIG.
This will be described with reference to FIGS. FIG. 3 is a functional block diagram of the large classification configuration determining unit 9 showing one embodiment of the present invention.
It comprises an initial value setting circuit 91, a calculation amount calculation circuit 92, a large classification parameter setting circuit 93, and a classification rate table 94.

【0023】図4は大分類構成決定部9の処理フロー図
である。図5は分類率テーブル94の一実施例であっ
て、ni 個(i=1,2,...,I)の特徴により候補を
0 からcj 個(j=1,2,...,J)に絞ったときの
分類率r(i,j)(0≦r(i,j)≦1)が格納さ
れている。該r(i,j)は大量の学習データに用いた
認識実験により予め求められた値である。図でIは各階
層の分類で取り得る特徴数の種類数、Jは取り得る候補
数の種類数であり、いずれも予め与えられた数である。
FIG. 4 is a processing flowchart of the large classification configuration determining section 9. FIG. 5 shows an embodiment of the classification rate table 94, in which n i (i = 1, 2,..., I) candidates are selected from c 0 to c j (j = 1, 2,. .., J) is stored as the classification rate r (i, j) (0 ≦ r (i, j) ≦ 1). The r (i, j) is a value obtained in advance by a recognition experiment using a large amount of learning data. In the figure, I is the number of types of the number of features that can be taken in the classification of each layer, and J is the number of types of the number of candidates that can be taken, all of which are predetermined numbers.

【0024】初期値設定回路91はトレードオフ機能設
定部10より与えられる保持すべき大分類率の値r0
ら、各段で使用する特徴数と絞り込む候補数の初期値を
決定する。まず、Kを決定し(ステップ21)、各段に
おける分類率の目標値rt を rt =(r0 1/K (4) で求める(ステップ22)。本実施例では各段の分類率
の負荷分担を等負荷としたが、前段は軽くして後段へ行
くに従って重くする等、可変にしても良い。演算量計算
回路92は分類率テーブル94を構成するr(i,j)
の中からrt に近い値を取るK個の要素を選出し、該r
(i,j)のjの小さい順にrk (1) (k=1,
2,...,K)とおく(ステップ23)。図6はK=3,
I=5,J=5の場合の選出例を示す図であり、○印で
囲まれたr(4,1),r(3,3),r(1,5)が
選出されたr(i,j)であり、r1 (1) =r(4,
1),r2 (1 ) =r(3,3),r3 (1) =r(1,
5)と置き換えられる。K段を通過したときの大分類率
p
The initial value setting circuit 91 determines the initial value of the number of features used in each stage and the number of candidates to be narrowed down from the value r 0 of the large classification rate to be held provided by the trade-off function setting unit 10. First obtained by determining the K (step 21), the target value r t of classification rate in each stage r t = (r 0) 1 / K (4) ( step 22). In the present embodiment, the load sharing of the classification rate of each stage is equal, but the load may be variable, such as reducing the weight of the front stage and increasing the weight toward the rear stage. The operation amount calculation circuit 92 constructs the classification rate table 94 by r (i, j).
Are selected from among K elements taking a value close to r t ,
R k (1) (k = 1, k ) in ascending order of j in (i, j)
2, ..., K) (step 23). FIG. 6 shows K = 3,
It is a figure which shows the example of selection at the time of I = 5, J = 5, and r (4,1), r (3,3), r (1,5) enclosed with the (circle) mark selected r ( i, j), and r 1 (1) = r (4,
1), r 2 (1 ) = r (3, 3), r 3 (1) = r (1,
5) is replaced. The large classification rate r p of the time that has passed through the K stages

【0025】[0025]

【数2】 (Equation 2)

【0026】で求め、また、rk (1) で指定される特徴
数と候補数を用いて距離計算時間Tpを式(2)により
求める(ステップ24)。次に、分類率テーブル94に
おいてrk (1) に上下左右に隣接する4要素の中から乱
数で選出した値をrk (2) とする。
The distance calculation time T p is obtained by the equation (2) using the number of features and the number of candidates specified by r k (1) (step 24). Next, the values selected at random from among the four elements that are vertically and horizontally adjacent to each to r k (1) and r k (2) in the classification rate table 94.

【0027】図6にr(3,3)の上下左右に隣接する
4要素の例を□で囲んで示す。該r k (2) を用いてK段
を通過したときの分類率ru を式(5)により求め、ま
た、該rk (2) で指定される特徴数と候補数とを用いて
距離計算時間Tu を式(2)により求める(ステップ2
5)。
FIG. 6 shows that r (3, 3) is adjacent to the upper, lower, left and right sides.
Examples of the four elements are shown in squares. The r k (2)Using K
Classification rate r when passinguIs calculated by equation (5), and
The rk (2)Using the number of features and the number of candidates specified in
Distance calculation time TuIs obtained by Expression (2) (Step 2)
5).

【0028】大分類パラメータ設定回路93はδを予め
定めた許容値とし、次の3条件 r0 −δ≦ru ≦r0 +δ (6) ru >rp (7) Tu <Tp (8) を満足した場合は(ステップ26)、前記rk (2) に対
応する特徴数および候補数を大分類パラメータとして仮
登録し、ru の値をrp に代入する(ステップ27)。
The major classification parameter setting circuit 93 is set to the allowable value determined in advance [delta], the following three conditions r 0 -δ ≦ r u ≦ r 0 + δ (6) r u> r p (7) T u <T p If satisfied (8) (step 26), the r k corresponding features number and the number of candidates in (2) and temporarily registered as a large classification parameters, it substitutes the value of r u in r p (step 27) .

【0029】前記処理が終了すると、rk (2) に隣接す
る4要素の中から乱数で選出した値に対してステップ2
5からステップ27の処理を行う。前記処理を予め定め
た回数(L回)だけ繰り返す(ステップ28)。かよう
な処理により、保持すべき大分類率の値r0 に近い大分
類率を有しつつ距離計算時間Tを最小化する大分類パラ
メータが選ばれる。L回の試行終了後に大分類パラメー
タ設定回路93に残された特徴数、候補数が大分類構成
決定部9から出力され(ステップ29)、大分類部4の
処理に供せられる。
When the above processing is completed, the value selected by random numbers from the four elements adjacent to r k (2)
The processing from step 5 to step 27 is performed. The above process is repeated a predetermined number of times (L times) (step 28). By such a process, a large classification parameter that minimizes the distance calculation time T while having a large classification rate close to the value r 0 of the large classification rate to be held is selected. After the L trials, the number of features and the number of candidates left in the large classification parameter setting circuit 93 are output from the large classification configuration determination unit 9 (step 29), and are provided to the processing of the large classification unit 4.

【0030】次に、トレードオフ機能設定部10の動作
を図7,図8を用いて説明する。図7は処理速度/大分
類率のトレードオフテーブルの一実施例であり、M段階
の処理速度sm (m=1,2,...,M)に対する大分類
率rm から成る。sm ,rm は多数の学習データを用い
て予め求められている値である。一般にs1 <s 2
... <sM ,r1 >r2 ... >rM であり、処理速度
の高速化に伴い大分類率が低下するトレードオフの性質
を有している。
Next, the operation of the trade-off function setting unit 10
Will be described with reference to FIGS. FIG. 7 shows the processing speed / Oita
It is an example of a trade-off table of similarity, and is an M-stage.
Processing speed smLarge classification for (m = 1,2, ..., M)
Rate rmConsists of sm, RmUses a lot of learning data
This is a value that is obtained in advance. Generally s1<S Two<
...<SM, R1> RTwo>...> RMAnd processing speed
Of the trade-off that the large classification rate decreases with the speeding up
have.

【0031】図8はトレードオフ機能設定部10の処理
フロー図である。図8において、ユーザは所望する大分
類率rd 、または処理速度sd のいずれかを入力する
(ステップ31)。
FIG. 8 is a processing flowchart of the trade-off function setting section 10. In FIG. 8, the user inputs either the desired large classification rate r d or the processing speed s d (step 31).

【0032】rd が入力された場合は、トレードオフテ
ーブルに格納されたM個のrm の中でrd に最も近いr
m を選択し(ステップ32)、該rm を大分類構成決定
部9に送出する(ステップ33)。大分類構成決定部9
は該rm を保持すべき大分類率の値r0 に置換し、大分
類構成決定部9の処理により大分類パラメータを決定す
る(ステップ34)。
When r d is input, r closest to r d among the M r m stored in the trade-off table
Select m (step 32) and sends the r m in the major classification configuration determination section 9 (step 33). Major classification configuration decision unit 9
Is replaced by the value r 0 of the major classification rate should retain the r m, determines a large classification parameters by treatment of the large classification configuration determination section 9 (step 34).

【0033】sd が入力された場合は、トレードオフテ
ーブルに格納されたM個のsm の中でsd に最も近いs
m を選択し(ステップ35)、該sm に対応するrm
取り出し(ステップ36)、大分類構成決定部9に送出
する(ステップ33)。大分類構成決定部9は該rm
保持すべき大分類率の値r0 に置換し、大分類構成決定
部9の処理により大分類パラメータを決定する(ステッ
プ34)。
[0033] s if d is input, closest to s d in the M stored in the tradeoff table s m s
Select m (step 35), r m was removed (step 36) corresponding to the s m, and sends the major classification configuration determination section 9 (step 33). Major classification configuration determination section 9 is replaced by the value r 0 of the major classification rate should retain the r m, determines a large classification parameters by treatment of the large classification configuration determination section 9 (step 34).

【0034】ユーザは精度重視のときはrd を選択し、
速度重視のときはsd を選択することにより、目的に応
じた大分類率あるいは処理速度で動作する大分類部を実
現できる。これは分類性能と処理速度をトレードオフ的
選択となっている。
[0034] The user selects a r d when the precision-oriented,
By selecting sd when speed is important, it is possible to realize a large classification unit that operates at a large classification rate or processing speed according to the purpose. This is a trade-off between classification performance and processing speed.

【0035】かくして目標の大分類率を実現する大分類
部が自動で構成される。これにより認識率、処理速度の
側面でユーザの種々の要請に応えることができるように
なる。
In this way, a large classification unit for realizing a target large classification rate is automatically configured. This makes it possible to respond to various requests of the user in terms of recognition rate and processing speed.

【0036】本実施例は大分類構成決定部9の分類率テ
ーブル94で選出するrk(2)はrk( 1)の上下左右に隣接
する4要素の中から選んだが、これは上下左右に隣接す
る4要素に限ったことではなく、rk(1)を取り囲む8要
素等であっても良い。
In the present embodiment, rk (2) selected from the classification rate table 94 of the large classification configuration determining unit 9 is selected from four elements adjacent to rk ( 1) in the upper, lower, left and right directions. Is not limited to the four elements adjacent to, but may be eight elements surrounding rk (1) or the like.

【0037】本実施例はトレードオフ機能設定部10に
おいては大分類率あるいは処理速度を直接入力する方式
について説明したが、M段階ある大分類率あるいは処理
速度の任意の1個を指定する方式であっても本実施例と
同様の処理が可能である。
In the present embodiment, the system for directly inputting the large classification rate or the processing speed in the trade-off function setting section 10 has been described. Even in this case, the same processing as in the present embodiment can be performed.

【0038】以上、本発明を実施例に基づき具体的に説
明したが、本発明は前記実施例に限定されるものではな
く、その要旨を逸脱しない範囲において種々変更可能で
あることは言うまでもない。
As described above, the present invention has been specifically described based on the embodiments. However, it is needless to say that the present invention is not limited to the above-described embodiments and can be variously modified without departing from the gist thereof.

【0039】[0039]

【発明の効果】以上説明したように、本発明によれば階
層的大分類手段を採っており、かつ、大分類部を自動で
構築する機能を有しているため、指定した認識率を保持
しつつ高速な認識が行える系、あるいは指定した処理速
度を実現する系を容易に構築できる長所がある。また、
分類率テーブル、トレードオフテーブルは入力される文
字品質に応じて設定変更が可能なため、種々の用途に適
応できるという長所がある。
As described above, according to the present invention, since the hierarchical large classification means is employed and the function of automatically constructing the large classification part is provided, the specified recognition rate is maintained. There is an advantage that a system that can perform high-speed recognition while performing, or a system that achieves a specified processing speed can be easily constructed. Also,
Since the setting of the classification rate table and the trade-off table can be changed according to the quality of the input characters, there is an advantage that it can be applied to various uses.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施例を示す文字認識装置のブロッ
ク構成図である。
FIG. 1 is a block diagram of a character recognition device according to an embodiment of the present invention.

【図2】大分類部4のブロック構成図である。FIG. 2 is a block diagram of a large classification unit 4;

【図3】大分類構成決定部9のブロック構成図である。FIG. 3 is a block diagram illustrating a configuration of a large classification configuration determination unit 9;

【図4】大分類構成決定部9の処理フロー図である。FIG. 4 is a processing flowchart of a large classification configuration determining unit 9;

【図5】分類率テーブル94の一例を示す図である。FIG. 5 is a diagram showing an example of a classification rate table 94.

【図6】分類率テーブル94で選出されたr(i,j)
の一例を示す図である。
FIG. 6 shows r (i, j) selected in the classification rate table 94
It is a figure showing an example of.

【図7】トレードオフテーブルの一例を示す図である。FIG. 7 is a diagram illustrating an example of a trade-off table.

【図8】トレードオフ機能設定部10の処理フロー図で
ある。
FIG. 8 is a processing flowchart of the trade-off function setting unit 10;

【符号の説明】[Explanation of symbols]

1 文字パターン入力部 2 前処理部 3 特徴抽出部 4 大分類部 5 大分類辞書 6 識別部 7 識別辞書 8 認識結果メモリ部 9 大分類構成決定部 10 トレードオフ機能設定部 DESCRIPTION OF SYMBOLS 1 Character pattern input part 2 Preprocessing part 3 Feature extraction part 4 Large classification part 5 Large classification dictionary 6 Identification part 7 Identification dictionary 8 Recognition result memory part 9 Large classification configuration decision part 10 Trade-off function setting part

フロントページの続き (72)発明者 若原 徹 東京都新宿区西新宿三丁目19番2号 日本 電信電話株式会社内 (72)発明者 宮本 信夫 東京都新宿区西新宿三丁目19番2号 日本 電信電話株式会社内 (72)発明者 小倉 健司 東京都新宿区西新宿三丁目19番2号 日本 電信電話株式会社内Continued on the front page (72) Inventor Toru Wakahara 3-19-2 Nishi Shinjuku, Shinjuku-ku, Tokyo Nippon Telegraph and Telephone Corporation (72) Inventor Nobuo Miyamoto 3-19-2 Nishi-Shinjuku, Shinjuku-ku, Tokyo Nippon Telegraph and Telephone Within Telephone Co., Ltd. (72) Inventor Kenji Ogura 3-19-2 Nishi Shinjuku, Shinjuku-ku, Tokyo Japan Telegraph and Telephone Co., Ltd.

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 入力文字パターンの特徴と標準辞書の特
徴との間で照合を行うことにより該入力文字パターンの
属するカテゴリを候補として出力する文字認識方法にお
いて、 前記入力文字パターンの特徴の全部または一部と前記標
準辞書の特徴の全部または一部との間で分類尺度を計算
することにより分類対象とする候補数を減少させる分類
回路を階層構造を成すように構成し、前段の階層から後
段の階層へと処理が進行するに伴い該分類回路の分類に
使用する特徴数を増加させながら分類対象とする候補数
を減少させていく階層的大分類法を採り、 前記階層的大分類法における各階層の特徴数と候補数の
設定とは、まず各階層の特徴数と候補数との初期値を設
定しておき、次に大分類率を予め定められた一定値に保
持するという拘束条件の下で前記階層的大分類に要する
演算量を最小化すべく前記初期値を逐次変更する方法に
より行われ、 前記階層的大分類法における各階層の特徴数と候補数の
設定とは、大分類率の目標値が指定された場合には該目
標値を前記一定値に置換し前記逐次変更する方法を適用
することにより行われ、大分類処理速度の目標値が指定
された場合には予め得られている大分類処理速度と大分
類率との関係から前記一定値を求め前記逐次変更する方
法を適用することにより行われ、かつ、前記2種類の指
定を選択できるトレードオフを行うようにしたことを特
徴とする文字認識方法。
1. A character recognition method for comparing a feature of an input character pattern with a feature of a standard dictionary to output a category to which the input character pattern belongs as a candidate, wherein: A classification circuit that reduces the number of candidates to be classified by calculating a classification scale between a part and all or a part of the features of the standard dictionary is configured to form a hierarchical structure, and a hierarchy is arranged from a previous stage to a subsequent stage. Hierarchical large classification method in which the number of candidates to be classified is reduced while increasing the number of features used for classification of the classification circuit as the processing proceeds to the hierarchy of The setting of the number of features and the number of candidates in each layer is performed by first setting the initial values of the number of features and the number of candidates in each layer, and then maintaining the large classification rate at a predetermined constant value. of Is performed by a method of sequentially changing the initial value so as to minimize the amount of computation required for the hierarchical large classification. The setting of the number of features and the number of candidates of each hierarchy in the hierarchical large classification method is performed by setting a large classification rate. When the target value is specified, the target value is replaced by the constant value, and the method of sequentially changing the target value is performed. When the target value of the large classification processing speed is specified, the target value is obtained in advance. The method is performed by applying the method of obtaining the constant value from the relationship between the large classification processing speed and the large classification rate, and sequentially changing the value, and performs a trade-off in which the two types of designation can be selected. Character recognition method to be characterized.
【請求項2】 入力文字パターンの特徴と標準辞書の特
徴との間で照合を行うことにより該入力文字パターンの
属するカテゴリを候補として出力する文字認識装置にお
いて、 前記入力文字パターンの特徴の全部または一部と前記標
準辞書の特徴の全部または一部との間で分類尺度を計算
することにより分類対象とする候補数を減少させる分類
回路を階層構造を成すように構成し、前段の階層から後
段の階層へと処理が進行するに伴い該分類回路の分類に
使用する特徴数を増加させながら分類対象とする候補数
を減少させていく階層的大分類手段と、 前記階層的大分類法における各階層の特徴数と候補数の
設定とは、まず各階層の特徴数と候補数の初期値を設定
しておき、次に大分類率を予め定められた一定値に保持
するという拘束条件の下で前記階層的大分類に要する演
算量を最小化すべく前記初期値を逐次変更することによ
り行う大分類構成決定手段と、 前記階層的大分類法における各階層の特徴数と候補数の
設定とは、大分類率の目標値が指定された場合には該目
標値を前記一定値に置換し前記逐次変更するようにさ
れ、大分類処理速度の目標値が指定された場合には予め
得られている大分類処理速度と大分類率との関係から前
記一定値を求め前記逐次変更するようにされ、かつ、前
記2種類の指定を選択できるトレードオフ機能設定手段
と、 を具備することを特徴とする文字認識装置。
2. A character recognition apparatus for comparing a feature of an input character pattern with a feature of a standard dictionary to output a category to which the input character pattern belongs as a candidate, A classification circuit that reduces the number of candidates to be classified by calculating a classification scale between a part and all or a part of the features of the standard dictionary is configured to form a hierarchical structure, and a hierarchy is arranged from a previous stage to a subsequent stage. Hierarchical large classification means for decreasing the number of candidates to be classified while increasing the number of features used for the classification of the classification circuit as the processing proceeds to the hierarchy of The setting of the number of features and the number of candidates in the hierarchy is performed by first setting the initial values of the number of features and the number of candidates in each layer, and then maintaining the large classification rate at a predetermined constant value. so A large classification configuration determining means for sequentially changing the initial value so as to minimize the amount of computation required for the hierarchical large classification, and setting of the number of features and the number of candidates of each layer in the hierarchical large classification method, When the target value of the large classification rate is specified, the target value is replaced with the constant value and the value is sequentially changed. When the target value of the large classification processing speed is specified, the target value is obtained in advance. Trade-off function setting means for obtaining the constant value from the relationship between the large classification processing speed and the large classification rate and changing the constant value sequentially, and which can select the two types of designations. Character recognition device.
JP10026907A 1998-02-09 1998-02-09 Character recognition method and device Pending JPH11224309A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10026907A JPH11224309A (en) 1998-02-09 1998-02-09 Character recognition method and device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10026907A JPH11224309A (en) 1998-02-09 1998-02-09 Character recognition method and device

Publications (1)

Publication Number Publication Date
JPH11224309A true JPH11224309A (en) 1999-08-17

Family

ID=12206303

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10026907A Pending JPH11224309A (en) 1998-02-09 1998-02-09 Character recognition method and device

Country Status (1)

Country Link
JP (1) JPH11224309A (en)

Similar Documents

Publication Publication Date Title
US5805730A (en) Method for training an adaptive statistical classifier with improved learning of difficult samples
US5903884A (en) Method for training a statistical classifier with reduced tendency for overfitting
KR100247969B1 (en) Apparatus and method for massive pattern matching
US7817857B2 (en) Combiner for improving handwriting recognition
CN106372624B (en) Face recognition method and system
US5796863A (en) Method for training an adaptive statistical classifier to balance unigram prior factors
US6834121B2 (en) Apparatus for rough classification of words, method for rough classification of words, and record medium recording a control program thereof
WO2002019248A9 (en) Character recognition system
US5689584A (en) Method of and apparatus for pattern recognition and method of creating pattern recognition dictionary
CN113361567B (en) Image processing method, device, electronic equipment and storage medium
JP2986074B2 (en) Neighboring point detection method and pattern recognition device
JPH07160822A (en) Pattern recognizing method
JPH11224309A (en) Character recognition method and device
US10909421B2 (en) Training method for phase image generator and training method of phase image classifier
CN115349142A (en) Image processing apparatus, image processing method, and computer-readable storage medium
EP0650136B1 (en) A comparison inequality function based method and apparatus for accelerated OCR correlation
JPH09265529A (en) Method and device for cluster classification
JP4215385B2 (en) PATTERN RECOGNIZING DEVICE, PATTERN RECOGNIZING METHOD, AND COMPUTER-READABLE RECORDING MEDIUM CONTAINING PROGRAM FOR CAUSING COMPUTER TO EXECUTE THE METHOD
JP3266441B2 (en) Character recognition method
JP2003331254A (en) Device, method, and program for sorting, and recording medium having the program recorded therein
JP2001034709A (en) Fast recognition and retrieval system, method for accelerating recognition and retrieval used for the same and recording medium with its control program recorded thereon
JPH06348903A (en) Character recognition device
JPH04102969A (en) Method for storing data in data base
JP4143148B2 (en) Character recognition device
JP3754118B2 (en) Pattern recognition apparatus and pattern recognition method