JPH11345337A - Pattern dictionary generation device and method therefor, and machine-readable recording medium has recorded pattern dictionary generation method in computer - Google Patents

Pattern dictionary generation device and method therefor, and machine-readable recording medium has recorded pattern dictionary generation method in computer

Info

Publication number
JPH11345337A
JPH11345337A JP10164436A JP16443698A JPH11345337A JP H11345337 A JPH11345337 A JP H11345337A JP 10164436 A JP10164436 A JP 10164436A JP 16443698 A JP16443698 A JP 16443698A JP H11345337 A JPH11345337 A JP H11345337A
Authority
JP
Japan
Prior art keywords
template
displacement
dictionary
pattern
pattern dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10164436A
Other languages
Japanese (ja)
Inventor
Toshihiro Suzuki
俊博 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP10164436A priority Critical patent/JPH11345337A/en
Publication of JPH11345337A publication Critical patent/JPH11345337A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a pattern recognition dictionary whose recognition precision is high and which can recognize a pattern at a high speed. SOLUTION: The pattern dictionary generation device generating a dictionary for pattern recognition is provided with an input part 101 inputting a learning sample in the form of a feature vector, an average template deciding part 102 obtaining average templates representing the learning samples inputted from the input part 101 for every category, a main component analysis part 103 obtaining intrinsic value/intrinsic vectors (main components) for every category from the learning samples inputted from the input part 101, a displacement deciding part 104 deciding template displacement based on the intrinsic value/ intrinsic vector (main component) obtained in the main component analysis part 103 and a template registration part 105 registering a displacement position obtained in the displacement deciding part 104 in a dictionary 106 as the template.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は,文字認識を含むパ
ターン認識一般に用いられるパターン辞書を作成するパ
ターン辞書作成装置およびパターン辞書作成方法,並び
にパターン辞書作成方法をコンピュータに記録した機械
読み取り可能な記録媒体に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a pattern dictionary creating apparatus and a pattern dictionary creating method for creating a pattern dictionary generally used for pattern recognition including character recognition, and a machine-readable recording in which the pattern dictionary creating method is recorded in a computer. Regarding the medium.

【0002】[0002]

【従来の技術】従来,マルチテンプレート型の辞書を備
えた文字認識に関連する参考技術文献として,第1の従
来例として,新しいクラスタ中心をそのままテンプレー
トとするのではなく,元のカテゴリ内全サンプルの平均
テンプレートを用いて補正を行うことにより,認識精度
を向上されるものが電子通信学会技術報告(PRU86
−36,1986,7月)の『手書き文字の識別に関す
る基礎的検討』に開示されている。
2. Description of the Related Art Heretofore, as a reference technical document relating to character recognition provided with a multi-template type dictionary, as a first conventional example, instead of using a new cluster center as a template as it is, all samples in the original category are used. The recognition accuracy can be improved by performing the correction using the average template of the IEICE Technical Report (PRU86
-36, 1986, July) in "Basic Study on Identification of Handwritten Characters".

【0003】また,第2の従来例として,マルチテンプ
レート型の辞書を有し,入力文字から特徴値ベクトルを
抽出し,各クラスの平均特徴値ベクトルと比較し,入力
文字を入力文字の特徴値ベクトルに最も近似する平均特
徴値ベクトルに対応するモデル文字として認識するもの
が,特開平8−180139号公報の『拘束のない手書
き英数字オンライン認識の方法および装置』に開示され
ている。
Further, as a second conventional example, a dictionary of a multi-template type is provided, a feature value vector is extracted from an input character, and compared with an average feature value vector of each class. Japanese Patent Application Laid-Open No. 8-180139 discloses a "method and apparatus for unrestricted handwritten alphanumeric online recognition" which is recognized as a model character corresponding to an average feature value vector closest to a vector.

【0004】さらに,第3の従来例として,シングルテ
ンプレートであっても認識精度が高い方法が,信学技法
(PRU92−115,pp99〜106,1993,
1月)の『文字認識における特徴量の次元数と変数変換
に関する考察』に開示されている。これは,カテゴリを
表現するのにその平均テンプレートのみを用いるのでは
なく,さらに固有値・固有ベクトルを用いており,これ
によってカテゴリ内のサンプル分布をも表現しようとす
るものである。
Further, as a third conventional example, a method with high recognition accuracy even for a single template is described in the IEICE Technical Report (PRU92-115, pp99-106, 1993,
(Jan.), “Consideration on Dimensionality and Variable Conversion of Feature in Character Recognition”. In this method, not only the average template is used to represent a category, but also eigenvalues / eigenvectors are used, thereby trying to represent the sample distribution within the category.

【0005】[0005]

【発明が解決しようとする課題】しかしながら,上記に
示されるような第2の従来例にあっては,第1の従来例
でも指摘されているように,単純なクラスタリングに基
づくマルチテンプレート型の辞書を用いると,辞書容量
が増大するにもかかわらず認識精度がむしろ低下するこ
とが多いという問題点があった。
However, in the second conventional example as described above, as pointed out in the first conventional example, a multi-template dictionary based on simple clustering is used. However, there is a problem that the recognition accuracy often decreases rather than increases the dictionary capacity.

【0006】また,第3の従来例にあっては,高次識別
関数を用いる必要があるため,その認識処理にかかる計
算量が多くなるという問題点があった。
Further, in the third conventional example, since it is necessary to use a higher-order discriminant function, there is a problem that the amount of calculation required for the recognition process is increased.

【0007】本発明は,上記に鑑みてなされたものであ
って,認識精度が高く,かつ高速なパターン認識を実現
可能にするパターン認識辞書を提供することを目的とす
る。
The present invention has been made in view of the above, and an object of the present invention is to provide a pattern recognition dictionary which has high recognition accuracy and can realize high-speed pattern recognition.

【0008】[0008]

【課題を解決するための手段】上記の目的を達成するた
めに,請求項1に係るパターン辞書作成装置にあって
は,パターン認識のための辞書を作成するパターン辞書
作成装置において,学習サンプルを特徴ベクトルの形で
入力する入力手段と,前記入力手段から入力された学習
サンプルを代表する平均テンプテートをカテゴリ毎に求
める平均テンプレート決定手段と,前記入力手段から入
力された学習サンプルからカテゴリ毎に固有値・固有ベ
クトル(主成分)を求める主成分分析手段と,前記主成
分分析手段で求められた固有値・固有ベクトル(主成
分)に基づいてテンプレート変位を決定する変位決定手
段と,前記変位決定手段で求められた変位位置をテンプ
レートとして辞書に登録するテンプレート登録手段と,
を備えたものである。
According to a first aspect of the present invention, there is provided a pattern dictionary creating apparatus for creating a dictionary for pattern recognition. Input means for inputting in the form of a feature vector, average template determining means for obtaining, for each category, an average template representing the learning sample input from the input means, and eigenvalues for each category from the learning sample input from the input means. Principal component analysis means for obtaining an eigenvector (principal component); displacement determination means for determining a template displacement based on the eigenvalue and eigenvector (principal component) obtained by the principal component analysis means; Registering means for registering the displaced position in the dictionary as a template,
It is provided with.

【0009】また,請求項2に係るパターン辞書作成装
置にあっては,前記テンプレート登録手段は,変位テン
プレートを合成し,合成変位テンプレートを追加するも
のである。
According to a second aspect of the present invention, the template registering means combines the displacement templates and adds the combined displacement templates.

【0010】また,請求項3に係るパターン辞書作成装
置にあっては,前記変位決定手段は,前記主成分分析手
段で求められた固有値に基づいてテンプレート数を決定
するものである。
According to a third aspect of the present invention, the displacement determining means determines the number of templates based on the eigenvalues obtained by the principal component analyzing means.

【0011】また,請求項4に係るパターン辞書作成装
置にあっては,前記テンプレート登録手段は,作成され
たテンプレートのうち,認識精度に寄与しない不要なも
のを削除するものである。
According to a fourth aspect of the present invention, in the pattern dictionary creating apparatus, the template registering means deletes unnecessary templates which do not contribute to recognition accuracy among the created templates.

【0012】また,請求項5に係るパターン辞書作成方
法にあっては,パターン認識のための辞書を作成するパ
ターン辞書作成方法において,学習サンプルを特徴ベク
トルの形で入力する第1の工程と,前記第1の工程で入
力された学習サンプルを代表する平均テンプテートをカ
テゴリ毎に求める第2の工程と,前記第2の工程で入力
された学習サンプルからカテゴリ毎に固有値・固有ベク
トル(主成分)を求める第3の工程と,前記第3の工程
で求められた固有値・固有ベクトル(主成分)に基づい
てテンプレート変位を決定する第4の工程と,前記第4
の工程で求められた変位位置をテンプレートとして辞書
に登録する第5の工程と,を含むものである。
According to a fifth aspect of the present invention, in the pattern dictionary creating method for creating a dictionary for pattern recognition, a first step of inputting a learning sample in the form of a feature vector; A second step of obtaining, for each category, an average template representing the learning sample input in the first step, and eigenvalues / eigenvectors (principal components) for each category from the learning sample input in the second step. A third step of determining, a fourth step of determining a template displacement based on the eigenvalues / eigenvectors (principal components) determined in the third step, and a fourth step of determining the template displacement.
And a fifth step of registering the displacement position obtained in the step as a template in a dictionary.

【0013】また,請求項6に係る機械読み取り可能な
記録媒体にあっては,請求項5に記載されたパターン辞
書作成方法をコンピュータに実行させるプログラムを記
録したものである。
According to a sixth aspect of the present invention, there is provided a machine-readable recording medium on which a program for causing a computer to execute the pattern dictionary creating method according to the fifth aspect is recorded.

【0014】[0014]

【発明の実施の形態】以下,本発明のパターン辞書作成
装置およびパターン辞書作成方法,並びにパターン辞書
作成方法をコンピュータに記録した機械読み取り可能な
記録媒体について添付図面を参照し,詳細に説明する。
DESCRIPTION OF THE PREFERRED EMBODIMENTS A pattern dictionary creating apparatus, a pattern dictionary creating method, and a machine readable recording medium having a pattern dictionary creating method recorded in a computer according to the present invention will be described below in detail with reference to the accompanying drawings.

【0015】(発明の原理)本発明の原理は,カテゴリ
の分布を考慮した距離計算は複雑であって処理時間がか
かるため,マルチテンプレート型の構成をとることによ
り良好に近似する,というものである。この良好に近似
するというのは,カテゴリの固有値・固有ベクトル(主
成分)を用い,その分布をよく近似する位置にテンプレ
ートを配置するという意味である。
(Principle of the Invention) The principle of the present invention is that distance calculation in consideration of the distribution of categories is complicated and takes a long processing time, so that a good approximation is obtained by adopting a multi-template configuration. is there. This good approximation means that the template is arranged at a position that closely approximates the distribution using the eigenvalues / eigenvectors (principal components) of the category.

【0016】一方,従来のマルチテンプレート型との違
いは,クラスタリングではなくカテゴリの固有値・固有
ベクトルからテンプレートを決定するということにあ
る。このため,従来のマルチテンプレート型の辞書と比
較して,本発明のパターン辞書の場合は認識精度が高く
なる。
On the other hand, the difference from the conventional multi-template type is that a template is determined from eigenvalues / eigenvectors of a category instead of clustering. For this reason, the recognition accuracy of the pattern dictionary of the present invention is higher than that of the conventional multi-template dictionary.

【0017】(システムの構成)図1は,本発明の実施
の形態に係るパターン辞書作成装置のシステム構成を示
すブロック図である。101は学習サンプルを特徴ベク
トルの形で入力する入力手段としての入力部,102は
入力部101から入力された学習サンプルを代表する平
均テンプテートをカテゴリ毎に求める平均テンプレート
決定手段としての平均テンプレート決定部,103は入
力部101から入力された学習サンプルからカテゴリ毎
に固有値・固有ベクトル(主成分)を求める主成分分析
手段としての主成分分析部,104は主成分分析部10
3で求められた固有値・固有ベクトル(主成分)に基づ
いてテンプレート変位を決定する変位決定手段としての
変位決定部,105は変位決定部104で求められた変
位位置をテンプレートとして辞書に登録するテンプレー
ト登録手段としてのテンプレート登録部,106は辞書
である。
(System Configuration) FIG. 1 is a block diagram showing a system configuration of a pattern dictionary creating apparatus according to an embodiment of the present invention. Reference numeral 101 denotes an input unit serving as an input unit for inputting a learning sample in the form of a feature vector. Reference numeral 102 denotes an average template determining unit serving as an average template determining unit for obtaining an average template representing the learning sample input from the input unit 101 for each category. , 103 are principal component analysis units as principal component analysis means for finding eigenvalues / eigenvectors (principal components) for each category from the learning sample input from the input unit 101, and 104 is a principal component analysis unit 10.
3. A displacement determination unit as a displacement determination unit that determines a template displacement based on the eigenvalues / eigenvectors (principal components) obtained in step 3; a template registration unit 105 that registers the displacement position obtained by the displacement determination unit 104 as a template in a dictionary The template registration unit 106 as a means is a dictionary.

【0018】(システムの処理動作)次に,以上のよう
に構成されたパターン辞書作成装置におけるシステムの
処理動作について説明する。図2は,本発明の実施の形
態に係るパターン辞書作成の処理動作例を示すフローチ
ャートである。
(Processing Operation of System) Next, the processing operation of the system in the pattern dictionary creating apparatus configured as described above will be described. FIG. 2 is a flowchart showing an example of a processing operation for creating a pattern dictionary according to the embodiment of the present invention.

【0019】図2において,処理が開始されると,ま
ず,学習サンプルを入力部101より入力する(S20
1)。このとき,学習サンプルは特徴ベクトルの形で与
えられている。次いで,平均テンプレート決定部102
によってカテゴリ毎に平均ベクトルが算出され,これが
平均テンプレートとして辞書106に登録される(S2
02)。
In FIG. 2, when the process is started, first, a learning sample is input from the input unit 101 (S20).
1). At this time, the learning sample is given in the form of a feature vector. Next, the average template determination unit 102
, An average vector is calculated for each category, and this is registered in the dictionary 106 as an average template (S2).
02).

【0020】さらに,主成分分析部103によって,平
均ベクトルを利用してカテゴリ毎の主成分分析を実行し
(S203),各カテゴリの分布を表現する固有値およ
び固有ベクトルを算出する。これらの値が変位決定部1
04に供給され,変位決定部104によって変位算出が
実行され,変位が決定される(S204)。そして,変
位テンプレートの登録を行い(S205),すべてのカ
テゴリについての処理が終われば,終了する。
Further, the principal component analysis unit 103 performs a principal component analysis for each category using the average vector (S203), and calculates eigenvalues and eigenvectors representing the distribution of each category. These values are the displacement determination unit 1
Then, the displacement is determined by the displacement determination unit 104 (S204). Then, a displacement template is registered (S205), and when the processing for all the categories is completed, the processing ends.

【0021】ここで,特徴ベクトルの次元数をnとし
て,対象とするカテゴリの平均ベクトルをMとする。対
象カテゴリについて算出された固有値を大きい順にλi
(i=1..n)とし,これに対応する固有ベクトルを
Φi (i=1..n)とする。
Here, the number of dimensions of the feature vector is n, and the average vector of the target category is M. The eigenvalues calculated for the target category are assigned as λ i
(I = 1..n), and the corresponding eigenvector is Φ i (i = 1..n).

【0022】固有値と固有ベクトルについては,値の大
きな順にm(m≦n)個の固有値とそれに対応する固有
ベクトルを用いるものとする。固有値λi が大きいとい
うことは,Mを中心として対応する固有ベクトルΦi
方向に関する特徴ベクトル分布の分散が大きいことを意
味している。すなわち,その方向に関しては,同一カテ
ゴリであるにもかかわらずMからの距離が遠いものが存
在することになる。
For the eigenvalues and eigenvectors, m (m ≦ n) eigenvalues and the corresponding eigenvectors are used in descending order of value. That the eigenvalues lambda i is large, it means that the variance of feature vector distribution with respect to the direction of the eigenvector [Phi i corresponding about the M is large. That is, regarding the direction, there are some which are far from M even though they belong to the same category.

【0023】そこで,これを補うために,変位テンプレ
ートを追加することを考える。例えば,図3に示す変位
算出例のように,あらかじめ定められた定数をαとする
と,変位テンプレートの位置M+ i ,M- i をそれぞ
れ, M+ i =M+α×λi 1/2 ×Φi- i =M−α×λi 1/2 ×Φi とすればよい。
To compensate for this, consider adding a displacement template. For example, as the displacement calculation example shown in FIG. 3, when the predetermined constant as alpha, position M + i of the displacement template, M - i, respectively, M + i = M + α × λ i 1/2 × Φ i M i = M−α × λ i 1/2 × Φ i

【0024】これによって,Mからの距離が遠いもので
あっても,追加された変位テンプレートには近くなるた
め,それらを正しく識別することができるようになる。
このとき,ベイズ識別関数のように計算量の多い方法で
はなく,ユークリッド距離や市街区距離などの簡単な方
法で計算を行えばよいため,テンプレート数は増える
が,全体の計算量の増大は抑制することができ,認識処
理の高速化に寄与することになる。
As a result, even if the distance from M is long, the distance is closer to the added displacement template, so that they can be correctly identified.
At this time, the number of templates is increased because the calculation can be performed by a simple method such as Euclidean distance or city block distance instead of a method with a large amount of calculation like the Bayesian discriminant function. This contributes to speeding up the recognition processing.

【0025】さて,テンプレート登録部105が,変位
テンプレートを合成した合成変位テンプレートを追加す
る機能を有する例について説明する。すなわち,図4に
示すように,テンプレート登録部105において,異な
るiについての変位テンプレートを合成し,合成変位テ
ンプレートを追加する。なお,図4における黒丸が合成
変位テンプレートである。
Now, an example in which the template registration unit 105 has a function of adding a combined displacement template obtained by combining displacement templates will be described. That is, as shown in FIG. 4, the template registration unit 105 combines displacement templates for different i, and adds a combined displacement template. Note that a black circle in FIG. 4 is a combined displacement template.

【0026】また,変位決定部104は,主成分分析部
103で求められた固有値に基づいてテンプレート数を
決定する。すなわち,図5に示すように,変位固有値の
応じてテンプレート数を決定する。これにより,固有値
が大きい軸ほどテンプレート数を多くすることができ
る。これは,前述のテンプレート登録部105による合
成変位テンプレートを追加する機能と併用することも可
能である。
The displacement determining unit 104 determines the number of templates based on the eigenvalues obtained by the principal component analyzing unit 103. That is, as shown in FIG. 5, the number of templates is determined according to the displacement eigenvalue. Thereby, the number of templates can be increased for an axis having a larger eigenvalue. This can be used together with the function of adding the combined displacement template by the template registration unit 105 described above.

【0027】さらに,テンプレート登録部105は,不
要なテンプレートを削除する機能を備えている。不要で
あるというのは,認識精度向上屁の寄与が少ないという
意味である。
Further, the template registration section 105 has a function of deleting unnecessary templates. The fact that it is unnecessary means that the contribution of the recognition accuracy improvement flat is small.

【0028】ところで,本発明は上述した実施の形態の
他にソフトウェアによっても実現することができる。本
発明をソフトウェアによって実現する場合におけるコン
ピュータシステムの構成例を図6に示す。
The present invention can be realized by software other than the above-described embodiment. FIG. 6 shows a configuration example of a computer system when the present invention is realized by software.

【0029】図6において,601は入力インターフェ
イス,602は制御プログラムに基づいてシステム全体
を制御するCPU,603は記憶装置,604は出力イ
ンターフェイス,605はCD−ROMなどの記録媒体
606を駆動するドライブである。
In FIG. 6, 601 is an input interface, 602 is a CPU for controlling the whole system based on a control program, 603 is a storage device, 604 is an output interface, and 605 is a drive for driving a recording medium 606 such as a CD-ROM. It is.

【0030】以上のように構成されたコンピュータシス
テムにおいて,先に述べたパターン辞書作成方法のプロ
グラムをCD−ROMなどの記録媒体606にあらかじ
め記録しておく。そして,ドライブ605を通じて読み
込む。CPU602は,記憶装置603との間で情報の
やり取りを行いながら,プログラムの各ステップを実行
する。
In the computer system configured as described above, the program of the above-described pattern dictionary creating method is recorded in advance on a recording medium 606 such as a CD-ROM. Then, the data is read through the drive 605. The CPU 602 executes each step of the program while exchanging information with the storage device 603.

【0031】[0031]

【発明の効果】以上説明したように,本発明に係るパタ
ーン辞書作成装置(請求項1)によれば,学習サンプル
を特徴ベクトルの形で入力する入力手段と,入力された
学習サンプルを代表する平均テンプテートをカテゴリ毎
に求める平均テンプレート決定手段と,入力された学習
サンプルからカテゴリ毎に固有値・固有ベクトル(主成
分)を求める主成分分析手段と,固有値・固有ベクトル
(主成分)に基づいてテンプレート変位を決定する変位
決定手段と,求められた変位位置をテンプレートとして
辞書に登録するテンプレート登録手段とによって構成さ
れるため,認識精度が高く,かつ高速なパターン認識を
実現可能とするパターン認識辞書を作成する装置を提供
することができる。
As described above, according to the pattern dictionary creating apparatus of the present invention (claim 1), input means for inputting a learning sample in the form of a feature vector, and representing the input learning sample. Mean template determination means for obtaining an average template for each category, principal component analysis means for obtaining an eigenvalue / eigenvector (principal component) for each category from an input learning sample, and template displacement based on eigenvalue / eigenvector (principal component) A pattern recognition dictionary that has high recognition accuracy and can realize high-speed pattern recognition is created because it is composed of a displacement determining means for determining and a template registering means for registering the obtained displacement position as a template in a dictionary. An apparatus can be provided.

【0032】また,本発明に係るパターン辞書作成装置
(請求項2)によれば,請求項1の効果に加え,さらに
認識精度を向上させることが可能となる。
According to the pattern dictionary creating apparatus of the present invention (claim 2), in addition to the effect of claim 1, it is possible to further improve recognition accuracy.

【0033】また,本発明に係るパターン辞書作成装置
(請求項3)によれば,請求項1の効果に加え,固有値
が大きい軸ほどテンプレート数を多くすることができ,
より認識精度を向上させることが可能となる。
According to the pattern dictionary creating apparatus of the present invention (claim 3), in addition to the effect of claim 1, the number of templates can be increased for an axis having a larger eigenvalue.
It is possible to further improve recognition accuracy.

【0034】また,本発明に係るパターン辞書作成装置
(請求項4)によれば,テンプレート登録時に,認識精
度向上への寄与が少ない不要なテンプレートを削除する
ので,辞書の容量を有効に活用でき,かつ規模を小さく
することが可能となる。
Further, according to the pattern dictionary creating apparatus of the present invention (claim 4), unnecessary templates that contribute little to improvement of recognition accuracy are deleted at the time of template registration, so that the capacity of the dictionary can be effectively utilized. , And the size can be reduced.

【0035】また,本発明に係るパターン辞書作成方法
(請求項5)によれば,学習サンプルを特徴ベクトルの
形で入力し,該入力された学習サンプルを代表する平均
テンプテートをカテゴリ毎に求め,さらに入力された学
習サンプルからカテゴリ毎に固有値・固有ベクトル(主
成分)を求め,その求められた固有値・固有ベクトル
(主成分)に基づいてテンプレート変位を決定し,その
変位位置をテンプレートとして辞書に登録するという方
法をとるため,認識精度が高く,かつ高速なパターン認
識を実現可能とするパターン認識辞書を作成する装置を
提供することができる。
According to the pattern dictionary creating method of the present invention (claim 5), a learning sample is input in the form of a feature vector, and an average template representing the input learning sample is obtained for each category. Further, eigenvalues / eigenvectors (principal components) are obtained for each category from the input learning samples, template displacements are determined based on the obtained eigenvalues / eigenvectors (principal components), and the displacement positions are registered in the dictionary as templates. Therefore, it is possible to provide an apparatus for creating a pattern recognition dictionary that has high recognition accuracy and can realize high-speed pattern recognition.

【0036】また,本発明に係る機械読み取り可能な記
録媒体(請求項6)によれば,請求項2に記載されたパ
ターン辞書作成方法をコンピュータに実行させるプログ
ラムを記録したことにより,請求項2の動作をコンピュ
ータによって実現することが可能となる。
Further, according to the machine-readable recording medium of the present invention (claim 6), a program for causing a computer to execute the pattern dictionary creation method described in claim 2 is recorded, so that Can be realized by a computer.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施の形態に係るパターン辞書作成装
置のシステム構成を示すブロック図である。
FIG. 1 is a block diagram showing a system configuration of a pattern dictionary creation device according to an embodiment of the present invention.

【図2】本発明の実施の形態に係るパターン辞書作成の
処理動作例を示すフローチャートである。
FIG. 2 is a flowchart illustrating an example of a processing operation of creating a pattern dictionary according to the embodiment of the present invention.

【図3】本発明の実施の形態に係る変位算出例を示す説
明図である。
FIG. 3 is an explanatory diagram showing a displacement calculation example according to the embodiment of the present invention.

【図4】本発明の実施の形態に係る変位テンプレートの
合成例を示す説明図である。
FIG. 4 is an explanatory diagram showing an example of combining displacement templates according to the embodiment of the present invention.

【図5】本発明の実施の形態に係る固有値に応じたテン
プレート数の決定例を示す説明図である。
FIG. 5 is an explanatory diagram showing an example of determining the number of templates according to an eigenvalue according to the embodiment of the present invention.

【図6】本発明の実施の形態に係るコンピュータシステ
ムの構成例を示すブロック図である。
FIG. 6 is a block diagram illustrating a configuration example of a computer system according to an embodiment of the present invention.

【符号の説明】[Explanation of symbols]

101 入力部 102 平均テンプレート決定部 103 主成分分析部 104 変位決定部 105 テンプレート登録部 106 辞書 Reference Signs List 101 input unit 102 average template determination unit 103 principal component analysis unit 104 displacement determination unit 105 template registration unit 106 dictionary

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】 パターン認識のための辞書を作成するパ
ターン辞書作成装置において,学習サンプルを特徴ベク
トルの形で入力する入力手段と,前記入力手段から入力
された学習サンプルを代表する平均テンプテートをカテ
ゴリ毎に求める平均テンプレート決定手段と,前記入力
手段から入力された学習サンプルからカテゴリ毎に固有
値・固有ベクトル(主成分)を求める主成分分析手段
と,前記主成分分析手段で求められた固有値・固有ベク
トル(主成分)に基づいてテンプレート変位を決定する
変位決定手段と,前記変位決定手段で求められた変位位
置をテンプレートとして辞書に登録するテンプレート登
録手段と,を備えたことを特徴とするパターン辞書作成
装置。
In a pattern dictionary creating apparatus for creating a dictionary for pattern recognition, an input means for inputting a learning sample in the form of a feature vector, and an average template representative of the learning sample input from the input means are classified into categories. Means for determining an average template for each category, principal component analysis means for obtaining eigenvalues / eigenvectors (principal components) for each category from the learning samples input from the input means, and eigenvalues / eigenvectors ( A pattern dictionary creating apparatus, comprising: displacement determining means for determining a template displacement based on the principal component); and template registering means for registering a displacement position obtained by the displacement determining means in a dictionary as a template. .
【請求項2】 前記テンプレート登録手段は,変位テン
プレートを合成し,合成変位テンプレートを追加するこ
とを特徴とする請求項1に記載のパターン辞書作成装
置。
2. The pattern dictionary creating apparatus according to claim 1, wherein said template registering means combines the displacement templates and adds the combined displacement templates.
【請求項3】 前記変位決定手段は,前記主成分分析手
段で求められた固有値に基づいてテンプレート数を決定
することを特徴とする請求項1または2に記載のパター
ン辞書作成装置。
3. The pattern dictionary creating apparatus according to claim 1, wherein said displacement determining means determines the number of templates based on the eigenvalues obtained by said principal component analyzing means.
【請求項4】 前記テンプレート登録手段は,作成され
たテンプレートのうち,認識精度に寄与しない不要なも
のを削除することを特徴とする請求項1ないし3の何れ
か一つに記載のパターン辞書作成装置。
4. The pattern dictionary creation device according to claim 1, wherein the template registration unit deletes unnecessary templates that do not contribute to recognition accuracy from the created templates. apparatus.
【請求項5】 パターン認識のための辞書を作成するパ
ターン辞書作成方法において,学習サンプルを特徴ベク
トルの形で入力する第1の工程と,前記第1の工程で入
力された学習サンプルを代表する平均テンプテートをカ
テゴリ毎に求める第2の工程と,前記第2の工程で入力
された学習サンプルからカテゴリ毎に固有値・固有ベク
トル(主成分)を求める第3の工程と,前記第3の工程
で求められた固有値・固有ベクトル(主成分)に基づい
てテンプレート変位を決定する第4の工程と,前記第4
の工程で求められた変位位置をテンプレートとして辞書
に登録する第5の工程と,を含むことを特徴とするパタ
ーン辞書作成方法。
5. In a pattern dictionary creating method for creating a dictionary for pattern recognition, a first step of inputting a learning sample in the form of a feature vector, and representing the learning sample input in the first step. A second step of obtaining an average template for each category; a third step of obtaining eigenvalues / eigenvectors (principal components) for each category from the learning samples input in the second step; A fourth step of determining a template displacement based on the obtained eigenvalues / eigenvectors (principal components);
And a fifth step of registering the displacement position obtained in the step as a template in a dictionary.
【請求項6】 請求項5に記載されたパターン辞書作成
方法をコンピュータに実行させるプログラムを記録した
ことを特徴とする機械読み取り可能な記録媒体。
6. A machine-readable recording medium on which a program for causing a computer to execute the pattern dictionary creating method according to claim 5 is recorded.
JP10164436A 1998-05-29 1998-05-29 Pattern dictionary generation device and method therefor, and machine-readable recording medium has recorded pattern dictionary generation method in computer Pending JPH11345337A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10164436A JPH11345337A (en) 1998-05-29 1998-05-29 Pattern dictionary generation device and method therefor, and machine-readable recording medium has recorded pattern dictionary generation method in computer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10164436A JPH11345337A (en) 1998-05-29 1998-05-29 Pattern dictionary generation device and method therefor, and machine-readable recording medium has recorded pattern dictionary generation method in computer

Publications (1)

Publication Number Publication Date
JPH11345337A true JPH11345337A (en) 1999-12-14

Family

ID=15793138

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10164436A Pending JPH11345337A (en) 1998-05-29 1998-05-29 Pattern dictionary generation device and method therefor, and machine-readable recording medium has recorded pattern dictionary generation method in computer

Country Status (1)

Country Link
JP (1) JPH11345337A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009276937A (en) * 2008-05-13 2009-11-26 Fujitsu Ltd Dictionary creating apparatus, recognition apparatus, recognition method, and recognition program
JP2015185033A (en) * 2014-03-25 2015-10-22 株式会社日立情報通信エンジニアリング Character recognition device and identification function generation method

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009276937A (en) * 2008-05-13 2009-11-26 Fujitsu Ltd Dictionary creating apparatus, recognition apparatus, recognition method, and recognition program
US8379983B2 (en) 2008-05-13 2013-02-19 Fujitsu Limited Dictionary creating apparatus, recognizing apparatus, and recognizing method
JP2015185033A (en) * 2014-03-25 2015-10-22 株式会社日立情報通信エンジニアリング Character recognition device and identification function generation method

Similar Documents

Publication Publication Date Title
US7184591B2 (en) Systems and methods for adaptive handwriting recognition
JP2000099632A (en) Retrieval device, retrieval method and computer readable recording medium recorded with retrieval program
US20120213419A1 (en) Pattern recognition method and apparatus using local binary pattern codes, and recording medium thereof
CN111401099A (en) Text recognition method, device and storage medium
JP4393720B2 (en) Pattern recognition apparatus and method
CN112651392A (en) Certificate information acquisition method and device, storage medium and computer equipment
JPH08167000A (en) Device and method for character recognition
JPH1131226A (en) Method and device for processing information
JP2008225695A (en) Character recognition error correction device and program
CN111144466B (en) Image sample self-adaptive depth measurement learning method
JPH11345337A (en) Pattern dictionary generation device and method therefor, and machine-readable recording medium has recorded pattern dictionary generation method in computer
Sotoodeh et al. A music symbols recognition method using pattern matching along with integrated projection and morphological operation techniques
JP2001014465A (en) Method and device for recognizing object
JP2751865B2 (en) String recognition device
US9015573B2 (en) Object recognition and describing structure of graphical objects
CN112287763A (en) Image processing method, apparatus, device and medium
JP2004094644A (en) Image processor, image processing method, storage medium, and program
US20230230406A1 (en) Facilitating identification of fillable regions in a form
JP2000155806A (en) Character recognition method and its device and dictionary preparation method and its device and character quality judgment method and recording medium
CN117830601B (en) Three-dimensional visual positioning method, device, equipment and medium based on weak supervision
JP2728117B2 (en) Character recognition device
JP4209511B2 (en) Character recognition method, character recognition device, and computer-readable recording medium recording a program for causing a computer to execute the character recognition method
JP2001126063A (en) Method and device for recognizing pattern
JP2576080B2 (en) Character extraction method
JPH10154191A (en) Business form identification method and device, and medium recording business form identification program