JP4820830B2 - Pattern recognition apparatus, pattern recognition program, and pattern recognition method - Google Patents

Pattern recognition apparatus, pattern recognition program, and pattern recognition method Download PDF

Info

Publication number
JP4820830B2
JP4820830B2 JP2008034234A JP2008034234A JP4820830B2 JP 4820830 B2 JP4820830 B2 JP 4820830B2 JP 2008034234 A JP2008034234 A JP 2008034234A JP 2008034234 A JP2008034234 A JP 2008034234A JP 4820830 B2 JP4820830 B2 JP 4820830B2
Authority
JP
Japan
Prior art keywords
recognition
unit
pattern
eigenvectors
reliability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008034234A
Other languages
Japanese (ja)
Other versions
JP2009193417A (en
Inventor
篤弘 吉田
博之 水谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2008034234A priority Critical patent/JP4820830B2/en
Publication of JP2009193417A publication Critical patent/JP2009193417A/en
Application granted granted Critical
Publication of JP4820830B2 publication Critical patent/JP4820830B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、例えば文字、画像、音声などのパターンを認識するパターン認識装置、パターン認識プログラム及びパターン認識方法に関する。   The present invention relates to a pattern recognition apparatus, a pattern recognition program, and a pattern recognition method for recognizing patterns such as characters, images, and sounds.

現在、認識システムに入力された未知のパターンから所属カテゴリを特定する、パターン認識技術が数多く利用されている。   Currently, many pattern recognition techniques are used to identify a category belonging to an unknown pattern input to a recognition system.

その中で、例えば文字認識システムに利用される文字パターン認識技術の一つとして、認識用辞書を使用したものがある。   Among them, for example, one of character pattern recognition techniques used in a character recognition system uses a recognition dictionary.

この種の文字認識システムの場合、以下の手順で文字認識を行う。まず認識対象となる文字毎の標準的な特徴を現すN次元の特徴ベクトルを、認識用辞書としての標準特徴ベクトル辞書から抽出しメモリに保持しておく。   In this type of character recognition system, character recognition is performed according to the following procedure. First, an N-dimensional feature vector representing a standard feature for each character to be recognized is extracted from a standard feature vector dictionary as a recognition dictionary and stored in a memory.

次いで、認識対象の文字パターンからも同様にN次元の特徴ベクトルを抽出する。この特徴ベクトルとメモリに保持しておいた辞書の標準的な特徴ベクトルとの類似性を計る度合いとして類似度(あるいは相違度)を計算し、最も類似度が大きく(相違度が小さく)なった特徴ベクトルを持つ文字を認識対称の候補(認識解)として出力とする。   Next, N-dimensional feature vectors are similarly extracted from the character pattern to be recognized. The degree of similarity (or dissimilarity) was calculated as the degree of similarity between this feature vector and the standard feature vector of the dictionary stored in the memory, and the degree of similarity was the largest (the degree of dissimilarity). Characters having feature vectors are output as recognition symmetry candidates (recognition solutions).

従来、特徴ベクトルの類似性を計るのに用いる計算手法として、例えば部分空間法や擬似ベイズ識別法などが知られている。   Conventionally, as a calculation method used to measure the similarity of feature vectors, for example, a subspace method, a pseudo Bayes identification method, and the like are known.

これらの手法は、自己相関行列の固有値及び固有値に対応する固有ベクトルを定め、予め設定した閾値に基づき固有値及び対応した固有ベクトルを選択し、使用することでパターン認識を行う手法であり、ある一定数の固有値・固有ベクトルのみをパターン認識に使用することで、計算量の削減や認識に不要な成分の除去を行える(非特許文献1参照)。
エルッキオヤ著、「パターン認識と部分空間法」、産業図書、(1986)
These methods determine the eigenvalues corresponding to the eigenvalues and eigenvalues of the autocorrelation matrix, select the eigenvalues and the corresponding eigenvectors based on preset threshold values, and use them to perform pattern recognition. By using only eigenvalues and eigenvectors for pattern recognition, the amount of calculation can be reduced and components unnecessary for recognition can be removed (see Non-Patent Document 1).
Ercchioya, "Pattern recognition and subspace method", Sangyo Tosho, (1986)

上記の先行技術の場合、予め設定した閾値に収まる固有値を求めることで使用する固有ベクトルを決定する。このため、入力パターン(例えば文字等)の個々の特性の差は考慮されず、固有値が閾値に収まる固有ベクトルは全て利用対象として選ばれることから、選ばれた中にある入力パターンの認識には悪影響を及ぼす固有ベクトルが含まれていたとしても、その固有ベクトルが認識用として使われてしまい、この結果、認識すべきパターンとは異なるパターンが認識候補にあげられるなどの原因により、パターン認識率のさらなる向上には限界があった。   In the case of the above prior art, the eigenvector to be used is determined by obtaining the eigenvalue that falls within a preset threshold value. For this reason, differences in individual characteristics of input patterns (for example, characters) are not considered, and all eigenvectors whose eigenvalues fall within the threshold are selected as objects to be used, which adversely affects the recognition of the input pattern in the selected one. Even if an eigenvector that affects the pattern is included, the eigenvector is used for recognition, and as a result, a pattern that is different from the pattern to be recognized is included as a recognition candidate. There were limits.

本発明はこのような課題を解決するためになされたもので、パターン認識率を向上することができるパターン認識装置、パターン認識プログラム及びパターン認識方法を提供することを目的とする。   SUMMARY An advantage of some aspects of the invention is that it provides a pattern recognition apparatus, a pattern recognition program, and a pattern recognition method capable of improving a pattern recognition rate.

上記の課題を解決するために本発明のパターン認識装置は、認識対象の入力パターンを、パターン認識に使用するための特徴ベクトルに変換する入力部と、パターン認識に使用する標準的なパターンの固有ベクトルが記憶された認識用辞書と、前記入力部により変換された特徴ベクトルから前記入力パターン固有の特徴を示す複数の固有ベクトルを求める特徴抽出部と、前記特徴抽出部により求められた複数の固有ベクトルと前記認識用辞書に記憶された固有ベクトルとを比較して前記入力パターンの認識を行い、比較した固有ベクトル毎に一致の度合いを示すスコアを出力する第1認識部と、前記第1認識部の出力結果である前記スコアに基づき、固有ベクトル毎に前記認識の結果の信頼度を求める信頼度計算部と、前記信頼度計算部により求められた信頼度を用いて複数の固有ベクトルの中から次の認識で使用する固有ベクトルを選択するベクトル選択部と、前記ベクトル選択部により選択された固有ベクトルを用いて前記入力パターンの認識を行い、正解候補もしくは正解決定に使用する各正解候補の前記スコアをパターン認識の結果として出力する第2認識部とを具備することを特徴とする。 In order to solve the above problems, a pattern recognition apparatus according to the present invention includes an input unit that converts an input pattern to be recognized into a feature vector for use in pattern recognition, and an eigenvector of a standard pattern that is used in pattern recognition. Is stored, a feature extraction unit that obtains a plurality of eigenvectors indicating features unique to the input pattern from the feature vectors converted by the input unit, a plurality of eigenvectors obtained by the feature extraction unit, and the The first recognition unit that compares the eigenvectors stored in the recognition dictionary to recognize the input pattern, outputs a score indicating the degree of matching for each of the compared eigenvectors, and the output result of the first recognition unit based on some the score, the reliability calculating portion for determining the results of the reliability of the recognition for each eigenvector, the reliability calculation unit A vector selecting unit that selects eigenvectors to be used in the next recognition from a plurality of eigenvectors by using the obtained reliability, performs recognition of the input pattern using the eigenvectors selected by the vector selection unit, the correct answer And a second recognizing unit that outputs the score of each correct candidate used for determining a candidate or a correct answer as a result of pattern recognition .

本発明のパターン認識プログラムは、コンピュータを、認識対象の入力パターンを、パターン認識に使用するための特徴ベクトルに変換する入力部と、パターン認識に使用する標準的なパターンの固有ベクトルが記憶された認識用辞書と、前記入力部により変換された特徴ベクトルから前記入力パターン固有の特徴を示す複数の固有ベクトルを求める特徴抽出部と、前記特徴抽出部により求められた複数の固有ベクトルと前記認識用辞書に記憶された固有ベクトルとを比較して前記入力パターンの認識を行い、比較した固有ベクトル毎に一致の度合いを示すスコアを出力する第1認識部と、前記第1認識部の出力結果である前記スコアに基づき、固有ベクトル毎に前記認識の結果の信頼度を求める信頼度計算部と、前記信頼度計算部により求められた信頼度を用いて複数の固有ベクトルの中から次の認識で使用する固有ベクトルを選択するベクトル選択部と、前記ベクトル選択部により選択された固有ベクトルを用いて前記入力パターンの認識を行い、正解候補もしくは正解決定に使用する各正解候補の前記スコアをパターン認識の結果として出力する第2認識部
として機能させることを特徴とする。
The pattern recognition program according to the present invention includes a computer that stores an input unit for converting an input pattern to be recognized into a feature vector for use in pattern recognition, and a standard pattern eigenvector used for pattern recognition. A feature dictionary, a feature extraction unit that obtains a plurality of eigenvectors indicating features unique to the input pattern from the feature vector converted by the input unit, a plurality of eigenvectors obtained by the feature extraction unit, and the memory stored in the recognition dictionary A first recognition unit that compares the eigenvectors with each other and recognizes the input pattern and outputs a score indicating the degree of matching for each of the compared eigenvectors; and based on the score that is an output result of the first recognition unit a reliability calculating unit for obtaining the results of the reliability of the recognition for each eigenvector, determined by the reliability calculating unit A vector selecting unit that selects eigenvectors to be used in the next recognition from a plurality of eigenvectors by using the obtained reliability, have rows recognition of the input pattern using the eigenvectors selected by the vector selection unit, the correct answer It is made to function as a 2nd recognition part which outputs the said score of each correct candidate used for a candidate or a correct answer as a result of pattern recognition .

本発明のパターン認識方法は、認識対象の入力パターンを、パターン認識に使用するための特徴ベクトルに変換するステップと、変換された特徴ベクトルから前記入力パターン固有の特徴を示す複数の固有ベクトルを求めるステップと、前記特徴抽出部により求められた複数の固有ベクトルと、パターン認識に使用する標準的なパターンの固有ベクトルが記憶された認識用辞書に記憶された固有ベクトルとを比較して前記入力パターンの認識を行い、比較した固有ベクトル毎に一致の度合いを示すスコアを出力するステップと、前記認識の出力結果である前記スコアに基づき、固有ベクトル毎に前記認識の結果の信頼度を求めるステップと、求められた信頼度を用いて複数の固有ベクトルの中から次の認識で使用する固有ベクトルを選択するステップと、選択された固有ベクトルを用いて前記入力パターンの認識を行い、正解候補もしくは正解決定に使用する各正解候補の前記スコアをパターン認識の結果として出力するステップとを有することを特徴とする。 The pattern recognition method of the present invention includes a step of converting an input pattern to be recognized into a feature vector for use in pattern recognition, and a step of obtaining a plurality of eigenvectors indicating features unique to the input pattern from the converted feature vector The input pattern is recognized by comparing the plurality of eigenvectors obtained by the feature extraction unit with the eigenvector stored in the recognition dictionary in which eigenvectors of standard patterns used for pattern recognition are stored. A step of outputting a score indicating the degree of coincidence for each of the compared eigenvectors, a step of determining the reliability of the recognition result for each eigenvector based on the score that is the output result of the recognition, and the obtained reliability Is used to select the eigenvector to be used in the next recognition from multiple eigenvectors And step, have rows recognition of the input pattern using the selected eigenvectors, and having a step of outputting the score for each correct answer candidate to be used to correct the candidate or correct decision as a result of the pattern recognition .

本発明によれば、パターン認識率を向上することができる。   According to the present invention, the pattern recognition rate can be improved.

以下、本発明の実施の形態について図面を参照しながら説明する。図1は本発明の実施形態に係るパターン認識装置の構成を示すブロック図である。   Hereinafter, embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing a configuration of a pattern recognition apparatus according to an embodiment of the present invention.

図1に示すように、このパターン認識装置は、入力部21、認識用辞書27、特徴抽出部22、第1認識部24aおよび第2認識部24bを有する認識部24、信頼度計算部23、ベクトル選択部25、出力部26、信頼度判定情報記憶部28を有している。   As shown in FIG. 1, the pattern recognition apparatus includes an input unit 21, a recognition dictionary 27, a feature extraction unit 22, a recognition unit 24 having a first recognition unit 24a and a second recognition unit 24b, a reliability calculation unit 23, A vector selection unit 25, an output unit 26, and a reliability determination information storage unit 28 are provided.

入力部21は、例えばスキャナなどの機器であり、この他、ネットワーク回線に接続されたコンピュータ等の場合もあり、これらを総称している。入力部21は、文字、画像、音声などの認識対象となるパターン(入力パターン)を取得する。つまり入力部21は、入力されたパターンが例えば文字などの場合は文字のイメージデータ(以下「文字パターン」と称す)を、パターン認識に使用するための特徴ベクトルに変換する。   The input unit 21 is, for example, a device such as a scanner. In addition, the input unit 21 may be a computer connected to a network line. The input unit 21 acquires a pattern (input pattern) to be recognized such as characters, images, and voices. That is, the input unit 21 converts character image data (hereinafter referred to as “character pattern”) into a feature vector for use in pattern recognition when the input pattern is, for example, a character.

すなわち、入力部21は、文字、画像、音声などの認識対象となるパターンを入力とし、認識処理に適した形式に変換して特徴抽出部22に出力する。   That is, the input unit 21 receives a pattern to be recognized such as a character, an image, and a sound as an input, converts it into a format suitable for recognition processing, and outputs it to the feature extraction unit 22.

入力部21は、パターンの形式が認識処理に適していない場合、既知の手段による変換を行う。例えば文字パターンであれば、文字切り出しによる文字個別の領域の抽出、正規化による大きさ調整、二値化などの処理を実行し、認識において適切な形式に変換する。   When the pattern format is not suitable for the recognition process, the input unit 21 performs conversion by a known means. For example, in the case of a character pattern, processing such as extraction of individual character regions by character extraction, size adjustment by normalization, and binarization is executed, and converted into an appropriate format for recognition.

変換処理後のデータは特徴抽出部22へ出力される。また、入力部21は、認識用辞書27を設計する場合にその指示を特徴抽出部22へ与える。   The data after the conversion process is output to the feature extraction unit 22. The input unit 21 gives an instruction to the feature extraction unit 22 when designing the recognition dictionary 27.

認識用辞書27には、文字パターンの認識に使用する各文字の標準的なパターンの認識ベクトル(固有値および固有ベクトル)が記憶されている。   The recognition dictionary 27 stores a standard pattern recognition vector (eigenvalue and eigenvector) of each character used for character pattern recognition.

特徴抽出部22は、入力部21から入力された文字パターンより特徴成分を抽出し、文字パターンをN次元の特徴ベクトルの形で表す(N:自然数)。特徴ベクトルは、文字パターンを例にすると、一定の大きさに区切った文字領域内の各部分における方向成分及び濃度特徴など、N個の変量を持つベクトルであり、入力パターンの特徴を表す。なお、文字に限らず、変量をベクトルで表すことが可能であれば、特徴として何を用いてもよい。   The feature extraction unit 22 extracts a feature component from the character pattern input from the input unit 21, and represents the character pattern in the form of an N-dimensional feature vector (N: natural number). Taking a character pattern as an example, the feature vector is a vector having N variables such as a direction component and a density feature in each part in a character area divided into a certain size, and represents a feature of the input pattern. Note that not limited to characters, any variable may be used as long as the variable can be represented by a vector.

つまり、特徴抽出部22は、入力部21により変換された文字パターンの特徴ベクトルから文字パターン固有の特徴を示す複数次元の認識用のベクトル(以下「認識ベクトル」という)を求める。すなわち特徴抽出部22は、特徴ベクトルから、認識用辞書27の認識ベクトルと比較するための認識ベクトルを抽出する。   In other words, the feature extraction unit 22 obtains a multidimensional recognition vector (hereinafter referred to as “recognition vector”) indicating the characteristic unique to the character pattern from the feature vector of the character pattern converted by the input unit 21. That is, the feature extraction unit 22 extracts a recognition vector for comparison with the recognition vector of the recognition dictionary 27 from the feature vector.

認識部24は、この認識ベクトルを用いて、内積やユークリッド距離など、様々な手法により各文字の認識ベクトル間の距離を求めることにより認識用辞書27の認識ベクトルと比較してパターン認識を行う。   The recognition unit 24 performs pattern recognition in comparison with the recognition vector of the recognition dictionary 27 by using this recognition vector to obtain the distance between the recognition vectors of each character by various methods such as inner product and Euclidean distance.

この実施形態では、認識ベクトルの一例として、特徴ベクトルの自己相関行列の固有値及び固有ベクトルを使用する。固有ベクトルとは、大きさが一定で方向が与えられているだけのベクトルであり、それを何倍にするかを決めているのが固有値である。固有値が大きいほど、特徴量が多いことを示している。   In this embodiment, the eigenvalue and eigenvector of the autocorrelation matrix of the feature vector are used as an example of the recognition vector. The eigenvector is a vector having a constant size and a given direction, and the eigenvalue determines how many times the eigenvector is given. The larger the eigenvalue, the greater the feature amount.

なお、固有値及び固有ベクトルに限らず、パターン認識に最適な部分のみを抽出して使用するという本発明の概念を実現できるならば、認識ベクトルとしていかなるパラメータを用いてもよい。   It should be noted that any parameter may be used as a recognition vector as long as the concept of the present invention that extracts and uses only the optimum part for pattern recognition is not limited to eigenvalues and eigenvectors.

第1認識部24aは、特徴抽出部22により求められた複数の固有ベクトルと認識用辞書27に記憶された各文字の固有ベクトルとを比較し、比較した文字の固有ベクトル毎に一致の度合いを示すスコアを出力する。この場合の出力とは、求めたスコアを各候補に対応付けてメモリに記憶することを言う。   The first recognition unit 24a compares the plurality of eigenvectors obtained by the feature extraction unit 22 with the eigenvectors of each character stored in the recognition dictionary 27, and calculates a score indicating the degree of matching for each eigenvector of the compared characters. Output. The output in this case means that the obtained score is stored in the memory in association with each candidate.

信頼度計算部23は、固有ベクトル毎の1位候補のスコアと2位候補のスコアとの関係から1位候補の認識結果の信頼度を求める。   The reliability calculation unit 23 obtains the reliability of the recognition result of the first candidate from the relationship between the score of the first candidate and the score of the second candidate for each eigenvector.

ベクトル選択部25は、信頼度の計算により求められた信頼度から、信頼度が予め設定された閾値以上の固有ベクトルを、入力部21から入力された文字パターンの認識に有用な認識用の固有ベクトルとして選出する。   The vector selection unit 25 uses, as a recognition eigenvector useful for recognizing a character pattern input from the input unit 21, an eigenvector whose reliability is equal to or higher than a preset threshold value from the reliability obtained by calculation of the reliability. elect.

第2認識部24bは、ベクトル選択部25により選択された固有ベクトルを用いて文字パターンの認識を行う。   The second recognition unit 24b recognizes the character pattern using the eigenvector selected by the vector selection unit 25.

このように認識部24は、特徴抽出部22から得られた文字パターンの固有ベクトルと、特徴抽出部22で生成し認識用辞書27で保持している各文字の固有ベクトルとを比較し、文字パターンの所属する文字を決定する。なお、どの固有ベクトルを使用するかは後述のベクトル選択部25による選択結果を基に決定する。   Thus, the recognition unit 24 compares the eigenvector of the character pattern obtained from the feature extraction unit 22 with the eigenvector of each character generated by the feature extraction unit 22 and held in the recognition dictionary 27, and Determine the character to which it belongs. Note that which eigenvector is used is determined based on a selection result by the vector selection unit 25 described later.

また、ベクトルどうしの比較、すなわち文字パターンがどの文字であるかの判定は所定の手法を用いて実行する。例えば比較対象であるベクトルどうしの内積を計算し、その計算結果を類似度として、類似度が最大となった文字を認識解と見なすといった手法がある。この他、例えばユークリッド距離など、文字パターンが所属する文字の確からしさを数値で表現できるならば既知のいかなる手法を用いてもよい。   Moreover, the comparison between vectors, that is, the determination of which character the character pattern is, is executed using a predetermined method. For example, there is a technique in which an inner product of vectors to be compared is calculated, the calculation result is regarded as a similarity, and a character having the maximum similarity is regarded as a recognition solution. In addition, any known method may be used as long as the probability of the character to which the character pattern belongs can be expressed by a numerical value, such as the Euclidean distance.

出力部26は、各種インターフェースとそれに接続された機器、例えばVGAインターフェースに接続されたモニタ、USBインターフェースに接続されたプリンタ、LANインターフェースに接続された外部のコンピュータなどである。認識部24による認識結果が出力部26に渡されて出力部26から出力される。   The output unit 26 includes various interfaces and devices connected thereto, such as a monitor connected to a VGA interface, a printer connected to a USB interface, and an external computer connected to a LAN interface. The recognition result by the recognition unit 24 is passed to the output unit 26 and output from the output unit 26.

認識結果とは入力された文字パターンから認識した文字(テキスト)、信頼度判定の際に用いたスコア、他の正解候補であるスコア上位の文字、各正解候補のスコアなどである。なお、上記の項目は一例であり、ユーザが必要とする任意の情報を適宜取捨し出力してよい。また、表示形式もユーザが所望により決めた任意の形式としてよい。一例としては、出力部26は、認識部24により認識された認識解である文字を表示する。   The recognition result includes a character (text) recognized from the input character pattern, a score used when determining reliability, a higher-ranking character that is another correct candidate, a score of each correct candidate, and the like. In addition, said item is an example and you may discard and output arbitrarily the information which a user requires suitably. The display format may be an arbitrary format determined by the user as desired. As an example, the output unit 26 displays characters that are recognition solutions recognized by the recognition unit 24.

信頼度判定情報記憶部28はメモリ等により実現される。信頼度判定情報記憶部28には、信頼度から有効な認識用の固有ベクトルを選出するための閾値が記憶されている。   The reliability determination information storage unit 28 is realized by a memory or the like. The reliability determination information storage unit 28 stores a threshold value for selecting an effective recognition eigenvector from the reliability.

ここで、まず、図2を参照してこのパターン認識装置の辞書登録動作を説明する。   First, the dictionary registration operation of the pattern recognition apparatus will be described with reference to FIG.

認識用辞書27に認識用の文字パターンを登録する場合、入力部21は、辞書設計用の文字パターンを取得し特徴抽出部22に出力する(ステップS101)。   When registering a character pattern for recognition in the recognition dictionary 27, the input unit 21 acquires a character pattern for dictionary design and outputs it to the feature extraction unit 22 (step S101).

特徴抽出部22は、入力された辞書設計用の文字パターンの特徴ベクトル及び認識ベクトル(固有値及び固有ベクトル)を算出し(ステップS102)、算出した認識ベクトル(固有値及び固有ベクトル)と入力された文字パターンの文字(ひらがな、カタカナ、漢字等)の情報とを対応付けて認識用辞書27に記憶する(ステップS103)。   The feature extraction unit 22 calculates the feature vector and the recognition vector (eigenvalue and eigenvector) of the input dictionary design character pattern (step S102), and calculates the calculated recognition vector (eigenvalue and eigenvector) and the input character pattern. Character information (Hiragana, Katakana, Kanji, etc.) is associated with each other and stored in the recognition dictionary 27 (step S103).

そして、特徴抽出部22は、各固有ベクトルの信頼度関数を生成し、信頼度判定情報記憶部28に記憶する(ステップS104)。   Then, the feature extraction unit 22 generates a reliability function for each eigenvector and stores it in the reliability determination information storage unit 28 (step S104).

続いて、図3乃至図8を参照してこのパターン認識装置のパターン認識動作を説明する。
この場合、入力部21は、認識対象の文字パターンを取得し特徴抽出部22へ出力する(図4のステップS201)。
Next, the pattern recognition operation of this pattern recognition apparatus will be described with reference to FIGS.
In this case, the input unit 21 acquires a character pattern to be recognized and outputs it to the feature extraction unit 22 (step S201 in FIG. 4).

特徴抽出部22は、入力された文字パターンより特徴ベクトル及び認識用の複数の固有ベクトルを算出し認識部24へ出力する(ステップS202)。   The feature extraction unit 22 calculates a feature vector and a plurality of eigenvectors for recognition from the input character pattern and outputs them to the recognition unit 24 (step S202).

認識部24では、第1認識部24aが、まず、特徴抽出部22から入力されたそれぞれの固有ベクトルと認識用辞書27の認識ベクトル(固有ベクトル)とを比較して第1認識を行い、認識結果として得られた複数の候補それぞれの固有ベクトルの認識スコア(得点)を算出し、メモリに記憶する(ステップS203)。   In the recognizing unit 24, the first recognizing unit 24a first performs first recognition by comparing each eigenvector input from the feature extracting unit 22 with the recognition vector (eigenvector) of the recognition dictionary 27, and as a recognition result. A recognition score (score) of the eigenvector for each of the obtained candidates is calculated and stored in the memory (step S203).

一つの文字パターンから得られた複数の固有ベクトルが、例えば図3に示すように、固有ベクトルA〜Dとし、スコアが「1000点」を満点とすると、この例では、信頼度判定情報記憶部28(メモリ)には、固有ベクトルAについて第1候補のスコアとして例えば「900点」、第2候補のスコアとして「450点」等が記憶される。   If a plurality of eigenvectors obtained from one character pattern are eigenvectors A to D as shown in FIG. 3, for example, and the score is “1000 points”, in this example, the reliability determination information storage unit 28 ( For example, “900 points” is stored as the first candidate score for the eigenvector A, and “450 points” is stored as the second candidate score.

固有ベクトルBについて第1候補のスコアとして例えば「700点」、第2候補のスコアとして「650点」等が記憶される。   For the eigenvector B, for example, “700 points” is stored as the first candidate score, “650 points” is stored as the second candidate score, and the like.

固有ベクトルCについて第1候補のスコアとして例えば「400点」、第2候補のスコアとして「100点」等が記憶される。   For the eigenvector C, for example, “400 points” is stored as the score of the first candidate, “100 points” is stored as the score of the second candidate, and the like.

固有ベクトルDについて第1候補のスコアとして例えば「300点」、第2候補のスコアとして「250点」等が記憶される。   For the eigenvector D, for example, “300 points” is stored as the first candidate score, “250 points” is stored as the second candidate score, and the like.

各固有ベクトルについてのスコアの算出が終了すると、続いて、信頼度計算部23は、認識部24での各固有ベクトルの認識結果を読み出して、信頼度判定情報記憶部28(メモリ)に記憶されていた信頼度関数を基に信頼度を算出する(ステップS204)。   When the calculation of the score for each eigenvector is completed, the reliability calculation unit 23 subsequently reads the recognition result of each eigenvector in the recognition unit 24 and is stored in the reliability determination information storage unit 28 (memory). The reliability is calculated based on the reliability function (step S204).

例えば信頼度計算部23は、上位候補どうしの固有ベクトルのスコアの関係から第1候補の認識結果の信頼度を算出し、信頼度判定情報記憶部28の該当固有ベクトルの信頼度の欄に記憶する。   For example, the reliability calculation unit 23 calculates the reliability of the recognition result of the first candidate from the relationship between the eigenvector scores of the higher candidates, and stores the reliability in the column of the reliability of the corresponding eigenvector in the reliability determination information storage unit 28.

例えば図3の固有ベクトルAについて、第1候補のスコアが「900点」、第2候補のスコアが「450点」の場合、第1候補のスコアが高得点であり、かつ第1候補と第2候補との得点差が大きい場合に第1候補の信頼度が高いため、信頼度として「0.9」が付与される。なおこの場合の信頼度は「1.0」が一番高いものとする。   For example, for the eigenvector A in FIG. 3, if the score of the first candidate is “900 points” and the score of the second candidate is “450 points”, the score of the first candidate is high, and the first candidate and the second candidate Since the reliability of the first candidate is high when the score difference from the candidate is large, “0.9” is assigned as the reliability. In this case, “1.0” is the highest reliability.

一方、固有ベクトルBについては、第1候補のスコアが「700点」、第2候補のスコアが「650点」の場合、第1候補のスコアと第2候補のスコアとの得点差が小さいため、得点が高いものの第1候補の信頼度は高くはない。このため、信頼度として「0.5」が付与される。   On the other hand, for the eigenvector B, when the score of the first candidate is “700 points” and the score of the second candidate is “650 points”, the score difference between the score of the first candidate and the score of the second candidate is small. Although the score is high, the reliability of the first candidate is not high. For this reason, “0.5” is given as the reliability.

また、固有ベクトルCについては、第1候補のスコアが「400点」、第2候補のスコアが「100点」の場合、第1候補のスコアはそれほど高くはないものの、第1候補のスコアと第2候補のスコアとの得点差が大きいため、第1候補の信頼度は高い。このため、信頼度として「0.8」が付与される。   For the eigenvector C, when the score of the first candidate is “400 points” and the score of the second candidate is “100 points”, the score of the first candidate and the second candidate score are not so high. Since the score difference with the score of the two candidates is large, the reliability of the first candidate is high. For this reason, “0.8” is given as the reliability.

ここで、認識スコアの算出から信頼度を求める処理を詳述する。認識部24は、固有ベクトル群のそれぞれ一つ一つを用いてデータ取得用パターン群を入力した際の認識結果(認識スコア)を求める。   Here, the process for obtaining the reliability from the calculation of the recognition score will be described in detail. The recognition unit 24 obtains a recognition result (recognition score) when a data acquisition pattern group is input using each eigenvector group.

信頼度計算部23は、この認識結果(認識スコア)を基にして、ある文字パターンの認識結果がどれだけ信頼できるかを示す信頼度関数を設定する。すなわち、ある固有ベクトルを用いて得た認識スコアがどれだけ信頼できるか、その固有ベクトルを基に作成した識別情報の信頼度(重み)がどれほどであるかを、認識部24が算出した認識スコアを入力として、信頼度を返す数式の形で表現する。   The reliability calculation unit 23 sets a reliability function indicating how reliable the recognition result of a certain character pattern is based on the recognition result (recognition score). That is, the recognition score calculated by the recognition unit 24 is input as to how reliable the recognition score obtained using a certain eigenvector is, and how much the identification information created based on that eigenvector is reliable (weight). Is expressed in the form of a mathematical expression that returns the reliability.

この信頼度関数として、例えば図5に示すように、認識スコア(類似度)に対してある閾値で信頼度が一定値ずつ段階的に変化するステップ関数などを用いる。なお、文字パターンから得られた各種データを基に信頼度を一意に決定できるならば、信頼度関数の他、入力データに対応する値を表の形で持っておくなど、どのような形式の決定様式を定めてもよい。   As the reliability function, for example, as shown in FIG. 5, a step function or the like in which the reliability changes stepwise by a certain value with a certain threshold with respect to the recognition score (similarity). If the reliability can be uniquely determined based on the various data obtained from the character pattern, in addition to the reliability function, the value corresponding to the input data is held in the form of a table. A decision style may be established.

また、入力データに対する信頼度の関係(ある入力データが来た場合において、出力する信頼度はどのような値か)は任意に設定してよい。   Further, the relationship of reliability with respect to input data (what value is the reliability to be output when certain input data comes) may be arbitrarily set.

信頼度計算部23は、信頼度関数を作成した上で、信頼度関数と文字パターンからその認識における各固有ベクトルの信頼度を求める。求めた結果はベクトル選択部25へ出力される。   The reliability calculation unit 23 creates a reliability function and then calculates the reliability of each eigenvector in the recognition from the reliability function and the character pattern. The obtained result is output to the vector selection unit 25.

ベクトル選択部25は、信頼度計算部23により求められた各固有ベクトルについての信頼度を信頼度判定情報記憶部28から読み出し、読み出した各固有ベクトルの信頼度どうしの関係から文字パターンの認識に有効な固有ベクトルを選択(選出)し、その固有ベクトルの選択情報を認識部24に出力する(ステップS205)。   The vector selection unit 25 reads the reliability of each eigenvector obtained by the reliability calculation unit 23 from the reliability determination information storage unit 28, and is effective for character pattern recognition from the relationship between the reliability of each read eigenvector. The eigenvector is selected (selected), and selection information of the eigenvector is output to the recognition unit 24 (step S205).

文字パターンの認識に有効な固有ベクトルを選択(選出)する場合、例えば図6に示すように、固有ベクトルA〜Dの中から固有ベクトルAと固有ベクトルCだけが選択されることや、図7に示すように、固有ベクトルA〜Dの中から固有ベクトルA〜Cのように連続した一定範囲のベクトルが選択されることもあり、その境界となる閾値は所望により決定してよい。   When selecting (selecting) eigenvectors effective for character pattern recognition, for example, as shown in FIG. 6, only eigenvector A and eigenvector C are selected from eigenvectors A to D, or as shown in FIG. A continuous range of vectors such as eigenvectors A to C may be selected from eigenvectors A to D, and the threshold value as the boundary may be determined as desired.

認識部24では、第2認識部24bが、まず、特徴抽出部22から入力された固有ベクトルの選択情報から、認識用辞書27の認識ベクトル(固有値及び固有ベクトル)のうちの選択された認識ベクトル(固有値及び固有ベクトル)と、文字パターンから得られた該当固有ベクトルとを比較して第2認識を行い(ステップS206)、認識結果として文字を出力部26へ出力すると共に(ステップS207)、メモリに記憶する。   In the recognition unit 24, the second recognition unit 24 b first selects a recognition vector (eigenvalue) selected from the recognition vectors (eigenvalues and eigenvectors) of the recognition dictionary 27 from the eigenvector selection information input from the feature extraction unit 22. And the corresponding eigenvector obtained from the character pattern to perform the second recognition (step S206), and the character is output to the output unit 26 as the recognition result (step S207) and stored in the memory.

第2認識を行う上で、選択された固有ベクトルの信頼度を考慮して複数の固有ベクトルを組み合わせて識別空間を構成する。認識スコアを計算する場合、一つの文字について、選択した複数の固有ベクトルA〜Dの認識スコアを合計する。   In performing the second recognition, an identification space is configured by combining a plurality of eigenvectors in consideration of the reliability of the selected eigenvector. When calculating a recognition score, the recognition scores of a plurality of selected eigenvectors A to D are totaled for one character.

複数の固有ベクトルが例えば固有ベクトルA〜Dとし、文字「ア」の認識スコアをR(X)とすると、図8に示すように、固有ベクトルAで得られた認識用スコア(R(X))に固有ベクトルごとの信頼度αを乗じ、固有ベクトルBで得られた認識用スコア(R1(X))に固有ベクトルごとの信頼度α1を乗じ、固有ベクトルCで得られた認識用スコア(R2(X))に固有ベクトルごとの信頼度α2を乗じ、…、これらの値を合計した値を認識用スコアR(X)とする。 Assuming that the plurality of eigenvectors are eigenvectors A to D and the recognition score of the character “A” is R (X), the recognition score (R 0 (X)) obtained with the eigenvector A is obtained as shown in FIG. Multiply the reliability α o for each eigenvector, multiply the recognition score (R 1 (X)) obtained for the eigenvector B by the reliability α 1 for each eigenvector, and obtain the recognition score (R 2 ( X)) is multiplied by the reliability α 2 for each eigenvector, and the sum of these values is taken as a recognition score R (X).

そしてこの認識スコアを他の文字についても求め、最終的に最も値が高くなった文字を認識解、つまり認識結果の文字とする。つまり他の文字についても複数の固有ベクトルA〜Dの認識スコアを合計する。例えば文字「イ」の認識スコアをR’(X)、文字「ウ」の認識スコアをR’’(X)等として各固有ベクトルの数値を合計する。   Then, the recognition score is obtained for other characters, and the character having the highest value in the end is used as the recognition solution, that is, the character of the recognition result. That is, the recognition scores of a plurality of eigenvectors A to D are totaled for other characters. For example, the recognition score of the character “I” is R ′ (X), the recognition score of the character “U” is R ″ (X), etc., and the numerical values of the eigenvectors are summed.

この他、固有ベクトル毎に認識解を求めた上で固有ベクトル毎の信頼度を認識解のスコアとして累積し、最もスコアが高くなった文字を最終的な認識解とするなど、組み合わせについては任意の手法を適用してよい。   In addition, after obtaining a recognition solution for each eigenvector, the reliability for each eigenvector is accumulated as the recognition solution score, and the character with the highest score is used as the final recognition solution. May be applied.

このようにこの第1実施形態のパターン認識装置によれば、はじめの文字認識で得られた複数の固有ベクトルの信頼度を求め、この信頼度を用いて認識対象とすべき固有ベクトルを限定し、その固有ベクトルを持つ文字の認識に特化した認識ベクトルを選択することで、文字全てを認識対象とするよりも認識精度を高めることができ、文字パターンの認識率を向上することができる。
(第2実施形態)
As described above, according to the pattern recognition apparatus of the first embodiment, the reliability of a plurality of eigenvectors obtained in the first character recognition is obtained, and the eigenvectors to be recognized are limited by using the reliability. By selecting a recognition vector specialized for recognition of characters having eigenvectors, recognition accuracy can be improved and recognition rate of character patterns can be improved as compared with the case where all characters are recognized.
(Second Embodiment)

(第2実施形態)
次に、第2実施形態について説明する。なお、第2実施形態を説明するにあたり、上記第1実施形態と同じ構成には同一の符号を付し異なる機能について説明する。
(Second Embodiment)
Next, a second embodiment will be described. In describing the second embodiment, the same components as those in the first embodiment are denoted by the same reference numerals, and different functions will be described.

図9に示すように、この第2実施形態のパターン認識装置は、第1実施形態と同様に、入力部21、特徴抽出部22、信頼度計算部23、認識部24、ベクトル選択部25、出力部26、認識用辞書27、信頼度判定情報記憶部28、パターンマッチング部29を有している。   As shown in FIG. 9, the pattern recognition apparatus of the second embodiment is similar to the first embodiment in that an input unit 21, a feature extraction unit 22, a reliability calculation unit 23, a recognition unit 24, a vector selection unit 25, An output unit 26, a recognition dictionary 27, a reliability determination information storage unit 28, and a pattern matching unit 29 are provided.

特徴抽出部22は、入力部21から入力された文字パターンから認識ベクトルを抽出する。ここで、認識対象となる入力パターンに関してはその認識ベクトルをそのまま信頼度計算部23へ出力する。信頼度計算部23は、特徴抽出部22で求められた特徴ベクトルを受け取り、受け取った特徴ベクトルから信頼度を計算する。   The feature extraction unit 22 extracts a recognition vector from the character pattern input from the input unit 21. Here, regarding the input pattern to be recognized, the recognition vector is output to the reliability calculation unit 23 as it is. The reliability calculation unit 23 receives the feature vector obtained by the feature extraction unit 22, and calculates the reliability from the received feature vector.

パターンマッチング部29は、特徴抽出部22から入力されたそれぞれの固有ベクトルと認識用辞書27の認識ベクトル(固有値及び固有ベクトル)とを比較してパターンマッチングを行い、パターンマッチングの結果として得られた複数の候補それぞれの固有ベクトルの認識スコア(得点)を算出し出力、つまり認識ベクトル(固有値及び固有ベクトル)と認識スコア(得点)とを対応づけてメモリに記憶する。   The pattern matching unit 29 performs pattern matching by comparing each eigenvector input from the feature extraction unit 22 with the recognition vectors (eigenvalues and eigenvectors) of the recognition dictionary 27, and a plurality of pattern matching results are obtained. A recognition score (score) of each candidate eigenvector is calculated and output, that is, a recognition vector (eigenvalue and eigenvector) and a recognition score (score) are associated with each other and stored in a memory.

信頼度計算部23は、メモリに記憶された文字パターンの固有ベクトルおよび認識スコア(得点)を読み出して各固有ベクトル毎の信頼度を計算しベクトル選択部25へ出力する。   The reliability calculation unit 23 reads the eigenvector and recognition score (score) of the character pattern stored in the memory, calculates the reliability for each eigenvector, and outputs it to the vector selection unit 25.

この第2実施形態では、上記第1実施形態と同様に、認識ベクトルの例として元パターン群の分散度合いを表す認識ベクトル(固有値及び固有ベクトル)と認識スコアを使用する。   In the second embodiment, as in the first embodiment, a recognition vector (eigenvalue and eigenvector) representing the degree of dispersion of the original pattern group and a recognition score are used as examples of the recognition vector.

信頼度計算部23は、メモリより読み出した認識ベクトル(固有値及び固有ベクトル)から固有値の分布状況を取得する。   The reliability calculation unit 23 acquires the distribution state of eigenvalues from the recognition vector (eigenvalue and eigenvector) read from the memory.

図10〜図12に示すように、固有ベクトルの分布状況に対応した信頼度計算用の表30(テーブル)を予めメモリに記憶しておき、固有値の数値が、図10〜図12の表30のいずれかの棒グラフの並び方に近似または一致した場合、該当する表30から対応する信頼度を求めてベクトル選択部25へ出力する。以降のベクトル選択部25での処理は第1実施形態と同様であり、認識用辞書27の認識ベクトルの中から入力パターンの認識に適するものを取捨選択して認識部24に通知する。   10 to 12, a reliability calculation table 30 (table) corresponding to the distribution state of the eigenvectors is stored in advance in the memory, and the numerical values of the eigenvalues are as shown in Table 30 of FIGS. When it is approximated or coincides with any bar graph arrangement, the corresponding reliability is obtained from the corresponding table 30 and output to the vector selection unit 25. Subsequent processing in the vector selection unit 25 is the same as that in the first embodiment. From the recognition vectors in the recognition dictionary 27, those suitable for recognition of the input pattern are selected and notified to the recognition unit 24.

認識部24は、認識ベクトルそれぞれ単独の認識は行わず、ベクトル選択部25からの通知を受けて、選択された認識ベクトルを用いて文字パターンの認識処理を実行する。   The recognition unit 24 does not perform recognition of each recognition vector, but receives a notification from the vector selection unit 25 and executes character pattern recognition processing using the selected recognition vector.

なお、固有値及び固有ベクトルの他に、認識に最適な部分のみを抽出して使用するという本発明の概念を実現できるならば、認識ベクトルとしていかなるものを用いてもよい。   In addition to the eigenvalues and eigenvectors, any recognition vector may be used as long as the concept of the present invention of extracting and using only the optimum part for recognition can be realized.

また、表30(テーブル)の他に特定の関数など、入力に対して信頼度及びその認識に使用する認識ベクトルを一意に選択(決定)できる限りにおいて、その決定手段としていかなる手段を用いてもよい。これにより、認識部24を二度通すことなく、認識用辞書27の認識ベクトルの中から入力パターンの認識に適するもののみを選択して利用できるようになる。   In addition to the table 30 (table), any means can be used as the determining means as long as the reliability and the recognition vector used for the recognition can be uniquely selected (determined) for a specific function. Good. As a result, only those suitable for recognition of the input pattern can be selected from the recognition vectors in the recognition dictionary 27 without passing through the recognition unit 24 twice.

(第3実施形態)
次に、第3実施形態について説明する。なお、この第3実施形態の構成の接続関係は、上記第1実施形態と同じであり、図1を参照して各構成の機能を説明する。
(Third embodiment)
Next, a third embodiment will be described. The connection relationship of the configuration of the third embodiment is the same as that of the first embodiment, and the function of each configuration will be described with reference to FIG.

この第3実施形態のパターン認識装置は、第1実施形態と同様に、入力部21、特徴抽出部22、信頼度計算部23、認識部24、ベクトル選択部25、出力部26、認識用辞書27、信頼度判定情報記憶部28を有している。   Similar to the first embodiment, the pattern recognition apparatus according to the third embodiment includes an input unit 21, a feature extraction unit 22, a reliability calculation unit 23, a recognition unit 24, a vector selection unit 25, an output unit 26, and a recognition dictionary. 27, a reliability determination information storage unit 28 is provided.

この第3実施形態では、認識部24は、はじめに認識ベクトル全てを用いて、入力された文字パターンの認識を実行する。この認識の結果、得られた認識スコアが上位となった文字群(上位候補の文字群)を信頼度計算部23へ出力する。これにより、信頼度計算部23は、認識部24により求められた認識スコアの上位の文字群を受け取る。   In the third embodiment, the recognition unit 24 first performs recognition of the input character pattern using all the recognition vectors. As a result of this recognition, a character group (higher candidate character group) having a higher recognition score is output to the reliability calculation unit 23. As a result, the reliability calculation unit 23 receives the upper character group of the recognition score obtained by the recognition unit 24.

メモリには、図13に示すように、特定の文字群に対して行う認識についての認識ベクトル毎の信頼度合いを設定した表をリスト31として予め保持しておく。   As shown in FIG. 13, a table in which a reliability level for each recognition vector for recognition performed on a specific character group is set in advance as a list 31 in the memory.

信頼度計算部23は、認識スコアの上位候補との文字群を受け取ると、受け取った文字群に対して、メモリのリスト31から対応した認識ベクトル毎の信頼度をベクトル選択部25に出力する。   When the reliability calculation unit 23 receives a character group with a higher recognition score candidate, the reliability calculation unit 23 outputs the reliability for each recognition vector corresponding to the received character group from the memory list 31 to the vector selection unit 25.

なお、この例では、リスト31を用いたが、この他、例えば関数など、入力に対して信頼度を一意に決定できる情報であるならば、いかなる形式のものを用いてよい。また、信頼度計算部23は、入力された文字群に対して、認識ベクトル毎の信頼度をベクトル選択部25へ出力する他、使用すべき認識ベクトルを示す情報を送ってもよい。この場合は、ベクトル選択部25では、入力された情報をそのまま認識部24へ出力する。   In this example, the list 31 is used. However, any other format may be used as long as the information can uniquely determine the reliability of the input, such as a function. In addition to outputting the reliability for each recognition vector to the vector selection unit 25, the reliability calculation unit 23 may send information indicating the recognition vector to be used to the input character group. In this case, the vector selection unit 25 outputs the input information as it is to the recognition unit 24.

認識部24は、入力される文字パターンに対して認識ベクトル全てを用いた第1認識を最初に実行し、その認識結果を信頼度計算部23に渡すものとする。   The recognition unit 24 first executes the first recognition using all the recognition vectors for the input character pattern, and passes the recognition result to the reliability calculation unit 23.

この第3実施形態によれば、認識対象とすべき文字を限定し、その文字の認識に特化した認識ベクトルを選択することで、文字全てを認識対象とするよりも認識精度をさらに向上することができる。   According to the third embodiment, by limiting the characters to be recognized and selecting a recognition vector specialized for the recognition of the characters, the recognition accuracy is further improved as compared with the case where all the characters are to be recognized. be able to.

なお、本願発明は、上記実施形態のみに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形してもよい。また、上記実施形態に開示されている複数の構成要素を適宜組み合わせることにより、種々の発明を構成できる。   In addition, this invention is not limited only to the said embodiment, You may deform | transform a component in the range which does not deviate from the summary in an implementation stage. In addition, various inventions can be configured by appropriately combining a plurality of components disclosed in the embodiment.

例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。   For example, some components may be deleted from all the components shown in the embodiment. Furthermore, constituent elements over different embodiments may be appropriately combined.

具体的には、上記実施形態では、認識対象の入力パターンが文字パターンの場合について説明したが、この他、音声パターン、画像、動画などのパターンであってもよい。   Specifically, although the case where the input pattern to be recognized is a character pattern has been described in the above embodiment, other patterns such as an audio pattern, an image, and a moving image may be used.

本発明の第1実施形態及び第3実施形態のパターン認識装置の構成を示す図。The figure which shows the structure of the pattern recognition apparatus of 1st Embodiment and 3rd Embodiment of this invention. このパターン認識装置の辞書登録動作を示すフローチャート。The flowchart which shows the dictionary registration operation | movement of this pattern recognition apparatus. 文字パターンから得られた複数の固有ベクトルに対して付与される第1候補毎のスコアと信頼度を示す図。The figure which shows the score and reliability for every 1st candidate provided with respect to the some eigenvector obtained from the character pattern. 第1実施形態のパターン認識装置の動作を示すフローチャート。The flowchart which shows operation | movement of the pattern recognition apparatus of 1st Embodiment. 認識スコアに対してある閾値で信頼度が一定値ずつ変化するステップ関数の一例を示す図。The figure which shows an example of the step function from which a reliability changes by a fixed value with a certain threshold with respect to a recognition score. 複数の固有ベクトルの中から有用な固有ベクトルが選択される一例を示す図。The figure which shows an example in which a useful eigenvector is selected from several eigenvectors. 複数の固有ベクトルの中から有用な固有ベクトルが選択される他の例を示す図。The figure which shows the other example from which a useful eigenvector is selected from several eigenvectors. 個々の文字についての認証スコアの算出例を示す図。The figure which shows the example of calculation of the authentication score about each character. 第2実施形態のパターン認識装置の構成を示す図。The figure which shows the structure of the pattern recognition apparatus of 2nd Embodiment. パターン別の固有ベクトル−信頼度の表を示す図。The figure which shows the table | surface of the eigenvector-reliability according to pattern. パターン別の固有ベクトル−信頼度表を示す図。The figure which shows the eigenvector-reliability table according to pattern. パターン別の固有ベクトル−信頼度表を示す図。The figure which shows the eigenvector-reliability table according to pattern. 上位候補の組み合わせと各固有ベクトル信頼度のリスト(対応表)を示す図。The figure which shows the list | wrist (correspondence table | surface) of the combination of a high-order candidate, and each eigenvector reliability.

符号の説明Explanation of symbols

21…入力部、22…特徴抽出部、23…信頼度計算部、24…認識部、24a…第1認識部、24b…第2認識部、25…ベクトル選択部、26…出力部、27…認識用辞書、28…信頼度判定情報記憶部、29…パターンマッチング部。   DESCRIPTION OF SYMBOLS 21 ... Input part, 22 ... Feature extraction part, 23 ... Reliability calculation part, 24 ... Recognition part, 24a ... First recognition part, 24b ... Second recognition part, 25 ... Vector selection part, 26 ... Output part, 27 ... Recognizing dictionary, 28 ... reliability determination information storage unit, 29 ... pattern matching unit.

Claims (5)

認識対象の入力パターンを、パターン認識に使用するための特徴ベクトルに変換する入力部と、
パターン認識に使用する標準的なパターンの固有ベクトルが記憶された認識用辞書と、
前記入力部により変換された特徴ベクトルから前記入力パターン固有の特徴を示す複数の固有ベクトルを求める特徴抽出部と、
前記特徴抽出部により求められた複数の固有ベクトルと前記認識用辞書に記憶された固有ベクトルとを比較して前記入力パターンの認識を行い、比較した固有ベクトル毎に一致の度合いを示すスコアを出力する第1認識部と、
前記第1認識部の出力結果である前記スコアに基づき、固有ベクトル毎に前記認識の結果の信頼度を求める信頼度計算部と、
前記信頼度計算部により求められた信頼度を用いて複数の固有ベクトルの中から次の認識で使用する固有ベクトルを選択するベクトル選択部と、
前記ベクトル選択部により選択された固有ベクトルを用いて前記入力パターンの認識を行い、正解候補もしくは正解決定に使用する各正解候補の前記スコアをパターン認識の結果として出力する第2認識部と
を具備することを特徴とするパターン認識装置。
An input unit that converts an input pattern to be recognized into a feature vector for use in pattern recognition;
A recognition dictionary in which eigenvectors of standard patterns used for pattern recognition are stored;
A feature extraction unit for obtaining a plurality of eigenvectors indicating features unique to the input pattern from the feature vectors converted by the input unit;
A first output unit that recognizes the input pattern by comparing a plurality of eigenvectors obtained by the feature extraction unit with eigenvectors stored in the recognition dictionary and outputs a score indicating a degree of matching for each of the compared eigenvectors. A recognition unit;
A reliability calculation unit that obtains reliability of the recognition result for each eigenvector based on the score that is an output result of the first recognition unit ;
A vector selection unit that selects an eigenvector to be used in the next recognition from a plurality of eigenvectors using the reliability obtained by the reliability calculation unit;
A second recognizing unit that recognizes the input pattern using the eigenvector selected by the vector selecting unit and outputs the correct candidate or the score of each correct candidate used for determining a correct answer as a result of pattern recognition. A pattern recognition apparatus.
前記信頼度計算部は、
固有ベクトル毎の1位候補のスコアと2位候補のスコアとの関係から1位候補の認識結果の信頼度を求めることを特徴とする請求項1記載のパターン認識装置。
The reliability calculation unit includes:
The pattern recognition apparatus according to claim 1, wherein the reliability of the recognition result of the first candidate is obtained from the relationship between the score of the first candidate and the score of the second candidate for each eigenvector.
前記ベクトル選択部は、
信頼度計算の結果から信頼度が予め設定された閾値以上の固有ベクトルを、前記第2認識部での認識に用いる固有ベクトルとして選択することを特徴とする請求項1記載のパターン認識装置。
The vector selection unit
The pattern recognition apparatus according to claim 1, wherein an eigenvector whose reliability is equal to or higher than a preset threshold is selected as an eigenvector used for recognition in the second recognition unit from a result of reliability calculation.
コンピュータを、
認識対象の入力パターンを、パターン認識に使用するための特徴ベクトルに変換する入力部と、
パターン認識に使用する標準的なパターンの固有ベクトルが記憶された認識用辞書と、
前記入力部により変換された特徴ベクトルから前記入力パターン固有の特徴を示す複数の固有ベクトルを求める特徴抽出部と、
前記特徴抽出部により求められた複数の固有ベクトルと前記認識用辞書に記憶された固有ベクトルとを比較して前記入力パターンの認識を行い、比較した固有ベクトル毎に一致の度合いを示すスコアを出力する第1認識部と、
前記第1認識部の出力結果である前記スコアに基づき、固有ベクトル毎に前記認識の結果の信頼度を求める信頼度計算部と、
前記信頼度計算部により求められた信頼度を用いて複数の固有ベクトルの中から次の認識で使用する固有ベクトルを選択するベクトル選択部と、
前記ベクトル選択部により選択された固有ベクトルを用いて前記入力パターンの認識を行い、正解候補もしくは正解決定に使用する各正解候補の前記スコアをパターン認識の結果として出力する第2認識部
として機能させることを特徴とするパターン認識プログラム。
Computer
An input unit that converts an input pattern to be recognized into a feature vector for use in pattern recognition;
A recognition dictionary in which eigenvectors of standard patterns used for pattern recognition are stored;
A feature extraction unit for obtaining a plurality of eigenvectors indicating features unique to the input pattern from the feature vectors converted by the input unit;
A first output unit that recognizes the input pattern by comparing a plurality of eigenvectors obtained by the feature extraction unit with eigenvectors stored in the recognition dictionary and outputs a score indicating a degree of matching for each of the compared eigenvectors. A recognition unit;
A reliability calculation unit that obtains reliability of the recognition result for each eigenvector based on the score that is an output result of the first recognition unit ;
A vector selection unit that selects an eigenvector to be used in the next recognition from a plurality of eigenvectors using the reliability obtained by the reliability calculation unit;
There line recognition of the input pattern using the selected eigenvectors by the vector selecting unit, to function as a second recognition unit which outputs the score for each correct answer candidate to be used to correct the candidate or correct decision as a result of the pattern recognition A pattern recognition program characterized by that.
認識対象の入力パターンを、パターン認識に使用するための特徴ベクトルに変換するステップと、
変換された特徴ベクトルから前記入力パターン固有の特徴を示す複数の固有ベクトルを求めるステップと、
前記特徴抽出部により求められた複数の固有ベクトルと、パターン認識に使用する標準的なパターンの固有ベクトルが記憶された認識用辞書に記憶された固有ベクトルとを比較して前記入力パターンの認識を行い、比較した固有ベクトル毎に一致の度合いを示すスコアを出力するステップと、
前記認識の出力結果である前記スコアに基づき、固有ベクトル毎に前記認識の結果の信頼度を求めるステップと、
求められた信頼度を用いて複数の固有ベクトルの中から次の認識で使用する固有ベクトルを選択するステップと、
選択された固有ベクトルを用いて前記入力パターンの認識を行い、正解候補もしくは正解決定に使用する各正解候補の前記スコアをパターン認識の結果として出力するステップと
を有することを特徴とするパターン認識方法。
Converting the input pattern to be recognized into a feature vector for use in pattern recognition;
Obtaining a plurality of eigenvectors indicating features unique to the input pattern from the transformed feature vectors;
The input pattern is recognized by comparing a plurality of eigenvectors obtained by the feature extraction unit with eigenvectors stored in a recognition dictionary in which eigenvectors of standard patterns used for pattern recognition are stored. Outputting a score indicating the degree of matching for each eigenvector,
Determining the reliability of the recognition result for each eigenvector based on the score that is the output result of the recognition;
Selecting an eigenvector to be used in the next recognition from a plurality of eigenvectors using the determined reliability;
Pattern recognition method characterized by a step of outputting have line recognition of the input pattern using the selected eigenvectors, the score for each correct answer candidate to be used to correct the candidate or correct decision as a result of the pattern recognition .
JP2008034234A 2008-02-15 2008-02-15 Pattern recognition apparatus, pattern recognition program, and pattern recognition method Active JP4820830B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008034234A JP4820830B2 (en) 2008-02-15 2008-02-15 Pattern recognition apparatus, pattern recognition program, and pattern recognition method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008034234A JP4820830B2 (en) 2008-02-15 2008-02-15 Pattern recognition apparatus, pattern recognition program, and pattern recognition method

Publications (2)

Publication Number Publication Date
JP2009193417A JP2009193417A (en) 2009-08-27
JP4820830B2 true JP4820830B2 (en) 2011-11-24

Family

ID=41075362

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008034234A Active JP4820830B2 (en) 2008-02-15 2008-02-15 Pattern recognition apparatus, pattern recognition program, and pattern recognition method

Country Status (1)

Country Link
JP (1) JP4820830B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6790995B2 (en) 2017-04-27 2020-11-25 富士通株式会社 Collation device, collation method and collation program
JP2021182665A (en) * 2020-05-18 2021-11-25 東日本電信電話株式会社 Information processing device

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08123906A (en) * 1994-10-26 1996-05-17 Ricoh Co Ltd Character recognition method
JP2815045B2 (en) * 1996-12-16 1998-10-27 日本電気株式会社 Image feature extraction device, image feature analysis device, and image matching system
JP4039708B2 (en) * 1997-02-14 2008-01-30 ヒューレット・パッカード・カンパニー Pattern recognition method and pattern recognition apparatus
JP4215385B2 (en) * 2000-11-06 2009-01-28 グローリー株式会社 PATTERN RECOGNIZING DEVICE, PATTERN RECOGNIZING METHOD, AND COMPUTER-READABLE RECORDING MEDIUM CONTAINING PROGRAM FOR CAUSING COMPUTER TO EXECUTE THE METHOD
JP2005242777A (en) * 2004-02-27 2005-09-08 Toshiba Corp Face collation device and passage control device

Also Published As

Publication number Publication date
JP2009193417A (en) 2009-08-27

Similar Documents

Publication Publication Date Title
US11216729B2 (en) Recognition system and recognition method
CN110287312B (en) Text similarity calculation method, device, computer equipment and computer storage medium
JP4504702B2 (en) Document processing apparatus, document processing method, and document processing program
US11301509B2 (en) Image search system, image search method, and program
US9704100B2 (en) Authentication method, authentication device, and recording medium
JP6760318B2 (en) Face image identification system, classifier generator, identification device, image identification system, and identification system
JP5207870B2 (en) Dimension reduction method, pattern recognition dictionary generation device, and pattern recognition device
JP2013206187A (en) Information conversion device, information search device, information conversion method, information search method, information conversion program and information search program
KR101977231B1 (en) Community detection method and community detection framework apparatus
JP2015176175A (en) Information processing apparatus, information processing method and program
JPWO2014118978A1 (en) Learning method, information processing apparatus, and learning program
US9576222B2 (en) Image retrieval apparatus, image retrieval method, and recording medium
JP4820830B2 (en) Pattern recognition apparatus, pattern recognition program, and pattern recognition method
CN107533671B (en) Pattern recognition device, pattern recognition method, and recording medium
US9792561B2 (en) Learning method, information conversion device, and recording medium
KR101064617B1 (en) Method and apparatus for classifying multivariate stream data
JP2008020963A (en) Pattern recognition device and method
JP4885112B2 (en) Document processing apparatus, document processing method, and document processing program
JP2009134466A (en) Recognition processing device, method, and computer program
JP5683287B2 (en) Pattern recognition apparatus and pattern recognition method
JP6453618B2 (en) Calculation apparatus, method and program
Qu et al. Similar handwritten Chinese character recognition based on adaptive discriminative locality alignment
JP5030235B2 (en) Pattern recognition apparatus and pattern recognition method
JP7435740B2 (en) Voice recognition device, control method, and program
Srivastava et al. Feasibility of Principal Component Analysis in hand gesture recognition system

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110118

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110322

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20110322

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110809

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110905

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140909

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4820830

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350