JPH08171398A - Data recognizing device, dictionary forming device and learning device - Google Patents

Data recognizing device, dictionary forming device and learning device

Info

Publication number
JPH08171398A
JPH08171398A JP6313766A JP31376694A JPH08171398A JP H08171398 A JPH08171398 A JP H08171398A JP 6313766 A JP6313766 A JP 6313766A JP 31376694 A JP31376694 A JP 31376694A JP H08171398 A JPH08171398 A JP H08171398A
Authority
JP
Japan
Prior art keywords
data
pattern
recognition
dictionary
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6313766A
Other languages
Japanese (ja)
Inventor
Yuuko Kubooka
祐子 久保岡
Tadakatsu Masaki
忠勝 正木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP6313766A priority Critical patent/JPH08171398A/en
Publication of JPH08171398A publication Critical patent/JPH08171398A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PURPOSE: To provide a recognizing device capable of more improving a recognition rate compared with the conventional recognizing device. CONSTITUTION: This device is constituted of an input processing part 2, a reference pattern dictionary 5, a reference pattern comparison processing part 3 comparing the input data with a reference pattern, a data conversion processing part 12, a comparison pattern dictionary 14, a data comparison processing part 13 and an output processing part 16. The data conversion processing part 12 converts the data outputted by the reference pattern comparison processing part 3 as a function to the data for comparison processing with the comparison pattern dictionary 14. The pattern of the data outputted from the reference pattern comparison processing part 3 are stored in the comparison pattern dictionary 14. The data comparison processing part 13 inputs the data converted by the data conversion processing part 12, and compares the pattern existing in the dictionary 14 with the pattern of the input data, and thus, it extracts the pattern with a similarity in the comparison pattern dictionary to output a recognition word.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、認識されるべき入力デ
ータについての認識等を行なうことが出来るデータ認識
装置、辞書作成装置及び学習装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a data recognizing device, a dictionary creating device and a learning device capable of recognizing input data to be recognized.

【0002】[0002]

【従来の技術】従来の認識装置は、図7に示すように、
入力処理部(2)、標準パターン比較処理部(3)、標準
パターン辞書(5)、出力処理部(4)で構成される。入
力処理部(2)は、データを入力し、内部データ形式に
変換する。そして、標準パターン比較処理部(3)が、
入力データと標準パターン辞書(5)と比較し、標準パタ
ーンとの類似度からどのパターンが入力されたのか推定
する。このとき認識結果とともに類似度も出力する。
2. Description of the Related Art A conventional recognition apparatus, as shown in FIG.
It is composed of an input processing unit (2), a standard pattern comparison processing unit (3), a standard pattern dictionary (5), and an output processing unit (4). An input processing unit (2) inputs data and converts it into an internal data format. Then, the standard pattern comparison processing unit (3)
The input data is compared with the standard pattern dictionary (5), and which pattern is input is estimated from the similarity to the standard pattern. At this time, the similarity is output together with the recognition result.

【0003】以下、音声認識の場合を例に挙げて従来の
認識装置の動作について説明する。
The operation of the conventional recognition apparatus will be described below by taking the case of voice recognition as an example.

【0004】音声の標準パターン比較処理部は、図8に
示すように「タ」と発声したとき、1位から「ファ」「タ」
「ハ」「ワ」「カ」「ナ」と候補順に出力する。これは
「タ」と発声したが、「ファ」と誤認識した場合である。
The standard pattern comparison processing unit for voices, when uttering "ta" as shown in FIG.
“Ha”, “wa”, “ka”, and “na” are output in the order of candidates. This is the case when the user uttered "ta" but mistakenly recognized it as "fa".

【0005】次に「ファ」と発声した場合の出力結果を図
9に示す。
Next, FIG. 9 shows an output result in the case of uttering "Fa".

【0006】「ファ」の発声に対して、標準パターン比較
処理部は、1位から「ファ」「ワ」「ハ」「カ」「タ」「ナ」
という結果を出力し、正しい認識結果を出力している。
[0006] In response to the utterance of "Fa", the standard pattern comparison processing unit starts from the first place and selects "Fa"
Is output and the correct recognition result is output.

【0007】又、従来の学習方法は、上記認識方法の標
準パターン辞書を作成、編集することによって実現して
いた。
Further, the conventional learning method has been realized by creating and editing the standard pattern dictionary of the above recognition method.

【0008】[0008]

【発明が解決しようとする課題】しかしながら、このよ
うな従来の技術では、入力したデータのパターンと標準
パターンの類似性を調べる処理の方法によって認識率が
定まっていた。そのため、このような方法では認識率の
向上に限界があるといった課題があった。
However, in such a conventional technique, the recognition rate is determined by the processing method for checking the similarity between the pattern of the input data and the standard pattern. Therefore, such a method has a problem that there is a limit in improving the recognition rate.

【0009】本発明は上記従来の課題に鑑み、従来の認
識装置に比べて認識率をより一層向上させることができ
る認識装置を提供することを目的とする。
In view of the above conventional problems, it is an object of the present invention to provide a recognition device capable of further improving the recognition rate as compared with the conventional recognition device.

【0010】[0010]

【課題を解決するための手段】請求項1の本発明は、認
識されるべき対象の特徴データを基にしてパターン認識
法(A)によって得られる複数の認識候補及びそれらに
対応する認識の正しさの程度を表す情報を、新たな特徴
データとして入力する入力手段と、前記入力される新た
な特徴データに基づき、パターン認識法(B)によっ
て、前記認識されるべき対象についての認識結果を得る
パターン認識処理手段と、前記認識結果を出力する出力
手段とを備えているデータ認識装置である。
According to the present invention of claim 1, a plurality of recognition candidates obtained by a pattern recognition method (A) on the basis of feature data of an object to be recognized and recognition accuracy corresponding thereto. Based on the input means for inputting the information indicating the degree of intensity as new feature data and the new feature data input, the pattern recognition method (B) obtains the recognition result of the object to be recognized. A data recognition device comprising pattern recognition processing means and output means for outputting the recognition result.

【0011】請求項2の本発明は、上記パターン認識処
理手段は、ニューラルネットワークにより構成されてい
るデータ認識装置である。
According to a second aspect of the present invention, the pattern recognition processing means is a data recognition device constituted by a neural network.

【0012】請求項3の本発明は、上記パターン認識法
(B)で用いられる特徴データと、それに対応する認識
結果とが格納されている特徴データ格納辞書を備えてい
るデータ認識装置である。
A third aspect of the present invention is a data recognition device comprising a feature data storage dictionary in which feature data used in the pattern recognition method (B) and a recognition result corresponding thereto are stored.

【0013】請求項4の本発明は、上記パターン認識処
理手段により新たに選定された認識候補が誤りであると
判定された場合、その誤りであると判定された前記認識
されるべき対象についても正しく認識出来るように前記
パターン認識法(B)を調整する調整手段を備えている
データ認識装置である。
According to the present invention of claim 4, when the pattern recognition processing means determines that the newly selected recognition candidate is erroneous, the object to be recognized which is determined to be erroneous is also The data recognition device is provided with an adjusting means for adjusting the pattern recognition method (B) so that the pattern can be correctly recognized.

【0014】請求項5の本発明は、前記パターン認識処
理手段が、ニューラルネットワークにより構成されてい
る場合、前記正しく認識出来るように前記パターン認識
法(B)を調整するとは、前記調整手段により、前記ニ
ューラルネットワークに対して、所定の教師信号が与え
られ、前記正しく認識出来るようにそのニューラルネッ
トワークの構成を調整することであるデータ認識装置で
ある。
According to the present invention of claim 5, when the pattern recognition processing means comprises a neural network, the pattern recognition method (B) is adjusted so that the pattern can be correctly recognized. A data recognition device, which is to apply a predetermined teacher signal to the neural network and adjust the configuration of the neural network so that the neural network can be correctly recognized.

【0015】請求項6の本発明は、前記特徴データ格納
辞書を備えている場合、前記正しく認識出来るように前
記パターン認識法(B)を調整するとは、前記特徴デー
タ格納辞書に対して、前記誤りであると判定された前記
対象の特徴データとそれに対応する正解データとを新た
に追加することであるデータ認識装置である。
According to a sixth aspect of the present invention, when the feature data storage dictionary is provided, adjusting the pattern recognition method (B) so that the recognition can be performed correctly means that for the feature data storage dictionary, The data recognition device is to newly add the feature data of the object determined to be erroneous and the correct answer data corresponding thereto.

【0016】請求項7の本発明は、上記認識されるべき
対象は、音声情報、文字情報、画像情報又はパターン情
報であるデータ認識装置である。
The present invention of claim 7 is a data recognition device, wherein the object to be recognized is voice information, character information, image information or pattern information.

【0017】請求項8の本発明は、請求項3記載のデー
タ認識装置における前記特徴データ格納辞書を作成する
ための辞書作成装置であって、学習用サンプルについて
の特徴データを基にしてパターン認識法(A)によって
得られる複数の認識候補及びそれらに対応する認識の正
しさの程度を表す情報と、それに対応する正解データと
を、作成対象としての特徴データ格納辞書に登録し、特
徴データ格納辞書の作成を行う特徴データ格納辞書作成
手段を備えている辞書作成装置である。
The present invention of claim 8 is a dictionary creating device for creating the feature data storage dictionary in the data recognizing device according to claim 3, wherein pattern recognition is performed based on the feature data of the learning sample. A plurality of recognition candidates obtained by the method (A) and information indicating the degree of recognition correctness corresponding to them and correct answer data corresponding thereto are registered in a feature data storage dictionary as a creation target, and feature data storage is performed. It is a dictionary creation device provided with a feature data storage dictionary creation means for creating a dictionary.

【0018】請求項9の本発明は、上記学習用サンプル
は、音声情報、文字情報、画像情報又はパターン情報で
ある辞書作成装置である。
According to a ninth aspect of the present invention, there is provided a dictionary creating apparatus in which the learning sample is voice information, character information, image information or pattern information.

【0019】請求項10の本発明は、請求項2記載のデ
ータ認識装置における前記ニューラルネットワークを作
成するための学習装置であって、学習用サンプルについ
ての特徴データを基にしてパターン認識法(A)によっ
て得られる複数の認識候補及びそれらに対応する認識の
正しさの程度を表す情報と、それに対応する教師信号で
ある正解データとを、学習を必要とするニューラルネッ
トワークに対して与え、そのニューラルネットワークか
らの出力結果が前記正解データと一致するように、少な
くともそのニューラルネットワークの所定の係数を調整
するニューラルネットワーク調整手段を備えている学習
装置である。
According to a tenth aspect of the present invention, there is provided a learning device for creating the neural network in the data recognition device according to the second aspect, wherein the pattern recognition method (A ), A plurality of recognition candidates and information indicating the degree of correctness of recognition corresponding to them, and correct data corresponding to them, which is a teacher signal, are given to a neural network that requires learning. The learning device includes a neural network adjusting means for adjusting at least a predetermined coefficient of the neural network so that the output result from the network matches the correct answer data.

【0020】請求項11の本発明は、上記学習用サンプ
ルは、音声情報、文字情報、画像情報又はパターン情報
である学習装置である。
The eleventh aspect of the present invention is the learning device, wherein the learning sample is voice information, character information, image information or pattern information.

【0021】[0021]

【作用】請求項1の本発明では、入力手段が、認識され
るべき対象の特徴データを基にしてパターン認識法
(A)によって得られる複数の認識候補及びそれらに対
応する認識の正しさの程度を表す情報を、新たな特徴デ
ータとして入力し、パターン認識処理手段が、前記入力
される新たな特徴データに基づき、パターン認識法
(B)によって、前記認識されるべき対象についての認
識結果を得、出力手段が、前記認識結果を出力する。
According to the present invention of claim 1, the input means determines a plurality of recognition candidates obtained by the pattern recognition method (A) based on the feature data of the object to be recognized and the recognition correctness corresponding to them. Information indicating the degree is input as new feature data, and the pattern recognition processing means obtains the recognition result of the object to be recognized by the pattern recognition method (B) based on the input new feature data. Obtaining and outputting means outputs the recognition result.

【0022】請求項8の本発明では、請求項3記載のデ
ータ認識装置における前記特徴データ格納辞書を作成す
るための辞書作成装置であって、特徴データ格納辞書作
成手段が、学習用サンプルについての特徴データを基に
してパターン認識法(A)によって得られる複数の認識
候補及びそれらに対応する認識の正しさの程度を表す情
報と、それに対応する正解とを、作成対象としての特徴
データ格納辞書に登録し、特徴データ格納辞書の作成を
行う。
According to an eighth aspect of the present invention, there is provided a dictionary creating device for creating the characteristic data storage dictionary in the data recognizing device according to the third aspect, wherein the characteristic data storage dictionary creating means is for learning samples. A feature data storage dictionary as a creation target of a plurality of recognition candidates obtained by the pattern recognition method (A) based on the feature data and information indicating the degree of correctness of recognition corresponding to the plurality of recognition candidates and the corresponding correct answer. To create a feature data storage dictionary.

【0023】請求項10の本発明では、請求項2記載の
データ認識装置における前記ニューラルネットワークを
作成するための学習装置であって、ニューラルネットワ
ーク調整手段が、学習用サンプルについての特徴データ
を基にしてパターン認識法(A)によって得られる複数
の認識候補及びそれらに対応する認識の正しさの程度を
表す情報と、それに対応する教師信号である正解データ
とを、学習を必要とするニューラルネットワークに対し
て与え、そのニューラルネットワークからの出力結果が
前記正解データと一致するように、少なくともそのニュ
ーラルネットワークの所定の係数を調整する。
According to a tenth aspect of the present invention, there is provided a learning device for creating the neural network in the data recognition device according to the second aspect, wherein the neural network adjusting means is based on the characteristic data of the learning sample. A plurality of recognition candidates obtained by the pattern recognition method (A) and the information indicating the degree of correctness of recognition corresponding to them, and the correct answer data which is a teacher signal corresponding to the recognition candidates are converted into a neural network that requires learning. At least a predetermined coefficient of the neural network is adjusted so that the output result from the neural network matches the correct answer data.

【0024】更に具体的な場合について説明する。A more specific case will be described.

【0025】(1)『データ認識装置』 例えば、上記データ認識装置における認識方法の処理の
流れを音声認識を例に挙げ、図1を用いて次に示す。
(1) "Data Recognition Device" For example, the flow of processing of the recognition method in the data recognition device will be described below with reference to FIG.

【0026】(イ)入力処理部(2)は音声を内部で処
理できる形式のデータに変換する。
(B) The input processing section (2) converts the voice into data of a format that can be internally processed.

【0027】(ロ)標準パターン比較処理部(3)は、パ
ターン認識法(A)によって、入力データと標準パター
ン辞書(5)を比較し、入力データに近い標準パターン
(認識候補に対応)を抽出し、該当単語と類似度を示す
点数(認識の正しさの程度を表す情報)を出力する。
(B) The standard pattern comparison processing unit (3) compares the input data with the standard pattern dictionary (5) by the pattern recognition method (A) and finds a standard pattern (corresponding to a recognition candidate) close to the input data. It is extracted and a score indicating the degree of similarity with the corresponding word (information indicating the degree of correctness of recognition) is output.

【0028】(ハ)データ変換処理部(12)(入力手段)
が、標準パターン比較処理部(3)で出力されたデータ
を入力する。
(C) Data conversion processing unit (12) (input means)
Inputs the data output by the standard pattern comparison processing unit (3).

【0029】(ニ)データ変換処理部(12)が、入力した
データをデータ比較処理のデータ形式に変換する。
(D) The data conversion processing unit (12) converts the input data into a data format for data comparison processing.

【0030】(ホ)データ比較処理部(13)(パターン認
識処理手段)が、変換した入力データと比較パターン辞
書(14)(特徴データ格納辞書)にあるパターンとをパタ
ーン認識法(B)によって比較し、類似性がある辞書パ
ターン(認識結果)を抽出する。
(E) The data comparison processing unit (13) (pattern recognition processing means) uses the pattern recognition method (B) to convert the converted input data and the pattern in the comparison pattern dictionary (14) (feature data storage dictionary). The dictionary patterns (recognition results) having similarities are compared and extracted.

【0031】(ヘ)出力処理部(15)(出力手段)が、上
記抽出された辞書パターンの単語と類似度を出力する。
(F) The output processing section (15) (output means) outputs the word of the extracted dictionary pattern and the degree of similarity.

【0032】(2)『辞書作成装置』 上記辞書作成装置における辞書作成方法の処理の流れを
音声認識を例に挙げて図2を用いて次に示す。
(2) "Dictionary Creation Device" The flow of processing of the dictionary creation method in the dictionary creation device will be described below with reference to FIG. 2 by taking voice recognition as an example.

【0033】(イ)入力処理部(2)は音声を内部で処
理できる形式のデータに変換する。
(B) The input processing section (2) converts the voice into data of a format that can be internally processed.

【0034】(ロ)標準パターン比較処理部(3)は、
パターン認識法(A)によって、入力データと標準パタ
ーン辞書(5)を比較し、入力データに近い標準パター
ンを抽出し、該当単語と類似度を示す点数を出力する。
(B) The standard pattern comparison processing unit (3)
By the pattern recognition method (A), the input data is compared with the standard pattern dictionary (5), a standard pattern close to the input data is extracted, and a score indicating the corresponding word and the similarity is output.

【0035】(ハ)データ変換処理部(12)が、標準パタ
ーン比較処理部で出力されたデータを入力する。
(C) The data conversion processing unit (12) inputs the data output by the standard pattern comparison processing unit.

【0036】(ニ)データ変換処理部(12)が、入力した
データをデータ比較処理のデータ形式に変換する。
(D) The data conversion processing unit (12) converts the input data into a data format for data comparison processing.

【0037】(ホ)パターン抽出処理部(17)(特徴デー
タ格納辞書作成手段)が、変換した入力データの特徴を
抽出し、正解データ(19)とともに比較パターン辞書(14)
(特徴データ格納辞書)に登録する。これを繰り返し行
なうことにより比較パターン辞書(14)が作成される。
(E) The pattern extraction processing unit (17) (feature data storage dictionary creating means) extracts the features of the converted input data, and the comparison pattern dictionary (14) together with the correct answer data (19).
Register in (feature data storage dictionary). By repeating this, the comparison pattern dictionary (14) is created.

【0038】(3)他の『データ認識装置』 パターン認識処理手段により新たに選定された認識候補
が誤りであると判定された場合、その誤りであると判定
された前記認識されるべき対象についても正しく認識出
来るように前記パターン認識法(B)を調整する調整手
段を備えているデータ認識装置の処理の流れを、音声認
識の場合を例に挙げて図3を用いて次に示す。
(3) Another "data recognizing device" When the pattern recognition processing means determines that the newly selected recognition candidate is erroneous, the object to be recognized which is determined to be erroneous Also, the flow of processing of the data recognition apparatus provided with the adjusting means for adjusting the pattern recognition method (B) so that the pattern can be correctly recognized will be described below with reference to FIG.

【0039】(イ)入力処理部(2)は音声を内部で処
理できる形式のデータに変換する。
(A) The input processing unit (2) converts the voice into data in a format that can be internally processed.

【0040】(ロ)標準パターン比較処理部(3)は、パ
ターン認識法(A)によって、入力データと標準パター
ン辞書(5)を比較し、入力データに近い標準パターン
を抽出し、該当単語と類似度を示す点数を出力する。
(B) The standard pattern comparison processing unit (3) compares the input data with the standard pattern dictionary (5) by the pattern recognition method (A), extracts the standard pattern close to the input data, and extracts the corresponding word. The score indicating the similarity is output.

【0041】(ハ)データ変換処理部(12)が、標準パタ
ーン比較処理部(3)で出力されたデータを入力する。
(C) The data conversion processing unit (12) inputs the data output by the standard pattern comparison processing unit (3).

【0042】(ニ)データ変換処理部(12)が、入力した
データをデータ比較処理のデータ形式に変換する。
(D) The data conversion processing unit (12) converts the input data into a data format for data comparison processing.

【0043】(ホ)データ比較処理部(13)が、変換した
入力データと比較パターン辞書(14)にあるパターンとを
パターン認識法(B)によって比較し、類似性がある辞
書パターンを抽出する。
(E) The data comparison processing unit (13) compares the converted input data with the pattern in the comparison pattern dictionary (14) by the pattern recognition method (B), and extracts dictionary patterns having similarity. .

【0044】(ヘ)出力処理部(15)が、上記抽出された
辞書パターンの単語と類似度を出力する。
(F) The output processing section (15) outputs the word of the extracted dictionary pattern and the degree of similarity.

【0045】(ト)(ヘ)によって出力されたデータ
が、誤りであった場合、正解データをパターン抽出処理
部(17)へ入力する。
When the data output by (G) and (G) are incorrect, the correct answer data is input to the pattern extraction processing section (17).

【0046】(チ)パターン抽出処理部(107)(調整
手段)は、データ比較処理部(13)から、入力データを
入力する。
(H) The pattern extraction processing section (107) (adjusting means) inputs the input data from the data comparison processing section (13).

【0047】(リ)パターン抽出処理部(107)が、入力
データの特徴を抽出し、正解データ(19)ともに比較パタ
ーン辞書(14)(特徴データ格納辞書)に新たに追加登録
する。 尚、本明細書において、パターン認識法(A)
とパターン認識法(B)は、同一のパターン認識法であ
ると、あるいは、異なるパターン認識法であるとを問わ
ない。
(I) The pattern extraction processing unit (107) extracts the characteristics of the input data, and additionally registers the correct answer data (19) in the comparison pattern dictionary (14) (feature data storage dictionary). In the present specification, the pattern recognition method (A)
The pattern recognition method and the pattern recognition method (B) may be the same pattern recognition method or different pattern recognition methods.

【0048】[0048]

【実施例】以下、本発明にかかる実施例について図面を
参照しながら説明する。
Embodiments of the present invention will be described below with reference to the drawings.

【0049】ここで、本発明の一実施例であるデータ認
識装置の説明に先立ち、同装置について、従来のデータ
認識装置との主な相違点について述べる。
Here, prior to the description of the data recognizing device which is one embodiment of the present invention, the main difference between the device and the conventional data recognizing device will be described.

【0050】本実施例では、従来のデータ認識装置によ
り出力される、音声データの特徴データを基にしてパタ
ーン認識法(A)によって得られる候補単語及びそれら
の候補順位を、新たな特徴データとして利用することに
ある。ここで、音声データは本発明の認識されるべき対
象に対応し、候補単語は本発明の複数の認識候補に対応
し、それらの候補順位は本発明の認識の正しさの程度を
表す情報に対応する。
In this embodiment, the candidate words and their candidate ranks obtained by the pattern recognition method (A) based on the feature data of the voice data output by the conventional data recognition device are used as new feature data. There is to use. Here, the voice data corresponds to the object to be recognized of the present invention, the candidate words correspond to the plurality of recognition candidates of the present invention, and the candidate ranks thereof are information indicating the degree of correctness of the recognition of the present invention. Correspond.

【0051】すなわち、図8、図9を用いて上述したよ
うに、従来のデータ認識装置では、結果としては、
「タ」も「ファ」も音声の標準パターン比較処理部では、
「ファ」と認識している。
That is, as described above with reference to FIGS. 8 and 9, in the conventional data recognition device, as a result,
Both "ta" and "fa" are in the standard pattern comparison processing unit of voice,
We recognize as "fa".

【0052】しかし、このときの2位以下の出力パター
ンに注目すると、「タ」と発声した場合の「タ」の認識は
2位であるが、「ファ」と発声した場合の「タ」の認識は
5位となっており、その出力パターンには大きな違いが
あることが分かる。つまり、発声の単語によって、1位
の認識単語は同じでも2位以降の出力単語のパターンに
大きな違いがある傾向が見られる。
However, paying attention to the output pattern of the second or lower rank at this time, although the recognition of "Ta" when uttering "Ta" is the second rank, the recognition of "Ta" when "Fa" is pronounced Recognition is in 5th place, and it can be seen that there are large differences in the output patterns. That is, depending on the uttered words, there is a tendency that there is a large difference in the patterns of the output words after the second place, even if the first recognized words are the same.

【0053】したがって、この出力パターンの違いに着
目することにより、正解単語を推定することが可能であ
り、結果として、認識率の向上が期待できるのである。
Therefore, by paying attention to the difference in the output patterns, it is possible to estimate the correct word, and as a result, the recognition rate can be expected to improve.

【0054】この出力パターンから正解単語を推定する
処理を、従来のデータ認識装置の音声標準パターン比較
処理部(7)からの出力結果に追加することによって、音
声認識率の向上を図ることが可能となる。これが、本実
施例の最も重要な点の一つである。
It is possible to improve the voice recognition rate by adding the process of estimating the correct word from this output pattern to the output result from the voice standard pattern comparison processing unit (7) of the conventional data recognition device. Becomes This is one of the most important points of this embodiment.

【0055】ここで、正解単語を推定する機能を有する
データ認識装置を、図1に示す。
FIG. 1 shows a data recognition device having a function of estimating a correct answer word.

【0056】すなわち、同図に示すように、データ認識
装置は、入力処理部(2)と、標準パターン辞書(5)
と、前述した音声標準パターン比較処理部のような入力
データと標準パターンを比較する標準パターン比較処理
部(3)と、データ変換処理部(12)、比較パターン辞書
(14)、データ比較処理部(13)、出力処理部(16)で構
成されている。
That is, as shown in the figure, the data recognition device includes an input processing section (2) and a standard pattern dictionary (5).
And a standard pattern comparison processing unit (3) for comparing input data with a standard pattern, such as the voice standard pattern comparison processing unit described above, a data conversion processing unit (12), a comparison pattern dictionary (14), and a data comparison processing unit. (13) and the output processing section (16).

【0057】データ変換処理部(12)は、機能として標準
パターン比較処理部で出力されたデータを比較パターン
辞書との比較処理用のデータに変換する。比較パターン
辞書(14)には、標準パターン比較処理部から出力される
データのパターンが格納されている。データ比較処理部
(13)は、データ変換処理部(12)で変換したデータを
入力し、比較パターン辞書にあるパターンと、入力デー
タのパターンを比較する。比較した結果、類似性が見ら
れる比較パターン辞書内のパターンを抽出し、認識単語
を出力する。
The data conversion processing unit (12) has a function of converting the data output from the standard pattern comparison processing unit into data for comparison processing with the comparison pattern dictionary. The comparison pattern dictionary (14) stores patterns of data output from the standard pattern comparison processing unit. The data comparison processing unit (13) inputs the data converted by the data conversion processing unit (12) and compares the pattern in the comparison pattern dictionary with the pattern of the input data. As a result of the comparison, the patterns in the comparison pattern dictionary that have similarities are extracted, and the recognition word is output.

【0058】したがって、標準パターン比較処理部(3)
が誤認識した場合も、誤認識したデータのパターンが特
徴として比較パターン辞書(14)に格納されているため、
正しい認識単語を出力することが出来る。
Therefore, the standard pattern comparison processing unit (3)
Even if it is erroneously recognized, since the pattern of the erroneously recognized data is stored in the comparison pattern dictionary (14) as a feature,
The correct recognition word can be output.

【0059】尚、データ認識装置のデータ比較処理部(1
3)に使用する技法としては、パターン認識をおこなうニ
ューラルネットワーク技法等が考えられ、ニューラルネ
ットワークによって、データ比較処理部(13)が構成され
ていてもよい。但し、この場合には、上述した比較パタ
ーン辞書(14)は、必要でない。
The data comparison processing unit (1
As a technique used in 3), a neural network technique for performing pattern recognition or the like is considered, and the data comparison processing unit (13) may be configured by a neural network. However, in this case, the above-mentioned comparison pattern dictionary (14) is not necessary.

【0060】一方、本実施例の他の実施例の辞書作成装
置の特徴について述べる。
On the other hand, the features of the dictionary creating apparatus of another embodiment of this embodiment will be described.

【0061】すなわち、本実施例の辞書作成装置は、上
述したデータ認識装置に付属する比較パターン辞書(14)
を作成し、新たに前記辞書に学習用データパターンを登
録する機能を持つことを特徴とする。ここで、学習用デ
ータは、本発明の学習用サンプルに対応する。
That is, the dictionary creating apparatus of the present embodiment is a comparison pattern dictionary (14) attached to the above-mentioned data recognition apparatus.
Is created, and the learning data pattern is newly registered in the dictionary. Here, the learning data corresponds to the learning sample of the present invention.

【0062】本実施例の辞書作成装置は、図2に示すよ
うに、入力処理部(2)と、標準パターン辞書(5)と、
標準パターン比較処理部(3)と、データ変換処理部(1
2)と、パターン抽出処理部(17)で構成されている。
The dictionary creating apparatus of this embodiment, as shown in FIG. 2, includes an input processing section (2), a standard pattern dictionary (5),
Standard pattern comparison processing unit (3) and data conversion processing unit (1
2) and a pattern extraction processing unit (17).

【0063】パターン抽出処理部は(17)、入力された
学習用データを基にして、パターン認識法(A)によっ
て標準パターン比較処理部(3)から出力された複数の
認識データから、候補データ及びそれらの順位等による
データパターンの特徴を抽出し、抽出したデータパター
ンの特徴を、入力した正解データに対応するパターンと
して比較パターン辞書(14)に登録する。これを繰り返し
行なうことにより比較パターン辞書(14)が作成される。
The pattern extraction processing section (17) selects candidate data from a plurality of recognition data output from the standard pattern comparison processing section (3) by the pattern recognition method (A) based on the input learning data. Further, the features of the data pattern are extracted according to their ranks and the like, and the features of the extracted data pattern are registered in the comparison pattern dictionary (14) as patterns corresponding to the input correct answer data. By repeating this, the comparison pattern dictionary (14) is created.

【0064】ところで、上記実施例にて説明した、ニュ
ーラルネットワークによってデータ比較処理部(13)が構
成されている場合、そのニューラルネットワークを作成
することを特徴とする、本発明にかかる一実施例として
の学習装置について、説明する。
By the way, as an embodiment according to the present invention, when the data comparison processing unit (13) is constituted by the neural network described in the above embodiment, the neural network is created. The learning device will be described.

【0065】すなわち、この学習装置は、学習用サンプ
ルについての特徴データを基にしてパターン認識法
(A)によって得られる複数の認識候補及びそれらに対
応する認識の正しさの程度を表す情報と、それに対応す
る教師信号である正解データとを、学習を必要とするニ
ューラルネットワークに対して与え、そのニューラルネ
ットワークからの出力結果が上記正解データと一致する
ように、そのニューラルネットワークの各要素の定数を
調整するニューラルネットワーク調整手段(203)(図5
参照)を備えている。学習の方法は、従来の方法と本質
的に変わらない。
That is, the learning device includes a plurality of recognition candidates obtained by the pattern recognition method (A) based on the feature data of the learning sample and information indicating the degree of recognition accuracy corresponding to the plurality of recognition candidates. Correct answer data that is a corresponding teacher signal is given to a neural network that requires learning, and constants of each element of the neural network are set so that the output result from the neural network matches the correct answer data. Neural network adjusting means (203) for adjusting (FIG. 5)
See). The learning method is essentially the same as the conventional method.

【0066】又、本発明の他の実施例としてのデータ認
識装置は、上記実施例で述べたデータ認識装置に、調整
手段を備えており、学習機能を有することを特徴とす
る。
Further, a data recognition apparatus as another embodiment of the present invention is characterized in that the data recognition apparatus described in the above embodiment is provided with an adjusting means and has a learning function.

【0067】すなわち、本実施例のデータ認識装置は、
図3に示すように、入力処理部(2)、標準パターン比
較処理部(3)、標準パターン辞書(5)、データ変換処
理部(12)、データ比較処理部(13)、パターン抽出処
理部(107)、比較パターン辞書(14)、出力処理部(1
6)で構成する。ここで、パターン抽出処理部(107)
は、本発明の調整手段に対応する。
That is, the data recognition device of this embodiment is
As shown in FIG. 3, an input processing unit (2), a standard pattern comparison processing unit (3), a standard pattern dictionary (5), a data conversion processing unit (12), a data comparison processing unit (13), a pattern extraction processing unit. (107), comparison pattern dictionary (14), output processing unit (1
It consists of 6). Here, the pattern extraction processing unit (107)
Corresponds to the adjusting means of the present invention.

【0068】本実施例の学習機能は、データ比較処理部
(13)でおこなった結果が誤認識であったとき、正解デ
ータを入力し、学習方法によって学習を行うものであ
る。
The learning function of this embodiment is to input correct answer data and perform learning by a learning method when the result of the data comparison processing section (13) is erroneous recognition.

【0069】次に、上記実施例について、更に具体的に
述べる。
Next, the above embodiment will be described more specifically.

【0070】上記実施例のデータ認識装置について、音
声認識の認識方法で、データ比較処理部(13)にニュー
ラルネットワークを用いた場合の一実施例を説明する。
With respect to the data recognition apparatus of the above embodiment, an embodiment in which a neural network is used for the data comparison processing unit (13) in the recognition method of voice recognition will be described.

【0071】データ認識装置は、図4に示すように。入
力処理部(2)、音声標準パターン比較処理部(7)、標
準パターン辞書(5)、データ変換処理(12)、ニュー
ラルネットワーク(23)で構成される。
The data recognition device is as shown in FIG. It is composed of an input processing unit (2), a voice standard pattern comparison processing unit (7), a standard pattern dictionary (5), a data conversion process (12), and a neural network (23).

【0072】以下に、本実施例の処理手順を示す。The processing procedure of this embodiment is shown below.

【0073】(イ)入力処理部(2) 入力処理部は、「ア」の発声音を入力し、内部処理のデ
ータ形式に変換する。
(A) Input processing section (2) The input processing section inputs the vocal sound "a" and converts it into a data format for internal processing.

【0074】(ロ)標準パターン比較処理部(7) 標準パターン比較処理部では、(イ)によって変換した
入力データを、パターン認識法(A)によって、標準パ
ターン辞書と比較する。比較した結果として1位から順
に「ファ:908」「ハ:877」「カ:800」「ア:799」「タ:792」
「ワ:583」のように、認識単語と類似度を示す点数が出
力される。この例は、音声標準パターン比較処理部が誤
認識した場合で、「ア」と発声したのに対して、「ファ」
と誤認識している場合を示している。
(B) Standard pattern comparison processing section (7) The standard pattern comparison processing section compares the input data converted in (a) with the standard pattern dictionary by the pattern recognition method (A). As a result of comparison, from the first place in order, "Fa: 908""C:877""C:800""A:799""T:792"
A score indicating the degree of similarity with the recognized word is output, such as “wa: 583”. In this example, when the voice standard pattern comparison processing unit erroneously recognizes, “A” is uttered,
It shows the case of erroneously recognizing.

【0075】(ハ)データ変換処理部(12) データ変換処理部(12)は、(ロ)で出力されたデータ
を、ニューラルネットワークに認識処理をさせるため
に、同図に示すように、ニューラルネットワークの入力
形式に合わせて変換する。この場合は、類似度を示す点
数の最大値を255にしている。図4に示す変換データ(2
2)が、ニューラルネットワークが正解データを推定す
るためのパターンとなる。このパターンが、本発明の新
たな特徴データに対応するものである。
(C) Data conversion processing section (12) The data conversion processing section (12) uses a neural network as shown in FIG. 9 in order to cause the neural network to recognize the data output in (b). Convert according to the input format of the network. In this case, the maximum score indicating the degree of similarity is set to 255. Converted data (2
2) is a pattern for the neural network to estimate correct data. This pattern corresponds to the new feature data of the present invention.

【0076】ここで、データ変換処理部(12)におけ
る、変換処理方法を一例として「ア」の場合について説
明する。
Here, the case of "A" will be described as an example of the conversion processing method in the data conversion processing section (12).

【0077】すなわち、データ変換処理部(12)に対す
る入力のデータパターンにおける類似度を示す点数の最
大値は「ファ」の908点である。又、データ変換処理
部(12)の出力段階でのデータパターンについての類似
度を示す点数の最大値は、上述のように255とする。
That is, the maximum value of the score indicating the similarity in the data pattern of the input to the data conversion processing unit (12) is 908 points of "Fa". In addition, the maximum value of the score indicating the similarity of the data pattern at the output stage of the data conversion processing unit (12) is set to 255 as described above.

【0078】従って、799点の「ア」は、その類似度
について、他の候補データの類似度との相対的な比率を
維持するために、「255×799÷908」の計算を行ない、
「ア」の類似度を224点に変換するものである。他の
候補データの場合についても同様の計算方法で、類似度
が変換される。
Therefore, in order to maintain the relative ratio of the similarity of “A” of 799 points to the similarity of other candidate data, “255 × 799 ÷ 908” is calculated,
The degree of similarity of "A" is converted into 224 points. Similarities are converted for other candidate data by the same calculation method.

【0079】(ニ)ニューラルネットワークの認識処理
(23) ニューラルネットワークは、(ハ)によって変換したデ
ータパターンを入力し、入力データの単語毎の点数に固
有の計数の重み付けをおこない、その後、線形加算し、
さらにその加算値に定数を加えたものに、非線形関数を
施して、認識単語を出力する。この場合、入力データパ
ターンが「ア」のデータパターンと類似しているため、
「ア」と出力している。
(D) Neural network recognition processing (23) The neural network inputs the data pattern converted in (c), weights the number of points for each word of the input data, and then performs linear addition. Then
Further, a non-linear function is applied to the addition value plus a constant, and the recognition word is output. In this case, since the input data pattern is similar to the data pattern of "A",
"A" is output.

【0080】上記で説明したように、手順(ロ)で標準
パターン比較処理部が誤認識をした場合でも、データ比
較処理により正確なデータを出力することができる。そ
のため、認識率を向上させることができる。
As described above, accurate data can be output by the data comparison processing even when the standard pattern comparison processing unit makes an erroneous recognition in the procedure (b). Therefore, the recognition rate can be improved.

【0081】次に、本発明に係る学習装置の一実施例を
説明し、データ認識装置のパターン抽出処理部に用いる
ニューラルネットワークについての学習方法の一例を示
す。
Next, an embodiment of the learning device according to the present invention will be described, and an example of the learning method for the neural network used in the pattern extraction processing section of the data recognition device will be shown.

【0082】本実施例の学習装置は、図5に示すよう
に、入力処理部(2)、音声標準パターン比較処理部
(7)、標準パターン辞書(5)、データ変換処理(1
2)、学習を必要とするニューラルネットワーク(2
3)、及びそのニューラルネットワーク(23)の各要素
の定数を調整するためのニューラルネットワーク調整手
段(203)で構成される。
As shown in FIG. 5, the learning device of this embodiment has an input processing unit (2), a voice standard pattern comparison processing unit (7), a standard pattern dictionary (5), and a data conversion process (1
2), neural networks that require learning (2
3) and a neural network adjusting means (203) for adjusting constants of each element of the neural network (23).

【0083】以下に本実施例の学習の過程を示す。The learning process of this embodiment will be described below.

【0084】(イ)入力処理部(2) 入力処理部(2)は、学習用サンプルとして「ア」の発声
音を入力し、内部処理のデータ形式に変換する。
(A) Input processing unit (2) The input processing unit (2) inputs the vocal sound "A" as a learning sample and converts it into a data format for internal processing.

【0085】(ロ)標準パターン比較処理部(7) 標準パターン比較処理部(7)では、(イ)によって変
換した入力データを、標準パターン辞書(5)と比較す
る。比較した結果として1位から順に「ファ:889」「カ:76
7」「ハ:756」「ア:729」「タ:657」「ワ:583」のように、
認識単語の候補と各類似度を示す点数が出力データ(2
6)として出力される。この例は、音声標準パターン比
較処理部(7)が誤認識した場合で、「ア」と発声したの
に対して、「ファ」と誤認識している。
(B) Standard pattern comparison processing section (7) The standard pattern comparison processing section (7) compares the input data converted in (a) with the standard pattern dictionary (5). As a result of the comparison, from the first place, "Fa: 889" and "F: 76
7 ”,“ C: 756 ”,“ A: 729 ”,“ T: 657 ”,“ Wa: 583 ”.
Recognized word candidates and the score indicating each similarity are output data (2
6) is output as. In this example, the voice standard pattern comparison processing unit (7) erroneously recognizes, and utters "a", but erroneously recognizes "fa".

【0086】(ハ)データ変換処理部(12) データ変換処理部(12)は、(ロ)で出力されたデータ
(26)を、ニューラルネットワーク(23)に学習させる
ために、ニューラルネットワーク調整手段(203)への
入力形式に合わせて変換する。この場合は、類似度を示
す点数の最大値を 255 にしている。この変換データ(2
7)が、ニューラルネットワーク(23)が学習するデー
タパターンとなる。
(C) Data conversion processing unit (12) The data conversion processing unit (12) uses a neural network adjusting means for causing the neural network (23) to learn the data (26) output in (b). Convert according to the input format to (203). In this case, the maximum score for similarity is set to 255. This converted data (2
7) is the data pattern learned by the neural network (23).

【0087】(ニ)ニューラルネットワーク調整手段
(203)による学習 ニューラルネットワーク調整手段(203)は、学習を必
要とするニューラルネットワーク(23)に対して、
(ハ)によって変換したデータパターンと、それに対応
する教師信号としての正解データ「ア」を入力する。そ
して、入力したデータパターンから正解データ「ア」が
出力されるように、ニューラルネットワーク(23)を構
成する要素の各定数を調節する。
(D) Learning by Neural Network Adjusting Means (203) The neural network adjusting means (203) applies to the neural network (23) that needs learning,
The data pattern converted by (C) and the correct answer data "A" as a teacher signal corresponding to the data pattern are input. Then, each constant of the elements forming the neural network (23) is adjusted so that the correct data “A” is output from the input data pattern.

【0088】複数の学習用サンプルを用いて上記手順を
繰り返すことにより、ニューラルネットワーク(23)を
完成させることができる。
The neural network (23) can be completed by repeating the above procedure using a plurality of learning samples.

【0089】次に、他の実施例であるデータ認識装置に
ついて、データ比較処理部、パターン抽出処理部にニュ
ーラルネットワークを用いた場合の一例を、具体的に説
明する。
Next, with respect to the data recognition apparatus of another embodiment, an example in which a neural network is used for the data comparison processing unit and the pattern extraction processing unit will be specifically described.

【0090】本実施例の装置は、パターン認識処理手段
により新たに選定された認識候補が誤りであると判定さ
れた場合、その誤りであると判定された前記認識される
べき対象についても正しく認識出来るように上記パター
ン認識法(B)を調整する調整手段を備えている点が特
徴である。
When the pattern recognition processing means determines that the newly selected recognition candidate is erroneous, the apparatus of this embodiment also correctly recognizes the object to be recognized, which is determined to be erroneous. The feature is that an adjusting means for adjusting the pattern recognition method (B) is provided so as to be able to do so.

【0091】本実施例のデータ認識装置は、図6に示す
ように、入力処理部(2)、音声標準パターン比較処理
部(7)、標準パターン辞書(5)、データ変換処理(1
2)、ニューラルネットワーク(23)、調整手段(200
3)で構成する。
As shown in FIG. 6, the data recognition apparatus of the present embodiment has an input processing section (2), a voice standard pattern comparison processing section (7), a standard pattern dictionary (5), a data conversion processing (1
2), neural network (23), adjusting means (200
It consists of 3).

【0092】以下に、本実施例の調整手段を中心とする
処理手順を示す。
The processing procedure centering on the adjusting means of this embodiment will be described below.

【0093】(イ)入力処理部(2) 入力処理部は、「ア」の発声音を入力し、内部処理のデ
ータ形式に変換する。
(B) Input processing section (2) The input processing section inputs the vocal sound "a" and converts it into a data format for internal processing.

【0094】(ロ)標準パターン比較処理部(7) 標準パターン比較処理部では、(イ)によって変換した
入力データを、標準パターン辞書と比較する。比較した
結果として1位から順に「ファ:908」「ハ:877」「カ:800」
「ア:799」「タ:792」「ワ:583」のように、認識単語と類
似度を示す点数が出力する。この例は、音声標準パター
ン比較処理部が誤認識した場合で、「ア」と発声したの
に対して、「ファ」と誤認識している。
(B) Standard pattern comparison processing unit (7) The standard pattern comparison processing unit compares the input data converted in (a) with the standard pattern dictionary. As a result of the comparison, from the first place, "Fa: 908", "C: 877", "C: 800"
A score indicating the recognition word and the similarity is output, such as “A: 799”, “T: 792”, and “Wa: 583”. In this example, the voice standard pattern comparison processing unit erroneously recognizes "a", but erroneously recognizes "fa".

【0095】(ハ)データ変換処理部(12) データ変換処理部は、(ロ)で出力されたデータを、ニ
ューラルネットワークに認識処理をさせるために、図に
示すように、ニューラルネットワークの入力形式に合わ
せて変換する。この場合は、類似度を示す点数の最大値
を 255 にしている。図4に示す変換データ(22)が、
ニューラルネットワークが正解データを推定するための
パターンとなる。
(C) Data conversion processing section (12) The data conversion processing section, as shown in the figure, causes the neural network to recognize the data output in (b) in order to cause the neural network to perform recognition processing. Convert according to. In this case, the maximum score for similarity is set to 255. The conversion data (22) shown in FIG.
The neural network becomes a pattern for estimating correct data.

【0096】(ニ)ニューラルネットワーク(23)の認
識処理 ニューラルネットワーク(23)は、(ハ)によって変換
したデータパターン(27)を入力し、入力データの単語
毎の点数に固有の計数の重み付けをおこない、その後、
線形加算し、さらにその加算値に定数を加えたものに、
非線形関数を施して、認識単語を出力する。この場合、
入力データパターンが「ファ」のデータパターンと類似し
ているため、「ファ」の点数を一番高く出力している。し
かし、このデータは誤認識である。
(D) Recognition processing of the neural network (23) The neural network (23) inputs the data pattern (27) converted by (c) and weights the count peculiar to each word of the input data. And then
Linear addition, and a constant added to the addition value,
A non-linear function is applied and the recognition word is output. in this case,
Since the input data pattern is similar to the "fa" data pattern, the "fa" score is output the highest. However, this data is a false positive.

【0097】(ホ)調整手段(2003)によるニューラル
ネットワークの学習処理(23) 調整手段(2003)は、ニューラルネットワーク(23)
が、(ニ)によって変換したデータパターンと正解デー
タ「ア」を入力して、入力したデータパターンから正解
データ「ア」を出力するように、そのニューラルネット
ワーク(23)を構成する要素の各定数を調節する。この
ようにして、調整手段(2003)は、ニューラルネットワ
ーク(23)を学習させる。
(E) Neural network learning processing by adjusting means (2003) (23) The adjusting means (2003) is a neural network (23).
, Input the data pattern converted by (d) and the correct answer data "a", and output the correct answer data "a" from the input data pattern. Adjust. In this way, the adjusting means (2003) trains the neural network (23).

【0098】上記手順で示すように、データ認識装置に
学習機能を付加することによって、認識率がより向上す
る。
As shown in the above procedure, the recognition rate is further improved by adding the learning function to the data recognition device.

【0099】[0099]

【発明の効果】以上に述べたところから明らかなよう
に、本発明は、従来に比べて認識率をより一層向上させ
ることができるという長所を有する。
As is clear from the above description, the present invention has an advantage that the recognition rate can be further improved as compared with the prior art.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例のデータ認識装置の構成図で
ある。
FIG. 1 is a configuration diagram of a data recognition device according to an embodiment of the present invention.

【図2】本発明の一実施例の辞書作成装置の構成図であ
る。
FIG. 2 is a configuration diagram of a dictionary creating apparatus according to an embodiment of the present invention.

【図3】本発明の他の実施例のデータ認識装置の構成図
である。
FIG. 3 is a configuration diagram of a data recognition device according to another embodiment of the present invention.

【図4】本発明の一実施例である、音声を入力データと
するデータ認識装置の構成図で、「ア」と発声したとき
のデータの流れを示す。
FIG. 4 is a block diagram of a data recognition device which is an embodiment of the present invention and uses voice as input data, and shows a data flow when "A" is uttered.

【図5】本発明の一実施例の学習装置の構成図で、
「ア」と発声したときのデータの流れを示す。
FIG. 5 is a configuration diagram of a learning device according to an embodiment of the present invention,
The data flow when "A" is uttered is shown.

【図6】本発明の他の実施例であるデータ認識装置の構
成図で、「ア」と発声したときのデータの流れを示す。
FIG. 6 is a configuration diagram of a data recognition device according to another embodiment of the present invention, showing a data flow when "A" is uttered.

【図7】従来のデータ認識装置の構成図である。FIG. 7 is a block diagram of a conventional data recognition device.

【図8】従来の音声を入力データとするデータ認識装置
の構成図で、「タ」と発声したときのデータの流れを示
す。
FIG. 8 is a block diagram of a conventional data recognition device that uses voice as input data, and shows the flow of data when "ta" is uttered.

【図9】従来の音声を入力データとするデータ認識装置
の構成図で、「ファ」と発声したときのデータの流れを示
す。
FIG. 9 is a block diagram of a conventional data recognition device that uses voice as input data, and shows the flow of data when "Fa" is uttered.

【符号の説明】[Explanation of symbols]

1 入力データ 2 入力処理部 3 標準パターン比較処理部 4,16 出力処理部 5 標準パターン辞書 6 標準パターン比較処理による出力デー
タ 7 音声の標準パターン比較処理部 8 発声単語「タ」 9 「タ」の標準パターン比較処理結果 10 発声単語「ファ」 11 「ファ」の標準パターン比較処理結果 12 データ変換処理部 13 データ比較処理部 14 比較パターン辞書 15,22,27 データ変換処理の出力データ 17,107 パターン抽出処理部 18 出力データ 19 正解データ 20 発声単語「ア」1 21,26 音声の標準パターン比較処理部の出
力データ 23 ニューラルネットワーク 24 類似点数 25 発声単語「ア」2 28 正解データ「ア」 203 ニューラルネットワーク調整手段 2003 調整手段
1 input data 2 input processing unit 3 standard pattern comparison processing unit 4, 16 output processing unit 5 standard pattern dictionary 6 output data by standard pattern comparison processing 7 standard pattern comparison processing unit for voice 8 vocalized word "ta" 9 "ta" Standard pattern comparison processing result 10 Spoken word “Fa” 11 Standard pattern comparison processing result of “Fa” 12 Data conversion processing unit 13 Data comparison processing unit 14 Comparison pattern dictionary 15, 22, 27 Output data of data conversion processing 17,107 patterns Extraction processing unit 18 Output data 19 Correct answer data 20 Spoken word “A” 1 21, 26 Output data of standard pattern comparison processing unit of speech 23 Neural network 24 Similarity score 25 Spoken word “A” 2 28 Correct answer data “A” 203 Neural Network adjustment means 2003 Adjustment means

Claims (11)

【特許請求の範囲】[Claims] 【請求項1】 認識されるべき対象の特徴データを基に
してパターン認識法(A)によって得られる複数の認識
候補及びそれらに対応する認識の正しさの程度を表す情
報を、新たな特徴データとして入力する入力手段と、 前記入力される新たな特徴データに基づき、パターン認
識法(B)によって、前記認識されるべき対象について
の認識結果を得るパターン認識処理手段と、 前記認識結果を出力する出力手段と、を備えていること
を特徴とするデータ認識装置。
1. A plurality of recognition candidates obtained by a pattern recognition method (A) based on feature data of an object to be recognized and information indicating the degree of correctness corresponding to them are newly added as new feature data. Input means for inputting, as pattern recognition processing means for obtaining a recognition result for the object to be recognized by the pattern recognition method (B) based on the new feature data input, and outputting the recognition result. A data recognition apparatus comprising: an output unit.
【請求項2】 パターン認識処理手段は、ニューラルネ
ットワークにより構成されていることを特徴とする請求
項1記載のデータ認識装置。
2. The data recognition apparatus according to claim 1, wherein the pattern recognition processing means is composed of a neural network.
【請求項3】 パターン認識法(B)で用いられる特徴
データと、それに対応する認識結果とが格納されている
特徴データ格納辞書を備えていることを特徴とする請求
項1記載のデータ認識装置。
3. The data recognition device according to claim 1, further comprising a feature data storage dictionary in which feature data used in the pattern recognition method (B) and a recognition result corresponding to the feature data are stored. .
【請求項4】 パターン認識処理手段により新たに選定
された認識候補が誤りであると判定された場合、その誤
りであると判定された前記認識されるべき対象について
も正しく認識出来るように前記パターン認識法(B)を
調整する調整手段を備えていることを特徴とする請求項
1、2、又は3記載のデータ認識装置。
4. When the pattern recognition processing unit determines that the newly selected recognition candidate is erroneous, the pattern can be correctly recognized even for the object to be recognized which has been erroneously determined. 4. The data recognition device according to claim 1, further comprising adjusting means for adjusting the recognition method (B).
【請求項5】 前記パターン認識処理手段が、ニューラ
ルネットワークにより構成されている場合、 前記正しく認識出来るように前記パターン認識法(B)
を調整するとは、前記調整手段により、前記ニューラル
ネットワークに対して、所定の教師信号が与えられ、前
記正しく認識出来るようにそのニューラルネットワーク
の構成を調整することであることを特徴とする請求項4
記載のデータ認識装置。
5. The pattern recognition method (B), wherein when the pattern recognition processing means is composed of a neural network, the pattern recognition processing means can correctly recognize the pattern.
5. The adjusting means means adjusting the configuration of the neural network so that the teacher can give a predetermined teacher signal to the neural network and correctly recognize the neural network.
The described data recognition device.
【請求項6】 前記特徴データ格納辞書を備えている場
合、 前記正しく認識出来るように前記パターン認識法(B)
を調整するとは、前記特徴データ格納辞書に対して、前
記誤りであると判定された前記対象の特徴データとそれ
に対応する正解データとを新たに追加することであるこ
とを特徴とする請求項4記載のデータ認識装置。
6. When the feature data storage dictionary is provided, the pattern recognition method (B) so that the pattern can be correctly recognized.
5. The adjustment of means is to newly add the target feature data determined to be the error and the correct answer data corresponding thereto to the feature data storage dictionary. The described data recognition device.
【請求項7】 認識されるべき対象は、音声情報、文字
情報、画像情報又はパターン情報であることを特徴とす
る請求項1〜6の何れか一つに記載のデータ認識装置。
7. The data recognition device according to claim 1, wherein the object to be recognized is voice information, character information, image information or pattern information.
【請求項8】 請求項3記載のデータ認識装置における
前記特徴データ格納辞書を作成するための辞書作成装置
であって、 学習用サンプルについての特徴データを基にしてパター
ン認識法(A)によって得られる複数の認識候補及びそ
れらに対応する認識の正しさの程度を表す情報と、それ
に対応する正解データとを、作成対象としての特徴デー
タ格納辞書に登録し、特徴データ格納辞書の作成を行う
特徴データ格納辞書作成手段を備えていることを特徴と
する辞書作成装置。
8. A dictionary creation device for creating the feature data storage dictionary in the data recognition device according to claim 3, wherein the dictionary is obtained by a pattern recognition method (A) based on the feature data of the learning sample. A plurality of recognition candidates that are stored, information indicating the degree of correctness of recognition corresponding to them, and correct answer data corresponding thereto are registered in a feature data storage dictionary as a creation target, and a feature data storage dictionary is created. A dictionary creation device comprising a data storage dictionary creation means.
【請求項9】 学習用サンプルは、音声情報、文字情
報、画像情報又はパターン情報であることを特徴とする
請求項8記載の辞書作成装置。
9. The dictionary creating apparatus according to claim 8, wherein the learning sample is voice information, character information, image information or pattern information.
【請求項10】 請求項2記載のデータ認識装置におけ
る前記ニューラルネットワークを作成するための学習装
置であって、 学習用サンプルについての特徴データを基にしてパター
ン認識法(A)によって得られる複数の認識候補及びそ
れらに対応する認識の正しさの程度を表す情報と、それ
に対応する教師信号である正解データとを、学習を必要
とするニューラルネットワークに対して与え、そのニュ
ーラルネットワークからの出力結果が前記正解データと
一致するように、少なくともそのニューラルネットワー
クの所定の係数を調整するニューラルネットワーク調整
手段を備えていることを特徴とする学習装置。
10. A learning device for creating the neural network in the data recognition device according to claim 2, comprising a plurality of patterns obtained by a pattern recognition method (A) on the basis of feature data of learning samples. Information indicating the degree of correctness of recognition corresponding to the recognition candidates and the correctness data that is a teacher signal corresponding thereto is given to a neural network that requires learning, and the output result from the neural network is A learning device comprising a neural network adjusting means for adjusting at least a predetermined coefficient of the neural network so as to match the correct answer data.
【請求項11】 学習用サンプルは、音声情報、文字情
報、画像情報又はパターン情報であることを特徴とする
請求項10記載の学習装置。
11. The learning device according to claim 10, wherein the learning sample is voice information, character information, image information, or pattern information.
JP6313766A 1994-12-16 1994-12-16 Data recognizing device, dictionary forming device and learning device Pending JPH08171398A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6313766A JPH08171398A (en) 1994-12-16 1994-12-16 Data recognizing device, dictionary forming device and learning device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6313766A JPH08171398A (en) 1994-12-16 1994-12-16 Data recognizing device, dictionary forming device and learning device

Publications (1)

Publication Number Publication Date
JPH08171398A true JPH08171398A (en) 1996-07-02

Family

ID=18045270

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6313766A Pending JPH08171398A (en) 1994-12-16 1994-12-16 Data recognizing device, dictionary forming device and learning device

Country Status (1)

Country Link
JP (1) JPH08171398A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018517927A (en) * 2015-09-04 2018-07-05 グーグル エルエルシー Neural network for speaker verification

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018517927A (en) * 2015-09-04 2018-07-05 グーグル エルエルシー Neural network for speaker verification

Similar Documents

Publication Publication Date Title
US7013276B2 (en) Method of assessing degree of acoustic confusability, and system therefor
JP4301102B2 (en) Audio processing apparatus, audio processing method, program, and recording medium
US5794204A (en) Interactive speech recognition combining speaker-independent and speaker-specific word recognition, and having a response-creation capability
US6236965B1 (en) Method for automatically generating pronunciation dictionary in speech recognition system
KR101183344B1 (en) Automatic speech recognition learning using user corrections
US6910012B2 (en) Method and system for speech recognition using phonetically similar word alternatives
JP4680714B2 (en) Speech recognition apparatus and speech recognition method
JPH0422276B2 (en)
JP2003316386A (en) Method, device, and program for speech recognition
JPH0423799B2 (en)
CN110021293B (en) Voice recognition method and device and readable storage medium
JPH0713594A (en) Method for evaluation of quality of voice in voice synthesis
CN117043857A (en) Method, apparatus and computer program product for English pronunciation assessment
JPH06110494A (en) Pronounciation learning device
JPH08171398A (en) Data recognizing device, dictionary forming device and learning device
JP2000214879A (en) Adaptation method for voice recognition device
JPH08314490A (en) Word spotting type method and device for recognizing voice
JPH0736481A (en) Interpolation speech recognition device
Kitaoka et al. Detection and recognition of correction utterances on misrecognition of spoken dialog system
JP3231365B2 (en) Voice recognition device
JPH0713587A (en) Hidden markov connection learning method
JP2001034291A (en) Voice recognition device
JPH04271397A (en) Voice recognizer
JPH08211893A (en) Speech recognition device
JP2004309654A (en) Speech recognition apparatus