JPS63229496A - Pattern updating system for voice recognition - Google Patents

Pattern updating system for voice recognition

Info

Publication number
JPS63229496A
JPS63229496A JP62063405A JP6340587A JPS63229496A JP S63229496 A JPS63229496 A JP S63229496A JP 62063405 A JP62063405 A JP 62063405A JP 6340587 A JP6340587 A JP 6340587A JP S63229496 A JPS63229496 A JP S63229496A
Authority
JP
Japan
Prior art keywords
pattern
word
words
recognition
speaker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62063405A
Other languages
Japanese (ja)
Inventor
沢井 秀文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP62063405A priority Critical patent/JPS63229496A/en
Publication of JPS63229496A publication Critical patent/JPS63229496A/en
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 止1 本発明は、音声認識用パターン更新方式、より詳細には
、不特定話者の単語音声を認識する音声認識装置におけ
る標準パターンの更新方式に関する。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a speech recognition pattern update method, and more particularly to a standard pattern update method in a speech recognition device that recognizes word speech of an unspecified speaker.

0」 従来、不特定話者を対象とした単語音声認識装置におい
て、認識率の向上を図るための話者適応化の手法の一つ
として1発声者のパターンを用いて予め(2録されてい
る標準パターンの更新を行なう方式があるが、更新後の
パターンが不良であったりすると、かえって認識率の低
下を招く場合や。
Conventionally, in word speech recognition devices targeting unspecified speakers, one method of speaker adaptation in order to improve the recognition rate is to use the pattern of one speaker in advance (2 recorded). There is a method of updating a standard pattern, but if the updated pattern is defective, it may actually reduce the recognition rate.

誤認識が発生する度にパターンを更新することは煩雑で
あり、使い易い認識装置をユーザーに提供する観点から
は問題点が多い。
It is cumbersome to update the pattern every time an erroneous recognition occurs, and there are many problems from the viewpoint of providing the user with an easy-to-use recognition device.

目     了り 本発明は、上述のごとき実情に鑑みてなされたもので、
音声認識装置、特に、不特定話者の発声する単語音声認
識装置において、予め登録格納されている認識対象語の
標準パターンに対し、認識装置を使用する話者の発声パ
ターンを用いて、予め格納されている不特定話者用の標
準パターンを改変することなく追加、更新等の操作を施
すことにより認識装置の性能を使用者に適応させて認識
率を向上させることを目的としてなされたものである。
The present invention was made in view of the above-mentioned circumstances.
A speech recognition device, especially a speech recognition device for words uttered by an unspecified speaker, uses the utterance pattern of the speaker using the recognition device to pre-store standard patterns of recognition target words that are registered and stored in advance. This was done with the aim of adapting the performance of the recognition device to the user and improving the recognition rate by adding, updating, etc. without modifying the standard pattern for non-specific speakers. be.

構成 本発明は、上記目的を達成するために、不特定話者の単
語音声を認識する音声L!!識装置において。
Structure In order to achieve the above object, the present invention provides a voice L! that recognizes word sounds of unspecified speakers. ! In the cognitive device.

予め登録されている不特定話者用の単語標準パターンに
対し、ある話者が発声した単語が一定回数以上誤認識を
起こした場合には、誤認識単語に対応する登録されてい
る標準パターンを改変することなく認識対象からはずし
、新たに話者の発声パターンを登録追加すること、或い
は、認識対象となる単語セット中の類似単語を予めリス
トアップしておき、話者が認識モードに入る前に、類似
昨語を全て発声して不特定話者用の標準パターンに追加
登録しておくことを特徴としたものである。
If a word uttered by a certain speaker is misrecognized more than a certain number of times against pre-registered word standard patterns for unspecified speakers, the registered standard pattern corresponding to the misrecognized word is used. Remove the speech pattern from the recognition target without changing it and add a new speaker's utterance pattern to the recognition target, or list similar words in the recognition target word set in advance before the speaker enters recognition mode. The feature is that all similar last words are uttered and added to the standard pattern for unspecified speakers.

以下、本発明の実施例に基づいて説明する。Hereinafter, the present invention will be explained based on examples.

第1図は、本発明の一実施例を説明するためのブロック
線図で、図中、1は音声入力部、2は特徴抽出部、3は
登@/認識モード切り換え部、4は標準パターン格納部
、5は単語音声認識部、6は認識結果出力部で、音声入
力部1より入力された単語音声は、特徴抽出部2でバン
ドパスフィルタ群による分析やLPG分析を経て、特徴
パラメータの時系列に変換される。モード切り換え部3
ではスイッチSWが登録モード31にあるときは、単語
標準パターンの登録を行ない、標準パターン登録部4に
格納する。また、スイッチSWが認識モード32にある
ときには、標準パターン格納部4より標準パターンを引
用し、単語認識部5にて未知入力音声とのパターンマツ
チングを行ない、最も類似したパターンから1つ選択し
1M!!P識結果出力部6にて出力する。
FIG. 1 is a block diagram for explaining one embodiment of the present invention, in which 1 is a voice input section, 2 is a feature extraction section, 3 is an entry/recognition mode switching section, and 4 is a standard pattern 5 is a storage unit, 5 is a word speech recognition unit, and 6 is a recognition result output unit.The word speech input from the speech input unit 1 is analyzed by a group of bandpass filters and LPG analysis in a feature extraction unit 2, and then extracted with feature parameters. Converted to time series. Mode switching section 3
Now, when the switch SW is in the registration mode 31, a word standard pattern is registered and stored in the standard pattern registration section 4. When the switch SW is in the recognition mode 32, the standard pattern is quoted from the standard pattern storage section 4, and the word recognition section 5 performs pattern matching with the unknown input voice to select one of the most similar patterns. 1M! ! The P recognition result output section 6 outputs the result.

第2図は、本発明における標準パターンの更新方法を説
明するためのブロック図で、図中、7は誤認識カウント
部、8は更新モード切り換え判定部、41は更新パター
ン格納部、Cは更新モード切り換え制御(1号で、その
他、第1図に示した実施例と同様の作用をする部分には
第1図の場合と同一の参照番号が付しである。第2図に
おいて。
FIG. 2 is a block diagram for explaining the standard pattern updating method according to the present invention. In the figure, 7 is an erroneous recognition counting section, 8 is an update mode switching judgment section, 41 is an update pattern storage section, and C is an update section. Mode switching control (No. 1) Other parts having the same functions as those in the embodiment shown in FIG. 1 are given the same reference numerals as in FIG. 1. In FIG.

モード切り換え部3のスイッチSWが認識モード32に
ある時は、音声入力部1より入力された未知人力音声は
、特微分析部2を経て、単語認識部5で認識が行なわれ
るが、その際、誤認識が生じた場合に、発声パターンが
不良の場合と不特定話者用の標準パターン4が不良の場
合の2通りが考えられる。しかし、同一単語を複数回発
声しても依然として誤認識を生ずる場合には発声パター
ンの不良と考えるよりも、標準パターン自体が話者の発
声パターンと大きく異なっていると考える方が妥当であ
る。このような観点から、ある一定回数以上、同−単語
が誤った場合には、モード切り換え部3への制御信号C
を送信し、スイッチSWを更新モード31に切り換えて
パターンの更新を行なう、その際、従来在る不特定話者
用の標準パターンを消去するのではなく、新たに話者の
パターンを追加登録する。そして、再びスイッチSWを
認識モード32に切り換えた時には、更新パターン41
を優先的にアクセスし、更新パターンに対応する不特定
話者用標準パターンをアクセスしない措置をとる。これ
により、不特定用のパターンを改変することなく話者に
適用した標準パターンの更新を行なうことが可能となる
When the switch SW of the mode switching unit 3 is in the recognition mode 32, the unknown human voice input from the voice input unit 1 passes through the feature analysis unit 2 and is recognized by the word recognition unit 5. When erroneous recognition occurs, there are two possible cases: a case where the utterance pattern is defective and a case where the standard pattern 4 for unspecified speakers is defective. However, if erroneous recognition still occurs even after uttering the same word multiple times, it is more reasonable to consider that the standard pattern itself is significantly different from the speaker's utterance pattern than to consider that the utterance pattern is defective. From this point of view, if the same word is incorrect more than a certain number of times, the control signal C to the mode switching unit 3 is
and change the switch SW to update mode 31 to update the pattern.In this case, instead of deleting the existing standard pattern for unspecified speakers, a new pattern for a new speaker is added and registered. . Then, when the switch SW is switched to the recognition mode 32 again, the update pattern 41
, and take measures not to access the standard pattern for unspecified speakers that corresponds to the update pattern. This makes it possible to update the standard pattern applied to the speaker without modifying the non-specific pattern.

第3図は、認識に先立ち、認識対象となる単語セット中
の類似単語を予めリストアップしておき、話者がそれら
の類似単語−欄表の音声を発声して不特定話者用の標準
パターンに追加登録する方式を説明するための図であり
、図中、9は標準パターン格納部4の認識対象単語−欄
から導かれる類似m語一様表であり、これはディスプレ
イ10を通して話者に表示できるようになっている。認
識モードに入る前に、話者はディスプレイ1,0に示さ
れる類似単語を発声し、標準パターン追加べ)緑部41
に登録し、スイッチSWを認識モード32に切り換えた
後、認識を行なう。その際、追加登録部41の追加パタ
ーンを優先してアクセスすることは第2図に示した実施
例の場合と同様である。
In Figure 3, prior to recognition, similar words in the word set to be recognized are listed in advance, and the speaker utters the sounds of those similar words - column table to create a standard for unspecified speakers. This is a diagram for explaining the method of additionally registering a pattern. In the diagram, 9 is a similar m-word uniform table derived from the recognition target word column of the standard pattern storage unit 4. It is now possible to display. Before entering the recognition mode, the speaker should utter the similar words shown on displays 1 and 0 and add the standard pattern.
, and after switching the switch SW to recognition mode 32, recognition is performed. At this time, priority is given to accessing the additional patterns in the additional registration section 41, as in the embodiment shown in FIG.

第4図は、第3図の類似単語−欄表9の類似単語同士を
作成する場合の実施例を説明するための図であり1図中
、データ(DEETA)とデルタ(DERUTA) 、
訂正(TEESEE)と形成(KEESEIE)、こく
(KOKU)と6(110にU)は音韻の異なり数に基
づき、各々単語間距離を2.0.1.0.1.0と定義
する。このように、認識対象語中の単語間距離が一定値
(例えば2.0)以下となる単語の組をリストアップす
る方法が考えられる。
FIG. 4 is a diagram for explaining an example of creating similar words in the similar words column table 9 in FIG. 3. In FIG. 1, data (DEETA), delta (DERUTA),
Correction (TEESEE), formation (KEESEIE), body (KOKU) and 6 (U in 110) are based on the number of different phonemes, and the distance between words is defined as 2.0.1.0.1.0, respectively. In this way, a method can be considered in which a list of word pairs in which the distance between words in the recognition target words is equal to or less than a certain value (for example, 2.0) is considered.

第5図は、第3図の類似単語−欄表9の類似単語−欄を
作成する他の実施例を説明するための図つまり単語間の
コンフユージヨンマトリックスの一例を示す図であり、
図中、認識対象単語の番号を1,2.・・・、 N (
Nは単語数)とし、n番目とm番目の単語間のコンフユ
ージヨンの値をp<ntm)とする。全く、単語間にコ
ンフユージヨンが無い場合には単位行列(対角成分が全
て1で他の成分が全てO)となるが、一般的には類似単
語同士のペアではO<p(n、m)<1の値をとる。し
たがって、p(n、m)の値がある閾値Th以上となる
(p(n、m)≧Th)単語のペア(π、冨)(E (
(n 、m)l p (n 、m)≧Th)を全て選択
する方法も考えられる。
FIG. 5 is a diagram for explaining another example of creating the similar word column of the similar word column table 9 in FIG. 3, that is, a diagram showing an example of a confusion matrix between words;
In the figure, the numbers of the words to be recognized are 1, 2, etc. ..., N (
N is the number of words), and the value of the fusion between the nth and mth words is p<ntm). If there is no confusion between words, the matrix becomes an identity matrix (all diagonal elements are 1 and all other elements are O), but in general, for pairs of similar words, O<p(n, m) takes a value of <1. Therefore, a pair of words (π, depth) (E (
A method of selecting all (n, m)l p (n, m)≧Th) can also be considered.

このように、簡単な手続きで標準パターンを改変するこ
となく、話者の音声を追加登録することができるので、
話者に適応した標準パターンを作成することができ、従
って、認識率を大幅に向上させることができる。また、
従来、標準パターンの更新時に存在したような特定の話
者のみにパターンが適応してしまう弊害を生ずることな
く、他の話者に対しても同様の手続きをふむことにより
、パターンを適応させ認識率を向上させることができる
In this way, the speaker's voice can be additionally registered with a simple procedure without modifying the standard pattern.
A standard pattern adapted to the speaker can be created, and the recognition rate can therefore be greatly improved. Also,
The pattern can be adapted and recognized by applying the same procedure to other speakers, without causing the problem of patterns being adapted only to a specific speaker, which previously existed when updating standard patterns. rate can be improved.

効−1 以上の説明から明らかなように、本発明によると、不特
定話者用の単語音声認識装置を使用する際に、話者の発
声パターンを用いて標準パターンを消去することなく、
パターンを追加更新し・、また類似単語を認識対象語中
から予めリストアップして話者の音声を追加登録してお
くことにより、元の不特定話者用の標準パターンを改変
することなく話者の発声パターンに適用させることがで
きる。換言すれば、特定の話者の使用に対しても予め登
録されている不特定話者の標準パターンに改変する必要
が無いため、標準パターンが特定ユーザーだけに適用し
て他のユーザーには不適応となる弊害を生ずることなく
、全ゆるユーザーに対して適用可能な標準パターンを提
供して認識を向上させることができる。
Effect-1 As is clear from the above explanation, according to the present invention, when using a word speech recognition device for unspecified speakers, the speech pattern of the speaker can be used without erasing the standard pattern.
By adding and updating the pattern, listing similar words from among the words to be recognized in advance, and additionally registering the speaker's voice, it is possible to speak without changing the original standard pattern for non-specific speakers. It can be applied to a person's vocal pattern. In other words, there is no need to modify the pre-registered standard pattern for unspecified speakers for use by a specific speaker, so the standard pattern can be applied only to a specific user and not to other users. Recognition can be improved by providing a standard pattern that can be applied to all users without causing adaptational harm.

【図面の簡単な説明】[Brief explanation of drawings]

第1図乃至第3図は、それぞれ本発明によるパターン更
新方式の実施例を説明するためのブロック線図、第4図
及び第5図は、それぞれ類似単語の一欄表を作成する作
成方法を説明するための図である。 1・・・音声入力部、2・・・特徴抽出部、3・・・登
録/認識モード切り換え部、4・・・標準パターン格納
部。 5・・・単語音声認識部、6・・・認識結果出力部、7
・・・誤認識カウント部、8・・・更新モード切り換え
判定部、9・・・類似単語−欄表、10・・ディスプレ
ー。 ゛、2−
FIGS. 1 to 3 are block diagrams for explaining an embodiment of the pattern update method according to the present invention, and FIGS. 4 and 5 each illustrate a method for creating a list of similar words. It is a figure for explaining. DESCRIPTION OF SYMBOLS 1... Voice input section, 2... Feature extraction section, 3... Registration/recognition mode switching section, 4... Standard pattern storage section. 5... Word speech recognition unit, 6... Recognition result output unit, 7
. . . Erroneous recognition count section, 8. Update mode switching determination section, 9. Similar words column table, 10. Display.゛, 2-

Claims (4)

【特許請求の範囲】[Claims] (1)不特定話者の単語音声を認識する音声認識装置に
おいて、予め登録されている不特定話者用の単語標準パ
ターンに対し、ある話者が発声した単語が一定回数以上
誤認識を起こした場合には、誤認識単語に対応する登録
されている標準パターンを改変することなく認識対象か
らはずし、新たに話者の発声パターンを登録追加するこ
とを特徴とする音声認識用パターン更新方式。
(1) In a speech recognition device that recognizes word sounds from unspecified speakers, words uttered by a certain speaker are incorrectly recognized more than a certain number of times against pre-registered word standard patterns for unspecified speakers. 1. A pattern updating method for speech recognition, characterized in that, in the case of a misrecognized word, a registered standard pattern corresponding to an erroneously recognized word is removed from the recognition target without altering it, and a new speaker's utterance pattern is registered and added.
(2)、認識対象となる単語セット中の類似単語を予め
リストアップしておき、話者が認識モードに入る前に、
類似単語を全て発声して不特定話者用の標準パターンに
追加登録しておくことを特徴とする音声認識用パターン
更新方式。
(2) List similar words in the word set to be recognized in advance, and before the speaker enters recognition mode,
A speech recognition pattern update method characterized by uttering all similar words and additionally registering them in a standard pattern for unspecified speakers.
(3)、認識対象となる単語セット中の類似単語のリス
トアップ方法として、単語中のカナ系列間の距離または
音素系列間の距離が一定の閾値以下となるものを選択す
ることを特徴とする特許請求の範囲第(2)項に記載の
音声認識用パターン更新方式。
(3) As a method for listing similar words in a set of words to be recognized, a method is selected in which the distance between kana sequences or the distance between phoneme sequences in a word is less than a certain threshold. A speech recognition pattern update method according to claim (2).
(4)、認識対象となる単語セット中の類似単語のリス
トアップ方法として、認識装置を過去に使用した誤認識
結果から求めた単語間のコンフュージョン・マトリック
スに基づいて、マトリックスの要素の値がある閾値以上
となる単語ペアを選択することを特徴とする特許請求の
範囲第(2)項に記載の音声認識用パターン更新方式。
(4) As a method for listing similar words in a set of words to be recognized, the values of the elements of the matrix are The speech recognition pattern updating method according to claim (2), characterized in that a word pair having a value equal to or greater than a certain threshold is selected.
JP62063405A 1987-03-18 1987-03-18 Pattern updating system for voice recognition Pending JPS63229496A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62063405A JPS63229496A (en) 1987-03-18 1987-03-18 Pattern updating system for voice recognition

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62063405A JPS63229496A (en) 1987-03-18 1987-03-18 Pattern updating system for voice recognition

Publications (1)

Publication Number Publication Date
JPS63229496A true JPS63229496A (en) 1988-09-26

Family

ID=13228360

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62063405A Pending JPS63229496A (en) 1987-03-18 1987-03-18 Pattern updating system for voice recognition

Country Status (1)

Country Link
JP (1) JPS63229496A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007105409A1 (en) * 2006-02-27 2007-09-20 Nec Corporation Reference pattern adapter, reference pattern adapting method, and reference pattern adapting program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007105409A1 (en) * 2006-02-27 2007-09-20 Nec Corporation Reference pattern adapter, reference pattern adapting method, and reference pattern adapting program

Similar Documents

Publication Publication Date Title
ES2278763T3 (en) VOICE RECOGNITION SYSTEM AND PROCEDURE WITH A PLURALITY OF RECOGNITION MOTORS.
US6925154B2 (en) Methods and apparatus for conversational name dialing systems
WO2016092807A1 (en) Speaker identification device and method for registering features of registered speech for identifying speaker
US6836758B2 (en) System and method for hybrid voice recognition
JPH10133684A (en) Method and system for selecting alternative word during speech recognition
JPH10133685A (en) Method and system for editing phrase during continuous speech recognition
JPH0225517B2 (en)
JPS63229496A (en) Pattern updating system for voice recognition
JPH10187184A (en) Method of selecting recognized word at the time of correcting recognized speech and system therefor
JP2001265385A (en) Speaker recognizing device
JPS63149699A (en) Voice input/output device
JPH1168920A (en) Speech telephone number setting device
JPS645320B2 (en)
JP2000148187A (en) Speaker recognizing method, device using the method and program recording medium therefor
JPH01152851A (en) Voice dialing device
JPS6281699A (en) Forming and updating method for dictoinary for voice word processor
WO2021082084A1 (en) Audio signal processing method and device
JPH02208700A (en) Voice recognition device
JP3192324B2 (en) Word speaker for specific speaker
JPH05265482A (en) Information processor
KR19990081664A (en) Voice recognition method of voice recognition phone
JP3069150B2 (en) Voice dialing device
JPS6073592A (en) Voice recognition equipment for specific speaker
JPH0556519B2 (en)
JPH04301695A (en) Dictionary control system for speech recognition device