JPS6075894A - Dictionary updating system - Google Patents

Dictionary updating system

Info

Publication number
JPS6075894A
JPS6075894A JP58184153A JP18415383A JPS6075894A JP S6075894 A JPS6075894 A JP S6075894A JP 58184153 A JP58184153 A JP 58184153A JP 18415383 A JP18415383 A JP 18415383A JP S6075894 A JPS6075894 A JP S6075894A
Authority
JP
Japan
Prior art keywords
pattern
dictionary
section
updated
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58184153A
Other languages
Japanese (ja)
Other versions
JPH0634179B2 (en
Inventor
潤一郎 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP58184153A priority Critical patent/JPH0634179B2/en
Publication of JPS6075894A publication Critical patent/JPS6075894A/en
Publication of JPH0634179B2 publication Critical patent/JPH0634179B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 11次I 本発明は、音響認識装置における辞書の更新方式に関す
るものである。
DETAILED DESCRIPTION OF THE INVENTION Eleventh Order I The present invention relates to a dictionary updating method in an acoustic recognition device.

鎧m曹 DP法(動的計画法)を用いない音声パターン照合法、
或いは話者による変動吸収法として、音声の時間−周波
数パターンのピークを連絡したパターンとブロードなパ
ターンとの重ね合わせによる照合法か考えられている(
音響学会秋季全国大会1983.10)。この方法の例
を第1図に示す。第1図において、1はマイクロフォン
、2はフィルタ群、3は音声区間検出部、4は2値化(
閑イ161)部、5は24fi化(閾値2)部、6はレ
ジスタ、7は加算部、8は辞書部、9は類似度算出部、
10は結果表示部で、まず、辞書登録に際しては登録す
べき単語を順に発声し、各単語を複数回発白するとする
。マイクlから入力された音j1jは周波数パターンに
変換され1゛1声に一間がす」り出されて、ある悶(直
(閾値2)によってOllに2値化されてレジスタ6に
格納される。次に同じ単語の2回目の発声が行なわれ、
同様の2値化パターンかすでにレジスタに格納されてい
るパターンと加算され、再びレジスタに納められる。こ
うして1つの単語について複数回発声されたパターンは
加算され、辞書単語数だけ登録される。
Voice pattern matching method that does not use DP method (dynamic programming),
Alternatively, as a method of absorbing variations caused by speakers, a matching method is considered that involves superimposing a pattern that connects the peaks of the time-frequency pattern of the voice with a broad pattern (
Autumn National Conference of the Acoustical Society of Japan (October 1983). An example of this method is shown in FIG. In Fig. 1, 1 is a microphone, 2 is a filter group, 3 is a voice section detection unit, and 4 is a binarization (
161) section, 5 is a 24fi conversion (threshold value 2) section, 6 is a register, 7 is an addition section, 8 is a dictionary section, 9 is a similarity calculation section,
Reference numeral 10 denotes a result display section. First, when registering a dictionary, words to be registered are uttered in order, and each word is uttered multiple times. The sound j1j input from the microphone L is converted into a frequency pattern, outputted with a pause for each voice, and then binarized into the Oll by a certain amount of time (threshold value 2) and stored in the register 6. A second utterance of the same word is then made,
A similar binarized pattern is added to a pattern already stored in the register and stored in the register again. In this way, patterns in which one word is uttered multiple times are added up and registered as many times as there are words in the dictionary.

次に認識に際しては、音声が区間検出された後辞書作成
時と異る閾値(閾値l)で2値化される。
Next, during recognition, after the speech is detected, it is binarized using a different threshold (threshold 1) than when creating the dictionary.

仮に閾値1〉閾値2とすると辞書パターンに比べ入カバ
ターンの力か2値化後の「1」の幅が狭いことになる。
If threshold value 1>threshold value 2, then the strength of the input pattern or the width of "1" after binarization will be narrower than in the dictionary pattern.

このような入カバターンを辞書の各単語のパターン七に
重ねる操作をし、その重なりの度合から類似度を計算し
、最大類似度をもつ辞書単語を認識結果とする。一般に
人間の発声は刻々と変化し、体調などでも変化するため
、使用しながら辞書を更新する必要が生ずる。今、便宜
上、時間lサンプル分の3回加賀の辞書によって更新す
る場合について説明すると、周波数方向に8サンプルで
第2図(a)のような計算を(b)のような入力の1.
0パターンで更新する時、(a)と(b)のパターンを
加え合わせ(C)のパターンにして1以上の部分から1
を引いて最大値が「3」となるような辞a (d)に更
新する方法が考えられる。ところが、このような方法で
は、(b)のパターン特有の情報(gもの変化等による
)である周波数第2サンプルのrlJか(d)には反映
されない。つまり更新しても辞書は新しくはならない欠
点がある。又、第3図に示す如く逆に現在の辞書パター
ンの「1」以上の部分から先にrlJを引き(b)、そ
の後入カッくターン(d)を加える方法も考えられる。
The input pattern is superimposed on each pattern of each word in the dictionary, the degree of similarity is calculated from the degree of overlap, and the dictionary word with the maximum degree of similarity is taken as the recognition result. In general, human speech changes from moment to moment, and changes due to factors such as physical condition, so it is necessary to update the dictionary while using it. For convenience, we will explain the case where Kaga's dictionary is updated three times for a time of l samples.The calculation as shown in FIG.
When updating with 0 pattern, add patterns (a) and (b) and make pattern (C) from 1 or more parts.
A possible method is to subtract ``a'' and update the term a(d) such that the maximum value becomes ``3''. However, in such a method, rlJ of the second frequency sample, which is information specific to the pattern (b) (due to a change in g, etc.), is not reflected in (d). In other words, there is a drawback that the dictionary will not be updated even if it is updated. Alternatively, as shown in FIG. 3, it is conceivable to conversely draw rlJ (b) from the part of the current dictionary pattern that is greater than or equal to "1", and then add an incoming turn (d).

この場合、第3図のように一見更新され人カッくターン
の周波数第2サンプルのrlJが保存されるかに見える
。しかし、次に更新される時にはまず(a)の「l」の
部分が引き去られ、今更新された部分かOとなってしま
い、その後に反映しないとl、)う欠点かある。また、
第4図のような方式も考えられる。第4図において、1
1は入カバターンレジスタ、12は加算部、13は減算
部、14は辞書部、15は2値化部、16はレジスタで
これは該当する辞書パターン(第5図(a))を2値化
して(b)の如きパターンにしてレジスタに保持し、人
カバターンと該当辞書パターンと加算した後(d)、!
パターン(b)を差し引くことによって更新するもので
ある(e)。この方式によると入カバターンの44徴的
な部分Aは更新辞書に保存されるが1例えばBのような
辞書中の「l」のパターンは更新辞書」二でも「1」で
あり、いくら人カバターンで更新されても「1」以上に
なることがないという欠点が生じる。
In this case, as shown in FIG. 3, it appears at first glance that the rlJ of the second sample of the frequency of the human cut turn is updated and saved. However, when it is updated next time, the "l" part in (a) is first removed, and the currently updated part becomes O, which has the disadvantage of not being reflected afterwards. Also,
A method as shown in FIG. 4 is also conceivable. In Figure 4, 1
1 is an input pattern register, 12 is an addition section, 13 is a subtraction section, 14 is a dictionary section, 15 is a binarization section, and 16 is a register that converts the corresponding dictionary pattern (Fig. 5 (a)) into two values. After converting into a pattern like (b) and storing it in a register, adding the human cover pattern and the corresponding dictionary pattern, (d), !
The pattern (e) is updated by subtracting the pattern (b). According to this method, the 44 characteristic part A of the input kabataan is stored in the updated dictionary, but 1. For example, the pattern of "l" in the dictionary such as B is "1" even in the updated dictionary. The disadvantage is that even if the value is updated, it will never become greater than "1".

止−−1 本発明は、上述のごとき欠点を解決するためになされた
もので、特に、音声認識装置においてんに高認識率を保
持できるような辞書を得るための辞書更新方式を提供す
ることを目的としてなされたものである。
The present invention has been made in order to solve the above-mentioned drawbacks, and in particular, to provide a dictionary updating method for obtaining a dictionary that can maintain a high recognition rate in a speech recognition device. It was made for the purpose of

癒−一一戎 本発明の構成について、以下、実施例に基づいて説明す
る。
EMBODIMENT OF THE INVENTION The structure of the present invention will be described below based on examples.

本発明においては、前記目的を達するために次の如き操
作をしている。すなわち、音声認識装置で認識を行ない
、正解が得られたものに関し、認識された入カバターン
中の「0」の部分を負の単位で置きかえ、更新すべき辞
書パターンに加算する。その結果の負の部分を再び「0
」に変換し、辞書パターンの最大値を越える偵は最大値
に置きかえて辞書更新パターンを作成する。この方法の
基本的条件は次のようなものであるが、ここでは便宜」
二2値化パターンを3つ加qして辞書を作る(同じ単語
を3回発声して各々の2値化パターンを加37する)と
して考える。つまり辞書パターン中の値はO〜3までの
整数となり辞書パターンの最大値は3である。
In the present invention, the following operations are performed to achieve the above object. That is, recognition is performed by the speech recognition device, and for those for which a correct answer is obtained, the "0" part in the recognized input pattern is replaced with a negative unit and added to the dictionary pattern to be updated. The negative part of the result is again “0”
'', and if the value exceeds the maximum value of the dictionary pattern, a dictionary update pattern is created by replacing it with the maximum value. The basic conditions for this method are as follows, but we will explain them here for convenience.
It is assumed that a dictionary is created by adding 3 2-binarization patterns (by saying the same word 3 times and adding 37 each of the 2-binarization patterns). That is, the values in the dictionary pattern are integers from O to 3, and the maximum value of the dictionary pattern is 3.

(条件) 辞書パターンのOに入カバターンのOが重なると更新パ
ターンはOとするtt l tt、Q tt O// //、 2 // Q tt l tttt 3 tt
 Q // 2 tt l/ Oll l ll 1 〃 tt l // l // 2// lt 2 tt l tt 3 // lt 3 tt l tt 3 // これを実現するために更新法の構成を上記の如くした。
(Condition) If the O of the dictionary pattern and the O of the input pattern overlap, the update pattern is O.tt l tt, Q tt O// //, 2 // Q tt l tttt 3 tt
Q // 2 tt l/ Oll l ll 1 〃 tt l // l // 2// lt 2 tt l tt 3 // lt 3 tt l tt 3 // To achieve this, the configuration of the update method is described above. It was like this.

この上の条性に従うと第7図(a)の如き辞書パターン
を(b)の如き人カバターンで更新すると(f)の如き
パターンとなる。
According to the above condition, when a dictionary pattern as shown in FIG. 7(a) is updated with a human cover turn as shown in FIG. 7(b), a pattern as shown in FIG. 7(f) is obtained.

未発、明のL順を第6図に示し、合わせて第7図(a)
、(b)のパターンがどのように変化して第7図(f)
のパターンになって行くかを第7図(C)〜(f)に示
す。まず人カデ〜り中に0があるかを判断し、0を負の
甲位である一工に置き変える(第7図(C))。これと
更新すべき辞書パターンを加算する(第7図(d))。
The L order of undiscovered and light is shown in Fig. 6, and also shown in Fig. 7(a).
, how the pattern in (b) changes to Fig. 7(f)
Figures 7(C) to (f) show how the pattern changes. First, it is determined whether there is a 0 in the position of the person, and the 0 is replaced with 1, which is a negative position (Fig. 7 (C)). This and the dictionary pattern to be updated are added (FIG. 7(d)).

この第7図(d)の′パターン中の負の部分をrQJへ
戻す(第7図(e))。その後、パターンの最大値の補
正をする。この場合、辞書は3つのパターンの和で構成
されているため最大値は3である。他の単語辞書もこの
ように構成されているため常に全ての辞書パターンも回
し構成にしなければならない。そこで第6図(e)のパ
ターン中の「4」以」−の部分を全て「3」に書き変え
ろことで第7図(f)のパターンつまり更新パターンが
得られる。これは前述のようにしてめた第7図の(f)
と一致して望む更新パターンが作られていることを示し
ている。
The negative part in the ' pattern of FIG. 7(d) is returned to rQJ (FIG. 7(e)). After that, the maximum value of the pattern is corrected. In this case, the maximum value is 3 because the dictionary is made up of the sum of three patterns. Since other word dictionaries are also structured in this way, all dictionary patterns must always be configured in a rotating configuration. Therefore, by rewriting all the parts "4" and "-" in the pattern of FIG. 6(e) to "3", the pattern of FIG. 7(f), that is, the updated pattern is obtained. This is (f) in Figure 7, which was created as described above.
This shows that the desired update pattern is created in accordance with the above.

防−一一ス 以上の説明から明らかなごとく、本発明によるよ、入カ
バターンの刻々の変化によって辞書パターンも追従して
変化し、従って、発声者の声の状態か変化しても認識率
を低下させることなく高6’!識−Vを維持するための
辞書を得ることができる。
Prevention - Eleven As is clear from the above explanation, according to the present invention, as the input pattern changes from moment to moment, the dictionary pattern changes accordingly, and therefore, even if the state of the speaker's voice changes, the recognition rate cannot be improved. High 6' without lowering! A dictionary for maintaining knowledge-V can be obtained.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は、従来の音声照合法の一例を説明するための電
気的ブロック線図、第2図及び第3図は、それぞれ辞書
更新法の例を説明するための1% 、第4図は、従来の
音声照合法の他の例を示す電気的ブロック線図、・第5
図は、その辞書更新法の例を説明すめための図、第6図
は、本発明の一実施例を説明するためのフローチャート
、第71剣は、そのための信号パターン図である。 1・・・マイク、2・・・フィルター〇f、3・・・音
声区間検出部、4・・・2値化(閾値l)部、5・・・
2値化(14J値2)部、6・・・レジスタ、7・・・
加算部、8・・・辞aft、9・・・類似度算出部、1
0・・・結果出力部、11 用大カパタールジスタ、1
2・・・加算部、13・・・減算部、14・・・辞書部
、15・・・2値化部、16・・・レジスタ。
FIG. 1 is an electrical block diagram for explaining an example of a conventional voice matching method, FIGS. 2 and 3 are electrical block diagrams for explaining an example of a dictionary updating method, and FIG. , an electrical block diagram illustrating another example of the conventional voice matching method, ・Fifth
The figure is a diagram for explaining an example of the dictionary updating method, FIG. 6 is a flowchart for explaining an embodiment of the present invention, and the 71st sword is a signal pattern diagram for that purpose. 1... Microphone, 2... Filter 〇f, 3... Voice section detection section, 4... Binarization (threshold l) section, 5...
Binarization (14J value 2) section, 6... register, 7...
Addition unit, 8... End aft, 9... Similarity calculation unit, 1
0...Result output section, 11 Large kaputar resistor, 1
2... Addition section, 13... Subtraction section, 14... Dictionary section, 15... Binarization section, 16... Register.

Claims (1)

【特許請求の範囲】[Claims] 音声を時間−周波数のパターンに変換し、そのいくつか
を辞書として保持し、未知音声が入力された場合、この
未知音声人力を前記と同様にして時間−周波数のパター
ンに変換して該辞書中の各パターンと重ね合わせる操作
を行なって類似度を算出する音声認識装置において、正
解が得られた場合、人カバターン中の「0」の部分を負
の単位に1&きかえ、更新すべき辞書パターンに加算し
、再び負の部分を「0」に変更し、辞書パターンの最大
値を越える部分は最大値に置き変えることにより更新パ
ターンをf1成することを特徴とする辞書更新方式。
Convert speech into time-frequency patterns and store some of them as a dictionary. When unknown speech is input, this unknown speech is converted into time-frequency patterns in the same way as above and stored in the dictionary. If a correct answer is obtained in a speech recognition device that calculates similarity by overlapping each pattern with each pattern, it changes the "0" part in the human cover turn to a negative unit by 1&, and updates the dictionary pattern to be updated. A dictionary update method characterized in that an update pattern is created by adding the negative part to "0" again, and replacing the part exceeding the maximum value of the dictionary pattern with the maximum value.
JP58184153A 1983-10-02 1983-10-02 Dictionary update method Expired - Lifetime JPH0634179B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58184153A JPH0634179B2 (en) 1983-10-02 1983-10-02 Dictionary update method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58184153A JPH0634179B2 (en) 1983-10-02 1983-10-02 Dictionary update method

Publications (2)

Publication Number Publication Date
JPS6075894A true JPS6075894A (en) 1985-04-30
JPH0634179B2 JPH0634179B2 (en) 1994-05-02

Family

ID=16148289

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58184153A Expired - Lifetime JPH0634179B2 (en) 1983-10-02 1983-10-02 Dictionary update method

Country Status (1)

Country Link
JP (1) JPH0634179B2 (en)

Also Published As

Publication number Publication date
JPH0634179B2 (en) 1994-05-02

Similar Documents

Publication Publication Date Title
US3377428A (en) Voiced sound detector circuits and systems
JP2003131700A (en) Voice information outputting device and its method
JPS6075894A (en) Dictionary updating system
JPS6312312B2 (en)
JPH03192400A (en) Waveform information processor
JPH04369698A (en) Voice recognition system
JPS6078491A (en) Dictionary updating system
JPS6078489A (en) Dictionary updating system
JPS6078496A (en) Dictionary updating system
JPS6078490A (en) Dictionary updating system
JP2666296B2 (en) Voice recognition device
JPH0461359B2 (en)
JP2913310B2 (en) Speech synthesis interruption device
JP2975808B2 (en) Voice recognition device
JPS63278100A (en) Voice recognition equipment
JPS6069699A (en) Voice pattern generator
JPS59228300A (en) Voice section detecting system
JPS6239899A (en) Conversation voice understanding system
JPH02287398A (en) Voice recognizing system and voice recognizing device
JP2884563B2 (en) Voice detection device
JPS59176797A (en) Voice recognition equipment
JPS58209799A (en) Voice message identification system
JPS60175098A (en) Voice recognition equipment
KR920008667A (en) Voice recognition and response system for car phone
JPS63226692A (en) Pattern comparison system