JPS6370296A - Word registration - Google Patents
Word registrationInfo
- Publication number
- JPS6370296A JPS6370296A JP61214366A JP21436686A JPS6370296A JP S6370296 A JPS6370296 A JP S6370296A JP 61214366 A JP61214366 A JP 61214366A JP 21436686 A JP21436686 A JP 21436686A JP S6370296 A JPS6370296 A JP S6370296A
- Authority
- JP
- Japan
- Prior art keywords
- word
- words
- speech
- voice
- registered
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims description 10
- 238000010586 diagram Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 230000035922 thirst Effects 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。(57) [Abstract] This bulletin contains application data before electronic filing, so abstract data is not recorded.
Description
【発明の詳細な説明】
〔概要〕
単語音声認識の為に特定話者の単語を登録する場合、登
録する為に発した単語の音声特徴パラメータを、既にメ
モリに格納登録済の単語の音声特徴パラメータと比較し
、類似度の近いものがあれば、類似した語との違いを強
調して発声して貰うか、又は言い方の異なる同じ意味を
持つ単語を発して貰い、再度登録を行うようにすること
で、既にメモリに格納登録済の単語の音声特徴パラメー
タと類似度の近いものを登録しなくすることで、単語音
声認識時の認識率を向上するようにしたものである。[Detailed Description of the Invention] [Summary] When registering words of a specific speaker for word speech recognition, the speech feature parameters of the words uttered for registration are already stored in memory and the speech features of the registered words are stored. Compare it with the parameters, and if there are any words that are similar, have them say the word emphasizing the difference from similar words, or say a word that has the same meaning in a different way, and then register it again. By doing so, the recognition rate during word speech recognition is improved by not registering words that have a similar degree of similarity to the speech feature parameters of words that have already been stored and registered in the memory.
本発明は、特定話者の単語音声認識の為に、特定話者の
単語を登録する場合の単語登録方法の改良に関する。The present invention relates to an improvement in a word registration method for registering words of a specific speaker for word speech recognition of a specific speaker.
特定話者の単語音声認識装置は、筒車で小形に出来るの
で、多くの装置に用いられている。Word speech recognition devices for specific speakers can be made compact using hour wheels, so they are used in many devices.
このj■語音声認識装置を使用するには誤認識の少ない
ことが要求される。In order to use this J ■ language speech recognition device, it is required that there are few false recognitions.
現在誤認識の改善が進められているが、ある程度限界に
きており、より誤認識を少なく出来る単語登録方法の提
供が要望されている。Although efforts are currently being made to improve misrecognition, they have reached their limits to some extent, and there is a demand for a word registration method that can further reduce misrecognition.
以下従来例を図を用いて説明する。 A conventional example will be explained below using figures.
第3図は従来例の単語登録装置のプロ・7り図、第4図
は1例の音声特徴パラメータ抽出器のブロック図である
。FIG. 3 is a professional diagram of a conventional word registration device, and FIG. 4 is a block diagram of an example of a speech feature parameter extractor.
第3図に示す装置で単語を登録する場合は、特定話者が
単語を発すると、マイクロホン5を介してA/D変換部
6に人力し、ディジタル信号に変換され、音声特徴パラ
メータ抽出器1に人力し、音声特徴パラメータが抽出さ
れ、メモリ2に格納登録される。When registering a word using the device shown in FIG. The audio feature parameters are manually extracted and stored and registered in the memory 2.
この時、キーボード12より、単語を意味するキャラク
タコードを入力し、メモリ2に一諸に格納登録しておく
。At this time, character codes representing the words are input from the keyboard 12 and are stored and registered in the memory 2.
尚これ等の制QUはプロセッサ7にて行ない、13はバ
スを示す。Note that these control QUs are performed by a processor 7, and 13 indicates a bus.
次に音声特徴パラメータ抽出器について説明すると、現
在上として用いられてものは、第4図に示すバンドパス
を用いるスペクトル包絡を求めるものである。Next, the voice feature parameter extractor will be explained. The one currently used is one that obtains a spectral envelope using a band pass as shown in FIG.
これは約2秒間位続(単語音声を、A/D変換部6にて
ディジタル信号に変換したものを、1フレーム512サ
ンプル程度で、各フレーム毎に5〜30個程度の通過帯
域幅が100〜200Hzのバンドパスフィルタ群20
により、低域は100Hzから高域7000Hz位(電
話による音声の場合は3400Hz)にわたる範囲で、
スペクトル分析を行い、正規化群21にて正規化し、数
Hz〜’Q十Hzのカットオフ周波数のローパスフィル
タ群22を通した分析値を総合し、音声特徴パラメータ
であるスペクトル包絡を求めるものである。This lasts about 2 seconds (word speech is converted into a digital signal by the A/D converter 6, and one frame has about 512 samples, and the passband width of about 5 to 30 samples per frame is 100 samples). ~200Hz bandpass filter group 20
Therefore, the low range ranges from 100Hz to the high range of about 7000Hz (3400Hz for telephone voice).
Spectral analysis is performed, normalized by a normalization group 21, and analyzed values passed through a low-pass filter group 22 with a cutoff frequency of several Hz to Q10 Hz are integrated to obtain a spectral envelope, which is a voice characteristic parameter. be.
しかしながら、従来の単語登録方法では、入力された単
語の音声特徴パラメータを抽出して、その侭、メモリへ
格納登録している為、特徴の似ている単語を格納登録す
ることもあり、単語音声認識時に、誤認識が多くなる問
題点がある。However, in the conventional word registration method, the audio feature parameters of the input word are extracted and then stored and registered in memory, so words with similar characteristics may be stored and registered. There is a problem that there are many erroneous recognitions during recognition.
上記問題点は、第1図の原理ブロック図に示す如く、登
録する為に発した単語の、音声特徴パラメータ抽出器1
にて抽出した音声特徴パラメータを、既にメモリ2に格
納登録済の単語の音声特徴パラメータと、音声特徴パラ
メータ比較部3にて比較し、類似度の近いものがあれば
、類似した語との違いを強調して発声して貰うか、又は
言い方の異なる同じ意味を持つ単語を発して貰い、再度
登録を行うようにした本発明の単語登録方法により解決
される。The above problem is solved by the speech feature parameter extractor 1 of the word uttered for registration, as shown in the principle block diagram of Fig. 1.
The speech feature parameters extracted in the above are compared with the speech feature parameters of the words already stored and registered in the memory 2 in the speech feature parameter comparison section 3, and if there are any words with similar degrees of similarity, the differences between the similar words are determined. This problem is solved by the word registration method of the present invention, in which the word registration method of the present invention is performed by asking the person to say the word with emphasis, or by having the person say a word with the same meaning in a different way, and then re-registering the word.
本発明によれば、単語登録時に、この単語の音声特徴パ
ラメータと、既にメモリ2に格納登録済の単語の音声特
徴パラメータとを比較し、類似度の近いものがあれば、
例えば、明瞭な言い方に直すとか、あだ名等の同じ意味
を持つ単語を発して貰い、再度登録することで、類似度
の高いものは登録しないようにしているので、単語音声
認識時、誤認識を少なくすることが出来る。According to the present invention, when registering a word, the phonetic feature parameters of this word are compared with the phonetic feature parameters of words that have already been stored and registered in the memory 2, and if there are words with similar degrees of similarity,
For example, by asking people to say words that have the same meaning, such as nicknames, and registering them again, we avoid registering words with a high degree of similarity. It can be reduced.
以下本発明の1実施例に付き図に従って説明する。 An embodiment of the present invention will be described below with reference to the accompanying drawings.
第2図は本発明の実施例の単語登録装置のブロック図で
ある。FIG. 2 is a block diagram of a word registration device according to an embodiment of the present invention.
第2図での単語登録について説明すると、特定話者が単
語を発すると、マイクロホン5を介してA/D変換部6
に人力し、ディジタル信号に変換され、音声特徴パラメ
ータ抽出器1に入力し、音声特徴パラメータが抽出され
、ダイナミック・プログラミング・マツチング方式等の
音声特徴パラメータ比較部3に入力する。To explain the word registration in FIG.
The input signal is manually inputted, converted into a digital signal, and input to the voice feature parameter extractor 1, where the voice feature parameters are extracted and input to the voice feature parameter comparison unit 3 using a dynamic programming matching method or the like.
一方メモリ2に既に格納登録されている音声特徴パラメ
ータがプロセッサ7の制御により順次読み出され、音声
特徴パラメータ比較部3に送られ、順次比較され、類似
度の近いものがあれば、メモリ2に同時に格納登録され
ているキャラクタコードが表示部8に表示され、又この
キャラクタコードは音声合成部9に送られ音声信号が合
成され、スピーカ11より単語音声が出力される。On the other hand, the voice feature parameters already stored and registered in the memory 2 are sequentially read out under the control of the processor 7, sent to the voice feature parameter comparison section 3, and compared sequentially. At the same time, the stored and registered character code is displayed on the display section 8, and this character code is also sent to the voice synthesis section 9, where a voice signal is synthesized, and the word voice is outputted from the speaker 11.
そこで特定話者は今発した単語はメモリ2に既に格納登
録された音声特徴パラメータと近似していることが判る
ので、特定話者には再度明瞭な言い方に直すとか、あだ
名等の同じ意味を持つ単語を発して買うようにしている
ので、単語音声認識時の誤認識を少なくすることが出来
る。Then, the specific speaker can see that the word he just uttered is similar to the voice feature parameters already stored and registered in memory 2, so the specific speaker may be asked to rephrase it in a clearer way, or give him a nickname or other similar meaning. Since the user is trying to buy by saying the word he or she has, it is possible to reduce misrecognition during word speech recognition.
この場合も、これ等の制御はプロセッサ7にて行われる
。In this case as well, these controls are performed by the processor 7.
尚このメモリ2に格納登録された音声特徴パラメータは
単語音声認識時にその侭使用される。Note that the voice feature parameters stored and registered in this memory 2 are used during word voice recognition.
次ぎに、音声特徴パラメータを比較する方法として、現
在上として用いられているダイナミック・プログラミン
グ・マツチング方式(DPマツチング方式)について説
明する。Next, a dynamic programming matching method (DP matching method) currently used as a method for comparing voice feature parameters will be explained.
これは、入力する単語音声特徴パラメータと、これと比
較する単語音声特徴パラメータとの最もよいマツチング
が得られるように時間軸の対応づけを行い、単語音声に
おける時間軸の不均等な伸縮の影響を全く受けなく時間
正規化を行い、次ぎに両者のパターンの各点の比較を行
い時間正規化距離を求め、この値をパターンについて夫
々計算し、総和を求め、この総和が所定の値より小さい
時類似度が貰いとするものである。This is done by associating the time axes so as to obtain the best matching between the input word speech feature parameters and the word speech feature parameters being compared, and to eliminate the effects of uneven expansion and contraction of the time axis in word speech. Perform time normalization without receiving any data, then compare each point of both patterns to find the time normalized distance, calculate this value for each pattern, find the sum, and if this sum is less than a predetermined value It is assumed that the degree of similarity is obtained.
以上詳細に説明せる如(本発明によれば、既にメモリに
格納登録済の単語の音声特徴パラメータと類似度の近い
ものがあれば、類似した語との違いを強調して発声して
貰うか、又は言い方の異なる同じ意味を持つ単語を発し
て貰い、再度登録を行うことで、既にメモリに格納登録
済の単語の音声特徴パラメータと類似度の近いものを登
録しなくしているので、単語音声認識時の認識率を向上
出来る効果がある。As explained in detail above, (according to the present invention, if there is a word that has a similar degree of similarity to the voice feature parameters of a word that has already been stored and registered in the memory, the difference between the word and the similar word is emphasized and the voice is uttered.) , or a word that has the same meaning in a different way, and then registers it again. This prevents the registration of words that have a similar degree of similarity to the voice feature parameters of words that have already been stored and registered in memory. This has the effect of improving the recognition rate during recognition.
第1図は本発明の原理ブロック図、
第2図は本発明の実施例の単語登録装置のブロック図、
第3図は従来例の単語登録装置のブロック図、第4図は
1例の音声特徴パラメータ抽出器のブロック図である。
図において、
1は音声特徴パラメータ抽出器、
2はメモリ、
3は音声特徴パラメータ比較部、
5はマイクロホン、
6はA/D変換部、
7はプロセッサ、
8は表示部、
9は音声合成部、
11はスピーカ、
爪だ田川の大プレイΣすQ′牟舒ト)貨峻昔捻のプロ・
フロ非 2 口
従4−9」の御−q月)釧9壱対姪のフ゛Qソ2渇羊
3 りFig. 1 is a block diagram of the principle of the present invention, Fig. 2 is a block diagram of a word registration device according to an embodiment of the present invention, Fig. 3 is a block diagram of a conventional word registration device, and Fig. 4 is an example of speech. FIG. 2 is a block diagram of a feature parameter extractor. In the figure, 1 is a voice feature parameter extractor, 2 is a memory, 3 is a voice feature parameter comparison unit, 5 is a microphone, 6 is an A/D conversion unit, 7 is a processor, 8 is a display unit, 9 is a voice synthesis unit, 11 is the speaker, Tsumeda Tagawa's big play
Furohei 2 Kuchiju 4-9's Go-q Month) Sen 9 1 vs. niece's FQ So 2 Thirst
3 Ri
Claims (1)
(1)にて抽出した音声特徴パラメータを、既にメモリ
(2)に格納登録済の単語の音声特徴パラメータと、音
声特徴パラメータ比較部(3)にて比較し、類似度の近
いものがあれば、類似した語との違いを強調して発声し
て貰うか、又は言い方の異なる同じ意味を持つ単語を発
して貰い、再度登録を行うようにしたことを特徴とする
単語登録方法。[Claims] When registering words of a specific speaker for word speech recognition, the speech feature parameters extracted by the speech feature parameter extractor (1) of the words uttered for registration are already stored in memory. The voice feature parameters of the words stored and registered in (2) are compared in the voice feature parameter comparison section (3), and if there are words with a similar degree of similarity, the words are uttered while emphasizing the differences from similar words. A word registration method characterized in that the word registration is performed again after receiving the word or having the word uttered in a different way but having the same meaning.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61214366A JPS6370296A (en) | 1986-09-11 | 1986-09-11 | Word registration |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61214366A JPS6370296A (en) | 1986-09-11 | 1986-09-11 | Word registration |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS6370296A true JPS6370296A (en) | 1988-03-30 |
Family
ID=16654596
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61214366A Pending JPS6370296A (en) | 1986-09-11 | 1986-09-11 | Word registration |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6370296A (en) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60169900A (en) * | 1984-02-13 | 1985-09-03 | 富士通株式会社 | Word registration system |
JPS60218698A (en) * | 1984-04-16 | 1985-11-01 | 日本電気株式会社 | Voice recognition equipment |
-
1986
- 1986-09-11 JP JP61214366A patent/JPS6370296A/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60169900A (en) * | 1984-02-13 | 1985-09-03 | 富士通株式会社 | Word registration system |
JPS60218698A (en) * | 1984-04-16 | 1985-11-01 | 日本電気株式会社 | Voice recognition equipment |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4085924B2 (en) | Audio processing device | |
JPH0361959B2 (en) | ||
JPH096390A (en) | Voice recognition interactive processing method and processor therefor | |
JPS6370296A (en) | Word registration | |
JPH0225517B2 (en) | ||
JPH04324499A (en) | Speech recognition device | |
JP2989231B2 (en) | Voice recognition device | |
JP2003099094A (en) | Voice processing device | |
JP2975808B2 (en) | Voice recognition device | |
JPH0461359B2 (en) | ||
JPS61180297A (en) | Speaker collator | |
JP2002372982A (en) | Method and device for analyzing acoustic signal | |
JPS6126678B2 (en) | ||
JP2004004182A (en) | Device, method and program of voice recognition | |
JP3002211B2 (en) | Unspecified speaker speech recognition device | |
JPS62113197A (en) | Voice recognition equipment | |
JPH0316038B2 (en) | ||
JPS59114600A (en) | Speaker identification system | |
JPS6364100A (en) | Voice recognition equipment | |
JPS59147397A (en) | Voice recognition control system | |
JPS6120094A (en) | Voice recognition/synthesization equipment | |
JPS58176699A (en) | Voice standard pattern registration system | |
JP2005148764A (en) | Method and device for speech recognition interaction | |
JPH05134697A (en) | Voice recognizing system | |
JPH03155599A (en) | Speech recognition device |