JPH03155599A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPH03155599A JPH03155599A JP1295801A JP29580189A JPH03155599A JP H03155599 A JPH03155599 A JP H03155599A JP 1295801 A JP1295801 A JP 1295801A JP 29580189 A JP29580189 A JP 29580189A JP H03155599 A JPH03155599 A JP H03155599A
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- input
- speech
- patterns
- standard
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 7
- 238000004458 analytical method Methods 0.000 claims description 12
- 230000002093 peripheral effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000000034 method Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は音声パターンの比較により音声を認識する音声
認識装置に関し、特に特定話者用の音声認識装置に関す
る。
認識装置に関し、特に特定話者用の音声認識装置に関す
る。
かかる音声認識装置はパターンマツチング法に基づくの
が通例であり、あらかじめ使用者が自分の音声を登録し
ておく必要がある。
が通例であり、あらかじめ使用者が自分の音声を登録し
ておく必要がある。
上述した従来の音声認識装置では、音声を1度だけ入力
し、その音声パターンを音声標準パターンとして登録す
る方式をとっているので、発声者の不必要な音声や周囲
のノイズなどを音声標準パターンとして登録してしまう
場合があり、音声認識を実行したときに誤った認識結果
が出力されてしまったり、認識結果が出力されずに、結
局認識率が下がるという欠点がある。
し、その音声パターンを音声標準パターンとして登録す
る方式をとっているので、発声者の不必要な音声や周囲
のノイズなどを音声標準パターンとして登録してしまう
場合があり、音声認識を実行したときに誤った認識結果
が出力されてしまったり、認識結果が出力されずに、結
局認識率が下がるという欠点がある。
本発明の音声認識装置は、音声信号を符号化して音声パ
ターンを出力する分析処理部と、この分析処理部が出力
した前記音声パターンを一時記憶する入力パターンバッ
ファと、複数の音声標準パターンを記憶する標準パター
ン記憶部と、この標準パターン記憶部から入力した前記
音声標準パターンのそれぞれと前記入力パターンバッフ
ァから入力した前記音声パターンとの間の相違度を算出
するパターン比較部と、このパターン比較部の比較結果
に基づいて前記相違度が最少となる前記音声標準パター
ンを決定し決定結果を出力する認識判定部とを備える特
定話者用の音声認識装置において、前記音声標準パター
ンの1つを得るべく順次入力した2つの候補音声信号か
ら得た2つの候補音声パターンの間の相違度である候補
間相違度があらかじめ定めた値より小さいか否かを判定
し小さいとき前記2つの候補音声パターンのいずれか一
方を前記音声標準パターンとして前記標準パターン記憶
部に記憶させる登録判定部を含んでいる。
ターンを出力する分析処理部と、この分析処理部が出力
した前記音声パターンを一時記憶する入力パターンバッ
ファと、複数の音声標準パターンを記憶する標準パター
ン記憶部と、この標準パターン記憶部から入力した前記
音声標準パターンのそれぞれと前記入力パターンバッフ
ァから入力した前記音声パターンとの間の相違度を算出
するパターン比較部と、このパターン比較部の比較結果
に基づいて前記相違度が最少となる前記音声標準パター
ンを決定し決定結果を出力する認識判定部とを備える特
定話者用の音声認識装置において、前記音声標準パター
ンの1つを得るべく順次入力した2つの候補音声信号か
ら得た2つの候補音声パターンの間の相違度である候補
間相違度があらかじめ定めた値より小さいか否かを判定
し小さいとき前記2つの候補音声パターンのいずれか一
方を前記音声標準パターンとして前記標準パターン記憶
部に記憶させる登録判定部を含んでいる。
又、本発明の音声認識装置は、前記2つの候補音声信号
を前記分析処理部に入力して前記2つの候補音声パター
ンを得てもよい。
を前記分析処理部に入力して前記2つの候補音声パター
ンを得てもよい。
更に、本発明の音声認識装置は、前記2つの候補音声パ
ターンを前記入力パターンバッファ及び前記標準パター
ン記憶部に1つずつ一時記憶させてもよい。
ターンを前記入力パターンバッファ及び前記標準パター
ン記憶部に1つずつ一時記憶させてもよい。
更に又、本発明の音声認識装置は、前記2つの候補音声
パターンを前記パターン比較部に入力して前記候補間相
違度を得てもよい。
パターンを前記パターン比較部に入力して前記候補間相
違度を得てもよい。
次に、本発明について図面を参照して説明する。
第1図は本発明の一実施例を示すブロック図である。
マイクロホン10より入力された音声信号Sは分析処理
部20によって分析処理される。この分析処理部20は
、例えば、バンドパスフィルタ分析機能を有し、入力音
声信号Sは16m5の分析フレーム周期で時間標本化が
行われ、かつ、ディジタル信号に符号化される。このよ
うにして得られる入力音声パターンはベクトル時系列と
して表現することができる。
部20によって分析処理される。この分析処理部20は
、例えば、バンドパスフィルタ分析機能を有し、入力音
声信号Sは16m5の分析フレーム周期で時間標本化が
行われ、かつ、ディジタル信号に符号化される。このよ
うにして得られる入力音声パターンはベクトル時系列と
して表現することができる。
本実施例の動作は登録と認識の2種のモードに分けられ
る。
る。
登録モードでは、スイッチ30はまず端子31に接続さ
れ、スイッチ70は端子71に接続される。最初に入力
される音声信号は分析処理部20で分析されて音声パタ
ーンとなった後、標準パターン記憶部40に入力される
。この音声パターンをAと呼ぶ。次の発声の時はスイッ
チ30は端子32に接続され、得られた音声パターンは
入力パターンバッファ50に入力される。この音声パタ
ーンをBと呼ぶ。
れ、スイッチ70は端子71に接続される。最初に入力
される音声信号は分析処理部20で分析されて音声パタ
ーンとなった後、標準パターン記憶部40に入力される
。この音声パターンをAと呼ぶ。次の発声の時はスイッ
チ30は端子32に接続され、得られた音声パターンは
入力パターンバッファ50に入力される。この音声パタ
ーンをBと呼ぶ。
標準パターン記憶部40に入力された音声パターンAと
入力パターンバッファ50に入力された音声パターンB
はパターン比較部60で相違度D(A、B)が算出され
る。この相違度D (A。
入力パターンバッファ50に入力された音声パターンB
はパターン比較部60で相違度D(A、B)が算出され
る。この相違度D (A。
B)は登録判定部80に送られる。
登録判定部80はあらかじめ設定された登録リジェクト
値を持っている。登録リジェクト値とは、算出された相
違度がそれより高い場合には入力を却下する基準値であ
る。登録判定部80では相違度D (A、B)と登録リ
ジェクト値を比較し、相違度D (A、B)が登録リジ
ェクト値より小さい場合は、入力パターンバッファ50
の音声パターンBを標準パターンであると認定する。音
声パターンBは標準パターンとして標準パターン記憶部
40に登録される。
値を持っている。登録リジェクト値とは、算出された相
違度がそれより高い場合には入力を却下する基準値であ
る。登録判定部80では相違度D (A、B)と登録リ
ジェクト値を比較し、相違度D (A、B)が登録リジ
ェクト値より小さい場合は、入力パターンバッファ50
の音声パターンBを標準パターンであると認定する。音
声パターンBは標準パターンとして標準パターン記憶部
40に登録される。
相違度D (A、B)が登録リジェクト値より大きい場
合は、標準パターン記憶部40に入力されている音声パ
ターンAは不正なパターンとして却下され、新たに音声
を発声するよう使用者に要求する。入力パターンバッフ
ァ50の音声パターンBは標準パターン記憶部40に移
される。そして、新しく入力された音声信号の音声パタ
ーンCが入力パターンバッファ50に入力され、音声パ
ターンBとCの間で登録処理が行われる。
合は、標準パターン記憶部40に入力されている音声パ
ターンAは不正なパターンとして却下され、新たに音声
を発声するよう使用者に要求する。入力パターンバッフ
ァ50の音声パターンBは標準パターン記憶部40に移
される。そして、新しく入力された音声信号の音声パタ
ーンCが入力パターンバッファ50に入力され、音声パ
ターンBとCの間で登録処理が行われる。
以上の一連の登録操作により標準パターンが決定され、
標準パターン記憶部40に記憶される。
標準パターン記憶部40に記憶される。
したがって、不必要な音声や周囲のノイズなどのパター
ンは却下され、不正な標準パターンは大幅に低減できる
。
ンは却下され、不正な標準パターンは大幅に低減できる
。
認識モードにおいては、スイッチ30は端子32に接続
されスイッチ70は端子72に接続される。入力される
音声信号の音声パターンは入力パターンバッファ50に
入力され保持される。このパターンを入カバターンaと
呼び、標準パターン記憶部40に記憶されている全ての
音声パターンを標準パターンB”;n=o、1、・・・
Nと呼ぶことにする。パターン比較部60では、入カバ
ターンaと標準パターンBとの間で比較操作が行われ、
相違度D (a、B” ); n=o、1 、・Nが算
出され、認識判定部90に送られる。認識判定部90で
は相違度の値が相互に比較され、最小のものが決定され
出力される。
されスイッチ70は端子72に接続される。入力される
音声信号の音声パターンは入力パターンバッファ50に
入力され保持される。このパターンを入カバターンaと
呼び、標準パターン記憶部40に記憶されている全ての
音声パターンを標準パターンB”;n=o、1、・・・
Nと呼ぶことにする。パターン比較部60では、入カバ
ターンaと標準パターンBとの間で比較操作が行われ、
相違度D (a、B” ); n=o、1 、・Nが算
出され、認識判定部90に送られる。認識判定部90で
は相違度の値が相互に比較され、最小のものが決定され
出力される。
以上説明したように本発明は、標準パターンの登録にお
いて2つの音声パターンを入力し、その相違度を算出し
て標準パターンとして適当かどうかを判定することによ
り、不必要な音声やノイズなどが標準パターンとして登
録されることを防ぐことができ、その結果、誤認識を低
減することができるという効果があり、又、標準パター
ンとして適当かどうかを判定するために必要な2つの音
声パターン−時記憶手段や相違度算出手段として音声認
識装置がもともと備えている入カバッファ、標準パター
ン記憶部、パターン比較部を共用することができるので
、従来装置にわずかな機能を付加するだけで経済的に実
現できる効果がある。
いて2つの音声パターンを入力し、その相違度を算出し
て標準パターンとして適当かどうかを判定することによ
り、不必要な音声やノイズなどが標準パターンとして登
録されることを防ぐことができ、その結果、誤認識を低
減することができるという効果があり、又、標準パター
ンとして適当かどうかを判定するために必要な2つの音
声パターン−時記憶手段や相違度算出手段として音声認
識装置がもともと備えている入カバッファ、標準パター
ン記憶部、パターン比較部を共用することができるので
、従来装置にわずかな機能を付加するだけで経済的に実
現できる効果がある。
第1図は本発明の一実施例のブロック図である。
10・・・マイクロホン、20・・・分析処理部、30
゜70・・・スイッチ、31,32.71.72・・・
端子、40・・・標準パターン記憶部、50・・・入力
パターンバッファ、60・・・パターン比較部、80・
・・登録判定部、90・・・認識判定部。
゜70・・・スイッチ、31,32.71.72・・・
端子、40・・・標準パターン記憶部、50・・・入力
パターンバッファ、60・・・パターン比較部、80・
・・登録判定部、90・・・認識判定部。
Claims (1)
- 【特許請求の範囲】 1、音声信号を符号化して音声パターンを出力する分析
処理部と、この分析処理部が出力した前記音声パターン
を一時記憶する入力パターンバッファと、複数の音声標
準パターンを記憶する標準パターン記憶部と、この標準
パターン記憶部から入力した前記音声標準パターンのそ
れぞれと前記入力パターンバッファから入力した前記音
声パターンとの間の相違度を算出するパターン比較部と
、このパターン比較部の比較結果に基づいて前記相違度
が最少となる前記音声標準パターンを決定し決定結果を
出力する認識判定部とを備える特定話者用の音声認識装
置において、前記音声標準パターンの1つを得るべく順
次入力した2つの候補音声信号から得た2つの候補音声
パターンの間の相違度である候補間相違度があらかじめ
定めた値より小さいか否かを判定し小さいとき前記2つ
の候補音声パターンのいずれか一方を前記音声標準パタ
ーンとして前記標準パターン記憶部に記憶させる登録判
定部を含むことを特徴とする音声認識装置。 2、前記2つの候補音声信号を前記分析処理部に入力し
て前記2つの候補音声パターンを得ることを特徴とする
請求項1記載の音声認識装置。 3、前記2つの候補音声パターンを前記入力パターンバ
ッファ及び前記標準パターン記憶部に1つずつ一時記憶
させることを特徴とする請求項1又は2記載の音声認識
装置。 4、前記2つの候補音声パターンを前記パターン比較部
に入力して前記候補間相違度を得ることを特徴とする請
求項1、2又は3記載の音声認識装置。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1295801A JPH03155599A (ja) | 1989-11-13 | 1989-11-13 | 音声認識装置 |
CA002029676A CA2029676C (en) | 1989-11-13 | 1990-11-09 | Speech recognition system having speech registration function based on two utterances of a word |
AU66599/90A AU637427B2 (en) | 1989-11-13 | 1990-11-13 | Speech recognition system having speech registration function based on twice utterance of word |
DE69026795T DE69026795T2 (de) | 1989-11-13 | 1990-11-13 | Spracherkennungssystem mit Spracheintragungsfunktion, die auf zwei Äusserungen von jedem Wort basiert ist |
EP90312355A EP0429233B1 (en) | 1989-11-13 | 1990-11-13 | Speech recognition system having speech registration function based on twice utterance of word |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1295801A JPH03155599A (ja) | 1989-11-13 | 1989-11-13 | 音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH03155599A true JPH03155599A (ja) | 1991-07-03 |
Family
ID=17825342
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1295801A Pending JPH03155599A (ja) | 1989-11-13 | 1989-11-13 | 音声認識装置 |
Country Status (5)
Country | Link |
---|---|
EP (1) | EP0429233B1 (ja) |
JP (1) | JPH03155599A (ja) |
AU (1) | AU637427B2 (ja) |
CA (1) | CA2029676C (ja) |
DE (1) | DE69026795T2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6012027A (en) * | 1997-05-27 | 2000-01-04 | Ameritech Corporation | Criteria for usable repetitions of an utterance during speech reference enrollment |
WO2007111197A1 (ja) * | 2006-03-24 | 2007-10-04 | Pioneer Corporation | 話者認識システムにおける話者モデル登録装置及び方法、並びにコンピュータプログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57102699A (en) * | 1980-12-18 | 1982-06-25 | Matsushita Electric Ind Co Ltd | Voice recognizer |
JPS59155900A (ja) * | 1983-02-25 | 1984-09-05 | 松下電器産業株式会社 | 音声認識装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4297528A (en) * | 1979-09-10 | 1981-10-27 | Interstate Electronics Corp. | Training circuit for audio signal recognition computer |
JPS58178396A (ja) * | 1982-04-12 | 1983-10-19 | 株式会社日立製作所 | 音声認識用標準パタ−ン登録方式 |
JPS6024597A (ja) * | 1983-07-21 | 1985-02-07 | 日本電気株式会社 | 音声登録方式 |
JP2545914B2 (ja) * | 1988-02-09 | 1996-10-23 | 日本電気株式会社 | 音声認識方法 |
-
1989
- 1989-11-13 JP JP1295801A patent/JPH03155599A/ja active Pending
-
1990
- 1990-11-09 CA CA002029676A patent/CA2029676C/en not_active Expired - Fee Related
- 1990-11-13 EP EP90312355A patent/EP0429233B1/en not_active Expired - Lifetime
- 1990-11-13 AU AU66599/90A patent/AU637427B2/en not_active Ceased
- 1990-11-13 DE DE69026795T patent/DE69026795T2/de not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57102699A (en) * | 1980-12-18 | 1982-06-25 | Matsushita Electric Ind Co Ltd | Voice recognizer |
JPS59155900A (ja) * | 1983-02-25 | 1984-09-05 | 松下電器産業株式会社 | 音声認識装置 |
Also Published As
Publication number | Publication date |
---|---|
EP0429233A3 (en) | 1991-12-18 |
DE69026795T2 (de) | 1996-12-19 |
CA2029676A1 (en) | 1991-05-14 |
CA2029676C (en) | 1996-01-23 |
EP0429233B1 (en) | 1996-05-01 |
AU637427B2 (en) | 1993-05-27 |
AU6659990A (en) | 1991-05-16 |
EP0429233A2 (en) | 1991-05-29 |
DE69026795D1 (de) | 1996-06-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2286014T3 (es) | Esquema de rechazo de reconocimiento de voz. | |
US5159637A (en) | Speech word recognizing apparatus using information indicative of the relative significance of speech features | |
JPH03155599A (ja) | 音声認識装置 | |
JPS6332394B2 (ja) | ||
JPH0225517B2 (ja) | ||
JP3114757B2 (ja) | 音声認識装置 | |
JPH01321499A (ja) | 音声認識装置 | |
JP2834880B2 (ja) | 音声認識装置 | |
JP2989231B2 (ja) | 音声認識装置 | |
JPH04324499A (ja) | 音声認識装置 | |
JPH01222299A (ja) | 音声認識装置 | |
JPS6361300A (ja) | 音声認識方式 | |
JPS5876892A (ja) | 音声認識装置 | |
JPH0481898A (ja) | 音声認識装置 | |
JP2658104B2 (ja) | 音声認識装置 | |
JPH03200298A (ja) | 音声制御装置 | |
JPH01293397A (ja) | 音声応答方式 | |
JPH06250687A (ja) | 不特定話者用音声認識装置 | |
KR19980045013A (ko) | 암호 입력을 통한 화자 인식기의 성능 개선 방법 | |
JPH0431896A (ja) | 音声認識装置 | |
JPH0316038B2 (ja) | ||
JPH02272495A (ja) | 音声認識装置 | |
JP2000250594A (ja) | 話者認識装置 | |
JPH05313692A (ja) | 音声認識装置 | |
JPH06318098A (ja) | 話者認識装置 |