JPH03155599A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH03155599A
JPH03155599A JP1295801A JP29580189A JPH03155599A JP H03155599 A JPH03155599 A JP H03155599A JP 1295801 A JP1295801 A JP 1295801A JP 29580189 A JP29580189 A JP 29580189A JP H03155599 A JPH03155599 A JP H03155599A
Authority
JP
Japan
Prior art keywords
pattern
input
speech
patterns
standard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1295801A
Other languages
English (en)
Inventor
Keiko Shimada
島田 桂子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP1295801A priority Critical patent/JPH03155599A/ja
Priority to CA002029676A priority patent/CA2029676C/en
Priority to AU66599/90A priority patent/AU637427B2/en
Priority to DE69026795T priority patent/DE69026795T2/de
Priority to EP90312355A priority patent/EP0429233B1/en
Publication of JPH03155599A publication Critical patent/JPH03155599A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は音声パターンの比較により音声を認識する音声
認識装置に関し、特に特定話者用の音声認識装置に関す
る。
〔従来の技術〕
かかる音声認識装置はパターンマツチング法に基づくの
が通例であり、あらかじめ使用者が自分の音声を登録し
ておく必要がある。
〔発明が解決しようとする課題〕
上述した従来の音声認識装置では、音声を1度だけ入力
し、その音声パターンを音声標準パターンとして登録す
る方式をとっているので、発声者の不必要な音声や周囲
のノイズなどを音声標準パターンとして登録してしまう
場合があり、音声認識を実行したときに誤った認識結果
が出力されてしまったり、認識結果が出力されずに、結
局認識率が下がるという欠点がある。
〔課題を解決するための手段〕
本発明の音声認識装置は、音声信号を符号化して音声パ
ターンを出力する分析処理部と、この分析処理部が出力
した前記音声パターンを一時記憶する入力パターンバッ
ファと、複数の音声標準パターンを記憶する標準パター
ン記憶部と、この標準パターン記憶部から入力した前記
音声標準パターンのそれぞれと前記入力パターンバッフ
ァから入力した前記音声パターンとの間の相違度を算出
するパターン比較部と、このパターン比較部の比較結果
に基づいて前記相違度が最少となる前記音声標準パター
ンを決定し決定結果を出力する認識判定部とを備える特
定話者用の音声認識装置において、前記音声標準パター
ンの1つを得るべく順次入力した2つの候補音声信号か
ら得た2つの候補音声パターンの間の相違度である候補
間相違度があらかじめ定めた値より小さいか否かを判定
し小さいとき前記2つの候補音声パターンのいずれか一
方を前記音声標準パターンとして前記標準パターン記憶
部に記憶させる登録判定部を含んでいる。
又、本発明の音声認識装置は、前記2つの候補音声信号
を前記分析処理部に入力して前記2つの候補音声パター
ンを得てもよい。
更に、本発明の音声認識装置は、前記2つの候補音声パ
ターンを前記入力パターンバッファ及び前記標準パター
ン記憶部に1つずつ一時記憶させてもよい。
更に又、本発明の音声認識装置は、前記2つの候補音声
パターンを前記パターン比較部に入力して前記候補間相
違度を得てもよい。
〔実施例〕
次に、本発明について図面を参照して説明する。
第1図は本発明の一実施例を示すブロック図である。
マイクロホン10より入力された音声信号Sは分析処理
部20によって分析処理される。この分析処理部20は
、例えば、バンドパスフィルタ分析機能を有し、入力音
声信号Sは16m5の分析フレーム周期で時間標本化が
行われ、かつ、ディジタル信号に符号化される。このよ
うにして得られる入力音声パターンはベクトル時系列と
して表現することができる。
本実施例の動作は登録と認識の2種のモードに分けられ
る。
登録モードでは、スイッチ30はまず端子31に接続さ
れ、スイッチ70は端子71に接続される。最初に入力
される音声信号は分析処理部20で分析されて音声パタ
ーンとなった後、標準パターン記憶部40に入力される
。この音声パターンをAと呼ぶ。次の発声の時はスイッ
チ30は端子32に接続され、得られた音声パターンは
入力パターンバッファ50に入力される。この音声パタ
ーンをBと呼ぶ。
標準パターン記憶部40に入力された音声パターンAと
入力パターンバッファ50に入力された音声パターンB
はパターン比較部60で相違度D(A、B)が算出され
る。この相違度D (A。
B)は登録判定部80に送られる。
登録判定部80はあらかじめ設定された登録リジェクト
値を持っている。登録リジェクト値とは、算出された相
違度がそれより高い場合には入力を却下する基準値であ
る。登録判定部80では相違度D (A、B)と登録リ
ジェクト値を比較し、相違度D (A、B)が登録リジ
ェクト値より小さい場合は、入力パターンバッファ50
の音声パターンBを標準パターンであると認定する。音
声パターンBは標準パターンとして標準パターン記憶部
40に登録される。
相違度D (A、B)が登録リジェクト値より大きい場
合は、標準パターン記憶部40に入力されている音声パ
ターンAは不正なパターンとして却下され、新たに音声
を発声するよう使用者に要求する。入力パターンバッフ
ァ50の音声パターンBは標準パターン記憶部40に移
される。そして、新しく入力された音声信号の音声パタ
ーンCが入力パターンバッファ50に入力され、音声パ
ターンBとCの間で登録処理が行われる。
以上の一連の登録操作により標準パターンが決定され、
標準パターン記憶部40に記憶される。
したがって、不必要な音声や周囲のノイズなどのパター
ンは却下され、不正な標準パターンは大幅に低減できる
認識モードにおいては、スイッチ30は端子32に接続
されスイッチ70は端子72に接続される。入力される
音声信号の音声パターンは入力パターンバッファ50に
入力され保持される。このパターンを入カバターンaと
呼び、標準パターン記憶部40に記憶されている全ての
音声パターンを標準パターンB”;n=o、1、・・・
Nと呼ぶことにする。パターン比較部60では、入カバ
ターンaと標準パターンBとの間で比較操作が行われ、
相違度D (a、B” ); n=o、1 、・Nが算
出され、認識判定部90に送られる。認識判定部90で
は相違度の値が相互に比較され、最小のものが決定され
出力される。
〔発明の効果〕
以上説明したように本発明は、標準パターンの登録にお
いて2つの音声パターンを入力し、その相違度を算出し
て標準パターンとして適当かどうかを判定することによ
り、不必要な音声やノイズなどが標準パターンとして登
録されることを防ぐことができ、その結果、誤認識を低
減することができるという効果があり、又、標準パター
ンとして適当かどうかを判定するために必要な2つの音
声パターン−時記憶手段や相違度算出手段として音声認
識装置がもともと備えている入カバッファ、標準パター
ン記憶部、パターン比較部を共用することができるので
、従来装置にわずかな機能を付加するだけで経済的に実
現できる効果がある。
【図面の簡単な説明】
第1図は本発明の一実施例のブロック図である。 10・・・マイクロホン、20・・・分析処理部、30
゜70・・・スイッチ、31,32.71.72・・・
端子、40・・・標準パターン記憶部、50・・・入力
パターンバッファ、60・・・パターン比較部、80・
・・登録判定部、90・・・認識判定部。

Claims (1)

  1. 【特許請求の範囲】 1、音声信号を符号化して音声パターンを出力する分析
    処理部と、この分析処理部が出力した前記音声パターン
    を一時記憶する入力パターンバッファと、複数の音声標
    準パターンを記憶する標準パターン記憶部と、この標準
    パターン記憶部から入力した前記音声標準パターンのそ
    れぞれと前記入力パターンバッファから入力した前記音
    声パターンとの間の相違度を算出するパターン比較部と
    、このパターン比較部の比較結果に基づいて前記相違度
    が最少となる前記音声標準パターンを決定し決定結果を
    出力する認識判定部とを備える特定話者用の音声認識装
    置において、前記音声標準パターンの1つを得るべく順
    次入力した2つの候補音声信号から得た2つの候補音声
    パターンの間の相違度である候補間相違度があらかじめ
    定めた値より小さいか否かを判定し小さいとき前記2つ
    の候補音声パターンのいずれか一方を前記音声標準パタ
    ーンとして前記標準パターン記憶部に記憶させる登録判
    定部を含むことを特徴とする音声認識装置。 2、前記2つの候補音声信号を前記分析処理部に入力し
    て前記2つの候補音声パターンを得ることを特徴とする
    請求項1記載の音声認識装置。 3、前記2つの候補音声パターンを前記入力パターンバ
    ッファ及び前記標準パターン記憶部に1つずつ一時記憶
    させることを特徴とする請求項1又は2記載の音声認識
    装置。 4、前記2つの候補音声パターンを前記パターン比較部
    に入力して前記候補間相違度を得ることを特徴とする請
    求項1、2又は3記載の音声認識装置。
JP1295801A 1989-11-13 1989-11-13 音声認識装置 Pending JPH03155599A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP1295801A JPH03155599A (ja) 1989-11-13 1989-11-13 音声認識装置
CA002029676A CA2029676C (en) 1989-11-13 1990-11-09 Speech recognition system having speech registration function based on two utterances of a word
AU66599/90A AU637427B2 (en) 1989-11-13 1990-11-13 Speech recognition system having speech registration function based on twice utterance of word
DE69026795T DE69026795T2 (de) 1989-11-13 1990-11-13 Spracherkennungssystem mit Spracheintragungsfunktion, die auf zwei Äusserungen von jedem Wort basiert ist
EP90312355A EP0429233B1 (en) 1989-11-13 1990-11-13 Speech recognition system having speech registration function based on twice utterance of word

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1295801A JPH03155599A (ja) 1989-11-13 1989-11-13 音声認識装置

Publications (1)

Publication Number Publication Date
JPH03155599A true JPH03155599A (ja) 1991-07-03

Family

ID=17825342

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1295801A Pending JPH03155599A (ja) 1989-11-13 1989-11-13 音声認識装置

Country Status (5)

Country Link
EP (1) EP0429233B1 (ja)
JP (1) JPH03155599A (ja)
AU (1) AU637427B2 (ja)
CA (1) CA2029676C (ja)
DE (1) DE69026795T2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6012027A (en) * 1997-05-27 2000-01-04 Ameritech Corporation Criteria for usable repetitions of an utterance during speech reference enrollment
WO2007111197A1 (ja) * 2006-03-24 2007-10-04 Pioneer Corporation 話者認識システムにおける話者モデル登録装置及び方法、並びにコンピュータプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57102699A (en) * 1980-12-18 1982-06-25 Matsushita Electric Ind Co Ltd Voice recognizer
JPS59155900A (ja) * 1983-02-25 1984-09-05 松下電器産業株式会社 音声認識装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4297528A (en) * 1979-09-10 1981-10-27 Interstate Electronics Corp. Training circuit for audio signal recognition computer
JPS58178396A (ja) * 1982-04-12 1983-10-19 株式会社日立製作所 音声認識用標準パタ−ン登録方式
JPS6024597A (ja) * 1983-07-21 1985-02-07 日本電気株式会社 音声登録方式
JP2545914B2 (ja) * 1988-02-09 1996-10-23 日本電気株式会社 音声認識方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57102699A (en) * 1980-12-18 1982-06-25 Matsushita Electric Ind Co Ltd Voice recognizer
JPS59155900A (ja) * 1983-02-25 1984-09-05 松下電器産業株式会社 音声認識装置

Also Published As

Publication number Publication date
EP0429233A3 (en) 1991-12-18
DE69026795T2 (de) 1996-12-19
CA2029676A1 (en) 1991-05-14
CA2029676C (en) 1996-01-23
EP0429233B1 (en) 1996-05-01
AU637427B2 (en) 1993-05-27
AU6659990A (en) 1991-05-16
EP0429233A2 (en) 1991-05-29
DE69026795D1 (de) 1996-06-05

Similar Documents

Publication Publication Date Title
ES2286014T3 (es) Esquema de rechazo de reconocimiento de voz.
US5159637A (en) Speech word recognizing apparatus using information indicative of the relative significance of speech features
JPH03155599A (ja) 音声認識装置
JPS6332394B2 (ja)
JPH0225517B2 (ja)
JP3114757B2 (ja) 音声認識装置
JPH01321499A (ja) 音声認識装置
JP2834880B2 (ja) 音声認識装置
JP2989231B2 (ja) 音声認識装置
JPH04324499A (ja) 音声認識装置
JPH01222299A (ja) 音声認識装置
JPS6361300A (ja) 音声認識方式
JPS5876892A (ja) 音声認識装置
JPH0481898A (ja) 音声認識装置
JP2658104B2 (ja) 音声認識装置
JPH03200298A (ja) 音声制御装置
JPH01293397A (ja) 音声応答方式
JPH06250687A (ja) 不特定話者用音声認識装置
KR19980045013A (ko) 암호 입력을 통한 화자 인식기의 성능 개선 방법
JPH0431896A (ja) 音声認識装置
JPH0316038B2 (ja)
JPH02272495A (ja) 音声認識装置
JP2000250594A (ja) 話者認識装置
JPH05313692A (ja) 音声認識装置
JPH06318098A (ja) 話者認識装置