JP2834880B2 - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JP2834880B2
JP2834880B2 JP2278394A JP27839490A JP2834880B2 JP 2834880 B2 JP2834880 B2 JP 2834880B2 JP 2278394 A JP2278394 A JP 2278394A JP 27839490 A JP27839490 A JP 27839490A JP 2834880 B2 JP2834880 B2 JP 2834880B2
Authority
JP
Japan
Prior art keywords
voice
similarity
speech recognition
recognition
determination unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2278394A
Other languages
English (en)
Other versions
JPH04152397A (ja
Inventor
真一 鶴藤
宏樹 大西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Denki Co Ltd
Original Assignee
Sanyo Denki Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Denki Co Ltd filed Critical Sanyo Denki Co Ltd
Priority to JP2278394A priority Critical patent/JP2834880B2/ja
Publication of JPH04152397A publication Critical patent/JPH04152397A/ja
Application granted granted Critical
Publication of JP2834880B2 publication Critical patent/JP2834880B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
(イ)産業上の利用分野 音声によって、各種機器を制御する音声認識装置に関
する。 (ロ)従来の技術 近年、音声を認識できる音声認識装置の研究開発が盛
んに行われており、この種装置の実用化が望まれてい
る。 この種装置は、一般には、音声を分析して得られる音
声の特徴を表すパラメータからなる音声パタンをデータ
処理するものであり、あらかじめ複数の音声について貯
えられた音声パタン(標準音声パタン)のそれぞれを未
知の音声パタンとパタンマッチングの手法によって比較
し、最も誤差の小さい(即ち、類似度の大きい)標準パ
タンを見出すことで、この標準パタンに対応した信号が
認識結果として出力されるものである。 このような音声認識手法に於ては、入力音声と最も類
似する標準音声を見出しても、これとの類似度が極めて
小さい時は、誤認識である可能性が高いので、これを防
止するために、この最大類似度が一定の閾値を越えなけ
れば、認識棄却(以後リジェクトという)にするのが一
般的である。 (ハ)発明が解決しようとする課題 上述の如くリジェクト機能を備えた従来の音声認識装
置に於ては、その閾値を固定して設定していたので、閾
値が厳し過ぎる場合には、認識対象になっている音声を
入力しているのに、発声の微妙な曖昧要素によって認識
結果が得られない場合が多発する不都合がある。また、
逆にこの閾値を甘くすると音声以外の雑音でもこれに最
も近い認識対象の音声であると誤認識してしまう不都合
がある。 このように、音声認識装置に於ては、如何に閾値の設
定するかが、重要課題であった。 本発明は、このような従来からの課題を解決するため
になされたものであり、リジェクトの状況に応じて閾値
をダイナミックに設定できる音声認識装置を提供するも
のである。 (ニ)課題を解決するための手段 本発明の音声認識装置は、音声を入力するマイクとマ
イクから入力された音声を分析する音声分析部、音声分
析部で分析された分析結果を音声パタンに変換するパタ
ン作成部、あらかじめ複数の音声パタンを標準音声パタ
ンとして貯えている標準パタンメモリ、標準パタンメモ
リの複数の各標準パタンの夫々と上記パタン作成部で作
成された入力音声の音声パタンを比較してその類似度を
計算し、最も大きい類似度を示す標準パタンを選択する
類似度計算部、類似度計算部で選択した標準パタンの最
大類似度があらかじめ設定されている閾値より大きい
時、この時の選択標準パタンに対応する信号を認識結果
として出力し、該最大類似度が閾値よりも小さいとき、
認識棄却と判定する判定部を具備した音声認識装置であ
って、 その特徴とするところは、上記判定部で認識棄却と判
定された場合には、その時の選択標準パタンに対応する
信号を認識棄却結果として貯え、認識棄却された前回の
音声入力と同一の認識棄却結果が得られる場合には、上
記判定部に設定されている閾値を甘く(小さく)設定す
ることにあり、 また、その特徴とするところは、上記類似度計算部か
ら得られた選択標準パタンが示す信号と認識棄却された
前回の音声入力時の認識棄却結果とが一致する場合に
は、上記判定部は、前回の音声入力時より甘い(小さ
い)閾値を用いて、この時の音声入力に対する判定を行
うことにある。 (ホ)作用 本発明の音声認識装置に於ては、あらかじめ閾値を厳
しく設定しておき、誤認識を防止を図りながら、この閾
値でリジェクトになった入力音声の再入力時に、閾値を
所定量甘くしてやることで、正しい認識結果を得ること
ができる。 (ヘ)実施例 第2図に本発明の音声認識装置の構成を示し、その要
部の判定部の一実施例の構成を第1図に示す。 第2図に於て、(21)は音声を入力するマイク、(2
2)はマイクから入力された音声を分析する音声分析
部、(23)は音声分析部で分析された分析結果を音声パ
タンに変換するパタン作成部、(25)あらかじめ複数の
音声パタンを標準音声パタンとして貯えている標準パタ
ンメモリ、(24)は標準パタンメモリの複数の各標準パ
タンの夫々と上記パタン作成部で作成された入力音声の
音声パタンを比較してその類似度を計算し、最も大きい
類似度を示す標準パタンを選択する類似度計算部、(2
6)は類似度計算部で選択した標準パタンの最大類似度
があらかじめ設定されている閾値よりも大きい時、この
時の選択標準パタンに対応する信号を認識結果として出
力し、該最大類似度が閾値よりも小さいとき、認識棄却
と判定する判定部である。 このような第2図の音声認識装置に於て、本発明の特
徴とするところは、判定部(26)にあり、その構成は第
1図に示す如く、類似度メモリ(1)、認識結果メモリ
(2)、第1閾値テーブル(3)、第1リジェクト判定
部(4)、出力部(5)、リジェクト回数メモリ
(6)、リジェクト回数判定部(7)、同一リジェクト
判定部(8)、リジェクト番号メモリ(9)、第2閾値
テーブル(10)、第2リジェクト判定部(11)からな
る。 このような第1図の構成を第2図の判定部(26)に採
用した場合の本発明装置の動作について以下に解説す
る。 ここでは、説明を簡単にするために、標準音声パタン
メモリに、複数の標準パタンが既に貯えられているもの
とする。例えば、標準パタンメモリ(24)の番号[0]
に対応つけられたメモリ領域に音声“ゼロ”のパタン、
番号[1]に対応つけたれたメモリ領域に音声“イチ”
のパタン、番号[2]に対応つけられたメモリ領域に音
声“ニ”のパタン、以下同様に番号[9]に対応つけら
れたメモリ領域に音声“キュウ”のパタンが順番に貯え
られている。このように数字音声のパタンが格納された
標準パタンメモリ(24)を持つ音声認識装置は勿論数字
音声を認識するために動作することになる。 今、使用者は、例えば、マイク(21)に向かって“イ
チ”と発声したとする。 この時、マイクから入力された音声は、音声分析部
(22)で分析された後に、パタン作成部(23)でパタン
化される。類似度計算部(24)は、標準パタンメモリ
(25)内の標準パタンとマイク(21)から入力され、パ
タン作成部(23)で作成された音声パタンとの類似度を
計算して、そのうち、最も大きな類似度を示した標準パ
タンの番号とその類似度を判定部(26)に伝達する。 斯して判定部(26)に伝達された標準パタンの番号は
第1図に示す如く認識結果メモリ(2)へ転送され、ま
たこれと同時に判定部(26)に伝達されたその最大類似
度は第1図に示す如く類似度メモリ(1)に転送され
る。 例えば、最大類似度を示す標準パタンの番号が[1]
であり、その類似度が170であった場合、認識結果メモ
リ(2)に[1]が、類似度メモリ(1)に170がそれ
ぞれ伝達される。 この場合、第1リジェクト判定部(4)では、類似度
メモリ(1)から類似度として170が、第1閾値テーブ
ル(3)から第1の閾値Vth1(例えば、150に設定され
ている)が伝達され、その大小関係を調べる。この数値
例では、類似度メモリの値が大きい(類似している)の
で、第1リジェクト判定部(4)は認識結果メモリ
(2)の内容、即ち番号[1]を出力部(5)に出力す
ると共に、リジェクト回数メモリの内容をクリアする。 以下に、第6図を参照しつつ解説を続ける。 今、例えば、音声“イチ”の入力に対して、最大類似
度を示す標準パタンの番号[1]であり、その類似度
が、同図(a)のイで表示した数値130であった場合、
認識結果メモリ(2)に[1]が、類似度メモリ(1)
に130がそれぞれ格納され、第1リジェクト判定部
(4)にて、第1閾値テーブル(3)の第1の閾値Vth1
(=150)と類似度メモリ(1)の類似度130が図示の如
く比較される。 この結果、類似度メモリの値が小さい(認識棄却)の
で、第1リジェクト判定部(4)は、リジェクトと判定
して、リジェクト回数判定部(7)にその旨を伝達す
る。リジェクト回数判定部(7)は、リジェクト回数メ
モリ(6)からリジェクト回数を呼び込む。リジェクト
が初めてであれば、その値が0であるので、リジェクト
と判定してその旨を出力部(5)に伝達するとともにリ
ジェクト回数メモリ(6)のカウント値に1を加え、更
に認識結果メモリ(2)の内容をリジェクト番号メモリ
に蓄える。
【この状態を〈状態1〉とする】 以上に説明した〈状態1〉に於て、続いてマイク(2
1)から音声“いち”が入力され、この時の類似度が第
6図(a)のロで示される値120であった場合につい
て、解説をさらに続ける。 この場合も、第1リジェクト判定部(4)は、第1閾
値テーブル(3)から第1の閾値Vth1=150と類似度メ
モリ(1)から類似度120を呼び込み、その大小関係を
調べる。 その結果、同図に示す如く、類似度メモリ(2)の値
が小さいので、第1リジェクト判定部(4)は、リジェ
クトと判定して、リジェクト回数判定部(7)にその旨
を伝達する。リジェクト回数判定部(7)は、リジェク
ト回数メモリ(6)からリジェクト回数を呼び込む。既
に1回リジェクトされており、その値が1であるので、
ただちにリジェクトとは判定しないで、その旨をリジェ
クト同一判定部(8)に伝達する。リジェクト同一判定
部(8)はリジェクト番号メモリ(9)からリジェクト
番号[1]を、そして認識結果メモリ(2)から認識結
果[1]を呼び込み、その結果が同一であるかを判定す
る。この場合には、両番号が一致するので、その旨を第
2リジェクト判定部(11)に伝達する。 斯して第2リジェクト判定部(11)はリジェクト回数
メモリ(6)からリジェクト回数[1]が伝達され、ま
た第2閾値テーブル(10)からリジェクト回数に応じた
第2の閾値Vth2=110が伝達される。第2リジェクト判
定部(11)では前記の類似度120と第2の閾値Vth2=110
の大小関係を調べる。この場合は、図示の如く、類似度
メモリ(2)の値が大きいので、第2リジェクト判定部
(11)は認識結果メモリ(2)の内容を出力部(5)に
出力すると共に、リジェクト回数メモリの内容をクリア
する。 一方、第6図(b)に示す如く、この状態でもリジェ
クトである場合には、リジェクト回数メモリ(6)の内
容に[1]を加えるので、その記憶内容は[2]にな
る。
【この状態を〈状態2〉とする】 第6図(b)の場合、〈状態2〉でハで示される類似
度93の“いち”の入力があった時は、これがVth1より小
さいので、今度はVth2と比較するが、このVth2はそれま
でのリジェクト回数に応じて小さく設定されることにな
る。同図の場合、Vth2は80であるので、類似度93はこの
Vth2より大きくなり、認識結果が出力される。そして、
この認識結果の出力でリジェクト回数が0にリセットさ
れる。 一方、1度音声が入力され、リジェクトとなり、結果
が1であり、上記の〈状態1〉で、再度音声が入力され
最も大きい類似度を示すものが番号[2]の音声“ニ”
である場合について説明する。 再度入力された音声と最も類似している音声パタンの
番号[2]が認識結果メモリ(2)に伝達され、類似度
120が類似度メモリ(1)に格納される。第1リジェク
ト判定部(4)は、第1閾値テーブル(3)から閾値15
0と類似度メモリ(1)から類似度120を呼び込み、その
大小関係を調べる。類似度メモリの値が小さいので、第
1リジェクト判定部(4)は、リジェクトと判定して、
リジェクト回数判定部(7)にその旨を伝達する。リジ
ェクト回数判定部(7)は、リジェクト回数メモリ
(6)からリジェクト回数を呼び込み、その値が1であ
るので、リジェクトと判定は行わないで、その旨をリジ
ェクト同一判定部(8)に伝達する。リジェクト同一判
定部(8)はリジェクト番号メモリ(9)からリジェク
ト番号[1]を、そして認識結果メモリ(2)から認識
結果2を呼び込み、その結果が同一であるかを判定す
る。この場合には、[1]と[2]で同一ではないの
で、リジェクト同一判定部(8)は出力部(5)にリジ
ェクトである旨を伝達し、認識結果メモリ(2)の値2
をリジェクト番号メモリ(9)に格納する。またリジェ
クト同一判定部(8)はリジェクト回数メモリのカウン
ト値を1にセットする。 上述の本発明装置によれば、一度リジェクトされて
も、同じ言葉を言い直し、それが同一結果にリジェクト
されれば、閾値を甘くして再度判定をしなおすことが可
能であるので、認識対象語が入力された場合には、リジ
ェクトとなっても言い直しをすることにより認識しやす
くすることが可能となる。また、認識対象語以外が入力
された場合には、同じ認識結果にリジェクトしない限り
は、閾値が甘くならないため、突発音や会話音声による
誤動作を削減させることが可能となった。 一方、第3図に本発明の音声認識装置の判定部の他の
実施例の構成を示す。同図の装置構成は、第1図のリジ
ェクト回数メモリを一定時間後にクリアするタイマ(1
2)を追加したものである。 同図の装置は、前述と同様の〈状態1〉の状態に於
て、タイマ(12)には、リジェクト回数判定部(7)あ
るいは、第2リジェクト判定部(11)がリジェクトと判
定すると、そのリジェクト回数判定部(7)、第2リジ
ェクト判定部(11)により所定時間(例えば10秒)がセ
ットされる。このタイマ(12)は、所定時間が設定され
るとカウントを開始することになり、このカウントが所
定時間を越えた場合には、リジェクト回数メモリ(6)
の内容がクリアされる。このように前回の音声入力から
相当の時間が経過した後では、使用者の再度の発声の可
能性は小さく、新たな音声である可能性が高いので、閾
値を甘くする必要はない。 又、第4図に本発明装置の判定部のさらに他の実施例
の構成を示す。同図の装置構成は、第1図のリジェクト
回数メモリのリジェクト回数が所定回数を越えた場合に
は、リジェクト回数をクリアする最大棄却回数判定部
(13)が追加されたものである。 同図の装置は、前述と同様の〈状態2〉の状態に於
て、最大棄却回数判定部(13)は、第2リジェクト判定
部(11)がリジェクトと判定するとその旨が伝達され、
リジェクト回数メモリ(6)の内容を呼び込み、その内
容が所定値(例えば4)ならばリジェクト回数メモリ
(6)の内容をクリアする。リジェクト回数が極めて多
くなるとそれは雑音入力である可能性が高いので、閾値
を甘くする必要はない。 又、第5図に本発明装置の判定部の他の実施例の構成
を示す。同図の装置構成は、第4図の類似度メモリの値
が第3閾値テーブル(15)の値より小さい場合に、リジ
ェクト回数メモリをクリアする類似度判定部(14)が追
加されたものである。 同図の装置は、前述と同様の〈状態1〉の状態に於
て、類似度判定部(14)は、リジェクト回数判定部
(7)あるいは、第2リジェクト判定部(11)がリジェ
クトと判定すると類似度メモリ(1)の類似度を呼び込
み、その値が第3閾値テーブル(15)の値(例えば50)
よりも小さい(標準パタンと入力音声パタンの類似度が
掛け離れている)ときは、リジェクト回数メモリ(6)
の内容をクリアする。類似度が極めて小さい場合には、
それは雑音入力である可能性が高いので、閾値を甘くす
る必要はない。 以上の説明に於ては、上記類似度計算部から得られた
選択標準パタンが示す信号と認識棄却された前回の音声
入力時の認識棄却結果とが一致する場合には、一度Vth1
と比較してから、Vth2と比較しているが、始めのVth1と
の比較をを省略して、直ちにVth2と比較するようにしも
よい。 (ト)発明の効果 本発明の音声認識装置によれば、あらかじめ閾値を厳
しく設定しておき、誤認識を防止を図りながら、この閾
値でリジェクトになった入力音声の再入力時に、閾値を
所定量甘くしてやることができるので、リジェクトを抑
制して、正しい認識結果を得ることができる。
【図面の簡単な説明】
第1図は本発明の一実施例の判定部の構成図、第2図は
本発明の音声認識装置の構成図、第3図乃至第5図は夫
々本発明装置の判別部の異なる実施例を示す構成図、第
6図は本発明の動作を示す模式図である。 (1)……類似度メモリ、(2)……認識結果メモリ、
(3)……第1閾値テーブル、(4)……第1リジェク
ト判定部、(5)……出力部、(6)……リジェクト回
数メモリ、(7)……リジェクト回数判定部、(8)…
…リジェクト同一判定部、(9)……リジェクト番号メ
モリ、(10)……第2閾値テーブル、(11)……第2リ
ジェクト判定部。
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G10L 3/00 561

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】音声を入力するマイク、該マイクから入力
    された音声を分析する音声分析部、該音声分析部で分析
    された分析結果を音声パタンに変換するパタン作成部、
    あらかじめ複数の音声パタンを標準音声パタンとして貯
    えている標準パタンメモリ、該標準パタンメモリの複数
    の各標準パタンの夫々と上記パタン作成部で作成された
    入力音声の音声パタンを比較してその類似度を計算し、
    最も大きい類似度を示す標準パタンを選択する類似度計
    算部、該類似度計算部で選択した標準パタンの最大類似
    度があらかじめ設定されている閾値よりも大きい時、こ
    の時の選択標準パタンに対応する信号を認識結果として
    出力し、該最大類似度が閾値よりも小さいとき、認識棄
    却と判定する判定部を具備した音声認識装置において、 上記判定部で認識棄却と判定された場合には、その時の
    選択標準パタンに対応する信号を認識棄却結果として貯
    え、認識棄却された前回の音声入力と同一の認識棄却結
    果が得られる場合には、上記判定部に設定されている閾
    値を小さく設定することを特徴とする音声認識装置。
  2. 【請求項2】請求項1記載の音声認識装置に於て、連続
    した音声入力に対して連続して同一の認識棄却結果が得
    られる場合には、上記判定部に設定されている閾値を小
    さく再設定し、この時の音声入力に対して該再設定閾値
    を用いて再度比較を行うことを特徴とした音声認識装
    置。
  3. 【請求項3】請求項1記載の音声認識装置に於て、連続
    した音声入力に対して連続して同一の認識棄却結果が得
    られる回数を記憶する記憶手段を備え、該記憶手段に記
    憶された認識結果棄却回数に応じて、上記判定部に設定
    されている閾値を小さく設定することを特徴とした音声
    認識装置。
  4. 【請求項4】請求項1記載の音声認識装置に於て、認識
    棄却結果が得られた後に計時を開始するタイマを具備
    し、該タイマが所定時間経過した時に、認識棄却回数を
    クリアすることを特徴とした音声認識装置。
  5. 【請求項5】請求項1記載の音声認識装置に於て、該音
    声認識装置は、記憶手段を備え、該記憶手段に記憶され
    ている認識結果棄却回数が所定回数を越えた場合には、
    該記憶手段の記憶内容をクリアすることを特徴とした音
    声認識装置。
  6. 【請求項6】請求項1記載の音声認識装置に於て、該音
    声認識装置は、記憶手段を備え、上記類似度計算部から
    得られる類似度が上記第2の閾値より小さい第3の閾値
    よりさらに小さい場合に、上記記憶手段の記憶内容をク
    リアすることを特徴とした音声認識装置。
JP2278394A 1990-10-16 1990-10-16 音声認識装置 Expired - Fee Related JP2834880B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2278394A JP2834880B2 (ja) 1990-10-16 1990-10-16 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2278394A JP2834880B2 (ja) 1990-10-16 1990-10-16 音声認識装置

Publications (2)

Publication Number Publication Date
JPH04152397A JPH04152397A (ja) 1992-05-26
JP2834880B2 true JP2834880B2 (ja) 1998-12-14

Family

ID=17596732

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2278394A Expired - Fee Related JP2834880B2 (ja) 1990-10-16 1990-10-16 音声認識装置

Country Status (1)

Country Link
JP (1) JP2834880B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4565768B2 (ja) * 2001-04-19 2010-10-20 アルパイン株式会社 音声認識装置
JP4638939B2 (ja) 2006-03-31 2011-02-23 富士通株式会社 閾値補正回路,回路および閾値補正機能付き回路基板
JP6966374B2 (ja) * 2018-04-02 2021-11-17 アルパイン株式会社 音声認識システム及びコンピュータプログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01222299A (ja) * 1988-03-01 1989-09-05 Nippon Denso Co Ltd 音声認識装置

Also Published As

Publication number Publication date
JPH04152397A (ja) 1992-05-26

Similar Documents

Publication Publication Date Title
JP2963142B2 (ja) 信号処理方法
JPS5944639B2 (ja) 音声による異同認識方式における標準パタ−ン更新方法
JP2969862B2 (ja) 音声認識装置
JP2834880B2 (ja) 音声認識装置
JP2996019B2 (ja) 音声認識装置
JP4440414B2 (ja) 話者照合装置及び方法
JP2975772B2 (ja) 音声認識装置
JP6711343B2 (ja) 音声処理装置、音声処理方法及びプログラム
JP2006010739A (ja) 音声認識装置
JP3523949B2 (ja) 音声認識装置及び音声認識方法
JP2790808B2 (ja) 音声認識装置
JPH04324499A (ja) 音声認識装置
JPH10124084A (ja) 音声処理装置
JPH05210397A (ja) 音声認識装置
KR100382473B1 (ko) 음성 인식 방법
JP2004510209A (ja) 発声された番号シーケンスの分析方法及び装置
JPH0119597B2 (ja)
JPH04332000A (ja) 音声認識方法
JPH03149598A (ja) 音声認識装置
JPH01209499A (ja) パターン照合方式
JPH0634193B2 (ja) キ−ワ−ド抽出装置
JPS63798B2 (ja)
JPH06318097A (ja) 音声認識装置
JPH03155599A (ja) 音声認識装置
JPH0316038B2 (ja)

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees