JPS63259690A - 音声認識応答装置 - Google Patents
音声認識応答装置Info
- Publication number
- JPS63259690A JPS63259690A JP62095621A JP9562187A JPS63259690A JP S63259690 A JPS63259690 A JP S63259690A JP 62095621 A JP62095621 A JP 62095621A JP 9562187 A JP9562187 A JP 9562187A JP S63259690 A JPS63259690 A JP S63259690A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- recognition
- section
- threshold value
- voice recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000004044 response Effects 0.000 claims description 16
- 238000001514 detection method Methods 0.000 claims description 8
- 230000005236 sound signal Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 7
- 238000003786 synthesis reaction Methods 0.000 description 7
- 238000000034 method Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 206010002953 Aphonia Diseases 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は、人間の声を機械に認識させ、機械が応答する
音声認識応答装置に関するものである。
音声認識応答装置に関するものである。
従来の技術
近年、電話等を利用した音声認識応答装置の開発が活発
に行なわれている。このような不特定話者を対象とした
音声認識においては、ノイズを含んだ音声信号や語頭、
語尾における発声が不明瞭な音声信号についても認識す
る必要があるが、本出願人は先にこれら不明瞭な音声信
号に対して高い認識率を得ることができるようにした音
声認識方法について特願昭60−251360号として
提案した。
に行なわれている。このような不特定話者を対象とした
音声認識においては、ノイズを含んだ音声信号や語頭、
語尾における発声が不明瞭な音声信号についても認識す
る必要があるが、本出願人は先にこれら不明瞭な音声信
号に対して高い認識率を得ることができるようにした音
声認識方法について特願昭60−251360号として
提案した。
以下この方法を用いて音声により機械と対話を行なう音
声認識応答装置について図面を参照しながら説明する。
声認識応答装置について図面を参照しながら説明する。
第4図は従来の音声認識応答装置の構成を示す機能ブロ
ック図である。同図に示すようにAD変換部1は入力音
声をディジタル信号に変換する。
ック図である。同図に示すようにAD変換部1は入力音
声をディジタル信号に変換する。
音響分析部2は音声を分析区間(フレーム)毎に分析し
、スペクトル情報(線形予測係数)を求める。特徴パラ
メータ抽出部3は線形予測係数を用いてLPOケプヌト
ラム係数、正規化対数残差パワーC6および帯域通過フ
ィルタ値などを求める。
、スペクトル情報(線形予測係数)を求める。特徴パラ
メータ抽出部3は線形予測係数を用いてLPOケプヌト
ラム係数、正規化対数残差パワーC6および帯域通過フ
ィルタ値などを求める。
フレーム同期信号発生部4はフレーム毎に同期信号を発
生する。標準パターン選択部9はパターンマツチングを
行なう際、認識対象語句の標準パターンを順次選択する
。区間候補設定部6は選択された標準パターン毎に複数
の候補の音声区間長を設定する。時間軸正規化部5は設
定された複数の候補の音声区間に対する特徴パラメータ
の時系列パターンを一定フレーム長に伸縮する。類似度
計算部7は標準パターン選択部9で選ばれた標準パター
ン格納部8中の各標準パターンとの類似度を計算する。
生する。標準パターン選択部9はパターンマツチングを
行なう際、認識対象語句の標準パターンを順次選択する
。区間候補設定部6は選択された標準パターン毎に複数
の候補の音声区間長を設定する。時間軸正規化部5は設
定された複数の候補の音声区間に対する特徴パラメータ
の時系列パターンを一定フレーム長に伸縮する。類似度
計算部7は標準パターン選択部9で選ばれた標準パター
ン格納部8中の各標準パターンとの類似度を計算する。
類似度比較部11はフレーム毎に1字記憶10に蓄積さ
れている最大類似度値と比較し、最大の類似度の認識対
象語句を選択する。1次記憶IOは得られた最大類似度
の語句を更新する。
れている最大類似度値と比較し、最大の類似度の認識対
象語句を選択する。1次記憶IOは得られた最大類似度
の語句を更新する。
1次記憶10に残った語句は認識結果として類似度比較
部11よりタスク制御部15に出力されるが、認識開始
より一定時間経つと、タイマ部工9は制限時間であるこ
とを類似度比較部11に知らせ、その間に得られた最大
類似度がある閾値を越えない場合には音声が入力されな
かったものと判断し、「リジェクト」または「タイムア
ウトエラー」という認識結果として出力する。タスク制
御部15は上記認識結果に対する応答文音声を選択し、
音声合成部16に指令を与える。音声合成部16は音声
データ格納部17かも指定された文の音声データを取り
出し、音声を合成する。この合成されたディジタルの音
声をDA変換部18でアナログに変換して出力する。
部11よりタスク制御部15に出力されるが、認識開始
より一定時間経つと、タイマ部工9は制限時間であるこ
とを類似度比較部11に知らせ、その間に得られた最大
類似度がある閾値を越えない場合には音声が入力されな
かったものと判断し、「リジェクト」または「タイムア
ウトエラー」という認識結果として出力する。タスク制
御部15は上記認識結果に対する応答文音声を選択し、
音声合成部16に指令を与える。音声合成部16は音声
データ格納部17かも指定された文の音声データを取り
出し、音声を合成する。この合成されたディジタルの音
声をDA変換部18でアナログに変換して出力する。
タスク制御部15は類似度比較部11に認識指令を出力
し、認識を開始させて認識結果を得ることと、音声合成
部16に対する合成指令で応答文の音声を再生すること
とを繰返して行ない、目的のタスク全体の流れを制御す
る。
し、認識を開始させて認識結果を得ることと、音声合成
部16に対する合成指令で応答文の音声を再生すること
とを繰返して行ない、目的のタスク全体の流れを制御す
る。
発明が解決しようとする問題点
しかし、上記のような従来例の構成では、第5図(a)
〜(、)に示すように認識制限時間間際に発声された音
声は一義的に時間制限により「リジェクト」または「タ
イムアウトエラー」と判断されるため、再度音声を発し
なければならないという不都合を生じ、利用者に不快感
を与えていた。
〜(、)に示すように認識制限時間間際に発声された音
声は一義的に時間制限により「リジェクト」または「タ
イムアウトエラー」と判断されるため、再度音声を発し
なければならないという不都合を生じ、利用者に不快感
を与えていた。
本発明の目的は、認識制限時間間際に発声された音声を
「リジェクト」または「タイムアウトエラー」と判断す
ることなく、制限時間を延長して音声を認識し、自然な
対話を行なうことができるようにした音声認識応答装置
を提供するものである。
「リジェクト」または「タイムアウトエラー」と判断す
ることなく、制限時間を延長して音声を認識し、自然な
対話を行なうことができるようにした音声認識応答装置
を提供するものである。
問題点を解決するための手段
本発明は上記目的を達成するもので、入力音声の有無を
検出する手段と、音声の入力終了時点で上記検出手段の
検出により音声入力制限時間を延長するか否かを判定し
、有音の場合には音声認識を延長する認識処理手段を備
えだものである。
検出する手段と、音声の入力終了時点で上記検出手段の
検出により音声入力制限時間を延長するか否かを判定し
、有音の場合には音声認識を延長する認識処理手段を備
えだものである。
作用
本発明は上記構成により、発声を促されたにもかかわら
ず、発声が遅れ、制限時間内に発声を終了できなかった
場合にも認識処理を延長して行なうことができるので、
同じ語句や文の全部を2度繰り返して発声するという煩
わしさをなくすことができる。
ず、発声が遅れ、制限時間内に発声を終了できなかった
場合にも認識処理を延長して行なうことができるので、
同じ語句や文の全部を2度繰り返して発声するという煩
わしさをなくすことができる。
実施例
以下、本発明の実施例について図面を参照しながら詳細
に説明する。
に説明する。
まず、本発明の第1実施例について説明する。
第1図は本発明の第1実施例における音声認識応答装置
の構成を示す機能ブロック図である。
の構成を示す機能ブロック図である。
同図において、符号1〜11および15〜19で示す各
部は第4図で説明した従来例の構成と同様であるので、
その説明を省略し、異なる構成についてのみ説明する。
部は第4図で説明した従来例の構成と同様であるので、
その説明を省略し、異なる構成についてのみ説明する。
パワー比較部12は特徴パラメータ抽出部3で得られた
帯域通過フィルタのパワー値と、ある一定閾値との比較
を行ない、閾値を越えたフレームを検出する。認識結果
生成部14は音声の入力終了時点で上記パワー比較部1
2の検出により入力制限時間を延長するか否かを判定す
る。すなわち、認識結果生成部14は予め設定され、タ
イマ部19で計数している認識制限時間以内に認識結果
が得られない場合、制限時間終了時点で上記フィルタパ
ワー値が閾値を越えている事がパワー比較部12より検
出されれば、認識制限時間を再設定し、認識処理を続行
する。その結果、認識結果生成部14は最大類似度があ
る閾値以上となれば認識結果を出力するが、再び認識制
限時間に達してもある程度以上の類似度が得られない場
合には「リジェクト」または「タイムアウトエラー」と
してタスク制御部15に報告する。タスク制御部15は
音声合成部16にリジェクト等の理由を示す応答文の合
成を指令し、音声合成部16は音声データ格納部17か
ら応答文の音声デンタを取り出し、音声を合成し、DA
変換部18でアナログに変換して出力し、発声者に伝達
する。なお、この他の合図音で伝達することもできる。
帯域通過フィルタのパワー値と、ある一定閾値との比較
を行ない、閾値を越えたフレームを検出する。認識結果
生成部14は音声の入力終了時点で上記パワー比較部1
2の検出により入力制限時間を延長するか否かを判定す
る。すなわち、認識結果生成部14は予め設定され、タ
イマ部19で計数している認識制限時間以内に認識結果
が得られない場合、制限時間終了時点で上記フィルタパ
ワー値が閾値を越えている事がパワー比較部12より検
出されれば、認識制限時間を再設定し、認識処理を続行
する。その結果、認識結果生成部14は最大類似度があ
る閾値以上となれば認識結果を出力するが、再び認識制
限時間に達してもある程度以上の類似度が得られない場
合には「リジェクト」または「タイムアウトエラー」と
してタスク制御部15に報告する。タスク制御部15は
音声合成部16にリジェクト等の理由を示す応答文の合
成を指令し、音声合成部16は音声データ格納部17か
ら応答文の音声デンタを取り出し、音声を合成し、DA
変換部18でアナログに変換して出力し、発声者に伝達
する。なお、この他の合図音で伝達することもできる。
第2図(a)〜(P)は以上の処理の様子を示した図で
ある。同図に示すように認識制限時間終了時点で音声が
検出された場合、制限時間を延長して認識処理を行ない
、発声終了後に認識結果を出力している。
ある。同図に示すように認識制限時間終了時点で音声が
検出された場合、制限時間を延長して認識処理を行ない
、発声終了後に認識結果を出力している。
次に本発明の第2実施例について説明する。第3図は本
発明の第2実施例の構成を示す機能ブロック図である。
発明の第2実施例の構成を示す機能ブロック図である。
上記第1実施例では、認識制限時間終了時点で、音声の
有無を判定するため、音声以外の瞬時のノイズに対して
誤ってリジェクトしてしまう危険性があるので、本実施
例では瞬時のノイズに対して誤ってリジェクトしないよ
うに考慮したものである。
有無を判定するため、音声以外の瞬時のノイズに対して
誤ってリジェクトしてしまう危険性があるので、本実施
例では瞬時のノイズに対して誤ってリジェクトしないよ
うに考慮したものである。
同図において、符号1〜12および14〜19で示す各
部は第1図に示した第1実施例の構成と同様であるので
、その説明を省略し、異なる構成についてのみ説明する
。13はパワー比較部12から出力される帯域通過フィ
ルタパワー値がある閾値を越えたフレームの個数を計算
するフレーム計数部であり、認識開始時点より連続して
一定フレーム以上閾値を越えたフレームが連続した場合
を検出する。
部は第1図に示した第1実施例の構成と同様であるので
、その説明を省略し、異なる構成についてのみ説明する
。13はパワー比較部12から出力される帯域通過フィ
ルタパワー値がある閾値を越えたフレームの個数を計算
するフレーム計数部であり、認識開始時点より連続して
一定フレーム以上閾値を越えたフレームが連続した場合
を検出する。
以降の処理は上記第1実施例と同様である。
なお、上記各実施例では、帯域通過フィルタパワーによ
り音声の有無を検出しているが、全域パワーを用いても
同様の検出は可能である。
り音声の有無を検出しているが、全域パワーを用いても
同様の検出は可能である。
発明の効果
以上述べたように本発明によれば、音声の入力終了時点
において、検出手段による入力音声の有無の検出により
認識処理手段で音声入力制限時間を延長するか否かを判
定し、有音の場合には音声認識を延長するrうに構成し
ている。すなわち、音声が認識制限時間直前に発声され
、制限時間以内に発声を終了しない場合に制限時間終了
時点の音声の有無を検出し、有音の時には制限時間を延
長して認識を行なうことができるようになっている。し
たがって、発声するタイミングが少し遅れても、認識動
作を正しく行ない、従来例のように「リジェクト」また
は「タイムアウトエラー」と判断され、全く同じ発声を
2度繰り返さなければならないという煩わしさから解放
され、スムーズで自然な対話を実現できる。
において、検出手段による入力音声の有無の検出により
認識処理手段で音声入力制限時間を延長するか否かを判
定し、有音の場合には音声認識を延長するrうに構成し
ている。すなわち、音声が認識制限時間直前に発声され
、制限時間以内に発声を終了しない場合に制限時間終了
時点の音声の有無を検出し、有音の時には制限時間を延
長して認識を行なうことができるようになっている。し
たがって、発声するタイミングが少し遅れても、認識動
作を正しく行ない、従来例のように「リジェクト」また
は「タイムアウトエラー」と判断され、全く同じ発声を
2度繰り返さなければならないという煩わしさから解放
され、スムーズで自然な対話を実現できる。
第1図は本発明の第1実施例における音声認識応答装置
の構成を示す機能プロ・ツク図、第2図は本発明の実施
例における対話の様子を示すタイミング図、第3図は本
発明の第2実施例の構成を示す機能ブロック図、第4図
は従来の音声認識応答装置の構成を示す機能ブロック図
、第5図は従来例における対話の様子を示すタイミング
図である。 1・・・AD変換部、2・・・音響分析部、3・・・特
徴パラメータ抽出部、4・・・フレーム同期信号発生部
、5・・・時間軸正規化部、6・・・区間候補設定部、
7・・・類似度計算部、8・・・標準パターン格納部、
9・・・標準パターン選択部、10・・・1次記憶、1
1・・・類似度比較部、12・・・パワー比較部、13
・・・フレーム計数部、14・・・認識結果生成部、1
5・・・タスク制御部、16・・・音声合成部、17・
・・音声データ格納部、18・・・DA変換部、19・
・・タイマ部。
の構成を示す機能プロ・ツク図、第2図は本発明の実施
例における対話の様子を示すタイミング図、第3図は本
発明の第2実施例の構成を示す機能ブロック図、第4図
は従来の音声認識応答装置の構成を示す機能ブロック図
、第5図は従来例における対話の様子を示すタイミング
図である。 1・・・AD変換部、2・・・音響分析部、3・・・特
徴パラメータ抽出部、4・・・フレーム同期信号発生部
、5・・・時間軸正規化部、6・・・区間候補設定部、
7・・・類似度計算部、8・・・標準パターン格納部、
9・・・標準パターン選択部、10・・・1次記憶、1
1・・・類似度比較部、12・・・パワー比較部、13
・・・フレーム計数部、14・・・認識結果生成部、1
5・・・タスク制御部、16・・・音声合成部、17・
・・音声データ格納部、18・・・DA変換部、19・
・・タイマ部。
Claims (3)
- (1)入力音声の有無を検出する手段と、音声の入力終
了時点で上記検出手段の検出により音声入力制限時間を
延長するか否かを判定し、有音の場合には音声認識を延
長する認識処理手段を備えたことを特徴とする音声認識
応答装置。 - (2)検出手段が音声信号のパワー値と、ある一定閾値
との比較を行ない、閾値を越えたフレームを検出するパ
ワー比較部で構成されている特許請求の範囲第1項記載
の音声認識応答装置。 - (3)検出手段が音声信号のパワー値と、ある一定閾値
との比較を行ない、閾値を越えたフレームを検出するパ
ワー比較部と、このパワー比較部から出力され、閾値を
越えたフレームの個数を計算するフレーム計数部とより
構成されている特許請求の範囲第1項記載の音声認識応
答装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62095621A JPS63259690A (ja) | 1987-04-17 | 1987-04-17 | 音声認識応答装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62095621A JPS63259690A (ja) | 1987-04-17 | 1987-04-17 | 音声認識応答装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS63259690A true JPS63259690A (ja) | 1988-10-26 |
Family
ID=14142609
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62095621A Pending JPS63259690A (ja) | 1987-04-17 | 1987-04-17 | 音声認識応答装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS63259690A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009146331A (ja) * | 2007-12-18 | 2009-07-02 | Oki Electric Ind Co Ltd | 自動取引装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59105697A (ja) * | 1982-12-09 | 1984-06-19 | 松下電器産業株式会社 | 音声認識装置 |
JPS59109095A (ja) * | 1982-12-14 | 1984-06-23 | 三菱自動車工業株式会社 | 音声認識装置におけるマイク入力装置 |
JPS60186895A (ja) * | 1984-03-06 | 1985-09-24 | キヤノン株式会社 | 音声認識装置 |
-
1987
- 1987-04-17 JP JP62095621A patent/JPS63259690A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59105697A (ja) * | 1982-12-09 | 1984-06-19 | 松下電器産業株式会社 | 音声認識装置 |
JPS59109095A (ja) * | 1982-12-14 | 1984-06-23 | 三菱自動車工業株式会社 | 音声認識装置におけるマイク入力装置 |
JPS60186895A (ja) * | 1984-03-06 | 1985-09-24 | キヤノン株式会社 | 音声認識装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009146331A (ja) * | 2007-12-18 | 2009-07-02 | Oki Electric Ind Co Ltd | 自動取引装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3180655B2 (ja) | パターンマッチングによる単語音声認識方法及びその方法を実施する装置 | |
EP0757342B1 (en) | User selectable multiple threshold criteria for voice recognition | |
CA2366892C (en) | Method and apparatus for speaker recognition using a speaker dependent transform | |
EP0411290A2 (en) | Method and apparatus for extracting information-bearing portions of a signal for recognizing varying instances of similar patterns | |
JPH0990974A (ja) | 信号処理方法 | |
JPS5862699A (ja) | 音声認識装置 | |
JP3069531B2 (ja) | 音声認識方法 | |
JP2002236494A (ja) | 音声区間判別装置、音声認識装置、プログラム及び記録媒体 | |
JPS63259690A (ja) | 音声認識応答装置 | |
KR100330905B1 (ko) | 음향 또는 음성의 패턴 인식을 이용한 완구의 동작 제어 방법 | |
JP4447857B2 (ja) | 音声検出装置 | |
JP4127155B2 (ja) | 聴覚補助装置 | |
JPS63259689A (ja) | 音声認識応答装置 | |
JP4449380B2 (ja) | 話者正規化方法及びそれを用いた音声認識装置 | |
JP2001042889A (ja) | 音声認識入力音声の音程正規化装置 | |
JPH0769713B2 (ja) | 音声認識応答装置 | |
JP2000099099A (ja) | データ再生装置 | |
JP3360978B2 (ja) | 音声認識装置 | |
JPH0475520B2 (ja) | ||
JPH04324499A (ja) | 音声認識装置 | |
JPS6228480B2 (ja) | ||
JPS59224900A (ja) | 音声認識方法 | |
JPH02103599A (ja) | 音声認識装置 | |
CN111445912A (zh) | 语音处理方法和系统 | |
JPS6120880B2 (ja) |