JPS61107397A - 音声認識応答装置 - Google Patents

音声認識応答装置

Info

Publication number
JPS61107397A
JPS61107397A JP59229248A JP22924884A JPS61107397A JP S61107397 A JPS61107397 A JP S61107397A JP 59229248 A JP59229248 A JP 59229248A JP 22924884 A JP22924884 A JP 22924884A JP S61107397 A JPS61107397 A JP S61107397A
Authority
JP
Japan
Prior art keywords
voice
response
signal
user
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59229248A
Other languages
English (en)
Inventor
上原 堅助
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP59229248A priority Critical patent/JPS61107397A/ja
Publication of JPS61107397A publication Critical patent/JPS61107397A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 【発明の技術分野】
本発明は、電話回線を利用して音声認識応答処理を実行
する音声認識応答装置に関する。
【発明の技術的背景とその問題点】
音声認識応答システムは、電話回線を利用して、利用者
とホストコンピュータ間で情報を交換し、利用者に対し
て音声による情報サービスを提供するシステムである。 このシステムでは、第2図に示すように、利用者は電話
器10を操作して、例えば予め決定された一運のコード
番号を一語毎に区切って連続して発声する。利用者の発
声による音声信号は、電話口[11を通じて音声認識装
j[13に送信される。このとき、回線切換回路12は
ホストコンピュータ14の制御により、電話回線11を
音声認識i冨13側に接続させる。音声認識装置13は
。 不特定話者単語認識用の音声認識装置からなり、利用者
から発声された各数字を単語として一語毎に呂声認M処
理する。 ここで、利用者は、通常では音声応答装置15から送信
される肋誘音(ビー音)Pに応じて、必要な音声(音声
信号S)を発声するようになっている。このとき、ホス
トコンピュータ14のIII lにより回線切換回路1
2が音声応答装W!15側に接続されて、音声応′I!
I¥装置15から出力される勧誘音Pが電話口1Q11
を通じて利用者に送信される。勧誘音Pの出力が終了後
に、第3図に示すような利用者からの音声信号Sが音声
認識装置13に出力される。 音声認識装置13は、音声信号Sから予め決定された!
1lfi!ILを越える音声区間T1を検出し、この音
声区間T1に対する認識処理を行なう。 ところで、利用者の中には上記のような勧誘音P8聞き
終わらないうちに、音声を発声する場合がある。この場
合、第4図に示すように、音声信号Sの始端部分が音声
認識装置13に入力されない事態が発生する。このため
、音声認識装置13では、利用者の音声を誤謬識または
リジェクトする場合が多くなる。このような利用者は、
特に数字を連続して発声する場合に、たびたび早めに発
声する。 さらに、発声する単品または利用者の発声の癖により、
発声が通常より極端に長くなる場合がある。 音声認識装置13は認識処理を行なう際に一部バッファ
メモリに音声信号Sを格納するが、発声期間の長い音声
信号Sはそのバッフ7メモリの容口を越えることがある
。このため、音声HIEili113では、第5図に示
すように、本来の音声区間T1の終端部分が削除された
音声区間T2に対して認識処理が実行されることになる
。このため、利用者の発声に対して、誤認識またはりジ
ェツトが発生することになる。また、利用者に中には音
声を入力する際に、長時間に渡り沈黙している場合があ
る。従来のシステムでは、音声応答装置15からの勧誘
音Pが出力した後、適当に時間(タイムアウトRBT3
と称し、通常5秒程度)内に音声入力がない場合、利用
者に対して発声を催促するように構成されている。即ち
、例えば音声応答[i15から、「音声の入力がありま
せんので、もう一度どうぞ」等のメツセージを利用者に
送信する。ここで、利用者がタイムアウト[flT3の
限度付近で発声した場合、第6図に示すように、音声信
号Sの終端部分が削除されて音声認識処理W113に入
力される場合がある。この場合でも、音声信号に対する
誤Hutまたはりジェツトが発生することになる。 上記のように、従来のシステムでは、利用者の発声が不
適切である場合には、音声認識率が著しく低下し、結果
的に確実な音声応答サービスが不可能になる問題がある
。 [発明の目的コ 木光明の目的は、音声認識応答システムにおいて、利用
者の発声が不適切である場合、利用者に対して適切な発
声を示唆して、利用者からの音声に対する確実な音声認
識処理を実現し、音声応答サービスを確実に行なうこと
ができる音声y:X識応答装置を提供することにある。 [発明の慨要] 本発明では、音声認識応答システムにおいて、利用者の
不適切な発声を検出する音声検出手段が設けられている
。この音声検出手段は、音声信号に対して音声認識処理
に必要な音声区間を検出し、かつその音声区間の検出が
不可能な場合には検出不可内容を含む検出不可信号を出
力する。上記音声検出手段から検出不可信号が出力され
ると、音声応答手段は予め決定された音声応答処理を実
行し、音声応答処理による音声応答信号を電話回線を通
じて利用者に送信するように構成されている。 このような構成により、利用者は発声が不適切な場合に
は、音声応答手段からの指示に応じて再度適切な発声を
行なうことが可能となる。これにより、利用者が発声し
た音声に対する音声認識処理を確実に実行することがで
きる。 【発明の実施例1 以下図面を参照して本発明の一実施例を説明する。第1
図は同実施例に係わる音声認識c5答装置の構成を示す
ブロック図である。第1図において、音声検出回路16
は、回線切換回路12により電話回線11に接続される
と、この電話口1111を通じて入力される音声信号S
に対する音声区間の検出9理を行なう。音声検出回路1
6は、利用者の不適切な発声により音声区間の検出が不
可能な場合には、検出不可内容を含む検出不可信号Rを
ホストコンピュータ14に出力する。ホストコンピュー
タ14は、音声検出回路16からの検出不可信号Rに応
じて、音声応答a置15に予め決定された応答データを
出力する。音声応答狭M15は、応答データに応じた音
声応答信号をN語口l1111に出力する。 一方、音声検出回路16で検出された音声区間に対応す
る音声信号Sは、音声認識装置13に出力されて音声認
識処理が実行される。ホストコンピュータ14は、音声
認識装置13の01結果に応じた応答データを音声応答
i置15に出力する。 このような構成の音声認識装置装宜において、同実施例
の動作を説明する。先ず、音声認識応答システムに電話
口$111が接続されて、システムが動作状態になると
、ホストコンピュータ14は肋誘音Pの発生を行なうた
めに、音声応答波W115の動動を制すする。このとき
、回線切換回路12はホストコンピュータ14の制御に
より、音声応答装!15側に電話回線11を接続させて
いる。音声応答装置15から出力されたIl!l誘音P
は、電話口!1111を通じて利用者に送信される。ホ
ストコンピュータ14は、U誘音Pの発生終了後直ちに
、電話口1;111が音声検出回路16測に接続される
ように回線切換回路12の動作を制御する。 利用者は、肋誘音Pに応じて、必要な音声を発声して、
音声信号Sを電話回線11を通じて音声検出回路16に
入力する。音声検出回路16は、通常では音声信号Sに
対する音声区間を検出して、その区間の音声信号Sを一
部バッフ?メモリに格納した後に音声認識¥A113に
出力する。ここで、音声区間とは予め決定された閾!!
ILより高レベルになった時を9!5端とし、また閾値
しより低レベルになった時を終端とする区間である(第
3図を参照)。 音声認識装置13は、音声検出回路16で検出された音
声区間■に対応する音声信号Sの認識処理を実?テし、
認識結果をホストコンピュータ14に出力する。ホスト
コンピュータ14は、音声認識装置13からの認識結果
に応じた応答データを音声応答装置15に出力する。即
ち、例えば利用者からのフード番号に対して、ホストコ
ンピュータ14は頂金残a等の応答データを出力する。 音声応答波M15は、応答データに応じた音声応答信号
を利用者に送信することになる。 ところで、利用者が、上記のような肋誘音Pを送信中に
音声を発声したとする。この場合、回線切換回路12が
電話口I!11を音声検出回路16側に接続する前に、
音声信@Sが入力されるため、その始端部分が削除され
た状態の音声信号Sが音声検出回路16に入力される(
第4図を参照)。音声噴出回路16は、音声信号Sの始
端が第4図に示すような閾値しより大きいレベル1aで
あることを検出すると、上記のような不適切な発声であ
ると判定する。これにより、音声検出回路76は、音声
信@Sの終端を検出した後に検出不可信号Rをホストコ
ンピュータ14に出力する。ホストコンピュータ14は
、音声検出回路16からの検出不可信号Rに基づいて、
利用者の不通切な発声を訂正させるために予め決定され
た応;データを音声応答装置15に出力する。音声応答
装置15は、応答データに応じて、例えば「音声の発声
が早すぎます。信号音の後に発声して下さい」等のメツ
セージからなる音声応答信号を電話口1i111に出力
する。さらに、利用者の発声期間が長く、音声信号SS
音声検出回路16のバッファメモリの容量を越える場合
(第5図を参照)には、音声検出回路16は音声信@S
の終端を検出できないため検出不可信号Rをホストコン
ピュータ14に出力する。ホストコンピュータ14は、
そのときの検出不可信号Rの内容に基づいて、利用者の
不適切な発声を訂正させるために予め決定された応答デ
ータを音声応答装置15に出力する。音声応答装置15
は、例えば「もう少し発声を短くして下さい」等のメツ
セージの音声応答信号を電話回線11に出力する。また
、勧誘音Pの発生後、利用者の沈黙が長く、音声検出回
路16においてタイムアウト時間T3を過ぎても音声信
号Sの終端か検出されない場合(第6図な参照)、音声
検出回路16は検出不可信号Rをホストコンピュータ1
4に出力する。これにより、上記と同様にホストコンピ
ュータ14からの応答データに応じて、音声応答11i
1sは例えば「音声の発声が遅すぎます。信号音の後に
すぐに発声して下さい」等のメツセージの音声応答信号
を電話口P;111に出力する。 このようにして、利用者の不適切な発声により、利用者
からの音声信@Sから確実に音声区間を検出できない場
合、不適切な発声の内容に応じた音声応答信号が利用者
に送信される。このため、利用者は不適切な発声を訂正
して、再度適切な発声で音声信号を入力することができ
る。したがって、音声01装[13には適正な音声区間
の音声信号が入力されることになり、利用者からの音声
信号に対するill率を大幅に高めることができる。 [発明の効果] 以上詳述したように本発明によれば、音声認識応答シス
テムにおいて、利用者の発声が不適切である場合、不適
切の内容を検出して、その内容に応じた発声訂正用の音
声応答信号を出力することができる。したがって、利用
者に対して適切な発声で再度音声信号を入力することを
催促することができ、音声信号に対する認識処理を確実
に行なうことが可能となる。これにより、結果的に利用
者に対する音声応答サービスを、常に確実に提供するこ
とができるものである。
【図面の簡単な説明】
第1図は本発明の一実施例に係わる音声認識応答装置の
構成を示すブロック図、第2図は従来のるための音声信
号の波形図である。 11・・・電話回線、12・・・回線切換回路、13・
・・音声認識@置、14・・・ホストコンピュータ、1
5・・・音声応答装置、16・・・音声検出回路。 出願人代理人 弁理士 鈴江武彦 第10 第2図 第3図 第4図 第5図 ° ←−−TI    ’

Claims (1)

    【特許請求の範囲】
  1. 電話回線を通じて送信される音声信号に対して音声認識
    処理に必要な音声区間を検出しかつその音声区間の検出
    が不可能な場合には検出不可内容を含む検出不可信号を
    出力する音声検出手段と、この音声検出手段で検出され
    た音声区間の上記音声信号に対する音声認識処理を行な
    う音声認識手段と、この音声認識手段の認識結果に対応
    する音声応答処理または上記音声検出手段から出力され
    る検出不可信号に対して予め決定された音声応答処理を
    実行して各音声応答処理による音声応答信号をそれぞれ
    上記電話回線に出力する音声応答手段とを具備してなる
    ことを特徴とする音声認識応答装置。
JP59229248A 1984-10-31 1984-10-31 音声認識応答装置 Pending JPS61107397A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59229248A JPS61107397A (ja) 1984-10-31 1984-10-31 音声認識応答装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59229248A JPS61107397A (ja) 1984-10-31 1984-10-31 音声認識応答装置

Publications (1)

Publication Number Publication Date
JPS61107397A true JPS61107397A (ja) 1986-05-26

Family

ID=16889134

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59229248A Pending JPS61107397A (ja) 1984-10-31 1984-10-31 音声認識応答装置

Country Status (1)

Country Link
JP (1) JPS61107397A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7516077B2 (en) 2002-07-25 2009-04-07 Denso Corporation Voice control system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7516077B2 (en) 2002-07-25 2009-04-07 Denso Corporation Voice control system

Similar Documents

Publication Publication Date Title
JP3968133B2 (ja) 音声認識対話処理方法および音声認識対話装置
US6088428A (en) Voice controlled messaging system and processing method
US6687673B2 (en) Speech recognition system
US20100063820A1 (en) Correlating video images of lip movements with audio signals to improve speech recognition
KR20100083572A (ko) 신호처리장치 및 신호처리장치에서의 음성 인식 방법
JPH09106296A (ja) 音声認識装置及び方法
US20080154596A1 (en) Solution that integrates voice enrollment with other types of recognition operations performed by a speech recognition engine using a layered grammar stack
CN112513984A (zh) 电子设备及其控制方法
JPH06100959B2 (ja) 音声対話装置
US20010056345A1 (en) Method and system for speech recognition of the alphabet
US20030023439A1 (en) Method and apparatus for automatic recognition of long sequences of spoken digits
JP2000067005A (ja) 本人確認方法及びその方法を用いた装置及び本人確認装置制御プログラムを記録した記録媒体
JPS61107397A (ja) 音声認識応答装置
JPH09230889A (ja) 音声認識応答装置
JP6920730B2 (ja) 対話装置および対話プログラム
JP3846500B2 (ja) 音声認識対話装置および音声認識対話処理方法
JPH02109100A (ja) 音声入力装置
JP2002196789A (ja) 音声対話装置
Ainsworth et al. Comparing error correction strategies in speech recognition systems
EP1422691B1 (en) Method for adapting a speech recognition system
JPS6239899A (ja) 会話音声理解方法
JP2005148764A (ja) 音声認識対話処理方法および音声認識対話装置
JPS59144946A (ja) 音声タイプライタ制御方式
WO2017191710A1 (ja) 対話装置、対話装置の制御方法、および制御プログラム
JPS60205595A (ja) 音声認識応答方式