JPH037119B2 - - Google Patents

Info

Publication number
JPH037119B2
JPH037119B2 JP57002566A JP256682A JPH037119B2 JP H037119 B2 JPH037119 B2 JP H037119B2 JP 57002566 A JP57002566 A JP 57002566A JP 256682 A JP256682 A JP 256682A JP H037119 B2 JPH037119 B2 JP H037119B2
Authority
JP
Japan
Prior art keywords
voice
noise level
recognition device
speech
voice response
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP57002566A
Other languages
English (en)
Other versions
JPS58120297A (ja
Inventor
Naoki Ishii
Ryohei Nakatsu
Hiromi Nagashima
Junji Kojima
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP57002566A priority Critical patent/JPS58120297A/ja
Publication of JPS58120297A publication Critical patent/JPS58120297A/ja
Publication of JPH037119B2 publication Critical patent/JPH037119B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Description

【発明の詳細な説明】 〈発明の背景〉 この発明は主として音声応答装置、音声認識装
置から構成され、電話回線を通して多数の利用者
に対して音声による対話形式でサービスを提供す
る音声応答認識装置において、各種の周囲雑音、
回線雑音が重畳された入力信号から音声区間を正
確に検出し、音声認識の認識率の向上を可能とす
るものである。
音声応答技術、音声認識技術の進歩に伴つて高
品質の合成音の作成、不特定多数話者の音声認識
が可能になつてきた。これらの技術を利用すれば
広く普及している電話機を端末として多数の利用
者に対して銀行の振込照合、通知、各種の予約業
務等のサービスを対話形式で提供できるようにな
る。
これらのサービスを実施するに当つて認識技術
の上で問題になるものの一つは入力信号からの音
声区間を正確に切り出すことである。入力信号に
は各種の周囲雑音、回線雑音が重畳されており、
これらの雑音レベルは条件により大きく変動す
る。このような状況のもとで音声区間を正確に切
り出す方法として雑音レベルを前もつて測定し、
これをもとに音声切出しのためのしきい値を定め
る方法がある。この音声区間検出方法の様子を示
したのが第1図である。第1図において入力信号
1のレベルに対し、測定した雑音レベル2をもと
に、音声切出し用しきい値3を決定し、入力信号
1のレベルがこのしきい値3より大きくなつた区
間4を音声区間として検出する。
このような従来技術では雑音レベル2をいつ測
定するかが問題であつた。すなわち、雑音レベル
を測定している際に音声が入力されると雑音レベ
ル2は大きな値になり、これに伴つて音声切出し
用しきい値3も不当に大きな値になる。このよう
なしきい値3を用いると入力音声の音声区間4が
正しく検出されなかつたり、入力音声が存在しな
いと断面される誤りが生じやすい。しかるに音声
が入力されるタイミングを事前に知ることは困難
であるため、雑音レベルを測定するタイミングを
明確に示した音声応答認識装置は現在まで提案さ
れていないのが実情である。
〈発明の概要〉 以上のような従来技術の持つ欠点を除去するた
め、この発明では送出される案内音声中の短い切
れ目、いわゆる無音区間を利用して雑音レベルの
測定を行なうことを特徴とし、その目的は種々の
周囲雑音、回線雑音の重畳した入力信号中からで
も音声区間を正しく検出することにある。更にこ
の発明においてはあらかじめ内部にしきい値をも
うけておき、無音区間で測定された雑音レベルが
そのあらかじめ設けたしきい値より大きい場合に
は再度雑音レベルの測定を行なうことにより正し
い音声区間の検出をより確実に行うことができ
る。
〈実施例〉 第2図は第2図は音声応答認識装置の構成例を
示し、音声応答装置5、音声認識装置6は制御装
置7に接続されると共にこれらは網制御装置8に
接続される。網制御装置8は交換器9に端末の電
話機10と共に収容されている。
銀行業務における振込通知サービスを例にとつ
てこのシステムの動作を述べる。制御装置7にこ
の図には示してない上位装置から利用者に通知す
べき振込データが送られてくると、制御装置7の
指示により網制御装置8はその利用者の電話機に
対し自動呼出を行う。網制御装置8が交換機9を
通して利用者の電話機10につながり、その利用
者が応答すると、まず音声応答装置5から振込通
知の開始を案内する案内文が送出される。例えば
第3図に示すように「こちらは××銀行でござい
ます。振込のご通知を致します。よろしければ
「どうぞ」とおつしやつて下さい。」なる案内文の
音声が送出される。この送出の直後に網制御装置
8は回線を音声認識装置6の方に切りかえてお
く。次に利用者からの振込通知開始を指示する音
声、例えば「どうぞ」が入力されると、これは音
声認識装置6に送られて認識され、その結果は制
御装置7に送られる。それによつて制御装置7は
音声応答装置5へ振込に関する情報の送出を指示
し、例えば「振込は2件です。1番○○○○様か
ら○○円、2番△△△△様から△△円」なる音声
が利用者の電話機へ送られる。このように利用者
とシステムとの間の音声による対話形式でサービ
スの提供が行われる。
第4図はこの発明による雑音測定のシーケンス
を示すタイムヤチヤートである。同図Aは網制御
装置8による音声応答装置5、音声認識装置6の
回線の切り換えタイミングを示しており音声応答
装置5が回線に接続されている状態111で示
し、音声認識装置6が回線へ接続されている状態
を112で示している。同図Bは音声認識装置6
の動作タイミングを示しており、雑音レベルの測
定タイミングを121、認識動作を行うタイミン
グを122でそれぞれ示している。音声認識装置
6では音声の特徴抽出の一つの過程として入力信
号のレベルを測定する機能をもつているから雑音
レベル測定は音声認識装置6で容易に行うことが
できる。同図Cは音声応答装置5から送出される
案内文を示し、同図Dは入力音声信号を示してお
り、正しいタイミングで入力された音声を141
で示している。
音声応答装置5から送出される案内文中には当
然短い無音区間がある。制御装置7はこの切れ目
(無音区間)を利用して網制御装置8へ回線を音
声認識装置6側へ切換える指示を行い、同時に音
声認識装置6に雑音レベルの測定を指示する。案
内文が送出されている間、利用者は音声を発声せ
ずに案内文を聞いている。しかも、案内文中の無
音区間は通常非常に短い、一般に一秒ないしそれ
以下であるから、通常この間に利用者が音声を発
声することはない。したがつて雑音レベル測定タ
イミング121では正しい雑音レベルが測定さ
れ、それに伴つて決定されたしきい値を使つて認
識動作タイミング122において認識動作を行
う。このようにして入力された音声141を正し
く検出することが可能となる。
以上述べた音声区間検出における雑音レベルの
測定は案内文が送出されている間においては利用
者はその案内文を聞き取ろうとするため音声を発
声しないという性質を利用している。しかしなが
ら、利用者が雑音レベル測定タイミング121で
偶然、くしやみ、せきばらいをしたり、或は背景
で衝撃音が生じた場合には定常的な雑音レベルよ
り大きな値が測定されることがあり、このような
測定値に基づいて決定された音声切出し用しきい
値を使うと正しい音声区間の検出が行なえなくな
るおそれがある。
このような状況を防ぐには測定した雑音レベル
があらかじめ定めたしきい値より大きい場合には
雑音の再測定を行うようにすればよい。第5図は
その場合の雑音再測定のシーケンスを示すタイム
チヤートである。同図A〜Dは第4図A〜Dと同
一である。この例では雑音レベル測定のタイミン
グが121の後に123が認識動作タイミング1
22より前に設けられている。雑音レベル測定タ
イミング121において、第5図Dに示すように
音、例えばせきばらい142が入力さていること
を示している。最初の雑音レベル測定タイミング
121では音142が入力されているため雑音測
定値が大きな値となる。制御装置7はその受取つ
た雑音測定値を内部にあらかじめ持つているしき
い値と比較し、測定値がしきい値より大きければ
案内文中の次の無音区間112において再び網制
御装置8に対し、音声認識装置6側に回線を切り
かえると共に音声認識装置6に雑音レベル再測定
を指示する。これを受けて音声認識装置6ではタ
イミング123において雑音レベルを再び測定す
る。その測定値によつて決定された音声切出し用
しきい値を用いて認識動作タイミング122にお
いて認識動作を行う。
以上述べたように、この発明は利用者と音声で
対話しながら各種のサービスを行う音声応答認識
装置において、装置より送出される案内文中の短
い切目を利用して雑音レベルの測定を行い、この
測定値に基づいて音声切出し用しきい値を定める
ようにしており、案内文が送出されている間は音
声が入力されないことを利用して、確実な雑音測
定値測定を行い、また、これに基づいて決定した
音声切出し用しきい値によつて正確に音声区間検
出を行うことができる。
また、雑音レベル測定時に利用者がせきばらい
をしたり、背景で衝撃音が生じたりした場合は、
あらかじめ装置内部にしきい値を持つておき、こ
のしきい値より雑音測定値が大きい場合には再度
雑音レベル測定を行うことにより音声切出し用し
きい値の設定とそれを用いて行う音声区間検出を
更に正確に行うことが可能となる。
なお、以上の説明において雑音測定の回数につ
いては特に言及しなかつたが、これはシステムを
作成する際、外部条件に応じて定めれば良い。例
えばしきい値以下になるまで何度でも再測定する
という方式でもかまわない。また、測定の回数に
上限をもうけておき、上限値まで測定してもしき
い値以下の測定レベルが得られない場合はあらか
じめシステムで用意している固定の音声切出し用
しきい値を用いるようにしてもよい。
【図面の簡単な説明】
第1図は音声区間検出の一方法を説明するため
の音声と、雑音としきい値との関係を示す図、第
2図は音声応答認識装置の構成例を示すブロツク
図、第3図は音声応答認識装置における利用者と
装置の交話例を示す図、第4図はこの発明による
音声区間検出方法の一例を示すタイムチヤート、
第5図はこの発明による音声区間検出方法の他の
例を示すタイムチヤートである。 1……入力信号、2……雑音レベル、3……音
声切出し用しきい値、4……音声区間、5……音
声応答装置、6……音声認識装置、7……制御装
置、8……網制御装置、9……交換機、10……
電話機、111……回線の音声応答装置への接続
タイミング、112……回線の音声認識装置への
接続タイミング、121……雑音測定タイミン
グ、122……認識動作タイミング、141……
正しいタイミングで入力された音声、123……
雑音レベル再測定タイミング、142……雑音測
定時に入力された音。

Claims (1)

  1. 【特許請求の範囲】 1 電話回線に音声メツセージを送出する音声応
    答装置と、電話回線を通して入力される音声を、
    しきい値を用いて音声区間を検出して認識する音
    声認識装置とを有し、電話回線を前記音声応答装
    置と前記音声認識装置とに切替えて、電話機の利
    用者に対して音声による対話形式で各種のサービ
    スを提供する音声応答認識装置において、 前記音声応答装置からの音声メツセージ中の無
    音区間にそのサービス中の回線を前記音声認識装
    置へ切替える手段と、 その回線の雑音レベルを測定する手段と、 その測定雑音レベルをもとにして前記音声認識
    装置における音声区間検出用のしきい値を決定す
    る手段とを具備することを特徴とする、 音声応答認識装置。 2 電話回線に音声メツセージを送出する音声応
    答装置と、電話回線を通して入力される音声を、
    しきい値を用いて音声区間を検出して認識する音
    声認識装置とを有し、電話回線を前記音声応答装
    置と前記音声認識装置とに切替えて、電話機の利
    用者に対して音声による対話形式で各種のサービ
    スを提供する音声応答認識装置において、 前記音声応答装置からの音声メツセージ中の無
    音区間にそのサービス中の回線を前記音声認識装
    置へ切替える手段と、 その回線の雑音レベルを測定する手段と、 その測定雑音レベルを基準値と比較する手段
    と、 その測定雑音レベルが前記基準値以下の場合に
    は、その測定雑音レベルをもとにして前記音声認
    識装置における音声区間検出用のしきい値を決定
    する手段と、 前記測定雑音レベルが前記基準値を越える場合
    には、その雑音レベルを測定した無音区間の次に
    到来する無音区間に再度前記雑音レベルを測定す
    る手段と、 その測定雑音レベルをもとにして前記音声認識
    装置における音声区間検出用のしきい値を決定す
    る手段とを具備することを特徴とする、 音声応答認識装置。
JP57002566A 1982-01-11 1982-01-11 音声応答認識装置 Granted JPS58120297A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57002566A JPS58120297A (ja) 1982-01-11 1982-01-11 音声応答認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57002566A JPS58120297A (ja) 1982-01-11 1982-01-11 音声応答認識装置

Publications (2)

Publication Number Publication Date
JPS58120297A JPS58120297A (ja) 1983-07-18
JPH037119B2 true JPH037119B2 (ja) 1991-01-31

Family

ID=11532914

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57002566A Granted JPS58120297A (ja) 1982-01-11 1982-01-11 音声応答認識装置

Country Status (1)

Country Link
JP (1) JPS58120297A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11506845A (ja) * 1995-09-11 1999-06-15 ダイムラー−ベンツ エーロスペイス アクチエンゲゼルシャフト 実時間作動での音声対話又は音声命令による1つ又は複数の機器の自動制御方法及びこの方法を実施する装置

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61116400A (ja) * 1984-11-12 1986-06-03 シャープ株式会社 音声情報処理装置
JP2708913B2 (ja) * 1989-10-23 1998-02-04 株式会社日立製作所 音声検出出力装置
JP2013186228A (ja) * 2012-03-07 2013-09-19 Seiko Epson Corp 音声認識処理装置及び音声認識処理方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56135898A (en) * 1980-03-26 1981-10-23 Sanyo Electric Co Voice recognition device

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56135898A (en) * 1980-03-26 1981-10-23 Sanyo Electric Co Voice recognition device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11506845A (ja) * 1995-09-11 1999-06-15 ダイムラー−ベンツ エーロスペイス アクチエンゲゼルシャフト 実時間作動での音声対話又は音声命令による1つ又は複数の機器の自動制御方法及びこの方法を実施する装置

Also Published As

Publication number Publication date
JPS58120297A (ja) 1983-07-18

Similar Documents

Publication Publication Date Title
US10320982B2 (en) Speech recognition method of and system for determining the status of an answered telephone during the course of an outbound telephone call
US9571638B1 (en) Segment-based queueing for audio captioning
US5081673A (en) Voice bridge for relay center
JP2011022600A (ja) 音声認識システムの動作方法
KR100526216B1 (ko) 대화형 장치
JPH037119B2 (ja)
JPH07110021B2 (ja) 対話形音声応答装置
JP2929676B2 (ja) 留守番電話装置
US11445056B1 (en) Telephone system for the hearing impaired
JP7097584B2 (ja) 不要電話対策システム
CN113271491B (zh) 电子装置以及播放控制方法
JPH10240284A (ja) 音声検出方法及び装置
JPH0519734B2 (ja)
CA2712853C (en) Speech recognition method and system to determine the status of an outbound telephone call
JPS6143862A (ja) 音声認識装置
CA1320602C (en) Voice bridge for a relay center
JPH04280152A (ja) 音声応答装置の負荷試験用擬似呼装置
KR100232787B1 (ko) 자동응답시스템에서 메모 확인 정보 전송 방법
KR200240708Y1 (ko) 음성전송 단축다이얼 장치
JPH10224484A (ja) 自動回り込み減衰機能付き音声応答装置
JPH01318455A (ja) 通信装置
JPH0470156A (ja) 情報送信装置
JPH03276947A (ja) 対話型留守番電話機
JPH06291883A (ja) ファクシミリ装置
JPH1068788A (ja) 自動時刻合わせ装置