JPH07104676B2 - 適応形発声終了検出方法 - Google Patents

適応形発声終了検出方法

Info

Publication number
JPH07104676B2
JPH07104676B2 JP63046521A JP4652188A JPH07104676B2 JP H07104676 B2 JPH07104676 B2 JP H07104676B2 JP 63046521 A JP63046521 A JP 63046521A JP 4652188 A JP4652188 A JP 4652188A JP H07104676 B2 JPH07104676 B2 JP H07104676B2
Authority
JP
Japan
Prior art keywords
voice
user
message
utterance
response message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63046521A
Other languages
English (en)
Other versions
JPH01219893A (ja
Inventor
宏之 西
順治 小島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP63046521A priority Critical patent/JPH07104676B2/ja
Publication of JPH01219893A publication Critical patent/JPH01219893A/ja
Publication of JPH07104676B2 publication Critical patent/JPH07104676B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 「産業上の利用分野」 この発明は、対話形の音声入出力装置において発呼者が
用件メッセージの発声を終了したか否かを判断するため
の発声終了検出時間を合理的に設定制御するための適応
形発声終了検出方法に関するものである。
「従来の技術」 対話形の音声入出力装置は、第6図に示すように、機械
と利用者とが交互に発声を繰り返して情報の授受を行う
ものである(例えば特願昭60−27566)。この場合機械
の発声開始タイミングを得るため利用者の発声を終了時
点を知る必要がある。
利用者の発声終了時点を知るために従来は利用者の音声
の有無を監視し、無音時間長が所定の一定値を越えた時
点で発声終了と判断していた。
この場合誤検出を防ぐため十分長い無音時間を検出して
いたので、利用者から機械に発言が移る場合、冗長な印
象を与えるという問題点があった。これに対して、予想
される発声内容や、発声を開始してからの継続時間に適
応して発声終了検出時間を可変とする発声終了検出方法
が提案されている(特願昭62−185363)。しかしなが
ら、そのような手法を用いても、長い思考時間が生じる
ような対話においてはポーズ時間を発声終了と誤って検
出することがあり、適切なタイミングで発声終了を検出
することはきわめて困難であった。
「課題を解決するための手段」 請求項1によれは利用者音声の長さを測定する音声区間
長測定手段を備え、発声終了検出時間を、無音が観測さ
れる直前の有音区間(以下音声区間と呼ぶ)の長さに応
じて可変とする。請求項2によれば利用者の音声のパワ
ー値を測定する音声パワー測定手段を備え、発声終了検
出時間を、無音が検出される直前の音声パワー値に応じ
て可変とする。請求項3によれば音声検出手段からの情
報をもとに、発声開始後に検出されたポーズの長さの平
均値を計算するポーズ長平均値計算手段を備え、発声終
了検出時間を、発声終了検出動作以前に観測されたポー
ズの長さの平均値に応じて可変とする。請求項4によれ
ば音声検出手段からの情報を基に、ポーズの発生頻度を
計算するポーズ発生頻度計算手段を備え、発声終了検出
時間を、発声終了動作以前に観測されたポーズの発声頻
度に応じて可変とする。
つまりこの発明によれば人間習性に関する以下の知識を
利用して、思考時間による無音と発声終了による無音と
を識別して発声終了検出時間を適応的に制御するもので
ある。
「あの−,…」のように長い音の後はより長いポーズ
が発生する可能性が大きい。「ですが,…」のごと
く、パワー値が大きい音の後は発声が終了していない可
能性が大きい。発声開始後に観測されたポーズの平均
的な長さが長い場合、最大のポーズ時間の長さも長い傾
向にある。発声開始後に観測されたポーズの発生頻度
が大きい場合、最大のポーズ時間の長さも長い傾向にあ
る。
従って、長音の後、強調音の後、ポーズの平均長が長い
場合、ポーズの発生頻度が大きい場合には発生終了検出
時間をより長く設定してやる必要がある。
第1図〜第4図は上記からに示される性質を視覚的
に表示したものの例である。
第1図よりポーズの長さとポーズの直前の音声区間長と
には相関性があり長い音声区間の後のポーズは長くなる
可能性が高いことがわかる。従って、長い音声区間の後
における無音区間においては発声終了か一時的なポーズ
であるかの判定を行うため、より長い無音区間の観測を
必要とする。
第2図では、音声区間ごとの平均パワーレベルと、その
音声区間に続くポーズ時間との相関性から同様の考察が
できる。例えば日本語の特徴として、文章の終わりの部
分は音量が小さくなる傾向がある。逆に文章の途中でポ
ーズを挿入する場合はポーズの直前の音声の音量は大き
くなる傾向がみられる。従って有音状態から無音状態に
変化した場合に無音状態の直前の有音状態における音声
パワーの大きさを測定し、それに応じて無音状態におけ
る発声終了検出時間を可変設定すればよい。即ち、音声
パワーが大きいほど発声終了検出時間を長く設定する必
要がある。
また、第3図より発声中に観測されるポーズの長さには
個人差があり、長いポーズを含む発声者の場合、ポーズ
の長さの平均値も長いことがわかる。従って、観測され
るポーズの長さをすべて測定し、それらの平均値を求
め、これをもとに発声終了検出時間を修正していく方法
が考えられる。
第4図では観測されるポーズの発声頻度に着目して同様
の考察ができる。
「実施例」 第5図はこの発明の一実施例を示す対話形電話音声入出
力装置の回路ブロック図である。同図において、1は着
信検出回路、2は制御部、3はフックスイッチ、4はル
ープ制御回路、5は応答メッセージ蓄積部、6は通話回
路、7は応答メッセージ送出部、8は利用者メッセージ
録音部、9は音声検出回路、10は音声区間長測定手段、
11は無音区間長測定手段、12は利用者メッセージ再生部
である。
以下、同図を用いて実施例の動作を説明する。
先ず、局線から着信があると、着信検出回路1がこれを
検出し制御部2に出力する。制御部2は所定時間経過後
フックスイッチ3と並列に接続されたループ制御回路4
を作動せしめてループを閉成し、自動着信動作を終了す
る。
次に、制御部2は応答メッセージ蓄積部5に予め登録さ
れた第一の応答メッセージを、通話回路6の送話端子に
接続された応答メッセージ送出部7を動作させることに
より、局線に送出する。その後、制御部2は発呼者(利
用者)が発声した音声を以下に示す要領で利用者メッセ
ージ録音部8に録音する。
第一の応答メッセージ送出後、制御部2は音声検出回路
9からの信号をもとに発呼者が利用者メッセージを発声
中であるか否かを監視する。利用者メッセージの開始が
確認された後、発声が途切れた時点で制御部2は音声区
間長測定手段10に発声が途切れる直前の音声区間長を測
定させる。音声区間長測定手段10は制御部2の指示にし
たがって音声区間の長さを測定し制御部2に通知する。
制御部2は得られた音声区間長の情報と第1図の知識を
もとに発声終了制御τを計算する。制御部2は無音区間
長測定手段11から得られた無音区間長が発声終了検出時
間τより大きくなった時点で発声終了と判断する。ま
た、無音区間長がτより大きくなる以前に、音声検出回
路9からの情報により音声が検出され無音が終了したこ
とが分かった場合、制御部2は再び発声の途切れの監視
を開始する。
以下、上記応答メッセージの送出と利用者メッセージの
録音とを繰り返すことにより、対話録音を進める。全て
の利用者メッセージの録音が終了すると、制御部2はル
ープ制御回路4を制御して、ループを開放し、空き状態
に戻る。
本装置の所有者が、利用者メッセージを再生する場合、
制御部2は、利用者メッセージ録音部8に録音された利
用者メッセージを利用者メッセージ再生部12に再生させ
ることにより、利用者メッセージを聴取することが出来
る。
また、音声区間長測定手段11及び第1図の代わりに音声
パワー測定手段及び第2図を用いることにより同様の機
能を実現することができる。ポーズ長平均値計算手段お
よび第3図、ポーズ発生頻度計算手段及び第4図を用い
ても同様である。
「発明の効果」 以上説明したように、この発明の対話形電話音声入出力
装置を用いることにより、発呼者の発声終了を、信頼性
高く、かつ速やかに検出することができる。即ち、発声
終了以前に機械が割り込む動作を防止するとともに、応
答時間の短縮により、使い勝手を向上させることが可能
となる。
【図面の簡単な説明】
第1図はポーズ区間長とポーズ直前の音声区間長との相
関関係を示す図、第2図はポーズ区間長とポーズ直前の
音声区間のパワー値との相関関係を示す図、第3図は最
大ポーズ区間長とポーズ長の平均値との相関関係を示す
図、第4図は最大ポーズ区間長とポーズ発声頻度との相
関関係を示す図、第5図はこの発明を対話形留守番電話
装置に適用した例を示すブロック図、第6図は対話形音
声入出力装置の処理例を示す図である。

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】複数または任意の応答メッセージを格納す
    る応答メッセージ蓄積手段と、応答メッセージ音声を直
    接または電話回線を通して利用者に送出する応答メッセ
    ージ送出手段と、利用者の音声メッセージを録音または
    認識する利用者メッセージ入力手段と、利用者が発声中
    であるか否かを検出する音声検出手段と、その音声検出
    手段からの情報により、利用者音声中に観測される無音
    時間の長さが所定の発声終了検出時間に達することをも
    って発声終了を検出する発声終了検出手段とを備え、応
    答メッセージの送出と利用者メッセージの入力とを対話
    形式で繰り返すことにより情報の入出力を行う対話形音
    声入出力装置において、 利用者音声の長さを測定する音声区間長測定手段を備
    え、発声終了検出時間を、無音が観測される直前の有音
    区間の長さに応じて可変とすることを特長とする適応形
    発声終了検出方法。
  2. 【請求項2】複数または任意の応答メッセージを格納す
    る応答メッセージ蓄積手段と、応答メッセージ音声を直
    接または電話回線を通して利用者に送出する応答メッセ
    ージ送出手段と、利用者の音声メッセージを録音または
    認識する利用者メッセージ入力手段と、利用者が発声中
    であるか否かを検出する音声検出手段と、その音声検出
    手段からの情報により、利用者音声中に観測される無音
    時間の長さが所定の発声終了検出時間に達することをも
    って発声終了を検出する発声終了検出手段とを備え、応
    答メッセージの送出と利用者メッセージの入力とを対話
    形式で繰り返すことにより情報の入出力を行う対話形音
    声入出力装置において、 利用者の音声のパワー値を測定する音声パワー測定手段
    を備え、発声終了検出時間を、無音が検出される直前の
    音声パワー値に応じて可変とすることを特徴とする適応
    形発声終了検出方法。
  3. 【請求項3】複数または任意の応答メッセージを格納す
    る応答メッセージ蓄積手段と、応答メッセージ音声を直
    接または電話回線を通して利用者に送出する応答メッセ
    ージ送出手段と、利用者の音声メッセージを録音または
    認識する利用者メッセージ入力手段と、利用者が発声中
    であるか否かを検出する音声検出手段と、その音声検出
    手段からの情報により、利用者音声中に観測される無音
    時間の長さが所定の発声終了検出時間に達することをも
    って発声終了を検出する発声終了検出手段とを備え、応
    答メッセージの送出と利用者メッセージの入力とを対話
    形式で繰り返すことにより情報の入出力を行う対話形音
    声入出力装置において、 音声検出手段からの情報をもとに、発声開始後に検出さ
    れたポーズの長さの平均値を計算するポーズ長平均値計
    算手段を備え、発声終了検出時間を、発声終了検出動作
    以前に観測されたポーズの長さの平均値に応じて可変と
    することを特徴とする適応形発声終了検出方法。
  4. 【請求項4】複数または任意の応答メッセージを格納す
    る応答メッセージ蓄積手段と、応答メッセージ音声を直
    接または電話回線を通して利用者に送出する応答メッセ
    ージ送出手段と、利用者の音声メッセージを録音または
    認識する利用者メッセージ入力手段と、利用者が発声中
    であるか否かを検出する音声検出手段と、その音声検出
    手段からの情報により、利用者音声中に観測される無音
    時間の長さが所定の発声終了検出時間に達することをも
    って発声終了を検出する発声終了検出手段とを備え、応
    答メッセージの送出と利用者メッセージの入力とを対話
    形式で繰り返すことにより情報の入出力を行う対話形音
    声入出力装置において、 音声検出手段からの情報を基に、ポーズの発生頻度を計
    算するポーズ発生頻度計算手段を備え、発声終了検出時
    間を、発声終了動作以前に観測されたポーズの発生頻度
    に応じて可変とすることを特徴とする適応形発声終了検
    出方法。
JP63046521A 1988-02-29 1988-02-29 適応形発声終了検出方法 Expired - Fee Related JPH07104676B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63046521A JPH07104676B2 (ja) 1988-02-29 1988-02-29 適応形発声終了検出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63046521A JPH07104676B2 (ja) 1988-02-29 1988-02-29 適応形発声終了検出方法

Publications (2)

Publication Number Publication Date
JPH01219893A JPH01219893A (ja) 1989-09-01
JPH07104676B2 true JPH07104676B2 (ja) 1995-11-13

Family

ID=12749578

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63046521A Expired - Fee Related JPH07104676B2 (ja) 1988-02-29 1988-02-29 適応形発声終了検出方法

Country Status (1)

Country Link
JP (1) JPH07104676B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024010284A1 (ko) * 2022-07-06 2024-01-11 삼성전자주식회사 끝점 검출 시간 결정 방법 및 상기 방법을 수행하는 전자 장치

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004094077A (ja) * 2002-09-03 2004-03-25 Nec Corp 音声認識装置及び制御方法並びにプログラム
US10269341B2 (en) 2015-10-19 2019-04-23 Google Llc Speech endpointing
KR101942521B1 (ko) 2015-10-19 2019-01-28 구글 엘엘씨 음성 엔드포인팅
EP4083998A1 (en) 2017-06-06 2022-11-02 Google LLC End of query detection
US10929754B2 (en) 2017-06-06 2021-02-23 Google Llc Unified endpointer using multitask and multidomain learning
JP7409381B2 (ja) * 2019-07-24 2024-01-09 日本電信電話株式会社 発話区間検出装置、発話区間検出方法、プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024010284A1 (ko) * 2022-07-06 2024-01-11 삼성전자주식회사 끝점 검출 시간 결정 방법 및 상기 방법을 수행하는 전자 장치

Also Published As

Publication number Publication date
JPH01219893A (ja) 1989-09-01

Similar Documents

Publication Publication Date Title
US8473290B2 (en) Voice barge-in in telephony speech recognition
EP0809841B1 (en) Voice activity detection
MX2008016354A (es) Deteccion de una maquina contestadora utilizando reconocimiento de dialogo.
WO2006077626A1 (ja) 話速変換方法及び話速変換装置
JPH07104676B2 (ja) 適応形発声終了検出方法
JP2017216603A (ja) 電話装置
US6625474B1 (en) Method and apparatus for audio signal based answer call message generation
JPS61189057A (ja) 対話形留守番電話装置
JPS6345950A (ja) 対話形音声応答装置
JP2556978B2 (ja) 対話形留守番電話装置
JP2636002B2 (ja) 対話型留守番電話機
JP2590193B2 (ja) 対話形音声応答装置
JPS60535A (ja) 通信装置
JPH03276947A (ja) 対話型留守番電話機
JP2590366B2 (ja) 対話形留守番電話機
JPH11177681A (ja) 留守録機能付通信装置
JPH01306897A (ja) 音声検出回路
JPH06188966A (ja) 留守番電話装置
KR100228916B1 (ko) 음성사서함에 메시지 녹음시 가청시보음을 제공하는 방법
JPH01181261A (ja) 留守番電話装置
JPH07177217A (ja) 留守番電話の発信音検出方法
JP2635970B2 (ja) 留守番電話機
JPS6328387B2 (ja)
JPS63299446A (ja) 音声等の音による機械入力方式
JPH04167650A (ja) 音声応答認識装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees