JPH01219893A - 適応形発声終了検出方法 - Google Patents

適応形発声終了検出方法

Info

Publication number
JPH01219893A
JPH01219893A JP63046521A JP4652188A JPH01219893A JP H01219893 A JPH01219893 A JP H01219893A JP 63046521 A JP63046521 A JP 63046521A JP 4652188 A JP4652188 A JP 4652188A JP H01219893 A JPH01219893 A JP H01219893A
Authority
JP
Japan
Prior art keywords
voice
user
length
utterance
message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63046521A
Other languages
English (en)
Other versions
JPH07104676B2 (ja
Inventor
Hiroyuki Nishi
宏之 西
Junji Kojima
小島 順治
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP63046521A priority Critical patent/JPH07104676B2/ja
Publication of JPH01219893A publication Critical patent/JPH01219893A/ja
Publication of JPH07104676B2 publication Critical patent/JPH07104676B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 「産業上の利用分野」 この発明は、対話形の音声入出力装置において発呼者が
用件メツセージの発声を終了したか否かを判断するため
の発声終了検出時間を合理的に設定制御するための適応
形発声終了検出方法に関するものである。
「従来の技術」 対話形の音声入出力装置は、第6図に示すように、機械
と利用者とが交互に発声を繰り返して情報の授受を行う
ものである(例えば特願昭60−27566 ) 、こ
の場合機械の発声開始タイミングを得るため利用者の発
声の終了時点を知る必要がある。
利用者の発声終了時点を知るために従来は利用者の音声
の有無を監視し、無音時間長が所定の一定値を越えた時
点で発声終了と判断していた。
この場合誤検出を防ぐため十分長い無音時間を検出して
いたので、利用者から機械に発言が移る場合、冗長な印
象を与えるという問題点があった。
これに対して、予想される発声内容や、発声を開始して
からの継続時間に適応して発声終了検出時間を可変とす
る発声終了検出方法が提案されている(特願昭62−1
85363 )。しかしながら、そのような手法を用い
ても、長い思考時間が生じるような対話においてはポー
ズ時間を発声終了と誤って検出することがあり、適切な
タイミングで発声終了を検出することはきわめて困難で
あった。
「課題を解決するための手段」 請求項1によれば利用者音声の長さを測定する音声区間
長測定手段を備え、発声終了検出時間を、無音が観測さ
れる直前の音声区間の長さに応じて可変とする。請求項
2によれば利用者の音声のパワー値を測定する音声パワ
ー測定手段を備え、発声終了検出時間を、無音が検出さ
れる直前の音声パワー値に応じて可変とする。請求項3
によれば音声検出手段からの情報をもとに、発声開始後
に検出されたポーズの長さの平均値を計算するポーズ長
平均値計算手段を備え、発声終了検出時間を、発声終了
検出動作以前に観測されたポーズの長さの平均値に応じ
て可変とする。請求項4によれば音声検出手段からの情
報を基に、ポーズの発声頻度を計算するポーズ発生頻度
計算手段を備え、発声終了検出時間を、発声終了動作以
前に観測されたポーズの発生頻度に応じて可変とする。
つまりこの発明によれば人間習性に関する以下の知識を
利用して、思考時間による無音と発声終了による無音と
を識別して発声終了検出時間を適応的に制御するもので
ある。
■「あの二、・・・」のように長い音の後はより長いポ
ーズが発生する可能性が大きい。■「です皇。
・・・」のごとく、パワー値が大きい音の後は発声が終
了していない可能性が大きい。■発声開始後に観測され
たポーズの平均的な長さが長い場合、最大のポーズ時間
9長さも長い傾向にある。■発声開始後に観測されたポ
ーズの発生頻度が大きい場合、最大のポーズ時間の長さ
も長い傾向にある。
従って、長音の後、強調音の後、ポーズの平均長が長い
場合、ポーズの発生頻度が大きい場合には発生終了検出
時間をより長く設定してやる必要がある。
第1図〜第4図は上記■から■に示される性質を視覚的
に表示したものの例である。
第1図よりポーズの長さとポーズの直前の音声区間長と
には相関性があり長い音声区間の後のポーズは長(なる
可能性が高いことがわかる。従って、長い音声区間の後
における無音区間においては発声終了か一時的なポーズ
であるかの判定を行うため、より長い無音区間の観測を
必要とする。
第2図では、音声区間ごとの平均パワーレベルと、その
音声区間に続くポーズ時間との相関性から同様の考察が
できる。例えば日本語の特徴として、文章の終わりの部
分は音量が小さくなる傾向がある。逆に文章の途中でポ
ーズを挿入する場合はポーズの直前の音声の音量は大き
くなる傾向がみられる。従って有音状態から無音状態に
変化した場合に無音状態の直前の有音状態における音声
パワーの大きさを測定し、それに応じて無音状態におけ
る発声終了検出時間を可変設定すればよい。
即ち、音声パワーが大きいほど発声終了検出時間を長く
設定する必要がある。
また、第3図より発声中にWL測されるポーズの長さに
は個人差があり、長いポーズを含む発声者の場合、ポー
ズの長さの平均値も長いことがわかる。従って、観測さ
れるポーズの長さをすべて測定し、それらの平均値を求
め、これをもとに発声終了検出時間を修正していく方法
が考えられる。
第4図では観測されるポーズの発声頻度に着目して同様
の考察ができる。
「実施例」 第5図はこの発明の一実施例を示す対話形電話音声入出
力装置の回路プロンク図である。同図において、1は着
信検出回路、2は制御部、3はフックスイッチ、4はル
ープ制御回路、5は応答メツセージ蓄積部、6は通話回
路、7は応答メッセージ送出部、8は利用者メツセージ
録音部、9は音声検出回路、10は音声区間長測定手段
、11は無音区間長測定手段、12は利用者メツセージ
再生部である。
以下、同図を用いて実施例の動作を説明する。
先ず、局線から着信があると、着信検出回路1がこれを
検出し制御部2に出力する。制御部2は所定時間経過後
フックスイッチ3と並列に接続されたループ制御回路4
を作動せしめてループを閉成し、自動着信動作を終了す
る。
次に、制御部2は応答メツセージ蓄積部5に予め登録さ
れた第一の応答メツセージを、通話回路6の送話端子に
接続された応答メツセージ送出部7を動作させることに
より、局線に送出する。その後、制御部2は発呼者(利
用者)が発声した音声を以下に示す要領で利用者メツセ
ージ、録音部8に録音する。
第一の応答メツセージ送出後、制御部2は音声検出回路
9からの信号をもとに発呼者が利用者メツセージを発声
中であるか否かを監視する。利用者メッセージの開始が
確認された後、発声が途切れた時点で制御部2は音声区
間長測定手段10に発声が途切れる直前の音声区間長を
測定させる。
音声区間長測定手段10は制御部2の指示にしたがって
音声区間の長さを測定し制御部2に通知する。制御部2
は得られた音声区間長の情報と第1図の知識をもとに発
声終了時間τを計算する。制御部2は無音区間長測定手
段11から得られた無音区間長が発声終了検出時間τよ
り大きくなった時点で発声終了と判断する。また、無音
区間長がτより大きくなる以前に、音声検出回路9から
の情報により音声が検出され無音が終了したことが分か
った場合、制御部2は再び発声の途切れの監視を開始す
る。
以下、上記応答メッセージの送出と利用者メッセージの
録音とを繰り返すことにより、対話録音を進める。全て
の利用者メツセージの録音が終了すると、制御部2はル
ープ制御回路4を制御して、ループを開放し、空き状態
に戻る。
本装置の所有者が、利用者メツセージを再生する場合、
′!61制御部2は、利用者メツセージ録音部8に録音
された利用者メツセージを利用者メツセージ再生部12
に再生させることにより、利用者メツセージを聴取する
ことが出来る。
また、音声区間長測定手段11及び第1図の代わりに音
声パワー測定手段及び第2図を用いることにより同様の
機能を実現することができる。ポーズ長平均値計算手段
および第3図、ポーズ発生頻度計算手段及び第4図を用
いても同様である。
「発明の効果」 以上説明したように、この発明の対話形電話音声人出力
装置を用いることにより、発呼音の発声終了を、信頼性
高く、かつ速やかに検出することができる。即ち、発声
終了以前に機械が割り込む動作を防止するとともに、応
答時間の短縮により、使い勝手を向上させることが可能
となる。
【図面の簡単な説明】
第1図はポーズ区間長とポーズ直前の音声区間長との相
関関係を示す図、第2図はポーズ区間長とポーズ直前の
音声区間のパワー値との相関関係を示す図、第3図は最
大ポーズ区間長とポーズ長の平均値との相関関係を示す
図、第4図は最大ポーズ区間長とポーズ発生頻度との相
関関係を示す図、第5図はこの発明を対話形留守番電話
装置に適用した例を示すブロック図、第6図は対話形音
声入出力装置の処理例を示す図である。 特許出願人  日本電信電話株式会社

Claims (4)

    【特許請求の範囲】
  1. (1)複数または任意の応答メッセージを格納する応答
    メッセージ蓄積手段と、応答メッセージ音声を直接また
    は電話回線を通して利用者に送出する応答メッセージ送
    出手段と、利用者の音声メッセージを録音または認識す
    る利用者メッセージ入力手段と、利用者が発声中である
    か否かを検出する音声検出手段と、その音声検出手段か
    らの情報により、利用者音声中に観測される無音時間の
    長さが所定の発声終了検出時間に達することをもって発
    声終了を検出する発声終了検出手段とを備え、応答メッ
    セージの送出と利用者メッセージの入力とを対話形式で
    繰り返すことにより情報の入出力を行う対話形音声入出
    力装置において、 利用者音声の長さを測定する音声区間長測定手段を備え
    、発声終了検出時間を、無音が観測される直前の音声区
    間の長さに応じて可変とすることを特徴とする適応形発
    声終了検出方法。
  2. (2)複数または任意の応答メッセージを格納する応答
    メッセージ蓄積手段と、応答メッセージ音声を直接また
    は電話回線を通して利用者に送出する応答メッセージ送
    出手段と、利用者の音声メッセージを録音または認識す
    る利用者メッセージ入力手段と、利用者が発声中である
    か否かを検出する音声検出手段と、その音声検出手段か
    らの情報により、利用者音声中に観測される無音時間の
    長さが所定の発声終了検出時間に達することをもって発
    声終了を検出する発声終了検出手段とを備え、応答メッ
    セージの送出と利用者メッセージの入力とを対話形式で
    繰り返すことにより情報の入出力を行う対話形音声入出
    力装置において、 利用者の音声のパワー値を測定する音声パワー測定手段
    を備え、発声終了検出時間を、無音が検出される直前の
    音声パワー値に応じて可変とすることを特徴とする適応
    形発声終了検出方法。
  3. (3)複数または任意の応答メッセージを格納する応答
    メッセージ蓄積手段と、応答メッセージ音声を直接また
    は電話回線を通して利用者に送出する応答メッセージ送
    出手段と、利用者の音声メッセージを録音または認識す
    る利用者メッセージ入力手段と、利用者が発声中である
    か否かを検出する音声検出手段と、その音声検出手段か
    らの情報により、利用者音声中に観測される無音時間の
    長さが所定の発声終了検出時間に達することをもって発
    声終了を検出する発声終了検出手段とを備え、応答メッ
    セージの送出と利用者メッセージの入力とを対話形式で
    繰り返すことにより情報の入出力を行う対話形音声入出
    力装置において、 音声検出手段からの情報をもとに、発声開始後に検出さ
    れたポーズの長さの平均値を計算するポーズ長平均値計
    算手段を備え、発声終了検出時間を、発声終了検出動作
    以前に観測されたポーズの長さの平均値に応じて可変と
    することを特徴とする適応形発声終了検出方法。
  4. (4)複数または任意の応答メッセージを格納する応答
    メッセージ蓄積手段と、応答メッージ音声を直接または
    電話回線を通して利用者に送出する応答メッセージ送出
    手段と、利用者の音声メッセージを録音または認識する
    利用者メッセージ入力手段と、利用者が発声中であるか
    否かを検出する音声検出手段と、その音声検出手段から
    の情報により、利用者音声中に観測される無音時間の長
    さが所定の発声終了検出時間に達することをもって発声
    終了を検出する発声終了検出手段とを備え、応答メッセ
    ージの送出と利用者メッセージの入力とを対話形式で繰
    り返すことにより情報の入出力を行う対話形音声入出力
    装置において、 音声検出手段からの情報を基に、ポーズの発声頻度を計
    算するポーズ発声頻度計算手段を備え、発声終了検出時
    間を、発声終了動作以前に観測されたポーズの発生頻度
    に応じて可変とすることを特徴とする適応形発声終了検
    出方法。
JP63046521A 1988-02-29 1988-02-29 適応形発声終了検出方法 Expired - Fee Related JPH07104676B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63046521A JPH07104676B2 (ja) 1988-02-29 1988-02-29 適応形発声終了検出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63046521A JPH07104676B2 (ja) 1988-02-29 1988-02-29 適応形発声終了検出方法

Publications (2)

Publication Number Publication Date
JPH01219893A true JPH01219893A (ja) 1989-09-01
JPH07104676B2 JPH07104676B2 (ja) 1995-11-13

Family

ID=12749578

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63046521A Expired - Fee Related JPH07104676B2 (ja) 1988-02-29 1988-02-29 適応形発声終了検出方法

Country Status (1)

Country Link
JP (1) JPH07104676B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004094077A (ja) * 2002-09-03 2004-03-25 Nec Corp 音声認識装置及び制御方法並びにプログラム
JP2017078848A (ja) * 2015-10-19 2017-04-27 グーグル インコーポレイテッド スピーチエンドポインティング
US10269341B2 (en) 2015-10-19 2019-04-23 Google Llc Speech endpointing
US10593352B2 (en) 2017-06-06 2020-03-17 Google Llc End of query detection
JPWO2021014612A1 (ja) * 2019-07-24 2021-01-28
US11676625B2 (en) 2017-06-06 2023-06-13 Google Llc Unified endpointer using multitask and multidomain learning

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024010284A1 (ko) * 2022-07-06 2024-01-11 삼성전자주식회사 끝점 검출 시간 결정 방법 및 상기 방법을 수행하는 전자 장치

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004094077A (ja) * 2002-09-03 2004-03-25 Nec Corp 音声認識装置及び制御方法並びにプログラム
JP2017078848A (ja) * 2015-10-19 2017-04-27 グーグル インコーポレイテッド スピーチエンドポインティング
JP2017078869A (ja) * 2015-10-19 2017-04-27 グーグル インコーポレイテッド スピーチエンドポインティング
US10269341B2 (en) 2015-10-19 2019-04-23 Google Llc Speech endpointing
US11062696B2 (en) 2015-10-19 2021-07-13 Google Llc Speech endpointing
US11710477B2 (en) 2015-10-19 2023-07-25 Google Llc Speech endpointing
US10593352B2 (en) 2017-06-06 2020-03-17 Google Llc End of query detection
US11551709B2 (en) 2017-06-06 2023-01-10 Google Llc End of query detection
US11676625B2 (en) 2017-06-06 2023-06-13 Google Llc Unified endpointer using multitask and multidomain learning
JPWO2021014612A1 (ja) * 2019-07-24 2021-01-28
WO2021014612A1 (ja) * 2019-07-24 2021-01-28 日本電信電話株式会社 発話区間検出装置、発話区間検出方法、プログラム

Also Published As

Publication number Publication date
JPH07104676B2 (ja) 1995-11-13

Similar Documents

Publication Publication Date Title
US8701003B2 (en) Methods and apparatus for controlling a user interface based on the emotional state of a user
JPH09106296A (ja) 音声認識装置及び方法
JPH01219893A (ja) 適応形発声終了検出方法
JP3553828B2 (ja) 音声蓄積再生方法および音声蓄積再生装置
US6625474B1 (en) Method and apparatus for audio signal based answer call message generation
JPS6345950A (ja) 対話形音声応答装置
JP2556978B2 (ja) 対話形留守番電話装置
JPH0519734B2 (ja)
JP2636002B2 (ja) 対話型留守番電話機
JP2590193B2 (ja) 対話形音声応答装置
KR100228916B1 (ko) 음성사서함에 메시지 녹음시 가청시보음을 제공하는 방법
JPH03276947A (ja) 対話型留守番電話機
JPS61127255A (ja) 電話機
JP3469800B2 (ja) 通信装置
JP2635970B2 (ja) 留守番電話機
JPS6328387B2 (ja)
JPH11187117A (ja) 録音再生装置
JPH05304557A (ja) 音声入出力装置
JPS63299446A (ja) 音声等の音による機械入力方式
JPH05153082A (ja) 背景雑音電力検出器
JPH01306897A (ja) 音声検出回路
JPH07177217A (ja) 留守番電話の発信音検出方法
JPH04167650A (ja) 音声応答認識装置
JPH07312640A (ja) 応答メッセージ収集送出装置
JPH01160153A (ja) 音声メール装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees