JPH03248268A - 音声対話処理方式 - Google Patents

音声対話処理方式

Info

Publication number
JPH03248268A
JPH03248268A JP2046173A JP4617390A JPH03248268A JP H03248268 A JPH03248268 A JP H03248268A JP 2046173 A JP2046173 A JP 2046173A JP 4617390 A JP4617390 A JP 4617390A JP H03248268 A JPH03248268 A JP H03248268A
Authority
JP
Japan
Prior art keywords
voice
signal
sends
response
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2046173A
Other languages
English (en)
Inventor
Atsushi Noguchi
淳 野口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2046173A priority Critical patent/JPH03248268A/ja
Publication of JPH03248268A publication Critical patent/JPH03248268A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、自動通訳システム、音声Q&Aシステム等に
おいて、人間が音声を用いて機械と対話を行なう音声対
話処理方式に関し、特に、相づちを含む会話対話処理方
式に関する。
(従来の技術) 人間が音声を用いて機械と行なう対話の処理において、
機械側の無音が続くと、人間側は自然な対話ができない
、あるいは心理的な不安を生じるなどの問題点がある。
この問題に対する改善としては、昭和62年電子情報通
信学会情報・システム部門全国大会講演論文集分冊1:
partl、1−179の西宏之、小島順治著[相づち
を含む会話の対話処理についてJに記載されている、対
話における音声の無音部分を監視し、無音部分の持続時
間が一定長に達した時点で相づちを送出するという方法
がある。
(発明が解決しようとする課題) しかしながら、人間同士の対話で相づちをうつのは、相
手の音声の無音部分が続いた場合だけではなく、相手の
音声が徐々に小さくなっていく場合や、相手が「え−」
 [あのjなどの間投詞の最後の母音、あるいは「・・
・ですが−」なとのように文節末、文末などの母音が持
続する場合などがある。この場合、従来の方法では、人
間同士ならば相づちを打つような場合でも機械側は無音
状態を続ける。このため、人間側が自然な対話ができな
い、あるいは心理的な不安を生じるなどの問題点は依然
として残る。本発明の目的は、このような欠点を克服し
た、より自然な対話を可能とする音声対話処理方式を提
供することにある。
(課題を解決するための手段) 本発明の音声対話処理方式においては、入力音声の無音
部分以外の区間において、入力音声レベルを検出して、
レベルが一定のしきい値以下である時間が一定長に達し
た時点で、相づちを送出することを特徴としている。
また、本発明の音声対話処理方式においては、入力音声
の母音を識別し、入力音声中に同母音が一定時間以上連
続して出現した時点で、相づちを送出することを特徴と
している。
(作用) 人間同士の対話では、発話の中断に際して、徐々に音声
が小さくなる、あるいは、中断直前の母音が長く伸びる
という現象がしばしば生じる。
そこで本方式では、音声のレベルの低下あるいは母音の
継続を識別することにより、相手の発話の中断を検知し
、その時点で相づちを送出する。これによって、人間と
機械の自然な対話ができる。
(実施例) 次に図面を参照して本発明の詳細な説明する。
第1図は本発明の請求項1を実現するための一実施例を
表すブロック図である。
第1図において、無音検出部101は無音部分が検出さ
れた時に、信号を対話処理部105に送る。対話処理部
105は、無音検出部101から信号を受けると音声応
答部106に相づちを送出するように信号を送る。音声
応答部106は、対話処理部105から信号を受は取る
と、「はい」、[ええ1等の相づちを送出する。音声入
力部102は、音声が入力されるとレベル送出部103
にんD変換された音声信号を送り、対話処理部105に
音声の分析結果を送る。レベル検出部103では、例え
ば10[mslごとの、各区間における音声のパワーの
最大値を求め、その結果を判定部104に送る。判定部
104では、各区間における音声のパワーの最大値とあ
るしきい値を比較し、あらかじめ定めた時間長(例えば
2秒程度)以上、入力音声がしきい値以下であるときに
信号を対話処理部105に送る。対話処理部105は、
判定部104から信号を受けると音声応答部106に相
づちを送出するように信号を送る。音声応答部106は
、対話処理部105から信号を受は取ると、「はい」、
「ええ」等の相づちを送出する。上記実施例において、
レベル送出部103で、音声パワーの最大値の代わりに
音声のパワーの平均値を求め、判定部104では、各区
間における音声のパワーの平均値とあるしきい値を比較
し、あらかじめ定めた時間長く例えば2秒程度)以上、
入力音声がしきい値以下であるときに信号を対話処理部
105に送るとしても良い。もし、判定部104で音声
の最大値とあるしきい値を比較し、一定時間長以上、入
力音声がしきい値以下であるときがなかったら、信号が
対話処理部105に送られることはなく、その結果、音
声応答部106に相づちを送出するように信号が送られ
ることもなく相づちが送出されることはない。
第2図は本発明の請求項2を実現するための一実施例を
表すブロック図である。
第2図において音声入力部201は、音声が入力される
と、母音識別部202(例えばバタン比較器)、および
対話処理部203に音声の分析結果を送る。母音バタン
記憶部206には、各母音のフレーム単位の母音標準バ
タンをあらかじめ記憶しておく。母音識別部202は音
声の分析結果と、母音バタン記憶部206の母音標準バ
タンとのマツチングをフレームごとに行いフレームごと
に母音を識別し、その結果を判定部204(例えばカウ
ンタ)に送る。判定部204では、あらかじめ定められ
た数似上連続して同じ母音フレームが出現したときに、
信号を対話処理部203に送る。この際、母音認識部2
02における識別部りに対処するために、判定部204
では、同一母音フレームがあらかじめ定めたフレーム数
、例えば3フレ一ム以上連続した場合のみ、その母音が
出現したとみなしても良い。あるいは、判定部204に
おいて連続する同一母音フレームの間にはさまれた、あ
らかじめ定められたフレーム数、例えば、2フレーム以
下の他の母音フレームは識別誤りとみなしても良い。す
なわち、例えばeeeeiieeeeeという母音フレ
ーム時系列はeeeeeeeeeeeという母音フレー
ム時系列とみなすことになる。対話処理部203は、判
定部204から信号が送られてきた時に、音声応答部2
05に相づちを送出するように信号を送る。
音声応答部205は、対話処理部203から信号を受は
取ると、「はい]、[ええJ等の相づちを送出する。あ
らかじめ定められた数似上連続して同じ母音フレームが
出現しなかったときは、信号は対話処理部203に送ら
れないので、音声応答部205に信号も送られず、相づ
ちは送出されない。
(発明の効果) 以上述べたように本発明によれば、人間が音声を用いて
機械と対話を行う際に、より人間同士の対話に似た、自
然で心理的な不安を生じさせない対話を可能にする音声
対話処理装置を提供することができる。
【図面の簡単な説明】
第1図及び第2図は、各々本発明の一実施例を示すブロ
ック図である。 101・・・無音検出部、102・・・音声入力部、1
03・・・レベル検出部、104・・・対話処理部、1
05・・・判定部、106・・・音声応答部、201・
・・音声入力部、202・・・母音識別部、2030.
・対話処理部、204・・・判定部、205・・・音声
応答部、206・・・母音バタン記憶部。

Claims (2)

    【特許請求の範囲】
  1. (1)入力音声の無音部分以外の区間において、入力音
    声のレベルを検出して、レベルが一定のしきい値以下で
    ある時間が一定長に達した時点で、相づちを送出するこ
    とを特徴とする音声対話処理方式。
  2. (2)入力音声の母音を識別し、入力音声中に同母音が
    一定時間以上連続して出現した時点で、相づちを送出す
    ることを特徴とする音声対話処理方式。
JP2046173A 1990-02-26 1990-02-26 音声対話処理方式 Pending JPH03248268A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2046173A JPH03248268A (ja) 1990-02-26 1990-02-26 音声対話処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2046173A JPH03248268A (ja) 1990-02-26 1990-02-26 音声対話処理方式

Publications (1)

Publication Number Publication Date
JPH03248268A true JPH03248268A (ja) 1991-11-06

Family

ID=12739637

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2046173A Pending JPH03248268A (ja) 1990-02-26 1990-02-26 音声対話処理方式

Country Status (1)

Country Link
JP (1) JPH03248268A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07219961A (ja) * 1994-01-31 1995-08-18 Hitachi Ltd 音声対話システム
JP2009003040A (ja) * 2007-06-20 2009-01-08 Univ Waseda 音声対話装置、音声対話方法及びロボット装置
WO2018078885A1 (ja) * 2016-10-31 2018-05-03 富士通株式会社 対話装置、対話方法及び対話用コンピュータプログラム
EP3852100A4 (en) * 2018-09-11 2022-06-15 Nippon Telegraph And Telephone Corporation CONTINUOUS SPEECH ESTIMATION DEVICE, METHOD AND PROGRAM

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07219961A (ja) * 1994-01-31 1995-08-18 Hitachi Ltd 音声対話システム
JP2009003040A (ja) * 2007-06-20 2009-01-08 Univ Waseda 音声対話装置、音声対話方法及びロボット装置
WO2018078885A1 (ja) * 2016-10-31 2018-05-03 富士通株式会社 対話装置、対話方法及び対話用コンピュータプログラム
JPWO2018078885A1 (ja) * 2016-10-31 2019-06-24 富士通株式会社 対話装置、対話方法及び対話用コンピュータプログラム
EP3852100A4 (en) * 2018-09-11 2022-06-15 Nippon Telegraph And Telephone Corporation CONTINUOUS SPEECH ESTIMATION DEVICE, METHOD AND PROGRAM

Similar Documents

Publication Publication Date Title
CN110300001B (zh) 会议音频控制方法、系统、设备及计算机可读存储介质
Chen et al. The use of emphasis to automatically summarize a spoken discourse
CN109377998B (zh) 一种语音交互方法及装置
JP6066471B2 (ja) 対話システム及び対話システム向け発話の判別方法
KR19980080615A (ko) 음성 활동 검출 방법 및 장치
KR20040050928A (ko) 사용자와 에이전트 간의 대화 관리방법 및 장치
KR20170083391A (ko) 음성 인식 시스템에서의 발화 검증 장치 및 그 방법
CN106847305A (zh) 一种处理客服电话的录音数据的方法及装置
CN110867197A (zh) 语音交互过程中实时打断语音机器人的方法及设备
JPH0792988A (ja) 音声検出装置と映像切り替え装置
CN110503943B (zh) 一种语音交互方法以及语音交互系统
CN110364178B (zh) 一种语音处理方法、装置、存储介质和电子设备
An et al. Detecting laughter and filled pauses using syllable-based features.
JPH03248268A (ja) 音声対話処理方式
CN109841216B (zh) 语音数据的处理方法、装置和智能终端
JP2797861B2 (ja) 音声検出方法および音声検出装置
KR20210000802A (ko) 인공지능 음성 인식 처리 방법 및 시스템
US5201028A (en) System for distinguishing or counting spoken itemized expressions
CN115512687A (zh) 一种语音断句方法、装置、存储介质及电子设备
CN110125946B (zh) 自动通话方法、装置、电子设备及计算机可读介质
KR20080061901A (ko) 로봇의 입출력 장치에 의한 효율적인 음성인식 방법 및시스템
KR102306994B1 (ko) 악성전화 차단 시스템
JP2004510209A (ja) 発声された番号シーケンスの分析方法及び装置
JP2656234B2 (ja) 会話音声理解方法
EP0770986A2 (en) Modified discrete word recognition