JP2019045831A - 音声処理装置、方法およびプログラム - Google Patents
音声処理装置、方法およびプログラム Download PDFInfo
- Publication number
- JP2019045831A JP2019045831A JP2017172162A JP2017172162A JP2019045831A JP 2019045831 A JP2019045831 A JP 2019045831A JP 2017172162 A JP2017172162 A JP 2017172162A JP 2017172162 A JP2017172162 A JP 2017172162A JP 2019045831 A JP2019045831 A JP 2019045831A
- Authority
- JP
- Japan
- Prior art keywords
- response
- voice
- speech
- time
- content data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Telephonic Communication Services (AREA)
Abstract
Description
[第1の実施形態]
(構成)
図1は、この発明の第1の実施形態に係る、ユーザとの音声対話を実現するシステムの概略構成図である。本実施形態では、音声処理装置の非限定的な例として音声対話装置について説明する。
次に、以上のように構成された音声対話装置1の動作を説明する。
以上詳述したように、この発明の第1の実施形態では、以下のような効果が奏せられる。
なお、この発明は上記第1の実施形態に限定されるものではない。例えば、上記第1の実施形態では、音声対話装置とサーバとの組み合わせによってユーザとの対話を実現している。しかしながら、音声対話装置とサーバとを1つの装置として実現してもよい。また、上記第1の実施形態では、応答音声の出力とフィラー情報の出力との両方を実現する音声対話装置について説明したが、これらを別個の異なる装置によって実現してもよい。
Claims (8)
- ユーザからの発話音声の認識、当該認識の結果に基づく応答内容データの生成、および当該応答内容データに対応する応答音声の合成の実施とともに使用される、音声処理装置であって、
前記発話音声の長さと、過去の応答内容データに関する情報とに基づいて、前記発話音声の終了時点から前記応答音声の出力を開始するまでに要する遅延時間を予測する予測部と、
前記予測された遅延時間内において、当該遅延時間に応じたフィラー情報を出力するフィラー情報出力部と
を備える音声処理装置。 - 前記予測部は、
前記発話音声の長さを検出し、当該検出された発話音声の長さに基づいて前記発話音声の認識に要する第1の時間を予測する手段と、
前記過去の応答内容データに関する情報に基づいて、前記発話音声の認識の結果に基づく応答内容データの生成に要する第2の時間を予測する手段と、
前記過去の応答内容データに関する情報に基づいて、前記生成される応答内容データに対応する応答音声の合成に要する第3の時間を予測する手段と、
前記予測された第1、第2および第3の時間に基づいて、前記発話音声の終了時点から前記応答音声の出力を開始するまでに要する遅延時間を予測する手段と
を備える、請求項1記載の音声処理装置。 - 前記第1の時間を予測する手段は、
ユーザからの過去の発話音声の長さと、当該長さの発話音声の認識に要した時間とに基づいて、発話音声の長さと発話音声の認識に要する時間との係数を算出する手段と、
前記検出された発話音声の長さと、前記算出された、発話音声の長さと発話音声の認識に要する時間との係数とに基づいて、前記第1の時間を予測する手段と
を備える、請求項2に記載の音声処理装置。 - 前記過去の応答内容データに関する情報は、過去の応答内容データに対応する応答音声の合成に要した時間を含み、
前記第3の時間を予測する手段は、前記第3の時間を、所定の回数の前記過去の応答音声の合成に要した時間の平均値に基づいて予測する、請求項2又は3に記載の音声処理装置。 - 前記出力されたフィラー情報の再生が終了した際に、前記ユーザからの発話音声に対する応答音声の合成が完了しているか否かを判定する判定部をさらに備え、
前記フィラー情報出力部は、前記応答音声の合成が完了していないと判定された場合に、追加のフィラー情報を出力する、請求項1乃至4のいずれかに記載の音声処理装置。 - 前記出力されたフィラー情報の再生が終了した際に、前記ユーザからの発話音声に対する応答音声の合成が完了しているか否かを判定し、さらに、前記応答音声の合成が完了していないと判定された場合に、前記ユーザからの発話音声の認識と、当該認識の結果に基づく応答内容データの生成が完了しているか否かを判定する判定部をさらに備え、
前記過去の応答内容データに関する情報は、ユーザからの過去の発話音声に対する応答内容データの長さと、当該長さの応答内容データに対応する応答音声の合成に要した時間とを含み、
前記第3の時間を予測する手段は、
前記ユーザからの過去の発話音声に対する応答内容データの長さと、当該長さの応答内容データに対応する応答音声の合成に要した時間とに基づいて、応答内容データの長さと応答音声の合成に要する時間との係数を算出する手段と、
前記応答音声の合成が完了していないと判定され、かつ、前記ユーザからの発話音声の認識と、当該認識の結果に基づく応答内容データの生成が完了していると判定された場合に、前記ユーザからの発話音声に対する応答内容データの長さと、前記算出された、応答内容データの長さと応答音声の合成に要する時間との係数とに基づいて、前記第3の時間を再予測する手段とを備え、
前記遅延時間を予測する手段は、前記再予測された第3の時間に基づいて、前記ユーザからの発話音声の終了時点から前記応答音声の出力を開始するまでに要する遅延時間を再予測し、
前記フィラー情報出力部は、前記再予測された遅延時間内において、前記ユーザからの発話音声の終了時点からの経過時間を前記再予測された遅延時間から減算した時間に応じた、追加のフィラー情報を出力する、請求項2乃至4のいずれかに記載の音声処理装置。 - ユーザからの発話音声の認識、当該認識の結果に基づく応答内容データの生成、および当該応答内容データに対応する応答音声の合成の実施とともに使用される、コンピュータおよびメモリを備える装置が実行する音声処理方法であって、
前記発話音声の長さと、過去の応答内容データに関する情報とに基づいて、前記発話音声の終了時点から前記応答音声の出力を開始するまでに要する遅延時間を予測する過程と、
前記予測された遅延時間内において、当該遅延時間に応じたフィラー情報を出力する過程と
を備える音声処理方法。 - 請求項1乃至6のいずれかに記載の音声処理装置が備える各部としてコンピュータを機能させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017172162A JP6664359B2 (ja) | 2017-09-07 | 2017-09-07 | 音声処理装置、方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017172162A JP6664359B2 (ja) | 2017-09-07 | 2017-09-07 | 音声処理装置、方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019045831A true JP2019045831A (ja) | 2019-03-22 |
JP6664359B2 JP6664359B2 (ja) | 2020-03-13 |
Family
ID=65816438
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017172162A Active JP6664359B2 (ja) | 2017-09-07 | 2017-09-07 | 音声処理装置、方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6664359B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113450096A (zh) * | 2021-06-25 | 2021-09-28 | 未鲲(上海)科技服务有限公司 | 资源转移数据的处理方法、装置、电子设备及介质 |
CN113711307A (zh) * | 2019-04-23 | 2021-11-26 | 三菱电机株式会社 | 设备控制装置及设备控制方法 |
CN115565535A (zh) * | 2022-09-21 | 2023-01-03 | 深圳琪乐科技有限公司 | 一种智能语音客服系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015135420A (ja) * | 2014-01-17 | 2015-07-27 | 株式会社デンソー | 音声認識端末装置、音声認識システム、音声認識方法 |
JP2016126293A (ja) * | 2015-01-08 | 2016-07-11 | シャープ株式会社 | 音声対話制御装置、音声対話制御装置の制御方法、および音声対話装置 |
-
2017
- 2017-09-07 JP JP2017172162A patent/JP6664359B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015135420A (ja) * | 2014-01-17 | 2015-07-27 | 株式会社デンソー | 音声認識端末装置、音声認識システム、音声認識方法 |
JP2016126293A (ja) * | 2015-01-08 | 2016-07-11 | シャープ株式会社 | 音声対話制御装置、音声対話制御装置の制御方法、および音声対話装置 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113711307A (zh) * | 2019-04-23 | 2021-11-26 | 三菱电机株式会社 | 设备控制装置及设备控制方法 |
CN113711307B (zh) * | 2019-04-23 | 2023-06-27 | 三菱电机株式会社 | 设备控制装置及设备控制方法 |
CN113450096A (zh) * | 2021-06-25 | 2021-09-28 | 未鲲(上海)科技服务有限公司 | 资源转移数据的处理方法、装置、电子设备及介质 |
CN115565535A (zh) * | 2022-09-21 | 2023-01-03 | 深圳琪乐科技有限公司 | 一种智能语音客服系统 |
CN115565535B (zh) * | 2022-09-21 | 2024-04-12 | 南京浮点智算数字科技有限公司 | 一种智能语音客服系统 |
Also Published As
Publication number | Publication date |
---|---|
JP6664359B2 (ja) | 2020-03-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210249013A1 (en) | Method and Apparatus to Provide Comprehensive Smart Assistant Services | |
US11227584B2 (en) | System and method for determining the compliance of agent scripts | |
EP3061086B1 (en) | Text-to-speech performance evaluation | |
JP6731326B2 (ja) | 音声対話装置及び音声対話方法 | |
JP2006098993A (ja) | 音声処理装置およびそのためのコンピュータプログラム | |
JP7230806B2 (ja) | 情報処理装置、及び情報処理方法 | |
JP6111802B2 (ja) | 音声対話装置及び対話制御方法 | |
KR101836430B1 (ko) | 음성 인식과 번역 방법 및 그를 위한 단말 장치와 서버 | |
US9691389B2 (en) | Spoken word generation method and system for speech recognition and computer readable medium thereof | |
JP2019045831A (ja) | 音声処理装置、方法およびプログラム | |
EP3567586B1 (en) | Voice interaction system, voice interaction method, and program | |
JP2004101901A (ja) | 音声対話装置及び音声対話プログラム | |
JP6873805B2 (ja) | 対話支援システム、対話支援方法、及び対話支援プログラム | |
JP6576968B2 (ja) | 話し終わり判定装置、話し終わり判定方法およびプログラム | |
US20120078634A1 (en) | Voice dialogue system, method, and program | |
KR20220070546A (ko) | 텍스트 독립 화자 인식 | |
JP6028556B2 (ja) | 対話制御方法及び対話制御用コンピュータプログラム | |
JP2016126294A (ja) | 音声対話制御装置、音声対話制御装置の制御方法、および音声対話装置 | |
JP2012163692A (ja) | 音声信号処理システム、音声信号処理方法および音声信号処理方法プログラム | |
JP6621593B2 (ja) | 対話装置、対話システム、及び対話装置の制御方法 | |
EP2541544A1 (en) | Voice sample tagging | |
JP6772881B2 (ja) | 音声対話装置 | |
JP5223843B2 (ja) | 情報処理装置およびプログラム | |
JP6233103B2 (ja) | 音声合成装置、音声合成方法及び音声合成プログラム | |
KR20210098250A (ko) | 전자 장치 및 이의 제어 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190129 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191113 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20191210 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200123 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200212 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200218 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6664359 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |