JP6270661B2 - 音声対話方法、及び音声対話システム - Google Patents
音声対話方法、及び音声対話システム Download PDFInfo
- Publication number
- JP6270661B2 JP6270661B2 JP2014162579A JP2014162579A JP6270661B2 JP 6270661 B2 JP6270661 B2 JP 6270661B2 JP 2014162579 A JP2014162579 A JP 2014162579A JP 2014162579 A JP2014162579 A JP 2014162579A JP 6270661 B2 JP6270661 B2 JP 6270661B2
- Authority
- JP
- Japan
- Prior art keywords
- prosodic
- conflict
- user utterance
- utterance
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 22
- 230000003993 interaction Effects 0.000 claims description 46
- 238000000605 extraction Methods 0.000 claims description 26
- 239000000284 extract Substances 0.000 claims description 6
- 230000002996 emotional effect Effects 0.000 claims description 4
- 230000007474 system interaction Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 6
- 239000004071 soot Substances 0.000 description 6
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 3
- 230000008451 emotion Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 206010012289 Dementia Diseases 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
Images
Description
図3は、ユーザと音声対話システムとが対話している状態を示す図である。図3に示すように、本実施の形態にかかる発明は、ユーザ31がロボット(音声対話システム)32と対話する際に、ロボット32が、ユーザ31の発話を促進させる相槌を発することを特徴としている。つまり、本実施の形態にかかる発明では、ユーザ31の発話の音声波形33から韻律的特徴を抽出し、相槌を生成する際に、相槌の音声波形34の韻律的特徴がユーザ31の発話の音声波形33の韻律的特徴と合うように相槌の韻律(音声波形34)を調整することを特徴としている。以下で、本実施の形態にかかる音声対話方法、及び音声対話システムについて詳細に説明する。
求める韻律調整パラメータBCipの数はこれ以外であってもよい。例えば、韻律調整パラメータ生成部17は、基本周波数成分F0およびパワー成分のうち、ユーザ発話の韻律的特徴と相槌の韻律的特徴との相関が高い成分(つまり、相関係数αが高い成分:図5を参照)について、韻律調整パラメータBCipを求めるようにしてもよい。換言すると、韻律調整パラメータ生成部17は、基本周波数成分F0およびパワー成分のうち、相槌についての相関係数が高い成分を優先的に用いて、韻律調整パラメータBCipを求めるようにしてもよい。
11 発話入力部
12 韻律的特徴抽出部
13 相槌生成タイミング決定部
14 相槌生成部
15 相槌データベース
16 相槌選択部
17 韻律調整パラメータ生成部
18 相槌波形生成部
19 相槌出力部
21 抽出した韻律的特徴
22 相槌生成タイミング情報
23 相槌選択信号
24 特徴量
25 相槌情報
26 相関係数に関する情報
27 韻律調整パラメータ
31 ユーザ
32 ロボット
33 ユーザ発話の音声波形
34 相槌の音声波形
Claims (7)
- ユーザ発話を入力する工程と、
入力された前記ユーザ発話の韻律的特徴を抽出する工程と、
抽出された前記韻律的特徴に基づき前記ユーザ発話に応答する相槌を生成する工程と、を備え、
前記ユーザ発話の韻律的特徴を抽出する際、前記ユーザ発話の基本周波数成分およびパワー成分を抽出し、
前記パワー成分は、当該パワー成分の最大値および平均値を含み、
前記相槌を生成する際、前記基本周波数成分および前記パワー成分のうち、前記ユーザ発話の韻律的特徴と前記相槌の韻律的特徴との相関が高い成分を用いて、前記相槌の韻律的特徴が前記ユーザ発話の韻律的特徴と合うように前記相槌の韻律を調整する、
音声対話方法。 - 前記ユーザ発話の韻律的特徴と前記相槌の韻律的特徴との相関を示す相関係数テーブルを予め生成し、
前記基本周波数成分および前記パワー成分のうち、前記相槌についての相関係数が高い成分を優先的に用いて前記相槌の韻律を調整する、
請求項1に記載の音声対話方法。 - 前記基本周波数成分は、当該基本周波数成分の最大値および平均値を含む、請求項1または2に記載の音声対話方法。
- 前記ユーザ発話の韻律的特徴を用いて前記相槌を生成するタイミングを決定する工程を更に備え、
前記ユーザ発話の韻律的特徴であるパワー成分が所定の閾値以下である場合に、前記相槌を生成する、
請求項1乃至4のいずれか一項に記載の音声対話方法。 - 前記相槌には感情表出系の相槌と応答系の相槌とが含まれており、
前記ユーザ発話が発話中である場合、前記応答系の相槌を選択し、
前記ユーザ発話が終了している場合、前記感情表出系の相槌を選択する、
請求項1乃至5のいずれか一項に記載の音声対話方法。 - ユーザ発話を入力する発話入力部と、
前記発話入力部に入力された前記ユーザ発話の韻律的特徴を抽出する韻律的特徴抽出部と、
前記韻律的特徴抽出部で抽出された前記韻律的特徴に基づき前記ユーザ発話に応答する相槌を生成する相槌生成部と、を備え、
前記韻律的特徴抽出部は、前記ユーザ発話の韻律的特徴を抽出する際、前記ユーザ発話の基本周波数成分およびパワー成分を抽出し、
前記パワー成分は、当該パワー成分の最大値および平均値を含み、
前記相槌生成部は、前記相槌を生成する際、前記基本周波数成分および前記パワー成分のうち、前記ユーザ発話の韻律的特徴と前記相槌の韻律的特徴との相関が高い成分を用いて、前記相槌の韻律的特徴が前記ユーザ発話の韻律的特徴と合うように前記相槌の韻律を調整する、
音声対話システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014162579A JP6270661B2 (ja) | 2014-08-08 | 2014-08-08 | 音声対話方法、及び音声対話システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014162579A JP6270661B2 (ja) | 2014-08-08 | 2014-08-08 | 音声対話方法、及び音声対話システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016038501A JP2016038501A (ja) | 2016-03-22 |
JP6270661B2 true JP6270661B2 (ja) | 2018-01-31 |
Family
ID=55529610
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014162579A Active JP6270661B2 (ja) | 2014-08-08 | 2014-08-08 | 音声対話方法、及び音声対話システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6270661B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6461058B2 (ja) | 2016-09-06 | 2019-01-30 | 国立大学法人京都大学 | 音声対話装置および音声対話装置を用いた自動対話方法 |
JP6911398B2 (ja) * | 2017-03-09 | 2021-07-28 | ヤマハ株式会社 | 音声対話方法、音声対話装置およびプログラム |
JP6801587B2 (ja) * | 2017-05-26 | 2020-12-16 | トヨタ自動車株式会社 | 音声対話装置 |
JP6768597B2 (ja) | 2017-06-08 | 2020-10-14 | 株式会社日立製作所 | 対話システム、対話システムの制御方法、及び装置 |
JP6993314B2 (ja) * | 2018-11-09 | 2022-01-13 | 株式会社日立製作所 | 対話システム、装置、及びプログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11175082A (ja) * | 1997-12-10 | 1999-07-02 | Toshiba Corp | 音声対話装置及び音声対話用音声合成方法 |
JP2002041084A (ja) * | 2000-07-26 | 2002-02-08 | Victor Co Of Japan Ltd | 対話処理システム |
JP2003228449A (ja) * | 2002-02-01 | 2003-08-15 | Sharp Corp | 対話装置及び対話処理プログラムを記録した記録媒体 |
JP2004086001A (ja) * | 2002-08-28 | 2004-03-18 | Sony Corp | 会話処理装置、および会話処理方法、並びにコンピュータ・プログラム |
JP2011217018A (ja) * | 2010-03-31 | 2011-10-27 | Oki Networks Co Ltd | 音声応答装置及びプログラム |
-
2014
- 2014-08-08 JP JP2014162579A patent/JP6270661B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016038501A (ja) | 2016-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4456537B2 (ja) | 情報伝達装置 | |
JP6270661B2 (ja) | 音声対話方法、及び音声対話システム | |
US20150348538A1 (en) | Speech summary and action item generation | |
WO2016063879A1 (ja) | 音声合成装置および方法 | |
JP6464703B2 (ja) | 会話評価装置およびプログラム | |
EP3065130B1 (en) | Voice synthesis | |
Tanaka et al. | A hybrid approach to electrolaryngeal speech enhancement based on noise reduction and statistical excitation generation | |
JP6664670B2 (ja) | 声質変換システム | |
Janke et al. | Fundamental frequency generation for whisper-to-audible speech conversion | |
CN108369804A (zh) | 语音交互设备和语音交互方法 | |
JP6747318B2 (ja) | 対話装置 | |
CN111653281A (zh) | 用于对助听器的音频信号进行个性化信号处理的方法 | |
JP2012163692A (ja) | 音声信号処理システム、音声信号処理方法および音声信号処理方法プログラム | |
JP2018132624A (ja) | 音声対話装置 | |
JP2004021121A (ja) | 音声対話制御装置 | |
JP6569588B2 (ja) | 音声対話装置およびプログラム | |
JP6728660B2 (ja) | 音声対話方法、音声対話装置およびプログラム | |
JP6657887B2 (ja) | 音声対話方法、音声対話装置およびプログラム | |
JP6657888B2 (ja) | 音声対話方法、音声対話装置およびプログラム | |
JP2018165805A (ja) | 対話装置、対話装置の制御方法およびプログラム | |
JP2018132623A (ja) | 音声対話装置 | |
Ueda et al. | Are we truly modeling expressiveness? A study on expressive TTS in Brazilian Portuguese for real-life application styles | |
Gallardo | Human and automatic speaker recognition over telecommunication channels | |
JP2018205654A (ja) | 音声合成学習装置、音声合成装置、これらの方法及びプログラム | |
WO2017098940A1 (ja) | 音声対話装置および音声対話方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161007 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170919 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170926 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171030 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171205 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171226 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6270661 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |