JP2018165805A - 対話装置、対話装置の制御方法およびプログラム - Google Patents

対話装置、対話装置の制御方法およびプログラム Download PDF

Info

Publication number
JP2018165805A
JP2018165805A JP2017063689A JP2017063689A JP2018165805A JP 2018165805 A JP2018165805 A JP 2018165805A JP 2017063689 A JP2017063689 A JP 2017063689A JP 2017063689 A JP2017063689 A JP 2017063689A JP 2018165805 A JP2018165805 A JP 2018165805A
Authority
JP
Japan
Prior art keywords
speaker
response
speech
unit
talk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017063689A
Other languages
English (en)
Other versions
JP6736225B2 (ja
Inventor
喜昭 野田
Yoshiaki Noda
喜昭 野田
節夫 山田
Setsuo Yamada
節夫 山田
杉崎 正之
Masayuki Sugizaki
正之 杉崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2017063689A priority Critical patent/JP6736225B2/ja
Publication of JP2018165805A publication Critical patent/JP2018165805A/ja
Application granted granted Critical
Publication of JP6736225B2 publication Critical patent/JP6736225B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • User Interface Of Digital Computer (AREA)
  • Telephonic Communication Services (AREA)

Abstract

【課題】発話者に対してより適切な応答を行う。【解決手段】本発明に係る話し終わり対話装置10は、発話者が話し終わったか否かを判定する話し終わり判定部11と、話し終わり判定部11により発話者が話し終わったと判定されると、発話者の話し終わりまでの発話内容に応じた応答を応答部12に行わせ、話し終わり判定部11により発話者が話し終わっていないと判定されると、発話者の話を傾聴していることを示す応答を応答部12に行わせる応答制御部15と、を備える。【選択図】図1

Description

本発明は、発話者に対する応答を行う対話装置、対話装置の制御方法およびプログラムに関する。
発話者の発した音声に対する音声認識の結果を発話内容として取得し、取得した発話内容を解析して、解析結果に応じた応答を発話者に対して行う対話システムが検討されている。このような対話システムによれば、例えば、顧客がコールセンタに電話し、不明点などの質問を話すことで質問に対する回答を自動的に顧客に提示することができる。また、非特許文献1には、上述したような対話システムにおいて、対話システム側が相槌を行うことで、ユーザが話しやすく感じるという効果を得られることが記載されている。
中野 幹生他「自然言語処理シリーズ7 対話システム」、コロナ社、2015年2月13日(P212−P218)
上述したような対話システムでは、あたかも人と話しているような自然な応答を発話者に返すことが重要である。
ここで、人間は常に伝えたい内容を整理してよどみなく話せるわけではなく、話の途中で考えたり、言い淀んだりする。そのため、発話者が話している途中に、音声が途切れることがある。
従来の対話システムにおいては、発話者が実際には話し終わっていないにも関わらず、発話者の音声が途切れた時点までの音声認識により得られた中途半端な発話内容の解析結果に応じた応答が行われることがある。このような応答は不適切な応答であり、発話者が不自然さを感じる原因となる。
また、通常、人と人との対話では、発話者の話が途切れたタイミングなどで、受話者が相槌や頷きを行うことで、発話者は受話者が発話者の話を傾聴していることを感じることができる。上述したように、発話者に対して、対話システム側から相槌や頷きなどの発話者の話を傾聴していることを示す応答を行うことは、発話者が不自然さを感じないようにするために重要である。しかしながら、従来の対話システムにおいては、発話者の話を傾聴していることを示す応答を行うことについて十分な検討がなされていなかった。
このように従来の対話システムでは、発話者に対してより適切な応答を行うことができないという問題がある。
上記のような問題点に鑑みてなされた本発明の目的は、発話者に対してより適切な応答を行うことができる対話装置、対話装置の制御方法およびプログラムを提供することにある。
上記課題を解決するため、本発明に係る対話装置は、発話者に対する応答を行う応答部を備えた対話装置であって、前記発話者が話し終わったか否かを判定する話し終わり判定部と、前記話し終わり判定部により前記発話者が話し終わったと判定されると、前記発話者の話し終わりまでの発話内容に応じた応答を前記応答部に行わせ、前記話し終わり判定部により前記発話者が話し終わっていないと判定されると、前記発話者の話を傾聴していることを示す応答を前記応答部に行わせる応答制御部と、を備える。
また、上記課題を解決するため、本発明に係る話し終わり対話装置の制御方法は、発話者に対する応答を行う応答部を備えた対話装置の制御方法であって、前記発話者が話し終わったか否かを判定するステップと、前記発話者が話し終わったと判定されると、前記発話者の話し終わりまでの発話内容に応じた応答を前記応答部に行わせ、前記発話者が話し終わっていないと判定されると、前記発話者の話を傾聴していることを示す応答を前記応答部に行わせるステップと、を含む。
また、上記課題を解決するため、本発明に係るプログラムは、コンピュータを上記の対話装置として機能させる。
本発明に係る対話装置、対話装置の制御方法およびプログラムによれば、発話者に対してより適切な応答を行うことができる。
本発明の第1の実施形態に係る対話装置の構成例を示すブロック図である。 図1に示す対話装置の動作を概念的に示す図である。 本発明の第2の実施形態に係る対話装置の構成例を示すブロック図である。
以下、本発明を実施するための形態について、図面を参照しながら説明する。
(第1の実施形態)
図1は、本発明の第1の実施形態に係る対話装置10の構成例を示すブロック図である。本実施形態に係る対話装置10は、発話者が発した音声が入力され、入力された音声に応じて、発話者に対して応答を行うものである。なお、以下では、本実施形態に係る対話装置10は、例えば、人型のロボット装置などに搭載され、あるいは、ロボット装置と一体的に構成され、ロボット装置を制御して、音声出力およびロボット装置を動作させることで、ロボット装置に発話する発話者に対して応答を行うものであるとする。
図1に示す対話装置10は、話し終わり判定部11と、応答部12と、応答制御部15とを備える。
話し終わり判定部11は、発話者が発した音声が入力されると、入力音声に対して音声認識を行い、入力音声のテキスト化を行う。そして、話し終わり判定部11は、音声認識により得られた入力音声をテキスト化した単位メッセージ(認識結果メッセージ)毎に、発話者が話し終わったか否かを判定し、判定結果を応答制御部15に出力する。話し終わり判定部11は、例えば、発話者が音声を発しない無音期間が所定時間以上続くことを示す認識結果メッセージが得られると、発話者が対話装置10からの応答を待っている、すなわち、発話者が話し終えたと判定する。また、話し終わり判定部11は、例えば、話し終わりに用いられることが多い語句(例えば、「〜でしょうか」、「〜ですが」など)が検出された場合に、発話者が話し終えたと判定する。音声認識の結果に基づく、発話者が話し終わったか否かの判定方法は、これらに限られるものではなく、種々の方法を用いることができる。
応答部12は、応答制御部15の制御に従い、音声出力およびロボット装置の動作などにより発話者に対する応答を行う。応答部12は、音声合成部13と、動作部14とを備える。
音声合成部13は、発話者に対する応答として音声出力を行うために、ロボット装置の音声出力部(図示せず)から出力する音声の音声合成を行う。そして、音声合成部13は、合成音声を音声出力部から出力させる。
動作部14は、発話者に対する応答としてロボット装置を動作させるために、ロボット装置の動作を制御する動作指令を生成し、ロボット装置を動作させる動作機構に出力する。なお、発話者に対する応答は、上述した音声出力部からの音声出力、ロボット装置の動作だけに限られない。例えば、ロボット装置に表示部を設け、発話者に対する応答をロボット装置の表示部に表示するようにしてもよい。
応答制御部15は、話し終わり判定部11の判定結果に応じて、応答部12による発話者への応答を制御する。
具体的には、応答制御部15は、話し終わり判定部11により、発話者が話し終わったと判定されるまで、認識結果メッセージ(部分発話内容)を順次蓄積していき、発話者が話し終わったと判定されると、それまでに蓄積した認識結果メッセージと現在の認識結果メッセージ(話し終わりであると判定された認識結果メッセージ)とをまとめて発話内容として取得する。そして、応答制御部15は、取得した発話内容を予め定められた対話ルールに基づき評価し、対話ルールで記述された条件に応じた応答を応答部12に行わせる。
また、応答制御部15は、話し終わり判定部11により、認識結果メッセージに対して話し終わりでないと判定された場合には、相槌や頷きといった発話者の話を傾聴していることを示す応答を応答部12に行わせる。
図2は、本実施形態に係る対話装置10の動作を概念的に示す図である。図2においては、無音期間、発話者による「えーっと」という発話、無音期間、「昨日引っ越したので、住所変更をしたいのですが」という発話からなる入力音声が対話装置10に入力されたとする。
上述した入力音声に対する音声認識により、「無音」、「えーっと」、「無音」、「昨日、引越しをしたので、」および「住所変更をしたいのですが」という認識結果メッセージが得られたとする。従来の対話システムでは、「えーっと」、「昨日、引越しをしたので、」、「住所変更をしたいのですが」といった発話の区切り(認識結果メッセージ単位)で発話者の発話内容の解析が行われ、その解析結果に応じた応答が行われていた。そのため、例えば、「えーっと」、「昨日、引越しをしたので、」などの、発話者が用件を話し終わる前の認識結果メッセージに対して、「質問内容が不明です」などの発話者の意図に合致しない不適切な応答が行われることがあった。また、従来の対話システムでは、発話者の話の合間に相槌や頷きなどの、発話者の話を傾聴していることを示す応答が行われることが無く、発話者は自分の話が認識されているのか、不安を感じることがあった。
本実施形態においては、対話装置10は、発話者が話し終わっていないと判定した場合には、発話者の話を傾聴していることを示す応答(相槌や頷き)を行う。そして、対話装置10は、発話者が話し終わったと判定すると、それまでの認識結果メッセージを纏めて発話内容を解析し、その解析結果に応じた応答を行う。
図2に示す例では、例えば、対話装置10は、「えーっと」という認識結果メッセージに対して話し終わりでないと判定すると、例えば、発話者の話を傾聴していることを示す相槌(例えば、「はい」)を音声出力する。さらに、対話装置10は、「昨日、引越しをしたので、」という認識結果メッセージに対して話し終わりでないと判定すると、例えば、発話者の話を傾聴していることを示すロボット装置の動作(例えば、頷き)を行う。また、対話装置10は、話し終わりではないと判定した認識結果メッセージ(「えーっと」および「昨日、引越しをしたので、」)を順次蓄積する。
さらに、対話装置10は、「住所変更をしたいのですが」という認識結果メッセージに対して話し終わりであると判定すると、これまでに蓄積した認識結果メッセージ(「えーっと」および「昨日、引越しをしたので、」)と、現在の認識結果メッセージ「住所変更をしたいのですが」とを纏めて発話内容として取得する。そして、対話装置10は、取得した発話内容を解析し、発話内容に対する回答(例えば、住所変更の方法)を音声出力する。
このように本実施形態においては、対話装置10は、発話者が話し終わったか否かを判定する話し終わり判定部11と、話し終わり判定部11により発話者が話し終わったと判定されると、発話者の話し終わりまでの発話内容に応じた応答を応答部12に行わせ、話し終わり判定部11により発話者が話し終わっていないと判定されると、発話者の話を傾聴していることを示す応答を応答部12に行わせる応答制御部15と、を備える。
発話者が話し終わったと判定すると、それまでの発話内容に応じた応答を行い、発話者が話し終わっていないと判定すると、発話者の話を傾聴していることを示す応答を行うことで、話し終わる前の中途半端な発話内容の解析結果に応じた応答が行われる可能性が低減し、また、発話者に対して話を傾聴していることを示すことができるので、発話者に対してより適切な応答を行うことができる。
(第2の実施形態)
図3は、本発明の第2の実施形態に係る対話装置10Aの構成例を示す図である。図3において、図1と同様の構成には同じ符号を付し、説明を省略する。
図3に示す対話装置10Aは、図1に示す対話装置10と比較して、話し終わり判定部11を話し終わり判定部11Aに変更した点が異なる。
話し終わり判定部11Aは、発話時の発話者の音声および発話者を撮影した映像が入力され、入力された音声および映像に基づき、発話者が話し終わったか否かを判定する。例えば、話し終わり判定部11Aは、入力音声から発話者が音声を発しない無音期間が所定時間以上続いたことを検出し、かつ、発話時の発話者の映像から、発話者が口を閉じている期間が所定時間以上続いたことを検出すると、発話者が話し終えたと判定する。なお、話し終わり判定部11Aは、発話時の発話者の音声および発話者を撮影した映像のいずれか一方から、発話者が話し終えたか否かを判定してもよい。
第1の実施形態においては、話し終わり判定部11は、発話者の音声に対する音声認識の結果に基づき、発話者が話し終わったか否かを判定する。一方、本実施形態においては、話し終わり判定部11Aは、音声認識を行うことなく、発話者の発話時の音声的情報および視覚的情報の少なくとも一方に基づいて、発話者が話し終わったか否かを判定する。
応答制御部15は、第1の実施形態と同様に、発話者の音声に対する音声認識により得られる認識結果メッセージから発話内容を取得し、取得した発話内容を解析し、解析結果に応じた応答を応答部12に行わせる。
なお、上述した第1および第2の実施形態においては、発話者に対する応答として音声出力およびロボット装置の動作を行う例を用いて説明したが、これに限られるものではなく、例えば、音声出力のみであってもよい。この場合、コールセンタにおける顧客との対話などに本発明を適用することができる。
また、発話者が発した音声に対する音声認識には、誤りが発生することがある。そこで、単語の音声認識による認識結果として複数の候補を用意するN−best法を用いた処理を行ってもよい。
実施形態では特に触れていないが、対話装置10,10Aとして機能するコンピュータが行う各処理を実行するためのプログラムが提供されてもよい。また、プログラムは、コンピュータ読取り可能媒体に記録されていてもよい。コンピュータ読取り可能媒体を用いれば、コンピュータにインストールすることが可能である。ここで、プログラムが記録されたコンピュータ読取り可能媒体は、非一過性の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、CD−ROMやDVD−ROMなどの記録媒体であってもよい。
上述の実施形態は代表的な例として説明したが、本発明の趣旨および範囲内で、多くの変更および置換が可能であることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。例えば、実施形態の構成図に記載の複数の構成ブロックを1つに組み合わせたり、あるいは1つの構成ブロックを分割したりすることが可能である。
10,10A 対話装置
11,11A 話し終わり判定部
12 応答部
13 音声合成部
14 動作部
15 応答制御部

Claims (6)

  1. 発話者に対する応答を行う応答部を備えた対話装置であって、
    前記発話者が話し終わったか否かを判定する話し終わり判定部と、
    前記話し終わり判定部により前記発話者が話し終わったと判定されると、前記発話者の話し終わりまでの発話内容に応じた応答を前記応答部に行わせ、前記話し終わり判定部により前記発話者が話し終わっていないと判定されると、前記発話者の話を傾聴していることを示す応答を前記応答部に行わせる応答制御部と、を備えることを特徴とする対話装置。
  2. 請求項1に記載の対話装置において、
    前記話し終わり判定部は、前記発話者の発話の区切りで、前記発話者が話し終わったか否かを判定することを特徴とする対話装置。
  3. 請求項1または2に記載の対話装置において、
    前記話し終わり判定部は、前記発話者が発した音声に対する音声認識の結果に基づいて、前記発話者が話し終わったか否かを判定することを特徴とする対話装置。
  4. 請求項1または2に記載の対話装置において、
    前記話し終わり判定部は、前記発話者の発話時の音声的情報および視覚的情報の少なくとも一方に基づいて、前記発話者が話し終わったか否かを判定することを特徴とする対話装置。
  5. 発話者に対する応答を行う応答部を備えた対話装置の制御方法であって、
    前記発話者が話し終わったか否かを判定するステップと、
    前記発話者が話し終わったと判定されると、前記発話者の話し終わりまでの発話内容に応じた応答を前記応答部に行わせ、前記発話者が話し終わっていないと判定されると、前記発話者の話を傾聴していることを示す応答を前記応答部に行わせるステップと、を含むことを特徴とする制御方法。
  6. コンピュータを請求項1から4のいずれか一項に記載の対話装置として機能させるためのプログラム。
JP2017063689A 2017-03-28 2017-03-28 対話装置、対話装置の制御方法およびプログラム Active JP6736225B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017063689A JP6736225B2 (ja) 2017-03-28 2017-03-28 対話装置、対話装置の制御方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017063689A JP6736225B2 (ja) 2017-03-28 2017-03-28 対話装置、対話装置の制御方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2018165805A true JP2018165805A (ja) 2018-10-25
JP6736225B2 JP6736225B2 (ja) 2020-08-05

Family

ID=63922713

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017063689A Active JP6736225B2 (ja) 2017-03-28 2017-03-28 対話装置、対話装置の制御方法およびプログラム

Country Status (1)

Country Link
JP (1) JP6736225B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020190587A (ja) * 2019-05-20 2020-11-26 カシオ計算機株式会社 ロボットの制御装置、ロボット、ロボットの制御方法及びプログラム
KR20210012153A (ko) 2019-07-24 2021-02-03 박용희 기액분리 유닛을 통한 수 처리 장치

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11175093A (ja) * 1997-12-08 1999-07-02 Nippon Telegr & Teleph Corp <Ntt> 音声認識確認応答方法
JP2004309682A (ja) * 2003-04-04 2004-11-04 Nippon Telegr & Teleph Corp <Ntt> 音声対話方法、音声対話端末装置、音声対話センタ装置、音声対話プログラム
JP2005196134A (ja) * 2003-12-12 2005-07-21 Toyota Central Res & Dev Lab Inc 音声対話システム及び方法並びに音声対話プログラム
JP2007328283A (ja) * 2006-06-09 2007-12-20 Kenwood Corp 対話装置、プログラム、及び対話方法
JP6070809B1 (ja) * 2015-12-03 2017-02-01 国立大学法人静岡大学 自然言語処理装置及び自然言語処理方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11175093A (ja) * 1997-12-08 1999-07-02 Nippon Telegr & Teleph Corp <Ntt> 音声認識確認応答方法
JP2004309682A (ja) * 2003-04-04 2004-11-04 Nippon Telegr & Teleph Corp <Ntt> 音声対話方法、音声対話端末装置、音声対話センタ装置、音声対話プログラム
JP2005196134A (ja) * 2003-12-12 2005-07-21 Toyota Central Res & Dev Lab Inc 音声対話システム及び方法並びに音声対話プログラム
JP2007328283A (ja) * 2006-06-09 2007-12-20 Kenwood Corp 対話装置、プログラム、及び対話方法
JP6070809B1 (ja) * 2015-12-03 2017-02-01 国立大学法人静岡大学 自然言語処理装置及び自然言語処理方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
中川 聖一, 音声言語処理と自然言語処理, vol. 第1版, JPN6019050703, 28 March 2013 (2013-03-28), pages 153, ISSN: 0004182817 *
伊福部 達, 進化するヒトと機械の音声コミュニケーション, vol. 第1版, JPN6019050702, 10 September 2015 (2015-09-10), pages 193, ISSN: 0004182816 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020190587A (ja) * 2019-05-20 2020-11-26 カシオ計算機株式会社 ロボットの制御装置、ロボット、ロボットの制御方法及びプログラム
JP7342419B2 (ja) 2019-05-20 2023-09-12 カシオ計算機株式会社 ロボットの制御装置、ロボット、ロボットの制御方法及びプログラム
KR20210012153A (ko) 2019-07-24 2021-02-03 박용희 기액분리 유닛을 통한 수 처리 장치

Also Published As

Publication number Publication date
JP6736225B2 (ja) 2020-08-05

Similar Documents

Publication Publication Date Title
JP5381988B2 (ja) 対話音声認識システム、対話音声認識方法および対話音声認識用プログラム
US9293134B1 (en) Source-specific speech interactions
JP6819672B2 (ja) 情報処理装置、情報処理方法、及びプログラム
US8560326B2 (en) Voice prompts for use in speech-to-speech translation system
US9293133B2 (en) Improving voice communication over a network
US9666209B2 (en) Prevention of unintended distribution of audio information
US20180068660A1 (en) Voice interaction apparatus and automatic interaction method using voice interaction apparatus
WO2017200074A1 (ja) 対話方法、対話システム、対話装置、及びプログラム
JP5018773B2 (ja) 音声入力システム、対話型ロボット、音声入力方法、および、音声入力プログラム
Hansen et al. On the issues of intra-speaker variability and realism in speech, speaker, and language recognition tasks
JP2006251545A (ja) 音声対話システム及びコンピュータプログラム
WO2016088557A1 (ja) 会話評価装置および方法
JP2009178783A (ja) コミュニケーションロボット及びその制御方法
KR20230098266A (ko) 통화들 및 오디오 메시지들로부터 다른 화자들의 음성 필터링
JP6270661B2 (ja) 音声対話方法、及び音声対話システム
JP2018165805A (ja) 対話装置、対話装置の制御方法およびプログラム
JP2020113150A (ja) 音声翻訳対話システム
US20200388268A1 (en) Information processing apparatus, information processing system, and information processing method, and program
JPWO2017200077A1 (ja) 対話方法、対話システム、対話装置、及びプログラム
Ward et al. A responsive dialog system
JP2008249893A (ja) 音声応答装置及びその方法
Nishimuta et al. Development of a robot quizmaster with auditory functions for speech-based multiparty interaction
Beça et al. Evaluating the performance of ASR systems for TV interactions in several domestic noise scenarios
JP7007616B2 (ja) 学習データ生成装置、学習データ生成方法およびプログラム
Moriya et al. Estimation of conversational activation level during video chat using turn-taking information.

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180507

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190516

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190521

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190718

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200107

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200302

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200714

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200714

R150 Certificate of patent or registration of utility model

Ref document number: 6736225

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150