JP7044167B2 - 対話装置、対話方法及び対話プログラム - Google Patents
対話装置、対話方法及び対話プログラム Download PDFInfo
- Publication number
- JP7044167B2 JP7044167B2 JP2020547883A JP2020547883A JP7044167B2 JP 7044167 B2 JP7044167 B2 JP 7044167B2 JP 2020547883 A JP2020547883 A JP 2020547883A JP 2020547883 A JP2020547883 A JP 2020547883A JP 7044167 B2 JP7044167 B2 JP 7044167B2
- Authority
- JP
- Japan
- Prior art keywords
- dialogue
- user
- keyword
- unit
- storage area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/083—Recognition networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
Description
図1は、実施例1にかかる対話装置の機能構成を示す機能ブロック図である。図1に示すように、対話装置10は、通信部11、記憶部12及び制御部13を有する。また、対話装置10は、入力装置20及び出力装置30と接続されている。
(ユーザの発話に対する処理の流れ)
図5を用いて、ユーザの発話に対する対話装置10の処理の流れを説明する。図5は、ユーザの発話に対する処理の流れを示すフローチャートである。図5に示すように、まず、対話装置10は、ユーザの発話の入力を受け付ける(ステップS11)。次に、対話装置10は、入力されたユーザの発話の内容を解釈する(ステップS12)。そして、対話装置10は、キーワード追加処理を実行する(ステップS13)。
図6を用いて、ユーザの反応に対する対話装置10の処理の流れを説明する。図6は、ユーザの反応に対する処理の流れを示すフローチャートである。図6に示すように、まず、対話装置10は、ユーザに対して発話を出力する(ステップS21)。次に、対話装置10は、ユーザの反応の入力を受け付ける(ステップS22)。そして、対話装置10は、ユーザの反応がポジティブであるか否かを判定する(ステップS23)。
図7を用いて、キーワード追加処理の流れを説明する。図7は、キーワード追加処理の流れを示すフローチャートである。なお、キーワード追加処理は、図5のステップS13及び図6のステップS24に対応する処理である。
図8を用いて、発話の出力処理の流れを説明する。図8は、発話の出力処理の流れを示すフローチャートである。図8に示すように、まず、対話状態推定処理を実行する(ステップS31)。次に、対話装置10は、対話状態が、「新規話題開始」及び「発散」のうちのいずれかであるか、又は「新規話題開始」及び「発散」のいずれでもないかを判定する(ステップS32)。
図9を用いて、対話状態推定処理の流れを説明する。図9は、対話状態推定処理の流れを示すフローチャートである。なお、対話状態推定処理は、図8のステップS31に対応している。
上述したように、対話装置10は、ユーザと対話装置10との間でユーザから発話された内容を基に、対話状態を推定する。また、対話装置10は、ユーザと対話装置10との間でユーザから発話された内容を基に、対話状態を推定する。また、対話装置10は、推定した対話状態に対応したストラテジーを取得し、取得したストラテジーに基づいてユーザと対話装置10との対話において、対話装置10が発話する発話内容を選択する。対話装置10は、選択した発話内容でユーザに対して発話する。このように、対話装置10は、対話状態に応じて話題を遷移させ、ユーザが対話に飽きないようにすることができる。このため、対話装置10によれば、対話の継続性を高めることができる。
上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。また、実施例で説明した具体例、分布、数値等は、あくまで一例であり、任意に変更することができる。
図10は、ハードウェア構成例を説明する図である。図10に示すように、対話装置10は、通信装置10a、HDD(Hard Disk Drive)10b、メモリ10c、プロセッサ10dを有する。また、図10に示した各部は、バス等で相互に接続される。
11 通信部
12 記憶部
13 制御部
20 入力装置
30 出力装置
121 キーワード記憶領域
122 対話ブロックDB
131 入力部
132 解釈部
133 読込部
134 生成部
135 出力部
150 ブロック選択部
151 蓄積部
152 推定部
153 評価部
154 選択部
Claims (6)
- ユーザと対話装置による対話において出現したキーワードであって、記憶領域に蓄積済みでないキーワードを前記記憶領域に蓄積する蓄積部と、
前記ユーザと前記対話装置との間でユーザから発話された内容を基に、前記記憶領域にキーワードが新たに追加されたか否か、及び、追加されたキーワードが前記記憶領域に蓄積済みのキーワードと類似していたか否か、により対話状態を推定する推定部と、
前記推定した対話状態に対応したストラテジーを取得し、取得したストラテジーに基づいて前記ユーザと対話装置との対話において、対話装置が発話する発話内容を選択する選択部と、
前記選択部により選択された発話内容でユーザに対して発話する発話部と、
を有することを特徴とする対話装置。 - 前記推定部は、蓄積済みのキーワードと非類似のキーワードが追加された場合、対話状態を新規話題開始と推定し、蓄積済みのキーワードと類似のキーワードが追加された場合、対話状態を発散と推定し、キーワードが追加されなかった場合、対話状態を収束と推定し、対話が途切れた場合、対話状態を話題なしと推定することを特徴とする請求項1に記載の対話装置。
- 前記蓄積部は、前記ユーザに対する前記対話装置からの発話のうち、前記ユーザが肯定的な反応をした発話に含まれるキーワードを前記記憶領域に蓄積することを特徴とする請求項1に記載の対話装置。
- 前記選択部は、
前記取得したストラテジーに基づいて、発話内容をあらかじめ定義した情報である対話ブロックを評価する評価部と、
前記評価部による評価に基づいて選択された対話ブロックから、前記ユーザに対して出力する発話を生成する生成部と、
をさらに有することを特徴とする請求項1に記載の対話装置。 - コンピュータが、
ユーザと対話装置による対話において出現したキーワードであって、記憶領域に蓄積済みでないキーワードを記憶領域に蓄積し、
前記ユーザと前記対話装置との間でユーザから発話された内容を基に、前記記憶領域にキーワードが新たに追加されたか否か、及び、追加されたキーワードが前記記憶領域に蓄積済みのキーワードと類似していたか否か、により対話状態を推定し、
前記推定した対話状態に対応したストラテジーを取得し、取得したストラテジーに基づいて前記ユーザと対話装置との対話において、対話装置が発話する発話内容を選択し、
選択した発話内容でユーザに対して発話する
処理を実行することを特徴とする対話方法。 - コンピュータに、
ユーザと対話装置による対話において出現したキーワードであって、記憶領域に蓄積済みでないキーワードを記憶領域に蓄積し、
前記ユーザと前記対話装置との間でユーザから発話された内容を基に、前記記憶領域にキーワードが新たに追加されたか否か、及び、追加されたキーワードが前記記憶領域に蓄積済みのキーワードと類似していたか否か、により対話状態を推定し、
前記推定した対話状態に対応したストラテジーを取得し、取得したストラテジーに基づいて前記ユーザと対話装置との対話において、対話装置が発話する発話内容を選択し、
選択した発話内容でユーザに対して発話する
処理を実行させることを特徴とする対話プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2018/036581 WO2020066019A1 (ja) | 2018-09-28 | 2018-09-28 | 対話装置、対話方法及び対話プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2020066019A1 JPWO2020066019A1 (ja) | 2021-08-30 |
JP7044167B2 true JP7044167B2 (ja) | 2022-03-30 |
Family
ID=69951281
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020547883A Active JP7044167B2 (ja) | 2018-09-28 | 2018-09-28 | 対話装置、対話方法及び対話プログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US20210210082A1 (ja) |
EP (1) | EP3859568A4 (ja) |
JP (1) | JP7044167B2 (ja) |
WO (1) | WO2020066019A1 (ja) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007219149A (ja) | 2006-02-16 | 2007-08-30 | Toyota Central Res & Dev Lab Inc | 応答生成装置、方法及びプログラム |
JP2007264198A (ja) | 2006-03-28 | 2007-10-11 | Toshiba Corp | 対話装置、対話方法、対話システム、コンピュータプログラム及び対話シナリオ生成装置 |
JP2008097082A (ja) | 2006-10-06 | 2008-04-24 | Mitsubishi Electric Corp | 音声対話装置 |
JP2011033837A (ja) | 2009-07-31 | 2011-02-17 | Nec Corp | 対話支援装置、対話支援方法およびプログラム |
JP2014222402A (ja) | 2013-05-13 | 2014-11-27 | 日本電信電話株式会社 | 発話候補生成装置、発話候補生成方法、及び発話候補生成プログラム |
WO2016157642A1 (ja) | 2015-03-27 | 2016-10-06 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
JP2017125921A (ja) | 2016-01-13 | 2017-07-20 | 日本電信電話株式会社 | 発話選択装置、方法、及びプログラム |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001188784A (ja) * | 1999-12-28 | 2001-07-10 | Sony Corp | 会話処理装置および方法、並びに記録媒体 |
JP3994368B2 (ja) * | 2000-01-25 | 2007-10-17 | ソニー株式会社 | 情報処理装置および情報処理方法、並びに記録媒体 |
JP2002229919A (ja) | 2001-02-07 | 2002-08-16 | Fujitsu Ltd | 会話装置及び会話促進方法 |
KR101032176B1 (ko) * | 2002-12-02 | 2011-05-02 | 소니 주식회사 | 대화 제어 장치 및 방법 및 로봇 장치 |
JP2004310034A (ja) | 2003-03-24 | 2004-11-04 | Matsushita Electric Works Ltd | 対話エージェントシステム |
JP5294315B2 (ja) | 2008-11-28 | 2013-09-18 | 学校法人早稲田大学 | 対話活性化ロボット |
FR3011375B1 (fr) * | 2013-10-01 | 2017-01-27 | Aldebaran Robotics | Procede de dialogue entre une machine, telle qu'un robot humanoide, et un interlocuteur humain, produit programme d'ordinateur et robot humanoide pour la mise en œuvre d'un tel procede |
EP2933071A1 (en) * | 2014-04-17 | 2015-10-21 | Aldebaran Robotics | Methods and systems for managing dialogs of a robot |
US10108702B2 (en) * | 2015-08-24 | 2018-10-23 | International Business Machines Corporation | Topic shift detector |
JP6601069B2 (ja) * | 2015-09-01 | 2019-11-06 | カシオ計算機株式会社 | 対話制御装置、対話制御方法及びプログラム |
US10789310B2 (en) * | 2016-06-30 | 2020-09-29 | Oath Inc. | Fact machine for user generated content |
JP2018021987A (ja) * | 2016-08-02 | 2018-02-08 | ユニロボット株式会社 | 会話処理装置、及びプログラム |
JP2018072560A (ja) * | 2016-10-28 | 2018-05-10 | 富士通株式会社 | 情報処理システム、情報処理装置及び情報処理方法 |
JP6795387B2 (ja) * | 2016-12-14 | 2020-12-02 | パナソニック株式会社 | 音声対話装置、音声対話方法、音声対話プログラム及びロボット |
US10268680B2 (en) * | 2016-12-30 | 2019-04-23 | Google Llc | Context-aware human-to-computer dialog |
JP6777002B2 (ja) * | 2017-04-27 | 2020-10-28 | トヨタ自動車株式会社 | 対話装置、対話方法及び対話プログラム |
-
2018
- 2018-09-28 EP EP18935850.0A patent/EP3859568A4/en not_active Withdrawn
- 2018-09-28 WO PCT/JP2018/036581 patent/WO2020066019A1/ja unknown
- 2018-09-28 JP JP2020547883A patent/JP7044167B2/ja active Active
-
2021
- 2021-03-22 US US17/207,990 patent/US20210210082A1/en not_active Abandoned
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007219149A (ja) | 2006-02-16 | 2007-08-30 | Toyota Central Res & Dev Lab Inc | 応答生成装置、方法及びプログラム |
JP2007264198A (ja) | 2006-03-28 | 2007-10-11 | Toshiba Corp | 対話装置、対話方法、対話システム、コンピュータプログラム及び対話シナリオ生成装置 |
JP2008097082A (ja) | 2006-10-06 | 2008-04-24 | Mitsubishi Electric Corp | 音声対話装置 |
JP2011033837A (ja) | 2009-07-31 | 2011-02-17 | Nec Corp | 対話支援装置、対話支援方法およびプログラム |
JP2014222402A (ja) | 2013-05-13 | 2014-11-27 | 日本電信電話株式会社 | 発話候補生成装置、発話候補生成方法、及び発話候補生成プログラム |
WO2016157642A1 (ja) | 2015-03-27 | 2016-10-06 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
JP2017125921A (ja) | 2016-01-13 | 2017-07-20 | 日本電信電話株式会社 | 発話選択装置、方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JPWO2020066019A1 (ja) | 2021-08-30 |
EP3859568A4 (en) | 2021-09-29 |
WO2020066019A1 (ja) | 2020-04-02 |
US20210210082A1 (en) | 2021-07-08 |
EP3859568A1 (en) | 2021-08-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106484093B (zh) | 对话控制装置、对话控制方法以及记录介质 | |
JP6774018B2 (ja) | 対話装置 | |
US20160004299A1 (en) | Systems and methods for assessing, verifying and adjusting the affective state of a user | |
US11183187B2 (en) | Dialog method, dialog system, dialog apparatus and program that gives impression that dialog system understands content of dialog | |
KR20200130352A (ko) | 음성 웨이크업 방법 및 장치 | |
CN104899240B (zh) | 声音检索装置、声音检索方法 | |
KR102451925B1 (ko) | 자연 언어 처리를 위한 네트워크-기반 학습 모델 | |
US10836044B2 (en) | Robot control device and robot control method | |
JP2009037050A (ja) | 対話装置と対話用プログラム | |
Leite et al. | Semi-situated learning of verbal and nonverbal content for repeated human-robot interaction | |
JP7101057B2 (ja) | 言語モデル学習装置およびそのプログラム、ならびに、単語推定装置およびそのプログラム | |
CN109726308A (zh) | 一种生成小说的背景音乐的方法及设备 | |
JP7347217B2 (ja) | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム | |
JP6952259B2 (ja) | 情報処理方法、情報処理装置、及び、プログラム | |
Bowden et al. | Entertaining and opinionated but too controlling: a large-scale user study of an open domain Alexa prize system | |
JP2001249945A (ja) | 感情生成方法および感情生成装置 | |
JP6772916B2 (ja) | 対話装置および対話方法 | |
CN113539261A (zh) | 人机语音交互方法、装置、计算机设备和存储介质 | |
JP7044167B2 (ja) | 対話装置、対話方法及び対話プログラム | |
JP6629172B2 (ja) | 対話制御装置、その方法及びプログラム | |
JP2006106748A (ja) | 音声認識の精度を改善するためのシステムおよび方法 | |
JP7248615B2 (ja) | 出力装置、出力方法及び出力プログラム | |
JP7176333B2 (ja) | 対話装置、対話方法および対話プログラム | |
JP7313518B1 (ja) | 評価方法、評価装置、および、評価プログラム | |
JP7160116B2 (ja) | 対話装置、対話方法及び対話プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201117 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211207 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220131 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220215 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220228 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7044167 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |