JPWO2020136733A1 - 対話装置、対話方法及び対話プログラム - Google Patents
対話装置、対話方法及び対話プログラム Download PDFInfo
- Publication number
- JPWO2020136733A1 JPWO2020136733A1 JP2020561999A JP2020561999A JPWO2020136733A1 JP WO2020136733 A1 JPWO2020136733 A1 JP WO2020136733A1 JP 2020561999 A JP2020561999 A JP 2020561999A JP 2020561999 A JP2020561999 A JP 2020561999A JP WO2020136733 A1 JPWO2020136733 A1 JP WO2020136733A1
- Authority
- JP
- Japan
- Prior art keywords
- dialogue
- unit
- data
- utterance
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 230000008569 process Effects 0.000 claims abstract description 20
- 238000012217 deletion Methods 0.000 claims description 12
- 230000037430 deletion Effects 0.000 claims description 12
- 238000010586 diagram Methods 0.000 description 14
- 238000000605 extraction Methods 0.000 description 11
- 230000004044 response Effects 0.000 description 11
- 238000004891 communication Methods 0.000 description 6
- 239000000284 extract Substances 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 241000282414 Homo sapiens Species 0.000 description 3
- 238000009826 distribution Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 235000019640 taste Nutrition 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/02—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail using automatic reactions or user delegation, e.g. automatic replies or chatbot-generated messages
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/07—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail characterised by the inclusion of specific contents
- H04L51/18—Commands or executable codes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/04—Real-time or near real-time messaging, e.g. instant messaging [IM]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/21—Monitoring or handling of messages
- H04L51/216—Handling conversation history, e.g. grouping of messages in sessions or threads
Landscapes
- Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Machine Translation (AREA)
Abstract
Description
図1は、実施例1にかかる対話装置の機能構成を示す機能ブロック図である。図1に示すように、対話装置10は、発話部11、追加部12及び対話ブロック記憶部13を有する。また、対話装置10は、NIC(Network Interface Card)等の通信インタフェースを介してインターネットに接続することができる。また、発話部11及び追加部12は、プロセッサ等により実現される。
図6を用いて、対話装置10の処理の流れを説明する。図6は、対話装置の処理の流れを示すシーケンス図である。図6に示すように、発話部11及び追加部12は、非同期で並行して処理を行う。まず、発話部11は、発話に対するユーザの応答の入力を受け付ける(ステップS211)。そして、発話部11は、ユーザの応答を解釈する(ステップS212)。このとき、解釈の結果は、追加部12に受け渡される。
上述したように、対話装置10は、ユーザの発話の文脈に基づいて、ユーザへの発話を生成するためのデータの候補から選択したデータを基に、ユーザに対して発話を行う。また、対話装置10は、発話する処理と非同期で、ユーザと対話装置10との間の対話から抽出したキーワードに基づいて収集された第1のデータを、データの候補に追加する。このように、対話装置10は、発話する処理の実行中であっても、非同期で対話ブロックを追加する処理を実行することができる。このため、対話装置10は、対話の応答速度を向上させることができる。
上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。また、実施例で説明した具体例、分布、数値等は、あくまで一例であり、任意に変更することができる。
図7は、ハードウェア構成例を説明する図である。図7に示すように、対話装置10は、通信装置10a、HDD(Hard Disk Drive)10b、メモリ10c、プロセッサ10dを有する。また、図7に示した各部は、バス等で相互に接続される。
11 発話部
12 追加部
13 対話ブロック記憶部
111 入力部
112 解釈部
113 対話文脈管理部
114 選択部
115 実行部
116 出力部
121 抽出部
121a 流行話題検索部
121b 興味管理部
121c 拡張部
121d 協調部
122 アプリ選択部
123 調整部
124 生成部
125 候補管理部
Claims (7)
- ユーザの発話の文脈に基づいて、前記ユーザへの発話を生成するためのデータの候補から選択したデータを基に、前記ユーザに対して発話を行う発話部と、
前記発話部による処理と非同期で、前記ユーザと対話装置との間の対話から抽出したキーワードに基づいて収集された第1のデータを、前記データの候補に追加する追加部と、
を有することを特徴とする対話装置。 - 前記追加部は、所定のICTサービスにおいて流行している話題、あらかじめ設定された所定の嗜好に合致する話題、あらかじめ取得された前記ユーザの興味に合致する話題に関する第2のデータを、前記第1のデータの数と前記第2のデータの数の比が一定となるように、前記データの候補にさらに追加することを特徴とする請求項1に記載の対話装置。
- 前記追加部は、前記第1のデータの収集先を特定する情報を、所定の記憶領域に格納することを特徴とする請求項1に記載の対話装置。
- 前記データの候補のうち、前記発話部によって1回も選択されていないデータを、前記発話部によって1回以上選択されたデータより優先して削除する削除部をさらに有することを特徴とする請求項1に記載の対話装置。
- 前記追加部は、インターネットを介して収集されたICTサービスのコンテンツを前記データの候補に追加することを特徴とする請求項1に記載の対話装置。
- コンピュータが、
ユーザの発話の文脈に基づいて、前記ユーザへの発話を生成するためのデータの候補から選択したデータを基に、前記ユーザに対して発話し、
前記発話する処理と非同期で、前記ユーザと対話装置との間の対話から抽出したキーワードに基づいて収集された第1のデータを、前記データの候補に追加する
処理を実行することを特徴とする対話方法。 - コンピュータに、
ユーザの発話の文脈に基づいて、前記ユーザへの発話を生成するためのデータの候補から選択したデータを基に、前記ユーザに対して発話し、
前記発話する処理と非同期で、前記ユーザと対話装置との間の対話から抽出したキーワードに基づいて収集された第1のデータを、前記データの候補に追加する
処理を実行させることを特徴とする対話プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2018/047677 WO2020136733A1 (ja) | 2018-12-25 | 2018-12-25 | 対話装置、対話方法及び対話プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2020136733A1 true JPWO2020136733A1 (ja) | 2021-09-27 |
JP7160116B2 JP7160116B2 (ja) | 2022-10-25 |
Family
ID=71126947
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020561999A Active JP7160116B2 (ja) | 2018-12-25 | 2018-12-25 | 対話装置、対話方法及び対話プログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US20210304732A1 (ja) |
EP (1) | EP3905239A4 (ja) |
JP (1) | JP7160116B2 (ja) |
WO (1) | WO2020136733A1 (ja) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001034292A (ja) * | 1999-07-26 | 2001-02-09 | Denso Corp | 単語列認識装置 |
JP2004343320A (ja) * | 2003-05-14 | 2004-12-02 | Sony Corp | 情報処理装置および方法、プログラム、並びに記録媒体 |
US20160163311A1 (en) * | 2014-12-09 | 2016-06-09 | Microsoft Technology Licensing, Llc | Communication system |
JP2017037602A (ja) * | 2015-08-14 | 2017-02-16 | Psソリューションズ株式会社 | 対話インターフェース |
JP2017049427A (ja) * | 2015-09-01 | 2017-03-09 | カシオ計算機株式会社 | 対話制御装置、対話制御方法及びプログラム |
WO2017094212A1 (ja) * | 2015-11-30 | 2017-06-08 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003044088A (ja) | 2001-07-27 | 2003-02-14 | Sony Corp | プログラム、記録媒体、並びに音声対話装置および方法 |
JP2003323388A (ja) | 2002-05-01 | 2003-11-14 | Omron Corp | 情報提供方法および情報提供システム |
US8140335B2 (en) * | 2007-12-11 | 2012-03-20 | Voicebox Technologies, Inc. | System and method for providing a natural language voice user interface in an integrated voice navigation services environment |
GB2459476A (en) * | 2008-04-23 | 2009-10-28 | British Telecomm | Classification of posts for prioritizing or grouping comments. |
US8285652B2 (en) * | 2008-05-08 | 2012-10-09 | Microsoft Corporation | Virtual robot integration with search |
JP2015052745A (ja) * | 2013-09-09 | 2015-03-19 | Necパーソナルコンピュータ株式会社 | 情報処理装置、制御方法、及びプログラム |
US10997257B2 (en) * | 2015-02-06 | 2021-05-04 | Facebook, Inc. | Aggregating news events on online social networks |
KR20180070659A (ko) * | 2015-12-21 | 2018-06-26 | 구글 엘엘씨 | 메시징 애플리케이션들을 위한 자동적인 제안들 및 다른 콘텐츠 |
EP3211840B1 (en) * | 2016-02-25 | 2019-05-08 | Facebook Inc. | Techniques for messaging bot rich communication |
CA2962765A1 (en) * | 2016-04-04 | 2017-10-04 | Kik Interactive Inc. | System, apparatus and method for autonomous messaging integration |
JP2018072560A (ja) * | 2016-10-28 | 2018-05-10 | 富士通株式会社 | 情報処理システム、情報処理装置及び情報処理方法 |
US10268680B2 (en) * | 2016-12-30 | 2019-04-23 | Google Llc | Context-aware human-to-computer dialog |
US10498898B2 (en) * | 2017-12-13 | 2019-12-03 | Genesys Telecommunications Laboratories, Inc. | Systems and methods for chatbot generation |
WO2019161207A1 (en) * | 2018-02-15 | 2019-08-22 | DMAI, Inc. | System and method for conversational agent via adaptive caching of dialogue tree |
-
2018
- 2018-12-25 JP JP2020561999A patent/JP7160116B2/ja active Active
- 2018-12-25 EP EP18944489.6A patent/EP3905239A4/en not_active Withdrawn
- 2018-12-25 WO PCT/JP2018/047677 patent/WO2020136733A1/ja unknown
-
2021
- 2021-06-10 US US17/344,341 patent/US20210304732A1/en not_active Abandoned
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001034292A (ja) * | 1999-07-26 | 2001-02-09 | Denso Corp | 単語列認識装置 |
JP2004343320A (ja) * | 2003-05-14 | 2004-12-02 | Sony Corp | 情報処理装置および方法、プログラム、並びに記録媒体 |
US20160163311A1 (en) * | 2014-12-09 | 2016-06-09 | Microsoft Technology Licensing, Llc | Communication system |
JP2017037602A (ja) * | 2015-08-14 | 2017-02-16 | Psソリューションズ株式会社 | 対話インターフェース |
JP2017049427A (ja) * | 2015-09-01 | 2017-03-09 | カシオ計算機株式会社 | 対話制御装置、対話制御方法及びプログラム |
WO2017094212A1 (ja) * | 2015-11-30 | 2017-06-08 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20210304732A1 (en) | 2021-09-30 |
WO2020136733A1 (ja) | 2020-07-02 |
JP7160116B2 (ja) | 2022-10-25 |
EP3905239A4 (en) | 2021-12-29 |
EP3905239A1 (en) | 2021-11-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115082602B (zh) | 生成数字人的方法、模型的训练方法、装置、设备和介质 | |
US8954849B2 (en) | Communication support method, system, and server device | |
CN110517689B (zh) | 一种语音数据处理方法、装置及存储介质 | |
CN107832286A (zh) | 智能交互方法、设备及存储介质 | |
JP6884947B2 (ja) | 対話システム及びそのためのコンピュータプログラム | |
JP6860010B2 (ja) | 情報処理システム、情報処理方法、および情報処理プログラム | |
CN107797984A (zh) | 智能交互方法、设备及存储介质 | |
CN107040452B (zh) | 一种信息处理方法、装置和计算机可读存储介质 | |
JP2006201870A (ja) | 対話処理装置 | |
JP6804763B2 (ja) | 対話システム、対話装置及びそのためのコンピュータプログラム | |
WO2020098756A1 (zh) | 一种基于情感的语音交互方法、存储介质及终端设备 | |
Kaushik et al. | Automatic sentiment detection in naturalistic audio | |
WO2023184942A1 (zh) | 语音交互方法、装置及电器 | |
CN109710799B (zh) | 语音交互方法、介质、装置和计算设备 | |
CN113761268A (zh) | 音频节目内容的播放控制方法、装置、设备和存储介质 | |
CN109074809B (zh) | 信息处理设备、信息处理方法和计算机可读存储介质 | |
CN116958342A (zh) | 虚拟形象的动作生成方法、动作库的构建方法及装置 | |
WO2015040751A1 (ja) | 音声選択支援装置、音声選択方法、およびプログラム | |
CN117786095A (zh) | 基于一致性判别的可控新闻稿件生成方法、设备及介质 | |
CN110524547B (zh) | 会话装置、机器人、会话装置控制方法以及存储介质 | |
CN109377988B (zh) | 用于智能音箱的交互方法、介质、装置和计算设备 | |
JP7160116B2 (ja) | 対話装置、対話方法及び対話プログラム | |
CN111490929A (zh) | 视频片段推送方法、装置、电子设备、存储介质 | |
JP6821542B2 (ja) | 複数種の対話を続けて実施可能な対話制御装置、プログラム及び方法 | |
JP2014109998A (ja) | 対話装置及びコンピュータ対話方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210330 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220426 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220623 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220913 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220926 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7160116 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |