JP6929960B2 - 情報処理装置及び情報処理方法 - Google Patents
情報処理装置及び情報処理方法 Download PDFInfo
- Publication number
- JP6929960B2 JP6929960B2 JP2019555315A JP2019555315A JP6929960B2 JP 6929960 B2 JP6929960 B2 JP 6929960B2 JP 2019555315 A JP2019555315 A JP 2019555315A JP 2019555315 A JP2019555315 A JP 2019555315A JP 6929960 B2 JP6929960 B2 JP 6929960B2
- Authority
- JP
- Japan
- Prior art keywords
- guidance information
- user
- user terminal
- data
- input data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 13
- 238000003672 processing method Methods 0.000 title claims description 4
- 238000012545 processing Methods 0.000 claims description 113
- 230000004044 response Effects 0.000 claims description 52
- 230000002452 interceptive effect Effects 0.000 claims description 7
- 238000004891 communication Methods 0.000 description 22
- 230000006870 function Effects 0.000 description 21
- 235000013550 pizza Nutrition 0.000 description 17
- 238000004458 analytical method Methods 0.000 description 16
- 238000000034 method Methods 0.000 description 12
- 230000004048 modification Effects 0.000 description 10
- 238000012986 modification Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 7
- 230000010485 coping Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 235000013351 cheese Nutrition 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9032—Query formulation
- G06F16/90332—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Acoustics & Sound (AREA)
- User Interface Of Digital Computer (AREA)
- Machine Translation (AREA)
Description
図1は、本発明の一実施形態に係る対話処理システムの全体構成を示すブロック図である。この対話処理システムは、本発明に係る情報処理装置の一形態である中継装置1と、発話者であるユーザが利用するユーザ端末2と、ユーザが発話した音声を認識してその認識結果に応じた処理(以下、対話処理機能という)を行う対話処理装置3a,3bと、これら中継装置1、ユーザ端末2及び対話処理装置3a,3bを通信可能に接続する通信網4とを備えている。ユーザ端末2は例えばスマートホンやタブレット等の携帯可能なコンピュータであってもよいし、ユーザの自宅等に設置された据え置き型のコンピュータであってもよい。通信網4は移動通信網又は固定通信網を含んでおり、例えばユーザ端末2は無線で移動通信網に接続可能である。対話処理装置3a,3bは図では2つある場合を例示しているが、この例に限らず、1以上であればよい。また、ユーザ端末2は1つに限らず、複数であってもよい。なお、以下において、対話処理装置3a,3bを総称するときは、対話処理装置3という。
次に、図4、5を参照して本実施形態の動作を説明する。まず、中継装置1による案内情報の生成動作について説明する。ユーザが対話処理機能を起動するために予め決められたキーワードを発話すると、ユーザ端末2がこの発話を収音して対話処理機能が起動される。次に、ユーザは、いずれかの対話処理装置3を指定して処理を指示する発話を行う。中継装置1の取得部11は、ユーザ端末2に入力された発話に応じた入力データを通信網4経由で取得して記憶する。出力部13は、この入力データを通信網4経由で対話処理装置3に出力する(ステップS1)。これに応じて、対話処理装置3から応答データが送信されてくるので、取得部11は、対話処理装置3から送信されてくる応答データを通信網4経由で取得して記憶する。出力部13は、この応答データを通信網4経由でユーザ端末2に出力する(ステップS2)。生成部12は、上記ステップS1,S2において記憶された入力データ及び応答データに基づいて、対話処理装置3の利用に関してユーザに案内する案内情報を生成する(ステップS3)。
上述した実施形態は次のような変形が可能である。また、以下の変形例を互いに組み合わせて実施してもよい。
[変形例1]
案内情報を生成する方法は実施形態の例に限定されない。例えば生成部12は、ユーザの入力データに応答する応答データ群のうち、エラーに関する応答データに基づいて、案内情報を生成するようにしてもよい。具体的には、ユーザの入力データを対話処理装置3が認識することができなかったり、その入力データに対応する処理が存在しなかったりするような場合に、対話処理装置3は、例えば「もう一度言ってください」、「よくわかりませんでした」、「理解できませんでした」等の、ユーザにより指定された処理ができないことを意味するエラー応答を行う。このような場合、生成部12は、エラー応答が出力される直前のユーザの入力データを対話処理装置3毎に収集しておく。そして、生成部12は、エラー応答が出力される直前のユーザの入力データを列挙した後で、「これらの音声入力にはこの対話処理装置は対応していません」というようなメッセージを含む案内情報を生成する。この場合、生成部12は、エラー応答が出力されるユーザの入力データのうち、エラー応答が頻出するもの(閾値以上のエラー応答が出力される場合)に限定して案内情報を生成してもよい。
生成部12は、入力データと当該入力データに応答する応答データとの組を1回の対話回数としたときに、ユーザ端末2に入力データが入力されてから対話処理装置3が処理を行うまでの対話回数に基づいて案内情報を生成するようにしてもよい。具体的には、生成部12は、ユーザ端末2に入力データが入力されてから各対話処理装置3について処理完了までの対話回数を記録しておき、それを案内情報として提供する。例えば生成部12は、商品特定(ピザ名特定)→オプション特定(ピザ以外のサブメニュー特定)→お届け先入力→決済情報入力→確認、といった対話の流れにおいて対話回数を記録しておき、その対話回数を案内する案内情報を生成する。お届け先や決済情報が既に登録されている場合には、そのときの対話回数も記録しておき、その対話回数を案内する案内情報を生成するようにしてもよい。
案内情報の生成は、ユーザ又はユーザグループ単位の生成であってもよい。ここでいうユーザグループとは、例えばオフィスの組織や家族といったグループである。この場合、ユーザ端末2は自装置の識別情報及び自装置のユーザが属するユーザグループの識別情報を伴ってデータ通信を行う。この場合、生成部12は、ユーザ端末2を使用するユーザ単位又は当該ユーザが属するグループ単位で案内情報を生成し、出力部13は、ユーザ端末2を使用するユーザ又は当該ユーザが属するグループに応じた案内情報を当該ユーザ端末2に出力する。
出力部13は、案内情報の内容に応じて当該案内情報を表示するか又は音声出力するかを指定して、当該案内情報をユーザ端末2に出力するようにしてもよい。出力部13は、例えば案内情報の情報量が多い場合や、画像で示したほうが分かりやすい場合には、その案内情報を表示するよう指定してユーザ端末2に出力する。一方、出力部13は、例えばユーザ端末2が高速で移動中の場合(車両による移動中と推測される場合)には、その案内情報を音声出力するよう指定してユーザ端末2に出力する。
案内情報の出力タイミングは図5の例に限らず、いつでもよい。出力部13は、例えば、最初のユーザ発話及び装置発話が完了した後に案内情報を出力してもよい。
生成部12は、どの対話処理装置3が入力データの入力先となる対話処理装置3に相当するかを学習してもよい。具体的には、まず初期段階では、ユーザがいずれかの対話処理装置3を指定して所望の処理を指示する発話を行うが、このときのユーザの入力データと指定された対話処理装置3との対応関係を学習する。例えばユーザの入力データが「ミックスピザください」「チーズピザください」「ミックスチーズピザください」等のように「ピザ」という単語が含まれている場合には、対話処理装置3aが指定されるという対応関係をユーザ端末2毎に学習する。つまり、生成部12は、取得された入力データ及び応答データに基づいて、複数の対話処理装置3のうち、当該入力データの入力先となる対話処理装置3を学習する。このようにすれば、ユーザがこのシステムを利用していく期間が長くなるにつれて上記の学習が進み、最終的には、ユーザが対話処理装置3を指定しなくても、ユーザ発話がそのユーザの所望する対話処理装置3に届けられることになる。
上記実施の形態の説明に用いたブロック図は、機能単位のブロックを示している。これらの機能ブロック(構成部)は、ハードウェア及び/又はソフトウェアの任意の組み合わせによって実現される。また、各機能ブロックの実現手段は特に限定されない。すなわち、各機能ブロックは、物理的及び/又は論理的に結合した1つの装置により実現されてもよいし、物理的及び/又は論理的に分離した2つ以上の装置を直接的及び/又は間接的に(例えば、有線及び/又は無線)で接続し、これら複数の装置により実現されてもよい。
例えば、中継装置1は、図3の機能の全てを一体に備えた単一装置によっても実現可能であるし、これらの機能を複数の装置に分散して備えたシステムによって実現されてもよい。
例えば対話処理装置3の機能の少なくとも一部の機能を中継装置1が備えていてもよい。また、中継装置1は、対話処理装置3とは異なる専用の対話機能(例えば対話処理装置3に対するユーザとの対話しシーケンスに移行する前段階でユーザと対話する機能)を有していてもよい。
本明細書で説明した各態様/実施形態は単独で用いてもよいし、組み合わせて用いてもよいし、実行に伴って切り替えて用いてもよい。また、所定の情報の通知(例えば、「Xであること」の通知)は、明示的に行うものに限られず、暗黙的(例えば、当該所定の情報の通知を行わない)ことによって行われてもよい。
Claims (5)
- ユーザ端末に入力された発話に応じた入力データと、当該入力データに応じた処理を行う1以上の対話処理装置からの応答データを取得する取得部と、
前記入力データと、前記入力データに応答する前記応答データとをそれぞれ類型化した結果に基づいて、当該対話処理装置の利用に関してユーザに案内する案内情報を生成する生成部と、
前記生成部によって生成された案内情報を前記ユーザ端末に出力する出力部と
を備えることを特徴とする情報処理装置。 - 前記生成部は、前記ユーザ端末を使用するユーザ又は当該ユーザが属するグループ単位で前記案内情報を生成し、
前記出力部は、前記ユーザ端末を使用するユーザ又は当該ユーザが属するグループに応じた案内情報を当該ユーザ端末に出力する
ことを特徴とする請求項1に記載の情報処理装置。 - 前記出力部は、前記案内情報の内容に応じて当該案内情報を表示するか又は音声出力するかを指定して、当該案内情報を前記ユーザ端末に出力する
ことを特徴とする請求項1または2に記載の情報処理装置。 - 前記出力部は、前記案内情報を出力する必要があるか否かを判断し、前記案内情報を出力する必要がある場合には、当該案内情報を前記ユーザ端末に出力する
ことを特徴とする請求項1〜3のいずれか1項に記載の情報処理装置。 - ユーザ端末に入力された発話に応じた入力データと、当該入力データに応じた処理を行う1以上の対話処理装置からの応答データを取得するステップと、
前記入力データと、前記入力データに応答する前記応答データとをそれぞれ類型化した結果に基づいて、当該対話処理装置の利用に関してユーザに案内する案内情報を生成するステップと、
前記生成された案内情報を前記ユーザ端末に出力するステップと
を含む情報処理方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017225815 | 2017-11-24 | ||
JP2017225815 | 2017-11-24 | ||
PCT/JP2018/042885 WO2019103007A1 (ja) | 2017-11-24 | 2018-11-20 | 情報処理装置及び情報処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2019103007A1 JPWO2019103007A1 (ja) | 2020-12-03 |
JP6929960B2 true JP6929960B2 (ja) | 2021-09-01 |
Family
ID=66631982
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019555315A Active JP6929960B2 (ja) | 2017-11-24 | 2018-11-20 | 情報処理装置及び情報処理方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11755652B2 (ja) |
JP (1) | JP6929960B2 (ja) |
WO (1) | WO2019103007A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114207710A (zh) * | 2019-10-15 | 2022-03-18 | 谷歌有限责任公司 | 检测和/或登记热命令以由自动助理触发响应动作 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000194386A (ja) * | 1998-12-24 | 2000-07-14 | Omron Corp | 音声認識応答装置及び方法 |
US20020052913A1 (en) | 2000-09-06 | 2002-05-02 | Teruhiro Yamada | User support apparatus and system using agents |
JP2002163054A (ja) * | 2000-11-29 | 2002-06-07 | Sanyo Electric Co Ltd | ユーザ支援方法、装置およびシステム |
JP5360414B2 (ja) | 2007-06-06 | 2013-12-04 | 日本電気株式会社 | キーワード抽出モデル学習システム、方法およびプログラム |
-
2018
- 2018-11-20 JP JP2019555315A patent/JP6929960B2/ja active Active
- 2018-11-20 US US16/647,684 patent/US11755652B2/en active Active
- 2018-11-20 WO PCT/JP2018/042885 patent/WO2019103007A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2019103007A1 (ja) | 2019-05-31 |
JPWO2019103007A1 (ja) | 2020-12-03 |
US20210248189A1 (en) | 2021-08-12 |
US11755652B2 (en) | 2023-09-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11315560B2 (en) | Method for conducting dialog between human and computer | |
KR102289917B1 (ko) | 화행 정보를 이용한 대화 처리 방법 및 그 장치 | |
US9865264B2 (en) | Selective speech recognition for chat and digital personal assistant systems | |
US9742912B2 (en) | Method and apparatus for predicting intent in IVR using natural language queries | |
CN111159364B (zh) | 对话系统、对话装置、对话方法以及存储介质 | |
US10586528B2 (en) | Domain-specific speech recognizers in a digital medium environment | |
KR101615848B1 (ko) | 유사상황 검색을 통한 대화 스티커 추천방법 및 컴퓨터 프로그램 | |
US10255346B2 (en) | Tagging relations with N-best | |
KR20190117840A (ko) | 대화 이해 ai 시스템에 의한 고객 상담의 제공 중에 사람 상담 직원으로 하여금 해당 고객을 위한 이후 상담을 진행하도록 전환하는 방법 및 컴퓨터 판독가능 기록 매체 | |
US12008988B2 (en) | Electronic apparatus and controlling method thereof | |
JP6929960B2 (ja) | 情報処理装置及び情報処理方法 | |
US20210166685A1 (en) | Speech processing apparatus and speech processing method | |
JP6937842B2 (ja) | 情報処理装置及び情報処理方法 | |
JP2020204711A (ja) | 登録システム | |
US11942086B2 (en) | Description support device and description support method | |
CN114860910A (zh) | 智能对话方法及系统 | |
CN114528386A (zh) | 机器人的外呼控制方法、装置、存储介质和终端 | |
JP2021012660A (ja) | 情報処理装置、情報処理方法および情報処理プログラム | |
US20240321267A1 (en) | A system and method for delivering domain or use-case switch suggestion for an ongoing conversation | |
US20230342642A1 (en) | System and method for managing a user-controllable device | |
US20220238107A1 (en) | Device and method for providing recommended sentence related to utterance input of user | |
Hunt et al. | Artificial Intelligence for Customer Experience and Care | |
JP2022152061A (ja) | 情報取得サーバ、プログラム及び情報取得システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200512 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210302 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210406 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210713 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210811 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6929960 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |