JP7093266B2 - 決定装置、決定方法及び決定プログラム - Google Patents
決定装置、決定方法及び決定プログラム Download PDFInfo
- Publication number
- JP7093266B2 JP7093266B2 JP2018154264A JP2018154264A JP7093266B2 JP 7093266 B2 JP7093266 B2 JP 7093266B2 JP 2018154264 A JP2018154264 A JP 2018154264A JP 2018154264 A JP2018154264 A JP 2018154264A JP 7093266 B2 JP7093266 B2 JP 7093266B2
- Authority
- JP
- Japan
- Prior art keywords
- user
- utterance
- response
- determination
- terminal device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 53
- 230000004044 response Effects 0.000 claims description 76
- 230000008569 process Effects 0.000 claims description 36
- 238000012545 processing Methods 0.000 claims description 28
- 230000006870 function Effects 0.000 description 49
- 238000010586 diagram Methods 0.000 description 12
- 230000005236 sound signal Effects 0.000 description 12
- 238000012549 training Methods 0.000 description 7
- 238000011156 evaluation Methods 0.000 description 6
- 230000009118 appropriate response Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 230000006399 behavior Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Landscapes
- User Interface Of Digital Computer (AREA)
Description
まず、図1を参照して、実施形態に係るネットワークシステム1の構成について説明する。図1は、実施形態に係るネットワークシステム1の構成例を示す図である。図1に示すように、実施形態に係るネットワークシステム1には、端末装置101~10nと、決定装置100とが含まれる(nは任意の自然数)。本明細書では、端末装置101~10nを区別する必要がない場合は、端末装置101~10nを「端末装置10」と総称する。端末装置10および決定装置100は、それぞれネットワークNと有線又は無線により接続される。図1中では図示していないが、ネットワークシステム1は、複数台の決定装置100を含んでもよい。
次に、図2を参照して、実施形態に係る決定処理の一例について説明する。図2は、実施形態に係る決定処理の一例を示す図である。
次に、図3を参照して、実施形態に係る決定装置100の構成例について説明する。図3は、実施形態に係る決定装置100の構成例を示す図である。図3に示すように、決定装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、決定装置100は、決定装置100を利用する管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(液晶ディスプレイ等)を有してもよい。
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。通信部110は、ネットワーク網と有線又は無線により接続され、ネットワーク網を介して、端末装置10との間で情報の送受信を行う。
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。図4に示すように、記憶部120は、ユーザ情報記憶部121と、機能情報記憶部122と、対話モデル記憶部123とを有する。
図4は、実施形態に係るユーザ情報記憶部121の一例を示す図である。ユーザ情報記憶部121は、端末装置10のユーザのユーザ情報を記憶する。例えば、ユーザ情報記憶部121は、受信部131によって受信されたユーザ情報を記憶する。図4の例では、ユーザ情報記憶部121には、「ユーザ情報」が「ユーザID」ごとに記憶される。例示として、「ユーザ情報」には、項目「コンテキスト情報」が含まれる。
図5は、実施形態に係る機能情報記憶部122の一例を示す図である。機能情報記憶部122は、端末装置10を介して提供される各種機能またはサービスの機能情報を記憶する。例えば、機能情報記憶部122は、受信部131によって受信された機能情報を記憶する。図5の例では、機能情報記憶部122には、「機能情報」が「機能ID」ごとに記憶される。例示として、「機能情報」には、項目「機能」が含まれる。
図3に戻ると、対話モデル記憶部123は、端末装置10を介して提供される各種機能またはサービスに関する対話モデルを記憶する。例えば、対話モデルは、端末装置10を介して提供される各種機能またはサービスに関連する複数のサンプル発話を含む。一例では、機能「クレジットカード管理CM1」に関する対話モデルは、サンプル発話「クレジットカードの「スロット名」を教えて」を含む。
制御部130は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)等のプロセッサによって、決定装置100内部の記憶装置に記憶されている各種プログラムがRAM等を作業領域として実行されることにより実現される。また、制御部130は、コントローラ(controller)であり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現されてもよい。
受信部131は、端末装置10から、音声信号を受信する。受信部131は、受信された音声信号を、ユーザ情報記憶部121に格納してもよい。一例では、受信部131は、発話「SS1、クレジットカードの番号を教えて」に由来する音声信号を受信する。
取得部132は、ユーザの発話に関するコンテキスト情報を取得する。取得部132は、例えば、受信部131によって受信されたコンテキスト情報を取得する。取得部132は、受信部131に受信された音声信号を、コンテキスト情報として取得してもよい。取得部132は、ユーザ情報記憶部121から、コンテキスト情報を取得してもよい。また、特定部133によって生成されたコンテキスト情報を取得してもよい。
特定部133は、受信部131によって受信された音声信号に基づいて、ユーザの発話に関するコンテキストを特定してもよい。特定部133は、特定されたコンテキストを示すコンテキスト情報を生成してもよい。
決定部134は、取得部132によって取得されたコンテキスト情報に基づいて、ユーザの発話に対する応答の出力態様を決定する。例えば、決定部134は、コンテキスト情報と、ユーザの発話に対して応答するための条件とに基づいて、出力態様を決定する。例えば、決定部134は、他のユーザがユーザの周囲環境に存在することを示すコンテキスト情報と、ユーザのプライバシに関する条件とに基づいて、出力態様を決定する。
生成部135は、ユーザの発話内容を示すテキストデータを生成する。例えば、生成部135は、受信部131によって音声信号が受信された場合に、音声信号を音声認識し、ユーザの発話内容を示すテキストデータを生成する。より具体的には、生成部135は、音声認識モデルを用いて、ユーザの発話内容を示すテキストデータを生成する。例えば、ユーザの音声信号の音響特徴量が音声認識モデルに入力された場合に、音声認識モデルは、ユーザの発話内容を示すテキストデータを音声認識結果として出力する。
学習部136は、ユーザの発話に対応する処理がユーザのコンテキストに適しているか否かを判定する判定モデルを学習する。ユーザのコンテキストは、例えば、ユーザが置かれた状況、ユーザが置かれた環境、ユーザの行動パターン、ユーザの興味や関心等である。例えば、学習部136は、ユーザのコンテキストを示すコンテキストデータと、ユーザの発話に対応する処理を示す処理データと、ユーザの発話に対応する処理がユーザのコンテキストに適しているか否かを示す評価値とを含む訓練データを用いて、判定モデルを学習する。
提供部137は、端末装置10を介して、機能やサービスをユーザに提供する。例えば、提供部137は、決定部134によって決定された応答処理を実行する。また、例えば、提供部137は、決定部134によって決定された応答の出力態様で、ユーザの発話に対する応答を出力する。
次に、実施形態に係る決定装置100による決定処理の手順について説明する。図6は、実施形態に係る決定装置100による決定処理手順を示すフローチャートである。
上述の実施形態に係る決定装置100は、上記の実施形態以外にも、種々の異なる形態で実施されてよい。そこで、以下では、上記の決定装置100の他の実施形態について説明する。
決定部134は、発話者がユーザであることを示すコンテキスト情報と、ユーザの発話に対して応答するための条件であって、かかるユーザの利用範囲に関する条件とに基づいて、出力態様を決定してもよい。
決定部134は、他のユーザがユーザの周囲環境に存在することを示すコンテキスト情報と、かかるユーザの発話に対して応答するための条件であって、かかる他のユーザに関連する情報に関する条件とに基づいて、出力態様を決定してもよい。
決定部134は、ユーザの発話に対応する音声信号を受信した端末装置10が、かかるユーザの発話に対して応答するための条件であって、かかるユーザの発話に対する応答として出力される音声信号の強度に関する条件に応じた出力態様で、ユーザの発話に対する応答を出力することを決定してもよい。
決定部134は、ユーザ以外の他のユーザが発話に対する応答として出力される情報を認識できないように、発話に対応する音声信号を受信した端末装置10以外の装置が、発話に対する応答を出力することを決定してもよい。
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の一部を手動的に行うこともできる。あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
また、上述してきた実施形態に係る決定装置100は、例えば図7に示すような構成のコンピュータ1000によって実現される。図7は、ハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
上述してきたように、実施形態に係る決定装置100は、取得部132と、決定部134とを有する。取得部132は、ユーザの発話に関するコンテキスト情報を取得する。決定部134は、取得部132によって取得されたコンテキスト情報に基づいて、ユーザの発話に対する応答の出力態様を決定する。このため、決定装置100は、ユーザの発話状況に相応しい情報を、ユーザに提供することができる。
10 端末装置
100 決定装置
120 記憶部
121 ユーザ情報記憶部
122 機能情報記憶部
123 対話モデル記憶部
130 制御部
131 受信部
132 取得部
133 特定部
134 決定部
135 生成部
136 学習部
137 提供部
Claims (9)
- ユーザの発話に関するコンテキスト情報であって、前記ユーザの発話の状況を示すコンテキスト情報を取得する取得部と、
前記取得部によって取得されたコンテキスト情報が、前記ユーザの発話に対して応答するための条件であって、人感センサによって、他のユーザの存在が検知されていないという条件を満たすかを判定し、前記コンテキスト情報が前記条件を満たす場合に、前記ユーザの発話に対応する応答処理の結果を通知する音声が、前記ユーザの発話に対応する音声信号を受信した端末装置を介して出力されるように、前記ユーザの発話に対する応答の出力態様を決定し、前記コンテキスト情報が前記条件を満たさない場合に、前記端末装置が前記ユーザの発話に対応する応答処理を実行しないことを通知する音声が、前記端末装置を介して出力されるように、前記ユーザの発話に対する応答の出力態様を決定する決定部と、
を備えることを特徴とする決定装置。 - 前記決定部は、
前記コンテキスト情報と、前記ユーザの発話に対して応答するための条件とに基づいて、前記出力態様を決定する
ことを特徴とする請求項1に記載の決定装置。 - 前記決定部は
他のユーザが前記ユーザの周囲環境に存在することを示す前記コンテキスト情報と、前記ユーザのプライバシに関する前記条件とに基づいて、前記出力態様を決定する
ことを特徴とする請求項2に記載の決定装置。 - 前記決定部は
発話者が前記ユーザであることを示す前記コンテキスト情報と、前記ユーザの利用範囲に関する前記条件とに基づいて、前記出力態様を決定する
ことを特徴とする請求項2又は3に記載の決定装置。 - 前記決定部は、
他のユーザが前記ユーザの周囲環境に存在することを示す前記コンテキスト情報と、当該他のユーザに関連する情報に関する前記条件とに基づいて、前記出力態様を決定する
ことを特徴とする請求項2~4のうちいずれか1つに記載の決定装置。 - 前記決定部は、
前記発話に対応する音声信号を受信した端末装置が、前記ユーザの発話に対する応答として出力される音声信号の強度に関する前記条件に応じた前記出力態様で、前記発話に対する応答を出力することを決定する
ことを特徴とする請求項2~5のうちいずれか1つに記載の決定装置。 - 前記決定部は、
前記ユーザ以外の他のユーザが前記発話に対する応答として出力される情報を認識できないように、前記発話に対応する音声信号を受信した端末装置以外の装置が、前記発話に対する応答を出力することを決定する
ことを特徴とする請求項2~6のうちいずれか1つに記載の決定装置。 - ユーザの発話に関するコンテキスト情報であって、前記ユーザの発話の状況を示すコンテキスト情報を取得する取得工程と、
前記取得工程によって取得されたコンテキスト情報が、前記ユーザの発話に対して応答するための条件であって、人感センサによって、他のユーザの存在が検知されていないという条件を満たすかを判定し、前記コンテキスト情報が前記条件を満たす場合に、前記ユーザの発話に対応する応答処理の結果を通知する音声が、前記ユーザの発話に対応する音声信号を受信した端末装置を介して出力されるように、前記ユーザの発話に対する応答の出力態様を決定し、前記コンテキスト情報が前記条件を満たさない場合に、前記端末装置が前記ユーザの発話に対応する応答処理を実行しないことを通知する音声が、前記端末装置を介して出力されるように、前記ユーザの発話に対する応答の出力態様を決定する決定工程と、
を含むことを特徴とする決定方法。 - ユーザの発話に関するコンテキスト情報であって、前記ユーザの発話の状況を示すコンテキスト情報を取得する取得手順と、
前記取得手順によって取得されたコンテキスト情報が、前記ユーザの発話に対して応答するための条件であって、人感センサによって、他のユーザの存在が検知されていないという条件を満たすかを判定し、前記コンテキスト情報が前記条件を満たす場合に、前記ユーザの発話に対応する応答処理の結果を通知する音声が、前記ユーザの発話に対応する音声信号を受信した端末装置を介して出力されるように、前記ユーザの発話に対する応答の出力態様を決定し、前記コンテキスト情報が前記条件を満たさない場合に、前記端末装置が前記ユーザの発話に対応する応答処理を実行しないことを通知する音声が、前記端末装置を介して出力されるように、前記ユーザの発話に対する応答の出力態様を決定する決定手順と、
をコンピュータに実行させることを特徴とする決定プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018154264A JP7093266B2 (ja) | 2018-08-20 | 2018-08-20 | 決定装置、決定方法及び決定プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018154264A JP7093266B2 (ja) | 2018-08-20 | 2018-08-20 | 決定装置、決定方法及び決定プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020030246A JP2020030246A (ja) | 2020-02-27 |
JP7093266B2 true JP7093266B2 (ja) | 2022-06-29 |
Family
ID=69624301
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018154264A Active JP7093266B2 (ja) | 2018-08-20 | 2018-08-20 | 決定装置、決定方法及び決定プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7093266B2 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016158792A1 (ja) | 2015-03-31 | 2016-10-06 | ソニー株式会社 | 情報処理装置、制御方法、およびプログラム |
WO2017175442A1 (ja) | 2016-04-08 | 2017-10-12 | ソニー株式会社 | 情報処理装置、および情報処理方法 |
-
2018
- 2018-08-20 JP JP2018154264A patent/JP7093266B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016158792A1 (ja) | 2015-03-31 | 2016-10-06 | ソニー株式会社 | 情報処理装置、制御方法、およびプログラム |
WO2017175442A1 (ja) | 2016-04-08 | 2017-10-12 | ソニー株式会社 | 情報処理装置、および情報処理方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2020030246A (ja) | 2020-02-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102597571B1 (ko) | 자동으로 액션 그룹을 커스터마이징하도록 구성된 가상 어시스턴트 | |
KR102623727B1 (ko) | 전자 장치 및 이의 제어 방법 | |
US11398223B2 (en) | Electronic device for modulating user voice using artificial intelligence model and control method thereof | |
US11308955B2 (en) | Method and apparatus for recognizing a voice | |
CN107863108B (zh) | 信息输出方法和装置 | |
CN109478106B (zh) | 利用环境上下文以用于增强的通信吞吐量 | |
KR20240006713A (ko) | 챗봇 변경을 위한 위한 전자 장치 및 이의 제어 방법 | |
KR102590914B1 (ko) | 전자 장치 및 이의 제어 방법 | |
US20200125967A1 (en) | Electronic device and method for controlling the electronic device | |
EP3794587A1 (en) | Selective enrollment with an automated assistant | |
CN114391143A (zh) | 用于提供对话服务的电子设备和方法 | |
US11393459B2 (en) | Method and apparatus for recognizing a voice | |
US11769492B2 (en) | Voice conversation analysis method and apparatus using artificial intelligence | |
US11928985B2 (en) | Content pre-personalization using biometric data | |
KR20180108400A (ko) | 전자 장치, 그의 제어 방법 및 비일시적 컴퓨터 판독가능 기록매체 | |
JP6370962B1 (ja) | 生成装置、生成方法および生成プログラム | |
US20220059088A1 (en) | Electronic device and control method therefor | |
US11657237B2 (en) | Electronic device and natural language generation method thereof | |
Ma et al. | Enthusiasts, pragmatists, and skeptics: investigating users’ attitudes towards emotion-and personality-aware voice assistants across cultures | |
WO2021095473A1 (ja) | 情報処理装置、情報処理方法及びコンピュータプログラム | |
KR20200080389A (ko) | 전자 장치 및 그 제어 방법 | |
JP7093266B2 (ja) | 決定装置、決定方法及び決定プログラム | |
JP7018850B2 (ja) | 端末装置、決定方法、決定プログラム及び決定装置 | |
WO2021200502A1 (ja) | 情報処理装置及び情報処理方法 | |
US11782986B2 (en) | Interactive query based network communication through a media device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191108 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200819 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210716 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210727 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210917 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20220111 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220411 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20220411 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20220419 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20220426 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220524 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220617 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7093266 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |