JP2018055155A - 音声対話装置および音声対話方法 - Google Patents
音声対話装置および音声対話方法 Download PDFInfo
- Publication number
- JP2018055155A JP2018055155A JP2016186791A JP2016186791A JP2018055155A JP 2018055155 A JP2018055155 A JP 2018055155A JP 2016186791 A JP2016186791 A JP 2016186791A JP 2016186791 A JP2016186791 A JP 2016186791A JP 2018055155 A JP2018055155 A JP 2018055155A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- user
- dialogue
- sentence
- users
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
このように、従来技術においては、発話を行う際の状況を考慮せずに対話文を生成しているため、望ましくない発話がなされてしまうといった課題があった。
音声によってユーザと対話する音声対話装置であって、音声を取得する音声取得手段と、自装置の周辺に存在するユーザの数をカウントする計数手段と、対話文を生成する対話文生成手段と、を有し、前記対話文生成手段は、前記計数手段がカウントしたユーザの数に基づいて、前記対話文の内容を決定することを特徴とする。
これにより、例えば、自装置の周辺にユーザが一人しかいない場合、制限なく対話を行うが、二人以上いる場合はセンシティブな情報の扱いを控えるといった判断が可能になり、ユーザのプライバシーを守ることができる。
なお、本明細書におけるユーザは、装置と対話する可能性のある人物であればよく、必
ずしも装置と対話する必要はない。
なお、撮像する範囲は、装置の正面領域などであってもよいが、音声は全方位に到達するため、より広範囲であることが好ましい。
ーザであるか否かを判定することを特徴としてもよい。
<システム構成>
図1は、第一の実施形態に係る音声対話システムのシステム構成図である。本実施形態に係る音声対話システムは、ロボット10と、制御装置20と、サーバ装置30から構成される。
制御装置20は、ロボット10に対して命令を発行する装置である。また、サーバ装置30は、制御装置20から送信された要求に応じて、ユーザに提供する応答(応答文)を生成する装置である。
本実施形態では、ロボット10はユーザインタフェースとしてのみ機能し、発話内容の認識、応答文の生成、その他の処理など、システム全体を制御する処理は制御装置20およびサーバ装置30が行う。
提供する応答文は、例えば、事前に記憶された対話シナリオ(対話辞書)に基づくものであってもよいし、データベースやウェブを検索して得られた情報に基づくものであってもよい。生成された応答文は、応答生成部23が有する音声合成機能によって音声データに変換され、ロボット10が有する音声出力部13を介してユーザに提供される。これにより、ユーザは、自然言語による会話を行うことができる。
なお、本実施形態では、応答生成部23は、ユーザ判定部22が判定した人数に応じて異なる内容の応答文を生成する。具体的な方法については後述する。
通信部31が有する機能は、前述した通信部24と同様であるため、詳細な説明は省略する。
次に、図1に示した各手段が行う処理とデータの流れについて、処理内容およびデータの流れを説明するフロー図である図3を参照しながら説明する。
文を生成し、判定された人の数が二人以上であった場合、一対多で行う対話を前提として応答文を生成する。例えば、複数のユーザに対する問い掛けなどを交えた応答文を生成してもよいし、複数のユーザ同士で会話が進むような応答文を生成してもよい。
この他にも、判定された人の数が一人であり、かつ、当該人物がロボット10の持ち主であると推定できる場合は、パーソナライズされた応答文(例えば、当該持ち主を対話相手と想定した応答文)を生成してもよい。
第二の実施形態は、ロボット10がユーザの個人情報を記憶しており、当該個人情報を用いて対話を行う実施形態である。
(ケースA)ユーザが一人である場合
この場合、一対一の対話を前提として応答文を生成する。なお、当該ユーザが登録済み
ユーザである場合、プロファイル情報に含まれる個人情報を用いて応答文を生成する。
(ケースB)ユーザが二人以上であり、全員が登録済みユーザである場合
この場合、一対多の対話を前提として応答文を生成する。また、全員が登録済みであることから、セキュリティ上の問題は発生しないと判断し、プロファイル情報に含まれる個人情報を用いて応答文を生成する。
(ケースC)ユーザが二人以上であり、未登録ユーザが含まれている場合
この場合、一対多の対話を前提として応答文を生成するが、未登録ユーザが存在するため、登録されたユーザに関する個人情報は用いずに応答文を生成する。あるいは、登録されたユーザに関する個人情報のうち、センシティブな情報を除いて応答文を生成する。例えば、個人情報を、オープンな情報とクローズな情報に予め分類したうえで、オープンな情報のみを用いて応答文を生成するようにしてもよい。
第二の実施形態では、ユーザが行った発話を取得してから画像取得部14が画像を取得した。これに対し、第三の実施形態は、画像取得部14が予め周期的に画像を取得し、蓄積したうえで、過去に取得した画像を遡って判定を行う実施形態である。
第二ないし第三の実施形態では、顔画像のみに基づいてユーザの識別を行った。これに対し、第四の実施形態は、取得した音声にさらに基づいてユーザの識別を行う実施形態である。
第一ないし第四の実施形態では、固定されたカメラを用いて画像を取得した。これに対し、第五の実施形態は、音声の到来方向を判定してカメラの向きを移動させる実施形態で
ある。
そして、ユーザ判定部22が、取得した音声の到来方向を推定し、当該推定した方向にカメラ(ロボットの首)を向けたうえで撮像を行う命令をロボット10に送信する。その後の処理は、図3に示したものと同様である。
なお、複数のマイクを用いることで音声の到来方向を推定する技術は公知であるため、具体的な方法についての説明は省略する。
上記の実施形態はあくまでも一例であって、本発明はその要旨を逸脱しない範囲内で適宜変更して実施しうる。
11・・・音声入力部
12,21・・・近距離通信部
13・・・音声出力部
14・・・画像取得部
20・・・制御装置
22・・・ユーザ判定部
23・・・応答生成部
24,31・・・通信部
30・・・サーバ装置
32・・・音声認識部
Claims (8)
- 音声によってユーザと対話する音声対話装置であって、
音声を取得する音声取得手段と、
自装置の周辺に存在するユーザの数をカウントする計数手段と、
対話文を生成する対話文生成手段と、を有し、
前記対話文生成手段は、前記計数手段がカウントしたユーザの数に基づいて、前記対話文の内容を決定する、
音声対話装置。 - 前記対話文生成手段は、前記計数手段がカウントしたユーザの数が一人である場合と二人以上である場合とで、異なる内容の対話文を生成する、
請求項1に記載の音声対話装置。 - 前記カウントされたユーザが、登録されているユーザであるか否かを判定する判定手段をさらに有し、
前記対話文生成手段は、登録されていないユーザが自装置の周辺に存在するか否かによって、異なる内容の対話文を生成する、
請求項1または2に記載の音声対話装置。 - 前記対話文生成手段は、自装置の周辺に二人以上が存在し、かつ、登録されていないユーザが含まれる場合に、登録されているユーザに関するプライベートな情報を含ませずに前記対話文を生成する、
請求項3に記載の音声対話装置。 - 登録されたユーザに対応する音声モデルを記憶する第一の記憶手段をさらに有し、
前記判定手段は、取得した音声と前記音声モデルを対比した結果に基づいて、前記カウントされたユーザが登録されているユーザであるか否かを判定する、
請求項3または4に記載の音声対話装置。 - 自装置周辺の画像を取得する画像取得手段をさらに有し、
前記計数手段は、前記取得した画像に基づいて、自装置の周辺に存在するユーザの数をカウントする、
請求項3から5のいずれかに記載の音声対話装置。 - 登録されたユーザに対応するテンプレートを記憶する第二の記憶手段をさらに有し、
前記判定手段は、取得した画像に含まれる顔と前記テンプレートとを比較した結果に基づいて、前記カウントされたユーザが登録されているユーザであるか否かを判定する、
請求項6に記載の音声対話装置。 - 音声によってユーザと対話する音声対話装置が行う音声対話方法であって、
音声を取得する音声取得ステップと、
自装置の周辺に存在するユーザの数をカウントする計数ステップと、
対話文を生成する対話文生成ステップと、を含み、
前記対話文生成ステップでは、前記計数手段がカウントしたユーザの数に基づいて、前記対話文の内容を決定する、
音声対話方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016186791A JP2018055155A (ja) | 2016-09-26 | 2016-09-26 | 音声対話装置および音声対話方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016186791A JP2018055155A (ja) | 2016-09-26 | 2016-09-26 | 音声対話装置および音声対話方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018055155A true JP2018055155A (ja) | 2018-04-05 |
JP2018055155A5 JP2018055155A5 (ja) | 2019-02-14 |
Family
ID=61836688
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016186791A Pending JP2018055155A (ja) | 2016-09-26 | 2016-09-26 | 音声対話装置および音声対話方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2018055155A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109161732A (zh) * | 2018-09-17 | 2019-01-08 | 广州宇智科技有限公司 | 一种无凝固收缩的液态调幅分解型Al-Si-In合金 |
JP2021522636A (ja) * | 2018-05-04 | 2021-08-30 | グーグル エルエルシーGoogle LLC | ユーザと自動化されたアシスタントインターフェースとの間の距離に応じて自動化されたアシスタントのコンテンツを生成するおよび/または適応させること |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004310034A (ja) * | 2003-03-24 | 2004-11-04 | Matsushita Electric Works Ltd | 対話エージェントシステム |
JP2014083658A (ja) * | 2012-10-25 | 2014-05-12 | Panasonic Corp | 音声エージェント装置、及びその制御方法 |
-
2016
- 2016-09-26 JP JP2016186791A patent/JP2018055155A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004310034A (ja) * | 2003-03-24 | 2004-11-04 | Matsushita Electric Works Ltd | 対話エージェントシステム |
JP2014083658A (ja) * | 2012-10-25 | 2014-05-12 | Panasonic Corp | 音声エージェント装置、及びその制御方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021522636A (ja) * | 2018-05-04 | 2021-08-30 | グーグル エルエルシーGoogle LLC | ユーザと自動化されたアシスタントインターフェースとの間の距離に応じて自動化されたアシスタントのコンテンツを生成するおよび/または適応させること |
JP7081045B2 (ja) | 2018-05-04 | 2022-06-06 | グーグル エルエルシー | ユーザと自動化されたアシスタントインターフェースとの間の距離に応じて自動化されたアシスタントのコンテンツを生成するおよび/または適応させること |
US11789522B2 (en) | 2018-05-04 | 2023-10-17 | Google Llc | Generating and/or adapting automated assistant content according to a distance between user(s) and an automated assistant interface |
CN109161732A (zh) * | 2018-09-17 | 2019-01-08 | 广州宇智科技有限公司 | 一种无凝固收缩的液态调幅分解型Al-Si-In合金 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110741433B (zh) | 使用多个计算设备的对讲式通信 | |
US11289100B2 (en) | Selective enrollment with an automated assistant | |
JP6520878B2 (ja) | 音声取得システムおよび音声取得方法 | |
US9293133B2 (en) | Improving voice communication over a network | |
JP6819672B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
US9412361B1 (en) | Configuring system operation using image data | |
US20190355352A1 (en) | Voice and conversation recognition system | |
TW201923737A (zh) | 交互方法和設備 | |
KR20190022109A (ko) | 음성 인식 서비스를 활성화하는 방법 및 이를 구현한 전자 장치 | |
US11704940B2 (en) | Enrollment with an automated assistant | |
JP6497372B2 (ja) | 音声対話装置および音声対話方法 | |
JP2019109503A5 (ja) | ||
US20210195500A1 (en) | Electronic device for setting up network of external device and method for operating same | |
US20220180859A1 (en) | User speech profile management | |
JP5849761B2 (ja) | 音声認識システム、音声認識方法および音声認識プログラム | |
KR20200092166A (ko) | 감정을 인식하는 서버, 방법 및 컴퓨터 프로그램 | |
JP2009178783A (ja) | コミュニケーションロボット及びその制御方法 | |
KR102037789B1 (ko) | 로봇을 이용한 수화통역시스템 | |
JP7140523B2 (ja) | 介護行為推定システム | |
JP2018055155A (ja) | 音声対話装置および音声対話方法 | |
JPWO2017175442A1 (ja) | 情報処理装置、および情報処理方法 | |
KR101933822B1 (ko) | 얼굴인식 기반 지능형 스피커, 이를 이용한 능동적인 대화 제공 방법 및 이를 수행하기 위한 기록매체 | |
WO2019202804A1 (ja) | 音声処理装置および音声処理方法 | |
WO2019150708A1 (ja) | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム | |
CN108174030B (zh) | 定制化语音控制的实现方法、移动终端及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190107 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190107 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190827 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190830 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20200303 |