JP6514475B2 - 対話装置および対話方法 - Google Patents
対話装置および対話方法 Download PDFInfo
- Publication number
- JP6514475B2 JP6514475B2 JP2014204520A JP2014204520A JP6514475B2 JP 6514475 B2 JP6514475 B2 JP 6514475B2 JP 2014204520 A JP2014204520 A JP 2014204520A JP 2014204520 A JP2014204520 A JP 2014204520A JP 6514475 B2 JP6514475 B2 JP 6514475B2
- Authority
- JP
- Japan
- Prior art keywords
- user
- interactive
- state
- dialogue
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 36
- 230000002452 interceptive effect Effects 0.000 claims description 134
- 238000001514 detection method Methods 0.000 claims description 37
- 230000003993 interaction Effects 0.000 claims description 30
- 238000004891 communication Methods 0.000 claims description 20
- 230000000007 visual effect Effects 0.000 claims description 17
- 230000004044 response Effects 0.000 description 38
- 230000008569 process Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 7
- 230000007704 transition Effects 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000003384 imaging method Methods 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Landscapes
- User Interface Of Digital Computer (AREA)
- Studio Devices (AREA)
Description
http://developer.android.com/reference/android/media/FaceDetector.html
http://developer.android.com/reference/android/hardware/SensorManager.html
http://developer.android.com/reference/android/speech/RecognizerIntent.html
http://developer.android.com/reference/android/speech/tts/TextToSpeech.html
http://www.fuetrek.co.jp/product/vgate/asr.html
Claims (4)
- ユーザとの対話を行うための対話装置であって、
前記ユーザと前記対話装置との距離と、カメラ画像における前記ユーザの存在とを検出する検出手段と、
前記検出手段の検出結果に基づいて、ハンズフリー状態にある前記ユーザが前記対話装置への語りかけ意思を有しているか否かを判定するユーザ意思判定手段と、
前記判定手段の判定結果に基づいて、前記対話装置が対話状態および非対話状態のいずれかの状態に切り替わるように前記対話装置の状態を制御する対話状態制御手段と、
前記対話状態においては前記ユーザの音声に含まれる語彙を連続して認識する第1の認識モードを実行し、前記非対話状態においては前記ユーザの音声に含まれる所定の語彙のみを認識する第2の認識モードを実行する音声認識手段と、
を備え、
前記ユーザ意思判定手段は、前記非対話状態において、前記第2の認識モードを実行する音声認識手段によって前記ユーザの音声に含まれる所定の語彙が認識された場合に、前記ユーザが前記対話装置への語りかけ意思を有していると判定し、
前記対話装置は、
前記検出手段の検出結果に基づいて、前記ユーザが前記対話装置からの情報を視認できる状態にあるか否かを判定するユーザ状態判定手段と、
前記ユーザ状態判定手段の判定結果に基づいて、前記ユーザへの出力を制御する出力制御手段と、
をさらに備え、
前記出力制御手段が制御する前記ユーザへの出力は、音声出力情報と視覚情報とを組合せた情報を前記ユーザへ伝達することを含む、対話装置。 - 前記第1の認識モードでは、前記音声認識手段が、前記対話装置の外部との通信を行いサーバのデータ処理を利用することによって、前記ユーザの音声に含まれる語彙を連続して認識し、
前記第2の認識モードでは、前記音声認識手段が、前記対話装置の外部との通信を行わずに、前記ユーザの音声に含まれる所定の語彙のみを認識する、請求項1に記載の対話装置。 - 前記検出手段は、カメラ画像における前記ユーザの顔を検出することによって、前記ユーザの存在を検出する、請求項1または2に記載の対話装置。
- ユーザと対話装置との間で対話を行うための対話方法であって、
前記対話装置が、前記ユーザと前記対話装置との距離と、カメラ画像における前記ユーザの存在とを検出するステップと、
前記対話装置が、前記検出するステップの検出結果に基づいて、ハンズフリー状態にある前記ユーザが前記対話装置への語りかけ意思を有しているか否かを判定するステップと、
前記対話装置が、前記判定するステップの判定結果に基づいて、前記対話装置が対話状態および非対話状態のいずれかの状態に切り替わるように前記対話装置の状態を制御するステップと、
を含み、
前記対話状態においては前記ユーザの音声に含まれる語彙を連続して認識する第1の認識モードが実行され、前記非対話状態においては前記ユーザの音声に含まれる所定の語彙のみを認識する第2の認識モードが実行され、
前記語りかけ意思を有しているか否かを判定するステップでは、前記非対話状態において、前記第2の認識モードが実行されることによって前記ユーザの音声に含まれる所定の語彙が認識された場合に、前記ユーザが前記対話装置への語りかけ意思を有していると判定され、
前記対話方法は、
前記検出するステップの検出結果に基づいて、前記ユーザが前記対話装置からの情報を視認できる状態にあるか否かを判定するステップと、
前記視認できる状態にあるか否かを判定するステップの判定結果に基づいて、前記ユーザへの出力を制御するステップと、
をさらに備え、
前記制御するステップが制御する前記ユーザへの出力は、音声出力情報と視覚情報とを組合せた情報を前記ユーザへ伝達することを含む、対話方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014204520A JP6514475B2 (ja) | 2014-10-03 | 2014-10-03 | 対話装置および対話方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014204520A JP6514475B2 (ja) | 2014-10-03 | 2014-10-03 | 対話装置および対話方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016076007A JP2016076007A (ja) | 2016-05-12 |
JP6514475B2 true JP6514475B2 (ja) | 2019-05-15 |
Family
ID=55949917
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014204520A Active JP6514475B2 (ja) | 2014-10-03 | 2014-10-03 | 対話装置および対話方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6514475B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7056020B2 (ja) * | 2017-07-04 | 2022-04-19 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置およびプログラム |
JP7341171B2 (ja) * | 2018-08-21 | 2023-09-08 | グーグル エルエルシー | 自動化アシスタントを呼び出すための動的および/またはコンテキスト固有のホットワード |
WO2020040744A1 (en) | 2018-08-21 | 2020-02-27 | Google Llc | Dynamic and/or context-specific hot words to invoke automated assistant |
JP2020047061A (ja) | 2018-09-20 | 2020-03-26 | Dynabook株式会社 | 電子機器および制御方法 |
US11151993B2 (en) | 2018-12-28 | 2021-10-19 | Baidu Usa Llc | Activating voice commands of a smart display device based on a vision-based mechanism |
JP7120060B2 (ja) * | 2019-02-06 | 2022-08-17 | トヨタ自動車株式会社 | 音声対話装置、音声対話装置の制御装置及び制御プログラム |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000322078A (ja) * | 1999-05-14 | 2000-11-24 | Sumitomo Electric Ind Ltd | 車載型音声認識装置 |
JP4204541B2 (ja) * | 2004-12-24 | 2009-01-07 | 株式会社東芝 | 対話型ロボット、対話型ロボットの音声認識方法および対話型ロボットの音声認識プログラム |
JP4505862B2 (ja) * | 2006-06-26 | 2010-07-21 | 村田機械株式会社 | 音声対話装置と音声対話方法及びそのプログラム |
JP2008309864A (ja) * | 2007-06-12 | 2008-12-25 | Fujitsu Ten Ltd | 音声認識装置および音声認識方法 |
JP5075664B2 (ja) * | 2008-02-15 | 2012-11-21 | 株式会社東芝 | 音声対話装置及び支援方法 |
JP5309070B2 (ja) * | 2010-03-31 | 2013-10-09 | Kddi株式会社 | マルチモーダル対話装置 |
JP5695447B2 (ja) * | 2011-03-01 | 2015-04-08 | 株式会社東芝 | テレビジョン装置及び遠隔操作装置 |
-
2014
- 2014-10-03 JP JP2014204520A patent/JP6514475B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016076007A (ja) | 2016-05-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6514475B2 (ja) | 対話装置および対話方法 | |
EP3179474B1 (en) | User focus activated voice recognition | |
US10366699B1 (en) | Multi-path calculations for device energy levels | |
KR102098136B1 (ko) | 응답을 제공하기 위한 디바이스 선택 | |
KR102069237B1 (ko) | 핸즈프리 자동 통역 서비스를 위한 단말 장치 및 핸즈프리 장치와, 핸즈프리 자동 통역 서비스 방법 | |
US9992642B1 (en) | Automated messaging | |
US9891719B2 (en) | Impact and contactless gesture inputs for electronic devices | |
US20160019886A1 (en) | Method and apparatus for recognizing whisper | |
JP6289448B2 (ja) | 即時翻訳システム | |
WO2019013849A1 (en) | PROVIDING AMBIENT ASSISTANCE MODE FOR COMPUTER DEVICES | |
JP2017211608A (ja) | 音声対話装置および音声対話方法 | |
WO2005057549A1 (ja) | 情報処理システム、情報処理方法および情報処理用プログラム | |
KR102193029B1 (ko) | 디스플레이 장치 및 그의 화상 통화 수행 방법 | |
JP5628749B2 (ja) | 通訳端末及び通訳端末間の相互通信を用いた通訳方法 | |
KR102629796B1 (ko) | 음성 인식의 향상을 지원하는 전자 장치 | |
CN112739507B (zh) | 一种交互沟通实现方法、设备和存储介质 | |
WO2021244056A1 (zh) | 一种数据处理方法、装置和可读介质 | |
KR20200025226A (ko) | 전자 장치 및 그 제어 방법 | |
JP7330066B2 (ja) | 音声認識装置、音声認識方法及びそのプログラム | |
KR20200101221A (ko) | 사용자 입력 처리 방법 및 이를 지원하는 전자 장치 | |
JP6359935B2 (ja) | 対話装置および対話方法 | |
WO2016206646A1 (zh) | 使机器装置产生动作的方法及系统 | |
KR20140117771A (ko) | 움직임 센서 기반의 휴대용 자동 통역 장치 및 그의 제어방법 | |
KR20220111574A (ko) | 전자 장치 및 그 제어 방법 | |
JP2018075657A (ja) | 生成プログラム、生成装置、制御プログラム、制御方法、ロボット装置及び通話システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170818 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180314 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180403 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180523 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180814 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181011 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190326 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190412 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6514475 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |