JP6025037B2 - 音声エージェント装置、及びその制御方法 - Google Patents
音声エージェント装置、及びその制御方法 Download PDFInfo
- Publication number
- JP6025037B2 JP6025037B2 JP2012235902A JP2012235902A JP6025037B2 JP 6025037 B2 JP6025037 B2 JP 6025037B2 JP 2012235902 A JP2012235902 A JP 2012235902A JP 2012235902 A JP2012235902 A JP 2012235902A JP 6025037 B2 JP6025037 B2 JP 6025037B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- voice
- agent device
- area
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 31
- 241000282414 Homo sapiens Species 0.000 claims description 50
- 230000007613 environmental effect Effects 0.000 claims description 37
- 238000001514 detection method Methods 0.000 claims description 27
- 238000004891 communication Methods 0.000 description 15
- 230000008569 process Effects 0.000 description 15
- 230000005236 sound signal Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 241000282412 Homo Species 0.000 description 9
- 238000012545 processing Methods 0.000 description 9
- 238000005259 measurement Methods 0.000 description 6
- 239000000470 constituent Substances 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 230000007423 decrease Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 235000006481 Colocasia esculenta Nutrition 0.000 description 1
- 240000004270 Colocasia esculenta var. antiquorum Species 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/04—Training, enrolment or model building
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Manipulator (AREA)
- Telephonic Communication Services (AREA)
- User Interface Of Digital Computer (AREA)
Description
本発明者は、従来技術において、以下の問題が生じることを見出した。
音声エージェント装置が、特に2名以上が同一空間に存在する場合の、人間のおかれた環境を理解して対話内容を選択する方法、及び、その実現装置について説明する。
101A、101B、101C 人間
102、102A、102B、102C、102D マイク
103、103A、103B、103C、103D スピーカ
104、104A、104B ディスプレイ
110 対話エリア
111 対話空間
201 音声取得部
202 位置検出部
203 声量検出部
204 環境音測定部
205 個人識別部
206 対話エリア決定部
207 情報提供部
208 情報選択部
209 記憶部
210 出力選択部
220 プロフィール情報
220A 個人プロフィール情報
220B 人間関係情報
220C プライバシー設定情報
221 音声信号
222 位置
223 声量
224 環境音
Claims (11)
- 音声エージェント装置であって、
前記音声エージェント装置が情報提供可能な空間である対話空間内に存在する人間の位置を検出する位置検出部と、
収音部で得られた前記対話空間の音声信号から、前記人間の声量を検出する声量検出部と、
前記声量が大きいほど、前記人間の発話内容が聞こえうる空間範囲である対話エリアを広く決定する対話エリア決定部と、
前記対話エリアに提供情報を提供する情報提供部とを備える
音声エージェント装置。 - 前記音声エージェント装置は、さらに、
前記対話エリア内に存在する人間を識別する個人識別部を備え、
前記情報提供部は、
予め設定された、個人ごとの情報を示すプロフィール情報を記憶する記憶部と、
前記対話エリア内に複数の人間が存在する場合、前記個人識別部による識別結果と、前記プロフィール情報とに基づき、当該複数の人間に提供する前記提供情報を選択する情報選択部とを備える
請求項1記載の音声エージェント装置。 - 前記プロフィール情報は、予め設定された、個人ごとに、当該個人に提供可能な情報を示し、
前記情報選択部は、前記対話エリア内に複数の人間が存在する場合、前記プロフィール情報に基づき、当該複数の人間の全てに共通に提供可能な情報を判定し、当該提供可能な情報から前記提供情報を選択する
請求項2記載の音声エージェント装置。 - 前記個人識別部は、前記音声信号を用いて、予め登録された人間の声紋を認識することで、前記対話エリア内に存在する人間を識別する
請求項2又は3記載の音声エージェント装置。 - 前記音声エージェント装置は、さらに、
前記対話空間における環境音を測定する環境音測定部を備え、
前記対話エリア決定部は、前記環境音が大きいほど、前記対話エリアを狭く決定する
請求項1〜4のいずれか1項に記載の音声エージェント装置。 - 前記情報提供部は、
前記対話空間内に配置されている複数の出力装置のうち、前記対話エリアに最も近い位置に配置されている出力装置を選択し、選択した出力装置に前記提供情報を出力することで、前記対話エリアに前記提供情報を提供する出力選択部を備える
請求項1〜5のいずれか1項に記載の音声エージェント装置。 - 前記出力選択部は、前記対話エリアが広いほど、前記提供情報として出力する音声情報の音量を大きくする
請求項6記載の音声エージェント装置。 - 前記情報提供部は、
前記対話空間のうち一部の範囲のみに情報を提示可能な出力装置を介して、前記対話空間のうち前記対話エリアに前記提供情報を提供する出力選択部を備える
請求項1〜5のいずれか1項に記載の音声エージェント装置。 - 音声エージェント装置の制御方法であって、
前記音声エージェント装置が情報提供可能な空間である対話空間内に存在する人間の位置を検出する位置検出ステップと、
収音部で得られた前記対話空間の音声信号から、前記人間の声量を検出する声量検出ステップと、
前記声量が第1声量値である場合、前記人間の発話内容が聞こえうる空間範囲である対話エリアを、前記位置を含む第1範囲に決定し、前記声量が前記第1声量値より小さい第2声量値である場合、前記対話エリアを、前記位置を含み、かつ前記第1範囲より狭い第2範囲に決定する対話エリア決定ステップと、
前記対話エリアに提供情報を提供する情報提供ステップとを含む
音声エージェント装置の制御方法。 - 請求項9記載の音声エージェント装置の制御方法をコンピュータに実行させるためのプログラム。
- 音声エージェント装置に用いられる集積回路であって、
前記音声エージェント装置が情報提供可能な空間である対話空間内に存在する人間の位置を検出する位置検出部と、
収音部で得られた前記対話空間の音声信号から、前記人間の声量を検出する声量検出部と、
前記声量が第1声量値である場合、前記人間の発話内容が聞こえうる空間範囲である対話エリアを、前記位置を含む第1範囲に決定し、前記声量が前記第1声量値より小さい第2声量値である場合、前記対話エリアを、前記位置を含み、かつ前記第1範囲より狭い第2範囲に決定する対話エリア決定部と、
前記対話エリアに提供情報を提供する情報提供部とを備える
集積回路。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012235902A JP6025037B2 (ja) | 2012-10-25 | 2012-10-25 | 音声エージェント装置、及びその制御方法 |
US14/062,937 US9324326B2 (en) | 2012-10-25 | 2013-10-25 | Voice agent device and method for controlling the same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012235902A JP6025037B2 (ja) | 2012-10-25 | 2012-10-25 | 音声エージェント装置、及びその制御方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014083658A JP2014083658A (ja) | 2014-05-12 |
JP6025037B2 true JP6025037B2 (ja) | 2016-11-16 |
Family
ID=50548156
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012235902A Expired - Fee Related JP6025037B2 (ja) | 2012-10-25 | 2012-10-25 | 音声エージェント装置、及びその制御方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9324326B2 (ja) |
JP (1) | JP6025037B2 (ja) |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105096977B (zh) * | 2015-08-24 | 2017-06-13 | 北京泽桥传媒科技股份有限公司 | 一种多媒体播放的控制方法及移动终端 |
CN106486132A (zh) * | 2015-08-26 | 2017-03-08 | 天津三星电子有限公司 | 一种调节显示终端音量的方法及其显示终端 |
US9571628B1 (en) * | 2015-11-13 | 2017-02-14 | International Business Machines Corporation | Context and environment aware volume control in telephonic conversation |
US11774920B2 (en) | 2016-05-04 | 2023-10-03 | Johnson Controls Technology Company | Building system with user presentation composition based on building context |
US11226598B2 (en) * | 2016-05-04 | 2022-01-18 | Johnson Controls Technology Company | Building system with user presentation composition based on building context |
US10901373B2 (en) | 2017-06-15 | 2021-01-26 | Johnson Controls Technology Company | Building management system with artificial intelligence for unified agent based control of building subsystems |
US11226597B2 (en) | 2016-07-11 | 2022-01-18 | Johnson Controls Technology Company | Systems and methods for interaction with a building management system |
EP3452964A1 (en) | 2016-05-04 | 2019-03-13 | Johnson Controls Technology Company | Systems and methods for agent interaction with building management system |
EP3748558A1 (en) | 2016-06-13 | 2020-12-09 | Google LLC | Automated telephone call initiating system and method |
JP6681800B2 (ja) * | 2016-07-15 | 2020-04-15 | 株式会社日立製作所 | 制御装置、制御システム、および制御方法 |
US11195542B2 (en) | 2019-10-31 | 2021-12-07 | Ron Zass | Detecting repetitions in audio data |
US20180018974A1 (en) * | 2016-07-16 | 2018-01-18 | Ron Zass | System and method for detecting tantrums |
US10185840B2 (en) * | 2016-08-30 | 2019-01-22 | Google Llc | Conditional disclosure of individual-controlled content in group contexts |
JP2018055155A (ja) * | 2016-09-26 | 2018-04-05 | トヨタ自動車株式会社 | 音声対話装置および音声対話方法 |
JP2018087838A (ja) * | 2016-11-28 | 2018-06-07 | 三菱電機株式会社 | 音声認識装置 |
JP6250852B1 (ja) * | 2017-03-16 | 2017-12-20 | ヤフー株式会社 | 判定プログラム、判定装置及び判定方法 |
US11081128B2 (en) * | 2017-04-26 | 2021-08-03 | Sony Corporation | Signal processing apparatus and method, and program |
US10176808B1 (en) * | 2017-06-20 | 2019-01-08 | Microsoft Technology Licensing, Llc | Utilizing spoken cues to influence response rendering for virtual assistants |
EP3655826A1 (en) | 2017-07-17 | 2020-05-27 | Johnson Controls Technology Company | Systems and methods for agent based building simulation for optimal control |
JP6942557B2 (ja) * | 2017-08-17 | 2021-09-29 | 京セラ株式会社 | 対話型電子機器、コミュニケーションシステム、方法、およびプログラム |
US20200410980A1 (en) * | 2017-08-17 | 2020-12-31 | Kyocera Corporation | Interactive electronic apparatus, communication system, method, and program |
JP6971088B2 (ja) * | 2017-08-25 | 2021-11-24 | 京セラ株式会社 | 対話型電子機器、コミュニケーションシステム、方法、およびプログラム |
CN107657954A (zh) * | 2017-10-27 | 2018-02-02 | 成都常明信息技术有限公司 | 一种智能音量语音机器人 |
JP6560321B2 (ja) * | 2017-11-15 | 2019-08-14 | ヤフー株式会社 | 判定プログラム、判定装置及び判定方法 |
JP6994922B2 (ja) * | 2017-12-07 | 2022-02-04 | 清水建設株式会社 | 会話認識記録システム |
CN111344692A (zh) * | 2018-01-16 | 2020-06-26 | 索尼公司 | 信息处理装置、信息处理方法和程序 |
KR101972545B1 (ko) * | 2018-02-12 | 2019-04-26 | 주식회사 럭스로보 | 음성 명령을 통한 위치 기반 음성 인식 시스템 |
JP7107732B2 (ja) * | 2018-04-24 | 2022-07-27 | 清水建設株式会社 | 人物関係抽出システム |
JP7169921B2 (ja) * | 2019-03-27 | 2022-11-11 | 本田技研工業株式会社 | エージェント装置、エージェントシステム、エージェント装置の制御方法、およびプログラム |
CN113424513A (zh) | 2019-05-06 | 2021-09-21 | 谷歌有限责任公司 | 自动呼叫系统 |
JPWO2021039456A1 (ja) * | 2019-08-27 | 2021-03-04 | ||
US11303749B1 (en) | 2020-10-06 | 2022-04-12 | Google Llc | Automatic navigation of an interactive voice response (IVR) tree on behalf of human user(s) |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2539672B2 (ja) * | 1988-08-26 | 1996-10-02 | 日本電信電話株式会社 | 音声再生方式 |
US6662137B2 (en) * | 2000-12-19 | 2003-12-09 | Hewlett-Packard Development Company, L.P. | Device location discovery by sound |
US6952672B2 (en) * | 2001-04-25 | 2005-10-04 | International Business Machines Corporation | Audio source position detection and audio adjustment |
JP2005202076A (ja) * | 2004-01-14 | 2005-07-28 | Sony Corp | 発話制御装置及び方並びにロボット装置 |
EP1720374B1 (en) * | 2004-02-10 | 2011-10-12 | Honda Motor Co., Ltd. | Mobile body with superdirectivity speaker |
AU2005282632A1 (en) * | 2004-09-03 | 2006-03-16 | Panaseca, Inc. | Vision center kiosk |
JP4599522B2 (ja) * | 2006-02-21 | 2010-12-15 | 株式会社国際電気通信基礎技術研究所 | コミュニケーションロボット |
US8229130B2 (en) * | 2006-10-17 | 2012-07-24 | Massachusetts Institute Of Technology | Distributed acoustic conversation shielding system |
JP5075664B2 (ja) * | 2008-02-15 | 2012-11-21 | 株式会社東芝 | 音声対話装置及び支援方法 |
US20110188666A1 (en) * | 2008-07-18 | 2011-08-04 | Koninklijke Philips Electronics N.V. | Method and system for preventing overhearing of private conversations in public places |
-
2012
- 2012-10-25 JP JP2012235902A patent/JP6025037B2/ja not_active Expired - Fee Related
-
2013
- 2013-10-25 US US14/062,937 patent/US9324326B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US9324326B2 (en) | 2016-04-26 |
JP2014083658A (ja) | 2014-05-12 |
US20140122077A1 (en) | 2014-05-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6025037B2 (ja) | 音声エージェント装置、及びその制御方法 | |
US10453443B2 (en) | Providing an indication of the suitability of speech recognition | |
EP3520102B1 (en) | Context aware hearing optimization engine | |
CN105074815B (zh) | 针对语音识别系统的视觉反馈 | |
US10353495B2 (en) | Personalized operation of a mobile device using sensor signatures | |
US10127906B1 (en) | Naming devices via voice commands | |
CN104111814B (zh) | 防止音频信息的非预期分发的方法和系统 | |
US20140172953A1 (en) | Response Endpoint Selection | |
JP4539600B2 (ja) | 案内ロボット | |
KR20150052903A (ko) | 생활 패턴을 이용하는 청각 기기 및 외부 기기 | |
US11138987B2 (en) | System and method to distinguish sources in a multiple audio source environment | |
US9772815B1 (en) | Personalized operation of a mobile device using acoustic and non-acoustic information | |
CN106067996A (zh) | 语音再现方法、语音对话装置 | |
CN108476072A (zh) | 用于声音识别的众包数据库 | |
JP6767322B2 (ja) | 出力制御装置、出力制御方法及び出力制御プログラム | |
EP3412036B1 (fr) | Procédé d'aide au suivi d'une conversation pour personne malentendante | |
CN109756825A (zh) | 智能个人助理的位置分类 | |
JP2010079103A (ja) | 音声対話装置及びそのプログラム並びに音声対話処理方法 | |
US11551707B2 (en) | Speech processing method, information device, and computer program product | |
WO2019138652A1 (ja) | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム | |
JP6678315B2 (ja) | 音声再生方法、音声対話装置及び音声対話プログラム | |
WO2013190791A1 (ja) | 補聴器フィッティング装置、補聴器、及び補聴器フィッティング方法 | |
WO2019187521A1 (ja) | 音声情報送信装置、音声情報送信方法、音声情報送信プログラム、音声情報解析システム及び音声情報解析サーバ | |
US20220084505A1 (en) | Communication between devices in close proximity to improve voice control of the devices | |
US9532155B1 (en) | Real time monitoring of acoustic environments using ultrasound |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20141003 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150630 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160809 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160831 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160920 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160929 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6025037 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |