JP2021509730A - 制御デバイスにおいて音声入力を指示する装置、システム及び方法 - Google Patents
制御デバイスにおいて音声入力を指示する装置、システム及び方法 Download PDFInfo
- Publication number
- JP2021509730A JP2021509730A JP2020537000A JP2020537000A JP2021509730A JP 2021509730 A JP2021509730 A JP 2021509730A JP 2020537000 A JP2020537000 A JP 2020537000A JP 2020537000 A JP2020537000 A JP 2020537000A JP 2021509730 A JP2021509730 A JP 2021509730A
- Authority
- JP
- Japan
- Prior art keywords
- smart home
- home appliance
- state
- commands
- level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 230000007704 transition Effects 0.000 claims abstract 6
- 230000004044 response Effects 0.000 claims description 8
- 238000004891 communication Methods 0.000 description 44
- 230000006870 function Effects 0.000 description 18
- 238000012545 processing Methods 0.000 description 17
- 230000008569 process Effects 0.000 description 13
- 230000009471 action Effects 0.000 description 11
- 230000000875 corresponding effect Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 10
- 230000008859 change Effects 0.000 description 6
- 241000238558 Eucarida Species 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000013515 script Methods 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000001276 controlling effect Effects 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 238000003058 natural language processing Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 101000826116 Homo sapiens Single-stranded DNA-binding protein 3 Proteins 0.000 description 1
- 206010039740 Screaming Diseases 0.000 description 1
- 102100023008 Single-stranded DNA-binding protein 3 Human genes 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 230000004622 sleep time Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Selective Calling Equipment (AREA)
- Telephonic Communication Services (AREA)
Abstract
Description
本願は、2017年7月12日付で出願された米国特許出願第15/647947号の利益を請求するとともにその一部継続出願である。なお、先の特許出願の開示は、その全文を参照により本願に援用される。
Claims (21)
- 発話入力を受けるよう構成されたデバイスを含む環境内にある制御可能な機器を制御する方法であって、
前記デバイスが動作している環境のノイズ閾値を規定することと、
前記デバイスで発話入力を受けることと、
前記発話入力が前記デバイスによって受け取られた時点での前記環境のノイズレベルを決定することと、
前記決定されたノイズレベルを前記規定されたノイズ閾値と比較することと、
前記比較により前記環境の前記決定されたレベルが前記環境の前記規定されたノイズ閾値よりも大きいことが示される場合に、前記制御可能な機器に、第1ボリュームレベルを有する第1状態から、前記第1ボリュームレベルよりも小さい第2ボリュームレベルを有する第2状態へ遷移させるよう、1つ以上のコマンドが前記制御可能な機器へ自動的に発せられるようにすることと
を有する方法。 - 前記デバイスは、リモートコントロール機能をサポートするよう構成され、
前記1つ以上のコマンドは、前記デバイスによって直接に前記制御可能な機器へ送られる、
請求項1に記載の方法。 - 前記1つ以上のコマンドは、ボリュームミュートコマンドを有する、
請求項2に記載の方法。 - 前記1つ以上のコマンドは、1つ以上のボリュームダウンコマンドを有する、
請求項2に記載の方法。 - 前記1つ以上のコマンドは、電源オフコマンドを有する、
請求項2に記載の方法。 - 前記発話入力が受け取られた後の所定期間内に前記デバイスによって更なる発話入力が受け取られていないと決定し、それに応じて、前記制御可能な機器に前記第2状態から前記第1状態へ戻させるよう、1つ以上のコマンドが前記制御可能な機器へ自動的に発せられるようにすることを有する、
請求項1に記載の方法。 - 前記デバイスは、リモートコントロール機能をサポートするよう構成され、
前記制御可能な機器を前記第1状態から前記第2状態へ遷移させるための及び前記制御可能な機器を前記第2状態から前記第1状態へ戻すための前記1つ以上のコマンドは全て、前記デバイスによって直接に前記制御可能な機器へ送られる、
請求項6に記載の方法。 - 前記発話入力が受け取られた後の所定期間内に更なる発話入力が前記デバイスによって受け取られると予想されないと決定し、それに応じて、前記制御可能な機器に前記第2状態から前記第1状態へ戻させるよう、1つ以上のコマンドが前記制御可能な機器へ自動的に発せられるようにすることを有する、
請求項1に記載の方法。 - 前記デバイスは、リモートコントロール機能をサポートするよう構成され、
前記制御可能な機器を前記第1状態から前記第2状態へ遷移させるための及び前記制御可能な機器を前記第2状態から前記第1状態へ戻すための前記1つ以上のコマンドは全て、前記デバイスによって直接に前記制御可能な機器へ送られる、
請求項8に記載の方法。 - 1つ以上のコマンドが、前記制御可能な機器に、第1ボリュームレベルを有する第1状態から、前記第1ボリュームレベルよりも小さい第2ボリュームレベルを有する第2状態へ遷移させるよう、前記制御可能な機器へ自動的に発せられるべきかどうかを判定するために、前記制御可能な機器の既知の動作状態を使用することを更に有する、
請求項1に記載の方法。 - 1つ以上のコマンドが、前記制御可能な機器に、第1ボリュームレベルを有する第1状態から、前記第1ボリュームレベルよりも小さい第2ボリュームレベルを有する第2状態へ遷移させるよう、前記制御可能な機器へ自動的に発せられるべきかどうかを判定するために、前記制御可能な機器の導出された動作状態を使用することを更に有する、
請求項1に記載の方法。 - 前記デバイスの発話入力閾値を規定することと、
前記受け取られた発話入力の発話レベルを決定することと、
前記決定された発話レベルを前記発話入力閾値と比較することと、
前記比較により前記決定された発話レベルが前記規定された発話入力閾値よりも大きいことが示される場合に、前記発話入力に応答して生成された1つ以上の出力が、通常使用される出力レベルよりも大きい第1ボリュームレベルで供給されるようにすることと
を更に有する、
請求項1に記載の方法。 - 前記デバイスは、前記発話入力に応答して生成された前記1つ以上の出力を出力するスピーカを有する、
請求項12に記載の方法。 - 前記デバイスの発話入力閾値を規定することと、
前記受け取られた発話入力の発話レベルを決定することと、
前記決定された発話レベルを前記発話入力閾値と比較することと、
前記比較により前記決定された発話レベルが前記規定された発話入力閾値よりも大きいことが示される場合に、前記発話入力に応答して生成された1つ以上の出力が、通常使用される出力レベルよりも小さい大きい第1ボリュームレベルで供給されるようにすることと
を更に有する、
請求項1に記載の方法。 - 前記デバイスは、前記発話入力に応答して生成された前記1つ以上の出力を出力するスピーカを有する、
請求項14に記載の方法。 - 時間を前記規定されたノイズ閾値と関連付けることと、
前記受け取られた発話入力が前記時間中に受け取られる場合にのみ、前記決定されたノイズレベルを前記規定されたノイズ閾値と比較することと
を有する、
請求項1に記載の方法。 - 前記デバイスは、リモートコントロールアプリケーションを有し、該リモートコントロールアプリケーションは、前記制御可能な機器の機能動作を操るのに適したコマンドコードセットをプロビジョニングされ、
前記デバイスは、前記制御可能な機器に、第1ボリュームレベルを有する第1状態から、前記第1ボリュームレベルよりも小さい第2ボリュームレベルを有する第2状態へ遷移させるよう、1つ以上のコマンドが前記デバイスに関連した送信器の使用により前記制御可能な機器へ自動的に発せられるようにするために、前記プロビジョニングされたコマンドコードセットを使用する、
請求項1に記載の方法。 - 前記デバイスは、ボイスコントロールアプリケーションを有し、該ボイスコントロールアプリケーションは、発話入力を受け取るよう構成された少なくとも1つの更なるデバイスへボイスコマンドを送る際に使用される少なくとも1つのプロトコルをプロビジョニングされ、
前記デバイスは、前記制御可能な機器に、第1ボリュームレベルを有する第1状態から、前記第1ボリュームレベルよりも小さい第2ボリュームレベルを有する第2状態へ遷移させるよう、1つ以上のコマンドが前記デバイスに関連した送信器の使用により前記少なくとも1つの更なるデバイスへ自動的に発せられるようにするために、前記プロビジョニングされたプロトコルを使用する、
請求項1に記載の方法。 - 前記制御可能な機器は、前記更なるデバイスを有する、
請求項18に記載の方法。 - 前記発話入力の発生源までの測定された距離は、前記受け取られた発話入力の発話レベルを決定するときに利用される、
請求項12に記載の方法。 - 前記発話入力の発生源までの測定された距離は、前記受け取られた発話入力の発話レベルを決定するときに利用される、
請求項14に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/861,298 US10930276B2 (en) | 2017-07-12 | 2018-01-03 | Apparatus, system and method for directing voice input in a controlling device |
US15/861,298 | 2018-01-03 | ||
PCT/US2019/012050 WO2019136065A1 (en) | 2018-01-03 | 2019-01-02 | Apparatus, system and method for directing voice input in a controlling device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021509730A true JP2021509730A (ja) | 2021-04-01 |
JP7374099B2 JP7374099B2 (ja) | 2023-11-06 |
Family
ID=67143953
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020537000A Active JP7374099B2 (ja) | 2018-01-03 | 2019-01-02 | 制御デバイスにおいて音声入力を指示する装置、システム及び方法 |
Country Status (5)
Country | Link |
---|---|
EP (1) | EP3735687A4 (ja) |
JP (1) | JP7374099B2 (ja) |
KR (1) | KR20200104898A (ja) |
CN (1) | CN111801729B (ja) |
WO (1) | WO2019136065A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021045278A1 (ko) * | 2019-09-06 | 2021-03-11 | 엘지전자 주식회사 | 디스플레이 장치 |
EP4216214A4 (en) * | 2020-09-21 | 2024-05-01 | LG Electronics Inc. | CONTROL DEVICE AND SYSTEM INCLUDING IT |
CN113516981A (zh) * | 2021-03-31 | 2021-10-19 | 深圳鱼亮科技有限公司 | 一种基于无线分布式麦克风阵列的语音唤醒决策系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003219393A (ja) * | 2002-01-28 | 2003-07-31 | Sony Corp | 情報処理システム、情報処理装置、情報処理方法および情報処理プログラム、入力装置、入力方法および入力プログラム、ならびに、記録媒体 |
JP2012095047A (ja) * | 2010-10-26 | 2012-05-17 | Panasonic Corp | 音声処理装置 |
JP2014155007A (ja) * | 2013-02-07 | 2014-08-25 | Mitsubishi Electric Corp | スマートメータおよびスマートメータシステム |
WO2015127194A1 (en) * | 2014-02-20 | 2015-08-27 | Harman International Industries, Inc. | Environment sensing intelligent apparatus |
WO2015149216A1 (en) * | 2014-03-31 | 2015-10-08 | Intel Corporation | Location aware power management scheme for always-on- always-listen voice recognition system |
JP2016213589A (ja) * | 2015-05-01 | 2016-12-15 | 株式会社ハネロン | 環境管理システム |
WO2017134935A1 (ja) * | 2016-02-03 | 2017-08-10 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
JP2017203967A (ja) * | 2016-05-13 | 2017-11-16 | シャープ株式会社 | 音声出力制御装置、電子機器、および音声出力制御装置の制御方法 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3674990B2 (ja) * | 1995-08-21 | 2005-07-27 | セイコーエプソン株式会社 | 音声認識対話装置および音声認識対話処理方法 |
US6397186B1 (en) * | 1999-12-22 | 2002-05-28 | Ambush Interactive, Inc. | Hands-free, voice-operated remote control transmitter |
US8314893B2 (en) * | 2009-08-28 | 2012-11-20 | Sling Media Pvt. Ltd. | Remote control and method for automatically adjusting the volume output of an audio device |
EP2737479B1 (en) * | 2011-07-29 | 2017-01-18 | Dts Llc | Adaptive voice intelligibility enhancement |
US9274673B2 (en) * | 2013-12-31 | 2016-03-01 | Google Inc. | Methods, systems, and media for rewinding media content based on detected audio events |
US9508344B2 (en) * | 2014-10-15 | 2016-11-29 | Delphi Technologies, Inc. | Automatic volume control based on speech recognition |
US9571628B1 (en) * | 2015-11-13 | 2017-02-14 | International Business Machines Corporation | Context and environment aware volume control in telephonic conversation |
CN106899869A (zh) * | 2015-12-25 | 2017-06-27 | 小米科技有限责任公司 | 调整电子设备音量的方法、装置及系统 |
WO2017217286A1 (ja) * | 2016-06-15 | 2017-12-21 | コニカミノルタ株式会社 | 通話機器およびケアサポートシステム |
ES1175583Y (es) * | 2016-10-31 | 2017-04-24 | Fermax Design & Dev S L U | Portero electronico accesible. |
-
2019
- 2019-01-02 KR KR1020207022128A patent/KR20200104898A/ko unknown
- 2019-01-02 JP JP2020537000A patent/JP7374099B2/ja active Active
- 2019-01-02 CN CN201980017095.9A patent/CN111801729B/zh active Active
- 2019-01-02 EP EP19736080.3A patent/EP3735687A4/en active Pending
- 2019-01-02 WO PCT/US2019/012050 patent/WO2019136065A1/en unknown
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003219393A (ja) * | 2002-01-28 | 2003-07-31 | Sony Corp | 情報処理システム、情報処理装置、情報処理方法および情報処理プログラム、入力装置、入力方法および入力プログラム、ならびに、記録媒体 |
JP2012095047A (ja) * | 2010-10-26 | 2012-05-17 | Panasonic Corp | 音声処理装置 |
JP2014155007A (ja) * | 2013-02-07 | 2014-08-25 | Mitsubishi Electric Corp | スマートメータおよびスマートメータシステム |
WO2015127194A1 (en) * | 2014-02-20 | 2015-08-27 | Harman International Industries, Inc. | Environment sensing intelligent apparatus |
WO2015149216A1 (en) * | 2014-03-31 | 2015-10-08 | Intel Corporation | Location aware power management scheme for always-on- always-listen voice recognition system |
JP2016213589A (ja) * | 2015-05-01 | 2016-12-15 | 株式会社ハネロン | 環境管理システム |
WO2017134935A1 (ja) * | 2016-02-03 | 2017-08-10 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
JP2017203967A (ja) * | 2016-05-13 | 2017-11-16 | シャープ株式会社 | 音声出力制御装置、電子機器、および音声出力制御装置の制御方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2019136065A1 (en) | 2019-07-11 |
KR20200104898A (ko) | 2020-09-04 |
CN111801729B (zh) | 2024-05-24 |
CN111801729A (zh) | 2020-10-20 |
JP7374099B2 (ja) | 2023-11-06 |
EP3735687A1 (en) | 2020-11-11 |
EP3735687A4 (en) | 2021-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11631403B2 (en) | Apparatus, system and method for directing voice input in a controlling device | |
US11985003B2 (en) | Apparatus, system and method for directing voice input in a controlling device | |
US20220230635A1 (en) | VAS Toggle Based on Device Orientation | |
US9998703B2 (en) | Apparatus, systems and methods for synchronization of multiple headsets | |
US9886233B2 (en) | Apparatus, systems and methods for audio content diagnostics | |
JP7374099B2 (ja) | 制御デバイスにおいて音声入力を指示する装置、システム及び方法 | |
JP2019159306A (ja) | ファーフィールド音声制御デバイス及びファーフィールド音声制御システム | |
CN109473095A (zh) | 一种智能家居控制系统及控制方法 | |
US11869503B2 (en) | Offline voice control | |
US12003673B2 (en) | Acoustic echo cancellation control for distributed audio devices | |
US11556307B2 (en) | Local voice data processing | |
EP3484183B1 (en) | Location classification for intelligent personal assistant | |
CN104112459A (zh) | 播放音频数据的方法和装置 | |
JP7456387B2 (ja) | 情報処理装置、及び情報処理方法 | |
JP6882615B2 (ja) | 音声制御マルチメディアデバイス | |
US20240235879A1 (en) | Apparatus, system and method for directing voice input in a controlling device | |
KR20210042442A (ko) | 전자장치 및 그 제어방법 | |
RU2818982C2 (ru) | Управление акустической эхокомпенсацией для распределенных аудиоустройств | |
JP2020061046A (ja) | 音声操作装置、音声操作方法、コンピュータプログラムおよび音声操作システム | |
US20240005949A1 (en) | Method and apparatus for providing noise suppression to an intelligent personal assistant | |
US20220381892A1 (en) | Environmentally aware remote control | |
US20230099144A1 (en) | Enabling and Disabling Microphones and Voice Assistants | |
WO2016183837A1 (zh) | 调节电视音量的方法和数字电视设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211208 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221018 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230411 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230630 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230926 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231024 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7374099 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |