JP2018512619A - 発話の方向に基づく電子デバイスの制御 - Google Patents
発話の方向に基づく電子デバイスの制御 Download PDFInfo
- Publication number
- JP2018512619A JP2018512619A JP2017549296A JP2017549296A JP2018512619A JP 2018512619 A JP2018512619 A JP 2018512619A JP 2017549296 A JP2017549296 A JP 2017549296A JP 2017549296 A JP2017549296 A JP 2017549296A JP 2018512619 A JP2018512619 A JP 2018512619A
- Authority
- JP
- Japan
- Prior art keywords
- utterance
- electronic device
- frequency range
- determining
- characteristic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
- 238000000034 method Methods 0.000 claims abstract description 59
- 230000004044 response Effects 0.000 claims abstract description 45
- 230000006854 communication Effects 0.000 claims description 24
- 238000004891 communication Methods 0.000 claims description 24
- 238000004458 analytical method Methods 0.000 claims description 17
- 238000001514 detection method Methods 0.000 claims description 8
- 230000003595 spectral effect Effects 0.000 description 46
- 230000006870 function Effects 0.000 description 39
- 238000012545 processing Methods 0.000 description 17
- 230000005540 biological transmission Effects 0.000 description 9
- 238000012706 support-vector machine Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 101000574648 Homo sapiens Retinoid-inducible serine carboxypeptidase Proteins 0.000 description 4
- 102100025483 Retinoid-inducible serine carboxypeptidase Human genes 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 4
- 235000019800 disodium phosphate Nutrition 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000007175 bidirectional communication Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2250/00—Details of telephonic subscriber devices
- H04M2250/74—Details of telephonic subscriber devices with voice recognition means
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Navigation (AREA)
- Telephone Function (AREA)
- User Interface Of Digital Computer (AREA)
- Telephonic Communication Services (AREA)
Abstract
Description
本出願は、その内容全体が参照により組み込まれる、「CONTROLLING ELECTRONIC DEVICE BASED ON DIRECTION OF SPEECH」という名称の2015年3月27日に出願された米国出願第14/671,858号の優先権を主張する。
以下に、本開示のいくつかの態様をさらに述べる。
110 ユーザ
120 電子デバイス
122 音声アシスタントアプリケーション
130 電子デバイス
140 電子デバイス
150 電子デバイス
210 音声コマンド
212 発信方向
220 音声コマンド
222 発信方向
230 基準線
240 基準線
310 音声コマンド
312 発信方向
410 入力音
420 音センサ
430 プロセッサ
432 発話検出器
434 周波数分析ユニット
436 発話方向決定ユニット
438 発話認識ユニット
440 I/Oユニット
450 ストレージユニット
460 通信ユニット
900 部屋
910 ネットワーク
920 サーバ
1100 電子デバイス
1112 アンテナ
1114 受信機(RCVR)
1116 送信機(TMTR)
1120 デジタル部
1122 モデムプロセッサ
1124 縮小命令セットコンピュータ/デジタル信号プロセッサ(RISC/DSP)
1126 コントローラ/プロセッサ
1128 内部メモリ
1132 汎用オーディオ/ビデオエンコーダ
1134 汎用オーディオデコーダ
1136 グラフィックス/ディスプレイプロセッサ
1138 外部バスインターフェース(EBI)
1142 オーディオ/ビデオソース
1144 マイクロフォン
1146 画像センサ
1148 スピーカー/ヘッドセット
1150 ディスプレイユニット
1152 メインメモリ
1200 サーバシステム
1202 処理ユニット
1212 メモリ
1214 通信バス
1216 オペレーティングシステム
1218 ネットワーク通信モジュール
1220 データベース
Claims (30)
- ユーザによって話された発話に応答して電子デバイスを制御するための方法であって、
音センサによって入力音を受信するステップと、
前記入力音中に前記ユーザによって話された前記発話を検出するステップと、
前記入力音中の前記発話の検出に応答して、前記発話の第1の周波数範囲の第1の特性および第2の周波数範囲の第2の特性を決定するステップと、
前記第1および第2の特性に基づいて、前記ユーザによって話された前記発話の発信方向が前記電子デバイスに向けたものであるかどうかを決定するステップと
を含む、方法。 - 前記第1の周波数範囲が前記第2の周波数範囲よりも高い、請求項1に記載の方法。
- 前記第1および第2の周波数範囲が、少なくとも1つの周波数を含む、請求項1に記載の方法。
- 前記発話の前記発信方向が前記電子デバイスに向けたものであるとの決定に応答して、前記発話中の音声コマンドを認識するステップと、
前記認識された音声コマンドに関連する機能を実行するステップと
をさらに含む、請求項1に記載の方法。 - 前記発話の第1の周波数範囲の第1の特性および第2の周波数範囲の第2の特性を決定するステップが、
前記第1の周波数範囲の第1のエネルギー値を前記第1の特性として決定するステップと、
前記第2の周波数範囲の第2のエネルギー値を前記第2の特性として決定するステップと
を含む、請求項1に記載の方法。 - 前記発話の発信方向が前記電子デバイスに向けたものであるかどうかを決定するステップが、
前記第1のエネルギー値と前記第2のエネルギー値の比率を決定するステップと、
前記比率に基づいて、前記発話の前記発信方向が前記電子デバイスに向けたものであると決定するステップと
を含む、請求項5に記載の方法。 - 前記比率が、前記入力音の信号強度とは無関係である、請求項6に記載の方法。
- 外部デバイスから前記発話の話された方向の表示を受信するステップ
をさらに含む、請求項1に記載の方法。 - 前記第1および第2の特性ならびに前記外部デバイスからの前記表示に基づいて、前記発話のターゲットが前記電子デバイスであるか、それとも前記外部デバイスであるかを決定するステップと、
前記発話の前記ターゲットが前記電子デバイスであるとの決定に応答して、前記発話中の音声コマンドを認識するステップと、
前記認識された音声コマンドに関連する機能を実行するステップと
をさらに含む、請求項8に記載の方法。 - 電子デバイスであって、
入力音を受信するように構成された音センサと、
前記入力音中にユーザによって話された発話を検出するように構成された発話検出器と、
前記入力音中の前記発話の検出に応答して、前記発話の第1の周波数範囲の第1の特性および第2の周波数範囲の第2の特性を決定するように構成された周波数分析ユニットと、
前記第1および第2の特性に基づいて、前記ユーザによって話された前記発話の発信方向が前記電子デバイスに向けたものであるかどうかを決定するように構成された発話方向決定ユニットと
を備える、電子デバイス。 - 前記第1の周波数範囲が前記第2の周波数範囲よりも高い、請求項10に記載の電子デバイス。
- 前記第1および第2の周波数範囲が、少なくとも1つの周波数を含む、請求項10に記載の電子デバイス。
- 前記発話の前記発信方向が前記電子デバイスに向けたものであるとの決定に応答して、前記発話中の音声コマンドを認識するように構成された発話認識ユニット
をさらに備え、
前記電子デバイスが、前記認識された音声コマンドに関連する機能を実行する
請求項10に記載の電子デバイス。 - 前記周波数分析ユニットが、
前記第1の周波数範囲の第1のエネルギー値を前記第1の特性として決定することと、
前記第2の周波数範囲の第2のエネルギー値を前記第2の特性として決定することと
を行うように構成される、請求項10に記載の電子デバイス。 - 前記発話方向決定ユニットが、
前記第1のエネルギー値と前記第2のエネルギー値の比率を決定することと、
前記比率に基づいて、前記発話の前記発信方向が前記電子デバイスに向けたものであると決定することと
を行うように構成される、請求項14に記載の電子デバイス。 - 前記比率が、前記入力音の信号強度とは無関係である、請求項15に記載の電子デバイス。
- 外部デバイスから前記発話の話された方向の表示を受信するように構成された通信ユニット
をさらに備える、請求項10に記載の電子デバイス。 - 前記発話方向決定ユニットが、
前記第1および第2の特性ならびに前記外部デバイスからの前記表示に基づいて、前記発話のターゲットが前記電子デバイスであるか、それとも前記外部デバイスであるかを決定する
ように構成され、
前記電子デバイスが、
前記発話の前記ターゲットが前記電子デバイスであるとの決定に応答して、前記発話中の音声コマンドを認識するように構成された発話認識ユニット
をさらに備え、
前記電子デバイスが、前記認識された音声コマンドに関連する機能を実行する
請求項17に記載の電子デバイス。 - 電子デバイスであって、
入力音を受信するための手段と、
前記入力音中にユーザによって話された発話を検出するための手段と、
前記入力音中の前記発話の検出に応答して、前記発話の第1の周波数範囲の第1の特性および第2の周波数範囲の第2の特性を決定するための手段と、
前記第1および第2の特性に基づいて、前記ユーザによって話された前記発話の発信方向が前記電子デバイスに向けたものであるかどうかを決定するための手段と
を備える、電子デバイス。 - 前記発話の前記発信方向が前記電子デバイスに向けたものであるとの決定に応答して、前記発話中の音声コマンドを認識するための手段と、
前記認識された音声コマンドに関連する機能を実行するための手段と
をさらに備える、請求項19に記載の電子デバイス。 - 前記発話の第1の周波数範囲の第1の特性および第2の周波数範囲の第2の特性を決定するための前記手段が、
前記第1の周波数範囲の第1のエネルギー値を前記第1の特性として決定することと、
前記第2の周波数範囲の第2のエネルギー値を前記第2の特性として決定することと
を行うように構成される、請求項19に記載の電子デバイス。 - 前記ユーザによって話された前記発話の発信方向が前記電子デバイスに向けたものであるかどうかを決定するための前記手段が、
前記第1のエネルギー値と前記第2のエネルギー値の比率を決定することと、
前記比率に基づいて、前記発話の前記発信方向が前記電子デバイスに向けたものであると決定することと
を行うように構成される、請求項21に記載の電子デバイス。 - 外部デバイスから前記発話の話された方向の表示を受信するための手段
をさらに備える、請求項19に記載の電子デバイス。 - 前記ユーザによって話された前記発話の発信方向が前記電子デバイスに向けたものであるかどうかを決定するための前記手段が、
前記第1および第2の特性ならびに前記外部デバイスからの前記表示に基づいて、前記発話のターゲットが前記電子デバイスであるか、それとも前記外部デバイスであるかを決定するように構成され、
前記電子デバイスが、
前記発話の前記ターゲットが前記電子デバイスであるとの決定に応答して、前記発話中の音声コマンドを認識するための手段と、
前記認識された音声コマンドに関連する機能を実行するための手段と
をさらに備える、請求項23に記載の電子デバイス。 - 電子デバイスの少なくとも1つのプロセッサに、
音センサによって入力音を受信する動作と、
前記入力音中にユーザによって話された発話を検出する動作と、
前記入力音中の前記発話の検出に応答して、前記発話の第1の周波数範囲の第1の特性および第2の周波数範囲の第2の特性を決定する動作と、
前記第1および第2の特性に基づいて、前記ユーザによって話された前記発話の発信方向が前記電子デバイスに向けたものであるかどうかを決定する動作と
を実行させる命令を含む、コンピュータ可読記憶媒体。 - 前記電子デバイスの前記少なくとも1つのプロセッサに、
前記発話の前記発信方向が前記電子デバイスに向けたものであるとの決定に応答して、前記発話中の音声コマンドを認識する動作と、
前記認識された音声コマンドに関連する機能を実行する動作と
を実行させる命令をさらに含む、請求項25に記載のコンピュータ可読記憶媒体。 - 前記発話の第1の周波数範囲の第1の特性および第2の周波数範囲の第2の特性を決定することが、
前記第1の周波数範囲の第1のエネルギー値を前記第1の特性として決定することと、
前記第2の周波数範囲の第2のエネルギー値を前記第2の特性として決定することと
を含む、請求項25に記載のコンピュータ可読記憶媒体。 - 前記発話の発信方向が前記電子デバイスに向けたものであるかどうかを決定することが、
前記第1のエネルギー値と前記第2のエネルギー値の比率を決定することと、
前記比率に基づいて、前記発話の前記発信方向が前記電子デバイスに向けたものであると決定することと
を含む、請求項27に記載のコンピュータ可読記憶媒体。 - 前記電子デバイスの前記少なくとも1つのプロセッサに、
外部デバイスから前記発話の話された方向の表示を受信する動作
を実行させる命令をさらに含む、請求項25に記載のコンピュータ可読記憶媒体。 - 前記電子デバイスの前記少なくとも1つのプロセッサに、
前記第1および第2の特性ならびに前記外部デバイスからの前記表示に基づいて、前記発話のターゲットが前記電子デバイスであるか、それとも前記外部デバイスであるかを決定する動作と、
前記発話の前記ターゲットが前記電子デバイスであるとの決定に応答して、前記発話中の音声コマンドを認識する動作と、
前記認識された音声コマンドに関連する機能を実行する動作と
を実行させる命令をさらに含む、請求項29に記載のコンピュータ可読記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/671,858 US9911416B2 (en) | 2015-03-27 | 2015-03-27 | Controlling electronic device based on direction of speech |
US14/671,858 | 2015-03-27 | ||
PCT/US2016/016649 WO2016160123A1 (en) | 2015-03-27 | 2016-02-04 | Controlling electronic device based on direction of speech |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018512619A true JP2018512619A (ja) | 2018-05-17 |
JP2018512619A5 JP2018512619A5 (ja) | 2018-06-28 |
Family
ID=55404841
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017549296A Ceased JP2018512619A (ja) | 2015-03-27 | 2016-02-04 | 発話の方向に基づく電子デバイスの制御 |
Country Status (8)
Country | Link |
---|---|
US (1) | US9911416B2 (ja) |
EP (1) | EP3274988B1 (ja) |
JP (1) | JP2018512619A (ja) |
KR (1) | KR101981878B1 (ja) |
CN (1) | CN107408386B (ja) |
ES (1) | ES2754448T3 (ja) |
HU (1) | HUE047117T2 (ja) |
WO (1) | WO2016160123A1 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019204103A (ja) * | 2018-08-31 | 2019-11-28 | 百度在線網絡技術(北京)有限公司 | 音声スマート機器のウェイクアップ方法、音声スマート機器のウェイクアップ装置、スマート機器及びコンピュータ読み取り可能な記憶媒体 |
JP2020003774A (ja) * | 2018-06-29 | 2020-01-09 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | 音声を処理する方法及び装置 |
KR20210116066A (ko) * | 2020-03-17 | 2021-09-27 | 성균관대학교산학협력단 | 심층 신경망을 이용한 음성 발생 방향 추론 방법 및 그 장치 |
US20220182756A1 (en) * | 2020-12-07 | 2022-06-09 | Gulfstream Aerospace Corporation | Microphone array onboard aircraft to determine crew/passenger location and to steer a transducer beam pattern to that location |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106125048B (zh) * | 2016-07-11 | 2019-05-24 | 浙江大华技术股份有限公司 | 一种声源定位方法及装置 |
EP2911149B1 (en) * | 2014-02-19 | 2019-04-17 | Nokia Technologies OY | Determination of an operational directive based at least in part on a spatial audio property |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
WO2016208789A1 (ko) * | 2015-06-26 | 2016-12-29 | 삼성전자 주식회사 | 소리를 판별하는 방법 및 이를 위한 장치 |
US11587559B2 (en) * | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
KR102427833B1 (ko) * | 2015-11-30 | 2022-08-02 | 삼성전자주식회사 | 사용자 단말장치 및 디스플레이 방법 |
EP3414759B1 (en) * | 2016-02-10 | 2020-07-01 | Cerence Operating Company | Techniques for spatially selective wake-up word recognition and related systems and methods |
US9911417B2 (en) * | 2016-04-01 | 2018-03-06 | Tai-An Lu | Internet of things system with voice-controlled functions and method for processing information of the same |
US10147423B2 (en) * | 2016-09-29 | 2018-12-04 | Intel IP Corporation | Context-aware query recognition for electronic devices |
US9642225B1 (en) * | 2016-10-20 | 2017-05-02 | Kai-kong Ng | Voice-controlled lighting control system |
KR101893768B1 (ko) * | 2017-02-27 | 2018-09-04 | 주식회사 브이터치 | 음성 인식 트리거를 제공하기 위한 방법, 시스템 및 비일시성의 컴퓨터 판독 가능한 기록 매체 |
US20220238134A1 (en) * | 2017-02-27 | 2022-07-28 | VTouch Co., Ltd. | Method and system for providing voice recognition trigger and non-transitory computer-readable recording medium |
US10403276B2 (en) | 2017-03-17 | 2019-09-03 | Microsoft Technology Licensing, Llc | Voice enabled features based on proximity |
KR102471493B1 (ko) * | 2017-10-17 | 2022-11-29 | 삼성전자주식회사 | 전자 장치 및 음성 인식 방법 |
TWM562433U (zh) * | 2018-01-05 | 2018-06-21 | Thermaltake Technology Co Ltd | 聲控輸入系統 |
US11150869B2 (en) | 2018-02-14 | 2021-10-19 | International Business Machines Corporation | Voice command filtering |
US11238856B2 (en) | 2018-05-01 | 2022-02-01 | International Business Machines Corporation | Ignoring trigger words in streamed media content |
US11200890B2 (en) | 2018-05-01 | 2021-12-14 | International Business Machines Corporation | Distinguishing voice commands |
US11609739B2 (en) * | 2018-06-01 | 2023-03-21 | Apple Inc. | Providing audio information with a digital assistant |
US11854566B2 (en) | 2018-06-21 | 2023-12-26 | Magic Leap, Inc. | Wearable system speech processing |
US11062703B2 (en) | 2018-08-21 | 2021-07-13 | Intel Corporation | Automatic speech recognition with filler model processing |
NO20181210A1 (en) * | 2018-08-31 | 2020-03-02 | Elliptic Laboratories As | Voice assistant |
CN109831709B (zh) * | 2019-02-15 | 2020-10-09 | 杭州嘉楠耘智信息科技有限公司 | 音源定向方法及装置和计算机可读存储介质 |
WO2020180719A1 (en) | 2019-03-01 | 2020-09-10 | Magic Leap, Inc. | Determining input for speech processing engine |
KR102245953B1 (ko) * | 2019-06-05 | 2021-04-28 | 엘지전자 주식회사 | 복수의 전자기기의 제어방법 |
CN110459213A (zh) * | 2019-06-28 | 2019-11-15 | 浙江想能睡眠科技股份有限公司 | 基于语音控制的智能床垫及其控制方法 |
US11328740B2 (en) | 2019-08-07 | 2022-05-10 | Magic Leap, Inc. | Voice onset detection |
US11355108B2 (en) | 2019-08-20 | 2022-06-07 | International Business Machines Corporation | Distinguishing voice commands |
US11205433B2 (en) * | 2019-08-21 | 2021-12-21 | Qualcomm Incorporated | Method and apparatus for activating speech recognition |
US11917384B2 (en) | 2020-03-27 | 2024-02-27 | Magic Leap, Inc. | Method of waking a device using spoken voice commands |
CN115086096A (zh) * | 2021-03-15 | 2022-09-20 | Oppo广东移动通信有限公司 | 响应控制语音的方法、装置、设备及存储介质 |
US20230035941A1 (en) * | 2021-07-15 | 2023-02-02 | Apple Inc. | Speech interpretation based on environmental context |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6219645B1 (en) * | 1999-12-02 | 2001-04-17 | Lucent Technologies, Inc. | Enhanced automatic speech recognition using multiple directional microphones |
US7167544B1 (en) * | 1999-11-25 | 2007-01-23 | Siemens Aktiengesellschaft | Telecommunication system with error messages corresponding to speech recognition errors |
JP2012220959A (ja) * | 2011-04-08 | 2012-11-12 | Sony Computer Entertainment Inc | 入力された発話の関連性を判定するための装置および方法 |
US20140244267A1 (en) * | 2013-02-26 | 2014-08-28 | Avaya Inc. | Integration of user orientation into a voice command system |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10133126A1 (de) | 2001-07-07 | 2003-01-16 | Philips Corp Intellectual Pty | Richtungssensitives Audioaufnahmesystem mit Anzeige von Aufnahmegebiet und/oder Störquelle |
JP4157581B2 (ja) * | 2004-12-03 | 2008-10-01 | 本田技研工業株式会社 | 音声認識装置 |
JP4873913B2 (ja) | 2004-12-17 | 2012-02-08 | 学校法人早稲田大学 | 音源分離システムおよび音源分離方法、並びに音響信号取得装置 |
EP1699261B1 (en) * | 2005-03-01 | 2011-05-25 | Oticon A/S | System and method for determining directionality of sound detected by a hearing aid |
EP2237271B1 (en) | 2009-03-31 | 2021-01-20 | Cerence Operating Company | Method for determining a signal component for reducing noise in an input signal |
US8588441B2 (en) * | 2010-01-29 | 2013-11-19 | Phonak Ag | Method for adaptively matching microphones of a hearing system as well as a hearing system |
US9053697B2 (en) * | 2010-06-01 | 2015-06-09 | Qualcomm Incorporated | Systems, methods, devices, apparatus, and computer program products for audio equalization |
CN103069297A (zh) * | 2011-01-18 | 2013-04-24 | 松下电器产业株式会社 | 车辆方向确定装置、车辆方向确定方法及其程序 |
US20130204629A1 (en) | 2012-02-08 | 2013-08-08 | Panasonic Corporation | Voice input device and display device |
US20130238326A1 (en) | 2012-03-08 | 2013-09-12 | Lg Electronics Inc. | Apparatus and method for multiple device voice control |
KR101946364B1 (ko) * | 2012-05-01 | 2019-02-11 | 엘지전자 주식회사 | 적어도 하나의 마이크 센서를 갖는 모바일 디바이스 및 그 제어방법 |
US9251787B1 (en) * | 2012-09-26 | 2016-02-02 | Amazon Technologies, Inc. | Altering audio to improve automatic speech recognition |
WO2014087495A1 (ja) | 2012-12-05 | 2014-06-12 | 株式会社日立製作所 | 音声対話ロボット、音声対話ロボットシステム |
US9525938B2 (en) * | 2013-02-06 | 2016-12-20 | Apple Inc. | User voice location estimation for adjusting portable device beamforming settings |
US9384751B2 (en) | 2013-05-06 | 2016-07-05 | Honeywell International Inc. | User authentication of voice controlled devices |
EP2911149B1 (en) | 2014-02-19 | 2019-04-17 | Nokia Technologies OY | Determination of an operational directive based at least in part on a spatial audio property |
EP2928210A1 (en) * | 2014-04-03 | 2015-10-07 | Oticon A/s | A binaural hearing assistance system comprising binaural noise reduction |
-
2015
- 2015-03-27 US US14/671,858 patent/US9911416B2/en active Active
-
2016
- 2016-02-04 HU HUE16705671A patent/HUE047117T2/hu unknown
- 2016-02-04 ES ES16705671T patent/ES2754448T3/es active Active
- 2016-02-04 CN CN201680014289.XA patent/CN107408386B/zh active Active
- 2016-02-04 JP JP2017549296A patent/JP2018512619A/ja not_active Ceased
- 2016-02-04 WO PCT/US2016/016649 patent/WO2016160123A1/en active Application Filing
- 2016-02-04 KR KR1020177027318A patent/KR101981878B1/ko active IP Right Grant
- 2016-02-04 EP EP16705671.2A patent/EP3274988B1/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7167544B1 (en) * | 1999-11-25 | 2007-01-23 | Siemens Aktiengesellschaft | Telecommunication system with error messages corresponding to speech recognition errors |
US6219645B1 (en) * | 1999-12-02 | 2001-04-17 | Lucent Technologies, Inc. | Enhanced automatic speech recognition using multiple directional microphones |
JP2012220959A (ja) * | 2011-04-08 | 2012-11-12 | Sony Computer Entertainment Inc | 入力された発話の関連性を判定するための装置および方法 |
US20140244267A1 (en) * | 2013-02-26 | 2014-08-28 | Avaya Inc. | Integration of user orientation into a voice command system |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020003774A (ja) * | 2018-06-29 | 2020-01-09 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | 音声を処理する方法及び装置 |
US11244686B2 (en) | 2018-06-29 | 2022-02-08 | Baidu Online Network Technology (Beijing) Co., Ltd. | Method and apparatus for processing speech |
JP2019204103A (ja) * | 2018-08-31 | 2019-11-28 | 百度在線網絡技術(北京)有限公司 | 音声スマート機器のウェイクアップ方法、音声スマート機器のウェイクアップ装置、スマート機器及びコンピュータ読み取り可能な記憶媒体 |
US11355107B2 (en) | 2018-08-31 | 2022-06-07 | Baidu Online Network Technology (Beijing) Co., Ltd. | Voice smart device wake-up method, apparatus, device and storage medium |
KR20210116066A (ko) * | 2020-03-17 | 2021-09-27 | 성균관대학교산학협력단 | 심층 신경망을 이용한 음성 발생 방향 추론 방법 및 그 장치 |
KR102329353B1 (ko) | 2020-03-17 | 2021-11-22 | 성균관대학교산학협력단 | 심층 신경망을 이용한 음성 발생 방향 추론 방법 및 그 장치 |
US20220182756A1 (en) * | 2020-12-07 | 2022-06-09 | Gulfstream Aerospace Corporation | Microphone array onboard aircraft to determine crew/passenger location and to steer a transducer beam pattern to that location |
US11778370B2 (en) * | 2020-12-07 | 2023-10-03 | Gulfstream Aerospace Corporation | Microphone array onboard aircraft to determine crew/passenger location and to steer a transducer beam pattern to that location |
Also Published As
Publication number | Publication date |
---|---|
EP3274988B1 (en) | 2019-08-07 |
CN107408386A (zh) | 2017-11-28 |
US9911416B2 (en) | 2018-03-06 |
US20160284350A1 (en) | 2016-09-29 |
EP3274988A1 (en) | 2018-01-31 |
KR20170131465A (ko) | 2017-11-29 |
HUE047117T2 (hu) | 2020-04-28 |
WO2016160123A1 (en) | 2016-10-06 |
ES2754448T3 (es) | 2020-04-17 |
KR101981878B1 (ko) | 2019-05-23 |
CN107408386B (zh) | 2018-11-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101981878B1 (ko) | 스피치의 방향에 기초한 전자 디바이스의 제어 | |
EP3134896B1 (en) | Method and apparatus for activating application by speech input | |
US11756563B1 (en) | Multi-path calculations for device energy levels | |
US20220093108A1 (en) | Speaker identification | |
KR101752119B1 (ko) | 다수의 디바이스에서의 핫워드 검출 | |
US20150302856A1 (en) | Method and apparatus for performing function by speech input | |
CN109791763B (zh) | 多设备上的热词检测 | |
CN110431623B (zh) | 电子设备及其控制方法 | |
US9343068B2 (en) | Method and apparatus for controlling access to applications having different security levels | |
US9892729B2 (en) | Method and apparatus for controlling voice activation | |
EP2994911B1 (en) | Adaptive audio frame processing for keyword detection | |
US9837068B2 (en) | Sound sample verification for generating sound detection model | |
US9867012B2 (en) | Whispered speech detection | |
US20190147887A1 (en) | Audio processing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180418 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180418 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20180418 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20180703 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180713 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181005 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181221 |
|
A045 | Written measure of dismissal of application [lapsed due to lack of payment] |
Free format text: JAPANESE INTERMEDIATE CODE: A045 Effective date: 20190422 |