JP2020511682A - 記録メディアのホットワードトリガ抑制 - Google Patents
記録メディアのホットワードトリガ抑制 Download PDFInfo
- Publication number
- JP2020511682A JP2020511682A JP2019538634A JP2019538634A JP2020511682A JP 2020511682 A JP2020511682 A JP 2020511682A JP 2019538634 A JP2019538634 A JP 2019538634A JP 2019538634 A JP2019538634 A JP 2019538634A JP 2020511682 A JP2020511682 A JP 2020511682A
- Authority
- JP
- Japan
- Prior art keywords
- audio
- computing device
- watermark
- hotword
- media content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000001629 suppression Effects 0.000 title 1
- 238000000034 method Methods 0.000 claims abstract description 80
- 230000009471 action Effects 0.000 claims abstract description 48
- 238000003058 natural language processing Methods 0.000 claims description 5
- 238000004590 computer program Methods 0.000 abstract description 6
- 230000015654 memory Effects 0.000 description 38
- 230000008569 process Effects 0.000 description 24
- 238000004891 communication Methods 0.000 description 18
- 239000000872 buffer Substances 0.000 description 10
- 230000004044 response Effects 0.000 description 5
- 241000282412 Homo Species 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 241000287828 Gallus gallus Species 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 239000004984 smart glass Substances 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 206010011878 Deafness Diseases 0.000 description 1
- 208000032041 Hearing impaired Diseases 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000010411 cooking Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000026676 system process Effects 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/018—Audio watermarking, i.e. embedding inaudible data in the audio signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
Description
122 オーディオサブシステム
124 ホットワーダ
126 ホットワーダ
128 オーディオ透かし識別子
130 オーディオ透かし識別子
140 オーディオ透かし比較器
142 オーディオ透かし
144 オーディオ透かし比較器
146 オーディオ透かし
148 ユーザインタフェース生成器
150 ユーザインタフェース生成器
152 ユーザ設定
156 位置検出器
158 デバイス識別子
160 デバイス識別
162 ユーザ識別子
166 スピーチ認識器
168 スピーチ認識器状態
170 オーディオ透かしログ
172 スピーチ認識器
174 スピーチ認識器状態
176 位置検出器
178 デバイス識別子
180 デバイス識別
182 ユーザ識別子
186 ユーザ設定
188 オーディオ透かしログ
300 コンピューティングデバイス
302 プロセッサ
304 メモリ
306 ストレージデバイス
308 高速インタフェース
310 高速拡張ポート
312 低速インタフェース
314 低速拡張ポート
316 ディスプレイ
320 サーバ
322 ラップトップコンピュータ
324 ラックサーバシステ
350 モバイルコンピューティングデバイス
352 プロセッサ
354 タッチ式ディスプレイ
356 ディスプレイインタフェース
358 制御インタフェース
360 オーディオコーデック
362 外部インタフェース
364 メモリ
366 通信インタフェース
368 トランシーバ
370 GPS受信モジュール
372 拡張インタフェース
374 拡張メモリ
380 携帯電話
382 スマートフォン
Claims (19)
- コンピューティングデバイスにより、1個のメディアコンテンツの再生に対応するオーディオを受け取るステップと、
前記コンピューティングデバイスにより、前記オーディオが既定のホットワードの発語を含み、前記オーディオがオーディオ透かしを含むと判定するステップと、
前記コンピューティングデバイスにより、前記オーディオ透かしを解析するステップと、
前記オーディオ透かしの解析に基づいて、前記コンピューティングデバイスにより、前記既定のホットワードに続く前記オーディオの一部分に対してスピーチ認識を実行するかどうかを判定するステップと、
を含む、コンピュータ実施方法。 - 前記オーディオ透かしを解析するステップが、前記オーディオ透かしを1つまたは複数のオーディオ透かしと比較するステップを含み、
前記既定のホットワードに続く前記オーディオの前記一部分に対してスピーチ認識を実行するかどうかを判定するステップが、前記オーディオ透かしと1つまたは複数のオーディオ透かしとの比較にさらに基づいている、請求項1に記載の方法。 - 前記オーディオ透かしが、1個のメディアコンテンツの再生に対応する前記オーディオの不可聴部分である、請求項1または2に記載の方法。
- 前記オーディオ透かしの解析に基づいて、前記1個のメディアコンテンツの再生に対応する前記オーディオのソースを識別するステップを含み、
前記既定のホットワードに続く前記オーディオの前記一部分に対してスピーチ認識を実行するかどうかを判定するステップが、前記1個のメディアコンテンツの再生に対応する前記オーディオの前記ソースにさらに基づいている、請求項1から3のいずれか一項に記載の方法。 - 前記オーディオ透かしの解析に基づいて、1個のメディアコンテンツの再生に対応する前記オーディオのソースを識別するステップと、
前記1個のメディアコンテンツの再生に対応する前記オーディオの前記ソースを示すようにログファイルを更新するステップと、
を含む、請求項1から4のいずれか一項に記載の方法。 - 前記オーディオ透かしが、前記既定のホットワードの前記発語を含む前記オーディオの一部分に含まれる、請求項1から5のいずれか一項に記載の方法。
- 前記追加のコンピューティングデバイスのタイプを決定するステップを含み、
前記既定のホットワードに続く前記オーディオの前記一部分に対してスピーチ認識を実行するかどうか判定するステップが、前記追加のコンピューティングデバイスの前記タイプにさらに基づいている、請求項1から6のいずれか一項に記載の方法。 - 前記コンピューティングデバイスにより、前記既定のホットワードに続く前記オーディオの一部分に対してスピーチ認識を実行するかどうか判定するステップが、前記既定のホットワードに続く前記オーディオの前記一部分に対してスピーチ認識を実行すると決定するステップを含み、
前記方法が、
自動スピーチ認識器により、前記既定のホットワードに続く前記オーディオの音訳を生成するステップと、
前記既定のホットワードに続く前記オーディオの前記音訳に対応するアクションを実行するステップと、をさらに含む、請求項1から7のいずれか一項に記載の方法。 - 前記コンピューティングデバイスにより、前記既定のホットワードに続く前記オーディオの一部分に対してスピーチ認識を実行するかどうかを判定するステップが、前記既定のホットワードに続く前記オーディオの前記一部分に対してスピーチ認識を実行しないと決定するステップを含み、
前記方法が、
前記1個のメディアコンテンツの再生に対応する前記オーディオに対応するアクションを抑制するステップをさらに含む、請求項1から7のいずれか一項に記載の方法。 - 前記追加のコンピューティングデバイスの位置を決定するステップを含み、
前記既定のホットワードに続く前記オーディオの前記一部分に対してスピーチ認識を実行するかどうか判定するステップが、前記追加のコンピューティングデバイスの前記位置にさらに基づいている、請求項1から9のいずれか一項に記載の方法。 - 前記追加のコンピューティングデバイスのユーザ設定を決定するステップを含み、
前記既定のホットワードに続く前記オーディオの前記一部分に対してスピーチ認識を実行するかどうか判定するステップが、前記追加のコンピューティングデバイスの前記ユーザ設定にさらに基づいている、請求項1から10のいずれか一項に記載の方法。 - 前記コンピューティングデバイスにより、前記オーディオが既定のホットワードの発語を含み、前記オーディオがオーディオ透かしを含むと判定するステップが、
前記オーディオが既定のホットワードの発語を含むと判定するステップと、
前記オーディオが既定のホットワードの発語を含むという判定に基づいて、前記オーディオが前記オーディオ透かしを含むと判定するステップと、
を含む、請求項1から11のいずれか一項に記載の方法。 - 前記コンピューティングデバイスにより、前記オーディオが既定のホットワードの発語を含み、前記オーディオがオーディオ透かしを含むと判定するステップが、
前記オーディオが既定のホットワードの発語を含むと判定するステップと、
前記オーディオが既定のホットワードの発語を含むと判定した後で、前記オーディオが前記オーディオ透かしを含むと判定するステップと、
を含む、請求項1から12のいずれか一項に記載の方法。 - 前記オーディオ透かしを解析するステップが、前記オーディオ透かし内で符号化されたデータを抽出するステップを含み、
前記既定のホットワードに続く前記オーディオの一部分に対してスピーチ認識を実行するかどうかを判定するステップが、前記オーディオ透かし内で符号化された前記データにさらに基づく、請求項1から13のいずれか一項に記載の方法。 - 前記オーディオ透かしの解析に基づいて、1個のメディアコンテンツの再生に対応する前記オーディオのメディアコンテンツタイプを識別するステップと、
前記1個のメディアコンテンツの再生に対応する前記オーディオの前記メディアコンテンツタイプを示すようにログファイルを更新するステップと、
を含む、請求項1から14のいずれか一項に記載の方法。 - 前記オーディオ透かしの解析に基づいて、前記1個のメディアコンテンツの再生に対応する前記オーディオのメディアコンテンツタイプを識別するステップを含み、
前記既定のホットワードに続く前記オーディオの前記一部分に対してスピーチ認識を実行するかどうかを判定するステップが、前記1個のメディアコンテンツの再生に対応する前記オーディオの前記メディアコンテンツタイプにさらに基づいている、請求項1から15のいずれか一項に記載の方法。 - 前記オーディオ透かしの解析に基づいて、前記コンピューティングデバイスにより、前記既定のホットワードに続く前記オーディオの一部分に対して自然言語処理を実行するかどうかを判定するステップを含む、請求項1から16のいずれか一項に記載の方法。
- 1つまたは複数のコンピュータと、
前記1つまたは複数のコンピュータによって実行されたときに、前記1つまたは複数のコンピュータに請求項1から17のいずれか一項に記載の方法を実行させるように動作可能な命令を格納する、1つまたは複数のストレージデバイスと、
を備える、システム。 - 1つまたは複数のコンピュータによって実行可能な、任意選択で非一時的コンピュータ可読媒体に格納されたコンピュータ可読命令であって、実行時に、前記1つまたは複数のコンピュータに請求項1から17のいずれか一項に記載の方法を実行させる、コンピュータ可読命令。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/614,213 | 2017-06-05 | ||
US15/614,213 US10395650B2 (en) | 2017-06-05 | 2017-06-05 | Recorded media hotword trigger suppression |
PCT/US2018/022101 WO2018226283A1 (en) | 2017-06-05 | 2018-03-13 | Recorded media hotword trigger suppression |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020135793A Division JP7114660B2 (ja) | 2017-06-05 | 2020-08-11 | 記録メディアのホットワードトリガ抑制 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020511682A true JP2020511682A (ja) | 2020-04-16 |
JP6750125B2 JP6750125B2 (ja) | 2020-09-02 |
Family
ID=61837845
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019538634A Active JP6750125B2 (ja) | 2017-06-05 | 2018-03-13 | 記録メディアのホットワードトリガ抑制 |
JP2020135793A Active JP7114660B2 (ja) | 2017-06-05 | 2020-08-11 | 記録メディアのホットワードトリガ抑制 |
JP2022118728A Active JP7461416B2 (ja) | 2017-06-05 | 2022-07-26 | 記録メディアのホットワードトリガ抑制 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020135793A Active JP7114660B2 (ja) | 2017-06-05 | 2020-08-11 | 記録メディアのホットワードトリガ抑制 |
JP2022118728A Active JP7461416B2 (ja) | 2017-06-05 | 2022-07-26 | 記録メディアのホットワードトリガ抑制 |
Country Status (6)
Country | Link |
---|---|
US (3) | US10395650B2 (ja) |
EP (3) | EP4220629A1 (ja) |
JP (3) | JP6750125B2 (ja) |
KR (1) | KR102296238B1 (ja) |
CN (2) | CN116597836A (ja) |
WO (1) | WO2018226283A1 (ja) |
Families Citing this family (58)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9772817B2 (en) | 2016-02-22 | 2017-09-26 | Sonos, Inc. | Room-corrected voice detection |
US10264030B2 (en) | 2016-02-22 | 2019-04-16 | Sonos, Inc. | Networked microphone device control |
US10509626B2 (en) | 2016-02-22 | 2019-12-17 | Sonos, Inc | Handling of loss of pairing between networked devices |
US10095470B2 (en) | 2016-02-22 | 2018-10-09 | Sonos, Inc. | Audio response playback |
US9978390B2 (en) | 2016-06-09 | 2018-05-22 | Sonos, Inc. | Dynamic player selection for audio signal processing |
US10134399B2 (en) | 2016-07-15 | 2018-11-20 | Sonos, Inc. | Contextualization of voice inputs |
US10115400B2 (en) | 2016-08-05 | 2018-10-30 | Sonos, Inc. | Multiple voice services |
US10181323B2 (en) | 2016-10-19 | 2019-01-15 | Sonos, Inc. | Arbitration-based voice recognition |
US10347247B2 (en) | 2016-12-30 | 2019-07-09 | Google Llc | Modulation of packetized audio signals |
US10395650B2 (en) | 2017-06-05 | 2019-08-27 | Google Llc | Recorded media hotword trigger suppression |
US10475449B2 (en) | 2017-08-07 | 2019-11-12 | Sonos, Inc. | Wake-word detection suppression |
CA3071560C (en) * | 2017-08-10 | 2024-01-23 | Sony Corporation | Transmission apparatus, transmission method, reception apparatus, and reception method |
US10048930B1 (en) | 2017-09-08 | 2018-08-14 | Sonos, Inc. | Dynamic computation of system response volume |
SG11202001429XA (en) * | 2017-09-15 | 2020-04-29 | Sony Corp | Information processing apparatus and information processing method |
US10482868B2 (en) | 2017-09-28 | 2019-11-19 | Sonos, Inc. | Multi-channel acoustic echo cancellation |
US10051366B1 (en) | 2017-09-28 | 2018-08-14 | Sonos, Inc. | Three-dimensional beam forming with a microphone array |
US10466962B2 (en) | 2017-09-29 | 2019-11-05 | Sonos, Inc. | Media playback system with voice assistance |
US10276175B1 (en) | 2017-11-28 | 2019-04-30 | Google Llc | Key phrase detection with audio watermarking |
US10818290B2 (en) * | 2017-12-11 | 2020-10-27 | Sonos, Inc. | Home graph |
CN108172224B (zh) * | 2017-12-19 | 2019-08-27 | 浙江大学 | 基于机器学习的防御无声指令控制语音助手的方法 |
US11175880B2 (en) | 2018-05-10 | 2021-11-16 | Sonos, Inc. | Systems and methods for voice-assisted media content selection |
US10692496B2 (en) * | 2018-05-22 | 2020-06-23 | Google Llc | Hotword suppression |
US10959029B2 (en) | 2018-05-25 | 2021-03-23 | Sonos, Inc. | Determining and adapting to changes in microphone performance of playback devices |
US11076035B2 (en) | 2018-08-28 | 2021-07-27 | Sonos, Inc. | Do not disturb feature for audio notifications |
US11024331B2 (en) | 2018-09-21 | 2021-06-01 | Sonos, Inc. | Voice detection optimization using sound metadata |
US10811015B2 (en) * | 2018-09-25 | 2020-10-20 | Sonos, Inc. | Voice detection optimization based on selected voice assistant service |
US11100923B2 (en) | 2018-09-28 | 2021-08-24 | Sonos, Inc. | Systems and methods for selective wake word detection using neural network models |
US10692518B2 (en) | 2018-09-29 | 2020-06-23 | Sonos, Inc. | Linear filtering for noise-suppressed speech detection via multiple network microphone devices |
US11089348B2 (en) * | 2018-10-03 | 2021-08-10 | At&T Intellectual Property I, L.P. | Method and apparatus for determining the accuracy of targeted advertising |
US11227310B2 (en) * | 2018-10-16 | 2022-01-18 | At&T Intellectual Property I, L.P. | Method and apparatus for targeted advertising selection |
US11210699B2 (en) * | 2018-10-18 | 2021-12-28 | At&T Intellectual Property I, L.P. | Method and apparatus for targeted advertising |
US11899519B2 (en) | 2018-10-23 | 2024-02-13 | Sonos, Inc. | Multiple stage network microphone device with reduced power consumption and processing load |
US11183183B2 (en) | 2018-12-07 | 2021-11-23 | Sonos, Inc. | Systems and methods of operating media playback systems having multiple voice assistant services |
US11132989B2 (en) | 2018-12-13 | 2021-09-28 | Sonos, Inc. | Networked microphone devices, systems, and methods of localized arbitration |
US10602268B1 (en) | 2018-12-20 | 2020-03-24 | Sonos, Inc. | Optimization of network microphone devices using noise classification |
US11522619B2 (en) | 2019-03-08 | 2022-12-06 | Rovi Guides, Inc. | Frequency pairing for device synchronization |
US11011169B2 (en) | 2019-03-08 | 2021-05-18 | ROVl GUIDES, INC. | Inaudible frequency transmission in interactive content |
US11074914B2 (en) | 2019-03-08 | 2021-07-27 | Rovi Guides, Inc. | Automated query detection in interactive content |
US11120794B2 (en) | 2019-05-03 | 2021-09-14 | Sonos, Inc. | Voice assistant persistence across multiple network microphone devices |
US10956123B2 (en) | 2019-05-08 | 2021-03-23 | Rovi Guides, Inc. | Device and query management system |
US11810575B2 (en) * | 2019-06-12 | 2023-11-07 | Lg Electronics Inc. | Artificial intelligence robot for providing voice recognition function and method of operating the same |
US10871943B1 (en) | 2019-07-31 | 2020-12-22 | Sonos, Inc. | Noise classification for event detection |
US11189286B2 (en) | 2019-10-22 | 2021-11-30 | Sonos, Inc. | VAS toggle based on device orientation |
WO2021100555A1 (ja) * | 2019-11-21 | 2021-05-27 | ソニーグループ株式会社 | 情報処理システム、情報処理装置、情報処理方法及びプログラム |
US11200900B2 (en) | 2019-12-20 | 2021-12-14 | Sonos, Inc. | Offline voice control |
US11562740B2 (en) | 2020-01-07 | 2023-01-24 | Sonos, Inc. | Voice verification for media playback |
US11556307B2 (en) | 2020-01-31 | 2023-01-17 | Sonos, Inc. | Local voice data processing |
US11308958B2 (en) | 2020-02-07 | 2022-04-19 | Sonos, Inc. | Localized wakeword verification |
US11170793B2 (en) * | 2020-02-13 | 2021-11-09 | Adobe Inc. | Secure audio watermarking based on neural networks |
KR102348091B1 (ko) | 2020-04-01 | 2022-01-10 | 한국원자력연구원 | 증기 발생기 사고 대처 시스템 |
RU2767962C2 (ru) | 2020-04-13 | 2022-03-22 | Общество С Ограниченной Ответственностью «Яндекс» | Способ и система для распознавания воспроизведенного речевого фрагмента |
US11308962B2 (en) | 2020-05-20 | 2022-04-19 | Sonos, Inc. | Input detection windowing |
US11482224B2 (en) | 2020-05-20 | 2022-10-25 | Sonos, Inc. | Command keywords with input detection windowing |
US11776549B2 (en) * | 2020-11-06 | 2023-10-03 | Google Llc | Multi-factor audio watermarking |
US11984123B2 (en) | 2020-11-12 | 2024-05-14 | Sonos, Inc. | Network device interaction by range |
CN112767917B (zh) * | 2020-12-31 | 2022-05-17 | 科大讯飞股份有限公司 | 语音识别方法、装置及存储介质 |
US11483427B1 (en) | 2021-04-28 | 2022-10-25 | Zoom Video Communications, Inc. | Call recording authentication |
US11915711B2 (en) | 2021-07-20 | 2024-02-27 | Direct Cursus Technology L.L.C | Method and system for augmenting audio signals |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014103099A1 (ja) * | 2012-12-28 | 2014-07-03 | パナソニック株式会社 | 音声認識付き機器及び音声認識方法 |
US9548053B1 (en) * | 2014-09-19 | 2017-01-17 | Amazon Technologies, Inc. | Audible command filtering |
Family Cites Families (145)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4363102A (en) | 1981-03-27 | 1982-12-07 | Bell Telephone Laboratories, Incorporated | Speaker identification system using word recognition templates |
JPS59180599A (ja) | 1983-03-31 | 1984-10-13 | 日本電気ホームエレクトロニクス株式会社 | 車載用音声認識制御装置 |
JPS59170599A (ja) | 1983-12-07 | 1984-09-26 | Ishikawajima Harima Heavy Ind Co Ltd | 低温液体用タンク |
US5659665A (en) | 1994-12-08 | 1997-08-19 | Lucent Technologies Inc. | Method and apparatus for including speech recognition capabilities in a computer system |
JP3674990B2 (ja) | 1995-08-21 | 2005-07-27 | セイコーエプソン株式会社 | 音声認識対話装置および音声認識対話処理方法 |
US6023676A (en) | 1996-12-12 | 2000-02-08 | Dspc Israel, Ltd. | Keyword recognition system and method |
SE511418C2 (sv) | 1997-03-13 | 1999-09-27 | Telia Ab | Metod för talarverifiering/identifiering via modellering av typiska icke-typiska egenskaper. |
US6076055A (en) | 1997-05-27 | 2000-06-13 | Ameritech | Speaker verification method |
US5897616A (en) | 1997-06-11 | 1999-04-27 | International Business Machines Corporation | Apparatus and methods for speaker verification/identification/classification employing non-acoustic and/or acoustic models and databases |
JPH1152976A (ja) | 1997-07-29 | 1999-02-26 | Nec Home Electron Ltd | 音声認識装置 |
JP3524370B2 (ja) | 1998-02-19 | 2004-05-10 | 富士通テン株式会社 | 音声起動システム |
US6141644A (en) | 1998-09-04 | 2000-10-31 | Matsushita Electric Industrial Co., Ltd. | Speaker verification and speaker identification based on eigenvoices |
US6744860B1 (en) | 1998-12-31 | 2004-06-01 | Bell Atlantic Network Services | Methods and apparatus for initiating a voice-dialing operation |
US6671672B1 (en) | 1999-03-30 | 2003-12-30 | Nuance Communications | Voice authentication system having cognitive recall mechanism for password verification |
US6408272B1 (en) | 1999-04-12 | 2002-06-18 | General Magic, Inc. | Distributed voice user interface |
JP3357629B2 (ja) | 1999-04-26 | 2002-12-16 | 旭化成株式会社 | 設備制御システム |
DE10015960C2 (de) | 2000-03-30 | 2003-01-16 | Micronas Munich Gmbh | Spracherkennungsverfahren und Spracherkennungsvorrichtung |
US6567775B1 (en) | 2000-04-26 | 2003-05-20 | International Business Machines Corporation | Fusion of audio and video based speaker identification for multimedia information access |
US6826159B1 (en) | 2000-05-24 | 2004-11-30 | Cisco Technology, Inc. | System and method for providing speaker identification in a conference call |
EP1168736A1 (en) | 2000-06-30 | 2002-01-02 | Alcatel | Telecommunication system and method with a speech recognizer |
US7016833B2 (en) | 2000-11-21 | 2006-03-21 | The Regents Of The University Of California | Speaker verification system using acoustic data and non-acoustic data |
US6973426B1 (en) | 2000-12-29 | 2005-12-06 | Cisco Technology, Inc. | Method and apparatus for performing speaker verification based on speaker independent recognition of commands |
US6701293B2 (en) | 2001-06-13 | 2004-03-02 | Intel Corporation | Combining N-best lists from multiple speech recognizers |
KR100552468B1 (ko) * | 2001-07-19 | 2006-02-15 | 삼성전자주식회사 | 음성인식에 따른 오동작을 방지 및 음성인식율을 향상 할수 있는 전자기기 및 방법 |
JP4207445B2 (ja) | 2002-03-28 | 2009-01-14 | セイコーエプソン株式会社 | 付加情報埋め込み方法 |
JP4224250B2 (ja) | 2002-04-17 | 2009-02-12 | パイオニア株式会社 | 音声認識装置、音声認識方法および音声認識プログラム |
US20030231746A1 (en) | 2002-06-14 | 2003-12-18 | Hunter Karla Rae | Teleconference speaker identification |
TW200409525A (en) | 2002-11-26 | 2004-06-01 | Lite On Technology Corp | Voice identification method for cellular phone and cellular phone with voiceprint password |
EP1429314A1 (en) | 2002-12-13 | 2004-06-16 | Sony International (Europe) GmbH | Correction of energy as input feature for speech processing |
US7222072B2 (en) | 2003-02-13 | 2007-05-22 | Sbc Properties, L.P. | Bio-phonetic multi-phrase speaker identity verification |
US8290603B1 (en) | 2004-06-05 | 2012-10-16 | Sonos, Inc. | User interfaces for controlling and manipulating groupings in a multi-zone media system |
US7571014B1 (en) | 2004-04-01 | 2009-08-04 | Sonos, Inc. | Method and apparatus for controlling multimedia players in a multi-zone system |
US20070198262A1 (en) | 2003-08-20 | 2007-08-23 | Mindlin Bernardo G | Topological voiceprints for speaker identification |
US20050165607A1 (en) | 2004-01-22 | 2005-07-28 | At&T Corp. | System and method to disambiguate and clarify user intention in a spoken dialog system |
JP2005338454A (ja) | 2004-05-27 | 2005-12-08 | Toshiba Tec Corp | 音声対話装置 |
US8214447B2 (en) | 2004-06-08 | 2012-07-03 | Bose Corporation | Managing an audio network |
US7720012B1 (en) | 2004-07-09 | 2010-05-18 | Arrowhead Center, Inc. | Speaker identification in the presence of packet losses |
US8412521B2 (en) | 2004-08-20 | 2013-04-02 | Multimodal Technologies, Llc | Discriminative training of document transcription system |
US8521529B2 (en) | 2004-10-18 | 2013-08-27 | Creative Technology Ltd | Method for segmenting audio signals |
KR100679043B1 (ko) | 2005-02-15 | 2007-02-05 | 삼성전자주식회사 | 음성 대화 인터페이스 장치 및 방법 |
US8041570B2 (en) | 2005-05-31 | 2011-10-18 | Robert Bosch Corporation | Dialogue management using scripts |
US8709018B2 (en) | 2005-09-16 | 2014-04-29 | Applied Medical Technology, Inc. | Non-balloon low profile feed device with insertion/removal tool |
US7603275B2 (en) | 2005-10-31 | 2009-10-13 | Hitachi, Ltd. | System, method and computer program product for verifying an identity using voiced to unvoiced classifiers |
KR100711094B1 (ko) | 2005-11-29 | 2007-04-27 | 삼성전자주식회사 | 분산 통신 환경에서의 이동체들 간의 자원 할당 방법 |
JP2006227634A (ja) | 2006-03-29 | 2006-08-31 | Seiko Epson Corp | 音声認識を用いた機器制御方法および音声認識を用いた機器制御システムならびに音声認識を用いた機器制御プログラムを記録した記録媒体 |
CN1996847B (zh) | 2006-12-27 | 2010-05-19 | 中国科学院上海技术物理研究所 | 基于协作网格的图像及多媒体数据通信与存储系统 |
US8099288B2 (en) | 2007-02-12 | 2012-01-17 | Microsoft Corp. | Text-dependent speaker verification |
US20110060587A1 (en) | 2007-03-07 | 2011-03-10 | Phillips Michael S | Command and control utilizing ancillary information in a mobile voice-to-speech application |
US8838457B2 (en) | 2007-03-07 | 2014-09-16 | Vlingo Corporation | Using results of unstructured language model based speech recognition to control a system-level function of a mobile communications facility |
US20080252595A1 (en) | 2007-04-11 | 2008-10-16 | Marc Boillot | Method and Device for Virtual Navigation and Voice Processing |
US8503686B2 (en) | 2007-05-25 | 2013-08-06 | Aliphcom | Vibration sensor and acoustic voice activity detection system (VADS) for use with electronic systems |
US8385233B2 (en) | 2007-06-12 | 2013-02-26 | Microsoft Corporation | Active speaker identification |
GB2450886B (en) | 2007-07-10 | 2009-12-16 | Motorola Inc | Voice activity detector and a method of operation |
US8528033B2 (en) * | 2007-10-22 | 2013-09-03 | At&T Intellectual Property I, L.P. | Method and system for providing subscription data |
GB2458461A (en) | 2008-03-17 | 2009-09-23 | Kai Yu | Spoken language learning system |
US8805689B2 (en) * | 2008-04-11 | 2014-08-12 | The Nielsen Company (Us), Llc | Methods and apparatus to generate and use content-aware watermarks |
US8504365B2 (en) | 2008-04-11 | 2013-08-06 | At&T Intellectual Property I, L.P. | System and method for detecting synthetic speaker verification |
US8145482B2 (en) | 2008-05-25 | 2012-03-27 | Ezra Daya | Enhancing analysis of test key phrases from acoustic sources with key phrase training models |
KR101056511B1 (ko) | 2008-05-28 | 2011-08-11 | (주)파워보이스 | 실시간 호출명령어 인식을 이용한 잡음환경에서의음성구간검출과 연속음성인식 시스템 |
GB2463231B (en) | 2008-09-01 | 2012-05-30 | Sony Corp | Audio watermarking apparatus and method |
US8676586B2 (en) | 2008-09-16 | 2014-03-18 | Nice Systems Ltd | Method and apparatus for interaction or discourse analytics |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US9922640B2 (en) | 2008-10-17 | 2018-03-20 | Ashwin P Rao | System and method for multimodal utterance detection |
KR101519104B1 (ko) | 2008-10-30 | 2015-05-11 | 삼성전자 주식회사 | 목적음 검출 장치 및 방법 |
US20110066437A1 (en) * | 2009-01-26 | 2011-03-17 | Robert Luff | Methods and apparatus to monitor media exposure using content-aware watermarks |
US8326637B2 (en) | 2009-02-20 | 2012-12-04 | Voicebox Technologies, Inc. | System and method for processing multi-modal device interactions in a natural language voice services environment |
US8209174B2 (en) | 2009-04-17 | 2012-06-26 | Saudi Arabian Oil Company | Speaker verification system |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
CN101923853B (zh) | 2009-06-12 | 2013-01-23 | 华为技术有限公司 | 说话人识别方法、设备和系统 |
US8819172B2 (en) * | 2010-11-04 | 2014-08-26 | Digimarc Corporation | Smartphone-based methods and systems |
US8311838B2 (en) | 2010-01-13 | 2012-11-13 | Apple Inc. | Devices and methods for identifying a prompt corresponding to a voice input in a sequence of prompts |
US8626511B2 (en) | 2010-01-22 | 2014-01-07 | Google Inc. | Multi-dimensional disambiguation of voice commands |
KR101672212B1 (ko) | 2010-06-15 | 2016-11-04 | 엘지전자 주식회사 | 휴대 단말기 및 그 동작 방법 |
US8719018B2 (en) | 2010-10-25 | 2014-05-06 | Lockheed Martin Corporation | Biometric speaker identification |
EP2494545A4 (en) | 2010-12-24 | 2012-11-21 | Huawei Tech Co Ltd | METHOD AND DEVICE FOR DETECTING LANGUAGE ACTIVITIES |
US9196028B2 (en) * | 2011-09-23 | 2015-11-24 | Digimarc Corporation | Context-based smartphone sensor logic |
US9294869B2 (en) * | 2013-03-13 | 2016-03-22 | Aliphcom | Methods, systems and apparatus to affect RF transmission from a non-linked wireless client |
US9159324B2 (en) | 2011-07-01 | 2015-10-13 | Qualcomm Incorporated | Identifying people that are proximate to a mobile device user via social graphs, speech models, and user context |
WO2013012112A1 (ko) * | 2011-07-21 | 2013-01-24 | 엘지전자 주식회사 | 쿠폰 검색을 수행하는 전자 기기 및 소셜 커머스 서버 |
US8660847B2 (en) | 2011-09-02 | 2014-02-25 | Microsoft Corporation | Integrated local and cloud based speech recognition |
US8340975B1 (en) | 2011-10-04 | 2012-12-25 | Theodore Alfred Rosenberger | Interactive speech recognition device and system for hands-free building control |
US9031847B2 (en) | 2011-11-15 | 2015-05-12 | Microsoft Technology Licensing, Llc | Voice-controlled camera operations |
EP2783365B1 (en) | 2011-11-21 | 2018-02-21 | Robert Bosch GmbH | Method and system for adapting grammars in hybrid speech recognition engines for enhancing local speech recognition performance |
US8825020B2 (en) | 2012-01-12 | 2014-09-02 | Sensory, Incorporated | Information access and device control using mobile phones and audio in the home environment |
US9536528B2 (en) | 2012-07-03 | 2017-01-03 | Google Inc. | Determining hotword suitability |
JP6131537B2 (ja) | 2012-07-04 | 2017-05-24 | セイコーエプソン株式会社 | 音声認識システム、音声認識プログラム、記録媒体及び音声認識方法 |
TWI474317B (zh) | 2012-07-06 | 2015-02-21 | Realtek Semiconductor Corp | 訊號處理裝置以及訊號處理方法 |
US8983836B2 (en) | 2012-09-26 | 2015-03-17 | International Business Machines Corporation | Captioning using socially derived acoustic profiles |
US9401153B2 (en) * | 2012-10-15 | 2016-07-26 | Digimarc Corporation | Multi-mode audio recognition and auxiliary data encoding and decoding |
US9305559B2 (en) | 2012-10-15 | 2016-04-05 | Digimarc Corporation | Audio watermark encoding with reversing polarity and pairwise embedding |
US8996372B1 (en) | 2012-10-30 | 2015-03-31 | Amazon Technologies, Inc. | Using adaptation data with cloud-based speech recognition |
CN104641410A (zh) * | 2012-11-30 | 2015-05-20 | 日立麦克赛尔株式会社 | 影像显示装置,及其设定变更方法,设定变更程序 |
FR3000632A1 (fr) * | 2012-12-28 | 2014-07-04 | Thomson Licensing | Procede d'affichage de donnees dans un reseau et dispositif mobile associe |
EP2760015A1 (en) * | 2013-01-23 | 2014-07-30 | BlackBerry Limited | Event-triggered hands-free multitasking for media playback |
US9530409B2 (en) * | 2013-01-23 | 2016-12-27 | Blackberry Limited | Event-triggered hands-free multitasking for media playback |
US9349386B2 (en) | 2013-03-07 | 2016-05-24 | Analog Device Global | System and method for processor wake-up based on sensor data |
US9171450B2 (en) * | 2013-03-08 | 2015-10-27 | Qualcomm Incorporated | Emergency handling system using informative alarm sound |
US9093064B2 (en) * | 2013-03-11 | 2015-07-28 | The Nielsen Company (Us), Llc | Down-mixing compensation for audio watermarking |
US9361885B2 (en) | 2013-03-12 | 2016-06-07 | Nuance Communications, Inc. | Methods and apparatus for detecting a voice command |
US9384754B2 (en) * | 2013-03-12 | 2016-07-05 | Comcast Cable Communications, Llc | Removal of audio noise |
US9312826B2 (en) | 2013-03-13 | 2016-04-12 | Kopin Corporation | Apparatuses and methods for acoustic channel auto-balancing during multi-channel signal extraction |
US8768687B1 (en) | 2013-04-29 | 2014-07-01 | Google Inc. | Machine translation of indirect speech |
US9679053B2 (en) * | 2013-05-20 | 2017-06-13 | The Nielsen Company (Us), Llc | Detecting media watermarks in magnetic field data |
US9285886B2 (en) * | 2013-06-24 | 2016-03-15 | Sonos, Inc. | Intelligent amplifier activation |
WO2015025330A1 (en) | 2013-08-21 | 2015-02-26 | Kale Aaditya Kishore | A system to enable user to interact with an electronic processing device using voice of the user |
US9286943B2 (en) * | 2013-08-23 | 2016-03-15 | International Business Machines Corporation | Enhancing karaoke systems utilizing audience sentiment feedback and audio watermarking |
JP6502249B2 (ja) | 2013-08-29 | 2019-04-17 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 音声認識方法及び音声認識装置 |
US8775191B1 (en) | 2013-11-13 | 2014-07-08 | Google Inc. | Efficient utterance-specific endpointer triggering for always-on hotwording |
US9373321B2 (en) | 2013-12-02 | 2016-06-21 | Cypress Semiconductor Corporation | Generation of wake-up words |
US8918326B1 (en) * | 2013-12-05 | 2014-12-23 | The Telos Alliance | Feedback and simulation regarding detectability of a watermark message |
WO2015100430A1 (en) * | 2013-12-24 | 2015-07-02 | Digimarc Corporation | Methods and system for cue detection from audio input, low-power data processing and related arrangements |
US8938394B1 (en) | 2014-01-09 | 2015-01-20 | Google Inc. | Audio triggers based on context |
CN104978968A (zh) | 2014-04-11 | 2015-10-14 | 鸿富锦精密工业(深圳)有限公司 | 水印加载装置及水印加载的方法 |
US10770075B2 (en) * | 2014-04-21 | 2020-09-08 | Qualcomm Incorporated | Method and apparatus for activating application by speech input |
CN104093079B (zh) * | 2014-05-29 | 2015-10-07 | 腾讯科技(深圳)有限公司 | 基于多媒体节目的交互方法、终端、服务器和系统 |
US9357320B2 (en) | 2014-06-24 | 2016-05-31 | Harmon International Industries, Inc. | Headphone listening apparatus |
KR102208477B1 (ko) * | 2014-06-30 | 2021-01-27 | 삼성전자주식회사 | 마이크 운용 방법 및 이를 지원하는 전자 장치 |
US9368124B2 (en) | 2014-08-12 | 2016-06-14 | Tata Consultancy Services Ltd. | Computer implemented system for audio watermarking |
US9424841B2 (en) | 2014-10-09 | 2016-08-23 | Google Inc. | Hotword detection on multiple devices |
US9318107B1 (en) | 2014-10-09 | 2016-04-19 | Google Inc. | Hotword detection on multiple devices |
KR20160043267A (ko) | 2014-10-13 | 2016-04-21 | 한국전자통신연구원 | 음향 채널 왜곡에 강인한 워터마크 전송 장치 및 방법 |
KR102299330B1 (ko) * | 2014-11-26 | 2021-09-08 | 삼성전자주식회사 | 음성 인식 방법 및 그 전자 장치 |
US9418395B1 (en) * | 2014-12-31 | 2016-08-16 | The Nielsen Company (Us), Llc | Power efficient detection of watermarks in media signals |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US10153113B2 (en) * | 2015-08-31 | 2018-12-11 | Deako, Inc. | Systems and methods for occupancy prediction |
US9875081B2 (en) | 2015-09-21 | 2018-01-23 | Amazon Technologies, Inc. | Device selection for providing a response |
US9928840B2 (en) * | 2015-10-16 | 2018-03-27 | Google Llc | Hotword recognition |
US9747926B2 (en) * | 2015-10-16 | 2017-08-29 | Google Inc. | Hotword recognition |
JP6463710B2 (ja) * | 2015-10-16 | 2019-02-06 | グーグル エルエルシー | ホットワード認識 |
KR20170046958A (ko) * | 2015-10-22 | 2017-05-04 | 삼성전자주식회사 | 전자 장치 및 그의 음성 인식을 이용한 기능 실행 방법 |
US20180254042A1 (en) * | 2015-10-23 | 2018-09-06 | Samsung Electronics Co., Ltd. | Electronic device and control method therefor |
US10028023B2 (en) * | 2016-01-20 | 2018-07-17 | Google Llc | Methods and systems for automatic media output based on user proximity |
TWI633425B (zh) * | 2016-03-02 | 2018-08-21 | 美律實業股份有限公司 | 麥克風裝置 |
TWI584270B (zh) * | 2016-06-15 | 2017-05-21 | 瑞昱半導體股份有限公司 | 語音控制系統及其方法 |
US10332513B1 (en) * | 2016-06-27 | 2019-06-25 | Amazon Technologies, Inc. | Voice enablement and disablement of speech processing functionality |
KR102241970B1 (ko) * | 2016-11-07 | 2021-04-20 | 구글 엘엘씨 | 기록된 미디어 핫워드 트리거 억제 |
US10079015B1 (en) * | 2016-12-06 | 2018-09-18 | Amazon Technologies, Inc. | Multi-layer keyword detection |
US10559309B2 (en) * | 2016-12-22 | 2020-02-11 | Google Llc | Collaborative voice controlled devices |
US10902001B1 (en) * | 2017-02-27 | 2021-01-26 | Amazon Technologies, Inc. | Contact presence aggregator |
US10074371B1 (en) * | 2017-03-14 | 2018-09-11 | Amazon Technologies, Inc. | Voice control of remote device by disabling wakeword detection |
US10102855B1 (en) * | 2017-03-30 | 2018-10-16 | Amazon Technologies, Inc. | Embedded instructions for voice user interface |
US10170112B2 (en) | 2017-05-11 | 2019-01-01 | Google Llc | Detecting and suppressing voice queries |
US10242680B2 (en) * | 2017-06-02 | 2019-03-26 | The Nielsen Company (Us), Llc | Methods and apparatus to inspect characteristics of multichannel audio |
US10395650B2 (en) | 2017-06-05 | 2019-08-27 | Google Llc | Recorded media hotword trigger suppression |
JP7202214B2 (ja) | 2019-02-26 | 2023-01-11 | ヤンマーパワーテクノロジー株式会社 | 自動走行システム |
-
2017
- 2017-06-05 US US15/614,213 patent/US10395650B2/en active Active
-
2018
- 2018-03-13 KR KR1020197022907A patent/KR102296238B1/ko active IP Right Grant
- 2018-03-13 EP EP23164851.0A patent/EP4220629A1/en active Pending
- 2018-03-13 CN CN202310618091.4A patent/CN116597836A/zh active Pending
- 2018-03-13 CN CN201880008785.3A patent/CN110214351B/zh active Active
- 2018-03-13 EP EP18714917.4A patent/EP3430618B1/en active Active
- 2018-03-13 JP JP2019538634A patent/JP6750125B2/ja active Active
- 2018-03-13 WO PCT/US2018/022101 patent/WO2018226283A1/en active Application Filing
- 2018-03-13 EP EP20178162.2A patent/EP3723083B1/en active Active
-
2019
- 2019-08-09 US US16/537,033 patent/US11244674B2/en active Active
-
2020
- 2020-08-11 JP JP2020135793A patent/JP7114660B2/ja active Active
-
2022
- 2022-01-13 US US17/647,863 patent/US11798543B2/en active Active
- 2022-07-26 JP JP2022118728A patent/JP7461416B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014103099A1 (ja) * | 2012-12-28 | 2014-07-03 | パナソニック株式会社 | 音声認識付き機器及び音声認識方法 |
US9548053B1 (en) * | 2014-09-19 | 2017-01-17 | Amazon Technologies, Inc. | Audible command filtering |
Also Published As
Publication number | Publication date |
---|---|
CN110214351A (zh) | 2019-09-06 |
US11798543B2 (en) | 2023-10-24 |
US20200035232A1 (en) | 2020-01-30 |
EP3430618B1 (en) | 2020-07-15 |
EP4220629A1 (en) | 2023-08-02 |
JP2022136197A (ja) | 2022-09-15 |
US20180350356A1 (en) | 2018-12-06 |
US11244674B2 (en) | 2022-02-08 |
EP3723083B1 (en) | 2023-05-10 |
JP6750125B2 (ja) | 2020-09-02 |
CN116597836A (zh) | 2023-08-15 |
EP3430618A1 (en) | 2019-01-23 |
US20220139387A1 (en) | 2022-05-05 |
EP3723083A1 (en) | 2020-10-14 |
US10395650B2 (en) | 2019-08-27 |
JP2020190752A (ja) | 2020-11-26 |
WO2018226283A1 (en) | 2018-12-13 |
KR20190103308A (ko) | 2019-09-04 |
KR102296238B1 (ko) | 2021-08-31 |
CN110214351B (zh) | 2023-05-30 |
JP7461416B2 (ja) | 2024-04-03 |
JP7114660B2 (ja) | 2022-08-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6750125B2 (ja) | 記録メディアのホットワードトリガ抑制 | |
US11887603B2 (en) | Hotword detection on multiple devices | |
JP7395509B2 (ja) | ホットワード抑制 | |
US10978070B2 (en) | Speaker diarization | |
US11553051B2 (en) | Pairing a voice-enabled device with a display device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190917 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190917 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20190917 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20200120 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200302 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200508 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200713 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200812 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6750125 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |