JP2022136197A - 記録メディアのホットワードトリガ抑制 - Google Patents
記録メディアのホットワードトリガ抑制 Download PDFInfo
- Publication number
- JP2022136197A JP2022136197A JP2022118728A JP2022118728A JP2022136197A JP 2022136197 A JP2022136197 A JP 2022136197A JP 2022118728 A JP2022118728 A JP 2022118728A JP 2022118728 A JP2022118728 A JP 2022118728A JP 2022136197 A JP2022136197 A JP 2022136197A
- Authority
- JP
- Japan
- Prior art keywords
- audio
- audio data
- watermark
- user device
- computing device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000001629 suppression Effects 0.000 title 1
- 238000000034 method Methods 0.000 claims abstract description 60
- 230000009471 action Effects 0.000 claims abstract description 48
- 230000015654 memory Effects 0.000 claims description 41
- 238000004891 communication Methods 0.000 claims description 19
- 238000007493 shaping process Methods 0.000 claims description 3
- 238000001228 spectrum Methods 0.000 claims description 3
- 230000008929 regeneration Effects 0.000 claims 2
- 238000011069 regeneration method Methods 0.000 claims 2
- 238000004590 computer program Methods 0.000 abstract description 6
- 230000008569 process Effects 0.000 description 26
- 239000000872 buffer Substances 0.000 description 10
- 241000282412 Homo Species 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 4
- 238000003058 natural language processing Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 241000287828 Gallus gallus Species 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 239000004984 smart glass Substances 0.000 description 2
- 230000026676 system process Effects 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 206010011878 Deafness Diseases 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000010411 cooking Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 208000016354 hearing loss disease Diseases 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/018—Audio watermarking, i.e. embedding inaudible data in the audio signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
Description
122 オーディオサブシステム
124 ホットワーダ
126 ホットワーダ
128 オーディオ透かし識別子
130 オーディオ透かし識別子
140 オーディオ透かし比較器
142 オーディオ透かし
144 オーディオ透かし比較器
146 オーディオ透かし
148 ユーザインタフェース生成器
150 ユーザインタフェース生成器
152 ユーザ設定
156 位置検出器
158 デバイス識別子
160 デバイス識別
162 ユーザ識別子
166 スピーチ認識器
168 スピーチ認識器状態
170 オーディオ透かしログ
172 スピーチ認識器
174 スピーチ認識器状態
176 位置検出器
178 デバイス識別子
180 デバイス識別
182 ユーザ識別子
186 ユーザ設定
188 オーディオ透かしログ
300 コンピューティングデバイス
302 プロセッサ
304 メモリ
306 ストレージデバイス
308 高速インタフェース
310 高速拡張ポート
312 低速インタフェース
314 低速拡張ポート
316 ディスプレイ
320 サーバ
322 ラップトップコンピュータ
324 ラックサーバシステ
350 モバイルコンピューティングデバイス
352 プロセッサ
354 タッチ式ディスプレイ
356 ディスプレイインタフェース
358 制御インタフェース
360 オーディオコーデック
362 外部インタフェース
364 メモリ
366 通信インタフェース
368 トランシーバ
370 GPS受信モジュール
372 拡張インタフェース
374 拡張メモリ
380 携帯電話
382 スマートフォン
Claims (20)
- ユーザデバイスのデータ処理ハードウェア上で実行される際に、
前記ユーザデバイスがスリープモードにある間に、前記ユーザデバイスのマイクロフォンによって捕捉されたオーディオデータを受信し、前記オーディオデータは、前記ユーザデバイスの近傍にあるオーディオソースから出力された1個のメディアコンテンツの再生に対応するステップ;
前記ユーザデバイスがスリープモードにある間に、前記オーディオデータを処理して、前記オーディオデータに符号化されたオーディオ透かしの対応するビットストリームを決定するステップ;及び、
前記オーディオデータに符号化されたオーディオ透かしの決定された前記対応するビットストリームに基づいて、一致するオーディオ透かしを識別するために前記オーディオ透かしデータベースにアクセスせずに、前記オーディオデータに対して音声認識を行うことを回避することを決定するステップ;
を含む動作を前記データ処理ハードウェアに実行させることを特徴とするコンピュータ実装方法。 - 前記オーディオデータは、ホットワードに先行するコマンドの発話からなることを特徴とする請求項1に記載のコンピュータ実装方法。
- 前記オーディオデータに対して音声認識を行うことを回避することを決定するステップは、前記コマンドの前記発話に対応する受信した前記オーディオデータの部分に対して音声認識を行うことを回避するステップを含むことを特徴とする請求項2に記載のコンピュータ実装方法。
- 前記オーディオ透かしは、前記ホットワードを含む前記オーディオデータの一部に符号化されることを特徴とする請求項2に記載のコンピュータ実装方法。
- 前記動作は、前記オーディオデータに符号化された前記オーディオ透かしの対応するビットストリームを決定するために前記オーディオデータを処理する前に、受信した前記オーディオデータが前記ホットワードを含むことを決定するステップをさらに含むことを特徴とする請求項2に記載のコンピュータ実装方法。
- 前記受信した前記オーディオデータが前記ホットワードを含むことを決定するステップは、
音声認識を行うことなく、前記オーディオデータが前記ホットワードを含む可能性を示すホットワード信頼度スコアを計算するステップ;及び、
前記ホットワード信頼度スコアがホットワード信頼度スコアしきい値を満たすと決定するステップ;
を含むことを特徴とする請求項5に記載のコンピュータ実装方法。 - 前記ユーザデバイスがスリープ状態にある間に、前記オーディオデータを処理するステップは、前記オーディオデータを処理して、スペクトル拡散シェーピングタイプの透かしを検出することによって前記オーディオデータに符号化されたオーディオ透かしを識別するステップをさらに含むことを特徴とする請求項1に記載のコンピュータ実装方法。
- 前記ユーザデバイスは、前記オーディオデータに対して音声認識を実行することを回避することを決定した後、前記スリープモードのままであることを特徴とする請求項1に記載のコンピュータ実装方法。
- 前記動作が、
前記1個のメディアコンテンツの再生に対応する前記オーディオデータのオーディオ源を識別するために、前記オーディオ透かしを分析するステップ;
をさらに含み、
前記オーディオデータに対して音声認識を実行することを回避することを決定するステップが、前記1個のメディアコンテンツの再生に対応する前記オーディオデータのオーディオ源にさらに基づいていることを特徴する請求項1に記載のコンピュータ実装方法。 - 前記動作は、前記1個のメディアコンテンツの再生に対応する前記オーディオデータの前記オーディオ源を示すためにログファイルを更新するステップをさらに含むことを特徴とする請求項9に記載のコンピュータ実装方法。
- ユーザデバイスであって、
データ処理ハードウェア;及び、
前記データ処理ハードウェアと通信し、命令を記憶するメモリハードウェアであって、前記データ処理ハードウェア上で実行される際に、
前記ユーザデバイスがスリープモードにある間に、前記ユーザデバイスのマイクロフォンによって捕捉されたオーディオデータを受信し、前記オーディオデータは、前記ユーザデバイスの近傍にあるオーディオソースから出力された1個のメディアコンテンツの再生に対応すること;
前記ユーザデバイスがスリープモードにある間に、前記オーディオデータを処理して、前記オーディオデータに符号化されたオーディオ透かしの対応するビットストリームを決定すること;及び
前記オーディオデータに符号化されたオーディオ透かしの決定された前記対応するビットストリームに基づいて、一致するオーディオ透かしを識別するために前記オーディオ透かしデータベースにアクセスせずに、前記オーディオデータに対して音声認識を行うことを回避することを決定すること;
を含む動作を前記データ処理ハードウェアに実行させるメモリハードウェア;
を備えることを特徴とするユーザデバイス。 - 前記オーディオデータは、ホットワードに先行するコマンドの発話からなることを特徴とする請求項11に記載のユーザデバイス。
- 前記オーディオデータに対して音声認識を行うことを回避することを決定することは、前記コマンドの前記発話に対応する受信した前記オーディオデータの部分に対して音声認識を行うことを回避することを含むことを特徴とする請求項12に記載のユーザデバイス。
- 前記オーディオ透かしは、前記ホットワードを含む前記オーディオデータの一部に符号化されることを特徴とする請求項12に記載のユーザデバイス。
- 前記動作は、前記オーディオデータに符号化された前記オーディオ透かしの対応するビットストリームを決定するために前記オーディオデータを処理する前に、受信した前記オーディオデータが前記ホットワードを含むことを決定することをさらに含むことを特徴とする請求項12に記載のユーザデバイス。
- 前記受信した前記オーディオデータが前記ホットワードを含むことを決定することは、
音声認識を行うことなく、前記オーディオデータが前記ホットワードを含む可能性を示すホットワード信頼度スコアを計算すること;及び、
前記ホットワード信頼度スコアがホットワード信頼度スコアしきい値を満たすと決定すること;
を含むことを特徴とする請求項15に記載のユーザデバイス。 - 前記ユーザデバイスがスリープ状態にある間に、前記オーディオデータを処理することは、前記オーディオデータを処理して、スペクトル拡散シェーピングタイプの透かしを検出することによって前記オーディオデータに符号化されたオーディオ透かしを識別することをさらに含むことを特徴とする請求項11に記載のユーザデバイス。
- 前記ユーザデバイスは、前記オーディオデータに対して音声認識を実行することを回避することを決定した後、前記スリープモードのままであることを特徴とする請求項11に記載のユーザデバイス。
- 前記動作が、
前記1個のメディアコンテンツの再生に対応する前記オーディオデータのオーディオ源を識別するために、前記オーディオ透かしを分析すること;
をさらに含み、
前記オーディオデータに対して音声認識を実行することを回避することを決定することが、前記1個のメディアコンテンツの再生に対応する前記オーディオデータのオーディオ源にさらに基づいていることを特徴する請求項11に記載のユーザデバイス。 - 前記動作は、前記1個のメディアコンテンツの再生に対応する前記オーディオデータの前記オーディオ源を示すためにログファイルを更新することをさらに含むことを特徴とする請求項19に記載のユーザデバイス。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/614,213 | 2017-06-05 | ||
US15/614,213 US10395650B2 (en) | 2017-06-05 | 2017-06-05 | Recorded media hotword trigger suppression |
JP2020135793A JP7114660B2 (ja) | 2017-06-05 | 2020-08-11 | 記録メディアのホットワードトリガ抑制 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020135793A Division JP7114660B2 (ja) | 2017-06-05 | 2020-08-11 | 記録メディアのホットワードトリガ抑制 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022136197A true JP2022136197A (ja) | 2022-09-15 |
JP7461416B2 JP7461416B2 (ja) | 2024-04-03 |
Family
ID=61837845
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019538634A Active JP6750125B2 (ja) | 2017-06-05 | 2018-03-13 | 記録メディアのホットワードトリガ抑制 |
JP2020135793A Active JP7114660B2 (ja) | 2017-06-05 | 2020-08-11 | 記録メディアのホットワードトリガ抑制 |
JP2022118728A Active JP7461416B2 (ja) | 2017-06-05 | 2022-07-26 | 記録メディアのホットワードトリガ抑制 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019538634A Active JP6750125B2 (ja) | 2017-06-05 | 2018-03-13 | 記録メディアのホットワードトリガ抑制 |
JP2020135793A Active JP7114660B2 (ja) | 2017-06-05 | 2020-08-11 | 記録メディアのホットワードトリガ抑制 |
Country Status (6)
Country | Link |
---|---|
US (3) | US10395650B2 (ja) |
EP (3) | EP4220629A1 (ja) |
JP (3) | JP6750125B2 (ja) |
KR (1) | KR102296238B1 (ja) |
CN (2) | CN116597836A (ja) |
WO (1) | WO2018226283A1 (ja) |
Families Citing this family (58)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9772817B2 (en) | 2016-02-22 | 2017-09-26 | Sonos, Inc. | Room-corrected voice detection |
US10264030B2 (en) | 2016-02-22 | 2019-04-16 | Sonos, Inc. | Networked microphone device control |
US10509626B2 (en) | 2016-02-22 | 2019-12-17 | Sonos, Inc | Handling of loss of pairing between networked devices |
US10095470B2 (en) | 2016-02-22 | 2018-10-09 | Sonos, Inc. | Audio response playback |
US9978390B2 (en) | 2016-06-09 | 2018-05-22 | Sonos, Inc. | Dynamic player selection for audio signal processing |
US10134399B2 (en) | 2016-07-15 | 2018-11-20 | Sonos, Inc. | Contextualization of voice inputs |
US10115400B2 (en) | 2016-08-05 | 2018-10-30 | Sonos, Inc. | Multiple voice services |
US10181323B2 (en) | 2016-10-19 | 2019-01-15 | Sonos, Inc. | Arbitration-based voice recognition |
US10347247B2 (en) | 2016-12-30 | 2019-07-09 | Google Llc | Modulation of packetized audio signals |
US10395650B2 (en) | 2017-06-05 | 2019-08-27 | Google Llc | Recorded media hotword trigger suppression |
US10475449B2 (en) | 2017-08-07 | 2019-11-12 | Sonos, Inc. | Wake-word detection suppression |
CA3071560C (en) * | 2017-08-10 | 2024-01-23 | Sony Corporation | Transmission apparatus, transmission method, reception apparatus, and reception method |
US10048930B1 (en) | 2017-09-08 | 2018-08-14 | Sonos, Inc. | Dynamic computation of system response volume |
SG11202001429XA (en) * | 2017-09-15 | 2020-04-29 | Sony Corp | Information processing apparatus and information processing method |
US10482868B2 (en) | 2017-09-28 | 2019-11-19 | Sonos, Inc. | Multi-channel acoustic echo cancellation |
US10051366B1 (en) | 2017-09-28 | 2018-08-14 | Sonos, Inc. | Three-dimensional beam forming with a microphone array |
US10466962B2 (en) | 2017-09-29 | 2019-11-05 | Sonos, Inc. | Media playback system with voice assistance |
US10276175B1 (en) | 2017-11-28 | 2019-04-30 | Google Llc | Key phrase detection with audio watermarking |
US10818290B2 (en) * | 2017-12-11 | 2020-10-27 | Sonos, Inc. | Home graph |
CN108172224B (zh) * | 2017-12-19 | 2019-08-27 | 浙江大学 | 基于机器学习的防御无声指令控制语音助手的方法 |
US11175880B2 (en) | 2018-05-10 | 2021-11-16 | Sonos, Inc. | Systems and methods for voice-assisted media content selection |
US10692496B2 (en) * | 2018-05-22 | 2020-06-23 | Google Llc | Hotword suppression |
US10959029B2 (en) | 2018-05-25 | 2021-03-23 | Sonos, Inc. | Determining and adapting to changes in microphone performance of playback devices |
US11076035B2 (en) | 2018-08-28 | 2021-07-27 | Sonos, Inc. | Do not disturb feature for audio notifications |
US11024331B2 (en) | 2018-09-21 | 2021-06-01 | Sonos, Inc. | Voice detection optimization using sound metadata |
US10811015B2 (en) * | 2018-09-25 | 2020-10-20 | Sonos, Inc. | Voice detection optimization based on selected voice assistant service |
US11100923B2 (en) | 2018-09-28 | 2021-08-24 | Sonos, Inc. | Systems and methods for selective wake word detection using neural network models |
US10692518B2 (en) | 2018-09-29 | 2020-06-23 | Sonos, Inc. | Linear filtering for noise-suppressed speech detection via multiple network microphone devices |
US11089348B2 (en) * | 2018-10-03 | 2021-08-10 | At&T Intellectual Property I, L.P. | Method and apparatus for determining the accuracy of targeted advertising |
US11227310B2 (en) * | 2018-10-16 | 2022-01-18 | At&T Intellectual Property I, L.P. | Method and apparatus for targeted advertising selection |
US11210699B2 (en) * | 2018-10-18 | 2021-12-28 | At&T Intellectual Property I, L.P. | Method and apparatus for targeted advertising |
US11899519B2 (en) | 2018-10-23 | 2024-02-13 | Sonos, Inc. | Multiple stage network microphone device with reduced power consumption and processing load |
US11183183B2 (en) | 2018-12-07 | 2021-11-23 | Sonos, Inc. | Systems and methods of operating media playback systems having multiple voice assistant services |
US11132989B2 (en) | 2018-12-13 | 2021-09-28 | Sonos, Inc. | Networked microphone devices, systems, and methods of localized arbitration |
US10602268B1 (en) | 2018-12-20 | 2020-03-24 | Sonos, Inc. | Optimization of network microphone devices using noise classification |
US11522619B2 (en) | 2019-03-08 | 2022-12-06 | Rovi Guides, Inc. | Frequency pairing for device synchronization |
US11011169B2 (en) | 2019-03-08 | 2021-05-18 | ROVl GUIDES, INC. | Inaudible frequency transmission in interactive content |
US11074914B2 (en) | 2019-03-08 | 2021-07-27 | Rovi Guides, Inc. | Automated query detection in interactive content |
US11120794B2 (en) | 2019-05-03 | 2021-09-14 | Sonos, Inc. | Voice assistant persistence across multiple network microphone devices |
US10956123B2 (en) | 2019-05-08 | 2021-03-23 | Rovi Guides, Inc. | Device and query management system |
US11810575B2 (en) * | 2019-06-12 | 2023-11-07 | Lg Electronics Inc. | Artificial intelligence robot for providing voice recognition function and method of operating the same |
US10871943B1 (en) | 2019-07-31 | 2020-12-22 | Sonos, Inc. | Noise classification for event detection |
US11189286B2 (en) | 2019-10-22 | 2021-11-30 | Sonos, Inc. | VAS toggle based on device orientation |
WO2021100555A1 (ja) * | 2019-11-21 | 2021-05-27 | ソニーグループ株式会社 | 情報処理システム、情報処理装置、情報処理方法及びプログラム |
US11200900B2 (en) | 2019-12-20 | 2021-12-14 | Sonos, Inc. | Offline voice control |
US11562740B2 (en) | 2020-01-07 | 2023-01-24 | Sonos, Inc. | Voice verification for media playback |
US11556307B2 (en) | 2020-01-31 | 2023-01-17 | Sonos, Inc. | Local voice data processing |
US11308958B2 (en) | 2020-02-07 | 2022-04-19 | Sonos, Inc. | Localized wakeword verification |
US11170793B2 (en) * | 2020-02-13 | 2021-11-09 | Adobe Inc. | Secure audio watermarking based on neural networks |
KR102348091B1 (ko) | 2020-04-01 | 2022-01-10 | 한국원자력연구원 | 증기 발생기 사고 대처 시스템 |
RU2767962C2 (ru) | 2020-04-13 | 2022-03-22 | Общество С Ограниченной Ответственностью «Яндекс» | Способ и система для распознавания воспроизведенного речевого фрагмента |
US11308962B2 (en) | 2020-05-20 | 2022-04-19 | Sonos, Inc. | Input detection windowing |
US11482224B2 (en) | 2020-05-20 | 2022-10-25 | Sonos, Inc. | Command keywords with input detection windowing |
US11776549B2 (en) * | 2020-11-06 | 2023-10-03 | Google Llc | Multi-factor audio watermarking |
US11984123B2 (en) | 2020-11-12 | 2024-05-14 | Sonos, Inc. | Network device interaction by range |
CN112767917B (zh) * | 2020-12-31 | 2022-05-17 | 科大讯飞股份有限公司 | 语音识别方法、装置及存储介质 |
US11483427B1 (en) | 2021-04-28 | 2022-10-25 | Zoom Video Communications, Inc. | Call recording authentication |
US11915711B2 (en) | 2021-07-20 | 2024-02-27 | Direct Cursus Technology L.L.C | Method and system for augmenting audio signals |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003295894A (ja) * | 2002-03-28 | 2003-10-15 | Seiko Epson Corp | 付加情報埋め込み方法および付加情報読み出し方法ならびに音声認識システム |
JP2005338454A (ja) * | 2004-05-27 | 2005-12-08 | Toshiba Tec Corp | 音声対話装置 |
US20170083285A1 (en) * | 2015-09-21 | 2017-03-23 | Amazon Technologies, Inc. | Device selection for providing a response |
JP2017513037A (ja) * | 2014-10-09 | 2017-05-25 | グーグル インコーポレイテッド | 複数のデバイスにおけるホットワードの検出 |
Family Cites Families (143)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4363102A (en) | 1981-03-27 | 1982-12-07 | Bell Telephone Laboratories, Incorporated | Speaker identification system using word recognition templates |
JPS59180599A (ja) | 1983-03-31 | 1984-10-13 | 日本電気ホームエレクトロニクス株式会社 | 車載用音声認識制御装置 |
JPS59170599A (ja) | 1983-12-07 | 1984-09-26 | Ishikawajima Harima Heavy Ind Co Ltd | 低温液体用タンク |
US5659665A (en) | 1994-12-08 | 1997-08-19 | Lucent Technologies Inc. | Method and apparatus for including speech recognition capabilities in a computer system |
JP3674990B2 (ja) | 1995-08-21 | 2005-07-27 | セイコーエプソン株式会社 | 音声認識対話装置および音声認識対話処理方法 |
US6023676A (en) | 1996-12-12 | 2000-02-08 | Dspc Israel, Ltd. | Keyword recognition system and method |
SE511418C2 (sv) | 1997-03-13 | 1999-09-27 | Telia Ab | Metod för talarverifiering/identifiering via modellering av typiska icke-typiska egenskaper. |
US6076055A (en) | 1997-05-27 | 2000-06-13 | Ameritech | Speaker verification method |
US5897616A (en) | 1997-06-11 | 1999-04-27 | International Business Machines Corporation | Apparatus and methods for speaker verification/identification/classification employing non-acoustic and/or acoustic models and databases |
JPH1152976A (ja) | 1997-07-29 | 1999-02-26 | Nec Home Electron Ltd | 音声認識装置 |
JP3524370B2 (ja) | 1998-02-19 | 2004-05-10 | 富士通テン株式会社 | 音声起動システム |
US6141644A (en) | 1998-09-04 | 2000-10-31 | Matsushita Electric Industrial Co., Ltd. | Speaker verification and speaker identification based on eigenvoices |
US6744860B1 (en) | 1998-12-31 | 2004-06-01 | Bell Atlantic Network Services | Methods and apparatus for initiating a voice-dialing operation |
US6671672B1 (en) | 1999-03-30 | 2003-12-30 | Nuance Communications | Voice authentication system having cognitive recall mechanism for password verification |
US6408272B1 (en) | 1999-04-12 | 2002-06-18 | General Magic, Inc. | Distributed voice user interface |
JP3357629B2 (ja) | 1999-04-26 | 2002-12-16 | 旭化成株式会社 | 設備制御システム |
DE10015960C2 (de) | 2000-03-30 | 2003-01-16 | Micronas Munich Gmbh | Spracherkennungsverfahren und Spracherkennungsvorrichtung |
US6567775B1 (en) | 2000-04-26 | 2003-05-20 | International Business Machines Corporation | Fusion of audio and video based speaker identification for multimedia information access |
US6826159B1 (en) | 2000-05-24 | 2004-11-30 | Cisco Technology, Inc. | System and method for providing speaker identification in a conference call |
EP1168736A1 (en) | 2000-06-30 | 2002-01-02 | Alcatel | Telecommunication system and method with a speech recognizer |
US7016833B2 (en) | 2000-11-21 | 2006-03-21 | The Regents Of The University Of California | Speaker verification system using acoustic data and non-acoustic data |
US6973426B1 (en) | 2000-12-29 | 2005-12-06 | Cisco Technology, Inc. | Method and apparatus for performing speaker verification based on speaker independent recognition of commands |
US6701293B2 (en) | 2001-06-13 | 2004-03-02 | Intel Corporation | Combining N-best lists from multiple speech recognizers |
KR100552468B1 (ko) * | 2001-07-19 | 2006-02-15 | 삼성전자주식회사 | 음성인식에 따른 오동작을 방지 및 음성인식율을 향상 할수 있는 전자기기 및 방법 |
JP4224250B2 (ja) | 2002-04-17 | 2009-02-12 | パイオニア株式会社 | 音声認識装置、音声認識方法および音声認識プログラム |
US20030231746A1 (en) | 2002-06-14 | 2003-12-18 | Hunter Karla Rae | Teleconference speaker identification |
TW200409525A (en) | 2002-11-26 | 2004-06-01 | Lite On Technology Corp | Voice identification method for cellular phone and cellular phone with voiceprint password |
EP1429314A1 (en) | 2002-12-13 | 2004-06-16 | Sony International (Europe) GmbH | Correction of energy as input feature for speech processing |
US7222072B2 (en) | 2003-02-13 | 2007-05-22 | Sbc Properties, L.P. | Bio-phonetic multi-phrase speaker identity verification |
US8290603B1 (en) | 2004-06-05 | 2012-10-16 | Sonos, Inc. | User interfaces for controlling and manipulating groupings in a multi-zone media system |
US7571014B1 (en) | 2004-04-01 | 2009-08-04 | Sonos, Inc. | Method and apparatus for controlling multimedia players in a multi-zone system |
US20070198262A1 (en) | 2003-08-20 | 2007-08-23 | Mindlin Bernardo G | Topological voiceprints for speaker identification |
US20050165607A1 (en) | 2004-01-22 | 2005-07-28 | At&T Corp. | System and method to disambiguate and clarify user intention in a spoken dialog system |
US8214447B2 (en) | 2004-06-08 | 2012-07-03 | Bose Corporation | Managing an audio network |
US7720012B1 (en) | 2004-07-09 | 2010-05-18 | Arrowhead Center, Inc. | Speaker identification in the presence of packet losses |
US8412521B2 (en) | 2004-08-20 | 2013-04-02 | Multimodal Technologies, Llc | Discriminative training of document transcription system |
US8521529B2 (en) | 2004-10-18 | 2013-08-27 | Creative Technology Ltd | Method for segmenting audio signals |
KR100679043B1 (ko) | 2005-02-15 | 2007-02-05 | 삼성전자주식회사 | 음성 대화 인터페이스 장치 및 방법 |
US8041570B2 (en) | 2005-05-31 | 2011-10-18 | Robert Bosch Corporation | Dialogue management using scripts |
US8709018B2 (en) | 2005-09-16 | 2014-04-29 | Applied Medical Technology, Inc. | Non-balloon low profile feed device with insertion/removal tool |
US7603275B2 (en) | 2005-10-31 | 2009-10-13 | Hitachi, Ltd. | System, method and computer program product for verifying an identity using voiced to unvoiced classifiers |
KR100711094B1 (ko) | 2005-11-29 | 2007-04-27 | 삼성전자주식회사 | 분산 통신 환경에서의 이동체들 간의 자원 할당 방법 |
JP2006227634A (ja) | 2006-03-29 | 2006-08-31 | Seiko Epson Corp | 音声認識を用いた機器制御方法および音声認識を用いた機器制御システムならびに音声認識を用いた機器制御プログラムを記録した記録媒体 |
CN1996847B (zh) | 2006-12-27 | 2010-05-19 | 中国科学院上海技术物理研究所 | 基于协作网格的图像及多媒体数据通信与存储系统 |
US8099288B2 (en) | 2007-02-12 | 2012-01-17 | Microsoft Corp. | Text-dependent speaker verification |
US20110060587A1 (en) | 2007-03-07 | 2011-03-10 | Phillips Michael S | Command and control utilizing ancillary information in a mobile voice-to-speech application |
US8838457B2 (en) | 2007-03-07 | 2014-09-16 | Vlingo Corporation | Using results of unstructured language model based speech recognition to control a system-level function of a mobile communications facility |
US20080252595A1 (en) | 2007-04-11 | 2008-10-16 | Marc Boillot | Method and Device for Virtual Navigation and Voice Processing |
US8503686B2 (en) | 2007-05-25 | 2013-08-06 | Aliphcom | Vibration sensor and acoustic voice activity detection system (VADS) for use with electronic systems |
US8385233B2 (en) | 2007-06-12 | 2013-02-26 | Microsoft Corporation | Active speaker identification |
GB2450886B (en) | 2007-07-10 | 2009-12-16 | Motorola Inc | Voice activity detector and a method of operation |
US8528033B2 (en) * | 2007-10-22 | 2013-09-03 | At&T Intellectual Property I, L.P. | Method and system for providing subscription data |
GB2458461A (en) | 2008-03-17 | 2009-09-23 | Kai Yu | Spoken language learning system |
US8805689B2 (en) * | 2008-04-11 | 2014-08-12 | The Nielsen Company (Us), Llc | Methods and apparatus to generate and use content-aware watermarks |
US8504365B2 (en) | 2008-04-11 | 2013-08-06 | At&T Intellectual Property I, L.P. | System and method for detecting synthetic speaker verification |
US8145482B2 (en) | 2008-05-25 | 2012-03-27 | Ezra Daya | Enhancing analysis of test key phrases from acoustic sources with key phrase training models |
KR101056511B1 (ko) | 2008-05-28 | 2011-08-11 | (주)파워보이스 | 실시간 호출명령어 인식을 이용한 잡음환경에서의음성구간검출과 연속음성인식 시스템 |
GB2463231B (en) | 2008-09-01 | 2012-05-30 | Sony Corp | Audio watermarking apparatus and method |
US8676586B2 (en) | 2008-09-16 | 2014-03-18 | Nice Systems Ltd | Method and apparatus for interaction or discourse analytics |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US9922640B2 (en) | 2008-10-17 | 2018-03-20 | Ashwin P Rao | System and method for multimodal utterance detection |
KR101519104B1 (ko) | 2008-10-30 | 2015-05-11 | 삼성전자 주식회사 | 목적음 검출 장치 및 방법 |
US20110066437A1 (en) * | 2009-01-26 | 2011-03-17 | Robert Luff | Methods and apparatus to monitor media exposure using content-aware watermarks |
US8326637B2 (en) | 2009-02-20 | 2012-12-04 | Voicebox Technologies, Inc. | System and method for processing multi-modal device interactions in a natural language voice services environment |
US8209174B2 (en) | 2009-04-17 | 2012-06-26 | Saudi Arabian Oil Company | Speaker verification system |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
CN101923853B (zh) | 2009-06-12 | 2013-01-23 | 华为技术有限公司 | 说话人识别方法、设备和系统 |
US8819172B2 (en) * | 2010-11-04 | 2014-08-26 | Digimarc Corporation | Smartphone-based methods and systems |
US8311838B2 (en) | 2010-01-13 | 2012-11-13 | Apple Inc. | Devices and methods for identifying a prompt corresponding to a voice input in a sequence of prompts |
US8626511B2 (en) | 2010-01-22 | 2014-01-07 | Google Inc. | Multi-dimensional disambiguation of voice commands |
KR101672212B1 (ko) | 2010-06-15 | 2016-11-04 | 엘지전자 주식회사 | 휴대 단말기 및 그 동작 방법 |
US8719018B2 (en) | 2010-10-25 | 2014-05-06 | Lockheed Martin Corporation | Biometric speaker identification |
EP2494545A4 (en) | 2010-12-24 | 2012-11-21 | Huawei Tech Co Ltd | METHOD AND DEVICE FOR DETECTING LANGUAGE ACTIVITIES |
US9196028B2 (en) * | 2011-09-23 | 2015-11-24 | Digimarc Corporation | Context-based smartphone sensor logic |
US9294869B2 (en) * | 2013-03-13 | 2016-03-22 | Aliphcom | Methods, systems and apparatus to affect RF transmission from a non-linked wireless client |
US9159324B2 (en) | 2011-07-01 | 2015-10-13 | Qualcomm Incorporated | Identifying people that are proximate to a mobile device user via social graphs, speech models, and user context |
WO2013012112A1 (ko) * | 2011-07-21 | 2013-01-24 | 엘지전자 주식회사 | 쿠폰 검색을 수행하는 전자 기기 및 소셜 커머스 서버 |
US8660847B2 (en) | 2011-09-02 | 2014-02-25 | Microsoft Corporation | Integrated local and cloud based speech recognition |
US8340975B1 (en) | 2011-10-04 | 2012-12-25 | Theodore Alfred Rosenberger | Interactive speech recognition device and system for hands-free building control |
US9031847B2 (en) | 2011-11-15 | 2015-05-12 | Microsoft Technology Licensing, Llc | Voice-controlled camera operations |
EP2783365B1 (en) | 2011-11-21 | 2018-02-21 | Robert Bosch GmbH | Method and system for adapting grammars in hybrid speech recognition engines for enhancing local speech recognition performance |
US8825020B2 (en) | 2012-01-12 | 2014-09-02 | Sensory, Incorporated | Information access and device control using mobile phones and audio in the home environment |
US9536528B2 (en) | 2012-07-03 | 2017-01-03 | Google Inc. | Determining hotword suitability |
JP6131537B2 (ja) | 2012-07-04 | 2017-05-24 | セイコーエプソン株式会社 | 音声認識システム、音声認識プログラム、記録媒体及び音声認識方法 |
TWI474317B (zh) | 2012-07-06 | 2015-02-21 | Realtek Semiconductor Corp | 訊號處理裝置以及訊號處理方法 |
US8983836B2 (en) | 2012-09-26 | 2015-03-17 | International Business Machines Corporation | Captioning using socially derived acoustic profiles |
US9401153B2 (en) * | 2012-10-15 | 2016-07-26 | Digimarc Corporation | Multi-mode audio recognition and auxiliary data encoding and decoding |
US9305559B2 (en) | 2012-10-15 | 2016-04-05 | Digimarc Corporation | Audio watermark encoding with reversing polarity and pairwise embedding |
US8996372B1 (en) | 2012-10-30 | 2015-03-31 | Amazon Technologies, Inc. | Using adaptation data with cloud-based speech recognition |
CN104641410A (zh) * | 2012-11-30 | 2015-05-20 | 日立麦克赛尔株式会社 | 影像显示装置,及其设定变更方法,设定变更程序 |
FR3000632A1 (fr) * | 2012-12-28 | 2014-07-04 | Thomson Licensing | Procede d'affichage de donnees dans un reseau et dispositif mobile associe |
JP6225920B2 (ja) * | 2012-12-28 | 2017-11-08 | 株式会社ソシオネクスト | 音声認識付き機器及び音声認識方法 |
EP2760015A1 (en) * | 2013-01-23 | 2014-07-30 | BlackBerry Limited | Event-triggered hands-free multitasking for media playback |
US9530409B2 (en) * | 2013-01-23 | 2016-12-27 | Blackberry Limited | Event-triggered hands-free multitasking for media playback |
US9349386B2 (en) | 2013-03-07 | 2016-05-24 | Analog Device Global | System and method for processor wake-up based on sensor data |
US9171450B2 (en) * | 2013-03-08 | 2015-10-27 | Qualcomm Incorporated | Emergency handling system using informative alarm sound |
US9093064B2 (en) * | 2013-03-11 | 2015-07-28 | The Nielsen Company (Us), Llc | Down-mixing compensation for audio watermarking |
US9361885B2 (en) | 2013-03-12 | 2016-06-07 | Nuance Communications, Inc. | Methods and apparatus for detecting a voice command |
US9384754B2 (en) * | 2013-03-12 | 2016-07-05 | Comcast Cable Communications, Llc | Removal of audio noise |
US9312826B2 (en) | 2013-03-13 | 2016-04-12 | Kopin Corporation | Apparatuses and methods for acoustic channel auto-balancing during multi-channel signal extraction |
US8768687B1 (en) | 2013-04-29 | 2014-07-01 | Google Inc. | Machine translation of indirect speech |
US9679053B2 (en) * | 2013-05-20 | 2017-06-13 | The Nielsen Company (Us), Llc | Detecting media watermarks in magnetic field data |
US9285886B2 (en) * | 2013-06-24 | 2016-03-15 | Sonos, Inc. | Intelligent amplifier activation |
WO2015025330A1 (en) | 2013-08-21 | 2015-02-26 | Kale Aaditya Kishore | A system to enable user to interact with an electronic processing device using voice of the user |
US9286943B2 (en) * | 2013-08-23 | 2016-03-15 | International Business Machines Corporation | Enhancing karaoke systems utilizing audience sentiment feedback and audio watermarking |
JP6502249B2 (ja) | 2013-08-29 | 2019-04-17 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 音声認識方法及び音声認識装置 |
US8775191B1 (en) | 2013-11-13 | 2014-07-08 | Google Inc. | Efficient utterance-specific endpointer triggering for always-on hotwording |
US9373321B2 (en) | 2013-12-02 | 2016-06-21 | Cypress Semiconductor Corporation | Generation of wake-up words |
US8918326B1 (en) * | 2013-12-05 | 2014-12-23 | The Telos Alliance | Feedback and simulation regarding detectability of a watermark message |
WO2015100430A1 (en) * | 2013-12-24 | 2015-07-02 | Digimarc Corporation | Methods and system for cue detection from audio input, low-power data processing and related arrangements |
US8938394B1 (en) | 2014-01-09 | 2015-01-20 | Google Inc. | Audio triggers based on context |
CN104978968A (zh) | 2014-04-11 | 2015-10-14 | 鸿富锦精密工业(深圳)有限公司 | 水印加载装置及水印加载的方法 |
US10770075B2 (en) * | 2014-04-21 | 2020-09-08 | Qualcomm Incorporated | Method and apparatus for activating application by speech input |
CN104093079B (zh) * | 2014-05-29 | 2015-10-07 | 腾讯科技(深圳)有限公司 | 基于多媒体节目的交互方法、终端、服务器和系统 |
US9357320B2 (en) | 2014-06-24 | 2016-05-31 | Harmon International Industries, Inc. | Headphone listening apparatus |
KR102208477B1 (ko) * | 2014-06-30 | 2021-01-27 | 삼성전자주식회사 | 마이크 운용 방법 및 이를 지원하는 전자 장치 |
US9368124B2 (en) | 2014-08-12 | 2016-06-14 | Tata Consultancy Services Ltd. | Computer implemented system for audio watermarking |
US9548053B1 (en) | 2014-09-19 | 2017-01-17 | Amazon Technologies, Inc. | Audible command filtering |
US9318107B1 (en) | 2014-10-09 | 2016-04-19 | Google Inc. | Hotword detection on multiple devices |
KR20160043267A (ko) | 2014-10-13 | 2016-04-21 | 한국전자통신연구원 | 음향 채널 왜곡에 강인한 워터마크 전송 장치 및 방법 |
KR102299330B1 (ko) * | 2014-11-26 | 2021-09-08 | 삼성전자주식회사 | 음성 인식 방법 및 그 전자 장치 |
US9418395B1 (en) * | 2014-12-31 | 2016-08-16 | The Nielsen Company (Us), Llc | Power efficient detection of watermarks in media signals |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US10153113B2 (en) * | 2015-08-31 | 2018-12-11 | Deako, Inc. | Systems and methods for occupancy prediction |
US9928840B2 (en) * | 2015-10-16 | 2018-03-27 | Google Llc | Hotword recognition |
US9747926B2 (en) * | 2015-10-16 | 2017-08-29 | Google Inc. | Hotword recognition |
JP6463710B2 (ja) * | 2015-10-16 | 2019-02-06 | グーグル エルエルシー | ホットワード認識 |
KR20170046958A (ko) * | 2015-10-22 | 2017-05-04 | 삼성전자주식회사 | 전자 장치 및 그의 음성 인식을 이용한 기능 실행 방법 |
US20180254042A1 (en) * | 2015-10-23 | 2018-09-06 | Samsung Electronics Co., Ltd. | Electronic device and control method therefor |
US10028023B2 (en) * | 2016-01-20 | 2018-07-17 | Google Llc | Methods and systems for automatic media output based on user proximity |
TWI633425B (zh) * | 2016-03-02 | 2018-08-21 | 美律實業股份有限公司 | 麥克風裝置 |
TWI584270B (zh) * | 2016-06-15 | 2017-05-21 | 瑞昱半導體股份有限公司 | 語音控制系統及其方法 |
US10332513B1 (en) * | 2016-06-27 | 2019-06-25 | Amazon Technologies, Inc. | Voice enablement and disablement of speech processing functionality |
KR102241970B1 (ko) * | 2016-11-07 | 2021-04-20 | 구글 엘엘씨 | 기록된 미디어 핫워드 트리거 억제 |
US10079015B1 (en) * | 2016-12-06 | 2018-09-18 | Amazon Technologies, Inc. | Multi-layer keyword detection |
US10559309B2 (en) * | 2016-12-22 | 2020-02-11 | Google Llc | Collaborative voice controlled devices |
US10902001B1 (en) * | 2017-02-27 | 2021-01-26 | Amazon Technologies, Inc. | Contact presence aggregator |
US10074371B1 (en) * | 2017-03-14 | 2018-09-11 | Amazon Technologies, Inc. | Voice control of remote device by disabling wakeword detection |
US10102855B1 (en) * | 2017-03-30 | 2018-10-16 | Amazon Technologies, Inc. | Embedded instructions for voice user interface |
US10170112B2 (en) | 2017-05-11 | 2019-01-01 | Google Llc | Detecting and suppressing voice queries |
US10242680B2 (en) * | 2017-06-02 | 2019-03-26 | The Nielsen Company (Us), Llc | Methods and apparatus to inspect characteristics of multichannel audio |
US10395650B2 (en) | 2017-06-05 | 2019-08-27 | Google Llc | Recorded media hotword trigger suppression |
JP7202214B2 (ja) | 2019-02-26 | 2023-01-11 | ヤンマーパワーテクノロジー株式会社 | 自動走行システム |
-
2017
- 2017-06-05 US US15/614,213 patent/US10395650B2/en active Active
-
2018
- 2018-03-13 KR KR1020197022907A patent/KR102296238B1/ko active IP Right Grant
- 2018-03-13 EP EP23164851.0A patent/EP4220629A1/en active Pending
- 2018-03-13 CN CN202310618091.4A patent/CN116597836A/zh active Pending
- 2018-03-13 CN CN201880008785.3A patent/CN110214351B/zh active Active
- 2018-03-13 EP EP18714917.4A patent/EP3430618B1/en active Active
- 2018-03-13 JP JP2019538634A patent/JP6750125B2/ja active Active
- 2018-03-13 WO PCT/US2018/022101 patent/WO2018226283A1/en active Application Filing
- 2018-03-13 EP EP20178162.2A patent/EP3723083B1/en active Active
-
2019
- 2019-08-09 US US16/537,033 patent/US11244674B2/en active Active
-
2020
- 2020-08-11 JP JP2020135793A patent/JP7114660B2/ja active Active
-
2022
- 2022-01-13 US US17/647,863 patent/US11798543B2/en active Active
- 2022-07-26 JP JP2022118728A patent/JP7461416B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003295894A (ja) * | 2002-03-28 | 2003-10-15 | Seiko Epson Corp | 付加情報埋め込み方法および付加情報読み出し方法ならびに音声認識システム |
JP2005338454A (ja) * | 2004-05-27 | 2005-12-08 | Toshiba Tec Corp | 音声対話装置 |
JP2017513037A (ja) * | 2014-10-09 | 2017-05-25 | グーグル インコーポレイテッド | 複数のデバイスにおけるホットワードの検出 |
US20170083285A1 (en) * | 2015-09-21 | 2017-03-23 | Amazon Technologies, Inc. | Device selection for providing a response |
Also Published As
Publication number | Publication date |
---|---|
CN110214351A (zh) | 2019-09-06 |
US11798543B2 (en) | 2023-10-24 |
US20200035232A1 (en) | 2020-01-30 |
EP3430618B1 (en) | 2020-07-15 |
EP4220629A1 (en) | 2023-08-02 |
US20180350356A1 (en) | 2018-12-06 |
JP2020511682A (ja) | 2020-04-16 |
US11244674B2 (en) | 2022-02-08 |
EP3723083B1 (en) | 2023-05-10 |
JP6750125B2 (ja) | 2020-09-02 |
CN116597836A (zh) | 2023-08-15 |
EP3430618A1 (en) | 2019-01-23 |
US20220139387A1 (en) | 2022-05-05 |
EP3723083A1 (en) | 2020-10-14 |
US10395650B2 (en) | 2019-08-27 |
JP2020190752A (ja) | 2020-11-26 |
WO2018226283A1 (en) | 2018-12-13 |
KR20190103308A (ko) | 2019-09-04 |
KR102296238B1 (ko) | 2021-08-31 |
CN110214351B (zh) | 2023-05-30 |
JP7461416B2 (ja) | 2024-04-03 |
JP7114660B2 (ja) | 2022-08-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7114660B2 (ja) | 記録メディアのホットワードトリガ抑制 | |
US11887603B2 (en) | Hotword detection on multiple devices | |
US11967323B2 (en) | Hotword suppression | |
US20210043210A1 (en) | Contextual hotwords | |
US10978070B2 (en) | Speaker diarization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220727 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230828 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231128 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240226 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240322 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7461416 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |