JP2020526781A - オーディオ透かしによるキーフレーズ検出 - Google Patents
オーディオ透かしによるキーフレーズ検出 Download PDFInfo
- Publication number
- JP2020526781A JP2020526781A JP2019566262A JP2019566262A JP2020526781A JP 2020526781 A JP2020526781 A JP 2020526781A JP 2019566262 A JP2019566262 A JP 2019566262A JP 2019566262 A JP2019566262 A JP 2019566262A JP 2020526781 A JP2020526781 A JP 2020526781A
- Authority
- JP
- Japan
- Prior art keywords
- data stream
- audio data
- watermark
- audio
- playback device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title description 76
- 238000000034 method Methods 0.000 claims abstract description 37
- 230000004044 response Effects 0.000 claims description 19
- 238000004590 computer program Methods 0.000 abstract description 21
- 230000009471 action Effects 0.000 description 52
- 230000015654 memory Effects 0.000 description 47
- 238000004891 communication Methods 0.000 description 15
- 230000000875 corresponding effect Effects 0.000 description 13
- 230000008569 process Effects 0.000 description 13
- 238000012545 processing Methods 0.000 description 11
- 230000004048 modification Effects 0.000 description 8
- 238000012986 modification Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000004913 activation Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/018—Audio watermarking, i.e. embedding inaudible data in the audio signal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/233—Processing of audio elementary streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/835—Generation of protective data, e.g. certificates
- H04N21/8358—Generation of protective data, e.g. certificates involving watermark
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Computer Security & Cryptography (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
Description
102 再生デバイス
104 コンテンツ検索モジュール
106 自動音声認識器
108 透かしエンコードモジュール
110 ディスプレイ
112 スピーカ
114 オーディオデータストリーム
116 オーディオデータストリーム
118 オーディオ透かし
120 第1の部分
122 第2の部分
124 リスニングデバイス
126 マイクロフォン
128 キーフレーズ検出モジュール
130 透かし検出モジュール
300 コンピューティングデバイス
302 プロセッサ
304 メモリ
306 記憶デバイス
308 高速コントローラ、高速インターフェース
310 高速拡張ポート
312 低速コントローラ、低速インターフェース
314 低速拡張ポート、低速バス
316 ディスプレイ
320 サーバ
322 ラップトップコンピュータ
324 ラックサーバシステム
350 コンピューティングデバイス
352 プロセッサ
354 ディスプレイ
356 ディスプレイインターフェース
358 制御インターフェース
360 オーディオコーデック
362 外部インターフェース
364 メモリ
366 通信インターフェース
368 無線周波数トランシーバ
370 受信機モジュール
372 拡張インターフェース
374 拡張メモリ
380 セルラ電話
382 スマートフォン
Claims (22)
- 命令が記憶された1つまたは複数の記憶デバイスを備えた再生デバイスであって、前記命令は、前記再生デバイスによって実行された場合、前記再生デバイスに、
オーディオデータストリームを受信するステップと、
前記オーディオデータストリームが前記再生デバイスによって出力される前に、自動音声認識器を使用して、前記オーディオデータストリームの一部を分析することにより、前記オーディオデータストリームの前記一部が特定のキーフレーズをエンコードしているか否かを判定するステップと、
前記オーディオデータストリームの前記一部が前記特定のキーフレーズをエンコードしているとの判定に応じて、オーディオ透かしを含めるように前記オーディオデータストリームを修正するステップと、
出力のために、前記修正されたオーディオデータストリームを提供するステップと
を備えた動作を実行させるように動作可能である、再生デバイス。 - 前記命令は、前記再生デバイスによって実行された場合、前記特定のキーフレーズをエンコードしていない前記オーディオデータストリームの前記一部に基づいて、オーディオ透かしを含めるように、前記オーディオデータストリームを修正することをスキップするように判定し、前記特定のキーフレーズをエンコードしていない前記オーディオデータストリームの前記一部に基づいて、前記オーディオ透かしを含めるように、前記オーディオデータストリームを修正することをスキップすると判定した後、出力のために、前記オーディオデータストリームを提供することによって、前記オーディオデータストリームの前記一部が、前記特定のキーフレーズをエンコードしていないと判定するステップに前記再生デバイスを応答させるように動作可能である、請求項1に記載の再生デバイス。
- 前記オーディオ透かしを含めるように前記オーディオデータストリームを修正するステップは、
前記受信したオーディオデータストリームが前記特定のキーフレーズの透かしを含んでいるか否かを判定するステップと、
前記受信したオーディオデータストリームが前記特定のキーフレーズの透かしを含んでいないとの判定に応じて、オーディオ透かしを含めるように前記オーディオデータストリームを修正するステップと
を備えた、請求項1に記載の再生デバイス。 - 前記オーディオ透かしを含めるように前記オーディオデータストリームを修正するステップは、
前記受信したオーディオデータストリームが、前記特定のキーフレーズの透かしを含んでいるか否かを判定するステップと、
前記受信したオーディオデータストリームが、前記特定のキーフレーズの透かしを含んでいるとの判定に応じて、前記透かしにエンコードされているデータを分析することにより、特定のデータが前記透かしにエンコードされているか否かを判定するステップと、
特定のデータが前記透かしにエンコードされていないとの判定に応じて、前記特定のデータをエンコードする前記オーディオ透かしを含めるように前記オーディオデータストリームを修正するステップと
を備えた、請求項1に記載の再生デバイス。 - 前記特定のデータをエンコードする前記オーディオ透かしを含めるように前記オーディオデータストリームを修正するステップは、前記特定のデータをエンコードするように、前記受信したオーディオデータストリームからの前記透かしを修正するステップを備えた、請求項3に記載の再生デバイス。
- 前記特定のデータは、前記特定のキーフレーズのデータを備えた、請求項4または5に記載の再生デバイス。
- 前記特定のデータは、前記オーディオデータストリームのソースのデータを備えた、請求項4から6のいずれか一項に記載の再生デバイス。
- 前記特定のデータは、前記オーディオデータストリームにおいてエンコードされているコンテンツに関するデータを備えた、請求項4から7のいずれか一項に記載の再生デバイス。
- 前記動作は、
前記再生デバイスによって前記オーディオデータストリームが再生される前に、前記自動音声認識器を使用して、前記オーディオデータストリームの前記一部を分析することによって、前記オーディオデータストリームの前記一部が、前記特定のキーフレーズをエンコードしているか否かを判定することと同時に、前記オーディオデータストリームの別の部分を受信するステップ
を備えた、請求項1から8のいずれか一項に記載の再生デバイス。 - 前記特定のキーフレーズは固定されている、請求項1から9のいずれか一項に記載の再生デバイス。
- 前記動作は、
前記オーディオデータストリームが前記再生デバイスによって再生される前に、前記自動音声認識器を使用して、前記オーディオデータストリームの前記一部を分析することによって、前記オーディオデータストリームの前記一部が、前記特定のキーフレーズをエンコードしているか否かを判定する前に、前記特定のキーフレーズを定義する入力を受信するステップ
を備えた、請求項1から9のいずれか一項に記載の再生デバイス。 - 前記オーディオデータストリームを受信するステップは、出力のために、前記修正されたオーディオデータストリームの前記一部を提供する前に、マイクロフォン以外のワイヤードまたはワイヤレス入力接続を介して、前記オーディオデータストリームを受信するステップを備えた、請求項1から11のいずれか一項に記載の再生デバイス。
- 前記オーディオ透かしを含めるように前記オーディオデータストリームを修正するステップは、前記オーディオデータストリームのソースを識別する前記オーディオ透かしを含めるように前記オーディオデータストリームを修正するステップを備えた、請求項1から12のいずれか一項に記載の再生デバイス。
- 前記オーディオ透かしを含めるように前記オーディオデータストリームを修正するステップは、前記特定のキーフレーズが前記オーディオデータストリームの前記一部においてエンコードされていることを指定するデータを含む前記オーディオ透かしを含めるように、前記オーディオデータストリームを修正するステップを備えた、請求項1から13のいずれか一項に記載の再生デバイス。
- 前記オーディオ透かしを含めるように前記オーディオデータストリームを修正するステップは、キーフレーズが前記オーディオデータストリームの前記一部においてエンコードされていることを指定するデータを含む前記オーディオ透かしを含めるように、前記オーディオデータストリームを修正するステップを備えた、請求項1から13のいずれか一項に記載の再生デバイス。
- 命令でエンコードされた非一時的コンピュータ記憶媒体であって、命令は、1つまたは複数のコンピュータによって実行された場合、前記1つまたは複数のコンピュータに、
オーディオデータストリームを受信するステップと、
前記オーディオデータストリームが前記1つまたは複数のコンピュータによって出力される前に、自動音声認識器を使用して、前記オーディオデータストリームの一部を分析することにより、前記オーディオデータストリームの前記一部が特定のキーフレーズをエンコードしているか否かを判定するステップと、
前記オーディオデータストリームの前記一部が前記特定のキーフレーズをエンコードしていないとの判定に応じて、前記特定のキーフレーズをエンコードしていない前記オーディオデータストリームの前記一部に基づいて、オーディオ透かしを含めるように前記オーディオデータストリームを修正することをスキップすると判定するステップと、
前記特定のキーフレーズをエンコードしていない前記オーディオデータストリームの前記一部に基づいて、前記オーディオ透かしを含めるように前記オーディオデータストリームを修正することをスキップすると判定した後、出力のために、前記オーディオデータストリームを提供するステップと
を備えた動作を実行させる、非一時的コンピュータ記憶媒体。 - 前記動作は、
前記オーディオデータストリームが前記1つまたは複数のコンピュータによって出力される前に、前記自動音声認識器を使用して、前記オーディオデータストリームの第2の部分を分析することによって、前記オーディオデータストリームの前記第2の部分が、前記特定のキーフレーズの発生をエンコードしているか否かを判定するステップと、
前記オーディオデータストリームの前記第2の部分が、前記特定のキーフレーズをエンコードしているとの判定に応じて、前記受信したオーディオデータストリームが、前記特定のキーフレーズの前記発生に関する透かしを含んでいるか否かを判定するステップと、
前記受信したオーディオデータストリームが、前記特定のキーフレーズの前記発生に関する透かしを含んでいるとの判定に応じて、前記透かしにエンコードされているデータを分析することによって、特定のデータが前記透かしにエンコードされているか否かを判定するステップと、
特定のデータが前記透かしにエンコードされていないとの判定に応じて、前記特定のデータをエンコードする前記オーディオ透かしを含むように前記オーディオデータストリームを修正するステップと
を備えた、請求項16に記載のコンピュータ記憶媒体。 - 前記動作は、
前記オーディオデータストリームが前記1つまたは複数のコンピュータによって出力される前に、前記自動音声認識器を使用して、前記オーディオデータストリームの第2の部分を分析することによって、前記オーディオデータストリームの前記第2の部分が、前記特定のキーフレーズの発生をエンコードしているか否かを判定するステップと、
前記オーディオデータストリームの前記第2の部分が、前記特定のキーフレーズをエンコードしているとの判定に応じて、前記受信したオーディオデータストリームが、前記特定のキーフレーズの前記発生に関する透かしを含んでいるか否かを判定するステップと、
前記受信したオーディオデータストリームが、前記特定のキーフレーズの前記発生に関する透かしを含んでいるとの判定に応じて、前記特定のキーフレーズの前記発生に基づいて、前記オーディオ透かしを含めるように前記オーディオデータストリームを修正することをスキップすると判定するステップと
を備えた、請求項16に記載のコンピュータ記憶媒体。 - 再生デバイスによってオーディオデータストリームを受信するステップと、
前記オーディオデータストリームが前記再生デバイスによって出力される前に、自動音声認識器を使用して、前記オーディオデータストリームの一部を分析することにより、前記オーディオデータストリームの前記一部が、特定のキーフレーズをエンコードしているか否かを判定するステップと、
前記オーディオデータストリームの前記一部が前記特定のキーフレーズをエンコードしているとの判定に応じて、オーディオ透かしを含めるように前記オーディオデータストリームを修正するステップと、
出力のために、前記修正されたオーディオデータストリームを、前記再生デバイスによって提供するステップと
を備えた、コンピュータによって実施される方法。 - 前記オーディオ透かしを含めるように前記オーディオデータストリームを修正するステップは、
前記受信したオーディオデータストリームが前記特定のキーフレーズの透かしを含んでいるか否かを判定するステップと、
前記受信したオーディオデータストリームが前記特定のキーフレーズの透かしを含んでいないとの判定に応じて、オーディオ透かしを含めるように前記オーディオデータストリームを修正するステップと
を備えた、請求項19に記載の方法。 - 前記オーディオ透かしを含めるように前記オーディオデータストリームを修正するステップは、
前記受信したオーディオデータストリームが、前記特定のキーフレーズの透かしを含んでいるか否かを判定するステップと、
前記受信したオーディオデータストリームが、前記特定のキーフレーズの透かしを含んでいるとの判定に応じて、前記透かしにエンコードされているデータを分析することにより、特定のデータが前記透かしにエンコードされているか否かを判定するステップと、
特定のデータが前記透かしにエンコードされていないとの判定に応じて、前記特定のデータをエンコードする前記オーディオ透かしを含めるように前記オーディオデータストリームを修正するステップと
を備えた、請求項19に記載の方法。 - 1つまたは複数のコンピュータによって実行された場合、前記1つまたは複数のコンピュータに、請求項19から21のいずれか一項に記載の方法を実行させる、コンピュータ可読命令。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/824,183 | 2017-11-28 | ||
US15/824,183 US10276175B1 (en) | 2017-11-28 | 2017-11-28 | Key phrase detection with audio watermarking |
PCT/US2018/045185 WO2019108275A1 (en) | 2017-11-28 | 2018-08-03 | Key phrase detection with audio watermarking |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021014286A Division JP7160967B2 (ja) | 2017-11-28 | 2021-02-01 | オーディオ透かしによるキーフレーズ検出 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020526781A true JP2020526781A (ja) | 2020-08-31 |
JP6883119B2 JP6883119B2 (ja) | 2021-06-09 |
Family
ID=63245115
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019566262A Active JP6883119B2 (ja) | 2017-11-28 | 2018-08-03 | オーディオ透かしによるキーフレーズ検出 |
JP2021014286A Active JP7160967B2 (ja) | 2017-11-28 | 2021-02-01 | オーディオ透かしによるキーフレーズ検出 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021014286A Active JP7160967B2 (ja) | 2017-11-28 | 2021-02-01 | オーディオ透かしによるキーフレーズ検出 |
Country Status (6)
Country | Link |
---|---|
US (4) | US10276175B1 (ja) |
EP (4) | EP3828741B1 (ja) |
JP (2) | JP6883119B2 (ja) |
KR (2) | KR102363872B1 (ja) |
CN (2) | CN113138743B (ja) |
WO (1) | WO2019108275A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021525385A (ja) * | 2018-05-22 | 2021-09-24 | グーグル エルエルシーGoogle LLC | ホットワード抑制 |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10276175B1 (en) | 2017-11-28 | 2019-04-30 | Google Llc | Key phrase detection with audio watermarking |
US11032580B2 (en) | 2017-12-18 | 2021-06-08 | Dish Network L.L.C. | Systems and methods for facilitating a personalized viewing experience |
US10365885B1 (en) * | 2018-02-21 | 2019-07-30 | Sling Media Pvt. Ltd. | Systems and methods for composition of audio content from multi-object audio |
US10978081B2 (en) * | 2018-09-25 | 2021-04-13 | Amazon Technologies, Inc. | Audio watermark encoding/decoding |
US10950249B2 (en) * | 2018-09-25 | 2021-03-16 | Amazon Technologies, Inc. | Audio watermark encoding/decoding |
RU2767962C2 (ru) | 2020-04-13 | 2022-03-22 | Общество С Ограниченной Ответственностью «Яндекс» | Способ и система для распознавания воспроизведенного речевого фрагмента |
US11714595B1 (en) * | 2020-08-07 | 2023-08-01 | mmhmm inc. | Adaptive audio for immersive individual conference spaces |
CN113516991A (zh) * | 2020-08-18 | 2021-10-19 | 腾讯科技(深圳)有限公司 | 基于群组会话的音频播放、设备管理方法及装置 |
US11595703B2 (en) * | 2021-04-22 | 2023-02-28 | Shopify Inc. | Systems and methods for controlling transmission of live media streams |
US11915711B2 (en) | 2021-07-20 | 2024-02-27 | Direct Cursus Technology L.L.C | Method and system for augmenting audio signals |
JP7267636B1 (ja) | 2021-10-21 | 2023-05-02 | 株式会社アートクリフ | 情報処理装置、情報処理システム、情報処理方法およびプログラム |
US20240038249A1 (en) * | 2022-07-27 | 2024-02-01 | Cerence Operating Company | Tamper-robust watermarking of speech signals |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004222129A (ja) * | 2003-01-17 | 2004-08-05 | Matsushita Electric Ind Co Ltd | 電子透かし多重化装置および電子透かし検出装置 |
JP2011091619A (ja) * | 2009-10-22 | 2011-05-06 | Sony Corp | 送信装置、送信方法、受信装置、受信方法、プログラム、および放送システム |
JP2017167559A (ja) * | 2014-07-29 | 2017-09-21 | ヤマハ株式会社 | 情報管理システムおよび端末装置 |
Family Cites Families (63)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2681997A1 (fr) | 1991-09-30 | 1993-04-02 | Arbitron Cy | Procede et dispositif d'identification automatique d'un programme comportant un signal sonore. |
US6505160B1 (en) | 1995-07-27 | 2003-01-07 | Digimarc Corporation | Connected audio and other media objects |
US7562392B1 (en) | 1999-05-19 | 2009-07-14 | Digimarc Corporation | Methods of interacting with audio and ambient music |
US5708478A (en) | 1996-06-26 | 1998-01-13 | Sun Microsystems, Inc. | Computer system for enabling radio listeners/television watchers to obtain advertising information |
AU6131899A (en) * | 1998-08-31 | 2000-03-21 | Digital Video Express, L.P. | Watermarking system and methodology for digital multimedia content |
EP1093652B1 (en) | 1998-12-21 | 2004-05-12 | Roke Manor Research Limited | Acoustically activated marketing method and device |
US7664264B2 (en) | 1999-03-24 | 2010-02-16 | Blue Spike, Inc. | Utilizing data reduction in steganographic and cryptographic systems |
US6871180B1 (en) | 1999-05-25 | 2005-03-22 | Arbitron Inc. | Decoding of information in audio signals |
AU2001229402A1 (en) | 2000-01-13 | 2001-07-24 | Digimarc Corporation | Authenticating metadata and embedding metadata in watermarks of media signals |
US6737957B1 (en) | 2000-02-16 | 2004-05-18 | Verance Corporation | Remote control signaling using audio watermarks |
US6990453B2 (en) | 2000-07-31 | 2006-01-24 | Landmark Digital Services Llc | System and methods for recognizing sound and music signals in high noise and distortion |
KR102077314B1 (ko) | 2000-09-13 | 2020-02-13 | 스트라토스 오디오, 인코포레이티드 | 미디어 콘텐츠 주문 및 배달 방법 및 시스템 |
JP2002091455A (ja) * | 2000-09-19 | 2002-03-27 | Matsushita Electric Ind Co Ltd | 端末装置及び電子音楽配信システム |
DE60107710T2 (de) | 2000-10-20 | 2005-12-01 | Koninklijke Philips Electronics N.V. | Einrichtung und anordnung zur wiedergabe |
US6954790B2 (en) | 2000-12-05 | 2005-10-11 | Interactive People Unplugged Ab | Network-based mobile workgroup system |
EP1490767B1 (en) | 2001-04-05 | 2014-06-11 | Audible Magic Corporation | Copyright detection and protection system and method |
KR100552468B1 (ko) * | 2001-07-19 | 2006-02-15 | 삼성전자주식회사 | 음성인식에 따른 오동작을 방지 및 음성인식율을 향상 할수 있는 전자기기 및 방법 |
US7181159B2 (en) | 2002-03-07 | 2007-02-20 | Breen Julian H | Method and apparatus for monitoring audio listening |
US7342906B1 (en) | 2003-04-04 | 2008-03-11 | Airespace, Inc. | Distributed wireless network security system |
US20040260701A1 (en) | 2003-05-27 | 2004-12-23 | Juha Lehikoinen | System and method for weblog and sharing in a peer-to-peer environment |
US6910820B2 (en) | 2003-07-25 | 2005-06-28 | 3M Innovative Properties Company | Apparatus and method for handling linerless label tape |
JP2005176021A (ja) | 2003-12-12 | 2005-06-30 | Toshiba Corp | 情報処理装置およびプログラム |
US20050219366A1 (en) | 2004-03-31 | 2005-10-06 | Hollowbush Richard R | Digital audio-video differential delay and channel analyzer |
US7623823B2 (en) | 2004-08-31 | 2009-11-24 | Integrated Media Measurement, Inc. | Detecting and measuring exposure to media content items |
KR100617165B1 (ko) * | 2004-11-19 | 2006-08-31 | 엘지전자 주식회사 | 워터마크 삽입/검출 기능을 갖는 오디오 부호화/복호화장치 및 방법 |
JP4715239B2 (ja) | 2005-03-04 | 2011-07-06 | 沖電気工業株式会社 | 無線アクセス装置、無線アクセス方法及び無線ネットワーク |
WO2007001953A1 (en) | 2005-06-21 | 2007-01-04 | Motorola, Inc. | Method, apparatus, and system for establishing a direct route between agents of a sender node and a receiver node |
US8254308B1 (en) | 2006-01-05 | 2012-08-28 | Sprint Spectrum L.P. | Method and system for acoustically triggering electronic coupon retrieval |
US7774854B1 (en) | 2006-03-31 | 2010-08-10 | Verint Americas Inc. | Systems and methods for protecting information |
EP2070231B1 (en) | 2006-10-03 | 2013-07-03 | Shazam Entertainment, Ltd. | Method for high throughput of identification of distributed broadcast content |
US8245284B2 (en) | 2006-10-05 | 2012-08-14 | Microsoft Corporation | Extensible network discovery |
US8166534B2 (en) | 2007-05-18 | 2012-04-24 | Microsoft Corporation | Incorporating network connection security levels into firewall rules |
CA2858944C (en) * | 2007-11-12 | 2017-08-22 | The Nielsen Company (Us), Llc | Methods and apparatus to perform audio watermarking and watermark detection and extraction |
MY147120A (en) | 2008-09-10 | 2012-10-31 | Mimos Berhad | Method of integrating quantum key distribution with internet key exchange protocol |
CN101464982A (zh) * | 2009-01-21 | 2009-06-24 | 北京中科信利技术有限公司 | 一种基于音频水印的手机支付认证系统及方法 |
US8577346B2 (en) | 2009-03-02 | 2013-11-05 | First Data Corporation | Systems, methods, and apparatus for receiving promotion information by a mobile device |
US8577345B2 (en) | 2009-03-02 | 2013-11-05 | First Data Corporation | Systems, methods, and apparatus for providing promotion information to a mobile device |
US8650129B2 (en) | 2010-01-20 | 2014-02-11 | American Express Travel Related Services Company, Inc. | Dynamically reacting policies and protections for securing mobile financial transaction data in transit |
US8645132B2 (en) | 2011-08-24 | 2014-02-04 | Sensory, Inc. | Truly handsfree speech recognition in high noise environments |
JP5793865B2 (ja) * | 2010-12-28 | 2015-10-14 | 富士通株式会社 | 電子透かし埋め込み装置、電子透かし埋め込み用コンピュータプログラム及び電子透かし検出装置ならびに電子透かし検出用コンピュータプログラム |
US8611506B2 (en) * | 2011-07-08 | 2013-12-17 | Blackberry Limited | Methods and apparatus to facilitate voicemail interaction |
US9860588B2 (en) | 2012-05-08 | 2018-01-02 | Cirrus Logic, Inc. | Implied media networks |
US8869222B2 (en) | 2012-09-13 | 2014-10-21 | Verance Corporation | Second screen content |
WO2014103099A1 (ja) | 2012-12-28 | 2014-07-03 | パナソニック株式会社 | 音声認識付き機器及び音声認識方法 |
JP2014187490A (ja) * | 2013-03-22 | 2014-10-02 | Yamaha Corp | 放送受信装置及び端末装置 |
CN104138596A (zh) | 2014-07-22 | 2014-11-12 | 张喜田 | 重组灵芝免疫调节蛋白在延缓衰老药物中的应用 |
JP5871088B1 (ja) | 2014-07-29 | 2016-03-01 | ヤマハ株式会社 | 端末装置、情報提供システム、情報提供方法およびプログラム |
US10896151B2 (en) | 2014-08-08 | 2021-01-19 | Nokia Technologies Oy | Method and apparatus for providing a visual indication of the copy history |
US9548053B1 (en) | 2014-09-19 | 2017-01-17 | Amazon Technologies, Inc. | Audible command filtering |
US9318107B1 (en) * | 2014-10-09 | 2016-04-19 | Google Inc. | Hotword detection on multiple devices |
US9424841B2 (en) * | 2014-10-09 | 2016-08-23 | Google Inc. | Hotword detection on multiple devices |
US9818414B2 (en) | 2015-06-04 | 2017-11-14 | Intel Corporation | Dialogue system with audio watermark |
US9928840B2 (en) * | 2015-10-16 | 2018-03-27 | Google Llc | Hotword recognition |
CN107016999B (zh) * | 2015-10-16 | 2022-06-14 | 谷歌有限责任公司 | 热词识别 |
CN105392022B (zh) * | 2015-11-04 | 2019-01-18 | 北京符景数据服务有限公司 | 基于音频水印的信息交互方法与装置 |
US10453460B1 (en) | 2016-02-02 | 2019-10-22 | Amazon Technologies, Inc. | Post-speech recognition request surplus detection and prevention |
US9728188B1 (en) * | 2016-06-28 | 2017-08-08 | Amazon Technologies, Inc. | Methods and devices for ignoring similar audio being received by a system |
US10079024B1 (en) * | 2016-08-19 | 2018-09-18 | Amazon Technologies, Inc. | Detecting replay attacks in voice-based authentication |
EP3555882B1 (en) | 2016-12-19 | 2021-10-27 | Rovi Guides, Inc. | Systems and methods for distinguishing valid voice commands from false voice commands in an interactive media guidance application |
US10395650B2 (en) | 2017-06-05 | 2019-08-27 | Google Llc | Recorded media hotword trigger suppression |
US11445235B2 (en) * | 2017-10-24 | 2022-09-13 | Comcast Cable Communications, Llc | Determining context to initiate interactivity |
US10152966B1 (en) * | 2017-10-31 | 2018-12-11 | Comcast Cable Communications, Llc | Preventing unwanted activation of a hands free device |
US10276175B1 (en) | 2017-11-28 | 2019-04-30 | Google Llc | Key phrase detection with audio watermarking |
-
2017
- 2017-11-28 US US15/824,183 patent/US10276175B1/en active Active
-
2018
- 2018-08-03 KR KR1020197035499A patent/KR102363872B1/ko active IP Right Grant
- 2018-08-03 WO PCT/US2018/045185 patent/WO2019108275A1/en unknown
- 2018-08-03 CN CN202110376125.4A patent/CN113138743B/zh active Active
- 2018-08-03 EP EP21152004.4A patent/EP3828741B1/en active Active
- 2018-08-03 KR KR1020227004628A patent/KR102469262B1/ko active IP Right Grant
- 2018-08-03 EP EP23153016.3A patent/EP4202737A1/en active Pending
- 2018-08-03 CN CN201880036483.7A patent/CN110692055B/zh active Active
- 2018-08-03 EP EP19218608.8A patent/EP3664091B1/en active Active
- 2018-08-03 JP JP2019566262A patent/JP6883119B2/ja active Active
- 2018-08-03 EP EP18756127.9A patent/EP3529804B1/en active Active
-
2019
- 2019-03-19 US US16/358,109 patent/US10777210B2/en active Active
-
2020
- 2020-08-13 US US16/992,647 patent/US11211076B2/en active Active
-
2021
- 2021-02-01 JP JP2021014286A patent/JP7160967B2/ja active Active
- 2021-12-06 US US17/457,820 patent/US11727947B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004222129A (ja) * | 2003-01-17 | 2004-08-05 | Matsushita Electric Ind Co Ltd | 電子透かし多重化装置および電子透かし検出装置 |
JP2011091619A (ja) * | 2009-10-22 | 2011-05-06 | Sony Corp | 送信装置、送信方法、受信装置、受信方法、プログラム、および放送システム |
JP2017167559A (ja) * | 2014-07-29 | 2017-09-21 | ヤマハ株式会社 | 情報管理システムおよび端末装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021525385A (ja) * | 2018-05-22 | 2021-09-24 | グーグル エルエルシーGoogle LLC | ホットワード抑制 |
JP7395509B2 (ja) | 2018-05-22 | 2023-12-11 | グーグル エルエルシー | ホットワード抑制 |
US11967323B2 (en) | 2018-05-22 | 2024-04-23 | Google Llc | Hotword suppression |
Also Published As
Publication number | Publication date |
---|---|
US20190214030A1 (en) | 2019-07-11 |
EP3828741A1 (en) | 2021-06-02 |
US20220093114A1 (en) | 2022-03-24 |
EP3529804B1 (en) | 2020-02-05 |
US10777210B2 (en) | 2020-09-15 |
EP3529804A1 (en) | 2019-08-28 |
KR102469262B1 (ko) | 2022-11-22 |
US10276175B1 (en) | 2019-04-30 |
US11727947B2 (en) | 2023-08-15 |
JP2021071733A (ja) | 2021-05-06 |
CN110692055A (zh) | 2020-01-14 |
EP3828741B1 (en) | 2023-03-08 |
US20200372922A1 (en) | 2020-11-26 |
JP6883119B2 (ja) | 2021-06-09 |
EP3664091A1 (en) | 2020-06-10 |
EP4202737A1 (en) | 2023-06-28 |
EP3664091B1 (en) | 2021-02-17 |
JP7160967B2 (ja) | 2022-10-25 |
KR20190141767A (ko) | 2019-12-24 |
KR102363872B1 (ko) | 2022-02-16 |
CN113138743A (zh) | 2021-07-20 |
KR20220027251A (ko) | 2022-03-07 |
CN113138743B (zh) | 2022-10-14 |
CN110692055B (zh) | 2021-05-04 |
WO2019108275A1 (en) | 2019-06-06 |
US11211076B2 (en) | 2021-12-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6883119B2 (ja) | オーディオ透かしによるキーフレーズ検出 | |
US9167520B2 (en) | Controlling applications in a mobile device based on environmental context | |
US9530409B2 (en) | Event-triggered hands-free multitasking for media playback | |
KR20140074549A (ko) | 음성인식 기술을 이용한 상황 인식 서비스 제공 방법 및 장치 | |
JP6783339B2 (ja) | 音声を処理する方法及び装置 | |
JP2017509009A (ja) | オーディオストリームの中の音楽の追跡 | |
WO2015088789A1 (en) | Audio keyword based control of media output | |
US20240147010A1 (en) | Smart remote control for audio responsive media device | |
US10693944B1 (en) | Media-player initialization optimization | |
US10313845B2 (en) | Proactive speech detection and alerting | |
CN112259076B (zh) | 语音交互方法、装置、电子设备及计算机可读存储介质 | |
CN112148754A (zh) | 一种歌曲识别方法和装置 | |
US11922949B1 (en) | Sound detection-based power control of a device | |
EP4284005A1 (en) | Video dubbing method, related device, and computer readable storage medium | |
CN112015567A (zh) | 数据处理方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200123 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200123 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20200123 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20200602 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200713 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20201005 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210201 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20210201 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20210209 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20210215 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210412 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210507 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6883119 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |