KR20220027251A - 오디오 워터 마킹을 이용한 키 구문 검출 - Google Patents
오디오 워터 마킹을 이용한 키 구문 검출 Download PDFInfo
- Publication number
- KR20220027251A KR20220027251A KR1020227004628A KR20227004628A KR20220027251A KR 20220027251 A KR20220027251 A KR 20220027251A KR 1020227004628 A KR1020227004628 A KR 1020227004628A KR 20227004628 A KR20227004628 A KR 20227004628A KR 20220027251 A KR20220027251 A KR 20220027251A
- Authority
- KR
- South Korea
- Prior art keywords
- data stream
- audio data
- audio
- playback device
- speaker
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/018—Audio watermarking, i.e. embedding inaudible data in the audio signal
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/233—Processing of audio elementary streams
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/835—Generation of protective data, e.g. certificates
- H04N21/8358—Generation of protective data, e.g. certificates involving watermark
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Theoretical Computer Science (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Computer Security & Cryptography (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- General Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
Abstract
Description
도 2는 키 구문 검출에 기초하여 오디오 데이터 스트림을 수정하기 위한 프로세스의 흐름도이다.
도 3은 본 문서에 기술된 컴퓨터 구현 방법과 관련하여 사용될 수 있는 컴퓨팅 시스템의 블록도이다.
다양한 도면에서 유사한 참조 번호 및 명칭은 유사한 요소를 나타낸다.
Claims (38)
- 데이터 처리 하드웨어에서 실행될 때 데이터 처리 하드웨어로 하여금 동작들을 수행하게 하는 컴퓨터 구현 방법으로서,
스피커를 통해 출력될 오디오 데이터 스트림이 핵심 문구(key phrase)를 인코딩하는지 여부를 결정하는 단계, 상기 오디오 데이터 스트림은 음악 컨텐츠 또는 비디오 컨텐츠 중 하나에 대응하고;
오디오 데이터 스트림이 핵심 문구를 인코딩하는 경우:
컨텐츠 제공자로부터 발신된(originated) 오디오 데이터 스트림을 나타내는 데이터를 인코딩하는 다수의 오디오 워터마크를 동적으로 생성하고; 그리고
수정된 오디오 데이터 스트림을 생성하기 위해 상기 동적으로 생성된 다수의 오디오 워터마크를 오디오 데이터 스트림에 삽입함으로써, 수정된 오디오 데이터 스트림을 생성하는 단계; 및
스피커를 통해 출력하기 위해 상기 수정된 오디오 데이터 스트림을 제공하는 단계를 포함하는 것을 특징으로 하는 컴퓨터 구현 방법. - 제1항에 있어서,
상기 데이터 처리 하드웨어는 재생 디바이스상에 있고; 그리고
스피커를 통해 출력될 오디오 데이터 스트림이 핵심 문구를 인코딩하는지 여부를 결정하기 전에, 상기 재생 디바이스는 마이크로폰 이외의 무선 입력 연결을 통해 컨텐츠 제공자로부터 오디오 데이터 스트림을 수신하는 것을 특징으로 하는 컴퓨터 구현 방법. - 제2항에 있어서,
상기 재생 디바이스는,
무선 입력 연결을 통해 컨텐츠 제공자로부터 비디오 스트림의 오디오 데이터 스트림을 수신하고; 그리고
디지털 오디오 및 비디오 연결을 사용하여 디스플레이에 연결하는 것을 특징으로 하는 컴퓨터 구현 방법. - 제3항에 있어서,
상기 동작들은,
스피커를 통해 출력하기 위해 상기 수정된 오디오 데이터 스트림을 제공할 때, 디지털 오디오 및 비디오 연결을 사용하여, 디스플레이에 의한 프리젠테이션을 위해 비디오 스트림의 비디오 부분을 제공하는 단계를 더 포함하는 것을 특징으로 하는 컴퓨터 구현 방법. - 제4항에 있어서,
상기 재생 디바이스는,
스피커를 통해 출력하기 위해 상기 수정된 오디오 데이터 스트림과 상기 디스플레이에 의한 비디오 스트림의 비디오 부분의 프리젠테이션을 동기화하는 것을 특징으로 하는 컴퓨터 구현 방법. - 제3항에 있어서,
상기 재생 디바이스는 디지털 오디오 및 비디오 연결을 사용하여 텔레비전에 연결되고, 상기 텔레비전은 디스플레이 및 스피커를 포함하는 것을 특징으로 하는 컴퓨터 구현 방법. - 제2항에 있어서,
상기 재생 디바이스는 스피커를 포함하는 것을 특징으로 하는 컴퓨터 구현 방법. - 제1항에 있어서,
상기 스피커를 통해 출력하기 위해 상기 수정된 데이터 스트림을 제공하는 단계 이후에, 청취 디바이스는, 마이크로폰을 통해 핵심 문구를 검출하는 것에 응답하여 어웨이크(awake) 모드에 있는 동안:
마이크로폰을 통해 상기 수정된 오디오 데이터 스트림을 캡처하고; 그리고
컨텐츠 제공자로부터 발신된 오디오 데이터 스트림을 나타내는 데이터를 인코딩하는 다수의 오디오 워터마크를 사용하여 수행할 액션을 결정하도록 구성되는 것을 특징으로 하는 컴퓨터 구현 방법. - 제1항에 있어서,
상기 청취 디바이스는 스피커와 동일한 방에 위치하는 것을 특징으로 하는 컴퓨터 구현 방법. - 제1항에 있어서,
수정된 오디오 데이터 스트림의 다수의 오디오 워터마크의 일부는 다른 다수의 오디오 워터마크와 상이한 데이터를 인코딩하고; 또는
다수의 오디오 워터마크 각각은 동일한 데이터를 인코딩하는 것을 특징으로 하는 컴퓨터 구현 방법. - 시스템으로서,
데이터 처리 하드웨어와; 그리고
데이터 처리 하드웨어와 통신하고 데이터 처리 하드웨어에서 실행될 때 데이터 처리 하드웨어로 하여금 동작들을 수행하게 하는 명령들을 저장하는 메모리 하드웨어를 포함하고, 상기 동작들은,
스피커를 통해 출력될 오디오 데이터 스트림이 핵심 문구를 인코딩하는지 여부를 결정하는 단계, 상기 오디오 데이터 스트림은 음악 컨텐츠 또는 비디오 컨텐츠 중 하나에 대응하고;
오디오 데이터 스트림이 핵심 문구를 인코딩하는 경우:
컨텐츠 제공자로부터 발신된 오디오 데이터 스트림을 나타내는 데이터를 인코딩하는 다수의 오디오 워터마크를 동적으로 생성하고; 그리고
수정된 오디오 데이터 스트림을 생성하기 위해 상기 동적으로 생성된 다수의 오디오 워터마크를 오디오 데이터 스트림에 삽입함으로써, 수정된 오디오 데이터 스트림을 생성하는 단계; 및
스피커를 통해 출력하기 위해 상기 수정된 오디오 데이터 스트림을 제공하는 단계를 포함하는 것을 특징으로 하는 시스템. - 제11항에 있어서,
상기 데이터 처리 하드웨어 및 메모리 하드웨어는 재생 디바이스상에 있고; 그리고
스피커를 통해 출력될 오디오 데이터 스트림이 핵심 문구를 인코딩하는지 여부를 결정하기 전에, 재생 디바이스는 마이크로폰 이외의 무선 입력 연결을 통해 컨텐츠 제공자로부터 오디오 데이터 스트림을 수신하는 것을 특징으로 하는 시스템. - 제12항에 있어서,
상기 재생 디바이스는,
무선 입력 연결을 통해 컨텐츠 제공자로부터 비디오 스트림의 오디오 데이터 스트림을 수신하고; 그리고
디지털 오디오 및 비디오 연결을 사용하여 디스플레이에 연결하는 것을 특징으로 하는 시스템. - 제13항에 있어서,
상기 동작들은,
스피커를 통해 출력하기 위해 상기 수정된 오디오 데이터 스트림을 제공할 때, 디지털 오디오 및 비디오 연결을 사용하여, 디스플레이에 의한 프리젠테이션을 위해 비디오 스트림의 비디오 부분을 제공하는 단계를 더 포함하는 것을 특징으로 하는 시스템. - 제14항에 있어서,
상기 재생 디바이스는,
스피커를 통해 출력하기 위해 상기 수정된 오디오 데이터 스트림과 상기 디스플레이에 의한 비디오 스트림의 비디오 부분의 프리젠테이션을 동기화하는 것을 특징으로 하는 시스템. - 제13항에 있어서,
상기 재생 디바이스는 디지털 오디오 및 비디오 연결을 사용하여 텔레비전에 연결되고, 상기 텔레비전은 디스플레이 및 스피커를 포함하는 것을 특징으로 하는 시스템. - 제12항에 있어서,
상기 재생 디바이스는 스피커를 포함하는 것을 특징으로 하는 시스템. - 제11항에 있어서,
상기 스피커를 통해 출력하기 위해 상기 수정된 데이터 스트림을 제공하는 단계 이후에, 청취 디바이스는, 마이크로폰을 통해 핵심 문구를 검출하는 것에 응답하여 어웨이크 모드에 있는 동안:
마이크로폰을 통해 상기 수정된 오디오 데이터 스트림을 캡처하고; 그리고
컨텐츠 제공자로부터 발신된 오디오 데이터 스트림을 나타내는 데이터를 인코딩하는 다수의 오디오 워터마크를 사용하여 수행할 액션을 결정하도록 구성되는 것을 특징으로 하는 시스템. - 제11항에 있어서,
상기 청취 디바이스는 스피커와 동일한 방에 위치하는 것을 특징으로 하는 시스템. - 제11항에 있어서,
수정된 오디오 데이터 스트림의 다수의 오디오 워터마크의 일부는 다른 다수의 오디오 워터마크와 상이한 데이터를 인코딩하고; 또는
다수의 오디오 워터마크 각각은 동일한 데이터를 인코딩하는 것을 특징으로 하는 시스템. - 방법으로서,
재생 디바이스의 데이터 처리 하드웨어에서, 컨텐츠 제공자로부터, 음악 컨텐츠 또는 비디오 컨텐츠 중 하나에 대응하는 오디오 데이터 스트림을 수신하는 단계, 상기 재생 디바이스는 마이크로폰 이외의 무선 입력 연결을 통해 컨텐츠 제공자로부터 오디오 데이터 스트림을 수신하고;
데이터 처리 하드웨어에 의해:
컨텐츠 제공자로부터 발신된 오디오 데이터 스트림을 나타내는 데이터를 인코딩하는 다수의 오디오 워터마크를 동적으로 생성하고; 그리고
수정된 오디오 데이터 스트림을 생성하기 위해 상기 동적으로 생성된 다수의 오디오 워터마크를 오디오 데이터 스트림에 삽입함으로써, 수정된 오디오 데이터 스트림을 생성하는 단계; 및
데이터 처리 하드웨어에 의해, 데이터 처리 하드웨어와 통신하는 스피커를 통해 출력하기 위해 상기 수정된 오디오 데이터 스트림을 제공하는 단계를 포함하고,
상기 스피커를 통해 출력하기 위해 상기 수정된 데이터 스트림을 제공하는 단계 이후에, 청취 디바이스는, 마이크로폰을 통해 핵심 문구를 검출하는 것에 응답하여 어웨이크 모드에 있는 동안:
마이크로폰을 통해 상기 수정된 오디오 데이터 스트림을 캡처하고; 그리고
컨텐츠 제공자로부터 발신된 오디오 데이터 스트림을 나타내는 데이터를 인코딩하는 다수의 오디오 워터마크를 사용하여 수행할 액션을 결정하도록 구성되는 것을 특징으로 하는 방법. - 제21항에 있어서,
상기 재생 디바이스는,
무선 입력 연결을 통해 컨텐츠 제공자로부터 비디오 스트림의 오디오 데이터 스트림을 수신하고; 그리고
디지털 오디오 및 비디오 연결을 사용하여 디스플레이에 연결하는 것을 특징으로 하는 방법. - 제22항에 있어서,
스피커를 통해 출력하기 위해 상기 수정된 오디오 데이터 스트림을 제공할 때, 데이터 처리 하드웨어에 의해, 디지털 오디오 및 비디오 연결을 사용하여, 디스플레이에 의한 프리젠테이션을 위해 비디오 스트림의 비디오 부분을 제공하는 단계를 더 포함하는 것을 특징으로 하는 방법. - 제23항에 있어서,
상기 재생 디바이스는 스피커를 통해 출력하기 위해 상기 수정된 오디오 데이터 스트림과 상기 디스플레이에 의한 비디오 스트림의 비디오 부분의 프리젠테이션을 동기화하는 것을 특징으로 하는 방법. - 제22항에 있어서,
상기 재생 디바이스는 디지털 오디오 및 비디오 연결을 사용하여 텔레비전에 연결되고, 상기 텔레비전은 디스플레이 및 스피커를 포함하는 것을 특징으로 하는 방법. - 제21항에 있어서,
상기 재생 디바이스는 스피커를 포함하는 것을 특징으로 하는 방법. - 제21항에 있어서,
상기 청취 디바이스는 스피커와 동일한 방에 위치하는 것을 특징으로 하는 방법. - 제21항에 있어서,
상기 수정된 오디오 데이터 스트림의 다수의 오디오 워터마크의 일부는 다른 다수의 오디오 워터마크와 상이한 데이터를 인코딩하는 것을 특징으로 하는 방법. - 제21항에 있어서,
상기 다수의 오디오 워터마크 각각은 동일한 데이터를 인코딩하는 것을 특징으로 하는 방법. - 재생 디바이스로서,
데이터 처리 하드웨어와; 그리고
데이터 처리 하드웨어와 통신하고 데이터 처리 하드웨어에서 실행될 때 데이터 처리 하드웨어로 하여금 동작들을 수행하게 하는 명령들을 저장하는 메모리 하드웨어를 포함하고, 상기 동작들은,
컨텐츠 제공자로부터, 음악 컨텐츠 또는 비디오 컨텐츠 중 하나에 대응하는 오디오 데이터 스트림을 수신하는 단계, 상기 재생 디바이스는 마이크로폰 이외의 무선 입력 연결을 통해 컨텐츠 제공자로부터 오디오 데이터 스트림을 수신하고;
컨텐츠 제공자로부터 발신된 오디오 데이터 스트림을 나타내는 데이터를 인코딩하는 다수의 오디오 워터마크를 동적으로 생성하고; 그리고
수정된 오디오 데이터 스트림을 생성하기 위해 상기 동적으로 생성된 다수의 오디오 워터마크를 오디오 데이터 스트림에 삽입함으로써, 수정된 오디오 데이터 스트림을 생성하는 단계; 및
데이터 처리 하드웨어와 통신하는 스피커를 통해 출력하기 위해 상기 수정된 오디오 데이터 스트림을 제공하는 단계를 포함하고,
상기 스피커를 통해 출력하기 위해 상기 수정된 데이터 스트림을 제공하는 단계 이후에, 청취 디바이스는, 마이크로폰을 통해 핵심 문구를 검출하는 것에 응답하여 어웨이크 모드에 있는 동안:
마이크로폰을 통해 상기 수정된 오디오 데이터 스트림을 캡처하고; 그리고
컨텐츠 제공자로부터 발신된 오디오 데이터 스트림을 나타내는 데이터를 인코딩하는 다수의 오디오 워터마크를 사용하여 수행할 액션을 결정하도록 구성되는 것을 특징으로 하는 재생 디바이스. - 제30항에 있어서,
상기 재생 디바이스는,
무선 입력 연결을 통해 컨텐츠 제공자로부터 비디오 스트림의 오디오 데이터 스트림을 수신하고; 그리고
디지털 오디오 및 비디오 연결을 사용하여 디스플레이에 연결하는 것을 특징으로 하는 재생 디바이스. - 제31항에 있어서,
상기 동작들은,
스피커를 통해 출력하기 위해 상기 수정된 오디오 데이터 스트림을 제공할 때, 디지털 오디오 및 비디오 연결을 사용하여, 디스플레이에 의한 프리젠테이션을 위해 비디오 스트림의 비디오 부분을 제공하는 단계를 더 포함하는 것을 특징으로 하는 재생 디바이스. - 제32항에 있어서,
상기 재생 디바이스는 스피커를 통해 출력하기 위해 상기 수정된 오디오 데이터 스트림과 상기 디스플레이에 의한 비디오 스트림의 비디오 부분의 프리젠테이션을 동기화하는 것을 특징으로 하는 재생 디바이스. - 제31항에 있어서,
상기 재생 디바이스는 디지털 오디오 및 비디오 연결을 사용하여 텔레비전에 연결되고, 상기 텔레비전은 디스플레이 및 스피커를 포함하는 것을 특징으로 하는 재생 디바이스. - 제30항에 있어서,
상기 재생 디바이스는 스피커를 포함하는 것을 특징으로 하는 재생 디바이스. - 제30항에 있어서,
상기 청취 디바이스는 스피커와 동일한 방에 위치하는 것을 특징으로 하는 재생 디바이스. - 제30항에 있어서,
상기 수정된 오디오 데이터 스트림의 다수의 오디오 워터마크의 일부는 다른 다수의 오디오 워터마크와 상이한 데이터를 인코딩하는 것을 특징으로 하는 재생 디바이스. - 제30항에 있어서,
상기 다수의 오디오 워터마크 각각은 동일한 데이터를 인코딩하는 것을 특징으로 하는 재생 디바이스.
Applications Claiming Priority (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US15/824,183 US10276175B1 (en) | 2017-11-28 | 2017-11-28 | Key phrase detection with audio watermarking |
| US15/824,183 | 2017-11-28 | ||
| KR1020197035499A KR102363872B1 (ko) | 2017-11-28 | 2018-08-03 | 오디오 워터 마킹을 이용한 키 구문 검출 |
| PCT/US2018/045185 WO2019108275A1 (en) | 2017-11-28 | 2018-08-03 | Key phrase detection with audio watermarking |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020197035499A Division KR102363872B1 (ko) | 2017-11-28 | 2018-08-03 | 오디오 워터 마킹을 이용한 키 구문 검출 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20220027251A true KR20220027251A (ko) | 2022-03-07 |
| KR102469262B1 KR102469262B1 (ko) | 2022-11-22 |
Family
ID=63245115
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020197035499A Active KR102363872B1 (ko) | 2017-11-28 | 2018-08-03 | 오디오 워터 마킹을 이용한 키 구문 검출 |
| KR1020227004628A Active KR102469262B1 (ko) | 2017-11-28 | 2018-08-03 | 오디오 워터 마킹을 이용한 키 구문 검출 |
Family Applications Before (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020197035499A Active KR102363872B1 (ko) | 2017-11-28 | 2018-08-03 | 오디오 워터 마킹을 이용한 키 구문 검출 |
Country Status (6)
| Country | Link |
|---|---|
| US (4) | US10276175B1 (ko) |
| EP (4) | EP3828741B1 (ko) |
| JP (2) | JP6883119B2 (ko) |
| KR (2) | KR102363872B1 (ko) |
| CN (2) | CN110692055B (ko) |
| WO (1) | WO2019108275A1 (ko) |
Families Citing this family (21)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US10276175B1 (en) | 2017-11-28 | 2019-04-30 | Google Llc | Key phrase detection with audio watermarking |
| US11032580B2 (en) | 2017-12-18 | 2021-06-08 | Dish Network L.L.C. | Systems and methods for facilitating a personalized viewing experience |
| US10365885B1 (en) * | 2018-02-21 | 2019-07-30 | Sling Media Pvt. Ltd. | Systems and methods for composition of audio content from multi-object audio |
| US10692496B2 (en) * | 2018-05-22 | 2020-06-23 | Google Llc | Hotword suppression |
| US10950249B2 (en) * | 2018-09-25 | 2021-03-16 | Amazon Technologies, Inc. | Audio watermark encoding/decoding |
| US10978081B2 (en) * | 2018-09-25 | 2021-04-13 | Amazon Technologies, Inc. | Audio watermark encoding/decoding |
| RU2767962C2 (ru) | 2020-04-13 | 2022-03-22 | Общество С Ограниченной Ответственностью «Яндекс» | Способ и система для распознавания воспроизведенного речевого фрагмента |
| US11714595B1 (en) * | 2020-08-07 | 2023-08-01 | mmhmm inc. | Adaptive audio for immersive individual conference spaces |
| CN113516991A (zh) * | 2020-08-18 | 2021-10-19 | 腾讯科技(深圳)有限公司 | 基于群组会话的音频播放、设备管理方法及装置 |
| US11776549B2 (en) * | 2020-11-06 | 2023-10-03 | Google Llc | Multi-factor audio watermarking |
| US12494857B2 (en) * | 2021-03-29 | 2025-12-09 | Jvckenwood Corporation | Broadcasting contextual information through modification of audio and video interfaces |
| US11595703B2 (en) * | 2021-04-22 | 2023-02-28 | Shopify Inc. | Systems and methods for controlling transmission of live media streams |
| US11915711B2 (en) | 2021-07-20 | 2024-02-27 | Direct Cursus Technology L.L.C | Method and system for augmenting audio signals |
| US12136428B1 (en) * | 2021-09-07 | 2024-11-05 | Amazon Technologies, Inc. | Audio watermarking |
| JP7267636B1 (ja) | 2021-10-21 | 2023-05-02 | 株式会社アートクリフ | 情報処理装置、情報処理システム、情報処理方法およびプログラム |
| US12494219B1 (en) | 2022-06-29 | 2025-12-09 | Amazon Technologies, Inc. | Decoding audio watermarks using time shifts |
| US12354622B1 (en) | 2022-06-29 | 2025-07-08 | Amazon Technologies, Inc. | Extended audio watermarks |
| US12249344B1 (en) * | 2022-06-29 | 2025-03-11 | Amazon Technologies, Inc. | Extended audio watermarks |
| US12067994B2 (en) * | 2022-07-27 | 2024-08-20 | Cerence Operating Company | Tamper-robust watermarking of speech signals |
| US11818443B1 (en) * | 2022-12-02 | 2023-11-14 | Roku, Inc. | Methods and systems for determining creation attributes of video content |
| US20240231749A1 (en) * | 2023-01-10 | 2024-07-11 | Sony Group Corporation | Configuration of platform application with audio profile of a user |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20170004956A (ko) * | 2014-10-09 | 2017-01-11 | 구글 인코포레이티드 | 다수의 디바이스에서의 핫워드 검출 |
| KR20170045123A (ko) * | 2015-10-16 | 2017-04-26 | 구글 인코포레이티드 | 핫 워드 인식 |
Family Cites Families (64)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| FR2681997A1 (fr) | 1991-09-30 | 1993-04-02 | Arbitron Cy | Procede et dispositif d'identification automatique d'un programme comportant un signal sonore. |
| US7562392B1 (en) | 1999-05-19 | 2009-07-14 | Digimarc Corporation | Methods of interacting with audio and ambient music |
| US6505160B1 (en) | 1995-07-27 | 2003-01-07 | Digimarc Corporation | Connected audio and other media objects |
| US5708478A (en) | 1996-06-26 | 1998-01-13 | Sun Microsystems, Inc. | Computer system for enabling radio listeners/television watchers to obtain advertising information |
| US8538886B1 (en) * | 1998-08-31 | 2013-09-17 | Google Inc. | Watermarking system and methodology for digital multimedia content |
| CA2344858C (en) | 1998-12-21 | 2006-07-04 | Roke Manor Research Limited | Acoustically activated marketing device |
| US7664264B2 (en) | 1999-03-24 | 2010-02-16 | Blue Spike, Inc. | Utilizing data reduction in steganographic and cryptographic systems |
| US6871180B1 (en) | 1999-05-25 | 2005-03-22 | Arbitron Inc. | Decoding of information in audio signals |
| EP1249002B1 (en) | 2000-01-13 | 2011-03-16 | Digimarc Corporation | Authenticating metadata and embedding metadata in watermarks of media signals |
| US6737957B1 (en) | 2000-02-16 | 2004-05-18 | Verance Corporation | Remote control signaling using audio watermarks |
| US6990453B2 (en) | 2000-07-31 | 2006-01-24 | Landmark Digital Services Llc | System and methods for recognizing sound and music signals in high noise and distortion |
| KR20120039749A (ko) | 2000-09-13 | 2012-04-25 | 스트라토스 오디오, 인코포레이티드 | 미디어 콘텐츠 주문 및 배달 방법 및 시스템 |
| JP2002091455A (ja) * | 2000-09-19 | 2002-03-27 | Matsushita Electric Ind Co Ltd | 端末装置及び電子音楽配信システム |
| DE60107710T2 (de) * | 2000-10-20 | 2005-12-01 | Koninklijke Philips Electronics N.V. | Einrichtung und anordnung zur wiedergabe |
| US6954790B2 (en) | 2000-12-05 | 2005-10-11 | Interactive People Unplugged Ab | Network-based mobile workgroup system |
| US7363278B2 (en) | 2001-04-05 | 2008-04-22 | Audible Magic Corporation | Copyright detection and protection system and method |
| KR100552468B1 (ko) * | 2001-07-19 | 2006-02-15 | 삼성전자주식회사 | 음성인식에 따른 오동작을 방지 및 음성인식율을 향상 할수 있는 전자기기 및 방법 |
| US7181159B2 (en) | 2002-03-07 | 2007-02-20 | Breen Julian H | Method and apparatus for monitoring audio listening |
| JP2004222129A (ja) * | 2003-01-17 | 2004-08-05 | Matsushita Electric Ind Co Ltd | 電子透かし多重化装置および電子透かし検出装置 |
| US7342906B1 (en) | 2003-04-04 | 2008-03-11 | Airespace, Inc. | Distributed wireless network security system |
| US20040260701A1 (en) | 2003-05-27 | 2004-12-23 | Juha Lehikoinen | System and method for weblog and sharing in a peer-to-peer environment |
| US6910820B2 (en) | 2003-07-25 | 2005-06-28 | 3M Innovative Properties Company | Apparatus and method for handling linerless label tape |
| JP2005176021A (ja) | 2003-12-12 | 2005-06-30 | Toshiba Corp | 情報処理装置およびプログラム |
| US20050219366A1 (en) | 2004-03-31 | 2005-10-06 | Hollowbush Richard R | Digital audio-video differential delay and channel analyzer |
| US7623823B2 (en) | 2004-08-31 | 2009-11-24 | Integrated Media Measurement, Inc. | Detecting and measuring exposure to media content items |
| KR100617165B1 (ko) * | 2004-11-19 | 2006-08-31 | 엘지전자 주식회사 | 워터마크 삽입/검출 기능을 갖는 오디오 부호화/복호화장치 및 방법 |
| JP4715239B2 (ja) | 2005-03-04 | 2011-07-06 | 沖電気工業株式会社 | 無線アクセス装置、無線アクセス方法及び無線ネットワーク |
| WO2007001953A1 (en) | 2005-06-21 | 2007-01-04 | Motorola, Inc. | Method, apparatus, and system for establishing a direct route between agents of a sender node and a receiver node |
| US8254308B1 (en) | 2006-01-05 | 2012-08-28 | Sprint Spectrum L.P. | Method and system for acoustically triggering electronic coupon retrieval |
| US7774854B1 (en) | 2006-03-31 | 2010-08-10 | Verint Americas Inc. | Systems and methods for protecting information |
| US7881657B2 (en) | 2006-10-03 | 2011-02-01 | Shazam Entertainment, Ltd. | Method for high-throughput identification of distributed broadcast content |
| US8245284B2 (en) | 2006-10-05 | 2012-08-14 | Microsoft Corporation | Extensible network discovery |
| US8166534B2 (en) | 2007-05-18 | 2012-04-24 | Microsoft Corporation | Incorporating network connection security levels into firewall rules |
| AU2008321318B2 (en) * | 2007-11-12 | 2012-11-01 | The Nielsen Company (Us), Llc | Methods and apparatus to perform audio watermarking and watermark detection and extraction |
| MY147120A (en) | 2008-09-10 | 2012-10-31 | Mimos Berhad | Method of integrating quantum key distribution with internet key exchange protocol |
| CN101464982A (zh) * | 2009-01-21 | 2009-06-24 | 北京中科信利技术有限公司 | 一种基于音频水印的手机支付认证系统及方法 |
| US8577345B2 (en) | 2009-03-02 | 2013-11-05 | First Data Corporation | Systems, methods, and apparatus for providing promotion information to a mobile device |
| US8577346B2 (en) | 2009-03-02 | 2013-11-05 | First Data Corporation | Systems, methods, and apparatus for receiving promotion information by a mobile device |
| JP2011091619A (ja) * | 2009-10-22 | 2011-05-06 | Sony Corp | 送信装置、送信方法、受信装置、受信方法、プログラム、および放送システム |
| US8650129B2 (en) | 2010-01-20 | 2014-02-11 | American Express Travel Related Services Company, Inc. | Dynamically reacting policies and protections for securing mobile financial transaction data in transit |
| US8645132B2 (en) | 2011-08-24 | 2014-02-04 | Sensory, Inc. | Truly handsfree speech recognition in high noise environments |
| JP5793865B2 (ja) | 2010-12-28 | 2015-10-14 | 富士通株式会社 | 電子透かし埋め込み装置、電子透かし埋め込み用コンピュータプログラム及び電子透かし検出装置ならびに電子透かし検出用コンピュータプログラム |
| US8611506B2 (en) * | 2011-07-08 | 2013-12-17 | Blackberry Limited | Methods and apparatus to facilitate voicemail interaction |
| WO2013169868A1 (en) | 2012-05-08 | 2013-11-14 | Actiwave Ab | System and method for forming media networks from loosely coordinated media|rendering devices |
| US8869222B2 (en) | 2012-09-13 | 2014-10-21 | Verance Corporation | Second screen content |
| WO2014103099A1 (ja) | 2012-12-28 | 2014-07-03 | パナソニック株式会社 | 音声認識付き機器及び音声認識方法 |
| JP2014187490A (ja) * | 2013-03-22 | 2014-10-02 | Yamaha Corp | 放送受信装置及び端末装置 |
| CN104138596A (zh) | 2014-07-22 | 2014-11-12 | 张喜田 | 重组灵芝免疫调节蛋白在延缓衰老药物中的应用 |
| JP6258981B2 (ja) * | 2014-07-29 | 2018-01-10 | ヤマハ株式会社 | プログラムおよび情報処理方法 |
| JP5871088B1 (ja) | 2014-07-29 | 2016-03-01 | ヤマハ株式会社 | 端末装置、情報提供システム、情報提供方法およびプログラム |
| US10896151B2 (en) | 2014-08-08 | 2021-01-19 | Nokia Technologies Oy | Method and apparatus for providing a visual indication of the copy history |
| US9548053B1 (en) | 2014-09-19 | 2017-01-17 | Amazon Technologies, Inc. | Audible command filtering |
| US9424841B2 (en) * | 2014-10-09 | 2016-08-23 | Google Inc. | Hotword detection on multiple devices |
| US9818414B2 (en) | 2015-06-04 | 2017-11-14 | Intel Corporation | Dialogue system with audio watermark |
| US9928840B2 (en) * | 2015-10-16 | 2018-03-27 | Google Llc | Hotword recognition |
| CN105392022B (zh) * | 2015-11-04 | 2019-01-18 | 北京符景数据服务有限公司 | 基于音频水印的信息交互方法与装置 |
| US10074364B1 (en) | 2016-02-02 | 2018-09-11 | Amazon Technologies, Inc. | Sound profile generation based on speech recognition results exceeding a threshold |
| US9728188B1 (en) * | 2016-06-28 | 2017-08-08 | Amazon Technologies, Inc. | Methods and devices for ignoring similar audio being received by a system |
| US10079024B1 (en) * | 2016-08-19 | 2018-09-18 | Amazon Technologies, Inc. | Detecting replay attacks in voice-based authentication |
| CA3045628C (en) | 2016-12-19 | 2025-09-23 | Rovi Guides, Inc. | Systems and methods for distinguishing valid voice instructions from false voice instructions in an interactive multimedia guidance application |
| US10395650B2 (en) | 2017-06-05 | 2019-08-27 | Google Llc | Recorded media hotword trigger suppression |
| US11445235B2 (en) * | 2017-10-24 | 2022-09-13 | Comcast Cable Communications, Llc | Determining context to initiate interactivity |
| US10152966B1 (en) * | 2017-10-31 | 2018-12-11 | Comcast Cable Communications, Llc | Preventing unwanted activation of a hands free device |
| US10276175B1 (en) | 2017-11-28 | 2019-04-30 | Google Llc | Key phrase detection with audio watermarking |
-
2017
- 2017-11-28 US US15/824,183 patent/US10276175B1/en active Active
-
2018
- 2018-08-03 WO PCT/US2018/045185 patent/WO2019108275A1/en not_active Ceased
- 2018-08-03 KR KR1020197035499A patent/KR102363872B1/ko active Active
- 2018-08-03 EP EP21152004.4A patent/EP3828741B1/en active Active
- 2018-08-03 EP EP18756127.9A patent/EP3529804B1/en active Active
- 2018-08-03 CN CN201880036483.7A patent/CN110692055B/zh active Active
- 2018-08-03 JP JP2019566262A patent/JP6883119B2/ja active Active
- 2018-08-03 EP EP19218608.8A patent/EP3664091B1/en active Active
- 2018-08-03 EP EP23153016.3A patent/EP4202737B1/en active Active
- 2018-08-03 CN CN202110376125.4A patent/CN113138743B/zh active Active
- 2018-08-03 KR KR1020227004628A patent/KR102469262B1/ko active Active
-
2019
- 2019-03-19 US US16/358,109 patent/US10777210B2/en active Active
-
2020
- 2020-08-13 US US16/992,647 patent/US11211076B2/en active Active
-
2021
- 2021-02-01 JP JP2021014286A patent/JP7160967B2/ja active Active
- 2021-12-06 US US17/457,820 patent/US11727947B2/en active Active
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20170004956A (ko) * | 2014-10-09 | 2017-01-11 | 구글 인코포레이티드 | 다수의 디바이스에서의 핫워드 검출 |
| KR20170045123A (ko) * | 2015-10-16 | 2017-04-26 | 구글 인코포레이티드 | 핫 워드 인식 |
Non-Patent Citations (1)
| Title |
|---|
| Saraju P. Mohanty. Digital watermarking: A tutorial review. URL: http://www. csee. usf. edu/~ smohanty/research/Reports/WMSurvey1999Mohanty. 1999.* * |
Also Published As
| Publication number | Publication date |
|---|---|
| US11211076B2 (en) | 2021-12-28 |
| EP3828741A1 (en) | 2021-06-02 |
| JP2021071733A (ja) | 2021-05-06 |
| EP3664091B1 (en) | 2021-02-17 |
| KR20190141767A (ko) | 2019-12-24 |
| CN113138743A (zh) | 2021-07-20 |
| EP4202737B1 (en) | 2024-11-27 |
| US10777210B2 (en) | 2020-09-15 |
| KR102363872B1 (ko) | 2022-02-16 |
| JP7160967B2 (ja) | 2022-10-25 |
| KR102469262B1 (ko) | 2022-11-22 |
| JP6883119B2 (ja) | 2021-06-09 |
| JP2020526781A (ja) | 2020-08-31 |
| CN110692055B (zh) | 2021-05-04 |
| US11727947B2 (en) | 2023-08-15 |
| WO2019108275A1 (en) | 2019-06-06 |
| CN113138743B (zh) | 2022-10-14 |
| US20190214030A1 (en) | 2019-07-11 |
| US20200372922A1 (en) | 2020-11-26 |
| US10276175B1 (en) | 2019-04-30 |
| EP3529804B1 (en) | 2020-02-05 |
| US20220093114A1 (en) | 2022-03-24 |
| EP3664091A1 (en) | 2020-06-10 |
| EP4202737A1 (en) | 2023-06-28 |
| EP3828741B1 (en) | 2023-03-08 |
| EP3529804A1 (en) | 2019-08-28 |
| CN110692055A (zh) | 2020-01-14 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR102363872B1 (ko) | 오디오 워터 마킹을 이용한 키 구문 검출 | |
| US12094472B2 (en) | Server side hotwording | |
| KR102451034B1 (ko) | 화자 구분 | |
| KR20140074549A (ko) | 음성인식 기술을 이용한 상황 인식 서비스 제공 방법 및 장치 | |
| CN104170413A (zh) | 基于环境上下文控制移动装置中的应用程序 | |
| US10313845B2 (en) | Proactive speech detection and alerting |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A107 | Divisional application of patent | ||
| PA0104 | Divisional application for international application |
Comment text: Divisional Application for International Patent Patent event code: PA01041R01D Patent event date: 20220210 Application number text: 1020197035499 Filing date: 20191129 |
|
| PA0201 | Request for examination | ||
| PG1501 | Laying open of application | ||
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20220504 Patent event code: PE09021S01D |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20220822 |
|
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20221116 Patent event code: PR07011E01D |
|
| PR1002 | Payment of registration fee |
Payment date: 20221117 End annual number: 3 Start annual number: 1 |
|
| PG1601 | Publication of registration |