KR101001839B1 - 오디오 신호 역상관기 - Google Patents
오디오 신호 역상관기 Download PDFInfo
- Publication number
- KR101001839B1 KR101001839B1 KR1020087025014A KR20087025014A KR101001839B1 KR 101001839 B1 KR101001839 B1 KR 101001839B1 KR 1020087025014 A KR1020087025014 A KR 1020087025014A KR 20087025014 A KR20087025014 A KR 20087025014A KR 101001839 B1 KR101001839 B1 KR 101001839B1
- Authority
- KR
- South Korea
- Prior art keywords
- signal
- audio signal
- audio
- partial
- channel
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 582
- 230000010363 phase shift Effects 0.000 claims abstract description 200
- 239000003607 modifier Substances 0.000 claims abstract description 11
- 230000003595 spectral effect Effects 0.000 claims description 129
- 230000006870 function Effects 0.000 claims description 84
- 238000000034 method Methods 0.000 claims description 78
- 230000008859 change Effects 0.000 claims description 48
- 238000012545 processing Methods 0.000 claims description 25
- 230000015572 biosynthetic process Effects 0.000 claims description 23
- 238000003786 synthesis reaction Methods 0.000 claims description 23
- 238000004590 computer program Methods 0.000 claims description 14
- 230000001934 delay Effects 0.000 claims description 10
- 230000000737 periodic effect Effects 0.000 claims description 7
- 230000002123 temporal effect Effects 0.000 claims description 5
- 239000000284 extract Substances 0.000 claims description 2
- 230000008878 coupling Effects 0.000 claims 1
- 238000010168 coupling process Methods 0.000 claims 1
- 238000005859 coupling reaction Methods 0.000 claims 1
- 238000007781 pre-processing Methods 0.000 description 24
- 238000010586 diagram Methods 0.000 description 19
- 230000000875 corresponding effect Effects 0.000 description 16
- 230000002596 correlated effect Effects 0.000 description 15
- 230000008447 perception Effects 0.000 description 15
- 238000012546 transfer Methods 0.000 description 10
- 238000001914 filtration Methods 0.000 description 9
- 238000013459 approach Methods 0.000 description 5
- 230000015556 catabolic process Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000006731 degradation reaction Methods 0.000 description 4
- 230000003111 delayed effect Effects 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 230000009977 dual effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000001360 synchronised effect Effects 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 230000004075 alteration Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008825 perceptual sensitivity Effects 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M9/00—Arrangements for interconnection not involving centralised switching
- H04M9/08—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
- H04M9/082—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M9/00—Arrangements for interconnection not involving centralised switching
- H04M9/08—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Stereophonic System (AREA)
- Filters That Use Time-Delay Elements (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
- Seasonings (AREA)
- Thermistors And Varistors (AREA)
Abstract
Description
Claims (32)
- 입력 오디오 신호(112; 310)로부터 출력 오디오 신호(170; 352)를 도출하기 위한 오디오 신호 역상관기(audio signal decorrelator, 100; 300)로서,상기 입력 오디오 신호로부터 제1 부분 신호(first partial signal, 120; 314) 및 제2 부분 신호(second partial signal, 122; 316)를 추출하는 주파수 분석기(frequency analyzer, 110; 312)로서, 상기 제1 부분 신호는 제1 오디오 주파수 범위 내의 오디오 컨텐트(audio content)를 기술하고, 상기 제2 부분 신호는 제2 오디오 주파수 범위 내의 오디오 컨텐트를 기술하고, 상기 제1 오디오 주파수 범위는 상기 제2 오디오 주파수 범위와 비교하여 더 높은 주파수들을 갖는, 주파수 분석기;상기 제1 부분 신호에 적용되는 시간 변화 위상 시프트(time variant phase shift) 또는 시간 변화 지연(time variant delay)의 변조 크기(modulation amplitude)가 상기 제2 부분 신호에 적용된 시간 변화 위상 시프트 또는 시간 변화 지연의 변조 크기보다 더 높게 되도록 하여, 상기 제1 부분 신호를 변경하여 제1 처리된 부분 신호(150; 342)를 획득하고 제2 부분 신호를 변경하여 제2 처리된 부분 신호(152; 344)를 획득하거나, 또는 시간 변화 위상 시프트 또는 시간 변화 지연이 상기 제1 부분 신호에 적용되도록 상기 제1 부분 신호만을 변경하는 부분 신호 변경기(partial signal modifier, 140; 332, 334, 336); 및출력 오디오 신호(170; 352)를 획득하기 위해, 상기 제1 처리된 부분 신호 및 상기 제2 처리된 부분 신호를 결합하거나 또는 상기 제1 처리된 부분 신호 및 상기 제2 부분 신호를 결합하는 신호 결합기(signal combiner, 160; 350)를 포함하는 오디오 신호 역상관기.
- 제 1 항에 있어서,상기 주파수 분석기(110; 312)는 상기 입력 오디오 신호(112; 310)를 적어도 두 개의 서브밴드 신호들(120, 122; 214, 316, 318)로 분해하는 분석 필터뱅크(analysis filterbank)를 포함하고, 제1 서브밴드 신호(first subband signal)는 상기 제1 오디오 주파수 범위 내 오디오 컨텐트를 기술하고, 상기 제1 서브밴드 신호는 상기 제1 부분 신호를 형성하고, 상기 제2 서브밴드 신호(second subband signal)는 상기 제2 오디오 주파수 범위 내 오디오 컨텐트를 기술하고, 상기 제2 서브밴드 신호는 상기 제2 부분 신호를 형성하며;상기 부분 신호 변경기(140; 332, 344, 336)는 상기 제1 처리된 부분 신호(150; 342)를 획득하기 위해 적어도 상기 제1 서브밴드 신호의 지연을 변조(modulate)하거나, 또는 상기 제1 처리된 부분 신호를 획득하기 위해 상기 제1 서브밴드 신호의 지연을 변조(modulate)하고 상기 제2 처리된 부분 신호(152; 344)를 획득하기 위해 상기 제2 서브밴드 신호의 지연을 변조(modulate)하며;상기 신호 결합기(160; 350)는 시간 영역 신호로서 상기 출력 오디오 신호(170; 352)를 획득하기 위해 상기 처리된 제1 부분 신호 및 제2 부분 신호를 결합하거나, 시간 영역 신호로서 상기 출력 오디오 신호를 획득하기 위해 상기 처리된 제1 부분 신호 및 상기 처리된 제2 부분 신호를 결합하는 합성 필터뱅크(synthesis filterbank)를 포함하는, 오디오 신호 역상관기.
- 제 1 항에 있어서,상기 주파수 분석기(110; 312)는 상기 입력 오디오 신호(112; 312)를 적어도 두 개의 스펙트럴 계수들(spectral coefficients)로 분해하는 분석 필터뱅크를 포함하고, 제1 스펙트럴 계수는 상기 제1 오디오 주파수 범위 내 오디오 컨텐트를 기술하고, 상기 제1 스펙트럴 계수는 제1 부분 신호(120; 314)를 형성하고, 제2 스펙트럴 계수는 상기 제2 오디오 주파수 범위 내 오디오 컨텐트를 기술하고, 상기 제2 스펙트럴 계수는 상기 제2 부분 신호(122; 316)를 형성하며;상기 부분 신호 변경기(140; 332, 344, 336)는 상기 제1 처리된 부분 신호(150; 342)를 획득하기 위해 적어도 상기 제1 스펙트럴 계수의 위상을 변조하거나, 또는 상기 제1 처리된 부분 신호를 획득하기 위해 상기 제1 스펙트럴 계수의 위상을 변조하고 제2 처리된 부분 신호(152; 344)를 획득하기 위해 상기 제2 스펙트럴 계수의 위상을 변조하며;상기 신호 결합기(160; 350)는, 시간 영역 신호로서 상기 출력 오디오 신호(170; 352)를 획득하기 위해 상기 처리된 제1 부분 신호 및 상기 제2 부분 신호를 결합하거나 또는, 시간 영역 신호로서 상기 출력 오디오 신호를 획득하기 위해 상기 처리된 제1 부분 신호 및 상기 처리된 제2 부분 신호를 결합하는 합성 필터뱅크(synthesis filterbank)를 포함하는, 오디오 신호 역상관기(100; 300).
- 제 3 항에 있어서,상기 주파수 분석기(110; 312)는, 상기 제1 부분 신호(120; 314)가 제1 스펙트럴 계수들의 시간 시퀀스를 포함하고 상기 제2 부분 신호(122; 316)가 제2 스펙트럴 계수들의 시간 시퀀스(time sequence)를 포함하도록, 상기 입력 오디오 신호(112; 310)의 시간 블록들(temporal blocks)을 복수의 스펙트럴 계수들로 분해하며;상기 부분 신호 변경기(140; 332, 334, 336)는 처리된 제1 스펙트럴 계수들의 시간 시퀀스로서, 상기 제1 처리된 부분 신호(150; 342)를 획득하기 위해 적어도 상기 제1 부분 신호를 처리하고,상기 합성 필터뱅크(160; 350)는 상기 제1 처리된 부분 신호의 스펙트럴 계수들의 시간 시퀀스 및 상기 제2 부분 신호 또는 상기 제2 처리된 부분 신호의 스펙트럴 계수들의 시간 시퀀스를 결합하여 상기 시간 영역 출력 오디오 신호(170; 352)를 생성하는 오디오 신호 역상관기.
- 제 6 항에 있어서, 상기 변조 함수 생성기(362, 364, 366)는,상기 제1 복수의 시간 변화 복소 값들의 시간 변화 복소 값들의 위상의 시간 변화로 인해 상기 제1 부분 신호(120)에 의해 표현되는 상기 오디오 컨텐트에 발생된 변조 주파수가 10 Hz보다 작게 되는 방식으로 상기 변조 함수를 생성하는 오디오 신호 역상관기.
- 제 6 항에 있어서, 상기 변조 함수 생성기(362, 364, 366)는,시간의 랜덤(random) 또는 슈도-랜덤(pseudo-random) 함수를 생성하는 오디오 신호 역상관기.
- 제 6 항에 있어서,상기 부분 신호 변경기(140; 332, 334, 336)는 상기 제2 스펙트럴 계수 또는 상기 제2 스펙트럴 계수들을 미리 정해진, 동일한 시간 불변 크기(time invariant magnitude) 및 시간 변화 위상(time variant phase)을 갖는 제2 복수의 시간 변화 복소 값들로 곱하거나 나눔으로써 상기 제2 부분 신호(122; 360)의 스펙트럴 계수들의 위상들을 변조하며;
- 제 11 항에 있어서,상기 제1 복수의 시간 변화 복소 값들의 복소 값들의 시간 변화 위상을 획득하기 위해 상기 변조 시간 함수를 제1 시간 불변 스칼라(scalar) 값으로 스케일(scale)하고, 상기 제2 복수의 시간 변화 복소 값들의 복소 값들의 시간 변화 위상을 획득하기 위해 상기 변조 시간 함수를 제2 시간 불변 스칼라 값으로 스케일하는 스케일러(scaler)를 더 포함하고;여기서, 상기 제1 부분 신호(120; 314)에 적용된 위상 시프트 변조 크기가 상기 제2 부분 신호(122; 316)에 적용된 위상 시프트 변조 크기보다 더 크도록, 상기 제1 스칼라 값의 절대값 또는 크기(magnitude)가 상기 제2 스칼라 값의 절대값 또는 크기(magnitude)보다 더 큰, 오디오 신호 역상관기.
- 제 1 항에 있어서,상기 주파수 분석기(110; 312)는 상기 입력 오디오 신호(310)로부터 제3 부분 신호(318)를 추출하고, 상기 제3 부분 신호는 제3 오디오 주파수 범위 내 오디오 컨텐트를 기술하고, 상기 제1 오디오 주파수 범위는 상기 제2 오디오 주파수 범위와 비교하여 더 높은 주파수들을 갖고, 상기 제2 오디오 주파수 범위는 상기 제3 오디오 주파수 범위와 비교하여 더 높은 주파수들을 가지며;상기 부분 신호 변경기(332, 334, 336)는, 상기 제2 부분 신호에 적용된 시간 변화 위상 시프트 변조()보다 더 큰 변조 크기를 포함하는 시간 변화 위상 시프트 변조()가 상기 제1 부분 신호에 적용되도록 상기 제1 부분 신호(314)를 변경하여 제1 처리된 부분 신호(342)를 획득하고, 상기 제2 부분 신호(316)를 변경하여 상기 제2 처리된 부분 신호(344)를 획득하고, 상기 제3 부분 신호(318)를 변경하여 제3 처리된 부분 신호(346)를 획득하고, 여기서, 상기 제2 부분 신호에 적용된 상기 시간 변화 위상 시프트의 변조 크기가 상기 제3 부분 신호에 적용된 시간 변화 위상 시프트의 변조 크기보다 더 크며,상기 신호 결합기(350)는 상기 출력 오디오 신호(352)를 획득하기 위해, 상기 제1 처리된 부분 신호(342), 상기 제2 처리된 부분 신호(344) 및 상기 제3 처리된 부분 신호(346)를 결합하는, 오디오 신호 역상관기.
- 제 1 항에 있어서,상기 제1 오디오 주파수 범위의 하단 주파수 경계(lower frequency border)가 1.1 kHz보다 더 큰 오디오 신호 역상관기.
- 제1 역상관된 출력 오디오 신호(230; 422) 및 제2 역상관된 출력 오디오 신호(232; 426)을 획득하기 위해, 제1 채널 오디오 신호(210; 410) 및 제2 채널 오디오 신호(212; 412)를 역상관하기 위한 멀티 채널 오디오 신호 프로세서(200, 400: 500)로서,제 1 항에 따른 제1 오디오 신호 역상관기(first audio signal decorrelator, 100; 300; 220; 430, 434, 442)를 포함하되, 상기 제1 오디오 신호 역상관기는 상기 입력 오디오 신호(112; 310)로서 상기 제1 채널 오디오 신호를 수신하고, 상기 제1 오디오 신호 역상관기의 출력 오디오 신호(170; 362)는 상기 제1 역상관된 출력 오디오 신호를 형성하며;상기 제2 채널 오디오 신호(212; 412) 또는 상기 제2 채널 오디오 신호로부터 도출된 신호가 상기 제2 역상관된 출력 오디오 신호(232; 426)를 형성하며;상기 제1 오디오 신호 역상관기는, 상기 제1 역상관된 출력 오디오 신호 및 상기 제2 역상관된 출력 오디오 신호의 상기 제1 오디오 주파수 범위 내 오디오 컨텐츠가 상기 제1 역상관된 출력 오디오 신호 및 상기 제2 역상관된 오디오 출력 신호의 제2 오디오 주파수 범위 내 오디오 컨텐츠보다 서로에 관하여 더 강한 시간 변화 위상 시프트 변조를 포함하도록 하는, 멀티 채널 오디오 신호 프로세서.
- 제 15 항에 있어서,상기 제2 채널 오디오 신호(212; 412)로부터 제3 부분 신호(120; 314; Pr,l(k)) 및 제4 부분 신호(122; 316; pr,2(k))를 추출하는 주파수 분석기로서, 상기 제3 부분 신호는 제3 오디오 주파수 범위 내 오디오 컨텐트를 기술하고, 상기 제4 부분 신호는 제4 오디오 주파수 범위 내 오디오 컨텐트를 기술하고, 상기 제3 오디오 주파수 범위는 상기 제4 오디오 주파수 범위보다 더 높은 주파수들을 포함하는, 주파수 분석기(110; 312; 450);상기 제3 부분 신호에 적용된 시간 변화 위상 시프트 또는 시간 변화 지연의 변조 크기가 상기 제4 부분 신호에 적용된 시간 변화 위상 시프트 또는 시간 변화 지연의 변조 크기보다 더 크도록, 상기 제3 부분 신호를 변경하여 제3 처리된 부분 신호를 획득하거나, 또는 시간 변화 위상 시프트 또는 시간 변화 지연이 상기 제3 부분 신호에 적용되도록, 상기 제3 부분 신호만을 변경하는, 부분 신호 변경기(440; 332, 334, 336; 454); 및상기 제2 역상관된 출력 신호를 획득하기 위해 상기 제3 처리된 부분 신호 및 상기 제4 처리된 부분 신호를 결합하거나, 또는 상기 제2 역상관된 출력 신호를 획득하기 위해 상기 제3 처리된 부분 신호 및 상기 제4 부분 신호를 결합하는 신호 결합기를 포함하는 제2 오디오 신호 역상관기(100; 300; 250; 450, 454, 462)를 더 포함하는 멀티 채널 오디오 신호 프로세서.
- 제 15 항에 있어서,제 1 항에 따른 제2 오디오 신호 역상관기(100; 300; 250; 450, 454, 462)를 더 포함하되,상기 제1 오디오 신호 역상관기의 제1 오디오 주파수 범위는 상기 제2 오디오 신호 역상관기의 상기 제2 오디오 주파수 범위보다 더 높은 주파수들을 포함하고,상기 제1 오디오 신호 역상관기의 제1 오디오 주파수 범위는 제1 오버랩 오디오 주파수 범위에서 상기 제2 오디오 신호 역상관기의 상기 제1 오디오 주파수 범위와 오버랩되고;상기 제1 오디오 신호 역상관기의 제2 오디오 주파수 범위는 제2 오버랩 오디오 주파수 범위에서 상기 제2 오디오 신호 역상관기의 제2 오디오 주파수 범위와 오버랩되고;상기 제2 오디오 신호 역상관기는 상기 입력 오디오 신호(112; 310)로서 제2 채널 입력 오디오 신호(212)를 수신하고;상기 제2 오디오 신호 역상관기의 상기 출력 오디오 신호(170; 352)는 상기 역상관된 제2 출력 오디오 신호(232; 426)를 형성하고;상기 제1 오디오 신호 역상관기 및 상기 제2 오디오 신호 역상관기는, 상기 제1 오디오 신호 역상관기의 상기 제1 부분 신호에 발생된 상기 시간 변화 위상 시프트 또는 시간 변화 지연이 상기 제2 오디오 신호 역상관기의 상기 제1 부분 신호에 발생된 상기 시간 변화 위상 시프트 또는 시간 변화 지연과 다르도록 하는, 멀티 채널 오디오 신호 프로세서.
- 제 17 항에 있어서,상기 제1 신호 역상관기(100; 300; 430, 434, 442)는, 제1 위상 시프트 값(zl,1)에 기반하여 상기 제1 신호 역상관기의 제1 오디오 주파수 범위 내 상기 시간 변화 지연 또는 시간 변화 위상 시프트를 조정하고, 제2 위상 시프트 값 (zl,2)에 기반하여 상기 제1 신호 역상관기의 제2 오디오 주파수 범위 내 상기 시간 변화 지연 또는 시간 변화 위상 시프트를 조정하며;상기 제2 오디오 신호 역상관기(100; 300; 450, 454, 462)는 제3 위상 시프트 값 (zr,l)에 기반하여 상기 제2 오디오 신호 역상관기의 제1 오디오 주파수 범위 내 상기 시간 변화 지연 또는 상기 시간 변화 위상 시프트를 조정하고, 제4 위상 시프트 값 (zr,2)에 기반하여 상기 제2 오디오 신호 역상관기의 제2 오디오 주파수 범위 내 상기 시간 변화 지연 또는 시간 변화 위상 시프트를 조정하며;
- 제 18 항에 있어서, 상기 제1 오디오 신호 역상관기(100; 300; 430, 434, 442), 상기 제2 오디오 신호 역상관기(100; 300; 450, 454, 462) 및 상기 스케일러(220a, 220b, 520a, 520b)는,상기 제1 오디오 신호 역상관기에 의해 상기 제1 오버랩 오디오 주파수 범위 내에 적용된 위상 시프트가, 상기 제2 오디오 신호 역상관기에 의해 상기 제1 오버랩 오디오 주파수 범위 내에서 적용된 위상 시프트와 비교할 때 반대 방향을 포함하도록 하고, 상기 제1 오디오 신호 역상관기에 의해 상기 제2 오버랩 오디오 주파수 범위 내에 적용된 위상 시프트가, 상기 제2 오디오 신호 역상관기에 의해 상기 제2 오버랩 오디오 주파수 범위 내에 적용된 위상 시프트에 비교할 때 반대 방향을 포함하도록 하는, 멀티 채널 오디오 신호 프로세서.
- 제 18 항에 있어서, 상기 제1 오디오 신호 역상관기(100; 300; 430, 434, 442), 상기 제2 오디오 신호 역상관기(100; 300; 450, 454, 462) 및 상기 스케일러(220a, 220b, 520a, 520b)는,상기 제1 오디오 신호 역상관기에 의해 상기 제1 오버랩 오디오 주파수 범위 내에 적용된 위상 시프트가 상기 제2 오디오 신호 역상관기에 의해 상기 제1 오버랩 오디오 주파수 범위 내에 적용된 위상 시프트와 동일한 크기(magnitude)를 포함하도록 하고,상기 제1 오디오 신호 역상관기에 의해 상기 제2 오버랩 오디오 주파수 범위 내에 적용된 위상 시프트가 상기 제2 오디오 신호 역상관기에 의해 상기 제2 오버랩 오디오 주파수 범위 내에 적용된 위상 시프트와 동일한 크기(magnitude)를 포함하도록 하는, 멀티 채널 오디오 신호 프로세서.
- 제 17 항에 있어서,상기 제1 오디오 신호 역상관기(100; 300; 430, 434, 442)는 상기 제1 채널 오디오 신호(410)를 적어도 두 개의 스펙트럴 계수들로 분해하도록 하는 분석 필터뱅크(110; 312; 430)를 포함하고, 제1 스펙트럴 계수 (pl,1)는 상기 제1 오디오 주파수 범위 내 오디오 컨텐트를 기술하고, 상기 제1 스펙트럴 계수는 상기 제1 부분 신호를 형성하고, 제2 스펙트럴 계수 (pl,2)는 상기 제2 오디오 주파수 범위 내 오디오 컨텐트를 기술하고, 상기 제2 스펙트럴 계수는 상기 제2 부분 신호를 형성하며;상기 제2 오디오 신호 역상관기(100; 300; 450, 454, 462)는 상기 제2 채널 오디오 신호를 적어도 두 개의 스펙트럴 계수들로 분해하는 분석 필터뱅크(110; 312; 450)를 포함하되, 제3 스펙트럴 계수 (pr,1)는 상기 제2 오디오 주파수 범위 내 오디오 컨텐트를 기술하고, 상기 제3 스펙트럴 계수는 상기 제2 오디오 신호 역상관기의 상기 제1 부분 신호를 기술하고, 상기 제3 스펙트럴 계수는 상기 제2 오디오 신호 역상관기의 상기 제1 부분 신호를 형성하고, 제4 스펙트럴 계수는 상기 제2 오디오 주파수 범위 내 오디오 컨텐트를 기술하고, 상기 제4 스펙트럴 계수는 상기 제2 오디오 신호 역상관기의 상기 제2 부분 신호를 형성하며,상기 멀티 채널 오디오 신호 프로세서, 상기 제1 오디오 신호 역상관기 및 상기 제2 오디오 신호 역상관기는 주어진 시간 간격 내에서 상기 제1 스펙트럴 계수 및 상기 제3 스펙트럴 계수가 서로에 대하여 공액 복소수인 값들로 곱해지도록 하거나, 또는 주어진 시간 간격 내에서 상기 제1 스펙트럴 계수가 크기(magnitude) 1의 복소 값으로 곱해지도록 하고, 상기 제3 스펙트럴 계수가 동일한 복소 값으로 나누어지도록 하는, 멀티 채널 오디오 신호 프로세서.
- 멀티 채널 오디오 신호의 일부인, 제1 채널 오디오 신호(610), 제2 채널 오디오 신호(612), 제3 채널 오디오 신호(614), 제4 채널 오디오 신호(616) 및 제5 채널 오디오 신호(618)를 수신하기 위한 오디오 신호 프로세서(600)에 있어서,상기 제1 멀티 채널 오디오 신호 프로세서(620)는 상기 제1 멀티 채널 오디오 신호 프로세서의 제1 채널 오디오 신호(210, 410)로서 상기 멀티 채널 신호의 상기 제1 채널 오디오 신호(610)를 수신하고, 상기 제1 멀티 채널 오디오 신호 프로세서는 상기 제1 멀티 채널 오디오 신호 프로세서의 제2 채널 오디오 신호(412)로서 상기 멀티 채널 신호의 상기 제2 채널 오디오 신호(612)를 수신하는, 제 15 항에 따른 제1 멀티 채널 오디오 신호 프로세서(200, 400, 500);상기 제2 멀티 채널 오디오 신호 프로세서(630)는 상기 제2 멀티 채널 오디오 신호 프로세서의 제1 채널 오디오 신호(210; 410)로서 상기 멀티 채널 신호의 상기 제3 채널 오디오 신호를 수신하고, 상기 제2 멀티 채널 오디오 신호 프로세서는 상기 제2 멀티 채널 오디오 신호 프로세서의 제2 채널 오디오 신호(212; 412)로서 상기 멀티 채널 신호의 상기 제4 채널 오디오 신호를 수신하는, 제 15 항에 따른 제2 멀티 채널 오디오 신호 프로세서(200; 400; 500); 및상기 오디오 신호 역상관기(640)는 상기 오디오 신호 역상관기의 입력 오디오 신호(112; 310)로서 상기 멀티 채널 신호의 상기 제5 채널 오디오 신호를 수신하는, 제 1 항에 따른 오디오 신호 역상관기(100; 300)를 포함하고,상기 제1 멀티 채널 오디오 신호 프로세서, 상기 제2 멀티 채널 오디오 신호 프로세서 및 상기 오디오 신호 역상관기의 출력 신호들이 역상관된 5-채널 신호를 형성하는, 오디오 신호 프로세서.
- 제 22 항에 있어서,상기 멀티 채널 신호의 상기 제1 채널 오디오 신호가 좌측 전방 스피커 신호이고;상기 멀티 채널 신호의 상기 제2 채널 오디오 신호가 우측 전방 스피커 신호이고;상기 멀티 채널 신호의 상기 제3 채널 오디오 신호가 좌측 후방 스피커 신호이고;상기 멀티 채널 신호의 상기 제4 채널 오디오 신호가 우측 후방 스피커 신호이고;상기 멀티 채널 신호의 상기 제5 채널 오디오 신호가 중앙 스피커 신호인, 오디오 신호 프로세서.
- 제 22 항에 있어서,상기 제1 멀티 채널 오디오 신호 프로세서(620)는, 스케일러(520a, 520b, 522a, 522b)에 의해 수행되는 스케일링 동작들을 이용하여 제1 변조 시간 함수()로부터 도출된 위상 시프트 값들에 의존하여 상기 제1 멀티 채널 오디오 신호 프로세서의 오디오 주파수 범위 내에 지연들을 적용하며;상기 제2 멀티 채널 오디오 신호 프로세서(630)는 스케일러(520a, 520b, 522a, 522b)에 의해 수행되는 스케일링 동작들을 이용하여 제2 변조 시간 함수()로부터 도출된 위상 시프트 값들에 의존하여 상기 제2 멀티 채널 오디오 신호 프로세서 오디오 주파수 범위 내에 지연들을 적용하며;
- 제1 채널 오디오 신호(xl) 및 제2 채널 오디오 신호(xp)를 수신하는 오디오 입력;상기 제1 채널 오디오 신호 및 상기 제2 채널 오디오 신호를 수신하는, 제 15 항에 따른 멀티 채널 오디오 신호 프로세서(200; 400; 500; 710);상기 멀티 채널 오디오 신호 프로세서에 의해 제공된 제1 역상관된 출력 오디오 신호(230; 422; x1')를 출력하는 제1 전자음향 트랜스듀서(electroacoustic tranducer, 932);상기 멀티 채널 오디오 신호 프로세서에 의해 제공된 제2 역상관된 출력 오디오 신호(232; 426; xp')를 출력하는 제2 전자음향 트랜스듀서(932);제1 전자음향 트랜스듀서 및 제2 전자음향 트랜스듀서와 음향적으로 결합되고, 상기 음향 신호를 기술하는 마이크로폰 신호 (y)를 제공하는 마이크로폰(940); 및상기 마이크로폰 신호로부터 상기 제1 전자음향 트랜스듀서에 의한 오디오 컨텐트 출력을 감소 또는 제거하고, 상기 마이크로폰 신호로부터 상기 제2 전자음향 트랜스듀서에 의한 오디오 컨텐트 출력을 감소 또는 제거하는 에코 제거 유닛(echo cancellation unit, 950)을 포함하고,여기서, 상기 에코 제거 유닛은, 필터 계수들에 의존하여 상기 역상관된 출력 오디오 신호들을 필터링하고,에코-감소된 마이크로폰 신호를 획득하기 위해, 상기 마이크로폰 신호로부터 상기 필터링된 버전의 역상관된 출력 오디오 신호들을 제거 또는 차감하고,
- 입력 오디오 신호(112; 316)로부터 출력 오디오 신호(170; 252)를 도출하기 위한 방법으로서,상기 입력 오디오 신호로부터 제1 부분 신호(120; 314) 및 제2 부분 신호(122; 316)를 추출하는 단계로서, 상기 제1 부분 신호는 제1 오디오 주파수 범위 내 오디오 컨텐트를 기술하고, 상기 제2 부분 신호는 제2 오디오 주파수 범위 내 오디오 컨텐트를 기술하고, 상기 제1 오디오 주파수 범위는 상기 제2 오디오 주파수 범위에 비교하여 더 높은 주파수들을 가지는, 단계(860);상기 제1 부분 신호에 적용된 시간 변화 위상 시프트 또는 시간 변화 지연의 변조 크기가 상기 제2 부분 신호에 적용된 시간 변화 위상 시프트 또는 시간 변화 지연의 변조 크기보다 더 높도록, 상기 제1 부분 신호를 변경하여 제1 처리된 부분 신호(150; 342)를 획득하고, 상기 제2 부분 신호를 변경하여 제2 처리된 부분 신호(152; 344)를 획득하는 단계(870, 880), 또는 시간 변화 위상 시프트 또는 시간 변화 지연이 상기 제1 부분 신호에 적용되도록, 상기 제1 부분 신호만을 변경하는 단계(870); 및출력 오디오 신호(170; 352)를 획득하기 위해, 상기 제1 처리된 부분 신호 및 상기 제2 처리된 부분 신호를 결합하거나 또는 상기 제1 처리된 부분 신호 및 상기 제2 부분 신호를 결합하는 단계(890)를 포함하는, 출력 오디오 신호 도출 방법.
- 제1 역상관된 출력 오디오 신호(230; 422) 및 제2 역상관된 출력 오디오 신호(232; 426)를 획득하기 위하여, 제1 채널 오디오 신호(210; 410) 및 제2 채널 오디오 신호(212; 412)를 역상관하는 방법으로서,제 27 항의 방법에 따라 입력 오디오 신호(112; 310)로부터 출력 오디오 신호(170; 252)를 도출하는 단계로서, 상기 제1 채널 오디오 신호가 상기 입력 오디오 신호를 형성하고, 상기 출력 오디오 신호가 상기 제1 역상관된 출력 오디오 신호를 형성하는, 단계; 및상기 제2 역상관된 출력 오디오 신호(232; 426)로서, 제2 채널 오디오 신호(212; 412) 또는 상기 제2 채널 오디오 신호(212; 412)로부터 도출된 신호를 제공하는 단계를 포함하고,상기 역상관하는 방법은, 상기 제1 역상관된 출력 오디오 신호 및 상기 제2 역상관된 출력 오디오 신호의 상기 제1 오디오 주파수 범위 내 오디오 컨텐츠가 상기 제1 역상관된 출력 오디오 신호 및 상기 제2 역상관된 오디오 출력 신호의 상기 제2 오디오 주파수 범위 내 오디오 컨텐츠보다 서로에 대하여 더 큰 시간 변화 위상 시프트 변조 크기를 포함하도록 수행되는, 오디오 신호 역상관 방법.
- 멀티 채널 오디오 신호를 처리하는 방법으로서,멀티 채널 오디오 신호의 일부인 제1 채널 오디오 신호(610), 제2 채널 오디오 신호(612), 제3 채널 오디오 신호(614), 제4 채널 오디오 신호(616) 및 제5 채널 오디오 신호(618)를 수신하는 단계;역상관된 멀티 채널 신호의 두 개의 신호들을 획득하기 위해, 제 28 항에 따른 방법을 이용하여 5-채널 오디오 신호의 상기 제1 채널 오디오 신호 및 상기 제2 채널 오디오 신호를 역상관하는 단계;상기 처리된 멀티 채널 신호의 두 개의 추가적인 신호들을 획득하기 위해, 제 28 항에 따른 방법을 이용하여 상기 멀티 채널 오디오 신호의 상기 제3 채널 오디오 신호 및 상기 제4 채널 오디오 신호를 역상관하는 단계;상기 처리된 멀티 채널 신호의 제5 신호를 획득하기 위해, 제 27 항에 따른 방법을 이용하여 상기 멀티 채널 오디오 신호의 상기 제5 채널 오디오 신호를 역상관하는 단계를 포함하는, 멀티 채널 오디오 신호 처리 방법.
- 컴퓨터 프로그램(computer program)이 컴퓨터 상에서 실행될 때, 청구항 27에 따른 방법을 수행하기 위한 프로그램 코드(program code)를 포함하는 상기 컴퓨터 프로그램을 기록한 컴퓨터로 판독 가능한 매체.
- 컴퓨터 프로그램(computer program)이 컴퓨터 상에서 실행될 때, 청구항 28에 따른 방법을 수행하기 위한 프로그램 코드(program code)를 포함하는 상기 컴퓨터 프로그램을 기록한 컴퓨터로 판독 가능한 매체.
- 컴퓨터 프로그램(computer program)이 컴퓨터 상에서 실행될 때, 청구항 29에 따른 방법을 수행하기 위한 프로그램 코드(program code)를 포함하는 상기 컴퓨터 프로그램을 기록한 컴퓨터로 판독 가능한 매체.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP06007833.4 | 2006-04-13 | ||
EP06007833 | 2006-04-13 | ||
EP06012271A EP1845699B1 (en) | 2006-04-13 | 2006-06-14 | Audio signal decorrelator |
EP06012271.0 | 2006-06-14 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20080113412A KR20080113412A (ko) | 2008-12-30 |
KR101001839B1 true KR101001839B1 (ko) | 2010-12-15 |
Family
ID=36685861
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020087025014A KR101001839B1 (ko) | 2006-04-13 | 2007-03-28 | 오디오 신호 역상관기 |
Country Status (8)
Country | Link |
---|---|
US (1) | US8538037B2 (ko) |
EP (1) | EP1845699B1 (ko) |
JP (1) | JP5290956B2 (ko) |
KR (1) | KR101001839B1 (ko) |
CN (2) | CN102968993B (ko) |
AT (1) | ATE448638T1 (ko) |
DE (1) | DE602006010323D1 (ko) |
HK (1) | HK1180822A1 (ko) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20150021508A (ko) * | 2012-05-04 | 2015-03-02 | 카오닉스 랩스 엘엘씨 | 원신호 분리 시스템 및 방법 |
KR20180073649A (ko) * | 2016-05-25 | 2018-07-02 | 텐센트 테크놀로지(센젠) 컴퍼니 리미티드 | 에코 지연을 추적하는 방법 및 장치 |
US10497381B2 (en) | 2012-05-04 | 2019-12-03 | Xmos Inc. | Methods and systems for improved measurement, entity and parameter estimation, and path propagation effect measurement and mitigation in source signal separation |
US11056097B2 (en) | 2013-03-15 | 2021-07-06 | Xmos Inc. | Method and system for generating advanced feature discrimination vectors for use in speech recognition |
Families Citing this family (234)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
EP1845699B1 (en) * | 2006-04-13 | 2009-11-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal decorrelator |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8009838B2 (en) * | 2008-02-22 | 2011-08-30 | National Taiwan University | Electrostatic loudspeaker array |
EP2104096B1 (en) * | 2008-03-20 | 2020-05-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for converting an audio signal into a parameterized representation, apparatus and method for modifying a parameterized representation, apparatus and method for synthesizing a parameterized representation of an audio signal |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
TWI413109B (zh) * | 2008-10-01 | 2013-10-21 | Dolby Lab Licensing Corp | 用於上混系統之解相關器 |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
EP2345026A1 (en) * | 2008-10-03 | 2011-07-20 | Nokia Corporation | Apparatus for binaural audio coding |
US20110211037A1 (en) * | 2008-10-15 | 2011-09-01 | Gygax Otto A | Conferencing System With A Database Of Mode Definitions |
US8150052B2 (en) * | 2008-10-15 | 2012-04-03 | Hewlett-Packard Development Company, L.P. | Integrating acoustic echo cancellation as a subsystem into an existing videoconference and telepresence system |
US9959870B2 (en) | 2008-12-11 | 2018-05-01 | Apple Inc. | Speech recognition involving a mobile device |
US10706373B2 (en) | 2011-06-03 | 2020-07-07 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
EP2360688B1 (en) * | 2009-10-21 | 2018-12-05 | Panasonic Intellectual Property Corporation of America | Apparatus, method and program for audio signal processing |
EP2333970B1 (en) * | 2009-12-10 | 2012-07-18 | Telefonaktiebolaget L M Ericsson (publ) | Technique for determining a cell-identity |
US8560309B2 (en) * | 2009-12-29 | 2013-10-15 | Apple Inc. | Remote conferencing center |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
MX2013001111A (es) | 2010-07-30 | 2013-05-01 | Fraunhofer Ges Forschung | Arreglo de altavoz en reposacabezas. |
US9100734B2 (en) * | 2010-10-22 | 2015-08-04 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for far-field multi-source tracking and separation |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
EP2487891B1 (de) * | 2011-02-11 | 2018-09-05 | Deutsche Telekom AG | Vermeiden eines akustischen Echos bei Vollduplexsystemen |
US9558738B2 (en) | 2011-03-08 | 2017-01-31 | At&T Intellectual Property I, L.P. | System and method for speech recognition modeling for mobile voice search |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
TWI450266B (zh) * | 2011-04-19 | 2014-08-21 | Hon Hai Prec Ind Co Ltd | 電子裝置及音頻資料的解碼方法 |
KR101930907B1 (ko) | 2011-05-30 | 2019-03-12 | 삼성전자주식회사 | 오디오 신호 처리 방법, 그에 따른 오디오 장치, 및 그에 따른 전자기기 |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
US8879761B2 (en) | 2011-11-22 | 2014-11-04 | Apple Inc. | Orientation-based audio |
US11665482B2 (en) | 2011-12-23 | 2023-05-30 | Shenzhen Shokz Co., Ltd. | Bone conduction speaker and compound vibration device thereof |
TWI575962B (zh) * | 2012-02-24 | 2017-03-21 | 杜比國際公司 | 部份複數處理之重疊濾波器組中的低延遲實數至複數轉換 |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US9258653B2 (en) * | 2012-03-21 | 2016-02-09 | Semiconductor Components Industries, Llc | Method and system for parameter based adaptation of clock speeds to listening devices and audio applications |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
EP2939407B1 (en) * | 2012-12-27 | 2017-02-22 | Robert Bosch GmbH | Conference system and process for voice activation in the conference system |
KR20250004158A (ko) | 2013-02-07 | 2025-01-07 | 애플 인크. | 디지털 어시스턴트를 위한 음성 트리거 |
WO2014126688A1 (en) | 2013-02-14 | 2014-08-21 | Dolby Laboratories Licensing Corporation | Methods for audio signal transient detection and decorrelation control |
TWI618050B (zh) | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於音訊處理系統中之訊號去相關的方法及設備 |
TWI618051B (zh) | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置 |
KR101729930B1 (ko) | 2013-02-14 | 2017-04-25 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 업믹스된 오디오 신호들의 채널간 코히어런스를 제어하기 위한 방법 |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
AU2014233517B2 (en) | 2013-03-15 | 2017-05-25 | Apple Inc. | Training an at least partial voice command system |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
EP3008641A1 (en) | 2013-06-09 | 2016-04-20 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
JP5853995B2 (ja) * | 2013-06-10 | 2016-02-09 | トヨタ自動車株式会社 | 協調スペクトラムセンシング方法および車載無線通信装置 |
KR101809808B1 (ko) | 2013-06-13 | 2017-12-15 | 애플 인크. | 음성 명령에 의해 개시되는 긴급 전화를 걸기 위한 시스템 및 방법 |
US9084050B2 (en) * | 2013-07-12 | 2015-07-14 | Elwha Llc | Systems and methods for remapping an audio range to a human perceivable range |
US9445196B2 (en) * | 2013-07-24 | 2016-09-13 | Mh Acoustics Llc | Inter-channel coherence reduction for stereophonic and multichannel acoustic echo cancellation |
US9406308B1 (en) | 2013-08-05 | 2016-08-02 | Google Inc. | Echo cancellation via frequency domain modulation |
US10791216B2 (en) | 2013-08-06 | 2020-09-29 | Apple Inc. | Auto-activating smart responses based on activities from remote devices |
CN106104678A (zh) * | 2013-10-02 | 2016-11-09 | 斯托明瑞士有限责任公司 | 从两个或多个基本信号导出多通道信号 |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
KR20160113224A (ko) * | 2014-01-30 | 2016-09-28 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 오디오 신호를 압축하는 오디오 압축 시스템 |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
EP3480811A1 (en) | 2014-05-30 | 2019-05-08 | Apple Inc. | Multi-command single utterance input method |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
EP2953380A1 (en) * | 2014-06-04 | 2015-12-09 | Sonion Nederland B.V. | Acoustical crosstalk compensation |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
EP2963646A1 (en) | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder and method for decoding an audio signal, encoder and method for encoding an audio signal |
EP2980789A1 (en) * | 2014-07-30 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for enhancing an audio signal, sound enhancing system |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US9606986B2 (en) | 2014-09-29 | 2017-03-28 | Apple Inc. | Integrated word N-gram and class M-gram language models |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
US9830927B2 (en) * | 2014-12-16 | 2017-11-28 | Psyx Research, Inc. | System and method for decorrelating audio data |
EP3048608A1 (en) * | 2015-01-20 | 2016-07-27 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Speech reproduction device configured for masking reproduced speech in a masked speech zone |
US10152299B2 (en) | 2015-03-06 | 2018-12-11 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
CA3131960A1 (en) * | 2015-06-17 | 2016-12-22 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Loudness control for user interactivity in audio coding systems |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
US9787825B1 (en) * | 2015-06-30 | 2017-10-10 | Amazon Technologies, Inc. | Cyclically variable signal delays for acoustic echo cancellation |
US10863492B2 (en) * | 2015-07-16 | 2020-12-08 | Qualcomm Incorporated | Low latency device-to-device communication |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US9762382B1 (en) * | 2016-02-18 | 2017-09-12 | Teradyne, Inc. | Time-aligning a signal |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179309B1 (en) | 2016-06-09 | 2018-04-23 | Apple Inc | Intelligent automated assistant in a home environment |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
CN106067990A (zh) * | 2016-06-29 | 2016-11-02 | 合信息技术(北京)有限公司 | 音频处理方法、装置以及视频播放器 |
GB2552178A (en) * | 2016-07-12 | 2018-01-17 | Samsung Electronics Co Ltd | Noise suppressor |
CN107731238B (zh) * | 2016-08-10 | 2021-07-16 | 华为技术有限公司 | 多声道信号的编码方法和编码器 |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US11281993B2 (en) | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
US10477314B2 (en) | 2017-03-20 | 2019-11-12 | Bambu Tech, Inc. | Dynamic audio enhancement using an all-pass filter |
DK201770383A1 (en) | 2017-05-09 | 2018-12-14 | Apple Inc. | USER INTERFACE FOR CORRECTING RECOGNITION ERRORS |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
US10013995B1 (en) * | 2017-05-10 | 2018-07-03 | Cirrus Logic, Inc. | Combined reference signal for acoustic echo cancellation |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
DK201770427A1 (en) | 2017-05-12 | 2018-12-20 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
US20180336275A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Intelligent automated assistant for media exploration |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10019981B1 (en) | 2017-06-02 | 2018-07-10 | Apple Inc. | Active reverberation augmentation |
US10657328B2 (en) | 2017-06-02 | 2020-05-19 | Apple Inc. | Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling |
US11609737B2 (en) | 2017-06-27 | 2023-03-21 | Dolby International Ab | Hybrid audio signal synchronization based on cross-correlation and attack analysis |
US10594869B2 (en) | 2017-08-03 | 2020-03-17 | Bose Corporation | Mitigating impact of double talk for residual echo suppressors |
US10200540B1 (en) * | 2017-08-03 | 2019-02-05 | Bose Corporation | Efficient reutilization of acoustic echo canceler channels |
US10542153B2 (en) | 2017-08-03 | 2020-01-21 | Bose Corporation | Multi-channel residual echo suppression |
US10445429B2 (en) | 2017-09-21 | 2019-10-15 | Apple Inc. | Natural language understanding using vocabularies with compressed serialized tries |
US10755051B2 (en) | 2017-09-29 | 2020-08-25 | Apple Inc. | Rule-based natural language processing |
WO2019070722A1 (en) | 2017-10-03 | 2019-04-11 | Bose Corporation | SPACE DIAGRAM DETECTOR |
US10636424B2 (en) | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
GB201800101D0 (en) * | 2018-01-04 | 2018-02-21 | Nordic Semiconductor Asa | Matched-filter radio receiver |
US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
US10504518B1 (en) | 2018-06-03 | 2019-12-10 | Apple Inc. | Accelerated task performance |
EP3834200A4 (en) * | 2018-09-12 | 2021-08-25 | Shenzhen Voxtech Co., Ltd. | SIGNAL PROCESSING DEVICE INCLUDING MULTIPLE ELECTROACOUSTIC TRANSDUCERS |
US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
US10839159B2 (en) | 2018-09-28 | 2020-11-17 | Apple Inc. | Named entity normalization in a spoken dialog system |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US11170166B2 (en) | 2018-09-28 | 2021-11-09 | Apple Inc. | Neural typographical error modeling via generative adversarial networks |
US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
DE102018127071B3 (de) | 2018-10-30 | 2020-01-09 | Harman Becker Automotive Systems Gmbh | Audiosignalverarbeitung mit akustischer Echounterdrückung |
US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
US11210710B2 (en) * | 2019-01-15 | 2021-12-28 | Wp Company Llc | Techniques for inserting advertising content into digital content |
CN111615044B (zh) * | 2019-02-25 | 2021-09-14 | 宏碁股份有限公司 | 声音信号的能量分布修正方法及其系统 |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
JP7270186B2 (ja) | 2019-03-27 | 2023-05-10 | パナソニックIpマネジメント株式会社 | 信号処理装置、音響再生システム、及び音響再生方法 |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
US10964305B2 (en) | 2019-05-20 | 2021-03-30 | Bose Corporation | Mitigating impact of double talk for residual echo suppressors |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | USER ACTIVITY SHORTCUT SUGGESTIONS |
US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
US11488406B2 (en) | 2019-09-25 | 2022-11-01 | Apple Inc. | Text detection using global geometry estimators |
CN111739540A (zh) * | 2020-07-20 | 2020-10-02 | 天域全感音科技有限公司 | 一种音频信号采集装置、计算机设备及方法 |
CN114141230A (zh) * | 2020-08-14 | 2022-03-04 | 华为终端有限公司 | 电子设备及其语音识别方法和介质 |
CN112653799B (zh) * | 2020-12-07 | 2022-09-20 | 兰州空间技术物理研究所 | 一种空间站的空间话音设备的回声消除方法 |
US20230130515A1 (en) * | 2021-08-18 | 2023-04-27 | The Boeing Company | Systems and methods for confirming identity and location of an aircraft within an airspace |
TWI806299B (zh) | 2021-12-21 | 2023-06-21 | 宏碁股份有限公司 | 聲音浮水印的處理方法及聲音浮水印產生裝置 |
US12190873B2 (en) * | 2022-05-13 | 2025-01-07 | Apple Inc. | Determining whether speech input is intended for a digital assistant |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5291557A (en) | 1992-10-13 | 1994-03-01 | Dolby Laboratories Licensing Corporation | Adaptive rematrixing of matrixed audio signals |
US6895093B1 (en) | 1998-03-03 | 2005-05-17 | Texas Instruments Incorporated | Acoustic echo-cancellation system |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4972489A (en) * | 1987-02-19 | 1990-11-20 | Matsushita Electric Industrial Co., Ltd. | Sound reproducing apparatus |
JPH0454100A (ja) * | 1990-06-22 | 1992-02-21 | Clarion Co Ltd | 音声信号補償回路 |
KR100378449B1 (ko) * | 1994-04-12 | 2003-06-11 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 개선된에코제거기를갖는신호증폭기시스템 |
US5742679A (en) * | 1996-08-19 | 1998-04-21 | Rockwell International Corporation | Optimized simultaneous audio and data transmission using QADM with phase randomization |
JP3152292B2 (ja) * | 1997-04-15 | 2001-04-03 | 日本電気株式会社 | 多チャネルエコー除去方法及び装置 |
JP3319403B2 (ja) * | 1998-09-02 | 2002-09-03 | 日本電気株式会社 | 多チャネルエコー除去方法及び装置 |
US6760448B1 (en) | 1999-02-05 | 2004-07-06 | Dolby Laboratories Licensing Corporation | Compatible matrix-encoded surround-sound channels in a discrete digital sound format |
DE10153188C2 (de) * | 2001-10-27 | 2003-08-21 | Grundig Ag I Ins | Vorrichtung und Verfahren zur mehrkanaligen akustischen Echokompensation mit variabler Kanalzahl |
US7391869B2 (en) * | 2002-05-03 | 2008-06-24 | Harman International Industries, Incorporated | Base management systems |
CA2399159A1 (en) * | 2002-08-16 | 2004-02-16 | Dspfactory Ltd. | Convergence improvement for oversampled subband adaptive filters |
CN1219391C (zh) * | 2002-11-04 | 2005-09-14 | 华为技术有限公司 | 一种回声消除器及回声估计方法 |
JP3876850B2 (ja) * | 2003-06-02 | 2007-02-07 | ヤマハ株式会社 | アレースピーカーシステム |
SE527062C2 (sv) * | 2003-07-21 | 2005-12-13 | Embracing Sound Experience Ab | Stereoljudbehandlingsmetod, -anordning och -system |
AU2005219956B2 (en) | 2004-03-01 | 2009-05-28 | Dolby Laboratories Licensing Corporation | Multichannel audio coding |
US7688989B2 (en) | 2004-03-11 | 2010-03-30 | Pss Belgium N.V. | Method and system for processing sound signals for a surround left channel and a surround right channel |
US20080267378A1 (en) | 2004-05-25 | 2008-10-30 | Koninklijke Philips Electronics, N.V. | Conference System |
US7508947B2 (en) * | 2004-08-03 | 2009-03-24 | Dolby Laboratories Licensing Corporation | Method for combining audio signals using auditory scene analysis |
EP1845699B1 (en) * | 2006-04-13 | 2009-11-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal decorrelator |
-
2006
- 2006-06-14 EP EP06012271A patent/EP1845699B1/en active Active
- 2006-06-14 DE DE602006010323T patent/DE602006010323D1/de active Active
- 2006-06-14 AT AT06012271T patent/ATE448638T1/de not_active IP Right Cessation
-
2007
- 2007-03-28 CN CN201210390241.2A patent/CN102968993B/zh active Active
- 2007-03-28 CN CN2007800216165A patent/CN101502091B/zh active Active
- 2007-03-28 US US12/296,698 patent/US8538037B2/en active Active
- 2007-03-28 JP JP2009504598A patent/JP5290956B2/ja active Active
- 2007-03-28 KR KR1020087025014A patent/KR101001839B1/ko active IP Right Grant
-
2013
- 2013-07-03 HK HK13107779.7A patent/HK1180822A1/zh unknown
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5291557A (en) | 1992-10-13 | 1994-03-01 | Dolby Laboratories Licensing Corporation | Adaptive rematrixing of matrixed audio signals |
US6895093B1 (en) | 1998-03-03 | 2005-05-17 | Texas Instruments Incorporated | Acoustic echo-cancellation system |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20150021508A (ko) * | 2012-05-04 | 2015-03-02 | 카오닉스 랩스 엘엘씨 | 원신호 분리 시스템 및 방법 |
US10497381B2 (en) | 2012-05-04 | 2019-12-03 | Xmos Inc. | Methods and systems for improved measurement, entity and parameter estimation, and path propagation effect measurement and mitigation in source signal separation |
KR102118411B1 (ko) * | 2012-05-04 | 2020-06-03 | 액스모스 인코포레이티드 | 원신호 분리 시스템 및 방법 |
US10957336B2 (en) | 2012-05-04 | 2021-03-23 | Xmos Inc. | Systems and methods for source signal separation |
US10978088B2 (en) | 2012-05-04 | 2021-04-13 | Xmos Inc. | Methods and systems for improved measurement, entity and parameter estimation, and path propagation effect measurement and mitigation in source signal separation |
US11056097B2 (en) | 2013-03-15 | 2021-07-06 | Xmos Inc. | Method and system for generating advanced feature discrimination vectors for use in speech recognition |
KR20180073649A (ko) * | 2016-05-25 | 2018-07-02 | 텐센트 테크놀로지(센젠) 컴퍼니 리미티드 | 에코 지연을 추적하는 방법 및 장치 |
KR102114766B1 (ko) | 2016-05-25 | 2020-05-25 | 텐센트 테크놀로지(센젠) 컴퍼니 리미티드 | 에코 지연을 추적하는 방법 및 장치 |
Also Published As
Publication number | Publication date |
---|---|
CN102968993A (zh) | 2013-03-13 |
EP1845699B1 (en) | 2009-11-11 |
ATE448638T1 (de) | 2009-11-15 |
CN101502091B (zh) | 2013-03-06 |
US8538037B2 (en) | 2013-09-17 |
DE602006010323D1 (de) | 2009-12-24 |
EP1845699A1 (en) | 2007-10-17 |
CN102968993B (zh) | 2016-08-03 |
KR20080113412A (ko) | 2008-12-30 |
HK1180822A1 (zh) | 2013-10-25 |
US20090304198A1 (en) | 2009-12-10 |
JP5290956B2 (ja) | 2013-09-18 |
CN101502091A (zh) | 2009-08-05 |
JP2009533912A (ja) | 2009-09-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101001839B1 (ko) | 오디오 신호 역상관기 | |
KR101984115B1 (ko) | 오디오 신호 처리를 위한 다채널 다이렉트-앰비언트 분해를 위한 장치 및 방법 | |
RU2495506C2 (ru) | Устройство и способ расчета параметров управления фильтра эхоподавления и устройство и способ расчета величины задержки | |
EP2420050B1 (en) | Multichannel echo canceller | |
Herre et al. | Acoustic echo cancellation for surround sound using perceptually motivated convergence enhancement | |
RU2507678C2 (ru) | Эффективная фильтрация банком комплексно-модулированных фильтров | |
KR101177677B1 (ko) | 오디오 공간 환경 엔진 | |
US8189766B1 (en) | System and method for blind subband acoustic echo cancellation postfiltering | |
US9449603B2 (en) | Multi-channel audio encoder and method for encoding a multi-channel audio signal | |
JP5724044B2 (ja) | 多重チャネル・オーディオ信号の符号化のためのパラメトリック型符号化装置 | |
WO2009117084A2 (en) | System and method for envelope-based acoustic echo cancellation | |
JP6280983B2 (ja) | 信号対ダウンミックス比に基づいたセンター信号スケーリング及び立体音響強調のための装置及び方法 | |
KR20080078882A (ko) | 입체 오디오 신호 디코딩 | |
EP1782417A1 (en) | Multichannel decorrelation in spatial audio coding | |
WO2007118583A1 (en) | Audio signal decorrelator | |
KR101710544B1 (ko) | 스펙트럼 무게 발생기를 사용하는 주파수-영역 처리를 이용하는 스테레오 레코딩 분해를 위한 방법 및 장치 | |
Cecchi et al. | A combined psychoacoustic approach for stereo acoustic echo cancellation | |
Bispo et al. | Hybrid pre-processor based on frequency shifting for stereophonic acoustic echo cancellation | |
Wada et al. | Multi-channel acoustic echo cancellation based on residual echo enhancement with effective channel decorrelation via resampling | |
WO2013029225A1 (en) | Parametric multichannel encoder and decoder | |
Huang | Efficient acoustic noise suppression for audio signals |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0105 | International application |
Patent event date: 20081013 Patent event code: PA01051R01D Comment text: International Patent Application |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20100628 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20101125 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20101209 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20101209 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
FPAY | Annual fee payment |
Payment date: 20131128 Year of fee payment: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20131128 Start annual number: 4 End annual number: 4 |
|
FPAY | Annual fee payment |
Payment date: 20141204 Year of fee payment: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20141204 Start annual number: 5 End annual number: 5 |
|
FPAY | Annual fee payment |
Payment date: 20151203 Year of fee payment: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20151203 Start annual number: 6 End annual number: 6 |
|
FPAY | Annual fee payment |
Payment date: 20161208 Year of fee payment: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20161208 Start annual number: 7 End annual number: 7 |
|
FPAY | Annual fee payment |
Payment date: 20171129 Year of fee payment: 8 |
|
PR1001 | Payment of annual fee |
Payment date: 20171129 Start annual number: 8 End annual number: 8 |
|
FPAY | Annual fee payment |
Payment date: 20191202 Year of fee payment: 10 |
|
PR1001 | Payment of annual fee |
Payment date: 20191202 Start annual number: 10 End annual number: 10 |
|
PR1001 | Payment of annual fee |
Payment date: 20201130 Start annual number: 11 End annual number: 11 |
|
PR1001 | Payment of annual fee |
Payment date: 20211202 Start annual number: 12 End annual number: 12 |
|
PR1001 | Payment of annual fee |
Payment date: 20221129 Start annual number: 13 End annual number: 13 |
|
PR1001 | Payment of annual fee |
Payment date: 20231130 Start annual number: 14 End annual number: 14 |