KR101976135B1 - 적응성 빔 형성을 위한 사전 백색화를 사용하는 적응성 블록 매트릭스 - Google Patents
적응성 빔 형성을 위한 사전 백색화를 사용하는 적응성 블록 매트릭스 Download PDFInfo
- Publication number
- KR101976135B1 KR101976135B1 KR1020187006782A KR20187006782A KR101976135B1 KR 101976135 B1 KR101976135 B1 KR 101976135B1 KR 1020187006782 A KR1020187006782 A KR 1020187006782A KR 20187006782 A KR20187006782 A KR 20187006782A KR 101976135 B1 KR101976135 B1 KR 101976135B1
- Authority
- KR
- South Korea
- Prior art keywords
- input signal
- noisy input
- adaptive
- signal
- noisy
- Prior art date
Links
- 230000003044 adaptive effect Effects 0.000 title claims abstract description 105
- 239000011159 matrix material Substances 0.000 title claims abstract description 60
- 230000002087 whitening effect Effects 0.000 title claims abstract description 55
- 230000000903 blocking effect Effects 0.000 claims abstract description 49
- 238000000034 method Methods 0.000 claims description 69
- 238000012545 processing Methods 0.000 claims description 41
- 230000006870 function Effects 0.000 claims description 22
- 238000001914 filtration Methods 0.000 claims description 9
- 230000005236 sound signal Effects 0.000 claims description 2
- 230000009467 reduction Effects 0.000 abstract description 5
- 230000008569 process Effects 0.000 description 14
- 230000002123 temporal effect Effects 0.000 description 9
- 230000002596 correlated effect Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 230000004044 response Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 230000000875 corresponding effect Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000005534 acoustic noise Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/175—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
- G10K11/178—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/175—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
- G10K11/178—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
- G10K11/1781—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions
- G10K11/17821—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions characterised by the analysis of the input signals only
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/175—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/10—Earpieces; Attachments therefor ; Earphones; Monophonic headphones
- H04R1/1083—Reduction of ambient noise
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2410/00—Microphones
- H04R2410/05—Noise reduction with a separate noise microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/20—Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/20—Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
- H04R2430/25—Array processing for suppression of unwanted side-lobes in directivity characteristics, e.g. a blocking matrix
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2499/00—Aspects covered by H04R or H04S not otherwise provided for in their subgroups
- H04R2499/10—General applications
- H04R2499/11—Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2499/00—Aspects covered by H04R or H04S not otherwise provided for in their subgroups
- H04R2499/10—General applications
- H04R2499/13—Acoustic transducers and sound field adaptation in vehicles
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
적응성 빔 형성기 또는 널(null) 형성기에서 적응성 블록킹 매트릭스의 적응 필터는 적응성 노이즈 소거기 모듈에 대한 입력과 기준 노이즈 신호 사이의 노이즈 상관을 추적하고 유지하도록 수정될 수 있다. 즉, 노이즈 상관 팩터가 결정될 수 있고, 노이즈 상관 팩터는, 블록킹 매트릭스 출력 신호를 생성할 때 적용된 센서 간 신호 모델에서 사용될 수 있다. 이어서, 출력 신호는 마이크로폰들에서 수신된 스피치 신호를 대표하는 더 적은-노이지를 생성하도록 적응성 빔형성기 내에서 추가로 프로세싱될 수 있다. 센서 간 신호 모델은 GrTLS(gradient decent total least squares) 알고리즘을 사용하여 추정될 수 있다. 추가로, 공간 사전-백색화(pre-whitening)는 적응성 블록킹 매트릭스에 적용되어 노이즈 감소를 추가로 개선할 수 있다.
Description
[0001] 본 개시내용은 디지털 신호 프로세싱에 관한 것이다. 더 구체적으로, 본 개시내용의 부분들은 마이크로폰들에 대한 디지털 신호 프로세싱에 관한 것이다.
[0002] 전화들 및 다른 통신 디바이스들은 조용한 사무실 환경들뿐만이 아닌 다양한 조건들에서 전 세계 어디에서나 사용된다. 음성 통신들은 다양하고 가혹한 음향 조건들, 이를테면 자동차들, 공항들, 레스토랑들 등에서 발생할 수 있다. 구체적으로, 배경 음향 노이즈는 고정 노이즈들, 이를테면 도로 노이즈 및 엔진 노이즈로부터, 비고정 노이즈들, 이를테면 왁자지껄 노이즈와 과속 차량 노이즈까지 다양할 수 있다. 모바일 통신 디바이스들은 음성 통신의 품질을 개선하기 위해 이들 원하지 않는 배경 음향 노이즈들을 감소시켜야 한다. 이들 원하지 않는 배경 노이즈들 및 원하는 스피치(speech)의 근원이 공간적으로 분리되면, 디바이스는 빔형성을 사용하여 노이지 마이크로폰 신호로부터 클린(clean) 스피치를 추출할 수 있다.
[0003] 배경 노이즈를 감소시키기 위해 환경 사운드들을 프로세싱하는 하나의 방식은 모바일 통신 디바이스 상에 하나보다 많은 마이크로폰을 배치하는 것이다. 공간 분리 알고리즘들은 이들 마이크로폰들을 사용하여, 스피치 소스로부터 공간적으로 다양한 노이즈 소스들을 제거함으로써 클린 스피치를 추출하는데 필요한 공간 정보를 획득한다. 그런 알고리즘들은 마이크로폰들 사이에 존재하는 공간 다이버시티(diversity)를 활용함으로써 노이지 신호의 SNR(signal-to-noise ratio)을 개선한다. 하나의 그런 공간 분리 알고리즘은 적응성 빔형성이고, 적응성 빔형성은 수신된 데이터에 기반하여 변화하는 노이즈 조건들에 적응한다. 적응성 빔형성기들은 고정식 빔형성기들과 비교할 때 더 높은 노이즈 소거 또는 간섭 억제를 달성할 수 있다. 하나의 그런 적응성 빔형성기는 GSC(Generalized Sidelobe Canceller)이다. GSC의 고정식 빔형성기는 원하는 방향을 향하여 마이크로폰 빔을 형성하여, 그 방향의 사운드들만이 캡처되고, GSC의 블록킹 매트릭스(blocking matrix)는 원하는 주사 방향(look direction)을 향하여 널(null)을 형성한다. GSC의 일 예는 도 1에 도시된다.
[0004] 도 1은 종래 기술에 따른 적응성 빔형성기의 예이다. 적응성 빔형성기(100)는 각각 신호들(x1[n] 및 x2[n])을 생성하기 위해 마이크로폰들(102 및 104)을 포함한다. 신호들(x1[n] 및 x2[n])은 고정식 빔형성기(110) 및 블록킹 매트릭스(120)에 제공된다. 고정식 빔형성기(110)는 신호([n])를 생성하고, 신호(a[n])는 마이크로폰 신호들(x1[n] 및 x2[n]) 내에 포함된 원하는 신호의 노이즈 감소 버전이다. 블록킹 매트릭스(120)는, 적응 필터(122)의 동작을 통해, 노이즈 신호인 b[n] 신호를 생성한다. 마이크로폰들(102 및 104)의 둘 모두에 존재하는 원하는 신호 성분들과, 따라서 신호들(x1[n] 및 x2[n]) 사이의 관계는 선형 시변 시스템에 의해 모델링되고, 이 선형 모델(h[n])은 적응 필터(122)를 사용하여 추정된다. 마이크로폰 채널의 반향/회절 효과들 및 주파수 응답 모두는 임펄스 응답(h[n])에 포함될 수 있다. 따라서, 선형 모델의 파라미터들을 추정함으로써, 마이크로폰들(102 및 104) 중 하나에서의 원하는 신호(예컨대, 스피치) 및 다른 마이크로폰으로부터 필터링된 원하는 신호는 이에 의해 크기 및 위상이 근접하게 매칭되고, 이는 신호(b[n])에서 원하는 신호 누설을 크게 감소시킨다. 신호(b[n])는 적응성 노이즈 소거기(130)에서 프로세싱되어 신호(w[n])를 생성하고, 신호(w[n])는 신호(a[n])에서의 모든 상관된 노이즈를 포함하는 신호이다. 신호(w[n])는 적응성 노이즈 소거기(130)에서 신호(a[n])로부터 감산되어 신호(y[n])를 생성하고, 신호(y[n])는 마이크로폰들(102 및 104)에 의해 픽업된 원하는 신호의 노이즈 감소 버전이다.
[0005] 종래의 빔형성기에 대한 하나의 문제점은, 적응성 블록킹 매트릭스(120)가 의도치 않게 신호(b[n])로부터 일부 노이즈를 제거하여, 신호들(b[n] 및 a[n])의 노이즈가 상관되지 않게 한다는 것이다. 이런 상관되지 않은 노이즈는 소거기(130)에서 제거될 수 없다. 따라서, 원하지 않는 노이즈의 일부는 신호(b[n])로부터, 프로세싱 블록(130)에서 생성된 신호(y[n])에 여전히 존재할 수 있다. 노이즈 상관은 적응 필터(122)에서 손실된다. 따라서, 적응 필터(122) 내에서 노이즈 소거의 무능(destruction)을 감소시키게 동작시키도록 종래의 적응성 빔형성기(100)의 적응 필터(122)의 프로세싱을 수정하는 것이 바람직할 것이다.
[0006] 여기서 언급된 단점들은 단지 대표적이고 그리고 개선된 전기 성분들, 특히 모바일 폰들 같은 소비자-레벨 디바이스들에 이용되는 신호 프로세싱에 대한 필요가 존재하는 것을 단순히 강조하기 위해 포함된다. 여기에 설명된 실시예들은 특정 단점들을 처리하지만 반드시 여기에 설명되거나 기술 분야에서 알려진 단점을 모두 처리하지 않는다.
[0007] 하나의 해결책은 마이크로폰 신호들 사이의 노이즈 상관을 추적하고 유지하도록 적응 필터를 수정하는 것을 포함할 수 있다. 즉, 노이즈 상관 팩터(factor)가 결정될 수 있고 그리고 그 노이즈 상관 팩터는 신호(b[n])를 생성하기 위해 적응 필터를 사용하여 올바른 센서 간 신호 모델을 유도하는데 사용될 수 있다. 이어서, 그 신호(b[n])는 적응성 빔형성기 내에서 추가로 프로세싱되어 마이크로폰들에서 수신된 스피치 신호의 더 적은-노이지 표현을 생성할 수 있다. 일 실시예에서, 공간 사전-백색화(pre-whitening)는 적응성 블록킹 매트릭스에 적용되어 노이즈 감소를 추가로 개선할 수 있다. 위에서 설명된 적응성 블록킹 매트릭스 및 다른 컴포넌트들 및 방법들은 모바일 디바이스의 니어 및/또는 파 마이크로폰들로부터 수신된 신호들을 프로세싱하기 위해 모바일 디바이스에서 구현될 수 있다.
[0008] 일 실시예에서, GrTLS(gradient descent total least square) 알고리즘은 복수의 노이지 소스들의 존재에서 신호 간 모델을 추정하기 위해 적용될 수 있다. GrTLS 알고리즘은 복수의 노이즈 스피치 소스들에 의해 제공된 신호의 노이즈-감소 버전을 생성하기 위해 상호-상관 노이즈 팩터 및/또는 사전-백색화 필터들을 포함할 수 있다. 셀룰러 전화의 실시예에서, 복수의 노이지 소스들은 니어 마이크로폰 및 파 마이크로폰을 포함할 수 있다. 니어 마이크로폰은, 전화 통화 동안 사용자의 입이 포지셔닝되는 위치에 가장 가까운 폰의 말단 가까이에 위치된 마이크로폰일 수 있다. 파 마이크로폰은 사용자의 입으로부터 더 먼 위치인 셀룰러 전화상의 어딘가에 위치될 수 있다.
[0009] 일 실시예에 따라, 방법은, 복수의 센서들에 커플링된 프로세서에 의해, 적어도 제1 노이지 입력 신호 및 제2 노이지 입력 신호를 수신하는 단계 ― 제1 노이지 신호 및 제2 노이지 신호 각각은 복수의 센서들로부터 발생함 ―; 프로세서에 의해, 제1 노이지 입력 신호와 제2 노이지 입력 신호 사이의 적어도 하나의 추정된 노이즈 상관 통계를 결정하는 단계; 및/또는 프로세서에 의해, 노이즈 상관이 적응성 노이즈 소거기 모듈에 대한 입력과 적응성 블록킹 매트릭스의 출력 사이에 유지되도록, 적어도 하나의 추정된 노이즈 상관 통계에 적어도 부분적으로 기반하여 제1 노이지 입력 신호와 제2 노이지 입력 신호 사이의 센서 간 신호 모델을 추정하는 학습 알고리즘을 실행하는 단계를 포함할 수 있다.
[0010] 특정 실시예들에서, 학습 알고리즘을 실행하는 단계는 추정된 노이즈 상관 통계에 적어도 부분적으로 기반하여 적어도 하나의 필터 계수를 계산하는 적응 필터를 실행하는 단계를 포함할 수 있고; 적응 필터를 실행하는 단계는 추정된 노이즈 상관 통계를 포함하는 TLS(total least squares) 비용 함수를 푸는 단계를 포함할 수 있고; 적응 필터를 실행하는 단계는 추정된 노이즈 상관 통계를 사용하는 GrTLS(gradient descent total least squares) 학습 방법을 유도하기 위해 TLS(total least squares) 비용 함수를 푸는 단계를 포함할 수 있고; 적응 필터를 실행하는 단계는 추정된 노이즈 상관 통계를 포함하는 LS(least squares) 비용 함수를 푸는 단계를 포함할 수 있고; 적응 필터를 실행하는 단계는 추정된 노이즈 상관 통계를 사용하는 LMS(least mean squares) 학습 방법을 유도하기 위해 LS(least squares) 비용 함수를 푸는 단계를 포함할 수 있고; 필터링하는 단계는 제1 노이지 신호 및 제2 노이지 신호 중 적어도 하나에 공간적 사전-백색화 근사화를 적용하는 단계를 포함할 수 있고; 그리고/또는 공간적 사전-백색화 근사화를 적용하는 단계는 직접 매트릭스 인버전(inversion) 없이 그리고 매트릭스 제곱근 컴퓨테이션(computation) 없이 수행될 수 있다.
[0011] 특정 실시예들에서, 방법은 또한, 프로세서에 의해, 적어도 하나의 추정된 노이즈 상관 통계를 결정하는 단계 이전에 제1 노이지 입력 신호 및 제2 노이지 입력 신호 중 적어도 하나를 필터링하는, 이를테면 사전-백색화 필터로 필터링하는 단계; 추정된 센서 간 신호 모델을 제1 노이지 입력 신호 및 제2 노이지 입력 신호 중 적어도 하나에 적용하는 단계; 추정된 센서 간 신호 모델을 제1 노이지 입력 신호 및 제2 노이지 입력 신호 중 적어도 하나에 적용한 이후에 제1 노이지 입력 신호와 제2 노이지 입력 신호를 결합하는 단계; 및/또는 결합된 제1 노이지 입력 신호와 제2 노이지 입력 신호에 인버스(inverse) 시간적 사전-백색화 필터를 적용하는 단계를 포함할 수 있다.
[0012] 다른 실시예에 따라, 장치는 제1 노이지 입력 신호를 수신하도록 구성된 제1 입력 노드; 제2 노이지 입력 신호를 수신하도록 구성된 제2 입력 노드; 및/또는 제1 입력 노드에 커플링되고 제2 입력 노드에 커플링된 프로세서를 포함할 수 있다. 프로세서는 복수의 센서들로부터 적어도 제1 노이지 입력 신호 및 제2 노이지 입력 신호를 수신하는 단계; 제1 노이지 입력 신호와 제2 노이지 입력 신호 사이의 적어도 하나의 추정된 노이즈 상관 통계를 결정하는 단계; 및/또는 노이즈 상관이 적응성 노이즈 소거기 모듈에 대한 입력과 블록킹 매트릭스의 출력 사이에 유지되도록, 적어도 하나의 추정된 노이즈 상관 통계에 적어도 부분적으로 기반하여 제1 노이지 입력 신호와 제2 노이지 입력 신호 사이의 센서 간 신호 모델을 추정하는 학습 알고리즘을 실행하는 단계를 포함하는 단계들을 수행하도록 구성될 수 있다.
[0013] 일부 실시예들에서, 프로세서는, 프로세서에 의해, 적어도 하나의 추정된 노이즈 상관 통계를 결정하는 단계 이전에 제1 노이지 입력 신호 및 제2 노이지 입력 신호 중 적어도 하나를 필터링하는, 이를테면 시간적 사전-백색화 필터로 노이즈를 필터링하는 단계; 추정된 센서 간 신호 모델을 제1 노이지 입력 신호 및 제2 노이지 입력 신호 중 적어도 하나에 적용하는 단계; 추정된 센서 간 신호 모델을 제1 노이지 입력 신호 및 제2 노이지 입력 신호 중 적어도 하나에 적용한 이후에 제1 노이지 입력 신호와 제2 노이지 입력 신호를 결합하는 단계; 및/또는 결합된 제1 노이지 입력 신호와 제2 노이지 입력 신호 상에 인버스 시간적 사전-백색화 필터를 적용하는 단계를 실행하도록 추가로 구성될 수 있다.
[0014] 특정 실시예들에서, 학습 알고리즘을 실행하는 단계는 추정된 노이즈 상관 통계에 적어도 부분적으로 기반하여 적어도 하나의 필터 계수를 계산하는 적응 필터를 실행하는 단계를 포함할 수 있고; 적응 필터를 실행하는 단계는 추정된 노이즈 상관 통계를 포함하는 TLS(total least squares) 비용 함수를 푸는 단계를 포함할 수 있고; 적응 필터를 실행하는 단계는 추정된 노이즈 상관 통계를 사용하는 GrTLS(gradient descent total least squares) 학습 방법을 유도하기 위해 TLS(total least squares) 비용 함수를 푸는 단계를 포함할 수 있고; 적응 필터를 실행하는 단계는 추정된 노이즈 상관 통계를 포함하는 LS(least squares) 비용 함수를 푸는 단계를 포함할 수 있고; 적응 필터를 실행하는 단계는 추정된 노이즈 상관 통계를 사용하는 LMS(least mean squares) 학습 방법을 유도하기 위해 LS(least squares) 비용 함수를 푸는 단계를 포함할 수 있고; 필터링하는 단계는 제1 노이지 신호 및 제2 노이지 신호 중 적어도 하나에 공간적 사전-백색화 근사화를 적용하는 단계를 포함할 수 있고; 그리고/또는 공간적 사전-백색화 근사화를 적용하는 단계는 직접 매트릭스 인버전 없이 그리고 매트릭스 제곱근 컴퓨테이션 없이 수행될 수 있고; 제1 입력 노드는 니어 마이크로폰에 커플링하도록 구성될 수 있고; 제2 입력 노드는 파 마이크로폰에 커플링하도록 구성될 수 있고; 그리고/또는 프로세서는 DSP(digital signal processor)일 수 있다.
[0015] 다른 실시예에 따라, 장치는 제1 센서로부터 제1 노이지 입력 신호를 수신하도록 구성된 제1 입력 노드; 제2 센서로부터 제2 노이지 입력 신호를 수신하도록 구성된 제2 입력 노드; 제1 입력 노드에 커플링되고 제2 입력 노드에 커플링된 고정식 빔형성기 모듈; 제1 입력 노드에 커플링되고 제2 입력 노드에 커플링된 블록킹 매트릭스 모듈 ― 블록킹 매트릭스 모듈은, 노이즈 상관이 적응성 노이즈 소거기 모듈에 대한 입력과 블록킹 매트릭스의 출력 사이에 유지되도록, 적어도 하나의 추정된 노이즈 상관 통계에 적어도 부분적으로 기반하여 제1 노이지 입력 신호와 제2 노이지 입력 신호 사이의 센서 간 신호 모델을 추정하는 학습 알고리즘을 실행함 ―; 및/또는 고정식 빔형성기 모듈에 커플링되고 블록킹 매트릭스 모듈에 커플링된 적응성 노이즈 소거기를 포함할 수 있고, 적응성 노이즈 소거 필터는 제1 센서 및 제2 센서에서 수신된 원하는 오디오 신호를 대표하는 출력 신호를 출력하도록 구성된다.
[0016] 특정 실시예들에서, 블록킹 매트릭스 모듈은 공간적 사전-백색화 근사화를 제1 노이지 신호에 적용하는 단계; 다른 또는 동일한 공간적 사전-백색화 근사화를 제2 노이지 신호에 적용하는 단계; 추정된 센서 간 신호 모델을 제1 노이지 입력 신호 및 제2 노이지 입력 신호 중 적어도 하나에 적용하는 단계; 추정된 센서 간 신호 모델을 적용한 이후에 제1 노이지 입력 신호와 제2 노이지 입력 신호를 결합하는 단계; 및/또는 결합된 제1 노이지 입력 신호와 제2 노이지 입력 신호에 인버스 사전-백색화 필터를 적용하는 단계를 포함하는 단계들을 실행하도록 구성된다.
[0017] 추가 실시예에 따라, 방법은 복수의 센서들에 커플링된 프로세서에 의해, 복수의 센서들로부터 적어도 제1 노이지 입력 신호 및 제2 노이지 입력 신호를 수신하는 단계; 및/또는 프로세서에 의해, 제1 노이지 입력 신호와 제2 노이지 입력 신호 사이의 센서 간 신호 모델을 추정하는 GrTLS(gradient descent based total least squares) 알고리즘을 실행하는 단계를 포함할 수 있다.
[0018] 특정 실시예들에서, 방법은 또한 사전-백색화 필터를 제1 노이지 입력 신호 및 제2 노이지 입력 신호 중 적어도 하나에 적용하는 단계를 포함할 수 있고; 사전-백색화 필터를 적용하는 단계는 공간적 및 시간적 사전-백색화 필터를 적용하는 단계를 포함할 수 있고; 그리고/또는 GrTLS 알고리즘은, 노이즈 상관이 적응성 노이즈 소거기 모듈에 대한 입력과 블록킹 매트릭스의 출력 사이에 유지되도록, 적어도 하나의 추정된 노이즈 상관 통계를 포함할 수 있다.
[0019] 다른 실시예에 따라, 장치는 제1 노이지 입력 신호를 수신하기 위한 제1 입력 노드; 제2 노이지 입력 신호를 수신하기 위한 제2 입력 노드; 및/또는 제1 입력 노드에 커플링되고, 제2 입력 노드에 커플링되고, 그리고 신호들(a[n] 및 b[n]) 사이의 센서 간 신호 모델을 추정하는 사전-백색화 업데이트 알고리즘으로 GrTLS(gradient descent based total least squares) 또는 NLMS(normalized least means square)를 실행하는 단계를 수행하도록 구성된 프로세서를 포함할 수 있다.
[0020] 특정 실시예들에서, 프로세서는 사전-백색화 필터를 제1 노이지 입력 신호 및 제2 노이지 입력 신호 중 적어도 하나에 적용하는 단계를 포함하는 단계를 수행하도록 추가로 구성될 수 있고; 사전-백색화 필터를 적용하는 단계는 공간적 및 시간적 사전-백색화 필터를 적용하는 단계를 포함할 수 있고; 그리고/또는 사전-백색화 업데이트 알고리즘에 의한 GrTLS 또는 NLMS는, 노이즈 상관이 적응성 노이즈 소거기 모듈에 대한 입력과 블록킹 매트릭스의 출력 사이에 유지되도록, 적어도 하나의 추정된 노이즈 상관 통계를 포함할 수 있다.
[0021] 전술한 것은 오히려 뒤따르는 상세한 설명이 더 잘 이해될 수 있도록 본 발명의 실시예들의 특정 특징들 및 기술적 장점들을 대략적으로 서술하였다. 본 발명의 청구 대상을 형성하는 부가적인 특징들 및 장점들은 이후에 설명될 것이다. 개시된 개념 및 특정 실시예가 동일하거나 유사한 목적들을 수행하기 위하여 다른 구조들을 수정하거나 설계하는 것에 대한 기초로서 쉽게 활용될 수 있다는 것이 당업자들에 의해 인식되어야 한다. 또한, 그런 등가 구성들이 첨부된 청구항들에 설명된 바와 같이 본 발명의 사상 및 범위에서 벗어나지 않는 것이 당업자들에 의해 인식되어야 한다. 부가적인 특징들은, 첨부 도면들과 관련하여 고려될 때 다음 설명으로부터 더 잘 이해될 것이다. 그러나, 도면들 각각이 단지 예시 및 설명의 목적을 위해서 제공되고 본 발명을 제한하도록 의도되지 않는 것이 명확하게 이해될 것이다.
[0022] 개시된 시스템 및 방법들의 더 완전한 이해를 위하여, 이제 첨부 도면들과 함께 취해진 다음 설명들에 대해 참조가 이루어진다.
[0023] 도 1은 종래 기술에 따른 적응성 빔형성기의 예이다.
[0024] 도 2는 본 개시내용의 일 실시예에 따른 적응성 블록킹 매트릭스에 대한 노이즈 상관 팩터를 결정하는 프로세싱 블록을 예시하는 예시적 블록 다이어그램이다.
[0025] 도 3은 본 개시내용의 일 실시예에 따른 학습 알고리즘으로 마이크로폰 신호들을 프로세싱하기 위한 예시적 흐름도이다.
[0026] 도 4는 본 개시내용의 일 실시예에 따른 적응성 블록킹 매트릭스 프로세싱에 대한 신호 프로세싱의 예시적 모델이다.
[0027] 도 5는 본 개시내용의 일 실시예에 따른 사전-백색화 필터로 적응성 블록킹 매트릭스 프로세싱을 위한 신호 프로세싱의 예시적 모델이다.
[0028] 도 6은 본 개시내용의 일 실시예에 따라 노이즈 상관 결정 전에 사전-백색화 필터로 적응성 블록킹 매트릭스 프로세싱을 위한 신호 프로세싱의 예시적 모델이다.
[0029] 도 7은 본 개시내용의 일 실시예에 따른 사전-백색화 필터 및 지연으로 적응성 블록킹 매트릭스 프로세싱을 위한 신호 프로세싱의 예시적 모델이다.
[0030] 도 8은 본 개시내용의 일 실시예에 따른 기울기 강하 TLS(total least squares) 학습 알고리즘을 실행시키기 위한 시스템의 예시적 블록 다이어그램이다.
[0031] 도 9는 본 개시내용의 특정 실시예들에 적용된 특정 예시적 입력들에 대한 노이즈 상관 값들을 예시하는 예시적 그래프들이다.
[0023] 도 1은 종래 기술에 따른 적응성 빔형성기의 예이다.
[0024] 도 2는 본 개시내용의 일 실시예에 따른 적응성 블록킹 매트릭스에 대한 노이즈 상관 팩터를 결정하는 프로세싱 블록을 예시하는 예시적 블록 다이어그램이다.
[0025] 도 3은 본 개시내용의 일 실시예에 따른 학습 알고리즘으로 마이크로폰 신호들을 프로세싱하기 위한 예시적 흐름도이다.
[0026] 도 4는 본 개시내용의 일 실시예에 따른 적응성 블록킹 매트릭스 프로세싱에 대한 신호 프로세싱의 예시적 모델이다.
[0027] 도 5는 본 개시내용의 일 실시예에 따른 사전-백색화 필터로 적응성 블록킹 매트릭스 프로세싱을 위한 신호 프로세싱의 예시적 모델이다.
[0028] 도 6은 본 개시내용의 일 실시예에 따라 노이즈 상관 결정 전에 사전-백색화 필터로 적응성 블록킹 매트릭스 프로세싱을 위한 신호 프로세싱의 예시적 모델이다.
[0029] 도 7은 본 개시내용의 일 실시예에 따른 사전-백색화 필터 및 지연으로 적응성 블록킹 매트릭스 프로세싱을 위한 신호 프로세싱의 예시적 모델이다.
[0030] 도 8은 본 개시내용의 일 실시예에 따른 기울기 강하 TLS(total least squares) 학습 알고리즘을 실행시키기 위한 시스템의 예시적 블록 다이어그램이다.
[0031] 도 9는 본 개시내용의 특정 실시예들에 적용된 특정 예시적 입력들에 대한 노이즈 상관 값들을 예시하는 예시적 그래프들이다.
[0032] 노이즈가 마이크로폰들 사이에서 계속 상관되어 있을 때, 더 나은 스피치 신호가 마이크로폰 입력들을 프로세싱하여 획득된다. 노이즈 상관 팩터를 유지함으로써 신호들을 프로세싱하는 적응 필터에 대한 프로세싱 블록이 도 2에 도시된다. 도 2는 본 개시내용의 일 실시예에 따른 적응성 블록킹 매트릭스에 대한 노이즈 상관 팩터를 결정하는 프로세싱 블록을 예시하는 예시적 블록 다이어그램이다. 프로세싱 블록(210)은 마이크로폰들에 커플링될 수 있는 입력 노드들(202 및 204)로부터 마이크로폰 데이터를 수신한다. 마이크로폰 데이터는 노이즈 상관 결정 블록(212) 및 센서 간 신호 모델 추정기(214)에 제공된다. 센서 간 신호 모델 추정기(214)는 또한 노이즈 상관 결정 블록(212)에 의해 계산된 노이즈 상관 팩터, 이를테면 아래에서 설명되는 rq2q1을 수신한다. 센서 간 신호 모델 추정기(214)는 학습 알고리즘, 이를테면 NLMS(normalized least means square) 알고리즘 또는 GrTLS(gradient total least squares) 알고리즘을 구현하여, 추가 프로세싱 블록들 또는 다른 컴포넌트들에 제공되는 노이즈 신호(b[n])를 생성할 수 있다. 다른 컴포넌트들은 b[n] 신호를 사용하여 예컨대 마이크로폰들 중 하나에서 개별적으로 수신된 것보다 감소된 노이즈를 가진 스피치 신호를 생성할 수 있다.
[0033] 적응성 블록킹 매트릭스에서 노이즈 상관을 개선하기 위해 마이크로폰 신호들을 프로세싱하는 방법의 예가 도 3에 도시된다. 도 3은 본 개시내용의 일 실시예에 따른 학습 알고리즘으로 마이크로폰 신호들을 프로세싱하기 위한 예시적 흐름도이다. 방법(300)은 블록(302)에서, 이를테면 통신 디바이스의 제1 마이크로폰 및 제2 마이크로폰으로부터 각각 제1 입력 및 제2 입력을 수신하는 것에서 시작될 수 있다. 블록(304)에서, 이를테면 DSP(digital signal processor)의 프로세싱 블록은 제1 입력과 제2 입력 사이의 적어도 하나의 추정된 노이즈 상관 통계들을 결정할 수 있다. 이어서, 블록(306)에서, 학습 알고리즘은 이를테면 DSP에 의해, 제1 마이크로폰과 제2 마이크로폰 사이의 센서 간 모델을 추정하기 위해 실행될 수 있다. 추정된 센서 간 모델은 블록(304)의 결정된 노이즈 상관 통계에 기반할 수 있고 그리고 제1 입력 및 제2 입력이 프로세싱될 때 제1 입력과 제2 입력 사이의 노이즈 상관을 유지하기 위해 적응성 블록킹 매트릭스에 적용될 수 있다. 예컨대, a[n] 신호들과 b[n] 신호들 사이의 노이즈 상관을 유지하거나, 또는 더 일반적으로 적응성 노이즈 소거기 블록에 대한 입력과 적응성 블록킹 매트릭스의 출력 사이의 상관을 유지함으로써.
[0034] 그런 학습 알고리즘에 따른 적응성 블록킹 매트릭스에 의한 마이크로폰 신호들의 프로세싱은 도 4, 도 5, 도 6 및 도 7에 도시된 프로세싱 모델들에 의해 예시된다. 도 4는 본 개시내용의 일 실시예에 따른 적응성 블록킹 매트릭스 프로세싱에 대한 신호 프로세싱의 예시적 모델이다. 적응성 빔형성기에서, 블록킹 매트릭스의 주 목적은, 원하는 방향 스피치 신호(s[n])가 감산 프로세스를 통해 소거될 수 있도록 hest[n]으로 시스템(h[n])을 추정하는 것이다. 스피치 신호(s[n])는 2개의 마이크로폰들에 의해 검출될 수 있고, 여기서 각각의 마이크로폰은 상이한 노이즈들을 경험하고, 이의 노이즈들은 v1[n] 및 v2[n]로서 예시된다. 도 4의 입력 노드들(202 및 204)은 각각 제1 마이크로폰 및 제2 마이크로폰으로부터 수신된 신호들(x1[n] x2[n])을 표시한다. 시스템(h[n])은 수신된 신호의 부분으로서 제2 마이크로폰 신호에 부가되는 것으로 표현된다. 비록 h[n]이 신호에 부가되는 것으로 도시되지만, 디지털 신호 프로세서가 마이크로폰으로부터 신호(x2[n])를 수신할 때, h[n] 신호는 일반적으로 신호(x2[n])의 불가분한 성분이고 다른 노이즈(v2[n]) 및 스피치 신호(s[n])와 결합된다. 이어서, 블록킹 매트릭스는 h[n]을 모델링하기 위해 hest[n]을 추정하는 모델(402)을 생성한다. 따라서, hest[n]가 제1 마이크로폰(x1[n])으로부터의 신호에 부가되고, 그 신호가 프로세싱 블록(210)에서 x2[n] 신호와 결합될 때, 출력 신호(b[n])는 원하는 스피치 신호에서 소거된다. 상가성 노이즈들(v1[n] 및 v2[n])은 서로 상관되고, 상관 정도는 마이크로폰 간격에 따른다.
[0035] 알려지지 않은 시스템(h[n])은 적응 필터를 사용하여 hest[n]에서 추정될 수 있다. 적응 필터 계수들은 다음 수학식에 도시된 바와 같이 종래 NLMS(normalized least squares)를 사용하여 업데이트될 수 있다:
여기서
신호(x1[n])의 과거 및 현재 샘플들을 나타내고, L은 조정될 수 있는 다수의 FIR(finite impulse response) 필터 계수들이고, 그리고 μ는 원하는 적응성 레이트에 기반하여 조정될 수 있는 학습 레이트이다. NLMS-기반 필터 계수들 추정의 수렴 깊이는 신호들(x1[n](기준 신호) 및 x2[n](입력 신호)에 존재하는 노이즈의 상관 특성들에 의해 제한될 수 있다.
[0036] 시스템(400)의 적응 필터(402)의 계수들은 대안적으로, 이를테면 관찰된(기준 및 입력 둘 모두) 신호들이 상관되지 않은 백색 노이즈 신호들에 의해 변질될 때, TLS(total least squares) 접근법에 기반하여 계산될 수 있다. TLS 접근법의 일 실시예에서, GrTLS(gradient-descent based TLS solution)는 다음 수학식에 의해 주어진다:
[0037] 필터 계수들을 추정하기 위한 디지털 신호 프로세서, 이를테면 NLMS 또는 GrTLS에 의해 구현되는 학습 알고리즘의 타입은 사용자 또는 프로세서 상에서 실행되는 제어 알고리즘에 의해 선택될 수 있다. LS 솔루션에 대한 TLS 솔루션의 수렴 개선의 깊이는 SNR(signal-to-noise ratio) 및 임펄스 응답의 최대 진폭에 따를 수 있다.
[0038] TLS 학습 알고리즘은, 부가적인 노이즈들(v1[n] 및 v2[n]) 둘 모두가 시간적으로 그리고 공간적으로 상관되지 않는다는 가정에 기반하여 유도될 수 있다. 그러나, 노이즈들은 마이크로폰 신호들 사이에 존재하는 공간적 상관 및 또한 음향 배경 노이즈들이 스펙트럼적으로 편평하지 않다는(즉, 일시적으로 상관됨) 사실로 인해 상관될 수 있다. 이런 상관된 노이즈는 학습 알고리즘들의 불충분한 수렴 깊이를 초래할 수 있다.
[0039] 시간적 상관의 효과들은 마이크로폰들로부터 수신된 신호들(x1[n] 및 x2[n])에 고정식 사전-백색화 필터를 적용함으로써 감소될 수 있다. 도 5는 본 개시내용의 일 실시예에 따른 사전-백색화 필터로 적응성 블록킹 매트릭스 프로세싱을 위한 신호 프로세싱의 예시적 모델이다. PW(Pre-whitening) 블록들(504 및 506)은 프로세싱 블록(210)에 부가될 수 있다. PW 블록들(504 및 506)은 사전-백색화 필터를 마이크로폰 신호들(x1[n] 및 x2[n])에 각각 적용하여, 신호들(y1[n] 및 y2[n])을 획득할 수 있다. 대응하는 사전-백색화된 신호들의 노이즈들은 각각 q1[n] 및 q2[n]로서 표현된다. PW(pre-whitening) 필터는 1차 FIR(finite impulse response) 필터를 사용하여 구현될 수 있다. 일 실시예에서, PW 블록들(504 및 506)은 신호들(x1[n] 및 x2[n]) 내의 가변 노이즈 스펙트럼을 고려하기 위해 적응적으로 수정될 수 있다. 다른 실시예에서, PW 블록들(504 및 506)은 고정식 사전-백색화 필터들일 수 있다.
[0040] PW 블록들(504 및 506)은 공간적 및/또는 시간적 사전-백색화를 적용할 수 있다. 공간적 사전-백색화 기반 업데이트 수학식들 또는 다른 업데이트 수학식들을 사용하는 것의 선택은 사용자에 의해 또는 제어기 상에서 실행되는 알고리즘에 의해 제어될 수 있다. 일 실시예에서, 시간적 및 공간적 사전-백색화 프로세스는 상관 매트릭스의 제곱근 인버스의 완전한 지식을 사용하여 단일 단계 프로세스로서 구현될 수 있다. 다른 실시예에서, 사전-백색화 프로세스는, 시간적 사전-백색화가 먼저 수행되고 공간적 사전-백색화 프로세스가 수행되는 2개의 단계들로 분할될 수 있다. 공간적 사전-백색화 프로세스는 상관 매트릭스의 제곱근 인버스를 근사화시킴으로써 수행될 수 있다. 다른 실시예에서, 상관 매트릭스의 근사화된 제곱근 인버스를 사용한 공간적 사전-백색화는 신호 간 모델 추정 프로세스의 계수 업데이트 단계에 내장된다.
[0041] 도 4의 적응 필터(402)와 유사할 수 있는 적응 필터(502)를 적용하고, 그리고 신호(e[n])를 형성하기 위해 신호들을 결합한 이후에, 사전-백색화 프로세스의 필터링 효과는 이를테면 신호(e[n])에 IIR 필터를 적용함으로써 IPW(inverse pre-whitening) 블록(508)에서 제거될 수 있다. 일 실시예에서, PW 필터의 분자 및 분모 계수들은 IPW 필터(a0 = 1, a1 = 0, b0 = 0.9, b1 = -0.7)에 의해 주어지고 IPW 필터의 분자 및 분포 계수들은 (a0 = 0.9, a1 = -0.7, b0 = 1, b1 = 0)에 의해 주어지고, 여기서 ai들과 bi들은 IIR 필터의 분모와 분자 계수들이다. IPW 블록(508)의 출력은 b[n] 신호이다.
[0042] 공간적 상관의 효과들은 공간적 상관 매트릭스로부터 획득될 수 있는 상관해제(decorrelating) 매트릭스를 사용하여 노이즈를 상관해제시킴으로써 처리될 수 있다. 신호들을 명시적으로 상관해제하는 대신, 노이즈의 상호-상관은 최소화 문제의 비용 함수에 포함될 수 있고, 추정된 상호-상관 함수의 함수인 기울기 강하 알고리즘은 적응 필터(502)에 대해 선택된 임의의 학습 알고리즘에 대해 유도될 수 있다.
[0043] 예컨대, TLS 학습 알고리즘에 대해, 적응 필터(502)에 대한 계수들은 다음 수학식으로부터 컴퓨팅(compute)될 수 있다:
[0044] 다른 예로서, LS 학습 알고리즘에 대해, 적응 필터(502)에 대한 계수들은 다음 수학식으로부터 컴퓨팅될 수 있다:
여기서 σq는 평균 노이즈 전력의 제곱근을 취함으로써 컴퓨팅될 수 있는 배경 노이즈의 표준 편차이고, rq2q1은 시간적으로 백색화된 마이크로폰 신호들 사이의 상호-상관이다. 이어서, 평활화된 표준 편차들은 다음 수학식으로부터 획득될 수 있다:
여기서 Eq[l]는 평균된 노이즈 전력이고 α는 평활화 파라미터이다.
[0045] 일반적으로, 배경 노이즈들은 파 필드로부터 도달하고 그러므로 양쪽 마이크로폰들에서 노이즈 전력은 동일한 전력을 가지는 것으로 가정될 수 있다. 따라서, 마이크로폰들 중 어느 하나로부터의 노이즈 전력은 Eq[l]를 계산하기 위해 사용될 수 있다. 평활화된 노이즈 상호-상관 추정(rq2q1)은 아래와 같이 획득된다:
여기서
여기서 m은 샘플들에서 상호-상관 지연 래그(lag)이고, N은 상호-상관을 추정하는데 사용되는 샘플들의 수이고 256개의 샘플들로 세팅되고, l은, N개의 샘플들 크기의 노이즈 버퍼들이 생성되는 슈퍼-프레임(super-frame) 시간 인덱스이고, D는 입력(x2[n])에서 도입된 인과 지연이고 그리고 β는 조정가능한 평활화 상수이다. 도 2를 다시 참조하면, 위에서 설명된 rq2q1 팩터는 노이즈 상관 결정 블록(212)에 의해 컴퓨팅될 수 있다.
[0046] 노이즈 상호-상관 값은, 래그가 증가함에 따라 중요하지 않을 수 있다. 컴퓨테이셔널 복잡성을 감소시키기 위해, 단지 선택된 수의 래그들에 대응하는 상호-상관이 컴퓨팅될 수 있다. 따라서, 최대 상호-상관 래그(M)는 사용자에 의해 조정가능하거나 알고리즘에 의해 결정될 수 있다. 더 큰 M의 값은, 더 적은 수의 노이즈 소스들, 이를테면 지향성, 간섭성, 경쟁 화자(talker)가 존재하거나 마이크로폰들이 서로 밀접하게 간격을 두는 애플리케이션들에서 사용될 수 있다.
[0047] 원하는 스피치의 존재 동안 상호-상관의 추정은 노이즈 상관 추정을 변질시킬 수 있고, 이에 의해 원하는 스피치 소거 성능에 영향을 미친다. 그러므로, 상호-상관 컴퓨테이션을 위한 데이터 샘플들의 버퍼링 및 평활화된 상호-상관의 추정은 임의의 특정 시간들에서만 인에이블될 수 있고 그리고 예컨대 원하는 스피치의 부재가 높은 신뢰도로 검출될 때 디스에이블될 수 있다.
[0048] 도 6은 본 개시내용의 일 실시예에 따라 노이즈 상관 결정 전에 사전-백색화 필터로 적응성 블록킹 매트릭스 프로세싱을 위한 신호 프로세싱의 예시적 모델이다. 도 6의 시스템(600)은 도 5의 시스템(500)과 유사하지만, 노이즈 상관 결정 블록(610)을 포함한다. 상관 블록(610)은 입력으로서, 블록들(504 및 506)로부터의 사전-백색화된 마이크로폰 신호들을 수신할 수 있다. 상관 블록(610)은 적응 필터(502)에, 노이즈 상관 파라미터, 이를테면 rq2q1을 출력할 수 있다.
[0049] 도 7은 본 개시내용의 일 실시예에 따른 사전-백색화 필터 및 지연으로 적응성 블록킹 매트릭스 프로세싱을 위한 신호 프로세싱의 예시적 모델이다. 도 7의 시스템(700)은 도 6의 시스템(600)과 유사하지만, 지연 블록(722)을 포함한다. 원하는 신호의 도달 방향 및 선택된 기준 신호에 따라, 시스템(h[n])의 임펄스 응답은 무원인(acausal) 시스템을 초래할 수 있다. 이런 무원인 시스템은 적응 필터(502)의 입력에 지연(z-D) 블록(722)을 도입함으로써 구현될 수 있어서, 추정된 임펄스 응답은 트루(true) 시스템의 시간 시프트된 버전이다. 입력에 도입된 블록(722)에서의 지연은 사용자에 의해 조정될 수 있거나 제어기 상에서 실행되는 알고리즘에 의해 결정될 수 있다.
[0050] 신호 프로세싱 블록의 일 실시예를 구현하기 위한 시스템은 도 8에 도시된다. 도 8은 본 개시내용의 일 실시예에 따른 기울기 강하 TLS(total least squares) 학습 알고리즘을 실행시키기 위한 시스템의 예시적 블록 다이어그램이다. 시스템(800)은 노이지 신호 소스들(802A 및 802B), 이를테면 디지털 MEMS(micro-electromechanical systems) 마이크로폰들을 포함한다. 노이지 신호들은 각각 사전-시간적 백색화 필터들(806A 및 806B)을 통과할 수 있다. 2개의 필터들이 도시되지만, 일 실시예에서 사전-백색화 필터는 신호 소스들(802A 및 802B) 중 단지 하나에만 적용될 수 있다. 이어서, 사전-백색화된 신호들은 상관 결정 모듈(810) 및 기울기 강하 TLS 모듈(808)에 제공된다. 모듈들(808 및 810)은 동일한 프로세서, 이를테면 DSP(digital signal processor) 상에서 실행될 수 있다. 상관 결정 모듈(810)은 위에서 설명된 바와 같은 파라미터(rq2q1)를 결정할 수 있고, 파라미터(rq2q1)는 GrTLS 모듈(808)에 제공된다. 이어서, GrTLS 모듈(808)은 입력 소스들(802A 및 802B)의 둘 모두에서 수신된 스피치 신호를 대표하는 신호를 생성한다. 이어서, 그 신호는 인버스 사전-백색화 필터(812)를 통과하여, 소스들(802A 및 802B)에서 수신된 신호를 생성한다. 추가로, 필터들(806A, 806B 및 812)은 또한 GrTLS 블록(808)과 동일한 프로세서, 또는 DSP(digital signal processor) 상에서 구현될 수 있다.
[0051] 위에서 설명된 예시적 시스템들을 적용한 결과들은 샘플 노이지 신호들을 시스템들에 적용하고 시스템들의 출력에서 노이즈 감소를 결정함으로써 예시될 수 있다. 도 9는 본 개시내용의 특정 실시예들에 적용된 특정 예시적 입력들에 대한 노이즈 상관 값들을 예시하는 예시적 그래프들이다. 그래프(900)는 적응성 노이즈 소거기에 대한 기준 신호(b[n] 신호)와 그의 입력(a[n] 신호) 사이의 크기 제곱 코히어런스(coherence)의 그래프이다. 거의 이상적인 경우가 라인(902)으로서 도시된다. NLMS 학습 알고리즘에 대한 노이즈 상관 그래프들은 라인들(906A 및 906B)로서 도시된다. GrTLS 학습 알고리즘에 대한 노이즈 상관 그래프들은 라인들(904A 및 904B)로서 도시된다. 라인들(904A 및 904B)은 통상적인 배경 노이즈들에 대한 공통 주파수들인 특히 100 헤르쯔 내지 1000 헤르쯔의 주파수들에서 902의 이상적인 경우에 더 가깝다. 따라서, 위에서 설명된 GrTLS-기반 시스템들은 적어도 특정 노이지 신호들에 대해, 종래의 시스템들에 비해 노이즈 감소의 가장 높은 개선을 제공할 수 있다. 게다가, 노이즈 상관은, 사전-백색화 접근법이 사용될 때 개선된다.
[0052] 위에서 설명된 적응성 블록킹 매트릭스 및 다른 컴포넌트들 및 방법들은 모바일 디바이스의 니어 및/또는 파 마이크로폰들로부터 수신된 신호들을 프로세싱하기 위해 모바일 디바이스에서 구현될 수 있다. 모바일 디바이스는 예컨대 모바일 폰, 태블릿 컴퓨터, 랩톱 컴퓨터, 또는 무선 이어폰일 수 있다. 모바일 디바이스의 프로세서, 이를테면 디바이스의 애플리케이션 프로세서는 적응성 빔형성기, 적응성 블록킹 매트릭스, 적응성 노이즈 소거기, 이를테면 도 2, 도 4, 도 5, 도 6, 도 7 및/또는 도 8을 참조하여 위에서 설명된 것들, 또는 프로세싱을 위한 다른 회로를 구현할 수 있다. 대안적으로, 모바일 디바이스는 이들 기능들을 수행하기 위한 특정 하드웨어, 이를테면 DSP(digital signal processor)를 포함할 수 있다. 추가로, 프로세서 또는 DSP는 위의 실시예들 및 설명에서 설명된 바와 같은 수정된 적응성 블록킹 매트릭스를 가진 도 1의 시스템을 구현할 수 있다.
[0053] 도 3의 개략 흐름도 다이어그램은 일반적으로 로지컬 흐름도 다이어그램으로서 설명된다. 따라서, 도시된 순서 및 라벨링(label)된 단계들은 개시된 방법의 양상들을 가리킨다. 예시된 방법의 하나 또는 그 초과의 단계들, 또는 단계들의 부분들에 대해 기능, 로직, 또는 효과가 동등한 다른 단계들 및 방법들이 고려될 수 있다. 부가적으로, 이용된 포맷 및 심볼들은 방법의 로지컬 단계들을 설명하기 위해 제공되고 방법의 범위를 제한하지 않는 것으로 이해된다. 다양한 화살표 타입들 및 라인 타입들이 흐름도 다이어그램에 이용될 수 있지만, 이들은 대응하는 방법의 범위를 제한하지 않는 것으로 이해된다. 실제로, 일부 화살표들 또는 다른 연결기들은 방법의 로지컬 흐름만을 표시하기 위해 사용될 수 있다. 예컨대, 화살표는 도시된 방법의 열거된 단계들 간의 불특정 지속기간의 대기 기간 또는 모니터링 기간을 표시할 수 있다. 부가적으로, 특정 방법이 발생하는 순서는 도시된 대응하는 단계들의 순서를 엄격하게 고수하거나 고수하지 않을 수 있다.
[0054] 펌웨어 및/또는 소프트웨어로 구현되면, 위에서 설명된 기능들은 컴퓨터-판독가능 매체상에 하나 또는 그 초과의 명령들 또는 코드로서 저장될 수 있다. 예들은 데이터 구조로 인코딩된 비-일시적 컴퓨터-판독가능 매체들 및 컴퓨터 프로그램으로 인코딩된 컴퓨터-판독가능 매체들을 포함한다. 컴퓨터-판독가능 매체들은 물리 컴퓨터 저장 매체들을 포함한다. 저장 매체는 컴퓨터에 의해 액세스될 수 있는 어떤 이용 가능한 매체일 수 있다. 제한이 아닌 예로써, 그런 컴퓨터-판독가능 매체들은 RAM(random access memory), ROM(read-only memory), EEPROM(electrically erasable programmable read only memory), CD-ROM(compact disc read-only memory) 또는 다른 광학 디스크 저장부, 자기 디스크 저장부 또는 다른 자기 저장 디바이스들, 또는 명령들 또는 데이터 구조들 형태의 원하는 프로그램 코드를 저장하기 위하여 사용될 수 있고 컴퓨터에 의해 액세스될 수 있는 임의의 다른 매체를 포함할 수 있다. 디스크(disk) 및 디스크(disc)는 CD들(compact discs), 레이저 디스크들(laser discs), 광학 디스크들(discs), DVD들(digital versatile discs), 플로피 디스크들(disks) 및 블루-레이 디스크들(discs)을 포함한다. 일반적으로, 디스크(disk)들은 데이터를 자기적으로 재생하고, 디스크(disc)들은 데이터를 광학적으로 재생한다. 위의 조합들은 또한 컴퓨터-판독가능 매체들의 범위 내에 포함되어야 한다.
[0055] 컴퓨터 판독가능 매체상의 저장 외에, 명령들 및/또는 데이터는 통신 장치에 포함된 송신 매체들에 대한 신호들로서 제공될 수 있다. 예컨대, 통신 장치는 명령들 및 데이터를 표시하는 신호들을 가진 트랜시버를 포함할 수 있다. 명령들 및 데이터는, 하나 또는 그 초과의 프로세서들로 하여금 청구항들에 설명된 기능들을 구현하게 하도록 구성된다.
[0056] 비록 본 개시내용 및 특정 대표적 장점들이 상세히 설명되었지만, 다양한 변화들, 대체들 및 변경들이 첨부된 청구항들에 의해 정의된 바와 같은 본 개시내용의 사상 및 범위에서 벗어나지 않고 본원에서 이루어질 수 있다는 것이 이해되어야 한다. 예컨대, 위의 설명이 모바일 디바이스의 마이크로폰들로부터 스피치 신호를 프로세싱하고 추출하는 것을 참조하지만, 위에서 설명된 방법들 및 시스템들은 다른 디바이스들로부터 다른 신호들을 추출하는데 사용될 수 있다. 개시된 방법들 및 시스템들을 구현할 수 있는 다른 시스템들은 예컨대, 노이지 마이크로폰 신호로부터 기기 사운드를 추출해야 할 수 있는 오디오 장비에 대한 프로세싱 회로를 포함한다. 또 다른 시스템은 노이지 센서로부터 원하는 신호를 추출해야 할 수 있는 레이더, 소나(sonar), 또는 이미징 시스템을 포함할 수 있다. 게다가, 본 출원의 범위는 명세서에 설명된 프로세스, 머신, 제조, 물질의 조성, 수단, 방법들 및 단계들의 특정 실시예들로 제한되도록 의도되지 않는다. 당업자가 본 개시로부터 쉽게 인식할 바와 같이, 본원에 설명된 대응하는 실시예들과 실질적으로 동일한 기능을 수행하거나 실질적으로 동일한 결과를 달성하도록 현재 존재하거나 이후에 개발될 프로세스들, 머신들, 제조, 물질의 조성들, 수단, 방법들, 또는 단계들이 활용될 수 있다. 따라서, 첨부된 청구항들은 그런 프로세스들, 기계들, 제조, 물질의 조성들, 수단, 방법들, 또는 단계들을 그들의 범위 내에 포함하도록 의도된다.
Claims (32)
- 디지털 신호들을 프로세싱하기 위한 방법으로서,
복수의 센서들에 커플링된 프로세서에 의해, 적어도 제1 노이지(noisy) 입력 신호 및 제2 노이지 입력 신호를 수신하는 단계 ― 상기 제1 노이지 입력 신호 및 상기 제2 노이지 입력 신호 각각은 상기 복수의 센서들로부터 발생함 ―;
상기 프로세서에 의해, 상기 제1 노이지 입력 신호와 상기 제2 노이지 입력 신호 사이의 적어도 하나의 추정된 노이즈 상관 통계(statistic)를 결정하는 단계; 및
상기 프로세서에 의해, 노이즈 상관이 적응성 노이즈 소거기 모듈에 대한 입력과 적응성 블록킹 매트릭스(blocking matrix)의 출력 사이에 유지되도록, 상기 적어도 하나의 추정된 노이즈 상관 통계에 적어도 부분적으로 기반하여 상기 제1 노이지 입력 신호와 상기 제2 노이지 입력 신호 사이의 센서 간 신호 모델을 추정하는 학습 알고리즘을 상기 적응성 블록킹 매트릭스에서 실행하는 단계
를 포함하는,
방법. - 제1 항에 있어서,
상기 학습 알고리즘을 실행하는 단계는 상기 추정된 노이즈 상관 통계에 적어도 부분적으로 기반하여 적어도 하나의 필터 계수를 계산하는 적응 필터를 실행하는 단계를 포함하는,
방법. - 제2 항에 있어서,
상기 적응 필터를 실행하는 단계는 상기 추정된 노이즈 상관 통계를 포함하는 TLS(total least squares) 비용 함수를 푸는(solving) 단계를 포함하는,
방법. - 제2 항에 있어서,
상기 적응 필터를 실행하는 단계는 TLS 비용 함수를 최소화하기 위해 상기 추정된 노이즈 상관 통계를 포함하는 GrTLS(gradient descent total least squares) 학습 방법을 실행하는 단계를 포함하는,
방법. - 제2 항에 있어서,
상기 적응 필터를 실행하는 단계는 LS(least squares) 비용 함수를 최소화하기 위해 상기 추정된 노이즈 상관 통계를 포함하는 LS 학습 방법을 실행하는 단계를 포함하는,
방법. - 제2 항에 있어서,
상기 적응 필터를 실행하는 단계는 상기 추정된 노이즈 상관 통계를 사용하는 LMS(least mean squares) 학습 방법을 유도하기 위해 LS 비용 함수를 푸는 단계를 포함하는,
방법. - 제1 항에 있어서,
상기 프로세서에 의해, 상기 적어도 하나의 추정된 노이즈 상관 통계를 결정하는 단계 이전에 상기 제1 노이지 입력 신호 및 상기 제2 노이지 입력 신호 중 적어도 하나를 필터링하는 단계를 더 포함하는,
방법. - 제5 항에 있어서,
상기 적응 필터를 실행하는 단계는 공간적 사전-백색화 근사화(pre-whitening approximation)를 상기 제1 노이지 입력 신호 및 상기 제2 노이지 입력 신호 중 적어도 하나에 적용하는 단계를 포함하는,
방법. - 제8 항에 있어서,
상기 공간적 사전-백색화 근사화를 적용하는 단계는 직접 매트릭스 인버전(inversion) 없이 그리고 매트릭스 제곱근 컴퓨테이션(computation) 없이 수행되는,
방법. - 제8 항에 있어서,
상기 추정된 센서 간 신호 모델을 상기 제1 노이지 입력 신호 및 상기 제2 노이지 입력 신호 중 적어도 하나에 적용하는 단계;
상기 추정된 센서 간 신호 모델을 상기 제1 노이지 입력 신호 및 상기 제2 노이지 입력 신호 중 적어도 하나에 적용하는 단계 이후에 상기 제1 노이지 입력 신호와 상기 제2 노이지 입력 신호를 결합하는 단계; 및
인버스(inverse) 사전-백색화 필터를 결합된 제1 노이지 입력 신호와 제2 노이지 입력 신호에 적용하는 단계
를 더 포함하는,
방법. - 디지털 신호들을 프로세싱하기 위한 장치로서,
제1 노이지 입력 신호를 수신하도록 구성된 제1 입력 노드;
제2 노이지 입력 신호를 수신하도록 구성된 제2 입력 노드;
상기 제1 입력 노드에 커플링되고 상기 제2 입력 노드에 커플링되는 프로세서
를 포함하고,
상기 프로세서는:
복수의 센서들로부터 적어도 제1 노이지 입력 신호 및 제2 노이지 입력 신호를 수신하는 단계;
상기 제1 노이지 입력 신호와 상기 제2 노이지 입력 신호 사이의 적어도 하나의 추정된 노이즈 상관 통계를 결정하는 단계; 및
노이즈 상관이 적응성 노이즈 소거기 모듈에 대한 입력과 블록킹 매트릭스의 출력 사이에 유지되도록, 상기 적어도 하나의 추정된 노이즈 상관 통계에 적어도 부분적으로 기반하여 상기 제1 노이지 입력 신호와 상기 제2 노이지 입력 신호 사이의 센서 간 신호 모델을 추정하는 학습 알고리즘을 실행하는 단계
를 수행하도록 구성되는,
장치. - 제11 항에 있어서,
상기 학습 알고리즘을 실행하는 단계는 상기 추정된 노이즈 상관 통계에 적어도 부분적으로 기반하여 적어도 하나의 필터 계수를 계산하는 적응 필터를 실행하는 단계를 포함하는,
장치. - 제12 항에 있어서,
상기 적응 필터를 실행하는 단계는 상기 추정된 노이즈 상관 통계를 포함하는 TLS 비용 함수를 푸는 단계를 포함하는,
장치. - 제12 항에 있어서,
상기 적응 필터를 실행하는 단계는 TLS 비용 함수를 최소화하기 위해 상기 추정된 노이즈 상관 통계를 포함하는 GrTLS 학습 방법을 실행하는 단계를 포함하는,
장치. - 제12 항에 있어서,
상기 적응 필터를 실행하는 단계는 LS 비용 함수를 최소화하기 위해 상기 추정된 노이즈 상관 통계를 포함하는 LS 학습 방법을 실행하는 단계를 포함하는,
장치. - 제12 항에 있어서,
상기 적응 필터를 실행하는 단계는 상기 추정된 노이즈 상관 통계를 사용하는 LMS 학습 방법을 유도하기 위해 LS 비용 함수를 푸는 단계를 포함하는,
장치. - 제11 항에 있어서,
상기 프로세서는, 상기 적어도 하나의 추정된 노이즈 상관 통계를 결정하는 단계 이전에 상기 프로세서에 의해, 상기 제1 노이지 입력 신호 및 상기 제2 노이지 입력 신호 중 적어도 하나를 필터링하는 단계를 실행하도록 추가로 구성되는,
장치. - 제17 항에 있어서,
상기 필터링하는 단계는 공간적 사전-백색화 근사화를 상기 제1 노이지 입력 신호 및 상기 제2 노이지 입력 신호 중 적어도 하나에 적용하는 단계를 포함하는,
장치. - 제18 항에 있어서,
상기 공간적 사전-백색화 근사화를 적용하는 단계는 직접 매트릭스 인버전(inversion) 없이 그리고 매트릭스 제곱근 컴퓨테이션 없이 수행되는,
장치. - 제18 항에 있어서,
상기 프로세서는:
상기 추정된 센서 간 신호 모델을 상기 제1 노이지 입력 신호 및 상기 제2 노이지 입력 신호 중 적어도 하나에 적용하는 단계;
상기 추정된 센서 간 신호 모델을 상기 제1 노이지 입력 신호 및 상기 제2 노이지 입력 신호 중 적어도 하나에 적용하는 단계 이후에 상기 제1 노이지 입력 신호와 상기 제2 노이지 입력 신호를 결합하는 단계; 및
인버스 사전-백색화 필터를 결합된 제1 노이지 입력 신호와 제2 노이지 입력 신호에 적용하는 단계
를 실행하도록 추가로 구성되는,
장치. - 제11 항에 있어서,
상기 제1 입력 노드는 니어(near) 마이크로폰에 커플링하도록 구성되고, 그리고 상기 제2 입력 노드는 파(far) 마이크로폰에 커플링하도록 구성되는,
장치. - 제11 항에 있어서,
상기 프로세서는 DSP(digital signal processor)인,
장치. - 디지털 신호들을 프로세싱하기 위한 장치로서,
제1 센서로부터 제1 노이지 입력 신호를 수신하도록 구성된 제1 입력 노드;
제2 센서로부터 제2 노이지 입력 신호를 수신하도록 구성된 제2 입력 노드;
상기 제1 입력 노드에 커플링되고 상기 제2 입력 노드에 커플링되는 고정식 빔형성기 모듈;
상기 제1 입력 노드에 커플링되고 상기 제2 입력 노드에 커플링되는 적응성 블록킹 매트릭스 모듈 ― 상기 적응성 블록킹 매트릭스 모듈은 적어도 하나의 추정된 노이즈 상관 통계에 적어도 부분적으로 기반하여 상기 제1 노이지 입력 신호와 상기 제2 노이지 입력 신호 사이의 센서 간 신호 모델을 추정하는 학습 알고리즘을 실행함 ―; 및
상기 고정식 빔형성기 모듈에 커플링되고 상기 적응성 블록킹 매트릭스 모듈에 커플링되는 적응성 노이즈 소거기
를 포함하고,
상기 적응성 노이즈 소거기는 상기 제1 센서 및 상기 제2 센서에서 수신된 오디오 신호를 대표하는 출력 신호를 출력하도록 구성되고,
상기 적응성 블록킹 매트릭스는 상기 적응성 노이즈 소거기에 대한 입력과 상기 적응성 블록킹 매트릭스의 출력 사이의 노이즈 상관을 유지하도록 구성되는,
장치. - 제23 항에 있어서,
상기 블록킹 매트릭스 모듈은:
공간적 사전-백색화 근사화를 상기 제1 노이지 입력 신호에 적용하는 단계;
상기 공간적 사전-백색화 근사화를 상기 제2 노이지 입력 신호에 적용하는 단계;
상기 추정된 센서 간 신호 모델을 상기 제1 노이지 입력 신호 및 상기 제2 노이지 입력 신호 중 적어도 하나에 적용하는 단계;
상기 추정된 센서 간 신호 모델을 적용하는 단계 이후에 상기 제1 노이지 입력 신호와 상기 제2 노이지 입력 신호를 결합하는 단계; 및
인버스 사전-백색화 필터를 결합된 제1 노이지 입력 신호와 제2 노이지 입력 신호에 적용하는 단계
를 실행하도록 구성되는,
장치. - 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020197002784A KR102333031B1 (ko) | 2015-09-30 | 2016-06-29 | 적응성 빔 형성을 위한 사전 백색화를 사용하는 적응성 블록 매트릭스 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/871,688 US9607603B1 (en) | 2015-09-30 | 2015-09-30 | Adaptive block matrix using pre-whitening for adaptive beam forming |
US14/871,688 | 2015-09-30 | ||
PCT/US2016/040034 WO2017058320A1 (en) | 2015-09-30 | 2016-06-29 | Adaptive block matrix using pre-whitening for adaptive beam forming |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197002784A Division KR102333031B1 (ko) | 2015-09-30 | 2016-06-29 | 적응성 빔 형성을 위한 사전 백색화를 사용하는 적응성 블록 매트릭스 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20180039138A KR20180039138A (ko) | 2018-04-17 |
KR101976135B1 true KR101976135B1 (ko) | 2019-05-07 |
Family
ID=55132322
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020187006782A KR101976135B1 (ko) | 2015-09-30 | 2016-06-29 | 적응성 빔 형성을 위한 사전 백색화를 사용하는 적응성 블록 매트릭스 |
KR1020197002784A KR102333031B1 (ko) | 2015-09-30 | 2016-06-29 | 적응성 빔 형성을 위한 사전 백색화를 사용하는 적응성 블록 매트릭스 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197002784A KR102333031B1 (ko) | 2015-09-30 | 2016-06-29 | 적응성 빔 형성을 위한 사전 백색화를 사용하는 적응성 블록 매트릭스 |
Country Status (8)
Country | Link |
---|---|
US (1) | US9607603B1 (ko) |
EP (1) | EP3357256B1 (ko) |
JP (1) | JP6534180B2 (ko) |
KR (2) | KR101976135B1 (ko) |
CN (1) | CN108141656B (ko) |
GB (2) | GB2542862B (ko) |
TW (2) | TWI660614B (ko) |
WO (1) | WO2017058320A1 (ko) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10475471B2 (en) | 2016-10-11 | 2019-11-12 | Cirrus Logic, Inc. | Detection of acoustic impulse events in voice applications using a neural network |
US10013995B1 (en) * | 2017-05-10 | 2018-07-03 | Cirrus Logic, Inc. | Combined reference signal for acoustic echo cancellation |
US10395667B2 (en) | 2017-05-12 | 2019-08-27 | Cirrus Logic, Inc. | Correlation-based near-field detector |
US10297267B2 (en) | 2017-05-15 | 2019-05-21 | Cirrus Logic, Inc. | Dual microphone voice processing for headsets with variable microphone array orientation |
US10319228B2 (en) | 2017-06-27 | 2019-06-11 | Waymo Llc | Detecting and responding to sirens |
US9947338B1 (en) * | 2017-09-19 | 2018-04-17 | Amazon Technologies, Inc. | Echo latency estimation |
US10885907B2 (en) | 2018-02-14 | 2021-01-05 | Cirrus Logic, Inc. | Noise reduction system and method for audio device with multiple microphones |
US10418048B1 (en) * | 2018-04-30 | 2019-09-17 | Cirrus Logic, Inc. | Noise reference estimation for noise reduction |
US11195540B2 (en) * | 2019-01-28 | 2021-12-07 | Cirrus Logic, Inc. | Methods and apparatus for an adaptive blocking matrix |
US10839821B1 (en) * | 2019-07-23 | 2020-11-17 | Bose Corporation | Systems and methods for estimating noise |
CN110464343A (zh) * | 2019-08-16 | 2019-11-19 | 杭州电子科技大学 | 一种基于自主手部动作的增强型脑肌相干方法 |
US11997474B2 (en) * | 2019-09-19 | 2024-05-28 | Wave Sciences, LLC | Spatial audio array processing system and method |
US10735887B1 (en) * | 2019-09-19 | 2020-08-04 | Wave Sciences, LLC | Spatial audio array processing system and method |
US11508379B2 (en) | 2019-12-04 | 2022-11-22 | Cirrus Logic, Inc. | Asynchronous ad-hoc distributed microphone array processing in smart home applications using voice biometrics |
US11025324B1 (en) | 2020-04-15 | 2021-06-01 | Cirrus Logic, Inc. | Initialization of adaptive blocking matrix filters in a beamforming array using a priori information |
USD998712S1 (en) * | 2021-08-10 | 2023-09-12 | Pacoware Inc. | Block play board |
CN116320947B (zh) * | 2023-05-17 | 2023-09-01 | 杭州爱听科技有限公司 | 一种应用于助听器的频域双通道语音增强方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040071284A1 (en) | 2002-08-16 | 2004-04-15 | Abutalebi Hamid Reza | Method and system for processing subband signals using adaptive filters |
US20070273585A1 (en) * | 2004-04-28 | 2007-11-29 | Koninklijke Philips Electronics, N.V. | Adaptive beamformer, sidelobe canceller, handsfree speech communication device |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS56119517A (en) * | 1980-02-26 | 1981-09-19 | Matsushita Electric Ind Co Ltd | Amplitude limiting circuit |
EP0095902A1 (en) * | 1982-05-28 | 1983-12-07 | British Broadcasting Corporation | Headphone level protection circuit |
WO2005006808A1 (en) * | 2003-07-11 | 2005-01-20 | Cochlear Limited | Method and device for noise reduction |
US7415117B2 (en) * | 2004-03-02 | 2008-08-19 | Microsoft Corporation | System and method for beamforming using a microphone array |
US7464029B2 (en) * | 2005-07-22 | 2008-12-09 | Qualcomm Incorporated | Robust separation of speech signals in a noisy environment |
US8106827B2 (en) * | 2006-04-20 | 2012-01-31 | Nec Corporation | Adaptive array control device, method and program, and adaptive array processing device, method and program |
KR20070117171A (ko) * | 2006-06-07 | 2007-12-12 | 삼성전자주식회사 | 오디오 앰프의 입력이득 제한 장치 및 방법 |
US8270625B2 (en) * | 2006-12-06 | 2012-09-18 | Brigham Young University | Secondary path modeling for active noise control |
US8005238B2 (en) * | 2007-03-22 | 2011-08-23 | Microsoft Corporation | Robust adaptive beamforming with enhanced noise suppression |
WO2009034524A1 (en) | 2007-09-13 | 2009-03-19 | Koninklijke Philips Electronics N.V. | Apparatus and method for audio beam forming |
CN102113346B (zh) * | 2008-07-29 | 2013-10-30 | 杜比实验室特许公司 | 用于电声通道的自适应控制和均衡的方法 |
US8401206B2 (en) * | 2009-01-15 | 2013-03-19 | Microsoft Corporation | Adaptive beamformer using a log domain optimization criterion |
EP2237270B1 (en) | 2009-03-30 | 2012-07-04 | Nuance Communications, Inc. | A method for determining a noise reference signal for noise compensation and/or noise reduction |
KR101581885B1 (ko) | 2009-08-26 | 2016-01-04 | 삼성전자주식회사 | 복소 스펙트럼 잡음 제거 장치 및 방법 |
US9031268B2 (en) * | 2011-05-09 | 2015-05-12 | Dts, Inc. | Room characterization and correction for multi-channel audio |
CN102903368B (zh) * | 2011-07-29 | 2017-04-12 | 杜比实验室特许公司 | 用于卷积盲源分离的方法和设备 |
US9078057B2 (en) * | 2012-11-01 | 2015-07-07 | Csr Technology Inc. | Adaptive microphone beamforming |
US20140270241A1 (en) * | 2013-03-15 | 2014-09-18 | CSR Technology, Inc | Method, apparatus, and manufacture for two-microphone array speech enhancement for an automotive environment |
US20140270219A1 (en) * | 2013-03-15 | 2014-09-18 | CSR Technology, Inc. | Method, apparatus, and manufacture for beamforming with fixed weights and adaptive selection or resynthesis |
CN104301999B (zh) * | 2014-10-14 | 2017-10-20 | 西北工业大学 | 一种基于rssi的无线传感器网络自适应迭代定位方法 |
CN204761691U (zh) * | 2015-07-29 | 2015-11-11 | 泉州品荣商贸有限公司 | 一种对讲机音频电路 |
-
2015
- 2015-09-30 US US14/871,688 patent/US9607603B1/en active Active
- 2015-11-05 GB GB1519514.2A patent/GB2542862B/en active Active
- 2015-11-05 GB GB1716064.9A patent/GB2556199B/en active Active
-
2016
- 2016-06-29 EP EP16738615.0A patent/EP3357256B1/en active Active
- 2016-06-29 CN CN201680055768.6A patent/CN108141656B/zh active Active
- 2016-06-29 JP JP2018515532A patent/JP6534180B2/ja not_active Expired - Fee Related
- 2016-06-29 WO PCT/US2016/040034 patent/WO2017058320A1/en active Application Filing
- 2016-06-29 KR KR1020187006782A patent/KR101976135B1/ko active IP Right Grant
- 2016-06-29 KR KR1020197002784A patent/KR102333031B1/ko active IP Right Grant
- 2016-09-12 TW TW105129556A patent/TWI660614B/zh active
- 2016-09-12 TW TW107110670A patent/TWI661684B/zh active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040071284A1 (en) | 2002-08-16 | 2004-04-15 | Abutalebi Hamid Reza | Method and system for processing subband signals using adaptive filters |
US20070273585A1 (en) * | 2004-04-28 | 2007-11-29 | Koninklijke Philips Electronics, N.V. | Adaptive beamformer, sidelobe canceller, handsfree speech communication device |
Also Published As
Publication number | Publication date |
---|---|
JP6534180B2 (ja) | 2019-06-26 |
KR20180039138A (ko) | 2018-04-17 |
GB2556199A (en) | 2018-05-23 |
KR20190011839A (ko) | 2019-02-07 |
US9607603B1 (en) | 2017-03-28 |
TW201826725A (zh) | 2018-07-16 |
GB2556199B (en) | 2018-12-05 |
JP2018528717A (ja) | 2018-09-27 |
CN108141656A (zh) | 2018-06-08 |
CN108141656B (zh) | 2020-01-07 |
GB2542862A (en) | 2017-04-05 |
TWI660614B (zh) | 2019-05-21 |
GB201519514D0 (en) | 2015-12-23 |
US20170092256A1 (en) | 2017-03-30 |
TW201714442A (zh) | 2017-04-16 |
EP3357256A1 (en) | 2018-08-08 |
GB201716064D0 (en) | 2017-11-15 |
WO2017058320A1 (en) | 2017-04-06 |
EP3357256B1 (en) | 2022-03-30 |
TWI661684B (zh) | 2019-06-01 |
KR102333031B1 (ko) | 2021-11-29 |
GB2542862B (en) | 2019-04-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101976135B1 (ko) | 적응성 빔 형성을 위한 사전 백색화를 사용하는 적응성 블록 매트릭스 | |
KR102410447B1 (ko) | 적응성 빔포밍 | |
KR101449433B1 (ko) | 마이크로폰을 통해 입력된 사운드 신호로부터 잡음을제거하는 방법 및 장치 | |
RU2546717C2 (ru) | Многоканальное акустическое эхоподавление | |
JP4689269B2 (ja) | 静的スペクトルパワー依存型音響強調システム | |
CN108293170B (zh) | 波束成形应用中的自适应无相位失真幅度响应均衡的方法及装置 | |
JP5738488B2 (ja) | ビームフォーミング装置 | |
CN109326297B (zh) | 自适应后滤波 | |
KR102517939B1 (ko) | 원거리 장 사운드 캡처링 | |
TWI465121B (zh) | 利用全方向麥克風改善通話的系統及方法 | |
US11195540B2 (en) | Methods and apparatus for an adaptive blocking matrix | |
CN109308907B (zh) | 单信道降噪 | |
Azarpour et al. | Distortionless-response vs. matched-filter-array processing for adaptive binaural noise reduction | |
Tomita | Binaural asynchronous component cancellation—An extension of the spatial Wiener filter |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
A107 | Divisional application of patent | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |