KR20170039126A - 오디오 신호들을 정제하는 멀티 오럴 mmse 분석 기술들 - Google Patents
오디오 신호들을 정제하는 멀티 오럴 mmse 분석 기술들 Download PDFInfo
- Publication number
- KR20170039126A KR20170039126A KR1020177001307A KR20177001307A KR20170039126A KR 20170039126 A KR20170039126 A KR 20170039126A KR 1020177001307 A KR1020177001307 A KR 1020177001307A KR 20177001307 A KR20177001307 A KR 20177001307A KR 20170039126 A KR20170039126 A KR 20170039126A
- Authority
- KR
- South Korea
- Prior art keywords
- audio signal
- frequency band
- primary
- frequency bands
- microphone
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 254
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000004458 analytical method Methods 0.000 title claims description 34
- 238000007670 refining Methods 0.000 claims abstract description 9
- 238000012545 processing Methods 0.000 claims abstract description 8
- 238000004891 communication Methods 0.000 claims description 22
- 230000003044 adaptive effect Effects 0.000 claims description 19
- 230000000694 effects Effects 0.000 claims description 3
- 238000003556 assay Methods 0.000 abstract 1
- 230000008569 process Effects 0.000 description 12
- 238000000746 purification Methods 0.000 description 4
- 230000003595 spectral effect Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 1
- 238000005352 clarification Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000010223 real-time analysis Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/08—Mouthpieces; Microphones; Attachments therefor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02165—Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2410/00—Microphones
- H04R2410/05—Noise reduction with a separate noise microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2499/00—Aspects covered by H04R or H04S not otherwise provided for in their subgroups
- H04R2499/10—General applications
- H04R2499/11—Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Abstract
오디오 신호들을 처리하는 기술들은 오디오 신호들을 출력하기 전에 오디오 신호들로부터 잡음을 제거하는 것 또는 다른 방식으로 오디오 신호들을 정제하는 것을 포함한다. 개시된 기술들은 일차 마이크로폰 및 적어도 하나의 기준 마이크로폰으로부터 수신되는 오디오 신호들에 대해 최소 평균 제곱 에러(MMSE) 분석들을 이용할 수 있고, 일차 마이크로폰에 의해 수신되는 오디오 신호들로부터 잡음을 감소시키거나 제거하기 위해 MMSE 분석들이 사용되는 기술들에 관한 것이다. 선택사항적으로, 오디오 신호의 상이한 주파수 대역들에 신뢰 구간들이 할당될 수 있으며, 각각의 신뢰 구간은 그것의 각자의 주파수 대역이 타겟팅된 오디오를 포함할 가능성에 대응하고, 각각의 신뢰 구간은 잡음이 제거된 재구성된 오디오 신호에서 그것의 각자의 주파수 대역의 기여를 나타낸다.
Description
본 개시내용은 일반적으로 오디오 신호들을 출력하기 전에 오디오 신호들로부터 잡음을 제거하거나 다른 방식으로 오디오 신호들을 정제하는 기술들을 포함하는, 오디오 신호들을 처리하는 기술들에 관한 것이다. 더 구체적으로, 본 개시내용은 최소 평균 제곱 에러(minimum mean squared error)(MMSE) 분석들이 일차 마이크로폰 및 적어도 하나의 기준 마이크로폰으로부터 수신되는 오디오 신호들에 대해 수행되는 기술들, 및 일차 마이크로폰에 의해 수신되는 오디오 신호들로부터 잡음을 감소시키거나 제거하기 위해 MMSE 분석들이 사용되는 기술들에 관한 것이다.
다양한 양태들에서, 본 개시내용에 따른 방법은 오디오 신호의 타겟팅된 부분(targeted portion), 또는 성분을 식별하는 단계 및 오디오 신호의 타겟팅된 부분을 동반하는 잡음을 감소시키거나 제거하는 단계를 포함하는 정제 프로세스(clarification process)이다. 정제 프로세스가 사용될 때, 일차 오디오 신호의 타겟팅된 부분, 또는 일차 오디오 신호의 타겟팅된 부분의 적어도 상당한 부분은 정제 프로세스 후에 남거나, 존속할 것이다. 정제 프로세스 후에 남아 있는 일차 오디오 신호의 각각의 부분은 본원에서 "정제된 오디오 신호(clarified audio signal)"로 언급된다. 일차 오디오 신호의 상이한 주파수 대역들이 개별적으로 정제되는 실시예들에서, 정제된 오디오 신호들은 일차 오디오 신호의 재구성된 버전에 포함될 수 있으며, 일차 오디오 신호는 또한 본원에서 "재구성된 오디오 신호"로 언급된다. 정제 프로세스가 오디오 통신 디바이스, 예컨대 이동 전화에서 사용되는 실시예들에서, 일차 오디오 신호의 타겟팅된 부분은 개인의 음성을 포함할 수 있다. 일차 오디오 신호가 정제되었고 정제된 오디오 신호가 재구성된 오디오 신호에 임의로 포함되었다면, 정제된 및/또는 재구성된 오디오 신호가 저장되고, 다른 디바이스에 송신되고 및/또는 가청으로 출력될 수 있다.
오디오 신호를 처리하는 방법은 적어도 2개의 마이크로폰이 서로 근접한 상태에서, 오디오 신호를 사운드의 형태로 수신하지만, 상이한 배향들 또는 관점들을 제공하는 단계, 및 따라서, 오디오 신호를 서로 상이한 방식들로, 또는 상이한 관점들로부터 수신하는 단계를 포함한다. 그러한 배열은 "바이노럴 환경(binaural environment)"으로 언급된다. 마이크로폰들은 일차 마이크로폰 및 하나 이상의 기준 마이크로폰들을 포함한다. 일차 마이크로폰은 의도된 소스로부터 오디오 신호를 수신하도록 위치될 수 있으며; 예를 들어, 일차 마이크로폰은 개인이 이동 전화를 사용하면서 말하는 이동 전화의 마이크로폰을 포함할 수 있다. 의도된 소스로부터의 오디오 신호는 타겟팅된 오디오, 또는 타겟팅된 사운드를 포함할 수 있다. 그것의 배향 또는 관점 때문에, 일차 마이크로폰에 의해 수신되는 오디오 신호는 본원에서 "일차 오디오 신호"로 언급된다.
각각의 기준 마이크로폰은 위치 및 배향, 또는 관점에서, 사운드의 의도된 소스로부터 다소 원격으로 위치될 수 있으며, 그것은 기준 마이크로폰이 배경 사운드를 동일한 정도로 또는 배경 사운드가 일차 마이크로폰에 의해 수신되는 것보다 더 큰 정도로 수신할 수 있게 하고, 일차 마이크로폰이 타겟팅된 오디오를 수신하는 것보다 더 작은 정도로 타겟팅된 오디오를 수신할 수 있게 한다. 각각의 기준 마이크로폰의 관점으로부터 수신되는 오디오 신호는 본원에서 "기준 오디오 신호"로 언급된다.
오디오 신호가 일차 오디오 신호 및 하나 이상의 기준 오디오 신호들로 수신되었다면, 일차 오디오 신호는 정제될 수 있다. 정제 프로세스의 일부로서, 일차 오디오 신호 및 각각의 기준 오디오 신호에 하나 이상의 적응 시간 도메인 필터들이 가해질 수 있다. 특정 실시예에서, 일차 오디오 신호 및/또는 각각의 기준 오디오 신호에 최소 제곱 평균들(LMS) 필터가 가해질 수 있다.
일차 오디오 신호 또는 임의의 기준 오디오 신호에 하나 이상의 적응 시간 도메인 필터들이 가해지는지의 여부에 상관없이, 잡음 추정값이 획득된다. 잡음 추정값은 하나 이상의 기준 오디오 신호들로부터 획득될 수 있다. 더 구체적으로, 잡음 추정값은 적어도 하나의 타겟팅된 오디오의 하나 이상의 부분들(예를 들어, 인간 음성의 포먼트들, 또는 스펙트럼 피크들; 등)이 존재하는 것으로 공지되어 있는 하나 이상의 주파수 대역들로부터 획득될 수 있다. 잡음 추정값은 기준 오디오 신호(들)로부터 단독으로 획득되거나, 기준 오디오 신호(들)의 적절한 부분들(예를 들어, 관심의 각각의 주파수 대역 등)을 잡음에 더하여, 타겟 오디오를 포함하는 일차 오디오 신호의 대응하는 부분들과 비교함으로써 획득될 수 있다. 훨씬 더 구체적으로, 일차 오디오 신호의 특정 주파수 대역의 샘플은 일차 오디오 신호의 그 주파수 대역에 존재하는 예상적, 또는 개연적 잡음(즉, 잡음 추정값)을 식별하기 위해 하나 이상의 기준 오디오 신호들의 동일한 특정 주파수 대역의 동시에 획득된 샘플과 비교될 수 있다. 그것이 어떻게 획득되는지에 상관없이, 각각의 잡음 추정값은 일차 오디오 신호에 존재하거나 일차 오디오 신호의 하나 이상의 주파수 대역들에 존재하는, 예상적 잡음, 또는 개연적 잡음을 식별하기 위해 사용될 수 있다. 바이노럴 환경에서 오디오 신호들을 분석함으로써, 잡음 추정은 잡음이 기준 오디오 신호의 사용 없이 추정될 때 요구되는 바와 같이, 음성 활동 검출기 없이 수행될 수 있다.
각각의 잡음 추정값은 일차 오디오 신호 또는 일차 오디오 신호의 하나 이상의 주파수 대역들 상에 최소 평균 제곱 에러(MMSE) 분석을 수행하는 동안에 고려될 수 있다. MMSE 분석은 잡음 추정값들의 함수 및 일차 오디오 신호들의 주파수 분해에 의해 정의되는, 에러를 최소화하기 위해 사용될 수 있다. 그러한 최소화의 결과는 일차 오디오 신호의 하나 이상의 주파수 대역들을 수정하기 위해 사용될 수 있다. 일부 실시예들에서, MMSE 분석은 하나 이상의 잡음 추정값들에 기초하여 조정될 수 있다. 대안적으로, 하나 이상의 잡음 추정값들은 일차 오디오 신호 또는 일차 오디오 신호의 하나 이상의 주파수 대역들의 MMSE 분석을 위해 감안(account for)되거나 MMSE 분석에 통합(incorporate)될 수 있다. MMSE 분석은 일차 오디오 신호 또는 일차 오디오 신호의 하나 이상의 주파수 대역들로부터 잡음을 적어도 부분적으로 제거하여, 하나 이상의 정제된 오디오 신호들을 제공한다. 다른 방법으로 명시되면, 정제된 오디오 신호(들)의 하나 이상의 주파수 대역들 내의 잡음의 전체 존재가 감소될 수 있거나, 잡음을 포함하지만 타겟팅된 오디오가 없는 각각의 주파수 대역의 경우에, 재구성된 출력 신호 내의 주파수 대역의 전체 존재가 감소될 수 있다.
상이한 주파수 대역들 상에 수행되는 MMSE 분석이 복수의 정제된 오디오 신호들을 야기했던 것들뿐만 아니라, 일차 오디오 신호가 복수의 상이한 주파수 대역들로 분리되었던 것들을 포함하는 일부 실시예들에서, 각각의 정제된 오디오 신호는 복수의 주파수 대역들의 주파수 대역에 대응하며, 신뢰 구간은 각각의 주파수 대역 또는 정제된 오디오 신호에 할당될 수 있다. 각각의 주파수 대역, 또는 정제된 오디오 신호에 대한 신뢰 레벨은 그 주파수 대역, 또는 정제된 오디오 신호가 재구성된 오디오 신호에 포함되는 정도에 대응할 수 있다. 각각의 신뢰 구간은 실시간 분석에 기초하고 및/또는, 일부 실시예들에서, 이력 데이터에 기초할 수 있다. 더 구체적으로, 각각의 주파수 대역 또는 정제된 오디오 신호에 대한 신뢰 구간은 일차 오디오 신호 및 각각의 기준 오디오 신호로부터 얻어지는 정보(예를 들어, 대응하는 주파수 대역에 대한 잡음 추정값, 대응하는 주파수 대역에 대한 MMSE 분석의 결과들 등)에 대응할 수 있다.
신뢰 구간은 그것의 대응하는 주파수 대역 또는 정제된 오디오 신호가 일차 오디오 신호의 타겟팅된 오디오의 적어도 일부, 예컨대 인간 음성, 음악 등을 포함할 가능에 적어도 부분적으로 대응할 수 있다. 일부 실시예들에서, 특정 주파수 대역 또는 정제된 오디오 신호에 대한 신뢰 구간은 주파수 대역 또는 정제된 오디오 신호가 타겟팅된 오디오의 적어도 일부를 포함할 가능성에 대응할 수 있다. 대안적으로, 또는 부가적으로, 특정 주파수 대역 또는 정제된 오디오 신호에 대한 신뢰 구간은 기준 오디오 신호의 대응하는 부분의 대응하는 주파수 대역에 존재하는 잡음과 비교할 때 정제된 오디오 신호로부터 제거되는 잡음의 양(예를 들어, 잡음의 퍼센티지 등)에 대응할 수 있다.
각각의 신뢰 구간은 이득 값; 예를 들어, 영(0)과 일(1) 사이의 값으로 구체화될 수 있으며, 이득 값은 그것의 대응하는 미리 결정된 주파수 대역에 대한 승수로 사용되고, 따라서, 그러한 대응하는 미리 결정된 주파수 대역이 재구성된 출력 오디오 신호에 포함되는 정보를 제어하기 위해 사용될 수 있다. 일 예로서, 주파수 대역 또는 정제된 오디오 신호가 (예를 들어, 그 주파수 대역에 대한 MMSE 분석 등으로부터) 일차 오디오 신호의 타겟팅된 오디오의 일부에 대응하는 높은 신뢰 레벨이 있으면, 비교적 높은 이득 값(예를 들어, 0.5 초과, 0.6과 1 사이 등)이 그 주파수 대역에 할당될 수 있다. 주파수 대역이 일차 오디오 신호의 타겟팅된 오디오의 일부에 대응할 가능성이 더 적으면, 대응하는 신뢰 구간은 낮을 수 있고, 대응적으로 낮은 이득 값(예를 들어, 0.5 이하의 이득 값 등)이 그 특정 주파수 대역에 할당될 수 있다. 주파수 대역이 타겟팅된 오디오의 일부에 대응하거나, 주파수 대역이 잡음으로 주로 구성될 가능성이 매우 있는 매우 낮은 신뢰 레벨이 있으면, 매우 낮은 이득 값(예를 들어, 0.3 미만 등)이 그 특정 주파수 대역에 할당될 수 있다.
복수의 주파수 대역들이 일차 오디오 신호로부터 분리되거나, 추출되었고 신뢰 구간이 각각의 주파수 대역에 할당되었을 경우, 신뢰 구간들은 이때 주파수 대역들 각각이 재구성된 오디오 신호에 포함되는 정도를 결정하기 위해 사용될 수 있으며; 즉 재구성된 오디오 출력 신호의 각각의 주파수 대역의 존재는 그것의 신뢰 구간에 대응할 수 있다. 더 구체적으로, 각각의 신뢰 구간은 최종 재구성된 신호의 신호 대 잡음 비(SNR)를 개선하기 위해 그것의 대응하는 주파수 대역의 크기를 동적으로 조정하도록 사용될 수 있다. 더 높은 신뢰 구간들을 갖는 주파수 대역들은 더 낮은 신뢰 구간들을 갖는 주파수 대역들보다 더 큰 존재를 가져서, 높은 신뢰 구간들을 갖는 주파수 대역들을 낮은 신뢰 구간들을 갖는 주파수 대역들보다 재구성된 오디오 신호에서 더 현저하게 한다. 신뢰 구간들이 할당되었다면, 주파수 대역들은 재구성된 오디오 신호를 발생시키기 위해 다시 수집될 수 있다.
개시된 정제 프로세스는 연속적 또는 실질적으로 연속적으로(예를 들어, 일련의 시간 세그먼트들 등으로) 수행될 수 있다.
본 개시내용에 따른 정제 프로세스의 임의의 실시예는 전자 디바이스의 처리 요소의 동작을 제어하는 프로그램(예를 들어, 소프트웨어 애플리케이션, 또는 "앱"; 펌웨어; 등)으로 구체화될 수 있다. 따라서, 본 개시내용의 전자 디바이스는 잡음이 소스 오디오 신호에 존재한 정도에 상관없이, 거의 없는 잡음을 갖는 정제된 오디오 신호 및/또는 재구성된 오디오 신호를 제공하도록 구성될 수 있다. 그 다음, 전자 디바이스는 정제된 오디오 신호 및/또는 재구성된 오디오 신호의 가청 출력을 저장하고, 송신하고 및/또는 제공하도록 구성될 수 있다.
구체적이지만, 비제한적 실시예에서, 그러한 전자 디바이스는 이동 전화 또는 다른 오디오 통신 디바이스를 포함할 수 있다. 프로그램 및 프로세서를 포함하는 것에 더하여, 오디오 통신 디바이스는 일차 마이크로폰 및 하나 이상의 기준 마이크로폰들을 포함할 수 있다. 오디오 통신 디바이스는 또한 오디오 신호를 송신하는 안테나와 같은 송신 요소를 포함할 수 있다. 일차 마이크로폰 및 각각의 기준 마이크로폰은 오디오 신호를 수신하고 오디오 신호를 프로세서에 전달하도록 구성된다. 프로세서는 상기 설명된 방법의 일 실시예에 따라 일차 마이크로폰으로부터 일차 오디오 신호를 처리하고 각각의 기준 마이크로폰으로부터 기준 오디오 신호를 처리하며, 정제된 오디오 신호 및/또는 재구성된 오디오 신호를 발생시킨다. 그 다음, 정제된 오디오 신호 및/또는 재구성된 오디오 신호는 오디오 통신 디바이스의 출력 요소에 의해; 예를 들어, 셀룰러 캐리어 네트워크에 송신될 수 있으며, 그것으로부터, 정제된 오디오 신호 및/또는 재구성된 오디오 신호는 결국 수신자 디바이스, 예컨대 다른 전화에 의해 수신될 수 있다.
개시된 발명 대상의 다른 양태들뿐만 아니라, 다양한 양태들의 특징들 및 장점들은 다음의 설명, 첨부 도면들 및 첨부된 청구항들의 고려를 통해 본 기술분야의 통상의 기술자들에게 분명해질 것이다.
도면들에서,
도 1은 오디오 신호들을 정제하는 방법의 일 실시예를 도시하는 흐름도이다.
도 2는 본 개시내용의 교시들에 따라 오디오 신호들을 정제하는 방법의 일 실시예에서 적응 최소 제곱 평균들(least mean squares)(LMS) 필터링의 사용의 일 실시예를 예시하는 흐름도이다.
도 3은 본 개시내용의 교시들에 따라 오디오 신호들을 정제하는 방법의 일 실시예를 실행하도록 구성되는 전자 디바이스의 일 실시예를 개략적으로 도시한다.
도 1은 오디오 신호들을 정제하는 방법의 일 실시예를 도시하는 흐름도이다.
도 2는 본 개시내용의 교시들에 따라 오디오 신호들을 정제하는 방법의 일 실시예에서 적응 최소 제곱 평균들(least mean squares)(LMS) 필터링의 사용의 일 실시예를 예시하는 흐름도이다.
도 3은 본 개시내용의 교시들에 따라 오디오 신호들을 정제하는 방법의 일 실시예를 실행하도록 구성되는 전자 디바이스의 일 실시예를 개략적으로 도시한다.
도 1을 참조하여, 오디오 신호를 정제하는 방법의 일 실시예가 예시되고 설명된다. 일반적으로, 방법은 3개의 구성요소를 포함한다: 참조(10)에서, 오디오 신호를 수신하는 단계; 참조(20)에서, 정제된 오디오 신호 및/또는 재구성된 오디오 신호를 제공하기 위해, 오디오 신호를 처리하는 단계; 및 참조(40)에서, 정제된 오디오 신호 및/또는 재구성된 오디오 신호를 출력하는 단계.
참조(10)에서, 오디오 신호를 수신하는 행동은 복수의 오디오 신호들을 수신하는 행동을 포함할 수 있다. 참조(12)에서, 일차 오디오 신호는 도 3에 도시된 바와 같이, 제1 소스, 예컨대 이동 전화 또는 다른 오디오 통신 디바이스(100)의 일차 마이크로폰(112)으로부터 수신될 수 있다. 도 1의 참조(14)에서, 오디오 통신 디바이스(100)의 하나 이상의 기준 마이크로폰들(114)은 기준 오디오 신호를 수신할 수 있다. 일차 마이크로폰(112) 및 각각의 기준 마이크로폰(114)은 일차 오디오 신호 및 각각의 기준 오디오 신호를 동시에 및 같은 위상에서 각각 수신할 수 있다. 일부 실시예들에서, 일차 오디오 신호 및 각각의 기준 오디오 신호의 성분들은 일차 오디오 신호 및 기준 오디오 신호(들)가 획득된 각각의 일차 마이크로폰(112) 및 기준 마이크로폰(들)(114)의 상이한 배향들, 또는 관점들 사이의 인트라오럴 레벨 차이(intraaural level difference)(ILD)로 인해, 실질적으로 동일한 것이지만, 상이한 양들로 있을 수 있다.
일차 오디오 신호 및 각각의 기준 오디오 신호를 수신하면, 도 3에 도시된 오디오 통신 디바이스(100)의 일차 마이크로폰(112) 및 각각의 기준 마이크로폰(114)은 도 1의 참조(16)에서, 이러한 신호들을 오디오 통신 디바이스(100)의 프로세서(120)에 전달할 수 있다.
도 1의 참조(20)에서, 일차 오디오 신호 및 각각의 기준 오디오 신호는 정제된 오디오 신호를 제공하는 방식으로 처리될 수 있다. 이러한 정제 프로세스는 도 2에 상세히 제시되는 다수의 행동들을 포함할 수 있다. 도 2의 참조(22)에서, 일차 오디오 신호, 및 선택사항적으로, 각각의 기준 오디오 신호에 하나 이상의 적응 시간 도메인 필터들이 가해질 수 있다. 저역 통과 필터를 포함할 수 있는 그러한 필터는 필터링된 신호들로부터, 에러, 또는 개연적 잡음을 제거할 수 있어, 추가 처리 후에, 더 개선된 신호(more refined signal), 또는 더 클린한 신호(clearer signal)를 야기한다. 특정 실시예에서, 최소 제곱 평균 필터(LMS)는 적응 시간 도메인 필터로 사용될 수 있다. 적응 시간 도메인 필터는 각각 필터링된 신호로부터 일부 잡음 및/또는 다른 원하지 않은 인공물들을 제거하는 러프(rough), 또는 패시브 필터를 제공할 수 있다.
도 2의 참조(24)에서, 잡음 추정값이 획득될 수 있다. 더 구체적으로, 기준 오디오 신호, 또는 복수의 기준 오디오 신호들이 수신되는 실시예들에서, 기준 오디오 신호들은 잡음 추정값을 제공하는 방식으로 처리될 수 있다. 그러한 처리는 개인이 오디오 통신 디바이스(100)(도 3)의 일차 마이크로폰(112)으로 말하는 음성의 일부를 형성하는 포먼트와 같은 타겟 오디오를 포함할 가능성이 있는 하나 이상의 주파수 대역들의 평가를 포함할 수 있다. 그러한 처리에 의해 제공되는 잡음 추정값은 각각의 기준 오디오 신호의 각각 평가된 주파수 대역으로부터 오디오 신호들에 오로지 기초할 수 있다. 대안적으로, 잡음 추정값은 각각의 기준 오디오 신호의 각각의 평가된 주파수 대역과 기준 오디오 신호(들)에 대응하는 일차 오디오 신호의 각각의 대응하는 주파수 대역 사이의 차이들에 기초할 수 있다. 특정 실시예에서, 기준 오디오 신호로부터의 특정 주파수 대역이 실질적으로 동일한 전력을 갖거나 대응하는 일차 오디오 신호의 동일한 주파수 대역보다 더 큰 전력을 가지면, 그 주파수 대역은 잡음으로 주로 구성될 가능성이 가장 많고, 따라서 잡음으로 주로 구성되는 것으로 간주될 수 있다. 일차 오디오 신호로부터의 주파수 대역이 대응하는 기준 오디오 신호 내의 동일한 주파수 대역보다 더 큰 전력을 가지면, 그것은 타겟팅된 오디오의 적어도 일부를 포함할 가능성이 있고 따라서 타겟팅된 오디오의 적어도 일부를 포함하는 것으로 간주될 수 있다.
잡음 추정값이 획득되었다면, 잡음 추정값은 도 2의 참조(26)에서 제시되는 바와 같이, 일차 오디오 신호의 최소 평균 제곱 에러(MMSE) 분석과 함께 사용될 수 있다. 일부 실시예들에서, MMSE 분석은 잡음 추정값을 감안할 수 있다. 더 구체적으로, MMSE 분석은 잡음 추정값에 기초하여 조정될 수 있다. 예를 들어, 잡음 추정값은 MMSE 분석으로 통합될 수 있다. 그 다음, MMSE 분석은 적어도 하나의 정제된 오디오 신호를 제공하기 위해 본 기술분야에 공지된 방식으로 일차 오디오 신호에 적용될 수 있다. 일차 오디오 신호에 적응 시간 도메인 필터가 가해졌던 실시예들에서, 일차 오디오 신호의 스펙트럼 특성들은 수정되었고, MMSE 분석은 적절히 수정될 수 있다. 일부 실시예들에서, MMSE 분석은 일차 오디오 신호의 주파수 대역들 중 하나에 각각 대응하는, 복수의 정제된 오디오 신호들을 제공하기 위해 일차 오디오 신호의 상이한 주파수 대역들에 개별적으로 적용될 수 있다.
도 2의 참조(28)에서, 신뢰 구간은 일차 오디오 신호의 각각의 주파수 대역에 할당될 수 있다. 신뢰 구간들은 일차 오디오 신호의 비처리된 주파수 대역들에 적용되거나, 일차 오디오 신호의 필터링된 주파수 대역들에 적용되거나 일차 오디오 신호의 주파수 대역들 상의 MMSE 분석들에서 기인하는 정제된 오디오 신호들에 적용될 수 있다. 각각의 신뢰 구간은 일차 오디오 신호의 대응하는 주파수 대역이 타겟팅된 오디오의 적어도 일부에 대응할 가능성의 표시자를 제공할 수 있다. 일부 실시예들에서, 일차 오디오 신호 및 각각의 기준 오디오 신호, 또는 그러한 신호들 중 어느 하나 또는 둘 다로부터 획득되는 정보(예를 들어, 각각의 주파수 대역에 대한 잡음 추정값, 각각의 주파수 대역에 대한 MMSE 분석의 결과들 등)는 신뢰 구간을 일차 오디오 신호의 각각의 주파수 대역에 할당하는 동안에 고려될 수 있다.
각각의 신뢰 구간은 대응하는 미리 결정된 주파수 대역이 재구성된 출력 오디오 신호에 포함되는 정도를 제어할 수 있다. 각각의 신뢰 구간의 실제적 효과는 타겟팅된 오디오에 기여(contribute)하는 것으로 생각되지 않는 주파수 대역들을 약화시키는 것이다. 특정한 미리 결정된 주파수 대역에 대한 신뢰 구간은 임의의 적절한 방식으로 그러한 미리 결정된 주파수 대역에 적용될 수 있다. 제한 없이, 신뢰 구간은 그것의 대응하는 미리 결정된 주파수 대역에 대한 승수를 포함할 수 있다. 특정 실시예에서, 각각의 신뢰 구간은 이득 값; 즉, 영(0)과 일(1) 사이의 값으로 구체화될 수 있다. 예를 들어, 특정 주파수 대역이 일차 오디오 신호의 타겟팅된 오디오의 일부일 가능성이 있으며, 비교적 높은 이득 값(예를 들어, 0.5 초과, 0.6과 1 사이 등)이 그 주파수 대역에 할당될 수 있다. 특정 주파수 대역은 타겟팅된 오디오의 일부를 포함할 가능성만큼 잡음을 포함할 가능성이 적어도 있으면, 그 주파수 대역에 대한 신뢰 구간은 낮을 수 있고, 대응적으로 낮은 이득 값(예를 들어, 0.5 이하의 이득 값 등)이 그 주파수 대역에 할당될 수 있다. 특정 주파수 대역이 타겟팅된 오디오의 일부를 포함할 가능성이 없거나, 특정 주파수 대역이 잡음의 결과일 가능성이 매우 있으면, 매우 낮은 신뢰 구간 및 매우 낮은 이득 값(예를 들어, 0.3 미만 등)이 그 주파수 대역에 할당될 수 있다.
일차 오디오 신호의 각각의 주파수 대역에 할당되는 적절한 신뢰 구간의 경우, 그 주파수 대역은 도 2의 참조(30)에서, 적절한 방식으로 조정될 수 있다. 신뢰 구간이 이득 값에 대응하는 실시예들에서, 이득 값은 주파수 대역에 적용될 수 있다.
도 2의 참조(32)에서, 재구성된 오디오 신호는 수정되었던 하나 이상의 주파수 대역들을 조합함으로써 구성될 수 있다. 조합되는 주파수 대역들은 상기 설명된 MMSE 분석에 의해 수정되거나, 신뢰 구간을 사용하여 수정되건, 또는 MMSE 분석 및 신뢰 구간들의 조합에 의해 수정될 수 있다.
그 다음, 재구성된 오디오 신호는 도 1의 참조(40)에서 출력될 수 있다. 도 1 및 도 2를 참조하여 설명되었던 타입의 프로세스가 도 3에 의해 도시되는 이동 전화와 같은 오디오 통신 디바이스(100)의 일차 마이크로폰 및 하나 이상의 기준 마이크로폰들에 의해 수신되었던 오디오를 수정하기 위해 사용되는 실시예들에서, 수정된 일차 오디오 신호는 오디오 통신 디바이스(100)의 프로세서(110)에 의해 오디오 통신 디바이스(100)의 안테나(130)에 전달될 수 있으며, 그 다음 안테나는 수정된 일차 오디오 신호를 다른 오디오 통신 디바이스 또는 네트워크에 송신하며, 그 다음 네트워크는 수정된 일차 오디오 신호를 다른 오디오 통신 디바이스에 송신할 수 있다. 그 다음, 수정된 일차 오디오 신호를 수신하는 오디오 통신 디바이스는 거의 없는 잡음을 갖는 가청 출력을 제공하는 방식으로 그러한 신호를 처리할 수 있다.
이전 개시내용은 오디오 통신 디바이스들의 맥락에서 주로 제공되었지만, 개시된 발명 대상은 또한 여러가지 다른 맥락들에서 오디오 신호들에 적용될 수 있다. 제한 없이, 개시된 발명 대상은 사운드를 수신하고 증폭하기 위해 사용되는 장치들(예를 들어, 마이크로폰들, 증폭기들, 및 선택사항적으로, 혼합기들 등을 포함하는 시스템들), 오디오를 수신하고 기록하는 장치들(예를 들어, 음성 레코더들, 비디오 레코더들, 사운드 스튜디오들 등), 오디오 헤드셋들(예를 들어, 유선, 무선(예를 들어, BLUETOOTH® 등) 등) 및 여러가지 다른 맥락들에서 유용할 수 있다. 더 구체적으로, 도 3에 의해 예시된 바와 같이, 재구성된 오디오 신호는 오디오 출력 디바이스(100) 또는 오디오를 수신하고 저장하도록 구성되는 다른 디바이스(예를 들어, 음성 레코더, 오디오 레코더, 비디오 카메라 등)와 같은, 전자 디바이스의 프로세서(110)와 연관되는 메모리(120)에 의해 저장될 수 있다. 대안적으로, 재구성된 오디오 신호는 전자 디바이스의 스피커(140), 예컨대 스테레오, 휴대용 전자 디바이스, 컴퓨터, 사운드 시스템 등의 라우드 스피커에 의해 가청으로 출력될 수 있다.
일차 오디오 신호는 실시간 또는 실질적인 실시간으로 (예를 들어, 오디오 통신 디바이스(100)의 일차 마이크로폰(112)에 의해―도 3) 획득되고 (예를 들어, 오디오 통신 디바이스(100)의 프로세서(110)와 연관되는 메모리(120) 등에 의해) 저장되고, (예를 들어, 오디오 통신 디바이스(100)의 안테나(130) 등에 의해) 송신되거나 (예를 들어, 오디오 통신 디바이스(100)의 스피커(140) 등에 의해) 출력되는 신호를 포함하는 실시예들에서, 도 1 및 도 2를 참조하여 설명되었던 프로세스들은 반복적으로 수행될 수 있다.
정제 프로세스(들)의 반복은 일차 오디오 신호의 연속적 수정을 제공하고, 일차 오디오 신호 내의 잡음 및 타겟팅된 오디오의 상대 레벨들의 변화들을 감안하는 빠른 조정들을 제공할 수 있다.
상술한 개시내용이 많은 세부 사항들을 제공하지만, 이들은 다음의 청구항들 중 어느 것에 대한 범위를 제한하는 것으로 해석되지 않아야 한다. 청구항들의 범위들로부터 벗어나지 않는 다른 실시예들이 고안될 수 있다. 상이한 실시예들로부터의 특징들은 조합으로 이용될 수 있다. 따라서, 각 청구항의 범위는 그것의 평범한 언어 및 그것의 요소들에 대한 이용가능 법적 균등물들의 전체 범위에 의해서만 표시되고 제한된다.
Claims (31)
- 오디오 신호를 정제(clarifying)하는 방법으로서,
전자 디바이스의 적어도 2개의 마이크로폰에 의해 오디오 신호들을 수신하는 단계 - 각각의 오디오 신호는 복수의 주파수 대역들, 타겟 성분 및 잡음 성분을 포함하며, 상기 적어도 2개의 마이크로폰은 기준 마이크로폰이 상기 타겟 성분을 수신하는 것보다 더 높은 전력으로 상기 타겟 성분을 수신하는 일차 마이크로폰을 포함함 -;
상기 기준 마이크로폰에 의해 수신되는 기준 오디오 신호로부터 잡음 추정값을 결정하는 단계;
상기 잡음 추정값을 최소 평균 제곱 에러 분석(minimum mean squared error analysis)에 통합(incorporating)시키는 단계;
상기 일차 마이크로폰에 의해 수신되는 일차 오디오 신호의 복수의 주파수 대역들의 각각의 주파수 대역에 상기 최소 평균 제곱 에러 분석을 가하는(subjecting) 단계;
상기 최소 평균 제곱 분석의 결과에 기초하여 상기 복수의 주파수 대역들의 각각의 주파수 대역에 신뢰 구간(confidence interval)을 할당하는 단계;
수정된 출력 주파수 대역을 제공하기 위해 그 주파수 대역의 신뢰 구간에 기초하여 상기 일차 오디오 신호의 각각의 주파수 대역의 오디오 출력 레벨을 수정하는 단계; 및
정제된 출력 오디오 신호를 제공하기 위해 상기 일차 오디오 신호의 복수의 주파수 대역들의 각각의 주파수 대역에 대한 수정된 출력 주파수 대역들을 조합(combining)하는 단계
를 포함하는 방법. - 제1항에 있어서, 상기 잡음 추정값을 결정하는 단계는 상기 일차 마이크로폰에 의해 수신되는 일차 오디오 신호로부터의 적어도 하나의 주파수 대역을 상기 기준 마이크로폰에 의해 수신되는 기준 오디오 신호의 적어도 하나의 대응하는 주파수 대역과 비교하는 단계를 포함하는 방법.
- 제2항에 있어서, 상기 잡음 추정값을 결정하는 단계는 상기 일차 마이크로폰에 의해 수신되는 일차 오디오 신호로부터의 복수의 주파수 대역들을 상기 기준 마이크로폰에 의해 수신되는 기준 오디오 신호의 대응하는 복수의 주파수 대역들과 비교하는 단계를 포함하는 방법.
- 제1항에 있어서,
상기 기준 마이크로폰에서 수신되는 기준 오디오 신호의 복수의 주파수 대역들의 각각의 주파수 대역에 상기 최소 평균 제곱 에러 분석을 가하는 단계를 더 포함하는 방법. - 제1항에 있어서, 상기 신뢰 구간을 할당하는 단계는,
상기 일차 마이크로폰에 의해 수신되는 주파수 대역보다 더 큰 전력으로 상기 기준 마이크로폰에 의해 수신되는 주파수 대역에 매우 낮은 신뢰 구간을 할당하는 단계;
실질적으로 동일한 전력으로 상기 일차 마이크로폰과 상기 기준 마이크로폰 둘 다에 의해 수신되는 주파수 대역에 낮은 신뢰 구간을 할당하는 단계; 및
상기 기준 마이크로폰에 의해 수신되는 주파수 대역보다 더 큰 전력으로 상기 일차 마이크로폰에 의해 수신되는 주파수 대역에 높은 신뢰 구간을 할당하는 단계를 포함하는 방법. - 제5항에 있어서, 상기 매우 낮은 신뢰 구간을 할당하는 단계는 0.3 미만의 이득을 상기 주파수 대역에 할당하는 단계를 포함하는 방법.
- 제5항에 있어서, 상기 낮은 신뢰 구간을 할당하는 단계는 약 0.5 이하의 이득을 상기 주파수 대역에 할당하는 단계를 포함하는 방법.
- 제5항에 있어서, 상기 높은 신뢰 구간을 할당하는 단계는 0.6보다 더 큰 이득을 상기 주파수 대역에 할당하는 단계를 포함하는 방법.
- 제1항에 있어서, 상기 신뢰 구간을 할당하는 단계는 적절한 이득을 각각의 주파수 대역에 할당하는 단계를 포함하는 방법.
- 제1항에 있어서, 상기 신뢰 구간을 할당하는 단계는 상기 오디오 신호들에서 잡음을 동적으로 추정하는 단계를 포함하는 방법.
- 제1항에 있어서, 음성 활동(voice activity)을 검출하는 것 없이 수행되는 방법.
- 제1항에 있어서,
상기 일차 오디오 신호 및 상기 기준 오디오 신호에 적응 시간 도메인 필터를 가하는 단계를 더 포함하는 방법. - 제12항에 있어서, 상기 일차 오디오 신호 및 상기 기준 오디오 신호에 상기 적응 시간 도메인 필터를 가하는 단계는 상기 일차 오디오 신호 및 상기 기준 오디오 신호에 최소 제곱 평균 필터(least mean square filter)를 가하는 단계를 포함하는 방법.
- 제12항에 있어서, 상기 일차 오디오 신호 및 상기 기준 오디오 신호에 상기 적응 시간 도메인 필터를 가하는 단계는 상기 제1 및 기준 오디오 신호들의 복수의 주파수 대역들의 각각의 주파수 대역에 상기 최소 평균 제곱 에러 분석들을 가하기 전에 상기 일차 오디오 신호 및 상기 기준 오디오 신호에 상기 적응 시간 도메인 필터를 가하는 단계를 포함하는 방법.
- 오디오 신호를 정제하는 방법으로서,
전자 디바이스의 적어도 2개의 마이크로폰에 의해 오디오 신호들을 수신하는 단계 - 각각의 오디오 신호는 복수의 주파수 대역들, 타겟 성분 및 잡음 성분을 포함하며, 상기 적어도 2개의 마이크로폰은 기준 마이크로폰이 상기 타겟 성분을 수신하는 것보다 더 높은 전력으로 상기 타겟 성분을 수신하는 일차 마이크로폰을 포함함 -;
필터링된 오디오 신호를 제공하기 위해 상기 일차 마이크로폰에 의해 수신되는 일차 오디오 신호에 적응 시간 도메인 필터를 가하는 단계;
상기 기준 마이크로폰에 의해 수신되는 기준 오디오 신호를 사용하여 잡음 추정값을 결정하는 단계;
상기 잡음 추정값에 기초하여 최소 평균 제곱 에러 분석을 조정(tailoring)하는 단계; 및
상기 필터링된 오디오 신호의 복수의 주파수 대역들의 각각의 주파수 대역에 상기 최소 평균 제곱 에러 분석을 가하는 단계
를 포함하는 방법. - 제15항에 있어서, 상기 일차 오디오 신호 및 상기 기준 오디오 신호에 상기 적응 시간 도메인 필터를 가하는 단계는 상기 일차 오디오 신호 및 상기 기준 오디오 신호에 최소 제곱 평균 필터를 가하는 단계를 포함하는 방법.
- 제15항에 있어서,
필터링된 기준 오디오 신호를 제공하기 위해 상기 기준 마이크로폰에 의해 수신되는 기준 오디오 신호에 상기 적응 시간 도메인 필터를 가하는 단계를 더 포함하는 방법. - 제17항에 있어서, 상기 기준 마이크로폰에 의해 수신되는 기준 오디오 신호에 상기 적응 시간 도메인 필터를 가하는 단계는 상기 기준 오디오 신호에 최소 제곱 평균 필터를 가하는 단계를 포함하는 방법.
- 제17항에 있어서, 상기 기준 오디오 신호를 사용하여 상기 잡음 추정값을 결정하는 단계는 상기 필터링된 기준 오디오 신호를 사용하여 상기 잡음 추정값을 결정하는 단계를 포함하는 방법.
- 제17항에 있어서,
상기 필터링된 기준 오디오 신호의 복수의 주파수 대역들의 각각의 주파수 대역에 상기 최소 평균 제곱 분석을 가하는 단계를 더 포함하는 방법. - 제15항에 있어서,
상기 기준 오디오 신호의 복수의 주파수 대역들의 각각의 주파수 대역에 상기 최소 평균 제곱 분석을 가하는 단계를 더 포함하는 방법. - 제15항에 있어서,
상기 최소 평균 제곱 분석들의 결과에 기초하여 신뢰 구간을 상기 복수의 주파수 대역들의 각각의 주파수 대역에 할당하는 단계;
수정된 출력 주파수 대역을 제공하기 위해 그 주파수 대역의 신뢰 구간에 기초하여 상기 필터링된 오디오 신호의 각각의 주파수 대역의 오디오 출력 레벨을 수정하는 단계; 및
정제된 출력 오디오 신호를 제공하기 위해 상기 필터링된 오디오 신호의 복수의 주파수 대역들의 각각의 주파수 대역에 대한 수정된 출력 주파수 대역들을 조합하는 단계를 더 포함하는 방법. - 오디오 신호를 수신하도록 구성되는 전자 디바이스로서,
일차 오디오 신호를 수신하고 전달(communicating)하는 일차 마이크로폰;
기준 오디오 신호를 수신하고 전달하는 기준 마이크로폰;
프로세서; 및
상기 프로세서와 통신하는 출력 요소
를 포함하고,
상기 프로세서는,
상기 일차 오디오 신호 및 상기 기준 오디오 신호를 수신하고;
잡음 추정값을 제공하기 위해 상기 기준 오디오 신호를 처리하고;
상기 잡음 추정값을 감안(account for)하는 최소 평균 제곱 에러 분석을 발생시키고;
상기 일차 오디오 신호의 복수의 주파수 대역들에 상기 최소 평균 제곱 에러 분석을 가하고;
주파수 대역 비교를 제공하기 위해 상기 일차 오디오 신호의 복수의 주파수 대역들의 각각의 주파수 대역에 대한 최소 평균 제곱 분석의 결과를 상기 기준 오디오 신호의 복수의 주파수 대역들의 대응하는 주파수 대역에 대한 최소 평균 제곱 분석의 결과와 비교하고;
그 주파수 대역에 대응하는 주파수 대역 비교에 기초하여 상기 일차 오디오 신호의 복수의 주파수 대역들의 각각의 주파수 대역에 신뢰 구간을 할당하고;
수정된 출력 주파수 대역을 제공하기 위해 상기 신뢰 구간에 기초하여 상기 주파수 대역의 출력 전력을 조정하고;
정제된 출력 오디오 신호를 제공하기 위해 상기 일차 오디오 신호의 복수의 주파수 대역들의 각각의 주파수 대역에 대한 수정된 출력 주파수 대역들을 조합하고;
상기 출력 요소가 상기 정제된 출력 오디오 신호를 출력하게 하도록 프로그래밍되는 전자 디바이스. - 제23항에 있어서, 상기 프로세서는,
상기 기준 오디오 신호의 복수의 주파수 대역들에 상기 최소 평균 제곱 에러 분석을 가하도록 더 프로그래밍되며, 상기 일차 오디오 신호의 복수의 주파수 대역들 및 상기 기준 오디오 신호의 복수의 주파수 대역들의 주파수 범위들은 서로에 대응하는 전자 디바이스. - 제23항에 있어서, 이동 전화를 포함하는 전자 디바이스.
- 제23항에 있어서, 상기 출력 요소는 스피커를 포함하는 전자 디바이스.
- 제23항에 있어서, 상기 스피커는 상기 전자 디바이스에 의해 휴대되는(carried) 전자 디바이스.
- 제23항에 있어서, 상기 스피커는 상기 전자 디바이스에 선택적으로 결합되도록 구성되는 전자 디바이스.
- 제23항에 있어서, 상기 프로세서는,
상기 일차 오디오 신호 및 상기 기준 오디오 신호에 적응 시간 도메인 필터를 적용하도록 더 프로그래밍되는 전자 디바이스. - 제29항에 있어서, 상기 프로세서는,
상기 일차 오디오 신호 및 상기 기준 오디오 신호에 적응 최소 제곱 평균 필터를 적용하도록 프로그래밍되는 전자 디바이스. - 제29항에 있어서, 상기 프로세서는,
상기 일차 오디오 신호의 복수의 주파수 대역들 및 상기 기준 오디오 신호의 복수의 주파수 대역들에 상기 최소 평균 제곱 에러 분석들을 가하기 전에 상기 적응 시간 도메인 필터를 상기 일차 오디오 신호 및 상기 기준 오디오 신호에 적용하도록 프로그래밍되는 전자 디바이스.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/308,541 | 2014-06-18 | ||
US14/308,541 US10149047B2 (en) | 2014-06-18 | 2014-06-18 | Multi-aural MMSE analysis techniques for clarifying audio signals |
PCT/US2015/035612 WO2015195482A1 (en) | 2014-06-18 | 2015-06-12 | Multi-aural mmse analysis techniques for clarifying audio signals |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20170039126A true KR20170039126A (ko) | 2017-04-10 |
KR102378207B1 KR102378207B1 (ko) | 2022-03-25 |
Family
ID=54870902
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020177001307A KR102378207B1 (ko) | 2014-06-18 | 2015-06-12 | 오디오 신호들을 정제하는 멀티 오럴 mmse 분석 기술들 |
Country Status (6)
Country | Link |
---|---|
US (1) | US10149047B2 (ko) |
EP (1) | EP3158775A4 (ko) |
JP (1) | JP6789827B2 (ko) |
KR (1) | KR102378207B1 (ko) |
CN (1) | CN106797517B (ko) |
WO (1) | WO2015195482A1 (ko) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2963817B1 (en) * | 2014-07-02 | 2016-12-28 | GN Audio A/S | Method and apparatus for attenuating undesired content in an audio signal |
CN110970015B (zh) * | 2018-09-30 | 2024-04-23 | 北京搜狗科技发展有限公司 | 一种语音处理方法、装置和电子设备 |
EP3667662B1 (en) * | 2018-12-12 | 2022-08-10 | Panasonic Intellectual Property Corporation of America | Acoustic echo cancellation device, acoustic echo cancellation method and acoustic echo cancellation program |
CN110021307B (zh) * | 2019-04-04 | 2022-02-01 | Oppo广东移动通信有限公司 | 音频校验方法、装置、存储介质及电子设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130142349A1 (en) * | 2011-09-05 | 2013-06-06 | Goertek Inc. | Method, device and system for eliminating noises with multi-microphone array |
US20130343558A1 (en) * | 2012-06-26 | 2013-12-26 | Parrot | Method for denoising an acoustic signal for a multi-microphone audio device operating in a noisy environment |
Family Cites Families (72)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4897878A (en) * | 1985-08-26 | 1990-01-30 | Itt Corporation | Noise compensation in speech recognition apparatus |
US4658426A (en) * | 1985-10-10 | 1987-04-14 | Harold Antin | Adaptive noise suppressor |
JP3484757B2 (ja) * | 1994-05-13 | 2004-01-06 | ソニー株式会社 | 音声信号の雑音低減方法及び雑音区間検出方法 |
FR2722631B1 (fr) * | 1994-07-13 | 1996-09-20 | France Telecom Etablissement P | Procede et systeme de filtrage adaptatif par egalisation aveugle d'un signal telephonique numerique et leurs applications |
JPH10257583A (ja) * | 1997-03-06 | 1998-09-25 | Asahi Chem Ind Co Ltd | 音声処理装置およびその音声処理方法 |
US5924065A (en) * | 1997-06-16 | 1999-07-13 | Digital Equipment Corporation | Environmently compensated speech processing |
FR2766604B1 (fr) * | 1997-07-22 | 1999-10-01 | France Telecom | Procede et dispositif d'egalisation aveugle des effets d'un canal de transmission sur un signal de parole numerique |
JPH11126090A (ja) * | 1997-10-23 | 1999-05-11 | Pioneer Electron Corp | 音声認識方法及び音声認識装置並びに音声認識装置を動作させるためのプログラムが記録された記録媒体 |
US20020002455A1 (en) * | 1998-01-09 | 2002-01-03 | At&T Corporation | Core estimator and adaptive gains from signal to noise ratio in a hybrid speech enhancement system |
WO2000057671A2 (de) * | 1999-03-19 | 2000-09-28 | Siemens Aktiengesellschaft | Verfahren und einrichtung zum aufnehmen und bearbeiten von audiosignalen in einer störschallerfüllten umgebung |
US20030018471A1 (en) * | 1999-10-26 | 2003-01-23 | Yan Ming Cheng | Mel-frequency domain based audible noise filter and method |
US6757395B1 (en) * | 2000-01-12 | 2004-06-29 | Sonic Innovations, Inc. | Noise reduction apparatus and method |
FR2820227B1 (fr) * | 2001-01-30 | 2003-04-18 | France Telecom | Procede et dispositif de reduction de bruit |
US7617099B2 (en) * | 2001-02-12 | 2009-11-10 | FortMedia Inc. | Noise suppression by two-channel tandem spectrum modification for speech signal in an automobile |
US6549629B2 (en) * | 2001-02-21 | 2003-04-15 | Digisonix Llc | DVE system with normalized selection |
CA2354858A1 (en) * | 2001-08-08 | 2003-02-08 | Dspfactory Ltd. | Subband directional audio signal processing using an oversampled filterbank |
JP3950930B2 (ja) * | 2002-05-10 | 2007-08-01 | 財団法人北九州産業学術推進機構 | 音源の位置情報を利用した分割スペクトルに基づく目的音声の復元方法 |
US7161973B2 (en) * | 2002-12-17 | 2007-01-09 | Sbc Properties, L.P. | Pilot aided adaptive minimum mean square interference cancellation and detection |
WO2004084182A1 (en) * | 2003-03-15 | 2004-09-30 | Mindspeed Technologies, Inc. | Decomposition of voiced speech for celp speech coding |
US6931362B2 (en) * | 2003-03-28 | 2005-08-16 | Harris Corporation | System and method for hybrid minimum mean squared error matrix-pencil separation weights for blind source separation |
JP4989967B2 (ja) * | 2003-07-11 | 2012-08-01 | コクレア リミテッド | ノイズ低減のための方法および装置 |
DE10362073A1 (de) * | 2003-11-06 | 2005-11-24 | Herbert Buchner | Vorrichtung und Verfahren zum Verarbeiten eines Eingangssignals |
US7392181B2 (en) * | 2004-03-05 | 2008-06-24 | Siemens Corporate Research, Inc. | System and method for nonlinear signal enhancement that bypasses a noisy phase of a signal |
FI20045315A (fi) * | 2004-08-30 | 2006-03-01 | Nokia Corp | Ääniaktiivisuuden havaitseminen äänisignaalissa |
US8233636B2 (en) * | 2005-09-02 | 2012-07-31 | Nec Corporation | Method, apparatus, and computer program for suppressing noise |
CN101091209B (zh) * | 2005-09-02 | 2010-06-09 | 日本电气株式会社 | 抑制噪声的方法及装置 |
EP1760696B1 (en) * | 2005-09-03 | 2016-02-03 | GN ReSound A/S | Method and apparatus for improved estimation of non-stationary noise for speech enhancement |
US9185487B2 (en) * | 2006-01-30 | 2015-11-10 | Audience, Inc. | System and method for providing noise suppression utilizing null processing noise subtraction |
CN101089952B (zh) * | 2006-06-15 | 2010-10-06 | 株式会社东芝 | 噪声抑制、提取特征、训练模型及语音识别的方法和装置 |
EP1887708B1 (en) * | 2006-08-07 | 2012-09-19 | Mitel Networks Corporation | Delayed adaptation structure for improved double-talk immunity in echo cancellation devices |
US7933420B2 (en) * | 2006-12-28 | 2011-04-26 | Caterpillar Inc. | Methods and systems for determining the effectiveness of active noise cancellation |
TW200847137A (en) * | 2007-03-09 | 2008-12-01 | Fortemedia Inc | Method and apparatus for voice communication |
JP4469882B2 (ja) * | 2007-08-16 | 2010-06-02 | 株式会社東芝 | 音響信号処理方法及び装置 |
KR100930584B1 (ko) * | 2007-09-19 | 2009-12-09 | 한국전자통신연구원 | 인간 음성의 유성음 특징을 이용한 음성 판별 방법 및 장치 |
WO2009038136A1 (ja) * | 2007-09-19 | 2009-03-26 | Nec Corporation | 雑音抑圧装置、その方法及びプログラム |
JP2009116275A (ja) * | 2007-11-09 | 2009-05-28 | Toshiba Corp | 雑音抑圧、音声スペクトル平滑化、音声特徴抽出、音声認識及び音声モデルトレーニングための方法及び装置 |
US8175291B2 (en) * | 2007-12-19 | 2012-05-08 | Qualcomm Incorporated | Systems, methods, and apparatus for multi-microphone based speech enhancement |
US9142221B2 (en) * | 2008-04-07 | 2015-09-22 | Cambridge Silicon Radio Limited | Noise reduction |
US8660281B2 (en) * | 2009-02-03 | 2014-02-25 | University Of Ottawa | Method and system for a multi-microphone noise reduction |
JP5127754B2 (ja) * | 2009-03-24 | 2013-01-23 | 株式会社東芝 | 信号処理装置 |
CN102111697B (zh) * | 2009-12-28 | 2015-03-25 | 歌尔声学股份有限公司 | 一种麦克风阵列降噪控制方法及装置 |
JP5641186B2 (ja) * | 2010-01-13 | 2014-12-17 | ヤマハ株式会社 | 雑音抑圧装置およびプログラム |
JP5528538B2 (ja) * | 2010-03-09 | 2014-06-25 | 三菱電機株式会社 | 雑音抑圧装置 |
US8798992B2 (en) * | 2010-05-19 | 2014-08-05 | Disney Enterprises, Inc. | Audio noise modification for event broadcasting |
US9837097B2 (en) * | 2010-05-24 | 2017-12-05 | Nec Corporation | Single processing method, information processing apparatus and signal processing program |
US9408542B1 (en) * | 2010-07-22 | 2016-08-09 | Masimo Corporation | Non-invasive blood pressure measurement system |
US8861756B2 (en) * | 2010-09-24 | 2014-10-14 | LI Creative Technologies, Inc. | Microphone array system |
US9142207B2 (en) * | 2010-12-03 | 2015-09-22 | Cirrus Logic, Inc. | Oversight control of an adaptive noise canceler in a personal audio device |
EP2652737B1 (en) * | 2010-12-15 | 2014-06-04 | Koninklijke Philips N.V. | Noise reduction system with remote noise detector |
WO2012105940A1 (en) | 2011-01-31 | 2012-08-09 | Empire Technology Development Llc | Speech quality enhancement in telecommunication system |
US8948407B2 (en) * | 2011-06-03 | 2015-02-03 | Cirrus Logic, Inc. | Bandlimiting anti-noise in personal audio devices having adaptive noise cancellation (ANC) |
US9002027B2 (en) * | 2011-06-27 | 2015-04-07 | Gentex Corporation | Space-time noise reduction system for use in a vehicle and method of forming same |
US9680497B2 (en) * | 2014-03-26 | 2017-06-13 | Syntropy Systems, Llc | Conversion of a discrete-time quantized signal into a continuous-time, continuously variable signal |
US20130094657A1 (en) * | 2011-10-12 | 2013-04-18 | University Of Connecticut | Method and device for improving the audibility, localization and intelligibility of sounds, and comfort of communication devices worn on or in the ear |
US20130163781A1 (en) * | 2011-12-22 | 2013-06-27 | Broadcom Corporation | Breathing noise suppression for audio signals |
JP5875414B2 (ja) * | 2012-03-07 | 2016-03-02 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 雑音抑制方法、プログラム及び装置 |
US9002030B2 (en) * | 2012-05-01 | 2015-04-07 | Audyssey Laboratories, Inc. | System and method for performing voice activity detection |
US20160240210A1 (en) * | 2012-07-22 | 2016-08-18 | Xia Lou | Speech Enhancement to Improve Speech Intelligibility and Automatic Speech Recognition |
DE112012006876B4 (de) * | 2012-09-04 | 2021-06-10 | Cerence Operating Company | Verfahren und Sprachsignal-Verarbeitungssystem zur formantabhängigen Sprachsignalverstärkung |
EP2747081A1 (en) * | 2012-12-18 | 2014-06-25 | Oticon A/s | An audio processing device comprising artifact reduction |
US9275625B2 (en) * | 2013-03-06 | 2016-03-01 | Qualcomm Incorporated | Content based noise suppression |
JP5588054B1 (ja) * | 2013-09-06 | 2014-09-10 | リオン株式会社 | 補聴器、拡声器及びハウリングキャンセラ |
US9633671B2 (en) * | 2013-10-18 | 2017-04-25 | Apple Inc. | Voice quality enhancement techniques, speech recognition techniques, and related systems |
US9449615B2 (en) * | 2013-11-07 | 2016-09-20 | Continental Automotive Systems, Inc. | Externally estimated SNR based modifiers for internal MMSE calculators |
US9449609B2 (en) * | 2013-11-07 | 2016-09-20 | Continental Automotive Systems, Inc. | Accurate forward SNR estimation based on MMSE speech probability presence |
ES2831407T3 (es) * | 2013-12-11 | 2021-06-08 | Med El Elektromedizinische Geraete Gmbh | Selección automática de reducción o realzado de sonidos transitorios |
US9271077B2 (en) * | 2013-12-17 | 2016-02-23 | Personics Holdings, Llc | Method and system for directional enhancement of sound using small microphone arrays |
EP2916321B1 (en) * | 2014-03-07 | 2017-10-25 | Oticon A/s | Processing of a noisy audio signal to estimate target and noise spectral variances |
US9479860B2 (en) * | 2014-03-07 | 2016-10-25 | Cirrus Logic, Inc. | Systems and methods for enhancing performance of audio transducer based on detection of transducer status |
US10181315B2 (en) * | 2014-06-13 | 2019-01-15 | Cirrus Logic, Inc. | Systems and methods for selectively enabling and disabling adaptation of an adaptive noise cancellation system |
US9466282B2 (en) * | 2014-10-31 | 2016-10-11 | Qualcomm Incorporated | Variable rate adaptive active noise cancellation |
US9576583B1 (en) * | 2014-12-01 | 2017-02-21 | Cedar Audio Ltd | Restoring audio signals with mask and latent variables |
-
2014
- 2014-06-18 US US14/308,541 patent/US10149047B2/en active Active
-
2015
- 2015-06-12 WO PCT/US2015/035612 patent/WO2015195482A1/en active Application Filing
- 2015-06-12 EP EP15809800.4A patent/EP3158775A4/en not_active Ceased
- 2015-06-12 KR KR1020177001307A patent/KR102378207B1/ko active IP Right Grant
- 2015-06-12 CN CN201580043954.3A patent/CN106797517B/zh active Active
- 2015-06-12 JP JP2016573971A patent/JP6789827B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130142349A1 (en) * | 2011-09-05 | 2013-06-06 | Goertek Inc. | Method, device and system for eliminating noises with multi-microphone array |
US20130343558A1 (en) * | 2012-06-26 | 2013-12-26 | Parrot | Method for denoising an acoustic signal for a multi-microphone audio device operating in a noisy environment |
Also Published As
Publication number | Publication date |
---|---|
JP2017522594A (ja) | 2017-08-10 |
US10149047B2 (en) | 2018-12-04 |
EP3158775A4 (en) | 2018-02-21 |
EP3158775A1 (en) | 2017-04-26 |
US20150373453A1 (en) | 2015-12-24 |
JP6789827B2 (ja) | 2020-11-25 |
CN106797517A (zh) | 2017-05-31 |
WO2015195482A1 (en) | 2015-12-23 |
CN106797517B (zh) | 2019-12-17 |
KR102378207B1 (ko) | 2022-03-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200273442A1 (en) | Single-channel, binaural and multi-channel dereverberation | |
US10827263B2 (en) | Adaptive beamforming | |
CN109845288B (zh) | 用于麦克风之间的输出信号均衡的方法和装置 | |
EP3300078B1 (en) | A voice activitity detection unit and a hearing device comprising a voice activity detection unit | |
US8781137B1 (en) | Wind noise detection and suppression | |
US8682006B1 (en) | Noise suppression based on null coherence | |
EP3203473B1 (en) | A monaural speech intelligibility predictor unit, a hearing aid and a binaural hearing system | |
US20130322643A1 (en) | Multi-Microphone Robust Noise Suppression | |
US20170092256A1 (en) | Adaptive block matrix using pre-whitening for adaptive beam forming | |
US8761410B1 (en) | Systems and methods for multi-channel dereverberation | |
US9082411B2 (en) | Method to reduce artifacts in algorithms with fast-varying gain | |
US9378754B1 (en) | Adaptive spatial classifier for multi-microphone systems | |
KR102378207B1 (ko) | 오디오 신호들을 정제하는 멀티 오럴 mmse 분석 기술들 | |
CN110140294B (zh) | 用于均衡音频信号的方法和装置 | |
Hersbach et al. | Algorithms to improve listening in noise for cochlear implant users |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E90F | Notification of reason for final refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |