KR20040044982A - 선택적인 사운드 증강 - Google Patents
선택적인 사운드 증강 Download PDFInfo
- Publication number
- KR20040044982A KR20040044982A KR10-2004-7004267A KR20047004267A KR20040044982A KR 20040044982 A KR20040044982 A KR 20040044982A KR 20047004267 A KR20047004267 A KR 20047004267A KR 20040044982 A KR20040044982 A KR 20040044982A
- Authority
- KR
- South Korea
- Prior art keywords
- signals
- sound
- microphone
- filter
- coefficients
- Prior art date
Links
- 230000035945 sensitivity Effects 0.000 claims abstract description 19
- 230000005236 sound signal Effects 0.000 claims description 21
- 238000000034 method Methods 0.000 claims description 18
- 238000001914 filtration Methods 0.000 claims description 15
- 230000004044 response Effects 0.000 claims description 13
- 230000003111 delayed effect Effects 0.000 claims description 10
- 230000003190 augmentative effect Effects 0.000 claims description 4
- 238000012935 Averaging Methods 0.000 claims description 2
- 230000003139 buffering effect Effects 0.000 claims 2
- 238000005070 sampling Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 11
- 238000001228 spectrum Methods 0.000 description 4
- 239000002131 composite material Substances 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/84—Detection of presence or absence of voice signals for discriminating voice from noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02165—Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
다른 방향들로 향한 두개의 마이크, 또는 마이크 세트들은 마이크들로부터 수음된 신호들의 상관성 및 간섭성에 기초하여 필터 파라미터들을 생성시키기 위해 사용된다. 제 1 신호들은 적어도 하나의 제 1 마이크에 의해 수음된 사운드로부터 획득된다. 각 제 1 마이크는 제 1 주요 감도 방향을 포함하는 제 1 방향 세트로부터 사운드를 수음한다. 상기 바람직한 사운드 방향은 상기 제 1 방향 세트에 포함된다. 제 2 신호들은 적어도 하나의 제 2 마이크에 의해 수음된 사운드로부터 획득된다. 각 제 2 마이크는 제 1 주요 감도 방향과 다른 제 2주요 감도 방향을 포함하는 제 2 방향 세트로부터 사운드를 수음한다. 상기 바람직한 사운드는 상기 제 2 방향 세트에 포함된다. 필터 계수들은 제 1 신호들과 제 1 신호들의 간섭성 및 제 1 신호들과 제 2 신호들 사이의 상관성에 기초하여 결정된다. 제 1 신호들 및 제 2 신호들의 결합은 결정된 필터 계수들로 필터링된다.
Description
많은 어플리케이션들은 대부분 제거된 다른 방향들에서 비롯하는 사운드들을 가진 특정 방향으로부터의 분명한 사운드를 결정하는 것을 필요로 한다. 그러한 어플리케이션들은 음성 인식 및 검출, 사람-기계 인터페이스, 음성 증강(speech enhancement), 및 전화기, 컴퓨터, 보청기, 보안 및 음성 작동 조절(voice activated control)을 포함하는 폭넓고 다양한 제품들과 같은 것을 포함한다.
공간 필터링(Spatial filtering)은 신호원들의 물리적인 위치에 기초하여 다중 신호원들 사이에서 의도적으로 식별하기 위해 설계될 때 잡음 감소를 위한 효율적인 방법이 될 수 있다. 그러한 식별은 예를 들어, 지향식의 수음방식(directive microphone array)에 의해 가능하다. 그러나, 공간 필터링을 위해 사용된 통상적인 빔포밍(beamforming) 기술들은 몇가지 문제점들을 겪는다. 첫째, 그러한 기술들은 적절한 크기의 개구(aperture)를 성취하기 위해 큰 마이크 스페이싱을 필요로 한다. 두번째, 그러한 기술들은 협대역(narrowband) 신호들에 더 적용가능하고, 스피치에 대해 반드시 충분한 실행이 되지는 않으며, 그리고 그것은 상대적으로 광대역신호이다.
요구되는 것은 스피치를 위한 적절한 실행 및 작은 사이즈 둘 모두를 제공하는 스피치 증강이다.
본 발명은 잡음에서, 스피치(speech)와 같은 바람직한 사운드를 검출하는 것 및 증강하는 것에 관한 것이다.
본 발명은 마이크로부터 수신된 신호들의 상관성(correlation) 및 간섭성(coherence)에 기초하여 필터 파라미터들을 생성하기 위해 다른 방향들로 향하는 두개의 마이크들 또는 마이크 세트들로부터의 입력들을 사용한다.
바람직한 사운드 방향에서 다가오는 바람직한 사운드를 증강시키는 방법이 제공된다. 제 1 신호들은 적어도 하나의 제 1 마이크에 의해 수음된 사운드로부터 획득된다. 각각의 제 1 마이크는 제 1 주요 감도 방향을 포함하는 제 1 방향 세트로부터 사운드를 수음한다. 상기 바람직한 사운드 방향은 제 1 방향 세트로 포함된다. 제 2 신호들은 적어도 하나의 제 2 마이크에 의해 수음된 사운드로부터 획득된다. 각각의 제 2 마이크는 제 1 주요 감도 방향과 다른 제 2 주요 감도 방향을 포함하는 제 2 방향 세트로부터 사운드를 수음한다. 상기 바람직한 사운드 방향은 제 2 방향 세트로 포함된다. 필터 계수들은 제 1 신호들과 제 2 신호들의 간섭성 및 제 1 신호들과 제 2 신호들 사이의 상관성에 기초하여 결정된다. 제 1 신호들 및 제 2 신호들의 결합은 결정된 필터 계수들로 필터링된다.
본 발명의 실시예에서, 제 1 주요 감도 방향도 아니고 제 2 주요 감도 방향도 아닌 방향은 바람직한 사운드 방향과 같다.
본 발명의 또 다른 실시예에서, 바람직한 사운드 방향 및 제 1 주요 감도 방향 사이의 각도 상쇄(offset)는 바람직한 사운드 방향 및 제 2 주요 감도 방향 사이의 각도 상쇄와 크기가 같다.
본 발명의 더욱 더 다른 실시예에서, 필터 계수들은 제 1 신호들 및 제 2 신호들에 기초하여 간섭성 계수들을 결정하는 단계, 제 1 신호들 및 제 2 신호들에 기초하여 상관성 계수들을 결정하는 단계에 의해 계산되며 그런 다음 상관성 계수로 간섭성 계수들을 스케일링하는 단계에 의해 계산된다.
다시 본 발명의 또 다른 실시예에서, 제 1 신호들 및 제 2 신호들은 필터 계수를 결정하기에 앞서 공간적으로 필터링된다. 이러한 공간적 필터링은 제 2 신호들로부터 제 1 신호들의 딜레이된 버전을 제거함으로써 및 제 1 신호들로부터 제 2 신호들의 딜레이된 버전을 제거함으로써 달성될 수 있다.
본 발명의 앞으로의 실시예에서, 바람직한 사운드는 스피치를 포함한다.
바람직한 사운드 방향으로부터 수음된 바람직한 사운드를 복원하기 위한 시스템이 또한 제공된다. 적어도 하나의 마이크를 가지는, 제 1 마이크 세트는 제 1 방향으로 향하게 된다. 상기 제 1 마이크 세트는 바람직한 사운드를 포함하는 수음된 사운드에 응답하여 제 1 신호들을 생성시킨다. 적어도 하나의 마이크를 가지는, 제 2 마이크 세트는 제 1 방향과 다른 제 2 방향으로 향하게 된다. 상기 제 2 마이크 세트는 바람직한 사운드를 포함하는 수음된 사운드에 응답하여 제 2 신호들을 생성시킨다. 필터 추정기(estimator)는 제 1 신호들과 제 2 신호들의 간섭성 및 제 1 신호들과 제 2 신호들 사이의 상관성에 기초하여 필터 계수들을 결정한다. 필터는 제 1 신호들 및 제 2 신호들을 결정된 필터 계수들로 필터링한다.
바람직한 사운드를 증강시키기 위해 다수의 수음된 사운드 신호들의 필터링으로 사용될 필터 계수들을 생성시키기 위한 방법이 또한 제공된다. 제 1 사운드 신호들은 바람직한 사운드 방향을 포함하는 제 1 방향 세트로부터 수음된다. 제 2 사운드 신호들은 바람직한 사운드 방향을 포함하는 제 2 방향 세트로부터 수음된다. 상기 제 2 방향 세트는 제 1 방향 세트가 아닌 방향들을 포함한다. 간섭성 계수들은 제 1 사운드 신호들 및 제 2 사운드 신호들에 기초하여 결정된다. 상관성 계수들은 제 1 사운드 신호들 및 제 2 사운드 신호들에 기초하여 결정된다. 상기 필터 계수들은 상관성 계수들로 간섭성 계수들을 스케일링함으로써 생성된다.
도면의 간단한 설명
도 1은 본 발명에서 사용될 수 있는 변화하는 방향성(directionality)을 가진 두개의 마이크 패턴들을 도시하는 개략도이다.
도 2는 본 발명에서 사용될 수 있는 변화하는 방향성을 생성시키기 위해 사용된 다중 마이크들을 도시하는 개략도이다.
도 3은 본 발명의 실시예를 도시하는 블럭도이다.
도 4는 본 발명의 실시예에 따라 필터 계수 추정을 도시하는 블럭도이다.
도 5는 본 발명의 실시예에 따라 공간적으로 필터링을 도시하는 블럭도이다.
도 6은 본 발명의 실시예에 따라 다수의 바람직한 사운드 신호들을 수음하기 위해 정렬된 마이크들을 도시하는 개략도이다.
도 1에 보면, 본 발명에서 사용될 수 있는 변화하는 방향성을 가진 두개의마이크 패턴들을 도시하는 개략도를 나타낸다. 상기 본 발명은 방향성 패턴이라는 이점이 있으며, 이는 특정 방향들에서 도달하는 하나 이상의 신호들을 선택하기 위해 위치된 변화하는 방향의 픽업(pickup) 패턴들을 가진 두개 이상의 마이크들에 의해 나타난다.
도 1은 변화하는 방향성을 가진 두개의 마이크의 일례를 도시한다. 하기의 논의에서, 마이크들의 하나 또는 둘 모두는 마이크 그룹으로 교체될 수 있다. 유사하게, 두개 이상의 방향들은 일제히 또는 다수의 마이크들에 의해 지지되는 많은 방향들로부터 두개 이상을 선택함으로써 고려된다.
신호 방향(1) 및 다른 소스들로부터 도달하는 다중 잡음원들로부터 도달하는 신호들을 선택하기 위해 정렬된 두개의 마이크들을 고려해 보자. 좌측 마이크는 감도(2)의 주요 방향을 가지며 우측 마이크는 감도(3)의 주요 방향을 가진다. 상기 좌측 마이크는 도 4에 의해 도시된 극좌표응답선도(polar response plot)를 가지며 우측 마이크은 도 5에 의해 도시된 극좌표응답선도를 가진다. 영역(6)은 좌우측 마이크들의 스피치 방향(1)에 대한 접합 응답 영역을 나타낸다.
다수의 잡음원 각각은 NX(j)로 불리며, 이때 X는 방향(좌측 또는 우측)을 정의하며 j는 할당된 번호이다. 이러한 요구는 사실상 물리적 잡음원들이 아니라는 것을 주목하라. 각 NX(j)는, 예를 들어, 마이크들에 도달하는 잡음 신호들의 근사치들이 될 수 있다. 만약 다른 위치들로부터 수음된다면 사운드의 모든 소스들은 독립된 소스들로 가정된다.
도 1에 도시된 상기 시스템은 양쪽 마이크들이 잡음의 다른 렌디션(rendition) 외에 방향(1)로부터 본질적으로 신호의 동일한 렌디션을 포착할 것 임을 나타낸다. 좌측 마이크 신호들(ML) 및 우측 마이크 신호들(MR)은 하기와 같이 나타낼 수 있다:
여기서은 상기 좌측 마이크 또는 마이크 그룹에서 등록된 스피치의 렌디션이며은 우측 마이크 또는 마이크 그룹에서 등록된 스피치의 렌디션이다. 스피치 신호 그 자체(그리고 그것에 의하여 스피치 신호의 좌우측 렌디션 모두)가 스피치 방향(1)으로부터 도달한다는 것 및 합산된 잡음들 NL및 NR이 각각 좌우측 방향들로부터 도달하는 사운드를 구성한다는 것을 주목하라.
도 2는 다중 마이크 그룹들을 사용하여 본 발명의 실시예를 나타낸다. 마이크 세트들(20)은 더 큰 방향성을 성취하기 위해 사용될 수 있다. 게다가, 다중 마이크들(20) 또는 마이크 그룹들(20)은 스피치가 획득 될 방향(1)로부터 선택하기 위해 사용될 수 있다.
이제 도 3에 보면, 본 발명의 실시예를 도시하는 블럭도를 보여준다. 일반적으로 40에 의해 나타낸 스피치 획득(acquisition) 시스템은 적어도 두개의 마이크들 또는 마이크 그룹들에서 나타난다. 도시된 예제에서, 좌측 마이크(42)는 응답패턴(3)을 가지며 우측 마이크(44)는 응답 패턴(5)을 가진다. 마이크들(42, 44)의 중첩된 영역(6)은 스피치 방향(1)으로 결합된 응답 패턴(46)을 생성시킨다.
좌측 마이크(42)는 좌측 신호(48)을 생성시킨다. 우측 마이크(44)는 우측 신호(50)을 생성시킨다. 필터 추정기(52)는 좌측 신호(48) 및 우측 신호(50)를 수음하며 필터 계수들(54)를 발생시킨다. 합산기(56)는 합산 신호(58)을 생성하기 위해 좌측 신호(48) 및 우측 신호(50)를 합산한다. 필터(60)는 출력 신호(62)를 생산하기 위해 필터 계수(54)로 합산 신호(58)를 필터링하며, 상기 출력 신호는 방향(1)이 아닌 다른 방향들에서 서로 관련 없는 잡음으로부터 경감된 충돌을 가지는 방향(1)으로부터의 스피치를 갖는다.
이제 도 4에 보면, 본 발명의 실시예에 따라 필터 계수 추정을 도시하는 블럭도를 보여준다. 필터 추정기(52)는 좌측 마이크(42)에서의 좌측 신호(48) 및 우측 마이크(44)에서의 우측 신호(50)를 수음하는 공간 필터(70)를 포함한다. 공간 필터(70)는 마이크 신호들(48,50)의 적어도 하나의 신호보다 더 높은 비율의 잡음 또는 더 높은 비율의 신호를 가지는 적어도 하나의 신호를 포함할 수 있는 필터링 된 신호들(72)을 발생시킨다. 공간 필터(70)는 또한 상기 상황에서 잡음원들의 특정 서브셋(subset)으로부터 또는 마이크들(42,44)에 대하여 특정 방향 세트에서 비롯하는 잡음원들로부터 더 큰 컨텐트를 포함하는 필터링 된 신호들(72)을 발생시킬 수도 있다.
간섭성 추정기(74)는 필터링 된 신호들(72)의 적어도 하나를 수음하며 간섭성 계수(76)를 발생시킨다. 상관성 계수 추정기(78)는 필터링 된 신호들(72)의 적어도 하나를 수음하며 적어도 하나의 상관성 계수(80)를 발생시킨다. 필터 계수(54)는 간섭성 계수(76) 및 상관성 계수(80)에 기초한다. 보여준 실시예에서, 간섭성 계수(76)는 상관성 계수(80)로 스케일링된다.
본 발명의 실시예의 수학적 실행이 현재 제공된다. 상기 가정은 좌측 마이크(44)(SpeechL) 및 우측 마이크(48)(SpeechR)에 의해 렌디션이 간섭하는 것에 반해 합산된 잡음 NL및 NR은 간섭하지 않는다는 것이다. 이는 바람직한 스피치 신호 및 합산된 잡음 NL및 NR사이에서 신호-대-노이즈 비율을 최대화하기 위한 간섭 함수에 기초하여 최적의 필터의 구조를 허용한다.
두개의 신호 X 및 Y는 다음과 같이 정의될 수 있다:
이때및는 신호 X 및 Y의 복합 퓨리에 변환이다;
는 신호 X 및 Y의 복합 스펙트럼이며;및
<*>는 프레임-바이-프레임 평균 기호이다.
스펙트럼및는 스피치의 복합 스펙트럼 및 합산된 잡음들의 복합 스펙트럼들인, 합산된 NL에 대한및 합산된 NR에 대한로 정의될 수 있다. 게다가, 좌우측 채널들에 대한 변환은 다음과 같이 표현될 수 있다:
그 다음 스펙트럼 제곱값은 다음과 같다:
좌측 및 우측 채널들의 복합 상호스펙트럼(cospectrum)은 다음과 같이 표현될 수 있다:
Sp,NL및 NR이 독립적 소스들이기 때문에, 하기의 부등식은 각 결과를 유지한다:
게다가, 그 대역에서 스피치의 전력이 클 때, 주파수 대역에서 스피치에 의해 차지된 ω는이다. 하지만, 스피치가 존재하지 않을 때,는 0과 1 사이에 있다.
스피치 주파수 대역에서, 마이크들(20)과 마이크 그룹들(20) 사이에서 짧은 거리가 주어지면, 무응답(silence)의 기간 동안(이를테면, 스피치가 존재하지 않을때) 간섭은 1에 근사할 것이다:. 그러므로, 간섭 함수가 스피치 기간 동안 스피치를 위해 좋은 최적의 필터링법(filtration)을 가질지라도, 그것은 무응답 기간 동안 잡음을 줄이는데 거의 도움을 줄 수 없을 것이다. 무응답 기간 동안 잡음을 줄이기 위해 상관 계수가 사용되기도 한다.
두개의 신호 X 및 Y의 상관 계수는 다음과 같이 정의 될 수 있다:
여기서 COV는 공분산(covariance)을 나타내며 VAR은 분산(variance)을 나타낸다.
주파수 영역을 사용할 때, FFT 프레임에서의 평균이 사용될 수도 있다. 상기 시간 상관 계수,,는 다음과 같이 정의된다.
여기서 k는 사용된 프레임 번호(또는 디스크리트 등가 시간)이며, N은 각 프레임의 샘플 개수이다. 게다가,
및
게다가, 스피치의 시간 동안이며, 무응답 기간 동안이다.
본 발명의 실시예에서, 프레임 k, G(ω,k)에서의 추정 필터는 Ccorr(k) 및 Coh(ω,k)의 결과를 사용함으로써 다음과 같이 획득될 수 있다:
Ccorr(k)를 획득하기 위한 또 다른 방법으로, 그것은 다중 프레임들에 의해 평균화 하는 것을 포함하며, 다음과 같다:
더욱이 이 경우에,
이제 도 5에 보면, 본 발명의 실시예에 따라 공간적으로 필터링을 도시하는 블럭도를 보여준다. 공간 필터(70)는 좌측 신호(48) 및 우측 신호(50)를 수용한다. 좌측 신호는 블럭(90)에서 딜레이된다. 우측 신호(50)는 블럭(92)에서 딜레이 된다. 감산기(94)는 우측 신호(50) 및 딜레이된 좌측 신호(48) 사이의 차이를 발생시킨다. 감산기(96)는 좌측 신호(48) 및 딜레이된 우측 신호(50) 사이의 차이를 발생시킨다. 게다가, 필터링 된 신호(72)의 일부는 좌측 부분 잡음원들에 의해 추가된 스피치 신호를 포함하며 그 밖의 나머지는 우측 부분 잡음원들에 의해 추가된 스피치 신호를 포함한다.
이제 도 6에 보면, 본 발명의 실시예에 따라 다수의 바람직한 사운드를 수음하기 위해 정렬된 마이크들을 도시하는 개략도를 보여준다. 다중 방향으로부터 도달하는 다중 사운드들은 두개 이상의 마이크 그룹들을 사용하여 획득될 수 있다. 네개의 그룹들이 보여지며, 이는 네개의 관심(interest) 스피치 소스들 쪽으로 향하게 될 수 있다.
본 발명의 실시예가 도시되고 기술되어지는 동안, 이러한 실시예들이 본 발명의 모든 가능한 형태를 도시하고 기술하는 것으로 의도되지 않는다. 예를 들어, 스피치가 상기 설명에서 예제로써 사용되는 동안, 임의의 사운드 소스는 본 발명에 의해 증강될 수 있다. 명세서에서 사용된 상기 용어는 한정하는 것보다 오히려 서술 용어들이며, 다양한 변화들이 본 발명의 정신과 범위에서 벗어남 없이 만들어질 수 있음이 이해된다.
Claims (19)
- 제 1 방향 세트에 포함된 바람직한 사운드 방향을 가지며, 제 1 주요 감도 방향을 포함하는 제 1 방향 세트로부터 사운드를 수음하는 각 제 1 마이크를 가지며, 적어도 하나의 제 1 마이크에 의해 수음된 사운드로부터 제 1 신호들을 획득하는 단계;제 2 방향 세트에 포함된 바람직한 사운드 방향을 가지며, 제 1 주요 감도 방향과 다른 제 2 주요 감도 방향을 포함하는 제 2 방향 세트로부터 사운드를 수음하는 각 제 2 마이크를 가지며, 적어도 하나의 제 2 마이크에 의해 수음된 사운드로부터 제 2 신호들을 획득하는 단계;제 1 신호들과 제 2 신호들의 간섭성(coherence) 및 제 1 신호들과 제 2 신호들 사이의 상관성(correlation)에 기초하여 필터 계수들을 결정하는 단계; 및상기 결정된 필터 계수들로 제 1 신호들 및 제 2 신호들의 결합을 필터링하는 단계를 포함하며, 바람직한 사운드 방향으로부터 다가오는 바람직한 사운드를 증강시키는 방법.
- 제 1 항에 있어서, 제 1 주요 감도 방향이 바람직한 사운드 방향과 같지 않으며 제 2 주요 감도 방향이 바람직한 사운드 방향과 같지 않은 것을 특징으로 하는 바람직한 사운드를 증강시키는 방법.
- 제 1 항에 있어서, 바람직한 사운드 방향과 제 1 주요 감도 방향 사이의 각도 상쇄(offset)가 바람직한 사운드 방향과 제 2 주요 감도 방향 사이의 각도 상쇄와 크기가 같은 것을 특징으로 하는 바람직한 사운드를 증강시키는 방법.
- 제 1 항에 있어서,제 1 신호들 및 제 2 신호들에 기초하여 간섭 계수들을 결정하는 단계;제 1 신호들 및 제 2 신호들에 기초하여 상관 계수를 결정하는 단계; 및상기 상관 계수에 의해 간섭 계수들을 스케일링 하는 단계를 포함하는 필터 계수들을 결정하는 것를 특징으로 하는 바람직한 사운드를 증강시키는 방법.
- 제 1 항에 있어서, 필터 계수들을 결정하기에 앞서 제 1 신호들 및 제 2 신호들을 공간적으로 필터링하는 단계를 더 포함하는 것을 특징으로 하는 바람직한 사운드를 증강시키는 방법.
- 제 5 항에 있어서, 공간 필터링이 제 2 신호들로 부터 제 1 신호들의 딜레이된 버전을 제거하는 단계 및 제 1 신호들로부터 제 2 신호들의 딜레이된 버전을 제거하는 단계를 포함하는 것을 특징으로 하는 바람직한 사운드를 증강시키는 방법.
- 제 5 항에 있어서, 바람직한 사운드가 스피치를 포함하는 것을 특징으로 하는 바람직한 사운드를 증강시키는 방법.
- 제 1 마이크 세트가 바람직한 사운드를 포함하는 수음된 사운드에 응답하여 제 1 신호들을 발생시키고, 상기 제 1 마이크 세트가 적어도 하나의 마이크를 포함하며, 제 1 방향으로 향하는 제 1 마이크 세트;제 2 마이크 세트가 바람직한 사운드를 포함하는 수음된 사운드에 응답하여 제 2 신호들을 발생시키고, 상기 제 2 마이크 세트가 적어도 하나의 마이크을 포함하며, 제 1 방향과 다른 제 2 방향으로 향하는 제 2 마이크 세트;제 1 신호들과 제 2 신호들의 간섭성 및 제 1 신호들과 제 2 신호들 사이의 상관성에 기초하여 필터 계수들을 결정하는 필터 추정기를 가지며, 상기 제 1 마이크 세트 및 상기 제 2 마이크 세트와 소통하는 필터 추정기;및결정된 필터 계수들로 제 1 신호들 및 제 2 신호들을 필터링하는 필터를 가지며, 상기 제 1 마이크 세트 및 상기 제 2 마이크 세트, 필터 추정기와 소통하는 필터;를 포함하며, 바람직한 사운드 방향으로부터 수음된 바람직한 사운드를 복원시키기 위한 시스템.
- 제 8 항에 있어서, 제 1 방향이 바람직한 사운드 방향과 다르며 제 2 방향이 바람직한 사운드 방향과 다른 것을 특징으로 하는 바람직한 사운드를 복원시키기위한 시스템.
- 제 8 항에 있어서, 바람직한 사운드 방향이 실질상 제 1 방향 및 제 2 방향 사이에 중심이 되는 것을 특징으로 하는 바람직한 사운드를 복원시키기 위한 시스템.
- 제 8 항에 있어서,제 1 신호들 및 제 2 신호들을 공간적으로 필터링함으로써 필터링 된 신호들을 생성시키는 공간 필터;필터링 된 신호들에 기초하여 간섭 계수들을 생성시키는 간섭 추정기;필터링 된 신호들에 기초하여 상관 계수를 생성시키는 상관 계수 추정기; 및상관 계수로 간섭 계수들을 스케일링 함으로써 필터 계수들을 생성시키는 스칼라(scalar)를 포함하는 필터 추정기에 의해 바람직한 사운드를 복원시키기 위한 시스템.
- 제 11 항에 있어서, 상관 계수가 다수의 프레임들에 의한 평균으로 결정되는 것을 특징으로 하는 바람직한 사운드를 복원시키기 위한 시스템.
- 제 11 항에 있어서, 공간 필터가 제 2 신호들로부터 딜레이 된 제 1 신호들을 제거함으로써 및 제 1 신호들로부터 딜레이된 제 2 신호들을 제거함으로써 필터링 된 신호들을 생성시키는 것을 특징으로 하는 바람직한 사운드를 복원시키기 위한 시스템.
- 제 8 항에 있어서, 바람직한 사운드가 스피치를 포함하는 것을 특징으로 하는 바람직한 사운드를 복원시키기 위한 시스템.
- 바람직한 사운드 방향을 포함하는 제 1 방향 세트로부터 제 1 사운드 신호들을 수음하는 단계;제 1 방향 세트가 아닌 방향들을 포함하는 제 2 방향 세트를 가지며, 바람직한 사운드 방향을 포함하는 제 2 방향 세트로부터 제 2 사운드 신호들을 수음하는 단계;제 1 사운드 신호들 및 제 2 사운드 신호들에 기초하여 간섭 계수들을 결정하는 단계;제 1 사운드 신호들 및 제 2 사운드 신호들에 기초하여 상관 계수들을 결정하는 단계; 및상관 계수들로 간섭 계수들을 스케일링 함으로써 필터 계수들을 생성시키는 단계를 포함하며, 각 사운드 신호에 포함된 바람직한 사운드 방향으로부터 바람직한 사운드를 증강시키기 위해 다수의 수음된 신호들을 필터링하는 방법으로 사용될 필터 계수들을 생성시키기 위한 방법.
- 제 15 항에 있어서, 간섭 계수들 및 상관 계수들을 결정하는 것에 앞서 제 1 사운드 신호들 및 제 2 사운드 신호들을 공간적으로 필터링하는 단계를 더 포함하는 것을 특징으로 하는 필터 계수들을 생성시키기 위한 방법.
- 제 16 항에 있어서,제 1 사운드 신호들을 버퍼링하는 단계;제 2 사운드 신호들을 버퍼링하는 단계;제 1 사운드 신호들 및 상기 퍼버링 된 제 2 사운드 신호들 사이의 차이를 획득하는 단계를 포함하는 공간 필터링에 의해 필터 계수들을 생성시키기 위한 방법.
- 제 15 항에 있어서, 상관 계수를 결정하는 단계가 다수의 샘플링 프레임들에 의해 상관 계수들을 평균화하는 단계를 포함하는 하는 것을 특징으로 하는 필터 계수들을 생성시키기 위한 방법.
- 제 15 항에 있어서, 바람직한 사운드가 스피치를 포함하는 것을 특징으로 하는 필터 계수들을 생성시키기 위한 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US32483701P | 2001-09-24 | 2001-09-24 | |
US60/324,837 | 2001-09-24 | ||
PCT/US2002/030294 WO2003028006A2 (en) | 2001-09-24 | 2002-09-24 | Selective sound enhancement |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20040044982A true KR20040044982A (ko) | 2004-05-31 |
Family
ID=23265310
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR10-2004-7004267A KR20040044982A (ko) | 2001-09-24 | 2002-09-24 | 선택적인 사운드 증강 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20030061032A1 (ko) |
EP (1) | EP1430472A2 (ko) |
JP (1) | JP2005525717A (ko) |
KR (1) | KR20040044982A (ko) |
AU (1) | AU2002339995A1 (ko) |
WO (1) | WO2003028006A2 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101111524B1 (ko) * | 2011-10-26 | 2012-02-13 | (주)유나 | 유리 실험 기구 거치대 |
Families Citing this family (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7076072B2 (en) * | 2003-04-09 | 2006-07-11 | Board Of Trustees For The University Of Illinois | Systems and methods for interference-suppression with directional sensing patterns |
EP1581026B1 (en) * | 2004-03-17 | 2015-11-11 | Nuance Communications, Inc. | Method for detecting and reducing noise from a microphone array |
FR2878399B1 (fr) * | 2004-11-22 | 2007-04-06 | Wavecom Sa | Dispositif et procede de debruitage a deux voies mettant en oeuvre une fonction de coherence associee a une utilisation de proprietes psychoacoustiques, et programme d'ordinateur correspondant |
DE602005018023D1 (de) * | 2005-04-29 | 2010-01-14 | Harman Becker Automotive Sys | Kompensation des Echos und der Rückkopplung |
US8345890B2 (en) | 2006-01-05 | 2013-01-01 | Audience, Inc. | System and method for utilizing inter-microphone level differences for speech enhancement |
US8204252B1 (en) | 2006-10-10 | 2012-06-19 | Audience, Inc. | System and method for providing close microphone adaptive array processing |
US8744844B2 (en) | 2007-07-06 | 2014-06-03 | Audience, Inc. | System and method for adaptive intelligent noise suppression |
US9185487B2 (en) | 2006-01-30 | 2015-11-10 | Audience, Inc. | System and method for providing noise suppression utilizing null processing noise subtraction |
US8194880B2 (en) | 2006-01-30 | 2012-06-05 | Audience, Inc. | System and method for utilizing omni-directional microphones for speech enhancement |
US8180067B2 (en) * | 2006-04-28 | 2012-05-15 | Harman International Industries, Incorporated | System for selectively extracting components of an audio input signal |
US8934641B2 (en) * | 2006-05-25 | 2015-01-13 | Audience, Inc. | Systems and methods for reconstructing decomposed audio signals |
US8150065B2 (en) | 2006-05-25 | 2012-04-03 | Audience, Inc. | System and method for processing an audio signal |
US8849231B1 (en) | 2007-08-08 | 2014-09-30 | Audience, Inc. | System and method for adaptive power control |
US8204253B1 (en) | 2008-06-30 | 2012-06-19 | Audience, Inc. | Self calibration of audio device |
US8949120B1 (en) * | 2006-05-25 | 2015-02-03 | Audience, Inc. | Adaptive noise cancelation |
US8036767B2 (en) | 2006-09-20 | 2011-10-11 | Harman International Industries, Incorporated | System for extracting and changing the reverberant content of an audio input signal |
US8259926B1 (en) | 2007-02-23 | 2012-09-04 | Audience, Inc. | System and method for 2-channel and 3-channel acoustic echo cancellation |
US8189766B1 (en) | 2007-07-26 | 2012-05-29 | Audience, Inc. | System and method for blind subband acoustic echo cancellation postfiltering |
US8143620B1 (en) | 2007-12-21 | 2012-03-27 | Audience, Inc. | System and method for adaptive classification of audio sources |
US8180064B1 (en) | 2007-12-21 | 2012-05-15 | Audience, Inc. | System and method for providing voice equalization |
US8194882B2 (en) | 2008-02-29 | 2012-06-05 | Audience, Inc. | System and method for providing single microphone noise suppression fallback |
US8355511B2 (en) | 2008-03-18 | 2013-01-15 | Audience, Inc. | System and method for envelope-based acoustic echo cancellation |
US8774423B1 (en) | 2008-06-30 | 2014-07-08 | Audience, Inc. | System and method for controlling adaptivity of signal modification using a phantom coefficient |
US8521530B1 (en) | 2008-06-30 | 2013-08-27 | Audience, Inc. | System and method for enhancing a monaural audio signal |
WO2011044064A1 (en) * | 2009-10-05 | 2011-04-14 | Harman International Industries, Incorporated | System for spatial extraction of audio signals |
US9008329B1 (en) | 2010-01-26 | 2015-04-14 | Audience, Inc. | Noise reduction using multi-feature cluster tracker |
US8798290B1 (en) | 2010-04-21 | 2014-08-05 | Audience, Inc. | Systems and methods for adaptive signal equalization |
US20120057717A1 (en) * | 2010-09-02 | 2012-03-08 | Sony Ericsson Mobile Communications Ab | Noise Suppression for Sending Voice with Binaural Microphones |
DE102010043127B4 (de) | 2010-10-29 | 2024-08-14 | Sennheiser Electronic Se & Co. Kg | Mikrofon |
DK2555189T3 (en) * | 2010-11-25 | 2017-01-23 | Goertek Inc | Speech enhancement method and device for noise reduction communication headphones |
US9589580B2 (en) * | 2011-03-14 | 2017-03-07 | Cochlear Limited | Sound processing based on a confidence measure |
US9640194B1 (en) | 2012-10-04 | 2017-05-02 | Knowles Electronics, Llc | Noise suppression for speech processing based on machine-learning mask estimation |
JP6221257B2 (ja) * | 2013-02-26 | 2017-11-01 | 沖電気工業株式会社 | 信号処理装置、方法及びプログラム |
US9536540B2 (en) | 2013-07-19 | 2017-01-03 | Knowles Electronics, Llc | Speech signal separation and synthesis based on auditory scene analysis and speech modeling |
JP6295650B2 (ja) * | 2013-12-25 | 2018-03-20 | 沖電気工業株式会社 | 音声信号処理装置及びプログラム |
CN106797512B (zh) | 2014-08-28 | 2019-10-25 | 美商楼氏电子有限公司 | 多源噪声抑制的方法、系统和非瞬时计算机可读存储介质 |
KR102606286B1 (ko) | 2016-01-07 | 2023-11-24 | 삼성전자주식회사 | 전자 장치 및 전자 장치를 이용한 소음 제어 방법 |
CN105976826B (zh) * | 2016-04-28 | 2019-10-25 | 中国科学技术大学 | 应用于双麦克风小型手持设备的语音降噪方法 |
CN107331407B (zh) * | 2017-06-21 | 2020-10-16 | 深圳市泰衡诺科技有限公司 | 下行通话降噪方法及装置 |
JP6686977B2 (ja) * | 2017-06-23 | 2020-04-22 | カシオ計算機株式会社 | 音源分離情報検出装置、ロボット、音源分離情報検出方法及びプログラム |
CN112992169B (zh) * | 2019-12-12 | 2024-06-11 | 华为技术有限公司 | 语音信号的采集方法、装置、电子设备以及存储介质 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4888807A (en) * | 1989-01-18 | 1989-12-19 | Audio-Technica U.S., Inc. | Variable pattern microphone system |
JPH0728470B2 (ja) * | 1989-02-03 | 1995-03-29 | 松下電器産業株式会社 | アレイマイクロホン |
IT1257164B (it) * | 1992-10-23 | 1996-01-05 | Ist Trentino Di Cultura | Procedimento per la localizzazione di un parlatore e l'acquisizione diun messaggio vocale, e relativo sistema. |
US5473701A (en) * | 1993-11-05 | 1995-12-05 | At&T Corp. | Adaptive microphone array |
JPH07248784A (ja) * | 1994-03-10 | 1995-09-26 | Nissan Motor Co Ltd | 能動型騒音制御装置 |
DE4436272A1 (de) * | 1994-10-11 | 1996-04-18 | Schalltechnik Dr Ing Schoeps G | Verfahren und Vorrichtung zur Beeinflussung der Richtcharakteristiken einer akustoelektrischen Empfangsanordnung |
US5694474A (en) * | 1995-09-18 | 1997-12-02 | Interval Research Corporation | Adaptive filter for signal processing and method therefor |
JP3522954B2 (ja) * | 1996-03-15 | 2004-04-26 | 株式会社東芝 | マイクロホンアレイ入力型音声認識装置及び方法 |
US6041127A (en) * | 1997-04-03 | 2000-03-21 | Lucent Technologies Inc. | Steerable and variable first-order differential microphone array |
US6584203B2 (en) * | 2001-07-18 | 2003-06-24 | Agere Systems Inc. | Second-order adaptive differential microphone array |
-
2002
- 2002-09-24 WO PCT/US2002/030294 patent/WO2003028006A2/en not_active Application Discontinuation
- 2002-09-24 US US10/253,684 patent/US20030061032A1/en not_active Abandoned
- 2002-09-24 AU AU2002339995A patent/AU2002339995A1/en not_active Abandoned
- 2002-09-24 KR KR10-2004-7004267A patent/KR20040044982A/ko not_active Application Discontinuation
- 2002-09-24 JP JP2003531458A patent/JP2005525717A/ja active Pending
- 2002-09-24 EP EP02778321A patent/EP1430472A2/en not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101111524B1 (ko) * | 2011-10-26 | 2012-02-13 | (주)유나 | 유리 실험 기구 거치대 |
Also Published As
Publication number | Publication date |
---|---|
EP1430472A2 (en) | 2004-06-23 |
WO2003028006A2 (en) | 2003-04-03 |
AU2002339995A1 (en) | 2003-04-07 |
WO2003028006A3 (en) | 2003-11-20 |
US20030061032A1 (en) | 2003-03-27 |
JP2005525717A (ja) | 2005-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20040044982A (ko) | 선택적인 사운드 증강 | |
US7386135B2 (en) | Cardioid beam with a desired null based acoustic devices, systems and methods | |
CN102164328B (zh) | 一种用于家庭环境的基于传声器阵列的音频输入系统 | |
EP1743323B1 (en) | Adaptive beamformer, sidelobe canceller, handsfree speech communication device | |
JP3484112B2 (ja) | 雑音成分抑圧処理装置および雑音成分抑圧処理方法 | |
US7092529B2 (en) | Adaptive control system for noise cancellation | |
KR101456866B1 (ko) | 혼합 사운드로부터 목표 음원 신호를 추출하는 방법 및장치 | |
US5715319A (en) | Method and apparatus for steerable and endfire superdirective microphone arrays with reduced analog-to-digital converter and computational requirements | |
US6192134B1 (en) | System and method for a monolithic directional microphone array | |
US8300861B2 (en) | Hearing aid algorithms | |
CN110770827B (zh) | 基于相关性的近场检测器 | |
CN103907152B (zh) | 用于音频信号噪声抑制的方法和系统 | |
CN106251877A (zh) | 语音声源方向估计方法及装置 | |
WO2004045244A1 (en) | Adaptative noise canceling microphone system | |
WO2000041441A1 (en) | A method and a device for providing improved speech intelligibility | |
US9406293B2 (en) | Apparatuses and methods to detect and obtain desired audio | |
Doclo et al. | Extension of the multi-channel Wiener filter with ITD cues for noise reduction in binaural hearing aids | |
KR20060085392A (ko) | 어레이 마이크 시스템 | |
CN113744752A (zh) | 语音处理方法及装置 | |
JP2003533109A (ja) | マルチセンサアンテナ用受信システム | |
Maj et al. | SVD-based optimal filtering technique for noise reduction in hearing aids using two microphones | |
Lorenzelli et al. | Broadband array processing using subband techniques | |
KR102105975B1 (ko) | 다중 마이크로폰을 가진 디지털 보청기 | |
CN118250592A (zh) | 一种基于阵列麦克风的降风噪方法及系统 | |
CN117479063A (zh) | 基于多领麦自适应降噪会议系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WITN | Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid |