KR20070036777A - 오디오 신호 반향 억제 - Google Patents

오디오 신호 반향 억제 Download PDF

Info

Publication number
KR20070036777A
KR20070036777A KR1020077001207A KR20077001207A KR20070036777A KR 20070036777 A KR20070036777 A KR 20070036777A KR 1020077001207 A KR1020077001207 A KR 1020077001207A KR 20077001207 A KR20077001207 A KR 20077001207A KR 20070036777 A KR20070036777 A KR 20070036777A
Authority
KR
South Korea
Prior art keywords
echo
signal
frequency spectrum
parameter
direct
Prior art date
Application number
KR1020077001207A
Other languages
English (en)
Other versions
KR101149591B1 (ko
Inventor
렌 엠. 엠. 데렉스
코르넬리스 페. 얀스
꼬라도 보스까리노
Original Assignee
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 코닌클리케 필립스 일렉트로닉스 엔.브이.
Publication of KR20070036777A publication Critical patent/KR20070036777A/ko
Application granted granted Critical
Publication of KR101149591B1 publication Critical patent/KR101149591B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B3/00Line transmission systems
    • H04B3/02Details
    • H04B3/20Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other
    • H04B3/23Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other using a replica of transmitted signal in the time domain, e.g. echo cancellers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Telephone Function (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

음향 신호(y)에서 반향을 추정하는 방법은 신호(y)의 주파수 스펙트럼(Y)을 결정하는 단계와, 시간이 지남에 따라 신호의 반향 부분(r)의 감쇠를 지시하는 제 1 파라미터(α)를 제공하는 단계와, 반향 부분(r)에 대한 신호의 직접 부분(d)의 진폭을 지시하는 제 2 파라미터(β)를 제공하는 단계를 포함한다. 반향 신호(r)의 추정된 주파수 스펙트럼(
Figure 112007004932177-PCT00076
)은 이전 프레임의 주파수 스펙트럼(Y)과, 제 1 파라미터(α)와, 제 2 파라미터(β)를 사용하여 생성된다. 제 2 파라미터(β)는 바람직하게는 신호(y)의 이른 신호-대-늦은 신호 비에 반비례한다.

Description

오디오 신호 반향 억제{AUDIO SIGNAL DEREVERBERATION}
본 발명은 오디오 신호의 반향 억제(dereverberation)에 관한 것이다. 좀더 상세하게, 본 발명은 특히 음성과 같이 고정적이지 않은 오디오 신호인 오디오 신호의 반향을 추정하는 방법 및 디바이스에 관한 것이다.
음향 신호와 같은 신호가 여러 표면으로부터 반향이나 에코를 포함할 수 있다는 점은 잘알려져 있다. 실내공간에서, 예컨대, (음성이나 음악과 같은) 음향 신호는 벽, 천장 및 마루에 의해 반사된다. 그러므로, 실내 공간에 있는 마이크는 (소스로부터 직접 수신된) 직접 신호와 (반사 표면을 통해 수신된) 간접 신호의 조합으로서 음향 신호를 수신할 것이다. 이러한 간접 신호를 수신된 신호의 반향 부분이라고 한다.
원하는(즉, 직접) 신호를 그 반향으로부터 분리하고자 하는 많은 시도가 있어왔다. K. Lebart, J.M. Boucher 및 P.N. Denbigh가 저술한 논문 "A New Method Based on Spectral Subtraction for Speech Dereverberation"(Acta Acustica, 87권, 359-366페이지(2001))은 예컨대 스펙트럼 감산을 기초로 음성 신호로부터 최근 실내 공간 반향을 억압하는 방법을 개시하고 있다. 이러한 알려진 방법에서, 수신된 신호의 반향 부분의 주파수 스펙트럼은 시간이 지남에 따른 이러한 반향 부분의 감쇠를 지시하는 (제 1) 파라미터와 수신된 신호의 지연된 주파수 스펙트럼을 사용하여 추정된다. 이러한 반향 부분의 주파수 스펙트럼은 스펙트럼 감산에 의해 직접 부분의 주파수 스펙트럼을 추정하는데 사용될 수 있다.
이러한 알려진 방법은 직접 부분과 반향 부분의 진폭이 유사한 신호나 다시 말해 직접 부분의 에너지 크기가 반향 부분의 에너지 크기 보다 (훨씬) 더 작은 신호에 매우 효과가 있다. 그러나, 직접 신호의 진폭( 및 그에 따른 에너지 크기)이 반향 신호의 진폭( 및 에너지 크기)보다 상당히 더 클 때, 이러한 알려진 방법은 신호 왜곡을 초래하는 오차를 야기한다.
그러므로, 본 발명의 목적은 종래 기술의 이들 문제 및 다른 문제를 극복하는 것이고, 직접 부분 및 반향 부분의 에너지 크기의 임의의 차이를 고려한 음향 신호의 반향 부분을 추정하는 방법 및 디바이스를 제공하는 것이다.
그에 따라, 본 발명은 직접 부분과 반향 부분을 포함하는 신호에서 반향을 추정하는 방법을 제공하며, 이러한 방법은 제 1 파라미터, 제 2 파라미터 및 신호의 주파수 스펙트럼을 사용하여 반향 부분의 주파수 스펙트럼의 추정치를 제공하는 단계를 포함하며, 여기서, 제 1 파라미터는 시간이 지남에 따른 반향 부분의 감쇠를 지시하며, 제 2 파라미터는 신호의 반향 부분에 대한 직접 부분의 진폭을 지시한다.
반향 부분에 대한 직접 경로의 진폭을 지시하는 제 2 파라미터를 제공함으로써, 이들 두 신호 부의 상대적인 진폭이 고려된다. 그 결과, 진폭의 임의의 차이를 보상하여 좀더 정확한 추정치를 얻는 것이 가능하다.
직접 부분의 주파수 스펙트럼과, 그에 따라 직접 신호 부 자체를 잘 알려진 스펙트럼 감산 기술을 사용하여 반향 부분의 추정된 주파수 스펙트럼으로부터 얻을 수 있다는 점을 이해할 수 있을 것이다.
바람직한 실시예에서, 제 2 파라미터는 신호의 이른 신호-대-늦은 신호(early-to-late) 비에 반비례한다. 이른 신호-대-늦은 신호 비는 신호의 반향(늦은) 부에 대한 직접(이른) 부의 진폭을 지시하는 비이다.
바람직한 실시예에서, 반향 부분의 주파수 스펙트럼의 추정치를 제공하는 단계는 반향 부분의 주파수 스펙트럼의 이전 추정치를 사용하는 단계를 수반한다. 이러한 방식으로, 추정치를 이전 값 및 업데이트 조건을 사용하여 결정하며, 업데이트 조건은 바람직하게는 신호의 주파수 스펙트럼을 포함한다.
바람직한 실시예에서, 그러므로, 반향 부분의 주파수 스펙트럼 추정치는 제 1 파라미터x주파수 스펙트럼의 이전 절대값-제 3 파라미터x주파수 스펙트럼의 이전 절대값과 반향 신호의 주파수 스펙트럼의 이전 추정치의 차이와 같으며, 제 3 파라미터는 제 1 파라미터-제 2 파라미터와 같다.
실지 실시예에서, 본 발명의 방법은 추가로:
- 신호의 시간-제한 세그먼트를 포함하는 프레임을 한정하는 단계와,
- 각 프레임에 대해 신호의 주파수 스펙트럼을 결정하는 단계를 포함한다.
프레임은 부분적으로 겹쳐서, 일부 신호 값이 한번 이상 사용될 수 있을 것이다.
비록 제 2 파라미터의 신호 값이 소스와 마이크 사이의 거리( 및 그리하여 직접 신호의 상대적인 진폭)가 변화하지 않는 상황에 대해 결정될 수 있을 지라도, 제 2 파라미터를 각 프레임에 대해 분리해서 결정하는 것이 바람직하다. 이러한 방식으로, 제 2 파라미터의 좀더 정확한 결정이, 특히 움직임이 수반되는 경우에 가능하게 된다. 본 발명에 따라, 제 2 파라미터는 신호 및 신호의 파생 신호만을 사용하여 바람직하게는 결정된다.
신호의 각 시간 세그먼트에 대해, 바로 앞선 시간 세그먼트가 현재 시간 세그먼트에서 반향 부분의 주파수 스펙트럼 추정에 사용되는 직접 부분의 추정된 주파수 스펙트럼과 신호 자체의 주파수 스펙트럼을 결정하는데 사용된다.
훨씬더 우수한 추정치를 얻기 위해, 신호의 주파수 스펙트럼을 각 프레임에 대해 주파수 대역당 결정하고, 제 2 파라미터, 직접 신호의 추정된 주파수 스펙트럼 및 반향 부분의 추정된 주파수 스펙트럼을 또한 주파수 대역 당 결정하는 것이 바람직하다. 이러한 방식으로, 개별 추정치가 개별 주파수 대역에 대해 구해질 수 있다. 주파수 대역의 선택은 특정한 신호에 의해 지시될 수 있다.
전술된 바와 같이, 반향 부분의 주파수 스펙트럼은 이전 프레임의 주파수 스펙트럼, 제 1 파라미터, 제 2 파라미터 및 이전 프레임의 반향 부분의 추정된 주파수 스펙트럼을 사용하여 추정된다(제 1 프레임에 대해, 이전 프레임의 추정치는 예컨대 0과 같이 미리 결정된 값을 갖는다고 가정될 수 있다). 이 방법은 바람직하게는 스펙트럼 감산을 사용하여 반향 부분의 주파수 스펙트럼의 추정치를 사용하여 신호의 반향을 억제하고, 감산으로 인한 스펙트럼을 기초하여 반향 억제된 신호를 재구성하는 추가적인 단계를 포함할 수 있다.
본 발명은 또한 전술된 방법을 실행하는 컴퓨터 프로그램 제품을 제공한다. 컴퓨터 프로그램 제품은 컴퓨터 프로그램이 전자 또는 광 형태로 저장되는 CD, DVD, 또는 플로피 디스크와 같은 캐리어를 포함할 수 있다. 컴퓨터 프로그램은 범용 컴퓨터나 특수용도 컴퓨터에 의해 실행될 방법 단계들을 명시한다.
본 발명은 전술된 방법을 실행하기 위한 디바이스 및 그러한 디바이스를 포함하는 음성 인식 시스템과 같은 오디오 시스템을 추가로 제공한다.
본 발명은 수반하는 도면에 예시된 예시적인 실시예를 참조하여 추가로 설명될 것이다.
도 1은 실내 공간의 임펄스 응답의 전형적인 예를 개략적으로 도시한 도면.
도 2는 도 1의 실내 공간 임펄스 응답의 에너지 감쇠 곡선을 개략적으로 도시한 도면.
도 3은 본 발명에 따른 반향을 추정하기 위한 필터 배열을 개략적으로 도시한 도면.
도 4는 본 발명에 따른 반향을 추정하기 위한 디바이스를 개략적으로 도시한 도면.
도 5는 도 4의 본 발명의 디바이스를 병합한 시스템을 개략적으로 도시한 도면.
도 1에 도시된 예시적인 신호는 실내 공간의 임펄스 응답, 즉 음향 임펄스( 극히 짧은 지속기간을 갖는 펄스)가 실내 공간에서 생성될 때 그 실내 공간 내의 마이크에 의해 수신된 신호를 나타낸다. 이러한 임펄스 응답은 중요한 신호 성분을 전혀 포함하지 않는 제 1(신호 감쇠) 구역(I)과, 직접 신호 부(d)를 포함하는 제 2 구역(II)과, 간접 반향 신호 부(r)를 포함하는 제 3 구역(III)을 포함한다. 직접 신호 부(d)와 반향 신호 부(r)는 함께 신호(y)를 구성하며, 그 진폭(yi)이 샘플 지수(i)의 함수로서 도시되어 있다. 샘플링된(디지털화된) 신호의 샘플 지수(i)는 아날로그 신호에서 시간에 대응함을 이해해야 할 것이다.
직접 신호 부(d)가 직접 신호 경로를 통해, 즉 반사되지 않고 수신되는 반면, 간접 즉 반향 부분(r)이 벽 및 기타 반사 표면을 통해 수신된다. 도시된 바와 같이, 반사 부(r)의 진폭(yi)은 지수적으로 감쇠한다. 이점이 도 2에 또한 예시되어 있으며, 도 2는 신호(y)의 에너지 감쇠 곡선(EDC: Energy Decay Curve)을 샘플 지수(i)의 함수로서 나타낸다. EDC는 다음과 같이 정의된다:
Figure 112007004932177-PCT00001
말로 표현하면, 에너지 감쇠 곡선(EDC)은 주어진 샘플 지수(i)에 대해 신호의 나머지 부분의 에너지의 로그값에 10을 곱한 것이다. 반향 부분(r)의 EDC를 포함하는 제 3 구역(III)에서 EDC가 대략 선형적임을 볼 수 있다(도시된 EDC의 값은 본 예에서 yi의 모든 값이 1보다 훨씬 더 작기 때문에 음(negative)임을 주목해야 한다). EDC는 로그값이므로, EDC의 이러한 선형 감쇠는 신호(y)의 지수적 감쇠를 나타낸다. 구역(III)에서 EDC의 경사도는 파라미터(αr)에 의해 표현될 수 있고, 여기서 아랫첨자(r)는 반향을 지칭한다.
영역(I)과 영역(III) 사이의 EDC에서 계단이 발생함을 도 2에서 또한 볼 수 있다. 이 계단은 반향 부분(r)에 대한 직접 신호 부(d)의 에너지(도 1)를 나타낸다. 일부 상황에서, 이 계단은 상대적으로 작으며, 반향 부분(r)은 직접 경로(d)와 유사한(또는 이보다 더 큰) 진폭을 갖는다. 도시된 예에서, 그러나, EDC에서의 이러한 계단은 상대적으로 크며, 이는 도 1의 직접 부분이 반향 부분(r)보다 상당히 더 크기 때문이다. 이러한 계단을 무시하면, 반향 부분(r)(의 주파수 스펙트럼)을 추정할 경우 추정 오차를 초래할 수 있다. 그러나, 본 발명은 추가적인 파라미터(β)를 사용하여 이 계단을 고려하며, 이를 통해 훨씬 개선된 결과를 생성한다.
도 1의 신호(y)는 잡음 주파수 스펙트럼을 반향 주파수 스펙트럼의 추정치로서 대체하는 하나의 채널 잡음 억압 기술과 같은 알려진 기술을 사용하여 반향 억제될 수 있다. 스펙트럼 감산의 경우, 이는 신호의 주파수 스펙트럼(Y)을 결정하는 단계와, 반향의 주파수 스펙트럼(R)을 추정하는 단계와, 직접 신호 부의 추정된 주파수 스펙트럼을 얻기 위해 신호 주파수 스펙트럼으로부터 이렇게 추정된 반향 주파수 스펙트럼을 감산하는 단계와, 그 추정된 주파수 스펙트럼을 기초로 해서 직접 신호를 재구성하는 단계를 수반한다.
전술한 종래 기술에 따라, 이것은 다음과 같이 달성될 수 있다. 신호(y)는 디지털 신호의 다수의 샘플을 각각 포함하는 프레임으로 나눠진다. 각 프레임은 예컨대 128 또는 256개의 샘플을 포함할 수 있다. 0이 추가되어(소위 "제로 패딩") 프레임 당 적절한 샘플 수에 도달한다. 프레임은 전형적으로 반드시 부분적으로 겹쳐질 필요는 없으며, 용어 "블록"은 각 프레임의 "새로운" 샘플을 지칭하는데 사용된다.
유리하게, 윈도우, 예컨대 그 자체로 알려져 있는 해밍 윈도우가 아티팩트(artifacts)의 도입을 완화하도록 적용된다. 각 프레임에 대해, 주파수 스펙트럼(Y)이 잘 알려져 있는 고속 푸리에 변환(FFT)을 사용하여 결정된다. 각 프레임(κ)에 대해, 반향 주파수 스펙트럼(R)의 추정치(
Figure 112007004932177-PCT00002
)는 다음의 수학식 2에 의해 결정된다:
Figure 112007004932177-PCT00003
여기서, b는 블록 크기(즉, 각 프레임에서 새로운 샘플의 수)이며, m은 주파수이며, 수직 막대는 절대값을 지시하며, αr은 반향 부분(r)의 감쇠 속도를 지시하는 파라미터이다. 수학적으로, αr은 다음과 같이 한정될 수 있다:
Figure 112007004932177-PCT00004
여기서, F는 샘플링 주파수이고,
Figure 112007004932177-PCT00005
이다.
여기서, ln은 자연 로그(3ln10은 대략 6.9와 같다)이고, T60은 반향 시간, 즉 신호가 초기 신호 레벨에 비해 60dB(데시벨) 강하하는데 경과한 시간 길이이다.
반향 주파수 스펙트럼의 추정치(
Figure 112007004932177-PCT00006
)는 이득 함수를 결정하는데 사용될 수 있다:
Figure 112007004932177-PCT00007
여기서, λ는 반향 억제된 신호의 임의의 심각한 왜곡이 회피됨을 보장하는 값인 소위 스펙트럼 마루이다. λ의 전형적인 값은, 비록 다른 값이 또한 사용될 수 있을 지라도, 0.1이다. 원래 신호의 주파수 스펙트럼(Y)은 이 이득 인자(G(κB,m))에 의해 곱해져 직접(반향 억제된) 신호(d)의 주파수 스펙트럼(D)을 산출한다.
비록 이 알려진 방법이 매우 효과적일지라도, 이것은, 신호(y)의 직접 부분(d)이 반향 부분(r)에 대해 큰 진폭(에너지)을 가질 때, 다시 말해 신호가 도 2의 구역(II)에서 큰 계단을 보일 때, 신호 왜곡을 초래한다. 반향 부분에 대한 직접 부분의 이러한 진폭은 이른 신호-대-늦은 신호 비(ELR)를 사용하여 표현될 수 있으 며, 이것은 다음과 같이 기록할 수 있다:
Figure 112007004932177-PCT00008
여기서, k는 도 2의 구역(II 및 III)을 분리하는 샘플 수, 즉 EDC 곡선의 강하가 종료하고 상대적으로 직선 부가 시작하는 지점이다. 그러므로, ELR은 직접 부분(샘플(k)까지)과 반향 부분(샘플(k)로부터)의 에너지(의 로그값) 비를 결정한다. ELR은 종종 명료 지수(Clarity Index)로 지칭된다.
이른 신호-대-늦은 신호 비(ELR)가 작을 때(예컨대, 위의 정의를 사용할 경우 0dB보다 더 작을 때), 직접 부분(d)의 에너지 크기가 신호(y)의 반향 부분(r)에 비해 작으며, 전술된 종래기술의 방법은 신호(y)의 반향을 억제하는데 효과적으로 사용될 수 있다. 그러나, ELR이 클 때(예컨대, 위의 정의를 사용할 경우 0dB보다 더 크거나, 5dB보다 더 클 때), 알려진 방법은 왜곡을 초래하며, 이는 EDC(도 2)의 구역(II)의 계단이 무시되기 때문이다.
그에 따라, 본 발명은 직접 신호 부(d)와 반향 신호 부(r)의 상대적인 에너지 크기를 고려한 개선된 추정 방법을 사용한다.
상기 수학식 2에서 시작해서, 본 발명은 정정 조건(
Figure 112007004932177-PCT00009
)을 감산함으로서 반향 부분(r)의 주파수 스펙트럼(R)의 추정치를 정정하는 것을 제안하며, 여기서
Figure 112007004932177-PCT00010
는 ELR에 의존한 인자이며, C는 프레임 수(κ)(즉, 시간)의 함수 및, 아마도 또한 블록 크기(B)와 주파수(m)의 함수이다:
Figure 112007004932177-PCT00011
본 발명은 직접 부분의 주파수 스펙트럼(D)의 추정치(
Figure 112007004932177-PCT00012
)를 함수(C)로서 사용하는 것을 추가로 제안한다:
Figure 112007004932177-PCT00013
필요한 속성을 갖는 다른 함수(C)가 있을 수 있음을 이해해야 할 것이다.
직접 부분의 주파수 스펙트럼(D)의 추정치(
Figure 112007004932177-PCT00014
)가 다음과 같이 표현될 수 있다:
Figure 112007004932177-PCT00015
수학식 8은 다음과 같이 다시 기록될 수 있다:
Figure 112007004932177-PCT00016
파라미터(
Figure 112007004932177-PCT00017
)를 도입하면(여기서, o≤β(κB)≤αr), 수학식 10은 다음과 같이 기록될 수 있다:
Figure 112007004932177-PCT00018
수학식 9를 사용하면, 수학식 11은 또한 다음과 같이 표현될 수 있다:
Figure 112007004932177-PCT00019
다음의 수학식 13임을 알 수 있다:
Figure 112007004932177-PCT00020
다시 말해, (제 2) 파라미터(
Figure 112007004932177-PCT00021
)는 이른 신호-대-늦은 신호 비(ELR)에 반비례한다. β와 ELR 모두가 시간의 함수(즉, 프레임 지수(κ)x 블록 지수(B))이며, β( 및 ELR)는 또한 주파수(또는 하위 대역)에 의존함(
Figure 112007004932177-PCT00022
)을 또한 주목해야 한다.
본 발명에 따른 추정치(
Figure 112007004932177-PCT00023
)가 ELR을 고려하면서 이전 프레임의 주파수 스펙트럼(Y)(의 절대값)과 이전 추정치 모두를 결합함을 수학식 11로부터 볼 수 있다. 큰 ELR에 대해,
Figure 112007004932177-PCT00024
는 작고,
Figure 112007004932177-PCT00025
는 이전 추정치를 효과적으로 기초하며, 스펙트럼(Y)의 영향을 억압함을 추가로 수학식 11 및 12로부터 볼 수 있다. 작은 ELR에 대해,
Figure 112007004932177-PCT00026
는 "크고", 대략 αr과 같고,
Figure 112007004932177-PCT00027
은 종래기술에서처럼
Figure 112007004932177-PCT00028
과 대략 같다.
그러므로, ELR이 클 때 중요한 개선을 제공하면서, 본 발명의 방법은 이른 신호-대-늦은 신호 비(ELR)가 작은 경우에 종래기술과 부합함을 알 수 있다.
본 발명의 방법은 모든 주파수에 대해 하나의 조건을 사용하여 하위-대역 당 , 즉 주파수(m) 당 실행되거나, 주파수와 무관하게 실행될 수 있음을 주목해야 한다.
본 발명의 방법은 소프트웨어나 하드웨어로 구현될 수 있다. 예시적인 하드웨어 구현이 도 3에 도시되며, 여기서, 필터부(10)가 도시되어 있다. 필터부(10)는 제 1 지연 요소(11)와, 제 1 증폭기(12)와, 결합 요소(13)와, 제 2 지연 요소(14)와, 제 2 증폭기(15)를 포함한다.
도시된 예에서, 제 1 지연 요소(11)는 주파수 스펙트럼(Y)의 절대값(즉, 크기)(
Figure 112007004932177-PCT00029
)을 수신하며, 지연된 절대값(
Figure 112007004932177-PCT00030
)을 출력한다. 바람직한 실시예에서, 지연(Δ)은 1 프레임과 같다. 증폭기(12)에서, 이러한 지연된 절대값은 (제 2) 파라미터(β)에 의해 곱해져 결합 요소(13)에 공급되며, 결합 요소(13)는 바람직하게는 가산기로 구성된다.
결합 요소(13)는 또한 제 2 곱셈기(15)의 출력 신호를 수신하고, 추정치(
Figure 112007004932177-PCT00031
)를 출력한다. 이러한 추정치는 제 2 지연 요소(14)에 의해 수신되고, 지연 요소(14)는 지연된 추정치(
Figure 112007004932177-PCT00032
)를 제 2 증폭기(15)에 출력한다. 이러한 지연된 추정치(
Figure 112007004932177-PCT00033
)는 증폭기(15)에서 인자(αr -β)와 곱해지고 결합 요소(13)에 공급된다. 알 수 있는 바와 같이, 필터부(10)는 상기 수학식 11과 동일한 결과를 생성한다.
파라미터(β)(또는
Figure 112007004932177-PCT00034
)는 미리 결정될 수 있다. 예컨대, 어떤 상황에 대한 ELR의 추정치가 알려져 있다면, 그러한 상황에 대해 0.1 또는 0.2의 고정값이 사용될 수 있었다. 그러나, 각 신호에 대해
Figure 112007004932177-PCT00035
를 추정하는 것이 바람직하다. 물론,
Figure 112007004932177-PCT00036
는 상기 수학식 13을 사용하여 이른 신호-대-늦은 신호 비를 기초하여 추정될 수 있다. 그러나, (예컨대 0인 미리 결정된 값일 수 있는)
Figure 112007004932177-PCT00037
의 초기 값에서 시작한다면, 다음의 수학식 14를 사용하여 업데이트가 제공될 수 있다:
Figure 112007004932177-PCT00038
여기서, 함수(f())는 업데이트 함수이고, 파라미터(λ)는 전술한 스펙트럼 마루이다. 절대값(
Figure 112007004932177-PCT00039
)과 추정된 스펙트럼(
Figure 112007004932177-PCT00040
)을 사용하는 업데이트 함수의 예가 다음과 같다:
Figure 112007004932177-PCT00041
여기서, ε는 0으로 나누는 것을 막기 위해 (매우 작은) 값을 갖는 보조 파라미터이며, μ는
Figure 112007004932177-PCT00042
의 업데이트의 속도 및 정확도를 제어하는 음이 아닌 파라미터이다.
신호의 반향을 억제하기 위한 디바이스의 바람직한 실시예가 개략적으로 도 4에 도시되어 있다. 도 4에 도시된 예시적인 디바이스(1)는 필터 유닛(10)과, FFT 유닛(20)과, 스펙트럼 분해 유닛(30)과, 파라미터 추정 유닛(40)과, 이득 결정 유닛(50)과, 지연 유닛(60)과, 곱셈 유닛(70)과, 스펙트럼 재구성 유닛(80)과, 역 FFT 유닛(90)을 포함한다.
FFT 유닛(20)은 (디지털) 신호(y(k))를 수신하고, 신호 샘플의 프레임에 대해 잘 알려진 고속 푸리에 변환을 수행한다. A/D(아날로그/디지털) 변환기는, 원래의 신호가 아날로그인 경우에 존재할 수 있음을 이해해야 할 것이다. FFT 유닛(20)에 의해 생성된 (복소) 스펙트럼(Y(m))은 분해 유닛(30)에 공급되며, 유닛(30)은 복소 스펙트럼을 위상 부(φ)와 크기 부(ρ)로 분해한다. 이러한 크기(ρ)는 절대값(
Figure 112007004932177-PCT00043
)과 같으며, 여기서, 앞서와 같이, κ는 프레임 지수(프레임 수)이며, B는 블록 크기이며, m은 주파수이다. 위상 부(φ)는 스펙트럼 재구성 유닛(80)에 직접 공급되는 반면, 크기 부(ρ)는 필터 유닛(10), 파라미터 유닛(40), 이득 유닛(50) 및 곱셈 유닛(70)에 공급된다.
도 3의 필터 유닛(10)과 동일할 수 있는 필터 유닛(10)은 또한 추정된 반향 스펙트럼(
Figure 112007004932177-PCT00044
)을 생성하기 위해 파라미터(αr
Figure 112007004932177-PCT00045
)를 수신하며, 이러한 스펙트럼은 유닛(40 및 50)에 공급된다. 유닛(40)은 예컨대 수학식 15에 따라 추정치(
Figure 112007004932177-PCT00046
)와, 파라미터(λ)와, 지연(Δ) 유닛(60)에 의해 출력된 지연된 값(
Figure 112007004932177-PCT00047
)을 사용하여
Figure 112007004932177-PCT00048
의 업데이트된 값을 생성한다.
유닛(50)은 예컨대 수학식 5에 따라 이득 인자(
Figure 112007004932177-PCT00049
)를 생성한다. 이러한 이득 인자는 곱셈기(70)에 공급되고, 여기서, 이러한 인자는 절대값 스펙트럼(
Figure 112007004932177-PCT00050
)과 곱해져 반향 억제된 스펙트럼 크기(ρ')를 생성한다. 재구성 유닛(80)은 φ와 ρ'를 기초로 해서 반향 억제된 스펙트럼(
Figure 112007004932177-PCT00051
)을 재구성 한다. 이러한 스펙트럼(
Figure 112007004932177-PCT00052
)은 IFFT(고속 푸리에 역변환) 유닛(90)에 의해 반향 억제된 시간 신호(
Figure 112007004932177-PCT00053
)로 변환된다.
도 4의 디바이스(1)를 병합하는 오디오 시스템이 도 5에 개략적으로 도시된다. 시스템(9)은 반향 억제 디바이스(1)와, 신호 처리 디바이스(2)와, 마이크(3)와, 라우드스피커(4)를 포함한다. 반향 억제 디바이스(1)는 바람직하게는 도 4의 디바이스(1)나 그 등가 디바이스이다. 신호 처리 디바이스(2)는 증폭기 및/또는 임의의 다른 적절한 오디오 신호 처리 수단을 포함할 수 있다. 마이크(3)는 마이크 세트로 대체될 수 있다. 유사하게, 라우드스피커(4)는 라우드스피커 세트나 다른 적절한 트랜스듀서로 대체될 수 있다. 반향 억제 디바이스(1)와 신호 처리 디바이스(2)의 순서는 역전될 수 있고, 다른 디바이스(미도시)가 추가될 수 있다. 시스템(9)은 예컨대 컨퍼런스 시스템, 핸즈-프리 전화 시스템, 또는 음성 인식 시스템을 구성할 수 있다.
본 발명은 직접 신호 부와 반향 신호 부의 에너지 크기 비는 신호의 반향을 억제할 때 고려되어야 한다는 인식을 기초로 한다. 이러한 에너지 크기 비에 관련된 파라미터를 도입함으로써, 더 적은 신호 왜곡을 도입하는 더 우수한 반향 억제가 달성된다.
본 발명은 직접 부분과 반향 부분을 포함하는 신호에서 반향을 추정하는 방법이라고 요약될 수 있으며, 이 방법은 제 1 파라미터와 신호의 스펙트럼을 사용하여 반향 부분의 스펙트럼을 추정하는 단계와, 제 2 파라미터를 수반하는 정정 조건 을 사용하여 추정된 스펙트럼을 정정하는 단계를 포함하며, 제 2 파라미터는 신호의 반향 부분에 대한 직접 부분의 진폭을 지시한다.
본 명세서에서 사용된 임의의 조건은 본 발명의 범위를 제한하도록 해석되지 않아야 함을 주목해야 한다. 특히, 단어 "포함한다" 및 "포함하는"은 구체적으로 언급되지 않은 임의의 요소를 배제하지 않을 것이다. 하나의 (회로) 요소는 다수의 (회로) 요소나 그 등가 요소로 대체될 수 있다.
용어 컴퓨터 프로그램 제품은 예컨대 제조 물품과 같이, 프로세서 내로 명령을 입력하는 일련의 로딩 단계 이후 프로세서-범용 또는 특수 용도-가 본 발명의 특징적인 기능 중 임의의 기능을 수행할 수 있게 하는 명령 집합의 물리적인 실현을 포함한다고 이해되어야 한다. 특히, 컴퓨터 프로그램 제품은 예컨대 디스크나 네트워크 연결-유선 또는 무선-상에 잠시 존재하는 메모리에 존재하는 다른 플러그-인 구성요소와 같은 캐리어 상에서 프로그램 코드, 이 프로그램 코드로부터 유도한 프로세서 적응 코드, 또는 이러한 프로그램 코드의 임의의 중간 변환이나, 종이에 기록된 프로그램 코드로서 실현될 수 있다. 프로그램 코드와 별도로, 프로그램에 필요한 본 발명의 특징적인 데이터는 또한 컴퓨터 프로그램 제품으로서 구현될 수 있다.
본 발명은 전술된 실시예로 제한되지 않고, 많은 변경 및 추가가 첨부된 청구항에서 한정된 바와 같은 본 발명의 범주에서 벗어나지 않고 이뤄질 수 있다는 점을 당업자는 이해하게 될 것이다.
상술한 바와 같이, 본 발명은 오디오 신호의 반향 억제와, 음성과 같은 비고정 오디오 신호인 오디오 신호의 반향을 추정하는 방법 및 디바이스에 이용된다.

Claims (27)

  1. 직접 부분(direct part)(d)과 반향 부분(reverberations part)(r)을 포함하는 신호(y)에서 반향을 추정하는 방법으로서,
    제 1 파라미터(α), 제 2 파라미터(β) 및 신호(y)의 주파수 스펙트럼(Y)을 사용하여 상기 반향 부분(r)의 주파수 스펙트럼(R)의 추정치(
    Figure 112007004932177-PCT00054
    )를 제공하는 단계를 포함하며,
    여기서, 상기 제 1 파라미터(α)는 시간이 지남에 따른 상기 반향 부분(r)의 감쇠를 지시하며, 상기 제 2 파라미터(β)는 신호(y)의 상기 반향 부분(r)에 대한 상기 직접 부분(d)의 진폭을 지시하는,
    직접 부분과 반향 부분을 포함하는 신호에서 반향을 추정하는 방법.
  2. 제 1항에 있어서, 상기 제 2 파라미터(β)는 신호(y)의 이른 신호-대-늦은 신호(early-to-late) 비(ELR)에 반비례하는, 직접 부분과 반향 부분을 포함하는 신호에서 반향을 추정하는 방법.
  3. 제 1항에 있어서, 상기 반향 부분(r)의 주파수 스펙트럼(R)의 추정치(
    Figure 112007004932177-PCT00055
    )를 제공하는 상기 단계는 상기 반향 부분(r)의 주파수 스펙트럼(R)의 이전 추정치(
    Figure 112007004932177-PCT00056
    )를 사용하는 단계를 수반하는, 직접 부분과 반향 부분을 포함하는 신호에서 반향을 추정하는 방법.
  4. 제 1항에 있어서, 상기 반향 부분(r)의 상기 주파수 스펙트럼(R)의 상기 추정치(
    Figure 112007004932177-PCT00057
    )는 상기 제 1 파라미터(α)x주파수 스펙트럼(Y)의 이전 절대값-제 3 파라미터(
    Figure 112007004932177-PCT00058
    )x주파수 스펙트럼(Y)의 이전 절대값과 상기 반향 신호(r)의 주파수 스펙트럼(R)의 이전 추정치(
    Figure 112007004932177-PCT00059
    )의 차이이고, 상기 제 3 파라미터(
    Figure 112007004932177-PCT00060
    )는 상기 제 1 파라미터(α)-상기 제 2 파라미터(β)인, 직접 부분과 반향 부분을 포함하는 신호에서 반향을 추정하는 방법.
  5. 제 1항에 있어서,
    - 신호(y)의 시간-제한 세그먼트를 포함하는 프레임(κ)을 한정하는 단계와,
    - 각 프레임(κ)에 대해 신호(y)의 주파수 스펙트럼(Y)을 결정하는 단계를 더 포함하는, 직접 부분과 반향 부분을 포함하는 신호에서 반향을 추정하는 방법.
  6. 제 5항에 있어서, 프레임은 부분적으로 겹치는, 직접 부분과 반향 부분을 포함하는 신호에서 반향을 추정하는 방법.
  7. 제 5항에 있어서, 각 프레임(κ)에 대해, 이전 프레임의 주파수 스펙트럼(Y), 상기 제 1 파라미터(α), 상기 제 2 파라미터(β) 및 이전 프레임의 반향 부 분(r)의 추정된 주파수 스펙트럼()을 사용하여 반향 부분(r)의 추정된 주파수 스펙트럼(
    Figure 112007004932177-PCT00062
    )을 제공하는 단계를 더 포함하는, 직접 부분과 반향 부분을 포함하는 신호에서 반향을 추정하는 방법.
  8. 제 7항에 있어서, 상기 이전 프레임은 바로 앞선 프레임(κ-1)인, 직접 부분과 반향 부분을 포함하는 신호에서 반향을 추정하는 방법.
  9. 제 5항에 있어서, 상기 제 2 파라미터(β)는 바람직하게는 신호(y)와 그 파생 신호만을 사용하여 각 프레임(κ)에 대해 분리해서 결정되는, 직접 부분과 반향 부분을 포함하는 신호에서 반향을 추정하는 방법.
  10. 제 1항에 있어서, 상기 반향 부분(r)의 주파수 스펙트럼(R)의 추정치(
    Figure 112007004932177-PCT00063
    )를 사용하여 신호(y)의 반향을 억제하는(dereverberating) 단계를 더 포함하는, 직접 부분과 반향 부분을 포함하는 신호에서 반향을 추정하는 방법.
  11. 제 1항 내지 제 10항 중 어느 한 항에 기재된 방법을 실행하기 위한 컴퓨터 프로그램 제품.
  12. 직접 부분(d)과 반향 부분(r)을 포함하는 신호(y)에서 반향을 추정하는 디바 이스(1)로서,
    제 1 파라미터(α), 제 2 파라미터(β) 및 신호(y)의 주파수 스펙트럼(Y)을 사용하여, 상기 반향 부분(r)의 주파수 스펙트럼(R)의 추정치(
    Figure 112007004932177-PCT00064
    )를 제공하는 수단을 포함하며,
    여기서, 상기 제 1 파라미터(α)는 시간이 지남에 따른 상기 반향 부분(r)의 감쇠를 지시하며, 상기 제 2 파라미터(β)는 신호(y)의 상기 반향 부분(r)에 대한 상기 직접 부분(d)의 진폭을 지시하는, 직접 부분과 반향 부분을 포함하는 신호에서 반향을 추정하는 디바이스.
  13. 제 12항에 있어서, 상기 제 2 파라미터(β)는 신호(y)의 이른 신호-대-늦은 신호 비(ELR)에 반비례하는, 직접 부분과 반향 부분을 포함하는 신호에서 반향을 추정하는 디바이스.
  14. 제 12항에 있어서, 상기 반향 부분(r)의 주파수 스펙트럼(R)의 추정치(
    Figure 112007004932177-PCT00065
    )를 제공하는 수단(10)은 상기 반향 부분(r)의 주파수 스펙트럼(R)의 이전 추정치(
    Figure 112007004932177-PCT00066
    )를 사용하기 위해 배치되는, 직접 부분과 반향 부분을 포함하는 신호에서 반향을 추정하는 디바이스.
  15. 제 12항에 있어서, 상기 반향 부분(r)의 상기 주파수 스펙트럼(R)의 상기 추 정치(
    Figure 112007004932177-PCT00067
    )는 상기 제 1 파라미터(α)x주파수 스펙트럼(Y)의 이전 절대값-제 3 파라미터(
    Figure 112007004932177-PCT00068
    )x주파수 스펙트럼(Y)의 이전 절대값과 상기 반향 신호(r)의 주파수 스펙트럼(R)의 이전 추정치(
    Figure 112007004932177-PCT00069
    )의 차이이고, 상기 제 3 파라미터(
    Figure 112007004932177-PCT00070
    )는 상기 제 1 파라미터(α)-상기 제 2 파라미터(β)인, 직접 부분과 반향 부분을 포함하는 신호에서 반향을 추정하는 디바이스.
  16. 제 12항에 있어서,
    - 신호(y)의 시간-제한 세그먼트를 포함하는 프레임(κ)을 한정하고,
    - 각 프레임(κ)에 대해 신호(y)의 주파수 스펙트럼(Y)을 결정하기 위한 수단(20)을 더 포함하는, 직접 부분과 반향 부분을 포함하는 신호에서 반향을 추정하는 디바이스.
  17. 제 16항에 있어서, 프레임은 부분적으로 겹치는, 직접 부분과 반향 부분을 포함하는 신호에서 반향을 추정하는 디바이스.
  18. 제 16항에 있어서, 각 프레임(κ)에 대해, 이전 프레임의 주파수 스펙트럼(Y), 상기 제 1 파라미터(α), 상기 제 2 파라미터(β) 및 이전 프레임의 반향 부분(r)의 추정된 주파수 스펙트럼(
    Figure 112007004932177-PCT00071
    )을 사용하여 반향 부분(r)의 추정된 주파수 스펙트럼(
    Figure 112007004932177-PCT00072
    )을 제공하는 수단(10)을 더 포함하는, 직접 부분과 반향 부분을 포함하 는 신호에서 반향을 추정하는 디바이스.
  19. 제 18항에 있어서, 상기 이전 프레임은 바로 앞선 프레임(κ-1)인, 직접 부분과 반향 부분을 포함하는 신호에서 반향을 추정하는 디바이스.
  20. 제 12항에 있어서, 상기 제 2 파라미터(β)를 결정하기 위한 수단(40, 60)을 더 포함하는, 직접 부분과 반향 부분을 포함하는 신호에서 반향을 추정하는 디바이스.
  21. 제 20항에 있어서, 상기 제 2 파라미터(β)를 제공하기 위한 상기 수단(40, 60)은 바람직하게는 신호(y)와 그 파생 신호만을 사용하여 각 프레임(κ)에 대해 분리해서 상기 제 2 파라미터(β)를 결정하기 위해 배치되는, 직접 부분과 반향 부분을 포함하는 신호에서 반향을 추정하는 디바이스.
  22. 제 12항에 있어서, 상기 반향 부분(r)의 추정된 주파수 스펙트럼(
    Figure 112007004932177-PCT00073
    )과 이전 프레임의 주파수 스펙트럼(Y)을 사용하여 이득 인자(G(κB,m))를 결정하기 위한 수단(50)을 더 포함하는, 직접 부분과 반향 부분을 포함하는 신호에서 반향을 추정하는 디바이스.
  23. 제 12항에 있어서, 직접 신호(d)의 스펙트럼의 추정치(
    Figure 112007004932177-PCT00074
    )를 생성하기 위해 상기 이득 인자(G(κB,m)) 및 상기 주파수 스펙트럼(Y)을 곱하기 위한 수단(70)을 더 포함하는, 직접 부분과 반향 부분을 포함하는 신호에서 반향을 추정하는 디바이스.
  24. 제 12항에 있어서, 주파수 스펙트럼의 위상(φ)과 크기(ρ)를 분리하기 위한 수단(30) 및/또는 위상(φ)과 크기(ρ)를 사용하여 주파수 스펙트럼을 재구성하기 위한 재구성 수단(80)을 더 포함하는, 직접 부분과 반향 부분을 포함하는 신호에서 반향을 추정하는 디바이스.
  25. 제 12항에 있어서, 직접 신호(d)를, 직접 신호의 주파수 스펙트럼의 추정치(
    Figure 112007004932177-PCT00075
    )를 사용하여, 결정하기 위한 수단(90)을 더 포함하는, 직접 부분과 반향 부분을 포함하는 신호에서 반향을 추정하는 디바이스.
  26. 제 12항 내지 제 25항 중 어느 한 항에 기재된 디바이스(1)를 포함하는 오디오 처리 시스템(9).
  27. 음성 인식 시스템, 컨퍼런스 시스템, 또는 핸즈-프리 전화 시스템인 제 26항의 오디오 처리 시스템(9).
KR1020077001207A 2004-07-22 2005-07-18 오디오 신호 반향 억제 KR101149591B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP04103509 2004-07-22
EP04103509.8 2004-07-22
PCT/IB2005/052377 WO2006011104A1 (en) 2004-07-22 2005-07-18 Audio signal dereverberation

Publications (2)

Publication Number Publication Date
KR20070036777A true KR20070036777A (ko) 2007-04-03
KR101149591B1 KR101149591B1 (ko) 2012-05-29

Family

ID=34972925

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020077001207A KR101149591B1 (ko) 2004-07-22 2005-07-18 오디오 신호 반향 억제

Country Status (6)

Country Link
US (1) US8116471B2 (ko)
EP (1) EP1774517B1 (ko)
JP (1) JP5042823B2 (ko)
KR (1) KR101149591B1 (ko)
CN (1) CN1989550B (ko)
WO (1) WO2006011104A1 (ko)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8271277B2 (en) * 2006-03-03 2012-09-18 Nippon Telegraph And Telephone Corporation Dereverberation apparatus, dereverberation method, dereverberation program, and recording medium
EP1885154B1 (en) * 2006-08-01 2013-07-03 Nuance Communications, Inc. Dereverberation of microphone signals
US8036767B2 (en) * 2006-09-20 2011-10-11 Harman International Industries, Incorporated System for extracting and changing the reverberant content of an audio input signal
WO2008122930A1 (en) * 2007-04-04 2008-10-16 Koninklijke Philips Electronics N.V. Sound enhancement in closed spaces
EP2058804B1 (en) 2007-10-31 2016-12-14 Nuance Communications, Inc. Method for dereverberation of an acoustic signal and system thereof
JP4532576B2 (ja) * 2008-05-08 2010-08-25 トヨタ自動車株式会社 処理装置、音声認識装置、音声認識システム、音声認識方法、及び音声認識プログラム
JP5645419B2 (ja) * 2009-08-20 2014-12-24 三菱電機株式会社 残響除去装置
GB2490092B (en) * 2011-02-16 2018-04-11 Skype Processing audio signals
JP5654955B2 (ja) * 2011-07-01 2015-01-14 クラリオン株式会社 直接音抽出装置および残響音抽出装置
JP5751110B2 (ja) * 2011-09-22 2015-07-22 富士通株式会社 残響抑制装置および残響抑制方法並びに残響抑制プログラム
JP5898534B2 (ja) * 2012-03-12 2016-04-06 クラリオン株式会社 音響信号処理装置および音響信号処理方法
CN102750956B (zh) * 2012-06-18 2014-07-16 歌尔声学股份有限公司 一种单通道语音去混响的方法和装置
FR3009121B1 (fr) * 2013-07-23 2017-06-02 Arkamys Procede de suppression de la reverberation tardive d'un signal sonore
JP6299279B2 (ja) * 2014-02-27 2018-03-28 ヤマハ株式会社 音響処理装置および音響処理方法
CN103956170B (zh) * 2014-04-21 2016-12-07 华为技术有限公司 一种消除混响的方法、装置和设备
JP6371167B2 (ja) * 2014-09-03 2018-08-08 リオン株式会社 残響抑制装置
US10726855B2 (en) 2017-03-15 2020-07-28 Guardian Glass, Llc. Speech privacy system and/or associated method
US20180268840A1 (en) * 2017-03-15 2018-09-20 Guardian Glass, LLC Speech privacy system and/or associated method
CN110136733B (zh) * 2018-02-02 2021-05-25 腾讯科技(深圳)有限公司 一种音频信号的解混响方法和装置
CN113362841B (zh) * 2021-06-10 2023-05-02 北京小米移动软件有限公司 音频信号处理方法、装置和存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4796237A (en) * 1987-01-28 1989-01-03 Amoco Corporation Method for acoustic reverberation removal
US6622030B1 (en) * 2000-06-29 2003-09-16 Ericsson Inc. Echo suppression using adaptive gain based on residual echo energy
US20040213415A1 (en) * 2003-04-28 2004-10-28 Ratnam Rama Determining reverberation time
US7844059B2 (en) * 2005-03-16 2010-11-30 Microsoft Corporation Dereverberation of multi-channel audio streams
EP1885154B1 (en) * 2006-08-01 2013-07-03 Nuance Communications, Inc. Dereverberation of microphone signals

Also Published As

Publication number Publication date
US8116471B2 (en) 2012-02-14
EP1774517B1 (en) 2017-01-04
KR101149591B1 (ko) 2012-05-29
JP2008507720A (ja) 2008-03-13
US20080300869A1 (en) 2008-12-04
CN1989550A (zh) 2007-06-27
CN1989550B (zh) 2010-10-13
EP1774517A1 (en) 2007-04-18
WO2006011104A1 (en) 2006-02-02
JP5042823B2 (ja) 2012-10-03

Similar Documents

Publication Publication Date Title
KR101149591B1 (ko) 오디오 신호 반향 억제
US9414158B2 (en) Single-channel, binaural and multi-channel dereverberation
US8644496B2 (en) Echo suppressor, echo suppressing method, and computer readable storage medium
US6377637B1 (en) Sub-band exponential smoothing noise canceling system
US9509854B2 (en) Echo cancellation
CN111213359B (zh) 回声消除器和用于回声消除器的方法
US8472616B1 (en) Self calibration of envelope-based acoustic echo cancellation
JP4689269B2 (ja) 静的スペクトルパワー依存型音響強調システム
JP6019969B2 (ja) 音響処理装置
JP2007129736A (ja) 音声信号中の暗騒音を抑制する方法及び装置、並びに反響消去を伴う対応する装置
US11238882B2 (en) Dry sound and ambient sound separation
FI94564C (fi) Aktiivinen melunvaimennusjärjestelmä
EP2490218B1 (en) Method for interference suppression
EP1465159A1 (en) Virtual microphone array
US20050118956A1 (en) Audio enhancement system having a spectral power ratio dependent processor
JP2003250193A (ja) 反響消去方法、この方法を実施する装置、プログラムおよびその記録媒体
JP2010154356A (ja) ハウリング抑制装置
US20240121554A1 (en) Howling suppression device, howling suppression method, and non-transitory computer readable recording medium storing howling suppression program
JP4478045B2 (ja) エコー消去装置、エコー消去方法、エコー消去プログラムおよびその記録媒体
JP2010011272A (ja) 音響エコーキャンセラ
JP2015004959A (ja) 音響処理装置
Vashkevich et al. Speech enhancement in a smartphone-based hearing aid

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20150513

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20160510

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20170512

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20180509

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20190515

Year of fee payment: 8