KR20110109333A - 잡음 제거 장치 및 잡음 제거 방법 - Google Patents

잡음 제거 장치 및 잡음 제거 방법 Download PDF

Info

Publication number
KR20110109333A
KR20110109333A KR1020100029011A KR20100029011A KR20110109333A KR 20110109333 A KR20110109333 A KR 20110109333A KR 1020100029011 A KR1020100029011 A KR 1020100029011A KR 20100029011 A KR20100029011 A KR 20100029011A KR 20110109333 A KR20110109333 A KR 20110109333A
Authority
KR
South Korea
Prior art keywords
noise
signals
voice
received
signal
Prior art date
Application number
KR1020100029011A
Other languages
English (en)
Other versions
KR101077965B1 (ko
Inventor
정상배
이영재
김수환
Original Assignee
경상대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 경상대학교산학협력단 filed Critical 경상대학교산학협력단
Priority to KR1020100029011A priority Critical patent/KR101077965B1/ko
Publication of KR20110109333A publication Critical patent/KR20110109333A/ko
Application granted granted Critical
Publication of KR101077965B1 publication Critical patent/KR101077965B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K2210/00Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
    • G10K2210/30Means
    • G10K2210/301Computational
    • G10K2210/3028Filtering, e.g. Kalman filters or special analogue or digital filters

Abstract

본 발명은 잡음 제거 장치에 관한 것이다. 본 발명의 잡음 제거 장치는 공간 필터링부, 시간 필터링부, 그리고 모드 적응 제어기로 구성된다. 공간 필터링부는 복수의 채널들을 통해 음성 신호들을 수신하고, 수신된 음성 신호들에 기반하여 잡음이 감소된 음성 신호를 생성하고, 그리고 수신된 음성 신호들에 기반하여 복수의 채널들에 대응하는 복수의 잡음 신호들을 생성한다. 시간 필터링부는 복수의 잡음 신호들을 적응적 필터링하여 잡음이 감소된 음성 신호의 잡음 성분에 대응하는 잡음 성분 신호들을 생성하고, 그리고 생성된 잡음 성분 신호들을 이용하여 잡음이 감소된 음성 신호로부터 잡음 성분을 제거한다. 모드 적응 제어기는 수신된 음성 신호들 중 적어도 두 개의 신호들에 기반하여 적어도 두 개의 신호들의 잡음 구간들을 판별하고, 판별 결과에 기반하여 시간 필터링부의 상기 적응적 필터링의 필터링 계수의 학습 모드를 활성화 또는 비활성화 한다. 모드 적응 제어기는 적어도 두 개의 신호들의 특정 구간들이 잡음 구간들일 확률을 산출하고, 산출된 확률에 기반하여 잡음 구간들을 판별한다.

Description

잡음 제거 장치 및 잡음 제거 방법{NOISE REDUCTION DEVICE AND METHOD FOR REDUCING NOISE}
본 발명은 음성 신호의 잡음 제거 장치 및 잡음 제거 방법에 관한 것이다.
전자 장치는 사용자로부터 신호를 수신하는 다양한 사용자 인터페이스들을 제공한다. 예를 들면, 전자 장치는 키보드, 마우스, 버튼 등과 같은 사용자 인터페이스들을 제공한다. 기술이 발전하면서, 전자 장치에 제공되는 사용자 인터페이스는 더욱 다양해지고 있다. 예를 들면, 터치 패널, 인체 감응 센서 등과 같은 다양한 사용자 인터페이스가 전자 장치에 제공된다.
기술의 발전과 함께 새롭게 연구되고 있는 사용자 인터페이스 중 하나는 음성 인식 장치이다. 음성 인식 장치는 사용자의 음성으로부터 정보를 추출하여 사용한다.
통상적인 환경에서, 다양한 형태의 잡음들이 존재한다. 예를 들면, 자동차 소음, 전자 장치의 소음, 주변 사람의 음성, 방송 매체의 방송 등과 같은 다양한 잡음들이 통상적인 환경에 존재한다. 잡음이 존재하면, 음성 인식 장치의 음성 인식률이 저하된다. 음성 인식 장치의 음성 인식률을 향상시키기 위하여, 다양한 형태의 잡음 제거 장치 및 잡음 제거 방법들이 연구되고 있다.
본 발명의 목적은 향상된 동작 성능을 갖는 잡음 제거 장치 및 잡음 제거 방법을 제공하는 데에 있다.
본 발명의 실시 예에 따른 잡음 제거 장치는, 복수의 채널들을 통해 음성 신호들을 수신하고, 상기 수신된 음성 신호들에 기반하여 잡음이 감소된 음성 신호를 생성하고, 그리고 상기 수신된 음성 신호들에 기반하여 상기 복수의 채널들에 대응하는 복수의 잡음 신호들을 생성하도록 구성되는 공간 필터링부; 상기 복수의 잡음 신호들을 적응적 필터링하여 상기 잡음이 감소된 음성 신호의 잡음 성분에 대응하는 잡음 성분 신호들을 생성하고, 그리고 상기 생성된 잡음 성분 신호들을 이용하여 상기 잡음이 감소된 음성 신호로부터 잡음 성분을 제거하도록 구성되는 시간 필터링부; 그리고 상기 수신된 음성 신호들 중 적어도 두 개의 신호들에 기반하여 상기 적어도 두 개의 신호들의 잡음 구간들을 판별하고, 상기 판별 결과에 기반하여 상기 시간 필터링부의 상기 적응적 필터링의 필터링 계수의 학습 모드를 활성화 또는 비활성화 하도록 구성되는 모드 적응 제어기를 포함하고, 상기 모드 적응 제어기는 상기 적어도 두 개의 신호들의 특정 구간들이 상기 잡음 구간들일 확률을 산출하고, 상기 산출된 확률에 기반하여 상기 잡음 구간들을 판별하도록 구성된다.
실시 예로서, 상기 모드 적응 제어기는, 상기 적어도 두 개의 신호들의 선형 예측 잔차 신호를 산출하고, 상기 산출된 선형 예측 잔차 신호에 기반하여 상기 적어도 두 개의 신호들의 상호 상관도를 산출하고, 상기 산출된 상호 상관도에 기반하여 우도를 산출하고, 그리고 상기 산출된 우도에 기반하여 상기 잡음 구간들을 판별하도록 구성된다.
실시 예로서, 상기 모드 적응 제어기는 상기 산출된 우도가 미리 설정된 값 보다 큰 구간들을 상기 잡음 구간들로 판별하도록 구성된다.
실시 예로서, 상기 모드 적응 제어기는 상기 산출된 우도가 미리 설정된 값 보다 클 때 상기 학습 모드를 활성화하고, 그리고 상기 산출된 우도가 상기 미리 설정된 값 보다 작을 때 상기 학습 모드를 비활성화하도록 구성된다.
실시 예로서, 상기 수신된 음성 신호들의 음성 구간들을 판별하고, 상기 수신된 음성 신호들의 음성 구간 신호들 및 상기 수신된 신호들의 비음성 구간 신호들에 기반하여 상기 수신된 음성 신호들을 조절하도록 구성되는 채널 보상 필터를 더 포함한다.
실시 예로서, 상기 채널 보상 필터는 상기 음성 구간 신호들의 통계 및 상기 비음성 구간 신호들의 통계에 기반하여 상기 수신된 음성 신호들을 조절하도록 구성된다.
실시 예로서, 상기 채널 보상 필터는, 상기 수신된 음성 신호들 중 기준 채널에 대응하는 음성 구간 신호, 상기 수신된 음성 신호들 중 특정 채널에 대응하는 음성 구간 신호, 상기 기준 채널에 대응하는 비음성 구간 신호, 그리고 상기 특정 채널에 대응하는 비음성 구간 신호에 기반하여 상기 특정 채널을 통해 수신되는 신호를 조절하도록 구성된다.
실시 예로서, 상기 채널 보성 필터는 상기 복수의 채널들 사이의 차이로 인해 상기 수신된 음성 신호들에서 발생하는 차이를 보상하도록 구성된다.
실시 예로서, 상기 모드 적응 제어기는 상기 채널 보상 필터의 출력들 중 적어도 두 개의 출력들에 기반하여 상기 잡음 구간들을 판별하도록 구성된다.
본 발명의 실시 예에 따른 잡음 제거 방법은, 적어도 두 개의 채널들을 통해 음성 신호들을 수신하는 단계; 상기 수신된 음성 신호들에 기반하여, 상기 수신된 음성 신호들의 특정 구간들이 잡음 구간들일 확률을 산출하는 단계; 상기 산출된 확률에 기반하여, 상기 수신된 음성 신호들의 잡음 구간들을 판별하는 단계; 상기 수신된 음성 신호들의 잡음 성분을 적응적 필터링하는 단계; 그리고 상기 필터링 결과를 이용하여 상기 수신된 음성 신호들로부터 잡음 성분을 제거하는 단계를 포함하고, 상기 적응적 필터링 시의 필터링 계수의 학습 모드는 상기 판별된 잡음 구간들에서 활성화된다.
실시 예로서, 상기 수신된 음성 신호들의 잡음 구간들을 판별하는 단계는, 상기 수신된 음성 신호들의 선형 예측 잔차 신호를 산출하는 단계; 상기 산출된 선형 예측 잔차 신호에 기반하여 상호 상관도를 산출하는 단계; 상기 산출된 상호 상관도에 기반하여 우도를 산출하는 단계; 그리고 상기 산출된 우도에 기반하여 상기 수신된 음성 신호들의 잡음 구간들을 판별하는 단계를 포함한다.
실시 예로서, 상기 수신된 음성 신호들의 음성 구간들을 판별하는 단계; 그리고 상기 수신된 음성 신호들의 상기 판별된 음성 구간들 및 비음성 구간들에 기반하여, 상기 수신된 음성 신호들의 채널들의 특성에 따른 차이를 보상하는 단계를 더 포함하고; 상기 잡음 구간들은 상기 차이가 보상된 음성 신호들에 기반하여 판별된다.
본 발명에 의하면, 수신된 음성 신호들의 잡음 구간 확률에 기반하여 적응적 필터링의 학습 모드가 제어된다. 또한, 음성 신호의 음성 구간의 통계 및 잡음 구간의 통계에 따라 채널 특성이 보상된다. 따라서, 향상된 동작 성능을 갖는 잡음 제거 장치 및 잡음 제거 방법이 제공된다.
도 1은 본 발명의 실시 예에 따른 잡음 제거 장치를 보여주는 블록도이다.
도 2는 도 1의 음성 수신기의 출력 신호들을 보여주는 파형도이다.
도 3은 도 1의 확률적 모드 적응 제어기의 동작 방법을 보여주는 순서도이다.
도 4는 도 1의 채널 보상 필터의 동작 방법을 보여주는 순서도이다.
도 5는 도 1 내지 도 4를 참조하여 설명된 잡음 제거 장치의 실험 환경을 보여주는 블록도이다.
도 6은 도 5의 실험 환경에서 도 1의 잡음 제거 장치를 실험한 제 1 결과를 보여주는 테이블이다.
도 7은 도 5의 실험 환경에서 도 1의 잡음 제거 장치를 실험한 제 2 결과를 보여주는 테이블이다.
도 8은 도 1 내지 도 7을 참조하여 설명된 잡음 제거 장치를 포함하는 음성 인식 시스템을 보여주는 블록도이다.
도 9는 도 8의 음성 인식 시스템을 포함하는 컴퓨팅 시스템을 보여주는 블록도이다.
이하에서, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 정도로 상세히 설명하기 위하여, 본 발명의 실시 예를 첨부된 도면을 참조하여 설명하기로 한다.
도 1은 본 발명의 실시 예에 따른 잡음 제거 장치(100)를 보여주는 블록도이다. 도 1을 참조하면, 잡음 제거 장치(100)는 공간 필터링부(200), 시간 필터링부(300), 그리고 확률적 모드 적응 제어기(400)를 포함한다. 공간 필터링부(200)는 잡음 제거 장치(100)의 공간적 특성에 따라 잡음을 제거하도록 구성된다. 시간 필터링부(300)는 음성 신호의 시간적 특성에 따라 잡음을 제거하도록 구성된다.
공간 필터링부(200)는 음성 수신기(210), 채널 보상 필터(220), 고정 빔 형성기(230), 그리고 차단 매트릭스(240)를 포함한다.
음성 수신기(210)는 복수의 마이크들(MC1~MCN)을 포함한다. 음성 수신기(210)는 복수의 마이크들(MC1~MCN)을 통해 음성을 수신하여 제 1 내지 제 N 음성 신호들(x1(n)~xN(n))을 출력한다.
예시적으로, 음성 수신기(210)의 출력 신호들이 도 2에 도시되어 있다. 도 2에서, 가로 축은 시간을 나타내며, 세로 축은 각 채널별 진폭을 나타낸다. 예시적으로, 도 2에서, 제 1 내지 제 4 채널들(CH1~CH4)에 대응하는 음성 신호들이 도시되어 있다. 그러나, 음성 수신기(210)는 제 1 내지 제 4 채널들(CH1~CH4)에 대응하는 신호를 출력하는 것으로 한정되지 않는다. 예시적으로, 제 1 시간(t1) 내지 제 2 시간(t2) 동안 목표 음성이 수신되고, 나머지 시간 동안 잡음이 수신된다. 즉, 제 1 시간(t1) 내지 제 2 시간(t2)은 음성 구간이고, 나머지 시간은 잡음 구간이다.
다시 도 1을 참조하면, 음성 수신기(210)의 출력 신호들(x1(n)~xN(n))은 채널 보상 필터(220)로 전달된다.
채널 보상 필터(220)는 음성 수신기(210)로부터 음성 신호들(x1(n)~xN(n))을 수신한다. 채널 보상 필터(220)는 채널들 사이의 차이에 의해 음성 신호들(x1(n)~xN(n))에서 발생되는 차이들을 보상하도록 구성된다. 예시적으로, 특정 음성 소스로부터 음성 수신기(210)에 음성이 수신될 때, 음성 소스 및 마이크들(MC1~MCN) 사이의 거리 및 채널 환경은 상이하다. 상이한 거리 및 채널 환경에 따라, 음성 수신기(210)의 출력 신호들(x1(n)~xN(n)) 사이에 차이가 발생할 것이다.
채널 보상 필터(220)는 음성 소스 및 마이크들(MC1~MCN) 사이의 거리 및 채널 환경의 차이를 보상하도록 구성된다. 채널 보상 필터(220)는 음성 신호들(x1(n)~xN(n))을 조절하여 보상된 신호들(x'1(n)~x'N(n))을 출력한다. 보상된 신호들(x'1(n)~x'N(n))은 고정 빔 형성기(230) 및 차단 매트릭스(240)에 전달된다.
고정 빔 형성기(230)는 채널 보상 필터(220)로부터 보상된 신호들(x'1(n)~x'N(n))을 수신한다. 고정 빔 형성기(230)는 수신된 신호들(x'1(n)~x'N(n))에 기반하여 빔 포밍(beam foraming)을 수행하도록 구성된다. 예를 들면, 고정 빔 형성기(230)는 수신된 신호들(x'1(n)~x'N(n))에 기반하여 잡음이 감소된 신호(f(n))를 생성한다.
예를 들면, 고정 빔 형성기(230)는 수신된 신호들(x'1(n)~x'N(n)) 중 음성 구간 신호들의 위상을 보상하여 합산한다. 음성 소스 및 마이크들(MC1~MCN) 사이의 거리 및 채널의 차이로 인해, 수신된 신호들(x'1(n)~x'N(n))의 위상들은 상이할 것이다. 도 2에 도시된 바와 같이, 수신된 신호들(x'1(n)~x'N(n))의 제 1 시간(t1) 및 제 2 시간(t2) 사이의 구간들은 음성 구간이며, 나머지 구간들은 잡음 구간이다. 고정 빔 형성기(230)는 수신된 신호들(x'1(n)~x'N(n))의 음성 구간 신호들의 위상이 일치하도록 보상할 것이다. 위상이 보상된 신호들이 합산되면, 위상의 차이로 인해 잡음 성분 중 일부가 상쇄될 것이다. 따라서, 합산된 신호의 신호 대 잡음 비(SNR, Signal to Noise Ratio)는 입력 신호들(x'1(n)~x'N(n))의 SNR 보다 감소할 것이다. 잡음이 감소된 신호(f(n))는 시간 필터링부(300)에 전달된다.
차단 매트릭스(240)는 채널 보상 필터(220)로부터 보상된 신호들(x'1(n)~x'N(n))을 수신한다. 차단 매트릭스(240)는 수신된 신호들(x'1(n)~x'N(n))로부터 잡음 신호들(Z](n)~ZN(n))을 검출하여 출력하도록 구성된다. 예를 들면, 차단 매트릭스(240)는 수신된 신호들(x'1(n)~x'N(n)) 중 인접한 채널들에 대응하는 신호들을 차감하여 잡음 신호를 검출할 것이다. 인접한 채널들에 대응하는 신호들의 음성 성분들의 위상 차이는 인접하지 않은 채널들에 대응하는 신호들의 음성 성분들의 위상 차이보다 상대적으로 작다. 따라서, 인접한 채널들에 대응하는 신호들이 차감될 때, 음성 성분이 감소된다. 즉, 차감된 신호는 잡음 신호인 것으로 이해될 수 있다. 검출된 잡음 신호들(Z](n)~ZN(n))은 시간 필터링부(300)에 전달된다.
시간 필터링부(300)는 적응적 필터 회로(310) 및 합산기(320)를 포함한다.
적응적 필터 회로(310)는 제 1 내지 제 N 필터들(311~31N)을 포함한다. 제 1 내지 제 N 필터들(311~31N)은 공간 필터링부(200)의 차단 매트릭스(240)로부터 잡음 신호들(Z](n)~ZN(n))을 각각 수신한다. 제 1 내지 제 N 필터들(311~31N)은 수신된 잡음 신호들(Z](n)~ZN(n))을 필터링하도록 구성된다. 필터링된 신호들(Z'](n)~Z'N(n))은 잡음이 감소된 신호(f(n))의 잡음 성분에 대응한다. 이하에서, 적응적 필터링된 신호들(Z'](n)~Z'N(n))을 잡음 성분 신호들(Z'](n)~Z'N(n))이라 부르기로 한다. 잡음 성분 신호들(Z'](n)~Z'N(n))은 합산기(320)로 전달된다.
합산기(320)는 공간 필터링부(200)의 고정 빔 형성기(230)로부터 잡음이 감소된 신호(f(n))를 수신하고, 제 1 내지 제 N 필터들(311~31N)로부터 잡음 성분 신호들(Z'](n)~Z'N(n))을 수신한다. 합산기(320)는 잡음이 감소된 신호(f(n)) 및 잡음 성분 신호들(Z'](n)~Z'N(n))을 합산한다. 상술한 바와 같이, 잡음 성분 신호들(Z'](n)~Z'N(n))은 잡음이 감소된 신호(f(n))의 잡음 성분에 대응한다. 따라서, 잡음이 감소된 신호(f(n)) 및 잡음 성분 신호들(Z'](n)~Z'N(n))이 합산되면, 잡음이 제거된 신호(y(n))가 생성된다.
예시적으로, 제 1 내지 제 N 필터들(311~31N)은 잡음 신호들(Z](n)~ZN(n))을 적응적 필터링(adaptive filtering)하도록 구성된다. 그리고, 제 1 내지 제 N 필터들(311~31N)은 활성화 및 비활성화가 가능한 학습 모드를 갖는다. 학습 모드가 활성화될 때, 제 1 내지 제 N 필터들(311~31N)은 잡음이 제거된 신호(y(n))에 기반하여 필터링 계수를 조절하도록 구성된다. 예를 들면, 제 1 내지 제 N 필터들(311~31N)은 정규화된 최소 평균 제곱근(normalized Least Mean Square) 알고리즘에 기반하여 필터링 계수를 갱신하도록 구성된다. 예를 들면, 제 1 내지 제 N 필터들(311~31N)은 잡음이 제거된 신호(y(n)) 중 미리 설정된 시간 윈도우에 대응하는 신호에 기반하여 필터링 계수를 갱신하도록 구성된다.
학습 모드가 비활성화될 때, 제 1 내지 제 N 필터들(311~31N)은 필터링 계수를 유지하도록 구성된다.
제 1 내지 제 N 필터들(311~31N)의 학습 모드는 확률적 모드 적응 제어기(400)의 제어에 따라 활성화 또는 비활성화 된다.
확률적 모드 적응 제어기(400)는 공간 필터링부(200)로부터 적어도 두 개의 음성 신호들을 수신하도록 구성된다. 예를 들면, 확률적 모드 적응 제어기(400)는 공간 필터링부(200)의 채널 보상 필터(220)로부터 적어도 두 개의 보상된 신호들(x'i(n), x'j(n))을 수신하도록 구성된다. 수신된 신호들(x'i(n), x'j(n))에 기반하여, 확률적 모드 적응 제어기(400)는 수신된 신호들(x'i(n), x'j(n))의 잡음 구간을 판별하도록 구성된다. 확률적 모드 적응 제어기(400)는 판별 결과에 따라 제어 신호(CTRL)를 제어한다.
예를 들면, 잡음 구간으로 판별된 구간 동안, 확률적 모드 적응 제어기(400)는 제 1 내지 제 N 필터들(311~31N)의 학습 모드가 활성화되도록 제어 신호(CTRL)를 제어할 것이다. 비잡음 구간으로 판별된 구간 동안, 확률적 모드 적응 제어기(400)는 제 1 내지 제 N 필터들(311~31N)의 학습 모드가 비활성화 되도록 제어 신호(CTRL)를 제어할 것이다.
상술한 바와 같은 잡음 제거 장치(100)에서, 잡음 제거 동작 성능은 보상된 신호들(x'1(n)~x'N(n))의 잡음 구간을 판별하는 방법에 따라 변화한다. 예를 들면, 확률적 모드 적응 제어기(400)에 의해 판별된 잡음 구간 동안 제 1 내지 제 N 필터들(311~31N)의 학습 모드가 활성화 되므로, 확률적 모드 적응 제어기(400)에 의해 판별된 잡음 구간의 정확성이 잡음 제거 장치(100)의 동작 성능을 결정한다.
본 발명의 실시 예에 따른 잡음 제거 장치(100)의 확률적 모드 적응 제어기(400)는 보상된 신호들(x'1(n)~x'N(n))의 잡음 구간을 확률에 기반하여 판별하도록 구성된다. 예를 들면, 잡음 제거 장치(100)는 보상된 신호들(x'1(n)~ x'N(n)) 중 적어도 두 개의 신호들을 수신하고, 수신된 신호들의 잡음 구간의 확률을 산출한다. 확률적 모드 적응 제어기(400)는 산출된 확률에 기반하여 잡음 구간을 판별하도록 구성된다.
예시적으로, 확률적 모드 적응 제어기(400)는 수신된 신호들을 프레임 단위로 처리할 것이다. 예를 들면, 확률적 모드 적응 제어기(400)는 수신된 신호들의 특정 구간이 잡음 구간일 확률을 산출하고, 산출된 확률에 기반하여 특정 구간이 잡음 구간인지의 여부를 판별할 것이다.
도 3은 도 1의 확률적 모드 적응 제어기(400)의 동작 방법을 보여주는 순서도이다. 도 1 및 도 3을 참조하면, S110 단계에서, 확률적 모드 적응 제어기(400)는 미리 설정된 수의 채널 보상 필터(220)의 출력들을 수신한다. 예시적으로, 확률적 모드 적응 제어기(400)는 채널 보상 필터(220)의 출력들 중 제 i 채널에 대응하는 보상 신호(x'i(n)) 및 제 j 채널에 대응하는 보상 신호(x'j(n))을 수신할 것이다. 예시적으로, 제 i 채널 및 제 j 채널은 음성 수신기(210)의 마이크들(MC1~MCN) 중 미리 설정된 위치의 마이크들(MCi, MCj)에 대응할 것이다.
예시적으로, 확률적 모드 적응 제어기(400)는 채널 보상 필터(220)의 출력들 중 두 개를 수신하는 것으로 한정되지 않는다. 확률적 모드 적응 제어기(400)는 채널 보상 필터(220)의 출력들 중 적어도 두 개를 수신하도록 구성될 수 있다.
예시적으로, 확률적 모드 적응 제어기(400)는 채널 보상 필터(220)의 출력들을 수신하는 것으로 한정되지 않는다. 예를 들면, 확률적 모드 적응 제어기(400)는 음성 신호들(x1(n)~xN(n)) 중 적어도 두 개를 수신하도록 구성될 수 있다. 예를 들면, 잡음 제거 장치(100)에서 채널 보상 필터(220)가 제거되는 경우, 확률적 모드 적응 제어기(400)는 음성 신호들(x1(n)~xN(n)) 중 적어도 두 개를 수신하도록 구성될 것이다.
S120 단계에서, 확률적 모드 적응 제어기(400)는 수신된 출력들의 선형 예측 잔차 신호를 추정한다. 예를 들면, 확률적 모드 적응 제어기(400)는 수신된 출력들의 제 t 프레임의 선형 예측 잔차 신호를 추정할 것이다. 예시적으로, 제 i 채널에 대응하는 선형 예측 잔차 신호는 수학식 1에 기반하여 산출된다.
Figure pat00001
여기에서, ai(k)는 제 i 보상 신호(x'i(n))에서 추정한 선형 예측 계수이며, P는 선형 예측 차수이다.
예시적으로, ai(k)는 제 i 보상 신호(x'i(n))의 비정상 잡음 성분에 대응하는 계수이다. 즉, 수학식 1에서,
Figure pat00002
는 제 i 보상 신호(xi(n))의 비정상 잡음 성분에 대응한다. 예를 들면, 비정상 잡음 성분은 음성의 반사에 의한 잔향을 포함할 것이다. 즉, 선형 예측 잔차 신호(ei(n))는 제 i 보상 신호(x'i(n))로부터 비정상 잡음 성분을 제거된 정상 잡음 성분일 것이다.
확률적 모드 적응 제어기(400)는 제 i 및 제 j 보상 신호들(x'i(n), x'j(n))에 대응하는 제 i 및 제 j 선형 예측 잔차 신호들(ei(n), ej(n))을 각각 추정할 것이다. 확률적 모드 적응 제어기(400)가 적어도 두 개의 보상 신호들을 수신하는 경우, 확률적 모드 적응 제어기(400)는 적어도 두 개의 선형 예측 잔차 신호들을 추정할 것이다.
S130 단계에서, 확률적 모드 적응 제어기(400)는 추정된 제 i 및 제 j 선형 예측 잔차 신호들(ei(n), ej(n))에 기반하여 상호 상관도를 산출한다. 예시적으로, 확률적 모드 적응 제어기(400)는 제 t 프레임에 대응하는 상호 상관도를 산출할 것이다. 상호 상관도는 수학식 2에 기반하여 산출된다.
Figure pat00003
여기에서, ei ,t(n) 및 ej ,t(n) 은 제 t 프레임에 대응하는 제 i 및 제 j 선형 예측 잔차 신호들(ei(n), ej(n))을 각각 나타내고, L은 프레임 길이를 나타낸다.
산출된 상호 상관도(ct)는 제 i 및 제 j 채널에 대응하는 정상 잡음들 사이의 상호 관련도를 나타낼 것이다.
S140 단계에서, 확률적 모드 적응 제어기(400)는 산출된 상호 상관도(ct)에 기반하여 로그 우도를 산출한다. 예시적으로, 확률적 모드 적응 제어기(400)는 제 t 프레임에 대응하는 로그 우도를 산출할 것이다. 로그 우도는 수학식 3에 기반하여 산출된다.
Figure pat00004
여기에서, μnoise는 잡음구간 상호 상관도의 평균을 나타내고, σnoise는 잡음구간 상호 상관도의 표준편차를 나타낸다.
G는 수학식 4와 같이 표현된다.
Figure pat00005
예시적으로, 확률적 모드 적응 제어기(400)는 제 i 및 제 j 보상 신호들(x'i(t), x'j(t))의 초기 구간을 잡음 구간으로 간주하고, 잡음 구간의 상호 상관도의 평균(μnoise) 및 표준편차(σnoise)를 산출할 것이다. 그리고, 산출된 잡음 구간의 상호 상관도의 평균(μnoise) 및 표준편차(σnoise)에 기반하여, 로그 우도(LLt, 예를 들면, 정규분포)를 추정할 것이다. 로그 우도(LLt)는 제 t 프레임이 잡음 구간일 확률을 나타낸다.
S150 단계에서, 확률적 모드 적응 제어기(400)는 산출된 로그 우도(LLt)가 제 1 임계값보다 큰 지 판별한다. 산출된 로그 우도(LLt)가 제 1 임계값보다 크면, 확률적 모드 적응 제어기(400)는 제 t 프레임을 잡음 구간으로 판별한다. 이후에, 확률적 모드 적응 제어기(400)는 제 1 내지 제 N 필터들(311~31N)의 필터링 계수 학습 모드가 활성화되도록 제어 신호(CTRL)를 제어한다.
산출된 로그 우도(LLt)가 제 1 임계값보다 작으면, 확률적 모드 적응 제어기(400)는 제 t 프레임을 비잡음 구간, 즉 음성 구간으로 판별한다. 이후에, 확률적 모드 적응 제어기(400)는 제 1 내지 제 N 필터들(311~31N)의 필터링 계수 학습 모드가 비활성화되도록 제어 신호(CTRL)를 제어한다.
상술한 바와 같이, 확률적 모드 적응 제어기(400)는 특정 프레임이 잡음 구간일 확률에 기반하여 특정 프레임이 잡음 구간인지 비잡음 구간인지 판별한다. 따라서, 확률적 모드 적응 제어기(400)가 잡음 구간을 판별하는 정확도가 향상된다.
도 4는 도 1의 채널 보상 필터(220)의 동작 방법을 보여주는 순서도이다. 예시적으로, 채널 보상 필터(220)가 제 i 채널에 대응하는 필터링 계수를 획득하는 방법이 도시되어 있다. 도 1 및 도 4를 참조하면, S210 단계에서, 채널 보상 필터(220)는 제 i 채널 신호를 수신한다. 예를 들면, 채널 보상 필터(220)는 음성 수신부(210)로부터 제 i 음성 신호(xi(n))를 수신할 것이다. 예시적으로, 채널 보상 필터(220)는 수신된 제 i 음성 신호(xi(n))를 미리 설정된 구간 단위로 처리할 것이다.
S220 단계에서, 채널 보상 필터(220)는 수신된 제 i 음성 신호(xi(n))를 푸리에(Fourier) 변환한다. S220 단계가 수행되면, 수신된 제 i 음성 신호(xi(n))의 주파수 응답이 획득될 것이다. 예를 들면, 수신된 제 i 음성 신호(xi(n))의 특정 구간에 대응하는 주파수 응답이 획득될 것이다.
S230 단계에서, 채널 보상 필터(220)는 수신된 제 i 음성 신호(xi(n))의 특정 구간이 음성 구간인지 판별한다. 예시적으로, 채널 보상 필터(220)는 수신된 제 i 음성 신호(xi(n))의 특정 구간의 에너지에 기반하여 특정 구간이 음성 구간인지 판별할 것이다. 예를 들면, 채널 보상 필터(220)는 수신된 제 i 음성 신호(xi(n))의 특정 구간의 에너지가 제 2 임계값보다 클 때, 특정 구간을 음성 구간으로 판별할 것이다.
예를 들면, 채널 보상 필터(220)는 수신된 제 i 음성 신호(xi(n))의 초기 구간(예를 들면, 200msec)을 초기 잡음 구간으로 간주할 것이다. 특정 구간의 에너지가 초기 잡음 구간의 에너지보다 10dB 내지 20dB 크면, 채널 보상 필터(220)는 특정 구간을 음성 구간으로 판별할 것이다.
특정 구간이 음성 구간으로 판별되면, S240 단계에서 채널 보상 필터(220)는 수신된 제 i 음성 신호(xi(n))의 특정 구간의 주파수 응답을 이용하여 음성 통계를 산출한다. 예를 들면, 산출되는 음성 통계는 제 i 음성 신호(xi(n))가 수신되는 동안 누적될 것이다. 음성 통계는 수학식 5에 기반하여 산출될 것이다.
Figure pat00006
Figure pat00007
여기에서, Xi(k)는 제 i 음성 신호(xi(n))의 특정 구간의 주파수 응답이고, XR(k)는 기준 채널에 대응하는 음성 신호(xR(n))의 특정 구간의 주파수 응답이다. 예시적으로, 기준 채널은 음성 수신기(210)의 미리 설정된 위치의 마이크에 대응할 것이다.
특정 구간이 비음성 구간, 즉 잡음 구간으로 판별되면, S250 단계에서 채널 보상 필터(220)는 수신된 제 i 음성 신호(xi(n))의 특정 구간의 주파수 응답을 이용하여 잡음 통계를 산출한다. 예를 들면, 산출되는 잡음 통계는 제 i 음성 신호(xi(n))가 수신되는 동안 누적될 것이다. 잡음 통계는 수학식 6에 기반하여 산출될 것이다.
Figure pat00008
Figure pat00009
여기에서, Vi(k)는 제 i 음성 신호(xi(n))의 특정 구간의 주파수 응답이고, VR(k)는 기준 채널에 대응하는 음성 신호(xR(n))의 특정 구간의 주파수 응답이다.
S260 단계에서, 채널 보상 필터(220)는 제 i 음성 신호(xi(n))의 입력이 종료되는지 판별한다. 제 i 음성 신호(xi(n))의 입력이 종료되지 않으면, S210 단계에서, 채널 보상 필터(220)는 제 i 음성 신호(xi(n))의 다음 구간을 수신할 것이다. 제 i 음성 신호(xi(n))의 입력이 종료되면, S270 단계가 수행된다.
S270 단계에서, 채널 보상 필터(220)는 채널 보상 응답을 추정한다. 채널 보상 응답은 비용 함수에 기반하여 추정된다. 비용 함수는 수학식 7과 같이 정의된다.
Figure pat00010
여기에서, Ji는 제 i 음성 신호(xi(n))의 보상 응답을 판별하기 위한 비용 함수이고, DR(k)는 기준 채널에 대응하는 잡음 없는 음성 신호의 주파수 응답을 나타내고, Di(k)는 제 i 음성 신호(xi(n))의 잡음 없는 주파수 응답을 나타낸다. 그리고, wi(k)는 제 i 음성 신호(xi(n))를 보상하는 주파수 이득을 나타낸다.
기준 채널에 대응하는 신호의 크기 및 제 i 음성 신호(xi(n))의 크기의 차이가 최소화되도록 주파수 이득(wi(k))이 설정되면, 음성 수신기(210)의 마이크들(MC1~MCN)의 위치 차이로 인한 신호들의 차이는 보상될 것이다. 따라서, 제 i 음성 신호(xi(n))를 보상하는 최적화된 주파수 이득은 수학식 8과 같이 정의된다.
Figure pat00011
제 i 음성 신호(xi(n))는 잡음 없는 음성 신호 및 잡음 신호로 구성된다. 마찬가지로, 기준 채널에 대응하는 음성 신호(xR(n))는 잡음 없는 음성 신호 및 잡음 신호로 구성된다. 제 i 음성 신호(xi(n)) 및 기준 채널에 대응하는 음성 신호(xR(n))는 수학식 9와 같이 표현될 수 있다.
Figure pat00012
Figure pat00013
수학식 8 및 수학식 9를 결합하면, 최적화된 주파수 이득(
Figure pat00014
)은 수학식 10과 같이 정리될 수 있다.
Figure pat00015
즉, S240 단계에서 산출된 음성 통계들(V1, V2) 및 S250 단계에서 산출된 잡음 통계들(N1, N2)에 기반하여 최적화된 주파수 이득(
Figure pat00016
)이 산출된다.
S280 단계에서, 채널 보상 필터(220)는 산출된 최적 주파수 이득(
Figure pat00017
)을 역 푸리에(inverse Fourier) 변환한다. S290 단계에서, 채널 보상 필터(220)는 역 푸리에 변환의 결과를 제 i 채널에 대응하는 필터링 계수로 획득한다. 이후에, 획득된 필터링 계수에 기반하여, 제 i 음성 신호(xi(n))가 필터링될 것이다. 필터링된 결과는 보상된 제 i 음성 신호(x'i(n))로 출력될 것이다.
예시적으로, 채널 보상 필터(220)는 제 1 내지 제 N 음성 신호들(x1(n)~xN(n))에 대하여 도 4를 참조하여 설명된 필터링 계수 획득 방법을 수행할 것이다.
상술한 바와 같이, 채널 보상 필터(220)는 음성 통계 및 잡음 통계를 산출하고, 산출된 음성 및 잡음 통계들에 기반하여 최적화된 주파수 이득(
Figure pat00018
)을 획득한다. 따라서, 음성 수신기(210)의 마이크들(MC1~MCN)의 위치 차이로 인한 음성 신호들(x1(n)~xN(n))의 차이가 보상된다. 즉, 잡음 제거 장치(100)의 동작 성능이 향상된다.
도 5는 도 1 내지 도 4를 참조하여 설명된 잡음 제거 장치(100)의 실험 환경(500)을 보여주는 블록도이다. 도 5를 참조하면, 실험은 가로 6m 그리고 세로 5m의 공간(510)에서 실행되었다. 음성 수신기(210)는 8채널을 갖는 것으로 설정되었으며, 음성 수신기(210)는 실험 공간(510)의 하단 벽으로부터 1.5m 이격된 위치에 설치되었다. 음성 소스(520)는 음성 수신기(210)로부터 2m 이격된 위치에 설치되었다. 그리고, 잡음 소스(530)는 음성 수신기(210)와 2m 이격되며, 음성 소스(520) 및 음성 수신기(540)를 연결하는 축선과 45도의 각도를 갖는 위치에 설치되었다.
예시적으로, 데이터 표본화율은 16kHz로 설정되었고, 해상도는 16bit으로 설정되었다. 선형 예측 분석 차수(P)는 18로 설정되었고, 제 1 내지 제 N 필터들(311~31N) 각각의 길이는 127로 설정되었다. 제 1 내지 제 N 필터들(311~31N)의 학습 알고리즘은 정규화된 최소 평균 제곱근(normalized Least Mean Square) 알고리즘이 적용되었다. 제 1 내지 제 N 필터들(311~31N)의 학습률은 0.1로 설정되었다. 그리고, 잡음 구간을 판별하기 위한 로그 우도(LLt)의 제 1 임계값은 잡음 구간의 평균 로그 우도에서 10dB를 감한 값으로 설정되었다.
도 6은 도 5의 실험 환경(500)에서 도 1의 잡음 제거 장치(100)를 실험한 제 1 결과를 보여주는 테이블이다. 도 1, 도 5, 그리고 도 6을 참조하면, 입력 신호들(x1(n)~xN(n))의 신호대 잡음비(SNR, signal to noise ratio)를 -5dB, 0dB, 5dB, 10dB, 그리고 15dB로 변화하며 실험이 수행되었다.
변화하는 SNR을 갖는 입력 신호들(x1(n)~xN(n))에 기반하여, 잡음 섞인 입력에 따른 잡음 구간의 인식률, 고정 빔포밍 결과의 에너지 궤적을 이용한 잡음 구간의 인식률, 고정 빔포밍 결과와 GSC(Generalized Sidelibe Canceller) 출력간의 상호 상관도를 이용하는 방식에 따른 잡음 구간의 인식률, 그리고 본 발명에 따른 잡음 구간의 인식률이 도 6에 기재되어 있다.
도 6에 기재된 바와 같이, 기존의 방법들에 따른 잡음 구간의 인식률과 비교할 때, 본 발명에 따른 잡음 구간의 인식률이 더 높다. 특히, SNR이 낮은 열악한 환경에서, 본 발명에 따른 잡음 구간의 인식률이 기존의 방법들에 따른 잡음 구간의 인식률보다 월등한 것으로 나타난다.
도 7은 도 5의 실험 환경(500)에서 도 1의 잡음 제거 장치(100)를 실험한 제 2 결과를 보여주는 테이블이다. 도 1, 도 5, 그리고 도 7을 참조하면, 입력 신호들(x1(n)~xN(n))의 신호대 잡음비(SNR, signal to noise ratio)를 -5dB, 0dB, 5dB, 10dB, 그리고 15dB로 변화하며 실험이 수행되었다.
변화하는 SNR을 갖는 입력 신호들(x1(n)~xN(n))에 기반하여, 잡음 섞인 입력에 따른 출력 신호(y(n))의 SNR, 고정 빔포밍 결과의 에너지 궤적을 이용한 출력 신호(y(n))의 SNR, 고정 빔포밍 결과와 GSC(Generalized Sidelibe Canceller) 출력간의 상호 상관도를 이용하는 방식에 따른 출력 신호(y(n))의 SNR, 그리고 본 발명에 따른 출력 신호(y(n))의 SNR이 도 7에 기재되어 있다.
도 7에 기재된 바와 같이, 기존의 방법들에 따른 출력 신호(y(n))의 SNR과 비교할 때, 본 발명에 따른 출력 신호(y(n))의 SNR이 더 높다.
도 8은 도 1 내지 도 7을 참조하여 설명된 잡음 제거 장치(100)를 포함하는 음성 인식 시스템(1000)을 보여주는 블록도이다. 도 8을 참조하면, 음성 인식 시스템(1000)은 잡음 제거 장치(100) 및 음성 인식 장치(1100)를 포함한다.
잡음 제거 장치(100)는 도 1 내지 도 7을 참조하여 설명된 바와 같이 구성된다. 예를 들면, 잡음 제거 장치(100)는 음성 신호가 잡음 구간일 확률에 기반하여 음성 신호의 잡음 구간을 판별할 것이다. 그리고, 잡음 제거 장치(100)는 수신 신호의 음성 구간 신호의 통계 및 비음성 구간 신호의 통계에 기반하여 수신 신호를 필터링할 것이다. 잡음 제거 장치(100)의 출력 신호(y(n))는 음성 인식 장치(1100)로 전달된다.
음성 인식 장치(1100)는 잡음 제거 장치(100)로부터 출력 신호(y(n))를 수신한다. 음성 인식 장치(1100)는 수신된 출력 신호(y(n))에 기반하여 음성 인식 동작을 수행할 것이다.
도 6 및 도 7을 참조하여 설명된 바와 같이, 본 발명의 실시 예에 따른 잡음 제거 장치(100)는 기존의 잡음 제거 방법들보다 향상된 잡음 제거 성능을 제공한다. 따라서, 음성 인식 시스템(1000)의 음성 인식률이 향상될 것이다.
도 9는 도 8의 음성 인식 시스템(1000)을 포함하는 컴퓨팅 시스템(2000)을 보여주는 블록도이다. 도 9를 참조하면, 컴퓨팅 시스템(2000)은 시스템 버스(2100), 프로세서(2200), 메모리(2300), 대용량 저장장치(2400), 사용자 출력 인터페이스(2500), 그리고 음성 인식 시스템(1000)을 포함한다.
시스템 버스(2100)는 컴퓨팅 시스템(2000)의 구성 요소들 사이에 통신 채널을 제공한다.
프로세서(2200)는 컴퓨팅 시스템(2000)의 제반 동작을 제어하도록 구성된다. 예를 들면, 프로세서(2200)는 응용(Application) 및 운영체제(OS, Operating System)를 구동할 것이다.
메모리(2300)는 컴퓨팅 시스템(2000)의 동작 메모리, 버퍼 메모리, 또는 캐시 메모리로 이용될 것이다. 예를 들면, 메모리(2300)는 SRAM, DRAM, SDRAM 등과 같은 고속 메모리를 포함할 것이다.
대용량 저장장치(2400)는 컴퓨팅 시스템(2000)에 대용량 저장 수단을 제공한다. 예를 들면, 대용량 저장장치(2400)는 불휘발성 저장장치일 것이다. 예를 들면, 대용량 저장장치(2400)는 하드 디스크 드라이브(HDD, Hard Disk Drive), 반도체 드라이브(SSD, Solid State Drive), 또는 플래시 메모리, MRAM (magnetic RAM), FeRAM (Ferroelectric RAM), PRAM (Phase-change RAM), RRAM (Resistive RAM), PROM, EPROM, EEPROM 등과 같은 불휘발성 메모리를 포함할 것이다.
사용자 출력 인터페이스(2500)는 사용자에게 데이터를 전달하는 다양한 수단을 포함할 것이다. 예를 들면, 사용자 출력 인터페이스(2500)는 모니터, 프린터, 스피커, LED, 모터 등과 같은 다양한 장치를 포함할 것이다.
음성 인식 시스템(1000)은 컴퓨팅 시스템(2000)의 사용자 입력 인터페이스로 동작할 것이다. 예를 들면, 컴퓨팅 시스템(2000)은 음성 인식 시스템(1000)을 통해 사용자로부터 데이터를 수신할 것이다.
도 6 및 도 7을 참조하여 설명된 바와 같이, 본 발명의 실시 예에 따른 잡음 제거 장치(100)는 기존의 잡음 제거 방법들보다 향상된 잡음 제거 성능을 제공한다. 따라서, 컴퓨팅 시스템(2000)이 사용자로부터 데이터를 정상적으로 수신할 확률이 증가한다. 즉, 컴퓨팅 시스템(2000)의 신뢰도가 증가할 것이다.
예시적으로, 컴퓨팅 시스템(2000)은 음성 인식 시스템(1000) 이외의 다양한 사용자 입력 인터페이스(미도시)를 추가적으로 포함할 수 있다. 예를 들면, 컴퓨팅 시스템(2000)은 키보드, 마우스, 터치 패널, 카드 리더, 센서, 카메라 등과 같은 다양한 사용자 입력 인터페이스를 더 포함할 수 있다.
예시적으로, 컴퓨팅 시스템(2000)은 다른 컴퓨팅 시스템(미도시)과 통신할 수 있는 통신 모뎀을 추가적으로 포함할 수 있다. 예를 들면, 컴퓨팅 시스템(2000)은 ethernet, WiFi, WCDMA, CDMA 2000, Wibro, WiMAX 등과 같은 다양한 프로토콜을 제공하는 모뎀을 더 포함할 수 있다.
예시적으로, 컴퓨팅 시스템(2000)은 컴퓨터, UMPC (Ultra Mobile PC), 워크스테이션, 넷북(net-book), PDA (Personal Digital Assistants), 포터블(portable) 컴퓨터, 웹 타블렛(web tablet), 무선 전화기(wireless phone), 모바일 폰(mobile phone), 스마트폰(smart phone), e-북(e-book), PMP (portable multimedia player), 휴대용 게임기, 네비게이션(navigation) 장치, 블랙박스(black box), 디지털 카메라(digital camera), DMB (Digital Multimedia Broadcasting) 재생기, 디지털 음성 녹음기(digital audio recorder), 디지털 음성 재생기(digital audio player), 디지털 영상 녹화기(digital picture recorder), 디지털 영상 재생기(digital picture player), 디지털 동영상 녹화기(digital video recorder), 디지털 동영상 재생기(digital video player), 정보를 무선 환경에서 송수신할 수 있는 장치, 홈 네트워크를 구성하는 다양한 전자 장치들 중 하나, 컴퓨터 네트워크를 구성하는 다양한 전자 장치들 중 하나, 또는 텔레매틱스 네트워크를 구성하는 다양한 전자 장치들 중 하나로 제공될 수 있다.
본 발명의 상세한 설명에서는 구체적인 실시 예에 관하여 설명하였으나, 본 발명의 범위와 기술적 사상에서 벗어나지 않는 한도 내에서 여러 가지 변형이 가능하다. 그러므로 본 발명의 범위는 상술한 실시 예에 국한되어 정해져서는 안되며 후술하는 특허청구범위뿐만 아니라 이 발명의 특허청구범위와 균등한 것들에 의해 정해져야 한다.
100 : 잡음 제거 장치
200 : 공간 필터링부
220 : 채널 보상 필터
300 : 시간 필터링부
400 : 확률적 모드 적응 제어기
1000 : 음성 인식 시스템
2000 : 컴퓨팅 시스템

Claims (12)

  1. 복수의 채널들을 통해 음성 신호들을 수신하고, 상기 수신된 음성 신호들에 기반하여 잡음이 감소된 음성 신호를 생성하고, 그리고 상기 수신된 음성 신호들에 기반하여 상기 복수의 채널들에 대응하는 복수의 잡음 신호들을 생성하도록 구성되는 공간 필터링부;
    상기 복수의 잡음 신호들을 적응적 필터링하여 상기 잡음이 감소된 음성 신호의 잡음 성분에 대응하는 잡음 성분 신호들을 생성하고, 그리고 상기 생성된 잡음 성분 신호들을 이용하여 상기 잡음이 감소된 음성 신호로부터 잡음 성분을 제거하도록 구성되는 시간 필터링부; 그리고
    상기 수신된 음성 신호들 중 적어도 두 개의 신호들에 기반하여 상기 적어도 두 개의 신호들의 잡음 구간들을 판별하고, 상기 판별 결과에 기반하여 상기 시간 필터링부의 상기 적응적 필터링의 필터링 계수의 학습 모드를 활성화 또는 비활성화 하도록 구성되는 모드 적응 제어기를 포함하고,
    상기 모드 적응 제어기는 상기 적어도 두 개의 신호들의 특정 구간들이 상기 잡음 구간들일 확률을 산출하고, 상기 산출된 확률에 기반하여 상기 잡음 구간들을 판별하도록 구성되는 잡음 제거 장치.
  2. 제 1 항에 있어서,
    상기 모드 적응 제어기는
    상기 적어도 두 개의 신호들의 선형 예측 잔차 신호를 산출하고, 상기 산출된 선형 예측 잔차 신호에 기반하여 상기 적어도 두 개의 신호들의 상호 상관도를 산출하고, 상기 산출된 상호 상관도에 기반하여 우도를 산출하고, 그리고 상기 산출된 우도에 기반하여 상기 잡음 구간들을 판별하도록 구성되는 잡음 제거 장치.
  3. 제 2 항에 있어서,
    상기 모드 적응 제어기는 상기 산출된 우도가 미리 설정된 값 보다 큰 구간들을 상기 잡음 구간들로 판별하도록 구성되는 잡음 제거 장치.
  4. 제 2 항에 있어서,
    상기 모드 적응 제어기는 상기 산출된 우도가 미리 설정된 값 보다 클 때 상기 학습 모드를 활성화하고, 그리고 상기 산출된 우도가 상기 미리 설정된 값 보다 작을 때 상기 학습 모드를 비활성화하도록 구성되는 잡음 제거 장치.
  5. 제 1 항에 있어서,
    상기 수신된 음성 신호들의 음성 구간들을 판별하고, 상기 수신된 음성 신호들의 음성 구간 신호들 및 상기 수신된 신호들의 비음성 구간 신호들에 기반하여 상기 수신된 음성 신호들을 조절하도록 구성되는 채널 보상 필터를 더 포함하는 잡음 제거 장치.
  6. 제 5 항에 있어서,
    상기 채널 보상 필터는
    상기 음성 구간 신호들의 통계 및 상기 비음성 구간 신호들의 통계에 기반하여 상기 수신된 음성 신호들을 조절하도록 구성되는 잡음 제거 장치.
  7. 제 5 항에 있어서,
    상기 채널 보상 필터는
    상기 수신된 음성 신호들 중 기준 채널에 대응하는 음성 구간 신호, 상기 수신된 음성 신호들 중 특정 채널에 대응하는 음성 구간 신호, 상기 기준 채널에 대응하는 비음성 구간 신호, 그리고 상기 특정 채널에 대응하는 비음성 구간 신호에 기반하여 상기 특정 채널을 통해 수신되는 신호를 조절하도록 구성되는 잡음 제거 장치.
  8. 제 5 항에 있어서,
    상기 채널 보성 필터는 상기 복수의 채널들 사이의 차이로 인해 상기 수신된 음성 신호들에서 발생하는 차이를 보상하도록 구성되는 잡음 제거 장치.
  9. 제 5 항에 있어서,
    상기 모드 적응 제어기는
    상기 채널 보상 필터의 출력들 중 적어도 두 개의 출력들에 기반하여 상기 잡음 구간들을 판별하도록 구성되는 잡음 제거 장치.
  10. 적어도 두 개의 채널들을 통해 음성 신호들을 수신하는 단계;
    상기 수신된 음성 신호들에 기반하여, 상기 수신된 음성 신호들의 특정 구간들이 잡음 구간들일 확률을 산출하는 단계;
    상기 산출된 확률에 기반하여, 상기 수신된 음성 신호들의 잡음 구간들을 판별하는 단계;
    상기 수신된 음성 신호들의 잡음 성분을 적응적 필터링하는 단계; 그리고
    상기 필터링 결과를 이용하여 상기 수신된 음성 신호들로부터 잡음 성분을 제거하는 단계를 포함하고,
    상기 적응적 필터링 시의 필터링 계수의 학습 모드는 상기 판별된 잡음 구간들에서 활성화되는 잡음 제거 방법.
  11. 제 10 항에 있어서,
    상기 수신된 음성 신호들의 잡음 구간들을 판별하는 단계는
    상기 수신된 음성 신호들의 선형 예측 잔차 신호를 산출하는 단계;
    상기 산출된 선형 예측 잔차 신호에 기반하여 상호 상관도를 산출하는 단계;
    상기 산출된 상호 상관도에 기반하여 우도를 산출하는 단계; 그리고
    상기 산출된 우도에 기반하여 상기 수신된 음성 신호들의 잡음 구간들을 판별하는 단계를 포함하는 잡음 제거 방법.
  12. 제 10 항에 있어서,
    상기 수신된 음성 신호들의 음성 구간들을 판별하는 단계; 그리고
    상기 수신된 음성 신호들의 상기 판별된 음성 구간들 및 비음성 구간들에 기반하여, 상기 수신된 음성 신호들의 채널들의 특성에 따른 차이를 보상하는 단계를 더 포함하고;
    상기 잡음 구간들은 상기 차이가 보상된 음성 신호들에 기반하여 판별되는 잡음 제거 방법.
KR1020100029011A 2010-03-31 2010-03-31 잡음 제거 장치 및 잡음 제거 방법 KR101077965B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020100029011A KR101077965B1 (ko) 2010-03-31 2010-03-31 잡음 제거 장치 및 잡음 제거 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100029011A KR101077965B1 (ko) 2010-03-31 2010-03-31 잡음 제거 장치 및 잡음 제거 방법

Publications (2)

Publication Number Publication Date
KR20110109333A true KR20110109333A (ko) 2011-10-06
KR101077965B1 KR101077965B1 (ko) 2011-10-31

Family

ID=45026599

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100029011A KR101077965B1 (ko) 2010-03-31 2010-03-31 잡음 제거 장치 및 잡음 제거 방법

Country Status (1)

Country Link
KR (1) KR101077965B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018199367A1 (ko) * 2017-04-27 2018-11-01 경상대학교 산학협력단 스테레오 채널 잡음 제거 장치 및 방법
KR20210059388A (ko) * 2019-11-15 2021-05-25 주식회사 위스타 복수의 음원을 이용한 잡음 제거 방법 및 장치
KR102263135B1 (ko) * 2020-12-09 2021-06-09 주식회사 모빌린트 딥러닝 알고리즘을 이용한 소음 제거 방법 및 장치

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018199367A1 (ko) * 2017-04-27 2018-11-01 경상대학교 산학협력단 스테레오 채널 잡음 제거 장치 및 방법
KR20210059388A (ko) * 2019-11-15 2021-05-25 주식회사 위스타 복수의 음원을 이용한 잡음 제거 방법 및 장치
KR102263135B1 (ko) * 2020-12-09 2021-06-09 주식회사 모빌린트 딥러닝 알고리즘을 이용한 소음 제거 방법 및 장치
WO2022124452A1 (ko) * 2020-12-09 2022-06-16 주식회사 모빌린트 딥러닝 알고리즘을 이용한 소음 제거 방법 및 장치

Also Published As

Publication number Publication date
KR101077965B1 (ko) 2011-10-31

Similar Documents

Publication Publication Date Title
US10959018B1 (en) Method for autonomous loudspeaker room adaptation
US10446171B2 (en) Online dereverberation algorithm based on weighted prediction error for noisy time-varying environments
CN110556103B (zh) 音频信号处理方法、装置、系统、设备和存储介质
US10777214B1 (en) Method for efficient autonomous loudspeaker room adaptation
US10930298B2 (en) Multiple input multiple output (MIMO) audio signal processing for speech de-reverberation
US10123113B2 (en) Selective audio source enhancement
US8981994B2 (en) Processing signals
US10403300B2 (en) Spectral estimation of room acoustic parameters
US8238569B2 (en) Method, medium, and apparatus for extracting target sound from mixed sound
KR101210313B1 (ko) 음성 향상을 위해 마이크로폰 사이의 레벨 차이를 활용하는시스템 및 방법
US9031257B2 (en) Processing signals
CN111418012B (zh) 用于处理音频信号的方法和音频处理设备
US10598543B1 (en) Multi microphone wall detection and location estimation
US8014230B2 (en) Adaptive array control device, method and program, and adaptive array processing device, method and program using the same
US11483651B2 (en) Processing audio signals
US9842606B2 (en) Electronic device, method of cancelling acoustic echo thereof, and non-transitory computer readable medium
CN111868826B (zh) 一种回声消除中的自适应滤波方法、装置、设备及存储介质
KR101077965B1 (ko) 잡음 제거 장치 및 잡음 제거 방법
KR100940629B1 (ko) 잡음 제거 장치 및 방법
JP2010085733A (ja) 音声強調システム
US11264015B2 (en) Variable-time smoothing for steady state noise estimation
CN111246036A (zh) 一种回声估计方法和装置
CN116364087A (zh) 一种提高唤醒率的方法、系统、设备及存储介质
KR20230101846A (ko) 기계 학습 보조 공간 잡음 추정 및 억제
CN117202021A (zh) 一种音频信号处理方法、系统及电子设备

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140929

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20151026

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160927

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee