KR100875264B1 - 암묵신호분리를 위한 후처리 방법 - Google Patents

암묵신호분리를 위한 후처리 방법 Download PDF

Info

Publication number
KR100875264B1
KR100875264B1 KR1020060082355A KR20060082355A KR100875264B1 KR 100875264 B1 KR100875264 B1 KR 100875264B1 KR 1020060082355 A KR1020060082355 A KR 1020060082355A KR 20060082355 A KR20060082355 A KR 20060082355A KR 100875264 B1 KR100875264 B1 KR 100875264B1
Authority
KR
South Korea
Prior art keywords
signal
signals
estimated
post
present
Prior art date
Application number
KR1020060082355A
Other languages
English (en)
Other versions
KR20080019879A (ko
Inventor
김현태
박장식
Original Assignee
학교법인 동의학원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 학교법인 동의학원 filed Critical 학교법인 동의학원
Priority to KR1020060082355A priority Critical patent/KR100875264B1/ko
Publication of KR20080019879A publication Critical patent/KR20080019879A/ko
Application granted granted Critical
Publication of KR100875264B1 publication Critical patent/KR100875264B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

본 발명은 암묵신호분리에 관한 것으로, 특히 독립 성분 분석에 의하여 분리된 신호에 대하여 소정의 가중치를 적용하는 위너 필터를 이용한 파워 스펙트럼 가중필터링 기법을 후처리 기법으로 사용한 암묵신호분리를 위한 후처리 방법에 관한 것이다.
일반적으로, 독립성분 분석(ICA)를 이용한 암묵신호분리 방법은 반향이 존재하는 곳에서는 성능이 저하된다. 이러한 성능 저하는 간섭 신호의 반향에 의하여 야기된 잔류 크로스토크에 의하여 초래되는 것이 일반적이다. 본 발명에서 제안된 후처리 방법은 주파수 영역에서 위너 필터 기법을 사용하는 것을 특징으로 한다. 일반적으로, 음성 신호는 스펙트럼 영역에서 분산 특성을 가지기 때문에 각각의 신호 성분에 다른 가중치를 부여함으로써 위너 필터링을 적용할 수 있다. 본 발명에서는 음원부재확률 추정, 소거계수결정부, 간섭신호생성부의 처리를 위한 계산 없이 크로스 토크를 제거하여 계산량이 줄어들게 된다. 본 발명의 실험 결과에 의하면 제안된 후처리 방법은 종래의 주파수영역 독립성분분석에 비하여 신호 대 간섭비(signal-to-interference ratio)가 3dB 정도 개선된다.
암묵신호분리, 독립성분분석, 후처리, BSS, ICA,

Description

암묵신호분리를 위한 후처리 방법{Post-processing for Blind Signal Separation}
도 1은 폐쇄된 공간에서 마이크로폰으로 입력되는 음원의 입력 경로를 개략적으로 설명하는 도면이다.
도 2는 음원의 혼합 과정을 설명하는 도면이다.
도 3은 본 발명에서 제안하는 일실시예인 2입력 2출력 암묵신호 분리 시스템의 블록도이다.
도 4에 본 발명이 실시된 사무실의 개략적인 배치 평면도이다.
도 5의 (a)와 (b)는 종래의 일반적인 주파수 영역 독립 성분 분석(FDICA)을 수행한 경우의 분리된 출력 신호(Y1, Y2)에 관한 실험 데이타, (c)와 (d)는 상기 (a) 및 (b)에 대하여 본 발명에서 제안하는 후처리 방법(가중치 적용)을 적용하여 최종적으로 분리한 출력신호(Yw1, Yw2)에 관한 실험 데이타이다.
도 6은 생활 주변 환경하에서 기록된 음성 신호에 대한 종래 및 본 발명에 따른 신호 대 간섭비(SIR)의 평가 결과표이다.
본 발명은 암묵신호분리에 관한 것으로, 특히 독립 성분 분석에 의하여 분리된 신호에 대하여 소정의 가중치를 적용하는 위너 필터 기법을 후처리 기법으로 사용한 암묵신호분리를 위한 후처리 방법에 관한 것이다.
음성신호처리에 있어 음성신호와 잡음을 분리하는 것은 다양한 응용분야에서 중요한 기초 기술이다.
따라서, 다수개의 음원 정보가 혼합된 입력신호로부터 잡음을 분리하여 제거하기 위하여 다양한 방법들이 제안되고 있으며, 그 중에서 특히 입력신호의 통계적인 특성 등의 사전 정보를 알지 못하는 상황에서 잡음과 신호를 분리하는 블라인드 음원분리(BSS, blind source separation)에 대하여 많은 연구를 하고 있다. 즉, 암묵 신호 분리는 관측된 혼합 신호만을 가지고 원 소스 신호(original source signal: 예컨대 특정 음성 신호)를 추정하는 방법이다.
음성간의 통계적 특성이 독립적이라는 가정하에 여러 음원을 분리하는 방법은 잡음제거의 일반적 처리로 해석할 수 있다. 잡음의 분리는 여러 음원의 분리(source separation)의 특별한 상황이다.
상기 BSS는 음성신호처리는 물론이고 배열안테나신호처리, 원격회의에서 화자의 분리, 통신에서 다중경로분리 등의 다양한 분야에 응용될 수 있다.
Jutten과 Herault가 제안한 BSS알고리즘은 간단하게 선형혼합(linear mixture)된 신호에 대하여 신호를 분리할 수 있다고 밝혀진 이후 다양하게 연구되었다. Jutten과 Herault는 BSS를 시간영역에서 잡음과 신호를 분리하는 시간영역 BSS(TDBSS, time-domain BSS)알고리즘을 제안하였다.
그러나 TDBSS는 입력신호로부터 잡음이 제거된 신호를 얻기 위해서는 수천 탭를 처리하기 위한 메모리가 필요하고 따라서 계산량이 많아진다는 문제점이 있다.
그리고 신호와 잡음 분리하는 과정에 혼합되는 소스 신호(source signals)의 특성과 혼합방법에 따라서 BSS의 성능이 다르게 나타난다.
지연이 있는 신호가 혼합될 때 지연을 추정하여야만 신호의 분리가 용이하다. Bell과 Sejnowski 는 지연혼합된 신호를 분리하기 위하여 지연을 ICA(independent component analysis)를 이용하여 추정하는 방법을 제안하였다. 독립 성분 분석법(ICA: Independent Component Analysis)을 이용한 암묵신호 분리법는 입력 신호들이 선형 혼합(instantaneous mixtures)인 경우에 특히 효과적이다. 그러나 소스 신호가 음성인 경우에는 음성신호의 주기적인 특성 때문에 지연을 추정하는데 있어 초기값에 따라서 최적해로 수렴하지 못하는 문제가 있으며, 더욱이 잔향(reverberant environment)이 존재하는 경우, 독립 성분 분석법을 사용하면 암묵신호분리 성능이 크게 저하된다는 문제점이 있다.
특히, 최근의 연구에 의하면, 비록 소정 시스템이 간섭 신호(interference signal)로부터 직접음(direct sound)을 분리할 수 있어도, 임펄스 응답을 사용하는 독립 성분 분석법에 의하여 얻어진 분리 시스템은 그 반향들을 제거하기 어렵다고 알려져 있으며, 이것이 성능 저하의 주요 원인이다.
결과적으로 종래의 주파수 영역 독립 성분 분석법(Frequency Domain ICA: FDICA) 알고리즘은 성능 저하의 주요 원인인 반향을 제거하기에는 충분하지 않다는 문제점을 여전히 안고 있다.
이런 문제를 해결하기 위하여, 다양한 연구들이 진행되고 있다.
예컨대, 잔류 크로스토크 성분을 모델링하고 추정하기 위하여, 주파수 영역에서 NLMS 필터를 사용하여 BSS에 대한 후처리 방법이 그 중의 하나이다.
그러나, 이 또한 여전히 만족스럽지 못하다는 문제점을 안고 있다.
이에 대하여, 본 발명에서는 BSS에 의하여 얻은 출력 신호를 재정리(refine)하는 새로운 후처리 알고리즘을 제안한다.
본 발명에서는 스펙트럼 영역에서 위너 필터(Wiener Filter)를 사용하여 간섭 신호에 대한 목표 신호의 전력비에 가중치를 부여한다(음성 신호는 일반적으로 스펙트럼 영역에서 분산되어 분포되기 때문에 위너 필터링 기법(Wiener Filtering Technique)이 사용될 수 있다)
본 발명에서 제안하는 방법은, 간섭 전력 스펙트럼에 대한 목표 전력 스펙트럼의 비에 의하여, 상대적으로 더 큰 가중치를 스펙트럼 영역의 목표 성분에 부여하고 보다 작은 가중치를 스펙트럼 영역의 간섭 성분에 부여하는 것을 특징으로 한다.
또한, 본 발명은 반향 환경하에서 초래되는 암묵신호분리 약화 형상을 보상하는 후처리 방법을 제공하는 적을 목적으로 한다.
본 발명에서 제안하는 암묵신호분리를 위한 후처리 방법은 M 개의 음원 수신부 각각에 M 개의 소오스 신호가 혼합되어 입력되는 제 1 단계, 상기 M 개 음원 수신부 각각에 수신된 입력신호(xi)를 분리하여 상기 M 개의 소오스 신호에 일대일 대응하는 M 개의 제 1 추정 신호를 출력하는 제 2 단계, 상기 M 개의 제 1 추정 신호를 주파수 영역 독립 성분 분석 처리하여 상기 M 개의 제 1 추정 신호에 일대일 대응하는 M 개의 제 2 추정 신호를 출력하는 제 3 단계, 상기 M 개의 제 2 추정 신호 각각을 위너 필터를 변형한 파워 스펙트럼 가중 필터링 기법으로 처리하여 상기 M 개의 소오스 신호에 근접한 M 개의 제 3 추정 신호를 출력하는 제 4 단계를 포함하며 상기 제 4 단계에서는 다음 수학식
Figure 112008006954781-pat00015

( 여기서
Figure 112008006954781-pat00016
임)
에 의하여 간섭 신호에 대한 목표 신호의 전력비에 가중치를 부여하는 것을 특징으로 한다.
삭제
본 발명에 있어서, 상기 제 M 개의 제 2 추정 신호의 파워 스펙트럼 각각은 제 2 추정 신호 각각의 절대치를 k승하여 획득되며, 상기 k는 0보다 큰 유리수인 것을 특징으로 한다.
삭제
이하, 도면을 참조하여 본 발명의 바람직한 실시예에 대하여 구체적으로 설명하기로 한다.
도 1은 폐쇄된 공간에서 센서(예컨대, 마이크로폰)로 입력되는 음원(소스 신호)의 입력 경로를 개략적으로 설명하는 도면이다.
도시된 바와 같이, 센서(21, 22)로 입력되는 소스 신호(11, 12)는 각기 다른 시간 지연을 가지고 입력됨은 물론, 센서(21)에는 소스 신호(11) 이외에 소스 신호(12)도 함께 입력됨을 알 수 있다. 이는 센서(22)의 경우에도 마찬가지이다.
즉, 각 센서(21, 22)에는 소스 신호(11, 12)가 혼합되어 입력되고 있으며, 이하에서 각 센서(21, 22)에 혼합 입력된 소스 신호를 분리하여 각각 소스 신호(11, 12)에 근접한 추정 신호를 분리하는 방법을 단계적으로 설명하기로 한다. 참고로, 도 1에서는 2 개의 소스 신호에 대하여 도시하고 있으나 아래에서는 다수개의 소스 신호로 일반화하여 설명하기로 한다.
이하에서는 주파수영역 독립성분 분석(FDICA:Frequency Domain ICA)를 이용한 나선 혼합(convolutive mixture)의 암묵 신호 분리에 대하여 설명하기로 한다.
먼저, 소스 신호(source signal)을 si(t) (1≤i≤N), j번째 센서인 마이크로폰을 통하여 관측된 신호를 xj(t) (1≤j≤M), 각 센서로부터 분리된 신호(즉, 출력 신호)를 yi(t) (1≤i≤N)라고 하면, 암묵신호 분리 모델은 다음과 같은 식으로 일반적으로 표현된다.
Figure 112006062410610-pat00001
Figure 112006062410610-pat00002
여기서, hji는 i번째 음원으로부터 j번째 센서인 마이크로폰까지의 임펄스 응답이며, wji는 분리 시스템이 FIR 필터를 사용한다고 가정하였을 때의 계수이며, *는 콘보루션 연산자이다. 문제를 간단히 하기 위하여, 순서(permutation) 문제는 해결되었다고 가정하고, i번째 출력 신호는 yi(t)라고 한다.
일반적으로, 시간 영역에서의 나선 혼합은 주파수 영역에서의 선형 혼합에 해당한다. 따라서, 반향이 존재하는 환경에서 암묵신호의 문제를 해결하기 위하여 주파수 영역에서 일반 ICA를 적용할 수 있을 것이다. 단구간 이산 퓨리어변환(short time discrete Fourier transform)을 식 (1)에 적용하여 주파수 영역으로 변화시키면 다음과 같은 식을 얻을 수 있다.
Figure 112006062410610-pat00003
또한, 소스 신호를 분리하는 식 (2)의 분리 과정은 각 주파수 빈(frequency bin)마다 다음 식과 같이 공식화 할 수 있다.
Figure 112006062410610-pat00004
여기서, Y(ω,n)=[Y1(ω,n),..., YL(ω,n)]T은 추정된 신호 벡터이고, W(ω)는 분리 행렬을 나타낸다. 소정 독립 음원들의 선형 혼합으로 가정되는 각 n 프레임의 주파수 영역에서 관측된 바와 같이 X(ω,n)이 주어지는 경우, W(ω)이 결정되어 Yi(ω,n)과 Yj(ω,n)은 상호 독립적으로 된다.
본 발명에서는 Amari에 의하여 제안된 FDICA 알고리즘을 사용하여 소스 신호 분리 작업을 실시한다. 참고로, 본 명세서에서는 표기의 단순화를 위하여, 혼동되지 않는 범위 내에서 ω 또는 n은 무시되어 표시되기도 한다.
혼합 시스템과 분리 시스템의 결합(concatenation)을 G로 표시하는 경우, 즉 G=WH로 표시하는 경우, 암묵신호 분리에 의하여 얻어진 분리된 신호 Yi 각각은 다음과 같이 표시된다.
Figure 112006062410610-pat00005
Yi를 신호 Si로부터의 직접 성분인 Yi (S)와 다른 신호Sj로부터의 크로스토크 성분 Yj (S)의 합으로 분해하면 다음과 같다(단 j≠i).
Figure 112006062410610-pat00006
직접 경로(straight path)와 크로스 경로(cross path)는 도 2에 도시되어 있다. 도 2에서, 신호(Y1)를 목표 신호라고 가정할 때, 실선은 직접 경로를 나타내고, 점선은 크로스 경로를 나타낸다.
식 (6)에서 알 수 있듯이, 소스 신호에 대하여 일대일 대응하도록 각기 분리된 신호(Yi)에는 다른 소스 신호에 의하여 영향을 받은 크로스토크 성분이 존재함을 알 수 있다.
본 발명은 최종 목적은 크로스토크(crosstalk) 성분 Yi (C)를 억제함과 동시에 직접 성분 Yi (S)를 보존하는 후처리 분리 방법(즉, 후처리 방법)에 관한 것인 바, 이하에서는 이에 대하여 구체적으로 설명하기로 한다.
본 발명에서 제안하는 후처리 방법은 위너 필터 기법을 적용하는 것에 관한 것이다.
전술한 바와 같이, 독립 성분 분석(ICA)를 이용한 암묵신호분리의 성능은 반향 환경하에서 크게 저하된다. 다시 말하면, 이는 식 6에서 크로스토크 신호가 어느 정도 영향을 미친다는 것을 의미한다.
본 발명에서는 식 6의 크로스토크 신호 성분을 억제하기 위하여 식 6에서 출력되는 신호 성분 각각에 대하여 각기 다른 소정의 가중치를 적용하는 방식을 취하고자 한다.
예컨대, 신호 Y1(ω)에 대하여 식 7과 같은 가중치가 할당되었으며, 신호 Y2(ω)에 대하여는 식 8과 가중치가 할당되었다.(도 3 참조)
Figure 112006062410610-pat00007
Figure 112006062410610-pat00008
식 7에서, 만약 Y1(ω)의 성분이 지배적이고, Y2(ω)의 성분이 약하다면, 목표 성분은 감쇠가 거의 없는 상태로 보존될 수 있다(즉, 가중치가 1에 근접할수록 소스 신호에 근접하게 될 것이다). 반면에, 만약 Y2(ω)의 성분이 지배적이고, Y1(ω)의 성분이 약하다면, 식 7의 가중치에 의하여 잔존 크로스토크 성분이 급격하게 감소하게 된다.
마찬가지로, 식 8의 경우도 식 7의 경우와 동일한 방식으로 해석될 것이다. 다시 말하면, 만약 Y2(ω)의 성분이 지배적이고, Y1(ω)의 성분이 약하다면, 목표 성분은 감쇠가 거의 없는 상태로 보존될 수 있다. 반면에, 만약 Y1(ω)의 성분이 지배적이고, Y2(ω)의 성분이 약하다면, 식 8의 가중치에 의하여 잔존 크로스토크 성분이 급격하게 감소하게 된다.
식 7과 8에서 Y1(ω)와 Y2(ω) 각각의 파워 스펙트럼은 독립성분분석 결과치의 절대치에 대하여 제곱을 하였으나, 이는 일예에 불과하며, 제곱 대신에 0 보다 큰 유리수를 승수로 사용하는 것도 가능한데, 이는 시스템을 어떻게 구현하는냐에 따라 달라지기 때문이다.
전술한 식 7과 8은 음원이 2 개이고 최종적으로 분리되는 음원이 2개인 경우에 대하여 설명하였으나, 이는 음원이 M개이고, 최종 분리되어 추정되는 신호도 M개인 경우에 동일하게 성립한다. 즉, 일반화가 가능하다.
다시 표현하면, 위너 필터링 기법의 적용시, M 개의 최종 추정 신호(도 3의 Φ(ω) 박스의 출력신호)중 i 번째 최종 추정 신호의 절대치는, {(상기 M 개의 직전 추정 신호(도 3의 FEICA 박스의 출력신호)중 i번째 직전 추정 신호의 파워 스펙트럼)/(상기 M 개의 직전 추정 신호 각각의 파워 스펙트럼의 합계)}×(i번째 직전 추정 신호의 절대치)와 같이 계산된다. 여기서, i는 1≤i≤M이다.
전술한 바와 같이, 상기 제 M 개의 직전 추정 신호의 파워 스펙트럼 각각은 직전 추정 신호 각각의 절대치를 k승하여 획득되며, 상기 k는 0보다 큰 유리수이다.
참고로, 본 발명의 후처리 기법이 가능한 것은 음성 신호는 스펙트럼 영역에서 분산되어 분포되는 것이 일반적이기 때문이다.
도 3에는 본 발명에서 제안하는 2입력 2출력 암묵신호 분리 시스템의 블록도가 도시되어 있다.
한편, 본 발명에서 제안하는 방법의 효용성을 실험하기 위하여, 본 연구진은 가구가 배치된 일반 사무실에서 기록된 음성 신호를 사용하여 2입력 2출력 시스템에 대하여 실험을 하였다.
도 4에는 본 발명이 실시된 사무실의 배치도가 개략적으로 도시되어 있다.
본 발명의 실시에 있어서는 3명의 남성과 3명의 여성에 의하여 발음된 6문장을 소스 신호(source signal)로 사용하였다.
음성 분리 작업은 Amari의 FDICA 알고리즘으로 수행하였다.
각 음성 신호는 16kHz 샘플링율에서 8초 길이로 기록되었다.
본 발명의 경우, 단구간(short time) DFT의 프레임 길이는 1024탭, 프레임 쉬프트(frame shift)는 64탭, 윈도우 함수는 해밍 윈도우(Hamming window), FDICA에서의 사건의 수(the number of epoch)의 수는 30, 스텝사이즈는 1×10- 4 로 설정한 경우에 가장 바람직한 분리 성능을 얻을 수 있었다. NLMS 후처리 기법에 있어서, NLMS의 필터 길이는 16탭으로 설정하였으며, 스무딩 계수(p)는 0.998이다.
본 연구진은 "Dactron" 회사에서 제작한 "RT Pro Dynamic Signal Analysis"를 기록 시스템으로 사용하였다.
음성에 대하여 바람직한 튜닝(tuning) 결과를 얻기 위해서, 상기 기록 시스템은 0.3V를 최대 범위(maximum range)로 설정하였다.
실험 결과는 신호 대 간섭비(Signal to Interference ratio: SIR)로 비교되었다. 상기 신호 대 간섭비는 출력에서의 간섭 전력에 대한 목표 신호의 전력의 비로 나타내었다.
도 5의 (a)와 (b)는 종래의 일반적인 주파수 영역 독립 성분 분석(FDICA)을 수행한 경우의 분리된 출력 신호(Y1, Y2)에 관한 도면이고, 도 5의 (c)와 (d)는 상기 (a) 및 (b)에 대하여 본 발명에서 제안하는 후처리 방법(가중치 적용)을 적용하여 최종적으로 분리한 출력신호(YW1, YW2)에 관한 도면이다.
도 5에서, (a)의 타원 영역은 소스 신호(s2)의 영향을 받은 것을 의미하고, (b)의 타원 영역은 소스 신호(s1)의 영향을 받은 것을 의미한다(즉, 크로스토크 성분의 발현을 의미한다). 이들에 대한 후처리 결과, 도 5의 (c)와 (d)에서 알 수 있듯이, 크로스토크 성분이 상당 부분 감소하여 소스 신호에 근접할 수 있게 됨을 알 수 있다. 즉, 도 5의 (c)와 (d)에 표시된 타원 여역으로부터 알 수 있듯이, 서로 다른 소스 신호에 의한 간섭 성분이 상당히 감소하였음을 인지할 수 있다.
참고로, 도 5는 2입력 2출력 BSS 시스템의 협밴드(narrow band) 스펙트럼(1024 개의 주파수 빈 중에서 144번째 주파수 빈)의 일예로서, 나머지의 경우도 이와 유사한 패턴을 보인다.
도 6에는 생활 주변 환경하에서 기록된 음성 신호에 대한 SIR의 평가 결과가 도시되어 있다.
도 6에서, Y는 종래의 FDCIA에 의한 신호 대 간섭비를 , Ypp(ω)는 본 발명에서 제안한 후처리 방법 적용후의 신호 대 간섭비, Ypp(NLMS)는 NLMS 후처리 기법에 의한 신호 대 간섭비를 각각 데시벨로 표시한 것이다.
도 6를 참조하면, 본 발명에서는 3명의 남성과 3명의 여성으로 이루어진 화자들을 12조합으로 구성하여 이들 각 조합으로부터의 발음에 대한 SIR를 측정하였다.
도 6에서 알 수 있듯이, 본 발명에서 제안한 방법에 의한 SIR는 종래의 FDCIA과 비교하여 대략 3~5dB 정도 개선되었음을 알 수 있다.
또한, 본 발명에서 제안한 방법은 NLMS 후처리 알고리즘에 비하여 대략 1~2dB 정도 개선됨을 알 수 있다.
표 1에는 본 발명에서 제안하는 방법과 NLMS 후처리 기법간의 비교 결과가 표시되어 있다. 표 1에서, "L"은 NLMS의 필터 길이를 나타낸다.
표 1은 각 주파수 빈에서의 곱셈 및 가산 연산을 나타낸다. 본 발명에서 제안한 방법은 가산 연산의 복잡성은 변하지 않으나, NLMS 후처리 방법의 필터 길이(L)가 긴 경우, 곱셈 연산의 부담을 덜 수 있다.
곱셈 덧셈
NLMS 후처리 기법 3L+2 2
본 발명의 후처리 기법 4 2
본 발명에서는 L을 16으로 설정하였기 때문에 제안된 방법을 사용하는 경우 은 곱셈 연산을 상당히 감소시킬 수 있다.
알려진 바와 같이, FDICA에 있어서의 암묵 신호 분리의 성능은 반향 환경하에서 크게 저하된다.
이에 본 발명에서는 위너 필터링 기법을 이용한 후처리 방법을 제안하여 FDICA의 출력을 재정리(refine)하는 방식을 설명하였다.
위에서 살펴 본 같이, 본 발명에서 제안된 방법은 일반적인 FDICA 또는 NLMS 후처리 기법과의 비교시 상대적으로 우수한 분리 특성을 가짐을 알 수 있다.
또한, 실험 결과로부터 알 수 있듯이, 본 발명에서 제안된 방법은 과도한 측정 부담없이도 SIR에서의 분리도를 개선시킬 수 있는 이점도 있다.

Claims (3)

  1. M 개의 음원 수신부 각각에 M 개의 소오스 신호가 혼합되어 입력되는 제 1 단계;
    상기 M 개 음원 수신부 각각에 수신된 입력신호(xi)를 분리하여 상기 M 개의 소오스 신호에 일대일 대응하는 M 개의 제 1 추정 신호를 출력하는 제 2 단계;
    상기 M 개의 제 1 추정 신호를 주파수 영역 독립 성분 분석 처리하여 상기 M 개의 제 1 추정 신호에 일대일 대응하는 M 개의 제 2 추정 신호를 출력하는 제 3 단계;
    상기 M 개의 제 2 추정 신호 각각을 위너 필터를 변형한 파워 스펙트럼 가중 필터링 기법으로 처리하여 상기 M 개의 소오스 신호에 근접한 M 개의 제 3 추정 신호를 출력하는 제 4 단계를 포함하며;
    상기 제 4 단계에서는 다음 수학식
    Figure 112008006954781-pat00017
    ( 여기서
    Figure 112008006954781-pat00018
    임)
    에 의하여 간섭 신호에 대한 목표 신호의 전력비에 가중치를 부여하는 것을 특징으로 하는 암묵신호분리를 위한 후처리 방법.
  2. 제 1 항에 있어서, 상기 제 4 단계에서의 상기 파워 스펙트럼 가중 필터링 기법의 적용시,
    상기 M 개의 제 3 추정 신호중 i 번째 제 3 추정 신호의 절대치는
    {(상기 M 개의 제 2 추정 신호중 i번째 제 2 추정 신호의 파워 스펙트럼)/(상기 M 개의 제 2 추정 신호 각각의 파워 스펙트럼의 합계)}×(i번째 제 2 추정 신호의 절대치)이고, 여기서 i는 1≤i≤M이며,
    상기 M 개의 제 3 추정 신호 각각은,
    상기 M 개의 제 3 추정 신호 각각의 절대치에 상기 M 개의 제 2 추정 신호 각각의 위상을 일대일 대응시켜 얻어지는 것을 특징으로 하는 암묵신호분리를 위한 후처리 방법.
  3. 제 2 항에 있어서,
    상기 제 M 개의 제 2 추정 신호의 파워 스펙트럼 각각은 제 2 추정 신호 각각의 절대치를 k승하여 획득되며, 상기 k는 0보다 큰 유리수인 것을 특징으로 하는 암묵신호분리를 위한 후처리 방법.
KR1020060082355A 2006-08-29 2006-08-29 암묵신호분리를 위한 후처리 방법 KR100875264B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020060082355A KR100875264B1 (ko) 2006-08-29 2006-08-29 암묵신호분리를 위한 후처리 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020060082355A KR100875264B1 (ko) 2006-08-29 2006-08-29 암묵신호분리를 위한 후처리 방법

Publications (2)

Publication Number Publication Date
KR20080019879A KR20080019879A (ko) 2008-03-05
KR100875264B1 true KR100875264B1 (ko) 2008-12-22

Family

ID=39394984

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060082355A KR100875264B1 (ko) 2006-08-29 2006-08-29 암묵신호분리를 위한 후처리 방법

Country Status (1)

Country Link
KR (1) KR100875264B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103903631A (zh) * 2014-03-28 2014-07-02 哈尔滨工程大学 基于变步长自然梯度算法的语音信号盲分离方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101280253B1 (ko) 2008-12-22 2013-07-05 한국전자통신연구원 음원 분리 방법 및 그 장치

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5675659A (en) 1995-12-12 1997-10-07 Motorola Methods and apparatus for blind separation of delayed and filtered sources
JP2002204175A (ja) 2000-12-28 2002-07-19 Nec Corp ノイズ除去の方法及び装置
WO2004053839A1 (en) 2002-12-11 2004-06-24 Softmax, Inc. System and method for speech processing using independent component analysis under stability constraints

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5675659A (en) 1995-12-12 1997-10-07 Motorola Methods and apparatus for blind separation of delayed and filtered sources
JP2002204175A (ja) 2000-12-28 2002-07-19 Nec Corp ノイズ除去の方法及び装置
WO2004053839A1 (en) 2002-12-11 2004-06-24 Softmax, Inc. System and method for speech processing using independent component analysis under stability constraints

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103903631A (zh) * 2014-03-28 2014-07-02 哈尔滨工程大学 基于变步长自然梯度算法的语音信号盲分离方法

Also Published As

Publication number Publication date
KR20080019879A (ko) 2008-03-05

Similar Documents

Publication Publication Date Title
CN106782590B (zh) 基于混响环境下麦克风阵列波束形成方法
US9818424B2 (en) Method and apparatus for suppression of unwanted audio signals
US20040264610A1 (en) Interference cancelling method and system for multisensor antenna
Avendano Acoustic echo suppression in the STFT domain
CN111213359B (zh) 回声消除器和用于回声消除器的方法
EP1190417A1 (en) Cancellation of non-stationary interfering signals for speech recognition
EP1995722B1 (en) Method for processing an acoustic input signal to provide an output signal with reduced noise
CN101958122A (zh) 一种回声消除的方法和装置
Mahmoudi et al. Combined Wiener and coherence filtering in wavelet domain for microphone array speech enhancement
KR100875264B1 (ko) 암묵신호분리를 위한 후처리 방법
Roman et al. Binaural sound segregation for multisource reverberant environments
CN111968659B (zh) 一种基于优化imcra的麦克风阵列语音增强方法
Kawamura et al. A noise reduction method based on linear prediction analysis
Shamsa et al. Noise reduction using multi-channel FIR warped Wiener filter
Miyazaki et al. Theoretical analysis of parametric blind spatial subtraction array and its application to speech recognition performance prediction
Daqrouq et al. Speech signal enhancement using neural network and wavelet transform
Gonzalez-Rodriguez et al. Speech dereverberation and noise reduction with a combined microphone array approach
EP1261961B1 (en) Methods and systems for noise reduction for spatially displaced signal sources
Park et al. Two‐Microphone Generalized Sidelobe Canceller with Post‐Filter Based Speech Enhancement in Composite Noise
Bendoumia et al. Recursive adaptive filtering algorithms for sparse channel identification and acoustic noise reduction
Kallinger et al. Multi-microphone residual echo estimation
Faller et al. Stereo acoustic echo control using a simplified echo path model
KR101537653B1 (ko) 주파수 또는 시간적 상관관계를 반영한 잡음 제거 방법 및 시스템
Shi et al. Subband dereverberation algorithm for noisy environments
Lee Blind signal separation algorithm for acoustic echo cancellation

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121025

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20131023

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee