KR101019395B1 - 블라인드 소스 분리 (bss) 를 위한 강화 기술 - Google Patents

블라인드 소스 분리 (bss) 를 위한 강화 기술 Download PDF

Info

Publication number
KR101019395B1
KR101019395B1 KR1020087029520A KR20087029520A KR101019395B1 KR 101019395 B1 KR101019395 B1 KR 101019395B1 KR 1020087029520 A KR1020087029520 A KR 1020087029520A KR 20087029520 A KR20087029520 A KR 20087029520A KR 101019395 B1 KR101019395 B1 KR 101019395B1
Authority
KR
South Korea
Prior art keywords
signal
bss
adaptive
preprocessing
processing
Prior art date
Application number
KR1020087029520A
Other languages
English (en)
Other versions
KR20090016463A (ko
Inventor
쑹 왕
에디 엘 티 쵸이
사미르 쿠마 굽타
Original Assignee
퀄컴 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 퀄컴 인코포레이티드 filed Critical 퀄컴 인코포레이티드
Publication of KR20090016463A publication Critical patent/KR20090016463A/ko
Application granted granted Critical
Publication of KR101019395B1 publication Critical patent/KR101019395B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2134Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on separation criteria, e.g. independent component analysis
    • G06F18/21343Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on separation criteria, e.g. independent component analysis using decorrelation or non-stationarity, e.g. minimising lagged cross-correlations
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

본 개시물은, 블라인드 소스 분리 (BSS; blind source separation) 기술의 성능을 개선할 수 있는 신호 프로세싱 기술을 개시한다. 특히, 개시된 기술은 BSS 기술의 실행 이전에 서로 상이한 신호들을 상관해제하는 것을 도울 수 있는 전처리 단계를 제안한다. 또한, 개시된 기술은 BSS 기술의 실행 이후의 상이한 신호들을 더 상관해제시킬 수 있는 부가적인 후처리 단계를 제안한다. 이 기술은, 고 상관된 오디오 신호들 (예를 들어, 서로 공간적 근접성을 갖는 2 개의 마이크로폰으로부터의 신호들) 을 통해서 BSS 성능을 개선하는데 특히 유용할 수도 있다.
Figure R1020087029520
BSS 신호, 전처리, 후처리, 노이즈 플로어, 교정 인자

Description

블라인드 소스 분리 (BSS) 를 위한 강화 기술{ENHANCEMENT TECHNIQUES FOR BLIND SOURCE SEPARATION (BSS)}
본 출원은, 2006년 5월 2일자로 출원된 미국 가출원 번호 제60/797,264호의 이점을 주장하며, 그 전체 내용은 본 명세서에 참조로서 포함된다.
기술 분야
본 개시물은 신호 프로세싱에 관한 것이고, 더욱 상세하게는, 블라인드 소스 분리 (BSS; Blind Source Separation) 기술과 관련하여 이용되는 프로세싱 기술에 관한 것이다.
배경
수많은 신호 프로세싱 애플리케이션에서, 상이한 신호는 종종 노이즈로 손상된다. 이 노이즈는, 레코딩된 신호에 배경 사운드, 교란 (disturbance), 간섭, 크로스토크, 또는 임의의 원하지 않는 부가와 같은 것을 포함할 수도 있다. 따라서, 신호를 강화하기 위해서는, 이러한 노이즈를 감소시키거나 제거하는 것이 바람직하다. 음성 통신 프로세싱에서, 노이즈 감소를 위한 신호 프로세싱은 종종 음성 강화 (speech enhancement) 로 지칭된다.
블라인드 소스 분리 (BSS) 는, 소스 신호들의 다수의 독립적인 신호 혼합물을 이용하여, 독립적인 소스 신호를 복원하는데 이용될 수 있다. 2 개의 신호 를 분리하기 위해서는, 독립적인 신호 혼합물을 발생시키도록 2 개 이상의 센서가 필요하다. 각각의 센서는 상이한 위치에 배치되어 있고, 각각의 센서는 소스 신호들의 혼합물인 신호를 레코딩한다. 그러나, 센서가 상이한 위치에서 정보를 레코딩하기 때문에, 레코딩된 신호는 서로 독립적이다. BSS 알고리즘은, 양 센서들에 의해 레코딩된 공통 정보의 공간 다이버시티 (spatial diversity) 를 나타내는 이들 신호 차이를 활용함으로써 신호들을 분리시키는데 이용될 수도 있다. 음성 통신 프로세싱에서, 상이한 센서들은, 레코딩되고 있는 음성의 소스에 관해 상이한 위치에 배치된 마이크로폰들을 포함할 수도 있다.
개요
이 개시물은, 블라인드 소스 분리 (BSS) 기술의 성능을 개선할 수 있는 신호 프로세싱 기술을 개시한다. 특히, 개시된 기술은, BSS 기술을 실행하기 전에 독립적인 센서 신호들을 서로로부터 상관해제하는데 도움이 될 전처리 단계를 포함한다. 또한, 개시된 기술은, BSS 기술을 실행한 후, 상이한 신호들을 더 상관해제시킬 수 있는 선택적인 후처리 단계를 포함할 수도 있다. 이 기술은, 고 상관된 오디오 신호들 (예를 들어, 서로 공간적 근접성을 갖는 2 개의 마이크로폰으로 레코딩된 오디오 신호들) 을 통해서 BSS 성능을 개선하는데 특히 유용할 수도 있다.
일 실시형태에서, 본 개시물은, 제 1 센서와 관련된 제 1 신호 및 제 2 센서와 관련된 제 2 신호를 수신하는 단계, 제 2 신호를 전처리하여 제 1 신호로부터 제 2 신호를 상관해제하는 단계, BSS 기술을 제 1 신호에 적용시켜 제 1 BSS 신호 를 발생시키는 단계, 및 BSS 기술을 전처리된 제 2 신호에 적용시켜 제 2 BSS 신호를 발생시키는 단계를 포함하는 방법을 기재한다.
다른 실시형태에서, 본 개시물은, 제 1 신호를 발생시키는 제 1 센서 및 제 2 신호를 발생시키는 제 2 센서, 제 2 신호를 전처리하여 제 1 신호로부터 제 2 신호를 상관해제하는 전처리 유닛, 및 제 1 신호 및 전처리된 제 2 신호에 BSS 기술을 적용시켜 제 1 BSS 신호 및 제 2 BSS 신호를 각각 발생시키는 BSS 유닛을 포함하는 디바이스를 기재한다. 선택적으로, 이 디바이스는 또한 BSS 신호를 더 상관해제하는 후처리 유닛을 포함할 수도 있다.
다른 실시형태에서, 본 개시물은, 제 1 신호를 발생시키는 수단, 제 2 신호를 발생시키는 수단, 제 2 신호를 전처리하여 제 1 신호로부터 제 2 신호를 상관해제하는 수단, 및 제 1 신호 및 전처리된 제 2 신호에 BSS 기술을 적용시켜 제 1 BSS 신호 및 제 2 BSS 신호를 각각 발생시키는 수단을 포함하는 장치를 기재한다. 선택적으로, BSS 신호를 후처리하는 수단은 BSS 신호를 더 상관해제하기 위해서, BSS 신호들 중 하나 또는 모두에 적용될 수도 있다.
본 개시물에 기재된 이러한 기술 및 다른 기술들은 하드웨어, 소프트웨어, 펌웨어, 또는 이들의 임의의 조합으로 구현될 수도 있다. 소프트웨어로 구현되면, 이 소프트웨어는 디지털 신호 프로세서 (DSP) 또는 다른 유형의 프로세서에서 실행될 수도 있다. 이 기술을 실행하는 소프트웨어는 초기에 머신-판독가능 매체에 저장되고, BSS 기술의 효과적인 강화를 위해 프로세스에 로딩되어 실행될 수도 있다.
이에 따라, 본 개시물은, 실행시에, 제 1 신호 및 제 2 신호를 수신하는 명령들, 제 2 신호를 전처리하여 제 1 신호로부터 제 2 신호를 상관해제하는 명령들, 그리고 제 1 신호 및 전처리된 제 2 신호에 BSS 기술을 적용시켜 제 1 BSS 신호 및 제 2 BSS 신호를 각각 발생시키는 명령들을 포함하는 머신-판독가능 매체를 고찰한다.
각종 실시형태의 추가적인 세부사항은 첨부된 도면 및 이하의 상세한 설명에서 상술된다. 다른 특징, 목적 및 이점들은 상세한 설명 및 도면 그리고 청구범위로부터 명백하게 될 것이다.
도면의 간단한 설명
도 1 은, 본 명세서에 개시된 전처리 및 후처리 기술들에 의해 강화될 수도 있는 블라인드 소스 분리 (BSS) 기술을 수행하는 디바이스의 블록도이다.
도 2 는, 본 개시물의 일 실시형태에 따른 다른 정규 BSS 기술에 관한 전처리 및 후처리 기술을 수행하는 디바이스를 도시하는 블록도이다.
도 3 은, 본 개시물의 일 실시형태에 따라서 BSS 기술에 관한 전처리 및 후처리 기술을 수행하는 디바이스를 도시하는 다른 블록도이다.
도 4 는, 본 개시물의 실시형태에 따라서 수행될 수도 있는 기술을 도시하는 흐름도이다.
상세한 설명
본 개시물은, 블라인드 소스 분리 (BSS) 기술의 성능을 개선할 수 있는 신호 프로세싱 기술을 설명한다. 특히, 설명된 기술은, 다른 정규 BSS 기술의 실행 이전에 독립적인 센서 신호들을 서로로부터 상관해제하는데 도움이 될 전처리 단계들을 포함한다. 또한, 설명된 기술은, BSS 기술을 실행한 후, 분리된 신호를 더 상관해제하는 선택적인 후처리 단계를 포함할 수도 있다. 본 명세서에 설명된 기술은, 고 상관된 오디오 신호 (예를 들어, 서로에 대해 공간적 근접성을 갖는 2 개의 마이크로폰에 의해 레코딩된 오디오 신호들) 로 BSS 알고리즘 성능을 수행능력을 개선하는데 특히 유용할 수도 있다.
몇몇 BSS 알고리즘은, 특히 2 개의 센서들이 서로 매우 근접하게 위치되어 있을 때, 제한된 유효성을 가질 수도 있다. 예를 들어, 음성 강화를 수행하는 휴대용 디바이스에서, 상이한 마이크로폰들이 서로 공간적으로 아주 근접하여 위치되는 마이크로폰 배열을 갖는 것이 바람직할 수도 있다. 사실상, 이동 전화기와 같은 무선 통신 디바이스를 포함하는 휴대용 디바이스는 사용자 편의성을 증진시키기 위해 일반적으로 작은 폼 팩터 (small form factor) 로 설계되고, 이는, 상이한 마이크로폰들의 공간적 근접성으로 인한 BSS 에 대한 과제를 제시한다.
일반적으로, BSS 는 이들 신호의 다수의 혼합물을 이용하여 독립적인 신호들을 분리하는데 이용된다. 본 개시물에서 설명되는 기술에서, 다른 정규 BSS 알고리즘과 함께 이용하기 위한 개선이 설명된다. 설명된 기술은, 전처리 절차의 일부로서 레코딩된 신호들을 상관해제하기 위해 적응성 필터 (adaptive filter) 를 사용할 수도 있다. 그 다음에, 상관해제된 신호들은 전처리의 일부로서 교정 (calibrate) 될 수 있다. 교정 이후에, 정보 최대화에 기초한 BSS 피드백 아키텍처가 이용되어, 상관해제 신호들을 분리시킬 수도 있다. 선택적으로, 제 2 적응성 필터가 후처리 절차의 일부로서 이용되어, 신호들을 더 상관해제함으로써 신호 분리 성능을 더 개선할 수도 있다.
도 1 은, 본 개시물에 설명된 전처리 및 후처리 기술에 의해 강화될 수도 있는 BSS 기술을 수행하는 디바이스 (10) 의 블록도이다. 또한, BSS 는 독립적인 컴포넌트 분석 (ICA; independent component analysis) 으로서 알려져 있고, 이들 신호의 다수의 혼합물에 기초하여 신호들을 분리시키는데 이용될 수도 있다. 분리 프로세스 동안, 소스 신호들의 혼합물인 수많은 레코딩된 센서 신호들이 이용가능하다. 통상적으로, 혼합 프로세스와 관련된 정보는 이용가능하지 않고, 소스 신호들의 어떠한 직접적인 측정도 이용가능하지 않다. 종종, 몇몇 또는 모든 소스 신호의 선험적인 (a priori) 통계 정보가 이용가능할 수도 있다.
BSS 는 수많은 신호 프로세싱 문제에서의 그 잠재적 값 때문에 연구원으로부터 폭넓은 관심을 끌었다. BSS 는 각종 영역 (예를 들어, 통신, 음성 강화, 노이즈 감소, 및 심전도 (ECG; electrocardiogram) 및 뇌전도 (EEG; electroencephalogram) 프로세싱을 포함하는 바이오-메디컬 신호 프로세싱 등) 에서 잠재적 애플리케이션을 갖는다. 본 명세서에 설명된 기술은, 작은 폼 팩터가 마이크로폰 배치를 제한하는 무선 통신 디바이스에서의 음성 애플리케이션에 특히 유용할 수도 있다. 그러나, 이 기술은 음성 애플리케이션들에 제한되지는 않고, 다른 신호 프로세싱 애플리케이션, 또는 다른 디바이스에 유용할 수도 있다.
수많은 BSS 접근방식들 중에서, 정보 최대화 기반 방법은, 고정 소수점 플랫폼 (fixed-point platform) 상에서 실시간 구현을 위한 그 적합성 및 그 간단성 때 문에, 많은 관심을 받는다. 이러한 BSS 접근방식은, 콘볼루티브 신호 혼합 (convolutive signal mixture) 을 분리하기 위해 이용될 수도 있다. 특히, 피드백 크로스-필터가 콘볼루티브하게 혼합된 신호를 분리하기 위해 이용될 수 있다.
도 1 에 도시된 바와 같이, 디바이스 (10) 는, 센서 유닛 (12) 및 BSS 유닛 (14) 을 포함한다. 변수 s1(t) 및 s2(t) 는 2 개의 독립적인 소스 신호들을 나타낸다. 필터 h11(t), h12(t), h21(t), h22(t) 는, 센서와 소스 사이의 콘볼루티브 경로를 나타낸다. 센서 (16A 및 16B) 는, 가산기로서 도시되지만, 더욱 일반적으로는, 상이한 위치에 배치된 마이크로폰과 같은 2 개의 상이한 센서들을 나타낸다. 음성 강화에 이용되는 경우, 센서 (16A 및 16B) 는 이들이 비용적인 면에서 효율적이기 때문에 전방향성 마이크로폰 (omni-directional microphone) 을 포함하는 것이 바람직할 수도 있다.
신호 S1(t) 는, 이 신호가 센서 (16A) 에 도달하기 전에, 필터 h11(t) 와 콘볼빙하고, 또한 이 신호가 센서 (16B) 에 도달하기 전에, 필터 h12(t) 와 콘볼빙한다. 유사하게, 신호 S2(t) 는, 이 신호가 센서 (16A) 에 도달하기 전에, 필터 h21(t) 와 콘볼빙하고, 또한 이 신호가 센서 (16B) 에 도달하기 전에, 필터 h22(t) 와 콘볼빙한다. 센서 (16A 및 16B) 는 각각의 정보를 캡처하여, 신호 x1(t) 및 x2(t) 를 각각 발생시킨다. 그후, ADC (17A 및 17B) 는 신호 X1(z) 및 X2(z) 를 각각 발생시킨다. 따라서, 신호 X1(z) 및 X2(z) 는 아날로그-디지털 변환 이후에 디지털 도메인에 있다. 이들 신호 X1(z) 및 X2(z) 는 블라인드 소스 분리를 수행하기 위해서, BSS 유닛 (14) 에 공급된다.
특히, BSS 유닛 (14) 은 피드백 크로스 필터링 기술을 구현한다. X1(z) 는 전달 함수 W11(z) 를 갖는 필터로 공급된 후, 가산기 (18A) 로 공급된다. 유사하게, X2(z) 는 전달 함수 W22(z) 를 갖는 필터로 공급된 후, 가산기 (18B) 로 공급된다. 가산기 (18A) 의 출력은 가산기 (18B) 로 피드백되기 전에 전달 함수 W12(z) 를 갖는 다른 필터로 공급된다. 가산기 (18B) 의 출력은 가산기 (18A) 로 피드백되기 전에 전달함수 W21(z) 를 갖는 다른 필터로 공급된다. 도 1 에서, 변수 S'1(z) 및 S'2(z) 는, 통상적으로 소스 신호 s1(t) 및 s2(t) 와 공통점을 갖고 BSS 유닛 (14) 에 대해 입력 신호 X1(z) 및 입력 신호 X2(z) 보다 훨씬 더 나은 분리를 갖는, BSS 유닛 (14) 의 출력을 나타낸다.
전달 함수 W12(z) 및 전달 함수 W21(z) 로 표현된 필터는 적응성 필터링 알고리즘과 같은 최소 평균 제곱 (LMS; least mean square) 을 이용하여 구현될 수 있다. 이러한 필터링의 부가적인 세부사항이 도 2 의 설명에서 이하 더욱 상세하게 후술된다. 필요한 경우, ψ(·) 로 표현된 비선형 전달 함수 (도 1 에는 도시되지 않음) 가 필터 계수 업데이트 도중에 이용될 수 있다. 함수 ψ(·) 의 가능한 형태는 ψ(x) =tanh(x), ψ(x)=|x|, 및
Figure 112008083199158-pct00001
을 포함하고, 여기서,
Figure 112008083199158-pct00002
는 랜덤 변수 X 의 누적 분포 함수 (cdf; cumulative distribution function) 이다. 그러나, ψ(·) 로 표현된 함수는 간략함을 위해 도 1 에 도시되지 않는다.
전달 함수 W11(z) 및 전달 함수 W22(z) 는 BSS 기술에 부합하는 몇몇 형태를 취할 수도 있다. 그러나, 부가된 간략함을 위해, 이하의 설명에서는, W11(z) 및 W22(z) 는 알고리즘의 성능을 손상하지 않으면서 스칼라로 대체될 수 있다. 따라서, 이하의 설명에서, 이러한 2 개의 전달 함수는 단일체 (unity) 로 설정되고, 후속 도면으로부터 제거된다.
BSS 유닛 (14) 에 의해 구현된 것과 같은 BSS 알고리즘은 구현하기 매우 간단하고, 수많은 경우에서 상당히 우수한 분리 성능을 산출한다. 그러나, 이러한 알고리즘은, 레코딩이 고 상관될 때의 수렴에 있어서 어려움을 가질 수도 있다. 이러한 어려움이 발생할 때, BSS 알고리즘은 모든 신호에서 가장 두드러진 컴포넌트를 소멸시키는 경향이 있을 수도 있다. 음성 강화에 있어서, 가장 두드러진 컴포넌트는 희망 음성 신호일 가능성이 크다. 이러한 이유로, 본 개시물은 전처리 유닛을 구현하여, 이러한 잠재적인 문제들을 해결한다.
몇몇 경우에, BSS 유닛 (14) 에 의해 구현된 것과 같은 BSS 알고리즘은 신호들을 분리하는데 이용가능한 정보를 완전히 활용하지 않는다. 이 경우, 분리된 신호들 사이의 상관이 BSS 유닛 (14) 에 의한 이하의 분리로 관찰될 수도 있다. 이는, 이러한 일고리즘의 성능에 대한 추가 개선을 위한 여지를 남긴다. 이러한 이유로, 본 개시물은 또한 후처리 유닛을 구현하여, 추가 상관해제를 제공할 수도 있다. 후술되는 개선된 BSS 기술은, 오직 하나의 소스 신호만이 관심의 대상이 된 애플리케이션 (예를 들어, 음성 통신에서 멀티-마이크로폰 노이즈 감소의 경우) 에 대해 특히 유용할 수도 있다.
일반적으로, BSS 알고리즘에서, 모든 신호는 개별적인 랜덤 변수로서 취급된다. 블라인드 소스 분리에 이용되는 가정은, 모든 랜덤 변수들이 통계적으로 서로 개별적인 것, 즉, 모든 랜덤 변수의 결합 분포 (joint distribution) 가 모든 개별적인 랜덤 변수의 곱이라는 것이다. 이러한 가정은 이하와 같이 공식화되고:
Figure 112008083199158-pct00003
여기서,
Figure 112008083199158-pct00004
는 모든 랜덤 변수 S1,…Sm 의 결합 분포이고,
Figure 112008083199158-pct00005
는 j 번째 랜덤 변수 Sj 의 분포이다.
BBS 문제는, 혼합 프로세스가 순시 행렬 혼합으로서 모델링될 수 있는 경우에 순시 BSS 문제로 지칭될 수도 있는데, 이는:
Figure 112008083199158-pct00006
로 공식화되고, 여기서,
Figure 112008083199158-pct00007
는 m×1 벡터이고,
Figure 112008083199158-pct00008
는 n×1 벡터이고, A 는 n×m 스칼라 행렬이다. 분리 프로세스에서,
Figure 112008083199158-pct00009
가 임의의 치환 및 임의의 스케일링까지
Figure 112008083199158-pct00010
와 유사하도록, 신호
Figure 112008083199158-pct00011
를 복원하도록 m×n 스칼라 행렬 B 가 계산되고 이용된다. 즉, 행렬 BAPD 로 분해될 수 있고, 여기서 행렬 P 는 치환 행렬이고, 행렬 D 는 대각 행렬이다. 치환 행렬은 동일한 차원의 단위 행렬을 치환함으로써 도출된 행렬이다. 대각 행렬은 단지 그 대각선에 제로가 아닌 엔트리들을 갖는 행렬이다. 대각 행렬 D 는 단위 행렬일 필요는 없다는 것이 명시된다. 모든 m 개의 소스들이 서로에 독립적인 경우, 행렬 D 의 대각선 상에는 제로 엔트리가 있어서는 안된다. 일반적으로, 완전한 신호 분리를 위해 n≥m 이 요구된다.
불행하게도, 현실은, 순시 혼합을 이용하여 몇몇 문제들이 모델링될 수 있다. 통상적으로, 도 1 에 도시된 바와 같이, 신호는 센서에 의해 레코딩되기 전에 비-이상적인 채널을 통해서 이동한다 (travel). 이러한 경우, 이 문제는 콘볼루티브 BSS 문제로서 고려된다. 그 혼합 프로세스는 이하와 같이 모델링될 수 있다:
Figure 112008083199158-pct00012
여기서,
Figure 112008083199158-pct00013
는 j 번째 소스이고,
Figure 112008083199158-pct00014
는 i 번째 센서에 의한 측정치이다. 전달 함수
Figure 112008083199158-pct00015
는 j 번째 소스와 i 번째 센서 사이의 전달 함수이다. 심볼
Figure 112008083199158-pct00016
은 콘볼루션을 나타낸다. 필터의 다른 세트
Figure 112008083199158-pct00017
는 소스 신호
Figure 112008083199158-pct00018
를 복원하기 위해 필요하다.
복원 공식은 이하와 같다:
Figure 112008083199158-pct00019
여기서, 분리 프로세스가 디지털 신호 도메인에서 실행되기 때문에, Z-도메인 표현이 이용된다. 순시 혼합 문제와 유사하게,
Figure 112008083199158-pct00020
는, 임의의 치환 및 임의의 콘볼루션까지, 소스 신호
Figure 112008083199158-pct00021
의 이산 표현인
Figure 112008083199158-pct00022
와 유사하다. 혼합 전달 함수
Figure 112008083199158-pct00023
가 이산 표현
Figure 112008083199158-pct00024
을 이용하여 표현되는 경우, 전반적인 시스템은:
Figure 112008083199158-pct00025
와 같이 공식화될 수 있고, 여기서,
Figure 112008083199158-pct00026
.
P 는 치환 행렬이고, D(z) 는 대각 전달 함수 행렬이다. D(z) 의 대각선상의 엘리먼트는, 순시 BSS 문제에서 표현된 바와 같이 스칼라라기 보다는 전달 함수이다. 한편, 순시 BSS 에서의 완전한 분리를 위한 요건인, m≥n 은, 콘볼루티브 BSS 에서도 여전히 유지된다.
본 개시물에 따르면, 2 개의 센서가 이용된다는 것이 가정될 수도 있다. 모든 소스 신호들 중에서, 단지 하나의 신호만이 관심 신호로 고려되고, 그 단지 하나의 신호만이 강화될 필요가 있다. 그럼에도 불구하고, 2 개 센서 구성에 포커스가 맞춰지지만, 그 결과는, 다수의-센서 구성 및 다수의 관심 신호로 용이하게 확장될 수 있다.
도 1 을 다시 참조하면, BSS 유닛 (14) 에 의해 구현된 알고리즘의 출력은:
Figure 112008083199158-pct00027
으로 공식화될 수 있다.
전술한 바와 같이,
Figure 112008083199158-pct00028
Figure 112008083199158-pct00029
는 이 알고리즘의 성능에 기여하지 않기 때문에, 이들은 단일체 (unity) 와 같은 스칼라로 설정될 수 있다. 이하에서, 도 1 에 도시된
Figure 112008083199158-pct00030
Figure 112008083199158-pct00031
는 후속 도면을 위해 단일체로 설정되고, 이들이 부가될 수 있어도 나타나지 않을 것이다. 이러한 경우, BSS 유닛 (14) 에 의해 구현된 이 알고리즘의 출력은:
Figure 112008083199158-pct00032
으로서 공식화될 수 있다.
몇몇 경우에서,
Figure 112008083199158-pct00033
Figure 112008083199158-pct00034
는 적응성 필터링 알고리즘과 같은 최소 평균 제곱 (LMS; least mean square) 을 이용하여 적응될 수 있다. 가능한 필터 업데이트 식은 이하와 같이 주어지고:
Figure 112008083199158-pct00035
여기서,
Figure 112008083199158-pct00036
Figure 112008083199158-pct00037
는 시간 t 에서의 2 개의 필터이다. 변수
Figure 112008083199158-pct00038
Figure 112008083199158-pct00039
는 시간 t 에서의 필터링된 출력이다. 또한, 이들은
Figure 112008083199158-pct00040
Figure 112008083199158-pct00041
각각의 이산 표현이다. 변수 μ 는 업데이트 스텝 사이즈이고,
Figure 112008083199158-pct00042
는 비선형 함수 (도 1 에는 도시되지 않음) 이다. 예로서, 변수
Figure 112008083199158-pct00043
로 표현된 전달 함수는 시그모이드 (sigmoid) 함수, 쌍곡선 탄젠트 (hyperbolic tangent) 함수 또는 사인 (sign) 함수일 수 있다. 또는, 이는, -1 과 1 사이에서 평가된 다른 단조 함수 (monotonous function) 일 수 있다.
Figure 112008083199158-pct00044
Figure 112008083199158-pct00045
는 시간 t 에서 필터
Figure 112008083199158-pct00046
Figure 112008083199158-pct00047
로 각각 입력되는데, 즉,
Figure 112008083199158-pct00048
이고, 여기서 M 은 2 개의 필터의 길이이다.
도 2 는, 본 개시물의 일 실시형태에 따른 다른 정규 BSS 기술과 관련된 전처리 및 후처리 기술을 수행하는 디바이스 (20) 를 도시하는 블록도이다. 특히, 디바이스 (20) 는 전처리 유닛 (22), BSS 유닛 (24) 및 후처리 유닛 (26) 을 포함한다. BSS 유닛 (24) 은 도 1 에 도시된 BSS 유닛 (14) 에 관해 간략화되지만, 임의의 BSS 기술에 부합하는 추가적인 컴포넌트를 포함할 수도 있다. 임의의 경우, BSS 유닛 (24) 은 다른 정규 BSS 알고리즘을 수행하는 컴포넌트를 포함한다. 그러나, 전처리 유닛 (22) 은 정규 BSS 기술의 실행 이전에 상관해제를 개선시키기 위해 신호를 전처리함으로써 BSS 기술을 변형시킨다. 또한, 후처리 유닛 (26) 은, 정규 BSS 기술 이후에, 신호의 추가적인 상관해제를 달성하기 위해 이 BSS 알고리즘을 더 변형한다. 후처리 유닛 (26) 은 몇몇 실시형태에서는 선택적이다.
도 2 에서, 신호 X1(z) 및 X2(z) 는 2 개의 상이한 센서로부터의 신호, 예를 들어, 2 개의 전방향성 마이크로폰과 같은 2 개의 상이한 마이크로폰으로부터의 오디오 신호이다. 제 1 신호 X1(z) 는 BSS 유닛 (24) 의 가산기 (32A) 에 송신되고, 또한, 전처리 유닛 (22) 으로 송신된다. 전처리 유닛 (22) 에서, 적응성 필터 (42) 는 신호 X1(z) 에 대해 이용되고, 적응성 필터 (42) 의 출력은 감산 유닛 (44) 을 통해서 X2(z) 로부터 감산되어 X2'(z) 를 발생시킨다. 적응성 필터 (42; "G(z)") 는 비교적 적은 수의 탭 (예를 들어, 3 개의 탭) 을 포함할 수도 있다. X2'(z) 는, 이것이 본래 X1(z) 의 필터링 다음에 X1(z) 와 X2(z) 사이의 차이를 나타내는 한, 대부분 노이즈를 포함한다. 또한, X2'(z) 는 피드백으로서 이용되어 적응성 필터 (42) 를 제어한다.
교정 유닛 (46) 은, X2'(z) 및 X1(z) 을 이용하여, 교정 인자 "c" 를 발생시킨다. 구체적으로는, 교정 유닛 (46) 은, X1(z) 를 시간 세그먼트로 분할하고, 일 주기에 걸쳐 에너지를 모니터링함으로써 X1(z) 에서의 노이즈 플로어 (noise floor) 를 결정한다. 이 주기에 걸쳐 최소 에너지는 X1(z) 의 노이즈 플로어로서 확립된다. 유사하게, 교정 유닛 (46) 은, 예를 들어, X2'(z) 를 세그먼트로 분할하고, 일 주기에 걸쳐 에너지를 모니터링하고, 노이즈 플로어로서 X2'(z) 의 최소 에너지 값을 식별함으로써, X2'(z) 에서의 노이즈 플로어를 결정한다. X2'(z) 의 노이즈 플로어에 관한 X1(z) 의 노이즈 플로어의 비율은 교정 인자 "c" 를 확립하고, 이는, X2''(z) 가 X1(z) 와 유사한 노이즈 플로어를 갖도록, X2'(z) 를 스케일링하는데 이용될 수 있다. 승산 유닛 (48) 은 X2'(z) 에 교정 인자 "c" 를 적용하여, 제 2 신호 X2(z) 의 전처리된 버전으로서 본 명세서에서 지칭된 X2''(z) 를 발생시킨다.
전처리된 제 2 신호 X2''(z) 는 오리지널 제 2 신호 X2(z) 보다 X1(z) 로부터 더 많이 상관해제된다. 이러한 이유로, 전처리 유닛 (22) 은 BSS 유닛 (24) 에 의해 수행된 블라인드 소스 분리의 성능을 개선할 수 있다. 일반적으로, BSS 유닛 (24) 은 도 1 의 BSS 유닛 (14) 과 유사하게 동작하지만, 신호 X2(z) 가 아닌 전처리된 제 2 신호 X2''(z) 를 이용하여 동작한다. 필터 W12(z) 는 최소 평균 제곱 (LMS) 적응성 필터링을 제 1 신호 X1(z) 에 적용하고, 가산기 (32B) 는 LMS 적응성 필터링된 제 1 신호와 전처리된 제 2 신호 X2''(z) 를 합산한다. 유사하게, 필터 W21(z) 는 전처리된 제 2 신호 X2''(z) 에 LMS 적응성 필터링을 적용하고, 가산기 (32A) 는 LMS 적응성 필터링되며 전처리된 제 2 신호와 제 1 신호 X1(z) 를 합산한다.
전술한 바와 같이, 적응성 필터 (42) 는 수많은 탭을 요구하지 않는다. 수많은 애플리케이션에서, 1 개 내지 3 개의 탭이면 충분하다. 3 개의 탭이 이용되는 경우, 상이한 센서 구성을 어드레싱하기 위해 하나의 원인이 아닌 탭 (non-causal) 을 전념시키는 것 (즉, 하나의 샘플 지연을 신호 X2(z) 에 부가) 이 바람직할 수도 있다. 명백하게, 더욱 많은 탭은 신호들 사이의 공간 다이버시티를 불필요하게 제거함으로써 콘볼루티브 BSS 알고리즘의 성능을 사실상 열화시킬 수도 있다. 따라서, 그 성능을 위해 3 개 또는 약간의 탭이 바람직할 수도 있다.
적응성 필터 (42) 의 출력은
Figure 112008083199158-pct00049
으로 나타날 수 있고, 여기서,
Figure 112008083199158-pct00050
는 신호 X2(z) 에 부가된 지연이고,
Figure 112008083199158-pct00051
는 시간 t 에서 i 번째 필터 계수이고, N 은 적응성 필터의 길이이다. 적응성 필터 (42) 는 이하의 식:
Figure 112008083199158-pct00052
을 이용하여 업데이트될 수 있고, 여기서,
Figure 112008083199158-pct00053
는 시간 t 에서의 적응성 필터 (42) 의 필터 계수를 나타내고,
Figure 112008083199158-pct00054
는 시간 t 에서의 필터 출력이고, μ 는 적응 스텝 사이즈이고,
Figure 112008083199158-pct00055
는 필터 G(z) 에 입력된다.
수많은 경우에서, 신호 X1(z) 및 X2(z) 사이의 차이가 매우 작기 때문에, 적응성 필터 (42) 의 출력 레벨은 매우 낮다. 이 신호가 BSS 알고리즘에 직접적으로 공급되는 경우, 이 알고리즘은 2 개의 채널상에서의 균형잡히지 않은 여기 (excitation) 으로 인해 매우 천천히 수렴하는 경향이 있다. 따라서, 본 명세서에 기재된 바와 같이 BSS 알고리즘의 수렴의 속도를 높이기 위해서 일정한 레벨까지 이 신호를 교정하는 것이 바람직하다. 특히, 에러 신호에서의 노이즈 레벨이 초기 (primary) 마이크로폰 신호의 노이즈 레벨과 유사하도록, 에러 신호가 교정될 수 있다. 구체적으로, L1 이 X1(z) 에서의 노이즈 플로어 레벨을 나타내고, L2 가 X'(z) 에서의 노이즈 플로어 레벨을 나타내는 경우, 교정 인자 c 는:
Figure 112008083199158-pct00056
이 되도록 선택될 수 있다.
BSS 유닛 (24) 의 출력은 BSS 신호로서 본 명세서에서 지칭된다. 몇몇 경우에서, 이들은 서로로부터 상관해제되는 최종 프로세싱된 신호를 포함할 수도 있고, 이 경우, 후처리 유닛 (26) 이 제거될 수 있다. 그러나, BSS 알고리즘의 성능은 후처리 유닛 (26) 을 구현함으로써 더욱 개선될 수도 있다.
일반적으로, 신호 분리 프로세스 이후에, 2 개의 신호가 생성되고, 또한, 이들은 BSS 신호로서 지칭된다. 가산기 (32A) 의 출력인 제 1 BSS 신호는 주로 관심 신호 및 모든 다른 신호의 약간 감쇠된 부분을 함유한다. 음성 강화 애플리케이션에서, 이러한 제 1 BSS 신호는 감쇠된 노이즈를 갖는 레코딩된 음성을 포함할 수도 있다. 제 1 BSS 신호에서 노이즈의 감소는 음성 신호 및 노이즈의 특성 및 환경에 의존하여 변화할 수도 있다. 가산기 (32B) 의 출력인 제 2 BSS 신호는 주로 감쇠된 (예를 들어, 2 개의 상이한 마이크로폰에 의해 검출된 음성과 같은) 관심 신호와 함께 노이즈를 포함한다.
수많은 경우에서, 제 1 BSS 신호와 제 2 BSS 신호 사이에 상관이 있다. 또한, 이러한 상관은 관심 신호 (예를 들어, 음성 신호) 를 개선하기 위해 더 활용될 수도 있다. 이러한 목적을 위해, 후처리 유닛 (26) 이 이용되어, 제 1 BSS 신호 및 제 2 BSS 신호를 더 상관해제할 수 있다.
특히, 도 2 에 도시된 바와 같이, 후처리 유닛 (26) 은, 가산기 (32B) 로부터 출력되는 제 2 BSS 신호를 필터링하기 위해 적응성 필터 (52) 를 포함한다. 가산기 (32A) 로부터 출력되는 제 1 BSS 신호는 지연 회로 (54) 를 통해서 지연된다. 그후, (적응성 필터 (52) 로부터 출력된) 적응성 필터링된 제 2 BSS 신호는 감산 유닛 (56) 을 통해서 (지연 회로 (54) 로부터 출력된) 지연된 제 1 BSS 신호로부터 감산된다. S1'(z) 는, 전처리, BSS 기술 및 후처리 이후의 입력 신호 X1(z) 와 관련된 출력을 나타낸다. 유사하게, S2'(z) 는 전처리, BSS 기술 및 후처리 이후의 입력 신호 X2(z) 와 관련된 출력을 나타낸다. 또한, S1'(z) 신호는 적응성 필터 (52) 를 제어하기 위해 피드백으로서 이용된다.
도 2 의 디바이스 (20) 에서, 2 개의 신호들 중 단지 하나의 신호, 즉 원하지 않는 노이즈가 제거된 입력 신호 X1(z) 를 나타낼 수도 있는 신호 S1'(z) 가 요구될 수도 있다. 여기서, 다른 출력 신호 S2'(z) 는 단순히 적응성 필터 (52) 에 대한 입력으로서 이용된다. 전술한 바와 같이, 지연 회로 (54) 다음에, 관심 신호 S1'(z) 가 적응성 필터 (52) 에 대한 기준으로서 이용된다. 적응성 필터 (52) 의 적응성은 전처리 유닛 (22) 에서의 적응성 필터 (42) 의 적응성과 유사할 수도 있다. 후처리 유닛 (26) 은, 2 개의 상이한 마이크로폰 (통상적으로, 전방향성 마이크로폰) 이 하나의 강화된 음성 신호를 발생시키도록 이용되는 음성 강화에 특히 유용할 수도 있다. 이러한 경우, 강화된 음성 신호는 S1'(z) 로서 출력될 수도 있다.
도 3 은, 본 개시물의 일 실시형태에 따른 디바이스 (60) 의 다른 실시형태를 도시한다. 도 3 의 디바이스 (60) 는 도 2 의 디바이스 (20) 과 매우 유사하다. 그러나, 디바이스 (60) 에서, 도 2 에 참조되어 상술된 것과 같은 신호 S1'(z) 가 아니라, 양 신호 (S1''(z) 및 S2''(z)) 가 관심 신호이다. 따라서, 도 3 에서, 상이한 후처리 유닛 (70) 이 이용된다. 도 3 에서, 전처리 유닛 (22) 및 BSS 유닛 (24) 은 도 2 의 유닛들과 동일하고, 따라서, 이들 컴포넌트의 설명은 이하 다시 중복되지 않는다. 후처리 유닛 (70) 은 도 2 의 유닛 (26) 과 유사하지만, 이 후처리 유닛 (70) 은 신호 경로들 중 하나의 신호 경로만이 아 닌 양 신호 경로상에서의 유사한 기능들을 필수적으로 수행한다.
도 3 에서, 후처리 유닛 (70) 은 2 개의 적응성 필터 (75A 및 75B), 및 2 개의 지연 회로 (74A 및 74B) 를 포함한다. 적응성 필터 (75B) 는, 가산기 (38A) 로부터의 출력인 제 2 BSS 신호를 필터링한다. 가산기 (38A) 로부터의 출력인 제 1 BSS 신호는 지연 회로 (74A) 를 통해서 지연된다. 그후, (적응성 필터 (75B) 로부터의 출력된) 적응성 필터링된 제 2 BSS 신호는 감산 유닛 (77A) 을 통해서 (지연 회로 (74A) 로부터 출력된) 지연된 제 1 BSS 신호로부터 감산된다. S1''(z) 는, 도 3 에 도시된 전처리, BSS 기술 및 후처리 이후의 입력 신호 X1(z) 와 관련된 출력을 나타낸다. 또한, S1''(z) 신호는 적응성 필터 (75B) 를 제어하기 위한 피드백으로서 이용되지만, 이 피드백은 도면에서의 간략함을 위해 도시되지 않는다.
제 2 신호 경로는 유사하게 프로세싱된다. 특히, 적응성 필터 (75A) 는 가산기 (38A) 로부터 출력된 제 1 BSS 신호를 필터링한다. 가산기 (38B) 로부터 출력된 제 2 BSS 신호는 지연 회로 (74B) 를 통해서 지연된다. 그후, (적응성 필터 (75A) 로부터 출력된) 적응성 필터링된 제 1 BSS 신호는 감산 유닛 (77B) 을 통해서 (지연 회로 (74B) 로부터 출력된) 지연된 제 2 BSS 신호로부터 감산된다. S2''(z) 는, 도 3 에 도시된 전처리, BSS 기술 및 후처리 이후의 입력 신호 X2(z) 와 관련된 출력을 나타낸다. 또한, S2''(z) 신호는 적응성 필터 (75A) 를 제어하기 위해 피드백으로서 이용되지만, 이 피드백은 도면에서 간략함을 위해 도 시되지 않는다.
도 4 는, 본 개시물의 일 실시형태에 따라서 수행될 수도 있는 기술을 도시하는 흐름도이다. 도 4 에 도시된 바와 같이, 디바이스 (20) (도 2 참조) 는 제 1 신호 X1(z) 및 제 2 신호 X2(z) 를 수신한다 (81). 신호 X1(z) 및 X2(z) 는 2 개의 마이크로폰에 의해 캡처된 오디오 신호를 포함할 수도 있지만, 본 개시물은 이 점에 대해서는 반드시 제한되지 않는다. 예를 들어, 마이크로폰은 전방향성 마이크로폰 (또는 다른 유형의 마이크로폰) 을 포함할 수도 있고, 디바이스 (20) 에 포함될 수도 있다. 제 1 신호 X1(z) 는 제 1 및 제 2 마이크로폰의 공간적 근접성으로 인해 제 2 신호 X2(z) 와 고 상관될 수도 있다.
전처리 유닛 (22) 은 제 1 신호 X1(z) 로부터 제 2 신호 X2(z) 를 상관해제하기 위해 제 2 신호 X2(z) 에 대해 전처리를 수행한다 (82). 전처리는, 제 1 신호 X1(z) 에 적응성 필터 (42) 를 적용하는 단계, 및 (적응성 필터 (42) 로부터 출력된) 적응성 필터링된 제 1 신호를 제 2 신호 X2(z) 로부터 감산하는 단계를 포함할 수도 있다. 또한, 제 2 신호 X2(z) 를 전처리하는 것은, 제 2 신호 X2(z) 와 (적응성 필터 (42) 의 출력인) 적응성 필터링된 제 1 신호 사이의 차이 X'2(z) 에 대한 제 1 신호 X1(z) 의 노이즈 플로어의 비율에 기초하여 교정 인자 "c" 를 발생시키는 단계를 더 포함할 수도 있다. 또한, 전처리는 교정 인자 "c" 를 차이 X'2(z) 에 적용하는 단계를 더 포함할 수도 있다. 몇몇 경우, 제 2 신호 X2(z) 를 전처리하는 단계가 (적응성 필터 (42) 로부터의 출력인) 적응성 필터링된 제 1 신호를 제 2 신호 X2(z) 로부터 감산하기 전에 제 2 신호 X2(z) 를 지연시키는 단계를 더 포함하도록, 지연이 이용될 수도 있다. 도 2 에 도시되지 않은 지연 엘리먼트가 필요한 경우 부가될 수 있다.
다음으로, BSS 유닛 (24) 은 제 1 신호 X1(z) 및 전처리된 제 2 신호 X''2(z) 에 대해 BSS 기술을 수행한다 (83). BSS 기술은, 제 1 신호 X1(z) 에 최소 평균 제곱 (LMS) 적응성 필터링을 적용하는 단계, 및 전처리된 제 2 신호 X''2(z) 와 (W12(z) 의 출력인) LMS 적응성 필터링된 제 1 신호를 합산하는 단계를 포함할 수도 있다. 또한, BSS 기술은, 전처리된 제 2 신호 X''2(z) 에 LMS 적응성 필터링을 적용하는 단계, 및 제 1 신호와 (W21(z) 의 출력인) LMS 적응성 필터링되며 전처리된 제 2 신호를 합산하는 단계를 포함할 수도 있다.
마지막으로, 후처리 유닛 (26) 은, 각각 가산기 (32A 및 32B) 에 의해 출력된 제 1 BSS 신호와 제 2 BSS 신호를 더욱 상관해제하기 위해 후처리를 수행한다 (84). 도 2 의 경우에서, (가산기 (32A) 의 출력인) 제 1 BSS 신호를 후처리하는 것은, 제 2 적응성 필터 (52) 를 (가산기 (32B) 의 출력인) 제 2 BSS 신호에 적용하는 단계, 및 (가산기 (32A) 의 출력인) 제 1 BSS 신호로부터 (적응성 필터 (52) 의 출력인) 적응성 필터링된 제 2 BSS 신호를 감산하는 단계를 포함한다. (가산기 (32A) 의 출력인) 제 1 BSS 신호를 후처리하는 것은, 회로 (54) 의 지연된 출력이 감산 유닛 (56) 에 의해 이용되도록, (적응성 필터 (52) 로부터의 출력인) 적응성 필터링된 제 2 BSS 신호를 제 1 BSS 신호로부터 감산하기 전에 지연 회로 (54) 를 통해서 제 1 BSS 신호를 지연시키는 단계를 더 포함할 수도 있다.
디바이스 (20) 의 출력은, 노이즈가 감소된 신호 X1(z) 의 매우 정확한 표현을 포함할 수도 있는 신호 S'1(z) 를 포함할 수도 있다. 이와 다르게, 도 2 의 후처리 유닛 (26) 이 도 3 의 후처리 유닛 (60) 과 대체되는 경우, 디바이스 (70) 의 출력은 신호 S''1(z) 및 S''2(z) 를 포함할 수도 있다.
수많은 실시형태들이 설명되었다. 하지만, 본 명세서에서 설명된 기술에 대해 다양한 변형이 이루어질 수 있다. 예를 들어, 본 명세서에 설명된 전처리 및/또는 후처리 기술은 도 1 에 도시된 BSS 알고리즘에 반드시 한정되지 않는 다른 BSS 알고리즘에 대해 이용될 수도 있다. 또한, 이 기술은 주로 음성 강화에 이용되는 것으로 설명되지만, 이러한 기술은, 다른 음성 신호 애플리케이션, 노이즈 감소, 및 심전도 (ECG; electrocardiogram) 및 뇌전도 (EEG; electroencephalogram) 프로세싱을 포함하는 바이오-메디컬 신호 프로세싱 등을 포함하여, BSS 기술이 이용되는 임의의 환경에 대한 폭넓은 애플리케이션을 발견할 수도 있다. 오디오 또는 음성 프로세싱에 있어서, 신호는 몇몇 애플리케이션에 대해 실시간으로 프로세싱될 수도 있다.
본 명세서에 설명된 기술은 하드웨어, 소프트웨어, 펌웨어, 또는 이들의 임 의의 조합으로 구현될 수도 있다. 소프트웨어로 구현되는 경우, 이 기술은, 실행시에 디바이스가 본 명세서에 설명된 하나 이상의 기술을 수행하게 하는 프로그램 코드를 포함하는 컴퓨터 판독가능 매체에 관한 것일 수도 있다. 이러한 경우, 컴퓨터 판독가능 매체는 SDRAM (synchronous dynamic random access memory) 와 같은 랜덤 액세스 메모리 (RAM), ROM (read-only memory), NVRAM (non-volatile random access memory), EEPROM (electrically erasable programmable read-only memory), FLASH 메모리 등을 포함할 수도 있다.
프로그램 코드는 컴퓨터 판독가능 명령의 형태로 메모리에 저장될 수도 있다. 이러한 경우, DSP 와 같은 프로세서는 본 명세서에 설명된 하나 이상의 BSS 강화 기술을 수행하기 위해 메모리에 저장된 명령을 실행할 수도 있다. 몇몇 경우, 이 기술은 프로세스를 가속화시키기 위해 다양한 하드웨어 컴포넌트를 ghcnf하는 DSP 에 의해 실행될 수도 있다. 다른 경우, 본 명세서에 설명된 유닛은 마이크로프로세서, 하나 이상의 ASIC (application specific integrated circuit), 하나 이상의 FPGA (field programmable gate array), 하나 이상의 CPLD (complex programmable logic device), 또는 몇몇 다른 하드웨어-소프트웨어 조합으로서 구현될 수도 있다. 본 명세서에 설명된 유닛은 공통의 하드웨어, 회로 또는 프로세서로 집적될 수도 있다. 구체적으로, 본 개시물에 설명된 전처리 유닛 및 후처리 유닛은 본 명세서에 설명된 BSS 유닛을 갖는 하나의 공통 유닛으로서 구현될 수 있다.
이러한 실시형태 및 다른 실시형태가 이하의 청구범위의 범위 내에 있다.

Claims (37)

  1. 오디오 신호들을 처리하는 방법으로서,
    제 1 센서와 관련된 제 1 신호 및 제 2 센서와 관련된 제 2 신호를 수신하는 단계;
    상기 제 1 신호로부터 상기 제 2 신호를 상관해제하기 위해 상기 제 2 신호를 전처리하는 단계;
    제 1 BSS (blind source separation) 신호를 발생시키기 위해 상기 제 1 신호에 블라인드 소스 분리 기술 (BSS) 을 적용하는 단계; 및
    제 2 BSS 신호를 발생시키기 위해 상기 전처리된 제 2 신호에 상기 BSS 기술을 적용하는 단계를 포함하는, 오디오 신호들을 처리하는 방법.
  2. 제 1 항에 있어서,
    상기 제 2 신호를 전처리하는 단계는, 상기 제 1 신호에 적응성 필터를 적용하는 단계, 및 상기 제 2 신호로부터 상기 적응성 필터링된 제 1 신호를 감산하는 단계를 포함하는, 오디오 신호들을 처리하는 방법.
  3. 제 2 항에 있어서,
    상기 제 2 신호를 전처리하는 단계는, 상기 제 2 신호로부터 상기 적응성 필터링된 제 1 신호를 감산하는 단계 이전에, 상기 제 2 신호를 지연시키는 단계를 더 포함하는, 오디오 신호들을 처리하는 방법.
  4. 제 3 항에 있어서,
    상기 제 2 신호를 전처리하는 단계는, 상기 제 2 신호와 상기 적응성 필터링된 제 1 신호 사이의 차이에 대한 상기 제 1 신호의 노이즈 플로어들의 비율에 기초하여 교정 인자를 발생시키는 단계를 더 포함하는, 오디오 신호들을 처리하는 방법.
  5. 제 4 항에 있어서,
    상기 제 2 신호를 전처리하는 단계는, 상기 차이에 상기 교정 인자를 적용하는 단계를 더 포함하는, 오디오 신호들을 처리하는 방법.
  6. 제 1 항에 있어서,
    상기 제 2 BSS 신호로부터 상기 제 1 BSS 신호를 더 상관해제하기 위해 상기 제 1 BSS 신호를 후처리하는 단계; 및
    상기 후처리된 제 1 BSS 신호를 출력하는 단계를 더 포함하는, 오디오 신호들을 처리하는 방법.
  7. 제 6 항에 있어서,
    상기 제 2 신호를 전처리하는 단계는, 상기 제 1 신호에 제 1 적응성 필터를 적용하는 단계, 및 상기 제 2 신호로부터 상기 적응성 필터링된 제 1 신호를 감산하는 단계를 포함하고,
    상기 제 1 BSS 신호를 후처리하는 단계는, 상기 제 2 BSS 신호에 제 2 적응성 필터를 적용하는 단계, 및 상기 제 1 BSS 신호로부터 상기 적응성 필터링된 제 2 BSS 신호를 감산하는 단계를 포함하는, 오디오 신호들을 처리하는 방법.
  8. 제 7 항에 있어서,
    상기 제 1 BSS 신호를 후처리하는 단계는, 상기 제 1 BSS 신호로부터 상기 적응성 필터링된 제 2 BSS 신호를 감산하는 단계 이전에, 상기 제 1 BSS 신호를 지연시키는 단계를 더 포함하는, 오디오 신호들을 처리하는 방법.
  9. 제 8 항에 있어서,
    상기 제 2 신호를 전처리하는 단계는,
    상기 제 2 신호와 상기 적응성 필터링된 제 1 신호 사이의 차이에 대한 상기 제 1 신호의 노이즈 플로어들의 비율에 기초하여 교정 인자를 발생시키는 단계, 및
    상기 차이에 상기 교정 인자를 적용시키는 단계를 더 포함하는, 오디오 신호들을 처리하는 방법.
  10. 제 1 항에 있어서,
    상기 제 2 BSS 신호로부터 상기 제 1 BSS 신호를 더 상관해제시키기 위해 상기 제 1 BSS 신호 및 상기 제 2 BSS 신호를 후처리하는 단계를 더 포함하는, 오디오 신호들을 처리하는 방법.
  11. 제 1 항에 있어서,
    상기 BSS 기술을 적용하는 단계는,
    상기 제 1 신호에 최소 평균 제곱 (LMS; least mean square) 적응성 필터링을 적용하는 단계;
    상기 LMS 적응성 필터링된 제 1 신호와 상기 전처리된 제 2 신호를 합산하는 단계;
    상기 전처리된 제 2 신호에 LMS 적응성 필터링을 적용하는 단계; 및
    상기 LMS 적응성 필터링되며 전처리된 제 2 신호와 상기 제 1 신호를 합산하는 단계를 포함하는, 오디오 신호들을 처리하는 방법.
  12. 제 1 항에 있어서,
    상기 제 1 신호는 제 1 마이크로폰과 관련된 제 1 오디오 신호를 포함하고,
    상기 제 2 신호는 제 2 마이크로폰과 관련된 제 2 오디오 신호를 포함하는, 오디오 신호들을 처리하는 방법.
  13. 제 12 항에 있어서,
    상기 제 1 마이크로폰을 사용하여 상기 제 1 오디오 신호를 캡처하는 단계, 및 상기 제 2 마이크로폰을 사용하여 상기 제 2 오디오 신호를 캡처하는 단계를 더 포함하는, 오디오 신호들을 처리하는 방법.
  14. 제 13 항에 있어서,
    상기 캡처된 오디오 신호들을 아날로그 신호들로부터 디지털 신호들로 변환하는 단계를 더 포함하는, 오디오 신호들을 처리하는 방법.
  15. 제 13 항에 있어서,
    상기 제 1 오디오 신호는, 상기 제 1 마이크로폰과 상기 제 2 마이크로폰의 공간적 근접성으로 인해 상기 제 2 오디오 신호와 고 상관되는 (highly correlated), 오디오 신호들을 처리하는 방법.
  16. 제 15 항에 있어서,
    상기 오디오 신호들을 처리하는 방법은 무선 통신 디바이스에서 실행되는, 오디오 신호들을 처리하는 방법.
  17. 오디오 신호들을 처리하는 디바이스로서,
    제 1 신호를 발생시키는 제 1 센서 및 제 2 신호를 발생시키는 제 2 센서;
    상기 제 2 신호를 전처리하여, 상기 제 1 신호로부터 상기 제 2 신호를 상관해제하는 전처리 유닛; 및
    상기 제 1 신호 및 상기 전처리된 제 2 신호에 BSS (blind source separation) 기술을 적용하여, 제 1 BSS 신호 및 제 2 BSS 신호를 각각 발생시키는 블라인드 소스 분리 유닛을 포함하는, 오디오 신호들을 처리하는 디바이스.
  18. 제 17 항에 있어서,
    상기 전처리 유닛은, 상기 제 1 신호에 적응성 필터를 적용하고, 상기 제 2 신호로부터 상기 적응성 필터링된 제 1 신호를 감산하는, 오디오 신호들을 처리하는 디바이스.
  19. 제 18 항에 있어서,
    상기 전처리 유닛은, 상기 제 2 신호와 상기 적응성 필터링된 제 1 신호 사이의 차이에 대한 상기 제 1 신호의 노이즈 플로어들의 비율에 기초하여 교정 인자를 발생시키는, 오디오 신호들을 처리하는 디바이스.
  20. 제 19 항에 있어서,
    상기 전처리 유닛은, 상기 차이에 상기 교정 인자를 적용시키는, 오디오 신호들을 처리하는 디바이스.
  21. 제 17 항에 있어서,
    상기 제 1 BSS 신호를 후처리하여 상기 제 2 BSS 신호로부터 상기 제 1 BSS 신호를 더 상관해제하고, 상기 후처리된 제 1 BSS 신호를 출력하는 후처리 유닛을 더 포함하는, 오디오 신호들을 처리하는 디바이스.
  22. 제 21 항에 있어서,
    상기 전처리 유닛은, 상기 제 1 신호에 제 1 적응성 필터를 적용하고, 상기 제 2 신호로부터 상기 적응성 필터링된 제 1 신호를 감산하며;
    상기 후처리 유닛은, 상기 제 2 BSS 신호에 제 2 적응성 필터를 적용하고, 상기 제 1 BSS 신호로부터 상기 적응성 필터링된 제 2 BSS 신호를 감산하는, 오디오 신호들을 처리하는 디바이스.
  23. 제 22 항에 있어서,
    상기 후처리 유닛은, 상기 제 1 BSS 신호로부터 상기 적응성 필터링된 제 2 BSS 신호를 감산하기 전에, 상기 제 1 BSS 신호를 지연시키는, 오디오 신호들을 처리하는 디바이스.
  24. 제 23 항에 있어서,
    상기 전처리 유닛은,
    상기 제 2 신호와 상기 적응성 필터링된 제 1 신호 사이의 차이에 대한 상기 제 1 신호의 노이즈 플로어들의 비율에 기초하여 교정 인자를 발생시키고,
    상기 차이에 상기 교정 인자를 적용하는, 오디오 신호들을 처리하는 디바이스.
  25. 제 21 항에 있어서,
    상기 후처리 유닛은, 상기 제 1 BSS 신호 및 상기 제 2 BSS 신호를 후처리하여, 상기 제 2 BSS 신호로부터 상기 제 1 BSS 신호를 더 상관해제시키는, 오디오 신호들을 처리하는 디바이스.
  26. 제 18 항에 있어서,
    상기 전처리 유닛은, 상기 제 2 신호로부터 상기 적응성 필터링된 제 1 신호를 감산하기 전에, 상기 제 2 신호를 지연시키는, 오디오 신호들을 처리하는 디바이스.
  27. 제 17 항에 있어서,
    상기 BSS 유닛은,
    상기 제 1 신호에 최소 평균 제곱 (LMS; least mean square) 적응성 필터링을 적용하고,
    상기 LMS 적응성 필터링된 제 1 신호와 상기 전처리된 제 2 신호를 합산하고,
    상기 전처리된 제 2 신호에 LMS 적응성 필터링을 적용하고,
    상기 제 1 신호와 상기 LMS 적응성 필터링되며 전처리된 제 2 신호를 합산하는, 오디오 신호들을 처리하는 디바이스.
  28. 제 17 항에 있어서,
    상기 제 1 센서는 제 1 마이크로폰을 포함하고, 상기 제 2 센서는 제 2 마이크로폰을 포함하며,
    상기 제 1 신호는 상기 제 1 마이크로폰과 관련된 제 1 오디오 신호를 포함하고, 상기 제 2 신호는 상기 제 2 마이크로폰과 관련된 제 2 오디오 신호를 포함하는, 오디오 신호들을 처리하는 디바이스.
  29. 제 28 항에 있어서,
    상기 제 1 오디오 신호는, 상기 제 1 마이크로폰과 상기 제 2 마이크로폰의 공간적 근접성으로 인해 상기 제 2 오디오 신호와 고 상관되는 (highly correlated), 오디오 신호들을 처리하는 디바이스.
  30. 제 17 항에 있어서,
    상기 오디오 신호들을 처리하는 디바이스는 무선 통신 디바이스를 포함하는, 오디오 신호들을 처리하는 디바이스.
  31. 오디오 신호들을 처리하는 명령들을 포함하는 컴퓨터-판독가능 매체로서,
    상기 명령들은 실행 시에 컴퓨터로 하여금,
    제 1 신호 및 제 2 신호를 수신하게 하고;
    상기 제 1 신호로부터 상기 제 2 신호를 상관해제하기 위해 상기 제 2 신호를 전처리하게 하고;
    제 1 BSS (blind source separation) 신호 및 제 2 BSS 신호를 각각 발생시키기 위해 상기 제 1 신호 및 상기 전처리된 제 2 신호에 블라인드 소스 분리 기술을 적용하게 하는, 오디오 신호들을 처리하는 명령들을 포함하는 컴퓨터-판독가능 매체.
  32. 제 31 항에 있어서,
    상기 제 2 신호를 전처리하는 것은,
    상기 제 1 신호에 적응성 필터를 적용하는 것,
    상기 제 2 신호로부터 상기 적응성 필터링된 제 1 신호를 감산하는 것,
    상기 제 2 신호와 상기 적응성 필터링된 제 1 신호 사이의 차이에 대한 상기 제 1 신호의 노이즈 플로어들의 비율에 기초하여 교정 인자를 발생시키는 것, 및
    상기 차이에 상기 교정 인자를 적용하는 것을 포함하는, 오디오 신호들을 처리하는 명령들을 포함하는 컴퓨터-판독가능 매체.
  33. 제 31 항에 있어서,
    상기 명령들은:
    상기 제 2 BSS 신호로부터 상기 제 1 BSS 신호를 또한 상관해제하기 위해 상기 제 1 BSS 신호를 후처리하는, 오디오 신호들을 처리하는 명령들을 포함하는 컴퓨터-판독가능 매체.
  34. 제 33 항에 있어서,
    상기 제 2 신호를 전처리하는 것은,
    상기 제 1 신호에 적응성 필터를 적용하는 것;
    상기 제 2 신호에 지연을 적용하는 것;
    상기 지연된 제 2 신호로부터 상기 적응성 필터링된 제 1 신호를 감산하는 것;
    상기 제 2 신호와 상기 적응성 필터링된 제 1 신호 사이의 차이에 대한 상기 제 1 신호의 노이즈 플로어들의 비율에 기초하여 교정 인자를 발생시키는 것; 및
    상기 차이에 상기 교정 인자를 적용시키는 것을 포함하며,
    상기 제 1 BSS 신호를 후처리하는 것은,
    상기 제 1 BSS 신호를 지연시키는 것;
    상기 제 2 BSS 신호에 제 2 적응성 필터를 적용하는 것; 및
    상기 지연된 제 1 BSS 신호로부터 상기 적응성 필터링된 제 2 BSS 신호를 감산하는 것을 포함하는, 오디오 신호들을 처리하는 명령들을 포함하는 컴퓨터-판독가능 매체.
  35. 제 31 항에 있어서,
    상기 제 1 신호는 제 1 마이크로폰과 관련된 제 1 오디오 신호를 포함하고,
    상기 제 2 신호는 제 2 마이크로폰과 관련된 제 2 오디오 신호를 포함하는, 오디오 신호들을 처리하는 명령들을 포함하는 컴퓨터-판독가능 매체.
  36. 오디오 신호들을 처리하는 장치로서,
    제 1 신호를 발생시키는 수단;
    제 2 신호를 발생시키는 수단;
    상기 제 2 신호를 전처리하여, 상기 제 1 신호로부터 상기 제 2 신호를 상관해제하는 수단; 및
    상기 제 1 신호와 상기 전처리된 제 2 신호에 블라인드 소스 분리 (blind source separation) 기술을 적용하여, 제 1 BSS 신호 및 제 2 BSS 신호를 각각 발생시키는 수단을 포함하는, 오디오 신호들을 처리하는 장치.
  37. 제 36 항에 있어서,
    상기 제 1 BSS 신호를 후처리하여, 상기 제 2 BSS 신호로부터 상기 제 1 BSS 신호를 더 상관해제하는 수단을 더 포함하는, 오디오 신호들을 처리하는 장치.
KR1020087029520A 2006-05-02 2007-04-20 블라인드 소스 분리 (bss) 를 위한 강화 기술 KR101019395B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US79726406P 2006-05-02 2006-05-02
US60/797,264 2006-05-02
US11/551,509 US7970564B2 (en) 2006-05-02 2006-10-20 Enhancement techniques for blind source separation (BSS)
US11/551,509 2006-10-20

Publications (2)

Publication Number Publication Date
KR20090016463A KR20090016463A (ko) 2009-02-13
KR101019395B1 true KR101019395B1 (ko) 2011-03-07

Family

ID=38325402

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020087029520A KR101019395B1 (ko) 2006-05-02 2007-04-20 블라인드 소스 분리 (bss) 를 위한 강화 기술

Country Status (6)

Country Link
US (1) US7970564B2 (ko)
EP (1) EP2013870A1 (ko)
JP (1) JP4927942B2 (ko)
KR (1) KR101019395B1 (ko)
CN (1) CN101432805B (ko)
WO (1) WO2007130797A1 (ko)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8280072B2 (en) 2003-03-27 2012-10-02 Aliphcom, Inc. Microphone array with rear venting
US8019091B2 (en) 2000-07-19 2011-09-13 Aliphcom, Inc. Voice activity detector (VAD) -based multiple-microphone acoustic noise suppression
US9066186B2 (en) 2003-01-30 2015-06-23 Aliphcom Light-based detection for acoustic applications
US9099094B2 (en) 2003-03-27 2015-08-04 Aliphcom Microphone array with rear venting
US7970564B2 (en) 2006-05-02 2011-06-28 Qualcomm Incorporated Enhancement techniques for blind source separation (BSS)
WO2008043731A1 (de) * 2006-10-10 2008-04-17 Siemens Audiologische Technik Gmbh Verfahren zum betreiben einer hörhilfe, sowie hörhilfe
US8175871B2 (en) 2007-09-28 2012-05-08 Qualcomm Incorporated Apparatus and method of noise and echo reduction in multiple microphone audio systems
US8954324B2 (en) 2007-09-28 2015-02-10 Qualcomm Incorporated Multiple microphone voice activity detector
US8223988B2 (en) * 2008-01-29 2012-07-17 Qualcomm Incorporated Enhanced blind source separation algorithm for highly correlated mixtures
US8411880B2 (en) * 2008-01-29 2013-04-02 Qualcomm Incorporated Sound quality by intelligently selecting between signals from a plurality of microphones
US9113240B2 (en) * 2008-03-18 2015-08-18 Qualcomm Incorporated Speech enhancement using multiple microphones on multiple devices
US8731211B2 (en) * 2008-06-13 2014-05-20 Aliphcom Calibrated dual omnidirectional microphone array (DOMA)
US8503694B2 (en) * 2008-06-24 2013-08-06 Microsoft Corporation Sound capture system for devices with two microphones
EP2350926A2 (en) * 2008-11-24 2011-08-03 Institut Ruder Boskovic Method of and system for blind extraction of more than two pure components out of spectroscopic or spectrometric measurements of only two mixtures by means of sparse component analysis
KR101233271B1 (ko) * 2008-12-12 2013-02-14 신호준 신호 분리 방법, 상기 신호 분리 방법을 이용한 통신 시스템 및 음성인식시스템
WO2011030172A1 (en) * 2009-09-10 2011-03-17 Rudjer Boskovic Institute Method of and system for blind extraction of more pure components than mixtures in id and 2d nmr spectroscopy and mass spectrometry by means of combined sparse component analysis and detection of single component points
DE102010006956B4 (de) 2010-02-02 2012-03-29 Technische Universität Berlin Verfahren und Messgerät zum Messen der Sauerstoffsättigung im Blut
US8583428B2 (en) * 2010-06-15 2013-11-12 Microsoft Corporation Sound source separation using spatial filtering and regularization phases
CN103270772B (zh) * 2010-11-25 2017-06-06 日本电气株式会社 信号处理设备、信号处理方法
US20120294446A1 (en) * 2011-05-16 2012-11-22 Qualcomm Incorporated Blind source separation based spatial filtering
CN102543098B (zh) * 2012-02-01 2013-04-10 大连理工大学 一种分频段切换cmn非线性函数的频域语音盲分离方法
CN103903631B (zh) * 2014-03-28 2017-10-03 哈尔滨工程大学 基于变步长自然梯度算法的语音信号盲分离方法
US9747922B2 (en) 2014-09-19 2017-08-29 Hyundai Motor Company Sound signal processing method, and sound signal processing apparatus and vehicle equipped with the apparatus
US9769563B2 (en) * 2015-07-22 2017-09-19 Harman International Industries, Incorporated Audio enhancement via opportunistic use of microphones
EP3335217B1 (en) 2015-12-21 2022-05-04 Huawei Technologies Co., Ltd. A signal processing apparatus and method
US11234072B2 (en) 2016-02-18 2022-01-25 Dolby Laboratories Licensing Corporation Processing of microphone signals for spatial playback
CN106531156A (zh) * 2016-10-19 2017-03-22 兰州交通大学 一种基于室内多移动源实时处理的语音信号增强技术方法
CN107945815B (zh) * 2017-11-27 2021-09-07 歌尔科技有限公司 语音信号降噪方法及设备
CN108766455B (zh) * 2018-05-16 2020-04-03 南京地平线机器人技术有限公司 对混合信号进行降噪的方法和装置
CN110782911A (zh) * 2018-07-30 2020-02-11 阿里巴巴集团控股有限公司 音频信号处理方法、装置、设备和存储介质
US11170760B2 (en) * 2019-06-21 2021-11-09 Robert Bosch Gmbh Detecting speech activity in real-time in audio signal
CN113191233B (zh) * 2021-04-21 2023-04-18 东莞理工学院城市学院 盲信号分离方法及系统、电子设备及存储介质

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL101556A (en) * 1992-04-10 1996-08-04 Univ Ramot Multi-channel signal separation using cross-polyspectra
US5825671A (en) * 1994-03-16 1998-10-20 U.S. Philips Corporation Signal-source characterization system
JP2758846B2 (ja) 1995-02-27 1998-05-28 埼玉日本電気株式会社 ノイズキャンセラ装置
US5694474A (en) 1995-09-18 1997-12-02 Interval Research Corporation Adaptive filter for signal processing and method therefor
JP3505085B2 (ja) * 1998-04-14 2004-03-08 アルパイン株式会社 オーディオ装置
US6526148B1 (en) * 1999-05-18 2003-02-25 Siemens Corporate Research, Inc. Device and method for demixing signal mixtures using fast blind source separation technique based on delay and attenuation compensation, and for selecting channels for the demixed signals
US6424960B1 (en) * 1999-10-14 2002-07-23 The Salk Institute For Biological Studies Unsupervised adaptation and classification of multiple classes and sources in blind signal separation
US7558391B2 (en) * 1999-11-29 2009-07-07 Bizjak Karl L Compander architecture and methods
WO2001095666A2 (en) 2000-06-05 2001-12-13 Nanyang Technological University Adaptive directional noise cancelling microphone system
US20030179888A1 (en) * 2002-03-05 2003-09-25 Burnett Gregory C. Voice activity detection (VAD) devices and methods for use with noise suppression systems
KR100394840B1 (ko) * 2000-11-30 2003-08-19 한국과학기술원 독립 성분 분석을 이용한 능동 잡음 제거방법
JP3364487B2 (ja) * 2001-06-25 2003-01-08 隆義 山本 複合音声データの音声分離方法、発言者特定方法、複合音声データの音声分離装置、発言者特定装置、コンピュータプログラム、及び、記録媒体
GB0204548D0 (en) * 2002-02-27 2002-04-10 Qinetiq Ltd Blind signal separation
JP3682032B2 (ja) * 2002-05-13 2005-08-10 株式会社ダイマジック オーディオ装置並びにその再生用プログラム
US7082204B2 (en) 2002-07-15 2006-07-25 Sony Ericsson Mobile Communications Ab Electronic devices, methods of operating the same, and computer program products for detecting noise in a signal based on a combination of spatial correlation and time correlation
US7383178B2 (en) * 2002-12-11 2008-06-03 Softmax, Inc. System and method for speech processing using independent component analysis under stability constraints
JP2004274683A (ja) * 2003-03-12 2004-09-30 Matsushita Electric Ind Co Ltd エコーキャンセル装置、エコーキャンセル方法、プログラムおよび記録媒体
US7099821B2 (en) * 2003-09-12 2006-08-29 Softmax, Inc. Separation of target acoustic signals in a multi-transducer arrangement
JP2005227512A (ja) * 2004-02-12 2005-08-25 Yamaha Motor Co Ltd 音信号処理方法及びその装置、音声認識装置並びにプログラム
DE102004049347A1 (de) * 2004-10-08 2006-04-20 Micronas Gmbh Schaltungsanordnung bzw. Verfahren für Sprache enthaltende Audiosignale
CN1314000C (zh) * 2004-10-12 2007-05-02 上海大学 基于盲信号分离的语音增强装置
WO2006131959A1 (ja) * 2005-06-06 2006-12-14 Saga University 信号分離装置
US7464029B2 (en) * 2005-07-22 2008-12-09 Qualcomm Incorporated Robust separation of speech signals in a noisy environment
JP4556875B2 (ja) * 2006-01-18 2010-10-06 ソニー株式会社 音声信号分離装置及び方法
US7970564B2 (en) 2006-05-02 2011-06-28 Qualcomm Incorporated Enhancement techniques for blind source separation (BSS)

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Caihua Zhao et al. 'An effective method on blind speech separation in strong noisy environment', Proceedings of 2005 IEEE Int. Workshop VLSI Design & Video Tech., pp. 211-214, May 2005*
Miguel Figueroa et al. 'Adaptive signal processing in mixed-signal VLSI with Anti-Hebbian learning', Proceedings of the 2006 Emerging VLSI Technologies and Architectures, March 2006.*

Also Published As

Publication number Publication date
US20070257840A1 (en) 2007-11-08
CN101432805A (zh) 2009-05-13
WO2007130797A1 (en) 2007-11-15
JP2009535998A (ja) 2009-10-01
US7970564B2 (en) 2011-06-28
JP4927942B2 (ja) 2012-05-09
CN101432805B (zh) 2012-05-23
EP2013870A1 (en) 2009-01-14
KR20090016463A (ko) 2009-02-13

Similar Documents

Publication Publication Date Title
KR101019395B1 (ko) 블라인드 소스 분리 (bss) 를 위한 강화 기술
US6449586B1 (en) Control method of adaptive array and adaptive array apparatus
JP5678023B2 (ja) 高度に相関する混合のための強調ブラインド信号源分離アルゴリズム
RU2483439C2 (ru) Робастная система подавления шума с двумя микрофонами
JP4184342B2 (ja) 適応型フィルタを用いてサブバンド信号を処理する方法及びシステム
JP5038143B2 (ja) エコーキャンセル
KR101610662B1 (ko) 분해된 오디오 신호의 재구성 시스템 및 방법
WO2012046582A1 (ja) 信号処理装置、信号処理方法、及び信号処理プログラム
US20020013695A1 (en) Method for noise suppression in an adaptive beamformer
US7602926B2 (en) Stationary spectral power dependent audio enhancement system
WO2009130513A1 (en) Two microphone noise reduction system
JP2007288775A (ja) マルチチャネルエコー補正システムおよび方法
KR20070088751A (ko) 잡음억제방법과 장치, 및 컴퓨터프로그램
EP3155618A1 (en) Multi-band noise reduction system and methodology for digital audio signals
Bonnetat et al. An adaptive all-digital blind compensation of dual-TIADC frequency-response mismatch based on complex signal correlations
WO2007123048A1 (ja) 適応アレイ制御装置、方法、プログラム、及びこれを利用した適応アレイ処理装置、方法、プログラム
Hidri et al. About multichannel speech signal extraction and separation techniques
Lemos et al. Spatial filtering based on differential spectrum for improving ML DOA estimation performance
US20050118956A1 (en) Audio enhancement system having a spectral power ratio dependent processor
JP3673727B2 (ja) 反響消去方法、その装置、そのプログラム及びその記録媒体
Dam et al. Blind signal separation using steepest descent method
JP5228903B2 (ja) 信号処理装置および方法
WO2016045706A1 (en) Method and apparatus for generating a directional sound signal from first and second sound signals
Kim et al. Variable step-size affine projection sign algorithm using selective input vectors
Jeong Real-time whitening application to two microphone sensors for comb filtering and smoothing

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140129

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20150129

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee