KR100600313B1 - 다중경로 다채널 혼합신호의 주파수 영역 블라인드 분리를 위한 방법 및 그 장치 - Google Patents

다중경로 다채널 혼합신호의 주파수 영역 블라인드 분리를 위한 방법 및 그 장치 Download PDF

Info

Publication number
KR100600313B1
KR100600313B1 KR20040013016A KR20040013016A KR100600313B1 KR 100600313 B1 KR100600313 B1 KR 100600313B1 KR 20040013016 A KR20040013016 A KR 20040013016A KR 20040013016 A KR20040013016 A KR 20040013016A KR 100600313 B1 KR100600313 B1 KR 100600313B1
Authority
KR
South Korea
Prior art keywords
signal
separation
multi
frequency domain
blind
Prior art date
Application number
KR20040013016A
Other languages
English (en)
Other versions
KR20050087291A (ko
Inventor
남승현
Original Assignee
남승현
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 남승현 filed Critical 남승현
Priority to KR20040013016A priority Critical patent/KR100600313B1/ko
Publication of KR20050087291A publication Critical patent/KR20050087291A/ko
Application granted granted Critical
Publication of KR100600313B1 publication Critical patent/KR100600313B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06KRECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K9/00Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
    • G06K9/62Methods or arrangements for recognition using electronic means
    • G06K9/6217Design or setup of recognition systems and techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06K9/6232Extracting features by transforming the feature space, e.g. multidimensional scaling; Mappings, e.g. subspace methods
    • G06K9/624Extracting features by transforming the feature space, e.g. multidimensional scaling; Mappings, e.g. subspace methods based on a separation criterion, e.g. independent component analysis

Abstract

1. 청구범위에 기재된 발명이 속한 기술 분야
본 발명은 다중 경로에 의하여 혼합된 독립적인 신호들을 신호에 대한 사전 정보 없이 분리하는 다중경로 다채널 혼합신호의 주파수 영역 블라인드 분리(Blind Source Separation)를 위한 방법 및 그 장치와 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것임
2. 발명이 해결하고자 하는 기술적 과제
본 발명은 실제 소음 환경에서 다중 경로를 통해 혼합되어 여러 개의 센서(Sensor)를 통해 수집된 음성 및 오디오 신호들로부터 분리필터를 추정하여 원신호를 분리해내는 경우에, 분리필터의 빠른 수렴을 위해 적용되는 자연접선기울기를 주파수 영역에서 효과적으로 적용시킴으로써, 빠르고 안정적인 적응 분리회로를 구현할 수 있는 주파수 영역의 다중경로 다채널 블라인드 혼합신호 분리를 위한 장치 및 그 방법을 제공함.
3. 발명의 해결 방법의 요지
본 발명의 주파수 영역의 다중경로 다채널 블라인드 혼합신호 분리를 위한 장치는, 수집된 다채널 혼합신호를 주파수 영역에서 블록(Block) 단위로 분리하기 위해, 수집된 다채널 혼합신호로부터 여러 개의 블록들로 구성된 현재 프레임(Frame)을 형성하는 수단; 상기 현재 프레임의 신호를 주파수 영역에서 분리하는 수단; 상기 분리된 신호를 비선형함수를 통해 변환하는 수단; 상기 분리신호와 비선형 변환된 신호를 이용하여 정규화된 상호전력 스펙트럼(Cross-Power Spectrum)을 계산하는 수단; 상기 정규화된 상호전력 스펙트럼을 이용하여 자연접선 기울기를 계산하는 수단; 상기 자연접선 기울기를 이용하여 분리필터 계수를 갱신하는 수단; 상기 갱신된 분리필터계수를 정규화하는 수단; 상기 분리필터의 수렴을 점검하는 수단; 상기 분리필터가 수렴된 경우 분리필터를 이용하여 신호를 분리하는 수단을 포함함.
4. 발명의 중요한 용도
블라인드 신호분리 기술은 다중 마이크로폰 (Microphone) 어레이를 이용한 화자 추적, 열화된 신호의 음성인식이나 음질 향상을 위한 음성부호화기의 전 처리기, 3차원 객체지향 오디오 신호처리를 위한 신호 분리기, 스테레오 반향제거기(Stereophonic Echo Canceller), 통신 채널의 간섭제거, 도래각(Direction of Arrival) 추정이나 EEG나 MEG과 같은 생체신호 등에서 광범위하게 활용됨.
블라인드 신호 분리, 다채널 블라인드 디콘볼루션(Multichannel Blind Deconvolution), 자연접선기울기, 논홀로노믹(Nonholonomic)

Description

다중경로 다채널 혼합신호의 주파수 영역 블라인드 분리를 위한 방법 및 그 장치{The Methods and Apparatus for Blind Separation of Multichannel Convolutive Mixtures in the Frequency-domain}

도 1은 다채널 다중경로 혼합신호 블라인드 분리 장치에 대한 구성도.

도 2a는 자연접선기울기를 이용한 다채널 블라인드 디콘볼루션 알고리즘의 블록도.

도 2b는 다채널 혼합신호를 분리하기 위한 다채널 분리필터 다이어그램 (2채널 예).

도 2c는 메모리가 없는 비선형 함수를 이용한 혼합신호의 확률밀도를 균일한 확률밀도로 변환하는 개념도.

도 3은 자연접선기울기를 이용한 주파수 영역 다채널 블라인드 디콘볼루션 알고리즘의 순서도.

도 4a는 실제 사무실 환경에서 녹음된 혼합된 음성-음악신호(x1,x2)와 본 발명의 방법을 이용하여 분리한 음성-음악 분리신호(u1,u2).

도 4b는 실제 사무실 환경에서 녹음된 혼합된 음성-음악신호를 본 발명의 분리방법을 이용하여 분리한 결과 최종적으로 수렴된 분리필터 계수.

도 5는 두 사람의 원음성(s1,s2), 가상의 혼합회로를 통해 혼합된 음성(x1,x2), 본 발명의 분리 방법을 분리한 음성(u1,u2)의 파형 비교.

<도면의 주요 부분에 대한 부호의 설명>

100 : 분리 장치102 : 센서 어레이

104 : 신호처리 프로세서106 : 녹음장치

108 : 컴퓨터 시스템110 : 입력 장치

112 : 출력 장치114 : 중앙처리장치

116 : 보조회로118 : 음성인식기/음성부호화기

120 : 입출력 인터페이스122 : 메모리

124 : 주파수 영역 다채널 블라인드 디콘볼루션 프로그램

126 : 다채널 혼합신호 입력 장치

201 : 분리부202 : 비선형 변환부

203 : 자연접선기울기를 이용한 분리필터 계수 갱신 연산부

301 : 다채널 혼합신호 입력 유닛302 : 현재 프레임 형성 유닛

303 : 현재 프레임 신호 분리 유닛304 : 비선형 함수 변환 유닛

305 : 정규화된 상호전력 스펙트럼 계산 유닛

306 : 상호전력 스펙트럼 계산 유닛307 : 평균전력 스펙트럼 유닛

308 : 상호전력 스펙트럼 정규화 유닛

309 : 시간 영역의 제약조건 적용 유닛310 : 자연접선기울기 계산 유닛

311 : 분리필터 계수 갱신 유닛

312 : 분리필터 계수 정규화 유닛

313 : 수렴여부 판단 유닛314 : 신호분리 출력 유닛

본 발명은 신호처리 분야에 속하며 보다 구체적으로는 다중경로 다채널 혼합신호의 주파수 영역 블라인드 분리를 위한 방법 및 그 장치와 상기 방법을 실현하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것이다.

실제 소음환경에서 음성이나 오디오 신호들은 다중 경로를 통해 혼합되어 여러 센서들에 인가되므로 원 신호를 얻기 위해서는 혼합된 신호들을 분리할 필요가 있다. 이때 원 신호에 대한 사전 정보 없이 신호를 분리하는 기술을 블라인드 신호분리 (Blind Source Separation; BSS) 기술이라고 부른다. 블라인드 신호분리는 다중 화자 혹은 소나 어레이(Sonar Array) 등과 같은 서로 독립적인 신호들이 다중 경로를 통해 혼합되었을 때 이를 분리하는데 매우 효과적인 기술이다. 블라인드 신호분리 기술은 다중 마이크로폰 (Microphone) 어레이를 이용한 화자 추적, 열화된 신호의 음성인식이나 음질 향상을 위한 음성부호화기의 전 처리기, 3차원 객체지향 오디오 신호처리를 위한 신호 분리기, 스테레오 반향제거기(Stereophonic Echo Canceller), 통신 채널의 간섭제거, 도래각(Direction of Arrival) 추정이나 EEG나 MEG과 같은 생체신호 등에서 광범위하게 활용된다.

대부분의 블라인드 신호 분리 방식은 다중 혼합 경로의 영향을 무효화함으로써 원 신호를 복원하고자 한다. 다중 혼합 경로의 영향을 무효화하는데 필요한 이상적인 다중 분리에는 무한 길이의 필터가 필요하지만 대부분의 실용 가능한 상황에서는 유한 길이의 분리필터로서도 충분히 가능하다. 특히, 화자나 물체의 이동이나 환경의 변화에 충분히 빠르게 적응적으로 반응하기 위한 블라인드 신호분리 방법이 필요하다.

현재 널리 사용되고 있는 다채널 블라인드 신호 분리의 두 가지 유형은 (1) 독립적인 신호들의 2차 통계 특성을 이용한 다중 상관관계 제거 (Multiple Decorrelation) 방식과 (2) 비선형 함수를 이용한 다채널 블라인드 디콘볼루션 (Multichannel Blind Deconvolution: MBD) 방식이다.

대표적인 다중 상관관계 제거 방식으로는 최근 제안된 Convolutive Blind Source Separation Using A Multiple Decorrelation Method (Lucas Parra and Clay Spence, US Patent 6167417)가 있다. 이 방법은 수렴 속도가 빠르고 안정적인 특징이 있지만 주파수 영역에서 분리신호들이 서로 뒤섞이는 (Frequency Permutation) 단점이 있다. 또한 대각 분리필터를 1로 고정하고 비대각 분리필터만을 가지고 분리하기 때문에 분리 성능이 떨어지는 단점도 있다.

MBD 방식에는 여러 방법들이 제안되었지만 그중 다중경로 혼합에서 가장 좋은 성능을 나타내는 것으로는 자연접선기울기를 이용한 MBD 방식이다. 이 방식은 원 신호가 평탄한 스펙트럼을 갖는 통신채널의 등화에는 매우 성공적이지만 음성이나 오디오 신호와 같이 스펙트럼이 기울어진 신호에 대하여는 매우 부적절하다. 그 이유는 MBD 방식이 평탄한 스펙트럼을 가정하여 유도되었기 때문에 분리 스펙트럼이 평탄해질 때까지 분리과정이 진행되기 때문이다. 이러한 현상을 백색화 현상 (Whitening Effect)이라고 부른다.

최근 이러한 문제점을 극복하기 위해 주파수 영역에서 자연접선기울기를 사용하는 MBD 방식의 블라인드 신호분리가 고안되었다 (다중경로 혼합신호 분리 장치 및 그 방법, 특허출원번호:10-2003-36759,출원일:2003-6-9). 그러나 이 방식의 경우 자유접선기울기가 여전히 논홀로노믹(Nonholonomic) 특성을 충분히 만족시켜주지 못하므로 분리된 신호의 음질이 크게 저하되며 안정성이 떨어지는 단점이 있다. 본 발명에서는 자연접선기울기가 주파수 영역에서 논홀로노믹 특성을 만족하도록 정규화하는 방법을 제공함으로써 수렴특성을 안정화시키고, 분리성능을 크게 향상시키고, 백색화 현상을 효율적으로 제거함으로써 음질을 크게 향상시킨다.

상기의 단점들은 본 발명에서 제안하는 에일리어싱이 제거된 정규화된 상호전력 스펙트럼을 사용하는 블록 주파수 영역의 블라인드 신호분리 방법과 그 장치를 통해 극복된다. 구체적으로, 본 발명은 블라인드 신호 분리 방식이 잘못된 필터로 수렴하는 것을 방지하기 위해 상호전력 스펙트럼을 계산할 때 과거 프레임으로부터의 분리신호를 사용하지 않고 오직 현재 프레임에서 분리된 신호만을 사용한다. 또한 에일리어싱이 제거된 정규화된 상호전력 스펙트럼을 사용함으로써 빠르고 안정적인 수렴을 보장하는 동시에 우수한 분리 성능과 우수한 분리신호 음질을 제공한다. 우수한 분리신호 음질은 음성인식기나 음성부호화기와 같은 응용에서는 매우 중요한 요소이다.

본 발명은 블라인드 신호 분리를 위한 다중 경로 분리회로 필터를 추정하기 위하여 주파수 영역에서 안정적인 정규화된 자연접선기울기를 이용하는 다채널 블라인드 신호분리 방법과 그 장치를 제공한다.

도 1은 본 발명의 온라인(On-Line)과 오프라인(Off-Line) 신호 분리 방법을 구현하기 위한 시스템(100)이다. 시스템은 다중경로 혼합신호를 제공하는 입력 장치(126)와 이를 분리하는 주파수 영역 다채널 블라인드 디콘볼루션 프로그램(124)이 내장된 컴퓨터 시스템(108)으로 구성되어 있다. 다중경로 혼합신호 입력 장치(126)은 센서 어레이(102)와 다중경로 혼합신호를 디지털 신호로 변환하는 신호처리 프로세서(104)으로 구성되어 있으며 센서 어레이(102)는 마이크로폰과 같은 하나 이상의 센서들(102A,102B,102C)로 구성되어 있다.

컴퓨터 시스템(108)은 중앙처리장치(114), 메모리(122), 입출력 인터페이스(120), 보조회로(116)으로 구성되어 있다. 컴퓨터 시스템(108)은 마우스(Mouse), 키보드(Keyboard)등과 같은 입력장치(110)와 모니터(Monitor)나 프린터(Printer)와 같은 출력장치(112)와 연결된다. 보조회로(116)는 전원공급장치, 캐쉬(Cache), 타이밍회로(Timing Circuit), 통신회로(Communication Circuit), 버스(Bus)등과 같은 장치들이다. 메모리는 RAM(Random Access Memory), ROM(Read Only Memory), 디스크 드라이브(Disk Drive), 테입 드라이브(Tape Drive), 플래쉬 메모리(Flash Memory), CD(Compact Disk) 혹은 이들의 조합과 같은 장치들이다. 본 발명은 주파수 영역 자중채널 블라인드 디콘볼루션 프로그램(124)로 구현되어 메모리(122)에 저장되어 있으며 중앙처리장치(114)에서 수행되어 다중경로 다채널 혼합신호 입력장치를 통하여 입력된 혼합신호(126)를 분리한다. 이러한 컴퓨터 시스템(108)은 본 발명을 실행할 수 있는 일반적인 컴퓨터 시스템이지만, 특별하게 고안된 ASIC(Application Specific Intergrated Circuits)전용이나 디지털 신호처리 프로세서(Digital Signal Processor: DSP)와 같은 컴퓨터 시스템을 포한한다. 이와 같이, 본 발명은 하드웨어(Hardware)나 소프트웨어(Software) 혹은 이들의 조합형태로 구현될 수 있다.

본 발명에서 컴퓨터 시스템(108)의 동작을 설명하기 위한 일실시 예로 음성인식기나 음성부호화기 등과 같은 신호처리 모듈(118)을 이용한다. 여러 사람이 함께 있는 회의실에서 사람들의 음성 혹은 음악과 배경 잡음들은 마이크로폰 어레이(102)를 통해 채집된다. 마이크로폰(102)에 의해 채집된 음성신호들은 다중경로를 통해 혼합된 다채널 신호들로서 만약 각 사람의 음성을 분리하여 각 음성을 음성부호화기에 인가할 수 있다. 혼합된 신호는 신호처리 프로세서(104)를 통해 필터링(Filtering)되고, 증폭된 다음 디지털로 변환되어 컴퓨터 시스템(108)로 보내진다. 중앙처리장치(114)는 주파수영역 다채널 블라인드 디콘볼루션 프로그램(124)를 수행함으로써 혼합신호를 각각의 독립적인 신호로 분리한다. 이 과정에서 혼합신호에 포함되었던 배경 잡음은 제거되고, 잡음이 제거된 신호는 음성인식기(혹은 음성부호화기)(118)에 보내진다. 음성인식기가 사용된 경우라면 음성은 음성인식기(118)에서 이를 해석하여 컴퓨터 명령이나 문자로 변환할 수 있으며, 음성부호화기가 사용된 경우라면 보다 깨끗한 음질의 통화를 제공한다. 이처럼, 컴퓨터 시스템(108)은 주파수 영역 다채널 블라인드 디콘볼루션 프로그램을 수행함으로써 음성인식기나 음성부호화기에 전 처리기로서 활용될 수 있다.

도 2a는 본 발명 주파수 영역 다채널 블라인드 디콘볼루션 프로그램(124)의 일실시예 구조도이다. 본 발명의 다중경로 다채널 분리 장치는 분리부(201), 비선형 변환부(202) 및 자연접선기울기를 이용한 분리필터계수 갱신 연산부(203)를 포함하고 있다. 상기 분리부(201)는 다중 채널 혼합신호 로부터 신호를 분리하는 기능을 담당한다. 상기 혼합신호 개의 독립적인 원 신호가 다중 경로를 통해 개의 센서에 인가된 것으로 다음과 같이 정의된다.

여기서, 번째 센서에서 인가된 혼합신호이다. 이를 분리하기 위한 분리필터는 행렬로 필터 원소를 변환의 형태로 표현하면 다음과 같다.

이로부터, 분리된 신호 는 다음과 같이 정의된다.

여기서, 번째 분리신호로서 다음과 같이 정의된다.

도 2b는 인 경우에 대한 분리필터 다이어그램이다. 상기 분리부 (201)에서 분리된 신호 는 비선형 변환부(202)로 입력된다.

비선형 변환부(202)는 분리신호를 버스강(Bussgang) 유형의 메모리가 없는 비선형함수를 통해 변환하는 부분으로 다음과 같이 정의된다.

비선형 함수 는 도 2c에서 볼 수 있는 바와 같이 원 신호의 확률밀도 를 균일한 확률밀도 로 변환한다. 비선형 함수는 원 신호의 확률밀도에 따라 다르게 선정된다. 음성이나 오디오 신호의 확률밀도는 감마(Gamma) 혹은 라플라시안(Laplacian)이며 이 경우 혹은 와 같은 비선형 함수가 적절하다.

자연접선기울기를 이용한 분리필터 계수 갱신 연산부(203)는 다음과 같이 최대기울기 방식을 이용하여 분리필터 계수를 계산한다.

여기서 는 자연접선기울기로서 다음과 같이 주어진다

주목할 것은 (7)의 합에서 의 범위가 기존의 자연접선가울기을 이용한 MBD 알고리즘의 경우와는 달리 이 아닌 로 제한된다는 점이다. 기존의 MBD 알고리즘은 양방향 분리필터를 가정하므로 미래의 분리신호 샘플 값들을 필요로 한다. 기존의 자연접선기울기를 이용한 MBD 알고리즘에서는 이러한 비인과적인 연산을 피하기 위해 분리신호를 샘플만큼 지연시킨 다음 사용하는 지연 갱신을 적용한다. 이 지연갱신은 수렴속도가 저하되며 수렴특성의 저하를 초래하는 원인이 되었다. 이에 비해, 본 발명에서는 인과성의 최소위상을 갖는 단일방향 분리필터를 가정하기 때문에 미래의 분리신호 값을 필요로 하지 않았으며 결과적으로 지연의 필요성이 제거됨으로 인해 수렴속도와 수렴특성을 개선할 수 있다. 비 인과성 특성을 갖는 양방향 분리필터를 사용하는 근본적인 이유는 이상적인 분리필터가 비 최소위상을 갖는다는 점 때문이다. 현실적으로 응용 가능한 많은 현실문제에서 인과성 분리필터만으로도 우수한 분리성과를 얻을 수 있다는 사실은 잘 알려져 있다.

본 발명에서는 이러한 과정을 효율적으로 수행하기 위하여 DFT(Discrete Fourier Transform)을 이용하여 주파수 영역에서 블록 단위로 수행하는 오버랩-세이브(Overlap-Save)방식을 취한다. 여기서, 블록 크기 , 프레임 크기 , 필터 길이 로 정의하며 프레임 크기는 오버랩-세이브 방식에서 사용하는 오버랩의 정도에 따라 에 의해 결정된다. 일반적으로 이며 50% 오버랩을 사용하는 경우 로 설정하지만 빠른 수렴을 위해 2보다 큰 값을 사용할 수 있다. 여기서는 로 가정된다. 또한 DFT와 IDFT의 크기는 로 가정된다. 도 3은 본 발명의 다채널 다중경로 혼합신호의 주파수 영역 분리방법에 대한 순서도이다.

단계 301의 다채널 혼합신호 는 식 (1)과 동일하다.

단계 302에서는 블록 시간 일 때 다채널 혼합신호를 각 채널별로 샘플의 블록으로 인가하여 과거 블록과 묶어서 샘플 단위의 프레임을 형성한다.

단계 303는 블록시간 에서의 분리회로 계수

를 이용하여 입력된 다채널 혼합신호를 분리하는 과정이다. 분리필터 계수는 만약 분리필터 계수에 대한 유용한 정보가 있다면 그 정보를 이용하여 적절하게 초기화될 수 있으며 일반적으로는 다음과 같이 초기화된다.

이로부터 분리신호는 주파수 영역에서 다음과 같이 계산된다.

여기서 는 원소별 곱셈이며 벡터들로서 각각 의 푸리에 변환으로 다음과 같이 정의된다.

여기서 크기의 -point DFT 행렬을 의미하며 DFT는 일반적으로 FFT(Fast Fourier Transform)을 이용하여 계산된다. 만약 변환하고자 하는 벡터의 길이가 보다 작을 때 벡터의 후반부에 0을 채워서 길이 의 벡터로 만든다. 주파수 영역에서의 콘볼루션은 순환 콘볼루션(Circular Convolution)이며 선형 콘볼루션(Linear Convolution)을 계산하기 위해서는 시간 영역에서 에일리어싱이 일어난 처음 개의 샘플들을 버리고 후반부 샘플만을 취한다. 일반적인 50% 오버랩-세이브 방식에서는 처음 샘플의 한 블록을 다 버리고 후반부의 샘플만을 취하지만, 본 발명에서는 초반 개의 샘플만을 버림으로써 다음에 전력 스펙트럼을 계산하는 과정에서 정확한 값을 계산하는 동시에 알고리즘을 안정하게 만든다. 에일리어싱을 제거하는 과정은 다음과 같이 정의된다.

여기서, 은 처음 개의 샘플값을 0으로 만드는 크기의 프로젝션(projection) 행렬로 다음과 같이 정의된다.

여기서, 크기의 0행렬이고 크기의 단위행렬이다.

단계 304는 분리된 신호를 버스강 유형의 비선형함수를 통해 변환하는 과정으로 다음의 두 가지 방법 중 하나를 사용할 수 있다.

일반적으로 식 (15a)를 사용하면 비선형함수와 분리신호와 상호상관관계 계수 (Cross-correlation)인 에는 바이어스(bias)가 포함되며 식 (15b)를 사용하면 바이어스가 없는 계수를 얻게 된다.

단계 305는 에일리어싱이 제거된 정규화된 상호전력 스펙트럼을 계산하는 과정으로 본 발명에서 매우 중요한 과정으로 단계 306~309로 구성된다.

단계 306은 단계 303과 304에서 형성된 분리신호 와 비선형 변환된 신호 를 각각 DFT 변환하고 이를 이용하여 다음과 같이 블록 에서의 상호전력 스펙트럼을 계산한다.

여기서, 는 켤레복소수를 의미하며 벡터들로서 각각 다음과 같이 정의된다.

여기서 주목할 것은 상호전력 스펙트럼의 계산에 사용되는 분리신호 와 비선형 변환된 신호 가 수식 (13),(15a),(15b)에 나타난 것처럼 현재 프레임에서 분리된 신호만을 이용하여 구성되었다는 점과 의 처음 샘플들이 0이라는 점이다. 이것은 일반적으로

다음과 같이 모두 채워진 형태로 조성된다는 점과 크게 다르다.수학식 (18)에서 처음 샘플들은 블록 시간에서의 분리필터 값을 이용하여 계산된 분리신호이며 나머지 샘플들은 블록 시간의 분리필터 계수를 이용하여 계산된 값이다. 따라서 분리신호열의 일관성이 파괴되어 상호전력 스펙트럼이 부정확하게 산출되며 이로 인해 알고리즘 수렴과정이 불안정해지고 분리성능이 저하된다. 뿐만 아니라, 알고리즘의 구현에서 과거 프레임(혹은 불록)의 분리신호 값과 비선형함수 변환된 신호 값을 저장해야하는 부담이 발생한다.

단계 307은 상호전력 스펙트럼을 정규화하기 위해 분리신호와 비선형변환신호의 평균전력 스펙트럼들을 계산하는 과정이다. 일반적으로 신호들은 시간에 따라 많이 변화하므로 매 블록 마다 다음의 순환식을 이용하여 평균전력을 갱신한다.

여기서, 는 0과 1사이의 상수로서 신호의 유형과 환경변화에 따라 적절하게 선택될 수 있으며, 평균전력 스펙트럼은 로 초기화된다. 단계 308은 상호전력 스펙트럼을 정규화하는 과정이다. 이전 발명에서는 상호전력스펙트럼을 정규화하기 위해 각 주파수에서 상호전력 스펙트럼의 모든 원소들을 동시에 각자의 평균전력 스펙트럼으로 정규화하였다. 본 발명에서는 정규화된 상호전력 스펙트럼이 각 주파수에서 단위행렬로 수렴하도록 만들어주는 동시에 비대각 원소들은 효과적으로 0으로 수렴하도록 만들어준다. 이로 인해, 신호분리의 필연적 결과인 분리신호간의 독립성을 얻을 뿐 아니라, 대각원소들이 효과적으로 정규화 됨으로써 알고리즘의 수렴특성을 크게 개선하였고 우수한 분리 성능을 얻을 수 있게 되었다. 뿐만 아니라, 최종적으로 분리된 분리신호에서 나타나는 백색화 현상(Whitening Effect)가 현저하게 줄어들었다.

이제, 정규화는 다음과 같이 수행된다.

여기서, 는 원소별 나눗셈이다. 수학식 (20)의 정규화된 상호전력 스펙트럼을 시간 영역으로 IDFT 변환하면 상호상관관계 계수(Cross-Correlations)가 된다. 그러나 이 값들은 주파수 영역에서 순환 상관연산(Circular Correlation) (16)을 통해 계산된 것으로 에일리어싱 부분을 포함하고 있다. 따라서 에일리어싱 부분은 제거되어야만 한다. 뿐만 아니라, 단계 310의 자연접선기울기 계산에서 필요로 하는 부분은 분리회로의 길이와 동일한 처음 개의 상관관계 계수 값이므로 나머지 후반의 값들은 0으로 대체되어야만 한다. 이러한 제한조건을 만족시키는 것은 순수한 최소위상의 특성을 가진 분리회로를 사용하기 때문이다. 단계 309에서 적용되는 시간 영역의 제한조건은 다음과 같이 정의된다.

여기서 크기의 -point 역 DFT 행렬을 의미하며 은 처음 개의 샘플은 그대로 남겨놓고 나머지 개의 샘플 값을 0으로 만드는 크기의 프로젝션(projection) 행렬로 다음과 같이 정의된다.

여기서, 크기의 단위행렬이고 크기의 0 행렬이다.

단계 310는 논홀로노믹(nonholonomic) 조건을 적용하여 자연접선기울기를 계산하는 과정으로 다음과 같다.

여기서, 로 정의된다.

단계 311은 분리필터 계수를 갱신하는 과정이다.

상기 식(21)의 시간영역의 제약조건은 식(24)의 분리필터 계수를 계산한 이후 분리필터 계수를 시간영역으로 변환하여 제약조건을 적용하는 것과 동일하다.

단계 312는 분리필터 계수의 크기를 주파수 영역에서 대각필터 계수의 전력(norm)으로 나누어줌으로써 정규화하는 과정이다. 분리필터 계수의 정규화는 갱신이 진행됨에 따라 분리신호의 전력이 무한히 작아지는 현상을 방지하는데 목적이 있다. 분리필터 계수의 정규화는 블록 시간마다 수행할 필요는 없으며 일정한 간격으로 수행함으로써 계산량의 증가를 줄일 수 있다.

단계 313은 분리필터 계수가 원하는 상태로 수렴했는지를 판단하는 과정이다. 이 과정은 가용한 다채널의 혼합신호 샘플들을 모두 처리했거나 혹은 반복해서 처리해야하는 회수만큼 모두 반복 수행한 경우 수렴으로 간주된다. 그 밖에 분리필터 계수나 그 밖의 변수들이 특정한 값으로 수렴하는 것을 조사하여 수렴을 판단할 수 도 있다.

단계 314는 수렴이 완료된 경우 가용한 다채널 혼합신호를 분리하여 최종 분리신호를 얻는 과정이다. 이 과정은 식 (11)을 이용하며 역시 오버랩-세이브 방식을 이용하여 주파수 영역에서 수행될 수 있다.

도 4a는 실제 사무실 환경에서 녹음된 음성과 음악을 두개의 마이크로 녹음한 다음 등을 이용하여 본 발명의 방법과 장치들을 이용하여 분리한 결과이다. 도 4의 파형은 위로부터 혼합신호 분리신호 를 보여준다. 여기서 를 사용하였다. 도 4b는 최종적으로 얻어진 분리필터이다.

혼합신호 본 발명은 음성 인식기나 음성 부호화기의 전 처리기 등으로 활용됨으로써, 여러 신호가 혼재된 상황에서 음질의 왜곡을 최소화하면서 효과적으로 분리할 수 있다. 도 5는 음악과 음성 원 신호(s1,s2), 가상의 혼합회로를 통해 혼합된 신호(x1,x2), 본 발명의 분리 방법을 분리한 신호(u1,u2)의 파형을 비교한 것이다. 도 5는 본 발명의 방법과 장치를 이용하여 분리한 신호의 파형은 원 신호의 파형과 거의 동일하며 우수한 음질을 갖는다는 것을 보여준다.

이상에서 설명한 본 발명은 전술한 실시 예 및 첨부된 도면에 의해 한정되는 것이 아니고, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하다는 것이 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 있어 명백할 것이다.

상기한 바와 같이 본 발명은 자연접선기울기를 이용한 다채널 블라인드 신호분리를 통해 다중경로를 통해 혼합된 다채널 혼합신호를 효과적으로 분리할 수 있다. 음악과 음성이 혼합된 경우나 여러 사람의 음성이 혼합된 경우 등에서 음성인식율과 통화품질이 현저하게 개선되는 효과가 있다.

Claims (7)

  1. 다중경로 다채널 혼합신호를 분리하는 분리 방법에 있어서,
    (a)혼합신호로부터 현재 프레임을 형성하는 단계(302);
    (b)상기 프레임을 분리하여 현재 프레임의 분리신호를 형성하는 단계(303);
    (c)상기 분리신호를 비선형 함수로 변환하는 단계(304);
    (d)상기 분리신호와 비선형 변환된 신호로부터 에일리어싱이 제거된 정규화된 상호전력 스펙트럼을 계산하는 단계(305);
    (e)상기 에일리어싱이 제거된 정규화된 상호전력 스펙트럼을 이용하여 자연접선기울기를 계산하는 단계(310);
    (f)상기 자연접선기울기를 이용하여 분리필터 계수를 갱신하는 단계(311);
    (g)상기 분리필터 계수를 정규화하는 단계(312);
    (h)수렴을 판단하여 수렴할 때 까지 상기 (a)-(g) 단계들을 반복하는 단계(313); 및
    (i)수렴이 완료된 이후 분리필터 계수를 이용하여 다채널 혼합신호를 분리하는 단계(314)
    를 포함하는 것을 특징으로 하는 다중경로 혼합신호의 블라인드 분리를 위한 방법.
  2. 제 1항에서, 단계 (b)는
    (b1)상기 분리필터 계수와 상기 현재 프레임의 혼합신호를 주파수 영역으로 변환하는 단계;
    (b2)주파수 영역에서 상기 분리신호를 계산하고 그 결과를 시간 영역으로 변환하는 단계;
    (b3)시간 영역으로 변환된 분리신호의 처음 샘플을 0으로 치환하는 단계;
    를 포함하는 것을 특징으로 하는 다중경로 혼합신호의 블라인드 분리를 위한 방법.
  3. 제 1항에서, 단계 (d)
    (d1)상기 현재 프레임의 분리신호와 비선형함수 변환신호를 주파수 영역으로 변환하는 단계;
    (d2)상기 주파수 영역으로 변환된 분리신호와 비선형 함수 변환신호로부터 현재 프레임의 상호전력 스펙트럼을 계산하는 단계(306);
    (d3)상기 주파수 영역으로 변환된 분리신호와 비선형 함수 변환신호의 평균전력 스펙트럼을 계산하는 단계(307);
    (d4)상기 상호전력 스펙트럼을 정규화하는 단계(308);
    (d5)상기 정규화된 상호전력 스펙트럼을 시간 영역으로 변환한 다음 시간 영역에서 제약조건을 가하여 처음 샘플만을 취하고 다시 주파수 영역으로 변환하는 단계(309);
    를 포함하는 것을 특징으로 하는 다중경로 혼합신호의 블라인드 분리를 위한 방법.
  4. 제 1항에서, 단계 (e)는
    (e1)상기 에일리어싱이 제거된 정규화된 상호전력 스펙트럼의 대각원소에 대한 기댓값 1을 제거하여 논홀로노믹(nonholonomic) 조건을 만족시켜주는 단계;
    (e2)정규화된 상호전력 스펙트럼의 대각원소를 계산한 이후 주파수 영역의 분리필터 계수와 곱하여 자연접선기울기를 계산하는 단계;
    를 포함하는 것을 특징으로 하는 다중경로 혼합신호의 블라인드 분리를 위한 방법.
  5. 제 1항에서, 단계 (f)는 상기 자연접선기울기를 이용하여 최대기울기 방법을 통해 분리필터 계수를 갱신하는 것을 특징으로 하는 다중경로 혼합신호의 블라인드 분리를 위한 방법.
  6. 음성인식기나 음성부호화기가 결합되는 것이 특징인 다중경로 혼합신호의 블라인드 분리를 위한 장치.
  7. 상기 1항의 다중경로 다채널 혼합신호의 블라인드 분리 방법을 내장하고 있는 컴퓨터 저장매체.
KR20040013016A 2004-02-26 2004-02-26 다중경로 다채널 혼합신호의 주파수 영역 블라인드 분리를 위한 방법 및 그 장치 KR100600313B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR20040013016A KR100600313B1 (ko) 2004-02-26 2004-02-26 다중경로 다채널 혼합신호의 주파수 영역 블라인드 분리를 위한 방법 및 그 장치

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
KR20040013016A KR100600313B1 (ko) 2004-02-26 2004-02-26 다중경로 다채널 혼합신호의 주파수 영역 블라인드 분리를 위한 방법 및 그 장치
DE200410035237 DE102004035237A1 (de) 2004-02-26 2004-07-21 Luftabführanordnung für einen Staubsauger
PCT/KR2005/000526 WO2005083706A1 (en) 2004-02-26 2005-02-26 The methods andapparatus for blind separation of multichannel convolutive mixtures in the frequency domain
EP20050721875 EP1719129A1 (en) 2004-02-26 2005-02-26 The methods andapparatus for blind separation of multichannel convolutive mixtures in the frequency domain
US10/588,197 US7711553B2 (en) 2004-02-26 2005-02-26 Methods and apparatus for blind separation of multichannel convolutive mixtures in the frequency domain
JP2007500683A JP2007526511A (ja) 2004-02-26 2005-02-26 周波数領域で多重経路多チャネル混合信号のブラインド分離のための方法及びその装置
CN 200580003157 CN1914683A (zh) 2004-02-26 2005-02-26 频域中多通道卷积混合的盲分离方法和设备

Publications (2)

Publication Number Publication Date
KR20050087291A KR20050087291A (ko) 2005-08-31
KR100600313B1 true KR100600313B1 (ko) 2006-07-14

Family

ID=34858850

Family Applications (1)

Application Number Title Priority Date Filing Date
KR20040013016A KR100600313B1 (ko) 2004-02-26 2004-02-26 다중경로 다채널 혼합신호의 주파수 영역 블라인드 분리를 위한 방법 및 그 장치

Country Status (7)

Country Link
US (1) US7711553B2 (ko)
EP (1) EP1719129A1 (ko)
JP (1) JP2007526511A (ko)
KR (1) KR100600313B1 (ko)
CN (1) CN1914683A (ko)
DE (1) DE102004035237A1 (ko)
WO (1) WO2005083706A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100863184B1 (ko) 2006-12-27 2008-10-13 충북대학교 산학협력단 간섭 및 반향신호 제거를 위한 다단계 암묵 디콘볼루션방법

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006337851A (ja) * 2005-06-03 2006-12-14 Sony Corp 音声信号分離装置及び方法
US8874439B2 (en) * 2006-03-01 2014-10-28 The Regents Of The University Of California Systems and methods for blind source signal separation
US8898056B2 (en) * 2006-03-01 2014-11-25 Qualcomm Incorporated System and method for generating a separated signal by reordering frequency components
US20080010067A1 (en) 2006-07-07 2008-01-10 Chaudhari Upendra V Target specific data filter to speed processing
US8160273B2 (en) 2007-02-26 2012-04-17 Erik Visser Systems, methods, and apparatus for signal separation using data driven techniques
US8175291B2 (en) 2007-12-19 2012-05-08 Qualcomm Incorporated Systems, methods, and apparatus for multi-microphone based speech enhancement
US8321214B2 (en) 2008-06-02 2012-11-27 Qualcomm Incorporated Systems, methods, and apparatus for multichannel signal amplitude balancing
EP2249333B1 (en) * 2009-05-06 2014-08-27 Nuance Communications, Inc. Method and apparatus for estimating a fundamental frequency of a speech signal
KR101615262B1 (ko) 2009-08-12 2016-04-26 삼성전자주식회사 시멘틱 정보를 이용한 멀티 채널 오디오 인코딩 및 디코딩 방법 및 장치
US8666734B2 (en) 2009-09-23 2014-03-04 University Of Maryland, College Park Systems and methods for multiple pitch tracking using a multidimensional function and strength values
KR101650951B1 (ko) * 2009-12-04 2016-08-25 엘지전자 주식회사 혼합된 신호 분리방법
CN102903368B (zh) * 2011-07-29 2017-04-12 杜比实验室特许公司 用于卷积盲源分离的方法和设备
TWI455115B (zh) * 2012-04-13 2014-10-01 Univ Nat Central A method of separating a plurality of signal sources in a spherically mixed blind source
CN103295193A (zh) * 2013-05-10 2013-09-11 天津理工大学 基于互功率谱的盲源分离方法
CN103871422A (zh) * 2014-01-08 2014-06-18 西安电子科技大学 基于三因子迭代联合块对角化的时域混叠盲信号分离方法
CN104408025A (zh) * 2014-11-19 2015-03-11 天津大学 基于频谱校正的超定盲信号分离方法及其装置
US9928848B2 (en) * 2015-12-24 2018-03-27 Intel Corporation Audio signal noise reduction in noisy environments
CN106126479B (zh) * 2016-07-07 2019-04-12 重庆邮电大学 基于遗传变异优化的二阶振荡粒子群盲源分离方法
CN107607342A (zh) * 2017-09-22 2018-01-19 沈阳工业大学 空调机房设备群的健康能效检测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6167417A (en) 1998-04-08 2000-12-26 Sarnoff Corporation Convolutive blind source separation using a multiple decorrelation method
JP2003271168A (ja) 2002-03-15 2003-09-25 Nippon Telegr & Teleph Corp <Ntt> 信号抽出方法および信号抽出装置、信号抽出プログラムとそのプログラムを記録した記録媒体
US6642887B2 (en) 2000-02-29 2003-11-04 Hrl Laboratories, Llc Cooperative mobile antenna system
US6711528B2 (en) 2002-04-22 2004-03-23 Harris Corporation Blind source separation utilizing a spatial fourth order cumulant matrix pencil
US6898612B1 (en) 1998-11-12 2005-05-24 Sarnoff Corporation Method and system for on-line blind source separation

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5208786A (en) 1991-08-28 1993-05-04 Massachusetts Institute Of Technology Multi-channel signal separation
FR2730881A1 (fr) * 1995-02-22 1996-08-23 Philips Electronique Lab Systeme pour estimer des signaux recus sous forme de signaux melanges
US5675659A (en) 1995-12-12 1997-10-07 Motorola Methods and apparatus for blind separation of delayed and filtered sources
WO1998058450A1 (en) * 1997-06-18 1998-12-23 Clarity, L.L.C. Methods and apparatus for blind signal separation
JP3927701B2 (ja) * 1998-09-22 2007-06-13 日本放送協会 音源信号推定装置
US6654719B1 (en) * 2000-03-14 2003-11-25 Lucent Technologies Inc. Method and system for blind separation of independent source signals
JP4616529B2 (ja) 2001-09-03 2011-01-19 クラリオン株式会社 ブラインド信号分離処理装置
JP3887192B2 (ja) * 2001-09-14 2007-02-28 日本電信電話株式会社 独立成分分析方法及び装置並びに独立成分分析プログラム及びそのプログラムを記録した記録媒体
JP2006510069A (ja) * 2002-12-11 2006-03-23 ソフトマックス,インク 改良型独立成分分析を使用する音声処理ためのシステムおよび方法
US20040117186A1 (en) * 2002-12-13 2004-06-17 Bhiksha Ramakrishnan Multi-channel transcription-based speaker separation

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6167417A (en) 1998-04-08 2000-12-26 Sarnoff Corporation Convolutive blind source separation using a multiple decorrelation method
US6898612B1 (en) 1998-11-12 2005-05-24 Sarnoff Corporation Method and system for on-line blind source separation
US6642887B2 (en) 2000-02-29 2003-11-04 Hrl Laboratories, Llc Cooperative mobile antenna system
JP2003271168A (ja) 2002-03-15 2003-09-25 Nippon Telegr & Teleph Corp <Ntt> 信号抽出方法および信号抽出装置、信号抽出プログラムとそのプログラムを記録した記録媒体
US6711528B2 (en) 2002-04-22 2004-03-23 Harris Corporation Blind source separation utilizing a spatial fourth order cumulant matrix pencil

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100863184B1 (ko) 2006-12-27 2008-10-13 충북대학교 산학협력단 간섭 및 반향신호 제거를 위한 다단계 암묵 디콘볼루션방법

Also Published As

Publication number Publication date
JP2007526511A (ja) 2007-09-13
EP1719129A1 (en) 2006-11-08
DE102004035237A1 (de) 2005-09-15
US7711553B2 (en) 2010-05-04
KR20050087291A (ko) 2005-08-31
CN1914683A (zh) 2007-02-14
US20080208570A1 (en) 2008-08-28
WO2005083706A1 (en) 2005-09-09

Similar Documents

Publication Publication Date Title
Gannot et al. Subspace methods for multimicrophone speech dereverberation
Lee et al. Blind source separation of real world signals
TWI483244B (zh) 用於將信號編碼/解碼之裝置與方法
Soon et al. Noisy speech enhancement using discrete cosine transform
CA2732723C (en) Apparatus and method for processing an audio signal for speech enhancement using a feature extraction
TW546630B (en) Optimized local feature extraction for automatic speech recognition
US9456275B2 (en) Cardioid beam with a desired null based acoustic devices, systems, and methods
US7167568B2 (en) Microphone array signal enhancement
RU2145737C1 (ru) Способ подавления шума путем спектрального вычитания
US7383178B2 (en) System and method for speech processing using independent component analysis under stability constraints
US7487097B2 (en) Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods
CN1156822C (zh) 音频信号编码方法、解码方法,及音频信号编码装置、解码装置
CN1750124B (zh) 带限音频信号的带宽扩展
EP0788089B1 (en) Method and apparatus for suppressing background music or noise from the speech input of a speech recognizer
US6144937A (en) Noise suppression of speech by signal processing including applying a transform to time domain input sequences of digital signals representing audio information
CN100476949C (zh) 不利环境中的多信道语音检测
Hermansky et al. RASTA-PLP speech analysis
US6377637B1 (en) Sub-band exponential smoothing noise canceling system
US6263307B1 (en) Adaptive weiner filtering using line spectral frequencies
CN1971709B (zh) 语音识别系统和汽车导航系统
EP1500086B1 (en) Coding and decoding of multichannel audio signals
US7343022B2 (en) Spectral enhancement using digital frequency warping
Yoshioka et al. Blind separation and dereverberation of speech mixtures by joint optimization
JP3185413B2 (ja) 直交変換演算並びに逆直交変換演算方法及びその装置、ディジタル信号符号化及び/又は復号化装置
US5706395A (en) Adaptive weiner filtering using a dynamic suppression factor

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130704

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20140625

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20150515

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20160523

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20170605

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20180524

Year of fee payment: 13