KR20110121955A

KR20110121955A - 암묵 신호 추출 방법 및 암묵 신호 추출 장치

Info

Publication number: KR20110121955A
Application number: KR1020100041494A
Authority: KR
Inventors: 이수영; 유재권
Original assignee: 한국과학기술원
Priority date: 2010-05-03
Filing date: 2010-05-03
Publication date: 2011-11-09
Also published as: KR101112154B1

Abstract

암묵 신호 추출 방법 및 암묵 신호 추출 장치가 개시된다. 신호 추출 장치는 2 이상의 수신부를 포함하여 신호를 수신하는 수신 수단과, 디믹싱(demixing)을 위한 전달함수를 산출하는 전달함수 산출 수단과, 산출된 전달함수를 이용하여 수신된 신호를 디믹싱하는 디믹싱 수단을 포함한다. 전달함수는 수신부에서 가장 가까운 소스로부터의 신호를 추출하거나, 수신부에 대해 알려진 방향에 있는 소스로부터의 신호를 제거하고 나머지 소스로부터의 신호를 추출하도록 결정된다. 또한, 전달함수는, 가장 가까운 소스로부터 수신부까지의 경로에 대한 전달 함수가 실질적으로 델타 함수임을 기초로 산출된다.

Description

암묵 신호 추출 방법 및 암묵 신호 추출 장치{METHOD AND APPARATUS FOR BLIND SOURCE EXTRACTION}

본 발명은 신호 추출에 관한 것으로, 구체적으로는 방향 제약 조건(Direction Constraint) 또는 최근 거리 제약 조건(Closest Constraint)을 이용한 암묵 신호 추출(Blind Source Extraction)을 위한 방법 및 장치에 관한 것이다.

본 발명은 지식경제부의 인간기능 생활지원 지능로봇 기술개발사업의 일환으로 수행한 연구로부터 도출된 것이다[과제관리번호: F0005000-2009-31, 과제명: 가정 내 다중 음원 환경에서의 음성분리 및 잡음제거 기술 개발].

음성과 같은 신호를 수신하는 경우, 그 신호는 서로 다른 2 이상의 소스(source)에서 발생한 신호들이 혼합되어 있는 신호일 수 있다. 그러므로 이러한 2 이상의 소스로부터의 신호가 혼합된 신호 중에서 원하는 소스로부터의 신호만을 분리 또는 추출해내는 것이 필요하다. 이를 위한 방법으로는 암묵 신호 분리(Blind Source Separation; BSS) 방법과 암묵 신호 추출(Blind Source Extraction; BSE) 방법이 알려져 있다.

암묵 신호 분리 방법은 2이상의 소스로부터의 신호를 분리하여 각각의 소스로부터의 신호를 별도로 획득하는 것이다. 그러나 BSS 방식은 원하지 않는 소스로부터의 신호, 예를 들어 잡음까지도 분리하는 결과를 가져오므로 필요 없는 계산량이 증가하고 계산 시간이나 회로 구성이 복잡해지는 문제가 있다.

반면에 암묵 신호 추출 방법은 신호로부터 원하는 소스로부터의 신호만을 추출하는 방식이다. 그러나, 선택되는 소스를 정의하지 않는 이상, 불확정성을 피할 수 없다. 다시 말해, 정확한 기준이 제공되지 않은 상태에서 하나의 소스로부터의 신호만을 선정하여 추출하는 경우에는, 추출된 신호가 원하는 신호임을 보장할 수가 없다.

기준 신호를 획득하고 그 기준 신호에 기초하여 하나의 신호를 추출하는 BSE 방법도 알려져 있으나, 이 방법은 기준 신호를 획득하기 위해 추가적인 연산이 필요하다는 문제가 있다.

본 발명은 상술한 문제점을 인식한 것으로, 효율적으로 하나의 원하는 신호를 추출할 수 있는 BSE 방법 및 장치를 제공하는 것을 목적으로 한다.

상기 목적을 달성하기 위하여, 본 발명의 일 태양에 따르면, 암묵 신호 추출(Blind Source Extraction)에 의해 신호를 추출하는 장치에 있어서, 2 이상의 수신부를 포함하여 신호를 수신하는 수신 수단과, 디믹싱(demixing)을 위한 전달함수를 산출하는 전달함수 산출 수단과, 산출된 상기 전달함수를 이용하여 수신된 상기 신호를 디믹싱하는 디믹싱 수단을 포함하되, 상기 전달함수는 상기 수신부에서 가장 가까운 소스로부터의 신호를 추출하도록 결정되는 신호 추출 장치가 제공된다.

상기 전달함수는, 소스로부터 가까울수록 상기 수신부까지의 경로에 대한 전달 함수가 델타 함수로 근사됨을 기초로 산출되는 것이 바람직하다.

상기 전달함수는

의 식을 기초로 산출되고, 여기서, W_i는 상기 디믹싱 수단의 입력 i 에 대한 전달함수,

는 가장 가까운 소스로부터 두 개의 상기 수신부까지의 경로 차에 의한 시간 지연인 것도 바람직하다.

상기 전달함수 산출 수단은 비용함수

를 이용하여 반복적으로 상기 전달함수를 산출하되, 여기서,

이고,

이며, ω₁과 ω₂는 각각 W₁과 W₂를 나타내는 벡터일 수 있다.

바람직하게는, 상기 전달함수 산출 수단은 비용함수

를 기초로 반복적으로 상기 전달함수를 산출하되, J_G(w)는 출력 신호의 네젠트로피(Negentropy)를 나타내는 함수이고,

는 상수이다.

상기 전달함수 산출 수단은 학습규칙(learning rule)

에 기초하여 반복적으로 상기 전달함수를 산출하되,

는 학습률(learning rate)일 수 있다.

상기 신호 추출 장치는 상기 신호를 사전백색화(pre-whitening)하는 사전백색화 수단을 더 포함할 수 있다.

본 발명의 다른 태양에 따르면, 암묵 신호 추출(Blind Source Extraction)에 의해 신호를 추출하는 방법에 있어서, 2 이상의 수신부를 통해 신호를 수신하는 단계와, 디믹싱을 위한 전달함수를 산출하는 단계와, 산출된 상기 전달함수를 이용하여 수신된 상기 신호를 디믹싱(demixing)하는 단계를 포함하되, 상기 전달함수는 상기 수신부에서 가장 가까운 소스로부터의 신호를 추출하도록 결정되는 신호 추출 방법이 제공된다.

상기 전달함수는, 소스로부터 가까울수록 상기 수신부까지의 경로에 대한 전달 함수가 델타 함수로 근사됨을 기초로 산출될 수 있다.

또한, 상기 전달함수는

는 가장 가까운 소스로부터 두 개의 상기 수신부까지의 경로 차에 의한 시간 지연일 수 있다.

상기 전달함수를 산출하는 단계는 비용함수

이고,

이며, ω₁과 ω₂는 각각 W₁과 W₂를 나타내는 벡터인 것이 바람직하다.

상기 전달함수를 산출하는 단계는 비용함수

는 상수인 것도 바람직하다.

상기 전달함수를 산출하는 단계는 학습규칙(learning rule)

에 기초하여 반복적으로 상기 전달함수를 산출하되,

는 학습률(learning rate)일 수 있다.

신호 추출 방법은 상기 신호를 사전백색화(pre-whitening)하는 단계를 더 포함할 수 있다.

본 발명의 또 다른 태양에 따르면, 암묵 신호 추출(Blind Source Extraction)에 의해 신호를 추출하는 장치에 있어서, 2 이상의 수신부를 포함하여 신호를 수신하는 수신 수단과, 디믹싱(demixing)을 위한 전달함수를 산출하는 전달함수 산출 수단과, 산출된 상기 전달함수를 이용하여 수신된 상기 신호를 디믹싱하는 디믹싱 수단을 포함하되, 상기 전달함수는 상기 수신부에 대해 알려진 방향에 있는 소스로부터의 신호를 제거하고 나머지 소스로부터의 신호를 추출하도록 결정되는 신호 추출 장치가 제공된다.

상기 전달함수는, 상기 알려진 방향에 해당하는 알려진 시간 지연에 기초하여 초기화될 수 있다.

상기 알려진 시간 지연은, 상기 알려진 방향에 있는 소스로부터 상기 2 이상의 수신 수단까지의 전달함수에 있어서, 직접 경로에 해당하는 성분 사이의 시간 인덱스 차에 해당하는 것이 바람직하다.

상기 전달함수는, 상기 전달함수를 나타내는 벡터 w의 시간 지연 이외의 성분은 0으로 설정되도록 초기화되는 것이 바람직하다.

본 발명의 다른 태양에 따르면, 암묵 신호 추출(Blind Source Extraction)에 의해 신호를 추출하는 방법에 있어서, 2 이상의 수신부를 통해 신호를 수신하는 단계와, 디믹싱을 위한 전달함수를 산출하는 단계와, 산출된 상기 전달함수를 이용하여 수신된 상기 신호를 디믹싱(demixing)하는 단계를 포함하되, 상기 전달함수는 상기 수신부에 대해 알려진 방향에 있는 소스로부터의 신호를 제거하고 나머지 소스로부터의 신호를 추출하도록 결정되는 신호 추출 방법이 제공된다.

또한, 상기 전달함수는, 상기 전달함수를 나타내는 벡터 w의 시간 지연 이외의 성분은 0으로 설정되도록 초기화될 수 있다.

본 발명의 다른 태양에 따르면, 기계에 의해 실행되는 경우, 기계가 상기한 방법을 실행하도록 하는 프로그램이 기록된, 기계 판독 가능한 기록 매체가 제공된다.

본 발명에 따르면, 수신부로부터 특정 방향에 있는 소스 또는 가장 가까운 소스로부터의 신호를 효율적으로 추출하는 방법 및 장치를 얻을 수 있다.

도 1은 본 발명의 일 실시형태에 따른 디믹싱 시스템을 설명하기 위한 도면.
도 2는 본 발명의 일 실시형태에 따른 디믹싱을 설명하기 위한 도면.
도 3은 본 발명의 다른 실시형태에 따른 디믹싱 시스템을 도시하는 블록도.
도 4는 거리에 따른 DRR을 나타내는 그래프.
도 5는 본 발명의 일 실시형태에 따른 디믹싱 방법을 설명하기 위한 도면.
도 6은 본 발명의 시뮬레이션 조건을 설명하는 도면.

이하, 첨부된 도면을 참조하여 본 발명의 구체적 실시형태를 설명한다.

실시형태의 설명을 위해 도 1에 도시된 바와 같이, 실내에서 2개의 소스(예를 들어, 스피커 10, 12)로부터의 신호가 1 이상의 신호 수신부(예를 들어, 마이크 20, 22)에서 수신되는 경우를 고려한다. 각각의 스피커(10, 12)로부터의 신호는 직접 경로(D)를 통해 마이크(20)에 도달될 뿐만 아니라, 실내의 벽에 반향되어 반향 경로(R)를 통해서도 마이크(20)에 도달된다. 예를 들어, 스피커(10)로부터의 신호는 직접 경로 D₁₁을 거쳐 마이크(20)에 도달되고, 직접 경로 D₁₂를 거쳐 마이크(22)에 도달된다. 또한, 반향 경로 R₁₁을 거쳐 마이크(20)에 도달되고, 반향 경로 R₁₂를 거쳐 마이크(22)에 도달된다. 이는 다른 스피커(12)에 대해서도 동일하다.

마이크(20, 22)에서 수신된 신호들은 디믹싱(demixing) 시스템(30)에 입력되고, 디믹싱 시스템(30)에서 수행되는 디믹싱에 의해 희망의 신호가 추출된다. 본 발명의 실시형태에서, 희망의 신호는 마이크(20, 22)로부터의 방향 또는 마이크(20, 22)로부터의 거리에 기초하여 선택된다.

한편, 실질적으로 마이크(20, 22)도 디믹싱 시스템(30)에 포함되는 것으로 고려할 수도 있고, 마이크(20, 22)로부터의 신호를 수신하는 수신부가 디믹싱 시스템(30)에 포함되는 것으로 고려할 수도 있으므로, 특별히 언급되지 않는 한, 이후의 논의에서는 디믹싱 시스템(30)과 수신부(20, 22)를 구별하지 않는다.

도 2는 본 발명의 일 실시형태에 다른 디믹싱 시스템(30)의 구성을 도시하는 도면이다. 도시된 바와 같이, 디믹싱 시스템(30)은 사전백색화(pre-whitening) 필터(32)와 디믹싱 필터(34)를 포함한다. 구체적으로, 스피커로부터의 신호 x₁, x₂는 사전백색화 필터(32)에 입력된다. 이 신호 x₁, x₂는 실질적으로는 스피커로부터 마이크까지의 경로를 통과하여 전달된 신호로서, 경로의 전달 함수 A를 거친 신호라고 할 수 있다.

입력된 신호 x₁, x₂에 대해, 신호 간의 상관에 의해 이후의 처리의 신뢰성이 저하되는 것을 방지하기 위해 사전백색화가 이루지고, 사전백색화된 신호 w₁, w₂가 출력된다. 사전백색화 필터(32)는 후속 처리를 돕기 위한 것으로서, 필수적으로 포함되어야 하는 것은 아니며, 디믹싱 필터(34)에 통합될 수도 있다. 수학적으로 말해, 디믹싱 필터(34)의 전달 함수가 사전백색화를 고려하여 결정될 수도 있다는 것이다.

다음, 사전백색화된 신호 w₁, w₂는 디믹싱 필터(34)에 입력되어 디믹싱이 수행되고, 하나의 추출된 신호 y가 출력된다. 이하, 디믹싱 필터(34)의 전달함수를 W라 한다. 또한, 디믹싱 필터의 전달함수 W을 표현한 벡터를 w라고 한다.

디믹싱 필터(34)는 필터 파라미터 산출부(36)과 연결되어 필터의 전달함수 W, 또는 전달함수를 결정하는데 필요한 필터 파라미터, 예를 들어 벡터 w를 공급받는다. 이하에서는, 파라미터 산출부(36)에서 수행되는 필터 파라미터 산출에 대해 설명한다. 다만, 파라미터 산출부(36)는 별개의 구성요소일 필요는 없으며, 디믹싱 필터(34)와 통합될 수도 있음을 유의하여야 한다.

디믹싱 시스템에서 디믹싱 필터(34)에 의해 추출된 신호 y는 스피커로부터의 신호와 동일하여야 하므로, 최초 신호에 경로의 전달함수 A를 곱하고, 다시 디믹싱 필터의 전달함수 W를 곱하면 원 신호가 복원되어야 한다. 이를 행렬로 표현하면, 다음 수학식 1과 같다.

여기서 W₁(z)는 디믹싱 시스템의 입력 x₁과 출력 y 에 대한 전달함수의 z-도메인 표현이고, W₂(z)는 디믹싱 시스템의 입력 x₂와 출력 y 에 대한 전달함수의 z-도메인 표현이다. 또한, A_ij(z)는 소스(예를 들어, 스피커) j로부터 수신부(예를 들어, 마이크) i까지의 경로의 전달함수의 z-도메인 표현이다.

본원 발명의 발명자들은 상기 수학식 2에서의 전달함수, 즉 W₁와 W₂를 결정하기 위하여, 방향 제약 조건(Direction Constraint) 및 최근 거리 제약 조건(Closest Constraint)을 창안하였으며, 이에 대해 아래에서 자세히 설명한다.

방향 제약 조건에 기초한 신호의 추출

먼저, 방향 제약 조건을 이용하는 본 발명의 실시형태를 설명한다. 본 실시형태에서는 2 이상의 소스 중 특정 방향으로부터의 신호를 제거하고 나머지 소스로부터의 신호를 추출한다. 이를 위해, 도 3 에 도시된 바와 같이 마이크(20)로부터 φ의 각도를 갖는 방향의 소스, 즉 스피커(10)로부터의 신호를 제거한다고 가정하면, 도 3에 도시된 바와 같이 스피커(10)로부터 2개의 마이크(20, 22)까지의 거리의 차이는 Dsin(φ)로 주어진다 (여기서, D는 마이크 사이의 거리). 그러므로, 신호가 두 마이크에 도달하는 시간의 차

는 다음 수학식 2로 주어진다.

여기서, v는 신호의 속도를 나타낸다.

이때, 두 신호의 시간 차가 0인 경우에는 스피커(10)가 마이크(20, 22)로부터 동일한 거리에 있는 것이고, 이는 스피커(10)가 마이크(20, 22) 사이의 중점을 기준으로 정면에 있음을 의미한다. 한편, 스피커(10)가 마이크(20, 22)의 중점을 기준으로 오른쪽 측면에 위치한다면, φ가 0보다 크고, 시간차

는 양의 값을 갖는다. 반면, 스피커(10)가 마이크(20, 22)의 중점을 기준으로 왼쪽 측면에 위치하면, 시간차

는 음의 값을 갖는다. 이처럼, 신호의 도달 시간차에는 신호의 방향에 대한 정보가 포함되어 있는 것이고, 역으로 신호의 방향이 정해지면 도달 시간차도 함께 정해지게 된다. 위의 수학식 2를 수열 식에서의 인덱스 값으로 표현하면 다음 수학식 3의 ρ를 얻는다. 수학식 3은 각 전달함수를 나타내는 수열에서 최대값을 나타내는(즉, 직접 경로 전달함수를 나타내는) 성분의 시간 인덱스의 차이를 표현한 것이다.

한편, 수학식 1의 제2열의 계산 결과, 즉, 추출하고자 하는 신호 이외의 신호가 0이 되도록 전달함수가 결정된다는 것으로부터 수학식 4를 얻는다.

수학식 4을 주파수 도메인에서 표현하면 다음의 수학식 5와 수학식 6을 얻는다. 수학식 6은 수학식 5의 수열(series) 표현이다.

일반적으로, 직접 경로를 통한 신호가 반향 경로를 통한 신호보다 매우 크기 때문에, 수학식 6에서 직접 경로를 통한 성분만을 취하면, 다음의 식을 얻는다.

여기서, σ와ξ는 각각 직접 경로 신호에 대한 전달함수의 인덱스이다. 따라서, 인덱스의 차

와

는 각각 전달함수 W와 A에 대한 직접 경로 성분에 대한 시간 인덱스 차이와 동일하다. 수학식 2와 관련하여 설명한 바와 같이, 소스의 방향(즉, φ)이 정해지면 시간차를 알 수 있으며, 시간차는 직접 경로 신호의 인덱스차와 동일하므로, 수학식 7에 있어서

와

는 방향 제약 조건 하에서 알려진 값, 즉 수학식 3의 ρ가 된다.

따라서, 본 실시형태에서는, 전달함수 W를 나타내는 벡터 w를 수학식 2의 시간 지연 또는 수학식 3의 시간 인덱스 차로 초기화 한 후에, 적응적으로 벡터 w를 계산하여 전달함수를 얻어내고, 또한 전달함수를 이용하여 신호를 추출한다. 따라서 상기 수학식 4의 관계에 의해, 알려진 방향에 존재하는 소스로부터의 신호는 제거되고, 나머지 신호만이 추출될 수 있다. 여기서, 적응적으로 벡터 w를 계산하기 위해서는 다양한 방법을 사용할 수 있으며, 예를 들어 종래의 네젠트로피를 이용한 BSE 방법을 이용할 수 있다. 불필요한 성분을 배제하기 위해, 초기화 시에, 벡터 w에서 시간 지연을 나타내는 성분 이외의 모든 성분은 0으로 설정할 수 있다. 이로써, 특정 방향(예를 들어, 각도 φ)에 위치하는 소스로부터의 신호를 배제하고 나머지 신호를 추출할 수 있게 된다.

거리 제약 조건에 기초한 신호의 추출

다음, 거리 제약 조건을 이용하는 본 발명의 다른 실시형태를 설명한다. 본 실시형태에 있어서, 소스 1이 희망의 소스라 하고, 상기의 수학식 1 중 소스 1에 대한 식만을 고려하면, 다음의 수학식 8이 성립한다.

도 1에 도시된 바와 같이, 일반적으로 소스로부터의 신호는 직접 경로와 반향 경로를 거쳐 수신부에 도달한다. 따라서, 수신부에서 수신된 신호에는 직접 성분과 반향 성분이 혼합되어 있으며, 직접 성분과 반향 성분간의 에너지 비를 DRR(Direct-to-Reverbarant Ratio)라 한다. 예를 들어, DRR은 다음 수학식 9로 계산될 수 있다.

여기서, ω(k)는 경로의 전달함수를 나타내고, k_max는 ω(k)를 최대로 하는 인덱스 k를 나타낸다. 수학식 9에서 알 수 있듯이, 전달함수 ω에 대한 DDR은 그 전달함수 중 최대값(

)과 나머지 값의 합(

)의 비로 이해할 수 있으며, DDR이 클수록 특정 인덱스에서의 전달함수 값이 다른 값에 비해 현저히 큰 것임을 알 수 있다.

본 발명자들의 연구에 따르면, 다음 표와 같이, 수신부에 가까운 소스로부터의 신호일수록 직접 성분의 비율이 높아 DRR이 크며, 수신부로부터 멀어질수록 DRR값이 급격히 감소한다. 다시 말해, 소스에 가까운 신호일수록 특정 인덱스에서의 전달함수의 크기가 다른 인덱스에서의 전달함수 크기보다 현저히 크게 된다는 것이다.

거리(m)	DRR
0.5	14.42
1.0	2.70
1.5	0.88
2.0	0.32

이러한 연구를 바탕으로, 본 발명자들은 소스에 가까운 신호일수록, 소스와 수신부 사이의 경로의 전달함수 A가 델타 함수(delta function)에 가깝다는 것을 발견하였다. 이는 각각 거리 0.5m와 2.0m에서의 임펄스 응답을 나타내는 도 4(a) 및 4(b)로부터 확인할 수 있다. 따라서, 최근 거리 소스로부터의 신호에 대한 전달함수 A, 위 수학식 4에서 A₁₁은 델타 함수라고 가정할 수 있다.

한편, 일반성을 잃지 않고, 두 개의 수신부, 즉 마이크(10, 12)가 서로 충분히 가깝게 위치하여 소스, 즉 스피커로부터 두 수신부까지의 경로는 그 거리가 상이할 뿐 특성이 거의 동일하다고 가정할 수 있다.

위의 두 가지 가정, 즉, A₁₁이 델타 함수이고, A₂₁은 A₁₁의 시간 지연된 버전과 같다는 가정으로부터, 수학식 8은 다음 수학식 10으로 변환될 수 있다.

여기서

는 가장 가까운 소스로부터 상기 두 개의 수신부까지의 경로차에 의한 시간 지연으로서,

와

가 성립한다. (a₁₁과 a₂₂는 각각 A₁₁과 A₂₁의 k 도메인 표현).

위의 수학식 10을 k 도메인에서 표현하여 다음 수학식 11을 얻을 수 있다.

최종적으로, 수학식 11을 기초로, 다음 수학식 12와 같은 최근 거리 제약 조건 하의 비용 함수 J_C를 정의 할 수 있다.

여기서,

이다.

상기의 비용함수를 최대로 하는 w를 반복적(iteratively)으로 연산함으로써, 디믹싱 필터의 전달함수를 얻고 혼합 신호로부터 가장 가까운 소스로부터의 신호를 추출해 낼 수 있게 된다. 여기서 반복적이라 함은, 이전 연산의 결과를 이용하여 연산을 다시 수행하는 것을 포함한다.

네젠트로피에 근거한 비용함수

일 실시형태에서, 상기 최근 거리 제약 조건 하의 비용함수 J_C는 ICA(Independent Component Analysis)에서 사용되는 비용함수 J_G와 함께 고려될 수 있다. ICA에서는 신호의 비-가우스 함수 특성(non-Gaussianity)을 최대화하기 위한 기준으로서 네젠트로피(Negentropy)가 비용함수로 사용될 수 있으며, 이는 다음 수학식 13으로 주어진다.

여기서,

는 출력 신호이고,

는

와 동일한 평균과 분산을 갖는 가우스 함수 형태의 신호,

G는 비2차 우함수(non-quadratic even function)이다.

한편, []는 기대값(expectation)을 나타내는 연산자로서, 시간 평균으로 구현될 수 있다.

위의 네젠트로피와 최근 거리 제약 조건 하의 비용 함수 수학식 12를 함께 고려하여, 다음의 비용 함수를 얻는다.

여기서,

는 상수이다.

또한, 위 수학식 14의 비용 함수를 이용하여 다음의 학습 규칙(learning rule)을 얻는다.

여기서,

는 학습율(learning rate)이다.

수학식 15에 있어서, 도함수인

과

는 수학식 12와 수학식 13을 미분하여 각각 구할 수 있다. 예를 들어, 수학식 11을 이용하여, 위 수학식 12를 미분하면,

를 얻는다.

또한, 수학식 13을 미분하면,

를 얻으며, 여기서

이다.

이상과 같이, 본 발명의 일 실시형태의 필터 파라미터 산출부(36)는, 방향 제약 조건 또는 최근 거리 제약 조건을 이용하여 디믹싱 필터 W를 나타내는 벡터 w를 구할 수 있다. 구체적으로, 방향 제약 조건을 이용하는 경우에는 w를 시간 지연으로 초기화하고, 최근 거리 제약 조건을 이용하는 경우에는 위의 수학식 15의 학습 규칙을 이용하여 벡터 w를 결정할 수 있다.

필터 파라미터 산출부(36)는 필터의 파라미터를 산출하여 디믹싱 필터(34)에 공급한다. 특히, 필터 파라미터 산출부(36)는 필터(34)로부터의 출력을 수신하고, 이에 기초하여 반복적으로 파라미터를 산출하여 필터에 공급함으로써, 디믹싱 필터(34)가 적응적으로 동작하도록 할 수 있다.

신호 추출 방법

다음, 본 발명의 일 실시형태에 따른 신호 추출 방법을 도 5를 참조하여 설명한다.

본 실시형태의 방법은 먼저, 단계 410에서 2 이상의 소스로부터의 신호가 혼합된 혼합 신호를 수신한다. 혼합 신호에는, 2이상의 소스로부터의 신호가 혼합되어 있을 뿐만 아니라, 직접 경로 및 반향 경로로부터의 신호가 혼합되어 있다.

다음, 단계 420에서는 수신된 신호에 대해 사전백색화를 수행하여, 후속 처리를 준비한다. 단계 420은 필수적인 것은 아니며, 이후의 단계와 통합되거나 생략될 수 있다.

다음, 단계 430에서, 백색화된 (또는 수신된) 신호에 대하여 디믹싱을 수행하여 소망의 한 소스로부터의 신호, 즉, 특정 방향의 소스 또는 가장 가까운 소스로부터의 신호를 추출하기 위하여, 디믹싱 파라미터를 산출한다.

단계 430에 있어서, 특정 방향의 소스로부터의 신호를 추출하기 위해, 디믹싱 필터의 전달함수를 나타내는 벡터 w를 시간 지연으로 초기화할 수 있다. 다른 실시형태에서는, 가장 가까운 소스로부터의 신호를 추출하기 위해, 수학식 8의 비용 함수 및/또는 수학식 10의 비용 함수를 이용하여 디믹싱 필터의 전달함수 W를 구한다. 단계 430에서 얻는 전달함수에는 단계 420에서 수행된 사전 백색화에 대응되는 백색화 필터링이 추가될 수 있다. 다르게는, 별도의 단계에서 백색화가 수행될 수도 있다.

그리고, 단계 440에서 산출된 전달함수 W를 이용하여 신호를 디믹싱 하고, 소망의 신호를 추출한다.

여기서, 전달함수 W는, 예를 들어, 수학식 11의 학습 규칙 등에 따라 반복적으로 연산을 수행함으로써 적응적으로 얻어질 수 있다. 따라서, 단계 450에서는, 전달 함수 W가 수렴하였는지 여부를 판단하고, 전달함수가 수렴하지 않은 경우에는 단계 430으로 돌아가 전달함수 W를 다시 산출하고, 디믹싱을 수행한다.

본 발명의 방법은 기계에 의해 실행되는 경우, 기계가 상기한 방법을 실행하도록 하는 프로그램의 형태로 구현되어 기계가 판독할 수 있는 매체에 기록될 수 있다. 매체는, 컴팩트 디스크(CD), 자기 디스크, 자기 테이프, ROM(Read Only Memory), RAM(Random Access Memory), 광 디스크, 플래시 디스크 등을 포함하나 이에 제한되지 않으며, 데이터를 기록하고 컴퓨터, 프로세서 등의 기계가 그 데이터를 판독할 수 있는 모든 매체를 포함한다.

본 발명의 실시형태에 따른 디믹싱 방법에 대해, 도 6의 조건에 따라 실험을 수행하였다. 구체적으로, 반향실의 크기는 7m X 5m X 3m이고, 마이크(20, 22)는 벽으로부터 1.5m 및 2.5m 위치에 배치하였다. 마이크(20, 22)간의 거리는 17cm이고 높이는 1.7m였다. 또한, 최근접 소스의 위치는 마이크(20, 22) 사이의 중점을 기준으로 극좌표

로 정하고, 다른 소스(즉, 간섭 소스)의 극좌표는

로 하였다. 위의 조건 하에서, 소스에서의 신호 세기를 나타내는 SPR(Source Power Ratio)을 변화시키면서 디믹싱의 결과를, SIR(Signal-to-Interference Ratio), 즉 신호-대-간섭비로서 측정하였다. 구체적으로,

(s(k)는 최근접 소스로부터의 신호, n(k)는 간섭 소스로부터의 신호),

(x_ij(k)는 마이크 i에서 수신한 소스 j로부터의 신호),

(y_ij(k)는 출력 i에 포함된 소스 j로부터의 신호 성분)

로 주어진다.

소스로부터의 신호로서는 샘플링 레이트 8kHz, 6초 길이의 남자 음성을 사용하였으며, 학습률(

)과 상수(

)의 값은 각각 0.0001과 0.01을 사용하였다. 또한, 반향 시간은 200ms로 설정하고, 벽의 반사계수는 0.74로 하였다.

또한, 방향 제약 조건(directoinally constrainted ICA; dcICA) 방식을 이용하여 동일한 조건에서 실험을 수행하였다.

한편, 대조군으로서 종래의 ICA 방식을 이용하여 동일한 조건에서 디믹싱을 수행하였다.

위의 조건 하에서 디믹싱을 수행한 결과는 다음 표 2에 나타나 있다.

위치		SPR (dB)	SIRx (dB)		SIRy (dB)
위치			마이크 1	마이크 2	ICA	dcICA	ccICA
			마이크 1	마이크 2	ICA	dcICA	ccICA
(0.5m, 0˚)	(1.0m, -60˚)	0	4.6	5.2	21.8	22.2	18.2
		-7.8	-2.3	-1.6	-18.2	11.3	15.3
		-12.5	-6.4	-5.7	-19.9	10.0	11.5
		-14.8	-8.3	-7.6	-22.0	6.4	9.4
		-16.9	-9.3	-9.6	-22.5	-4.5	8.5
(0.5m, 0˚)	(1.0m,-60˚)	-12.5	-6.4	-5.7	-19.9	10.0	11.5
	(1.0m,-30˚)	-13.1	-6.3	-5.7	-19.1	8.2	9.2
	(1.0m,-15˚)	-13.1	-6.3	-5.8	-15.6	-3.7	4.7
	(1.0m, 15˚)	-12.9	-5.9	-6.1	-13.8	-4.3	3.3
	(1.0m, 30˚)	-13.1	-6.3	-5.7	-19.1	5.6	7.6
	(1.0m, 60˚)	-12.5	-6.4	-5.7	-19.9	6.8	10.8
(0.5m,-60˚)	(1.0m, 0˚)	-13.7	-4.9	-7.3	-14.4	11.9	13.9
(0.5m,-30˚)		-13.3	-5.3	-6.8	-21.3	9.2	11.2
(0.5m,-15˚)		-13.1	-5.6	-6.5	-4.8	-5.5	6.5
(0.5m, 15˚)		-13.1	-6.3	-5.8	-8.7	-6.7	4.7
(0.5m, 30˚)		-13.3	-6.5	-5.5	-20.3	6.5	9.5
(0.5m, 60˚)		-13.6	-7.1	-5.0	-23.5	9.8	13.8
(0.5m, 0˚)	(0.6m, -60˚)	-6.7	-5.6	-3.4	-17.3	-5.2	12.8
(0.5m,-30˚)	(0.6m, 30˚)	-6.8	-3.2	-5.8	-8.3	5.3	14.4
(1.0m, 0˚)	(2.0m, -60˚)	-9.4	-4.7	-4.2	-8.7	7.9	6.9
(1.0m, 0˚)	(2.0m, 15˚)	-9.4	-4.3	-4.6	-10.9	-6.9	8.6
(1.0m, 0˚)	(1.1m, -60˚)	-5.3	-4.8	-4.1	-13.5	-10.7	9.1

위의 표에서 볼 수 있듯이, 대부분의 경우에서 ICA 에 의해 추출된 신호의 SIR은 본원 발명의 최근 거리 제약 조건을 이용한 방법, 즉 ccICA(closest constraint ICA)나 거리 제약 조건을 이용한 방법, 즉 dcICA 에 의해 얻어진 신호의 SIR에 비해 낮음을 확인할 수 있다. 그러므로, ccICA 및 dcICA에 의한 암묵 신호 추출이 더욱 우수한 결과를 나타냄을 확인할 수 있었다.

이상 본 발명의 구체적 실시형태들을 참조하여 본 발명을 설명하였으나, 이는 예시에 불과하며 본 발명의 범위를 제한하는 것이 아니다. 당업자는 본 발명의 범위를 벗어나지 않는 범위 내에서 설명된 실시형태들을 변경 또는 변형할 수 있다. 본 명세서에서 설명된 각 기능 블록들 또는 수단들은 전자 회로, 집적 회로, ASIC(Application Specific Integrated Circuit) 등 공지된 다양한 소자들로 구현될 수 있으며, 각각 별개로 구현되거나 2 이상이 하나로 통합되어 구현될 수 있다. 본 명세서 및 청구범위에서 별개인 것으로 설명된 수단 등의 구성요소는 단순히 기능상 구별된 것으로 물리적으로는 하나의 수단으로 구현될 수 있으며, 단일한 것으로 설명된 수단 등의 구성요소도 수개의 구성요소의 결합으로 이루어질 수 있다. 또한 본 명세서에서 설명된 각 방법 단계들은 본 발명의 범위를 벗어나지 않고 그 순서가 변경될 수 있고, 다른 단계가 부가될 수 있다. 뿐만 아니라, 본 명세서에서 설명된 다양한 실시형태들은 각각 독립하여서뿐만 아니라 적절하게 결합되어 구현될 수도 있다. 따라서 본 발명의 범위는 설명된 실시형태가 아니라 첨부된 청구범위 및 그 균등물에 의해 정해져야 한다.

Claims

암묵 신호 추출(Blind Source Extraction)에 의해 신호를 추출하는 장치에 있어서,
2 이상의 수신부를 포함하여 신호를 수신하는 수신 수단과,
디믹싱(demixing)을 위한 전달함수를 산출하는 전달함수 산출 수단과,
산출된 상기 전달함수를 이용하여 수신된 상기 신호를 디믹싱하는 디믹싱 수단을 포함하되,
상기 전달함수는 상기 수신부에서 가장 가까운 소스로부터의 신호를 추출하도록 결정되는
신호 추출 장치.
제 1 항에 있어서,
상기 전달함수는, 소스로부터 가까울수록 상기 수신부까지의 경로에 대한 전달 함수가 델타 함수로 근사됨을 기초로 산출되는
신호 추출 장치.
제 1 항에 있어서,
상기 전달함수는

의 식을 기초로 산출되고,
여기서, W_i는 상기 디믹싱 수단의 입력 i 에 대한 전달함수,

는 가장 가까운 소스로부터 두 개의 상기 수신부까지의 경로 차에 의한 시간 지연인,
신호 추출 장치.
제 1 항에 있어서,
상기 전달함수 산출 수단은
비용함수

를 이용하여 반복적으로 상기 전달함수를 산출하되,
여기서,
이고,

이며,
ω₁과 ω₂는 각각 W₁과 W₂를 나타내는 벡터인,
신호 추출 장치.
제 4 항에 있어서,
상기 전달함수 산출 수단은
비용함수

를 기초로 반복적으로 상기 전달함수를 산출하되,
J_G(w)는 출력 신호의 네젠트로피(Negentropy)를 나타내는 함수이고,

는 상수인
신호 추출 장치.
제 5 항에 있어서,
상기 전달함수 산출 수단은
학습규칙(learning rule)

에 기초하여 반복적으로 상기 전달함수를 산출하되,

는 학습률(learning rate)인,
신호 추출 장치.
제 1 항에 있어서,
상기 신호를 사전백색화(pre-whitening)하는 사전백색화 수단을 더 포함하는
신호 추출 장치.
암묵 신호 추출(Blind Source Extraction)에 의해 신호를 추출하는 방법에 있어서,
2 이상의 수신부를 통해 신호를 수신하는 단계와,
디믹싱을 위한 전달함수를 산출하는 단계와,
산출된 상기 전달함수를 이용하여 수신된 상기 신호를 디믹싱(demixing)하는 단계를 포함하되,
상기 전달함수는 상기 수신부에서 가장 가까운 소스로부터의 신호를 추출하도록 결정되는
신호 추출 방법.
제 8 항에 있어서,
상기 전달함수는, 소스로부터 가까울수록 상기 수신부까지의 경로에 대한 전달 함수가 델타 함수로 근사됨을 기초로 산출되는
신호 추출 방법.
제 8 항에 있어서,
상기 전달함수는

의 식을 기초로 산출되고,
여기서, W_i는 상기 디믹싱 수단의 입력 i 에 대한 전달함수,

는 가장 가까운 소스로부터 두 개의 상기 수신부까지의 경로 차에 의한 시간 지연인,
신호 추출 방법.
제 8 항에 있어서,
상기 전달함수를 산출하는 단계는
비용함수

를 이용하여 반복적으로 상기 전달함수를 산출하되,
여기서,
이고,

이며,
ω₁과 ω₂는 각각 W₁과 W₂를 나타내는 벡터인,
신호 추출 방법.
제 11 항에 있어서,
상기 전달함수를 산출하는 단계는
비용함수

를 기초로 반복적으로 상기 전달함수를 산출하되,
J_G(w)는 출력 신호의 네젠트로피(Negentropy)를 나타내는 함수이고,

는 상수인
신호 추출 방법.
제 12 항에 있어서,
상기 전달함수를 산출하는 단계는
학습규칙(learning rule)

에 기초하여 반복적으로 상기 전달함수를 산출하되,

는 학습률(learning rate)인,
신호 추출 방법.
제 8 항에 있어서,
상기 신호를 사전백색화(pre-whitening)하는 단계를 더 포함하는
신호 추출 방법.
기계에 의해 실행되는 경우, 기계가 제 8 항 내지 제 14 항 중 어느 한 항의 방법을 실행하도록 하는 프로그램이 기록된, 기계 판독 가능한 기록 매체.
암묵 신호 추출(Blind Source Extraction)에 의해 신호를 추출하는 장치에 있어서,
2 이상의 수신부를 포함하여 신호를 수신하는 수신 수단과,
디믹싱(demixing)을 위한 전달함수를 산출하는 전달함수 산출 수단과,
산출된 상기 전달함수를 이용하여 수신된 상기 신호를 디믹싱하는 디믹싱 수단을 포함하되,
상기 전달함수는 상기 수신부에 대해 알려진 방향에 있는 소스로부터의 신호를 제거하고 나머지 소스로부터의 신호를 추출하도록 결정되는
신호 추출 장치.
제 16 항에 있어서,
상기 전달함수는, 상기 알려진 방향에 해당하는 알려진 시간 지연에 기초하여 초기화되는
신호 추출 장치.
제 17 항에 있어서,
상기 알려진 시간 지연은, 상기 알려진 방향에 있는 소스로부터 상기 2 이상의 수신 수단까지의 전달함수에 있어서, 직접 경로에 해당하는 성분 사이의 시간 인덱스 차에 해당하는
신호 추출 장치.
제 16 항에 있어서,
상기 전달함수는, 상기 전달함수를 나타내는 벡터 w의 시간 지연 이외의 성분은 0으로 설정되도록 초기화되는
신호 추출 장치.
암묵 신호 추출(Blind Source Extraction)에 의해 신호를 추출하는 방법에 있어서,
2 이상의 수신부를 통해 신호를 수신하는 단계와,
디믹싱을 위한 전달함수를 산출하는 단계와,
산출된 상기 전달함수를 이용하여 수신된 상기 신호를 디믹싱(demixing)하는 단계를 포함하되,
상기 전달함수는 상기 수신부에 대해 알려진 방향에 있는 소스로부터의 신호를 제거하고 나머지 소스로부터의 신호를 추출하도록 결정되는
신호 추출 방법.
제 20 항에 있어서,
상기 전달함수는, 상기 알려진 방향에 해당하는 알려진 시간 지연에 기초하여 초기화되는
신호 추출 방법.
제 21 항에 있어서,
상기 알려진 시간 지연은, 상기 알려진 방향에 있는 소스로부터 상기 2 이상의 수신 수단까지의 전달함수에 있어서, 직접 경로에 해당하는 성분 사이의 시간 인덱스 차에 해당하는
신호 추출 방법.
제 20 항에 있어서,
상기 전달함수는, 상기 전달함수를 나타내는 벡터 w의 시간 지연 이외의 성분은 0으로 설정되도록 초기화되는
신호 추출 방법.
기계에 의해 실행되는 경우, 기계가 제 20 항 내지 제 23 항 중 어느 한 항의 방법을 실행하도록 하는 프로그램이 기록된, 기계 판독 가능한 기록 매체.