KR101112154B1 - 암묵 신호 추출 방법 및 암묵 신호 추출 장치 - Google Patents
암묵 신호 추출 방법 및 암묵 신호 추출 장치 Download PDFInfo
- Publication number
- KR101112154B1 KR101112154B1 KR1020100041494A KR20100041494A KR101112154B1 KR 101112154 B1 KR101112154 B1 KR 101112154B1 KR 1020100041494 A KR1020100041494 A KR 1020100041494A KR 20100041494 A KR20100041494 A KR 20100041494A KR 101112154 B1 KR101112154 B1 KR 101112154B1
- Authority
- KR
- South Korea
- Prior art keywords
- transfer function
- signal
- source
- demixing
- function
- Prior art date
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 49
- 238000000034 method Methods 0.000 title claims description 43
- 238000012546 transfer Methods 0.000 claims abstract description 121
- 230000006870 function Effects 0.000 claims description 148
- 239000013598 vector Substances 0.000 claims description 17
- 230000002087 whitening effect Effects 0.000 claims description 12
- 239000000284 extract Substances 0.000 abstract description 8
- 238000012880 independent component analysis Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
- G10L21/0308—Voice signal separating characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
암묵 신호 추출 방법 및 암묵 신호 추출 장치가 개시된다. 신호 추출 장치는 2 이상의 수신부를 포함하여 신호를 수신하는 수신 수단과, 디믹싱(demixing)을 위한 전달함수를 산출하는 전달함수 산출 수단과, 산출된 전달함수를 이용하여 수신된 신호를 디믹싱하는 디믹싱 수단을 포함한다. 전달함수는 수신부에서 가장 가까운 소스로부터의 신호를 추출하거나, 수신부에 대해 알려진 방향에 있는 소스로부터의 신호를 제거하고 나머지 소스로부터의 신호를 추출하도록 결정된다. 또한, 전달함수는, 가장 가까운 소스로부터 수신부까지의 경로에 대한 전달 함수가 실질적으로 델타 함수임을 기초로 산출된다.
Description
본 발명은 신호 추출에 관한 것으로, 구체적으로는 방향 제약 조건(Direction Constraint) 또는 최근 거리 제약 조건(Closest Constraint)을 이용한 암묵 신호 추출(Blind Source Extraction)을 위한 방법 및 장치에 관한 것이다.
본 발명은 지식경제부의 인간기능 생활지원 지능로봇 기술개발사업의 일환으로 수행한 연구로부터 도출된 것이다[과제관리번호: F0005000-2009-31, 과제명: 가정 내 다중 음원 환경에서의 음성분리 및 잡음제거 기술 개발].
음성과 같은 신호를 수신하는 경우, 그 신호는 서로 다른 2 이상의 소스(source)에서 발생한 신호들이 혼합되어 있는 신호일 수 있다. 그러므로 이러한 2 이상의 소스로부터의 신호가 혼합된 신호 중에서 원하는 소스로부터의 신호만을 분리 또는 추출해내는 것이 필요하다. 이를 위한 방법으로는 암묵 신호 분리(Blind Source Separation; BSS) 방법과 암묵 신호 추출(Blind Source Extraction; BSE) 방법이 알려져 있다.
암묵 신호 분리 방법은 2이상의 소스로부터의 신호를 분리하여 각각의 소스로부터의 신호를 별도로 획득하는 것이다. 그러나 BSS 방식은 원하지 않는 소스로부터의 신호, 예를 들어 잡음까지도 분리하는 결과를 가져오므로 필요 없는 계산량이 증가하고 계산 시간이나 회로 구성이 복잡해지는 문제가 있다.
반면에 암묵 신호 추출 방법은 신호로부터 원하는 소스로부터의 신호만을 추출하는 방식이다. 그러나, 선택되는 소스를 정의하지 않는 이상, 불확정성을 피할 수 없다. 다시 말해, 정확한 기준이 제공되지 않은 상태에서 하나의 소스로부터의 신호만을 선정하여 추출하는 경우에는, 추출된 신호가 원하는 신호임을 보장할 수가 없다.
기준 신호를 획득하고 그 기준 신호에 기초하여 하나의 신호를 추출하는 BSE 방법도 알려져 있으나, 이 방법은 기준 신호를 획득하기 위해 추가적인 연산이 필요하다는 문제가 있다.
본 발명은 상술한 문제점을 인식한 것으로, 효율적으로 하나의 원하는 신호를 추출할 수 있는 BSE 방법 및 장치를 제공하는 것을 목적으로 한다.
상기 목적을 달성하기 위하여, 본 발명의 일 태양에 따르면, 암묵 신호 추출(Blind Source Extraction)에 의해 신호를 추출하는 장치에 있어서, 2 이상의 수신부를 포함하여 신호를 수신하는 수신 수단과, 디믹싱(demixing)을 위한 전달함수를 산출하는 전달함수 산출 수단과, 산출된 상기 전달함수를 이용하여 수신된 상기 신호를 디믹싱하는 디믹싱 수단을 포함하되, 상기 전달함수는 상기 수신부에서 가장 가까운 소스로부터의 신호를 추출하도록 결정되는 신호 추출 장치가 제공된다.
상기 전달함수는, 소스로부터 가까울수록 상기 수신부까지의 경로에 대한 전달 함수가 델타 함수로 근사됨을 기초로 산출되는 것이 바람직하다.
상기 전달함수는 의 식을 기초로 산출되고, 여기서, Wi는 상기 디믹싱 수단의 입력 i 에 대한 전달함수, 는 가장 가까운 소스로부터 두 개의 상기 수신부까지의 경로 차에 의한 시간 지연인 것도 바람직하다.
바람직하게는, 상기 전달함수 산출 수단은 비용함수 를 기초로 반복적으로 상기 전달함수를 산출하되, JG(w)는 출력 신호의 네젠트로피(Negentropy)를 나타내는 함수이고, 는 상수이다.
상기 신호 추출 장치는 상기 신호를 사전백색화(pre-whitening)하는 사전백색화 수단을 더 포함할 수 있다.
본 발명의 다른 태양에 따르면, 암묵 신호 추출(Blind Source Extraction)에 의해 신호를 추출하는 방법에 있어서, 2 이상의 수신부를 통해 신호를 수신하는 단계와, 디믹싱을 위한 전달함수를 산출하는 단계와, 산출된 상기 전달함수를 이용하여 수신된 상기 신호를 디믹싱(demixing)하는 단계를 포함하되, 상기 전달함수는 상기 수신부에서 가장 가까운 소스로부터의 신호를 추출하도록 결정되는 신호 추출 방법이 제공된다.
상기 전달함수는, 소스로부터 가까울수록 상기 수신부까지의 경로에 대한 전달 함수가 델타 함수로 근사됨을 기초로 산출될 수 있다.
또한, 상기 전달함수는 의 식을 기초로 산출되고, 여기서, Wi는 상기 디믹싱 수단의 입력 i 에 대한 전달함수, 는 가장 가까운 소스로부터 두 개의 상기 수신부까지의 경로 차에 의한 시간 지연일 수 있다.
상기 전달함수를 산출하는 단계는 비용함수 를 이용하여 반복적으로 상기 전달함수를 산출하되, 여기서, 이고, 이며, ω1과 ω2 는 각각 W1과 W2를 나타내는 벡터인 것이 바람직하다.
상기 전달함수를 산출하는 단계는 비용함수 를 기초로 반복적으로 상기 전달함수를 산출하되, JG(w)는 출력 신호의 네젠트로피(Negentropy)를 나타내는 함수이고, 는 상수인 것도 바람직하다.
신호 추출 방법은 상기 신호를 사전백색화(pre-whitening)하는 단계를 더 포함할 수 있다.
본 발명의 또 다른 태양에 따르면, 암묵 신호 추출(Blind Source Extraction)에 의해 신호를 추출하는 장치에 있어서, 2 이상의 수신부를 포함하여 신호를 수신하는 수신 수단과, 디믹싱(demixing)을 위한 전달함수를 산출하는 전달함수 산출 수단과, 산출된 상기 전달함수를 이용하여 수신된 상기 신호를 디믹싱하는 디믹싱 수단을 포함하되, 상기 전달함수는 상기 수신부에 대해 알려진 방향에 있는 소스로부터의 신호를 제거하고 나머지 소스로부터의 신호를 추출하도록 결정되는 신호 추출 장치가 제공된다.
상기 전달함수는, 상기 알려진 방향에 해당하는 알려진 시간 지연에 기초하여 초기화될 수 있다.
상기 알려진 시간 지연은, 상기 알려진 방향에 있는 소스로부터 상기 2 이상의 수신 수단까지의 전달함수에 있어서, 직접 경로에 해당하는 성분 사이의 시간 인덱스 차에 해당하는 것이 바람직하다.
상기 전달함수는, 상기 전달함수를 나타내는 벡터 w의 시간 지연 이외의 성분은 0으로 설정되도록 초기화되는 것이 바람직하다.
본 발명의 다른 태양에 따르면, 암묵 신호 추출(Blind Source Extraction)에 의해 신호를 추출하는 방법에 있어서, 2 이상의 수신부를 통해 신호를 수신하는 단계와, 디믹싱을 위한 전달함수를 산출하는 단계와, 산출된 상기 전달함수를 이용하여 수신된 상기 신호를 디믹싱(demixing)하는 단계를 포함하되, 상기 전달함수는 상기 수신부에 대해 알려진 방향에 있는 소스로부터의 신호를 제거하고 나머지 소스로부터의 신호를 추출하도록 결정되는 신호 추출 방법이 제공된다.
상기 전달함수는, 상기 알려진 방향에 해당하는 알려진 시간 지연에 기초하여 초기화될 수 있다.
상기 알려진 시간 지연은, 상기 알려진 방향에 있는 소스로부터 상기 2 이상의 수신 수단까지의 전달함수에 있어서, 직접 경로에 해당하는 성분 사이의 시간 인덱스 차에 해당하는 것이 바람직하다.
또한, 상기 전달함수는, 상기 전달함수를 나타내는 벡터 w의 시간 지연 이외의 성분은 0으로 설정되도록 초기화될 수 있다.
본 발명의 다른 태양에 따르면, 기계에 의해 실행되는 경우, 기계가 상기한 방법을 실행하도록 하는 프로그램이 기록된, 기계 판독 가능한 기록 매체가 제공된다.
본 발명에 따르면, 수신부로부터 특정 방향에 있는 소스 또는 가장 가까운 소스로부터의 신호를 효율적으로 추출하는 방법 및 장치를 얻을 수 있다.
도 1은 본 발명의 일 실시형태에 따른 디믹싱 시스템을 설명하기 위한 도면.
도 2는 본 발명의 일 실시형태에 따른 디믹싱을 설명하기 위한 도면.
도 3은 본 발명의 다른 실시형태에 따른 디믹싱 시스템을 도시하는 블록도.
도 4는 거리에 따른 DRR을 나타내는 그래프.
도 5는 본 발명의 일 실시형태에 따른 디믹싱 방법을 설명하기 위한 도면.
도 6은 본 발명의 시뮬레이션 조건을 설명하는 도면.
도 2는 본 발명의 일 실시형태에 따른 디믹싱을 설명하기 위한 도면.
도 3은 본 발명의 다른 실시형태에 따른 디믹싱 시스템을 도시하는 블록도.
도 4는 거리에 따른 DRR을 나타내는 그래프.
도 5는 본 발명의 일 실시형태에 따른 디믹싱 방법을 설명하기 위한 도면.
도 6은 본 발명의 시뮬레이션 조건을 설명하는 도면.
이하, 첨부된 도면을 참조하여 본 발명의 구체적 실시형태를 설명한다.
실시형태의 설명을 위해 도 1에 도시된 바와 같이, 실내에서 2개의 소스(예를 들어, 스피커 10, 12)로부터의 신호가 1 이상의 신호 수신부(예를 들어, 마이크 20, 22)에서 수신되는 경우를 고려한다. 각각의 스피커(10, 12)로부터의 신호는 직접 경로(D)를 통해 마이크(20)에 도달될 뿐만 아니라, 실내의 벽에 반향되어 반향 경로(R)를 통해서도 마이크(20)에 도달된다. 예를 들어, 스피커(10)로부터의 신호는 직접 경로 D11을 거쳐 마이크(20)에 도달되고, 직접 경로 D12를 거쳐 마이크(22)에 도달된다. 또한, 반향 경로 R11을 거쳐 마이크(20)에 도달되고, 반향 경로 R12를 거쳐 마이크(22)에 도달된다. 이는 다른 스피커(12)에 대해서도 동일하다.
마이크(20, 22)에서 수신된 신호들은 디믹싱(demixing) 시스템(30)에 입력되고, 디믹싱 시스템(30)에서 수행되는 디믹싱에 의해 희망의 신호가 추출된다. 본 발명의 실시형태에서, 희망의 신호는 마이크(20, 22)로부터의 방향 또는 마이크(20, 22)로부터의 거리에 기초하여 선택된다.
한편, 실질적으로 마이크(20, 22)도 디믹싱 시스템(30)에 포함되는 것으로 고려할 수도 있고, 마이크(20, 22)로부터의 신호를 수신하는 수신부가 디믹싱 시스템(30)에 포함되는 것으로 고려할 수도 있으므로, 특별히 언급되지 않는 한, 이후의 논의에서는 디믹싱 시스템(30)과 수신부(20, 22)를 구별하지 않는다.
도 2는 본 발명의 일 실시형태에 다른 디믹싱 시스템(30)의 구성을 도시하는 도면이다. 도시된 바와 같이, 디믹싱 시스템(30)은 사전백색화(pre-whitening) 필터(32)와 디믹싱 필터(34)를 포함한다. 구체적으로, 스피커로부터의 신호 x1, x2는 사전백색화 필터(32)에 입력된다. 이 신호 x1, x2는 실질적으로는 스피커로부터 마이크까지의 경로를 통과하여 전달된 신호로서, 경로의 전달 함수 A를 거친 신호라고 할 수 있다.
입력된 신호 x1, x2에 대해, 신호 간의 상관에 의해 이후의 처리의 신뢰성이 저하되는 것을 방지하기 위해 사전백색화가 이루지고, 사전백색화된 신호 w1, w2가 출력된다. 사전백색화 필터(32)는 후속 처리를 돕기 위한 것으로서, 필수적으로 포함되어야 하는 것은 아니며, 디믹싱 필터(34)에 통합될 수도 있다. 수학적으로 말해, 디믹싱 필터(34)의 전달 함수가 사전백색화를 고려하여 결정될 수도 있다는 것이다.
다음, 사전백색화된 신호 w1, w2는 디믹싱 필터(34)에 입력되어 디믹싱이 수행되고, 하나의 추출된 신호 y가 출력된다. 이하, 디믹싱 필터(34)의 전달함수를 W라 한다. 또한, 디믹싱 필터의 전달함수 W을 표현한 벡터를 w라고 한다.
디믹싱 필터(34)는 필터 파라미터 산출부(36)과 연결되어 필터의 전달함수 W, 또는 전달함수를 결정하는데 필요한 필터 파라미터, 예를 들어 벡터 w를 공급받는다. 이하에서는, 파라미터 산출부(36)에서 수행되는 필터 파라미터 산출에 대해 설명한다. 다만, 파라미터 산출부(36)는 별개의 구성요소일 필요는 없으며, 디믹싱 필터(34)와 통합될 수도 있음을 유의하여야 한다.
디믹싱 시스템에서 디믹싱 필터(34)에 의해 추출된 신호 y는 스피커로부터의 신호와 동일하여야 하므로, 최초 신호에 경로의 전달함수 A를 곱하고, 다시 디믹싱 필터의 전달함수 W를 곱하면 원 신호가 복원되어야 한다. 이를 행렬로 표현하면, 다음 수학식 1과 같다.
여기서 W1(z)는 디믹싱 시스템의 입력 x1과 출력 y 에 대한 전달함수의 z-도메인 표현이고, W2(z)는 디믹싱 시스템의 입력 x2와 출력 y 에 대한 전달함수의 z-도메인 표현이다. 또한, Aij(z)는 소스(예를 들어, 스피커) j로부터 수신부(예를 들어, 마이크) i까지의 경로의 전달함수의 z-도메인 표현이다.
본원 발명의 발명자들은 상기 수학식 2에서의 전달함수, 즉 W1와 W2를 결정하기 위하여, 방향 제약 조건(Direction Constraint) 및 최근 거리 제약 조건(Closest Constraint)을 창안하였으며, 이에 대해 아래에서 자세히 설명한다.
방향 제약 조건에 기초한 신호의 추출
먼저, 방향 제약 조건을 이용하는 본 발명의 실시형태를 설명한다. 본 실시형태에서는 2 이상의 소스 중 특정 방향으로부터의 신호를 제거하고 나머지 소스로부터의 신호를 추출한다. 이를 위해, 도 3 에 도시된 바와 같이 마이크(20)로부터 φ의 각도를 갖는 방향의 소스, 즉 스피커(10)로부터의 신호를 제거한다고 가정하면, 도 3에 도시된 바와 같이 스피커(10)로부터 2개의 마이크(20, 22)까지의 거리의 차이는 Dsin(φ)로 주어진다 (여기서, D는 마이크 사이의 거리). 그러므로, 신호가 두 마이크에 도달하는 시간의 차 는 다음 수학식 2로 주어진다.
여기서, v는 신호의 속도를 나타낸다.
이때, 두 신호의 시간 차가 0인 경우에는 스피커(10)가 마이크(20, 22)로부터 동일한 거리에 있는 것이고, 이는 스피커(10)가 마이크(20, 22) 사이의 중점을 기준으로 정면에 있음을 의미한다. 한편, 스피커(10)가 마이크(20, 22)의 중점을 기준으로 오른쪽 측면에 위치한다면, φ가 0보다 크고, 시간차 는 양의 값을 갖는다. 반면, 스피커(10)가 마이크(20, 22)의 중점을 기준으로 왼쪽 측면에 위치하면, 시간차 는 음의 값을 갖는다. 이처럼, 신호의 도달 시간차에는 신호의 방향에 대한 정보가 포함되어 있는 것이고, 역으로 신호의 방향이 정해지면 도달 시간차도 함께 정해지게 된다. 위의 수학식 2를 수열 식에서의 인덱스 값으로 표현하면 다음 수학식 3의 ρ를 얻는다. 수학식 3은 각 전달함수를 나타내는 수열에서 최대값을 나타내는(즉, 직접 경로 전달함수를 나타내는) 성분의 시간 인덱스의 차이를 표현한 것이다.
한편, 수학식 1의 제2열의 계산 결과, 즉, 추출하고자 하는 신호 이외의 신호가 0이 되도록 전달함수가 결정된다는 것으로부터 수학식 4를 얻는다.
수학식 4을 주파수 도메인에서 표현하면 다음의 수학식 5와 수학식 6을 얻는다. 수학식 6은 수학식 5의 수열(series) 표현이다.
일반적으로, 직접 경로를 통한 신호가 반향 경로를 통한 신호보다 매우 크기 때문에, 수학식 6에서 직접 경로를 통한 성분만을 취하면, 다음의 식을 얻는다.
여기서, σ와ξ는 각각 직접 경로 신호에 대한 전달함수의 인덱스이다. 따라서, 인덱스의 차 와 는 각각 전달함수 W와 A에 대한 직접 경로 성분에 대한 시간 인덱스 차이와 동일하다. 수학식 2와 관련하여 설명한 바와 같이, 소스의 방향(즉, φ)이 정해지면 시간차를 알 수 있으며, 시간차는 직접 경로 신호의 인덱스차와 동일하므로, 수학식 7에 있어서 와 는 방향 제약 조건 하에서 알려진 값, 즉 수학식 3의 ρ가 된다.
따라서, 본 실시형태에서는, 전달함수 W를 나타내는 벡터 w를 수학식 2의 시간 지연 또는 수학식 3의 시간 인덱스 차로 초기화 한 후에, 적응적으로 벡터 w를 계산하여 전달함수를 얻어내고, 또한 전달함수를 이용하여 신호를 추출한다. 따라서 상기 수학식 4의 관계에 의해, 알려진 방향에 존재하는 소스로부터의 신호는 제거되고, 나머지 신호만이 추출될 수 있다. 여기서, 적응적으로 벡터 w를 계산하기 위해서는 다양한 방법을 사용할 수 있으며, 예를 들어 종래의 네젠트로피를 이용한 BSE 방법을 이용할 수 있다. 불필요한 성분을 배제하기 위해, 초기화 시에, 벡터 w에서 시간 지연을 나타내는 성분 이외의 모든 성분은 0으로 설정할 수 있다. 이로써, 특정 방향(예를 들어, 각도 φ)에 위치하는 소스로부터의 신호를 배제하고 나머지 신호를 추출할 수 있게 된다.
거리 제약 조건에 기초한 신호의 추출
다음, 거리 제약 조건을 이용하는 본 발명의 다른 실시형태를 설명한다. 본 실시형태에 있어서, 소스 1이 희망의 소스라 하고, 상기의 수학식 1 중 소스 1에 대한 식만을 고려하면, 다음의 수학식 8이 성립한다.
도 1에 도시된 바와 같이, 일반적으로 소스로부터의 신호는 직접 경로와 반향 경로를 거쳐 수신부에 도달한다. 따라서, 수신부에서 수신된 신호에는 직접 성분과 반향 성분이 혼합되어 있으며, 직접 성분과 반향 성분간의 에너지 비를 DRR(Direct-to-Reverbarant Ratio)라 한다. 예를 들어, DRR은 다음 수학식 9로 계산될 수 있다.
여기서, ω(k)는 경로의 전달함수를 나타내고, kmax는 ω(k)를 최대로 하는 인덱스 k를 나타낸다. 수학식 9에서 알 수 있듯이, 전달함수 ω에 대한 DDR은 그 전달함수 중 최대값()과 나머지 값의 합()의 비로 이해할 수 있으며, DDR이 클수록 특정 인덱스에서의 전달함수 값이 다른 값에 비해 현저히 큰 것임을 알 수 있다.
본 발명자들의 연구에 따르면, 다음 표와 같이, 수신부에 가까운 소스로부터의 신호일수록 직접 성분의 비율이 높아 DRR이 크며, 수신부로부터 멀어질수록 DRR값이 급격히 감소한다. 다시 말해, 소스에 가까운 신호일수록 특정 인덱스에서의 전달함수의 크기가 다른 인덱스에서의 전달함수 크기보다 현저히 크게 된다는 것이다.
거리(m) | DRR |
0.5 | 14.42 |
1.0 | 2.70 |
1.5 | 0.88 |
2.0 | 0.32 |
이러한 연구를 바탕으로, 본 발명자들은 소스에 가까운 신호일수록, 소스와 수신부 사이의 경로의 전달함수 A가 델타 함수(delta function)에 가깝다는 것을 발견하였다. 이는 각각 거리 0.5m와 2.0m에서의 임펄스 응답을 나타내는 도 4(a) 및 4(b)로부터 확인할 수 있다. 따라서, 최근 거리 소스로부터의 신호에 대한 전달함수 A, 위 수학식 4에서 A11은 델타 함수라고 가정할 수 있다.
한편, 일반성을 잃지 않고, 두 개의 수신부, 즉 마이크(10, 12)가 서로 충분히 가깝게 위치하여 소스, 즉 스피커로부터 두 수신부까지의 경로는 그 거리가 상이할 뿐 특성이 거의 동일하다고 가정할 수 있다.
위의 두 가지 가정, 즉, A11이 델타 함수이고, A21은 A11의 시간 지연된 버전과 같다는 가정으로부터, 수학식 8은 다음 수학식 10으로 변환될 수 있다.
위의 수학식 10을 k 도메인에서 표현하여 다음 수학식 11을 얻을 수 있다.
최종적으로, 수학식 11을 기초로, 다음 수학식 12와 같은 최근 거리 제약 조건 하의 비용 함수 JC를 정의 할 수 있다.
상기의 비용함수를 최대로 하는 w를 반복적(iteratively)으로 연산함으로써, 디믹싱 필터의 전달함수를 얻고 혼합 신호로부터 가장 가까운 소스로부터의 신호를 추출해 낼 수 있게 된다. 여기서 반복적이라 함은, 이전 연산의 결과를 이용하여 연산을 다시 수행하는 것을 포함한다.
네젠트로피에 근거한 비용함수
일 실시형태에서, 상기 최근 거리 제약 조건 하의 비용함수 JC는 ICA(Independent Component Analysis)에서 사용되는 비용함수 JG와 함께 고려될 수 있다. ICA에서는 신호의 비-가우스 함수 특성(non-Gaussianity)을 최대화하기 위한 기준으로서 네젠트로피(Negentropy)가 비용함수로 사용될 수 있으며, 이는 다음 수학식 13으로 주어진다.
G는 비2차 우함수(non-quadratic even function)이다.
한편, []는 기대값(expectation)을 나타내는 연산자로서, 시간 평균으로 구현될 수 있다.
위의 네젠트로피와 최근 거리 제약 조건 하의 비용 함수 수학식 12를 함께 고려하여, 다음의 비용 함수를 얻는다.
또한, 위 수학식 14의 비용 함수를 이용하여 다음의 학습 규칙(learning rule)을 얻는다.
를 얻는다.
또한, 수학식 13을 미분하면,
이상과 같이, 본 발명의 일 실시형태의 필터 파라미터 산출부(36)는, 방향 제약 조건 또는 최근 거리 제약 조건을 이용하여 디믹싱 필터 W를 나타내는 벡터 w를 구할 수 있다. 구체적으로, 방향 제약 조건을 이용하는 경우에는 w를 시간 지연으로 초기화하고, 최근 거리 제약 조건을 이용하는 경우에는 위의 수학식 15의 학습 규칙을 이용하여 벡터 w를 결정할 수 있다.
필터 파라미터 산출부(36)는 필터의 파라미터를 산출하여 디믹싱 필터(34)에 공급한다. 특히, 필터 파라미터 산출부(36)는 필터(34)로부터의 출력을 수신하고, 이에 기초하여 반복적으로 파라미터를 산출하여 필터에 공급함으로써, 디믹싱 필터(34)가 적응적으로 동작하도록 할 수 있다.
신호 추출 방법
다음, 본 발명의 일 실시형태에 따른 신호 추출 방법을 도 5를 참조하여 설명한다.
본 실시형태의 방법은 먼저, 단계 410에서 2 이상의 소스로부터의 신호가 혼합된 혼합 신호를 수신한다. 혼합 신호에는, 2이상의 소스로부터의 신호가 혼합되어 있을 뿐만 아니라, 직접 경로 및 반향 경로로부터의 신호가 혼합되어 있다.
다음, 단계 420에서는 수신된 신호에 대해 사전백색화를 수행하여, 후속 처리를 준비한다. 단계 420은 필수적인 것은 아니며, 이후의 단계와 통합되거나 생략될 수 있다.
다음, 단계 430에서, 백색화된 (또는 수신된) 신호에 대하여 디믹싱을 수행하여 소망의 한 소스로부터의 신호, 즉, 특정 방향의 소스 또는 가장 가까운 소스로부터의 신호를 추출하기 위하여, 디믹싱 파라미터를 산출한다.
단계 430에 있어서, 특정 방향의 소스로부터의 신호를 추출하기 위해, 디믹싱 필터의 전달함수를 나타내는 벡터 w를 시간 지연으로 초기화할 수 있다. 다른 실시형태에서는, 가장 가까운 소스로부터의 신호를 추출하기 위해, 수학식 8의 비용 함수 및/또는 수학식 10의 비용 함수를 이용하여 디믹싱 필터의 전달함수 W를 구한다. 단계 430에서 얻는 전달함수에는 단계 420에서 수행된 사전 백색화에 대응되는 백색화 필터링이 추가될 수 있다. 다르게는, 별도의 단계에서 백색화가 수행될 수도 있다.
그리고, 단계 440에서 산출된 전달함수 W를 이용하여 신호를 디믹싱 하고, 소망의 신호를 추출한다.
여기서, 전달함수 W는, 예를 들어, 수학식 11의 학습 규칙 등에 따라 반복적으로 연산을 수행함으로써 적응적으로 얻어질 수 있다. 따라서, 단계 450에서는, 전달 함수 W가 수렴하였는지 여부를 판단하고, 전달함수가 수렴하지 않은 경우에는 단계 430으로 돌아가 전달함수 W를 다시 산출하고, 디믹싱을 수행한다.
본 발명의 방법은 기계에 의해 실행되는 경우, 기계가 상기한 방법을 실행하도록 하는 프로그램의 형태로 구현되어 기계가 판독할 수 있는 매체에 기록될 수 있다. 매체는, 컴팩트 디스크(CD), 자기 디스크, 자기 테이프, ROM(Read Only Memory), RAM(Random Access Memory), 광 디스크, 플래시 디스크 등을 포함하나 이에 제한되지 않으며, 데이터를 기록하고 컴퓨터, 프로세서 등의 기계가 그 데이터를 판독할 수 있는 모든 매체를 포함한다.
본 발명의 실시형태에 따른 디믹싱 방법에 대해, 도 6의 조건에 따라 실험을 수행하였다. 구체적으로, 반향실의 크기는 7m X 5m X 3m이고, 마이크(20, 22)는 벽으로부터 1.5m 및 2.5m 위치에 배치하였다. 마이크(20, 22)간의 거리는 17cm이고 높이는 1.7m였다. 또한, 최근접 소스의 위치는 마이크(20, 22) 사이의 중점을 기준으로 극좌표 로 정하고, 다른 소스(즉, 간섭 소스)의 극좌표는 로 하였다. 위의 조건 하에서, 소스에서의 신호 세기를 나타내는 SPR(Source Power Ratio)을 변화시키면서 디믹싱의 결과를, SIR(Signal-to-Interference Ratio), 즉 신호-대-간섭비로서 측정하였다. 구체적으로,
(s(k)는 최근접 소스로부터의 신호, n(k)는 간섭 소스로부터의 신호),
(xij(k)는 마이크 i에서 수신한 소스 j로부터의 신호),
(yij(k)는 출력 i에 포함된 소스 j로부터의 신호 성분)
로 주어진다.
소스로부터의 신호로서는 샘플링 레이트 8kHz, 6초 길이의 남자 음성을 사용하였으며, 학습률()과 상수()의 값은 각각 0.0001과 0.01을 사용하였다. 또한, 반향 시간은 200ms로 설정하고, 벽의 반사계수는 0.74로 하였다.
또한, 방향 제약 조건(directoinally constrainted ICA; dcICA) 방식을 이용하여 동일한 조건에서 실험을 수행하였다.
한편, 대조군으로서 종래의 ICA 방식을 이용하여 동일한 조건에서 디믹싱을 수행하였다.
위의 조건 하에서 디믹싱을 수행한 결과는 다음 표 2에 나타나 있다.
위치 | SPR (dB) | SIRx (dB) | SIRy (dB) | ||||
마이크 1 | 마이크 2 | ICA | dcICA | ccICA | |||
(0.5m, 0˚) | (1.0m, -60˚) | 0 | 4.6 | 5.2 | 21.8 | 22.2 | 18.2 |
-7.8 | -2.3 | -1.6 | -18.2 | 11.3 | 15.3 | ||
-12.5 | -6.4 | -5.7 | -19.9 | 10.0 | 11.5 | ||
-14.8 | -8.3 | -7.6 | -22.0 | 6.4 | 9.4 | ||
-16.9 | -9.3 | -9.6 | -22.5 | -4.5 | 8.5 | ||
(0.5m, 0˚) | (1.0m,-60˚) | -12.5 | -6.4 | -5.7 | -19.9 | 10.0 | 11.5 |
(1.0m,-30˚) | -13.1 | -6.3 | -5.7 | -19.1 | 8.2 | 9.2 | |
(1.0m,-15˚) | -13.1 | -6.3 | -5.8 | -15.6 | -3.7 | 4.7 | |
(1.0m, 15˚) | -12.9 | -5.9 | -6.1 | -13.8 | -4.3 | 3.3 | |
(1.0m, 30˚) | -13.1 | -6.3 | -5.7 | -19.1 | 5.6 | 7.6 | |
(1.0m, 60˚) | -12.5 | -6.4 | -5.7 | -19.9 | 6.8 | 10.8 | |
(0.5m,-60˚) | (1.0m, 0˚) | -13.7 | -4.9 | -7.3 | -14.4 | 11.9 | 13.9 |
(0.5m,-30˚) | -13.3 | -5.3 | -6.8 | -21.3 | 9.2 | 11.2 | |
(0.5m,-15˚) | -13.1 | -5.6 | -6.5 | -4.8 | -5.5 | 6.5 | |
(0.5m, 15˚) | -13.1 | -6.3 | -5.8 | -8.7 | -6.7 | 4.7 | |
(0.5m, 30˚) | -13.3 | -6.5 | -5.5 | -20.3 | 6.5 | 9.5 | |
(0.5m, 60˚) | -13.6 | -7.1 | -5.0 | -23.5 | 9.8 | 13.8 | |
(0.5m, 0˚) | (0.6m, -60˚) | -6.7 | -5.6 | -3.4 | -17.3 | -5.2 | 12.8 |
(0.5m,-30˚) | (0.6m, 30˚) | -6.8 | -3.2 | -5.8 | -8.3 | 5.3 | 14.4 |
(1.0m, 0˚) | (2.0m, -60˚) | -9.4 | -4.7 | -4.2 | -8.7 | 7.9 | 6.9 |
(1.0m, 0˚) | (2.0m, 15˚) | -9.4 | -4.3 | -4.6 | -10.9 | -6.9 | 8.6 |
(1.0m, 0˚) | (1.1m, -60˚) | -5.3 | -4.8 | -4.1 | -13.5 | -10.7 | 9.1 |
위의 표에서 볼 수 있듯이, 대부분의 경우에서 ICA 에 의해 추출된 신호의 SIR은 본원 발명의 최근 거리 제약 조건을 이용한 방법, 즉 ccICA(closest constraint ICA)나 거리 제약 조건을 이용한 방법, 즉 dcICA 에 의해 얻어진 신호의 SIR에 비해 낮음을 확인할 수 있다. 그러므로, ccICA 및 dcICA에 의한 암묵 신호 추출이 더욱 우수한 결과를 나타냄을 확인할 수 있었다.
이상 본 발명의 구체적 실시형태들을 참조하여 본 발명을 설명하였으나, 이는 예시에 불과하며 본 발명의 범위를 제한하는 것이 아니다. 당업자는 본 발명의 범위를 벗어나지 않는 범위 내에서 설명된 실시형태들을 변경 또는 변형할 수 있다. 본 명세서에서 설명된 각 기능 블록들 또는 수단들은 전자 회로, 집적 회로, ASIC(Application Specific Integrated Circuit) 등 공지된 다양한 소자들로 구현될 수 있으며, 각각 별개로 구현되거나 2 이상이 하나로 통합되어 구현될 수 있다. 본 명세서 및 청구범위에서 별개인 것으로 설명된 수단 등의 구성요소는 단순히 기능상 구별된 것으로 물리적으로는 하나의 수단으로 구현될 수 있으며, 단일한 것으로 설명된 수단 등의 구성요소도 수개의 구성요소의 결합으로 이루어질 수 있다. 또한 본 명세서에서 설명된 각 방법 단계들은 본 발명의 범위를 벗어나지 않고 그 순서가 변경될 수 있고, 다른 단계가 부가될 수 있다. 뿐만 아니라, 본 명세서에서 설명된 다양한 실시형태들은 각각 독립하여서뿐만 아니라 적절하게 결합되어 구현될 수도 있다. 따라서 본 발명의 범위는 설명된 실시형태가 아니라 첨부된 청구범위 및 그 균등물에 의해 정해져야 한다.
Claims (24)
- 삭제
- 암묵 신호 추출(Blind Source Extraction)에 의해 신호를 추출하는 장치에 있어서,
2 이상의 수신부를 포함하여 신호를 수신하는 수신 수단과,
디믹싱(demixing)을 위한 전달함수를 산출하는 전달함수 산출 수단과,
산출된 상기 전달함수를 이용하여 수신된 상기 신호를 디믹싱하는 디믹싱 수단을 포함하되,
상기 전달함수는, 상기 수신부에서 가장 가까운 소스로부터의 신호를 추출하도록 결정되며, 상기 소스로부터 가까울수록 상기 수신부까지의 경로에 대한 전달 함수가 델타 함수로 근사됨을 기초로 산출되는
신호 추출 장치. - 제 2 항에 있어서,
상기 신호를 사전백색화(pre-whitening)하는 사전백색화 수단을 더 포함하는
신호 추출 장치. - 삭제
- 암묵 신호 추출(Blind Source Extraction)에 의해 신호를 추출하는 방법에 있어서,
2 이상의 수신부를 통해 신호를 수신하는 단계와,
디믹싱을 위한 전달함수를 산출하는 단계와,
산출된 상기 전달함수를 이용하여 수신된 상기 신호를 디믹싱(demixing)하는 단계를 포함하되,
상기 전달함수는, 상기 수신부에서 가장 가까운 소스로부터의 신호를 추출하도록 결정되며, 소스로부터 가까울수록 상기 수신부까지의 경로에 대한 전달 함수가 델타 함수로 근사됨을 기초로 산출되는
신호 추출 방법. - 제 9 항에 있어서,
상기 신호를 사전백색화(pre-whitening)하는 단계를 더 포함하는
신호 추출 방법. - 컴퓨터에 의해 실행되는 경우, 상기 컴퓨터가 제 9 항 내지 제 14 항 중 어느 한 항의 신호 추출 방법을 실행하도록 하는 프로그램이 기록된, 컴퓨터 판독가능 기록 매체.
- 암묵 신호 추출(Blind Source Extraction)에 의해 신호를 추출하는 장치에 있어서,
2 이상의 수신부를 포함하여 신호를 수신하는 수신 수단과,
디믹싱(demixing)을 위한 전달함수를 산출하는 전달함수 산출 수단과,
산출된 상기 전달함수를 이용하여 수신된 상기 신호를 디믹싱하는 디믹싱 수단을 포함하되,
상기 전달함수는 상기 수신부에 대해 알려진 방향에 있는 소스로부터의 신호를 제거하고 나머지 소스로부터의 신호를 추출하도록 결정되는
신호 추출 장치. - 제 16 항에 있어서,
상기 전달함수는, 상기 알려진 방향에 해당하는 알려진 시간 지연에 기초하여 초기화되는
신호 추출 장치. - 제 17 항에 있어서,
상기 알려진 시간 지연은, 상기 알려진 방향에 있는 소스로부터 상기 2 이상의 수신부까지의 전달함수에 있어서, 직접 경로에 해당하는 성분 사이의 시간 인덱스 차에 해당하는
신호 추출 장치. - 제 16 항에 있어서,
상기 전달함수는, 상기 전달함수를 나타내는 벡터 w의 시간 지연 이외의 성분은 0으로 설정되도록 초기화되는
신호 추출 장치. - 암묵 신호 추출(Blind Source Extraction)에 의해 신호를 추출하는 방법에 있어서,
2 이상의 수신부를 통해 신호를 수신하는 단계와,
디믹싱을 위한 전달함수를 산출하는 단계와,
산출된 상기 전달함수를 이용하여 수신된 상기 신호를 디믹싱(demixing)하는 단계를 포함하되,
상기 전달함수는 상기 수신부에 대해 알려진 방향에 있는 소스로부터의 신호를 제거하고 나머지 소스로부터의 신호를 추출하도록 결정되는
신호 추출 방법. - 제 20 항에 있어서,
상기 전달함수는, 상기 알려진 방향에 해당하는 알려진 시간 지연에 기초하여 초기화되는
신호 추출 방법. - 제 21 항에 있어서,
상기 알려진 시간 지연은, 상기 알려진 방향에 있는 소스로부터 상기 2 이상의 수신부까지의 전달함수에 있어서, 직접 경로에 해당하는 성분 사이의 시간 인덱스 차에 해당하는
신호 추출 방법. - 제 20 항에 있어서,
상기 전달함수는, 상기 전달함수를 나타내는 벡터 w의 시간 지연 이외의 성분은 0으로 설정되도록 초기화되는
신호 추출 방법. - 컴퓨터에 의해 실행되는 경우, 상기 컴퓨터가 제 20 항 내지 제 23 항 중 어느 한 항의 신호 추출 방법을 실행하도록 하는 프로그램이 기록된, 컴퓨터 판독가능 기록 매체.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020100041494A KR101112154B1 (ko) | 2010-05-03 | 2010-05-03 | 암묵 신호 추출 방법 및 암묵 신호 추출 장치 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020100041494A KR101112154B1 (ko) | 2010-05-03 | 2010-05-03 | 암묵 신호 추출 방법 및 암묵 신호 추출 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20110121955A KR20110121955A (ko) | 2011-11-09 |
KR101112154B1 true KR101112154B1 (ko) | 2012-02-22 |
Family
ID=45392660
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020100041494A KR101112154B1 (ko) | 2010-05-03 | 2010-05-03 | 암묵 신호 추출 방법 및 암묵 신호 추출 장치 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101112154B1 (ko) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101356040B1 (ko) * | 2012-06-27 | 2014-01-29 | 한국과학기술원 | 주파수 영역에서의 암묵 신호 추출 방법 및 이를 위한 디믹싱 시스템 |
KR101474321B1 (ko) * | 2012-06-29 | 2014-12-30 | 한국과학기술원 | 암묵신호 분리에서의 순열/비례 문제 해결장치 및 그 방법 |
KR101474633B1 (ko) * | 2013-02-25 | 2014-12-24 | 한국과학기술원 | 주파수 영역의 암묵신호 추출에서의 다중 주파수 해상도를 이용한 비례문제 해결장치 및 그 방법 |
KR101463955B1 (ko) * | 2013-02-27 | 2014-11-21 | 한국과학기술원 | 방향 정보를 이용한 암묵 신호 추출 방법 및 이를 위한 디믹싱 시스템 |
KR20240009758A (ko) * | 2022-07-14 | 2024-01-23 | 서강대학교산학협력단 | 강인한 음성인식을 위한 타겟 마스크 및 독립성분분석 기반의 실시간 빔포밍 및 방향 벡터 추정 방법 |
-
2010
- 2010-05-03 KR KR1020100041494A patent/KR101112154B1/ko active IP Right Grant
Non-Patent Citations (1)
Title |
---|
Mandic et al., 'Blind source extraction based on a linear predictor', IET Signal Processing, Vol.1, pp.29-34, March 2007* |
Also Published As
Publication number | Publication date |
---|---|
KR20110121955A (ko) | 2011-11-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6837099B2 (ja) | 音響エコーキャンセルのための室内インパルス応答の推定 | |
KR101112154B1 (ko) | 암묵 신호 추출 방법 및 암묵 신호 추출 장치 | |
EP2123116A1 (en) | Multi-sensor sound source localization | |
WO2015065682A1 (en) | Selective audio source enhancement | |
KR102087307B1 (ko) | 잔향 환경에 강인한 음원 방향 추정을 위한 심화 신경망 기반의 앙상블 음원 방향 추정 방법 및 장치 | |
US20210058731A1 (en) | Acoustic program, acoustic device, and acoustic system | |
TW201727623A (zh) | 聲場增強裝置及方法 | |
Aichner et al. | Time domain blind source separation of non-stationary convolved signals by utilizing geometric beamforming | |
CN106872945A (zh) | 声源定位方法、装置和电子设备 | |
Nakadai et al. | Robot audition for dynamic environments | |
WO2020020247A1 (zh) | 信号处理方法、装置以及计算机存储介质 | |
EP3320311B1 (en) | Estimation of reverberant energy component from active audio source | |
US20130156222A1 (en) | Method and Apparatus for Blind Signal Extraction | |
WO2022256577A1 (en) | A method of speech enhancement and a mobile computing device implementing the method | |
Cobos et al. | Wireless acoustic sensor networks and applications | |
CN113223552A (zh) | 语音增强方法、装置、设备、存储介质及程序 | |
EP3335217A1 (en) | A signal processing apparatus and method | |
López-Espejo et al. | Feature enhancement for robust speech recognition on smartphones with dual-microphone | |
CN115421099A (zh) | 一种语音波达方向估计方法及系统 | |
Deleforge et al. | Audio-motor integration for robot audition | |
JP6114053B2 (ja) | 音源分離装置、音源分離方法、およびプログラム | |
CN112653979A (zh) | 自适应去混响方法和装置 | |
Ağcaer et al. | Binaural source localization based on modulation-domain features and decision pooling | |
Sanei et al. | A geometrically constrained multimodal approach for convolutive blind source separation | |
KR20120102832A (ko) | 음원재생장치, 음원재생장치에서 음원을 재생하는 방법 및 궤환신호를 제거하는 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20160127 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20161227 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20180102 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20190107 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20200122 Year of fee payment: 9 |