KR20110121955A - 암묵 신호 추출 방법 및 암묵 신호 추출 장치 - Google Patents

암묵 신호 추출 방법 및 암묵 신호 추출 장치 Download PDF

Info

Publication number
KR20110121955A
KR20110121955A KR1020100041494A KR20100041494A KR20110121955A KR 20110121955 A KR20110121955 A KR 20110121955A KR 1020100041494 A KR1020100041494 A KR 1020100041494A KR 20100041494 A KR20100041494 A KR 20100041494A KR 20110121955 A KR20110121955 A KR 20110121955A
Authority
KR
South Korea
Prior art keywords
transfer function
signal
source
demixing
signal extraction
Prior art date
Application number
KR1020100041494A
Other languages
English (en)
Other versions
KR101112154B1 (ko
Inventor
이수영
유재권
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Priority to KR1020100041494A priority Critical patent/KR101112154B1/ko
Publication of KR20110121955A publication Critical patent/KR20110121955A/ko
Application granted granted Critical
Publication of KR101112154B1 publication Critical patent/KR101112154B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • G10L21/0308Voice signal separating characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

암묵 신호 추출 방법 및 암묵 신호 추출 장치가 개시된다. 신호 추출 장치는 2 이상의 수신부를 포함하여 신호를 수신하는 수신 수단과, 디믹싱(demixing)을 위한 전달함수를 산출하는 전달함수 산출 수단과, 산출된 전달함수를 이용하여 수신된 신호를 디믹싱하는 디믹싱 수단을 포함한다. 전달함수는 수신부에서 가장 가까운 소스로부터의 신호를 추출하거나, 수신부에 대해 알려진 방향에 있는 소스로부터의 신호를 제거하고 나머지 소스로부터의 신호를 추출하도록 결정된다. 또한, 전달함수는, 가장 가까운 소스로부터 수신부까지의 경로에 대한 전달 함수가 실질적으로 델타 함수임을 기초로 산출된다.

Description

암묵 신호 추출 방법 및 암묵 신호 추출 장치{METHOD AND APPARATUS FOR BLIND SOURCE EXTRACTION}
본 발명은 신호 추출에 관한 것으로, 구체적으로는 방향 제약 조건(Direction Constraint) 또는 최근 거리 제약 조건(Closest Constraint)을 이용한 암묵 신호 추출(Blind Source Extraction)을 위한 방법 및 장치에 관한 것이다.
본 발명은 지식경제부의 인간기능 생활지원 지능로봇 기술개발사업의 일환으로 수행한 연구로부터 도출된 것이다[과제관리번호: F0005000-2009-31, 과제명: 가정 내 다중 음원 환경에서의 음성분리 및 잡음제거 기술 개발].
음성과 같은 신호를 수신하는 경우, 그 신호는 서로 다른 2 이상의 소스(source)에서 발생한 신호들이 혼합되어 있는 신호일 수 있다. 그러므로 이러한 2 이상의 소스로부터의 신호가 혼합된 신호 중에서 원하는 소스로부터의 신호만을 분리 또는 추출해내는 것이 필요하다. 이를 위한 방법으로는 암묵 신호 분리(Blind Source Separation; BSS) 방법과 암묵 신호 추출(Blind Source Extraction; BSE) 방법이 알려져 있다.
암묵 신호 분리 방법은 2이상의 소스로부터의 신호를 분리하여 각각의 소스로부터의 신호를 별도로 획득하는 것이다. 그러나 BSS 방식은 원하지 않는 소스로부터의 신호, 예를 들어 잡음까지도 분리하는 결과를 가져오므로 필요 없는 계산량이 증가하고 계산 시간이나 회로 구성이 복잡해지는 문제가 있다.
반면에 암묵 신호 추출 방법은 신호로부터 원하는 소스로부터의 신호만을 추출하는 방식이다. 그러나, 선택되는 소스를 정의하지 않는 이상, 불확정성을 피할 수 없다. 다시 말해, 정확한 기준이 제공되지 않은 상태에서 하나의 소스로부터의 신호만을 선정하여 추출하는 경우에는, 추출된 신호가 원하는 신호임을 보장할 수가 없다.
기준 신호를 획득하고 그 기준 신호에 기초하여 하나의 신호를 추출하는 BSE 방법도 알려져 있으나, 이 방법은 기준 신호를 획득하기 위해 추가적인 연산이 필요하다는 문제가 있다.
본 발명은 상술한 문제점을 인식한 것으로, 효율적으로 하나의 원하는 신호를 추출할 수 있는 BSE 방법 및 장치를 제공하는 것을 목적으로 한다.
상기 목적을 달성하기 위하여, 본 발명의 일 태양에 따르면, 암묵 신호 추출(Blind Source Extraction)에 의해 신호를 추출하는 장치에 있어서, 2 이상의 수신부를 포함하여 신호를 수신하는 수신 수단과, 디믹싱(demixing)을 위한 전달함수를 산출하는 전달함수 산출 수단과, 산출된 상기 전달함수를 이용하여 수신된 상기 신호를 디믹싱하는 디믹싱 수단을 포함하되, 상기 전달함수는 상기 수신부에서 가장 가까운 소스로부터의 신호를 추출하도록 결정되는 신호 추출 장치가 제공된다.
상기 전달함수는, 소스로부터 가까울수록 상기 수신부까지의 경로에 대한 전달 함수가 델타 함수로 근사됨을 기초로 산출되는 것이 바람직하다.
상기 전달함수는
Figure pat00001
의 식을 기초로 산출되고, 여기서, Wi는 상기 디믹싱 수단의 입력 i 에 대한 전달함수,
Figure pat00002
는 가장 가까운 소스로부터 두 개의 상기 수신부까지의 경로 차에 의한 시간 지연인 것도 바람직하다.
상기 전달함수 산출 수단은 비용함수
Figure pat00003
를 이용하여 반복적으로 상기 전달함수를 산출하되, 여기서,
Figure pat00004
이고,
Figure pat00005
이며, ω1과 ω2 는 각각 W1과 W2를 나타내는 벡터일 수 있다.
바람직하게는, 상기 전달함수 산출 수단은 비용함수
Figure pat00006
를 기초로 반복적으로 상기 전달함수를 산출하되, JG(w)는 출력 신호의 네젠트로피(Negentropy)를 나타내는 함수이고,
Figure pat00007
는 상수이다.
상기 전달함수 산출 수단은 학습규칙(learning rule)
Figure pat00008
에 기초하여 반복적으로 상기 전달함수를 산출하되,
Figure pat00009
는 학습률(learning rate)일 수 있다.
상기 신호 추출 장치는 상기 신호를 사전백색화(pre-whitening)하는 사전백색화 수단을 더 포함할 수 있다.
본 발명의 다른 태양에 따르면, 암묵 신호 추출(Blind Source Extraction)에 의해 신호를 추출하는 방법에 있어서, 2 이상의 수신부를 통해 신호를 수신하는 단계와, 디믹싱을 위한 전달함수를 산출하는 단계와, 산출된 상기 전달함수를 이용하여 수신된 상기 신호를 디믹싱(demixing)하는 단계를 포함하되, 상기 전달함수는 상기 수신부에서 가장 가까운 소스로부터의 신호를 추출하도록 결정되는 신호 추출 방법이 제공된다.
상기 전달함수는, 소스로부터 가까울수록 상기 수신부까지의 경로에 대한 전달 함수가 델타 함수로 근사됨을 기초로 산출될 수 있다.
또한, 상기 전달함수는
Figure pat00010
의 식을 기초로 산출되고, 여기서, Wi는 상기 디믹싱 수단의 입력 i 에 대한 전달함수,
Figure pat00011
는 가장 가까운 소스로부터 두 개의 상기 수신부까지의 경로 차에 의한 시간 지연일 수 있다.
상기 전달함수를 산출하는 단계는 비용함수
Figure pat00012
를 이용하여 반복적으로 상기 전달함수를 산출하되, 여기서,
Figure pat00013
이고,
Figure pat00014
이며, ω1과 ω2 는 각각 W1과 W2를 나타내는 벡터인 것이 바람직하다.
상기 전달함수를 산출하는 단계는 비용함수
Figure pat00015
를 기초로 반복적으로 상기 전달함수를 산출하되, JG(w)는 출력 신호의 네젠트로피(Negentropy)를 나타내는 함수이고,
Figure pat00016
는 상수인 것도 바람직하다.
상기 전달함수를 산출하는 단계는 학습규칙(learning rule)
Figure pat00017
에 기초하여 반복적으로 상기 전달함수를 산출하되,
Figure pat00018
는 학습률(learning rate)일 수 있다.
신호 추출 방법은 상기 신호를 사전백색화(pre-whitening)하는 단계를 더 포함할 수 있다.
본 발명의 또 다른 태양에 따르면, 암묵 신호 추출(Blind Source Extraction)에 의해 신호를 추출하는 장치에 있어서, 2 이상의 수신부를 포함하여 신호를 수신하는 수신 수단과, 디믹싱(demixing)을 위한 전달함수를 산출하는 전달함수 산출 수단과, 산출된 상기 전달함수를 이용하여 수신된 상기 신호를 디믹싱하는 디믹싱 수단을 포함하되, 상기 전달함수는 상기 수신부에 대해 알려진 방향에 있는 소스로부터의 신호를 제거하고 나머지 소스로부터의 신호를 추출하도록 결정되는 신호 추출 장치가 제공된다.
상기 전달함수는, 상기 알려진 방향에 해당하는 알려진 시간 지연에 기초하여 초기화될 수 있다.
상기 알려진 시간 지연은, 상기 알려진 방향에 있는 소스로부터 상기 2 이상의 수신 수단까지의 전달함수에 있어서, 직접 경로에 해당하는 성분 사이의 시간 인덱스 차에 해당하는 것이 바람직하다.
상기 전달함수는, 상기 전달함수를 나타내는 벡터 w의 시간 지연 이외의 성분은 0으로 설정되도록 초기화되는 것이 바람직하다.
본 발명의 다른 태양에 따르면, 암묵 신호 추출(Blind Source Extraction)에 의해 신호를 추출하는 방법에 있어서, 2 이상의 수신부를 통해 신호를 수신하는 단계와, 디믹싱을 위한 전달함수를 산출하는 단계와, 산출된 상기 전달함수를 이용하여 수신된 상기 신호를 디믹싱(demixing)하는 단계를 포함하되, 상기 전달함수는 상기 수신부에 대해 알려진 방향에 있는 소스로부터의 신호를 제거하고 나머지 소스로부터의 신호를 추출하도록 결정되는 신호 추출 방법이 제공된다.
상기 전달함수는, 상기 알려진 방향에 해당하는 알려진 시간 지연에 기초하여 초기화될 수 있다.
상기 알려진 시간 지연은, 상기 알려진 방향에 있는 소스로부터 상기 2 이상의 수신 수단까지의 전달함수에 있어서, 직접 경로에 해당하는 성분 사이의 시간 인덱스 차에 해당하는 것이 바람직하다.
또한, 상기 전달함수는, 상기 전달함수를 나타내는 벡터 w의 시간 지연 이외의 성분은 0으로 설정되도록 초기화될 수 있다.
본 발명의 다른 태양에 따르면, 기계에 의해 실행되는 경우, 기계가 상기한 방법을 실행하도록 하는 프로그램이 기록된, 기계 판독 가능한 기록 매체가 제공된다.
본 발명에 따르면, 수신부로부터 특정 방향에 있는 소스 또는 가장 가까운 소스로부터의 신호를 효율적으로 추출하는 방법 및 장치를 얻을 수 있다.
도 1은 본 발명의 일 실시형태에 따른 디믹싱 시스템을 설명하기 위한 도면.
도 2는 본 발명의 일 실시형태에 따른 디믹싱을 설명하기 위한 도면.
도 3은 본 발명의 다른 실시형태에 따른 디믹싱 시스템을 도시하는 블록도.
도 4는 거리에 따른 DRR을 나타내는 그래프.
도 5는 본 발명의 일 실시형태에 따른 디믹싱 방법을 설명하기 위한 도면.
도 6은 본 발명의 시뮬레이션 조건을 설명하는 도면.
이하, 첨부된 도면을 참조하여 본 발명의 구체적 실시형태를 설명한다.
실시형태의 설명을 위해 도 1에 도시된 바와 같이, 실내에서 2개의 소스(예를 들어, 스피커 10, 12)로부터의 신호가 1 이상의 신호 수신부(예를 들어, 마이크 20, 22)에서 수신되는 경우를 고려한다. 각각의 스피커(10, 12)로부터의 신호는 직접 경로(D)를 통해 마이크(20)에 도달될 뿐만 아니라, 실내의 벽에 반향되어 반향 경로(R)를 통해서도 마이크(20)에 도달된다. 예를 들어, 스피커(10)로부터의 신호는 직접 경로 D11을 거쳐 마이크(20)에 도달되고, 직접 경로 D12를 거쳐 마이크(22)에 도달된다. 또한, 반향 경로 R11을 거쳐 마이크(20)에 도달되고, 반향 경로 R12를 거쳐 마이크(22)에 도달된다. 이는 다른 스피커(12)에 대해서도 동일하다.
마이크(20, 22)에서 수신된 신호들은 디믹싱(demixing) 시스템(30)에 입력되고, 디믹싱 시스템(30)에서 수행되는 디믹싱에 의해 희망의 신호가 추출된다. 본 발명의 실시형태에서, 희망의 신호는 마이크(20, 22)로부터의 방향 또는 마이크(20, 22)로부터의 거리에 기초하여 선택된다.
한편, 실질적으로 마이크(20, 22)도 디믹싱 시스템(30)에 포함되는 것으로 고려할 수도 있고, 마이크(20, 22)로부터의 신호를 수신하는 수신부가 디믹싱 시스템(30)에 포함되는 것으로 고려할 수도 있으므로, 특별히 언급되지 않는 한, 이후의 논의에서는 디믹싱 시스템(30)과 수신부(20, 22)를 구별하지 않는다.
도 2는 본 발명의 일 실시형태에 다른 디믹싱 시스템(30)의 구성을 도시하는 도면이다. 도시된 바와 같이, 디믹싱 시스템(30)은 사전백색화(pre-whitening) 필터(32)와 디믹싱 필터(34)를 포함한다. 구체적으로, 스피커로부터의 신호 x1, x2는 사전백색화 필터(32)에 입력된다. 이 신호 x1, x2는 실질적으로는 스피커로부터 마이크까지의 경로를 통과하여 전달된 신호로서, 경로의 전달 함수 A를 거친 신호라고 할 수 있다.
입력된 신호 x1, x2에 대해, 신호 간의 상관에 의해 이후의 처리의 신뢰성이 저하되는 것을 방지하기 위해 사전백색화가 이루지고, 사전백색화된 신호 w1, w2가 출력된다. 사전백색화 필터(32)는 후속 처리를 돕기 위한 것으로서, 필수적으로 포함되어야 하는 것은 아니며, 디믹싱 필터(34)에 통합될 수도 있다. 수학적으로 말해, 디믹싱 필터(34)의 전달 함수가 사전백색화를 고려하여 결정될 수도 있다는 것이다.
다음, 사전백색화된 신호 w1, w2는 디믹싱 필터(34)에 입력되어 디믹싱이 수행되고, 하나의 추출된 신호 y가 출력된다. 이하, 디믹싱 필터(34)의 전달함수를 W라 한다. 또한, 디믹싱 필터의 전달함수 W을 표현한 벡터를 w라고 한다.
디믹싱 필터(34)는 필터 파라미터 산출부(36)과 연결되어 필터의 전달함수 W, 또는 전달함수를 결정하는데 필요한 필터 파라미터, 예를 들어 벡터 w를 공급받는다. 이하에서는, 파라미터 산출부(36)에서 수행되는 필터 파라미터 산출에 대해 설명한다. 다만, 파라미터 산출부(36)는 별개의 구성요소일 필요는 없으며, 디믹싱 필터(34)와 통합될 수도 있음을 유의하여야 한다.
디믹싱 시스템에서 디믹싱 필터(34)에 의해 추출된 신호 y는 스피커로부터의 신호와 동일하여야 하므로, 최초 신호에 경로의 전달함수 A를 곱하고, 다시 디믹싱 필터의 전달함수 W를 곱하면 원 신호가 복원되어야 한다. 이를 행렬로 표현하면, 다음 수학식 1과 같다.
Figure pat00019
여기서 W1(z)는 디믹싱 시스템의 입력 x1과 출력 y 에 대한 전달함수의 z-도메인 표현이고, W2(z)는 디믹싱 시스템의 입력 x2와 출력 y 에 대한 전달함수의 z-도메인 표현이다. 또한, Aij(z)는 소스(예를 들어, 스피커) j로부터 수신부(예를 들어, 마이크) i까지의 경로의 전달함수의 z-도메인 표현이다.
본원 발명의 발명자들은 상기 수학식 2에서의 전달함수, 즉 W1와 W2를 결정하기 위하여, 방향 제약 조건(Direction Constraint) 및 최근 거리 제약 조건(Closest Constraint)을 창안하였으며, 이에 대해 아래에서 자세히 설명한다.
방향 제약 조건에 기초한 신호의 추출
먼저, 방향 제약 조건을 이용하는 본 발명의 실시형태를 설명한다. 본 실시형태에서는 2 이상의 소스 중 특정 방향으로부터의 신호를 제거하고 나머지 소스로부터의 신호를 추출한다. 이를 위해, 도 3 에 도시된 바와 같이 마이크(20)로부터 φ의 각도를 갖는 방향의 소스, 즉 스피커(10)로부터의 신호를 제거한다고 가정하면, 도 3에 도시된 바와 같이 스피커(10)로부터 2개의 마이크(20, 22)까지의 거리의 차이는 Dsin(φ)로 주어진다 (여기서, D는 마이크 사이의 거리). 그러므로, 신호가 두 마이크에 도달하는 시간의 차
Figure pat00020
는 다음 수학식 2로 주어진다.
Figure pat00021
여기서, v는 신호의 속도를 나타낸다.
이때, 두 신호의 시간 차가 0인 경우에는 스피커(10)가 마이크(20, 22)로부터 동일한 거리에 있는 것이고, 이는 스피커(10)가 마이크(20, 22) 사이의 중점을 기준으로 정면에 있음을 의미한다. 한편, 스피커(10)가 마이크(20, 22)의 중점을 기준으로 오른쪽 측면에 위치한다면, φ가 0보다 크고, 시간차
Figure pat00022
는 양의 값을 갖는다. 반면, 스피커(10)가 마이크(20, 22)의 중점을 기준으로 왼쪽 측면에 위치하면, 시간차
Figure pat00023
는 음의 값을 갖는다. 이처럼, 신호의 도달 시간차에는 신호의 방향에 대한 정보가 포함되어 있는 것이고, 역으로 신호의 방향이 정해지면 도달 시간차도 함께 정해지게 된다. 위의 수학식 2를 수열 식에서의 인덱스 값으로 표현하면 다음 수학식 3의 ρ를 얻는다. 수학식 3은 각 전달함수를 나타내는 수열에서 최대값을 나타내는(즉, 직접 경로 전달함수를 나타내는) 성분의 시간 인덱스의 차이를 표현한 것이다.
Figure pat00024
한편, 수학식 1의 제2열의 계산 결과, 즉, 추출하고자 하는 신호 이외의 신호가 0이 되도록 전달함수가 결정된다는 것으로부터 수학식 4를 얻는다.
Figure pat00025
수학식 4을 주파수 도메인에서 표현하면 다음의 수학식 5와 수학식 6을 얻는다. 수학식 6은 수학식 5의 수열(series) 표현이다.
Figure pat00026
Figure pat00027
일반적으로, 직접 경로를 통한 신호가 반향 경로를 통한 신호보다 매우 크기 때문에, 수학식 6에서 직접 경로를 통한 성분만을 취하면, 다음의 식을 얻는다.
Figure pat00028
여기서, σ와ξ는 각각 직접 경로 신호에 대한 전달함수의 인덱스이다. 따라서, 인덱스의 차
Figure pat00029
Figure pat00030
는 각각 전달함수 W와 A에 대한 직접 경로 성분에 대한 시간 인덱스 차이와 동일하다. 수학식 2와 관련하여 설명한 바와 같이, 소스의 방향(즉, φ)이 정해지면 시간차를 알 수 있으며, 시간차는 직접 경로 신호의 인덱스차와 동일하므로, 수학식 7에 있어서
Figure pat00031
Figure pat00032
는 방향 제약 조건 하에서 알려진 값, 즉 수학식 3의 ρ가 된다.
따라서, 본 실시형태에서는, 전달함수 W를 나타내는 벡터 w를 수학식 2의 시간 지연 또는 수학식 3의 시간 인덱스 차로 초기화 한 후에, 적응적으로 벡터 w를 계산하여 전달함수를 얻어내고, 또한 전달함수를 이용하여 신호를 추출한다. 따라서 상기 수학식 4의 관계에 의해, 알려진 방향에 존재하는 소스로부터의 신호는 제거되고, 나머지 신호만이 추출될 수 있다. 여기서, 적응적으로 벡터 w를 계산하기 위해서는 다양한 방법을 사용할 수 있으며, 예를 들어 종래의 네젠트로피를 이용한 BSE 방법을 이용할 수 있다. 불필요한 성분을 배제하기 위해, 초기화 시에, 벡터 w에서 시간 지연을 나타내는 성분 이외의 모든 성분은 0으로 설정할 수 있다. 이로써, 특정 방향(예를 들어, 각도 φ)에 위치하는 소스로부터의 신호를 배제하고 나머지 신호를 추출할 수 있게 된다.
거리 제약 조건에 기초한 신호의 추출
다음, 거리 제약 조건을 이용하는 본 발명의 다른 실시형태를 설명한다. 본 실시형태에 있어서, 소스 1이 희망의 소스라 하고, 상기의 수학식 1 중 소스 1에 대한 식만을 고려하면, 다음의 수학식 8이 성립한다.
Figure pat00033
도 1에 도시된 바와 같이, 일반적으로 소스로부터의 신호는 직접 경로와 반향 경로를 거쳐 수신부에 도달한다. 따라서, 수신부에서 수신된 신호에는 직접 성분과 반향 성분이 혼합되어 있으며, 직접 성분과 반향 성분간의 에너지 비를 DRR(Direct-to-Reverbarant Ratio)라 한다. 예를 들어, DRR은 다음 수학식 9로 계산될 수 있다.
Figure pat00034
여기서, ω(k)는 경로의 전달함수를 나타내고, kmax는 ω(k)를 최대로 하는 인덱스 k를 나타낸다. 수학식 9에서 알 수 있듯이, 전달함수 ω에 대한 DDR은 그 전달함수 중 최대값(
Figure pat00035
)과 나머지 값의 합(
Figure pat00036
)의 비로 이해할 수 있으며, DDR이 클수록 특정 인덱스에서의 전달함수 값이 다른 값에 비해 현저히 큰 것임을 알 수 있다.
본 발명자들의 연구에 따르면, 다음 표와 같이, 수신부에 가까운 소스로부터의 신호일수록 직접 성분의 비율이 높아 DRR이 크며, 수신부로부터 멀어질수록 DRR값이 급격히 감소한다. 다시 말해, 소스에 가까운 신호일수록 특정 인덱스에서의 전달함수의 크기가 다른 인덱스에서의 전달함수 크기보다 현저히 크게 된다는 것이다.
거리(m) DRR
0.5 14.42
1.0 2.70
1.5 0.88
2.0 0.32
이러한 연구를 바탕으로, 본 발명자들은 소스에 가까운 신호일수록, 소스와 수신부 사이의 경로의 전달함수 A가 델타 함수(delta function)에 가깝다는 것을 발견하였다. 이는 각각 거리 0.5m와 2.0m에서의 임펄스 응답을 나타내는 도 4(a) 및 4(b)로부터 확인할 수 있다. 따라서, 최근 거리 소스로부터의 신호에 대한 전달함수 A, 위 수학식 4에서 A11은 델타 함수라고 가정할 수 있다.
한편, 일반성을 잃지 않고, 두 개의 수신부, 즉 마이크(10, 12)가 서로 충분히 가깝게 위치하여 소스, 즉 스피커로부터 두 수신부까지의 경로는 그 거리가 상이할 뿐 특성이 거의 동일하다고 가정할 수 있다.
위의 두 가지 가정, 즉, A11이 델타 함수이고, A21은 A11의 시간 지연된 버전과 같다는 가정으로부터, 수학식 8은 다음 수학식 10으로 변환될 수 있다.
Figure pat00037
여기서
Figure pat00038
는 가장 가까운 소스로부터 상기 두 개의 수신부까지의 경로차에 의한 시간 지연으로서,
Figure pat00039
Figure pat00040
가 성립한다. (a11 과 a22는 각각 A11과 A21의 k 도메인 표현).
위의 수학식 10을 k 도메인에서 표현하여 다음 수학식 11을 얻을 수 있다.
Figure pat00041
최종적으로, 수학식 11을 기초로, 다음 수학식 12와 같은 최근 거리 제약 조건 하의 비용 함수 JC를 정의 할 수 있다.
Figure pat00042
여기서,
Figure pat00043
이다.
상기의 비용함수를 최대로 하는 w를 반복적(iteratively)으로 연산함으로써, 디믹싱 필터의 전달함수를 얻고 혼합 신호로부터 가장 가까운 소스로부터의 신호를 추출해 낼 수 있게 된다. 여기서 반복적이라 함은, 이전 연산의 결과를 이용하여 연산을 다시 수행하는 것을 포함한다.
네젠트로피에 근거한 비용함수
일 실시형태에서, 상기 최근 거리 제약 조건 하의 비용함수 JC는 ICA(Independent Component Analysis)에서 사용되는 비용함수 JG와 함께 고려될 수 있다. ICA에서는 신호의 비-가우스 함수 특성(non-Gaussianity)을 최대화하기 위한 기준으로서 네젠트로피(Negentropy)가 비용함수로 사용될 수 있으며, 이는 다음 수학식 13으로 주어진다.
Figure pat00044
여기서,
Figure pat00045
는 출력 신호이고,
Figure pat00046
Figure pat00047
와 동일한 평균과 분산을 갖는 가우스 함수 형태의 신호,
G는 비2차 우함수(non-quadratic even function)이다.
한편, []는 기대값(expectation)을 나타내는 연산자로서, 시간 평균으로 구현될 수 있다.
위의 네젠트로피와 최근 거리 제약 조건 하의 비용 함수 수학식 12를 함께 고려하여, 다음의 비용 함수를 얻는다.
Figure pat00048
여기서,
Figure pat00049
는 상수이다.
또한, 위 수학식 14의 비용 함수를 이용하여 다음의 학습 규칙(learning rule)을 얻는다.
Figure pat00050
여기서,
Figure pat00051
는 학습율(learning rate)이다.
수학식 15에 있어서, 도함수인
Figure pat00052
Figure pat00053
는 수학식 12와 수학식 13을 미분하여 각각 구할 수 있다. 예를 들어, 수학식 11을 이용하여, 위 수학식 12를 미분하면,
Figure pat00054
를 얻는다.
또한, 수학식 13을 미분하면,
Figure pat00055
를 얻으며, 여기서
Figure pat00056
이다.
이상과 같이, 본 발명의 일 실시형태의 필터 파라미터 산출부(36)는, 방향 제약 조건 또는 최근 거리 제약 조건을 이용하여 디믹싱 필터 W를 나타내는 벡터 w를 구할 수 있다. 구체적으로, 방향 제약 조건을 이용하는 경우에는 w를 시간 지연으로 초기화하고, 최근 거리 제약 조건을 이용하는 경우에는 위의 수학식 15의 학습 규칙을 이용하여 벡터 w를 결정할 수 있다.
필터 파라미터 산출부(36)는 필터의 파라미터를 산출하여 디믹싱 필터(34)에 공급한다. 특히, 필터 파라미터 산출부(36)는 필터(34)로부터의 출력을 수신하고, 이에 기초하여 반복적으로 파라미터를 산출하여 필터에 공급함으로써, 디믹싱 필터(34)가 적응적으로 동작하도록 할 수 있다.
신호 추출 방법
다음, 본 발명의 일 실시형태에 따른 신호 추출 방법을 도 5를 참조하여 설명한다.
본 실시형태의 방법은 먼저, 단계 410에서 2 이상의 소스로부터의 신호가 혼합된 혼합 신호를 수신한다. 혼합 신호에는, 2이상의 소스로부터의 신호가 혼합되어 있을 뿐만 아니라, 직접 경로 및 반향 경로로부터의 신호가 혼합되어 있다.
다음, 단계 420에서는 수신된 신호에 대해 사전백색화를 수행하여, 후속 처리를 준비한다. 단계 420은 필수적인 것은 아니며, 이후의 단계와 통합되거나 생략될 수 있다.
다음, 단계 430에서, 백색화된 (또는 수신된) 신호에 대하여 디믹싱을 수행하여 소망의 한 소스로부터의 신호, 즉, 특정 방향의 소스 또는 가장 가까운 소스로부터의 신호를 추출하기 위하여, 디믹싱 파라미터를 산출한다.
단계 430에 있어서, 특정 방향의 소스로부터의 신호를 추출하기 위해, 디믹싱 필터의 전달함수를 나타내는 벡터 w를 시간 지연으로 초기화할 수 있다. 다른 실시형태에서는, 가장 가까운 소스로부터의 신호를 추출하기 위해, 수학식 8의 비용 함수 및/또는 수학식 10의 비용 함수를 이용하여 디믹싱 필터의 전달함수 W를 구한다. 단계 430에서 얻는 전달함수에는 단계 420에서 수행된 사전 백색화에 대응되는 백색화 필터링이 추가될 수 있다. 다르게는, 별도의 단계에서 백색화가 수행될 수도 있다.
그리고, 단계 440에서 산출된 전달함수 W를 이용하여 신호를 디믹싱 하고, 소망의 신호를 추출한다.
여기서, 전달함수 W는, 예를 들어, 수학식 11의 학습 규칙 등에 따라 반복적으로 연산을 수행함으로써 적응적으로 얻어질 수 있다. 따라서, 단계 450에서는, 전달 함수 W가 수렴하였는지 여부를 판단하고, 전달함수가 수렴하지 않은 경우에는 단계 430으로 돌아가 전달함수 W를 다시 산출하고, 디믹싱을 수행한다.
본 발명의 방법은 기계에 의해 실행되는 경우, 기계가 상기한 방법을 실행하도록 하는 프로그램의 형태로 구현되어 기계가 판독할 수 있는 매체에 기록될 수 있다. 매체는, 컴팩트 디스크(CD), 자기 디스크, 자기 테이프, ROM(Read Only Memory), RAM(Random Access Memory), 광 디스크, 플래시 디스크 등을 포함하나 이에 제한되지 않으며, 데이터를 기록하고 컴퓨터, 프로세서 등의 기계가 그 데이터를 판독할 수 있는 모든 매체를 포함한다.
본 발명의 실시형태에 따른 디믹싱 방법에 대해, 도 6의 조건에 따라 실험을 수행하였다. 구체적으로, 반향실의 크기는 7m X 5m X 3m이고, 마이크(20, 22)는 벽으로부터 1.5m 및 2.5m 위치에 배치하였다. 마이크(20, 22)간의 거리는 17cm이고 높이는 1.7m였다. 또한, 최근접 소스의 위치는 마이크(20, 22) 사이의 중점을 기준으로 극좌표
Figure pat00057
로 정하고, 다른 소스(즉, 간섭 소스)의 극좌표는
Figure pat00058
로 하였다. 위의 조건 하에서, 소스에서의 신호 세기를 나타내는 SPR(Source Power Ratio)을 변화시키면서 디믹싱의 결과를, SIR(Signal-to-Interference Ratio), 즉 신호-대-간섭비로서 측정하였다. 구체적으로,
Figure pat00059
(s(k)는 최근접 소스로부터의 신호, n(k)는 간섭 소스로부터의 신호),
Figure pat00060
(xij(k)는 마이크 i에서 수신한 소스 j로부터의 신호),
Figure pat00061
(yij(k)는 출력 i에 포함된 소스 j로부터의 신호 성분)
로 주어진다.
소스로부터의 신호로서는 샘플링 레이트 8kHz, 6초 길이의 남자 음성을 사용하였으며, 학습률(
Figure pat00062
)과 상수(
Figure pat00063
)의 값은 각각 0.0001과 0.01을 사용하였다. 또한, 반향 시간은 200ms로 설정하고, 벽의 반사계수는 0.74로 하였다.
또한, 방향 제약 조건(directoinally constrainted ICA; dcICA) 방식을 이용하여 동일한 조건에서 실험을 수행하였다.
한편, 대조군으로서 종래의 ICA 방식을 이용하여 동일한 조건에서 디믹싱을 수행하였다.
위의 조건 하에서 디믹싱을 수행한 결과는 다음 표 2에 나타나 있다.
위치 SPR (dB) SIRx (dB) SIRy (dB)
마이크 1 마이크 2 ICA dcICA ccICA
Figure pat00064
Figure pat00065
(0.5m, 0˚) (1.0m, -60˚) 0 4.6 5.2 21.8 22.2 18.2
-7.8 -2.3 -1.6 -18.2 11.3 15.3
-12.5 -6.4 -5.7 -19.9 10.0 11.5
-14.8 -8.3 -7.6 -22.0 6.4 9.4
-16.9 -9.3 -9.6 -22.5 -4.5 8.5
(0.5m, 0˚) (1.0m,-60˚) -12.5 -6.4 -5.7 -19.9 10.0 11.5
(1.0m,-30˚) -13.1 -6.3 -5.7 -19.1 8.2 9.2
(1.0m,-15˚) -13.1 -6.3 -5.8 -15.6 -3.7 4.7
(1.0m, 15˚) -12.9 -5.9 -6.1 -13.8 -4.3 3.3
(1.0m, 30˚) -13.1 -6.3 -5.7 -19.1 5.6 7.6
(1.0m, 60˚) -12.5 -6.4 -5.7 -19.9 6.8 10.8
(0.5m,-60˚) (1.0m, 0˚) -13.7 -4.9 -7.3 -14.4 11.9 13.9
(0.5m,-30˚) -13.3 -5.3 -6.8 -21.3 9.2 11.2
(0.5m,-15˚) -13.1 -5.6 -6.5 -4.8 -5.5 6.5
(0.5m, 15˚) -13.1 -6.3 -5.8 -8.7 -6.7 4.7
(0.5m, 30˚) -13.3 -6.5 -5.5 -20.3 6.5 9.5
(0.5m, 60˚) -13.6 -7.1 -5.0 -23.5 9.8 13.8
(0.5m, 0˚) (0.6m, -60˚) -6.7 -5.6 -3.4 -17.3 -5.2 12.8
(0.5m,-30˚) (0.6m, 30˚) -6.8 -3.2 -5.8 -8.3 5.3 14.4
(1.0m, 0˚) (2.0m, -60˚) -9.4 -4.7 -4.2 -8.7 7.9 6.9
(1.0m, 0˚) (2.0m, 15˚) -9.4 -4.3 -4.6 -10.9 -6.9 8.6
(1.0m, 0˚) (1.1m, -60˚) -5.3 -4.8 -4.1 -13.5 -10.7 9.1
위의 표에서 볼 수 있듯이, 대부분의 경우에서 ICA 에 의해 추출된 신호의 SIR은 본원 발명의 최근 거리 제약 조건을 이용한 방법, 즉 ccICA(closest constraint ICA)나 거리 제약 조건을 이용한 방법, 즉 dcICA 에 의해 얻어진 신호의 SIR에 비해 낮음을 확인할 수 있다. 그러므로, ccICA 및 dcICA에 의한 암묵 신호 추출이 더욱 우수한 결과를 나타냄을 확인할 수 있었다.
이상 본 발명의 구체적 실시형태들을 참조하여 본 발명을 설명하였으나, 이는 예시에 불과하며 본 발명의 범위를 제한하는 것이 아니다. 당업자는 본 발명의 범위를 벗어나지 않는 범위 내에서 설명된 실시형태들을 변경 또는 변형할 수 있다. 본 명세서에서 설명된 각 기능 블록들 또는 수단들은 전자 회로, 집적 회로, ASIC(Application Specific Integrated Circuit) 등 공지된 다양한 소자들로 구현될 수 있으며, 각각 별개로 구현되거나 2 이상이 하나로 통합되어 구현될 수 있다. 본 명세서 및 청구범위에서 별개인 것으로 설명된 수단 등의 구성요소는 단순히 기능상 구별된 것으로 물리적으로는 하나의 수단으로 구현될 수 있으며, 단일한 것으로 설명된 수단 등의 구성요소도 수개의 구성요소의 결합으로 이루어질 수 있다. 또한 본 명세서에서 설명된 각 방법 단계들은 본 발명의 범위를 벗어나지 않고 그 순서가 변경될 수 있고, 다른 단계가 부가될 수 있다. 뿐만 아니라, 본 명세서에서 설명된 다양한 실시형태들은 각각 독립하여서뿐만 아니라 적절하게 결합되어 구현될 수도 있다. 따라서 본 발명의 범위는 설명된 실시형태가 아니라 첨부된 청구범위 및 그 균등물에 의해 정해져야 한다.

Claims (24)

  1. 암묵 신호 추출(Blind Source Extraction)에 의해 신호를 추출하는 장치에 있어서,
    2 이상의 수신부를 포함하여 신호를 수신하는 수신 수단과,
    디믹싱(demixing)을 위한 전달함수를 산출하는 전달함수 산출 수단과,
    산출된 상기 전달함수를 이용하여 수신된 상기 신호를 디믹싱하는 디믹싱 수단을 포함하되,
    상기 전달함수는 상기 수신부에서 가장 가까운 소스로부터의 신호를 추출하도록 결정되는
    신호 추출 장치.
  2. 제 1 항에 있어서,
    상기 전달함수는, 소스로부터 가까울수록 상기 수신부까지의 경로에 대한 전달 함수가 델타 함수로 근사됨을 기초로 산출되는
    신호 추출 장치.
  3. 제 1 항에 있어서,
    상기 전달함수는
    Figure pat00066

    의 식을 기초로 산출되고,
    여기서, Wi는 상기 디믹싱 수단의 입력 i 에 대한 전달함수,
    Figure pat00067
    는 가장 가까운 소스로부터 두 개의 상기 수신부까지의 경로 차에 의한 시간 지연인,
    신호 추출 장치.
  4. 제 1 항에 있어서,
    상기 전달함수 산출 수단은
    비용함수
    Figure pat00068

    를 이용하여 반복적으로 상기 전달함수를 산출하되,
    여기서,
    Figure pat00069
    이고,
    Figure pat00070
    이며,
    ω1과 ω2 는 각각 W1과 W2를 나타내는 벡터인,
    신호 추출 장치.
  5. 제 4 항에 있어서,
    상기 전달함수 산출 수단은
    비용함수
    Figure pat00071

    를 기초로 반복적으로 상기 전달함수를 산출하되,
    JG(w)는 출력 신호의 네젠트로피(Negentropy)를 나타내는 함수이고,
    Figure pat00072
    는 상수인
    신호 추출 장치.
  6. 제 5 항에 있어서,
    상기 전달함수 산출 수단은
    학습규칙(learning rule)
    Figure pat00073

    에 기초하여 반복적으로 상기 전달함수를 산출하되,
    Figure pat00074
    는 학습률(learning rate)인,
    신호 추출 장치.
  7. 제 1 항에 있어서,
    상기 신호를 사전백색화(pre-whitening)하는 사전백색화 수단을 더 포함하는
    신호 추출 장치.
  8. 암묵 신호 추출(Blind Source Extraction)에 의해 신호를 추출하는 방법에 있어서,
    2 이상의 수신부를 통해 신호를 수신하는 단계와,
    디믹싱을 위한 전달함수를 산출하는 단계와,
    산출된 상기 전달함수를 이용하여 수신된 상기 신호를 디믹싱(demixing)하는 단계를 포함하되,
    상기 전달함수는 상기 수신부에서 가장 가까운 소스로부터의 신호를 추출하도록 결정되는
    신호 추출 방법.
  9. 제 8 항에 있어서,
    상기 전달함수는, 소스로부터 가까울수록 상기 수신부까지의 경로에 대한 전달 함수가 델타 함수로 근사됨을 기초로 산출되는
    신호 추출 방법.
  10. 제 8 항에 있어서,
    상기 전달함수는
    Figure pat00075

    의 식을 기초로 산출되고,
    여기서, Wi는 상기 디믹싱 수단의 입력 i 에 대한 전달함수,
    Figure pat00076
    는 가장 가까운 소스로부터 두 개의 상기 수신부까지의 경로 차에 의한 시간 지연인,
    신호 추출 방법.
  11. 제 8 항에 있어서,
    상기 전달함수를 산출하는 단계는
    비용함수
    Figure pat00077

    를 이용하여 반복적으로 상기 전달함수를 산출하되,
    여기서,
    Figure pat00078
    이고,
    Figure pat00079
    이며,
    ω1과 ω2 는 각각 W1과 W2를 나타내는 벡터인,
    신호 추출 방법.
  12. 제 11 항에 있어서,
    상기 전달함수를 산출하는 단계는
    비용함수
    Figure pat00080

    를 기초로 반복적으로 상기 전달함수를 산출하되,
    JG(w)는 출력 신호의 네젠트로피(Negentropy)를 나타내는 함수이고,
    Figure pat00081
    는 상수인
    신호 추출 방법.
  13. 제 12 항에 있어서,
    상기 전달함수를 산출하는 단계는
    학습규칙(learning rule)
    Figure pat00082

    에 기초하여 반복적으로 상기 전달함수를 산출하되,
    Figure pat00083
    는 학습률(learning rate)인,
    신호 추출 방법.
  14. 제 8 항에 있어서,
    상기 신호를 사전백색화(pre-whitening)하는 단계를 더 포함하는
    신호 추출 방법.
  15. 기계에 의해 실행되는 경우, 기계가 제 8 항 내지 제 14 항 중 어느 한 항의 방법을 실행하도록 하는 프로그램이 기록된, 기계 판독 가능한 기록 매체.
  16. 암묵 신호 추출(Blind Source Extraction)에 의해 신호를 추출하는 장치에 있어서,
    2 이상의 수신부를 포함하여 신호를 수신하는 수신 수단과,
    디믹싱(demixing)을 위한 전달함수를 산출하는 전달함수 산출 수단과,
    산출된 상기 전달함수를 이용하여 수신된 상기 신호를 디믹싱하는 디믹싱 수단을 포함하되,
    상기 전달함수는 상기 수신부에 대해 알려진 방향에 있는 소스로부터의 신호를 제거하고 나머지 소스로부터의 신호를 추출하도록 결정되는
    신호 추출 장치.
  17. 제 16 항에 있어서,
    상기 전달함수는, 상기 알려진 방향에 해당하는 알려진 시간 지연에 기초하여 초기화되는
    신호 추출 장치.
  18. 제 17 항에 있어서,
    상기 알려진 시간 지연은, 상기 알려진 방향에 있는 소스로부터 상기 2 이상의 수신 수단까지의 전달함수에 있어서, 직접 경로에 해당하는 성분 사이의 시간 인덱스 차에 해당하는
    신호 추출 장치.
  19. 제 16 항에 있어서,
    상기 전달함수는, 상기 전달함수를 나타내는 벡터 w의 시간 지연 이외의 성분은 0으로 설정되도록 초기화되는
    신호 추출 장치.
  20. 암묵 신호 추출(Blind Source Extraction)에 의해 신호를 추출하는 방법에 있어서,
    2 이상의 수신부를 통해 신호를 수신하는 단계와,
    디믹싱을 위한 전달함수를 산출하는 단계와,
    산출된 상기 전달함수를 이용하여 수신된 상기 신호를 디믹싱(demixing)하는 단계를 포함하되,
    상기 전달함수는 상기 수신부에 대해 알려진 방향에 있는 소스로부터의 신호를 제거하고 나머지 소스로부터의 신호를 추출하도록 결정되는
    신호 추출 방법.
  21. 제 20 항에 있어서,
    상기 전달함수는, 상기 알려진 방향에 해당하는 알려진 시간 지연에 기초하여 초기화되는
    신호 추출 방법.
  22. 제 21 항에 있어서,
    상기 알려진 시간 지연은, 상기 알려진 방향에 있는 소스로부터 상기 2 이상의 수신 수단까지의 전달함수에 있어서, 직접 경로에 해당하는 성분 사이의 시간 인덱스 차에 해당하는
    신호 추출 방법.
  23. 제 20 항에 있어서,
    상기 전달함수는, 상기 전달함수를 나타내는 벡터 w의 시간 지연 이외의 성분은 0으로 설정되도록 초기화되는
    신호 추출 방법.
  24. 기계에 의해 실행되는 경우, 기계가 제 20 항 내지 제 23 항 중 어느 한 항의 방법을 실행하도록 하는 프로그램이 기록된, 기계 판독 가능한 기록 매체.
KR1020100041494A 2010-05-03 2010-05-03 암묵 신호 추출 방법 및 암묵 신호 추출 장치 KR101112154B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020100041494A KR101112154B1 (ko) 2010-05-03 2010-05-03 암묵 신호 추출 방법 및 암묵 신호 추출 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100041494A KR101112154B1 (ko) 2010-05-03 2010-05-03 암묵 신호 추출 방법 및 암묵 신호 추출 장치

Publications (2)

Publication Number Publication Date
KR20110121955A true KR20110121955A (ko) 2011-11-09
KR101112154B1 KR101112154B1 (ko) 2012-02-22

Family

ID=45392660

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100041494A KR101112154B1 (ko) 2010-05-03 2010-05-03 암묵 신호 추출 방법 및 암묵 신호 추출 장치

Country Status (1)

Country Link
KR (1) KR101112154B1 (ko)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101356040B1 (ko) * 2012-06-27 2014-01-29 한국과학기술원 주파수 영역에서의 암묵 신호 추출 방법 및 이를 위한 디믹싱 시스템
WO2014129878A1 (en) * 2013-02-25 2014-08-28 Korea Advanced Institute Of Science And Technology Apparatus and method for solving scale problem in blind signal extraction of frequency domain
WO2014133338A1 (en) * 2013-02-27 2014-09-04 Korea Advanced Institute Of Science And Technology Blind signal extraction method using direction of arrival information and de-mixing system therefor
KR101474321B1 (ko) * 2012-06-29 2014-12-30 한국과학기술원 암묵신호 분리에서의 순열/비례 문제 해결장치 및 그 방법
WO2024014797A1 (ko) * 2022-07-14 2024-01-18 서강대학교산학협력단 강인한 음성인식을 위한 타겟 마스크 및 독립성분분석 기반의 실시간 빔포밍 및 방향 벡터 추정 방법

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101356040B1 (ko) * 2012-06-27 2014-01-29 한국과학기술원 주파수 영역에서의 암묵 신호 추출 방법 및 이를 위한 디믹싱 시스템
KR101474321B1 (ko) * 2012-06-29 2014-12-30 한국과학기술원 암묵신호 분리에서의 순열/비례 문제 해결장치 및 그 방법
WO2014129878A1 (en) * 2013-02-25 2014-08-28 Korea Advanced Institute Of Science And Technology Apparatus and method for solving scale problem in blind signal extraction of frequency domain
KR101474633B1 (ko) * 2013-02-25 2014-12-24 한국과학기술원 주파수 영역의 암묵신호 추출에서의 다중 주파수 해상도를 이용한 비례문제 해결장치 및 그 방법
WO2014133338A1 (en) * 2013-02-27 2014-09-04 Korea Advanced Institute Of Science And Technology Blind signal extraction method using direction of arrival information and de-mixing system therefor
KR101463955B1 (ko) * 2013-02-27 2014-11-21 한국과학기술원 방향 정보를 이용한 암묵 신호 추출 방법 및 이를 위한 디믹싱 시스템
WO2024014797A1 (ko) * 2022-07-14 2024-01-18 서강대학교산학협력단 강인한 음성인식을 위한 타겟 마스크 및 독립성분분석 기반의 실시간 빔포밍 및 방향 벡터 추정 방법

Also Published As

Publication number Publication date
KR101112154B1 (ko) 2012-02-22

Similar Documents

Publication Publication Date Title
US8160270B2 (en) Method and apparatus for acquiring multi-channel sound by using microphone array
KR101112154B1 (ko) 암묵 신호 추출 방법 및 암묵 신호 추출 장치
RU2685053C2 (ru) Оценка импульсной характеристики помещения для подавления акустического эха
Kowalczyk et al. Blind system identification using sparse learning for TDOA estimation of room reflections
WO2015065682A1 (en) Selective audio source enhancement
KR102087307B1 (ko) 잔향 환경에 강인한 음원 방향 추정을 위한 심화 신경망 기반의 앙상블 음원 방향 추정 방법 및 장치
TW201727623A (zh) 聲場增強裝置及方法
EP3799035A1 (en) Acoustic program, acoustic device, and acoustic system
CN106872945A (zh) 声源定位方法、装置和电子设备
WO2020020247A1 (zh) 信号处理方法、装置以及计算机存储介质
US8712073B2 (en) Method and apparatus for blind signal extraction
EP3320311B1 (en) Estimation of reverberant energy component from active audio source
WO2022256577A1 (en) A method of speech enhancement and a mobile computing device implementing the method
Douglas Blind separation of acoustic signals
Abutalebi et al. Performance improvement of TDOA-based speaker localization in joint noisy and reverberant conditions
López-Espejo et al. Feature enhancement for robust speech recognition on smartphones with dual-microphone
Barfuss et al. Informed Spatial Filtering Based on Constrained Independent Component Analysis
CN113223552A (zh) 语音增强方法、装置、设备、存储介质及程序
Deleforge et al. Audio-motor integration for robot audition
Ağcaer et al. Binaural source localization based on modulation-domain features and decision pooling
Kodrasi et al. Instrumental and perceptual evaluation of dereverberation techniques based on robust acoustic multichannel equalization
Sanei et al. A geometrically constrained multimodal approach for convolutive blind source separation
KR20120102832A (ko) 음원재생장치, 음원재생장치에서 음원을 재생하는 방법 및 궤환신호를 제거하는 방법
Kuster Multichannel room impulse response rendering on the basis of underdetermined data
JP6059112B2 (ja) 音源分離装置とその方法とプログラム

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160127

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20161227

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20180102

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20190107

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20200122

Year of fee payment: 9