KR101463955B1 - Blind source extraction method using direction of arrival information and de-mixing system therefor - Google Patents

Blind source extraction method using direction of arrival information and de-mixing system therefor Download PDF

Info

Publication number
KR101463955B1
KR101463955B1 KR1020130020917A KR20130020917A KR101463955B1 KR 101463955 B1 KR101463955 B1 KR 101463955B1 KR 1020130020917 A KR1020130020917 A KR 1020130020917A KR 20130020917 A KR20130020917 A KR 20130020917A KR 101463955 B1 KR101463955 B1 KR 101463955B1
Authority
KR
South Korea
Prior art keywords
signal
demixing
filter
transfer function
sound source
Prior art date
Application number
KR1020130020917A
Other languages
Korean (ko)
Other versions
KR20140106823A (en
Inventor
이수영
최충환
룩신 첸
유재권
Original Assignee
한국과학기술원
소니 컴퓨터 엔터테인먼트 아메리카 엘엘씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원, 소니 컴퓨터 엔터테인먼트 아메리카 엘엘씨 filed Critical 한국과학기술원
Priority to KR1020130020917A priority Critical patent/KR101463955B1/en
Priority to PCT/KR2014/001630 priority patent/WO2014133338A1/en
Publication of KR20140106823A publication Critical patent/KR20140106823A/en
Application granted granted Critical
Publication of KR101463955B1 publication Critical patent/KR101463955B1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • G10L21/028Voice signal separating using properties of sound source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/02Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using radio waves
    • G01S3/74Multi-channel systems specially adapted for direction-finding, i.e. having a single antenna system capable of giving simultaneous indications of the directions of different signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/03Synergistic effects of band splitting and sub-band processing

Abstract

본 발명에 따른 방향 정보를 이용한 암묵 신호 추출 방법은 주파수 영역에서 특정 방향에 위치하는 음원으로부터의 신호(y)를 추출하는 방법으로서, 상기 특정 방향에 위치하는 음원을 포함하는 2개 이상의 음원으로부터의 신호가 혼합되어 신호 수신부를 통해 수신되는 단계; 및 상기 수신된 신호의 비-가우스 함수 특성을 이용하되, 상기 방향 정보를 이용하여 상기 수신된 신호를 디믹싱하는 단계를 포함한다.A method for extracting a blind signal using direction information according to the present invention is a method for extracting a signal (y) from a sound source located in a specific direction in a frequency domain, the method comprising: extracting a signal y from two or more sound sources The signals are mixed and received through the signal receiver; And demixing the received signal using the non-Gaussian function characteristic of the received signal, using the direction information.

Description

방향 정보를 이용한 암묵 신호 추출 방법 및 이를 위한 디믹싱 시스템 {BLIND SOURCE EXTRACTION METHOD USING DIRECTION OF ARRIVAL INFORMATION AND DE-MIXING SYSTEM THEREFOR}BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a blind signal extracting method using direction information and a demixing system for the blind signal extracting method.

본 발명은 방향 정보를 이용한 암묵 신호 추출 방법 및 이를 위한 디믹싱 시스템에 관한 것이며, 보다 구체적으로 본 발명은 주파수 영역에서 신호 수신부에서 수신되는 혼합된 신호 중에서 특정 방향에 위치하는 음원으로부터의 신호를 추출하는 암묵 신호 추출 알고리즘에 관한 것이다.The present invention relates to a blind signal extracting method using direction information and a demixing system therefor. More particularly, the present invention relates to a blind signal extracting method using direction information, and more particularly to a method and apparatus for extracting a signal from a sound source located in a specific direction among mixed signals received by a signal receiving unit in a frequency domain To a blind signal extracting algorithm.

음성과 같은 신호를 수신하는 경우, 그 신호는 서로 다른 2 이상의 소스(source)로부터 발생한 신호가 혼합된 신호일 수 있다. 따라서, 이러한 2 이상의 소스로부터의 신호가 혼합된 신호 중에서 원하는 소스로부터의 신호만을 분리 또는 추출하는 것이 필요하다. 이를 위한 방법으로 암묵 신호 분리(BSS: Blind Source Separation) 및 암묵 신호 추출(BSE: Blind Source Extraction) 알고리즘이 알려져 있다. When receiving a signal such as voice, the signal may be a mixed signal of signals originating from two or more different sources. Therefore, it is necessary to separate or extract only the signal from the desired source among the mixed signals from these two or more sources. Blind Source Separation (BSS) and Blind Source Extraction (BSE) algorithms are known as methods for this purpose.

암묵 신호 분리 방법은 2 이상의 소스로부터의 신호를 분리하여 각 소스로부터의 신호를 별도로 획득한다. 하지만, 암묵 신호 분리 방법은 원하지 않는 소스로부터의 신호, 예컨대 잡음까지도 분리하는 결과를 가져온다. 이로 인해 불필요한 계산량이 증가하고 회로 구성이 복잡해지는 문제점이 야기된다. 반면에 암묵 신호 추출 방법은 혼합된 신호로부터 원하는 소스로부터의 신호만을 추출하는 방식이다. 시간 영역에서의 암묵 신호 추출을 위한 알고리즘은 이미 제안되었으나 이는 계산량이 매우 커 연산 시간이 긴 단점이 있다. The blind signal separation method separates signals from two or more sources and separately obtains signals from each source. However, the blind signal separation method results in the separation of signals from undesired sources, e.g., noise. This increases the amount of unnecessary calculation and complicates circuit configuration. On the other hand, the blind signal extraction method is a method of extracting signals from a desired signal from a mixed signal. An algorithm for blind signal extraction in the time domain has already been proposed, but it has a drawback that the computation time is very long and the computation time is long.

주파수 영역에서의 암묵 신호 추출 알고리즘은 활성화되어 있지 않다. 주파수 영역에서 암묵 신호 분리를 수행하는 경우, 서로 다른 주파수 영역에서 분리된 신호 사이에 순서를 맞추어야 하는 퍼뮤테이션(permutation) 문제가 발생한다. 이러한 퍼뮤테이션 문제를 제거하기 위해 서로 다른 주파수 영역에서 분리된 신호들을 이용해 서로 짝을 맞추는 작업이 수행된다. 하지만, 암묵 신호 추출의 경우에는 하나의 신호만이 추출되므로, 퍼뮤테이션 문제 제거를 위한 짝 맞추는 작업을 수행할 수 없다. The blind signal extraction algorithm in the frequency domain is not active. When the blind signal separation is performed in the frequency domain, a permutation problem occurs in order to align the signals separated in different frequency domains. In order to eliminate such permutation problems, pairing is performed using signals separated in different frequency domains. However, in the case of blind signal extraction, only one signal is extracted, so that a matching operation for eliminating a permutation problem can not be performed.

따라서, 주파수 영역에서 퍼뮤테이션 문제를 야기하지 않으면서도 암묵 신호 추출 알고리즘이 수행되어 원하는 신호를 효과적으로 추출할 수 있는 기법에 대한 필요성이 대두되고 있다.Accordingly, there is a need for a technique capable of effectively extracting a desired signal by performing an implicit signal extraction algorithm without causing a permutation problem in the frequency domain.

한국공개공보 제10-2008-0019879호 (2008.03.05)Korean Laid-Open Publication No. 10-2008-0019879 (2008.03.05) 미국특허공보 US7,797,153B2 (2010.9.14)U.S. Patent Publication No. 7,797,153B2 (September 14, 2010)

본 발명은 종래기술의 문제점을 해결하기 위해 안출된 것으로, 주파수 영역에서 퍼뮤테이션 문제를 발생시키지 않으면서 암묵 신호 추출을 수행하여 혼합된 신호에서 특정 방향의 음원으로부터의 신호를 빠르게 추출할 수 있는 기법을 제공하는 것을 목적으로 한다. SUMMARY OF THE INVENTION The present invention has been conceived to solve the problems of the prior art, and it is an object of the present invention to provide a technique capable of quickly extracting a signal from a sound source in a specific direction in a mixed signal by performing blind signal extraction without generating a permutation problem in a frequency domain And to provide the above objects.

본 발명이 이루고자 하는 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 본 발명의 기재로부터 당해 분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.The technical objects to be achieved by the present invention are not limited to the above-mentioned technical problems, and other technical subjects which are not mentioned can be clearly understood by those skilled in the art from the description of the present invention .

본 발명의 일 양상에 따른 방향 정보를 이용한 암묵 신호 추출 방법은 주파수 영역에서 특정 방향에 위치하는 음원으로부터의 신호(y)를 추출하는 방법으로서, 상기 특정 방향에 위치하는 음원을 포함하는 2개 이상의 음원으로부터의 신호가 혼합되어 신호 수신부를 통해 수신되는 단계; 및 상기 수신된 신호의 비-가우스 함수 특성을 이용하되, 상기 방향의 정보를 이용하여 상기 수신된 신호를 디믹싱하는 단계를 포함한다. A method for extracting a blind signal using direction information according to an aspect of the present invention is a method for extracting a signal y from a sound source located in a specific direction in a frequency domain, Receiving signals from a sound source through a signal receiving unit; And demixing the received signal using information of the direction using the non-Gaussian function characteristic of the received signal.

본 발명의 다른 양상에서 수신된 음원 신호를 디믹싱하는 단계는 상기 방향의 정보를 이용하여 디믹싱 필터의 전달함수(W)를 초기화하여 상기 전달함수를 산출할 수 있다.In another aspect of the present invention, the step of demultiplexing the received sound source signal may calculate the transfer function by initializing a transfer function W of the demixing filter using information in the direction.

본 발명의 다른 양상에 따른 암묵 신호 추출 방법은 주파수 영역에서 하나의 신호(y)를 추출하는 방법으로서, 2개 이상의 음원으로부터의 신호가 혼합되어 2개 이상의 신호 수신부를 통해 수신되는 단계; 및 상기 수신된 신호의 비-가우스 함수 특성을 이용하여 상기 수신된 신호를 디믹싱하는 단계를 포함하며, 상기 디믹싱하는 단계는 주파수 영역에서 믹싱 필터의 전달함수의 평탄도를 나타내는 근거리 제약 조건을 이용하여 디믹싱 필터의 전달함수(W)를 산출하기 위해 반복적으로 학습을 수행하며, 상기 반복적으로 학습이 수행됨에 따라 상기 2개 이상의 신호 수신부로의 신호 도달 지연시간의 값이 적응적으로 갱신될 수 있다.According to another aspect of the present invention, there is provided a method of extracting a signal y in a frequency domain, comprising: receiving signals from two or more sound sources through two or more signal receivers; And demixing the received signal using a non-Gaussian function characteristic of the received signal, wherein the demixing step includes a step of calculating a local constraint indicating a flatness of a transfer function of the mixing filter in a frequency domain And the value of the signal arrival delay time to the two or more signal receiving units is adaptively updated as the learning is repeatedly performed .

본 발명의 다른 양상에 따른 방향 정보를 이용한 암묵 신호 추출을 위한 디믹싱 시스템은 주파수 영역에서 특정 방향에 위치하는 음원으로부터의 신호(y)를 추출하는 디믹싱 시스템으로서, 상기 특정 방향에 위치하는 음원을 포함하는 2개 이상의 음원으로부터의 신호가 혼합되어 수신되는 신호 수신부; 및 상기 수신된 신호의 비-가우스 함수 특성을 이용하되, 상기 방향의 정보를 이용하여 상기 수신된 신호를 디믹싱하는 디믹싱 필터를 포함한다. According to another aspect of the present invention, a demixing system for blind signal extraction using direction information is a demixing system for extracting a signal y from a sound source located in a specific direction in a frequency domain, A signal receiving unit in which signals from two or more sound sources including a plurality of sound sources are mixed and received; And a de-mixing filter using the non-Gaussian function characteristic of the received signal, wherein the de-mixing filter demultiplexes the received signal using information of the direction.

본 발명의 다른 양상에 따른 방향 정보를 이용한 암묵 신호 추출을 위한 디믹싱 시스템은 상기 방향의 정보를 이용하여 상기 디믹싱 필터의 전달함수(W)를 초기화하여 상기 전달함수를 산출하는 필터 파라미터 산출부를 더 포함할 수 있다. A demixing system for blind signal extraction using direction information according to another aspect of the present invention includes a filter parameter calculation unit for initializing a transfer function (W) of the demixing filter using the information in the direction and calculating the transfer function .

본 발명의 또 다른 양상에 따른 암묵 신호 추출을 위한 디믹싱 시스템은 주파수 영역에서 하나의 신호(y)를 추출하는 디믹싱 시스템으로서, 2개 이상의 음원으로부터의 신호가 혼합되어 수신되는 2개 이상의 신호 수신부; 상기 수신된 신호의 비-가우스 함수 특성을 이용하여 상기 수신된 신호를 디믹싱하는 디믹싱 필터; 및 주파수 영역에서 믹싱 필터의 전달함수의 평탄도를 나타내는 근거리 제약 조건을 이용하여 디믹싱 필터의 전달함수(W)를 산출하기 위해 반복적으로 학습을 수행하는 필터 파라미터 산출부를 포함하며, 상기 반복적으로 학습이 수행됨에 따라 상기 2개 이상의 신호 수신부로의 신호 도달 지연시간(τ)의 값이 적응적으로 갱신될 수 있다.A demixing system for extracting blind signals according to another aspect of the present invention is a demixing system for extracting one signal (y) in a frequency domain and includes two or more signals A receiving unit; A demixing filter for demultiplexing the received signal using a non-Gaussian function characteristic of the received signal; And a filter parameter calculator for repeatedly performing learning to calculate a transfer function (W) of the demixing filter using a near-field constraint expressing the flatness of the transfer function of the mixing filter in the frequency domain, The value of the signal arrival delay time τ to the two or more signal receiving units can be adaptively updated.

본 발명에 따르면 주파수 영역에서 퍼뮤테이션 문제를 발생시키지 않으면서 암묵 신호 추출을 수행하여 혼합된 신호에서 특정 방향에 위치하는 음원으로부터의 신호를 추출할 수 있는 기법을 제공할 수 있다. 또한, 본 발명에 따르면 암묵 신호 추출 알고리즘의 수렴 속도를 개선하고 계산량을 감소시킬 수 있다.According to the present invention, it is possible to provide a technique of extracting a signal from a sound source located in a specific direction in a mixed signal by performing blind signal extraction without generating a permutation problem in the frequency domain. Also, according to the present invention, it is possible to improve the convergence speed of the blind signal extraction algorithm and reduce the calculation amount.

도1은 본 발명의 실시예에 따른 암묵 신호 추출 알고리즘이 실행될 수 있는 디믹싱 시스템의 환경을 예시한다.
도2는 본 발명의 실시예에 따른 근거리 제약 조건을 찾기 위해 신호 수신부로부터 음원의 위치에 따른 룸 임펄스 응답(Room Impulse response)를 나타낸다.
도3은 음원과 신호 수신부 사이의 거리에 따라 주파수 영역에서의 신호의 평탄도(flatness)를 나타낸다.
도4는 본 발명의 실시예에 따른 암묵 신호 추출 알고리즘이 적용될 수 있는 음원과 신호 수신부 사이의 지리적 위치 관계를 나타낸다.
1 illustrates an environment of a demixing system in which a blind signal extraction algorithm according to an embodiment of the present invention may be implemented.
FIG. 2 shows a room impulse response according to the location of a sound source from a signal receiver in order to find a local constraint according to an embodiment of the present invention.
3 shows the flatness of the signal in the frequency domain according to the distance between the sound source and the signal receiving unit.
FIG. 4 illustrates a geographic positional relationship between a sound source and a signal receiving unit to which a blind signal extraction algorithm according to an embodiment of the present invention can be applied.

이하, 본 발명의 바람직한 실시예의 상세한 설명이 첨부된 도면들을 참조하여 설명된다. 도면에서의 요소들의 형상 및 크기 등은 보다 명확한 설명을 위해 과장될 수 있으며, 도면들 중 인용부호들 및 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 인용부호들로 표시됨을 유의해야 한다. 참고로 본 발명을 설명함에 있어서 관련된 공지 기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, a detailed description of preferred embodiments of the present invention will be given with reference to the accompanying drawings. The shape and the size of the elements in the drawings may be exaggerated for clarity of explanation and the same reference numerals are used for the same elements and the same elements are denoted by the same quote symbols as possible even if they are displayed on different drawings Should be. In the following description, well-known functions or constructions are not described in detail to avoid unnecessarily obscuring the subject matter of the present invention.

도1은 본 발명의 실시예에 따른 암묵 신호 추출 알고리즘이 실행될 수 있는 디믹싱 시스템의 환경을 예시한다. 도1에 도시된 바와 같이, 2이상의 소스(10, 12)로부터 음원 신호가 혼합되어 1이상의 신호 수신부(20, 22)에 의해 수신되는 경우를 고려할 수 있다. 도1에서는 실내 환경을 예시한다. 따라서, 소스(10, 12)로부터의 신호는 직접 경로(D11, D12, D21, D22)를 통해서 신호 수신부(20, 22)에 도달할 뿐 아니라, 실내에 반향되어 반향 경로(R11, R12, R21, R22)를 통해서도 도달할 수 있다. 이렇게 수신된 음원 신호는 디믹싱 시스템(30)에 입력될 수 있다. 상기 디믹싱 시스템(30)을 통해 수행되는 디믹싱(de-mixing)을 통해 혼합되어 수신된 음원 신호가 분리될 수 있다. 이하에서는 디믹싱 시스템(30)이 신호 수신부(20, 22)를 포괄하는 개념으로 지칭될 수 있다. 1 illustrates an environment of a demixing system in which a blind signal extraction algorithm according to an embodiment of the present invention may be implemented. As shown in FIG. 1, it can be considered that a sound source signal is mixed from two or more sources 10 and 12 and received by one or more signal receiving units 20 and 22. 1 illustrates an indoor environment. Therefore, the signals from the sources 10 and 12 not only reach the signal receiving units 20 and 22 through the direct paths D11, D12, D21 and D22, , R22). The sound source signal thus received may be input to the demixing system 30. [ The de-mixing performed through the demixing system 30 may separate the received sound source signals. Hereinafter, the demixing system 30 may be referred to as a concept including the signal receiving units 20 and 22. [

이때, 음원 신호나 혼합 환경에 대한 정보가 없는 상태가 "암묵" 상태로 지칭된다. 즉, 본 발명의 실시예에서는 암묵 상태에서 수신된 신호를 추출하는 알고리즘을 제공한다.
At this time, a state in which there is no information on the sound source signal or mixed environment is referred to as an "implicit" state. That is, an embodiment of the present invention provides an algorithm for extracting signals received in an implicit state.

혼합된 신호에서 임의의 신호 추출Extract random signals from mixed signals

이하에서는 본 발명의 실시예에 이용될 수 있는, 미국 특허 공보 US7,797,153B2에서 소개된 암묵 신호 추출 알고리즘에 대해서 설명한다. 미국 특허 공보 US7,797,153B2에서 소개된 암묵 신호 추출 알고리즘은 혼합된 신호 각각이 확률적으로 서로 독립적인 반면, 하나의 신호 내에서 서로 다른 주파수 빈(bin) 사이는 확률적으로 서로 종속적이라는 점을 이용한다. 이와 같은 암묵 신호 추출 알고리즘을 이용할 경우에는 혼합된 신호를 분리함과 동시에 퍼뮤테이션 문제(순열 문제)를 해결할 수 있다. Hereinafter, the blind signal extraction algorithm introduced in U.S. Patent No. 7,797,153 B2, which can be used in the embodiment of the present invention, will be described. The blind signal extraction algorithm introduced in U.S. Patent Publication No. 7,797,153B2 shows that each of the mixed signals is stochastically independent of one another while the other frequency bins within one signal are stochastically dependent on each other . When such a blind signal extraction algorithm is used, the permutation problem (permutation problem) can be solved at the same time as the mixed signal is separated.

보다 구체적으로, 독립 성분 분석(ICA: Independent Component Analysis)은 출력 신호들 사이에 통계적 독립성을 이용하는 암묵 신호 분리(BSS: Blind Source Separation) 알고리즘이다. 주파수 도메인 독립 성분 분석(FDICA: Frequency Domain ICA)가 콘볼루티브 BSS 알고리즘을 위해 이용되어 왔는바, 이는 상기 알고리즘에서 시간 도메인에서의 콘볼루티브 혼합신호가 주파수 도메인에서 순간 혼합신호(instantaneous mixture)로 모델링될 수 있기 때문이다. 이러한 모델링에 따라 분리 문제가 단순화될 수 있다. FDCIA는 각 주파수 채널의 신호 성분을 성공적으로 분리한다. 그러나, 주파수 빈들(bins) 사이에서 분리된 주파수 성분들의 임의적인 퍼뮤테이션(random permutation) 문제가 발생된다. More specifically, Independent Component Analysis (ICA) is a Blind Source Separation (BSS) algorithm that utilizes statistical independence between output signals. Frequency Domain Independent Component Analysis (FDICA) has been used for the convolutive BSS algorithm because it allows the convolution of the convolutional signal in the time domain in the frequency domain to an instantaneous mixture Because it can be modeled. This modeling can simplify the separation problem. FDCIA successfully separates the signal components of each frequency channel. However, the random permutation problem of separated frequency components between frequency bins occurs.

미국 특허 공보 US7,797,153B2에서 소개된 암묵 신호 추출 알고리즘은 독립 성분 분석의 다변수 확장에 해당하며, 주파수 성분들 사이의 종속성을 이용함으로써 상기 퍼뮤테이션 불확정성 문제를 해소한다. 보다 구체적인 설명은 미국 특허 공보 US7,797,153B2를 참조할 수 있다. The blind signal extraction algorithm introduced in U.S. Patent No. 7,797,153 B2 corresponds to a multivariate extension of the independent component analysis and solves the permutation uncertainty problem by using dependency between frequency components. A more detailed description can be found in U.S. Patent Publication No. 7,797,153B2.

우선, 상기 디믹싱 시스템(30)에 수신된 혼합 신호는 단기 푸리에 변환(STFT: Short-Time Fourier Transform)을 통해 주파수 도메인에서 표현될 수 있다. 디믹싱 시스템(30)에서 디믹싱 필터(미도시)에 의해 추출된 신호 y는 소스(10, 12)로부터의 음원 신호와 동일해야 한다. 따라서, 최초의 소스(11, 12)로부터의 음원 신호에 음원 신호의 경로에 대한 전달함수 A(믹싱 필터에 대한 전달함수)를 곱하고, 이에 추가하여 디믹싱 필터의 전달함수 W를 곱하면 최초의 소스(11, 12)로부터의 음원 신호가 복원되어야 한다. 이를 행렬로 표시하면 아래와 같다. First, the mixed signal received in the demixing system 30 can be expressed in the frequency domain through a short-time Fourier transform (STFT). The signal y extracted by the demixing filter (not shown) in the demixing system 30 should be the same as the sound source signal from the sources 10 and 12. Therefore, by multiplying the sound source signal from the first source 11, 12 by the transfer function A (transfer function for the mixing filter) with respect to the path of the sound source signal and multiplying the result by the transfer function W of the demixing filter, The source signal from the sources 11 and 12 must be restored. This is expressed as a matrix.

Figure 112013017477105-pat00001
수학식(1)
Figure 112013017477105-pat00001
Equation (1)

여기서, Wij(z)는 디믹싱 시스템(30)에 포함된 디믹싱 필터(미도시)의 입력j와 출력i에 대한 전달함수를 z-도메인에서 표현한 것이고, Aij(z)는 소스j로부터 신호 수신부 i까지의 경로의 전달함수를 z-도메인에서 표현한 것이다. Here, W ij (z) will representation of the transfer function for the input j and the output i of the de-mixing filter (not shown) contained in the de-mixing system 30 in the z- domain, A ij (z) is the source j Domain to the signal receiving unit i in the z-domain.

본 발명의 실시예에서 추출된 신호(y)는 아래 수학식(2)로 제안되는 다변수 확률 밀도 함수가 이용되어 표현될 수 있다. The signal y extracted in the embodiment of the present invention can be expressed by using a multivariate probability density function proposed by the following equation (2).

Figure 112013017477105-pat00002
수학식(2)
Figure 112013017477105-pat00002
Equation (2)

여기서, yf는 f번째 주파수의 출력 신호이고, y=[y1, yf,..., yK]이다. 또한, K는 신호(y)에 포함된 전체 주파수 빈(bin)의 개수를 나타내고, σf는 f 번째 주파수 신호의 절대값의 표준편차이며, 예컨대 1로 설정될 수 있다. Here, y f is the output signal of the f-th frequency, and y = [y 1 , y f , ..., y K ]. Further, K represents the number of all frequency bins included in the signal y, and? F is the standard deviation of the absolute value of the fth frequency signal, and may be set to, for example,

디믹싱 시스템(30)에 수신된 신호를 디믹싱 하기 위해서 디믹싱 필터에서 디믹싱을 위한 전달함수(W)를 산출해야 한다. 예컨대, 전달함수(W)의 파라미터는 아래와 같은 방식으로 필터 파라미터 산출부(미도시)에서 구해질 수 있다. In order to demix the received signal to the demixing system 30, it is necessary to calculate a transfer function W for demixing in the demixing filter. For example, the parameters of the transfer function W can be obtained in a filter parameter calculation unit (not shown) in the following manner.

본 발명의 실시예에 따른, 미국 특허 공보 US7,797,153B2에서 소개된 암묵 신호 추출 알고리즘에서 신호의 비-가우스 함수 특성(non-Gaussianity)을 최대화하기 위해서 아래와 같이 네겐트로피(Negentropy) 함수가 비용함수로서 사용될 수 있다. In order to maximize the non-Gaussianity of a signal in the blind signal extraction algorithm introduced in U.S. Patent No. 7,797,153B2 according to an embodiment of the present invention, a Negentropy function is used as a cost function Lt; / RTI >

Figure 112013017477105-pat00003
수학식(3)
Figure 112013017477105-pat00003
Equation (3)

여기서, y Gy와 동일한 평균과 분산을 갖는 가우스 함수 형태의 신호이다.Where y G is a Gaussian function signal with mean and variance equal to y .

상기 수학식(3)으로 표시된 비용함수를 이용하여 최적화된 추출 신호를 획득하기 위해 아래와 같은 학습 규칙(learning rule)을 구할 수 있다. The following learning rule can be obtained in order to obtain an optimized extracted signal using the cost function expressed by the above-mentioned equation (3).

Figure 112013017477105-pat00004
수학식(4)
Figure 112013017477105-pat00004
Equation (4)

여기서, η는 학습률(learning rate)을 나타낸다. Here,? Represents a learning rate.

이때, 수학식(3)을 미분함으로써 아래 수학식 (5)를 얻을 수 있다. At this time, the following equation (5) can be obtained by differentiating the equation (3).

Figure 112013017477105-pat00005
수학식(5)
Figure 112013017477105-pat00005
Equation (5)

본 발명의 실시예에서는 상기 수학식(5)를 이용하여 수학식 (4)로 표현된 학습 규칙을 결정할 수 있다. 여기서, xf는 신호 수신부(20,22)에서 수신되어 디믹싱 시스템(30)에 입력되는 f번째 주파수의 신호를 나타낸다. In the embodiment of the present invention, the learning rule represented by the equation (4) can be determined using the equation (5). Here, x f represents a signal of the f-th frequency received at the signal receiving units 20 and 22 and input to the demixing system 30.

본 발명의 실시예에서, 디믹싱 시스템(30)에 포함된 필터 파라미터 산출부(미도시)는 수학식(3)와 같이 표현되는 비용함수를 이용하여 디믹싱을 위한 전달함수(W)를 구할 수 있다. 이후, 산출된 전달함수(W)를 이용하여 디믹싱 시스템(30)에 수신된 신호를 디믹싱 필터에서 디믹싱한다. In the embodiment of the present invention, the filter parameter calculator (not shown) included in the demixing system 30 obtains a transfer function W for demixing using the cost function expressed by Equation (3) . Thereafter, the signal received by the demixing system 30 is demixed in the demixing filter using the calculated transfer function W.

이때, 필터 파라미터 산출부는 디믹싱 필터로부터의 출력을 수신하고, 이에 기초하여 상기 수학식 (4)와 같이 표현되는 학습규칙에 따라 반복적으로 필터 파라미터를 구하여 디믹싱 필터에 공급할 수 있다. 이에 따라 디믹싱 필터는 적응적으로 동작할 수 있다. 즉, 전달함수(W)는, 수학식(4)의 학습규칙에 따라 반복적으로 연산을 수행함으로써, 적응적으로 얻어질 수 있다. 이후, 전달함수(W)가 수렴하는지 여부를 판단하여, 그러하지 않은 경우에는 이전 단계로 돌아가 전달함수(W)를 다시 산출하여 디믹싱을 수행할 수 있다. At this time, the filter parameter calculator receives the output from the demixing filter, and on the basis of the filter parameter calculator, it can repeatedly obtain filter parameters according to the learning rule expressed by Equation (4) and supply it to the demixing filter. Thus, the demixing filter can operate adaptively. In other words, the transfer function W can be adaptively obtained by repeatedly performing an operation in accordance with the learning rule of the equation (4). Thereafter, it is determined whether or not the transfer function W converges. If not, the flow returns to the previous step to calculate the transfer function W again and perform demixing.

이와 같이 적응적인 방식으로 획득된 전달함수(W)를 이용하여 신호(y)를 추출할 수 있다. 이는 이후 필요에 따라 시간 도메인에서 표현되도록 변환될 수 있다. 이상에서 설명된 알고리즘에 따라 추출된 신호(y)는 신호 수신부(20,22)를 통해 수신된 신호 중 임의의 신호일 수 있다. 일반적으로 추출된 신호(y)는 신호 수신부(20,22)를 통해 수신된 신호 중 신호 수신부(20,22)에서 크기가 가장 큰 신호이다.
Thus, the signal y can be extracted using the transfer function W obtained in an adaptive manner. Which can then be transformed to be represented in the time domain as needed. The signal y extracted according to the algorithm described above may be any of the signals received through the signal receiving units 20 and 22. Generally, the extracted signal y is the largest signal among the signals received through the signal receiving units 20 and 22 in the signal receiving units 20 and 22.

신호 수신부에 가장 가까운 음원으로부터의 신호 추출Extracting the signal from the sound source closest to the signal receiver

이상에서 살펴본 바와 같은 암묵 신호 추출 알고리즘에 특정 조건을 추가하여 신호(y)를 추출함으로써 신호 수신부(20,22)로부터 가장 가까이로부터 발생한 신호를 추출할 수 있다. 이하에서는 본 발명의 실시예에 따라 근거리 신호를 추출할 수 있는 암묵 신호 추출 알고리즘에 대해서 살펴본다. By extracting the signal y by adding a specific condition to the blind signal extraction algorithm as described above, it is possible to extract the signal generated from the nearest one from the signal receiving units 20 and 22. Hereinafter, a blind signal extraction algorithm capable of extracting a near signal according to an embodiment of the present invention will be described.

우선, 신호 수신부(20,22)로부터 근거리에 위치한 소스(10,12)로부터의 신호의 특성을 살펴본다. First, the characteristics of the signals from the sources 10 and 12 located in the short distance from the signal receiving units 20 and 22 are examined.

도2는 본 발명의 실시예에 따른 근거리 제약 조건을 찾기 위해 신호 수신부로부터 음원의 위치에 따른 룸 임펄스 응답(Room Impulse Response)를 나타낸다. 도2에서 음원의 소스는 "source"로 표시되고 신호 수신부는 "mic"로 표시된다. 도2에서 각각의 소스(1 내지 5)에 대한 그래프에서 가로축은 시간 지연을 나타내는 시간축이고 세로축은 응답의 크기를 나타낸다.FIG. 2 shows a room impulse response according to a location of a sound source from a signal receiver in order to find a local constraint according to an embodiment of the present invention. In Fig. 2, the source of the sound source is indicated by "source" and the signal receiver is indicated by "mic". In FIG. 2, in the graph for each of the sources 1 to 5, the horizontal axis represents the time axis representing the time delay and the vertical axis represents the size of the response.

도2에서 각 소스(1 내지 5)에 대한 룸 임펄스 응답으로부터 알 수 있는 바와 같이, 음원 소스로부터 신호 수신부(마이크)까지의 거리가 가까울수록 룸 임펄스 응답의 첫 번째 성분의 크기가 나머지 성분들의 크기에 비해서 비약적으로 커짐을 알 수 있다. 또한, 음원 소스로부터 신호 수신부(마이크)까지의 거리가 멀어질수록 룸 임펄스 응답의 첫 번째 성분의 크기와 나머지 성분들의 크기의 차이가 줄어들게 된다. As can be seen from the room impulse response for each of the sources 1 to 5 in FIG. 2, the closer the distance from the source to the signal receiver (microphone) is, the smaller the magnitude of the first component of the room impulse response is, As shown in FIG. In addition, as the distance from the sound source to the signal receiver (microphone) increases, the difference between the size of the first component of the room impulse response and the size of the remaining components decreases.

도2로부터, 음원과 신호 수신부 사이의 거리가 극단적으로 매우 가까운 경우에는 룸 임펄스 응답이 델타 함수(delta function)에 유사한 모양이 됨을 알 수 있다. 이러한 델타 함수에 가까운 룸 임펄스 응답을 주파수 영역에서 표현하는 경우 신호는 모든 주파수 영역에 대해서 일정한 상수값을 가지게 된다. 따라서, 룸 임펄스 응답이 주파수 영역에서 일정한 값을 가질수록 그 값이 커지도록 설정된 평탄도(flatness)를 아래 수학식(6)과 같이 표현할 수 있다. It can be seen from FIG. 2 that the room impulse response is similar to the delta function when the distance between the sound source and the signal receiving unit is extremely close. When a room impulse response close to the delta function is expressed in the frequency domain, the signal has a constant value for all the frequency domains. Accordingly, the flatness that is set such that the value increases as the room impulse response has a constant value in the frequency domain can be expressed as Equation (6) below.

Figure 112013017477105-pat00006
수학식(6)
Figure 112013017477105-pat00006
Equation (6)

여기서 aij f는 소스 j로부터 신호 수신부 i까지의 경로의 f번째 주파수 영역의 전달함수를 의미한다.Where a ij f is the transfer function of the fth frequency domain of the path from source j to signal receiver i.

도3은 음원과 신호 수신부 사이의 거리에 따라 주파수 영역에서의 신호의 평탄도(flatness)를 나타낸다. 도3에서 룸의 반향 정도에 따라 서로 다른 색으로 표시된다. 도3에서 가로축은 소스와 마이크 사이의 거리를 나타내는 거리축이고 세로축은 평탄도의 크기를 나타내는 크기축이다. 3 shows the flatness of the signal in the frequency domain according to the distance between the sound source and the signal receiving unit. In FIG. 3, different colors are displayed depending on the degree of echo of the room. 3, the abscissa is a distance axis indicating the distance between the source and the microphone, and the ordinate is a magnitude axis indicating the magnitude of the flatness.

도3으로부터 알 수 있는 바와 같이, 소스 j가 신호 수신부 i로부터 가까우면 가까울수록 주파수 영역에서 전달함수의 크기는 일정해지고 따라서 수학식(6)에 따라 정의된 평탄도 값은 커지게 된다. 이러한 평탄도는 소스로부터 신호 수신부까지 경로의 전달함수인 aij f를 이용하여 계산된 것이다.As can be seen from FIG. 3, as the source j is closer to the signal receiving unit i, the size of the transfer function becomes constant in the frequency domain, and therefore, the flatness value defined according to Equation (6) becomes larger. This flatness is calculated using the transfer function a ij f from the source to the signal receiving unit.

본 발명의 실시예에 따른 암묵 신호 추출 알고리즘에서 근거리 신호를 추출하기 위해서는 전술한 바와 같은 특성이 디믹싱 필터의 전달함수를 산출할 때 적용되어야 한다. 본 발명의 실시예에서는 암묵 신호 추출 알고리즘에서 수학식(4)로 표현된 학습 규칙에 근거리 제약 조건을 추가하여 디믹싱 필터의 전달함수(W)를 산출할 수 있다. In order to extract the near signal in the blind signal extraction algorithm according to the embodiment of the present invention, the above-mentioned characteristic should be applied when calculating the transfer function of the demix filter. In the embodiment of the present invention, it is possible to calculate the transfer function W of the demixing filter by adding the near limit constraint to the learning rule expressed by Equation (4) in the blind signal extraction algorithm.

이하에서는 근거리 제약 조건에 대해서 살펴본다. Hereinafter, the near limit constraint condition will be discussed.

본원 명세서에 기재된 수학식(1)은 2 x 2(음원 신호 2개, 마이크 2개)의 암묵 신호 추출에 대해서 표현된 것이다. 이를, N개의 신호와 N개의 마이크에 대한 암묵 신호 추출에 관한 식으로 나타내면 아래 수학식(7)과 같다.Equation (1) described herein is expressed for a blind signal extraction of 2 x 2 (2 source signals, 2 microphones). This can be expressed by the following equation (7) as an expression for the blind signal extraction for N signals and N microphones.

Figure 112013017477105-pat00007
수학식(7)
Figure 112013017477105-pat00007
Equation (7)

여기서, const.는 상수값을 나타낸다. 따라서 수학식(7)을 통해서 디믹싱 필터와 믹싱 필터의 관계식을 수학식(8)과 같이 구할 수 있다.Here, const. Represents a constant value. Therefore, the relation between the demixing filter and the mixing filter can be obtained as shown in equation (8) using equation (7).

Figure 112013017477105-pat00008
수학식(8)
Figure 112013017477105-pat00008
Equation (8)

수학식(8)은, 근거리 제약 조건을 구하기 위한 아래 두 가지 가정을 적용하여 더욱 간단한 형태로 변형될 수 있다. 신호 수신부(20,22)로부터 가장 가까운 신호를 추출하기 위한 목적에 위배되지 않도록 다음과 같은 2가지 가정을 사용하여 믹싱 필터에 해당하는 전달함수 aij f를 간단하게 모델링할 수 있다. Equation (8) can be transformed into a simpler form by applying the following two assumptions for obtaining the near limit constraint. The transfer function a ij f corresponding to the mixing filter can be simply modeled using the following two assumptions so as not to violate the object of extracting the signal closest to the signal receiving units 20 and 22.

1. 이웃한 두 마이크의 거리는 매우 가깝다.1. The distance between two neighbors is very close.

2. 가장 가까운 신호와 2개의 수신부까지의 거리가 매우 짧기 때문에 가까운 신호로부터 각각의 수신부까지 전달함수인 룸 임펄스 응답은 둘 다 델타함수와 유사한 형태, 즉 첫 번째 성분은 매우 크고 나머지 성분은 매우 작은 형태가 될 것이다. 첫 번째 성분을 제외한 나머지 성분을 무시한다면 단순히 2개의 수신부에서의 룸 임펄스 응답인 ai1 f와 ak1 f 는 시간 지연만큼의 차이가 있는 수학식(9)와 같이 표현될 수 있다. 2. Since the distance between the nearest signal and the two receivers is very short, the room impulse response, which is a transfer function from the nearest signal to each receiver, is similar to the delta function, ie the first component is very large and the remaining components are very small It will be a form. If we ignore the remaining components except the first component, we can simply express the room impulse responses a i1 f and a k1 f in the two receiving units as shown in Equation (9) with a difference in time delay.

Figure 112013017477105-pat00009
수학식(9)
Figure 112013017477105-pat00009
Equation (9)

여기서 τ l 은 가장 가까운 음원에서부터 수신부 l까지 소리가 전달되는데 걸리는 시간을 의미하며, L l 은 가장 가까운 음원에서부터 수신부 l까지의 거리, v는 소리의 속도를 의미한다. 따라서 이러한 관계를 하나의 전달함수 a11 f에 대하여 수학식(8)에 대입하면 아래와 같은 수학식(10)을 구할 수 있다. Where τ l is the closest sound from the receiver l The sound is passed by means of time-consuming and, L l is the distance, v from the closest source to the receiver l denotes the speed of sound. Therefore, by substituting this relationship into the equation (8) for one transfer function a 11 f , the following equation (10) can be obtained.

Figure 112013017477105-pat00010
수학식(10)
Figure 112013017477105-pat00010
Equation (10)

전술한 가정 2의 내용을 한번 더 활용하여 상기 수학식(10)은 더욱 간단한 형태로 표현될 수 있다. 즉, 믹싱 필터의 전달함수인 a11 f또한 소스와의 짧은 거리 때문에 상수로 취급이 가능하다. 따라서 상기 수학식(10)은 아래와 같은 수학식(11)로 표현이 가능하다. Using the above-mentioned assumption 2 once more, the above equation (10) can be expressed in a simpler form. That is, the transfer function a 11 f of the mixing filter can also be treated as a constant because of its short distance to the source. Therefore, the above equation (10) can be expressed by the following equation (11).

Figure 112013017477105-pat00011
수학식(11)
Figure 112013017477105-pat00011
Equation (11)

즉, 근거리 신호의 특성을 이용한 상기 2가지 가정을 통하여 신호 수신부로부터 거리가 가까운 신호가 가지는 디믹싱 필터의 특성은 상기 수학식(11)과 같이 모델링할 수 있다. 여기서 수학식(6)으로 표현된 평탄도를 도입하여 아래 수학식 (12)로 표현되는 근거리 제약 조건을 얻을 수 있다. That is, the characteristics of the demixing filter having a signal close to the signal receiving unit through the above two assumptions using the characteristics of the near-field signal can be modeled as in Equation (11). Here, by introducing the flatness expressed by the equation (6), a near constraint expressed by the following equation (12) can be obtained.

Figure 112013017477105-pat00012
수학식(12)
Figure 112013017477105-pat00012
Equation (12)

여기서,

Figure 112013017477105-pat00013
이고,here,
Figure 112013017477105-pat00013
ego,

Figure 112013017477105-pat00014
이며, 그리고
Figure 112013017477105-pat00014
And

Figure 112013017477105-pat00015
로 표현될 수 있다.
Figure 112013017477105-pat00015
. ≪ / RTI >

또한,

Figure 112013017477105-pat00016
이다. 수학식(12)에서 획득되는 Jc가 본 발명의 실시예에 따라 근거리 신호를 추출하기 위한 주파수 영역에서의 근거리 제약 조건이 되는 것이다. 이러한 근거리 제약 조건을 수학식(4)로 표현된 학습 규칙에 적용하여 학습하기 위해서는 Jc의 미분값을 구할 필요가 있다. Jc의 미분값은 다음과 같이 수학식(13)로 표현이 가능하다.Also,
Figure 112013017477105-pat00016
to be. Jc obtained in the equation (12) becomes a local constraint in the frequency domain for extracting the near-field signal according to the embodiment of the present invention. To apply such a local constraint to the learning rule expressed by equation (4), it is necessary to obtain the derivative value of Jc. The differential value of Jc can be expressed by the following equation (13).

Figure 112013017477105-pat00017
수학식(13)
Figure 112013017477105-pat00017
Equation (13)

수학식(13)을 이용하여, 수학식(4)로 표현된 임의의 신호를 추출하는 알고리즘에서 근거리 제약 조건을 추가하여 아래 수학식(14)와 같은 근거리 신호를 추출하기 위한 학습 규칙을 얻을 수 있다. Using the equation (13), a learning rule for extracting a near signal as in the following equation (14) can be obtained by adding a near constraint in an algorithm for extracting a signal represented by equation (4) have.

Figure 112013017477105-pat00018
수학식(14)
Figure 112013017477105-pat00018
Equation (14)

여기서,

Figure 112013017477105-pat00019
이고,
Figure 112013017477105-pat00020
이고, 그리고
Figure 112013017477105-pat00021
이다. here,
Figure 112013017477105-pat00019
ego,
Figure 112013017477105-pat00020
And
Figure 112013017477105-pat00021
to be.

여기서

Figure 112013017477105-pat00022
이고, η는 학습률, λ는 근거리 제약조건의 가중치로써 임의의 값을 정해두고 사용한다. η와 λ의 값이 너무 크면 수학식(14)로 표시된 학습 규칙이 발산하여 학습에 실패할 수 있다. 하지만, 이들 값이 너무 작은 경우에는 학습하는데 장시간이 소요된다. 일반적으로 η와 λ의 값은, 여러 번의 시행착오를 통해 학습 규칙이 수렴하는 경우 중 가장 큰 값으로 설정될 수 있다. 안정성을 위해서 상기 가장 큰 값의 70~80%에 해당하는 값으로 설정될 수도 있다. JNeg는 네겐트로피 함수를 이용하여 임의의 신호 하나를 추출하는 부분이며 JC는 근거리 제약조건(Closeness Constraint)을 나타낸다. here
Figure 112013017477105-pat00022
, Η is the learning rate, and λ is an arbitrary value as the weight of the near constraint. If the values of [eta] and [lambda] are too large, the learning rule indicated by equation (14) may diverge and fail to learn. However, if these values are too small, it takes a long time to learn. In general, the values of η and λ can be set to the largest value among the cases where the learning rule converges through several trial and error. And may be set to a value corresponding to 70 to 80% of the largest value for stability. J Neg is the part that extracts one arbitrary signal by using the nagent trophy function and J C represents the close constraint (Closeness Constraint).

이상에서 살펴본 바와 같이 근거리 제약 조건을 포함하는 학습규칙, 예컨대 수학식(14)로 표현된 학습규칙을 적용하여 산출된 전달함수(W)를 이용함으로써, 본 발명의 실시예에 따른 암묵 신호 추출 알고리즘을 이용하여 신호 수신부(20, 22)로부터 가장 가까운 신호가 추출될 수 있다. As described above, by using the transfer function W calculated by applying the learning rule including the local constraint condition, for example, the learning rule expressed by the equation (14), the blind signal extraction algorithm according to the embodiment of the present invention The signals closest to the signal receiving units 20 and 22 can be extracted.

근거리 제약 조건에 대한 함수(Jc)에는 상기 지연시간(τ)이 변수로 포함된다. 이제껏 이러한 지연시간(τ)의 값은 0의 값 또는 특정 값으로 고정하여 암묵 신호 추출 알고리즘을 실행하였다. 근거리 제약 조건을 추가하여 본 발명의 실시예에 따른 암묵 신호 추출 알고리즘을 통해 신호 수신부(20,22)로부터 가장 가까운 신호를 추출할 때, 복수개의 신호 수신부에 신호가 도달하는 시간 차이인 지연시간(τ)으로 고정 값을 이용하는 대신에 적응적으로 그 값을 계산하여 업데이트할 수 있다. 즉, 본 발명의 실시예에 따른 암묵 신호 추출 알고리즘의 매 학습마다 상기 지연시간(τ)의 값을 적응적으로 갱신할 수 있다. 이와 같이 암묵 신호 추출 알고리즘의 매 학습마다 지연시간(τ)을 적응적으로 갱신해 감으로써 본 발명의 실시예에 따른 암묵 신호 추출 알고리즘은 더욱 빠르게 수렴할 수 있다. 즉, 외부에서 지연시간(τ)의 값에 대한 입력 없이 신호 수신부(20,22)로부터 가까이에 위치한 음원의 방향을 예측할 수 있고 보다 효율적인 학습이 가능하다. 또한, 이를 통해 계산량이 감소할 수 있다. The function Jc for the near limit constraint includes the delay time? As a variable. So far, the value of the delay time (tau) has been fixed to a value of 0 or a specific value to execute the blind signal extraction algorithm. When extracting the closest signal from the signal receiving units 20 and 22 through the blind signal extracting algorithm according to the embodiment of the present invention by adding the near limit constraint, the delay time which is a time difference between signals arriving at the plurality of signal receiving units τ), instead of using a fixed value, the value can be calculated and updated adaptively. That is, the value of the delay time? Can be adaptively updated for each learning of the blind signal extraction algorithm according to the embodiment of the present invention. In this way, the blind signal extraction algorithm according to the embodiment of the present invention can converge more quickly by adaptively updating the delay time (τ) for each learning of the blind signal extraction algorithm. That is, it is possible to predict the direction of a sound source located nearby from the signal receiving units 20 and 22 without inputting a value of the delay time? From outside, and more efficient learning is possible. Also, through this, the amount of calculation can be reduced.

도4는 본 발명의 실시예에 따른 암묵 신호 추출 알고리즘이 적용될 수 있는 음원과 신호 수신부 사이의 지리적 위치 관계를 나타낸다. 도4에서는 신호 수신부로서 제1마이크(Microphone 1) 및 제2마이크(Microphone 2)이 도시되고 음원으로서 제1음원(sound source 1)이 도시된다. FIG. 4 illustrates a geographic positional relationship between a sound source and a signal receiving unit to which a blind signal extraction algorithm according to an embodiment of the present invention can be applied. In FIG. 4, a first microphone (Microphone 1) and a second microphone (Microphone 2) are shown as a signal receiving unit and a first sound source 1 is shown as a sound source.

복수 개의 신호 수신부(20, 22)에 신호가 도달하는 시간 차이인 지연시간(τ)의 값은 음원이 위치하는 방향과 매우 밀접한 관계가 있다. 즉, 도4에서 상기 제1음원으로부터 제1마이크와 제2마이크에 각각 도달하는 시간의 차이인 지연시간(τ)의 값은 상기 두 개의 마이크가 떨어진 거리에 의해 최대값이 결정된다. The value of the delay time?, Which is a time difference between the arrival of the signal at the plurality of signal receiving units 20 and 22, is closely related to the direction in which the sound source is located. That is, in FIG. 4, the maximum value of the delay time (.tau.), Which is the time difference between the first sound source and the second microphone, is determined by the distance between the two microphones.

도4에서 가로축은 x축 그리고 세로축은 y축으로 정의한다. 만약, 제1음원이 x축 위에 위치한다면 상기 제1음원으로부터의 신호가 제1마이크와 제2마이크에 도달하는데 걸리는 시간차인 지연시간(τ)의 값은 최대가 된다. 이때의 지연시간(τ)의 값은 T라고 지칭되며 최대의 지연시간을 나타낸다. 만약, 제1음원이 y축 위에 위치한다면 상기 제1음원으로부터의 신호가 제1마이크와 제2마이크에 도달하는데 걸리는 시간차인 지연시간(τ)의 값은 0이 된다. 따라서 상기 지연시간(τ)의 값은 -T ~ T의 값을 가짐을 알 수 있다. In Fig. 4, the abscissa axis is defined as x axis and the ordinate axis is defined as y axis. If the first sound source is located on the x-axis, the value of the delay time (tau), which is the time delay taken for the signal from the first sound source to reach the first microphone and the second microphone, becomes the maximum. The value of the delay time (tau) at this time is referred to as T and represents the maximum delay time. If the first sound source is located on the y-axis, the value of the delay time (tau), which is the time delay taken for the signal from the first sound source to reach the first microphone and the second microphone, becomes zero. Therefore, it can be seen that the value of the delay time? Has a value of -T to T.

이때, 상기 지연시간(τ)의 값에 따라 근거리 제약 조건인 함수 Jc의 값을 구할 수 있다. 예컨대, 상기 지연시간(τ)의 값을 적당한 레졸루션(resolution), 예컨대 0.1초 간격으로 상기 함수 Jc 값을 획득할 수 있다. 이러한 지연시간(τ)과 함수 Jc 값은 그래프로 도시될 수도 있다. 예컨대, 가로축은 지연시간(τ)을 세로축은 근거리 제약 조건인 함수 Jc 값을 나타내도록 하고, 상기 두 개의 값 사이의 관계를 그래프로 도시(plot)할 수 있다. At this time, the value of the function Jc which is a local constraint can be obtained according to the value of the delay time?. For example, the value of the delay time? May be obtained at an appropriate resolution, for example, 0.1 second intervals. This delay time? And the function Jc value may be plotted. For example, the horizontal axis represents the delay time?, The vertical axis represents the value of the function Jc, which is the near limit constraint condition, and the relationship between the two values can be plotted graphically.

근거리 제약 조건을 이용한 암묵 신호 추출 알고리즘의 학습 목표는 함수 Jc 값을 최대로 만드는 디믹싱 필터의 전달함수(W) 찾는 것이다. 여기서도 마찬가지로 함수 Jc 값을 최대로 만드는 지연시간(τ) 값을 찾을 수 있다. 이와 같이, 근거리 제약 조건을 추가하여 본 발명의 실시예에 따른 암묵 신호 추출 알고리즘의 매 학습마다 지연시간(τ)을 적응적으로 갱신함으로써, 본 발명의 실시예에 따른 암묵 신호 추출 알고리즘은 더욱 빠르게 수렴할 수 있다. 또한, 이를 통해 계산량이 감소할 수 있다.
The learning objective of the blind signal extraction algorithm using the near limit constraint is to find the transfer function (W) of the demixing filter that maximizes the function Jc value. Again, we can find the value of the delay time (τ) that maximizes the value of the function Jc. In this way, by adding the local constraint condition and adaptively updating the delay time? For each learning of the blind signal extraction algorithm according to the embodiment of the present invention, the blind signal extraction algorithm according to the embodiment of the present invention is faster Can be converged. Also, through this, the amount of calculation can be reduced.

특정 방향에 위치한 음원으로부터의 신호 추출Extraction of signals from a sound source located in a specific direction

근거리 제약 조건을 추가하지 않는 경우, 본 발명의 실시예에 따른 암묵 신호 추출 알고리즘을 이용하면 임의의 신호, 예컨대 신호 수신부(20,22)에서 크기가 가장 큰 신호를 추출할 수 있다. In the case where the near limit constraint is not added, an arbitrary signal such as a signal having the largest size can be extracted by using the blind signal extraction algorithm according to the embodiment of the present invention.

본 발명의 실시예에 따른 암묵 신호 추출 알고리즘에 따르면 혼합된 신호에서 특정 방향에 위치하는 음원으로부터의 신호를 추출할 수 있다. According to the blind signal extraction algorithm according to the embodiment of the present invention, it is possible to extract a signal from a sound source located in a specific direction in a mixed signal.

즉, 신호 수신부(20,22)에는 복수의 음원들(10,12)로부터의 신호가 혼합되어 수신된다. 이때, 신호 수신부(20, 22)에 수신된 신호들 중에서 특정 방향에 위치하는 음원으로부터의 신호를 추출할 수 있다. That is, signals from the plurality of sound sources 10 and 12 are mixed and received in the signal receiving units 20 and 22. At this time, it is possible to extract a signal from a sound source located in a specific direction among the signals received by the signal receiving units 20 and 22.

신호 수신부(20,22)의 배열과의 관계에서 특정 방향에 위치하는 음원(10,12)으로부터 신호를 추출하기 위해서, 원하는 방향의 정보를 이용할 수 있다. 여기서 방향의 정보는 신호 수신부(20,22)에 대한 음원의 상대적인 방향을 지칭할 수 있다. 예컨대, 음원이 도4의 y축 상에 위치하는 경우 해당 음원의 방향은 0도 방향에 위치하는 것으로 지칭될 수 있다. 또한, 음원이 도4의 x축 상에 위치하되 제1 및 제2마이크의 우측 또는 좌측에 위치하는 경우, 해당 음원의 방향은 +90도 또는 -90도 방향에 위치하는 것으로 지칭될 수 있다. Information in a desired direction can be used to extract signals from the sound sources 10 and 12 located in a specific direction in relation to the arrangement of the signal receiving units 20 and 22. [ Here, the direction information may refer to a relative direction of the sound source to the signal receiving units 20 and 22. [ For example, when the sound source is located on the y-axis of FIG. 4, the direction of the sound source may be referred to as being located in the 0 degree direction. In addition, when the sound source is located on the x-axis of FIG. 4 and is located on the right or left side of the first and second microphones, the direction of the sound source may be referred to as being located in the +90 degrees or -90 degrees direction.

이하에서는 본 발명의 실시예에 따라 특정 방향에 위치하는 음원으로부터의 신호를 추출할 수 있는 암묵 신호 추출 알고리즘에 대해서 살펴본다. Hereinafter, a blind signal extraction algorithm capable of extracting a signal from a sound source located in a specific direction will be described according to an embodiment of the present invention.

신호 수신부(20,22)를 기준으로 음원(10,12)의 위치에 따라서 음원(10,12)으로부터 신호 수신부(20,22)까지의 전달함수, 즉 믹싱 필터의 전달함수는 아래 수학식(15)와 같이 모델링될 수 있다. The transfer function from the sound sources 10 and 12 to the signal receiving units 20 and 22, that is, the transfer function of the mixing filter, according to the positions of the sound sources 10 and 12 with respect to the signal receiving units 20 and 22, 15). ≪ / RTI >

Figure 112013017477105-pat00023
수학식(15)
Figure 112013017477105-pat00023
Equation (15)

여기서, τkl은 음원l로부터 신호 수신부 k까지 음성이 전달되는데 소요되는 시간이며, lkl은 음원l과 신호 수신부 k사이의 거리이고, v는 소리의 속도이다. 음원의 방향에 대한 정보는, 예컨대 두 개의 마이크를 이용하였을 때, 하나의 음원으로부터 각 마이크로의 전달함수(A)에서 위상(phase) 차이로 나타난다. 즉, m번째 마이크와 n번째 마이크에 대한 믹싱 필터의 전달함수(A)를 통하여 두 전달함수 사이의 관계식을 적어보면 아래 수학식(16)와 같이 표현된다.Here, τ kl is the time required from the sound signal to the receiver k l there is a voice transmission, l kl is the distance between the sound source and the signal receiver l k, v is the speed of sound. The information about the direction of the sound source appears as a phase difference in the transfer function (A) of each micro from one sound source when two microphones are used, for example. That is, the relation between the two transfer functions through the transfer function (A) of the mixing filter for the m-th microphone and the n-th microphone is expressed as Equation (16) below.

Figure 112013017477105-pat00024
수학식(16)
Figure 112013017477105-pat00024
Equation (16)

디믹싱 필터와 믹싱 필터 사이의 관계를 나타내는 수학식(8)로부터 수학식(15)를 이용하여

Figure 112013017477105-pat00025
에 대하여 정리하면 아래 수학식(17)을 구할 수 있다.Using the equation (15) from the equation (8) representing the relationship between the demixing filter and the mixing filter,
Figure 112013017477105-pat00025
The following equation (17) can be obtained.

Figure 112013017477105-pat00026
수학식(17)
Figure 112013017477105-pat00026
Equation (17)

상기 수학식(17)으로부터 알 수 있는 바와 같이, 디믹싱 필터의 전달함수(W)의 계수와 믹싱 필터의 전달함수(A)의 계수는 각각 묶여 있는 형태를 갖는다. 여기서, 믹싱 필터의 계수는 위상 차이로서 표현될 수 있다. 디믹싱 필터의 계수를 초기화할 때, 방향 정보를 바탕으로 믹싱 필터에서 발생한 위상 차이를 보상해줄 수 있다. 이와 같이, 디믹싱 필터의 전달함수(W)를 초기화함으로써 상기 방향 정보에 따른 특정 방향에 위치한 음원으로부터의 신호를 추출할 수 있다. As can be seen from the above equation (17), the coefficients of the transfer function W of the demixing filter and the coefficients of the transfer function A of the mixing filter are respectively bundled. Here, the coefficients of the mixing filter can be expressed as a phase difference. When the coefficients of the demixing filter are initialized, the phase difference generated in the mixing filter can be compensated based on the direction information. Thus, by initializing the transfer function W of the demixing filter, a signal from a sound source located in a specific direction according to the direction information can be extracted.

디믹싱 필터의 전달함수(W)를 초기화하는 것은 아래 수학식 (18)로 표현될 수 있다. Initializing the transfer function W of the demixing filter can be expressed by the following equation (18).

Figure 112013017477105-pat00027
수학식(18)
Figure 112013017477105-pat00027
Equation (18)

여기서 τml은 추출하고자 하는 음원 l에서부터 신호 수신부 m까지 신호가 전달되는 데 걸리는 시간이다. 이 값(τml)은 음원l의 방향 정보에 따라 입력되는 값이다. τdmn은 추출하고자 하는 음원l에서부터 신호 수신부 m과 신호 수신부 n까지 각각 신호가 전달되는 거리가 다르기 때문에 발생하는 지연시간 값이다. 상기 수학식(17)과 같이 디믹싱 필터의 전달함수(W)를 초기화 하여, 본 발명의 실시예에 따른 암묵 신호 추출 알고리즘을 적용하는 경우, 원하는 방향에 위치하는 음원으로부터의 신호를 추출할 수 있다. 참고로, 방향 정보가 제공되지 않는 경우의 암묵 신호 추출 알고리즘에서는 예컨대, 전달함수(W)가

Figure 112013017477105-pat00028
으로 초기화될 수 있다. Where τ ml is the time it takes for the signal to travel from the sound source 1 to the signal receiver m to be extracted. This value (τ ml ) is a value inputted according to the direction information of the sound source l. τ dmn is the delay time value that occurs because the distances to which signals are transmitted from the sound source 1 to be extracted to the signal receiving unit m and the signal receiving unit n are different. In the case of applying the blind signal extraction algorithm according to the embodiment of the present invention by initializing the transfer function W of the demixing filter as in Equation (17), it is possible to extract a signal from a sound source located in a desired direction have. For reference, in the blind signal extraction algorithm when direction information is not provided, for example, the transfer function W
Figure 112013017477105-pat00028
Lt; / RTI >

이러한 방향 정보를 이용한 암묵 신호 추출 알고리즘 또한 근거리 제약 조건을 추가하는 기법 및/또는 지연시간(τ)을 적응적으로 갱신해가는 기법과 함께 이용될 수 있다. 예컨대, 음원의 방향 정보에 오류가 존재하는 경우 암묵 신호 추출 알고리즘의 매 학습마다 지연시간(τ)을 갱신함으로써 잘못된 음원의 방향 정보를 보상하면서 암묵 신호 추출 알고리즘의 적응할 수 있다. The blind signal extraction algorithm using the direction information can also be used together with a technique of adding a near constraint and / or a technique of adaptively updating the delay time (tau). For example, when there is an error in the direction information of the sound source, the blind signal extraction algorithm can be adapted while compensating the direction information of the erroneous sound source by updating the delay time (tau) for each learning of the blind signal extraction algorithm.

이상 첨부된 도면을 참조하여 본 발명의 실시예를 설명하였지만, 본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해되어야 하고, 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.While the present invention has been particularly shown and described with reference to exemplary embodiments thereof, it is evident that many alternatives, modifications and variations will be apparent to those skilled in the art. will be. Therefore, it should be understood that the above-described embodiments are to be considered in all respects as illustrative and not restrictive, the scope of the invention being indicated by the appended claims rather than the foregoing description, It is intended that all changes and modifications derived from the equivalent concept be included within the scope of the present invention.

10, 12: 소스
20, 22: 신호 수신부
30: 디믹싱 시스템
10, 12: source
20, 22: Signal receiving section
30: De-mixing system

Claims (12)

주파수 영역에서 특정 방향에 위치하는 음원으로부터의 신호(y)를 추출하는 방법에 있어서,
상기 특정 방향에 위치하는 음원을 포함하는 2개 이상의 음원으로부터의 신호가 혼합되어 신호 수신부를 통해 수신되는 단계; 및
상기 수신된 신호의 비-가우스 함수 특성을 이용하되, 상기 방향의 정보를 이용하여 상기 수신된 신호를 디믹싱하는 단계:를 포함하며,
상기 디믹싱하는 단계는:
비용함수
Figure 112014050467360-pat00047
를 이용하여 상기 디믹싱 필터의 전달함수(W)를 산출하되, 학습규칙
Figure 112014050467360-pat00048
에 따라 반복적으로 상기 전달함수를 산출하는 단계; 및
상기 전달함수를 이용하여 상기 수신된 신호를 디믹싱하는 단계를 포함하며,
여기서,
Figure 112014050467360-pat00049
이고 η는 학습률인 것을 특징으로 하는 방향 정보를 이용한 암묵 신호 추출 방법.
A method for extracting a signal (y) from a sound source located in a specific direction in a frequency domain,
Receiving signals from two or more sound sources including a sound source located in the specific direction through a signal receiving unit; And
And demixing the received signal using information of the direction using the non-Gaussian function of the received signal,
Wherein the demixing comprises:
Cost function
Figure 112014050467360-pat00047
(W) of the demixing filter using the learning rule
Figure 112014050467360-pat00048
Repeatedly calculating the transfer function according to the transfer function; And
And demixing the received signal using the transfer function,
here,
Figure 112014050467360-pat00049
And? Is a learning rate.
제1항에 있어서,
상기 디믹싱하는 단계는:
상기 방향의 정보를 이용하여 디믹싱 필터의 전달함수(W)를 초기화하여 상기 전달함수를 산출하는 것을 특징으로 하는 방향 정보를 이용한 암묵 신호 추출 방법.
The method according to claim 1,
Wherein the demixing comprises:
Wherein the transfer function (W) of the demixing filter is initialized by using the direction information to calculate the transfer function.
삭제delete 주파수 영역에서 특정 방향에 위치하는 음원으로부터의 신호(y)를 추출하는 방법에 있어서,
2개 이상의 음원으로부터의 신호가 혼합되어 2개 이상의 신호 수신부를 통해 수신되는 단계; 및
상기 수신된 신호의 비-가우스 함수 특성을 이용하여 상기 수신된 신호를 디믹싱하는 단계를 포함하며,
상기 디믹싱하는 단계는 주파수 영역에서 믹싱 필터의 전달함수의 평탄도를 나타내는 근거리 제약 조건을 이용하여 디믹싱 필터의 전달함수(W)를 산출하기 위해 반복적으로 학습을 수행하며,
상기 반복적으로 학습이 수행됨에 따라 상기 2개 이상의 신호 수신부로의 신호 도달 지연시간의 값이 적응적으로 갱신되는 것을 특징으로 하는 암묵 신호 추출 방법.
A method for extracting a signal (y) from a sound source located in a specific direction in a frequency domain,
The signals from two or more sound sources are mixed and received through two or more signal receivers; And
And demixing the received signal using a non-Gaussian function characteristic of the received signal,
The demixing step repeatedly performs learning to calculate a transfer function (W) of a demixing filter using a near-field constraint representing a flatness of a transfer function of a mixing filter in a frequency domain,
And the value of the signal arrival delay time to the two or more signal receiving units is adaptively updated as the learning is repeatedly performed.
제4항에 있어서,
상기 디믹싱하는 단계는:
비용함수
Figure 112013017477105-pat00032
를 이용하여 상기 디믹싱 필터의 전달함수(W)를 산출하되, 학습규칙
Figure 112013017477105-pat00033
에 따라 반복적으로 상기 디믹싱 필터의 전달함수를 산출하는 단계; 및
상기 디믹싱 필터의 전달함수를 이용하여 상기 수신된 신호를 디믹싱하는 단계를 포함하며,
여기서,
Figure 112013017477105-pat00034
이고, Jc는 상기 근거리 제약 조건이고, η는 학습률이고, 그리고 λ는 상기 근거리 제약 조건의 가중치인 것을 특징으로 하는 암묵 신호 추출 방법.
5. The method of claim 4,
Wherein the demixing comprises:
Cost function
Figure 112013017477105-pat00032
(W) of the demixing filter using the learning rule
Figure 112013017477105-pat00033
Calculating the transfer function of the demixing filter repeatedly according to the transfer function of the demixing filter; And
And demixing the received signal using a transfer function of the demixing filter,
here,
Figure 112013017477105-pat00034
, Jc is the near limit constraint, η is the learning rate, and λ is the weight of the near limit constraint.
제5항에 있어서,
상기 근거리 제약 조건은
Figure 112013017477105-pat00035
로 표현되는 것을 특징으로 하는 암묵 신호 추출 방법.
6. The method of claim 5,
The near constraint
Figure 112013017477105-pat00035
Wherein the first and second signals are represented by the following equation:
주파수 영역에서 특정 방향에 위치하는 음원으로부터의 신호(y)를 추출하는 디믹싱 시스템에 있어서,
상기 특정 방향에 위치하는 음원을 포함하는 2개 이상의 음원으로부터의 신호가 혼합되어 수신되는 신호 수신부; 및
상기 수신된 신호의 비-가우스 함수 특성을 이용하되, 상기 방향의 정보를 이용하여 상기 수신된 신호를 디믹싱하는 디믹싱 필터;를 포함하며,
상기 필터 파라미터 산출부는:
비용함수
Figure 112014050467360-pat00050
를 이용하여 상기 디믹싱 필터의 전달함수(W)를 산출하되, 학습규칙
Figure 112014050467360-pat00051
에 따라 반복적으로 상기 전달함수를 산출하며,
여기서,
Figure 112014050467360-pat00052
이고 η는 학습률인 것을 특징으로 하는 방향 정보를 이용한 암묵 신호 추출을 위한 디믹싱 시스템.
A demixing system for extracting a signal (y) from a sound source located in a specific direction in a frequency domain,
A signal receiving unit in which signals from two or more sound sources including a sound source located in the specific direction are mixed and received; And
And a demixing filter for demultiplexing the received signal using the non-Gaussian characteristic of the received signal,
Wherein the filter parameter calculator comprises:
Cost function
Figure 112014050467360-pat00050
(W) of the demixing filter using the learning rule
Figure 112014050467360-pat00051
The transfer function is repeatedly calculated in accordance with the transfer function,
here,
Figure 112014050467360-pat00052
And? Is a learning rate. The demixing system for blind signal extraction using direction information.
제7항에 있어서,
상기 방향의 정보를 이용하여 상기 디믹싱 필터의 전달함수(W)를 초기화하여 상기 전달함수를 산출하는 필터 파라미터 산출부를 더 포함하는 것을 특징으로 하는 방향 정보를 이용한 암묵 신호 추출을 위한 디믹싱 시스템.
8. The method of claim 7,
Further comprising a filter parameter calculator for calculating the transfer function by initializing a transfer function (W) of the demixing filter using information in the direction.
삭제delete 주파수 영역에서 특정 방향에 위치하는 음원으로부터의 신호(y)를 추출하는 디믹싱 시스템에 있어서,
2개 이상의 음원으로부터의 신호가 혼합되어 수신되는 2개 이상의 신호 수신부;
상기 수신된 신호의 비-가우스 함수 특성을 이용하여 상기 수신된 신호를 디믹싱하는 디믹싱 필터; 및
주파수 영역에서 믹싱 필터의 전달함수의 평탄도를 나타내는 근거리 제약 조건을 이용하여 디믹싱 필터의 전달함수(W)를 산출하기 위해 반복적으로 학습을 수행하는 필터 파라미터 산출부를 포함하며,
상기 반복적으로 학습이 수행됨에 따라 상기 2개 이상의 신호 수신부로의 신호 도달 지연시간(τ)의 값이 적응적으로 갱신되는 것을 특징으로 하는 암묵 신호 추출을 위한 디믹싱 시스템.
A demixing system for extracting a signal (y) from a sound source located in a specific direction in a frequency domain,
Two or more signal receiving units in which signals from two or more sound sources are mixed and received;
A demixing filter for demultiplexing the received signal using a non-Gaussian function characteristic of the received signal; And
And a filter parameter calculator that repeatedly performs learning to calculate a transfer function (W) of the demixing filter using a near-field constraint expressing the flatness of the transfer function of the mixing filter in the frequency domain,
And the value of the signal arrival delay time (τ) to the two or more signal receiving units is adaptively updated as the learning is repeatedly performed.
제10항에 있어서,
상기 필터 파라미터 산출부는:
비용함수
Figure 112013017477105-pat00039
를 이용하여 상기 디믹싱 필터의 전달함수(W)를 산출하되, 학습규칙
Figure 112013017477105-pat00040
에 따라 반복적으로 상기 디믹싱 필터의 전달함수를 산출하고,
여기서,
Figure 112013017477105-pat00041
이고, Jc는 상기 근거리 제약 조건이고, η는 학습률이고 λ는 상기 근거리 제약 조건의 가중치인 것을 특징으로 하는 암묵 신호 추출을 위한 디믹싱 시스템.
11. The method of claim 10,
Wherein the filter parameter calculator comprises:
Cost function
Figure 112013017477105-pat00039
(W) of the demixing filter using the learning rule
Figure 112013017477105-pat00040
The transfer function of the demixing filter is repeatedly calculated according to Equation
here,
Figure 112013017477105-pat00041
, Jc is the near-field constraint,? Is the learning rate, and? Is the weight of the near-field constraint.
제11항에 있어서,
상기 근거리 제약 조건은
Figure 112013017477105-pat00042
로 표현되는 것을 특징으로 하는 암묵 신호 추출을 위한 디믹싱 시스템.
12. The method of claim 11,
The near constraint
Figure 112013017477105-pat00042
Wherein the demixing signal is expressed by the following equation: " (1) "
KR1020130020917A 2013-02-27 2013-02-27 Blind source extraction method using direction of arrival information and de-mixing system therefor KR101463955B1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020130020917A KR101463955B1 (en) 2013-02-27 2013-02-27 Blind source extraction method using direction of arrival information and de-mixing system therefor
PCT/KR2014/001630 WO2014133338A1 (en) 2013-02-27 2014-02-27 Blind signal extraction method using direction of arrival information and de-mixing system therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020130020917A KR101463955B1 (en) 2013-02-27 2013-02-27 Blind source extraction method using direction of arrival information and de-mixing system therefor

Publications (2)

Publication Number Publication Date
KR20140106823A KR20140106823A (en) 2014-09-04
KR101463955B1 true KR101463955B1 (en) 2014-11-21

Family

ID=51428532

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020130020917A KR101463955B1 (en) 2013-02-27 2013-02-27 Blind source extraction method using direction of arrival information and de-mixing system therefor

Country Status (2)

Country Link
KR (1) KR101463955B1 (en)
WO (1) WO2014133338A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106483502A (en) * 2016-09-23 2017-03-08 科大讯飞股份有限公司 A kind of sound localization method and device

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101721424B1 (en) * 2015-12-31 2017-03-31 서강대학교산학협력단 Reverberation_robust multiple sound source localization based independent component analysis

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100066916A (en) * 2008-12-10 2010-06-18 한국전자통신연구원 Method for separating noise from audio signal
KR20110121955A (en) * 2010-05-03 2011-11-09 한국과학기술원 Method and apparatus for blind source extraction

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100066916A (en) * 2008-12-10 2010-06-18 한국전자통신연구원 Method for separating noise from audio signal
KR20110121955A (en) * 2010-05-03 2011-11-09 한국과학기술원 Method and apparatus for blind source extraction

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106483502A (en) * 2016-09-23 2017-03-08 科大讯飞股份有限公司 A kind of sound localization method and device
CN106483502B (en) * 2016-09-23 2019-10-18 科大讯飞股份有限公司 A kind of sound localization method and device

Also Published As

Publication number Publication date
KR20140106823A (en) 2014-09-04
WO2014133338A1 (en) 2014-09-04

Similar Documents

Publication Publication Date Title
WO2015013698A1 (en) Microphone calibration
CN102576543A (en) Multi-input noise suppresion device, multi-input noise suppression method, program, and integrated circuit
Heusdens et al. Distributed MVDR beamforming for (wireless) microphone networks using message passing
JP7027365B2 (en) Signal processing equipment, signal processing methods and programs
CN108364659A (en) Frequency domain convolution Blind Signal Separation method based on multiple-objection optimization
JP6763721B2 (en) Sound source separator
US20170118555A1 (en) Adaptive phase-distortionless magnitude response equalization (mre) for beamforming applications
Ribeiro et al. Identification of separable systems using trilinear filtering
US10679642B2 (en) Signal processing apparatus and method
Huemmer et al. Estimating parameters of nonlinear systems using the elitist particle filter based on evolutionary strategies
KR101463955B1 (en) Blind source extraction method using direction of arrival information and de-mixing system therefor
Wang et al. Sparse multipath channel estimation using norm combination constrained set-membership NLMS algorithms
Gannot Speech processing utilizing the Kalman filter
KR101658001B1 (en) Online target-speech extraction method for robust automatic speech recognition
KR101356040B1 (en) Blind source extraction method in frequency domain and de-mixing system therefor
JP6644356B2 (en) Sound source separation system, method and program
KR101721424B1 (en) Reverberation_robust multiple sound source localization based independent component analysis
KR20120133038A (en) Blind source separation method and apparatus
van Waterschoot et al. Embedded optimization algorithms for multi-microphone dereverberation
Hosseini et al. A novel noise cancellation method for speech enhancement using variable step-size adaptive algorithm
Houda et al. Blind audio source separation: state-of-art
Zhou et al. Two stage DOA and fundamental frequency estimation based on subspace techniques
KR20110063250A (en) Methods for separating mixed sigals
US11620985B2 (en) Pattern recognition robust to influence of a transfer path
Mahdikhani et al. Speed up ICA algorithm without loss of quality using DR-LCO algorithm

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20171026

Year of fee payment: 4