WO2024014797A1

WO2024014797A1 - 강인한 음성인식을 위한 타겟 마스크 및 독립성분분석 기반의 실시간 빔포밍 및 방향 벡터 추정 방법

Info

Publication number: WO2024014797A1
Application number: PCT/KR2023/009726
Authority: WO
Inventors: 박형민; 신의협
Original assignee: 서강대학교산학협력단
Priority date: 2022-07-14
Filing date: 2023-07-10
Publication date: 2024-01-18
Also published as: KR20240009758A

Abstract

본 발명의 실시예에 따른 빔포밍 및 방향 벡터 추정 시스템은 입력 제공부, 디믹싱 제공부 및 결과 제공부를 포함할 수 있다. 입력 제공부는 타겟지점에서의 타겟신호 및 노이즈 신호에 상응하는 공간전달함수에 기초하여 마이크들의 입력신호를 제공할 수 있다. 디믹싱 제공부는 마이크들의 입력신호 및 공간 제약 조건이 걸린 독립성분 분석(Independent Component Analysis, ICA)에 따라 결정되는 디믹싱 행렬을 제공할 수 있다. 결과 제공부는 디믹싱 행렬에 기초하여 마이크들의 입력신호로부터 결과신호를 추출할 수 있다. 본 발명에 따른 빔포밍 및 방향 벡터 추정 시스템에서는, 복수의 제한조건들을 포함하는 비용함수를 이용해서 디믹싱 행렬을 산출함으로써 타겟지점으로부터 발생되는 타겟신호를 원하는 채널에 고정적으로 왜곡없이 추출할 수 있다.

Description

강인한 음성인식을 위한 타겟 마스크 및 독립성분분석 기반의 실시간 빔포밍 및 방향 벡터 추정 방법

본 발명은 음성 인식 시스템에서의 타겟 음원에 대한 빔포밍 및 방향 벡터 추정 시스템에 관한 것으로서, 더욱 구체적으로는 목표 마스크와 독립 성분 분석에 기반하여 타겟 음원과 노이즈에 대한 모델을 동시에 고려하여 빔포밍 및 방향 벡터 추정에 대한 성능을 향상시킬 수 있는 방법에 관한 것이다.

마이크를 통해서 입력되는 마이크들의 입력신호는 음성인식에 필요한 타겟 음성뿐만 아니라 음성인식에 방해가 되는 노이즈들이 포함될 수 있다. 마이크들의 입력신호에서 노이즈를 제거하고, 원하는 타겟 음성만을 추출하여 음성인식의 성능을 높이기 위한 다양한 연구가 진행되고 있다.

본 발명이 이루고자 하는 기술적 과제는 복수의 제한조건들을 추가적으로 포함하는 비용함수를 이용해서 디믹싱 행렬을 산출함으로써 타겟지점으로부터 발생되는 타겟신호를 왜곡없이 추출할 수 있는 빔포밍 및 방향 벡터 추정 시스템을 제공하는 것이다.

이러한 과제를 해결하기 위하여 본 발명의 실시예에 따른 빔포밍 및 방향 벡터 추정 시스템은 입력 제공부, 디믹싱 제공부 및 결과 제공부를 포함할 수 있다. 입력 제공부는 타겟지점에서의 타겟신호 및 노이즈 신호에 상응하는 공간전달함수에 기초하여 마이크들의 입력신호를 제공할 수 있다. 디믹싱 제공부는 상기 마이크들의 입력신호 및 독립성분 분석(Independent Component Analysis, ICA)에 따라 결정되는 디믹싱 행렬을 제공할 수 있다. 결과 제공부는 상기 디믹싱 행렬에 기초하여 상기 마이크들의 입력신호로부터 결과신호를 추출할 수 있다.

일 실시예에 있어서, 상기 공간전달함수는 상기 타겟 지점으로부터 상기 입력제공부까지의 전달함수에 해당하는 방향 벡터 및 상기 노이즈 신호가 상기 입력제공부까지 전달되기까지의 전달함수에 해당하는 노이즈 전달함수를 포함할 수 있다.

일 실시예에 있어서, 상기 디믹싱 행렬

에 포함되는 제1 성분

과 상기 공간전달함수에 포함되는 방향 벡터

의 곱은 1이고, 상기 디믹싱 행렬에 포함되는 상기 제1 성분을 제외한 나머지 성분

과 상기 방향 벡터

의 곱은 0일 수 있다.

일 실시예에 있어서, 상기 디믹싱 행렬은 상기 독립성분 분석에 따른 비용함수(Cost Function, CF)에 기초하여 결정될 수 있다.

일 실시예에 있어서, 상기 마이크들의 입력신호 및 상기 디믹싱 행렬에 기초하여 생성되는 결과 행렬의 제1 성분은 상기 타겟 신호에 상응할 수 있다.

일 실시예에 있어서, 상기 비용함수는 [수학식1]과 같이 표현되고,

[수학식1]

여기서,

는 비용함수, k 및 m은 각각 주파수 및 채널 인덱스를 나타내는 자연수,

는 독립성분 분석의 비용함수,

및

는 각각 왜곡 방지 및 널 조건의 제약 정도를 조절하는 파라미터,

는 디믹싱 행렬의 제1 성분,

는 방향 벡터일 수 있다.

일 실시예에 있어서, 상기 비용함수는 [수학식2]과 같이 표현되고,

[수학식2]

여기서,

및

는 각각 왜곡 방지 및 널 조건을 보장하기 위한 라그랑즈 승수,

는 디믹싱 행렬의 제1 성분,

는 방향 벡터일 수 있다.

일 실시예에 있어서, 상기 비용함수는 [수학식3]과 같이 표현되고,

[수학식3]

여기서,

는 왜곡 방지 조건을 보장하기 위한 라그랑즈 승수,

는 디믹싱 행렬의 제1 성분,

는 방향 벡터,

는 널 조건의 제약 정도를 조절하는 파라미터일 수 있다.

일 실시예에 있어서, 상기 타겟신호에 대한 상기 결과신호는 라플라시안 함수에 따라 분포될 수 있다.

일 실시예에 있어서, 상기 방향 벡터는 상기 마이크들의 입력신호에 대한 공간 공분산 행렬(Input Spatial Covariance Matrix, ISCM)) 및 상기 노이즈 신호에 대한 공간 공분산 행렬(Noise Spatial Covariance Matrix, NSCM))의 차에 따라 결정될 수 있다.

일 실시예에 있어서, 상기 노이즈 신호에 대한 공간 공분산 행렬은 상기 결과신호 중 상기 타겟 신호에 상응하는 값과 상기 노이즈 신호에 상응하는 값의 비율에 따라 결정될 수 있다.

일 실시예에 있어서, 상기 빔포밍 및 방향 벡터 추정 시스템은 일정한 시간간격에 해당하는 프레임마다 구동되어 상기 디믹싱 행렬을 업데이트할 수 있다.

이러한 과제를 해결하기 위하여 본 발명의 실시예에 따른 빔포밍 및 방향 벡터 추정 시스템은 입력 제공부, 디믹싱 제공부, 결과 제공부 및 음성 제공부를 포함할 수 있다. 입력 제공부는 타겟지점에서의 타겟신호 및 노이즈 신호에 상응하는 공간전달함수에 기초하여 마이크들의 입력신호를 제공할 수 있다. 디믹싱 제공부는 상기 마이크들의 입력신호 및 독립성분 분석(Independent Component Analysis, ICA)에 따라 결정되는 디믹싱 행렬을 제공할 수 있다. 결과 제공부는 상기 디믹싱 행렬에 기초하여 상기 마이크들의 입력신호로부터 결과신호를 추출할 수 있다. 음성 제공부는 상기 결과신호를 음성으로 제공할 수 있다.

이러한 과제를 해결하기 위하여 본 발명의 실시예에 따른 빔포밍 및 방향 벡터 추정 시스템의 동작방법에서는, 입력 제공부가 타겟지점에서의 타겟신호 및 노이즈 신호의 각각에 상응하는 공간전달함수에 기초하여 마이크들의 입력신호를 제공할 수 있다. 디믹싱 제공부가 상기 마이크들의 입력신호 및 독립성분 분석(Independent Component Analysis, ICA)에 따라 결정되는 디믹싱 행렬을 제공할 수 있다. 결과 제공부가 상기 디믹싱 행렬에 기초하여 상기 마이크들의 입력신호로부터 결과신호를 추출할 수 있다.

이러한 과제를 해결하기 위하여 본 발명의 실시예에 따른 빔포밍 및 방향 벡터 추정 시스템의 동작방법에서는, 입력 제공부가 타겟지점에서의 타겟신호 및 노이즈 신호의 각각에 상응하는 공간전달함수에 기초하여 마이크들의 입력신호를 제공할 수 있다. 디믹싱 제공부가 상기 마이크들의 입력신호 및 독립성분 분석(Independent Component Analysis, ICA)에 따라 결정되는 디믹싱 행렬을 제공할 수 있다. 결과 제공부가 상기 디믹싱 행렬에 기초하여 상기 마이크들의 입력신호로부터 결과신호를 추출할 수 있다. 음성 제공부가 상기 결과신호를 음성으로 제공할 수 있다.

위에서 언급된 본 발명의 기술적 과제 외에도, 본 발명의 다른 특징 및 이점들이 이하에서 기술되거나, 그러한 기술 및 설명으로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.

이상과 같은 본 발명에 따르면 다음과 같은 효과가 있다.

본 발명에 따른 빔포밍 및 방향 벡터 추정 시스템에서는, 복수의 제한조건들을 포함하는 비용함수를 이용해서 디믹싱 행렬을 산출함으로써 타겟지점으로부터 발생되는 타겟신호를 왜곡없이 추출할 수 있다. 그리고 타겟 신호뿐만 아니라 노이즈 신호에 상응하는 값을 사용하여 방향 벡터를 효과적으로 추정할 수 있다.

이 밖에도, 본 발명의 실시 예들을 통해 본 발명의 또 다른 특징 및 이점들이 새롭게 파악될 수도 있을 것이다.

도 1은 본 발명의 실시예들에 따른 빔포밍 및 방향 벡터 추정 시스템을 나타내는 도면이다.

도 2는 도 1의 빔포밍 및 방향 벡터 추정 시스템에 적용되는 마이크들의 입력신호를 설명하기 위한 도면이다.

도 3은 도 1의 빔포밍 및 방향 벡터 추정 시스템에서 사용되는 공간전달함수를 설명하기 위한 도면이다.

도 4 및 5는 도 1의 빔포밍 및 방향 벡터 추정 시스템의 온라인 동작을 설명하기 위한 도면들이다.

도 6은 도 1의 빔포밍 및 방향 벡터 추정 시스템의 일 실시예를 설명하기 위한 도면이다.

도 7은 본 발명의 실시예들에 따른 빔포밍 및 방향 벡터 추정 시스템의 동작방법을 나타내는 도면이다.

도 8은 도 7의 빔포밍 및 방향 벡터 추정 시스템의 동작방법의 일 실시예를 설명하기 위한 도면이다.

본 명세서에서 각 도면의 구성 요소들에 참조번호를 부가함에 있어서 동일한 구성 요소들에 한해서는 비록 다른 도면상에 표시되더라도 가능한한 동일한 번호를 가지도록 하고 있음에 유의하여야 한다.

한편, 본 명세서에서 서술되는 용어의 의미는 다음과 같이 이해되어야 할 것이다.

단수의 표현은 문맥상 명백하게 다르게 정의하지 않는 한, 복수의 표현을 포함하는 것으로 이해되어야 하는 것으로, 이들 용어들에 의해 권리범위가 한정되어서는 아니 된다.

"포함하다" 또는 "가지다" 등의 용어는 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

이하, 첨부되는 도면을 참고하여 상기 문제점을 해결하기 위해 고안된 본 발명의 바람직한 실시예들에 대해 상세히 설명한다.

도 1은 본 발명의 실시예들에 따른 빔포밍 및 방향 벡터 추정 시스템을 나타내는 도면이고, 2는 도 1의 빔포밍 및 방향 벡터 추정 시스템에 적용되는 마이크들의 입력신호를 설명하기 위한 도면이고, 도 3은 도 1의 빔포밍 및 방향 벡터 추정 시스템에서 사용되는 공간전달함수를 설명하기 위한 도면이다.

도 1 내지 3을 참조하면, 본 발명의 실시예에 따른 빔포밍 및 방향 벡터 추정 시스템(10)은 입력 제공부(100), 디믹싱 제공부(200) 및 결과 제공부(300)를 포함할 수 있다. 입력 제공부(100)는 타겟지점(TP)에서의 타겟신호(TS) 및 노이즈 신호(NS)에 상응하는 공간전달함수(A)에 기초하여 마이크들의 입력신호(XS)를 제공할 수 있다. 예를 들어, 입력 제공부(100)는 복수의 마이크들일 수 있다. 복수의 마이크들은 제1 마이크(101) 내지 제3 마이크(103)를 포함할 수 있다. 공간전달함수(A)는 타겟신호(TS)가 타겟지점(TP)으로부터 입력 제공부(100)까지 전달되기까지의 전달함수에 해당하는 방향 벡터(Steering Vector)(H) 및 노이즈 신호(NS)가 입력 제공부(100)까지 전달되기까지의 전달함수에 해당하는 노이즈 전달함수(D)를 포함할 수 있다. 이 경우, 마이크들의 입력신호(XS)는 아래와 같이 [수학식1-1]로 표현될 수 있다.

[수학식1-1]

여기서,

는 마이크들의 입력신호(XS),

는 공간전달함수(A),

는 타겟신호(TS),

는 노이즈 신호(NS),

방향 벡터(H),

는 노이즈 전달함수(D),

는 주파수 인덱스,

는 프레임 인덱스일 수 있다.

디믹싱 제공부(200)는 마이크들의 입력신호(XS) 및 독립성분 분석(Independent Component Analysis, ICA)에 따라 결정되는 디믹싱 행렬(W)를 제공할 수 있다.

일 실시예에 있어서, 디믹싱 행렬(W)는 독립성분 분석 및 공간 제약 조건에 따른 비용함수(Cost Function, CF)에 기초하여 결정될 수 있다. 공간 제약 조건은 [수학식 1-1]과 이후 후술할 [수학식 4]에 의해서 각각 왜곡 방지 조건(

)과 널 조건(

)으로 표현될 수 있다. 예를 들어, 비용함수는 아래의 [수학식1], [수학식2] 및 [수학식3]으로 표현될 수 있다.

[수학식1]

여기서,

는 독립성분 분석의 비용함수,

및

는 각각 왜곡 방지 및 널 조건의 제약 정도를 조절하는 파라미터

와

는 디믹싱 행렬(W)의 제1 및 m 성분,

는 방향 벡터(H) 일 수 있다. 한편 비용함수

를 구성하는 기본적인 독립성분 분석의 기존 비용함수

는 아래의 [수학식1-2]로 표현될 수 있다.

[수학식1-2]

여기서, k 및 m은 주파수 및 채널 인덱스를 나타내는 자연수,

와

는 디믹싱 행렬(W)의 제1 및 m 성분,

는 디믹싱 행렬(W),

와

는 각각 타겟 신호와 노이즈 신호의 모델링에 따라 결정되는 가중 공간 공분산 행렬(Weighted Spatial Covariance Matrix, WSCM)을 나타낼 수 있다. [수학식1] 을 최적화 하는 디믹싱 행렬(W)의 제 1 성분

는 아래와 같은 [수학식1-3]에 의해 반복적으로 수렴 추정할 수 있다.

[수학식1-3]

여기서, k는 주파수 인덱스를 나타내는 자연수,

는 타겟 신호에 대한 가중 공간 공분산 행렬(Weighted Spatial Covariance Matrix, WSCM),

는 왜곡 방지 조건의 제약 정도를 조절하는 파라미터,

는 방향 벡터(H),

는 디믹싱 행렬(W)의 제1 성분일 수 있다. 그리고 [수학식1]을 최적화하는 디믹싱 행렬(W)의 제 m 성분

은 아래와 같이 [수학식1-4]에 의해 반복적으로 수렴 추정할 수 있다.

[수학식1-4]

여기서, k는 주파수 인덱스를 나타내는 자연수,

는 노이즈 신호에 대한 가중 공간 공분산 행렬(Weighted Spatial Covariance Matrix, WSCM),

는 널 조건의 제약 정도를 조절하는 파라미터,

는 방향 벡터(H),

는 디믹싱 행렬(W),

는 디믹싱 행렬(W)의 제 m 성분일 수 있다.

[수학식2]

여기서,

는 비용함수, k 및 m은 주파수 및 채널 인덱스를 나타내는 자연수,

는 독립성분 분석의 비용함수,

및

와

는 디믹싱 행렬(W)의 제1 및 m 성분,

는 방향 벡터(H)일 수 있다. 그리고 [수학식2] 을 최적화 하는 디믹싱 행렬(W)의 제 1 성분

는 아래와 같은 [수학식2-1]에 의해 반복적으로 수렴 추정할 수 있다.

[수학식2-1]

여기서, k는 주파수 인덱스를 나타내는 자연수,

는 방향 벡터(H),

는 디믹싱 행렬(W)의 제1 성분일 수 있다. 그리고 [수학식2]을 최적화하는 디믹싱 행렬(W)의 제 m 성분

은 아래와 같이 [수학식2-2]에 의해 반복적으로 수렴 추정할 수 있다.

[수학식2-2]

여기서, k는 주파수 인덱스를 나타내는 자연수,

는 방향 벡터(H),

는 디믹싱 행렬(W),

는 디믹싱 행렬(W)의 제 m 성분일 수 있다.

[수학식3]

여기서,

는 독립성분 분석의 비용함수,

는 왜곡 방지 조건을 보장하기 위한 라그랑즈 승수,

와

는 디믹싱 행렬(W)의 제1 및 m 성분,

는 방향 벡터(H),

는 널 조건의 제약 정도를 조절하는 파라미터일 수 있다. 그리고 [수학식3] 을 최적화 하는 디믹싱 행렬(W)의 제 1 성분

는 아래와 같은 [수학식3-1]에 의해 반복적으로 수렴 추정할 수 있다.

[수학식3-1]

여기서, k는 주파수 인덱스를 나타내는 자연수,

는 방향 벡터(H),

는 디믹싱 행렬(W)의 제1 성분일 수 있다. 그리고 [수학식3]을 최적화하는 디믹싱 행렬(W)의 제 m 성분

은 아래와 같이 [수학식3-2]에 의해 반복적으로 수렴 추정할 수 있다.

[수학식3-2]

여기서, k는 주파수 인덱스를 나타내는 자연수,

는 널 조건의 제약 정도를 조절하는 파라미터,

는 방향 벡터(H),

는 디믹싱 행렬(W),

는 디믹싱 행렬(W)의 제 m 성분일 수 있다.

[수학식1], [수학식2] 및 [수학식3]에 표현되는 바와 같이 각 수학식에서

이후에 배치되는 제한조건들을 비용함수에 적용함으로써 디믹싱 행렬(W)에 기초하여 제공되는 결과신호(RS)를 포함하는 행렬의 제1 채널(성분)을 타겟신호(TS)에 대한 결과로 고정할 수 있고, 타겟신호(TS)에 대한 왜곡도 감소시킬 수 있다. 또한, [수학식1]에서의 파라미터

에 의해서 조절되는 제한적인 정도의 왜곡 방지 조건을 가지는 제곱항으로 인하여 발생할 수 있는 음성의 왜곡을 감소시키기 위하여 [수학식3]은 [수학식1]과 [수학식2]를 하이브리드 형태로 조합하여 구성한 것일 수 있다. 일 실시예에 있어서, 마이크들의 입력신호(XS) 및 디믹싱 행렬(W)에 기초하여 생성되는 결과 행렬의 제1 성분은 타겟신호(TS)에 상응할 수 있다. 여기서, [수학식1], [수학식2] 및 [수학식3]의

는 [수학식1-2]의

와 동일할 수 있다.

일 실시예에 있어서, 디믹싱 행렬(W)에 포함되는 제1 성분(W1)와 공간전달함수(A)에 포함되는 방향 벡터(H)의 곱은 1이고, 디믹싱 행렬(W)에 포함되는 제1 성분(W1)을 제외한 나머지 성분(Wm)과 방향 벡터(H)의 곱은 0일 수 있다. 이와 같은 내용은 아래의 [수학식4]와 같이 표현될 수 있다.

[수학식4]

여기서,

는 타겟신호(TS)에 상응하는 결과신호(RS),

는 노이즈 신호(NS)에 상응하는 결과신호(RS),

는 마이크들의 입력신호(XS)일 수 있다.

결과 제공부(300)는 디믹싱 행렬(W)에 기초하여 마이크들의 입력신호(XS)로부터 결과신호(RS)를 추출할 수 있다. 예를 들어, 독립성분 분석(Independent Component Analysis, ICA)을 통해서 비용함수를 최적화하는 경우, 타겟신호(TS)에 대한 결과신호(RS) 및 노이즈 신호(NS)에 대한 결과신호(RS)로 구분되어 제공될 수 있다.

일 실시예에 있어서, 타겟신호(TS)에 대한 결과신호(RS)는 시간에 따라 변하는 분산을 가지는 라플라시안 분포를 따를 수 있다. 예를 들어, 라플라시안 함수에 따라 분포되는 타겟신호(TS)에 상응하는 결과신호(RS)는 아래의 [수학식5]와 같이 모델링될 수 있다.

[수학식5]

,

여기서,

는 타겟신호(TS)에 대한 출력 신호(RS)의 확률밀도함수,

는 타겟신호(TS)의 시간에 따라 변하는 분산,

는 결과신호(RS)일 수 있다. [수학식 5]에 의해서 모델링 된 신호를 통해서 [수학식 1-2]의 타겟에 대한 가중 공간 공분산 행렬

는 아래와 같은 [수학식 5-1]과 같이 계산된다.

[수학식 5-1]

여기서, k는 주파수 인덱스를 나타내는 자연수,

는 전체 프레임의 개수,

는 타겟신호(TS)에 대한 가중 공간 공분산 행렬(Weighted Spatial Covariance Matrix, WSCM),

는 가중치 함수,

는 미리 정해진 마스크,

와

는 마이크들의 입력신호(XS)를 나타낼 수 있다. 이러한 라플라시안 분포를 따르도록 모델링된 타겟 신호(TS)로부터 가중치 함수는 결과신호(RS)

와 미리 정해진 마스크

로부터 추정된 시간에 따라 변하는 분산

을 모두 반영하여 계산 될 수 있다. 그리고 노이즈 신호(NS)에 대해서는 아래의 [수학식 5-2]와 같이 모델링 될 수 있다.

[수학식 5-2]

여기서,

는 노이즈 신호(NS)에 대한 출력 신호의 확률 밀도 함수,

는 노이즈 신호(NS)에 대한 출력 신호일 수 있다. 이에 따라서 [수학식 1-2]의 노이즈에 대한 가중 공간 공분산 행렬

는 아래의 [수학식 5-3]과 같이 계산된다.

[수학식 5-3]

여기서, k는 주파수 인덱스를 나타내는 자연수,

는 전체 프레임의 개수,

는 노이즈 신호(NS)에 대한 가중 공간 공분산 행렬(Weighted Spatial Covariance Matrix, WSCM),

는 노이즈 신호(NS)에 대한 가중치 함수,

는 마이크들의 입력신호(XS)를 나타낼 수 있다.

일 실시예에 있어서, 방향 벡터(H)는 마이크들의 입력신호(XS)에 대한 공간 공분산 행렬(Input Spatial Covariance Matrix, ISCM)) 및 노이즈 신호(NS)에 대한 공간 공분산 행렬(Noise Spatial Covariance Matrix, NSCM)의 차에 따라 결정될 수 있다. 또 다른 실시예에 있어서, 노이즈 신호(NS)에 대한 공간 공분산 행렬(NSCM)는 결과신호(RS) 중 타겟신호(TS)에 상응하는 값과 노이즈 신호(NS)에 상응하는 값의 비율에 따라 결정될 수 있다. 예를 들어, 방향 벡터(H)를 추정하는 방식은 아래의 [수학식6]과 같이 표시될 수 있다.

[수학식6]

여기서,

는 마이크들의 입력신호(XS)에 대한 공간 공분산 행렬(ISCM)),

는 타겟신호(TS)에 대한 공간 공분산 행렬(TSCM),

는 노이즈 신호(NS)에 대한 공간 공분산 행렬(NSCM),

는 입력 성분 중 노이즈 성분의 기여도를 나타내는 비율일 수 있다. 그리고 방향 벡터 추정에 있어서

는 아래의 [수학식6-1]과 같이 마이크들의 입력신호(XS)에 고정된 외부 마스크의 제곱근 값을 곱한 것으로 대체될 수 있다.

[수학식6-1]

이러한 타겟 신호(TS)에 대한 공간 공분산 행렬

로부터 주요 아이젠 벡터를 추출함으로써 방향 벡터를 추정할 수 있다.

도 4 및 5는 도 1의 빔포밍 및 방향 벡터 추정 시스템의 온라인 동작을 설명하기 위한 도면들이고, 도 6은 도 1의 빔포밍 및 방향 벡터 추정 시스템의 일 실시예를 설명하기 위한 도면이다.

도 1 내지 6을 참조하면, 본 발명에 따른 빔포밍 및 방향 벡터 추정 시스템(10)은 온라인으로 동작할 수도 있다. 이 경우, 빔포밍 및 방향 벡터 추정 시스템(10)은 일정한 시간간격에 해당하는 프레임마다 디믹싱 행렬(W)를 업데이트할 수 있다. 예를 들어, 복수의 시간들은 제1 시간(T1) 내지 제4 시간(T4)을 포함할 수 있고, 복수의 시간간격은 제1 프레임 간격(FI1) 내지 제3 프레임 간격(FI3)을 포함할 수 있다. 제1 프레임 간격(FI1)은 제1 시간(T1)부터 제2 시간(T2)까지의 시간간격일 수 있고, 제2 프레임 간격(FI2)은 제2 시간(T2)부터 제3 시간(T3)까지의 시간간격일 수 있다. 또한, 제3 프레임 간격(FI3)은 제3 시간(T3)부터 제4 시간(T4)까지의 시간간격일 수 있다. 이 경우, 본 발명에 따른 빔포밍 및 방향 벡터 추정 시스템(10)은 제1 프레임 간격(FI1)동안 디믹싱 행렬(W)를 업데이트하고, 제2 프레임 시간간격동안 다시 디믹싱 행렬(W)를 업데이트할 수 있다. 여기서, 도 5에 도시되는 바와 같이 디믹싱 행렬(W)를 업데이트하는 과정에서 최근 프레임에 대해서 가중치(WT)를 점진적으로 높여 적용하는 경우, 빔포밍 및 방향 벡터 추정 시스템(10)의 성능을 높일 수 있다. 이 경우, 제 t 프레임 간격 동안의 디믹싱 행렬에 기초하여 마이크들의 입력신호(XS)로부터 결과신호(RS)를 아래의 [수학식7]과 같이 추출할 수 있다.

[수학식7]

여기서,

는 t-1프레임 간격 동안 추정된 디믹싱 행렬(W)을 통해서 추정된 t프레임 간격의 타겟신호(TS)에 상응하는 결과신호(RS),

는 t-1 프레임 간격 동안 추정된 디믹싱 행렬의 제1 채널(성분),

는 마이크들의 입력신호(XS)일 수 있다.

일 실시예에 있어서, t프레임 간격에서의 디믹싱 행렬(W)을 추정하기 위해서 독립성분 분석(Independent Component Analysis, ICA)의 비용함수에 해당하는 [수학식1-2]의

는 t번째 프레임에서 정의되는 아래의 [수학식8]의

로 대체될 수 있다.

[수학식8]

여기서, k 및 m는 주파수 및 채널 인덱스를 나타내는 자연수,

와

는 t번째 프레임에서 추정되는 디믹싱 행렬(W)의 제 1 및 m성분,

는 t번째 프레임에서 추정되는 디믹싱 행렬(W),

와

는 각각 타겟 신호(TS)와 노이즈 신호(RS)의 모델링에 따라 결정되는 t번째 프레임에서의 가중 공간 공분산 행렬(Weighted Spatial Covariance Matrix, WSCM),

는 망각인자(forgetting factor),

는 마이크들의 입력신호(XS)를 나타낼 수 있다. 이러한 가중 공간 공분산 행렬은 아래의 [수학식 8-1]과 같이 재귀적으로 온라인 업데이트를 수행할 수 있다.

[수학식8-1]

여기서, k는 주파수 인덱스를 나타내는 자연수,

와

는 각각 t번째와 t-1번째 프레임에서 추정되는 가중 공간 공분산 행렬(Weighted Spatial Covariance Matrix, WSCM),

는 망각인자(forgetting factor),

는 가중치 함수,

는 마이크들의 입력신호(XS)일 수 있다. 그리고 t번째프레임에서의 가중 공간 공분산 행렬(Weighted Spatial Covariance Matrix, WSCM)의 역행렬을

로 나타낼 때, 아래의 [수학식8-2]와 같이 재귀적으로 역행렬의 업데이트를 곧바로 수행할 수 있다.

[수학식8-2]

여기서,

와

는 각각 t번째와 t-1번째 프레임에서 추정되는 가중 공간 공분산 행렬(Weighted Spatial Covariance Matrix, WSCM)의 역행렬,

는 망각인자(forgetting factor),

는 가중치 함수,

는 마이크들의 입력신호(XS)일 수 있다. 그리고, 타겟신호(TS)및 노이즈신호(NS)에 대한 결과신호(RS)가 각각 [수학식5]와 [수학식5-2] 같이 라플라시안 분포를 따를 수 있다. [수학식5]의 라플라시안 함수에 따라 분포되는 타겟신호(TS)에 상응하는 결과신호(RS)를 온라인으로 업데이트하고자 기존의 [수학식5-1]와 [수학식5-3]을 대신하여 아래의 [수학식8-3]와 같이 온라인으로 업데이트 될 수 있다.

[수학식8-3]

여기서,

와

는 각각 타겟신호(TS)및 노이즈신호(NS)에 대한 가중치 함수,

는 타겟신호(TS)의 시간에 따라 변하는 분산,

는 스무딩 팩터(smoothing factor),

는 미리 정해진 마스크,

는 마이크들의 입력신호(XS)의 대표값,

는 t-1번째 프레임에서 추정한 디믹싱 행렬(W)을 사용한 t번째 타겟신호(TS)에 대응되는 프레임의 결과신호(RS),

는 t-1번째 프레임에서 추정한 디믹싱 행렬(W)을 사용한 t번째 노이즈신호(NS)에 대응되는 프레임의 결과신호(RS)일 수 있다.

일 실시예에 있어서, 온라인 업데이트를 수행하기 위해서 기존의 [수학식1], [수학식2] 및 [수학식3]는 각각 아래의 [수학식9], [수학식10] 및 [수학식11]로 표현될 수 있다.

[수학식9]

여기서,

는 t번째 프레임에서의 비용함수, k 및 m은 각각 주파수 및 채널 인덱스를 나타내는 자연수,

는 t번쨰 프레임에서의 독립성분 분석의 비용함수,

와

는 t번째 프레임에서의 디믹싱 행렬(W)의 제 1 및 m 성분,

는 t번째 프레임에서 추정된 방향 벡터(H)일 수 있다. 그리고 [수학식9]를 최적화하는 디믹싱 행렬(W)의 제 1성분은 아래와 같은 [수학식9-1]에 의해 업데이트할 수 있다.

[수학식9-1]

여기서, k는 주파수 인덱스를 나타내는 자연수,

와

는 타겟 신호에 대한 t번째 프레임에서의 가중 공간 공분산 행렬(Weighted Spatial Covariance Matrix, WSCM)와 이에 대응하는 역행렬,

는 왜곡 방지 조건의 제약 정도를 조절하는 파라미터,

는 t번째 프레임에서의 방향 벡터(H),

는 t번째 프레임에서의 디믹싱 행렬(W)의 제1 성분일 수 있다. 그리고 [수학식9]를 최적화하는 디믹싱 행렬(W)의 제 m성분은 아래와 같이 [수학식9-2]에 의해 업데이트 할 수 있다.

[수학식9-2]

여기서, k는 주파수 인덱스를 나타내는 자연수,

와

는 노이즈 신호에 대한 t번째 프레임에서의 가중 공간 공분산 행렬(Weighted Spatial Covariance Matrix, WSCM)와 이에 대응하는 역행렬,

는 널 조건의 제약 정도를 조절하는 파라미터,

는 t번째 프레임에서의 방향 벡터(H),

는 t번째 프레임에서의 디믹싱 행렬(W)의 제m 성분일 수 있다.

[수학식10]

여기서,

는 t번째 프레임에서의 독립성분 분석의 비용함수,

와

는 t번째 프레임에서 각각 왜곡 방지 및 널 조건을 보장하기 위한 라그랑즈 승수,

와

는 t번째 프레임에서의 디믹싱 행렬(W)의 제1 및 m 성분,

는 t번째 프레임에서 추정된 방향 벡터(H)일 수 있다. 그리고 [수학식10]를 최적화하는 디믹싱 행렬(W)의 제1 성분은 아래와 같은 [수학식10-1]에 의해 업데이트할 수 있다.

[수학식10-1]

여기서, k는 주파수 인덱스를 나타내는 자연수,

는 타겟 신호에 대한 t번째 프레임에서의 가중 공간 공분산 행렬(Weighted Spatial Covariance Matrix, WSCM)의 역행렬,

는 t번째 프레임에서의 방향 벡터(H),

는 t번째 프레임에서의 디믹싱 행렬(W)의 제1 성분일 수 있다. 그리고 [수학식10]를 최적화하는 디믹싱 행렬(W)의 제 m성분은 아래와 같이 [수학식10-2]에 의해 업데이트 할 수 있다.

[수학식10-2]

여기서, k는 주파수 인덱스를 나타내는 자연수,

와

는 t번째 프레임에서의 방향 벡터(H),

[수학식11]

여기서,

는 t번쨰 프레임에서의 독립성분 분석의 비용함수,

는 t번째 프레임에서 왜곡 방지 조건을 보장하기 위한 라그랑즈 승수,

는 널 조건의 제약 정도를 조절하는 파라미터,

와

는 t번째 프레임에서의 디믹싱 행렬(W)의 제1 및 m 성분,

는 t번째 프레임에서 추정된 방향 벡터(H)일 수 있다. 그리고 [수학식11]를 최적화하는 디믹싱 행렬(W)의 제1성분은 아래와 같은 [수학식11-1]에 의해 업데이트할 수 있다.

[수학식11-1]

여기서, k는 주파수 인덱스를 나타내는 자연수,

는 t번째 프레임에서의 방향 벡터(H),

는 t번째 프레임에서의 디믹싱 행렬(W)의 제1 성분일 수 있다. 그리고 [수학식11]를 최적화하는 디믹싱 행렬(W)의 제 m성분은 아래와 같이 [수학식11-2]에 의해 업데이트 할 수 있다.

[수학식11-2]

여기서, k는 주파수 인덱스를 나타내는 자연수,

와

는 널 조건의 제약 정도를 조절하는 파라미터,

는 t번째 프레임에서의 방향 벡터(H),

는 t번째 프레임에서의 디믹싱 행렬(W)의 제 m성분일 수 있다.

[수학식9], [수학식10] 및 [수학식11]에 표현되는 바와 같이 각 수학식에서

이후에 배치되는 제한조건들을 비용함수에 적용함으로써 매 프레임마다 온라인 업데이트 되는 디믹싱 행렬(W)에 기초하여 제공되는 결과신호(RS)를 포함하는 행렬의 제1 채널(성분)을 타겟신호(TS)에 대한 결과로 고정할 수 있고, 타겟신호(TS)에 대한 왜곡도 감소시킬 수 있다. 또한, [수학식1]에서의 파라미터

에 의해서 조절되는 제한적인 정도의 왜곡 방지 조건을 가지는 제곱항으로 인하여 발생할 수 있는 음성의 왜곡을 감소시키기 위하여 [수학식11]은 [수학식9]과 [수학식10]를 하이브리드 형태로 조합하여 구성한 것일 수 있다. 일 실시예에 있어서, 마이크들의 입력신호(XS) 및 매 프레임마다 온라인 업데이트 되는 디믹싱 행렬(W)에 기초하여 생성되는 결과 행렬의 제1 성분은 타겟신호(TS)에 상응할 수 있다. 여기서, [수학식9], [수학식10] 및 [수학식11]의

는 [수학식8]의

와 동일할 수 있다.

일 실시예에 있어서, 방향 벡터(H)는 매 프레임마다 온라인으로 계산되는 마이크들의 입력신호(XS)에 대한 공간 공분산 행렬(Input Spatial Covariance Matrix, ISCM)) 및 노이즈 신호(NS)에 대한 공간 공분산 행렬(Noise Spatial Covariance Matrix, NSCM)의 차에 따라 결정될 수 있다. 또 다른 실시예에 있어서, 노이즈 신호(NS)에 대한 공간 공분산 행렬(NSCM)는 결과신호(RS) 중 타겟신호(TS)에 상응하는 값과 노이즈 신호(NS)에 상응하는 값의 비율에 따라 매 프레임 결정될 수 있다. 예를 들어, 방향 벡터(H)를 추정하는 방식은 아래의 [수학식12]과 같이 표시될 수 있다.

[수학식12]

여기서, k와 m는 각각 주파수 및 채널 인덱스를 나타내는 자연수,

는 t번째 프레임에서 추정되는 디믹싱 행렬(W)의 제 m 성분,

는 t번째 프레임에서 디믹싱 행렬(W)의 역행렬,

는 입력 성분 중 노이즈 성분의 기여도를 나타내는 비율,

는 망각인자(forgetting factor),

는 마이크들의 입력신호(XS),

는 마이크들의 입력신호(XS)에 대한 t번째 프레임에서의 공간 공분산 행렬(ISCM)),

는 노이즈신호(NS)에 대한 t번째 프레임에서의 공간 공분산 행렬(NSCM),

는 0과 1사이의 실수값을 가지는 스케일링 팩터(scaling factor),

는 타겟신호(TS)에 대한 t번째 프레임에서의 공간 공분산 행렬(TSCM)일 수 있다. 그리고 방향 벡터 추정에 있어서

는 아래의 [수학식12-1]과 같이 마이크들의 입력신호(XS)에 고정된 외부 마스크의 제곱근 값을 곱한 것으로 대체될 수 있다.

[수학식12-1]

이러한 타겟 신호(TS)에 대한 공간 공분산 행렬

로부터 주요 아이젠 벡터를 추출함으로써 방향 벡터를 매 구간 프레임마다 온라인으로 추정할 수 있다.

일 실시예에 있어서, 미리 정해진 마스크

를 아래의 [수학식13]과 같이 확산성을 기반으로 하여 매 프레임 추정할 수 있다.

[수학식13]

여기서,

와

는 각각 치우침 및 기울기를 조절하는 파라미터,

는 임의의 마이크들의 입력신호(XS) 쌍

와

대해서 구한 확산성 수치

들의 중간 값일 수 있다. 또 다른 실시예에 있어서, 미리 정해진 마스크

는 미리 학습된 신경망의 출력에 의한 값일 수 있다.

일 실시예에 있어서, 디믹싱 제공부(200) 및 결과제공부(300)의 [수학식4]와 같이 하나의 타겟지점(TP)및 타겟신호(TS)는 아래의 [수학식14]와 같이 복수의 타겟지점(TP)및 타겟신호(TS)로 확장될 수 있다. 예를 들어, 총 N개의 타겟 신호가 있다고 할 때,

[수학식14]

여기서,

는 N개의 타겟신호(TS)에 상응하는 N개의 결과신호(RS),

는 노이즈 신호(NS)에 상응하는 결과신호(RS),

는 마이크들의 입력신호(XS)일 수 있다. 그리고 [수학식1], [수학식2] 및 [수학식3]으로 표현되는 비용함수는 복수의 타겟지점(TP)및 타겟신호(TS)의 경우로 확장될 수 있다. 예를 들어, 총 N개의 타겟 신호가 있다고 할 때, [수학식3]에 대응되는 비용함수는 아래의 [수학식15]로 확장될 수 있다.

[수학식15]

여기서,

는 비용함수, k는 주파수 인덱스를 나타내는 자연수,

는 독립성분 분석의 비용함수,

는 n번째 타겟신호(TS)의 왜곡 방지 조건을 보장하기 위한 라그랑즈 승수

는 디믹싱 행렬(W)의 m 성분,

는 n번째 타겟신호(TS)에 대응되는 방향 벡터(H),

는 널 조건의 제약 정도를 조절하는 파라미터,

는 디믹싱 행렬(W),

와

는 각각 m번째 타겟 신호와 노이즈 신호의 모델링에 따라 결정되는 가중 공간 공분산 행렬(Weighted Spatial Covariance Matrix, WSCM)일 수 있다.

일 실시예에 있어서, 복수의 타겟신호(TS)에 대해 상응하는 복수의 방향 벡터(H)는 마이크들의 입력신호(XS)에 대한 공간 공분산 행렬(Input Spatial Covariance Matrix, ISCM)) 및 노이즈 신호(NS)에 대한 공간 공분산 행렬(Noise Spatial Covariance Matrix, NSCM)의 차에 따라 결정될 수 있다. 또 다른 실시예에 있어서, 노이즈 신호(NS)에 대한 공간 공분산 행렬(NSCM)는 결과신호(RS) 중 타겟신호(TS)에 상응하는 값과 노이즈 신호(NS)에 상응하는 값의 비율에 따라 결정될 수 있다. 예를 들어, 총 N개의 타겟 신호가 있다고 할 때, 복수의 방향 벡터(H)를 추정하는 방식은 [수학식6]과 대응되는 추정 방식은 아래의 [수학식16]과 같이 확장될 수 있다.

[수학식16]

여기서,

는 마이크들의 입력신호(XS)에 대한 공간 공분산 행렬(ISCM)),

는 m번째 타겟신호(TS)에 대한 공간 공분산 행렬(TSCM),

는 노이즈 신호(NS)에 대한 공간 공분산 행렬(NSCM),

는 m번째 타겟신호(TS)를 제외한 나머지 신호에 대한 공간 공분산 행렬(NSCM),

는 입력 성분 중 m번째 타겟신호(TS)를 제외한 나머지 성분의 기여도를 나타내는 비율일 수 있다. 이러한 타겟 신호(TS)에 대한 공간 공분산 행렬

로부터 주요 아이젠 벡터를 추출함으로써 N개의 방향 벡터를 추정할 수 있다.

일 실시예에 있어서, 디믹싱 제공부(200) 및 결과제공부(300)의 하나 또는 복수의 타겟지점(TP)및 타겟신호(TS)의 디믹싱 행렬(W)은 단일 프레임에서의 마이크들의 입력신호(XS)와의 곱이 아닌 아래의 [수학식16]와 같이 복수의 프레임에서의 마이크들의 입력신호(XS)와의 컨볼루션을 통한 연산으로 확장될 수 있다.

[수학식17]

여기서,

는 복수의 타겟신호(TS)에 상응하는 복수의 결과신호(RS),

는 노이즈 신호(NS)에 상응하는 결과신호(RS),

는 컨볼루션 디믹싱 행렬(W),

는 마이크들의 입력신호(XS), D와 L은 프레임 딜레이와 컨볼루션 필터의 길이를 나타내는 자연수일 수 있다. 이러한 컨볼루션 필터로의 확장을 통해 D 프레임 이전의 L개의 프레임을 함께 사용하여 효과적으로 타겟 신호를 분리할 수 있다. 그리고 [수학식15]으로 표현되는 비용함수는 컨볼루션 디믹싱 행렬(W)의 경우로 확장될 수 있다. 예를 들어, [수학식15]에 대응되는 비용함수는 아래의 [수학식18]로 확장될 수 있다.

[수학식18]

여기서,

는 비용함수, k는 주파수 인덱스를 나타내는 자연수,

는 독립성분 분석의 비용함수,

는 디믹싱 행렬(W)의 m 성분,

는 n번째 타겟신호(TS)에 대응되는 방향 벡터(H),

는 널 조건의 제약 정도를 조절하는 파라미터,

는 컨볼루션 디믹싱 행렬(W),

와

일 실시예에 있어서, 본 발명의 실시예에 따른 빔포밍 및 방향 벡터 추정 시스템(10)은 입력 제공부(100), 디믹싱 제공부(200), 결과 제공부(300) 및 음성 제공부(400)를 포함할 수 있다. 입력 제공부(100)는 타겟지점(TS)에서의 타겟신호(TS) 및 노이즈 신호(NS)에 상응하는 공간전달함수(A)에 기초하여 마이크들의 입력신호(XS)를 제공할 수 있다. 디믹싱 제공부(200)는 마이크들의 입력신호(XS) 및 독립성분 분석(Independent Component Analysis, ICA)에 따라 결정되는 디믹싱 행렬(W)를 제공할 수 있다. 결과 제공부(300)는 디믹싱 행렬(W)에 기초하여 마이크들의 입력신호(XS)로부터 결과신호(RS)를 추출할 수 있다. 음성 제공부(400)는 결과신호(RS)를 음성(SO)으로 제공할 수 있다.

도 7은 본 발명의 실시예들에 따른 빔포밍 및 방향 벡터 추정 시스템의 동작방법을 나타내는 도면이고, 도 8은 도 7의 빔포밍 및 방향 벡터 추정 시스템의 동작방법의 일 실시예를 설명하기 위한 도면이다.

도 1 내지 8을 참조하면, 본 발명의 실시예에 따른 빔포밍 및 방향 벡터 추정 시스템(10)의 동작방법에서는, 입력 제공부(100)가 타겟지점(TS)에서의 타겟신호(TS) 및 노이즈 신호(NS)의 각각에 상응하는 공간전달함수(A)에 기초하여 마이크들의 입력신호(XS)를 제공할 수 있다(S100). 디믹싱 제공부(200)가 마이크들의 입력신호(XS) 및 독립성분 분석(Independent Component Analysis, ICA)에 따라 결정되는 디믹싱 행렬(W)를 제공할 수 있다(S200). 결과 제공부(300)가 디믹싱 행렬(W)에 기초하여 마이크들의 입력신호(XS)로부터 결과신호(RS)를 추출할 수 있다(S300). 음성 제공부(400)가 결과신호(RS)를 음성(SO)으로 제공할 수 있다(S400). 본 발명에 따른 빔포밍 및 방향 벡터 추정 시스템(10)에서는, 복수의 공간적 제한조건들을 포함하는 비용함수를 이용해서 디믹싱 행렬(W)를 산출함으로써 타겟지점(TS)으로부터 발생되는 타겟신호(TS)를 왜곡없이 추출할 수 있다.

Claims

타겟지점에서의 타겟신호 및 노이즈 신호에 상응하는 공간전달함수에 기초하여 마이크들의 입력신호를 제공하는 입력 제공부;

상기 마이크들의 입력신호 및 독립성분 분석(Independent Component Analysis, ICA)에 따라 결정되는 디믹싱 행렬을 제공하는 디믹싱 제공부; 및

상기 디믹싱 행렬에 기초하여 상기 마이크들의 입력신호로부터 결과신호를 추출하는 결과 제공부를 포함하는 빔포밍 및 방향 벡터 추정 시스템.
제1항에 있어서,

상기 공간전달함수는 상기 타겟지점으로부터 상기 입력제공부까지의 전달함수에 해당하는 방향 벡터 및 상기 노이즈 신호가 상기 입력제공부까지 전달되기까지의 전달함수에 해당하는 노이즈 전달함수를 포함하는 것을 특징으로 하는 빔포밍 및 방향 벡터 추정 시스템.
제2항에 있어서,

상기 디믹싱 행렬에 포함되는 제1 성분와 상기 공간전달함수에 포함되는 방향 벡터의 곱은 1이고, 상기 디믹싱 행렬에 포함되는 상기 제1 성분을 제외한 나머지 성분과 상기 방향 벡터의 곱은 0인 것을 특징으로 하는 빔포밍 및 방향 벡터 추정 시스템.
제3항에 있어서,

상기 디믹싱 행렬은 상기 독립성분 분석 및 공간 제약 조건에 따른 비용함수(Cost Function, CF)에 기초하여 결정되는 것을 특징으로 하는 빔포밍 및 방향 벡터 추정 시스템.
제4항에 있어서,

상기 마이크들의 입력신호 및 상기 디믹싱 행렬에 기초하여 생성되는 결과 행렬의 제1 성분은 상기 타겟신호에 상응하는 것을 특징으로 하는 빔포밍 및 방향 벡터 추정 시스템.
제5항에 있어서,

상기 비용함수는 [수학식1]과 같이 표현되고,

[수학식1]

여기서,
는 비용함수, k 및 m은 각각 주파수 및 채널 인덱스를 나타내는 자연수,
는 독립성분 분석의 비용함수,
및
는 각각 왜곡 방지 및 널 조건의 제약 정도를 조절하는 파라미터
와
는 디믹싱 행렬의 제1 및 m 성분,
는 방향 벡터인 것을 특징으로 하는 빔포밍 및 방향 벡터 추정 시스템.
제5항에 있어서,

상기 비용함수는 [수학식2]과 같이 표현되고,

[수학식2]

여기서,
는 비용함수, k 및 m은 주파수 및 채널 인덱스를 나타내는 자연수,
는 독립성분 분석의 비용함수,
및
는 각각 왜곡 방지 및 널 조건을 보장하기 위한 라그랑즈 승수,
와
는 디믹싱 행렬의 제1 및 m 성분,
는 방향 벡터인 것을 특징으로 하는 빔포밍 및 방향 벡터 추정 시스템.
제5항에 있어서,

상기 비용함수는 [수학식3]과 같이 표현되고,

[수학식3]

여기서,
는 비용함수, k 및 m은 주파수 및 채널 인덱스를 나타내는 자연수,
는 독립성분 분석의 비용함수,
는 왜곡 방지 조건을 보장하기 위한 라그랑즈 승수,
와
는 디믹싱 행렬의 제 1 및 m 성분,
는 방향 벡터(H),
는 널 조건의 제약 정도를 조절하는 파라미터인 것을 특징으로 하는 빔포밍 및 방향 벡터 추정 시스템.
제6, 7 및 8항에 있어서,

상기 독립성분 분석의 비용함수
는 [수학식1-2]과 같이 표현되고,

[수학식1-2]

여기서, k 및 m은 주파수 및 채널 인덱스를 나타내는 자연수,
와
는 디믹싱 행렬(W)의 제1 및 m 성분,
는 디믹싱 행렬(W),
와
는 각각 타겟 신호와 노이즈 신호의 모델링에 따라 결정되는 가중 공간 공분산 행렬(Weighted Spatial Covariance Matrix, WSCM)인 것을 특징으로 하는 빔포밍 및 방향 벡터 추정 시스템.
제4항에 있어서,

상기 마이크들의 입력신호 및 상기 디믹싱 행렬에 기초하여 생성되는 결과 행렬의 제1부터 N까지의 성분이 N개의 복수의 상기 타겟신호로 확장되어 상응하는 것을 특징으로 하는 빔포밍 및 방향 벡터 추정 시스템.
제10항에 있어서,

상기 비용함수는 [수학식15]과 같이 표현되고,

[수학식15]

여기서,
는 비용함수, k는 주파수 인덱스를 나타내는 자연수,
는 독립성분 분석의 비용함수,
는 n번째 타겟신호(TS)의 왜곡 방지 조건을 보장하기 위한 라그랑즈 승수
는 디믹싱 행렬(W)의 m 성분,
는 n번째 타겟신호(TS)에 대응되는 방향 벡터(H),
는 널 조건의 제약 정도를 조절하는 파라미터,
는 디믹싱 행렬(W),
와
는 각각 타겟 신호와 노이즈 신호의 모델링에 따라 결정되는 가중 공간 공분산 행렬(Weighted Spatial Covariance Matrix, WSCM)인 것을 특징으로 하는 빔포밍 방향 벡터 추정 시스템.
제9 및 11항에 있어서,

상기 타겟신호에 대한 상기 결과신호는 시간에 따라 변하는 분산을 가지는 라플라시안 분포를 따르는 것을 특징으로 하는 빔포밍 및 방향 벡터 추정 시스템.
제12항에 있어서,

상기 시간에 따라 변하는 분산을 가지는 라플라시안 분포를 통해서 타겟신호(TS)에 대한 가중 공간 공분산 행렬(Weighted Spatial Covariance Matrix, WSCM) 및 가중치 함수의 계산식은 [수학식5-1]과 같이 표현되고,

[수학식 5-1]

여기서, k는 주파수 인덱스를 나타내는 자연수,
는 전체 프레임의 개수,
는 타겟신호(TS)에 대한 가중 공간 공분산 행렬(Weighted Spatial Covariance Matrix, WSCM),
는 가중치 함수,
는 미리 정해진 마스크,
와
는 마이크들의 입력신호(XS) 및 마이크들의 입력신호(XS)의 대표값인 것을 특징으로 하는 빔포밍 및 방향 벡터 추정 시스템
제6, 7, 8 및 11항에 있어서,

상기 방향 벡터는 상기 마이크들의 입력신호에 대한 공간 공분산 행렬(Input Spatial Covariance Matrix, ISCM)) 및 상기 노이즈 신호에 대한 공간 공분산 행렬(Noise Spatial Covariance Matrix, NSCM))의 차에 따라 결정되는 것을 특징으로 하는 빔포밍 및 방향 벡터 추정 시스템.
제14항에 있어서,

상기 노이즈 신호에 대한 공간 공분산 행렬은 상기 결과신호 중 상기 타겟신호에 상응하는 값과 상기 노이즈 신호에 상응하는 값의 비율에 따라 결정되는 것을 특징으로 하는 빔포밍 및 방향 벡터 추정 시스템.
제4와 5항에 있어서,

상기 빔포밍 및 방향 벡터 추정 시스템은 일정한 시간간격에 해당하는 프레임마다 구동되어 상기 디믹싱 행렬을 온라인 업데이트하는 빔포밍 및 방향 벡터 추정 시스템.
제13항에 있어서,

미리 정해진 마스크
는 확산성을 기반으로 하여 매 프레임 추정될 수 있는 빔포밍 및 방향 벡터 추정 시스템.
타겟지점에서의 타겟신호 및 노이즈 신호의 각각에 상응하는 공간전달함수에 기초하여 마이크들의 입력신호를 제공하는 입력 제공부;

상기 마이크들의 입력신호 및 독립성분 분석(Independent Component Analysis, ICA) 및 공간 제약 조건에 따라 결정되는 디믹싱 행렬을 제공하는 디믹싱 제공부;

상기 디믹싱 행렬에 기초하여 상기 마이크들의 입력신호로부터 결과신호를 추출하는 결과 제공부; 및

상기 결과신호를 음성으로 제공하는 음성 제공부를 포함하는 빔포밍 및 방향 벡터 추정 시스템.
입력 제공부가 타겟지점에서의 타겟신호 및 노이즈 신호의 각각에 상응하는 공간전달함수에 기초하여 마이크들의 입력신호를 제공하는 단계;

디믹싱 제공부가 상기 마이크들의 입력신호 및 공간 제약 조건이 걸린 독립성분 분석(Independent Component Analysis, ICA)에 따라 결정되는 디믹싱 행렬을 제공하는 단계; 및

결과 제공부가 상기 디믹싱 행렬에 기초하여 상기 마이크들의 입력신호로부터 결과신호를 추출하는 단계를 포함하는 빔포밍 및 방향 벡터 추정 시스템의 동작방법.
입력 제공부가 타겟지점에서의 타겟신호 및 노이즈 신호의 각각에 상응하는 공간전달함수에 기초하여 마이크들의 입력신호를 제공하는 단계;

디믹싱 제공부가 상기 마이크들의 입력신호 및 공간 제약 조건이 걸린 독립성분 분석(Independent Component Analysis, ICA)에 따라 결정되는 디믹싱 행렬을 제공하는 단계;

결과 제공부가 상기 디믹싱 행렬에 기초하여 상기 마이크들의 입력신호로부터 결과신호를 추출하는 단계; 및

음성 제공부가 상기 결과신호를 음성으로 제공하는 단계를 포함하는 빔포밍 및 방향 벡터 추정 시스템의 동작방법.