KR20070018611A

KR20070018611A - 항해기록저장장치의 사고분석용 음원분리장치

Info

Publication number: KR20070018611A
Application number: KR1020050073463A
Authority: KR
Inventors: 박창선; 이보인; 명희철; 최호웅
Original assignee: 현대중공업 주식회사
Priority date: 2005-08-10
Filing date: 2005-08-10
Publication date: 2007-02-14

Abstract

본 발명은 항해기록저장장치의 사고분석용 음원분리장치에 관한 것으로서, 특히 서로다른 음성신호가 혼재되어있는 오디오데이타로부터 행렬로 표현되는 목수음성신호의 선형결합계수에 대한 역행렬을 계산하여 오디오데이타에 포함되어있는 서로다른 음성신호를 분리하는 음원분리수단을 구성하므로서, 항해기록장치에 보관된 여러신호들이 섞인 형태인 불명확한 음성신호를 개개의 독자적인 신호로 분리하여 개개인의 음성을 좀더 명확하게 해석할 수 있고, 이를통해 사고의 원인을 보다 정확하게 판단할 수 있도록 한 항해기록저장장치의 사고분석용 음원분리장치에 관한 것이다.

항해기록저장장치, 음원분리수단, 믹서, 언믹싱 매트릭스부, 신호분리부

Description

항해기록저장장치의 사고분석용 음원분리장치{Blind source separation device}

도 1 은 본 발명의 항해기록저장장치의 사고분석용 음원분리장치를 보인 블럭도.

도 2 는 본 발명의 음원분리방법을 설명하기 위한 도면.

도 3 은 본 발명에 적용된 음원분리수단의 구성을 보인 블럭도.

*도면의 주요부분에 대한 부호의 설명*

1: VDR, 2: 재생기,

3: 음원분리수단, 4: 믹서,

5: 언믹싱 매트릭스부, 6: 신호분리부,

본 발명은 항해기록저장장치의 사고분석용 음원분리장치에 관한 것으로서, 특히 항해기록장치에 보관된 여러신호들이 섞인 형태인 불명확한 음성신호를 개개의 독자적인 신호로 분리하여 개개인의 음성을 좀더 명확하게 해석할 수 있고, 이를통해 사고의 원인을 보다 정확하게 판단할 수 있도록 한 항해기록저장장치의 사 고분석용 음원분리장치에 관한 것이다.

일반적으로 항해기록저장장치(Voyage Data Recorder : VDR)는 선박의 운항정보를 12시간 이상 보관하여 운항중에 발생할 수 있는 사고의 원인을 사후에 판단할 수 있도록 하는 장비이다.

상기와같이 VDR에 기록된 오디오 데이타를 분석하는 것이 사고의 원인을 분석할때 많은 도움을 줄 수 있게된다.

그러나, VDR에 기록 저장되는 오디오 데이타는 여러사람들의 음성들과 선박의 엔진 잡음 등이 섞여 쉽게 분석할 수 없는 신호가 될 수 있으며, 이러한 이유로 인해 VDR에 기록된 오디오 데이타를 정확하게 분석하지 못하여 선박사고의 원인을 밝혀내지 못하는 문제점이 발생하고 있었다.

따라서, 상기 문제점을 해결하기 위한 본 발명은 서로다른 음성신호가 혼재되어있는 오디오데이타로부터 행렬로 표현되는 목수음성신호의 선형결합계수에 대한 역행렬을 계산하여 오디오데이타에 포함되어있는 서로다른 음성신호를 분리하는 음원분리수단을 구성하므로서, 항해기록장치에 보관된 여러신호들이 섞인 형태인 불명확한 음성신호를 개개의 독자적인 신호로 분리하여 개개인의 음성을 좀더 명확하게 해석할 수 있고, 이를통해 사고의 원인을 보다 정확하게 판단할 수 있도록 한 항해기록저장장치의 사고분석용 음원분리장치를 제공함을 목적으로 한다.

이하, 첨부된 도면 도 1 내지 도 3 을 참조하여 본 발명의 바람직한 실시예 를 설명하면 다음과 같다.

상기 목적달성을 위한 본 발명은,

VDR(1)로부터 재생된 오디오데이타로부터 개개인의 음성신호를 분리하는 장치에 있어서,

서로다른 음성신호가 혼재되어있는 오디오데이타를 입력받고, 행렬로 표현되는 복수음성신호의 선형결합계수(A)에 대한 역행렬(W)을 구하여 오디오 데이타오 포함되어있는 서로 다른 음성신호를 분리하는 음원분리수단(3)을 포함하는 것을 특징으로 한다.

상기 음원분리수단(3)은,

서로다른 음원신호가 혼재된 오디오데이타를 믹싱하는 믹서(4)와;

상기 믹서(4)에서 출력된 오디오데이타로부터 복수 음성신호의 선형결합상태에 대한 역행렬(W)을 구하는 언믹싱매트릭스부(5)와;

오디오데이타에 역행렬(W)을 대입하여 오디오데이타로부터 각각의 음성신호를 분리하는 신호분리부(6); 로 구성된 것을 특징으로 한다.

상기 언믹싱 매트릭스부(5)는 역행렬(W)을 임의의 초기값으로 셋팅하여 신호분리부에 공급하고, 일정주기마다 역행렬(W)값을 얻데이트하여 역행렬(W)이 선형결합계수(A)의 역행렬값에 수렴하도록 하는 것을 특징으로 한다.

이와같이 구성된 본 발명의 동작을 설명하면 다음과 같다.

VDR(1)에 저장되어있는 오디오데이타는 TCP/IP 네트웍을 통해 재생기(2)로 공급되고, 재생기(2)로 공급된 오디오데이타는 재생되어 음원분리수단(3)으로 공급 된다.

상기 음원분리수단(3)의 믹서(4)는 재생기(2)로부터 공급된 오디오 데이타를 입력받고, 언믹싱 매트릭스부(5)는 오디오데이타로부터 복수의 음성신호의 선형결합상태에 대한 역행렬(W)값으로 임의의 초기값으로 셋팅하여 신호분리부(6)에 공급하고, 신호분리부(6)는 공급된 역행렬(W)을 대입하여 오디오데이타로부터 각각의 음성신호를 분리하게되는데, 이때 상기 언믹싱 매트릭스부(5)에서 공급된 초기 역행렬(W)이 선형결합계수(A)의 역행렬에 수렴하지 않은 상태이므로 정상적인 각각의 음성신호를 분리하지 못하게된다.

이에따라, 신호분리부(6)에서 분리된 신호는 다시 언믹싱 매트릭스부(5)로 피드백되고, 언믹싱 매트릭스부(5)는 다시 역행렬(W)을 새로이 업데이트하여 신호분리부(6)로 공급하여 신호분리가 이루어지도록 하며, 이러한 언믹싱 매트릭스부(5)의 역행렬(W) 업데이트가 반복적으로 실시됨에 따라 역행렬(W)값이 선형결합계수(A)의 역행렬에 수렴하게되어 비로서 오디오데이타에 혼재되어있는 각각의 음성신호를 분리해낼 수 있게되는 것이다.

상기 설명과같은 본 발명의 동작에 대한 근본적인 원리를 설명하면 다음과같다.

본 발명은 오디오데이타에 혼재되어있는 개개인의 음성신호를 분리하는 것, 즉, 미지신호분리(Blind source separation)이다.

도 2 와같이 미지신호로서 두명의 화자(s₁,s₂)가 이야기를 하고있고 두대의 마이크(x₁,x₂)가 설치되어 있다고 가정했을때 화자 1 과 화자 2 가 만들어내는 음성신호는 마이크 1(x₁) 과 마이크 2(x₂)에 섞여서 동시에 음원분리수단(3)에 입력된다.

하지만 두 마이크에 입력된 신호는 화자와 마이크의 우치에 따라 각기 다른 값을 가지게 될 것이며, 이는 수식적으로 수학식1과 같이 표현된다.

x₁ = a₁₁s₁ + a₁₂s₂

x₂ = a₂₁s₁ + a₂₂s₂

즉, 마이크에 입력된 신호는 두 화자신호의 선형결합형태로 나타나게되고 이는 다음과 같이 행렬로 표현된다.

x = A·s

,

,

미지신호분리의 목적은 섞인 신호 x 만으로 원신호 s 를 복원하는 것이기 때문에 위의 수학식2에서 선형결합계수 A 의 역행렬을 찾으면 원신호 s 를 복원할 수 있게된다.

하지만 신호가 섞인 환경을 모르기 때문에 선형결합계수 A를 알 수 없다.

따라서, 선형결합계수 A의 역행렬인 W 를 구할 수 없게된다.

이때 원신호들이 서로 통계적으로 독립이라는 사실을 이용한다. 즉, 통계적 독립성을 측정하는 합수를 설정한 다음 그 함수를 최대로 하는 W를 반복적으로 찾도록 하는 것이다.

여기서 통계적 독립성을 측정하는 함수로서 상호정보(Mutual information)를 이용한다.

상호정보는 여러개의 벡터 사이의 연관 정도를 나타내는 척도중의 하나로써 간단하게 두 벡터 y₁ 과 y₂ 사이의 상호정보는 다음의 수학식3과 같이 표현된다.

여기서 f(x)는 x의 확률밀도함수를 나타낸다.

상호정보는 엔트로피(Entropy)에서 유도된 함수로써 Entropy는 다음과 같이 수학식4로 정의된다.

따라서, 수식적으로 I(y₁,y₂)는 다음과 같이 수학식5로 표현될 수 있다.

위의 수학식3에서 알 수 있듯이 I(y₁,y₂)는 항상 양의 값을 가지게되고 y₁ 과 y₂ 가 서로 독립일때에는 0 이 된다.

즉, 분리된 신호들 사이의 상호 독립값이 최소가 되도록, 즉 결합 entropy H(y₁,y₂)가 최대가 되도록 역행렬 W를 반복적으로 찾으면 된다.

이는 다음의 수학식6과 수학식7과 같이 널리 알려진 Gradient ascent 알고리즘으로 반복적으로 구할 수 있다.

즉, 처음에 역행렬 W 를 임의의 값으로 초기화를 시킨 후 매 시간마다 역행렬 W를 업데이트 해 줌으로써 결국에는 역행렬 W 가 선형결합계수 A의 역행렬에 수렴하게되므로 오디오 데이타에 혼재되어 있는 각각의 음성신호를 분리할 수 있게되 는 것이다.

본 발명에 적용된 언믹싱매트릭스부(5)는 상기한 수학식6과 수학식7을 이용하여 주기별로 시간 t 를 업데이트하여 역행렬(W)를 업데이트하여 신호분리부(6)로 공급함에 따라 상기 언믹싱매트릭스부(5)에서 업데이트되는 역행렬(W)이 선형결합계수 A의 역행렬에 수렴할때 비로서 신호분리부(6)에서 음성신호가 분리되는 것이다.

이상에서 설명한 바와같이 본 발명은 서로다른 음성신호가 혼재되어있는 오디오데이타로부터 행렬로 표현되는 목수음성신호의 선형결합계수에 대한 역행렬을 계산하여 오디오데이타에 포함되어있는 서로다른 음성신호를 분리하는 음원분리수단을 구성하므로서, 항해기록장치에 보관된 여러신호들이 섞인 형태인 불명확한 음성신호를 개개의 독자적인 신호로 분리하여 개개인의 음성을 좀더 명확하게 해석할 수 있고, 이를통해 사고의 원인을 보다 정확하게 판단할 수 있도록 한 항해기록저장장치의 사고분석용 음원분리장치를 제공하는 효과를 기대할 수 있다.

Claims

VDR(1)로부터 재생된 오디오데이타로부터 개개인의 음성신호를 분리하는 장치에 있어서,

서로다른 음성신호가 혼재되어있는 오디오데이타를 입력받고, 행렬로 표현되는 복수음성신호의 선형결합계수(A)에 대한 역행렬(W)을 구하여 오디오 데이타오 포함되어있는 서로 다른 음성신호를 분리하는 음원분리수단(3)을 포함하는 것을 특징으로 하는 항해기록저장장치의 사고분석용 음원분리장치.
제 1 항에 있어서, 상기 음원분리수단(3)은,

서로다른 음원신호가 혼재된 오디오데이타를 믹싱하는 믹서(4)와;

상기 믹서(4)에서 출력된 오디오데이타로부터 복수 음성신호의 선형결합상태에 대한 역행렬(W)을 구하는 언믹싱매트릭스부(5)와;

오디오데이타에 역행렬(W)을 대입하여 오디오데이타로부터 각각의 음성신호를 분리하는 신호분리부(6); 로 구성된 것을 특징으로 하는 항해기록저장장치의 사고분석용 음원분리장치.
제 2 항에 있어서,

상기 언믹싱 매트릭스부(5)는 역행렬(W)을 임의의 초기값으로 셋팅하여 신호분리부에 공급하고, 일정주기마다 역행렬(W)값을 얻데이트하여 역행렬(W)이 선형 결합계수(A)의 역행렬값에 수렴하도록 하는 것을 특징으로 하는 항해기록저장장치의 사고분석용 음원분리장치.