WO2014104815A1

WO2014104815A1 - 바람 소음 제거를 통한 음원 위치 추적 장치 및 그 방법

Info

Publication number: WO2014104815A1
Application number: PCT/KR2013/012305
Authority: WO
Inventors: 최종석; 쾅 뉴옌반
Original assignee: 한국과학기술연구원
Priority date: 2012-12-28
Filing date: 2013-12-27
Publication date: 2014-07-03
Also published as: US20150358750A1; KR101681188B1; KR20150100704A; US9549271B2

Abstract

바람 소음 제거를 통한 음원 위치 추적 장치 및 그 방법이 개시된다. 복수의 마이크로폰이 수신한 시간 영역의 입력 신호를 푸리에 변환하는 단계; 상기 푸리에 변환된 입력 신호의 평균 파워값에 기반하여 제1음원 구간을 검출하는 단계; 상기 제1음원 구간 및 마이크로폰으로 수신된 입력 신호별 파워값의 차이에 기반하여 바람 소음을 제거한 제2음원 구간을 검출하는 단계; 상기 제2음원 구간 및 복수의 마이크로폰이 수신한 입력 신호의 위상차이에 기반하여 음원의 위치를 검출하는 단계를 포함하는 바람 소음 제거를 통한 음원 위치 추적 방법이 개시된다.

Description

【명세서】

【발명의 명칭】

바람 소음 제거를 통한 음원 위치 추적 장치 및 그 방법

【기술분야】

실시예들은 음원 위치 추적 장치 및 그 방법에 관한 것이며 , 보다 구체적으 로 바람 소음이 있는 환경에서의 음원 위치 추적 장치 및 그 방법에 관한 것이다. 【배경기술】

실외환경 지능형 CCTV 카메라를 위한 음원위치추적 기술은 인간의 비명 소 리， 자동차의 층돌소리 등과 같은 중요한 사운드 이벤트를 감지하여 해당 음원의 발생 위치로 CCTV 카메라방향을 돌려 당시 발생 사건을 집중적으로 감시하여 관련 보안 부서에 알려주어 주변 상황을보다 안전하게 지켜주는데 목적을 두고 있다. 하지만, 실외 환경은 일반적인 실내환경과 달리 다양하고 랜덤한 소음이 존 재하고 있다. 대표적으로 오토바이 지나가는 소리， 자동차 엔진소리， 바람소리 등 의 소음 종류가 있으며， 일반적으로 이러한 소음의 영향으로 음원방향검지 시스템 에 허위 경보 (즉， 오인식)가 많이 발생하고 있다. 바람소음은 다름 소음 (예， 자동 차 또는 오토바이 소음)에 비해 어떤 일정한 규칙적인 패턴 정보도 찾기 힘들뿐더 러， 바람의 크기 및 방향성 등 다양한 요소에서 랜덤하게 변화하는 어려운 문제점 이 있기 때문으로 분석된다. 종래의 음원방향감지 시스템은 일반적인 조용한 실내 환경에서만 잘 작동하며， 소음이 존재하더라도 소음 레벨이 매우 작거나 안정적인 특성을 갖는 소음에 대해서만 좋은 성능 보이는 문제점이 있다. 즉, 실외 환경에서 항시 존재하는 바람 소음을 효과적으로 대웅하는 음원방향감지 기술이 매우 필요한 실정이다.

【발명의 상세한 설명】

【기술적 과제】

본 발명의 일 측면에 따르면， 바람 소음을 효과적으로 제거하여 음원의 위치 를 추적할 수 있다.

본 발명의 다른 측면에 따르면， 음원 위치 추적 기능을 개선한 보안 카메라 를 구현할 수 있다.

【기술적 해결방법】

본 발명의 일 측면에 의하면 복수의 마이크로폰이 수신한 시간 영역의 입력 신호를 푸리에 변환하는 단계; 상기 푸리에 변환된 입력 신호의 평균 파워값에 기 반하여 게 1음원 구간을 검출하는 단계; 상기 제 1음원 구간 및 마이크로폰으로 수신 된 입력 신호별 파워값의 차이에 기반하여 바람 소음을 제거한 제 2음원 구간을 검 출하는 단계; 상기 제 2음원 구간 및 복수의 마이크로폰이 수신한 입력 신호의 위상 차이에 기반하여 음원의 위치를 검출하는 단계; 상기 음원의 위치 검출의 신뢰도를 계산하는 단계를 포함하되， 상기 제 1음원 구간을 검출하는 단계는 상기 제 1음원 구 간이 연속적으로 이어지는 경우에만 게 1음원 구간으로 검출하는 단계를 더 포함하 는ᅳ 바람 소음 제거를 통한 음원 위치 추적 방법이 제공된다,

일 실시예에 있어서, 바람 소음 제거를 통한 음원 위치 추적 방법은 복수의 마이크로폰이 수신한 시간 영역의 입력 신호를 푸리에 변환하는 단계; 상기 푸리에 변환된 입력 신호의 평균 파워값에 기반하여 제 1음원 구간을 검출하는 단계; 상기 제 1음원 구간 및 마이크로폰으로 수신된 입력 신호별 파워값의 차이에 기반하여 바 람 소음을 제거한 제 2음원 구간올 검출하는 단계; 상기 제 2음원 구간 및 복수의 마 이크로폰이 수신한 입력 신호의 위상차이에 기반하여 음원의 위치를 검출하는 단계 를 포함할 수 있다.

일 실시예에 있어서, 바람 소음 제거를 통한 음원 위치 추적 방법은 상기 음 원의 위치 검출의 신뢰도를 계산하는 단계를 포함하되，상기 제 1음원 구간을 검출하 는 단계는 상기 제 1음원 구간이 연속적으로 이어지는 경우에만 제 1음원 구간으로 검출하는 단계를 더 포함하는 것을 특징으로 할 수 있다.

일 실시예에 있어서， 바람 소음 제거를 통한 음원 위치 추적 방법은 상기 제

1음원 구간을 검출하는 단계는, 상기 입력 신호의 평균 파워값은 아래 수학식 1을 이용하여 결정하고,상기 게 1 음원 구간은 아래 수학식 2를 이용하여 결정하되， 여 기서， n은 프레임 인덱스， f_rain은 입력된 신호의 최소 주파수, f_max은 입력된 신호의 최대 주파수， Nf 는 최소 주파수 (f_min)에서 최고 주파수 (f_max) 사이의 주파수 빈의 개 수인 것을 특징으로 할 수 있다. 상기 수학식 및 수학식 2는 아래 설명에서 표시된 다.

일 실시예에 있어서， 바람 소음 제거를 통한 음원 위치 추적 방법은, 상기 i_rain은 300Hz 이고， 상기 f_raax는 3.4kHz인 것을 특징으로 할 수 있다.

일 실시예에 있어서， 바람 소음 제거를 통한 음원 위치 추적 방법은， 상기 제 2음원 구간을 검출하는 단계는, 명세서의 수학식 4를 이용하여 채널간 파워 차이 값올 구하고， 명세서의 수학식 5를 이용하여 바람소음의 존지를 판단하되， 여기서 P는 마이크로폰 쌍 (microphone pair)의 개수를 나타내고, ΊΉ— ₂는 5dB인 것을 특징으 로 할 수 있다. 일 실시예에 있어서， 바람 소음 제거를 통한 음원 위치 추적 장치는， 복수의 마이크로폰; 상기 복수의 마이크로폰이 수신한 시간 영역의 입력 신호를 푸리에 변 환하는 푸리에 변환부; 상기 푸리에 변환된 입력 신호의 평균 파워값에 기반하여 제 1음원 구간을 검출하는 제 1음원 구간 검출부; 상기 제 1음원 구간 및 마이크로폰 으로 수신된 입력 신호별 파워값의 차이에 기반하여 바람 소음을 제거한 제 2음원 구간을 검출하는 제 2음원 구간 검출부; 및 상기 게 2음원 구간 및 복수의 마이크로 폰이 수신한 입력 신호의 위상차이에 기반하여 음원의 위치를 검출하는 음원 위치 검출부를 포함한다.

일 실시예에 있어서, 바람 소음 제거를 통한 음원 위치 추적 장치는, 상기 음원의 위치 검출의 신뢰도를 계산하는 신뢰도 계산부를 포함하되， 상기 제 1음원 구간 검출부는， 상기 제 1음원 구간이 연속적으로 이어지는 경우에만 제 1음원 구간 으로 검출하는 것을 특징으로 할 수 있다.

일 실시예에 있어서， 바람 소음 제거를 통한 음원 위치 추적 장치는, 상기 제 1음원 구간 검출부는, 상기 입력 신호의 평균 파워값은 아래 수학식 1을 이용하 여 결정하고， 상기 제 1 음원 구간은 아래 수학식 2를 이용하여 결정하되, 수학식 1 및 수학식 2에서， n은 프레임 인덱스， i_rain은 입력된 신호의 최소 주파수， i_max은 입 력된 신호의 최대 주파수, Nf 는 최소 주파수 (f_min)에서 최고 주파수 (f_raax) 사이의 주 파수 빈의 개수인 것을 특징으로 할 수 있다.

일 실시예에 있어서， 바람 소음 제거를 통한 음원 위치 추적 장치는, 상기 f_rain은 300Hz 이고， 상기 f_max는 3.4kHz인 것을 특징으로 할 수 있다.

일 실시예에 있어서， 바람 소음 제거를 통한 음원 위치 추적 장치는， 상기 제 2음원 구간 검출부는， 아래 수학식 3을 이용하여 채널간 파워 차이값을 구하고， 아래 수학식 4를 이용하여 바람소음의 존재를 판단하되, 명세서의 수학식 4 및 5에 서 P는 마이크로폰 쌍 (microphone pair)의 개수를 나타내고, TH— ₂는 5dB인 것을 특 징으로 할 수 있다.

본 발명의 다른 측면에 의하면 복수의 마이크로폰; 상기 복수의 마이크로폰 이 수신한 시간 영역의 입력 신호를 푸리에 변환하는 푸리에 변환부; 상기 푸리에 변환된 입력 신호의 평균 파워값에 기반하여 제 1음원 구간을 검출하는 제 1음원 구 간 검출부; 상기 거 U음원 구간 및 마이크로폰으로 수신된 입력 신호별 파워값의 차 이에 기반하여 바람 소음을 제거한 제 2음원 구간을 검출하는 제 2음원 구간 검출부; 상기 제 2음원 구간 및 복수의 마이크로폰이 수신한 입력 신호의 위상차이에 기반하 여 음원의 위치를 검출하는 음원 위치 검출부; 상기 음원의 위치 검출의 신뢰도를 계산하는 신뢰도 계산부를 포함하되， 상기 제 1음원 구간 검출부는， 상기 제 1음원 구간이 연속적으로 이어지는 경우에만 제 1음원 구간으로 검출하는 것을 특징으로 하는， 바람 소음 제거를 통한 음원 위치 추적 장치가 제공된다.

【유리한 효과】

본 발명의 일 측면에 따르면， 바람 소음을 효과적으로 제거하여 음원의 위치 를 정확하게 파악할 수 있는 효과가 있다.

본 발명의 다른 측면에 따르면， 음원 위치 추적 기능을 개선한 보안 카메라 의 구현이 가능해지는 효과가 있다.

【도면의 간단한 설명】

도 1은 본 발명의 일 실시예에 따른 음원 위치 추적 방법의 일 흐름도이다. 도 2는 본 발명의 일 실시예에 따른 마이크로폰의 입력 신호의 스펙트로그램 비교도이다.

도 3은 본 발명의 일 실시예에 따른 음원 위치 추적 방법의 일 흐름도이다. 도 4는 본 발명의 일 실시예에 따른 마이크로폰의 입력 신호의 스펙트로그램 비교도에 바람 소음 구간과 비명소리를 나타낸 도면이다.

도 5는 종래의 마이크로폰의 입력 신호에 대한 로그 - 파워 변화 그래프이 다.

도 6는 종래의 마이크로폰의 입력 신호에 대한 음원 구간 검출 결과를 나타 낸 그래프이다.

도 7는 본 발명의 일 실시예에 따른 마이크로폰의 입력 신호에 대한 로그 ― 파워 변화 그래프이다.

도 8은 본 발명의 일 실시예에 따른 마이크로폰의 입력 신호에 대한 바람 소 음 구간 검출 결과를 나타낸 그래프이다.

도 9은 본 발명의 일 실시예에 따른 마이크로폰의 입력 신호에 대한 음원 구 간 검출 결과를 나타낸 그래프이다.

도 10은 본 발명의 일 실시예에 따른 마이크로폰의 입력 신호， 음원 구간 검 출 결과 및 신뢰도와 클러스팅을 반영한 후의 음원 구간 검출 결과를 나타낸 그래 프이다.

【발명의 실시를 위한 최선의 형태】

본 명세서에 기술된 실시예는 전적으로 하드웨어이거나， 부분적으로 하드웨 어이고 부분적으로 소프트웨어이거나, 또는 전적으로 소프트웨어인 측면을 가질 수 있다. 본 명세서에서 "부 (unit)", "모들 (module)", "장치" 또는 "시스템" 등은 하 드웨어， 하드웨어와 소프트웨어의 조합， 또는 소프트웨어 등 컴퓨터 관련 엔티티 (entity)를 지칭한다. 예를 들어， 본 명세서에서 부， 모들， 장치 또는 시스템 등은 실행중인 프로세스， 프로세서， 객체 (object), 실행 파일 (executable), 실행 스레드 (thread of execution), 프로그램 (program)， 및 /또는 컴퓨터 (computer)일 수 있으 나 이에 제한되는 것은 아니다. 예를 들어, 컴퓨터에서 실행중인 애플리케이션 (application) 및 컴퓨터의 양쪽이 모두 본 명세서의 부, 모들， 장치 또는 시스템 등에 해당할 수 있다.

실시예들이 도면에 제시된 순서도를 참조로 하여 설명되었다. 간단히 설명하 기 위하여 상기 방법은 일련의 블록들로 도시되고 설명되었으나， 본 발명은 상기 블록들의 순서에 한정되지 않고， 몇몇 블록들은 다른 블록들과 본 명세서에서 도시 되고 기술된 것과 상이한 순서로 또는 동시에 일어날 수도 있으며, 동일한 또는 유 사한 결과를 달성하는 다양한 다른 분기， 흐름 경로, 및 블록의 순서들이 구현될 수 있다. 또한， 본 명세서에서 기술되는 방법의 구현을 위하여 도시된 모든 블록들 이 요구되지 않을 수도 있다. 나아가, 본 발명의 일 실시예에 따른 방법은 일련의 과정들을 수행하기 위한 컴퓨터 프로그램의 형태로 구현될 수도 있으며, 상기 컴퓨 터 프로그램은 컴퓨터로 판독 가능한 기록 매체에 기록될 수도 있다.

후술하는 본 발명에 대한 상세한 설명은， 본 발명이 실시될 수 있는 특정 실 시예를 예시로서 도시하는 첨부 도면을 참조한다. 이들 실시예는 당업자가 본 발명 을 실시할 수 있기에 층분하도록 상세히 설명된다. 본 발명의 다양한 실시예는 서 로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 예를 들어， 여기에 기 재되어 있는 특정 형상， 구조 및 특성은 일 실시예에 관련하여 본 발명의 정신 및 범위를 벗어나지 않으면서 다른 실시예로 구현될 수 있다. 또한， 각각의 개시된 실 시예 내의 개별 구성요소의 위치 또는 배치는 본 발명의 정신 및 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서， 후술하는 상세한 설명은 한 정적인 의미로서 취하려는 것이 아니며， 본 발명의 범위는， 적절하게 설명된다면， 그 청구항들이 주장하는 것과 균등한 모든 범위와 더불어 첨부된 청구항에 의해서 만 한정된다. 도면에서 유사한 참조부호는 여러 측면에 걸쳐서 동일하거나 유사한 기능을 지칭한다. 도 1은 본 발명의 일 실시예에 따른 음원 위치 추적 방법의 일 흐름도이다. 즉， 마이크로폰 어레이를 이용하여 멀티 채널의 입력 신호 (input sound)를 받은 후 , 먼저 단구간 주파수변환 (STFT)을 수행하여 시간영역의 입력 신호를 주파수 영역 으로 변환시킨다. 그리고 주파수 영역에서의 일반적인 음원구간검출 (Voice Activity Detection (VAD))부를 통해 입력신호에서 음원구간을 검출한다. 음원구간 검출과 함께， WDR(Wind detection and remover) 처리부는 시간영역의 멀티 채널 신 호를 이용하여 현재 프레임이 바람 소음인지 여부를 판단하는 바람감지 및 제거단 계를 진행한다. 왜냐하면 일반적으로 바람소음은 큰 에너지 값을 가지므로 대부분 음원구간으로 검출되며， 이로 인해 오 방향검지를 많이 발생시키고 있기 때문이다. 따라서 WDR 처리를 수행하므로 VAD검출결과에서 바람 소음에 해당되는 프레 임들은 배제를 시키므로 sound 이벤트 프레임들에만 음원방향검지를 수행할 수 있 게 보장할 수 있게 된다. 뿐만 아니라， 매우 짧은 구간의 임펄스 (impulse) 특성의 음원 (일반적으로 이런 경우는 대부분 무의미한 소리)에 대해서도 본 시스템에서는 입력 음원의 추정 신뢰도와 음원구간검출의 지속 시간 (연속적으로 음원구간으로 관정되는 프레임 수)에 정당한 기준값을 두어 누적 (Accumulate) 조건에 해당되는 음원 이벤트에 대해서만 클러스팅 (Clustering)을 수행하여 해당 음원 이벤트에 대 한 위치 (수평각 및 및 고도각)를 출력하게 된다.

마지막 단계에서 발생 음원 이벤트의 위치 (수평각， 고도각)값을 IP카메라의 HTTP프로토콜올 통해 카메라에 전송 및 제어를 수행하게 된다.

1. 음성구간 검출 (Voice Activity Detection; VAD)

입력 소리 x(_n,t)에 대해 푸리에 변환 (Fourier Transform)을 하면 X(n,f)과 같이 나타낼 수 있다. 여기서 n은 프레임 인덱스， t는 시간을 의미한다. n번째 프 레임에 대한 주파수 영역에서의 파워값은 수학식 1과 같이 구할 수 있다. 일반적으 로 바람 소음은 각 마이크로폰에 도달하는 세기는 서로 다른 특성을 갖고 있으므 로， 여기서는 입력 신호의 평균 파워값을 수학식 1과 같이 모든 채널의 입력 파워 값의 평균을 계산하여 사용한다.

여기서 f_min, f_nax 는 최소 주파수 (300Hz )ᅳ최고 주파수 (3.4kHz )를 의미한 다， Νί 는 최소 주파수 (fmin)에서 최고 주파수 (imax) 사이의 주파수 빈의 개수를 나타낸다.

음원구간검출은 수학식 2를 이용하여 판별한다.

【수학식 2】

여기서 P_noise(n), Ί 는 η번째 프레임에 대한 배경 잡음 파워， 음원 검출 기 준값 (즉， 3dB)을 의미한다. 즉, 현재 프레임의 파워값과 배경 소음 파워값의 차이 가 기준값 TH보다 크면 음원 존재 구간으로， 반면에 작으면 음원이 존재하지 않는 구간으로 판별하게 된다.

일반적으로 음원구간 검출의 성능은 배경 소음 파워의 예측 정확도에 많이 좌우된다. 본 연구에서는 시간적 변화를 고려하는 적웅 소음 예측 (adaptive noise estimation) 방법을 사용하였다. 즉， 이는 수학식 3과 같다.

【수학식 3】

p ᅳ Cai noise (n) + {l-ai)P(n) if VAD{n) = 0

幽 ^e ' ⁼ \ ₂P noise (n) + ( 1-α₂)Ρ(π) otherwise

여기서 estimation factor al, a 2는 각각 0.95, 0.99로 설정하였다. 이는 예시에 불과하다.

2. 바람검출 및 제거 (Wind detection and remover； WDR)

바람소음은 사람의 목소리 또는 일반 기타 소음에 비해 채널 (마이크로폰)간 의 주파수 분포가 많이 다른 특성을 가지고 있다. 즉， 도 2와 같이 마이크로폰 1번 및 2번에서 동그라미에 표시된 부분과 같이 동일 시점에 각 채널의 주파수별 에너 지 분포가 많이 다른 것을 알 수 있다. 따라서 이러한 특징을 이용하면 기존 에너 지 정보만 이용한 음원구간검출 (VAD)부의 바람소음 대응에 취약 하는 문제점을 효 과적으로 해결할 수 있게 된다.

이를 위하여 본 연구에서는 수학식 4와 같이 채널간 파워 차이 (Cross- channel different power (XDP))를 바람 소음의 판별 측도로 정의하여 Wind Detection and Remover (WDR)을 수행한다. 즉， 높은 XDP값을 갖는 구간일수록 바람 소음의 가능성이 크므로 기존 VAD부에서 잘 못 판별된 바람소음 구간을 배제시키게 된다. 여기서 P는 마이크로폰 쌍 (microphone pair)의 개수를 의미하고, 나머지 변 수는 수학식 1과 동일하다.

【수학식 4】 ¬뼤 (X-(n,f)) - lOloglO (X-(n,f))

구체적인 바람 소음 판별 방법은 다음과 같다.

즉， 수학식 5를 이용하여 채널간 파워 차이 (XDP)값을 기준값 α¾)와 비교하 여， 기준값 보다 크면 바람소음이 존재， 반대로 작으면 존재하지 않는 것으로 판단 한다. 여기서 기준값 (Τ¾)의 크기는 5dB로 설정하였다.

【수학식 5]

w_{dr (n) =} |1 if P(n) > TH₂

\ otherwise

최종적으로 바람 소음 구간은 배제시키고， 오직 의미 있는 음원 구간만 검출 되기 위하여， 수학식 2와수학식 5의 결과를 수학식 6과 같이 결합하게 된다.

【수학식 6】

VAD(n) - vad(n)(l-wdr(n)

수학식 6을 다시 정리하면 수학식 7과 같이 풀이할 수 있다.

【수학식 7】顺") ^{1 if P(n) ~ Pnoise (n)}〉 ^{THl and AP(n)} 〉™²

0 otherwise

3. 실제 데이터를 이용한 WDR의 성능 평가

본 명세서에서 제안하는 WDR의 성능을 확인하기 위하여， 도 4와 같이 바람소 음 및 비명소리가 동시 존재하는 실제 음원 데이터를 이용하여 음원 구간 검출 실 험을 실시하였다. 기존 VAD 방법일 경우， 다 채널 입력신호 중 임의의 한 채널을 선정하여 수학식 1을 이용하여 로그-파워값 (도 4)을 계산한 후， 음원구간을 도 5와 같이 검출하는 것을 확인 할 수 있다. 그 결과， 도 4에서 확인할 수 있듯이 바람 소음 구간도 높은 파워 값을 가지므로 대부분 의미 있는 음원 구간으로 오검출되고 있는 것을 확인 할 수 있다.

본 연구에서 제안하는 TOR 방법일 경우， 채널간 파워 차이값을 그래프로 나 타내보면 도 7과 같으며, 따라서 수학식 5를 이용하여 바람 존재여부를 판단할 경 우 도 8과 같이 바람 소음 존재 구간을 정확하게 검출되는 것을 확인할 수 있다. 따라서 이 결과를 기존 VAD방법의 의해 결정된 음원구간과 수학식 6의 방식으로 결 합하면 최종 도 9와 같이 바람 소음 구간은 정확하게 배제시키면서 기타 중요한 이 벤트 소리 (예: 사람의 비명소리 등 구간)는 유지되는 것을 확인할 수 있었다.

4. 음원위치추적 (Sound source localization)

먼저， 입력 음원 신호에 대한 각 주파수의 채널간 위상 차이 (phase difference)는 수학식 8과 같이 계산할 수 있다.

【수학식 8]

여기서 X 및 는 복수 X에 대한 complex-conjugate 및 진폭값을 의口 한다.

입력 음원신호의 위치 (즉， 수평각 /방위각)올 찾아내기 위하여， 수학식 (9)와 같이 사전에 작성된 지도 (map) (즉， ^{y / Y} ), 주파수 (f)ᅳ 수평각

(azimuth) 및 고도각 (elevat ion)에 대한 채널간 위상차이 값에 대한 지도)와의 각 도 거리를 계산하여 비교한다.

【수학식 9]

여기서 Μ은 지도， ij는 채널 인덱스， f는 주파수， Θ는 수평각， φ는 방위 각, n은 프레임 인덱스를 의미한다. 다음은 수학식 9에서 수평각과 고도각에 대한 입력 프레임과 ：지도 (M)과의 위 상차이를 계산하기 위하여， 수학식 10과 같이 주파수 (f) 및 마이크 페어 (ij)에 대 해 각각 합을 계산한다.

【수학식 10】

마지막으로 수학식 11을 이용하여 입력 음원의 위치 및 신뢰도 (reliability score)를 계산한다. 즉， 수학식 (10)의 최고값이 되는 인덱스 (θ, φ )와 최대 신뢰 도 s(n)를 해당 입력 음원의 위치 (수평각 및 고도각)을 산출하게 된다.

【수학식 11】 θ(^η) ,φ (^η)， s («) 二 argmaxC (Λ, θ ,φ)

θ,φ

5. 누적 및 클러스터링 (Accumulation and clustering)

본 발명은 보다 안정적으로 입력 음원 이벤트 단위로 위치 값을 계산하기 위 하여 , VAD 검출된 프레임이 연속적으로 이어져 일정 프레임이 누적 (Accumulation) 될 경우， 그 음원 구간 (즉， 이벤트로 봄)에 대한 위치 값을 클러스터링 (Culstering) 방법올 이용하여 최종 계산하여 출력하게 된다. 도 10은 입력 신호 ( 상단) 음원구간검출결과 (중단), 방향검지 결과 및 클러스터링 결과 (하단)를 보여주 고 있다. 좀 더 자세히 설명하명, 도 9(상단)은 마이크로폰 1번의 입력 신호에 대 한 스펙트로그램을 나타내고 있고 도 9 (중단)는 입력 신호에 대한 최종 VAD구간 검출 결과를 보여주고 있으며, 이에 대한 음원 위치 추적 결과는 도 9 (하단)에서 *(파란색)로 각 프레임에 대한 수평각 (azimuth)를 나타내고 있고， 최종 클러스터링 한후 본 이벤트 (비명소리)에 대한 음원위치 값은 42도 (빨간색)로 표시되고 있다. 이상에서 본 발명이 구체적인 구성요소 등과 같은 특정 사항들과 한정된 실 시예 및 도면에 의해 설명되었으나, 이는 본 발명의 보다 전반적인 이해를 돕기 위 해서 제공된 것일 뿐， 본 발명이 상기 실시예들에 한정돠는 것은 아니며， 본 발명 이 속하는 기술분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형을 꾀할 수 있다. 따라서， 본 발명의 사상은 상기 설명된 실시예에 국한되어 정해져서는 아니 되며， 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등하게 또는 등가적 으로 변형된 모든 것들은 본 발명의 사상의 범주에 속한다고 할 것이다,

【산업상 이용가능성】

본 발명의 일 측면에 따르면， 바람 소음을 효과적으로 제거하여 음원의 위치 를 정확하게 파악할 수 있는 효과가 있다 .

Claims

【청구의 범위】

【청구항 11

복수의 마이크로폰이 수신한 시간 영역의 입력 신호를 푸리에 변환하는 단 계;

상기 푸리에 변환된 입력 신호의 평균 파워값에 기반하여 제 1음원 구간을 검 출하는 단계；

상기 제 1음원 구간 및 마이크로폰으로 수신된 입력 신호별 파워값의 차이에 기반하여 바람 소음을 제거한 제 2음원 구간을 검출하는 단계;

상기 제 2음원 구간 및 복수의 마이크로폰이 수신한 입력 신호의 위상차이에 기반하여 음원의 위치를 검출하는 단계를 포함하는 바람 소음 제거를 통한 음원 위 치 추적 방법 .

【청구항 2]

제 1항에 있어서，

상기 음원의 위치 검출의 신뢰도를 계산하는 단계를 포함하되,

상기 제 1음원 구간을 검출하는 단계는 상기 게 1음원 구간이 연속적으로 이어 지는 경우에만 제 1음원 구간으로 검출하는 단계를 더 포함하는 것을 특징으로 하는 바람 소음 제거를 통한 음원 위치 추적 방법.

【청구항 3】

계 1항에 있어서，

상기 제 1음원 구간을 검출하는 단계는，

상기 입력 신호의 평균 파워값은 아래 수학식 1을 이용하여 결정하고， 상기 제 1 음원 구간은 아래 수학식 2를 이용하여 결정하되，

[수학식 1]

[수학식 2]

1 if P(n) - P noise (n) > TH

vad (n)二

0 otherwise 여기서， n은 프레임 인덱스， f,„_in은 입력된 신호의 최소 주파수， i_raax은 입력 된 신호의 최대 주파수, Nf 는 최소 주파수 (f,„_in)에서 최고 주파수 (fmax) 사이의 주파 수 빈의 개수인 것을 특징으로 하는 바람 소음 제거를 통한 음원 위치 추적 방법.

【청구항 4】

제 3항에 있어서，

상기 f_rain은 300Hz 이고， 상기 ^ 는 3.4kHz인 것을 특징으로 하는 바람 소음 제거를 통한 음원 위치 추적 방법.

【청구항 5】

제 3항에 있어서，

상기 제 2음원 구간을 검출하는 단계는，

아래 수학식 3을 이용하여 채널간 파워 차이값을 구하고,

아래 수학식 4를 이용하여 바람소음의 존재를 판단하되 ,

[수학식 3] 101 oglO ( χ] (Λ , /)) - 101 oglO ( χ) (n,f)) f^AP(n 〉 ^THz

otherwise

여기서 P는 마이크로폰 쌍 (microphone pair)의 개수를 나타내고, TH-₂는 5dB 인 것을 특징으로 하는 바람 소음 제거를 통한 음원 위치 추적 방법.

【청구항 6】

복수의 마이크로폰;

상기 복수의 마이크로폰이 수신한 시간 영역의 입력 신호를 푸리에 변환하는 푸리에 변환부;

상기 푸리에 변환된 입력 신호의 평균 파워값에 기반하여 계 1음원 구간을 검 출하는 제 1음원 구간 검출부;

상기 제 1음원 구간 및 마이크로폰으로 수신된 입력 신호별 파워값의 차이에 기반하여 바람 소음올 제거한 제 2음원 구간을 검출하는 제 2음원 구간 검출부; 및 상기 제 2음원 구간 및 복수의 마이크로폰이 수신한 입력 신호의 위상차이에 기반하여 음원의 위치를 검출하는 음원 위치 검출부를 포함하는 바람 소음 제거를 통한 음원 위치 추적 장치.

【청구항 7】

제 6항에 있어서，

상기 음원의 위치 검출의 신뢰도를 계산하는 신뢰도 계산부를 포함하되， 상기 게 1음원 구간 검출부는， 상기 제 1음원 구간이 연속적으로 이어지는 경 우에만 제 1음원 구간으로 검출하는 것을 특징으로 하는 바람 소음 제거를 통한 음 원 위치 추적 장치.

【청구항 8】

제 6항에 있어서，

상기 제 1음원 구간 검출부는，

상기 입력 신호의 평균 파워값은 아래 수학식 1을 이용하여 결정하고, 상기 제 1음원 구간은 아래 수학식 2를 이용하여 결정하되，

[수학식 1]

[수학식 2] vad(n). if P(- - Pnoise(n) > T_Hl

L U otherwise 여기서, ri은 프레임 인덱스， f_min은 입력된 신호의 최소 주파수， i_max은 입력 된 신호의 최대 주파수， Nf 는 최소 주파수 (f_min)에서 최고 주파수 (f_raax) 사이의 주파 수 빈의 개수인 것을 특징으로 하는 바람 소음 제거를 통한 음원 위치 추적 장치 .

【청구항 9】

제 8항에 있어서，

상기 f_min은 300Hz 이고 상기 f_raax는 3.4kHz인 것을 특징으로 하는 바람 소음 제거를 통한 음원 위치 추적 장치.

【청구항 10】

제 8항에 있어서,

상기 제 2음원 구간 검출부는,

아래 수학식 3을 이용하여 채널간 파워 차이값을 구하고，

아래 수학식 4를 이용하여 바람소음의 존재를 판단하되 ,

[수학식 3]

[수학식 4]

여기서 P는 마이크로폰 쌍 (microphone pair)의 개수를 나타내고， ΊΉ-₂는 5dB 인 것을 특징으로 하는 바람 소음 제거를 통한 음원 위치 추적 장치.