KR20140089261A - 음향 센서 어레이를 포함하는 실시간 자동 영상 감시 시스템 - Google Patents

음향 센서 어레이를 포함하는 실시간 자동 영상 감시 시스템 Download PDF

Info

Publication number
KR20140089261A
KR20140089261A KR1020130001323A KR20130001323A KR20140089261A KR 20140089261 A KR20140089261 A KR 20140089261A KR 1020130001323 A KR1020130001323 A KR 1020130001323A KR 20130001323 A KR20130001323 A KR 20130001323A KR 20140089261 A KR20140089261 A KR 20140089261A
Authority
KR
South Korea
Prior art keywords
sound
signal
distance
video monitoring
collection
Prior art date
Application number
KR1020130001323A
Other languages
English (en)
Other versions
KR101424911B1 (ko
Inventor
김정근
이정석
Original Assignee
김정근
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 김정근 filed Critical 김정근
Priority to KR1020130001323A priority Critical patent/KR101424911B1/ko
Publication of KR20140089261A publication Critical patent/KR20140089261A/ko
Application granted granted Critical
Publication of KR101424911B1 publication Critical patent/KR101424911B1/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61GTRANSPORT, PERSONAL CONVEYANCES, OR ACCOMMODATION SPECIALLY ADAPTED FOR PATIENTS OR DISABLED PERSONS; OPERATING TABLES OR CHAIRS; CHAIRS FOR DENTISTRY; FUNERAL DEVICES
    • A61G17/00Coffins; Funeral wrappings; Funeral urns
    • A61G17/08Urns

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

본 발명의 목적은 도보 등에서 위급한 상황이 발생한 경우, 음향을 탐지하고 2차원 평면상에서의 음원 방향을 계산하여, CCTV를 대상물 방향으로 회전할 수 있도록 하는 음향 센서 어레이에 관한 것이다. 본 발명에 따른 실시간 자동 영상 감시 장치는 90°마다 4개의 집음구들이 형성된 중공형의 환형 도파관, 및 상기 도파관 내부에 배치된 2개의 음향 센서들을 포함하는 음향 센서 어레이; 상기 2개의 음향 센서들에서 검출된 음성 신호를 디지털 신호로 변환하는 아날로그-디지털 컨버터(ADC); 상기 ADC에서 변환된 디지털 신호를 이용하여 상기 음성 신호가 발생된 음원의 방향을 계산하도록 구성된 디지털 신호 처리부(DSP); 및 상기 디지털 신호 처리부에서 계산된 상기 음원 방향으로 회전하여 상기 음원 방향에 위치된 대상물을 촬영하도록 구성된 카메라부를 포함한다. 상기 디지털 신호 처리부는, 상호 상관법을 이용하여 상기 음성 신호가 상기 집음구에 입사한 후 상기 2개의 음향 센서들에 각각 가장 빨리 도달한 시간들의 차인 도달 시간 지연을 계산하고, 상기 도달 시간 지연을 기초로 상기 음성 신호가 상기 집음구에 입사한 후 상기 2개의 음향 센서들에 각각 도달한 거리의 차이 값을 계산하고, 상기 도달한 거리의 차이 값을 기초로 상기 음성 신호가 상기 4개의 집음구들 중 어느 집음구를 통해 입사된 것인가를 결정한다.

Description

음향 센서 어레이를 포함하는 실시간 자동 영상 감시 시스템{REAL-TIME AUTOMATIC VIDEO MONITORING SYSTEM INCLUDING AUDIO SENSOR ARRAY}
본 발명은 일반적으로 영상 감시 시스템에 관한 것이다. 본 발명은 보다 구체적으로는 음향 센서 어레이를 포함하는 실시간 자동 영상 감시 시스템에 관한 것이다.
CCTV(closed circuit television)는 화상 정보를 특정의 목적으로 특정 수신자를 대상으로 화상을 전송하는 텔레비젼 방식을 말하며, 여러 응용 분야에 사용되고 있지만 최근에는 특히 골목과 같은 우범지대에 CCTV를 설치하는 등 범죄 예방을 위한 감시용으로 사용되고 있다.
이러한 CCTV를 통한 영상 감시 시스템이 발전되어 왔는데, 특정 공간에 설치된 CCTV 카메라를 통하여 획득된 영상정보를 폐쇄적인 유선 전송로를 이용하여 관제센터로 전송하고 관리자가 모니터를 통하여 직접 감시하는 것이 가장 기본적인 형태이다.
IT 기술의 진보에 따라, VCR 저장장치 기반의 아날로그 시대에서 DVR 기반의 영상압축 및 디지털 전송기술을 사용하는 디지털 시대로 발전하였으며 최근에는 광대역 통신망 및 개방 프로토콜을 사용하는 IP 기반의 네트워크와 영상 자동분석 및 인식 기술이 결합된 지능형 영상보안 기술로 진화하고 있다.
그러나, 기존 영상 감시 시스템의 한가지 문제점은 전술한 것처럼 CCTV를 통해 획득되고 관제 센터로 전송된 영상을 관리자가 모니터를 통하여 직접 감시하기 때문에, 예방 또는 즉각 대처를 위하여 감시 근무자가 항상 정위치하여 장시간 동안 별 이벤트가 없는 CCTV 감시화면을 주시하고 있어야 한다는 문제점이 있다. 인간의 심리적인 특성상 비효율적인 방식이고 통합 관제센터처럼 수백의 CCTV가 존재하는 환경에서 필요한 감시인원의 수에 대한 요구 또한 굉장한 비용 요인으로 돌아온다.
또한 고정식의 다수의 CCTV를 여러 방향으로 설치하고 연속 촬영하여 저장한 후 사후 검색하는 방식이 있으나, CCTV가 고화질로 발전할수록 저장 메모리 등에 한계가 있고, 사후 처리시 검색이 어렵다는 문제점이 있다.
이와 관련하여 최근에는 음향 센서, 열선 센서 등을 설치하여, 이상 여부를 감지하고, 이상이 감지되면 해당 영역으로 CCTV를 지향시켜 감시자의 감시 부담을 감소시키고자 하는 지능형 영상 감시 시스템이 개발되고 있다.
이러한 종래기술로는 한국 등록특허 제10-0970609호가 제시되었다. 상기 기술은 5개의 마이크로폰으로 들어오는 소리의 레벨 강도를 각각 비교하여 최고 레벨의 해당방위각을 찾아낸 후 음성신호가 발생되어진 방향으로 카메라를 구동시키는 소리감지를 통한 카메라 위치 제어장치를 개시하고 있다.
그러나, 특허 제10-0970609호는 마이크로폰이 5개나 사용되어야 한다. 또한, 음향 센서(마이크로폰)가 외부에 직접 노출되므로 바람, 눈, 비 등에 약한 센서의 특성상, 시간이 지남에 따라 노후되어 교체 주기가 짧아지게 된다는 단점이 존재한다.
센서가 5개나 사용되는 것도 문제지만 센서당 ADC 및 AMP가 부가되어야 하므로, 센서가 1개 증가할 때마다 센서, ADC, 및 AMP의 비용이 증가된다. 더욱이, 센서 증가에 따라 비례하여 연산수가 증가되는데 이는 DSP의 연산 부담을 크게 증가시킨다. 이를 위해 고속의 DSP가 사용되어야 하며, DSP가 다수개 사용되어야 할 수도 있다. DSP의 연산 부담은 센서, ADC, 및 AMP의 비용 부담과는 비교할 수 없을 정도로 시스템 비용을 기하급수적으로 증가시킨다. 따라서 센서 수를 감소시키기 위한 당업계의 필요성이 존재한다.
KR 10-0970609 B1
본 발명은 이와 같은 종래기술의 문제점을 해결하기 위해 발명된 것으로서, 본 발명의 목적은 도보 등에서 위급한 상황이 발생한 경우, 예를 들어, 치한 등에 의해 성희롱, 납치 등이 발생하거나, 싸움이 벌어졌을 경우, 행인의 비명 소리, 도움을 요청하는 소리 등을 탐지하고 2차원 평면상에서의 음원 방향을 계산하여, CCTV를 대상물 방향으로 회전할 수 있도록 하는 음향 센서 어레이를 제공하기 위한 것이다.
또한, 종래 기술은 센서가 5개나 사용되므로 센서, ADC, AMP, DSP의 비용부담이 증가하고, 센서 노후에 대한 문제점이 존재하므로, 센서 수를 줄이는 동시에 센서의 노후도 방지할 수 있는 음향 센서 어레이를 제공하기 위한 것이다.
이를 위해 90°마다 4개의 집음구들이 형성된 중공형의 환형 도파관과 상기 도파관 내부에 배치된 2개의 음향 센서들을 포함하는 음향 센서 어레이를 제공하여, 이를 통해 음원의 방향을 동서남북 중 한 곳으로 특정할 수 있도록 한 것이다.
본 발명의 제1 양상에 따르면, 90°마다 4개의 집음구들이 형성된 중공형의 환형 도파관, 및 상기 도파관 내부에 배치된 2개의 음향 센서들을 포함하는 음향 센서 어레이; 상기 2개의 음향 센서들에서 검출된 음성 신호를 디지털 신호로 변환하는 아날로그-디지털 컨버터(ADC); 상기 아날로그-디지털 컨버터에서 변환된 디지털 신호를 이용하여 상기 음성 신호가 발생된 음원의 방향을 계산하도록 구성된 디지털 신호 처리부(DSP); 및 상기 디지털 신호 처리부에서 계산된 상기 음원 방향으로 회전하여 상기 음원 방향에 위치된 대상물을 촬영하도록 구성된 카메라부를 포함하는 실시간 자동 영상 감시 장치를 제공한다. 상기 디지털 신호 처리부는, 상호 상관법(cross-correlation)을 이용하여 상기 음성 신호가 상기 집음구에 입사한 후 상기 2개의 음향 센서들에 각각 가장 빨리 도달한 시간들의 차인 도달 시간 지연(Time Difference Of Arrival : TDOA)을 계산하고, 상기 도달 시간 지연을 기초로 상기 음성 신호가 상기 집음구에 입사한 후 상기 2개의 음향 센서들에 각각 도달한 거리의 차이 값을 계산하고, 상기 도달한 거리의 차이 값을 기초로 상기 음성 신호가 상기 4개의 집음구들 중 어느 개구를 통해 입사된 것인가를 결정한다.
본 발명의 제2 양상에 따르면, 상기 2개의 음향 센서들에 각각 도달한 거리의 차이 값은 상기 4개의 집음구들 중 어느 개구를 통해 입사된 것인지에 따라 고유하게 설정되어 있고, 상기 계산된 거리의 차이 값이 상기 고유하게 설정되어 있는 거리의 차이 값 중 어느 것과 매칭되는지에 따라, 상기 음성 신호가 상기 4개의 집음구들 중 어느 개구를 통해 입사된 것인가를 결정한다.
본 발명의 제3 양상에 따르면, 상기 2개의 음향 센서들 중 하나의 음향 센서는 상기 4개의 집음구들 중 인접한 2개의 집음구들 사이에 배치되며, 상기 인접한 2개의 집음구들 중 하나로부터 센서까지의 거리는 d1이고 상기 인접한 2개의 집음구들 중 다른 하나로부터 센서까지의 거리는 d2이며, 상기 고유하게 설정되어 있는 거리의 차이 값은 4개의 집음구들에 대해 각각 -2d2, 2d1, 2d2, +2d1이다.
본 발명의 제4 양상에 따르면, 상기 고유하게 설정되어 있는 거리의 차이 값은 일정 범위의 값으로 설정된다.
본 발명의 제5 양상에 따르면, 상기 집음구에는 상기 음향 신호를 모으기 위한 집음판이 설치된다.
본 발명의 제6 양상에 따르면, 상기 집음구 측의 상기 도파관 내측면에는 상기 음향 신호를 모으기 위해 프리즘 형상의 돌출부가 형성된다.
본 발명의 제7 양상에 따르면, 상기 2개의 음향 센서들은 180°의 각도를 두고 상기 도파관 내부에 배치된다.
본 발명에 따르면, 기존의 음원 위치 추정 방법과는 전혀 상이하게, 도파관 내부에 2개의 음향 센서만을 배치하여 음성 신호가 입사된 방향을 식별하도록 하였다. 따라서 촬영 대상물의 위치를 계산하여 CCTV를 대상물 방향으로 회전하여 촬영 대상물을 선택적으로 촬영할 수 있으므로, 감시자의 감시 부담을 감소시킬 수 있다.
또한, 단지 2개의 음향 센서로 CCTV 카메라 방향을 제어할 수 있으므로, 기존의 5개의 센서를 사용하는 시스템에 비해 ADC, AMP의 수를 2/5로 감소시킬 수 있고, DSP의 연산 부담이 2/5로 획기적으로 감소시킬 수 있다. 더불어, 음향 센서가 외부에 직접 노출되지 않으므로, 센서의 노후도 방지할 수 있다.
도 1은 본 발명의 실시간 자동 영상 감시 시스템을 위한 음향 센서 어레이의 평면도이다.
도 2는 본 발명의 실시간 자동 영상 감시 시스템의 블록도이다.
도 3은 상호상관을 이용하여 도달 지연 시간을 계산하는 원리를 설명하는 도면이다.
도 4는 제1 집음구의 정면, -22.5°, +22.5°에서 각각 음성 신호가 발생된 경우, 제1 음향 센서과 제2 음향 센서에서 검출된 신호들의 상호 상관의 계산값을 나타내는 그래프이다.
도 5는 제2 집음구의 정면, -22.5°, +22.5°에서 각각 음성 신호가 발생된 경우, 제1 음향 센서과 제2 음향 센서에서 검출된 신호들의 상호 상관의 계산값을 나타내는 그래프이다.
도 6은 제3 집음구의 정면, -22.5°, +22.5°에서 각각 음성 신호가 발생된 경우, 제1 음향 센서과 제2 음향 센서에서 검출된 신호들의 상호 상관의 계산값을 나타내는 그래프이다.
도 7은 제4 집음구의 정면, -22.5°, +22.5°에서 각각 음성 신호가 발생된 경우, 제1 음향 센서과 제2 음향 센서에서 검출된 신호들의 상호 상관의 계산값을 나타내는 그래프이다.
다양한 양상들이 도면을 참조하여 설명되는데, 동일한 도면부호는 도면 전체에서 동일한 요소들을 나타내는데 사용된다. 이하의 설명에서, 설명의 목적을 위해, 다양한 구체적 사항들이 하나 이상의 양상들의 전체적인 이해를 제공하기 위해 설명된다. 그러나, 이러한 양상은 이러한 구체적 사항들 없이도 실행될 수 있음이 당업자에게 명백할 것이다.
도 1을 참조하면, 본 발명의 실시간 자동 영상 감시 시스템을 위한 음향 센서 어레이(10)의 평면도가 도시된다.
음향 센서 어레이(10)는 중공형의 환형 도파관(30)과 도파관 내부에 배치된 2개의 음향 센서들(14, 16)을 포함한다. 상기 도파관(30)에는 90°마다 4개의 집음구들(12a, 12b, 12c, 12d)이 도파관의 외측벽에 형성된다. 상기 2개의 음향 센서들은 180°의 각도를 두고 상기 도파관 내부에 배치된다.
제1 음향 센서(14)는 제4 집음구(12d)보다 제1 집음구(12a)에 가깝게 배치하고, 제2 음향 센서(16)는 제2 집음구(12b)보다 제3 집음구(12c)에 가깝게 배치하는 것이 바람직하다. 제1 음향 센서(14)는 제1 집음구(12a)에서 시계방향으로 거리 d1만큼 이격되어 위치되고, 제4 집음구(12d)까지는 거리 d2만큼 이격되어 있다. 유사하게, 제2 음향 센서(16)는 제3 집음구(12c)에서 시계방향으로 거리 d1만큼 이격되어 위치되고, 제2 집음구(12b)까지는 거리 d2만큼 이격되어 있다.
음향 센서 어레이(10)는 각각의 집음구에 집음판을 더 포함할 수 있다. 집음판은 정사각형의 집음구로 들어오는 음성 신호를 도파관 내부로 지향시키기 위한 것이다. 집음판은 금속 또는 플라스틱제의 평평한 플레이트를 사용하여 집음구의 양측면 및또는 상하면에서 음원의 방향으로부터 약 45° 내지 80°의 각도를 두고 설치한다. 집음판은 반사판의 역할을 하여 음성 신호가 양쪽 방향으로 잘 전달할 수 있게 해준다.
다른 실시예에서는, 상기 집음구 측의 상기 도파관 내측면에 음성 신호를 양쪽 방향으로 전달하기 위해 프리즘 형상의 돌출부를 형성할 수도 있다.
이제 도 2를 참조하여, 본 발명의 실시간 자동 영상 감시 시스템(100)을 설명한다. 자동 영상 감시 시스템(100)은 음향 센서 어레이(10), 신호 증폭부(AMP; 50), 아날로그-디지털 컨버터(ADC; 60), 디지털 신호 처리부(DSP; 70), 카메라부(80)로 구성된다.
음원으로부터 발생된 음성 신호는 음향 센서 어레이(10)의 집음구들(12) 중 거리가 가장 가까운 하나의 집음구에 입사한 후 시계 방향 및 반시계 방향으로 2개의 음향 센서들에 각각 가장 빠른 경로를 통해 도달할 것이다.
상기 2개의 음향 센서들에서 검출된 음성 신호는 신호 증폭부(50)를 거치면서 입력신호의 파형의 특징을 유지한 채 큰 출력 신호로 바뀌게 된다. 유입된 신호 중 음성 신호 주파수 대역(400~4KHz)의 신호를 전체 주파수 대역에서 필터링하여 진폭이 임계치를 초과하는 신호를 원하는 신호로 판단한다. 아날로그-디지털 컨버터(60)는 상기 출력 신호를 디지털 신호로 변환한다. 디지털 신호 처리부(70)는 상기 아날로그-디지털 컨버터(60)에서 변환된 디지털 신호를 이용하여 상기 음성 신호가 발생된 음원의 방향을 계산하도록 구성된다.
상기 디지털 신호 처리부(70)에서 수행되는 과정을 보다 구체적으로 설명하면 다음과 같다.
디지털 신호 처리부(70)는 제1 음향 센서(14) 및 제2 음향 센서(16)로부터 검출된 두 개의 디지털 신호를 분석한다. 이후, 제1 음향 센서(14) 및 제2 음향 센서(16)에 음성 신호가 각각 가장 빨리 도달한 시간들의 차인 도달 시간 지연(TDOA)을 아래의 식 (1)에서와 같이 계산한다.
Figure pat00001
(1)
여기서, T1은 음성 신호가 제1 음향 센서에 최초로 도달한 시간이고, T2는 음성 신호가 제2 음향 센서에 최초로 도달한 시간이다. 하나의 집음구, 예를 들어 제1 집음구(12a)쪽에서 음성 신호가 발생되었다면 음성 신호는 제1 집음구(12a)로 입사되어 시계방향의 경로로 제1 음향 센서(14)로 d1만큼의 거리를 이동하여 검출되고, 또한 제1 집음구(12a)로 입사되어 반시계방향으로 제2 음향 센서(16)로 d2만큼의 거리를 이동하여 검출될 것이다. 다른 집음구로도 음성신호가 입사되지만 제1 집음구(12a)쪽에서 음성 신호가 발생되었다면 제1 음향 센서(14)로 d1, 제2 음향 센서(16)로 d2의 거리가 최단 도달거리이다.
이러한 도달 시간 지연은 상호 상관법(cross-correlation)을 이용하여 계산할 수 있다. 상호 상관법을 도 3을 참조로 설명한다.
상호 상관법( cross - correlation ; CC )
상호 상관법을 이해하기 위해, 마이크로폰에 입력되는 신호의 시간 축에서의 수학적 모델은 다음 식 (2), 식 (3)과 같다.
Figure pat00002
(2)
Figure pat00003
(3)
여기서 x1은 제1 음향 센서(14)에 입력된 음원의 신호 s와 유입된 노이즈 n1을 더한 값이다. x2는 제2 음향 센서(16)에 입력된 음원 신호 s의 감쇄(α)되고 지연(D)된 신호와 유입된 노이즈 n2를 더한 값이다. 이 두 신호간의 CC는 다음 식 (4)와 같이 나타낼 수 있다.
Figure pat00004
Figure pat00005
Figure pat00006
(4)
도 3(a) 및 도 3(b)는 상호 상관법을 이용하여 도달 지연시간을 추정하는 예시적인 방법을 나타낸 도면이다. 도 3(a)는 제1 음향 센서(14) 및 제2 음향 센서(16)에 입력된 신호의 예시를 나타낸 도면이고, 도 3(b)는 두 음향 센서에 입력된 신호의 상호 상관 연산 결과를 나타낸 도면이다.
상호 상관법은 두 음향 센서에 들어온 신호간의 상호 상관을 이용한 방법으로, 두 신호를 시간 축으로 이동하면서 상호 상관 연산을 수행하여 그 값이 가장 최대(peak)가 될 때의 이동 값을 도달 지연 시간으로 추정한다. 도 3(a)와 같이 음향 센서(14, 16) 간에 +2초 지연된 신호가 들어왔다고 할 때 두 신호를 시간 축으로 이동하면서 상호 상관 연산을 수행하면 도 3(b)와 같은 그래프를 얻을 수 있다. 도 3(b)에 도시된 바와 같이, -2의 값에서 가장 높은 값을 보이므로 도달 지연 시간은 -2가 되는 것을 알 수 있다.
이제 다시 도 1을 참조하면,
상기 도달 시간 지연 τ에 소리의 속도 c와 곱해주어 결과 값을 식 (5)과 같이 구한다.
Figure pat00007
(5)
이 결과 값은 음성 신호가 집음구를 입사해서 제1 음향 센서에 도달한 거리와 제2 음향 센서에 도달한 거리의 차이와 같다. 그런데, 각 개구를 통해 유입된 음성 신호가 제1 음향 센서 및 2에 도달하는 거리의 차이 값은 다음과 같이 유일하게 결정된다.
1) 제1 집음구에서 신호가 들어온 경우:
제1 음향 센서로의 유입 거리: d1
제2 음향 센서로의 유입 거리: d1+d2+d2
차이: -2d2
2) 제2 집음구에서 신호가 들어온 경우:
제1 음향 센서로의 유입 거리: d1+d2+d1
제2 음향 센서로의 유입 거리: d2
차이: +2d1
3) 제3 집음구에서 신호가 들어온 경우:
제1 음향 센서로의 유입 거리: d1+d2+d2
제2 음향 센서로의 유입 거리: d1
차이: +2d2
4) 제4 집음구에서 신호가 들어온 경우:
제1 음향 센서로의 유입 거리: d2
제2 음향 센서로의 유입 거리: d1+d2+d1
차이: -2d1
따라서, 각 개구를 통해 유입된 음성 신호가 제1 및 제2 음향 센서에 도달하는 거리의 차이 값 ΔD 값이 상기 4가지 차이 값 -2d2, +2d1, +2d2, -2d1 중 어느 것과 매칭되는지를 확인하면, 신호가 어떤 개구를 통해 유입되었는지를 결정할 수 있다.
이렇게 상기 DSP(70)에서 음성 신호가 유입된 개구, 즉 음원 방향이 결정되면, 카메라부(80)는 상기 DSP(70)에서 계산된 상기 음원 방향으로 회전하여 상기 음원 방향에 위치된 대상물을 촬영하도록 구성된다. 카메라부는 예를 들면 CCTV를 포함한다.
근래에 출시되는 CCTV는 90° 이상의 화각(Angle of View)을 가지고 있으므로, 촬영이 필요한 곳을 4분면으로 나누어 음원의 위치가 4분면 중 어느 곳인지만 알 수 있다면, 90° 단위로 카메라를 회전시켜 360° 중 어느 곳에서 일어난 이벤트도 촬영 또는 감시할 수가 있다.
실험예
음향 센서 어레이로부터 20m 떨어진 지점에서 음성 신호를 발생시키고 이를 측정하였다. 본 시스템은 치한 등에 의해 성희롱, 납치 등이 발생하거나, 싸움이 벌어졌을 경우, 행인의 비명 소리, 도움을 요청하는 소리 등을 탐지하기 위한 것이므로, 음성 신호로서 "살려주세요"를 사용하였다. 집음구에서 제1 음향 센서까지의 거리 d1은 15.5cm로 설정하였고, 제1 음향 센서에서 이웃한 집음구까지의 거리 d2는 23.5cm로 설정하였다. 집음구의 크기는 5cm였다. 음성 신호를 48kHz의 샘플링 주파수로 샘플링하였다. 결과 값을 각각의 집음구에 대하여 집음구 정면, 집음구의 -22.5° 집음구의 +22.5°방향에서 3회 측정하였다.
예상되는 실험 값
제1, 2, 3, 4 집음구를 통해 음성 신호가 유입된 경우, 제1 음향 센서에 도달한 거리와 제1 음향 센서에 도달한 거리의 차이 ΔD 값이 각각 -2d2, +2d1, +2d2, -2d1이었다. 실험에서 사용한 d1, d2값이 d1=15.5cm, d2=23.5cm이었고, 48kHz의 sampling frequency로 샘플링 하였으므로, 각 개구에서의 제1, 2 음향 센서의 시간차 값(ΔT = T1 - T2)은 이론상 다음과 같이 계산될 수 있다.
Figure pat00008
(6)
각 개구에서의 상기 식 (6)에 의한 계산 값은 다음과 같다.
집음구 1 집음구 2 집음구 3 집음구 4
ΔD 값(cm) -2d2 2d1 2d2 -2d1
예상 ΔT 값 -66 44 66 -44
상기 ΔT 값의 단위는 샘플수이고, 시간으로 환산하면 제1, 2, 3, 4 집음구에서 각각 -66/48000초, 44/48000초, 66/48000초, -44/48000초에 해당한다.
위의 계산에서의 ΔD 값은, 예를 들어 제1 집음구로 들어온 음성 신호가 도파관을 통해 제1 음향 센서에 가장 빨리 도달하는 거리 d1에서 제2 음향 센서에 가장 빨리 도달하는 거리 (d1+d2+d2)를 뺀 값인 -2d2이지만, 실제 실험에서는 도파관으로 들어온 음성 신호가 도파관 벽에 여러 번 반사되어 해당 센서로 들어가므로, 실제로 제1 음향 센서 및 제2 음향 센서에 도달하는 거리는 각각 d1과 (d1+d2+d2)보다 클 것으로 예상된다. 따라서, ΔT 값이 정확히 -66, 44, 66, -44가 되지는 않을 것이며, 이보다 큰 절대값의 샘플수만큼 차이가 날 것으로 예상된다.
따라서, 적어도 실험에서, 제3 집음구의 값이 제1 집음구의 값의 마이너스 값이 되고, 제4 집음구의 값이 제2 집음구의 마이너스 값이 되며, 각각의 값이 서로 구별될 수 있으면, 네 방향에서의 음성 신호를 분별할 수 있는 것이다.
실험 결과값
도 4 내지 도 7은 제1 내지 제4 집음구의 정면, -22.5°, +22.5°에서 각각 음성 신호가 발생된 경우, 제1 음향 센서과 제2 음향 센서에서 검출된 신호들의 상호 상관의 계산값을 나타내는 그래프이다. 각각의 그래프에서, x축은 sample수로 표시된 시간을 나타내며, y축은 전술한 식(4)에 의한 상호상관값을 나타낸다.
도 4를 참조하면, 제1 집음구의 경우, -72 또는 -73 샘플수에서 peak 값이 발견되었다. 이는 제1 음향센서와 제2 음향센서에 음성 신호가 도달한 시간의 차이값이 -72 샘플 또는 -73 샘플임을 의미한다. 다시 말해서, 제1 음향센서에 음성 신호가 도달한 후 72/48000초 또는 73/48000초 후에 제2 음향센서에 음성 신호가 도달한 것이다.
도 5를 참조하면, 집음구 2의 경우, 54 내지 56 샘플수에서 peak 값이 발견되었다. 이는 제1 음향센서와 제2 음향센서에 음성 신호가 도달한 시간의 차이값이 54 샘플 또는 56 샘플임을 의미한다. 다시 말해서, 제2 음향센서에 음성 신호가 도달한 후 54/48000초 내지 56/48000초 후에 제1 음향센서에 음성 신호가 도달한 것이다.
도 6을 참조하면, 집음구 3의 경우, 72 샘플수에서 peak 값이 발견되었다. 이는 제1 음향센서와 제2 음향센서에 음성 신호가 도달한 시간의 차이값이 72 샘플임을 의미한다. 다시 말해서, 제2 음향센서에 음성 신호가 도달한 후 72/48000초 후에 제1 음향센서에 음성 신호가 도달한 것이다.
도 7을 참조하면, 집음구 4의 경우, -55 또는 -56 샘플수에서 peak 값이 발견되었다. 이는 제1 음향센서와 제2 음향센서에 음성 신호가 도달한 시간의 차이값이 -55 샘플 또는 -56 샘플임을 의미한다. 다시 말해서, 제1 음향센서에 음성 신호가 도달한 후 55/48000초 또는 56/48000초 후에 제2 음향센서에 음성 신호가 도달한 것이다.
예상되는 실험 값과 실험값의 비교
아래의 표 2에는 이미 계산한 제1 음향 센서, 제2 음향 센서의 예상되는 시간차 값(ΔT = T1 - T2) 과 실험에 의해 얻은 시간차 값을 대비하였다.
집음구 1 집음구 2 집음구 3 집음구 4
ΔD 값(cm) -2d2 2d1 2d2 -2d1
예상 ΔT 값 -66 44 66 -44
실험 ΔT 값 -72~-73 54~56 72 -55~-56
상기 실험에 의해 얻은 ΔT 값의 단위는 샘플수이고, 시간으로 환산하면 제1, 2, 3, 4 집음구에서 중간 값을 취하면 각각 약-72/48000초, 약 55/48000초, 72/48000초, -55/48000초에 해당한다.
예상 값과 실험 값 사이에, 제1 및 제3 집음구의 경우에는 약 6샘플의 오프셋이, 제2 및 제4 집음구의 경우에는 약 10샘플의 오프셋이 존재한다. 이는 전술한 것처럼, 예상되는 ΔD 값이 예를 들어 제1 집음구로 들어온 음성 신호가 도파관을 통해 제1 음향 센서에 가장 빨리 도달하는 거리 d1에서 제2 음향 센서에 가장 빨리 도달하는 거리 (d1+d2+d2)를 뺀 값인 -2d2이지만, 실제 실험에서는 도파관으로 들어온 음성 신호가 도파관 벽에 여러 번 반사되어 해당 센서로 들어가므로, 실제로 제1 음향 센서 및 제2 음향 센서에 도달하는 거리는 각각 d1과 (d1+d2+d2)보다 크게 된 것이다. 따라서, 실험에 의한 T 값은 예상되는 T 값인 -66, 44, 66, -44보다 각각 더 많은 시간차가 생겼고, -72, 55, 72, -55였다.
그러나, 이러한 오프셋은 음성 신호의 방향 검출에 전혀 문제가 되지 않는다. 제 1, 2, 3, 4 집음구에서의 제1 음향 센서와, 제2 음향 센서의 시간차 값(T = T1 - T2)은 각각 -72, 55, 72, -55로 서로에 대해 충분히 구별가능한 값이다. 제 1, 2, 3, 4 집음구를 식별하는 시간차 값을 -70~-80, 50~60, 70~80, -50~-60 범위로 설정해 놓음으로써, 검출된 음성 신호의 시간차 값이 해당 범위에 있다면, 어떤 집음구를 통해 입사된 것인지를 판별가능하다. 이 값 또는 값의 범위는 물론 실제 센서 어레이의 스펙에 따라 달라질 것이며(예를 들어, 도파관의 두께, 집음구로부터 d1, d2의 거리, 센서의 부착 위치, 집음구의 크기 등), 제작된 센서 어레이를 통해 얻어진 실험값을 해당 방향으로 인식하도록 설정하면 될 것이다.
비록 본 발명이 그 실시예들을 참조하여 구체적으로 기재되었지만, 형태 및 세부사항들에 있어서의 변경들 및 수정들은 본 발명의 사상 및 범위를 일탈함이 없이 이루어질 수 있음이 당업자에게 이해될 것이다. 첨부된 청구범위는 이러한 변경들 및 수정들을 포괄하려는 것이다. 다음의 청구범위가 본 발명을 정의한다.
100 : 실시간 자동 영상 감시 시스템
10 : 음향 센서 어레이
12a, 12b, 12c, 12d : 집음구
14, 16 : 제1 및 제2 음향 센서
30 : 도파관
50 : 신호 증폭부(AMP)
60 : 아날로그-디지털 컨버터(ADC)
70 : 디지털 신호 처리부(DSP)
80 : 카메라부

Claims (7)

  1. 실시간 자동 영상 감시 장치로서,
    90°마다 4개의 집음구들이 형성된 중공형의 환형 도파관, 및 상기 도파관 내부에 배치된 2개의 음향 센서들을 포함하는 음향 센서 어레이;
    상기 2개의 음향 센서들에서 검출된 음성 신호를 디지털 신호로 변환하는 아날로그-디지털 컨버터(ADC);
    상기 아날로그-디지털 컨버터에서 변환된 디지털 신호를 이용하여 상기 음성 신호가 발생된 음원의 방향을 계산하도록 구성된 디지털 신호 처리부(DSP); 및
    상기 디지털 신호 처리부에서 계산된 상기 음원 방향으로 회전하여 상기 음원 방향에 위치된 대상물을 촬영하도록 구성된 카메라부
    를 포함하며,
    상기 디지털 신호 처리부는,
    상호 상관법(cross-correlation)을 이용하여 상기 음성 신호가 상기 집음구에 입사한 후 상기 2개의 음향 센서들에 각각 가장 빨리 도달한 시간들의 차인 도달 시간 지연(Time Difference Of Arrival : TDOA)을 계산하고,
    상기 도달 시간 지연을 기초로 상기 음성 신호가 상기 집음구에 입사한 후 상기 2개의 음향 센서들에 각각 도달한 거리의 차이 값을 계산하고,
    상기 도달한 거리의 차이 값을 기초로 상기 음성 신호가 상기 4개의 집음구들 중 어느 집음구를 통해 입사된 것인가를 결정하는,
    실시간 자동 영상 감시 장치.
  2. 제 1 항에 있어서,
    상기 2개의 음향 센서들에 각각 도달한 거리의 차이 값은 상기 4개의 집음구들 중 어느 집음구를 통해 입사된 것인지에 따라 고유하게 설정되어 있고, 상기 계산된 거리의 차이 값이 상기 고유하게 설정되어 있는 거리의 차이 값 중 어느 것과 매칭되는지에 따라, 상기 음성 신호가 상기 4개의 집음구들 중 어느 집음구를 통해 입사된 것인가를 결정하는,
    실시간 자동 영상 감시 장치.
  3. 제 2 항에 있어서,
    상기 2개의 음향 센서들 중 하나의 음향 센서는 상기 4개의 집음구들 중 인접한 2개의 집음구들 사이에 배치되며, 상기 인접한 2개의 집음구들 중 하나로부터 센서까지의 거리는 d1이고 상기 인접한 2개의 집음구들 중 다른 하나로부터 센서까지의 거리는 d2이며, 상기 고유하게 설정되어 있는 거리의 차이 값은 4개의 집음구들에 대해 각각 -2d2, 2d1, 2d2, +2d1인,
    실시간 자동 영상 감시 장치.
  4. 제 2 항에 있어서,
    상기 고유하게 설정되어 있는 거리의 차이 값은 일정 범위의 값으로 설정되는,
    실시간 자동 영상 감시 장치.
  5. 제 1 항에 있어서,
    상기 집음구에는 상기 음성 신호를 모으기 위한 집음판이 설치되어 있는,
    실시간 자동 영상 감시 장치.
  6. 제 1 항에 있어서,
    상기 집음구 측의 상기 도파관 내측면에는 상기 음성 신호를 모으기 위해 프리즘 형상의 돌출부가 형성되어 있는,
    실시간 자동 영상 감시 장치.
  7. 제 1 항에 있어서,
    상기 2개의 음향 센서들은 180°의 각도를 두고 상기 도파관 내부에 배치되는,
    실시간 자동 영상 감시 장치.
KR1020130001323A 2013-01-04 2013-01-04 음향 센서 어레이를 포함하는 실시간 자동 영상 감시 시스템 KR101424911B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020130001323A KR101424911B1 (ko) 2013-01-04 2013-01-04 음향 센서 어레이를 포함하는 실시간 자동 영상 감시 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020130001323A KR101424911B1 (ko) 2013-01-04 2013-01-04 음향 센서 어레이를 포함하는 실시간 자동 영상 감시 시스템

Publications (2)

Publication Number Publication Date
KR20140089261A true KR20140089261A (ko) 2014-07-14
KR101424911B1 KR101424911B1 (ko) 2014-07-31

Family

ID=51737499

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020130001323A KR101424911B1 (ko) 2013-01-04 2013-01-04 음향 센서 어레이를 포함하는 실시간 자동 영상 감시 시스템

Country Status (1)

Country Link
KR (1) KR101424911B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104869369A (zh) * 2015-06-10 2015-08-26 国网山东济南市历城区供电公司 一种多角度电力视频监控系统
KR20180001429A (ko) * 2016-06-24 2018-01-04 한국산업기술대학교산학협력단 음원 탐지 및 IoT 기술을 적용한 유해 조수 퇴치 시스템
CN108803312A (zh) * 2018-04-19 2018-11-13 彭楷文 一种新型道路损坏检测系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3069663B1 (ja) 1999-03-18 2000-07-24 防衛庁技術研究本部長 音源方向測定方法及び装置
JP3758911B2 (ja) 1999-09-22 2006-03-22 三菱重工業株式会社 受波装置
KR100953029B1 (ko) * 2008-05-06 2010-04-14 중앙대학교 산학협력단 보안 시스템 및 보안 방법
KR101268076B1 (ko) * 2011-03-25 2013-05-29 노희상 소리발생 방향 감지에 따른 감시카메라 시스템 및 이를 이용한 위치추정 방법

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104869369A (zh) * 2015-06-10 2015-08-26 国网山东济南市历城区供电公司 一种多角度电力视频监控系统
KR20180001429A (ko) * 2016-06-24 2018-01-04 한국산업기술대학교산학협력단 음원 탐지 및 IoT 기술을 적용한 유해 조수 퇴치 시스템
CN108803312A (zh) * 2018-04-19 2018-11-13 彭楷文 一种新型道路损坏检测系统

Also Published As

Publication number Publication date
KR101424911B1 (ko) 2014-07-31

Similar Documents

Publication Publication Date Title
US8755536B2 (en) Stabilizing directional audio input from a moving microphone array
CN106125048B (zh) 一种声源定位方法及装置
CN105611167B (zh) 一种对焦平面调整方法及电子设备
US7362654B2 (en) System and a method for detecting the direction of arrival of a sound signal
US20150281832A1 (en) Sound processing apparatus, sound processing system and sound processing method
KR101793942B1 (ko) 음향 수신부를 이용한 음원 추적 장치 및 방법
US20210158828A1 (en) Audio processing device, image processing device, microphone array system, and audio processing method
CN105474666A (zh) 声音处理装置、声音处理系统及声音处理方法
WO2017000775A1 (zh) 一种机器人语音寻向转动系统及方法
JP6977448B2 (ja) 機器制御装置、機器制御プログラム、機器制御方法、対話装置、及びコミュニケーションシステム
KR101424911B1 (ko) 음향 센서 어레이를 포함하는 실시간 자동 영상 감시 시스템
KR101384781B1 (ko) 이상 음원 탐지 장치 및 방법
KR101321447B1 (ko) 네트워크를 통한 현장 모니터링 방법, 및 이에 사용되는 관리 서버
KR100970609B1 (ko) 소리감지를 통한 카메라 위치 제어장치
JPH06351015A (ja) テレビジョン会議システム用の撮像システム
US10084965B2 (en) Omnidirectional high resolution tracking and recording apparatus and method
CN106303810B (zh) 基于方向性声音传感器的声源方位判断装置及方法
JP2006038772A (ja) 音圧測定方法
WO2015151130A1 (ja) 音声処理装置、音声処理システム、及び音声処理方法
CA2485728C (en) Detecting acoustic echoes using microphone arrays
CN112014797A (zh) 一种网络摄像机的听声辩位系统
JP4175180B2 (ja) 監視通報システム
JPS63262576A (ja) マイクロホン装置
Kotus et al. Detection and localization of selected acoustic events in 3D acoustic field for smart surveillance applications
KR20040074702A (ko) 감시시스템에서의 음원 탐지 및 위치 제어방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20170824

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20180807

Year of fee payment: 5