KR101621827B1 - 음원 방향 추정 시스템 및 방법 - Google Patents

음원 방향 추정 시스템 및 방법 Download PDF

Info

Publication number
KR101621827B1
KR101621827B1 KR1020150037638A KR20150037638A KR101621827B1 KR 101621827 B1 KR101621827 B1 KR 101621827B1 KR 1020150037638 A KR1020150037638 A KR 1020150037638A KR 20150037638 A KR20150037638 A KR 20150037638A KR 101621827 B1 KR101621827 B1 KR 101621827B1
Authority
KR
South Korea
Prior art keywords
resonance induction
module
sound source
resonance
fundamental frequency
Prior art date
Application number
KR1020150037638A
Other languages
English (en)
Inventor
김건욱
Original Assignee
동국대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 동국대학교 산학협력단 filed Critical 동국대학교 산학협력단
Priority to KR1020150037638A priority Critical patent/KR101621827B1/ko
Priority to PCT/KR2015/013745 priority patent/WO2016148379A1/ko
Application granted granted Critical
Publication of KR101621827B1 publication Critical patent/KR101621827B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Otolaryngology (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

음원 방향 추정 시스템 및 방법이 제공된다. 본 발명의 일 실시예에 따른 음원 방향 추정 시스템은, 다방향으로 연장되며 연장 길이가 서로 다른 복수의 공명 유도 셀을 구비함으로써, 음원의 방향에 따라 음향 신호의 주파수 패턴을 변화시키는 공명 유도 모듈; 상기 공명 유도 모듈을 통과한 상기 음향 신호를 디지털 신호로 변환하는 변환 모듈; 및 상기 디지털 신호의 주파수 패턴을 분석하여 상기 음원의 방향을 추정하는 추정 모듈을 포함한다.

Description

음원 방향 추정 시스템 및 방법 {SYSTEM AND METHOD FOR ESTIMATING DIRECTION OF SOUND SOURCE}
본 발명은 음원의 방향을 추정하는 기술과 관련된다.
일반적으로, 사람은 소리를 통해 의사 소통을 할 수 있을 뿐 아니라 소리의 방향을 감지하여 눈에 보이지 않는 범위의 공간 정보를 인지할 수 있다. 이에 따라, 음원의 방향을 찾는 연구는 다양한 방식으로 진행되어 왔다.
일 예시로서, 여러 개의 마이크를 공간 상에 배치하여 각 마이크에서 추출된 음향 신호의 크기에 따라 음원의 방향을 찾을 수 있다. 그러나, 이 경우 최소 2개 이상의 마이크가 필요하며, 음원의 방향을 정확하게 찾기 위해서는 마이크의 개수가 많아야 한다. 즉, 종래 기술의 경우 다수의 마이크를 필요로 하므로 제작 비용이 많이 소요될 뿐 아니라, 각 마이크에서 추출된 데이터를 실시간으로 처리하기 위해 높은 성능의 처리 시스템이 필요하다. 이는 곧 전체 비용의 증가로 이어진다.
다른 예시로서, 사람의 귓바퀴와 같은 구조물을 이용하여 음원의 방향을 찾을 수 있다. 그러나, 귓바퀴 구조는 비선형 정보를 만들어 내며, 이는 음원의 방향을 추정하는 데 있어서 성능을 저하시키는 요인이 된다.
한국공개특허공보 제10-2012-0031328호(2012.04.03)
본 발명의 실시예들은 서로 다른 기본 주파수에서 공명을 일으키는 구조물을 이용하여 음원의 방향을 추정하는 음원 방향 추정 시스템 및 방법을 제공한다.
본 발명의 예시적인 실시예에 따르면, 다방향으로 연장되며 연장 길이가 서로 다른 복수의 공명 유도 셀을 구비함으로써, 음원의 방향에 따라 음향 신호의 주파수 패턴을 변화시키는 공명 유도 모듈; 상기 공명 유도 모듈을 통과한 상기 음향 신호를 디지털 신호로 변환하는 변환 모듈; 및 상기 디지털 신호의 주파수 패턴을 분석하여 상기 음원의 방향을 추정하는 추정 모듈을 포함하는, 음원 방향 추정 시스템이 제공된다.
상기 공명 유도 모듈은, 상기 음원과 가장 가까운 공명 유도 셀의 연장 길이와 대응되는 기본 주파수의 배수에 해당하는 주파수 성분들을 증폭시킬 수 있다.
상기 추정 모듈은, 상기 디지털 신호의 기본 주파수를 획득하고, 획득한 상기 기본 주파수에 대응되는 공명 유도 셀의 연장 길이를 획득하고, 획득한 상기 연장 길이를 갖는 공명 유도 셀의 연장 방향을 상기 음원의 방향으로 추정할 수 있다.
상기 추정 모듈은, 캡스트럼(Cepstrum) 알고리즘을 이용하여 상기 디지털 신호의 기본 주파수를 획득할 수 있다.
상기 공명 유도 셀 각각은, 중공을 갖는 혼(horn) 형상일 수 있다.
상기 공명 유도 셀 각각은, 중공을 갖는 파이프(pipe) 형상일 수 있다.
상기 공명 유도 셀 각각은, 상기 변환 모듈을 중심으로 다방향으로 연장될 수 있다.
상기 공명 유도 셀 각각은, 30cm 내지 50cm 의 연장 길이를 가질 수 있다.
본 발명의 다른 예시적인 실시에에 따르면, 다방향으로 연장되며 연장 길이가 서로 다른 복수의 공명 유도 셀을 구비하는 공명 유도 모듈에서, 음원의 방향에 따라 음향 신호의 주파수 패턴을 변화시키는 단계; 변환 모듈에서, 상기 공명 유도 모듈을 통과한 상기 음향 신호를 디지털 신호로 변환하는 단계; 및 추정 모듈에서, 상기 디지털 신호의 주파수 패턴을 분석하여 상기 음원의 방향을 추정하는 단계를 포함하는, 음원 방향 추정 방법이 제공된다.
상기 음향 신호의 주파수 패턴을 변화시키는 단계는, 상기 음원과 가장 가까운 공명 유도 셀의 연장 길이와 대응되는 기본 주파수의 배수에 해당하는 주파수 성분들을 증폭시킬 수 있다.
상기 음원의 방향을 추정하는 단계는, 상기 디지털 신호의 기본 주파수를 획득하는 단계; 획득한 상기 기본 주파수에 대응되는 공명 유도 셀의 연장 길이를 획득하는 단계; 및 획득한 상기 연장 길이를 갖는 공명 유도 셀의 연장 방향을 상기 음원의 방향으로 추정하는 단계를 포함할 수 있다.
상기 디지털 신호의 기본 주파수를 획득하는 단계는, 캡스트럼(Cepstrum) 알고리즘을 이용하여 상기 디지털 신호의 기본 주파수를 획득할 수 있다.
본 발명의 실시예들에 따르면, 공명 유도 모듈의 구조적인 특징을 이용하여 음원의 방향을 간편하고 정확하게 추정할 수 있다.
또한, 본 발명의 실시예들에 따르면, 하나의 변환 모듈 및 이를 둘러싼 공명 유도 모듈을 이용함으로써, 다수의 마이크가 필요한 종래 기술에 비해 음원 방향의 추정에 따른 비용 및 시간을 크게 줄일 수 있다.
도 1은 본 발명의 일 실시예에 따른 음원 방향 추정 시스템의 상세 구성을 나타낸 개략도
도 2는 본 발명의 제 1 실시예에 따른 공명 유도 모듈을 나타낸 도면
도 3은 본 발명의 제 2 실시예에 따른 공명 유도 모듈을 나타낸 도면
도 4는 본 발명의 실시예들에 따른 공명 유도 모듈에서 음향 신호의 주파수 패턴을 변화시키는 과정을 설명하기 위한 도면
도 5는 공명 유도 셀의 연장 길이에 따른 음향 신호의 기본 주파수를 나타낸 그래프
도 6은 본 발명의 일 실시예에 따른 추정 모듈에서 획득한 기본 주파수에 대응되는 공명 유도 셀의 연장 길이를 획득하는 과정을 설명하기 위한 그래프
도 7은 본 발명의 일 실시예에 따른 추정 모듈에서 획득한 기본 주파수에 대응되는 공명 유도 셀의 연장 길이를 획득하는 과정을 설명하기 위한 그래프
도 8은 본 발명의 일 실시예에 따른 추정 모듈에서 추정한 음원의 방향을 나타낸 도면
도 9는 본 발명의 일 실시예에 따른 음원 방향 추정 방법을 설명하기 위한 흐름도
이하, 도면을 참조하여 본 발명의 구체적인 실시예를 설명하기로 한다. 그러나 이는 예시적 실시예에 불과하며 본 발명은 이에 한정되지 않는다.
본 발명을 설명함에 있어서, 본 발명과 관련된 공지기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략하기로 한다. 그리고, 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
본 발명의 기술적 사상은 청구범위에 의해 결정되며, 이하 실시예는 진보적인 본 발명의 기술적 사상을 본 발명이 속하는 기술분야에서 통상의 지식을 가진자에게 효율적으로 설명하기 위한 일 수단일 뿐이다.
도 1은 본 발명의 일 실시예에 따른 음원 방향 추정 시스템(100)의 상세 구성을 나타낸 개략도이며, 도 2 및 도 3은 본 발명의 실시예들에 따른 공명 유도 모듈(102)을 나타낸 도면이다. 또한, 도 4는 본 발명의 실시예들에 따른 공명 유도 모듈(102)에서 음향 신호의 주파수 패턴을 변화시키는 과정을 설명하기 위한 도면이다.
도 1에 도시된 바와 같이, 본 발명의 일 실시예에 따른 음원 방향 추정 시스템(100)은 공명 유도 모듈(102), 변환 모듈(104) 및 추정 모듈(106)을 포함한다.
공명 유도 모듈(102)은 음원(110)의 방향에 따라 음향 신호의 주파수 패턴을 변화시키는 구조물로서, 음원(110) 근처에 배치될 수 있다. 여기서, 음원(110)은 음향 신호를 발생시키는 근원으로서, 예를 들어 스피커, 오디오 등과 같은 음향 발생 장치뿐 아니라 발자국 소리를 발생시키는 사람, 엔진 소리를 발생시키는 차량 등 음향 신호를 발생시키는 모든 종류의 대상체가 될 수 있다. 공명 유도 모듈(102)은 음원(110)에서 발생한 음향 신호로부터 공명을 유도할 수 있다.
도 2는 본 발명의 제 1 실시예에 따른 공명 유도 모듈(102)을 나타낸 도면이다. 도 2에 도시된 바와 같이, 본 발명의 제 1 실시예에 따른 공명 유도 모듈(102)은 복수의 공명 유도 셀(202 내지 222)을 포함한다. 공명 유도 셀(202 내지 222) 각각은 혼(horn) 형상을 가질 수 있으며, 후술할 변환 모듈(104)을 중심으로 다방향으로 연장될 수 있다. 예를 들어, 공명 유도 셀(202 내지 222) 각각은 변환 모듈(104)을 둘러싸도록 원형으로 배치될 수 있다. 공명 유도 모듈(102)은 예를 들어, 11개의 공명 유도 셀(202 내지 222)을 포함할 수 있다. 다만, 공명 유도 셀(202 내지 222)의 개수가 이에 한정되는 것은 아니며, 음원(110)의 종류, 공명 유도 모듈(102)과 음원(110)과의 거리 등에 따라 공명 유도 셀(202 내지 222)의 개수를 달리할 수 있다.
또한, 공명 유도 셀(202 내지 222) 각각은 중공(S)을 가질 수 있다. 음향 신호는 공명 유도 셀(202 내지 222)의 중공(S)을 통과하여 변환 모듈(104)로 입력될 수 있다.
이때, 공명 유도 셀(202 내지 222) 각각은 서로 다른 연장 길이(l1 내지 l11)를 가질 수 있으며, 공명 유도 셀(202 내지 222) 각각은 중공(S)을 통과하는 음향 신호에 의해 서로 다른 기본 주파수(fundamental frequency)에서 공명(resonance)을 일으킬 수 있다. 공명 유도 셀(202 내지 222) 각각의 연장 길이는 표 1과 같이 예를 들어, 30cm 내지 50cm 의 값을 가질 수 있다.
l1 l2 l3 l4 l5 l6 l7 l8 l9 l10 l11
30cm 32cm 34cm 36cm 38cm 40cm 42cm 44cm 46cm 48cm 50cm
일반적으로, 공명 현상이 일어나는 주파수를 공명 주파수(resonance frequency)라 하며, 공명 주파수는 관의 길이(여기서는 l1 내지 l11)에 반비례한다. 음원(110)에서 발생된 음향 신호는 공명 유도 셀(202 내지 222)을 통과하면서 공명을 일으키며, 공명 유도 셀(202 내지 222)의 공명에 따라 음향 신호의 주파수 패턴이 변화하게 된다.
이를 구체적으로 살펴보면, 공명 유도 모듈(102)은 음원(110)과 가장 가까운 공명 유도 셀(예를 들어, 204)의 연장 길이(예를 들어, l2)와 대응되는 기본 주파수(예를 들어, 550Hz)의 배수에 해당하는 주파수 성분들을 증폭시킴으로써 음향 신호의 주파수 패턴을 변화시킬 수 있다. 음향 신호는 공명 유도 셀(202 내지 222) 각각의 중공(S)을 통과하기는 하나, 음원(110)과 상대적으로 먼 위치의 공명 유도 셀에서는 해당 공명 유도 셀의 공명 주파수의 주기성이 약하게 나타나며, 음원(110)과 가장 가까운 공명 유도 셀(예를 들어, 204)의 공명 주파수의 주기성이 가장 강하게 나타난다. 즉, 동일한 음원(110)이라도 음원(110)이 어느 방향에서 일어나느냐에 따라 공명 유도 모듈(102)을 통과한 음향 신호의 주파수 패턴이 달라지게 된다.
도 3은 본 발명의 제 2 실시예에 따른 공명 유도 모듈(102)을 나타낸 도면이다. 도 3에 도시된 바와 같이, 본 발명의 제 2 실시예에 따른 공명 유도 모듈(102)은 도 2에서와 마찬가지로 복수의 공명 유도 셀(302 내지 324)을 포함한다. 여기서, 공명 유도 셀(302 내지 324) 각각은 혼(horn) 형상이 아닌 파이프(pipe) 형상을 가질 수 있다. 공명 유도 셀(302 내지 324) 각각은 중공(S)을 가질 수 있으며, 음향 신호는 공명 유도 셀(302 내지 324)의 중공(S)을 통과하여 변환 모듈(104)로 입력될 수 있다. 또한, 도 2에서와 마찬가지로 공명 유도 셀(302 내지 324) 각각은 서로 다른 연장 길이(l1'내지 l12')를 가질 수 있으며, 공명 유도 셀(302 내지 324) 각각은 중공(S)을 통과하는 음향 신호에 의해 서로 다른 기본 주파수에서 공명을 일으킬 수 있다.
도 4는 본 발명의 실시예들에 따른 공명 유도 모듈(102)에서 음향 신호의 주파수 패턴을 변화시키는 과정을 설명하기 위한 도면이다. 도 4의 (a)는 A 방향에 위치한 음원(110)으로부터 발생된 음향 신호가 공명 유도 모듈(102) 및 변환 모듈(104)을 통과하였을 때 변화된 음향 신호의 주파수 패턴을 나타낸 그래프이며, 도 4의 (b)는 Z 방향에 위치한 음원(110)으로부터 발생된 음향 신호가 공명 유도 모듈(102) 및 변환 모듈(104)을 통과하였을 때 변화된 음향 신호의 주파수 패턴을 나타낸 그래프이다.
만약, 도 4의 (a)에서 볼 수 있는 바와 같이, 음원(110)이 A 방향에 위치한 경우 음원(110)과 가장 가까운 공명 유도 셀(312)에서 공명 유도 셀(312)의 연장 길이(l6')에 대응되는 기본 주파수의 배수에 해당하는 주파수 성분들이 증폭될 수 있다.
만약, 도 4의 (b)에서 볼 수 있는 바와 같이, 음원(110)이 Z 방향에 위치한 경우 음원(110)과 가장 가까운 공명 유도 셀(318)에서 공명 유도 셀(318)의 연장 길이(l9')에 대응되는 기본 주파수의 배수에 해당하는 주파수 성분들이 증폭될 수 있다. 즉, 공명 유도 모듈(102)은 다방향으로 배치되며 연장 길이가 서로 다른 복수의 공명 유도 셀을 구비함으로써, 음원(110)의 방향에 따라 음향 신호의 주파수 패턴을 변화시킬 수 있다.
한편, 변환 모듈(104)은 공명 유도 모듈(102)을 통과한 음향 신호를 디지털 신호로 변환한다. 공명 유도 모듈(102)은 통과하는 음향 신호는 아날로그 신호이다. 변환 모듈(104)은 후술할 추정 모듈(106)에서의 음향 신호 분석을 위해 음향 신호를 디지털 신호로 변환한다. 변환 모듈(104)은 아날로그-디지털 변환기(ADC ; Analog-Digital Converter)일 수 있으며, 예를 들어 마이크, 휴대폰 등이 될 수 있다.
변환 모듈(104)은 공명 유도 셀(202 내지 222)의 중심에 배치될 수 있다. 상술한 바와 같이, 공명 유도 셀(202 내지 222) 각각은 변환 모듈(104)을 중심으로 다방향으로 연장될 수 있다. 변환 모듈(104)은 디지털 신호를 추정 모듈(106)로 전송할 수 있다. 상술한 바와 같이, 변환 모듈(104)은 예를 들어, 마이크가 될 수 있으며, 이 경우 추정 모듈(106)과 유선 연결되어 디지털 신호를 추정 모듈(106)로 전송할 수 있다. 또한, 추정 모듈(106)은 예를 들어, 휴대폰이 될 수 있으며, 이 경우 와이파이, 블루투스 등을 통해 디지털 신호를 추정 모듈(106)로 전송할 수 있다. 변환 모듈(104)이 디지털 신호를 추정 모듈(106)로 전송하는 방식은 특별히 제한되지 않는다.
추정 모듈(106)은 변환 모듈(104)에서 변환된 디지털 신호의 주파수 패턴을 분석하여 음원(110)의 방향을 추정한다. 추정 모듈(106)은 예를 들어, 신호 분석 및 연산 기능이 포함된 컴퓨터, 노트북, 휴대폰, PDA 등의 전자 기기가 될 수 있다. 추정 모듈(106)은 변환 모듈(104)과 유선 또는 무선 연결되어 변환 모듈(104)로부터 디지털 신호를 수신할 수 있다.
먼저, 추정 모듈(106)은 변환 모듈(104)에서 변환된 디지털 신호의 기본 주파수를 획득한다. 추정 모듈(106)은 예를 들어, 캡스트럼(Cepstrum) 알고리즘을 이용하여 변환 모듈(104)에서 변환된 디지털 신호의 기본 주파수를 획득할 수 있다. 캡스트럼 알고리즘은 주파수 도메인의 주기성으로부터 기본 주파수를 획득하는 데 사용되는 알고리즘으로서, 다음의 수학식 1 내지 4를 이용하여 기본 주파수를 획득할 수 있다.
[수학식 1]
Figure 112015026594332-pat00001

[수학식 2]
Figure 112015026594332-pat00002

[수학식 3]
Figure 112015026594332-pat00003

[수학식 4]
Figure 112015026594332-pat00004

수학식 1은 시간 영역의 음향 신호 x[n]을 데이터 길이 N에 대해 제 1 푸리에 변환(DFT ; Discrete Fourier Transform)하는 과정을 나타내며, 수학식 2는 수학식 1에 의해 푸리에 변환된 X[k] 크기의 로그값을 제 2 푸리에 변환(DFT)하는 과정을 나타낸다. 수학식 2의 결과값
Figure 112015026594332-pat00005
은 음향 신호의 기본 주파수를 포함하며, 이는 수학식 3에 의해 검출될 수 있다. r에 대한 주파수 도메인에서
Figure 112015026594332-pat00006
의 높은 크기(higher magnitude)는 주기성이 강함을 의미한다. 수학식 3은 수학식 2의 결과값
Figure 112015026594332-pat00007
에 argmax 함수를 적용한 식이며, 수학식 4로부터 음향 신호의 기본 주파수가 계산될 수 있다. 여기서, fs는 x[n] sequence 의 샘플링 주파수를 의미한다.
한편, 여기서는 추정 모듈(106)이 캡스트럼 알고리즘을 이용하여 음향 신호의 기본 주파수를 획득하는 것으로 설명하였으나, 이는 하나의 실시예에 불과할 뿐 음향 신호의 기본 주파수를 획득하는 수단이 이에 한정되는 것은 아니다. 예를 들어, 추정 모듈(106)은 컨볼루션(convolution) 연산을 이용하여 음향 신호의 기본 주파수를 획득할 수도 있다.
다음으로, 추정 모듈(106)은 캡스트럼 알고리즘 등을 통해 획득한 기본 주파수에 대응되는 공명 유도 셀의 연장 길이를 획득한다.
도 5는 공명 유도 셀의 연장 길이에 따른 음향 신호의 기본 주파수를 나타낸 그래프이다. 상술한 바와 같이, 공명 유도 셀 각각은 서로 다른 연장 길이를 가질 수 있으며, 공명 유도 셀의 연장 길이가 길수록 음향 신호의 기본 주파수는 작아질 수 있다. 추정 모듈(106)은 공명 유도 셀의 길이에 따른 음향 신호의 기본 주파수를 측정하여 도 5와 같이 모델링할 수 있으며, 이를 내부 데이터베이스(미도시)에 저장할 수 있다.
도 6 및 도 7은 본 발명의 일 실시예에 따른 추정 모듈(106)에서 획득한 기본 주파수에 대응되는 공명 유도 셀의 연장 길이를 획득하는 과정을 설명하기 위한 그래프이다. 도 6에서는 음원(110)이 Z 방향에 있는 것으로 가정하며, 도 7에서는 음원(110)이 A 방향에 있는 것으로 가정한다.
상술한 바와 같이, 수학식 2의 결과값
Figure 112015026594332-pat00008
은 음향 신호의 기본 주파수를 포함하며, r에 대한 주파수 도메인에서
Figure 112015026594332-pat00009
의 높은 크기(higher magnitude)는 주기성이 강함을 의미한다.
도 6을 참조하면, 공명 유도 셀의 연장 길이(radial length)에 대한
Figure 112015026594332-pat00010
의 크기(magnitude) 분포를 알 수 있으며, 공명 유도 셀의 연장 길이가 약 50.9cm 일 때
Figure 112015026594332-pat00011
이 약 70.2 의 최대값을 가짐을 확인할 수 있다. 추정 모듈(106)은 내부 데이터베이스를 참조하여 약 50cm의 연장 길이를 갖는 공명 유도 셀을 추출할 수 있으며, 해당 공명 유도 셀의 연장 방향을 음원(110)의 방향으로 추정할 수 있다. 만약, 추정 모듈(106)에서 획득한 연장 길이를 갖는 공명 유도 셀이 없는 경우, 추정 모듈(106)은 획득한 연장 길이와 가장 가까운 값을 갖는 공명 유도 셀의 연장 방향을 음원(110)의 방향으로 추정할 수 있으며, 또한 획득한 연장 길이와 가장 가까운 값을 갖는 공명 유도 셀과 인전합 공명 유도 셀의 연장 길이를 이용하여 음원(110)의 방향을 계산할 수도 있다.
도 7에서는 공명 유도 셀의 연장 길이가 약 29.8 cm 일 때
Figure 112015026594332-pat00012
이 약 66.8 의 최대값을 가짐을 확인할 수 있다. 추정 모듈(106)은 내부 데이터베이스를 참조하여 약 30cm의 연장 길이를 갖는 공명 유도 셀을 추출할 수 있으며, 해당 공명 유도 셀의 연장 방향을 음원(110)의 방향으로 추정할 수 있다.
도 8은 본 발명의 일 실시예에 따른 추정 모듈(106)에서 추정한 음원(110)의 방향을 나타낸 도면이다. 도 8에 도시된 바와 같이, 추정 모듈(106)에서 추정된 음원(110)의 방향은 디스플레이 모듈(미도시)에서 디스플레이될 수 있다. 여기서는 음원(110)의 방향을 타원 형상의 라인으로 도시하였으나, 이는 하나의 실시예에 불과하며 음원(110)의 방향을 나타내는 방식이 이에 한정되는 것은 아니다.
이상과 같이, 본 발명의 실시예들에 따르면, 공명 유도 모듈의 구조적인 특징을 이용하여 음원의 방향을 간편하고 정확하게 추정할 수 있다. 또한, 본 발명의 실시예들에 따르면, 하나의 변환 모듈 및 이를 둘러싼 공명 유도 모듈을 이용함으로써, 다수의 마이크가 필요한 종래 기술에 비해 음원 방향의 추정에 따른 비용 및 시간을 크게 줄일 수 있다. 이러한 음원 방향 추정 시스템(100)은 예를 들어, 군인의 헬멧에 적용되어 주변에서 발생한 소리의 방향을 추정하는 데 사용되거나, 차량에 적용되어 사각 지대에서 접근하는 차량의 방향을 추정하는 데 사용되는 등 다양한 분야에서 적용될 수 있다.
도 9는 본 발명의 일 실시예에 따른 음원 방향 추정 방법을 설명하기 위한 흐름도이다.
먼저, 공명 유도 모듈(102)은 음원(110)의 방향에 따라 음향 신호의 주파수 패턴을 변화시킨다(S902). 상술한 바와 같이, 공명 유도 모듈(102)은 중공(S)을 갖는 복수의 공명 유도 셀(202 내지 222)을 포함한다. 공명 유도 셀(202 내지 222) 각각은 다방향으로 연장되고 서로 다른 연장 길이(l1 내지 l11)를 가질 수 있으며, 중공(S)을 통과하는 음향 신호에 의해 서로 다른 기본 주파수에서 공명을 일으킬 수 있다. 즉, 공명 유도 모듈(102)은 음원(110)과 가장 가까운 공명 유도 셀의 연장 길이와 대응되는 기본 주파수의 배수에 해당하는 주파수 성분들을 증폭시킴으로써 음향 신호의 주파수 패턴을 변화시킬 수 있다.
다음으로, 변환 모듈(104)은 공명 유도 모듈(102)을 통과한 음향 신호를 디지털 신호로 변환한다(S904). 변환 모듈(104)은 아날로그-디지털 변환기(ADC ; Analog-Digital Converter)일 수 있으며, 예를 들어 마이크, 휴대폰 등이 될 수 있다.
마지막으로, 추정 모듈(106)은 변환 모듈(104)에서 변환된 디지털 신호의 주파수 패턴을 분석하여 음원(110)의 방향을 추정한다(S906). 추정 모듈(106)은 캡스트럼 알고리즘 등을 이용하여 디지털 신호의 기본 주파수를 획득하고, 획득한 기본 주파수에 대응되는 공명 유도 셀의 연장 길이를 획득할 수 있다. 이에 따라, 추정 모듈(106)은 획득한 연장 길이를 갖는 공명 유도 셀의 연장 방향을 음원(110)의 방향으로 추정할 수 있다. 추정 모듈(106)이 음원(110)의 방향을 추정하는 구체적인 방법은 앞에서 자세히 설명하였는바, 여기서는 그 자세한 설명을 생략하기로 한다.
이상에서 대표적인 실시예를 통하여 본 발명에 대하여 상세하게 설명하였으나, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 전술한 실시예에 대하여 본 발명의 범주에서 벗어나지 않는 한도 내에서 다양한 변형이 가능함을 이해할 것이다. 그러므로 본 발명의 권리범위는 설명된 실시예에 국한되어 정해져서는 안 되며, 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.
100 : 음원 방향 추정 시스템
102 : 공명 유도 모듈
104 : 변환 모듈
106 : 추정 모듈
110 : 음원
202, 204, 206, 208, 210, 212, 214, 216, 218, 220, 222, 302, 304, 306, 308, 310, 312, 314, 416, 318, 320, 322, 324 : 공명 유도 셀

Claims (12)

  1. 다방향으로 연장되며 연장 길이가 서로 다른 복수의 공명 유도 셀을 구비함으로써, 음원과 가장 가까운 공명 유도 셀의 연장 길이와 대응되는 기본 주파수의 배수에 해당하는 주파수 성분들을 증폭시켜 상기 음원의 방향에 따라 음향 신호의 주파수 패턴을 변화시키는 공명 유도 모듈;
    상기 공명 유도 모듈을 통과한 상기 음향 신호를 디지털 신호로 변환하는 변환 모듈; 및
    상기 디지털 신호의 기본 주파수를 획득하고, 획득한 상기 기본 주파수에 대응되는 공명 유도 셀의 연장 길이를 획득하고, 획득한 상기 연장 길이를 갖는 공명 유도 셀의 연장 방향을 상기 음원의 방향으로 추정하는 추정 모듈을 포함하는, 음원 방향 추정 시스템.
  2. 삭제
  3. 삭제
  4. 청구항 1에 있어서,
    상기 추정 모듈은, 캡스트럼(Cepstrum) 알고리즘을 이용하여 상기 디지털 신호의 기본 주파수를 획득하는, 음원 방향 추정 시스템.
  5. 청구항 1에 있어서,
    상기 공명 유도 셀 각각은, 중공을 갖는 혼(horn) 형상인, 음원 방향 추정 시스템.
  6. 청구항 1에 있어서,
    상기 공명 유도 셀 각각은, 중공을 갖는 파이프(pipe) 형상인, 음원 방향 추정 시스템.
  7. 청구항 1에 있어서,
    상기 공명 유도 셀 각각은, 상기 변환 모듈을 중심으로 다방향으로 연장되는, 음원 방향 추정 시스템.
  8. 청구항 1에 있어서,
    상기 공명 유도 셀 각각은, 30cm 내지 50cm 의 연장 길이를 갖는, 음원 방향 추정 시스템.
  9. 다방향으로 연장되며 연장 길이가 서로 다른 복수의 공명 유도 셀을 구비하는 공명 유도 모듈에서, 음원과 가장 가까운 공명 유도 셀의 연장 길이와 대응되는 기본 주파수의 배수에 해당하는 주파수 성분들을 증폭시켜 상기 음원의 방향에 따라 음향 신호의 주파수 패턴을 변화시키는 단계;
    변환 모듈에서, 상기 공명 유도 모듈을 통과한 상기 음향 신호를 디지털 신호로 변환하는 단계; 및
    추정 모듈에서, 상기 디지털 신호의 기본 주파수를 획득하는 단계;
    상기 추정 모듈에서, 획득한 상기 기본 주파수에 대응되는 공명 유도 셀의 연장 길이를 획득하는 단계; 및
    상기 추정 모듈에서, 획득한 상기 연장 길이를 갖는 공명 유도 셀의 연장 방향을 상기 음원의 방향으로 추정하는 단계를 포함하는, 음원 방향 추정 방법.
  10. 삭제
  11. 삭제
  12. 청구항 9에 있어서,
    상기 디지털 신호의 기본 주파수를 획득하는 단계는, 캡스트럼(Cepstrum) 알고리즘을 이용하여 상기 디지털 신호의 기본 주파수를 획득하는, 음원 방향 추정 방법.
KR1020150037638A 2015-03-18 2015-03-18 음원 방향 추정 시스템 및 방법 KR101621827B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020150037638A KR101621827B1 (ko) 2015-03-18 2015-03-18 음원 방향 추정 시스템 및 방법
PCT/KR2015/013745 WO2016148379A1 (ko) 2015-03-18 2015-12-15 음원 방향 추정 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150037638A KR101621827B1 (ko) 2015-03-18 2015-03-18 음원 방향 추정 시스템 및 방법

Publications (1)

Publication Number Publication Date
KR101621827B1 true KR101621827B1 (ko) 2016-05-17

Family

ID=56109727

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150037638A KR101621827B1 (ko) 2015-03-18 2015-03-18 음원 방향 추정 시스템 및 방법

Country Status (2)

Country Link
KR (1) KR101621827B1 (ko)
WO (1) WO2016148379A1 (ko)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002112381A (ja) * 2000-10-03 2002-04-12 Melco Inc 音源位置推定装置および音源位置推定方法
JP2012042664A (ja) 2010-08-18 2012-03-01 Nippon Telegr & Teleph Corp <Ntt> 音源パラメータ推定装置と音源分離装置とそれらの方法と、プログラムと記憶媒体
JP2013167698A (ja) 2012-02-14 2013-08-29 Nippon Telegr & Teleph Corp <Ntt> 音源ごとに信号のスペクトル形状特徴量を推定する装置、方法、目的信号のスペクトル特徴量を推定する装置、方法、プログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100780669B1 (ko) * 2006-03-30 2007-11-30 포스데이타 주식회사 디지털 주파수 상향 변환 장치 및 방법
KR101415755B1 (ko) * 2012-06-14 2014-07-09 주식회사 이엠텍 음압 조절 기능을 지닌 음향변환장치

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002112381A (ja) * 2000-10-03 2002-04-12 Melco Inc 音源位置推定装置および音源位置推定方法
JP2012042664A (ja) 2010-08-18 2012-03-01 Nippon Telegr & Teleph Corp <Ntt> 音源パラメータ推定装置と音源分離装置とそれらの方法と、プログラムと記憶媒体
JP2013167698A (ja) 2012-02-14 2013-08-29 Nippon Telegr & Teleph Corp <Ntt> 音源ごとに信号のスペクトル形状特徴量を推定する装置、方法、目的信号のスペクトル特徴量を推定する装置、方法、プログラム

Also Published As

Publication number Publication date
WO2016148379A1 (ko) 2016-09-22

Similar Documents

Publication Publication Date Title
JP6943248B2 (ja) 個人認証システム、個人認証装置、個人認証方法および個人認証プログラム
CN108538320B (zh) 录音控制方法和装置、可读存储介质、终端
KR101238362B1 (ko) 음원 거리에 따라 음원 신호를 여과하는 방법 및 장치
JP2019191558A (ja) 音声を増幅する方法及び装置
US9860665B2 (en) Method and apparatus for processing audio signal based on speaker location information
WO2014161309A1 (zh) 一种移动终端实现声源定位的方法及装置
JP6003472B2 (ja) 音声解析装置、音声解析システムおよびプログラム
CN109979469B (zh) 信号处理方法、设备及存储介质
US10262678B2 (en) Signal processing system, signal processing method and storage medium
KR20200012866A (ko) 오디오 코더 윈도우 사이즈 및 시간-주파수 변환
CN106031196B (zh) 信号处理装置、方法以及程序
WO2020037282A1 (en) Spatial audio signal encoder
EP2996314A1 (en) Voice processing device, voice processing method, and computer program for voice processing
CN110136733B (zh) 一种音频信号的解混响方法和装置
KR100873000B1 (ko) 마이크 어레이를 이용한 방향성 음원 필터링 시스템 및 그방법
KR101621827B1 (ko) 음원 방향 추정 시스템 및 방법
CN105830152B (zh) 集音装置、集音装置的输入信号校正方法以及移动设备信息系统
US20150098588A1 (en) Apparatus and method for controlling sound output
KR101721501B1 (ko) 공명 유도 모듈과 이를 이용한 음원 방향 추정 시스템 및 방법
Jiang et al. Indoor silent object localization using ambient acoustic noise fingerprinting
US11837228B2 (en) System and method for data augmentation for multi-microphone signal processing
CN115150712A (zh) 一种车载麦克风系统及汽车
JP6515591B2 (ja) 音声解析装置、音声解析システムおよびプログラム
CN112741622B (zh) 一种测听系统、测听方法、装置、耳机及终端设备
KR102484195B1 (ko) 음성 강화 장치 및 음성 강화 방법

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20190429

Year of fee payment: 4