KR101090893B1 - 음원 방향 검지 시스템 및 방법 - Google Patents
음원 방향 검지 시스템 및 방법 Download PDFInfo
- Publication number
- KR101090893B1 KR101090893B1 KR1020100022697A KR20100022697A KR101090893B1 KR 101090893 B1 KR101090893 B1 KR 101090893B1 KR 1020100022697 A KR1020100022697 A KR 1020100022697A KR 20100022697 A KR20100022697 A KR 20100022697A KR 101090893 B1 KR101090893 B1 KR 101090893B1
- Authority
- KR
- South Korea
- Prior art keywords
- time delay
- sound source
- delay difference
- detecting
- frequency
- Prior art date
Links
- 230000004807 localization Effects 0.000 title 1
- 238000001514 detection method Methods 0.000 claims abstract description 48
- 238000000034 method Methods 0.000 claims description 25
- 230000006870 function Effects 0.000 description 11
- 238000013528 artificial neural network Methods 0.000 description 9
- 210000005069 ears Anatomy 0.000 description 8
- 238000001914 filtration Methods 0.000 description 7
- 230000001537 neural effect Effects 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000007613 environmental effect Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 210000003128 head Anatomy 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 240000007817 Olea europaea Species 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 210000003926 auditory cortex Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 210000003477 cochlea Anatomy 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 210000000883 ear external Anatomy 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010304 firing Methods 0.000 description 1
- 210000003552 inferior colliculi Anatomy 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/027—Spatial or constructional arrangements of microphones, e.g. in dummy heads
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/04—Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- General Health & Medical Sciences (AREA)
- Stereophonic System (AREA)
- Circuit For Audible Band Transducer (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Abstract
Description
도 2는 종래의 방향 검지 기술을 두 귀를 이용한 방향 검지 기법에 적용할 경우의 문제점을 설명하기 위한 도면이다.
도 3은 사람의 방향 검지 시스템과 본 발명의 일 실시예에 따른 음원 방향 검지 시스템의 대응 관계를 설명하기 위한 도이다.
도 4는 본 발명의 일 실시예에 따른 방향 검지 시스템을 개략적으로 도시한 도면이다.
도 5a 내지 도 5d는 본 발명의 일 실시예에 따른 음원 방향 검지 시스템의 필터들을 적용한 결과를 나타내는 그래프이다.
도 6은 본 발명의 일 실시예에 따른 음원 방향 검지 방법의 개략적인 순서도이다.
Claims (12)
- 음원으로부터 신호를 입력받는 복수의 마이크로폰;
스파스 코딩을 이용하여 상기 복수의 마이크로폰으로 입력된 신호를 시간, 주파수 및 크기로 분리한 후 상기 복수의 마이크로폰으로 입력된 신호 간의 시간 지연차를 주파수별로 추출하는 시간 지연차 추출부; 및
상기 시간 지연차를 이용하여 상기 음원의 방향을 검지하는 음원 방향 검지부를 포함하고,
상기 지연차 추출부는 감마톤 필터뱅크를 이용하여 스파스 코딩하는 것을 특징으로 하는 음원 방향 검지 시스템.
- 삭제
- 제1항에 있어서,
상기 음원 방향 검지부는,
상기 시간 지연차를 학습하고, 학습된 상기 시간 지연차를 이용하여 음원의 방향을 검지하는 것을 특징으로 하는 음원 방향 검지 시스템.
- 제1항에 있어서,
상기 시간 지연차 추출부 및 상기 음원 방향 검지부의 사이에, 상기 시간 지연차의 가우시안 평균을 구하여 상기 가우시안 평균을 중심으로 오차가 미리 설정된 값 이상인 시간 지연차를 제거하는 제1 필터를 더 포함하는 것을 특징으로 하는 음원 방향 검지 시스템.
- 제1항에 있어서,
상기 시간 지연차 추출부 및 상기 음원 방향 검지부의 사이에, 상기 시간 지연차 중 음성대역 안에 있는 시간 지연차만을 통과시키는 제2 필터를 더 포함하는 것을 특징으로 하는 음원 방향 검지 시스템.
- 제1항에 있어서,
상기 시간 지연차 추출부 및 상기 음원 방향 검지부의 사이에, 상기 시간 지연차의 계수가 미리 설정된 임계값보다 작은 시간 지연차만을 통과시키는 제3 필터를 더 포함하는 것을 특징으로 하는 음원 방향 검지 시스템.
- 음원으로부터 신호를 입력받는 단계;
스파스 코딩을 이용하여 상기 신호를 시간, 주파수 및 크기로 분리하는 단계;
상기 신호 간의 시간 지연차를 주파수별로 추출하는 단계; 및
상기 시간 지연차를 이용하여 상기 음원의 방향을 검지하는 단계를 포함하고,
상기 분리하는 단계는 감마톤 필터뱅크를 이용하여 스파스 코딩을 하는 단계를 포함하는 것을 특징으로 하는 음원 방향 검지 방법.
- 삭제
- 제7항에 있어서,
상기 검지하는 단계는,
상기 시간 지연차를 학습하는 단계; 및
학습된 상기 시간 지연차를 이용하여 음원의 방향을 검지하는 단계를 포함하는 것을 특징으로 하는 음원 방향 검지 방법.
- 제7항에 있어서,
상기 추출하는 단계 및 상기 검지하는 단계 사이에, 상기 시간 지연차의 가우시안 평균을 구하여 상기 가우시안 평균을 중심으로 오차가 미리 설정된 값 이상인 시간 지연차를 제거하는 단계를 더 포함하는 것을 특징으로 하는 음원 방향 검지 방법.
- 제7항에 있어서,
상기 추출하는 단계 및 상기 검지하는 단계 사이에, 상기 시간 지연차 중 음성대역 안에 있는 시간 지연차만을 통과시키는 단계를 더 포함하는 것을 특징으로 하는 음원 방향 검지 방법.
- 제7항에 있어서,
상기 추출하는 단계 및 상기 검지하는 단계 사이에, 상기 시간 지연차의 계수가 미리 설정된 임계값보다 작은 시간 지연차만을 통과시키는 단계를 더 포함하는 것을 특징으로 하는 음원 방향 검지 방법.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020100022697A KR101090893B1 (ko) | 2010-03-15 | 2010-03-15 | 음원 방향 검지 시스템 및 방법 |
US12/844,004 US8270632B2 (en) | 2010-03-15 | 2010-07-27 | Sound source localization system and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020100022697A KR101090893B1 (ko) | 2010-03-15 | 2010-03-15 | 음원 방향 검지 시스템 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20110103572A KR20110103572A (ko) | 2011-09-21 |
KR101090893B1 true KR101090893B1 (ko) | 2011-12-08 |
Family
ID=44559985
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020100022697A KR101090893B1 (ko) | 2010-03-15 | 2010-03-15 | 음원 방향 검지 시스템 및 방법 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8270632B2 (ko) |
KR (1) | KR101090893B1 (ko) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2446291A4 (en) * | 2009-06-26 | 2012-11-28 | Lizard Technology Aps | TONORTUNGSROBOTER |
US9689959B2 (en) * | 2011-10-17 | 2017-06-27 | Foundation de l'Institut de Recherche Idiap | Method, apparatus and computer program product for determining the location of a plurality of speech sources |
US9881616B2 (en) * | 2012-06-06 | 2018-01-30 | Qualcomm Incorporated | Method and systems having improved speech recognition |
GB2514184B (en) * | 2013-05-17 | 2016-05-04 | Canon Kk | Method for determining a direction of at least one sound source from an array of microphones |
US9395723B2 (en) | 2013-09-30 | 2016-07-19 | Five Elements Robotics, Inc. | Self-propelled robot assistant |
CN103985390A (zh) * | 2014-05-20 | 2014-08-13 | 北京安慧音通科技有限责任公司 | 一种基于伽马通相关图语音特征参数提取方法 |
US10063965B2 (en) * | 2016-06-01 | 2018-08-28 | Google Llc | Sound source estimation using neural networks |
US9883142B1 (en) | 2017-03-21 | 2018-01-30 | Cisco Technology, Inc. | Automated collaboration system |
US11190896B1 (en) | 2018-09-27 | 2021-11-30 | Apple Inc. | System and method of determining head-related transfer function parameter based on in-situ binaural recordings |
CN111462766B (zh) * | 2020-04-09 | 2022-04-26 | 浙江大学 | 一种基于稀疏编码的听觉脉冲编码方法及系统 |
CN112904279B (zh) * | 2021-01-18 | 2024-01-26 | 南京工程学院 | 基于卷积神经网络和子带srp-phat空间谱的声源定位方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6719700B1 (en) * | 2002-12-13 | 2004-04-13 | Scimed Life Systems, Inc. | Ultrasound ranging for localization of imaging transducer |
NO318096B1 (no) * | 2003-05-08 | 2005-01-31 | Tandberg Telecom As | Arrangement og fremgangsmate for lokalisering av lydkilde |
US7495998B1 (en) * | 2005-04-29 | 2009-02-24 | Trustees Of Boston University | Biomimetic acoustic detection and localization system |
KR100943224B1 (ko) | 2007-10-16 | 2010-02-18 | 한국전자통신연구원 | 음원 추적이 가능한 지능형 로봇 및 방법 |
US20100217590A1 (en) * | 2009-02-24 | 2010-08-26 | Broadcom Corporation | Speaker localization system and method |
-
2010
- 2010-03-15 KR KR1020100022697A patent/KR101090893B1/ko active IP Right Grant
- 2010-07-27 US US12/844,004 patent/US8270632B2/en active Active
Non-Patent Citations (1)
Title |
---|
논문(2009.08) |
Also Published As
Publication number | Publication date |
---|---|
US20110222707A1 (en) | 2011-09-15 |
KR20110103572A (ko) | 2011-09-21 |
US8270632B2 (en) | 2012-09-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101090893B1 (ko) | 음원 방향 검지 시스템 및 방법 | |
Dietz et al. | Auditory model based direction estimation of concurrent speakers from binaural signals | |
US6792118B2 (en) | Computation of multi-sensor time delays | |
JP4841863B2 (ja) | バイノーラル信号に基づいた音源定位 | |
AU2010346387B2 (en) | Device and method for direction dependent spatial noise reduction | |
EP2603018B1 (de) | Hörvorrichtung mit Sprecheraktivitätserkennung und Verfahren zum Betreiben einer Hörvorrichtung | |
WO2016025812A1 (en) | Binaurally integrated cross-correlation auto-correlation mechanism | |
Benichoux et al. | On the variation of interaural time differences with frequency | |
CN104575511B (zh) | 语音增强方法及装置 | |
KR20170034405A (ko) | 바람 잡음 검출을 위한 방법 및 장치 | |
KR102316671B1 (ko) | Cnn을 이용한 음향 처리방법 | |
Zhang et al. | Statistical method to identify key anthropometric parameters in HRTF individualization | |
Anumula et al. | An event-driven probabilistic model of sound source localization using cochlea spikes | |
CA2804449A1 (en) | System and method for measuring and validating the occlusion effect of a hearing aid user | |
Puffay et al. | Relating the fundamental frequency of speech with EEG using a dilated convolutional network | |
US20130034138A1 (en) | Time delay estimation | |
US10070220B2 (en) | Method for equalization of microphone sensitivities | |
Pirhosseinloo et al. | Time-Frequency Masking for Blind Source Separation with Preserved Spatial Cues. | |
Kayser et al. | Robust auditory localization using probabilistic inference and coherence-based weighting of interaural cues | |
Goodman et al. | Learning to localise sounds with spiking neural networks | |
Chou et al. | A binaural algorithm for space and pitch detection | |
Koshkina et al. | Localization in static and dynamic hearing scenarios: Utilization of machine learning and binaural auditory model | |
Karthik et al. | Subband Selection for Binaural Speech Source Localization. | |
Smith | Using depressing synapses for phase locked auditory onset detection | |
Wrigley et al. | Binaural speech separation using recurrent timing neural networks for joint F0-localisation estimation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20141201 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20151126 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20161201 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20171201 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20181203 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20191203 Year of fee payment: 9 |