CN106125048B - 一种声源定位方法及装置 - Google Patents

一种声源定位方法及装置 Download PDF

Info

Publication number
CN106125048B
CN106125048B CN201610555249.8A CN201610555249A CN106125048B CN 106125048 B CN106125048 B CN 106125048B CN 201610555249 A CN201610555249 A CN 201610555249A CN 106125048 B CN106125048 B CN 106125048B
Authority
CN
China
Prior art keywords
sound
sound transducer
transducer
high frequency
frequency ratio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610555249.8A
Other languages
English (en)
Other versions
CN106125048A (zh
Inventor
高娅
乔刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Dahua Technology Co Ltd
Original Assignee
Zhejiang Dahua Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Dahua Technology Co Ltd filed Critical Zhejiang Dahua Technology Co Ltd
Priority to CN201610555249.8A priority Critical patent/CN106125048B/zh
Publication of CN106125048A publication Critical patent/CN106125048A/zh
Priority to PCT/CN2016/114014 priority patent/WO2018010398A1/en
Priority to EP16908720.2A priority patent/EP3469391B1/en
Priority to US16/246,428 priority patent/US10466334B2/en
Application granted granted Critical
Publication of CN106125048B publication Critical patent/CN106125048B/zh
Priority to US16/664,745 priority patent/US10816634B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • G01S3/802Systems for determining direction or deviation from predetermined direction
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
    • G01S5/22Position of source determined by co-ordinating a plurality of position lines defined by path-difference measurements
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • G01S3/801Details
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • G01S3/802Systems for determining direction or deviation from predetermined direction
    • G01S3/803Systems for determining direction or deviation from predetermined direction using amplitude comparison of signals derived from receiving transducers or transducer systems having differently-oriented directivity characteristics
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • G01S3/802Systems for determining direction or deviation from predetermined direction
    • G01S3/805Systems for determining direction or deviation from predetermined direction using adjustment of real or effective orientation of directivity characteristics of a transducer or transducer system to give a desired condition of signal derived from that transducer or transducer system, e.g. to give a maximum or minimum signal
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
    • G01S5/20Position of source determined by a plurality of spaced direction-finders
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
    • G01S5/30Determining absolute distances from a plurality of spaced points of known location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/59Context or environment of the image inside of a vehicle, e.g. relating to seat occupancy, driver state or inner lighting conditions
    • G06V20/597Recognising the driver's state or behaviour, e.g. attention or drowsiness
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/06Decision making techniques; Pattern matching strategies
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
    • H04N7/183Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a single remote source
    • H04N7/185Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a single remote source from a mobile camera, e.g. for remote control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/02Casings; Cabinets ; Supports therefor; Mountings therein
    • H04R1/028Casings; Cabinets ; Supports therefor; Mountings therein associated with devices performing functions other than acoustics, e.g. electric candles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • G10L2025/906Pitch tracking

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Otolaryngology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Game Theory and Decision Science (AREA)
  • Theoretical Computer Science (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Emergency Alarm Devices (AREA)

Abstract

本发明提供一种声源定位方法及装置,其中,预先在球机上设置多个独立且特性相同的声音传感器,任意两个声音传感器间隔预设距离,该预距离离小于球机的直径,并且每个声音传感器朝向的方向相同,该方法包括:利用多个声音传感器采集来自同一声源的声音时域数据;针对每个声音传感器,将该声音传感器采集的声音时域数据转换为声音频域数据;根据该声音传感器对应的声音频域数据,计算该声音传感器对应的高频比值;根据多个声音传感器对应的高频比值,确定声源所处的方向,其中,声源所处的方向为声音传感器朝向的方向或者声音传感器背向的方向。本发明能够实现球机在360度范围内对声源进行定位,提高了声源定位的准确性。

Description

一种声源定位方法及装置
技术领域
本发明涉及声源定位技术领域,尤其涉及一种声源定位方法及装置。
背景技术
视频监控系统领域的研究一般集中在视频图像的分析上,然而随着安全防范系统要求的不断提高,传统的单一视频监控不能根据异常情况的发生转动到相应的位置捕捉画面。因此,一些学者提出了在监控系统领域引入音频,通过定位声源的方法确定声源的位置,进而调整摄像头转动,准确及时的捕捉到画面。
目前,基于麦克风阵列的声源定位技术受到越来越多的关注,基于时间差估计的双步定向算法对声源进行定位,此种算法的麦克风阵列中包括两个独立、特性相同且朝向相同的麦克风,其中,规定麦克风朝向的方向为正向,麦克风背向的方向为反向,此种算法只能够确定声源相对于正向的初始位置的偏移角度,就是说,只能够默认声源在正向,不能够实时的根据声源产生的声音信号确定声源所处的方向(正向或者反向)。
发明内容
本发明提供一种声源定位方法及装置,用于解决现有技术中不能够实时的根据声源产生的声音信号确定声源所处的方向(正向或者反向)的问题。
一种声源定位方法,预先在球机上设置多个独立且特性相同的声音传感器,任意两个声音传感器间隔预设距离,该预距离离小于球机的直径,并且每个声音传感器朝向的方向相同,该方法包括:
利用所述多个声音传感器采集来自同一声源的声音时域数据;
针对每个声音传感器,将该声音传感器采集的声音时域数据转换为声音频域数据;
根据该声音传感器对应的声音频域数据,计算该声音传感器对应的高频比值;
根据所述多个声音传感器对应的高频比值,确定所述声源所处的方向,其中,所述声源所处的方向为所述声音传感器朝向的方向或者所述声音传感器背向的方向。
所述方法中,所述声音传感器的个数为两个,所述预设距离大于或等于球机的半径。
所述方法中,所述声音传感器设置在球机上具有摄像头的一侧,所述声音传感器朝向的方向为:与两个所述声音传感器的连线垂直,并且,背向与两个所述声音传感器的连线平行的球机的直径。
所述方法中,根据两个所述声音传感器对应的高频比值,确定所述声源所处的方向,具体包括:
计算两个声音传感器对应的高频比值之间的差值;
确定所述差值的绝对值大于设定阈值时,确定所述声源所处的方向为所述声音传感器背向的方向;
确定所述差值的绝对值小于设定阈值时,确定所述声源所处的方向为所述声音传感器朝向的方向。
本发明实施例,通过不同声音传感器对应的高频比值的差值与设定阈值的比较,确定声源所处的方向。
所述方法中,根据该声音传感器对应的声音频域数据,计算该声音传感器对应的高频比值,具体包括:
计算该声音传感器采集到的M帧声音数据中的每帧声音数据的高频比值,M为大于1的整数;
计算M帧声音数据的高频比值的总和N;
将所述N除以M所得的结果作为该声音传感器对应的高频比值。
本发明实施例,通过计算M帧声音数据的高频比值的平均值,确定声音传感器对应的高频比值。
所述方法中,采用如下方式计算该声音传感器采集到的任一帧声音数据的高频比值:
其中,TH表示该声音传感器接收到的第i帧声音数据的高频比值,n为大于0的预设采样点,Xi_real为该声音传感器采集到的第i帧声音频域数据的实部,Xi_imag为该声音传感器采集到的第i帧声音频域数据的虚部。
本发明还提供一种声源定位装置,预先在所述球机上设置多个独立且特性相同的声音传感器,任意两个声音传感器间隔预设距离,该预距离离小于球机的直径,并且每个声音传感器朝向的方向相同,包括:
采集单元,用于利用所述多个声音传感器采集来自同一声源的声音时域数据;
转换单元,用于针对每个声音传感器,将该声音传感器采集的声音时域数据转换为声音频域数据;
计算单元,用于根据该声音传感器对应的声音频域数据,计算该声音传感器对应的高频比值;
方向确定单元,用于根据所述多个声音传感器对应的高频比值,确定所述声源所处的方向,其中,所述声源所处的方向为所述声音传感器朝向的方向或者所述声音传感器背向的方向。
所述装置中,所述声音传感器的个数为两个,所述预设距离大于或等于球机的半径。
所述装置中,所述声音传感器设置在球机上具有摄像头的一侧,所述声音传感器朝向的方向为:与两个所述声音传感器的连线垂直,并且,背向与两个所述声音传感器的连线平行的球机的直径。
所述装置中,所述方向确定单元具体用于:
计算两个声音传感器对应的高频比值之间的差值;
确定所述差值的绝对值大于设定阈值时,确定所述声源所处的方向为所述声音传感器背向的方向;
确定所述差值的绝对值小于设定阈值时,确定所述声源所处的方向为所述声音传感器朝向的方向。
所述装置中,所述计算单元具体用于:
计算该声音传感器采集到的M帧声音数据中的每帧声音数据的高频比值,M为大于1的整数;
计算M帧声音数据的高频比值的总和N;
将所述N除以M所得的结果作为该声音传感器对应的高频比值。
所述装置中,所述计算单元用于采用如下方式计算该声音传感器采集到的任一帧声音数据的高频比值:
其中,TH表示该声音传感器接收到的第i帧声音数据的高频比值,n为大于0的预设采样点,Xi_real为该声音传感器采集到的第i帧声音频域数据的实部,Xi_imag为该声音传感器采集到的第i帧声音频域数据的虚部。
利用本发明提供的声源定位方法及装置,具有以下有益效果:通过多个声音传感器对应的高频比值,确定声源所处的方向是否为多个声音传感器朝向的方向,并控制球机转动到声源所处的方向;之后,根据声音数据到达任意两个声音传感器的时延,确定球机在180度范围内的转动角度,从而实现了球机在360度范围内对声源进行定位,进而提高了声源定位的准确性。
附图说明
图1为本发明实施例提供的声源定位方法流程图;
图2为本发明实施例提供的根据声音传感器对应的高频比值确定声源所处的方向的一方法流程图;
图3为本发明实施例提供的在球机上设置声音传感器以及声音传感器的朝向示意图;
图4为本发明实施例提供的在球机上设置声音传感器示意图;
图5为本发明实施例提供的根据声音传感器对应的高频比值确定声源所处的方向的又一方法流程图;
图6为本发明实施例提供的计算声音传感器对应的高频比值的方法流程图;
图7为本发明实施例提供的具体实施例的实施过程流程图;
图8为本发明实施例提供的声源定位装置示意图。
具体实施方式
下面结合附图和实施例对本发明提供的声源定位方法及装置进行更详细地说明。
现有技术中,基于双麦克风阵列的声源定位技术,仅能够根据声音到达两个麦克风的时间差,确定球机在180度方向上的转动角度,假设,规定麦克风朝向的方向为正向,麦克风背向的方向为反向,现有技术的声源定位算法,只能够确定球机在正向对应的180度范围内的转动角度,就是说,只能够默认声源在正向,之后根据计算的转动角度转动球机,此时,如果声源在反向,根据默认的声源所处的方向转动球机后,会导致声源定位错误的问题。因此,目前业界亟需一种能够确定声源所处的方向为正向还是反向的技术方案,从而解决上述问题。
本发明实施例提供一种声源定位方法,用于确定声源所处的方向,其中,预先在球机上设置多个独立且特性相同的声音传感器,任意两个声音传感器间隔预设距离,并且,该预设距离小于球机的直径,所述预设距离为两个声音传感器的重心之间的直线距离,如图1所示,该方法包括:
步骤101,利用多个声音传感器采集来自同一声源的声音时域数据。
具体的,在球机云台上设置多个独立且特性相同的声音传感器,云台随着球机的转动而转动。声源发出声音后,利用位于球机上的多个声音传感器分别采集来自该声源的声音时域数据。其中,声音传感器可以为全向型麦克风。
步骤102,针对每个声音传感器,将该声音传感器采集的声音时域数据转换为声音频域数据。
具体的,根据预设的频域转换算法,将获取的声音时域数据转换为声音频域数据,频域转换算法可以为MCZT(改进的Z变换)、FFT(快速傅里叶变换)等算法。针对每个声音传感器,对该声音传感器采集的声音时域数据转换为声音频域数据后,得到该声音传感器对应的声音频域数据。
步骤103,根据该声音传感器对应的声音频域数据,计算该声音传感器对应的高频比值。
步骤104,根据多个声音传感器对应的高频比值,确定所述声源所处的方向,其中,所述声源所处的方向为所述声音传感器朝向的方向或者所述声音传感器背向的方向。
具体的,当遮挡物遮挡声音的传输时,声音的高频衰减较多,即,如果来自声源的声音数据被遮挡物遮挡后到达声音传感器,则,声音传感器接收到高频衰减后的声音数据。本发明实施例中,声音传感器对应的高频比值越大,说明到达该声音传感器的声音数据的高频衰减较重。
声音传感器对应的高频比值在一定程度上反映该声音传感器采集到的声音数据的高频衰减,通过比较多个声音传感器对应的高频比值,确定声源所处的方向。
本发明实施例,通过多个声音传感器对应的高频比值,确定声源所处的方向是否为多个声音传感器朝向的方向,并控制球机转动到声源所处的方向;之后,根据声音数据到达任意两个声音传感器的时延,确定球机在180度范围内的转动角度,从而实现了球机在360度范围内对声源进行定位,进而提高了声源定位的准确性,解决了现有技术中存在的问题。
优选地,预先在球机上设置两个独立且特性相同的声音传感器,两个声音传感器之间的预设距离小于球机的直径,并且,所述预设距离大于或等于球机的半径。
具体的,两个声音传感器分别为第一声音传感器和第二声音传感器,第一声音传感器和第二声音传感器对称设置在球机上。
优选地,所述声音传感器设置在球机上具有摄像头的一侧,所述声音传感器朝向的方向为:与两个所述声音传感器的连线垂直,并且,背向与两个所述声音传感器的连线平行的球机的直径,则根据两个所述声音传感器对应的高频比值,确定所述声源所处的方向,如图2所示,具体包括:
步骤201,计算两个声音传感器对应的高频比值之间的差值。
具体的,假设第一声音传感器对应的高频比值为第一高频比值,第二声音传感器对应的高频比值为第二高频比值,则,计算第一高频比值减去第二高频比值所得的差值。
步骤202,确定所述差值的绝对值大于设定阈值时,确定所述声源所处的方向为所述声音传感器背向的方向。
步骤203,确定所述差值的绝对值小于设定阈值时,确定所述声源所处的方向为所述声音传感器朝向的方向。
具体的,如图3所示,两个声音传感器mic1和mic2朝向的方向为与两个声音传感器的连线垂直并且背向与两个声音传感器的连线平行的球机的直径的方向,图3中d1为与两个声音传感器的连线平行的球机的直径,d2为两个声音传感器的连线,两个声音传感器采集到的来自声源的声音数据的高频衰减较轻或者没有衰减时,说明该声源为S’,即说明该声源所处的方向为图3中声音传感器朝向的方向,否则,说明该声源为S,即说明该声源所处的方向为图3中声音传感器背向的方向,图3中如果声源位于S处,则声音到达mic1的衰减较重,图3中,箭头所指的方向为声音传感器朝向的方向,声音传感器朝向的方向与d2垂直。
如图4所示,为本发明实施例提供的将两个声音传感器设置在球机上的示意图,其中,mic1和mic2均设置在球机中具有摄像头的一侧,优选地,mic1和mic2之间的连线(如图3中的d1)与水平面平行,mic1和mic2对称的设置在摄像头的中心线上并且mic1和mic2位于摄像头的两侧。图4提供的球机仅是一种形式的球机,本发明实施例还可应用到其它形式的球机,这里不做限定。
本优选实施方式中,默认声音传感器朝向的方向初始为:与两个所述声音传感器的连线垂直,并且,背向与两个所述声音传感器的连线平行的球机的直径。根据两个声音传感器朝向的方向可知,当声源在两个声音传感器朝向的方向发出声音时,两个声音传感器采集到的来自该声源的声音数据的高频衰减较轻或者没有衰减;当声源在两个声音传感器背向的方向发出声音时,至少一个声音传感器采集到的来自该声源的声音数据的高频衰减较重,即,该至少一个声音传感器采集来自该声源的声音数据时会有遮挡物遮挡声音数据,导致至少一个声音传感器采集到的声音数据产生较大的高频衰减。因此,本优选实施方式根据第一高频比值和第二高频比值的差值的绝对值与设定阈值的比较,确定声源所处的方向。
优选地,所述声音传感器设置在球机上具有摄像头的一侧,所述声音传感器朝向的方向为:与两个所述声音传感器的连线垂直,并且,朝向与两个所述声音传感器的连线平行的球机的直径,则根据两个所述声音传感器对应的高频比值,确定所述声源所处的方向,如图5所示,具体包括:
步骤301,计算两个声音传感器对应的高频比值之间的差值。
具体的,假设第一声音传感器对应的高频比值为第一高频比值,第二声音传感器对应的高频比值为第二高频比值,则,计算第一高频比值减去第二高频比值所得的差值。
步骤302,确定所述差值的绝对值大于设定阈值时,确定所述声源所处的方向为所述声音传感器朝向的方向。
步骤303,确定所述差值的绝对值小于设定阈值时,确定所述声源所处的方向为所述声音传感器背向的方向。
具体的,本发明实施例中声音传感器朝向的方向与图3中所示的声音传感器朝向的方向相反。设定阈值可根据实际应用场景设定,这里不做限定。
本优选实施方式中,默认声音传感器朝向的初始方向为:与两个所述声音传感器的连线垂直,并且,朝向与两个所述声音传感器的连线平行的球机的直径。根据两个声音传感器朝向的方向可知,当声源在两个声音传感器背向的方向发出声音时,两个声音传感器采集到的来自该声源的声音数据的高频衰减较轻或者没有衰减;当声源在两个声音传感器朝向的方向发出声音时,至少一个声音传感器采集到的来自该声源的声音数据的高频衰减较重。因此,本优选实施方式根据第一高频比值和第二高频比值的差值的绝对值与设定阈值的比较,确定声源所处的方向。
优选地,步骤103中,根据该声音传感器对应的声音频域数据,计算该声音传感器对应的高频比值,如图6所示,具体包括:
步骤401,计算该声音传感器采集到的M帧声音数据中的每帧声音数据的高频比值,M为大于1的整数。
具体的,针对每个声音传感器,M帧声音数据优选为该声音传感器连续采集到的M帧声音数据,针对每帧声音数据,确定该帧声音数据的高频比值。
步骤402,计算M帧声音数据的高频比值的总和N。
具体的,确定M帧声音数据中每帧声音数据的高频比值后,计算M帧声音数据的高频比值的总和N。
步骤403,将所述N除以M所得的结果作为该声音传感器对应的高频比值。
具体的,本发明实施例,针对每个声音传感器,将该声音传感器采集到的M帧声音数据的平均高频比值作为该声音传感器对应的高频比值。
本优选实施方式,通过计算多帧声音数据的高频比值的平均值,将该平均值作为该声音传感器对应的高频比值,使得计算得到的该声音传感器对应的高频比值更加稳定可靠。
优选地,采用如下方式计算该声音传感器采集到的任一帧声音数据的高频比值:
其中,TH表示该声音传感器接收到的第i帧声音数据的高频比值,n为大于0的预设采样点,Xi_real为该声音传感器采集到的第i帧声音频域数据的实部,Xi_imag为该声音传感器采集到的第i帧声音频域数据的虚部,i大于零,并且小于或等于M,i为整数。
其中,n可以为预先设定的特定数值,也可以为根据设定公式计算得到的数值,并且,n为正整数。具体的,根据设定公式计算得到n的方式为:
计算当q为整数时,n等于q;当q为非整数时,n等于q向上取整或者向下取整,其中,fhigh为声音绕射不过去的高频的值,即,当声音的频率高于fhigh时,会产生高频衰减;fs为采样率;常数256为采样点数;其中,可根据如下方式确定fhigh
根据衍射理论,障碍物尺寸大于一定声音频率的波长时,声音衰减比较大,按照声音的传播速度计算公式其中,c等于340米/秒,d表示球机的直径,a为预先设定的常数,比如a=200Hz。
下面结合具体实施例,对本发明实施例提供的声源定位方法进行详细说明。
实施例
假设设置在球机上的声音传感器的个数为两个,两个声音传感器设置在球机上具有摄像头的一侧,两个声音传感器朝向的方向为:与两个所述声音传感器的连线垂直,并且,背向与两个所述声音传感器的连线平行的球机的直径,则本发明实施例提供的声源定位方法,如图7所示,包括:
步骤501,利用第一声音传感器采集来自声源的第一声音时域数据以及利用第二声音传感器采集来自所述声源的第二声音时域数据。
具体的,第一声音传感器采集来自声源的第一声音时域数据,第二声音传感器采集来自该声源的第二声音时域数据;获取声音传感器采集的声音时域数据的方式为:从第一声音传感器中获取第一声音时域数据,并,从第二声音传感器中获取第二声音时域数据;或者,由第一声音传感器将其采集的第一声音时域数据上传至服务器侧的存储器,由第二声音传感器将其采集的第二声音时域数据上传至服务器侧的存储器,从服务器侧的存储器获取第一声音时域数据和第二声音时域数据。
其中,第一声音时域数据是指由第一声音传感器采集的来自声源的声音时域数据,第二声音时域数据是指由第二声音传感器采集的来自声源的声音时域数据,第一声音时域数据和第二声音时域数据来自同一声源。
步骤502,将所述第一声音时域数据转换为第一声音频域数据,并将所述第二声音时域数据转换为第二声音频域数据。
步骤503,根据第一声音频域数据,计算第一声音传感器对应的第一高频比值,并,根据第二声音频域数据,计算第二声音传感器对应的第二高频比值。
具体的,可根据图6提供的内容计算第一高频比值和第二高频比值。
步骤504,计算所述第一高频比值减去所述第二高频比值所得的差值。
步骤505,确定该差值的绝对值大于设定阈值时,确定所述声源所处的方向为所述声音传感器背向的方向。
步骤506,确定该差值的绝对值小于设定阈值时,确定所述声源所处的方向为所述声音传感器朝向的方向。
具体的,第一高频比值如果较大,说明到达第一声音传感器的声音数据的高频衰减较轻,否则,说明到达第一声音传感器的声音数据的高频衰减较重,同理,第二高频比值也具有这种特点。
本发明实施例还提供一种声源定位装置,预先在所述球机上设置多个独立且特性相同的声音传感器,任意两个声音传感器间隔预设距离,该预距离离小于球机的直径,并且每个声音传感器朝向的方向相同,如图8所示,包括:
采集单元801,用于利用所述多个声音传感器采集来自同一声源的声音时域数据;
转换单元802,用于针对每个声音传感器,将该声音传感器采集的声音时域数据转换为声音频域数据;
计算单元803,用于根据该声音传感器对应的声音频域数据,计算该声音传感器对应的高频比值;
方向确定单元804,用于根据所述多个声音传感器对应的高频比值,确定所述声源所处的方向,其中,所述声源所处的方向为所述声音传感器朝向的方向或者所述声音传感器背向的方向。
优选地,所述声音传感器的个数为两个,所述预设距离大于或等于球机的半径。
优选地,所述声音传感器设置在球机上具有摄像头的一侧,所述声音传感器朝向的方向为:与两个所述声音传感器的连线垂直,并且,背向与两个所述声音传感器的连线平行的球机的直径。
优选地,所述装置中,所述方向确定单元具体用于:
计算两个声音传感器对应的高频比值之间的差值;
确定所述差值的绝对值大于设定阈值时,确定所述声源所处的方向为所述声音传感器背向的方向;
确定所述差值的绝对值小于设定阈值时,确定所述声源所处的方向为所述声音传感器朝向的方向。
优选地,所述装置中,所述计算单元具体用于:
计算该声音传感器采集到的M帧声音数据中的每帧声音数据的高频比值,M为大于1的整数;
计算M帧声音数据的高频比值的总和N;
将所述N除以M所得的结果作为该声音传感器对应的高频比值。
优选地,所述装置中,所述计算单元用于采用如下方式计算该声音传感器采集到的任一帧声音数据的高频比值:
其中,TH表示该声音传感器接收到的第i帧声音数据的高频比值,n为大于0的预设采样点,Xi_real为该声音传感器采集到的第i帧声音频域数据的实部,Xi_imag为该声音传感器采集到的第i帧声音频域数据的虚部。
利用本发明实施例提供的声源定位方法及装置,具有以下有益效果:
通过多个声音传感器对应的高频比值,确定声源所处的方向是否为多个声音传感器朝向的方向,并控制球机转动到声源所处的方向;之后,根据声音数据到达任意两个声音传感器的时延,确定球机在180度范围内的转动角度,从而实现了球机在360度范围内对声源进行定位,进而提高了声源定位的准确性,解决了现有技术中存在的问题。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种声源定位方法,其特征在于,预先在球机上设置多个独立且特性相同的声音传感器,任意两个声音传感器间隔预设距离,该预设距离小于球机的直径,并且每个声音传感器朝向的方向相同,该方法包括:
利用所述多个声音传感器采集来自同一声源的声音时域数据;
针对每个声音传感器,将该声音传感器采集的声音时域数据转换为声音频域数据;
根据该声音传感器对应的声音频域数据,计算该声音传感器对应的高频比值;
根据所述多个声音传感器对应的高频比值,确定所述声源所处的方向,其中,所述声源所处的方向为所述声音传感器朝向的方向或者所述声音传感器背向的方向;
根据该声音传感器对应的声音频域数据,计算该声音传感器对应的高频比值,具体包括:
计算该声音传感器采集到的M帧声音数据中的每帧声音数据的高频比值,M为大于1的整数;
计算M帧声音数据的高频比值的总和N;
将所述N除以M所得的结果作为该声音传感器对应的高频比值;
其中,采用如下方式计算该声音传感器采集到的任一帧声音数据的高频比值:
其中,TH表示该声音传感器接收到的第i帧声音数据的高频比值,n为预先设定的大于零的整数,Xi_real为该声音传感器采集到的第i帧声音频域数据的实部,Xi_imag为该声音传感器采集到的第i帧声音频域数据的虚部,Xj_real为该声音传感器采集到的第j帧声音频域数据的实部,Xj_imag为该声音传感器采集到的第j帧声音频域数据的虚部。
2.如权利要求1所述的方法,其特征在于,所述声音传感器的个数为两个,所述预设距离大于或等于球机的半径。
3.如权利要求2所述的方法,其特征在于,所述声音传感器设置在球机上具有摄像头的一侧,所述声音传感器朝向的方向为:与两个所述声音传感器的连线垂直,并且,背向与两个所述声音传感器的连线平行的球机的直径。
4.如权利要求3所述的方法,其特征在于,根据两个所述声音传感器对应的高频比值,确定所述声源所处的方向,具体包括:
计算两个声音传感器对应的高频比值之间的差值;
确定所述差值的绝对值大于设定阈值时,确定所述声源所处的方向为所述声音传感器背向的方向;
确定所述差值的绝对值小于设定阈值时,确定所述声源所处的方向为所述声音传感器朝向的方向。
5.如权利要求1所述的方法,其特征在于,根据以下公式确定n:
计算当q为整数时,n等于q;当q为非整数时,n等于q向上取整或者向下取整后的整数;
其中,常数256为采样点数;fs为采样率;fhigh为高频值、且根据公式确定,c等于340米/秒,d表示球机的直径,a为预先设定的常数。
6.一种声源定位装置,其特征在于,预先在球机上设置多个独立且特性相同的声音传感器,任意两个声音传感器间隔预设距离,该预设距离小于球机的直径,并且每个声音传感器朝向的方向相同,包括:
采集单元,用于利用所述多个声音传感器采集来自同一声源的声音时域数据;
转换单元,用于针对每个声音传感器,将该声音传感器采集的声音时域数据转换为声音频域数据;
计算单元,用于根据该声音传感器对应的声音频域数据,计算该声音传感器对应的高频比值;
方向确定单元,用于根据所述多个声音传感器对应的高频比值,确定所述声源所处的方向,其中,所述声源所处的方向为所述声音传感器朝向的方向或者所述声音传感器背向的方向;
所述计算单元,具体用于计算该声音传感器采集到的M帧声音数据中的每帧声音数据的高频比值,M为大于1的整数;计算M帧声音数据的高频比值的总和N;将所述N除以M所得的结果作为该声音传感器对应的高频比值;其中,采用如下方式计算该声音传感器采集到的任一帧声音数据的高频比值:
其中,TH表示该声音传感器接收到的第i帧声音数据的高频比值,n为预先设定的大于零的整数,Xi_real为该声音传感器采集到的第i帧声音频域数据的实部,Xi_imag为该声音传感器采集到的第i帧声音频域数据的虚部,Xj_real为该声音传感器采集到的第j帧声音频域数据的实部,Xj_imag为该声音传感器采集到的第j帧声音频域数据的虚部。
7.如权利要求6所述的装置,其特征在于,所述声音传感器的个数为两个,所述预设距离大于或等于球机的半径。
8.如权利要求7所述的装置,其特征在于,所述声音传感器设置在球机上具有摄像头的一侧,所述声音传感器朝向的方向为:与两个所述声音传感器的连线垂直,并且,背向与两个所述声音传感器的连线平行的球机的直径。
9.如权利要求8所述的装置,其特征在于,所述方向确定单元具体用于:
计算两个声音传感器对应的高频比值之间的差值;
确定所述差值的绝对值大于设定阈值时,确定所述声源所处的方向为所述声音传感器背向的方向;
确定所述差值的绝对值小于设定阈值时,确定所述声源所处的方向为所述声音传感器朝向的方向。
10.如权利要求6所述的装置,其特征在于,根据以下公式确定n:
计算当q为整数时,n等于q;当q为非整数时,n等于q向上取整或者向下取整后的整数;
其中,常数256为采样点数;fs为采样率;fhigh为高频值、且根据公式确定,c等于340米/秒,d表示球机的直径,a为预先设定的常数。
CN201610555249.8A 2006-07-11 2016-07-11 一种声源定位方法及装置 Active CN106125048B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN201610555249.8A CN106125048B (zh) 2016-07-11 2016-07-11 一种声源定位方法及装置
PCT/CN2016/114014 WO2018010398A1 (en) 2016-07-11 2016-12-31 Methods and systems for sound source locating
EP16908720.2A EP3469391B1 (en) 2016-07-11 2016-12-31 Methods and systems for sound source locating
US16/246,428 US10466334B2 (en) 2006-07-11 2019-01-11 Methods and systems for sound source locating
US16/664,745 US10816634B2 (en) 2016-07-11 2019-10-25 Methods and systems for sound source locating

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610555249.8A CN106125048B (zh) 2016-07-11 2016-07-11 一种声源定位方法及装置

Publications (2)

Publication Number Publication Date
CN106125048A CN106125048A (zh) 2016-11-16
CN106125048B true CN106125048B (zh) 2019-05-24

Family

ID=57283232

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610555249.8A Active CN106125048B (zh) 2006-07-11 2016-07-11 一种声源定位方法及装置

Country Status (4)

Country Link
US (2) US10466334B2 (zh)
EP (1) EP3469391B1 (zh)
CN (1) CN106125048B (zh)
WO (1) WO2018010398A1 (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106125048B (zh) 2016-07-11 2019-05-24 浙江大华技术股份有限公司 一种声源定位方法及装置
KR20180090852A (ko) 2015-12-09 2018-08-13 리써치 트라이앵글 인스티튜트 개선된 아펠린 수용체(apj) 효능제 및 이의 용도
CN107159435B (zh) * 2017-05-25 2019-07-09 洛阳语音云创新研究院 一种磨机工作状态调整方法及装置
EP3725091A1 (en) * 2017-12-14 2020-10-21 Barco N.V. Method and system for locating the origin of an audio signal within a defined space
CN107948856A (zh) * 2017-12-15 2018-04-20 浙江大华技术股份有限公司 一种录播主机、声源测向的方法及装置
US11100918B2 (en) * 2018-08-27 2021-08-24 American Family Mutual Insurance Company, S.I. Event sensing system
CN109545217B (zh) * 2018-12-29 2022-01-04 深圳Tcl新技术有限公司 语音信号接收方法、装置、智能终端及可读存储介质
CN110095755B (zh) * 2019-04-01 2021-03-12 云知声智能科技股份有限公司 一种声源定位方法
CN110441730B (zh) * 2019-07-04 2021-09-03 清华大学 一种基于模拟信号处理架构的麦克风阵列声源定向系统
JPWO2021039606A1 (zh) * 2019-08-29 2021-03-04
CN111157950B (zh) * 2019-11-15 2023-12-05 海菲曼(天津)科技有限公司 一种基于传感器的声音定位方法
WO2021159310A1 (zh) * 2020-02-12 2021-08-19 深圳市锐明技术股份有限公司 一种违章监控系统及违章监控方法
CN113763657B (zh) * 2020-06-04 2023-04-21 浙江宇视科技有限公司 监控警报装置、监控警报控制方法及监控系统
CN111983357B (zh) * 2020-08-21 2022-08-09 国网重庆市电力公司电力科学研究院 一种结合声纹检测功能的超声可视化故障检测方法
CN112078498B (zh) * 2020-09-11 2022-03-18 广州小鹏汽车科技有限公司 一种车辆智能座舱的声音输出控制方法和智能座舱
CN112492202B (zh) * 2020-11-26 2022-03-08 深圳创维数字技术有限公司 全景相机远距离声源定向方法、装置和计算机存储介质
CN114279557B (zh) * 2022-03-02 2022-05-17 山东卓朗检测股份有限公司 一种分布式声学检测设备及其检测方法

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4521549B2 (ja) * 2003-04-25 2010-08-11 財団法人くまもとテクノ産業財団 上下、左右方向の複数の音源の分離方法、そのためのシステム
CN106125048B (zh) * 2016-07-11 2019-05-24 浙江大华技术股份有限公司 一种声源定位方法及装置
JP5082327B2 (ja) * 2006-08-09 2012-11-28 ソニー株式会社 音声信号処理装置、音声信号処理方法および音声信号処理プログラム
CN101030324A (zh) 2007-04-23 2007-09-05 凌子龙 车辆违章鸣笛电子警察路口机装置
CN101030325A (zh) 2007-04-23 2007-09-05 凌子龙 车辆违章鸣笛自动取证系统
JP5063489B2 (ja) * 2008-06-04 2012-10-31 三洋電機株式会社 判定装置及びそれを備えた電子機器並びに判定方法
CN102110367A (zh) 2009-12-25 2011-06-29 刘天宇 违法停车行为实时检测系统及其控制方法
CN102438189B (zh) * 2011-08-30 2014-07-09 东南大学 基于双通路声信号的声源定位方法
CN103116984B (zh) 2013-01-21 2016-03-23 信帧电子技术(北京)有限公司 检测违章停车的方法
WO2014182030A1 (ko) * 2013-05-07 2014-11-13 Bae Youngsik 헤드 마운트 디스플레이
CN103630872A (zh) * 2013-12-03 2014-03-12 大连大学 基于麦克风阵列的声源定位方法
CN103901401B (zh) * 2014-04-10 2016-08-17 北京大学深圳研究生院 一种基于双耳匹配滤波器的双耳声音源定位方法
CN104464750B (zh) * 2014-10-24 2017-07-07 东南大学 一种基于双耳声源定位的语音分离方法
CN104469154B (zh) * 2014-12-05 2017-09-26 合肥国科声拓信息技术有限公司 一种基于麦克风阵列的摄像头引导装置及引导方法
CN104535964B (zh) * 2014-12-24 2017-01-25 大连大学 基于低频衍射时延差的头盔式麦克风阵列声源定位方法
US9911416B2 (en) * 2015-03-27 2018-03-06 Qualcomm Incorporated Controlling electronic device based on direction of speech
CN104777450B (zh) * 2015-04-29 2017-03-08 西安电子科技大学 一种两级music麦克风阵列测向方法
CN204788411U (zh) * 2015-07-06 2015-11-18 南京航空航天大学 基于声源定位、ins的爬壁机器人导航定位系统
CN105301563B (zh) * 2015-11-10 2017-09-22 南京信息工程大学 一种基于一致聚焦变换最小二乘法的双声源定位方法

Also Published As

Publication number Publication date
CN106125048A (zh) 2016-11-16
US10816634B2 (en) 2020-10-27
EP3469391B1 (en) 2020-09-30
US20200057131A1 (en) 2020-02-20
EP3469391A1 (en) 2019-04-17
EP3469391A4 (en) 2019-07-10
US20190162811A1 (en) 2019-05-30
US10466334B2 (en) 2019-11-05
WO2018010398A1 (en) 2018-01-18

Similar Documents

Publication Publication Date Title
CN106125048B (zh) 一种声源定位方法及装置
CN104469154B (zh) 一种基于麦克风阵列的摄像头引导装置及引导方法
Katz et al. A comparative study of interaural time delay estimation methods
US9690262B2 (en) Display device and method for regulating viewing angle of display device
US6185152B1 (en) Spatial sound steering system
US20130265919A1 (en) Method and apparatus for adaptive transmission of sensor data with latency controls
CN106161985B (zh) 一种浸入式视频会议的实现方法
CN103235287B (zh) 一种声源定位摄像追踪装置
JP2019514293A5 (zh)
RU2018139285A (ru) Обработка пространственного аудио
CN109032039B (zh) 一种语音控制的方法及装置
US20160035337A1 (en) Enhancing audio using a mobile device
EP3531714A3 (en) Facilitating calibration of an audio playback device
US9686605B2 (en) Precise tracking of sound angle of arrival at a microphone array under air temperature variation
US20160286133A1 (en) Control Method, Control Device, and Control Equipment
WO2014173069A1 (zh) 一种音效调节方法、装置和设备
WO2021118946A1 (en) Methods for reducing error in environmental noise compensation systems
CN105163240A (zh) 播放装置及音效调整方法
JP2006304124A (ja) 音源方向確定装置および音源方向確定方法
CN109361969A (zh) 一种音频设备及其音量调节方法、装置、设备、介质
CN103379271A (zh) 辅助调焦装置及辅助调焦方法
US20180074163A1 (en) Method and system for positioning sound source by robot
TW201318421A (zh) 控制攝影機裝置的系統及方法
KR101424911B1 (ko) 음향 센서 어레이를 포함하는 실시간 자동 영상 감시 시스템
CN113631942B (zh) 声源跟踪控制方法和控制装置、声源跟踪系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant