CN110082724B - 一种声源定位方法、装置及存储介质 - Google Patents

一种声源定位方法、装置及存储介质 Download PDF

Info

Publication number
CN110082724B
CN110082724B CN201910470138.0A CN201910470138A CN110082724B CN 110082724 B CN110082724 B CN 110082724B CN 201910470138 A CN201910470138 A CN 201910470138A CN 110082724 B CN110082724 B CN 110082724B
Authority
CN
China
Prior art keywords
sound source
microphone array
source position
delay difference
annular microphone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910470138.0A
Other languages
English (en)
Other versions
CN110082724A (zh
Inventor
陈烈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Dahua Technology Co Ltd
Original Assignee
Zhejiang Dahua Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Dahua Technology Co Ltd filed Critical Zhejiang Dahua Technology Co Ltd
Priority to CN201910470138.0A priority Critical patent/CN110082724B/zh
Publication of CN110082724A publication Critical patent/CN110082724A/zh
Application granted granted Critical
Publication of CN110082724B publication Critical patent/CN110082724B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

本申请公开了一种声源定位方法、装置及存储介质,涉及定位技术领域,用以解决现有技术中,由于在定位声源时,需要计算各麦克风之间的时延差,从而导致现有的声源定位的方法计算量大,处理时间长的问题。该方法中,将通过预先构建好的环形麦克风阵列接收的待定位音频信号,和预先存储的延时差系数表中各声源位置对应的延时差系数集输入到声源方位代价函数中,得到输出结果;将输出结果为最大值时对应的声源位置作为待定位音频信号的声源位置。这样,通过查找延时差系数表可以节省了计算时间,使得处理速度变快;同时的,通过环形麦克风阵列可以使获取的音频信号更加清晰,使得到的声源位置更加准确。

Description

一种声源定位方法、装置及存储介质
技术领域
本申请涉及定位技术领域,尤其涉及一种声源定位方法、装置及存储介质。
背景技术
对声音的定位与跟踪是人机交互研究中的重要课题,在安全部门的监控识别、视频会议系统、多媒体系统以及机器人等领域有着广泛的应用。通常,视觉是人们获取信息的主要途径,但在很多情况下,视觉不能提供目标的完整信息,和听觉相比有一定的局限性,人脸跟踪方法容易受到视频遮挡以及光照、姿态变化等因素的影响。和受限的视觉范围相比,听觉系统是全向的,不受角度和位置的限制。人们能够接听到来自于三维空间中任意方位的声音,较好地补充了视觉信息的不足之处。
而在现有技术中,由于在定位声源时,需要计算各麦克风之间的时延差,从而导致现有的声源定位的方法计算量大,处理时间长。
发明内容
申请实施例提供一种声源定位方法、装置及存储介质,用以解决现有技术中,由于在定位声源时,需要计算各麦克风之间的时延差,从而导致现有的声源定位的方法计算量大,处理时间长的问题。
第一方面,本申请实施例提供一种声源定位方法,该方法包括:
通过预先构建好的至少一个环形麦克风阵列接收待定位音频信号;
获取所述待定位音频信号中的有效数据信息;以及;
从预先存储的延时差系数表中获取各声源位置对应的延时差系数集,并将所述待定位音频信号的有效数据和获取的延时差系数集输入到声源方位代价函数中,得到各声源位置各自对应的输出结果;其中,所述延时差系数表中存储有预先根据测试结果建立的延时差系数和声源位置的对应关系,其中一个声源位置对应多个延时差系数,且同一环形麦克风阵列中任两个麦克风对应一个延时差系数;
确定输出结果的最大值对应的声源位置为所述待定位音频信号的声源位置。
第二方面,本申请实施例提供一种声源定位装置,该装置包括:
接收模块,用于通过预先构建好的至少一个环形麦克风阵列接收待定位音频信号;
获取模块,用于获取所述待定位音频信号中的有效数据信息;以及;
结果输出模块,用于从预先存储的延时差系数表中获取各声源位置对应的延时差系数集,并将所述待定位音频信号的有效数据和获取的延时差系数集输入到声源方位代价函数中,得到各声源位置各自对应的输出结果;其中,所述延时差系数表中存储有预先根据测试结果建立的延时差系数和声源位置的对应关系,其中一个声源位置对应多个延时差系数,且同一环形麦克风阵列中任两个麦克风对应一个延时差系数;
确定模块,用于确定输出结果的最大值对应的声源位置为所述待定位音频信号的声源位置。
第三方面,本申请另一实施例还提供了一种计算装置,包括至少一个处理器;以及;
与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请实施例提供的一种声源定位方法。
第四方面,本申请另一实施例还提供了一种计算机存储介质,其中,所述计算机存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行本申请实施例中的一种声源定位方法。
本申请实施例提供的一种声源定位方法、装置及存储介质,将通过预先构建好的环形麦克风阵列接收的待定位音频信号,和预先存储的延时差系数表中各声源位置对应的延时差系数集输入到声源方位代价函数中,得到输出结果;将输出结果为最大值时对应的声源位置作为待定位音频信号的声源位置。这样,通过查找延时差系数表可以节省了计算时间,使得处理速度变快;同时的,通过环形麦克风阵列可以使获取的音频信号更加清晰,使得到的声源位置更加准确。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例中构建延时差系数表的流程示意图;
图2为本申请实施例中两个环形麦克风阵列构成环型嵌套麦克风阵列的示意图;
图3为本申请实施例中一个环形麦克风阵列的示意图;
图4为本申请实施例中进行声源定位的流程示意图;
图5为本申请实施例中内圈的环形麦克风阵列所能覆盖的角度范围的示意图;
图6为本申请实施例中外圈的环形麦克风阵列所能覆盖的角度范围的示意图;
图7为本申请实施例中声源定位结构示意图;
图8为根据本申请实施方式的计算装置的结构示意图。
具体实施方式
为了解决现有技术中,由于在定位声源时,需要计算各麦克风之间的时延差,从而导致现有的声源定位的方法计算量大,处理时间长的问题,本申请实施例中提供一种声源定位方法、装置及存储介质。为了更好的理解本申请实施例提供的技术方案,下面对该方案的基本原理做一下简单说明:
本申请实施例提供的一种声源定位方法、装置及存储介质,将通过预先构建好的环形麦克风阵列接收的待定位音频信号,和预先存储的延时差系数表中各声源位置对应的延时差系数集输入到声源方位代价函数中,得到输出结果;将输出结果为最大值时对应的声源位置作为待定位音频信号的声源位置。这样,通过查找延时差系数表可以节省了计算时间,使得处理速度变快;同时的,通过环形麦克风阵列可以使获取的音频信号更加清晰,使得到的声源位置更加准确。
在本申请实施例中,可以将声源定位方法分为两个部分,分别为:建表和定位。下面对如何构建延时差系数表进行详细的说明。
一、建表:
下面通过具体实施例对建表进行详细的说明。图1为如何构建延时差系数表的流程示意图,包括以下步骤:
步骤101:获取用于构建延时差系数表的测试音频信号。
在本申请实施例中,通过预先构建好的环形麦克风阵列来接收测试音频信号。其中,环形麦克风阵列的数量可以为多个,当环形麦克风阵列具有至少两个时,所述至少两个环形麦克风阵列为同心圆。如图2所示,为两个环形麦克风阵列构成的环型嵌套麦克风阵列,其中,内圈中的环形麦克风阵列的半径为r;外圈中的环形麦克风阵列的半径为R。需要说明的是,本申请实施例中,每个环形麦克风阵列中麦克风的数量可以相同,也可以不同,本申请对此不做限定。
在本申请实施例中,获取了测试音频信号之后,会对测试音频信号进行预处理,包括分帧、加窗、FFT(Fast Fourier Transformation,快速傅氏变换)等,目的是为了免除噪声影响。
步骤102:针对各延时差系数表,确定所述测试音频信号在各指定声源位置时,同一环形麦克风阵列中的各麦克风两两之间的延时差系数。
其中,两两之间的延时差系数指的是在同一环形麦克风阵列内任意两个麦克风与测试音频信号之间的延时差系数。
步骤103:针对每个环形麦克风阵列,将同一指定声源位置对应的各延时差系数作为该指定声源位置的一组延时差系数,并对应存储。
这样,通过预先构建延时差系数表,使得在进行声源定位时,可直接通过查找延时差系数表,从而可以节省了计算时间,使得处理速度变快。
在本申请实施例中,根据构建好的环形麦克风阵列进行建表。其中,每个环形麦克风阵列对应一张延时差系数表。而构建延时差系数表的具体过程如下:
首先,确定测试音频信号的声源位置。其中,声源位置包括方向角与俯仰角。
其次,确定在同一环形麦克风阵列中的各麦克风与测试音频信号之间的延时差系数。
最后,将得到的延时差系数都存储在对应的声源位置上。
计算延时差系数的公式如下所示:
Figure GDA0003177856930000051
其中,FS为采样率,C为声波速率,
Figure GDA0003177856930000052
Figure GDA0003177856930000053
分别是麦克风阵列中任意两个麦克风的空间向量,
Figure GDA0003177856930000054
是测试音频信号的位置向量,τij为延时差系数。
这样,由公式(1)可以得到当测试音频信号在指定声源位置时,同一环形麦克风阵列中的各麦克风两两之间的延时差系数。如图3所示,为一个环形麦克风阵列,其中该环形麦克风阵列中每个麦克风都进行标记,如图中的1、2、3、4、5、6。则根据公式(1),测试音频信号在指定声源位置时,可以得到各麦克风之间的延时差系数,如(1,2)、(1,3)、(1,4)、(1,5)、(1,6)、(2,3)、(2,4)、(2,5)、(2,6)、(3,4)、(3,5)、(3,6)、(4,5)、(4,6)、(5,6)共15个延时差系数。将这15个延时差系数作为测试音频信号在该声源位置下的延时差系数集,并存储到延时差系数表中相应的位置上。
在介绍完如何计算延时差系数后,下面对如何构建延时差系数表进行进一步的说明。在本申请实施例中,延时差系数表可如表1所示。
表1、延时差系数表
Figure GDA0003177856930000061
其中,延时差系数表中的行为方向角的度数,延时差系数表中的列为俯仰角的度数。当前也可以列为方向角,行为俯仰角,本申请对此不做限定。而方向角与俯仰角之间的空间为测试音频信号在改声源位置下得到的延时差系数集。如方向角为20度,俯仰角为10度,则在(20,10)对应的位置上存储有环形麦克风阵列中的各麦克风两两之间的延时差系数。
而在本申请实施例中,方向角的范围为(0°,360°),俯仰角的范围为(-90°,90°)。需要说明的是,若构建的环形嵌套麦克风阵列为在平面上构建的,则俯仰角的范围为(0°,90°)。
在本申请实施例中,在同一延时差系数表中方向角和俯仰角按照预设距离增加。例如方向角和俯仰角均按照10°来增加,则构成的延时差系数表如表1所示。当然,也可以根据实际情况确定预设距离,且方向角与俯仰角的预设距离可以不同,本申请对此不做限定。
在本申请实施例中,若构建的环形嵌套麦克风阵列具有多个环形麦克风阵列,则每个环形麦克风阵列对应一张延时差系数表,且各延时差系数表中声源位置中的相邻方向角之间的预设距离和/或相邻俯仰角之间的预设距离随环形麦克风阵列半径的减小而增大。即,如图2所示,内圈的环形麦克风阵列的声源位置的预设距离大于外圈的环形麦克风阵列的声源位置的预设距离。例如,内圈对应的延时差系数表中的方向角和俯仰角均按照10°来增加,而外圈对应的延时差系数表中的方向角和俯仰角均按照5°来增加。可根据实际情况确定,本申请对此不做限定。
二、定位:
在介绍了如何构建延时差系数表后,下面对通过构建的环形嵌套麦克风阵列和构建的延时差系数表对待定位音频信号进行定位做进一步的说明。下面通过具体实施例对定位进行详细的说明。图4为如何进行声源定位的流程示意图,包括以下步骤:
步骤401:通过预先构建好的至少一个环形麦克风阵列接收待定位音频信号。
步骤402:获取所述待定位音频信号中的有效数据信息。
步骤403:从预先存储的延时差系数表中获取各声源位置对应的延时差系数集,并将所述待定位音频信号的有效数据和获取的延时差系数集输入到声源方位代价函数中,得到各声源位置各自对应的输出结果。
其中,所述延时差系数表中存储有预先根据测试结果建立的延时差系数和声源位置的对应关系,其中一个声源位置对应多个延时差系数,且同一环形麦克风阵列中任两个麦克风对应一个延时差系数。
步骤404:确定输出结果的最大值对应的声源位置为所述待定位音频信号的声源位置。
这样,通过查找延时差系数表可以节省了计算时间,使得处理速度变快;同时的,通过环形麦克风阵列可以使获取的音频信号更加清晰,使得到的声源位置更加准确。
而为了进一步提高声源定位的准确性,本申请可以使用环形嵌套麦克风阵列进行声源定位,即通过多个环形麦克风阵列对声源进行定位。当使用多个环形麦克风阵列对声源进行定位时,本申请提供了三种方案。
方案一:
在本申请实施例中,可先通过半径最小的环形麦克风阵列对声源进行粗定位,再按照半径从小到大的顺序依序对声源进行细定位,最终的得到准确的声源位置,因此,步骤403可具体实施为步骤A1-A3:
步骤A1:针对除半径最大的环形麦克风阵列之外的每个环形麦克风阵列,按照半径由小到大的顺序、依序对每个环形麦克风阵列执行如下操作:根据环形麦克风阵列的延时差系数表,确定待定位音频信号在该环形麦克风阵列的声源位置范围作为下一环形麦克风阵列的参考声源位置范围。
步骤A2:针对半径最大的环形麦克风阵列,根据该环形麦克风阵列及对应的延时差系数表,得到该环形麦克风阵列的参考声源位置范围内各声源位置对应的延时差系数集。
步骤A3:将所述待定位音频信号的有效数据和获取的延时差系数集作为声源方位代价函数的输入参数,得到半径最大的环形麦克风阵列的参考声源位置范围内各声源位置对应的输出结果。
这样,通过多个环形麦克风阵列对声源进行定位,可以进一步的提高声源定位的准确性。
而在本申请实施例中,为了确定下一环形麦克风阵列的参考声源位置范围,可以以内层的环形麦克风阵列确定的声源位置为基准进行确定,具体可实施为步骤B1-B5:
步骤B1:从半径最小的环形麦克风阵列对应的延时差系数表中获取各声源位置对应的延时差系数集。
步骤B2:将所述待定位音频信号的有效数据信息和获取的延时差系数集作为声源方位代价函数的输入参数,得到各声源位置对应的输出结果。
步骤B3:选择最大的输出结果对应的声源位置。
步骤B4:以选择的声源位置为基准,确定下一环形麦克风阵列的参考声源位置范围。
其中,以选择声源位置为基准,根据预设角度差确定下一个待处理的环形麦克风阵列的声源位置的范围。例如,当选择的声源位置为(90°,30°),预设角度差为10°,则下一个待处理的环形麦克风阵列的声源位置的范围为(90°±10°,30°±10°),也就是方向角的范围是(80°,100°),俯仰角的范围是(20°,40°)。当然,预设角度差可以根据实际情况进行确定,且方向角与俯仰角的预设角度差可以相同,也可以不同,本申请对此不做限定。
步骤B5:将半径最小和半径最大的环形麦克风阵列之外的每个环形麦克风阵列,按照半径由小到大的顺序依序对每个环形麦克风阵列执行:从当前环形麦克风阵列对应的延时差系数表中获取的当前麦克风阵列的参考声源位置范围内的各声源位置对应的延时差系数集,并返回执行将所述待定位音频信号的有效数据信息和获取的延时差系数集作为声源方位代价函数的输入参数,得到各声源位置对应的输出结果的步骤,直至得到半径最大的环形麦克风阵列的声源位置范围内的各声源位置的输出结果。
这样,通过上述方式,最终确定半径最大的环形麦克风阵列的声源位置范围内的各声源位置的输出结果,可以使确定的输出结果更加准确。
在本申请实施例中,在确定了半径最大的环形麦克风阵列的声源位置范围内的各声源位置的输出结果后,确定待定位音频信号的声源位置,具体可实施为步骤C1-C2:
步骤C1:从半径最大的环形麦克风阵列的声源位置范围内的各声源位置的输出结果中选择最大值。
步骤C2:将最大值对应的声源位置确定为所述待定位音频信号的声源位置。
这样,通过半径最小的环形麦克风阵列对声源进行粗定位,再按照半径从小到大的顺序依序对声源进行细定位,可以使声源定位更加准确。
方案二:
在本申请实施例中,可先通过半径最大的环形麦克风阵列对声源进行定位,会得到多个声源位置,再按照半径从大到小的顺序依序对声源进行定位,去掉不合适的声源位置,最终的得到准确的声源位置,因此,步骤403可具体实施为步骤D1-D3:
步骤D1:针对除半径最小的环形麦克风阵列之外的每个环形麦克风阵列,按照半径由大到小的顺序、依序对每个环形麦克风阵列执行如下操作:根据环形麦克风阵列的延时差系数表,确定待定位音频信号在该环形麦克风阵列的声源位置范围作为下一环形麦克风阵列的参考声源位置范围。
步骤D2:针对半径最小的环形麦克风阵列,根据该环形麦克风阵列及对应的延时差系数表,得到该环形麦克风阵列的参考声源位置范围内各声源位置对应的延时差系数集。
步骤D3:将所述待定位音频信号的有效数据和获取的延时差系数集作为声源方位代价函数的输入参数,得到半径最小的环形麦克风阵列的参考声源位置范围内各声源位置对应的输出结果。
这样,通过多个环形麦克风阵列对声源进行定位,可以进一步的提高声源定位的准确性。
而在本申请实施例中,为了确定下一环形麦克风阵列的参考声源位置范围,可以以外层的环形麦克风阵列确定的声源位置为基准进行确定,具体可实施为步骤E1-E5:
步骤E1:从半径最大的环形麦克风阵列对应的延时差系数表中获取各声源位置对应的延时差系数集。
步骤E2:将所述待定位音频信号的有效数据信息和获取的延时差系数集作为声源方位代价函数的输入参数,得到各声源位置对应的输出结果。
步骤E3:按照输出结果从大到小的顺序,选择预设数量的输出结果各自对应的声源位置。
由于首先通过的是半径最大的环形麦克风阵列进行定位,因此得到的输出结果可能会出现误差。为了减小误差,在得到各声源位置对应的输出结果时,按照输出结果从大到小的顺序,选择预设数量的输出结果,并通过半径小于半径最大的环形麦克风阵列进行验证来过滤掉准确性较差的声源位置。
步骤E4:以选择的预设数量声源位置为基准,确定下一环形麦克风阵列的参考声源位置范围集合。
在本申请实施例中,由于选取的为多个声源位置,因此下一待处理环形麦克风阵列的声源位置范围为多个声源位置所组成的集合。
步骤E5:将半径最小和半径最大的环形麦克风阵列之外的每个环形麦克风阵列,按照半径由大到小的顺序依序对每个环形麦克风阵列执行:从当前环形麦克风阵列对应的延时差系数表中获取当前麦克风阵列的参考声源位置范围集合内各声源位置对应的延时差系数集,并返回执行将所述待定位音频信号的有效数据信息和获取的延时差系数集作为声源方位代价函数的输入参数,得到各声源位置对应的输出结果的步骤,直至得到半径最小的环形麦克风阵列的声源位置范围内的各声源位置的输出结果。
这样,通过上述方式,最终确定半径最小的环形麦克风阵列的声源位置范围内的各声源位置的输出结果,可以使确定的输出结果更加准确。
在本申请实施例中,在确定了半径最小的环形麦克风阵列的声源位置范围内的各声源位置的输出结果后,确定待定位音频信号的声源位置,具体可实施为步骤F1-F4:
步骤F1:从半径最小的环形麦克风阵列的声源位置范围内,选择最大的输出结果对应的声源位置。
步骤F2:以选择声源位置为基准,确定所述半径最大的环形麦克风阵列的声源位置范围。
步骤F3:从半径最大的环形麦克风阵列的声源位置范围内的各声源位置的输出结果中选择最大值。
步骤F4:将最大值对应的声源位置确定为所述待定位音频信号的声源位置。
这样,通过半径最大的环形麦克风阵列对声源进行定位,再根据确定的定位结果按照半径从大到小的顺序依序对声源进行定位,最后去掉不合适的声源位置,可以使声源定位更加准确。
方案三:
在本申请实施例中,还可以依次通过各环形麦克风阵列,得到各环形麦克风阵列确定的声源位置,并最终进行比较排除,得到最终的声源位置。例如:首先从半径最小的环形麦克风阵列对应的延时差系数表中获取各声源位置对应的延时差系数集,将所述待定位音频信号的有效数据信息和获取的延时差系数集作为声源方位代价函数的输入参数,得到各声源位置对应的输出结果;选择最大的输出结果对应的声源位置。同样的,对其他环形麦克风阵列执行上述操作,均可以得到一个声源位置。将各环形麦克风阵列确定的声源位置进行比较排除,确定最终的声源位置。这样,通过多个环形麦克风阵列对声源进行定位,可以进一步的提高声源定位的准确性。
在本申请实施例中,在多个环形麦克风阵列中,半径小的环形麦克风阵列的作用是为了粗定位,而半径大的环形麦克风阵列的作用是进行细定位。例如,如图2所示,构建的环形麦克风阵列的数量为2个,而通过内圈的环形麦克风阵列进行声源定位,所能覆盖的角度范围如图5所示,而通过外圈的环形麦克风阵列进行声源定位,所能覆盖的角度范围和图6所示。其中,图5和图6中的三角形为通过环形麦克风阵列所确定的声源的位置范围。通过图5与图6的比较可知,通过内圈的环形麦克风阵列最终得到的声源的范围比通过外圈的环形麦克风阵列最终得到的声源的范围大,因此,在先通过半径小的环形麦克风阵列定位后,再通过半径大的环形麦克风阵列进行定位,可以使得到的声源位置更加准确。
上面介绍了通过多个环形麦克风阵列对声源进行定位的三种方案,下面本申请提到的声源方位代价函数做进一步的说明。
声源方位代价函数的公式如下所示:
Figure GDA0003177856930000131
其中,τ为上述的延时差系数,Yi(k)和Yj(k)分别是麦克风阵列接收的有效数据,L是有效数据的长度,k为L的其中一份;w是权重因子,用于提升相关输出的效果。
Figure GDA0003177856930000132
的物理意义是扫描整个方位的方向矢量,获取空间谱估计,根据空间功率谱的最大值得到所求声源方位。
这样,由公式(2)可以得到在各声源位置下的R的值,例如:一个延时差系数对应同一环形麦克风阵列的两个麦克风(如麦克风1和麦克风2),因此,当把指定声源位置的延时差系数集中的其中一个输入到公式(2)中,可以得到该延时差系数对应的两个麦克风接收到的有效数据Y1(k)和Y2(k)得到的
Figure GDA0003177856930000133
的值,将该声源位置所有的延时差系数均输入到的公式(2)中,可以得到该声源位置下对应的多个
Figure GDA0003177856930000134
值,其中,
Figure GDA0003177856930000135
的数量与该声源位置对应的延时差系数的数量相同。根据得到的多个
Figure GDA0003177856930000136
得到最终的R值。其中,可以将多个
Figure GDA0003177856930000137
相加得到R值,也可以将多个
Figure GDA0003177856930000138
相乘得到R值。本申请对此不做限定。
当R值为最大值时,可以确定当前R值对应的声源位置为待定位音频信号的声源位置;若是通过多个环形麦克风阵列进行声源定位,则每个环形麦克风阵列对应的延时差系数表均需要通过公式(2),从而完成定位。而这样,可以使得到的声源位置更加准确。
基于相同的发明构思,本申请实施例还提供了一种声源定位装置。如图7所示,该装置包括:
接收模块701,用于通过预先构建好的至少一个环形麦克风阵列接收待定位音频信号;
获取模块702,用于获取所述待定位音频信号中的有效数据信息;以及;
结果输出模块703,用于从预先存储的延时差系数表中获取各声源位置对应的延时差系数集,并将所述待定位音频信号的有效数据和获取的延时差系数集输入到声源方位代价函数中,得到各声源位置各自对应的输出结果;其中,所述延时差系数表中存储有预先根据测试结果建立的延时差系数和声源位置的对应关系,其中一个声源位置对应多个延时差系数,且同一环形麦克风阵列中任两个麦克风对应一个延时差系数;
确定模块704,用于确定输出结果的最大值对应的声源位置为所述待定位音频信号的声源位置。
进一步的,所述环形麦克风阵列具有至少两个时,所述至少两个环形麦克风阵列为同心圆。
进一步的,每个环形麦克风阵列对应一张延时差系数表;结果输出模块703包括:
第一确定参考声源位置范围单元,用于针对除半径最大的环形麦克风阵列之外的每个环形麦克风阵列,按照半径由小到大的顺序、依序对每个环形麦克风阵列执行如下操作:根据环形麦克风阵列的延时差系数表,确定待定位音频信号在该环形麦克风阵列的声源位置范围作为下一环形麦克风阵列的参考声源位置范围;
第一获取延时差系数集单元,用于针对半径最大的环形麦克风阵列,根据该环形麦克风阵列及对应的延时差系数表,得到该环形麦克风阵列的参考声源位置范围内各声源位置对应的延时差系数集;
第一确定输出结果单元,用于将所述待定位音频信号的有效数据和获取的延时差系数集作为声源方位代价函数的输入参数,得到半径最大的环形麦克风阵列的参考声源位置范围内各声源位置对应的输出结果。
进一步的,第一确定参考声源位置范围单元包括:
第一获取延时差系数集子单元,用于从半径最小的环形麦克风阵列对应的延时差系数表中获取各声源位置对应的延时差系数集;并;
第一输入子单元,用于将所述待定位音频信号的有效数据信息和获取的延时差系数集作为声源方位代价函数的输入参数,得到各声源位置对应的输出结果;
第一选择子单元,用于选择最大的输出结果对应的声源位置;
第一确定范围子单元,用于以选择的声源位置为基准,确定下一环形麦克风阵列的参考声源位置范围;
第一循环子单元,用于将半径最小和半径最大的环形麦克风阵列之外的每个环形麦克风阵列,按照半径由小到大的顺序依序对每个环形麦克风阵列执行:从当前环形麦克风阵列对应的延时差系数表中获取的当前麦克风阵列的参考声源位置范围内的各声源位置对应的延时差系数集,并返回执行将所述待定位音频信号的有效数据信息和获取的延时差系数集作为声源方位代价函数的输入参数,得到各声源位置对应的输出结果的步骤,直至得到半径最大的环形麦克风阵列的声源位置范围内的各声源位置的输出结果;
进一步的,确定模块704包括:
第二选择单元,用于从半径最大的环形麦克风阵列的声源位置范围内的各声源位置的输出结果中选择最大值;
第一确定声源位置单元,用于将最大值对应的声源位置确定为所述待定位音频信号的声源位置。
进一步的,每个环形麦克风阵列对应一张延时差系数表;结果输出模块703包括:
第二确定参考声源位置范围单元,用于针对除半径最小的环形麦克风阵列之外的每个环形麦克风阵列,按照半径由大到小的顺序、依序对每个环形麦克风阵列执行如下操作:根据环形麦克风阵列的延时差系数表,确定待定位音频信号在该环形麦克风阵列的声源位置范围作为下一环形麦克风阵列的参考声源位置范围;
第二获取延时差系数集单元,用于针对半径最小的环形麦克风阵列,根据该环形麦克风阵列及对应的延时差系数表,得到该环形麦克风阵列的参考声源位置范围内各声源位置对应的延时差系数集;
第二确定输出结果单元,用于将所述待定位音频信号的有效数据和获取的延时差系数集作为声源方位代价函数的输入参数,得到半径最小的环形麦克风阵列的参考声源位置范围内各声源位置对应的输出结果。
进一步的,第二确定参考声源位置范围单元包括:
第二获取延时差系数集子单元,用于从半径最大的环形麦克风阵列对应的延时差系数表中获取各声源位置对应的延时差系数集;并;
第二输入子单元,用于将所述待定位音频信号的有效数据信息和获取的延时差系数集作为声源方位代价函数的输入参数,得到各声源位置对应的输出结果;
第三选择子单元,用于按照输出结果从大到小的顺序,选择预设数量的输出结果各自对应的声源位置;
第二确定范围子单元,用于以选择的预设数量声源位置为基准,确定下一环形麦克风阵列的参考声源位置范围集合;
第二循环子单元,用于将半径最小和半径最大的环形麦克风阵列之外的每个环形麦克风阵列,按照半径由大到小的顺序依序对每个环形麦克风阵列执行:从当前环形麦克风阵列对应的延时差系数表中获取当前麦克风阵列的参考声源位置范围集合内各声源位置对应的延时差系数集,并返回执行将所述待定位音频信号的有效数据信息和获取的延时差系数集作为声源方位代价函数的输入参数,得到各声源位置对应的输出结果的步骤,直至得到半径最小的环形麦克风阵列的声源位置范围内的各声源位置的输出结果;
进一步的,确定模块704包括:
第四选择单元,用于从半径最小的环形麦克风阵列的声源位置范围内,选择最大的输出结果对应的声源位置;
第三确定范围单元,用于以选择声源位置为基准,确定所述半径最大的环形麦克风阵列的声源位置范围;
选择最大值单元,用于从半径最大的环形麦克风阵列的声源位置范围内的各声源位置的输出结果中选择最大值;
第二确定声源位置单元,用于将最大值对应的声源位置确定为所述待定位音频信号的声源位置。
进一步的,所述装置还包括:
获取测试音频信号模块,用于获取用于构建延时差系数表的测试音频信号;
确定延时差系数模块,用于针对各延时差系数表:确定所述测试音频信号在各指定声源位置时,同一环形麦克风阵列中的各麦克风两两之间的延时差系数;
存储模块,用于针对每个环形麦克风阵列,将同一指定声源位置对应的各延时差系数作为该指定声源位置的一组延时差系数,并对应存储。
进一步的,声源位置包括方向角与俯仰角,在同一延时差系数表中方向角和俯仰角按照预设距离增加。
进一步的,各延时差系数表中声源位置中的相邻方向角之间的预设距离和/或相邻俯仰角之间的预设距离随环形麦克风阵列半径的减小而增大。
在介绍了本申请示例性实施方式的声源定位的方法及装置之后,接下来,介绍根据本申请的另一示例性实施方式的计算装置。
所属技术领域的技术人员能够理解,本申请的各个方面可以实现为系统、方法或程序产品。因此,本申请的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
在一些可能的实施方式中,根据本申请的实施例,计算装置可以至少包括至少一个处理器、以及至少一个存储器。其中,存储器存储有程序代码,当程序代码被处理器执行时,使得处理器执行本说明书上述描述的根据本申请各种示例性实施方式的声源定位方法中的步骤401-404。
下面参照图8来描述根据本申请的这种实施方式的计算装置80。图8显示的计算装置80仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。该计算装置例如可以是手机、平板电脑等。
如图8所示,计算装置80以通用计算装置的形式表现。计算装置80的组件可以包括但不限于:上述至少一个处理器81、上述至少一个存储器82、连接不同系统组件(包括存储器82和处理器81)的总线83。
总线83表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器、外围总线、处理器或者使用多种总线结构中的任意总线结构的局域总线。
存储器82可以包括易失性存储器形式的可读介质,例如随机存取存储器(RAM)821和/或高速缓存存储器822,还可以进一步包括只读存储器(ROM)823。
存储器82还可以包括具有一组(至少一个)程序模块824的程序/实用工具825,这样的程序模块824包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
计算装置80也可以与一个或多个外部设备84(例如指向设备等)通信,还可与一个或者多个使得用户能与计算装置80交互的设备通信,和/或与使得该计算装置80能与一个或多个其它计算装置进行通信的任何设备(例如路由器、调制解调器等)通信。这种通信可以通过输入/输出(I/O)接口85进行。并且,计算装置80还可以通过网络适配器86与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器86通过总线83与用于计算装置80的其它模块通信。应当理解,尽管图中未示出,可以结合计算装置80使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
在一些可能的实施方式中,本申请提供的声源定位方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在计算机设备上运行时,程序代码用于使计算机设备执行本说明书上述描述的根据本申请各种示例性实施方式的声源定位的方法中的步骤,执行如图4中所示的步骤401-404。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
本申请实施方式的声源定位方法可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在计算装置上运行。然而,本申请的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆、RF等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本申请操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算装置上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算装置上部分在远程计算装置上执行、或者完全在远程计算装置或服务器上执行。在涉及远程计算装置的情形中,远程计算装置可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算装置,或者,可以连接到外部计算装置(例如利用因特网服务提供商来通过因特网连接)。
应当注意,尽管在上文详细描述中提及了装置的若干单元或子单元,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之,上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。
此外,尽管在附图中以顺序描述了本申请方法的操作,但是,这并非要求或者暗示必须按照该顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (11)

1.一种声源定位方法,其特征在于,所述方法包括:
通过预先构建好的至少一个环形麦克风阵列接收待定位音频信号;
获取所述待定位音频信号中的有效数据信息;以及,
从预先存储的延时差系数表中获取各声源位置对应的延时差系数集,并将所述待定位音频信号的有效数据和获取的延时差系数集输入到声源方位代价函数中,得到各声源位置各自对应的输出结果;其中,所述延时差系数表中存储有预先根据测试结果建立的延时差系数和声源位置的对应关系,其中一个声源位置对应多个延时差系数,且同一环形麦克风阵列中任两个麦克风对应一个延时差系数;
确定输出结果的最大值对应的声源位置为所述待定位音频信号的声源位置;
其中,所述环形麦克风阵列具有至少两个时,所述至少两个环形麦克风阵列为同心圆;
其中,每个环形麦克风阵列对应一张延时差系数表;
所述从预先存储的延时差系数表中获取各声源位置对应的延时差系数集,并将所述待定位音频信号的有效数据和获取的延时差系数集输入到声源方位代价函数中,得到各声源位置各自对应的输出结果,具体包括如下两种方式中的任一种:
方式1:针对除半径最大的环形麦克风阵列之外的每个环形麦克风阵列,按照半径由小到大的顺序、依序对每个环形麦克风阵列执行如下操作:根据环形麦克风阵列的延时差系数表,确定待定位音频信号在该环形麦克风阵列的声源位置范围作为下一环形麦克风阵列的参考声源位置范围;
针对半径最大的环形麦克风阵列,根据该环形麦克风阵列及对应的延时差系数表,得到该环形麦克风阵列的参考声源位置范围内各声源位置对应的延时差系数集;
将所述待定位音频信号的有效数据和获取的延时差系数集作为声源方位代价函数的输入参数,
得到半径最大的环形麦克风阵列的参考声源位置范围内各声源位置对应的输出结果;
或,
方式2:针对除半径最小的环形麦克风阵列之外的每个环形麦克风阵列,按照半径由大到小的顺序、依序对每个环形麦克风阵列执行如下操作:根据环形麦克风阵列的延时差系数表,确定待定位音频信号在该环形麦克风阵列的声源位置范围作为下一环形麦克风阵列的参考声源位置范围;
针对半径最小的环形麦克风阵列,根据该环形麦克风阵列及对应的延时差系数表,得到该环形麦克风阵列的参考声源位置范围内各声源位置对应的延时差系数集;
将所述待定位音频信号的有效数据和获取的延时差系数集作为声源方位代价函数的输入参数,得到半径最小的环形麦克风阵列的参考声源位置范围内各声源位置对应的输出结果。
2.根据权利要求1所述的方法,其特征在于,针对除半径最大的环形麦克风阵列之外的每个环形麦克风阵列,按照半径由小到大的顺序、依序根据该环形麦克风阵列的延时差系数表,确定所述待定位音频信号在该环形麦克风阵列的声源位置范围作为下一环形麦克风阵列的参考声源位置范围,具体包括:
从半径最小的环形麦克风阵列对应的延时差系数表中获取各声源位置对应的延时差系数集;并,
将所述待定位音频信号的有效数据信息和获取的延时差系数集作为声源方位代价函数的输入参数,得到各声源位置对应的输出结果;
选择最大的输出结果对应的声源位置;
以选择的声源位置为基准,确定下一环形麦克风阵列的参考声源位置范围;
将半径最小和半径最大的环形麦克风阵列之外的每个环形麦克风阵列,按照半径由小到大的顺序依序对每个环形麦克风阵列执行:从当前环形麦克风阵列对应的延时差系数表中获取的当前麦克风阵列的参考声源位置范围内的各声源位置对应的延时差系数集,并返回执行将所述待定位音频信号的有效数据信息和获取的延时差系数集作为声源方位代价函数的输入参数,得到各声源位置对应的输出结果的步骤,直至得到半径最大的环形麦克风阵列的声源位置范围内的各声源位置的输出结果。
3.根据权利要求1所述的方法,其特征在于,基于方式1,所述确定输出结果的最大值对应的声源位置为所述待定位音频信号的声源位置,具体包括:
从半径最大的环形麦克风阵列的声源位置范围内的各声源位置的输出结果中选择最大值;
将最大值对应的声源位置确定为所述待定位音频信号的声源位置。
4.根据权利要求1所述的方法,其特征在于,针对除半径最小的环形麦克风阵列之外的每个环形麦克风阵列,按照半径由大到小的顺序、依序根据该环形麦克风阵列的延时差系数表,确定所述待定位音频信号在该环形麦克风阵列的声源位置范围作为下一环形麦克风阵列的参考声源位置范围,具体包括:
从半径最大的环形麦克风阵列对应的延时差系数表中获取各声源位置对应的延时差系数集;并,
将所述待定位音频信号的有效数据信息和获取的延时差系数集作为声源方位代价函数的输入参数,得到各声源位置对应的输出结果;
按照输出结果从大到小的顺序,选择预设数量的输出结果各自对应的声源位置;
以选择的预设数量声源位置为基准,确定下一环形麦克风阵列的参考声源位置范围集合;
将半径最小和半径最大的环形麦克风阵列之外的每个环形麦克风阵列,按照半径由大到小的顺序依序对每个环形麦克风阵列执行:从当前环形麦克风阵列对应的延时差系数表中获取当前麦克风阵列的参考声源位置范围集合内各声源位置对应的延时差系数集,并返回执行将所述待定位音频信号的有效数据信息和获取的延时差系数集作为声源方位代价函数的输入参数,得到各声源位置对应的输出结果的步骤,直至得到半径最小的环形麦克风阵列的声源位置范围内的各声源位置的输出结果。
5.根据权利要求1所述的方法,其特征在于,基于方式2,所述确定输出结果的最大值对应的声源位置为所述待定位音频信号的声源位置,具体包括:
从半径最小的环形麦克风阵列的声源位置范围内,选择最大的输出结果对应的声源位置;
以选择声源位置为基准,确定所述半径最大的环形麦克风阵列的声源位置范围;
从半径最大的环形麦克风阵列的声源位置范围内的各声源位置的输出结果中选择最大值;
将最大值对应的声源位置确定为所述待定位音频信号的声源位置。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取用于构建延时差系数表的测试音频信号;
针对各延时差系数表:
确定所述测试音频信号在各指定声源位置时,同一环形麦克风阵列中的各麦克风两两之间的延时差系数;
针对每个环形麦克风阵列,将同一指定声源位置对应的各延时差系数作为该指定声源位置的一组延时差系数,并对应存储。
7.根据权利要求6所述的方法,其特征在于,声源位置包括方向角与俯仰角,在同一延时差系数表中方向角和俯仰角按照预设距离增加。
8.根据权利要求7所述的方法,其特征在于,各延时差系数表中声源位置中的相邻方向角之间的预设距离和/或相邻俯仰角之间的预设距离随环形麦克风阵列半径的减小而增大。
9.一种声源定位装置,其特征在于,所述装置包括:
接收模块,用于通过预先构建好的至少一个环形麦克风阵列接收待定位音频信号;
获取模块,用于获取所述待定位音频信号中的有效数据信息;以及,
结果输出模块,用于从预先存储的延时差系数表中获取各声源位置对应的延时差系数集,并将所述待定位音频信号的有效数据和获取的延时差系数集输入到声源方位代价函数中,得到各声源位置各自对应的输出结果;其中,所述延时差系数表中存储有预先根据测试结果建立的延时差系数和声源位置的对应关系,其中一个声源位置对应多个延时差系数,且同一环形麦克风阵列中任两个麦克风对应一个延时差系数;
确定模块,用于确定输出结果的最大值对应的声源位置为所述待定位音频信号的声源位置;
其中,所述环形麦克风阵列具有至少两个时,所述至少两个环形麦克风阵列为同心圆;
其中,每个环形麦克风阵列对应一张延时差系数表;结果输出模块执行从预先存储的延时差系数表中获取各声源位置对应的延时差系数集,并将所述待定位音频信号的有效数据和获取的延时差系数集输入到声源方位代价函数中,得到各声源位置各自对应的输出结果包括如下两种方式中的任一种:
方式1:第一确定参考声源位置范围单元,用于针对除半径最大的环形麦克风阵列之外的每个环形麦克风阵列,按照半径由小到大的顺序、依序对每个环形麦克风阵列执行如下操作:根据环形麦克风阵列的延时差系数表,确定待定位音频信号在该环形麦克风阵列的声源位置范围作为下一环形麦克风阵列的参考声源位置范围;
第一获取延时差系数集单元,用于针对半径最大的环形麦克风阵列,根据该环形麦克风阵列及对应的延时差系数表,得到该环形麦克风阵列的参考声源位置范围内各声源位置对应的延时差系数集;
第一确定输出结果单元,用于将所述待定位音频信号的有效数据和获取的延时差系数集作为声源方位代价函数的输入参数,得到半径最大的环形麦克风阵列的参考声源位置范围内各声源位置对应的输出结果;
或,
方式2:第二确定参考声源位置范围单元,用于针对除半径最小的环形麦克风阵列之外的每个环形麦克风阵列,按照半径由大到小的顺序、依序对每个环形麦克风阵列执行如下操作:根据环形麦克风阵列的延时差系数表,确定待定位音频信号在该环形麦克风阵列的声源位置范围作为下一环形麦克风阵列的参考声源位置范围;
第二获取延时差系数集单元,用于针对半径最小的环形麦克风阵列,根据该环形麦克风阵列及对应的延时差系数表,得到该环形麦克风阵列的参考声源位置范围内各声源位置对应的延时差系数集;
第二确定输出结果单元,用于将所述待定位音频信号的有效数据和获取的延时差系数集作为声源方位代价函数的输入参数,得到半径最小的环形麦克风阵列的参考声源位置范围内各声源位置对应的输出结果。
10.一种智能终端可读介质,存储有智能终端可执行指令,其特征在于,所述智能终端可执行指令用于执行如权利要求1-8中任一权利要求所述的方法。
11.一种计算装置,其特征在于,包括:
至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1-8中任一权利要求所述的方法。
CN201910470138.0A 2019-05-31 2019-05-31 一种声源定位方法、装置及存储介质 Active CN110082724B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910470138.0A CN110082724B (zh) 2019-05-31 2019-05-31 一种声源定位方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910470138.0A CN110082724B (zh) 2019-05-31 2019-05-31 一种声源定位方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN110082724A CN110082724A (zh) 2019-08-02
CN110082724B true CN110082724B (zh) 2021-09-21

Family

ID=67422978

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910470138.0A Active CN110082724B (zh) 2019-05-31 2019-05-31 一种声源定位方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN110082724B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111060874B (zh) * 2019-12-10 2021-10-29 深圳市优必选科技股份有限公司 一种声源定位方法、装置、存储介质及终端设备
WO2021212287A1 (zh) * 2020-04-20 2021-10-28 深圳市大疆创新科技有限公司 音频信号处理方法、音频处理装置及录音设备
CN112305501A (zh) * 2020-10-21 2021-02-02 珠海格力电器股份有限公司 噪声源的确定方法和装置、存储介质、电子装置
CN112261528B (zh) * 2020-10-23 2022-08-26 汪洲华 一种多路定向拾音的音频输出方法及系统
CN114624650A (zh) * 2020-11-26 2022-06-14 中兴通讯股份有限公司 一种声音定位方法、设备以及计算机可读存储介质
CN112946576B (zh) * 2020-12-10 2023-04-14 北京有竹居网络技术有限公司 声源定位方法、装置和电子设备
CN113109764B (zh) * 2021-04-15 2023-02-14 北方工业大学 一种声源定位方法及系统
CN113297911B (zh) * 2021-04-25 2024-06-07 普联国际有限公司 基于麦克风阵列的定位误差矫正方法、装置及存储介质
CN115166043B (zh) * 2022-09-07 2022-12-02 广东工业大学 一种基于声源定位的激光超声检测系统及方法
CN115184462B (zh) * 2022-09-07 2022-12-02 广东工业大学 一种基于组合式非接触探头的激光超声检测系统
CN115452141B (zh) * 2022-11-08 2023-03-31 杭州兆华电子股份有限公司 一种非均匀声学成像方法

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009141560A (ja) * 2007-12-05 2009-06-25 Sony Corp 音声信号処理装置、音声信号処理方法
CN101644774A (zh) * 2009-07-07 2010-02-10 中国科学院声学研究所 一种基于线性规划的近场目标定位方法及其系统
JP4760160B2 (ja) * 2005-06-29 2011-08-31 ヤマハ株式会社 集音装置
EP2197219B1 (en) * 2008-12-12 2012-10-24 Nuance Communications, Inc. Method for determining a time delay for time delay compensation
CN103364761A (zh) * 2013-07-12 2013-10-23 哈尔滨工业大学 一种室内声源定位系统及采用该系统定位室内声源的方法
CN105096956A (zh) * 2015-08-05 2015-11-25 百度在线网络技术(北京)有限公司 基于人工智能的智能机器人的多声源判断方法及装置
CN105467364A (zh) * 2015-11-20 2016-04-06 百度在线网络技术(北京)有限公司 一种定位目标声源的方法和装置
CN106093864A (zh) * 2016-06-03 2016-11-09 清华大学 一种麦克风阵列声源空间实时定位方法
CN107484069A (zh) * 2017-06-30 2017-12-15 歌尔丹拿音响有限公司 扬声器所处位置的确定方法及装置、扬声器
CN107976651A (zh) * 2016-10-21 2018-05-01 杭州海康威视数字技术股份有限公司 一种基于麦克风阵列的声源定位方法及装置
CN109001682A (zh) * 2018-05-30 2018-12-14 大连民族大学 一种基于麦克风阵列的机器人声源定位方法
CN109709437A (zh) * 2018-11-26 2019-05-03 国网上海市电力公司 一种用于识别特高压变压器异响声源位置的装置及方法
CN109800724A (zh) * 2019-01-25 2019-05-24 国光电器股份有限公司 一种扬声器位置确定方法、装置、终端及存储介质

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5235723B2 (ja) * 2009-03-02 2013-07-10 日本電信電話株式会社 発話向き推定装置、方法及びプログラム
CN101762806B (zh) * 2010-01-27 2013-03-13 华为终端有限公司 声源定位方法和装置
US8515094B2 (en) * 2010-10-12 2013-08-20 Hewlett-Packard Development Company, L.P. Distributed signal processing systems and methods
CN103856871B (zh) * 2012-12-06 2016-08-10 华为技术有限公司 麦克风阵列采集多声道声音的装置及其方法
CN103048642B (zh) * 2012-12-31 2014-09-10 东南大学 基于频域最小二乘法的水声脉冲信号匹配场定位方法
CN103308889B (zh) * 2013-05-13 2014-07-02 辽宁工业大学 复杂环境下被动声源二维doa估计方法
CN105609113A (zh) * 2015-12-15 2016-05-25 中国科学院自动化研究所 基于双谱加权空间相关矩阵的语音声源定位方法
CN106251877B (zh) * 2016-08-11 2019-09-06 珠海全志科技股份有限公司 语音声源方向估计方法及装置
CN108398664B (zh) * 2017-02-07 2020-09-08 中国科学院声学研究所 一种用于麦克风阵列的解析式空间解混叠方法
CN107271963A (zh) * 2017-06-22 2017-10-20 广东美的制冷设备有限公司 声源定位的方法和装置及空调器
CN107102296B (zh) * 2017-04-27 2020-04-14 大连理工大学 一种基于分布式麦克风阵列的声源定位系统
CN107202976B (zh) * 2017-05-15 2020-08-14 大连理工大学 低复杂度的分布式麦克风阵列声源定位系统
CN109164414A (zh) * 2018-09-07 2019-01-08 深圳市天博智科技有限公司 基于麦克风阵列的定位方法、装置和存储介质

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4760160B2 (ja) * 2005-06-29 2011-08-31 ヤマハ株式会社 集音装置
JP2009141560A (ja) * 2007-12-05 2009-06-25 Sony Corp 音声信号処理装置、音声信号処理方法
EP2197219B1 (en) * 2008-12-12 2012-10-24 Nuance Communications, Inc. Method for determining a time delay for time delay compensation
CN101644774A (zh) * 2009-07-07 2010-02-10 中国科学院声学研究所 一种基于线性规划的近场目标定位方法及其系统
CN103364761A (zh) * 2013-07-12 2013-10-23 哈尔滨工业大学 一种室内声源定位系统及采用该系统定位室内声源的方法
CN105096956A (zh) * 2015-08-05 2015-11-25 百度在线网络技术(北京)有限公司 基于人工智能的智能机器人的多声源判断方法及装置
CN105467364A (zh) * 2015-11-20 2016-04-06 百度在线网络技术(北京)有限公司 一种定位目标声源的方法和装置
CN106093864A (zh) * 2016-06-03 2016-11-09 清华大学 一种麦克风阵列声源空间实时定位方法
CN107976651A (zh) * 2016-10-21 2018-05-01 杭州海康威视数字技术股份有限公司 一种基于麦克风阵列的声源定位方法及装置
CN107484069A (zh) * 2017-06-30 2017-12-15 歌尔丹拿音响有限公司 扬声器所处位置的确定方法及装置、扬声器
CN109001682A (zh) * 2018-05-30 2018-12-14 大连民族大学 一种基于麦克风阵列的机器人声源定位方法
CN109709437A (zh) * 2018-11-26 2019-05-03 国网上海市电力公司 一种用于识别特高压变压器异响声源位置的装置及方法
CN109800724A (zh) * 2019-01-25 2019-05-24 国光电器股份有限公司 一种扬声器位置确定方法、装置、终端及存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
《基于麦克风阵列的声源定位系统》;陶巍; 刘建平; 张一闻;《计算机应用》;20120501(第5期);1457-1459 *
《机器人听觉声源定位研究综述》;李晓飞;刘宏;《智能系统学报》;20120209(第1期);9-20 *
P Jeyasingh;M. Mohamed Ismail.《Real-time Multi Source Speech Enhancement based on Sound Source Separation using Microphone Array》.《2018 Conference on Emerging Devices and Smart Systems (ICEDSS)》.2018,183-187. *

Also Published As

Publication number Publication date
CN110082724A (zh) 2019-08-02

Similar Documents

Publication Publication Date Title
CN110082724B (zh) 一种声源定位方法、装置及存储介质
CN107924681B (zh) 用于在具有语音功能的装置之间的仲裁中的方法以及用于仲裁的系统
CN110875060A (zh) 语音信号处理方法、装置、系统、设备和存储介质
Yook et al. Fast sound source localization using two-level search space clustering
US20170368688A1 (en) Method and apparatus for adjusting interactive directions of robots
CN103902963A (zh) 一种识别方位及身份的方法和电子设备
CN104246878A (zh) 音频用户交互辨识和上下文精炼
US9473887B2 (en) Wireless positioning and wireless positioning method and apparatus
CN111209978A (zh) 三维视觉重定位方法、装置及计算设备、存储介质
CN109669158B (zh) 一种声源定位方法、系统、计算机设备及存储介质
US20240046955A1 (en) Voice extraction method and apparatus, and electronic device
CN112213743B (zh) 接收机的定位精度测试方法、装置、终端设备及存储介质
CN111060874A (zh) 一种声源定位方法、装置、存储介质及终端设备
CN113314138B (zh) 基于麦克风阵列的声源监听分离方法、装置及存储介质
CN113099160B (zh) 基于麦克风阵列的视频会议方法、系统、设备及存储介质
US10747804B2 (en) Focus-assisted intelligent personal assistant query response determination
TWI708957B (zh) 動態功率定位方法及其動態功率定位系統
Zhang et al. Acoustic source localization via subspace based method using small aperture MEMS arrays
US20220310092A1 (en) Multi-look enhancement modeling and application for keyword spotting
CN110364159A (zh) 一种语音指令的执行方法、装置及电子设备
CN111933182B (zh) 声源跟踪方法、装置、设备和存储介质
WO2023075874A1 (en) An audio processing device and method for acoustic angle of arrival detection using audio signals of a virtual rotating microphone
CN112946576B (zh) 声源定位方法、装置和电子设备
CN111624554B (zh) 声源定位方法和装置
CN117523090A (zh) 一种场景重建方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant