CN116165607A - 采用多个麦克风阵列实现声源精确定位系统及定位方法 - Google Patents

采用多个麦克风阵列实现声源精确定位系统及定位方法 Download PDF

Info

Publication number
CN116165607A
CN116165607A CN202310152009.3A CN202310152009A CN116165607A CN 116165607 A CN116165607 A CN 116165607A CN 202310152009 A CN202310152009 A CN 202310152009A CN 116165607 A CN116165607 A CN 116165607A
Authority
CN
China
Prior art keywords
angle
mic array
array
sound source
mic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310152009.3A
Other languages
English (en)
Other versions
CN116165607B (zh
Inventor
谢俊杰
谭颢
曹珈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Bachao Technology Co ltd
Original Assignee
Shenzhen Bachao Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Bachao Technology Co ltd filed Critical Shenzhen Bachao Technology Co ltd
Priority to CN202310152009.3A priority Critical patent/CN116165607B/zh
Publication of CN116165607A publication Critical patent/CN116165607A/zh
Application granted granted Critical
Publication of CN116165607B publication Critical patent/CN116165607B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
    • G01S5/22Position of source determined by co-ordinating a plurality of position lines defined by path-difference measurements
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J19/00Accessories fitted to manipulators, e.g. for monitoring, for viewing; Safety devices combined with or specially adapted for use in connection with manipulators
    • B25J19/02Sensing devices
    • B25J19/026Acoustical sensing devices
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
    • G01S5/20Position of source determined by a plurality of spaced direction-finders
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Abstract

本发明公开了一种采用多个麦克风阵列实现声源精确定位系统及定位方法,该定位系统由MIC阵列A、MIC阵列B和MIC阵列C组成。该定位方法主要为:在MIC阵列A、MIC阵列B和MIC阵列C上采用完全相同的角度测量计算算法;对各MIC阵列所测量计算出来的角度分别进行正偏移或负偏移输出一组初始角度值并构造多边形;采用逐次逼近收敛算法调节多边形各角的角度,缩小多边形面积,以得到发言人S同各MIC阵列间的实际夹角角度,实现定位。本发明可以解决当前产品使用单麦克风阵列无法实现对声源精准定位的问题,为发言人特写、定向降噪等需要精准定位信息的应用提供准确的定位信息,提升功能的可用性和用户体验。

Description

采用多个麦克风阵列实现声源精确定位系统及定位方法
技术领域
本发明涉及通信技术领域,具体涉及一种采用多个麦克风阵列实现声源精确定位系统及定位方法。
背景技术
采用麦克风阵列对声源进行定位是一种比较常用的声源定位方法,常常在视频会议系统中应用,通过麦克风阵列对发言人进行声源定位来实现发言人特写及定向降噪等功能。
如图12所示,采用麦克风阵列对声源定位的基本原理为:通过对阵列中2个或多个麦克风所拾取到的声音延时差进行计算,得到音源到各个麦克风之间的距离差值,再根据三角函数计算得出声源同麦克风阵列之间的相对角度。
现有设备基本都采用单麦克风阵列进行声源定位,由于是通过MIC阵列中各个麦克风采集声源之间的延时来进行计算,受各麦克风之间的间距、声源到麦克风阵列之间的距离、声音反射折射等因素影响,实际计算出来的角度误差较大,做不到精确定位,在对角度精度要求较高的应用(如发言人近距离特写)中使用体验不佳甚至无法实际使用。
鉴于此,在中国专利CN202110474150.6中公开了一种声源定位方法及装置。声源定位方法包括:在声源环境具有至少两个麦克风阵列的情况下,获取第一麦克风阵列从声源采集到的第一语音信号和第二麦克风阵列从声源采集到的第二语音信号;根据第一语音信号确定声源相对于第一麦克风阵列的第一声源角度,根据第二语音信号确定声源相对于第二麦克风阵列的第二声源角度;获取第一麦克风阵列和第二麦克风阵列的相对位置信息;根据相对位置信息、第一声源角度和第二声源角度,确定声源的声源位置信息。该方法对声源实现的定位信息中,角度信息即为单个麦克风阵列自身所定位出来的角度信息,距离信息为通过三角函数计算出来的信息。该方法对声源实现精确定位前提是第一麦克风阵列和第二麦克风阵列自身对声源定位的角度和距离都是精确的,即该算法对声源位置定位的精确度取决于单个麦克风阵列本身对声源定位的精确度。因此,在单个麦克风阵列自身无法对声源进行精确定位的情况下,该方法无法做到对声源进行精确的角度和距离定位。而对于单个麦克风阵列,受阵列中各麦克风之间的间距、声源到麦克风阵列之间的距离、声音反射折射等因素影响,实际计算出来的角度误差较大,是做不到精确定位的。所以该方法虽然使用了两个麦克风阵列对声源进行定位,但定位精度相对单个麦克风阵列的定位精度并没有提高,无法实现对声源的精确定位。
在中国专利CN202111208034.6中公开了双麦克风阵列的声源定位系统及其方法,基于双麦克风阵列的声源定位系统包括一台PC端、两台树莓派和两个麦克风阵列。系统工作时,两个树莓派分别向两个麦克风阵列发送调用数据请求,两个麦克风阵列分别向两个树莓派传输数据;第一树莓派向第二树莓派发送调用数据请求,第一树莓派接收到第二树莓派发送的数据后,再经过计算向PC端发送声源位置信息。基于双麦克风阵列的声源定位方法包括:搭建双麦克风阵列的声源定位系统、建立双麦克风坐标轴、研究针对建立坐标轴的不同象限位置的声源定位方法。该专利主要是解决单麦克风阵列只能定位声源方位,而无法定位声源距离的问题,即通过双麦克风阵列分别测量出的声源方位角及双麦克风阵列之间的固定位置关系来计算出声源到麦克风阵列之间的距离;该专利可以实现对声源的方位角和距离的定位,但定位精度取决于单麦克风阵列本身对声源方位角的定位精度,无法通过双麦克风阵列进一步提高相对于单麦克风阵列的定位精度,不能解决单麦克风阵列无法对声源进行精确定位的问题。
在中国专利CN202110451183.9公开了一种基于分布式麦阵的声源定位方法、装置、设备及存储介质,该方法包括:获取多个麦克风阵列的输出信号;对所述输出信号进行分类,得到分类结果;获取麦克风阵列之间的当前位置关系参数;根据所述分类结果以及所述当前位置关系参数,确定声源的位置信息。该专利有效解决了现有技术中语音识别效果差和无法进行声源三维定位的问题。该专利采用多个麦克风阵列,通过代价函数拟合算法来提高麦克风声源定位精度,虽然相比单麦克风阵列可以提高声源定位精度,但采用的算法和处理过程比较复杂,在产品上具体实现时对相应处理器的处理性能要求较高,实现难度和成本都较高;同时,采用拟合算法输出的结果同实际真实值存在偏差,且每次计算的偏差值大小同各麦克风阵列在该次输出的测量值具有强相关性,因各麦克风阵列每次输出的测量值误差存在随机性且不可控,因此该专利在每次对声源定位输出的误差精度也会波动且该波动范围不易控制,较难做到将误差控制在一个设定的阈值内。
在中国专利CN201811042764.1公开了一种基于麦克风阵列的定位方法、装置和存储介质,应用于机器人,包括以下步骤:通过麦克风阵列获取声源发出的声音,并记录所述麦克风阵列中各麦克风获取到所述声音的时间差;根据所述时间差和预设的麦克风阵列中各个麦克风之间的距离,通过第一算法定位所述声源的位置;根据所述声源的位置,控制所述机器人移动以使得所述机器人面向所述声源。该专利通过定位算法,利用麦克风阵列获取声源发出的声音并定位声源的位置,在较小的计算量下提高了声源定位的精度。该专利提出了一种基于单麦克风阵列的声源定位方法,受限于单麦克风阵列自身特性,定位精度不足,不能解决单麦克风阵列无法对声源进行精确定位的问题。
在中国专利CN201710417074.9公开了一种麦克风阵列声源定位方法和装置,方法包括:将麦克风阵列发生旋转时所围绕旋转的水平轴线确定为基准轴线;对麦克风阵列采集到的声源发出的声音进行计算,得到指示三维空间中声源方位的第一声源估计值;获取麦克风阵列发生旋转时的旋转轴线相对于基准轴线所在的水平面的倾斜角度;根据第一声源估计值和倾斜角度,计算得到第一声源估计值对应的水平面上的第二声源估计值,将第二声源估计值作为确定出的声源方位。该专利技术方案通过在麦克风阵列发生倾斜时,计算出三维空间中的声源方向对应的水平面内的声源方向,减小麦克风阵列倾斜时定位出的声源与实际声源方位的误差,提高了声源定位的精度和音频处理性能。该专利解决的是单麦克风阵列在实际应用中会遇到的定位精度相比理论值降低的问题,无法进一步提高单麦克风阵列的理论定位精度,不能解决单麦克风阵列无法对声源进行精确定位的问题。
综上所述,有必要对现有技术做进一步创新。
发明内容
本发明是为了解决当前产品使用单麦克风阵列无法实现对声源角度精准定位,不能为用户提供声源同麦克阵列之间的精确角度信息的问题,而提出了一种构思合理,可以解决当前产品使用单麦克风阵列无法实现对声源精准定位的问题,为发言人特写、定向降噪等需要精准定位信息的应用提供准确的定位信息,提升功能的可用性和用户体验的采用多个麦克风阵列实现声源精确定位系统及定位方法。
为解决上述技术问题,本发明提供的一种采用多个麦克风阵列实现声源精确定位系统,由MIC阵列A、MIC阵列B和MIC阵列C组成;所述MIC阵列A安装在会议室的会议桌正前方;所述MIC阵列B和所述MIC阵列C安装在会议桌上;所述MIC阵列A、所述MIC阵列B和所述MIC阵列C在水平方向位于同一条直线上且该直线穿过会议桌中央。
所述采用多个麦克风阵列实现声源精确定位系统,其中:所述MIC阵列A同所述MIC阵列B之间的距离D1和所述MIC阵列B同所述MIC阵列C之间的距离D2,均为已知量且在后续使用过程中不会发生改变。
所述采用多个麦克风阵列实现声源精确定位系统,其中:所述MIC阵列A同会议摄像头间有固定的位置关系,以便在所述MIC阵列A完成声源定位后可转换为摄像头同声源之间的角度关系。
一种采用多个麦克风阵列实现声源精确定位方法,基于所述的采用多个麦克风阵列实现声源精确定位系统;具体包括以下步骤:
首先,设点A、B、C分别代表MIC阵列A、MIC阵列B、MIC阵列C所处位置,点S代表发言人所处位置,a、b、c分别代表发言人S同MIC阵列A、MIC阵列B和MIC阵列C基于MIC阵列共线直线ABC间的夹角,h为发言人到直线ABC间的距离;
其次,在MIC阵列A、MIC阵列B和MIC阵列C上采用完全相同的角度测量计算算法;对各MIC阵列所测量计算出来的角度分别进行正偏移和负偏移中的任一种,输出一组初始角度值,使发言人S的位置位于各角非公共边延长线相交合围所组成的多边形内;
然后,采用逐次逼近收敛算法调节多边形各角的角度,缩小多边形面积直至多边形的各个顶点彼此之间的高度差均在设定的误差值内,从而得到发言人S同各MIC阵列间的实际夹角角度,实现精确定位。
所述采用多个麦克风阵列实现声源精确定位方法,其中:采用逐次逼近收敛算法调节多边形各角的角度时,还可缩小多边形面积直至多边形的各个顶点重合。
所述采用多个麦克风阵列实现声源精确定位方法,其中,所述多边形可采用构造三角形的方法来实现,具体为:将MIC阵列A和MIC阵列C的测量计算结果人为进行正向偏移,确保所计算出来的角度a和c大于实际角度a'和c';将MIC阵列B的测量计算结果人为进行负向偏移,确保所计算出来的角度b小于实际角度b';
所述角a和角b非公共边的延长线相交于点S1;所述角a和角c非公共边的延长线相交于点S2;所述角b和角c非公共边的延长线相交于点S3;所述点S1、点S2和点S3到直线ABC的距离分别为H1、H2和H3;则发言人S的位置位于所述点S1、点S2和点S3所组成的三角形内,且H1>H2>H3;
采用逐次逼近收敛算法逐步减小所述角a和角c的角度值,以及逐步加大所述角b的角度值,直至H1、H2、H3三者的差值小于预定门限值,以得到修正后的实际角度值a'、b'和c',实现对发言人S的精确定位。
所述采用多个麦克风阵列实现声源精确定位方法,其中:逐步减小所述角a和角c的角度值,以及逐步加大所述角b的角度值,还可直至H1、H2、H3三者值相等即三角形的三个顶点重合。
所述采用多个麦克风阵列实现声源精确定位方法,其中,所述点S1到直线ABC的距离H1的计算公式为:
Figure BDA0004091157350000061
其中上式(4)中D1为所述MIC阵列A同所述MIC阵列B之间的距离;a为发言人S同MIC阵列A基于MIC阵列共线直线ABC间的夹角;b为发言人S同MIC阵列B基于MIC阵列共线直线ABC间的夹角。
所述采用多个麦克风阵列实现声源精确定位方法,其中,所述点S2到直线ABC的距离H2的计算公式为:
Figure BDA0004091157350000062
其中上式(5)中,D1为所述MIC阵列A同所述MIC阵列B之间的距离;D2为所述MIC阵列B同所述MIC阵列C之间的距离;a为发言人S同MIC阵列A基于MIC阵列共线直线ABC间的夹角;c为发言人S同MIC阵列C基于MIC阵列共线直线ABC间的夹角。
所述采用多个麦克风阵列实现声源精确定位方法,其中,所述点S3到直线ABC的距离H3的计算公式为:
Figure BDA0004091157350000071
其中上式(6)中,D2为所述MIC阵列B同所述MIC阵列C之间的距离;b为发言人S同MIC阵列B基于MIC阵列共线直线ABC间的夹角;c为发言人S同MIC阵列C基于MIC阵列共线直线ABC间的夹角。
采用上述技术方案,本发明具有如下有益效果:
本发明采用多个麦克风阵列实现声源精确定位系统及定位方法,构思合理,采用三个麦克风阵列即MIC阵列A、MIC阵列B和MIC阵列C,通过逐次逼近收敛算法来实现对单个麦克风阵列测量误差的减小乃至消除,获得声源同麦克风阵列之间的精确角度信息,定位精度不依赖于单个麦克风阵列的定位精度,可以在单个麦克风阵列对声源定位存在较大误差的情况下,通过对测量误差的逐步收敛获得声源同麦克风阵列之间的精确角度信息,实现对声源方位的精确定位,可以解决当前产品使用单麦克风阵列无法实现对声源精准定位的问题,为发言人特写、定向降噪等需要精准定位信息的应用提供准确的定位信息,提升功能的可用性和用户体验。
同时,本发明对相应的处理器处理能力要求不高,实现难度和成本都较低,采用逐次逼近收敛算法,可以做到对实际值的无限逼近,具有误差精度可控的优势。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明采用多个麦克风阵列实现声源精确定位系统的系统框图;
图2为本发明采用多个麦克风阵列实现声源精确定位系统的定位原理图;
图3为本发明采用多个麦克风阵列实现声源精确定位方法的构造三角形的原理图;
图4为本发明实施例1采用多个麦克风阵列实现声源精确定位方法的构建基于三角形的定位系统的原理图;
图5为本发明实施例1采用多个麦克风阵列实现声源精确定位方法的调整角a角度的流程图;
图6为本发明实施例1采用多个麦克风阵列实现声源精确定位方法的调整角a角度的原理图;
图7为本发明实施例1采用多个麦克风阵列实现声源精确定位方法的调整角b角度的流程图;
图8为本发明实施例1采用多个麦克风阵列实现声源精确定位方法的调整角b角度的原理图;
图9为本发明实施例1采用多个麦克风阵列实现声源精确定位方法的调整角c角度的流程图;
图10为本发明实施例1采用多个麦克风阵列实现声源精确定位方法的调整角c角度的原理图;
图11为本发明实施例1采用多个麦克风阵列实现声源精确定位方法的第一轮角度逼近调整后的示意图;
图12为采用线性麦克风阵列实现声源角度定位的示意图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合具体的实施方式对本发明做进一步的解释说明。
实施例1
如图1所示,本发明采用多个麦克风阵列实现声源精确定位系统,由3个麦克风阵列组成即MIC阵列A、MIC阵列B和MIC阵列C。
该MIC阵列A同当前市场上主流产品的麦克风阵列部署方法相同,安装在会议室的会议桌正前方,且同会议摄像头间有固定的位置关系,以便在MIC阵列A完成声源定位后可转换为摄像头同声源之间的角度关系。
该MIC阵列B和MIC阵列C安装在会议桌上。
该MIC阵列A、MIC阵列B和MIC阵列C在水平方向位于同一条直线上,且该直线穿过会议桌中央。
该MIC阵列A同MIC阵列B之间的距离D1、MIC阵列B同MIC阵列C之间的距离D2,均为在工程安装时就已确定的已知量,且在后续使用过程中不会发生改变。
本发明采用多个麦克风阵列实现声源精确定位系统实现对发言人精确定位的原理如下:
如图2所示,设点A、B、C分别代表图1中的MIC阵列A、MIC阵列B、MIC阵列C所处位置,点S代表发言人所处位置,a、b、c分别代表发言人S同三个MIC阵列基于MIC阵列共线直线ABC间的夹角,h为发言人到直线ABC间的距离,则根据各点间的几何关系,有如下数学推导结果:
cot(a)*h-D1=cot(b)*h
Figure BDA0004091157350000101
同理可得:
Figure BDA0004091157350000102
Figure BDA0004091157350000103
当三个MIC阵列均能对发言人S进行准确定位时,各MIC阵列所计算出的角度即应为a、b、c,分别采用三个公式计算出来的值h也均应为同一值。
但在实际应用中,因测量计算误差的存在,采用三个公式计算出来的值不会相同。如能通过一定方法对测量出来的角度a、b、c进行调整,使三个公式计算出来的值相等,则此时的角度值a、b、c即为发言人同各MIC阵列之间的实际夹角,即实现了对发言人的精确定位。
本发明采用多个麦克风阵列实现声源精确定位方法基于上述的本发明采用多个麦克风阵列实现声源精确定位系统,具体是:在三个MIC阵列上采用完全相同的角度测量计算算法;对各MIC阵列所测量计算出来的角度分别进行正偏移或负偏移,输出一组初始角度值,使发言人S的位置位于各角非公共边延长线相交合围所组成的多边形内;然后采用合适的逐次逼近收敛算法调节多边形各角的角度,缩小多边形面积,直至多边形的各个顶点重合或彼此之间的高度差均在设定的误差值内,从而得到发言人S同各MIC阵列间的的实际夹角角度,实现精确定位。
实施例2
基于上述实施例1,上述的多边形可以有多种构造方法,图3为一个示例,采用构造三角形的方法来实现:
如图3所示:在三个MIC阵列上采用完全相同的角度计算算法(即确保三个MIC阵列对声音角度测量的误差范围基本保持一致,,以使后面的收敛算法能够做到准确收敛),将MIC阵列A和MIC阵列C的测量计算结果人为进行正向偏移,确保所计算出来的角度度a和角度c一定大于实际角度a'和c';将MIC阵列B的测量计算结果人为进行负向偏移,确保所计算出来的角度b一定小于实际角度b'。
角度a和角度b非公共边的延长线相交于点S1;角度a和角度c非公共边的延长线相交于点S2;角度b和角度c非公共边的延长线相交于点S3,H1、H2、H3分别为S1、S2、S3到直线ABC的距离。
则发言人S的位置必然位于S1、S2、S3所组成的三角形内,且H1>H2>H3。
由前述所推数学结论分别到以下公式(4)-(6):
Figure BDA0004091157350000111
Figure BDA0004091157350000112
Figure BDA0004091157350000113
理论上需要使H1=H2=H3=h,此时可采用逐次逼近收敛算法,根据算法逐步减小角度a和角度c的角度值,以及逐步加大角度b的角度值,直至H1、H2、H3三者值相等或三者的差值小于预定门限值,从而得到修正后的实际角度值a'、b'和c',实现对发言人的精确定位。
实施例3
如图4所示,构建基于三角形的定位系统。
设MIC阵列测量计算算法的最大测量角度误差为Φ,则:
设置角a=MIC阵列A测量计算角度值+Φ*1.5;
设置角b=MIC阵列B测量计算角度值-Φ*1.5;
设置角c=MIC阵列C测量计算角度值+Φ*1.5;
因算法的测量误差范围是可以确定的,因此在测量角度值上再加上算法的最大测量误差值Φ*1.5后该角度值相比实际角度值一定是正偏的,负偏方法类似。
角a、b、c即构成合围点S的初始三角形ΔS1S2S3,且存在关系H1>H2>H3。
在确保点S始终在ΔS1S2S3内部的前提下,采用逐次逼近收敛算法逐步缩小ΔS1S2S3的面积,直至S1、S2、S3三点重合或三点之间的距离足够小(即H1、H2、H3之间的差值足够小),此时的角度a、角度b和角度c即为实际角度值或同实际角度值在一个可控的误差值内。
上述逐次逼近收敛算法的具体实现如下:
1)调整角度a的角度:
设调整步长θ1=Φ/3,步长θ2=Φ,判决门限r=5cm(当前参数值为示例,实际实现时可根据调整收敛速度和调整精度要求对各参数值进行相应设置)。
按如下步骤进行调整(图5):
因角度b和角度c调整的步长为角度a的3倍,因此在角度a调整较小角度的情况下即可完成上述调整过程,确保调整后的角度a相对于实际角度仍为正偏。调整后的角度a同原角度b、角度c组成新的三角形ΔS1'S2'S3,且S点仍位于ΔS1'S2'S3内部,如图6所示。
2)调整角度b的角度:
保持步长θ1和θ2不变,按如下步骤进行调整(图7):
同理,因角度a和角度c调整的步长为角度b的3倍,因此在角度b调整较小角度的情况下即可完成上述调整过程,确保调整后的角度b相对于实际角度仍为负偏。调整后的角度b同角度a、角度c组成新的三角形ΔS1'S2'S3',且S点仍位于ΔS1'S2'S3'内部,如图8所示。
3)调整角度c的角度:
同理按如下步骤对角度c进行角度调整(如图9所示):
调整后的角度c同角度a、角度b组成新的三角形ΔS1'S2'S3',且S点仍位于ΔS1'S2'S3'内部,如图10所示。
经过上述步骤1)-3)之后,即完成了第一轮角度逼近调整,如图11所示:
此时比较H1、H2、H3之间的差值是否小于判决门限值r,即是否满足如下判决式:
|H1-H3|<r;
如不满足,则按上述步骤1)-3)启动第二论角度逼近调整,此轮的调整步长将减小到第一轮步长值的1/2,即每轮调整的步长值会逐次递减,以确保做到精确收敛。
重复进行多轮角度逼近调整,直至满足上述的判决式,得到最终的角度a、角度b和角度c。
此时的角度a、角度b和角度c即为同实际角度值在足够小误差范围内的角度值(误差范围同r值相关,r值越小则误差范围越小),完成对S的精确定位。
本发明可以解决当前产品使用单麦克风阵列无法实现对声源精准定位的问题,为发言人特写、定向降噪等需要精准定位信息的应用提供准确的定位信息,提升功能的可用性和用户体验。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种采用多个麦克风阵列实现声源精确定位系统,其特征在于:所述定位系统由MIC阵列A、MIC阵列B和MIC阵列C组成;
所述MIC阵列A安装在会议室的会议桌正前方;
所述MIC阵列B和所述MIC阵列C安装在会议桌上;
所述MIC阵列A、所述MIC阵列B和所述MIC阵列C在水平方向位于同一条直线上且该直线穿过会议桌中央。
2.如权利要求1所述的采用多个麦克风阵列实现声源精确定位系统,其特征在于:所述MIC阵列A同所述MIC阵列B之间的距离D1和所述MIC阵列B同所述MIC阵列C之间的距离D2,均为已知量且在后续使用过程中不会发生改变。
3.如权利要求1所述的采用多个麦克风阵列实现声源精确定位系统,其特征在于:所述MIC阵列A同会议摄像头间有固定的位置关系,以便在所述MIC阵列A完成声源定位后可转换为摄像头同声源之间的角度关系。
4.一种采用多个麦克风阵列实现声源精确定位方法,基于上述权利要求1至3任一所述的采用多个麦克风阵列实现声源精确定位系统;其特征在于,具体包括以下步骤:
首先,设点A、B、C分别代表MIC阵列A、MIC阵列B、MIC阵列C所处位置,点S代表发言人所处位置,a、b、c分别代表发言人S同MIC阵列A、MIC阵列B和MIC阵列C基于MIC阵列共线直线ABC间的夹角,h为发言人到直线ABC间的距离;
其次,在MIC阵列A、MIC阵列B和MIC阵列C上采用完全相同的角度测量计算算法;对各MIC阵列所测量计算出来的角度分别进行正偏移和负偏移中的任一种,输出一组初始角度值,使发言人S的位置位于各角非公共边延长线相交合围所组成的多边形内;
然后,采用逐次逼近收敛算法调节多边形各角的角度,缩小多边形面积直至多边形的各个顶点彼此之间的高度差均在设定的误差值内,得到发言人S同各MIC阵列间的实际夹角角度,实现精确定位。
5.如权利要求4所述的采用多个麦克风阵列实现声源精确定位方法,其特征在于:采用逐次逼近收敛算法调节多边形各角的角度时,缩小多边形面积直至多边形的各个顶点重合。
6.如权利要求4所述的采用多个麦克风阵列实现声源精确定位方法,其特征在于,所述多边形可采用构造三角形的方法来实现,具体为:将MIC阵列A和MIC阵列C的测量计算结果人为进行正向偏移,确保所计算出来的角度a和c大于实际角度a'和c';将MIC阵列B的测量计算结果人为进行负向偏移,确保所计算出来的角度b小于实际角度b';
所述角a和角b非公共边的延长线相交于点S1;所述角a和角c非公共边的延长线相交于点S2;所述角b和角c非公共边的延长线相交于点S3;所述点S1、点S2和点S3到直线ABC的距离分别为H1、H2和H3;则发言人S的位置位于所述点S1、点S2和点S3所组成的三角形内,且H1>H2>H3;
采用逐次逼近收敛算法逐步减小所述角a和角c的角度值,以及逐步加大所述角b的角度值,直至H1、H2、H3三者的差值小于预定门限值,以得到修正后的实际角度值a'、b'和c',实现对发言人S的精确定位。
7.如权利要求6所述的采用多个麦克风阵列实现声源精确定位方法,其特征在于:逐步减小所述角a和角c的角度值,以及逐步加大所述角b的角度值,直至H1、H2、H3三者值相等即三角形的三个顶点重合。
8.如权利要求5所述的采用多个麦克风阵列实现声源精确定位方法,其特征在于,所述点S1到直线ABC的距离H1的计算公式为:
Figure FDA0004091157300000031
其中上式(4)中D1为所述MIC阵列A同所述MIC阵列B之间的距离;a为发言人S同MIC阵列A基于MIC阵列共线直线ABC间的夹角;b为发言人S同MIC阵列B基于MIC阵列共线直线ABC间的夹角。
9.如权利要求5所述的采用多个麦克风阵列实现声源精确定位方法,其特征在于,所述点S2到直线ABC的距离H2的计算公式为:
Figure FDA0004091157300000032
其中上式(5)中,D1为所述MIC阵列A同所述MIC阵列B之间的距离;D2为所述MIC阵列B同所述MIC阵列C之间的距离;a为发言人S同MIC阵列A基于MIC阵列共线直线ABC间的夹角;c为发言人S同MIC阵列C基于MIC阵列共线直线ABC间的夹角。
10.如权利要求5所述的采用多个麦克风阵列实现声源精确定位方法,其特征在于,所述点S3到直线ABC的距离H3的计算公式为:
Figure FDA0004091157300000033
其中上式(6)中,D2为所述MIC阵列B同所述MIC阵列C之间的距离;b为发言人S同MIC阵列B基于MIC阵列共线直线ABC间的夹角;c为发言人S同MIC阵列C基于MIC阵列共线直线ABC间的夹角。
CN202310152009.3A 2023-02-15 2023-02-15 采用多个麦克风阵列实现声源精确定位系统及定位方法 Active CN116165607B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310152009.3A CN116165607B (zh) 2023-02-15 2023-02-15 采用多个麦克风阵列实现声源精确定位系统及定位方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310152009.3A CN116165607B (zh) 2023-02-15 2023-02-15 采用多个麦克风阵列实现声源精确定位系统及定位方法

Publications (2)

Publication Number Publication Date
CN116165607A true CN116165607A (zh) 2023-05-26
CN116165607B CN116165607B (zh) 2023-12-19

Family

ID=86419657

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310152009.3A Active CN116165607B (zh) 2023-02-15 2023-02-15 采用多个麦克风阵列实现声源精确定位系统及定位方法

Country Status (1)

Country Link
CN (1) CN116165607B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104898091A (zh) * 2015-05-29 2015-09-09 复旦大学 基于迭代优化算法的麦克风阵列自校准声源定位系统
CN106054133A (zh) * 2016-05-11 2016-10-26 北京地平线信息技术有限公司 远场声源定位系统和方法
WO2016183791A1 (zh) * 2015-05-19 2016-11-24 华为技术有限公司 一种语音信号处理方法及装置
CN107167770A (zh) * 2017-06-02 2017-09-15 厦门大学 一种混响条件下的麦克风阵列声源定位装置
CN107422305A (zh) * 2017-06-06 2017-12-01 歌尔股份有限公司 一种麦克风阵列声源定位方法和装置
CN109155884A (zh) * 2016-05-02 2019-01-04 美商楼氏电子有限公司 用全向麦克风进行立体声分离和定向抑制
CN111343411A (zh) * 2020-03-20 2020-06-26 青岛海信智慧家居系统股份有限公司 一种智能远程视频会议系统
CN113203988A (zh) * 2021-04-29 2021-08-03 北京达佳互联信息技术有限公司 声源定位方法及装置
CN113311390A (zh) * 2021-04-25 2021-08-27 普联国际有限公司 基于分布式麦阵的声源定位方法、装置、设备及存储介质
US20220240042A1 (en) * 2021-01-22 2022-07-28 Aver Information Inc. Video conferencing system and method thereof

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016183791A1 (zh) * 2015-05-19 2016-11-24 华为技术有限公司 一种语音信号处理方法及装置
CN104898091A (zh) * 2015-05-29 2015-09-09 复旦大学 基于迭代优化算法的麦克风阵列自校准声源定位系统
CN109155884A (zh) * 2016-05-02 2019-01-04 美商楼氏电子有限公司 用全向麦克风进行立体声分离和定向抑制
CN106054133A (zh) * 2016-05-11 2016-10-26 北京地平线信息技术有限公司 远场声源定位系统和方法
CN107167770A (zh) * 2017-06-02 2017-09-15 厦门大学 一种混响条件下的麦克风阵列声源定位装置
CN107422305A (zh) * 2017-06-06 2017-12-01 歌尔股份有限公司 一种麦克风阵列声源定位方法和装置
CN111343411A (zh) * 2020-03-20 2020-06-26 青岛海信智慧家居系统股份有限公司 一种智能远程视频会议系统
US20220240042A1 (en) * 2021-01-22 2022-07-28 Aver Information Inc. Video conferencing system and method thereof
CN113311390A (zh) * 2021-04-25 2021-08-27 普联国际有限公司 基于分布式麦阵的声源定位方法、装置、设备及存储介质
CN113203988A (zh) * 2021-04-29 2021-08-03 北京达佳互联信息技术有限公司 声源定位方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
DAOBILIGE SU 等: "Towards Real-Time 3D Sound Sources Mapping with Linear Microphone Arrays", 《2017 IEEE》, pages 1 - 7 *
孙放 等: "迭代优化算法的自校准麦克风阵列声源定位系统", 《微电子学与计算机》, vol. 33, no. 01, pages 6 - 9 *

Also Published As

Publication number Publication date
CN116165607B (zh) 2023-12-19

Similar Documents

Publication Publication Date Title
US20140329567A1 (en) Mobile device with automatic volume control
KR20160026652A (ko) 사운드 신호 처리 방법 및 장치
CN111080714B (zh) 一种基于三维重建的平行式双目相机标定方法
WO2017206619A1 (zh) 一种音量调节的方法及装置
WO2021127286A1 (en) Audio device auto-location
CN111060872A (zh) 基于麦克风阵列的声源定位方法、装置和计算机设备
CN110211600B (zh) 用于定向监听通信的智能麦克风阵列模块
WO2020073023A1 (en) Near-field audio rendering
CN109307856A (zh) 一种机器人空间定位的交互方法及装置
WO2020069275A2 (en) Binaural sound source localization
CN113933786A (zh) 一种新型四麦克风工业噪声源定位系统
CN109699200A (zh) 可变声学扬声器
WO2020248235A1 (zh) 差分波束形成方法及模块、信号处理方法及装置、芯片
CN116165607B (zh) 采用多个麦克风阵列实现声源精确定位系统及定位方法
CN107167770A (zh) 一种混响条件下的麦克风阵列声源定位装置
JP6947183B2 (ja) 音源位置推定装置及びウェアラブルデバイス
JP2009160682A5 (zh)
CN111562563A (zh) 激光雷达转台标定方法、装置和计算机可读存储介质
CN109164416B (zh) 一种三平面五元传声器阵列的声源定位方法
US20180352363A1 (en) Intelligent Audio Rendering
CN113314138B (zh) 基于麦克风阵列的声源监听分离方法、装置及存储介质
CN110766763A (zh) 一种基于消失点运算的相机标定法
CN112540347A (zh) 一种声源远近的判断方法、装置、终端设备及存储介质
CN113311390A (zh) 基于分布式麦阵的声源定位方法、装置、设备及存储介质
CN113111404A (zh) 一种空间连续小线段圆弧与直线拟合方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant