CN109901112B - 基于多通道声获取的声学同时定位与建图方法 - Google Patents

基于多通道声获取的声学同时定位与建图方法 Download PDF

Info

Publication number
CN109901112B
CN109901112B CN201910250346.XA CN201910250346A CN109901112B CN 109901112 B CN109901112 B CN 109901112B CN 201910250346 A CN201910250346 A CN 201910250346A CN 109901112 B CN109901112 B CN 109901112B
Authority
CN
China
Prior art keywords
sound source
acoustic
sound
space
microphone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910250346.XA
Other languages
English (en)
Other versions
CN109901112A (zh
Inventor
宋浠瑜
王玫
仇洪冰
罗丽燕
孙昊彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guilin University of Electronic Technology
Original Assignee
Guilin University of Electronic Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guilin University of Electronic Technology filed Critical Guilin University of Electronic Technology
Priority to CN201910250346.XA priority Critical patent/CN109901112B/zh
Publication of CN109901112A publication Critical patent/CN109901112A/zh
Application granted granted Critical
Publication of CN109901112B publication Critical patent/CN109901112B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

本发明公开了基于多通道声获取的声学同时定位与建图方法,是通过多通道声获取方式,基于几何声学镜像模型,分析语音信号传播过程中的信道状态,实现室内声场环境空间感知,并利用空间感知结果提升移动声源(说话人)连续定位性能的方法。本发明方法通过引入Delaunay三角剖分方法,分析移动声源的运动状态,估计声源位置的自适应搜索子空间,避免了在室内声场全空间范围内对移动声源位置重复搜索的繁琐与冗余,提高了空间感知与移动声源定位方案的普适性,不仅适用于室内空间轮廓重构,也适用于室内环境的移动声源跟踪定位。

Description

基于多通道声获取的声学同时定位与建图方法
技术领域
本发明涉及室内定位领域,具体是一种基于多通道声获取的声学同时定位与建图方法。
背景技术
室内空间庞大复杂,基于位置的人工智能应用越来越多样化,位置感知已成为万物互联的重要基础。室内室位技术在过去20年间得到了广泛的研究和发展,人们提出了多类基于不同物理载体和测算原理的定位技术,包括基于电磁波信号到达时延/时差/角度的定位、基于电磁波信号强度测量与衰减模型的定位、地磁/电磁波的空间指纹特征信息匹配定位与多源信息融合定位等。由于人类活动干扰、信号多径传播、基础设施依赖等因素影响,上述室内定位技术的推广应用,已难以满足当前社会发展对位置感知与服务的迫切需求。
音频信号通常包含有关声学环境的信息,基于几何声学模型,采用阵列感知方式,可实现室内声源的主动定位。此外,由于空气中声速较低,在相同时间测量精度下,其距离分辨率高于电磁波,因此,近年来室内声学定位受到了研究人员的关注。声学场景映射(Acoustic Scene Mapping,ASM)是一种在声场环境的空间地图中显示移动声源的位置与轨迹的技术,它对于诸如家庭自动化,电话会议,搜索和救援机器人以及人机交互的应用而言十分必要。然而,如何在无基础设施依赖的情况下,获取声场环境的空间地图,并利用该地图信息提升声源定位性能极具挑战。
声学同时定位与建图(Acoustic SLAM)是将感兴趣目标的位置获取与声场环境空间地图的构建进行联合估计的一种技术,也是解决声学场景映射问题的有效途径。传统的声学SLAM研究方法,为了将位置获取与地图构建进行联合推算,常采用一些滤波算法来对目标位置与环境特征点进行估计,如利用粒子滤波算法估计移动声源位置,卡尔曼滤波算法推导环境特征点位置,然后采用基于估计理论分析的贝叶斯滤波来对下一步位置与地图信息进行估计;又或者通过凸优化的方法对位置获取与地图构建进行联合推算。但是,这些方案尽管付出了较高的计算复杂度为代价,其声场环境空间地图的构建结果也仅限于室内空间几何轮廓,即对于在日常生活中常见的矩形轮廓室内环境而言,这些声学SLAM方案存在“一步一重构”的冗余计算。因此,在室内复杂声场环境中,即能降低构建声场环境空间地图的复杂度,又能提高室内移动源的定位精度是声学SLAM研究的关键。
目前,常见的空间感知技术主要有视觉,激光/毫米波雷达测距,声波测距等,主要解决了从大量地标测量数据中重构环境地图的问题,为实现室内高精度定位提供了可能。然而,基于视觉的空间感知方式对室内隐私保护产生了极大的威胁;基于激光雷达的空间感知局限于特殊应用场景和专用设备;在几何声学范畴内基于房间冲激响应分析的空间感知技术,已经有较为成熟的研究。早至二十世纪初期,国外学者就开始利用单声源+麦克风阵列,或者单声源+单麦克风,或者收发一体的多设备协作方式,基于几何声学相关理论,进行室内空间感知与声源定位的研究。如:利用声纳估计室内空间占用率;利用回声与多径信号,构画室内几何形状,分析室内空间尺寸;基于室内空间尺寸与室内混响先验,实现盲源分离,提高目标源的TDOA识别准确率,提高目标源的跟踪定位精度;利用室内混响,提高阵列对目标源定位性能的鲁棒性等。但是,高精准的空间感知结果以高计算复杂度为代价,且房间冲激响应的测量常依赖于特殊声源信号与专用接收设备,这制约了空间感知技术的推广应用。语音信号作为一种易获取的声音信号,充分考虑其短时平稳特性,以广义互相关的分析方法获取信号传播的时延估计,进而分析语音信号传播过程中的信道状态,探究基于语音信号分析的空间感知技术,对降低构建声场环境空间地图的复杂度极其关键。
室内声场环境空间感知的目的是为了提升声源的定位性能。图形学相关研究成果表明:三角网络模型可以较好地分析室内空间拓扑结构。因此,利用三角剖分方法中的Delaunay剖分优势,分析室内声场环境空间感知结构,是提升声源定位性能的有效方法。
发明内容
针对室内复杂环境对声信号传播的衰减与损耗,导致现有室内移动声源自定位能力仍然不足的问题,本发明提出了一种基于多通道声获取的声学同时定位与建图方法,以构建室内声场环境的空间几何轮廓,并提升移动声源连续定位性能。
实现本发明目的的技术方案是:
基于多通道声获取的声学同时定位与建图方法,包括如下步骤:
(1)估计声场环境的空间几何轮廓:
根据声场环境的空间几何轮廓,对麦克风接收信号进行分析,推算出房间长、宽、 高信息
Figure DEST_PATH_IMAGE001
,根据声源、麦克风与反射墙体之间的位置关系,基于几何声学镜像原理, 得到房间几何轮廓
Figure 60330DEST_PATH_IMAGE001
、声源初始位置
Figure 100002_DEST_PATH_IMAGE002
及坐标系正轴指向的一阶镜像声 源(
Figure DEST_PATH_IMAGE003
Figure 100002_DEST_PATH_IMAGE004
Figure DEST_PATH_IMAGE005
)关系:
Figure 100002_DEST_PATH_IMAGE006
(1)
根据式(1),将对
Figure 194114DEST_PATH_IMAGE001
的求解转化为对声源初始位置
Figure DEST_PATH_IMAGE007
及其一阶 镜像声源(
Figure 786901DEST_PATH_IMAGE003
,
Figure 713269DEST_PATH_IMAGE004
Figure 58799DEST_PATH_IMAGE005
)的求解;
(2)声学场景映射:
利用Delaunay三角剖分方法来分析室内声场环境空间感知结果
Figure 428732DEST_PATH_IMAGE001
,并根 据
Figure 226924DEST_PATH_IMAGE007
的估算结果,结合剖分效果,推导出声源空间位置的自适应搜索体元
Figure 100002_DEST_PATH_IMAGE008
步骤(1)所述对声源初始位置
Figure 488141DEST_PATH_IMAGE007
求解的步骤如下:
将麦克风阵列x轴的麦克风看成一个等距线阵,设阵元间距为
Figure DEST_PATH_IMAGE009
,由于麦克风阵 列原点
Figure 100002_DEST_PATH_IMAGE010
己知,则线阵上每一个麦克风位置
Figure DEST_PATH_IMAGE011
己知。设该线阵有8个麦 克风,则
Figure 100002_DEST_PATH_IMAGE012
,由DSB可以计算波束输出
Figure DEST_PATH_IMAGE013
(2)
其中,时延
Figure 100002_DEST_PATH_IMAGE014
Figure DEST_PATH_IMAGE015
为声速,
Figure 100002_DEST_PATH_IMAGE016
为每路接收信号的权重,
Figure DEST_PATH_IMAGE017
为每个麦克风 的接收信号;由于
Figure 249030DEST_PATH_IMAGE007
Figure 773552DEST_PATH_IMAGE011
同处于坐标系的x方向,因此,只需要求 解
Figure 75352DEST_PATH_IMAGE007
Figure 100002_DEST_PATH_IMAGE018
的距离
Figure DEST_PATH_IMAGE019
,就可以根据
Figure 405839DEST_PATH_IMAGE018
位置坐标计算出
Figure 211115DEST_PATH_IMAGE007
的估值即:
Figure 100002_DEST_PATH_IMAGE020
(3)
其中,
Figure DEST_PATH_IMAGE021
是求解欧氏距离运算符,
Figure 100002_DEST_PATH_IMAGE022
表示声源
Figure 778975DEST_PATH_IMAGE007
到达
Figure 551759DEST_PATH_IMAGE018
的直达声传播 时间,
Figure DEST_PATH_IMAGE023
为采样频率;设声源模板信号为
Figure 100002_DEST_PATH_IMAGE024
,则可以通过
Figure 436669DEST_PATH_IMAGE024
Figure DEST_PATH_IMAGE025
的广义互相关计算求 解出
Figure 142457DEST_PATH_IMAGE022
Figure 100002_DEST_PATH_IMAGE026
(4)
Figure DEST_PATH_IMAGE027
(5)
其中,
Figure 100002_DEST_PATH_IMAGE028
Figure DEST_PATH_IMAGE029
Figure 100002_DEST_PATH_IMAGE030
Figure DEST_PATH_IMAGE031
分别是
Figure 962777DEST_PATH_IMAGE024
Figure 100002_DEST_PATH_IMAGE032
的 离散傅里叶变换;根据声学镜像原理,可以从
Figure DEST_PATH_IMAGE033
上检索到一阶镜像源
Figure 100002_DEST_PATH_IMAGE034
到达
Figure 564135DEST_PATH_IMAGE018
的直达声传播时间
Figure DEST_PATH_IMAGE035
Figure 100002_DEST_PATH_IMAGE036
(6)
因此,我们可以得到
Figure 252736DEST_PATH_IMAGE007
Figure DEST_PATH_IMAGE037
的位置如下所示:
Figure 100002_DEST_PATH_IMAGE038
(7)
Figure DEST_PATH_IMAGE039
(8)
此外,根据镜像模型中的对称关系,我们还可以根据己求得的
Figure 891659DEST_PATH_IMAGE007
,计算 出以下一阶镜像源位置
Figure 100002_DEST_PATH_IMAGE040
Figure DEST_PATH_IMAGE041
Figure 100002_DEST_PATH_IMAGE042
Figure DEST_PATH_IMAGE043
(9)
Figure 100002_DEST_PATH_IMAGE044
(10)
Figure DEST_PATH_IMAGE045
(11)。
步骤(1)所述对一阶镜像声源(
Figure 145530DEST_PATH_IMAGE003
,
Figure 627327DEST_PATH_IMAGE004
Figure 57302DEST_PATH_IMAGE005
)求解的步骤如下:
将立体麦克风阵列的的
Figure 100002_DEST_PATH_IMAGE046
个麦克风,看成空间中的一个点集,对该点集建立其欧 氏距离阵
Figure DEST_PATH_IMAGE047
,并将每个一阶镜像声源逐一补充到该点集中, 则形成一个扩充的欧氏距离阵:
Figure 100002_DEST_PATH_IMAGE048
(12)
Figure DEST_PATH_IMAGE049
(13)
其中,
Figure 100002_DEST_PATH_IMAGE050
可以根据空间几何与勾股定理得到:
Figure DEST_PATH_IMAGE051
(14)
因此,可以得到
Figure 100002_DEST_PATH_IMAGE052
Figure DEST_PATH_IMAGE053
的位置如下所示:
Figure 100002_DEST_PATH_IMAGE054
(15)
Figure DEST_PATH_IMAGE055
(16)。
步骤(2)所述
Figure 564113DEST_PATH_IMAGE008
的获取依赖于SRC-like算法,该算法步骤如下:
1)输入空间感知结果
Figure 37820DEST_PATH_IMAGE001
和声源初始位置估值
Figure 757645DEST_PATH_IMAGE007
,以
Figure 100002_DEST_PATH_IMAGE056
为圆心,
Figure DEST_PATH_IMAGE057
为步长构建一个圆球区域;
2)将该圆球内的所有Delaunay三角剖分样点记为点集
Figure 100002_DEST_PATH_IMAGE058
3)根据Delaunay三角剖分生成的房间剖分网格,寻找
Figure 319208DEST_PATH_IMAGE058
的相关点集
Figure DEST_PATH_IMAGE059
4)根据点集
Figure 119674DEST_PATH_IMAGE059
,计算其边界,从而获得
Figure 515014DEST_PATH_IMAGE008
本发明的优点是:该方法以三维立体阵为麦克风阵列拓扑,以说话人为移动声源,充分利用了几何声学原理进行空间几何轮廓感知,将空间感知结果通过三角剖分方法,应用于移动声源的连续定位中,摆脱了传统声学SLAM方法在规则矩形房间内“一步一重构”的冗余计算,也避免了传统随机区域收缩算法在位置解算时对室内声场空间的全范围搜索,提高了移动声源定位性能,具有较低的复杂度和较高的普适度,能满足声学场景映射的需求。
附图说明
图1为本发明实施例基于多通道声获取的声学同时定位与建图方法系统框图;
图2为本发明实施例室内环境中声源、麦克风与反射墙体之间的位置关系图;
图3为本发明实施例Delaunay三角剖分结果示意图;
图4为本发明实施例基于SRC-like的ASM效果示意图;
图5为本发明实施例SRP-PHAT-SRC-like与传统SRP-PHAT-SRC的定位误差与计算性能比较示意图。
具体实施方式
下面结合附图和实施例对本发明内容作进一步阐述,但不是对本发明的限定。
实施例:
如图1所示,本发明所提出基于多通道声获取的声学同时定位与建图方法系统框图,主要分为两部分:
(1)估计声场环境的空间几何轮廓;
(2)声学场景映射。
其中,DSB是指延时求和波束成形,AIM是指声学镜像模型,EDM是指欧氏距离矩阵,SRP-PHAT是指最大可控响应功率相位变换。
如图2所示,图2给出室内环境中反射墙体、移动声源与麦克风阵列的位置关系。以 房间的一个角落作为房间坐标系原点
Figure 100002_DEST_PATH_IMAGE060
,
Figure 502562DEST_PATH_IMAGE010
是麦克风阵列原点。坐标系的正x轴指 向地理方位的南向,正y轴指向地理方位的东向,正z轴指向房间的天顶,相应地,负x轴指向 地理方位的北向,负y轴指向地理方位的西向,负z轴指向房间的地板。
Figure 523607DEST_PATH_IMAGE056
是声源的初始位 置,
Figure DEST_PATH_IMAGE061
Figure 395224DEST_PATH_IMAGE056
对应于第
Figure 100002_DEST_PATH_IMAGE062
面墙体的一阶镜像源,
Figure 741892DEST_PATH_IMAGE062
的索引号与墙体的对应关系如图2 中标注所示。
(1)估计声场环境的空间几何轮廓
估计声场环境的空间几何轮廓,也就是对麦克风接收信号进行分析,以推算出房 间长、宽、高信息
Figure 436309DEST_PATH_IMAGE001
。根据图2所示的声源、麦克风与反射墙体之间的位置关系,基于 几何声学镜像原理,可以得到房间几何轮廓
Figure 261046DEST_PATH_IMAGE001
、声源初始位置
Figure 973787DEST_PATH_IMAGE002
及坐标系 正轴指向的一阶镜像声源(
Figure 445351DEST_PATH_IMAGE003
Figure 876332DEST_PATH_IMAGE004
Figure 973601DEST_PATH_IMAGE005
)关系:
Figure 72007DEST_PATH_IMAGE006
(1)
根据上述关系式,将对
Figure 714472DEST_PATH_IMAGE001
的求解转化为对声源初始位置
Figure 632749DEST_PATH_IMAGE007
及其 一阶镜像声源(
Figure 533709DEST_PATH_IMAGE003
,
Figure 955463DEST_PATH_IMAGE004
Figure 132996DEST_PATH_IMAGE005
)的求解。
Figure DEST_PATH_IMAGE063
基于DSB求解声源初始位置
Figure 804149DEST_PATH_IMAGE007
及其一阶镜像源
Figure 259532DEST_PATH_IMAGE034
将麦克风阵列x轴的麦克风看成一个等距线阵,设阵元间距为
Figure 801372DEST_PATH_IMAGE009
,由于麦克风阵 列原点
Figure 300486DEST_PATH_IMAGE010
己知,则线阵上每一个麦克风位置
Figure 927777DEST_PATH_IMAGE011
己知。设该线阵有8个麦 克风,则
Figure 921272DEST_PATH_IMAGE012
,根据图2所示,由DSB可以计算波束输出
Figure 317618DEST_PATH_IMAGE013
(2)
其中,时延
Figure 253213DEST_PATH_IMAGE014
Figure 367799DEST_PATH_IMAGE015
为声速,
Figure 164985DEST_PATH_IMAGE016
为每路接收信号的权重,
Figure 681417DEST_PATH_IMAGE017
为每个麦克风 的接收信号。由于
Figure 522334DEST_PATH_IMAGE007
Figure 858638DEST_PATH_IMAGE011
同处于坐标系的x方向,因此,只需要求 解
Figure 722164DEST_PATH_IMAGE007
Figure 93102DEST_PATH_IMAGE018
的距离
Figure 104921DEST_PATH_IMAGE019
,就可以根据
Figure 679253DEST_PATH_IMAGE018
位置坐标计算出
Figure 67509DEST_PATH_IMAGE007
的估值即:
Figure 558533DEST_PATH_IMAGE020
(3)
其中,
Figure 491985DEST_PATH_IMAGE021
是求解欧氏距离运算符,
Figure 68460DEST_PATH_IMAGE022
表示声源
Figure 994828DEST_PATH_IMAGE007
到达
Figure 74779DEST_PATH_IMAGE018
的直达声传播 时间,
Figure 444712DEST_PATH_IMAGE023
为采样频率。设声源模板信号为
Figure 508483DEST_PATH_IMAGE024
,则可以通过
Figure 238541DEST_PATH_IMAGE024
Figure 172999DEST_PATH_IMAGE025
的广义互相关计算求 解出
Figure 710903DEST_PATH_IMAGE022
Figure 261970DEST_PATH_IMAGE026
(4)
Figure 530141DEST_PATH_IMAGE027
(5)
其中,
Figure 335417DEST_PATH_IMAGE028
Figure 296420DEST_PATH_IMAGE029
Figure 803624DEST_PATH_IMAGE030
Figure 875485DEST_PATH_IMAGE031
分别是
Figure 800847DEST_PATH_IMAGE024
Figure 667172DEST_PATH_IMAGE032
的 离散傅里叶变换。根据声学镜像原理,可以从
Figure 192831DEST_PATH_IMAGE033
上检索到一阶镜像源
Figure 802804DEST_PATH_IMAGE034
到达
Figure 582673DEST_PATH_IMAGE018
的直达声传播时间
Figure 619899DEST_PATH_IMAGE035
Figure 632854DEST_PATH_IMAGE036
(6)
因此,得到
Figure 794321DEST_PATH_IMAGE007
Figure 943542DEST_PATH_IMAGE037
的位置如下所示:
Figure 417249DEST_PATH_IMAGE038
(7)
Figure 386342DEST_PATH_IMAGE039
(8)
此外,根据镜像模型中的对称关系,还可以根据己求得的
Figure 88850DEST_PATH_IMAGE007
,计算出以 下一阶镜像源位置
Figure 92578DEST_PATH_IMAGE040
Figure 471607DEST_PATH_IMAGE041
Figure 927996DEST_PATH_IMAGE042
Figure 699774DEST_PATH_IMAGE043
(9)
Figure 292429DEST_PATH_IMAGE044
(10)
Figure 373518DEST_PATH_IMAGE045
(11)
Figure 100002_DEST_PATH_IMAGE064
基于EDM的一阶回波检索求解
Figure 864673DEST_PATH_IMAGE052
Figure 158251DEST_PATH_IMAGE053
将图2所示的立体麦克风阵列的
Figure 870992DEST_PATH_IMAGE046
个麦克风,看成空间中的一个点集,对该点集建 立其欧氏距离阵
Figure 870785DEST_PATH_IMAGE047
,并考虑将每个一阶镜像声源逐一补充到 该点集中,则形成一个扩充的欧氏距离阵:
Figure 301766DEST_PATH_IMAGE048
(12)
Figure 399035DEST_PATH_IMAGE049
(13)
其中,
Figure 717015DEST_PATH_IMAGE050
可以根据空间几何与勾股定理得到:
Figure 874327DEST_PATH_IMAGE051
(14)
因此,可以得到
Figure 58183DEST_PATH_IMAGE052
Figure 693564DEST_PATH_IMAGE053
的位置如下所示:
Figure 131630DEST_PATH_IMAGE054
(15)
Figure 459843DEST_PATH_IMAGE055
(16)
(2)声学场景映射
声学场景映射的需求在于在声场环境的空间地图中显示移动声源的位置与轨迹,而声学SLAM中利用声场环境的空间感知结果来提升声源定位性能的效果恰恰能满足声学场景映射的需求。
本发明利用Delaunay三角剖分方法来分析室内声场环境空间感知结果,并在此分析结果上,提出一种改进的随机区域收缩算法(stochastic region contraction-like,SRC-like),用于推算移动声源空间位置的自适应搜索体元,通过在该自适应体元内搜索最大的声功率位置来估计移动声源位置。该算法避免了传统随机区域收缩算法(SRC)在位置解算时对室内声场空间的全范围搜索,有效降低了移动声源的定位误差与计算复杂度。
将空间感知结果
Figure 865417DEST_PATH_IMAGE001
如图3(a)所示,进行Denaulay三角剖分,得到如图3(b) 的效果,并根据
Figure 304488DEST_PATH_IMAGE007
的估算结果,结合剖分效果,推导出声源空间位置的自适应搜 索体元
Figure 862640DEST_PATH_IMAGE008
,如图3(c)所示。
Figure 361754DEST_PATH_IMAGE008
的获取依赖于本发明所提出的SRC-like算法,该算法步骤如下所述:
Step1: 输入空间感知结果
Figure 989044DEST_PATH_IMAGE001
和声源初始位置估值
Figure 714031DEST_PATH_IMAGE007
,以
Figure 375956DEST_PATH_IMAGE056
为 圆心,
Figure 45972DEST_PATH_IMAGE057
为步长构建一个圆球区域;
Step2: 将该圆球内的所有Delaunay三角剖分样点记为点集
Figure 426138DEST_PATH_IMAGE058
Step3: 根据Delaunay三角剖分生成的房间剖分网格,寻找
Figure 957744DEST_PATH_IMAGE058
的相关点集
Figure 474176DEST_PATH_IMAGE059
Step4: 根据点集
Figure 315093DEST_PATH_IMAGE059
,计算其边界,从而获得
Figure 916976DEST_PATH_IMAGE008
Figure 100002_DEST_PATH_IMAGE066
图4给出了采用SRP-PHAT-SRC-like算法的声学场景映射的2D和3D效果,图中红色的点是声源位置参考点,蓝色的点是由SRP-PHAT-SRC-like算法估算出的声源位置,其中,以圈相连接的位置表示位置误差在0.034m~0.21m之间,以箭头相连接的位置表示位置误差在0.30m~1.03m之间。
图5给出了所提算法SRP-PHAT-SRC-like与传统SRP-PHAT-SRC在声源连续定位误 差与计算性能的比较图。从比较结果可以看到,所提SRP-PHAT-SRC-like算法相对传统SRP- PHAT-SRC在定位精度上提升了70%(24个位置中有17个位置的误差值较低),然而每一个位 置的计算量均比传统SRP-PHAT-SRC要低得多,最多可以节省
Figure DEST_PATH_IMAGE067
次运算。

Claims (4)

1.基于多通道声获取的声学同时定位与建图方法,其特征是:包括如下步骤:
(1)估计声场环境的空间几何轮廓:
根据声场环境的空间几何轮廓,对麦克风接收信号进行分析,推算出房间长、宽、高信息
Figure DEST_PATH_IMAGE002
,根据声源、麦克风与反射墙体之间的位置关系,基于几何声学镜像原理,得到房间几何轮廓
Figure 834774DEST_PATH_IMAGE002
、声源初始位置
Figure DEST_PATH_IMAGE004
及坐标系正轴指向的一阶镜像声源(
Figure DEST_PATH_IMAGE006
Figure DEST_PATH_IMAGE008
Figure DEST_PATH_IMAGE010
)关系:
Figure DEST_PATH_IMAGE012
(1)
根据式(1),将对
Figure 352516DEST_PATH_IMAGE002
的求解转化为对声源初始位置
Figure 601095DEST_PATH_IMAGE004
及其一阶镜像声源(
Figure 465145DEST_PATH_IMAGE006
,
Figure 13938DEST_PATH_IMAGE008
Figure 305242DEST_PATH_IMAGE010
)的求解;
(2)声学场景映射:
利用Delaunay三角剖分方法来分析室内声场环境空间感知结果
Figure 41117DEST_PATH_IMAGE002
,并根据
Figure 443280DEST_PATH_IMAGE004
的估算结果,结合剖分效果,推导出声源空间位置的自适应搜索体元
Figure DEST_PATH_IMAGE014
;所述
Figure 813956DEST_PATH_IMAGE014
的获取依赖于SRC-like算法,该算法步骤如下:
1)输入空间感知结果
Figure 276161DEST_PATH_IMAGE002
和声源初始位置估值
Figure 499332DEST_PATH_IMAGE004
,以
Figure DEST_PATH_IMAGE016
为圆心,
Figure DEST_PATH_IMAGE018
为步长构建一个圆球区域;
2)将该圆球内的所有Delaunay三角剖分样点记为点集
Figure DEST_PATH_IMAGE020
3)根据Delaunay三角剖分生成的房间剖分网格,寻找
Figure 111710DEST_PATH_IMAGE020
的相关点集
Figure DEST_PATH_IMAGE022
4)根据点集
Figure 838358DEST_PATH_IMAGE022
,计算其边界,从而获得
Figure 235579DEST_PATH_IMAGE014
2.根据权利要求1所述的基于多通道声获取的声学同时定位与建图方法,其特征是:步骤(1)所述对声源初始位置
Figure 946046DEST_PATH_IMAGE004
求解的步骤如下:
将麦克风阵列x轴的麦克风看成一个等距线阵,设阵元间距为
Figure DEST_PATH_IMAGE024
,由于麦克风阵列原点
Figure DEST_PATH_IMAGE026
己知,则线阵上每一个麦克风位置
Figure DEST_PATH_IMAGE028
己知;设该线阵有8个麦克风,则
Figure DEST_PATH_IMAGE030
,由DSB可以计算波束输出
Figure DEST_PATH_IMAGE032
(2)
其中,时延
Figure DEST_PATH_IMAGE034
Figure DEST_PATH_IMAGE036
为声速,
Figure DEST_PATH_IMAGE038
为每路接收信号的权重,
Figure DEST_PATH_IMAGE040
为每个麦克风的接收信号;由于
Figure 673699DEST_PATH_IMAGE004
Figure 786012DEST_PATH_IMAGE028
同处于坐标系的x方向,因此,只需要求解
Figure 855599DEST_PATH_IMAGE004
Figure DEST_PATH_IMAGE042
的距离
Figure DEST_PATH_IMAGE044
,就可以根据
Figure 991045DEST_PATH_IMAGE042
位置坐标计算出
Figure 37236DEST_PATH_IMAGE004
的估值即:
Figure DEST_PATH_IMAGE046
(3)
其中,
Figure DEST_PATH_IMAGE048
是求解欧氏距离运算符,
Figure DEST_PATH_IMAGE050
表示声源
Figure 676159DEST_PATH_IMAGE004
到达
Figure 916648DEST_PATH_IMAGE042
的直达声传播时间,
Figure DEST_PATH_IMAGE052
为采样频率;设声源模板信号为
Figure DEST_PATH_IMAGE054
,则可以通过
Figure 772346DEST_PATH_IMAGE054
Figure DEST_PATH_IMAGE056
的广义互相关计算求解出
Figure 858114DEST_PATH_IMAGE050
Figure DEST_PATH_IMAGE058
(4)
Figure DEST_PATH_IMAGE060
(5)
其中,
Figure DEST_PATH_IMAGE062
Figure DEST_PATH_IMAGE064
Figure DEST_PATH_IMAGE066
Figure RE-DEST_PATH_IMAGE068
分别是
Figure 991024DEST_PATH_IMAGE054
Figure RE-DEST_PATH_IMAGE070
的离散傅里叶变换;根据声学镜像原理,可以从
Figure RE-DEST_PATH_IMAGE072
上检索到一阶镜像源
Figure RE-DEST_PATH_IMAGE074
到达
Figure 74517DEST_PATH_IMAGE042
的直达声传播时间
Figure RE-DEST_PATH_IMAGE076
Figure RE-DEST_PATH_IMAGE078
(6)
因此,可以得到
Figure 918977DEST_PATH_IMAGE004
Figure RE-DEST_PATH_IMAGE080
的位置如下所示:
Figure RE-DEST_PATH_IMAGE082
(7)
Figure RE-DEST_PATH_IMAGE084
(8)。
3.根据权利要求2所述的基于多通道声获取的声学同时定位与建图方法,其特征是:根据镜像模型中的对称关系,还可以根据己求得的
Figure 979074DEST_PATH_IMAGE004
,计算出以下一阶镜像源位置
Figure RE-DEST_PATH_IMAGE086
Figure RE-DEST_PATH_IMAGE088
Figure RE-DEST_PATH_IMAGE090
Figure RE-DEST_PATH_IMAGE092
(9)
Figure RE-DEST_PATH_IMAGE094
(10)
Figure RE-DEST_PATH_IMAGE096
(11)。
4.根据权利要求1所述的基于多通道声获取的声学同时定位与建图方法,其特征是:步骤(1)所述对一阶镜像声源(
Figure 497649DEST_PATH_IMAGE006
,
Figure 345519DEST_PATH_IMAGE008
Figure 739592DEST_PATH_IMAGE010
)求解的步骤如下:
将立体麦克风阵列的
Figure RE-DEST_PATH_IMAGE098
个麦克风,看成空间中的一个点集,对该点集建立其欧氏距离阵
Figure RE-DEST_PATH_IMAGE100
,并将每个一阶镜像声源逐一补充到该点集中,则形成一个扩充的欧氏距离阵:
Figure RE-DEST_PATH_IMAGE102
(12)
Figure RE-DEST_PATH_IMAGE104
(13)
其中,
Figure RE-DEST_PATH_IMAGE106
可以根据空间几何与勾股定理得到:
Figure RE-DEST_PATH_IMAGE108
(14)
因此,可以得到
Figure RE-DEST_PATH_IMAGE110
Figure RE-DEST_PATH_IMAGE112
的位置如下所示:
Figure RE-DEST_PATH_IMAGE114
(15)
Figure RE-DEST_PATH_IMAGE116
(16)。
CN201910250346.XA 2019-03-29 2019-03-29 基于多通道声获取的声学同时定位与建图方法 Active CN109901112B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910250346.XA CN109901112B (zh) 2019-03-29 2019-03-29 基于多通道声获取的声学同时定位与建图方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910250346.XA CN109901112B (zh) 2019-03-29 2019-03-29 基于多通道声获取的声学同时定位与建图方法

Publications (2)

Publication Number Publication Date
CN109901112A CN109901112A (zh) 2019-06-18
CN109901112B true CN109901112B (zh) 2022-10-04

Family

ID=66955006

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910250346.XA Active CN109901112B (zh) 2019-03-29 2019-03-29 基于多通道声获取的声学同时定位与建图方法

Country Status (1)

Country Link
CN (1) CN109901112B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110794409B (zh) * 2019-10-21 2021-09-21 哈尔滨工程大学 一种可估计未知有效声速的水下单信标定位方法
CN113050033B (zh) * 2019-12-26 2024-05-31 聚众联合科技股份有限公司 功率定位方法及其功率定位装置
CN111157952B (zh) * 2020-01-06 2022-04-01 北京大学 一种基于移动麦克风阵列的房间边界估计方法
CN112198476B (zh) * 2020-10-16 2023-10-27 昆明理工大学 一种基于立体视觉和波束形成的移动声源的三维定位方法
CN113098441B (zh) * 2021-03-30 2023-01-24 太原理工大学 一种基于粒子滤波算法的电磁波优化模型
CN114111785B (zh) * 2021-10-28 2024-03-01 桂林电子科技大学 一种基于rir倒谱提取一阶回波的声slam系统及方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9560439B2 (en) * 2013-07-01 2017-01-31 The University of North Carolina at Chapel Hills Methods, systems, and computer readable media for source and listener directivity for interactive wave-based sound propagation
CN107172018A (zh) * 2017-04-27 2017-09-15 华南理工大学 公共背景噪声下激活式的声纹密码安全控制方法及系统
CN108872939B (zh) * 2018-04-29 2020-09-29 桂林电子科技大学 基于声学镜像模型的室内空间几何轮廓重构方法
CN109375223B (zh) * 2018-08-28 2022-08-16 桂林电子科技大学 基于声波粒二象性的室内空间感知与移动声源自定位方法

Also Published As

Publication number Publication date
CN109901112A (zh) 2019-06-18

Similar Documents

Publication Publication Date Title
CN109901112B (zh) 基于多通道声获取的声学同时定位与建图方法
CN103064061B (zh) 三维空间声源定位方法
Parsayan et al. Real time high accuracy 3-D PHAT-based sound source localization using a simple 4-microphone arrangement
CN104106267B (zh) 在增强现实环境中的信号增强波束成形
Hu et al. Simultaneous localization of a mobile robot and multiple sound sources using a microphone array
CN104142492A (zh) 一种srp-phat多源空间定位方法
Tellakula Acoustic source localization using time delay estimation
Perrodin et al. Design and calibration of large microphone arrays for robotic applications
Ogiso et al. Robust indoor localization in a reverberant environment using microphone pairs and asynchronous acoustic beacons
CN105607042A (zh) 用麦克风阵列时延估计定位声源的方法
CN115902776B (zh) 一种基于被动式声音信号的声源定位方法
CN103487796B (zh) 一种利用水声信道统计不变特征实现被动测距的方法
CN109212481A (zh) 一种利用麦克风阵列进行声源定位的方法
CN104535964A (zh) 基于低频衍射时延差的头盔式麦克风阵列声源定位方法
CN109164416B (zh) 一种三平面五元传声器阵列的声源定位方法
CN108872939B (zh) 基于声学镜像模型的室内空间几何轮廓重构方法
Astapov et al. Simplified acoustic localization by linear arrays for wireless sensor networks
Kossyk et al. Binaural bearing only tracking of stationary sound sources in reverberant environment
Pfreundtner et al. (W) Earable Microphone Array and Ultrasonic Echo Localization for Coarse Indoor Environment Mapping
Aprea et al. Acoustic reconstruction of the geometry of an environment through acquisition of a controlled emission
CN111239691B (zh) 一种抑制主声源的多声源跟踪方法
Dang et al. Multiple sound source localization based on a multi-dimensional assignment model
Astapov et al. A method of initial search region reduction for acoustic localization in distributed systems
CN109375223B (zh) 基于声波粒二象性的室内空间感知与移动声源自定位方法
Sreejith et al. TDE sign based homing algorithm for sound source tracking using a Y-shaped microphone array

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20190618

Assignee: Wuhan xingeno Technology Co.,Ltd.

Assignor: GUILIN University OF ELECTRONIC TECHNOLOGY

Contract record no.: X2022450000387

Denomination of invention: Acoustic simultaneous localization and mapping method based on multi-channel acoustic acquisition

Granted publication date: 20221004

License type: Common License

Record date: 20221226

EE01 Entry into force of recordation of patent licensing contract