CN117368847A

CN117368847A - 基于麦克风射频通信网络的定位方法及系统

Info

Publication number: CN117368847A
Application number: CN202311669434.6A
Authority: CN
Inventors: 赵凯潜
Original assignee: Bbs Electronics Co ltd
Current assignee: Bbs Electronics Co ltd
Priority date: 2023-12-07
Filing date: 2023-12-07
Publication date: 2024-01-09
Anticipated expiration: 2043-12-07
Also published as: CN117368847B

Abstract

本发明公开了一种基于麦克风射频通信网络的定位方法及系统，包括：获取目标区域中分布式麦克风阵列对应的射频通信网络，确定待定位麦克风节点，提取待定位麦克风节点与信标节点的射频信号对应的目标射频指纹；构建麦克风定位模型获取潜在特征，获取待定位麦克风节点所属位置分类的概率；将待定位麦克风节点的定位作为目标声源的初始定位区域，获取区域各点的可控响应功率进行迭代搜索，获取可控响应功率最大时对应的空间位置作为目标声源的位置。本发明利用射频通信网络中不同环境场景的迁移学习提高了定位效率及精度，另外根据待定位麦克风的位置实现目标声源的初定位，弱化噪声对时延估计的同时降低了计算复杂度。

Description

基于麦克风射频通信网络的定位方法及系统

技术领域

本发明涉及信号源定位技术领域，更具体的，涉及一种基于麦克风射频通信网络的定位方法及系统。

背景技术

随着社会不断的发展，在各种技术层出不穷的新时代，多媒体技术的发展可谓突飞猛进，各种智能化的设备走进寻常百姓家，丰富方便了人们的生活。语音信号处理技术是多媒体技术中重要的组成部分，得到了较为广泛的研究关注，对麦克风位置进行准确的定位，能够帮助分布式麦克风阵列信号处理，而麦克风阵列在语音增强、声源定位和声源分离的应用中起着重要作用。而声源定位系统在民用领域，尤其是室内场景下的音视频会议、安防监控、智能机器人定位等都表现出了十足的应用潜力。

定位的高实时性与精确性使得其在诸多方面都将发挥着至关重要的作用。麦克风数量的增加理论上可以提高定位精度，但随之计算量的增加对实时性提出了巨大的挑战。另外，对于不同距离下的声源，计算中近场模型或远场模型的选择也给定位带来较大误差；此外混响和噪声对定位精度影响很大，传统的定位算法无法在高混响和低信噪比的环境中保持较高的定位精度。现有的声源定位方法在求解时，多使用数值求解的计算方法，这种求解方法一般计算量较大，不利于定位的实时性，同时存在人工干预的问题。因此，如何利用射频通信网络进行高精度麦克风定位及声源定位是目前亟需解决的问题。

发明内容

为了解决上述技术问题，本发明提出了涉及一种基于麦克风射频通信网络的定位方法及系统。

本发明第一方面提供了一种基于麦克风射频通信网络的定位方法，包括：

获取目标区域中分布式麦克风阵列对应的射频通信网络，在所述射频通信网络中选取信标节点，并将所述信标节点在射频通信网络对应的拓扑结构中进行标记；

根据不同麦克风阵列接收到目标声源的响应情况确定待定位麦克风节点，提取待定位麦克风节点与信标节点的射频信号，提取射频信号对应的目标射频指纹；

基于深度学习方法构建麦克风定位模型，经过迁移训练后将所述目标射频指纹作为模型输入获取潜在特征，通过所述潜在特征获取待定位麦克风节点所属位置分类的概率；

确定待定位麦克风节点的位置后，获取目标声源的初始定位区域，在所述初始定位区域中获取各点的可控响应功率筛选预设数量的区域，根据筛选的区域进行迭代搜索，获取可控响应功率最大时对应的空间位置作为目标声源的位置。

本方案中，获取目标区域中分布式麦克风阵列对应的射频通信网络，在所述射频通信网络中选取信标节点，具体为：

获取目标区域中分布式麦克风阵列及无线接入设备，根据射频连接关系获取目标区域的射频通信网络，并筛选固定麦克风阵列及无线接入设备作为信标候选点；

通过大数据检索获取节点定位精度的影响因素，根据层次聚类筛选影响因素，计算影响因素的之间的相关程度，根据所述相关程度进行聚类，获取聚类结果并构建层次关系；

在不同聚类结果对应的类簇中对影响因素进行层次分析，通过层次分析法获取各影响因素的权重信息，根据所述权重信息筛选预设数量的影响因素，根据所述影响因素确定评价指标；

将目标区域划分为若干子区域，根据所述评价指标对不同子区域的环境特征进行评估获取环境因素对节点定位的扰动影响，根据扰动影响将所述子区域进行排序；

通过排序结果获取预设数量的子区域进行标记，在标记子区域中选择部分信标候选点作为信标节点参与定位；

选定目标对信标节点进行误差分析，获取信标节点的位置信息，根据TDOA测量值获取所述选定目标的估计位置，根据选定目标的实际位置与估算位置的偏差进行误差修正。

本方案中，根据不同麦克风阵列接收到目标声源的响应情况确定待定位麦克风节点，具体为：

通过目标地区的射频通信网络中的麦克风阵列获取目标声源的声音信号，对所述声音信号进行加窗处理，将所述声音信号截取为若干短时声音信号，将所述短时声音信号进行短时傅里叶变换；

提取所述短时声音信号对应的时频谱，将所述时频谱利用梅尔滤波器进行处理获取对数梅尔谱，根据所述对数梅尔谱获取短时声音信号中每帧的MFCC特征；

并且获取短时信号中各帧声音信号的短时能量，将所述MFCC特征及短时能量获取不同麦克风节点对目标声源的响应情况，保留符合预设标准的麦克风节点；

在所述符合预设标准的麦克风节点中筛选移动麦克风节点，确定待定位麦克风节点。

本方案中，提取待定位麦克风节点与信标节点的射频信号，提取射频信号对应的目标射频指纹，具体为：

获取待定位麦克风节点与信标节点的射频信号，对所述射频信号进行加窗处理获取射频时序谱，根据所述射频时序谱获取当前时间戳对应的目标射频指纹；

将所述目标射频指纹在预设射频指纹数据库中进行筛选，根据相似度计算构建目标射频指纹邻域范围，获取目标射频指纹邻域范围内的已采集射频指纹参考点，并提取射频指纹参考点的射频时序谱；

将射频指纹参考点的射频时序谱进行加噪编码获取对应的噪声时序谱，将所述噪声时序谱进行叠加获取目标射频指纹对应的噪声时序谱，将所述噪声时序谱导入U-net网络进行去噪；

在所述U-net网络中利用残差网络及自注意力机制进行特征编码，将编码后特征导入解码器，通过上采样进行解码去噪，生成目标射频指纹的重建射频时序谱；

根据所述重建射频时序谱进行目标射频指纹的数据扩充，输出最终的目标射频指纹。

本方案中，基于深度学习方法构建麦克风定位模型，具体为：

通过深度学习方法构建麦克风定位模型，根据信标节点的更新获取当前含有少量位置更新的射频指纹数据库，将原始的射频指纹数据库作为源域，将含有少量位置更新的射频指纹数据库作为目标域；

根据所述源域及目标域对所述麦克风定位模型进行迁移训练，初始化源域及目标域的样本权重，射频指纹与位置信息之间的非线性函数，根据源域及目标域对应的错误率更新训练权重；

在目标域中根据更新后的权重进行排序，选取权重最大的一批数据重新构建训练集，输出训练好的麦克风定位模型；

将所述目标射频指纹导入麦克风定位模型，提取目标射频指纹的潜在特征，根据所述潜在特征进行待定位麦克风节点的预测，输出待定位麦克风节点的位置划分概率。

本方案中，在所述初始定位区域中获取各点的可控响应功率筛选预设数量的区域，根据筛选的区域进行迭代搜索，获取可控响应功率最大时对应的空间位置作为目标声源的位置，具体为：

根据待定位麦克风节点的位置信息生成目标声源的初始定位区域，将所述初始定位区域划分为若干格网，在所述初始定位区域中计算任意点的可控响应功率；

将所述可控响应功率进行排序并筛选预设数量的点位，根据所述点位获取对应格网，引入空间注意力机制获取对应格网的空间注意力权重，根据所述初始注意力权重获取初始定位区域的收缩方向；

根据所述收缩方向进行初始定位区域的收缩，获取包含预设数量点位的更小区域，重新获取可控响应功率排序及收缩方向进行迭代收缩，当定位区域符合预设要求时停止迭代，获取最终定位区域；

根据获取的最终定位区域获取与位置确定后待定位麦克风节点的TDOA向量，基于所述TDOA向量利用TDOA定位算法生成最终定位区域的位置坐标。

本发明第二方面还提供了一种基于麦克风射频通信网络的定位系统，该系统包括：存储器、处理器，所述存储器中包括基于麦克风射频通信网络的定位方法程序，所述基于麦克风射频通信网络的定位方法程序被所述处理器执行时实现如下步骤：

附图说明

图1示出了本发明一种基于麦克风射频通信网络的定位方法的流程图；

图2示出了本发明提取目标射频指纹的方法流程图；

图3示出了本发明根据可控响应功率获取目标声源位置的方法流程图；

图4示出了本发明一种基于麦克风射频通信网络的定位系统的框图。

实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点，下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是，本发明还可以采用其他不同于在此描述的其他方式来实施，因此，本发明的保护范围并不受下面公开的具体实施例的限制。

图1示出了本发明一种基于麦克风射频通信网络的定位方法的流程图。

如图1所示，本发明第一方面提供了一种基于麦克风射频通信网络的定位方法，包括：

S102，获取目标区域中分布式麦克风阵列对应的射频通信网络，在所述射频通信网络中选取信标节点，并将所述信标节点在射频通信网络对应的拓扑结构中进行标记；

S104，根据不同麦克风阵列接收到目标声源的响应情况确定待定位麦克风节点，提取待定位麦克风节点与信标节点的射频信号，提取射频信号对应的目标射频指纹；

S106，基于深度学习方法构建麦克风定位模型，经过迁移训练后将所述目标射频指纹作为模型输入获取潜在特征，通过所述潜在特征获取待定位麦克风节点所属位置分类的概率；

S108，确定待定位麦克风节点的位置后，获取目标声源的初始定位区域，在所述初始定位区域中获取各点的可控响应功率筛选预设数量的区域，根据筛选的区域进行迭代搜索，获取可控响应功率最大时对应的空间位置作为目标声源的位置。

需要说明的是，获取目标区域中分布式麦克风阵列及无线接入设备，分布式麦克风阵列节点为随机放置，部分位置通常未知，所述分布式麦克风阵列分为固定麦克风阵列及移动麦克风阵列；根据射频连接关系获取目标区域的射频通信网络，并筛选固定麦克风阵列及无线接入设备作为信标候选点；由于目标区域内存在各种建筑等障碍物，信号只能以反射及折射等方式传播，因此存在非视距误差；通过大数据检索获取节点定位精度的影响因素，根据层次聚类筛选影响因素，计算影响因素的之间的相关程度，根据所述相关程度进行聚类，获取聚类结果并构建层次关系；在不同聚类结果对应的类簇中对影响因素进行层次分析，通过层次分析法获取各影响因素的权重信息，根据所述权重信息筛选预设数量的影响因素，根据所述影响因素确定评价指标；将目标区域划分为若干子区域，根据所述评价指标对不同子区域的环境特征进行评估获取环境因素对节点定位的扰动影响，根据扰动影响将所述子区域进行排序；通过排序结果获取预设数量的子区域进行标记，在标记子区域中选择部分信标候选点作为信标节点参与定位；选定目标对信标节点进行误差分析，获取信标节点的位置信息，根据TDOA测量值获取所述选定目标的估计位置，其中TDOA算法是通过计算接收到信号的时间差来确定目标的位置，根据选定目标的实际位置与估算位置的偏差进行误差修正。

需要说明的是，通过目标地区的射频通信网络中的麦克风阵列获取目标声源的声音信号，对所述声音信号利用汉明窗或者汉宁窗进行加窗处理，将所述声音信号截取为若干短时声音信号，将所述短时声音信号进行短时傅里叶变换；提取所述短时声音信号对应的时频谱，将所述时频谱利用梅尔滤波器进行处理获取对数梅尔谱，根据所述对数梅尔谱获取短时声音信号中每帧的MFCC特征，所述MFCC特征为将对数梅尔谱进行倒谱操作后，通过离散余弦变换并取其中的前若干个系数，根据系数生成每帧的MFCC特征。并且获取短时信号中各帧声音信号的短时能量，根据短时能量衡量声音信号的幅度变化情况，将所述MFCC特征及短时能量获取不同麦克风节点对目标声源的响应情况，保留符合预设标准的麦克风节点；在所述符合预设标准的麦克风节点中筛选移动麦克风节点，确定待定位麦克风节点。

图2示出了本发明提取目标射频指纹的方法流程图。

根据本发明实施例，提取待定位麦克风节点与信标节点的射频信号，提取射频信号对应的目标射频指纹，具体为：

S202，获取待定位麦克风节点与信标节点的射频信号，对所述射频信号进行加窗处理获取射频时序谱，根据所述射频时序谱获取当前时间戳对应的目标射频指纹；

S204，将所述目标射频指纹在预设射频指纹数据库中进行筛选，根据相似度计算构建目标射频指纹邻域范围，获取目标射频指纹邻域范围内的已采集射频指纹参考点，并提取射频指纹参考点的射频时序谱；

S206，将射频指纹参考点的射频时序谱进行加噪编码获取对应的噪声时序谱，将所述噪声时序谱进行叠加获取目标射频指纹对应的噪声时序谱，将所述噪声时序谱导入U-net网络进行去噪；

S208，在所述U-net网络中利用残差网络及自注意力机制进行特征编码，将编码后特征导入解码器，通过上采样进行解码去噪，生成目标射频指纹的重建射频时序谱；

S210，根据所述重建射频时序谱进行目标射频指纹的数据扩充，输出最终的目标射频指纹。

需要说明的是，由于射频定位是通过建立指纹空间和位置坐标之间的对应关系来实现定位，因此不同参考点处的射频指纹各不相同，所述射频指纹可以为接收信号强度、信道状态信息及信号信噪比等。射频时序谱包含一个时间窗内接收到的所有信号源的接收信号强度信息，生成目标射频指纹，并将目标射频指纹进行数据增强，通过前向过程进行逐步加噪，将得到的噪声图编码到隐空间中并进行线性插值，将射频时序谱变为近似标准高斯噪声谱，生成目标射频指纹的噪声时序谱，通过反向过程对噪声时序谱逐步去噪，获得目标射频指纹重建后的射频时序谱，通过重建射频时序谱重新生成目标射频指纹，结合原始目标射频指纹进行数据扩充。

需要说明的是，通过神经网络等深度学习方法构建麦克风定位模型，射频指纹数据库的分布会随着时间发生变化，导致定位精度不断下降，通过迁移学习克服射频指纹数据库的分布变化导致定位精度下降的问题，根据信标节点的更新获取当前含有少量位置更新的射频指纹数据库，将原始的射频指纹数据库作为源域，将含有少量位置更新的射频指纹数据库作为目标域；根据所述源域及目标域对所述麦克风定位模型进行迁移训练，初始化源域及目标域的样本权重，射频指纹与位置信息之间的非线性函数，根据源域及目标域对应的错误率更新训练权重，若分类正确则减少样本权重，若分类错误则增大样本权重；在目标域中根据更新后的权重进行排序，选取权重最大的一批数据重新构建训练集，通过权重更新将存在分布差异的两射频指纹数据库在经过样本权重调整后具有相似的数据分布，输出训练好的麦克风定位模型；将所述目标射频指纹导入麦克风定位模型，提取目标射频指纹的潜在特征，根据所述潜在特征进行待定位麦克风节点的预测，输出待定位麦克风节点的位置划分概率。

图3示出了本发明根据可控响应功率获取目标声源位置的方法流程图。

根据本发明实施例，在所述初始定位区域中获取各点的可控响应功率筛选预设数量的区域，根据筛选的区域进行迭代搜索，获取可控响应功率最大时对应的空间位置作为目标声源的位置，具体为：

S302，根据待定位麦克风节点的位置信息生成目标声源的初始定位区域，将所述初始定位区域划分为若干格网，在所述初始定位区域中计算任意点的可控响应功率；

S304，将所述可控响应功率进行排序并筛选预设数量的点位，根据所述点位获取对应格网，引入空间注意力机制获取对应格网的空间注意力权重，根据所述初始注意力权重获取初始定位区域的收缩方向；

S306，根据所述收缩方向进行初始定位区域的收缩，获取包含预设数量点位的更小区域，重新获取可控响应功率排序及收缩方向进行迭代收缩，当定位区域符合预设要求时停止迭代，获取最终定位区域；

S308，根据获取的最终定位区域获取与位置确定后待定位麦克风节点的TDOA向量，基于所述TDOA向量利用TDOA定位算法生成最终定位区域的位置坐标。

需要说明的是，根据可控波束声源定位算法 SRP对可能包含目标声源的初始定位区域进行搜索，找出可控响应功率最大值对应的空间位置，获取初始定位空间中的一点计算/>的可控响应功率/>，具体为：/>其中，N为麦克风阵列数量，/>分别为麦克风/>，麦克风/>接收的声音信号所对应的傅里叶变换，/>为加权函数，/>为目标声源从/>到麦克风/>，麦克风/>的传播时延，/>为共轭计算。

优选的，所述加权函数为PHAT加权函数，用其特性能够弱化伪峰，提高抗噪声和混响的能力，通过待定位麦克风节点的位置确定初始定位区域显著降低运算量、提高算法运算效率的同时使得声源定位更加准确，在迭代中不断收缩定位区域，当最优解包含于一个足够小的定位区域时停止迭代过程。另外迭代收缩中引入空间注意力机制，使得区域收缩关注更有价值格网，从而确定收缩搜索方向，为收缩提供数据指示。

根据本发明实施例，当目标区域中存在多声源时，获取目标声源的位置信息，根据所述位置信息获取目标声源到周围麦克风节点的到达时间差，通过所述到达时间差获取每个声源对应的时延；并根据不同时间戳的区域搜索获取当前时间步对应的位置变化序列，根据所述位置变化序列提取时空特征，通过所述时空特征进行目标声源的轨迹预测，利用轨迹预测唤醒对应子区域的麦克风阵列，将所述时延传递至对应子区域的麦克风阵列，利用时延对目标声源进行识别，进行目标声源的跟踪。

本发明第二方面还提供了一种基于麦克风射频通信网络的定位系统4，该系统包括：存储器41、处理器42，所述存储器中包括基于麦克风射频通信网络的定位方法程序，所述基于麦克风射频通信网络的定位方法程序被所述处理器执行时实现如下步骤：

需要说明的是，根据可控波束声源定位算法 SRP对可能包含目标声源的初始定位区域进行搜索，找出可控响应功率最大值对应的空间位置，获取初始定位空间中的一点，计算/>的可控响应功率/>，具体为：/>其中，N为麦克风阵列数量，/>分别为麦克风/>，麦克风/>接收的声音信号所对应的傅里叶变换，/>为加权函数，/>为目标声源从/>到麦克风/>，麦克风/>的传播时延，/>为共轭计算。优选的，所述加权函数为PHAT加权函数，用其特性能够弱化伪峰，提高抗噪声和混响的能力，通过待定位麦克风节点的位置确定初始定位区域显著降低运算量、提高算法运算效率的同时使得声源定位更加准确，在迭代中不断收缩定位区域，当最优解包含于一个足够小的定位区域时停止迭代过程。另外迭代收缩中引入空间注意力机制，使得区域收缩关注更有价值格网，从而确定收缩搜索方向，为收缩提供数据指示。

本发明第三方面还提供一种计算机可读存储介质，所述计算机可读存储介质中包括基于麦克风射频通信网络的定位方法程序，所述基于麦克风射频通信网络的定位方法程序被处理器执行时，实现如上述任一项所述的基于麦克风射频通信网络的定位方法的步骤。

在本申请所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，如：多个单元或组件可以结合，或可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口，设备或单元的间接耦合或通信连接，可以是电性的、机械的或其它形式的。

上述作为分离部件说明的单元可以是、或也可以不是物理上分开的，作为单元显示的部件可以是、或也可以不是物理单元；既可以位于一个地方，也可以分布到多个网络单元上；可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外，在本发明各实施例中的各功能单元可以全部集成在一个处理单元中，也可以是各单元分别单独作为一个单元，也可以两个或两个以上单元集成在一个单元中；上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：移动存储设备、只读存储器（ROM，Read-OnlyMemory）、随机存取存储器（RAM，RandomAccessMemory）、磁碟或者光盘等各种可以存储程序代码的介质。

或者，本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机、服务器、或者网络设备等）执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括：移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种基于麦克风射频通信网络的定位方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于麦克风射频通信网络的定位方法，其特征在于，获取目标区域中分布式麦克风阵列对应的射频通信网络，在所述射频通信网络中选取信标节点，具体为：

3.根据权利要求1所述的一种基于麦克风射频通信网络的定位方法，其特征在于，根据不同麦克风阵列接收到目标声源的响应情况确定待定位麦克风节点，具体为：

4.根据权利要求1所述的一种基于麦克风射频通信网络的定位方法，其特征在于，提取待定位麦克风节点与信标节点的射频信号，提取射频信号对应的目标射频指纹，具体为：

5.根据权利要求1所述的一种基于麦克风射频通信网络的定位方法，其特征在于，基于深度学习方法构建麦克风定位模型，具体为：

6.根据权利要求1所述的一种基于麦克风射频通信网络的定位方法，其特征在于，在所述初始定位区域中获取各点的可控响应功率筛选预设数量的区域，根据筛选的区域进行迭代搜索，获取可控响应功率最大时对应的空间位置作为目标声源的位置，具体为：

7.一种基于麦克风射频通信网络的定位系统，其特征在于，该系统包括：存储器、处理器，所述存储器中包括基于麦克风射频通信网络的定位方法程序，所述基于麦克风射频通信网络的定位方法程序被所述处理器执行时实现如下步骤：

8.根据权利要求7所述的一种基于麦克风射频通信网络的定位系统，其特征在于，提取待定位麦克风节点与信标节点的射频信号，提取射频信号对应的目标射频指纹，具体为：

9.根据权利要求7所述的一种基于麦克风射频通信网络的定位系统，其特征在于，基于深度学习方法构建麦克风定位模型，具体为：

10.根据权利要求7所述的一种基于麦克风射频通信网络的定位系统，其特征在于，在所述初始定位区域中获取各点的可控响应功率筛选预设数量的区域，根据筛选的区域进行迭代搜索，获取可控响应功率最大时对应的空间位置作为目标声源的位置，具体为：