CN109343001A

CN109343001A - 一种无人机声音识别定位装置及方法

Info

Publication number: CN109343001A
Application number: CN201811319605.1A
Authority: CN
Inventors: 樊宽刚; 刘汉森; 邱海云; 何兵; 杨杰; 杨斌; 张振利; 邓永芳; 李家节; 占鹏飞
Original assignee: Jiangxi University of Science and Technology
Current assignee: Jiangxi University of Science and Technology
Priority date: 2018-11-07
Filing date: 2018-11-07
Publication date: 2019-02-15

Abstract

本发明公开了一种无人机声音识别定位装置及方法，装置包括无线声音传感器网络和总控制器；无线声音传感器网络包括多个无线声音传感器节点，每个无线声音传感器节点均主要由七个声音传感器、信号滤波放大模块、ADC模块、MCU和无线发送模块组成；总控制器包括解码模块、声音识别模块和三维七元声音传感器阵列声源定位模块。本发明的环境声音的监控及传输采用无线传感器网络的方式，方便快捷、适应性强，在进行声音识别时除了采用MFCC作特征提取外，还输入至CNN模型中，然后用SVM判别是否包含无人机声音，使得识别率更加准确。最后采用三维七元声音传感器阵列声源定位算法对无人机进行三维定位，定位更加准确。

Description

一种无人机声音识别定位装置及方法

技术领域

本发明涉及无人机识别和定位技术领域，具体涉及一种无人机声音识别定位装置及方法。

背景技术

我国消费级民用无人机的市场份额更是占到了全球市场的70％以上，占据了绝对优势。2015年，全球无人机大约销售58.7万架，其中军用无人机约占3％，民用无人机占97％；民用无人机销量中，专业级无人机销量约17.1万架，消费级无人机销量约39.9万架。

但无人机技术发展是一把双刃剑。无人机虽多用于摄影、录像等用途，但仍有可能被不法分子利用来实施犯罪，对反恐、维稳、安保、警卫、禁毒等领域的安全构成潜在而现实的风险挑战。另外，无人机一旦被不法分子利用进行非法拍摄，甚至用来进行投毒、爆炸等破坏活动，后果将不堪设想。

目前还缺乏一种有效、精确度高的无人机声音识别定位装置和方法。

发明内容

针对现有技术的不足，本发明旨在提供一种无人机声音识别定位装置及方法，方便快捷、适应性强，且识别效率和准确率更高。

为了实现上述目的，本发明采用如下技术方案：

一种无人机声音识别定位装置，包括无线声音传感器网络和总控制器；

所述无线声音传感器网络包括多个无线声音传感器节点，每个无线声音传感器节点均主要由七个声音传感器、信号滤波放大模块、ADC 模块、MCU和无线发送模块组成；所述七个声音传感器用于在所处位置录制环境声音并将环境声音信号传输至信号滤波放大模块；所述信号滤波放大模块用于对环境声音信号进行滤波放大并传输至ADC模块；ADC模块用于将经过滤波放大后的环境声音信号进行采样并传输至MCU；所述MCU用于对ADC模块采用的环境声音信号进行音频编码并通过无线发送模块发送至下一个无线声音传感器节点或总控制器；所述无线发送模块用于接收上一个无线声音传感器节点的声音信号并传输至下一个无线声音传感器节点或总控制器，以及将所属无线声音传感器节点的环境声音信号传输至下一个无线声音传感器节点或总控制器；

所述总控制器包括解码模块、声音识别模块和三维七元声音传感器阵列声源定位模块；

所述解码模块用于将接收每个无线声音传感器节点传输来的环境声音信号并进行解码；

所述声音识别模块用于对解码后的环境声音信号进行识别，判断其中是否含有无人机的声音；

所述三维七元声音传感器阵列声源定位模块用于当声音识别模块识别出有无线声音传感器节点录制的环境声音中含有无人机的声音时，按照如下方法对无人机的位置进行定位计算：

设定录制的环境声音中含有无人机的声音的无线声音传感器节点的七个声音传感器的位置坐标分别为M₀(0,0,0)、M₁(L,0,0)、 M₂(0,L,0)、M₃(-L,0,0)、M₄(0，-L，0)、M₅(0，0,-L)、M₆(0，0，L)，无人机的坐标为(x，y，z)、方位角为俯仰角为θ(0°≤θ≤90°)，声音的传播速度为c＝340m/s，r_i表示无人机的声音到达第0个声音传感器的位置M₀与无人机的声音到达第i个声音传感器的位置M_i的距离差值，t_i表示无人机的声音到达第i个声音传感器与无人机的声音到达第0个声音传感器的时间差；由声音传感器与无人机的声音的几何位置关系得：

由式(1)，可得：

根据式(2)、(3)、(4)即可求解到无人机的位置坐标。

进一步地，各个无线声音传感器节点的距离为300-500m。

进一步地，所述声音识别模块包括预处理模块、特征提取模块、 CNN处理模块和SVM二分类器；

所述预处理模块用于对环境声音信号进行预处理；具体为：如果环境声音信号中首尾出现静音则切除静音部分；切除静音部分之后将环境声音信号进行分帧操作，把其切开成多个小段，每个小段为一帧短时波形信号；

所述特征提取模块用于对经过预处理模块进行预处理的环境声音信号通过MFCC进行特征提取，得到带有声音特征的向量；

CNN处理模块用于将特征提取模块得到的带有声音特征的向量进行识别，识别出其中是否具有无人机声音；

SVM二分类器用于对经过CNN处理模块进行识别处理的向量进行二分类，将其分成是包含无人机声音的向量和不包含无人机声音的向量。

进一步地，所述无线发送模块采用ZigBee无线传输协议将经过音频编码的环境声音信号发送至下一个无线声音传感器节点或总控制器。

利用上述无人机声音识别定位装置进行无人机的识别和定位的方法，包括如下步骤：

S1、将无线声音传感器节点分布在需要进行无人机识别和定位的区域，每个无线声音传感器节点之间的距离在300-500m之间；

S2、所述无线声音传感器节点中的七个声音传感器开始录制环境声音，并将环境声音信号传输至信号滤波放大模块；所述信号滤波放大模块对环境声音信号进行滤波放大并传输至ADC模块；ADC模块将经过滤波放大后的环境声音信号进行采样并传输至MCU；所述MCU对 ADC模块采用的环境声音信号进行音频编码并通过无线发送模块发送至离自身最近的下一个无线声音传感器节点或总控制器；另外，所述无线发送模块在接收上一个无线声音传感器节点的声音信号后传输至离自身最近的下一个无线声音传感器节点或总控制器；

S3、总控制器的解码模块将接收到的环境声音信号进行解码，然后总控制器的声音识别模块对解码后的环境声音信号进行识别，判断其是否含有无人机的声音；

S4、当声音识别模块识别出有无线声音传感器节点录制的环境声音中含有无人机的声音时，按照如下方法对无人机的位置进行定位计算：

设定录制的环境声音中含有无人机的声音的无线声音传感器节点的七个声音传感器的位置坐标分别为M0(0,0,0)、M₁(L,0,0)、 M₂(0,L,0)、M₃(-L,0,0)、M₄(0,-L，0)、M₅(0,0,-L)、M₆(0,0,L)，无人机的坐标为(x,y,z)、方位角为俯仰角为θ(0°≤θ≤90°)，声音的传播速度为c＝340m/s，r_i表示无人机的声音到达第0个声音传感器的位置M₀与无人机的声音到达第i个声音传感器的位置M_i的距离差值，t_i表示无人机的声音到达第i个声音传感器与无人机的声音到达第0个声音传感器的时间差；由声音传感器与无人机的声音的几何位置关系得：

由式(1)，可得：

根据式(2)、(3)、(4)即可求解到无人机的位置坐标。

进一步地，步骤S3中，所述声音识别模块对解码后的环境声音信号进行识别的过程包括：

S3.1、声音识别模块的预处理模块对解码后的环境声音信号进行预处理：如果环境声音信号中首尾出现静音则切除静音部分；切除静音部分之后将环境声音信号进行分帧操作，把其切开成多个小段，每小段称为一帧短时波形信号；

S3.2、声音识别模块的特征提取模块对经过预处理模块进行预处理的环境声音信号通过MFCC进行特征提取，得到带有声音特征的向量；

S3.3、声音识别模块的CNN处理模块将特征提取模块得到的带有声音特征的向量进行识别，识别出其中是否具有无人机声音；

S3.4、声音识别模块的SVM二分类器对经过CNN处理模块识别处理的向量进行二分类，将其分成是包含无人机声音的向量和不包含无人机声音的向量。

本发明的有益效果在于：本发明中，环境声音的监控及传输采用无线传感器网络的方式，具有更加方便快捷、适应性强的特点。在进行声音识别时除了采用MFCC作特征提取外，还采用输入至CNN模型中，最后用SVM判别是否包含无人机声音，使得识别率更加准确。最后采用三维七元声音传感器阵列声源定位算法对无人机进行三维定位，定位更加准确。

附图说明

图1为本发明实施例1中所述无人机声音识别定位装置的构成示意图；

图2为本发明实施例1中所述无人机声音识别定位装置的无线传输的示意图；

图3为本发明实施例1中所述无人机声音识别定位装置的无线声音传感器节点的硬件示意图；

图4为本发明实施例1中所述无人机声音识别定位装置的预处理模块的分帧示意图；

图5为本发明实施例2中的方法的特征提取的流程示意图；

图6为本发明实施例1中CNN处理模块的卷积神经网络的结构示意图；

图7为本发明实施例1提供的无人机声音识别定位装置的三维七源声音传感器阵列示意图。

图8为本发明实施例1提供的无人机声音识别定位装置的的控制流程示意图。

具体实施方式

以下将结合附图对本发明作进一步的描述，需要说明的是，本实施例以本技术方案为前提，给出了详细的实施方式和具体的操作过程，但本发明的保护范围并不限于本实施例。

实施例1

如图1-8所示，一种无人机声音识别定位装置，包括无线声音传感器网络和总控制器；

所述无线声音传感器网络包括多个无线声音传感器节点，每个无线声音传感器节点均主要由七个声音传感器、信号滤波放大模块、ADC 模块、MCU和无线发送模块组成；所述七个声音传感器用于在所处位置录制环境声音并将环境声音信号传输至信号滤波放大模块；所述信号滤波放大模块用于对环境声音信号进行滤波放大并传输至ADC模块；ADC模块用于将经过滤波放大后的环境声音信号进行采样并传输至MCU；所述MCU用于对ADC模块采用的环境声音信号进行音频编码并通过无线发送模块发送至下一个无线声音传感器节点或总控制器；所述无线发送模块用于接收上一个无线声音传感器节点的声音信号并传输至下一个无线声音传感器节点或总控制器，以及将所属无线声音传感器节点的环境声音信号传输至下一个无线声音传感器节点或总控制器。

在本实施例中，所述七个声音传感器排列如图7所示，其中一个声音传感器位于中心位置，设位于中心位置的声音传感器的坐标值为 M₀(0,0,0)，则其他六个声音传感器的坐标值分别为M₁(L,0,0)、 M₂(0，L，0)、M₃(-L,0，0)、M₄(0,-L,0)、M₅(0,0,-L)、M₆(0,0,L)。

进一步地，各个无线声音传感器节点的距离为300-500m。

设定录制的环境声音中含有无人机的声音的无线声音传感器节点的七个声音传感器的位置坐标分别为M₀(0,0,0)、M₁(L，0,0)、 M₂(0,L,0)、M₃(-L,0,0)、M₄(0,-L,0)、M₅(0,0,-L)、M₆(0，0，L)，无人机的坐标为(x，y,z)、方位角为俯仰角为θ(0°≤θ≤90°)，声音的传播速度为c＝340m/s，r_i表示无人机的声音到达第0个声音传感器的位置M₀与无人机的声音到达第i个声音传感器的位置M_i的距离差值，t_i表示无人机的声音到达第i个声音传感器与无人机的声音到达第0个声音传感器的时间差；由声音传感器与无人机的声音的几何位置关系得：

由式(1)，可得：

根据式(2)、(3)、(4)即可求解到无人机的位置坐标。

例如，如图4所示，将波形进行切分，每一帧长度为10ms，下一帧隔7ms，相邻两帧有3ms的重叠。分帧后，环境声音信号就变成了很多帧短时波形信号。但波形信号在时域上几乎没有描述能力，因此必须将波形信号作变换，在本实施例中采用MFCC进行特征提取。

所述特征提取模块用于对经过预处理模块进行预处理的环境声音信号通过MFCC进行特征提取，得到带有声音特征的向量；具体为：

所述MFCC就是梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient)。通过MFCC进行特征提取使环境声音信号中具有辨识性的成分提取出来，将波形信号处理成特征向量的形式。主要包括以下四个步骤：

1)将经过分帧操作得到每一帧短时波形信号经过快速傅里叶变换(FFT)，将时域信号转换成频率信号；

2)进行Mel滤波；Mel就是将不同的频率按照不同的灵敏度进行处理，以至对语调的感知度为线性关系。

3)将Mel滤波的结果取对数；

4)进行傅里叶逆变换。这样就是进行倒谱分析了，将波形信号转换成了带有声音特征的向量了，可以通过倒谱向量进行声音分类器的训练和识别、分类了。

更进一步地，在进行快速傅里叶变换之前，可以先进行归一化。因为不同节点于无人机的距离长短不一，所以接收到的声音能量也有差异，经过归一化操作后可以减少这些差异的影响。在进行Mel滤波之前先进行去绝对值或者平方值的简单操作。

CNN是卷积神经网络，本实施例中采用的浅层神经网络。如图6 所示，所述浅层神经网络包含五层，三层卷积层(conv)和两层全连接层(fc)。第一层的卷积层是采用5x5大小的核，有24个核，进行 24种特征提取，padding是采用“SAME padding”，在经过卷积计算之后通过ReLU激活函数激活，输出后在经过max pool ing。第二层的卷积层也是采用5x5大小的核，用了48个核，padding是采用“SAME padding”，再经过卷积计算之后通过ReLU激活函数激活，输出后在经过max pool ing。第三层的卷积层也是采用5x5大小的核，和第二层一样用了48个核，padding是采用“SAME padding”，再经过卷积计算之后通过ReLU激活函数激活，输出后不再经过max pool ing，而是直接输入至下一层。第四层是全连接层，将卷积之后的结果拉成 64维的向量，计算之后通过ReLU激活函数激活。最后一层是全连接层，将生一层的向量压缩成10维的向量。

SVM二分类器用于对经过CNN处理模块进行识别处理的向量进行二分类，将其分成是包含无人机声音的向量和不包含无人机声音的向量。SVM就是在十维的空间中找到最好的决策边界，使得位于这边界两边的值能够处于两分类的状态。

在本实施例中，所述总控制器是采用意法半导体公司的 STM32F407系列的芯片，该芯片的工作最高主频可以达到168MHz，在 168MHz频率下，从Flash存储器执行时，STM32F407具有 210DMIPS/566CoreMark性能，并且利用意法半导体的ART加速器实现了FLASH零等待状态，这些都为快速的实现解码提供了有利条件，提高了此磁悬浮定位测速系统的实时性。STM32F407芯片还具有丰富的连接功能，出色的创新型外设，如具有符合IEEE1588 v2标准要求的以太网MAC10/100接口，能够快速的将经信号处理电路的信息传入并存储。解码模块、声音识别模块和三维七元声音传感器阵列声源定位模块以算法的形式写入STM32F407中进行实现。

实施例2

本实施例提供一种利用实施例1所述装置进行无人机的识别和定位的方法，包括如下步骤：

在本实施例中，有其他无线声音传感器节点离自身较总控制器近，各个无线声音传感器节点会将环境声音信号传输至离自身最近的无线声音传感器节点，然后由该接收的无线声音传感器节点将环境声音信号继续传输至下一个离自身最近的无线声音传感器节点，直至传输至总控制器中。如果总控制器离自身最近，则直接传输至总控制器中。

设定录制的环境声音中含有无人机的声音的无线声音传感器节点的七个声音传感器的位置坐标分别为M₀(0，0，0)、M₁(L，0,0)、 M₂(0,L,0)、M₃(-L,0,0)、M₄(0,-L,0)、M₅(0，0,-L)、M₆(0,0,L)，无人机的坐标为(x,y,z)、方位角为俯仰角为θ(0°≤θ≤90°)，声音的传播速度为c＝340m/s，r_i表示无人机的声音到达第0个声音传感器的位置M₀与无人机的声音到达第i个声音传感器的位置M_i的距离差值，t_i表示无人机的声音到达第i个声音传感器与无人机的声音到达第0个声音传感器的时间差；由声音传感器与无人机的声音的几何位置关系得：

由式(1)，可得：

根据式(2)、(3)、(4)即可求解到无人机的位置坐标。

S3.2、声音识别模块的特征提取模块对经过预处理模块进行预处理的环境声音信号通过MFCC进行特征提取，得到带有声音特征的向量；进一步包括：

S3.2.1、将经过分帧操作得到每一帧短时波形信号经过快速傅里叶变换(FFT)，将时域信号转换成频率信号；

S3.2.2、进行Mel滤波；

S3.2.3、将Mel滤波的结果取对数；

S3.2.4、进行傅里叶逆变换，将波形信号转换成了带有声音特征的向量。

对于本领域的技术人员来说，可以根据以上的技术方案和构思，给出各种相应的改变和变形，而所有的这些改变和变形，都应该包括在本发明权利要求的保护范围之内。

Claims

1.一种无人机声音识别定位装置，其特征在于，包括无线声音传感器网络和总控制器；

所述无线声音传感器网络包括多个无线声音传感器节点，每个无线声音传感器节点均主要由七个声音传感器、信号滤波放大模块、ADC模块、MCU和无线发送模块组成；所述七个声音传感器用于在所处位置录制环境声音并将环境声音信号传输至信号滤波放大模块；所述信号滤波放大模块用于对环境声音信号进行滤波放大并传输至ADC模块；ADC模块用于将经过滤波放大后的环境声音信号进行采样并传输至MCU；所述MCU用于对ADC模块采用的环境声音信号进行音频编码并通过无线发送模块发送至下一个无线声音传感器节点或总控制器；所述无线发送模块用于接收上一个无线声音传感器节点的声音信号并传输至下一个无线声音传感器节点或总控制器，以及将所属无线声音传感器节点的环境声音信号传输至下一个无线声音传感器节点或总控制器；

设定录制的环境声音中含有无人机的声音的无线声音传感器节点的七个声音传感器的位置坐标分别为M₀(0,0,0)、M₁(L，0，0)、M₂(0,L,0)、M₃(-L,0,0)、M₄(0,-L,0)、M₅(0,0,-L)、M₆(0,0，L)，无人机的坐标为(x,y,z)、方位角为俯仰角为θ(0°≤θ≤90°)，声音的传播速度为c＝340m/s，r_i表示无人机的声音到达第0个声音传感器的位置M₀与无人机的声音到达第i个声音传感器的位置M_i的距离差值，t_i表示无人机的声音到达第i个声音传感器与无人机的声音到达第0个声音传感器的时间差；由声音传感器与无人机的声音的几何位置关系得：

由式(1)，可得：

根据式(2)、(3)、(4)即可求解到无人机的位置坐标。

2.根据权利要求1所述的无人机声音识别定位装置，其特征在于，各个无线声音传感器节点的距离为300-500m。

3.根据权利要求1所述的无人机声音识别定位装置，其特征在于，所述声音识别模块包括预处理模块、特征提取模块、CNN处理模块和SVM二分类器；

4.根据权利要求1所述的无人机声音识别定位装置，其特征在于，所述无线发送模块采用ZigBee无线传输协议将经过音频编码的环境声音信号发送至下一个无线声音传感器节点或总控制器。

5.利用权利要求1所述的无人机声音识别定位装置进行无人机的识别和定位的方法，其特征在于，包括如下步骤：

S2、所述无线声音传感器节点中的七个声音传感器开始录制环境声音，并将环境声音信号传输至信号滤波放大模块；所述信号滤波放大模块对环境声音信号进行滤波放大并传输至ADC模块；ADC模块将经过滤波放大后的环境声音信号进行采样并传输至MCU；所述MCU对ADC模块采用的环境声音信号进行音频编码并通过无线发送模块发送至离自身最近的下一个无线声音传感器节点或总控制器；另外，所述无线发送模块在接收上一个无线声音传感器节点的声音信号后传输至离自身最近的下一个无线声音传感器节点或总控制器；

设定录制的环境声音中含有无人机的声音的无线声音传感器节点的七个声音传感器的位置坐标分别为M₀(0,0,0)、M₁(L,0,0)、M₂(0,L,0)、M₃(-L,0,0)、M₄(0,-L,0)、M₅(0,0，-L)、M₆(0，0,L)，无人机的坐标为(x,y,z)、方位角为俯仰角为θ(0°≤θ≤90°)，声音的传播速度为c＝340m/s，r_i表示无人机的声音到达第0个声音传感器的位置M₀与无人机的声音到达第i个声音传感器的位置M_i的距离差值，t_i表示无人机的声音到达第i个声音传感器与无人机的声音到达第0个声音传感器的时间差；由声音传感器与无人机的声音的几何位置关系得：

由式(1)，可得：

根据式(2)、(3)、(4)即可求解到无人机的位置坐标。

6.根据权利要求5所述的方法，其特征在于，步骤S3中，所述声音识别模块对解码后的环境声音信号进行识别的过程包括：