CN109343001A - 一种无人机声音识别定位装置及方法 - Google Patents
一种无人机声音识别定位装置及方法 Download PDFInfo
- Publication number
- CN109343001A CN109343001A CN201811319605.1A CN201811319605A CN109343001A CN 109343001 A CN109343001 A CN 109343001A CN 201811319605 A CN201811319605 A CN 201811319605A CN 109343001 A CN109343001 A CN 109343001A
- Authority
- CN
- China
- Prior art keywords
- sound
- module
- unmanned plane
- signal
- wireless
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 16
- 230000003321 amplification Effects 0.000 claims abstract description 26
- 238000003199 nucleic acid amplification method Methods 0.000 claims abstract description 26
- 238000000605 extraction Methods 0.000 claims abstract description 13
- 230000005540 biological transmission Effects 0.000 claims abstract description 11
- 230000005236 sound signal Effects 0.000 claims description 68
- 230000007613 environmental effect Effects 0.000 claims description 62
- 238000012545 processing Methods 0.000 claims description 23
- 238000007781 pre-processing Methods 0.000 claims description 19
- 238000009432 framing Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 2
- 230000004807 localization Effects 0.000 abstract description 2
- 238000012544 monitoring process Methods 0.000 abstract description 2
- 238000013527 convolutional neural network Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 5
- 230000004913 activation Effects 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 238000011176 pooling Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003475 lamination Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004377 microelectronic Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S5/00—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
- G01S5/18—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/24—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Physics & Mathematics (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Abstract
本发明公开了一种无人机声音识别定位装置及方法,装置包括无线声音传感器网络和总控制器;无线声音传感器网络包括多个无线声音传感器节点,每个无线声音传感器节点均主要由七个声音传感器、信号滤波放大模块、ADC模块、MCU和无线发送模块组成;总控制器包括解码模块、声音识别模块和三维七元声音传感器阵列声源定位模块。本发明的环境声音的监控及传输采用无线传感器网络的方式,方便快捷、适应性强,在进行声音识别时除了采用MFCC作特征提取外,还输入至CNN模型中,然后用SVM判别是否包含无人机声音,使得识别率更加准确。最后采用三维七元声音传感器阵列声源定位算法对无人机进行三维定位,定位更加准确。
Description
技术领域
本发明涉及无人机识别和定位技术领域,具体涉及一种无人机声音识别定位装置及方法。
背景技术
我国消费级民用无人机的市场份额更是占到了全球市场的70%以上,占据了绝对优势。2015年,全球无人机大约销售58.7万架,其中军用无人机约占3%,民用无人机占97%;民用无人机销量中,专业级无人机销量约17.1万架,消费级无人机销量约39.9万架。
但无人机技术发展是一把双刃剑。无人机虽多用于摄影、录像等用途,但仍有可能被不法分子利用来实施犯罪,对反恐、维稳、安保、警卫、禁毒等领域的安全构成潜在而现实的风险挑战。另外,无人机一旦被不法分子利用进行非法拍摄,甚至用来进行投毒、爆炸等破坏活动,后果将不堪设想。
目前还缺乏一种有效、精确度高的无人机声音识别定位装置和方法。
发明内容
针对现有技术的不足,本发明旨在提供一种无人机声音识别定位装置及方法,方便快捷、适应性强,且识别效率和准确率更高。
为了实现上述目的,本发明采用如下技术方案:
一种无人机声音识别定位装置,包括无线声音传感器网络和总控制器;
所述无线声音传感器网络包括多个无线声音传感器节点,每个无线声音传感器节点均主要由七个声音传感器、信号滤波放大模块、ADC 模块、MCU和无线发送模块组成;所述七个声音传感器用于在所处位置录制环境声音并将环境声音信号传输至信号滤波放大模块;所述信号滤波放大模块用于对环境声音信号进行滤波放大并传输至ADC模块;ADC模块用于将经过滤波放大后的环境声音信号进行采样并传输至MCU;所述MCU用于对ADC模块采用的环境声音信号进行音频编码并通过无线发送模块发送至下一个无线声音传感器节点或总控制器;所述无线发送模块用于接收上一个无线声音传感器节点的声音信号并传输至下一个无线声音传感器节点或总控制器,以及将所属无线声音传感器节点的环境声音信号传输至下一个无线声音传感器节点或总控制器;
所述总控制器包括解码模块、声音识别模块和三维七元声音传感器阵列声源定位模块;
所述解码模块用于将接收每个无线声音传感器节点传输来的环境声音信号并进行解码;
所述声音识别模块用于对解码后的环境声音信号进行识别,判断其中是否含有无人机的声音;
所述三维七元声音传感器阵列声源定位模块用于当声音识别模块识别出有无线声音传感器节点录制的环境声音中含有无人机的声音时,按照如下方法对无人机的位置进行定位计算:
设定录制的环境声音中含有无人机的声音的无线声音传感器节点的七个声音传感器的位置坐标分别为M0(0,0,0)、M1(L,0,0)、 M2(0,L,0)、M3(-L,0,0)、M4(0,-L,0)、M5(0,0,-L)、M6(0,0,L),无人机的坐标为(x,y,z)、方位角为俯仰角为θ(0°≤θ≤90°),声音的传播速度为c=340m/s,ri表示无人机的声音到达第0个声音传感器的位置M0与无人机的声音到达第i个声音传感器的位置Mi的距离差值,ti表示无人机的声音到达第i个声音传感器与无人机的声音到达第0个声音传感器的时间差;由声音传感器与无人机的声音的几何位置关系得:
由式(1),可得:
根据式(2)、(3)、(4)即可求解到无人机的位置坐标。
进一步地,各个无线声音传感器节点的距离为300-500m。
进一步地,所述声音识别模块包括预处理模块、特征提取模块、 CNN处理模块和SVM二分类器;
所述预处理模块用于对环境声音信号进行预处理;具体为:如果环境声音信号中首尾出现静音则切除静音部分;切除静音部分之后将环境声音信号进行分帧操作,把其切开成多个小段,每个小段为一帧短时波形信号;
所述特征提取模块用于对经过预处理模块进行预处理的环境声音信号通过MFCC进行特征提取,得到带有声音特征的向量;
CNN处理模块用于将特征提取模块得到的带有声音特征的向量进行识别,识别出其中是否具有无人机声音;
SVM二分类器用于对经过CNN处理模块进行识别处理的向量进行二分类,将其分成是包含无人机声音的向量和不包含无人机声音的向量。
进一步地,所述无线发送模块采用ZigBee无线传输协议将经过音频编码的环境声音信号发送至下一个无线声音传感器节点或总控制器。
利用上述无人机声音识别定位装置进行无人机的识别和定位的方法,包括如下步骤:
S1、将无线声音传感器节点分布在需要进行无人机识别和定位的区域,每个无线声音传感器节点之间的距离在300-500m之间;
S2、所述无线声音传感器节点中的七个声音传感器开始录制环境声音,并将环境声音信号传输至信号滤波放大模块;所述信号滤波放大模块对环境声音信号进行滤波放大并传输至ADC模块;ADC模块将经过滤波放大后的环境声音信号进行采样并传输至MCU;所述MCU对 ADC模块采用的环境声音信号进行音频编码并通过无线发送模块发送至离自身最近的下一个无线声音传感器节点或总控制器;另外,所述无线发送模块在接收上一个无线声音传感器节点的声音信号后传输至离自身最近的下一个无线声音传感器节点或总控制器;
S3、总控制器的解码模块将接收到的环境声音信号进行解码,然后总控制器的声音识别模块对解码后的环境声音信号进行识别,判断其是否含有无人机的声音;
S4、当声音识别模块识别出有无线声音传感器节点录制的环境声音中含有无人机的声音时,按照如下方法对无人机的位置进行定位计算:
设定录制的环境声音中含有无人机的声音的无线声音传感器节点的七个声音传感器的位置坐标分别为M0(0,0,0)、M1(L,0,0)、 M2(0,L,0)、M3(-L,0,0)、M4(0,-L,0)、M5(0,0,-L)、M6(0,0,L),无人机的坐标为(x,y,z)、方位角为俯仰角为θ(0°≤θ≤90°),声音的传播速度为c=340m/s,ri表示无人机的声音到达第0个声音传感器的位置M0与无人机的声音到达第i个声音传感器的位置Mi的距离差值,ti表示无人机的声音到达第i个声音传感器与无人机的声音到达第0个声音传感器的时间差;由声音传感器与无人机的声音的几何位置关系得:
由式(1),可得:
根据式(2)、(3)、(4)即可求解到无人机的位置坐标。
进一步地,步骤S3中,所述声音识别模块对解码后的环境声音信号进行识别的过程包括:
S3.1、声音识别模块的预处理模块对解码后的环境声音信号进行预处理:如果环境声音信号中首尾出现静音则切除静音部分;切除静音部分之后将环境声音信号进行分帧操作,把其切开成多个小段,每小段称为一帧短时波形信号;
S3.2、声音识别模块的特征提取模块对经过预处理模块进行预处理的环境声音信号通过MFCC进行特征提取,得到带有声音特征的向量;
S3.3、声音识别模块的CNN处理模块将特征提取模块得到的带有声音特征的向量进行识别,识别出其中是否具有无人机声音;
S3.4、声音识别模块的SVM二分类器对经过CNN处理模块识别处理的向量进行二分类,将其分成是包含无人机声音的向量和不包含无人机声音的向量。
本发明的有益效果在于:本发明中,环境声音的监控及传输采用无线传感器网络的方式,具有更加方便快捷、适应性强的特点。在进行声音识别时除了采用MFCC作特征提取外,还采用输入至CNN模型中,最后用SVM判别是否包含无人机声音,使得识别率更加准确。最后采用三维七元声音传感器阵列声源定位算法对无人机进行三维定位,定位更加准确。
附图说明
图1为本发明实施例1中所述无人机声音识别定位装置的构成示意图;
图2为本发明实施例1中所述无人机声音识别定位装置的无线传输的示意图;
图3为本发明实施例1中所述无人机声音识别定位装置的无线声音传感器节点的硬件示意图;
图4为本发明实施例1中所述无人机声音识别定位装置的预处理模块的分帧示意图;
图5为本发明实施例2中的方法的特征提取的流程示意图;
图6为本发明实施例1中CNN处理模块的卷积神经网络的结构示意图;
图7为本发明实施例1提供的无人机声音识别定位装置的三维七源声音传感器阵列示意图。
图8为本发明实施例1提供的无人机声音识别定位装置的的控制流程示意图。
具体实施方式
以下将结合附图对本发明作进一步的描述,需要说明的是,本实施例以本技术方案为前提,给出了详细的实施方式和具体的操作过程,但本发明的保护范围并不限于本实施例。
实施例1
如图1-8所示,一种无人机声音识别定位装置,包括无线声音传感器网络和总控制器;
所述无线声音传感器网络包括多个无线声音传感器节点,每个无线声音传感器节点均主要由七个声音传感器、信号滤波放大模块、ADC 模块、MCU和无线发送模块组成;所述七个声音传感器用于在所处位置录制环境声音并将环境声音信号传输至信号滤波放大模块;所述信号滤波放大模块用于对环境声音信号进行滤波放大并传输至ADC模块;ADC模块用于将经过滤波放大后的环境声音信号进行采样并传输至MCU;所述MCU用于对ADC模块采用的环境声音信号进行音频编码并通过无线发送模块发送至下一个无线声音传感器节点或总控制器;所述无线发送模块用于接收上一个无线声音传感器节点的声音信号并传输至下一个无线声音传感器节点或总控制器,以及将所属无线声音传感器节点的环境声音信号传输至下一个无线声音传感器节点或总控制器。
在本实施例中,所述七个声音传感器排列如图7所示,其中一个声音传感器位于中心位置,设位于中心位置的声音传感器的坐标值为 M0(0,0,0),则其他六个声音传感器的坐标值分别为M1(L,0,0)、 M2(0,L,0)、M3(-L,0,0)、M4(0,-L,0)、M5(0,0,-L)、M6(0,0,L)。
进一步地,所述无线发送模块采用ZigBee无线传输协议将经过音频编码的环境声音信号发送至下一个无线声音传感器节点或总控制器。
进一步地,各个无线声音传感器节点的距离为300-500m。
所述总控制器包括解码模块、声音识别模块和三维七元声音传感器阵列声源定位模块;
所述解码模块用于将接收每个无线声音传感器节点传输来的环境声音信号并进行解码;
所述声音识别模块用于对解码后的环境声音信号进行识别,判断其中是否含有无人机的声音;
所述三维七元声音传感器阵列声源定位模块用于当声音识别模块识别出有无线声音传感器节点录制的环境声音中含有无人机的声音时,按照如下方法对无人机的位置进行定位计算:
设定录制的环境声音中含有无人机的声音的无线声音传感器节点的七个声音传感器的位置坐标分别为M0(0,0,0)、M1(L,0,0)、 M2(0,L,0)、M3(-L,0,0)、M4(0,-L,0)、M5(0,0,-L)、M6(0,0,L),无人机的坐标为(x,y,z)、方位角为俯仰角为θ(0°≤θ≤90°),声音的传播速度为c=340m/s,ri表示无人机的声音到达第0个声音传感器的位置M0与无人机的声音到达第i个声音传感器的位置Mi的距离差值,ti表示无人机的声音到达第i个声音传感器与无人机的声音到达第0个声音传感器的时间差;由声音传感器与无人机的声音的几何位置关系得:
由式(1),可得:
根据式(2)、(3)、(4)即可求解到无人机的位置坐标。
进一步地,所述声音识别模块包括预处理模块、特征提取模块、 CNN处理模块和SVM二分类器;
所述预处理模块用于对环境声音信号进行预处理;具体为:如果环境声音信号中首尾出现静音则切除静音部分;切除静音部分之后将环境声音信号进行分帧操作,把其切开成多个小段,每个小段为一帧短时波形信号;
例如,如图4所示,将波形进行切分,每一帧长度为10ms,下一帧隔7ms,相邻两帧有3ms的重叠。分帧后,环境声音信号就变成了很多帧短时波形信号。但波形信号在时域上几乎没有描述能力,因此必须将波形信号作变换,在本实施例中采用MFCC进行特征提取。
所述特征提取模块用于对经过预处理模块进行预处理的环境声音信号通过MFCC进行特征提取,得到带有声音特征的向量;具体为:
所述MFCC就是梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient)。通过MFCC进行特征提取使环境声音信号中具有辨识性的成分提取出来,将波形信号处理成特征向量的形式。主要包括以下四个步骤:
1)将经过分帧操作得到每一帧短时波形信号经过快速傅里叶变换(FFT),将时域信号转换成频率信号;
2)进行Mel滤波;Mel就是将不同的频率按照不同的灵敏度进行处理,以至对语调的感知度为线性关系。
3)将Mel滤波的结果取对数;
4)进行傅里叶逆变换。这样就是进行倒谱分析了,将波形信号转换成了带有声音特征的向量了,可以通过倒谱向量进行声音分类器的训练和识别、分类了。
更进一步地,在进行快速傅里叶变换之前,可以先进行归一化。因为不同节点于无人机的距离长短不一,所以接收到的声音能量也有差异,经过归一化操作后可以减少这些差异的影响。在进行Mel滤波之前先进行去绝对值或者平方值的简单操作。
CNN处理模块用于将特征提取模块得到的带有声音特征的向量进行识别,识别出其中是否具有无人机声音;
CNN是卷积神经网络,本实施例中采用的浅层神经网络。如图6 所示,所述浅层神经网络包含五层,三层卷积层(conv)和两层全连接层(fc)。第一层的卷积层是采用5x5大小的核,有24个核,进行 24种特征提取,padding是采用“SAME padding”,在经过卷积计算之后通过ReLU激活函数激活,输出后在经过max pool ing。第二层的卷积层也是采用5x5大小的核,用了48个核,padding是采用“SAME padding”,再经过卷积计算之后通过ReLU激活函数激活,输出后在经过max pool ing。第三层的卷积层也是采用5x5大小的核,和第二层一样用了48个核,padding是采用“SAME padding”,再经过卷积计算之后通过ReLU激活函数激活,输出后不再经过max pool ing,而是直接输入至下一层。第四层是全连接层,将卷积之后的结果拉成 64维的向量,计算之后通过ReLU激活函数激活。最后一层是全连接层,将生一层的向量压缩成10维的向量。
SVM二分类器用于对经过CNN处理模块进行识别处理的向量进行二分类,将其分成是包含无人机声音的向量和不包含无人机声音的向量。SVM就是在十维的空间中找到最好的决策边界,使得位于这边界两边的值能够处于两分类的状态。
在本实施例中,所述总控制器是采用意法半导体公司的 STM32F407系列的芯片,该芯片的工作最高主频可以达到168MHz,在 168MHz频率下,从Flash存储器执行时,STM32F407具有 210DMIPS/566CoreMark性能,并且利用意法半导体的ART加速器实现了FLASH零等待状态,这些都为快速的实现解码提供了有利条件,提高了此磁悬浮定位测速系统的实时性。STM32F407芯片还具有丰富的连接功能,出色的创新型外设,如具有符合IEEE1588 v2标准要求的以太网MAC10/100接口,能够快速的将经信号处理电路的信息传入并存储。解码模块、声音识别模块和三维七元声音传感器阵列声源定位模块以算法的形式写入STM32F407中进行实现。
实施例2
本实施例提供一种利用实施例1所述装置进行无人机的识别和定位的方法,包括如下步骤:
S1、将无线声音传感器节点分布在需要进行无人机识别和定位的区域,每个无线声音传感器节点之间的距离在300-500m之间;
S2、所述无线声音传感器节点中的七个声音传感器开始录制环境声音,并将环境声音信号传输至信号滤波放大模块;所述信号滤波放大模块对环境声音信号进行滤波放大并传输至ADC模块;ADC模块将经过滤波放大后的环境声音信号进行采样并传输至MCU;所述MCU对 ADC模块采用的环境声音信号进行音频编码并通过无线发送模块发送至离自身最近的下一个无线声音传感器节点或总控制器;另外,所述无线发送模块在接收上一个无线声音传感器节点的声音信号后传输至离自身最近的下一个无线声音传感器节点或总控制器;
在本实施例中,有其他无线声音传感器节点离自身较总控制器近,各个无线声音传感器节点会将环境声音信号传输至离自身最近的无线声音传感器节点,然后由该接收的无线声音传感器节点将环境声音信号继续传输至下一个离自身最近的无线声音传感器节点,直至传输至总控制器中。如果总控制器离自身最近,则直接传输至总控制器中。
S3、总控制器的解码模块将接收到的环境声音信号进行解码,然后总控制器的声音识别模块对解码后的环境声音信号进行识别,判断其是否含有无人机的声音;
S4、当声音识别模块识别出有无线声音传感器节点录制的环境声音中含有无人机的声音时,按照如下方法对无人机的位置进行定位计算:
设定录制的环境声音中含有无人机的声音的无线声音传感器节点的七个声音传感器的位置坐标分别为M0(0,0,0)、M1(L,0,0)、 M2(0,L,0)、M3(-L,0,0)、M4(0,-L,0)、M5(0,0,-L)、M6(0,0,L),无人机的坐标为(x,y,z)、方位角为俯仰角为θ(0°≤θ≤90°),声音的传播速度为c=340m/s,ri表示无人机的声音到达第0个声音传感器的位置M0与无人机的声音到达第i个声音传感器的位置Mi的距离差值,ti表示无人机的声音到达第i个声音传感器与无人机的声音到达第0个声音传感器的时间差;由声音传感器与无人机的声音的几何位置关系得:
由式(1),可得:
根据式(2)、(3)、(4)即可求解到无人机的位置坐标。
进一步地,步骤S3中,所述声音识别模块对解码后的环境声音信号进行识别的过程包括:
S3.1、声音识别模块的预处理模块对解码后的环境声音信号进行预处理:如果环境声音信号中首尾出现静音则切除静音部分;切除静音部分之后将环境声音信号进行分帧操作,把其切开成多个小段,每小段称为一帧短时波形信号;
S3.2、声音识别模块的特征提取模块对经过预处理模块进行预处理的环境声音信号通过MFCC进行特征提取,得到带有声音特征的向量;进一步包括:
S3.2.1、将经过分帧操作得到每一帧短时波形信号经过快速傅里叶变换(FFT),将时域信号转换成频率信号;
S3.2.2、进行Mel滤波;
S3.2.3、将Mel滤波的结果取对数;
S3.2.4、进行傅里叶逆变换,将波形信号转换成了带有声音特征的向量。
更进一步地,在进行快速傅里叶变换之前,可以先进行归一化。因为不同节点于无人机的距离长短不一,所以接收到的声音能量也有差异,经过归一化操作后可以减少这些差异的影响。在进行Mel滤波之前先进行去绝对值或者平方值的简单操作。
S3.3、声音识别模块的CNN处理模块将特征提取模块得到的带有声音特征的向量进行识别,识别出其中是否具有无人机声音;
S3.4、声音识别模块的SVM二分类器对经过CNN处理模块识别处理的向量进行二分类,将其分成是包含无人机声音的向量和不包含无人机声音的向量。
对于本领域的技术人员来说,可以根据以上的技术方案和构思,给出各种相应的改变和变形,而所有的这些改变和变形,都应该包括在本发明权利要求的保护范围之内。
Claims (6)
1.一种无人机声音识别定位装置,其特征在于,包括无线声音传感器网络和总控制器;
所述无线声音传感器网络包括多个无线声音传感器节点,每个无线声音传感器节点均主要由七个声音传感器、信号滤波放大模块、ADC模块、MCU和无线发送模块组成;所述七个声音传感器用于在所处位置录制环境声音并将环境声音信号传输至信号滤波放大模块;所述信号滤波放大模块用于对环境声音信号进行滤波放大并传输至ADC模块;ADC模块用于将经过滤波放大后的环境声音信号进行采样并传输至MCU;所述MCU用于对ADC模块采用的环境声音信号进行音频编码并通过无线发送模块发送至下一个无线声音传感器节点或总控制器;所述无线发送模块用于接收上一个无线声音传感器节点的声音信号并传输至下一个无线声音传感器节点或总控制器,以及将所属无线声音传感器节点的环境声音信号传输至下一个无线声音传感器节点或总控制器;
所述总控制器包括解码模块、声音识别模块和三维七元声音传感器阵列声源定位模块;
所述解码模块用于将接收每个无线声音传感器节点传输来的环境声音信号并进行解码;
所述声音识别模块用于对解码后的环境声音信号进行识别,判断其中是否含有无人机的声音;
所述三维七元声音传感器阵列声源定位模块用于当声音识别模块识别出有无线声音传感器节点录制的环境声音中含有无人机的声音时,按照如下方法对无人机的位置进行定位计算:
设定录制的环境声音中含有无人机的声音的无线声音传感器节点的七个声音传感器的位置坐标分别为M0(0,0,0)、M1(L,0,0)、M2(0,L,0)、M3(-L,0,0)、M4(0,-L,0)、M5(0,0,-L)、M6(0,0,L),无人机的坐标为(x,y,z)、方位角为俯仰角为θ(0°≤θ≤90°),声音的传播速度为c=340m/s,ri表示无人机的声音到达第0个声音传感器的位置M0与无人机的声音到达第i个声音传感器的位置Mi的距离差值,ti表示无人机的声音到达第i个声音传感器与无人机的声音到达第0个声音传感器的时间差;由声音传感器与无人机的声音的几何位置关系得:
由式(1),可得:
根据式(2)、(3)、(4)即可求解到无人机的位置坐标。
2.根据权利要求1所述的无人机声音识别定位装置,其特征在于,各个无线声音传感器节点的距离为300-500m。
3.根据权利要求1所述的无人机声音识别定位装置,其特征在于,所述声音识别模块包括预处理模块、特征提取模块、CNN处理模块和SVM二分类器;
所述预处理模块用于对环境声音信号进行预处理;具体为:如果环境声音信号中首尾出现静音则切除静音部分;切除静音部分之后将环境声音信号进行分帧操作,把其切开成多个小段,每个小段为一帧短时波形信号;
所述特征提取模块用于对经过预处理模块进行预处理的环境声音信号通过MFCC进行特征提取,得到带有声音特征的向量;
CNN处理模块用于将特征提取模块得到的带有声音特征的向量进行识别,识别出其中是否具有无人机声音;
SVM二分类器用于对经过CNN处理模块进行识别处理的向量进行二分类,将其分成是包含无人机声音的向量和不包含无人机声音的向量。
4.根据权利要求1所述的无人机声音识别定位装置,其特征在于,所述无线发送模块采用ZigBee无线传输协议将经过音频编码的环境声音信号发送至下一个无线声音传感器节点或总控制器。
5.利用权利要求1所述的无人机声音识别定位装置进行无人机的识别和定位的方法,其特征在于,包括如下步骤:
S1、将无线声音传感器节点分布在需要进行无人机识别和定位的区域,每个无线声音传感器节点之间的距离在300-500m之间;
S2、所述无线声音传感器节点中的七个声音传感器开始录制环境声音,并将环境声音信号传输至信号滤波放大模块;所述信号滤波放大模块对环境声音信号进行滤波放大并传输至ADC模块;ADC模块将经过滤波放大后的环境声音信号进行采样并传输至MCU;所述MCU对ADC模块采用的环境声音信号进行音频编码并通过无线发送模块发送至离自身最近的下一个无线声音传感器节点或总控制器;另外,所述无线发送模块在接收上一个无线声音传感器节点的声音信号后传输至离自身最近的下一个无线声音传感器节点或总控制器;
S3、总控制器的解码模块将接收到的环境声音信号进行解码,然后总控制器的声音识别模块对解码后的环境声音信号进行识别,判断其是否含有无人机的声音;
S4、当声音识别模块识别出有无线声音传感器节点录制的环境声音中含有无人机的声音时,按照如下方法对无人机的位置进行定位计算:
设定录制的环境声音中含有无人机的声音的无线声音传感器节点的七个声音传感器的位置坐标分别为M0(0,0,0)、M1(L,0,0)、M2(0,L,0)、M3(-L,0,0)、M4(0,-L,0)、M5(0,0,-L)、M6(0,0,L),无人机的坐标为(x,y,z)、方位角为俯仰角为θ(0°≤θ≤90°),声音的传播速度为c=340m/s,ri表示无人机的声音到达第0个声音传感器的位置M0与无人机的声音到达第i个声音传感器的位置Mi的距离差值,ti表示无人机的声音到达第i个声音传感器与无人机的声音到达第0个声音传感器的时间差;由声音传感器与无人机的声音的几何位置关系得:
由式(1),可得:
根据式(2)、(3)、(4)即可求解到无人机的位置坐标。
6.根据权利要求5所述的方法,其特征在于,步骤S3中,所述声音识别模块对解码后的环境声音信号进行识别的过程包括:
S3.1、声音识别模块的预处理模块对解码后的环境声音信号进行预处理:如果环境声音信号中首尾出现静音则切除静音部分;切除静音部分之后将环境声音信号进行分帧操作,把其切开成多个小段,每小段称为一帧短时波形信号;
S3.2、声音识别模块的特征提取模块对经过预处理模块进行预处理的环境声音信号通过MFCC进行特征提取,得到带有声音特征的向量;
S3.3、声音识别模块的CNN处理模块将特征提取模块得到的带有声音特征的向量进行识别,识别出其中是否具有无人机声音;
S3.4、声音识别模块的SVM二分类器对经过CNN处理模块识别处理的向量进行二分类,将其分成是包含无人机声音的向量和不包含无人机声音的向量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811319605.1A CN109343001A (zh) | 2018-11-07 | 2018-11-07 | 一种无人机声音识别定位装置及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811319605.1A CN109343001A (zh) | 2018-11-07 | 2018-11-07 | 一种无人机声音识别定位装置及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109343001A true CN109343001A (zh) | 2019-02-15 |
Family
ID=65314458
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811319605.1A Pending CN109343001A (zh) | 2018-11-07 | 2018-11-07 | 一种无人机声音识别定位装置及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109343001A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112735473A (zh) * | 2020-11-30 | 2021-04-30 | 长春理工大学 | 基于声音识别无人机的方法及系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104076331A (zh) * | 2014-06-18 | 2014-10-01 | 南京信息工程大学 | 一种七元麦克风阵列的声源定位方法 |
-
2018
- 2018-11-07 CN CN201811319605.1A patent/CN109343001A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104076331A (zh) * | 2014-06-18 | 2014-10-01 | 南京信息工程大学 | 一种七元麦克风阵列的声源定位方法 |
Non-Patent Citations (4)
Title |
---|
J.-L. RULLAN-LARA ET AL.: ""UAV real-time location using a Wireless Sensor Network"", 《2011 IEEE》 * |
孙智国: ""一种支持度函数的改进及其WSN数据融合应用研究"", 《中国优秀硕士学位论文全文数据库(电子期刊)信息科技辑》 * |
杨东海: ""基于声音识别的四旋翼无人机探测技术研究与实现"", 《中国优秀硕士学位论文全文数据库(电子期刊) 工程科技II辑》 * |
王航: ""基于ZigBee的智能精准农业系统关键技术研究及应用"", 《中国优秀硕士学位论文全文数据库(电子期刊) 农业科技辑》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112735473A (zh) * | 2020-11-30 | 2021-04-30 | 长春理工大学 | 基于声音识别无人机的方法及系统 |
CN112735473B (zh) * | 2020-11-30 | 2022-07-05 | 长春理工大学 | 基于声音识别无人机的方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210158799A1 (en) | Speech recognition method, device, and computer-readable storage medium | |
CN110600054B (zh) | 基于网络模型融合的声场景分类方法 | |
JP6759509B2 (ja) | 音声の始点及び終点の検出方法、装置、コンピュータ設備及びプログラム | |
CN112735473B (zh) | 基于声音识别无人机的方法及系统 | |
CN104036774A (zh) | 藏语方言识别方法及系统 | |
CN101447188B (zh) | 数字声纹鉴定系统及确认和辨认方法 | |
EP2907121B1 (en) | Real-time traffic detection | |
CN206312566U (zh) | 一种车载智能音频装置 | |
CN108875592A (zh) | 一种基于注意力的卷积神经网络优化方法 | |
CN108922541A (zh) | 基于dtw和gmm模型的多维特征参数声纹识别方法 | |
CN109935226A (zh) | 一种基于深度神经网络的远场语音识别增强系统及方法 | |
CN109410956A (zh) | 一种音频数据的对象识别方法、装置、设备及存储介质 | |
CN110570873A (zh) | 声纹唤醒方法、装置、计算机设备以及存储介质 | |
Salman et al. | Machine learning inspired efficient audio drone detection using acoustic features | |
CN109460063A (zh) | 一种无人机搜救系统及其方法 | |
Wang et al. | Exploring audio semantic concepts for event-based video retrieval | |
CN110970020A (zh) | 一种利用声纹提取有效语音信号的方法 | |
CN109343001A (zh) | 一种无人机声音识别定位装置及方法 | |
CN111145726A (zh) | 基于深度学习的声场景分类方法、系统、装置及存储介质 | |
CN114242066A (zh) | 语音处理方法、语音处理模型的训练方法、设备及介质 | |
CN101950564A (zh) | 一种远程数字化语音采集分析识别系统 | |
CN109186752A (zh) | 基于图形处理器的水下声学信号采集、传输和检测系统 | |
Yang et al. | Acoustic scene classification using CNN ensembles and primary ambient extraction | |
Huang et al. | Audio-replay Attacks Spoofing Detection for Automatic Speaker Verification System | |
Yue et al. | Multidimensional zero-crossing interval points: a low sampling rate acoustic fingerprint recognition method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190215 |
|
RJ01 | Rejection of invention patent application after publication |