CN107993648A - 一种无人机识别方法、装置及电子设备 - Google Patents

一种无人机识别方法、装置及电子设备 Download PDF

Info

Publication number
CN107993648A
CN107993648A CN201711204886.1A CN201711204886A CN107993648A CN 107993648 A CN107993648 A CN 107993648A CN 201711204886 A CN201711204886 A CN 201711204886A CN 107993648 A CN107993648 A CN 107993648A
Authority
CN
China
Prior art keywords
unmanned plane
voice signal
conversion
region
detected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711204886.1A
Other languages
English (en)
Inventor
尉志青
马昊
魏思杰
冯志勇
张少廷
王义总
侯佳蕾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN201711204886.1A priority Critical patent/CN107993648A/zh
Publication of CN107993648A publication Critical patent/CN107993648A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本发明实施例提供了无人机识别方法、装置及电子设备,其中,方法包括:采集待检测区域的声音信号;对声音信号进行快速傅里叶变换,得到变换声音信号;根据变换声音信号的频率特征,对待检测区域是否存在无人机进行预判决;在预判决的结果为存在无人机时,对变换声音信号进行梅尔倒谱系数MFCC变换,得到MFCC特征向量;将MFCC特征向量输入至预先训练的支持向量机SVM模型中,识别待检测区域是否存在无人机,其中,SVM模型是根据多个不同类型的样本声音信号,以及各样本声音信号是否为无人机运行声音的对应结果训练得到的,其中,多个不同类型的样本声音信号中至少部分为无人机运行声音信号。如此能够提高无人机识别的精准度。

Description

一种无人机识别方法、装置及电子设备
技术领域
本发明涉及模式识别技术领域,特别是涉及一种基于无人机声音的无人机识别方法、装置及电子设备。
背景技术
随着电子技术的发展,无人机逐渐被广泛应用到商业和民用消费市场,例如,航空拍摄、新闻报道、快递服务等行业。为了实现对无人机的管理,使得能够更好地应用于多种领域,无人机识别技术显得尤为重要。
现有技术中,一种常见的方法是通过雷达检测实现无人机识别。具体地,雷达设备发送超声波信号,当雷达设备检测到该超声波信号对应的反射波信号时,确定待检测区域存在无人机。
但是,通过雷达检测实现无人机识别的过程中,很容易误识别,例如,待检测区域中飞行的是小鸟,雷达设备也可能接收到反射波信号,如此可能将小鸟误识别为无人机。可以看出,现有的通过雷达检测实现无人机识别的方法中,无人机识别的精准度比较低。
发明内容
本发明实施例的目的在于提供一种无人机识别方法、装置及电子设备,以提高无人机识别的精准度。具体技术方案如下:
第一方面,本发明实施例提供了一种无人机识别方法,包括:
采集待检测区域的声音信号;
对所述声音信号进行快速傅里叶变换,得到变换声音信号;
根据所述变换声音信号的频率特征,对所述待检测区域是否存在无人机进行预判决;
在所述预判决的结果为存在无人机时,对所述变换声音信号进行梅尔倒谱系数MFCC变换,得到MFCC特征向量;
将所述MFCC特征向量输入至预先训练的支持向量机SVM模型中,识别所述待检测区域是否存在无人机,其中,所述SVM模型是根据多个不同类型的样本声音信号,以及各样本声音信号是否为无人机运行声音的对应结果训练得到的,其中,所述多个不同类型的样本声音信号中至少部分为无人机运行声音信号。
可选的,所述SVM模型的训练过程包括:
获取不同类型的多个样本声音信号;其中,所述多个样本声音信号中至少部分为无人机运行声音信号;
对所述不同类型的多个样本声音信号进行MFCC变换,分别得到所述多个样本声音信号对应的MFCC特征向量;
分别将所述多个样本声音信号对应的MFCC特征向量,以及所述多个样本声音信号是否为无人机运行声音的对应结果,输入至预设SVM模型中,对所述预设SVM模型进行训练,得到所述SVM模型。
可选的,所述采集待检测区域的声音信号,包括:
通过预设采样频率,采集待检测区域的声音信号。
可选的,所述根据所述变换声音信号的频率特征,对所述待检测区域是否存在无人机进行预判决,包括:
当所述变换声音信号的频率存在于预设频段内时,确定所述预判决的结果为存在无人机;
当所述变换声音信号的频率不存在于所述预设频段内时,确定所述预判决的结果为不存在无人机。
可选的,在识别出所述待检测区域存在无人机之后,还包括:
通过警告灯或者蜂鸣器进行报警。
第二方面,本发明实施例提供了一种无人机识别装置,包括:
采集模块,用于采集待检测区域的声音信号;
第一变换模块,用于对所述声音信号进行快速傅里叶变换,得到变换声音信号;
预判决模块,用于根据所述变换声音信号的频率特征,对所述待检测区域是否存在无人机进行预判决;
第二变换模块,用于在所述预判决的结果为存在无人机时,对所述变换声音信号进行梅尔倒谱系数MFCC变换,得到MFCC特征向量;
识别模块,用于将所述MFCC特征向量输入至预先训练的支持向量机SVM模型中,识别所述待检测区域是否存在无人机,其中,所述SVM模型是根据多个不同类型的样本声音信号,以及各样本声音信号是否为无人机运行声音的对应结果训练得到的,其中,所述多个不同类型的样本声音信号中至少部分为无人机运行声音信号。
可选的,所述装置还包括:
获取模块,用于获取不同类型的多个样本声音信号;其中,所述多个样本声音信号中至少部分为无人机运行声音信号;
第三变换模块,用于对所述不同类型的多个样本声音信号进行MFCC变换,分别得到所述多个样本声音信号对应的MFCC特征向量;
训练模块,用于分别将所述多个样本声音信号对应的MFCC特征向量,以及所述多个样本声音信号是否为无人机运行声音的对应结果,输入至预设SVM模型中,对所述预设SVM模型进行训练,得到所述SVM模型。
可选的,所述采集模块,具体用于通过预设采样频率,采集待检测区域的声音信号。
可选的,所述预判决模块包括:
第一确定子模块,用于当所述变换声音信号的频率存在于预设频段内时,确定所述预判决的结果为存在无人机;
第二确定子模块,用于当所述变换声音信号的频率不存在于所述预设频段内时,确定所述预判决的结果为不存在无人机。
第三方面,本发明实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现第一方面所述的方法步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所述的方法步骤。
本发明实施例提供的无人机识别方法、装置及电子设备,可以对待检测区域的声音信号进行快速傅里叶变换,并根据进行快速傅里叶变换得到的变换声音信号进行预判决,在预判决的结果为存在无人机时,对该变换声音信号进行MFCC(Mel-FrequencyCepstral Coefficient,梅尔倒谱系数)变换,得到MFCC特征向量,并将该MFCC特征向量输入至预先训练的SVM(Support Vector Machine,支持向量机)模型中,识别待检测区域是否存在无人机。可以看出,本发明实施例提供的无人机识别方法、装置及电子设备中,对待检测区域的声音信号进行分析,根据该声音信号的特征,对待检测区域是否存在无人机进行识别,能够提高无人机识别的精准度。当然,实施本发明的任一产品或方法必不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的无人机识别方法的流程图;
图2(a)为本发明实施例中无人机声音信号整体频段的示意图;
图2(b)为本发明实施例中无人机声音信号低频段的示意图;
图2(c)为本发明实施例中无人机声音信号高频段的示意图;
图2(d)为本发明实施例中歌声整体频段的示意图;
图2(e)为本发明实施例中街道噪声整体频段的示意图;
图2(f)为本发明实施例中鸣笛声整体频段的示意图;
图2(g)为本发明实施例中喷气式飞机声音信号整体频段的示意图;
图2(h)为本发明实施例中单螺旋桨飞机声音信号整体频段的示意图;
图3为滤波器响应与频率对应关系的示意图;
图4(a)为本发明实施例中无人机声音信号MFCC特征向量对应的示意图;
图4(b)为本发明实施例中歌声MFCC特征向量对应的示意图;
图4(c)为本发明实施例中街道噪声MFCC特征向量对应的示意图;
图4(d)为本发明实施例中鸣笛声特征向量对应的示意图;
图4(e)为本发明实施例中喷气式飞机声音信号MFCC特征向量对应的示意图;
图4(f)为本发明实施例中单螺旋桨飞机声音信号MFCC特征向量对应的示意图;
图5为本发明实施例提供的无人机识别装置的结构示意图;
图6为本发明实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种无人机识别方法,如图1所示,包括:
S101,采集待检测区域的声音信号。
本发明实施例提供的方法可以应用于电子设备。具体的,该电子设备可以为台式计算机、便携式计算机、智能移动终端等。
具体地,可以通过声音采集模块,例如通过麦克风采集待检测区域预设时长的声音信号,如1s的声音信号。
另外,为了满足采样定理,避免混叠现象,可以通过预设采样频率,采集待检测区域的声音信号,例如,预设采样频率可以为44100Hz。
S102,对该声音信号进行快速傅里叶变换,得到变换声音信号。
通过快速傅里叶变换,将声音信号从时域变换到频域上,如此,可以通过分析声音信号在频域上的特征,分析该声音信号是否满足无人机飞行时发出的声音信号的特征,进而对待检测区域是否存在无人机进行初步识别,即预判决。
S103,根据变换声音信号的频率特征,对待检测区域是否存在无人机进行预判决。
为了提高识别的精准度,首先根据变换声音信号的频率特征进行预判决。可以通过判断变换声音信号的频率是否存在于预设频段内,预判决待检测区域是否存在无人机。具体地,当该变换声音信号的频率存在于预设频段内时,确定预判决的结果为存在无人机,即预判决待检测区域存在无人机;当该变换声音信号的频率不存在于预设频段内时,确定预判决的结果为不存在无人机,即预判决待检测区域不存在无人机。
S104,在预判决的结果为存在无人机时,对变换声音信号进行MFCC变换,得到MFCC特征向量。
不难理解的是,有些类型的声音信号进行FFT(Fast Fourier Transformation,快速傅里叶变换)变换得到的频谱、与无人机的声音信号进行FFT变换得到的频谱存在重叠,例如包括喷气式飞机飞行时发出的声音的声音信号等。如此仅仅通过FFT变换后的结果进行识别,无法将无人机声音与其他声音区分开来。
所以,为了进一步提高识别的精准度,将待检测区域的声音信号进行FFT变换后的变换声音信号继续进行MFCC变换,通过MFCC变换的结果识别待检测区域是否存在无人机。
S105,将MFCC特征向量输入至预先训练的SVM模型中,识别待检测区域是否存在无人机。
其中,SVM模型是根据多个不同类型的样本声音信号,以及各样本声音信号是否为无人机运行声音的对应结果训练得到的,其中,多个不同类型的样本声音信号中至少部分为无人机运行声音信号。
通过SVM模型识别待检测区域是否存在无人机,即识别MFCC特征向量对应的声音信号是否为无人机运行声音,如果MFCC特征向量对应的声音信号是无人机运行声音,则输出结果为:待检测区域存在无人机;如果MFCC特征向量对应的声音信号不是无人机运行声音,则输出结果为:待检测区域不存在无人机。
具体地,当SVM模型输出待检测区域存在无人机的结果,例如,输出数字“1”,则确定待检测区域存在无人机;当SVM模型输出待检测区域不存在无人机的结果,例如,输出数字“0”,则确定待检测区域不存在无人机。
本发明实施例提供的无人机识别方法中,对待检测区域的声音信号进行分析,根据该声音信号的特征,对待检测区域是否存在无人机进行识别,能够提高无人机识别的精准度。
为了分析无人机声音信号的特征,本发明实施例对包括无人机声音信号在内的几种不同类型的声音信号进行了对比分析。具体地可以包括:歌声、街道噪声、鸣笛声、喷气式飞机运行声音等。其中,通过44100Hz的采样率采集不同类型的声音信号。另外,考虑到实时性的要求,处理的音频长度不能太长,采集预设时长的不同类型的声音信号,本发明实施例中分别采集1s不同类型的声音信号。
具体地,本发明实施例中,采集并分析无人机运行时的声音信号(记为a1,a2,a3,b1,b2,b3);歌声中三段1s声音信号(记为c1,c2,c3);街道噪声中七段声音信号(根据音源的不同记为d1,d2,d3,e1,e2,e3,f1);发生交通拥堵时的两段鸣笛声(记为g1,g2);喷气式飞机运行时的声音信号(记为h1,h2,h3);单螺旋桨飞机运行的声音信号(记为i1,i2,i3)。
声音信号在时域上很难分析其特征,但其频域特征较为明显。对于确定时域信号的频谱来说,通常采用DFT(Discrete Fourier Transformation,离散傅里叶变换)实现。在实际工程应用中,采用FFT算法,FFT的输出与DFT的输出相同,但运算量要小得多,采用DSP(Digital Signal Processor,数字信号处理器)实现FFT可进行信号高速的实时处理。
下面对FFT进行详细介绍。
FFT基2时域抽取法原理:
设输入时域信号为x(n),其转换后的频域信号为X(n),则离散傅里叶变换DFT为:
在基2时域抽取法中,将此时域信号为x(n)根据采样号n分解为偶采样点和奇采样点,则偶数序列为:
x1(m)=x(2m)m=1,2,…,(N/2)-1
奇数序列为:
x2(m)=x(2m+1)m=0,1,…,(N/2)-1
上述DFT变换公式,便可变换为两个长度为N/2的DFT的和。即:
其中,(k=0,1,…,N-1)。
又因为:
所以:
因为直接在时域上分析声音信号工作量大且准确度不高,所以本发明实施例中通过将声音信号变换到频域上,分析各不同类型的声音信号在频域上的特征。具体地,对包括无人机的声音信号在内的多种不同类型的声音信号进行FFT变换,变换结果如图2(a)、图2(b)、图2(c)、图2(d)、图2(e)、图2(f)、图2(g)以及图2(h)所示,其中,图2(a)为无人机声音信号整体频段的示意图;图2(b)为无人机声音信号低频段的示意图;图2(c)为无人机声音信号高频段的示意图;图2(d)为歌声整体频段的示意图;图2(e)为街道噪声整体频段的示意图;图2(f)为鸣笛声整体频段的示意图;图2(g)为喷气式飞机声音信号整体频段的示意图;图2(h)为单螺旋桨飞机声音信号整体频段的示意图。
对不同类型的声音信号的FFT变换结果进行分析,可得到各个类型的声音信号所处频段的情况,如表1所示。
表1
可以看出,无人机声音信号的频谱整体分为高频和低频两个部分,但高频部分的图像中主要来自于多段采样声音中的两段,其他段的能量相对较低。所以高频部分不能作为有无人机出现的充分原因。而低频部分在多段音频中皆有信息存在,从而可通过分析低频部分预判断无人机是否存在。
无人机声音信号的低频部分显示出比较明显的两个波峰,分别为700Hz-1100Hz的主峰,400Hz-600Hz的辅峰。通过结果分析可以发现歌声与街道噪声的主峰频率均低于500Hz,与无人机频谱不重叠,因此通过FFT变换的结果可以起到初步筛选的作用。所以,可以通过对声音信号进行FFT变换得到的结果对是否存在无人机进行预判决,例如,可以判断待检测区域的声音信号进行FFT变换后得到的变换声音信号的频率是否存在于700Hz-1100Hz、或400Hz-600Hz频段内,如果存在于频段内,则预判决待检测区域存在无人机,如果不存在于频段内,则预判决待检测区域不存在无人机。
还可以看出鸣笛声、喷气式飞机的声音信号、单螺旋桨飞机的声音信号的频谱与无人机声音信号存在部分重叠,所以只用FFT不能够准确识别无人机的声音信号。所以本发明实施例中将FFT变换得到的结果进行MFCC变换,进一步对待检测区域是否存在无人机进行识别。
下面对MFCC进行详细介绍。
MFCC由于模拟人耳听觉特性,被广泛应用在说话人识别,情感识别等人声事件识别,而将其应用于非人声事件的实践除了应用于音乐上外,十分稀少,因为其提出是建立在人发声模型上。人类听觉感知实验表明,人类听觉感知只聚焦在某些特定区域,而不是频谱包络。Mel频率分析就是基于人耳听觉实验的,它们采用Mel滤波器组来模拟人耳的频率选择性,并用对数频率来模拟人耳的低频敏感性,合在一起即对数频率等间隔的三角形滤波器组。
由于螺旋桨旋转特性,无人机声音信号的频谱会包含螺旋桨引起的声音的基频和谐波,如果只关注螺旋桨的声音的话,整个频谱理想情况下异常简单,但是由于实际结构、噪声、无人机不断的负反馈来完成姿态调整,不可能出现理想的单频点冲激,实际检测有明显的三个频率簇。Mel滤波器组与频率相乘后,求取各个点滤波器组的输出的能量可以完成这个特征提取。
MFCC提取原理:
MFCC是对输入的短时信号进行特征提取,分为预加重,分帧,Mel滤波器组滤波对各帧信号,对各个滤波器输出的能量进行DCT变换去相关获得MFCC参数将其与一阶差分二阶差分组合得到MFCC特征向量。
(1)预加重
通过一个一阶有限激励响应高通滤波器:
H(z)=1-μz-1
其中,μ一般介于0.9-1.0之间,优选的取0.97,z为待分析的信号。
如此可以使信号的频谱变得平坦,不易受到有限字长效应的影响。
(2)分帧加窗
在对信号分帧时,首先考虑帧的长度对应的时间是否合适,由于无人机声音信号的特性是时变的,若帧长过小,相邻帧频谱变化较大,而且计算量增大,不易满足实时性。分帧选用汉明窗,而帧叠取半个帧长,使相邻帧的频谱变化减小,更利于获取特征。
实验中在采样频率为44100Hz时,综上考虑,为了计算方便,每帧数据是1024个点,对应时间约为23ms,帧移是512。
(3)DFT
需要对每帧信号进行滤波,直接计算时域卷积,计算量大,不满足实时性,故对信号进行DFT转换。
其中,x(n)为输入的声音信号,N为傅里叶变换点数,取帧长大小W=ej2πk/N
实际应用中,DFT可以使用FFT实现,进一步加快处理速度。
(4)Mel滤波器组计算滤波器频谱成分的加权和
Mel滤波器组是定义在Mel频率轴上等间隔的一组三角形滤波器,滤波器间隔为其中fmax为最大频率fs/2(即采样频率的一半)对应的Mel频率,M为滤波器数量。
Mel频率与线性频率的关系为
各个滤波器的响应为:
滤波器的响应与频率对应关系,如图3所示。
计算每个滤波器组输出的对数能量:
其中,N为帧长,M为三角形滤波器个数。
(5)DCT将Mel滤波器组能量去相关
对上述得到的对数能量进行DCT变换:
DCT变换是KL变换(Karhunen-Loève Transform,卡洛南-洛伊变换)的近似,在实验中用来减小输出的对数能量间的相关性,得到一组相关性较小的特征向量,特征向量的维度由DCT的点数决定。
(6)计算差分MFCC获取特征向量
在声音特征中加入表征声音动态特性的差分参数,来提高系统的识别性能。将差分做了三点平均来提高稳定性,三点平均的差分MFCC计算公式为:
MFCC特征向量E=[MFCC,ΔMFCC(i),ΔΔMFCC(i)],即将三个矢量拼接成特征向量。
对不同类型声音信号的FFT变换结果进行MFCC,得到的结果通过如图4(a)、图4(b)、图4(c)、图4(d)、图4(e)以及图4(f)所示的图像表示。其中,图4(a)为无人机声音信号MFCC特征向量对应的示意图;图4(b)为歌声MFCC特征向量对应的示意图;图4(c)为街道噪声MFCC特征向量对应的示意图;图4(d)为鸣笛声特征向量对应的示意图;图4(e)为喷气式飞机声音信号MFCC特征向量对应的示意图;图4(f)为单螺旋桨飞机声音信号MFCC特征向量对应的示意图。
下面对SVM进行详细介绍。
SVM是目前一种比较主流的分类方法,由Vapnik在上世纪90年代,最初是为了解决二分类问题提出来的,对于二分类问题有十分成熟的理论基础。对解决线性不可分问题十分有效,由于引入了核函数,克服了由广义线性判别函数等存在的”维度灾难”的问题,而判别只与支持向量有关,性能很高。
(1)线性支持向量机
假设训练样本:
(x1,y1,)(x2,y2,),……,(xN,yN,),xi∈Rd,yi∈{+1,-1}
是线性可分的,线性分类器的目标是找到一个分类超平面,将训练样本无误的分开。
尺度调整后数学表述为:
yi(<ω,xi>+b)-1≥0,i=1,2,……,N
而最优分类超平面是在此条件下使两类训练样本中,使离超平面最近的样本与超平面的距离最大的超平面。
则这个超平面的数学表述为:
利用拉格朗日乘子法可将该问题转化为:
通过上述对偶问题的解可以求出原问题的解
(2)非线性支持向量机
现实的情况常常是线性不可分的,可以将低维空间通过非线性运算映射到高维空间,使得样本在高维线性可分,比如广义线性分类器,但是计算量将急剧增大。而支持向量机利用核函数间接实现了高维空间的运算。
将原空间特征X通过非线性映射到新空间Z,即
如果存在核函数K,满足则高维空间的内积运算可以被K(xi,xj)替换简化。
而Mercer定理给出了核函数的判断条件:
对于任意的对称函数K(x,x′)它是某个特征空间中的内积运算的充分必要条件是,对任意
若采用满足Mercer定理的高斯径向核函数
则相当于原特征映射到无穷维,可以获得很好的分类效果。
此时的判别则相应的变成:
yi(K(ω,xi)+b)-1≥0,i=1,2,……,N
为了进一步提高识别精准度,本发明实施例根据多个不同类型的样本声音信号,以及各样本声音信号是否为无人机运行声音的对应结果训练SVM模型,其中,多个不同类型的样本声音信号中至少部分为无人机运行声音信号。然后,将MFCC特征向量输入至该SVM模型,识别待检测区域是否存在无人机。MFCC特征向量是将待检测区域的声音信号进行FFT变换后得到的变换声音信号、继续进行MFCC变换后得到的特征向量。
具体地,SVM模型的训练过程包括:
第一步,获取不同类型的多个样本声音信号。
其中,多个样本声音信号中至少部分为无人机运行声音信号。
例如,获取无人机运行声音、歌声、街道噪声、鸣笛声、喷气式飞机运行声音和单螺旋桨飞机运行声音等不同类型的多个样本声音信号。一般情况下,训练的过程中获取大量的样本声音信号,例如,1000帧、2000帧等。
第二步,对不同类型的多个样本声音信号进行MFCC变换,分别得到多个样本声音信号对应的MFCC特征向量。
分别将不同类型的多个样本声音信号进行MFCC变换,例如,无人机运行声音对应的样本声音信号、歌声对应的样本声音信号等,得到多个样本声音信号对应的MFCC特征向量。具体地,MFCC在上述过程中已经进行了详细地描述,这里就不再赘述。
第三步,分别将多个样本声音信号对应的MFCC特征向量,以及多个样本声音信号是否为无人机运行声音的对应结果,输入至预设SVM模型中,对预设SVM模型进行训练,得到SVM模型。
将样本声音信号对应的MFCC特征向量输入至预设SVM模型中,检测该样本声音信号是否为无人机运行声音,并将检测结果与输入的样本声音信号是否为无人机运行声音的对应结果进行对比,不断对预设SVM模型进行调节,如此反复操作,使得检测结果与输入的该对应结果相同,完成一次训练。经过对一定数量的样本声音信号的MFCC特征向量进行上述处理,不断地进行上述训练过程,最终得到用于无人机识别的SVM模型。其中,一定数量如1000帧、2000帧等。
本发明实施例还进行了仿真实验,采用帧作为统计单位,分别将4291帧无人机声音信号和89018帧其它声音信号输入至SVM模型中,其中,4291帧无人机声音信号中4238帧识别出无人机,漏报率约为1.24%。89018帧其它声音信号中15帧识别为无人机,虚警率约为0.0169%。
通过仿真实验,本发明实施例中无人机识别精准度由现有的百分之六十左右提升至最高百分之九十左右。
本发明实施例中,通过将声音信号对应的MFCC特征向量输入至预先训练的SVM模型,识别待检测区域是否存在无人机,不仅可以提高识别的精准度,还可以提高无人机识别的速度。
本发明实施例一种可选的实施例中,在识别出待检测区域存在无人机之后,还可以包括:通过警告灯或者蜂鸣器进行报警。
另外,还可以根据报警时间等信息生成识别日志,并记录该识别日志。
如此,当识别待检测区域存在无人机时,可以快速、直观地展现出来。同时,识别日志可以保存识别过程中的数据以及识别结果等。
本发明实施例提供了一种无人机识别装置,如图5,包括:
采集模块501,用于采集待检测区域的声音信号;
第一变换模块502,用于对声音信号进行快速傅里叶变换,得到变换声音信号;
预判决模块503,用于根据变换声音信号的频率特征,对待检测区域是否存在无人机进行预判决;
第二变换模块504,用于在预判决的结果为存在无人机时,对变换声音信号进行梅尔倒谱系数MFCC变换,得到MFCC特征向量;
识别模块505,用于将MFCC特征向量输入至预先训练的支持向量机SVM模型中,识别待检测区域是否存在无人机,其中,SVM模型是根据多个不同类型的样本声音信号,以及各样本声音信号是否为无人机运行声音的对应结果训练得到的,其中,多个不同类型的样本声音信号中至少部分为无人机运行声音信号。
本发明实施例提供的无人机识别装置,对待检测区域的声音信号进行分析,根据该声音信号的特征,对待检测区域是否存在无人机进行识别,能够提高无人机识别的精准度。
可选的,该装置还包括:
获取模块,用于获取不同类型的多个样本声音信号;其中,多个样本声音信号中至少部分为无人机运行声音信号;
第三变换模块,用于对不同类型的多个样本声音信号进行MFCC变换,分别得到多个样本声音信号对应的MFCC特征向量;
训练模块,用于分别将多个样本声音信号对应的MFCC特征向量,以及多个样本声音信号是否为无人机运行声音的对应结果,输入至预设SVM模型中,对预设SVM模型进行训练,得到SVM模型。
可选的,采集模块501,具体用于通过预设采样频率,采集待检测区域的声音信号。
可选的,预判决模块503包括:
第一确定子模块,用于当变换声音信号的频率存在于预设频段内时,确定预判决的结果为存在无人机;
第二确定子模块,用于当变换声音信号的频率不存在于预设频段内时,确定预判决的结果为不存在无人机。
可选的,该装置还包括:报警模块,用于在识别出待检测区域存在无人机之后,通过警告灯或者蜂鸣器进行报警。
需要说明的是,本发明实施例的无人机识别装置是应用上述无人机识别方法的装置,则上述无人机识别方法的所有实施例均适用于该装置,且均能达到相同或相似的有益效果。
本发明实施例还提供了一种电子设备,如图6所示,包括处理器601、通信接口602、存储器603和通信总线604,其中,处理器601,通信接口602,存储器603通过通信总线604完成相互间的通信,
存储器603,用于存放计算机程序;
处理器601,用于执行存储器603上所存放的程序时,实现上述无人机识别方法的方法步骤。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
本发明实施例提供的电子设备,对待检测区域的声音信号进行分析,根据该声音信号的特征,对待检测区域是否存在无人机进行识别,能够提高无人机识别的精准度。
本发明实施例提供了一种计算机可读存储介质,计算机可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现上述无人机识别方法的方法步骤。
本发明实施例提供的计算机可读存储介质,对待检测区域的声音信号进行分析,根据该声音信号的特征,对待检测区域是否存在无人机进行识别,能够提高无人机识别的精准度。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种无人机识别方法,其特征在于,包括:
采集待检测区域的声音信号;
对所述声音信号进行快速傅里叶变换,得到变换声音信号;
根据所述变换声音信号的频率特征,对所述待检测区域是否存在无人机进行预判决;
在所述预判决的结果为存在无人机时,对所述变换声音信号进行梅尔倒谱系数MFCC变换,得到MFCC特征向量;
将所述MFCC特征向量输入至预先训练的支持向量机SVM模型中,识别所述待检测区域是否存在无人机,其中,所述SVM模型是根据多个不同类型的样本声音信号,以及各样本声音信号是否为无人机运行声音的对应结果训练得到的,其中,所述多个不同类型的样本声音信号中至少部分为无人机运行声音信号。
2.根据权利要求1所述的方法,其特征在于,所述SVM模型的训练过程包括:
获取不同类型的多个样本声音信号;其中,所述多个样本声音信号中至少部分为无人机运行声音信号;
对所述不同类型的多个样本声音信号进行MFCC变换,分别得到所述多个样本声音信号对应的MFCC特征向量;
分别将所述多个样本声音信号对应的MFCC特征向量,以及所述多个样本声音信号是否为无人机运行声音的对应结果,输入至预设SVM模型中,对所述预设SVM模型进行训练,得到所述SVM模型。
3.根据权利要求1或2所述的方法,其特征在于,所述采集待检测区域的声音信号,包括:
通过预设采样频率,采集待检测区域的声音信号。
4.根据权利要求1或2所述的方法,其特征在于,所述根据所述变换声音信号的频率特征,对所述待检测区域是否存在无人机进行预判决,包括:
当所述变换声音信号的频率存在于预设频段内时,确定所述预判决的结果为存在无人机;
当所述变换声音信号的频率不存在于所述预设频段内时,确定所述预判决的结果为不存在无人机。
5.根据权利要求1或2所述的方法,其特征在于,在识别出所述待检测区域存在无人机之后,还包括:
通过警告灯或者蜂鸣器进行报警。
6.一种无人机识别装置,其特征在于,包括:
采集模块,用于采集待检测区域的声音信号;
第一变换模块,用于对所述声音信号进行快速傅里叶变换,得到变换声音信号;
预判决模块,用于根据所述变换声音信号的频率特征,对所述待检测区域是否存在无人机进行预判决;
第二变换模块,用于在所述预判决的结果为存在无人机时,对所述变换声音信号进行梅尔倒谱系数MFCC变换,得到MFCC特征向量;
识别模块,用于将所述MFCC特征向量输入至预先训练的支持向量机SVM模型中,识别所述待检测区域是否存在无人机,其中,所述SVM模型是根据多个不同类型的样本声音信号,以及各样本声音信号是否为无人机运行声音的对应结果训练得到的,其中,所述多个不同类型的样本声音信号中至少部分为无人机运行声音信号。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
获取模块,用于获取不同类型的多个样本声音信号;其中,所述多个样本声音信号中至少部分为无人机运行声音信号;
第三变换模块,用于对所述不同类型的多个样本声音信号进行MFCC变换,分别得到所述多个样本声音信号对应的MFCC特征向量;
训练模块,用于分别将所述多个样本声音信号对应的MFCC特征向量,以及所述多个样本声音信号是否为无人机运行声音的对应结果,输入至预设SVM模型中,对所述预设SVM模型进行训练,得到所述SVM模型。
8.根据权利要求6或7所述的装置,其特征在于,所述采集模块,具体用于通过预设采样频率,采集待检测区域的声音信号。
9.根据权利要求6或7所述的装置,其特征在于,所述预判决模块包括:
第一确定子模块,用于当所述变换声音信号的频率存在于预设频段内时,确定所述预判决的结果为存在无人机;
第二确定子模块,用于当所述变换声音信号的频率不存在于所述预设频段内时,确定所述预判决的结果为不存在无人机。
10.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-5任一所述的方法步骤。
CN201711204886.1A 2017-11-27 2017-11-27 一种无人机识别方法、装置及电子设备 Pending CN107993648A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711204886.1A CN107993648A (zh) 2017-11-27 2017-11-27 一种无人机识别方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711204886.1A CN107993648A (zh) 2017-11-27 2017-11-27 一种无人机识别方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN107993648A true CN107993648A (zh) 2018-05-04

Family

ID=62033372

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711204886.1A Pending CN107993648A (zh) 2017-11-27 2017-11-27 一种无人机识别方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN107993648A (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109034088A (zh) * 2018-08-06 2018-12-18 北京邮电大学 一种无人机信号探测方法及装置
CN109061632A (zh) * 2018-08-20 2018-12-21 无锡若飞科技有限公司 一种无人机识别方法
CN109243486A (zh) * 2018-09-13 2019-01-18 西安电子科技大学 一种基于机器学习的反黑飞声探测方法
CN109446896A (zh) * 2018-09-19 2019-03-08 青岛国数信息科技有限公司 基于图像处理的无人机信号识别检测算法
CN110444202A (zh) * 2019-07-04 2019-11-12 平安科技(深圳)有限公司 复合语音识别方法、装置、设备及计算机可读存储介质
CN110688959A (zh) * 2019-09-27 2020-01-14 上海特金信息科技有限公司 无人机信号识别方法、装置、电子设备与存储介质
CN111968671A (zh) * 2020-08-24 2020-11-20 中国电子科技集团公司第三研究所 基于多维特征空间的低空声目标综合识别方法及装置
CN112420074A (zh) * 2020-11-18 2021-02-26 麦格纳(太仓)汽车科技有限公司 一种汽车后视镜电机异响声音的诊断方法
CN112735473A (zh) * 2020-11-30 2021-04-30 长春理工大学 基于声音识别无人机的方法及系统
CN114093385A (zh) * 2021-11-24 2022-02-25 中山大学 一种无人机检测方法及装置
CN114114274A (zh) * 2021-11-02 2022-03-01 北京理工大学 一种基于类脑听觉模型的无人机识别方法
CN114743562A (zh) * 2022-06-09 2022-07-12 成都凯天电子股份有限公司 一种飞机声纹识别方法、系统、电子设备及存储介质
CN115809422A (zh) * 2021-09-13 2023-03-17 国家电网有限公司 一种基于svm的无人机rf信号识别方法及系统
CN117969670A (zh) * 2024-04-02 2024-05-03 湖南大学 一种基于声学特征的西瓜成熟度快速无损检测方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102509545A (zh) * 2011-09-21 2012-06-20 哈尔滨工业大学 一种实时声学事件检测系统及检测方法
CN102820034A (zh) * 2012-07-16 2012-12-12 中国民航大学 一种民用航空器噪声感知与识别装置及其方法
CN104916289A (zh) * 2015-06-12 2015-09-16 哈尔滨工业大学 行车噪声环境下快速声学事件的检测方法
CN104991245A (zh) * 2015-07-29 2015-10-21 杨珊珊 一种无人飞行器预警装置及其预警方法
CN106057195A (zh) * 2016-05-25 2016-10-26 东华大学 一种基于嵌入式音频识别的无人机探测系统
CN107358252A (zh) * 2017-06-09 2017-11-17 清华大学 一种无人机分类方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102509545A (zh) * 2011-09-21 2012-06-20 哈尔滨工业大学 一种实时声学事件检测系统及检测方法
CN102820034A (zh) * 2012-07-16 2012-12-12 中国民航大学 一种民用航空器噪声感知与识别装置及其方法
CN104916289A (zh) * 2015-06-12 2015-09-16 哈尔滨工业大学 行车噪声环境下快速声学事件的检测方法
CN104991245A (zh) * 2015-07-29 2015-10-21 杨珊珊 一种无人飞行器预警装置及其预警方法
CN106057195A (zh) * 2016-05-25 2016-10-26 东华大学 一种基于嵌入式音频识别的无人机探测系统
CN107358252A (zh) * 2017-06-09 2017-11-17 清华大学 一种无人机分类方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
BERNARDINI A, MANGIATORDI F, PALLOTTI E, ET AL.: "Drone detection by acoustic signature identification", 《ELECTRONIC IMAGING》 *
X SHEN, Z WEI, Z FENG: "A novel algorithm of UAV-mounted base station placement and frequency allocation", 《INTERNATIONAL CONFERENCE ON 5G FOR FUTURE WIRELESS NETWORKS》 *
刘辉; 杨俊安; 许学忠: "基于HMM和SVM串联模型的低空飞行目标声识别方法", 《数据采集与处理》 *

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109034088A (zh) * 2018-08-06 2018-12-18 北京邮电大学 一种无人机信号探测方法及装置
CN109061632A (zh) * 2018-08-20 2018-12-21 无锡若飞科技有限公司 一种无人机识别方法
CN109243486A (zh) * 2018-09-13 2019-01-18 西安电子科技大学 一种基于机器学习的反黑飞声探测方法
CN109446896A (zh) * 2018-09-19 2019-03-08 青岛国数信息科技有限公司 基于图像处理的无人机信号识别检测算法
CN109446896B (zh) * 2018-09-19 2021-08-17 青岛国数信息科技有限公司 基于图像处理的无人机信号识别检测算法
CN110444202B (zh) * 2019-07-04 2023-05-26 平安科技(深圳)有限公司 复合语音识别方法、装置、设备及计算机可读存储介质
CN110444202A (zh) * 2019-07-04 2019-11-12 平安科技(深圳)有限公司 复合语音识别方法、装置、设备及计算机可读存储介质
CN110688959A (zh) * 2019-09-27 2020-01-14 上海特金信息科技有限公司 无人机信号识别方法、装置、电子设备与存储介质
CN111968671A (zh) * 2020-08-24 2020-11-20 中国电子科技集团公司第三研究所 基于多维特征空间的低空声目标综合识别方法及装置
CN111968671B (zh) * 2020-08-24 2024-03-01 中国电子科技集团公司第三研究所 基于多维特征空间的低空声目标综合识别方法及装置
CN112420074A (zh) * 2020-11-18 2021-02-26 麦格纳(太仓)汽车科技有限公司 一种汽车后视镜电机异响声音的诊断方法
CN112735473A (zh) * 2020-11-30 2021-04-30 长春理工大学 基于声音识别无人机的方法及系统
CN112735473B (zh) * 2020-11-30 2022-07-05 长春理工大学 基于声音识别无人机的方法及系统
CN115809422A (zh) * 2021-09-13 2023-03-17 国家电网有限公司 一种基于svm的无人机rf信号识别方法及系统
CN115809422B (zh) * 2021-09-13 2023-11-21 国家电网有限公司 一种基于svm的无人机rf信号识别方法及系统
CN114114274A (zh) * 2021-11-02 2022-03-01 北京理工大学 一种基于类脑听觉模型的无人机识别方法
CN114093385A (zh) * 2021-11-24 2022-02-25 中山大学 一种无人机检测方法及装置
CN114743562A (zh) * 2022-06-09 2022-07-12 成都凯天电子股份有限公司 一种飞机声纹识别方法、系统、电子设备及存储介质
CN117969670A (zh) * 2024-04-02 2024-05-03 湖南大学 一种基于声学特征的西瓜成熟度快速无损检测方法及系统

Similar Documents

Publication Publication Date Title
CN107993648A (zh) 一种无人机识别方法、装置及电子设备
Kerkeni et al. Automatic speech emotion recognition using an optimal combination of features based on EMD-TKEO
Khunarsal et al. Very short time environmental sound classification based on spectrogram pattern matching
CN109256138B (zh) 身份验证方法、终端设备及计算机可读存储介质
Zhang et al. An overview of speech endpoint detection algorithms
CN109243497A (zh) 语音唤醒的控制方法及装置
CN112329819A (zh) 基于多网络融合的水下目标识别方法
Ludeña-Choez et al. Feature extraction based on the high-pass filtering of audio signals for Acoustic Event Classification
Zhai et al. Pattern recognition approach to identify loose particle material based on modified MFCC and HMMs
Al-Hattab et al. Rethinking environmental sound classification using convolutional neural networks: optimized parameter tuning of single feature extraction
Chang et al. Spectro-temporal features for noise-robust speech recognition using power-law nonlinearity and power-bias subtraction
CN112397090B (zh) 一种基于fpga的实时声音分类方法及系统
Ruan et al. Use AF-CNN for end-to-end fiber vibration signal recognition
Bernal-Oñate et al. Volcanic Micro-Earthquake Classification with Spectral Manifolds in Low-Dimensional Latent Spaces
Adam et al. Wavelet cesptral coefficients for isolated speech recognition
Ding et al. Acoustic scene classification based on ensemble system
Valero et al. Narrow-band autocorrelation function features for the automatic recognition of acoustic environments
Fathima et al. Gammatone cepstral coefficient for speaker Identification
Pour et al. Gammatonegram based speaker identification
Sundar et al. A mixture model approach for formant tracking and the robustness of student's-t distribution
Zacarias-Morales et al. Full single-type deep learning models with multihead attention for speech enhancement
Srivastava S-transform and gaussian mixture model for acoustic scene classification
Baghel et al. Shouted/normal speech classification using speech-specific features
Eshaghi et al. A voice activity detection algorithm in spectro-temporal domain using sparse representation
Hu et al. MSARN: A Multi-scale Attention Residual Network for End-to-End Environmental Sound Classification

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180504

RJ01 Rejection of invention patent application after publication