CN113177536B - 基于深度残差收缩网络的车辆碰撞检测方法及装置 - Google Patents

基于深度残差收缩网络的车辆碰撞检测方法及装置 Download PDF

Info

Publication number
CN113177536B
CN113177536B CN202110717159.5A CN202110717159A CN113177536B CN 113177536 B CN113177536 B CN 113177536B CN 202110717159 A CN202110717159 A CN 202110717159A CN 113177536 B CN113177536 B CN 113177536B
Authority
CN
China
Prior art keywords
layer
features
formula
value
follows
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110717159.5A
Other languages
English (en)
Other versions
CN113177536A (zh
Inventor
吴彩萍
申莲莲
张蓉
邓承刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Jiutong Zhilu Technology Co ltd
Original Assignee
Sichuan Jiutong Zhilu Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Jiutong Zhilu Technology Co ltd filed Critical Sichuan Jiutong Zhilu Technology Co ltd
Priority to CN202110717159.5A priority Critical patent/CN113177536B/zh
Publication of CN113177536A publication Critical patent/CN113177536A/zh
Application granted granted Critical
Publication of CN113177536B publication Critical patent/CN113177536B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/02Preprocessing
    • G06F2218/04Denoising
    • G06F2218/06Denoising by applying a scale-space analysis, e.g. using wavelet analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0137Measuring and analyzing of parameters relative to traffic conditions for specific applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • G10L25/30Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Evolutionary Biology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本申请涉及智能交通技术领域,公开了一种基于深度残差收缩网络的车辆碰撞检测方法及装置,具体包括以下步骤:S1、采集车辆碰撞事故多发地段的实时音频数据作为样本数据,并对音频数据进行类别标注;S2、对采集的音频数据进行预处理;S3、对预处理后的音频数据进行特征计算;S4、特征融合;S5、构造深度残差收缩网络模型并进行模型训练,保存训练好的模型;S6、车辆碰撞预测,对新的输入样本做预处理、特征计算以及特征融合后输入至保存好的模型中,计算其属于每个类别的概率值大小,以此来判断是否发生了车辆碰撞。本申请能够更好的消除噪声,提高模型的精度,并最终提高车辆碰撞预测的精度。

Description

基于深度残差收缩网络的车辆碰撞检测方法及装置
技术领域
本申请涉及智能交通技术领域,具体涉及一种基于深度残差收缩网络的车辆碰撞检测方法。
背景技术
随着社会经济不断的发展,道路上行驶的汽车逐渐增多,伴随着车辆碰撞事故的发生日益频繁,如何高效智能地检测车辆碰撞迫在眉睫。目前检测方法主要有基于视频图像的车流量统计判断方法和车辆车速突变检测方法。针对基于视频图像的车流量统计判断方法,在道路发生拥堵时,由于遮挡现象尤其严重,因此流量数据的可靠性大大降低,通过该方式反馈的事故信息比较滞后,并且由于视频检测的范围有限,如果碰撞导致的车辆停车行为不在视频画面中,还会会产生漏检的可能;而针对第二种方法,如果不是由于碰撞导致的车辆快速停车行为则会产生误判。
基于碰撞声信号的方法可以通过提取声信号的声频特征,实时检测碰撞事故的发生,也无需安装高清摄像头,降低了成本,但是由于受到环境背景噪声的干扰太大,而车辆碰撞事故发生现场通常伴随复杂的背景噪声,因此很容易产生误判的情况。
发明内容
为了克服上述现有技术中存在的问题和不足,本申请提出了一种基于声信号特征融合和深度残差收缩网络的车辆碰撞检测方法,本申请融合多种声信号特征,使用深度残差收缩网络进行模型训练,具有更好的鲁棒性,提高了预测准确度。
为了实现上述发明目的,本申请的技术方案如下:
一种基于深度残差收缩网络的车辆碰撞检测方法,包括以下步骤:
S1、采集车辆碰撞事故多发地段的实时音频数据作为样本数据,并对音频数据进行类别标注;
S2、对采集的音频数据进行预处理;
S3、对预处理后的音频数据进行特征计算,包括MFCC特征及其一阶差分计算、GFCC特征及其一阶差分计算以及小波能量特征计算,将计算得到的特征做归一化处理;
S4、特征融合,使用基于DCA特征融合策略分别对归一化后的MFCC特性和GFCC特征、
Figure 801621DEST_PATH_IMAGE001
特征与
Figure 1658DEST_PATH_IMAGE002
特征做特征变换,最大化变换后两个特征集中对应特征的相关关系,同时最大化不同类之间的差异,然后将变换后得到的新的MFCC特征、GFCC特征、
Figure 791760DEST_PATH_IMAGE001
特征、
Figure 342827DEST_PATH_IMAGE002
特征与小波能量特征依次使用concat方法进行拼接形成新的特征,用于神经网络模型的训练;
S5、构造深度残差收缩网络模型并进行模型训练,保存训练好的模型;
S6、车辆碰撞预测,对新的输入样本做预处理、特征计算以及特征融合后输入至保存好的模型中,计算其属于每个类别的概率值大小,概率值最大的那个类别就代表输入样本声音的类别,以此来判断是否发生了车辆碰撞。
进一步地,所述步骤S1中,采集的实时音频数据包括车辆碰撞声、喇叭声、人声、音乐以及轮胎摩擦声,存储为时长5s、采样频率为32kHz的音频文件,并进行类别标注。
进一步地,所述步骤S2中,读取音频数据,首先进行幅值归一化和滤波去噪处理,然后对音频数据进行预加重、分帧以及加窗操作。
进一步地,所述步骤S3中,MFCC特征及其一阶差分计算过程如下:
1)对预处理后的数据进行快速傅里叶变换,将数据从时域转换到频域,得到频谱上的能量分布,取其模的平方得到谱线能量;然后送入Mel三角滤波器组得到梅尔频谱图;对得到的梅尔频谱图进行对数运算以获得梅尔对数功率频谱图;最后对该对数功率频谱图进行离散余弦变换后就可得到MFCC特征,MFCC特征计算公式如下:
Figure 876576DEST_PATH_IMAGE003
式(1);
其中,M是三角滤波器的个数;
Figure 931120DEST_PATH_IMAGE004
是第m个对数梅尔频谱图的对数能量;c是倒谱系数的索引;
2)MFCC特征的一阶差分
Figure 157702DEST_PATH_IMAGE001
的计算公式如下:
Figure 664907DEST_PATH_IMAGE005
式(2);
其中,t表示第t帧,k表示取第t帧前后各k帧的MFCC特征参数。
进一步地,所述步骤S3中,GFCC特征及其一阶差分计算过程如下:
1)对预处理后的数据进行快速傅里叶变换,将数据从时域转换到频域,得到频谱上的能量分布,取其模的平方得到谱线能量;然后送入Ganmmatone滤波器组得到Ganmmatone频谱图;对得到的Ganmmatone频谱图进行对数运算以获得Ganmmatone对数功率频谱图;最后对该对数功率频谱图进行离散余弦变换后就可得到GFCC特征;
Ganmmatone滤波器的时域表达式如下:
Figure 736768DEST_PATH_IMAGE006
式(3);
其中,
Figure 911397DEST_PATH_IMAGE007
为滤波器的增益,
Figure 43301DEST_PATH_IMAGE008
为滤波器的中心频率,
Figure 303381DEST_PATH_IMAGE009
为阶跃函数,
Figure 933862DEST_PATH_IMAGE010
为偏移相位,
Figure 228577DEST_PATH_IMAGE011
为滤波器的阶数,
Figure 265803DEST_PATH_IMAGE012
为滤波器数目,
Figure 13179DEST_PATH_IMAGE013
为滤波器的衰减因子,决定当前滤波器对脉冲响应的衰减速度,与中心频率的对应关系如下:
Figure 426843DEST_PATH_IMAGE014
式(4);
其中,
Figure 576065DEST_PATH_IMAGE015
为等效矩形带宽,与重心频率
Figure 49771DEST_PATH_IMAGE008
的关系如下:
Figure 18864DEST_PATH_IMAGE016
式(5);
最终得到GFCC特征,其计算公式如下:
Figure 970640DEST_PATH_IMAGE017
式(6);
其中,
Figure 974368DEST_PATH_IMAGE012
是Gammatone滤波器的个数,
Figure 618976DEST_PATH_IMAGE018
是第 n个对数Gammatone频谱图的对数能量,c是倒谱系数的索引;
2)GFCC特征的一阶差分
Figure 75365DEST_PATH_IMAGE002
的计算公式如下:
Figure 830832DEST_PATH_IMAGE019
式(7);
其中,t表示第t帧,k表示取第t帧前后各k帧的GFCC特征参数。
进一步地,所述步骤S3中,小波能量特征计算具体过程如下:
对预处理后的每帧数据做n层小波分解,得到低频概貌系数CA和高频细节系数
Figure 954645DEST_PATH_IMAGE020
;对高频细节系数
Figure 38664DEST_PATH_IMAGE021
采用改进的阈值和改进的Garrote阈值函数做进一步地阈值处理,使用经过阈值处理后的小波分解系数计算小波系数能量;
改进的阈值计算公式如下:
Figure 982349DEST_PATH_IMAGE022
式(8);
Figure 541506DEST_PATH_IMAGE023
式(9);
其中,
Figure 254247DEST_PATH_IMAGE024
表示第
Figure 240658DEST_PATH_IMAGE025
层的阈值,
Figure 937218DEST_PATH_IMAGE026
表示信号长度,
Figure 34487DEST_PATH_IMAGE027
表示自然对数,
Figure 601735DEST_PATH_IMAGE028
为噪声的标准方差,
Figure 759047DEST_PATH_IMAGE029
表示小波分解第一层的细节系数,
Figure 942903DEST_PATH_IMAGE030
函数表示取数组的中值;
改进的Garrote阈值函数计算公式如下:
Figure 578284DEST_PATH_IMAGE031
式(10);
其中,
Figure 265617DEST_PATH_IMAGE032
表示小波分解第
Figure 859410DEST_PATH_IMAGE033
层细节系数的第
Figure 999404DEST_PATH_IMAGE034
个值,
Figure 966704DEST_PATH_IMAGE035
表示计算得到的第
Figure 508544DEST_PATH_IMAGE033
层的阈值;
使用经过阈值处理后的小波分解系数计算小波系数能量,计算公式如下:
Figure 7659DEST_PATH_IMAGE036
式(11);
Figure 634949DEST_PATH_IMAGE037
式(12);
其中,
Figure 877712DEST_PATH_IMAGE038
表示小波分解第
Figure 539637DEST_PATH_IMAGE033
层细节系数,
Figure 209653DEST_PATH_IMAGE039
表示第
Figure 324239DEST_PATH_IMAGE033
层细节系数的能量值,
Figure 105114DEST_PATH_IMAGE040
表示
Figure 887125DEST_PATH_IMAGE038
的长度,
Figure 728042DEST_PATH_IMAGE032
表示第
Figure 595504DEST_PATH_IMAGE033
层细节系数的第
Figure 180069DEST_PATH_IMAGE034
个值,
Figure 819516DEST_PATH_IMAGE041
表示小波分解的低频概貌系数,
Figure 96914DEST_PATH_IMAGE042
表示低频概貌系数的能量值,
Figure 186092DEST_PATH_IMAGE043
表示
Figure 839928DEST_PATH_IMAGE044
的长度,
Figure 330952DEST_PATH_IMAGE045
表示
Figure 372726DEST_PATH_IMAGE044
的第
Figure 949201DEST_PATH_IMAGE034
个值;
经计算后,得到该帧声信号的小波能量特征如下:
Figure 141148DEST_PATH_IMAGE046
式(13);
其中,
Figure 221099DEST_PATH_IMAGE047
表示第h层的小波细节系数能量值。
进一步地,所述步骤S3中,归一化处理具体过程如下:
使用min-max归一化,对原始数据进行线性变换,映射到[0, 1]区间,转换公式如下:
Figure 840299DEST_PATH_IMAGE048
式(14);
其中,x表示转换前的原始特征数值,
Figure 901141DEST_PATH_IMAGE049
表示归一化后的特征数值,max为原始数据的最大值,min为原始数据的最小值。
进一步地,所述步骤S5具体如下:
1)构造深度残差收缩网络模型
所述深度残差收缩网络模型包括输入层、卷积层、深度残差收缩网络基本模块、全局均值池化层以及全连接输出层,构造过程如下:
首先构造深度残差收缩网络基本模块,模块中嵌入了一个子网络,用于自动地设置软阈值化所需要的阈值,采用通道间共享阈值的残差收缩模块,首先对输入特征图经过两次批标准化、ReLu激活函数和卷积层操作;然后对所有特征求绝对值,取其平均值记为特征
Figure 365620DEST_PATH_IMAGE050
;在另一条路径中,将特征的绝对值通过全局均值池化之后,输入到一个两层的全连接网络,然后使用 Sigmoid 函数将输出归一化到0和1之间,获得一个尺度参数
Figure 565657DEST_PATH_IMAGE051
,最终的阈值表示为
Figure 355759DEST_PATH_IMAGE052
;最后使用Tensorfow中的identify将原始输入特征图与阈值进行相加并返回;
a)构造输入层,接收神经网络模型的外部输入,并将其传递给卷积层,这里的外部输入是前述步骤计算的声信号特征;
b)构造卷积层,卷积层接收输入层的输出,然后通过重复一定次数的卷积操作,获得特征图,然后将特征图传递给深度残差收缩网络基本模块;
c)堆叠一定数目的深度残差收缩网络基本模块,卷积层输出的特征图经过这些深度残差收缩网络模块处理后传递给批标准化层;
d)构造批标准化层,激活函数ReLu和全局均值化层;
e)构造全连接输出层,接收来自全局均值化层的输出;
f)全连接输出层对应样本数据包含的所有类别,输出值是样本属于每个类别的概率值,取最大输出值对应的类别作为模型预测的样本类别;
2)模型训练
将计算后的特征数据集分成十份,轮流将其中9份作为训练数据,1份作为测试数据,进行模型训练和测试,得出相应的准确率,最后取这10次结果的准确率的平均值作为对算法精度的估计,最后保存训练好的模型。
一种基于深度残差收缩网络的车辆碰撞检测装置,包括数据采集模块、数据预处理模块、特征提取模块、特征融合模块、模型训练模块以及预测输出模块,其中:
数据采集模块利用声音传感器采集车辆碰撞声、喇叭声、人声、音乐以及轮胎摩擦声等五个类别的音频数据并进行保存;
数据预处理模块读取保存的音频数据,对上述音频数据进行幅值归一化处理、滤波消噪处理、预加重、分帧以及加窗操作;
特征提取模块,计算预处理后的音频数据的各种声信号特征,包括MFCC特征及其一阶差分
Figure 375667DEST_PATH_IMAGE001
特征、GFCC特征及其一阶差分
Figure 174996DEST_PATH_IMAGE002
特征以及小波能量特征,并对得到的特征进行归一化处理;
特征融合模块使用DCA特征融合策略及concat特征融合策略融合计算后的特征,DCA融合策略分别对MFCC特征与GFCC特征、
Figure 229540DEST_PATH_IMAGE001
特征与
Figure 924963DEST_PATH_IMAGE002
特征做变换,然后再将变换后的所有特征以及小波能量特征使用concat方法连接组合成新的声信号特征;
模型训练模块构建深度残差收缩网络模型并将融合后的新特征输入到深度残差收缩网络模型中进行训练,保存训练好的模型参数;
预测输出模块使用训练好的模型对新输入的声音信号样本进行碰撞预测,预测是否发生了车辆碰撞事故。
本申请的有益效果:
(1)本申请构建深度残差收缩网络使并进行模型训练,通过深度残差收缩网络的基本模块自动学习阈值,避免了人工设置阈值,每个样本都学习了各自的阈值,契合不同样本噪声含量不同的情况,能够更好的消除噪声,提高模型的精度,并最终提高车辆碰撞预测的精度。
(2)本申请对采集的音频数据进行了特征融合,相较于单一特征,更加适合复杂的交通领域的声音分类,因此具有更好的鲁棒性,提高了预测的准确度。
(3)本申请使用了基于DCA特征融合策略对MFCC特征和GFCC特征以及
Figure 963327DEST_PATH_IMAGE001
Figure 35188DEST_PATH_IMAGE002
做了特征变换,因此能够消除因不同特征集之间的相关性而产生的冗余信息,最后再将变换后的特征与小波能量特征做concat拼接,形成了新的特征,因此消除了冗余信息,特征维度得到了降低,减少了模型的训练时间并且提高了模型精度。
(4)传统的小波阈值去噪中,硬阈值函数和软阈值函数会导致去噪重构后的信号存在固定偏差和不连续等问题,Garrote阈值法虽然有效的克服了软、硬阈值法的缺点,但没有考虑到噪声在小波变换下随着尺度增大而减小的特性,因此采用改进的阈值和改进的Garrote阈值函数,既能兼顾各尺度下的不同阈值,又能进一步收缩高频细节系数。
附图说明
图1为本申请流程图。
具体实施方式
下面结合实施例对本申请作进一步地详细说明,但本申请的实施方式不限于此。
实施例1
参照说明书附图1,本实施例公开了一种基于深度残差收缩网络的车辆碰撞检测方法,所述方法通过一种基于特征融合和深度残差收缩网络的车辆碰撞检测装置实现,具体包括以下步骤:
S1、数据采集模块利用声音传感器采集车辆碰撞事故多发地段的实时音频数据作为样本数据,采集的实时音频数据包括车辆碰撞声、喇叭声、人声、音乐以及轮胎摩擦声,存储为时长5s、采样频率为32kHz的音频文件,并进行类别标注;
S2、数据预处理模块对采集的音频数据进行预处理,读取音频数据,先进行幅值归一化和滤波去噪处理,然后进行预加重、分帧、加窗等操作;
S3、特征提取模块对预处理后的音频数据进行特征计算,包括MFCC特征及其一阶差分计算、GFCC特征及其一阶差分计算以及小波能量特征计算,然后再将上述经计算后得到的特征进行归一化处理,具体过程如下:
S31、MFCC特征及其一阶差分计算:
1)对预处理后的音频数据进行快速傅里叶变换(FFT),将数据从时域转换到频域,得到频谱上的能量分布,取其模的平方得到谱线能量;然后送入Mel三角滤波器组得到梅尔频谱图;对得到的梅尔频谱图进行对数运算以获得梅尔对数功率频谱图;最后对该对数功率频谱图进行离散余弦变换后就可得到MFCC特征。MFCC计算公式如下:
Figure 944238DEST_PATH_IMAGE053
式(1);
其中,M是三角滤波器的个数;
Figure 341721DEST_PATH_IMAGE054
是第m个对数梅尔频谱图的对数能量;c是倒谱系数的索引;
MFCC主要提取的是语音的静态特征,为了凸显语音信号的动态变化,通常对特征参数进行二次提取,因此本申请MFCC的一阶差分
Figure 336222DEST_PATH_IMAGE055
2)MFCC特征的一阶差分
Figure 211774DEST_PATH_IMAGE055
的计算公式如下:
Figure 243840DEST_PATH_IMAGE056
式(2);
其中,t表示第t帧,k表示取第t帧前后各k帧的MFCC特征参数;
S32、GFCC特征及其一阶差分计算:
GFCC特征的计算与MFCC特征计算基本相似,只是将使用的Mel滤波器更换为Gammatone滤波器,具体过程如下:
1)对预处理后的数据进行快速傅里叶变换,将数据从时域转换到频域,得到频谱上的能量分布,取其模的平方得到谱线能量;然后送入Ganmmatone滤波器组得到Ganmmatone频谱图;对得到的Ganmmatone频谱图进行对数运算以获得Ganmmatone对数功率频谱图;最后对该对数功率频谱图进行离散余弦变换后就可得到GFCC特征,Gammatone滤波器的时域表达式如下:
Figure 546645DEST_PATH_IMAGE057
式(3);
其中,
Figure 294021DEST_PATH_IMAGE007
为滤波器的增益,
Figure 707685DEST_PATH_IMAGE058
为滤波器的中心频率,
Figure 591327DEST_PATH_IMAGE059
为阶跃函数,
Figure 65034DEST_PATH_IMAGE060
为偏移相位,
Figure 34127DEST_PATH_IMAGE011
为滤波器的阶数,
Figure 251482DEST_PATH_IMAGE061
为滤波器数目,
Figure 989631DEST_PATH_IMAGE062
为滤波器的衰减因子,决定当前滤波器对脉冲响应的衰减速度,与中心频率的对应关系如下:
Figure 899818DEST_PATH_IMAGE063
式(4);
其中,
Figure 356207DEST_PATH_IMAGE064
为等效矩形带宽,与重心频率
Figure 111673DEST_PATH_IMAGE058
的关系如下:
Figure 235487DEST_PATH_IMAGE065
式(5);
最终得到GFCC特征,其计算公式如下:
Figure 50996DEST_PATH_IMAGE066
式(6);
其中,
Figure 726173DEST_PATH_IMAGE061
是Gammatone滤波器的个数,
Figure 285330DEST_PATH_IMAGE067
是第 n个对数Gammatone频谱图的对数能量,c是倒谱系数的索引;
2)GFCC特征的一阶差分
Figure 263650DEST_PATH_IMAGE068
的计算公式如下:
Figure 250061DEST_PATH_IMAGE069
式(7);
其中,t表示第t帧,k表示取第t帧前后各k帧的GFCC特征参数;
S33、小波能量特征计算:
首先对预处理后的每帧数据做n层小波分解,得到低频概貌系数CA和高频细节系数
Figure 681042DEST_PATH_IMAGE070
;由于传统的小波阈值去噪中,硬阈值函数和软阈值函数会导致去噪重构后的信号存在固定偏差和不连续等问题,Garrote阈值法虽然有效的克服了软、硬阈值法的缺点,但没有考虑到噪声在小波变换下随着尺度增大而减小的特性,因此本申请采用改进的阈值和改进的Garrote阈值函数对高频细节系数
Figure 43890DEST_PATH_IMAGE071
做进一步地的阈值处理,既能兼顾各尺度下的不同阈值,又能进一步收缩高频细节系数,最后使用经过阈值处理后的小波分解系数计算小波系数能量;
改进的阈值计算公式如下:
Figure 611138DEST_PATH_IMAGE072
式(8);
Figure 768450DEST_PATH_IMAGE073
式(9);
其中,
Figure 421148DEST_PATH_IMAGE074
表示第
Figure 587687DEST_PATH_IMAGE075
层的阈值,
Figure 540600DEST_PATH_IMAGE076
表示信号长度,
Figure 134392DEST_PATH_IMAGE077
表示自然对数,
Figure 274386DEST_PATH_IMAGE078
为噪声的标准方差,一般使用小波分解第一层细节系数来估计噪声的标准方差,
Figure 713458DEST_PATH_IMAGE079
表示小波分解第一层的细节系数,
Figure 523807DEST_PATH_IMAGE080
函数表示取数组的中值;
在上述公式中,当
Figure 22921DEST_PATH_IMAGE081
时,其结果与固定阈值计算公式一致,当
Figure 650212DEST_PATH_IMAGE082
时,阈值随层数的增大而减小,与噪声在小波变换随着层数增大而减小的特性一致;
改进的Garrote阈值函数计算公式如下:
Figure 892974DEST_PATH_IMAGE083
式(10);
其中,
Figure 820479DEST_PATH_IMAGE084
表示小波分解第
Figure 490495DEST_PATH_IMAGE085
层细节系数的第
Figure 339502DEST_PATH_IMAGE086
个值,
Figure 385955DEST_PATH_IMAGE087
表示计算得到的第
Figure 902387DEST_PATH_IMAGE085
层的阈值;
使用经过阈值处理后的小波分解系数计算小波系数能量,计算公式如下:
Figure 8884DEST_PATH_IMAGE088
式(11);
Figure 345187DEST_PATH_IMAGE089
式(12);
其中,
Figure 929752DEST_PATH_IMAGE090
表示小波分解第
Figure 566270DEST_PATH_IMAGE085
层细节系数,
Figure 578088DEST_PATH_IMAGE091
表示第
Figure 500275DEST_PATH_IMAGE085
层细节系数的能量值,
Figure 888531DEST_PATH_IMAGE092
表示
Figure 379555DEST_PATH_IMAGE090
的长度,
Figure 562275DEST_PATH_IMAGE084
表示第
Figure 873170DEST_PATH_IMAGE085
层细节系数的第
Figure 65117DEST_PATH_IMAGE086
个值,
Figure 410648DEST_PATH_IMAGE093
表示小波分解的低频概貌系数,
Figure 764269DEST_PATH_IMAGE094
表示低频概貌系数的能量值,
Figure 562460DEST_PATH_IMAGE095
表示
Figure 558098DEST_PATH_IMAGE096
的长度,
Figure 758135DEST_PATH_IMAGE097
表示
Figure 282658DEST_PATH_IMAGE096
的第
Figure 568146DEST_PATH_IMAGE086
个值;
经计算后,得到该帧声信号的小波能量特征如下:
Figure 367474DEST_PATH_IMAGE098
式(13);
其中,
Figure 424948DEST_PATH_IMAGE099
表示第h层的小波细节系数能量值;
S34、计算特征归一化处理
将上述步骤S31-步骤S33计算得到的各种特征做归一化处理,归一化方法使用min-max归一化,对原始数据进行线性变换,映射到[0, 1]区间,转换公式如下:
Figure 120371DEST_PATH_IMAGE100
式(14);
其中,x表示转换前的原始特征数值,
Figure 158734DEST_PATH_IMAGE101
表示归一化后的特征数值,max为原始数据的最大值,min为原始数据的最小值;
S4、特征融合模块使用基于DCA特征融合策略分别对归一化后的MFCC特性和GFCC特征、
Figure 230596DEST_PATH_IMAGE001
特征与
Figure 139646DEST_PATH_IMAGE002
特征做特征变换,最大化变换后两个特征集中对应特征的相关关系,同时最大化不同类之间的差异,然后将变换后得到的新的MFCC特征、GFCC特征、
Figure 537129DEST_PATH_IMAGE001
特征、
Figure 531630DEST_PATH_IMAGE002
特征与小波能量特征依次使用concat方法进行拼接形成新的特征,用于神经网络模型的训练;
S5、模型训练模块构造深度残差收缩网络模型并进行模型训练;
1)构造深度残差收缩网络模型
所述深度残差收缩网络模型包括输入层、卷积层、深度残差收缩网络基本模块、全局均值池化层以及全连接输出层,构造过程如下:
g)首先构造深度残差收缩网络基本模块,深度残差收缩网络基本模块是深度残差网络基本模块的改进,在改进后的残差模块中,不仅有一个软阈值化函数作为非线性层,而且嵌入了一个子网络,用于自动地设置软阈值化所需要的阈值,进一步地,的本实施采用通道间共享阈值的残差收缩模块,首先对输入特征图经过两次批标准化、ReLu激活函数和卷积层操作;然后对所有特征求绝对值,取其平均值记为特征
Figure 407182DEST_PATH_IMAGE102
;在另一条路径中,将特征的绝对值通过全局均值池化之后,输入到一个两层的全连接网络,然后使用 Sigmoid 函数将输出归一化到0和1之间,获得一个尺度参数
Figure 170739DEST_PATH_IMAGE103
,最终的阈值表示为
Figure 739123DEST_PATH_IMAGE104
;最后使用Tensorfow中的identify将原始输入特征图与阈值进行相加并返回;
h)构造输入层,接收神经网络模型的外部输入,并将其传递给卷积层,这里的外部输入是前述步骤计算的声信号特征;
i)构造卷积层,卷积层接收输入层的输出,然后通过重复一定次数的卷积操作,获得特征图,然后将特征图传递给深度残差收缩网络基本模块,卷积操作的次数根据具体的试验情况进行调整;
j)堆叠一定数目的深度残差收缩网络基本模块,卷积层输出的特征图经过这些深度残差收缩网络模块处理后传递给批标准化层,堆叠的数量根据具体的试验情况进行调整,可以是10个,20个,甚至更多;
k)构造批标准化层,激活函数ReLu和全局均值化层;
l)构造全连接输出层,接收来自全局均值化层的输出;
m)全连接输出层对应样本数据包含的所有类别,输出值是样本属于每个类别的概率值,取最大输出值对应的类别作为模型预测的样本类别;
2)模型训练
将计算后的特征数据集分成十份,轮流将其中9份作为训练数据,1份作为测试数据,进行模型训练和测试,得出相应的准确率,最后取这10次结果的准确率的平均值作为对算法精度的估计,若模型未达到预设精度,则对模型进行修改并重新进行训练直至精度满足要求,最后保存训练好的模型;
S6、预测输出模块对新的输入样本做预处理、特征计算以及特征融合后输入至保存好的模型中,计算其属于每个类别的概率值大小,概率值最大的那个类别就代表输入样本声音的类别,以此来判断是否发生了车辆碰撞。
实施例2
在实施例1的基础上,本实施例公开了用于实现上述检测方法的装置,一种基于深度残差收缩网络的车辆碰撞检测装置,所述装置具体包括依次通过信号连接的数据采集模块、数据预处理模块、特征提取模块、特征融合模块、模型训练模块以及预测输出模块,
其中:
数据采集模块利用声音传感器采集车辆碰撞声、喇叭声、人声、音乐以及轮胎摩擦声等五个类别的音频数据并进行保存,所述声音传感器设置在车辆事故多发地;
数据预处理模块读取保存的音频数据,对上述音频数据进行幅值归一化处理、滤波消噪处理、预加重、分帧、加窗等操作;
特征提取模块,计算预处理后的音频数据的各种声信号特征,例如梅尔倒谱系数特征MFCC及其一阶差分
Figure 220920DEST_PATH_IMAGE001
、Gammatone频率倒谱系数特征GFCC及其一阶差分
Figure 634584DEST_PATH_IMAGE002
、小波能量特征等,并对得到的特征进行归一化处理,消除数据之间存在的量纲上的差异性;
特征融合模块使用判别相关性分析(DCA)特征融合策略及concat特征融合策略融合计算后的特征,DCA特征融合是使用两个输入特征间的相关关系,计算两种变换,最大化变换后两个特征集中对应特征的相关关系,同时最大化不同类之间的差异,使用DCA融合策略分别对MFCC特征与GFCC特征、
Figure 518226DEST_PATH_IMAGE001
Figure 991933DEST_PATH_IMAGE002
特征做变换,然后再将变换后的所有特征以及小波能量特征使用concat方法连接组合成新的声信号特征;
模型训练模块构建深度残差收缩网络模型,并将融合后的新特征输入到深度残差收缩网络模型中进行训练,保存训练好的模型参数;
预测输出模块使用训练好的模型对新输入的声音信号样本进行碰撞预测,预测是否发生了车辆碰撞事故。
以上所述,仅是本申请的较佳实施例,并非对本申请做任何形式上的限制,凡是依据本申请的技术实质对以上实施例所作的任何简单修改、等同变化,均落入本申请的保护范围之内。

Claims (8)

1.一种基于深度残差收缩网络的车辆碰撞检测方法,其特征在于:包括以下步骤:
S1、采集车辆碰撞事故多发地段的实时音频数据作为样本数据,并对音频数据进行类别标注;
S2、对采集的音频数据进行预处理;
S3、对预处理后的音频数据进行特征计算,包括MFCC特征及其一阶差分
Figure 813214DEST_PATH_IMAGE001
特征计算、GFCC特征及其一阶差分
Figure 120567DEST_PATH_IMAGE002
特征计算以及小波能量特征计算,将计算得到的特征做归一化处理;
S4、特征融合,使用基于DCA特征融合策略分别对归一化后的MFCC特性和GFCC特征、
Figure 355764DEST_PATH_IMAGE001
特征与
Figure 141186DEST_PATH_IMAGE002
特征做特征变换,最大化变换后两个特征集中对应特征的相关关系,同时最大化不同类之间的差异,然后将变换后得到的新的MFCC特征、GFCC特征、
Figure 283454DEST_PATH_IMAGE001
特征、
Figure 230551DEST_PATH_IMAGE002
特征与小波能量特征依次使用concat方法进行拼接形成新的特征,用于神经网络模型的训练;
其中,
Figure 890727DEST_PATH_IMAGE001
表示MFCC特征的一阶差分,
Figure 542157DEST_PATH_IMAGE002
表示GFCC特征的一阶差分;
S5、构造深度残差收缩网络模型并进行模型训练,保存训练好的模型;
S6、车辆碰撞预测,对新的输入样本做预处理、特征计算以及特征融合后输入至保存好的模型中,计算其属于每个类别的概率值大小,概率值最大的那个类别就代表输入样本声音的类别,以此来判断是否发生了车辆碰撞;
所述步骤S3中,小波能量特征计算具体过程如下:
对预处理后的每帧数据做n层小波分解,得到低频概貌系数CA和高频细节系数
Figure 804511DEST_PATH_IMAGE003
;对高频细节系数
Figure 999474DEST_PATH_IMAGE004
采用改进的阈值和改进的Garrote阈值函数做进一步地阈值处理,使用经过阈值处理后的小波分解系数计算小波系数能量;
改进的阈值计算公式如下:
Figure 878437DEST_PATH_IMAGE005
式(8);
Figure 133225DEST_PATH_IMAGE006
式(9);
其中,
Figure 784174DEST_PATH_IMAGE007
表示第
Figure 666548DEST_PATH_IMAGE008
层的阈值,
Figure 298387DEST_PATH_IMAGE009
表示信号长度,
Figure 689355DEST_PATH_IMAGE010
表示自然对数,
Figure 519777DEST_PATH_IMAGE011
为噪声的标准方差,
Figure 182839DEST_PATH_IMAGE012
表示小波分解第一层的细节系数,
Figure 36394DEST_PATH_IMAGE013
函数表示取数组的中值;
改进的Garrote阈值函数计算公式如下:
Figure 836248DEST_PATH_IMAGE014
式(10);
其中,
Figure 458859DEST_PATH_IMAGE015
表示小波分解第
Figure 886298DEST_PATH_IMAGE016
层细节系数的第
Figure 230079DEST_PATH_IMAGE017
个值,
Figure 237218DEST_PATH_IMAGE018
表示计算得到的第
Figure 42232DEST_PATH_IMAGE016
层的阈值;
使用经过阈值处理后的小波分解系数计算小波系数能量,计算公式如下:
Figure 112344DEST_PATH_IMAGE019
式(11);
Figure 674912DEST_PATH_IMAGE020
式(12);
其中,
Figure 485742DEST_PATH_IMAGE021
表示小波分解第
Figure 82946DEST_PATH_IMAGE016
层细节系数,
Figure 538940DEST_PATH_IMAGE022
表示第
Figure 651121DEST_PATH_IMAGE016
层细节系数的能量值,
Figure 593538DEST_PATH_IMAGE023
表示
Figure 48178DEST_PATH_IMAGE024
的长度,
Figure 457162DEST_PATH_IMAGE015
表示第
Figure 994323DEST_PATH_IMAGE016
层细节系数的第
Figure 350218DEST_PATH_IMAGE017
个值,
Figure 721681DEST_PATH_IMAGE025
表示小波分解的低频概貌系数,
Figure 895042DEST_PATH_IMAGE026
表示低频概貌系数的能量值,
Figure 388341DEST_PATH_IMAGE027
表示
Figure 878752DEST_PATH_IMAGE028
的长度,
Figure 898530DEST_PATH_IMAGE029
表示
Figure 118158DEST_PATH_IMAGE028
的第
Figure 683439DEST_PATH_IMAGE017
个值;
经计算后,得到该帧声信号的小波能量特征如下:
Figure 771350DEST_PATH_IMAGE030
式(13);
其中,
Figure 255421DEST_PATH_IMAGE031
表示第h层的小波细节系数能量值。
2.根据权利要求1所述的基于深度残差收缩网络的车辆碰撞检测方法,其特征在于:所述步骤S1中,采集的实时音频数据包括车辆碰撞声、喇叭声、人声、音乐以及轮胎摩擦声,存储为时长5s、采样频率为32kHz的音频文件,并进行类别标注。
3.根据权利要求1所述的基于深度残差收缩网络的车辆碰撞检测方法,其特征在于:所述步骤S2中,读取音频数据,首先进行幅值归一化和滤波去噪处理,然后对音频数据进行预加重、分帧以及加窗操作。
4.根据权利要求1所述的基于深度残差收缩网络的车辆碰撞检测方法,其特征在于,所述步骤S3中,MFCC特征及其一阶差分计算过程如下:
1)对预处理后的数据进行快速傅里叶变换,将数据从时域转换到频域,得到频谱上的能量分布,取其模的平方得到谱线能量;然后送入Mel三角滤波器组得到梅尔频谱图;对得到的梅尔频谱图进行对数运算以获得梅尔对数功率频谱图;最后对该对数功率频谱图进行离散余弦变换后就可得到MFCC特征,MFCC特征计算公式如下:
Figure 773514DEST_PATH_IMAGE032
式(1);
其中,M是三角滤波器的个数;
Figure 303721DEST_PATH_IMAGE033
是第m个对数梅尔频谱图的对数能量;c是倒谱系数的索引;
2)MFCC特征的一阶差分
Figure 70689DEST_PATH_IMAGE001
的计算公式如下:
Figure 802409DEST_PATH_IMAGE034
式(2);
其中,t表示第t帧,k表示取第t帧前后各k帧的MFCC特征参数。
5.根据权利要求1所述的基于深度残差收缩网络的车辆碰撞检测方法,其特征在于,所述步骤S3中,GFCC特征及其一阶差分计算过程如下:
1)对预处理后的数据进行快速傅里叶变换,将数据从时域转换到频域,得到频谱上的能量分布,取其模的平方得到谱线能量;然后送入Ganmmatone滤波器组得到Ganmmatone频谱图;对得到的Ganmmatone频谱图进行对数运算以获得Ganmmatone对数功率频谱图;最后对该对数功率频谱图进行离散余弦变换后就可得到GFCC特征;
Ganmmatone滤波器的时域表达式如下:
Figure 160578DEST_PATH_IMAGE035
式(3);
其中,
Figure 584606DEST_PATH_IMAGE036
为滤波器的增益,
Figure 686424DEST_PATH_IMAGE037
为滤波器的中心频率,
Figure 7071DEST_PATH_IMAGE038
为阶跃函数,
Figure 98260DEST_PATH_IMAGE039
为偏移相位,
Figure 868639DEST_PATH_IMAGE040
为滤波器的阶数,
Figure 508567DEST_PATH_IMAGE041
为滤波器数目,
Figure 824667DEST_PATH_IMAGE042
为滤波器的衰减因子,决定当前滤波器对脉冲响应的衰减速度,与中心频率的对应关系如下:
Figure 852534DEST_PATH_IMAGE043
式(4);
其中,
Figure 313472DEST_PATH_IMAGE044
为等效矩形带宽,与重心频率
Figure 694774DEST_PATH_IMAGE037
的关系如下:
Figure 927697DEST_PATH_IMAGE045
式(5);
最终得到GFCC特征,其计算公式如下:
Figure 860887DEST_PATH_IMAGE046
式(6);
其中,
Figure 543541DEST_PATH_IMAGE041
是Gammatone滤波器的个数,
Figure 516483DEST_PATH_IMAGE047
是第 n个对数Gammatone频谱图的对数能量,c是倒谱系数的索引;
2)GFCC特征的一阶差分
Figure 804245DEST_PATH_IMAGE002
的计算公式如下:
Figure 580440DEST_PATH_IMAGE048
式(7);
其中,t表示第t帧,k表示取第t帧前后各k帧的GFCC特征参数。
6.根据权利要求1所述的基于深度残差收缩网络的车辆碰撞检测方法,其特征在于,所述步骤S3中,归一化处理具体过程如下:
使用min-max归一化,对原始数据进行线性变换,映射到[0, 1]区间,转换公式如下:
Figure 78286DEST_PATH_IMAGE049
式(14);
其中,x表示转换前的原始特征数值,
Figure 601059DEST_PATH_IMAGE050
表示归一化后的特征数值,max为原始数据的最大值,min为原始数据的最小值。
7.根据权利要求1所述的基于深度残差收缩网络的车辆碰撞检测方法,其特征在于,所述步骤S5具体如下:
1)构造深度残差收缩网络模型
所述深度残差收缩网络模型包括输入层、卷积层、深度残差收缩网络基本模块、全局均值池化层以及全连接输出层,构造过程如下:
首先构造深度残差收缩网络基本模块,模块中嵌入了一个子网络,用于自动地设置软阈值化所需要的阈值,采用通道间共享阈值的残差收缩模块,首先对输入特征图经过两次批标准化、ReLu激活函数和卷积层操作;然后对所有特征求绝对值,取其平均值记为特征
Figure 540065DEST_PATH_IMAGE051
;在另一条路径中,将特征的绝对值通过全局均值池化之后,输入到一个两层的全连接网络,然后使用 Sigmoid 函数将输出归一化到0和1之间,获得一个尺度参数
Figure 752741DEST_PATH_IMAGE052
,最终的阈值表示为
Figure 347670DEST_PATH_IMAGE053
;最后使用Tensorfow中的identify将原始输入特征图与阈值进行相加并返回;
构造输入层,接收神经网络模型的外部输入,并将其传递给卷积层,这里的外部输入是前述步骤计算的声信号特征;
构造卷积层,卷积层接收输入层的输出,然后重复卷积操作,获得特征图,然后将特征图传递给深度残差收缩网络基本模块;
堆叠深度残差收缩网络基本模块,卷积层输出的特征图经过这些深度残差收缩网络模块处理后传递给批标准化层;
构造批标准化层,激活函数ReLu和全局均值化层;
构造全连接输出层,接收来自全局均值化层的输出;
全连接输出层对应样本数据包含的所有类别,输出值是样本属于每个类别的概率值,取最大输出值对应的类别作为模型预测的样本类别;
2)模型训练
将计算后的特征数据集分成十份,轮流将其中9份作为训练数据,1份作为测试数据,进行模型训练和测试,得出相应的准确率,最后取这10次结果的准确率的平均值作为对算法精度的估计,最后保存训练好的模型。
8.一种基于深度残差收缩网络的车辆碰撞检测装置,其特征在于:包括数据采集模块、数据预处理模块、特征提取模块、特征融合模块、模型训练模块以及预测输出模块,其中:
数据采集模块利用声音传感器采集车辆碰撞声、喇叭声、人声、音乐以及轮胎摩擦声这五个类别的音频数据并进行保存;
数据预处理模块读取保存的音频数据,对上述音频数据进行幅值归一化处理、滤波消噪处理、预加重、分帧以及加窗操作;
特征提取模块,计算预处理后的音频数据的各种声信号特征,包括MFCC特征及其一阶差分
Figure 674134DEST_PATH_IMAGE001
特征、GFCC特征及其一阶差分
Figure 467646DEST_PATH_IMAGE002
特征以及小波能量特征,并对得到的特征进行归一化处理;
特征融合模块使用DCA特征融合策略及concat特征融合策略融合计算后的特征, DCA融合策略分别对MFCC特征与GFCC特征、
Figure 179119DEST_PATH_IMAGE001
特征与
Figure 61012DEST_PATH_IMAGE002
特征做变换,然后再将变换后的所有特征以及小波能量特征使用concat方法连接组合成新的声信号特征;
模型训练模块构建深度残差收缩网络模型并将融合后的新特征输入到深度残差收缩网络模型中进行训练,保存训练好的模型参数;
预测输出模块使用训练好的模型对新输入的声音信号样本进行碰撞预测,预测是否发生了车辆碰撞事故;
所述小波能量特征计算具体过程如下:
对预处理后的每帧数据做n层小波分解,得到低频概貌系数CA和高频细节系数
Figure 922658DEST_PATH_IMAGE003
;对高频细节系数
Figure 836256DEST_PATH_IMAGE004
采用改进的阈值和改进的Garrote阈值函数做进一步地阈值处理,使用经过阈值处理后的小波分解系数计算小波系数能量;
改进的阈值计算公式如下:
Figure 390734DEST_PATH_IMAGE005
式(8);
Figure 552983DEST_PATH_IMAGE006
式(9);
其中,
Figure 952741DEST_PATH_IMAGE007
表示第
Figure 455266DEST_PATH_IMAGE008
层的阈值,
Figure 774121DEST_PATH_IMAGE009
表示信号长度,
Figure 630606DEST_PATH_IMAGE010
表示自然对数,
Figure 568475DEST_PATH_IMAGE011
为噪声的标准方差,
Figure 925507DEST_PATH_IMAGE012
表示小波分解第一层的细节系数,
Figure 152614DEST_PATH_IMAGE013
函数表示取数组的中值;
改进的Garrote阈值函数计算公式如下:
Figure 227886DEST_PATH_IMAGE014
式(10);
其中,
Figure 969446DEST_PATH_IMAGE015
表示小波分解第
Figure 446563DEST_PATH_IMAGE016
层细节系数的第
Figure 251096DEST_PATH_IMAGE017
个值,
Figure 672719DEST_PATH_IMAGE018
表示计算得到的第
Figure 686811DEST_PATH_IMAGE016
层的阈值;
使用经过阈值处理后的小波分解系数计算小波系数能量,计算公式如下:
Figure 284015DEST_PATH_IMAGE019
式(11);
Figure 982150DEST_PATH_IMAGE020
式(12);
其中,
Figure 891069DEST_PATH_IMAGE021
表示小波分解第
Figure 974432DEST_PATH_IMAGE016
层细节系数,
Figure 429072DEST_PATH_IMAGE022
表示第
Figure 838056DEST_PATH_IMAGE016
层细节系数的能量值,
Figure 109638DEST_PATH_IMAGE023
表示
Figure 996691DEST_PATH_IMAGE024
的长度,
Figure 40258DEST_PATH_IMAGE015
表示第
Figure 620144DEST_PATH_IMAGE016
层细节系数的第
Figure 503655DEST_PATH_IMAGE017
个值,
Figure 928820DEST_PATH_IMAGE025
表示小波分解的低频概貌系数,
Figure 561314DEST_PATH_IMAGE026
表示低频概貌系数的能量值,
Figure 312101DEST_PATH_IMAGE027
表示
Figure 682909DEST_PATH_IMAGE028
的长度,
Figure 52710DEST_PATH_IMAGE029
表示
Figure 207222DEST_PATH_IMAGE028
的第
Figure 863331DEST_PATH_IMAGE017
个值;
经计算后,得到该帧声信号的小波能量特征如下:
Figure 331222DEST_PATH_IMAGE030
式(13);
其中,
Figure 366698DEST_PATH_IMAGE031
表示第h层的小波细节系数能量值。
CN202110717159.5A 2021-06-28 2021-06-28 基于深度残差收缩网络的车辆碰撞检测方法及装置 Active CN113177536B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110717159.5A CN113177536B (zh) 2021-06-28 2021-06-28 基于深度残差收缩网络的车辆碰撞检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110717159.5A CN113177536B (zh) 2021-06-28 2021-06-28 基于深度残差收缩网络的车辆碰撞检测方法及装置

Publications (2)

Publication Number Publication Date
CN113177536A CN113177536A (zh) 2021-07-27
CN113177536B true CN113177536B (zh) 2021-09-10

Family

ID=76927872

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110717159.5A Active CN113177536B (zh) 2021-06-28 2021-06-28 基于深度残差收缩网络的车辆碰撞检测方法及装置

Country Status (1)

Country Link
CN (1) CN113177536B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104900229A (zh) * 2015-05-25 2015-09-09 桂林电子科技大学信息科技学院 一种语音信号混合特征参数的提取方法
US9741360B1 (en) * 2016-10-09 2017-08-22 Spectimbre Inc. Speech enhancement for target speakers
CN109346103A (zh) * 2018-10-30 2019-02-15 交通运输部公路科学研究所 一种用于公路隧道交通事件的音频检测方法
CN110917613A (zh) * 2019-11-30 2020-03-27 吉林大学 一种基于振动触觉的游戏智能桌垫
CN111785285A (zh) * 2020-05-22 2020-10-16 南京邮电大学 面向家居多特征参数融合的声纹识别方法
CN111951560A (zh) * 2020-08-30 2020-11-17 北京嘀嘀无限科技发展有限公司 服务异常检测方法、训练服务异常检测模型的方法和训练声音模型的方法
CN112259107A (zh) * 2020-09-28 2021-01-22 南京邮电大学 一种会议场景小样本条件下的声纹识别方法
CN112529177A (zh) * 2020-12-04 2021-03-19 广州亚美智造科技有限公司 一种车辆碰撞检测方法及装置
CN112651429A (zh) * 2020-12-09 2021-04-13 歌尔股份有限公司 一种音频信号时序对齐方法和装置
US10981668B1 (en) * 2020-02-28 2021-04-20 American Standard Aerospace Products (Asap) Apparatus, system and method of data recording
CN113033654A (zh) * 2021-03-23 2021-06-25 云南大学 基于WiFi信道状态信息的室内入侵检测方法及系统

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5505896B2 (ja) * 2008-02-29 2014-05-28 インターナショナル・ビジネス・マシーンズ・コーポレーション 発話区間検出システム、方法及びプログラム
US20130250771A1 (en) * 2012-03-20 2013-09-26 Nokia Siemens Networks Oy Device to device enhanced voice group call
US9495591B2 (en) * 2012-04-13 2016-11-15 Qualcomm Incorporated Object recognition using multi-modal matching scheme
GB201510220D0 (en) * 2015-06-11 2015-07-29 Renishaw Plc Additive manufacturing apparatus and method
CN106021548A (zh) * 2016-05-27 2016-10-12 大连楼兰科技股份有限公司 基于分布式人工智能图像识别的远程定损方法及系统
CN108877146A (zh) * 2018-09-03 2018-11-23 深圳市尼欧科技有限公司 一种基于智能语音识别的乘驾安全自动报警装置及其方法
CN109961017A (zh) * 2019-02-26 2019-07-02 杭州电子科技大学 一种基于卷积循环神经网络的心音信号分类方法
CN110097755B (zh) * 2019-04-29 2021-08-17 东北大学 基于深度神经网络的高速公路交通流量状态识别方法
US11562206B2 (en) * 2019-09-30 2023-01-24 Wipro Limited System and method for providing personalized driving or navigation assistance

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104900229A (zh) * 2015-05-25 2015-09-09 桂林电子科技大学信息科技学院 一种语音信号混合特征参数的提取方法
US9741360B1 (en) * 2016-10-09 2017-08-22 Spectimbre Inc. Speech enhancement for target speakers
CN109346103A (zh) * 2018-10-30 2019-02-15 交通运输部公路科学研究所 一种用于公路隧道交通事件的音频检测方法
CN110917613A (zh) * 2019-11-30 2020-03-27 吉林大学 一种基于振动触觉的游戏智能桌垫
US10981668B1 (en) * 2020-02-28 2021-04-20 American Standard Aerospace Products (Asap) Apparatus, system and method of data recording
CN111785285A (zh) * 2020-05-22 2020-10-16 南京邮电大学 面向家居多特征参数融合的声纹识别方法
CN111951560A (zh) * 2020-08-30 2020-11-17 北京嘀嘀无限科技发展有限公司 服务异常检测方法、训练服务异常检测模型的方法和训练声音模型的方法
CN112259107A (zh) * 2020-09-28 2021-01-22 南京邮电大学 一种会议场景小样本条件下的声纹识别方法
CN112529177A (zh) * 2020-12-04 2021-03-19 广州亚美智造科技有限公司 一种车辆碰撞检测方法及装置
CN112651429A (zh) * 2020-12-09 2021-04-13 歌尔股份有限公司 一种音频信号时序对齐方法和装置
CN113033654A (zh) * 2021-03-23 2021-06-25 云南大学 基于WiFi信道状态信息的室内入侵检测方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
"Adaptive wavelet thresholding with robust hybrid features for text-independent speaker identification system";Alabbasi H A 等;《International Journal of Electrical & Computer Engineering 》;20201031;第10卷(第5期);5208-5216 *
"基于MGC参数和BP神经网络的汽车声音转换系统研究";范文超;《中国硕士学位论文全文数据库 工程科技Ⅱ辑》;20200715(第7期);C035-471 *
梁洪波."基于DCA的自动驾驶车辆传感数据融合方法研究".《 安徽师范大学学报(自然科学版)》.2021,第44卷(第2期),121-125+144. *

Also Published As

Publication number Publication date
CN113177536A (zh) 2021-07-27

Similar Documents

Publication Publication Date Title
CN109949823B (zh) 一种基于dwpt-mfcc与gmm的车内异响识别方法
CN111724770B (zh) 一种基于深度卷积生成对抗网络的音频关键词识别方法
CN112446242A (zh) 声学场景分类方法、装置及相应设备
Wei et al. A method of underwater acoustic signal classification based on deep neural network
CN115081473A (zh) 一种多特征融合的制动噪声分类识别方法
CN112541533A (zh) 一种基于神经网络与特征融合的改装车识别方法
CN115758082A (zh) 一种轨道交通变压器故障诊断方法
CN114155876A (zh) 一种基于音频信号的交通流识别方法、装置及存储介质
CN112052712B (zh) 一种电力设备状态监测与故障识别方法及系统
CN112529177A (zh) 一种车辆碰撞检测方法及装置
CN113990303B (zh) 基于多分辨率空洞深度可分卷积网络的环境声音辨识方法
CN116594057B (zh) 一种基于深度学习和边缘计算的地震预警方法与装置
CN111968669B (zh) 一种多元混合声信号分离方法及装置
CN113177536B (zh) 基于深度残差收缩网络的车辆碰撞检测方法及装置
CN206781702U (zh) 一种基于量子神经网络的语音识别汽车防盗系统
CN117332293A (zh) 一种基于声音Mel频率特征的货车超载检测方法
CN115346514A (zh) 一种面向智能驾驶测评的音频预警智能识别方法
CN116168727A (zh) 一种变压器异常声音检测方法、系统、设备及存储介质
Čavor et al. Vehicle Speed Estimation From Audio Signals Using 1D Convolutional Neural Networks
CN112908344B (zh) 一种鸟鸣声智能识别方法、装置、设备和介质
CN111785262B (zh) 一种基于残差网络及融合特征的说话人年龄性别分类方法
CN114898773A (zh) 基于深度自注意力神经网络分类器的合成语音检测方法
CN114550711A (zh) 基于时频注意力网络模型的电缆周边环境声音识别方法
CN110322894B (zh) 一种基于声音的波形图生成及大熊猫检测方法
CN113539298A (zh) 一种基于云边端的声音大数据分析计算图像化系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant