CN112529177A - 一种车辆碰撞检测方法及装置 - Google Patents
一种车辆碰撞检测方法及装置 Download PDFInfo
- Publication number
- CN112529177A CN112529177A CN202011405263.2A CN202011405263A CN112529177A CN 112529177 A CN112529177 A CN 112529177A CN 202011405263 A CN202011405263 A CN 202011405263A CN 112529177 A CN112529177 A CN 112529177A
- Authority
- CN
- China
- Prior art keywords
- collision
- hwc
- audio sample
- audio
- dimensional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 26
- 239000013598 vector Substances 0.000 claims abstract description 136
- 238000013507 mapping Methods 0.000 claims abstract description 22
- 238000012549 training Methods 0.000 claims description 16
- 238000000605 extraction Methods 0.000 claims description 14
- 238000011176 pooling Methods 0.000 claims description 13
- 238000012360 testing method Methods 0.000 claims description 3
- 238000000034 method Methods 0.000 abstract description 35
- 230000008569 process Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 4
- 230000004913 activation Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000012952 Resampling Methods 0.000 description 1
- 206010039203 Road traffic accident Diseases 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Traffic Control Systems (AREA)
Abstract
本申请公开了一种车辆碰撞检测方法及装置,方法包括:获取待测音频样本;提取待测音频样本的MFCC特征向量;将MFCC特征向量映射为hwc三维特征向量,使得hwc三维特征向量符合碰撞模型的输入格式;将hwc三维特征向量输入训练好的碰撞模型中,得到碰撞概率值;若碰撞概率值大于预设概率值,则待测音频样本为碰撞音频样本。本申请解决了现有技术只能学习到语音样本在一维方向的信息,而不能学习到语音样本深层次的语义信息的技术问题。
Description
技术领域
本申请涉及碰撞检测技术领域,尤其涉及一种车辆碰撞检测方法及装置。
背景技术
随着社会发展水平的不断提高,汽车数量的增加给交通带来了极大的负担,各种各样的交通事故的数量也在增加,这一数量的增加为交通的疏导增加了成本。
对此,现有的对汽车碰撞检测方法有以下几个方面:通过图像的方法;通过车载的相关传感器,如红外传感器、超声传感器等等;通过音频的方法。
基于音频的方法,现有的一些方法主要是利用音频的大小判断是否碰撞,部分方法是对行车过程中的频率进行分析,判断碰撞时刻频率的分布来判断是否发生碰撞,这些都是基于传统方法去处理,单一阈值的情况下无法适用复杂的室外场景,检测效果相对较差。部分方法采用机器学习中分类器的方法对音频的频率进行分析,然后构建分类器来判断,此方法相对传统方法效果上会有一定改善,但由于分类器只能学习到音频信息在一维方向上的信息,未考虑音频频率域特征在二维的相关关系以及更深层次的语义信息,在场景较多情况下学习的效果并不理想。而深度学习的方法往往可以获得频率域基本分布特征的同时,也可以学到更深层次的语义信息。
发明内容
本申请提供了一种车辆碰撞检测方法及装置,解决了现有技术只能学习到语音样本在一维方向的信息,而不能学习到语音样本深层次的语义信息的技术问题。
有鉴于此,本申请第一方面提供了一种车辆碰撞检测方法,所述方法包括:
获取待测音频样本;
提取所述待测音频样本的MFCC特征向量;
将所述MFCC特征向量映射为hwc三维特征向量,使得所述hwc三维特征向量符合碰撞模型的输入格式;
将所述hwc三维特征向量输入训练好的所述碰撞模型中,得到碰撞概率值;
若所述碰撞概率值大于预设概率值,则所述待测音频样本为碰撞音频样本。
可选的,所述提取所述待测音频样本的MFCC特征向量,包括:
每间隔预置时间从所述待测音频样本中采集一段预置长度的第一音频样本,提取所述第一音频样本的MFCC特征向量。
可选的,所述提取所述待测音频样本的MFCC特征向量,包括:
每间隔0-0.5s从所述待测音频样本中采集一段1.5-2.5s的第一音频样本,提取所述第一音频样本的MFCC特征向量。
可选的,在所述将所述hwc三维特征向量输入训练好的所述碰撞模型中,得到碰撞概率值,之前还包括:
获取若干第二音频样本作为训练集,所述第二音频样本包括碰撞音频样本和非碰撞样本;
提取所述第二音频样本的所述MFCC特征向量;
将所述MFCC特征向量映射为hwc三维特征向量;
将所述hwc三维特征向量输入构建好的所述碰撞模型中,直到所述碰撞模型收敛,得到训练好的所述碰撞模型。
可选的,所述将所述hwc三维特征向量输入训练好的所述碰撞模型中,得到碰撞概率值,包括:
所述hwc三维特征向量经过卷积层,得到所述hwc三维特征向量的深层次语义特征;
所述深层次语义特征经过均值池化层展开,得到一维向量;
所述一维向量经过多个全连接层进行前馈网络学习;
所述前馈网络学习后的结果经过输出层得到碰撞概率值;
所述碰撞模型包括所述卷进层、所述均值池化层、所述全连接层和所述输出层。
本申请第二方面提供一种车辆碰撞检测装置,所述装置包括:
第一获取单元,用于获取待测音频样本;
第一提取单元,用于提取所述待测音频样本的MFCC特征向量;
第一映射单元,用于将所述MFCC特征向量映射为hwc三维特征向量,使得所述hwc三维特征向量符合碰撞模型的输入格式;
概率值获取单元,用于将所述hwc三维特征向量输入训练好的所述碰撞模型中,得到碰撞概率值;
判断单元,用于若所述碰撞概率值大于预设概率值,则所述待测音频样本为碰撞音频样本。
可选的,所述第一提取单元具体用于每间隔预置时间从所述待测音频样本中采集一段预置长度的第一音频样本,提取所述第一音频样本的MFCC特征向量。
可选的,所述第一提取单元具体用于每间隔0-0.5s从所述待测音频样本中采集一段1.5-2.5s的第一音频样本,提取所述第一音频样本的MFCC特征向量。
可选的,还包括:
第二获取单元,用于获取若干第二音频样本作为训练集,所述第二音频样本包括碰撞音频样本和非碰撞样本;
第二提取单元,用于提取所述第二音频样本的所述MFCC特征向量;
第二映射单元,将所述MFCC特征向量映射为hwc三维特征向量;
模型训练单元,用于将所述hwc三维特征向量输入构建好的所述碰撞模型中,直到所述碰撞模型收敛,得到训练好的所述碰撞模型。
可选的,概率值获取单元包括:
语义特征提取单元,用于将所述hwc三维特征向量经过卷积层,得到所述hwc三维特征向量的深层次语义特征;
展开单元,用于将所述深层次语义特征经过均值池化层展开,得到一维向量;
学习单元,用于将所述一维向量经过多个全连接层进行前馈网络学习;
输出单元,用于将所述前馈网络学习后的结果经过输出层得到碰撞概率值;
所述碰撞模型包括所述卷进层、所述均值池化层、所述全连接层和所述输出层。
从以上技术方案可以看出,本申请具有以下优点:
本申请中,提供了一种车辆碰撞检测方法,包括:获取待测音频样本;提取待测音频样本的MFCC特征向量;将MFCC特征向量映射为hwc三维特征向量,使得hwc三维特征向量符合碰撞模型的输入格式;将hwc三维特征向量输入训练好的碰撞模型中,得到碰撞概率值;若碰撞概率值大于预设概率值,则待测音频样本为碰撞音频样本。
本申请通过将MFCC特征向量映射为hwc三维特征向量,获取音频样本的多维特征,从而使得碰撞模型学习到深层次的语义信息,也使得碰撞模型在多场景环境下也能得到更优的结果。
附图说明
图1为本申请一种车辆碰撞检测方法的一个实施例的方法流程图;
图2为本申请中对碰撞模型进行训练的方法流程图;
图3为本申请一种车辆碰撞检测方法的另一个实施例的方法流程图;
图4为本申请一种车辆碰撞检测方法的一个实施例中提取音频样本MFCC特征向量的流程图;
图5为本申请一种车辆碰撞检测装置的一个实施例的结构示意图;
图6为本申请中碰撞模型的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
实施例1:
图1为本申请一种车辆碰撞检测方法的一个实施例的方法流程图,如图1所示,图1中包括:
101、获取待测音频样本;
需要说明的是,本申请可以获取来自车载记录仪或者其他车载音频采集设备采集的音频数据,并将采集的音频数据作为待测音频样本。
102、提取待测音频样本的MFCC特征向量;
需要说明的是,本申请可以采用常见的MFCC特征向量的提取方法,对待测音频样本的MFCC特征向量进行提取。
在一种具体的实施方式中,MFCC特征提取步骤如下:
S1:设待测音频样本为x(n),截取2s的待测音频样本;
S2:将2s的待测音频样本x(n)进行音频频率重采样后,量化为8khz;
S3:对量化后的待测音频样本x(n)进行归一化处理,使其值处于[-1,1]之间;
S4:对x(n)进行预加重处理,可以采用一阶数字滤波器来实现,具体公式为:H(z)=1-μz-1式中μ=0.97;x一般表示时域的信号,z表示频域的信号;
S5:对预加重处理后的待测音频样本进行加窗处理,可以设置帧长度为25ms,帧移动步长为10ms,为保证短时分析,通过加汉明窗选取声音信号,窗外声音信号为0,汉明窗的选取点数可以为256点,帧间的重叠为可以为128点;
S6:对加窗处理后的待测音频样本进行快速傅里叶变换,计算出待测音频样本中每帧数据的频谱采纳数;
S7:可以将快速傅里叶变换后的待测音频样本的频谱参数通过一组N(本发明可以取30)个三角形带通滤波器构成的梅尔频率滤波器进行卷积运算,在对每个频带的输出结果取对数,得到每个输出的对数能量;
S8:对得到的N个对数能量进行离散余弦变换,得到待测音频样本的梅尔倒谱系数,此即为待测音频样本的MFCC特征向量。
具体的,MFCC特征提取过程简要流程图如图4所示。
103、将MFCC特征向量映射为hwc三维特征向量,使得hwc三维特征向量符合碰撞模型的输入格式;
需要说明的是,本申请可以将MFCC特征向量映射为hwc三维特征向量,使得能够获取音频样本多维度的特征,从而提高判断待测音频样本的准确性。其中,h表示height,w表示width,c表示通道数,对应于碰撞模型的输入通道。本申请中可以采用CNN卷积神经网络构造碰撞模型。
104、将hwc三维特征向量输入训练好的碰撞模型中,得到碰撞概率值;
需要说明的是,hwc三维特征向量对应于碰撞模型的输入通道进行输入,通过训练好的碰撞模型学习hwc三维特征向量的深层次语义信息,从而实现对待测音频样本的碰撞概率值的计算。
105、若碰撞概率值大于预设概率值,则待测音频样本为碰撞音频样本。
需要说明的是,当待测音频样本的碰撞概率值大于预设概率值时,可以判断待测音频样本为碰撞音频样本。其中碰撞概率值可以根据大量实验得到,也可以根据需要进行设置。碰撞音频样本为发生碰撞时采集的汽车的音频样本。
本申请通过将MFCC特征向量映射为hwc三维特征向量,获取音频样本的多维特征,从而使得碰撞模型学习到深层次的语义信息,也使得碰撞模型在多场景环境下也能得到更优的结果。
实施例2:
图2为本申请一种车辆碰撞检测方法的实施例中对碰撞模型进行训练的方法流程图,如图2所示,图2中包括:
201、获取若干第二音频样本作为训练集,第二音频样本包括碰撞音频样本和非碰撞样本;
需要说明的是,本申请可以选用大量碰撞音频样本和非碰撞样本(即正样本和负样本)作为训练集,用于对碰撞模型进行训练。
202、提取第二音频样本的MFCC特征向量;
203、将MFCC特征向量映射为hwc三维特征向量;
204、将hwc三维特征向量输入构建好的碰撞模型中,直到碰撞模型收敛,得到训练好的碰撞模型。
以上步骤201-204是本申请对碰撞模型进行训练的步骤。
本申请的一个实施例中还包括采用训练好的碰撞模型对待测音频样本进行测试,判断音频样本是否为碰撞音频样本的步骤,如图3所示,图3中包括:
301、获取待测音频样本;
302、每间隔预置时间从待测音频样本中采集一段预置长度的第一音频样本,提取第一音频样本的MFCC特征向量;
需要说明的是,本申请可以间隔预置时间从待测音频样本中采集一段预置长度的第一音频样本,提取第一音频样本的MFCC特征向量。
具体的,本申请可以每间隔0-0.5s从待测音频样本中采集一段1.5-2.5s的第一音频样本,提取第一音频样本的MFCC特征向量。
在一种具体的实施方式中,若待测音频样本的时长大于2s,则每隔0.2s采集一段2s的音频数据;由于实际的车辆碰撞时间一般持续时间为1s左右;为了保证检测的有效性,对于待测音频样本,可以采用间隔0.2s截取一段2s的音频数据的方法,使得截取到的音频数据中能够得到完整的碰撞波形图;那么1s的时间内可以采样5段音频样本,即0-2s,0.2-2.2s,0.4-2.4s,0.6-2.6s,0.8-2.8s,通过以上截取方法可以保证了碰撞波形图能够完整的保存至至少一个第一音频样本中,从而减少了漏报误报情况的出现。
303、将MFCC特征向量映射为hwc三维特征向量,使得hwc三维特征向量符合碰撞模型的输入格式;
需要说明的是,本申请可以提取预置长度的第一音频样本的MFCC特征向量,并将提取的MFCC特征向量映射为hwc三维特征向量,使得能够获取音频样本多维度的特征,从而提高判断待测音频样本的准确性。
在一种具体的实施方式中,可以将MFCC特征向量映射为96*96*2的三维特征向量,具体为宽和高都是96的双通道三维特征向量。
304、将hwc三维特征向量输入训练好的碰撞模型中,得到碰撞概率值;
需要说明的是,hwc三维特征向量对应于碰撞模型的输入通道进行输入,通过碰撞模型学习hwc三维特征向量的深层次语义信息,从而实现对待测音频样本的碰撞概率值的计算。
本申请中可以搭建两层的卷积层用于提取hwc三维特征向量的深层次语义特征;将提取到的深层次语义特征经过均值池化后展开为1维向量;将一维向量经过两个全连接层进行前馈网络学习;将前馈网络学习后的结果输出给2维的softmax输出层,并得到一个1*2的输出向量y,即为碰撞概率值。本申请中可以设置当y[0]>0.7时表示输出结果为碰撞,反之为非碰撞。
具体的,碰撞模型可以为CNN网络结构,包括卷积层conv1、均值池化层avgpool1、卷积层conv2、均值池化层2,全连接层fc1及输出层fc2。本申请中卷积层中不使用dropout模块,在卷积层后加入BN(BatchNormalization,批归一化)处理模块以防止CNN网络陷入过拟合并加快训练过程中神经网络的收敛,为保证能够有效获取MFCC特征向量中的有效语义信息,并且不增加过多的计算耗时,本申请的conv1和conv2卷积核的大小可以设置为3*3,步长可以设置为1;其中,conv1的通道数可以为64,conv2卷积层通道数可以为128。全连接层fc1神经元个数可以为256,使用的激活函数可以为ReLU,目的是加速网络收敛和降低训练过程中的梯度消失问题,输出层fc2神经元个数可以为2,激活函数为softmax,碰撞模型的具体结构如图6所示。
305、若碰撞概率值大于预设概率值,则待测音频样本为碰撞音频样本。
需要说明的是,当待测音频样本的碰撞概率值大于预设概率值时,可以判断待测音频样本为碰撞音频样本。其中碰撞概率值可以根据大量实验得到,也可以根据需要进行设置,本申请中可以将碰撞概率值具体设置为0.7。碰撞音频样本为发生碰撞时采集的汽车的音频样本。
本申请通过将MFCC特征向量映射为hwc三维特征向量,获取音频样本的多维特征,从而使得碰撞模型学习到深层次的语义信息,也使得碰撞模型在多场景环境下也能得到更优的结果;通过隔预置时间从待测音频样本中采集一段预置长度的第一音频样本,使得截取到的音频数据中能够得到完整的碰撞波形图,并且可以保证了碰撞波形图能够完整的保存至少一个第一音频样本中,从而减少了漏报误报情况的出现。
实施例3:
以上是本申请方法的实施例,本申请还提供了一种车辆碰撞检测装置的一个实施例,如图5所示,图5中包括:
第一获取单元401,用于获取待测音频样本;
第一提取单元402,用于提取待测音频样本的MFCC特征向量;
第一映射单元403,用于将MFCC特征向量映射为hwc三维特征向量,使得hwc三维特征向量符合碰撞模型的输入格式;
概率值获取单元404,用于将hwc三维特征向量输入训练好的碰撞模型中,得到碰撞概率值;
判断单元405,用于若碰撞概率值大于预设概率值,则待测音频样本为碰撞音频样本。
第一提取单元402还用于每间隔预置时间从待测音频样本中采集一段预置长度的第一音频样本,提取第一音频样本的MFCC特征向量。
在一种具体的实施方式中,第一提取单元402还用于每间隔0-0.5s从待测音频样本中采集一段1.5-2.5s的第一音频样本,提取第一音频样本的MFCC特征向量。
在一种具体的实施方式中,车辆碰撞检测装置还包括:
第二获取单元,用于获取若干第二音频样本作为训练集,第二音频样本包括碰撞音频样本和非碰撞样本;
第二提取单元,用于提取第二音频样本的MFCC特征向量;
第二映射单元,将MFCC特征向量映射为hwc三维特征向量;
模型训练单元,用于将hwc三维特征向量输入构建好的碰撞模型中,直到碰撞模型收敛,得到训练好的碰撞模型。
概率值获取单元404包括:
语义特征提取单元,用于将hwc三维特征向量经过卷积层,得到hwc三维特征向量的深层次语义特征;
展开单元,用于将深层次语义特征经过均值池化层展开,得到一维向量;
学习单元,用于将一维向量经过多个全连接层进行前馈网络学习;
输出单元,用于将前馈网络学习后的结果经过输出层得到碰撞概率值;
碰撞模型包括卷进层、均值池化层、全连接层和输出层。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-OnlyMemory,英文缩写:ROM)、随机存取存储器(英文全称:Random Access Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (10)
1.一种车辆碰撞检测方法,其特征在于,包括:
获取待测音频样本;
提取所述待测音频样本的MFCC特征向量;
将所述MFCC特征向量映射为hwc三维特征向量,使得所述hwc三维特征向量符合碰撞模型的输入格式;
将所述hwc三维特征向量输入训练好的所述碰撞模型中,得到碰撞概率值;
若所述碰撞概率值大于预设概率值,则所述待测音频样本为碰撞音频样本。
2.根据权利要求1所述的车辆碰撞检测方法,其特征在于,所述提取所述待测音频样本的MFCC特征向量,包括:
每间隔预置时间从所述待测音频样本中采集一段预置长度的第一音频样本,提取所述第一音频样本的MFCC特征向量。
3.根据权利要求1所述的车辆碰撞检测方法,其特征在于,所述提取所述待测音频样本的MFCC特征向量,包括:
每间隔0-0.5s从所述待测音频样本中采集一段1.5-2.5s的第一音频样本,提取所述第一音频样本的MFCC特征向量。
4.根据权利要求1所述的车辆碰撞检测方法,其特征在于,在所述将所述hwc三维特征向量输入训练好的所述碰撞模型中,得到碰撞概率值,之前还包括:
获取若干第二音频样本作为训练集,所述第二音频样本包括碰撞音频样本和非碰撞样本;
提取所述第二音频样本的所述MFCC特征向量;
将所述MFCC特征向量映射为hwc三维特征向量;
将所述hwc三维特征向量输入构建好的所述碰撞模型中,直到所述碰撞模型收敛,得到训练好的所述碰撞模型。
5.根据权利要求1-4任一项所述的车辆碰撞检测方法,其特征在于,所述碰撞模型包括所述卷进层、所述均值池化层、所述全连接层和所述输出层所述将所述hwc三维特征向量输入训练好的所述碰撞模型中,得到碰撞概率值,包括:
所述hwc三维特征向量经过卷积层,得到所述hwc三维特征向量的深层次语义特征;
所述深层次语义特征经过均值池化层展开,得到一维向量;
所述一维向量经过多个全连接层进行前馈网络学习;
所述前馈网络学习后的结果经过输出层得到碰撞概率值。
6.一种车辆碰撞检测装置,其特征在于,包括:
第一获取单元,用于获取待测音频样本;
第一提取单元,用于提取所述待测音频样本的MFCC特征向量;
第一映射单元,用于将所述MFCC特征向量映射为hwc三维特征向量,使得所述hwc三维特征向量符合碰撞模型的输入格式;
概率值获取单元,用于将所述hwc三维特征向量输入训练好的所述碰撞模型中,得到碰撞概率值;
判断单元,用于若所述碰撞概率值大于预设概率值,则所述待测音频样本为碰撞音频样本。
7.根据权利要求6所述的车辆碰撞检测装置,其特征在于,所述第一提取单元具体用于每间隔预置时间从所述待测音频样本中采集一段预置长度的第一音频样本,提取所述第一音频样本的MFCC特征向量。
8.根据权利要求6所述的车辆碰撞检测装置,其特征在于,所述第一提取单元具体用于每间隔0-0.5s从所述待测音频样本中采集一段1.5-2.5s的第一音频样本,提取所述第一音频样本的MFCC特征向量。
9.根据权利要求6所述的车辆碰撞检测装置,其特征在于,还包括:
第二获取单元,用于获取若干第二音频样本作为训练集,所述第二音频样本包括碰撞音频样本和非碰撞样本;
第二提取单元,用于提取所述第二音频样本的所述MFCC特征向量;
第二映射单元,将所述MFCC特征向量映射为hwc三维特征向量;
模型训练单元,用于将所述hwc三维特征向量输入构建好的所述碰撞模型中,直到所述碰撞模型收敛,得到训练好的所述碰撞模型。
10.根据去权利要求6-9任一项所述的车辆碰撞检测装置,其特征在于,概率值获取单元包括:
语义特征提取单元,用于将所述hwc三维特征向量经过卷积层,得到所述hwc三维特征向量的深层次语义特征;
展开单元,用于将所述深层次语义特征经过均值池化层展开,得到一维向量;
学习单元,用于将所述一维向量经过多个全连接层进行前馈网络学习;
输出单元,用于将所述前馈网络学习后的结果经过输出层得到碰撞概率值;
所述碰撞模型包括所述卷进层、所述均值池化层、所述全连接层和所述输出层。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011405263.2A CN112529177A (zh) | 2020-12-04 | 2020-12-04 | 一种车辆碰撞检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011405263.2A CN112529177A (zh) | 2020-12-04 | 2020-12-04 | 一种车辆碰撞检测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112529177A true CN112529177A (zh) | 2021-03-19 |
Family
ID=74997570
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011405263.2A Pending CN112529177A (zh) | 2020-12-04 | 2020-12-04 | 一种车辆碰撞检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112529177A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113177536A (zh) * | 2021-06-28 | 2021-07-27 | 四川九通智路科技有限公司 | 基于深度残差收缩网络的车辆碰撞检测方法及装置 |
CN115223370A (zh) * | 2022-08-31 | 2022-10-21 | 四川九通智路科技有限公司 | 一种交通事故检测方法及检测系统 |
CN117876944A (zh) * | 2024-03-12 | 2024-04-12 | 深圳联友科技有限公司 | 一种基于音频信号的车辆碰撞识别方法 |
CN118072758A (zh) * | 2024-03-12 | 2024-05-24 | 深圳联友科技有限公司 | 一种基于语谱图的车辆碰撞识别方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106907697A (zh) * | 2017-04-19 | 2017-06-30 | 杭州派尼澳电子科技有限公司 | 一种内置碰撞声检测功能的智能路灯 |
CN107463907A (zh) * | 2017-08-08 | 2017-12-12 | 东软集团股份有限公司 | 车辆碰撞检测方法、装置、电子设备及车辆 |
CN108922560A (zh) * | 2018-05-02 | 2018-11-30 | 杭州电子科技大学 | 一种基于混合深度神经网络模型的城市噪声识别方法 |
CN109949824A (zh) * | 2019-01-24 | 2019-06-28 | 江南大学 | 基于N-DenseNet和高维mfcc特征的城市声音事件分类方法 |
CN110136744A (zh) * | 2019-05-24 | 2019-08-16 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种音频指纹生成方法、设备及存储介质 |
-
2020
- 2020-12-04 CN CN202011405263.2A patent/CN112529177A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106907697A (zh) * | 2017-04-19 | 2017-06-30 | 杭州派尼澳电子科技有限公司 | 一种内置碰撞声检测功能的智能路灯 |
CN107463907A (zh) * | 2017-08-08 | 2017-12-12 | 东软集团股份有限公司 | 车辆碰撞检测方法、装置、电子设备及车辆 |
CN108922560A (zh) * | 2018-05-02 | 2018-11-30 | 杭州电子科技大学 | 一种基于混合深度神经网络模型的城市噪声识别方法 |
CN109949824A (zh) * | 2019-01-24 | 2019-06-28 | 江南大学 | 基于N-DenseNet和高维mfcc特征的城市声音事件分类方法 |
CN110136744A (zh) * | 2019-05-24 | 2019-08-16 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种音频指纹生成方法、设备及存储介质 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113177536A (zh) * | 2021-06-28 | 2021-07-27 | 四川九通智路科技有限公司 | 基于深度残差收缩网络的车辆碰撞检测方法及装置 |
CN113177536B (zh) * | 2021-06-28 | 2021-09-10 | 四川九通智路科技有限公司 | 基于深度残差收缩网络的车辆碰撞检测方法及装置 |
CN115223370A (zh) * | 2022-08-31 | 2022-10-21 | 四川九通智路科技有限公司 | 一种交通事故检测方法及检测系统 |
CN115223370B (zh) * | 2022-08-31 | 2023-01-17 | 四川九通智路科技有限公司 | 一种交通事故检测方法及检测系统 |
CN117876944A (zh) * | 2024-03-12 | 2024-04-12 | 深圳联友科技有限公司 | 一种基于音频信号的车辆碰撞识别方法 |
CN118072758A (zh) * | 2024-03-12 | 2024-05-24 | 深圳联友科技有限公司 | 一种基于语谱图的车辆碰撞识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112529177A (zh) | 一种车辆碰撞检测方法及装置 | |
CN108648748B (zh) | 医院噪声环境下的声学事件检测方法 | |
CN110017991B (zh) | 基于谱峭度和神经网络的滚动轴承故障分类方法及系统 | |
CN106909784A (zh) | 基于二维时频图像深度卷积神经网络的癫痫脑电识别方法 | |
CN104916289A (zh) | 行车噪声环境下快速声学事件的检测方法 | |
CN110398647B (zh) | 变压器状态监测方法 | |
CN112735473B (zh) | 基于声音识别无人机的方法及系统 | |
CN110958568B (zh) | 基于WiFi的船舶驾驶室人员值班行为识别方法及系统 | |
CN101976564A (zh) | 昆虫声音识别方法 | |
CN109323754A (zh) | 一种列车车轮多边形故障诊断检测方法 | |
CN114093501B (zh) | 基于同步视频与脑电的儿童运动性癫痫智能辅助分析方法 | |
CN109060371A (zh) | 一种汽车零部件异响检测装置 | |
CN111816185A (zh) | 一种对混合语音中说话人的识别方法及装置 | |
CN110501172A (zh) | 一种基于轴箱振动的轨道车辆车轮状态识别方法 | |
CN114155876A (zh) | 一种基于音频信号的交通流识别方法、装置及存储介质 | |
CN110555346A (zh) | 驾驶员情绪检测方法、装置、电子设备及存储介质 | |
CN106203437A (zh) | 个体驾驶行为特征识别方法和装置 | |
CN115618205A (zh) | 一种便携式声纹故障检测系统及方法 | |
Yang et al. | Driver2vec: Driver identification from automotive data | |
CN116889411A (zh) | 自动驾驶安全员脑电信息语义分析方法及系统 | |
CN111476102A (zh) | 一种安全防护方法、中控设备及计算机存储介质 | |
CN115911623A (zh) | 一种储能系统基于声信号的电池热失控诊断方法及系统 | |
CN115346514A (zh) | 一种面向智能驾驶测评的音频预警智能识别方法 | |
CN112580531B (zh) | 一种真假车牌的识别检测方法及系统 | |
CN107334481B (zh) | 一种驾驶分心检测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20230522 Address after: Room 101, No. 227 Gaotang Road, Tianhe District, Guangzhou City, Guangdong Province, 510000 (location: Room 601) (office only) Applicant after: Yamei Zhilian Data Technology Co.,Ltd. Address before: NO.201 zijinghe Road, Tianhan District, Guangdong Province (510000 only) Applicant before: Guangzhou Yameizhi Technology Co.,Ltd. |