CN114626412B - 用于无人值守传感器系统的多类别目标识别方法及系统 - Google Patents
用于无人值守传感器系统的多类别目标识别方法及系统 Download PDFInfo
- Publication number
- CN114626412B CN114626412B CN202210191601.XA CN202210191601A CN114626412B CN 114626412 B CN114626412 B CN 114626412B CN 202210191601 A CN202210191601 A CN 202210191601A CN 114626412 B CN114626412 B CN 114626412B
- Authority
- CN
- China
- Prior art keywords
- model
- signal
- time domain
- sensor system
- framing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000012549 training Methods 0.000 claims abstract description 31
- 238000009432 framing Methods 0.000 claims abstract description 29
- 239000000203 mixture Substances 0.000 claims abstract description 28
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 230000009467 reduction Effects 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 14
- 230000009466 transformation Effects 0.000 claims description 9
- 230000003044 adaptive effect Effects 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 8
- 238000005259 measurement Methods 0.000 claims description 4
- 230000002194 synthesizing effect Effects 0.000 claims description 3
- 238000004422 calculation algorithm Methods 0.000 description 14
- 238000004364 calculation method Methods 0.000 description 13
- 238000009826 distribution Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 10
- 239000011159 matrix material Substances 0.000 description 9
- 239000013598 vector Substances 0.000 description 9
- 238000012360 testing method Methods 0.000 description 8
- 230000007613 environmental effect Effects 0.000 description 6
- 238000010801 machine learning Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000003064 k means clustering Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000035939 shock Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000004575 stone Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/02—Preprocessing
- G06F2218/04—Denoising
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/02—Preprocessing
- G06F2218/04—Denoising
- G06F2218/06—Denoising by applying a scale-space analysis, e.g. using wavelet analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Signal Processing (AREA)
- Image Analysis (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
本发明公开了一种用于无人值守传感器系统的多类别目标识别方法及系统,所述方法包括步骤:S1、预处理:对无人值守传感器系统获取的原始数据进行分帧;S2、特征提取:同时提取分帧后数据的多个时域特征;S3、模型训练:将步骤S2得到的多个时域特征作为训练样本,分别对高斯混合模型和xgboost模型进行训练,得到训练好的高斯混合模型和xgboost模型;S4、信号识别:通过训练好的高斯混合模型对信号进行识别,得到第一识别结果;通过训练好的xgboost模型对信号进行识别,得到第二识别结果;S5、综合判定:综合第一识别结果和第二识别结果,输出最终识别结果。本发明具有计算量小、识别精度高等优点。
Description
技术领域
本发明主要涉及目标识别技术领域,具体涉及一种用于无人值守传感器系统的多类别目标识别方法及系统。
背景技术
传统的无人值守传感器系统中目标识别方法包括:过零分析、傅里叶变换、卷积神经网络、循环神经网络等,前两种识别方法比较简单,但性能较差,环境适应性也不好;后两种计算量大,难于应用于计算资源相对有限的微处理器中,实际应用受限;传统的方法对于噪声的处理一般是使用数字滤波,但数字滤波在消除噪声的同时一些关键特征也被消除了,而普通的小波变换采取的硬阈值会造成局部突变,软阈值会失去局部信息。
发明内容
本发明要解决的技术问题就在于:针对现有技术存在的问题,本发明提供一种计算量小、识别率高的用于无人值守传感器系统的多类别目标识别方法及系统。
为解决上述技术问题,本发明提出的技术方案为:
一种用于无人值守传感器系统的多类别目标识别方法,包括步骤:
S1、预处理:对无人值守传感器系统获取的原始数据进行降噪及分帧;
S2、特征提取:同时提取分帧后数据的多个时域特征;
S3、模型训练:将步骤S2得到的多个时域特征作为训练样本,分别对高斯混合模型和xgboost模型进行训练,得到训练好的高斯混合模型和xgboost模型;
S4、信号识别:通过训练好的高斯混合模型对信号进行识别,得到第一识别结果;通过训练好的xgboost模型对信号进行识别,得到第二识别结果;
S5、综合判定:综合第一识别结果和第二识别结果,输出最终识别结果。
优选地,在步骤S1中,在对无人值守传感器系统获取的原始数据进行分帧之前,先对原始数据进行自适应阈值降噪:根据噪声在小波变换下的特性,自适应确定小波阈值,将低于阈值的噪声采取软阈值的方法处理,并将降噪后信号的峰值信噪比作为性能衡量指标。
优选地,在对原始数据进行分帧时,采取n1s的时间窗口对降噪后的估计值进行分帧,并在每个n1s帧前又多取n2s以作为参考段,在具体计算该(n1+n2)s信号的时候,再次对(n1+n2)s的信号进行分帧。
优选地,在步骤S2中,通过采用提取信号特征的方法来提取四个时域特征,具体为:
采用固定时间间隔提取分帧后数据的峰峰值作为第一个时域特征;
采用固定时间间隔提取分帧后数据的峭度作为第二个时域特征;
计算每帧数据最大的n个点值的和sumi作为第三个时域特征;
将sumi与前一帧最大的n个点值和sumi-1的比作为第四个时域特征。
优选地,四个时域特征的提取过程为:以x1个点为一个时间窗口,x2个点为滑动步长,于是得到h维的峰峰值特征F_ppvi=[p1,p2,..,ph];
对(n1+n2)s的窗口信号,以x3个点为一个时间窗口,x4个点为滑动步长,进行分帧得到w维的峭度特征F_kurtosisi=[k1,k2,...,kw]、每帧数据最大的n个点值的和sumi及其与前一帧最大的n个点值和sumi-1的比值特征ratei=Sumi/Sumi-1。
优选地,在步骤S4中,对于每一次GMM模型和xgboost模型给出的类别预测概率,采取阈值移动的方法,对概率大于预设值的才认定识别结果为可信的。
优选地,步骤S5的具体过程为:
采取高斯混合模型和xgboost模型博弈的计分逻辑:在第一次决策的时候,在两个模型中随机挑选一个模型的输出当作总的输出,并且对比真实标签yi,若xgboost模型正确且GMM不正确,则xgboost模型加1分,下一个预测的总输出由xgboost模型输出决定,反之亦然;若两个模型都预测正确或者错误,则不加分,下一轮的预测总输出由目前计分较多的一方决定。
本发明还公开了一种用于无人值守传感器系统的多类别目标识别系统,包括:
预处理模块,用于对无人值守传感器系统获取的原始数据进行降噪及分帧;
特征提取模块,用于同时提取分帧后数据的多个时域特征;
模型训练模块,用于将步骤S2得到的多个时域特征作为训练样本,分别对高斯混合模型和xgboost模型进行训练,得到训练好的高斯混合模型和xgboost模型;
信号识别模块,用于通过训练好的高斯混合模型对信号进行识别,得到第一识别结果;通过训练好的xgboost模型对信号进行识别,得到第二识别结果;
综合判定模块,用于综合第一识别结果和第二识别结果,输出最终识别结果。
本发明还公开了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在被处理器运行时执行如上所述的用于无人值守传感器系统的多类别目标识别方法的步骤。
本发明进一步公开了一种计算机终端,包括存储器和处理器,所述存储器上存储有计算机程序,所述计算机程序在被处理器运行时执行如上所述的用于无人值守传感器系统的多类别目标识别方法的步骤。
与现有技术相比,本发明的优点在于:
(1)本发明通过大量样本训练GMM、xgboost模型得到训练后的模型,模型识别具有普适性;只要目标信号的不同时域有差异,该方法就能获得比较好的识别性能;通过时域特征量的提取,减少了模型的输入数据,极大降低了运算过程的计算量,使得在计算资源有限的微处理器上也能实现神经网络计算,算法能部署到嵌入式系统中;通过两个模型结果的互相博弈综合判定整个模型的输出,比传统的投票法、平均法更为准确;作为一项应用,本发明对人员和车辆的识别准确率较高,分别达到99%和94%。
(2)本发明在进行分帧之前,对无人值守传感器设备获取的原始数据进行小波降噪:由于目标信号幅值相对较大,噪声幅值相对较小,因此首先对信号进行小波自适应阈值分析,小波变换能够在时、频两域上突出信号局部特征,小波变换具有:低熵性、去相关性、多分辨性以及选基灵活性。它对于高频成分采用逐渐精细的时频取样步长,能够突出对象的细节。基于信号和噪声在小波变换下表现出不同的性质,给出一种自适应阈值去噪算法,该方法根据噪声在小波变换下的特性,自适应确定小波阈值,将低于阈值的噪声采取软阈值的方法处理,并将去噪后信号的峰值信噪比作为性能衡量指标;采取小波自适应阈值降噪在不同环境、不同时间段可以自适应的获取噪声阈值,使得降噪效果更好。
(3)本发明为了减小计算量,使得微控制器也能进行GMM、xgboost的运算,对输入模型的数据量进行限制,因此采用提取信号特征的方法,具体为:采用固定时间间隔提取信号的峰峰值作为第一个时域特征以压缩数据量;采用固定时间间隔提取信号的峭度作为第二个时域特征以压缩数据量;对一帧数据计算该帧最大的n个点值的和sumi以及sumi跟前一帧最大的n个点值和sumi-1的比作为第三、四个时域特征;其中信号包含四个时域特征,同时使用四个时域特征可以获得较好的识别效果。
(4)本发明对信号进行连续识别,对于每一次GMM和xgboost给出的类别预测概率,采取阈值移动的方法,对概率大于预设值(如70%)才认定该模型预测结果为可信的,再将GMM、xgboost作出的两个预测结果进行综合判断。
(5)本发明已在带有FPU的普通单片机上实现,算法简单、方便、准确率高、能实时检测人员和车辆,并且可以很容易拓展到更多类型信号的识别上,方法具有很强的普适性,极具实用价值。
附图说明
图1是本发明的方法在实施例的流程图。
图2是本发明具体应用实例中人走路时原始信号的时域波形图。
图3是本发明在具体应用实例中车辆经过时原始信号的时域波形图。
图4是本发明在具体应用实例中小波自适应阈值降噪前后的对比图。
图5是本发明在具体应用实例中将训练好的模型用来预测测试集的样本得到的分类结果和每一个类别的概率图。
图6是本发明在具体应用实例中单个GMM模型测试集的分类指标的文本报告,包含各类别的精确度、召回率、F1值等信息,其中0代表环境噪声/无信号,1代表人员,2代表车辆。
图7是本发明在具体应用实例中单个xgboost模型测试集的分类指标的文本报告,包含各类别的精确度、召回率、F1值等信息,其中0代表环境噪声/无信号,1代表人员,2代表车辆。
图8是本发明在具体应用实例中GMM+xgboost组合模型测试集的分类指标的文本报告,包含各类别的精确度、召回率、F1值等信息,其中0代表环境噪声/无信号,1代表人员,2代表车辆。
具体实施方式
以下结合说明书附图和具体实施例对本发明作进一步描述。
如图1所示,本发明实施例的用于无人值守传感器系统的多类别目标识别方法,包括步骤:
S1、数据预处理:对无人值守传感器系统获取的原始数据进行降噪及分帧;其中原始数据包括行人或车辆等经过产生的地面震动而输出的模拟电压信号等;
S2、信号特征提取:同时提取分帧后数据的多个独立时域特征;
S3、机器学习模型训练:将步骤S2得到的多个独立时域特征作为训练样本,分别输入到高斯混合模型(简称GMM)、xgboost中训练,建立训练好的高斯混合模型和xgboost模型;
S4、信号识别:通过训练好的高斯混合模型对信号进行识别,得到第一识别结果;通过训练好的xgboost模型对信号进行识别,得到第二识别结果;
S5、综合判定:综合第一识别结果和第二识别结果,得到整个复合模型最后的识别结果。
本发明通过大量样本训练GMM、xgboost模型得到训练后的模型,模型识别具有普适性;只要目标信号的不同时域有差异,该方法就能获得比较好的识别性能;通过时域特征量的提取,减少了模型的输入数据,极大降低了运算过程的计算量,使得在计算资源有限的微处理器上也能实现神经网络计算,算法能部署到嵌入式系统中;通过两个模型结果的互相博弈综合判定整个模型的输出,比传统的投票法、平均法更为准确;作为一项应用,本发明对人员和车辆的识别准确率较高,分别达到99%和94%。
具体地,上述机器学习模块中,xgboost是boosting算法的其中一种。Boosting算法的思想是将许多弱分类器集成在一起形成一个强分类器。xgboost是一种提升树模型,它是将许多树模型集成在一起,形成一个很强的分类器。算法的基本思想与GBDT类似,不断地进行特征分裂来生长一棵树,每一轮学习一棵树,其实就是去拟合上一轮模型的预测值与实际值之间的残差。当训练完成得到k棵树时,预测一个样本的分数,其实就是根据这个样本的特征,在每棵树中会落到对应的一个叶子节点,每个叶子节点就对应一个分数,最后只需将每棵树对应的分数加起来就是该样本的预测值;
给定n个样本,m个特征的数据集D,xi为n个样本中的某一个样本,标签域R,yi为R中的某一类标签,D={(xi,yi)}(|D|=n,xi∈Rm,yi∈R),提升树模型采用K次迭代的结果作为输出结果。对于xi的预测结果表达式为:
其中Φ为抽象函数映射关系,F={f(x)=wq(x)}(q:Rm->T,w∈RT),表示提升树结构空间集,各个变量的含义如下:
q表示树的结构,可以将样本映射到相应的叶子节点;T表示提升树叶子节点数量;每个fk都对应独立的树结构。
GMM由于目标音频与震动信号特征在特征空间中都形成了特定的分布,所以可以用这种分布来描述目标的特性。高斯混合模型是用多个高斯分布的线性组合来近似模拟目标特征分布,将最有可能产生测试信号特征的音频与震动分布模型所对应的目标作为识别结果。高斯混合模型本质上是一种多维概率密度函数,可以用来表示震动信号特征矢量的概率密度函数。通过对特征矢量进行聚类,把每一类看作是一个多维高斯分布函数,然后求出每一类的均值、协方差矩阵和混合权重,将此作为目标的训练模板。
一个M阶混合高斯模型的概率密度函数是由M个高斯概率密度函数加权求和得到的,如下所示:
其中M是混合模型的阶数,X是一个D维随机向量,wi(i=1,2,...,M)是混合权重,且满足如下条件:
bi(X)(i=1,2,...,M)是子分布,每个子分布是D维的联合高斯概率分布,可表示为:
其中μi是均值向量,∑i是协方差矩阵。完整的高斯混合模型是由参数均值向量、协方差矩阵和混合权重三个参数来共同描述的。因此一个模型λ可以表示为如下一个三元组:
λ={wi,μi,∑i},i=1,2,...,M
式中协方差矩阵∑i可以取普通矩阵,也可以取对角矩阵。由于取对角矩阵计算简单,性能也很好,所以在本实施例中取对角矩阵的形式,即:
式(中为GMM第i个分量所对应的特征矢量的第k维分量的方差。
对于一个长度为T的振动信号时间序列X=(x1,x2,...,xT),它的GMM概率可以写作:
或者用对数表示:
根据贝叶斯定理在N个类别中得到的似然概率P最大的类别即为识别结果i*:
最后将观测序列X代入每个目标的模板,找到最大的后验概率,即对应所识别的目标。
在一具体实施例中,在步骤S2中,为了减小计算量,使得微控制器也能进行机器学习模型的运算,需要对输入机器学习模型的数据量进行限制,因此采用提取信号特征的方法来提取四段独立时域特征,具体为:
采用固定时间间隔提取信号的峰峰值作为第一个时域特征以压缩数据量;
采用固定时间间隔提取信号的峭度作为第二个时域特征以压缩数据量;
对于一帧数据,计算该帧最大的n个点值的和sumi作为第三个时域特征;
将sumi跟前一帧最大的n个点值和sumi-1的比作为第四个时域特征。
上述使用四个时域特征可以获得比使用单一特征更好的识别效果。当然,也可以根据实际情况选择两个、三个或者更多个时域特征。
其中上述第一个时域特征,峰峰值是指该信号在同一个时间点最大的值-最小的值,用峰峰值可以刻画出信号的波形,用峰峰值的效果显而易见的是,可以降低环境噪声带来的影响,峰峰值的计算:Xp-p=max{x(n)}-min{x(n)}式中,min{}表示求最小值函数。信号的峰值和峰峰值给出了信号幅值变化的范围,可以作为测试采集装置的量程和动态范围的依据。
其中上述第二个时域特征,峭度又称为峰度,在时域分析中可用峭度来检测震动信号是否服从高斯分布,其对震动信号中的冲击成分较为敏感,能够反映离散的震动信号概率质量函数的陡峭程度;
峭度的计算:
式中,E{}表示求数学期望,E{}2表示求数学期望的平方,μx为某一段信号x的均值,该信号x共有n个信号点,x(i)为某一时刻的信号点;
当Kx=3时,x是高斯信号;当Kx>3时,x是超高斯信号,其概率质量函数在信号均值附近较集中,形状比高斯分布陡峭;当Kx<3时,是亚高斯信号,其概率质量函数形状比高斯分布平缓。超高斯信号、亚高斯信号统称为非高斯信号。Kx是无量纲参数,对信号中的冲击成分较为敏感,冲击越强,往往越大。
上述提取时域特征可以采用固定时间间隔,间隔越宽,特征量越少,计算量越小,但识别性能也会下降,因此在间隔宽度和识别性能之间取得平衡。另外,针对功耗要求极其严格,处理能力很低的微处理器,甚至可以在牺牲少量性能的情况下,只采用时域特征来进一步降低计算量。
另外,信号采集频率原本是1000HZ,但是考虑到计算量,以及使信号更为平滑,将信号中相邻的点相加取平均变为500HZ。
在实现本发明的过程中也尝试过频域很多特征的提取,例如均方根、频率重心等等,但由于不同环境的底噪是不一样的,不同类别物体间的频率存在重叠部分,所以频域对于检测物体类别来说不太有效,于是上述提取的特征都是在时域,检测物体类别相对于频域来说更有效。
在步骤S3中,将峰峰值、峭度、每帧数据最大的n个点值的和sumi及其与前一帧最大的n个点值和sumi-1的比共四个时域特征合并组合,这四个特征量长度可以不同,合并组合之后分别输入至GMM模型和xgboost模型中进行训练;根据信号的类别,组合特征量确定标签,比如,0代表环境信号或无信号,1代表单人(或多人)走路或跑步,2代表车辆经过信号。
训练样本需要在不同环境和条件下采集,样本量尽可能大,以提高训练出来的模型的环境适应性。为此震动信号的数据在城市交通道路、河边、田野、公园、森林等工况环境下来采集,包括各种高低噪声、落雨、落石场景下的人的正常走路、跑步、车轮滚动等震动信号,提取不同典型场景震动信号的特征。另外对不同时域特征有差异的其它类别目标信号,也可以添加进样本进行训练,增加算法识别目标种类。在本实施例中,训练样本数量总数是27183,其中环境样本数为17564,人员走路跑步样本数为7926,车辆样本数为1693,测试样本数量是16984,其中环境样本数为10721,脚步样本数为5076,车辆样本数为1187,最终模型的测试准确率为人员99%,车辆94%。
如图5所示,在步骤S4中,将步骤S3得到的合并组合特征输入至GMM模型和xgboost模型中,对于每一次GMM模型和xgboost模型给出的类别预测概率,采取阈值移动的方法,对概率大于预设值(如70%)才认定该模型预测结果为可信的,再将GMM模型和xgboost模型作出的两个预测结果进行综合判断。
如图6~8所示,步骤S5的具体过程为:采取GMM、xgboost博弈的计分逻辑:
A.输出xgboost模型的预测结果
B.输出GMM模型的预测结果i*;
C.在第一次决策的时候,在两个模型中随机挑选一个模型的输出当作总的输出,并且对比真实标签yi,若xgboost模型正确且GMM不正确,则xgboost模型加1分,下一个预测的总输出由xgboost模型输出决定,反之亦然;若两个模型都预测正确或者错误,则不加分,下一轮的预测总输出由目前计分较多的一方决定。
在步骤S1中,具体根据系统微控制器处理能力和实时性要求,选取固定时间长度信号进行分帧,如可以选取2048ms、4096ms等时间长度以方便快速计算后续的时域特征。
进一步地,在进行分帧之前,对无人值守传感器系统获取的原始数据进行小波降噪,如图4所示:由于目标信号幅值相对较大,噪声幅值相对较小,因此首先对信号进行小波自适应阈值分析。其中小波变换能够在时域和频域两个域上突出信号局部特征,小波变换具有低熵性、去相关性、多分辨性以及选基灵活性。它对于高频成分采用逐渐精细的时频取样步长,能够突出对象的细节。由于信号和噪声在小波变换下表现出不同的性质,本发明给出了自适应阈值降噪算法,该方法根据噪声在小波变换下的特性,自适应确定小波阈值,将低于阈值的噪声采取软阈值的方法处理,并将降噪后信号的峰值信噪比作为性能衡量指标。
具体地,本实施例所提供的自适应阈值去噪的核心步骤用到了k-means聚类算法,其中k-means算法的步骤为:
a.从数据集D中随机选取k个元素,作为k个簇各自的中心c1,c2,...,ck分别计算剩余的元素到k个中心的距离,将这些元素划分至各自距离最小的中心点的簇,得到簇K1,K2,...,Kk;
b.根据聚类结果,重新计算k个簇各自的中心c1',c2',...,ck';
c.将D中的全部元素按照新的中心重新聚类;
d.重复步骤b、c,直到每个簇的中心基本不再变化;
e.将结果输出,得到每一簇的中心点ci,和每一簇的数据Ki,i=1,2,...,k。
基于上述的k-means聚类算法,具体的自适应阈值降噪过程则是:
A.利用k-means算法先聚类得到k1簇,k1须为偶数,由此得到每一簇数据的上下界,统一取每一簇数据的上界u1,u2,...,uk1;
B.然后取出这k1个上界中绝对值最小的两个上界umin1、umin2,这两个值必然为一正一负,再取其中正值,假设为umin2;
C.此时得到的umin2虽然也可以作为阈值,但还不够精准,须以此进一步划分,于是对以umin2为上界的簇重新聚类得到k2个簇;
D.重复A、B两步,取绝对值最小的两个上界中的正值作为最终的阈值th;
紧接着,使用小波分析按照上一步中得出的阈值th对信号进行去噪,过程描述如下:
假设含噪信号用数学模型表示为:
y=x+n
其中,y为含噪声数据(观测数据),由真实信号x和噪声n组成。此式为向量表示,每个向量对应的分量分别是yi,xi和ni,i=1,2,...,N。噪声信号n满足:服从正态分布、不相关且方差为常量的条件。去噪的实质就是根据观测数据y对x进行估计。去噪过程的3个步骤可以描述为:
其中,W和W-1分别为小波变换和小波逆变换运算,u是含噪信号的小波系数,是去噪后的小波系数,th是阈值,D为非线性去噪运算。
上述自适应阈值方法与小波分析结合弥补了小波分析需要指定固定的阈值的不足,即便不同工况都能保证较好的去噪效果。
经过第一个阶段的小波包分析降噪,得到观测信号的估计值然后再对信号进行分帧。考虑到芯片的性能以及检测需要的实时性,采取的是n1s的时间窗口对降噪后的估计值/>进行分帧,而且为了进一步提高信噪比,在每个n1s帧前又多取n2s以作为参考段,该n1s作为检测段。在具体计算该(n1+n2)s信号的时候,再次对(n1+n2)s的信号进行分帧;
以x1个点为一个时间窗口,x2个点为滑动步长,于是得到h维的峰峰值特征F_ppvi=[p1,p2,..,ph];
同样的道理,对(n1+n2)s的窗口信号,以x3个点为一个时间窗口,x4个点为滑动步长,进行分帧得到w维的峭度特征F_kurtosisi=[k1,k2,...,kw]、每帧最大n个数据的和Sumi及其与前一段最大n个数和的比值特征ratei=Sumi/Sumi-1;
将这四个特征向量拼接起来得到h+w维的组合特征X=[F_ppvi;F_kurtosisi;Sumi;ratei];然后往后移动n3s进行下一段(n1+n2)s的信号特征提取,重复上述特征提取过程。
本发明已在带有FPU的普通单片机上实现,算法简单、方便、准确率高、能实时检测人员和车辆,并且可以很容易拓展到更多类型信号的识别上,方法具有很强的普适性,极具实用价值。
本发明还公开了一种用于无人值守传感器系统的多类别目标识别系统,包括:
数据预处理模块,对无人值守传感器系统获取的原始数据进行降噪及分帧;
信号特征提取模块,用于同时提取分帧后数据的多个独立时域特征;
机器学习模型训练模块,用于将信号特征提取模块得到的多个独立时域特征作为训练样本,分别输入到高斯混合模型(简称GMM)、xgboost中训练,建立训练好的高斯混合模型和xgboost模型;
信号识别模块,用于通过训练好的高斯混合模型对信号进行识别,得到第一识别结果;通过训练好的xgboost模型对信号进行识别,得到第二识别结果;
综合判定模块:综合第一识别结果和第二识别结果,得到整个复合模型最后的识别结果。
本发明的用于无人值守传感器系统的多类别目标识别系统,与上述的目标识别方法相对应,同样具有如上识别方法所述的优点。
本发明还公开了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在被处理器运行时执行如上所述方法的步骤。本发明进一步公开了一种计算机设备,包括存储器和处理器,所述存储器上存储有计算机程序,所述计算机程序在被处理器运行时执行如上所述方法的步骤。本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一个计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述方法实施例的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。存储器用于存储计算机程序和/或模块,处理器通过运行或执行存储在存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现各种功能。存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其它易失性固态存储器件等。
以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。
Claims (6)
1.一种用于无人值守传感器系统的多类别目标识别方法,其特征在于,包括步骤:
S1、预处理:对无人值守传感器系统获取的原始数据进行降噪及分帧;
S2、特征提取:同时提取分帧后数据的多个时域特征;
S3、模型训练:将步骤S2得到的多个时域特征作为训练样本,分别对高斯混合模型和xgboost模型进行训练,得到训练好的高斯混合模型和xgboost模型;
S4、信号识别:通过训练好的高斯混合模型对信号进行识别,得到第一识别结果;通过训练好的xgboost模型对信号进行识别,得到第二识别结果;
S5、综合判定:综合第一识别结果和第二识别结果,输出最终识别结果;
步骤S5的具体过程为:
采取高斯混合模型和xgboost模型博弈的计分逻辑:在第一次决策的时候,在两个模型中随机挑选一个模型的输出当作总的输出,并且对比真实标签yi,若xgboost模型正确且GMM不正确,则xgboost模型加1分,下一个预测的总输出由xgboost模型输出决定,反之亦然;若两个模型都预测正确或者错误,则不加分,下一轮的预测总输出由目前计分较多的一方决定;
在步骤S1中,在对无人值守传感器系统获取的原始数据进行分帧之前,先对原始数据进行自适应阈值降噪:根据噪声在小波变换下的特性,自适应确定小波阈值,将低于阈值的噪声采取软阈值的方法处理,并将降噪后信号的峰值信噪比作为性能衡量指标;
在对原始数据进行分帧时,采取n1s的时间窗口对降噪后的估计值进行分帧,并在每个n1s帧前又多取n2s以作为参考段,在具体计算该(n1+n2)s信号的时候,再次对(n1+n2)s的信号进行分帧;
在步骤S2中,通过采用提取信号特征的方法来提取四个时域特征,具体为:
采用固定时间间隔提取分帧后数据的峰峰值作为第一个时域特征;
采用固定时间间隔提取分帧后数据的峭度作为第二个时域特征;
计算每帧数据最大的n个点值的和sumi作为第三个时域特征;
将sumi与前一帧最大的n个点值和sumi-1的比作为第四个时域特征。
2.根据权利要求1所述的用于无人值守传感器系统的多类别目标识别方法,其特征在于,四个时域特征的提取过程为:以x1个点为一个时间窗口,x2个点为滑动步长,于是得到h维的峰峰值特征F_ppvi=[p1,p2,..,ph];
对(n1+n2)s的窗口信号,以x3个点为一个时间窗口,x4个点为滑动步长,进行分帧得到w维的峭度特征F_kurtosisi=[k1,k2,...,kw]、每帧数据最大的n个点值的和sumi及其与前一帧最大的n个点值和sumi-1的比值特征ratei=Sumi/Sumi-1。
3.根据权利要求1~2中任意一项所述的用于无人值守传感器系统的多类别目标识别方法,其特征在于,在步骤S4中,对于每一次GMM模型和xgboost模型给出的类别预测概率,采取阈值移动的方法,对概率大于预设值的才认定识别结果为可信的。
4.一种用于无人值守传感器系统的多类别目标识别系统,用于执行如权利要求1~3中任意一项所述的用于无人值守传感器系统的多类别目标识别方法的步骤,其特征在于,包括:
预处理模块,用于对无人值守传感器系统获取的原始数据进行降噪及分帧;
特征提取模块,用于同时提取分帧后数据的多个时域特征;
模型训练模块,用于将得到的多个时域特征作为训练样本,分别对高斯混合模型和xgboost模型进行训练,得到训练好的高斯混合模型和xgboost模型;
信号识别模块,用于通过训练好的高斯混合模型对信号进行识别,得到第一识别结果;通过训练好的xgboost模型对信号进行识别,得到第二识别结果;
综合判定模块,用于综合第一识别结果和第二识别结果,输出最终识别结果。
5.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序在被处理器运行时执行如权利要求1~3中任意一项所述的用于无人值守传感器系统的多类别目标识别方法的步骤。
6.一种计算机终端,包括存储器和处理器,所述存储器上存储有计算机程序,其特征在于,所述计算机程序在被处理器运行时执行如权利要求1~3中任意一项所述的用于无人值守传感器系统的多类别目标识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210191601.XA CN114626412B (zh) | 2022-02-28 | 2022-02-28 | 用于无人值守传感器系统的多类别目标识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210191601.XA CN114626412B (zh) | 2022-02-28 | 2022-02-28 | 用于无人值守传感器系统的多类别目标识别方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114626412A CN114626412A (zh) | 2022-06-14 |
CN114626412B true CN114626412B (zh) | 2024-04-02 |
Family
ID=81899398
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210191601.XA Active CN114626412B (zh) | 2022-02-28 | 2022-02-28 | 用于无人值守传感器系统的多类别目标识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114626412B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116070174A (zh) * | 2023-03-23 | 2023-05-05 | 长沙融创智胜电子科技有限公司 | 一种多类别目标识别方法及系统 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102799899A (zh) * | 2012-06-29 | 2012-11-28 | 北京理工大学 | 基于svm和gmm的特定音频事件分层泛化识别方法 |
WO2018227780A1 (zh) * | 2017-06-12 | 2018-12-20 | 平安科技(深圳)有限公司 | 语音识别方法、装置、计算机设备及存储介质 |
CN109450834A (zh) * | 2018-10-30 | 2019-03-08 | 北京航空航天大学 | 基于多特征关联和贝叶斯网络的通信信号分类识别方法 |
CN110693489A (zh) * | 2019-10-28 | 2020-01-17 | 杭州电子科技大学 | 一种基于多分类器强化学习的心肌梗塞检测方法 |
CN110853324A (zh) * | 2019-11-21 | 2020-02-28 | 长沙融创智胜电子科技有限公司 | 一种基于激光和射频组合方式的敌我识别装置 |
WO2020177371A1 (zh) * | 2019-03-06 | 2020-09-10 | 哈尔滨工业大学(深圳) | 一种用于数字助听器的环境自适应神经网络降噪方法、系统及存储介质 |
CN111709371A (zh) * | 2020-06-17 | 2020-09-25 | 腾讯科技(深圳)有限公司 | 基于人工智能的分类方法、装置、服务器和存储介质 |
CN113111831A (zh) * | 2021-04-23 | 2021-07-13 | 浙江工业大学 | 一种基于多模态信息融合的手势识别技术 |
CN113283331A (zh) * | 2021-05-20 | 2021-08-20 | 长沙融创智胜电子科技有限公司 | 用于无人值守传感器系统的多类别目标识别方法及系统 |
WO2021190296A1 (zh) * | 2020-03-27 | 2021-09-30 | 华为技术有限公司 | 一种动态手势识别方法及设备 |
-
2022
- 2022-02-28 CN CN202210191601.XA patent/CN114626412B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102799899A (zh) * | 2012-06-29 | 2012-11-28 | 北京理工大学 | 基于svm和gmm的特定音频事件分层泛化识别方法 |
WO2018227780A1 (zh) * | 2017-06-12 | 2018-12-20 | 平安科技(深圳)有限公司 | 语音识别方法、装置、计算机设备及存储介质 |
CN109450834A (zh) * | 2018-10-30 | 2019-03-08 | 北京航空航天大学 | 基于多特征关联和贝叶斯网络的通信信号分类识别方法 |
WO2020177371A1 (zh) * | 2019-03-06 | 2020-09-10 | 哈尔滨工业大学(深圳) | 一种用于数字助听器的环境自适应神经网络降噪方法、系统及存储介质 |
CN110693489A (zh) * | 2019-10-28 | 2020-01-17 | 杭州电子科技大学 | 一种基于多分类器强化学习的心肌梗塞检测方法 |
CN110853324A (zh) * | 2019-11-21 | 2020-02-28 | 长沙融创智胜电子科技有限公司 | 一种基于激光和射频组合方式的敌我识别装置 |
WO2021190296A1 (zh) * | 2020-03-27 | 2021-09-30 | 华为技术有限公司 | 一种动态手势识别方法及设备 |
CN111709371A (zh) * | 2020-06-17 | 2020-09-25 | 腾讯科技(深圳)有限公司 | 基于人工智能的分类方法、装置、服务器和存储介质 |
CN113111831A (zh) * | 2021-04-23 | 2021-07-13 | 浙江工业大学 | 一种基于多模态信息融合的手势识别技术 |
CN113283331A (zh) * | 2021-05-20 | 2021-08-20 | 长沙融创智胜电子科技有限公司 | 用于无人值守传感器系统的多类别目标识别方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN114626412A (zh) | 2022-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103020978B (zh) | 结合多阈值分割与模糊聚类的sar图像变化检测方法 | |
CN112734775A (zh) | 图像标注、图像语义分割、模型训练方法及装置 | |
CN109410184B (zh) | 基于稠密对抗网络半监督学习的直播色情图像检测方法 | |
CN108021908B (zh) | 人脸年龄段识别方法及装置、计算机装置及可读存储介质 | |
CN105718889A (zh) | 基于GB(2D)2PCANet深度卷积模型的人脸身份识别方法 | |
CN113223536B (zh) | 声纹识别方法、装置及终端设备 | |
CN111144566B (zh) | 神经网络权重参数的训练方法、特征分类方法及对应装置 | |
CN113488060B (zh) | 一种基于变分信息瓶颈的声纹识别方法及系统 | |
CN106022254A (zh) | 图像识别技术 | |
CN106056523B (zh) | 数字图像拼接篡改盲检测方法 | |
CN113436646B (zh) | 一种采用联合特征与随机森林的伪装语音检测方法 | |
CN103474072A (zh) | 利用纹理特征与随机森林的快速抗噪鸟鸣声识别方法 | |
CN114626412B (zh) | 用于无人值守传感器系统的多类别目标识别方法及系统 | |
CN113283331A (zh) | 用于无人值守传感器系统的多类别目标识别方法及系统 | |
CN110458219B (zh) | 一种基于stft-cnn-rvfl的φ-otdr振动信号识别算法 | |
CN112560881B (zh) | 对象识别方法和装置、数据处理方法 | |
CN110808067A (zh) | 基于二值多频带能量分布的低信噪比声音事件检测方法 | |
US7113636B2 (en) | Method and computer program product for generating training data for a new class in a pattern recognition classifier | |
CN108986083A (zh) | 基于阈值优化的sar图像变化检测方法 | |
CN102789780B (zh) | 基于谱时幅度分级向量辨识环境声音事件的方法 | |
Cope et al. | Classifying plant leaves from their margins using dynamic time warping | |
CN116430317A (zh) | 一种辐射源调制样式与个体识别方法及系统 | |
CN116246303A (zh) | 用于模型跨域训练的样本构建方法、装置、设备及介质 | |
Li et al. | Animal sound recognition based on double feature of spectrogram | |
US20040042665A1 (en) | Method and computer program product for automatically establishing a classifiction system architecture |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CB03 | Change of inventor or designer information |
Inventor after: Xu Yan Inventor after: Zhou Chunlei Inventor after: Dong Zhi Inventor before: Dong Zhi Inventor before: Xu Yan Inventor before: Zhou Chunlei |
|
CB03 | Change of inventor or designer information |