CN104156963B - 一种电气火灾熔痕物证的自动鉴定方法 - Google Patents
一种电气火灾熔痕物证的自动鉴定方法 Download PDFInfo
- Publication number
- CN104156963B CN104156963B CN201410395742.9A CN201410395742A CN104156963B CN 104156963 B CN104156963 B CN 104156963B CN 201410395742 A CN201410395742 A CN 201410395742A CN 104156963 B CN104156963 B CN 104156963B
- Authority
- CN
- China
- Prior art keywords
- image
- value
- gray
- function
- decision boundary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Abstract
本发明公开了一种电气火灾熔痕物证的自动鉴定方法,包括以下步骤:1)金相图片预处理;2)图像特征提取;3)图像判定和识别。本发明基于支持向量机的电气火灾物证的金相图片识别和判断,确定电气火灾熔痕的性质,为火灾调查提供科学而有效的调查信息,避免了传统的人为经验的判断,可以使以后的火灾熔痕判断更加客观有效地进行。
Description
技术领域
本发明涉及火灾科学的电气火灾物证鉴定的技术领域,尤其是指一种电气火灾熔痕物证的自动鉴定方法。
背景技术
火灾是一个非常复杂的物理化学过程,是一种由失控燃烧造成的灾害,往往造成巨大的经济财产损失和人员伤亡。根据世界火灾统计中心以及欧洲共同体的研究结果显示,近年来,发达国家每年火灾直接损失占国民生产总值的0.2%左右,而整个火灾成本(包括火灾造成的直接与间接经济损失、人员伤亡损失、消防费用、保险管理费用以及投入的灾害防护费用)约占国民经济总值的1%左右,人员死亡率在十万分之二左右,同时,火灾还对环境和生态系统造成不同程度破坏,给社会带来不安定因素。世界火灾统计中心对中国、印度、美国、俄罗斯、日本、德国、英国、法国、澳大利亚、爱尔兰等十国在九十年代中期的火灾状况进行统计后发现,这十个国家每年发生火灾的次数约占世界火灾总数的58%,每年火灾死亡人数约占世界事故死亡总人数的63%;在中国,近几年随着经济的高速增长,火灾形势也越来越严峻。
电能在现代社会中扮演着重要的角色,作为日常生活和生产的重要能源为人类服务的同时,由于受多种因素的影响,不断造成重大电气火灾事故,已备受社会关注。经公安机关大量调查表明,当前我国电气火灾在火灾原因和火灾直接经济损失方面都排在各类火灾的首位,1993至2007的十五年间,全国共发生火灾152.76万起,其中电气火灾37.37万起,平均占火灾总数的24.5%,火灾财产损失1681566.4万元,其电气火灾的财产损失626276.7万元,平均占火灾损失的37.2%。从以上的统计数据看出,电气火灾已成为影响我国社会消防安全的主要火灾类别,其主要特征为:灾害频发、损失巨大,造成电气火灾的主要原因是短路、过热、接触不良、过负载、漏电,所占比例高达89.5%,其中,短路是引发重大电气火灾最主要的故障形式,百分比高达50%。
火灾物证鉴定是火灾调查工作的“重要基础”,为事故起火原因调查提供最为直接的证据,贯穿着火灾事故调查、分析的全过程,是火灾科学研究问题最为耀眼的“明珠”之一。对电气火灾原因和物证进行科学、完整的分析,查清电气火灾的起因,对于确定火灾责任归属,解决事故矛盾和纠纷,减少和防止火灾的再发,都有十分重要的意义。电气火灾现场残存的痕迹中,由电气原因直接产生的残留物中,常见的的熔痕分为一次短路熔痕(PSM)和二次短路熔痕(SMM),一次短路熔痕是指火灾之前由于电气短路形成的熔痕,二次短路熔痕则指在火灾环境中,由于火烧破坏绝缘层而发生短路形成的熔痕,如何鉴别和判定短路熔痕的性质对分析火灾的原因和火灾事故认定至关重要。
通常情况下,依据火灾现场各种金属熔化痕迹的形态和外观特性,初步判定火灾是由短路造成或其他原因引起,进一步判定断定短路火灾是人为引起或是电路故障引起,这些均要基于PSM和SSM的判定,但由于PSM与SMM在外观上没有明显差别,只有根据二者形成的外界火灾环境不同,将会在形成的熔痕内部留下可以区别的显微特征,采用光学金相显微镜(LEICA,DMI5000M)的金相分析法,在一定程度上,可以鉴别简单的PSM和SMM。当前,我国对短路熔痕金相分析方法进行研究并形成相关国家标准《电气火灾原因技术鉴定方法第4部分:金相法》(GB16840.4-1997)其中规定了火烧熔痕、PSM、SMM之间的金相显微组织的区别。但实际的电气火灾案例物证鉴定工作表明,常用的火灾物证鉴定方法和技术标准难以对所有物证鉴定材料给出确定的鉴定结论,尤其对于一次短路熔痕和二次短路熔痕之间的“灰色区域”更加难以客观地给出明确结论。另外,由于相关标准中缺少对照的标准图谱,目前国内隶属公安部的四大火灾物证鉴定中心均是依据多年积累的人为工作经验开展工作,即采用经验或是半经经方式进行物证鉴定工作,其鉴定结论多采用描述性语句,在不同类别金相组织进行分析判断时,没有一个量化的统一标准,存在对同一幅金相图片,不同的鉴定人员可能得出不同的结论,甚至同一幅金相图片,同一个人在不同的时间会做出不同的判断。这种传统的方法主要靠人的肉眼观察金相图片和个人经验对金相显微组织进行判断分类,在一定程度上缺乏客观性和通用性,容易出现误判。所以迫切需要形成客观且通用的火灾物证鉴定的判断系统或方法。
真实火灾调查中,电气火灾物证的鉴定一般过程是:将火灾现场提取的火灾鉴定物证:包括金属熔痕、导线等火灾物证,放入圆形模具中央,将牙脱粉和水按照1:2的比例混合成混合物,倒进模具中,等待大约30分钟,混合物凝固成固体,将凝固好的样品从模具中取出,在研磨机(YMP-2)上粗磨和细磨,将金属熔痕打磨出一个切面,一般是纵切面,再在抛光机(PG-2)上陪上煤油和钻石膏,将切面上的研磨痕抛光干净,再用1:20的氯化铁溶液进行腐蚀,使熔痕的晶粒结构呈现出来,在金相显微镜(Leica S8AP0和Leica DMI5000)下,分别50倍、100倍、200倍下分别拍摄熔痕切面不同区域晶粒结构的金相图片,火灾调查人员和物证鉴定人员根据金相图片判断出火灾现场不同部位的熔痕性质,是属于一次短路熔痕还是二次短路熔痕。
基于本火灾物证鉴定中心至今积累的800多起电气火灾案件中3000张物证和相应金相图片,和随着时间在不断增加的案件资源,且由于现在的电气火灾物证鉴定对物证的判断,均是由人为经验的判断,存在很大的主观性和不确定性,故通过支持向量机的分类系统,可以使以后的火灾熔痕判断更加客观有效进行。
发明内容
本发明的目的在于克服现有技术的不足与缺陷,提供一种科学、可靠的电气火灾熔痕物证的自动鉴定方法。
为实现上述目的,本发明所提供的技术方案为:一种电气火灾熔痕物证的自动鉴定方法,包括以下步骤:
1)金相图片预处理
1.1)图像灰度化
彩色图像中每个像素点由R、G、B三个分量决定,每个分量有255个值,这样一个像素点有255×255×255个值可选,而灰度图是R、G、B三个分量是相同值的一种特殊彩色图片,所以每个像素点的可选值是255个;
根据YUV的颜色空间,Y分量的物理意义是点的亮度,由该值反映亮度等级,根据RGB和YUV颜色空间的变化关系可建立亮度Y与R、G、B三个颜色分量的对应:Y=0.3R+0.59G+0.11B,最后以这个亮度值表达图像的灰度值;
1.2)图像的直方图处理
对于一幅灰度图像,在[0,Y]内总共有L个灰度级,Zi是区间[0,Y]内的第i级亮度的灰度值,ni表示灰度为Zi的图像中的像素数,n是图像中所有的像素总数,这样图像中灰度为Zi的像素出现概率是这个式子表达某亮度其灰度级为Zi出现的频数,P实际上是一个数字图像的直方图,将灰度级归一化到[0,1]的离散量;
1.3)直方图的均衡化
通过扩展输入图像的灰度级到较宽亮度范围的方式来实现图像增强,若Pr(r)表示原图像的PDF,用Ps(s)表示均衡化后图像的PDF,r,s分别表示均衡变化前后的灰度值,r,s属于[0,1],根据概率知识:公式中T-1(S)代表T(r)的逆变换函数,因为要求的概率密度为1,即因此:进一步得出:ds=pr(r)·dr,等式两边对r积分,即可得到PDF的均衡化公式:公式中T(r)代表r的灰度变换函数,∫表示积分,w为假设变量,对于离散型灰度级可以表示为:
图像经过直方图归一处理后,直方图的各值是图像取各灰度级的概率,对于离散的灰度级,其均衡化变换后图像中的亮度值为:
1.4)顶帽变换
从原有的图像中减去开运算后的图像;
2)图像特征提取
包括均值,即平均亮度的度量;标准偏差,即平均对比度的度量;平滑度,即区域中亮度的相对平滑度度量;三阶矩,即度量直方图的倾斜;一致性,即度量一致性,当所有灰度值相等时,该度量值最大且从此处开始减小;熵,即随机性的度量;HOG描述子,即计算局部图像梯度的方向信息的统计值;
3)图像判定和识别
3.1)在提取金相图片的相关特征后,组成一个有标识的训练样本集,{(Xi,yi)|Xi∈Rn,yi∈{-1,1},i=1,...,N},其中Xi=(xi1,xi2,…,xi9)对应第i个样本的属性集,也就是特征集,yi是它的标识号,其值不是-1就是1,这样就是一个包含N个训练样本的二元分类;
3.2)低维度到高维度的转化
基于低维度线性不可分,将低维度转化到高维度,从而实现决策边界在新高维空间是线性,选择多项式核函数K(x,y)=(x·y+1)p,设g(x)是一个具有有限L2范数的函数,即∫g(x)2dx<∞,则:
积分结果非负,因此所选核函数满足Mercer定理;
Mercer原理确保核函数在低维空间中的计算可以用高维空间中两个向量的点积表示,又由于核函数是原属性空间中的相似度函数,故存在:K(x,y)=Φ(x)·Φ(y)=(x·y+1)p,将原来的特征空间映射到一个新的高维空间,其属性集成为Φ(x),决策边界在这个空间为线性;
3.3)假设决策边界函数
在高维空间内,假设一个线性决策边界函数可以表达为:f(x)=W·Φ(x)+b,其中,W和b是模型的参数,且任何位于决策边界上的样本都必须满足W·Φ(x)+b=0;
3.4)定义决策边界边缘
考虑那些距离决策边界最近的数据,某些位于决策边界一边的数据,则存在关系:w·Xs+b≥0,位于决策边界另一边的数据,满足关系:w·Xx+b≤0,调整W和b,两个平行的超平面bi1和bi2可以表示为:
bi1:w·X+b=1
bi2:w·X+b=-1
决策边界的边缘由这两个超平面之间的距离给出,令X1是bi1上的一个数据点,X2是bi2上的一个数据点,分别带入上两式,两式再相减得:
w·(X1-X2)=2,令X1-X2=d,所以:
3.5)估算参数W和b,确定决策边界
在高维可分情况下,依据已有训练集和决策边界边缘的定义,估算边界函数的参数W和b,选择的参数必须满足下面的两个条件:
如果yi=1,则w·Xi+b≥1,
如果yi=-1,则w·Xi+b≤-1,
将两个不等式概括为:yi(w·Xi+b)≥1,i=1,2,…,N,
要求决策边界的边缘必须是最大的条件下,最大,等价为求目标函数:的最小值,也就是进一步概括等价形式为:且受限于yi(w·Xi+b)≥1,i=1,2,…,N,这是一个凸优化问题,通过拉格朗日乘子的方法进行求解:在考虑加在解上面的约束,将目标函数改写为拉格朗日函数:其中,ηi是拉格朗日乘子,拉格朗日函数将目标函数和不等式约束进行组合,将问题变为求解不违反不等式约束条件的可行解,按照一般求函数最小值的办法,拉格朗日函数对w和b求导后等于0,得到w和b的值:
由于ηi拉格朗日乘子未知,等式个数少于未知数个数,无法求解,所以为了求出w和b的值,将上面的不等式约束变换为等式约束,这种变换在KKT条件下成立,KKT条件:
ηi≥0
ηi[yi(w·xi+b)-1]=0
将拉格朗日函数变换成仅包含拉格朗日乘子的函数,变换如下:
将代入
得:
在这个拉格朗日对偶函数中,只有拉格朗日乘子和训练集数据,避开了w和b,使未知量减少,同时,原来求拉格朗日函数的最小值,在此刻由于第二项是个负号,所以变为求对偶函数的最大化问题,然后在运用大量的数据集,找到一组拉格朗日乘子ηi,再代入和ηi[yi(w·xi+b)-1]=0分别求出w和b的可行解,在对所有的b值进行平均作为最后的值,此时决策边界确定,可表示为:
3.6)当检测实例Z时,可应用分类模型:
进行,f(z)=1是一次短路熔痕,若f(z)=-1则是二次短路熔痕;
3.7)组合分类模型,提升分类准确率
所有金相图片根据鉴定结果已知是一次短路和二次短路,故构成有标识的训练集,基于均匀概率分布原理,在训练集中重复抽取样本数据,组成自主样本集,也就是形成子训练集Di,i=k,k是根据训练精度决定的一个整数,在Di上训练分类模型Ci:W·Φ(x)+b=0,这样可以得到k个基分类模型,通过对k个基分类模型所做的预测结果,使用多数表决来分类,由于y的值不是-1就是1,可以对y的预测值求和,然后由结果的符号决定,即:
在步骤1.1)中,灰度化后的图像统一转化为double类型,并将图像改变尺寸至相同大小。
在步骤2)中,均值,即平均亮度的度量,其提取如下:
若zi是表示一幅图像的灰度的一个离散随机变量,令p(zi),i=0,1,2,…,L-1是相应的归一化直方图,L是亮度值的数目,直方图分量是灰度值zi出现的概率的一个统计,描述直方图分布形状的一种主要方法是通过中心矩,其定义为:其中,n是矩的阶,m是均值,计算方法为:作为第一个提取特征X1;
标准偏差,即平均对比度的度量,其提取如下:
由于假设直方图已归一化,所有分量之和为1,所以基于公式:可得,μ0=1和μ1=0,所以是二阶矩,是方差,故作为第二个提取特征X2;
平滑度,其提取如下:
对于常亮区域,R=0;对于灰度级的值有较大偏移的区域,R=1;
方差σ2(z)=μ2(z),其中,L是亮度值的数目,作为第三个提取特征X3;
三阶矩,其提取如下:
若直方图对称的,则度量为0,若度量为正值,则直方图向右偏斜,若度量为负值,则直方图向向左偏斜,计算式:与以上三个特征保持一致,将三阶矩数值归一化,使结果的数值范围在区间[0,1]之内,作为第四个提取特征X4;
一致性,其提取如下:
图像的边缘信息比较复杂,有效的图像边缘具有以下的特征:灰度突出,不同区域的边界以及方向一致,一致性衡量的是图像边缘领域差异程度的量,当所有灰度相等时,该度量最大并以此开始减小;令p(zi),i=0,1,2,…,L-1为对应的直方图,其中L是可区分的灰度级数目,则一致性U定义为作为第五个提取特征X5;
熵,其提取如下:
信息熵用来描述随机变量的不确定程度,图像熵是图像灰度级集合的比特平均数,也描述了图像信源的平均信息量,数字图像由像素点组成,不同亮度的像素在图像中占据不同区域,图像熵反映了图像的相似性,相似的图像熵也接近,图像熵同时还反映了图像的总体概貌,则图像熵e定义为:作为第六个提取特征X6;
HOG描述子,其提取如下:
HOG,即梯度方向直方图,是具有良好的检测性能的一种局域描述子,通过计算局域区域上的梯度方向直方图来构成图片特征,HOG是在被称为Cell和Block的网格内进行密集计算得到,Cell由若干像素点构成,而Block则由若干相邻的Cell组成;
具体计算过程:将规范化大小的图片作为输入,通过梯度算子计算水平和垂直方向上的梯度;再以各像素点的梯度幅度为权重,统计各Cell的梯度方向加权直方图,得到Cell的HOGs(Cell-HOGs);进一步对同一个Block内的HOGs进行归一化处理,消除光照带入的影响,得到Block的HOGs(Block-HOGs);将图片中所有Block-HOGs串在一起构成图片的特征X7。
本发明与现有技术相比,具有如下优点与有益效果:
基于支持向量机的电气火灾物证的金相图片识别和判断,确定电气火灾熔痕的性质,为火灾调查提供科学而有效的调查信息,避免了传统的人为经验的判断,可以使以后的火灾熔痕判断更加客观有效地进行。
附图说明
图1为实施例中本发明所述方法的流程图。
具体实施方式
下面结合具体实施例对本发明作进一步说明。
本实施例所述的电气火灾熔痕物证的自动鉴定方法,包括以下步骤:
1)金相图片预处理
1.1)图像灰度化
彩色图像中每个像素点由R、G、B三个分量决定,每个分量有255个值,这样一个像素点有255×255×255个值可选,而灰度图是R、G、B三个分量是相同值的一种特殊彩色图片,所以每个像素点的可选值是255个;
根据YUV的颜色空间,Y分量的物理意义是点的亮度,由该值反映亮度等级,根据RGB和YUV颜色空间的变化关系可建立亮度Y与R、G、B三个颜色分量的对应:Y=0.3R+0.59G+0.11B,最后以这个亮度值表达图像的灰度值;
1.2)图像的直方图处理
对于一幅灰度图像,在[0,Y]内总共有L个灰度级,Zi是区间[0,Y]内的第i级亮度的灰度值,ni表示灰度为Zi的图像中的像素数,n是图像中所有的像素总数,这样图像中灰度为Zi的像素出现概率是这个式子表达某亮度其灰度级为Zi出现的频数,P实际上是一个数字图像的直方图,将灰度级归一化到[0,1]的离散量;
1.3)直方图的均衡化
通过扩展输入图像的灰度级到较宽亮度范围的方式来实现图像增强,若Pr(r)表示原图像的PDF,用Ps(s)表示均衡化后图像的PDF,r,s分别表示均衡变化前后的灰度值,r,s属于[0,1],根据概率知识:公式中T-1(S)代表T(r)的逆变换函数,因为要求的概率密度为1,即因此:进一步得出:ds=pr(r)·dr,等式两边对r积分,即可得到PDF的均衡化公式:公式中T(r)代表r的灰度变换函数,∫表示积分,w为假设变量,对于离散型灰度级可以表示为:
图像经过直方图归一处理后,直方图的各值是图像取各灰度级的概率,对于离散的灰度级,其均衡化变换后图像中的亮度值为:
1.4)顶帽变换
从原有的图像中减去开运算后的图像。
2)图像特征提取
包括均值,即平均亮度的度量;标准偏差,即平均对比度的度量;平滑度,即区域中亮度的相对平滑度度量;三阶矩,即度量直方图的倾斜;一致性,即度量一致性,当所有灰度值相等时,该度量值最大且从此处开始减小;熵,即随机性的度量;HOG描述子,即计算局部图像梯度的方向信息的统计值;其中,
均值,即平均亮度的度量,其提取如下:
若zi是表示一幅图像的灰度的一个离散随机变量,令p(zi),i=0,1,2,…,L-1是相应的归一化直方图,L是亮度值的数目,直方图分量是灰度值zi出现的概率的一个统计,描述直方图分布形状的一种主要方法是通过中心矩,其定义为:其中,n是矩的阶,m是均值,计算方法为:作为第一个提取特征X1;
标准偏差,即平均对比度的度量,其提取如下:
由于假设直方图已归一化,所有分量之和为1,所以基于公式:可得,μ0=1和μ1=0,所以是二阶矩,是方差,故作为第二个提取特征X2;
平滑度,其提取如下:
对于常亮区域,R=0;对于灰度级的值有较大偏移的区域,R=1;
方差σ2(z)=μ2(z),其中,L是亮度值的数目,作为第三个提取特征X3;
三阶矩,其提取如下:
若直方图对称的,则度量为0,若度量为正值,则直方图向右偏斜,若度量为负值,则直方图向向左偏斜,计算式:与以上三个特征保持一致,将三阶矩数值归一化,使结果的数值范围在区间[0,1]之内,作为第四个提取特征X4;
一致性,其提取如下:
图像的边缘信息比较复杂,有效的图像边缘具有以下的特征:灰度突出,不同区域的边界以及方向一致,一致性衡量的是图像边缘领域差异程度的量,当所有灰度相等时,该度量最大并以此开始减小;令p(zi),i=0,1,2,…,L-1为对应的直方图,其中L是可区分的灰度级数目,则一致性U定义为作为第五个提取特征X5;
熵,其提取如下:
信息熵用来描述随机变量的不确定程度,图像熵是图像灰度级集合的比特平均数,也描述了图像信源的平均信息量,数字图像由像素点组成,不同亮度的像素在图像中占据不同区域,图像熵反映了图像的相似性,相似的图像熵也接近,图像熵同时还反映了图像的总体概貌,则图像熵e定义为:作为第六个提取特征X6;
HOG描述子,其提取如下:
HOG,即梯度方向直方图,是具有良好的检测性能的一种局域描述子,通过计算局域区域上的梯度方向直方图来构成图片特征,HOG是在被称为Cell和Block的网格内进行密集计算得到,Cell由若干像素点构成,而Block则由若干相邻的Cell组成;
具体计算过程:将规范化大小的图片作为输入,通过梯度算子计算水平和垂直方向上的梯度;再以各像素点的梯度幅度为权重,统计各Cell的梯度方向加权直方图,得到Cell的HOGs(Cell-HOGs);进一步对同一个Block内的HOGs进行归一化处理,消除光照带入的影响,得到Block的HOGs(Block-HOGs);将图片中所有Block-HOGs串在一起构成图片的特征X7。
3)图像判定和识别
3.1)在提取金相图片的相关特征后,组成一个有标识的训练样本集,{(Xi,yi)|Xi∈Rn,yi∈{-1,1},i=1,...,N},其中Xi=(xi1,xi2,…,xi9)对应第i个样本的属性集,也就是特征集,yi是它的标识号,其值不是-1就是1,这样就是一个包含N个训练样本的二元分类;
3.2)低维度到高维度的转化
基于低维度线性不可分,将低维度转化到高维度,从而实现决策边界在新高维空间是线性,选择多项式核函数K(x,y)=(x·y+1)p,设g(x)是一个具有有限L2范数的函数,即∫g(x)2dx<∞,则:
积分结果非负,因此所选核函数满足Mercer定理;
Mercer原理确保核函数在低维空间中的计算可以用高维空间中两个向量的点积表示,又由于核函数是原属性空间中的相似度函数,故存在:K(x,y)=Φ(x)·Φ(y)=(x·y+1)p,将原来的特征空间映射到一个新的高维空间,其属性集成为Φ(x),决策边界在这个空间为线性;
3.3)假设决策边界函数
在高维空间内,假设一个线性决策边界函数可以表达为:f(x)=W·Φ(x)+b,其中,W和b是模型的参数,且任何位于决策边界上的样本都必须满足W·Φ(x)+b=0;
3.4)定义决策边界边缘
考虑那些距离决策边界最近的数据,某些位于决策边界一边的数据,则存在关系:w·Xs+b≥0,位于决策边界另一边的数据,满足关系:w·Xx+b≤0,调整W和b,两个平行的超平面bi1和bi2可以表示为:
bi1:w·X+b=1
bi2:w·X+b=-1
决策边界的边缘由这两个超平面之间的距离给出,令X1是bi1上的一个数据点,X2是bi2上的一个数据点,分别带入上两式,两式再相减得:
w·(X1-X2)=2,令X1-X2=d,所以:
3.5)估算参数W和b,确定决策边界
在高维可分情况下,依据已有训练集和决策边界边缘的定义,估算边界函数的参数W和b,选择的参数必须满足下面的两个条件:
如果yi=1,则w·Xi+b≥1,
如果yi=-1,则w·Xi+b≤-1,
将两个不等式概括为:yi(w·Xi+b)≥1,i=1,2,…,N,
要求决策边界的边缘必须是最大的条件下,最大,等价为求目标函数:的最小值,也就是进一步概括等价形式为:且受限于yi(w·Xi+b)≥1,i=1,2,…,N,这是一个凸优化问题,通过拉格朗日乘子的方法进行求解:在考虑加在解上面的约束,将目标函数改写为拉格朗日函数:其中,ηi是拉格朗日乘子,拉格朗日函数将目标函数和不等式约束进行组合,将问题变为求解不违反不等式约束条件的可行解,按照一般求函数最小值的办法,拉格朗日函数对w和b求导后等于0,得到w和b的值:
由于ηi拉格朗日乘子未知,等式个数少于未知数个数,无法求解,所以为了求出w和b的值,将上面的不等式约束变换为等式约束,这种变换在KKT条件下成立,KKT条件:
ηi≥0
ηi[yi(w·xi+b)-1]=0
将拉格朗日函数变换成仅包含拉格朗日乘子的函数,变换如下:
将代入
得:
在这个拉格朗日对偶函数中,只有拉格朗日乘子和训练集数据,避开了w和b,使未知量减少,同时,原来求拉格朗日函数的最小值,在此刻由于第二项是个负号,所以变为求对偶函数的最大化问题,然后在运用大量的数据集,找到一组拉格朗日乘子ηi,再代入和ηi[yi(w·xi+b)-1]=0分别求出w和b的可行解,在对所有的b值进行平均作为最后的值,此时决策边界确定,可表示为:
3.6)当检测实例Z时,可应用分类模型:
进行,f(z)=1是一次短路熔痕,若f(z)=-1则是二次短路熔痕;
3.7)组合分类模型,提升分类准确率
所有金相图片根据鉴定结果已知是一次短路和二次短路,故构成有标识的训练集,基于均匀概率分布原理,在训练集中重复抽取样本数据,组成自主样本集,也就是形成子训练集Di,i=k,k是根据训练精度决定的一个整数,在Di上训练分类模型Ci:W·Φ(x)+b=0,这样可以得到k个基分类模型,通过对k个基分类模型所做的预测结果,使用多数表决来分类,由于y的值不是-1就是1,可以对y的预测值求和,然后由结果的符号决定,即:
下面我们结合附图1对本发明上述方法进行具体说明,其情况如下:
一、金相图片预处理:
1.判断图像是否为彩色图像,若为彩色图像,则转化为灰度图像,以减少运算量;
2.将图像统一转化为double类型,以提高运算精度;
3.将图像改变尺寸至相同大小(1535px×2047px),以减少某些小尺寸图像导致的误差;
4.图像直方图均衡化,平衡图像内的亮度;
5.通过顶帽变换减少亮度不均匀的现象。进行顶帽变换时,采用的结构元素为半径为5的disk结构元素。
二、图像描述子:
1.均值,平均亮度的度量。
2.标准偏差,平均对比度的度量。
3.平滑度,区域中亮度的相对平滑度度量。
4.三阶矩,度量直方图的倾斜。若直方图是对称的,则度量值为0;若度量值为正值,则直方图向右偏斜,若度量值为负值,则直方图向左偏斜。
5.一致性,度量一致性。当所有灰度值相等时,该度量值最大且从此处开始减小。
6.熵,随机性的度量。
7.HOG描述子,计算局部图像梯度的方向信息的统计值,共有81个值。
将以上全部描述子组合形成图像的描述子向量,且其维数为87维。
三、SVM训练
·训练集构建:
1.将所有的一次短路(PSM)的实验样品图像按照如上的处理方法分别计算其描述子向量。其样本数目为100。其标签值设为1。
2.将所有的二次短路(SSM)的实验样品图像按照如上的处理方法分别计算其描述子向量。其样本数目为120。其标签值设为-1。
随机抽取以上两类样本中各一半参与训练。
·测试集构建:
1.将所有的一次短路(PSM)的案件样品图像按照如上的处理方法分别计算其描述子向量。其样本数目为231。其标签值设为1。
2.将所有的二次短路(SSM)的案件样品图像按照如上的处理方法分别计算其描述子向量。其样本数目为149。其标签值设为-1。
测试样本全部参与测试。
·数据归一化:
将训练集数据与测试机数据全部归一化到[0,1]上。
·数据降维:
用主成份分析方法(PCA)对归一化后的训练集和测试集数据进行降维,提起的主成份数目满足其解释其中80%以上的数据。
·SVM训练参数优化:
SVM训练时,采用的是台湾林智仁先生开发的SVM工具箱进行训练。训练时,先采用粒子群优化算法(PSO)优化SVM中的c参数和g参数(c参数为C-SVC,epsilon-SVR,nu-SVC的损失函数,g参数为SVM核函数中的gamma参数)。
采用PSO算法优化c参数和g参数时,其参数设置如下:
c1:初始为1.5,pso参数局部搜索能力
c2:初始为1.7,pso参数全局搜索能力
maxgen:初始为200,最大进化数量
sizepop:初始为20,种群最大数量
k:初始为0.6(k belongs to[0.1,1.0]),速率和x的关系(V=kX)
wV:初始为1(wV best belongs to[0.8,1.2]),速率更新公式中速度前面的弹性系数
wP:初始为1,种群更新公式中速度前面的弹性系数
v:初始为3,SVM Cross Validation参数
popcmax:初始为100,SVM参数c的变化的最大值.
popcmin:初始为0.1,SVM参数c的变化的最小值.
popgmax:初始为100,SVM参数g的变化的最大值.
popgmin:初始为0.01,SVM参数c的变化的最小值.
经优化之后的c参数和g参数参与SVM中模型的训练过程。
SVM进行训练时,设置SVM模型类型为C-SVC,核函数类型设置为多项式核函数,设置多项式核函数的degree值为3,g参数采用经过PSO算法优化后的g参数,r参数为核函数中的coef0,设置为0,c参数采用经过PSO算法优化后的c参数,设置nu-SVC,one-class SVM和nu-SVR参数为0.5,设置epsilon-SVR中损失函数epsilon的值为0.1,设置cache内存大小,以MB为单位,设为100,设置允许的终止判据为0.001,其余参数按照工具箱默认值进行设置。
将训练集及其对应的标签,应用设置的参数进行模型的训练。模型训练完毕后对该训练集重新进行预测,对测试集进行预测。
·训练后的所得模型:
·模型预测结果:
①重复SVM训练过程10次。由于每次抽取到的训练集的样本为随机抽取,故每次抽取到的样本不同。亦即将计算出10个不同的模型。模型分类效果如下。
②将所有的训练集样本与测试集样本全部作为训练集进行模型的训练,训练参数相同。其训练结果为:
c参数:0.1000
g参数:12.3205
训练集分类准确率为66.2%(331/500)。
比对以上两种方式的训练模型的准确率,可以看出在较大数量的训练集中完成模型的训练,则准确率会跟高,也就是随着案件图片的不断积累,这种方法的分类器或分类模型将更加可靠。
以上所述实施例子只为本发明较佳实施例,并非以此限制本发明的实施范围,故凡依本发明之形状、原理所作的变化,均应涵盖在本发明的保护范围内。
Claims (3)
1.一种电气火灾熔痕物证的自动鉴定方法,其特征在于,包括以下步骤:
1)金相图片预处理
1.1)图像灰度化
彩色图像中每个像素点由R、G、B三个分量决定,每个分量有255个值,这样一个像素点有255×255×255个值可选,而灰度图是R、G、B三个分量是相同值的一种特殊彩色图片,所以每个像素点的可选值是255个;
根据YUV的颜色空间,Y分量的物理意义是点的亮度,由该值反映亮度等级,根据RGB和YUV颜色空间的变化关系可建立亮度Y与R、G、B三个颜色分量的对应:Y=0.3R+0.59G+0.11B,最后以这个亮度值表达图像的灰度值;
1.2)图像的直方图处理
对于一幅灰度图像,在[0,Y]内总共有L个灰度级,zi是区间[0,Y]内的第i级亮度的灰度值,ni表示灰度为zi的图像中的像素数,n是图像中所有的像素总数,这样图像中灰度为zi的像素出现概率是这个式子表达某亮度其灰度级为zi出现的频数,p实际上是一个数字图像的直方图,将灰度级归一化到[0,1]的离散量;
1.3)直方图的均衡化
通过扩展输入图像的灰度级到较宽亮度范围的方式来实现图像增强,若Pr(r)表示原图像的PDF,用Ps(s)表示均衡化后图像的PDF,r,s分别表示均衡变化前后的灰度值,r,s属于[0,1],根据概率知识:公式中T-1(S)代表T(r)的逆变换函数,因为要求的概率密度为1,即因此:进一步得出:ds=pr(r)·dr,等式两边对r积分,即可得到PDF的均衡化公式:公式中T(r)代表r的灰度变换函数,∫表示积分,w为假设变量,对于离散型灰度级表示为:
图像经过直方图归一处理后,直方图的各值是图像取各灰度级的概率,对于离散的灰度级,其均衡化变换后图像中的亮度值为:
1.4)顶帽变换
从原有的图像中减去开运算后的图像;
2)图像特征提取
包括均值,即平均亮度的度量;标准偏差,即平均对比度的度量;平滑度,即区域中亮度的相对平滑度度量;三阶矩,即度量直方图的倾斜;一致性,即度量一致性,当所有灰度值相等时,该度量值最大且从此处开始减小;熵,即随机性的度量;HOG描述子,即计算局部图像梯度的方向信息的统计值;
3)图像判定和识别
3.1)在提取金相图片的相关特征后,组成一个有标识的训练样本集,{(Xi,yi)|Xi∈Rn,yi∈{-1,1},i=1,...,N},其中Xi=(xi1,xi2,…,xi9)对应第i个样本的属性集,也就是特征集,yi是它的标识号,其值不是-1就是1,这样就是一个包含N个训练样本的二元分类;
3.2)低维度到高维度的转化
基于低维度线性不可分,将低维度转化到高维度,从而实现决策边界在新高维空间是线性,选择多项式核函数K(x,y)=(x·y+1)p,设g(x)是一个具有有限L2范数的函数,即∫g(x)2dx<∞,则:
积分结果非负,因此所选核函数满足Mercer定理;
Mercer原理确保核函数在低维空间中的计算用高维空间中两个向量点积表示,又由于核函数是原属性空间中的相似度函数,故存在:K(x,y)=Φ(x)·Φ(y)=(x·y+1)p,将原来的特征空间映射到一个新的高维空间,其属性集成为Φ(x),决策边界在这个空间为线性;
3.3)假设决策边界函数
在高维空间内,假设一个线性决策边界函数表达为:f(x)=w·Φ(x)+b,其中,w和b是模型的参数,且任何位于决策边界上的样本都必须满足w·Φ(x)+b=0;
3.4)定义决策边界边缘
考虑那些距离决策边界最近的数据,某些位于决策边界一边的数据,则存在关系:w·Xs+b≥0,位于决策边界另一边的数据,满足关系:w·Xx+b≤0,调整w和b,两个平行的超平面bi1和bi2表示为:
bi1:w·X+b=1
bi2:w·X+b=-1
决策边界的边缘由这两个超平面之间的距离给出,令X1是bi1上的一个数据点,X2是bi2上的一个数据点,分别带入上两式,两式再相减得:
w·(X1-X2)=2,令X1-X2=d,所以:
3.5)估算参数w和b,确定决策边界
在高维可分情况下,依据已有训练集和决策边界边缘的定义,估算边界函数的参数w和b,选择的参数必须满足下面的两个条件:
如果yi=1,则w·Xi+b≥1,
如果yi=-1,则w·Xi+b≤-1,
将两个不等式概括为:yi(w·Xi+b)≥1,i=1,2,…,N,
要求决策边界的边缘必须是最大的条件下,最大,等价为求目标函数:的最小值,也就是进一步概括等价形式为:且受限于yi(w·Xi+b)≥1,i=1,2,…,N,这是一个凸优化问题,通过拉格朗日乘子的方法进行求解:在考虑加在解上面的约束,将目标函数改写为拉格朗日函数:其中,ηi是拉格朗日乘子,拉格朗日函数将目标函数和不等式约束进行组合,将问题变为求解不违反不等式约束条件的可行解,按照一般求函数最小值的办法,拉格朗日函数对w和b求导后等于0,得到w和b的值:
由于ηi拉格朗日乘子未知,等式个数少于未知数个数,无法求解,所以为了求出w和b的值,将上面的不等式约束变换为等式约束,这种变换在KKT条件下成立,KKT条件:
ηi≥0
ηi[yi(w·xi+b)-1]=0
将拉格朗日函数变换成仅包含拉格朗日乘子的函数,变换如下:
将代入
得:
在这个拉格朗日对偶函数中,只有拉格朗日乘子和训练集数据,避开了w和b,使未知量减少,同时,原来求拉格朗日函数的最小值,在此刻由于第二项是个负号,所以变为求对偶函数的最大化问题,然后在运用大量的数据集,找到一组拉格朗日乘子ηi,再代入和ηi[yi(w·xi+b)-1]=0分别求出w和b的可行解,在对所有的b值进行平均作为最后的值,此时决策边界确定,可表示为:
3.6)当检测实例z时,可应用分类模型:
进行,f(z)=1是一次短路熔痕,若f(z)=-1则是二次短路熔痕;
3.7)组合分类模型,提升分类准确率
所有金相图片根据鉴定结果已知是一次短路和二次短路,故构成有标识的训练集,基于均匀概率分布原理,在训练集中重复抽取样本数据,组成自主样本集,也就是形成子训练集Di,i=k,k是根据训练精度决定的一个整数,在Di上训练分类模型Ci:w·Φ(x)+b=0,这样得到k个基分类模型,通过对k个基分类模型所做的预测结果,使用多数表决来分类,由于y的值不是-1就是1,对y的预测值求和,然后由结果的符号决定,即:
2.根据权利要求1所述的一种电气火灾熔痕物证的自动鉴定方法,其特征在于:在步骤1.1)中,灰度化后的图像统一转化为double类型,并将图像改变尺寸至相同大小。
3.根据权利要求1所述的一种电气火灾熔痕物证的自动鉴定方法,其特征在于,在步骤2)中,均值,即平均亮度的度量,其提取如下:
若Zi是表示一幅图像的灰度的一个离散随机变量,令p(zi),i=0,1,2,…,L-1是相应的归一化直方图,L是亮度值的数目,直方图分量是灰度值Zi出现的概率的一个统计,描述直方图分布形状的一种主要方法是通过中心矩,其定义为:其中,n是矩的阶,m是均值,计算方法为:作为第一个提取特征X1;
标准偏差,即平均对比度的度量,其提取如下:
由于假设直方图已归一化,所有分量之和为1,所以基于公式:可得,μ0=1和μ1=0,所以是二阶矩,是方差,故作为第二个提取特征X2;
平滑度,其提取如下:
对于常亮区域,R=0;对于灰度级的值有较大偏移的区域,R=1;
方差σ2(z)=μ2(z),其中,L是亮度值的数目,作为第三个提取特征X3;
三阶矩,其提取如下:
若直方图对称的,则度量为0,若度量为正值,则直方图向右偏斜,若度量为负值,则直方图向向左偏斜,计算式:与以上三个特征保持一致,将三阶矩数值归一化,使结果的数值范围在区间[0,1]之内,作为第四个提取特征X4;
一致性,其提取如下:
图像的边缘信息比较复杂,有效的图像边缘具有以下的特征:灰度突出,不同区域的边界以及方向一致,一致性衡量的是图像边缘领域差异程度的量,当所有灰度相等时,该度量最大并以此开始减小;令p(zi),i=0,1,2,…,L-1为对应的直方图,其中L是可区分的灰度级数目,则一致性U定义为作为第五个提取特征X5;
熵,其提取如下:
信息熵用来描述随机变量的不确定程度,图像熵是图像灰度级集合的比特平均数,也描述了图像信源的平均信息量,数字图像由像素点组成,不同亮度的像素在图像中占据不同区域,图像熵反映了图像的相似性,相似的图像熵也接近,图像熵同时还反映了图像的总体概貌,则图像熵e定义为:作为第六个提取特征X6;
HOG描述子,其提取如下:
HOG,即梯度方向直方图,是具有良好的检测性能的一种局域描述子,通过计算局域区域上的梯度方向直方图来构成图片特征,HOG是在被称为Cell和Block的网格内进行密集计算得到,Cell由若干像素点构成,而Block则由若干相邻的Cell组成;
具体计算过程:将规范化大小的图片作为输入,通过梯度算子计算水平和垂直方向上的梯度;再以各像素点的梯度幅度为权重,统计各Cell的梯度方向加权直方图,得到Cell的HOGs,即Cell-HOGs;进一步对同一个Block内的HOGs进行归一化处理,消除光照带入的影响,得到Block的HOGs,即Block-HOGs;将图片中所有Block-HOGs串在一起构成图片的特征X7。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410395742.9A CN104156963B (zh) | 2014-08-12 | 2014-08-12 | 一种电气火灾熔痕物证的自动鉴定方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410395742.9A CN104156963B (zh) | 2014-08-12 | 2014-08-12 | 一种电气火灾熔痕物证的自动鉴定方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104156963A CN104156963A (zh) | 2014-11-19 |
CN104156963B true CN104156963B (zh) | 2017-02-15 |
Family
ID=51882453
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410395742.9A Expired - Fee Related CN104156963B (zh) | 2014-08-12 | 2014-08-12 | 一种电气火灾熔痕物证的自动鉴定方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104156963B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105894481B (zh) * | 2016-04-22 | 2019-02-05 | 深圳英飞拓科技股份有限公司 | 用于视频监控设备的直方图均衡化方法及装置 |
CN106097365A (zh) * | 2016-06-21 | 2016-11-09 | 齐齐哈尔华工机床股份有限公司 | 金属落锤撕裂dwtt断口图像自动评定方法 |
CN109917654A (zh) * | 2019-03-18 | 2019-06-21 | 浙江大学 | 一种基于混合建模的空分设备能耗监测智能系统 |
CN111340741B (zh) * | 2020-01-03 | 2023-05-09 | 中北大学 | 基于四元数与l1范数的粒子群优化灰度图像增强方法 |
CN112465002B (zh) * | 2020-11-23 | 2023-08-15 | 应急管理部天津消防研究所 | 一种火灾现场铜导线熔痕智能识别方法及装置 |
CN116071688A (zh) * | 2023-03-06 | 2023-05-05 | 台州天视智能科技有限公司 | 一种车辆的行为分析方法、装置、电子设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102737467A (zh) * | 2012-06-29 | 2012-10-17 | 深圳市新太阳数码有限公司 | 一种多功能音响系统及其火警监测方法 |
CN103776973A (zh) * | 2014-03-04 | 2014-05-07 | 中山大学 | 一种电气火灾短路模拟装置及其模拟方法 |
CN103839473A (zh) * | 2014-03-07 | 2014-06-04 | 中山大学 | 电气火灾情景体验装置及其控制方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9202115B2 (en) * | 2012-03-12 | 2015-12-01 | Hanwha Techwin Co., Ltd. | Event detection system and method using image analysis |
-
2014
- 2014-08-12 CN CN201410395742.9A patent/CN104156963B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102737467A (zh) * | 2012-06-29 | 2012-10-17 | 深圳市新太阳数码有限公司 | 一种多功能音响系统及其火警监测方法 |
CN103776973A (zh) * | 2014-03-04 | 2014-05-07 | 中山大学 | 一种电气火灾短路模拟装置及其模拟方法 |
CN103839473A (zh) * | 2014-03-07 | 2014-06-04 | 中山大学 | 电气火灾情景体验装置及其控制方法 |
Non-Patent Citations (1)
Title |
---|
王海蓉,王莉,晏建波,赵杏梅,梁栋.数字图像处理在熔痕特征分析中的应用.《中国安全科学学报》.2013,第23卷(第11期),第27-31页. * |
Also Published As
Publication number | Publication date |
---|---|
CN104156963A (zh) | 2014-11-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104156963B (zh) | 一种电气火灾熔痕物证的自动鉴定方法 | |
AU2020100705A4 (en) | A helmet detection method with lightweight backbone based on yolov3 network | |
Xia et al. | Bidirectional urban flows in rapidly urbanizing metropolitan areas and their macro and micro impacts on urban growth: A case study of the Yangtze River middle reaches megalopolis, China | |
Bowen et al. | Generalized SHAP: Generating multiple types of explanations in machine learning | |
KR101054107B1 (ko) | 이미지 특성정보를 이용한 개인정보 노출 검색 시스템 | |
CN101520894A (zh) | 基于区域显著性的显著对象提取方法 | |
CN106056059B (zh) | 多方向slgs特征描述及性能云加权融合的人脸识别方法 | |
CN110413973A (zh) | 计算机自动生成套卷的方法及其系统 | |
CN107507038A (zh) | 一种基于stacking和bagging算法的电费敏感用户分析方法 | |
CN104036360A (zh) | 一种基于磁卡考勤行为的用户数据处理系统及处理方法 | |
CN102297822A (zh) | 一种通过图像分析预测煤粒灰分的方法 | |
Garrido et al. | A Robust profit measure for binary classification model evaluation | |
CN109598681A (zh) | 一种对称唐卡修复后图像的无参考质量评价方法 | |
CN103310235A (zh) | 一种基于参数识别与估计的隐写分析方法 | |
Neñer et al. | Optimal risk in wealth exchange models: Agent dynamics from a microscopic perspective | |
CN107133722A (zh) | 基于电力企业大数据技术的配电网差异特征诊断分析方法 | |
Sun et al. | Detecting Crime Types Using Classification Algorithms. | |
Andersson et al. | Towards predicting dengue fever rates using convolutional neural networks and street-level images | |
Yang et al. | Classification for predicting offender affiliation with murder victims | |
Gerlach et al. | Dissection of Bitcoin's Multiscale Bubble History | |
Herawati | The comparison of two data mining method to detect financial fraud in Indonesia | |
CN115310606A (zh) | 基于数据集敏感属性重构的深度学习模型去偏方法及装置 | |
Fang et al. | Minimum wage impacts on older workers: Longitudinal estimates from Canada | |
CN114298192A (zh) | 基于偏见样本对生成的深度学习模型去偏方法 | |
Shastitko et al. | Monotowns: a quantitative analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20170215 Termination date: 20210812 |