CN107976992A - 基于图半监督支持向量机的工业过程大数据故障监测方法 - Google Patents
基于图半监督支持向量机的工业过程大数据故障监测方法 Download PDFInfo
- Publication number
- CN107976992A CN107976992A CN201711222858.2A CN201711222858A CN107976992A CN 107976992 A CN107976992 A CN 107976992A CN 201711222858 A CN201711222858 A CN 201711222858A CN 107976992 A CN107976992 A CN 107976992A
- Authority
- CN
- China
- Prior art keywords
- mrow
- data
- msub
- support vector
- vector machines
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B23/00—Testing or monitoring of control systems or parts thereof
- G05B23/02—Electric testing or monitoring
- G05B23/0205—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
- G05B23/0218—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
- G05B23/0243—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults model based detection method, e.g. first-principles knowledge model
- G05B23/0254—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults model based detection method, e.g. first-principles knowledge model based on a quantitative model, e.g. mathematical relationships between inputs and outputs; functions: observer, Kalman filter, residual calculation, Neural Networks
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
本发明提供一种基于图半监督支持向量机的工业过程大数据故障监测方法,涉及故障监测与诊断技术领域。该方法通过采集电熔镁炉生产过程中的图像数据和物理化学数据,构成大数据池,采用传统的半监督支持向量机生成多个不同的大间隔低密度分界线和相应的未标记数据的标记,通过目标函数找出分类效果最好的分界线,建立新的半监督支持向量机,求解得到最优标记,根据最优标记对电熔镁炉过程数据进行故障监测。本发明通过建立电熔镁炉生产流程的物理化学变量和图像声音视频大数据池,充分发挥大数据的优势,利用半监督支持向量机进行最优标记的寻找,提高故障诊断的灵敏度,实现全流程全视角全周期地描述工况。
Description
技术领域
本发明涉及故障监测与诊断技术领域,尤其涉及一种基于图半监督支持向量机的工业过程大数据故障监测方法。
背景技术
随着现代工业的迅速发展,现代企业中生产设备日趋大型化、连续化、高速化和自动化,设备的结构与组成十分复杂,生产规模非常庞大,各部门之间的联系也特别密切。实际的生产过程有不仅有大量的物理化学变量和采集到的图像声音等变量,对于不同的生产过程所具有的特征,应选用不同的故障监测方法,这样才能有效地检测到故障。电熔镁炉过程是一个复杂的包含大量的物理化学变量和图像声音的变量的过程。
已有的研究成果局限于把变量数据和多媒体异构数据分开建模分别诊断,其做法忽视了大数据之间的必然联系,失去了大数据固有的优势。
发明内容
本发明要解决的技术问题是针对上述现有技术的不足,提供一种基于图半监督支持向量机的工业过程大数据故障监测方法,通过建立电熔镁炉生产流程的物理化学变量和图像声音视频大数据池,充分发挥大数据的优势,利用半监督支持向量机进行最优标记的寻找,提高故障诊断的灵敏度,实现全流程全视角全周期地描述工况。
为解决上述技术问题,本发明所采取的技术方案是:一种基于图半监督支持向量机的工业过程大数据故障监测方法,包括以下步骤:
步骤1:采集数据;通过电熔镁炉现场安装的摄像头拍摄电熔镁炉工作过程中的运行情况,获取电熔镁炉工作过程的图片;记录电流表显示的各个电极的电流,同时加入拓展的电流变量,形成电流数据向量;
步骤2:对电熔镁炉的图像进行特征提取,形成图像数据向量,并与电流数据向量统一;对统一后得到的数据进行PCA降维处理,得到二维的数据集其中,x表示样本数据点,y表示数据点的标记,l表示数据类型已标记的数据的数量,u表示数据类型未标记的数据的数量,n=l+u,表示数据集中数据的总数量;数据集中的数据类型的标记包括故障数据和正常数据;
步骤3:基于传统的半监督支持向量机,构造目标函数,在数据集D中生成T个不同的大间隔低密度分界线
步骤4:从T个分界线中找出分类效果最好的分界线,来建立新的半监督支持向量机;通过求解新的半监督支持向量机,得到最优标记;根据最优标记对电熔镁炉过程数据进行故障监测。
所述步骤2中对电熔镁炉的图像提取的特征包括对比度、相关性、能量、同质性、熵和颜色直方图。
所述步骤3中构造的目标函数如式(1)所示,T个不同的分界线对应的未标记数据的标记为
其中,M是一个为了增大各分界线差别设置的常数;表示传统的半监督支持向量机的目标函数,如式(2)所示;Ω是一个和分界线的差异性有关的变量,分界线互相之间的差别越大,Ω的值越小,具体如式(4)所示;
其中,ft表示T个大间隔低密度的分界线中的第t个分界线,表示第t个分界线ft对应的含有u个数据的未标记数据的标记向量;第一项为SVM的基本型;为损失函数;f(xi)表示核空间的数据点;C1和C2是用户指定的用于平衡模型复杂度、有标记数据和未标记数据重要程度的折中参数,与数据点之间的距离Wii′相关,Wii′表示数据点xi与数据点xi′之间的距离,如式(3)所示;
其中,i、i′∈{1,2,...,n},σ>0是用户指定的高斯函数带宽参数,ne(xi)是数据点xi的k个邻近的数据点;C10和C20是两个权衡参数,分别表示标记数据和未标记数据对目标函数的影响;d表示所有数据点之间距离的总和,di表示样本点xi周围k个邻近点之间的距离总和;
其中,δ是指示函数;t和为[1,T]内不同的值;是的转置;是个常数。
所述步骤4的具体方法为:
对于未标记数据样本的标记y={yl+1,…,yl+u},将gain(y,y*,ysvm)和loss(y,y*,ysvm)分别作为与传统的支持向量机SVM相比增加和减少的准确度;找到一个最合适的标记向量y来使数据标记的准确率相比支持向量机最大化,建立目标函数如式(5)所示;
其中,y*是未标记数据的真实标记数值,y*∈{±1},ysvm是支持向量机SVM对标记数据的预测标记;λ是权衡参数;
将相对于支持向量机实现最小改善的分界线进行最大化的改善,得到最优解如式(6)所示;
其中,是y的线性函数,其中
通过引入额外的变量τ,求最优解的内部的最优化目标函数转变为最优化问题,则式(5)变为下式:
将其中的约束条件y∈{±1)u松弛为约束条件y∈[-1,1]u,则公式(7)变为凸线性问题,通过对这个凸线性问题进行求解,再还原为原问题的整数解;如果目标函数得到的整数解小于0,则将ysvm作为新的半监督支持向量机最终的输出;否则,将得到的整数解作为新的半监督支持向量机最终的输出;
引入变量α=[α1,...,αT]′≥0,根据拉普拉斯方程,得到
通过对上式求偏导等于0,即
在式(7)所示的目标函数中,将变量α引入,得到
其中,αt为能够成为真实标签的可能性;
通过标签传播的方法获得α的值,根据得到的α和式(10)得到最优的标记,根据最优标记中正常数据和故障数据的分类实现故障监测。
采用上述技术方案所产生的有益效果在于:本发明提供的一种基于图半监督支持向量机的工业过程大数据故障监测方法,通过统一建立生产流程的物理化学变量和图像声音视频大数据池,能够实现全流程全视角全周期地描述工况;基于大数据迁移学习方法,把炉内外监测图像以及物理化学变量统一在一个数据池协同建模,充分发挥大数据的优势;利用半监督支持向量机进行最优标记的寻找,提高故障诊断的灵敏度;根据故障幅值的输入值调控方法以降低故障灾害。
附图说明
图1为本发明实施例提供的电熔镁炉生产过程示意图;
图2为本发明实施例提供的基于图半监督支持向量机的工业过程大数据故障监测方法流程图;
图3为本发明实施例提供的采集样本数据经过PCA降维后的二维数据散点图;
图4为本发明实施例提供的降维后数据的真实标记图;
图5为本发明实施例提供的故障分类后的数据点;
图6为本发明实施例提供的10次线性分类的准确率曲线图;
图7为本发明实施例提供的10次高斯核函数分类的准确率曲线图。
图中:1、变压器;2、电路短网;3、电极升降装置;4、电极;5、炉壳;6、车体;7、电弧、8、炉料。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
电熔镁炉的基本工作原理如图1所示。电熔镁炉实际上是一种埋弧炉,属于矿热炉而不是电弧炉,其主要以熔融状态下电流通过物料所产生的物料电阻热为主要热源,同时伴有电弧热,它的热量集中,能有效的将物料加热到熔点2800℃以上,有利于熔炼电熔镁砂。电熔镁炉的设备主要包括:变压器1、电路短网2、电极升降装置3、电极4、炉壳5、车体6、电弧7以及炉料8等。图中的三个电流表可以分别测量三个电极通过的电流。炉边设有控制室,可控制电极升降。在电熔镁炉工作过程中,随着物料的不断熔化,同时向上提高电极,当炉体内物料熔化过程完成后,将电极移出炉体,通过小车将炉体送到冷却室进行自然冷却结晶,最终形成密度大、熔点高的氧化镁晶体。
针对电熔镁炉,基于图半监督支持向量机的工业过程大数据故障监测方法,如图2所示,包括以下步骤。
步骤1:采集数据,通过电熔镁炉现场安装的摄像头拍摄电熔镁炉工作过程中电熔镁炉的运行情况,获取电熔镁炉工作过程的图片,记录电流表显示的各个电极的电流,采集电熔镁炉中的电压和电阻以及电熔镁的熔化过程的数据。
通过摄像头获取了大量的电熔镁炉工作过程的图片,从这些图片中选取一些图片作为原始数据。
步骤2:对图片进行特征提取,通过灰度图像提取特征的方式,得到20维的向量数据。其中,要提取的图片特征包括对比度、相关性、能量、同质性和熵。部分向量数据如表1和表2所示。
表1
表2
在表1中展示的是其中10个图片的特征的向量,其中1-4是对比度,5-8是相关性,9-12是能量,13-16是同质性,17-10是熵。每一个特征都包含四个变量,分别表示0℃、45℃、90℃、135℃四个角度的特征。
表2中的数据和表1中的数据一样,都是图片的特征的向量,不同的是,表1中的数据是故障类的图片提取的特征的向量,表2的数据是电熔镁炉正常工作情况下的图片提取的特征的向量。从两个数据表中可以较明显的看出来两类数据在熵这一特征方面变化比较明显。
电熔镁炉正常工作时三个电极的电流大小如表3中的数据所示,将电流数据加入到图片特征数据中进行统一。
表3
除了电流数据以外,还可以在数据中添加电压,温度等物理变量,使数据更完整,故障检测性能也会更完善。
对处理后的数据向量进行PCA降维,得到二维的数据集其中,x表示样本数据点,y表示数据点的标记,l表示数据类型已标记的数据的数量,u表示数据类型未标记的数据的数量,n=l+u,表示数据集中数据的总数量,本实施例中,n=200。数据集中的数据类型的标记包括故障数据和正常数据。虽然PCA降维的结果并不是很准确,但是对数据进行降维后可以比较直观地对数据的分布有一个大概的了解。对处理后的数据进行降维后的数据点如图3中的数据所示。降维后的部分数据点如表4所示。
表4
数据的真实标记如图4中的数据点所示,从图4中可以看出,降维后的数据直观上分类比较明确。
步骤3:基于传统的半监督支持向量机,构造目标函数,如式(1)所示,在数据集D中生成T个不同的大间隔低密度分界线和相应的未标记数据的标记为根据公式(1),可以看出目标函数可以通过找到多个大间隔低密度的分界线,然后保留其中具有代表性的、互相之间有较大差异的分界线,分界线的间隔越大,差异越大,分类效果越好,最终的故障诊断的可信度越高。
其中,M是一个为了增大各分界线差别设置的常数,本实施例中取值为1×105;表示传统的半监督支持向量机的目标函数,如式(2)所示;
其中,ft表示T个大间隔低密度的分界线中的第t个分界线,表示第t个分界线ft对应的含有u个数据的未标记数据的标记向量;上式中的第一项为SVM的基本型;为损失函数;f(xi)表示核空间的数据点;C1和C2是用户指定的用于平衡模型复杂度、有标记数据和未标记数据重要程度的折中参数,与数据点之间的距离Wii′相关。
给定一个数据集,就可以将其映射为一个图,数据集中的每一个样本点对应于图中的数据点,两个样本之间的关系用两个点之间的连接的边来表示,如果两个样本点之间的相似度高,那么边的强度也高。本实施例中,数据集D={(x1,y1),(x2,y2),…,(xn,yn)}对应的图(V,E),用V={v1,v2,…,vn}来表示图中的向量,E表示图中的边,则可以得到边的强度,也就是数据点之间的距离,如式(3)所示。
其中,i、i′∈{1,2,...,n},Wii′表示数据点xi与数据点xi′之间的距离,σ>0是用户指定的高斯函数带宽参数,ne(xi)是数据点xi的k个邻近的数据点;C10和C20是两个权衡参数,分别表示标记数据和未标记数据对目标函数的影响;d表示所有数据点之间距离的总和,di表示样本点xi周围k个邻近点之间的距离总和。本实施例中的数据集包含200个数据点,因此距离矩阵W为200×200的矩阵,矩阵中的每个数据表示对应的行的数据和对应的列的数据之间的距离,部分数据表如表5所示。
表5
Ω是一个和分界线的差异性有关的变量,分界线互相之间的差别越大,Ω的值越小,具体如式(4)所示;
其中,δ是指示函数;t和为[1,T]内不同的值;是的转置;是个常数。
假设是半监督支持向量机中的线性模型,其中是核函数,那么式(1)所示的目标函数可以变为:
步骤4:从T个分界线中找出分类效果最好的分界线,来建立新的半监督支持向量机;通过求解新的半监督支持向量机,得到最优标记;根据最优标记对电熔镁炉过程数据进行故障监测。
得到大量的分界线后,下一目标是找到一个标记向量y来使故障分类的效果相对于SVM更好,即找到一个最合适的标记向量y来使数据标记的准确率相比支持向量机最大化,建立目标函数如式(5)所示;
其中,对于未标记数据样本的标记y={yl+1,…,yl+u},gain(y,y*,ysvm)和loss(y,y*,ysvm)分别表示与传统的支持向量机SVM相比增加和减少的准确度;y*是未标记数据的真实标记数值,y*∈{±1},ysvm是支持向量机SVM对标记数据的预测标记;λ是权衡参数。
由于数据的真实标记是未知的,那么由上一步得到的大量的分界线,就可以认为这样在没有其他知识的情况下,就可以最大化效果最差的分类器的分类效果,来提高分类准确率。假设是最优解,则
其中,相对支持向量机增加和减少的准确率函数和是关于y的线性函数,因此,也是y的线性函数,其中
通过引入额外的变量τ,求最优解的内部的最优化目标函数可以转变为最优化问题,则式(5)变为下式:
尽管上式仍是一个困难的混合整数线性规划问题,但是最优解对增加分类的结果的安全性来说是充分非必要条件。首先其中的约束条件y∈{±1}u松弛为约束条件y∈[-1,1]u,则公式(7)变为凸线性问题,然后通过对这个凸线性问题进行求解,再还原为原问题的整数解。如果目标函数得到的整数解小于0,则将ysvm作为新的半监督支持向量机最终的输出;否则,将得到的整数解作为新的半监督支持向量机最终的输出。
通过引入变量α=[α1,...,αT]′≥0,根据拉普拉斯方程,可以得到
通过偏导等于0,即
在式(7)所示的目标函数中,将变量α引入,就变成了
其中,αt为能够成为真实标签的可能性。通过标签传播的方法获得α的值,根据得到的α和式(10)得到最优的标记,根据最优标记中正常数据和故障数据的分类实现故障监测。本实施例中故障分类后的数据点如图5所示。
标记数据有10个,占总数据的5%,改变标记数据,并不断运行代码,就可以得到10次仿真结果。图6和表6是线性分类器下10次仿真结果的分类准确率,虽然准确率受到标记数据的影响,但是总体来说分类准确率较高。图7和表7是高斯核分类器下10次仿真结果的分类准确率,从下表中可以看出准确率同样受到标记数据的影响,而且,在同样的标记数据的前提下,高斯核的分类器的分类准确率能保持比线性分类器的准确率高。
表6
序号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
准确率 | 0.7789 | 0.9842 | 0.9789 | 0.9474 | 0.9526 | 0.9947 | 0.9632 | 0.9737 | 0.8053 | 0.9632 |
表7
序号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
准确率 | 0.8421 | 0.9895 | 0.9842 | 0.9737 | 0.9895 | 0.9947 | 0.9842 | 0.9895 | 0.9053 | 0.9842 |
本发明提供的基于图半监督支持向量机的工业过程大数据故障监测方法,基于大数据迁移学习方法,能把电熔镁炉炉内外监测图像的面积、运动速度、位置、有效像素比、方向分布比、声音的频率位置、高低频比率、时长、视频的重要度、高斯熵等以及物理化学变量统一在一个数据池协同建模,充分发挥大数据的优势,能够实现全流程全视角全周期地描述工况,提高故障诊断的灵敏度;根据故障幅值的输入值调控方法以降低故障灾害。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明权利要求所限定的范围。
Claims (4)
1.一种基于图半监督支持向量机的工业过程大数据故障监测方法,其特征在于:包括以下步骤:
步骤1:采集数据;通过电熔镁炉现场安装的摄像头拍摄电熔镁炉工作过程中的运行情况,获取电熔镁炉工作过程的图片;记录电流表显示的各个电极的电流,同时加入拓展的电流变量,形成电流数据向量;
步骤2:对电熔镁炉的图像进行特征提取,形成图像数据向量,并与电流数据向量统一;对统一后得到的数据进行PCA降维处理,得到二维的数据集其中,x表示样本数据点,y表示数据点的标记,l表示数据类型已标记的数据的数量,u表示数据类型未标记的数据的数量,n=l+u,表示数据集中数据的总数量;数据集中的数据类型的标记包括故障数据和正常数据;
步骤3:基于传统的半监督支持向量机,构造目标函数,在数据集D中生成T个不同的大间隔低密度分界线
步骤4:从T个分界线中找出分类效果最好的分界线,来建立新的半监督支持向量机;通过求解新的半监督支持向量机,得到最优标记;根据最优标记对电熔镁炉过程数据进行故障监测。
2.根据权利要求1所述的基于图半监督支持向量机的工业过程大数据故障监测方法,其特征在于:所述步骤2中对电熔镁炉的图像提取的特征包括对比度、相关性、能量、同质性、熵和颜色直方图。
3.根据权利要求1所述的基于图半监督支持向量机的工业过程大数据故障监测方法,其特征在于:所述步骤3中构造的目标函数如式(1)所示,T个不同的分界线对应的未标记数据的标记为
<mrow>
<munder>
<mi>min</mi>
<msubsup>
<mrow>
<mo>{</mo>
<msub>
<mi>f</mi>
<mi>t</mi>
</msub>
<mo>,</mo>
<msub>
<mover>
<mi>y</mi>
<mo>^</mo>
</mover>
<mi>t</mi>
</msub>
<mo>}</mo>
</mrow>
<mrow>
<mi>t</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>T</mi>
</msubsup>
</munder>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>t</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>T</mi>
</munderover>
<mi>h</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>f</mi>
<mi>t</mi>
</msub>
<mo>,</mo>
<msub>
<mover>
<mi>y</mi>
<mo>^</mo>
</mover>
<mi>t</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>+</mo>
<mi>M</mi>
<mi>&Omega;</mi>
<mrow>
<mo>(</mo>
<msubsup>
<mrow>
<mo>{</mo>
<msub>
<mover>
<mi>y</mi>
<mo>^</mo>
</mover>
<mi>t</mi>
</msub>
<mo>}</mo>
</mrow>
<mrow>
<mi>t</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>T</mi>
</msubsup>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,M是一个为了增大各分界线差别设置的常数;表示传统的半监督支持向量机的目标函数,如式(2)所示;Ω是一个和分界线的差异性有关的变量,分界线互相之间的差别越大,Ω的值越小,具体如式(4)所示;
其中,ft表示T个大间隔低密度的分界线中的第t个分界线,表示第t个分界线ft对应的含有u个数据的未标记数据的标记向量;第一项为SVM的基本型;为损失函数;f(xi)表示核空间的数据点;C1和C2是用户指定的用于平衡模型复杂度、有标记数据和未标记数据重要程度的折中参数,与数据点之间的距离Wii′相关,Wii′表示数据点xi与数据点xi′之间的距离,如式(3)所示;
其中,i、i′∈{1,2,...,n},σ>0是用户指定的高斯函数带宽参数,ne(xi)是数据点xi的k个邻近的数据点;C10和C20是两个权衡参数,分别表示标记数据和未标记数据对目标函数的影响;d表示所有数据点之间距离的总和,di表示样本点xi周围k个邻近点之间的距离总和;
其中,δ是指示函数;t和为[1,T]内不同的值;是的转置;是个常数。
4.根据权利要求3所述的基于图半监督支持向量机的工业过程大数据故障监测方法,其特征在于:所述步骤4的具体方法为:
对于未标记数据样本的标记y={yl+1,…,yl+u),将gain(y,y*,ysvm)和loss(y,y*,ysvm)分别作为与传统的支持向量机SVM相比增加和减少的准确度;找到一个最合适的标记向量y来使数据标记的准确率相比支持向量机最大化,建立目标函数如式(5)所示;
<mrow>
<msub>
<mi>max</mi>
<mrow>
<mi>y</mi>
<mo>&Element;</mo>
<msup>
<mrow>
<mo>{</mo>
<mo>&PlusMinus;</mo>
<mn>1</mn>
<mo>}</mo>
</mrow>
<mi>u</mi>
</msup>
</mrow>
</msub>
<mi>g</mi>
<mi>a</mi>
<mi>i</mi>
<mi>n</mi>
<mrow>
<mo>(</mo>
<mi>y</mi>
<mo>,</mo>
<msup>
<mi>y</mi>
<mo>*</mo>
</msup>
<mo>,</mo>
<msup>
<mi>y</mi>
<mrow>
<mi>s</mi>
<mi>v</mi>
<mi>m</mi>
</mrow>
</msup>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mi>&lambda;</mi>
<mi>l</mi>
<mi>o</mi>
<mi>s</mi>
<mi>s</mi>
<mrow>
<mo>(</mo>
<mi>y</mi>
<mo>,</mo>
<msup>
<mi>y</mi>
<mo>*</mo>
</msup>
<mo>,</mo>
<msup>
<mi>y</mi>
<mrow>
<mi>s</mi>
<mi>v</mi>
<mi>m</mi>
</mrow>
</msup>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>5</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,y*是未标记数据的真实标记数值,y*∈{±1),ysvm是支持向量机SVM对标记数据的预测标记;λ是权衡参数;
将相对于支持向量机实现最小改善的分界线进行最大化的改善,得到最优解如式(6)所示;
<mrow>
<mover>
<mi>y</mi>
<mo>&OverBar;</mo>
</mover>
<mo>=</mo>
<munder>
<mi>argmax</mi>
<mrow>
<mi>y</mi>
<mo>&Element;</mo>
<msup>
<mrow>
<mo>{</mo>
<mo>&PlusMinus;</mo>
<mn>1</mn>
<mo>}</mo>
</mrow>
<mi>u</mi>
</msup>
</mrow>
</munder>
<munder>
<mrow>
<mi>m</mi>
<mi>i</mi>
<mi>n</mi>
</mrow>
<mrow>
<mover>
<mi>y</mi>
<mo>^</mo>
</mover>
<mo>&Element;</mo>
<mi>M</mi>
</mrow>
</munder>
<mi>J</mi>
<mrow>
<mo>(</mo>
<mi>y</mi>
<mo>,</mo>
<msub>
<mover>
<mi>y</mi>
<mo>^</mo>
</mover>
<mi>t</mi>
</msub>
<mo>,</mo>
<msup>
<mi>y</mi>
<mrow>
<mi>s</mi>
<mi>v</mi>
<mi>m</mi>
</mrow>
</msup>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>6</mn>
<mo>)</mo>
</mrow>
</mrow>
其中, 是y的线性函数,其中
通过引入额外的变量τ,求最优解的内部的最优化目标函数转变为最优化问题,则式(5)变为下式:
<mrow>
<mtable>
<mtr>
<mtd>
<mrow>
<msub>
<mi>max</mi>
<mi>y</mi>
</msub>
<msub>
<mi>max</mi>
<mi>&tau;</mi>
</msub>
<mi>&tau;</mi>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mi>&tau;</mi>
<mo>&le;</mo>
<msubsup>
<mi>c</mi>
<mi>t</mi>
<mo>&prime;</mo>
</msubsup>
<mi>y</mi>
<mo>+</mo>
<msub>
<mi>d</mi>
<mi>t</mi>
</msub>
<mo>,</mo>
<mo>&ForAll;</mo>
<mi>t</mi>
<mo>=</mo>
<mn>1</mn>
<mo>,</mo>
<mn>...</mn>
<mo>,</mo>
<mi>T</mi>
<mo>;</mo>
<mi>y</mi>
<mo>&Element;</mo>
<msup>
<mrow>
<mo>{</mo>
<mo>&PlusMinus;</mo>
<mn>1</mn>
<mo>}</mo>
</mrow>
<mi>u</mi>
</msup>
</mrow>
</mtd>
</mtr>
</mtable>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>7</mn>
<mo>)</mo>
</mrow>
</mrow>
将其中的约束条件y∈{±1}u松弛为约束条件y∈[-1,1]u,则公式(7)变为凸线性问题,通过对这个凸线性问题进行求解,再还原为原问题的整数解;如果目标函数得到的整数解小于0,则将ysvm作为新的半监督支持向量机最终的输出;否则,将得到的整数解作为新的半监督支持向量机最终的输出;
引入变量α=[α1,...,αT]′≥0,根据拉普拉斯方程,得到
<mrow>
<mi>L</mi>
<mrow>
<mo>(</mo>
<mi>&tau;</mi>
<mo>,</mo>
<mi>y</mi>
<mo>,</mo>
<mi>&alpha;</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mi>&tau;</mi>
<mo>-</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>t</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>T</mi>
</munderover>
<msub>
<mi>&alpha;</mi>
<mi>t</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>&tau;</mi>
<mo>-</mo>
<msubsup>
<mi>c</mi>
<mi>t</mi>
<mo>&prime;</mo>
</msubsup>
<mi>y</mi>
<mo>-</mo>
<msub>
<mi>d</mi>
<mi>t</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>8</mn>
<mo>)</mo>
</mrow>
</mrow>
通过对上式求偏导等于0,即
<mrow>
<mo>&part;</mo>
<mi>L</mi>
<mo>/</mo>
<mo>&part;</mo>
<mi>&tau;</mi>
<mo>=</mo>
<mn>1</mn>
<mo>-</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>t</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>T</mi>
</munderover>
<msub>
<mi>&alpha;</mi>
<mi>t</mi>
</msub>
<mo>=</mo>
<mn>0</mn>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>9</mn>
<mo>)</mo>
</mrow>
</mrow>
在式(7)所示的目标函数中,将变量α引入,得到
<mrow>
<munder>
<mrow>
<mi>m</mi>
<mi>a</mi>
<mi>x</mi>
</mrow>
<mrow>
<mi>y</mi>
<mo>&Element;</mo>
<msup>
<mrow>
<mo>{</mo>
<mo>&PlusMinus;</mo>
<mn>1</mn>
<mo>}</mo>
</mrow>
<mi>u</mi>
</msup>
</mrow>
</munder>
<munder>
<mrow>
<mi>m</mi>
<mi>i</mi>
<mi>n</mi>
</mrow>
<mrow>
<msubsup>
<mi>&Sigma;</mi>
<mrow>
<mi>t</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>T</mi>
</msubsup>
<msub>
<mi>&alpha;</mi>
<mi>t</mi>
</msub>
<mo>=</mo>
<mn>1</mn>
<mo>,</mo>
<msub>
<mi>&alpha;</mi>
<mi>t</mi>
</msub>
<mo>&GreaterEqual;</mo>
<mn>0</mn>
</mrow>
</munder>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>t</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>T</mi>
</munderover>
<msub>
<mi>&alpha;</mi>
<mi>t</mi>
</msub>
<mrow>
<mo>(</mo>
<msubsup>
<mi>c</mi>
<mi>t</mi>
<mo>&prime;</mo>
</msubsup>
<mi>y</mi>
<mo>+</mo>
<msub>
<mi>d</mi>
<mi>t</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>10</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,αt为能够成为真实标签的可能性;
通过标签传播的方法获得α的值,根据得到的α和式(10)得到最优的标记,根据最优标记中正常数据和故障数据的分类实现故障监测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711222858.2A CN107976992B (zh) | 2017-11-29 | 2017-11-29 | 基于图半监督支持向量机的工业过程大数据故障监测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711222858.2A CN107976992B (zh) | 2017-11-29 | 2017-11-29 | 基于图半监督支持向量机的工业过程大数据故障监测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107976992A true CN107976992A (zh) | 2018-05-01 |
CN107976992B CN107976992B (zh) | 2020-01-21 |
Family
ID=62008475
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711222858.2A Active CN107976992B (zh) | 2017-11-29 | 2017-11-29 | 基于图半监督支持向量机的工业过程大数据故障监测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107976992B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109100142A (zh) * | 2018-06-26 | 2018-12-28 | 北京交通大学 | 一种基于图论的轴承半监督故障诊断方法 |
CN109885029A (zh) * | 2019-03-13 | 2019-06-14 | 东北大学 | 基于投影非负矩阵分解的电熔氧化镁过程故障检测方法 |
CN109885028A (zh) * | 2019-03-13 | 2019-06-14 | 东北大学 | 基于相关熵诱导度量的电熔氧化镁熔炼过程故障检测方法 |
CN110175602A (zh) * | 2019-03-13 | 2019-08-27 | 东北大学 | 基于特征重构和异构数据联合建模的特征选择方法 |
CN113484817A (zh) * | 2021-06-30 | 2021-10-08 | 国网上海市电力公司 | 基于tsvm模型的智能电能表自动化检定系统异常检测方法 |
CN113688863A (zh) * | 2021-07-14 | 2021-11-23 | 精英数智科技股份有限公司 | 基于机器学习的矿井传感器报警原因分类方法及装置 |
CN114842383A (zh) * | 2022-04-29 | 2022-08-02 | 合肥工业大学 | 一种基于dvrl-vst的电熔镁炉工况视频识别方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008065393A (ja) * | 2006-09-04 | 2008-03-21 | Research Organization Of Information & Systems | グループ判別装置及びグループ判別方法 |
WO2009017464A1 (en) * | 2007-07-31 | 2009-02-05 | Agency For Science, Technology And Research | Relation extraction system |
CN106295685A (zh) * | 2016-08-01 | 2017-01-04 | 浙江大学 | 改进的直推式支持向量机的大型高炉故障分类算法及应用 |
CN107169530A (zh) * | 2017-06-09 | 2017-09-15 | 成都澳海川科技有限公司 | 图片的标注方法、装置及电子设备 |
-
2017
- 2017-11-29 CN CN201711222858.2A patent/CN107976992B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008065393A (ja) * | 2006-09-04 | 2008-03-21 | Research Organization Of Information & Systems | グループ判別装置及びグループ判別方法 |
WO2009017464A1 (en) * | 2007-07-31 | 2009-02-05 | Agency For Science, Technology And Research | Relation extraction system |
CN106295685A (zh) * | 2016-08-01 | 2017-01-04 | 浙江大学 | 改进的直推式支持向量机的大型高炉故障分类算法及应用 |
CN107169530A (zh) * | 2017-06-09 | 2017-09-15 | 成都澳海川科技有限公司 | 图片的标注方法、装置及电子设备 |
Non-Patent Citations (2)
Title |
---|
AIHUA ZHANG等: "Fault Diagnosis based Semi-supervised Global LSSVM for Analog Circuit", 《2014 INTERNATIONAL CONFERENCE ON MECHATRONICS AND CONTROL》 * |
曹盼东: "基于图模型的半监督SVM分类算法研究与应用", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109100142A (zh) * | 2018-06-26 | 2018-12-28 | 北京交通大学 | 一种基于图论的轴承半监督故障诊断方法 |
CN109885029A (zh) * | 2019-03-13 | 2019-06-14 | 东北大学 | 基于投影非负矩阵分解的电熔氧化镁过程故障检测方法 |
CN109885028A (zh) * | 2019-03-13 | 2019-06-14 | 东北大学 | 基于相关熵诱导度量的电熔氧化镁熔炼过程故障检测方法 |
CN110175602A (zh) * | 2019-03-13 | 2019-08-27 | 东北大学 | 基于特征重构和异构数据联合建模的特征选择方法 |
CN109885028B (zh) * | 2019-03-13 | 2021-06-22 | 东北大学 | 基于相关熵诱导度量的电熔氧化镁熔炼过程故障检测方法 |
CN109885029B (zh) * | 2019-03-13 | 2021-07-06 | 东北大学 | 基于投影非负矩阵分解的电熔氧化镁过程故障检测方法 |
CN110175602B (zh) * | 2019-03-13 | 2023-02-14 | 东北大学 | 基于特征重构和异构数据联合建模的特征选择方法 |
CN113484817A (zh) * | 2021-06-30 | 2021-10-08 | 国网上海市电力公司 | 基于tsvm模型的智能电能表自动化检定系统异常检测方法 |
CN113688863A (zh) * | 2021-07-14 | 2021-11-23 | 精英数智科技股份有限公司 | 基于机器学习的矿井传感器报警原因分类方法及装置 |
CN114842383A (zh) * | 2022-04-29 | 2022-08-02 | 合肥工业大学 | 一种基于dvrl-vst的电熔镁炉工况视频识别方法 |
CN114842383B (zh) * | 2022-04-29 | 2024-02-20 | 合肥工业大学 | 一种基于dvrl-vst的电熔镁炉工况视频识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107976992B (zh) | 2020-01-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107976992A (zh) | 基于图半监督支持向量机的工业过程大数据故障监测方法 | |
Li et al. | Contour knowledge transfer for salient object detection | |
CN104992452B (zh) | 基于热成像视频的飞行目标自动跟踪方法 | |
Zhou et al. | Adaptive pooling in multi-instance learning for web video annotation | |
CN107273872A (zh) | 用于图像或视频中行人重识别的深度判别网络模型方法 | |
CN110197208A (zh) | 一种纺织品瑕疵智能检测分类方法及装置 | |
CN112800770B (zh) | 一种基于异构图注意力网络的实体对齐方法 | |
Gali et al. | Genetic algorithm for content based image retrieval | |
CN111242144B (zh) | 电网设备异常的检测方法和装置 | |
Liu et al. | Subtler mixed attention network on fine-grained image classification | |
Peng et al. | Context-aware co-supervision for accurate object detection | |
CN109961437A (zh) | 一种基于机器教学模式下的显著性织物疵点检测方法 | |
CN110197202A (zh) | 一种局部特征细粒度目标检测算法 | |
Liu et al. | Spatial pyramid block for oracle bone inscription detection | |
Wan et al. | Logit inducing with abnormality capturing for semi-supervised image anomaly detection | |
Zhang et al. | Traffic sign detection based on multi-scale feature extraction and cascade feature fusion | |
Chen et al. | Virtual Category Learning: A Semi-Supervised Learning Method for Dense Prediction with Extremely Limited Labels | |
Zong et al. | A cascaded refined rgb-d salient object detection network based on the attention mechanism | |
Xi et al. | SR-POD: Sample rotation based on principal-axis orientation distribution for data augmentation in deep object detection | |
Xu et al. | Semi-supervised self-growing generative adversarial networks for image recognition | |
Peng et al. | Cooperative Refinement Learning for domain adaptive person Re-identification | |
Bai et al. | Learning two-pathway convolutional neural networks for categorizing scene images | |
Hu et al. | Gptr: Gestalt-perception transformer for diagram object detection | |
Yang | [Retracted] A Deep Learning and Clustering Extraction Mechanism for Recognizing the Actions of Athletes in Sports | |
Wang et al. | Adversarial hard negative generation for complementary graph contrastive learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |