CN107861481A - 基于工业大数据图半监督新类挖掘的故障诊断方法 - Google Patents
基于工业大数据图半监督新类挖掘的故障诊断方法 Download PDFInfo
- Publication number
- CN107861481A CN107861481A CN201711053861.6A CN201711053861A CN107861481A CN 107861481 A CN107861481 A CN 107861481A CN 201711053861 A CN201711053861 A CN 201711053861A CN 107861481 A CN107861481 A CN 107861481A
- Authority
- CN
- China
- Prior art keywords
- data
- matrix
- mrow
- msup
- msub
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 239000011159 matrix material Substances 0.000 claims abstract description 78
- 238000004519 manufacturing process Methods 0.000 claims abstract description 37
- 241001269238 Data Species 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 6
- 241000894007 species Species 0.000 claims description 3
- 238000003745 diagnosis Methods 0.000 abstract description 12
- 238000012544 monitoring process Methods 0.000 abstract description 3
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 33
- 239000011777 magnesium Substances 0.000 description 33
- 229910052749 magnesium Inorganic materials 0.000 description 33
- 238000002844 melting Methods 0.000 description 32
- 230000008018 melting Effects 0.000 description 32
- 239000000463 material Substances 0.000 description 9
- 230000006870 function Effects 0.000 description 7
- CPLXHLVBOLITMK-UHFFFAOYSA-N Magnesium oxide Chemical compound [Mg]=O CPLXHLVBOLITMK-UHFFFAOYSA-N 0.000 description 6
- 235000014380 magnesium carbonate Nutrition 0.000 description 6
- 239000001095 magnesium carbonate Substances 0.000 description 5
- ZLNQQNXFFQJAID-UHFFFAOYSA-L magnesium carbonate Chemical compound [Mg+2].[O-]C([O-])=O ZLNQQNXFFQJAID-UHFFFAOYSA-L 0.000 description 5
- 229910000021 magnesium carbonate Inorganic materials 0.000 description 5
- 238000003723 Smelting Methods 0.000 description 4
- 238000010891 electric arc Methods 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 238000009412 basement excavation Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000005611 electricity Effects 0.000 description 3
- 239000000395 magnesium oxide Substances 0.000 description 3
- 238000001816 cooling Methods 0.000 description 2
- 238000002425 crystallisation Methods 0.000 description 2
- 230000008025 crystallization Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 229910052500 inorganic mineral Inorganic materials 0.000 description 2
- 239000011707 mineral Substances 0.000 description 2
- 235000010755 mineral Nutrition 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 239000002994 raw material Substances 0.000 description 2
- 230000032683 aging Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000010309 melting process Methods 0.000 description 1
- 238000005272 metallurgy Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000011819 refractory material Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/418—Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
- G05B19/41875—Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM] characterised by quality surveillance of production
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/418—Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
- G05B19/4183—Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM] characterised by data acquisition, e.g. workpiece identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Analysis (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Automation & Control Theory (AREA)
- Quality & Reliability (AREA)
- Manufacturing & Machinery (AREA)
- Computational Mathematics (AREA)
- Algebra (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Abstract
本发明提供一种基于工业大数据图半监督新类挖掘的故障诊断方法,涉及故障监测与诊断技术领域。基于工业大数据图半监督新类挖掘的故障诊断方法,首先采集工业生产过程的数据,并对其进行降维处理;然后对数据点按已标记数据点和未标记数据点进行初始标签标记,并计算软标签矩阵,通过软标签矩阵对故障数据的类别进行诊断;最后对新故障类型重新进行诊断,直到发现所有新的故障类型。本发明的基于工业大数据图半监督新类挖掘的故障诊断方法,实现了对原有故障类型的识别以及未知故障类型的发现,大大降低了故障类型的误报警率,同时提高了故障检测的准确性。
Description
技术领域
本发明涉及故障监测与诊断技术领域,尤其涉及一种基于工业大数据图半监督新类挖掘的故障诊断方法。
背景技术
随着现代工业的迅速发展,现代企业中生产设备日趋大型化、连续化、高速化和自动化,设备的结构与组成十分复杂,生产规模非常庞大,各部门之间的联系也特别密切。实际的生产过程有线性的、非线性的、时不变的、时变的等,对于不同的生产过程所具有的特征,应选用不同的故障监测方法,这样才能有效地检测到故障。基于图的半监督故障诊断算法可以准确识别各种不同类别的故障。
半监督算法,如图1所示,指既利用标记数据也利用未标记数据来建立学习模型,最终通过该模型能够预测输入数据的标记。半监督分为两类:归纳半监督和直推半监督,定义分别为:
归纳半监督:给定训练集归纳半监督的目的是学习得到一个函数f:X→Y,使得该函数能够很好地预测训练集以外的输入数据的标记。
直推半监督:给定训练集直推半监督的目的是学习得到一个函数f:Xl+u→Yl+u,使得该函数能够很好地预测训练集中未标记样本的标记。
实际工业过程中将会产生大量的生产过程数据,但是对所有数据进行人工标记显然是不现实的,所以应用半监督算法,即少量数据进行人工标记并保留大多数数据处于未标记状态,对于复杂的工业故障诊断是十分可取的。在众多半监督算法中,基于图的半监督学习算法最大的特点就是用图来表示数据之间的关系,其中图的结点表示数据点,点与点之间存在着边,这些边被赋予权重,权重代表数据点之间的相似度。最终从图学得一个用于对未标记数据进行分类标记的实值函数。
故障诊断算法的具体工业背景是电熔镁炉的生产过程。电熔镁炉生产过程得到的最终产品是电熔镁砂。电熔镁砂是一种广泛应用于化学、航天、冶金等领域的重要耐火材料,在我国,主要利用三相交流电熔镁炉来生产电熔镁砂。电熔镁炉实际上是一种埋弧炉,属于矿热炉而不是电弧炉,其主要以熔融状态下电流通过物料所产生的物料电阻热为主要热源,同时伴有电弧热,它的热量集中,能有效的将物料加热到熔点2800℃以上,有利于熔炼电熔镁砂。电熔镁炉的设备主要包括:变压器、电路短网、电极、电极升降装置及炉体等。
目前传统的基于图的半监督故障诊断算法对于在电熔镁炉生产过程的已知故障类别的诊断具有很好的效果,但是由于传感器漂移、设备老化、原材料变化和催化剂活性降低等原因,使得过程总是在不断地发生缓慢变化,这样也就可能导致新的故障类型的产生。目前传统的基于图的半监督故障诊断算法在发现新类型的故障方面的性能还是较差的,无法准确发现新类型的故障。
发明内容
针对现有技术的缺陷,本发明提供一种基于工业大数据图半监督新类挖掘的故障诊断方法,挖掘电熔镁炉生产过程的新故障类型。
一种基于工业大数据图半监督新类挖掘的故障诊断方法,包括以下步骤:
步骤1:采集工业生产过程中的数据,并将采集到的数据进行降维处理,生成一个包含多种数据类型的工业生产过程的大数据池;
步骤2:从工业生产过程的大数据池中随机选取n个采样数据,对采样数据进行初始标签的标记,具体方法为:
已知n个采样数据{x1,x2,…,xn},这些采样数据总共有c个种类,首先设置一个初始标记矩阵Y∈Rn×(c+1),对于人工已标记的第i个数据xi,若该数据属于第j类,1≤j≤c,则在初始标记矩阵Y的第j列设为1,其他列均设为0;对于未标记数据,则在初始标记矩阵Y的前c列均设为0,第c+1列设为1,得到已标记数据和未标记数据的初始标记矩阵Y;
步骤3:采用高斯核函数构建采样数据点的近邻权重矩阵W,该矩阵为一个n×n的且对称的权重系数矩阵,矩阵中的每个元素对应两个采样数据点之间的权重关系,第i个采样数据点xi与第i′个采样数据点xi′之间的权重关系如下式所示:
其中,||·||为向量的二范数,即||x||2=xTx,σ为权重的宽度参数;
步骤4:将采样数据点间的权重系数做标准化处理,得到标准化的权重矩阵;
第i个数据点和第i′个数据点间的权重系数标准化公式如下所示:
其中,di=∑i′Wii′为权重矩阵W的第i行元素之和,di′=∑iWi′i为权重矩阵W的第i′行元素之和;
得到标准化后的权重矩阵如下式所示:
其中,为近邻权重矩阵W的标准化矩阵,D是一个对角矩阵,且对角线上的元素为di=∑i′Wii′;
步骤5:计算采样数据点的软标签矩阵F∈Rn×(c+1),其计算公式如下所示:
F=(E-EaB)-1(E-Ea)Y
其中,E是n×n的单位矩阵,Ea是n×n的对角矩阵,矩阵中每个对角元素都是大于0小于1的正值,每个对角元素对应于大数据池中的一个数据点,当数据点是已标记数据,则该元素为一个接近于1的随机数,当数据是未标记数据,则该元素为一个接近于0的随机数;矩阵其中,矩阵为对角矩阵D的标准化的矩阵,中的对角元素分别为
步骤6:通过软标签矩阵的计算结果对采样数据点所属的故障类别进行诊断,对于数据点xi的故障类别的判别公式为:
yi=argmaxj≤c+1Fij
其中,yi为第i个采样数据的类别标签;
如果yi满足yi=c+1,则xi为新发现的故障类别;
步骤7:判断新发现的故障类别的数据中是否还存在多种新类数据,如果存在则对新发现的故障类别中的故障数据再进行一次分类,在之前的数据标记信息保持不变的基础上,再在新故障类型的数据中仅标记一个或两个数据,然后重复步骤3-步骤6,再次对数据进行新类挖掘,直到再无新的故障类别出现,完成对采样数据故障类型的标记。
由上述技术方案可知,本发明的有益效果在于:本发明提供的一种基于图的半监督发现新故障类型的故障诊断方法,进行故障诊断的数据不再是单纯的视频图像数据,而是由图像数据和电流物理数据融合建立的大数据池。大数据池与传统的单一数据类型相比,能够实现全流程全视角全周期地描述工况,使得故障诊断的性能大大提升。本发明不仅实现了对于多种故障数据类型的准确分类,而且实现了在电熔镁炉的生产过程出现新的未知的故障类型的情况下,可以对其做出及时诊断,大大降低了误报警的情况,进一步提高了故障检测的准确性。
附图说明
图1为半监督算法的学习示例图;
图2为本发明实施例提供电熔镁炉生产工艺流程示意图;
图3为本发明实施例提供的一种基于图的半监督发现新故障类型的故障诊断方法的流程图;
图4为本发明实施例提供的对电熔镁炉生产过程的数据进行初始标签标记的示意图;
图5为本发明实施例提供的对电熔镁炉生产过程的数据进行故障类型识别以及发现新的故障类型的示意图;
图6为本发明实施例提供的对电熔镁炉生产过程的数据进行标签再标记的示意图;
图7为本发明实施例提供的对电熔镁炉生产过程的数据进行新故障类型发掘的示意图;
图8为本发明实施例提供的利用人工全标记的正确的电熔镁炉数据的故障类别的示意图。
图中:1、变压器;2、短网;3、电极夹;4、电极;5、炉壳;6、小车;7、电弧;8、熔池。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
本实施例以某工厂电熔镁炉的生产过程为例,使用本发明的基于工业大数据图半监督新类挖掘的故障诊断方法对电熔镁炉生产过程中的故障进行诊断。
电熔镁炉的基本工作原理如图2所示,电熔镁砂是一种广泛应用于化学、航天、冶金等领域的重要耐火材料,在我国,主要利用三相交流电熔镁炉来生产电熔镁砂。电熔镁炉实际上是一种埋弧炉,属于矿热炉而不是电弧炉,其主要以熔融状态下电流通过物料所产生的物料电阻热为主要热源,同时伴有电弧热,它的热量集中,能有效的将物料加热到熔点2800℃以上,有利于熔炼电熔镁砂。电熔镁炉的设备主要包括:变压器1、短网2、电极夹3、电极4、炉壳5、小车6、电弧7和熔池8等。炉边设有控制室,可控制电极升降。
炉体是生产电熔镁砂的主要反应区,物料的熔化、排析、结晶过程都在炉体内完成,炉体由炉底及炉壳构成,熔炉被放置在小车上,炉壳一般为圆柱形。电极把持器是电极升降装置不可缺少的一部分,其不但可以用来调节电极的松紧程度,灵活的夹放电极,还可以把电流传送到电极上,电极把持器固定在升降台上,将电极夹持至一定的高度位置,就可以把经过变压器处理的电流传送到电极上,在熔化过程中,随着物料的不断熔化,同时向上提高电极,当炉体内物料熔化过程完成后,将电极移出炉体,通过小车将炉体送到冷却室进行自然冷却结晶,最终形成密度大、熔点高的氧化镁晶体。
一种基于工业大数据图半监督新类挖掘的故障诊断方法,如图3所示,包括以下步骤:
步骤1:采集电熔镁炉生产的工业生产过程中的数据,并生成电熔镁炉生产流程的大数据池;
本实施例采集电熔镁炉内生产过程的视频图像数据以及生产过程中电熔镁炉三相电极的电流数据,将采集到的视频数据截取成图片数据,并对截取后的图片数据降维处理,最后将降维后的图像数据与以及电熔镁炉三相电极的电流数据合并在一个列向量中,建立一个包含多种数据类型的电熔镁炉生产流程的大数据池;
本实施中,电熔镁炉生产流程大数据池的十组数据如表1所示,每组数据包括降维处理的视图片数据、电熔镁炉三相电极的电流数据以及已知的人工全标记类别。
表1电熔镁炉生产流程大数据池中的十组数据
步骤2:从电熔镁炉生产流程的大数据池中随机选取n个采样数据,对采样数据进行初始标签的标记,具体方法为:
已知n个采样数据{x1,x2,…,xn},这些采样数据总共有c个种类,首先设置一个初始标记矩阵Y∈Rn×(c+1),对于人工已标记的第i个数据xi,若该数据属于第j类,1≤j≤c,则在初始标记矩阵Y的第j列设为1,其他列均设为0。对于未标记数据,则在初始标记矩阵Y的前c列均设为0,第(c+1)列设为1,得到已标记数据和未标记数据的初始标记矩阵Y;
本实施例中,表1中的数据点相对应的初始标记如表2所示,采样点1和采样点5为人工已标记数据,且采样点1属于第一类,采样点5属于第二类,其他采样点数据为未标记数据。初始标签标记如图4所示,两个维度分别为数据表中的第一列和第二列。
表2采样数据的初始标记矩阵
步骤3:采用高斯核函数构建采样数据点的近邻权重矩阵W,该矩阵为一个n×n的且对称的权重系数矩阵,矩阵中的每个元素对应两个采样数据点之间的权重关系,第i个采样数据点xi与第i′个采样数据点xi′之间的权重关系如下式所示:
其中,||·||为向量的二范数,即||x||2=xTx,σ为权重的宽度参数。
本实施例中,表1中所给出的10个采样数据之间的权重系数如表3所示。
表3各点之间的权重系数
0 | 3.082e-07 | 0.0045 | 5.797e-20 | 2.514e-06 | 0.0013 | 9.042e-05 | 2.238e-30 | 1.445e-17 | 7.783e-20 |
3.082e-07 | 0 | 4.805e-08 | 2.769e-24 | 2.870e-11 | 2.474e-09 | 1.163e-07 | 3.274e-15 | 4.811e-16 | 3.754e-16 |
0.0045 | 4.805e-08 | 0 | 7.574e-18 | 3.215e-04 | 0.0435 | 0.0084 | 1.688e-32 | 7.503e-30 | 7.435e-22 |
5.797e-20 | 2.769e-24 | 7.574e-18 | 0 | 2.214e-14 | 4.334e-17 | 1.976e-17 | 1.322e-49 | 1.151e-36 | 5.685e-39 |
2.514e-06 | 2.870e-11 | 3.215e-04 | 2.214e-14 | 0 | 0.0017 | 1.638e-04 | 5.699e-36 | 3.846e-23 | 2.445e-25 |
0.0013 | 2.474e-09 | 0.0435 | 4.334e-17 | 0.0017 | 0 | 7.561e-04 | 2.949e-33 | 2.243e-20 | 1.401e-22 |
9.042e-05 | 1.163e-07 | 0.0084 | 1.976e-17 | 1.638e-04 | 7.561e-04 | 0 | 3.371e-33 | 5.738e-21 | 1.99e-21 |
2.238e-30 | 3.274e-15 | 1.688e-32 | 1.322e-49 | 5.699e-36 | 2.949e-33 | 3.371e-33 | 0 | 2.194e-14 | 1.149e-11 |
1.445e-17 | 4.811e-16 | 7.503e-30 | 1.151e-36 | 3.846e-23 | 2.243e-20 | 5.738e-21 | 2.194e-14 | 0 | 7.031e-07 |
7.783e-20 | 3.754e-16 | 7.435e-22 | 5.685e-39 | 2.445e-25 | 1.401e-22 | 1.99e-21 | 1.149e-11 | 7.031e-07 | 0 |
步骤4:将采样数据点间的权重系数做标准化处理,得到标准化的权重矩阵;
第i个采样数据点xi与第i′个采样数据点xi′间的权重系数标准化公式如下所示:
其中,di=∑i′Wii′为权重矩阵W的第i行元素之和,di′=∑iWi′i为权重矩阵W的第i′行元素之和;
得到标准化后的权重矩阵如下式所示:
其中,为近邻权重矩阵W的标准化矩阵,D是一个对角矩阵,且对角线上的元素分别为di=∑i′Wii′;
步骤5:计算采样数据点的软标签矩阵F∈Rn×(c+1),其计算公式如下所示:
F=(E-EaB)-1(E-Ea)Y
其中,E是n×n的单位矩阵,Ea是n×n的对角矩阵,矩阵中每个对角元素都是大于0小于1的正值,每个对角元素对应于大数据池中的一个数据点,当数据点是已标记数据,则该元素为一个接近于1的随机数,当数据是未标记数据,则该元素为一个接近于0的随机数,矩阵其中,矩阵为矩阵D的标准化的矩阵,中的对角元素分别为
本实施例中,表1中给出的10个采样数据的软标签矩阵如表4所示。
表4软标签矩阵
步骤6:通过软标签矩阵的计算结果对采样数据点所属的故障类别进行诊断,对于数据点xi的故障类别的判别公式为:
yi=argmaxj≤c+1Fij
其中,yi为第i个采样数据的类别标签;
如果yi满足yi=c+1,则xi为新发现的故障类别。
本实施例中,表1中所给出的10个采样数据的故障类别如表5所示,从表中可以看出采样数据点1、2和3属于第一类,采样数据点4、5和6属于第二类,采样数据点7、8、9和10属于新发现的故障类别。
本实施例中,对电熔镁炉生产过程的数据进行故障类型识别以及发现新的故障类型如图5所示,三角形代表新发现的故障类型。
表5各数据的故障类别
步骤7:判断新发现的故障类别的数据中是否还存在多类数据,如果存在则对新发现的故障类别中的故障数据再进行一次分类,在之前的数据标记信息保持不变的基础上,再在新故障类型的数据中只标记一到两个数据,再标记过程如图6所示,本示例中再标记了一个新类型的数据,然后重复步骤3-步骤6,第二次新故障类型发掘结果如图7所示,由图可知再无新的故障类别出现,完成对采样数据故障类型的标记。
本发明实施例同时提供了利用人工全标记的正确的电熔镁炉数据的故障类别,如图8所示,将本发明方法对电熔镁炉故障数据的分类结果与之进行对比,得出本方法最终的分类准确率为93.6%。可知本发明方法不仅做到了对新故障类型的挖掘,还可以对现有数据进行正确的分类。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明权利要求所限定的范围。
Claims (3)
1.一种基于工业大数据图半监督新类挖掘的故障诊断方法,其特征在于:包括以下步骤:
步骤1:采集工业生产过程中的数据,并将采集到的数据进行降维处理,生成一个包含多种数据类型的工业生产过程的大数据池;
步骤2:从工业生产过程的大数据池中随机选取n个采样数据,对采样数据进行初始标签的标记,具体方法为:
已知n个采样数据{x1,x2,…,xn},这些采样数据总共有c个种类,首先设置一个初始标记矩阵Y∈Rn×(c+1),对于人工已标记的第i个数据xi,若该数据属于第j类,1≤j≤c,则在初始标记矩阵Y的第j列设为1,其他列均设为0;对于未标记数据,则在初始标记矩阵Y的前c列均设为0,第c+1列设为1,得到已标记数据和未标记数据的初始标记矩阵Y;
步骤3:采用高斯核函数构建采样数据点的近邻权重矩阵W,该矩阵为一个n×n的且对称的权重系数矩阵,矩阵中的每个元素对应两个采样数据点之间的权重关系;
步骤4:将采样数据点间的权重系数做标准化处理,得到标准化的权重矩阵
步骤5:计算采样数据点的软标签矩阵F∈Rn×(c+1),其计算公式如下所示:
F=(E-EaB)-1(E-Ea)Y
其中,E是n×n的单位矩阵,Ea是n×n的对角矩阵,矩阵中每个对角元素都是大于0小于1的正值,每个对角元素对应于大数据池中的一个数据点,当数据点是已标记数据,则该元素为一个接近于1的随机数,当数据是未标记数据,则该元素为一个接近于0的随机数,矩阵其中,矩阵为对角矩阵D的标准化的矩阵;
步骤6:通过软标签矩阵的计算结果对采样数据点所属的故障类别进行诊断,对于数据点xi的故障类别的判别公式为:
yi=argmaxj≤c+1Fij
其中,yi为第i个采样数据的类别标签;
如果yi满足yi=c+1,则xi为新发现的故障类别;
步骤7:判断新发现的故障类别的数据中是否还存在多种新类数据,如果存在则对新发现的故障类别中的故障数据再进行一次分类,在之前的数据标记信息保持不变的基础上,再在新故障类型的数据中仅标记一个或两个数据,然后重复步骤3-步骤6,再次对数据进行新类挖掘,直到再无新的故障类别出现,完成对采样数据故障类型的标记。
2.根据权利要求1所述的基于工业大数据图半监督新类挖掘的故障诊断方法,其特征在于:步骤3所述两个采样数据点之间的权重关系如下式所示:
<mrow>
<msub>
<mi>W</mi>
<mrow>
<msup>
<mi>ii</mi>
<mo>&prime;</mo>
</msup>
</mrow>
</msub>
<mo>=</mo>
<msub>
<mi>W</mi>
<mrow>
<msup>
<mi>i</mi>
<mo>&prime;</mo>
</msup>
<mi>i</mi>
</mrow>
</msub>
<mo>=</mo>
<msup>
<mi>e</mi>
<mrow>
<mo>-</mo>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>x</mi>
<mi>i</mi>
</msub>
<mo>-</mo>
<msub>
<mi>x</mi>
<msup>
<mi>i</mi>
<mo>&prime;</mo>
</msup>
</msub>
<mo>|</mo>
<msup>
<mo>|</mo>
<mn>2</mn>
</msup>
<mo>/</mo>
<msup>
<mi>&sigma;</mi>
<mn>2</mn>
</msup>
</mrow>
</msup>
</mrow>
其中,Wii′为第i个采样数据点xi与第i′个采样数据点xi′之间的权重关系,||·||为向量的二范数,即||x||2=xTx,σ为权重的宽度参数。
3.根据权利要求2所述的基于工业大数据图半监督新类挖掘的故障诊断方法,其特征在于:步骤4所述将采样数据点间的权重系数做标准化处理,得到标准化的权重矩阵的具体方法为:
第i个数据点和第i′个数据点间的权重系数标准化公式如下所示:
<mrow>
<msub>
<mover>
<mi>W</mi>
<mo>~</mo>
</mover>
<mrow>
<msup>
<mi>ii</mi>
<mo>&prime;</mo>
</msup>
</mrow>
</msub>
<mo>=</mo>
<msub>
<mi>W</mi>
<mrow>
<msup>
<mi>ii</mi>
<mo>&prime;</mo>
</msup>
</mrow>
</msub>
<mo>/</mo>
<mrow>
<mo>(</mo>
<msqrt>
<mrow>
<msub>
<mi>d</mi>
<mi>i</mi>
</msub>
<msub>
<mi>d</mi>
<msup>
<mi>i</mi>
<mo>&prime;</mo>
</msup>
</msub>
</mrow>
</msqrt>
<mo>)</mo>
</mrow>
</mrow>
其中,di=∑i′Wii′为权重矩阵W的第i行元素之和,di′=∑iWi′i为权重矩阵W的第i′行元素之和;
得到标准化后的权重矩阵如下式所示:
<mrow>
<mover>
<mi>W</mi>
<mo>~</mo>
</mover>
<mo>=</mo>
<msup>
<mi>D</mi>
<mrow>
<mo>-</mo>
<mn>1</mn>
<mo>/</mo>
<mn>2</mn>
</mrow>
</msup>
<msup>
<mi>WD</mi>
<mrow>
<mo>-</mo>
<mn>1</mn>
<mo>/</mo>
<mn>2</mn>
</mrow>
</msup>
</mrow>
其中,为近邻权重矩阵W的标准化矩阵,D是一个对角矩阵,且对角线上的元素分别为di=∑i′Wii′。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711053861.6A CN107861481B (zh) | 2017-10-31 | 2017-10-31 | 基于工业大数据图半监督新类挖掘的故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711053861.6A CN107861481B (zh) | 2017-10-31 | 2017-10-31 | 基于工业大数据图半监督新类挖掘的故障诊断方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107861481A true CN107861481A (zh) | 2018-03-30 |
CN107861481B CN107861481B (zh) | 2019-12-10 |
Family
ID=61696492
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711053861.6A Active CN107861481B (zh) | 2017-10-31 | 2017-10-31 | 基于工业大数据图半监督新类挖掘的故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107861481B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109100142A (zh) * | 2018-06-26 | 2018-12-28 | 北京交通大学 | 一种基于图论的轴承半监督故障诊断方法 |
CN109801713A (zh) * | 2019-01-30 | 2019-05-24 | 华侨大学 | 一种基于图表模型的健康风险预测方法 |
CN109949437A (zh) * | 2019-03-13 | 2019-06-28 | 东北大学 | 基于稀疏化的异构数据协同工业故障诊断方法 |
CN112415977A (zh) * | 2019-08-22 | 2021-02-26 | 通用汽车环球科技运作有限责任公司 | 用于机动车辆的自适应故障诊断系统 |
CN112783865A (zh) * | 2021-01-29 | 2021-05-11 | 杭州优云软件有限公司 | 一种半监督人机结合的运维故障库生成方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090157384A1 (en) * | 2007-12-12 | 2009-06-18 | Microsoft Corporation | Semi-supervised part-of-speech tagging |
CN104463202A (zh) * | 2014-11-28 | 2015-03-25 | 苏州大学 | 一种多类图像半监督分类方法及系统 |
CN106596900A (zh) * | 2016-12-13 | 2017-04-26 | 贵州电网有限责任公司电力科学研究院 | 一种基于改进图的半监督分类的变压器故障诊断方法 |
CN106839769A (zh) * | 2017-03-24 | 2017-06-13 | 东北大学 | 基于多流形半监督局部‑全局的电熔镁炉故障监测方法 |
CN107065828A (zh) * | 2017-03-24 | 2017-08-18 | 东北大学 | 基于知识数据的半监督核判别分析故障诊断方法 |
-
2017
- 2017-10-31 CN CN201711053861.6A patent/CN107861481B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090157384A1 (en) * | 2007-12-12 | 2009-06-18 | Microsoft Corporation | Semi-supervised part-of-speech tagging |
CN104463202A (zh) * | 2014-11-28 | 2015-03-25 | 苏州大学 | 一种多类图像半监督分类方法及系统 |
CN106596900A (zh) * | 2016-12-13 | 2017-04-26 | 贵州电网有限责任公司电力科学研究院 | 一种基于改进图的半监督分类的变压器故障诊断方法 |
CN106839769A (zh) * | 2017-03-24 | 2017-06-13 | 东北大学 | 基于多流形半监督局部‑全局的电熔镁炉故障监测方法 |
CN107065828A (zh) * | 2017-03-24 | 2017-08-18 | 东北大学 | 基于知识数据的半监督核判别分析故障诊断方法 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109100142A (zh) * | 2018-06-26 | 2018-12-28 | 北京交通大学 | 一种基于图论的轴承半监督故障诊断方法 |
CN109100142B (zh) * | 2018-06-26 | 2019-09-13 | 北京交通大学 | 一种基于图论的轴承半监督故障诊断方法 |
CN109801713A (zh) * | 2019-01-30 | 2019-05-24 | 华侨大学 | 一种基于图表模型的健康风险预测方法 |
CN109949437A (zh) * | 2019-03-13 | 2019-06-28 | 东北大学 | 基于稀疏化的异构数据协同工业故障诊断方法 |
CN109949437B (zh) * | 2019-03-13 | 2021-06-15 | 东北大学 | 基于稀疏化的异构数据协同工业故障诊断方法 |
CN112415977A (zh) * | 2019-08-22 | 2021-02-26 | 通用汽车环球科技运作有限责任公司 | 用于机动车辆的自适应故障诊断系统 |
CN112783865A (zh) * | 2021-01-29 | 2021-05-11 | 杭州优云软件有限公司 | 一种半监督人机结合的运维故障库生成方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN107861481B (zh) | 2019-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107861481A (zh) | 基于工业大数据图半监督新类挖掘的故障诊断方法 | |
CN107976992B (zh) | 基于图半监督支持向量机的工业过程大数据故障监测方法 | |
CN107817745B (zh) | 基于丛流形核线性判别分析的工业过程故障监测方法 | |
CN107065828B (zh) | 基于知识数据的半监督核判别分析故障诊断方法 | |
CN106839769B (zh) | 基于多流形半监督局部-全局的电熔镁炉故障监测方法 | |
CN107918379B (zh) | 基于图半监督代价敏感的工业大数据早期故障检测方法 | |
CN110797096B (zh) | 一种基于深度学习的耐热合金高温力学性能预测方法 | |
CN108181891A (zh) | 基于智能核主元分析的工业大数据故障诊断方法 | |
CN107748901B (zh) | 基于相似性局部样条回归的工业过程故障诊断方法 | |
CN108182445A (zh) | 基于大数据智能核独立元分析的过程故障识别方法 | |
CN104731083B (zh) | 一种基于自适应特征提取的工业故障诊断方法及应用 | |
CN107092743A (zh) | 基于规则辅助的高炉冶炼过程数据驱动建模方法 | |
CN106599450A (zh) | 基于先验知识的核灵活流形嵌入电熔镁炉故障监测方法 | |
CN110320468B (zh) | 一种基于向量机的开关柜过热故障诊断方法 | |
CN108038493A (zh) | 基于回归智能判别嵌入的工业大数据过程故障监测方法 | |
CN104793606A (zh) | 基于改进的kpca和隐马尔科夫模型的工业故障诊断方法 | |
CN104199441A (zh) | 基于稀疏贡献图的高炉多工况故障分离方法及系统 | |
CN109949437B (zh) | 基于稀疏化的异构数据协同工业故障诊断方法 | |
CN106295685A (zh) | 改进的直推式支持向量机的大型高炉故障分类算法及应用 | |
CN107831743B (zh) | 基于可信软标签线性判别分析的工业过程故障诊断方法 | |
CN112582032B (zh) | 基于机器学习模型设计高热稳定性铁基软磁非晶合金 | |
CN109657731A (zh) | 一种微滴数字pcr仪抗干扰分类方法 | |
CN109885032B (zh) | 基于邻域投影保持的异构数据协同建模工业故障检测方法 | |
CN117078641A (zh) | 基于主动强化学习与多模态的电熔镁炉欠烧工况识别方法 | |
CN115496124A (zh) | 一种基于极小极大熵协同训练的高炉故障诊断方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |