CN110045691B - 一种多源异构大数据的多任务处理故障监测方法 - Google Patents

一种多源异构大数据的多任务处理故障监测方法 Download PDF

Info

Publication number
CN110045691B
CN110045691B CN201910189215.5A CN201910189215A CN110045691B CN 110045691 B CN110045691 B CN 110045691B CN 201910189215 A CN201910189215 A CN 201910189215A CN 110045691 B CN110045691 B CN 110045691B
Authority
CN
China
Prior art keywords
data
task
source
sources
window
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910189215.5A
Other languages
English (en)
Other versions
CN110045691A (zh
Inventor
于忠源
张颖伟
付元建
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeastern University China
Original Assignee
Northeastern University China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeastern University China filed Critical Northeastern University China
Priority to CN201910189215.5A priority Critical patent/CN110045691B/zh
Publication of CN110045691A publication Critical patent/CN110045691A/zh
Application granted granted Critical
Publication of CN110045691B publication Critical patent/CN110045691B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/418Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
    • G05B19/41885Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM] characterised by modeling, simulation of the manufacturing system
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Manufacturing & Machinery (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Complex Calculations (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明提出一种多源异构大数据的多任务处理故障监测方法,包括如下步骤:将采集来的不同来源的数据分别进行提取转化处理,得到总的转化处理后的数据;按照规定的时间间隔T,将总的转化处理后的数据进行数据窗口划分;将数据窗口划分后的数据按照采样时间先后顺序进行任务划分,得到任务划分后的数据;基于任务划分后的数据建立目标函数;求解多源异构大数据的多任务处理模型的目标函数,得到最优解,即为多任务的回归模型;基于多任务的回归模型,针对多源异构测试数据进行在线监测;本发明解决了工业大数据中数据来源广泛,类型构成多样,数据维度不统一难以协同建模的问题,监测结果表明本发明提高了故障检测的准确性。

Description

一种多源异构大数据的多任务处理故障监测方法
技术领域
本发明属于故障监测与诊断技术领域,具体涉及一种多源异构大数据的多任务处理故障 监测方法。
背景技术
现代企业中生产设备日趋大型化、连续化、高速化和自动化,设备的结构与组成愈发复 杂,生产规模逐渐变得非常庞大。精确的过程故障检测对提高生产质量和避免生产事故非常 重要。因此,过去几年来,大量研究人员重视开发有效的过程监控技术。特别是,随着计算 机和传感器技术在工业过程中的广泛应用,测量和存储了许多过程数据。测量数据包含大量 的过程操作信息,针对与这些信息进行分析不同的故障监测方法,这样才能有效地检测到故 障。而传统的监测方法,例如采用统计分析技术,主成分分析(PCA),偏最小二乘法(PLS) 和独立分量分析(ICA)在内的古典多变量统计过程监测(MSPM)方法以及相应的改进方法 在当下对于大数据背景下的工业故障检测其处理能力不足,分析能力不足的问题日益明显。 因为大数据的海量、多维、多样、变化快等特性,使得小数据环境下基于内存处理的传统机 器学习算法基本已不再适用于大数据下的应用问题。随着工业系统的发展,采集的数据也日 益复杂,数据之多且维度之高已经成为了大数据统一建模并进行故障监测和诊断的一大障碍。 所以如何对这样高维度的大数据进行特征提取来简化接下来的故障监测和诊断已成为当前所 关注的问题。近几年随着计算机和自动化技术的蓬勃发展,工业数据的采集、处理和获取获 得了前所未有的发展,为统一建立生产过程的物理化学变量和图像声音视频的大数据池提供 了可能。
为此我们提出一种针对于大规模工业数据多来源异构数据的统计处理框架,可以有效的 将监测图像图像的ASM能量、对比度、逆差距、熵、自相关等相关信息以及物理化学变量 统一建模,发挥工业大数据的优势,通过采集的传统数据和多媒体流异构数据进行统一建模。
发明内容
本发明提出一种多源异构大数据的多任务处理故障监测方法,这是一种处理多源异构大 数据的方法框架,主要针对于解决大数据工业背景下的数据来源广泛,类型构成多样,数据 维度不统一难以协同建模的问题,在这样的背景下,我们提出了一种新方法将多源异构数据统 一协同建模,将传统的传感器数据及物理化学变量,与视频数据结合,采用划分多数据窗口 的方法,之后在数据窗口内以多任务的模型来尽可能多的处理数据。
一种多源异构大数据的多任务处理故障监测方法,具体步骤如下:
步骤1:将采集来的不同来源的数据分别进行提取转化处理,得到总的转化处理后的数 据;
步骤1.1:对视频数据的提取转化处理,得到处理后的视频数据:
步骤1.1.1:根据故障监测对象不同,人工提取视频数据的关键帧图像,关键帧图像的总 的采样时间为各个不同来源的数据采样时间的最小公倍数;
步骤1.1.2:对关键帧图像进行特征提取:将每一张关键帧图像的像素矩阵转化为灰度矩 阵,作为多维向量,并对每一个多维向量提取图像特征,包括:ASM能量(AngularSecond Moment)、对比度、逆差距、熵和自相关;
所述ASM能量即每个矩阵元素的平方和;
步骤1.2:对传统物理化学变量及传感器数据的提取转化处理,得到处理后的传统物理化 学变量及传感器数据:
按照视频数据关键帧的时段,采集传统物理化学变量及传感器数据,其总的采样时间为 各个不同来源的数据采样时间的最小公倍数;
步骤1.3:将处理后的视频数据、处理后的传统物理化学变量及传感器数据,按照顺序组 成同一数据矩阵,即总的转化处理后的数据,其中,同一数据矩阵的行为某一采样时刻对应 的不同数据源的监测值,同一数据矩阵的列为采样时间,按照采样时间先后顺序排列;
所述不同来源的数据简称不同数据源,具体包括视频数据中提取的图像特征、传统物理 化学变量及传感器数据;
步骤2:按照规定的时间间隔T,将总的转化处理后的数据进行数据窗口划分,得到数据 窗口划分后的数据,其中,规定的时间间隔T小于总采样时间,以保证不同数据窗口内的数 据结构一致,如果时间排在最后的数据无法保证构成完整的数据窗口,将其删掉,以保证数 据窗口的整齐性;
步骤3:将数据窗口划分后的数据按照采样时间先后顺序进行任务划分,得到任务划分 后的数据:只要数据窗口划分后的数据中某一时刻存在数据,无论该数据属于哪种数据源, 那么以这个时刻为基础对应找到这时刻的其他数据源,将能够找到的这一时刻的不同数据源 进行排列组合,即设某一时刻对应的数据源为a个,任意取b个数据源作为一个任务,则总 的任务数为从a个数据源中任取b个作为任务的总任务数,记作
Figure BDA0001993865580000021
计算视频数据与传 统变量或者其他相结合的数据源在时间对应上误差,取误差小于某一阈值的对应任务,去掉 误差大于某一阈值的对应任务,得到任务划分后的数据;
所述任务划分后的数据,在每一数据窗口内任务数量相同,并保证每一数据窗口中对应 的任务内部的数据源数量完全相同;
步骤4:基于任务划分后的数据建立目标函数:数据数据窗口由z表示,其中z=1,...,Z, Z为数据数据窗口的总数;将每一数据数据窗口中的数据划分为m个任务;
Figure BDA0001993865580000031
Figure BDA0001993865580000032
Ni表示第i个任务的数据样本总数;s=1,...,S,表示第i个任务中数 据源数为S;
Figure BDA0001993865580000033
即表示的是第i个任务的第j个样本的第s个数据源的数据和其对应的 标签值;每一数据窗口内所有任务的所有数据源的标签值应当是一致的,
Figure BDA0001993865580000034
S值应 相等。
根据多源异构数据的特点,我们将逻辑回归方法改进以适用于多源数据的处理,使用多 源逻辑回归来进行有效的分类,引入对数损失函数作为我们的损失函数。因为使用逻辑回归, 我们可以直接对分类可能性进行建模,无需事先假设数据分布,无需事先知道样本数据的分 布,这样就避免了假设分布不准确所带来的问题。同时不仅预测出类别,通过sigmoid函数 的压缩,对样本点到局侧面的“距离”,即对数几率比值C(C∈R),压缩到(0,1)还且给出具体 的概率预测值。而且对数几率函数是任意阶可导的凸函数,有很好的数学性质,现有的许多 数值优化算法都可直接用于求取最优解。
根据多源异构数据无法事先知道样本数据分布的特点,将对数损失函数改进为下面线性 形式:
Figure BDA0001993865580000035
其中
Figure BDA0001993865580000036
S是第i个任务的第s源数据的参数向量,ws表示第s源的权 重,L(·)表示损失函数;
这种多任务逻辑回归形式不同于原有单一数据源的逻辑回归形式,其创新在于使用同一 种目标函数来有效的处理不同数据源的数据。通过对参数向量bs i调整可以保证每一任务的多 个数据源的数据得到最有效的利用,这样保证了不同数据窗口的对应任务的参数向量bs i一致, 又可保证数据窗口内不同任务的参数向量有这显著差异性。同时采用数据源权重ws使得不同 来源数据的重要程度得以展现,可以有效地区分不同来源数据对目标函数的贡献程度。
由此基于任务划分后的数据建立多源逻辑回归模型,即建立多源异构大数据的多任务处 理模型的目标函数,公式如下:
Figure BDA0001993865580000041
目标函数的第二项,是一个关于模型参数的2,1-范数正则化,这使得模型将一个具有需 稀疏性的解决方案,也就是说,涉及特定源的所有模型都受限于为这个特定源选择一组共同 的特征。
将B=[b1,...,bm]表示为所有模型参数的集合,其中
Figure BDA0001993865580000042
表示第i个任务下所有源 数据的参数向量组成的向量;由于之前假设共有S个数据源,并且第s个源的特征维度表示 为ps,为了表示方便,引入索引函数I(s,k),这样BI(s,k)就表示对应于第s个数据源中第k个 特征的所有任务模型参数。
数据源权重ws的值由约束项进行规范,给出ws的迭代计算公式如下:
Figure BDA0001993865580000043
这个权重迭代计算公式表明,一个来源的权重与其观察值与对数尺度真值之间的差异成 反比。负对数函数将0和1范围内的数字映射到0到无穷的范围,因此有助于扩大源权重的 差异。结果更接近真相的来源将具有更高的权重。因此,迭代计算公式是一个合理的约束函 数,它给出了有意义并且直观的权重更新公式。
步骤5:求解多源异构大数据的多任务处理模型的目标函数,得到最优解,即为多任务 的回归模型;
对目标函数进行简化,公式为:
Figure BDA0001993865580000044
我们通过将其重新表示为等价的光滑凸优化问题来加速计算,然后通过Nesterov方法, 用于平滑凸优化的最优一阶黑箱方法来求解。
引入一个附加变量
Figure BDA0001993865580000051
其中,tc是BI(s,k)的上界值,目标函数简化公式修改为:
Figure BDA0001993865580000052
其中,
Figure BDA0001993865580000053
并且
Figure BDA0001993865580000054
是闭合凸集;
因此我们在求解时可以将B通过欧几里德空间投影到D中以满足约束,同时避免2,1范 数难以优化的问题,并提高求解速度。通过结合Nesterov’s方法,我们就给出每一步的迭代 更新公式。我们的方法改进于Nesterov’s方法:
基于两个序列hi和bi,其中bi是近似解序列,hi是搜索点序列,搜索点hi是bi-1和bi的仿 射组合,αi是结合系数。
hi=bii(bi-bi-1).
近似解bi+1通过hi的梯度映射得到:
Figure BDA0001993865580000055
其中,γi是步长,并且γi由根据Armijo-Goldstein规则的线搜索确定,使得γi适合于hi
对于投影函数πG与我们目标函数简化公式修改公式的投影一致的,其投影空间应当是近 似解的上界。为表示方便与更易理解,搜索点hi与近似解bi+1的公式表示的是整体损失函数中 的参数矩阵的一行向量的迭代优化方式,更类似于原始的Nesterov’s方法。
给出整体的投影函数如下:
Figure BDA0001993865580000056
上式表明给定点(v,U)在这些D上的欧几里德投影,v,t∈Rn,U,W∈Rn×k,i=1,...,n, 并且v=[v1,...,vn]T,给出B和t最优化解
Figure BDA0001993865580000057
Figure BDA0001993865580000058
Figure BDA0001993865580000059
的第i行表示为
Figure BDA00019938655800000510
Figure BDA00019938655800000511
Figure BDA0001993865580000061
Figure BDA0001993865580000062
在每一步得到优化解之后通过目标函数简化公式修改进行权重更新。通过以上方法的不 断迭代优化,当解收敛时,便得到了最优解B和源权重ws
步骤6:基于多任务的回归模型,针对多源异构测试数据进行在线监测:在进行故障检 测时,首先根据步骤1~步骤3的处理时对建模数据任务的划分,判断当前测试数据属于哪项 任务,进而使用以下对应任务的多任务的回归模型进行判断是否发生故障,若fi>0,则无 故障,继续判定下一条数据,若fi≤0,则多任务回归模型判断有故障发生,对于每一任务 其回归模型为:
Figure BDA0001993865580000063
其中,
Figure BDA0001993865580000064
是监测数据中被判定为第i个任务的第s源数据。
有益技术效果:
本发明提出了一种提出一种针对于大规模工业数据多来源异构数据的统计处理框架,是 一种基于大数据的故障监测方法,主要分为两个部分,离线建模与在线监测。本发明主要解 决工业大数据中数据来源广泛,类型构成多样,数据维度不统一难以协同建模的问题。利用 此方法进行的过程监测结果表明,该方法不仅能大大降低误报警,还提高了故障检测的准确 性。
附图说明
图1为本发明实施例的电熔镁炉工艺原理图;
图2为本发明实施例的一种多源异构大数据的多任务处理故障监测方法的流程图;
图3为本发明大规模工业数据多来源异构数据的统计处理方法示意图;
图中,1-变压器,2-短网,3-电极升降装置,4-电极,5-炉壳,6-车体,7-电弧,8-炉料。
具体实施方式
下面结合附图和具体实施实例对发明做进一步说明,电解镁炉的结构如附图1所示,其 中包括:变压器1,短网2,电极升降装置3,电极4,炉壳5,车体6,电弧7,炉料8。电 熔镁炉主要以熔融状态下电流通过物料所产生的物料电阻热为主要热源,同时伴有电弧热,它的热量集中,能有效的将物料加热到熔点2800℃以上,有利于熔炼电熔镁砂。
一种多源异构大数据的多任务处理故障监测方法,如图2所示,包括如下步骤:
步骤1:将采集来的不同来源的数据分别进行提取转化处理,得到总的转化处理后的数 据;
步骤1.1:对视频数据的提取转化处理,得到处理后的视频数据:
步骤1.1.1:根据故障监测对象不同,人工提取视频数据的关键帧图像,关键帧图像的总 的采样时间为各个不同来源的数据采样时间的最小公倍数;
步骤1.1.2:对关键帧图像进行特征提取:将每一张关键帧图像的像素矩阵转化为灰度矩 阵,灰度矩阵作为多维向量,并对每一个多维向量提取图像特征,包括:ASM能量(angular second moment)、对比度、逆差距、熵和自相关;
所述ASM能量即每个矩阵元素的平方和;
将采集来的不同来源的数据分别进行提取转化处理,并进行标记。本发明以如附图1所示 结构的电熔镁炉为例,在电熔镁炉运行过程中,分别采集传统的统计量数据包括电熔镁炉三 个电极的电压值(Ua、Ub、Uc)、三个电极的电流值(Ia、Ib、Ic)以及频率F,其采样率为每秒 两次。同时采集炉内外的图像数据,每秒提取10帧图像,用灰度共生矩阵,提取图像的ASM 能量、对比度、逆差距、熵、自相关等共20维信息;所述灰度共生矩阵是像素距离和角度的 矩阵函数,它通过计算图像中一定距离和一定方向的两点灰度之间的相关性,来反映图像在 方向、间隔、变化幅度及快慢上的综合信息。如表1所示:
表1.电熔镁炉数据中的标记数据(部分)
Figure BDA0001993865580000071
Figure BDA0001993865580000081
步骤2:按照规定的时间间隔T,将总的转化处理后的数据进行数据窗口划分,得到数据 窗口划分后的数据,其中,规定的时间间隔T小于总采样时间,以保证不同数据窗口内的数 据结构一致,如果时间排在最后的数据无法保证构成完整的数据窗口,将其删掉,以保证数 据窗口的整齐性;例如每一数据窗口中划分了5个任务,而划分至最后的窗口任务数不足5 个,则将最后的窗口舍弃,保证以上所有数据窗口的数据结构的对齐。
将步骤1中已处理的数据进行数据窗口划分,保证不同数据窗口内的数据结构一致,我 们划分以0.5秒为单位划分数据窗口,一个数据窗口里有5帧图像,1组传统变量采样信息。
步骤3:将数据窗口划分后的数据按照采样时间先后顺序进行任务划分,得到任务划分 后的数据,如图3所示:只要数据窗口划分后的数据中某一时刻存在数据,无论该数据属于 哪种数据源,那么以这个时刻为基础对应找到这时刻的其他数据源,将能够找到的这一时刻 的不同数据源进行排列组合,即设某一时刻对应的数据源为a个,任意取b个数据源作为一 个任务,则总的任务数为从a个数据源中任取b个作为任务的总任务数,记作m=Aa b,计算 视频数据与传统变量或者其他相结合的数据源在时间对应上误差,取误差小于某一阈值的对 应任务,去掉误差大于某一阈值的对应任务,得到任务划分后的数据;如以0.5秒为单位划 分数据窗口,一个数据窗口里有5帧图像,1组传统变量采样信息。则以划分间隔最小的视 频图像间隔的1/2作为阈值,当传统变量与对应的图像间隔大于0.05秒时,则认为异构数据 已经不同步应去掉。
对步骤2中已划分完数据窗口的数据按照时间顺序进行任务划分,为保证视频数据与传 统变量或者其他相结合的数据在时间对应上误差尽可能的小,本实施例阈值为0.1秒,我们 数据窗口内的最后一帧图片与传统变量对应。我们在每个频次中化分成两个任务,第一个任 务中只包含图像视频信息,任务数为4;第二个任务同时含有视频图像信息和传统变量信息, 任务数为1。
步骤4:基于任务划分后的数据建立目标函数:数据数据窗口由z表示,其中z=1,...,Z, Z为数据数据窗口的总数;将每一数据数据窗口中的数据划分为m个任务;
Figure BDA0001993865580000091
Figure BDA0001993865580000092
Ni表示第i个任务的数据样本总数;s=1,...,S,表示第i个任务中数 据源数为S;
Figure BDA0001993865580000093
即表示的是第i个任务的第j个样本的第s个数据源的数据和其对应的 标签值;每一数据窗口内所有任务的所有数据源的标签值应当是一致的,
Figure BDA0001993865580000094
S值应 相等。
根据多源异构数据的特点,我们使用多源逻辑回归来进行有效的分类,引入对数损失函 数作为我们的损失函数。因为使用逻辑回归,我们可以直接对分类可能性进行建模,无需事 先假设数据分布,无需事先知道样本数据的分布,这样就避免了假设分布不准确所带来的问 题。同时不仅预测出类别,通过sigmoid函数的压缩,对样本点到局侧面的“距离”,即对数 几率比值C(C∈R),压缩到(0,1)还且给出具体的概率预测值。而且对数几率函数是任意阶可 导的凸函数,有很好的数学性质,现有的许多数值优化算法都可直接用于求取最优解。
根据多源异构数据无法事先知道样本数据分布的特点,将对数损失函数改进为下面线性 形式:
Figure BDA0001993865580000101
其中
Figure BDA0001993865580000102
S是第i个任务的第s源数据的参数向量,ws表示第s源的权 重,L(·)表示损失函数;
由此基于任务划分后的数据建立多源逻辑回归模型,即建立多源异构大数据的多任务处 理模型的目标函数,公式如下:
Figure BDA0001993865580000103
目标函数的第二项,是一个关于模型参数的2,1-范数正则化,这使得模型将一个具有需 稀疏性的解决方案,也就是说,涉及特定源的所有模型都受限于为这个特定源选择一组共同 的特征。
将B=[b1,...,bm]表示为所有模型参数的集合,其中
Figure BDA0001993865580000104
表示第i个任务下所有源 数据的参数向量组成的向量;由于之前假设共有S个数据源,并且第s个源的特征维度表示 为ps,为了表示方便,引入索引函数I(s,k),这样BI(s,k)就表示对应于第s个数据源中第k个 特征的所有任务模型参数。
数据源权重ws的值由约束项进行规范,给出ws的迭代计算公式如下:
Figure BDA0001993865580000105
这个权重迭代计算公式表明,一个来源的权重与其观察值与对数尺度真值之间的差异成 反比。负对数函数将0和1范围内的数字映射到0到无穷的范围,因此有助于扩大源权重的 差异。结果更接近真相的来源将具有更高的权重。因此,迭代计算公式是一个合理的约束函 数,它给出了有意义并且直观的权重更新公式。
步骤5:求解多源异构大数据的多任务处理模型的目标函数,得到最优解,即为多任务 的回归模型;
对目标函数进行简化,公式为:
Figure BDA0001993865580000111
我们通过将其重新表示为等价的光滑凸优化问题来加速计算,然后通过Nesterov方法, 用于平滑凸优化的最优一阶黑箱方法来求解。
引入一个附加变量
Figure BDA0001993865580000112
其中,tc是BI(s,k)的上界值,目标函数简化公式修改为:
Figure BDA0001993865580000113
其中,
Figure BDA0001993865580000114
并且
Figure BDA0001993865580000115
是闭合凸集;
因此我们在求解时可以将B通过欧几里德空间投影到D中以满足约束,同时避免2,1范 数难以优化的问题,并提高求解速度。通过结合Nesterov’s方法,我们就给出每一步的迭代 更新公式。我们的方法改进于Nesterov’s方法:
基于两个序列hi和bi,其中bi是近似解序列,hi是搜索点序列,搜索点hi是bi-1和bi的仿 射组合,αi是结合系数。
hi=bii(bi-bi-1).
近似解bi+1通过hi的梯度映射得到:
Figure BDA0001993865580000116
其中,γi是步长,并且γi由根据Armijo-Goldstein规则的线搜索确定,使得γi适合于hi
对于投影函数πG与我们目标函数简化公式修改公式的投影一致的,其投影空间应当是近 似解的上界。为表示方便与更易理解,搜索点hi与近似解bi+1的公式表示的是整体损失函数中 的参数矩阵的一行向量的迭代优化方式,更类似于原始的Nesterov’s方法。
给出整体的投影函数如下:
Figure BDA0001993865580000121
上式表明给定点(v,U)在这些D上的欧几里德投影,v,t∈Rn,U,W∈Rn×k,i=1,...,n, 并且v=[v1,...,vn]T,给出B和t最优化解
Figure BDA0001993865580000122
Figure BDA0001993865580000123
Figure BDA0001993865580000124
的第i行表示为
Figure BDA0001993865580000125
Figure BDA0001993865580000126
Figure BDA0001993865580000127
Figure BDA0001993865580000128
在每一步得到优化解之后通过目标函数简化公式修改进行权重更新。通过以上方法的不 断迭代优化,当解收敛时,便得到了最优解B和源权重ws
通过步骤123的处理,在每一数据窗口内每一任务数量,任务内部的数据源数已经完全 相同,由此建立模型并进行求解得到参数矩阵B和源权重ws
步骤6:基于多任务的回归模型,针对多源异构测试数据进行在线监测:在进行故障检 测时,首先根据步骤1~步骤3的处理时对建模数据任务的划分,判断当前测试数据属于哪项 任务,进而使用对应任务的回归模型进行判断是否发生故障,若fi>0,则无故障,继续判 定下一条数据,若fi≤0,则多任务回归模型判断有故障发生,对于每一任务其回归模型为:
Figure BDA0001993865580000129
其中,
Figure BDA00019938655800001210
是监测数据中被判定为第i个任务的第s源数据。
通过对电熔镁炉冶炼过程进行故障检测与诊断;通过步骤5求得的最优解,我们便得到的 多任务的回归模型。在进行故障检测时:首先判断监测数据属于哪项任务,进而使用对应任 务的回归模型进行判断是否发生故障,如无故障则继续判定下一条数据。
通过上面的仿真实例,表明了本发明多源异构大数据的多任务的数据窗口处理模型的有 效性,实现了对连续电熔镁炉冶炼过程的监测诊断。我们使用准确度、灵敏度、特异度三个 指标量衡量我们的方法有效性,如表2所示:
表2样本统计指标定义
Figure BDA0001993865580000131
Figure BDA0001993865580000132
Figure BDA0001993865580000133
Figure BDA0001993865580000134
通过对不同训练规模的数据进行建模诊断,我们的到了如表3的结果,训练规模单位是 秒,使用了多少秒的数据进行协同建模:
表3不同训练规模的故障诊断指标对比
Figure BDA0001993865580000135
通过上面的仿真实例,实现了对连续电熔镁炉冶炼过程的监测诊断。随着数据规模的增 长,本方法的在识别准确率方面不断提高,其他两个指标变现良好,表明了本发明检测方法 的有效性。

Claims (5)

1.一种多源异构大数据的多任务处理故障监测方法,其特征在于,包括如下步骤:
步骤1:将采集来的不同来源的数据分别进行提取转化处理,得到总的转化处理后的数据;
步骤1.1:对视频数据的提取转化处理,得到处理后的视频数据;
步骤1.1.1:根据故障监测对象不同,人工提取视频数据的关键帧图像,关键帧图像的总的采样时间为各个不同来源的数据采样时间的最小公倍数;
步骤1.1.2:对关键帧图像进行特征提取:将每一张关键帧图像的像素矩阵转化为灰度矩阵,作为多维向量,并对每一个多维向量提取图像特征,包括:ASM能量、对比度、逆差距、熵和自相关;
步骤1.2:对传统物理化学变量及传感器数据的提取转化处理,得到处理后的传统物理化学变量及传感器数据:按照视频数据关键帧的时段,采集传统物理化学变量及传感器数据,其总的采样时间为各个不同来源的数据采样时间的最小公倍数;
步骤1.3:将处理后的视频数据、处理后的传统物理化学变量及传感器数据,按照顺序组成同一数据矩阵,即总的转化处理后的数据,其中,同一数据矩阵的行为某一采样时刻对应的不同数据源的监测值,同一数据矩阵的列为采样时间,按照采样时间先后顺序排列;
步骤2:按照规定的时间间隔T,将总的转化处理后的数据进行数据窗口划分,得到数据窗口划分后的数据,其中,规定的时间间隔T小于总采样时间,以保证不同数据窗口内的数据结构一致,如果时间排在最后的数据无法保证构成完整的数据窗口,将其删掉,以保证数据窗口的整齐性;
步骤3:将数据窗口划分后的数据按照采样时间先后顺序进行任务划分,得到任务划分后的数据:只要数据窗口划分后的数据窗口中某一时刻存在数据,无论该数据窗口中的数据属于哪种数据源,那么以这个时刻为基础对应找到这时刻的其他数据源,将能够找到的这一时刻的不同数据源进行排列组合,即设某一时刻对应的数据源为a个,任意取b个数据源作为一个任务,则总的任务数为从a个数据源中任取b个作为任务的总任务数,记作
Figure FDA0002921838450000011
计算视频数据与传统变量或者其他相结合的数据源在时间对应上误差,取误差小于某一阈值的对应任务,去掉误差大于某一阈值的对应任务,得到任务划分后的数据;
步骤4:基于任务划分后的数据建立目标函数:数据数据窗口由z表示,其中z=1,...,Z,Z为数据数据窗口的总数;将每一数据数据窗口中的数据划分为m个任务;
Figure FDA0002921838450000012
i=1,...,m,j=1,...,Ni,Ni表示第i个任务的数据样本总数;s=1,...,S,表示第i个任务中数据源数为S;
Figure FDA0002921838450000021
即表示的是第i个任务的第j个样本的第s个数据源的数据和其对应的标签值;每一数据窗口内所有任务的所有数据源的标签值应当是一致的,
Figure FDA0002921838450000022
s=1,...,S值应相等;
根据多源异构数据无法事先知道样本数据分布的特点,将对数损失函数改进为下面线性形式:
Figure FDA0002921838450000023
其中
Figure FDA0002921838450000024
i=1,...,m,s=1,...,S是第i个任务的第s源数据的参数向量,ws表示第s源的权重,L(·)表示损失函数;
由此基于任务划分后的数据建立多源逻辑回归模型,即建立多源异构大数据的多任务处理模型的目标函数,公式如下:
Figure FDA0002921838450000025
Figure FDA0002921838450000026
目标函数的第二项,是一个关于模型参数的2,1-范数正则化,这使得模型将一个具有需稀疏性的解决方案,也就是说,涉及特定源的所有模型都受限于为这个特定源选择一组共同的特征;
将B=[b1,...,bm]表示为所有模型参数的集合,其中
Figure FDA0002921838450000027
表示第i个任务下所有源数据的参数向量组成的向量;由于之前假设共有S个数据源,并且第s个源的特征维度表示为ps,为了表示方便,引入索引函数I(s,k),这样BI(s,k)就表示对应于第s个数据源中第k个特征的所有任务模型参数;
第s源的权重ws的值由约束项进行规范,给出ws的迭代计算公式如下:
Figure FDA0002921838450000028
步骤5:求解多源异构大数据的多任务处理模型的目标函数,得到最优解,即为多任务的回归模型;
步骤6:基于多任务的回归模型,针对多源异构测试数据进行在线监测:在进行故障检测时,首先根据步骤1~步骤3的处理时对建模数据任务的划分,判断当前测试数据属于哪项任务,进而使用以下对应任务的多任务的回归模型进行判断是否发生故障,若fi>0,则无故障,继续判定下一条数据,若fi≤0,则多任务回归模型判断有故障发生,对于每一任务其回归模型为:
Figure FDA0002921838450000031
其中,
Figure FDA0002921838450000032
是监测数据中被判定为第i个任务的第s源数据。
2.根据权利要求1所述的多源异构大数据的多任务处理故障监测方法,其特征在于,步骤1中所述ASM能量即每个矩阵元素的平方和。
3.根据权利要求1所述的多源异构大数据的多任务处理故障监测方法,其特征在于,步骤1中所述不同来源的数据简称不同数据源,具体包括视频数据中提取的图像特征、传统物理化学变量及传感器数据。
4.根据权利要求1所述的多源异构大数据的多任务处理故障监测方法,其特征在于,步骤3中所述任务划分后的数据,在每一数据窗口内任务数量相同,并保证每一数据窗口中对应的任务内部的数据源数量完全相同。
5.根据权利要求1所述的多源异构大数据的多任务处理故障监测方法,其特征在于,步骤5中所述得到最优解的过程如下:
对目标函数进行简化,公式为:
Figure FDA0002921838450000033
Figure FDA0002921838450000034
通过将其重新表示为等价的光滑凸优化问题来加速计算,然后通过Nesterov方法,用于平滑凸优化的最优一阶黑箱方法来求解;
引入一个附加变量
Figure FDA0002921838450000035
其中,tc是BI(s,k)的上界值,目标函数简化公式修改为:
Figure FDA0002921838450000041
Figure FDA0002921838450000042
其中,
Figure FDA0002921838450000043
并且
Figure FDA0002921838450000044
是闭合凸集;
改进Nesterov’s方法:
基于两个序列hi和bi,其中bi是近似解序列,hi是搜索点序列,搜索点hi是bi-1和bi的仿射组合,αi是结合系数;
hi=bii(bi-bi-1).
近似解bi+1通过hi的梯度映射得到:
Figure FDA0002921838450000045
其中,γi是步长,并且γi由根据Armijo-Goldstein规则的线搜索确定,使得γi适合于hi
对于投影函数πG与我们目标函数简化公式修改公式的投影一致的,其投影空间应当是近似解的上界;为表示方便与更易理解,搜索点hi与近似解bi+1的公式表示的是整体损失函数中的参数矩阵的一行向量的迭代优化方式,更类似于原始的Nesterov’s方法;
给出整体的投影函数如下:
Figure FDA0002921838450000046
上式表明给定点(v,U)在这些D上的欧几里德投影,v,t∈Rn,U,W∈Rn×k,i=1,...,n,并且v=[v1,...,vn]T,给出B和t最优化解
Figure FDA0002921838450000047
Figure FDA0002921838450000048
Figure FDA0002921838450000049
Figure FDA00029218384500000410
的第i行表示为
Figure FDA00029218384500000411
Figure FDA00029218384500000412
Figure FDA00029218384500000413
Figure FDA0002921838450000051
在每一步得到优化解之后通过目标函数简化公式修改进行权重更新;通过以上方法的不断迭代优化,当解收敛时,便得到了最优解B和源权重ws
CN201910189215.5A 2019-03-13 2019-03-13 一种多源异构大数据的多任务处理故障监测方法 Active CN110045691B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910189215.5A CN110045691B (zh) 2019-03-13 2019-03-13 一种多源异构大数据的多任务处理故障监测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910189215.5A CN110045691B (zh) 2019-03-13 2019-03-13 一种多源异构大数据的多任务处理故障监测方法

Publications (2)

Publication Number Publication Date
CN110045691A CN110045691A (zh) 2019-07-23
CN110045691B true CN110045691B (zh) 2021-03-16

Family

ID=67274803

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910189215.5A Active CN110045691B (zh) 2019-03-13 2019-03-13 一种多源异构大数据的多任务处理故障监测方法

Country Status (1)

Country Link
CN (1) CN110045691B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114637263B (zh) * 2022-03-15 2024-01-12 中国石油大学(北京) 一种异常工况实时监测方法、装置、设备及存储介质
CN114609479A (zh) * 2022-05-09 2022-06-10 广东电网有限责任公司珠海供电局 故障定位方法、装置、电子设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104516778A (zh) * 2014-12-24 2015-04-15 西安电子科技大学 一种多任务环境下进程检查点的保存与恢复系统及方法
KR20150081588A (ko) * 2014-01-06 2015-07-15 삼성전기주식회사 제품 검사방법
CN106597231A (zh) * 2016-11-11 2017-04-26 上海交通大学 基于多源信息融合和深度学习网络的gis故障检测系统及方法
CN108170634A (zh) * 2017-12-26 2018-06-15 北京航空航天大学 一种异构多源数据重构瞬态可靠处理方法
CN108181891A (zh) * 2017-12-13 2018-06-19 东北大学 基于智能核主元分析的工业大数据故障诊断方法
CN109086804A (zh) * 2018-07-12 2018-12-25 中石化石油机械股份有限公司 一种基于多源状态监测信息和可靠性特征融合的液压设备早期故障预测方法
CN109270407A (zh) * 2018-11-16 2019-01-25 国网山东省电力公司电力科学研究院 基于多源信息融合的特高压直流输电线路故障原因辨识方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150081588A (ko) * 2014-01-06 2015-07-15 삼성전기주식회사 제품 검사방법
CN104516778A (zh) * 2014-12-24 2015-04-15 西安电子科技大学 一种多任务环境下进程检查点的保存与恢复系统及方法
CN106597231A (zh) * 2016-11-11 2017-04-26 上海交通大学 基于多源信息融合和深度学习网络的gis故障检测系统及方法
CN108181891A (zh) * 2017-12-13 2018-06-19 东北大学 基于智能核主元分析的工业大数据故障诊断方法
CN108170634A (zh) * 2017-12-26 2018-06-15 北京航空航天大学 一种异构多源数据重构瞬态可靠处理方法
CN109086804A (zh) * 2018-07-12 2018-12-25 中石化石油机械股份有限公司 一种基于多源状态监测信息和可靠性特征融合的液压设备早期故障预测方法
CN109270407A (zh) * 2018-11-16 2019-01-25 国网山东省电力公司电力科学研究院 基于多源信息融合的特高压直流输电线路故障原因辨识方法

Also Published As

Publication number Publication date
CN110045691A (zh) 2019-07-23

Similar Documents

Publication Publication Date Title
CN110598736A (zh) 一种电力设备红外图像故障定位、识别与预测方法
CN109993102B (zh) 相似人脸检索方法、装置及存储介质
Li et al. A multi-scale cucumber disease detection method in natural scenes based on YOLOv5
CN105740912B (zh) 基于核范数正则化的低秩图像特征提取的识别方法及系统
CN111222798B (zh) 一种复杂工业过程关键性指标软测量方法
CN105976397B (zh) 一种目标跟踪方法
CN107368802B (zh) 基于kcf和人脑记忆机制的运动目标跟踪方法
CN110045691B (zh) 一种多源异构大数据的多任务处理故障监测方法
CN108898269A (zh) 基于度量的电力图像环境影响评估方法
CN113222149A (zh) 模型训练方法、装置、设备和存储介质
CN111985325A (zh) 特高压环境评价中的航拍小目标快速识别方法
CN110458022A (zh) 一种基于域适应的可自主学习目标检测方法
CN106530330B (zh) 基于低秩稀疏的视频目标跟踪方法
CN110610210A (zh) 一种多目标检测方法
CN114708903A (zh) 一种基于自注意力机制的蛋白质残基间距离预测方法
CN107563327B (zh) 一种基于自步反馈的行人重识别方法及系统
CN116383747A (zh) 基于多时间尺度深度卷积生成对抗网络的异常检测方法
CN116704208B (zh) 基于特征关系的局部可解释方法
Sun et al. A classification and location of surface defects method in hot rolled steel strips based on YOLOV7
CN117765432A (zh) 一种基于动作边界预测的中学理化生实验动作检测方法
CN117593243A (zh) 可靠伪标签引导的压缩机外观自适应检测方法
CN112730437B (zh) 基于深度可分离卷积神经网络的喷丝板表面缺陷检测方法、装置、存储介质及设备
CN113011535A (zh) 基于低秩表示特征抽取算法的透明pcr管检测方法和系统
CN112132310A (zh) 基于改进lstm的电力设备状态预估方法及装置
You et al. Attention-based LSTM for motion switching detection of particles in living cells

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant