CN114077876A - 一种带钢热连轧多模态过程监测方法及装置 - Google Patents

一种带钢热连轧多模态过程监测方法及装置 Download PDF

Info

Publication number
CN114077876A
CN114077876A CN202210057410.4A CN202210057410A CN114077876A CN 114077876 A CN114077876 A CN 114077876A CN 202210057410 A CN202210057410 A CN 202210057410A CN 114077876 A CN114077876 A CN 114077876A
Authority
CN
China
Prior art keywords
training data
mode
submodel
hdp
hsmm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210057410.4A
Other languages
English (en)
Other versions
CN114077876B (zh
Inventor
彭开香
杜雅平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology Beijing USTB
Original Assignee
University of Science and Technology Beijing USTB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology Beijing USTB filed Critical University of Science and Technology Beijing USTB
Priority to CN202210057410.4A priority Critical patent/CN114077876B/zh
Publication of CN114077876A publication Critical patent/CN114077876A/zh
Application granted granted Critical
Publication of CN114077876B publication Critical patent/CN114077876B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/29Graphical models, e.g. Bayesian networks
    • G06F18/295Markov models or related models, e.g. semi-Markov models; Markov random fields; Networks embedding Markov models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • General Factory Administration (AREA)

Abstract

本发明公开了一种带钢热连轧多模态过程监测方法及装置,涉及工业过程监测技术领域。包括:利用获取的带钢热连轧过程数据训练HDP‑HSMM‑KECA模型,得到各模态下控制限以及全局控制限;将测试数据输入到训练好的HDP‑HSMM子模型,得到测试数据的对应模态;基于测试数据的对应模态对测试数据进行预处理;将预处理后的测试数据输入到训练好的KECA子模型,得到相应模态局部统计量进而获取全局统计量;若全局统计量小于或等于控制限,则带钢热连轧过程运行正常;若全局统计量大于控制限,则带钢热连轧过程发生故障。本发明能够解决传统的多模态过程监测聚类分析需要指定模态数量、未考虑状态驻留时间分布的限制,以及特征提取对数据进行高斯分布假设限制的问题。

Description

一种带钢热连轧多模态过程监测方法及装置
技术领域
本发明涉及工业过程监测技术领域,特别是指一种带钢热连轧多模态过程监测方法及装置。
背景技术
带钢热连轧过程是一个机理复杂、规模庞大、效率高、多工序的钢铁生产过程是一种典型的复杂流程工业。该生产线主要由加热炉、粗轧机组、热输出辊道和飞剪、精轧机组、层流冷却和卷取机组等构成。对带钢热连轧过程进行监测与故障诊断,有助于操作人员实时了解生产过程的运行状态,并对运行过程中出现的异常状态及时做出监测,便于接下来对故障进行定位和采取相应改进措施,消除异常状态,提高产品质量和生产效益,降低安全隐患。随着自动控制的飞速发展,以及现场总线系统的应用与优化升级,使得从生产过程中获取大量包含产品信息、加工信息、运行状态信息的数据成为可能,因此基于数据驱动的过程监测方法成为了带钢热连轧过程监测的热点。
然而由于过程原材料性质的变化、过程主要成分的老化、设备自身不断的磨损以及生产环境的变化所引起的多种操作条件的改变;为了适应以经济为导向的市场需求,不断改变产品生产计划,使得生产过程中的稳定设定点不断进行调整,导致连续生产过程出现多个操作工况,形成了多模态过程,即同一个生产过程有多个不同的稳定的工作点,且每个稳定的工作模态中性质不相同。相较于单一工况而言,多模态过程更为复杂,所获取的数据具有非线性、非高斯等特点,传统的基于多元统计方法的单一模态故障诊断方法无法取得理想的监测效果,因此,对于复杂的多模态带钢热连轧过程监测的研究具有实际的工程意义。
传统的过程监测方法分成三类,基于解析模型的方法、基于数据驱动的方
法及基于知识的方法。现代流程工业的生产流程复杂,涉及复杂的物理化学过程,边界条件模糊多变,变量众多,大规模化趋势越来越明显,一方面很难获取准确的机理模型,另一方面,很难组织并建立系统的专家知识库,因此基于机理模型的方法和基于知识的方法仅适用于流程中某些机理明确的单元设备。另外,现代工业中已装备大量传感器等仪表设备,储备了海量的过程历史数据,伴随着多元统计分析、统计学习、聚类分析、神经网络等过程数据分析技术的长足发展,基于数据的方法近20年来已成为流程工业过程监测的主流方法和研究热点,该方法不需要建立准确的机理模型,也不依赖于专家知识,而是通过在数据中提取过程信息指导过程监测,具有建模灵活、实施方便、简单经济、通用性强等优势。
多年来,针对多模态的过程监测,国内外学者从各个角度,以单模态过程监测方法为基础,深入探索提出了很多处理多模态问题的方法,根据所建立的模型,可以方法分为以下三种:全局模型法、自适应法、多模型法。
(1)全局模型法:全局模型法就是对整个多模态过程建立统一的模型来进行故障诊断的一种整体建模法。运用整体建模的思想来处理多模态问题,运算小,易实现,但由于多模态数据在特征空间中较为分散,而全局建模实际只是对多模态的历史数据进行统计意义上的平均,因此全局模型无法对各个模态的运行过程进行精确的描述,可能出现大量漏报和误报等情形。
(2)自适应法:自适应法就是利用递归的方法更新数据使之可以适应随时间变化后的模态。自适应建模可以很好的追踪变化缓慢的过程,但是通常操作模式的频繁变换要求监视模型频繁更新,另外盲目地采用自适应法,一旦当前模型出现一些误差,可能会在接下来的多次更新中对误差进行不断累积,削弱后续监测结果的可靠性,甚至造成模型失效。
(3)多模型法:多模型法,即为了精确高效处理多模态的监测问题,通过聚类分析识别出各个模态不同的特征并进行划分,然后对于各个模态的数据都建立一个相应的监测模型,是目前主要的多模态过程监测方法。
传统的聚类分析方法如K-均值、GMM(Gaussian Mixture Model,高斯混合模型)未考虑模态的动态切换,在运行条件突变、复杂动力学和过程不确定性出现时可能会失效;但利用HMM(Hidden Markov Model,隐马尔可夫模型)获取模态动态序列,存在局限性,状态驻留时间是不符合实际的几何分布并且需要在训练模型前指定隐状态的数量。传统处理非线性问题多采用KPCA(Kernel Principal Component Analysis,核主元成分分析)法,它是基于数据服从高斯分布分假设下进行的,然而实际生产过程的数据并不严格遵循高斯分布。传统的监测统计量选用T2(Hotelling statistic,霍特林统计量)、SPE(SquaredPrediction Error,平方预测误差)统计量,但由于非高斯数据的存在,T2、SPE统计量故障检测效果受限。
现有技术中,公开了A new multimode process monitoring method based on ahierarchical Dirichlet process—Hidden semi-Markov model with application tothe hot steel strip mill process(一种基于分层狄利克雷过程的新型多模过程监控方法——应用于热钢带钢轧机过程的隐性半马尔可夫模型),引入HDP-HSMM框架,解决未知的先验模式信息问题;提出一种多模过程的模式分类和识别方法;提出一种全局-局部监测策略进行故障检测;在热轧钢工艺上验证了理论结果。该方法局部建模采用马氏距离的监测指标,全局采用NLLP(Negative Log-Likelihood Probability,负对数似然概率)监测指标。
还公开了“基于KECA方法的过程监测与故障诊断研究”,该论文主要考虑单一模态过程监测,并没有考虑多模态的情况。所采用的监测统计量为T2、SPE,该方法需样本服从高斯分布的假设。
因此,传统的多模态过程监测聚类分析存在需要自己指定模态数量、未考虑状态驻留时间分布的限制,以及特征提取对数据进行高斯分布假设限制的问题。
发明内容
本发明针对传统的多模态过程监测聚类分析需要指定模态数量、未考虑状态驻留时间分布的限制,以及特征提取对数据进行高斯分布假设限制的问题,提出了本发明。
为解决上述技术问题,本发明提供如下技术方案:
一方面,本发明提供了一种带钢热连轧多模态过程监测方法,该方法由电子设备实现,该方法包括:
S1、获取带钢热连轧过程的测试数据。
S2、获取训练好的层次狄利克雷过程-隐半马尔科夫-核熵成分分析HDP-HSMM-KECA模型;其中,HDP-HSMM-KECA模型包括HDP-HSMM子模型和KECA子模型。
S3、将测试数据输入到训练好的HDP-HSMM子模型,得到测试数据的对应模态。
S4、基于测试数据的对应模态对测试数据进行预处理。
S5、将预处理后的测试数据输入到训练好的KECA子模型,得到相应模态局部统计量,进而获取全局统计量。
S6、若全局统计量小于或等于预设的全局控制限,则带钢热连轧过程运行正常;若全局统计量大于预设的全局控制限,则带钢热连轧过程发生故障。
可选地,S2中的HDP-HSMM-KECA模型的训练过程包括:
S21、获取不同运行模态的训练数据;其中,不同运行模态的训练数据为不同运行模态下的正常运行数据。
S22、利用训练数据训练初始的HDP-HSMM子模型,得到训练好的HDP-HSMM子模型,利用训练好的HDP-HSMM子模型将训练数据划分为多个模态。
S23、对划分后的多个模态的训练数据中每个模态的训练数据分别进行预处理,得到每个模态预处理后的训练数据。
S24、将每个模态预处理后的训练数据输入到KECA子模型,并对初始的KECA子模型中的参数进行调优,得到训练好的KECA子模型;通过所述训练好的KECA子模型,获取每个模态预处理后的训练数据的非线性特征。
S25、基于每个模态预处理后的训练数据的非线性特征,得到相应模态训练数据局部统计量及局部控制限,进而获取训练数据全局统计量及全局控制限。
可选地,S22中的HDP-HSMM子模型的训练过程包括:
S221、获取不同运行模态的训练数据。
S222、基于训练数据、引入HDP模型作为先验知识以及利用期望最大化EM算法对HSMM模型进行训练,得到训练好的HDP-HSMM模型。
可选地,S23中的对划分后的多个模态的训练数据中每个模态的训练数据分别进行预处理,得到每个模态预处理后的训练数据包括:
对划分后的多个模态的训练数据中每个模态的训练数据进行中心化,得到中心化后的训练数据。
对中心化后的训练数据进行归一化,归一化后的训练数据即为每个模态预处理后的训练数据。
可选地,S25中的基于每个模态预处理后的训练数据的非线性特征,得到相应模态训练数据局部统计量及局部控制限,进而获取训练数据全局统计量及全局控制限包括:
S251、分别利用每个模态预处理后的训练数据的非线性特征计算每个模态的局部离群因子LOF,得到各个模态训练数据局部离群因子统计量。
S252、基于各个模态训练数据局部离群因子统计量以及核密度估计KDE算法,得到各个模态的局部离群因子控制限。
S253、基于每个模态的局部离群因子以及贝叶斯推理,得到训练数据全局统计量及全局控制限。
可选地,S253中的基于每个模态的局部离群因子以及贝叶斯推理,得到训练数据全局统计量及全局控制限包括:
定义样本
Figure 117497DEST_PATH_IMAGE001
在第
Figure 871564DEST_PATH_IMAGE002
个模态中的故障发生的概率,由下式(1)计算:
Figure 918018DEST_PATH_IMAGE003
其中,
Figure 44237DEST_PATH_IMAGE004
为正常条件下样本的先验概率,取值为
Figure 885154DEST_PATH_IMAGE005
Figure 362403DEST_PATH_IMAGE006
为预设置信度;
Figure 946968DEST_PATH_IMAGE007
为故障条件下样本的先验概率,取值为
Figure 193273DEST_PATH_IMAGE006
Figure 939512DEST_PATH_IMAGE008
为正常条件下样本的后验概率,由下式(2)计算;
Figure 668171DEST_PATH_IMAGE009
为故障条件下样本的后验概率,由下式(3)计算;
Figure 790848DEST_PATH_IMAGE010
其中,
Figure 891659DEST_PATH_IMAGE011
代表第
Figure 480903DEST_PATH_IMAGE002
个模态的LOF,
Figure 198324DEST_PATH_IMAGE012
为相对应的局部控制限,
Figure 29751DEST_PATH_IMAGE013
为正常情况;
Figure 375282DEST_PATH_IMAGE014
为故障情况;由此得到融合的贝叶斯预测全局统计量,由下式(4)计算:
Figure 604269DEST_PATH_IMAGE015
其中,
Figure 668040DEST_PATH_IMAGE016
为模态数,全局控制限为置信度
Figure 273465DEST_PATH_IMAGE006
另一方面,本发明提供了一种带钢热连轧多模态过程监测装置,该装置应用于实现带钢热连轧多模态过程监测方法,该装置包括:
数据获取模块,用于获取带钢热连轧过程的测试数据。
模型获取模块,用于获取训练好的层次狄利克雷过程-隐半马尔科夫-核熵成分分析HDP-HSMM-KECA模型;其中,HDP-HSMM-KECA模型包括HDP-HSMM子模型和KECA子模型。
输入模块,用于将测试数据输入到训练好的HDP-HSMM子模型,得到测试数据的对应模态。
预处理模块,用于基于测试数据的对应模态对测试数据进行预处理。
计算模块,用于将预处理后的测试数据输入到训练好的KECA子模型,得到相应模态局部统计量,进而获取全局统计量。
输出模块,用于若全局统计量小于或等于预设的全局控制限,则带钢热连轧过程运行正常;若全局统计量大于预设的全局控制限,则带钢热连轧过程发生故障。
可选地,模型获取模块,进一步用于:
S21、获取不同运行模态的训练数据;其中,不同运行模态的训练数据为不同运行模态下的正常运行数据。
S22、利用训练数据训练初始的HDP-HSMM子模型,得到训练好的HDP-HSMM子模型,利用训练好的HDP-HSMM子模型将训练数据划分为多个模态。
S23、对划分后的多个模态的训练数据中每个模态的训练数据分别进行预处理,得到每个模态预处理后的训练数据。
S24、将每个模态预处理后的训练数据输入到初始的KECA子模型,并对初始的KECA子模型中的参数进行调优,得到训练好的KECA子模型;通过所述训练好的KECA子模型,获取每个模态预处理后的训练数据的非线性特征。
S25、基于每个模态预处理后的训练数据的非线性特征,得到相应模态训练数据局部统计量及局部控制限,进而获取训练数据全局统计量及全局控制限。
可选地,模型获取模块,进一步用于:
S221、获取不同运行模态的训练数据。
S222、基于训练数据、引入HDP模型作为先验知识以及利用期望最大化EM算法对HSMM模型进行训练,得到训练好的HDP-HSMM模型。
可选地,模型获取模块,进一步用于:
对划分后的多个模态的训练数据中每个模态的训练数据进行中心化,得到中心化后的训练数据。
对中心化后的训练数据进行归一化,归一化后的训练数据即为每个模态预处理后的训练数据。
可选地,模型获取模块,进一步用于:
S251、分别利用每个模态预处理后的训练数据的非线性特征计算每个模态的局部离群因子LOF,得到各个模态训练数据局部离群因子统计量。
S252、基于各个模态训练数据局部离群因子统计量以及核密度估计KDE算法,得到各个模态的局部离群因子控制限。
S253、基于每个模态的局部离群因子以及贝叶斯推理,得到训练数据全局统计量及全局控制限。
可选地,模型获取模块,进一步用于:
定义样本
Figure 473502DEST_PATH_IMAGE001
在第
Figure 138970DEST_PATH_IMAGE002
个模态中的故障发生的概率,由下式(1)计算:
Figure 63938DEST_PATH_IMAGE017
其中,
Figure 332108DEST_PATH_IMAGE004
为正常条件下样本的先验概率,取值为
Figure 527597DEST_PATH_IMAGE005
Figure 363966DEST_PATH_IMAGE006
为预设置信度;
Figure 136750DEST_PATH_IMAGE007
为故障条件下样本的先验概率,取值为
Figure 818398DEST_PATH_IMAGE006
Figure 993028DEST_PATH_IMAGE008
为正常条件下样本的后验概率,由下式(2)计算;
Figure 233254DEST_PATH_IMAGE009
为故障条件下样本的后验概率,由下式(3)计算;
Figure 758913DEST_PATH_IMAGE010
其中,
Figure 509832DEST_PATH_IMAGE011
代表第
Figure 945492DEST_PATH_IMAGE002
个模态的LOF,
Figure 389243DEST_PATH_IMAGE012
为相对应的局部控制限,
Figure 871040DEST_PATH_IMAGE013
为正常情况;
Figure 947622DEST_PATH_IMAGE014
为故障情况;由此得到融合的贝叶斯预测全局统计量,由下式(4)计算:
Figure 972210DEST_PATH_IMAGE015
其中,
Figure 445916DEST_PATH_IMAGE016
为模态数,全局控制限为置信度
Figure 290376DEST_PATH_IMAGE006
一方面,提供了一种电子设备,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现上述带钢热连轧多模态过程监测方法。
一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现上述带钢热连轧多模态过程监测方法。
本发明实施例提供的技术方案带来的有益效果至少包括:
上述方案中,利用层次狄利克雷过程HDP作为无限状态空间的先验知识,可以获取最优的模态数,而无需自己指定模态数,更符合生产过程的实际情况。
利用多模态数据构建HDP-HSMM模型可以实现模态的自适应精确划分,同时解决了传统隐马尔可夫模型HMM状态驻留时间的限制,更加切合实际过程。
利用KECA-LOF提取非线性特征构建局部监测模型,并不限定数据严格服从高斯分布,同时选取的主元数要少于KPCA,较于传统的KPCA有更好的监测效果。
利用贝叶斯决策将局部模型进行一个融合,可以更加直观地获取热连轧过程状态变化信息。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的带钢热连轧多模态过程监测方法流程示意图;
图2是本发明实施例提供的带钢热连轧过程流程示意图;
图3是本发明实施例提供的精轧过程流程示意图;
图4是本发明实施例提供的HDP-HSMM-KECA模型的训练方法示意图;
图5是本发明实施例提供的隐半马尔科夫模型示意图;
图6是本发明实施例提供的分层狄利克雷过程-隐半马尔科夫模型示意图;
图7是本发明实施例提供的带钢热连轧多模态过程监测装置框图;
图8是本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
如图1所示,本发明实施例提供了一种带钢热连轧多模态过程监测方法,该方法可以由电子设备实现。如图1所示的带钢热连轧多模态过程监测方法流程图,该方法的处理流程可以包括如下的步骤:
S11、获取带钢热连轧过程的测试数据。
一种可行的实施方式中,带钢热连轧过程是一个机理复杂、规模庞大、效率高、多工序的钢铁生产过程,是一种典型的复杂流程工业。如图2所示,该生产线主要由加热炉、粗轧机组、热输出辊道和飞剪、精轧机组、层流冷却和卷取机组等构成。本申请实施例以精轧机组的过程数据作为测试数据,对本申请进行说明,如图3所示,精轧机组通常由七台机架构成,各个机架通过控制回路联系在一起,每个机架左右有两个支撑辊,中间有两个工作辊,并配备液压系统以提供所需的轧制力和弯辊力,可以控制钢的厚度以及带钢平稳前移,因此会利用现场采集到的精轧过程数据来作为测试数据。
S12、获取训练好的层次狄利克雷过程-隐半马尔科夫-核熵成分分析HDP-HSMM-KECA模型。
其中,HDP-HSMM-KECA模型包括HDP-HSMM子模型和KECA子模型。
可选地,S12中的HDP-HSMM-KECA模型的训练过程包括:
S121、获取不同运行模态的训练数据;其中,不同运行模态的训练数据为不同运行模态下的正常运行数据。
S122、利用训练数据训练初始的HDP-HSMM子模型,得到训练好的HDP-HSMM子模型,利用训练好的HDP-HSMM子模型将训练数据划分为多个模态。
可选地,S122中的HDP-HSMM子模型的训练过程包括:
基于训练数据、引入HDP模型作为先验知识以及利用EM(Expectation-Maximum,期望最大化)算法对HSMM模型进行训练,得到训练好的HDP-HSMM模型。
S123、对划分后的多个模态的训练数据中每个模态的训练数据分别进行预处理,得到每个模态预处理后的训练数据。
S124、将每个模态预处理后的训练数据输入到初始的KECA子模型,并对初始的KECA子模型中的参数进行调优,得到训练好的KECA子模型;通过所述训练好的KECA子模型,获取每个模态预处理后的训练数据的非线性特征。
S125、基于每个模态预处理后的训练数据的非线性特征,得到相应模态训练数据局部统计量及局部控制限,进而获取训练数据全局统计量及全局控制限。
一种可行的实施方式中,将现场采集到的测试数据输入到训练好的HDP-HSMM子模型,训练好的HDP-HSMM子模型利用维比特算法可以直接求解出测试数据对应的最优的模态序列,并根据最优的模态序列识别测试数据对应的模态。
举例来说,将精轧过程数据输入到训练好的HDP-HSMM子模型,识别精轧过程数据对应的模态为模态1、模态2、模态5。
S13、将测试数据输入到训练好的HDP-HSMM(Hierarchical DirichletProcesses-Hidden Semi-Markov Models,层次狄利克雷过程-隐半马尔科夫)子模型,得到测试数据的对应模态。
S14、基于测试数据的对应模态对测试数据进行预处理。
可选地,对划分后的多个模态的训练数据中每个模态的训练数据进行中心化,得到中心化后的训练数据。
对中心化后的训练数据进行归一化,归一化后的训练数据即为每个模态预处理后的训练数据。
一种可行的实施方式中,在识别测试数据对应的模态后,利用对应模态的训练数据的均值与方差对测试数据进行中心化与归一化,得到预处理后的测试数据。
举例来说,将精轧过程数据中模态1对应的数据根据模态1的均值与方差进行中心化与归一化,得到预处理数据1;将精轧过程数据中模态2对应的数据根据模态2的均值与方差进行中心化与归一化,得到预处理数据2;将精轧过程数据中模态5对应的数据根据模态5的均值与方差进行中心化与归一化,得到预处理数据5。
S15、将预处理后的测试数据输入到训练好的KECA(Kernel Entropy ComponentAnalysis,核熵成分分析)子模型,得到相应模态训练数据局部统计量,进而获取训练数据全局统计量。
一种可行的实施方式中,对预处理后的测试数据计算其核矩阵,并利用训练好的对应模态的KECA模型提取预处理后的测试数据的非线性特征,然后计算测试数据相应的局部离群因子统计量以及全局统计量。
一种可行的实施方式中,上述步骤S15可以包括以下步骤S151- S152:
S151、分别利用每个模态预处理后的训练数据的非线性特征计算每个模态的局部离群因子LOF,得到各个模态训练数据局部离群因子统计量。
S152、基于每个模态的局部离群因子及相应的局部离群因子控制限以及贝叶斯推理,得到测试数据全局统计量。
可选地,S152中的基于每个模态的局部离群因子以及贝叶斯推理,得到训练数据全局统计量包括:
定义样本
Figure 242151DEST_PATH_IMAGE001
在第
Figure 291884DEST_PATH_IMAGE002
个模态中的故障发生的概率,由下式(1)计算:
Figure 202072DEST_PATH_IMAGE003
其中,
Figure 799406DEST_PATH_IMAGE004
为正常条件下样本的先验概率,取值为
Figure 430239DEST_PATH_IMAGE005
Figure 22894DEST_PATH_IMAGE006
为预设置信度;
Figure 713770DEST_PATH_IMAGE007
为故障条件下样本的先验概率,取值为
Figure 657455DEST_PATH_IMAGE006
Figure 856093DEST_PATH_IMAGE008
为正常条件下样本的后验概率,由下式(2)计算;
Figure 975358DEST_PATH_IMAGE009
为故障条件下样本的后验概率,由下式(3)计算;
Figure 102714DEST_PATH_IMAGE010
其中,
Figure 533696DEST_PATH_IMAGE011
代表第
Figure 771910DEST_PATH_IMAGE002
个模态的LOF,
Figure 339158DEST_PATH_IMAGE012
为相对应的局部控制限,
Figure 870371DEST_PATH_IMAGE013
为正常情况;
Figure 664015DEST_PATH_IMAGE014
为故障情况;由此得到融合的贝叶斯预测全局统计量,由下式(4)计算:
Figure 830554DEST_PATH_IMAGE015
其中,
Figure 127674DEST_PATH_IMAGE016
为模态数。
举例来说,将预处理数据1输入到模态1对应的KECA模型1,得到预处理数据1的非线性特征,然后计算预处理数据1的局部离群因子统计量1;将预处理数据2输入到模态2对应的KECA模型2,得到预处理数据2的非线性特征,然后计算预处理数据2的局部离群因子统计量2;将预处理数据5输入到模态5对应的KECA模型5,得到预处理数据5的非线性特征,然后计算预处理数据5的局部离群因子统计量5;根据贝叶斯推理以及局部离群因子统计量1、局部离群因子统计量2、局部离群因子统计量5得到全局统计量。
S16、若全局统计量小于或等于预设的全局控制限,则带钢热连轧过程运行正常;若全局统计量大于预设的全局控制限,则带钢热连轧过程发生故障。本发明实施例中,利用HDP作为无限状态空间的先验知识,可以获取最优的模态数,而无需自己指定模态数,更符合生产过程的实际情况。
利用多模态数据构建HDP-HSMM模型可以实现模态的自适应精确划分,同时解决了传统HMM(Hidden Markov Model,隐马尔可夫模型)状态驻留时间的限制,更加切合实际过程。
利用KECA-LOF(Kernel Entropy Component Analysis-local outlier factor,核熵成分分析-局部离群因子)提取非线性特征构建局部监测模型,并不限定数据严格服从高斯分布,同时选取的主元数要少于KPCA,较于传统的KPCA有更好的监测效果。
利用贝叶斯决策将局部模型进行一个融合,可以更加直观地获取热连轧过程状态变化信息。
如图4所示,本发明实施例提供了一种HDP-HSMM-KECA模型的训练方法,该方法可以由电子设备实现。如图4所示的HDP-HSMM-KECA模型的训练方法流程图,该方法的处理流程可以包括如下的步骤:
S21、获取不同运行模态的训练数据。
其中,不同运行模态的训练数据为不同运行模态下的正常运行数据。
一种可行的实施方式中,本发明针对具有多模态特性的带钢热连轧过程进行研究,其中精轧过程在整个热连轧过程中起着重要作用,可确保最终产品高精度、高效率、连续稳定生产。因此会利用现场采集到的不同运行模态下的正常运行的精轧过程数据作为训练数据,来构建带钢热连轧过程的监测模型,本发明实施例中,带钢热连轧过程的监测模型为HDP-HSMM-KECA模型,HDP-HSMM-KECA模型中包括HDP-HSMM子模型以及KECA子模型,在训练时,会分别对HDP-HSMM子模型以及KECA子模型进行训练。
S22、根据训练数据对初始的HDP-HSMM子模型进行训练,得到训练好的HDP-HSMM子模型。
一种可行的实施方式中,上述步骤S22可以包括以下步骤S221- S224:
S221、考虑多模态过程的各个模态对应HSMM的各个隐状态,每个隐状态对应于一个片段的观测的过程数据,则可以通过构建HSMM模型求取模态的动态序列,实现模态划分。
HSMM模型如图5所示,隐状态序列为:
Figure 455887DEST_PATH_IMAGE018
Figure 471248DEST_PATH_IMAGE016
为隐状态的数量,即模态数,观测序列为:
Figure 175899DEST_PATH_IMAGE019
Figure 91640DEST_PATH_IMAGE020
为观测序列样本数。HSMM模型可以由
Figure 590754DEST_PATH_IMAGE021
四要素进行描述,其中:
Figure 827832DEST_PATH_IMAGE022
是初始状态概率:
Figure 336173DEST_PATH_IMAGE023
Figure 607886DEST_PATH_IMAGE024
Figure 12322DEST_PATH_IMAGE025
代表
Figure 2275DEST_PATH_IMAGE026
时刻的隐状态。
Figure 783149DEST_PATH_IMAGE027
是状态转移概率矩阵:
Figure 673483DEST_PATH_IMAGE028
Figure 514400DEST_PATH_IMAGE029
Figure 991648DEST_PATH_IMAGE030
代表
Figure 576214DEST_PATH_IMAGE031
时刻的隐状态。
Figure 822518DEST_PATH_IMAGE032
是观测概率:
Figure 834337DEST_PATH_IMAGE033
Figure 533302DEST_PATH_IMAGE034
是驻留时间概率矩阵:
Figure 921558DEST_PATH_IMAGE035
Figure 520905DEST_PATH_IMAGE036
Figure 703624DEST_PATH_IMAGE037
表示隐状态驻留时间。
一般假设观测值服从高斯分布,状态驻留时间服从一个非几何分布。通过EM(Expectation-Maximum, 期望最大化)算法计算模型的参数。EM算法的原理是通过E步和M步循环迭代使得对数似然函数下界收敛到设定的误差值或者达到最大的迭代次数来求取模型参数。在获取到HSMM模型参数之后,利用基于动态规划的Viterbi算法求取最优可能的隐状态序列变化作为模态的变化,获取多模态训练数据模态的划分,如下式(1)所示:
Figure 155465DEST_PATH_IMAGE038
其中,
Figure 81833DEST_PATH_IMAGE039
为对函数求参数或集合的函数。
S222、DP(Dirichlet Process,狄利克雷过程)过程是一种可由测度空间上的随机概率密度分布
Figure 896205DEST_PATH_IMAGE040
与正实数
Figure 390772DEST_PATH_IMAGE041
进行表示的随机过程:
Figure 188963DEST_PATH_IMAGE042
,折棍过程构造是基于随机变量
Figure 794388DEST_PATH_IMAGE043
的独立同分布序列,
Figure 728846DEST_PATH_IMAGE044
Figure 892849DEST_PATH_IMAGE045
,可使用折棍过程进行构造
Figure 178337DEST_PATH_IMAGE046
过程,如下式(2)(3)所示:
Figure 56294DEST_PATH_IMAGE047
其中
Figure 110838DEST_PATH_IMAGE048
是随机测度,
Figure 947207DEST_PATH_IMAGE049
是随机概率测度,
Figure 454412DEST_PATH_IMAGE050
Figure 667218DEST_PATH_IMAGE051
是随机变量,
Figure 746907DEST_PATH_IMAGE052
是一个在
Figure 754178DEST_PATH_IMAGE053
中的概率测度,简记为:
Figure 14258DEST_PATH_IMAGE054
同样由折棍过程可以构造狄利克雷混合过程,如下式(4)-(6)所示:
Figure 499597DEST_PATH_IMAGE055
其中
Figure 528733DEST_PATH_IMAGE056
Figure 441325DEST_PATH_IMAGE057
的指示因子,
Figure 188701DEST_PATH_IMAGE057
服从
Figure 976266DEST_PATH_IMAGE058
,参数
Figure 859909DEST_PATH_IMAGE059
服从
Figure 474561DEST_PATH_IMAGE060
S223、HDP是对DP混合模型的多层次扩展,可利用折棍过程进行构造,如下式(7)-(10)所示:
Figure 584599DEST_PATH_IMAGE061
其中
Figure 536375DEST_PATH_IMAGE062
服从
Figure 415469DEST_PATH_IMAGE063
,参数
Figure 794498DEST_PATH_IMAGE064
服从
Figure 985308DEST_PATH_IMAGE065
,且取值为
Figure 114676DEST_PATH_IMAGE066
的概率为
Figure 972910DEST_PATH_IMAGE067
Figure 663786DEST_PATH_IMAGE068
Figure 607471DEST_PATH_IMAGE069
为指示因子,
Figure 776415DEST_PATH_IMAGE070
为参数为
Figure 223577DEST_PATH_IMAGE071
的先验分布,参数
Figure 85354DEST_PATH_IMAGE072
Figure 516335DEST_PATH_IMAGE073
相当于DP混合模型中的
Figure 987505DEST_PATH_IMAGE073
S224、将HSMM对时间序列标记的特性和HDP对数据自适应聚类的特性相结合,可以在不指定聚类数的情况下对获取的数据进行准确的模态划分,HDP-HSMM的示意图如图6所示,HDP-HSMM可以如下式(11)-(19)所示:
Figure 554753DEST_PATH_IMAGE074
其中GEM为Stick-breaking过程,
Figure 587431DEST_PATH_IMAGE075
是隐状态序列,
Figure 505709DEST_PATH_IMAGE076
是观测序列,
Figure 16455DEST_PATH_IMAGE077
是服从状态驻留时间分布
Figure 703789DEST_PATH_IMAGE078
的状态驻留时间,
Figure 907368DEST_PATH_IMAGE079
为状态驻留时间分布
Figure 47362DEST_PATH_IMAGE078
的参数,
Figure 486434DEST_PATH_IMAGE080
Figure 933334DEST_PATH_IMAGE081
所服从的分布,
Figure 307814DEST_PATH_IMAGE082
为时间参数,
Figure 935105DEST_PATH_IMAGE083
为状态参数,
Figure 787654DEST_PATH_IMAGE084
Figure 856104DEST_PATH_IMAGE085
状态对应的先验概率分布,HDP可作为一个无限状态的转移空间,每一个特定状态观测分布的参数
Figure 526120DEST_PATH_IMAGE086
都是一个DP过程,可作为状态的转移概率,可以利用弱极限近似采样器完成无穷维HDP的近似推断。
S23、将训练数据输入到训练好的HDP-HSMM子模型,得到划分后的多个模态的训练数据。
一种可行的实施方式中,将训练数据输入到训练好的HDP-HSMM子模型,训练好的HDP-HSMM子模型利用维比特算法将训练数据划分为多个模态。
S24、对划分后的多个模态的训练数据中每个模态的训练数据分别进行预处理,得到每个模态预处理后的训练数据。
一种可行的实施方式中,上述步骤S24可以包括以下步骤S241- S242:
S241、对划分后的多个模态的训练数据中每个模态的训练数据进行中心化,得到中心化后的训练数据。
一种可行的实施方式中,将每个变量减去整个样本的均值,从而获取每个样本相对整体平均值的变化数值。
S242、对中心化后的训练数据进行归一化,归一化后的训练数据即为每个模态预处理后的训练数据。
一种可行的实施方式中,将第一步中心化处理过的数据处于其标准差,从而标定每个变量到单位方差,使个别特殊变量不会处于主导地位。
S25、将多个预处理后的训练数据输入到KECA子模型,并对参数进行调优,得到每个模态预处理后的训练数据的非线性特征。
一种可行的实施方式中,上述步骤S25可以包括以下步骤:
KECA通过核函数将数据从低维特征空间投影到高维特征空间,将数据从非线性转化为线性,然后在高维特征空间最小化瑞利熵值实现数据降维。
瑞利熵是一种信息熵的指标,如下式(20)所示:
Figure 545766DEST_PATH_IMAGE087
其中
Figure 202007DEST_PATH_IMAGE088
为标准化后的样本
Figure 718439DEST_PATH_IMAGE089
的概率密度函数,根据对数函数的单调性,可以将式(20)转化为下式(21):
Figure 700301DEST_PATH_IMAGE090
即通过对
Figure 177550DEST_PATH_IMAGE091
的估计来实现瑞利熵
Figure 762115DEST_PATH_IMAGE092
的求取,引入
Figure 506955DEST_PATH_IMAGE093
窗概率密度估计算子,如下式(22)所示:
Figure 518773DEST_PATH_IMAGE094
其中,
Figure 217739DEST_PATH_IMAGE095
为样本数;
Figure 605995DEST_PATH_IMAGE096
Figure 706806DEST_PATH_IMAGE093
窗,同时也是中心为
Figure 889526DEST_PATH_IMAGE001
、宽为
Figure 341367DEST_PATH_IMAGE097
的核函数,本发明实施例采用的是径向基函数,如下式(23)所示:
Figure 267735DEST_PATH_IMAGE098
将式(22)代入(21),利用样本均值对样本期望近似估计,并经过一系列变换,得到的结果如下式(24)所示:
Figure 721588DEST_PATH_IMAGE099
其中,
Figure 340788DEST_PATH_IMAGE100
Figure 14346DEST_PATH_IMAGE101
的核矩阵,其元素
Figure 478825DEST_PATH_IMAGE102
Figure 554228DEST_PATH_IMAGE103
为元素均1为的
Figure 344330DEST_PATH_IMAGE104
Figure 239605DEST_PATH_IMAGE105
维向量。然后对核矩阵进行分解,如下式(25)所示:
Figure 773354DEST_PATH_IMAGE106
其中,
Figure 225237DEST_PATH_IMAGE107
为特征向量矩阵,
Figure 920660DEST_PATH_IMAGE108
为特征值矩阵。此时式(24)转化为下式(26):
Figure 568811DEST_PATH_IMAGE109
瑞利熵可以表示为
Figure 375093DEST_PATH_IMAGE110
个分量的累加和,只有
Figure 284143DEST_PATH_IMAGE111
大才能保证对瑞利熵的贡献率也大,对每个模态将
Figure 291413DEST_PATH_IMAGE112
从大到小排序为
Figure 20335DEST_PATH_IMAGE113
,选择累计和大于99%的前
Figure 771253DEST_PATH_IMAGE114
项对应的特征向量构成投影空间,标准化后化得到投影矩阵
Figure 800389DEST_PATH_IMAGE115
,相应的特征值向量为
Figure 211516DEST_PATH_IMAGE116
,即可将
Figure 958892DEST_PATH_IMAGE095
维数据
Figure 247922DEST_PATH_IMAGE117
通过映射到
Figure 131565DEST_PATH_IMAGE114
个主轴张成的子空间
Figure 215058DEST_PATH_IMAGE118
上,则样本内数据集降维后的投影,如下式(27)所示:
Figure 184151DEST_PATH_IMAGE119
样本外数据投影到
Figure 135927DEST_PATH_IMAGE120
上的计算公式,如下式(28)所示:
Figure 749442DEST_PATH_IMAGE121
其中,
Figure 394050DEST_PATH_IMAGE122
S26、基于每个模态预处理后的训练数据的非线性特征,得到相应模态局部统计量及局部控制限,进而获取全局统计量及全局控制限。
一种可行的实施方式中,上述步骤S26可以包括以下步骤S261- S263:
S261、分别利用每个模态预处理后的训练数据的非线性特征计算每个模态的局部离群因子,得到各个模态局部离群因子统计量。
一种可行的实施方式中,LOF算法根据样本密度大小来判断该样本是否是离群点,因为具有故障的样本相对于正常样本属于离群点,所以可以使用LOF作为监测指标,由于LOF样本没有数据分布的限制,检测性能优于T2、SPE统计量。
在利用KECA提取了各个模态的非线性特征后,将提取的特征作为样本
Figure 224340DEST_PATH_IMAGE123
Figure 714228DEST_PATH_IMAGE124
计算局部离群因子值,其中
Figure 447828DEST_PATH_IMAGE125
为特征样本个数,
Figure 263338DEST_PATH_IMAGE126
为特征样本维数。
对于样本
Figure 816810DEST_PATH_IMAGE001
,首先在剩余样本中找到样本的
Figure 110388DEST_PATH_IMAGE127
个邻居,构成样本的邻域
Figure 823129DEST_PATH_IMAGE128
,则可计算样本到邻域内邻居的最远欧式距离
Figure 684906DEST_PATH_IMAGE129
,然后计算样本
Figure 115887DEST_PATH_IMAGE001
到邻居
Figure 321478DEST_PATH_IMAGE130
的可达距离:
Figure 888726DEST_PATH_IMAGE131
则样本
Figure 921404DEST_PATH_IMAGE001
的局部可达密度
Figure 574102DEST_PATH_IMAGE132
可表示为:
Figure 350428DEST_PATH_IMAGE133
同理可计算邻居
Figure 772182DEST_PATH_IMAGE134
的局部可达密度
Figure 100396DEST_PATH_IMAGE135
,最终可以计算样本
Figure 115756DEST_PATH_IMAGE001
的局部离群因子
Figure 554828DEST_PATH_IMAGE136
Figure 470569DEST_PATH_IMAGE137
S262、基于各个模态局部离群因子统计量以及核密度估计KDE算法,得到各个模态的局部离群因子控制限。
一种可行的实施方式中,样本
Figure 704104DEST_PATH_IMAGE138
的局部离群因子即可以表示为邻域内所有样本的平均局部可达密度与自身局部可达密度之比。在获取到各个模态降维后样本的局部离群因子值后,利用核密度估计算法计算各个模态下正常样本的局部离群因子控制限
Figure 206761DEST_PATH_IMAGE139
S263、基于每个模态的局部离群因子以及贝叶斯推理,得到全局统计量及全局控制限。
一种可行的实施方式中,上述步骤S263可以包括以下步骤:
为了更加直观地获取过程状态变化信息,利用贝叶斯推理将每个模态局部统计量融合为全局统计量
Figure 449523DEST_PATH_IMAGE140
定义样本
Figure 986815DEST_PATH_IMAGE001
在第
Figure 656831DEST_PATH_IMAGE002
个模态中的故障发生的概率,由下式(32)计算:
Figure 381204DEST_PATH_IMAGE141
其中,
Figure 162078DEST_PATH_IMAGE004
为正常条件下样本的先验概率,取值为
Figure 678510DEST_PATH_IMAGE005
Figure 893329DEST_PATH_IMAGE006
为预设置信度;
Figure 964053DEST_PATH_IMAGE007
为故障条件下样本的先验概率,取值为
Figure 423984DEST_PATH_IMAGE006
Figure 794923DEST_PATH_IMAGE008
为正常条件下样本的后验概率、
Figure 682107DEST_PATH_IMAGE009
为故障条件下样本的后验概率,由下式(33)计算:
Figure 771286DEST_PATH_IMAGE142
其中,
Figure 628384DEST_PATH_IMAGE011
代表第
Figure 994774DEST_PATH_IMAGE002
个模态的LOF,
Figure 177494DEST_PATH_IMAGE012
为相对应的局部控制限,
Figure 862291DEST_PATH_IMAGE013
为正常情况;
Figure 788658DEST_PATH_IMAGE143
为故障情况;由此得到融合的贝叶斯预测全局统计量,由下式(34)计算:
Figure 743976DEST_PATH_IMAGE144
其中,
Figure 97597DEST_PATH_IMAGE145
为模态数,全局控制限为置信度
Figure 771155DEST_PATH_IMAGE006
本发明实施例中,利用层次狄利克雷过程HDP作为无限状态空间的先验知识,可以获取最优的模态数,而无需自己指定模态数,更符合生产过程的实际情况。
利用多模态数据构建HDP-HSMM模型可以实现模态的自适应精确划分,同时解决了传统隐马尔可夫模型HMM状态驻留时间的限制,更加切合实际过程。
利用KECA-LOF提取非线性特征构建局部监测模型,并不限定数据严格服从高斯分布,同时选取的主元数要少于KPCA,较于传统的KPCA有更好的监测效果。
利用贝叶斯决策将局部模型进行一个融合,可以更加直观地获取热连轧过程状态变化信息。
如图7所示,本发明实施例提供了一种带钢热连轧多模态过程监测装置700,该装置700应用于实现带钢热连轧多模态过程监测方法,该装置700包括:
数据获取模块710,用于获取带钢热连轧过程的测试数据。
模型获取模块720,用于获取训练好的层次狄利克雷过程-隐半马尔科夫-核熵成分分析HDP-HSMM-KECA模型;其中,HDP-HSMM-KECA模型包括HDP-HSMM子模型和KECA子模型。
输入模块730,用于将测试数据输入到训练好的HDP-HSMM子模型,得到测试数据的对应模态。
预处理模块740,用于基于测试数据的对应模态对测试数据进行预处理。
计算模块750,用于将预处理后的测试数据输入到训练好的KECA子模型,得到相应局部统计量,进而获取全局统计量。
输出模块760,用于若全局统计量小于或等于预设的全局控制限,则带钢热连轧过程运行正常;若全局统计量大于预设的全局控制限,则带钢热连轧过程发生故障。
可选地,模型获取模块720,进一步用于:
S21、获取不同运行模态的训练数据;其中,不同运行模态的训练数据为不同运行模态下的正常运行数据。
S22、利用训练数据训练初始的HDP-HSMM子模型,得到训练好的HDP-HSMM子模型,利用训练好的HDP-HSMM子模型将训练数据划分为多个模态。
S23、对划分后的多个模态的训练数据中每个模态的训练数据分别进行预处理,得到每个模态预处理后的训练数据。
S24、将每个模态预处理后的训练数据输入到初始的KECA子模型,并对初始的KECA子模型中的参数进行调优,得到训练好的KECA子模型;通过所述训练好的KECA子模型,获取每个模态预处理后的训练数据的非线性特征。
S25、基于每个模态预处理后的训练数据的非线性特征,得到相应模态训练数据局部统计量及局部控制限,进而获取训练数据全局统计量及全局控制限。
可选地,模型获取模块720,进一步用于:
S221、获取不同运行模态的训练数据。
S222、基于训练数据,引入HDP模型作为先验知识以及利用期望最大化EM算法对HSMM模型进行训练,得到训练好的HDP-HSMM模型。
可选地,模型获取模块720,进一步用于:
对划分后的多个模态的训练数据中每个模态的训练数据进行中心化,得到中心化后的训练数据。
对中心化后的训练数据进行归一化,归一化后的训练数据即为每个模态预处理后的训练数据。
可选地,模型获取模块720,进一步用于:
S251、分别利用每个模态预处理后的训练数据的非线性特征计算每个模态的局部离群因子LOF,得到各个模态训练数据局部离群因子统计量。
S252、基于各个模态训练数据局部离群因子统计量以及核密度估计KDE算法,得到各个模态的局部离群因子控制限。
S253、基于每个模态的局部离群因子以及贝叶斯推理,得到训练数据全局统计量及全局控制限。
可选地,模型获取模块720,进一步用于:
定义样本
Figure 501214DEST_PATH_IMAGE001
在第
Figure 576617DEST_PATH_IMAGE002
个模态中的故障发生的概率,由下式(1)计算:
Figure 835560DEST_PATH_IMAGE146
其中,
Figure 121048DEST_PATH_IMAGE004
为正常条件下样本的先验概率,取值为
Figure 28699DEST_PATH_IMAGE005
Figure 83242DEST_PATH_IMAGE006
为预设置信度;
Figure 654032DEST_PATH_IMAGE007
为故障条件下样本的先验概率,取值为
Figure 426816DEST_PATH_IMAGE006
Figure 374043DEST_PATH_IMAGE008
为正常条件下样本的后验概率,由下式(2)计算;
Figure 283094DEST_PATH_IMAGE009
为故障条件下样本的后验概率,由下式(3)计算;
Figure 24785DEST_PATH_IMAGE010
其中,
Figure 19286DEST_PATH_IMAGE011
代表第
Figure 268739DEST_PATH_IMAGE002
个模态的LOF,
Figure 32296DEST_PATH_IMAGE012
为相对应的局部控制限,
Figure 210467DEST_PATH_IMAGE013
为正常情况;
Figure 692264DEST_PATH_IMAGE014
为故障情况;由此得到融合的贝叶斯预测全局统计量,由下式(4)计算:
Figure 981294DEST_PATH_IMAGE015
其中,
Figure 864937DEST_PATH_IMAGE016
为模态数,全局控制限为置信度
Figure 73064DEST_PATH_IMAGE006
本发明实施例中,利用层次狄利克雷过程HDP作为无限状态空间的先验知识,可以获取最优的模态数,而无需自己指定模态数,更符合生产过程的实际情况。
利用多模态数据构建HDP-HSMM模型可以实现模态的自适应精确划分,同时解决了传统隐马尔可夫模型HMM状态驻留时间的限制,更加切合实际过程。
利用KECA-LOF提取非线性特征构建局部监测模型,并不限定数据严格服从高斯分布,同时选取的主元数要少于KPCA,较于传统的KPCA有更好的监测效果。
利用贝叶斯决策将局部模型进行一个融合,可以更加直观地获取热连轧过程状态变化信息。
图8是本发明实施例提供的一种电子设备800的结构示意图,该电子设备800可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(centralprocessing units,CPU)801和一个或一个以上的存储器802,其中,存储器802中存储有至少一条指令,至少一条指令由处理器801加载并执行以实现下述带钢热连轧多模态过程监测方法:
S1、获取带钢热连轧过程的测试数据。
S2、获取训练好的层次狄利克雷过程-隐半马尔科夫-核熵成分分析HDP-HSMM-KECA模型;其中,HDP-HSMM-KECA模型包括HDP-HSMM子模型和KECA子模型。
S3、将测试数据输入到训练好的HDP-HSMM子模型,得到测试数据的对应模态。
S4、基于测试数据的对应模态对测试数据进行预处理。
S5、将预处理后的测试数据输入到训练好的KECA子模型,得到相应模态局部统计量,进而获取全局统计量。
S6、若全局统计量小于或等于预设的全局控制限,则带钢热连轧过程运行正常;若全局统计量大于预设的全局控制限,则带钢热连轧过程发生故障。
在示例性实施例中,还提供了一种计算机可读存储介质,例如包括指令的存储器,上述指令可由终端中的处理器执行以完成上述带钢热连轧多模态过程监测方法。例如,计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种带钢热连轧多模态过程监测方法,其特征在于,所述方法包括:
S1、获取带钢热连轧过程的测试数据;
S2、获取训练好的层次狄利克雷过程-隐半马尔科夫-核熵成分分析HDP-HSMM-KECA模型;其中,所述HDP-HSMM-KECA模型包括HDP-HSMM子模型和KECA子模型;
S3、将所述测试数据输入到训练好的HDP-HSMM子模型,得到测试数据的对应模态;
S4、基于所述测试数据的对应模态对所述测试数据进行预处理;
S5、将预处理后的测试数据输入到训练好的KECA子模型,得到相应模态局部统计量,进而获取全局统计量;
S6、若所述全局统计量小于或等于预设的全局控制限,则所述带钢热连轧过程运行正常;若所述全局统计量大于预设的全局控制限,则所述带钢热连轧过程发生故障。
2.根据权利要求1所述的方法,其特征在于,所述S2中的HDP-HSMM-KECA模型的训练过程包括:
S21、获取不同运行模态的训练数据;其中,所述不同运行模态的训练数据为不同运行模态下的正常运行数据;
S22、利用所述训练数据训练初始的HDP-HSMM子模型,得到训练好的HDP-HSMM子模型,利用所述训练好的HDP-HSMM子模型将所述训练数据划分为多个模态;
S23、对划分后的多个模态的训练数据中每个模态的训练数据分别进行预处理,得到每个模态预处理后的训练数据;
S24、将所述每个模态预处理后的训练数据输入到初始的KECA子模型,并对初始的KECA子模型中的参数进行调优,得到训练好的KECA子模型;通过所述训练好的KECA子模型,获取所述每个模态预处理后的训练数据的非线性特征;
S25、基于所述每个模态预处理后的训练数据的非线性特征,得到相应模态训练数据局部统计量及局部控制限,进而获取训练数据全局统计量及全局控制限。
3.根据权利要求2所述的方法,其特征在于,所述S22中的HDP-HSMM子模型的训练过程包括:
基于所述训练数据、引入HDP模型作为先验知识以及利用期望最大化EM算法对HSMM模型进行训练,得到训练好的HDP-HSMM模型。
4.根据权利要求2所述的方法,其特征在于,所述S23中的对划分后的多个模态的训练数据中每个模态的训练数据分别进行预处理,得到每个模态预处理后的训练数据包括:
对划分后的多个模态的训练数据中每个模态的训练数据进行中心化,得到中心化后的训练数据;
对所述中心化后的训练数据进行归一化,归一化后的训练数据即为每个模态预处理后的训练数据。
5.根据权利要求2所述的方法,其特征在于,所述S25中的基于所述每个模态预处理后的训练数据的非线性特征,得到相应模态训练数据局部统计量及局部控制限,进而获取训练数据全局统计量及全局控制限包括:
S251、分别利用所述每个模态预处理后的训练数据的非线性特征计算每个模态的局部离群因子LOF,得到各个模态训练数据局部离群因子统计量;
S252、基于所述各个模态训练数据局部离群因子统计量以及核密度估计KDE算法,得到各个模态的局部离群因子控制限;
S253、基于每个模态的局部离群因子以及贝叶斯推理,得到训练数据全局统计量及全局控制限。
6.根据权利要求5所述的方法,其特征在于,所述S253中的基于所述每个模态的局部离群因子以及贝叶斯推理,得到训练数据全局统计量及全局控制限包括:
定义样本
Figure 278362DEST_PATH_IMAGE001
在第
Figure 664344DEST_PATH_IMAGE002
个模态中的故障发生的概率,由下式(1)计算:
Figure 178502DEST_PATH_IMAGE004
其中,
Figure 291821DEST_PATH_IMAGE005
为正常条件下样本的先验概率,取值为
Figure 575035DEST_PATH_IMAGE006
Figure 131918DEST_PATH_IMAGE007
为预设置信度;
Figure 867793DEST_PATH_IMAGE008
为故障条件下样本的先验概率,取值为
Figure 535534DEST_PATH_IMAGE007
Figure 922522DEST_PATH_IMAGE009
为正常条件下样本的后验概率,由下式(2)计算;
Figure 650307DEST_PATH_IMAGE010
为故障条件下样本的后验概率,由下式(3)计算;
Figure 873478DEST_PATH_IMAGE012
其中,
Figure 344910DEST_PATH_IMAGE013
代表第
Figure 337137DEST_PATH_IMAGE002
个模态的LOF,
Figure 485091DEST_PATH_IMAGE014
为相对应的局部控制限,
Figure 461137DEST_PATH_IMAGE015
为正常情况;
Figure 205102DEST_PATH_IMAGE016
为故障情况;由此得到融合的贝叶斯预测全局统计量,由下式(4)计算:
Figure 317414DEST_PATH_IMAGE018
其中,
Figure 387002DEST_PATH_IMAGE019
为模态数,所述全局控制限为置信度
Figure 834032DEST_PATH_IMAGE007
7.一种带钢热连轧多模态过程监测装置,其特征在于,所述装置包括:
数据获取模块,用于获取带钢热连轧过程的测试数据;
模型获取模块,用于获取训练好的层次狄利克雷过程-隐半马尔科夫-核熵成分分析HDP-HSMM-KECA模型;其中,所述HDP-HSMM-KECA模型包括HDP-HSMM子模型和KECA子模型;
输入模块,用于将所述测试数据输入到训练好的HDP-HSMM子模型,得到测试数据的对应模态;
预处理模块,用于基于所述测试数据的对应模态对所述测试数据进行预处理;
计算模块,用于将预处理后的测试数据输入到训练好的KECA子模型,得到相应局部统计量,进而获取全局统计量;
输出模块,用于若所述全局统计量小于或等于预设的全局控制限,则所述带钢热连轧过程运行正常;若所述全局统计量大于预设的全局控制限,则所述带钢热连轧过程发生故障。
8.根据权利要求7所述的装置,其特征在于,所述模型获取模块,进一步用于:
S21、获取不同运行模态的训练数据;其中,所述不同运行模态的训练数据为不同运行模态下的正常运行数据;
S22、利用所述训练数据训练初始的HDP-HSMM子模型,得到训练好的HDP-HSMM子模型,利用所述训练好的HDP-HSMM子模型将所述训练数据划分为多个模态;
S23、对划分后的多个模态的训练数据中每个模态的训练数据分别进行预处理,得到每个模态预处理后的训练数据;
S24、将所述每个模态预处理后的训练数据输入到初始的KECA子模型,并对初始的KECA子模型中的参数进行调优得到训练好的KECA子模型;通过所述训练好的KECA子模型,获取所述每个模态预处理后的训练数据的非线性特征;
S25、基于所述每个模态预处理后的训练数据的非线性特征,得到相应模态训练数据局部统计量及局部控制限,进而获取训练数据全局统计量及全局控制限。
9.根据权利要求7所述的装置,其特征在于,所述模型获取模块,进一步用于:
基于训练数据、引入HDP模型作为先验知识以及利用期望最大化EM算法对HSMM模型进行训练,得到训练好的HDP-HSMM模型。
10.根据权利要求7所述的装置,其特征在于,所述预处理模块,进一步用于:
对划分后的多个模态的训练数据中每个模态的训练数据进行中心化,得到中心化后的训练数据;
对所述中心化后的训练数据进行归一化,归一化后的训练数据即为每个模态预处理后的训练数据。
CN202210057410.4A 2022-01-19 2022-01-19 一种带钢热连轧多模态过程监测方法及装置 Active CN114077876B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210057410.4A CN114077876B (zh) 2022-01-19 2022-01-19 一种带钢热连轧多模态过程监测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210057410.4A CN114077876B (zh) 2022-01-19 2022-01-19 一种带钢热连轧多模态过程监测方法及装置

Publications (2)

Publication Number Publication Date
CN114077876A true CN114077876A (zh) 2022-02-22
CN114077876B CN114077876B (zh) 2022-05-13

Family

ID=80284562

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210057410.4A Active CN114077876B (zh) 2022-01-19 2022-01-19 一种带钢热连轧多模态过程监测方法及装置

Country Status (1)

Country Link
CN (1) CN114077876B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114757000A (zh) * 2022-06-14 2022-07-15 山东嘉通专用汽车制造有限公司 一种高精度自适应弹簧钢拉拔过程优化控制方法
CN115780530A (zh) * 2023-01-19 2023-03-14 北京科技大学 基于专家知识与数据联合驱动的轧钢故障溯源方法及装置
CN115994337A (zh) * 2023-03-24 2023-04-21 北京科技大学 一种带钢热连轧非平稳过程微小故障检测方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002297387A (ja) * 2001-03-30 2002-10-11 Toshiba Corp 因果関係モデル生成方法および因果関係モデル生成装置および因果システムモデル構成装置および原因推定方法および原因推定装置およびプログラムおよび記録媒体
CN105955241A (zh) * 2016-06-03 2016-09-21 北京科技大学 一种基于联合数据驱动生产过程的质量故障定位方法
CN112666918A (zh) * 2020-12-01 2021-04-16 沈阳化工大学 一种基于在线压缩keca自适应工业过程故障检测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002297387A (ja) * 2001-03-30 2002-10-11 Toshiba Corp 因果関係モデル生成方法および因果関係モデル生成装置および因果システムモデル構成装置および原因推定方法および原因推定装置およびプログラムおよび記録媒体
CN105955241A (zh) * 2016-06-03 2016-09-21 北京科技大学 一种基于联合数据驱动生产过程的质量故障定位方法
CN112666918A (zh) * 2020-12-01 2021-04-16 沈阳化工大学 一种基于在线压缩keca自适应工业过程故障检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JIE DONG 等: "《A new multimode process monitoring method based on a hierarchical Dirichlet process—Hidden semi-Markov model with application to the hot steel strip mill process》", 《CONTROL ENGINEERING PRACTICE》 *
赵小强 等: "《改进邻域保持嵌入—独立元分析的间歇过程故障检测算法》", 《计算机集成制造系统》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114757000A (zh) * 2022-06-14 2022-07-15 山东嘉通专用汽车制造有限公司 一种高精度自适应弹簧钢拉拔过程优化控制方法
CN114757000B (zh) * 2022-06-14 2022-08-12 山东嘉通专用汽车制造有限公司 一种高精度自适应弹簧钢拉拔过程优化控制方法
CN115780530A (zh) * 2023-01-19 2023-03-14 北京科技大学 基于专家知识与数据联合驱动的轧钢故障溯源方法及装置
CN115994337A (zh) * 2023-03-24 2023-04-21 北京科技大学 一种带钢热连轧非平稳过程微小故障检测方法及装置

Also Published As

Publication number Publication date
CN114077876B (zh) 2022-05-13

Similar Documents

Publication Publication Date Title
CN114077876B (zh) 一种带钢热连轧多模态过程监测方法及装置
CN112527788B (zh) 变压器监测数据异常值检测与清洗的方法及装置
Sun et al. Multiclassification of tool wear with support vector machine by manufacturing loss consideration
El-Midany et al. A proposed framework for control chart pattern recognition in multivariate process using artificial neural networks
CN108062565B (zh) 基于化工te过程的双主元-动态核主元分析故障诊断方法
Wang et al. Data-driven mode identification and unsupervised fault detection for nonlinear multimode processes
Deng et al. Modified kernel principal component analysis using double-weighted local outlier factor and its application to nonlinear process monitoring
Ma et al. A novel hierarchical detection and isolation framework for quality-related multiple faults in large-scale processes
Li et al. Distributed-ensemble stacked autoencoder model for non-linear process monitoring
CN109675935A (zh) 一种变控制限的ipca轧制过程在线故障诊断方法
CN110879580A (zh) 一种面向大范围非平稳瞬变连续过程的分析和监测方法
CN111638707A (zh) 基于som聚类和mpca的间歇过程故障监测方法
Peng et al. Quality-related process monitoring for dynamic non-Gaussian batch process with multi-phase using a new data-driven method
Zhang et al. A novel feature-extraction-based process monitoring method for multimode processes with common features and its applications to a rolling process
CN111482467A (zh) 一种轧机参数管理方法
CN106845826B (zh) 一种基于PCA-Cpk的冷连轧生产线服役质量状态评估方法
Liu et al. Fuzzy decision fusion system for fault classification with analytic hierarchy process approach
CN112904810A (zh) 基于有效特征选择的流程工业非线性过程监测方法
CN110427019B (zh) 一种基于多变量判别分析的工业过程故障分类方法及控制装置
CN110084301B (zh) 一种基于隐马尔可夫模型的多工况过程工况辨识方法
Tang et al. Monitoring of nonlinear processes with multiple operating modes through a novel gaussian mixture variational autoencoder model
Li et al. Novel adaptive fault detection method based on kernel entropy component analysis integrating moving window of dissimilarity for nonlinear dynamic processes
Jia et al. Prediction of tool wear in sculpture surface by a new fusion method of temporal convolutional network and self-attention
Zheng et al. Between-class difference analysis based multidimensional RBC for multivariate fault isolation of industrial processes
CN116011982A (zh) 一种磨煤机磨辊断裂在线监测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant