CN108268979A - 一种基于演化模糊关联规则的中厚板质量预测方法 - Google Patents
一种基于演化模糊关联规则的中厚板质量预测方法 Download PDFInfo
- Publication number
- CN108268979A CN108268979A CN201810101213.1A CN201810101213A CN108268979A CN 108268979 A CN108268979 A CN 108268979A CN 201810101213 A CN201810101213 A CN 201810101213A CN 108268979 A CN108268979 A CN 108268979A
- Authority
- CN
- China
- Prior art keywords
- fuzzy
- sliding window
- data
- association rule
- cluster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013277 forecasting method Methods 0.000 title abstract 2
- 229910000831 Steel Inorganic materials 0.000 claims abstract description 62
- 239000010959 steel Substances 0.000 claims abstract description 62
- 238000000034 method Methods 0.000 claims abstract description 51
- 238000005096 rolling process Methods 0.000 claims abstract description 37
- 238000012360 testing method Methods 0.000 claims abstract description 22
- 230000006870 function Effects 0.000 claims description 67
- 239000011159 matrix material Substances 0.000 claims description 36
- 238000009826 distribution Methods 0.000 claims description 17
- 238000004364 calculation method Methods 0.000 claims description 9
- 230000008859 change Effects 0.000 claims description 8
- 230000002159 abnormal effect Effects 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 claims description 3
- 101150049349 setA gene Proteins 0.000 claims description 3
- 238000007418 data mining Methods 0.000 abstract description 8
- 238000005516 engineering process Methods 0.000 abstract description 5
- 238000005065 mining Methods 0.000 description 8
- 230000001364 causal effect Effects 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 230000009471 action Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- VYZAMTAEIAYCRO-UHFFFAOYSA-N Chromium Chemical compound [Cr] VYZAMTAEIAYCRO-UHFFFAOYSA-N 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 101100455492 Escherichia coli (strain K12) lrhA gene Proteins 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- 241000764238 Isis Species 0.000 description 1
- PWHULOQIROXLJO-UHFFFAOYSA-N Manganese Chemical compound [Mn] PWHULOQIROXLJO-UHFFFAOYSA-N 0.000 description 1
- ZOKXTWBITQBERF-UHFFFAOYSA-N Molybdenum Chemical compound [Mo] ZOKXTWBITQBERF-UHFFFAOYSA-N 0.000 description 1
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- RTAQQCXQSZGOHL-UHFFFAOYSA-N Titanium Chemical compound [Ti] RTAQQCXQSZGOHL-UHFFFAOYSA-N 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000012098 association analyses Methods 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 229910052804 chromium Inorganic materials 0.000 description 1
- 239000011651 chromium Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 229910052748 manganese Inorganic materials 0.000 description 1
- 239000011572 manganese Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 229910052750 molybdenum Inorganic materials 0.000 description 1
- 239000011733 molybdenum Substances 0.000 description 1
- 229910052759 nickel Inorganic materials 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 239000010936 titanium Substances 0.000 description 1
- 229910052719 titanium Inorganic materials 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/04—Manufacturing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Probability & Statistics with Applications (AREA)
- General Health & Medical Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Manufacturing & Machinery (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Primary Health Care (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Life Sciences & Earth Sciences (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种基于演化模糊关联规则的中厚板质量预测方法,能够用拟合函数代替模糊关联规则的后件,使得模糊关联规则在实现了分类功能的基础上,也可以实现回归预测的功能。所述方法包括:获取轧钢数据对应的模糊关联规则,其中,所述轧钢数据为中厚板的轧钢数据;对模糊关联规则的后件进行学习,在模糊关联规则后件的基础上构建拟合函数;获取测试数据,判断测试数据与模糊关联规则是否匹配,若匹配,则使用所匹配规则产生的拟合函数进行预测,否则,则利用当前时刻所有模糊关联规则的拟合函数加权获得预测结果。本发明涉及数据挖掘技术领域。
Description
技术领域
本发明涉及数据挖掘技术领域,特别是指一种基于演化模糊关联规则的中厚板质量预测方法。
背景技术
厚度为4.5mm至25mm的钢板为中厚板,中厚板质量的预报在实际生产中具有重要意义。然而其性能受到生产材料成分、生产工艺等多个因素的影响,很难用数学公式精确描述。以人工神经网络为代表的人工智能方法虽然非线性逼近能力强,但神经网络学习算法在学习过程中容易出现过拟合现象。
随着计算机和数据库技术的发展,轧钢工业生产过程中的大量数据得以保存,这些数据中蕴含着生产过程的运行规律等对决策和优化控制有用的信息。利用数据挖掘技术来指导企业制定生产管理技术,可以提升产品质量为企业创造经济利益。关联规则挖掘是数据挖掘技术中的重要分支,通过关联分析发现数据库中项集之间有趣的关联,并从中找出有价值的规律可以为制定更好的决策方案作依据。
现有技术中,模糊关联规则挖掘算法只能用于分类,不能进行预测。
发明内容
本发明要解决的技术问题是提供一种基于演化模糊关联规则的中厚板质量预测方法,以解决现有技术所存在的模糊关联规则挖掘算法只能用于分类,不能进行预测的问题。
为解决上述技术问题,本发明实施例提供一种基于演化模糊关联规则的中厚板质量预测方法,包括:
获取轧钢数据对应的模糊关联规则,其中,所述轧钢数据为中厚板的轧钢数据;
对模糊关联规则的后件进行学习,在模糊关联规则后件的基础上构建拟合函数;
获取测试数据,判断测试数据与模糊关联规则是否匹配,若匹配,则使用所匹配规则产生的拟合函数进行预测,否则,则利用当前时刻所有模糊关联规则的拟合函数加权获得预测结果。
进一步地,在获取轧钢数据对应的模糊关联规则之前,所述方法还包括:
获取轧钢数据;
根据轧钢数据的分布,采用霍夫丁边界确定滑动窗口的大小,其中,滑动窗口的数量为多个。
进一步地,在根据轧钢数据的分布,采用霍夫丁边界确定滑动窗口的大小之后,所述方法还包括:
利用滑动窗口获取轧钢数据;
在每个滑动窗口中,对轧钢数据每一维度进行动态聚类;
通过聚类得到的类簇的均值和协方差矩阵自适应构建隶属度函数,根据构建的隶属度函数对轧钢数据进行模糊离散化,得到轧钢数据的模糊数据集。
进一步地,所述在每个滑动窗口中,对轧钢数据每一维度进行动态聚类包括:
Step31若t≠0,i=1,则当前第t个滑动窗口继承第t-1个滑动窗口的聚类结果,然后执行Step32;否则,直接执行Step32;
Step32将第t个滑动窗口中第i条数据与已有的所有类簇进行匹配,在第i条数据与第t个滑动窗口中第k个类簇进行匹配时,选择函数的计算公式为:
其中,是第t个滑动窗口中类簇的先验概率,k=1,2,...,|S(t)|,|S(t)|是第t个滑动窗口中已有的类簇个数,是第t个滑动窗口中第i条数据选择第t个滑动窗口中类簇为最合适的类簇的概率,表示第i条数据选择第t个滑动窗口中第k个类簇进行匹配的概率;
Step33选择最大的选择函数值对应的类簇作为获胜类簇J;
Step34计算第i条数据加入获胜类簇J后,协方差行列式的变化量将协方差行列式变化量与合并阈值进行比较,若则确定对于第i条数据匹配合适的类簇为获胜类簇J,并执行Step 35;否则,从剩下的类簇中寻找选择函数最大的类簇,继续进行匹配,若所有类簇都匹配不成功,则执行Step 36;
Step35更新已选择类簇J的均值向量和协方差矩阵:
其中,是更新之前第t个滑动窗口中获胜类簇J的均值向量,是更新之前第t个滑动窗口中获胜类簇J的协方差矩阵,是更新之后第t个滑动窗口中获胜类簇J的均值向量,是更新之后第t个滑动窗口中获胜类簇J的协方差矩阵,是第t个滑动窗口中获胜类簇J中数据的个数;
Step36增加新的类簇,确定新类簇的均值向量和协方差矩阵为:
其中,cov()是协方差函数,diag()是向量对角化函数,mean()是求均值函数,I是单位矩阵,N表示新类簇内的样本个数。
进一步地,在得到轧钢数据的模糊数据集后,所述方法还包括:
利用各滑动窗口分割模糊数据集;
根据动态模糊特征选择算法对每个滑动窗口中的模糊数据集进行特征选择,其中,若t=0,在第t个滑动窗口中进行离线模糊特征选择,若t≥1,在第t个滑动窗口中进行在线模糊特征选择。
进一步地,所述若t=0,在第t个滑动窗口中进行离线模糊特征选择包括:
Step41初始化优化模糊特征子集其中,表示空集合;
Step42根据滑动窗口SW0中的模糊数据集,计算每个模糊输入特征与输出特征的互信息量;根据互信息量计算每个模糊输入特征的权重,并根据权重从大到小排列模糊输入特征,得到依次计算排序后相邻权重的梯度,其中,是按照模糊输入特征的权重进行排序后得到的模糊输入特征,是按照模糊输入特征的权重排序得到的第d个模糊输入特征;
Step43选取排序后的模糊输入特征中的前d个特征初始化候选模糊特征子集
Step44判断相邻权重的梯度是否大于预先设置的权重梯度的截断点阈值若大于,则选取排序后的模糊输入特征中的前d个特征作为候选模糊特征子集
Step45计算候选模糊特征子集的综合指标其中,是基于候选模糊特征子集的模糊输入特征与输出特征之间的互信息量、及模糊输入特征与模糊输入特征之间的互信息量确定的;
Step46按照中模糊输入特征权重由小到大进行顺序;
Step47依次不考虑排序后模糊输入特征权重对应的模糊特征时,计算模糊特征子集的综合指标
Step48若则更新综合评价指标跳到Step49;
Step49循环执行Step46~Step48,直到Step48中所产生的模糊特征子集的综合指标都不大于则
进一步地,所述若t≥1,在第t个滑动窗口中进行在线模糊特征选择包括:
Step41根据第t-1个滑动窗口中的|S(t-1)|个聚类中心和第t个滑动窗口中的模糊数据集组成一个数据集D(t);
Step42根据构建的数据集D(t),计算模糊输入特征与输出特征的输入输出互信息量;
Step43根据互信息量计算每个模糊输入特征的权重,并根据权重从大到小排列模糊输入特征,得到依次计算排序后相邻权重的梯度,其中,是按照模糊输入特征的权重进行排序后得到的模糊输入特征,是按照模糊输入特征的权重排序得到的第d个模糊输入特征;
Step44选取排序后的模糊输入特征中的前d个特征初始化候选模糊特征子集
Step45判断相邻权重的梯度是否大于预先设置的权重梯度的截断点阈值若大于,则选取排序后的模糊输入特征中的前d个特征作为候选模糊特征子集
Step46将第t-1个滑动窗口中的优化模糊特征子集fs (t-1)与候选模糊特征子集的交集作为当前第t个滑动窗口的初始优化模糊特征子集,即:
Step47计算模糊输入特征在fs (t)中重要度:
其中,是一个整体,表示按照模糊输入特征权重排序相对应的模糊特征,H()表示模糊信息熵;
Step48选择具有最大重要度的模糊输入特征,在得到的优化模糊特征子集的前提下计算具有最大重要度的模糊输入特征的熵;
Step49若熵大于0,则确定优化模糊特征子集并返回Step47继续执行;否则,直接输出fs (t)。
进一步地,在得到优化模糊特征子集fs (t)之后,所述方法还包括:
将优化模糊特征子集fs (t)转化为布尔型数据矩阵Db。
进一步地,在得到的布尔型数据矩阵Db后,所述获取轧钢数据对应的模糊关联规则包括:
Step51将布尔型数据矩阵Db转换成垂直数据集;
Step52根据转换成的垂直数据集,产生滑动窗口SW0的频繁项集F(0);
Step53根据频繁项集F(0),产生滑动窗口SW0的模糊关联规则;
Step54在随后的每一个滑动窗口SW(t)中,t≥1,计算当前第t个滑动窗口SW(t)的异常数据率OR(t)和数据分布变化率CR(t),若OR(t)≥θ或者CR(t)≥η,则发生概念漂移,执行Step55;否则,沿用上一滑动窗口的模糊关联规则,其中,θ表示异常数据率阈值;η表示数据分布变化率阈值;
Step55产生当前第t个滑动窗口SW(t)的频繁k项集,根据频繁k项集生成当前第t个滑动窗口SW(t)的模糊关联规则,其中,t≥1,k≥2;
其中,所述Step55包括:
Step551、产生滑动窗口SW(t)的频繁1项集和期望频繁1项集;
Step552、基于得到的频繁1项集和期望频繁1项集,将滑动窗口SW(t)内的频繁k-1项集和期望频繁k-1项集作为整体连接,得到滑动窗口SW(t)的候选频繁k项集
Step553、若计算候选频繁k项集的支持度计数若则为滑动窗口SW(t)的频繁k项集否则计算的期望频繁概率若则为滑动窗口SW(t)的期望频繁k项集其中,β(t)表示当前时刻滑动窗口SW(t)的最小期望频繁概率阈值,表示滑动窗口SW(t-1)内的频繁k项集,表示滑动窗口SW(t-1)内的期望频繁k项集。
进一步地,所有模糊关联规则的拟合函数加权结果Y(t)为:
其中,表示第h条模糊关联规则产生的拟合函数,R(t)表示当前时刻的模糊关联规则的个数,表示第h条模糊关联规则的权重,表示第i条测试数据,表示滑动窗口SW(t)的第h条模糊关联规则前件包含输入特征个数,αi,都表示松弛因子,表示滑动窗口SW(t)的第h条模糊关联规则前件中的输入特征,表示偏差值。
本发明的上述技术方案的有益效果如下:
上述方案中,获取轧钢数据对应的模糊关联规则,其中,所述轧钢数据为中厚板的轧钢数据;对模糊关联规则的后件进行学习,在模糊关联规则后件的基础上构建拟合函数;获取测试数据,判断测试数据与模糊关联规则是否匹配,若匹配,则使用所匹配规则产生的拟合函数进行预测,否则,则利用当前时刻所有模糊关联规则的拟合函数加权获得预测结果。这样,用拟合函数代替模糊关联规则的后件,使得模糊关联规则在实现了分类功能的基础上,也可以实现回归预测的功能。
附图说明
图1为本发明实施例提供的基于演化模糊关联规则的中厚板质量预测方法的流程示意图;
图2为本发明实施例提供的基于演化模糊关联规则的中厚板质量预测方法的详细流程示意图;
图3为本发明实施例提供的对轧钢数据每一维度进行动态聚类的流程示意图;
图4为本发明实施例提供的动态模糊特征选择的流程示意图;
图5为本发明实施例提供的基于模糊Eclat的演化关联规则的动态数据挖掘的流程示意图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
本发明针对现有的模糊关联规则挖掘算法只能用于分类,不能进行预测的问题,提供一种基于演化模糊关联规则的中厚板质量预测方法。
如图1所示,本发明实施例提供的基于演化模糊关联规则的中厚板质量预测方法,包括:
S101,获取轧钢数据对应的模糊关联规则,其中,所述轧钢数据为中厚板的轧钢数据;
S102,对模糊关联规则的后件进行学习,在模糊关联规则后件的基础上构建拟合函数;
S103,获取测试数据,判断测试数据与模糊关联规则是否匹配,若匹配,则使用所匹配规则产生的拟合函数进行预测,否则,则利用当前时刻所有模糊关联规则的拟合函数加权获得预测结果。
本发明实施例所述的基于演化模糊关联规则的中厚板质量预测方法,获取轧钢数据对应的模糊关联规则,其中,所述轧钢数据为中厚板的轧钢数据;对模糊关联规则的后件进行学习,在模糊关联规则后件的基础上构建拟合函数;获取测试数据,判断测试数据与模糊关联规则是否匹配,若匹配,则使用所匹配规则产生的拟合函数进行预测,否则,则利用当前时刻所有模糊关联规则的拟合函数加权获得预测结果。这样,用拟合函数代替模糊关联规则的后件,使得模糊关联规则在实现了分类功能的基础上,也可以实现回归预测的功能。
为了更好地理解本发明实施例所述的基于演化模糊关联规则的中厚板质量预测方法,对其进行详细说明,如图2所示,所述方法具体可以包括:
A11,获取中厚板的轧钢数据,确定中厚板质量模型的输入、输出变量,并对轧钢数据进行归一化处理以消除变量之间由于量纲造成的影响;
本实施中,中厚板质量预测模型的输入、输出变量是由生成工艺过程决定,将表征中厚板力学性能的屈服度作为输出变量,以影响该输出变量的钢卷厚度、终轧温度平均值、平均温度、铬质量分数、铜质量分数、碳质量分数、氢质量分数、锰质量分数、钼质量分数、镍质量分数、氮质量分数、氧质量分数、硅质量分数、硫质量分数及钛质量分数这15个重要变量作为输入变量进行分析,如表1所示。
表1影响中厚板屈服度主要元素
本实施例中,每个变量对应一个维度。
A12,轧钢数据进行归一化处理后,根据轧钢数据的分布,采用霍夫丁(Hoeffding)边界确定滑动窗口的大小。具体的步骤可以包括:
假设每个滑动窗口包含n条样本,在置信程度是1-δ(δ表示置信度,δ一般取0.05)的条件下,计算得到滑动窗口的特征均值与检测到的所有数据的实际均值相差不超过边界ε。Hoeffding边界ε的计算公式是:
其中,T表示转置,n表示滑动窗口包含的样本个数,R为取值范围,R=[x1.max-x1.min,x2.max-x2,min,…,xj,max-xj,min,…,xL,max-xL,max],xj,max是第j个变量的最大值,xj,min是第j个变量的最小值,L是数据集变量的个数,所述变量包括:输入变量和输出变量。
随着n的增加,Hoeffding边界ε在变小,这表明当n足够大,Hoeffding边界ε将趋近于0。换言之,就是滑动窗口的特征均值与检测到的所有数据的实际均值完全相等。
根据Hoeffding边界,可以确定样本集的最小容量NH:
设相邻滑动窗口SW(t-1)和SW(t)所包含的样本集均值分别是μ(t-1)和μ(t),SW(t-1)表示第t-1个滑动窗口,SW(t)表示第t个滑动窗口,在置信程度是1-δ的条件下,|μ(t-1)-μ(t)|≤2ε,所以样本集的最小容量NH的计算公式可以调整为:
不断的调整滑动窗口包含的样本个数n,使得通过滑动窗口中的数据求得的样本集的最小容量NH不大于实际滑动窗口样本个数n,将n作为滑动窗口大小。
A13,利用确定的滑动窗口获取归一化处理后的轧钢数据,然后在无需设置参数的情况下,考虑类簇的局部分布情况,自适应地确定新数据的所属类别,并更新获胜类簇;最后,根据聚类结果,还可以确定相邻滑动窗口中类簇的演化关系。
本实施例中,在每个滑动窗口中,可以利用基于局部分布的贝叶斯自适应共振理论动态聚类算法,对轧钢数据每一维度进行动态聚类,如图3所示,动态聚类的具体步骤可以包括:
Step1利用滑动窗口获取归一化处理后的轧钢数据。
Step2初始化。令N=1,t=0,将第t个滑动窗口中的第1条数据作为该滑动窗口中第1个类簇的初始化均值向量初始化均值向量
第t个滑动窗口中第1个类簇的协方差矩阵的初始化公式为:
其中,已输入数据集为diag()是向量对角化函数,mean()是求均值函数,I是单位矩阵;
Step3在每个滑动窗口中,对轧钢数据每一维度进行动态聚类。具体的:
Step3.1若t≠0,i=1,则当前第t个滑动窗口继承第t-1个滑动窗口的聚类结果,然后执行Step3.2;否则,直接执行Step3.2;
Step3.2选择函数的计算。将第t个滑动窗口中第i条数据与已有的所有类簇进行匹配,在第i条数据与第t个滑动窗口中第k个类簇进行匹配时,选择函数的计算公式如下所示:
其中,表示第i条数据选择第t个滑动窗口中第k个类簇进行匹配的概率,是第t个滑动窗口中类簇的先验概率,k=1,2,...,|S(t)|,|S(t)|是第t个滑动窗口中已有的类簇个数,是第t个滑动窗口中第i条数据选择第t个滑动窗口中类簇为最合适的类簇的概率, 的计算公式如下所示:
其中,是第t个滑动窗口中类簇中数据的个数,L是输入的维度,是第t个滑动窗口中类簇的均值向量,是第t个滑动窗口中类簇的协方差矩阵,N是已处理数据的个数。
Step3.3选择最大的选择函数值对应的类簇作为获胜类簇J:
Step3.4匹配测试。计算第i条数据加入获胜类簇J后,协方差行列式的变化量计算公式如下所示:
其中,是的行列式,是的行列式:
为数据合并到获胜类簇J后的合并协方差矩阵,为假设数据单独为一个类簇时的协方差矩阵,是第t个滑动窗口中获胜类簇J的均值向量,是第t个滑动窗口中获胜类簇J的协方差矩阵,是第t个滑动窗口中获胜类簇J中数据的个数,diag()是向量对角化函数,mean()是求均值函数,I是单位矩阵。
为了平衡获胜类簇的选择函数和类簇的局部分布,引入合并阈值计算公式如下所示:
其中,是的行列式,表示为:
其中,是第t个滑动窗口中获胜类簇J的第一条数据,是第t个滑动窗口中获胜类簇J中第m条数据。
将协方差行列式变化量与合并阈值进行比较,若则匹配成功,确定对于第i条数据匹配合适的类簇为获胜类簇J,并执行Step 3.5;否则,从剩下的类簇中寻找选择函数最大的类簇,继续执行匹配测试,如果所有类簇都匹配不成功,执行Step3.6。
Step3.5更新已选择类簇J的均值向量和协方差矩阵:
N=N+1
其中,是更新之前第t个滑动窗口中获胜类簇J的均值向量,是更新之前第t个滑动窗口中获胜类簇J的协方差矩阵,是更新之后第t个滑动窗口中获胜类簇J的均值向量,是更新之后第t个滑动窗口中获胜类簇J的协方差矩阵;
Step3.6增加新的类簇,新类簇的均值向量和协方差矩阵为:
其中,cov()是协方差函数,diag()是向量对角化函数,mean()是求均值函数,I是单位矩阵,N表示新类簇内的样本个数。
根据滑动窗口的聚类结果,对轧钢数据进行模糊离散化,得到轧钢数据的模糊数据集。该过程无需人为定义任何参数,能够提高算法的自适应性。具体的:
通过聚类得到的类簇的均值和协方差矩阵来自适应构建隶属度函数,根据构建的隶属度函数对轧钢数据进行模糊离散化,提高了模糊离散化过程的可靠性。具体的:
在得到每一维度的聚类结果后,将每个维度的每个聚类按照取值区间最小值从小到大的顺序进行标号,然后将轧钢数据每个维度用对应的类标号表示,实现模糊离散化。
A14,根据动态模糊特征选择算法对每个滑动窗口中的模糊数据集进行特征选择,能够避免数据模糊化后模糊特征急剧增加的问题。如图4所示,首先利用滑动窗口SW0,SW1,…,SW(t)分割模糊数据集,得到每个滑动窗口的模糊数据集;以滑动窗口SW0中的模糊数据集作为初始数据进行离线模糊特征选择,在随后依次到来的滑动窗口SW1,…,SW(t)中进行在线模糊特征选择。
1)若t=0,在第t个滑动窗口中进行离线模糊特征选择,具体的:根据模糊输入特征与输出特征的互信息量计算每个模糊输入特征的权重,根据每个模糊输入特征的权重得到候选模糊特征子集;然后,根据预先设定的模糊特征筛选指标,采取后向特征选择方式,对得到的候选模糊特征子集进行筛选,得到与输出特征相关性最大,冗余度最小的优化模糊特征子集。
本实施例中,离线模糊特征选择的具体步骤可以包括:
Step4.1初始化。初始化优化模糊特征子集其中,表示空集合。
Step4.2确定候选模糊特征子集其具体步骤可以包括:
Step4.2.1根据滑动窗口SW0中的模糊数据集,计算每个模糊输入特征与输出特征Y(t)的互信息量其中,表示当前第t个滑动窗口的第j(1≤j≤L)个输入特征的第个模糊项,表示第j个输入特征的模糊项的数目;
Step4.2.2根据互信息量计算每个模糊输入特征的权重,并根据权重从大到小排列模糊输入特征,得到依次计算排序后相邻权重的梯度,其中,是按照模糊输入特征的权重进行排序后得到的模糊输入特征,是按照模糊输入特征的权重排序得到的第d个模糊输入特征;
Step4.2.3初始化候选模糊特征子集具体的:选取排序后的模糊输入特征中的前d个特征初始化候选模糊特征子集假设d=3,则
Step4.2.4根据权重的相邻梯度,确定候选模糊特征子集具体的:如果则选取排序后的模糊输入特征中的前d个特征作为候选模糊特征子集其中,表示相邻权重的梯度,表示预先设置的权重梯度的截断点阈值。
Step4.3确定优化模糊特征子集fs (t),其具体步骤可以包括:
Step4.3.1计算候选模糊特征子集的综合指标
本实施例中,将模糊输入特征筛选综合指标FCI作为模糊特征选择的衡量标准。FCI不仅考虑候选模糊特征子集的模糊输入特征与输出特征之间的互信息量,还考虑候选模糊特征子集的模糊输入特征与模糊输入特征之间的互信息量:
其中,是第t个滑动窗口中候选模糊特征子集包含的模糊特征个数,是第t个滑动窗口中包含的各个模糊输入特征与输出特征之间互信息量的均值,是第t个滑动窗口中包含的两两模糊输入特征的互信息量的均值:
其中,表示表示第j/u个输入特征的模糊项的数目,表示当前第t个滑动窗口的第j(1≤j≤L)个输入特征的第q个模糊项,表示第t个滑动窗口中第u(1≤u≤L)个输入特征的第v个模糊项。
Step4.3.2按照中模糊输入特征权重由小到大进行顺序;
Step4.3.3依次不考虑排序后模糊输入特征权重对应的模糊特征时,计算模糊特征子集的综合指标
Step4.3.4如果则更新综合评价指标跳到Step3.5;
Step4.3.5循环执行Step3.2~Step3.4,直到Step3.4中所产生的模糊特征子集的综合指标都不大于则不再循环;
Step4.4确定优化模糊特征子集
2)若t≥1,在第t个滑动窗口中进行在线模糊特征选择,结合当前窗口的候选模糊特征子集和已有模糊特征选择结果,计算模糊输入特征的重要度,获得当前窗口中的优化模糊特征子集。
在线模糊特征选择步骤如下所示:
Step4.1构建数据集D(t)。根据第t-1个(滑动窗口中的|S(t-1)|个聚类中心和第t个滑动窗口中的模糊数据集组成一个数据集D(t)。
Step4.2确定候选模糊特征子集具体的:
Step4.2.1根据构建的数据集D(t),计算模糊输入特征与输出特征Y(t)的输入输出互信息量其中,表示当前第t个滑动窗口的第j(1≤j≤L)个输入特征的第个模糊项,表示第j个输入特征的模糊项的数目;
Step4.2.2根据互信息量计算每个模糊输入特征的权重,并根据权重从大到小排列模糊输入特征,得到依次计算排序后相邻权重的梯度,其中,是按照模糊输入特征的权重进行排序后得到的模糊输入特征,是按照模糊输入特征的权重排序得到的第d个模糊输入特征。
Step4.2.3初始化候选模糊特征子集具体的:选取排序后的模糊输入特征中的前d个特征初始化候选模糊特征子集假设d=3,则
Step4.2.4根据权重的相邻梯度,确定候选模糊特征子集具体的:如果则选取排序后的模糊输入特征中的前d个特征作为候选模糊特征子集其中,表示相邻权重的梯度,表示预先设置的权重梯度的截断点阈值。
Step4.3初始化第t个滑动窗口中优化模糊特征子集fs (t),具体的:将第t-1个滑动窗口中的优化模糊特征子集fs (t-1)与候选模糊特征子集的交集作为当前第t个滑动窗口的初始优化模糊特征子集,即:
Step4.4计算模糊输入特征在fs (t)中重要度:
其中,是一个整体,表示按照模糊输入特征权重排序相对应的模糊特征,H()表示模糊信息熵。
Step4.5选择具有最大重要度的模糊输入特征,具体的:选择满足下面条件的属性:
其中,是指在得到的优化模糊特征子集的前提下计算具有最大重要度的模糊输入特征的熵。
Step4.6确定第t个滑动窗口中的优化模糊特征子集fs (t),具体的,如果则确定优化模糊特征子集并返回Step4.4继续执行;否则,直接输出fs (t)。
至此,完成滑动窗口模糊输入特征的选择,部分选择结果如表2所示:
表2部分模糊输入特征选择结果
本实施例中,计算相邻滑动窗口之间模糊输入特征权重的变化,可以发现模糊输入特征的演化关系。
A15,为了提高关联规则挖掘算法的效率,可以将优化模糊特征子集fs (t)转化为布尔型数据矩阵Db,该矩阵的行数等于轧钢数据样本个数,列数等于每个维度的聚类数之和,矩阵Db的某一列元素为“1”说明轧钢数据这一维度属于相应的类别,而矩阵Db中与这一维度相关的其余列置“0”。
A16,在得到布尔型数据矩阵Db后,利用基于模糊等价类变换(Equivalence CLAssTransformation,Eclat)的演化关联规则的动态数据挖掘算法生成模糊关联规则,如图5所示,具体步骤可以包括:
Step5.1将得到的布尔型数据矩阵Db转换成垂直数据集;
Step5.2根据转换成的垂直数据集,使用函数genF()产生滑动窗口SW0的频繁项集F(0)和期望频繁项集EF(0);
Step5.3根据频繁项集F(0),使用函数genR()产生滑动窗口SW0的模糊关联规则;
Step5.4在随后的每一个滑动窗口SW(t)中,t≥1,计算当前第t个滑动窗口SW(t)的异常数据率OR(t)和数据分布变化率CR(t),若OR(t)≥θ或者CR(t)≥η,则发生概念漂移,执行Step5.5;否则,沿用上一滑动窗口的模糊关联规则,其中,θ表示异常数据率阈值;η表示数据分布变化率阈值;
Step5.5产生当前第t个滑动窗口SW(t)的频繁k项集,根据频繁k项集生成当前第t个滑动窗口SW(t)的模糊关联规则,其中,t≥1,k≥2;具体的:
Step5.5.1、使用函数genF()产生滑动窗口SW(t)的频繁1项集和期望频繁1项集;
Step5.5.2、根据得到的频繁1项集和期望频繁1项集,更新滑动窗口SW(t)内频繁k项集和期望频繁k项集;具体的:
Step5.5.2.1、将滑动窗口SW(t)内的频繁k-1项集和期望频繁k-1项集作为整体连接,得到滑动窗口SW(t)的候选频繁k项集
Step5.5.2.2、若计算候选频繁k项集的支持度计数若则为滑动窗口SW(t)的频繁k项集否则计算的期望频繁概率若则为滑动窗口SW(t)的期望频繁k项集其中,β(t)表示当前时刻滑动窗口SW(t)的最小期望频繁概率阈值,表示滑动窗口SW(t-1)内的频繁k项集,表示滑动窗口SW(t-1)内的期望频繁k项集。
本实施例中,表示为:
其中,表示当前时刻频繁k-1项集对第i条数据的隶属度值。
需要说明的是,在当前时刻不频繁的项集,在接下来可能变的频繁。计算每个非频繁项集的期望频繁概率和当前时刻的最小期望频繁概率阈值β(t),如果非频繁项集的期望频繁概率不小于最小期望频繁概率阈值β(t),则该非频繁项集为期望频繁项集EF(t)。
Step5.5.2.3、根据频繁k(k≥2)项集生成当前第t个滑动窗口SW(t)的模糊关联规则,计算模糊关联规则的置信度,若置信度不小于最小置信度,则为感兴趣的规则;计算感兴趣规则的因果指标,若因果指标不小于因果指标阈值,则规则的前件与后件之间具有因果关系。
本实施例中,具有因果关系的模糊关联规则形如:
其中,是当前第t个滑动窗口的第h条模糊关联规则中前件包含输入特征个数,是当前第t个滑动窗口的第h条模糊关联规则中后件包含输入特征个数,是当前第t个滑动窗口的第h条模糊关联规则前件中的第j个特征,是第h条模糊关联规则前件第j个特征对应的第个模糊项,是当前第t个滑动窗口的第h条模糊关联规则后件中的第j'个特征,是第h条模糊关联规则后件第j'个特征对应的第个模糊项,是第h条模糊关联规则的支持度计数,是第h条模糊关联规则的模糊置信度,是第h条模糊关联规则的因果指标。
本实施例中,通过判断新数据加入时是否发生概念漂移,来决定是否更新规则集,这样,能够实时地根据数据分布获取轧钢数据对应的最新模糊关联规则。
本实施例中,判断测试数据与模糊关联规则的前件是否匹配,如果匹配,则可用模糊关联规则的后件进行分类,但是不能用于定量预测,如果测试数据与模糊关联规则不匹配则使用拟合函数进行回归测试。
A17,为了实现定量预测,采用支持向量回归算法学习模糊关联规则的后件,在模糊关联规则后件基础上构建拟合函数其中,表示第h条模糊关联规则产生的拟合函数,表示第i条测试数据,表示滑动窗口SW(t)的第h条模糊关联规则前件包含输入特征个数,αi,都表示松弛因子,表示滑动窗口SW(t)的第h条模糊关联规则前件中的输入特征,表示偏差值。
本实施例中,设当前第h条模糊关联规则所匹配的样本集合表示为:
其中,是第i(1≤i≤n(t))条样本的第j(1≤j≤L)个输入变量值,是第i条样本的输出变量值。假设取H(t)中的70%的数据作为训练集,其余的30%作为测试集,训练集样本个数为是第h条模糊关联规则所匹配的样本个数。
本实施例中,可以通过下面的式子计算:
其中, 都表示当前时刻的松弛因子,为当前时刻的第h条模糊关联规则的不敏感因子,C为预先设置的常数。
本实施例中,在基于模糊Eclat的演化关联规则的动态数据挖掘算法得到的模糊关联规则的基础上,用拟合函数代替模糊关联规则的后件,可以实现对中厚板质量的回归预测。
A18,构建好拟合函数后,当根据模糊关联规则进行预测时,如果测试数据与规则匹配,则直接使用所匹配规则产生的拟合函数进行预测;当测试数据与规则不匹配时,利用当前时刻所有规则的拟合函数加权Y(t)获得预测结果:
其中,R(t)表示当前时刻的模糊关联规则的个数,表示第h条模糊关联规则的权重。
本实施例中,第h条模糊关联规则的权重表示为:
其中,n (t)表示样本的个数,是滑动窗口SW(t)的第h条模糊关联规则相对于第i条数据的激励程度, 是滑动窗口SW(t)的第h条模糊关联规则的前件对第i条数据的隶属度,是第h条规则所匹配的样本个数,T()表示t-范数,相当于求最小。
本实施例中,部分模糊推理预测结果如表3所示:
表3模糊关联规则挖掘结果
综上所述,本发明实施例所述的基于演化模糊关联规则的中厚板质量预测方法产生的有益效果可以包括:
1)利用基于局部分布的贝叶斯自适应共振理论动态聚类算法对每个滑动窗口内的轧钢数据进行动态聚类,并根据滑动窗口的聚类结果进行模糊离散化,该算法可以自适应的确定隶属度函数,提高了模糊离散化过程的可靠性。
2)轧钢数据模糊离散化后,利用基于特征变权的动态模糊特征选择算法解决了模糊数据集的模糊特征急剧增加的问题。且可以通过计算滑动窗口之间模糊输入特征权重的变化,发现模糊输入特征的演化关系。
3)针对现有模糊关联规则算法不能实时的根据数据分布获取轧钢数据对应的模糊关联规则的问题,提出了基于演化模糊关联规则的动态数据挖掘算法。当有新数据加入时,该算法判断是否发生概念漂移来决定是否更新规则集。
4)在对冶金企业积累的大量数据进行关联规则挖掘得到挖掘结果的基础上,可以利用得到的模糊关联规则与新数据的相关因素进行规则匹配,用拟合函数代替模糊关联规则的后件实现回归预测,最终可以预测出给定条件下的新数据样本的输出。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种基于演化模糊关联规则的中厚板质量预测方法,其特征在于,包括:
获取轧钢数据对应的模糊关联规则,其中,所述轧钢数据为中厚板的轧钢数据;
对模糊关联规则的后件进行学习,在模糊关联规则后件的基础上构建拟合函数;
获取测试数据,判断测试数据与模糊关联规则是否匹配,若匹配,则使用所匹配规则产生的拟合函数进行预测,否则,则利用当前时刻所有模糊关联规则的拟合函数加权获得预测结果。
2.根据权利要求1所述的基于演化模糊关联规则的中厚板质量预测方法,其特征在于,在获取轧钢数据对应的模糊关联规则之前,所述方法还包括:
获取轧钢数据;
根据轧钢数据的分布,采用霍夫丁边界确定滑动窗口的大小,其中,滑动窗口的数量为多个。
3.根据权利要求2所述的基于演化模糊关联规则的中厚板质量预测方法,其特征在于,在根据轧钢数据的分布,采用霍夫丁边界确定滑动窗口的大小之后,所述方法还包括:
利用滑动窗口获取轧钢数据;
在每个滑动窗口中,对轧钢数据每一维度进行动态聚类;
通过聚类得到的类簇的均值和协方差矩阵自适应构建隶属度函数,根据构建的隶属度函数对轧钢数据进行模糊离散化,得到轧钢数据的模糊数据集。
4.根据权利要求3所述的基于演化模糊关联规则的中厚板质量预测方法,其特征在于,所述在每个滑动窗口中,对轧钢数据每一维度进行动态聚类包括:
Step31若t≠0,i=1,则当前第t个滑动窗口继承第t-1个滑动窗口的聚类结果,然后执行Step32;否则,直接执行Step32;
Step32将第t个滑动窗口中第i条数据与已有的所有类簇进行匹配,在第i条数据与第t个滑动窗口中第k个类簇进行匹配时,选择函数的计算公式为:
其中,是第t个滑动窗口中类簇的先验概率,k=1,2,...,|S(t)|,|S(t)|是第t个滑动窗口中已有的类簇个数,是第t个滑动窗口中第i条数据选择第t个滑动窗口中类簇为最合适的类簇的概率,表示第i条数据选择第t个滑动窗口中第k个类簇进行匹配的概率;
Step33选择最大的选择函数值对应的类簇作为获胜类簇J;
Step34计算第i条数据加入获胜类簇J后,协方差行列式的变化量将协方差行列式变化量与合并阈值进行比较,若则确定对于第i条数据匹配合适的类簇为获胜类簇J,并执行Step 35;否则,从剩下的类簇中寻找选择函数最大的类簇,继续进行匹配,若所有类簇都匹配不成功,则执行Step 36;
Step35更新已选择类簇J的均值向量和协方差矩阵:
其中,是更新之前第t个滑动窗口中获胜类簇J的均值向量,是更新之前第t个滑动窗口中获胜类簇J的协方差矩阵,是更新之后第t个滑动窗口中获胜类簇J的均值向量,是更新之后第t个滑动窗口中获胜类簇J的协方差矩阵,是第t个滑动窗口中获胜类簇J中数据的个数;
Step36增加新的类簇,确定新类簇的均值向量和协方差矩阵为:
其中,cov()是协方差函数,diag()是向量对角化函数,mean()是求均值函数,I是单位矩阵,N表示新类簇内的样本个数。
5.根据权利要求3所述的基于演化模糊关联规则的中厚板质量预测方法,其特征在于,在得到轧钢数据的模糊数据集后,所述方法还包括:
利用各滑动窗口分割模糊数据集;
根据动态模糊特征选择算法对每个滑动窗口中的模糊数据集进行特征选择,其中,若t=0,在第t个滑动窗口中进行离线模糊特征选择,若t≥1,在第t个滑动窗口中进行在线模糊特征选择。
6.根据权利要求5所述的基于演化模糊关联规则的中厚板质量预测方法,其特征在于,所述若t=0,在第t个滑动窗口中进行离线模糊特征选择包括:
Step41初始化优化模糊特征子集其中,表示空集合;
Step42根据滑动窗口SW0中的模糊数据集,计算每个模糊输入特征与输出特征的互信息量;根据互信息量计算每个模糊输入特征的权重,并根据权重从大到小排列模糊输入特征,得到依次计算排序后相邻权重的梯度,其中,是按照模糊输入特征的权重进行排序后得到的模糊输入特征,是按照模糊输入特征的权重排序得到的第d个模糊输入特征;
Step43选取排序后的模糊输入特征中的前d个特征初始化候选模糊特征子集
Step44判断相邻权重的梯度是否大于预先设置的权重梯度的截断点阈值若大于,则选取排序后的模糊输入特征中的前d个特征作为候选模糊特征子集
Step45计算候选模糊特征子集的综合指标其中,是基于候选模糊特征子集的模糊输入特征与输出特征之间的互信息量、及模糊输入特征与模糊输入特征之间的互信息量确定的;
Step46按照中模糊输入特征权重由小到大进行顺序;
Step47依次不考虑排序后模糊输入特征权重对应的模糊特征时,计算模糊特征子集的综合指标
Step48若则更新综合评价指标跳到Step49;
Step49循环执行Step46~Step48,直到Step48中所产生的模糊特征子集的综合指标都不大于则
7.根据权利要求6所述的基于演化模糊关联规则的中厚板质量预测方法,其特征在于,所述若t≥1,在第t个滑动窗口中进行在线模糊特征选择包括:
Step41根据第t-1个滑动窗口中的|S(t-1)|个聚类中心和第t个滑动窗口中的模糊数据集组成一个数据集D(t);
Step42根据构建的数据集D(t),计算模糊输入特征与输出特征的输入输出互信息量;
Step43根据互信息量计算每个模糊输入特征的权重,并根据权重从大到小排列模糊输入特征,得到依次计算排序后相邻权重的梯度,其中,是按照模糊输入特征的权重进行排序后得到的模糊输入特征,是按照模糊输入特征的权重排序得到的第d个模糊输入特征;
Step44选取排序后的模糊输入特征中的前d个特征初始化候选模糊特征子集
Step45判断相邻权重的梯度是否大于预先设置的权重梯度的截断点阈值若大于,则选取排序后的模糊输入特征中的前d个特征作为候选模糊特征子集
Step46将第t-1个滑动窗口中的优化模糊特征子集与候选模糊特征子集的交集作为当前第t个滑动窗口的初始优化模糊特征子集,即:
Step47计算模糊输入特征在中重要度:
其中, 是一个整体,表示按照模糊输入特征权重排序相对应的模糊特征,H()表示模糊信息熵;
Step48选择具有最大重要度的模糊输入特征,在得到的优化模糊特征子集的前提下计算具有最大重要度的模糊输入特征的熵;
Step49若熵大于0,则确定优化模糊特征子集并返回Step47继续执行;否则,直接输出。
8.根据权利要求7所述的基于演化模糊关联规则的中厚板质量预测方法,其特征在于,在得到优化模糊特征子集之后,所述方法还包括:
将优化模糊特征子集转化为布尔型数据矩阵Db。
9.根据权利要求8所述的基于演化模糊关联规则的中厚板质量预测方法,其特征在于,在得到的布尔型数据矩阵Db后,所述获取轧钢数据对应的模糊关联规则包括:
Step51将布尔型数据矩阵Db转换成垂直数据集;
Step52根据转换成的垂直数据集,产生滑动窗口SW0的频繁项集F(0);
Step53根据频繁项集F(0),产生滑动窗口SW0的模糊关联规则;
Step54在随后的每一个滑动窗口SW(t)中,t≥1,计算当前第t个滑动窗口SW(t)的异常数据率OR(t)和数据分布变化率CR(t),若OR(t)≥θ或者CR(t)≥η,则发生概念漂移,执行Step55;否则,沿用上一滑动窗口的模糊关联规则,其中,θ表示异常数据率阈值;η表示数据分布变化率阈值;
Step55产生当前第t个滑动窗口SW(t)的频繁k项集,根据频繁k项集生成当前第t个滑动窗口SW(t)的模糊关联规则,其中,t≥1,k≥2;
其中,所述Step55包括:
Step551、产生滑动窗口SW(t)的频繁1项集和期望频繁1项集;
Step552、基于得到的频繁1项集和期望频繁1项集,将滑动窗口SW(t)内的频繁k-1项集和期望频繁k-1项集作为整体连接,得到滑动窗口SW(t)的候选频繁k项集
Step553、若计算候选频繁k项集的支持度计数若则为滑动窗口SW(t)的频繁k项集否则计算的期望频繁概率若则为滑动窗口SW(t)的期望频繁k项集其中,β(t)表示当前时刻滑动窗口SW(t)的最小期望频繁概率阈值,表示滑动窗口SW(t-1)内的频繁k项集,表示滑动窗口SW(t-1)内的期望频繁k项集。
10.根据权利要求1所述的基于演化模糊关联规则的中厚板质量预测方法,其特征在于,所有模糊关联规则的拟合函数加权结果Y(t)为:
其中,表示第h条模糊关联规则产生的拟合函数,R(t)表示当前时刻的模糊关联规则的个数,表示第h条模糊关联规则的权重,表示第i条测试数据,表示滑动窗口SW(t)的第h条模糊关联规则前件包含输入特征个数,αi,都表示松弛因子,表示滑动窗口SW(t)的第h条模糊关联规则前件中的输入特征,表示偏差值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810101213.1A CN108268979B (zh) | 2018-02-01 | 2018-02-01 | 一种基于演化模糊关联规则的中厚板质量预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810101213.1A CN108268979B (zh) | 2018-02-01 | 2018-02-01 | 一种基于演化模糊关联规则的中厚板质量预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108268979A true CN108268979A (zh) | 2018-07-10 |
CN108268979B CN108268979B (zh) | 2021-11-19 |
Family
ID=62777260
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810101213.1A Active CN108268979B (zh) | 2018-02-01 | 2018-02-01 | 一种基于演化模糊关联规则的中厚板质量预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108268979B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109284831A (zh) * | 2018-07-19 | 2019-01-29 | 中国航空工业集团公司沈阳飞机设计研究所 | 基于Mamdani模糊推理方法及推理系统 |
CN110968618A (zh) * | 2019-11-07 | 2020-04-07 | 华中科技大学 | 一种挖掘焊接参数量化关联规则的方法及应用 |
CN113627469A (zh) * | 2021-07-01 | 2021-11-09 | 北京科技大学 | 一种基于模糊推理算法的热轧带钢板形凸度预测的方法 |
WO2022007376A1 (zh) * | 2020-07-08 | 2022-01-13 | 北京航空航天大学 | 基于贝叶斯自适应共振的多目标多模态粒子群优化方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102636991A (zh) * | 2012-04-18 | 2012-08-15 | 国电科学技术研究院 | 一种基于模糊集关联规则的火电机组运行参数优化方法 |
CN104298778A (zh) * | 2014-11-04 | 2015-01-21 | 北京科技大学 | 一种基于关联规则树的轧钢产品质量的预测方法及系统 |
US20160239753A1 (en) * | 2013-09-27 | 2016-08-18 | Deutsche Telekom Ag | Method and system for rating measured values taken from a system |
CN106203450A (zh) * | 2016-07-11 | 2016-12-07 | 国家新闻出版广电总局广播科学研究院 | 基于深度学习框架对图像进行特征提取的目标检测方法 |
CN107256003A (zh) * | 2017-05-27 | 2017-10-17 | 四川用联信息技术有限公司 | 一种模糊支持向量机的制造过程多元质量诊断分类器 |
-
2018
- 2018-02-01 CN CN201810101213.1A patent/CN108268979B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102636991A (zh) * | 2012-04-18 | 2012-08-15 | 国电科学技术研究院 | 一种基于模糊集关联规则的火电机组运行参数优化方法 |
US20160239753A1 (en) * | 2013-09-27 | 2016-08-18 | Deutsche Telekom Ag | Method and system for rating measured values taken from a system |
CN104298778A (zh) * | 2014-11-04 | 2015-01-21 | 北京科技大学 | 一种基于关联规则树的轧钢产品质量的预测方法及系统 |
CN106203450A (zh) * | 2016-07-11 | 2016-12-07 | 国家新闻出版广电总局广播科学研究院 | 基于深度学习框架对图像进行特征提取的目标检测方法 |
CN107256003A (zh) * | 2017-05-27 | 2017-10-17 | 四川用联信息技术有限公司 | 一种模糊支持向量机的制造过程多元质量诊断分类器 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109284831A (zh) * | 2018-07-19 | 2019-01-29 | 中国航空工业集团公司沈阳飞机设计研究所 | 基于Mamdani模糊推理方法及推理系统 |
CN109284831B (zh) * | 2018-07-19 | 2022-06-24 | 中国航空工业集团公司沈阳飞机设计研究所 | 基于Mamdani模糊推理方法及推理系统 |
CN110968618A (zh) * | 2019-11-07 | 2020-04-07 | 华中科技大学 | 一种挖掘焊接参数量化关联规则的方法及应用 |
CN110968618B (zh) * | 2019-11-07 | 2023-04-11 | 华中科技大学 | 一种挖掘焊接参数量化关联规则的方法及应用 |
WO2022007376A1 (zh) * | 2020-07-08 | 2022-01-13 | 北京航空航天大学 | 基于贝叶斯自适应共振的多目标多模态粒子群优化方法 |
CN113627469A (zh) * | 2021-07-01 | 2021-11-09 | 北京科技大学 | 一种基于模糊推理算法的热轧带钢板形凸度预测的方法 |
CN113627469B (zh) * | 2021-07-01 | 2024-02-09 | 北京科技大学 | 一种基于模糊推理算法的热轧带钢板形凸度预测的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108268979B (zh) | 2021-11-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108268979B (zh) | 一种基于演化模糊关联规则的中厚板质量预测方法 | |
Zhang et al. | A novel multi-stage hybrid model with enhanced multi-population niche genetic algorithm: An application in credit scoring | |
Viering et al. | The shape of learning curves: a review | |
US6636862B2 (en) | Method and system for the dynamic analysis of data | |
CN108921604B (zh) | 一种基于代价敏感分类器集成的广告点击率预测方法 | |
Li et al. | Multi-objective particle swarm optimization for key quality feature selection in complex manufacturing processes | |
CN110555459A (zh) | 基于模糊聚类和支持向量回归的成绩预测方法 | |
CN111310799A (zh) | 一种基于历史评估结果的主动学习算法 | |
CN117076691A (zh) | 一种面向智慧社区的商品资源知识图谱算法模型 | |
de Holanda Maia et al. | An ensemble of naive bayes classifiers for uncertain categorical data | |
Li et al. | A recursive framework for improving the performance of multi-objective differential evolution algorithms for gene selection | |
Singh et al. | Hybrid approach for gene selection and classification using filter and genetic algorithm | |
Radišić et al. | Predictive Factors for Completion or Dropping Out of Professional Studies | |
CN112347162A (zh) | 一种基于在线学习的多元时序数据规则挖掘方法 | |
Delgado et al. | The yield curve as a recession leading indicator. An application for gradient boosting and random forest | |
Narasimhan et al. | Altered particle swarm optimization based attribute selection strategy with improved fuzzy Artificial Neural Network classifier for coronary artery heart disease risk prediction | |
CN114357869A (zh) | 一种基于数据关系学习和预测的多目标优化代理模型设计方法及系统 | |
Himani et al. | A comparative study on machine learning based prediction of citations of articles | |
Qu et al. | An automatic clustering algorithm using nsga-ii with gene rearrangement | |
Kim | In-and-Out Weight Box: A novel approach for better network compression and feature selection | |
Saunders | Automated Machine Learning for Positive-Unlabelled Learning | |
Ghanem et al. | Data mining for intelligent academic advising from noisy dataset | |
KR20200126715A (ko) | 인공 신경망을 이용한 단백질 독성 예측 시스템 및 방법 | |
Fan et al. | An adaptive diversity-based ensemble method for binary classification | |
CN111553071B (zh) | 一种基于随机嵌入辅助模型的高维多目标演化优化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |