CN117036797A - 基于特征提取与随机森林分类的连铸坯纵裂纹预测方法 - Google Patents
基于特征提取与随机森林分类的连铸坯纵裂纹预测方法 Download PDFInfo
- Publication number
- CN117036797A CN117036797A CN202310970733.7A CN202310970733A CN117036797A CN 117036797 A CN117036797 A CN 117036797A CN 202310970733 A CN202310970733 A CN 202310970733A CN 117036797 A CN117036797 A CN 117036797A
- Authority
- CN
- China
- Prior art keywords
- temperature
- sample
- longitudinal crack
- model
- random forest
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007637 random forest analysis Methods 0.000 title claims abstract description 47
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000009749 continuous casting Methods 0.000 title claims abstract description 35
- 238000000605 extraction Methods 0.000 title claims abstract description 18
- 238000012549 training Methods 0.000 claims abstract description 44
- 238000001514 detection method Methods 0.000 claims abstract description 16
- 238000012360 testing method Methods 0.000 claims description 45
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 claims description 16
- 238000005266 casting Methods 0.000 claims description 16
- 229910052802 copper Inorganic materials 0.000 claims description 16
- 239000010949 copper Substances 0.000 claims description 16
- 230000000630 rising effect Effects 0.000 claims description 8
- 229910000831 Steel Inorganic materials 0.000 claims description 7
- 239000010959 steel Substances 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 6
- 238000003066 decision tree Methods 0.000 claims description 5
- 230000009467 reduction Effects 0.000 claims description 5
- 101100129500 Caenorhabditis elegans max-2 gene Proteins 0.000 claims description 4
- 238000004422 calculation algorithm Methods 0.000 claims description 4
- 239000003054 catalyst Substances 0.000 claims description 4
- 239000000203 mixture Substances 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 3
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 claims description 2
- 238000012935 Averaging Methods 0.000 claims description 2
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 2
- 238000013145 classification model Methods 0.000 claims description 2
- 238000009826 distribution Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 claims description 2
- 230000002159 abnormal effect Effects 0.000 abstract description 2
- 238000009851 ferrous metallurgy Methods 0.000 abstract description 2
- 230000008859 change Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000001816 cooling Methods 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 230000007547 defect Effects 0.000 description 3
- 238000007599 discharging Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 230000005499 meniscus Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000035882 stress Effects 0.000 description 1
- 230000008646 thermal stress Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Investigating Or Analyzing Materials Using Thermal Means (AREA)
Abstract
本发明提供一种基于特征提取与随机森林分类的连铸坯纵裂纹预测方法,属于钢铁冶金连铸检测技术领域。首先,通过提取正常工况和纵裂纹样本的温度特征,组成温度特征向量样本库;然后,利用温度特征向量样本库对随机森林分类模型进行训练,获得预测准确率最高的RFC模型;最终,利用训练好的随机森林模型对实时获取的样本进行分类,在线预测连铸坯纵裂纹。上述连铸坯纵裂纹预测方法适用于板坯、方坯、圆坯、异型坯等。本发明提出的连铸坯纵裂纹预测方法不易出现过拟合,对由正常工况下温度波动较大的样本产生的异常值和噪声具有很好的鲁棒性,纵裂纹预测准确率高。
Description
技术领域
本发明属于钢铁冶金连铸检测技术领域,涉及一种基于特征提取与随机森林分类的连铸坯纵裂纹预测方法。
背景技术
铸坯裂纹是影响连铸机产量和铸坯质量的主要缺陷,铸坯各类缺陷中有50%为裂纹。铸坯表面纵裂纹是常见的表面缺陷之一,严重的表面纵裂纹长度可达数米,裂纹宽度最大可达10mm。高温液态钢水在结晶器的强冷作用下于弯月面附近形成初生还壳,当冷却不均匀时会导致初生坯壳的厚度及冷却收缩率不均,进而产生较大的热应力。当局部薄弱的初生坯壳所受应力超过其抗拉强度时,将在坯壳薄弱处形成裂纹,并随着铸坯的冷却和下移进一步扩展,最终形成铸坯表面纵裂纹。纵裂纹的形成一般伴随着铸坯表面的纵向凹陷和气隙增厚,严重阻碍铸坯与铜板之间的传热。因此,当纵裂纹随铸坯下移经过、远离各排热电偶时,其温度会出现下降和回升的变化过程。生产中,轻微的纵裂纹需精整处理,严重的纵裂纹可以使铸坯判废,甚至裂纹深度超过凝固坯壳厚度,导致纵裂漏钢等重大事故,给生产和设备造成极大的危害,严重影响生产过程顺行。开发可靠、准确的连铸坯纵裂纹预测方法对于连铸生产具有十分重要的意义。
发明专利CN111618265A提出了一种连铸坯纵裂纹在线检测方法。该方法对纵裂纹和正常工况下同列热电偶温度的温度变化率进行计算,获得温度样本以及样本库;利用K近邻(KNN)分类算法和设定参数K对样本库和在线实时检测的同列热电偶温度预处理结果进行分类,从而识别和预报连铸坯纵裂纹。该方法具有易于实现,无需对样本库进行训练、无需估计参数等优点,然而其算法对测试样本分类时的计算量大,同时必须指定K值,K值选择不当,则分类精度不能保障。
随机森林算法具有无需指定参数值、精确度高、无需对特征进行降维处理、具有很好的抗噪能力和不易过拟合等优势,在解决分类回归问题上有着广泛的应用。针对连铸坯出现纵裂纹时典型的温度特征,本发明提出,对连铸坯纵裂纹和正常工况下提取的多维温度特征进行处理,组成温度特征向量样本库,然后利用温度特征向量样本库对随机森林分类(Random Forest Classifier,RFC)模型进行训练,获得预测准确率最高的RFC模型,最终利用RFC模型实现连铸坯纵裂纹的检测和预报。
发明内容
针对现有技术存在的问题,本发明提供一种基于特征提取与随机森林分类的连铸坯纵裂纹预测方法,准确、及时地检测连铸纵裂纹,为连铸异常监控提供一种可靠、有效的方法。
为达到上述目的,本发明的技术方案如下:
一种基于特征提取与随机森林分类的连铸坯纵裂纹预测方法,该方法首先,通过提取正常工况和纵裂纹样本的温度特征,组成温度特征向量样本库;然后,利用温度特征向量样本库对随机森林分类模型进行训练,获得预测准确率最高的RFC模型;最终,利用训练好的随机森林模型对实时获取的样本进行分类,在线预测连铸坯纵裂纹,具体包括以下步骤:
第一步、采集温度数据
(1.1)回溯钢厂历史温度数据,截取纵裂纹发生时连续S秒同列热电偶包含温度下降-稳定-上升整个波动过程在内的温度数据;
(1.2)回溯钢厂历史温度数据,截取正常工况内连续S秒同列热电偶正常波动的温度数据。其中,步骤(1.1)和(1.2)截取时间相同。
第二步、温度特征提取与特征值计算
(2.1)提取温度特征
板坯铸机结晶器有四张铜板,每张铜板上沿纵裂纹发生和扩展方向(纵向,即浇铸方向)分布有热电偶,对于正常工况下和发生纵裂纹的每列热电偶,沿浇铸方向从上至下,提取其第x、x+1排热电偶的温度特征,每列热电偶均提取8维温度特征,分别为:
第x排温度下降幅值、第x排温度上升幅值:
第x+1排温度下降幅值、第x+1排温度上升幅值:
第x排温度下降速率最大值、第x排温度上升速率最大值:
第x+1排温度下降速率最大值、第x+1排温度上升速率最大值:
(2.2)计算温度特征值
对于每列第x、x+1排热电偶温度下降、上升幅值计算公式为:
(1)、(2)式中,分别为第x排热电偶温度下降、上升幅值,T(x)max_1为第x排热电偶温度下降阶段开始前的温度最大值,T(x)max_2为第x排热电偶温度上升阶段的温度最大值,T(x)min为第x排热电偶温度下降阶段的温度最小值。
(3)、(4)式中,分别为第x+1排热电偶温度下降、上升幅值,T(x+1)max_1为第x+1排热电偶温度下降阶段开始前的温度最大值,T(x+1)max_2为第x+1排热电偶温度上升阶段的温度最大值,T(x+1)min为第x+1排热电偶温度下降阶段的温度最小值。
对于第x、x+1排热电偶每时刻的温度下降速率、温度上升速率计算公式为:
(5)、(6)式中,分别为第x排热电偶第i秒温度下降速率、温度上升速率,T(x)_i+k为第x排热电偶i+k秒的温度值,T(x)_i为第x排热电偶第i秒的温度值,k为两个温度的时间间隔。
(7)、(8)式中,分别为第x+1排热电偶第i秒温度下降速率、温度上升速率,T(x+1)_i+k为第x+1排热电偶i+k秒的温度值,T(x+1)_i为第x+1排热电偶第i秒的温度值,k为两个温度的时间间隔。
对于第x、x+1排热电偶温度下降速率最大值、温度上升速率最大值计算公式为:
(9)、(10)式中,分别为第x排热电偶截取时间段内,热电偶温度的下降速率、温度上升速率所得的最大值。
(11)、(12)式中,分别为第x+1排热电偶截取时间段内,热电偶温度的下降速率、温度上升速率所得的最大值。
第三步、样本库构建与最优RFC模型训练、测试及选择
(3.1)构建样本库
每一个特征向量样本Ef对应一例正常工况样本或纵裂纹样本,它包含了从一例正常工况样本或纵裂纹样本中提取的8维温度特征,该8维温度特征由第二步中步骤(2.1)确定,即:
所有的特征向量样本构成典型温度特征向量样本库Vf,即:
温度特征向量样本库Vf中包含正常工况样本和纵裂纹样本,表示纵裂纹样本,标签为1;/>表示正常工况下的样本,标签为-1。m、n分别为样本库中纵裂纹和正常工况样本的数量。
(3.2)对随机森林分类模型(RFC模型)进行训练、测试
将温度特征向量样本库Vf随机划分为L组子样本库,其中每一组子样本库均包含训练集和测试集。利用每一组子样本库中的训练集对RFC模型进行训练,并且对该子样本库中的测试样本集进行测试。对L组子样本库分别训练和测试后,得到L个测试准确率,选取测试结果最优的子样本库对应的RFC纵裂纹预测模型。具体包括以下步骤:
(3.2.1)RFC模型训练:随机从温度特征向量样本库Vf中抽取正常工况样本和纵裂纹样本各不少于a(a≥30,a∈Z+,Z+表示正整数)例组成训练集,开始对随机森林分类模型进行训练。随机森林分类模型预测结果为:
式中,H(x)为随机森林分类模型预测结果,Y表示分类类型,I是指示函数;所述的随机森林分类模型由多棵决策树{h(x,θt),t=1,2,3,…,k}组合而成,h(x,θt)表示决策树,x为自变量,θt为服从独立分布的随机变量,k为决策子树的个数,式子可以理解为是随机森林分类算法根据最大投票法则判断得票数最多的一类作为最后的分类结果。
同时,可以得到随机森林分类模型的边缘函数,即为:
式中,I为指示函数,avk表示对指示函数结果取平均,j为分类不正确的向量,hk(x)为一系列决策树,X为样本的特征属性,Y为其对应的类别属性。边缘函数衡量了分类模型能够分类的正确程度。
(3.2.2)RFC模型测试:训练完成后,再从温度特征向量样本库Vf中选取不同于训练集的包含正常工况下和纵裂纹样本各不少于b(b≥10,b∈Z+,Z+表示正整数)例的样本组成测试集,对训练好的随机森林分类模型进行测试并记录预测准确率。
重复以上训练、测试步骤L次,每一次训练集、测试集中样本数量和构成方式与上述方法一致,最终得到L组RFC模型及其对应的预测准确率。
(3.3)最优RFC模型选择
比较L组的RFC模型预测准确率数据,选取预测准确率最高的一次,从而得到最优随机森林分类模型,即最优RFC模型,通过最优RFC模型能够达到对实时温度特征向量样本的分类预测,最终实现对纵裂纹样本的检测和预报。
衡量最优RFC模型的分类精度可以用以下公式计算:
(13)式中,A表示RFC模型的总体分类精度,A取值越大,表示分类效果越好。TP表示对正例样本分类正确的数量,TN表示对负例样本分类正确的数量;P表示正例样本的数量;N表示负例样本的数量;正例样本指的是纵裂纹样本,负例样本指的是正常工况样本。
第四步、基于最优RFC模型的纵裂纹在线检测
(4.1)在线检测时,首先,截取当前时刻以及之前连续S-1秒同列热电偶的实时温度;然后,提取第二步中步骤(2.1)确认的8维温度特征;最后,得到实时温度特征向量样本Ef_now;
(4.2)利用第三步得到的最优RFC模型对实时温度特征向量样本Ef_now进行分类预测,输出实时温度特征向量样本Ef_now的类别标签;
(4.3)若Ef_now标签结果为1,则认为Ef_now为纵裂纹样本,发出纵裂纹预警;否则,继续下一秒温度检测,并对下一时刻及之前连续S-1秒的热电偶温度数据,即下一时刻对应的S秒热电偶温度数据执行步骤(4.1)到(4.3)。
进一步的,上述连铸坯纵裂纹预测方法适用于板坯、方坯、圆坯、异型坯等。
本发明的有益效果是:
本发明所提出的一种基于特征提取与随机森林分类的连铸坯纵裂纹预测方法,该方法通过对连铸坯纵裂纹和正常工况下提取的温度特征进行处理组成温度特征向量样本库,然后利用温度特征向量样本库对随机森林分类模型进行训练和测试,找到最优的随机森林分类(Random Forest Classifier,RFC)模型,进而实现在线连铸坯纵裂纹的检测和预报;本发明的方法不易出现过拟合,对由正常工况下温度波动较大的样本产生的异常值和噪声具有很好的鲁棒性,纵裂纹预测准确率高。
附图说明
图1是最优RFC模型训练、测试及铸坯纵裂纹在线检测流程图。
图2是结晶器四张铜板及热电偶布置示意图。
图3是纵裂纹发生时一、二排热电偶温度曲线变化图。
图4是正常工况下一、二排热电偶温度曲线变化图。
图5是温度特征提取示意图。
图6是数据集中每例样本第一排热电偶温升温降速率最大值散点图。
图7是数据集中每例样本第二排热电偶温升温降速率最大值散点图。
图8是最优RFC模型测试结果示意图。
具体实施方式
下面通过具体的实施例,并结合附图对本发明做进一步的阐述,但不限定本发明。
图1所示为最优RFC模型训练、测试及铸坯纵裂纹在线检测流程图。首先,根据获取的结晶器热电偶实时温度,提取连铸坯纵裂纹和正常工况8维温度特征,并进行处理组成温度特征向量样本库;其次,利用温度特征向量样本库对随机森林分类模型进行训练和测试,找到最优的随机森林分类(Random Forest Classifier,RFC)模型;最后,在线检测和预报连铸坯纵裂纹。
图2所示为某钢厂在线服役的结晶器四张铜板及其热电偶布置示意图。结晶器由四张铜板组合而成,铜板高度为D2为900mm,有效高度为800mm,宽度为D1为1910mm,窄面铜板厚度D7为244.5mm。内、外弧宽面铜板各安装3排11列热电偶,左、右侧窄面铜板各安装了3排1列热电偶,结晶器四张铜板共计安装72支热电偶。其中,第一排热电偶距结晶器上口的距离为D3为210mm,第一、二排热电偶之间的间距为D4为115mm,第二、三排热电偶之间的间距为D5为120mm,宽面铜板相邻两列热电偶之间的间距为D6为150mm。
第一步、采集温度数据
(1.1)图3是纵裂纹发生时一、二排热电偶温度曲线变化图。截取同列热电偶连续S秒包含温度下降-稳定-上升整个波动过程在内的热电偶温度数据,此例中S取120秒;
(1.2)图4是正常工况下一、二排热电偶温度曲线变化图,由图4可见,正常工况下温度无明显先下降后上升的变化趋势,波动较小。对于正常工况下的历史温度数据,截取连续120秒同列热电偶的温度数据。
第二步、温度特征提取与特征值计算
(2.1)提取温度特征
图5是温度特征提取示意图。对于正常工况下和发生纵裂纹的一列热电偶,沿浇铸方向从上至下,提取其第1、2排热电偶的温度特征,共提取8维温度特征,分别为:
第1排温度下降幅值、第1排温度上升幅值:
第2排温度下降幅值、第2排温度上升幅值:
第1排温度下降速率最大值、第1排温度上升速率最大值:
第2排温度下降速率最大值、第2排温度上升速率最大值:
图5所示中,分别是在得到/> 之前需要进行比较的该时刻的温度变化率之一,每排热电偶对应所在时刻的温度变化率共有120个温度变化率值。
(2.2)计算温度特征值
在提取完8维温度特征后按照(1)~(12)式进行温度特征值计算,其中(5)、(6)、(7)、(8)式中的k取5秒,即计算i秒的温度速率时,取i秒及i+5秒的温度值计算其温度变化速率。如图6、图7分别是数据集中每例样本第一排、第二排热电偶温升温降速率最大值散点图,图6中表示数据集中每例样本第一排热电偶的温升温降速率最大值,图7中/>表示数据集中每例样本第二排热电偶的温升温降速率最大值。
第三步、样本库构建与最优RFC模型训练、测试及选择
(3.1)构建样本库
每一个特征向量样本Ef由第二步步骤(2.1)确定的8维特征组成,即:
所有的特征向量样本构成温度特征向量样本库Vf,即:
本实例从温度特征向量样本库Vf中划分的子样本库中每组子样本库中均包含40例正常工况样本和40例纵裂纹样本。
(3.2)对随机森林分类模型(RFC模型)进行训练、测试
将温度特征向量样本库Vf随机划分为4组子样本库,其中每一组子样本库均包含训练集和测试集。利用每一组子样本库中的训练集对RFC模型进行训练,并且对该子样本库中的测试样本集进行测试。如此对4组子样本库分别训练和测试并得到4个测试准确率,选取测试结果最优的子样本库对应的RFC纵裂纹预测模型,具体包括以下步骤:
(3.2.1)RFC模型训练:随机从温度特征向量样本库Vf中抽取正常工况样本和纵裂纹样本各30例组成训练集,开始对RFC模型进行训练。
(3.2.2)RFC模型测试:训练完成后,再从温度特征向量样本库Vf中选取不同于训练集的包含正常工况下和纵裂纹样本各10例的样本组成测试集,对训练好的随机森林分类模型进行测试并记录下预测准确率,
重复以上训练、测试步骤4次,每一次训练集、测试集中样本数量和构成方式与上述方法一致,最终得到4组RFC模型及其对应的预测准确率。
(3.3)最优RFC模型选择
比较4次的预测准确率数据,其中准确率最高的RFC模型,即最优RFC模型。最优RFC模型边缘函数mg(X,Y)>0恒成立,表示样本能够被正确分类。如图8是最优RFC模型测试结果示意图,利用最优RFC模型对测试集中20例样本进行检测。最终,编号为1-10的纵裂纹样本全部被准确预测,编号为11-20的正常工况样本仅有1例被误报为纵裂纹样本,其余9例样本全部被准确预测。由(13)式可计算得
第四步、本实施例可以基于最优RFC模型的纵裂纹进行实时在线检测
(4.1)在线检测时,截取当前时刻以及之前连续119秒同列热电偶的实时温度,以与第二步相同的方式提取实时温度的典型特征,得到实时温度特征向量样本Ef_now;
(4.2)利用第三步得到的最优RFC模型对实时温度特征向量样本Ef_now进行分类预测,得到实时温度特征向量样本Ef_now的类别标签;
(4.3)若Ef_now标签输出结果为1,则认为Ef_now为纵裂纹样本,发出纵裂纹预警;否则,继续下一秒温度检测,对下一时刻及之前连续119秒的热电偶温度数据,即下一时刻对应的120秒热电偶温度数据执行步骤(4.1)到(4.3)。
本发明通过提取正常工况和纵裂纹样本的温度特征,组成温度特征向量样本库;然后,利用温度特征向量样本库对随机森林分类模型进行训练,获得预测准确率最高的RFC模型,即最优RFC模型;最终,能够利用最优RFC模型对实时获取的样本进行分类,在线预测连铸坯纵裂纹。
以上所述实施例仅表达本发明的实施方式,但并不能因此而理解为对本发明专利的范围的限制,应当指出,对于本领域的技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些均属于本发明的保护范围。
Claims (4)
1.一种基于特征提取与随机森林分类的连铸坯纵裂纹预测方法,其特征在于,所述的连铸坯纵裂纹预测方法首先,通过提取正常工况和纵裂纹样本的温度特征,组成温度特征向量样本库;然后,利用温度特征向量样本库对随机森林分类模型进行训练,获得预测准确率最高的RFC模型;最终,利用训练好的随机森林模型对实时获取的样本进行分类,在线预测连铸坯纵裂纹。
2.根据权利要求1所述的一种基于特征提取与随机森林分类的连铸坯纵裂纹预测方法,其特征在于,包括以下步骤:
第一步、采集温度数据
(1.1)回溯钢厂历史温度数据,截取纵裂纹发生时连续S秒同列热电偶包含温度下降-稳定-上升整个波动过程在内的温度数据;
(1.2)回溯钢厂历史温度数据,截取正常工况内连续S秒同列热电偶正常波动的温度数据;其中,步骤(1.1)和(1.2)截取时间相同;
第二步、温度特征提取与特征值计算
(2.1)提取温度特征
板坯铸机结晶器有四张铜板,每张铜板上均沿纵向分布有热电偶,对于正常工况下和发生纵裂纹的每列热电偶,沿浇铸方向从上至下,提取其第x、x+1排热电偶的温度特征,每列热电偶均提取8维温度特征,分别为:
第x排温度下降幅值、第x排温度上升幅值:
第x+1排温度下降幅值、第x+1排温度上升幅值:
第x排温度下降速率最大值、第x排温度上升速率最大值:
第x+1排温度下降速率最大值、第x+1排温度上升速率最大值:
(2.2)计算温度特征值
对于每列第x、x+1排热电偶温度下降、上升幅值计算公式为:
(1)、(2)式中,分别为第x排热电偶温度下降、上升幅值,T(x)max_1为第x排热电偶温度下降阶段开始前的温度最大值,T(x)max_2为第x排热电偶温度上升阶段的温度最大值,T(x)min为第x排热电偶温度下降阶段的温度最小值;
(3)、(4)式中,分别为第x+1排热电偶温度下降、上升幅值,T(x+1)max_1为第x+1排热电偶温度下降阶段开始前的温度最大值,T(x+1)max_2为第x+1排热电偶温度上升阶段的温度最大值,T(x+1)min为第x+1排热电偶温度下降阶段的温度最小值;
对于第x、x+1排热电偶每时刻的温度下降速率、温度上升速率计算公式为:
(5)、(6)式中,分别为第x排热电偶第i秒温度下降速率、温度上升速率,T(x)_i+k为第x排热电偶i+k秒的温度值,T(x)_i为第x排热电偶第i秒的温度值,k为两个温度的时间间隔;
(7)、(8)式中,分别为第x+1排热电偶第i秒温度下降速率、温度上升速率,T(x+1)_i+k为第x+1排热电偶i+k秒的温度值,T(x+1)_i为第x+1排热电偶第i秒的温度值,k为两个温度的时间间隔;
对于第x、x+1排热电偶温度下降速率最大值、温度上升速率最大值计算公式为:
(9)、(10)式中,分别为第x排热电偶截取时间段内,热电偶温度的下降速率、温度上升速率所得的最大值;
(11)、(12)式中,分别为第x+1排热电偶截取时间段内,热电偶温度的下降速率、温度上升速率所得的最大值;
第三步、样本库构建与最优RFC模型训练、测试及选择
(3.1)构建样本库
每一个特征向量样本Ef对应一例正常工况样本或纵裂纹样本,它包含了从一例正常工况样本或纵裂纹样本中提取的8维温度特征,该8维温度特征由第二步中步骤(2.1)确定,即:
所有的特征向量样本构成典型温度特征向量样本库Vf,即:
温度特征向量样本库Vf中包含正常工况样本和纵裂纹样本,表示纵裂纹样本,标签为1;/>表示正常工况下的样本,标签为-1;m、n分别为样本库中纵裂纹和正常工况样本的数量;
(3.2)对随机森林分类模型进行训练、测试
将温度特征向量样本库Vf随机划分为L组子样本库,其中每一组子样本库均包含训练集和测试集;利用每一组子样本库中的训练集对RFC模型进行训练,并且对该子样本库中的测试样本集进行测试;对L组子样本库分别训练和测试后,得到L个测试准确率,选取测试结果最优的子样本库对应的RFC纵裂纹预测模型;
(3.3)最优RFC模型选择
比较L组的RFC模型预测准确率数据,选取预测准确率最高的一次,从而得到最优随机森林分类模型,即最优RFC模型,通过最优RFC模型能够达到对实时温度特征向量样本的分类预测,最终实现对纵裂纹样本的检测和预报;
衡量最优RFC模型的分类精度可以用以下公式计算:
式(13)中,A表示RFC模型的总体分类精度,A取值越大,表示分类效果越好;TP表示对正例样本分类正确的数量,TN表示对负例样本分类正确的数量;P表示正例样本的数量;N表示负例样本的数量;正例样本指的是纵裂纹样本,负例样本指的是正常工况样本;
第四步、基于最优RFC模型的纵裂纹在线检测
(4.1)在线检测时,首先,截取当前时刻以及之前连续S-1秒同列热电偶的实时温度;然后,提取第二步中步骤(2.1)确认的8维温度特征;最后,得到实时温度特征向量样本Ef_now;
(4.2)利用第三步得到的最优RFC模型对实时温度特征向量样本Ef_now进行分类预测,输出实时温度特征向量样本Ef_now的类别标签;
(4.3)若Ef_now标签结果为1,则认为Ef_now为纵裂纹样本,发出纵裂纹预警;否则,继续下一秒温度检测,并对下一时刻及之前连续S-1秒的热电偶温度数据,即下一时刻对应的S秒热电偶温度数据执行步骤(4.1)到(4.3)。
3.根据权利要求2所述的一种基于特征提取与随机森林分类的连铸坯纵裂纹预测方法,其特征在于,所述的步骤(3.2)具体包括以下步骤:
(3.2.1)RFC模型训练:随机从温度特征向量样本库Vf中抽取正常工况样本和纵裂纹样本各不少于a(a≥30,a∈Z+,Z+表示正整数)例组成训练集,开始对随机森林分类模型进行训练;随机森林分类模型预测结果为:
式中,H(x)为随机森林分类模型预测结果,Y表示分类类型,I是指示函数;所述的随机森林分类模型由多棵决策树{h(x,θt),t=1,2,3,…,k}组合而成,h(x,θt)表示决策树,x为自变量,θt为服从独立分布的随机变量,k为决策子树的个数,式子可以理解为是随机森林分类算法根据最大投票法则判断得票数最多的一类作为最后的分类结果;
同时,可以得到随机森林分类模型的边缘函数,即为:
式中,I为指示函数,avk表示对指示函数结果取平均,j为分类不正确的向量,hk(x)为一系列决策树,X为样本的特征属性,Y为其对应的类别属性;边缘函数衡量了分类模型能够分类的正确程度;
(3.2.2)RFC模型测试:训练完成后,再从温度特征向量样本库Vf中选取不同于训练集的包含正常工况下和纵裂纹样本各不少于b(b≥10,b∈Z+,Z+表示正整数)例的样本组成测试集,对训练好的随机森林分类模型进行测试并记录预测准确率;
重复以上训练、测试步骤L次,每一次训练集、测试集中样本数量和构成方式与上述方法一致,最终得到L组RFC模型及其对应的预测准确率。
4.根据权利要求1所述的一种基于特征提取与随机森林分类的连铸坯纵裂纹预测方法,其特征在于,所述的连铸坯纵裂纹预测方法适用于板坯、方坯、圆坯、异型坯。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310970733.7A CN117036797A (zh) | 2023-08-03 | 2023-08-03 | 基于特征提取与随机森林分类的连铸坯纵裂纹预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310970733.7A CN117036797A (zh) | 2023-08-03 | 2023-08-03 | 基于特征提取与随机森林分类的连铸坯纵裂纹预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117036797A true CN117036797A (zh) | 2023-11-10 |
Family
ID=88623793
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310970733.7A Pending CN117036797A (zh) | 2023-08-03 | 2023-08-03 | 基于特征提取与随机森林分类的连铸坯纵裂纹预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117036797A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117371626A (zh) * | 2023-12-07 | 2024-01-09 | 小米汽车科技有限公司 | 铸件质量预测方法、装置及介质 |
-
2023
- 2023-08-03 CN CN202310970733.7A patent/CN117036797A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117371626A (zh) * | 2023-12-07 | 2024-01-09 | 小米汽车科技有限公司 | 铸件质量预测方法、装置及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11105758B2 (en) | Prediction method for mold breakout based on feature vectors and hierarchical clustering | |
CN109365769B (zh) | 一种基于混合模型判断的结晶器漏钢预报方法 | |
CN117036797A (zh) | 基于特征提取与随机森林分类的连铸坯纵裂纹预测方法 | |
JP6358215B2 (ja) | 連続鋳造鋳片の表面欠陥判定方法及び装置、該表面欠陥判定方法を用いた鋼片の製造方法 | |
CN104181196B (zh) | 一种连铸坯表面纵裂纹在线检测方法 | |
CN113340444A (zh) | 基于热电偶温度和逻辑判断的连铸坯表面纵裂预测方法 | |
Zhou et al. | Application of time series data anomaly detection based on deep learning in continuous casting process | |
CN111666710B (zh) | 一种采用逻辑回归分类预测连铸坯纵裂纹的方法 | |
Kumar et al. | Development of intelligent mould for online detection of defects in steel billets | |
CN117494531B (zh) | 一种基于有限元和XGBoost算法的中碳钢脱碳深度预测方法 | |
CN110918973B (zh) | 一种基于游程的结晶器热像图异常区域标记方法 | |
CN117518982B (zh) | 一种提高机床加工精度的方法及系统 | |
CN111421119A (zh) | 连铸板坯表面纵裂纹在线预测的方法 | |
CN117548639A (zh) | 一种厚板坯连铸生产的过程监控方法 | |
CN112926622A (zh) | 一种基于特征向量和swgan-gp生成对抗网络的结晶器漏钢预报方法 | |
CN115446276B (zh) | 基于卷积神经网络识别结晶器铜板v型黏结特征的连铸漏钢预警方法 | |
CN111680448B (zh) | 一种基于支持向量机svm分类的连铸坯纵裂纹预测方法 | |
CN113935416B (zh) | 一种多状态结晶器的连铸漏钢预报方法 | |
JP2015160239A (ja) | 連続鋳造スラブの表面欠陥判定方法及び装置 | |
CN117171936A (zh) | 基于缺陷机理提取结晶器实时特征值的板坯质量预测方法 | |
CN111618265B (zh) | 一种基于k近邻分类的连铸坯纵裂纹在线检测方法 | |
JP6119807B2 (ja) | 連続鋳造スラブの表面欠陥判定方法及び装置、該表面欠陥判定方法を用いた鋼鋳片の製造方法 | |
CN115586215A (zh) | 一种基于温度特征的连铸坯表面纵裂纹逻辑判断方法 | |
CN116441502A (zh) | 基于结晶器温度识别连铸板坯纵裂纹缺陷的方法及系统 | |
JP6358199B2 (ja) | 連続鋳造スラブの表面欠陥判定方法及び装置、該表面欠陥判定方法を用いた鋼鋳片の製造方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |