CN110619691B - 一种板坯表面裂纹的预测方法及装置 - Google Patents
一种板坯表面裂纹的预测方法及装置 Download PDFInfo
- Publication number
- CN110619691B CN110619691B CN201910913079.XA CN201910913079A CN110619691B CN 110619691 B CN110619691 B CN 110619691B CN 201910913079 A CN201910913079 A CN 201910913079A CN 110619691 B CN110619691 B CN 110619691B
- Authority
- CN
- China
- Prior art keywords
- data
- historical
- parameters
- training
- slab
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 108
- 238000004519 manufacturing process Methods 0.000 claims abstract description 142
- 238000012549 training Methods 0.000 claims description 123
- 238000012360 testing method Methods 0.000 claims description 60
- 238000005070 sampling Methods 0.000 claims description 35
- 238000007781 pre-processing Methods 0.000 claims description 26
- 238000009826 distribution Methods 0.000 claims description 20
- 238000007619 statistical method Methods 0.000 claims description 18
- 238000004422 calculation algorithm Methods 0.000 claims description 16
- 238000007637 random forest analysis Methods 0.000 claims description 16
- 230000002159 abnormal effect Effects 0.000 claims description 12
- 238000010310 metallurgical process Methods 0.000 claims description 9
- 238000010200 validation analysis Methods 0.000 claims description 8
- 238000002790 cross-validation Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 4
- 238000001514 detection method Methods 0.000 abstract description 11
- 238000012423 maintenance Methods 0.000 abstract description 4
- 238000011895 specific detection Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 9
- 238000012795 verification Methods 0.000 description 9
- 229910000831 Steel Inorganic materials 0.000 description 8
- 239000010959 steel Substances 0.000 description 8
- 238000005266 casting Methods 0.000 description 7
- 238000012952 Resampling Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 238000003066 decision tree Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000003672 processing method Methods 0.000 description 3
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 2
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000009749 continuous casting Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- WPBNNNQJVZRUHP-UHFFFAOYSA-L manganese(2+);methyl n-[[2-(methoxycarbonylcarbamothioylamino)phenyl]carbamothioyl]carbamate;n-[2-(sulfidocarbothioylamino)ethyl]carbamodithioate Chemical compound [Mn+2].[S-]C(=S)NCCNC([S-])=S.COC(=O)NC(=S)NC1=CC=CC=C1NC(=S)NC(=O)OC WPBNNNQJVZRUHP-UHFFFAOYSA-L 0.000 description 2
- 229910052698 phosphorus Inorganic materials 0.000 description 2
- 239000011574 phosphorus Substances 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 239000002436 steel type Substances 0.000 description 2
- 229910052717 sulfur Inorganic materials 0.000 description 2
- 239000011593 sulfur Substances 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000010924 continuous production Methods 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000001678 irradiating effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005272 metallurgy Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/04—Manufacturing
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07C—TIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
- G07C3/00—Registering or indicating the condition or the working of machines or other apparatus, other than vehicles
- G07C3/005—Registering or indicating the condition or the working of machines or other apparatus, other than vehicles during manufacturing process
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07C—TIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
- G07C3/00—Registering or indicating the condition or the working of machines or other apparatus, other than vehicles
- G07C3/14—Quality control systems
- G07C3/146—Quality control systems during manufacturing process
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Quality & Reliability (AREA)
- Development Economics (AREA)
- Manufacturing & Machinery (AREA)
- Entrepreneurship & Innovation (AREA)
- Tourism & Hospitality (AREA)
- Theoretical Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Educational Administration (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Automation & Control Theory (AREA)
- General Factory Administration (AREA)
Abstract
本申请涉及冶金自动控制技术领域,公开了一种板坯表面裂纹的预测方法及装置,在该方法中,预先使用历史板坯的关键生成数据,通过随机森林算法构建裂纹预测模型,然后获取当前板坯在生产过程中的关键参数数据,将当前板坯的关键生产数据输入至预先构建的裂纹预测模型中,获取裂纹预测模型输出的裂纹预测概率。根据所述裂纹预测概率,生成所述当前板坯表面是否存在裂纹的预测结果。相对于使用物理手段,本申请实施例公开的方法通过预先构建的模型,利用板坯生产过程中的数据,便可对板坯表面的裂纹实现预测,无需另外安装特定的检测设备,也就无需实施检测设备的日常维护工作,有效节约生产成本。
Description
技术领域
本申请涉及冶金自动控制技术领域,尤其涉及一种板坯表面裂纹的预测方法及装置。
背景技术
在连铸生产中,裂纹是板坯常见的表面缺陷。通常情况下,板坯表面形成裂纹的影响因素包括生产过程中的钢水成分、工艺元素以及设备等。轻微的裂纹经精整后对后续工序不会产生影响,严重的裂纹会导致板坯判废,甚至漏钢。连铸生产技术暂时不能彻底消除裂纹缺陷,因此为了保证连续化生产,需要在板坯流向下一工序之前,对表面存在裂纹的板坯进行准确预测,进而及时将之分拣下线。
目前,在对板坯表面的裂纹进行预测时,通常采用物理手段实现,例如采用光学检测法或者电磁超声波检测法来实现。其中,光学检测法就是使用光源照向板坯,然后根据板坯反射回来的光线,对板坯表面是否存在裂纹进行判断。电磁超声波检测法与光学检测法原理类似,只不过使用的反射信号是声波。
但是,利用上述物理手段对板坯表面的裂纹进行预测时,都需要配备相应的检测设备,例如光学检测法的光源发射器以及光线接收器等,电磁超声波检测法的超声波发射器以及超声波接收器等,实际应用中,这些设备不仅价格昂贵,而且日常维护工作也将增加生产成本。
发明内容
为了解决利用物理手段对板坯表面的裂纹进行预测,导致增加生产成本的问题,本申请通过以下实施例公开了一种板坯表面裂纹的预测方法及装置。
本申请第一方面,公开了一种板坯表面裂纹的预测方法,包括:
获取预先构建的裂纹预测模型,所述裂纹预测模型基于随机森林算法建立,并使用历史板坯的关键生产数据完成训练及测试,所述历史板坯的关键生产数据包括所述历史板坯在生产过程中的关键参数数据以及所述历史板坯的特征数据,其中,所述关键参数从所述历史板坯在生产过程中的多个特征参数中提取所得,所述特征参数为在生产过程中导致板坯表面形成裂纹的影响参数,所述特征数据用于表明所述历史板坯的表面是否存在裂纹;
获取当前板坯的关键生产数据,所述当前板坯的关键生产数据包括所述当前板坯在生产过程中的关键参数数据;
将所述当前板坯的关键生产数据输入至所述裂纹预测模型中,获取所述裂纹预测模型输出的裂纹预测概率;
根据所述裂纹预测概率,生成所述当前板坯表面是否存在裂纹的预测结果,其中,若所述裂纹预测概率大于或等于预设阈值,则生成所述当前板坯表面存在裂纹的预测结果。
可选的,所述关键参数包括重要特征参数以及工艺特征参数;
其中,所述重要特征参数为在生产过程中导致板坯表面形成裂纹的重要影响因素,所述重要特征参数根据每个所述特征参数之间的线性关系,从多个特征参数中提取所得;
所述工艺特征参数为根据冶金工艺规则,对多个所述特征参数进行线性组合所构造的参数。
可选的,构建所述裂纹预测模型的步骤包括:
采集所述历史板坯的生产数据,生成采样数据集,所述历史板坯的生产数据包括所述历史板坯在生产过程中的参数数据以及所述历史板坯的特征数据,所述参数数据包括所述历史板坯在生产过程中的多个特征参数的生产数据;
使用分层抽样法,对所述采样数据集进行划分抽样,获取目标样本集,所述目标样本集为训练样本集或测试样本集;
对所述目标样本集进行数据预处理,从所述目标样本集中所包含的多个特征参数中提取关键参数,并根据所提取的关键参数的生产数据,生成目标数据集,所述目标数据集为训练集或测试集,其中所述训练集为针对所述训练样本集进行数据预处理所生成的目标数据集,所述测试集为针对所述测试样本集进行数据预处理所生成的目标数据集;
采用随机森林算法,建立预测模型;
使用所述训练集对所述预测模型进行训练,使用所述测试集对训练完成的所述预测模型进行测试,构建所述裂纹预测模型。
可选的,所述对所述目标样本集进行数据预处理,从所述目标样本集中所包含的多个特征参数中提取关键参数,并根据所提取的关键参数的生产数据,生成目标数据集,包括:
对所述目标样本集进行统计分析;
根据所述目标样本集的统计分析结果,对每个所述特征参数的生产数据进行异常处理,获取每个所述特征参数的规范数据,所述异常处理包括:判断所述特征参数的生产数据是否存在缺失值,若存在,则对所述缺失值进行数据插补;以及,判断所述特征参数的生产数据是否存在异常值,若存在,则对所述异常值进行数据修复;
使用皮尔逊系数,计算每个所述特征参数与板坯表面裂纹之间的线性关系,并根据所述线性关系,提取所述重要特征参数;
结合冶金工艺规则,对每个所述特征参数进行线性组合,构造所述工艺特征参数;
获取所述重要特征参数的规范数据以及所述工艺特征参数的规范数据;
根据所述重要特征参数的规范数据以及所述工艺特征参数的规范数据,生成所述目标数据集。
可选的,所述使用所述训练集对所述预测模型进行训练,包括:
根据交叉验证法,将所述训练集折分为训练子集和验证子集;
使用所述训练子集和所述验证子集,对所述预测模型进行交叉训练。
可选的,所述使用所述训练集对所述预测模型进行训练之前,所述方法还包括:
从所述训练集中提取所述特征数据,所述特征数据包括正特征数据以及负特征数据,其中,所述正特征数据用于表示所述历史板坯的表面存在裂纹,所述负特征数据用于表示所述历史板坯的表面不存在裂纹;
判断所述正特征数据与所述负特征数据的数量比例是否满足预设的比例;
若判断结果为不满足,则按照所述预设的比例,从所述训练集中重新进行采样,获取用于训练所述预测模型的新的训练集。
可选的,所述根据所述裂纹预测概率,生成所述当前板坯表面是否存在裂纹的预测结果之前,所述方法还包括:
获取所述测试集对训练完成的预测模型进行测试时,所述训练完成的预测模型所输出的历史裂纹预测概率;
对所述历史裂纹预测概率进行概率分布统计,获取概率分布统计结果;
使用最大类间方差法,获取用于划分所述概率分布统计结果的最佳阈值;
将所述最佳阈值设置为所述预设阈值。
可选的,所述根据所述裂纹预测概率,生成所述当前板坯表面是否存在裂纹的预测结果,包括:
判断所述裂纹预测概率是否大于或等于预设阈值,所述预设阈值为所述最佳阈值;
其中,若判断结果为是,则生成所述当前板坯表面存在裂纹的预测结果;
若判断结果为否,则生成所述当前板坯表面不存在裂纹的预测结果。
本申请第二方面,公开了一种板坯表面裂纹的预测装置,所述预测装置应用于本申请第一方面所公开的一种板坯表面裂纹的预测方法,所述预测装置包括:
模型获取模块,用于获取预先构建的裂纹预测模型,所述裂纹预测模型基于随机森林算法建立,并使用历史板坯的关键生产数据完成训练及测试,所述历史板坯的关键生产数据包括所述历史板坯在生产过程中的关键参数数据以及所述历史板坯的特征数据,其中,所述关键参数从所述历史板坯在生产过程中的多个特征参数中提取所得,所述特征参数为在生产过程中导致板坯表面形成裂纹的影响参数,所述特征数据用于表明所述历史板坯的表面是否存在裂纹;
当前数据采集模块,用于获取当前板坯的关键生产数据,所述当前板坯的关键生产数据包括所述当前板坯在生产过程中的关键参数数据;
裂纹预测概率获取模块,用于将所述当前板坯的关键生产数据输入至所述裂纹预测模型中,获取所述裂纹预测模型输出的裂纹预测概率;
预测结果生成模块,用于根据所述裂纹预测概率,生成所述当前板坯表面是否存在裂纹的预测结果,其中,若所述裂纹预测概率大于或等于预设阈值,则生成所述当前板坯表面存在裂纹的预测结果。
可选的,所述装置还包括模型构建模块,所述模型构建模块用于预先构建所述裂纹预测模型,所述模型构建模块包括:
历史数据采集单元,用于采集所述历史板坯的生产数据,生成采样数据集,所述历史板坯的生产数据包括所述历史板坯在生产过程中的参数数据以及所述历史板坯的特征数据,所述参数数据包括所述历史板坯在生产过程中的多个特征参数的生产数据;
数据划分抽样单元,用于对所述采样数据集进行划分抽样,获取目标样本集,所述目标样本集为训练样本集或测试样本集;
数据预处理单元,用于对所述目标样本集进行数据预处理,从所述目标样本集中所包含的多个特征参数中提取关键参数,并根据所提取的关键参数的生产数据,生成目标数据集,所述目标数据集为训练集或测试集,其中所述训练集为针对所述训练样本集进行数据预处理所生成的目标数据集,所述测试集为针对所述测试样本集进行数据预处理所生成的目标数据集;
预测模型建立单元,用于采用随机森林算法,建立预测模型;
裂纹预测模型构建单元,用于使用所述训练集对所述预测模型进行训练,使用所述测试集对训练完成的所述预测模型进行测试,构建所述裂纹预测模型。
可选的,所述数据预处理单元包括:
统计分析子单元,用于对所述目标样本集进行统计分析;
异常处理子单元,用于根据所述目标样本集的统计分析结果,对每个所述特征参数的生产数据进行异常处理,获取每个所述特征参数的规范数据,所述异常处理包括:判断所述特征参数的生产数据是否存在缺失值,若存在,则对所述缺失值进行数据插补;以及,判断所述特征参数的生产数据是否存在异常值,若存在,则对所述异常值进行数据修复;
重要特征参数提取子单元,用于使用皮尔逊系数,计算每个所述特征参数与板坯表面裂纹之间的线性关系,并根据所述线性关系,提取所述重要特征参数;
工艺特征参数构造子单元,用于结合冶金工艺规则,对每个所述特征参数进行线性组合,构造所述工艺特征参数;
规范数据获取子单元,用于获取所述重要特征参数的规范数据以及所述工艺特征参数的规范数据;
目标数据集生成子单元,用于根据所述重要特征参数的规范数据以及所述工艺特征参数的规范数据,生成所述目标数据集。
可选的,所述裂纹预测模型构建单元包括:
折分子单元,用于根据交叉验证法,将所述训练集折分为训练子集和验证子集;
训练子单元,用于使用所述训练子集和所述验证子集,对所述预测模型进行交叉训练。
可选的,所述装置还包括:
特征数据提取单元,用于在使用所述训练集对所述预测模型进行训练之前,从所述训练集中提取所述特征数据,所述特征数据包括正特征数据以及负特征数据,其中,所述正特征数据用于表示所述历史板坯的表面存在裂纹,所述负特征数据用于表示所述历史板坯的表面不存在裂纹;
比例判断单元,用于判断所述正特征数据与所述负特征数据的数量比例是否满足预设的比例;
重新采样单元,用于在判断结果为不满足时,按照所述预设的比例,从所述训练集中重新进行采样,获取用于训练所述预测模型的新的训练集。
可选的,所述装置还包括:
历史裂纹预测概率获取单元,用于在根据所述裂纹预测概率,生成所述当前板坯表面是否存在裂纹的预测结果之前,获取所述测试集对训练完成的预测模型进行测试时,所述训练完成的预测模型所输出的历史裂纹预测概率;
概率分布统计单元,用于对所述历史裂纹预测概率进行概率分布统计,获取概率分布统计结果;
最佳阈值获取模块,用于使用最大类间方差法,获取用于划分所述概率分布统计结果的最佳阈值;
阈值设置模块,用于将所述最佳阈值设置为所述预设阈值。
可选的,所述预测结果生成模块包括:
概率判断单元,用于判断所述裂纹预测概率是否大于或等于预设阈值,所述预设阈值为所述最佳阈值;
第一结果生成单元,用于在判断结果为是时,生成所述当前板坯表面存在裂纹的预测结果;
第二结果生成单元,用于在判断结果为否时,生成所述当前板坯表面不存在裂纹的预测结果。
本申请涉及冶金自动控制技术领域,公开了一种板坯表面裂纹的预测方法及装置,在该方法中,预先使用历史板坯的关键生成数据,通过随机森林算法构建裂纹预测模型,然后获取当前板坯在生产过程中的关键参数数据,将当前板坯的关键生产数据输入至预先构建的裂纹预测模型中,获取裂纹预测模型输出的裂纹预测概率。根据所述裂纹预测概率,生成所述当前板坯表面是否存在裂纹的预测结果。相对于使用物理手段,本申请实施例公开的方法通过预先构建的模型,利用板坯生产过程中的数据,便可对板坯表面的裂纹实现预测,无需另外安装特定的检测设备,也就无需实施检测设备的日常维护工作,有效节约生产成本。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例公开的一种板坯表面裂纹的预测方法的工作流程示意图;
图2为本申请实施例公开的一种板坯表面裂纹的预测方法中,预先构建裂纹预测模型的工作流程示意图;
图3为本申请实施例公开的一种板坯表面裂纹的预测方法中,生成目标数据集的工作流程示意图;
图4为本申请实施例公开的一种板坯表面裂纹的预测方法中,根据裂纹预测概率生成预测结果的工作流程示意图;
图5为本申请实施例公开的一种板坯表面裂纹的预测装置的结构示意图。
具体实施方式
为了解决利用物理手段对板坯表面的裂纹进行预测,导致增加生产成本的问题,本申请通过以下实施例公开了一种板坯表面裂纹的预测方法及装置。
本申请第一实施例公开了一种板坯表面裂纹的预测方法,参见图1所示的工作流程示意图,该预测方法包括:
步骤S11,获取预先构建的裂纹预测模型,所述裂纹预测模型基于随机森林算法建立,并使用历史板坯的关键生产数据完成训练及测试,所述历史板坯的关键生产数据包括所述历史板坯在生产过程中的关键参数数据以及所述历史板坯的特征数据,其中,所述关键参数从所述历史板坯在生产过程中的多个特征参数中提取所得,所述特征参数为在生产过程中导致板坯表面形成裂纹的影响参数,所述特征数据用于表明所述历史板坯的表面是否存在裂纹。
根据钢厂实际生产数据进行统计分析,板坯的影响参数包括但不限于:钢种类别、热坯压力值、结晶器振动、结晶器锥度、结晶器底部总宽度实际值、结晶器入口水温最小值、结晶器入口水温最大值、铸机宽面活动侧温差最大值、铸机宽面活动侧流量、铸机宽面固定侧温差最小值、铸机宽面固定侧温差最大值、铸机宽面固定侧流量、铸机窄面右侧温差最小值以及钢中主要化学成分的含量(例如碳、锰、磷或硫等化学成分的含量)。可以看出,影响参数的种类多数量大,如果在裂纹预测模型构建的过程中,将所有影响参数的生产数据全部用来对模型的训练以及测试,将花费较多时间,甚至造成数据拟合的高维灾难,且有些影响参数对板坯的生产影响较小,使用这些参数对模型进行训练,将不利于模型拟合,降低模型精准度。
因此,本申请实施例中,从上述例举的板坯的影响参数中,提取出关键参数,对裂纹预测模型进行训练及测试,有效提高模型的精准度。其中,关键参数包括重要特征参数以及工艺特征参数。所述重要特征参数为在生产过程中导致板坯表面形成裂纹的重要影响因素,所述重要特征参数根据每个所述特征参数之间的线性关系,从多个特征参数中提取所得。所述工艺特征参数为根据冶金工艺规则,对多个所述特征参数进行线性组合所构造的参数。
需要说明的是,影响参数可能为类别型的变量,例如钢种类别等,也可能为数值型的变量,例如钢中主要化学成分的含量。因此提取关键参数时,需要针对类别型的变量进行相应的编码操作,例如平均数编码操作(一种针对高基数类别特征的数据处理方法),将类别型变量编码成计算机可理解的数字化形式。
步骤S12,获取当前板坯的关键生产数据,所述当前板坯的关键生产数据包括所述当前板坯在生产过程中的关键参数数据。
步骤S13,将所述当前板坯的关键生产数据输入至所述裂纹预测模型中,获取所述裂纹预测模型输出的裂纹预测概率。
步骤S14,根据所述裂纹预测概率,生成所述当前板坯表面是否存在裂纹的预测结果,其中,若所述裂纹预测概率大于或等于预设阈值,则生成所述当前板坯表面存在裂纹的预测结果。
在将构建的裂纹预测模型投入生产使用时,该模型只关注输入参数和输出参数,而将板坯的生产过程视为一个“黑箱”,只要输入板坯的关键生产数据,便会输出板坯表面存在裂纹的概率,即输出裂纹预测概率。根据裂纹预测概率,便能生成当前板坯表面是否存在裂纹的预测结果。
本申请上述实施例公开的一种板坯表面裂纹的预测方法,预先使用历史板坯的关键生成数据,通过随机森林算法构建裂纹预测模型,然后获取当前板坯在生产过程中的关键参数数据,将当前板坯的关键生产数据输入至预先构建的裂纹预测模型中,获取裂纹预测模型输出的裂纹预测概率。根据所述裂纹预测概率,生成所述当前板坯表面是否存在裂纹的预测结果。相对于使用物理手段,本申请实施例公开的方法通过预先构建的模型,利用板坯生产过程中的数据,便可对板坯表面的裂纹实现预测,无需另外安装特定的检测设备,也就无需实施检测设备的日常维护工作,有效节约生产成本。
进一步的,参见图2所示的工作流程示意图,构建所述裂纹预测模型的步骤包括:
步骤S101,采集所述历史板坯的生产数据,生成采样数据集,所述历史板坯的生产数据包括所述历史板坯在生产过程中的参数数据以及所述历史板坯的特征数据,所述参数数据包括所述历史板坯在生产过程中的多个特征参数的生产数据。
实际应用中,可以从钢厂的各类数据库表中采集历史板坯的生产数据,将数据整体合并在一个数据集中,生成采样数据集。
步骤S102,使用分层抽样法,对所述采样数据集进行划分抽样,获取目标样本集,所述目标样本集为训练样本集或测试样本集。
其中,分层抽样法是一种常用的数据统计方法,主要原理为从一个可以分成不同子总体(或称为层)的总体中,按规定的比例从不同层中随机抽取样品(个体)。本申请实施例中,通过对采样数据集进行分层抽样,将采样数据集划分为训练层和测试层,然后按照规定的比例从训练层随机抽取,获取训练样本集,从测试层随机抽取,获取测试样本集。
实际应用中,也可以通过时间点来对采样数据集进行划分抽样,例如将某一个月份设置为划分时间点,将这一个月的数据作为测试样本集,将这一个月之前的数据作为训练样本集。
步骤S103,对所述目标样本集进行数据预处理,从所述目标样本集中所包含的多个特征参数中提取关键参数,并根据所提取的关键参数的生产数据,生成目标数据集,所述目标数据集为训练集或测试集,其中所述训练集为针对所述训练样本集进行数据预处理所生成的目标数据集,所述测试集为针对所述测试样本集进行数据预处理所生成的目标数据集。
步骤S104,采用随机森林算法,建立预测模型。
随机森林对过拟合具有很强的鲁棒性,对于不平衡的数据集来说,它可以平衡误差,提高模型泛化能力。随机森林由大量独立的决策树组成,作为一个整体运行,每棵树都有一个类预测,投票最多的类将成为模型的预测,决策树对不同的数据集训练,使用的特征也不同,两种随机性构建多个不相关的决策树。
步骤S105,使用所述训练集对所述预测模型进行训练,使用所述测试集对训练完成的所述预测模型进行测试,构建所述裂纹预测模型。
其中,利用测试集对训练完成的预测模型进行测试时,可以采用评估指标,例如分类精度、混淆矩阵、精确率、召回率以及F1评分(精确率与召回率的调和平均数)等指标,来评判模型效果,以防模型出现过拟合。
当裂纹预测模型对新样本进行预测时,如果预测结果与实际铸坯质量不一致时,将其插入到训练集,对模型进行重新训练;如果预测结果与实际铸坯质量一致时,不将其作为新的训练样本。通过长期积累模型不断学习,保证裂纹预测模型的精确度。
进一步的,参见图3所示的工作流程示意图,步骤S103:对所述目标样本集进行数据预处理,从所述目标样本集中所包含的多个特征参数中提取关键参数,并根据所提取的关键参数的生产数据,生成目标数据集,包括以下实施步骤:
步骤S1031,对所述目标样本集进行统计分析。
为了实现检验目标数据集的数据质量、绘制图表、计算某些特征参数等后续操作,需要对目标数据集的结构和规律进行分析。本申请实施例中对目标样本集进行统计分析,包括基本的统计分析,例如对目标数据集的均值,最大值,最小值,方差,中位值等统计分析。
步骤S1032,根据所述目标样本集的统计分析结果,对每个所述特征参数的生产数据进行异常处理,获取每个所述特征参数的规范数据,所述异常处理包括:判断所述特征参数的生产数据是否存在缺失值,若存在,则对所述缺失值进行数据插补;以及,判断所述特征参数的生产数据是否存在异常值,若存在,则对所述异常值进行数据修复。
本申请实施例中,结合冶金经验和数学统计分析规则,对于生产数据中的缺失值,进行多维度分析后,采用数据(平均数、中位数)插补或直接删除的处理方法,针对生产数据中存在的未知异常值,可以采取直接删除的处理方法,以减少生产数据的数量,也可以进行异常值修复(数值填充)。通过上述方法做好数据规约,生成特征参数的规范数据,能够降低无效、错误数据对后续裂纹预测模型训练及测试的影响,提高模型的准确性。
另外,为了消除不同特征参数之间取值范围差异的影响,可以进一步对每个特征参数的规范数据进行处理,将其按照比例进行缩放,获取标准化的规范数据。
步骤S1033,使用皮尔逊系数,计算每个所述特征参数与板坯表面裂纹之间的线性关系,并根据所述线性关系,提取所述重要特征参数。
通过皮尔逊相关系数,能够估量特征参数与板坯表面裂纹之间的线性关系,根据该线性关系,便可提取重要特征参数。
另外,两个特征参数或两个以上特征参数之间存在相互影响制约的关系,本申请实施例中,对各个特征参数之间的相互关系进行估量,进而去除冗余的特征参数。
步骤S1034,结合冶金工艺规则,对每个所述特征参数进行线性组合,构造所述工艺特征参数。
结合冶金工艺规则,即引入现场工艺专家的经验规则,根据冶金工艺专家实验验证得到一些影响因素,能够构造新的工艺特征参数。具体的,通过以下几个实施例进行说明:
本申请实施例中,根据钢中主要化学成分的含量(例如碳、锰、磷或硫等化学成分的含量),通过对碳、锰或硫等化学成分的含量进行限定组合,构造钢种裂纹敏感性因子这一工艺特征参数,钢种裂纹敏感性因子的大小,可根据实际生产情况进行限定。
本申请实施例中,根据结晶器振动这一特征参数,构造结晶器振动总实际平均振幅这一工艺特征参数,结晶器振动总实际平均振幅的大小,可根据实际生产情况进行限定。
本申请实施例中,根据结晶器振动这一特征参数,通过获取结晶器振幅以及振动频率,构造折痕深度这一工艺特征参数,折痕深度的大小,可根据实际生产情况进行限定。
实际应用中,结合工艺冶金规则,所构造的工艺特征参数不限于上述几种,可以结合具体生产过程构造其他种类的工艺特征参数。
步骤S1035,获取所述重要特征参数的规范数据以及所述工艺特征参数的规范数据。
步骤S1036,根据所述重要特征参数的规范数据以及所述工艺特征参数的规范数据,生成所述目标数据集。
本申请实施例中,通过上述步骤S103所构建的一系列关键参数:重要特征参数以及工艺特征参数,所有特征参数加起来仍可能高达近百维,高维特征一方面可能会导致维数灾难,另一方面很容易导致模型过拟合。针对这一问题,可以通过特征选择来降低特征维度。比较高效的特征选择方法是基于学习模型的特征排序方法,在此,使用基于XGBoost机器学习算法来做特征选择,XGBoost机器学习算法能够将许多树模型集成在一起,形成一个很强的分类器。裂纹预测模型训练及测试的过程和特征选择的过程可以同时进行,利用XGBoost机器学习算法实现特征排序之后可以输出特征的重要性,据此我们可以保留重要性最高的n个特征,从而达到特征选择的目的。
进一步的,所述使用所述训练集对所述预测模型进行训练,包括:
根据交叉验证法,将所述训练集折分为训练子集和验证子集。
使用所述训练子集和所述验证子集,对所述预测模型进行交叉训练。
其中,k折交叉验证法是交叉验证法里一种,它是指将数据样本集分为k份,其中k-1份作为训练数据集,而另外的1份作为验证数据集。用验证数据集来验证所得分类器或者模型的错误率,一般需要循环k次,直到所有k份数据全部被选择一遍为止,将k次结果的均值作为最终训练结果,k折交叉验证法能够验证模型的鲁棒性,有效防止模型过拟合。
本申请实施例中,采用五折交叉验证法,将训练集折分五个子集,其中4个为训练子集,1个为验证子集。每次采用4个训练子集对预测模型进行训练,采用验证子集对预测模型进行验证,实现五折交叉训练,通过五折交叉训练得到5个结果,将5个结果的平均结果作为训练的最终结果。
进一步的,所述使用所述训练集对所述预测模型进行训练之前,所述方法还包括:
从所述训练集中提取所述特征数据,所述特征数据包括正特征数据以及负特征数据,其中,所述正特征数据用于表示所述历史板坯的表面存在裂纹,所述负特征数据用于表示所述历史板坯的表面不存在裂纹。
判断所述正特征数据与所述负特征数据的数量比例是否满足预设的比例。
若判断结果为不满足,则按照所述预设的比例,从所述训练集中重新进行采样,获取用于训练所述预测模型的新的训练集。
本申请实施例中,可以将特征数据设置为具体数值,例如将正特征数据设置为数值“1”,用于表示历史板坯的表面存在裂纹,将负特征数据设置为数值“0”,用于表示历史板坯的表面不存在裂纹。
实际应用中,板坯表面出现裂纹为少数情况,即有裂纹的板坯为少数类,无裂纹的板坯为多数类。这种情况下,正特征数据与负特征数据的数量比例十分不平衡,例如训练集中存在10000条数据,其中负特征数据与正特征数据的数量比例可能为9900:100,采用这样的训练集对预测模型进行训练,将无法保证模型的精确度。
因此,需要针对不平衡的训练集进行重新采样,采样方法包括欠采样以及过采样,其中欠采样就是减少多数类数据的采集数量,过采样方法就是增加少数类数据的采集数量,依此按预设的比列(如100:100或其它预设的比例)进行采样,将得到新的数据集作为新的训练集,进行预测模型的训练。
需要说明的是,如果正特征数据与负特征数据的数量比例是满足预设的比例,则无需进行重新采样。
进一步的,所述根据所述裂纹预测概率,生成所述当前板坯表面是否存在裂纹的预测结果之前,所述方法还包括:
获取所述测试集对训练完成的预测模型进行测试时,所述训练完成的预测模型所输出的历史裂纹预测概率。
对所述历史裂纹预测概率进行概率分布统计,获取概率分布统计结果。
使用最大类间方差法,获取用于划分所述概率分布统计结果的最佳阈值。
将所述最佳阈值设置为所述预设阈值。
本申请实施例中,针对裂纹预测概率,通过二分类判定它属于哪一类,即要判定有无裂纹。通常裂纹预测概率大于0.5,即判定存在裂纹,这种情况下,0.5就是一个默认阈值。
实际应用中,我们所处理的二分类,存在两个类别:0(无裂纹)和1(有裂纹),使用默认阈值0.5可能不合理,因为它对少数类不利,例如得到裂纹预测概率值为0.35,理论上则判定为0(无裂纹),但在测试集上分析可得该样本实际属于有裂纹,这种情况下模型分类错误,因此,需要根据具体生产情况修改这个默认阈值,将其调整为最佳阈值。
调整最佳阈值时,首先对历史裂纹预测概率进行概率分布统计,获取两个类别的概率分布图,并结合实际生产情况,使用最大类间方差法划分所述概率分布统计结果,从而过度有裂纹“1”这一标签。其中,最大类间方差法是一种自适应阈值方法,其思想源于图像灰度二分,它为了确定最终的阈值,使0类别和1类别两类概率值的方差最大化。
本申请实施例中,将最佳阈值设置为0.1-0.3区间的任一数值,实现了0(无裂纹)类别概率和1(有裂纹)类别概率到该阈值的方差最大化。
进一步的,参见图4所示的工作流程示意图,步骤S14:根据所述裂纹预测概率,生成所述当前板坯表面是否存在裂纹的预测结果,包括以下实施步骤:
步骤S141,判断所述裂纹预测概率是否大于或等于预设阈值,所述预设阈值为所述最佳阈值,其中,若判断结果为是,则执行步骤S142,若判断结果为否,则执行步骤S143。
步骤S142,生成所述当前板坯表面存在裂纹的预测结果。
步骤S143,生成所述当前板坯表面不存在裂纹的预测结果。
本申请实施例中,当最佳阈值为0.3时,若裂纹预测概率大于或等于0.3,则生成所述当前板坯表面存在裂纹的预测结果,即判定该概率属于1(有裂纹)类别;若裂纹预测概率小于0.3,则生成所述当前板坯表面不存在裂纹的预测结果,即判定该概率属于0(无裂纹)类别。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
本申请第二实施例公开了一种板坯表面裂纹的预测装置,所述预测装置应用于本申请第一实施例所公开的一种板坯表面裂纹的预测方法,参见图5所示的结构示意图,所述预测装置包括:
模型获取模块10,用于获取预先构建的裂纹预测模型,所述裂纹预测模型基于随机森林算法建立,并使用历史板坯的关键生产数据完成训练及测试,所述历史板坯的关键生产数据包括所述历史板坯在生产过程中的关键参数数据以及所述历史板坯的特征数据,其中,所述关键参数从所述历史板坯在生产过程中的多个特征参数中提取所得,所述特征参数为在生产过程中导致板坯表面形成裂纹的影响参数,所述特征数据用于表明所述历史板坯的表面是否存在裂纹。
当前数据采集模块20,用于获取当前板坯的关键生产数据,所述当前板坯的关键生产数据包括所述当前板坯在生产过程中的关键参数数据。
裂纹预测概率获取模块30,用于将所述当前板坯的关键生产数据输入至所述裂纹预测模型中,获取所述裂纹预测模型输出的裂纹预测概率。
预测结果生成模块40,用于根据所述裂纹预测概率,生成所述当前板坯表面是否存在裂纹的预测结果,其中,若所述裂纹预测概率大于或等于预设阈值,则生成所述当前板坯表面存在裂纹的预测结果。
进一步的,所述装置还包括模型构建模块,所述模型构建模块用于预先构建所述裂纹预测模型,所述模型构建模块包括:
历史数据采集单元,用于采集所述历史板坯的生产数据,生成采样数据集,所述历史板坯的生产数据包括所述历史板坯在生产过程中的参数数据以及所述历史板坯的特征数据,所述参数数据包括所述历史板坯在生产过程中的多个特征参数的生产数据。
数据划分抽样单元,用于对所述采样数据集进行划分抽样,获取目标样本集,所述目标样本集为训练样本集或测试样本集。
数据预处理单元,用于对所述目标样本集进行数据预处理,从所述目标样本集中所包含的多个特征参数中提取关键参数,并根据所提取的关键参数的生产数据,生成目标数据集,所述目标数据集为训练集或测试集,其中所述训练集为针对所述训练样本集进行数据预处理所生成的目标数据集,所述测试集为针对所述测试样本集进行数据预处理所生成的目标数据集。
预测模型建立单元,用于采用随机森林算法,建立预测模型。
裂纹预测模型构建单元,用于使用所述训练集对所述预测模型进行训练,使用所述测试集对训练完成的所述预测模型进行测试,构建所述裂纹预测模型。
进一步的,所述数据预处理单元包括:
统计分析子单元,用于对所述目标样本集进行统计分析。
异常处理子单元,用于根据所述目标样本集的统计分析结果,对每个所述特征参数的生产数据进行异常处理,获取每个所述特征参数的规范数据,所述异常处理包括:判断所述特征参数的生产数据是否存在缺失值,若存在,则对所述缺失值进行数据插补;以及,判断所述特征参数的生产数据是否存在异常值,若存在,则对所述异常值进行数据修复。
重要特征参数提取子单元,用于使用皮尔逊系数,计算每个所述特征参数与板坯表面裂纹之间的线性关系,并根据所述线性关系,提取所述重要特征参数。
工艺特征参数构造子单元,用于结合冶金工艺规则,对每个所述特征参数进行线性组合,构造所述工艺特征参数。
规范数据获取子单元,用于获取所述重要特征参数的规范数据以及所述工艺特征参数的规范数据。
目标数据集生成子单元,用于根据所述重要特征参数的规范数据以及所述工艺特征参数的规范数据,生成所述目标数据集。
进一步的,所述裂纹预测模型构建单元包括:
折分子单元,用于根据交叉验证法,将所述训练集折分为训练子集和验证子集。
训练子单元,用于使用所述训练子集和所述验证子集,对所述预测模型进行交叉训练。
进一步的,所述装置还包括:
特征数据提取单元,用于在使用所述训练集对所述预测模型进行训练之前,从所述训练集中提取所述特征数据,所述特征数据包括正特征数据以及负特征数据,其中,所述正特征数据用于表示所述历史板坯的表面存在裂纹,所述负特征数据用于表示所述历史板坯的表面不存在裂纹。
比例判断单元,用于判断所述正特征数据与所述负特征数据的数量比例是否满足预设的比例。
重新采样单元,用于在判断结果为不满足时,按照所述预设的比例,从所述训练集中重新进行采样,获取用于训练所述预测模型的新的训练集。
进一步的,所述装置还包括:
历史裂纹预测概率获取单元,用于在根据所述裂纹预测概率,生成所述当前板坯表面是否存在裂纹的预测结果之前,获取所述测试集对训练完成的预测模型进行测试时,所述训练完成的预测模型所输出的历史裂纹预测概率。
概率分布统计单元,用于对所述历史裂纹预测概率进行概率分布统计,获取概率分布统计结果。
最佳阈值获取模块,用于使用最大类间方差法,获取用于划分所述概率分布统计结果的最佳阈值。
阈值设置模块,用于将所述最佳阈值设置为所述预设阈值。
进一步的,所述预测结果生成模块包括:
概率判断单元,用于判断所述裂纹预测概率是否大于或等于预设阈值,所述预设阈值为所述最佳阈值。
第一结果生成单元,用于在判断结果为是时,生成所述当前板坯表面存在裂纹的预测结果。
第二结果生成单元,用于在判断结果为否时,生成所述当前板坯表面不存在裂纹的预测结果。
以上结合具体实施方式和范例性实例对本申请进行了详细说明,不过这些说明并不能理解为对本申请的限制。本领域技术人员理解,在不偏离本申请精神和范围的情况下,可以对本申请技术方案及其实施方式进行多种等价替换、修饰或改进,这些均落入本申请的范围内。本申请的保护范围以所附权利要求为准。
Claims (9)
1.一种板坯表面裂纹的预测方法,其特征在于,包括:
获取预先构建的裂纹预测模型,所述裂纹预测模型基于随机森林算法建立,并使用历史板坯的关键生产数据完成训练及测试,所述历史板坯的关键生产数据包括所述历史板坯在生产过程中关键参数对应的数据以及所述历史板坯的特征数据,其中,所述关键参数从所述历史板坯在生产过程中的多个特征参数中提取所得,所述特征参数为在生产过程中导致板坯表面形成裂纹的影响参数,所述特征数据用于表明所述历史板坯的表面是否存在裂纹;
获取当前板坯的关键生产数据,所述当前板坯的关键生产数据包括所述当前板坯在生产过程中关键参数对应的数据;
将所述当前板坯的关键生产数据输入至所述裂纹预测模型中,获取所述裂纹预测模型输出的裂纹预测概率;
根据所述裂纹预测概率,生成所述当前板坯表面是否存在裂纹的预测结果,其中,若所述裂纹预测概率大于或等于预设阈值,则生成所述当前板坯表面存在裂纹的预测结果;
所述关键参数包括重要特征参数以及工艺特征参数;
其中,所述重要特征参数为在生产过程中导致板坯表面形成裂纹的重要影响因素,所述重要特征参数为使用皮尔逊系数计算每个所述特征参数与板坯表面裂纹之间的线性关系,并根据所述线性关系,从多个特征参数中提取所得;
所述工艺特征参数为引入现场工艺专家的经验规则,对多个所述特征参数进行线性组合所构造的参数。
2.根据权利要求1所述的方法,其特征在于,构建所述裂纹预测模型的步骤包括:
采集所述历史板坯的生产数据,生成采样数据集,所述历史板坯的生产数据包括所述历史板坯在生产过程中的参数数据以及所述历史板坯的特征数据,所述参数数据包括所述历史板坯在生产过程中的多个特征参数的生产数据;
使用分层抽样法,对所述采样数据集进行划分抽样,获取目标样本集,所述目标样本集为训练样本集或测试样本集;
对所述目标样本集进行数据预处理,从所述目标样本集中所包含的多个特征参数中提取关键参数,并根据所提取的关键参数的生产数据,生成目标数据集,所述目标数据集为训练集或测试集,其中所述训练集为针对所述训练样本集进行数据预处理所生成的目标数据集,所述测试集为针对所述测试样本集进行数据预处理所生成的目标数据集;
采用随机森林算法,建立预测模型;
使用所述训练集对所述预测模型进行训练,使用所述测试集对训练完成的所述预测模型进行测试,构建所述裂纹预测模型。
3.根据权利要求2所述的方法,其特征在于,所述对所述目标样本集进行数据预处理,从所述目标样本集中所包含的多个特征参数中提取关键参数,并根据所提取的关键参数的生产数据,生成目标数据集,包括:
对所述目标样本集进行统计分析;
根据所述目标样本集的统计分析结果,对每个所述特征参数的生产数据进行异常处理,获取每个所述特征参数的规范数据,所述异常处理包括:判断所述特征参数的生产数据是否存在缺失值,若存在,则对所述缺失值进行数据插补;以及,判断所述特征参数的生产数据是否存在异常值,若存在,则对所述异常值进行数据修复;
使用皮尔逊系数,计算每个所述特征参数与板坯表面裂纹之间的线性关系,并根据所述线性关系,提取所述重要特征参数;
结合冶金工艺规则,对每个所述特征参数进行线性组合,构造所述工艺特征参数;
获取所述重要特征参数的规范数据以及所述工艺特征参数的规范数据;
根据所述重要特征参数的规范数据以及所述工艺特征参数的规范数据,生成所述目标数据集。
4.根据权利要求2所述的方法,其特征在于,所述使用所述训练集对所述预测模型进行训练,包括:
根据交叉验证法,将所述训练集折分为训练子集和验证子集;
使用所述训练子集和所述验证子集,对所述预测模型进行交叉训练。
5.根据权利要求2所述的方法,其特征在于,所述使用所述训练集对所述预测模型进行训练之前,所述方法还包括:
从所述训练集中提取所述特征数据,所述特征数据包括正特征数据以及负特征数据,其中,所述正特征数据用于表示所述历史板坯的表面存在裂纹,所述负特征数据用于表示所述历史板坯的表面不存在裂纹;
判断所述正特征数据与所述负特征数据的数量比例是否满足预设的比例;
若判断结果为不满足,则按照所述预设的比例,从所述训练集中重新进行采样,获取用于训练所述预测模型的新的训练集。
6.根据权利要求2所述的方法,其特征在于,所述根据所述裂纹预测概率,生成所述当前板坯表面是否存在裂纹的预测结果之前,所述方法还包括:
获取所述测试集对训练完成的预测模型进行测试时,所述训练完成的预测模型所输出的历史裂纹预测概率;
对所述历史裂纹预测概率进行概率分布统计,获取概率分布统计结果;
使用最大类间方差法,获取用于划分所述概率分布统计结果的最佳阈值;
将所述最佳阈值设置为所述预设阈值。
7.根据权利要求6所述的方法,其特征在于,所述根据所述裂纹预测概率,生成所述当前板坯表面是否存在裂纹的预测结果,包括:
判断所述裂纹预测概率是否大于或等于预设阈值,所述预设阈值为所述最佳阈值;
其中,若判断结果为是,则生成所述当前板坯表面存在裂纹的预测结果;
若判断结果为否,则生成所述当前板坯表面不存在裂纹的预测结果。
8.一种板坯表面裂纹的预测装置,其特征在于,所述预测装置应用于权利要求1-7任一项所述的一种板坯表面裂纹的预测方法,所述预测装置包括:
模型获取模块,用于获取预先构建的裂纹预测模型,所述裂纹预测模型基于随机森林算法建立,并使用历史板坯的关键生产数据完成训练及测试,所述历史板坯的关键生产数据包括所述历史板坯在生产过程中关键参数对应的数据以及所述历史板坯的特征数据,其中,所述关键参数从所述历史板坯在生产过程中的多个特征参数中提取所得,所述特征参数为在生产过程中导致板坯表面形成裂纹的影响参数,所述特征数据用于表明所述历史板坯的表面是否存在裂纹;
当前数据采集模块,用于获取当前板坯的关键生产数据,所述当前板坯的关键生产数据包括所述当前板坯在生产过程中关键参数对应的数据;
裂纹预测概率获取模块,用于将所述当前板坯的关键生产数据输入至所述裂纹预测模型中,获取所述裂纹预测模型输出的裂纹预测概率;
预测结果生成模块,用于根据所述裂纹预测概率,生成所述当前板坯表面是否存在裂纹的预测结果,其中,若所述裂纹预测概率大于或等于预设阈值,则生成所述当前板坯表面存在裂纹的预测结果;
所述关键参数包括重要特征参数以及工艺特征参数;
其中,所述重要特征参数为在生产过程中导致板坯表面形成裂纹的重要影响因素,所述重要特征参数为使用皮尔逊系数计算每个所述特征参数与板坯表面裂纹之间的线性关系,并根据所述线性关系,从多个特征参数中提取所得;
所述工艺特征参数为引入现场工艺专家的经验规则,对多个所述特征参数进行线性组合所构造的参数。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括模型构建模块,所述模型构建模块用于预先构建所述裂纹预测模型,所述模型构建模块包括:
历史数据采集单元,用于采集所述历史板坯的生产数据,生成采样数据集,所述历史板坯的生产数据包括所述历史板坯在生产过程中的参数数据以及所述历史板坯的特征数据,所述参数数据包括所述历史板坯在生产过程中的多个特征参数的生产数据;
数据划分抽样单元,用于对所述采样数据集进行划分抽样,获取目标样本集,所述目标样本集为训练样本集或测试样本集;
数据预处理单元,用于对所述目标样本集进行数据预处理,从所述目标样本集中所包含的多个特征参数中提取关键参数,并根据所提取的关键参数的生产数据,生成目标数据集,所述目标数据集为训练集或测试集,其中所述训练集为针对所述训练样本集进行数据预处理所生成的目标数据集,所述测试集为针对所述测试样本集进行数据预处理所生成的目标数据集;
预测模型建立单元,用于采用随机森林算法,建立预测模型;
裂纹预测模型构建单元,用于使用所述训练集对所述预测模型进行训练,使用所述测试集对训练完成的所述预测模型进行测试,构建所述裂纹预测模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910913079.XA CN110619691B (zh) | 2019-09-25 | 2019-09-25 | 一种板坯表面裂纹的预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910913079.XA CN110619691B (zh) | 2019-09-25 | 2019-09-25 | 一种板坯表面裂纹的预测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110619691A CN110619691A (zh) | 2019-12-27 |
CN110619691B true CN110619691B (zh) | 2021-07-06 |
Family
ID=68924696
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910913079.XA Active CN110619691B (zh) | 2019-09-25 | 2019-09-25 | 一种板坯表面裂纹的预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110619691B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112077273B (zh) * | 2020-09-18 | 2022-03-01 | 马鞍山钢铁股份有限公司 | 一种拉速变动的板坯质量判定评价系统及方法 |
CN112308127A (zh) * | 2020-10-28 | 2021-02-02 | 北京百度网讯科技有限公司 | 用于处理数据的方法、装置、设备以及存储介质 |
CN115249521A (zh) * | 2022-07-22 | 2022-10-28 | 南京理工大学 | 一种考虑多尺度特征的TiAl合金疲劳裂纹扩展速率预测方法 |
CN116721354B (zh) * | 2023-08-08 | 2023-11-21 | 中铁七局集团电务工程有限公司武汉分公司 | 一种建筑物裂纹缺陷识别方法、系统及可读存储介质 |
CN117972317B (zh) * | 2024-03-29 | 2024-06-14 | 中国民用航空飞行学院 | 一种面向飞行员胜任能力的韧性画像方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102319883A (zh) * | 2011-10-09 | 2012-01-18 | 北京首钢自动化信息技术有限公司 | 一种连铸坯质量在线预报的控制方法 |
CN108334890A (zh) * | 2017-01-19 | 2018-07-27 | 欧姆龙株式会社 | 预测模型生成装置、生产设备监视系统及其方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8155820B2 (en) * | 2008-03-10 | 2012-04-10 | Eklund Neil H | Method, apparatus and computer program product for predicting and avoiding a fault |
US20180260720A1 (en) * | 2017-03-13 | 2018-09-13 | General Electric Company | Fatigue Crack Growth Prediction |
-
2019
- 2019-09-25 CN CN201910913079.XA patent/CN110619691B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102319883A (zh) * | 2011-10-09 | 2012-01-18 | 北京首钢自动化信息技术有限公司 | 一种连铸坯质量在线预报的控制方法 |
CN108334890A (zh) * | 2017-01-19 | 2018-07-27 | 欧姆龙株式会社 | 预测模型生成装置、生产设备监视系统及其方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110619691A (zh) | 2019-12-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110619691B (zh) | 一种板坯表面裂纹的预测方法及装置 | |
CN111882446B (zh) | 一种基于图卷积网络的异常账户检测方法 | |
CN108304567B (zh) | 高压变压器工况模式识别与数据分类方法及系统 | |
CN113901977A (zh) | 一种基于深度学习的电力用户窃电识别方法及系统 | |
CN109034140A (zh) | 基于深度学习结构的工业控制网络信号异常检测方法 | |
CN111177655B (zh) | 一种数据处理方法、装置及电子设备 | |
CN114185760A (zh) | 系统风险评估方法及装置、充电设备运维检测方法 | |
CN116468160A (zh) | 基于生产大数据的铝合金压铸件质量预测方法 | |
CN114169424A (zh) | 基于k近邻回归算法和用电数据的排污量预测方法 | |
CN115098962A (zh) | 一种基于隐半马尔夫模型的机械设备退化态下剩余寿命的预测方法 | |
CN112686749A (zh) | 一种基于逻辑回归技术的信用风险评估方法及装置 | |
CN111275338A (zh) | 一种企业欺诈行为的判定方法、装置、设备及存储介质 | |
CN111402236A (zh) | 一种基于图像灰度值的热轧带钢表面缺陷分级方法 | |
CN116861369A (zh) | 工业互联网异构数据融合的空压机健康评估方法及系统 | |
CN116204825A (zh) | 一种基于数据驱动的生产线设备故障检测方法 | |
CN117233347B (zh) | 一种碳钢球化等级测量方法、系统及设备 | |
CN117408519A (zh) | 基于深度学习算法的化工反应过程风险预警方法及装置 | |
CN111062118B (zh) | 一种基于神经网络预测分层的多层软测量建模系统及方法 | |
Shantz | Uncertainty quantification in crack growth modeling under multi-axial variable amplitude loading | |
Weeraddana et al. | Utilizing machine learning to prevent water main breaks by understanding pipeline failure drivers | |
Katam et al. | SVM-assisted damage identification in cantilever steel beam using vibration-based method | |
Olsen et al. | Predicting dactyloscopic examiner fingerprint image quality assessments | |
CN117236971B (zh) | 多工况排放数据造假检测方法、装置及系统和存储介质 | |
CN117076454B (zh) | 一种工程质量验收表单数据结构化存储方法及系统 | |
CN117893100B (zh) | 基于卷积神经网络的质量评价数据更新模型的构建方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20220421 Address after: 5 / F, building A5, No. 9, Kechuang Avenue, Zhongshan Science Park, Liuhe District, Nanjing City, Jiangsu Province Patentee after: JIANGSU JINHENG INFORMATION TECHNOLOGY Co.,Ltd. Address before: Room 201, unit 1, building 527, Fukang Park, 399 Xiongzhou South Road, Longchi street, Liuhe District, Nanjing City, Jiangsu Province, 211500 Patentee before: Nanjing Tianxin Cloud Data Service Co.,Ltd. |