CN111814385A - 预测加工件质量的方法、装置和计算机设备 - Google Patents

预测加工件质量的方法、装置和计算机设备 Download PDF

Info

Publication number
CN111814385A
CN111814385A CN202010469626.2A CN202010469626A CN111814385A CN 111814385 A CN111814385 A CN 111814385A CN 202010469626 A CN202010469626 A CN 202010469626A CN 111814385 A CN111814385 A CN 111814385A
Authority
CN
China
Prior art keywords
model
xgboost
sample data
neural network
deep learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010469626.2A
Other languages
English (en)
Other versions
CN111814385B (zh
Inventor
林宏达
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202010469626.2A priority Critical patent/CN111814385B/zh
Priority to PCT/CN2020/099475 priority patent/WO2021143067A1/zh
Publication of CN111814385A publication Critical patent/CN111814385A/zh
Application granted granted Critical
Publication of CN111814385B publication Critical patent/CN111814385B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Geometry (AREA)
  • Computer Hardware Design (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • General Factory Administration (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及医疗领域,揭示了预测加工件质量的方法,包括:判断当前待分析数据是否含有瑕疵加工件的质量参数对应的标志特征;若是,则将当前待分析数据输入预测模型中进行预测分析,其中,预测模型至少包括Xgboost模型、RandomForest模型和深度学习神经网络模型中的两种,Xgboost模型通过线性回归模型进行了修正调整;按照预设方法对Xgboost模型、RandomForest模型和深度学习神经网络模型中的至少两种模型的分析结果进行汇总处理,得到汇总结果;根据汇总结果判断当前待分析数据对应的加工件质量不达标的几率。依据Xgboost模型的特征以及质量预测时的稀疏数据特征,设计了Xgboost模型的损失函数,使Xgboost模型更适用于稀疏数据的特征分析,使预测医疗领域加工件质量的方法得到工业化适用。

Description

预测加工件质量的方法、装置和计算机设备
技术领域
本申请涉及到医疗领域,特别是涉及到预测加工件质量的方法、装置和计算机设备。
背景技术
医疗领域的加工件种类繁多,包括诊断类的医疗器械上的加工件和治疗类的医疗器械上的加工件,质量精度要求都比较高。上述各加工件的质量预估需要参考的因素也多,现有预测加工件质量是否达标,或加工件是否有瑕疵缺陷不够准确,需要借助专业的质量评审员评审,不仅需要评审人对加工件进行各种相关检查,导致耗时长,且不能够进行工业化普遍推广。
发明内容
本申请的主要目的为提供预测加工件质量的方法,旨在解决现有预测加工件质量的方法不能够进行工业化普遍推广技术问题。
本申请提出一种预测加工件质量的方法,包括:
判断当前待分析数据是否含有瑕疵加工件的质量参数对应的标志特征;
若是,则将所述当前待分析数据输入预测模型中进行预测分析,其中,所述预测模型至少包括Xgboost模型、RandomForest模型和深度学习神经网络模型中的两种,所述Xgboost模型通过线性回归模型进行了修正调整;
按照预设方法对所述Xgboost模型、RandomForest模型和深度学习神经网络模型中的至少两种模型的分析结果进行汇总处理,得到汇总结果;
根据所述汇总结果判断所述当前待分析数据对应的加工件质量不达标的几率。
优选地,所述Xgboost模型的损失函数依据对数最大相似性构建得到,所述判断当前待分析数据是否含有瑕疵加工件的质量参数对应的标志特征的步骤之前,包括:
以损失函数梯度矩阵的二维范数
Figure BDA0002513853040000011
为基准,运用线性回归模型构成所述Xgboost模型的目标函数
Figure BDA0002513853040000021
其中,所述损失函数为
Figure BDA0002513853040000022
y是指真实的结果,x是指输入的样本数据,θ是指Xgboost模型中各函数权重,P(|)是条件概率,ω为线性回归模型中每个变量的权重,J(ω;X,y)是Xgboost模型通过输入样本数据得到的预测结果和实际结果之间的差值,α为权重向量配置比例;
根据所述目标函数对所述Xgboost模型的梯度进行梯度优化,其中,梯度优化的优化方向为
Figure BDA0002513853040000023
X是指输入的样本数据,ω为线性回归模型中每个变量的权重,J(ω;X,y)是Xgboost模型通过输入样本数据得到的预测结果和实际结果之间的差值,α为权重向量配置比例;
将预处理后的样本数据输入到进行梯度优化的所述Xgboost模型中进行训练,以确定优化后的所述Xgboost模型的学习参数。
优选地,所述深度学习神经网络模型包括放大层、解构层和学习层,所述判断当前待分析数据是否含有瑕疵加工件的质量参数对应的标志特征的步骤之前,包括:
选择构建元素分别构建所述深度学习神经网络模型的放大层、解构层和学习层,其中,所述放大层包括多层依次累积的隐藏层,所述解构层包括多层依次连接的卷积层,所述学习层包括多层依次累积的隐藏层;
依次连接所述放大层、解构层和学习层形成所述深度学习神经网络模型;
将预处理后的样本数据输入到所述深度学习神经网络模型,以确定所述深度学习神经网络模型的模型参数。
优选地,所述将预处理后的样本数据输入到进行梯度优化的所述Xgboost模型中进行训练,以确定优化后的所述Xgboost模型的学习参数的步骤之前,或将预处理后的样本数据输入到所述深度学习神经网络模型,以确定所述深度学习神经网络模型的模型参数的步骤之前,包括:
判断是否接收到对所述预处理后的样本数据的修正指令;
若是,则将所述预处理后的样本数据按照区域选择指令进行局部放大显示,其中,所述区域选择指令根据用户点击屏幕时的映射区域发出并显示在所述映射区域的样本数据处,所述区域选择指令至少包括添加和删除;
根据接收到的所述区域选择指令的类型,对所述映射区域对应的样本数据进行修正;
将修正后的样本数据的显示状态恢复至局部放大显示前的状态。
优选地,所述按照预设方法对所述Xgboost模型、RandomForest模型和深度学习神经网络模型中的至少两种模型的分析结果进行汇总处理,得到汇总结果的步骤,包括:
将所述当前待分析数据分别输入至所述Xgboost模型、RandomForest模型和深度学习神经网络模型后,分别得到的分析结果;
将各所述分析结果对应的矩阵数据,按照所述Xgboost模型、RandomForest模型和深度学习神经网络模型分别对应的权重,进行加权平均得到所述汇总结果。
优选地,将各所述分析结果对应的矩阵数据,按照所述Xgboost模型、RandomForest模型和深度学习神经网络模型分别对应的权重,进行加权平均得到所述汇总结果的步骤之前,包括:
将携带标签的样本数据,分别输入到所述Xgboost模型、RandomForest模型和深度学习神经网络模型中进行训练;
获取所述Xgboost模型、RandomForest模型和深度学习神经网络模型分别对所述携带标签的样本数据的反馈结果;
根据各所述反馈结果以及携带标签的赋值,通过线性回归模型,计算所述Xgboost模型、RandomForest模型和深度学习神经网络模型分别对应的权重。
本申请还提供了一种预测加工件质量的装置,包括:
第一判断模块,用于判断当前待分析数据是否含有瑕疵加工件的质量参数对应的标志特征;
输入模块,用于若当前待分析数据含有瑕疵加工件的质量参数对应的标志特征,则将所述当前待分析数据输入预测模型中进行预测分析,其中,所述预测模型至少包括Xgboost模型、RandomForest模型和深度学习神经网络模型中的两种,所述Xgboost模型通过线性回归模型进行了修正调整;
汇总模块,用于按照预设方法对所述Xgboost模型、RandomForest模型和深度学习神经网络模型中的至少两种模型的分析结果进行汇总处理,得到汇总结果;
第二判断模块,用于根据所述汇总结果判断所述当前待分析数据对应的加工件质量不达标的几率。
优选地,所述Xgboost模型的损失函数依据对数最大相似性构建得到,装置包括:
构成模块,用于以损失函数梯度矩阵的二维范数
Figure BDA0002513853040000041
为基准,运用线性回归模型构成所述Xgboost模型的目标函数
Figure BDA0002513853040000042
其中,所述损失函数为
Figure BDA0002513853040000043
y是指真实的结果,x是指输入的样本数据,θ是指Xgboost模型中各函数权重,P(|)是条件概率,ω为线性回归模型中每个变量的权重,J(ω;X,y)是Xgboost模型通过输入样本数据得到的预测结果和实际结果之间的差值,α为权重向量配置比例;
优化模块,用于根据所述目标函数对所述Xgboost模型的梯度进行梯度优化,其中,梯度优化的优化方向为
Figure BDA0002513853040000044
X是指输入的样本数据,ω为线性回归模型中每个变量的权重,J(ω;X,y)是Xgboost模型通过输入样本数据得到的预测结果和实际结果之间的差值,α为权重向量配置比例;
训练模块,用于将预处理后的样本数据输入到进行梯度优化的所述Xgboost模型中进行训练,以确定优化后的所述Xgboost模型的学习参数。
本申请还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。
本申请依据Xgboost模型的特征以及Xgboost模型用于加工件质量预测时的稀疏数据特征,设计了Xgboost模型的损失函数,以通过将对数最大相似性作为损失函数,并通过线性回归进行修正,使Xgboost模型更适用于稀疏数据的特征分析,使预测加工件质量的方法能够进行工业化普遍推广。通过将Random Forest模型、深度学习神经网络模型以及修正后的Xgboost模型分别通过预处理后的特征数据各自训练后,通过将待测数据样本分别输入到上述三模型中进行分析,得到三个分析结果,通过stacking模型融合上述三个结果,实现对样本数据对应加工件的质量预测,改变数据的稀疏特征对模型的不良影响。
附图说明
图1本申请一实施例的预测加工件质量的方法流程示意图;
图2本申请一实施例的预测加工件质量的装置结构示意图;
图3本申请一实施例的计算机设备内部结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
参照图1,本申请一实施例的预测加工件质量的方法,包括:
S1:判断当前待分析数据是否含有瑕疵加工件的质量参数对应的标志特征;
S2:若是,则将所述当前待分析数据输入预测模型中进行预测分析,其中,所述预测模型至少包括Xgboost模型、RandomForest模型和深度学习神经网络模型中的两种,所述Xgboost模型通过线性回归模型进行了修正调整;
S3:按照预设方法对所述Xgboost模型、RandomForest模型和深度学习神经网络模型中的至少两种模型的分析结果进行汇总处理,得到汇总结果;
S4:根据所述汇总结果判断所述当前待分析数据对应的加工件质量不达标的几率。
本实施例的当前待分析数据为加工件的特征数据,包括高度、宽度、长度、重量、密度、色彩均一度、表面平整度、硬度等产品特征数据,以及生产时间、生产环境参数、原料批次等加工信息特征数据。通过判断当前待分析数据中是否含有瑕疵加工件的质量参数对应的标志特征,当前待分析数据中含有瑕疵加工件的质量参数分别对应的标志特征时,则会触发预测模型进行预测分析。上述瑕疵加工件的质量参数包含于加工件的特征数据。比如加工件的密度对其质量达标的影响最大,则搜索当前待分析数据是否包括密度低的标志特征,若存在密度低的标志特征,则认为存在加工件质量不达标的风险,则会触发预设模型对所有特征数据进行分析预测。上述瑕疵加工件的质量参数相关联的标志特征除密度低外,还包括表面不平整、色彩不均一、尺寸不达标等,根据待测的加工件的质量要求不同而不同。比如,机密的小型齿轮加工工件,对其强度有非常高的要求,但是特殊的强度检测设备在检查完这个齿轮之后就会报废齿轮,所以需要通过小型齿轮的长、宽、高、重量和热力学成像等特征数据来判断齿轮的强度是否达标。
由于本实施例的模型训练中的样本数据为成千上万的加工件数据,瑕疵加工件占少数,表现为数据结构特征为稀疏特征,即多数数据赋值为零,导致模型训练时无法体现数据区分度,影响模型训练的区别分析效果。本实施例的Xgboost模型经过特定的修正过程,使其满足对稀疏数据的区别分析,深度学习神经网络模型通过设计特定的构建结构使满足对稀疏数据的区别分析。然后根据stacking模型对上述Xgboost模型、RandomForest模型和深度学习神经网络模型中的至少两种模型的分析结果进行融合处理,以突出机器学习模型的主体结果,同时对于机器学习模型的错误分析内容进行深度学习修正。本实施例为上述三种模型同时并行对当前待分析数据分别进行分析后,再融合分析。上述融合结果即对当前待分析数据的风险得分评价,得分越高说明当前待分析数据预示的加工件质量不达标的几率大。依据Xgboost模型的特征以及Xgboost模型用于加工件质量预测时的稀疏数据特征,设计了Xgboost模型的损失函数,以通过将对数最大相似性作为损失函数,并通过线性回归进行修正,使Xgboost模型更适用于稀疏数据的特征分析,使预测加工件质量的方法能够进行工业化普遍推广。通过将Random Forest模型、深度学习神经网络模型以及修正后的Xgboost模型分别通过预处理后的特征数据各自训练后,通过将待测数据样本分别输入到上述三模型中进行分析,得到三个分析结果,通过stacking模型融合上述三个结果,实现对样本数据对应加工件的质量预测,改变数据的稀疏特征对模型的不良影响。
进一步地,所述Xgboost模型的损失函数依据对数最大相似性构建得到,所述判断当前待分析数据是否含有瑕疵加工件的质量参数对应的标志特征的步骤S1之前,包括:
S11:以损失函数梯度矩阵的二维范数
Figure BDA0002513853040000061
为基准,运用线性回归模型构成所述Xgboost模型的目标函数
Figure BDA0002513853040000062
其中,所述损失函数为
Figure BDA0002513853040000071
y是指真实的结果,x是指输入的样本数据,θ是指Xgboost模型中各函数权重,P(|)是条件概率,ω为线性回归模型中每个变量的权重,J(ω;X,y)是Xgboost模型通过输入样本数据得到的预测结果和实际结果之间的差值,α为权重向量配置比例;
S12:根据所述目标函数对所述Xgboost模型的梯度进行梯度优化,其中,梯度优化的优化方向为
Figure BDA0002513853040000072
X是指输入的样本数据,ω为线性回归模型中每个变量的权重,J(ω;X,y)是Xgboost模型通过输入样本数据得到的预测结果和实际结果之间的差值,α为权重向量配置比例;
S13:将预处理后的样本数据输入到进行梯度优化的所述Xgboost模型中进行训练,以确定优化后的所述Xgboost模型的学习参数。
本实施例中,过大的学习参数会导致Xgboost优化趋近过程中出现步幅过快的问题,这种情况下很容易在优化到一个程度之后让优化方向和优化数量变成无穷大,表现为梯度爆炸;如果学习参数过小,会让Xgboost缓慢趋近最优结果,但是过慢的优化趋近可能会让它陷入局部最小值的陷阱,如果陷入局部最小值则表现为过拟合,通过上述损失函数运用线性回归模型构成Xgboost模型的目标函数,实现对Xgboost模型中的学习参数进行适应性调整,以通过线性回归模型甄选出最适宜上述稀疏数据分析结果的学习参数,确保Xgboost模型具有合适的优化速度。由于Xgboost模型使用的优化趋近方式是损失函数的二阶泰勒展开和节点值作为目标函数,所以损失函数的形态会很大程度上决定Xgboost模型性能的极限。由于Xgboost模型的节点激活方式是sigmoid,对于输入的高维度稀疏结构数据情况下,Xgboost模型优化的过程中,每一次优化方向和优化量主要是来自于损失函数的一阶导数和二阶导数决定,使用对数最大相似性作为损失函数,会让每次优化的趋近步幅不会过大,避免出现f’->infi的情况,即过拟合,也不会出现f’->0的情况,即梯度爆炸,以保证优化顺利进行。
上述预处理的样本数据指对样本数据通过指定预处理方式后的数据,上述预处理方式包括对样本数据中的加工件的特征数据进行分类,运用蒙特卡洛树搜索等统计学方法筛选用于模型训练中的特征数据,以提高通过各种特征确定加工件走向质量不达标的发展趋势路径,提高预测精准度。同时运用Random Froes模型筛选与加工件质量相关的因素,两者寻找交集,得到与质量不达标相关联的加工件的质量参数分组,形成各质量参数分组对应的发展为不达标的产品种类的各趋势路径,比如通过密度特征数据发展为不达标加工件的趋势路径、通过色彩特征数据、重量特征数据等发展为不达标加工件的趋势路径等等。通过进一步深挖与不达标的产品种类或质量参数分组相关的标志特征的特征数据,通过归一化、正则化等操作,以达到降维的目的。预处理的样本数据包括上述特征数据以及发展为不达标的产品种类的各趋势路径。举例地,样本数据为水轮机叶片的特征数据,水轮机叶片是巨大的加工件,水轮机叶片的重心是否符合标准要求,是需要的预测标准,但现实生产中无法实现对每个水轮机叶片进行重心达标检测。但若获得了水轮机叶片的长、宽、高、重量等特征数据后,输入上述模型进行预测分析。比如分别通过长、宽、高、重量等特征数据发展为水轮机叶片的重心不是在需要的位置的趋势路径。比如通过上述两者筛选到密度低很容易导致重心出现问题,则会特别关注密度这个特征数据,并将密度特征数据用于加工件不达标的几率模型预测,当分析有多个特征数据均有明显的影响趋势,则将多个特征数据同时输入到预测模型中进行预测。
进一步地,所述深度学习神经网络模型包括放大层、解构层和学习层,所述判断当前待分析数据是否含有瑕疵加工件的质量参数对应的标志特征的步骤S1之前,包括:
S1a:选择构建元素分别构建所述深度学习神经网络模型的放大层、解构层和学习层,其中,所述放大层包括多层依次累积的隐藏层,所述解构层包括多层依次连接的卷积层,所述学习层包括多层依次累积的隐藏层;
S1b:依次连接所述放大层、解构层和学习层形成所述深度学习神经网络模型;
S1c:将预处理后的样本数据输入到所述深度学习神经网络模型,以确定所述深度学习神经网络模型的模型参数。
本实施例中,由于样本数据为稀疏结构数据,需要对赋值为0的局部特征进行深层的细节放大、重新排列和解构,以便样本数据对于模型训练是有效的,即训练的模型对不同的样本数据实现区分分析。上述的深度学习神经网络模型以放大层为开始结构,以解构层为中间结构,以学习层为结尾结构。上述放大层由4层隐藏层构成,分别为依次连接的2^10ReLu、2^11ReLu、2^12ReLu和2^13ReLu,2^10ReLu与样本数据输入端相连,2^13ReLu与解构层相连。由于进入放大层各隐藏层的样本数据未进行卷积处理,因此,只对样本数据进行局部放大,以确定各样本数据之间的区别特征,实现将样本数据原本赋值为0局部特征进行细化区分。上述解构层由两层卷积层组成,各卷积层包括顺次连接的Bach Normalization*2^10和Average Pooling组成。通过解构层对样本数据进行重新排列和解构,获取原赋值为零的局部特征,经过放大后的细化区分对于整个样本数据的关联关系,得到不为0的赋值。将通过处理后的样本数据输入到学习层,进行学习训练,学习记忆通过处理后的样本数据的各特征。上述学习层由三层隐藏层组成,分别为依次连接的2^10ReLu、2^5ReLu和2^4ReLu,2^10ReLu连接解构层,2^4ReLu连接Softmax分类器相连。上述样本数据的预处理过程同上,不赘述。上述卷积层和隐藏层的数量根据具体训练过程中的优化程度以及计算量进行确定。
进一步地,S13或S1c步骤之前,包括:
S101:判断是否接收到对所述预处理后的样本数据的修正指令;
S102:若是,则将所述预处理后的样本数据按照区域选择指令进行局部放大显示,其中,所述区域选择指令根据用户点击屏幕时的映射区域发出并显示在所述映射区域的样本数据处,所述区域选择指令至少包括添加和删除;
S103:根据接收到的所述区域选择指令的类型,对所述映射区域对应的样本数据进行修正;
S104:将修正后的样本数据的显示状态恢复至局部放大显示前的状态。
本实施例经过预处理后的样本数据可接收人工修订,上述预处理后的样本数据为经过统计处理或模型处理等方式处理后的样本数据,推定为有利于提高预测模型的预测准确度的数据,提高通过样本数据训练预测模型后的预测精准度。上述局部放大是指不改变该特征所处于发展为不达标的产品种类的趋势路径中的连接关系,仅局部放大特征,以便对该特征进行精准修正。
进一步地,所述按照预设方法对所述Xgboost模型、RandomForest模型和深度学习神经网络模型中的至少两种模型的分析结果进行汇总处理,得到汇总结果的步骤S3,包括:
S30:将所述当前待分析数据分别输入至所述Xgboost模型、RandomForest模型和深度学习神经网络模型后,分别得到的分析结果;
S31:将各所述分析结果对应的矩阵数据,按照所述Xgboost模型、RandomForest模型和深度学习神经网络模型分别对应的权重,进行加权平均得到所述汇总结果。
本实施例通过对Xgboost模型、RandomForest模型和深度学习神经网络模型对同一输入样本数据进行分析的分析结果,进行加权平均得到汇总结果,使得汇总结果能避开各模型的自身的缺陷影响,融合结果更符合客观实际,预测结果更精准。举例地,Xgboost模型、RandomForest模型和深度学习神经网络模型的权重分别为W1、W2和W3。Xgboost模型、RandomForest模型和深度学习神经网络模型对当前待分析数据的预测概率分别为n1、n2和n3,则汇总结果为M,汇总结果M=W1*n1+W2*n2+W3*n3,其中,n1、n2、n3和汇总结果M均为0到1之间的小数。
进一步地,将各所述分析结果对应的矩阵数据,按照所述Xgboost模型、RandomForest模型和深度学习神经网络模型分别对应的权重,进行加权平均得到所述汇总结果的步骤S31之前,包括:
S311:将携带标签的样本数据,分别输入到所述Xgboost模型、RandomForest模型和深度学习神经网络模型中进行训练;
S312:获取所述Xgboost模型、RandomForest模型和深度学习神经网络模型分别对所述携带标签的样本数据的反馈结果;
S313:根据各所述反馈结果以及携带标签的赋值,通过线性回归模型,计算所述Xgboost模型、RandomForest模型和深度学习神经网络模型分别对应的权重。
本实施例中,所述Xgboost模型、RandomForest模型和深度学习神经网络模型,分别对所述携带标签的样本数据的反馈结果分别为x、y、z,多个携带标签的样本数据,则对应多组x、y、z以及每个标签对应的赋值t,标签对应的赋值t为0或1,当t为0时为不达标的标签,当t为1时为达标的标签。有多少个样本数据,就存在多少个x、y、z和t的组合,组成W1*x+W2*y+W3*z=t的组合,通过线性回归模型计算得到权重W1、W2和W3。本申请其他实施例中使用两个模型进行汇总分析,两个模型的汇总过程和原理与上述三个模型的汇总过程和原理近似,不赘述。
参照图2,本申请一实施例的预测加工件质量的装置,包括:
第一判断模块1,用于判断当前待分析数据是否含有瑕疵加工件的质量参数对应的标志特征;
输入模块2,用于若当前待分析数据含有瑕疵加工件的质量参数对应的标志特征,则将所述当前待分析数据输入预测模型中进行预测分析,其中,所述预测模型至少包括Xgboost模型、RandomForest模型和深度学习神经网络模型中的两种,所述Xgboost模型通过线性回归模型进行了修正调整;
汇总模块3,用于按照预设方法对所述Xgboost模型、RandomForest模型和深度学习神经网络模型中的至少两种模型的分析结果进行汇总处理,得到汇总结果;
第二判断模块4,用于根据所述汇总结果判断所述当前待分析数据对应的加工件质量不达标的几率。
本实施例的当前待分析数据为加工件的特征数据,包括高度、宽度、长度、重量、密度、色彩均一度、表面平整度、硬度等产品特征数据,以及生产时间、生产环境参数、原料批次等加工信息特征数据。通过判断当前待分析数据中是否含有瑕疵加工件的质量参数对应的标志特征,当前待分析数据中含有瑕疵加工件的质量参数分别对应的标志特征时,则会触发预测模型进行预测分析。上述瑕疵加工件的质量参数包含于加工件的特征数据。比如加工件的密度对其质量达标的影响最大,则搜索当前待分析数据是否包括密度低的标志特征,若存在密度低的标志特征,则认为存在加工件质量不达标的风险,则会触发预设模型对所有特征数据进行分析预测。上述瑕疵加工件的质量参数相关联的标志特征除密度低外,还包括表面不平整、色彩不均一、尺寸不达标等,根据待测的加工件的质量要求不同而不同。比如,机密的小型齿轮加工工件,对其强度有非常高的要求,但是特殊的强度检测设备在检查完这个齿轮之后就会报废齿轮,所以需要通过小型齿轮的长、宽、高、重量和热力学成像等特征数据来判断齿轮的强度是否达标。
由于本实施例的模型训练中的样本数据为成千上万的加工件数据,瑕疵加工件占少数,表现为数据结构特征为稀疏特征,即多数数据赋值为零,导致模型训练时无法体现数据区分度,影响模型训练的区别分析效果。本实施例的Xgboost模型经过特定的修正过程,使其满足对稀疏数据的区别分析,深度学习神经网络模型通过设计特定的构建结构使满足对稀疏数据的区别分析。然后根据stacking模型对上述Xgboost模型、RandomForest模型和深度学习神经网络模型中的至少两种模型的分析结果进行融合处理,以突出机器学习模型的主体结果,同时对于机器学习模型的错误分析内容进行深度学习修正。本实施例为上述三种模型同时并行对当前待分析数据分别进行分析后,再融合分析。上述融合结果即对当前待分析数据的风险得分评价,得分越高说明当前待分析数据预示的加工件质量不达标的几率大。依据Xgboost模型的特征以及Xgboost模型用于加工件质量预测时的稀疏数据特征,设计了Xgboost模型的损失函数,以通过将对数最大相似性作为损失函数,并通过线性回归进行修正,使Xgboost模型更适用于稀疏数据的特征分析,使预测加工件质量的方法能够进行工业化普遍推广。通过将Random Forest模型、深度学习神经网络模型以及修正后的Xgboost模型分别通过预处理后的特征数据各自训练后,通过将待测数据样本分别输入到上述三模型中进行分析,得到三个分析结果,通过stacking模型融合上述三个结果,实现对样本数据对应加工件的质量预测,改变数据的稀疏特征对模型的不良影响。
进一步地,所述Xgboost模型的损失函数依据对数最大相似性构建得到,预测加工件质量的装置,包括:
构成模块,用于以损失函数梯度矩阵的二维范数
Figure BDA0002513853040000121
为基准,运用线性回归模型构成所述Xgboost模型的目标函数
Figure BDA0002513853040000122
其中,所述损失函数为
Figure BDA0002513853040000123
y是指真实的结果,x是指输入的样本数据,θ是指Xgboost模型中各函数权重,P(|)是条件概率,ω为线性回归模型中每个变量的权重,J(ω;X,y)是Xgboost模型通过输入样本数据得到的预测结果和实际结果之间的差值,α为权重向量配置比例;
优化模块,用于根据所述目标函数对所述Xgboost模型的梯度进行梯度优化,其中,梯度优化的优化方向为
Figure BDA0002513853040000124
X是指输入的样本数据,ω为线性回归模型中每个变量的权重,J(ω;X,y)是Xgboost模型通过输入样本数据得到的预测结果和实际结果之间的差值,α为权重向量配置比例;
训练模块,用于将预处理后的样本数据输入到进行梯度优化的所述Xgboost模型中进行训练,以确定优化后的所述Xgboost模型的学习参数。
本实施例中,过大的学习参数会导致Xgboost优化趋近过程中出现步幅过快的问题,这种情况下很容易在优化到一个程度之后让优化方向和优化数量变成无穷大,表现为梯度爆炸;如果学习参数过小,会让Xgboost缓慢趋近最优结果,但是过慢的优化趋近可能会让它陷入局部最小值的陷阱,如果陷入局部最小值则表现为过拟合,通过上述损失函数运用线性回归模型构成Xgboost模型的目标函数,实现对Xgboost模型中的学习参数进行适应性调整,以通过线性回归模型甄选出最适宜上述稀疏数据分析结果的学习参数,确保Xgboost模型具有合适的优化速度。由于Xgboost模型使用的优化趋近方式是损失函数的二阶泰勒展开和节点值作为目标函数,所以损失函数的形态会很大程度上决定Xgboost模型性能的极限。由于Xgboost模型的节点激活方式是sigmoid,对于输入的高维度稀疏结构数据情况下,Xgboost模型优化的过程中,每一次优化方向和优化量主要是来自于损失函数的一阶导数和二阶导数决定,使用对数最大相似性作为损失函数,会让每次优化的趋近步幅不会过大,避免出现f’->infi的情况,即过拟合,也不会出现f’->0的情况,即梯度爆炸,以保证优化顺利进行。
上述预处理的样本数据指对样本数据通过指定预处理方式后的数据,上述预处理方式包括对样本数据中的加工件的特征数据进行分类,运用蒙特卡洛树搜索等统计学方法筛选用于模型训练中的特征数据,以提高通过各种特征确定加工件走向质量不达标的发展趋势路径,提高预测精准度。同时运用Random Froes模型筛选与加工件质量相关的因素,两者寻找交集,得到与质量不达标相关联的加工件的质量参数分组,形成各质量参数分组对应的发展为不达标的产品种类的各趋势路径,比如通过密度特征数据发展为不达标加工件的趋势路径、通过色彩特征数据、重量特征数据等发展为不达标加工件的趋势路径等等。通过进一步深挖与不达标的产品种类或质量参数分组相关的标志特征的特征数据,通过归一化、正则化等操作,以达到降维的目的。预处理的样本数据包括上述特征数据以及发展为不达标的产品种类的各趋势路径。举例地,样本数据为水轮机叶片的特征数据,水轮机叶片是巨大的加工件,水轮机叶片的重心是否符合标准要求,是需要的预测标准,但现实生产中无法实现对每个水轮机叶片进行重心达标检测。但若获得了水轮机叶片的长、宽、高、重量等特征数据后,输入上述模型进行预测分析。比如分别通过长、宽、高、重量等特征数据发展为水轮机叶片的重心不是在需要的位置的趋势路径。比如通过上述两者筛选到密度低很容易导致重心出现问题,则会特别关注密度这个特征数据,并将密度特征数据用于加工件不达标的几率模型预测,当分析有多个特征数据均有明显的影响趋势,则将多个特征数据同时输入到预测模型中进行预测。
进一步地,所述深度学习神经网络模型包括放大层、解构层和学习层,预测加工件质量的装置,包括:
选择模块,用于选择构建元素分别构建所述深度学习神经网络模型的放大层、解构层和学习层,其中,所述放大层包括多层依次累积的隐藏层,所述解构层包括多层依次连接的卷积层,所述学习层包括多层依次累积的隐藏层;
连接模块,用于依次连接所述放大层、解构层和学习层形成所述深度学习神经网络模型;
确定模块,用于将预处理后的样本数据输入到所述深度学习神经网络模型,以确定所述深度学习神经网络模型的模型参数。
本实施例中,由于样本数据为稀疏结构数据,需要对赋值为0的局部特征进行深层的细节放大、重新排列和解构,以便样本数据对于模型训练是有效的,即训练的模型对不同的样本数据实现区分分析。上述的深度学习神经网络模型以放大层为开始结构,以解构层为中间结构,以学习层为结尾结构。上述放大层由4层隐藏层构成,分别为依次连接的2^10ReLu、2^11ReLu、2^12ReLu和2^13ReLu,2^10ReLu与样本数据输入端相连,2^13ReLu与解构层相连。由于进入放大层各隐藏层的样本数据未进行卷积处理,因此,只对样本数据进行局部放大,以确定各样本数据之间的区别特征,实现将样本数据原本赋值为0局部特征进行细化区分。上述解构层由两层卷积层组成,各卷积层包括顺次连接的Bach Normalization*2^10和Average Pooling组成。通过解构层对样本数据进行重新排列和解构,获取原赋值为零的局部特征,经过放大后的细化区分对于整个样本数据的关联关系,得到不为0的赋值。将通过处理后的样本数据输入到学习层,进行学习训练,学习记忆通过处理后的样本数据的各特征。上述学习层由三层隐藏层组成,分别为依次连接的2^10ReLu、2^5ReLu和2^4ReLu,2^10ReLu连接解构层,2^4ReLu连接Softmax分类器相连。上述样本数据的预处理过程同上,不赘述。上述卷积层和隐藏层的数量根据具体训练过程中的优化程度以及计算量进行确定。
进一步地,预测加工件质量的装置,包括:
第三判断模块,用于判断是否接收到对所述预处理后的样本数据的修正指令;
放大模块,用于若接收到对所述预处理后的样本数据的修正指令,则将所述预处理后的样本数据按照区域选择指令进行局部放大显示,其中,所述区域选择指令根据用户点击屏幕时的映射区域发出并显示在所述映射区域的样本数据处,所述区域选择指令至少包括添加和删除;
修正模块,用于根据接收到的所述区域选择指令的类型,对所述映射区域对应的样本数据进行修正;
恢复模块,用于将修正后的样本数据的显示状态恢复至局部放大显示前的状态。
本实施例经过预处理后的样本数据可接收人工修订,上述预处理后的样本数据为经过统计处理或模型处理等方式处理后的样本数据,推定为有利于提高预测模型的预测准确度的数据,提高通过样本数据训练预测模型后的预测精准度。上述局部放大是指不改变该特征所处于发展为不达标的产品种类的趋势路径中的连接关系,仅局部放大特征,以便对该特征进行精准修正。
进一步地,所述汇总模块3,包括:
第一输入单元,用于将所述当前待分析数据分别输入至所述Xgboost模型、RandomForest模型和深度学习神经网络模型后,分别得到的分析结果;
汇总单元,用于将各所述分析结果对应的矩阵数据,按照所述Xgboost模型、RandomForest模型和深度学习神经网络模型分别对应的权重,进行加权平均得到所述汇总结果。
本实施例通过对Xgboost模型、RandomForest模型和深度学习神经网络模型对同一输入样本数据进行分析的分析结果,进行加权平均得到汇总结果,使得汇总结果能避开各模型的自身的缺陷影响,融合结果更符合客观实际,预测结果更精准。举例地,Xgboost模型、RandomForest模型和深度学习神经网络模型的权重分别为W1、W2和W3。Xgboost模型、RandomForest模型和深度学习神经网络模型对当前待分析数据的预测概率分别为n1、n2和n3,则汇总结果为M,汇总结果M=W1*n1+W2*n2+W3*n3,其中,n1、n2、n3和汇总结果M均为0到1之间的小数。
进一步地,所述汇总模块3,包括:
第二输入单元,用于将携带标签的样本数据,分别输入到所述Xgboost模型、RandomForest模型和深度学习神经网络模型中进行训练;
获取单元,用于获取所述Xgboost模型、RandomForest模型和深度学习神经网络模型分别对所述携带标签的样本数据的反馈结果;
计算单元,用于根据各所述反馈结果以及携带标签的赋值,通过线性回归模型,计算所述Xgboost模型、RandomForest模型和深度学习神经网络模型分别对应的权重。
本实施例中,所述Xgboost模型、RandomForest模型和深度学习神经网络模型,分别对所述携带标签的样本数据的反馈结果分别为x、y、z,多个携带标签的样本数据,则对应多组x、y、z以及每个标签对应的赋值t,标签对应的赋值t为0或1,当t为0时为不达标的标签,当t为1时为达标的标签。有多少个样本数据,就存在多少个x、y、z和t的组合,组成W1*x+W2*y+W3*z=t的组合,通过线性回归模型计算得到权重W1、W2和W3。本申请其他实施例中使用两个模型进行汇总分析,两个模型的汇总过程和原理与上述三个模型的汇总过程和原理近似,不赘述。
参照图3,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储预测加工件质量的过程需要的所有数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现预测加工件质量的方法。
上述处理器执行上述预测加工件质量的方法,包括:判断当前待分析数据是否含有瑕疵加工件的质量参数对应的标志特征;若是,则将所述当前待分析数据输入预测模型中进行预测分析,其中,所述预测模型至少包括Xgboost模型、RandomForest模型和深度学习神经网络模型中的两种,所述Xgboost模型通过线性回归模型进行了修正调整;按照预设方法对所述Xgboost模型、RandomForest模型和深度学习神经网络模型中的至少两种模型的分析结果进行汇总处理,得到汇总结果;根据所述汇总结果判断所述当前待分析数据对应的加工件质量不达标的几率。
上述计算机设备,依据Xgboost模型的特征以及Xgboost模型用于加工件质量预测时的稀疏数据特征,设计了Xgboost模型的损失函数,以通过将对数最大相似性作为损失函数,并通过线性回归进行修正,使Xgboost模型更适用于稀疏数据的特征分析,使预测加工件质量的方法能够进行工业化普遍推广。通过将Random Forest模型、深度学习神经网络模型以及修正后的Xgboost模型分别通过预处理后的特征数据各自训练后,通过将待测数据样本分别输入到上述三模型中进行分析,得到三个分析结果,通过stacking模型融合上述三个结果,实现对样本数据对应加工件的质量预测,改变数据的稀疏特征对模型的不良影响。
在一个实施例中,所述Xgboost模型的损失函数依据对数最大相似性构建得到,上述处理器判断当前待分析数据是否含有瑕疵加工件的质量参数对应的标志特征的步骤之前,包括:以损失函数梯度矩阵的二维范数
Figure BDA0002513853040000171
为基准,运用线性回归模型构成所述Xgboost模型的目标函数
Figure BDA0002513853040000172
其中,所述损失函数为
Figure BDA0002513853040000173
y是指真实的结果,x是指输入的样本数据,θ是指Xgboost模型中各函数权重,P(|)是条件概率,ω为线性回归模型中每个变量的权重,J(ω;X,y)是Xgboost模型通过输入样本数据得到的预测结果和实际结果之间的差值,α为权重向量配置比例;根据所述目标函数对所述Xgboost模型的梯度进行梯度优化,其中,梯度优化的优化方向为
Figure BDA0002513853040000181
X是指输入的样本数据,ω为线性回归模型中每个变量的权重,J(ω;X,y)是Xgboost模型通过输入样本数据得到的预测结果和实际结果之间的差值,α为权重向量配置比例;将预处理后的样本数据输入到进行梯度优化的所述Xgboost模型中进行训练,以确定优化后的所述Xgboost模型的学习参数。
在一个实施例中,所述深度学习神经网络模型包括放大层、解构层和学习层,上述处理器判断当前待分析数据是否含有瑕疵加工件的质量参数对应的标志特征的步骤之前,包括:选择构建元素分别构建所述深度学习神经网络模型的放大层、解构层和学习层,其中,所述放大层包括多层依次累积的隐藏层,所述解构层包括多层依次连接的卷积层,所述学习层包括多层依次累积的隐藏层;依次连接所述放大层、解构层和学习层形成所述深度学习神经网络模型;将预处理后的样本数据输入到所述深度学习神经网络模型,以确定所述深度学习神经网络模型的模型参数。
在一个实施例中,上述处理器将预处理后的样本数据输入到进行梯度优化的所述Xgboost模型中进行训练,以确定优化后的所述Xgboost模型的学习参数的步骤之前,或将预处理后的样本数据输入到所述深度学习神经网络模型,以确定所述深度学习神经网络模型的模型参数的步骤之前,包括:判断是否接收到对所述预处理后的样本数据的修正指令;若是,则将所述预处理后的样本数据按照区域选择指令进行局部放大显示,其中,所述区域选择指令根据用户点击屏幕时的映射区域发出并显示在所述映射区域的样本数据处,所述区域选择指令至少包括添加和删除;根据接收到的所述区域选择指令的类型,对所述映射区域对应的样本数据进行修正;将修正后的样本数据的显示状态恢复至局部放大显示前的状态。
在一个实施例中,上述处理器按照预设方法对所述Xgboost模型、RandomForest模型和深度学习神经网络模型中的至少两种模型的分析结果进行汇总处理,得到汇总结果的步骤,包括:将所述当前待分析数据分别输入至所述Xgboost模型、RandomForest模型和深度学习神经网络模型后,分别得到的分析结果;将各所述分析结果对应的矩阵数据,按照所述Xgboost模型、RandomForest模型和深度学习神经网络模型分别对应的权重,进行加权平均得到所述汇总结果。
在一个实施例中,上述处理器将各所述分析结果对应的矩阵数据,按照所述Xgboost模型、RandomForest模型和深度学习神经网络模型分别对应的权重,进行加权平均得到所述汇总结果的步骤之前,包括:将携带标签的样本数据,分别输入到所述Xgboost模型、RandomForest模型和深度学习神经网络模型中进行训练;获取所述Xgboost模型、RandomForest模型和深度学习神经网络模型分别对所述携带标签的样本数据的反馈结果;根据各所述反馈结果以及携带标签的赋值,通过线性回归模型,计算所述Xgboost模型、RandomForest模型和深度学习神经网络模型分别对应的权重。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定。
本申请还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现预测加工件质量的方法,包括:判断当前待分析数据是否含有瑕疵加工件的质量参数对应的标志特征;若是,则将所述当前待分析数据输入预测模型中进行预测分析,其中,所述预测模型至少包括Xgboost模型、RandomForest模型和深度学习神经网络模型中的两种,所述Xgboost模型通过线性回归模型进行了修正调整;按照预设方法对所述Xgboost模型、RandomForest模型和深度学习神经网络模型中的至少两种模型的分析结果进行汇总处理,得到汇总结果;根据所述汇总结果判断所述当前待分析数据对应的加工件质量不达标的几率。
上述计算机可读存储介质,依据Xgboost模型的特征以及Xgboost模型用于加工件质量预测时的稀疏数据特征,设计了Xgboost模型的损失函数,以通过将对数最大相似性作为损失函数,并通过线性回归进行修正,使Xgboost模型更适用于稀疏数据的特征分析,使预测加工件质量的方法能够进行工业化普遍推广。通过将Random Forest模型、深度学习神经网络模型以及修正后的Xgboost模型分别通过预处理后的特征数据各自训练后,通过将待测数据样本分别输入到上述三模型中进行分析,得到三个分析结果,通过stacking模型融合上述三个结果,实现对样本数据对应加工件的质量预测,改变数据的稀疏特征对模型的不良影响。
在一个实施例中,所述Xgboost模型的损失函数依据对数最大相似性构建得到,上述处理器判断当前待分析数据是否含有瑕疵加工件的质量参数对应的标志特征的步骤之前,包括:以损失函数梯度矩阵的二维范数
Figure BDA0002513853040000201
为基准,运用线性回归模型构成所述Xgboost模型的目标函数
Figure BDA0002513853040000202
其中,所述损失函数为
Figure BDA0002513853040000203
y是指真实的结果,x是指输入的样本数据,θ是指Xgboost模型中各函数权重,P(|)是条件概率,ω为线性回归模型中每个变量的权重,J(ω;X,y)是Xgboost模型通过输入样本数据得到的预测结果和实际结果之间的差值,α为权重向量配置比例;根据所述目标函数对所述Xgboost模型的梯度进行梯度优化,其中,梯度优化的优化方向为
Figure BDA0002513853040000204
X是指输入的样本数据,ω为线性回归模型中每个变量的权重,J(ω;X,y)是Xgboost模型通过输入样本数据得到的预测结果和实际结果之间的差值,α为权重向量配置比例;将预处理后的样本数据输入到进行梯度优化的所述Xgboost模型中进行训练,以确定优化后的所述Xgboost模型的学习参数。
在一个实施例中,所述深度学习神经网络模型包括放大层、解构层和学习层,上述处理器判断当前待分析数据是否含有瑕疵加工件的质量参数对应的标志特征的步骤之前,包括:选择构建元素分别构建所述深度学习神经网络模型的放大层、解构层和学习层,其中,所述放大层包括多层依次累积的隐藏层,所述解构层包括多层依次连接的卷积层,所述学习层包括多层依次累积的隐藏层;依次连接所述放大层、解构层和学习层形成所述深度学习神经网络模型;将预处理后的样本数据输入到所述深度学习神经网络模型,以确定所述深度学习神经网络模型的模型参数。
在一个实施例中,上述处理器将预处理后的样本数据输入到进行梯度优化的所述Xgboost模型中进行训练,以确定优化后的所述Xgboost模型的学习参数的步骤之前,或将预处理后的样本数据输入到所述深度学习神经网络模型,以确定所述深度学习神经网络模型的模型参数的步骤之前,包括:判断是否接收到对所述预处理后的样本数据的修正指令;若是,则将所述预处理后的样本数据按照区域选择指令进行局部放大显示,其中,所述区域选择指令根据用户点击屏幕时的映射区域发出并显示在所述映射区域的样本数据处,所述区域选择指令至少包括添加和删除;根据接收到的所述区域选择指令的类型,对所述映射区域对应的样本数据进行修正;将修正后的样本数据的显示状态恢复至局部放大显示前的状态。
在一个实施例中,上述处理器按照预设方法对所述Xgboost模型、RandomForest模型和深度学习神经网络模型中的至少两种模型的分析结果进行汇总处理,得到汇总结果的步骤,包括:将所述当前待分析数据分别输入至所述Xgboost模型、RandomForest模型和深度学习神经网络模型后,分别得到的分析结果;将各所述分析结果对应的矩阵数据,按照所述Xgboost模型、RandomForest模型和深度学习神经网络模型分别对应的权重,进行加权平均得到所述汇总结果。
在一个实施例中,上述处理器将各所述分析结果对应的矩阵数据,按照所述Xgboost模型、RandomForest模型和深度学习神经网络模型分别对应的权重,进行加权平均得到所述汇总结果的步骤之前,包括:将携带标签的样本数据,分别输入到所述Xgboost模型、RandomForest模型和深度学习神经网络模型中进行训练;获取所述Xgboost模型、RandomForest模型和深度学习神经网络模型分别对所述携带标签的样本数据的反馈结果;根据各所述反馈结果以及携带标签的赋值,通过线性回归模型,计算所述Xgboost模型、RandomForest模型和深度学习神经网络模型分别对应的权重。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,上述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (10)

1.一种预测加工件质量的方法,其特征在于,包括:
判断当前待分析数据是否含有瑕疵加工件的质量参数对应的标志特征;
若是,则将所述当前待分析数据输入预测模型中进行预测分析,其中,所述预测模型至少包括Xgboost模型、RandomForest模型和深度学习神经网络模型中的两种,所述Xgboost模型通过线性回归模型进行了修正调整;
按照预设方法对所述Xgboost模型、RandomForest模型和深度学习神经网络模型中的至少两种模型的分析结果进行汇总处理,得到汇总结果;
根据所述汇总结果判断所述当前待分析数据对应的加工件质量不达标的几率。
2.根据权利要求1所述的预测加工件质量的方法,其特征在于,所述Xgboost模型的损失函数依据对数最大相似性构建得到,所述判断当前待分析数据是否含有瑕疵加工件的质量参数对应的标志特征的步骤之前,包括:
以损失函数梯度矩阵的二维范数
Figure FDA0002513853030000011
为基准,运用线性回归模型构成所述Xgboost模型的目标函数
Figure FDA0002513853030000012
其中,所述损失函数为
Figure FDA0002513853030000013
y是指真实的结果,x是指输入的样本数据,θ是指Xgboost模型中各函数权重,P(|)是条件概率,ω为线性回归模型中每个变量的权重,J(ω;X,y)是Xgboost模型通过输入样本数据得到的预测结果和实际结果之间的差值,α为权重向量配置比例;
根据所述目标函数对所述Xgboost模型的梯度进行梯度优化,其中,梯度优化的优化方向为
Figure FDA0002513853030000014
X是指输入的样本数据,ω为线性回归模型中每个变量的权重,J(ω;X,y)是Xgboost模型通过输入样本数据得到的预测结果和实际结果之间的差值,α为权重向量配置比例;
将预处理后的样本数据输入到进行梯度优化的所述Xgboost模型中进行训练,以确定优化后的所述Xgboost模型的学习参数。
3.根据权利要求1所述的预测加工件质量的方法,其特征在于,所述深度学习神经网络模型包括放大层、解构层和学习层,所述判断当前待分析数据是否含有瑕疵加工件的质量参数对应的标志特征的步骤之前,包括:
选择构建元素分别构建所述深度学习神经网络模型的放大层、解构层和学习层,其中,所述放大层包括多层依次累积的隐藏层,所述解构层包括多层依次连接的卷积层,所述学习层包括多层依次累积的隐藏层;
依次连接所述放大层、解构层和学习层形成所述深度学习神经网络模型;
将预处理后的样本数据输入到所述深度学习神经网络模型,以确定所述深度学习神经网络模型的模型参数。
4.根据权利要求2所述的预测加工件质量的方法,其特征在于,所述将预处理后的样本数据输入到进行梯度优化的所述Xgboost模型中进行训练,以确定优化后的所述Xgboost模型的学习参数的步骤之前,或根据权利要求3所述的预测加工件质量的方法,将预处理后的样本数据输入到所述深度学习神经网络模型,以确定所述深度学习神经网络模型的模型参数的步骤之前,包括:
判断是否接收到对所述预处理后的样本数据的修正指令;
若是,则将所述预处理后的样本数据按照区域选择指令进行局部放大显示,其中,所述区域选择指令根据用户点击屏幕时的映射区域发出并显示在所述映射区域的样本数据处,所述区域选择指令至少包括添加和删除;
根据接收到的所述区域选择指令的类型,对所述映射区域对应的样本数据进行修正;
将修正后的样本数据的显示状态恢复至局部放大显示前的状态。
5.根据权利要求1所述的预测加工件质量的方法,其特征在于,所述按照预设方法对所述Xgboost模型、RandomForest模型和深度学习神经网络模型中的至少两种模型的分析结果进行汇总处理,得到汇总结果的步骤,包括:
将所述当前待分析数据分别输入至所述Xgboost模型、RandomForest模型和深度学习神经网络模型后,分别得到的分析结果;
将各所述分析结果对应的矩阵数据,按照所述Xgboost模型、RandomForest模型和深度学习神经网络模型分别对应的权重,进行加权平均得到所述汇总结果。
6.根据权利要求5所述的预测加工件质量的方法,其特征在于,将各所述分析结果对应的矩阵数据,按照所述Xgboost模型、RandomForest模型和深度学习神经网络模型分别对应的权重,进行加权平均得到所述汇总结果的步骤之前,包括:
将携带标签的样本数据,分别输入到所述Xgboost模型、RandomForest模型和深度学习神经网络模型中进行训练;
获取所述Xgboost模型、RandomForest模型和深度学习神经网络模型分别对所述携带标签的样本数据的反馈结果;
根据各所述反馈结果以及携带标签的赋值,通过线性回归模型,计算所述Xgboost模型、RandomForest模型和深度学习神经网络模型分别对应的权重。
7.一种预测加工件质量的装置,其特征在于,包括:
第一判断模块,用于判断当前待分析数据是否含有瑕疵加工件的质量参数对应的标志特征;
输入模块,用于若当前待分析数据含有瑕疵加工件的质量参数对应的标志特征,则将所述当前待分析数据输入预测模型中进行预测分析,其中,所述预测模型至少包括Xgboost模型、RandomForest模型和深度学习神经网络模型中的两种,所述Xgboost模型通过线性回归模型进行了修正调整;
汇总模块,用于按照预设方法对所述Xgboost模型、RandomForest模型和深度学习神经网络模型中的至少两种模型的分析结果进行汇总处理,得到汇总结果;
第二判断模块,用于根据所述汇总结果判断所述当前待分析数据对应的加工件质量不达标的几率。
8.根据权利要求7所述的预测加工件质量的装置,其特征在于,所述Xgboost模型的损失函数依据对数最大相似性构建得到,装置包括:
构成模块,用于以损失函数梯度矩阵的二维范数
Figure FDA0002513853030000041
为基准,运用线性回归模型构成所述Xgboost模型的目标函数
Figure FDA0002513853030000042
其中,所述损失函数为
Figure FDA0002513853030000043
y是指真实的结果,x是指输入的样本数据,θ是指Xgboost模型中各函数权重,P(|)是条件概率,ω为线性回归模型中每个变量的权重,J(ω;X,y)是Xgboost模型通过输入样本数据得到的预测结果和实际结果之间的差值,α为权重向量配置比例;
优化模块,用于根据所述目标函数对所述Xgboost模型的梯度进行梯度优化,其中,梯度优化的优化方向为
Figure FDA0002513853030000044
X是指输入的样本数据,ω为线性回归模型中每个变量的权重,J(ω;X,y)是Xgboost模型通过输入样本数据得到的预测结果和实际结果之间的差值,α为权重向量配置比例;
训练模块,用于将预处理后的样本数据输入到进行梯度优化的所述Xgboost模型中进行训练,以确定优化后的所述Xgboost模型的学习参数。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202010469626.2A 2020-05-28 2020-05-28 预测加工件质量的方法、装置和计算机设备 Active CN111814385B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010469626.2A CN111814385B (zh) 2020-05-28 2020-05-28 预测加工件质量的方法、装置和计算机设备
PCT/CN2020/099475 WO2021143067A1 (zh) 2020-05-28 2020-06-30 预测加工件质量的方法、装置和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010469626.2A CN111814385B (zh) 2020-05-28 2020-05-28 预测加工件质量的方法、装置和计算机设备

Publications (2)

Publication Number Publication Date
CN111814385A true CN111814385A (zh) 2020-10-23
CN111814385B CN111814385B (zh) 2023-11-17

Family

ID=72847830

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010469626.2A Active CN111814385B (zh) 2020-05-28 2020-05-28 预测加工件质量的方法、装置和计算机设备

Country Status (2)

Country Link
CN (1) CN111814385B (zh)
WO (1) WO2021143067A1 (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112884081A (zh) * 2021-03-31 2021-06-01 福州大学 一种多品种小批量生产的工件质量在线智能预测方法
CN112966827A (zh) * 2021-02-26 2021-06-15 普赛微科技(杭州)有限公司 一种存储器开发过程中的良品率预测方法
CN113516285A (zh) * 2021-05-12 2021-10-19 中船重工鹏力(南京)智能装备系统有限公司 自动化装配检测生产线在生产中产品质量分析预测方法
CN113987619A (zh) * 2021-12-29 2022-01-28 广州赛意信息科技股份有限公司 提高交互体验的工业设计系统及方法
CN115237054A (zh) * 2022-09-21 2022-10-25 中科航迈数控软件(深圳)有限公司 一种主轴驱动电机控制方法、装置、终端及存储介质
CN115630847A (zh) * 2022-12-07 2023-01-20 四川省华盾防务科技股份有限公司 一种基于数据预测的收发组件检测方法、系统及存储介质
CN116214808A (zh) * 2023-03-29 2023-06-06 连云港春旭滚塑科技有限公司 一种具有全自动定量加料的高温蒸汽滚塑设备
CN117647367A (zh) * 2024-01-29 2024-03-05 四川航空股份有限公司 一种基于机器学习的飞机油箱漏点定位方法及系统

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113642251B (zh) * 2021-08-31 2024-05-28 佛山众陶联供应链服务有限公司 一种建筑陶瓷喷雾制粉质量的数据分析预测方法及系统
CN114733640B (zh) * 2022-03-03 2023-09-12 江苏丰尚智能科技有限公司 粉碎机加工参数的调节方法、装置和计算机设备
CN115310357A (zh) * 2022-08-09 2022-11-08 大庆正方软件科技股份有限公司 一种基于数据驱动决策的压裂分析方法
CN115512166B (zh) * 2022-10-18 2023-05-16 湖北华鑫光电有限公司 镜头的智能化制备方法及其系统
CN116362599B (zh) * 2022-12-12 2023-11-10 武汉同捷信息技术有限公司 一种基于mes系统的质量数据采集方法与装置
CN116976208A (zh) * 2023-07-28 2023-10-31 沈阳飞机工业(集团)有限公司 一种基于机器学习的航空紧固件划分方法
CN117549219B (zh) * 2024-01-12 2024-05-10 东方电气集团东方汽轮机有限公司 一种叶片喷砂质量预测方法、系统、设备及存储介质
CN117649906B (zh) * 2024-01-30 2024-04-26 浙江大学 一体化铝合金结构件铸造质量预测方法、电子设备、介质

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105930934B (zh) * 2016-04-27 2018-08-14 第四范式(北京)技术有限公司 展示预测模型的方法、装置及调整预测模型的方法、装置
CN107492043A (zh) * 2017-09-04 2017-12-19 国网冀北电力有限公司电力科学研究院 窃电分析方法及装置
CN108764597A (zh) * 2018-04-02 2018-11-06 华南理工大学 一种基于集成学习的产品质量控制方法
CN108805259A (zh) * 2018-05-23 2018-11-13 北京达佳互联信息技术有限公司 神经网络模型训练方法、装置、存储介质及终端设备
CN108877905B (zh) * 2018-06-12 2020-11-10 中南大学 一种基于Xgboost框架的医院门诊就诊量预测方法
WO2020020088A1 (zh) * 2018-07-23 2020-01-30 第四范式(北京)技术有限公司 神经网络模型的训练方法和系统以及预测方法和系统
CN110288199A (zh) * 2019-05-29 2019-09-27 北京航空航天大学 产品质量预测的方法
CN110766660A (zh) * 2019-09-25 2020-02-07 上海众壹云计算科技有限公司 基于融合深度学习模型的集成电路缺陷图像识别分类系统
CN110990135B (zh) * 2019-11-28 2023-05-12 中国人民解放军国防科技大学 基于深度迁移学习的Spark作业时间预测方法和装置
CN111079865A (zh) * 2019-12-31 2020-04-28 联想(北京)有限公司 检测方法和装置以及电子设备和介质

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112966827A (zh) * 2021-02-26 2021-06-15 普赛微科技(杭州)有限公司 一种存储器开发过程中的良品率预测方法
CN112966827B (zh) * 2021-02-26 2022-02-11 普赛微科技(杭州)有限公司 一种存储器开发过程中的良品率预测方法
CN112884081A (zh) * 2021-03-31 2021-06-01 福州大学 一种多品种小批量生产的工件质量在线智能预测方法
CN113516285A (zh) * 2021-05-12 2021-10-19 中船重工鹏力(南京)智能装备系统有限公司 自动化装配检测生产线在生产中产品质量分析预测方法
CN113516285B (zh) * 2021-05-12 2024-02-13 中船重工鹏力(南京)智能装备系统有限公司 自动化装配检测生产线在生产中产品质量分析预测方法
CN113987619A (zh) * 2021-12-29 2022-01-28 广州赛意信息科技股份有限公司 提高交互体验的工业设计系统及方法
CN115237054B (zh) * 2022-09-21 2022-12-16 中科航迈数控软件(深圳)有限公司 一种主轴驱动电机控制方法、装置、终端及存储介质
CN115237054A (zh) * 2022-09-21 2022-10-25 中科航迈数控软件(深圳)有限公司 一种主轴驱动电机控制方法、装置、终端及存储介质
CN115630847A (zh) * 2022-12-07 2023-01-20 四川省华盾防务科技股份有限公司 一种基于数据预测的收发组件检测方法、系统及存储介质
CN116214808A (zh) * 2023-03-29 2023-06-06 连云港春旭滚塑科技有限公司 一种具有全自动定量加料的高温蒸汽滚塑设备
CN116214808B (zh) * 2023-03-29 2023-10-03 连云港春旭滚塑科技有限公司 一种具有全自动定量加料的高温蒸汽滚塑设备
CN117647367A (zh) * 2024-01-29 2024-03-05 四川航空股份有限公司 一种基于机器学习的飞机油箱漏点定位方法及系统
CN117647367B (zh) * 2024-01-29 2024-04-16 四川航空股份有限公司 一种基于机器学习的飞机油箱漏点定位方法及系统

Also Published As

Publication number Publication date
WO2021143067A1 (zh) 2021-07-22
CN111814385B (zh) 2023-11-17

Similar Documents

Publication Publication Date Title
CN111814385A (zh) 预测加工件质量的方法、装置和计算机设备
CN108780313B (zh) 为装配线执行目标参数分析的方法、系统和计算机可读介质
KR20180014471A (ko) 신규 물질의 구조 생성 방법 및 장치
CN111625516A (zh) 检测数据状态的方法、装置、计算机设备和存储介质
CN111210869A (zh) 一种蛋白质冷冻电镜结构解析模型训练方法和解析方法
CN112614125A (zh) 手机玻璃缺陷检测方法、装置、计算机设备及存储介质
CN112036426A (zh) 利用高维传感器数据的多数表决进行无监督异常检测和责任的方法和系统
CN115980322B (zh) 一种织物瑕疵智能检测方法及系统
CN115239946B (zh) 小样本迁移学习训练、目标检测方法、装置、设备和介质
CN107016416B (zh) 基于邻域粗糙集和pca融合的数据分类预测方法
CN115731220A (zh) 坯布缺陷定位与分类方法、系统、设备及存储介质
CN112750507B (zh) 基于混合机器学习模型的同时检测水中硝酸盐和亚硝酸盐含量的方法
CN116167336B (zh) 基于云计算的传感器数据加工方法、云服务器及介质
CN112633362A (zh) 一种旋转机械自适应故障诊断方法、装置、设备及介质
CN115936773A (zh) 一种互联网金融黑产识别方法与系统
US6757584B2 (en) Device and method for generating a classifier for automatically sorting objects
CN116186507A (zh) 一种特征子集的选取方法、装置及存储介质
Boehm et al. Machine learning algorithms for automated NIF capsule mandrel selection
US20220189806A1 (en) Estimating heights of defects in a wafer
CN111026661B (zh) 一种软件易用性全面测试方法及系统
CN114387089A (zh) 客户信用风险评估方法、装置、设备及存储介质
Go et al. A deep learning-based surface defect inspection system for smartphone glass
CN113689020A (zh) 业务信息预测方法、装置、计算机设备和存储介质
CN114372087A (zh) 基于型评系统的评价方法、装置、设备及介质
CN114372088A (zh) 基于型评系统的计量设备样机评价方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant