CN113836826A - 关键参数确定方法、装置、电子装置及存储介质 - Google Patents
关键参数确定方法、装置、电子装置及存储介质 Download PDFInfo
- Publication number
- CN113836826A CN113836826A CN202111410820.4A CN202111410820A CN113836826A CN 113836826 A CN113836826 A CN 113836826A CN 202111410820 A CN202111410820 A CN 202111410820A CN 113836826 A CN113836826 A CN 113836826A
- Authority
- CN
- China
- Prior art keywords
- data
- material processing
- determining
- parameter
- processing parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- General Factory Administration (AREA)
Abstract
本申请公开了一种关键参数确定方法,所述方法包括:获取物料数据,所述物料数据包括物料加工结果参数和多个物料加工参数;预处理所述物料数据,以获得输入数据;将所述输入数据输入至少两个算法模型,得到每种所述算法模型对应的第一权值,以得到一组合模型,所述组合模型包括至少两个算法模型;根据所述组合模型确定所述多个物料加工参数的每个物料加工参数的第二权值,并根据所述第二权值确定所述多个物料加工参数中的所述关键参数。本申请通过多算法模型权值以及多算法模型双输出的多个物料加工参数的权值,以确定多个物料加工参数中的关键参数,本申请同时提供一种关键参数确定装置、电子装置及存储介质。
Description
技术领域
本申请涉及物料加工技术领域,具体涉及一种关键参数确定方法、装置、电子装置及存储介质。
背景技术
在物料的加工过程中,物料的加工结果受物料加工过程中的多种参数的影响。如在激光焊接过程中,焊接质量受温度、物料的材料特性、时间等因素影响,阳极染色物料过程中,染色结果受染色时间、阳极槽溶液的浓度、温度、PH值等多种因素的影响。而目前为了保证物料的加工结果,往往需要确定对物料的加工结果影响较大的关键参数,然后通过调整这些关键参数以改善加工结果;而且有些情况下还需要确定这些关键参数对应的产品质量分布规则。但是目前基本都是依靠技术人员的经验,通过多次试验调整和验证,较为繁琐而且并不精确,工作量很大。例如阳极槽中的物料加工过程中,具有大量的加工参数,如温度、PH值、浓度、时间等,相同阳极槽中设置不同的加工参数加工物料,物料加工良率不相同;为了提升物料的加工良率,需确定多个加工参数对于物料加工良率的影响程度,以便通过调整物料参数以提升物料的加工良率;然而,由于阳极槽中的加工参数比较多,仅通过人工往往无法从大量数据中快速确定每个加工参数对于物料加工良率的影响程度,也无法得知加工参数对应的产品质量分布规则。
发明内容
鉴于以上内容,有必要提出一种关键参数确定方法、装置、电子装置及存储介质,以确定影响物料加工良率的关键参数,并可通过参数提升物料的加工良率。
本申请的第一方面提供一种关键参数确定方法,所述方法包括:
获取物料数据,所述物料数据包括物料加工结果参数和多个物料加工参数;
预处理所述物料数据,以获得输入数据;
将所述输入数据输入至少两个算法模型,得到每种所述算法模型对应的第一权值,以得到一组合模型,所述组合模型包括至少两个算法模型;
根据所述组合模型确定所述多个物料加工参数的每个物料加工参数的第二权值,并根据所述第二权值确定所述多个物料加工参数中的所述关键参数。
在一些实施例中,所述预处理所述物料数据包括:
获取所述物料数据的尺寸数据,所述尺寸数据包括多个行数据和多个列数据;
依据所述行数据和所述列数据确定行缺失值和列缺失值;
确定所述列缺失值超过第一阈值对应的物料数据为第一缺失数据;
确定所述行缺失值超过第二阈值对应的物料数据为第二缺失数据;
删除所述物料数据中所述第一缺失数据对应的列数据和所述第二缺失数据对应的行数据,以得到第一中间数据;
依据所述第一中间数据形成输入数据。
在一些实施例中,所述依据所述第一中间数据形成输入数据包括:
确定所述多个物料加工参数的取值范围;
确定所述第一中间数据中超出对应所述取值范围的物料加工参数为异常数据;
删除所述第一中间数据中的异常数据,以得到第二中间数据;
依据所述第二中间数据形成所述输入数据。
在一些实施例中,所述方法还包括:
确定所述第二中间数据中的多个物料加工参数间的第一相关系数;
确定所述第一相关系数大于第一预设阈值的两个物料加工参数为高相关参数组;
删除所述高相关参数组中其中一个物料加工参数以形成第三中间数据
依据所述第三中间数据形成所述输入数据。
在一些实施例中,所述依据所述第三中间数据形成所述输入数据包括:
获取所述第三中间数据中的多个物料加工参数和所述物料加工结果参数之间的第二相关系数;
确定所述第二相关系数小于第二预设阈值的物料加工参数为低相关参数;
删除所述低相关参数组以形成第四中间数据;
依据所述第四中间数据形成所述输入数据。
在一些实施例中,所述组合模型包括三种算法模型,所述三种算法模型为判定树模型、随机森林模型及xgboost模型。
在一些实施例中,所述确定所述至少两个算法模型对应的第一权值包括:
获取测试样本;
将所述测试样本分别输入所述至少两个算法模型,以获取每种算法模型对应的子测试结果;
依据所述子测试结果确定每个算法对应的所述第一权值。
在一些实施例中,所述方法还包括:根据所述组合模型,确定所述关键参数对应的产品质量分布规则。
在一些实施例中,所述物料数据为物料的阳极染色数据,所述物料加工结果参数为物料的阳极染色质量数据,所述物料加工参数为物料的阳极染色参数数据。
本申请的第二方面一种关键参数确定装置,所述装置包括:
通信器,所述通信器用于获取物料数据,所述物料数据包括物料加工结果参数和多个物料加工参数;
处理器,耦接所述通信器,用于:
预处理所述物料数据,以获得输入数据;将所述输入数据输入至少两个算法模型,得到每种所述算法模型对应的第一权值,以得到一组合模型,所述组合模型包括至少两个算法模型;
所述处理器还用于根据所述组合模型确定所述多个物料加工参数的每个物料加工参数的第二权值,并根据所述第二权值确定所述多个物料加工参数中的所述关键参数。
本申请的第三方面提供一种电子装置,所述电子装置包括处理器和存储器,所述存储器用于存储指令,所述处理器用于调用所述存储器中的指令,使得所述电子装置执行如上所述的关键参数确定方法。
本申请的第四方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有关键参数确定程序,所述关键参数确定程序被处理器执行时实现如上所述的关键参数确定方法。
附图说明
图1是本申请一些实施例的关键参数确定方法的流程示意图。
图2是本申请一些实施例的预处理物料数据方法的流程示意图。
图3是本申请一些实施例的原始物料数据的表格示意图。
图4是本申请一些实施例的删除缺失数据后的表格示意图。
图5是本申请一些实施例的输入数据形成方法的流程示意图一。
图6是本申请一些实施例的输入数据形成方法的流程示意图二。
图7是本申请一些实施例的输入数据形成方法的流程示意图三。
图8是本申请一些实施例的关键参数确定装置的硬件架构图。
主要元件符号说明:关键参数确定装置600,通信器602,处理器604,存储器606,通讯总线608,关键参数确定程序610。
具体实施方式
为了能够更清楚地理解本申请的目的、特征和优点,下面结合附图和具体实施例对本申请进行详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互结合。在下面的描述中阐述了很多具体细节以便于充分理解本申请,所述描述的实施例仅是本申请一部分实施例,而不是全部的实施例。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个所述特征。在本申请的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中在本申请的说明书所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。
本申请的一些实施例提供一种关键参数确定方法,该方法包括:
获取物料数据,所述物料数据包括物料加工结果参数和多个物料加工参数;
预处理所述物料数据,以获得输入数据;
将所述输入数据输入至少两个算法模型,得到每种所述算法模型对应的第一权值,以得到一组合模型,所述组合模型包括至少两个算法模型;
根据所述组合模型确定所述多个物料加工参数的每个物料加工参数的第二权值,并根据所述第二权值确定所述多个物料加工参数中的所述关键参数。
如此,通过预处理物料数据获取模型训练所需的输入数据,并将数据输入至少两个算法模型,由于物料数据的类型较多,通过多个算法模型同时处理该物料数据,以使各算法实现性能互补,以提升数据处理的准确性;依据算法模型对应的权值和算法模型输出的多个物料加工参数的权值,以确定多个物料加工参数种的关键参数,其中关键参数可为一个或多个物料加工参数。通过机器学习从海量的物料数据中快速确定导致物料加工结果参数为不良的关键参数,以提高整体生产效率。且方法具有很好的可复制性和可推广性,适用于各种物料加工制程,如焊接、蚀刻、化抛、阳极染色等。
以下将结合附图对本申请的一些实施方式作详细说明。
本申请实施例的关键参数确定方法用于在物料加工过程中对多种加工参数中的关键参数的确定。上述物料加工可以为各种加工制程,如焊接、蚀刻、化抛、阳极染色等领域。在以下的实施例中,以阳极染色制程中多个物料加工参数中关键参数的确定为例。其中阳极槽的物料加工参数可包括化抛温度、化抛时间、草酸浓度、PH值、染色时间等,通过设定不同的物料的加工参数,阳极槽中物料的加工结果并不相同,例如,不同的染色时间导致阳极槽中物料的染色深度不同。本申请的关键参数确定方法可通过大量历史数据训练获得组合模型,并依据组合模型确定多个物料加工参数中的关键参数,如此,当阳极槽中物料的加工结果不理想时,只需检查关键参数,即可确定形成该加工结果的关键参数,以便通过调整参数以提升物料的加工良率。
对阳极槽中的关键参数的确定,可以直接在阳极槽的加工机台上集成本申请的关键参数方法所提供的加工参数确定功能,或者安装用于实现本申请的关键参数确定方法的客户端。再如,本申请所提供的关键参数确定方法还可以以软件开发工具包(SDK,SoftwareDevelopment Kit)的形式运行在该阳极槽的加工设备上,以SDK的形式提供关键参数确定功能的接口,处理器或其他设备通过提供的接口即可实现关键参数确定功能。
请参见图1,本申请一些实施例提供了一种关键参数确定方法。
S101:获取物料数据。
其中,物料数据包括物料结果参数和多个物料加工参数。
其中,物料加工参数可为物料在加工过程中的各种参数,如在激光焊接制程中的温度、焊接时间、激光强度等;化抛制程中溶液组分、组分的浓度、化抛时间、温度等。对于阳极染色制程中,所述物料加工参数可以为阳极槽中物料加工的设置参数,例如化抛温度、化抛时间、草酸浓度、PH值、染色时间等。物料结果参数为物料的加工结果,对于阳极染色制程中可为物料在阳极槽内加工之后色差值,当然,物料结果参数还可为单个物料在阳极槽中加工之后的染色结果是否合格,即依据物料加工参数设置阳极槽,并依据设置完成的阳极槽加工对应物料之后物料的加工结果;若物料加工合格,则物料结果参数为合格;否则,物料结果参数为不合格;此外,物料结果参数还可为多个物料(如一个飞杆上的所有物料)在阳极槽中加工之后的的良率值。
其中,物料结果参数与物料加工参数具有对应关系,阳极槽依据其中一组物料加工参数加工物料,以形成该物料加工参数对应的物料结果参数。
S102:预处理物料数据,以获得输入数据。
其中,由于物料数据大多由阳极槽加工机台直接提供,该物料数据中包括很多与物料结果参数无关的参数、或是数学模型无法直接处理的参数,通过预处理以提升数据的准确性。
进一步地,预处理可包括缺失值处理、特征离散化处理、特征组合处理、特征选择处理等,通过以上处理,以保证物料数据的完整性和准确性。
S103:将所述输入数据输入至少两个算法模型,得到每种所述算法模型对应的第一权值,以得到一组合模型,所述组合模型包括至少两个算法模型;
在一些实施例中,通过输入数据训练至少两个算法模型,以得到组合模型。并依据数据数据形成测试样本,并将测试样本对组合模型进行测试,以获得测试结果,依据测试结果确定组合模型中的每个算法模型对应的权值。
本申请通过数据输入至少两个算法模型,由于物料数据的类型较多,通过多个算法模型同时处理该物料数据,以使各算法实现性能互补,以提升数据处理的准确性。
示例性地,组合模型包括算法模型A、算法模型B,依据测试样本对组合模型进行测试,使用均方误差的方法确定算法模型A、算法模型B的各自与真实值的均方误差分别为40和50,则说明算法模型A的在一定程度上更接近真实值,此时可以设置算法模型A的权重较大,算法模型B的权值较小,将算法模型A和算法模型B的权值分别设置为50/(40+50)和40/(40+50),即分别为0.56和0.44。
可以理解,算法模型的数量可以物料数据的类别进行确定,具体地,获取物料数据的类型组,该类型组包括多个子类型;确定子类型对应的算法类型。其中子类型可为多个物料加工数据的分布特征(例如较为连续、离散性较强)。
示例性地,多个物料加工参数离散性较强,随机森林算法处理该子类型的数据获得的结果的准确性较高,则可依据物料数据的子类型确定随机森林算法。
可以理解,组合模型中算法模型的数量可以物料数据的类型确定,当然,也可依据算法模型本身的特点确定,例如,通过选用两个算法模型的互补性,以提升结果的准确性。
在一可选的实施例中,组合模型包括三种算法模型,该三种算法模型为判定树模型、随机森林模型及xgboost模型。
S104:根据所述组合模型确定所述多个物料加工参数的每个物料加工参数的第二权值,并根据所述第二权值确定所述多个物料加工参数中的所述关键参数。
在一些实施例中,组合模型训练完成之后,获取实际的物料数据,其中实际的物料数据包括实际的物料加工结果参数和实际的多个物料加工参数,将实际的物料数据输入组合模型,以得到每个物料加工参数的占比,其中占比即为第二权值,依据第一权值和第二权值确定每个物料加工参数的实际占比,并依据实际占比对多个物料加工进行排名,依据排名结果确定关键参数。
其中,关键参数可包括一种物料加工参数,例如实际占比最高的物料加工参数;当然关键参数还可包括至少两个物料加工参数,例如实际占比最高的前两个物料加工参数。
示例性地,组合模型包括三种数学模型:数学模型A、数据模型B和数据模型C,依据测试样本确定数学模型A、数据模型B和数据模型C对应的第一权值分别为0.3,0.2及0.5,将实际加工参数输入数学模型A、数据模型B和数据模型C,数据模型A输出为:染色时间占比为0.3、化抛时间占比为0.3及温度占比为0.4;数据模型B输出为:染色时间占比为0.2、化抛时间占比为0.3及温度占比为0.5;数据模型C输出为:染色时间占比为0.1、化抛时间占比为0.4及温度占比为0.5;则染色时间、化抛时间及温度的实际占比为(0.3*0.3+0.2*0.2+0.5*0.1),(0.3*0.3+0.2*0.3+0.5*0.4),(0.3*0.4+0.2*0.5+0.5*0.5);即分别为0.18、0.35、0.47。则温度的权重是0.47,最为关键,其次是化抛时间的权重占0.35,处于一般关键,染色时间的权重是0.18,影响较小。
如此,通过将预处理后的物料数据输入至少两个算法模型,以获得组合模型,并依据组合模型确定加工参数中的各个算法模型的权值,以及每个算法模型输出的实际的加工参数对应的权值,以确定对该物料加工具有关键影响的关键参数,通过多个算法模型同时处理,以提升输出结果的准确性。
在一些实施例中,请参见图2,所述预处理所述物料数据包括:
S201:获取所述物料数据的尺寸数据,所述尺寸数据包括多个行数据和多个列数据;
其中,机台输出的物料数据按照行列排布,例如,物料数据共有12个数据,行数和列数分别为3和4。
S202:依据所述行数据和所述列数据确定行缺失值和列缺失值。
具体地,依据物料数据的行数据和列数据判断对应位置是否存在数据,例如若物料数据为3行4列,则读取物料数据并判断每列的前三行的位置是否均存在物料数据,若其中一列的前三行均存在物料数据,则表明该列数据无缺失;若其中一列的其中一行或多行数据不存在,则表明该列的数据为缺失数据。对于行缺失值的判断方法与对列缺失值的判断方法相同:读取物料数据并判断每行的前四列的位置是否均存在物料数据,若前四列均存在物料数据,则表明该行数据无缺失;若其中一行的其中一列或多列数据不存在,则表明该行的数据为缺失数据。
S203:确定所述列缺失值超过第一阈值对应的物料数据为第一缺失数据;
示例性地,第一阈值为30%,物料数据包括5行,其中一列对应的5行的缺失数据为1行,则该列的缺失值为20%且小于30%,则认为该列对应的数据为有效数据;若其中一列对应的5行的缺失数据为2行,则列的缺失值为40%且大于30%,则该列对应的数据为第一缺失数据。
S204:确定所述行缺失值超过第二阈值对应的物料数据为第二缺失数据;
其中,确定第二缺失数据的方法与确定第一缺失数据的方法相同。第一阈值和第二阈值可由用户依据实际应用场景进行设定。
S205:删除所述物料数据中所述第一缺失数据对应的列数据和所述第二缺失数据对应的行数据,以得到第一中间数据;
具体地,删除物料数据中行数据或列数据中的缺失位置,以保证物料的完整性和有效性。
示例性,请参图3和图4,其中图3为原始物料数据,由于化抛时间的数据作为第一缺失数据,第二行存在温度和化抛时间的缺失,因此,第二行作为第二缺失数据,因此,删除缺失数据得到图4所示的删除缺失数据后的物料数据。
可选地,物料数据包括多组数据,例如每组数据包括温度、染色时间、化抛时间,获取每组数据的缺失数据,若每组数据的缺失数据超过缺失阈值,则删除该组数据,否则,保留该组数据。
示例性地,缺失阈值为30%,若一组数据包括:温度(15°)、染色时间(3分钟)、化抛时间(无数据)、浓度(30%),则该组数据缺失数据为化抛时间,缺失率为25%,小于缺失阈值,则可保留该组数据。
S206:依据所述第一中间数据形成输入数据。
具体地,依据物料数据的行数据和列数据确定物料数据中的缺失数据,并删除物料数据中缺失超过阈值的数据,以提升数据的完成性和有效性。
可选地,当确定物料数据中存在缺失数据之后,所述方法还包括:
确定缺失数据的数据种类,该数据种类包括常变量数据和常量数据,常变量数据是指数据呈现周期性,所述数据呈现周期性既可以是每个周期的数值都相同,如加工温度,以五次为一个周期,第一周期的加工温度都是55度,第二个周期的温度是56度等;也可以是周期性变化,如第一个周期的温度分别是55度、56度、55度、57度,59度,第二个周期的温度也分别是55度、56度、55度、57度,59度。常量数据为多次加工过程中保持不变,如加工温度始终是55度。
依据数据种类获取该缺失数据的值。具体地,若缺失数据的数据种类为常量数据,则该组数据中的缺失数据与该组中未缺失的数据的值均相同;若该缺失数据的数据种类为常变量数据,则进一步确定该数据种类每个周期内的值是否发生变化,如发生变化,则该缺失数据与下一个或上一个周期对应位置的值相同,如不发生变化,则该缺失数据与本周期的数据的其他位置的值相同。示例性地,加工数据存在缺失数据,则分别读取该缺失数据的前五组和后五组对应位置的加工数据;若该组数据前五个数据对应位置的值均相同且均为6;该组数据后五个数据对应位置的值分别为,5、5、5、5及4;则表明该数据为周期为5的常变量数据,且每个周期内的值不发生变化,因此缺失数据缺失数据与本周期的其他数据的值相同,则得出该缺失数据的值为5。
依据所述关联数据更新该缺失数据。如此,通过获取缺失数据的数据种类,依据数据种类确定该缺失数据的类型并更新缺失数据,通过补全缺失数据的值,以提升物料数据的完整性;同时通过补全该缺失数据,也可提升该物料数据的数据量。
阳极槽的加工机台数据的数据量较大,由于机台的检测设备检测异常等场景,常常存在加工机台输出的物料数据不准确或是与正常值差异太大,若使用该物料数据作为输入数据,则容易影响组合模型输出数据的准确性。
因此有必要对物料的数据进行进一步地处理。在一可选的实施例中,请参见图5,所述依据所述第一中间数据形成输入数据包括:
S301:确定所述多个物料加工参数的取值范围。
具体地,取值范围可为一个取值区间,例如,(3,5)。
S302:确定所述第一中间数据中超出对应所述取值范围的物料加工参数为异常数据。
具体地,判断第一中间数据中的物料加工参数是否在对应的取值范围内,若该取值范围内,则判定该物料加工参数为正常数据;否则,判定该物料加工参数为异常数据。
示例性地,物料加工参数为染色时间,染色时间的取值范围为(7分钟,12分钟),若第一中间数据中的染色时间为13分钟,由于该染色时间不在对应的取值范围内,所以该组数据中的染色时间为异常数据。
S303:删除所述第一中间数据中的异常数据,以得到第二中间数据;
S304:依据所述第二中间数据形成所述输入数据。
如此,通过删除第一中间数据中的异常数据,以提升物料数据的准确性,进一步地,通过提升输入数据的准确性,以提升组合模型数据结果的准确性。
在阳极槽输出的大量物料数据中,若物料数据的多个物料加工参数之间具有较高的相关性,该表示两个物料加工参数具有相似的趋势并且可能携带类似的信息;若多个物料加工参数中存在具有较高相关性的参数较多,会降低某些组模型的性能(例如线性和逻辑回归模型),也会导致运算量较大,运算速度慢。为了解决此类问题,可通过计算独物料加工参数之间的相关系数并删除相关系数大于相关阈值的物料加工参数中的一个,以提升物料数据的共线性,也降低计算量,加快运算速度。
因此,在一些实施例中,请参见图6,所述依据所述第二中间数据形成所述输入数据包括:
S401:确定所述第二中间数据中的多个物料加工参数间的第一相关系数。
具体地,可通过皮尔逊相关系数公式计算任意两个物料加工参数之间相关系数。其中,相关系数用于表征两个物料加工参数的相关性,相关系数的值越大,则两个物料加工参数的相关性越大;相关系数的值越小,则两个物料加工参数的相关性越小。
S402:确定所述第一相关系数大于第一预设阈值的两个物料加工参数为高相关参数组。
其中第一预设阈值可为用于预先设定的,例如第一预设阈值可为0.6。
S403:删除所述高相关参数组中其中一个物料加工参数以形成第三中间数据。
S404:依据所述第三中间数据形成所述输入数据。
如此,通过计算物料加工参数之间的相关系数,并删除多个物料加工参数中高相关参数组中的一个物料加工参数,以提升物料数据的共线性,降低计算量,加快运算速度。
在一实施例中,可通过高相关滤波方法以去除物料数据中具有共线性的数据。
物料数据的中多个物料加工参数中的一些对于物料加工结果影响较小,例如,阳极槽的浓液的高度限定值,该高度限定值仅用于保证阳极槽的安全性,但是该高度限定值对物料加工结果影响较小,可通过删除物料加工参数和所述物料加工结果参数之间相关性小于预设值的物料加工参数,以提升物料数据的准确性,也可进一步降低计算量,加快运算速度。
因此,在一些实施例中,请参见图7,所述依据所述第三中间数据形成所述输入数据包括:
S501:获取所述第三中间数据中的多个物料加工参数和所述物料加工结果参数之间的第二相关系数。
具体地,可通过皮尔逊相关系数公式计算任一个物料加工参数和对应的物料加工参数之间相关系数。
S502:确定所述第二相关系数小于第二预设阈值的物料加工参数为低相关参数。
S503:删除所述低相关参数组以形成第四中间数据;
S504:依据所述第四中间数据形成所述输入数据。
如此,删除与对应物料加工结果相关系数小于预设阈值的物料加工参数,以提升物料数据的精准性,进而提升组合模型的训练效率,也可进一步降低计算量,加快运算速度。
可选地,可通过低方差滤波已去除物料数据中对物料加工结果影响较小的物料加工参数。
在一些实施例中,可通过F_regrssion方法筛选与物料加工结果的相关度较大的物料加工加工参数,并可通过提升相关度较大的物料加工参数在物料数据中的比重,以提升物料数据的精准性。
在一些实施例中,预处理物料数据还包括编码格式处理,由于不同阳极槽加工机台输出的物料数据均具有不同的编码格式,因此将物料数据形成输入数据之前,首先将物料数据转换为统一格式,以便于数据的处理。
可选地,可将物料数据转换为onehot编码方式。
例如,由于阳极槽中物料的按照飞杆为单位进行加工,每个飞杆上挂设有多个物料,且每个飞杆与对应物料具有对应关系,可依据对应关系确定与物料对应的飞杆,并依据物料数据形成飞杆数据,其中飞杆数据为以飞杆为单位形成的物料数据,例如可依据每个物料的物料加工结果参数确定飞杆的物料加工结果。
示例性地,飞杆上包括5个物料,5个物料中4个物料为合格,1个物料为不合格,则飞杆的物料加工结果为80%,其中80%也为飞杆上物料的良率。
由于阳极槽输出的物料数据的种类繁多,物料数据中包括表示同一内容的多个物料加工参数,例如染色开始时间、染色结束时间及停留时间,其中停留时间可由染色开始时间和染色结束时间获得,但仅停留时间可直接作为组合模型的输入数据,因此还可以依据物料数据之间的关联关系对物料数据进行进一步处理。
因此,可选地,所述方法还包括:
确定物料数据中的多个物料加工参数的关联关系,其中关联关系标识多个物料加工参数的关联性,例如停留时间可由染色开始时间、染色结束时间直接获得,则停留时间与染色开始时间、染色结束时间关联关系。
依据关联关系确定关联参数组。
示例性地,染色开始时间、染色结束时间及停留时间可形成关联参数组。
确定关联参数中的使用权值并删除关联参数中的使用权值低的物料加工参数。
其中,使用权值是组合模型可使用该参数情况占比,例如,物料加工参数可直接作为输入数据,则该物料加工参数的使用权值为1;若通过关联参数组中的至少两个物料加工参数结合计算获得的数据可作为输入数据,则该物料加工参数的使用权值为0.5。
如此,通过删除物料数据表达相同内容数据,以提升物料数据的精简性,提升组合模型的训练速度。
可选地,利用贝叶斯调参法进行自动寻参,对需要寻找的参数及其赋值范围、寻参目标以及需要迭代的轮数进行设定,由机器自动寻找在指定迭代轮数中,满足所述寻参目标的一组参数值。以提升组合模型的精准性。
可选地,将输入数据输入组合模型之前,每个输入数据并行地进行N折交叉验证的计算过程,每个输入数据分为N个次子集,其中N-1个作为训练集,1个作为测试集,总共进行N轮交叉验证的计算(即每个输入数据进行N轮独立的计算,因此包括N个计算任务),每个计算任务配到计算机集群中的一个核上进行参数寻优,各计算任务并行执行,通过N折交叉验证,以增加组合模型的泛化性。
在一些实施例中,所述确定所述至少两个算法模型对应的第一权值包括:
获取测试样本。
其中测试样本可以为物料加工结果和多个物料加工参数。
将所述测试样本分别输入所述至少两个算法模型,以获取每种算法模型对应的子测试结果。
在一些实施例中,其中子测试结果可为算法模型的准确度。将测试样本输入算法模型,算法模型输出测试样本中每种物料加工参数的重要程度的占比,依据该占比和标准占比比较,该占比和标准占比的差值小于预设占比阈值,则判定该算法模型输出物料加工该参数的占比为准确;若该差值大于或等于预设占比阈值,则判定该算法模型输出物料加工该参数的占比为不准确,并确定每种算法模型输出的占比的准确度。
示例性地,将测试样本输入算法模型,算法模型输出:温度的占比为20%、染色时间的占比为30%、化抛时间的占比为40%、浓度的占比为10%,其中标准占比为:温度的占比为25%、染色时间的占比为25%、化抛时间的占比为43%、浓度的占比为7%,其中预设占比阈值为标准占比±4%,则算法模型输出的温度和染色时间占比为不准确,输出的化抛时间和浓度的占比为准确,则该算法模型输出的占比准确度为50%。
依据所述子测试结果确定每个算法模型对应的所述第一权值。
可选地,第一权值可为算法模型的准确度。
在一些实施例中,确定每个算法模型对应的第一权值的方法不限于利用上述准确度的方式,也可以使用前述使用均方误差的方式或均方根误差、平均绝对误差等方法确定。
如此,依据测试样本对算法模型进行测试以获得每个算法模型对应的测试结果,并依据测试结果确定每个算法模型对应的权值。
在一些实施例中,所述方法还包括:根据所述组合模型,确定所述关键参数对应的产品质量分布规则。
其中,产品质量分布规则为产品在不同的物料加工参数范围内的分布规律,例如物料加工结果为良率的产品主要分布在关键参数对应的取值范围内。
示例性地,组合模型输出的关键参数包括温度和浓度,则温度和浓度是影响物料加工结果的主要因素,在温度为20°至30°之间且浓度为30%至40%之间的范围内,产品良率为70%,在温度大于40度或小于15度,或浓度大于45%或小于25%时,产品良率小于50%,则产品良率主要分布在温度为20°至30°之间且浓度为30%至40%之间,且产品不良主要分布在温度大于40度或小于15度,或浓度大于45%或小于25%的范围。
在一些实施例中,所述物料数据为物料的阳极染色数据,所述物料加工结果参数为物料的阳极染色质量数据,所述物料加工参数为物料的阳极染色参数数据。
其中,物料的阳极染色质量数据可为单个物料的合格和不合格,当然,物料的阳极染色质量数据还可为染色结果值,可依据染色结果值与预设的染色标准值进行比较以确定该物料是否合格,物料结果参数还可为多个物料(如一个飞杆上的所有物料)在阳极槽中加工之后的的良率值。
下面结合图8,对实现关键参数确定装置600的硬件架构进行介绍。应上述内容可见,本申请实施例仅为说明之用,在本申请范围内并不受此结构的限制。
请参见图8,图8为本申请一些实施例提供的关键参数确定装置600的硬件架构图。关键参数确定装置600用于确定物料数据中的关键参数。关键参数确定装置600包括通信器602、处理器604,通信器602与处理器604耦接,以实现数据传输,在图示的实施例中,通信器602与处理器604通过通讯总线608耦接。
通信器602用于接收物料数据。物料数据可以是处理器604发送给通信器602的,也可以是其他输入设备发送给通信器602的。通信器602还用于耦接关键参数确定装置600的各个部分,用于在各个部分之间发送信息。
处理器604可以为中央处理器(CPU,Central Processing Unit),还可以包括其他通用处理器、数字信号处理器(DSP,Digital Signal Processor)、专用集成电路(ASIC,Application Specific Intergrated Circuit)、现场可编程门阵列(FPGA,Field-Programmable Gate Array)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,处理器604是关键参数确定装置的控制中心,利用各种接口和线路连接整个关键参数确定装置的各个部分。
在一些实施例中,关键参数确定装置600还包括存储器606,通信器602、存储器606通过通讯总线608与处理器604耦接。存储器606用于存储关键参数确定装置中的各类数据,例如各种数据库、程序代码等。在本实施方式中,存储器606可以包括但不限于只读存储器(ROM,Read-Only Memory)、随机存储器(RAM,Random Access Memory)、可编程只读存储器(PROM,Programmable Read-Only Memory)、可擦除可编程只读存储器(EPROM,ErasableProgrammable Read-Only Memory)、电子擦除式可复写只读存储器(EEPROM,Electrically-Erasable Programmable Read-Only Memory)、只读光盘(CD-ROM,CompactDisc Read-Only Memory)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
存储器606中存储有关键参数确定程序610,关键参数确定程序610配置为实现如上所述的关键参数确定方法的步骤。
示例性的,关键参数确定程序610可被分割成一个或多个模块/单元,一个或多个模块/单元被存储在存储器606中,并由处理器604执行,以实现本申请的关键参数确定功能。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,指令段用于描述关键参数确定程序610在关键参数确定装置600中的执行过程。
本申请的一些实施例中还提供一种电子装置,所述电子装置包括处理器和存储器,所述存储器用于存储指令,所述处理器用于调用所述存储器中的指令,使得所述电子装置执行如上所述的关键参数确定方法。
本申请一些实施例中还提供了一种计算机可读存储介质,其上存储有关键参数确定程序,关键参数确定程序被处理器执行时实现如上所述的关键参数确定方法。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其他的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。
最后应说明的是,以上实施例仅用以说明本申请的技术方案而非限制,尽管参照较佳实施例对本申请进行了详细说明,本领域的普通技术人员应当理解,可以对本申请的技术方案进行修改或等同替换,而不脱离本申请技术方案的精神和范围。
Claims (12)
1.一种关键参数确定方法,其特征在于,所述方法包括:
获取物料数据,所述物料数据包括物料加工结果参数和多个物料加工参数;
预处理所述物料数据,以获得输入数据;
将所述输入数据输入至少两个算法模型,得到每种所述算法模型对应的第一权值,以得到一组合模型,所述组合模型包括至少两个算法模型;
根据所述组合模型确定所述多个物料加工参数的每个物料加工参数的第二权值,并根据所述第二权值确定所述多个物料加工参数中的所述关键参数。
2.如权利要求1所述的方法,其特征在于,所述预处理所述物料数据包括:
获取所述物料数据的尺寸数据,所述尺寸数据包括多个行数据和多个列数据;
依据所述行数据和所述列数据确定行缺失值和列缺失值;
确定所述列缺失值超过第一阈值对应的物料数据为第一缺失数据;
确定所述行缺失值超过第二阈值对应的物料数据为第二缺失数据;
删除所述物料数据中所述第一缺失数据对应的列数据和所述第二缺失数据对应的行数据,以得到第一中间数据;
依据所述第一中间数据形成输入数据。
3.如权利要求2所述的方法,其特征在于,所述依据所述第一中间数据形成输入数据包括:
确定所述多个物料加工参数的取值范围;
确定所述第一中间数据中超出对应所述取值范围的物料加工参数为异常数据;
删除所述第一中间数据中的异常数据,以得到第二中间数据;
依据所述第二中间数据形成所述输入数据。
4.如权利要求3所述的方法,其特征在于,所述依据所述第二中间数据形成所述输入数据包括:
确定所述第二中间数据中的多个物料加工参数间的第一相关系数;
确定所述第一相关系数大于第一预设阈值的两个物料加工参数为高相关参数组;
删除所述高相关参数组中其中一个物料加工参数以形成第三中间数据
依据所述第三中间数据形成所述输入数据。
5.如权利要求4所述的方法,其特征在于,所述依据所述第三中间数据形成所述输入数据包括:
获取所述第三中间数据中的多个物料加工参数和所述物料加工结果参数之间的第二相关系数;
确定所述第二相关系数小于第二预设阈值的物料加工参数为低相关参数;
删除所述低相关参数组以形成第四中间数据;
依据所述第四中间数据形成所述输入数据。
6.如权利要求1所述的方法,其特征在于,所述组合模型包括三种算法模型,所述三种算法模型为判定树模型、随机森林模型及xgboost模型。
7.如权利要求1所述的方法,其特征在于,确定所述至少两个算法模型对应的第一权值的方法包括:
获取测试样本;
将所述测试样本分别输入所述至少两个算法模型,以获取每种算法模型对应的子测试结果;
依据所述子测试结果确定每个算法模型对应的所述第一权值。
8.如权利要求1所述的方法,其特征在于,所述方法还包括:根据所述组合模型,确定所述关键参数对应的产品质量分布规则。
9.如权利要求1所述的方法,其特征在于,所述物料数据为物料的阳极染色数据,所述物料加工结果参数为物料的阳极染色质量数据,所述物料加工参数为物料的阳极染色参数数据。
10.一种关键参数确定装置,其特征在于,所述装置包括:
通信器,所述通信器用于获取物料数据,所述物料数据包括物料加工结果参数和多个物料加工参数;
处理器,耦接所述通信器,用于:
预处理所述物料数据,以获得输入数据;将所述输入数据输入至少两个算法模型,得到每种所述算法模型对应的第一权值,以得到一组合模型,所述组合模型包括至少两个算法模型;
所述处理器还用于根据所述组合模型确定所述多个物料加工参数的每个物料加工参数的第二权值,并根据所述第二权值确定所述多个物料加工参数中的所述关键参数。
11.一种电子装置,其特征在于,所述电子装置包括处理器和存储器,所述存储器用于存储指令,所述处理器用于调用所述存储器中的指令,使得所述电子装置执行如权利要求1至9中任一项所述的关键参数确定方法。
12.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,其特征在于,所述计算机可读指令被处理器执行时实现如权利要求1至9中任一项所述的关键参数确定方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111410820.4A CN113836826A (zh) | 2021-11-25 | 2021-11-25 | 关键参数确定方法、装置、电子装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111410820.4A CN113836826A (zh) | 2021-11-25 | 2021-11-25 | 关键参数确定方法、装置、电子装置及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113836826A true CN113836826A (zh) | 2021-12-24 |
Family
ID=78971710
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111410820.4A Pending CN113836826A (zh) | 2021-11-25 | 2021-11-25 | 关键参数确定方法、装置、电子装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113836826A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116277588A (zh) * | 2022-02-08 | 2023-06-23 | 苏州博之顺材料科技有限公司 | 一种改性塑料粒子生产预警方法和系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109613891A (zh) * | 2018-11-06 | 2019-04-12 | 北京航空航天大学 | 数控加工过程关键参数识别方法、装置及设备 |
WO2020220221A1 (zh) * | 2019-04-29 | 2020-11-05 | 西门子股份公司 | 生产设备的加工参数设置方法、装置和计算机可读介质 |
WO2021142622A1 (zh) * | 2020-01-14 | 2021-07-22 | 京东方科技集团股份有限公司 | 确定不良原因的方法、电子设备、存储介质及系统 |
CN113469288A (zh) * | 2021-07-29 | 2021-10-01 | 长三角信息智能创新研究院 | 融合多个机器学习算法的高危人员预警方法 |
CN113537751A (zh) * | 2021-07-09 | 2021-10-22 | 联通(浙江)产业互联网有限公司 | 影响磨加工产品质量要素的确定方法和装置 |
-
2021
- 2021-11-25 CN CN202111410820.4A patent/CN113836826A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109613891A (zh) * | 2018-11-06 | 2019-04-12 | 北京航空航天大学 | 数控加工过程关键参数识别方法、装置及设备 |
WO2020220221A1 (zh) * | 2019-04-29 | 2020-11-05 | 西门子股份公司 | 生产设备的加工参数设置方法、装置和计算机可读介质 |
WO2021142622A1 (zh) * | 2020-01-14 | 2021-07-22 | 京东方科技集团股份有限公司 | 确定不良原因的方法、电子设备、存储介质及系统 |
CN113537751A (zh) * | 2021-07-09 | 2021-10-22 | 联通(浙江)产业互联网有限公司 | 影响磨加工产品质量要素的确定方法和装置 |
CN113469288A (zh) * | 2021-07-29 | 2021-10-01 | 长三角信息智能创新研究院 | 融合多个机器学习算法的高危人员预警方法 |
Non-Patent Citations (2)
Title |
---|
刘军等: "《基因芯片制备及数据分析技术》", 31 May 2015, 西安电子科技大学出版社 * |
吕佑龙等: "基于混合式特征选择模型的晶圆允收测试关键参数识别方法", 《中国机械工程》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116277588A (zh) * | 2022-02-08 | 2023-06-23 | 苏州博之顺材料科技有限公司 | 一种改性塑料粒子生产预警方法和系统 |
CN116277588B (zh) * | 2022-02-08 | 2024-01-02 | 苏州博之顺材料科技有限公司 | 一种改性塑料粒子生产预警方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110245802B (zh) | 基于改进梯度提升决策树的卷烟空头率预测方法及系统 | |
CN113092981B (zh) | 晶圆数据检测方法及系统、存储介质及测试参数调整方法 | |
JP4394728B2 (ja) | 影響要因特定装置 | |
CN107168995B (zh) | 一种数据处理方法及服务器 | |
CN108681751B (zh) | 确定事件影响因素的方法及终端设备 | |
CN110222387B (zh) | 基于混合漏积分crj网络的多元钻井时间序列预测方法 | |
CN114819636B (zh) | 一种基于spc检测的工业生产数据处理方法及系统 | |
US20230161842A1 (en) | Parameter setting method, parameter setting device, and electronical device | |
CN115083549B (zh) | 一种基于数据挖掘的产品原料配比逆向推导方法 | |
JP2023511464A (ja) | 製品不良要因を分析するシステム及び方法、コンピュータ可読媒体 | |
CN112907026A (zh) | 一种基于可编辑网状指标体系的综合评估方法 | |
CN113836826A (zh) | 关键参数确定方法、装置、电子装置及存储介质 | |
CN111860698A (zh) | 确定学习模型的稳定性的方法和装置 | |
CN109886288B (zh) | 一种用于电力变压器的状态评价方法及装置 | |
CN111967168A (zh) | 一种加速退化试验方案优化设计方法 | |
CN114219461B (zh) | 基于多生产工况的生产控制方法和装置 | |
CN112395280B (zh) | 一种数据质量检测方法及其系统 | |
CN115270861A (zh) | 一种产品成分数据监测方法、装置、电子设备及存储介质 | |
CN115436342A (zh) | 降低多批次样本间libs检测不确定性的方法及装置 | |
CN113610350B (zh) | 复杂工况故障诊断方法、设备、存储介质及装置 | |
CN112328951B (zh) | 一种分析样品的实验数据的处理方法 | |
CN111026661B (zh) | 一种软件易用性全面测试方法及系统 | |
CN115222114A (zh) | 汽车零部件装配指标值预测方法、终端设备及存储介质 | |
Heo et al. | A modified lasso model for yield analysis considering the interaction effect in a multistage manufacturing line | |
TWI755995B (zh) | 對工程資料進行篩選以得到特徵的方法與系統、對工程資料進行多次篩選以得到特徵的方法、產生預測模型的方法以及將工程資料線上特徵化的系統 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20211224 |
|
WD01 | Invention patent application deemed withdrawn after publication |