CN114186732A - 助训练框架下的质量变量预测方法、装置终端及介质 - Google Patents
助训练框架下的质量变量预测方法、装置终端及介质 Download PDFInfo
- Publication number
- CN114186732A CN114186732A CN202111502375.4A CN202111502375A CN114186732A CN 114186732 A CN114186732 A CN 114186732A CN 202111502375 A CN202111502375 A CN 202111502375A CN 114186732 A CN114186732 A CN 114186732A
- Authority
- CN
- China
- Prior art keywords
- learning model
- training
- data set
- sample data
- unlabeled
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Software Systems (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Game Theory and Decision Science (AREA)
- General Business, Economics & Management (AREA)
- Educational Administration (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请关于一种助训练框架下的质量变量预测方法、装置、终端及存储介质,涉及复杂工业过程建模和故障诊断领域。该方法包括:获取待测数据集、有标签样本数据集以及无标签样本数据集;建立初始主学习模型以及与初始主学习模型对应的初始辅学习模型;对初始主学习模型以及初始辅学习模型进行训练;建立质量变量预测模型;将待测数据组输入质量变量预测模型。在预测的过程中,通过预先进行的无标签样本数据集以及有标签样本数据集的组合训练,在选取高全局信息含量的无标签样本数据集的基础上,提高了质量变量预测模型的质量,使无标签样本数量较多的场景下,质量变量的预测有了稳定且具体的途径,提高了对于质量变量进行预测的准确率和效率。
Description
技术领域
本申请涉及复杂工业过程建模和故障诊断领域,特别涉及一种助训练框架下的质量变量预测方法、装置、终端及存储介质。
背景技术
复杂工业过程广泛存在于炼油、化工等领域,具有多变量、强耦合、强非线性、随机性、大时滞、输出不能在线测量、工况变化大等特点,难以用准确的数学模型描述。
为对于复杂工业过程进行解析,在对于复杂工业过程进行对应分析时,需要确定工业过程当中的质量变量。通常情况下,质量变量的变化情况可以反映复杂工业过程的工况是否正常。在进行质量变量的测量时,通常需要确定与质量变量相关的工况数据,基于工况数据进行样本集的构建,并通过样本集对于质量变量进行预测。
然而,相关技术当中,在自动测量复杂工业过程的质量变量的场景下,大部分样本集都无法附带对应的质量变量测量结果,也即,均为无标签样本数据集。在此情况下,难以基于复杂的样本集确定对于质量变量的具体预测方式,致使对于质量变量的测量的效率以及准确率较低。
发明内容
本申请关于一种助训练框架下的质量变量预测方法、装置、终端及存储介质,能够提高对于质量变量的检测效率以及准确率。该技术方案如下:
一方面,提供了一种助训练框架下的质量变量预测方法,该方法包括:
获取待测数据集、有标签样本数据集以及无标签样本数据集,有标签样本数据集中包括至少两组有标签样本数据组,以及与有标签样本数据组对应的样本质量变量数值,无标签样本数据集中包括至少两组无标签样本数据组,待测数据集中包括至少两组待测数据组;
建立初始主学习模型以及与初始主学习模型对应的初始辅学习模型,初始辅学习模型用于进行无标签样本数据的初步标注,初始主学习模型用于基于初步标注的结果进行有标签样本数据集的扩充;
通过无标签样本数据集以及有标签样本数据集对初始主学习模型以及初始辅学习模型进行训练,得到主学习模型以及辅学习模型;
基于主学习模型以及辅学习模型建立质量变量预测模型;
将待测数据组输入质量变量预测模型,输出得到与待测数据组对应的质量变量预测结果。
另一方面,提供了一种质量变量的预测装置,该装置包括:
获取模块,用于获取待测数据集、有标签样本数据集以及无标签样本数据集,有标签样本数据集中包括至少两组有标签样本数据组,以及与有标签样本数据组对应的样本质量变量数值,无标签样本数据集中包括至少两组无标签样本数据组,待测数据集中包括至少两组待测数据组;
建立模块,用于建立初始主学习模型以及与初始主学习模型对应的初始辅学习模型,初始辅学习模型用于进行无标签样本数据的初步标注,初始主学习模型用于基于初步标注的结果进行有标签样本数据集的扩充;
训练模块,用于通过无标签样本数据集以及有标签样本数据集对初始主学习模型以及初始辅学习模型进行训练,得到主学习模型以及辅学习模型;
建立模块,还用于基于主学习模型以及辅学习模型建立质量变量预测模型;
输入模块,用于将待测数据组输入质量变量预测模型,输出得到与待测数据组对应的质量变量预测结果。
另一方面,提供了一种计算机设备,计算机设备包括处理器和存储器,存储器中存储有至少一条指令、至少一段程序、代码集或指令集,处理器可加载并执行至少一条指令、至少一段程序、代码集或指令集,以实现上述本申请实施例中提供的助训练框架下的质量变量预测方法。
另一方面,提供了一种计算机可读存储介质,可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,处理器可加载并执行至少一条指令、至少一段程序、代码集或指令集,以实现上述本申请实施例中提供的助训练框架下的质量变量预测方法。
另一方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机程序指令,该计算机程序指令存储于计算机可读存储介质中。处理器从计算机可读存储介质读取该计算机指令,并执行该计算机指令,使得该计算机设备执行如本申请实施例中提供的助训练框架下的质量变量预测方法。
本申请提供的技术方案带来的有益效果至少包括:
在进行复杂工业过程的质量变量确定的过程中,针对有标签样本数据组数量较少,且无标签样本数量较多的情况,在对待测数据集进行质量变量的预测之前,分别建立初始辅学习模型以及初始主学习模型,在对样本集进行扩充的同时对自身进行训练,最终生成质量变量预测模型,以对于待测数据集进行质量变量的预测。在预测的过程中,通过预先进行的无标签样本数据集以及有标签样本数据集的组合训练,在选取高全局信息含量的无标签样本数据集的基础上,提高了质量变量预测模型的质量,使无标签样本数量较多的场景下,质量变量的预测有了稳定且具体的途径,提高了对于质量变量进行预测的准确率和效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本申请一个示例性实施例提供的一种助训练框架下的质量变量预测方法的流程示意图;
图2示出了本申请一个示例性实施例提供的一种助训练框架下的质量变量预测方法的过程示意图;
图3示出了本申请一个示例性实施例提供的一种助训练框架下的质量变量预测方法的过程示意图;
图4示出了本申请一个示例性实施例提供的一种质量变量的预测装置的结构框图;
图5示出了本申请一个示例性实施例提供的另一种质量变量的预测装置的结构框图;
图6示出了本申请一个示例性实施例提供的一种执行助训练框架下的质量变量预测方法的计算机设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
首先,对本申请中出现的名词进行解释:
人工智能(Artificial Intelligence,AI),是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。人工智能企图了解智能的实质,并生产出一种能以人类智能相似的方式做出反应的智能机器。人工智能目的是使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛。人工智能基础技术包括但不限于传感器技术、人工智能芯片技术、云计算技术、大数据处理技术、机电一体化技术。本申请实施例中所应用的人工智能技术为机器学习技术,且该机器学习设备应用于计算机设备当中。
机器学习(Machine Learning,ML),是一门多领域交叉学科,涉及概率论、统计学、算法复杂度理论等多个学科领域。机器学习学科专门用于研究计算机怎样模拟或实现人类的学习行为,以使计算机获取新的知识,重新组织已有的知识结构,进而改善自身性能。机器学习通常与深度学习相结合,机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。
复杂工业过程,是一类特殊的工业过程,其广泛存在于炼油、化工等领域,具有多变量、强耦合、强非线性、随机性、大时滞、输出不能在线测量、工况变化大等特点,难以用准确的数学模型描述。
对应不同的工业过程,有不同的变量最能表征工业过程的工作状态。该类变量即为工业过程的质量变量。在复杂工业过程中,质量变量的监测难度较大。在此情况下,计算机设备可以对应某一时刻进行工况数据的获取,在获取至少一个参数,生成数据集,并获取到对应数据集的质量变量数值后,该工况数据即为有标签样本数据组;在获取至少一个参数,但未获取到对应数据集的质量变量数值后,该工况数据即为无标签样本数据组。
在本申请中,将列举脱丁烷塔的工作过程、青霉素发酵过程以及硫回收装置是对含硫气体进行处理的过程作为复杂工业过程的三个典型示例。
A、脱丁烷塔的工作过程
脱丁烷塔,是天然气乙烷回收过程中的关键设备之一,其主要功能是完成液化气与稳定轻烃组分分离。在脱丁烷塔的工作过程中,其各个部位的工作状态和工作温度将会发生变化。在一个示例中,当脱丁烷塔处于工作状态时,其塔顶温度、塔顶压力、回流量、下一级流量、塔板温度和塔底不同区域的共计两个温度将会发生变化。在本申请实施例中,为检测天然气回收乙烷过程当中的炼油质量,需要对塔底出气口的丁烷含量进行实时检测。在此情况下,获取丁烷浓度的方法包括但不限于以下两种:
(1)、通过诸如将丁烷浓度传感器直接设置在塔底出气口的方式,通过物理方法直接获取丁烷浓度。
(2)、基于上述七个参数建立软测量模型,将上述七个参数输入软测量模型当中,输出得到对于丁烷浓度的预测值。
由于脱丁烷塔的排出介质成分复杂,且在实际应用过程中,丁烷浓度传感器难以在设置之后进行持续的浓度检测。也即,在脱丁烷塔工作过程中,丁烷浓度是一项质量变量。
在此情况下,计算机设备可以对应某一时刻进行工况数据的获取,在获取上述七个参数,并获取到与上述七个参数对应的丁烷浓度数据时,该工况数据即为有标签样本数据组;在获取上述七个参数,但并未获取到对应的丁烷浓度数据时,该工况数据即为无标签样本数据组。
B、青霉素发酵过程
青霉素发酵过程是指青霉素产生菌在适合的环境下进行菌体生长和抗生素合成的代谢活动,主要包含产生菌的生长阶段、青霉素合成阶段和产生菌的自溶阶段,在青霉素发酵过程中搅拌机功率(W)、曝气速率(L/h)、底物进料速率(L/h)、进料温度(K)、溶解氧(mmole/L)PH值、发酵罐温度(K)、二氧化碳浓度(mmole/L)、培养体积(L)、产生的热量(卡路里)等9个参数都会对青霉素浓度产生影响。在本申请实施例中,为了减少青霉素发酵过程的生产成本同时提高产品产量,需要尽可能地实现过程的自动控制与优化,然而这些都依赖于过程中产物浓度等关键生物参数的在线准确测量。在此情况下,获取青霉素浓度的方法包括但不限于以下两种:
(1)、通过传感器直接获取青霉素浓度,然而通过传感器获得的青霉素浓度具有时滞性,是已发酵完成的青霉素浓度,无法对将要产生的青霉素浓度进行调控。
(2)、基于上述9个参数中的至少一个参数建立软测量模型,将上述9个参数中的至少一个参数输入软测量模型当中,输出得到对于青霉素浓度的预测值。
在此情况下,计算机设备可以对应某一时刻进行工况数据的获取,在获取上述九个参数,并获取到与上述九个参数对应的青霉素浓度数据时,该工况数据即为有标签样本数据组;在获取上述九个参数,但并未获取到对应的青霉素浓度数据时,该工况数据即为无标签样本数据组。
C、硫回收装置对含硫气体进行处理的过程
硫回收装置是对含硫气体进行处理,防止对大气造成污染的装置。硫回收过程的主导变量为H2S浓度和SO2浓度,H2S浓度和SO2浓度在工业过程中无法直接通过传感器测量得到,因此需要构建精确的软测量模型实时监控H2S浓度和SO2浓度。气体流,初级空气流,二级空气流,预设位置区域气体流,预设位置区域空气流这5个参数都会对H2S浓度和SO2浓度产生影响。在本申请实施例中,预设位置指示SWS区域。基于上述5个参数建立软测量模型,将上述5个参数输入软测量模型当中,输出得到H2S浓度和SO2浓度的预测值。也即,在硫回收装置对含硫气体进行处理的过程中,质量变量包括H2S浓度和SO2浓度。
在此情况下,计算机设备可以对应某一时刻进行工况数据的获取,在获取上述五个参数,并获取到与上述五个参数对应的青霉素浓度数据时,该工况数据即为有标签样本数据组;在获取上述五个参数,但并未获取到对应的青霉素浓度数据时,该工况数据即为无标签样本数据组。
图1示出了本申请一个示例性实施例提供的一种助训练框架下的质量变量预测方法的流程示意图,请参考图1,该方法包括:
步骤101,获取待测数据集、有标签样本数据集以及无标签样本数据集。
在本申请实施例中,有标签样本数据集中包括至少两组有标签样本数据组,以及与有标签样本数据组对应的样本质量变量数值,无标签样本数据集中包括至少两组无标签样本数据组,待测数据集中包括至少两组待测数据组。
在本申请实施例中,样本即指示与数据组对应的质量变量的具体数值。在一些情况下,质量变量的具体数值可以通过不确定的测量方式进行获取。本申请对于样本标签的生成方式不作限定。
在本申请实施例中,待测数据集,有标签样本数据集以及无标签样本数据集均对应指示复杂工业过程中的工况。以脱丁烷塔的工作情况为例进行说明,各个数据集即指示与某一工况对应的七个参数,也即,塔顶温度、塔顶压力、回流量、下一级流量、塔板温度和塔底不同区域的两个温度。本申请实施例对于复杂工业过程中数据集的实际实现形式不作限定,但每个数据集中均需要包括表征化工过程的工作状态的参数。
步骤102,建立初始主学习模型以及与初始主学习模型对应的初始辅学习模型。
在本申请实施例中,初始辅学习模型用于进行无标签样本数据的初步标注,初始主学习模型用于基于对于样本集的初步标注的结果进行有标签样本数据集的扩充。
可选地,初始辅学习模型以及初始主学习模型均为基于计算机设备中已定义的初始参数,构建的模型,其用于对有标签样本数据集以及无标签样本数据集进行数据整理以及特征提取。在本申请实施例中,需要将初始主学习模型以及初始辅学习模型串联使用,以对有标签样本数据集和无标签样本数据集进行数据整理。
步骤103,通过无标签样本数据集以及有标签样本数据集对初始主学习模型以及初始辅学习模型进行训练,得到主学习模型以及辅学习模型。
在初始辅学习模型以及初始主学习模型在执行对应功能的过程中,计算机设备会基于其样本的划分结果的准确度以及工作速度对于模型进行同时训练,在训练完成之后,初始主学习模型即被训练生成主学习模型,初始辅学习模型即被训练生成辅学习模型。主学习模型和辅学习模型在训练过程中,经过了参数的多轮调整。
步骤104,基于主学习模型以及辅学习模型建立质量变量预测模型。
在本申请实施例中,质量变量预测模型由主学习模型和辅学习模型串联形成。在本申请的其他实施例中,质量变量预测模型所对应的结构参数由主学习模型以及辅学习模型选取构成,本申请对于质量变量预测模型的结构参数来源形式不作限定。
步骤105,将待测数据组输入质量变量预测模型,输出得到与待测数据组对应的质量变量预测结果。
在完成对于质量变量预测模型的构建之后,即将待测数据组输入质量变量预测模型中,输出得到与待测数据集中的待测数据组对应的质量变量预测结果。在脱丁烷塔的工作过程中,质量变量即为丁烷浓度数值。
在本申请实施例中,获取质量变量的预测结果后,可以根据预测的质量变量确定与质量变量相对应的数据组,或,根据预测得到的质量变量生成质量变量曲线,以确定对应化工过程的工作状态。
综上所述,本申请实施例提供的方法,在进行复杂工业过程的质量变量确定的过程中,针对有标签样本数据组数量较少,且无标签样本数量较多的情况,在对待测数据集进行质量变量的预测之前,分别建立初始辅学习模型以及初始主学习模型,在对样本集进行扩充的同时对自身进行训练,最终生成质量变量预测模型,以对于待测数据集进行质量变量的预测。在预测的过程中,通过预先进行的无标签样本数据集以及有标签样本数据集的组合训练,在选取高全局信息含量的无标签样本数据集的基础上,提高了质量变量预测模型的质量,使无标签样本数量较多的场景下,质量变量的预测有了稳定且具体的途径,提高了对于质量变量进行预测的准确率和效率。
图2示出了本申请一个示例性实施例提供的一种助训练框架下的质量变量预测方法的流程示意图,请参考图2,该过程包括:
步骤201,获取待测数据集、有标签样本数据集以及无标签样本数据集。
该过程与步骤101中所示的过程相同,在此不作赘述。
步骤202,建立初始主学习模型以及与初始主学习模型对应的初始辅学习模型。
该过程与步骤102中所示的过程相同,在此不作赘述。
需要说明的是,在本申请实施例中,辅学习模型为基于K最邻近(K-NearestNeighbor,KNN)算法的机器学习模型。主学习模型为基于孪生支持向量回归(TwinSupport Vector Regression,TSVR)算法的机器学习模型。
步骤203,在无标签样本数据集中随机选取至少两个无标签样本数据组,得到无标签训练数据集。
在本申请实施例中,在构建初始主学习模型以及初始辅学习模型之后,步骤203至步骤215即说明了对于初始主学习模型以及初始辅学习模型的调整过程。
需要说明的是,该初始主学习模型以及初始辅学习模型的构建过程循环过程,在本申请实施例中,在初始主学习模型以及初始辅学习模型的训练未完成时,该训练过程将会循环执行。在本申请实施例中,设该循环次数,也即迭代次数为P。
可选地,步骤203所示的过程基于无标签样本数据集确定对初始辅学习模型进行样本集构建的过程。在该过程中,选用随机选取的方式,进行新的样本集,也即,无标签训练数据集的过程。
步骤204,基于无标签训练集中的无标签样本数据组,在有标签样本数据集中选取无标签样本数据组的至少两个近邻样本数据组。
在本申请实施例中,对应每个无标签训练集中的无标签样本数据组,需要进行近邻样本的选择,以对于无标签训练集中的样本进行样本赋值,在本申请实施例中,对照无标签训练集中的无标签样本,本申请实施例中通过有标签样本数据集,确定至少两个近邻样本数据组。
步骤205,基于至少两个近邻样本数据组,生成有标签训练数据集。
在本申请实施例中,有标签训练数据集即为基于至少两个近邻样本数据组,生成的样本数据集。
步骤206,通过有标签样本数据集以及无标签训练数据集对初始辅学习模型进行训练,得到辅学习模型。
步骤207,响应于辅学习模型训练完成,将无标签样本数据组输入辅学习模型,输出与无标签样本数据组对应的置信度数值。
在本申请实施例中,对于辅学习模型的训练可以通过有标签样本数据集以及无标签样本数据集的组合输入进行。可选地,将有标签样本数据集,或,无标签样本数据集中的一个数据组输入辅学习模型中,根据辅学习模型的输出结果,也即,置信度数值,进行输入后续输入主训练模型中的样本集确定过程。
可选地,在本申请实施例中,置信度数值的获取公式如下公式1所示:
式中,yi表示输入xi的真实标签值,U指示xu在有标签样本数据集M中的近邻样本集,k为近邻样本的个数,h(xi)以及h′(xi)分别为初始辅学习模型对于xu的预测值,以及训练后的辅学习模型对于xu的预测值。
步骤208,基于置信度数值从无标签样本训练集中筛选得到至少两个高置信度无标签样本数据组。
在进行性置信度数值的输出后,在本申请实施例中,即可基于置信度数值由大到小的排序,从通过辅学习模型的置信度结果中,选取置信度数值较高的至少两个高置信度无标签样本数据组,作为后续训练样本集的一部分。
步骤209,基于高置信度无标签样本数据组生成主学习模型训练样本集。
在本申请实施例中,高置信度无标签样本数据组即可作为主学习模型训练样本集的一部分。可选地,主学习模型训练样本集中的样本数据组内包括所有的高置信度无标签样本数据组,或,主学习模型训练样本集中包括至少两个高置信度无标签样本数据组。
步骤210,将主学习模型训练样本集输入初始主学习模型,输出得到伪标签训练样本集。
在本申请实施例中,初始主学习模型会对于主学习模型训练样本集进行伪标签训练样本集的生成。
步骤211,通过伪标签训练样本集对有标签数据集进行扩充。
在本申请实施例中,对主学习模型进行训练的样本集除了伪标签训练样本集外,还包括有标签数据集,故在得到伪标签训练样本集后,对有标签数据集进行扩充。
步骤212,将扩充后的有标签数据集中的有标签数据组输入初始主学习模型,输出得到与有标签数据组对应的均方误差。
在本申请实施例中,均方误差的获取公式如下公式2所示:
在如上所示的公式2中,(xi,yi)为有标签样本数据集M中的样本,yi表示输入xi的真实标签值;yi′为新的主学习器对xi添加的伪标签,即yi′=g′(xi)。
步骤213,基于均方误差对初始主学习模型进行训练,得到主学习模型。
该过程即为对于初始主学习模型进行训练的过程。
步骤214,确定与主学习模型的训练次数对应的第一迭代次数,以及与辅学习模型的训练次数对应的第二迭代次数。
步骤215,响应于第一迭代次数达到第一次数阈值,确定主学习模型的训练完成。
步骤216,响应于第二迭代次数达到第二次数阈值,确定辅学习模型的训练完成。
步骤214至步骤216所示的过程即为确定主学习模型以及辅学习模型是否训练充分的过程。在本申请实施例中,计算机设备对应主学习模型的训练情况,设置有第一次数阈值,且对应辅学习模型的训练情况,设置有第二次数阈值。当主学习模型的训练次数达到第一次数阈值,且辅学习模型的训练次数达到第二次数阈值时,即确定两个模型训练完成。
需要说明的是,次数阈值可以是计算机设备内预存的数值,也可以是在计算机设备对于模型进行训练的过程中,基于接收到的信号确定的数值,本申请对于次数阈值的实际确定形式不做限定。
步骤217,基于主学习模型以及辅学习模型建立质量变量预测模型。
该过程即为在主学习模型以及辅学习模型训练完成之后,基于主学习模型以及辅学习模型的参数,进行质量变量预测模型的构建的过程。
步骤218,将待测数据组输入质量变量预测模型,输出得到与待测数据组对应的质量变量预测结果。
该过程与步骤105所示的过程对应,在此不作赘述。
综上所述,本申请实施例提供的方法,在进行复杂工业过程的质量变量确定的过程中,针对有标签样本数据组数量较少,且无标签样本数量较多的情况,在对待测数据集进行质量变量的预测之前,分别建立初始辅学习模型以及初始主学习模型,在对样本集进行扩充的同时对自身进行训练,最终生成质量变量预测模型,以对于待测数据集进行质量变量的预测。在预测的过程中,通过预先进行的无标签样本数据集以及有标签样本数据集的组合训练,在选取高全局信息含量的无标签样本数据集的基础上,提高了质量变量预测模型的质量,使无标签样本数量较多的场景下,质量变量的预测有了稳定且具体的途径,提高了对于质量变量进行预测的准确率和效率。
图3示出了本申请一个示例性实施例提供的一种助训练框架下的质量变量预测方法的过程示意图,请参考图3,该过程包括:
步骤301,初始化。
该过程即为将初始主学习模型以及初始辅学习进行对应建议以及参数初始化的过程。
步骤302,获取无标签样本集N。
步骤303,获取有标签样本集M。
步骤304,获取样本H。
步骤302至步骤304所示的过程即为分别获取有标签样本数据集、无标签样本数据集以及待测样本集的过程。
步骤305,随机选取出n个无标签样本数据组组成样本集N’。
该过程即为生成无标签样本数据组的过程。
步骤306,训练辅学习器。
该过程即为对于初始辅学习模型进行训练,得到辅学习模型的过程。
步骤307,辅学习器置信度评估。
在辅学习模型训练完成,或,辅学习模型的训练达到一定训练程度时,通过辅学习模型确定与输入自身的样本相关的置信度。
步骤308,训练主学习器。
该过程即为对于主学习模型进行训练,得到主学习模型的过程。
步骤309,主学习器置信度评估。
在主学习模型训练完成,或,主学习模型的训练达到一定训练程度时,通过主学习模型确定与输入自身的样本相关的置信度。
步骤310,获取预测模模型。
该过程即为将质量变量预测模型进行建议并完善的过程。
步骤311,预测样本H。
该过程即为将待测数据组输入质量变量预测模型,输出得到与待测数据组对应的质量变量预测结果的过程。
步骤312,从无标签样本集N中剔除与预测样本H对应的样本数据组。
步骤313,向有标签样本集M中添加与预测样本H对应的样本数据组。
步骤312以及步骤313所示的过程即为基于样本的预测结果,对有标签样本数据集以及无标签样本数据集中的数据集内容进行调整的过程。
步骤314,判断迭代次数是否大于迭代次数阈值。
在本申请实施例中,该过程即为判断质量变量预测模型的调整是否完善的过程。在一个示例中,当迭代次数大于迭代次数阈值时,流程结束,当迭代次数小于迭代次数阈值时,重复执行本过程实施例中所述的训练过程。
综上所述,本申请实施例所示的质量变量的预测过程,在进行复杂工业过程的质量变量确定的过程中,针对有标签样本数据组数量较少,且无标签样本数量较多的情况,在对待测数据集进行质量变量的预测之前,分别建立初始辅学习模型以及初始主学习模型,在对样本集进行扩充的同时对自身进行训练,最终生成质量变量预测模型,以对于待测数据集进行质量变量的预测。在预测的过程中,通过预先进行的无标签样本数据集以及有标签样本数据集的组合训练,在选取高全局信息含量的无标签样本数据集的基础上,提高了质量变量预测模型的质量,使无标签样本数量较多的场景下,质量变量的预测有了稳定且具体的途径,提高了对于质量变量进行预测的准确率和效率。
图4示出了本申请一个示例性实施例提供的一种助训练框架下的质量变量的预测装置的结构框图,该装置包括:
获取模块401,用于获取待测数据集、有标签样本数据集以及无标签样本数据集,有标签样本数据集中包括至少两组有标签样本数据组,以及与有标签样本数据组对应的样本质量变量数值,无标签样本数据集中包括至少两组无标签样本数据组,待测数据集中包括至少两组待测数据组;
建立模块402,用于建立初始主学习模型以及与初始主学习模型对应的初始辅学习模型,初始辅学习模型用于进行无标签样本数据的初步标注,初始主学习模型用于基于初步标注的结果进行有标签样本数据集的扩充;
训练模块403,用于通过无标签样本数据集以及有标签样本数据集对初始主学习模型以及初始辅学习模型进行训练,得到主学习模型以及辅学习模型;
建立模块402,还用于基于主学习模型以及辅学习模型建立质量变量预测模型;
输入模块404,用于将待测数据组输入质量变量预测模型,输出得到与待测数据组对应的质量变量预测结果。
在一个可选的实施例中,请参考图5,该装置,还包括选取模块405,用于在无标签样本数据集中随机选取至少两个无标签样本数据组,得到无标签训练数据集;
训练模块403,还用于通过有标签样本数据集以及无标签训练数据集对初始辅学习模型进行训练,得到辅学习模型;
该装置,还包括确定模块406,用于响应于辅学习模型训练完成,通过辅学习训练模型从无标签训练数据集中确定主学习模型训练样本集;
通过主学习模型训练样本集对初始主学习模型进行训练,得到主学习模型。
在一个可选的实施例中,选取模块405,还用于从有标签样本数据集中选取与无标签训练数据集对应的有标签训练数据集,有标签训练数据集中,对应每个无标签训练数据集中的无标签样本数据组,有有标签样本数据子集,有标签样本数据子集中包括训练样本质量变量数值;
训练模块403,还用于基于样本质量变量数值以及无标签样本数据组对初始辅学习模型进行训练,得到辅学习模型。
在一个可选的实施例中,选取模块405,还用于基于无标签训练集中的无标签样本数据组,在有标签样本数据集中选取无标签样本数据组的至少两个近邻样本数据组;
该装置,还包括生成模块407,用于基于至少两个近邻样本数据组,生成有标签训练数据集。
在一个可选的实施例中,输入模块404,还用于响应于辅学习模型训练完成,将无标签样本数据输入辅学习模型,输出与无标签样本数据组对应的置信度数值;
该装置,还包括筛选模块408,用于基于置信度数值从无标签样本训练集中筛选得到至少两个高置信度无标签样本数据组;
生成模块407,还用于基于高置信度无标签样本数据组生成主学习模型训练样本集。
在一个可选的实施例中,输入模块404,还用于将主学习模型训练样本集输入初始主学习模型,输出得到伪标签训练样本集;
该装置,还包括扩充模块409,用于通过伪标签训练样本集对有标签数据集进行扩充;
将扩充后的有标签数据集中的有标签数据组输入初始主学习模型,输出得到与有标签数据组对应的均方误差;
训练模块403,还用于基于均方误差对初始主学习模型进行训练,得到主学习模型。
在一个可选的实施例中,确定模块406,还用于确定与主学习模型的训练次数对应的第一迭代次数,以及与辅学习模型的训练次数对应的第二迭代次数;
响应于第一迭代次数达到第一次数阈值,确定主学习模型的训练完成;
响应于第二迭代次数达到第二次数阈值,确定辅学习模型的训练完成。
综上所述,本申请实施例提供的装置,在进行复杂工业过程的质量变量确定的过程中,针对有标签样本数据组数量较少,且无标签样本数量较多的情况,在对待测数据集进行质量变量的预测之前,分别建立初始辅学习模型以及初始主学习模型,在对样本集进行扩充的同时对自身进行训练,最终生成质量变量预测模型,以对于待测数据集进行质量变量的预测。在预测的过程中,通过预先进行的无标签样本数据集以及有标签样本数据集的组合训练,在选取高全局信息含量的无标签样本数据集的基础上,提高了质量变量预测模型的质量,使无标签样本数量较多的场景下,质量变量的预测有了稳定且具体的途径,提高了对于质量变量进行预测的准确率和效率。
需要说明的是:上述实施例提供的助训练框架下的质量变量的预测装置,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
图6示出了本申请一个示例性实施例提供的一种执行助训练框架下的质量变量预测方法的计算机设备的结构示意图,该计算机设备包括:
处理器601包括一个或者一个以上处理核心,处理器601通过运行软件程序以及模块,从而执行各种功能应用以及数据处理。
接收器602和发射器603可以实现为一个通信组件,该通信组件可以是一块通信芯片。可选地,该通信组件可以实现包括信号传输功能。也即,发射器603可以用于发射控制信号至图像采集设备以及扫描设备中,接收器602可以用于接收对应的反馈指令。
存储器604通过总线605与处理器601相连。
存储器604可用于存储至少一个指令,处理器601用于执行该至少一个指令,以实现上述方法实施例中的各个步骤。
本申请实施例还提供一种计算机可读存储介质,该可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,以由处理器加载并执行以实现上述助训练框架下的质量变量预测方法。
本申请还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例中任一所述的助训练框架下的质量变量预测方法。
可选地,该计算机可读存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、固态硬盘(SSD,Solid State Drives)或光盘等。其中,随机存取记忆体可以包括电阻式随机存取记忆体(ReRAM,Resistance RandomAccess Memory)和动态随机存取存储器(DRAM,Dynamic RandomAccess Memory)。上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
上述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种助训练框架下的质量变量预测方法,其特征在于,所述方法应用于计算机设备中,所述方法包括:
获取待测数据集、有标签样本数据集以及无标签样本数据集,所述有标签样本数据集中包括至少两组有标签样本数据组,以及与所述有标签样本数据组对应的样本质量变量数值,所述无标签样本数据集中包括至少两组无标签样本数据组,所述待测数据集中包括至少两组待测数据组;
建立初始主学习模型以及与所述初始主学习模型对应的初始辅学习模型,所述初始辅学习模型用于进行所述无标签样本数据的初步标注,所述初始主学习模型用于基于初步标注的结果进行所述有标签样本数据集的扩充;
通过所述无标签样本数据集以及所述有标签样本数据集对所述初始主学习模型以及所述初始辅学习模型进行训练,得到主学习模型以及辅学习模型;
基于所述主学习模型以及所述辅学习模型建立质量变量预测模型;
将所述待测数据组输入所述质量变量预测模型,输出得到与所述待测数据组对应的质量变量预测结果。
2.根据权利要求1所述的方法,其特征在于,所述通过所述无标签样本数据集以及所述有标签样本数据集对所述初始主学习模型以及所述初始辅学习模型进行训练,得到主学习模型以及辅学习模型,包括:
在所述无标签样本数据集中随机选取至少两个无标签样本数据组,得到无标签训练数据集;
通过所述有标签样本数据集以及所述无标签训练数据集对所述初始辅学习模型进行训练,得到所述辅学习模型;
响应于所述辅学习模型训练完成,通过所述辅学习训练模型从所述无标签训练数据集中确定主学习模型训练样本集;
通过所述主学习模型训练样本集对所述初始主学习模型进行训练,得到所述主学习模型。
3.根据权利要求2所述的方法,其特征在于,所述通过所述有标签样本数据集以及所述无标签训练数据集对所述初始辅学习模型进行训练,得到所述辅学习模型,包括:
从所述有标签样本数据集中选取与所述无标签训练数据集对应的有标签训练数据集,所述有标签训练数据集中,对应每个所述无标签训练数据集中的所述无标签样本数据组,有有标签样本数据子集,所述有标签样本数据子集中包括训练样本质量变量数值;
基于所述样本质量变量数值以及所述无标签样本数据组对所述初始辅学习模型进行训练,得到所述辅学习模型。
4.根据权利要求3所述的方法,其特征在于,所述从所述有标签样本数据集中选取与所述无标签训练数据集对应的有标签训练数据集,包括:
基于所述无标签训练集中的所述无标签样本数据组,在所述有标签样本数据集中选取所述无标签样本数据组的至少两个近邻样本数据组;
基于所述至少两个近邻样本数据组,生成所述有标签训练数据集。
5.根据权利要求2所述的方法,其特征在于,所述响应于所述辅学习模型训练完成,通过所述辅学习模型从所述无标签训练数据集中确定主学习模型训练样本集,包括:
响应于所述辅学习模型训练完成,将所述无标签样本数据输入所述辅学习模型,输出与所述无标签样本数据组对应的置信度数值;
基于所述置信度数值从所述无标签样本训练集中筛选得到至少两个高置信度无标签样本数据组;
基于所述高置信度无标签样本数据组生成所述主学习模型训练样本集。
6.根据权利要求2所述的方法,其特征在于,所述通过所述主学习模型训练样本集对所述初始主学习模型进行训练,得到所述主学习模型,包括:
将所述主学习模型训练样本集输入所述初始主学习模型,输出得到伪标签训练样本集;
通过所述伪标签训练样本集对所述有标签数据集进行扩充;
将扩充后的所述有标签数据集中的所述有标签数据组输入所述初始主学习模型,输出得到与所述有标签数据组对应的均方误差;
基于所述均方误差对所述初始主学习模型进行训练,得到所述主学习模型。
7.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
确定所述与所述主学习模型的训练次数对应的第一迭代次数,以及与所述辅学习模型的训练次数对应的第二迭代次数;
响应于所述第一迭代次数达到第一次数阈值,确定所述主学习模型的训练完成;
响应于所述第二迭代次数达到第二次数阈值,确定所述辅学习模型的训练完成。
8.一种质量变量的预测装置,其特征在于,所述装置包括:
获取模块,用于获取待测数据集、有标签样本数据集以及无标签样本数据集,所述有标签样本数据集中包括至少两组有标签样本数据组,以及与所述有标签样本数据组对应的样本质量变量数值,所述无标签样本数据集中包括至少两组无标签样本数据组,所述待测数据集中包括至少两组待测数据组;
建立模块,用于建立初始主学习模型以及与所述初始主学习模型对应的初始辅学习模型,所述初始辅学习模型用于进行所述无标签样本数据的初步标注,所述初始主学习模型用于基于初步标注的结果进行所述有标签样本数据集的扩充;
训练模块,用于通过所述无标签样本数据集以及所述有标签样本数据集对所述初始主学习模型以及所述初始辅学习模型进行训练,得到主学习模型以及辅学习模型;
所述建立模块,还用于基于所述主学习模型以及所述辅学习模型建立质量变量预测模型;
输入模块,用于将所述待测数据组输入所述质量变量预测模型,输出得到与所述待测数据组对应的质量变量预测结果。
9.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、至少一段程序、代码集或指令集由所述处理器加载并执行以实现如权利要求1至7任一所述的助训练框架下的质量变量预测方法。
10.一种计算机可读存储介质,其特征在于,所述可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、至少一段程序、代码集或指令集由所述处理器加载并执行以实现如权利要求1至7任一所述的助训练框架下的质量变量预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111502375.4A CN114186732A (zh) | 2021-12-09 | 2021-12-09 | 助训练框架下的质量变量预测方法、装置终端及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111502375.4A CN114186732A (zh) | 2021-12-09 | 2021-12-09 | 助训练框架下的质量变量预测方法、装置终端及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114186732A true CN114186732A (zh) | 2022-03-15 |
Family
ID=80604129
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111502375.4A Pending CN114186732A (zh) | 2021-12-09 | 2021-12-09 | 助训练框架下的质量变量预测方法、装置终端及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114186732A (zh) |
-
2021
- 2021-12-09 CN CN202111502375.4A patent/CN114186732A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111460728B (zh) | 一种工业设备剩余寿命预测方法、装置、存储介质及设备 | |
CN104123476B (zh) | 基于极限学习机的气体浓度预测方法及其装置 | |
CN110442666B (zh) | 一种基于神经网络模型的矿产资源预测方法及系统 | |
CN114048600A (zh) | 一种数字孪生驱动的多模型融合工业系统异常检测方法 | |
US20220365521A1 (en) | Virtual simulation manufacturing platform based on automatic control | |
CN108647373A (zh) | 一种基于xgboost模型的工业过程软测量方法 | |
CN114357594B (zh) | 一种基于sca-gru的桥梁异常监测方法、系统、设备及存储介质 | |
CN102622535A (zh) | 一种基于多序列比对遗传算法的处理方法及装置 | |
CN100470427C (zh) | 基于仿生智能的工业软测量仪表及软测量方法 | |
CN113378581B (zh) | 一种基于多元概念注意力模型的知识追踪方法及系统 | |
CN113988311B (zh) | 质量变量的预测方法、装置、终端及存储介质 | |
CN114239397A (zh) | 基于动态特征提取与局部加权深度学习的软测量建模方法 | |
CN117892915A (zh) | 基于核算单位的商品碳标签生成方法及系统 | |
CN114186732A (zh) | 助训练框架下的质量变量预测方法、装置终端及介质 | |
CN115064218B (zh) | 一种构建病原微生物数据鉴定平台的方法及装置 | |
CN115169458A (zh) | 基于主动学习的自适应故障诊断方法、装置及相关介质 | |
Schumacher | CSU Mobile Radiosonde Data. Version 1.0 | |
Riid et al. | Interpretability of fuzzy systems and its application to process control | |
Shi et al. | LWS based PCA subspace ensemble model for soft sensor development | |
CN112380132A (zh) | 基于航天软件缺陷数据集类不平衡的对抗验证方法及装置 | |
Orantes et al. | A new support methodology for the placement of sensors used for fault detection and diagnosis | |
Gao et al. | Research on Modeling of Industrial Soft Sensor Based on Ensemble Learning | |
Wang | A new variable selection method for soft sensor based on deep learning | |
Wei et al. | Virtual sensors of nonlinear industrial processes based on neighborhood preserving regression model | |
Mohamed | Virtual measurements in Wastewater treatment plant: Machine learning models for predicting the PO4 concentration in the effluent |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |