CN112257341B - 一种基于异源数据差补融合的定制产品性能预测方法 - Google Patents
一种基于异源数据差补融合的定制产品性能预测方法 Download PDFInfo
- Publication number
- CN112257341B CN112257341B CN202011124136.5A CN202011124136A CN112257341B CN 112257341 B CN112257341 B CN 112257341B CN 202011124136 A CN202011124136 A CN 202011124136A CN 112257341 B CN112257341 B CN 112257341B
- Authority
- CN
- China
- Prior art keywords
- data
- sample
- eset
- data set
- performance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 64
- 230000004927 fusion Effects 0.000 title claims abstract description 18
- 238000012549 training Methods 0.000 claims abstract description 59
- 238000004088 simulation Methods 0.000 claims abstract description 48
- 238000004364 calculation method Methods 0.000 claims abstract description 29
- 238000012937 correction Methods 0.000 claims abstract description 27
- 101100256746 Mus musculus Setdb1 gene Proteins 0.000 claims description 37
- 238000012360 testing method Methods 0.000 claims description 33
- 210000002569 neuron Anatomy 0.000 claims description 29
- 238000012795 verification Methods 0.000 claims description 25
- 238000005259 measurement Methods 0.000 claims description 23
- 239000013598 vector Substances 0.000 claims description 19
- 238000005094 computer simulation Methods 0.000 claims description 17
- 238000003062 neural network model Methods 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 13
- 230000004913 activation Effects 0.000 claims description 9
- 238000010845 search algorithm Methods 0.000 claims description 9
- 239000003550 marker Substances 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 7
- 239000004576 sand Substances 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 6
- 238000011478 gradient descent method Methods 0.000 claims description 5
- 238000013507 mapping Methods 0.000 claims description 4
- 230000009469 supplementation Effects 0.000 claims description 3
- 238000013461 design Methods 0.000 abstract description 8
- 238000013528 artificial neural network Methods 0.000 abstract description 4
- 239000000047 product Substances 0.000 description 41
- 230000006870 function Effects 0.000 description 17
- 230000001133 acceleration Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 4
- 238000002790 cross-validation Methods 0.000 description 3
- 238000013016 damping Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000010200 validation analysis Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000012938 design process Methods 0.000 description 2
- 238000013450 outlier detection Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 238000013401 experimental design Methods 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Software Systems (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Geometry (AREA)
- Development Economics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Hardware Design (AREA)
- Game Theory and Decision Science (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于异源数据差补融合的定制产品性能预测方法,该方法基于深度自编码器、邻域关联方法以及相似度差补方法,采用历史实测数据集对计算仿真数据集进行差补修正;采用差补修正后的计算仿真数据集训练BP神经网络作为定制产品的性能预测模型。本发明方法结合深度自编码器,采用邻域关联方法以及相似度差补方法,将低保真度的计算仿真数据与高保真度的历史实测数据进行关联,实现了高保真度的历史实测数据对低保真度的计算仿真数据的差补修正,从而通过异源数据差补融合实现了对产品性能的变保真度预测,提高了性能预测模型的泛化能力,实现了在设计阶段对定制产品性能的高效可信预测。
Description
技术领域
本发明属于“互联网+”环境下定制产品性能预测领域,尤其涉及一种基于异源数据差补融合的定制产品性能预测方法。
背景技术
“互联网+”环境下,用户对产品的个性化需求日益凸显,同时在用户深度参与设计过程方面也提出了更高的要求。针对用户需求驱动的个性化定制产品设计而言,定制产品的性能预测有助于在设计阶段对用户需求实现高效快速响应,同时能够有效降低设计成本同时缩短设计周期,从而可以有效促进用户深度参与设计过程。
传统的产品性能预测方法一般有两种,第一种是基于历史实测性能进行推演预测,从累积的历史实测性能数据的角度出发,实现“性能—性能”的推演预测,具有较高的可信度,但费用高、周期长且响应慢;第二种方法是基于结构形状建模的仿真预测,从结构形状建模及计算仿真的角度出发,实现“形状—性能”的仿真预测,响应高效快速,但计算仿真具有较大误差,使得性能预测的可信度低。以上两种方法都难以在设计阶段实现定制产品的高效快速、可信性预测。
发明内容
本发明的目的在于针对现有技术的不足,提供一种基于异源数据差补融合的定制产品性能预测方法。本发明采用BP神经网络模型作为预测模型,同时结合深度自编码器,并通过邻域关联方法和相似度差补方法进行异源数据差补融合,采用高保真度的历史实测性能数据对低保真度的计算仿真性能数据进行关联和差补修正,从而能够实现对产品性能的变保真度预测,由此解决了难以在设计阶段对定制产品性能进行高效、可信预测的问题。
本发明的目的是通过以下技术方案来实现的:一种基于异源数据差补融合的定制产品性能预测方法,该方法包括下列步骤:
(1)以定制产品的配置参数作为输入特征,定制产品的待预测性能作为输出特征,收集获取数据样本。收集对已有产品实测的性能数据,构建定制产品性能预测的历史实测数据集;利用计算机仿真软件,建立定制产品的虚拟仿真模型,通过仿真分析获取性能数据,构建定制产品性能预测的计算仿真数据集;
(2)对历史实测数据集和计算仿真数据集进行数据预处理。
(3)基于历史实测数据集对计算仿真数据集进行差补修正:基于深度自编码器对历史实测数据集和计算仿真数据集进行编码,将数据样本从输入空间映射到特征空间,实现对数据样本的关键特征进行表达,记编码后的历史实测数据集为ESeth,记编码后的计算仿真数据集为ESets;通过随机采样,将数据集ESeth划分为训练样本集、验证样本集和测试样本集等,分别记为历史实测训练集ESethtrain、历史实测验证集ESethvalid和历史实测测试集ESethtest;最后采用邻域关联方法对数据集ESets和数据集ESethtrain进行相关联接,并通过相似度差补方法,采用数据集ESethtrain对数据集ESets进行差补修正,记差补修正后的数据集ESets为MSets;
(4)选取BP神经网络模型作为定制产品的性能预测模型,并以步骤(1)中选取的输入特征和输出特征作为预测模型的输入和输出。以差补修正后的计算仿真数据集作为训练样本集,结合禁忌搜索算法训练构建一个最优BP神经网络模型;随后采用历史实测测试集ESethtest对该模型进行测试,以得到最终的定制产品的性能预测模型;
(5)对待预测的数据样本,首先按照步骤(2)中对计算仿真数据集的处理进行数据预处理,然后输入至步骤(3)中构建的深度自编码器中进行编码,最后将编码后的待预测样本输入至步骤(4)中构建的预测模型进行预测,即可得到定制产品在不同配置参数条件下的产品性能。
进一步地,所述步骤(2)为首先对历史实测数据集进行数据去噪以及数据增补处理;然后分别对历史实测数据集和计算仿真数据集进行数据归一化处理。
进一步地,所述的步骤(3)中,采用历史实测数据集和计算仿真数据集训练一个神经网络模型,以此作为数据样本的深度自编码器。该深度自编码器由输入层、编码器、特征表达层、解码器以及输出层构成,且编码器与解码器均包含三个隐藏层。深度自编码器的输入与输出均为数据样本的输入特征向量,层与层之间采用全连接方式,输入层与隐藏层、隐藏层与隐藏层之间的激活函数采用relu函数,隐藏层与输出层之间的激活函数采用tanh函数。
进一步地,所述的步骤(3)中,采用邻域相关方法对编码后的计算仿真数据集ESets和历史实测训练集ESethtrain进行相关联接,关联的具体过程为:对数据集ESets中每一个数据样本初始化一个空的标记集;在数据集ESethtrain中任选一个数据样本Samplek,以该数据样本Samplek为中心,以邻域阈值ε为半径,对位于此邻域范围内的数据集ESets中的数据样本添加标记至标记集中,添加的标记为该数据样本Samplek的编号,与此同时将数据样本Samplek的访问属性设置为已访问;遍历数据集ESethtrain中所有访问属性为未访问的数据样本,重复对其邻域范围内的数据样本添加标记,直至数据集ESethtrain中的数据样本的访问属性均为已访问。
进一步地,所述的步骤(3)中,基于相似度差补方法,采用历史实测训练集ESethtrain对编码后的计算仿真数据集ESets进行差补修正。该相似度差补方法为:遍历数据集ESets,对其每一个标记集不为空的数据样本Samplel按照下式对该数据样本的输出特征进行差补修正:
其中,表示数据样本Samplel的差补修正后的输出特征向量;表示数据样本Samplel的差补修正前的输出特征向量,即为通过仿真分析获取的输出特征向量;M表示该数据样本Samplel的标记集中的标记个数,也就是与该数据样本Samplel相关联的数据集ESethtrain中数据样本的个数;Sz表示数据样本Samplel和第z个与其相关联的数据集ESethtrain中的数据样本之间的欧式距离,该值衡量了这两个数据样本之间的相似度;Δyz表示数据样本Samplel的输出特征向量和第z个与其相关的数据集ESethtrain中的数据样本的输出特征向量之间的绝对差值;表示第z个与数据样本Samplel相关的数据集ESethtrain中的数据样本的输出特征向量;α、β为超参数。
进一步地,所述的步骤(4)中,以差补修正后的计算仿真数据集MSets作为训练样本集,以历史实测验证集ESethvalid作为验证样本集,以历史实测测试集ESethtest作为测试样本集,结合禁忌搜索算法训练构建一个最优的BP神经网络模型BPNNsopt,以此作为最终的预测模型。该模型由一个输入层,三个隐藏层和一个输出层构成,层与层之间均为全连接,输入层的神经元个数为数据样本输入特征的个数,输出层的神经元个数为数据样本的输出特征的个数,隐藏层的神经元个数分别为h1、h2和h3,通过确定h1、h2和h3的范围;其中,L为隐藏层神经元个数,nin为输入层神经元个数,nout为输出层神经元个数,a为(1,10)之间的常数;在对应范围内选择不同的h1、h2和h3,采用训练样本集对当前h1、h2和h3组合下的模型进行训练,并采用验证样本集验证训练得到的模型,得到当前h1、h2和h3组合下的验证误差;以验证误差为目标,采用禁忌搜索算法优化h1、h2和h3,确定最优的隐藏层的神经元个数h1opt、h2opt和h3opt,从而在当前隐藏层层数固定的基础上,训练得到一个最优模型BPNNsopt;最后采用测试样本集对该最优模型BPNNsopt进行测试,若满足要求则选取该模型为最终的预测模型,否则重新设置该BP神经网络模型的隐藏层层数并重新训练新的网络模型。
进一步地,所述的步骤(4)中,隐藏层的初始化采用如下方式:权重均初始化为服从正态分布的[-1,1]之间的随机数,偏差均初始化为0;激活函数采用relu-relu-relu-tanh形式,损失函数采用均方损失函数,采用小批量梯度下降法更新权重和偏差。
本发明的有益效果是:本发明的方法采用深度自编码器对数据样本输入特征进行编码,将数据样本从输入空间映射到特征空间,以实现对数据关键特征进行表达,并能够表现出计算仿真数据样本与历史实测数据样本之间的相关性以及相似性;基于数据样本编码,采用邻域关联方法和相似度差补方法,实现了历史实测数据与计算仿真数据之间的相关联接,同时实现了高保真度的历史实测数据对低保真度的计算仿真数据的差补修正,从而能够有效实现计算仿真数据与历史实测数据的差补融合。本发明的方法通过异源数据差补融合能够实现对定制产品性能的变保真度预测,提高了性能预测模型的泛化能力,有效实现了在设计阶段对定制产品性能的高效可信预测。
附图说明
图1为按照本发明的定制产品性能预测方法的流程图;
图2为按照本发明的实施例的基于计算仿真数据集和历史实测数据集所构建的深度自编码器的拓扑结构图;
图3为按照本发明的实施例的基于差补修正后的计算仿真数据集构建最优BP神经网络BPNNsopt的流程图。
具体实施方式
下面结合附图及具体实施例对本发明作进一步详细地说明。
本发明以定制电梯产品轿厢水平振动加速度峰峰值这一性能预测作为实施例,训练构造BP神经网络模型,从而建立定制电梯产品的配置参数与电梯轿厢水平振动加速度峰峰值之间的映射关系,用以对不同配置参数下的电梯产品的轿厢水平振动性能进行可信预测。图1是按照本发明的实施例所构建的预测方法的流程图,如图1所示:
本发明的一种基于异源数据差补融合的定制产品性能预测方法,包括以下步骤:
步骤1:以定制产品的配置参数作为输入特征,定制产品的待预测性能作为输出特征,收集获取数据样本。从企业收集对已有产品实测的性能数据,构建定制产品性能预测的历史实测数据集;利用计算机仿真软件,建立定制产品的虚拟仿真模型,通过仿真分析获取性能数据,构建定制产品性能预测的计算仿真数据集。
本发明的实施例以定制电梯产品的最大运行速度vmax、最大运行加速度amax、运行高度H、曳引绳密度ρ、曳引绳公称直径D、曳引绳弹性模量E、轿架质量mframe及等效转动惯量Jframe、轿厢质量mcar及等效转动惯量Jcar、额定载荷mload、导靴弹簧等效刚度kshoe及阻尼cshoe、减振橡胶等效刚度krub及阻尼crub作为输入特征,以定制电梯产品轿厢水平振动加速度峰峰值ahvpp为输出特性,采集获取训练数据样本。
从企业收集已有电梯产品的实测轿厢水平振动加速度峰峰值,构建历史实测数据集;基于拉丁超立方采样方法进行实验设计,然后利用计算机仿真软件ADAMS以及产品开发软件NX,建立电梯产品的虚拟仿真模型,通过Ansys仿真分析获取轿厢水平振动加速度峰峰值,构建计算仿真数据集。
步骤2:对历史实测数据集和计算仿真数据集进行数据预处理,包括数据去噪、数据增补以及数据归一化处理。首先针对实测数据样本存在的噪声、特征值缺失等问题,对历史实测数据集进行数据去噪以及数据增补处理;然后分别对历史实测数据集和计算仿真数据集进行数据归一化处理。数据归一化处理之前的历史实测数据集和计算仿真数据集分别如表1、表2所示。
表1:电梯轿厢水平振动加速度峰峰值的历史实测数据
表2:电梯轿厢水平振动加速度峰峰值的计算仿真数据
本发明的实施例对历史实测数据集进行数据去噪处理时,采用离群点检测方法。采用基于聚类的离群点检测方法,对数据集中的样本点进行聚类,通过聚类将数据样本点组织成“簇”,在聚类完成后无法归属于任意聚类簇的数据样本即为离群点,从而实现在发现聚类簇的同时检测出离群点。检测出的离群点是数据集中的噪声,从数据集中去除这些离群点即可实现数据集去噪。本发明的实施例采用DBSCAN聚类方法。
本发明的实施例对历史实测数据集进行数据增补处理时,当数据样本的特征值缺失个数超过5个时,则去除该数据样本,否则采用特征值均值填补该数据样本的缺失特征。
本发明的实施例对历史实测数据集和计算仿真数据集的输入特征进行分别归一化处理,使得数据样本的输入特征值均位于[-1,1]之间,数据归一化处理公式如下:
式(1)中,xi′表示归一化后的第i个输入特征值,xi表示被归一化的第i个输入特征值,xi,max表示被归一化的第i个输入特征的最大值,xi,min表示被归一化的第i个输入特征的最小值,m表示数据集的输入特征的个数。
步骤3:基于历史实测数据集对计算仿真数据集进行差补修正。基于深度自编码器对历史实测数据集和计算仿真数据集进行编码,将数据样本从输入空间映射到特征空间,实现对数据样本的关键特征进行表达,记编码后的历史实测数据集为ESeth,记编码后的计算仿真数据集为ESets;随后以训练样本数比验证样本数比测试样本数之比为7∶2∶1的比例,随机采样,将数据集ESeth划分为训练样本集、验证样本集和测试样本集,分别记为历史实测训练集ESethtrain、历史实测验证集ESethvalid和历史实测测试集ESethtest;最后采用邻域关联方法对数据集ESets和数据集ESethtrain进行相关联接,并通过相似度差补方法,采用数据集ESethtrain对数据集ESets进行差补修正,记差补修正后的数据集ESets为ESetsmod。
本发明的实施例实现历史实测训练集ESethtrain对编码后的计算仿真数据集ESets进行差补修正的过程的具体描述如下:
步骤3.1:以历史实测数据集和计算仿真数据集作为训练样本集,构建训练深度自编码器,对数据样本进行编码,记编码后的计算仿真数据集为ESets,记编码后的历史实测数据集为ESeth。
采用BP神经网络构建深度自编码器,该深度自编码器的拓扑结构如图2所示。该深度自编码器由输入层、编码器、特征表达层、解码器以及输出层构成,编码器与解码器均包含三个隐藏层,层与层之间的连接均为全连接。该深度自编码器的输入与输出均为数据样本的输入特征向量,即有输入层和输出层的神经元个数均为数据样本的输入特征的个数即为15;编码器的三个隐藏层的神经元个数分别为Ne1、Ne2和Ne3,相对应地,解码器的三个隐藏层的神经元个数分别为Ne3、Ne2和Ne1。通过经验公式可以确定Ne1、Ne2和Ne3的范围,其中,Le为编码器/解码器的隐藏层神经元个数,nein为输入层神经元个数,neout为特征表达层神经元个数,ae为(1,10)之间的常数。基于十折交叉验证方法,选择由经验公式确定的隐藏层神经元个数的范围内选择不同的Ne1、Ne2和Ne3组合,构建训练深度自编码器并计算该模型的交叉验证误差,选择交叉验证误差最小的那一组作为编码器/解码器的隐藏层神经元个数。
更多地,各隐藏层的初始化采用如下方式:权重均初始化为服从正态分布的[-1,1]之间的随机数,偏差均初始化为0;输入层与隐藏层、隐藏层与隐藏层之间的激活函数采用relu函数,隐藏层与输出层之间的激活函数采用tanh函数;损失函数采用均方损失函数;采用小批量梯度下降法更新权重和偏差。
采用计算仿真数据集和历史实测数据集对该深度自编码器进行训练,训练完成后,提取特征表达层的输出作为数据样本编码后的特征向量。
步骤3.2:对编码后的历史实测数据集ESeth进行划分。以训练样本数比验证样本数比测试样本数之比为7∶2∶1的比例,随机采样,将数据集ESeth划分为训练样本集、验证样本集和测试样本集,记划分的样本集分别为历史实测训练集ESethtrain、历史实测验证集ESethvalid和历史实测测试集ESethtest。
步骤3.3:采用邻域相关方法,对编码后的计算仿真数据集ESets与历史实测训练集ESethtrain进行关联。
定义:设置ε为邻域大小阈值,以数据样本A为中心,以邻域阈值ε为半径,若数据样本B位于数据样本A的邻域范围(超球体)内,则认定数据样本B与数据样本A相关,也就是说当数据样本B与该数据样本A之间的欧式距离小于阈值ε时,数据样本B与数据样本A是相关的,否则数据样本B与数据样本A不相关的。
基于上述定义,该邻域相关方法对数据样本进行关联的过程可以表述为:对数据集ESets中每一个数据样本初始化一个空的标记集;在数据集ESethtrain中任选一个数据样本Samplek,以该数据样本Samplek为中心,以邻域阈值ε为半径,对位于此邻域范围(超球体)内的数据集ESets中的数据样本添加标记至标记集,添加的标记为该数据样本Samplek的编号,与此同时将数据样本Samplek的访问属性设置为已访问;遍历数据集ESethtrain中所有访问属性为未访问的数据样本,重复上述过程直至数据集ESethtrain中的数据样本的访问属性均为已访问。因此,对于数据样本集ESets中的任一数据样本而言,与其相关的数据集ESethtrain中的数据样本个数可能为零也可能有多个。
上述过程用下述的伪代码进行表达:
步骤3.4:通过相似度差补方法,采用历史实测训练集ESethtrain对编码后的计算仿真数据集ESets进行差补修正,记差补修正后的计算仿真数据集为MSets。
基于步骤3.1中的对输入特征的编码,通过计算数据集ESethtrain中的数据样本与数据集ESets中数据样本之间的欧式距离可以衡量两者之间的相似性,欧式距离越大表明两者之间的相似性越小,反之越大,从而可以用相似性衡量数据集ESethtrain中数据样本对数据集ESets中数据样本进行修正时所占的权重。
具体地,该相似度差补方法可以表述为:遍历数据集ESets,对每一个标记集不为空的数据样本Samplel按照下式对该数据样本的输出特征进行差补修正:
式中,表示数据样本Samplel的差补修正后的输出特征向量;表示数据样本Samplel的差补修正前的输出特征向量,即为通过仿真分析获取的输出特征向量;M表示该数据样本Samplel的标记集中的标记个数,也就是与数据样本Samplel相关联的数据集ESethtrain中数据样本的个数;Sz表示数据样本Samplel和第z个与其相关的数据集ESethtrain中的数据样本之间的欧式距离,该值衡量了这两个数据样本之间的相似度;Δyz表示数据样本Samplel的输出特征向量和第z个与其相关的数据集ESethtrain中的数据样本的输出特征向量之间的绝对差值;表示第z个与数据样本Samplel相关的数据集ESethtrain中的数据样本的输出特征向量;α、β为超参数。
上述过程用下述的伪代码进行表达:
步骤4:选取BP神经网络模型作为定制电梯产品轿厢水平振动加速度峰峰值的预测模型,以差补修正后的计算仿真数据集MSets作为训练样本集,以历史实测验证集ESethvalid作为验证样本集,以历史实测测试集ESethtest作为测试样本集,结合禁忌搜索算法训练构建一个最优的BP神经网络模型BPNNsopt。更多地,构建最优模型BPNNsopt的流程如图3所示。
步骤4.1:模型BPNNs构建及初始化:该模型由一个输入层,三个隐藏层和一个输出层构成,层与层之间均为全连接。输入层的神经元个数为数据样本的输入特征个数即为15,输出层的神经元个数为数据样本输出特征个数即为1,隐藏层的神经元个数分别为h1、h2和h3,通过经验公式可以确定h1、h2和h3的范围,其中,L为隐藏层神经元个数,nin为输入层神经元个数,nout为输出层神经元个数,a为(1,10)之间的常数。更多地,三个隐藏层的权重均初始化为服从正态分布的[-1,1]之间的随机数,偏差均初始化为0,激活函数采用relu-relu-relu-tanh形式。
步骤4.2:模型BPNNs的训练及验证:设定训练过程采用均方损失函数作为损失函数,小批量梯度下降法更新权重和偏差,学习率为0.002,批量大小为30,学习误差目标为10-3,学习最大循环次数为10000次。使用训练样本集MSets进行迭代训练,训练迭代如下所述:1)随机采样一个批量大小的训练样本;2)样本依次输入模型,进行前向计算,计算相对应的输出;3)根据损失函数,计算该批量大小训练样本的损失lbatch;4)误差反向传播,采用小批量梯度下降法对权重和偏差进行更新;5)重复1~4直至遍历完整个训练样本集MSets的训练样本,并将各个批量的损失累加,得到整个训练样本集MSets的损失lsum;6)判断第5步中的损失lsum是否满足设定的学习误差目标,若是,则模型训练完成,否则,进入下一步;7)判断迭代次数是否超过设置的学习最大循环次数,若是,则模型训练完成,否则,完成一次循环迭代,进入下一轮循环,跳转到第1步。
采用验证样本集ESethvalid对训练完成的模型进行验证。将验证样本依次输入模型,通过前向计算,计算相对应的输出,然后根据损失函数计算样本误差,最后将各个验证样本的误差累加,即得到相应的验证误差。
步骤4.3:结合禁忌搜索算法优化模型参数h1、h2和h3:在由L确定的范围内选择不同的h1、h2和h3组合,首先按照步骤4.1构建并初始化模型BPNNs,然后按照步骤4.2对其进行训练及验证,得到不同h1、h2和h3组合下的验证误差。以验证误差为目标,采用禁忌搜索算法优化h1、h2和h3,确定最优的隐藏层的神经元个数h1opt、h2opt和h3opt,从而在当前隐藏层层数固定的基础上,基于差补修正后的计算仿真数据集MSets训练得到一个最优模型BPNNsopt。
步骤4.4:当前最优模型BPNNsopt的测试:采用测试样本集ESethtest对该当前最优模型BPNNsopt进行测试,计算测试误差,若测试误差满足要求则设置该模型为最终的产品性能预测模型,否则,重新设置BP神经网络的隐藏层层数,重复步骤4中的4.1~4.3步,构建、训练以及验证模型。
采用均方绝对百分比误差作为指标来计算预测模型BPNNsopt的测试误差,且均方绝对百分比误差的表达式如下所示:
式中,Nvalid表示历史实测验证集的样本大小;表示预测模型Surrbpmix对历史实测验证集中第u个数据样本的电梯轿厢水平振动加速度峰峰值的预测值;表示历史实测验证集中第u个数据样本的电梯轿厢水平振动加速度峰峰值的实测值。
所构建的预测模型BPNNsopt对测试样本集ESethtest中样本的测试误差如表3所示。
表3预测模型BPNNsopt对测试样本集ESethtest的预测误差
从表3可以看出,针对测试样本集ESethtest中样本,所构建的预测模型BPNNsopt对电梯轿厢水平振动加速度峰峰值的均方绝对百分比误差为2.79%。均方绝对百分比误差越小,表示模型的预测精度越高,预测性能越好。更多地,当均方绝对百分比误差低于10%时,模型的预测精度是满足要求的。因此,所构建的预测模型BPNNsopt可以实现对电梯轿厢水平震动加速度峰峰值的可信预测。
步骤5:待测数据样本的预测。对待预测的数据样本,首先按照步骤2中计算仿真数据集的数据归一化处理方式对其输入特征进行归一化,然后输入至步骤3中构建的深度自编码器中进行编码,最后将编码后的待预测样本输入至预测模型BPNNsopt进行预测,即可得到定制电梯产品在不同配置参数条件下的轿厢水平振动加速度峰峰值。
Claims (7)
1.一种基于异源数据差补融合的定制产品性能预测方法,其特征在于,该方法包括下列步骤:
(1)以定制产品的配置参数作为输入特征,定制产品的待预测性能作为输出特征,收集获取数据样本;收集对已有产品实测的性能数据,构建定制产品性能预测的历史实测数据集;利用计算机仿真软件,建立定制产品的虚拟仿真模型,通过仿真分析获取性能数据,构建定制产品性能预测的计算仿真数据集;
(2)对历史实测数据集和计算仿真数据集进行数据预处理;
(3)基于历史实测数据集对计算仿真数据集进行差补修正:基于深度自编码器对历史实测数据集和计算仿真数据集进行编码,将数据样本从输入空间映射到特征空间,实现对数据样本的关键特征进行表达,记编码后的历史实测数据集为ESeth,记编码后的计算仿真数据集为ESets;通过随机采样,将数据集ESeth划分为训练样本集、验证样本集和测试样本集,分别记为历史实测训练集ESethtrain、历史实测验证集ESethvalid和历史实测测试集ESethtest;最后采用邻域关联方法对数据集ESets和数据集ESethtrain进行相关联接,并通过相似度差补方法,采用数据集ESethtrain对数据集ESets进行差补修正,记差补修正后的数据集ESets为MSets;
(4)选取BP神经网络模型作为定制产品的性能预测模型,并以步骤(1)中选取的输入特征和输出特征作为预测模型的输入和输出;以差补修正后的计算仿真数据集作为训练样本集,结合禁忌搜索算法训练构建一个最优BP神经网络模型;随后采用历史实测测试集ESethtest对该模型进行测试,以得到最终的定制产品的性能预测模型;
(5)对待预测的数据样本,首先按照步骤(2)中对计算仿真数据集的处理进行数据预处理,然后输入至步骤(3)中构建的深度自编码器中进行编码,最后将编码后的待预测样本输入至步骤(4)中构建的预测模型进行预测,即可得到定制产品在不同配置参数条件下的产品性能。
2.根据权利要求1所述的一种基于异源数据差补融合的定制产品性能预测方法,其特征在于,所述步骤(2)为首先对历史实测数据集进行数据去噪以及数据增补处理;然后分别对历史实测数据集和计算仿真数据集进行数据归一化处理。
3.根据权利要求1所述的一种基于异源数据差补融合的定制产品性能预测方法,其特征在于,所述的步骤(3)中,采用历史实测数据集和计算仿真数据集训练一个神经网络模型,以此作为数据样本的深度自编码器;该深度自编码器由输入层、编码器、特征表达层、解码器以及输出层构成,且编码器与解码器均包含三个隐藏层;深度自编码器的输入与输出均为数据样本的输入特征向量,层与层之间采用全连接方式,输入层与隐藏层、隐藏层与隐藏层之间的激活函数采用relu函数,隐藏层与输出层之间的激活函数采用tanh函数。
4.根据权利要求1所述的一种基于异源数据差补融合的定制产品性能预测方法,其特征在于,所述的步骤(3)中,采用邻域相关方法对编码后的计算仿真数据集ESets和历史实测训练集ESethtrain进行相关联接,关联的具体过程为:对数据集ESets中每一个数据样本初始化一个空的标记集;在数据集ESethtrain中任选一个数据样本Samplek,以该数据样本Samplek为中心,以邻域阈值ε为半径,对位于此邻域范围内的数据集ESets中的数据样本添加标记至标记集中,添加的标记为该数据样本Samplek的编号,与此同时将数据样本Samplek的访问属性设置为已访问;遍历数据集ESethtrain中所有访问属性为未访问的数据样本,重复对其邻域范围内的数据样本添加标记,直至数据集ESethtrain中的数据样本的访问属性均为已访问。
5.根据权利要求4所述的一种基于异源数据差补融合的定制产品性能预测方法,其特征在于,所述的步骤(3)中,基于相似度差补方法,采用历史实测训练集ESethtrain对编码后的计算仿真数据集ESets进行差补修正;该相似度差补方法为:遍历数据集ESets,对其每一个标记集不为空的数据样本Samplel按照下式对该数据样本的输出特征进行差补修正:
其中,表示数据样本Samplel的差补修正后的输出特征向量;表示数据样本Samplel的差补修正前的输出特征向量,即为通过仿真分析获取的输出特征向量;M表示该数据样本Samplel的标记集中的标记个数,也就是与该数据样本Samplel相关联的数据集ESethtrain中数据样本的个数;Sz表示数据样本Samplel和第z个与其相关联的数据集ESethtrain中的数据样本之间的欧式距离,该值衡量了这两个数据样本之间的相似度;Δyz表示数据样本Samplel的输出特征向量和第z个与其相关的数据集ESethtrain中的数据样本的输出特征向量之间的绝对差值;表示第z个与数据样本Samplel相关的数据集ESethtrain中的数据样本的输出特征向量;α、β为超参数。
6.根据权利要求1所述的一种基于异源数据差补融合的定制产品性能预测方法,其特征在于,所述的步骤(4)中,以差补修正后的计算仿真数据集MSets作为训练样本集,以历史实测验证集ESethvalid作为验证样本集,以历史实测测试集ESethtest作为测试样本集,结合禁忌搜索算法训练构建一个最优的BP神经网络模型BPNNsopt,以此作为最终的预测模型;该模型由一个输入层,三个隐藏层和一个输出层构成,层与层之间均为全连接,输入层的神经元个数为数据样本输入特征的个数,输出层的神经元个数为数据样本的输出特征的个数,隐藏层的神经元个数分别为h1、h2和h3,通过确定h1、h2和h3的范围;其中,L为隐藏层神经元个数,nin为输入层神经元个数,nout为输出层神经元个数,a为(1,10)之间的常数;在对应范围内选择不同的h1、h2和h3,采用训练样本集对当前h1、h2和h3组合下的模型进行训练,并采用验证样本集验证训练得到的模型,得到当前h1、h2和h3组合下的验证误差;以验证误差为目标,采用禁忌搜索算法优化h1、h2和h3,确定最优的隐藏层的神经元个数h1opt、h2opt和h3opt,从而在当前隐藏层层数固定的基础上,训练得到一个最优模型BPNNsopt;最后采用测试样本集对该最优模型BPNNsopt进行测试,若满足要求则选取该模型为最终的预测模型,否则重新设置该BP神经网络模型的隐藏层层数并重新训练新的网络模型。
7.根据权利要求6所述的一种基于异源数据差补融合的定制产品性能预测方法,其特征在于,所述的步骤(4)中,隐藏层的初始化采用如下方式:权重均初始化为服从正态分布的[-1,1]之间的随机数,偏差均初始化为0;激活函数采用relu-relu-relu-tanh形式,损失函数采用均方损失函数,采用小批量梯度下降法更新权重和偏差。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011124136.5A CN112257341B (zh) | 2020-10-20 | 2020-10-20 | 一种基于异源数据差补融合的定制产品性能预测方法 |
PCT/CN2021/070983 WO2022083009A1 (zh) | 2020-10-20 | 2021-01-08 | 一种基于异源数据差补融合的定制产品性能预测方法 |
US17/522,921 US20220122103A1 (en) | 2020-10-20 | 2021-11-10 | Customized product performance prediction method based on heterogeneous data difference compensation fusion |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011124136.5A CN112257341B (zh) | 2020-10-20 | 2020-10-20 | 一种基于异源数据差补融合的定制产品性能预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112257341A CN112257341A (zh) | 2021-01-22 |
CN112257341B true CN112257341B (zh) | 2022-04-26 |
Family
ID=74244369
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011124136.5A Active CN112257341B (zh) | 2020-10-20 | 2020-10-20 | 一种基于异源数据差补融合的定制产品性能预测方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN112257341B (zh) |
WO (1) | WO2022083009A1 (zh) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113189589B (zh) * | 2021-05-08 | 2024-05-17 | 南京航空航天大学 | 基于卷积神经网络的多通道合成孔径雷达动目标检测方法 |
CN113297527B (zh) * | 2021-06-09 | 2022-07-26 | 四川大学 | 基于多源城市大数据的pm2.5全面域时空计算推断方法 |
CN113779910B (zh) * | 2021-11-10 | 2022-02-22 | 海光信息技术股份有限公司 | 产品性能分布预测方法及装置、电子设备及存储介质 |
CN114861498B (zh) * | 2022-05-18 | 2022-11-18 | 上海交通大学 | 融合多传感时序信号机理模型的电阻点焊质量在线检测方法 |
CN115034443A (zh) * | 2022-05-23 | 2022-09-09 | 东南大学 | 一种基于工况划分与神经网络的锅炉性能预测方法 |
CN115062513B (zh) * | 2022-06-20 | 2024-05-17 | 嘉兴学院 | 基于adnn的永磁同步直线电机定位力计算模型构建方法 |
WO2024059965A1 (zh) * | 2022-09-19 | 2024-03-28 | 浙江大学 | 基于双通道信息互补融合堆叠自编码器的产品质量预测方法 |
CN116861347B (zh) * | 2023-05-22 | 2024-06-11 | 青岛海洋地质研究所 | 一种基于深度学习模型的磁力异常数据计算方法 |
CN116502544B (zh) * | 2023-06-26 | 2023-09-12 | 武汉新威奇科技有限公司 | 一种基于数据融合的电动螺旋压力机寿命预测方法及系统 |
CN116839783B (zh) * | 2023-09-01 | 2023-12-08 | 华东交通大学 | 一种基于机器学习的汽车板簧受力值及变形量的测量方法 |
CN117313278B (zh) * | 2023-11-08 | 2024-09-03 | 广东力源液压机械有限公司 | 一种大型液压桩锤运行控制参数的智能匹配方法及系统 |
CN117349710B (zh) * | 2023-12-04 | 2024-03-22 | 七七七电气科技有限公司 | 一种真空灭弧室开断能力的预测方法、电子设备及介质 |
CN117369425B (zh) * | 2023-12-08 | 2024-02-27 | 南昌华翔汽车内外饰件有限公司 | 汽车仪表总成故障诊断方法、系统、存储介质及计算机 |
CN118278215B (zh) * | 2024-05-27 | 2024-08-16 | 长春理工大学 | 一种基于载荷模拟的设备抗冲击仿真系统及方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104951836A (zh) * | 2014-03-25 | 2015-09-30 | 上海市玻森数据科技有限公司 | 基于神经网络技术的发帖预测系统 |
CN105426889A (zh) * | 2015-11-13 | 2016-03-23 | 浙江大学 | 基于pca混合特征融合的气液两相流流型识别方法 |
CN105893669A (zh) * | 2016-03-30 | 2016-08-24 | 浙江大学 | 一种基于数据挖掘的全局仿真性能预测方法 |
CN109145434A (zh) * | 2018-08-16 | 2019-01-04 | 北京理工大学 | 一种利用改进bp神经网络预测广播星历轨道误差的方法 |
CN110322933A (zh) * | 2019-06-20 | 2019-10-11 | 浙江工业大学 | 一种基于动态误差补偿机制的聚丙烯熔融指数混合建模方法 |
KR20190117849A (ko) * | 2018-03-28 | 2019-10-17 | 주식회사 미래이씨피 | Iptv 방송의 지역별 송출에서 방송 및 자막영역에서 노출되는 추천 제품 선정시 지역별 판매데이터 분석에 따른 맞춤형 제품 추천 장치 |
CN111079891A (zh) * | 2019-01-18 | 2020-04-28 | 兰州理工大学 | 一种基于双隐含层bp神经网络的离心泵性能预测方法 |
CN111445010A (zh) * | 2020-03-26 | 2020-07-24 | 南京工程学院 | 一种基于证据理论融合量子网络的配网电压趋势预警方法 |
CN111612029A (zh) * | 2020-03-30 | 2020-09-01 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 机载电子产品故障预测方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8301406B2 (en) * | 2008-07-24 | 2012-10-30 | University Of Cincinnati | Methods for prognosing mechanical systems |
CN104636800A (zh) * | 2013-11-06 | 2015-05-20 | 上海思控电气设备有限公司 | 基于最小二乘加权的冷冻站系统神经网络优化单元及其方法 |
CN104504292A (zh) * | 2015-01-14 | 2015-04-08 | 济南大学 | 基于bp神经网络预测循环流化床锅炉最佳工作温度的方法 |
CN108153982B (zh) * | 2017-12-26 | 2021-07-06 | 哈尔滨工业大学 | 基于堆叠自编码深度学习网络的航空发动机修后性能预测方法 |
US20200050982A1 (en) * | 2018-08-10 | 2020-02-13 | Adp, Llc | Method and System for Predictive Modeling for Dynamically Scheduling Resource Allocation |
CN110634082A (zh) * | 2019-09-24 | 2019-12-31 | 云南电网有限责任公司 | 一种基于深度学习的低频减载系统运行阶段预测方法 |
-
2020
- 2020-10-20 CN CN202011124136.5A patent/CN112257341B/zh active Active
-
2021
- 2021-01-08 WO PCT/CN2021/070983 patent/WO2022083009A1/zh active Application Filing
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104951836A (zh) * | 2014-03-25 | 2015-09-30 | 上海市玻森数据科技有限公司 | 基于神经网络技术的发帖预测系统 |
CN105426889A (zh) * | 2015-11-13 | 2016-03-23 | 浙江大学 | 基于pca混合特征融合的气液两相流流型识别方法 |
CN105893669A (zh) * | 2016-03-30 | 2016-08-24 | 浙江大学 | 一种基于数据挖掘的全局仿真性能预测方法 |
KR20190117849A (ko) * | 2018-03-28 | 2019-10-17 | 주식회사 미래이씨피 | Iptv 방송의 지역별 송출에서 방송 및 자막영역에서 노출되는 추천 제품 선정시 지역별 판매데이터 분석에 따른 맞춤형 제품 추천 장치 |
CN109145434A (zh) * | 2018-08-16 | 2019-01-04 | 北京理工大学 | 一种利用改进bp神经网络预测广播星历轨道误差的方法 |
CN111079891A (zh) * | 2019-01-18 | 2020-04-28 | 兰州理工大学 | 一种基于双隐含层bp神经网络的离心泵性能预测方法 |
CN110322933A (zh) * | 2019-06-20 | 2019-10-11 | 浙江工业大学 | 一种基于动态误差补偿机制的聚丙烯熔融指数混合建模方法 |
CN111445010A (zh) * | 2020-03-26 | 2020-07-24 | 南京工程学院 | 一种基于证据理论融合量子网络的配网电压趋势预警方法 |
CN111612029A (zh) * | 2020-03-30 | 2020-09-01 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 机载电子产品故障预测方法 |
Non-Patent Citations (2)
Title |
---|
Spring-Back Preditcion of the Bi-Layered Metallic Tube under CNC Bending Considering Neutral Layer Shifting Extraction;shuyou Zhang,et al.;《Applied Sciences》;20200731;第10卷(第14期);第1-23页 * |
考虑Sobol缺陷敏感度的抗恶劣环境结构设计方法;张树有等;《浙江大学学报》;20150831;第49卷(第8期);第1487-1494页 * |
Also Published As
Publication number | Publication date |
---|---|
WO2022083009A1 (zh) | 2022-04-28 |
CN112257341A (zh) | 2021-01-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112257341B (zh) | 一种基于异源数据差补融合的定制产品性能预测方法 | |
US20220122103A1 (en) | Customized product performance prediction method based on heterogeneous data difference compensation fusion | |
CN109086805B (zh) | 一种基于深度神经网络和成对约束的聚类方法 | |
CN105975573B (zh) | 一种基于knn的文本分类方法 | |
CN110334580A (zh) | 基于集成增量的动态权重组合的设备故障分类方法 | |
CN110941734B (zh) | 基于稀疏图结构的深度无监督图像检索方法 | |
CN113128671B (zh) | 一种基于多模态机器学习的服务需求动态预测方法及系统 | |
CN110633859B (zh) | 一种两阶段分解集成的水文序列预测方法 | |
CN114841257A (zh) | 一种基于自监督对比约束下的小样本目标检测方法 | |
CN114118369B (zh) | 一种基于群智能优化的图像分类卷积神经网络设计方法 | |
CN115510963A (zh) | 一种增量式设备故障诊断方法 | |
CN111914478A (zh) | 一种综合地质钻孔测井岩性识别方法 | |
CN112529638B (zh) | 基于用户分类和深度学习的服务需求动态预测方法及系统 | |
CN116187835A (zh) | 一种基于数据驱动的台区理论线损区间估算方法及系统 | |
CN110260914B (zh) | 一种基于测点时空特征的工程安全监测系统区域划分方法 | |
CN116933946A (zh) | 一种基于客流去向结构的轨道交通od客流预测方法及系统 | |
CN110503148B (zh) | 一种具有尺度不变性的点云对象识别方法 | |
CN113920379B (zh) | 一种基于知识辅助的零样本图像分类方法 | |
CN114510871A (zh) | 基于思维进化和lstm的云服务器性能衰退预测方法 | |
CN113656707A (zh) | 一种理财产品推荐方法、系统、存储介质及设备 | |
CN118038032A (zh) | 基于超点嵌入和聚类的点云语义分割模型及其训练方法 | |
CN116739100A (zh) | 量子神经网络的漏洞检测方法及自动驾驶漏洞检测方法 | |
CN112241811B (zh) | “互联网+”环境下定制产品的分层混合性能预测方法 | |
CN113807005B (zh) | 基于改进fpa-dbn的轴承剩余寿命预测方法 | |
CN115116549A (zh) | 细胞数据注释方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |