CN112257341A - 一种基于异源数据差补融合的定制产品性能预测方法 - Google Patents

一种基于异源数据差补融合的定制产品性能预测方法 Download PDF

Info

Publication number
CN112257341A
CN112257341A CN202011124136.5A CN202011124136A CN112257341A CN 112257341 A CN112257341 A CN 112257341A CN 202011124136 A CN202011124136 A CN 202011124136A CN 112257341 A CN112257341 A CN 112257341A
Authority
CN
China
Prior art keywords
data
sample
eset
data set
performance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011124136.5A
Other languages
English (en)
Other versions
CN112257341B (zh
Inventor
张树有
周会芳
裘乐淼
王自立
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN202011124136.5A priority Critical patent/CN112257341B/zh
Priority to PCT/CN2021/070983 priority patent/WO2022083009A1/zh
Publication of CN112257341A publication Critical patent/CN112257341A/zh
Priority to US17/522,921 priority patent/US20220122103A1/en
Application granted granted Critical
Publication of CN112257341B publication Critical patent/CN112257341B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Marketing (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Mathematical Physics (AREA)
  • Development Economics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于异源数据差补融合的定制产品性能预测方法,该方法基于深度自编码器、邻域关联方法以及相似度差补方法,采用历史实测数据集对计算仿真数据集进行差补修正;采用差补修正后的计算仿真数据集训练BP神经网络作为定制产品的性能预测模型。本发明方法结合深度自编码器,采用邻域关联方法以及相似度差补方法,将低保真度的计算仿真数据与高保真度的历史实测数据进行关联,实现了高保真度的历史实测数据对低保真度的计算仿真数据的差补修正,从而通过异源数据差补融合实现了对产品性能的变保真度预测,提高了性能预测模型的泛化能力,实现了在设计阶段对定制产品性能的高效可信预测。

Description

一种基于异源数据差补融合的定制产品性能预测方法
技术领域
本发明属于“互联网+”环境下定制产品性能预测领域,尤其涉及一种基于异源数据差补融合的定制产品性能预测方法。
背景技术
“互联网+”环境下,用户对产品的个性化需求日益凸显,同时在用户深度参与设计过程方面也提出了更高的要求。针对用户需求驱动的个性化定制产品设计而言,定制产品的性能预测有助于在设计阶段对用户需求实现高效快速响应,同时能够有效降低设计成本同时缩短设计周期,从而可以有效促进用户深度参与设计过程。
传统的产品性能预测方法一般有两种,第一种是基于历史实测性能进行推演预测,从累积的历史实测性能数据的角度出发,实现“性能—性能”的推演预测,具有较高的可信度,但费用高、周期长且响应慢;第二种方法是基于结构形状建模的仿真预测,从结构形状建模及计算仿真的角度出发,实现“形状—性能”的仿真预测,响应高效快速,但计算仿真具有较大误差,使得性能预测的可信度低。以上两种方法都难以在设计阶段实现定制产品的高效快速、可信性预测。
发明内容
本发明的目的在于针对现有技术的不足,提供一种基于异源数据差补融合的定制产品性能预测方法。本发明采用BP神经网络模型作为预测模型,同时结合深度自编码器,并通过邻域关联方法和相似度差补方法进行异源数据差补融合,采用高保真度的历史实测性能数据对低保真度的计算仿真性能数据进行关联和差补修正,从而能够实现对产品性能的变保真度预测,由此解决了难以在设计阶段对定制产品性能进行高效、可信预测的问题。
本发明的目的是通过以下技术方案来实现的:一种基于异源数据差补融合的定制产品性能预测方法,该方法包括下列步骤:
(1)以定制产品的配置参数作为输入特征,定制产品的待预测性能作为输出特征,收集获取数据样本。收集对已有产品实测的性能数据,构建定制产品性能预测的历史实测数据集;利用计算机仿真软件,建立定制产品的虚拟仿真模型,通过仿真分析获取性能数据,构建定制产品性能预测的计算仿真数据集;
(2)对历史实测数据集和计算仿真数据集进行数据预处理。
(3)基于历史实测数据集对计算仿真数据集进行差补修正:基于深度自编码器对历史实测数据集和计算仿真数据集进行编码,将数据样本从输入空间映射到特征空间,实现对数据样本的关键特征进行表达,记编码后的历史实测数据集为ESeth,记编码后的计算仿真数据集为ESets;通过随机采样,将数据集ESeth划分为训练样本集、验证样本集和测试样本集等,分别记为历史实测训练集ESethtrain、历史实测验证集ESethvalid和历史实测测试集ESethtest;最后采用邻域关联方法对数据集ESets和数据集ESethtrain进行相关联接,并通过相似度差补方法,采用数据集ESethtrain对数据集ESets进行差补修正,记差补修正后的数据集ESets为MSets
(4)选取BP神经网络模型作为定制产品的性能预测模型,并以步骤(1)中选取的输入特征和输出特征作为预测模型的输入和输出。以差补修正后的计算仿真数据集作为训练样本集,结合禁忌搜索算法训练构建一个最优BP神经网络模型;随后采用历史实测测试集ESethtest对该模型进行测试,以得到最终的定制产品的性能预测模型;
(5)对待预测的数据样本,首先按照步骤(2)中对计算仿真数据集的处理进行数据预处理,然后输入至步骤(3)中构建的深度自编码器中进行编码,最后将编码后的待预测样本输入至步骤(4)中构建的预测模型进行预测,即可得到定制产品在不同配置参数条件下的产品性能。
进一步地,所述步骤(2)为首先对历史实测数据集进行数据去噪以及数据增补处理;然后分别对历史实测数据集和计算仿真数据集进行数据归一化处理。
进一步地,所述的步骤(3)中,采用历史实测数据集和计算仿真数据集训练一个神经网络模型,以此作为数据样本的深度自编码器。该深度自编码器由输入层、编码器、特征表达层、解码器以及输出层构成,且编码器与解码器均包含三个隐藏层。深度自编码器的输入与输出均为数据样本的输入特征向量,层与层之间采用全连接方式,输入层与隐藏层、隐藏层与隐藏层之间的激活函数采用relu函数,隐藏层与输出层之间的激活函数采用tanh函数。
进一步地,所述的步骤(3)中,采用邻域相关方法对编码后的计算仿真数据集ESets和历史实测训练集ESethtrain进行相关联接,关联的具体过程为:对数据集ESets中每一个数据样本初始化一个空的标记集;在数据集ESethtrain中任选一个数据样本Samplek,以该数据样本Samplek为中心,以邻域阈值ε为半径,对位于此邻域范围内的数据集ESets中的数据样本添加标记至标记集中,添加的标记为该数据样本Samplek的编号,与此同时将数据样本Samplek的访问属性设置为已访问;遍历数据集ESethtrain中所有访问属性为未访问的数据样本,重复对其邻域范围内的数据样本添加标记,直至数据集ESethtrain中的数据样本的访问属性均为已访问。
进一步地,所述的步骤(3)中,基于相似度差补方法,采用历史实测训练集ESethtrain对编码后的计算仿真数据集ESets进行差补修正。该相似度差补方法为:遍历数据集ESets,对其每一个标记集不为空的数据样本Samplel按照下式对该数据样本的输出特征进行差补修正:
Figure BDA0002733031400000031
Figure BDA0002733031400000032
其中,
Figure BDA0002733031400000033
表示数据样本Samplel的差补修正后的输出特征向量;
Figure BDA0002733031400000034
表示数据样本Samplel的差补修正前的输出特征向量,即为通过仿真分析获取的输出特征向量;M表示该数据样本Samplel的标记集中的标记个数,也就是与该数据样本Samplel相关联的数据集ESethtrain中数据样本的个数;Sz表示数据样本Samplel和第z个与其相关联的数据集ESethtrain中的数据样本之间的欧式距离,该值衡量了这两个数据样本之间的相似度;Δyz表示数据样本Samplel的输出特征向量和第z个与其相关的数据集ESethtrain中的数据样本的输出特征向量之间的绝对差值;
Figure BDA0002733031400000035
表示第z个与数据样本Samplel相关的数据集ESethtrain中的数据样本的输出特征向量;α、β为超参数。
进一步地,所述的步骤(4)中,以差补修正后的计算仿真数据集MSets作为训练样本集,以历史实测验证集ESethvalid作为验证样本集,以历史实测测试集ESethtest作为测试样本集,结合禁忌搜索算法训练构建一个最优的BP神经网络模型BPNNsopt,以此作为最终的预测模型。该模型由一个输入层,三个隐藏层和一个输出层构成,层与层之间均为全连接,输入层的神经元个数为数据样本输入特征的个数,输出层的神经元个数为数据样本的输出特征的个数,隐藏层的神经元个数分别为h1、h2和h3,通过
Figure BDA0002733031400000036
确定h1、h2和h3的范围;其中,L为隐藏层神经元个数,nin为输入层神经元个数,nout为输出层神经元个数,a为(1,10)之间的常数;在对应范围内选择不同的h1、h2和h3,采用训练样本集对当前h1、h2和h3组合下的模型进行训练,并采用验证样本集验证训练得到的模型,得到当前h1、h2和h3组合下的验证误差;以验证误差为目标,采用禁忌搜索算法优化h1、h2和h3,确定最优的隐藏层的神经元个数h1opt、h2opt和h3opt,从而在当前隐藏层层数固定的基础上,训练得到一个最优模型BPNNsopt;最后采用测试样本集对该最优模型BPNNsopt进行测试,若满足要求则选取该模型为最终的预测模型,否则重新设置该BP神经网络模型的隐藏层层数并重新训练新的网络模型。
进一步地,所述的步骤(4)中,隐藏层的初始化采用如下方式:权重均初始化为服从正态分布的[-1,1]之间的随机数,偏差均初始化为0;激活函数采用relu-relu-relu-tanh形式,损失函数采用均方损失函数,采用小批量梯度下降法更新权重和偏差。
本发明的有益效果是:本发明的方法采用深度自编码器对数据样本输入特征进行编码,将数据样本从输入空间映射到特征空间,以实现对数据关键特征进行表达,并能够表现出计算仿真数据样本与历史实测数据样本之间的相关性以及相似性;基于数据样本编码,采用邻域关联方法和相似度差补方法,实现了历史实测数据与计算仿真数据之间的相关联接,同时实现了高保真度的历史实测数据对低保真度的计算仿真数据的差补修正,从而能够有效实现计算仿真数据与历史实测数据的差补融合。本发明的方法通过异源数据差补融合能够实现对定制产品性能的变保真度预测,提高了性能预测模型的泛化能力,有效实现了在设计阶段对定制产品性能的高效可信预测。
附图说明
图1为按照本发明的定制产品性能预测方法的流程图;
图2为按照本发明的实施例的基于计算仿真数据集和历史实测数据集所构建的深度自编码器的拓扑结构图;
图3为按照本发明的实施例的基于差补修正后的计算仿真数据集构建最优BP神经网络BPNNsopt的流程图。
具体实施方式
下面结合附图及具体实施例对本发明作进一步详细地说明。
本发明以定制电梯产品轿厢水平振动加速度峰峰值这一性能预测作为实施例,训练构造BP神经网络模型,从而建立定制电梯产品的配置参数与电梯轿厢水平振动加速度峰峰值之间的映射关系,用以对不同配置参数下的电梯产品的轿厢水平振动性能进行可信预测。图1是按照本发明的实施例所构建的预测方法的流程图,如图1所示:
本发明的一种基于异源数据差补融合的定制产品性能预测方法,包括以下步骤:
步骤1:以定制产品的配置参数作为输入特征,定制产品的待预测性能作为输出特征,收集获取数据样本。从企业收集对已有产品实测的性能数据,构建定制产品性能预测的历史实测数据集;利用计算机仿真软件,建立定制产品的虚拟仿真模型,通过仿真分析获取性能数据,构建定制产品性能预测的计算仿真数据集。
本发明的实施例以定制电梯产品的最大运行速度vmax、最大运行加速度amax、运行高度H、曳引绳密度ρ、曳引绳公称直径D、曳引绳弹性模量E、轿架质量mframe及等效转动惯量Jframe、轿厢质量mcar及等效转动惯量Jcar、额定载荷mload、导靴弹簧等效刚度kshoe及阻尼cshoe、减振橡胶等效刚度krub及阻尼crub作为输入特征,以定制电梯产品轿厢水平振动加速度峰峰值ahvpp为输出特性,采集获取训练数据样本。
从企业收集已有电梯产品的实测轿厢水平振动加速度峰峰值,构建历史实测数据集;基于拉丁超立方采样方法进行实验设计,然后利用计算机仿真软件ADAMS以及产品开发软件NX,建立电梯产品的虚拟仿真模型,通过Ansys仿真分析获取轿厢水平振动加速度峰峰值,构建计算仿真数据集。
步骤2:对历史实测数据集和计算仿真数据集进行数据预处理,包括数据去噪、数据增补以及数据归一化处理。首先针对实测数据样本存在的噪声、特征值缺失等问题,对历史实测数据集进行数据去噪以及数据增补处理;然后分别对历史实测数据集和计算仿真数据集进行数据归一化处理。数据归一化处理之前的历史实测数据集和计算仿真数据集分别如表1、表2所示。
表1:电梯轿厢水平振动加速度峰峰值的历史实测数据
Figure BDA0002733031400000051
表2:电梯轿厢水平振动加速度峰峰值的计算仿真数据
Figure BDA0002733031400000052
Figure BDA0002733031400000061
本发明的实施例对历史实测数据集进行数据去噪处理时,采用离群点检测方法。采用基于聚类的离群点检测方法,对数据集中的样本点进行聚类,通过聚类将数据样本点组织成“簇”,在聚类完成后无法归属于任意聚类簇的数据样本即为离群点,从而实现在发现聚类簇的同时检测出离群点。检测出的离群点是数据集中的噪声,从数据集中去除这些离群点即可实现数据集去噪。本发明的实施例采用DBSCAN聚类方法。
本发明的实施例对历史实测数据集进行数据增补处理时,当数据样本的特征值缺失个数超过5个时,则去除该数据样本,否则采用特征值均值填补该数据样本的缺失特征。
本发明的实施例对历史实测数据集和计算仿真数据集的输入特征进行分别归一化处理,使得数据样本的输入特征值均位于[-1,1]之间,数据归一化处理公式如下:
Figure BDA0002733031400000062
式(1)中,xi′表示归一化后的第i个输入特征值,xi表示被归一化的第i个输入特征值,xi,max表示被归一化的第i个输入特征的最大值,xi,min表示被归一化的第i个输入特征的最小值,m表示数据集的输入特征的个数。
步骤3:基于历史实测数据集对计算仿真数据集进行差补修正。基于深度自编码器对历史实测数据集和计算仿真数据集进行编码,将数据样本从输入空间映射到特征空间,实现对数据样本的关键特征进行表达,记编码后的历史实测数据集为ESeth,记编码后的计算仿真数据集为ESets;随后以训练样本数比验证样本数比测试样本数之比为7∶2∶1的比例,随机采样,将数据集ESeth划分为训练样本集、验证样本集和测试样本集,分别记为历史实测训练集ESethtrain、历史实测验证集ESethvalid和历史实测测试集ESethtest;最后采用邻域关联方法对数据集ESets和数据集ESethtrain进行相关联接,并通过相似度差补方法,采用数据集ESethtrain对数据集ESets进行差补修正,记差补修正后的数据集ESets为ESetsmod
本发明的实施例实现历史实测训练集ESethtrain对编码后的计算仿真数据集ESets进行差补修正的过程的具体描述如下:
步骤3.1:以历史实测数据集和计算仿真数据集作为训练样本集,构建训练深度自编码器,对数据样本进行编码,记编码后的计算仿真数据集为ESets,记编码后的历史实测数据集为ESeth
采用BP神经网络构建深度自编码器,该深度自编码器的拓扑结构如图2所示。该深度自编码器由输入层、编码器、特征表达层、解码器以及输出层构成,编码器与解码器均包含三个隐藏层,层与层之间的连接均为全连接。该深度自编码器的输入与输出均为数据样本的输入特征向量,即有输入层和输出层的神经元个数均为数据样本的输入特征的个数即为15;编码器的三个隐藏层的神经元个数分别为Ne1、Ne2和Ne3,相对应地,解码器的三个隐藏层的神经元个数分别为Ne3、Ne2和Ne1。通过经验公式
Figure BDA0002733031400000071
可以确定Ne1、Ne2和Ne3的范围,其中,Le为编码器/解码器的隐藏层神经元个数,nein为输入层神经元个数,neout为特征表达层神经元个数,ae为(1,10)之间的常数。基于十折交叉验证方法,选择由经验公式确定的隐藏层神经元个数的范围内选择不同的Ne1、Ne2和Ne3组合,构建训练深度自编码器并计算该模型的交叉验证误差,选择交叉验证误差最小的那一组作为编码器/解码器的隐藏层神经元个数。
更多地,各隐藏层的初始化采用如下方式:权重均初始化为服从正态分布的[-1,1]之间的随机数,偏差均初始化为0;输入层与隐藏层、隐藏层与隐藏层之间的激活函数采用relu函数,隐藏层与输出层之间的激活函数采用tanh函数;损失函数采用均方损失函数;采用小批量梯度下降法更新权重和偏差。
采用计算仿真数据集和历史实测数据集对该深度自编码器进行训练,训练完成后,提取特征表达层的输出作为数据样本编码后的特征向量。
步骤3.2:对编码后的历史实测数据集ESeth进行划分。以训练样本数比验证样本数比测试样本数之比为7∶2∶1的比例,随机采样,将数据集ESeth划分为训练样本集、验证样本集和测试样本集,记划分的样本集分别为历史实测训练集ESethtrain、历史实测验证集ESethvalid和历史实测测试集ESethtest
步骤3.3:采用邻域相关方法,对编码后的计算仿真数据集ESets与历史实测训练集ESethtrain进行关联。
定义:设置ε为邻域大小阈值,以数据样本A为中心,以邻域阈值ε为半径,若数据样本B位于数据样本A的邻域范围(超球体)内,则认定数据样本B与数据样本A相关,也就是说当数据样本B与该数据样本A之间的欧式距离小于阈值ε时,数据样本B与数据样本A是相关的,否则数据样本B与数据样本A不相关的。
基于上述定义,该邻域相关方法对数据样本进行关联的过程可以表述为:对数据集ESets中每一个数据样本初始化一个空的标记集;在数据集ESethtrain中任选一个数据样本Samplek,以该数据样本Samplek为中心,以邻域阈值ε为半径,对位于此邻域范围(超球体)内的数据集ESets中的数据样本添加标记至标记集,添加的标记为该数据样本Samplek的编号,与此同时将数据样本Samplek的访问属性设置为已访问;遍历数据集ESethtrain中所有访问属性为未访问的数据样本,重复上述过程直至数据集ESethtrain中的数据样本的访问属性均为已访问。因此,对于数据样本集ESets中的任一数据样本而言,与其相关的数据集ESethtrain中的数据样本个数可能为零也可能有多个。
上述过程用下述的伪代码进行表达:
Figure BDA0002733031400000081
Figure BDA0002733031400000091
步骤3.4:通过相似度差补方法,采用历史实测训练集ESethtrain对编码后的计算仿真数据集ESets进行差补修正,记差补修正后的计算仿真数据集为MSets
基于步骤3.1中的对输入特征的编码,通过计算数据集ESethtrain中的数据样本与数据集ESets中数据样本之间的欧式距离可以衡量两者之间的相似性,欧式距离越大表明两者之间的相似性越小,反之越大,从而可以用相似性衡量数据集ESethtrain中数据样本对数据集ESets中数据样本进行修正时所占的权重。
具体地,该相似度差补方法可以表述为:遍历数据集ESets,对每一个标记集不为空的数据样本Samplel按照下式对该数据样本的输出特征进行差补修正:
Figure BDA0002733031400000092
Figure BDA0002733031400000093
式中,
Figure BDA0002733031400000094
表示数据样本Samplel的差补修正后的输出特征向量;
Figure BDA0002733031400000095
表示数据样本Samplel的差补修正前的输出特征向量,即为通过仿真分析获取的输出特征向量;M表示该数据样本Samplel的标记集中的标记个数,也就是与数据样本Samplel相关联的数据集ESethtrain中数据样本的个数;Sz表示数据样本Samplel和第z个与其相关的数据集ESethtrain中的数据样本之间的欧式距离,该值衡量了这两个数据样本之间的相似度;Δyz表示数据样本Samplel的输出特征向量和第z个与其相关的数据集ESethtrain中的数据样本的输出特征向量之间的绝对差值;
Figure BDA0002733031400000096
表示第z个与数据样本Samplel相关的数据集ESethtrain中的数据样本的输出特征向量;α、β为超参数。
上述过程用下述的伪代码进行表达:
Figure BDA0002733031400000097
Figure BDA0002733031400000101
步骤4:选取BP神经网络模型作为定制电梯产品轿厢水平振动加速度峰峰值的预测模型,以差补修正后的计算仿真数据集MSets作为训练样本集,以历史实测验证集ESethvalid作为验证样本集,以历史实测测试集ESethtest作为测试样本集,结合禁忌搜索算法训练构建一个最优的BP神经网络模型BPNNsopt。更多地,构建最优模型BPNNsopt的流程如图3所示。
步骤4.1:模型BPNNs构建及初始化:该模型由一个输入层,三个隐藏层和一个输出层构成,层与层之间均为全连接。输入层的神经元个数为数据样本的输入特征个数即为15,输出层的神经元个数为数据样本输出特征个数即为1,隐藏层的神经元个数分别为h1、h2和h3,通过经验公式
Figure BDA0002733031400000102
可以确定h1、h2和h3的范围,其中,L为隐藏层神经元个数,nin为输入层神经元个数,nout为输出层神经元个数,a为(1,10)之间的常数。更多地,三个隐藏层的权重均初始化为服从正态分布的[-1,1]之间的随机数,偏差均初始化为0,激活函数采用relu-relu-relu-tanh形式。
步骤4.2:模型BPNNs的训练及验证:设定训练过程采用均方损失函数作为损失函数,小批量梯度下降法更新权重和偏差,学习率为0.002,批量大小为30,学习误差目标为10-3,学习最大循环次数为10000次。使用训练样本集MSets进行迭代训练,训练迭代如下所述:1)随机采样一个批量大小的训练样本;2)样本依次输入模型,进行前向计算,计算相对应的输出;3)根据损失函数,计算该批量大小训练样本的损失lbatch;4)误差反向传播,采用小批量梯度下降法对权重和偏差进行更新;5)重复1~4直至遍历完整个训练样本集MSets的训练样本,并将各个批量的损失累加,得到整个训练样本集MSets的损失lsum;6)判断第5步中的损失lsum是否满足设定的学习误差目标,若是,则模型训练完成,否则,进入下一步;7)判断迭代次数是否超过设置的学习最大循环次数,若是,则模型训练完成,否则,完成一次循环迭代,进入下一轮循环,跳转到第1步。
采用验证样本集ESethvalid对训练完成的模型进行验证。将验证样本依次输入模型,通过前向计算,计算相对应的输出,然后根据损失函数计算样本误差,最后将各个验证样本的误差累加,即得到相应的验证误差。
步骤4.3:结合禁忌搜索算法优化模型参数h1、h2和h3:在由L确定的范围内选择不同的h1、h2和h3组合,首先按照步骤4.1构建并初始化模型BPNNs,然后按照步骤4.2对其进行训练及验证,得到不同h1、h2和h3组合下的验证误差。以验证误差为目标,采用禁忌搜索算法优化h1、h2和h3,确定最优的隐藏层的神经元个数h1opt、h2opt和h3opt,从而在当前隐藏层层数固定的基础上,基于差补修正后的计算仿真数据集MSets训练得到一个最优模型BPNNsopt
步骤4.4:当前最优模型BPNNsopt的测试:采用测试样本集ESethtest对该当前最优模型BPNNsopt进行测试,计算测试误差,若测试误差满足要求则设置该模型为最终的产品性能预测模型,否则,重新设置BP神经网络的隐藏层层数,重复步骤4中的4.1~4.3步,构建、训练以及验证模型。
采用均方绝对百分比误差作为指标来计算预测模型BPNNsopt的测试误差,且均方绝对百分比误差的表达式如下所示:
Figure BDA0002733031400000111
式中,Nvalid表示历史实测验证集的样本大小;
Figure BDA0002733031400000112
表示预测模型Surrbpmix对历史实测验证集中第u个数据样本的电梯轿厢水平振动加速度峰峰值的预测值;
Figure BDA0002733031400000113
表示历史实测验证集中第u个数据样本的电梯轿厢水平振动加速度峰峰值的实测值。
所构建的预测模型BPNNsopt对测试样本集ESethtest中样本的测试误差如表3所示。
表3预测模型BPNNsopt对测试样本集ESethtest的预测误差
Figure BDA0002733031400000114
Figure BDA0002733031400000121
从表3可以看出,针对测试样本集ESethtest中样本,所构建的预测模型BPNNsopt对电梯轿厢水平振动加速度峰峰值的均方绝对百分比误差为2.79%。均方绝对百分比误差越小,表示模型的预测精度越高,预测性能越好。更多地,当均方绝对百分比误差低于10%时,模型的预测精度是满足要求的。因此,所构建的预测模型BPNNsopt可以实现对电梯轿厢水平震动加速度峰峰值的可信预测。
步骤5:待测数据样本的预测。对待预测的数据样本,首先按照步骤2中计算仿真数据集的数据归一化处理方式对其输入特征进行归一化,然后输入至步骤3中构建的深度自编码器中进行编码,最后将编码后的待预测样本输入至预测模型BPNNsopt进行预测,即可得到定制电梯产品在不同配置参数条件下的轿厢水平振动加速度峰峰值。

Claims (7)

1.一种基于异源数据差补融合的定制产品性能预测方法,其特征在于,该方法包括下列步骤:
(1)以定制产品的配置参数作为输入特征,定制产品的待预测性能作为输出特征,收集获取数据样本。收集对已有产品实测的性能数据,构建定制产品性能预测的历史实测数据集;利用计算机仿真软件,建立定制产品的虚拟仿真模型,通过仿真分析获取性能数据,构建定制产品性能预测的计算仿真数据集;
(2)对历史实测数据集和计算仿真数据集进行数据预处理。
(3)基于历史实测数据集对计算仿真数据集进行差补修正:基于深度自编码器对历史实测数据集和计算仿真数据集进行编码,将数据样本从输入空间映射到特征空间,实现对数据样本的关键特征进行表达,记编码后的历史实测数据集为ESeth,记编码后的计算仿真数据集为ESets;通过随机采样,将数据集ESeth划分为训练样本集、验证样本集和测试样本集等,分别记为历史实测训练集ESethtrain、历史实测验证集ESethvalid和历史实测测试集ESethtest;最后采用邻域关联方法对数据集ESets和数据集ESethtrain进行相关联接,并通过相似度差补方法,采用数据集ESethtrain对数据集ESets进行差补修正,记差补修正后的数据集ESets为MSets
(4)选取BP神经网络模型作为定制产品的性能预测模型,并以步骤(1)中选取的输入特征和输出特征作为预测模型的输入和输出。以差补修正后的计算仿真数据集作为训练样本集,结合禁忌搜索算法训练构建一个最优BP神经网络模型;随后采用历史实测测试集ESethtest对该模型进行测试,以得到最终的定制产品的性能预测模型;
(5)对待预测的数据样本,首先按照步骤(2)中对计算仿真数据集的处理进行数据预处理,然后输入至步骤(3)中构建的深度自编码器中进行编码,最后将编码后的待预测样本输入至步骤(4)中构建的预测模型进行预测,即可得到定制产品在不同配置参数条件下的产品性能。
2.根据权利要求1所述的一种基于异源数据差补融合的定制产品性能预测方法,其特征在于,所述步骤(2)为首先对历史实测数据集进行数据去噪以及数据增补处理;然后分别对历史实测数据集和计算仿真数据集进行数据归一化处理。
3.根据权利要求1所述的一种基于异源数据差补融合的定制产品性能预测方法,其特征在于,所述的步骤(3)中,采用历史实测数据集和计算仿真数据集训练一个神经网络模型,以此作为数据样本的深度自编码器。该深度自编码器由输入层、编码器、特征表达层、解码器以及输出层构成,且编码器与解码器均包含三个隐藏层。深度自编码器的输入与输出均为数据样本的输入特征向量,层与层之间采用全连接方式,输入层与隐藏层、隐藏层与隐藏层之间的激活函数采用relu函数,隐藏层与输出层之间的激活函数采用tanh函数。
4.根据权利要求1所述的一种基于异源数据差补融合的定制产品性能预测方法,其特征在于,所述的步骤(3)中,采用邻域相关方法对编码后的计算仿真数据集ESets和历史实测训练集ESethtrain进行相关联接,关联的具体过程为:对数据集ESets中每一个数据样本初始化一个空的标记集;在数据集ESethtrain中任选一个数据样本Samplek,以该数据样本Samplek为中心,以邻域阈值ε为半径,对位于此邻域范围内的数据集ESets中的数据样本添加标记至标记集中,添加的标记为该数据样本Samplek的编号,与此同时将数据样本Samplek的访问属性设置为已访问;遍历数据集ESethtrain中所有访问属性为未访问的数据样本,重复对其邻域范围内的数据样本添加标记,直至数据集ESethtrain中的数据样本的访问属性均为已访问。
5.根据权利要求4所述的一种基于异源数据差补融合的定制产品性能预测方法,其特征在于,所述的步骤(3)中,基于相似度差补方法,采用历史实测训练集ESethtrain对编码后的计算仿真数据集ESets进行差补修正。该相似度差补方法为:遍历数据集ESets,对其每一个标记集不为空的数据样本Samplel按照下式对该数据样本的输出特征进行差补修正:
Figure FDA0002733031390000021
Figure FDA0002733031390000022
其中,
Figure FDA0002733031390000023
表示数据样本Samplel的差补修正后的输出特征向量;
Figure FDA0002733031390000024
表示数据样本Samplel的差补修正前的输出特征向量,即为通过仿真分析获取的输出特征向量;M表示该数据样本Samplel的标记集中的标记个数,也就是与该数据样本Samplel相关联的数据集ESethtrain中数据样本的个数;Sz表示数据样本Samplel和第z个与其相关联的数据集ESethtrain中的数据样本之间的欧式距离,该值衡量了这两个数据样本之间的相似度;Δyz表示数据样本Samplel的输出特征向量和第z个与其相关的数据集ESethtrain中的数据样本的输出特征向量之间的绝对差值;
Figure FDA0002733031390000025
表示第z个与数据样本Samplel相关的数据集ESethtrain中的数据样本的输出特征向量;α、β为超参数。
6.根据权利要求1所述的一种基于异源数据差补融合的定制产品性能预测方法,其特征在于,所述的步骤(4)中,以差补修正后的计算仿真数据集MSets作为训练样本集,以历史实测验证集ESethvalid作为验证样本集,以历史实测测试集ESethtest作为测试样本集,结合禁忌搜索算法训练构建一个最优的BP神经网络模型BPNNsopt,以此作为最终的预测模型。该模型由一个输入层,三个隐藏层和一个输出层构成,层与层之间均为全连接,输入层的神经元个数为数据样本输入特征的个数,输出层的神经元个数为数据样本的输出特征的个数,隐藏层的神经元个数分别为h1、h2和h3,通过
Figure FDA0002733031390000031
确定h1、h2和h3的范围;其中,L为隐藏层神经元个数,nin为输入层神经元个数,nout为输出层神经元个数,a为(1,10)之间的常数;在对应范围内选择不同的h1、h2和h3,采用训练样本集对当前h1、h2和h3组合下的模型进行训练,并采用验证样本集验证训练得到的模型,得到当前h1、h2和h3组合下的验证误差;以验证误差为目标,采用禁忌搜索算法优化h1、h2和h3,确定最优的隐藏层的神经元个数h1opt、h2opt和h3opt,从而在当前隐藏层层数固定的基础上,训练得到一个最优模型BPNNsopt;最后采用测试样本集对该最优模型BPNNsopt进行测试,若满足要求则选取该模型为最终的预测模型,否则重新设置该BP神经网络模型的隐藏层层数并重新训练新的网络模型。
7.根据权利要求6所述的一种基于异源数据差补融合的定制产品性能预测方法,其特征在于,所述的步骤(4)中,隐藏层的初始化采用如下方式:权重均初始化为服从正态分布的[-1,1]之间的随机数,偏差均初始化为0;激活函数采用relu-relu-relu-tanh形式,损失函数采用均方损失函数,采用小批量梯度下降法更新权重和偏差。
CN202011124136.5A 2020-10-20 2020-10-20 一种基于异源数据差补融合的定制产品性能预测方法 Active CN112257341B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202011124136.5A CN112257341B (zh) 2020-10-20 2020-10-20 一种基于异源数据差补融合的定制产品性能预测方法
PCT/CN2021/070983 WO2022083009A1 (zh) 2020-10-20 2021-01-08 一种基于异源数据差补融合的定制产品性能预测方法
US17/522,921 US20220122103A1 (en) 2020-10-20 2021-11-10 Customized product performance prediction method based on heterogeneous data difference compensation fusion

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011124136.5A CN112257341B (zh) 2020-10-20 2020-10-20 一种基于异源数据差补融合的定制产品性能预测方法

Publications (2)

Publication Number Publication Date
CN112257341A true CN112257341A (zh) 2021-01-22
CN112257341B CN112257341B (zh) 2022-04-26

Family

ID=74244369

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011124136.5A Active CN112257341B (zh) 2020-10-20 2020-10-20 一种基于异源数据差补融合的定制产品性能预测方法

Country Status (2)

Country Link
CN (1) CN112257341B (zh)
WO (1) WO2022083009A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113189589A (zh) * 2021-05-08 2021-07-30 南京航空航天大学 基于卷积神经网络的多通道合成孔径雷达动目标检测方法
CN113297527A (zh) * 2021-06-09 2021-08-24 四川大学 基于多源城市大数据的pm2.5全面域时空计算推断方法
CN113779910A (zh) * 2021-11-10 2021-12-10 海光信息技术股份有限公司 产品性能分布预测方法及装置、电子设备及存储介质
CN114861498A (zh) * 2022-05-18 2022-08-05 上海交通大学 融合多传感时序信号机理模型的电阻点焊质量在线检测方法
WO2024059965A1 (zh) * 2022-09-19 2024-03-28 浙江大学 基于双通道信息互补融合堆叠自编码器的产品质量预测方法

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115062513B (zh) * 2022-06-20 2024-05-17 嘉兴学院 基于adnn的永磁同步直线电机定位力计算模型构建方法
CN116502544B (zh) * 2023-06-26 2023-09-12 武汉新威奇科技有限公司 一种基于数据融合的电动螺旋压力机寿命预测方法及系统
CN116839783B (zh) * 2023-09-01 2023-12-08 华东交通大学 一种基于机器学习的汽车板簧受力值及变形量的测量方法
CN117349710B (zh) * 2023-12-04 2024-03-22 七七七电气科技有限公司 一种真空灭弧室开断能力的预测方法、电子设备及介质
CN117369425B (zh) * 2023-12-08 2024-02-27 南昌华翔汽车内外饰件有限公司 汽车仪表总成故障诊断方法、系统、存储介质及计算机

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104951836A (zh) * 2014-03-25 2015-09-30 上海市玻森数据科技有限公司 基于神经网络技术的发帖预测系统
CN105426889A (zh) * 2015-11-13 2016-03-23 浙江大学 基于pca混合特征融合的气液两相流流型识别方法
CN105893669A (zh) * 2016-03-30 2016-08-24 浙江大学 一种基于数据挖掘的全局仿真性能预测方法
CN109145434A (zh) * 2018-08-16 2019-01-04 北京理工大学 一种利用改进bp神经网络预测广播星历轨道误差的方法
CN110322933A (zh) * 2019-06-20 2019-10-11 浙江工业大学 一种基于动态误差补偿机制的聚丙烯熔融指数混合建模方法
KR20190117849A (ko) * 2018-03-28 2019-10-17 주식회사 미래이씨피 Iptv 방송의 지역별 송출에서 방송 및 자막영역에서 노출되는 추천 제품 선정시 지역별 판매데이터 분석에 따른 맞춤형 제품 추천 장치
US20200050982A1 (en) * 2018-08-10 2020-02-13 Adp, Llc Method and System for Predictive Modeling for Dynamically Scheduling Resource Allocation
CN111079891A (zh) * 2019-01-18 2020-04-28 兰州理工大学 一种基于双隐含层bp神经网络的离心泵性能预测方法
CN111445010A (zh) * 2020-03-26 2020-07-24 南京工程学院 一种基于证据理论融合量子网络的配网电压趋势预警方法
CN111612029A (zh) * 2020-03-30 2020-09-01 西南电子技术研究所(中国电子科技集团公司第十研究所) 机载电子产品故障预测方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8301406B2 (en) * 2008-07-24 2012-10-30 University Of Cincinnati Methods for prognosing mechanical systems
CN104636800A (zh) * 2013-11-06 2015-05-20 上海思控电气设备有限公司 基于最小二乘加权的冷冻站系统神经网络优化单元及其方法
CN104504292A (zh) * 2015-01-14 2015-04-08 济南大学 基于bp神经网络预测循环流化床锅炉最佳工作温度的方法
CN108153982B (zh) * 2017-12-26 2021-07-06 哈尔滨工业大学 基于堆叠自编码深度学习网络的航空发动机修后性能预测方法
CN110634082A (zh) * 2019-09-24 2019-12-31 云南电网有限责任公司 一种基于深度学习的低频减载系统运行阶段预测方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104951836A (zh) * 2014-03-25 2015-09-30 上海市玻森数据科技有限公司 基于神经网络技术的发帖预测系统
CN105426889A (zh) * 2015-11-13 2016-03-23 浙江大学 基于pca混合特征融合的气液两相流流型识别方法
CN105893669A (zh) * 2016-03-30 2016-08-24 浙江大学 一种基于数据挖掘的全局仿真性能预测方法
KR20190117849A (ko) * 2018-03-28 2019-10-17 주식회사 미래이씨피 Iptv 방송의 지역별 송출에서 방송 및 자막영역에서 노출되는 추천 제품 선정시 지역별 판매데이터 분석에 따른 맞춤형 제품 추천 장치
US20200050982A1 (en) * 2018-08-10 2020-02-13 Adp, Llc Method and System for Predictive Modeling for Dynamically Scheduling Resource Allocation
CN109145434A (zh) * 2018-08-16 2019-01-04 北京理工大学 一种利用改进bp神经网络预测广播星历轨道误差的方法
CN111079891A (zh) * 2019-01-18 2020-04-28 兰州理工大学 一种基于双隐含层bp神经网络的离心泵性能预测方法
CN110322933A (zh) * 2019-06-20 2019-10-11 浙江工业大学 一种基于动态误差补偿机制的聚丙烯熔融指数混合建模方法
CN111445010A (zh) * 2020-03-26 2020-07-24 南京工程学院 一种基于证据理论融合量子网络的配网电压趋势预警方法
CN111612029A (zh) * 2020-03-30 2020-09-01 西南电子技术研究所(中国电子科技集团公司第十研究所) 机载电子产品故障预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SHUYOU ZHANG,ET AL.: "Spring-Back Preditcion of the Bi-Layered Metallic Tube under CNC Bending Considering Neutral Layer Shifting Extraction", 《APPLIED SCIENCES》 *
张树有等: "考虑Sobol缺陷敏感度的抗恶劣环境结构设计方法", 《浙江大学学报》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113189589A (zh) * 2021-05-08 2021-07-30 南京航空航天大学 基于卷积神经网络的多通道合成孔径雷达动目标检测方法
CN113189589B (zh) * 2021-05-08 2024-05-17 南京航空航天大学 基于卷积神经网络的多通道合成孔径雷达动目标检测方法
CN113297527A (zh) * 2021-06-09 2021-08-24 四川大学 基于多源城市大数据的pm2.5全面域时空计算推断方法
CN113297527B (zh) * 2021-06-09 2022-07-26 四川大学 基于多源城市大数据的pm2.5全面域时空计算推断方法
CN113779910A (zh) * 2021-11-10 2021-12-10 海光信息技术股份有限公司 产品性能分布预测方法及装置、电子设备及存储介质
CN114861498A (zh) * 2022-05-18 2022-08-05 上海交通大学 融合多传感时序信号机理模型的电阻点焊质量在线检测方法
WO2024059965A1 (zh) * 2022-09-19 2024-03-28 浙江大学 基于双通道信息互补融合堆叠自编码器的产品质量预测方法

Also Published As

Publication number Publication date
CN112257341B (zh) 2022-04-26
WO2022083009A1 (zh) 2022-04-28

Similar Documents

Publication Publication Date Title
CN112257341B (zh) 一种基于异源数据差补融合的定制产品性能预测方法
CN109086805B (zh) 一种基于深度神经网络和成对约束的聚类方法
US20220122103A1 (en) Customized product performance prediction method based on heterogeneous data difference compensation fusion
CN111898689B (zh) 一种基于神经网络架构搜索的图像分类方法
CN110941734A (zh) 基于稀疏图结构的深度无监督图像检索方法
CN108985617B (zh) 一种基于智能制造的产品生产流程调度方法及系统
CN113128671B (zh) 一种基于多模态机器学习的服务需求动态预测方法及系统
CN110633859B (zh) 一种两阶段分解集成的水文序列预测方法
CN114841257A (zh) 一种基于自监督对比约束下的小样本目标检测方法
CN112529638B (zh) 基于用户分类和深度学习的服务需求动态预测方法及系统
CN111914478A (zh) 一种综合地质钻孔测井岩性识别方法
CN113988203A (zh) 一种基于深度学习的轨迹序列聚类方法
CN110260914B (zh) 一种基于测点时空特征的工程安全监测系统区域划分方法
CN116187835A (zh) 一种基于数据驱动的台区理论线损区间估算方法及系统
CN116933946A (zh) 一种基于客流去向结构的轨道交通od客流预测方法及系统
CN110503148B (zh) 一种具有尺度不变性的点云对象识别方法
CN116959725A (zh) 一种多模态数据融合的疾病风险预测方法
CN114118369A (zh) 一种基于群智能优化的图像分类卷积神经网络设计方法
CN114548199A (zh) 一种基于深度迁移网络的多传感器数据融合方法
CN110223342A (zh) 一种基于深度神经网络的空间目标尺寸估计方法
CN116739100A (zh) 量子神经网络的漏洞检测方法及自动驾驶漏洞检测方法
CN112241811B (zh) “互联网+”环境下定制产品的分层混合性能预测方法
CN111066562A (zh) 一种葡萄霜霉病预测方法及系统
CN112529637B (zh) 基于情景感知的服务需求动态预测方法及系统
CN115409661A (zh) 基于集成学习模型的就业推荐方法、系统、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant