CN112257341B

CN112257341B - 一种基于异源数据差补融合的定制产品性能预测方法

Info

Publication number: CN112257341B
Application number: CN202011124136.5A
Authority: CN
Inventors: 张树有; 周会芳; 裘乐淼; 王自立
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2020-10-20
Filing date: 2020-10-20
Publication date: 2022-04-26
Anticipated expiration: 2040-10-20
Also published as: WO2022083009A1; CN112257341A

Abstract

本发明公开了一种基于异源数据差补融合的定制产品性能预测方法，该方法基于深度自编码器、邻域关联方法以及相似度差补方法，采用历史实测数据集对计算仿真数据集进行差补修正；采用差补修正后的计算仿真数据集训练BP神经网络作为定制产品的性能预测模型。本发明方法结合深度自编码器，采用邻域关联方法以及相似度差补方法，将低保真度的计算仿真数据与高保真度的历史实测数据进行关联，实现了高保真度的历史实测数据对低保真度的计算仿真数据的差补修正，从而通过异源数据差补融合实现了对产品性能的变保真度预测，提高了性能预测模型的泛化能力，实现了在设计阶段对定制产品性能的高效可信预测。

Description

一种基于异源数据差补融合的定制产品性能预测方法

技术领域

本发明属于“互联网+”环境下定制产品性能预测领域，尤其涉及一种基于异源数据差补融合的定制产品性能预测方法。

背景技术

“互联网+”环境下，用户对产品的个性化需求日益凸显，同时在用户深度参与设计过程方面也提出了更高的要求。针对用户需求驱动的个性化定制产品设计而言，定制产品的性能预测有助于在设计阶段对用户需求实现高效快速响应，同时能够有效降低设计成本同时缩短设计周期，从而可以有效促进用户深度参与设计过程。

传统的产品性能预测方法一般有两种，第一种是基于历史实测性能进行推演预测，从累积的历史实测性能数据的角度出发，实现“性能—性能”的推演预测，具有较高的可信度，但费用高、周期长且响应慢；第二种方法是基于结构形状建模的仿真预测，从结构形状建模及计算仿真的角度出发，实现“形状—性能”的仿真预测，响应高效快速，但计算仿真具有较大误差，使得性能预测的可信度低。以上两种方法都难以在设计阶段实现定制产品的高效快速、可信性预测。

发明内容

本发明的目的在于针对现有技术的不足，提供一种基于异源数据差补融合的定制产品性能预测方法。本发明采用BP神经网络模型作为预测模型，同时结合深度自编码器，并通过邻域关联方法和相似度差补方法进行异源数据差补融合，采用高保真度的历史实测性能数据对低保真度的计算仿真性能数据进行关联和差补修正，从而能够实现对产品性能的变保真度预测，由此解决了难以在设计阶段对定制产品性能进行高效、可信预测的问题。

本发明的目的是通过以下技术方案来实现的：一种基于异源数据差补融合的定制产品性能预测方法，该方法包括下列步骤：

(1)以定制产品的配置参数作为输入特征，定制产品的待预测性能作为输出特征，收集获取数据样本。收集对已有产品实测的性能数据，构建定制产品性能预测的历史实测数据集；利用计算机仿真软件，建立定制产品的虚拟仿真模型，通过仿真分析获取性能数据，构建定制产品性能预测的计算仿真数据集；

(2)对历史实测数据集和计算仿真数据集进行数据预处理。

(3)基于历史实测数据集对计算仿真数据集进行差补修正：基于深度自编码器对历史实测数据集和计算仿真数据集进行编码，将数据样本从输入空间映射到特征空间，实现对数据样本的关键特征进行表达，记编码后的历史实测数据集为ESet_h，记编码后的计算仿真数据集为ESet_s；通过随机采样，将数据集ESet_h划分为训练样本集、验证样本集和测试样本集等，分别记为历史实测训练集ESet_htrain、历史实测验证集ESet_hvalid和历史实测测试集ESet_htest；最后采用邻域关联方法对数据集ESet_s和数据集ESet_htrain进行相关联接，并通过相似度差补方法，采用数据集ESet_htrain对数据集ESet_s进行差补修正，记差补修正后的数据集ESet_s为MSet_s；

(4)选取BP神经网络模型作为定制产品的性能预测模型，并以步骤(1)中选取的输入特征和输出特征作为预测模型的输入和输出。以差补修正后的计算仿真数据集作为训练样本集，结合禁忌搜索算法训练构建一个最优BP神经网络模型；随后采用历史实测测试集ESet_htest对该模型进行测试，以得到最终的定制产品的性能预测模型；

(5)对待预测的数据样本，首先按照步骤(2)中对计算仿真数据集的处理进行数据预处理，然后输入至步骤(3)中构建的深度自编码器中进行编码，最后将编码后的待预测样本输入至步骤(4)中构建的预测模型进行预测，即可得到定制产品在不同配置参数条件下的产品性能。

进一步地，所述步骤(2)为首先对历史实测数据集进行数据去噪以及数据增补处理；然后分别对历史实测数据集和计算仿真数据集进行数据归一化处理。

进一步地，所述的步骤(3)中，采用历史实测数据集和计算仿真数据集训练一个神经网络模型，以此作为数据样本的深度自编码器。该深度自编码器由输入层、编码器、特征表达层、解码器以及输出层构成，且编码器与解码器均包含三个隐藏层。深度自编码器的输入与输出均为数据样本的输入特征向量，层与层之间采用全连接方式，输入层与隐藏层、隐藏层与隐藏层之间的激活函数采用relu函数，隐藏层与输出层之间的激活函数采用tanh函数。

进一步地，所述的步骤(3)中，采用邻域相关方法对编码后的计算仿真数据集ESet_s和历史实测训练集ESet_htrain进行相关联接，关联的具体过程为：对数据集ESet_s中每一个数据样本初始化一个空的标记集；在数据集ESet_htrain中任选一个数据样本Sample_k，以该数据样本Sample_k为中心，以邻域阈值ε为半径，对位于此邻域范围内的数据集ESet_s中的数据样本添加标记至标记集中，添加的标记为该数据样本Sample_k的编号，与此同时将数据样本Sample_k的访问属性设置为已访问；遍历数据集ESet_htrain中所有访问属性为未访问的数据样本，重复对其邻域范围内的数据样本添加标记，直至数据集ESet_htrain中的数据样本的访问属性均为已访问。

进一步地，所述的步骤(3)中，基于相似度差补方法，采用历史实测训练集ESet_htrain对编码后的计算仿真数据集ESet_s进行差补修正。该相似度差补方法为：遍历数据集ESet_s，对其每一个标记集不为空的数据样本Sample_l按照下式对该数据样本的输出特征进行差补修正：

其中，

表示数据样本Sample_l的差补修正后的输出特征向量；

表示数据样本Sample_l的差补修正前的输出特征向量，即为通过仿真分析获取的输出特征向量；M表示该数据样本Sample_l的标记集中的标记个数，也就是与该数据样本Sample_l相关联的数据集ESet_htrain中数据样本的个数；S_z表示数据样本Sample_l和第z个与其相关联的数据集ESet_htrain中的数据样本之间的欧式距离，该值衡量了这两个数据样本之间的相似度；Δy_z表示数据样本Sample_l的输出特征向量和第z个与其相关的数据集ESet_htrain中的数据样本的输出特征向量之间的绝对差值；

表示第z个与数据样本Sample_l相关的数据集ESet_htrain中的数据样本的输出特征向量；α、β为超参数。

进一步地，所述的步骤(4)中，以差补修正后的计算仿真数据集MSet_s作为训练样本集，以历史实测验证集ESet_hvalid作为验证样本集，以历史实测测试集ESet_htest作为测试样本集，结合禁忌搜索算法训练构建一个最优的BP神经网络模型BPNN_sopt，以此作为最终的预测模型。该模型由一个输入层，三个隐藏层和一个输出层构成，层与层之间均为全连接，输入层的神经元个数为数据样本输入特征的个数，输出层的神经元个数为数据样本的输出特征的个数，隐藏层的神经元个数分别为h₁、h₂和h₃，通过

确定h₁、h₂和h₃的范围；其中，L为隐藏层神经元个数，n_in为输入层神经元个数，n_out为输出层神经元个数，a为(1，10)之间的常数；在对应范围内选择不同的h₁、h₂和h₃，采用训练样本集对当前h₁、h₂和h₃组合下的模型进行训练，并采用验证样本集验证训练得到的模型，得到当前h₁、h₂和h₃组合下的验证误差；以验证误差为目标，采用禁忌搜索算法优化h₁、h₂和h₃，确定最优的隐藏层的神经元个数h_1opt、h_2opt和h_3opt，从而在当前隐藏层层数固定的基础上，训练得到一个最优模型BPNN_sopt；最后采用测试样本集对该最优模型BPNN_sopt进行测试，若满足要求则选取该模型为最终的预测模型，否则重新设置该BP神经网络模型的隐藏层层数并重新训练新的网络模型。

进一步地，所述的步骤(4)中，隐藏层的初始化采用如下方式：权重均初始化为服从正态分布的[-1，1]之间的随机数，偏差均初始化为0；激活函数采用relu-relu-relu-tanh形式，损失函数采用均方损失函数，采用小批量梯度下降法更新权重和偏差。

本发明的有益效果是：本发明的方法采用深度自编码器对数据样本输入特征进行编码，将数据样本从输入空间映射到特征空间，以实现对数据关键特征进行表达，并能够表现出计算仿真数据样本与历史实测数据样本之间的相关性以及相似性；基于数据样本编码，采用邻域关联方法和相似度差补方法，实现了历史实测数据与计算仿真数据之间的相关联接，同时实现了高保真度的历史实测数据对低保真度的计算仿真数据的差补修正，从而能够有效实现计算仿真数据与历史实测数据的差补融合。本发明的方法通过异源数据差补融合能够实现对定制产品性能的变保真度预测，提高了性能预测模型的泛化能力，有效实现了在设计阶段对定制产品性能的高效可信预测。

附图说明

图1为按照本发明的定制产品性能预测方法的流程图；

图2为按照本发明的实施例的基于计算仿真数据集和历史实测数据集所构建的深度自编码器的拓扑结构图；

图3为按照本发明的实施例的基于差补修正后的计算仿真数据集构建最优BP神经网络BPNN_sopt的流程图。

具体实施方式

下面结合附图及具体实施例对本发明作进一步详细地说明。

本发明以定制电梯产品轿厢水平振动加速度峰峰值这一性能预测作为实施例，训练构造BP神经网络模型，从而建立定制电梯产品的配置参数与电梯轿厢水平振动加速度峰峰值之间的映射关系，用以对不同配置参数下的电梯产品的轿厢水平振动性能进行可信预测。图1是按照本发明的实施例所构建的预测方法的流程图，如图1所示：

本发明的一种基于异源数据差补融合的定制产品性能预测方法，包括以下步骤：

步骤1：以定制产品的配置参数作为输入特征，定制产品的待预测性能作为输出特征，收集获取数据样本。从企业收集对已有产品实测的性能数据，构建定制产品性能预测的历史实测数据集；利用计算机仿真软件，建立定制产品的虚拟仿真模型，通过仿真分析获取性能数据，构建定制产品性能预测的计算仿真数据集。

本发明的实施例以定制电梯产品的最大运行速度v_max、最大运行加速度a_max、运行高度H、曳引绳密度ρ、曳引绳公称直径D、曳引绳弹性模量E、轿架质量m_frame及等效转动惯量J_frame、轿厢质量m_car及等效转动惯量J_car、额定载荷m_load、导靴弹簧等效刚度k_shoe及阻尼c_shoe、减振橡胶等效刚度k_rub及阻尼c_rub作为输入特征，以定制电梯产品轿厢水平振动加速度峰峰值a_hvpp为输出特性，采集获取训练数据样本。

从企业收集已有电梯产品的实测轿厢水平振动加速度峰峰值，构建历史实测数据集；基于拉丁超立方采样方法进行实验设计，然后利用计算机仿真软件ADAMS以及产品开发软件NX，建立电梯产品的虚拟仿真模型，通过Ansys仿真分析获取轿厢水平振动加速度峰峰值，构建计算仿真数据集。

步骤2：对历史实测数据集和计算仿真数据集进行数据预处理，包括数据去噪、数据增补以及数据归一化处理。首先针对实测数据样本存在的噪声、特征值缺失等问题，对历史实测数据集进行数据去噪以及数据增补处理；然后分别对历史实测数据集和计算仿真数据集进行数据归一化处理。数据归一化处理之前的历史实测数据集和计算仿真数据集分别如表1、表2所示。

表1:电梯轿厢水平振动加速度峰峰值的历史实测数据

表2：电梯轿厢水平振动加速度峰峰值的计算仿真数据

本发明的实施例对历史实测数据集进行数据去噪处理时，采用离群点检测方法。采用基于聚类的离群点检测方法，对数据集中的样本点进行聚类，通过聚类将数据样本点组织成“簇”，在聚类完成后无法归属于任意聚类簇的数据样本即为离群点，从而实现在发现聚类簇的同时检测出离群点。检测出的离群点是数据集中的噪声，从数据集中去除这些离群点即可实现数据集去噪。本发明的实施例采用DBSCAN聚类方法。

本发明的实施例对历史实测数据集进行数据增补处理时，当数据样本的特征值缺失个数超过5个时，则去除该数据样本，否则采用特征值均值填补该数据样本的缺失特征。

本发明的实施例对历史实测数据集和计算仿真数据集的输入特征进行分别归一化处理，使得数据样本的输入特征值均位于[-1,1]之间，数据归一化处理公式如下：

式(1)中，x_i′表示归一化后的第i个输入特征值，x_i表示被归一化的第i个输入特征值，x_i，max表示被归一化的第i个输入特征的最大值，x_i，min表示被归一化的第i个输入特征的最小值，m表示数据集的输入特征的个数。

步骤3：基于历史实测数据集对计算仿真数据集进行差补修正。基于深度自编码器对历史实测数据集和计算仿真数据集进行编码，将数据样本从输入空间映射到特征空间，实现对数据样本的关键特征进行表达，记编码后的历史实测数据集为ESet_h，记编码后的计算仿真数据集为ESet_s；随后以训练样本数比验证样本数比测试样本数之比为7∶2∶1的比例，随机采样，将数据集ESet_h划分为训练样本集、验证样本集和测试样本集，分别记为历史实测训练集ESet_htrain、历史实测验证集ESet_hvalid和历史实测测试集ESet_htest；最后采用邻域关联方法对数据集ESet_s和数据集ESet_htrain进行相关联接，并通过相似度差补方法，采用数据集ESet_htrain对数据集ESet_s进行差补修正，记差补修正后的数据集ESet_s为ESet_smod。

本发明的实施例实现历史实测训练集ESet_htrain对编码后的计算仿真数据集ESet_s进行差补修正的过程的具体描述如下：

步骤3.1：以历史实测数据集和计算仿真数据集作为训练样本集，构建训练深度自编码器，对数据样本进行编码，记编码后的计算仿真数据集为ESet_s，记编码后的历史实测数据集为ESet_h。

采用BP神经网络构建深度自编码器，该深度自编码器的拓扑结构如图2所示。该深度自编码器由输入层、编码器、特征表达层、解码器以及输出层构成，编码器与解码器均包含三个隐藏层，层与层之间的连接均为全连接。该深度自编码器的输入与输出均为数据样本的输入特征向量，即有输入层和输出层的神经元个数均为数据样本的输入特征的个数即为15；编码器的三个隐藏层的神经元个数分别为N_e1、N_e2和N_e3，相对应地，解码器的三个隐藏层的神经元个数分别为N_e3、N_e2和N_e1。通过经验公式

可以确定N_e1、N_e2和N_e3的范围，其中，L_e为编码器/解码器的隐藏层神经元个数，n_ein为输入层神经元个数，n_eout为特征表达层神经元个数，a_e为(1，10)之间的常数。基于十折交叉验证方法，选择由经验公式确定的隐藏层神经元个数的范围内选择不同的N_e1、N_e2和N_e3组合，构建训练深度自编码器并计算该模型的交叉验证误差，选择交叉验证误差最小的那一组作为编码器/解码器的隐藏层神经元个数。

更多地，各隐藏层的初始化采用如下方式：权重均初始化为服从正态分布的[-1，1]之间的随机数，偏差均初始化为0；输入层与隐藏层、隐藏层与隐藏层之间的激活函数采用relu函数，隐藏层与输出层之间的激活函数采用tanh函数；损失函数采用均方损失函数；采用小批量梯度下降法更新权重和偏差。

采用计算仿真数据集和历史实测数据集对该深度自编码器进行训练，训练完成后，提取特征表达层的输出作为数据样本编码后的特征向量。

步骤3.2：对编码后的历史实测数据集ESet_h进行划分。以训练样本数比验证样本数比测试样本数之比为7∶2∶1的比例，随机采样，将数据集ESet_h划分为训练样本集、验证样本集和测试样本集，记划分的样本集分别为历史实测训练集ESet_htrain、历史实测验证集ESet_hvalid和历史实测测试集ESet_htest。

步骤3.3：采用邻域相关方法，对编码后的计算仿真数据集ESet_s与历史实测训练集ESet_htrain进行关联。

定义：设置ε为邻域大小阈值，以数据样本A为中心，以邻域阈值ε为半径，若数据样本B位于数据样本A的邻域范围(超球体)内，则认定数据样本B与数据样本A相关，也就是说当数据样本B与该数据样本A之间的欧式距离小于阈值ε时，数据样本B与数据样本A是相关的，否则数据样本B与数据样本A不相关的。

基于上述定义，该邻域相关方法对数据样本进行关联的过程可以表述为：对数据集ESet_s中每一个数据样本初始化一个空的标记集；在数据集ESet_htrain中任选一个数据样本Sample_k，以该数据样本Sample_k为中心，以邻域阈值ε为半径，对位于此邻域范围(超球体)内的数据集ESet_s中的数据样本添加标记至标记集，添加的标记为该数据样本Sample_k的编号，与此同时将数据样本Sample_k的访问属性设置为已访问；遍历数据集ESet_htrain中所有访问属性为未访问的数据样本，重复上述过程直至数据集ESet_htrain中的数据样本的访问属性均为已访问。因此，对于数据样本集ESet_s中的任一数据样本而言，与其相关的数据集ESet_htrain中的数据样本个数可能为零也可能有多个。

上述过程用下述的伪代码进行表达：

步骤3.4：通过相似度差补方法，采用历史实测训练集ESet_htrain对编码后的计算仿真数据集ESet_s进行差补修正，记差补修正后的计算仿真数据集为MSet_s。

基于步骤3.1中的对输入特征的编码，通过计算数据集ESet_htrain中的数据样本与数据集ESet_s中数据样本之间的欧式距离可以衡量两者之间的相似性，欧式距离越大表明两者之间的相似性越小，反之越大，从而可以用相似性衡量数据集ESet_htrain中数据样本对数据集ESet_s中数据样本进行修正时所占的权重。

具体地，该相似度差补方法可以表述为：遍历数据集ESet_s，对每一个标记集不为空的数据样本Sample_l按照下式对该数据样本的输出特征进行差补修正：

式中，

表示数据样本Sample_l的差补修正后的输出特征向量；

表示数据样本Sample_l的差补修正前的输出特征向量，即为通过仿真分析获取的输出特征向量；M表示该数据样本Sample_l的标记集中的标记个数，也就是与数据样本Sample_l相关联的数据集ESet_htrain中数据样本的个数；S_z表示数据样本Sample_l和第z个与其相关的数据集ESet_htrain中的数据样本之间的欧式距离，该值衡量了这两个数据样本之间的相似度；Δy_z表示数据样本Sample_l的输出特征向量和第z个与其相关的数据集ESet_htrain中的数据样本的输出特征向量之间的绝对差值；

上述过程用下述的伪代码进行表达：

步骤4：选取BP神经网络模型作为定制电梯产品轿厢水平振动加速度峰峰值的预测模型，以差补修正后的计算仿真数据集MSet_s作为训练样本集，以历史实测验证集ESet_hvalid作为验证样本集，以历史实测测试集ESet_htest作为测试样本集，结合禁忌搜索算法训练构建一个最优的BP神经网络模型BPNN_sopt。更多地，构建最优模型BPNN_sopt的流程如图3所示。

步骤4.1：模型BPNN_s构建及初始化：该模型由一个输入层，三个隐藏层和一个输出层构成，层与层之间均为全连接。输入层的神经元个数为数据样本的输入特征个数即为15，输出层的神经元个数为数据样本输出特征个数即为1，隐藏层的神经元个数分别为h₁、h₂和h₃，通过经验公式

可以确定h₁、h₂和h₃的范围，其中，L为隐藏层神经元个数，n_in为输入层神经元个数，n_out为输出层神经元个数，a为(1，10)之间的常数。更多地，三个隐藏层的权重均初始化为服从正态分布的[-1，1]之间的随机数，偏差均初始化为0，激活函数采用relu-relu-relu-tanh形式。

步骤4.2：模型BPNN_s的训练及验证：设定训练过程采用均方损失函数作为损失函数，小批量梯度下降法更新权重和偏差，学习率为0.002，批量大小为30，学习误差目标为10^-3，学习最大循环次数为10000次。使用训练样本集MSet_s进行迭代训练，训练迭代如下所述：1)随机采样一个批量大小的训练样本；2)样本依次输入模型，进行前向计算，计算相对应的输出；3)根据损失函数，计算该批量大小训练样本的损失l_batch；4)误差反向传播，采用小批量梯度下降法对权重和偏差进行更新；5)重复1～4直至遍历完整个训练样本集MSet_s的训练样本，并将各个批量的损失累加，得到整个训练样本集MSet_s的损失l_sum；6)判断第5步中的损失l_sum是否满足设定的学习误差目标，若是，则模型训练完成，否则，进入下一步；7)判断迭代次数是否超过设置的学习最大循环次数，若是，则模型训练完成，否则，完成一次循环迭代，进入下一轮循环，跳转到第1步。

采用验证样本集ESet_hvalid对训练完成的模型进行验证。将验证样本依次输入模型，通过前向计算，计算相对应的输出，然后根据损失函数计算样本误差，最后将各个验证样本的误差累加，即得到相应的验证误差。

步骤4.3：结合禁忌搜索算法优化模型参数h₁、h₂和h₃：在由L确定的范围内选择不同的h₁、h₂和h₃组合，首先按照步骤4.1构建并初始化模型BPNN_s，然后按照步骤4.2对其进行训练及验证，得到不同h₁、h₂和h₃组合下的验证误差。以验证误差为目标，采用禁忌搜索算法优化h₁、h₂和h₃，确定最优的隐藏层的神经元个数h_1opt、h_2opt和h_3opt，从而在当前隐藏层层数固定的基础上，基于差补修正后的计算仿真数据集MSet_s训练得到一个最优模型BPNN_sopt。

步骤4.4：当前最优模型BPNN_sopt的测试：采用测试样本集ESet_htest对该当前最优模型BPNN_sopt进行测试，计算测试误差，若测试误差满足要求则设置该模型为最终的产品性能预测模型，否则，重新设置BP神经网络的隐藏层层数，重复步骤4中的4.1～4.3步，构建、训练以及验证模型。

采用均方绝对百分比误差作为指标来计算预测模型BPNN_sopt的测试误差，且均方绝对百分比误差的表达式如下所示：

式中，N_valid表示历史实测验证集的样本大小；

表示预测模型Surr_bpmix对历史实测验证集中第u个数据样本的电梯轿厢水平振动加速度峰峰值的预测值；

表示历史实测验证集中第u个数据样本的电梯轿厢水平振动加速度峰峰值的实测值。

所构建的预测模型BPNN_sopt对测试样本集ESet_htest中样本的测试误差如表3所示。

表3预测模型BPNN_sopt对测试样本集ESet_htest的预测误差

从表3可以看出，针对测试样本集ESet_htest中样本，所构建的预测模型BPNN_sopt对电梯轿厢水平振动加速度峰峰值的均方绝对百分比误差为2.79％。均方绝对百分比误差越小，表示模型的预测精度越高，预测性能越好。更多地，当均方绝对百分比误差低于10％时，模型的预测精度是满足要求的。因此，所构建的预测模型BPNN_sopt可以实现对电梯轿厢水平震动加速度峰峰值的可信预测。

步骤5：待测数据样本的预测。对待预测的数据样本，首先按照步骤2中计算仿真数据集的数据归一化处理方式对其输入特征进行归一化，然后输入至步骤3中构建的深度自编码器中进行编码，最后将编码后的待预测样本输入至预测模型BPNN_sopt进行预测，即可得到定制电梯产品在不同配置参数条件下的轿厢水平振动加速度峰峰值。

Claims

1.一种基于异源数据差补融合的定制产品性能预测方法，其特征在于，该方法包括下列步骤：

(1)以定制产品的配置参数作为输入特征，定制产品的待预测性能作为输出特征，收集获取数据样本；收集对已有产品实测的性能数据，构建定制产品性能预测的历史实测数据集；利用计算机仿真软件，建立定制产品的虚拟仿真模型，通过仿真分析获取性能数据，构建定制产品性能预测的计算仿真数据集；

(2)对历史实测数据集和计算仿真数据集进行数据预处理；

(3)基于历史实测数据集对计算仿真数据集进行差补修正：基于深度自编码器对历史实测数据集和计算仿真数据集进行编码，将数据样本从输入空间映射到特征空间，实现对数据样本的关键特征进行表达，记编码后的历史实测数据集为ESet_h，记编码后的计算仿真数据集为ESet_s；通过随机采样，将数据集ESet_h划分为训练样本集、验证样本集和测试样本集，分别记为历史实测训练集ESet_htrain、历史实测验证集ESet_hvalid和历史实测测试集ESet_htest；最后采用邻域关联方法对数据集ESet_s和数据集ESet_htrain进行相关联接，并通过相似度差补方法，采用数据集ESet_htrain对数据集ESet_s进行差补修正，记差补修正后的数据集ESet_s为MSet_s；

(4)选取BP神经网络模型作为定制产品的性能预测模型，并以步骤(1)中选取的输入特征和输出特征作为预测模型的输入和输出；以差补修正后的计算仿真数据集作为训练样本集，结合禁忌搜索算法训练构建一个最优BP神经网络模型；随后采用历史实测测试集ESet_htest对该模型进行测试，以得到最终的定制产品的性能预测模型；

2.根据权利要求1所述的一种基于异源数据差补融合的定制产品性能预测方法，其特征在于，所述步骤(2)为首先对历史实测数据集进行数据去噪以及数据增补处理；然后分别对历史实测数据集和计算仿真数据集进行数据归一化处理。

3.根据权利要求1所述的一种基于异源数据差补融合的定制产品性能预测方法，其特征在于，所述的步骤(3)中，采用历史实测数据集和计算仿真数据集训练一个神经网络模型，以此作为数据样本的深度自编码器；该深度自编码器由输入层、编码器、特征表达层、解码器以及输出层构成，且编码器与解码器均包含三个隐藏层；深度自编码器的输入与输出均为数据样本的输入特征向量，层与层之间采用全连接方式，输入层与隐藏层、隐藏层与隐藏层之间的激活函数采用relu函数，隐藏层与输出层之间的激活函数采用tanh函数。

4.根据权利要求1所述的一种基于异源数据差补融合的定制产品性能预测方法，其特征在于，所述的步骤(3)中，采用邻域相关方法对编码后的计算仿真数据集ESet_s和历史实测训练集ESet_htrain进行相关联接，关联的具体过程为：对数据集ESet_s中每一个数据样本初始化一个空的标记集；在数据集ESet_htrain中任选一个数据样本Sample_k，以该数据样本Sample_k为中心，以邻域阈值ε为半径，对位于此邻域范围内的数据集ESet_s中的数据样本添加标记至标记集中，添加的标记为该数据样本Sample_k的编号，与此同时将数据样本Sample_k的访问属性设置为已访问；遍历数据集ESet_htrain中所有访问属性为未访问的数据样本，重复对其邻域范围内的数据样本添加标记，直至数据集ESet_htrain中的数据样本的访问属性均为已访问。

5.根据权利要求4所述的一种基于异源数据差补融合的定制产品性能预测方法，其特征在于，所述的步骤(3)中，基于相似度差补方法，采用历史实测训练集ESet_htrain对编码后的计算仿真数据集ESet_s进行差补修正；该相似度差补方法为：遍历数据集ESet_s，对其每一个标记集不为空的数据样本Sample_l按照下式对该数据样本的输出特征进行差补修正：

其中，

表示数据样本Sample_l的差补修正后的输出特征向量；

6.根据权利要求1所述的一种基于异源数据差补融合的定制产品性能预测方法，其特征在于，所述的步骤(4)中，以差补修正后的计算仿真数据集MSet_s作为训练样本集，以历史实测验证集ESet_hvalid作为验证样本集，以历史实测测试集ESet_htest作为测试样本集，结合禁忌搜索算法训练构建一个最优的BP神经网络模型BPNN_sopt，以此作为最终的预测模型；该模型由一个输入层，三个隐藏层和一个输出层构成，层与层之间均为全连接，输入层的神经元个数为数据样本输入特征的个数，输出层的神经元个数为数据样本的输出特征的个数，隐藏层的神经元个数分别为h₁、h₂和h₃，通过

确定h₁、h₂和h₃的范围；其中，L为隐藏层神经元个数，n_in为输入层神经元个数，n_out为输出层神经元个数，a为(1,10)之间的常数；在对应范围内选择不同的h₁、h₂和h₃，采用训练样本集对当前h₁、h₂和h₃组合下的模型进行训练，并采用验证样本集验证训练得到的模型，得到当前h₁、h₂和h₃组合下的验证误差；以验证误差为目标，采用禁忌搜索算法优化h₁、h₂和h₃，确定最优的隐藏层的神经元个数h_1opt、h_2opt和h_3opt，从而在当前隐藏层层数固定的基础上，训练得到一个最优模型BPNN_sopt；最后采用测试样本集对该最优模型BPNN_sopt进行测试，若满足要求则选取该模型为最终的预测模型，否则重新设置该BP神经网络模型的隐藏层层数并重新训练新的网络模型。

7.根据权利要求6所述的一种基于异源数据差补融合的定制产品性能预测方法，其特征在于，所述的步骤(4)中，隐藏层的初始化采用如下方式：权重均初始化为服从正态分布的[-1,1]之间的随机数，偏差均初始化为0；激活函数采用relu-relu-relu-tanh形式，损失函数采用均方损失函数，采用小批量梯度下降法更新权重和偏差。