CN113283533B

CN113283533B - 面向性能衰退时间序列数据的可借用样本筛选方法和系统

Info

Publication number: CN113283533B
Application number: CN202110649050.2A
Authority: CN
Inventors: 马剑; 刘学; 邹新宇; 尚芃超; 丁宇; 吕琛
Original assignee: Beihang University
Current assignee: Beihang University
Priority date: 2020-06-12
Filing date: 2021-06-10
Publication date: 2022-08-12
Anticipated expiration: 2041-06-10
Also published as: CN113283533A

Abstract

本发明公开一种面向性能衰退时间序列数据的可借用样本筛选方法，涉及人工智能与数据处理技术领域，包括对采集目标相似产品当前的产品数据及数据库中保存的同类型相似产品的全寿产品数据分别按M个不同平滑尺度进行平滑处理，通过对每个处理结果进行双指标综合评估，实现时间尺度自优化选择，最终获得可借用样本。本发明方法能够自动给出性能衰退序列数据的最佳平滑尺度，解决由于大尺度平滑引起的退化趋势信息丢失和小尺度过滤噪声对准确预测的负面影响；同时还能够从其他域大量差异化数据中获得与性能衰退序列数据最相似样本，进而增强模型的泛化能力，提高预测的精准度，解决了目前无法利用相似样本进行精准预测的问题。

Description

面向性能衰退时间序列数据的可借用样本筛选方法和系统

技术领域

本发明涉及人工智能与数据处理技术领域，尤其涉及可借用样本的筛选方法。

背景技术

迁移学习在文本分类、情感分类和强化学习等领域都取得了显著的成果。然而，这些迁移学习方法大多用于解决分类问题，通过类似样本加权的方法将两个领域不同统计分布的数据进行分布对齐来逼近相似性。但是，性能衰退序列数据和类别数据存在明显区别，也不符合一定的统计分布规律，已有的类别数据迁移学习方法无法用于性能衰退序列数据。因此，针对性能衰退数据特点和预测任务需求，从序列间距离、角度、当前和未来趋势等多个方面，研究如何定义和度量数据可借用性，并用于设计可借用样本的筛选策略，从其他域大量差异化数据中获得最相似的样本，具有重大意义和应用需求。

本领域一般将对预测有用的信息通常定义为对性能退化趋势敏感的信息。由于多种因素(如传感器、数据采集装置、剖面振动等)引起的噪声和干扰信号，有用的信息隐藏在原始数据中，导致很难直接通过原始数据获得较高的精度。因此，提出了多种数据平滑方法，包括移动平均法、指数平滑法、指数移动平均法、局部加权回归法(LWR)等。尽管LWR在根据曲线形状和序列关系进行自适应平滑方面拥有较大优势，并且有利于避免末端效应问题，可以突出退化趋势，进一步提高预测精度，但是基于LWR数据平滑方法的时间尺度通常是根据专家经验手动设置的，因此误差较大，平滑效果和效率低。

发明内容

为从其他域大量差异化数据中获得最相似的样本，本发明提供一种筛选可借用性能衰退序列数据的方法，本发明方法能够自动给出性能衰退序列数据的最佳平滑尺度，解决由于大尺度平滑引起的退化趋势信息丢失和小尺度过滤噪声对准确预测的负面影响；同时还能够从其他域大量差异化数据中获得与性能衰退序列数据最相似的样本，进而增强模型的泛化能力，提高预测的精准度，解决了目前无法利用相似样本进行精准预测的问题。

为实现本发明的技术目的，本发明提供一种面向性能衰退时间序列数据的可借用样本筛选方法，其特征在于，包括：

通过采集目标相似产品当前的产品数据，得到目标相似产品的性能衰退时间序列数据；

将数据库中保存的同类型相似产品的N条全寿产品数据作为其他域差异化时间序列数据；

按M个不同平滑尺度分别对一条性能衰退时间序列数据进行平滑处理，得到M条性能衰退时间序列的平滑数据；

按M个不同时间尺度分别对N条其他域差异化时间序列数据进行平滑处理，得到N组且每组具有M条的其他域差异化时间序列平滑数据；

利用所述一条性能衰退时间序列数据和所述M条性能衰退时间序列平滑数据，得到对M个性能衰退时间序列平滑数据进行选择的第一双指标综合评估值集，将第一双综合评估值集中的最小值对应的性能衰退时间序列的平滑数据选作目标域；

利用所述N条其他域差异化时间序列数据和N组且每组具有M条的其他域差异化时间序列平滑数据，得到分别对每组中的M条其他域差异化时间序列平滑数据的进行选择的第二双指标综合评估值集，将选择得到的每组中第二双指标综合评估值集中的最小值所对应的其他域差异化时间序列平滑数据，形成具有N条其他域差异化时间序列平滑数据的源域；

通过将源域中的N条其他域差异化时间序列的平滑数据分别与目标域中的一条性能衰退时间序列的平滑数据进行匹配处理，将源域中匹配度最高的一条其他域差异化时间序列的平滑数据作为性能衰退序列数据的可借用样本；

其中所述M和N是大于2的正整数。

特别是，所述利用所述一条性能衰退时间序列数据和所述M条性能衰退时间序列平滑数据，得到对M个性能衰退时间序列平滑数据进行选择的第一双指标综合评估值集包括：

利用所述一条性能衰退时间序列数据和所述M条性能衰退时间序列平滑数据获得每条性能衰退时间序列的平滑数据的均方根误差值和平滑度值；

应用系数变异法计算均方根误差值和平滑度值的权重值，并对均方根误差值和平滑度值进行归一化，根据得到的均方根误差值和平滑度值的权重值与归一化后的均方根误差值和平滑度值计算得到对M个性能衰退时间序列平滑数据进行选择的第一双指标综合评估值。

具体的，所述利用所述N条其他域差异化时间序列数据和N组且每组具有M条的其他域差异化时间序列平滑数据，得到分别对每组中的M条其他域差异化时间序列平滑数据的进行选择的第二双指标综合评估值集包括：

利用所述N条其他域差异化时间序列数据和N组且每组具有M条的其他域差异化时间序列平滑数据获得每条其他域差异化时间序列平滑数据的均方根误差值和平滑度值；

应用系数变异法计算均方根误差值和平滑度值的权重值，并对均方根误差值和平滑度值进行归一化，根据得到的均方根误差值和平滑度值的权重值与归一后的均方根误差值和平滑度值计算得到分别对每组中的M条其他域差异化时间序列平滑数据的进行选择的第二双指标综合评估值集

特别是，所述通过将源域中的N条其他域差异化时间序列的平滑数据分别与目标域中的一条性能衰退时间序列的平滑数据进行匹配处理包括：

在源域中截取与目标域具有相同时间序列的N条截断数据；

计算每条截断数据与目标域数据的余弦距离，获得每条截断数据的余弦距离值。

特别是，所述将源域中匹配度最高的一条其他域差异化时间序列的平滑数据作为性能衰退序列数据的可借用样本是选择余弦距离值最低的截断数据所对应的一条其他域差异化时间序列的平滑数据作为性能衰退序列数据的可借用样本。

为实现本发明的技术目的，本发明再提供一种一种面向性能衰退时间序列数据的可借用样本筛选系统，其特征在于，包括：

数据采集单元，用于采集目标相似产品当前产品数据作为性能衰退时间序列数据，采集数据库中保存的同类型相似产品的全寿产品数据作为其他域差异化时间序列数据；

数据处理单元，按不同平滑尺度分别对性能衰退时间序列数据进行平滑处理，得到多条性能衰退时间序列的平滑数据，按不同平滑尺度分别对多个其他域差异化数据进行平滑处理，得到多组其他域差异化时间序列平滑数据；

样本自动筛选单元，用于自动根据数据处理单元中输入的多条性能衰退时间序列的平滑数据和多组其他域差异化时间序列平滑数据进行筛选，获得性能衰退序列数据的可借用样本；

其中，样本自动筛选模块包括：

数据评选模块，用于利用所述一条性能衰退时间序列数据和所述M条性能衰退时间序列平滑数据，得到对M个性能衰退时间序列平滑数据进行选择的第一双指标综合评估值集，将第一双综合评估值集中的最小值对应的性能衰退时间序列的平滑数据选作目标域；利用所述N条其他域差异化时间序列数据和N组且每组具有M条的其他域差异化时间序列平滑数据，得到分别对每组中的M条其他域差异化时间序列平滑数据的进行选择的第二双指标综合评估值集，将选择得到的每组中第二双指标综合评估值集中的最小值所对应的其他域差异化时间序列平滑数据，形成具有N条其他域差异化时间序列平滑数据的源域；；

数据匹配模块，通过将源域中的N条其他域差异化时间序列的平滑数据分别与目标域中的一条性能衰退时间序列的平滑数据进行匹配处理；

样本输出模块，用于将源域中匹配度最高的一条其他域差异化时间序列的平滑数据输出为性能衰退序列数据的可借用样本。

有益效果

本发明提供的方法和系统能够自动给出性能衰退序列数据的最佳平滑尺度，解决由于大尺度平滑引起的退化趋势信息丢失和小尺度过滤噪声对准确预测的负面影响；同时还能够从其他域大量差异化数据中获得与性能衰退序列数据最相似的借用样本，进而增强模型的泛化能力，提高预测的精准度，解决了目前无法利用借用样本进行精准预测的问题。

附图说明

图1是本发明实施例1提供的一种面向性能衰退时间序列数据的可借用样本筛选方法流程图；

图2是本发明实施例2提供的一种面向性能衰退时间序列数据的可借用样本筛选装置；

图3是本发明应用实施例的实验相似产品数据；

图4是本发明应用实施例的不同时间尺度优化和数据平滑的结果；

图5是本发明应用实施例的不同时间尺度下的数据平滑结果；

图6是本发明应用实施例的可借用样本选择结果；

图7是本发明试验例的不同平滑尺度的数据借用结果。

具体实施方式

以下结合附图对本发明的优选实施例进行详细说明，应当理解，尽管本发明实施例以电池为相似产品，但本发明的相似产品也可以是关于电动机或传动结构的相似产品。本发明的以下所说明的优选实施例仅用于说明和解释本发明，并不用于限定本发明。

实施例1

如图1所示，本发明提供的一种面向性能衰退时间序列数据的可借用样本筛选方法，包括：

步骤S101，通过采集目标相似产品当前的产品数据，作为目标相似产品的性能衰退时间序列数据，例如，通过采集测试电池当前的产品数据，得到电池的性能衰退时间序列数据；

步骤S102，将数据库中保存的同类型相似产品的N条全寿产品数据作为其他域差异化时间序列数据；

步骤S103，按M个不同平滑尺度分别对一条性能衰退时间序列数据进行平滑处理，得到M条性能衰退时间序列的平滑数据；

步骤S104，按M个不同时间尺度分别对N条其他域差异化时间序列数据进行平滑处理，得到N组且每组具有M条的其他域差异化时间序列平滑数据；

具体的，所述具平滑处理是对局部观测数据进行多项式加权拟合，并用最小二乘法进行估计，最终得到需要拟合的点。该方法的具体原理如下：

对每一个点q_i，确定一个窗口范围n，n控制局部加权回归数据平滑的尺度，在窗口内所有的q_k上，k＝1,2,…,n，使用带有权值ω_k(q_i)的加权最小二乘法对q_i进行d阶多项式拟合，得到q_i的拟合值p_i，称为局部加权回归。

函数ω_k(q_i)决定了权值的分布，本发明采用如下(式1)权重函数：

该函数是一种类似高斯分布的指数衰减函数。即，距离回归值越远的点，所占权重越低。式中λ为波长参数，控制了权值随距离下降的速率。λ越大，权重随距离下降的越快。

本发明采用的局部加权回归作为一种非参数的回归方法，可随着自变量的改变，自适应的改变线性回归模型中的参数，即观测值不同，模型参数也会随着变化，最终在自变量空间的范围内给出局部加权回归过后的函数估计值。本发明采用的局部加权回归具有以下优点：①与需要预测的数据有关的因素只有预测数据到训练数据之间的距离，随着距离的接近，关系也随之增大；②有效的减少了回归结果受到来自距离预测数据较远的点的干扰，从而可以避免回归时的欠拟合问题。

步骤S105，利用所述一条性能衰退时间序列数据和所述M条性能衰退时间序列平滑数据，得到对M个性能衰退时间序列平滑数据进行选择的第一双指标综合评估值集，将第一双综合评估值集中的最小值对应的性能衰退时间序列的平滑数据选作目标域；

具体的，步骤S105中所述的利用所述一条性能衰退时间序列数据和所述M条性能衰退时间序列平滑数据，得到对M个性能衰退时间序列平滑数据进行选择的第一双指标综合评估值集包括：

具体的，所述均方根误差值计算方法如式2所示：

式中RMSE(m)表示m分解尺度下的RMSE，f(i)为原始信号(即性能衰退时间序列数据)；

表示m尺度上的分解和重构信号(即M条性能衰退时间序列的平滑数据)；n表示信号长度(即平滑尺度的长度)。

具体的，所述均方根误差值的计算方法如式3所示：

式中r(m)表示m分解尺度下的平滑度，f(i)为原始信号(即性能衰退时间序列数据)；

具体的，所述对均方根误差值和平滑度值进行归一化是采用最大最小值的线性归一化方法对均方根误差指标与平滑度指标进行归一化，使两项指标在融合时不受单个指标绝对数值大小的影响，计算公式如式4和式5所示：

P_RMSE(m)＝[RMSE(m)-RMSE_min]/(RMSE_max-RMSE_min) (式4)

P_r(m)＝[r(m)-r_min]/(r_max-r_min) (式5)

式中RMSE_max和RMSE_min分别为RMSE的最大值和最小值，P_RMSE(m)为标准化的RMSE；r_max和r_min分别为平滑度的最大值和最小值，P_r(m)为归一化平滑度。

具体的，所述应用系数变异法计算均方根误差值和平滑度值的权重值是通过计算RMSE和平滑度的标准差与均值的比值，得到了变异系数。然后，根据每个系数的比值，得到两个权值，如式6-9所示：

式中P_RMSE和P_r表示均方根误差和平滑度的归一化值；

和

表示均方根误差和平滑度的变异系数；

和

表示均方根误差和平滑度的标准差；

和

表示均方根误差和平滑度的均值；

和

表示均方根误差和平滑度变异系数的权值。

具体的，所述根据得到的均方根误差值和平滑度值的权重值与归一化后的均方根误差值和平滑度值计算得到对M个性能衰退时间序列平滑数据进行选择的第一双指标综合评估值是根据式10进行计算：

式中T为综合评价指标值。

步骤S106，利用所述N条其他域差异化时间序列数据和N组且每组具有M条的其他域差异化时间序列平滑数据，得到分别对每组中的M条其他域差异化时间序列平滑数据的进行选择的第二双指标综合评估值集，将选择得到的每组中第二双指标综合评估值集中的最小值所对应的其他域差异化时间序列平滑数据，形成具有N条其他域差异化时间序列平滑数据的源域；

具体的，步骤S106中的所述利用所述N条其他域差异化时间序列数据和N组且每组具有M条的其他域差异化时间序列平滑数据，得到分别对每组中的M条其他域差异化时间序列平滑数据的进行选择的第二双指标综合评估值集包括：

应用系数变异法计算均方根误差值和平滑度值的权重值，并对均方根误差值和平滑度值进行归一化，根据得到的均方根误差值和平滑度值的权重值与归一后的均方根误差值和平滑度值计算得到分别对每组中的M条其他域差异化时间序列平滑数据的进行选择的第二双指标综合评估值集。

具体的，所述步骤S106使用的计算公式与步骤S107相同。

步骤S107，通过将源域中的N条其他域差异化时间序列的平滑数据分别与目标域中的一条性能衰退时间序列的平滑数据进行匹配处理，将源域中匹配度最高的一条其他域差异化时间序列的平滑数据作为性能衰退序列数据的可借用样本；

具体的，步骤S107中所述通过将源域中的N条其他域差异化时间序列的平滑数据分别与目标域中的一条性能衰退时间序列的平滑数据进行匹配处理包括：

在源域中截取与目标域具有相同时间序列的N条截断数据；

具体的，步骤S107中所述将源域中匹配度最高的一条其他域差异化时间序列的平滑数据作为性能衰退序列数据的可借用样本是选择余弦距离值最低的截断数据所对应的一条其他域差异化时间序列的平滑数据作为性能衰退序列数据的可借用样本。

具体的，所述余弦距离是计算两个向量夹角的余弦值来衡量它们之间的相似性。如(式11)所示，通过欧几里得点积的公式可以求出向量

和向量

之间的夹角θ的余弦值：

(式11)为点积的几何定义，其代数定义如下:

式中

和

为n维向量。因此，对于向量

和

在n维向量空间中它们之间的余弦相似度为

式中α为向量

与

的夹角。

余弦相似度在-1和1之间。它越接近1，两个向量就越接近。越接近-1，两个向量的对边就越大。当它接近0时，这两个向量是正交的。

其中，所述M和N是大于2的正整数。

实施例2

如图2所示，本发明提供的一种面向性能衰退时间序列数据的可借用样本筛选系统包括数据采集单元1，用于采集目标相似产品当前产品数据作为性能衰退时间序列数据，采集数据库中保存的同类型相似产品的全寿产品数据作为其他域差异化时间序列数据；数据处理单元2，按不同平滑尺度分别对性能衰退时间序列数据进行平滑处理，得到多条性能衰退时间序列的平滑数据，按不同平滑尺度分别对多个其他域差异化数据进行平滑处理，得到多组其他域差异化时间序列平滑数据；样本自动输出单元3，用于自动根据数据处理单元中输入的多条性能衰退时间序列的平滑数据和多组其他域差异化时间序列平滑数据进行筛选，输出性能衰退序列数据的可借用样本；

进一步地，样本自动筛选模块3包括：数据评选模块31，用于利用所述一条性能衰退时间序列数据和所述M条性能衰退时间序列平滑数据，得到对M个性能衰退时间序列平滑数据进行选择的第一双指标综合评估值集，将第一双综合评估值集中的最小值对应的性能衰退时间序列的平滑数据选作目标域；利用所述N条其他域差异化时间序列数据和N组且每组具有M条的其他域差异化时间序列平滑数据，得到分别对每组中的M条其他域差异化时间序列平滑数据的进行选择的第二双指标综合评估值集，将选择得到的每组中第二双指标综合评估值集中的最小值所对应的其他域差异化时间序列平滑数据，形成具有N条其他域差异化时间序列平滑数据的源域；数据匹配模块32，通过将源域中的N条其他域差异化时间序列的平滑数据分别与目标域中的一条性能衰退时间序列的平滑数据进行匹配处理；33样本输出模块，用于将源域中匹配度最高的一条其他域差异化时间序列的平滑数据输出为性能衰退序列数据的可借用样本。

应用实施例

这里提供了一种以电池作为相似产品(本发明也可以以电动机或者传动机构为相似产品)，筛选出的借用样本进行效果验证，具体过程如下：

本案例中使用的质子交换膜相似产品PEMFC的全寿产品数据是Morando等人提供的测试数据。测试是在恒载情况下以0.6A/cm²的电流密度运行相似产品来实现的。经过测试的相似产品是一个具有5个子电池的PEMFC电池堆，其有效面积为100A/cm²，该电池在自然老化过程中没有出现任何故障。用于实验测试的参数如表1所示。

表1 PEMFC退化试验参数

1、数据的采集

从试验台上获得的5个电池(命名为U1到U5)的电压如图5所示。由于位置的变化，同一堆栈上的5个单元以相似但不同的方式退化。堆栈边缘的单元比中间的单元退化得快。因此，五种退化的细胞电压可以通过五次交叉验证技术来验证预测借用样本的准确性。从test1到test5总共有5个测试。例如，在Test1中，U1作为目标相似产品的性能衰退时间序列数据，并命名为第一个目标FC。U2到U5的其他域差异化时间序列数据。根据实际使用情况，将相似产品的使用寿命标准设定为0.64伏特。相似产品寿命为由电压连续低于标准设定8小时的时间。为了评估借用样本的准确性，从第100小时到第1050小时，每隔50小时对不同的测试数据进行一次数据采集。

2、平滑处理

在产品数据中，观察到的峰值是由于质子交换膜相似产品(PEMFC)的周期表征，该表征用于获得极化曲线的静态响应和电化学阻抗谱的动态响应。每个周期的PEMFC特性有助于在数据生成期间进行对齐。因此，为了保留峰值并去除无用的噪声，采用了一种时标自优化LWR方法对原始产品数据进行滤波，以明确PEMFC的周期性退化趋势。如图4-(a)所示，随着平滑尺度的增大，综合指数逐渐减小，然后增大，最小值在40-60左右。在综合指数曲线分析的基础上，选择51作为基于LWR方法的数据平滑最优尺度。在图4-(b)中绘制了51刻度处的平滑信号，并对其进行了归一化。

将最优尺度下的数据平滑结果与第21和第131尺度下的数据平滑结果进行比较如图5所示，如果平滑尺度过小(图5-(a))，则无法有效滤除原始数据中对RUL预测毫无用处的噪声。如果平滑尺度过大(图5-(b))，原始数据中隐藏的周期性和全局退化趋势信息可能会丢失太多。噪声冗余和大规模趋势信息丢失都可能导致预测精度下降。最优平滑尺度把握了上述两种情况之间的平衡，在过滤原始数据波动干扰的基础上，最大程度地保留了数据退化信息。

3、平滑尺度自动选择

随着目标电池现有数据长度的逐渐增大，可迁移性测量和可借用样本的结果也发生了变化。图6显示了从0到1000小时每50小时每个目标FC的可借用样本选择结果。当数据长度较小时，由于初始阶段的退化趋势不明显，结果不稳定。然而，随着获得的数据越来越多，选择结果逐渐趋于恒定。

试验例

利用上述平滑尺度自动选择结果对相似产品的寿命进行预测，预测方法通过构建HTL-SAE模型进行，具体步骤如下：

本发明提供的SAE模型参数如表2所示，输入为可借用样本的归一化产品数据。模型由两个自动编码器堆叠，以学习输入电压的衰退特性。全连通层(隐藏层3)输入所提取的特征以学习目标电池的归一化电压。选择LeakyReLu作为激活函数，加速学习过程，避免神经元失效。批处理大小设置为16，以便将输入数据分成组，最大遍历循环数为50。为了提高模型的鲁棒性，将降噪率设置为0.15。

表2 SAE关键参数

1、不同平滑尺度的数据借用结果

为了分析平滑尺度对数据生成结果的影响，选取两个时间尺度21和131与最优尺度51进行比较。三种平滑尺度下HTL-SAE模型生成的曲线(测试数据长度为800h)如图7所示。利用三种尺度下平滑的目标函数已知部分(图中绿色曲线)选择其可转移样本(灰色曲线)，然后将它们输入到HTL-SAE中得到生成的曲线(黑色曲线)。从图中可以看出，尺度51下生成的曲线与目标FC未知部分(红色曲线)的相似度高于所选样本。当平滑尺度较小(如21)时，未滤波的噪声会给HTL-SAE模型的学习过程带来更多的干扰，从而未能准确提取出目标FC的主趋势。当平滑尺度大于131时，也会剔除较大的周期曲线波动和长期趋势信息，造成过多的有用信息损失，数据生成效果下降，进而影响预测精度。

2、不同数据长度的数据借用结果

随着目标电池的运行，已知数据长度会发生变化，数据生成结果也会发生变化。以最优平滑比例尺51和U4为例，由HTL-SAE模型在不同数据长度下生成的曲线如图7所示。与可转移样本相比，生成的曲线与目标函数曲线的现有部分具有更高的相似性。验证了HTL-SAE模型曲线拟合和数据生成的有效性。但是在现有数据长度不同的情况下，生成曲线与目标电池未知部分曲线的相似性也不相同。当长度较小时，由于操作开始时的不稳定趋势，使得曲线相似度较低。随着目标相似产品已知数据的增长，相似度增加，但仍不稳定，原因是所有相似产品在接近运行结束时都会出现差异增大的现象。

3、预测结果对比

下面从数据借用的平滑尺度、可借用样本数、是否使用数据借用、不同的预测方法等四个方面对预测结果进行了比较。以下预测均在600小时至1050小时进行，每50小时预测一次。准确度比较分别如以下四表所示。

(1)不同平滑尺度下的比较

在不同平滑尺度下进行数据借用后，被测相似产品平均预测准确度如下表所示。选取四个平滑尺度和无平滑的情况与最优尺度进行比较。当尺度为51时，平均预测准确度高于其它情况。随着平滑尺度的增大或减小，相对准确度呈下降趋势。这证明了本文所提出的综合评价指标能够有效地选择合适的平滑尺度进行数据迁移。

Table 5：Accuracy comparison with different smoothing scales for datatransfer

(2)不同可借用样品量的比较

使用不同数量的可借用样本时，被测相似产品的预测准确度如下表所示。当使用所提出的筛选策略来选择可借用性排名第一的样本进行数据借用时，预测准确度会高于其他三种情况。按照可借用性排名增加所选样本数，平均准确度逐渐降低。如果将平滑后的TTF-FC样本直接用于数据借用而不进行可借用样本筛选过程，则预测准确度最低。该表还显示，在数据借用过程中，要避免引入相似度太低的样本，否则可能会影响借用效果，导致影响预测效果。

Table 6：Accuracy comparison with different quantity of transferablesamples

尽管上文对本发明进行了详细说明，但是本发明不限于此，本技术领域技术人员可以根据本发明的原理进行各种修改。因此，凡按照本发明原理所作的修改，都应当理解为落入本发明的保护范围。

Claims

1.一种面向性能衰退时间序列数据的可借用样本筛选方法，其特征在于，包括：

其中所述M和N是大于2的正整数。

2.如权利要求1所述的面向性能衰退时间序列数据的可借用样本筛选方法，其特征在于，利用所述一条性能衰退时间序列数据和所述M条性能衰退时间序列平滑数据，得到对M个性能衰退时间序列平滑数据进行选择的第一双指标综合评估值集包括：

3.如权利要求1所述的面向性能衰退时间序列数据的可借用样本筛选方法，其特征在于，所述利用所述N条其他域差异化时间序列数据和N组且每组具有M条的其他域差异化时间序列平滑数据，得到分别对每组中的M条其他域差异化时间序列平滑数据的进行选择的第二双指标综合评估值集包括：

4.如权利要求1所述的面向性能衰退时间序列数据的可借用样本筛选方法，其特征在于，所述通过将源域中的N条其他域差异化时间序列的平滑数据分别与目标域中的一条性能衰退时间序列的平滑数据进行匹配处理包括：

在源域中截取与目标域具有相同时间序列的N条截断数据；

5.如权利要求1所述的面向性能衰退时间序列数据的可借用样本筛选方法，其特征在于，所述将源域中匹配度最高的一条其他域差异化时间序列的平滑数据作为性能衰退序列数据的可借用样本是选择余弦距离值最低的截断数据所对应的一条其他域差异化时间序列的平滑数据作为性能衰退序列数据的可借用样本。

6.一种面向性能衰退时间序列数据的可借用样本筛选系统，其特征在于，包括：

其中，样本自动筛选模块包括：

数据评选模块，用于利用一条性能衰退时间序列数据和M条性能衰退时间序列平滑数据，得到对M个性能衰退时间序列平滑数据进行选择的第一双指标综合评估值集，将第一双综合评估值集中的最小值对应的性能衰退时间序列的平滑数据选作目标域；利用N条其他域差异化时间序列数据和N组且每组具有M条的其他域差异化时间序列平滑数据，得到分别对每组中的M条其他域差异化时间序列平滑数据的进行选择的第二双指标综合评估值集，将选择得到的每组中第二双指标综合评估值集中的最小值所对应的其他域差异化时间序列平滑数据，形成具有N条其他域差异化时间序列平滑数据的源域；