CN110889190A - 面向预测精度要求的性能退化建模数据量优化方法 - Google Patents

面向预测精度要求的性能退化建模数据量优化方法 Download PDF

Info

Publication number
CN110889190A
CN110889190A CN201811053807.6A CN201811053807A CN110889190A CN 110889190 A CN110889190 A CN 110889190A CN 201811053807 A CN201811053807 A CN 201811053807A CN 110889190 A CN110889190 A CN 110889190A
Authority
CN
China
Prior art keywords
model
data
prediction
product
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811053807.6A
Other languages
English (en)
Other versions
CN110889190B (zh
Inventor
孙权
冯静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Gingko Reliability Technology Research Institute Co Ltd
Original Assignee
Hunan Gingko Reliability Technology Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Gingko Reliability Technology Research Institute Co Ltd filed Critical Hunan Gingko Reliability Technology Research Institute Co Ltd
Priority to CN201811053807.6A priority Critical patent/CN110889190B/zh
Publication of CN110889190A publication Critical patent/CN110889190A/zh
Application granted granted Critical
Publication of CN110889190B publication Critical patent/CN110889190B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种面向预测精度要求的性能退化建模数据量优化方法,其步骤如下:1)采集数据;2)确定备选模型形式;3)计算备选模型的预测误差;4)建立数据量、预测时长以及备选模型预测误差的关系模型;5)确定各预测时长目标下的最优模型;6)确定最优训练数据量要求。本发明从预测误差角度全面的、完整的评价性能退化模型的优劣。为工程研究关于模型验证和选择的方面提供一种新的思路。同时,也解决了在指定预测时长下,如何选取最优模型,以及在给定预测精度范围内,如何确定最优训练数据量要求的工程难题。

Description

面向预测精度要求的性能退化建模数据量优化方法
一、技术领域
本发明提供一种面向预测精度要求的性能退化建模数据量优化方法,属于可靠性工程技术领域。
二、背景技术
面向预测精度要求的性能退化建模数据量优化方法的研究具有广泛的实际意义,目前在模型选择方面主要应用统计学的方法,统计学的方法主要是从数据出发, 利用数学模型,提取出数据的特征,从而总结数据的规律与趋势,为而后的预测和分析提供依据。然而在实际的应用中多为含有异常数据的情况,通常人们会在研究之初选择一些备选模型,再拿备选模型与原有的数据进行对比,然后根据需要指定一些评价指标,从而选出预测效果相对较好的模型。在进行模型选择的时候,看似过程比较容易,原理较简单,但在普遍的工程研究中却存在着许多实际的问题,如果在样本量较大的前提下,我们可以直接用所有数据计算预测误差,在这种情况下,计算预测误差并不困难,同时也没有了寿命预测的意义。而在实际应用的多数情况下,往往没有这样足够多的样本,我们只能通过某种方法来对预测误差进行估计。同时,人们经常遇到这样的问题:在指定预测时长目标下,如何选取最优模型进行有效预测,以及在指定预测精度范围内,如何确定最优训练数据量要求。正是在这样的需求下,本发明提出了面向预测精度要求的性能退化建模数据量优化方法。对备选的数据模型进行评估,选择出更符合性能退化规律的模型,同时给出最优的训练数据量要求,从而为精确的寿命预测与可靠性评估提供保障。
三、发明内容
(一)目的
本发明的目的是提供一种面向预测精度要求的性能退化建模数据量优化方法,它是基于单一产品退化数据的性能退化模型的验证方法,从预测误差角度评价性能退化模型的优劣,在有限的训练数据下,选出各预测时长目标下的最优模型,以及在给定预测精度范围内,给出最优的训练数据量要求,为工程研究关于模型验证和选择的方面提供一种新的思路。
(二)技术方案
本发明一种面向预测精度要求的性能退化建模数据量优化方法,是根据产品的性能退化试验数据画出产品的退化轨迹,并选择几种常用的数学模型作为备选模型,采用交叉验证的方法进行数据的处理,即从原始试验数据中拿出一部分的数据作为训练集,剩下的数据即为测试集。首先对训练集进行参数估计,通过分析拟合出的模型特征,对测试集的数据用拟合出的模型进行预报,然后求出测试集的预测误差。最后以预测误差作为评价备选模型的关键指标,权衡各预测时长下的最优模型,同时得到给定预测时长和预测精度范围条件下的最优数据量要求。该方法的具体步骤如下。。
本发明一种面向预测精度要求的性能退化建模数据量优化方法,其步骤如下。
步骤1,采集数据:根据对产品的观察和监测,收集并整合在各时间点上的退化数据,根据这些获得的数据点描绘出产品的退化数据随时间变化的趋势图。
步骤2,确定备选模型形式:根据产品退化变化趋势图,选出备选模型。
步骤3,计算备选模型的预测误差:根据在步骤1中得到的产品性能退化的原始数据,采用10折交叉验证的方法将数据分为10 段,从相同预测时长、不同数据量的角度拟合备选模型和计算备选模型预测误差。参数估计方法可采用最小二乘法、最大似然法和最大后验估计中的一种或数种。预测误差计算方法可采用平方相对误差、平均相对误差和最大相对误差中的一种或数种。
步骤4,建立数据量、预测时长以及备选模型预测误差的关系模型:针对各备选模型,通过参数估计方法拟合得到不同的数据量、不同的预测时长以及预测误差的三维拟合图以及确定的线性多项式。
步骤5,确定各预测时长目标下的最优模型:根据在步骤5中得到的各备选模型数据量、预测时长与预测误差的线性多项式,运用判定规则,分析得到各预测时长下的最优模型。
步骤6,确定最优训练数据量要求:利用步骤5确定的最优模型和其对应的数据量、预测时长与预测误差线性多项式,在给定预测长度和预测精度要求下,得到最优数据量要求。
其中,所述的“产品”,是指本发明所述的方法适用于下列产品,该产品包括有:
(1)长贮退化失效型产品,是指在产品全寿命周期过程中,其绝大多数时间处于贮存状态的产品,该产品随着服役时间的增加,将产生劣化、老化现象;
(2)长时间连续工作退化失效型产品,是指在产品全寿命周期过程中,其绝大多数时间处于工作状态的产品,该产品随着服役时间的增加,将产生劣化、老化现象;
(3)非连续工作退化失效型产品,是指在产品全寿命周期过程中,其一部分时间处于贮存状态、一部分时间处于工作状态、且贮存与工作状态不断交替的产品,该产品随着服役时间的增加,将产生劣化、老化现象。
其中,在步骤1中所述的“退化数据”,是指本发明所述的方法是针对该类数据使用的,该类数据是通过对表征性能退化产品功能的某些量进行连续测量获得的。
本发明需至少获得一个样本的性能退化数据,若同时获得了多个样本的性能退化数据,则需先根据各产品监测时刻点,采用插值方法对性能数据进行插值,将各样本的测量时刻对齐;然后得到各测量时刻的样本均值;再将样本均值随时间变化的序列看作是单样本性能变化数据,这样就将多样本数据转化成了单样本性能退化数据。
其中,在步骤2中所述的“备选模型形式”,是指根据产品退化变化趋势图,选择多种符合产品退化规律的模型形式。模型形式可采用双曲线模型、幂函数模型、指数函数模型、对数函数模型和多项式模型中的一种或数种。该模型形式的具体情况如下。
(1)双曲线模型:若退化数据y随时间t的增加(或减少),最初增加(或减少)很快,以后逐渐放慢并趋于稳定,则可以选用双曲线模型。其形式为
Figure DEST_PATH_IMAGE002
Figure DEST_PATH_IMAGE004
式中,t为测试时刻,y
Figure DEST_PATH_IMAGE006
为模型待定系数。
(2)幂函数模型:幂函数模型的形式为
Figure DEST_PATH_IMAGE008
式中,t为测试时刻,y
Figure 434371DEST_PATH_IMAGE006
为模型待定系数。
(3)指数函数模型:该模型用于描述几何级数递增或递减的现象。其形式为
Figure DEST_PATH_IMAGE010
式中,t为测试时刻,y
Figure 476014DEST_PATH_IMAGE006
为模型待定系数。
(4)对数函数模型:该模型用于描述退化数据y随时间t的增加而增加(或减少),但其增加速度(或降低速度)逐渐放慢的现象。其形式为
Figure DEST_PATH_IMAGE012
式中,t为测试时刻,y
Figure 348155DEST_PATH_IMAGE006
为模型待定系数。
(5)多项式模型:该模型用途广泛,根据级数展开的原理,任何曲线的问题,在一定的范围内都能够用多项式逼近。其形式为
Figure DEST_PATH_IMAGE014
式中,t为测试时刻,y
Figure DEST_PATH_IMAGE016
为模型待定系数。
其中,在步骤3中所述的“预测误差”:是指测试数据与预测值之间的偏差。
其中,在步骤3中所述的“10折交叉验证”:是指将数据分为10段,从相同预测时长、不同数据量的角度计算模型的预测误差。具体情况如下。
(a)先用第1段数据估计模型的参数,用第2段数据与由第1段数据确定的模型计算第2段的预测误差;
(b)与上述方法一样,用第3段与由第1、2段数据确定的模型计算第3段的预测误差,用第4 段与由第1、2、3段数据确定的模型计算第4段的预测误差,依次类推,计算第5 段,第6段,一直到第10 段预测误差;
(c)接下来,以同样的方式,用第1段的数据估计模型的参数,用第2、3段数据与由第1段数据确定的模型计算第2、3段的预测误差,重复上两步的计算;
(d)依次类推,一直迭代计算到用第1段的数据估计模型的参数,计算第2、…、10段的预测误差。
其中,在步骤3中所述的“拟合备选模型方法”和步骤4中所述的“参数估计方法”:是指最小二乘法、最大似然法和最大后验估计中的一种或数种。这些方法的具体情况如下。
(1)最小二乘法:该方法的核心思想是构造误差平方和函数,对其求偏导,让误差平方和函数取得最小值的参数为最终的模型参数;
(2)最大似然估计法:该方法的核心思想是构造当前样本出现的联合概率函数,对其求偏导,让当前样本的概率最大的参数为最终的模型参数;
(3)最大后验估计法:该方法的核心思想是以当前样本数据条件下由贝叶斯公式计算出的整个后验概率最大的模型参数为最终的模型参数。
其中,在步骤3中所述的“预测误差计算方法”:是指平方相对误差、平均相对误差和最大相对误差中的一种或数种。这些指标的具体情况如下。
(1)平方相对误差:该指标是指测试数据与预测值之差与测试数据之比的平方和的平均值。当该指标越接近于0时,说明预测效果越好。其形式为
Figure DEST_PATH_IMAGE018
式中,
Figure DEST_PATH_IMAGE020
为第
Figure DEST_PATH_IMAGE022
个预测值,
Figure DEST_PATH_IMAGE024
为第
Figure 590786DEST_PATH_IMAGE022
个测试数据,
Figure DEST_PATH_IMAGE026
为测试数据量。
(2)平均相对误差:该指标是指测试数据与预测值之差与测试数据之比的绝对值的平均值。当该指标越接近于0时,说明预测效果越好。其形式为
Figure DEST_PATH_IMAGE028
式中,
Figure 220482DEST_PATH_IMAGE020
为第
Figure 488652DEST_PATH_IMAGE022
个预测值,
Figure 917097DEST_PATH_IMAGE024
为第
Figure 878100DEST_PATH_IMAGE022
个测试数据,
Figure 260671DEST_PATH_IMAGE026
为测试数据量。
(3)最大绝对误差:该指标是指测试数据与预测值之差与测试数据之比的绝对值的最大值。当该指标越接近于0时,说明预测效果越好。其形式为
Figure DEST_PATH_IMAGE030
式中,
Figure 4636DEST_PATH_IMAGE020
为第
Figure 851369DEST_PATH_IMAGE022
个预测值,
Figure 91595DEST_PATH_IMAGE024
为第
Figure 351675DEST_PATH_IMAGE022
个测试数据,
Figure 571435DEST_PATH_IMAGE026
为测试数据量。
其中,在步骤4中所述的“线性多项式”,其形式为
Figure DEST_PATH_IMAGE032
式中,在
Figure DEST_PATH_IMAGE034
为预测误差,
Figure DEST_PATH_IMAGE036
为数据量,
Figure DEST_PATH_IMAGE038
为预测时长,
Figure DEST_PATH_IMAGE040
为线性多项式待定系数。
其中,在步骤5中所述“判定规则”:是指各预测时长下的最优模型判定规则。其具体过程如下。
(1)根据在步骤4中得到的各备选模型数据量,预测时长与预测误差的线性多项式,计算出相同预测时长目标下的,各数据量训练得到模型的预测误差;;
(2)利用相同预测时长下,用各数据量训练得到模型的预测误差对备选模型进行排名,预测误差越小,备选模型排名越靠前;
(3)获得第一名的次数最多的备选模型,为该预测时长目标下的最优模型。
其中,在步骤6中所述最优数据量要求:是指满足预测长度和预测精度要求的最小数据量要求。
(三)本发明的优点:
(1)本发明在考虑充分性、必要性、符合工程习惯、可论证性、可设计性、可验证性原则的基础上根据性能退化数据的特点提出了一种面向预测精度要求的性能退化建模数据量优化方法,解决了在指定预测时长目标下,如何选取最优模型,以及在给定预测精度范围内,如何确定最优的训练数据量要求的工程难题;
(2)本发明运用10折交叉验证的原理研究基于单一产品退化数据的性能退化模型的验证方法,从预测误差角度全面的、完整的评价性能退化模型的优劣。为工程研究关于模型验证和选择的方面提供一种新的思路。
四、附图说明
图1为本发明的流程图;
图2为预处理后的太阳吸收率随时间变化曲线
图3为指数模型各预测误差
图4为指数加线性模型各预测误差
五、具体实施方式
本发明一种面向预测精度要求的性能退化建模数据量优化方法是以性能退化产品为研究对象,性能退化产品包括长贮退化失效型产品、长时间连续工作退化失效型产品和非连续工作退化失效型产品。性能退化产品的定义具体如下:(1)长贮退化失效型产品:是指在产品全寿命周期过程中,其绝大多数时间处于贮存状态的产品,该产品随着服役时间的增加,将产生劣化、老化现象;(2)长时间连续工作退化失效型产品:是指在产品全寿命周期过程中,其绝大多数时间处于工作状态的产品,该产品随着服役时间的增加,将产生劣化、老化现象;(3)非连续工作退化失效型产品:是指在产品全寿命周期过程中,其一部分时间处于贮存状态、一部分时间处于工作状态、且贮存与工作状态不断交替的产品,该产品随着服役时间的增加,将产生劣化、老化现象。
本发明需至少获得一个样本的性能退化数据,若同时获得了多个样本的性能退化数据,则需先根据各产品监测时刻点,采用插值方法对性能数据进行插值,将各样本的测量时刻对齐;然后得到各测量时刻的样本均值;再将样本均值随时间变化的序列看作是单样本性能变化数据,这样就将多样本数据转化成了单样本性能退化数据。
如图1所示,本发明一种面向预测精度要求的性能退化建模数据量优化方法,其步骤如下。
步骤1,采集数据。根据对产品的观察和监测,收集并整合在各时间点
Figure DEST_PATH_IMAGE042
上的退化数据
Figure DEST_PATH_IMAGE044
,对于第i个时刻
Figure DEST_PATH_IMAGE046
,退化数据为
Figure DEST_PATH_IMAGE048
,根据这些获得的数据点描绘出产品的退化数据随时间变化的趋势图。
步骤2,确定备选模型形式:根据产品退化变化趋势图,选出k个备选模型,其具体形式如下。
Figure DEST_PATH_IMAGE050
,其中
Figure DEST_PATH_IMAGE052
为模型参数向量。
模型形式可采用双曲线模型、幂函数模型、指数函数模型、对数函数模型和多项式模型中的一种或数种。该模型形式的具体情况如下。(1)双曲线模型:若退化数据y随时间t的增加(或减少),最初增加(或减少)很快,以后逐渐放慢并趋于稳定,则可以选用双曲线模型。其形式为
Figure DEST_PATH_IMAGE054
式中,t为测试时刻,y
Figure 427002DEST_PATH_IMAGE006
为模型待定系数。(2)幂函数模型:幂函数模型的形式为
Figure DEST_PATH_IMAGE056
式中,t为测试时刻,y
Figure 870753DEST_PATH_IMAGE006
为模型待定系数。(3)指数函数模型:该模型用于描述几何级数递增或递减的现象。其形式为
Figure DEST_PATH_IMAGE058
式中,t为测试时刻,y
Figure 24654DEST_PATH_IMAGE006
为模型待定系数。(4)对数函数模型:该模型用于描述退化数据y随时间t的增加而增加(或减少),但其增加速度(或降低速度)逐渐放慢的现象。其形式为
Figure DEST_PATH_IMAGE060
式中,t为测试时刻,y
Figure 844842DEST_PATH_IMAGE006
为模型待定系数。(5)多项式模型:该模型用途广泛,根据级数展开的原理,任何曲线的问题,在一定的范围内都能够用多项式逼近。其形式为
Figure 102386DEST_PATH_IMAGE014
式中,t为测试时刻,y
Figure 779355DEST_PATH_IMAGE016
为模型待定系数。
步骤3,计算备选模型的预测误差:根据在步骤1中得到的产品性能退化的原始数据
Figure 748448DEST_PATH_IMAGE048
,采用10折交叉验证的方法将数据分为10 段,从相同预测时长、不同数据量的角度拟合备选模型和计算备选模型预测误差。预测误差是指测试数据与预测值之间的偏差。10折交叉验证法是指将数据分为10段,从相同预测时长、不同数据量的角度计算模型的预测误差。具体情况如下。(a)先用第1段数据估计模型的参数,用第2段数据与由第1段数据确定的模型计算第2段的预测误差;(b)与上述方法一样,用第3段与由第1、2段数据确定的模型计算第3段的预测误差,用第4 段与由第1、2、3段数据确定的模型计算第4段的预测误差,依次类推,计算第5 段,第6段,一直到第10 段预测误差;(c)接下来,以同样的方式,用第1段的数据估计模型的参数,用第2、3段数据与由第1段数据确定的模型计算第2、3段的预测误差,重复上两步的计算;(d)依次类推,一直迭代计算到用第1段的数据估计模型的参数,计算第2、…、10段的预测误差。拟合备选模型方法可采用最小二乘法、最大似然法和最大后验估计中的一种或数种。这些方法的具体情况如下。(1)最小二乘法:该方法的核心思想是构造误差平方和函数,对其求偏导,让误差平方和函数取得最小值的参数为最终的模型参数;(2)最大似然估计法:该方法的核心思想是构造当前样本出现的联合概率函数,对其求偏导,让当前样本的概率最大的参数为最终的模型参数;(3)最大后验估计法:该方法的核心思想是以当前样本数据条件下由贝叶斯公式计算出的整个后验概率最大的模型参数为最终的模型参数。预测误差计算方法可采用平方相对误差、平均相对误差和最大相对误差中的一种或数种。这些指标的具体情况如下。(1)平方相对误差:该指标是指测试数据与预测值之差与测试数据之比的平方和的平均值。当该指标越接近于0时,说明预测效果越好。其形式为
Figure DEST_PATH_IMAGE062
式中,
Figure 106748DEST_PATH_IMAGE020
为第
Figure 985843DEST_PATH_IMAGE022
个预测值,
Figure 630451DEST_PATH_IMAGE024
为第
Figure 696627DEST_PATH_IMAGE022
个测试数据,
Figure 452093DEST_PATH_IMAGE026
为测试数据量。(2)平均相对误差:该指标是指测试数据与预测值之差与测试数据之比的绝对值的平均值。当该指标越接近于0时,说明预测效果越好。其形式为
Figure DEST_PATH_IMAGE064
式中,
Figure 215388DEST_PATH_IMAGE020
为第
Figure 906263DEST_PATH_IMAGE022
个预测值,
Figure 849948DEST_PATH_IMAGE024
为第
Figure 18893DEST_PATH_IMAGE022
个测试数据,
Figure 731634DEST_PATH_IMAGE026
为测试数据量。(3)最大绝对误差:该指标是指测试数据与预测值之差与测试数据之比的绝对值的最大值。当该指标越接近于0时,说明预测效果越好。其形式为
Figure DEST_PATH_IMAGE066
式中,
Figure 390148DEST_PATH_IMAGE020
为第
Figure 218468DEST_PATH_IMAGE022
个预测值,
Figure 50158DEST_PATH_IMAGE024
为第
Figure 492772DEST_PATH_IMAGE022
个测试数据,
Figure 650084DEST_PATH_IMAGE026
为测试数据量。
步骤4,建立数据量、预测时长以及备选模型预测误差的关系:由步骤3计算得到的预测误差,找出k个模型数据量、预测时长以及预测误差的三维关系表。分别对这k个模型通过在步骤3中所述拟合模型方法拟合得到不同的数据量
Figure 443727DEST_PATH_IMAGE036
、不同的预测时长
Figure 344687DEST_PATH_IMAGE038
以及预测误差
Figure 907387DEST_PATH_IMAGE034
的三维拟合图以及确定的线性多项式。其具体形式如下。
Figure DEST_PATH_IMAGE068
步骤5,确定各预测时长目标下的最优模型:根据在步骤4中得到的各备选模型数据量、预测时长与预测误差的线性多项式,运用判定规则,分析得到各预测时长下的最优模型。该判定规则是指各预测时长目标下的最优模型判定规则。其具体过程如下。(1)根据在步骤5中得到的各备选模型数据量,预测时长与预测误差的线性多项式,计算出相同预测时长目标下的,各数据量训练得到模型的预测误差;(2)利用相同预测时长下,用各数据量训练得到模型的预测误差对备选模型进行排名,预测误差越小,备选模型排名越靠前;(3)获得第一名的次数最多的备选模型,为该预测时长目标下的最优模型。
步骤6,确定最优训练数据量要求:利用步骤5确定的最优模型和其对应的数据量、预测时长与预测误差线性多项式,在给定预测长度和预测精度要求下,得到最优数据量要求。最优数据量要求是指满足预测长度和预测精度要求的最小数据量要求。
兹举实施案例如下:
本案例以XX热控涂层的太阳吸收率为例,陈述本发明一种面向预测精度要求的性能退化建模数据量优化方法的应用。本案例需要得到该热控涂层的最优退化模型和在预测时长为800天,预测误差范围不超过±0.005时的最优数据量要求。
本案例所涉及性能退化产品为长时间连续工作退化失效型产品。样本数为1个。
案例实施流程为上述七个步骤。针对本案例,步骤1采集得到太阳吸收率随时间变化数据,对其进行简单预处理得到太阳吸收率随时间变化曲线,如图2所示。通过步骤2得到两个备选模型:指数模型和指数加线性模型。通过步骤3,运用最小二乘法拟合得到备选模型,选用平方相对误差针对每个备选模型计算得到45个预测误差,为一个上三角矩阵,计算结果如图3和图4所示, 矩阵第
Figure 671818DEST_PATH_IMAGE022
行为用前
Figure 15075DEST_PATH_IMAGE022
段数据估计模型参数(
Figure 391829DEST_PATH_IMAGE022
从1到9),第
Figure DEST_PATH_IMAGE070
列为计算得到从第
Figure DEST_PATH_IMAGE072
段数据开始一直到第
Figure 74615DEST_PATH_IMAGE070
段前
Figure DEST_PATH_IMAGE074
段数据的预测误差。通过步骤4,针对每个备选模型建立得到数据量、预测时长以及该备选模型预测误差的关系。其对应关系式分别为:
Figure DEST_PATH_IMAGE076
通过步骤5,分别分析预测时长目标从600到1600的情形,得到预测时长目标从600到1600的情形下的最优模型皆为指数模型。
通过步骤6可以得到,当预测时长为800天,预测误差范围不超过±0.005时最少需要820天的训练数据量。

Claims (11)

1.一种面向预测精度要求的性能退化建模数据量优化方法,该方法是根据产品的性能退化试验数据画出产品的退化轨迹,并选择几种常用的数学模型作为备选模型,采用交叉验证的方法进行数据的处理,即从原始试验数据中拿出一部分的数据作为训练集,剩下的数据即为测试集,
首先对训练集进行参数估计,通过分析拟合出的模型特征,对测试集的数据用拟合出的模型进行预报,然后求出测试集的预测误差,
最后以预测误差作为评价备选模型的关键指标,权衡各预测时长下的最优模型,同时得到给定预测时长和预测精度范围条件下的最少数据量要求,
该方法的具体步骤如下:
步骤1,采集数据:根据对产品的观察和监测,收集并整合在各时间点上的退化数据,根据这些获得的数据点描绘出产品的退化数据随时间变化的趋势图;
步骤2,确定备选模型形式:根据产品退化变化趋势图,选出备选模型;
步骤3,计算备选模型的预测误差:根据在步骤1中得到的产品性能退化的原始数据,采用10折交叉验证的方法将数据分为10 段,从相同预测时长、不同数据量的角度拟合备选模型和计算备选模型预测误差,
拟合备选模型方法可采用最小二乘法、最大似然法和最大后验估计中的一种或数种,
预测误差计算方法可采用平方相对误差、平均相对误差和最大相对误差中的一种或数种;
步骤4,建立数据量、预测时长以及备选模型预测误差的关系模型:针对各备选模型,通过参数估计方法拟合得到不同的数据量、不同的预测时长以及预测误差的三维拟合图以及确定的线性多项式;
步骤5,确定各预测时长目标下的最优模型:根据在步骤4中得到的各备选模型数据量、预测时长与预测误差的线性多项式,运用判定规则,分析得到各预测时长下的最优模型;
步骤6,确定最优训练数据量要求:利用步骤5确定的最优模型和其对应的数据量、预测时长与预测误差线性多项式,在给定预测长度和预测精度要求下,得到最优数据量要求。
2.根据权利要求1所述的一种面向预测精度要求的性能退化建模数据量优化方法,其特征在于,所述的“产品”包括:(1)长贮退化失效型产品,指在产品全寿命周期过程中,其绝大多数时间处于贮存状态的产品,该产品随着服役时间的增加,将产生劣化、老化现象;(2)长时间连续工作退化失效型产品,指在产品全寿命周期过程中,其绝大多数时间处于工作状态的产品,该产品随着服役时间的增加,将产生劣化、老化现象;(3)非连续工作退化失效型产品,指在产品全寿命周期过程中,其一部分时间处于贮存状态、一部分时间处于工作状态、且贮存与工作状态不断交替的产品,该产品随着服役时间的增加,将产生劣化、老化现象。
3.根据权利要求1所述的一种面向预测精度要求的性能退化建模数据量优化方法,其特征在于,在步骤1中所述的退化数据,是指本发明所述的方法主要用于该类数据,该类数据是通过对表征性能退化产品功能的某些量进行连续测量获得的,
本发明需至少获得一个样本的性能退化数据,若同时获得了多个样本的性能退化数据,则需先根据各产品监测时刻点,采用插值方法对性能数据进行插值,将各样本的测量时刻对齐;然后得到各测量时刻的样本均值;再将样本均值随时间变化的序列看作是单样本性能变化数据,这样就将多样本数据转化成了单样本性能退化数据。
4.根据权利要求1所述的一种面向预测精度要求的性能退化建模数据量优化方法,其特征在于,在步骤2中所述的备选模型形式,是指根据产品退化变化趋势图,选择多种符合产品退化规律的模型形式,
模型形式可采用双曲线模型、幂函数模型、指数函数模型、对数函数模型和多项式模型中的一种或数种,
该模型形式的具体情况如下:
(1)双曲线模型:若退化数据y随时间t的增加(或减少),最初增加(或减少)很快,以后逐渐放慢并趋于稳定,则可以选用双曲线模型,
其形式为
Figure 398915DEST_PATH_IMAGE001
Figure 135664DEST_PATH_IMAGE002
式中,t为测试时刻,y
Figure 171754DEST_PATH_IMAGE003
为模型待定系数;
(2)幂函数模型:幂函数模型的形式为
Figure 63486DEST_PATH_IMAGE004
式中,t为测试时刻,y
Figure 122709DEST_PATH_IMAGE003
为模型待定系数;
(3)指数函数模型:该模型用于描述几何级数递增或递减的现象,
其形式为
Figure 226931DEST_PATH_IMAGE005
式中,t为测试时刻,y
Figure 914265DEST_PATH_IMAGE003
为模型待定系数;
(4)对数函数模型:该模型用于描述退化数据y随时间t的增加而增加(或减少),但其增加速度(或降低速度)逐渐放慢的现象,
其形式为
Figure 117844DEST_PATH_IMAGE006
式中,t为测试时刻,y
Figure 461101DEST_PATH_IMAGE003
为模型待定系数;
(5)多项式模型:该模型用途广泛,根据级数展开的原理,任何曲线的问题,在一定的范围内都能够用多项式逼近,
其形式为
Figure 103435DEST_PATH_IMAGE007
式中,t为测试时刻,y
Figure 19176DEST_PATH_IMAGE008
为模型待定系数。
5.根据权利要求1所述的一种面向预测精度要求的性能退化建模数据量优化方法,其特征在于,在步骤3中所述的预测误差,是指测试数据与预测值之间的偏差。
6.根据权利要求1所述的一种面向预测精度要求的性能退化建模数据量优化方法,其特征在于,在步骤3中所述的10折交叉验证,是指将数据分为10段,从相同预测时长、不同数据量的角度计算模型的预测误差,
具体情况如下:
(a)先用第1段数据估计模型的参数,用第2段数据与由第1段数据确定的模型计算第2段的预测误差;
(b)与上述方法一样,用第3段与由第1、2段数据确定的模型计算第3段的预测误差,用第4 段与由第1、2、3段数据确定的模型计算第4段的预测误差,依次类推,计算第5 段,第6段,一直到第10 段预测误差;
(c)接下来,以同样的方式,用第1段的数据估计模型的参数,用第2、3段数据与由第1段数据确定的模型计算第2、3段的预测误差,重复上两步的计算;
(d)依次类推,一直迭代计算到用第1段的数据估计模型的参数,计算第2、…、10段的预测误差。
7.根据权利要求1所述的一种面向预测精度要求的性能退化建模数据量优化方法,其特征在于,在步骤3中所述的拟合备选模型方法和步骤4中所述的参数估计方法,是指最小二乘法、最大似然法和最大后验估计中的一种或数种,
这些方法的具体情况如下:
(1)最小二乘法:该方法的核心思想是构造误差平方和函数,对其求偏导,让误差平方和函数取得最小值的参数为最终的模型参数;
(2)最大似然估计法:该方法的核心思想是构造当前样本出现的联合概率函数,对其求偏导,让当前样本的概率最大的参数为最终的模型参数;
(3)最大后验估计法:该方法的核心思想是以当前样本数据条件下由贝叶斯公式计算出的整个后验概率最大的模型参数为最终的模型参数。
8.根据权利要求1所述的一种基于相同数据量不同预测时长下10折交叉验证的性能退化模型精度验证方法,其特征在于,在步骤3中所述的预测误差计算方法,是指平方相对误差、平均相对误差和最大相对误差中的一种或数种,
这些指标的具体情况如下:
(1)平方相对误差:该指标是指测试数据与预测值之差与测试数据之比的平方和的平均值,
当该指标越接近于0时,说明预测效果越好,
其形式为
Figure 783869DEST_PATH_IMAGE009
式中,
Figure 614422DEST_PATH_IMAGE010
为第
Figure 998130DEST_PATH_IMAGE011
个预测值,
Figure 394476DEST_PATH_IMAGE012
为第
Figure 267754DEST_PATH_IMAGE011
个测试数据,
Figure DEST_PATH_IMAGE013
为测试数据量;
(2)平均相对误差:该指标是指测试数据与预测值之差与测试数据之比的绝对值的平均值,
当该指标越接近于0时,说明预测效果越好,
其形式为
Figure 257707DEST_PATH_IMAGE014
式中,
Figure 304161DEST_PATH_IMAGE010
为第
Figure 695959DEST_PATH_IMAGE011
个预测值,
Figure 740138DEST_PATH_IMAGE012
为第
Figure 810862DEST_PATH_IMAGE011
个测试数据,
Figure 395427DEST_PATH_IMAGE013
为测试数据量;
(3)最大绝对误差:该指标是指测试数据与预测值之差与测试数据之比的绝对值的最大值,
当该指标越接近于0时,说明预测效果越好,
其形式为
Figure 405847DEST_PATH_IMAGE015
式中,
Figure 620927DEST_PATH_IMAGE010
为第
Figure 710106DEST_PATH_IMAGE011
个预测值,
Figure 301624DEST_PATH_IMAGE012
为第
Figure 402435DEST_PATH_IMAGE011
个测试数据,
Figure 53997DEST_PATH_IMAGE013
为测试数据量。
9.根据权利要求1所述的一种面向预测精度要求的性能退化建模数据量优化方法,其特征在于,在步骤4中所述的线性多项式,其形式为
Figure 896051DEST_PATH_IMAGE016
式中,在
Figure 697785DEST_PATH_IMAGE017
为预测误差,
Figure 980998DEST_PATH_IMAGE018
为数据量,
Figure DEST_PATH_IMAGE019
为预测时长,
Figure 600199DEST_PATH_IMAGE020
为线性多项式待定系数。
10.根据权利要求1所述的一种面向预测精度要求的性能退化建模数据量优化方法,其特征在于,在步骤5中所述判定规则,是指各预测时长下的最优模型判定规则,
其具体过程如下,
(1)根据在步骤4中得到的各备选模型数据量,预测时长与预测误差的线性多项式,计算出相同预测时长目标下的,各数据量训练得到模型的预测误差;
(2)利用相同预测时长下,用各数据量训练得到模型的预测误差对备选模型进行排名,预测误差越小,备选模型排名越靠前;
(3)获得第一名的次数最多的备选模型,为该预测时长目标下的最优模型。
11.根据权利要求1所述的一种面向预测精度要求的性能退化建模数据量优化方法,其特征在于,在步骤6中所述最优数据量要求,是指满足预测长度和预测精度要求的最小数据量要求。
CN201811053807.6A 2018-09-11 2018-09-11 面向预测精度要求的性能退化建模数据量优化方法 Active CN110889190B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811053807.6A CN110889190B (zh) 2018-09-11 2018-09-11 面向预测精度要求的性能退化建模数据量优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811053807.6A CN110889190B (zh) 2018-09-11 2018-09-11 面向预测精度要求的性能退化建模数据量优化方法

Publications (2)

Publication Number Publication Date
CN110889190A true CN110889190A (zh) 2020-03-17
CN110889190B CN110889190B (zh) 2021-01-01

Family

ID=69745338

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811053807.6A Active CN110889190B (zh) 2018-09-11 2018-09-11 面向预测精度要求的性能退化建模数据量优化方法

Country Status (1)

Country Link
CN (1) CN110889190B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113341919A (zh) * 2021-05-31 2021-09-03 中国科学院重庆绿色智能技术研究院 一种基于时序数据长度优化的计算系统故障预测方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090055339A1 (en) * 2007-08-20 2009-02-26 Airbus France Process and apparatus for evaluating operational risks for aiding in vehicular maintenance decisions
CN102622473A (zh) * 2012-02-28 2012-08-01 北京航空航天大学 基于贝叶斯理论的步进应力加速退化试验优化设计方法
CN103679280A (zh) * 2012-09-26 2014-03-26 中国人民解放军第二炮兵工程大学 一种性能缓变退化的设备最优维护方法
CN103729693A (zh) * 2013-12-23 2014-04-16 清华大学 基于确定性库存退化模型的维修及备件供给联合优化方法
CN106228026A (zh) * 2016-08-15 2016-12-14 广东石油化工学院 一种基于最优退化特征量的剩余寿命预测算法
US20170169143A1 (en) * 2015-12-15 2017-06-15 Hitachi, Ltd. System for maintenance recommendation based on performance degradation modeling and monitoring

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090055339A1 (en) * 2007-08-20 2009-02-26 Airbus France Process and apparatus for evaluating operational risks for aiding in vehicular maintenance decisions
CN102622473A (zh) * 2012-02-28 2012-08-01 北京航空航天大学 基于贝叶斯理论的步进应力加速退化试验优化设计方法
CN103679280A (zh) * 2012-09-26 2014-03-26 中国人民解放军第二炮兵工程大学 一种性能缓变退化的设备最优维护方法
CN103729693A (zh) * 2013-12-23 2014-04-16 清华大学 基于确定性库存退化模型的维修及备件供给联合优化方法
US20170169143A1 (en) * 2015-12-15 2017-06-15 Hitachi, Ltd. System for maintenance recommendation based on performance degradation modeling and monitoring
CN106228026A (zh) * 2016-08-15 2016-12-14 广东石油化工学院 一种基于最优退化特征量的剩余寿命预测算法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113341919A (zh) * 2021-05-31 2021-09-03 中国科学院重庆绿色智能技术研究院 一种基于时序数据长度优化的计算系统故障预测方法

Also Published As

Publication number Publication date
CN110889190B (zh) 2021-01-01

Similar Documents

Publication Publication Date Title
CN103389472B (zh) 一种基于nd-ar模型的锂离子电池循环寿命的预测方法
CN113094923B (zh) 考虑多源不确定性的多参数相关退化产品可靠性评估方法
CN113065702B (zh) 基于st-seep分段法和时空arma模型的滑坡位移多线性预测方法
CN103324798B (zh) 基于区间响应面模型的随机模型修正方法
KR101057663B1 (ko) 분산전원 최적위치 선정 방법 및 시스템, 분산전원 최적용량 선정 방법 및 시스템
CN110895626B (zh) 基于留一交叉验证的性能退化模型精度验证方法
CN112733443B (zh) 一种基于虚拟监测点的供水管网模型参数优化校核方法
CN112669599A (zh) 一种基于时序分析和残差匹配的模型
CN110569890A (zh) 一种基于相似性度量的水文数据异常模式检测方法
CN113221439B (zh) 一种基于bp神经网络的排水系统实时率定与动态预测方法
CN111125885A (zh) 一种基于改进克里金插值算法的asf修正表构建方法
CN107293118A (zh) 一种交通速度动态区间短时预测方法
CN110889190B (zh) 面向预测精度要求的性能退化建模数据量优化方法
Lin et al. A novel efficient model for gas compressibility factor based on GMDH network
CN110895628B (zh) 一种性能退化模型预测精度验证方法
CN112329272B (zh) 综合光伏组件退化和寿命数据的剩余寿命拟合预测方法
CN109523077B (zh) 一种风电功率预测方法
CN114265368A (zh) 航空发动机伺服控制系统组合状态自适应估计方法
CN105408828B (zh) 对曲线上用于检测发动机异常的相关点进行估算的方法以及用于实施该方法的数据处理系统
CN111340853B (zh) 基于ospa迭代的多传感器gmphd自适应融合方法
Warburton et al. Critical Analysis of Linear and Nonlinear Project Duration Forecasting Methods
CN115963420A (zh) 一种电池soh影响因素分析方法
CN115270637A (zh) 一种基于gbrt的地下排水管道最大应力预测方法
CN112668125B (zh) 提高非完整小圆弧评价精度的方法、系统、介质及设备
CN117129895A (zh) 电池健康状态计算方法、装置、存储介质以及车辆

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Optimization method of performance degradation modeling data volume for prediction accuracy requirements

Effective date of registration: 20211008

Granted publication date: 20210101

Pledgee: Bank of Changsha Co.,Ltd. Yinde sub branch

Pledgor: Hunan gingko Reliability Technology Research Institute Co.,Ltd.

Registration number: Y2021980010281