CN102004661A

CN102004661A - 一种通用的数据驱动的软件和系统可靠性模型及参数优化方法

Info

Publication number: CN102004661A
Application number: CN2010101952263A
Authority: CN
Inventors: 杨波
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2010-06-09
Filing date: 2010-06-09
Publication date: 2011-04-06

Abstract

本发明提出了一种通用的数据驱动的软件和系统可靠性模型及参数优化方法。提出的模型具有通用性，现有的数据驱动的可靠性模型是本发明所提出的模型的一个特例。提出了一种混合遗传算法，通过该算法可得到模型参数的最优值。提出了一种用二进制码表示模型的某些参数的方法，该方法用于本发明所提出的混合遗传算法中。所提出的可靠性模型和参数优化方法适用于：1、软件可靠性与失效过程的建模、预测以及模型的参数优化；2、系统可靠性与失效过程的建模、预测以及模型的参数优化。

Description

一种通用的数据驱动的软件和系统可靠性模型及参数优化方法

技术领域

本发明是关于软件和系统的可靠性与失效过程的建模、预测以及模型的参数优化，属于可靠性工程和应用数学领域，尤其涉及对软件和系统的失效过程进行建模与预测的领域。

背景技术

从20世纪70年代开始，人们在软件和系统的可靠性建模、分析、评估、预测等方面开展了大量的研究，提出了各种可靠性模型。软件和系统可靠性模型大体上可分为两类：解析可靠性模型(Analytical Reliability Model)和数据驱动的可靠性模型(Data-drivenReliability Model)。解析可靠性模型包括马尔科夫模型、非齐次泊松过程模型、二项分布模型、贝叶斯模型等等。由于解析可靠性模型通常需要对软件或系统做出较多的假设，如失效间隔时间的概率分布等等，而这些假设不一定符合实际情况，因此解析可靠性模型的适用性和准确性受到了较大的影响，并且在实际的工程应用中，在各种解析可靠性模型中选择恰当的一个模型是比较困难的。

针对解析可靠性模型的不足，近年来提出了一些数据驱动的可靠性模型。数据驱动的可靠性模型不需要对软件或系统做过多的假设，而是将软件或系统的失效过程视为一个时间序列进行建模和预测。数据驱动的可靠性模型包括基于传统时间序列分析方法(如差分自回归滑动平均，ARIMA)的模型、基于人工神经网络(Artificial Neural Network，ANN)的模型、基于支持向量机(SupportVector Machine，SVM)的模型等等。数据驱动的可靠性模型适用范围较传统的解析可靠性模型更广，并且预测精度通常比解析可靠性模型更高。

然而，现有的数据驱动的可靠性模型大都认为软件和系统的失效与

一个或几个失效(如之前的第一个到第五个失效)存在相关关系，并基于此对失效过程进行建模和预测。而实际的情况是，软件和系统的失效是与之前的

失效(如之前的第三个、第四个、第八个失效)存在相关关系，应该基于该相关关系对失效过程进行建模和预测。

发明内容

本发明针对现有的数据驱动的可靠性模型的以上不足，提出了一种新的通用的数据驱动的软件和系统可靠性模型，并提出了一种新的模型参数的优化方法。所提出的模型和方法适用于：1、软件可靠性与失效过程的建模、预测以及模型的参数优化；2、系统可靠性与失效过程的建模、预测以及模型的参数优化。

本发明的目的在于建立一种更加符合实际情况、预测精度更高的数据驱动的可靠性模型和模型参数的优化方法。为实现上述目的，本发明提供了一种通用的数据驱动的软件和系统可靠性模型以及模型参数的优化方法，其特征在于包含以下内容：

1.模型的表达形式

本发明所提出的软件和系统可靠性模型表示为：

x_{i} = F (x_{i - m_{i}}, x_{i - m_{2}}, \cdot \cdot \cdot, x_{i - m_{p}}) - - - (1)

上式中，i和p为正整数，m_j(j＝1，2，…，p)为正整数，x_i表示软件或系统的第i个失效数据(失效数据可以为任何形式，如累计失效时间、失效间隔时间、累计失效数等)，F(·)表示软件或系统的当前失效(即x_i)与之前的失效(即

)之间的相关关系。F(·)可以通过任意方式来表达，如基于ARIMA的模型、基于人工神经网络的模型、基于支持向量机的模型等等。

现有的数据驱动的可靠性模型表示为：

x_i＝F(x_i-1，x_i-2，…，x_i-w) (2)

可见，现有的数据驱动的可靠性模型是本发明所提出的模型(1)的一个特例，即p＝w并且m_j＝j(1≤j≤p)。因此，本发明所提出的软件和系统可靠性模型具有通用性，包含了现有的数据驱动的可靠性模型不能表达的情况，并在特定条件下可退化为现有的数据驱动的可靠性模型。

2.模型参数的最优化

在模型(1)中，需要确定的模型参数包括两部分：p的值和m_j(j＝1，2，…，p)的值、F(·)中的各参数值。本发明提出了一种混合遗传算法(Hybrid Genetic Algorithm)同时求得这两部分参数的最优值，该算法如图1所示。

混合遗传算法包括外层的遗传算法(GA1)和内层的遗传算法(GA2)。GA1用于确定最优的p和m_j(j＝1，2，…，p)的值；GA2用于确定在某p值和m_j(j＝1，2，…，p)的值的条件下，F(·)中各参数的最优值；当混合遗传算法运行结束后，即得到所有的模型参数的最优值。在混合遗传算法中：

GA1中用一个二进制码来表示模型(1)中的p值和m_j(j＝1，2，…，p)的值，具体方法如下：由模型使用者给定一个正整数值v，该值表示模型(1)中p的最大可能取值，用一个长度为v的二进制码来表示模型(1)中的p值和m_j(j＝1，2，…，p)的值，具体表示方法为：该二进制码中“1”的个数为p的值，每个“1”从右往左(或从左往右)所在的位置代表一个m_j的值；或该二进制码中“0”的个数为p的值，每个“0”从右往左(或从左往右)所在的位置代表一个m_j的值。例如，若二进制码中“1”的个数为p的值，每个“1”从右往左所在的位置代表一个m_j的值，则图2所示的二进制码“10100010”表示v＝8，p＝3，m₁＝2，m₂＝6，m₃＝8，即模型(1)为x_i＝F(x_i-2，x_i-6，x_i-8)。

GA2用于确定在GA1的某二进制码的条件下最优的F(·)中的各参数值。

混合遗传算法的具体实施方式见后面所述。遗传算法的相关知识可见参考文献[1]。

3.用模型进行预测

当模型(1)的参数确定后，即可用该模型对软件或系统将来的失效进行预测。设目前共观测到n(n≥2)个软件或系统的失效数据：{x_i，i＝1，2，…，n}，则将对应的p个失效数据代入模型(1)，即得到软件或系统的下一次失效的预测值

附图说明

图1是本发明所提出的混合遗传算法流程图；

图2是模型(1)中的p值和m_j(j＝1，2，…，p)的值采用本发明权利要求2所述的表示方式之一种来表示的示例图；

图3是本发明的具体实施方式的说明图。

下面结合附图对本发明作进一步的详细描述。

具体实施方式

本发明的具体实施方式如图3所示，包括三个阶段：训练阶段、测试阶段、预测阶段。其中，训练阶段和测试阶段采用如图1所示的混合遗传算法来确定模型(1)中各参数的最优值，即P、m_j(j＝1，2，…，p)以及F(·)中各参数的最优值。

设目前共观测到n(n≥2)个软件或系统的失效数据{x_i，i＝1，2，…，n}。实施过程中，由模型使用者给定一个正整数d，则失效数据被划分为两部分：前(n-d)个数据{x_i，i＝1，2，…，n-d}用于训练阶段；其余的d个数据{x_i，i＝n-d+1，n-d+2，…，n}用于测试阶段。模型使用者还要给定一个正整数值v(v≤n-d-1)，该值表示模型(1)中p的最大可能取值，即p≤v。

下面以F(·)为具有高斯核函数(Gaussian kernel function)的支持向量机为例，来说明本发明的具体实施方式。支持向量机的相关知识可见参考文献[2][3]。

支持向量机的正则化风险函数(Regularized Risk Function)为：

R = \frac{1}{2} {| | ω | |}^{2} + C \frac{1}{l} Σ_{i = 1}^{l} {| y_{i} - f (x_{i}) |}_{ϵ} - - - (3)

其中有两个参数：C和ε。高斯核函数的表达式为：

K (x_{i}, x_{j}) = \exp [\frac{- {(x_{i} - x_{j})}^{2}}{{2 σ}^{2}}] - - - (4)

其中有一个参数：σ。因此，当F(·)为具有高斯核函数的支持向量机时，F(·)中有三个模型参数待确定：C、ε、σ。

如图1所示，算法开始后，进入外层的遗传算法GA1。遗传算法的相关知识可见参考文献[1]。首先由用户给定或随机地产生长度为v的二进制码的初代染色体(InitialGeneration of Chromosomes)，每个染色体确定了一组模型(1)中的p值和m_j(j＝1，2，…，p)的值。在每个染色体确定的值下，进入GA2。

在GA2中，采用遗传算法来确定C、ε、σ的最优值。其中，支持向量机的训练阶段如图3(a)所示，此时，F(·)为具有高斯核函数的支持向量机，当i取某一固定值时，输入数据为软件或系统的失效数据的前(n-d)个数据{x_i，i＝1，2，…，n-d}中的p个值：

这里p值和m_j(j＝1，2，…，p)的值由进入GA2时的二进制码的染色体确定。因此，图3(a)的模型输出值为：

{\hat{x}}_{i} = F (x_{i - m_{1}}, x_{i - m_{2}}, \cdot \cdot \cdot, x_{i - m_{p}}) - - - (5)

上式中，p值和m_j(j＝1，2，…，p)的值由进入GA2时的二进制码的染色体确定；F(·)中的参数：C、ε、σ由GA2的染色体确定。

定义拟合均方差(MSE_f)为：

{MSE}_{f} = \frac{1}{n - d} Σ_{i = v + 1}^{n - d} {({\hat{x}}_{i} - x_{i})}^{2} - - - (6)

上式中，

由(5)式得到，x_i是软件或系统的失效数据{x_i，i＝v+1，v+2，…，n-d}的真实值。在GA2中，“F(·)训练完成”的判断标准是MSE_f是否已最小化或已小于模型使用者给定的MSE_f的阈值。如果不满足该判断标准，则继续执行GA2，即进行选择(Selection)、交叉(Crossover)、变异(Mutation)，得到C、ε、σ的下一代染色体，然后返回到支持向量机训练阶段继续执行；如果已满足该判断标准，则退出GA2，返回GA1继续执行，此时F(·)中的参数：C、ε、σ达到由进入GA2时的二进制码染色体确定的p值和m_j(j＝1，2，…，p)的值的条件下的最优值。

当退出GA2，返回GA1继续执行时，支持向量机的测试阶段如图3(b)所示，此时F(·)中的参数：C、ε、σ为退出GA2时确定的值。

定义预测均方差(MSE_p)为：

{MSE}_{p} = \frac{1}{d} Σ_{i = n - d + 1}^{n} {({\hat{x}}_{i} - x_{i})}^{2} - - - (7)

上式中，

由(5)式得到，x_i是软件或系统的失效数据{x_i，i＝n-d+1，n-d+2，…，n}的真实值。在GA1中，“F(·)测试完成”的判断标准是MSE_p是否已最小化或已小于模型使用者给定的MSE_p的阈值。如果不满足该判断标准，则继续执行GA1，即进行选择、交叉、变异，得到二进制码的下一代染色体，然后重新进入GA2继续执行；如果已满足该判断标准，则退出GA1，混合遗传算法结束，此时得到了最优的p值和最优的m_j(j＝1，2，…，p)的值(由退出GA1时的二进制码确定)，以及F(·)中的参数：C、ε、σ的最优值。

混合遗传算法结束后，模型(1)的参数即已确定，此时可用该模型对软件或系统将来的失效进行预测，如图3(c)所示。软件或系统的下一次失效的预测值

为：

{\hat{x}}_{n + 1} = F (x_{n + 1 - m_{1}}, x_{n + 1 - m_{2}}, \cdot \cdot \cdot, x_{n + 1 - m_{p}}) - - - (8)

上式中，x_i(1≤i≤n)是软件或系统的失效数据{x_i，i＝1，2，…，n}中的某些值。

以上所述的本发明的具体实施方式可以反复进行，即当观测到软件或系统的第(n+1)个失效时，失效数据变为{x_i，i＝1，2，…，n+1}，这时将(n+1)的值作为n值，重复本发明的具体实施方式，即可得到软件或系统的下一次失效的预测值

依此类推。

下面通过一个例子来进一步说明本发明的具体实施方式。

文献[4]中报告了一组软件失效数据(文献[4]的Appendix A)，包含22个失效间隔时间(n＝22)，如表1所示。

表1

令d＝4，即第1到第18个失效数据用于训练阶段，第19到第22个数据用于测试阶段；令v＝8，即二进制码长度为8；令F(·)为具有高斯核函数的支持向量机。采用前面所述的本发明的具体实施方式，得到如下结果：

最优二进制码为00001100，即软件可靠性模型为x_i＝F(x_i-3，x_i-4)；F(·)为具有高斯核函数的支持向量机，其三个参数的最优值分别为：C＝2486，ε＝0.6417，σ＝1.042。

根据上面的结果，软件的下一个失效间隔时间的预测值为：

参考文献

[1]Goldberg DE.Genetic Algorithms in Search，Optimization，and Machine Learning.Addison-Wesley Professional，1989.

[2]Vapnik VN.The Nature of Statistical Learning Theory.New York：Springer-Verlag，1995.

[3]Vapnik VN.An overview of statistical learning theory.IEEE Transactions on NeuralNetworks，1999，10(5)：950-958.

[4]Pai PF and Hong WC.Software reliability forecasting by support vector machines withsimulated annealing algorithms.Journal of Systems and Software，2006，79(6)：747-755.

Claims

1.一种通用的数据驱动的软件和系统可靠性模型，其特征在于：

模型表示为：

其中，x_i表示软件或系统的第i个失效数据(i为正整数)，失效数据可以为任何形式，如累计失效时间、失效间隔时间、累计失效数等等，i和p为正整数，m_j(j＝1，2，…，p)为正整数，F(·)表示软件或系统的当前失效(即x_i)与之前的失效(即

)之间的相关关系。F(·)可以通过任意方式来表达，如基于差分自回归滑动平均(ARIMA)的模型、基于人工神经网络的模型、基于支持向量机的模型等等。

2.一种权利要求1所述的模型中的p和m_j(j＝1，2，…，p)的表示方法，其特征在于：

首先由模型使用者给定一个正整数值v，该值表示p的最大可能取值，然后用一个长度为v的二进制码来表示权利要求1所述的模型中的p值和m_j(j＝1，2，…，p)的值，具体表示方法为：该二进制码中“1”的个数为p的值，每个“1”从右往左(或从左往右)所在的位置代表一个m_j的值；或该二进制码中“0”的个数为p的值，每个“0”从右往左(或从左往右)所在的位置代表一个m_j的值。

3.一种权利要求1所述的模型的参数优化方法，其特征在：

采用图1所示的混合遗传算法，包括外层的遗传算法(GA1)和内层的遗传算法(GA2)。GA1中的二进制码如权利要求2所述的方式来表示权利要求1所述的模型中的p值和m_j(j＝1，2，…，p)的值。混合遗传算法运算结束后，即得到权利要求1所述的模型的所有参数(包括P、m_j(j＝1，2，…，p)和F(·)中的各参数)的最优值。

4.一种软件和系统下一次失效的预测方法，其特征在：

采用权利要求1所述的模型和权利要求3所述的模型参数优化方法，得到权利要求1所述的模型的具体表达式和模型的所有参数值。设目前共观测到n(n≥2)个软件或系统的失效数据：{x_i，i＝1，2，…，n}，则软件或系统的下一次失效的预测值

为：