CN102004661A - 一种通用的数据驱动的软件和系统可靠性模型及参数优化方法 - Google Patents

一种通用的数据驱动的软件和系统可靠性模型及参数优化方法 Download PDF

Info

Publication number
CN102004661A
CN102004661A CN2010101952263A CN201010195226A CN102004661A CN 102004661 A CN102004661 A CN 102004661A CN 2010101952263 A CN2010101952263 A CN 2010101952263A CN 201010195226 A CN201010195226 A CN 201010195226A CN 102004661 A CN102004661 A CN 102004661A
Authority
CN
China
Prior art keywords
model
value
software
parameter
genetic algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010101952263A
Other languages
English (en)
Inventor
杨波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN2010101952263A priority Critical patent/CN102004661A/zh
Publication of CN102004661A publication Critical patent/CN102004661A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出了一种通用的数据驱动的软件和系统可靠性模型及参数优化方法。提出的模型具有通用性,现有的数据驱动的可靠性模型是本发明所提出的模型的一个特例。提出了一种混合遗传算法,通过该算法可得到模型参数的最优值。提出了一种用二进制码表示模型的某些参数的方法,该方法用于本发明所提出的混合遗传算法中。所提出的可靠性模型和参数优化方法适用于:1、软件可靠性与失效过程的建模、预测以及模型的参数优化;2、系统可靠性与失效过程的建模、预测以及模型的参数优化。

Description

一种通用的数据驱动的软件和系统可靠性模型及参数优化方法
技术领域
本发明是关于软件和系统的可靠性与失效过程的建模、预测以及模型的参数优化,属于可靠性工程和应用数学领域,尤其涉及对软件和系统的失效过程进行建模与预测的领域。
背景技术
从20世纪70年代开始,人们在软件和系统的可靠性建模、分析、评估、预测等方面开展了大量的研究,提出了各种可靠性模型。软件和系统可靠性模型大体上可分为两类:解析可靠性模型(Analytical Reliability Model)和数据驱动的可靠性模型(Data-drivenReliability Model)。解析可靠性模型包括马尔科夫模型、非齐次泊松过程模型、二项分布模型、贝叶斯模型等等。由于解析可靠性模型通常需要对软件或系统做出较多的假设,如失效间隔时间的概率分布等等,而这些假设不一定符合实际情况,因此解析可靠性模型的适用性和准确性受到了较大的影响,并且在实际的工程应用中,在各种解析可靠性模型中选择恰当的一个模型是比较困难的。
针对解析可靠性模型的不足,近年来提出了一些数据驱动的可靠性模型。数据驱动的可靠性模型不需要对软件或系统做过多的假设,而是将软件或系统的失效过程视为一个时间序列进行建模和预测。数据驱动的可靠性模型包括基于传统时间序列分析方法(如差分自回归滑动平均,ARIMA)的模型、基于人工神经网络(Artificial Neural Network,ANN)的模型、基于支持向量机(SupportVector Machine,SVM)的模型等等。数据驱动的可靠性模型适用范围较传统的解析可靠性模型更广,并且预测精度通常比解析可靠性模型更高。
然而,现有的数据驱动的可靠性模型大都认为软件和系统的失效与
Figure BSA00000156965800011
一个或几个失效(如之前的第一个到第五个失效)存在相关关系,并基于此对失效过程进行建模和预测。而实际的情况是,软件和系统的失效是与之前的
Figure BSA00000156965800021
失效(如之前的第三个、第四个、第八个失效)存在相关关系,应该基于该相关关系对失效过程进行建模和预测。
发明内容
本发明针对现有的数据驱动的可靠性模型的以上不足,提出了一种新的通用的数据驱动的软件和系统可靠性模型,并提出了一种新的模型参数的优化方法。所提出的模型和方法适用于:1、软件可靠性与失效过程的建模、预测以及模型的参数优化;2、系统可靠性与失效过程的建模、预测以及模型的参数优化。
本发明的目的在于建立一种更加符合实际情况、预测精度更高的数据驱动的可靠性模型和模型参数的优化方法。为实现上述目的,本发明提供了一种通用的数据驱动的软件和系统可靠性模型以及模型参数的优化方法,其特征在于包含以下内容:
1.模型的表达形式
本发明所提出的软件和系统可靠性模型表示为:
x i = F ( x i - m i , x i - m 2 , · · · , x i - m p ) - - - ( 1 )
上式中,i和p为正整数,mj(j=1,2,…,p)为正整数,xi表示软件或系统的第i个失效数据(失效数据可以为任何形式,如累计失效时间、失效间隔时间、累计失效数等),F(·)表示软件或系统的当前失效(即xi)与之前的失效(即
Figure BSA00000156965800023
)之间的相关关系。F(·)可以通过任意方式来表达,如基于ARIMA的模型、基于人工神经网络的模型、基于支持向量机的模型等等。
现有的数据驱动的可靠性模型表示为:
xi=F(xi-1,xi-2,…,xi-w)              (2)
可见,现有的数据驱动的可靠性模型是本发明所提出的模型(1)的一个特例,即p=w并且mj=j(1≤j≤p)。因此,本发明所提出的软件和系统可靠性模型具有通用性,包含了现有的数据驱动的可靠性模型不能表达的情况,并在特定条件下可退化为现有的数据驱动的可靠性模型。
2.模型参数的最优化
在模型(1)中,需要确定的模型参数包括两部分:p的值和mj(j=1,2,…,p)的值、F(·)中的各参数值。本发明提出了一种混合遗传算法(Hybrid Genetic Algorithm)同时求得这两部分参数的最优值,该算法如图1所示。
混合遗传算法包括外层的遗传算法(GA1)和内层的遗传算法(GA2)。GA1用于确定最优的p和mj(j=1,2,…,p)的值;GA2用于确定在某p值和mj(j=1,2,…,p)的值的条件下,F(·)中各参数的最优值;当混合遗传算法运行结束后,即得到所有的模型参数的最优值。在混合遗传算法中:
GA1中用一个二进制码来表示模型(1)中的p值和mj(j=1,2,…,p)的值,具体方法如下:由模型使用者给定一个正整数值v,该值表示模型(1)中p的最大可能取值,用一个长度为v的二进制码来表示模型(1)中的p值和mj(j=1,2,…,p)的值,具体表示方法为:该二进制码中“1”的个数为p的值,每个“1”从右往左(或从左往右)所在的位置代表一个mj的值;或该二进制码中“0”的个数为p的值,每个“0”从右往左(或从左往右)所在的位置代表一个mj的值。例如,若二进制码中“1”的个数为p的值,每个“1”从右往左所在的位置代表一个mj的值,则图2所示的二进制码“10100010”表示v=8,p=3,m1=2,m2=6,m3=8,即模型(1)为xi=F(xi-2,xi-6,xi-8)。
GA2用于确定在GA1的某二进制码的条件下最优的F(·)中的各参数值。
混合遗传算法的具体实施方式见后面所述。遗传算法的相关知识可见参考文献[1]。
3.用模型进行预测
当模型(1)的参数确定后,即可用该模型对软件或系统将来的失效进行预测。设目前共观测到n(n≥2)个软件或系统的失效数据:{xi,i=1,2,…,n},则将对应的p个失效数据代入模型(1),即得到软件或系统的下一次失效的预测值
Figure BSA00000156965800032
附图说明
图1是本发明所提出的混合遗传算法流程图;
图2是模型(1)中的p值和mj(j=1,2,…,p)的值采用本发明权利要求2所述的表示方式之一种来表示的示例图;
图3是本发明的具体实施方式的说明图。
下面结合附图对本发明作进一步的详细描述。
具体实施方式
本发明的具体实施方式如图3所示,包括三个阶段:训练阶段、测试阶段、预测阶段。其中,训练阶段和测试阶段采用如图1所示的混合遗传算法来确定模型(1)中各参数的最优值,即P、mj(j=1,2,…,p)以及F(·)中各参数的最优值。
设目前共观测到n(n≥2)个软件或系统的失效数据{xi,i=1,2,…,n}。实施过程中,由模型使用者给定一个正整数d,则失效数据被划分为两部分:前(n-d)个数据{xi,i=1,2,…,n-d}用于训练阶段;其余的d个数据{xi,i=n-d+1,n-d+2,…,n}用于测试阶段。模型使用者还要给定一个正整数值v(v≤n-d-1),该值表示模型(1)中p的最大可能取值,即p≤v。
下面以F(·)为具有高斯核函数(Gaussian kernel function)的支持向量机为例,来说明本发明的具体实施方式。支持向量机的相关知识可见参考文献[2][3]。
支持向量机的正则化风险函数(Regularized Risk Function)为:
R = 1 2 | | ω | | 2 + C 1 l Σ i = 1 l | y i - f ( x i ) | ϵ - - - ( 3 )
其中有两个参数:C和ε。高斯核函数的表达式为:
K ( x i , x j ) = exp [ - ( x i - x j ) 2 2 σ 2 ] - - - ( 4 )
其中有一个参数:σ。因此,当F(·)为具有高斯核函数的支持向量机时,F(·)中有三个模型参数待确定:C、ε、σ。
如图1所示,算法开始后,进入外层的遗传算法GA1。遗传算法的相关知识可见参考文献[1]。首先由用户给定或随机地产生长度为v的二进制码的初代染色体(InitialGeneration of Chromosomes),每个染色体确定了一组模型(1)中的p值和mj(j=1,2,…,p)的值。在每个染色体确定的值下,进入GA2。
在GA2中,采用遗传算法来确定C、ε、σ的最优值。其中,支持向量机的训练阶段如图3(a)所示,此时,F(·)为具有高斯核函数的支持向量机,当i取某一固定值时,输入数据为软件或系统的失效数据的前(n-d)个数据{xi,i=1,2,…,n-d}中的p个值:
Figure BSA00000156965800051
这里p值和mj(j=1,2,…,p)的值由进入GA2时的二进制码的染色体确定。因此,图3(a)的模型输出值为:
x ^ i = F ( x i - m 1 , x i - m 2 , · · · , x i - m p ) - - - ( 5 )
上式中,p值和mj(j=1,2,…,p)的值由进入GA2时的二进制码的染色体确定;F(·)中的参数:C、ε、σ由GA2的染色体确定。
定义拟合均方差(MSEf)为:
MSE f = 1 n - d Σ i = v + 1 n - d ( x ^ i - x i ) 2 - - - ( 6 )
上式中,
Figure BSA00000156965800054
由(5)式得到,xi是软件或系统的失效数据{xi,i=v+1,v+2,…,n-d}的真实值。在GA2中,“F(·)训练完成”的判断标准是MSEf是否已最小化或已小于模型使用者给定的MSEf的阈值。如果不满足该判断标准,则继续执行GA2,即进行选择(Selection)、交叉(Crossover)、变异(Mutation),得到C、ε、σ的下一代染色体,然后返回到支持向量机训练阶段继续执行;如果已满足该判断标准,则退出GA2,返回GA1继续执行,此时F(·)中的参数:C、ε、σ达到由进入GA2时的二进制码染色体确定的p值和mj(j=1,2,…,p)的值的条件下的最优值。
当退出GA2,返回GA1继续执行时,支持向量机的测试阶段如图3(b)所示,此时F(·)中的参数:C、ε、σ为退出GA2时确定的值。
定义预测均方差(MSEp)为:
MSE p = 1 d Σ i = n - d + 1 n ( x ^ i - x i ) 2 - - - ( 7 )
上式中,
Figure BSA00000156965800056
由(5)式得到,xi是软件或系统的失效数据{xi,i=n-d+1,n-d+2,…,n}的真实值。在GA1中,“F(·)测试完成”的判断标准是MSEp是否已最小化或已小于模型使用者给定的MSEp的阈值。如果不满足该判断标准,则继续执行GA1,即进行选择、交叉、变异,得到二进制码的下一代染色体,然后重新进入GA2继续执行;如果已满足该判断标准,则退出GA1,混合遗传算法结束,此时得到了最优的p值和最优的mj(j=1,2,…,p)的值(由退出GA1时的二进制码确定),以及F(·)中的参数:C、ε、σ的最优值。
混合遗传算法结束后,模型(1)的参数即已确定,此时可用该模型对软件或系统将来的失效进行预测,如图3(c)所示。软件或系统的下一次失效的预测值
Figure BSA00000156965800061
为:
x ^ n + 1 = F ( x n + 1 - m 1 , x n + 1 - m 2 , · · · , x n + 1 - m p ) - - - ( 8 )
上式中,xi(1≤i≤n)是软件或系统的失效数据{xi,i=1,2,…,n}中的某些值。
以上所述的本发明的具体实施方式可以反复进行,即当观测到软件或系统的第(n+1)个失效时,失效数据变为{xi,i=1,2,…,n+1},这时将(n+1)的值作为n值,重复本发明的具体实施方式,即可得到软件或系统的下一次失效的预测值
Figure BSA00000156965800063
依此类推。
下面通过一个例子来进一步说明本发明的具体实施方式。
文献[4]中报告了一组软件失效数据(文献[4]的Appendix A),包含22个失效间隔时间(n=22),如表1所示。
表1
Figure BSA00000156965800064
Figure BSA00000156965800071
令d=4,即第1到第18个失效数据用于训练阶段,第19到第22个数据用于测试阶段;令v=8,即二进制码长度为8;令F(·)为具有高斯核函数的支持向量机。采用前面所述的本发明的具体实施方式,得到如下结果:
最优二进制码为00001100,即软件可靠性模型为xi=F(xi-3,xi-4);F(·)为具有高斯核函数的支持向量机,其三个参数的最优值分别为:C=2486,ε=0.6417,σ=1.042。
根据上面的结果,软件的下一个失效间隔时间的预测值为:
Figure BSA00000156965800072
参考文献
[1]Goldberg DE.Genetic Algorithms in Search,Optimization,and Machine Learning.Addison-Wesley Professional,1989.
[2]Vapnik VN.The Nature of Statistical Learning Theory.New York:Springer-Verlag,1995.
[3]Vapnik VN.An overview of statistical learning theory.IEEE Transactions on NeuralNetworks,1999,10(5):950-958.
[4]Pai PF and Hong WC.Software reliability forecasting by support vector machines withsimulated annealing algorithms.Journal of Systems and Software,2006,79(6):747-755.

Claims (4)

1.一种通用的数据驱动的软件和系统可靠性模型,其特征在于:
模型表示为:
Figure FSA00000156965700011
其中,xi表示软件或系统的第i个失效数据(i为正整数),失效数据可以为任何形式,如累计失效时间、失效间隔时间、累计失效数等等,i和p为正整数,mj(j=1,2,…,p)为正整数,F(·)表示软件或系统的当前失效(即xi)与之前的失效(即
Figure FSA00000156965700012
)之间的相关关系。F(·)可以通过任意方式来表达,如基于差分自回归滑动平均(ARIMA)的模型、基于人工神经网络的模型、基于支持向量机的模型等等。
2.一种权利要求1所述的模型中的p和mj(j=1,2,…,p)的表示方法,其特征在于:
首先由模型使用者给定一个正整数值v,该值表示p的最大可能取值,然后用一个长度为v的二进制码来表示权利要求1所述的模型中的p值和mj(j=1,2,…,p)的值,具体表示方法为:该二进制码中“1”的个数为p的值,每个“1”从右往左(或从左往右)所在的位置代表一个mj的值;或该二进制码中“0”的个数为p的值,每个“0”从右往左(或从左往右)所在的位置代表一个mj的值。
3.一种权利要求1所述的模型的参数优化方法,其特征在:
采用图1所示的混合遗传算法,包括外层的遗传算法(GA1)和内层的遗传算法(GA2)。GA1中的二进制码如权利要求2所述的方式来表示权利要求1所述的模型中的p值和mj(j=1,2,…,p)的值。混合遗传算法运算结束后,即得到权利要求1所述的模型的所有参数(包括P、mj(j=1,2,…,p)和F(·)中的各参数)的最优值。
4.一种软件和系统下一次失效的预测方法,其特征在:
采用权利要求1所述的模型和权利要求3所述的模型参数优化方法,得到权利要求1所述的模型的具体表达式和模型的所有参数值。设目前共观测到n(n≥2)个软件或系统的失效数据:{xi,i=1,2,…,n},则软件或系统的下一次失效的预测值
Figure FSA00000156965700013
为:
Figure FSA00000156965700014
CN2010101952263A 2010-06-09 2010-06-09 一种通用的数据驱动的软件和系统可靠性模型及参数优化方法 Pending CN102004661A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010101952263A CN102004661A (zh) 2010-06-09 2010-06-09 一种通用的数据驱动的软件和系统可靠性模型及参数优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010101952263A CN102004661A (zh) 2010-06-09 2010-06-09 一种通用的数据驱动的软件和系统可靠性模型及参数优化方法

Publications (1)

Publication Number Publication Date
CN102004661A true CN102004661A (zh) 2011-04-06

Family

ID=43812040

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010101952263A Pending CN102004661A (zh) 2010-06-09 2010-06-09 一种通用的数据驱动的软件和系统可靠性模型及参数优化方法

Country Status (1)

Country Link
CN (1) CN102004661A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105260304A (zh) * 2015-10-19 2016-01-20 湖州师范学院 一种基于qbgsa-rvr的软件可靠性预测方法
CN110211697A (zh) * 2019-05-29 2019-09-06 安徽医科大学第一附属医院 基于svm模型的消化内科电子数据分析方法
CN110223771A (zh) * 2019-05-29 2019-09-10 安徽医科大学第一附属医院 基于nhpp的消化内科电子数据分析方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070226546A1 (en) * 2005-12-22 2007-09-27 Lucent Technologies Inc. Method for determining field software reliability metrics
CN101082876A (zh) * 2006-05-30 2007-12-05 四川华智信息技术有限公司 软件自动测评工具包

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070226546A1 (en) * 2005-12-22 2007-09-27 Lucent Technologies Inc. Method for determining field software reliability metrics
CN101082876A (zh) * 2006-05-30 2007-12-05 四川华智信息技术有限公司 软件自动测评工具包

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
BO YANG ETC AL: "A generic data-driven software reliability model with model mining technique", 《RELIABILITY ENGINEERING AND SYSTEM SAFETY》 *
杨波等: "数据驱动的软件可靠性模型研究", 《中国科技论文在线》 *
郭夙昌等: "考虑节点失效恢复能力的网格服务可靠性建模与分析", 《西安交通大学学报》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105260304A (zh) * 2015-10-19 2016-01-20 湖州师范学院 一种基于qbgsa-rvr的软件可靠性预测方法
CN105260304B (zh) * 2015-10-19 2018-03-23 湖州师范学院 一种基于qbgsa‑rvr的软件可靠性预测方法
CN110211697A (zh) * 2019-05-29 2019-09-06 安徽医科大学第一附属医院 基于svm模型的消化内科电子数据分析方法
CN110223771A (zh) * 2019-05-29 2019-09-10 安徽医科大学第一附属医院 基于nhpp的消化内科电子数据分析方法
CN110223771B (zh) * 2019-05-29 2023-05-30 安徽医科大学第一附属医院 基于nhpp的消化内科电子数据分析方法
CN110211697B (zh) * 2019-05-29 2023-06-09 安徽医科大学第一附属医院 基于svm模型的消化内科电子数据分析方法

Similar Documents

Publication Publication Date Title
Golnaraghi et al. Application of artificial neural network (s) in predicting formwork labour productivity
Xiang et al. Ultra-short term wind power prediction applying a novel model named SATCN-LSTM
CN103488869A (zh) 一种最小二乘支持向量机的风力发电短期负荷预测方法
CN108090510A (zh) 一种基于间隔优化的集成学习方法及装置
CN101866143B (zh) 基于时空特征聚合的道路交通服务水平预测预报方法
CN105760952A (zh) 一种基于卡尔曼滤波与自适应模糊神经网络的负荷预测方法
Cerqueira et al. Dynamic and heterogeneous ensembles for time series forecasting
CN110210656B (zh) 基于站点行为分析的共享单车流量预测方法及系统
CN103942375A (zh) 基于区间的高速压力机滑块尺寸稳健设计方法
Ye et al. An environmental pollution management method based on extended belief rule base and data envelopment analysis under interval uncertainty
Biswas et al. Dynamic modeling for product family evolution combined with artificial neural network based forecasting model: a study of iPhone evolution
CN104732067A (zh) 一种面向流程对象的工业过程建模预测方法
Manoj et al. FWS-DL: forecasting wind speed based on deep learning algorithms
CN102004661A (zh) 一种通用的数据驱动的软件和系统可靠性模型及参数优化方法
CN104217296A (zh) 一种上市公司绩效综合评价方法
CN103605493A (zh) 基于图形处理单元的并行排序学习方法及系统
CN113989544A (zh) 一种基于深度图卷积网络的群体发现方法
CN105354644A (zh) 一种基于集成经验模态分解和1-范数支持向量机分位数回归的金融时间序列预测方法
Zhang et al. RSVRs based on feature extraction: a novel method for prediction of construction projects’ costs
CN109635008B (zh) 一种基于机器学习的设备故障检测方法
Micheli et al. Data-driven risk-based assessment of wind-excited tall buildings
Fazlollahtabar et al. OPTIMIZING MULTI-OBJECTIVE DECISION MAKING HAVING QUALITATIVE EVALUATION.
KR102418239B1 (ko) 기술의 지속 가능성을 탐색하기 위한 특허 분석 장치
Tozan et al. Fuzzy forecasting applications on supply chains
Li et al. GA-SVR traffic flow prediction based on phase space reconstruction with improved KNN method

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20110406