CN113609009B

CN113609009B - 一种基于多版本的开源软件可靠性建模方法

Info

Publication number: CN113609009B
Application number: CN202110866232.5A
Authority: CN
Inventors: 王金勇
Original assignee: Shanxi University
Current assignee: Shanxi University
Priority date: 2021-07-29
Filing date: 2021-07-29
Publication date: 2023-09-22
Anticipated expiration: 2041-07-29
Also published as: CN113609009A

Abstract

本发明属于计算机软件技术领域，公开了一种基于多版本的开源软件可靠性建模方法。针对开源软件故障检测存在的各种变化，提出了故障检测服从三参数寿命分布的开源软件可靠性模型。利用两个开源软件故障数据集、五个模型比较准则和五个开源软件可靠性模型进行了相应的模型性能比较实验。实验结果表明，与其他开源软件可靠性模型相比，本发明开源软件可靠性模型具有更好的拟合性能和预测性能。此外，该模型能更好地适应各种开源软件故障检测环境，并能帮助开发人员对开源软件的可靠性进行评估。

Description

一种基于多版本的开源软件可靠性建模方法

技术领域

本发明属于计算机软件技术领域，具体为一种基于多版本的开源软件可靠性建模方法。

背景技术

开源软件(Open Source Software,OSS)在过去的几十年中被广泛使用。由于开源软件的开发和测试主要由世界各地的志愿者和用户来完成，其可靠性成为一个热门话题。为了解决开源软件的可靠性问题，一般采用“早发布，常发布”的方法来提高和增强开源软件的可靠性，保持开源软件对社区贡献者的吸引力，满足用户不断变化的需求。

一方面，早发布和频繁发布的方法可以在一定条件下提高开源软件的可靠性。另一方面，由于开源软件发布的主观性和随意性很强，这种方法能否有效提高开源软件的可靠性受到广泛质疑。另外，由于开源软件开发和测试环境的复杂性，故障检测也呈现出多样性和复杂性。而且，由于开源社区志愿者和用户的不断动态变化，开源软件的故障检测也呈现出多种特点。

现有的开源软件可靠性建模研究主要集中在开源软件开发测试的单一特性和特定条件下的可靠性建模。虽然上述开源软件可靠性模型能够有效地评估开源软件在一定条件下的可靠性，但复杂的开发环境和不确定的开发过程使其无法适应实际的开源软件可靠性评估。由于开源软件开发环境的复杂性和开发过程的不确定性，其故障检测率会发生很大的变化。例如，故障检测率随着时间的推移而降低；随着时间的推移，故障检测率先上升后下降；由于开源软件社区的学习，故障检测率随着时间的推移而增加；故障检测率是一个常数；或故障检出率呈浴缸状曲线。因此，考虑到开源软件开发测试过程的单一特点和具体情况，由此建立的开源软件可靠性模型不能适应开源软件测试过程中故障检测的多样性和复杂性。

发明内容

针对开源软件开发环境的复杂性和开发过程的不确定性导致故障检测率会发生很大变化的问题，本发明提供了一种基于多版本的开源软件可靠性建模方法。

为了达到上述目的，本发明采用了下列技术方案：

一种基于多版本的开源软件可靠性建模方法，包括以下步骤：

步骤1，基于多版本的开源软件可靠性模型的建立

开源软件的开发过程可以看作是非齐次泊松过程，表示为下式：

其中，P{·}表示概率，N(t)表示计数过程，ψ(t)表示到t时刻为止，期望检测出故障的累计数量，也称为均值函数，t表示时间变量；k表示故障数量，k＝1,2,...,n；

考虑到开源软件开发和测试的特点和复杂性，假设：

1)开源软件的故障检测服从三参数寿命分布；

2)在开源软件中，前一版本中的剩余故障与当前版本中新生成的故障有关；

3)开源软件检测到的瞬时故障与软件中的剩余故障有关；

4)当检测到开源软件中的故障时，会立即将其去除，不会引入新的故障；

根据假设1)和3)可得：

其中，c>0和d>0表示形状参数；b>0表示尺度参数；η(t)表示故障检测率函数，ω表示期望最初检测出故障总的数量；

对公式(2)解微分方程组，可以得出：

ψ(t)＝ω[1-exp(1-(1+bt^c)^d)] (3)

将公式(3)转换成下式，

其中，F(t)表示三参数寿命分布函数；

一般来说，开源软件是多版本软件，当前版本中的故障包括新生成的故障和前一版本中的剩余故障，从假设2)中可以得出基于多版本的开源软件的可靠性模型如下：

发布1：

ψ₁(t)＝ω₁F₁(t)0≤t＜t₁ (5)

发布2：

ψ₂(t)＝(ω₂+ω₁(1-F₁(t₁)))F₂(t-t₁),t₁≤t＜t₂ (6)

发布3：

ψ₃(t)＝(ω₃+(ω₂+ω₁(1-F₁(t₁)))(1-F₂(t₂)))F₃(t-t₂),t₂≤t＜t₃ (7)

发布n:

其中，ψ₁(t)表示在第一发布中，到t时刻为止，期望检测出故障的累计数量，也成为均值函数；F₁(t)表示在第一次发布中，故障检测服从的分布函数；ψ₂(t)表示在第二发布中，到t时刻为止，期望检测出故障的累计数量，也称为均值函数；F₂(t)表示在第二次发布中，故障检测服从的分布函数；ψ₃(t)表示在第三次发布中，到t时刻为止，期望检测出故障的累计数量，也成为均值函数；F₃(t)表示在第三次发布中，故障检测服从的分布函数；ψ_n(t)表示在第n次发布中，到t时刻为止，期望检测出故障的累计数量，也成为均值函数；F_n(t)表示在第n次发布中，故障检测服从的分布函数；t_i表示第i次发布故障检测结束时间，ω_i表示在第i版本的开源软件中，期望最初检测出故障总的数量；

由公式(8)可知，本发明提出的基于多版本的开源软件可靠性模型充分考虑了当前版本剩余故障的影响，故障检测服从三参数寿命分布。而三参数寿命分布能够模拟开源软件的各种故障检测现象，因此本发明提出的可靠性模型能够更好地适应开源软件开发和测试的复杂环境。

步骤2，基于多版本的开源软件可靠性模型的参数估计

用最小二乘法对开源软件可靠性模型的参数进行估计，最小二乘法可以表示为：

其中，ξ_i表示第i版本的开源软件最小二乘法表达式，ψ_i(t)表示第i版本的开源软件可靠性模型，即，到t时刻为止，期望检测出故障的累计数量；表示在第i版本的开源软件中，到t时刻为止，观察到的故障数量；

针对步骤1中的开源软件可靠性模型的参数，对公式(9)两边取偏微分建立方程如下：

其中，表示偏微分符号；

解方程组式(10)，即可得出基于多版本的开源软件可靠性模型的参数值。

与现有技术相比本发明具有以下优点：

1、针对开源软件开发环境的复杂性和开发过程的不确定性导致故障检测率会发生很大变化的问题，本发明建立了一种基于多版本的开源软件可靠性模型，通过与其它4种模型的性能比较，表明该模型的拟合性能和预测性能最优，且本发明可靠性模型的拟合性能和预测性能随着开发和测试环境的变化相对稳定，此外，本发明的可靠性模型服从三参数寿命期分布，可以捕捉到开源软件测试过程中故障检测的主要变化，具有良好的适应性、鲁棒性和稳定性。

2、通过对本发明可靠性模型进行参数估计和参数敏感性分析，表明本发明可靠性模型的四个参数都是敏感性参数，这充分说明了在开源软件开发和测试环境中，本发明可靠性模型能够很好地满足开源软件开发和测试的规则和特点。在开源软件复杂的开发和测试环境中，可以有效地评估软件的可靠性，预测开源软件中剩余故障的数量，并能帮助开发人员对开源软件的可靠性进行评估。

附图说明

图1为服从三参数寿命分布的故障检测率函数随测试时间的变化情况。

图2为开源软件可靠性模型的拟合和预测性能比较。图2(a)、图2(b)和图2(c)分别表示使用100％的DS1-1、DS1-2和DS1-3的开源软件可靠性模型的拟合性能比较。图2(d)、图2(e)和图2(f)分别表示使用90％的DS2-1、DS2-2和DS2-3的开源软件可靠性模型的预测性能比较。

图3为本发明开源软件可靠性模型的参数敏感性分析。图(a)、图(b)、图(c)和图(d)表示本发明开源软件的可靠性模型分别使用100％的故障数据(DS1-1)进行参数敏感分析时，模型的参数变化情况。

具体实施方式

下面结合本发明实施例和附图，对本发明实施例中的技术方案进行具体、详细的说明。应当指出，对于本领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干变型和改进，这些也应视为属于本发明的保护范围。

实施例1

一种基于多版本的开源软件可靠性建模方法，具体包括以下步骤：

步骤1，基于多版本的开源软件可靠性模型的建立

考虑到开源软件开发和测试的特点和复杂性，假设：

1)开源软件的故障检测服从三参数寿命分布；

3)开源软件检测到的瞬时故障与软件中的剩余故障有关；

需要注意的是，新产生的故障和新引入的故障的区别在于，前者表示由于开源软件功能和需求的变化，在新发布的软件中产生了新的故障。后者意味着新的故障被引入，当检测到的故障被去除时。

根据假设1)和3)可得：

对公式(2)解微分方程组，可以得出：

ψ(t)＝ω[1-exp(1-(1+bt^c)^d)] (3)

将公式(3)转换成下式，

其中，F(t)表示三参数寿命分布函数；

发布1：

ψ₁(t)＝ω₁F₁(t) 0≤t＜t₁ (5)

发布2：

ψ₂(t)＝(ω₂+ω₁(1-F₁(t₁)))F₂(t-t₁),t₁≤t＜t₂ (6)

发布3：

发布n:

其中，ψ₁(t)表示在第一发布中，到t时刻为止，期望检测出故障的累计数量，也成为均值函数；F₁(t)表示在第一次发布中，故障检测服从的分布函数；ψ₂(t)表示在第二发布中，到t时刻为止，期望检测出故障的累计数量，也称为均值函数；F₂(t)表示在第二次发布中，故障检测服从的分布函数；ψ₃(t)表示在第三次发布中，到t时刻为止，期望检测出故障的累计数量，也成为均值函数；F₃(t)表示在第三次发布中，故障检测服从的分布函数；ψ_n(t)表示在第n次发布中，到t时刻为止，期望检测出故障的累计数量，也成为均值函数；F_n(t)表示在第n次发布中，故障检测服从的分布函数；t_i表示第i次发布故障检测结束时间；ω_i表示在第i版本的开源软件中，期望最初检测出故障总的数量。

步骤2，基于多版本的开源软件可靠性模型的参数估计

其中，表示偏微分符号；

实施例2

基于多版本的开源软件可靠性模型的性能分析

故障数据集：

使用了网站bug跟踪系统中两个开源软件项目的故障数据集(https://issues.apache.org/)，分别是apache omid(Omid)和Gobblin(Gobblin)项目。每个项目选择3个连续发布的软件作为开源软件故障数据采集的对象。对于Apache Omid项目，Omid0.9.0.0、Omid 1.0.0和Omid 1.0.1版本分别被重命名为第一个故障数据集(DS1)的Release-1(DS1-1)、Release-2(DS1-2)、Release-3(DS1-3)。对于Gobblin项目，Gobblin0.12.0、Gobblin 0.13.0和Gobblin0.14.0版本分别重命名为第二个故障数据集(DS2)的Release-1(DS2-1)、Release-2(DS2-2)、Release-3(DS2-3)。

在bug跟踪系统中，每个故障(问题，Issues)报告都有一些属性，如故障类型、故障关键字、故障id、故障总结、故障分配者、故障报告人、故障优先级、故障状态、故障解决方法、故障创建和故障更新等。在收集开源软件的故障数据时，我们去除了一些故障解决方法标注为重复、没有问题、无效、无法修复的故障。本发明将影响开源软件质量的因素称为故障(Faults)。2014年4月至2018年4月，DS1-1共检测到故障37处，2017年6月至2018年10月，DS1-2共采集到故障31处，2018年12月至2019年4月，DS1-3共采集到故障14处，2017年3月至2018年3月，在DS2-1中检测到55个故障。2017年7月至2018年7月，在DS2-1中收集了56个故障。2017年7月至2018年11月，在DS2-3中获得了73个故障。表1详细列出了故障数据集。

表1.开源软件故障数据集

比较标准：

本实施例采用下列5种经典的软件可靠性模型评价标准：均方误差(MSE)、平方误差预测和(PSSE)、R²、Theil统计(TS)和方差(Variance)。其中采用MSE、R²、TS和Variance对开源软件可靠性模型的拟合性能进行比较；采用PSSE、TS和Variance对开源软件可靠性模型的预测性能进行比较。

1)MSE可以被定义为下式：

式中，ψ(t_j)表示均值函数，即，到t_j时刻为止，期望检测出故障的累计数量；表示到t_j时刻为止，观察到的故障数量；n表示故障数据集的样本大小；

2)R²可以被表示为下式：

3)PSSE可以表示为：

用t₁到t_n-k个时间点来估计模型的参数值；用t_n-k+1到t_n个时间点来预测模型的性能，k＝1,2,3...,n-2

4)TS可以定义为：

TS表示模型估计值与实际观测到的故障数量之间的平均偏差百分比。

5)Variance可以表示为下式：

Variance是实际观测值和模型估计值的标准差。

MSE、PSSE、TS和Variance越小，模型的性能越好，R²越小，模型的拟合性能越差。

用于开源软件的可靠性模型比较的模型：

为了比较本发明模型的性能。选用其它四个开源软件可靠性模型，包括两个单发布(版本)开源软件可靠性模型(Li单发布模型和Wang单发布模型)、两个多发布(版本)开源软件可靠性模型(Yang多发布模型和Tandon多发布模型)

1、开源软件的可靠性模型的拟合性能比较

用100％的故障数据，比较了Li单发布(版本)模型、Wang单发布(版本)模型、Yang多发布(版本)模型、Tang多发布(版本)模型和本发明可靠性模型的拟合性能。结果如表2-4及图2(a)-(c)所示。

表2.用100％的DS1-1(OMID 0.9.0.0)进行开源软件可靠性模型的拟合性能比较

在表2的release-1中，本发明可靠性模型的MSE、TS和Variance均小于其它四种可靠性模型。而且本发明可靠性模型的R²大于其它四种可靠性模型。表明本发明在Release-1(DS1-1)数据集下，本发明可靠性模型的拟合性能优于其它四种模型。

表3.用100％的DS1-2(OMID 1.0.0)进行开源软件可靠性模型的拟合性能比较

在表3中，本发明可靠性模型的MSE、TS和Variance均小于其它四种可靠性模型。而且本发明可靠性模型的R²大于其它四种可靠性模型。表明本发明在Release-2(DS1-2)数据集下，本发明可靠性模型的拟合性能优于其它四种模型。Li单发布(版本)模型的拟合性能最差，Wang单发布(版本)模型的拟合性能与Yang多发布(版本)模型的拟合性能基本相当。

表4.用100％的DS1-3(OMID 1.0.1)进行开源软件可靠性模型的拟合性能比较

表4中，本发明可靠性模型的MSE、TS和Variance均小于其它四种可靠性模型。而且本发明可靠性模型的R²大于其它四种可靠性模型。表明本发明在Release-3(DS1-3)数据集下，本发明可靠性模型的拟合性能优于其它四种模型。Tandon多发布(版本)模型的拟合性能优于Li单发布(版本)模型、Wang单发布(版本)模型和Yang多发布(版本)模型。Li单发布(版本)模型是所有模型中最差的。

综合可得，本发明可靠性模型的拟合性能最好，除了本发明的可靠性模型外，Tandon多发布(版本)模型的拟合性能优于其它模型。图2(a)-(c)表明，本发明的可靠性模型的拟合性能排在第一位，其次是Tandon多发布(版本)模型。Wang单发布(版本)模型与Yang多发布(版本)模型等价。Li单发布(版本)模型是所有模型中最差的。

2、开源软件的可靠性模型的预测性能比较

用90％的DS2(DS2-1、DS2-2和DS2-3)故障数据集来估计模型的参数值，用剩余的DS2故障数据来比较模型的预测性能。实验结果如表5-7及图2(d)-(f)所示。

表5.用100％的DS2-1(GOBBLIN 0.12.0)进行开源软件可靠性模型的预测性能比较

在表5中，本发明可靠性模型的MSE、TS和Variance均小于其它四种可靠性模型，表明本发明可靠性模型的预测性能优于其它四种模型。Wang单发布(版本)模型的预测性能优于Li单发布(版本)模型、Yang多发布(版本)模型和Tandon多发布(版本)模型，在release-1中，Yang多发布(版本)模型和Tandon多发布(版本)模型大致相等。图2(d)显示了它们的比较结果。

表6.用100％的DS2-2(GOBBLIN 0.13.0)进行开源软件可靠性模型的预测性能比较

从表6可以看出，本发明可靠性模型的MSE、TS和Variance均小于其它四种可靠性模型，表明本发明可靠性模型的预测性能优于其它四种模型。Tandon多发布(版本)模型的预测性能优于Li单发布(版本)模型、Wang单发布(版本)模型的预测性能和Yang多发布(版本)模型的预测性能。Li单发布(版本)模型优于Wang单发布(版本)模型和Yang多发布(版本)模型，但Li单发布(版本)模型的TS远大于Wang单发布(版本)模型和Yang多发布(版本)模型。图2(e)显示了本发明的可靠性模型的预测性能最好。

表7.用100％的DS2-3(GOBBLIN 0.14.0)进行开源软件可靠性模型的预测性能比较

在表7中，本发明可靠性模型的MSE、TS和Variance均小于其它四种可靠性模型，表明本发明可靠性模型的预测性能优于其它四种模型。除了本发明的可靠性模型外，Tandon多发布(版本)模型的预测性能优于Li单发布(版本)模型。其中，Li单发布(版本)模型和Yang多发布(版本)模型的预测能力相当，从图2(f)可以看出，本发明可靠性模型的预测性能最好。

综上所述，本发明可靠性模型的拟合性能和预测性能相对稳定，而其它模型随着开发和测试环境的变化而变化。因此，在开源开发环境下，其它模型的适应性和稳定性较差，而本发明的可靠性模型服从三参数寿命期分布，可以捕捉到开源软件测试过程中故障检测的主要变化，具有良好的适应性、鲁棒性和稳定性。

3、开源软件可靠性模型的参数敏感性分析

使用100％的DS1(DS1-1、DS1-2和DS1-3)和90％的DS2(DS2-1、DS2-2和DS2-3)故障数据集进行本发明可靠性模型的参数值估计。表8列出了分别使用100％的DS1(DS1-1、DS1-2和DS1-3)和90％的DS2(DS2-1、DS2-2和DS2-3)故障数据集进行本发明模型的参数值估计。

表8.本发明的可靠性模型估计的参数值

参数敏感性分析是在改变一个参数值的同时，保持模型的其它参数值不变，进而观察模型的变化情况。从图3(a)-图(d)可以看出，本发明可靠性模型的四个参数都是敏感性参数。这充分说明了在开源软件开发和测试环境中，本发明的可靠性模型能够很好地满足开源软件开发和测试的规则和特点。在开源软件复杂的开发和测试环境中，它可以有效地评估软件的可靠性，预测开源软件中剩余故障的数量。此外，复杂的开源软件开发和测试环境也使得开源软件可靠性模型难以构建。本发明的可靠性模型的各参数对开源软件的可靠性评估和剩余失效预测都有重要作用。

Claims

1.一种基于多版本的开源软件可靠性建模方法，其特征在于，包括以下步骤：

步骤1，基于多版本的开源软件可靠性模型的建立

其中，P{·}表示概率；N(t)表示计数过程；ψ(t)表示到t时刻为止，期望检测出故障的累计数量，也称为均值函数；t表示时间变量；k表示故障数量；

针对开源软件开发和测试的特点和复杂性，假设：

1)开源软件的故障检测服从三参数寿命分布；

3)开源软件检测到的瞬时故障与软件中的剩余故障有关；

根据假设1)和3)可得：

其中，c>0和d>0表示形状参数；b>0表示尺度参数；η(t)表示故障检测率函数；ω表示期望最初检测出故障总的数量；

对公式(2)解微分方程组，可以得出：

ψ(t)＝ω[1-exp(1-(1+bt^c)^d)] (3)

将公式(3)转换成下式，

其中，F(t)表示三参数寿命分布函数；

一般来说，开源软件是多版本软件，当前版本中得故障包括新生成得故障和前一版本中的剩余故障，从假设2)中可以得出基于多版本的开源软件可靠性模型如下：

发布1：

ψ₁(t)＝ω₁F₁(t) 0≤t＜t₁ (5)

发布2：

ψ₂(t)＝(ω₂+ω₁(1-F₁(t₁)))F₂(t-t₁),t₁≤t＜t₂ (6)

发布3：

发布n:

其中，ψ₁(t)表示在第一发布中，到t时刻为止，期望检测出故障的累计数量，也成为均值函数；F₁(t)表示在第一次发布中，故障检测服从的分布函数；ψ₂(t)表示在第二发布中，到t时刻为止，期望检测出故障的累计数量，也称为均值函数；F₂(t)表示在第二次发布中，故障检测服从的分布函数；ψ₃(t)表示在第三次发布中，到t时刻为止，期望检测出故障的累计数量，也成为均值函数；F₃(t)表示在第三次发布中，故障检测服从的分布函数；ψ_n(t)表示在第n次发布中，到t时刻为止，期望检测出故障的累计数量，也成为均值函数；F_n(t)表示在第n次发布中，故障检测服从的分布函数；t_i表示第i次发布故障检测结束时间；ω_i表示在第i版本的开源软件中，期望最初检测出故障总的数量；

步骤2，基于多版本的开源软件可靠性模型的参数估计

其中，ξ_i表示第i版本的开源软件最小二乘法表达式，ψ_i(t)表示第i版本的开源软件可靠性模型，即，到t时刻为止，期望检测出故障的累计数量；O_ti表示在第i版本的开源软件中，到t时刻为止，观察到的故障数量；

其中，表示偏微分符号；