CN112799712A - 维护工作量的确定方法、装置、设备、介质和程序产品 - Google Patents
维护工作量的确定方法、装置、设备、介质和程序产品 Download PDFInfo
- Publication number
- CN112799712A CN112799712A CN202110133182.XA CN202110133182A CN112799712A CN 112799712 A CN112799712 A CN 112799712A CN 202110133182 A CN202110133182 A CN 202110133182A CN 112799712 A CN112799712 A CN 112799712A
- Authority
- CN
- China
- Prior art keywords
- code
- value
- software
- metric
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012423 maintenance Methods 0.000 title claims abstract description 97
- 238000000034 method Methods 0.000 title claims abstract description 81
- 238000013442 quality metrics Methods 0.000 claims description 147
- 238000005259 measurement Methods 0.000 claims description 134
- 230000004927 fusion Effects 0.000 claims description 60
- 239000011159 matrix material Substances 0.000 claims description 29
- 230000015654 memory Effects 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 15
- 230000001149 cognitive effect Effects 0.000 claims description 10
- 230000000903 blocking effect Effects 0.000 claims description 7
- 230000000875 corresponding effect Effects 0.000 description 64
- 238000010586 diagram Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 12
- 238000001514 detection method Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 6
- 238000012544 monitoring process Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 5
- 230000003068 static effect Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000007499 fusion processing Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000002596 correlated effect Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 238000004806 packaging method and process Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000003252 repetitive effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000013522 software testing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/70—Software maintenance or management
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Stored Programmes (AREA)
Abstract
本公开提供一种维护工作量的确定方法,包括:确定目标源代码的数量值,该目标源代码为目标软件的源代码中需要进行维护的源代码,基于目标软件的源代码的代码问题度量值和目标软件的源代码的代码属性度量值,确定目标软件的软件质量问题值,以及根据目标源代码的数量值和软件质量问题值,确定目标软件的维护工作量。本公开还提供了一种维护工作量的确定装置,电子设备、计算机可读存储介质和程序产品。本公开提供的维护工作量的确定方法和装置例如可以应用于金融领域或其他领域。
Description
技术领域
本公开涉及软件维护的技术领域,特别是涉及一种维护工作量的确定方法、装置、设备、介质和程序产品。
背景技术
软件维护工作是软件生命周期中的最后阶段,也是整个软件生命周期中最长的阶段,因此在软件工程中占有重要地位,其主要工作将占到整个软件生命周期花费的60%到70%。
正是由于软件维护在现代软件工程中占有非常重要的地位,所以对软件的维护工作量进行预测,可以帮助相关维护人员对软件维护工作在整体上做到心中有数,并对软件维护工作的各个部分做到有序安排,有助于软件的维护工作平稳、高效地开展。
相关技术也提供了一些针对软件的维护工作量进行预测的解决方案,但大多方案依据的是传统的通用预测模型,这些传统的通用预测模型由于侧重于针对不同类型的众多软件维护工作强的通用普适性,而针对性不强,因此无法很好反映不同类型软件的自身特点,导致维护工作量的预测准确度不高。
发明内容
有鉴于此,针对不同类型、数量众多的软件,为增强维护工作的针对性,至少部分地克服相关技术中存在的上述技术问题,本公开提供了一种维护工作量的确定方法、装置、设备、介质和程序产品。
为了实现上述目标,本公开的一个方面提供了一种维护工作量的确定方法,该方法可以包括:确定目标源代码的数量值,其中,上述目标源代码为目标软件的源代码中需要进行维护的源代码,基于上述目标软件的源代码的代码问题度量值和上述目标软件的源代码的代码属性度量值,确定上述目标软件的软件质量问题值,以及根据上述目标源代码的数量值和上述软件质量问题值,确定上述目标软件的维护工作量。
根据本公开的实施例,上述方法还可以包括:获取m个代码问题度量指标,其中,上述m个代码问题度量指标用于作为对源代码问题进行度量的度量依据,m为正整数,针对上述目标软件的源代码,获得m个代码问题度量指标值,其中,上述m个代码问题度量指标值与上述m个代码问题度量指标一一对应,获得m个代码问题度量指标权重值,其中,上述m个代码问题度量指标权重值与上述m个代码问题度量指标一一对应,以及基于上述m个代码问题度量指标值和上述m个代码问题度量指标权重值,确定上述目标软件的源代码的代码问题度量值。
根据本公开的实施例,上述代码问题度量指标可以包括以下至少之一:提示问题层级、次要问题层级、主要问题层级、严重问题层级以及阻断问题层级。
根据本公开的实施例,上述方法还可以包括:获取n个代码质量度量指标,其中,上述n个代码质量度量指标用于作为对代码属性进行度量的度量依据,n为正整数,获得p个样本软件的源代码,其中,p为正整数,针对每个样本软件的源代码,获得p个代码质量度量指标值,其中,上述p个代码质量度量指标值与上述p个代码质量度量指标一一对应,基于与上述每个样本软件的源代码对应的p个代码质量度量指标值和上述n个代码质量度量指标,生成代码质量度量指标矩阵,以及基于上述代码质量度量指标矩阵,确定上述目标软件的源代码的代码属性度量值。
根据本公开的实施例,上述基于上述代码质量度量指标矩阵,确定上述目标软件的源代码的代码属性度量值可以包括:基于上述代码质量度量指标矩阵,依次检测是否存在可融合的代码质量度量指标,若存在,则按照预设融合规则,融合上述可融合的代码质量度量指标,并获得代码质量度量指标的融合结果,以及基于上述代码质量度量指标的融合结果,确定上述目标软件的源代码的代码属性度量值。
根据本公开的实施例,上述按照预设融合规则,融合上述可融合的代码质量度量指标可以包括:在上述可融合的代码质量度量指标为正相关的情况下,按照第一预设融合规则,融合上述可融合的代码质量度量指标,以及在上述可融合的代码质量度量指标为负相关的情况下,按照第二预设融合规则,融合上述可融合的代码质量度量指标,其中,上述第一预设融合规则和上述第二预设融合规则不同。
根据本公开的实施例,上述代码质量度量指标可以包括以下至少之一:代码覆盖率、代码重复率、代码注释率、代码复杂度、代码认知复杂度以及代码可维护性。
根据本公开的实施例,上述确定目标源代码的数量值可以包括:获得上述目标软件的源代码的总行数值,获得上述目标软件的源代码的代码注释率,获得上述目标软件的源代码的代码重复率,以及基于上述总行数值、上述代码注释率和上述代码重复率,确定目标源代码的数量值。
为了实现上述目标,本公开的另一个方面提供了一种维护工作量的确定装置,该装置可以包括:目标代码数量值确定模块,用于确定目标源代码的数量值,其中,上述目标源代码为目标软件的源代码中需要进行维护的源代码,软件质量问题值确定模块,用于基于上述目标软件的源代码的代码问题度量值和上述目标软件的源代码的代码属性度量值,确定上述目标软件的软件质量问题值,以及维护工作量确定模块,用于根据上述目标源代码的数量值和上述软件质量问题值,确定上述目标软件的维护工作量。
根据本公开的实施例,上述装置还可以包括:代码问题度量指标获取模块,用于获取m个代码问题度量指标,其中,上述m个代码问题度量指标用于作为对源代码问题进行度量的度量依据,m为正整数,代码问题度量指标值获取模块,用于针对上述目标软件的源代码,获得m个代码问题度量指标值,其中,上述m个代码问题度量指标值与上述m个代码问题度量指标一一对应,代码问题度量指标权重值获取模块,用于获得m个代码问题度量指标权重值,其中,上述m个代码问题度量指标权重值与上述m个代码问题度量指标一一对应,以及代码问题度量值确定模块,用于基于上述m个代码问题度量指标值和上述m个代码问题度量指标权重值,确定上述目标软件的源代码的代码问题度量值。
根据本公开的实施例,上述代码问题度量指标可以包括以下至少之一:提示问题层级、次要问题层级、主要问题层级、严重问题层级以及阻断问题层级。
根据本公开的实施例,上述装置还可以包括:代码质量度量指标获取模块,用于获取n个代码质量度量指标,其中,上述n个代码质量度量指标用于作为对代码属性进行度量的度量依据,n为正整数,样本软件源代码获得模块,用于获得p个样本软件的源代码,其中,p为正整数,代码质量度量指标值获取模块,用于针对每个样本软件的源代码,获得p个代码质量度量指标值,其中,上述p个代码质量度量指标值与上述p个代码质量度量指标一对应,代码质量度量指标矩阵生成模块,用于基于与上述每个样本软件的源代码对应的p个代码质量度量指标值和上述n个代码质量度量指标,生成代码质量度量指标矩阵,以及代码属性度量值确定模块,用于基于上述代码质量度量指标矩阵,确定上述目标软件的源代码的代码属性度量值。
根据本公开的实施例,上述代码属性度量值确定模块可以包括:代码质量度量指标检测子模块,用于基于上述代码质量度量指标矩阵,依次检测是否存在可融合的代码质量度量指标,代码质量度量指标融合子模块,用于若存在,则按照预设融合规则,融合上述可融合的代码质量度量指标,并获得代码质量度量指标的融合结果,以及代码属性度量值确定子模块,用于基于上述代码质量度量指标的融合结果,确定上述目标软件的源代码的代码属性度量值。
根据本公开的实施例,上述代码质量度量指标融合子模块可以包括:代码质量度量指标第一融合单元,用于在上述可融合的代码质量度量指标为正相关的情况下,按照第一预设融合规则,融合上述可融合的代码质量度量指标,以及代码质量度量指标第二融合单元,用于在上述可融合的代码质量度量指标为负相关的情况下,按照第二预设融合规则,融合上述可融合的代码质量度量指标,其中,上述第一预设融合规则和上述第二预设融合规则不同。
根据本公开的实施例,上述代码质量度量指标可以包括以下至少之一:代码覆盖率、代码重复率、代码注释率、代码复杂度、代码认知复杂度以及代码可维护性。
根据本公开的实施例,上述目标代码数量值确定模块可以包括:总行数值获得子模块,用于获得上述目标软件的源代码的总行数值,代码注释率获得子模块,用于获得上述目标软件的源代码的代码注释率,代码重复率获得子模块,用于获得上述目标软件的源代码的代码重复率,以及目标代码数量值确定子模块,用于基于上述总行数值、上述代码注释率和上述代码重复率,确定目标源代码的数量值。
为了实现上述目标,本公开的另一方面提供了一种电子设备,包括:一个或多个处理豁,存储器,用于存储一个或多个程序,其中,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器实现如上所述的维护工作量的确定方法。
为了实现上述目标,本公开的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令,上述指令在被执行时用于实现如上所述的维护工作量的确定方法。
为了实现上述目标,本公开的另一方面提供了一种计算机程序产品,上述计算机程序包括计算机可执行指令,上述指令在被执行时用于实现如上所述的维护工作量的确定方法。
本公开提供的维护工作量的确定方法,基于目标软件的源代码的代码问题度量值和目标软件的源代码的代码属性度量值确定目标软件的软件质量问题值,再结合目标源代码的数量值来确定目标软件的维护工作量,使得维护工作量的确定过程中既考虑到目标软件的代码问题,又考虑到目标软件的代码属性,使得维护工作量的确定方法兼顾通用性,有针对性地针对目标软件,确定其对应的软件维护工作量,提升维护工作量的预测准确度。
附图说明
通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:
图1示意性示出了适用于本公开实施例的可以应用维护工作量的确定方法和装置的系统架构;
图2示意性示出了根据本公开实施例的维护工作量的确定方法的流程图;
图3示意性示出了根据本公开另一实施例的维护工作量的确定方法的流程图;
图4示意性示出了根据本公开实施例的维护工作量的确定装置的框图;
图5示意性示出了根据本公开另一实施例的维护工作量的确定装置的框图;
图6示意性示出了根据本公开实施例的适于实现上文描述的维护工作量的确定方法的计算机可读存储介质产品的示意图;以及
图7示意性示出了根据本公开实施例的适于实现上文描述的维护工作量的确定方法的电子设备的框图。
在附图中,相同或对应的标号表示相同或对应的部分。
应该注意的是,附图并未按比例绘制,并且出于说明目的,在整个附图中类似结构或功能的元素通常用类似的附图标记来表示。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了上述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
附图中示出了一些方框图和/或流程图。应理解,方框图和/或流程图中的一些方框或其组合可以由计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程维护工作量的确定装置的处理器,从而这些指令在由该处理器执行时可以创建用于实现这些方框图和/或流程图中所说明的功能/操作的装置。本公开的技术可以硬件和/或软件(包括固件、微代码等)的形式来实现。另外,本公开的技术可以采取存储有指令的计算机可读存储介质上的计算机程序产品的形式,该计算机程序产品可供指令执行系统使用或者结合指令执行系统使用。
软件的维护工作是软件生命周期的最后阶段,也是最长的阶段。软件的维护工作将占到整个软件生命周期花费的较大比例。由于现代软件工程中软件维护工作占有非常重要的地位,许多研究人员在此领域进行长期研究并创建了一系列预测模型来预测软件维护的工作量。按照预测所用的指标不同,软件维护工作量预测模型可分为静态预测模型和动态预测模型,这些模型多数都是仅根据若干应用领域中有限数量的项目的经验数据推导出来的,适用范围有限。因此,必须根据当前项目的特点选择适用的估算模型,并且根据需要适当地调整(例如,修改模型常数)估算模型。而动态多变量模型是根据从多个当代软件项目中收集的生产率数据推导出来的。该类模型把工作量看作是软件规模和开发时间这两个变量的函数,强的通用普适性和弱的个体针对性,并无法很好地反映不同类型各软件的自身特点,导致维护工作量的预测准确度不高。
有鉴于此,本公开提供了一种更有针对性的软件维护工作量的确定方法,该方法可以包括软件质量问题值确定阶段和维护工作量确定阶段。其中在软件质量问题值确定阶段,首先确定目标源代码的数量值,该目标源代码为目标软件的源代码中需要进行维护的源代码,然后基于目标软件的源代码的代码问题度量值和目标软件的源代码的代码属性度量值,确定目标软件的软件质量问题值。在维护工作量确定阶段,则根据目标源代码的数量值和软件质量问题值,确定目标软件的维护工作量。
通过本公开的实施例,基于目标软件的源代码的代码问题度量值和目标软件的源代码的代码属性度量值,确定目标软件的软件质量问题值,最终结合目标源代码的数量值来确定目标软件的维护工作量,由于在确定目标软件的软件质量问题值时,既考虑目标软件的代码本身存在的问题,又考虑代码属性,因此维护工作量的确定方法兼顾通用性和针对性,可以提高维护工作量的预测准确度。
需要说明的是,本公开所提供的维护工作量的确定方法和装置可用于金融领域中,也可用于除金融领域之外的任意领域中。因此,对本公开所提供的维护工作量的确定方法和装置的应用领域不做限定。
图1示意性示出了适用于本公开实施例的可以应用维护工作量的确定方法和装置的系统架构100。需要注意的是,图1所示仅为可应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
如图1所示,根据该实施例的系统架构100可以包括终端设备101、102、软件103,网络104和服务器105。网络104用以在终端设备101、102和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102通过网络104与服务器105交互,以接收或发送软件测试消息等。终端设备101、102上可以安装有各种软件103,即通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备101、102可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101或102所安装的各种软件103进行源代码提供质量管理和监控支持的平台或后台管理服务器(仅为示例)。平台或后台管理服务豁可以对各种软件103等源代码进行质量分析和监控等处理,并将处理结果反馈给终端设备101或102。
需要说明的是,本公开实施例所提供的维护工作量的确定方法一般可以由服务器105执行。相应地,本公开实施例所提供的维护工作量的确定装置一般可以设置于服务器105中。本公开实施例所提供的维护工作量的确定方法也可以由不同于服务器105且能够与终端设备101、102和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的维护工作量的确定装置也可以设置于不同于服务器105且能够与终端设备101、102和/或服务器105通信的服务器或服务器集群中。
应该理解,图1中的终端设备、软件、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、软件、网络和服务器。
图2示意性示出了根据本公开实施例的维护工作量的确定方法的流程图。如图2所示,该确定方法200可以包括操作S210~操作S230。
在操作S210,确定目标源代码的数量值。
根据本公开的实施例,目标源代码为目标软件的源代码中需要进行维护的源代码。目标软件可以是开源软件,即开放源代码的软件,由于公众可以不受许可证的限制使用、修改其源代码,所以对其必须付出相应的维护工作。在本公开中目标源代码的数量值可以是需要进行维护的源代码的行数。
在操作S220,基于目标软件的源代码的代码问题度量值和目标软件的源代码的代码属性度量值,确定目标软件的软件质量问题值。
根据本公开的实施例,代码问题度量值用于度量目标软件的源代码的代码质量,代码问题度量值越大,表明源代码的质量越差,代码问题度量值越小,表明源代码的质量越好。
根据本公开的实施例,代码属性度量值用于度量目标软件的源代码的代码属性,代码属性度量值越大,表明源代码的质量越好,代码属性度量值越小,表明源代码的质量越差。
根据本公开的实施例,可以为代码问题度量值和代码属性度量值分别设置对应的权重值,再对代码问题度量值和代码属性度量值进行加权求和,预测得到目标软件的软件质量问题值,即质量问题率。
在操作S230,根据目标源代码的数量值和软件质量问题值,确定目标软件的维护工作量。
根据本公开的实施例,分别从代码质量和代码属性角度,确定目标软件的软件质量问题值,可以避免极端性,使得软件质量问题值的确定更加客观准确。各种表征代码质量以及代码相关性质的指标和指标值,对指标进行筛选、规整,建立代码问题度量值、代码属性度量值与软件质量问题值之间的关系式,避免由于预测指标的单一性导致预测结果的极端性。
通过本公开的实施例,在确定目标软件的软件质量问题值时是基于目标软件的源代码的代码问题度量值和目标软件的源代码的代码属性度量值确定的,最终结合目标源代码的数量值来确定目标软件的维护工作量,使得维护工作量的确定过程中既考虑目标软件的代码问题,又考虑代码属性,因此维护工作量的确定方法兼顾通用性和针对性,增强确定方法的针对性,提高维护工作量的预测准确度。
相关技术中,软件维护工作在软件工程中占有重要地位,许多人在此领域进行研究并创建了一系列预测模型,现阶段的预测模型大多依据传统的通用模型,这些传统的模型由于注重模型的通用性,因而对不同类型软件维护工作评估的针对性不够强,无法很好反映不同类型软件的特点;另一方面,传统的软件评估模型存在指标难以量化的问题,实际评估过程的可操作性不强。
作为一种可选的实施例,该方法还可以包括:获取m个代码问题度量指标,其中,m个代码问题度量指标用于作为对源代码问题进行度量的度量依据,m为正整数,针对目标软件的源代码,获得m个代码问题度量指标值,其中,m个代码问题度量指标值与m个代码问题度量指标一一对应,获得m个代码问题度量指标权重值,其中,m个代码问题度量指标权重值与m个代码问题度量指标一一对应,以及基于m个代码问题度量指标值和m个代码问题度量指标权重值,确定目标软件的源代码的代码问题度量值。
作为一种可选的实施例,代码问题度量指标包括以下至少之一:提示问题层级、次要问题层级、主要问题层级、严重问题层级以及阻断问题层级。
根据本公开的实施例,对源代码问题进行度量的度量依据可以是问题层级,问题层级可以包括但不限于Info(提示)、Minor(次要)、Major(主要)、Critical(严重)以及Blocker(阻断)。需要说明的是,问题层级越高,软件存在漏洞的概率存在上升趋势,因此为了提高代码问题度量值的精准程度,可以为不同的问题层级设置不同的权重值。以m=5为例,可以确定分别与这5个代码问题度量指标对应的问题数指标值,形成问题数指标值集合{M,N,X,Y,Z},其中与代码问题度量指标Info(提示)对应的问题数指标值为M,与代码问题度量指标Minor(次要)对应的问题数指标值为N,与代码问题度量指标Major(主要)对应的问题数指标值为X,与代码问题度量指标Critical(严重)对应的问题数指标值为Y,与代码问题度量指标Blocker(阻断)对应的问题数指标值为Z。获取分别与其对应的m个代码问题度量指标值,分别赋予对应的权重值。可选地,可以以等差数列作为与各个代码问题度量指标对应的权重值,目标软件的源代码的代码问题度量值可以依据公式1计算确定。
Q=(M+2×N+3×X+4×Y+5×Z)/t (公式1)
其中,Q表示代码问题度量值,t=M+N+X+Y+Z,t表示目标软件的源代码中存在的问题数的总数,M~Z分别表示问题层级从Info(提示)~Blocker(阻断)的问题数指标值。
可以理解的是,由上述公式1可以得知:如果某开源软件在各个问题级别均未存在相应问题数,此时Q=0;如果某开源软件在某一个问题层级存在问题数,或者在多个问题层级存在问题数,此时1≤Q≤5。
作为一种可选的实施例,可以通过开源的代码质量管理平台获得与m个代码问题度量指标一一对应的m个代码问题度量指标值。可选地,开源的代码质量管理平台可以是传统的代码静态检测工具如PMD,Findbugs,也可以是对传统的代码静态检测工具进行整合的Sonar代码质量管理平台,其可以支持包括java,C#,C/C++,PL/SQL,Cobol,JavaScrip,Groovy等二十余种编程语言的代码质量管理与检测以及持续的代码质量审查。通过Sonar代码质量管理平台,对目标软件的源代码进行全面扫描,可以得到的各问题层级信息与问题数。需要说明的是,本公开对代码问题度量指标的获取方法不做限定。
通过本公开的实施例,针对m个代码问题度量指标,获取分别与其对应的m个代码问题度量指标值,分别赋予对应的权重值,可以量化目标软件的代码问题,为维护工作量的确定提供与目标软件自身相关的代码质量数据,在维护工作量与目标软件本身之间建立关联性,提高确定方法的针对性。
作为一种可选的实施例,该方法还可以包括:获取n个代码质量度量指标,其中,n个代码质量度量指标用于作为对代码属性进行度量的度量依据,n为正整数,获得p个样本软件的源代码,其中,p为正整数,针对每个样本软件的源代码,获得p个代码质量度量指标值,其中,p个代码质量度量指标值与p个代码质量度量指标一一对应,基于与每个样本软件的源代码对应的p个代码质量度量指标值和n个代码质量度量指标,生成代码质量度量指标矩阵,以及基于代码质量度量指标矩阵,确定目标软件的源代码的代码属性度量值。
作为一种可选的实施例,可以通过开源的代码质量管理平台获得与n个代码质量度量指标一一对应的n个代码质量度量指标值。可选地,开源的代码质量管理平台可以是传统的代码静态检测工具如PMD,Findbugs,也可以是对传统的代码静态检测工具进行整合的Sonar代码质量管理平台。通过Sonar代码质量管理平台,对每个样本软件的源代码进行全面扫描,可以得到与n个代码质量度量指标一一对应的n个代码质量度量指标值。需要说明的是,本公开对代码质量度量指标值的获取方法不做限定。
作为一种可选的实施例,代码质量度量指标包括以下至少之一:代码覆盖率、代码重复率、代码注释率、代码复杂度、代码认知复杂度以及代码可维护性。
根据本公开的实施例,代码覆盖率(Code Coverage)是软件测试中的度量,描述程序中源代码被测的比例和程度。代码重复率指的是那些彼此相似或者完全相同的代码片段,用于表征代码重复行数(Duplicated)。重复代码在所有的软件中都是很常见的,它也是使得软件的维护成本高昂的原因之一,大量的重复代码会导致运行时间的急剧增加。代码注释率(Comment lines)在源代码中占有重要地位,包括代码的可维护性,网站打开速度等。过少的代码注释会严重影响维护人员对源代码的理解,并且由维护带来的隐藏缺陷也会由此增加。过多的代码注释有可能影响软件的运行速度(例如页面的代码注释),在本公开中代码注释率为注释行数与代码行数的比值。代码复杂度也称为程序圈复杂度,表示程序流中的不同代码的路径数,圈复杂度数值越高,代码的流程越复杂,其存在的风险越高。代码认知复杂度表示代码的理解难度。代码可维护性表示代码是否可维护。
通过本公开的实施例,提供多维度的代码质量度量指标来确定代码属性度量值,可以适应不同软件、不同需求的软件维护工作,适用性和针对性都得以满足。
根据本公开的实施例,针对n个代码质量度量指标,分别获取p个样本软件中每个样本软件的源代码所对应的代码质量度量指标的指标值,生成代码质量度量指标值集合{A1,A2,...,An},每个元素An中包括p个代码质量度量指标值,将p组数据中同一代码质量度量指标对应的指标值以矩阵形式保存,得到如下矩阵。需要说明的是,可以随机选用p个开源软件的源代码。
A1=[A11,A12,..,A1p]
A2=[A21,A22,..,A2p]…
An=[An1,An2,...,Anp]
其中,An为指标值集合的元素,表示代码质量度量指标值集合中的第n个代码质量度量指标,Anp为第p个样本软件的源代码对应于第n个代码质量度量指标的指标值。例如A22为第2个样本软件对应于代码重复率的指标值。以n=6(代码质量度量指标包括代码覆盖率、代码重复率、代码注释率、代码复杂度、代码认知复杂度以及代码可维护性)为例,可以基于获取的与6个代码质量度量指标对应的指标值集合的元素,构成代码质量度量指标值集合{A1,A2,A3,A4,A5,A6},其中,A1为与代码覆盖率对应的元素,A2为与代码重复率对应的元素,A3为与代码注释率对应的元素,A4为与代码复杂度对应的元素,A5为与代码认知复杂度对应的元素,A6为与代码可维护性对应的元素。以p=3为例,每组元素都包括对应于3个样本软件的同一代码质量度量指标值。
通过本公开的实施例,利用与每个样本软件的源代码对应的p个代码质量度量指标值和n个代码质量度量指标,生成代码质量度量指标矩阵,提取不同样本软件的代码质量度量指标之间的相互关系,将代码质量度量指标之间的关联关系定量化,提高的代码问题度量值的准确性。
作为一种可选的实施例,基于代码质量度量指标矩阵,确定目标软件的源代码的代码属性度量值可以包括:基于代码质量度量指标矩阵,依次检测是否存在可融合的代码质量度量指标,若存在,则按照预设融合规则,融合可融合的代码质量度量指标,并获得代码质量度量指标的融合结果,以及基于代码质量度量指标的融合结果,确定目标软件的源代码的代码属性度量值。
为了减少代码属性度量值的多重判断,更加准确地评估代码质量,根据本公开的实施例,针对前述生成的代码质量度量指标矩阵,还需要进一步判断n个代码质量度量指标中是否存在多重共线性的指标,即是否存在需要融合的代码质量度量指标,将相关联的代码质量度量指标进行相应的融合。按照代码质量度量指标值集合中代码质量度量指标之间的前后顺序,依次检测是否存在可融合的代码质量度量指标。最终得到融合结果包括融合后的代码质量度量指标和互不关联的代码质量度量指标。
例如,代码质量度量指标值集合为{A1,A2,A3},包括3个代码质量度量指标分别为A1、A2和A3。具体实施时,可以先检测代码质量度量指标A1和A2之间是否存在相关关系,若存在,则对代码质量度量指标A1和A2进行融合,得到融合之后的代码质量度量指标A1A2。接着检测代码质量度量指标A1A2和A3之间是否存在相关关系,若存在,则对代码质量度量指标A1A2和A3进行融合,得到融合之后的代码质量度量指标A1A2A3,此时最终得到融合结果包括代码质量度量指标A1A2A3。若不存在,则代码质量度量指标A1A2和A3作仍可以做为独立的代码质量度量指标进行处理,此时最终得到融合结果包括融合后的代码质量度量指标A1A2和互不关联的代码质量度量指标A3。若代码质量度量指标A1和A2之间不存在相关关系,则代码质量度量指标A1和A2作仍可以做为独立的代码质量度量指标进行处理。接着检测代码质量度量指标A2和A3之间是否存在相关关系,若存在,则对代码质量度量指标A2和A3进行融合,得到融合之后的代码质量度量指标A2A3,此时最终得到融合结果包括互不关联的代码质量度量指标A1和融合后的代码质量度量指标A2A3。若不存在,则代码质量度量指标A2和A3作仍可以做为独立的代码质量度量指标进行处理,此时最终得到融合结果包括互不关联的代码质量度量指标A1、A2和A3。
具体实施时,可以针对两两代码质量度量指标值计算对应的相关系数,可选地相关系数可以通过计算各个维度偏离其均值的程度来衡量。预设融合规则可以根据相关系数的具体数值设定。
作为一种可选的实施例,以协方差系数(cov)为例,利用公式2可以得到代码质量度量指标A1与A2的相关系数cov(A1,A2)。
其中A1i表示代码质量度量指标值集合中第1个指标的第i个代码质量度量指标值,A2i表示代码质量度量指标值集合中第2个指标的第i个代码质量度量指标值,表示代码质量度量指标值集合中第1个指标的所有代码质量度量指标值的均值。
通过本公开的实施例,对检测到的可以融合的代码质量度量指标进行融合,可以减少代码质量度量指标值的多重判断,提高计算效率,避免多重共线性指标对工作量确定的干扰,更加准确的确定代码属性度量值,为软件维护工作量的确定提供准确性高的数据支持,有助于最终确定的维护工作量的准确性的提高。
在计算得出代码质量度量指标A1与A2的相关系数cov(A1,A2)之后,可以根据相关系数cov(A1,A2)确定对应的融合规则。作为一种可选的实施例,按照预设融合规则,融合可融合的代码质量度量指标包括:在可融合的代码质量度量指标为正相关的情况下,按照第一预设融合规则,融合可融合的代码质量度量指标,以及在可融合的代码质量度量指标为负相关的情况下,按照第二预设融合规则,融合可融合的代码质量度量指标,其中,第一预设融合规则和第二预设融合规则不同。
作为一种可选的实施例,如果相关系数cov(A1,A2)等于零,则表明代码质量度量指标A1和A2之间没有相关关系,此时代码质量度量指标A1和A2作仍可以做为独立的代码质量度量指标进行处理。
作为一种可选的实施例,如果相关系数cov(A1,A2)大于零,则表明代码质量度量指标A1和A2之间存在正相关关系,此时可以利用公式3对代码质量度量指标A1和A2进行融合。
作为一种可选的实施例,如果相关系数cov(A1,A2)小于零,则表明代码质量度量指标A1和A2之间存在负相关关系,此时可以利用公式4对代码质量度量指标A1和A2进行融合。
A1A2=1/2(A1+A2) (公式3)
A1A2=1/2|A1-A2| (公式4)
其中,A1A2表示代码质量度量指标A1和A2融合之后的融合指标。
根据本公开的实施例,利用最终得到融合结果(包括融合之后的代码质量度量指标和互不关联的代码质量度量指标)确定出的代码属性度量值和前述确定出的代码问题度量值即可以预测得到开源软件的质量问题率,即软件质量问题值。可选地,可以利用公式5,对代码属性度量值和代码问题度量值进行加权求值。
其中,a表示代码问题在目标软件的软件质量中所占权重值,b表示代码属性(软件各代码质量度量指标)在目标软件的软件质量中所占权重值,并且a+b=1,a或b可以根据历史数据进行线性回归评估计算得到,m表示融合之后的代码质量度量指标和互不关联的代码质量度量指标的总数。
通过本公开的实施例,不同的相关系数数值对应不同的融合规则,使得融合规则符合两两代码质量度量指标值之间的关联关系,进而更有针对性的对代码质量度量指标进行融合,提高融合结果的准确性。
作为一种可选的实施例,确定目标源代码的数量值包括:获得目标软件的源代码的总行数值,获得目标软件的源代码的代码注释率,获得目标软件的源代码的代码重复率,以及基于总行数值、代码注释率和代码重复率,确定目标源代码的数量值。
根据本公开的实施例,由于维护工作量与个人能力存在密切关系,而实际预测过程中无法得知开发人员的工作量以及工作时间,故在本公开中以目标软件的源代码的开发代码行数作为表征,利用获得的代码行数(line)、代码注释率(comment)以及代码重复率(cover)来衡量目标源代码的数量值。
Cost=line×(1-comment-cover) (公式6)
最后根据Y=C×Cost可求得目标软件的维护工作量Y,以预测得到的需要维护的代码行数作为衡量,后续可以根据开发人员的开发效率等条件来获得目标软件的真正的维护工作量(人·日),此处不再赘述。
通过本公开的实施例,根据代码行数、代码注释率以及代码重复率来衡量目标源代码的数量值,可以对目标源代码的数量值进行量化,克服相关技术中无法得知开发人员的工作量以及工作时间的问题。
为了便于理解,以下将以代码质量管理监控平台为Sonar,目标软件为开源软件poi-3.10.1,样本软件为开源软件log4j-1.2.17、commons-io-2.6以及commons-net-3.5为例,对通过Sonar代码质量管理平台,提供一种基于机器学习的开源软件的维护工作量的确定方法进行详细阐述。
具体实施时,通过Sonar代码质量管理平台,一方面对目标软件的源代码进行全面扫描,得到目标软件的源代码中存在的各问题层级信息与问题数。另一方面对样本软件的源代码进行全面扫描,获得样本软件分别与6个代码质量度量指标(代码覆盖率、代码重复率、代码注释率、代码复杂度、代码认知复杂度以及代码可维护性)对应的代码质量度量指标值,将存在关联关系的代码质量度量指标进行相应的融合,减少代码质量度量指标值的多重判断,使得代码质量度量指标可以更加准确评估源代码的代码质量,通过多方面指标结合预测得到目标软件的软件质量问题值,从而确定目标软件的维护工作量。可以理解的是,该示例并非对维护工作量确定方法的限定。
图3示意性示出了根据本公开另一实施例的维护工作量的确定方法的流程图。如图3所示,该确定方法300可以包括操作S310~操作S390。
在操作S310,扫描开源软件代码。具体实施时,通过代码质量管理监控平台Sonar全面开源软件代码,开源软件代码包括目标软件的源代码和样本软件的源代码。
在操作S320,获取代码问题度量指标和对应的代码问题度量指标值集合。具体实施时,通过代码质量管理监控平台Sonar全面扫描开源软件poi-3.10.1的源代码,可以得到代码问题度量指标和代码问题度量指标值。代码问题度量指标包括问题层级Info(提示)、Minor(次要)、Major(主要)、Critical(严重)、Blocker(阻断)对应的问题数指标值集合{99,3100,2600,1400,176},其中与代码问题度量指标Info(提示)对应的问题数指标值M=99,与代码问题度量指标Minor(次要)对应的问题数指标值N=3100,与代码问题度量指标Major(主要)对应的问题数指标值X=2600,与代码问题度量指标Critical(严重)对应的问题数指标值Y=1400,与代码问题度量指标Blocker(阻断)对应的问题数指标值Z=176。
在操作S330,计算问题层级问题数对应的软件质量问题Q。具体实施时,根据扫描获得的代码问题度量指标和代码问题度量指标值构成的问题数指标值集合,可以确定目标软件的源代码中存在的问题总数t=99+3100+2600+1410+176=7375,接着根据前述公式1(Q=(99+2×3100+3×2600+4×1400+5×176)/7375≈2.7904)计算得到目标软件的源代码的代码问题度量值Q为2.7904。
在操作S340,获取代码属性度量指标和对应代码属性度量指标值。具体实施时,通过代码质量管理监控平台Sonar全面扫描开源软件log4j-1.2.17、commons-io-2.6以及commons-net-3.5,可以获取代码质量度量指标和代码质量度量指标值,包括代码覆盖率、代码重复率、代码注释率、代码复杂度、代码认知复杂度以及代码可维护性,共同构成代码质量度量指标值集合,构成代码质量度量指标值集合{A1,A2,A3,A4,A5,A6},其中,A1为与代码覆盖率对应的元素,A2为与代码重复率对应的元素,A3为与代码注释率对应的元素,A4为与代码复杂度对应的元素,A5为与代码认知复杂度对应的元素,A6为与代码可维护性对应的元素
根据代码质量度量指标值集合,对样本软件对应的3组数据中同一代码质量度量指标对应的代码质量度量指标值以矩阵形式保存,得到如下矩阵:
A1=[0,0,0]
A2=[0.08,0.044,0.047]
A3=[0.318,0.276,0.286]
A4=[0.3736,0.1811,0.2821]
A5=[0.2994,0.1202,0.1876]
A6=[0.025,0.02,0.015]
在操作S350,求取代码属性度量指标间的协方差系数cov。
在操作S360,判断cov是否等于0。如果不等于0,则执行操作S370,根据正负对两指标进行融合。如果等于0,则执行操作S380,
结合Q求得最终质量系数
表1
具体实施时,依次上述代码质量度量指标值矩阵,求取两两代码质量度量指标计算的相关程度,由于A1元素均为0,故与其他指标集合计算结果均为0,此时忽略此集合,得到表1所示的融合结果。如
表1所示,最终得到的代码质量度量指标的融合结果为:
若扫描目标软件获得的与代码质量度量指标对应的代码质量度量指标值为[00.055 0.315 16488/84939 9013/84939 0.021]T,则利用上述代码质量度量指标的融合结果可以确定目标软件的源代码的代码属性度量值A=0.08442。
具体实施时,根据操作S330计算得到的问题层级问题数对应的软件质量问题Q,以及目标软件的源代码的代码属性度量值A,根据公式5可以确定目标软件的最终质量系数为:
其中,a可由历史数据进行线性回归评估计算得到。
在操作S390,求得需维护的代码行数表征的维护工作量。
具体实施时,根据公式6可以确定目标软件的维护工作量为:
Y=(0.08442+0.47366×a)×Cost (公式9)
通过本公开的实施例,通过结合Sonar代码质量平台对开源软件进行全面扫描,得到各种表征代码质量以及代码相关性质的指标和指标值,对指标进行筛选、规整,建立指标与软件代码质量之间的关系式,避免指标的极端性。进一步地,上述涉及的各项指标以及特性通过平台即可获得,容易获取,并且指标较为齐全,对于各不同类型开源软件均适合。
图4示意性示出了根据本公开实施例的维护工作量的确定装置的框图。如图4所示,该确定装置400可以包括目标代码数量值确定模块410、软件质量问题值确定模块420以及维护工作量确定模块430。
目标代码数量值确定模块410,用于确定目标源代码的数量值,该目标源代码为目标软件的源代码中需要进行维护的源代码。可选地,目标代码数量值确定模块410例如可以用于执行图2描述的操作S210,在此不再赘述。
软件质量问题值确定模块420,用于基于目标软件的源代码的代码问题度量值和目标软件的源代码的代码属性度量值,确定目标软件的软件质量问题值。可选地,软件质量问题值确定模块420例如可以用于执行图2描述的操作S220,在此不再赘述。
维护工作量确定模块430,用于根据目标源代码的数量值和软件质量问题值,确定目标软件的维护工作量。可选地,维护工作量确定模块430例如可以用于执行图2描述的操作S230,在此不再赘述。
作为一种可选的实施例,前述装置还可以包括:代码问题度量指标获取模块,用于获取m个代码问题度量指标,其中,m个代码问题度量指标用于作为对源代码问题进行度量的度量依据,m为正整数,代码问题度量指标值获取模块,用于针对目标软件的源代码,获得m个代码问题度量指标值,其中,m个代码问题度量指标值与m个代码问题度量指标一一对应,代码问题度量指标权重值获取模块,用于获得m个代码问题度量指标权重值,其中,m个代码问题度量指标权重值与m个代码问题度量指标一一对应,以及代码问题度量值确定模块,用于基于m个代码问题度量指标值和m个代码问题度量指标权重值,确定目标软件的源代码的代码问题度量值。
作为一种可选的实施例,前述代码问题度量指标可以包括以下至少之一:提示问题层级、次要问题层级、主要问题层级、严重问题层级以及阻断问题层级。
作为一种可选的实施例,前述装置还可以包括:代码质量度量指标获取模块,用于获取n个代码质量度量指标,其中,n个代码质量度量指标用于作为对代码属性进行度量的度量依据,n为正整数,样本软件源代码获得模块,用于获得p个样本软件的源代码,其中,p为正整数,代码质量度量指标值获取模块,用于针对每个样本软件的源代码,获得p个代码质量度量指标值,其中,p个代码质量度量指标值与p个代码质量度量指标一一对应,代码质量度量指标矩阵生成模块,用于基于与每个样本软件的源代码对应的p个代码质量度量指标值和n个代码质量度量指标,生成代码质量度量指标矩阵,以及代码属性度量值确定模块,用于基于代码质量度量指标矩阵,确定目标软件的源代码的代码属性度量值。
作为一种可选的实施例,前述代码属性度量值确定模块可以包括:代码质量度量指标检测子模块,用于基于代码质量度量指标矩阵,依次检测是否存在可融合的代码质量度量指标,代码质量度量指标融合子模块,用于若存在,则按照预设融合规则,融合可融合的代码质量度量指标,并获得代码质量度量指标的融合结果,以及代码属性度量值确定子模块,用于基于代码质量度量指标的融合结果,确定目标软件的源代码的代码属性度量值。
作为一种可选的实施例,前述代码质量度量指标融合子模块可以包括:代码质量度量指标第一融合单元,用于在可融合的代码质量度量指标为正相关的情况下,按照第一预设融合规则,融合可融合的代码质量度量指标,以及代码质量度量指标第二融合单元,用于在可融合的代码质量度量指标为负相关的情况下,按照第二预设融合规则,融合可融合的代码质量度量指标,其中,第一预设融合规则和第二预设融合规则不同。
作为一种可选的实施例,前述代码质量度量指标可以包括以下至少之一:代码覆盖率、代码重复率、代码注释率、代码复杂度、代码认知复杂度以及代码可维护性。
作为一种可选的实施例,前述目标代码数量值确定模块可以包括:总行数值获得子模块,用于获得目标软件的源代码的总行数值,代码注释率获得子模块,用于获得目标软件的源代码的代码注释率,代码重复率获得子模块,用于获得目标软件的源代码的代码重复率,以及目标代码数量值确定子模块,用于基于总行数值、代码注释率和代码重复率,确定目标源代码的数量值。
图5示意性示出了根据本公开另一实施例的维护工作量的确定装置的框图。如图5所示,该确定装置500可以包括开源代码扫描模块510、指标集合获取模块520、指标融合处理模块530以及维护工作量预测输出模块540。
开源代码扫描模块510,用于扫描开源软件代码。可选地,开源代码扫描模块510例如可以用于执行图3描述的操作S310,在此不再赘述。
指标集合获取模块520,用于获取代码问题度量指标和对应的指标值集合以及获取代码属性度量指标对应指标值。可选地,指标集合获取模块520例如可以用于执行图3描述的操作S320以及操作S340,在此不再赘述。
指标融合处理模块530,用于计算问题层级问题数对应的软件质量问题Q,求取指标间协方差系数cov,判断cov是否等于0,以及根据正负对两指标进行融合。可选地,指标融合处理模块530例如可以用于执行图3描述的操作S330、操作S350、操作S360以及操作S370,在此不再赘述。
维护工作量预测输出模块540,用于结合Q求得最终质量系数以及求得需维护的代码行数表征的维护工作量。可选地,维护工作量预测输出模块540例如可以用于执行图3描述的操作S380以及操作S390,在此不再赘述。
需要说明的是,维护工作量的确定装置部分实施例中各模块的实施方式、解决的技术问题、实现的功能、以及达到的技术效果分别与维护工作量的确定方法部分实施例中各对应的步骤的实施方式、解决的技术问题、实现的功能、以及达到的技术效果相同或类似,在此不再赘述。
根据本公开的实施例的模块、子模块、单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FNGA)、可编程逻辑阵列(NLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
例如,目标代码数量值确定模块、软件质量问题值确定模块、维护工作量确定模块、代码问题度量指标获取模块,代码问题度量指标值获取模块,代码问题度量指标权重值获取模块,代码问题度量值确定模块,代码质量度量指标获取模块,样本软件源代码获得模块,代码质量度量指标值获取模块,代码质量度量指标矩阵生成模块,生成代码质量度量指标矩阵,代码属性度量值确定模块,代码质量度量指标检测子模块,代码质量度量指标融合子模块,代码属性度量值确定子模块,代码质量度量指标第一融合单元,代码质量度量指标第二融合单元,总行数值获得子模块,代码注释率获得子模块,代码重复率获得子模块以及目标代码数量值确定子模块可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。Sonar开源代码扫描模块代码、指标集合获取模块、指标融合处理模块以及维护工作量预测输出模块可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,目标代码数量值确定模块、软件质量问题值确定模块、维护工作量确定模块、代码问题度量指标获取模块,代码问题度量指标值获取模块,代码问题度量指标权重值获取模块,代码问题度量值确定模块,代码质量度量指标获取模块,样本软件源代码获得模块,代码质量度量指标值获取模块,代码质量度量指标矩阵生成模块,生成代码质量度量指标矩阵,代码属性度量值确定模块,代码质量度量指标检测子模块,代码质量度量指标融合子模块,代码属性度量值确定子模块,代码质量度量指标第一融合单元,代码质量度量指标第二融合单元,总行数值获得子模块,代码注释率获得子模块,代码重复率获得子模块以及目标代码数量值确定子模块中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FNGA)、可编程逻辑阵列(NLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,目标代码数量值确定模块、软件质量问题值确定模块、维护工作量确定模块、代码问题度量指标获取模块,代码问题度量指标值获取模块,代码问题度量指标权重值获取模块,代码问题度量值确定模块,代码质量度量指标获取模块,样本软件源代码获得模块,代码质量度量指标值获取模块,代码质量度量指标矩阵生成模块,生成代码质量度量指标矩阵,代码属性度量值确定模块,代码质量度量指标检测子模块,代码质量度量指标融合子模块,代码属性度量值确定子模块,代码质量度量指标第一融合单元,代码质量度量指标第二融合单元,总行数值获得子模块,代码注释率获得子模块,代码重复率获得子模块以及目标代码数量值确定子模块中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
图6示意性示出了根据本公开实施例的适于实现上文描述的维护工作量的确定方法的计算机可读存储介质产品的示意图。
在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在设备上运行时,程序代码用于使设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施例的维护工作量的确定方法中的前述各项操作(或步骤),例如,电子设备可以执行如图2中所示的操作S210~操作S230。电子设备也可以执行如图3中所示的操作S310~操作S390。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、系统或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(ENROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
如图6所示,描述了根据本发明的实施方式的维护工作量确定的程序产品600,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在设备,例如个人电脑上运行。然而,本公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、系统或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、系统或者器件使用或者与其结合使用的程序。可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆,RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,程序设计语言包括面向对象的程序设计语言-诸如Java,C++等,还包括常规的过程式程序设计语言-诸如“C”,语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络——包括局域网(LAA)或广域网(WAA)一连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
图7示意性示出了根据本公开实施例的适于实现上文描述的维护工作量的确定方法的电子设备的框图。图7示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图7所示,根据本公开实施例的电子设备700包括处理器701,其可以根据存储在只读存储器(ROM)702中的程序或者从存储部分708加载到随机访问存储器(RAM)703中的程序而执行各种适当的动作和处理。处理器701例如可以包括通用微处理器(例如CNU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器701还可以包括用于缓存用途的板载存储器。处理器701可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 703中,存储有电子设备700操作所需的各种程序和数据。处理器701、ROM702以及RAM 703通过总线704彼此相连。处理器701通过执行ROM 702和/或RAM 703中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除ROM702和RAM 703以外的一个或多个存储器中。处理器701也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例图2中所示的操作S210~操作S230,也可以执行如图3中所示的操作S310~操作S390。
根据本公开的实施例,电子设备700还可以包括输入/输出(I/O)接口705,输入/输出(I/O)接口705也连接至总线704。系统700还可以包括连接至I/O接口705的以下部件中的一项或多项:包括键盘、鼠标等的输入部分706;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如LAA卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至I/O接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分708。
根据本公开的实施例,根据本公开实施例的方法流程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。在该计算机程序被处理器701执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、子模块、单元等可以通过计算机程序模块来实现。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的维护工作量的确定方法,包括图2中所示的操作S210~操作S230。电子设备也可以执行如图3中所示的操作S310~操作S390。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(ENROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM 702和/或RAM 703和/或ROM 702和RAM 703以外的一个或多个存储器。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目标,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。
Claims (12)
1.一种维护工作量的确定方法,包括:
确定目标源代码的数量值,其中,所述目标源代码为目标软件的源代码中需要进行维护的源代码;
基于所述目标软件的源代码的代码问题度量值和所述目标软件的源代码的代码属性度量值,确定所述目标软件的软件质量问题值;
根据所述目标源代码的数量值和所述软件质量问题值,确定所述目标软件的维护工作量。
2.根据权利要求1所述的方法,其中,所述方法还包括:
获取m个代码问题度量指标,其中,所述m个代码问题度量指标用于作为对源代码问题进行度量的度量依据,m为正整数;
针对所述目标软件的源代码,获得m个代码问题度量指标值,其中,所述m个代码问题度量指标值与所述m个代码问题度量指标一一对应;
获得m个代码问题度量指标权重值,其中,所述m个代码问题度量指标权重值与所述m个代码问题度量指标一一对应;
基于所述m个代码问题度量指标值和所述m个代码问题度量指标权重值,确定所述目标软件的源代码的代码问题度量值。
3.根据权利要求2所述的方法,其中,所述代码问题度量指标包括以下至少之一:提示问题层级、次要问题层级、主要问题层级、严重问题层级以及阻断问题层级。
4.根据权利要求1所述的方法,其中,所述方法还包括:
获取n个代码质量度量指标,其中,所述n个代码质量度量指标用于作为对代码属性进行度量的度量依据,n为正整数;
获得p个样本软件的源代码,其中,p为正整数;
针对每个样本软件的源代码,获得p个代码质量度量指标值,其中,所述p个代码质量度量指标值与所述p个代码质量度量指标一一对应;
基于与所述每个样本软件的源代码对应的p个代码质量度量指标值和所述n个代码质量度量指标,生成代码质量度量指标矩阵;
基于所述代码质量度量指标矩阵,确定所述目标软件的源代码的代码属性度量值。
5.根据权利要求4所述的方法,其中,所述基于所述代码质量度量指标矩阵,确定所述目标软件的源代码的代码属性度量值包括:
基于所述代码质量度量指标矩阵,依次检测是否存在可融合的代码质量度量指标;
若存在,则按照预设融合规则,融合所述可融合的代码质量度量指标,并获得代码质量度量指标的融合结果;
基于所述代码质量度量指标的融合结果,确定所述目标软件的源代码的代码属性度量值。
6.根据权利要求5所述的方法,其中,所述按照预设融合规则,融合所述可融合的代码质量度量指标包括:
在所述可融合的代码质量度量指标为正相关的情况下,按照第一预设融合规则,融合所述可融合的代码质量度量指标;
在所述可融合的代码质量度量指标为负相关的情况下,按照第二预设融合规则,融合所述可融合的代码质量度量指标,其中,所述第一预设融合规则和所述第二预设融合规则不同。
7.根据权利要求4所述的方法,其中,所述代码质量度量指标包括以下至少之一:代码覆盖率、代码重复率、代码注释率、代码复杂度、代码认知复杂度以及代码可维护性。
8.根据权利要求1所述的方法,其中,所述确定目标源代码的数量值包括:
获得所述目标软件的源代码的总行数值;
获得所述目标软件的源代码的代码注释率;
获得所述目标软件的源代码的代码重复率;
基于所述总行数值、所述代码注释率和所述代码重复率,确定目标源代码的数量值。
9.一种维护工作量的确定装置,包括:
目标代码数量值确定模块,用于确定目标源代码的数量值,其中,所述目标源代码为目标软件的源代码中需要进行维护的源代码;
软件质量问题值确定模块,用于基于所述目标软件的源代码的代码问题度量值和所述目标软件的源代码的代码属性度量值,确定所述目标软件的软件质量问题值;
维护工作量确定模块,用于根据所述目标源代码的数量值和所述软件质量问题值,确定所述目标软件的维护工作量。
10.一种电子设备,包括:
一个或多个处理器;以及
存储器,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至8中任一项所述的方法。
11.一种计算机可读存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现权利要求1至8中任一项所述的方法。
12.一种计算机程序产品,包括计算机可读指令,其中,所述计算机可读指令被执行时用于执行根据权利要求1至8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110133182.XA CN112799712B (zh) | 2021-01-29 | 2021-01-29 | 维护工作量的确定方法、装置、设备、介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110133182.XA CN112799712B (zh) | 2021-01-29 | 2021-01-29 | 维护工作量的确定方法、装置、设备、介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112799712A true CN112799712A (zh) | 2021-05-14 |
CN112799712B CN112799712B (zh) | 2024-02-02 |
Family
ID=75813208
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110133182.XA Active CN112799712B (zh) | 2021-01-29 | 2021-01-29 | 维护工作量的确定方法、装置、设备、介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112799712B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115345531A (zh) * | 2022-10-19 | 2022-11-15 | 平安银行股份有限公司 | 工作量的确定方法、装置、计算机设备及可读存储介质 |
CN116088934A (zh) * | 2023-04-10 | 2023-05-09 | 荣耀终端有限公司 | 一种软件开发工作量确定方法及服务器 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130152044A1 (en) * | 2011-12-07 | 2013-06-13 | Jürgen Salecker | Software Quality Evaluating System And Methods For Determining An Extent Of Software Code Changes |
CN104809066A (zh) * | 2015-04-30 | 2015-07-29 | 重庆大学 | 一种通过代码质量评估预测开源软件维护工作量的方法 |
CN108804323A (zh) * | 2018-06-06 | 2018-11-13 | 中国平安人寿保险股份有限公司 | 代码质量监控方法、设备及存储介质 |
CN111026433A (zh) * | 2019-12-23 | 2020-04-17 | 中国人民解放军国防科技大学 | 基于代码变更历史的软件代码质量问题自动修复方法、系统及介质 |
-
2021
- 2021-01-29 CN CN202110133182.XA patent/CN112799712B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130152044A1 (en) * | 2011-12-07 | 2013-06-13 | Jürgen Salecker | Software Quality Evaluating System And Methods For Determining An Extent Of Software Code Changes |
CN104809066A (zh) * | 2015-04-30 | 2015-07-29 | 重庆大学 | 一种通过代码质量评估预测开源软件维护工作量的方法 |
CN108804323A (zh) * | 2018-06-06 | 2018-11-13 | 中国平安人寿保险股份有限公司 | 代码质量监控方法、设备及存储介质 |
CN111026433A (zh) * | 2019-12-23 | 2020-04-17 | 中国人民解放军国防科技大学 | 基于代码变更历史的软件代码质量问题自动修复方法、系统及介质 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115345531A (zh) * | 2022-10-19 | 2022-11-15 | 平安银行股份有限公司 | 工作量的确定方法、装置、计算机设备及可读存储介质 |
CN116088934A (zh) * | 2023-04-10 | 2023-05-09 | 荣耀终端有限公司 | 一种软件开发工作量确定方法及服务器 |
CN116088934B (zh) * | 2023-04-10 | 2023-08-29 | 荣耀终端有限公司 | 一种软件开发工作量确定方法及服务器 |
Also Published As
Publication number | Publication date |
---|---|
CN112799712B (zh) | 2024-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Elberzhager et al. | Reducing test effort: A systematic mapping study on existing approaches | |
US20180046570A1 (en) | Development and production data based application evolution | |
US20190188605A1 (en) | Machine Learning Model Understanding As-A-Service | |
US9710257B2 (en) | System and method to map defect reduction data to organizational maturity profiles for defect projection modeling | |
US10318595B2 (en) | Analytics based on pipes programming model | |
US8719789B2 (en) | Measuring coupling between coverage tasks and use thereof | |
US8719799B2 (en) | Measuring coupling between coverage tasks and use thereof | |
CN109992498B (zh) | 测试用例的生成方法及系统、计算机系统 | |
US10169002B2 (en) | Automated and heuristically managed solution to quantify CPU and path length cost of instructions added, changed or removed by a service team | |
US20180253728A1 (en) | Optimizing fraud analytics selection | |
Toure et al. | Predicting different levels of the unit testing effort of classes using source code metrics: a multiple case study on open-source software | |
CN112799712B (zh) | 维护工作量的确定方法、装置、设备、介质 | |
US10346294B2 (en) | Comparing software projects having been analyzed using different criteria | |
US11237805B2 (en) | Techniques for automatically detecting programming deficiencies | |
CN115237804A (zh) | 性能瓶颈的评估方法、装置、电子设备、介质和程序产品 | |
US20120284695A1 (en) | Error simulation | |
CN117076280A (zh) | 策略生成方法及装置、电子设备和计算机可读存储介质 | |
US11681511B2 (en) | Systems and methods for building and deploying machine learning applications | |
CN114036054A (zh) | 代码质量评价方法、装置、设备、介质和程序产品 | |
CN113127362A (zh) | 对象测试方法、对象测试装置、电子设备及可读存储介质 | |
CN111858377A (zh) | 测试脚本的质量评价方法、装置、电子设备及存储介质 | |
CN115408223A (zh) | 项目质量预测方法、装置、计算机系统和存储介质 | |
CN114661605A (zh) | 软件测试方法、装置、电子设备、存储介质和程序产品 | |
CN115934041A (zh) | 策略信息生成方法、装置、设备及存储介质 | |
Bavand | The Impact of Parallel and Batch Testing in Continuous Integration Environments |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |