CN114489760A - 代码质量评价方法和代码质量评价装置 - Google Patents
代码质量评价方法和代码质量评价装置 Download PDFInfo
- Publication number
- CN114489760A CN114489760A CN202210148361.5A CN202210148361A CN114489760A CN 114489760 A CN114489760 A CN 114489760A CN 202210148361 A CN202210148361 A CN 202210148361A CN 114489760 A CN114489760 A CN 114489760A
- Authority
- CN
- China
- Prior art keywords
- code
- index data
- evaluated
- evaluation
- dimensions
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/70—Software maintenance or management
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Stored Programmes (AREA)
Abstract
本申请提供了一种代码质量评价方法和代码质量评价装置,涉及人工智能领域,可以提高代码质量评价的准确性。该方法可以包括:获取待评价代码的代码质量问题数据,代码质量问题数据是基于代码检查工具对待评价代码进行检查得到的;对代码质量问题数据进行预处理,得到多个维度的指标数据;将多个维度的指标数据输入至代码质量评价模型,得到待评价代码的评价结果,其中,代码质量评价模型是基于历史代码的多个维度的指标数据和历史代码的评价结果作为样本训练得到的。
Description
技术领域
本申请涉及人工智能领域,尤其涉及一种代码质量评价方法和代码质量评价质量。
背景技术
代码是按照一定的程序设计语言规范编写的、由字符和符号等组成的文本。随着程序项目开发的大型化和复杂化,一个程序项目往往由大量的代码构成,同时,程序项目代码的编写通常是由多个程序开发人员共同协作完成,存在很多影响代码质量的因素,如不同程序开发人员编写的代码的功能的衔接问题、编写风格的统一问题等。如何对编写的代码的质量进行评价成为了一个问题。
现有代码的质量评价是基于问题诊断和缺陷检测等维度的评价,例如AppScan和Fortify等安全代码审计工具,可以检测代码中的缺陷数量和风险等级,通过缺陷数量和风险等级评价代码的质量,会存在评价维度单一、评价不准确的问题。
发明内容
本申请提供了一种代码质量评价方法和代码质量评价装置,可以提高代码质量评价的准确性。
第一方面,本申请提供了一种代码质量评价方法,该方法包括:获取待评价代码的代码质量问题数据,代码质量问题数据是基于代码检查工具对待评价代码进行检查得到的;对代码质量问题数据进行预处理,得到多个维度的指标数据;将多个维度的指标数据输入至代码质量评价模型,得到待评价代码的评价结果,其中,代码质量评价模型是基于历史代码的多个维度的指标数据和历史代码的评价结果作为样本训练得到的。
本申请提供的代码质量评价方法,通过对代码质量问题数据进行预处理,得到多个维度的指标数据,相比直接利用代码质量问题数据进行评价,可以从更多的维度对代码质量进行评价,可以提高代码质量评价的准确性,同时,基于代码质量评价模型对多个维度的指标数据进行分析,得到评价结果,相比于人工进行评价,可以提高测试效率,也可以避免人工的评价误差,可以提高代码质量评价的准确性。
结合第一方面,在第一方面的某些实现方式中,上述多个维度包括:可靠性、安全性、可维护性、代码重复度以及可测性;其中,可靠性的指标数据包括有效代码行数、问题个数以及技术债比率,安全性的指标数据包括有效代码行数、漏洞个数以及技术债比率,可维护性的指标数据包括有效代码行数、成熟代码坏味道个数、注释行占比、平均认知复杂度以及技术债比率,代码重复度的指标数据包括重复代码行占比和重复代码块个数,可测性的指标数据包括有效代码行数、分支覆盖率以及平均方法圈复杂度。
结合第一方面,在第一方面的某些实现方式中,上述评价结果是基于多个维度的指标数据、多个维度的指标数据对应的权重、多个维度的指标数据对应的放大因子、以及多个维度中每个维度的偏置量得到的。
结合第一方面,在第一方面的某些实现方式中,上述待评价代码为X,代码质量评价模型通过下列公式表示:其中,f(X)表示待评价代码X的评价结果,xi,j表示待评价代码X的第i个维度的第j个指标数据,ωi,j为第i个维度的第j个指标数据的权重,λi,j第i个维度的第j个指标数据的放大因子,bi为第i个维度的偏置量,为映射函数。
结合第一方面,在第一方面的某些实现方式中,上述方法还包括:统计提交待评价代码的账户提交的多个代码的评价结果;在多个代码的评价结果中不满足质量评价条件的评价结果的数量累积超出第一预设阈值的情况下,发送预警信息,预警信息用于提示管理员账户存在问题,质量评价条件为评价结果大于或等于第二预设阈值。
本申请实施例提供的代码质量评价方法,可以统计账户提交的代码不满足质量评价条件的数量,当超过一定次数时,发送预警信息,可以提示管理员账户存在问题,可以有效的规避风险等级高的账户。
第二方面,本申请提供了一种代码质量评价装置,该装置包括:获取模块和处理模块。获取模块用于:获取待评价代码的代码质量问题数据,代码质量问题数据是基于代码检查工具对待评价代码进行检查得到的;处理模块用于:对代码质量问题数据进行预处理,得到多个维度的指标数据;以及,将多个维度的指标数据输入至代码质量评价模型,得到待评价代码的评价结果,其中,代码质量评价模型是基于历史代码的多个维度的指标数据和历史代码的评价结果作为样本训练得到的。
结合第二方面,在第二方面的某些实现方式中,上述多个维度包括:可靠性、安全性、可维护性、代码重复度以及可测性;其中,可靠性的指标数据包括有效代码行数、问题个数以及技术债比率,安全性的指标数据包括有效代码行数、漏洞个数以及技术债比率,可维护性的指标数据包括有效代码行数、成熟代码坏味道个数、注释行占比、平均认知复杂度以及技术债比率,代码重复度的指标数据包括重复代码行占比和重复代码块个数,可测性的指标数据包括有效代码行数、分支覆盖率以及平均方法圈复杂度。
结合第二方面,在第二方面的某些实现方式中,上述评价结果是基于多个维度的指标数据、多个维度的指标数据对应的权重、多个维度的指标数据对应的放大因子、以及多个维度中每个维度的偏置量得到的。
结合第二方面,在第二方面的某些实现方式中,上述待评价代码为X,代码质量评价模型通过下列公式表示:其中,f(X)表示待评价代码X的评价结果,xi,j表示待评价代码X的第i个维度的第j个指标数据,ωi,j为第i个维度的第j个指标数据的权重,λi,j第i个维度的第j个指标数据的放大因子,bi为第i个维度的偏置量,为映射函数。
结合第二方面,在第二方面的某些实现方式中,上述装置还包括发送模块;处理模块还用于:统计提交待评价代码的账户提交的多个代码的评价结果;发送模块用于:在多个代码的评价结果中不满足质量评价条件的评价结果的数量累积超出第一预设阈值的情况下,发送预警信息,预警信息用于提示管理员账户存在问题,质量评价条件为评价结果大于或等于第二预设阈值。
第三方面,本申请提供了一种代码质量评价装置,包括处理器和存储器。该处理器用于读取存储器中存储的指令,以执行上述第一方面中任一种可能实现方式中的方法。
可选地,处理器为一个或多个,存储器为一个或多个。
可选地,存储器可以与处理器集成在一起,或者存储器与处理器分离设置。
在具体实现过程中,存储器可以为非瞬时性(non-transitory)存储器,例如只读存储器(read only memory,ROM),其可以与处理器集成在同一块芯片上,也可以分别设置在不同的芯片上,本申请实施例对存储器的类型以及存储器与处理器的设置方式不做限定。
上述第三方面中的代码质量评价装置可以是一个芯片,该处理器可以通过硬件来实现也可以通过软件来实现,当通过硬件实现时,该处理器可以是逻辑电路、集成电路等;当通过软件来实现时,该处理器可以是一个通用处理器,通过读取存储器中存储的软件代码来实现,该存储器可以集成在处理器中,可以位于该处理器之外,独立存在。
第四方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质有计算机程序(也可以称为代码,或指令)当其在计算机上运行时,使得计算机执行上述第一方面中任一种可能实现方式中的方法。
第五方面,本申请提供了一种计算机程序产品,计算机程序产品包括:计算机程序(也可以称为代码,或指令),当计算机程序被运行时,使得计算机执行上述第一方面中任一种可能实现方式中的方法。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1为本申请实施例的一种代码质量评价方法的示意性流程图;
图2为本申请实施例的一种代码质量评价结果的示意图;
图3为本申请实施例的一种代码质量评价报告的示意图;
图4为本申请实施例的另一种代码质量评价方法的示意性流程图;
图5为本申请实施例的一种代码质量评价装置的示意性框图;
图6为本申请实施例的另一种代码质量评价装置的示意性框图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
下面将结合附图,对本申请中的技术方案进行描述。需要说明的是,本申请提供的代码质量评价方法和代码质量评价装置可用于人工智能领域,也可用于除人工智能领域以外的任意领域。本申请提供的代码质量评价方法和代码质量评价装置对应用领域不作限定。
为了便于理解本申请实施例,首先对本申请实施例中的相关术语进行介绍。
1、DevOps
DevOps是Development和Operations的组合词,是一组过程、方法与系统的统称,用于促进开发(应用程序/软件工程)、技术运营和质量保障(Quality Assurance,QA)部门之间的沟通、协作与整合。DevOps可以用于软件产品和服务的交付。
2、AppScan
AppScan是一款应用程序安全测试工具,可以快速、准确以及敏捷的对应用程序进行安全性测试。
3、Fortify
Fortify是一款静态应用程序安全性测试产品,可供开发团队和安全专家分析源代码,检测安全漏洞,帮助开发人员更快更轻松地识别问题并排定问题优先级,然后加以解决。
4、程序可靠性
程序可靠性是指程序执行时,行为可以按照所定义的框架执行,内部的状态机包含错误处理方式与功能一致。
5、程序安全性
程序安全性是指程序不会引入或不会存在漏洞,不会发生被黑客或黑产组织利用造成客户信息泄露等信息安全事件。
6、程序可测性
程序可测性是指程序在给定的测试环境下,可支持测试的程度,原则应易于测试执行,有明确的可验证的输出。
目前,软件和应用程序等产品在进行产品交付时,都需要对产品的代码的质量进行评价,当代码的质量评价为通过时,产品交付完成,当代码的质量评价为不通过时,产品的开发人员需要对产品的代码进行优化以达到交付的要求。
常用的代码质量评价工具可以包括AppScan和Fortify等,代码质量评价工具可以检测代码中的缺陷数量和风险等级,通过缺陷数量和风险等级评价代码的质量,会存在评价维度单一、评价不准确的问题。
有鉴于此,本申请实施例提供了一种代码质量评价方法和代码质量评价装置,可以提高代码质量评价的准确性。
在介绍本申请实施例提供的代码质量评价方法和代码质量评价装置之前,先做出以下说明。
本申请实施例中的“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B的情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a、b和c中的至少一项(个),可以表示:a,或b,或c,或a和b,或a和c,或b和c,或a、b和c,其中a,b,c可以是单个,也可以是多个。
图1为本申请实施例提供的一种代码质量评价方法100的示意性流程图,该方法100可以由具有数据处理功能的任意数据处理设备执行。为便于描述,下面以数据处理设备为例进行说明。
如图1所示,该方法100可以包括如下步骤:
S101、获取待评价代码的代码质量问题数据,代码质量问题数据是基于代码检查工具对待评价代码进行检查得到的。
待评价代码的数量可以为一个,也可以为多个,本申请实施例对此不作限定。当待评价代码为多个时,可以用编号区分不同的待评价代码。
代码检查工具可以包括上述AppScan和Fortify,还可以包括Sonar、fingbugs、编程错误检测器(programming mistake detector,pmd)以及源代码分析套件(source codeanalysis suite,SCA)等等。
代码质量问题数据可以是基于一个代码检查工具对待评价代码进行检查得到的,也可以是基于多个代码检查工具对待评价代码进行检查得到的,本申请实施例不作限定。
代码质量问题数据可以包括有效代码行数、问题个数、技术债比率、漏洞个数、成熟代码坏味道个数、注释行占比、平均认知复杂度、重复代码行占比、重复代码块个数、分支覆盖率以及平均方法圈复杂度等等。应理解,本申请实施例对代码质量问题数据中具体的数据以及数据的数量不做限定。
S102、对代码质量问题数据进行预处理,得到多个维度的指标数据。
该多个维度可以包括可靠性、安全性、可维护性、代码重复度以及可测性。
数据处理设备可以对上述代码质量问题数据进行预处理,得到可靠性、安全性、可维护性、代码重复度以及可测性的指标数据。
可选地,数据处理设备可以根据不同的维度和不同维度的指标数据,建立维度和指标数据的对应关系,该对应关系可以是以阵列、表格或者文字的形式表示的,本申请实施例对此不作限定。
示例性地,维度和指标数据的对应关系可以以表格的形式表示,如表一所示。
表一
如表一所示,可靠性的指标数据可以包括有效代码行数、问题个数以及技术债比率,安全性的指标数据可以包括有效代码行数、漏洞个数以及技术债比率,可维护性的指标数据可以包括有效代码行数、成熟代码坏味道个数、注释行占比、平均认知复杂度以及技术债比率,代码重复度的指标数据可以包括重复代码行占比和重复代码块个数,可测性的指标数据可以包括有效代码行数、分支覆盖率以及平均方法圈复杂度。
数据处理设备获取代码质量问题数据后,可以根据上述表一所示的对应关系,将代码质量问题数据划分到对应的维度(即为预处理),得到多个维度的指标数据。
S103、将多个维度的指标数据输入至代码质量评价模型,得到待评价代码的评价结果,其中,代码质量评价模型是基于历史代码的多个维度的指标数据和历史代码的评价结果作为样本训练得到的。
代码质量评价模型是基于大量历史样本数据训练得到的,数据处理设备可以将多个维度的指标数据输入至代码质量评价模型,得到待评价代码的评价结果。
可选地,上述代码质量评价模型可以是基于多个维度的指标数据、多个维度的指标数据对应的权重、多个维度的指标数据对应的放大因子、以及多个维度中每个维度的偏置量得到的。
数据处理设备可以基于大量历史样本数据训练得到多个维度的指标数据对应的权重、多个维度的指标数据对应的放大因子、以及多个维度中每个维度的偏置量。
具体地,数据处理设备可以将历史代码的多个维度的指标数据作为初始模型的输入,将根据经验得到的评价结果(即历史代码的评价结果)作为初始模型的输出,对初始模型进行训练,得到模型的参数,即多个维度的指标数据对应的权重、多个维度的指标数据对应的放大因子、以及多个维度中每个维度的偏置量,并对该参数进行正交分布验证,直至参数满足正交分布,确定参数的准确性后,得到代码质量评价模型。
应理解,上述初始模型可以是任意的机器学习模型或者神经网络模型,本申请实施例对此不作限定。在一种可能的实现方式中,初始模型可以是循环神经网络(recurrentneural network,RNN)。
可选地,数据处理设备通过代码质量评价模型进行评价时,数据处理设备可以保存代码质量评价模型的输入和输出,并将其作为训练数据,继续优化代码质量评价模型的参数,进而达到优化代码质量评价模型的目的。
可选地,数据处理设备可以定时优化代码质量评价模型,也可以在训练数据达到一定规模时优化代码质量评价模型,本申请实施例对具体优化的时间以及训练数据的具体规模不作限定。应理解,本申请实施例并不限于此。
在交付场景中,例如,DevOps,评价结果为通过,则交付成功,若评价结果未通过,则交付成失败,程序开发人员需要对代码进行优化,故该方法可以作为交付的门禁,确保代码质量达到相关的标准。
本申请实施例提供的代码质量评价方法,通过对代码质量问题数据进行预处理,得到多个维度的指标数据,相比直接利用代码质量问题数据进行评价,可以从更多的维度对代码质量进行评价,可以提高代码质量评价的准确性,同时,基于代码质量评价模型对多个维度的指标数据进行分析,得到评价结果,相比于人工进行评价,可以提高测试效率,也可以避免人工的评价误差,可以提高代码质量评价的准确性。该方法应用于DevOps时,可以有效作为质量门禁对代码进行控制,可以有效提升应用代码质量的精准评价,有效提升DevOps质量门禁管控效果。
上述代码质量评价模型可以有多种可能的实现方式。
在一种可能的实现方式中,代码质量评价模型仅输出一个评价结果。上述待评价代码可以为X,代码质量评价模型可以通过下列公式表示:其中,f(X)表示待评价代码X的评价结果,xi,j表示待评价代码X的第i个维度的第j个指标数据,ωi,j为第i个维度的第j个指标数据的权重,λi,j第i个维度的第j个指标数据的放大因子,bi为第i个维度的偏置量,为映射函数。
示例性地,上述多个维度可以包括可靠性、安全性、可维护性、代码重复度以及可测性。其中,可靠性可以是第1个维度,安全性可以是第2个维度,可维护性可以是第3个维度,代码重复度可以是第4个维度,可测性可以是第5个维度,应理解,该排序仅仅为一个示例,本申请实施例对此不作限定。
在上述示例中,代码重复度的指标数据可以包括重复代码行占比和重复代码块个数,其中,重复代码行占比可以为代码重复度的第1个指标数据,重复代码块个数可以为代码重复度的第2个指标数据,应理解,该排序仅仅为一个示例,本申请实施例对此不作限定。其他维度的排序方式可以与代码重复度的排序方式类似,此处不再赘述。
xi,j表示待评价代码X的第i个维度的第j个指标数据,例如,x4,1可以是第4个维度的第1个指标数据,即重复代码行占比。
基于代码质量评价模型可以得知,多个维度的指标数据分别乘以该多个维度的指标数据对应的方法因子,然后加权求和,并加上多个维度的偏置量,最后多个维度的求和得到评价结果。应理解,评价结果为多个维度的总评价结果。还应理解,评价结果为置信分数,取值范围可以为[0,1000],但本申请实施例并不限于此。
在该情况下,本申请实施例提供的代码质量评价方法,基于多个维度的指标数据,可以得到代码质量的总分,通过直观的数字表示代码质量,易于理解。
在另一种可能的实现方式中,代码质量评价模型输出多个评价结果,该多个评价结果的数量与上述多个维度的数量相同,即该代码质量评价模型会针对每个维度分别输出评价结果。上述代码质量评价模型可以通过下列公式表示:其中,g(X)表示待评价代码X的多个维度的评价结果,其他参数可以与上述相同,此处不再赘述。
多个维度的指标数据分别乘以该多个维度的指标数据对应的方法因子,然后加权求和,并加上多个维度的偏置量,最终得到多个维度的评价结果,该多个维度的评价结果可以是可靠性的评价结果、安全性的评价结果、可维护性的评价结果、代码重复度的评价结果以及可测性的评价结果。多个维度的评价结果的取值范围可以为[0,200],但本申请实施例并不限于此。
在该情况下,本申请实施例提供的代码质量评价方法,基于多个维度的指标数据,可以得到多个维度的评价结果,通过从多个维度的分数评价代码质量,提高代码评价的准确性。
在又一种可能的实现方式中,代码质量评价模型输出总的评价结果以及多个维度的评价结果,应理解,该多个维度的评价结果与上述多个维度的数量相同,即该多个维度的评价结果为代码质量评价模型针对每个维度分别输出的评价结果。上述代码质量评价模型可以包括和评价结果可以为多个维度的总评价结果、可靠性的评价结果、安全性的评价结果、可维护性的评价结果、代码重复度的评价结果以及可测性的评价结果。
当待评价代码的数量为多个时,数据处理设备可以得到多个待评价代码的多个维度的总评价结果、可靠性的评价结果、安全性的评价结果、可维护性的评价结果、代码重复度的评价结果以及可测性的评价结果。
数据处理设备可以先根据总评价结果对待评价代码的质量进行评价,当总评价结果相同时,数据处理设备可以根据可靠性的评价结果、安全性的评价结果、可维护性的评价结果、代码重复度的评价结果以及可测性的评价结果对待评价代码的质量进行评价。
具体地,当总评价结果相同时,数据处理设备可以根据可靠性、安全性、可维护性、代码重复度以及可测性对应的优先级,对待评价代码的质量进行评价。应理解,优先级可以是预设的,本申请实施例对具体的优先级级别不作限定。
示例性地,可靠性的优先级可以高于安全性的优先级,安全性的优先级可以高于可维护性的优先级,可维护性的优先级可以高于代码重复度的优先级,代码重复度的优先级可以高于可测性的优先级,当总评价结果相同时,可以根据可靠性的评价结果判断代码质量的优劣,当总评价结果相同、且可靠性的评价结果相同时,可以根据安全性的评价结果判断代码质量的优劣,其他情况类似,此处不再赘述。示例性地,待评价代码的数量可以为8个,该8个待评价代码的评价结果可以如表二所示。
表二
如表二所示,该8个待评价代码中的第1个待评价代码的总分(即总评价结果)为834,可靠性的评价结果为200,可测性的评价结果为59,安全性的评价结果为200,可维护性的评价结果为177,代码重复度的评价结果为198。该8个待评价代码中的第2个待评价代码的总分为834,可靠性的评价结果为200,可测性的评价结果为59,安全性的评价结果为200,可维护性的评价结果为177,代码重复度的评价结果为198。该8个待评价代码中的第3个待评价代码的总分为834,可靠性的评价结果为200,可测性的评价结果为59,安全性的评价结果为200,可维护性的评价结果为177,代码重复度的评价结果为198。该8个待评价代码中的第4个待评价代码的总分为831,可靠性的评价结果为200,可测性的评价结果为59,安全性的评价结果为200,可维护性的评价结果为174,代码重复度的评价结果为198。该8个待评价代码中的第5个待评价代码的总分为830,可靠性的评价结果为200,可测性的评价结果为59,安全性的评价结果为200,可维护性的评价结果为174,代码重复度的评价结果为196。该8个待评价代码中的第6个待评价代码的总分为828,可靠性的评价结果为200,可测性的评价结果为59,安全性的评价结果为200,可维护性的评价结果为170,代码重复度的评价结果为198。该8个待评价代码中的第7个待评价代码的总分为828,可靠性的评价结果为200,可测性的评价结果为53,安全性的评价结果为200,可维护性的评价结果为177,代码重复度的评价结果为198。该8个待评价代码中的第8个待评价代码的总分为827,可靠性的评价结果为200,可测性的评价结果为49,安全性的评价结果为200,可维护性的评价结果为179,代码重复度的评价结果为200。
可选地,待评价代码的评价结果还可以包括优、良以及差的等级。
示例性地,数据处理设备可以根据待评价代码的总评价结果(即表二所示的总分),设置优、良以及差的等级。其中,优可以用于表示待评价代码的代码质量很好,但可能存在微小瑕疵。良可以用于表示待评价代码的代码质量有待改进,差可以用于表示待评价代码的代码质量需要重点改进。
表三示出了一种总分与等级的对应关系。
表三
总分 | 等级 |
[825,1000] | 优 |
[650,825) | 良 |
[350,650) | 差 |
如表三所示,当待评价代码的总分在[825,1000]之间时,待评价代码的代码质量为优,当待评价代码的总分在[650,825)之间时,待评价代码的代码质量为良,当待评价代码的总分在[350,650)之间时,待评价代码的代码质量为差。
应理解,在该情况下,上述表二所示的待评价代码的代码质量均为优。
作为一个可选的实施例,上述待评价代码的评价结果可以通过雷达图表示。在一种可能的实现方式中,数据处理设备可以将上述待评价代码的评价结果保存至数据库,然后从数据库中待评价代码的评价结果显示在雷达图上进行展示。应理解,本申请实施例并不限于此。
示例性地,图2示出了一种评价结果的示意图。如图2所示,从同一点开始的轴上表示的五个变量的二维图表的雷达图显示多个维度的评价结果,即可靠性的评价结果、安全性的评价结果、可维护性的评价结果、代码重复度的评价结果以及可测性的评价结果。
在上述表二所示的示例中,第1个待评价代码的可靠性的评价结果为200,可测性的评价结果为59,安全性的评价结果为200,可维护性的评价结果为177,代码重复度的评价结果为198。
可选地,数据处理设备还可以将上述待评价代码的多个维度的指标数据和其对应的评价结果保存至数据库,根据多个维度的指标数据和其对应的评价结果之间的映射关系,生成评价报告,更清晰地显示待评价代码的评价结果。
示例性地,图3示出了一种待评价代码的评价报告的示意图,如图3所示,待评价代码的评价报告可以显示可靠性的评价结果、安全性的评价结果、可维护性的评价结果、代码重复度的评价结果、可测性的评价结果以及各个维度中涉及的指标数据。
具体地,待评价代码的代码质量评价的总分为834,可维护性的得分(即评价结果)为177,涉及的指标数据:坏味道的个数为586、注释行占比为0.142、平均认知复杂度为2.82以及有效代码行数33938。代码重复度的得分为198,涉及的指标数据:代码重复行占比为0.069和重复代码块个数147。可靠性的得分为200,涉及的指标数据:问题个数为11和有效代码行数为33938。安全性的得分为200,涉及的指标数据:漏洞个数为29和有效代码行数为33938。可测性的得分为59,涉及的指标数据:平均方法圈复杂度为0%。
作为一个可选的实施例,上述方法100还包括:统计提交待评价代码的账户提交的多个代码的评价结果;在多个代码的评价结果中不满足质量评价条件的评价结果的数量累积超出第一预设阈值的情况下,发送预警信息,预警信息用于提示管理员账户存在问题,质量评价条件为评价结果大于或等于第二预设阈值。
程序开发人员可以通过账户提交代码到数据处理设备,以便于数据处理设备对代码进行代码质量评价。数据处理设备可以获取程序开发人员的账户提交的代码,并将其作为待评价代码,对其进行代码质量评价。
应理解,数据处理设备可以接收多个程序开发人员的账户提交的代码,本申请实施例对具体的账户个数不作限定。
还应理解,程序开发人员可以通过账户提交多个代码到数据处理设备,数据处理设备可以获取程序开发人员的账户提交的多个代码,并对该多个代码进行代码质量评价,得到代码质量的评价结果。
当多个代码的评价结果中不满足质量评价条件的评价结果的数量累积超出第一预设阈值的情况下,发送预警信息,预警信息用于提示管理员账户存在问题。
程序开发人员可以通过账户依次提交多个代码,数据处理设备可以依次判断代码的评价结果是否满足质量评价条件,在不满足质量评价条件的情况下,将不通过的代码数量加1,当该数量超出第一预设阈值时,说明该账户提交的代码质量存在重大问题,则发送预警信息。在满足质量评价条件的情况下,将不通过的代码数量清0。
第一预设阈值可以是大于0的正整数,本申请实施例对第一预设阈值的具体数值不作限定。
数据处理设备可以同时对多个代码进行代码质量评价,数据处理设备可以将该多个代码质量的总分的中位数作为第二预设阈值,将超过第二预设阈值的代码确定为满足质量评价条件的代码,将未超过第二预设阈值的代码确定为不满足质量评价条件的代码。
数据处理设备可以通过邮件、短信、提示框或者弹窗的形式发送预警信息,应理解,本申请实施例对此不作限定。
本申请实施例提供的代码质量评价方法,可以统计账户提交的代码不满足质量评价条件的数量,当超过一定次数时,发送预警信息,可以提示管理员账户存在问题,可以有效的规避风险等级高的账户。
作为一个可选的实施例,在上述方法100的S102、对代码质量问题数据进行预处理,得到多个维度的指标数据之前,所述方法100还包括:判断代码质量问题数据是否满足准入条件;S102、对代码质量问题数据进行预处理,得到多个维度的指标数据,包括:当代码质量问题数据满足转入条件时,对代码质量问题数据进行预处理,得到多个维度的指标数据。
准入条件可以是根据关注点和常犯问题点确定的。例如,准入条件可以是代码质量问题数据中坏味道的个数不能多于700,当数据处理设备获取代码质量问题数据之后,判断代码质量问题数据中坏味道的个数是否多于700,当代码质量问题数据中坏味道的个数小于或等于700时,对代码质量问题数据进行预处理,得到多个维度的指标数据。
本申请实施例提供的代码质量评价方法,当代码质量问题数据满足准入条件时,对待评价的代码进行代码质量评价,有利于提前筛选出不符合代码质量标准的代码,有利于提高代码评价效率。
上述数据处理设备可以包括数据采集模块、预处理模块、模型处理模块、门禁控制模块以及预测报警模块,基于此,本申请实施例提供另一种代码评价质量方法400,如图4所示,该方法400可以包括如下步骤:
S401、数据采集模块获取待评价代码的代码质量问题数据,代码质量问题数据是基于代码检查工具对待评价代码进行检查得到的。
该步骤具体可参考上述S101,此处不再赘述。
S402、数据采集模块向预处理模块发送代码质量问题数据,对应地,预处理模块接收该代码质量问题数据。
S403、预处理模块对代码质量问题数据进行预处理,得到多个维度的指标数据。
该步骤具体可参考上述S102,此处不再赘述。
S404、预处理模块向模型处理模块发送多个维度的指标数据,对应地,模型处理模块接收该多个维度的指标数据。
S405、模型处理模块将多个维度的指标数据输入至代码质量评价模型,得到待评价代码的评价结果,其中,代码质量评价模型是基于历史代码的多个维度的指标数据和历史代码的评价结果作为样本训练得到的。
该步骤具体可参考上述S103,此处不再赘述。
S406、模型处理模块向门禁控制模块发送待评价代码的评价结果,对应地,门禁控制模块接收该待评价代码的评价结果。
S407、门禁控制模块统计提交待评价代码的账户提交的多个代码的评价结果。
S408、门禁控制模块判断多个代码的评价结果中不满足质量评价条件的评价结果的数量累积是否超出第一预设阈值,其中,质量评价条件为评价结果大于或等于第二预设阈值。
S409、在多个代码的评价结果中不满足质量评价条件的评价结果的数量累积超出第一预设阈值的情况下,门禁控制模块向预测报警模块发送指示信息,该指示信息用于指示预测报警模块发送预警信息,对应地,预测报警模块接收该指示信息。
S410、预测报警模块基于指示信息,发送预警信息,预警信息用于提示管理员账户存在问题。
本申请实施例提供的代码质量评价方法,通过对代码质量问题数据进行预处理,得到多个维度的指标数据,相比直接利用代码质量问题数据进行评价,可以从更多的维度对代码质量进行评价,可以提高代码质量评价的准确性,同时,基于代码质量评价模型对多个维度的指标数据进行分析,得到评价结果,相比于人工进行评价,可以提高测试效率,也可以避免人工的评价误差,可以提高代码质量评价的准确性。同时,可以统计账户提交的代码不满足质量评价条件的数量,当超过一定次数时,发送预警信息,可以提示管理员账户存在问题,可以有效的规避风险等级高的账户。
上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
上文中结合图1至图4,详细描述了本申请实施例提供的代码质量评价方法,下面将结合图5和图6,详细描述本申请实施例提供的代码质量评价装置。
图5示出了本申请实施例提供的一种代码质量评价装置500。该装置500包括:获取模块510和处理模块520。获取模块510用于:获取待评价代码的代码质量问题数据,代码质量问题数据是基于代码检查工具对待评价代码进行检查得到的;处理模块520用于:对代码质量问题数据进行预处理,得到多个维度的指标数据;以及,将多个维度的指标数据输入至代码质量评价模型,得到待评价代码的评价结果,其中,代码质量评价模型是基于历史代码的多个维度的指标数据和历史代码的评价结果作为样本训练得到的。
可选地,上述多个维度包括:可靠性、安全性、可维护性、代码重复度以及可测性;其中,可靠性的指标数据包括有效代码行数、问题个数以及技术债比率,安全性的指标数据包括有效代码行数、漏洞个数以及技术债比率,可维护性的指标数据包括有效代码行数、成熟代码坏味道个数、注释行占比、平均认知复杂度以及技术债比率,代码重复度的指标数据包括重复代码行占比和重复代码块个数,可测性的指标数据包括有效代码行数、分支覆盖率以及平均方法圈复杂度。
可选地,上述评价结果是基于多个维度的指标数据、多个维度的指标数据对应的权重、多个维度的指标数据对应的放大因子、以及多个维度中每个维度的偏置量得到的。
可选地,上述待评价代码为X,代码质量评价模型通过下列公式表示:其中,f(X)表示待评价代码X的评价结果,xi,j表示待评价代码X的第i个维度的第j个指标数据,ωi,j为第i个维度的第j个指标数据的权重,λi,j第i个维度的第j个指标数据的放大因子,bi为第i个维度的偏置量,为映射函数。
可选地,上述装置还包括发送模块;处理模块520还用于:统计提交待评价代码的账户提交的多个代码的评价结果;发送模块用于:在多个代码的评价结果中不满足质量评价条件的评价结果的数量累积超出第一预设阈值的情况下,发送预警信息,预警信息用于提示管理员账户存在问题,质量评价条件为评价结果大于或等于第二预设阈值。
应理解,这里的装置500以功能模块的形式体现。这里的术语“模块”可以指应用特有集成电路(application specific integrated circuit,ASIC)、电子电路、用于执行一个或多个软件或固件程序的处理器(例如共享处理器、专有处理器或组处理器等)和存储器、合并逻辑电路和/或其它支持所描述的功能的合适组件。在一个可选例子中,本领域技术人员可以理解,该装置500可以具体为上述实施例中的数据处理设备,或者,上述实施例中数据处理设备的功能可以集成在该装置500中,该装置500可以用于执行上述方法实施例中与数据处理设备对应的各个流程和/或步骤,为避免重复,在此不再赘述。
上述装置500具有实现上述方法100中数据处理设备执行的相应步骤的功能;上述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。该硬件或软件包括一个或多个与上述功能相对应的模块。例如,上述获取模块可以为通信接口,例如收发接口。
图6示出了本申请实施例提供的一种代码质量评价装置600。该装置600包括:处理器610、通信接口620和存储器630。其中,处理器610、通信接口620和存储器630通过内部连接通路互相通信,该存储器630用于存储指令,该处理器610用于执行该存储器630存储的指令,以控制该通信接口发送信号和/或接收信号。
上述装置600用于执行上述代码质量评价方法中的各个流程和步骤。其中,该处理器610用于:获取待评价代码的代码质量问题数据,代码质量问题数据是基于代码检查工具对待评价代码进行检查得到的;对代码质量问题数据进行预处理,得到多个维度的指标数据;将多个维度的指标数据输入至代码质量评价模型,得到待评价代码的评价结果,其中,代码质量评价模型是基于历史代码的多个维度的指标数据和历史代码的评价结果作为样本训练得到的。
应理解,该装置600可以用于执行上述方法实施例中与数据处理设备对应的各个步骤和/或流程。可选地,该存储器630可以包括只读存储器和随机存取存储器,并向处理器610提供指令和数据。存储器630的一部分还可以包括非易失性随机存取存储器。例如,存储器630还可以存储设备类型的信息。该处理器610可以用于执行存储器630中存储的指令,并且当该处理器610执行存储器630中存储的指令时,该处理器610用于执行上述与该数据处理设备对应的方法实施例的各个步骤和/或流程。
应理解,在本申请实施例中,上述装置600的处理器610可以是中央处理单元(central processing unit,CPU),该处理器610还可以是其他通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件单元组合执行完成。软件单元可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器执行存储器中的指令,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。
本申请提供一种可读计算机可读存储介质,该计算机可读存储介质用于存储计算机程序,该计算机程序用于实现上述实施例中数据处理设备对应的方法。
本申请提供了一种计算机程序产品,该计算机程序产品包括计算机程序(也可以称为代码,或指令),当该计算机程序在计算机上运行时,该计算机可以执行上述实施例中数据处理设备对应的方法。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
Claims (13)
1.一种代码质量评价方法,其特征在于,包括:
获取待评价代码的代码质量问题数据,所述代码质量问题数据是基于代码检查工具对所述待评价代码进行检查得到的;
对所述代码质量问题数据进行预处理,得到多个维度的指标数据;
将所述多个维度的指标数据输入至代码质量评价模型,得到所述待评价代码的评价结果,其中,所述代码质量评价模型是基于历史代码的多个维度的指标数据和所述历史代码的评价结果作为样本训练得到的。
2.根据权利要求1所述的方法,其特征在于,所述多个维度包括:可靠性、安全性、可维护性、代码重复度以及可测性;
其中,所述可靠性的指标数据包括有效代码行数、问题个数以及技术债比率,所述安全性的指标数据包括有效代码行数、漏洞个数以及技术债比率,所述可维护性的指标数据包括有效代码行数、成熟代码坏味道个数、注释行占比、平均认知复杂度以及技术债比率,所述代码重复度的指标数据包括重复代码行占比和重复代码块个数,所述可测性的指标数据包括有效代码行数、分支覆盖率以及平均方法圈复杂度。
3.根据权利要求1所述的方法,其特征在于,所述评价结果是基于所述多个维度的指标数据、所述多个维度的指标数据对应的权重、所述多个维度的指标数据对应的放大因子、以及所述多个维度中每个维度的偏置量得到的。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述方法还包括:
统计提交所述待评价代码的账户提交的多个代码的评价结果;
在所述多个代码的评价结果中不满足质量评价条件的评价结果的数量累积超出第一预设阈值的情况下,发送预警信息,所述预警信息用于提示管理员所述账户存在问题,所述质量评价条件为所述评价结果大于或等于第二预设阈值。
6.一种代码质量评价装置,其特征在于,包括:
获取模块,用于获取待评价代码的代码质量问题数据,所述代码质量问题数据是基于代码检查工具对所述待评价代码进行检查得到的;
处理模块,用于对所述代码质量问题数据进行预处理,得到多个维度的指标数据;以及,将所述多个维度的指标数据输入至代码质量评价模型,得到所述待评价代码的评价结果,其中,所述代码质量评价模型是基于历史代码的多个维度的指标数据和所述历史代码的评价结果作为样本训练得到的。
7.根据权利要求6所述的装置,其特征在于,所述多个维度包括:可靠性、安全性、可维护性、代码重复度以及可测性;
其中,所述可靠性的指标数据包括有效代码行数、问题个数以及技术债比率,所述安全性的指标数据包括有效代码行数、漏洞个数以及技术债比率,所述可维护性的指标数据包括有效代码行数、成熟代码坏味道个数、注释行占比、平均认知复杂度以及技术债比率,所述代码重复度的指标数据包括重复代码行占比和重复代码块个数,所述可测性的指标数据包括有效代码行数、分支覆盖率以及平均方法圈复杂度。
8.根据权利要求6所述的装置,其特征在于,所述评价结果是基于所述多个维度的指标数据、所述多个维度的指标数据对应的权重、所述多个维度的指标数据对应的放大因子、以及所述多个维度中每个维度的偏置量得到的。
10.根据权利要求1至9中任一项所述的装置,其特征在于,所述装置还包括发送模块;
所述处理模块还用于:
统计提交所述待评价代码的账户提交的多个代码的评价结果;
所述发送模块用于:
在所述多个代码的评价结果中不满足质量评价条件的评价结果的数量累积超出第一预设阈值的情况下,发送预警信息,所述预警信息用于提示管理员所述账户存在问题,所述质量评价条件为所述评价结果大于或等于第二预设阈值。
11.一种代码质量评价装置,其特征在于,包括:处理器,所述处理器和存储器耦合,所述存储器用于存储计算机程序,当所述处理器调用所述计算机程序时,使得所述装置执行权利要求1至5中任一项所述的方法。
12.一种计算机可读存储介质,其特征在于,用于存储计算机程序,所述计算机程序包括实现权利要求1至5中任一项所述的方法的指令。
13.一种计算机程序产品,其特征在于,包括计算机程序,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210148361.5A CN114489760A (zh) | 2022-02-17 | 2022-02-17 | 代码质量评价方法和代码质量评价装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210148361.5A CN114489760A (zh) | 2022-02-17 | 2022-02-17 | 代码质量评价方法和代码质量评价装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114489760A true CN114489760A (zh) | 2022-05-13 |
Family
ID=81481599
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210148361.5A Pending CN114489760A (zh) | 2022-02-17 | 2022-02-17 | 代码质量评价方法和代码质量评价装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114489760A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115113921A (zh) * | 2022-08-29 | 2022-09-27 | 云账户技术(天津)有限公司 | 代码重构价值的评估方法、装置、电子设备及存储介质 |
-
2022
- 2022-02-17 CN CN202210148361.5A patent/CN114489760A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115113921A (zh) * | 2022-08-29 | 2022-09-27 | 云账户技术(天津)有限公司 | 代码重构价值的评估方法、装置、电子设备及存储介质 |
CN115113921B (zh) * | 2022-08-29 | 2022-11-08 | 云账户技术(天津)有限公司 | 代码重构价值的评估方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lange et al. | Effects of defects in UML models: an experimental investigation | |
US20220300820A1 (en) | Ann-based program testing method, testing system and application | |
Sargent et al. | A tutorial on the operational validation of simulation models | |
US20080275747A1 (en) | Incident/accident report analysis apparatus and method | |
CN112199293A (zh) | 软件质量评价方法、装置、终端设备及存储介质 | |
CN111860698A (zh) | 确定学习模型的稳定性的方法和装置 | |
CN114489760A (zh) | 代码质量评价方法和代码质量评价装置 | |
de Mast et al. | Modeling and evaluating repeatability and reproducibility of ordinal classifications | |
Alverbro et al. | Methods for risk analysis | |
CN111858377A (zh) | 测试脚本的质量评价方法、装置、电子设备及存储介质 | |
CN115511454A (zh) | 一种生成审核规则的方法、装置及相关产品 | |
CN108446213A (zh) | 一种静态代码质量分析方法和装置 | |
Lemeshko et al. | Extending the application of Grubbs-type tests in rejecting anomalous measurements | |
WO2002099756A1 (fr) | Procede unifie d'evaluation de l'efficacite de systemes a grande echelle et dispositif automatise permettant la mise en oeuvre dudit procede | |
Malonda et al. | Radioactivity counting statistics | |
Spagnolo et al. | Forensic metrology: uncertainty of measurements in forensic analysis | |
Chu et al. | FAST: a framework for automating statistics-based testing | |
US20210224674A1 (en) | System and method for processing distorted or inaccurate input data obtained from an environment | |
CN112184415A (zh) | 数据处理方法、装置、电子设备和存储介质 | |
CN106096219B (zh) | 一种用于果蔬识别算法性能评价的数据质量分析方法 | |
Korbelak et al. | Teaming with technology at the TSA: An examination of trust in automation’s influence on human performance in operational environments | |
Linehan | Models for the Measurement of Political Instability | |
CN115292969B (zh) | 基于出厂和返修数据的装备外场可靠性评估方法及系统 | |
Mancini | Measuring the relevance of the microstructure noise in financial data | |
CN111507639B (zh) | 理财风险分析方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |