CN115269349A - 一种软件质量预测方法及相关装置 - Google Patents

一种软件质量预测方法及相关装置 Download PDF

Info

Publication number
CN115269349A
CN115269349A CN202210886871.2A CN202210886871A CN115269349A CN 115269349 A CN115269349 A CN 115269349A CN 202210886871 A CN202210886871 A CN 202210886871A CN 115269349 A CN115269349 A CN 115269349A
Authority
CN
China
Prior art keywords
software
sample
quality prediction
data
prediction model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210886871.2A
Other languages
English (en)
Inventor
徐梓丞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank of China Ltd
Original Assignee
Bank of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of China Ltd filed Critical Bank of China Ltd
Priority to CN202210886871.2A priority Critical patent/CN115269349A/zh
Publication of CN115269349A publication Critical patent/CN115269349A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3447Performance evaluation by modeling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3668Software testing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Stored Programmes (AREA)

Abstract

本申请提供了一种软件质量预测方法,包括:获取样本软件的开发数据;对该样本软件的开发数据进行预处理,获得样本数据,该样本数据包括正样本和负样本;根据正样本进行上采样,获得扩展后的正样本;基于扩展后的正样本以及负样本,训练软件质量预测模型;获取待预测的目标软件的开发数据;对该目标软件的开发数据进行预处理,将预处理后的数据输入软件质量预测模型,获得目标软件的质量预测结果。该方法通过对样本数据中的正样本进行上采样,解决了样本数据不平衡的问题,提高了训练得到的软件质量预测模型的精度,从而实现对目标软件质量的准确预测。

Description

一种软件质量预测方法及相关装置
技术领域
本申请涉及计算机技术领域,尤其涉及一种软件质量预测方法、装置、服务器、计算机可读存储介质以及计算机程序产品。
背景技术
在一款新开发的软件正式上线和投产之前,开发人员需要对软件质量进行严格把控,确保软件上线后不会出现相应的风险,避免为公司造成重大的人力和财力的损失。因此,对新开发的软件进行质量预测,并对预测结果为高风险的软件进行排查和改进是十分重要的。
针对上述问题,开发人员通常采用人工测试的方式对新开发的软件进行质量预测,从而获得软件的质量预测结果。然而,上述方法耗时耗力,获得的质量预测结果的精度也无法得到保障。业界亟需提供一种能够准确预测软件质量的方法。
发明内容
本申请提供了一种软件质量预测方法,该方法可以预测新开发的软件的质量风险情况,获得准确度较高的质量预测结果,从而保障软件的安全上线和投产。本申请还提供了上述方法对应的装置、服务器、计算机可读存储介质以及计算机程序产品。
第一方面,本申请提供了一种软件质量预测方法。所述方法包括:
获取样本软件的开发数据;
对所述样本软件的开发数据进行预处理,获得样本数据,所述样本数据包括正样本和负样本;
根据所述正样本进行上采样,获得扩展后的正样本;
基于所述扩展后的正样本以及负样本,训练软件质量预测模型;
获取待预测的目标软件的开发数据;
对所述目标软件的开发数据进行预处理,将预处理后的数据输入所述软件质量预测模型,获得所述目标软件的质量预测结果。
在一些可能的实现方式中,所述对所述样本软件的开发数据进行预处理,获得样本数据,包括:
提取所述样本软件的开发数据的特征信息,所述特征信息包括软件属性信息、软件缺陷信息、软件开发信息;
根据所述样本软件的开发信息的特征信息,获得所述样本数据。
在一些可能的实现方式中,所述上采样包括:简单随机抽样、分层采样、SMOTE采样中的至少一种。
在一些可能的实现方式中,所述基于所述扩展后的正样本以及负样本,训练软件质量预测模型,包括:
将所述扩展后的正样本以及负样本输入所述软件质量预测模型;
根据所述软件质量预测模型输出的结果,调整所述软件质量预测模型的超参数组合。
在一些可能的实现方式中,所述超参数组合包括:叶子节点数、树的最大深度、学习率、早期停止次数、叶子节点中的样本数据中的一种或多种。
在一些可能的实现方式中,所述将预处理后的数据输入所述软件质量预测模型,获得所述目标软件的质量预测结果,包括:
将预处理后的数据输入所述软件质量预测模型;
接收所述软件质量预测模型输出的所述目标软件的质量风险概率;
当所述目标软件的质量风险概率大于预设阈值时,所述目标软件的质量预测结果为高风险;当所述目标软件的质量风险概率小于或等于预设阈值时,所述目标软件的质量预测结果为低风险。
第二方面,本申请提供了一种软件质量预测装置。所述装置包括:
获取模块,用于获取样本软件的开发数据;
预处理模块,用于对所述样本软件的开发数据进行预处理,获得样本数据,所述样本数据包括正样本和负样本;
上采样模块,用于根据所述正样本进行上采样,获得扩展后的正样本;
训练模块,用于基于所述扩展后的正样本以及负样本,训练软件质量预测模型;
获取模块,还用于获取待预测的目标软件的开发数据;
质量预测模块,用于对所述目标软件的开发数据进行预处理,将预处理后的数据输入所述软件质量预测模型,获得所述目标软件的质量预测结果。
在一些可能的实现方式中,所述预处理模块,具体用于:
提取所述样本软件的开发数据的特征信息,所述特征信息包括软件属性信息、软件缺陷信息、软件开发信息;
根据所述样本软件的开发信息的特征信息,获得所述样本数据。
在一些可能的实现方式中,所述上采样包括:简单随机抽样、分层采样、SMOTE采样中的至少一种。
在一些可能的实现方式中,所述训练模块,具体用于:
将所述扩展后的正样本以及负样本输入所述软件质量预测模型;
根据所述软件质量预测模型输出的结果,调整所述软件质量预测模型的超参数组合。
在一些可能的实现方式中,所述超参数组合包括:叶子节点数、树的最大深度、学习率、早期停止次数、叶子节点中的样本数据中的一种或多种。
在一些可能的实现方式中,所述质量预测模块,具体用于:
将预处理后的数据输入所述软件质量预测模型;
接收所述软件质量预测模型输出的所述目标软件的质量风险概率;
当所述目标软件的质量风险概率大于预设阈值时,所述目标软件的质量预测结果为高风险;当所述目标软件的质量风险概率小于或等于预设阈值时,所述目标软件的质量预测结果为低风险。
第三方面,本申请提供了一种服务器。所述服务器包括处理器和存储器,所述存储器中存储有指令,所述处理器执行所述指令,以使所述服务器执行如本申请第一方面或第一方面的任一种实现方式所述的方法。
第四方面,本申请提供了一种计算机可读存储介质。所述计算机可读存储介质中存储有指令,当其在服务器上运行时,使得服务器执行上述第一方面或第一方面的任一种实现方式所述的方法。
第五方面,本申请提供了一种计算机程序产品。所述计算机程序产品包括计算机可读指令,当其在服务器上运行时,使得所述服务器执行上述第一方面或第一方面的任一种实现方式所述的方法。
本申请在上述各方面提供的实现方式的基础上,还可以进行进一步组合以提供更多实现方式。
基于上述内容描述,可知本申请的技术方案具有如下有益效果:
具体地,该方法首先获取样本软件的开发数据,对开发数据进行预处理,以获得样本数据,该样本数据包括正样本和负样本,接着根据正样本进行上采样,获得扩展后的正样本,并基于扩展后的正样本以及负样本,训练软件质量预测模型,然后获取待预测的目标软件的开发数据,对目标软件的开发数据进行预处理,并输入软件质量预测模型,获得目标软件的质量预测结果。该方法通过对样本数据中的正样本进行上采样,解决了样本数据不平衡的问题,提高了训练得到的软件质量预测模型的精度,从而实现对目标软件质量的准确预测。
附图说明
结合附图并参考以下具体实施方式,本申请各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
图1为本申请实施例提供的一种软件质量预测方法的流程示意图;
图2为本申请实施例提供的一种软件质量预测装置的结构示意图;
图3为本申请实施例提供的一种实现软件质量预测的服务器的结构示意图。
具体实施方式
下面将参照附图更详细地描述本申请的实施例。虽然附图中显示了本申请的某些实施例,然而应当理解的是,本申请可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本申请。应当理解的是,本申请的附图及实施例仅用于示例性作用,并非用于限制本申请的保护范围。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本申请中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本申请中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
为了便于理解本申请的技术方案,下面对本申请中具体的应用场景进行说明。
软件开发是根据用户需求建造出软件系统或者系统中的软件部分的过程,在软件开发的过程中,开发人员会针对软件的各个功能模块以及连接模块的接口进行多次测试,从而对保证软件各部分功能的正常运行。在软件正式上线之前,开发人员还会针对软件的整体质量进行预测,从而确保软件上线后不会出现风险事故。
通常情况下,开发人员采用人工测试的传统方法对软件进行质量预测,从而评估出软件的整体质量风险,以确定该软件是否达到上线标准。然而,采用人工对软件进行质量预测的方法费时费力,且人工预测存在一定的主观性,无法保证预测结果的准确度。
基于此,本申请实施例提供了一种软件质量预测方法。具体地,该方法首先获取样本软件的开发数据,对开发数据进行预处理,以获得样本数据,该样本数据包括正样本和负样本,接着根据正样本进行上采样,获得扩展后的正样本,并基于扩展后的正样本以及负样本,训练软件质量预测模型,然后获取待预测的目标软件的开发数据,对目标软件的开发数据进行预处理,并输入软件质量预测模型,获得目标软件的质量预测结果。该方法通过对样本数据中的正样本进行上采样,解决了样本数据不平衡的问题,提高了训练得到的软件质量预测模型的精度,从而实现对目标软件质量的准确预测。
接下来,结合附图对本申请实施例提供的软件质量预测方法进行详细说明。
参见图1所示的一种软件质量预测方法的流程示意图,该方法可以由服务器执行,具体包括如下步骤:
S101:服务器获取样本软件的开发数据。
其中,样本软件可以包括多个历史软件,开发数据可以包括软件的全生命周期的数据。例如,服务器可以获取多个历史软件的结构数据、编码数据、测试数据中的一种或多种,并将样本软件的开发数据作为训练数据。
需要说明的是,样本软件的开发数据可以保存在数据库中,并定时对数据库中的数据进行更新。服务器可以使用预先设置的获取代码,实时获取数据库中的样本软件的开发数据,从而有效利用数据和计算资源。
S102:服务器对样本软件的开发数据进行预处理,获得样本数据,该样本数据包括正样本和负样本。
具体地,服务器可以提取样本软件的开发数据的特征信息,以完成对样本软件的开发数据的预处理,从而获得样本数据。其中,特征信息可以包括提取样本软件的软件属性信息、软件缺陷信息、软件开发信息中的一种或多种。其中,软件属性信息可以为样本软件的名称、样本软件的功能名称、样本软件的批次数据中的至少一种,软件缺陷信息可以为缺陷的种类、缺陷产生的原因中的至少一种,软件开发信息可以为样本软件的开发时间、样本软件的质量结果中的至少一种。
需要说明的是,样本数据包括正样本和负样本,其中,正样本为质量结果为低质量(即存在质量缺陷)的样本软件,负样本为质量结果为高质量(即不存在质量缺陷)的样本软件。
S103:服务器根据正样本进行上采样,获得扩展后的正样本。
由于在实际的软件开发过程中,经过多轮测试后仍存在质量缺陷的软件数量较少,因此,样本数据中正样本的数量远远小于负样本的数量,直接使用样本数据进行训练获得的模型精度不高,预测结果准确率较低。因此,在本申请实施例中,服务器可以对正样本进行上采样,从而扩展正样本的数量,并获得扩展后的正样本。
具体地,上采样可以包括简单随机采样、分层采样、SMOTE采样中的至少一种。以SMOTE采样为例,对上采样进行介绍。服务器可以首先针对正样本中的每一个样本x,以欧式距离为标准,计算出样本x到正样本中所有样本的距离,从而确定样本x的k近邻,接着根据正样本和负样本的不平衡比例,确定采样倍率N,对于正样本中的每一个样本x,从其k近邻中随机选取若干个样本xn,并针对样本xn构建新的正样本。
S104:服务器基于扩展后的正样本以及负样本,训练软件质量预测模型。
具体地,服务器可以将扩展后的正样本以及负样本输入软件质量预测模型,并根据软件质量预测模型输出的结果,调整模型的超参数组合。其中,超参数组合可以包括叶子节点数、树的最大深度、学习率、早期停止次数、叶子节点中的样本数据中的一种或多种。通过对于超参数组合的调整,能够提升训练得到的软件质量预测模型的准确率。
S105:服务器获取待预测的目标软件的开发数据。
其中,待预测的目标软件为将要上线的软件。相应地,目标软件的开发数据可以包括目标软件的全生命周期的数据。
S106:服务器对目标软件的开发数据进行预处理,将预处理后的数据输入软件质量预测模型,获得目标软件的质量预测结果。
具体地,服务器可以提取目标软件的开发数据的特征信息,并将预处理后的数据输入软件质量预测模型,接收软件质量预测模型输出的目标软件的质量风险概率。其中,当目标软件的质量风险概率大于预设阈值时,目标软件的质量预测结果为高风险,当目标软件的质量风险概率小于预设阈值时,目标软件的质量预测结果为低风险。
进一步地,服务器可以通过前端页面等方式向用户呈现目标软件的质量预测结果,以便用户对于高风险的目标软件进行风险排查和质量改进。
该方法首先获取样本软件的开发数据,对开发数据进行预处理,以获得样本数据,该样本数据包括正样本和负样本,接着根据正样本进行上采样,获得扩展后的正样本,并基于扩展后的正样本以及负样本,训练软件质量预测模型,然后获取待预测的目标软件的开发数据,对目标软件的开发数据进行预处理,并输入软件质量预测模型,获得目标软件的质量预测结果。该方法通过对样本数据中的正样本进行上采样,解决了样本数据不平衡的问题,提高了训练得到的软件质量预测模型的精度,从而实现对目标软件质量的准确预测。
基于本申请实施例提供的上述方法,本申请实施例还提供了与上述方法对应的软件质量预测装置。描述于本申请实施例中所涉及到的单元/模块可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元/模块的名称在某种情况下并不构成对该单元/模块本身的限定。
参见图2所示的软件质量预测装置的结构示意图,该装置200包括:
获取模块201,用于获取样本软件的开发数据;
预处理模块202,用于对所述样本软件的开发数据进行预处理,获得样本数据,所述样本数据包括正样本和负样本;
上采样模块203,用于根据所述正样本进行上采样,获得扩展后的正样本;
训练模块204,用于基于所述扩展后的正样本以及负样本,训练软件质量预测模型;
获取模块205,还用于获取待预测的目标软件的开发数据;
质量预测模块206,用于对所述目标软件的开发数据进行预处理,将预处理后的数据输入所述软件质量预测模型,获得所述目标软件的质量预测结果。
在一些可能的实现方式中,所述预处理模块202,具体用于:
提取所述样本软件的开发数据的特征信息,所述特征信息包括软件属性信息、软件缺陷信息、软件开发信息;
根据所述样本软件的开发信息的特征信息,获得所述样本数据。
在一些可能的实现方式中,所述上采样包括:简单随机抽样、分层采样、SMOTE采样中的至少一种。
在一些可能的实现方式中,所述训练模块204,具体用于:
将所述扩展后的正样本以及负样本输入所述软件质量预测模型;
根据所述软件质量预测模型输出的结果,调整所述软件质量预测模型的超参数组合。
在一些可能的实现方式中,所述超参数组合包括:叶子节点数、树的最大深度、学习率、早期停止次数、叶子节点中的样本数据中的一种或多种。
在一些可能的实现方式中,所述质量预测模块206,具体用于:
将预处理后的数据输入所述软件质量预测模型;
接收所述软件质量预测模型输出的所述目标软件的质量风险概率;
当所述目标软件的质量风险概率大于预设阈值时,所述目标软件的质量预测结果为高风险;当所述目标软件的质量风险概率小于或等于预设阈值时,所述目标软件的质量预测结果为低风险。
根据本申请实施例的软件质量预测装置200可对应于执行本申请实施例中描述的方法,并且软件质量预测装置200的各个模块/单元的上述和其它操作和/或功能分别为了实现图1所示实施例中的各个方法的相应流程,为了简洁,在此不再赘述。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。参见图3所示的实现软件质量预测的服务器300的结构示意图,需要说明的是,图3所示的服务器仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图3所示,服务器300可以包括处理装置(例如中央处理器、图形处理器等)301,其可以根据存储在只读存储器(ROM)302中的程序或者从存储装置308加载到随机访问存储器(RAM)303中的程序而执行各种适当的动作和处理。在RAM303中,还存储有服务器300操作所需的各种程序和数据。处理装置301、ROM 302以及RAM 303通过总线304彼此相连。输入/输出(I/O)接口305也连接至总线304。
通常,以下装置可以连接至I/O接口305:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置306;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置307;包括例如磁带、硬盘等的存储装置308;以及通信装置309。通信装置309可以允许服务器300与其他设备进行无线或有线通信以交换数据。虽然图3示出了具有各种装置的服务器300,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
本申请还提供一种计算机可读存储介质,也称作机器可读介质。在本申请的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
需要说明的是,本申请上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该服务器执行时,使得服务器:获取样本软件的开发数据;对所述样本软件的开发数据进行预处理,获得样本数据,所述样本数据包括正样本和负样本;根据所述正样本进行上采样,获得扩展后的正样本;基于所述扩展后的正样本以及负样本,训练软件质量预测模型;获取待预测的目标软件的开发数据;对所述目标软件的开发数据进行预处理,将预处理后的数据输入所述软件质量预测模型,获得所述目标软件的质量预测结果。
特别地,根据本申请的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置从网络上被下载和安装,或者从存储装置被安装。在该计算机程序被处理装置执行时,执行本申请实施例的方法中限定的上述功能。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。
虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本申请的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (10)

1.一种软件质量预测方法,其特征在于,所述方法包括:
获取样本软件的开发数据;
对所述样本软件的开发数据进行预处理,获得样本数据,所述样本数据包括正样本和负样本;
根据所述正样本进行上采样,获得扩展后的正样本;
基于所述扩展后的正样本以及负样本,训练软件质量预测模型;
获取待预测的目标软件的开发数据;
对所述目标软件的开发数据进行预处理,将预处理后的数据输入所述软件质量预测模型,获得所述目标软件的质量预测结果。
2.根据权利要求1所述的方法,其特征在于,所述对所述样本软件的开发数据进行预处理,获得样本数据,包括:
提取所述样本软件的开发数据的特征信息,所述特征信息包括软件属性信息、软件缺陷信息、软件开发信息;
根据所述样本软件的开发信息的特征信息,获得所述样本数据。
3.根据权利要求1所述的方法,其特征在于,所述上采样包括:简单随机抽样、分层采样、SMOTE采样中的至少一种。
4.根据权利要求1所述的方法,其特征在于,所述基于所述扩展后的正样本以及负样本,训练软件质量预测模型,包括:
将所述扩展后的正样本以及负样本输入所述软件质量预测模型;
根据所述软件质量预测模型输出的结果,调整所述软件质量预测模型的超参数组合。
5.根据权利要求4所述的方法,其特征在于,所述超参数组合包括:叶子节点数、树的最大深度、学习率、早期停止次数、叶子节点中的样本数据中的一种或多种。
6.根据权利要求1所述的方法,其特征在于,所述将预处理后的数据输入所述软件质量预测模型,获得所述目标软件的质量预测结果,包括:
将预处理后的数据输入所述软件质量预测模型;
接收所述软件质量预测模型输出的所述目标软件的质量风险概率;
当所述目标软件的质量风险概率大于预设阈值时,所述目标软件的质量预测结果为高风险;当所述目标软件的质量风险概率小于或等于预设阈值时,所述目标软件的质量预测结果为低风险。
7.一种软件质量预测装置,其特征在于,所述装置包括:
获取模块,用于获取样本软件的开发数据;
预处理模块,用于对所述样本软件的开发数据进行预处理,获得样本数据,所述样本数据包括正样本和负样本;
上采样模块,用于根据所述正样本进行上采样,获得扩展后的正样本;
训练模块,用于基于所述扩展后的正样本以及负样本,训练软件质量预测模型;
获取模块,还用于获取待预测的目标软件的开发数据;
质量预测模块,用于对所述目标软件的开发数据进行预处理,将预处理后的数据输入所述软件质量预测模型,获得所述目标软件的质量预测结果。
8.一种服务器,其特征在于,所述服务器包括处理器和存储器,所述存储器中存储有指令,所述处理器执行所述指令,以使所述服务器执行如权利要求1至6任一项所述的方法。
9.一种计算机可读存储介质,其特征在于,包括计算机可读指令,当所述计算机可读指令在服务器上运行时,使得所述服务器执行如权利要求1至6中任一项所述的方法。
10.一种计算机程序产品,其特征在于,包括计算机可读指令,当所述计算机程序产品在服务器上运行时,使得所述服务器执行如权利要求1至6中任一项所述的方法。
CN202210886871.2A 2022-07-26 2022-07-26 一种软件质量预测方法及相关装置 Pending CN115269349A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210886871.2A CN115269349A (zh) 2022-07-26 2022-07-26 一种软件质量预测方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210886871.2A CN115269349A (zh) 2022-07-26 2022-07-26 一种软件质量预测方法及相关装置

Publications (1)

Publication Number Publication Date
CN115269349A true CN115269349A (zh) 2022-11-01

Family

ID=83769420

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210886871.2A Pending CN115269349A (zh) 2022-07-26 2022-07-26 一种软件质量预测方法及相关装置

Country Status (1)

Country Link
CN (1) CN115269349A (zh)

Similar Documents

Publication Publication Date Title
CN110211121B (zh) 用于推送模型的方法和装置
CN115277261B (zh) 基于工控网络病毒的异常机器智能识别方法、装置、设备
CN110399933B (zh) 数据标注修正方法、装置、计算机可读介质及电子设备
CN110969600A (zh) 一种产品缺陷检测方法、装置、电子设备及存储介质
CN112328869A (zh) 一种用户贷款意愿的预测方法、装置及计算机系统
CN109242165A (zh) 一种模型训练及基于模型训练的预测方法及装置
US20220270228A1 (en) Method and apparatus for obtaining information
CN117195083B (zh) 基于电流曲线的坍落度预测方法、装置及可读介质
CN108629355A (zh) 用于生成工作量信息的方法和装置
CN109656803B (zh) 信息推送方法、装置和电子设备
CN113592033A (zh) 油罐图像识别模型训练方法、油罐图像识别方法和装置
CN115269349A (zh) 一种软件质量预测方法及相关装置
CN114141236B (zh) 语言模型更新方法、装置、电子设备及存储介质
CN112966971B (zh) 一种项目工作量评估方法和装置
CN111859985B (zh) Ai客服模型测试方法、装置、电子设备及存储介质
KR102159574B1 (ko) 인공지능 학습데이터 생성을 위한 크라우드소싱 기반 프로젝트의 작업 결과의 정확도 추정 및 관리 방법
CN112505337B (zh) 一种辅助分析样品的数据处理方法
US11003825B1 (en) System, method, and computer program product for optimization in an electronic design
CN114564391A (zh) 确定测试用例的方法、装置、存储介质及电子设备
CN110083807B (zh) 合同的修改影响自动预测方法、装置、介质及电子设备
CN112685610A (zh) 虚假注册账号识别方法及相关装置
CN113807391A (zh) 任务模型的训练方法、装置、电子设备及存储介质
CN113296836A (zh) 训练模型的方法、测试方法、装置、电子设备及存储介质
CN116823407B (zh) 产品信息推送方法、装置、电子设备和计算机可读介质
CN116302661B (zh) 一种异常预测方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination