CN111723010B - 一种基于稀疏代价矩阵的软件bug分类方法 - Google Patents
一种基于稀疏代价矩阵的软件bug分类方法 Download PDFInfo
- Publication number
- CN111723010B CN111723010B CN202010538383.3A CN202010538383A CN111723010B CN 111723010 B CN111723010 B CN 111723010B CN 202010538383 A CN202010538383 A CN 202010538383A CN 111723010 B CN111723010 B CN 111723010B
- Authority
- CN
- China
- Prior art keywords
- cost
- learning machine
- matrix
- extreme learning
- sparse
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000011159 matrix material Substances 0.000 title claims abstract description 96
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000012549 training Methods 0.000 claims abstract description 18
- 239000013598 vector Substances 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 6
- 230000035772 mutation Effects 0.000 claims description 6
- 230000002068 genetic effect Effects 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 230000035945 sensitivity Effects 0.000 claims description 3
- 238000013145 classification model Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004836 empirical method Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/36—Preventing errors by testing or debugging software
- G06F11/3604—Software analysis for verifying properties of programs
- G06F11/3608—Software analysis for verifying properties of programs using formal methods, e.g. model checking, abstract interpretation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/086—Learning methods using evolutionary algorithms, e.g. genetic algorithms or genetic programming
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Physiology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Stored Programmes (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明公开了一种基于稀疏代价矩阵的软件BUG分类方法,包括以下步骤:S1:获取软件BUG报告;S2:对软件BUG报告数据进行编码操作,S3:初始化稀疏代价矩阵;S4:使用编码后的数据训练加权极限学习机、使其输出正确的报告分类结果;S5:使用训练好的加权极限学习机求出该加权极限学习机的局部泛化误差;S6:使用差分进化算法中的交叉变异策略产生新的软件BUG稀疏权重矩阵;S7:使用新的稀疏权重矩阵在相同不平衡数据集上训练新的加权极限学习机、S8:直至无法得到更低的局部泛化误差;S9:使用能够得到最低的局部泛化误差的加权极限学习机预测未知的软件BUG报告、得到其相应的报告分类结果。
Description
技术领域
本发明涉及软件BUG分类、进化算法、机器学习以及局部泛化误差,尤其涉及用于软件BUG分类的一种基于稀疏代价矩阵的软件BUG分类方法。
背景技术
尽管软件BUG分类领域有许多的进步,但是当受到形式不平衡的复杂数据集的影响时,现有的工作将无法取得有利的表现。而不平衡数据问题在很多场景下非常常见。偏差的类别分布通常会导致分类学习无法获得少数类样本的特征。然而,包括大多数极限学习机工作在内的标准分类学习假定了两个假设,即平等的错误分类成本和平衡的类别分布,在实践中往往不成立。为了解决这个问题,已经针对不平衡数据提出了代价敏感和加权的极限学习机,在这些解决不平衡分类的极限学习机中,需要手动指定了不同分类错误的各种代价。值得注意的是,为不同的类样本设置合理的代价值至关重要,但是,经验法则并不适用于所有情况,在该领域中迫切需要一种估算这些代价的自适应方法。
发明内容
根据现有技术存在的问题,本发明公开了一种基于稀疏代价矩阵的软件BUG分类方法,包括以下步骤:
S1:获取软件BUG报告,并对报告进行分类操作(如:严重、不严重),得到类别数C。
S2:对软件BUG报告数据进行编码操作,将每条软件BUG报告处理为一个相同长度的向量,将软件BUG报告的类别编码为one-hot格式。
S3:初始化稀疏代价矩阵,矩阵规模与软件BUG类别C有关。
S4:使用编码后的数据训练加权极限学习机,使其可以输出正确的报告分类结果,加权极限学习机中使用的权值为S3中获得的。
S5:使用S4中训练好的加权极限学习机求出该加权极限学习机的局部泛化误差。
S6:使用差分进化算法中的交叉变异策略产生新的软件BUG稀疏权重矩阵。
S7:使用S6中产生的新的稀疏权重矩阵在相同不平衡数据集上训练新的加权极限学习机,并计算加权极限学习机的局部泛化误差。
S8:重复S6-S7操作,直至无法得到更低的局部泛化误差。
S9:使用能够得到最低的局部泛化误差的加权极限学习机,预测未知的软件BUG报告,得到其相应的报告分类结果。
进一步的,S1中具体采用如下方式:
S11:从Stack Overflow等软件BUG报告网站,收集一定量的数据,主要保存其BUG描述,并将其分为C类(在这里C=2,表示严重与不严重)。
S2中具体采用如下方式:
S21:对软件BUG报告进行编码操作,即,将不同长度的软件BUG报告使用相同的长度的编码结果表示。在这里我们使用Sentence2vector方法得到编码后的BUG报告,其形式为一个相同长度的向量。在这里我们假设编码后的软件BUG报告数据可以被表示为D={d1,d2,…,dN},其中di是一个长度确定的向量。
进一步的,S3中具体采用如下方式:
S31:在我们的方法中我们使用稀疏的代价矩阵,传统的代价矩阵对每个训练样例对每个分类都有一个具体的代价值,即,如果BUG分类数据集中含有C个分类,那么其代价矩阵的规模为:C×C。而我们提出的稀疏代价矩阵,对于每个BUG类别只需要一个代价值,其代价矩阵中为一个对角矩阵,其代价矩阵规模实际为C×1。在这里,我们将稀疏矩阵中的所有权重设为1。
S4中具体采用如下方式:
S41:与其他分类学习类似,相同的错误分类成本是极限学习机持有的基本假设。因此,在存在严重的类别分布偏斜的情况下,原始极限学习机的性能趋于受限,无法得到正确的BUG分类结果。对于软件BUG分类的复杂不平衡数据,加权极限学习机可以达到更好的效果。加权极限学习机的基础是使用一个代价矩阵对不同类的软件BUG报告进行加权,从而使最终的分类器不会受到数据不平衡的影响。如S3中所说,在我们的方法中我们使用稀疏代价矩阵对极限学习机进行加权,该稀疏代价矩阵为对角矩阵,设该代价矩阵为W,其对角线上的每一个值costi,i=1,…,C,且Wii=0,i≠j,i,j=1,…,C。
原极限学习机的优化目标为:
其中公式中的第一项为l2正则项,H为极限学习机中的隐层输出矩阵,β为隐层与输出层之间的连接权重,Y为数据集标签。
极限学习机加入代价矩阵后,其优化目标为:
加权极限学习机输出层权重矩阵β其解为:
S42:求出输出层权重矩阵后,就可以通过该矩阵与隐层输出矩阵H得到分类结果/>在训练集中,/>理想情况下,在测试集中,该分类器依旧可以得到正确的分类结果。但是,由于数据中类别分布不平衡的干扰,该分类器预测准确率可能很低。
进一步的,S5中具体采用如下方式:
S51:局部泛化误差可以找到BUG报告分类的误差上限,是量化分类模型的泛化能力的有效方法。局部泛化误差可以被定义为:
给定Q>0和任意一个扰动向量Δx,使代表训练数据xi的Q近邻,表示除了xi之外不可见的所有样例。SQ表示所有SQ(xi)的集合。p(x)表示真实的概率密度函数Loss(F(x;θ),f(x))表示求得分布与真实分布之间的差距。
局部泛化误差可以表示为:
以通过随机灵敏度测量来测量,即,A,B,η分别表示目标输出的最大最小值之间的差,损失函数可能的最大值,以及约束的可信度。
此时有
局部泛化误差为:
基于S4中加权极限学习机的定义有:
最终结果即为在该加权极限学习机上的局部泛化误差,该值表示在所有未知的BUG报告上该分类器的误差有多大,即,该值越大,该分类器的分类结果越不准确。
进一步的,S6中具体采用如下方式:
S61:随机初始化多个稀疏代价矩阵,每个稀疏代价矩阵包含与BUG类别个数相同的代价权重;
S62:从初始化后的稀疏代价矩阵中随机选取三个不同的代价矩阵,分别为:cost1,cost2,cost3;
S63:使用选取的三个代价矩阵做突变操作产生一个新的代价矩阵:
h=cost1+Pm·(cost2-cost3)
其中Pm表示突变因子,新产生的代价矩阵为h。
S64:对新产生的代价矩阵做交叉操作,与上一代中相应的个体实现基因遗传:
其中i表示当前个体中的第几位,C表示所有类的个数,Pc表示交叉因子。cost表示上一代中与该新产生的个体相对应的个体。此时就得到了该次进化得到的稀疏权重矩阵。
S7中具体采用如下方式。
S71:使用新产生的稀疏代价矩阵v训练一个新的加权极限学习机,该过程如果S4相同,并如S5中计算其相应的局部泛化误差。
S72:根据局部泛化误差的定义,Q相同时,局部泛化误差越小表示该模型的泛化能力越强,也就是说在BUG分类问题得到的分类结果更加准确。比较新产生的稀疏代价矩阵与上一代相对应的代价矩阵的局部泛化误差,保留较小的那一个。
S8中具体采用如下方式:
S81:重复进行S7-S8操作,直至无法产生新的能取得更小局部泛化误差的代价矩阵。此时该矩阵可以得到最低的局部泛化误差,即,使用该稀疏代价矩阵的分类器完成训练后,可以达到最高的准确率。
S9中具体采用如下方式:
S91:使用S8中得到的最终稀疏代价矩阵,完成加权极限学习机的训练,使用该分类器对输入的软件BUG报告进行预测,输出最终的分类结果(在这里,即判断该软件报告中的BUG是否属于严重BUG)。
由于采用了上述技术方案,本发明提供的一种基于稀疏代价矩阵的软件BUG分类方法,该方法能够解决在数据不平衡的情况下数据分布对分类器的影响问题,并且整个过程不需要人为干扰。稀疏代价矩阵则可以解决大规模权重的存储问题。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明方法的流程图。
具体实施方式
为使本发明的技术方案和优点更加清楚,下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚完整的描述:
如图1所示的一种基于稀疏代价矩阵的软件BUG分类方法,具体包括如下步骤:
S1:获取软件BUG报告,并对报告进行分类操作(如:严重、不严重),得到类别数C。
S2:对软件BUG报告数据进行编码操作,将每条软件BUG报告处理为一个相同长度的向量,将软件BUG报告的类别编码为one-hot格式。
S3:初始化稀疏代价矩阵,矩阵规模与软件BUG类别C有关。
S4:使用编码后的数据训练加权极限学习机,使其可以输出正确的报告分类结果,加权极限学习机中使用的权值为S3中获得的。
S5:使用S4中训练好的加权极限学习机求出该加权极限学习机的局部泛化误差。
S6:使用差分进化算法中的交叉变异策略产生新的软件BUG稀疏权重矩阵。
S7:使用S6中产生的新的稀疏权重矩阵在相同不平衡数据集上训练新的加权极限学习机,并计算加权极限学习机的局部泛化误差。
S8:重复S6-S7操作,直至无法得到更低的局部泛化误差。
S9:使用能够得到最低的局部泛化误差的加权极限学习机,预测未知的软件BUG报告,得到其相应的报告分类结果。
S1中具体采用如下方式:
S11:从stackoverflow等软件BUG报告网站,收集一定量的数据,主要保存其BUG描述,并将其分为C类(在这里C=2,表示严重与不严重)。
进一步的,S2中具体采用如下方式:
S21:对软件BUG报告进行编码操作,即,将不同长度的软件BUG报告使用相同的长度的编码结果表示。在这里我们使用sentence2vector方法得到编码后的BUG报告,其形式为一个相同长度的向量。在这里我们假设编码后的软件BUG报告数据可以被表示为D={d1,d2,…,dN},其中di是一个长度确定的向量。
进一步的,S3中具体采用如下方式:
S31:在我们的方法中我们使用稀疏的代价矩阵,传统的代价矩阵对每个训练样例对每个分类都有一个具体的代价值,即,如果BUG分类数据集中含有C个分类,那么其代价矩阵的规模为:C×C。而我们提出的稀疏代价矩阵,对于每个BUG类别只需要一个代价值,其代价矩阵中为一个对角矩阵,其代价矩阵规模实际为C×1。在这里,我们将稀疏矩阵中的所有权重设为1。
进一步的,S4中具体采用如下方式:
S41:与其他分类学习类似,相同的错误分类成本是极限学习机持有的基本假设。因此,在存在严重的类别分布偏斜的情况下,原始极限学习机的性能趋于受限,无法得到正确的BUG分类结果。对于软件BUG分类的复杂不平衡数据,加权极限学习机可以达到更好的效果。加权极限学习机的基础是使用一个代价矩阵对不同类的软件BUG报告进行加权,从而使最终的分类器不会受到数据不平衡的影响。如S3中所说,在我们的方法中我们使用稀疏代价矩阵对极限学习机进行加权,该稀疏代价矩阵为对角矩阵,设该代价矩阵为W,其对角线上的每一个值costi,i=1,…,C,且Wii=0,i≠j,i,j=1,…,C。
原极限学习机的优化目标为:
其中公式中的第一项为l2正则项,H为极限学习机中的隐层输出矩阵,β为隐层与输出层之间的连接权重,Y为数据集标签。
极限学习机加入代价矩阵后,其优化目标为:
加权极限学习机输出层权重矩阵β其解为:
S42:求出输出层权重矩阵后,就可以通过该矩阵与隐层输出矩阵H得到分类结果/>在训练集中,/>理想情况下,在测试集中,该分类器依旧可以得到正确的分类结果。但是,由于数据中类别分布不平衡的干扰,该分类器预测准确率可能很低。
进一步的,S5中具体采用如下方式:
S51:局部泛化误差可以找到BUG报告分类的误差上限,是量化分类模型的泛化能力的有效方法。局部泛化误差可以被定义为:
给定Q>0和任意一个扰动向量Δx,使代表训练数据xi的Q近邻,表示除了xi之外不可见的所有样例。SQ表示所有SQ(xi)的集合。p(x)表示真实的概率密度函数,Loss(F(x;θ),f(x))表示求得分布与真实分布之间的差距。
局部泛化误差可以表示为:
其中输入扰动引起的输出波动可以通过随机灵敏度测量来测量,即,/>A,B,η分别表示目标输出的最大最小值之间的差,损失函数可能的最大值,以及约束的可信度。
此时有
局部泛化误差为:
基于S4中加权极限学习机的定义有:
最终结果即为在该加权极限学习机上的局部泛化误差,该值表示在所有未知的BUG报告上该分类器的误差有多大,即,该值越大,该分类器的分类结果越不准确。
S6中具体采用如下方式。
S61:随机初始化多个稀疏代价矩阵,每个稀疏代价矩阵包含与BUG类别个数相同的代价权重;
S62:从初始化后的稀疏代价矩阵中随机选取三个不同的代价矩阵,分别为:cost1,cost2,cost3;
S63:使用选取的三个代价矩阵做突变操作产生一个新的代价矩阵:
h=cost1+Pm·(cost2-cost3)
其中Pm表示突变因子,新产生的代价矩阵为h。
S64:对新产生的代价矩阵做交叉操作,与上一代中相应的个体实现基因遗传:
其中i表示当前个体中的第几位,C表示所有类的个数,Pc表示交叉因子。cost表示上一代中与该新产生的个体相对应的个体。此时就得到了该次进化得到的稀疏权重矩阵。
进一步的,S7中具体采用如下方式。
S71:使用新产生的稀疏代价矩阵v训练一个新的加权极限学习机,该过程如果S4相同,并如S5中计算其相应的局部泛化误差。
S72:根据局部泛化误差的定义,Q相同时,局部泛化误差越小表示该模型的泛化能力越强,也就是说在BUG分类问题得到的分类结果更加准确。比较新产生的稀疏代价矩阵与上一代相对应的代价矩阵的局部泛化误差,保留较小的那一个。
进一步的,S8中具体采用如下方式:
S81:重复进行S7-S8操作,直至无法产生新的能取得更小局部泛化误差的代价矩阵。此时该矩阵可以得到最低的局部泛化误差,即,使用该稀疏代价矩阵的分类器完成训练后,可以达到最高的准确率。
进一步的,S9中具体采用如下方式。
S91:使用S8中得到的最终稀疏代价矩阵,完成加权极限学习机的训练,使用该分类器对输入的软件BUG报告进行预测,输出最终的分类结果(在这里,即判断该软件报告中的BUG是否属于严重BUG)。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
Claims (3)
1.一种基于稀疏代价矩阵的软件BUG分类方法,其特征在于包括:包括以下步骤:
S1:获取软件BUG报告、对BUG报告进行分类得到类别数C;
S2:对软件BUG报告数据进行编码操作,将每条软件BUG报告处理为相同长度的向量,将软件BUG报告的类别编码为one-hot格式;
S3:初始化稀疏代价矩阵,其中矩阵规模与软件BUG类别C有关;
S4:使用编码后的数据训练加权极限学习机、使其输出正确的报告分类结果;
S5:使用训练好的加权极限学习机求出该加权极限学习机的局部泛化误差;
S6:使用差分进化算法中的交叉变异策略产生新的软件BUG稀疏权重矩阵;
S7:使用新的稀疏权重矩阵在相同不平衡数据集上训练新的加权极限学习机、并计算加权极限学习机的局部泛化误差;
S8:重复S6-S7操作直至无法得到更低的局部泛化误差;
S9:使用能够得到最低的局部泛化误差的加权极限学习机预测未知的软件BUG报告、得到其相应的报告分类结果;
S5中具体采用如下方式:
S51:将局部泛化误差定义为:
给定Q>0和任意一个扰动向量Δx,使代表训练数据xi的Q近邻,表示除了xi之外不可见的所有样例,SQ表示所有SQ(xi)的集合,p(x)表示真实的概率密度函数,Loss(F(x;θ),f(x))表示求得分布与真实分布之间的差距;
局部泛化误差表示为:
其中输入扰动引起的输出波动通过随机灵敏度测量,即/>A,B,η分别表示目标输出的最大最小值之间的差、损失函数的最大值、以及约束的可信度;
此时有
局部泛化误差为:
基于S4中加权极限学习机的定义有:
最终结果即为在该加权极限学习机上的局部泛化误差,该值表示在所有未知的BUG报告上分类器的误差有多大,即该值越大则该分类器的分类结果越不准确。
2.根据权利要求1所述的方法,其特征还在于:S4中具体采用如下方式:
使用稀疏代价矩阵对极限学习机进行加权,该稀疏代价矩阵为对角矩阵,设该代价矩阵为W,其对角线上的每一个值costi,i=1,…,C,且Wii=0,i≠j,i,j=1,…,C,
原极限学习机的优化目标为:
其中公式中的第一项为l2正则项,H为极限学习机中的隐层输出矩阵,β为隐层与输出层之间的连接权重,Y为数据集标签;
极限学习机加入代价矩阵后,其优化目标为:
加权极限学习机输出层权重矩阵β其解为:
求出输出层权重矩阵后通过该矩阵与隐层输出矩阵H得到分类结果/>在训练集中
3.根据权利要求1所述的用于软件BUG分类的基于稀疏代价矩阵的进化极限学习机,其特征还在于:S6中具体采用如下方式:
S61:随机初始化多个稀疏代价矩阵,每个稀疏代价矩阵包含与BUG类别个数相同的代价权重;
S62:从初始化后的稀疏代价矩阵中随机选取三个不同的代价矩阵,分别为:cost1,cost2,cost3;
S63:使用选取的三个代价矩阵做突变操作产生一个新的代价矩阵:
h=cost1+Pm·(cost2-cost3)
其中Pm表示突变因子,新产生的代价矩阵为h;
S64:对新产生的代价矩阵做交叉操作、与上一代中相应的个体实现基因遗传:
其中i表示当前个体中的第几位,C表示所有类的个数,Pc表示交叉因子,cost表示上一代中与该新产生的个体相对应的个体,此时获得该次进化得到的稀疏权重矩阵。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010538383.3A CN111723010B (zh) | 2020-06-12 | 2020-06-12 | 一种基于稀疏代价矩阵的软件bug分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010538383.3A CN111723010B (zh) | 2020-06-12 | 2020-06-12 | 一种基于稀疏代价矩阵的软件bug分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111723010A CN111723010A (zh) | 2020-09-29 |
CN111723010B true CN111723010B (zh) | 2024-02-23 |
Family
ID=72566657
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010538383.3A Active CN111723010B (zh) | 2020-06-12 | 2020-06-12 | 一种基于稀疏代价矩阵的软件bug分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111723010B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112465065B (zh) * | 2020-12-11 | 2022-10-14 | 中国第一汽车股份有限公司 | 一种传感器数据关联方法、装置、设备及存储介质 |
CN113254329A (zh) * | 2021-04-30 | 2021-08-13 | 展讯通信(天津)有限公司 | 基于机器学习的Bug处理方法、系统、设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108984613A (zh) * | 2018-06-12 | 2018-12-11 | 北京航空航天大学 | 一种基于迁移学习的缺陷报告跨项目分类方法 |
CN109255029A (zh) * | 2018-09-05 | 2019-01-22 | 大连海事大学 | 一种采用加权优化训练集增强自动Bug报告分配的方法 |
KR20190068205A (ko) * | 2017-12-08 | 2019-06-18 | 중앙대학교 산학협력단 | 버그 리포트의 자동 담당자 배정 시스템 및 방법 |
-
2020
- 2020-06-12 CN CN202010538383.3A patent/CN111723010B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190068205A (ko) * | 2017-12-08 | 2019-06-18 | 중앙대학교 산학협력단 | 버그 리포트의 자동 담당자 배정 시스템 및 방법 |
CN108984613A (zh) * | 2018-06-12 | 2018-12-11 | 北京航空航天大学 | 一种基于迁移学习的缺陷报告跨项目分类方法 |
CN109255029A (zh) * | 2018-09-05 | 2019-01-22 | 大连海事大学 | 一种采用加权优化训练集增强自动Bug报告分配的方法 |
Non-Patent Citations (1)
Title |
---|
基于堆叠降噪稀疏自动编码器的软件缺陷预测;薛参观;;计算机与现代化(第05期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111723010A (zh) | 2020-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bowden et al. | Input determination for neural network models in water resources applications. Part 1—background and methodology | |
CN108921604B (zh) | 一种基于代价敏感分类器集成的广告点击率预测方法 | |
CN111723010B (zh) | 一种基于稀疏代价矩阵的软件bug分类方法 | |
CN112364352B (zh) | 可解释性的软件漏洞检测与推荐方法及系统 | |
CN110363230B (zh) | 基于加权基分类器的stacking集成污水处理故障诊断方法 | |
CN111046961B (zh) | 基于双向长短时记忆单元和胶囊网络的故障分类方法 | |
CN112700324A (zh) | 基于CatBoost与受限玻尔兹曼机结合的用户借贷违约预测方法 | |
CN110826611A (zh) | 基于多个元分类器加权集成的stacking污水处理故障诊断方法 | |
CN111582315B (zh) | 样本数据处理方法、装置及电子设备 | |
CN117153268A (zh) | 一种细胞类别确定方法及系统 | |
CN111522736A (zh) | 一种软件缺陷预测方法、装置、电子设备及计算机存储介质 | |
CN116541698A (zh) | 一种基于XGBoost的网络异常入侵检测方法和系统 | |
CN114003900A (zh) | 变电站二次系统网络入侵检测方法、装置及系统 | |
CN113987910A (zh) | 一种耦合神经网络与动态时间规划的居民负荷辨识方法及装置 | |
CN106778252B (zh) | 基于粗糙集理论与waode算法的入侵检测方法 | |
CN109635008B (zh) | 一种基于机器学习的设备故障检测方法 | |
Hao et al. | A new method for noise data detection based on DBSCAN and SVDD | |
CN116304845A (zh) | 一种建筑物料的层次分类识别方法 | |
CN115470834A (zh) | 基于标签传播矫正标签置信度的不准确标记的多标签学习算法 | |
CN114819454A (zh) | 窃电检测方法、装置、设备、存储介质及程序产品 | |
CN113723835B (zh) | 火电厂用水评估方法和终端设备 | |
CN113469450B (zh) | 一种数据分类方法、装置、计算机设备及存储介质 | |
CN113327024A (zh) | 一种配电网薄弱环节辨识方法、系统及存储介质 | |
Manoli et al. | A Study on Machine Learning Algorithms Selection for Estimating the Impact of FIFA World Cups | |
Kheddam et al. | Supervised Classification of Multispectral Images: A Comparative Study |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |