CN109491914A - 基于不平衡学习策略高影响缺陷报告预测方法 - Google Patents

基于不平衡学习策略高影响缺陷报告预测方法 Download PDF

Info

Publication number
CN109491914A
CN109491914A CN201811333585.3A CN201811333585A CN109491914A CN 109491914 A CN109491914 A CN 109491914A CN 201811333585 A CN201811333585 A CN 201811333585A CN 109491914 A CN109491914 A CN 109491914A
Authority
CN
China
Prior art keywords
defect
weight
training set
text
defect report
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811333585.3A
Other languages
English (en)
Other versions
CN109491914B (zh
Inventor
李辉
李博
高国峰
李霄
陈荣
郭世凯
唐文君
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian Maritime University
Original Assignee
Dalian Maritime University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian Maritime University filed Critical Dalian Maritime University
Priority to CN201811333585.3A priority Critical patent/CN109491914B/zh
Publication of CN109491914A publication Critical patent/CN109491914A/zh
Application granted granted Critical
Publication of CN109491914B publication Critical patent/CN109491914B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3668Software testing
    • G06F11/3672Test management
    • G06F11/3692Test management for test results analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于不平衡学习策略高影响缺陷报告预测方法:使用文本预处理方法对缺陷报告的文本信息进行处理;将处理后文本信息分储为训练集和测试集;对训练集做多次数据平衡处理;使用多个分类器对经过平衡处理的训练集进行训练;把多个分类器的优点进行集成并输出;使用文本特征提取模块来对测试集中的缺陷报告进行文本特征提取;使用训练好的模型对测试集中的缺陷报告进行预测。本发明克服了数据的不平衡特性并加以利用,将不平衡学习策略与约束求解相结合,基于不同分类算法的不同能力,提出了利用权重优化每个分类器的判别概率以提高分类效果,并将优化后的多个分类器进行集成,通过获取更合适的权重来获得更高的准确率。

Description

基于不平衡学习策略高影响缺陷报告预测方法
技术领域
本发明涉及一种预测方法,具体地说是一种基于不平衡学习策略高影响缺陷报告预测方法。
背景技术
随着开源软件项目规模和复杂性的增加,在大多数软件系统中出现了不可避免的bug(缺陷),bug修复已经成为软件开发和维护中最重要的活动之一。但是,缺陷报告的数量非常巨大,开发人员难以有效管理,而在这些缺陷报告中,不同的缺陷有着不同的影响,开发人员最需要优先解决的缺陷是那些少量的但是具有重大影响的缺陷,因此,提供一种有效的方法来来帮助开发人员检测到那些对于软件系统有重大影响的缺陷是非常有必要的。而这些具有高优先级的缺陷被称为高影响bug。在之前的研究及相关工作中,有人提出了通过分类算法和不平和策略的组合来识别高影响bug的方式,但是这些方法的结果并不尽如人意,识别准确率并不是很高,并不能应用于软件项目中。
文献[Automated Identification of High Impact Bug Reports LeveragingImbalanced Learning Strategies]和[High-Impact Bug Report Identification withImbalanced Learning Strategies]中对于两种高影响力的缺陷(bug)进行了研究,对于surprise bugs采用了SMOTE(合成少数过采样技术)+KNN(k临近)来进行不平衡问题的优化以及分类问题,对于breakage bugs采用了RUS(随机欠采样)+NB(朴素贝叶斯)来处理不平衡问题以及分类问题。
上述的方法提出的解决问题的方式在分析问题时只使用了一种分类方法,由于不同的分类方式具有不同的特性,因此只使用一种分类方式在求解问题时很难得到较高的评价。
发明内容
根据上述提出的技术问题,提出了一种基于通过优化集成与不平衡学习策略(OIILS)的预测方法,以确定该缺陷是否具有高影响力,旨在帮助开发人员检测对软件系统构成更多威胁的漏洞。本发明采用的技术手段如下:
一种基于不平衡学习策略与优化集成的关于高影响缺陷报告预测方法,具有如下步骤:
S1、使用文本预处理方法对缺陷报告的文本信息进行处理;
S2、使用10折交叉验证的方法,将步骤S1得到的处理后文本信息分储为训练集和测试集;
S3、使用不平衡学习策略SMOTE(Synthetic Minority Over-samplingTechnique)算法对训练集做多次数据平衡处理;
S4、使用多个分类器对经过平衡处理的训练集进行训练;
S5、根据不同分类器对每个类别的发现能力不同,使用CPLEX约束求解器对多个分类器进行优化集成,把多个分类器的优点进行集成并输出;
S6、使用文本特征提取模块来对测试集中的报告进行文本特征提取;
使用步骤S5中的训练好的模型对测试集中的缺陷报告进行预测。
所述步骤S1的具体步骤如下:
从缺陷报告的摘要和描述字段中提取文本特征;
利用分词将提取的文本特征分段为单词,并删除其中包含很少含义的停用词,数字和标点符号(为了减少噪声数据),之后应用Iterated Lovins Stemmer算法进行词干化处理以协调具有相似含义的单词;
根据词干化处理后的单词,使用one-hot模式将每个缺陷报告转换成文本向量。
所述步骤S3的具体步骤如下:
将训练集的文本信息转换成文本特征向量之后,采用SMOTE算法对训练集进行平衡化处理;
根据文本特征向量的值,检测属于少数类中的每个缺陷的K个欧氏距离最相近的邻居;
将每个缺陷及其K个最相似的邻居连接起来,并分别在这些连线中随机选择点,作为少数类别的新数据,以减少训练集的不平衡分布带给分类器的负面影响。如果一个数据集出现属于少数类中的n个缺陷,SMOTE算法将产生K*n个人工点。
所述步骤S4的具体步骤如下:
获取经过平衡处理的训练集数据后,开始对数据进行分类,获取训练集中缺陷报告属于每个类别的概率:
不同的分类器在不同的数据集上执行不同的预测能力,利用不同的分类器预测同一数据集的效果也不同。另外,由不平衡学习策略SMOTE构建的人工数据存在一定的随机性,为了提高稳定性我们整合了不同的分类器。
分别采用KNN,J48和NBM三种分类器来获取训练集中缺陷报告属于每个类别的概率。
所述步骤S5的具体步骤如下:
包含权重训练阶段,权重调整阶段以及最小选择阶段;
权重训练:分类器对于每个样本会输出该样本属于不同类别的判别概率,通过比较概率的大小来确定目标的类别;并通过权重调整每个训练样本属于不同类别的判别概率,提高分类器的预测准确性;
提取训练集数据的特征,并确定缺陷报告是属于多数类还是少数类,相应结果用Ci表示,1表示多数类,-1表示少数类;
对训练集数据,使用分类器来进行自测,用pi0表示多数类概率,用pi1表示少数类概率;
将子目标函数建立等式:
子目标函数只包含两个结果,为1时表示第i个缺陷结果预测为真,为-1时为假;
这种集成方法将优化权重问题视为线性规划问题。
使用约束求解器来获取合适的权重,以此来获得识别高影响缺陷报告的最高性能;优化目标即确定合适的权重值,约束则要求权重的和为1,并且每个权重的值都要在0到1之间;
权重调整:权重训练后,为每个分类器获得最合适的权重W0和W1;
权重W0和W1用于调整由相应分类器生成的预测结果:利用相应的W0来调整多数类概率利用相应的W1来调整少数类概率
最小选择:权重调整之后,获取三组预测结果,每组包含两个类别的概率(对于同一个缺陷来说多数类的预测有三种结果,少数类的预测也有三种结果),将最小值设置为在所有关于多数类的概率中呈现最小值,并且将最小值设置为在所有关于少数类的概率中呈现最小值,则每个缺陷包含关于多数类和少数类的
使用由中的最大值表示的类别来确定该缺陷的最终类型,最终进行输出。
令K=1,即将属于少数类的训练集数据的数量加倍。
本发明克服了数据的不平衡特性并加以利用,将不平衡学习策略与约束求解相结合,基于不同分类算法(分类器)的不同能力,提出了利用权重优化每个分类器的判别概率以提高分类效果,并将优化后的多个分类器进行集成,通过获取更合适的权重来获得更高的准确率。
基于上述理由本发明可在预测方法等领域广泛推广。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的具体实施方式中基于不平衡学习策略高影响缺陷报告预测方法的流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,一种基于不平衡学习策略高影响缺陷报告预测方法,具有如下步骤:
S1、使用文本预处理方法对缺陷报告的文本信息进行处理:
从缺陷报告的摘要和描述字段中提取文本特征;
利用分词将提取的文本特征分段为单词,并删除其中包含很少含义的停用词,数字和标点符号,之后应用Iterated Lovins Stemmer算法进行词干化处理以协调具有相似含义的单词;
根据词干化处理后的单词,使用one-hot模式将每个缺陷报告转换成文本向量;
S2、使用10折交叉验证的方法,将步骤S1得到的处理后文本信息分储为训练集和测试集;
S3、使用不平衡学习策略SMOTE算法对训练集做数据平衡处理:
将训练集的文本信息转换成文本特征向量之后,采用SMOTE算法对训练集进行平衡化处理;
根据文本特征向量的值,检测属于少数类中的每个缺陷的K个欧氏距离最相近的邻居,令K=1;
将每个缺陷及其K个最相似的邻居连接起来,并分别在这些连线中随机选择点,作为少数类别的新数据,以减少训练集的不平衡分布带给分类器的负面影响;
S4、使用多个分类器对经过平衡处理的训练集进行训练:
获取经过平衡处理的训练集数据后,开始对数据进行分类,获取训练集中缺陷报告属于每个类别的概率:
分别采用KNN,J48和NBM三种分类器来获取训练集中缺陷报告属于每个类别的概率;
S5、根据不同分类器对每个类别的发现能力不同,使用CPLEX约束求解器对多个分类器进行优化集成,把多个分类器的优点进行集成并输出:
包含权重训练阶段,权重调整阶段以及最小选择阶段;
权重训练:分类器对于每个样本会输出该样本属于不同类别的判别概率,通过比较概率的大小来确定目标的类别;并通过权重调整每个训练样本属于不同类别的判别概率,提高分类器的预测准确性;
提取训练集数据的特征,并确定缺陷报告是属于多数类还是少数类,相应结果用Ci表示,1表示多数类,-1表示少数类;
对训练集数据,使用分类器来进行自测,用表示多数类概率,用表示少数类概率;
将子目标函数建立等式:
子目标函数只包含两个结果,为1时表示第i个缺陷结果预测为真,为-1时为假;
使用约束求解器来获取合适的权重,以此来获得识别高影响缺陷报告的最高性能,优化目标即确定合适的权重值,约束则要求权重的和为1,并且每个权重的值都要在0到1之间;
权重调整:权重训练后,为每个分类器获得最合适的权重W0和W1;
权重W0和W1用于调整由相应分类器生成的预测结果:利用相应的W0来调整多数类概率利用相应的W1来调整少数类概率
最小选择:权重调整之后,获取三组预测结果,每组包含两个类别的概率,将最小值设置为在所有关于多数类的概率中呈现最小值,并且将最小值设置为在所有关于少数类的概率中呈现最小值,则每个缺陷包含关于多数类和少数类的
使用由中的最大值表示的类别来确定该缺陷的最终类型,最终进行输出。
S6、使用文本特征提取模块来对测试集中的报告进行文本特征提取;
使用步骤S5中的多个分类器对测试集中的缺陷报告进行预测,得到结果;
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (6)

1.一种基于不平衡学习策略高影响缺陷报告预测方法,其特征在于具有如下步骤:
S1、使用文本预处理方法对缺陷报告的文本信息进行处理;
S2、使用10折交叉验证的方法,将步骤S1得到的处理后文本信息分储为训练集和测试集;
S3、使用不平衡学习策略SMOTE算法对训练集做多次数据平衡处理;
S4、使用多个分类器对经过平衡处理的训练集进行训练;
S5、根据不同分类器对每个类别的发现能力不同,使用CPLEX约束求解器对多个分类器进行优化集成,把多个分类器的优点进行集成并输出;
S6、使用文本特征提取模块来对测试集中的缺陷报告进行文本特征提取;
使用步骤S5中的训练好的模型对测试集中的缺陷报告进行预测。
2.根据权利要求1所述的基于不平衡学习策略高影响缺陷报告预测方法,其特征在于:所述步骤S1的具体步骤如下:
从缺陷报告的摘要和描述字段中提取文本特征;
利用分词将提取的文本特征分段为单词,并删除其中包含很少含义的停用词,数字和标点符号,之后应用Iterated Lovins Stemmer算法进行词干化处理以协调具有相似含义的单词;
根据词干化处理后的单词,使用one-hot模式将每个缺陷报告转换成文本向量。
3.根据权利要求1所述的基于不平衡学习策略高影响缺陷报告预测方法,其特征在于:所述步骤S3的具体步骤如下:
将训练集的文本信息转换成文本特征向量之后,采用SMOTE算法对训练集进行平衡化处理;
根据文本特征向量的值,检测属于少数类中的每个缺陷的K个欧氏距离最相近的邻居;
将每个缺陷及其K个最相似的邻居连接起来,并分别在这些连线中随机选择点,作为少数类别的新数据,以减少训练集的不平衡分布带给分类器的负面影响。
4.根据权利要求1所述的基于不平衡学习策略高影响缺陷报告预测方法,其特征在于:所述步骤S4的具体步骤如下:
获取经过平衡处理的训练集数据后,开始对数据进行分类,获取训练集中缺陷报告属于每个类别的概率:
分别采用KNN,J48和NBM三种分类器来获取训练集中缺陷报告属于每个类别的概率。
5.根据权利要求1所述的基于不平衡学习策略高影响缺陷报告预测方法,其特征在于:所述步骤S5的具体步骤如下:
包含权重训练阶段,权重调整阶段以及最小选择阶段;
权重训练:分类器对于每个样本会输出该样本属于不同类别的判别概率,通过比较概率的大小来确定目标的类别;并通过权重调整每个训练样本属于不同类别的判别概率,提高分类器的预测准确性;
提取训练集数据的特征,并确定缺陷报告是属于多数类还是少数类,相应结果用Ci表示,1表示多数类,-1表示少数类;
对训练集数据,使用分类器来进行自测,用表示多数类概率,用表示少数类概率;
将子目标函数建立等式:
子目标函数只包含两个结果,为1时表示第i个缺陷结果预测为真,为-1时为假;
使用约束求解器来获取合适的权重,以此来获得识别高影响缺陷报告的最高性能;优化目标即确定合适的权重值,约束则要求权重的和为1,并且每个权重的值都要在0到1之间;
权重调整:权重训练后,为每个分类器获得最合适的权重W0和W1;
权重W0和W1用于调整由相应分类器生成的预测结果:利用相应的W0来调整多数类概率利用相应的W1来调整少数类概率
最小选择:权重调整之后,获取三组预测结果,每组包含两个类别的概率,将最小值设置为在所有关于多数类的概率中呈现最小值,并且将最小值设置为在所有关于少数类的概率中呈现最小值,则每个缺陷包含关于多数类和少数类的
使用由中的最大值表示的类别来确定该缺陷的最终类型,最终进行输出。
6.根据权利要求3所述的基于不平衡学习策略高影响缺陷报告预测方法,其特征在于:令K=1。
CN201811333585.3A 2018-11-09 2018-11-09 基于不平衡学习策略高影响缺陷报告预测方法 Active CN109491914B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811333585.3A CN109491914B (zh) 2018-11-09 2018-11-09 基于不平衡学习策略高影响缺陷报告预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811333585.3A CN109491914B (zh) 2018-11-09 2018-11-09 基于不平衡学习策略高影响缺陷报告预测方法

Publications (2)

Publication Number Publication Date
CN109491914A true CN109491914A (zh) 2019-03-19
CN109491914B CN109491914B (zh) 2021-11-30

Family

ID=65694161

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811333585.3A Active CN109491914B (zh) 2018-11-09 2018-11-09 基于不平衡学习策略高影响缺陷报告预测方法

Country Status (1)

Country Link
CN (1) CN109491914B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110059183A (zh) * 2019-03-22 2019-07-26 重庆邮电大学 一种基于大数据的汽车行业用户观点情感分类方法
CN110188047A (zh) * 2019-06-20 2019-08-30 重庆大学 一种基于双通道卷积神经网络的重复缺陷报告检测方法
CN110413792A (zh) * 2019-08-08 2019-11-05 大连海事大学 一种高影响力缺陷报告识别方法
CN110471854A (zh) * 2019-08-20 2019-11-19 大连海事大学 一种基于高维数据混合约简的缺陷报告指派方法
CN110704616A (zh) * 2019-09-09 2020-01-17 中盈优创资讯科技有限公司 设备告警工单识别方法及装置
CN111815167A (zh) * 2020-07-09 2020-10-23 杭州师范大学 一种自动化众包测试绩效考核方法和装置
CN111950580A (zh) * 2019-05-14 2020-11-17 国际商业机器公司 使用平衡训练集的分类器的预测准确性
CN112749079A (zh) * 2019-10-31 2021-05-04 中国移动通信集团浙江有限公司 软件测试的缺陷分类方法、装置及计算设备
CN113705720A (zh) * 2021-09-08 2021-11-26 中国科学院国家天文台 机器学习中应用权重修正来减低加权训练偏差的方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080263507A1 (en) * 2007-04-17 2008-10-23 Ching-Pao Chang Action-based in-process software defect prediction software defect prediction techniques based on software development activities
WO2014131262A1 (zh) * 2013-02-28 2014-09-04 华为技术有限公司 一种缺陷预测方法及装置
CN105589806A (zh) * 2015-12-17 2016-05-18 北京航空航天大学 一种基于SMOTE+Boosting算法的软件缺陷倾向预测方法
CN105677564A (zh) * 2016-01-04 2016-06-15 中国石油大学(华东) 基于改进的Adaboost软件缺陷不平衡数据分类方法
CN106201897A (zh) * 2016-07-26 2016-12-07 南京航空航天大学 基于主成分分布函数的软件缺陷预测不平衡数据处理方法
US9535818B2 (en) * 2012-10-16 2017-01-03 Microsoft Technology Licensing, Llc Identifying high impact bugs
CN107391369A (zh) * 2017-07-13 2017-11-24 武汉大学 一种基于数据筛选和数据过采样的跨项目缺陷预测方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080263507A1 (en) * 2007-04-17 2008-10-23 Ching-Pao Chang Action-based in-process software defect prediction software defect prediction techniques based on software development activities
US9535818B2 (en) * 2012-10-16 2017-01-03 Microsoft Technology Licensing, Llc Identifying high impact bugs
WO2014131262A1 (zh) * 2013-02-28 2014-09-04 华为技术有限公司 一种缺陷预测方法及装置
CN105589806A (zh) * 2015-12-17 2016-05-18 北京航空航天大学 一种基于SMOTE+Boosting算法的软件缺陷倾向预测方法
CN105677564A (zh) * 2016-01-04 2016-06-15 中国石油大学(华东) 基于改进的Adaboost软件缺陷不平衡数据分类方法
CN106201897A (zh) * 2016-07-26 2016-12-07 南京航空航天大学 基于主成分分布函数的软件缺陷预测不平衡数据处理方法
CN107391369A (zh) * 2017-07-13 2017-11-24 武汉大学 一种基于数据筛选和数据过采样的跨项目缺陷预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
冯亮: "缺陷报告自动分流技术研究", 《中国优秀硕士学位论文全文数据库》 *
郭世凯等: "Ensemble Data Reduction Techniques and Multi-RSMOTE via Fuzzy Integral for Bug Report Classification", 《IEEE ACCESS》 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110059183A (zh) * 2019-03-22 2019-07-26 重庆邮电大学 一种基于大数据的汽车行业用户观点情感分类方法
CN110059183B (zh) * 2019-03-22 2022-08-23 重庆邮电大学 一种基于大数据的汽车行业用户观点情感分类方法
CN111950580A (zh) * 2019-05-14 2020-11-17 国际商业机器公司 使用平衡训练集的分类器的预测准确性
CN110188047A (zh) * 2019-06-20 2019-08-30 重庆大学 一种基于双通道卷积神经网络的重复缺陷报告检测方法
CN110188047B (zh) * 2019-06-20 2023-04-18 重庆大学 一种基于双通道卷积神经网络的重复缺陷报告检测方法
CN110413792A (zh) * 2019-08-08 2019-11-05 大连海事大学 一种高影响力缺陷报告识别方法
CN110413792B (zh) * 2019-08-08 2022-10-21 大连海事大学 一种高影响力缺陷报告识别方法
CN110471854A (zh) * 2019-08-20 2019-11-19 大连海事大学 一种基于高维数据混合约简的缺陷报告指派方法
CN110471854B (zh) * 2019-08-20 2023-02-03 大连海事大学 一种基于高维数据混合约简的缺陷报告指派方法
CN110704616A (zh) * 2019-09-09 2020-01-17 中盈优创资讯科技有限公司 设备告警工单识别方法及装置
CN112749079A (zh) * 2019-10-31 2021-05-04 中国移动通信集团浙江有限公司 软件测试的缺陷分类方法、装置及计算设备
CN112749079B (zh) * 2019-10-31 2023-12-26 中国移动通信集团浙江有限公司 软件测试的缺陷分类方法、装置及计算设备
CN111815167A (zh) * 2020-07-09 2020-10-23 杭州师范大学 一种自动化众包测试绩效考核方法和装置
CN113705720A (zh) * 2021-09-08 2021-11-26 中国科学院国家天文台 机器学习中应用权重修正来减低加权训练偏差的方法
CN113705720B (zh) * 2021-09-08 2024-05-14 中国科学院国家天文台 机器学习中应用权重修正来减低加权训练偏差的方法

Also Published As

Publication number Publication date
CN109491914B (zh) 2021-11-30

Similar Documents

Publication Publication Date Title
CN109491914A (zh) 基于不平衡学习策略高影响缺陷报告预测方法
US20190303569A1 (en) Data type recognition, model training and risk recognition methods, apparatuses and devices
CN103729678B (zh) 一种基于改进dbn模型的水军检测方法及系统
CN102651088B (zh) 基于A_Kohonen神经网络的恶意代码分类方法
CN110298321A (zh) 基于深度学习图像分类的道路阻断信息提取
WO2019179403A1 (zh) 基于序列宽深学习的欺诈交易检测方法
CN108304316B (zh) 一种基于协同迁移的软件缺陷预测方法
CN107766929B (zh) 模型分析方法及装置
CN106611052A (zh) 文本标签的确定方法及装置
CN109583322A (zh) 一种人脸识别深度网络训练方法和系统
CN107644057B (zh) 一种基于迁移学习的绝对不平衡文本分类方法
CN108229580A (zh) 一种基于注意力机制及特征融合的眼底图中糖网特征分级装置
CN104573000B (zh) 基于排序学习的自动问答装置及方法
CN104834940A (zh) 一种基于支持向量机的医疗影像检查疾病分类方法
CN108345904A (zh) 一种基于随机敏感度采样的不平衡数据的集成学习算法
CN105975611A (zh) 自适应组合降采样增强学习机
CN110225055A (zh) 一种基于knn半监督学习模型的网络流量异常检测方法与系统
CN109902202A (zh) 一种视频分类方法及装置
CN106326913A (zh) 一种洗钱账户的确定方法及装置
CN109800810A (zh) 一种基于不平衡数据的少样本学习分类器构建方法
CN113989519B (zh) 一种长尾目标检测方法及系统
CN108416369A (zh) 基于Stacking和翻转随机降采样分类方法、系统、介质及设备
CN109657147A (zh) 基于萤火虫和加权极限学习机的微博异常用户检测方法
CN107368526A (zh) 一种数据处理方法及装置
CN104978569A (zh) 一种基于稀疏表示的增量人脸识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant