CN105159822A - 一种基于文本词性和程序调用关系的软件缺陷定位方法 - Google Patents

一种基于文本词性和程序调用关系的软件缺陷定位方法 Download PDF

Info

Publication number
CN105159822A
CN105159822A CN201510492477.0A CN201510492477A CN105159822A CN 105159822 A CN105159822 A CN 105159822A CN 201510492477 A CN201510492477 A CN 201510492477A CN 105159822 A CN105159822 A CN 105159822A
Authority
CN
China
Prior art keywords
source code
code file
defect
speech
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510492477.0A
Other languages
English (en)
Other versions
CN105159822B (zh
Inventor
周宇
童燕翔
王立松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Aeronautics and Astronautics
Original Assignee
Nanjing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Aeronautics and Astronautics filed Critical Nanjing University of Aeronautics and Astronautics
Priority to CN201510492477.0A priority Critical patent/CN105159822B/zh
Publication of CN105159822A publication Critical patent/CN105159822A/zh
Application granted granted Critical
Publication of CN105159822B publication Critical patent/CN105159822B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种基于文本词性和程序调用关系的软件缺陷定位方法,包括:1)提取缺陷报告里小结和描述的文本信息,根据词性标记提高缺陷报告中名词词项的权重以及小结模块所有词项的权重;2)根据开发者的需求参数ran滤除源代码文件不需要的成分,对缺陷报告文本信息和滤除后的源代码文件进行预处理;3)生成可疑缺陷源代码文件列表;4)通过字符串检索找到调用源文件,提高其相似度值校正原有排名;5)根据开发者的需求参数ran输出缺陷报告对应的缺陷源代码文件或者缺陷源代码文件列表。本发明利用文本词性调整词项权值,程序间的调用关系校正相似度值,以及根据程序员需求进行源代码文件滤除和最终结果输出,达到提高缺陷定位准确度的目的。

Description

一种基于文本词性和程序调用关系的软件缺陷定位方法
技术领域
本发明属于计算机技术领域,尤其指代一种基于文本词性和程序调用关系的软件缺陷定位方法。
背景技术
软件缺陷的及时修复对提高用户满意度相当重要,也是一个软件发展的重要环节。在软件发展周期中,软件缺陷定位成为维护时一个非常困难的工作,尤其是对那些不熟悉缺陷模块的开发者来说,更是耗时和令人烦躁的工作。通常使用软件缺陷跟踪系统(BTS)来管理软件缺陷以及需求。当一个软件发布以后,相应的BTS就负责收集程序测试人员或者终端用户提交的对软件缺陷的描述报告(即缺陷报告),软件的开发人员可以通过这些报告对软件进行适当的维护和完善。开发人员需要仔细阅读缺陷报告里的内容,发现关键字,例如:类名或者方法名,检索数以万计的源代码文件从而找出缺陷在源代码中的位置。为了减轻开发人员的工作,许多研究者开始着手提出软件缺陷定位的方法。
软件缺陷定位是软件工程领域中被广泛研究的主题,其大致可分为动态和静态的方法,动态方法使用预先设计好的测试用例对程序进行测试,在程序运行过程中收集程序的执行信息,通过收集的信息来判断缺陷可能存在的位置。最常用的是基于频谱的动态定位方法,定位的粒度可以精确到一个执行语句。可是动态定位也存在着测试用例的生成以及选择等复杂的问题。
静态的缺陷定位多采用信息检索的方法,通过分析代码和缺陷报告的特征,用这些特征计算得出缺陷与代码的相关性。与动态的缺陷定位方法不同,静态的方法不需要测试用例,可以使用开源软件数据来检验方法的有效性。静态的方法通常定位到代码文件级或者是程序方法级。信息检索中的多个模型被运用,如潜在语义索引模型,向量空间潜以及狄利克雷分配模型,这些模型都是将缺陷报告作为查询,而将代码文件作为检索的对象,通过计算缺陷报告与代码的相关性来定位缺陷。
近年来,研究者们利用缺陷之间的相似性来提高缺陷定位的效果。因为相似的缺陷可能出现在同一个位置,Zhou等人结合缺陷之间的相似性和缺陷文件之间的相似性,进一步提高缺陷定位的精度,并在2012年第34届软件工程国际会议ICSE发表论文,提出软件缺陷定位方法BugLocator,其中若该方法参数α=0,则表示该方法不运用相似缺陷报告这一模块。从此以后,更多的缺陷信息,包括缺陷的历史信息、相似的缺陷报告和文件的结构信息都被利用来提升缺陷定位。这些研究在对于缺陷文本的处理上,对所有词性的词项都已是一视同仁,也没有利用缺陷文件程序的调用关系。
发明内容
针对于上述问题,本发明的目的在于提供一种基于文本词性和程序调用关系的软件缺陷定位方法,利用文本词性调整词项权值,程序间的调用关系校正相似度值,以及根据程序员要求进行源代码文件滤除和最终结果输出,达到提高缺陷定位准确度的目的。
为达到上述目的,本发明的一种基于文本词性和程序调用关系的软件缺陷定位方法,包括步骤如下:
1)提取缺陷报告里小结和描述的文本信息,并标记文本词项的词性,然后根据词性标记提高缺陷报告文本信息中名词词项的权重并且整体提高小结模块所有词项的权重;
2)根据开发者的需求参数ran滤除源代码文件不需要的成分,同时对缺陷报告文本信息和滤除后的源代码文件进行预处理,得到特征词集合;
3)利用信息检索技术建立模型,计算缺陷报告与源代码文件的相似度,并根据相似度的大小生成可疑缺陷文件列表;
4)提取缺陷报告文本信息里所含的类名并找到其对应的源代码文件,找出这些源代码文件在列表中排名最高的源代码文件,通过字符串检索找到排名最高源代码文件调用的所有源代码文件,即调用源文件,适当提高调用源文件的相似度值来校正原有排名;
5)根据开发者的需求参数ran输出缺陷报告对应的缺陷源代码文件或者缺陷源代码文件列表。
优选地,所述步骤1)中标记词性是由开源的词性标记器来实现,输入词性标记器的为一个完整的句子,且逐句进行词性标记。
优选地,所述步骤1)还包括:通过增加名词与其他词性词项的频数比来实现其在整体文本中权重的提高。
优选地,所述步骤1)还包括:词项权重调整后,词项标记将会被删除,以释放内存。
优选地,所述步骤2)和5)中的开发者需求参数ran有两个值,即true和false;若ran值为true,则表示开发者针对单个缺陷报告只需要一个可疑的缺陷源代码文件,源代码文件滤除操作后将只留下类名和方法名,并且最后的输出为与缺陷报告相似度值最高的源代码文件;若ran值为false,则表示开发者针对单个缺陷报告需要N个可疑缺陷源代码文件,源代码文件滤除操作将只删除源代码里的注释,并且最后的输出为一个可疑缺陷源代码文件列表。
优选地,对于缺陷文件和滤除后源代码文件的预处理包括分词,去停用词和提取词干;且两者使用的停用词集合不同,特征词项是缺陷报告预处理后的词项。
优选地,所述步骤3)中提到的基于信息检索的建立的模型为向量空间模型,它将缺陷文件和源代码文件表示为一个个的词向量,词项在一个缺陷报告或者源代码文件的权重是由它在其中的词频和数据集中的逆文档频率决定的。
优选地,相似度计算主要是计算缺陷报告对应的词向量和源代码文件所对应的词向量的Cosine值,值越大表示对应的缺陷报告和源代码文件越相近,源代码文件是缺陷报告所描述问题的位置的可能性就越大。
优选地,所述步骤4)中提到的字符串检索是指扫描最高排名源代码文件的所有词项,如果扫到的词项是一个源代码文件的名字,那么这个源代码文件就是调用源文件。
优选地,调用源文件原来相似值的70%加上调用它的源代码文件的相似值的30%,得到该调用源文件新的相似度值。
本发明的有益效果:
本发明文本词性调整词项权值,程序间的调用关系校正相似度值,以及根据程序员要求进行源代码文件滤除和最终结果输出,达到提高缺陷定位准确度的目的。
附图说明
图1为本发明基于文本词性和程序调用关系的软件缺陷定位方法的流程图。
图2为图1模块二中抽取调用源文件,并校正调用源文件与缺陷报告相似度值的示意图。
具体实施方式
为了便于本领域技术人员的理解,下面结合实施例与附图对本发明作进一步的说明,实施方式提及的内容并非对本发明的限定。
参照图1至图2所示,本发明的一种基于文本词性和程序调用关系的软件缺陷定位方法,包括如下:
1、需求参数ran
需求参数ran皆出现在两个模块中,该参数为布尔类型,值域为true(真)或者false(假),主要是控制源带代码文件成分滤除和最终的结果输出。
如果ran值为true,则表示开发者针对单个缺陷报告只需要一个可疑的缺陷源代码文件,源代码文件滤除操作后将只留下类名和方法名,并且最后的输出为相似度值最高的源代码文件;如果ran值为false,则表示开发者对单个缺陷报告需要N个可疑缺陷源代码文件,源代码文件滤除操作将只删除源代码所有的注释,并且最后的输出相应的可疑缺陷源代码文件列表。
2、模块一
该模块一主要是实现文本词性的标记,词项权重的调整,以及缺陷报告与源代码文件相似度的计算。
从软件缺陷跟踪系统中提取缺陷报告,再从缺陷报告中提取文本属性的小结和描述两部分,然后将该两部分中的句子输入到词性标记器中,得到每个词项在整个句子中的词性;接着,通过增加名词与其他词性词项的频数比来实现其在整体文本中权重的提高,并通过增加小结词项与描述词项的频数比来实现提高小结的权重。
将调整过词项权重的文本进行预处理,包括分词、去停用词和提取词干,停用词可根据文本特性自由添加;经预处理后得到特征词集合。以特征词集合为索引词项建立空间词向量模型,将每个缺陷报告都表示成为基于特征词的词向量。
下载缺陷报告对应版本的项目源代码,根据参数ran的值对源代码文件的成分进行滤除。如果ran的值为true,那么只保留源代码文件的类名和方法名;如果ran的值为false,那么删除源代码文件中的所有注释。滤除操作后,对源代码文本进行预处理,包括分词,去停用词,提取词干,停用词可根据源码特性自由添加且一般与缺陷报告的停用词集合不同。利用上述向量空间模型表示每个源代码文件为一个词向量,词项在一个缺陷报告或者源代码文件的权重是由它在其中的词频和数据集中的逆文档频率决定的。
众所周知,两个向量之间的夹角越小,那么这两个向量越接近。我们利用两个向量的Cosine(余弦)值来判定两个向量的夹角大小;Cosine(余弦)值越大,两个向量的夹角越小,越接近。在相似度计算时,模块一添加了源代码文件长度这一系数,进一步提高定位的效果。根据相似度的值,我们得到了针对某个缺陷报告的可疑缺陷源代码文件列表。
3、模块二
该模块二利用程序的调用关系校正模块一计算得到的相似度值,利用了真实缺陷源代码文件之间存在调用关系这一规律。
提取某个缺陷报告文本里所含的类名并搜索源项目找到其对应的源代码文件,找出这些源代码文件在模块一生成列表中排名最高的源代码文件,扫描这个排名最高源代码文件的词项,如果扫到的词项是一个源代码文件的名字,那么这个源代码文件就是调用源文件;最后,通过适当提高调用源文件的相似度值来校正原有排名。本方法中提高调用源文件的相似度就是用调用源文件原来相似值的70%加上调用它的源代码文件的相似值的30%,得到该调用源文件新的相似度值。根据最后的相似度值大小得到针对这个缺陷报告的可疑缺陷源代码文件列表最后,根据需求参数ran进行输出,若ran的值为true,那么本方法为每个缺陷报告提供一个可疑缺陷源代码文件;若ran的值为false,那么本方法为每个缺陷报告提供N个可疑缺陷源代码文件(N大于1,具体的数值可由用户指定,例如5,10等,其意义为对应该缺陷报告的最有可能的前N个缺陷源代码文件)。
综上所述,本发明通过上述两个模块,既在模块一中利用文本词性自动调整词项的权重,达到更好的定位;且在模块二中充分利用程序调用关系进一步校正模块一计算的相似度值。随着模块一权重更加合理的调整以及模块二获得调用关系方法的进一步优化,整个系统也具有很好的提升空间。
参照表1,其为本发明的优越性验证的数据集,如下:
表2为本发明定位缺陷报告的结果,如下:
表3为软件缺陷定位方法BugLocator(α=0)与本发明方法的对比试验,如下:
表2和表3中N/A=NotApplicable表示没有适合该标签的内容,即当布尔参数值ran为true时,本发明只输出一个可疑缺陷源代码文件,不存在N=5和N=10的情况。MRR表示平均排序倒数,MAP表示平均精度均值,两者皆是评估软件缺陷定位的常用方法。
度量缺陷定位方法有效性有三种常用度量方法,即topN,MRR以及MAP。topN度量方法中,本方法比BugLocator(α=0)在N=1、N=5和N=10上皆有所提高。当ran值为true时,项目AspectJ的N=1值由22.73%提高到39.86%;项目Eclipse的N=1值由24.36%提高到30.93%;项目SWT的N=1值由31.63%提高到34.69%。当ran值为false时,项目AspectJ的N=1值增加了5.59%,N=5值增加了7.34%,N=10的值增加了3.45%;项目Eclipse的N=1值增加了3.93%,N=5值增加了4.31%,N=10的值增加了4.39%;项目SWT的N=1值增加了14.29%,N=5值增加了16.22%,N=10的值增加了8.61%。在度量方法MRR和MAP上,本方法比BugLocator(α=0)皆有所提高。
本发明具体应用途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进,这些改进也应视为本发明的保护范围。

Claims (10)

1.一种基于文本词性和程序调用关系的软件缺陷定位方法,其特征在于,包括步骤如下:
1)提取缺陷报告里小结和描述的文本信息,并标记文本词项的词性,然后根据词性标记提高缺陷报告文本信息中名词词项的权重并且整体提高小结模块所有词项的权重;
2)根据开发者的需求参数ran滤除源代码文件不需要的成分,同时对缺陷报告文本信息和滤除后的源代码文件进行预处理,得到特征词集合;
3)利用信息检索技术建立模型,计算缺陷报告与源代码文件的相似度,并根据相似度的大小生成可疑缺陷文件列表;
4)提取缺陷报告文本信息里所含的类名并找到其对应的源代码文件,找出这些源代码文件在列表中排名最高的源代码文件,通过字符串检索找到排名最高源代码文件调用的所有源代码文件,即调用源文件,适当提高调用源文件的相似度值来校正原有排名;
5)根据开发者的需求参数ran输出缺陷报告对应的缺陷源代码文件或者缺陷源代码文件列表。
2.根据权利要求1所述的基于文本词性和程序调用关系的软件缺陷定位方法,其特征在于,所述步骤1)中标记词性是由开源的词性标记器来实现,输入词性标记器的为一个完整的句子,且逐句进行词性标记。
3.根据权利要求2所述的基于文本词性和程序调用关系的软件缺陷定位方法,其特征在于,所述步骤1)还包括:通过增加名词与其他词性词项的频数比来实现其在整体文本中权重的提高。
4.根据权利要求3所述的基于文本词性和程序调用关系的软件缺陷定位方法,其特征在于,所述步骤1)还包括:词项权重调整后,词项标记将会被删除,以释放内存。
5.根据权利要求1所述的基于文本词性和程序调用关系的软件缺陷定位方法,其特征在于,所述步骤2)和5)中的布尔类型的开发者需求参数ran有两个值,即true和false;如果ran值为true,则表示开发者针对单个缺陷报告只需要一个可疑的缺陷源代码文件,源代码文件滤除操作后将只留下类名和方法名,并且最后的输出为与缺陷报告相似度值最高的源代码文件;如果ran值为false,则表示开发者针对单个缺陷报告需要N个可疑缺陷源代码文件,源代码文件滤除操作将只删除源代码里的注释,并且最后的输出为一个可疑缺陷源代码文件列表。
6.根据权利要求5所述的基于文本词性和程序调用关系的软件缺陷定位方法,其特征在于,对于缺陷报告和滤除后源代码文件的预处理包括分词,去停用词和提取词干;且两者使用的停用词集合不同,特征词项是缺陷报告预处理后的词项。
7.根据权利要求1所述的基于文本词性和程序调用关系的软件缺陷定位方法,其特征在于,所述步骤3)中提到的基于信息检索的建立的模型为向量空间模型,它将缺陷文件和源代码文件表示为一个个的词向量,词项在一个缺陷报告或者源代码文件的权重是由它在其中的词频和数据集中的逆文档频率决定的。
8.根据权利要求7所述的基于文本词性和程序调用关系的软件缺陷定位方法,其特征在于,相似度计算主要是计算缺陷报告对应的词向量和源代码文件所对应的词向量的Cosine值,值越大表示对应的缺陷报告和源代码文件越相近,源代码文件是缺陷报告所描述问题的位置的可能性就越大。
9.根据权利要求1所述的基于文本词性和程序调用关系的软件缺陷定位方法,其特征在于,所述步骤4)中提到的字符串检索是指扫描最高排名源代码文件的所有词项,若扫到的词项是一个源代码文件的名字,那么这个源代码文件就是调用源文件。
10.根据权利要求9所述的基于文本词性和程序调用关系的软件缺陷定位方法,其特征在于,调用源文件原来相似值的70%加上调用它的源代码文件的相似值的30%,得到该调用源文件新的相似度值。
CN201510492477.0A 2015-08-12 2015-08-12 一种基于文本词性和程序调用关系的软件缺陷定位方法 Expired - Fee Related CN105159822B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510492477.0A CN105159822B (zh) 2015-08-12 2015-08-12 一种基于文本词性和程序调用关系的软件缺陷定位方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510492477.0A CN105159822B (zh) 2015-08-12 2015-08-12 一种基于文本词性和程序调用关系的软件缺陷定位方法

Publications (2)

Publication Number Publication Date
CN105159822A true CN105159822A (zh) 2015-12-16
CN105159822B CN105159822B (zh) 2017-08-29

Family

ID=54800684

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510492477.0A Expired - Fee Related CN105159822B (zh) 2015-08-12 2015-08-12 一种基于文本词性和程序调用关系的软件缺陷定位方法

Country Status (1)

Country Link
CN (1) CN105159822B (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105677833A (zh) * 2016-01-06 2016-06-15 云南电网有限责任公司电力科学研究院 一种基于文本挖掘技术提取断路器故障特征信息的方法
CN107480049A (zh) * 2017-07-14 2017-12-15 东软集团股份有限公司 缺陷修复方法、装置和计算机设备
CN107729258A (zh) * 2017-11-30 2018-02-23 扬州大学 一种面向软件版本问题的程序故障定位方法
CN107844414A (zh) * 2016-09-21 2018-03-27 南京大学 一种基于缺陷报告分析的跨项目、并行化缺陷定位方法
CN107861865A (zh) * 2017-08-29 2018-03-30 平安普惠企业管理有限公司 Sdk定位方法、设备及计算机可读存储介质
CN108959090A (zh) * 2018-07-05 2018-12-07 北方工业大学 一种开发者调试行为与软件调试之间的影响分析装置
CN109165382A (zh) * 2018-08-03 2019-01-08 南京工业大学 一种加权词向量和潜在语义分析结合的相似缺陷报告推荐方法
CN109376092A (zh) * 2018-11-26 2019-02-22 扬州大学 一种面向缺陷补丁代码的软件缺陷原因自动分析方法
CN110175128A (zh) * 2019-05-29 2019-08-27 北京百度网讯科技有限公司 一种相似代码案例获取方法、装置、设备和存储介质
CN110543422A (zh) * 2019-09-05 2019-12-06 中国人民解放军国防科技大学 一种用于fpr的软件包代码缺陷数据处理方法、系统及介质
CN110598787A (zh) * 2019-09-12 2019-12-20 北京理工大学 一种基于自定步长学习的软件bug分类方法
CN111104306A (zh) * 2018-10-26 2020-05-05 伊姆西Ip控股有限责任公司 用于应用中的错误诊断的方法、装置和计算机存储介质
CN111124366A (zh) * 2019-12-23 2020-05-08 南京航空航天大学 一种基于信息检索的需求追踪恢复方法
CN111258905A (zh) * 2020-01-19 2020-06-09 中信银行股份有限公司 缺陷定位方法、装置和电子设备及计算机可读存储介质
CN112286799A (zh) * 2020-10-19 2021-01-29 杭州电子科技大学 结合句嵌入和粒子群优化算法的软件缺陷定位方法
CN112328475A (zh) * 2020-10-28 2021-02-05 南京航空航天大学 一种面向多可疑代码文件的缺陷定位方法
CN112527389A (zh) * 2020-12-15 2021-03-19 厦门海迈科技股份有限公司 一种国产处理器和操作系统适配Eclipse的方法
CN112597063A (zh) * 2021-02-26 2021-04-02 北京北大软件工程股份有限公司 缺陷代码定位的方法、装置以及存储介质
CN115563619A (zh) * 2022-09-27 2023-01-03 北京墨云科技有限公司 基于文本预训练模型的漏洞相似性对比方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101286132A (zh) * 2008-06-02 2008-10-15 北京邮电大学 一种基于软件缺陷模式的测试方法及系统
CN101639829A (zh) * 2009-08-28 2010-02-03 中国科学院软件研究所 一种软件缺陷报告分流方法及其系统
WO2010070490A1 (en) * 2008-12-18 2010-06-24 Koninklijke Philips Electronics, N.V. Software bug and performance deficiency reporting system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101286132A (zh) * 2008-06-02 2008-10-15 北京邮电大学 一种基于软件缺陷模式的测试方法及系统
WO2010070490A1 (en) * 2008-12-18 2010-06-24 Koninklijke Philips Electronics, N.V. Software bug and performance deficiency reporting system
CN101639829A (zh) * 2009-08-28 2010-02-03 中国科学院软件研究所 一种软件缺陷报告分流方法及其系统

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105677833A (zh) * 2016-01-06 2016-06-15 云南电网有限责任公司电力科学研究院 一种基于文本挖掘技术提取断路器故障特征信息的方法
CN105677833B (zh) * 2016-01-06 2019-03-12 云南电网有限责任公司电力科学研究院 一种基于文本挖掘技术提取断路器故障特征信息的方法
CN107844414A (zh) * 2016-09-21 2018-03-27 南京大学 一种基于缺陷报告分析的跨项目、并行化缺陷定位方法
CN107480049A (zh) * 2017-07-14 2017-12-15 东软集团股份有限公司 缺陷修复方法、装置和计算机设备
CN107861865A (zh) * 2017-08-29 2018-03-30 平安普惠企业管理有限公司 Sdk定位方法、设备及计算机可读存储介质
CN107861865B (zh) * 2017-08-29 2020-11-17 平安普惠企业管理有限公司 Sdk定位方法、设备及计算机可读存储介质
CN107729258A (zh) * 2017-11-30 2018-02-23 扬州大学 一种面向软件版本问题的程序故障定位方法
CN108959090A (zh) * 2018-07-05 2018-12-07 北方工业大学 一种开发者调试行为与软件调试之间的影响分析装置
CN109165382A (zh) * 2018-08-03 2019-01-08 南京工业大学 一种加权词向量和潜在语义分析结合的相似缺陷报告推荐方法
CN111104306A (zh) * 2018-10-26 2020-05-05 伊姆西Ip控股有限责任公司 用于应用中的错误诊断的方法、装置和计算机存储介质
CN109376092A (zh) * 2018-11-26 2019-02-22 扬州大学 一种面向缺陷补丁代码的软件缺陷原因自动分析方法
CN110175128A (zh) * 2019-05-29 2019-08-27 北京百度网讯科技有限公司 一种相似代码案例获取方法、装置、设备和存储介质
CN110543422B (zh) * 2019-09-05 2022-12-27 中国人民解放军国防科技大学 一种用于fpr的软件包代码缺陷数据处理方法、系统及介质
CN110543422A (zh) * 2019-09-05 2019-12-06 中国人民解放军国防科技大学 一种用于fpr的软件包代码缺陷数据处理方法、系统及介质
CN110598787B (zh) * 2019-09-12 2021-06-08 北京理工大学 一种基于自定步长学习的软件bug分类方法
CN110598787A (zh) * 2019-09-12 2019-12-20 北京理工大学 一种基于自定步长学习的软件bug分类方法
CN111124366A (zh) * 2019-12-23 2020-05-08 南京航空航天大学 一种基于信息检索的需求追踪恢复方法
CN111258905A (zh) * 2020-01-19 2020-06-09 中信银行股份有限公司 缺陷定位方法、装置和电子设备及计算机可读存储介质
CN112286799A (zh) * 2020-10-19 2021-01-29 杭州电子科技大学 结合句嵌入和粒子群优化算法的软件缺陷定位方法
CN112286799B (zh) * 2020-10-19 2024-03-12 杭州电子科技大学 结合句嵌入和粒子群优化算法的软件缺陷定位方法
CN112328475B (zh) * 2020-10-28 2021-11-30 南京航空航天大学 一种面向多可疑代码文件的缺陷定位方法
CN112328475A (zh) * 2020-10-28 2021-02-05 南京航空航天大学 一种面向多可疑代码文件的缺陷定位方法
CN112527389B (zh) * 2020-12-15 2022-09-20 厦门海迈科技股份有限公司 一种国产处理器和操作系统适配Eclipse的方法
CN112527389A (zh) * 2020-12-15 2021-03-19 厦门海迈科技股份有限公司 一种国产处理器和操作系统适配Eclipse的方法
CN112597063B (zh) * 2021-02-26 2021-06-08 北京北大软件工程股份有限公司 缺陷代码定位的方法、装置以及存储介质
CN112597063A (zh) * 2021-02-26 2021-04-02 北京北大软件工程股份有限公司 缺陷代码定位的方法、装置以及存储介质
CN115563619A (zh) * 2022-09-27 2023-01-03 北京墨云科技有限公司 基于文本预训练模型的漏洞相似性对比方法及系统

Also Published As

Publication number Publication date
CN105159822B (zh) 2017-08-29

Similar Documents

Publication Publication Date Title
CN105159822A (zh) 一种基于文本词性和程序调用关系的软件缺陷定位方法
WO2020233330A1 (zh) 批量测试方法、装置及计算机可读存储介质
CN110348441B (zh) 增值税发票识别方法、装置、计算机设备及存储介质
CN110019486A (zh) 数据采集方法、装置、设备及存储介质
CN109446885B (zh) 一种基于文本的元器件识别方法、系统、装置和存储介质
CN105844424A (zh) 基于网络评论的产品质量问题发现及风险评估方法
CN105912625A (zh) 一种面向链接数据的实体分类方法和系统
CN105824756B (zh) 一种基于代码依赖关系的过时需求自动检测方法及系统
CN111026433A (zh) 基于代码变更历史的软件代码质量问题自动修复方法、系统及介质
CN103473409A (zh) 一种基于知识库的fpga故障自动诊断方法
CN111125116B (zh) 定位业务表中代码字段及对应代码表的方法及系统
Kolovos et al. Assessing the Use of Eclipse MDE Technologies in Open-Source Software Projects.
US10346294B2 (en) Comparing software projects having been analyzed using different criteria
CN109344355A (zh) 针对网页变化的自动回归检测与块匹配自适应方法和装置
CN110765750A (zh) 报表数据录入方法及终端设备
Cheng et al. A similarity integration method based information retrieval and word embedding in bug localization
CN105653548A (zh) 一种电子文档页面类型识别方法和系统
Wang et al. Smart contract vulnerability detection using code representation fusion
CN111104159A (zh) 一种基于程序分析和神经网络的注释定位方法
CN102710833A (zh) 一种手机测试用例及其自动生成方法
CN105512270A (zh) 一种确定相关对象的方法和装置
CN110941952A (zh) 一种完善审计分析模型的方法及装置
CN111309853B (zh) 一种基于结构化信息的代码搜索方法
CN114416174A (zh) 基于元数据的模型重构方法、装置、电子设备及存储介质
CN109783477B (zh) 一种数据更新方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20151216

Assignee: Jiangsu Fenghuang Intelligent Education Research Institute Co.,Ltd.

Assignor: Nanjing University of Aeronautics and Astronautics

Contract record no.: X2020980003896

Denomination of invention: Software defect positioning method based on text part of speech and program call relation

Granted publication date: 20170829

License type: Common License

Record date: 20200708

EE01 Entry into force of recordation of patent licensing contract
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170829

CF01 Termination of patent right due to non-payment of annual fee