CN107247663B

CN107247663B - 一种冗余变异体识别方法

Info

Publication number: CN107247663B
Application number: CN201710329693.2A
Authority: CN
Inventors: 孙昌爱; 郭新玲
Original assignee: University of Science and Technology Beijing USTB
Current assignee: University of Science and Technology Beijing USTB
Priority date: 2017-05-11
Filing date: 2017-05-11
Publication date: 2020-05-08
Anticipated expiration: 2037-05-11
Also published as: CN107247663A

Abstract

本发明提供一种冗余变异体识别方法，能够减少变异测试过程中变异体的执行时间。所述方法包括：比较变异体与待测程序源代码，获取每个变异体的变异位置及变异内容，确定每个变异体所属的块类别；对待测程序源代码进行数据流分析，获取待测程序的数据流信息，结合获取的待测程序的数据流信息，对获取的每个变异体的变异内容上的变量进行分析，确定变异体的变异类型；其中，所述数据流信息包括：每个变量的定义‑使用链；根据确定的变异体所属的块类别和变异体的变异类型，按照预先定义的冗余变异体识别规则，分析待测程序的每条定义‑使用链，获取满足冗余变异体识别规则的变异体并标记为冗余变异体本发明涉及软件技术领域。

Description

一种冗余变异体识别方法

技术领域

本发明涉及软件技术领域，特别是指一种冗余变异体识别方法。

背景技术

软件测试的一个根本问题是如何通过较少的测试用例尽可能地检测出软件中潜藏的各种故障。软件测试的实践表明，要想找出程序中潜藏的所有故障几乎是不可能的(即完全充分性测试)，一种较为可行的办法是尽可能的缩小故障的搜索范围，以便于专门测试某类故障是否存在(相对充分性测试)，为此人们提出了基于故障的软件测试。

变异测试是一种基于故障的测试技术。变异测试的基本思想是：测试人员首先根据待测程序的特征向其程序代码中植入各种类型的故障，产生大量的错误程序。产生的一个错误程序称为待测程序的一个变异体，用来模仿某种故障的操作称为“变异算子”，变异算子一般在符合语法前提下仅对待测程序作微小改动。如果执行某个测试用例导致一个变异体与待测程序产生不同的结果，那么称该变异体被“杀死”，即与该变异体相关的故障能够被检测出来，反之称该变异体“存活”。若不存在任何测试用例，使在某一变异体与待测程序上的执行结果不同，则称该变异体为待测程序的一个等价变异体。针对给定的测试用例集，能够“杀死”的变异体数量占所有产生的非等价变异体数量的百分比，称为该测试用例集合的“变异得分”。变异得分可以定量的评估测试用例集的质量，变异得分越高，说明测试用例集杀死的变异体越多，其检测故障的能力越强。

变异测试又称为变异分析，其可行性基于“熟练程序员”假设(通过对待测程序作合乎语法的代码修改，可以模拟熟练程序员的实际编程行为)和“耦合效应”假设(若测试用例可以检测出简单缺陷，则该测试用例也易于检测出更为复杂的缺陷)。变异测试可用于衡量测试用例集的揭错能力，也可以通过植入错误来系统地模拟被测软件的各种真实缺陷，对已有测试用例集进行辅助评估。变异测试不仅成功应用于C、C#、Java、SQL等不同的编程语言中，开发出了Mothra、Proteum、MuJava、Muclipse等测试支持工具，并成功应用于测试规格说明书和程序模型上。主要应用于单元测试，当前在接口测试、面向对象软件的测试和合约测试等方面都有相关研究进展。研究结果表明，变异测试的故障检测能力强，与手工植入缺陷相比，自动生成的变异体模拟真实软件中的故障效果更佳，具有排错能力强、方便灵活等优点。

尽管如此，作为一种能够有效评估测试用例集质量的技术，变异测试技术并没有广泛应用于工业界，其主要原因如下：变异测试生成的变异体数量庞大且执行时间较长，使得分析过程中的计算开销较大。

发明内容

本发明要解决的技术问题是提供一种冗余变异体识别方法，以解决现有技术所存在的变异体执行时间开销较大的问题。

为解决上述技术问题，本发明实施例提供一种冗余变异体识别方法，包括：

对待测程序源代码进行程序块的划分，根据程序块划分结果生成规则文件；

比较变异体与待测程序源代码，获取每个变异体的变异位置及变异内容，并根据每个变异体的变异位置和生成的规则文件，确定每个变异体所属的块类别；

对待测程序源代码进行数据流分析，获取待测程序的数据流信息，结合获取的待测程序的数据流信息，对获取的每个变异体的变异内容上的变量进行分析，确定变异体的变异类型；其中，所述数据流信息包括：每个变量的定义-使用链；

根据确定的变异体所属的块类别和变异体的变异类型，按照预先定义的冗余变异体识别规则，分析待测程序的每条定义-使用链，获取满足冗余变异体识别规则的变异体并标记为冗余变异体。

进一步地，所述对待测程序源代码进行程序块的划分，根据程序块划分结果生成规则文件包括：

根据预先确定的基本块、选择块和循环块的定义，对待测程序源代码进行程序块的划分，根据程序块划分结果生成规则文件。

进一步地，一个待测程序对应一个规则文件，一个规则文件包含多条分块规则；

每条分块规则描述了相应程序块在待测程序源代码中的入口行数与出口行数。

进一步地，所述比较变异体与待测程序源代码，获取每个变异体的变异位置及变异内容，并根据每个变异体的变异位置和生成的规则文件，确定每个变异体所属的块类别包括：

比较变异体i与待测程序源代码，获取变异体i的变异行数及变异内容；

遍历规则文件中的分块规则，判定变异体i的变异行数是否属于分块规则BR_j定义的程序块范围；

若不属于分块规则BR_j定义的程序块范围，则继续对比规则文件中的下条分块规则；

若属于分块规则BR_j定义的程序块范围，则变异体i属于第j组，第j组的块类别就是变异体i的块类别。

进一步地，所述数据流信息还包括：每个变量的定义位置、使用位置；

所述对待测程序源代码进行数据流分析，获取待测程序的数据流信息包括：

对待测程序源代码进行数据流分析，获取每个函数中每个变量在待测程序源代码中出现的定义位置、使用位置；

根据变量在待测程序源代码中出现的定义位置、使用位置，判断变量属于变量定义或变量使用，并根据变量在待测程序源代码中出现的定义位置、使用位置及判断结果生成定义-使用链。

进一步地，在根据确定的变异体所属的块类别和变异体的变异类型，按照预先定义的冗余变异体识别规则，分析待测程序的每条定义-使用链，获取满足冗余变异体识别规则的变异体并标记为冗余变异体之前，所述方法还包括：

在程序块层次上采用数据流对不同变异体在变异后的程序状态进行分析；

根据不同变异体在变异后是否出现程序状态改变的原则来定义冗余变异体识别规则。

进一步地，所述冗余变异体识别规则包括：

若对变量v的一个定义-使用链du(v,s1,s2)，当变异算子在变量定义s1处生成变异体集合M_def，变异算子作用在变量使用s2处生成变异体集合M_use，且s1和s2处于同一个基本块时，M_use是M_def的冗余变异体。

进一步地，所述冗余变异体识别规则包括：

若对变量v的一个定义-使用链du(v,s1,s2)，当变异算子在变量定义s1处生成变异体集合M_def，变异算子作用在变量使用s2处生成变异体集合M_use，且s2所处的基本块是s1所处基本块的任意个上层块的某个顺接块时，M_use是M_def的冗余变异体。

进一步地，所述冗余变异体识别规则包括：

若待测程序中存在含有变量v的函数调用，S_m→n为函数m调用函数n的调用语句，变量v在函数n的变量使用s2处使用，且在使用前没有对v的变量定义，则对变量v的一个定义-使用链du(v,S_m→n,s2)，当变异算子作用在函数调用语句S_m→n上生成变异体集合M_m→n，变异算子作用在变量使用s2上生成变异体集合M_use，且变量使用s2所处的基本块没有上层块时，M_use是M_m→n的冗余变异体。

进一步地，所述冗余变异体识别规则包括：

若S_printf表示待测程序中没有变量的输出语句，变异算子作用在谓词表达式φ上生成变异体集合M_φ，变异算子作用在S_printf上生成变异体集合M_printf，则当谓词表达式φ所处的选择块或循环块是S_printf所处的基本块的上层块时，M_printf是M_φ的冗余变异体。

本发明的上述技术方案的有益效果如下：

上述方案中，对待测程序源代码进行程序块的划分，根据程序块划分结果生成规则文件；比较变异体与待测程序源代码，获取每个变异体的变异位置及变异内容，并根据每个变异体的变异位置和生成的规则文件，确定每个变异体所属的块类别；对待测程序源代码进行数据流分析，获取待测程序的数据流信息，结合获取的待测程序的数据流信息，对获取的每个变异体的变异内容上的变量进行分析，确定变异体的变异类型；其中，所述数据流信息包括：每个变量的定义-使用链；根据确定的变异体所属的块类别和变异体的变异类型，按照预先定义的冗余变异体识别规则，分析待测程序的每条定义-使用链，获取满足冗余变异体识别规则的变异体并标记为冗余变异体。这样，在执行变异测试之前，可以利用本实施例所述的冗余变异体识别方法识别冗余变异体，在进行变异测试时，不需要再执行这些冗余变异体来判断其能不能被杀死，减少了变异测试过程中变异体的数量，从而缩短了变异测试过程中变异体的执行时间，提高了变异测试的效率，有助于变异测试在实践中的推广使用。

附图说明

图1为本发明实施例提供的冗余变异体识别方法的流程示意图。

具体实施方式

为使本发明要解决的技术问题、技术方案和优点更加清楚，下面将结合附图及具体实施例进行详细描述。

本发明针对现有的变异体执行时间开销较大的问题，提供一种冗余变异体识别方法。

为了更好地理解本发明，先对冗余变异体进行简要说明：

在变异测试中，即使只选取5％的变异体子集，能杀死这些变异体子集的测试用例子集依然可以杀死98％以上的变异体。因此，可以推测在变异测试中存在一些变异体，对测试用例集中的所有测试用例来说，当其能杀死变异体A时一定能杀死变异体B，则称变异体B为冗余变异体。冗余变异体的定义如下：给定待测程序源代码p，变异体m1、m2，测试用例集ts，若对

都有

则变异体m2是相对变异体m1的冗余变异体，记作

其中，t表示测试用例；m1(t)、p(t)、m2(t)分别表示测试用例t在变异体m1、待测程序p、变异体m2上的执行结果。

如图1所示，本发明实施例提供的冗余变异体识别方法，包括：

步骤101，对待测程序源代码进行程序块的划分，根据程序块划分结果生成规则文件；

步骤102，比较变异体与待测程序源代码，获取每个变异体的变异位置及变异内容，并根据每个变异体的变异位置和生成的规则文件，确定每个变异体所属的块类别；

步骤103，对待测程序源代码进行数据流分析，获取待测程序的数据流信息，结合获取的待测程序的数据流信息，对获取的每个变异体的变异内容上的变量进行分析，确定变异体的变异类型；其中，所述数据流信息包括：每个变量的定义-使用链；

步骤104，根据确定的变异体所属的块类别和变异体的变异类型，按照预先定义的冗余变异体识别规则，分析待测程序的每条定义-使用链，获取满足冗余变异体识别规则的变异体并标记为冗余变异体。

本发明实施例所述的冗余变异体识别方法，对待测程序源代码进行程序块的划分，根据程序块划分结果生成规则文件；比较变异体与待测程序源代码，获取每个变异体的变异位置及变异内容，并根据每个变异体的变异位置和生成的规则文件，确定每个变异体所属的块类别；对待测程序源代码进行数据流分析，获取待测程序的数据流信息，结合获取的待测程序的数据流信息，对获取的每个变异体的变异内容上的变量进行分析，确定变异体的变异类型；其中，所述数据流信息包括：每个变量的定义-使用链；根据确定的变异体所属的块类别和变异体的变异类型，按照预先定义的冗余变异体识别规则，分析待测程序的每条定义-使用链，获取满足冗余变异体识别规则的变异体并标记为冗余变异体。这样，在执行变异测试之前，可以利用本实施例所述的冗余变异体识别方法识别冗余变异体，在进行变异测试时，不需要再执行这些冗余变异体来判断其能不能被杀死，减少了变异测试过程中变异体的数量，从而缩短了变异测试过程中变异体的执行时间，提高了变异测试的效率，有助于变异测试在实践中的推广使用。

在前述冗余变异体识别方法的具体实施方式中，进一步地，所述对待测程序源代码进行程序块的划分，根据程序块划分结果生成规则文件包括：

本实施例中，可以根据预先确定的基本块、选择块和循环块的定义，分析待测程序源代码的结构，对待测程序源代码进行程序块的划分，确定待测程序的各种块结构，并生成规则文件。

本实施例中，基本块、选择块、循环块的定义如下：

定义1(基本块)：

其中，BasicBlock表示基本块；Statement_i表示待测程序中的逻辑语句行i，Statement_i,...,j表示由逻辑语句i到j构成的逻辑语句行的段；Statement_x＜Statement_y当且仅当Statement_x执行后立即执行Statement_y；其中，∧表示逻辑联接词“与”，

表示逻辑联接词“取反”，

表示存在量词。

定义2(选择块)：

选择块(ChoiceBlock)表示谓词表达式φ及其控制的选择执行的代码区域Region_i所组成的执行区域。ChoiceBlock＝(φ)＜Region_i；其中，φ表示其值可取true或false的谓词表达式；Region_i表示基本块、选择块、循环块或者它们之间组合的一个控制依赖区域。

定义3(循环块)：

循环块(LoopBlock)表示当循环谓词表达式满足时，选择重复执行的代码区域Region_i。LoopBlock＝((φ)＜Region_i)⁺；其中，φ表示其值可取true或false的谓词表达式；Region_i表示基本块、选择块、循环块或者它们之间组合的一个控制依赖区域；只有当谓词表达式φ为true时，Region_i才会执行。

基本块、选择块、循环块都是代码序列中一组顺序执行的语句序列，只有一个入口和一个出口。而划分块的实质就是定义入口和出口语句。基本块、选择块、循环块都之间存在以下的块关系：

定义4(上层块关系(UpperBlock))：

B_j是B_i的上层块关系(B_j＝UpperBlock(B_i))，当且仅当满足以下条件：

(1)B_i,B_j∈BasicBlock∨ChoiceBlock∨LoopBlock；其中，∨表示逻辑联接词“或”；

(2)如果B_j执行可能引起B_i执行,而且B_i执行后B_j继续执行。

定义5(顺接块关系(NextBlock))：

B_j是B_i的顺接块关系(B_j＝NextBlock(B_i))，当且仅当满足以下条件：

(1)B_i,B_j∈BasicBlock∨ChoiceBlock∨LoopBlock；

(2)如果B_i执行必然引起B_j执行，而B_j执行不会导致B_i执行。

在前述冗余变异体识别方法的具体实施方式中，进一步地，一个待测程序对应一个规则文件，一个规则文件包含多条分块规则；

本实施例中，一个待测程序对应一个规则文件，一个规则文件包含多条分块规则(BR)；所述规则文件中包含的分块规则描述了待测程序源代码行数与程序块号之间的关系；具体的，每条分块规则描述了相应程序块在待测程序源代码中的入口行数R_I与出口行数R_O，可以表示为：BR＝{<R_I，R_O>}。

本实施例中，由于变异测试生成的变异体数量较多，需要自动化实现变异体变异位置分析，否则手动比较所有变异体和待测程序源代码会耗费大量时间，为此需要编写相应的分析脚本，该脚本能够自动化逐个比较变异体与待测程序源代码，提取变异体变异位置信息。

本实施例中，根据编写的脚本，逐个比较变异体与待测程序源代码的不同之处，获取所有变异体的变异位置(具体为：变异行数)及变异内容，并根据变异体的变异位置确定变异体所属的块类别。例如，可以使用diff命令对比待测程序源代码和变异体，获取变异体的变异行数及变异内容，截取变异体的变异行数R_d，然后遍历分块规则文件中的分块规则，判定R_d是否属于分块规则BR_j定义的程序块范围内；若不属于，则继续对比下条分块规则；若属于，则该变异体属于第j组，则第j组的块类别就是变异体的块类别。

本实施例中，以变异体i为例，作为一可选实施例，所述比较变异体与待测程序源代码，获取每个变异体的变异位置及变异内容，并根据每个变异体的变异位置和生成的规则文件，确定每个变异体所属的块类别包括：

在前述冗余变异体识别方法的具体实施方式中，进一步地，所述数据流信息还包括：每个变量的定义位置、使用位置；

本实施例中，所述对待测程序源代码进行数据流分析，获取待测程序的数据流信息包括具体步骤可以包括：

采用数据流分析技术，逐个分析每个函数的每个变量在待测程序源代码中出现的定义位置、使用位置，根据每个变量在待测程序源代码中出现的定义位置、使用位置，判断每个变量是属于变量定义或变量使用，并根据每个变量的定义位置、使用位置及判断结果生成每个变量的所有定义-使用链。

本实施例中，所述数据流分析技术为静态分析技术。

在前述冗余变异体识别方法的具体实施方式中，进一步地，在根据确定的变异体所属的块类别和变异体的变异类型，按照预先定义的冗余变异体识别规则，分析待测程序的每条定义-使用链，获取满足冗余变异体识别规则的变异体并标记为冗余变异体之前，所述方法还包括：

本实施例中，可以定义一组冗余变异体识别规则，逐个分析待测程序的每条定义-使用链，寻找满足冗余变异体识别规则的变异体，标记为冗余变异体。

本实施例中，所述冗余变异体是指如果测试用例集中能杀死变异体A的所有测试用例也一定能杀死变异体B，称变异体B为变异体A的冗余变异体。

本实施例中，定义所述冗余变异体识别规则的思想在于：由于待测程序在某个时刻的状态表现为一组变量的值的集合，变量的定义通常改变程序的状态，而变量的使用是不改变程序状态。当分析两个变异体是否存在冗余关系时，需要在同一时刻分析两个变异体的程序状态，且分析点要设置在变异点靠后的变异体的变异点处分析。在这个分析点处，如果变异体是在变量使用处变异，则该变异对程序状态的改变会直接体现出来；如果变异体是在变量定义处变异，那么该变异对程序状态的改变也会通过变量的使用传播到分析点处。因此，可以，在程序块层次上采用数据流分析确定不同变异体在变异后是否出现类似的程序状态改变来定义冗余变异体识别规则，例如，是否都改变了该分析点处某个变量的值。

本实施例中，为了更好地理解冗余变异体识别规则，先对冗余变异体识别规则中用到的一些概念进行定义：

定义6：

如果模块m调用了模块n，则称m是n的调用模块，记作caller；相应地，n是m的被调用模块，记作callee，并将m调用n记作m→n；如果m调用n时有变量v传递，将m调用n记作

定义7(变量定义)：

设s是待测程序p中的一条赋值语句，v为s中被赋值的变量，则s为关于v的变量定义，记作def(v,s)。

定义8(变量使用)：

设s是待测程序p中的一条语句，v为s出现的变量，并且此时不是对v的赋值，则s为关于v的变量使用，记作use(v,s)。

定义9(定义-使用链)：

设在控制流图(CFG)中存在一条从def(v,s1)到use(v,s2)的路径path，且path上不存在def(v,s’)(s1<s’<s2)，则du(v,s1,s2)称为变量v的一个定义-使用链。

定义10(定义变异)：

变异算子作用在def(v,s)上生成变异体的变异过程称为定义变异，所生成的变异体集合为M_def，记作def(v,s)→M_def。

定义11(使用变异)：

变异算子作用在use(v,s)上的变量v处生成变异体的变异过程称为使用变异，所生成的变异体集合为M_use，记作use(v,s)→M_use。

本实施例中，所述冗余变异体识别规则包括：

对变量v的一个定义-使用链du(v,s1,s2)，若def(v,s1)→M_def，use(v,s2)→M_use，且def(v,s1)∈BasicBlock_i，use(v,s2)∈BasicBlock_j，则当BasicBlock_i与BasicBlock_j满足以下4种规则时，M_use是M_def的冗余变异体：

规则1BasicBlock_i＝BasicBlock_j；

规则2BasicBlock_j＝(NextBlock((UpperBlock(BasicBlock_i))*))⁺；

规则3s1是函数调用语句

且n中不存在def(v,s’)(s’<s2)，

另外，当程序中存在规则4所述结构时，变异体之间也存在冗余关系：

规则4用S_printf表示没有变量的输出语句，S_φ表示谓词表达式φ所在的判断语句，若S_φ→M_φ，S_printf→M_printf，且S_φ∈Block_i，S_printf∈BasicBlock_j，则当Block_i＝UpperBlock(BasicBlock_j)，Block_i∈ChoiceBlock∨LoopBlock时

本实施例中，作为一可选实施例，所述冗余变异体识别规则包括：

本实施例中，作为又一可选实施例，所述冗余变异体识别规则包括：

本实施例中，作为再一可选实施例，所述冗余变异体识别规则包括：

本实施例中，所述冗余变异体识别规则可以根据待测程序的不同结构、结合变异体所属的块类别及变异类型，描述在数据流方面冗余变异体的基本特征。确定变异体所属的块类别和变异体变异类型后，可以根据定义的冗余变异体识别规则，逐个分析待测程序的每条定义-使用链，寻找满足冗余变异体识别规则的变异体，标记为冗余变异体。

本实施例中，在执行变异测试之前，可以利用本实施例所述的冗余变异体识别方法识别冗余变异体，这样，在进行变异测试时，不需要再执行这些冗余变异体来判断其能不能被杀死，减少了执行时变异体的数量，从而缩短了变异体的执行时间，提高了变异测试的效率。而且，随着待测程序规模的扩大，本实施例所述的冗余变异体识别方法使用的时间要远少于执行这些冗余变异体的时间，因此，本实施例所述的冗余变异体识别方法能减少变异测试的执行时间，提高变异测试的效率，对于变异测试技术优化具有十分重要的意义。

根据如下待测程序源代码对本发明实施例提供的冗余变异体识别方法进行详细说明，所述待测程序源代码表示为：

首先,对待测程序源代码进行程序块的划分，根据程序块划分结果生成规则文件；分块结果和分块规则表示为：

程序块1分块结果：BR₁＝{<18，19>}，BR₁∈BasicBlock；

程序块2分块结果：BR₂＝{<22，22>}，BR₂∈BasicBlock；

程序块3分块结果：BR₃＝{<24，25>}，BR₃∈BasicBlock；

程序块4分块结果：BR₄＝{<16，26>}，BR₄∈ChoiceBlock

程序块5分块结果：BR₅＝{<27，28>}，BR₅∈BasicBlock；

程序块6分块结果：BR₆＝{<31，32>}，BR₆∈BasicBlock；

程序块7分块结果：BR₇＝{<29，33>}，BR₇∈LoopBlock；

程序块8分块结果：BR₈＝{<34，35>}，BR₈∈BasicBlock；

程序块9分块结果：BR₉＝{<178，178>}，BR₉∈BasicBlock；

程序块10分块结果：BR₁₀＝{<180，180>}，BR₁₀∈BasicBlock；

程序块11分块结果：BR₁₁＝{<179，181>}，BR₁₁∈ChoiceBlock；

程序块12分块结果：BR₁₂＝{<200，200>}，BR₁₂∈BasicBlock；

程序块13分块结果：BR₁₃＝{<199，200>}，BR₁₃∈ChoiceBlock；

根据分块结果和分块规则可以看出：在函数main()中，BR₄＝UpperBlock(BR₁)＝UpperBlock(BR₂)＝UpperBlock(BR₃)，BR₅＝NextBlock(BR₄)，BR₇＝UpperBlock(BR₆)，BR₇＝NextBlock(BR₅)，BR₈＝NextBlock(BR₇)；在函数print_token()中，BR₁₁＝UpperBlock(BR₁₀)，BR₁₁＝NextBlock(BR₉)，BR₁₃＝UpperBlock(BR₁₂)。

假设待测程序共生成8个变异体，变异位置和变异内容如下表所示：

其次，在Linux环境下使用diff命令分析这8个变异体的变异位置及变异内容，可知，变异体M₁∈BR₁，且对变量fname是定义变异；变异体M₂∈BR₅，且对变量fname是使用变异，对变量tp是定义变异；变异体M₃∈BR₅，且对变量tp是使用变异，对变量tok是定义变异；变异体M₄∈BR₆，且对变量tp是使用变异，对变量tok是定义变异；变异体M₅∈BR₈，且对变量tok是使用变异；变异体M₆∈BR₉，且对变量type是定义变异，对变量tok是使用变异；变异体M₇是判断谓词变异，M₇∈BR₁₃；变异体M₈∈BR₁₂，且是在没有变量的输出语句上的变异。

之后，借助Frama-C工具分析可知，在示例代码中，main()函数中有fname，tok，tp三个变量。变量fname在18,19,22,27行出现，其中18,19,22行是变量定义，27行是变量使用，构成du(fname,19,27)和du(fname,22,27)两条定义-使用链。变量tp在27,28,32行出现，其中27行是变量定义，28,32行是变量使用，构成du(tp,27,28)和du(tp,27,32)两条定义-使用链。变量tok在28,29,31,32,34行出现，其中25,32行是变量定义，29,31,34行是变量使用，构成du(tok,28,29),du(tok,28,31),du(tok,28,34),du(tok,31,29),du(tok,31,34)这5条定义-使用链。在print_token()函数中有tok，type两个变量。变量tok是通过其他函数调用作为形参传递过来的，并在178,180行使用，构成du(tok,34,178),du(tok,34,180)等定义-使用链。变量type在178,179,199行出现，其中178行是变量定义，179,199行是变量使用，构成du(type,178,179),du(type,178,199)等定义-使用链。

最后，逐个分析上一步所识别的定义-使用链，根据定义的冗余变异体识别规则识别冗余变异体。

·变量fname：对定义-使用链du(fname,19,27)，19行变异生成的变异体为M₁，处于BR₁基本块；27行在fname处变异生成的一个变异体为M₂，处于BR₅基本块；且块BR₄是块BR₁的上层块，块BR₅是BR₄的顺接块。满足规则2，因此变异体M₂是变异体M₁的冗余变异体。同理定义-使用链du(fname,22,27)也满足规则2。

·变量tp：对定义-使用链du(tp,27,28)，27行变异生成的一个变异体为M₂，处于BR₅基本块；28行在tp处变异生成的一个变异体为M₃，处于BR₅基本块。满足规则1，因此变异体M₃是变异体M₂的冗余变异体。而定义-使用链du(tp,27,32)不满足任何规则。

·变量tok(main()函数)：对定义-使用链du(tok,31,34)，31行变异生成的一个变异体为M₄，处于BR₆基本块；34行在tok处变异生成的一个变异体为M₅，处于BR₈基本块；且块BR₇是块BR₆的上层块，块BR₈是BR₇的顺接块。满足规则2，因此变异体M₅是变异体M₄的冗余变异体。对定义-使用链du(tok,28,34)，28行变异生成的一个变异体为M₃，处于BR₅基本块；34行在tok处变异生成的一个变异体为M₅，处于BR₈基本块；且块BR₇是块BR₅的顺接块，块BR₈是BR₇的顺接块。满足规则2，因此变异体M₅是变异体M₃的冗余变异体。其余定义-使用链不满足任何规则。

·变量tok(print_token()函数)：main()函数在34行调用print_token()函数，并有变量tok作为参数传递。对定义-使用链du(tok,34,178)，34行是函数调用语句，生成的一个变异体为M₅；178行变量tok使用，并且print_token()函数在178行之前没有对变量tok重新定义；178行在tok处变异生成的一个变异体为M₆，处于BR₉基本块；且块BR₉没有上层块。满足规则3，因此变异体M₆是变异体M₅的冗余变异体。其余定义-使用链不满足任何规则。

·在199行判断谓词type＝＝6变异生成M₇，200行的一个没有变量的输出语句变异生成M₈，由于M₇处于BR₁₃选择块，M₈处于BR₁₂基本块，且BR₁₃是BR₁₂的上层块，满足规则4，因此变异体M₈是变异体M₇的冗余变异体。

以上所述是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明所述原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种冗余变异体识别方法，其特征在于，包括：

根据确定的变异体所属的块类别和变异体的变异类型，按照预先定义的冗余变异体识别规则，分析待测程序的每条定义-使用链，获取满足冗余变异体识别规则的变异体并标记为冗余变异体；

其中，给定待测程序源代码p，变异体m1、m2，测试用例集ts，若对

∈ts，都有

则变异体m2是相对变异体m1的冗余变异体，记作

其中，t表示测试用例；m1(t)、p(t)、m2(t)分别表示测试用例t在变异体m1、待测程序源代码p、变异体m2上的执行结果；

其中，所述冗余变异体识别规则包括：

若对变量v的一个定义-使用链du(v,s1,s2)，当变异算子在变量定义s1处生成变异体集合M_def，变异算子作用在变量使用s2处生成变异体集合M_use，且s1和s2处于同一个基本块时，M_use是M_def的冗余变异体；

其中，所述冗余变异体识别规则包括：

若对变量v的一个定义-使用链du(v,s1,s2)，当变异算子在变量定义s1处生成变异体集合M_def，变异算子作用在变量使用s2处生成变异体集合M_use，且s2所处的基本块是s1所处基本块的任意个上层块的某个顺接块时，M_use是M_def的冗余变异体；

其中，所述冗余变异体识别规则包括：

若待测程序中存在含有变量v的函数调用，S_m→n为函数m调用函数n的调用语句，变量v在函数n的变量使用s2处使用，且在使用前没有对v的变量定义，则对变量v的一个定义-使用链du(v,S_m→n,s2)，当变异算子作用在函数调用语句S_m→n上生成变异体集合M_m→n，变异算子作用在变量使用s2上生成变异体集合M_use，且变量使用s2所处的基本块没有上层块时，M_use是M_m→n的冗余变异体；

其中，所述冗余变异体识别规则包括：

2.根据权利要求1所述的冗余变异体识别方法，其特征在于，所述对待测程序源代码进行程序块的划分，根据程序块划分结果生成规则文件包括：

3.根据权利要求1或2所述的冗余变异体识别方法，其特征在于，一个待测程序对应一个规则文件，一个规则文件包含多条分块规则；

4.根据权利要求1所述的冗余变异体识别方法，其特征在于，所述比较变异体与待测程序源代码，获取每个变异体的变异位置及变异内容，并根据每个变异体的变异位置和生成的规则文件，确定每个变异体所属的块类别包括：

5.根据权利要求1所述的冗余变异体识别方法，其特征在于，所述数据流信息还包括：每个变量的定义位置、使用位置；

6.根据权利要求1所述的冗余变异体识别方法，其特征在于，在根据确定的变异体所属的块类别和变异体的变异类型，按照预先定义的冗余变异体识别规则，分析待测程序的每条定义-使用链，获取满足冗余变异体识别规则的变异体并标记为冗余变异体之前，所述方法还包括：