CN112817841B - 基于路径覆盖的通信确定mpi并行程序测试数据生成方法 - Google Patents

基于路径覆盖的通信确定mpi并行程序测试数据生成方法 Download PDF

Info

Publication number
CN112817841B
CN112817841B CN202110082992.7A CN202110082992A CN112817841B CN 112817841 B CN112817841 B CN 112817841B CN 202110082992 A CN202110082992 A CN 202110082992A CN 112817841 B CN112817841 B CN 112817841B
Authority
CN
China
Prior art keywords
test data
path
sub
parallel program
individuals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110082992.7A
Other languages
English (en)
Other versions
CN112817841A (zh
Inventor
杜小智
贺红梅
刘晋兰
董鸿磊
张金金
段宇蓉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Jiaotong University
Original Assignee
Xian Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Jiaotong University filed Critical Xian Jiaotong University
Priority to CN202110082992.7A priority Critical patent/CN112817841B/zh
Publication of CN112817841A publication Critical patent/CN112817841A/zh
Application granted granted Critical
Publication of CN112817841B publication Critical patent/CN112817841B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Prevention of errors by analysis, debugging or testing of software
    • G06F11/3668Testing of software
    • G06F11/3672Test management
    • G06F11/3684Test management for test design, e.g. generating new test cases
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Prevention of errors by analysis, debugging or testing of software
    • G06F11/3668Testing of software
    • G06F11/3672Test management
    • G06F11/3688Test management for test execution, e.g. scheduling of test suites
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开一种基于路径覆盖的通信确定MPI并行程序测试数据生成方法,包括如下步骤:S1,对待测试的MPI并行程序进行部署;S2,获取MPI并行程序的目标路径;S3,确定所述目标路径的初始测试数据集;S4,将每个初始测试数据的分量对应地划分给MPI并行程序的每一个子进程;S5,对所述子进程和所述MPI并行程序应用协同交叉人工蜂群搜索算法产生测试数据。本发明基于路径覆盖的通信确定MPI并行程序测试数据生成方法中,对子进程和所述MPI并行程序应用协同交叉人工蜂群搜索算法产生测试数据,协同交叉人工蜂群搜索算法将人工蜂群算法、单点交叉和协同机制很好的融合起来,从而解决了因并行程序自身特点而带来的测试数据生成问题。

Description

基于路径覆盖的通信确定MPI并行程序测试数据生成方法
技术领域
本发明涉及软件工程领域,涉及测试数据生成方法,尤其涉及一种基于路径覆盖的通信确定MPI并行程序测试数据生成方法。
背景技术
并行程序具有求解问题高效的特点,这要归功于其运行过程中多个进程并行执行。但同时该类程序运行过程中涉及到通信、同步,以及不确定性等,这常常会导致数据竞争、死锁,以及资源冲突等问题。而截止到目前,已有的工作大多偏向于检测上述由并行执行引起的死锁、资源冲突等问题。这些方法虽然确保了并行程序的成功运行,却并不能保证程序能够正确运行并得到期望的结果。在并行程序能够正常运行的前提下,即运行过程中不会发生死锁和资源冲突等问题,如何通过测试数据生成来进一步提高程序的可靠性,是需要研究的问题。
现有工作关注于软件测试中测试数据的生成问题,研究启发式搜索算法来自动地产生测试数据。由于资源的竞争、网络延时等会影响并行程序的执行,因此现有的生成串行程序测试数据的方法不能完全应用于并行程序,同时,对应启发式搜索算法的适应度函数,没有多方面考虑路径相似度的权重问题,导致测试数据生成时间长迭代次数多效率低。
发明内容
针对目前方法测试数据生成时间长、迭代次数多的问题,本发明提供一种基于路径覆盖的通信确定MPI并行程序测试数据生成方法,有效缩短测试数据的生成时间和迭代次数,提高测试数据的生成效率。
本发明的目的是通过以下技术方案来实现:
基于路径覆盖的通信确定MPI并行程序测试数据生成方法,包括如下步骤:
S1,对待测试的MPI并行程序进行部署;
S2,获取MPI并行程序的目标路径;
S3,确定所述目标路径的初始测试数据集;
S4,将每个初始测试数据的分量对应地划分给MPI并行程序的每一个子进程,MPI并行程序与子进程为总分关系,也可表述为总进程与子进程;
S5,对所述子进程和所述MPI并行程序应用协同交叉人工蜂群搜索算法产生测试数据。
优选的,S5中,子进程与人工蜂群算法中的子种群一一对应,MPI并行程序与合作团体群对应;子进程和所述MPI并行程序通过协同进化机制进行协作。
优选的,S5包括如下步骤:
S5.1,所有子进程并发产生测试数据,每个子进程均保存较优秀的测试数据并把它传递给MPI并行程序;
S5.2,MPI并行程序对接收到的子进程传递的较优秀的测试数据进行优劣比较,判断是否为期望的测试数据,若为期望的测试数据,则将期望的测试数据输出;若为非期望的测试数据,则将非期望的测试数据回传给子进程;
S5.3,重复S5.1-S5.2,直到达到预定的循环次数或者寻到完全覆盖目标路径的数据,结束循环。
优选的,所述人工蜂群算法中,子进程的路径相似度
Figure BDA0002909772020000021
如下:
Figure BDA0002909772020000022
其中,
Figure BDA0002909772020000023
表示在逐位对比的过程中,第一位开始连续相同编码的个数;
Figure BDA0002909772020000024
表示两条路径连续相同的相同节点个数占目标路径节点个数的比例;
Figure BDA0002909772020000025
为目标路径和穿越路径的相似度。
优选的,目标路径和穿越路径的相似度
Figure BDA0002909772020000026
如下:
Figure BDA0002909772020000031
其中,min为
Figure BDA0002909772020000032
中的最小值函数即
Figure BDA0002909772020000033
Figure BDA0002909772020000034
Figure BDA0002909772020000035
为编码位数;
Figure BDA0002909772020000036
为子进程i的目标子路径,
Figure BDA0002909772020000037
Figure BDA0002909772020000038
的编码;
Figure BDA0002909772020000039
为子进程i的穿越子路径,
Figure BDA00029097720200000310
Figure BDA00029097720200000311
的编码;k表示
Figure BDA00029097720200000312
Figure BDA00029097720200000313
的第k位编码的异同性;mk为当比较到第k位时相同位数量;
Figure BDA00029097720200000314
为从左到右诸位对比
Figure BDA00029097720200000315
Figure BDA00029097720200000316
的编码结果。
优选的,所述人工蜂群算法中,MPI并行程序的路径相似度
Figure BDA00029097720200000317
如下:
Figure BDA00029097720200000318
其中,similarity(p)为pt和pr的相似度;pt和pr分别为程序p的目标路径和穿越路径。
优选的:
Figure BDA00029097720200000319
其中,wi′为子路径相似度权值wi归一化之后的权值;wi=li+1,其中,li为子进程i直接涉及的程序输入个数;f为子进程的路径相似度。
优选的,测试数据生成的数学模型如下:
Figure BDA00029097720200000320
其中,
Figure BDA00029097720200000321
为MPI并行程序的路径相似度中的最大值,D为程序中参数的取值,
Figure BDA00029097720200000322
为测试数据的输入。
优选的,S5.1中,子进程产生测试数据的过程包括:
子种群优化与某一进程子进程路径有关的输入分量,在进化的过程中,以解码后的进化个体作为该进程的输入,执行该进程获得穿越路径,由个体穿越路径和目标子路径,计算得到个体的适应度值;当到达指定的进化周期时,子种群根据适应度,选择预设数量的优良个体组成代表个体集合发送给合作团体群,并等待接收合作团体群返回的优良个体,如果接收到的个体为空,表示已经找到了期望的测试数据,进化终止,否则继续进化;
S5.2中,MPI并行程序产生测试数据的过程包括:
合作团体群收到各子种群发送来的代表个体后,根据每个子种群进化的输入分量集合,对代表个体进行组合,形成本种群的初始进化个体;得到本种群的初始进化个体后,在给定周期的每一代进化中,解码进化个体作为整个并行程序的输入,通过执行整个程序得到穿越路径,由个体穿越路径和目标路径,得到个体的适应度;若有个体的适应度为1,则该个体为期望的测试数据,输出个体,终止进化,同时给子种群发送空信息,终止所有种群的进化;否则继续进化生成子代种群;当到达进化周期时,根据每个子种群进化的输入分量,将优势个体进行划分,并发送到相应的子种群中。
优选的,所述对代表个体进行组合的过程包括:
首先,求输入变量与子种群进化的输入分量集合的差集;然后,从其他子种群的代表个体中,提取与差集分量相关的值,扩展被差输入分量集合对应子种群的代表个体,产生合作团体群的进化个体,用来进化产生覆盖目标路径的期望测试数据;求两子种群进化的输入分量集合的交集,并从其他子种群的代表个体中,提取与交集分量相关的值,替换已产生的进化个体的相应值,产生新的进化个体;最后,若产生的进化个体不同于已存在的进化个体,且在进化个体中,至少包含一个完整的代表个体,那么将该进化个体加入到合作团体群中。
本发明具有以下有益的技术效果:
本发明基于路径覆盖的通信确定MPI并行程序测试数据生成方法中,对子进程和所述MPI并行程序应用协同交叉人工蜂群搜索算法产生测试数据,协同交叉人工蜂群搜索算法将人工蜂群算法、单点交叉和协同机制很好的融合起来,从而解决了因并行程序自身特点而带来的测试数据生成问题。本发明在通信确定的MPI并行程序的测试数据生成中,数据迭代次数和测试数据生成时间明显减少,数据效果更好,具有非常优秀的性能。
附图说明
图1为本发明实施例提供的基于路径覆盖的通信确定MPI并行程序测试数据生成方法粗粒度级流程图;
图2为本发明实施例提供的基于路径覆盖的通信确定MPI并行程序测试数据生成方法细粒度级流程图,对图1的每一个步骤进行了细粒度级研究;
图3为本发明实施例提供的MPI通信确定程序消息接收语句;
图4为本发明实施例提供的人工蜂群算法步骤流程图;
图5为本发明实施例提供的单点交叉案例示意图;
图6为发明实施例提供的子任务与总任务协同迭代生成测试数据示例图。
具体实施方式
下面结合附图和实施例对本发明做进一步的详细说明,所述是对本发明的解释而不是限定。
参照图1和图2,本发明基于路径覆盖的通信确定MPI并行程序测试数据生成方法包括如下步骤:
S1:针对待测试任务即MPI并行程序进行部署;
S2:分析被测程序(即MPI并行程序),获取该程序的目标路径;
S3:明确目标路径后,应用边界值和等价类相结合的方法确定当前目标路径的初始测试数据集;
S4:将每个初始测试数据的分量对应地划分给每一个子进程;
S5:对子任务(即子进程)和总任务(即总进程)应用协同交叉人工蜂群搜索算法产生测试数据。
其中,S2中获取被测程序的目标路径的过程具体如下:
首先绘制被测程序的控制流图,多条流线的交汇点都是用圆圈标识,该圆圈被称作节点。在节点与节点间的连线称为边,它是具有方向的直线或者弧线。其次计算圈复杂度,它指出了程序逻辑结构的复杂度,明确了独立路径的个数。圈复杂度计算公式为V(G)=e-n+2p,e是强连通图的边数,n是节点数,p是连通区域数。最后从被测程序中选择目标路径时,它们须在被测程序的控制流图中均匀分布且覆盖程序中较多语句。
S3中获取初始测试数据集的过程具体如下:
等价类划分就是对被测程序的输入变量集合,按不同规则进行划分,主要划分成有效等价类(符合程序输入规则)和无效等价类(不符合程序输入规则)。边界值分析作为等价类划分的一个补充方法,将等价类划分的边界作为用例设计,在有效和无效等价类的边界取值中,会存在值重复的情况,可按有效无效进行取舍。
S4中将每个初始测试数据的分量对应地划分给每一个子进程的具体过程如下:
假设被测MPI并行程序的测试数据为(x1,x2,x3,...,xk),记为解空间
Figure BDA0002909772020000061
每一个xi对应被测程序中的一个变量,xk是最后一个变量,通过k的值可以确定被测程序中变量的个数;假设该MPI并行程序的初始进程集划分为:
process0(x1,x2),process1(x2,x3),......,processm(xk-1,x6),其中每一个process称为一个子进程。该步骤采用的划分是把解空间的输入变量与子进程相对应,即每个子进程所需的输入变量都划分给对应的进程,即x1,x2→process0,x2,x3→process1,...,xk-1,x6→processm。当生成与解空间对应的测试数据后,也将测试数据对应的输入变量划分给对应的子进程,这样使划分不再具有盲目性。
S5中应用协同交叉人工蜂群搜索算法产生测试数据的过程具体如下:
协同机制的主要原理是拆分,它是将一个大的问题分解成多个小的子问题,每个子问题单独进行求解,子问题并发执行并且它们之间互不干涉。交叉机制选择单点交叉,单点交叉是指依据概率选取两个个体后,从个体中选择一个点(两个个体选择同样的点),该点称为交叉点,对交叉点后面或前面的位串进行交换则完成了单点交叉。人工蜂群算法内有三样不同的蜜蜂,雇佣蜂、观察蜂和搜索蜂,雇佣蜂和观察蜂在蜂巢附近依据积累的经验来选择蜜源并调整蜜源所在的方向,搜索蜂随机选择一个位置采摘花蜜。若蜜蜂从当前位置采摘的花蜜多,他们会舍弃花蜜少的蜜源,把花蜜多的位置信息保存在记忆中。为解决并行程序特点所带来的问题,将上述方法进行结合,设计得到协同交叉人工蜂群搜索算法,应用该方法来生成通信确定的并行程序的测试数据。
在生成测试数据的过程中,多个子任务并发产生测试数据,然后保存较优秀的测试数据并把它传递给总任务,总任务对当前的数据进行优劣比较,再将满足需要的数据回传给子任务。如此交替下去直到达到预定的循环次数或者寻到完全覆盖目标路径的数据。子进程与总进程相互传递信息、相互协作,共同完成寻找测试数据的过程。
实施例
参阅图1和图2,本实施例基于路径覆盖的通信确定MPI并行程序测试数据生成方法,包括以下步骤:
步骤1、提出测试任务,对给定的测试任务进行部署。
该步骤的具体内容阐述如下:
该步骤中的测试任务指的就是通信确定的MPI并行程序,例如将求解3个数x、y、z的最大公约数的任务分成4个子任务,将这些子任务分别部署在4台计算机上,就完成了对给定测试任务的部署。编写一个MPI程序,需要六个基本的MPI函数,即MPI_Recv(void*buf,int count,MPI_Datatypedatatype,intsource,inttag,MPI_Comm_WORLD,&status)是消息接收语句。其中,source是发送信息的进程编号,tag对传送的信息进行编号。当source与tag都有具体的值时,说明当前的MPI程序采用确定的通讯方式。如图3所示,第一条消息接收语句接收到进程0编号1的消息,第二条接收语句接收到进程0编号2的消息。
步骤2、分析源程序(即MPI并行程序),获取当前程序的目标路径。
该步骤的具体内容阐述如下:
S21:分析程序的数据流向,绘制程序控制流图;
S22:根据控制流图,计算圈复杂度,得到独立路径的个数;
圈复杂度指出了程序逻辑结构的复杂度,明确了独立路径的个数。圈复杂度计算公式为V(G)=e-n+2p,e是强连通图的边数,n是节点数,p是连通区域数。
S23:结合被测程序和圈复杂度,得到被测程序的独立路径;
有了线性独立路径数量,即圈复杂度之后,进一步需要确定被测程序全部独立路径。主要步骤为:(1)选择一条独立路径,选择包含尽可能多的判定节点的路径;(2)回溯该路径,依次“反转”每个判定节点,即判定节点取其他值;(3)重复步骤(2),直到所有的判定节点都取了不同的值为止。由此,即可得到被测程序的全部独立路径。
S24:在独立路径中,选择在被测程序的控制流图中均匀分布且覆盖程序中较多语句的路径作为目标路径。
一般来说,一个程序包含多条独立路径,然而测试程序的全部路径是不现实的,也是没有必要的。所以,在实验过程中,仅选择被测程序的一部分路径作为目标路径,但是目标路径的选取对测试数据的生成代价有很大的影响,所以,为了减小这个威胁,在所有的目标路径中,选取在被测程序的控制流图中均匀分布且覆盖程序中较多语句的路径作为目标路径。
步骤3、应用边界值分析和等价类划分方法分析被测程序,确定当前目标路径的初始测试数据集。
步骤4、根据MPI并行程序的特性将每个测试数据的分量对应地划分给每一个子任务。
步骤5、采用协同交叉人工蜂群搜索算法生成测试数据。
该步骤的具体内容阐述如下:
S51:人工蜂群算法;
人工蜂群算法流程图如图4所示,该算法中的每一只蜜蜂为一个子种群,设子种群为{bee0,bee1,...,been},
初始的子任务集为process0(x1,x2),process1(x2,x3),...,processm(xk-1,x6)。考虑将人工蜂群算法中的子种群个数划分为n,且与子任务数m相同,并且子任务与子种群一一对应。则有
Figure BDA0002909772020000091
(i∈n,j∈m,n=m),并且i与j的取值可以相同也可以不相同。
人工蜂群算法含有雇佣蜂、观察蜂、搜索蜂三种蜜蜂,下面对每一类蜜蜂的功能进行详细地阐述。
(1)雇佣蜂:雇佣蜂在当前的数据不能覆盖目标路径前提下,探索当前数据周围的数据,在当前数据的基础上加上一个随机的值来生成新的数据,数据的好坏根据适应值函数的值进行判断。若找到适应值恒为1的数据,则存储该数据退出寻优阶段。
(2)观察蜂:观察蜂依据概率
Figure BDA0002909772020000092
来选择数据,然后在探索所选择数据周围的数据,生成新数据的方法是在当前数据上加上一个随机数值,然后计算新数据的适应值。当某一数据的适应值为1时,说明找到所需的测试数据,存储数据并结束寻优。
(3)搜索蜂:搜索蜂把进行多次迭代后仍没有改善的两个数据进行交叉操作,运用单点交叉方式产生新的数据。具体的交叉方式如图5所示,假设为基因A序列和基因B序列设置交叉点和交叉结束点,单点交叉即对这两点之间的片段进行交换,基因A序列交叉前后的数据分别是“651471036”和“651823545”。交叉机制的引入可以保证再次探索的数据是以较优的数据为前提进行的,使探索具有导向性。同时,新的数据是一种异于所存在数据的,充分地保证了数据的多样性。然后计算新的数据的适应值,若适应值为1,则找到所需的数据,存储该数据并退出寻找数据的过程;若适应值不为1,则保存适应值高的数据,进入下一次循环继续寻找覆盖目标路径的数据。
S52:协同进化机制;
在本发明中协同进化思想主要体现在子任务与总任务的协作上,如图6所示,子任务将最优数据传给总任务,总任务将较优数据传给子任务,相互迭代共同协作,产生最终数据。协同进化机制中的决策机构在本算法中的体现为当前测试数据对目标路径的覆盖率,即决策机构对应着传统人工蜂群算法中的适应度函数,适应度函数是通过真正走过的节点数占目标路径节点数的百分比来定义的,计算公式会依据实际问题进行设计。
子任务先利用引用交叉机制的人工蜂群算法求解测试数据,当找到覆盖子路径的数据或达到最大迭代周期时,将数据传递给总任务,总任务对各个数据分量进行组合形成总任务的初始数据,总任务再应用引用交叉机制的人工蜂群算法寻找较优的测试数据,并回传给子任务,子任务以该数据为前提继续寻优。子任务与总任务交替执行,协作产生MPI并行程序的测试数据。
S53:适应度函数设计;
适应度函数是通过真正走过的节点数占目标路径节点数的百分比来定义的,计算公式会依据实际问题进行设计。假设,对于有n个进程的并行程序,给定目标路径
Figure BDA0002909772020000101
当以
Figure BDA0002909772020000102
为输入数据运行被测程序时,它穿越的路径为
Figure BDA0002909772020000103
因此只要先计算出子任务的路径相似度,进一步即可求出总任务路径相似度。
(1)计算子任务的路径相似度
路径相似度计算的核心是需要计算两条路径连续相同节点所占的比例,而在比较两条路径节点的方法中,哈夫曼编码作为一种最优前缀编码,可以将数据传输的数量减少到最小。所以对被测程序进行哈夫曼编码,而且实际上,当被测程序表示成二叉树时,通常不必考虑权重问题。在本发明中,分支语句的假分支用0表示,其真分支用1表示,因此,可以从根节点遍历到叶子结点的路径编码,并且该路径编码被称为前缀编码。
基于上述思想,本发明给出的方法如下。记并行程序有n个进程,目标路径记为pt,对于进程i记目标子路径为
Figure BDA0002909772020000111
则其编码为
Figure BDA0002909772020000112
编码位数为
Figure BDA0002909772020000113
Figure BDA0002909772020000114
为测试数据的输入,穿越的路径记为pr,对于进程i记穿越子路径为
Figure BDA0002909772020000115
则其编码为
Figure BDA0002909772020000116
编码位数为
Figure BDA0002909772020000117
从左到右诸位对比
Figure BDA0002909772020000118
Figure BDA0002909772020000119
的编码,结果记为:
Figure BDA00029097720200001110
其中k表示
Figure BDA00029097720200001111
Figure BDA00029097720200001112
的第k位编码的异同性,若相同,则
Figure BDA00029097720200001113
否则
Figure BDA00029097720200001114
这样比较次数最多为
Figure BDA00029097720200001115
次。
对于穿越路径的每一个编码位,考虑编码位的重要性,当比较的相同位数越多,个体就越接近目标路径的测试数据。为了便于记录相同位的个数,在进行编码对比时,用计数器m来进行标记,即
Figure BDA00029097720200001116
为更清楚地区分不同编码位相应的相似度,针对编码位不同,设置了相应的权重,即两条路径在比较第k位编码时,总共的相同节点个数占目标路径节点个数的比例,但权重之和为1,故设置权重公式为
Figure BDA00029097720200001117
其中,min为
Figure BDA00029097720200001118
Figure BDA00029097720200001119
中的最小值函数即
Figure BDA00029097720200001120
当比较到第k位时相同位数量记为mk,目标路径和穿越路径的相似度记为
Figure BDA00029097720200001121
可表示为:
Figure BDA00029097720200001122
对比
Figure BDA00029097720200001123
Figure BDA00029097720200001124
相同编码位数越多,
Figure BDA00029097720200001125
就越大。
对于进程的穿越路径,考虑路径本身的重要性,从前到后连续相同的编码位,位数越多个体越接近于目标路径的测试数据。因此对公式进行修改,如下所示:
Figure BDA00029097720200001126
调整后的相似度为
Figure BDA00029097720200001127
其中
Figure BDA00029097720200001128
表示在逐位对比的过程中,第一位开始连续相同编码的个数,
Figure BDA00029097720200001129
表示两条路径连续相同的相同节点个数占目标路径节点个数的比例。与目标路径连续相同的编码位数越多,说明该路径与目标路径的相似程度越高。
通过以上的分析,得到在进程i中目标路径和穿越路径的相似度计算公式。
(2)计算总任务的路径相似度
对于一个消息传递并行程序而言,应该考虑该程序的每一进程直接涉及的程序输入。一般而言,不同进程直接涉及的程序输入也是不同的;某进程直接涉及的程序输入越多,那么,该进程子路径的相似度对整个路径相似度的贡献越大。为了体现子路径相似度的贡献,在计算路径相似度时,根据某进程直接涉及程序输入的个数,设定该进程子路径相似度的权值。
基于上述思想,本发明给出的方法如下。记进程i为pi,子路径相似度权值为wi,该进程直接涉及的程序输入个数为li,因为权值不能小于或等于0,那么,wi的值为:
wi=li+1 (4)
这样一来,就可以得到w0,w1,...,wn-1的值。对上述权值归一化操作,并记wi归一化之后的权值为wi′可以表示为:
Figure BDA0002909772020000121
对应并行程序p的路径pt和pr,其进程pi的子路径分别为
Figure BDA0002909772020000122
Figure BDA0002909772020000123
采用公式(3)得到的子路径相似度为
Figure BDA0002909772020000124
简记为f,那么再结合本部分的方法,pt和pr的相似度为:
Figure BDA0002909772020000125
其中n为进程的个数,MPI并行程序的相似度只与输入数据有关,因此可以把并行程序的相似度记为:
Figure BDA0002909772020000126
当相似度的定义明确后,了解到我们所需要的是能够覆盖目标路径的数据,基于此,给出测试数据生成的数学模型:
Figure BDA0002909772020000127
该数学模型明确了目标函数即以一组数据运行被测程序时,程序穿越的路径尽可能地为目标路径。约束条件为输入数据一定在给定的输入空间内。
S54:子任务和总任务协同交叉生成测试数据。
在该步骤提出的协同交叉人工蜂群测试数据生成算法中包含两类种群,除了若干个子种群外,还有合作团体群即总种群,且两类种群进化方式不同。
(1)子任务测试数据生成
子种群只优化与某一进程子任务路径有关的输入分量。在进化的过程中,以解码后的进化个体作为该进程的输入,执行该进程获得穿越路径,由个体穿越路径和目标子路径,计算得到个体的适应度值。当到达指定的进化周期时,子种群根据适应度,选择一定数量的优良个体组成代表个体集合发送给合作团体群,并等待接收合作团体群返回的优良个体,如果接收到的个体为空,表示已经找到了期望的测试数据,进化终止。否则继续进化。
(2)总任务测试数据生成
合作团体群收到各子种群发送来的代表个体后,为了保证合作团体群具有性能良好的初始种群,根据每个子种群进化的输入分量集合,对代表个体进行合理组合,形成本种群的初始进化个体。组合方式如下:
首先,求输入变量与子种群进化的输入分量集合的差集;然后,从其他子种群的代表个体中,提取与差集分量相关的值,扩展被差输入分量集合对应子种群的代表个体,从而产生合作团体群的进化个体,用来进化产生覆盖目标路径的期望测试数据;此外,为了产生新的进化个体,求两子种群进化的输入分量集合的交集,并从其他子种群的代表个体中,提取与交集分量相关的值,替换已产生的进化个体的相应值,进而,产生新的进化个体;最后,若产生的进化个体不同于已存在的进化个体,且在进化个体中,至少包含一个完整的代表个体,那么,将该进化个体加入到合作团体群中。
得到本种群的初始进化个体后,在给定周期的每一代进化中,解码进化个体作为整个并行程序的输入,通过执行整个程序得到穿越路径,由个体穿越路径和目标路径,得到个体的适应度。若有个体的适应度为1,也就是说,该个体为期望的测试数据,输出个体,终止进化,同时给子种群发送空信息,终止所有种群的进化。否则继续进化生成子代种群。当到达进化周期时,根据每个子种群进化的输入分量,将优势个体进行划分,并发送到相应的子种群中。
本发将人工蜂群算法、单点交叉和协同机制很好的融合起来,从而解决了因并行程序自身特点而带来的测试数据生成问题。同时适应度函数作为人工蜂群算法的数据评价标准,决定了算法的优劣性,所以综合考虑路径相似度中的权重问题,对适应度函数进行了针对性的改进。采用哈夫曼编码,在子路径的计算中,考虑了编码位和路径本身的重要性,在总路径的计算中考虑每一子路径对总路径的贡献度,从而设计出更适合MPI并行程序的适应度函数。本发明在通信确定的MPI并行程序的测试数据生成中,数据迭代次数和测试数据生成时间明显减少,数据效果更好,具有非常优秀的性能。
以上内容仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明权利要求书的保护范围之内。

Claims (6)

1.基于路径覆盖的通信确定MPI并行程序测试数据生成方法,其特征在于,包括如下步骤:
S1,对待测试的MPI并行程序进行部署;
S2,获取MPI并行程序的目标路径;
S3,确定所述目标路径的初始测试数据集;
S4,将每个初始测试数据的分量对应地划分给MPI并行程序的每一个子进程;
S5,对所述子进程和所述MPI并行程序应用协同交叉人工蜂群搜索算法产生测试数据;
S5中,所述子进程与人工蜂群算法中的子种群一一对应,MPI并行程序与合作团体群对应;子进程和所述MPI并行程序通过协同进化机制进行协作;
S5包括如下步骤:
S5.1,所有子进程并发产生测试数据,每个子进程均保存较优秀的测试数据并把它传递给MPI并行程序;
S5.2,MPI并行程序对接收到的子进程传递的较优秀的测试数据进行优劣比较,判断是否为期望的测试数据,若为期望的测试数据,则将期望的测试数据输出;若为非期望的测试数据,则将非期望的测试数据回传给子进程;
S5.3,重复S5.1-S5.2,直到达到预定的循环次数或者寻到完全覆盖目标路径的数据,结束循环;
S5.1中,子进程产生测试数据的过程包括:
子种群优化与某一进程子进程路径有关的输入分量,在进化的过程中,以解码后的进化个体作为该进程的输入,执行该进程获得穿越路径,由个体穿越路径和目标子路径,计算得到个体的适应度值;当到达指定的进化周期时,子种群根据适应度,选择预设数量的优良个体组成代表个体集合发送给合作团体群,并等待接收合作团体群返回的优良个体,如果接收到的个体为空,表示已经找到了期望的测试数据,进化终止,否则继续进化;
S5.2中,MPI并行程序产生测试数据的过程包括:
合作团体群收到各子种群发送来的代表个体后,根据每个子种群进化的输入分量集合,对代表个体进行组合,形成本种群的初始进化个体;得到本种群的初始进化个体后,在给定周期的每一代进化中,解码进化个体作为整个并行程序的输入,通过执行整个程序得到穿越路径,由个体穿越路径和目标路径,得到个体的适应度;若有个体的适应度为1,则该个体为期望的测试数据,输出个体,终止进化,同时给子种群发送空信息,终止所有种群的进化;否则继续进化生成子代种群;当到达进化周期时,根据每个子种群进化的输入分量,将优势个体进行划分,并发送到相应的子种群中;
所述对代表个体进行组合的过程包括:
首先,求输入变量与子种群进化的输入分量集合的差集;然后,从其他子种群的代表个体中,提取与差集分量相关的值,扩展被差输入分量集合对应子种群的代表个体,产生合作团体群的进化个体,用来进化产生覆盖目标路径的期望测试数据;求两子种群进化的输入分量集合的交集,并从其他子种群的代表个体中,提取与交集分量相关的值,替换已产生的进化个体的相应值,产生新的进化个体;最后,若产生的进化个体不同于已存在的进化个体,且在进化个体中,至少包含一个完整的代表个体,那么将该进化个体加入到合作团体群中。
2.根据权利要求1所述的基于路径覆盖的通信确定MPI并行程序测试数据生成方法,其特征在于,所述人工蜂群算法中,子进程的路径相似度
Figure FDA0003883146910000021
如下:
Figure FDA0003883146910000022
其中,
Figure FDA0003883146910000023
表示在逐位对比的过程中,第一位开始连续相同编码的个数;
Figure FDA0003883146910000024
表示两条路径连续相同的相同节点个数占目标路径节点个数的比例;
Figure FDA0003883146910000025
为目标路径和穿越路径的相似度。
3.根据权利要求2所述的基于路径覆盖的通信确定MPI并行程序测试数据生成方法,其特征在于,目标路径和穿越路径的相似度
Figure FDA0003883146910000031
如下:
Figure FDA0003883146910000032
其中,min为
Figure FDA0003883146910000033
Figure FDA0003883146910000034
中的最小值函数,
Figure FDA0003883146910000035
Figure FDA0003883146910000036
为编码位数;
Figure FDA0003883146910000037
为子进程i的目标子路径,
Figure FDA0003883146910000038
Figure FDA0003883146910000039
的编码;
Figure FDA00038831469100000310
为子进程i的穿越子路径,
Figure FDA00038831469100000311
Figure FDA00038831469100000312
的编码;k表示
Figure FDA00038831469100000313
Figure FDA00038831469100000314
的第k位编码的异同性;mk为当比较到第k位时相同位数量;
Figure FDA00038831469100000315
为从左到右诸位对比
Figure FDA00038831469100000316
Figure FDA00038831469100000317
的编码结果。
4.根据权利要求1所述的基于路径覆盖的通信确定MPI并行程序测试数据生成方法,其特征在于,所述人工蜂群算法中,MPI并行程序的路径相似度
Figure FDA00038831469100000318
如下:
Figure FDA00038831469100000319
其中,similarity(p)为pt和pr的相似度;pt和pr分别为程序p的目标路径和穿越路径。
5.根据权利要求4所述的基于路径覆盖的通信确定MPI并行程序测试数据生成方法,其特征在于:
Figure FDA00038831469100000320
其中,wi′为子路径相似度权值wi归一化之后的权值;wi=li+1,其中,li为子进程i直接涉及的程序输入个数;f为子进程的路径相似度。
6.根据权利要求4所述的基于路径覆盖的通信确定MPI并行程序测试数据生成方法,其特征在于,测试数据生成的数学模型如下:
Figure FDA00038831469100000321
其中,
Figure FDA00038831469100000322
为MPI并行程序的路径相似度中的最大值,D为程序中参数的取值,
Figure FDA00038831469100000323
为测试数据的输入。
CN202110082992.7A 2021-01-21 2021-01-21 基于路径覆盖的通信确定mpi并行程序测试数据生成方法 Active CN112817841B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110082992.7A CN112817841B (zh) 2021-01-21 2021-01-21 基于路径覆盖的通信确定mpi并行程序测试数据生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110082992.7A CN112817841B (zh) 2021-01-21 2021-01-21 基于路径覆盖的通信确定mpi并行程序测试数据生成方法

Publications (2)

Publication Number Publication Date
CN112817841A CN112817841A (zh) 2021-05-18
CN112817841B true CN112817841B (zh) 2022-12-09

Family

ID=75858579

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110082992.7A Active CN112817841B (zh) 2021-01-21 2021-01-21 基于路径覆盖的通信确定mpi并行程序测试数据生成方法

Country Status (1)

Country Link
CN (1) CN112817841B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN120952058B (zh) * 2025-10-11 2026-01-27 苏州元脑智能科技有限公司 一种模型训练时间优化方法及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103902457A (zh) * 2014-04-17 2014-07-02 中国矿业大学 基于协同进化的并行程序路径覆盖测试数据生成方法
JP2015176230A (ja) * 2014-03-13 2015-10-05 富士通株式会社 テストケース生成装置、方法、及びプログラム
CN108549607A (zh) * 2018-04-17 2018-09-18 中国矿业大学 消息传递并行程序多路径覆盖测试数据协同进化生成方法
CN109918307A (zh) * 2019-03-14 2019-06-21 牡丹江师范学院 基于否定选择遗传算法的路径覆盖测试数据生成方法
CN112085144A (zh) * 2020-08-11 2020-12-15 西安理工大学 自适应协方差学习引导人工蜂群的方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10956310B2 (en) * 2018-08-30 2021-03-23 International Business Machines Corporation Automated test case generation for deep neural networks and other model-based artificial intelligence systems

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015176230A (ja) * 2014-03-13 2015-10-05 富士通株式会社 テストケース生成装置、方法、及びプログラム
CN103902457A (zh) * 2014-04-17 2014-07-02 中国矿业大学 基于协同进化的并行程序路径覆盖测试数据生成方法
CN108549607A (zh) * 2018-04-17 2018-09-18 中国矿业大学 消息传递并行程序多路径覆盖测试数据协同进化生成方法
CN109918307A (zh) * 2019-03-14 2019-06-21 牡丹江师范学院 基于否定选择遗传算法的路径覆盖测试数据生成方法
CN112085144A (zh) * 2020-08-11 2020-12-15 西安理工大学 自适应协方差学习引导人工蜂群的方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
基于均衡优化理论的路径覆盖测试数据进化生成;范书平等;《电子学报》;20200715(第07期);全文 *
基于蚁群算法的多路径覆盖测试数据生成;廖伟志等;《电子学报》;20200715(第07期);全文 *
通信不确定MPI并行程序的测试数据自动生成方法;王荣丽等;《吉林大学学报(理学版)》;20161126(第06期);全文 *

Also Published As

Publication number Publication date
CN112817841A (zh) 2021-05-18

Similar Documents

Publication Publication Date Title
Auger et al. Continuous upper confidence trees with polynomial exploration–consistency
EP2742648B1 (en) Network capacity management system and method
CN111897734B (zh) 基于在线式增量学习的模糊测试用例选择方法和装置
CN103902457A (zh) 基于协同进化的并行程序路径覆盖测试数据生成方法
CN118802720A (zh) 网络路径优选方法、装置、设备、存储介质及程序产品
CN103116693A (zh) 基于人工蜂群的软硬件划分方法
CN112817841B (zh) 基于路径覆盖的通信确定mpi并行程序测试数据生成方法
Wiegand et al. Mining easily understandable models from complex event logs
Nejad et al. Using memetic algorithms for test case prioritization in model based software testing
Martins et al. Exploiting cardinality encodings in parallel maximum satisfiability
CN114124818B (zh) 一种sdn网络中多播传输的新增功能节点部署优化方法
Hsu et al. A genetic algorithm for the maximum edge-disjoint paths problem
Casella et al. New Lower Bounds for the Snake-in-the-Box Problem: Using Evolutionary Techniques to Hunt for Snakes.
Pietron et al. TinySubNets: An efficient and low capacity continual learning strategy
Ma et al. An approach for matching communication patterns in parallel applications
Ljubic et al. A genetic algorithm for the biconnectivity augmentation problem
CN119621548A (zh) 测试用例的生成方法、测试用例的生成装置及电子设备
Moghissi et al. A parallel evolutionary search for shortest vector problem
CN114510876B (zh) 基于共生搜索生物地理学优化的多平台武器目标分配方法
CN117092908A (zh) 基于遗传算法的废水处理设备智能控制方法及系统
Minhaz et al. Solution of a Classical Cryptarithmetic Problem by using parallel genetic algorithm
Rocha et al. A memetic algorithm for the biobjective minimum spanning tree problem
Vidal et al. A parallel discrete firefly algorithm on gpu for permutation combinatorial optimization problems
Li et al. A genetic algorithm enhanced automatic data flow management solution for facilitating data intensive applications in the cloud
Zuo et al. Symbolic regression for data storage with side information

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant