CN110147325A

CN110147325A - 一种基于自动化测试的数据生成方法及装置

Info

Publication number: CN110147325A
Application number: CN201910431742.2A
Authority: CN
Inventors: 师环; 马妤晨; 罗云
Original assignee: Telecommunications Science And Technology Tenth Research Institute Ltd
Current assignee: Telecommunications Science And Technology Tenth Research Institute Ltd
Priority date: 2019-05-22
Filing date: 2019-05-22
Publication date: 2019-08-20
Anticipated expiration: 2039-05-22
Also published as: CN110147325B

Abstract

本发明公开了一种基于自动化测试的数据生成方法及装置，涉及计算机领域。用以解决大数据系统测试存在数据量级巨大，数据类型繁多复杂，导致测试效率比较低的问题。该方法包括：根据待测数据的类型和格式确定所述待测数据的分类规则，根据分类规则，将待测数据生成样本数据，确定样本的初始权值；根据缺陷划分标准确定样本类的测试结果、样本类缺陷总数以及缺陷情况等级；根据初始权值和样本类缺陷总数，确定样本类的缺陷数量等级；根据缺陷情况等级，样本类缺陷总数以及缺陷数量等级确定样本类的缺陷情况得分；根据缺陷情况得分，权值评估函数和初始权值确定样本类的新权值，根据新权值调整样本类，得到调整后的样本数据。

Description

一种基于自动化测试的数据生成方法及装置

技术领域

本发明涉及计算机技术领域，更具体的涉及一种基于自动化测试的数据生成方法及装置。

背景技术

近几年来，大数据在全球迅猛发展，计算机硬件更新换代，大数据时代的特征并不局限于掌握规模庞大的数据，更多的是能够拥有相关行业的大规模数据专业化处理的能力。由于大数据拥有巨大的数据量、复杂的数据类型、高速信息处理以及较低的价值密度四大特征，当前的数据处理方式相比传统的处理方式有了很大的不同，导致软件测试形式、重点以及方法手段也需要及时更新变化。

针对不同架构、不同技术组件的大数据系统，功能测试主要方法仍然可以使用黑盒测试法。将程序看做黑盒，不考虑程序内部结构和内部特性，将准备的样本数据作为输入，测试程序是否能适当的接收数据而产生正确的输出信息。该方法的好处是忽略软件程序的具体实现方式，从用户角度考虑业务处理正确性，因此适用范围较广。

但是，大数据系统测试与传统软件平台测试还存在很多区别，主要在于处理数据量级巨大，数据类型繁多复杂，以及测试阶段数据信息无法完全确定等。

综上所述，现有的大数据系统测试存在数据量级巨大，数据类型繁多复杂，导致测试效率比较低的问题。

发明内容

本发明实施例提供一种基于自动化测试的数据生成方法及装置，用以解决现有的大数据系统测试存在数据量级巨大，数据类型繁多复杂，导致测试效率比较低的问题。

本发明实施例提供一种基于自动化测试的数据生成方法，包括：

根据待测数据的类型和格式确定所述待测数据的分类规则，根据所述分类规则，将所述待测数据生成样本数据，确定所述样本数据包括的样本类的总数以及每个所述样本的初始权值；

根据缺陷划分标准确定所述样本类的测试结果、样本类缺陷总数以及缺陷情况等级；

根据所述初始权值和所述样本类缺陷总数，确定所述样本类的缺陷数量等级；根据所述缺陷情况等级，所述样本类缺陷总数以及所述缺陷数量等级确定所述样本类的缺陷情况得分；

根据所述样本类的缺陷情况得分，权值评估函数和所述初始权值确定所述样本类的新权值，根据所述新权值调整所述样本类，得到调整后的样本数据。

优选地，所述缺陷情况等级至少包括1级，2级...m级，其中，所述缺陷情况等级的赋值按照递增顺序增加；

所述根据所述缺陷情况等级，所述样本类缺陷总数以及所述缺陷数量等级确定所述样本类的缺陷情况得分，具体包括：

通过下列公式确定所述样本类的缺陷等级评分平均值：

根据所述缺陷等级评分平均值和所述缺陷数量等级，通过下列公式确定所述样本类的缺陷情况得分：

s＝g×z

其中，g为缺陷等级评分平均值，x_j为第j级缺陷所对应的评分，y_j为第j级缺陷的实际数量，z为所述缺陷数量等级，s为所述样本类的缺陷情况得分，m为缺陷情况最高等级。

优选地，所述根据所述初始权值和所述样本类缺陷总数，确定所述样本数据的缺陷数量等级，具体包括：

根据所述初始权值和所述样本类缺陷总数通过下列公式确定样本类缺陷数估值：

根据所述样本类缺陷数估值通过下列公式确定样本总缺陷数估值，根据所述样本总缺陷数估值和所述样本类缺陷数估值确定缺陷数量分数，根据所述缺陷数量分数确定所述缺陷数量等级：

其中，N为所述样本类缺陷总数，ω_k为所述样本类的初始权值，a_i表示第i类所述样本类对应的a值，n为所述样本数据包括的样本类的总数。

优选地，所述根据所述样本类的缺陷情况得分，权值评估函数和所述初始权值确定所述样本类的新权值，具体包括：

通过下列公式确定所述样本类对应的调整后的权值：

ω_k+1'＝ω_k ^f(s)

通过下列公式确定所述新权值

其中，ω_k为所述初始权值，ω_k+1′为所述调整后的权值，f(s)为权值评估函数，α为调整系数，ω_k+1为所述新权值，n为所述样本类的总数。

优选地，所述测试结果包括通过和不通过两种，当所述测试结果为通过时，所述样本类缺陷总数为零。

本发明实施例还提供了一种基于自动化测试的数据生成装置，包括：

样本数据生成模块，用于根据待测数据的类型和格式确定所述待测数据的分类规则，根据所述分类规则，将所述待测数据生成样本数据，确定所述样本数据包括的样本类的总数以及每个所述样本的初始权值；

自动化测试装置，用于根据缺陷划分标准确定所述样本类的测试结果、样本类缺陷总数以及缺陷情况等级；

计算模块，用于根据所述初始权值和所述样本类缺陷总数，确定所述样本类的缺陷数量等级；根据所述缺陷情况等级，所述样本类缺陷总数以及所述缺陷数量等级确定所述样本类的缺陷情况得分；用于根据所述样本类的缺陷情况得分，权值评估函数和所述初始权值确定所述样本类的新权值，根据所述新权值调整所述样本类，得到调整后的样本数据。

所述计算模块具体用于：

通过下列公式确定所述样本类的缺陷等级评分平均值：

s＝g×z

优选地，所述计算模块具体用于：

通过下列公式确定所述样本类对应的调整后的权值：

ω_k+1'＝ω_k ^f(s)

通过下列公式确定所述新权值

本发明实施例提供一种基于自动化测试的数据生成方法及装置，该方法包括：根据待测数据的类型和格式确定所述待测数据的分类规则，根据所述分类规则，将所述待测数据生成样本数据，确定所述样本数据包括的样本类的总数以及每个所述样本的初始权值；根据缺陷划分标准确定所述样本类的测试结果、样本类缺陷总数以及缺陷情况等级；根据所述初始权值和所述样本类缺陷总数，确定所述样本类的缺陷数量等级；根据所述缺陷情况等级，所述样本类缺陷总数以及所述缺陷数量等级确定所述样本类的缺陷情况得分；根据所述样本类的缺陷情况得分，权值评估函数和所述初始权值确定所述样本类的新权值，根据所述新权值调整所述样本类，得到调整后的样本数据。该方法中结合待测试对象，对待测试数据进行分类，按照分类规则生成样本数据，并对样本数据包括的每个样本类赋予相同的初始权值，根据缺陷划分标准，得到样本类的测试结果、样本类缺陷总数和缺陷情况等级信息，进一步地，根据上述信息依此确定样本类的缺陷数量等级，样本类的缺陷情况得分，并最后确定了样本类的新权值，根据该新权值对样本类进行调整，最后得到调整后的样本数据。该方法有效解决大数据系统业务测试时对测试数据的各项要求，保证大数据系统业务测试的质量，还能减轻测试人员数据准备的负担，提高测试效率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种基于自动化测试的数据生成方法流程示意图；

图2为本发明实施例提供的一种基于自动化测试的数据生成装置结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1示例性的示出了本发明实施例提供的一种基于自动化测试的数据生成方法流程示意图，如图1所示，该方法主要包括以下步骤：

步骤101，根据待测数据的类型和格式确定所述待测数据的分类规则，根据所述分类规则，将所述待测数据生成样本数据，确定所述样本数据包括的样本类的总数以及每个所述样本的初始权值；

步骤102，根据缺陷划分标准确定所述样本类的测试结果、样本类缺陷总数以及缺陷情况等级；

步骤103，根据所述初始权值和所述样本类缺陷总数，确定所述样本类的缺陷数量等级；根据所述缺陷情况等级，所述样本类缺陷总数以及所述缺陷数量等级确定所述样本类的缺陷情况得分；

步骤104，根据所述样本类的缺陷情况得分，权值评估函数和所述初始权值确定所述样本类的新权值，根据所述新权值调整所述样本类，得到调整后的样本数据。

在步骤101中，先分析待测试数据，将待测试数据进行分类，具体地，根据数据的类型和格式按照黑盒测试方法分为有效等价类、无效等价类、边界数据、随机数据，各类中具体细分中文、英文、数字、符号、两两混合、三种混合、全部混合，按照格式还可分为长度不同，结构顺序不同等。需要说明的是，在本发明实施例中，添加随机数据是为了避免类型划分存在遗漏的情况。将所有划分类对应出规则，如随机数据规则、中文规则、英文规则等，即给出各类数据的生成函数。

进一步地，按照上述确定的分类规则，将待测数据生成样本数据，需要说明的是，该样本数据包括有多个样本类，当将待测数据生成样本数据之后，需要进一步确认该样本数据内包括的样本类的总数，然后再确认样本数据包括的每个样本类的初始权值。

在本发明实施例中，通过下列公式(1)确定每个样本类的初始权值：

ω_k＝1/Σ (1)

其中，ω_k为样本类的初始权值，Σ为样本数据包括的样本类的总数。

需要说明的是，待测数据的分类规则至少包括1类，即待测数据至少可以按照一类分类规则进行分类，相应地，待测数据按照分类规则分类之后，每类规则对应的数据至少包括有2种样本类。

在步骤102中，按照缺陷划分标准对样本类数据进行测试，可以得到样本类的测试结果、样本类缺陷总数以及缺陷情况等级。

需要说明的是，在本发明实施例中，当按照缺陷划分标准对样本数据包括的样本类进行测试时，得到的测试结果可以包括有两种，一种是测试结果为通过，一种是测试结果为不通过。

等级评定法是最容易操作和普遍应用的一种评估方法，这种方法的操作形式是，给出不同等级的定义和描述，然后针对每一个评价要素或指标按照给定的等级评估，最后再给出总的评价。

在本发明实施例中，采用等级评定法，确定对缺陷情况赋值的影响因素为产生的缺陷数量和缺陷情况等级，对它们进行定义、划分等级并对各等级进行评分，然后对每类数据产生的缺陷情况赋值。具体地，在本发明实施例中，缺陷情况等级至少可以包括有1级、2级、3级...m级等多个级别。其中，1级为缺陷情况等级中问题最轻的等级，相应地，m级为缺陷情况等级中问题最为严重的等级。举例来说，当按照缺陷情况等级包括提示、一般、严重、较严重和致命5个级别时，则表明该缺陷情况等级中提示对应的缺陷等级最小，后面的缺陷等级依此为一般、严重、较严重和致命，且致命对应的缺陷等级最为严重。表1为本发明实施例提供的缺陷情况等级说明。

进一步地，当确定了缺陷情况最高等级之后，则需要对各缺陷情况等级进行赋值，在本发明实施例中，缺陷情况等级的赋值根据等级说明按照递增的顺序增加。举例来说，若对提示、一般、严重、较严重和致命5个缺陷情况等级按照2～6分进行赋值，依此为：提示为2分，一般为3分，严重为4分，较严重为5分，致命为6分。若对提示、一般、严重、较严重和致命5个缺陷情况等级按照10～50分进行赋值，依此为：提示为10分，一般为20分，严重为30分，较严重为40分，致命为50分。

表1.缺陷情况等级

在实际应用中，按照缺陷划分标准对样本类数据进行测试，当测试结果为通过时，对测试结果赋值为0，可以确定样本类的缺陷数量为0；当测试结果为不通过时，对测试结果赋值为1，进一步地可以按照表1提供的缺陷情况等级对样本类的缺陷情况等级进行分类以及确定每种缺陷情况等级对应的分值。

在步骤103中，因为缺陷的发现常常具有聚集性，因此需要根据缺陷数量分等级进行评分，以规避因测试人员等主观因素对发现缺陷数量造成的影响。

由于每个样本类的初始权值相同，而每个样本类的样本类缺陷总数不同，多个样本类可能会产生多个同样的缺陷，为了避免这种影响，在本发明实施例中，采用每个样本类产生的样本类缺陷总数除以该样本类的初始权值，得到该样本类的样本类缺陷数估值。具体地，通过下列公式(2)确定样本类缺陷数估值：

其中，a为样本类缺陷数估值，N为所述样本类缺陷总数，ω_k为所述样本类的初始权值。

进一步地，对样本数据包括的每个样本类的样本类缺陷数估值通过下列公式(3)进行统计，得到样本总缺陷数估值：

其中，k为样本总缺陷数估值，a_i表示第i类所述样本类对应的a值，n为所述样本数据包括的样本类的总数。

进一步地，根据确定的样本总缺陷数估值和样本类缺陷数估值，通过下列公式(4)确定缺陷数量分数，进一步地，根据缺陷数量分数确定缺陷数量等级。

具体地，当确定缺陷数量分数介于0～10％之间时，则确定缺陷数量等级为1；当确定缺陷数量分数介于10％～20％之间时，则确定缺陷数量等级为2；当确定缺陷数量分数介于20％～30％之间时，则确定缺陷数量等级为3；当确定缺陷数量分数大于40％时，则确定缺陷数量等级为4。在本发明实施例中，采用字母z表示缺陷数量等级。

进一步地，当确定样本类的缺陷数量等级之后，需要确定样本类的缺陷等级评分平均值，具体地，通过下列公式(5)确定样本类的缺陷等级评分平均值：

其中，g为缺陷等级评分平均值，x_j为第j级缺陷所对应的评分，y_j为第j级缺陷的实际数量，m为缺陷情况最高等级。

进一步地，通过下列公式(6)确定样本类的缺陷情况得分：

s＝g×z (6)

其中，z为所述缺陷数量等级，s为所述样本类的缺陷情况得分。

在步骤104中，当确定了样本类的缺陷等级评分平均值和缺陷情况得分之后，则可以根据样本类的初始权值，确定样本类对应的调整后的权值，具体地，通过下列公式(7)确定样本类对应的调整后的权值：

ω_k+1'＝ω_k ^f(s) (7)

在公式(7)中，ω_k为所述初始权值，ω_k+1′为所述调整后的权值，f(s)为权值评估函数，s为每个样本类的缺陷情况得分，α为调整系数，需要说明的是，在本发明实施例中，α的取值可以为每轮各个样本类的缺陷情况得分之和。

进一步地，若每轮次运行完成后，需要对各样本类的权值进行归一化处理，假设输入类型共有n类，则归一化处理函数可以通过下列公式(8)确定：

其中，ω_k+1′为调整后的权值，ω_k+1为归一化处理后得到的样本类的新权值。

在本发明实施例中，当确定了样本类的新权值之后，则可以根据该新权值对样本类进行调整，得到调整后的样本数据。

为了更清楚的介绍本发明实施例提供的一种基于自动化测试的数据生成方法，以下结合具体的实例来介绍该方法：

S1、分析待测数据的输入条件，如搜索功能，对搜索功能可输入的数据条件进行等价类划分，需包括有效等价类、无效等价类、边界数据、随机数据。

对有效等价类使用穷举法罗列其类型，包括中文、英文、其他语种词组(结合系统实现进行添加)、数字、符号(全角、半角)，以及所有类型两两组合和三三组合类。

分别对每一类定义其规则，如中文类，需要包括二字词和多字词，英文类需包括单词、两词词组和多词词组。然后按照规则构造函数，使其按照要求随机生成符合规则的数据，生成样本数据。构造分类如以下表2示例：

表2.待测试数据的分类规则

S2、确定样本类的总数为10，进一步地通过公式(1)确定样本类的初始权值为0.1。

S3、生成样本数据。

S4、根据缺陷划分标准对样本类进行测试，得到样本类的测试结果，样本类缺陷总数和缺陷情况等级。

根据表1提供的缺陷情况等级说明，对样本类的缺陷情况等级可以划分为五个等级，即1级、2级、3级、4级和5级。

进一步地，可以得到该样本数据包括的各个样本类的测试结果即缺陷情况等级，具体如表3所示：

表3.样本数据的测试结果及缺陷情况等级

需要说明的是，上述表中，测试结果为0表示测试通过，测试结果为1表示测试未通过。

S5、根据测试结果重新计算权值：

S5-1、对每个样本类通过缺陷划分标准测试之后测试结果和缺陷分布赋值：

(1)、当测试结果为通过时，缺陷数量为0，缺陷情况的赋值为1。

(2)、当测试结果为不通过时，对缺陷情况的赋值具体如下：

对缺陷情况等级评分，在本发明实施例中，根据缺陷情况等级的划分，分别以2～6不同的值代表各缺陷情况等级。

根据样本类初始权值，样本类缺陷总数，依此确认样本类缺陷数估值、样本总缺陷数估值、缺陷数量分数和缺陷数量等级，具体可以参见表4

表4.缺陷数量等级评定

S5-1、各个样本类输出缺陷情况的赋值

根据表4中确定缺陷数量等级z，进一步地根据公式(5)，公式(6)依此确定样本类的缺陷等级评分平均值和样本类的缺陷情况得分，具体见表5。

表5样本类的缺陷情况赋值

S5-3、根据各样本类的缺陷情况，通过公式(7)和(8)得到样本类的新权值。具体见表6。

表6.样本类新权值

S6、设置终止条件为：各样本类的权值基本保持不变。

需要说明的是，终止条件的确定建立在对实际情况具体分析的基础上。

考虑以下情况：

(1)系统运行一段时间，各样本类的权值基本保持不变；

(2)当某一样本类引起的缺陷过多，为了保证测试数据的多样性，应该终止样本类的权值调整。

(3)鉴于整个测试周期的限制，测试数据的生成不宜花费太多时间，一般为3天。

运行终止条件可以是：

(1)各样本类的权值基本不变；

(2)某一类数据的缺陷占到总缺陷数的80％；

(3)系统运行时间达到72小时。

S7、循环执行。

S8、生成最终样本数据。

综上所述，本发明实施例提供一种基于自动化测试的数据生成方法，该方法中结合待测试对象，对待测试数据进行分类，按照分类规则生成样本数据，并对样本数据包括的每个样本类赋予相同的初始权值，根据缺陷划分标准，得到样本类的测试结果、样本类缺陷总数和缺陷情况等级信息，进一步地，根据上述信息依此确定样本类的缺陷数量等级，样本类的缺陷情况得分，并最后确定了样本类的新权值，根据该新权值对样本类进行调整，最后得到调整后的样本数据。该方法有效解决大数据系统业务测试时对测试数据的各项要求，保证大数据系统业务测试的质量，还能减轻测试人员数据准备的负担，提高测试效率。

基于同一发明构思，本发明实施例提供了一种基于自动化测试的数据生成装置，由于该装置解决技术问题的原理与一种基于自动化测试的数据生成方法相似，因此该装置的实施可以参见方法的实施，重复之处不再赘述。图

为本发明实施例提供的一种基于自动化测试的数据生成装置结构示意图。如图2所示，该装置包括样本数据生成模块201，自动化测试装置202和计算模块203。

样本数据生成模块201，用于根据待测数据的类型和格式确定所述待测数据的分类规则，根据所述分类规则，将所述待测数据生成样本数据，确定所述样本数据包括的样本类的总数以及每个所述样本的初始权值；

自动化测试装置202，用于根据缺陷划分标准确定所述样本类的测试结果、样本类缺陷总数以及缺陷情况等级；

计算模块203，用于根据所述初始权值和所述样本类缺陷总数，确定所述样本类的缺陷数量等级；根据所述缺陷情况等级，所述样本类缺陷总数以及所述缺陷数量等级确定所述样本类的缺陷情况得分；用于根据所述样本类的缺陷情况得分，权值评估函数和所述初始权值确定所述样本类的新权值，根据所述新权值调整所述样本类，得到调整后的样本数据。

所述计算模块203具体用于：

通过下列公式确定所述样本类的缺陷等级评分平均值：

s＝g×z

优选地，所述计算模块203具体用于：

通过下列公式确定所述样本类对应的调整后的权值：

ω_k+1'＝ω_k ^f(s)

通过下列公式确定所述新权值

应当理解，以上一种基于自动化测试的数据生成装置包括的单元仅为根据该设备装置实现的功能进行的逻辑划分，实际应用中，可以进行上述单元的叠加或拆分。并且该实施例提供的一种基于自动化测试的数据生成装置所实现的功能与上述实施例提供的一种基于自动化测试的数据生成方法一一对应，对于该装置所实现的更为详细的处理流程，在上述方法实施例一中已做详细描述，此处不再详细描述。

尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种基于自动化测试的数据生成方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，所述缺陷情况等级至少包括1级，2级...m级，其中，所述缺陷情况等级的赋值按照递增顺序增加；

通过下列公式确定所述样本类的缺陷等级评分平均值：

s＝g×z

3.如权利要求1所述的方法，其特征在于，所述根据所述初始权值和所述样本类缺陷总数，确定所述样本数据的缺陷数量等级，具体包括：

其中，N为所述样本类缺陷总数，ω_k为所述样本类的初始权值，a为所述样本类缺陷数估值，a_i表示第i类所述样本类对应的a值，k为所述样本总缺陷数估值，n为所述样本数据包括的样本类的总数。

4.如权利要求1所述的方法，其特征在于，所述根据所述样本类的缺陷情况得分，权值评估函数和所述初始权值确定所述样本类的新权值，具体包括：

通过下列公式确定所述样本类对应的调整后的权值：

ω_k+1'＝ω_k ^f(s)

通过下列公式确定所述新权值

5.如权利要求1所述的方法，其特征在于，所述测试结果包括通过和不通过两种，当所述测试结果为通过时，所述样本类缺陷总数为零。

6.一种基于自动化测试的数据生成装置，其特征在于，包括：

7.如权利要求6所述的装置，其特征在于，所述缺陷情况等级至少包括1级，2级...m级，其中，所述缺陷情况等级的赋值按照递增顺序增加；

所述计算模块具体用于：

通过下列公式确定所述样本类的缺陷等级评分平均值：

s＝g×z

8.如权利要求6所述的装置，其特征在于，所述计算模块具体用于：

9.如权利要求6所述的装置，其特征在于，所述计算模块具体用于：

通过下列公式确定所述样本类对应的调整后的权值：

ω_k+1'＝ω_k ^f(s)

通过下列公式确定所述新权值

10.如权利要求6所述的装置，其特征在于，所述测试结果包括通过和不通过两种，当所述测试结果为通过时，所述样本类缺陷总数为零。