CN110147325A - 一种基于自动化测试的数据生成方法及装置 - Google Patents

一种基于自动化测试的数据生成方法及装置 Download PDF

Info

Publication number
CN110147325A
CN110147325A CN201910431742.2A CN201910431742A CN110147325A CN 110147325 A CN110147325 A CN 110147325A CN 201910431742 A CN201910431742 A CN 201910431742A CN 110147325 A CN110147325 A CN 110147325A
Authority
CN
China
Prior art keywords
defect
sample
sample class
class
grade
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910431742.2A
Other languages
English (en)
Other versions
CN110147325B (zh
Inventor
师环
马妤晨
罗云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telecommunications Science And Technology Tenth Research Institute Ltd
Original Assignee
Telecommunications Science And Technology Tenth Research Institute Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telecommunications Science And Technology Tenth Research Institute Ltd filed Critical Telecommunications Science And Technology Tenth Research Institute Ltd
Priority to CN201910431742.2A priority Critical patent/CN110147325B/zh
Publication of CN110147325A publication Critical patent/CN110147325A/zh
Application granted granted Critical
Publication of CN110147325B publication Critical patent/CN110147325B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3668Software testing
    • G06F11/3672Test management
    • G06F11/3688Test management for test execution, e.g. scheduling of test suites
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3668Software testing
    • G06F11/3672Test management
    • G06F11/3692Test management for test results analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Quality & Reliability (AREA)
  • Computer Hardware Design (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Testing Or Measuring Of Semiconductors Or The Like (AREA)

Abstract

本发明公开了一种基于自动化测试的数据生成方法及装置,涉及计算机领域。用以解决大数据系统测试存在数据量级巨大,数据类型繁多复杂,导致测试效率比较低的问题。该方法包括:根据待测数据的类型和格式确定所述待测数据的分类规则,根据分类规则,将待测数据生成样本数据,确定样本的初始权值;根据缺陷划分标准确定样本类的测试结果、样本类缺陷总数以及缺陷情况等级;根据初始权值和样本类缺陷总数,确定样本类的缺陷数量等级;根据缺陷情况等级,样本类缺陷总数以及缺陷数量等级确定样本类的缺陷情况得分;根据缺陷情况得分,权值评估函数和初始权值确定样本类的新权值,根据新权值调整样本类,得到调整后的样本数据。

Description

一种基于自动化测试的数据生成方法及装置
技术领域
本发明涉及计算机技术领域,更具体的涉及一种基于自动化测试的数据生成方法及装置。
背景技术
近几年来,大数据在全球迅猛发展,计算机硬件更新换代,大数据时代的特征并不局限于掌握规模庞大的数据,更多的是能够拥有相关行业的大规模数据专业化处理的能力。由于大数据拥有巨大的数据量、复杂的数据类型、高速信息处理以及较低的价值密度四大特征,当前的数据处理方式相比传统的处理方式有了很大的不同,导致软件测试形式、重点以及方法手段也需要及时更新变化。
针对不同架构、不同技术组件的大数据系统,功能测试主要方法仍然可以使用黑盒测试法。将程序看做黑盒,不考虑程序内部结构和内部特性,将准备的样本数据作为输入,测试程序是否能适当的接收数据而产生正确的输出信息。该方法的好处是忽略软件程序的具体实现方式,从用户角度考虑业务处理正确性,因此适用范围较广。
但是,大数据系统测试与传统软件平台测试还存在很多区别,主要在于处理数据量级巨大,数据类型繁多复杂,以及测试阶段数据信息无法完全确定等。
综上所述,现有的大数据系统测试存在数据量级巨大,数据类型繁多复杂,导致测试效率比较低的问题。
发明内容
本发明实施例提供一种基于自动化测试的数据生成方法及装置,用以解决现有的大数据系统测试存在数据量级巨大,数据类型繁多复杂,导致测试效率比较低的问题。
本发明实施例提供一种基于自动化测试的数据生成方法,包括:
根据待测数据的类型和格式确定所述待测数据的分类规则,根据所述分类规则,将所述待测数据生成样本数据,确定所述样本数据包括的样本类的总数以及每个所述样本的初始权值;
根据缺陷划分标准确定所述样本类的测试结果、样本类缺陷总数以及缺陷情况等级;
根据所述初始权值和所述样本类缺陷总数,确定所述样本类的缺陷数量等级;根据所述缺陷情况等级,所述样本类缺陷总数以及所述缺陷数量等级确定所述样本类的缺陷情况得分;
根据所述样本类的缺陷情况得分,权值评估函数和所述初始权值确定所述样本类的新权值,根据所述新权值调整所述样本类,得到调整后的样本数据。
优选地,所述缺陷情况等级至少包括1级,2级...m级,其中,所述缺陷情况等级的赋值按照递增顺序增加;
所述根据所述缺陷情况等级,所述样本类缺陷总数以及所述缺陷数量等级确定所述样本类的缺陷情况得分,具体包括:
通过下列公式确定所述样本类的缺陷等级评分平均值:
根据所述缺陷等级评分平均值和所述缺陷数量等级,通过下列公式确定所述样本类的缺陷情况得分:
s=g×z
其中,g为缺陷等级评分平均值,xj为第j级缺陷所对应的评分,yj为第j级缺陷的实际数量,z为所述缺陷数量等级,s为所述样本类的缺陷情况得分,m为缺陷情况最高等级。
优选地,所述根据所述初始权值和所述样本类缺陷总数,确定所述样本数据的缺陷数量等级,具体包括:
根据所述初始权值和所述样本类缺陷总数通过下列公式确定样本类缺陷数估值:
根据所述样本类缺陷数估值通过下列公式确定样本总缺陷数估值,根据所述样本总缺陷数估值和所述样本类缺陷数估值确定缺陷数量分数,根据所述缺陷数量分数确定所述缺陷数量等级:
其中,N为所述样本类缺陷总数,ωk为所述样本类的初始权值,ai表示第i类所述样本类对应的a值,n为所述样本数据包括的样本类的总数。
优选地,所述根据所述样本类的缺陷情况得分,权值评估函数和所述初始权值确定所述样本类的新权值,具体包括:
通过下列公式确定所述样本类对应的调整后的权值:
ωk+1'=ωk f(s)
通过下列公式确定所述新权值
其中,ωk为所述初始权值,ωk+1′为所述调整后的权值,f(s)为权值评估函数,α为调整系数,ωk+1为所述新权值,n为所述样本类的总数。
优选地,所述测试结果包括通过和不通过两种,当所述测试结果为通过时,所述样本类缺陷总数为零。
本发明实施例还提供了一种基于自动化测试的数据生成装置,包括:
样本数据生成模块,用于根据待测数据的类型和格式确定所述待测数据的分类规则,根据所述分类规则,将所述待测数据生成样本数据,确定所述样本数据包括的样本类的总数以及每个所述样本的初始权值;
自动化测试装置,用于根据缺陷划分标准确定所述样本类的测试结果、样本类缺陷总数以及缺陷情况等级;
计算模块,用于根据所述初始权值和所述样本类缺陷总数,确定所述样本类的缺陷数量等级;根据所述缺陷情况等级,所述样本类缺陷总数以及所述缺陷数量等级确定所述样本类的缺陷情况得分;用于根据所述样本类的缺陷情况得分,权值评估函数和所述初始权值确定所述样本类的新权值,根据所述新权值调整所述样本类,得到调整后的样本数据。
优选地,所述缺陷情况等级至少包括1级,2级...m级,其中,所述缺陷情况等级的赋值按照递增顺序增加;
所述计算模块具体用于:
通过下列公式确定所述样本类的缺陷等级评分平均值:
根据所述缺陷等级评分平均值和所述缺陷数量等级,通过下列公式确定所述样本类的缺陷情况得分:
s=g×z
其中,g为缺陷等级评分平均值,xj为第j级缺陷所对应的评分,yj为第j级缺陷的实际数量,z为所述缺陷数量等级,s为所述样本类的缺陷情况得分,m为缺陷情况最高等级。
优选地,所述计算模块具体用于:
根据所述初始权值和所述样本类缺陷总数通过下列公式确定样本类缺陷数估值:
根据所述样本类缺陷数估值通过下列公式确定样本总缺陷数估值,根据所述样本总缺陷数估值和所述样本类缺陷数估值确定缺陷数量分数,根据所述缺陷数量分数确定所述缺陷数量等级:
其中,N为所述样本类缺陷总数,ωk为所述样本类的初始权值,ai表示第i类所述样本类对应的a值,n为所述样本数据包括的样本类的总数。
优选地,所述计算模块具体用于:
通过下列公式确定所述样本类对应的调整后的权值:
ωk+1'=ωk f(s)
通过下列公式确定所述新权值
其中,ωk为所述初始权值,ωk+1′为所述调整后的权值,f(s)为权值评估函数,α为调整系数,ωk+1为所述新权值,n为所述样本类的总数。
优选地,所述测试结果包括通过和不通过两种,当所述测试结果为通过时,所述样本类缺陷总数为零。
本发明实施例提供一种基于自动化测试的数据生成方法及装置,该方法包括:根据待测数据的类型和格式确定所述待测数据的分类规则,根据所述分类规则,将所述待测数据生成样本数据,确定所述样本数据包括的样本类的总数以及每个所述样本的初始权值;根据缺陷划分标准确定所述样本类的测试结果、样本类缺陷总数以及缺陷情况等级;根据所述初始权值和所述样本类缺陷总数,确定所述样本类的缺陷数量等级;根据所述缺陷情况等级,所述样本类缺陷总数以及所述缺陷数量等级确定所述样本类的缺陷情况得分;根据所述样本类的缺陷情况得分,权值评估函数和所述初始权值确定所述样本类的新权值,根据所述新权值调整所述样本类,得到调整后的样本数据。该方法中结合待测试对象,对待测试数据进行分类,按照分类规则生成样本数据,并对样本数据包括的每个样本类赋予相同的初始权值,根据缺陷划分标准,得到样本类的测试结果、样本类缺陷总数和缺陷情况等级信息,进一步地,根据上述信息依此确定样本类的缺陷数量等级,样本类的缺陷情况得分,并最后确定了样本类的新权值,根据该新权值对样本类进行调整,最后得到调整后的样本数据。该方法有效解决大数据系统业务测试时对测试数据的各项要求,保证大数据系统业务测试的质量,还能减轻测试人员数据准备的负担,提高测试效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于自动化测试的数据生成方法流程示意图;
图2为本发明实施例提供的一种基于自动化测试的数据生成装置结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1示例性的示出了本发明实施例提供的一种基于自动化测试的数据生成方法流程示意图,如图1所示,该方法主要包括以下步骤:
步骤101,根据待测数据的类型和格式确定所述待测数据的分类规则,根据所述分类规则,将所述待测数据生成样本数据,确定所述样本数据包括的样本类的总数以及每个所述样本的初始权值;
步骤102,根据缺陷划分标准确定所述样本类的测试结果、样本类缺陷总数以及缺陷情况等级;
步骤103,根据所述初始权值和所述样本类缺陷总数,确定所述样本类的缺陷数量等级;根据所述缺陷情况等级,所述样本类缺陷总数以及所述缺陷数量等级确定所述样本类的缺陷情况得分;
步骤104,根据所述样本类的缺陷情况得分,权值评估函数和所述初始权值确定所述样本类的新权值,根据所述新权值调整所述样本类,得到调整后的样本数据。
在步骤101中,先分析待测试数据,将待测试数据进行分类,具体地,根据数据的类型和格式按照黑盒测试方法分为有效等价类、无效等价类、边界数据、随机数据,各类中具体细分中文、英文、数字、符号、两两混合、三种混合、全部混合,按照格式还可分为长度不同,结构顺序不同等。需要说明的是,在本发明实施例中,添加随机数据是为了避免类型划分存在遗漏的情况。将所有划分类对应出规则,如随机数据规则、中文规则、英文规则等,即给出各类数据的生成函数。
进一步地,按照上述确定的分类规则,将待测数据生成样本数据,需要说明的是,该样本数据包括有多个样本类,当将待测数据生成样本数据之后,需要进一步确认该样本数据内包括的样本类的总数,然后再确认样本数据包括的每个样本类的初始权值。
在本发明实施例中,通过下列公式(1)确定每个样本类的初始权值:
ωk=1/Σ (1)
其中,ωk为样本类的初始权值,Σ为样本数据包括的样本类的总数。
需要说明的是,待测数据的分类规则至少包括1类,即待测数据至少可以按照一类分类规则进行分类,相应地,待测数据按照分类规则分类之后,每类规则对应的数据至少包括有2种样本类。
在步骤102中,按照缺陷划分标准对样本类数据进行测试,可以得到样本类的测试结果、样本类缺陷总数以及缺陷情况等级。
需要说明的是,在本发明实施例中,当按照缺陷划分标准对样本数据包括的样本类进行测试时,得到的测试结果可以包括有两种,一种是测试结果为通过,一种是测试结果为不通过。
等级评定法是最容易操作和普遍应用的一种评估方法,这种方法的操作形式是,给出不同等级的定义和描述,然后针对每一个评价要素或指标按照给定的等级评估,最后再给出总的评价。
在本发明实施例中,采用等级评定法,确定对缺陷情况赋值的影响因素为产生的缺陷数量和缺陷情况等级,对它们进行定义、划分等级并对各等级进行评分,然后对每类数据产生的缺陷情况赋值。具体地,在本发明实施例中,缺陷情况等级至少可以包括有1级、2级、3级...m级等多个级别。其中,1级为缺陷情况等级中问题最轻的等级,相应地,m级为缺陷情况等级中问题最为严重的等级。举例来说,当按照缺陷情况等级包括提示、一般、严重、较严重和致命5个级别时,则表明该缺陷情况等级中提示对应的缺陷等级最小,后面的缺陷等级依此为一般、严重、较严重和致命,且致命对应的缺陷等级最为严重。表1为本发明实施例提供的缺陷情况等级说明。
进一步地,当确定了缺陷情况最高等级之后,则需要对各缺陷情况等级进行赋值,在本发明实施例中,缺陷情况等级的赋值根据等级说明按照递增的顺序增加。举例来说,若对提示、一般、严重、较严重和致命5个缺陷情况等级按照2~6分进行赋值,依此为:提示为2分,一般为3分,严重为4分,较严重为5分,致命为6分。若对提示、一般、严重、较严重和致命5个缺陷情况等级按照10~50分进行赋值,依此为:提示为10分,一般为20分,严重为30分,较严重为40分,致命为50分。
表1.缺陷情况等级
在实际应用中,按照缺陷划分标准对样本类数据进行测试,当测试结果为通过时,对测试结果赋值为0,可以确定样本类的缺陷数量为0;当测试结果为不通过时,对测试结果赋值为1,进一步地可以按照表1提供的缺陷情况等级对样本类的缺陷情况等级进行分类以及确定每种缺陷情况等级对应的分值。
在步骤103中,因为缺陷的发现常常具有聚集性,因此需要根据缺陷数量分等级进行评分,以规避因测试人员等主观因素对发现缺陷数量造成的影响。
由于每个样本类的初始权值相同,而每个样本类的样本类缺陷总数不同,多个样本类可能会产生多个同样的缺陷,为了避免这种影响,在本发明实施例中,采用每个样本类产生的样本类缺陷总数除以该样本类的初始权值,得到该样本类的样本类缺陷数估值。具体地,通过下列公式(2)确定样本类缺陷数估值:
其中,a为样本类缺陷数估值,N为所述样本类缺陷总数,ωk为所述样本类的初始权值。
进一步地,对样本数据包括的每个样本类的样本类缺陷数估值通过下列公式(3)进行统计,得到样本总缺陷数估值:
其中,k为样本总缺陷数估值,ai表示第i类所述样本类对应的a值,n为所述样本数据包括的样本类的总数。
进一步地,根据确定的样本总缺陷数估值和样本类缺陷数估值,通过下列公式(4)确定缺陷数量分数,进一步地,根据缺陷数量分数确定缺陷数量等级。
具体地,当确定缺陷数量分数介于0~10%之间时,则确定缺陷数量等级为1;当确定缺陷数量分数介于10%~20%之间时,则确定缺陷数量等级为2;当确定缺陷数量分数介于20%~30%之间时,则确定缺陷数量等级为3;当确定缺陷数量分数大于40%时,则确定缺陷数量等级为4。在本发明实施例中,采用字母z表示缺陷数量等级。
进一步地,当确定样本类的缺陷数量等级之后,需要确定样本类的缺陷等级评分平均值,具体地,通过下列公式(5)确定样本类的缺陷等级评分平均值:
其中,g为缺陷等级评分平均值,xj为第j级缺陷所对应的评分,yj为第j级缺陷的实际数量,m为缺陷情况最高等级。
进一步地,通过下列公式(6)确定样本类的缺陷情况得分:
s=g×z (6)
其中,z为所述缺陷数量等级,s为所述样本类的缺陷情况得分。
在步骤104中,当确定了样本类的缺陷等级评分平均值和缺陷情况得分之后,则可以根据样本类的初始权值,确定样本类对应的调整后的权值,具体地,通过下列公式(7)确定样本类对应的调整后的权值:
ωk+1'=ωk f(s) (7)
在公式(7)中,ωk为所述初始权值,ωk+1′为所述调整后的权值,f(s)为权值评估函数,s为每个样本类的缺陷情况得分,α为调整系数,需要说明的是,在本发明实施例中,α的取值可以为每轮各个样本类的缺陷情况得分之和。
进一步地,若每轮次运行完成后,需要对各样本类的权值进行归一化处理,假设输入类型共有n类,则归一化处理函数可以通过下列公式(8)确定:
其中,ωk+1′为调整后的权值,ωk+1为归一化处理后得到的样本类的新权值。
在本发明实施例中,当确定了样本类的新权值之后,则可以根据该新权值对样本类进行调整,得到调整后的样本数据。
为了更清楚的介绍本发明实施例提供的一种基于自动化测试的数据生成方法,以下结合具体的实例来介绍该方法:
S1、分析待测数据的输入条件,如搜索功能,对搜索功能可输入的数据条件进行等价类划分,需包括有效等价类、无效等价类、边界数据、随机数据。
对有效等价类使用穷举法罗列其类型,包括中文、英文、其他语种词组(结合系统实现进行添加)、数字、符号(全角、半角),以及所有类型两两组合和三三组合类。
分别对每一类定义其规则,如中文类,需要包括二字词和多字词,英文类需包括单词、两词词组和多词词组。然后按照规则构造函数,使其按照要求随机生成符合规则的数据,生成样本数据。构造分类如以下表2示例:
表2.待测试数据的分类规则
S2、确定样本类的总数为10,进一步地通过公式(1)确定样本类的初始权值为0.1。
S3、生成样本数据。
S4、根据缺陷划分标准对样本类进行测试,得到样本类的测试结果,样本类缺陷总数和缺陷情况等级。
根据表1提供的缺陷情况等级说明,对样本类的缺陷情况等级可以划分为五个等级,即1级、2级、3级、4级和5级。
进一步地,可以得到该样本数据包括的各个样本类的测试结果即缺陷情况等级,具体如表3所示:
表3.样本数据的测试结果及缺陷情况等级
需要说明的是,上述表中,测试结果为0表示测试通过,测试结果为1表示测试未通过。
S5、根据测试结果重新计算权值:
S5-1、对每个样本类通过缺陷划分标准测试之后测试结果和缺陷分布赋值:
(1)、当测试结果为通过时,缺陷数量为0,缺陷情况的赋值为1。
(2)、当测试结果为不通过时,对缺陷情况的赋值具体如下:
对缺陷情况等级评分,在本发明实施例中,根据缺陷情况等级的划分,分别以2~6不同的值代表各缺陷情况等级。
根据样本类初始权值,样本类缺陷总数,依此确认样本类缺陷数估值、样本总缺陷数估值、缺陷数量分数和缺陷数量等级,具体可以参见表4
表4.缺陷数量等级评定
S5-1、各个样本类输出缺陷情况的赋值
根据表4中确定缺陷数量等级z,进一步地根据公式(5),公式(6)依此确定样本类的缺陷等级评分平均值和样本类的缺陷情况得分,具体见表5。
表5样本类的缺陷情况赋值
S5-3、根据各样本类的缺陷情况,通过公式(7)和(8)得到样本类的新权值。具体见表6。
表6.样本类新权值
S6、设置终止条件为:各样本类的权值基本保持不变。
需要说明的是,终止条件的确定建立在对实际情况具体分析的基础上。
考虑以下情况:
(1)系统运行一段时间,各样本类的权值基本保持不变;
(2)当某一样本类引起的缺陷过多,为了保证测试数据的多样性,应该终止样本类的权值调整。
(3)鉴于整个测试周期的限制,测试数据的生成不宜花费太多时间,一般为3天。
运行终止条件可以是:
(1)各样本类的权值基本不变;
(2)某一类数据的缺陷占到总缺陷数的80%;
(3)系统运行时间达到72小时。
S7、循环执行。
S8、生成最终样本数据。
综上所述,本发明实施例提供一种基于自动化测试的数据生成方法,该方法中结合待测试对象,对待测试数据进行分类,按照分类规则生成样本数据,并对样本数据包括的每个样本类赋予相同的初始权值,根据缺陷划分标准,得到样本类的测试结果、样本类缺陷总数和缺陷情况等级信息,进一步地,根据上述信息依此确定样本类的缺陷数量等级,样本类的缺陷情况得分,并最后确定了样本类的新权值,根据该新权值对样本类进行调整,最后得到调整后的样本数据。该方法有效解决大数据系统业务测试时对测试数据的各项要求,保证大数据系统业务测试的质量,还能减轻测试人员数据准备的负担,提高测试效率。
基于同一发明构思,本发明实施例提供了一种基于自动化测试的数据生成装置,由于该装置解决技术问题的原理与一种基于自动化测试的数据生成方法相似,因此该装置的实施可以参见方法的实施,重复之处不再赘述。图
为本发明实施例提供的一种基于自动化测试的数据生成装置结构示意图。如图2所示,该装置包括样本数据生成模块201,自动化测试装置202和计算模块203。
样本数据生成模块201,用于根据待测数据的类型和格式确定所述待测数据的分类规则,根据所述分类规则,将所述待测数据生成样本数据,确定所述样本数据包括的样本类的总数以及每个所述样本的初始权值;
自动化测试装置202,用于根据缺陷划分标准确定所述样本类的测试结果、样本类缺陷总数以及缺陷情况等级;
计算模块203,用于根据所述初始权值和所述样本类缺陷总数,确定所述样本类的缺陷数量等级;根据所述缺陷情况等级,所述样本类缺陷总数以及所述缺陷数量等级确定所述样本类的缺陷情况得分;用于根据所述样本类的缺陷情况得分,权值评估函数和所述初始权值确定所述样本类的新权值,根据所述新权值调整所述样本类,得到调整后的样本数据。
优选地,所述缺陷情况等级至少包括1级,2级...m级,其中,所述缺陷情况等级的赋值按照递增顺序增加;
所述计算模块203具体用于:
通过下列公式确定所述样本类的缺陷等级评分平均值:
根据所述缺陷等级评分平均值和所述缺陷数量等级,通过下列公式确定所述样本类的缺陷情况得分:
s=g×z
其中,g为缺陷等级评分平均值,xj为第j级缺陷所对应的评分,yj为第j级缺陷的实际数量,z为所述缺陷数量等级,s为所述样本类的缺陷情况得分,m为缺陷情况最高等级。
优选地,所述计算模块203具体用于:
根据所述初始权值和所述样本类缺陷总数通过下列公式确定样本类缺陷数估值:
根据所述样本类缺陷数估值通过下列公式确定样本总缺陷数估值,根据所述样本总缺陷数估值和所述样本类缺陷数估值确定缺陷数量分数,根据所述缺陷数量分数确定所述缺陷数量等级:
其中,N为所述样本类缺陷总数,ωk为所述样本类的初始权值,ai表示第i类所述样本类对应的a值,n为所述样本数据包括的样本类的总数。
优选地,所述计算模块203具体用于:
通过下列公式确定所述样本类对应的调整后的权值:
ωk+1'=ωk f(s)
通过下列公式确定所述新权值
其中,ωk为所述初始权值,ωk+1′为所述调整后的权值,f(s)为权值评估函数,α为调整系数,ωk+1为所述新权值,n为所述样本类的总数。
优选地,所述测试结果包括通过和不通过两种,当所述测试结果为通过时,所述样本类缺陷总数为零。
应当理解,以上一种基于自动化测试的数据生成装置包括的单元仅为根据该设备装置实现的功能进行的逻辑划分,实际应用中,可以进行上述单元的叠加或拆分。并且该实施例提供的一种基于自动化测试的数据生成装置所实现的功能与上述实施例提供的一种基于自动化测试的数据生成方法一一对应,对于该装置所实现的更为详细的处理流程,在上述方法实施例一中已做详细描述,此处不再详细描述。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种基于自动化测试的数据生成方法,其特征在于,包括:
根据待测数据的类型和格式确定所述待测数据的分类规则,根据所述分类规则,将所述待测数据生成样本数据,确定所述样本数据包括的样本类的总数以及每个所述样本的初始权值;
根据缺陷划分标准确定所述样本类的测试结果、样本类缺陷总数以及缺陷情况等级;
根据所述初始权值和所述样本类缺陷总数,确定所述样本类的缺陷数量等级;根据所述缺陷情况等级,所述样本类缺陷总数以及所述缺陷数量等级确定所述样本类的缺陷情况得分;
根据所述样本类的缺陷情况得分,权值评估函数和所述初始权值确定所述样本类的新权值,根据所述新权值调整所述样本类,得到调整后的样本数据。
2.如权利要求1所述的方法,其特征在于,所述缺陷情况等级至少包括1级,2级...m级,其中,所述缺陷情况等级的赋值按照递增顺序增加;
所述根据所述缺陷情况等级,所述样本类缺陷总数以及所述缺陷数量等级确定所述样本类的缺陷情况得分,具体包括:
通过下列公式确定所述样本类的缺陷等级评分平均值:
根据所述缺陷等级评分平均值和所述缺陷数量等级,通过下列公式确定所述样本类的缺陷情况得分:
s=g×z
其中,g为缺陷等级评分平均值,xj为第j级缺陷所对应的评分,yj为第j级缺陷的实际数量,z为所述缺陷数量等级,s为所述样本类的缺陷情况得分,m为缺陷情况最高等级。
3.如权利要求1所述的方法,其特征在于,所述根据所述初始权值和所述样本类缺陷总数,确定所述样本数据的缺陷数量等级,具体包括:
根据所述初始权值和所述样本类缺陷总数通过下列公式确定样本类缺陷数估值:
根据所述样本类缺陷数估值通过下列公式确定样本总缺陷数估值,根据所述样本总缺陷数估值和所述样本类缺陷数估值确定缺陷数量分数,根据所述缺陷数量分数确定所述缺陷数量等级:
其中,N为所述样本类缺陷总数,ωk为所述样本类的初始权值,a为所述样本类缺陷数估值,ai表示第i类所述样本类对应的a值,k为所述样本总缺陷数估值,n为所述样本数据包括的样本类的总数。
4.如权利要求1所述的方法,其特征在于,所述根据所述样本类的缺陷情况得分,权值评估函数和所述初始权值确定所述样本类的新权值,具体包括:
通过下列公式确定所述样本类对应的调整后的权值:
ωk+1'=ωk f(s)
通过下列公式确定所述新权值
其中,ωk为所述初始权值,ωk+1′为所述调整后的权值,f(s)为权值评估函数,α为调整系数,ωk+1为所述新权值,n为所述样本类的总数。
5.如权利要求1所述的方法,其特征在于,所述测试结果包括通过和不通过两种,当所述测试结果为通过时,所述样本类缺陷总数为零。
6.一种基于自动化测试的数据生成装置,其特征在于,包括:
样本数据生成模块,用于根据待测数据的类型和格式确定所述待测数据的分类规则,根据所述分类规则,将所述待测数据生成样本数据,确定所述样本数据包括的样本类的总数以及每个所述样本的初始权值;
自动化测试装置,用于根据缺陷划分标准确定所述样本类的测试结果、样本类缺陷总数以及缺陷情况等级;
计算模块,用于根据所述初始权值和所述样本类缺陷总数,确定所述样本类的缺陷数量等级;根据所述缺陷情况等级,所述样本类缺陷总数以及所述缺陷数量等级确定所述样本类的缺陷情况得分;用于根据所述样本类的缺陷情况得分,权值评估函数和所述初始权值确定所述样本类的新权值,根据所述新权值调整所述样本类,得到调整后的样本数据。
7.如权利要求6所述的装置,其特征在于,所述缺陷情况等级至少包括1级,2级...m级,其中,所述缺陷情况等级的赋值按照递增顺序增加;
所述计算模块具体用于:
通过下列公式确定所述样本类的缺陷等级评分平均值:
根据所述缺陷等级评分平均值和所述缺陷数量等级,通过下列公式确定所述样本类的缺陷情况得分:
s=g×z
其中,g为缺陷等级评分平均值,xj为第j级缺陷所对应的评分,yj为第j级缺陷的实际数量,z为所述缺陷数量等级,s为所述样本类的缺陷情况得分,m为缺陷情况最高等级。
8.如权利要求6所述的装置,其特征在于,所述计算模块具体用于:
根据所述初始权值和所述样本类缺陷总数通过下列公式确定样本类缺陷数估值:
根据所述样本类缺陷数估值通过下列公式确定样本总缺陷数估值,根据所述样本总缺陷数估值和所述样本类缺陷数估值确定缺陷数量分数,根据所述缺陷数量分数确定所述缺陷数量等级:
其中,N为所述样本类缺陷总数,ωk为所述样本类的初始权值,ai表示第i类所述样本类对应的a值,n为所述样本数据包括的样本类的总数。
9.如权利要求6所述的装置,其特征在于,所述计算模块具体用于:
通过下列公式确定所述样本类对应的调整后的权值:
ωk+1'=ωk f(s)
通过下列公式确定所述新权值
其中,ωk为所述初始权值,ωk+1′为所述调整后的权值,f(s)为权值评估函数,α为调整系数,ωk+1为所述新权值,n为所述样本类的总数。
10.如权利要求6所述的装置,其特征在于,所述测试结果包括通过和不通过两种,当所述测试结果为通过时,所述样本类缺陷总数为零。
CN201910431742.2A 2019-05-22 2019-05-22 一种基于自动化测试的数据生成方法及装置 Active CN110147325B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910431742.2A CN110147325B (zh) 2019-05-22 2019-05-22 一种基于自动化测试的数据生成方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910431742.2A CN110147325B (zh) 2019-05-22 2019-05-22 一种基于自动化测试的数据生成方法及装置

Publications (2)

Publication Number Publication Date
CN110147325A true CN110147325A (zh) 2019-08-20
CN110147325B CN110147325B (zh) 2023-04-07

Family

ID=67592729

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910431742.2A Active CN110147325B (zh) 2019-05-22 2019-05-22 一种基于自动化测试的数据生成方法及装置

Country Status (1)

Country Link
CN (1) CN110147325B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020011311A (ko) * 2000-08-01 2002-02-08 김영식 영어작문 채점방법
CN102141958A (zh) * 2011-03-09 2011-08-03 中国矿业大学 面向缺陷的路径覆盖测试数据进化生成方法
WO2011158711A1 (ja) * 2010-06-14 2011-12-22 住友金属工業株式会社 欠陥判別装置
CN102360335A (zh) * 2011-10-19 2012-02-22 北京广利核系统工程有限公司 定量评估核电厂安全级dcs系统应用软件缺陷价值的方法
CN102637143A (zh) * 2012-03-07 2012-08-15 南京邮电大学 基于改进的支持向量机的软件缺陷优先级预测方法
US20130279794A1 (en) * 2012-04-19 2013-10-24 Applied Materials Israel Ltd. Integration of automatic and manual defect classification
CN103984623A (zh) * 2014-04-28 2014-08-13 天津大学 一种基于缺陷检测的软件安全风险评估方法
CN104360946A (zh) * 2014-11-18 2015-02-18 电信科学技术第十研究所 一种测试缺陷的计算机实现的方法及计算机
CN105589806A (zh) * 2015-12-17 2016-05-18 北京航空航天大学 一种基于SMOTE+Boosting算法的软件缺陷倾向预测方法
WO2018015911A1 (en) * 2016-07-19 2018-01-25 Volpara Health Technologies Limited System and apparatus for clinical decision optimisation
CN108876765A (zh) * 2018-05-22 2018-11-23 塞伯睿机器人技术(长沙)有限公司 工业分拣机器人的目标定位装置和方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020011311A (ko) * 2000-08-01 2002-02-08 김영식 영어작문 채점방법
WO2011158711A1 (ja) * 2010-06-14 2011-12-22 住友金属工業株式会社 欠陥判別装置
CN102141958A (zh) * 2011-03-09 2011-08-03 中国矿业大学 面向缺陷的路径覆盖测试数据进化生成方法
CN102360335A (zh) * 2011-10-19 2012-02-22 北京广利核系统工程有限公司 定量评估核电厂安全级dcs系统应用软件缺陷价值的方法
CN102637143A (zh) * 2012-03-07 2012-08-15 南京邮电大学 基于改进的支持向量机的软件缺陷优先级预测方法
US20130279794A1 (en) * 2012-04-19 2013-10-24 Applied Materials Israel Ltd. Integration of automatic and manual defect classification
CN103984623A (zh) * 2014-04-28 2014-08-13 天津大学 一种基于缺陷检测的软件安全风险评估方法
CN104360946A (zh) * 2014-11-18 2015-02-18 电信科学技术第十研究所 一种测试缺陷的计算机实现的方法及计算机
CN105589806A (zh) * 2015-12-17 2016-05-18 北京航空航天大学 一种基于SMOTE+Boosting算法的软件缺陷倾向预测方法
WO2018015911A1 (en) * 2016-07-19 2018-01-25 Volpara Health Technologies Limited System and apparatus for clinical decision optimisation
CN108876765A (zh) * 2018-05-22 2018-11-23 塞伯睿机器人技术(长沙)有限公司 工业分拣机器人的目标定位装置和方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
FANGMING LI: "Quick Reconstruction of Arbitrary Pipeline Defect Profiles From MFL Measurements Employing Modified Harmony Search Algorithm", 《IEEE TRANSACTIONS ON INSTRUMENTATION AND MEASUREMENT》 *
李军锋: "软件测试质量评价方法", 《计算机与现代化》 *

Also Published As

Publication number Publication date
CN110147325B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
Holz et al. New method for determining cumulative gravitational lensing effects in inhomogeneous universes
CN104536881B (zh) 基于自然语言分析的众测错误报告优先级排序方法
WO2021115186A1 (zh) 基于ann的程序检测方法和检测系统及应用
CN110309010A (zh) 用于电力设备相位分辩的局放网络训练方法及装置
CN108763096A (zh) 基于深度信念网络算法支持向量机的软件缺陷预测方法
CN103309857B (zh) 一种分类语料确定方法和设备
CN112017070A (zh) 一种基于数据增强评估电力系统暂态稳定的方法及系统
CN110134988A (zh) 一种基于失效物理的器件级产品多应力强化试验剖面确定方法
CN106446011A (zh) 数据处理的方法及装置
Caterino et al. A comparative analysis of decision making methods for the seismic retrofit of RC buildings
CN109558983A (zh) 网络课程辍学率预测方法及装置
CN109426655A (zh) 数据分析方法、装置、电子设备及计算机可读存储介质
Bozkurt et al. Identifying the factors affecting the economic growth of oil-producing countries
CN104318105B (zh) 飞机飞行试验有效架次评定方法
Fowowe Energy consumption and real GDP: Panel co-integration and causality tests for sub-Saharan African countries
Ursem et al. Multi-objective distinct candidates optimization: Locating a few highly different solutions in a circuit component sizing problem
CN110147325A (zh) 一种基于自动化测试的数据生成方法及装置
Costa et al. Automatic classification of computational thinking skills in elementary school math questions
Cooper A simulation model of an information retrieval system
CN109376080B (zh) 时间适配的自动化缺陷定位方法和装置
CN107845047A (zh) 一种动态评分系统、方法以及计算机可读存储介质
JP7030583B2 (ja) シラバスを利用したマッチング装置
CN108073503A (zh) 一种组件成熟度的评测方法及装置
CN106301880A (zh) 一种确定网络关系稳定度、互联网业务推荐方法和设备
CN110767011A (zh) 一种考题选取方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant