CN113505283B - 一种测试数据的筛选方法及系统 - Google Patents

一种测试数据的筛选方法及系统 Download PDF

Info

Publication number
CN113505283B
CN113505283B CN202110780282.1A CN202110780282A CN113505283B CN 113505283 B CN113505283 B CN 113505283B CN 202110780282 A CN202110780282 A CN 202110780282A CN 113505283 B CN113505283 B CN 113505283B
Authority
CN
China
Prior art keywords
information
function
screening
data
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110780282.1A
Other languages
English (en)
Other versions
CN113505283A (zh
Inventor
徐中英
孔祥玉
何华锋
岳瑞华
赵沙乐
张琪
郑建飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rocket Force University of Engineering of PLA
Original Assignee
Rocket Force University of Engineering of PLA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rocket Force University of Engineering of PLA filed Critical Rocket Force University of Engineering of PLA
Priority to CN202110780282.1A priority Critical patent/CN113505283B/zh
Publication of CN113505283A publication Critical patent/CN113505283A/zh
Application granted granted Critical
Publication of CN113505283B publication Critical patent/CN113505283B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9035Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/04Manufacturing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Mathematical Physics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Molecular Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Manufacturing & Machinery (AREA)
  • Primary Health Care (AREA)
  • Debugging And Monitoring (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

本发明公开了一种测试数据的筛选方法及系统,通过获得函数特征信息;根据函数特征信息对所述待测试数据库进行特征遍历对比,获得对比结果,包括第一函数信息、第二函数信息、直到第N函数信息,N为正整数;根据第一函数信息,获得第一函数路径信息;根据第一函数信息、第一函数路径信息从所述待测试数据库中进行筛选,获得第一测试数据;依次根据第二函数信息、直到第N函数信息,获得第二函数路径信息、直到第N函数路径信息;基于各函数信息与函数路径信息从待测试数据库中进行筛选,获得第二测试数据、第N测试数据。达到了测试数据筛选过程简单方便,保障测试数据筛选的可靠性,从而提高了测试效率缩短测试周期的技术效果。

Description

一种测试数据的筛选方法及系统
技术领域
本发明涉及数据分析相关技术领域,尤其涉及一种测试数据的筛选方法及系统。
背景技术
对于可靠性要求高的工业产品需要经过测试,测试对于检查工业产品的合格率很重要,在生产测试流程有多个功能测试站点,每个站点会产生对应的测试日志文件存储于工业产品对应的存储空间中,在进行测试时,为了提高测试速度缩短测试周期,一般会对测试用例的测试数据进行筛选,减少不必要的测试过程,目前主要基于分支覆盖率对测试数据进行筛选,在测试程序代码中插入对应的编译软件工具,提供的覆盖率事件统计接口,对每条测试数据进行测试后,只要获得覆盖率增加,则说明测试程序进入新分支,即认为该测试数据有效,并存储为最终测试数据,否则认为无效。
但本申请发明人发现上述技术至少存在如下技术问题:
现有技术中数据筛选过程繁琐,需要借助其他编译工具使用成本高的技术问题。
发明内容
本申请实施例通过提供一种测试数据的筛选方法及系统,解决了现有技术中数据筛选过程繁琐,需要借助其他编译工具使用成本高的技术问题。达到了测试数据筛选过程简单方便,保障测试数据筛选的可靠性,从而提高了测试效率缩短测试周期的技术效果。
鉴于上述问题,提出了本申请实施例提供一种测试数据的筛选方法及系统。
第一方面,本申请实施例提供了一种测试数据的筛选方法,所述方法包括:获得待测试数据,构建待测试数据库;获得函数特征信息;根据所述函数特征信息对所述待测试数据库进行特征遍历对比,获得对比结果,所述对比结果包括多个函数信息,分别为第一函数信息、第二函数信息、直到第N函数信息,N为正整数;根据所述第一函数信息,获得第一函数路径信息;根据所述第一函数信息、所述第一函数路径信息从所述待测试数据库中进行筛选,获得第一测试数据;依次根据所述第二函数信息、直到第N函数信息,获得第二函数路径信息、直到第N函数路径信息,其中,所述函数信息与所述函数路径信息相映射;基于各函数信息与函数路径信息从所述待测试数据库中进行筛选,获得第二测试数据、第N测试数据。
另一方面,本申请还提供了一种测试数据的筛选系统,所述系统包括:第一构建单元,所述第一构建单元用于获得待测试数据,构建待测试数据库;第一获得单元,所述第一获得单元用于获得函数特征信息;第二获得单元,所述第二获得单元用于根据所述函数特征信息对所述待测试数据库进行特征遍历对比,获得对比结果,所述对比结果包括多个函数信息,分别为第一函数信息、第二函数信息、直到第N函数信息,N为正整数;第三获得单元,所述第三获得单元用于根据所述第一函数信息,获得第一函数路径信息;第四获得单元,所述第四获得单元用于根据所述第一函数信息、所述第一函数路径信息从所述待测试数据库中进行筛选,获得第一测试数据;第一执行单元,所述第一执行单元用于依次根据所述第二函数信息、直到第N函数信息,获得第二函数路径信息、直到第N函数路径信息,其中,所述函数信息与所述函数路径信息相映射;第五获得单元,所述第五获得单元用于基于各函数信息与函数路径信息从所述待测试数据库中进行筛选,获得第二测试数据、第N测试数据。
第三方面,本发明提供了一种测试数据的筛选系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现第一方面所述方法的步骤。
本申请实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
本申请实施例提供了一种测试数据的筛选方法及系统,通过获得待测试数据,构建待测试数据库;获得函数特征信息;根据所述函数特征信息对所述待测试数据库进行特征遍历对比,获得对比结果,所述对比结果包括多个函数信息,分别为第一函数信息、第二函数信息、直到第N函数信息,N为正整数;根据所述第一函数信息,获得第一函数路径信息;根据所述第一函数信息、所述第一函数路径信息从所述待测试数据库中进行筛选,获得第一测试数据;依次根据所述第二函数信息、直到第N函数信息,获得第二函数路径信息、直到第N函数路径信息,其中,所述函数信息与所述函数路径信息相映射;基于各函数信息与函数路径信息从所述待测试数据库中进行筛选,获得第二测试数据、第N测试数据。达到了测试数据筛选过程简单方便,保障测试数据筛选的可靠性,从而提高了测试效率缩短测试周期的技术效果,进而解决了现有技术中数据筛选过程繁琐,需要借助其他编译工具使用成本高的技术问题。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
图1为本申请实施例一种测试数据的筛选方法的流程示意图;
图2为本申请实施例一种测试数据的筛选系统的结构示意图;
图3为本申请实施例示例性电子设备的结构示意图。
附图标记说明:第一构建单元11,第一获得单元12,第二获得单元13,第三获得单元14,第四获得单元15,第一执行单元16,第五获得单元17,总线300,接收器301,处理器302,发送器303,存储器304,总线接口305。
具体实施方式
本申请实施例通过提供一种测试数据的筛选方法及系统,解决了现有技术中数据筛选过程繁琐,需要借助其他编译工具使用成本高的技术问题。达到了测试数据筛选过程简单方便,保障测试数据筛选的可靠性,从而提高了测试效率缩短测试周期的技术效果。下面,将参考附图详细的描述根据本申请的示例实施例。显然,所描述的实施例仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
针对上述技术问题,本申请提供的技术方案总体思路如下:
本申请实施例提供了一种测试数据的筛选方法,所述方法包括:获得待测试数据,构建待测试数据库;获得函数特征信息;根据所述函数特征信息对所述待测试数据库进行特征遍历对比,获得对比结果,所述对比结果包括多个函数信息,分别为第一函数信息、第二函数信息、直到第N函数信息,N为正整数;根据所述第一函数信息,获得第一函数路径信息;根据所述第一函数信息、所述第一函数路径信息从所述待测试数据库中进行筛选,获得第一测试数据;依次根据所述第二函数信息、直到第N函数信息,获得第二函数路径信息、直到第N函数路径信息,其中,所述函数信息与所述函数路径信息相映射;基于各函数信息与函数路径信息从所述待测试数据库中进行筛选,获得第二测试数据、第N测试数据。达到了测试数据筛选过程简单方便,保障测试数据筛选的可靠性,从而提高了测试效率缩短测试周期的技术效果。
在介绍了本申请基本原理后,下面将结合说明书附图来具体介绍本申请的各种非限制性的实施方式。
实施例一
如图1所示,本申请实施例提供了一种测试数据的筛选方法,所述方法包括:
步骤S100:获得待测试数据,构建待测试数据库;
具体的,在生产基地对于生产出的工业产品,无论是出厂前,还是在生产过程中,为了保证对产出的工业产品的质量,需要在生产测试流程中设置多个功能测试站点,每个站点对于产出的工业产品都会产生测试日志文件,如何高效分析这些数据,对待检测机器品质检验保障和测试改善十分重要。在测试日志中将待测试工业产品的测试数据进行提取,存储在待测试数据库中。
步骤S200:获得函数特征信息;
具体的,在测试日志里面查找到函数信息,每个函数信息由于函数代码不同,存在着不同的函数特征信息,不同的函数通过不同的形式和代码进行对应的展现,函数特征信息即与对应的函数信息一一对应,也是识别函数信息的唯一标识信息。
步骤S300:根据所述函数特征信息对所述待测试数据库进行特征遍历对比,获得对比结果,所述对比结果包括多个函数信息,分别为第一函数信息、第二函数信息、直到第N函数信息,N为正整数;
具体的,将函数特征信息作为卷积特征,在待测试数据库中进行特征遍历对比,得到对比结果即在待测试数据库中出现该函数特征信息的测试数据,其中由于每个测试环节对应了不同的函数信息,因而存在不同的函数特征信息,利用各个函数对应的函数特征信息依次在待测试数据库中进行特征对比,得到对应的对比结果,其中包含了多个函数信息,不同的函数特征信息的对比结果为该函数信息对应的待测试数据。根据测试功能节点的多少,存在对应的N个函数信息。
步骤S400:根据所述第一函数信息,获得第一函数路径信息;
具体的,根据函数信息对应了各函数的起始行、终止行、函数内各分支间的层级关系,从起始行到终止行的多个不同执行路径为该函数信息对应的路径信息。
步骤S500:根据所述第一函数信息、所述第一函数路径信息从所述待测试数据库中进行筛选,获得第一测试数据;
进一步的,所述获得第一测试数据之后,包括:步骤S510:根据所述第一测试数据,获得数据路径信息;步骤S520:当其中包括数据路径信息相同的两个或两个以上测试数据时,判断所述数据路径信息相同的测试数据是否具有相同的目标功能,若相同,则选择其中一个测试数据作为筛选数据。
具体的,根据第一函数信息及对应的第一函数路径信息从待测试数据库中进行筛选,得到对应符合第一函数信息和第一函数路径信息的测试数据,如果其中存在相同函数路径信息的测试数据,则判断路径相同的两个测试数据是否具有相同的处理逻辑,判断路径相同的两个测试数据所测试的目标功能是否相同。如果路径相同的两个测试数据具有相同的处理逻辑,即路径相同的两个测试数据所测试的目标功能也相同,则此测试数据无效,并选择两个测试数据中的一个作为最终的测试数据,所有对应路径相同并且处理逻辑相同的测试数据中只选取一个作为最终的测试数据,减少了不必要的测试数据,能够提高测试速度以及缩短测试周期。
步骤S600:依次根据所述第二函数信息、直到第N函数信息,获得第二函数路径信息、直到第N函数路径信息,其中,所述函数信息与所述函数路径信息相映射;
步骤S700:基于各函数信息与函数路径信息从所述待测试数据库中进行筛选,获得第二测试数据、第N测试数据。
具体的,同样的根据第二函数信息确定第二函数的路径信息,按照第二函数信息和第二函数的路径信息从待测试数据库中进行筛选,得到其中对应的测试数据,以此类推,直到完成所有函数信息的筛选工作,根据所有的筛选结果得到最终的筛选数据。从而实现了根据每个测试数据对应的路径对测试数据集合进行筛选,能够在众多测试数据中提取出覆盖待测程序所有路径,具有保证筛选结果的精准性,减少测试数据量,大幅度地提高了测试速度,缩短测试周期的技术效果,从而解决了现有技术中数据筛选过程繁琐,需要借助其他编译工具使用成本高的技术问题。
进一步的,所述方法还包括:
步骤S810:根据所述待测试数据库,获得函数信息,并作为第一分级特征;
步骤S820:根据所述函数信息,获得分支关键词,并作为第二分级特征;
步骤S830:根据所述待测试数据库、所述函数信息,获得路径信息,并作为第三分级特征;
步骤S840:根据所述第一分级特征、所述第二分级特征、所述第三分级特征,构建数据筛选决策树;
步骤S850:获得第一测试数据信息;
步骤S860:将所述第一测试数据信息输入所述数据筛选决策树中,获得第一筛选结果。
具体的,在进行测试数据的筛选中,以函数为单位进行分析,函数包括了函数名称、各函数语句,将其看作一个数结果,根节点为函数信息,程序的分支节点关键词为树节点,叶子节点为一个测试数据的测试结束点,从开始点到结束点为路径信息,通过将不同节点的信息作为分级特征,对待测试数据进行多分层级的筛选,得到最终的结果为筛选的目标测试数据,将符合多层级特征要求的数据进行提取,作为筛选的测试数据,有效保证了筛选数据结果的准确度,同时利用路径作为最终的筛选条件,能够在众多测试数据中提取出覆盖待测程序所有路径,具有保证筛选结果的精准性,减少测试数据量,大幅度地提高了测试速度,缩短测试周期的技术效果,进一步解决了现有技术中数据筛选过程繁琐,需要借助其他编译工具使用成本高的技术问题。
进一步的,所述方法包括:
步骤S910:对所述第一分级特征进行信息论编码运算,获得第一特征信息熵,对所述第二分级特征进行信息论编码运算,获得第二特征信息熵,对所述第三分级特征进行信息论编码运算,获得第三特征信息熵;
步骤S920:将所述第一特征信息熵、所述第二特征信息熵以及所述第三特征信息熵输入数据大小比对模型进行训练,获得第一根节点特征信息;
步骤S930:基于所述第一根节点特征信息和所述待测试数据库,构建所述数据筛选决策树。
具体的,为了具体构建所述数据筛选决策树,可分别对所述第一分级特征、所述第二分级特征以及所述第三分级特征进行信息熵的运算,即通过信息论编码中的香农公式对其进行信息熵数值的具体计算,进而获得对应的所述第一特征信息熵、所述第二特征信息熵以及所述第三特征信息熵,进一步,信息熵表示信息的不确定度,当不确定性越大时,它所包含的信息量也就越大,信息熵也就越高,纯度也就越低,当集合中的所有样本均匀混合时,信息熵最大,纯度最低。因此,应基于所述数据大小比对模型对所述第一特征信息熵、所述第二特征信息熵以及所述第三特征信息熵对其大小数值的比对,继而获得熵值最小的特征,即第一根节点特征信息,通过对熵值最小的特征进行优先分类,继而按照熵值由小到大的顺序,依次对各特征进行分类,最终构建所述数据筛选决策树,使得对测试数据进行准确的分级筛选,进而实现了对数据筛选决策树的具体构建。
进一步的,所述方法包括:
步骤S1010:根据所述第一函数信息,获得函数分支节点;
步骤S1020:根据所述第一函数信息、所述函数分支节点,获得第一标记指令,所述第一标记指令用于在第一函数、函数分支节点处进行标记,当测试数据运行时第一标记会做出记录;
步骤S1030:根据记录获得所述第一函数路径信息。
具体的,多个测试数据之间具有数据分割点,用于对每个测试数据进行分区,本申请通过在主函数和每个函数分支节点处增加标记信息,所述标记信息可以在测试数据运行中做出对应的记录,如记录代码,或者断点等,当待测试数据通过数据分割点和标记处时进行对应的记录,当完成所有的标记后,表明该函数对应的测试数据执行路径已完成,则对应可以获得该函数信息的路径信息,并进行保存。根据每个测试数据对应的路径对待测试数据库中的所有测试数据进行筛选,能够在众多测试数据中提取出覆盖待测程序所有路径,具有保证筛选结果的精准性,减少测试数据量,大幅度地提高了测试速度,缩短测试周期的技术效果,进一步解决现有技术中数据筛选过程繁琐,需要借助其他编译工具使用成本高的技术问题。
进一步的,所述方法包括:
步骤S1040:记录所述第一函数路径信息及对应路径的标记信息,获得测试文件,并将所述测试文件进行输出。
具体的,本申请实施例在各测试数据测试结束时记录其对应的路径及其标记断点信息,并根据生成的路径信息及测试数据对应的路径信息作为输出文件进行输出,进行展示。
进一步的,所述方法包括:
步骤S1110:获得所述数据筛选决策树的分级特征数据集;
步骤S1120:根据所述分级特征数据集,构建分级特征数据库;
步骤S1130:将所述待测试数据库输入所述分级特征数据库,判断所述待测试数据库中是否存在特殊筛选信息;
步骤S1140:根据所述特殊筛选信息、所述待测试数据库输入筛选模型,获得筛选数据信息;
步骤S1150:将所述筛选数据信息输入所述数据筛选决策树,获得第二筛选结果;
步骤S1160:通过对所述第一筛选结果、第二筛选结果进行损失分析,获得第一损失数据;
步骤S1170:将所述第一损失数据带入所述数据筛选决策树进行增量学习,获得第二筛选决策树。
具体的,为了实现数据筛选决策树的包容性,进一步,所述分级特征数据集集合了尽可能多的分类特征数据,其中,包含函数信息、分支关键词以及结束位置等,所述分级特征数据库由所述分级特征数据集构成,可将所述待测试数据库输入所述分级特征数据库,判断所述待测试数据库集中是否存在特殊分级特征数据,所述特殊分级特诊数据集可理解为不包含于所述分级特征数据库的分级特征,如特殊的函数代码信息和格式信息,或者路径,对特殊的分级特征进行筛选等级的分类,继而实现对所述特殊分级特征数据进行增量学习,进一步实现所述数据筛选决策树的包容性的要求。
进一步的,所述根据所述特殊筛选信息、所述待测试数据库输入筛选模型,获得筛选数据信息,包括:
步骤S1141:将所述特殊筛选信息、所述待测试数据库作为输入数据输入所述筛选模型,所述筛选模型为通过多组训练数据训练收敛获得,所述多组训练数据中每组数据均包括所述特殊筛选信息、所述待测试数据库及标识所述筛选数据信息的标识信息;
步骤S1142:获得所述筛选模型的输出结果,所述输出结果包括所述筛选数据信息。
具体的,根据特殊筛选信息从待测试数据库中进行提取时,为了提高处理速度和准确性,可以加入神经网络模型,所述筛选模型即为正在训练的神经网络模型,它是以神经元的数学模型为基础来描述的。简单地讲,它是一个数学模型。进一步来说,所述筛选模型的过程实质为监督学习的过程。所述多组训练数据具体为:所述特殊筛选信息、所述待测试数据库以及用来标识筛选数据信息的标识信息。通过输入所述特殊筛选信息、所述待测试数据库,筛选模型会输出训练结果。通过将所述输出信息与所述起标识作用的筛选数据信息进行校验,如果所述输出信息与所述标识的筛选数据信息要求相一致,则本数据监督学习完成,则进行下一组数据监督学习;如果所述输出信息与所述起标识作用的筛选数据信息要求不一致,则神经网络学习模型自身进行调整,直到神经网络学习模型输出结果与所述起标识作用的筛选数据信息要求相一致,进行下一组数据的监督学习。通过训练数据使神经网络学习模型自身不断地修正、优化,通过监督学习的过程来提高神经网络学习模型处理所述信息的准确性,进而达到使得筛选数据信息更加准确的技术效果。
综上所述,本申请实施例所提供的一种测试数据的筛选方法及系统具有如下技术效果:
1、由于采用了获得函数特征信息;根据所述函数特征信息对所述待测试数据库进行特征遍历对比,获得对比结果,所述对比结果包括多个函数信息,分别为第一函数信息、第二函数信息、直到第N函数信息,N为正整数;根据所述第一函数信息,获得第一函数路径信息;根据所述第一函数信息、所述第一函数路径信息从所述待测试数据库中进行筛选,获得第一测试数据。从而实现了根据每个测试数据对应的路径对测试数据集合进行筛选,能够在众多测试数据中提取出覆盖待测程序所有路径,具有保证筛选结果的精准性,减少测试数据量,大幅度地提高了测试速度,缩短测试周期的技术效果,从而解决了现有技术中数据筛选过程繁琐,需要借助其他编译工具使用成本高的技术问题。
2、由于采用了通过根据所述第一测试数据,获得数据路径信息;当其中包括数据路径信息相同的两个或两个以上测试数据时,判断所述数据路径信息相同的测试数据是否具有相同的目标功能,若相同,则选择其中一个测试数据作为筛选数据。将对应路径相同并且处理逻辑相同的测试数据中只选取一个作为最终的测试数据,达到了减少不必要的测试数据,能够提高测试速度以及缩短测试周期的技术效果。
3、由于采用了通过构建数据筛选决策树对待测试数据库中的测试数据按照分级进行特征筛选,最终利用分级特征进行路径分析,实现了根据每个测试数据对应的路径对测试数据集合进行筛选,能够在众多测试数据中提取出覆盖待测程序所有路径,具有保证筛选结果的精准性,减少测试数据量,大幅度地提高了测试速度,缩短测试周期的技术效果,进一步解决了现有技术中数据筛选过程繁琐,需要借助其他编译工具使用成本高的技术问题。
实施例二
基于与前述实施例中一种测试数据的筛选方法同样发明构思,本发明还提供了一种测试数据的筛选系统,如图2所示,所述系统包括:
第一构建单元11,所述第一构建单元11用于获得待测试数据,构建待测试数据库;
第一获得单元12,所述第一获得单元12用于获得函数特征信息;
第二获得单元13,所述第二获得单元13用于根据所述函数特征信息对所述待测试数据库进行特征遍历对比,获得对比结果,所述对比结果包括多个函数信息,分别为第一函数信息、第二函数信息、直到第N函数信息,N为正整数;
第三获得单元14,所述第三获得单元14用于根据所述第一函数信息,获得第一函数路径信息;
第四获得单元15,所述第四获得单元15用于根据所述第一函数信息、所述第一函数路径信息从所述待测试数据库中进行筛选,获得第一测试数据;
第一执行单元16,所述第一执行单元16用于依次根据所述第二函数信息、直到第N函数信息,获得第二函数路径信息、直到第N函数路径信息,其中,所述函数信息与所述函数路径信息相映射;
第五获得单元17,所述第五获得单元17用于基于各函数信息与函数路径信息从所述待测试数据库中进行筛选,获得第二测试数据、第N测试数据。
进一步的,所述系统还包括:
第六获得单元,所述第六获得单元用于根据所述待测试数据库,获得函数信息,并作为第一分级特征;
第七获得单元,所述第七获得单元用于根据所述函数信息,获得分支关键词,并作为第二分级特征;
第八获得单元,所述第八获得单元用于根据所述待测试数据库、所述函数信息,获得路径信息,并作为第三分级特征;
第二构建单元,所述第二构建单元用于根据所述第一分级特征、所述第二分级特征、所述第三分级特征,构建数据筛选决策树;
第九获得单元,所述第九获得单元用于获得第一测试数据信息;
第十获得单元,所述第十获得单元用于将所述第一测试数据信息输入所述数据筛选决策树中,获得第一筛选结果。
进一步的,所述系统还包括:
第十一获得单元,所述第十一获得单元用于对所述第一分级特征进行信息论编码运算,获得第一特征信息熵,对所述第二分级特征进行信息论编码运算,获得第二特征信息熵,对所述第三分级特征进行信息论编码运算,获得第三特征信息熵;
第十二获得单元,所述第十二获得单元用于将所述第一特征信息熵、所述第二特征信息熵以及所述第三特征信息熵输入数据大小比对模型进行训练,获得第一根节点特征信息;
第三构建单元,所述第三构建单元用于基于所述第一根节点特征信息和所述待测试数据库,构建所述数据筛选决策树。
进一步的,所述系统还包括:
第二执行单元,所述第二执行单元用于根据所述第一测试数据,获得数据路径信息;
第一判断单元,所述第一判断单元用于当其中包括数据路径信息相同的两个或两个以上测试数据时,判断所述数据路径信息相同的测试数据是否具有相同的目标功能,若相同,则选择其中一个测试数据作为筛选数据。
进一步的,所述系统还包括:
第十三获得单元,所述第十三获得单元用于根据所述第一函数信息,获得函数分支节点;
第十四获得单元,所述第十四获得单元用于根据所述第一函数信息、所述函数分支节点,获得第一标记指令,所述第一标记指令用于在第一函数、函数分支节点处进行标记,当测试数据运行时第一标记会做出记录;
第十五获得单元,所述第十五获得单元用于根据记录获得所述第一函数路径信息。
进一步的,所述系统还包括:
第十六获得单元,所述第十六获得单元用于记录所述第一函数路径信息及对应路径的标记信息,获得测试文件,并将所述测试文件进行输出。
进一步的,所述系统还包括:
第十七获得单元,所述第十七获得单元用于获得所述数据筛选决策树的分级特征数据集;
第四构建单元,所述第四构建单元用于根据所述分级特征数据集,构建分级特征数据库;
第二判断单元,所述第二判断单元用于将所述待测试数据库输入所述分级特征数据库,判断所述待测试数据库中是否存在特殊筛选信息;
第十八获得单元,所述第十八获得单元用于根据所述特殊筛选信息、所述待测试数据库输入筛选模型,获得筛选数据信息;
第十九获得单元,所述第十九获得单元用于将所述筛选数据信息输入所述数据筛选决策树,获得第二筛选结果;
第二十获得单元,所述第二十获得单元用于通过对所述第一筛选结果、第二筛选结果进行损失分析,获得第一损失数据;
第二十一获得单元,所述第二十一获得单元用于将所述第一损失数据带入所述数据筛选决策树进行增量学习,获得第二筛选决策树。
前述图1实施例一中的一种测试数据的筛选方法的各种变化方式和具体实例同样适用于本实施例的一种测试数据的筛选系统,通过前述对一种测试数据的筛选方法的详细描述,本领域技术人员可以清楚的知道本实施例中一种测试数据的筛选系统的实施方法,所以为了说明书的简洁,在此不再详述。
示例性电子设备
下面参考图3来描述本申请实施例的电子设备。
图3图示了根据本申请实施例的电子设备的结构示意图。
基于与前述实施例中一种测试数据的筛选方法的发明构思,本发明还提供一种测试数据的筛选系统,其上存储有计算机程序,该程序被处理器执行时实现前文所述一种测试数据的筛选方法的任一方法的步骤。
其中,在图3中,总线架构(用总线300来代表),总线300可以包括任意数量的互联的总线和桥,总线300将包括由处理器302代表的一个或多个处理器和存储器304代表的存储器的各种电路链接在一起。总线300还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口305在总线300和接收器301和发送器303之间提供接口。接收器301和发送器303可以是同一个元件,即收发机,提供用于在传输介质上与各种其他系统通信的单元。
处理器302负责管理总线300和通常的处理,而存储器304可以被用于存储处理器302在执行操作时所使用的数据。
本申请实施例提供了一种测试数据的筛选方法及系统,通过获得待测试数据,构建待测试数据库;获得函数特征信息;根据所述函数特征信息对所述待测试数据库进行特征遍历对比,获得对比结果,所述对比结果包括多个函数信息,分别为第一函数信息、第二函数信息、直到第N函数信息,N为正整数;根据所述第一函数信息,获得第一函数路径信息;根据所述第一函数信息、所述第一函数路径信息从所述待测试数据库中进行筛选,获得第一测试数据;依次根据所述第二函数信息、直到第N函数信息,获得第二函数路径信息、直到第N函数路径信息,其中,所述函数信息与所述函数路径信息相映射;基于各函数信息与函数路径信息从所述待测试数据库中进行筛选,获得第二测试数据、第N测试数据。达到了测试数据筛选过程简单方便,保障测试数据筛选的可靠性,从而提高了测试效率缩短测试周期的技术效果,进而解决了现有技术中数据筛选过程繁琐,需要借助其他编译工具使用成本高的技术问题。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的系统。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令系统的制造品,该指令系统实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (6)

1.一种测试数据的筛选方法,其特征在于,所述方法包括:
获得待测试数据,构建待测试数据库;
获得函数特征信息;
根据所述函数特征信息对所述待测试数据库进行特征遍历对比,获得对比结果,所述对比结果包括多个函数信息,分别为第一函数信息、第二函数信息、直到第N函数信息,N为正整数;
根据所述第一函数信息,获得第一函数路径信息;
根据所述第一函数信息、所述第一函数路径信息从所述待测试数据库中进行筛选,获得第一测试数据;
依次根据所述第二函数信息、直到第N函数信息,获得第二函数路径信息、直到第N函数路径信息,其中,所述函数信息与所述函数路径信息相映射;
基于各函数信息与函数路径信息从所述待测试数据库中进行筛选,获得第二测试数据、第N测试数据;
其中,所述方法还包括:
根据所述待测试数据库,获得函数信息,并作为第一分级特征;
根据所述函数信息,获得分支关键词,并作为第二分级特征;
根据所述待测试数据库、所述函数信息,获得路径信息,并作为第三分级特征;
根据所述第一分级特征、所述第二分级特征、所述第三分级特征,构建数据筛选决策树;
获得第一测试数据信息;
将所述第一测试数据信息输入所述数据筛选决策树中,获得第一筛选结果;
其中,所述方法包括:
对所述第一分级特征进行信息论编码运算,获得第一特征信息熵,对所述第二分级特征进行信息论编码运算,获得第二特征信息熵,对所述第三分级特征进行信息论编码运算,获得第三特征信息熵;
将所述第一特征信息熵、所述第二特征信息熵以及所述第三特征信息熵输入数据大小比对模型进行训练,获得第一根节点特征信息;
基于所述第一根节点特征信息和所述待测试数据库,构建所述数据筛选决策树;
其中,所述方法包括:
获得所述数据筛选决策树的分级特征数据集;
根据所述分级特征数据集,构建分级特征数据库;
将所述待测试数据库输入所述分级特征数据库,判断所述待测试数据库中是否存在特殊筛选信息;
根据所述特殊筛选信息、所述待测试数据库输入筛选模型,获得筛选数据信息;
将所述筛选数据信息输入所述数据筛选决策树,获得第二筛选结果;
通过对所述第一筛选结果、第二筛选结果进行损失分析,获得第一损失数据;
将所述第一损失数据带入所述数据筛选决策树进行增量学习,获得第二筛选决策树。
2.如权利要求1所述的方法,其特征在于,所述获得第一测试数据之后,包括:
根据所述第一测试数据,获得数据路径信息;
当其中包括数据路径信息相同的两个或两个以上测试数据时,判断所述数据路径信息相同的测试数据是否具有相同的目标功能,若相同,则选择其中一个测试数据作为筛选数据。
3.如权利要求1所述的方法,其特征在于,所述方法包括:
根据所述第一函数信息,获得函数分支节点;
根据所述第一函数信息、所述函数分支节点,获得第一标记指令,所述第一标记指令用于在第一函数、函数分支节点处进行标记,当测试数据运行时第一标记会做出记录;
根据记录获得所述第一函数路径信息。
4.如权利要求3所述的方法,其特征在于,所述方法包括:
记录所述第一函数路径信息及对应路径的标记信息,获得测试文件,并将所述测试文件进行输出。
5.一种测试数据的筛选系统,其特征在于,所述系统包括:
第一构建单元,所述第一构建单元用于获得待测试数据,构建待测试数据库;
第一获得单元,所述第一获得单元用于获得函数特征信息;
第二获得单元,所述第二获得单元用于根据所述函数特征信息对所述待测试数据库进行特征遍历对比,获得对比结果,所述对比结果包括多个函数信息,分别为第一函数信息、第二函数信息、直到第N函数信息,N为正整数;
第三获得单元,所述第三获得单元用于根据所述第一函数信息,获得第一函数路径信息;
第四获得单元,所述第四获得单元用于根据所述第一函数信息、所述第一函数路径信息从所述待测试数据库中进行筛选,获得第一测试数据;
第一执行单元,所述第一执行单元用于依次根据所述第二函数信息、直到第N函数信息,获得第二函数路径信息、直到第N函数路径信息,其中,所述函数信息与所述函数路径信息相映射;
第五获得单元,所述第五获得单元用于基于各函数信息与函数路径信息从所述待测试数据库中进行筛选,获得第二测试数据、第N测试数据;
所述系统还包括:
第六获得单元,所述第六获得单元用于根据所述待测试数据库,获得函数信息,并作为第一分级特征;
第七获得单元,所述第七获得单元用于根据所述函数信息,获得分支关键词,并作为第二分级特征;
第八获得单元,所述第八获得单元用于根据所述待测试数据库、所述函数信息,获得路径信息,并作为第三分级特征;
第二构建单元,所述第二构建单元用于根据所述第一分级特征、所述第二分级特征、所述第三分级特征,构建数据筛选决策树;
第九获得单元,所述第九获得单元用于获得第一测试数据信息;
第十获得单元,所述第十获得单元用于将所述第一测试数据信息输入所述数据筛选决策树中,获得第一筛选结果;
所述系统还包括:
第十一获得单元,所述第十一获得单元用于对所述第一分级特征进行信息论编码运算,获得第一特征信息熵,对所述第二分级特征进行信息论编码运算,获得第二特征信息熵,对所述第三分级特征进行信息论编码运算,获得第三特征信息熵;
第十二获得单元,所述第十二获得单元用于将所述第一特征信息熵、所述第二特征信息熵以及所述第三特征信息熵输入数据大小比对模型进行训练,获得第一根节点特征信息;
第三构建单元,所述第三构建单元用于基于所述第一根节点特征信息和所述待测试数据库,构建所述数据筛选决策树;
所述系统还包括:
第十七获得单元,所述第十七获得单元用于获得所述数据筛选决策树的分级特征数据集;
第四构建单元,所述第四构建单元用于根据所述分级特征数据集,构建分级特征数据库;
第二判断单元,所述第二判断单元用于将所述待测试数据库输入所述分级特征数据库,判断所述待测试数据库中是否存在特殊筛选信息;
第十八获得单元,所述第十八获得单元用于根据所述特殊筛选信息、所述待测试数据库输入筛选模型,获得筛选数据信息;
第十九获得单元,所述第十九获得单元用于将所述筛选数据信息输入所述数据筛选决策树,获得第二筛选结果;
第二十获得单元,所述第二十获得单元用于通过对所述第一筛选结果、第二筛选结果进行损失分析,获得第一损失数据;
第二十一获得单元,所述第二十一获得单元用于将所述第一损失数据带入所述数据筛选决策树进行增量学习,获得第二筛选决策树。
6.一种测试数据的筛选系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1-4任一项所述方法的步骤。
CN202110780282.1A 2021-07-09 2021-07-09 一种测试数据的筛选方法及系统 Active CN113505283B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110780282.1A CN113505283B (zh) 2021-07-09 2021-07-09 一种测试数据的筛选方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110780282.1A CN113505283B (zh) 2021-07-09 2021-07-09 一种测试数据的筛选方法及系统

Publications (2)

Publication Number Publication Date
CN113505283A CN113505283A (zh) 2021-10-15
CN113505283B true CN113505283B (zh) 2024-02-27

Family

ID=78012506

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110780282.1A Active CN113505283B (zh) 2021-07-09 2021-07-09 一种测试数据的筛选方法及系统

Country Status (1)

Country Link
CN (1) CN113505283B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115015026B (zh) * 2022-08-04 2022-11-01 南京泰祺瑞新材料科技有限公司 新材料测试数据处理方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102426551A (zh) * 2011-11-04 2012-04-25 百度在线网络技术(北京)有限公司 测试数据筛选方法及装置、测试数据构造方法及装置
CN103218297B (zh) * 2013-05-15 2018-05-04 百度在线网络技术(北京)有限公司 测试数据的筛选方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102426551A (zh) * 2011-11-04 2012-04-25 百度在线网络技术(北京)有限公司 测试数据筛选方法及装置、测试数据构造方法及装置
CN103218297B (zh) * 2013-05-15 2018-05-04 百度在线网络技术(北京)有限公司 测试数据的筛选方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
信息管理中计算机数据库技术的应用研究;张琪;;中国管理信息化;20170215(04);全文 *
沈晴 ; 牟永敏 ; .函数调用路径测试用例自动生成的方法研究.计算机工程与应用.(18),全文. *

Also Published As

Publication number Publication date
CN113505283A (zh) 2021-10-15

Similar Documents

Publication Publication Date Title
US11221832B2 (en) Pruning engine
CN110543421A (zh) 基于测试用例自动生成算法的单元测试自动执行方法
CN110162972B (zh) 一种基于语句联合编码深度神经网络的uaf漏洞检测方法
US11269760B2 (en) Systems and methods for automated testing using artificial intelligence techniques
CN113139712B (zh) 一种基于机器学习的流程日志活动属性残缺规则提取方法
CN115576840B (zh) 基于机器学习的静态程序插桩检测方法及装置
CN108681505B (zh) 一种基于决策树的测试用例排序方法和装置
CN113505283B (zh) 一种测试数据的筛选方法及系统
CN112765031A (zh) 一种群智化漏洞挖掘任务的分解方法
CN111259212B (zh) 一种遥测数据判读方法、装置、设备及存储介质
CN105224455B (zh) 一种自动生成字符串类型测试用例的方法
CN109144848B (zh) 一种Verilog HDL代码白盒测试辅助平台及其工作过程
CN112527573B (zh) 一种接口测试方法、装置及存储介质
CN110399284A (zh) 一种测试用例编写与执行方法及装置
CN111385273B (zh) 一种物联网业务流程识别方法、装置、电子设备及介质
CN113377962B (zh) 一种基于图像识别和自然语言处理的智能过程模拟方法
CN115941726A (zh) 一种工业设备监控方法、系统、电子设备及存储介质
CN114356903A (zh) 一种自适应数据结构的列相关关系发现装置及方法
CN110309047B (zh) 一种测试点生成方法、装置及系统
CN113505069A (zh) 一种测试数据分析方法及系统
CN113918474B (zh) 一种基于数据模式的测试用例管理方法及设备
CN114185548A (zh) 基于人工智能的代码评审方法、装置、存储介质及服务器
CN115309576A (zh) 一种地面测控装备的知识规则故障诊断方法及系统
CN114661598A (zh) 测试数据生成方法及装置
CN118228277A (zh) 一种基于风险评估的代码发布策略优化方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant