CN118012756A - 一种大数据处理平台的数据测试方法及装置 - Google Patents
一种大数据处理平台的数据测试方法及装置 Download PDFInfo
- Publication number
- CN118012756A CN118012756A CN202410154731.5A CN202410154731A CN118012756A CN 118012756 A CN118012756 A CN 118012756A CN 202410154731 A CN202410154731 A CN 202410154731A CN 118012756 A CN118012756 A CN 118012756A
- Authority
- CN
- China
- Prior art keywords
- data
- processing program
- test
- program
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012360 testing method Methods 0.000 title claims abstract description 196
- 238000012545 processing Methods 0.000 title claims abstract description 89
- 238000004458 analytical method Methods 0.000 claims abstract description 63
- 238000000034 method Methods 0.000 claims abstract description 58
- 238000012795 verification Methods 0.000 claims abstract description 27
- 238000004590 computer program Methods 0.000 claims description 17
- 238000010586 diagram Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000013100 final test Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Landscapes
- Test And Diagnosis Of Digital Computers (AREA)
Abstract
本申请涉及大数据测试技术领域,提供了一种大数据处理平台的数据测试方法及装置。该方法包括:基于大数据处理平台的架构,确定架构中各数据层以及相邻的每两个数据层之间的处理程序;确定每个处理程序中的一个或多个关键节点,在每个关键节点插入中间接口,中间接口用于在处理程序对前一个数据层的数据进行处理并存入下一个数据层的过程中,输出关键节点的中间数据;基于测试数据对每个处理程序进行测试,得到各关键节点输出的中间数据和处理程序输出的测试结果数据;对每个处理程序的所有中间数据和测试结果数据进行校验分析,以确认处理程序是否存在故障并对故障定位。本申请能够高效全面地实现对大数据处理平台的数据测试,测试难度降低。
Description
技术领域
本申请涉及大数据测试技术领域,尤其涉及一种大数据处理平台的数据测试方法及装置。
背景技术
数据测试,指指数据质量的测试,主要关注数据的完整性、准确性、一致性、及时性、可用性这五个维度。如果是业务系统中的数据测试,数据量不是非常大的情况下,测试人员是可以通过一些常用的测试手段从五个维度来验证数据。但随着企业数据量的发展,数据量越来越大,再加上大数据加工的技术也一直在进步,数据处理的框架越发复杂,场景更加多样,数据处理链路越来越长。
基于以上变化,大数据加工过程中的数据测试难度大幅提升,对测试人员的技术能力提出了更高的要求,常规的数据测试方法,难以全面完整对整个数据处理链路实现测试。
因此,如何提供一种解决上述技术问题的方案是目前本领域技术人员需要解决的问题。
发明内容
有鉴于此,本申请实施例提供了一种大数据处理平台的数据测试方法及装置,以解决现有技术中数据测试难度较高、无法完整高效测试数据处理链路的问题。
本申请实施例的第一方面,提供了一种大数据处理平台的数据测试方法,包括:
基于大数据处理平台的架构,确定架构中各数据层以及相邻的每两个数据层之间的处理程序;
确定每个处理程序中的一个或多个关键节点,在每个关键节点插入中间接口,中间接口用于在处理程序对前一个数据层的数据进行处理并存入下一个数据层的过程中,输出关键节点的中间数据;
基于测试数据对每个处理程序进行测试,得到各关键节点输出的中间数据和处理程序输出的测试结果数据;
对每个处理程序的所有中间数据和测试结果数据进行校验分析,以确认处理程序是否存在故障并对故障定位。
本申请实施例的第二方面,提供了一种大数据处理平台的数据测试装置,包括:
程序确定模块,用于基于大数据处理平台的架构,确定架构中各数据层以及相邻的每两个数据层之间的处理程序;
节点确定模块,用于确定每个处理程序中的一个或多个关键节点,在每个关键节点插入中间接口,中间接口用于在处理程序对前一个数据层的数据进行处理并存入下一个数据层的过程中,输出关键节点的中间数据;
测试模块,用于基于测试数据对每个处理程序进行测试,得到各关键节点输出的中间数据和处理程序输出的测试结果数据;
分析模块,用于对每个处理程序的所有中间数据和测试结果数据进行校验分析,以确认处理程序是否存在故障并对故障定位。
本申请实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述方法的步骤。
本申请实施例的第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
本申请实施例与现有技术相比存在的有益效果至少包括:本申请实施例通过将大数据处理平台的数据处理过程以数据层为依据分为多个处理程序、在每个处理程序中设置关键节点、输出该关键节点的中间数据的中间接口,从而在对处理程序进行测试时可以得到过程中的中间数据和最终的测试结果数据,进而分别对中间数据和测试结果数据进行校验分析和故障定位,该过程能够高效全面地实现对大数据处理平台的数据测试,降低了数据测试的难度,对技术人员的能力门槛较低,测试效率提高。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本申请实施例的一种应用场景的场景示意图;
图2是本申请实施例提供的一种大数据处理平台的数据测试方法的流程示意图;
图3是本申请实施例提供的一种大数据处理平台的架构示意图;
图4是本申请实施例提供的一种处理程序的逻辑结构图;
图5是本申请实施例提供的一种大数据处理平台的数据测试装置的结构示意图;
图6是本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
下面将结合附图详细说明根据本申请实施例的一种大数据处理平台的数据测试方法及装置。
图1是本申请实施例的应用场景的场景示意图。该应用场景可以包括第一终端设备101、第二终端设备102、第三终端设备103、服务器104以及网络105。
第一终端设备101、第二终端设备102、第三终端设备103可以是硬件,也可以是软件。当第一终端设备101、第二终端设备102、第三终端设备103为硬件时,其可以是具有显示屏且支持与服务器104通信的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等;当第一终端设备101、第二终端设备102、第三终端设备103为软件时,其可以安装在如上的电子设备中。第一终端设备101、第二终端设备102、第三终端设备103可以实现为多个软件或软件模块,也可以实现为单个软件或软件模块,本申请实施例对此不作限制。进一步地,第一终端设备101、第二终端设备102、第三终端设备103上可以安装有各种应用,例如数据处理应用、即时通信工具、社交平台软件、搜索类应用、购物类应用等。
服务器104可以是提供各种服务的服务器,例如,对与其建立通信连接的终端设备发送的请求进行接收的后台服务器,该后台服务器可以对终端设备发送的请求进行接收和分析等处理,并生成处理结果。服务器104可以是一台服务器,也可以是由若干台服务器组成的服务器集群,或者还可以是一个云计算服务中心,本申请实施例对此不作限制。
需要说明的是,服务器104可以是硬件,也可以是软件。当服务器104为硬件时,其可以是为第一终端设备101、第二终端设备102和第三终端设备103提供各种服务的各种电子设备。当服务器104为软件时,其可以是为第一终端设备101、第二终端设备102和第三终端设备103提供各种服务的多个软件或软件模块,也可以是为第一终端设备101、第二终端设备102和第三终端设备103提供各种服务的单个软件或软件模块,本申请实施例对此不作限制。
网络105可以是采用同轴电缆、双绞线和光纤连接的有线网络,也可以是无需布线就能实现各种通信设备互联的无线网络,例如,蓝牙(Bluetooth)、近场通信(Near FieldCommunication,NFC)、红外(Infrared)等,本申请实施例对此不作限制。
需要说明的是,第一终端设备101、第二终端设备102、第三终端设备103、服务器104以及网络105的具体类型、数量和组合可以根据应用场景的实际需求进行调整,本申请实施例对此不作限制。
需要说明的是,第一终端设备101、第二终端设备102、第三终端设备103、服务器104以及网络105的具体类型、数量和组合可以根据应用场景的实际需求进行调整,本申请实施例对此不作限制。
图2是本申请实施例提供的一种大数据处理平台的数据测试方法的流程示意图。图2的数据测试方法可以由图1的第一终端设备或第二终端设备或第三终端设备执行。如图2所示,该数据测试方法包括:
S201:基于大数据处理平台的架构,确定架构中各数据层以及相邻的每两个数据层之间的处理程序;
S202:确定每个处理程序中的一个或多个关键节点,在每个关键节点插入中间接口,中间接口用于在处理程序对前一个数据层的数据进行处理并存入下一个数据层的过程中,输出关键节点的中间数据;
S203:基于测试数据对每个处理程序进行测试,得到各关键节点输出的中间数据和处理程序输出的测试结果数据;
S204:对每个处理程序的所有中间数据和测试结果数据进行校验分析,以确认处理程序是否存在故障并对故障定位。
可以理解的是,大数据,指创造或收集的结构化、半结构化、或者非结构化的海量数据的集合,具有大体量、多样化、高价值、时效性几个特征。大数据处理平台则是对大数据进行加工处理、使这些多样化的数据产生最大化的价值的平台,大数据处理平台对大数据进行加工处理的过程也就是数据处理链路,依次可包括数据采集、数据存储、数据清洗或转换、数据建模、数据计算、数据展示,基于数据处理链路,对特定处理阶段,设有数据处理后的数据存放点,也即大数据处理平台的多个数据层,因此大数据处理平台包括多个数据层,相邻的两个数据层之间设有处理程序,处理程序用于在上一数据层的数据向下一数据层流动的过程中对数据进行处理,所有的处理程序构成数据处理链路,大数据处理平台的架构包括数据处理链路和所有的数据层,通过数据层的位置,可以在数据处理链路中确定具体的处理程序,该处理程序也即数据处理链路中属于两个数据层之间的数据处理程序。
以图3中的大数据处理平台为例,其中按照数据处理链路的方向,大数据处处理平台的架构中数据层依次包括源数据层、明细数据层、数据汇总层、数据应用层,其中,源数据层和业务数据保持一致,保留最近七天的数据;明细数据层,用于存储经过了清洗转化的明细模型数据;数据汇总层,根据业务主题、颗粒度不同对数据进行汇总,形成宽表;数据应用层,为数据产品提供结果数据。图3仅为示例,大数据处理平台中数据层的名称、个数、用途、顺序和数据处理链路的具体细节均可根据实际情况进行调整,此处不作限制。
可以理解的是,在步骤S201确定多个数据层和多个处理程序后,对每个处理程序,确定其中的关键节点并插入中间接口,中间接口用于输出中间数据。中间数据是处理程序在对测试数据进行处理的过程中经过关键节点时生成的数据,该数据可以反映出该关键节点之前的程序是否正常,具体可通过临时表、临时文件、运行日志的形式实现。
进一步的,在完成步骤S201-S202对处理程序的预先设置后,步骤S203可利用测试数据对完成预先设置的处理程序进行测试,获取中间数据和测试结果数据,步骤S204可进行测试数据的校验分析。
可以理解的是,由于实际情况中数据存在更新时间的差异,为避免更新时间对测试过程造成干扰,此处将所有的测试数据的更新时间规定为同一时刻,也即:基于测试数据对每个处理程序进行测试之前,还包括:
将测试数据中的所有更新时间设置为同一预设时间。
可以理解的是,此处用于测试每个处理程序的测试数据包括满足预设数值规范要求的正测试数据和不满足预设数值规范要求的负测试数据,根据测试需求,可选择仅使用正测试数据、或仅使用负测试数据、或既使用正测试数据又使用负测试数据,具体根据不同处理程序的测试需求进行选择,此处不做限制,即基于测试数据对每个处理程序进行测试包括:
基于满足预设数值规范要求的正测试数据对一个或多个处理程序进行测试;
或,基于不满足预设数值规范要求的负测试数据对一个或多个处理程序进行测试。
此处,预设数值规范要求包括对数值逻辑的要求、数值范围的要求等等,具体根据实际的处理程序进行确定。
进一步的,测试数据是否满足预设数值规范要求,决定了对应的测试结果的具体内容和分析方法,测试结果的具体内容由测试数据和处理程序共同决定,测试结果的实际内容由实际的测试数据和实际的处理程序共同决定,测试结果的期望内容由实际的测试数据和处理程序期望的运行逻辑决定,分析方法的目的在于对测试结果的实际内容和期望内容进行比对,判断实际内容是否与期望内容一致。其中处理程序对正测试数据的运行逻辑通常为常规处理过程,处理程序对负测试数据的运行逻辑通常为报错。
因此,对每个处理程序的所有中间数据和测试结果数据进行校验分析,以确认处理程序是否存在故障并对故障定位的过程,包括:
当测试数据为正测试数据,对对应的处理程序的所有中间数据和测试结果数据进行程序逻辑校验分析,以确认处理程序是否存在故障并对故障定位;
程序逻辑校验分析包括分析中间数据和测试结果数据是否符合处理程序的运行逻辑。
类似的,对每个处理程序的所有中间数据和测试结果数据进行校验分析,以确认处理程序是否存在故障并对故障定位的过程,包括:
当测试数据为负测试数据,对对应的处理程序的所有中间数据和测试结果数据进行报错校验分析,以确认处理程序是否存在故障并对故障定位;
报错校验分析,包括脚本是否报错的分析、是否与负测试数据对应的分析、是否符合对应的预设数值规范要求的分析中的一种或多种。
进一步的,在获取到多个中间数据和最终的测试结果数据后进行校验分析,校验分析的对象为中间处理数据或测试结果数据,校验分析的参照依据为该对象前的测试数据或中间处理数据,具体的,对象为生成顺序中第一个出现的中间数据,则参照依据为测试数据,其余对象的参照依据为该对象前的中间数据。
进一步的,校验分析的顺序可以按照中间数据和测试结果数据在处理程序中的生成顺序,逐一对中间数据和测试结果数据进行校验分析,也可以按照生成顺序的反向顺序进行校验分析,反向顺序的分析可提高分析效率,节省对无故障部分的处理程序的校验流程,例如如果测试结果数据校验无误,则整个处理程序不存在故障,如果某一个中间数据校验无误,则该中间数据所对应的关键节点前的程序部分不存在故障。可以理解的是,设置关键节点实现了更细粒度的故障分析和定位,反向顺序的校验分析能够进一步提高校验分析的效率。因此,对每个处理程序的所有中间数据和测试结果数据进行校验分析,以确认处理程序是否存在故障并对故障定位的过程,包括:
按照所有中间数据和测试结果数据的生成顺序的反向顺序,依次基于参考数据判断待测数据是否存在故障,若是,确定故障位于处理程序中参考数据和待测数据之间的程序中;
其中,待测数据为测试结果数据或中间数据,参考数据为生成顺序中位于待测数据前的中间数据或测试数据。
类似的,对于完整的数据处理链路,也可按照数据处理链路的反向顺序对数据进行校验分析,从而提高校验效率。
可以理解的是,上文在处理程序的程序入口处输入测试数据,从而完成完整的对处理程序的测试,除此外,还可通过对中间数据进行修改并重新输入关键节点,实现对处理程序中关键节点后的程序的测试,具体的,本实施例方法还包括:对任一处理程序执行以下操作:
利用节点测试数据更改任一关键节点的中间数据,以基于节点测试数据对处理程序中关键节点后的程序进行测试,得到处理程序输出的更新测试结果数据和关键节点后的程序中各关键节点所对应的更新中间数据;
对所有更新中间数据和更新测试结果数据进行校验分析,以确认关键节点后的程序是否存在故障并对故障定位。
具体的,以数据汇总层到数据应用层的处理程序为例,该部分处理程序可分为三步,第一步对数据汇总层的表也即测试数据进行过滤,第二步执行关联逻辑,第三步执行汇总计算及映射,基于这三步确定关键节点和中间数据,其中第一个关键节点设于第一步过滤结束后,对应设置的中间接口输出的中间数据为过滤后数据,第二个关键点设于第二步执行关联逻辑结束后,对应设置的中间接口输出的中间数据为关联逻辑后数据,第三步结束后输出测试结果数据,具体逻辑如图4所示。
当测试数据为正测试数据,分别对中间数据和测试结果数据进行逻辑校验分析:
对于第一个关键节点的过滤后数据,逻辑校验分析包括数据是否有唯一性,唯一主键是如何构成的;
对于第二个关键节点的关联逻辑后数据,逻辑校验分析包括主键非空校验、关联后的数据量的验证、判断左右关联是否正确、左右关联是否出现数据膨胀的情况、对计算和映射的字段的填充率的校验等。因此,关联后逻辑数据的着重测试点至少包括以下几部分:关联字段的正确性;关联后表的数据膨胀,是否产生没有关联上的,是否产生笛卡尔积数据膨胀;关联后表核心字段(下一步会用的)的填充率;关联后表核心字段(下一步会用的)的最小值min、最大值max等极限值的关注;数据的唯一性,是单主键还是联合主键,用来确定数据如何保证唯一性。
对于最后输出的测试结果数据,即第三步汇总计算及映射执行后输出的数据,分析测试结果数据的映射规则和汇总计算逻辑是否正确。
相应的,当测试数据为负测试数据,分别对中间数据和测试结果数据进行报错校验分析,此处负测试数据中包括特殊数据或异常数据,通常在正测试数据的基础上对数据进行更改得到负测试数据,然后基于负测试数据对处理程序进行测试,报错校验分析包括脚本是否报错的分析、是否与负测试数据对应的分析、是否符合对应的预设数值规范要求的分析中的一种或多种,也即验证脚本是否报错,特殊数据是否在结果表中,是否有符合业务规则的数据产出。
可以理解的是,本实施例的方法可以通过具体的代码实现脚本工程化,具体结构和语言可根据大数据处理平台的运行程序相应选择,具体实施过程此处不再赘述。
本申请实施例的方法通过将大数据处理平台的数据处理过程以数据层为依据分为多个处理程序、在每个处理程序中设置关键节点、输出该关键节点的中间数据的中间接口,从而在对处理程序进行测试时可以得到过程中的中间数据和最终的测试结果数据,进而分别对中间数据和测试结果数据进行校验分析和故障定位,该过程能够高效全面地实现对大数据处理平台的数据测试,降低了数据测试的难度,对技术人员的能力门槛较低,测试效率提高。
上述所有可选技术方案,可以采用任意结合形成本申请的可选实施例,在此不再一一赘述。应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
图5是本申请实施例提供的一种大数据处理平台的数据测试装置的示意图。如图5所示,该数据测试装置包括:
程序确定模块501,用于基于大数据处理平台的架构,确定架构中各数据层以及相邻的每两个数据层之间的处理程序;
节点确定模块502,用于确定每个处理程序中的一个或多个关键节点,在每个关键节点插入中间接口,中间接口用于在处理程序对前一个数据层的数据进行处理并存入下一个数据层的过程中,输出关键节点的中间数据;
测试模块503,用于基于测试数据对每个处理程序进行测试,得到各关键节点输出的中间数据和处理程序输出的测试结果数据;
分析模块504,用于对每个处理程序的所有中间数据和测试结果数据进行校验分析,以确认处理程序是否存在故障并对故障定位。
本申请实施例的装置通过将大数据处理平台的数据处理过程以数据层为依据分为多个处理程序、在每个处理程序中设置关键节点、输出该关键节点的中间数据的中间接口,从而在对处理程序进行测试时可以得到过程中的中间数据和最终的测试结果数据,进而分别对中间数据和测试结果数据进行校验分析和故障定位,该过程能够高效全面地实现对大数据处理平台的数据测试,降低了数据测试的难度,对技术人员的能力门槛较低,测试效率提高。
在一示例性的实施例中,对每个处理程序的所有中间数据和测试结果数据进行校验分析,以确认处理程序是否存在故障并对故障定位的过程,包括:
按照所有中间数据和测试结果数据的生成顺序的反向顺序,依次基于参考数据判断待测数据是否存在故障,若是,确定故障位于处理程序中参考数据和待测数据之间的程序中;
其中,待测数据为测试结果数据或中间数据,参考数据为生成顺序中位于待测数据前的中间数据。
在一示例性的实施例中,基于测试数据对每个处理程序进行测试包括:
基于满足预设数值规范要求的正测试数据对一个或多个处理程序进行测试;
或,基于不满足预设数值规范要求的负测试数据对一个或多个处理程序进行测试。
在一示例性的实施例中,对每个处理程序的所有中间数据和测试结果数据进行校验分析,以确认处理程序是否存在故障并对故障定位的过程,包括:
当测试数据为正测试数据,对对应的处理程序的所有中间数据和测试结果数据进行程序逻辑校验分析,以确认处理程序是否存在故障并对故障定位;
程序逻辑校验分析包括分析中间数据和测试结果数据是否符合处理程序的运行逻辑。
在一示例性的实施例中,对每个处理程序的所有中间数据和测试结果数据进行校验分析,以确认处理程序是否存在故障并对故障定位的过程,包括:
当测试数据为负测试数据,对对应的处理程序的所有中间数据和测试结果数据进行报错校验分析,以确认处理程序是否存在故障并对故障定位;
报错校验分析,包括脚本是否报错的分析、是否与负测试数据对应的分析、是否符合对应的预设数值规范要求的分析中的一种或多种。
在一示例性的实施例中,测试模块503基于测试数据对每个处理程序进行测试之前,还用于:
将测试数据中的所有更新时间设置为同一预设时间。
在一示例性的实施例中,测试模块503还用于:对任一处理程序执行以下操作:
利用节点测试数据更改任一关键节点的中间数据,以基于节点测试数据对处理程序中关键节点后的程序进行测试,得到处理程序输出的更新测试结果数据和关键节点后的程序中各关键节点所对应的更新中间数据;
分析模块504还用于:对所有更新中间数据和更新测试结果数据进行校验分析,以确认关键节点后的程序是否存在故障并对故障定位。
图6是本申请实施例提供的电子设备6的示意图。如图6所示,该实施例的电子设备6包括:处理器601、存储器602以及存储在该存储器602中并且可在处理器601上运行的计算机程序603。处理器601执行计算机程序603时实现上述各个方法实施例中的步骤。或者,处理器601执行计算机程序603时实现上述各装置实施例中各模块/单元的功能。
电子设备6可以是桌上型计算机、笔记本、掌上电脑及云端服务器等电子设备。电子设备6可以包括但不仅限于处理器601和存储器602。本领域技术人员可以理解,图6仅仅是电子设备6的示例,并不构成对电子设备6的限定,可以包括比图示更多或更少的部件,或者不同的部件。
处理器601可以是中央处理单元(Central Processing Unit,CPU),也可以是其它通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
存储器602可以是电子设备6的内部存储单元,例如,电子设备6的硬盘或内存。存储器602也可以是电子设备6的外部存储设备,例如,电子设备6上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。存储器602还可以既包括电子设备6的内部存储单元也包括外部存储设备。存储器602用于存储计算机程序以及电子设备所需的其它程序和数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可以存储在计算机可读存储介质中,该计算机程序在被处理器执行时,可以实现上述各个方法实施例的步骤。计算机程序可以包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读存储介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如,在某些司法管辖区,根据立法和专利实践,计算机可读存储介质不包括电载波信号和电信信号。
以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (10)
1.一种大数据处理平台的数据测试方法,其特征在于,包括:
基于大数据处理平台的架构,确定所述架构中各数据层以及相邻的每两个数据层之间的处理程序;
确定每个所述处理程序中的一个或多个关键节点,在每个所述关键节点插入中间接口,所述中间接口用于在所述处理程序对前一个数据层的数据进行处理并存入下一个所述数据层的过程中,输出所述关键节点的中间数据;
基于测试数据对每个所述处理程序进行测试,得到各所述关键节点输出的所述中间数据和所述处理程序输出的测试结果数据;
对每个所述处理程序的所有所述中间数据和所述测试结果数据进行校验分析,以确认所述处理程序是否存在故障并对所述故障定位。
2.根据权利要求1所述的方法,其特征在于,对每个所述处理程序的所有所述中间数据和所述测试结果数据进行校验分析,以确认所述处理程序是否存在故障并对所述故障定位的过程,包括:
按照所有所述中间数据和所述测试结果数据的生成顺序的反向顺序,依次基于参考数据判断待测数据是否存在故障,若是,确定所述故障位于所述处理程序中所述参考数据和所述待测数据之间的程序中;
其中,所述待测数据为所述测试结果数据或所述中间数据,所述参考数据为所述生成顺序中位于所述待测数据前的所述中间数据或所述测试数据。
3.根据权利要求1所述的方法,其特征在于,基于测试数据对每个所述处理程序进行测试包括:
基于满足预设数值规范要求的正测试数据对一个或多个所述处理程序进行测试;
或,基于不满足所述预设数值规范要求的负测试数据对一个或多个所述处理程序进行测试。
4.根据权利要求3所述的方法,其特征在于,对每个所述处理程序的所有所述中间数据和所述测试结果数据进行校验分析,以确认所述处理程序是否存在故障并对所述故障定位的过程,包括:
当所述测试数据为所述正测试数据,对对应的所述处理程序的所有所述中间数据和所述测试结果数据进行程序逻辑校验分析,以确认所述处理程序是否存在故障并对所述故障定位;
所述程序逻辑校验分析包括分析所述中间数据和所述测试结果数据是否符合所述处理程序的运行逻辑。
5.根据权利要求3所述的方法,其特征在于,对每个所述处理程序的所有所述中间数据和所述测试结果数据进行校验分析,以确认所述处理程序是否存在故障并对所述故障定位的过程,包括:
当所述测试数据为所述负测试数据,对对应的所述处理程序的所有所述中间数据和所述测试结果数据进行报错校验分析,以确认所述处理程序是否存在故障并对所述故障定位;
所述报错校验分析,包括脚本是否报错的分析、是否与所述负测试数据对应的分析、是否符合对应的所述预设数值规范要求的分析中的一种或多种。
6.根据权利要求1所述的方法,其特征在于,基于测试数据对每个所述处理程序进行测试之前,还包括:
将所述测试数据中的所有更新时间设置为同一预设时间。
7.根据权利要求1至6中任一项所述的方法,其特征在于,还包括:对任一所述处理程序执行以下操作:
利用节点测试数据更改任一所述关键节点的所述中间数据,以基于所述节点测试数据对所述处理程序中所述关键节点后的程序进行测试,得到所述处理程序输出的更新测试结果数据和所述关键节点后的程序中各所述关键节点所对应的更新中间数据;
对所有所述更新中间数据和所述更新测试结果数据进行校验分析,以确认所述关键节点后的程序是否存在故障并对所述故障定位。
8.一种大数据处理平台的数据测试装置,其特征在于,包括:
程序确定模块,用于基于大数据处理平台的架构,确定所述架构中各数据层以及相邻的每两个数据层之间的处理程序;
节点确定模块,用于确定每个所述处理程序中的一个或多个关键节点,在每个所述关键节点插入中间接口,所述中间接口用于在所述处理程序对前一个数据层的数据进行处理并存入下一个所述数据层的过程中,输出所述关键节点的中间数据;
测试模块,用于基于测试数据对每个所述处理程序进行测试,得到各所述关键节点输出的所述中间数据和所述处理程序输出的测试结果数据;
分析模块,用于对每个所述处理程序的所有所述中间数据和所述测试结果数据进行校验分析,以确认所述处理程序是否存在故障并对所述故障定位。
9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并且可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410154731.5A CN118012756A (zh) | 2024-02-02 | 2024-02-02 | 一种大数据处理平台的数据测试方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410154731.5A CN118012756A (zh) | 2024-02-02 | 2024-02-02 | 一种大数据处理平台的数据测试方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118012756A true CN118012756A (zh) | 2024-05-10 |
Family
ID=90953655
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410154731.5A Pending CN118012756A (zh) | 2024-02-02 | 2024-02-02 | 一种大数据处理平台的数据测试方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118012756A (zh) |
-
2024
- 2024-02-02 CN CN202410154731.5A patent/CN118012756A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108415832B (zh) | 接口自动化测试方法、装置、设备及存储介质 | |
CN108628748B (zh) | 自动化测试管理方法和自动化测试管理系统 | |
CN111881022A (zh) | 基于测试场景生成测试用例的方法、装置和设备 | |
CN112052172B (zh) | 第三方通道的快速测试方法、装置和电子设备 | |
CN105786695A (zh) | 数据测试方法及系统 | |
CN109522228A (zh) | 接口自动化测试数据构造方法、装置、平台及存储介质 | |
CN112579446A (zh) | 一种接口测试方法、装置、电子设备和存储介质 | |
CN112035344A (zh) | 多场景测试方法、装置、设备和计算机可读存储介质 | |
CN112506771A (zh) | 一种报文比对方法和装置 | |
CN111221727A (zh) | 测试方法、装置、电子设备和计算机可读介质 | |
CN112561690B (zh) | 信用卡分期业务接口的测试方法、系统、设备及存储介质 | |
CN111427582B (zh) | Rtl代码的管理方法、装置、设备及计算机可读存储介质 | |
CN110795331A (zh) | 软件测试的方法和装置 | |
CN118012756A (zh) | 一种大数据处理平台的数据测试方法及装置 | |
CN114003497A (zh) | 业务系统的测试方法、装置、设备及存储介质 | |
CN114428815A (zh) | 数据存储方法、装置、电子设备和计算机可读介质 | |
CN112380118A (zh) | 单元测试方法、装置、介质及电子设备 | |
CN113495831B (zh) | 基于关键字生成测试用例的方法、系统、设备及介质 | |
CN110716855B (zh) | 处理器指令集测试方法及装置 | |
CN113778845A (zh) | 一种系统测试方法和装置 | |
CN112650679B (zh) | 一种测试校验方法、装置及计算机系统 | |
CN116010349B (zh) | 基于元数据的数据检核方法和装置、电子设备和存储介质 | |
CN112579439A (zh) | 一种基于显示控制系统的形式化验证方法 | |
CN116828522A (zh) | 一种测试方法、装置、电子设备及计算机可读存储介质 | |
CN117667693A (zh) | 一种自动化报文测试方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination |