CN118152243A - 数据校验方法、装置、计算机设备、存储介质和程序产品 - Google Patents

数据校验方法、装置、计算机设备、存储介质和程序产品 Download PDF

Info

Publication number
CN118152243A
CN118152243A CN202410369054.9A CN202410369054A CN118152243A CN 118152243 A CN118152243 A CN 118152243A CN 202410369054 A CN202410369054 A CN 202410369054A CN 118152243 A CN118152243 A CN 118152243A
Authority
CN
China
Prior art keywords
data
verified
item
verification
checked
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410369054.9A
Other languages
English (en)
Inventor
黄文英
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
CCB Finetech Co Ltd
Original Assignee
China Construction Bank Corp
CCB Finetech Co Ltd
Filing date
Publication date
Application filed by China Construction Bank Corp, CCB Finetech Co Ltd filed Critical China Construction Bank Corp
Publication of CN118152243A publication Critical patent/CN118152243A/zh
Pending legal-status Critical Current

Links

Abstract

本公开涉及大数据处理技术领域,具体公开一种数据校验方法、装置、计算机设备、存储介质和程序产品。方法包括:获取待校验数据,待校验数据为待校验程序在预设时间段内的运行数据;根据待校验数据生成对应的分布趋势;根据分布趋势确定待校验数据中的异常数据;基于异常数据,获取异常数据对应的待校验项;获取预设的标准校验项;根据待校验项和标准校验生成待校验数据的校验结果,并输出。采用本方法能够提升问题确定的效率和准确性。

Description

数据校验方法、装置、计算机设备、存储介质和程序产品
技术领域
本申请涉及大数据处理技术领域,特别是涉及一种数据校验方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
随着计算机技术的发展,越来越多的企业利用计算机技术形成企业信息系统,利用企业信息系统实现数据的采集、加工等操作。
相关技术中,在利用计算机形成企业信息系统时,可以利用预先获取业务口径数据,以业务口径为基础生成业务信息系统,然而针对形成后的业务信息系统缺乏系统性的校验步骤,当存在问题时,无法快速准确的查找问题点所在。
发明内容
基于此,有必要针对上述技术问题,提供一种能够实现快速准确查找系统问题的数据校验方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种数据校验方法,包括:
获取待校验数据,待校验数据为待校验程序在预设时间段内的运行数据;
根据待校验数据生成对应的分布趋势;
根据分布趋势确定待校验数据中的异常数据;
基于异常数据,获取异常数据对应的待校验项;
获取预设的标准校验项;
根据待校验项和标准校验生成待校验数据的校验结果,并输出。
在一个实施例中,根据分布趋势确定待校验数据中的异常数据,包括:判断分布趋势是否连续;当分布趋势不连续时,获取以不连续处为基础、划分分布趋势得到的第一子分布趋势和第二子分布趋势;根据第一子分布趋势和第二子分布趋势确定不连续处是否异常。
在其中一个实施例中,根据第一子分布趋势和第二子分布趋势确定不连续处是否异常,包括:根据第一子分布趋势预测不连续处的第一预测数据;根据第二子分布趋势预测不连续处的第二预测数据;当第一预测数据和第二预测数据均为空时,则生成不连续处正常的判断结果;当第一预测数据或第二预测数据不为空时,则生成不连续处异常的判断结果。
在一个实施例中,根据分布趋势确定待校验数据中的异常数据,包括:获取参考数据,并根据参考数据生成对应的分布趋势;比较参考数据对应的分布趋势和待校验数据对应的分布趋势;根据参考数据对应的分布趋势与待校验数据对应的分布趋势之间的对比结果,确定待校验数据中的异常数据。
在一个实施例中,待校验项为多个,标准校验项为多个;根据待校验项和标准校验生成待校验数据的校验结果,包括:获取任一待校验项;基于待校验项获取对应的待校验项的作用标识;根据作用标识获取与任一待校验项对应的标准校验项;当任一待校验项与对应的标准校验项不匹配时,根据任一待校验项与对应的标准校验项生成校验结果;当任一待校验项与对应的标准校验项相匹配时,从剩余的待校验项中获取任一待校验项,继续执行基于待校验项获取对应的待校验项的作用标识的步骤,直至多个待校验项与多个标准校验项的匹配完成。
在其中一个实施例中,在多个待校验项与多个标准校验项的匹配完成之后,方法还包括:当多个待校验项与多个标准校验项都匹配时,获取异常数据对应的节点信息;基于节点信息获取上一节点的待校验项以及待校验项对应的标准校验项;根据上一节点的待校验项以及待校验项对应的标准校验项生成校验结果。
第二方面,本申请提供了一种数据校验装置,其特征在于,装置包括:
第一数据获取模块,用于获取待校验数据,待校验数据为待校验程序在预设时间段内的运行数据;
趋势生成模块,用于根据待校验数据生成对应的分布趋势;
异常数据确定模块,用于根据分布趋势确定待校验数据中的异常数据;
待校验项获取模块,用于基于异常数据,获取异常数据对应的待校验项;
标准项获取模块,用于获取预设的标准校验项;
校验模块,用于根据待校验项和标准校验生成待校验数据的校验结果,并输出。
第三方面,本申请还提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述各方法实施例中的步骤。
第四方面,本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述各方法实施例中的步骤。
第五方面,本申请还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
上述数据校验方法、装置、计算机设备、存储介质和计算机程序产品,根据待校验程序的待校验数据的分布趋势,确定待校验数据中的异常数据,并针对异常数据对应的待校验项与标准校验项的比较,从而确定校验结果后输出,以待校验项和标准校验项为基础生成校验结果,可以快速准确的查找待校验程序存在异常的位置,并确定异常存在的原因,提升数据处理效率,可以实现待校验程序系统的校验。
附图说明
为了更清楚地说明本申请实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种数据校验方法的应用环境图;
图2为本申请实施例提供的一种数据校验方法的流程示意图;
图3为本申请实施例提供的又一种数据校验方法的流程示意图;
图4为本申请实施例提供的另一个数据校验 的流程示意图;
图5为本申请实施例提供的一种数据校验装置的结构框图;
图6为本申请实施例提供的一种计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。本申请技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
本申请实施例提供的数据校验方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。服务器104获取待校验数据,待校验数据为终端102上安装的待校验程序在预设时间段内的运行数据,服务器104根据待校验数据生成对应的分布趋势,并根据分布趋势确定待校验数据中的异常数据,进一步基于异常数据,获取异常信息对应的待校验项和预设的标准校验项,根据待校验项和标准校验生成待校验数据的校验结果,并输出。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个示例性的实施例中,如图2所示,提供了一种数据校验方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤202至步骤206。其中:
步骤202,获取待校验数据。
其中,待校验数据用于表征待校验程序在预设时间段内的运行数据。
其中,待校验程序可以为需进行校验的系统数据。
可选地,待校验程序可以为已生成且运行的系统数据,待校验程序也可以已生成预备投入使用的系统数据。可以理解的,可以通过收集待校验程序的运行数据作为待校验数据,通过对待校验数据的校验确定待校验程序是否存在异常,例如是否与业务口径存在差异,也可以通过对待校验数据的分析,确定当待校验程序与业务口径存在差异时,差异存在的原因,例如确定是否为在基于给定的业务口径按数据标准形成程序系统时参数书写错误。
可选地,待校验程序可以为企业信息系统,企业信息系统一个组织内部以及与外部相关组织之间共享信息和完成工作任务所需的一系列技术和软件,可以包括多个子系统,例如经营控制系统、客户服务管理系统、财务管理系统和人力资源管理系统等。可选地,待校验程序也可以为子系统。
可选地,待校验程序可以包括多个子系统,每个子系统具有其对应的数据属性信息。可选地,数据属性信息包括但不限于,数据定义、数据分类、数据计算公式、上游子节点、下游子节点等。
其中,业务口径用于表征数值在特定业务场景下的含义,例如,新增用户数、活跃用户数等。可选地,业务口径包括但不限于数据定义、数据分类、数据计算公式、上游子节点、下游子节点等。
在一个实施例中,业务口径的获取可以通过与业务员沟通获取。可选地,业务口径的获取也可以由业务员提出需求,根据需求分析得出业务口径,例如通过企业信息系统实现内部需求反馈,对反馈的数据进行需求分析以确定业务口径。
在一个实施例中,可以设定获取待校验数据的触发机制,当触发上述触发机制时,即实现待校验数据的获取。可选地,可以设定固定的时间,服务器定时获取待校验数据,也可以设定流程节点作为触发点,例如对于某个审批任务,审批完成后即触发对待校验数据的获取。
在一个实施例中,可以预设数据报表模板,根据数据报表模板中所需的数据收集,并填入数据报表模板中,得到待校验数据。也可以通过安全审计系统(SAS,即SecurityAudit System)实现待校验数据的收集。
可选地,待校验数据可以结果数据,例如审批流程的审批结果,也可以为过程数据,例如审批流程经过多少个审批节点,也可以为参考数据。
其中,参考数据可用于确定待校验数据是否异常。可选地,参考数据可以为根据收集到的待校验数据生成的,例如,当存在多个同等级别子公司,对于某一产品销售额,从中宣泄销售额最好的数据作为参考数据。在一个实施例中,参考数据也可以为由业务员提供的行业数据。
步骤204,根据待校验数据生成对应的分布趋势。
步骤206,根据分布趋势确定待校验数据中的异常数据。
其中,分布趋势用于表征待校验数据的分布情况。可选地,分布趋势可以为图或表,或者图表结合,只要能够清晰的表示待校验数据的分布即可,对此不作限定。通过分布趋势可以清晰的确定待校验数据中是否存在异常数据,提升数据处理准确性,同时提升数据处理效率。
在一个实施例中,在获取到待校验数据后,可以针对待校验数据进行处理,例如可以以待校验数据的分布趋势确定是否存在异常。也可以将待校验数据与标杆数据进行比较,以确定是否存在异常。通过对数据进行多角度处理,可以提升数据处理的准确性。
可选地,以待校验数据的分布趋势确定待校验数据中是否异常数据,可以包括:根据待校验数据的分布趋势确定待校验数据是否有空值、重复值、异常值。其中,空值用于表征应当有数据而未有数据的情况,重复值用于表征应当不相同而相同的情况,异常值用于表征数据与分布趋势整体不匹配的数据,例如发生突变的数据。
在一个实施例中,根据分布趋势确定待校验数据中的异常数据,包括:判断分布趋势是否连续;当分布趋势不连续时,获取以不连续处为基础、划分分布趋势得到的第一子分布趋势和第二子分布趋势;根据第一子分布趋势和第二子分布趋势确定不连续处是否异常。
可选地,当分布趋势存在有不连续时,可以认为不连续处可能为异常,可以针对不连续处进一步校验,以确定不连续处是否的确存在异常。
在一个可选地实施例中,当根据分布趋势确定存在不连续处,可以以不连续处为基础,将分布趋势划分为第一子分布趋势和第二子分布趋势,根据第一子分布趋势和第二子分布趋势确定不连续处是否异常。例如,根据第一子分布趋势或第二子分布趋势确定预测不连续处是否应当存在数据,根据第一子分布趋势或第二子分布趋势的预测情况,确定不连续处是否的确存在异常。
可选地,根据第一子分布趋势和第二子分布趋势确定不连续处是否异常,包括:根据第一子分布趋势预测不连续处的第一预测数据;根据第二子分布趋势预测不连续处的第二预测数据;当第一预测数据和第二预测数据均为空时,则生成不连续处正常的判断结果;当第一预测数据或第二预测数据不为空时,则生成不连续处异常的判断结果。
在一个实施例中,可以以第一子分布趋势预测不连续是否应当存在数据,以及根据第二子分布趋势预测不连续处是否应当存在数据,若根据第一子分布趋势和第二子分布趋势均预测不连续不应当存在数据,则可以认为,不连续处的确不应当存在数据,此时不连续处为非异常数据。而当第一子分布趋势预测不连续处不应当存在数据、而根据第二子分布趋势预测不连续应当存在数据,或者第一子分布趋势预测不连续处应当存在数据、而根据第二子分布趋势预测不连续处不应当存在数据,此时可以认为不连续处有可能有数据,而实际没有,则需要针对不连续处进行校验,此时认为不连续处为异常数据。
在一个实施例中,根据分布趋势确定待校验数据中的异常数据,包括:遍历待校验数据,确定待校验数据中是否重复值,例如连续的两个点重复,则认为存在重复点。当存在重复值时,可以以重复点为基础将分布趋势划分第三子分布趋势和第四子分布趋势,通过第三子分布趋势和第四分布趋势确定重复点是否为异常。例如,根据第三分布趋势和第四分布趋势分别针对重复点进行预测,得到第三预测值和第四预测值,根据第三预测值和第四预测值确定是否应当为重复值。可选地,当根据第三预测值和第四预测均得出重复处应当为重复值,则生成重复处正常的判断结果,当第三预测值或者第四预测值得出重复处不应当为重复值,则生成重复处异常的判断结果。
在一个实施例中,根据分布趋势确定待校验数据中的异常数据,包括:根据分布趋势,确定是否存在突变数据;当获取突变数据,以重复点为基础将分布趋势划分第五子分布趋势和第六子分布趋势,通过第五子分布趋势和第六分布趋势确定突变处是否为异常。例如,根据第五分布趋势和第六分布趋势分别针对突变处进行预测,得到第五预测值和第六预测值,根据第五预测值和第六预测值确定是否应当为突变值。可选地,当根据第五预测值和第六预测均得出突变处应当为突变值,则生成突变处正常的判断结果,当第五预测值或者第六预测值得出重复处不应当为突变值,则生成重复处异常的判断结果。
在一个可选地实施例中,也可以以标杆数据为基础确定待校验数据是否异常,可选地,可以包括:获取参考数据,并根据参考数据生成对应的分布趋势;对比参考数据对应的分布趋势和待校验数据对应的分布趋势;根据参考数据对应的分布趋势和待校验数据对应的分布趋势,确定待校验数据中的异常数据。
在一个实施例中,可以参照待校验数据获取对应的参考数据,例如,当待校验数据为待校验程序一周内的某子公司的营业额,参考数据可以为其他子公司的最高营业额,参考数据也可以为同时段该子公司的历史营业额。
在其中一个实施例中,可以基于参考数据生成对应的分布趋势,基于待校验数据的分布趋势和标杆数据的分布趋势,确定待校验数据与标杆数据之间的差值。
可选地,可以设定阈值数据,并根据参考数据对应的分布趋势生成参考分布趋势范围,当待校验数据对应的分布趋势不在参考分布趋势范围内时,则认为待校验数据存在异常,将待校验数据对应的分布趋势不在参考分布趋势范围内的数据提取即为异常数据;当待校验数据对应的分内趋势在参考分布趋势范围内时,则认为待校验数据不存在异常。
其中,阈值数据用于表征参考数据可波动的数据。可选地,阈值数据可以预先设定。可选地,阈值数据可以与业务场景相关。
可选地,可以针对每个参考数据加上阈值数据,以生成每个参考数据分别对应的波动范围,其中,波动范围包括有两个端点数据,然后再基于每个参考数据分别对应的两个端点数据生成两个参考分布趋势,然后基于两个参考分布界定的范围即为参考分布趋势范围。
可选地,可以将待校验数据直接与参考数据进行比较,确定待校验数据与标杆数据之间的差值。在一个实施例中,可以设定预设阈值,例如预设阈值可以为参考数据的一半,当待校验数据与参考数据之间的差值大于预设阈值时,则认为待校验数据存在异常。在其中一个实施例中,当待校验数据为多个时,可以将每个待校验数据分别与对应的参考数据进行比较,以确定每个待校验数据是否存在异常,并统计存在异常的待校验数据的数量,当存在异常的待校验数据大于等于预设数量时,则认为存在异常,获取差值超过预设阈值的数据作为异常数据,可选地,预设数量可以预设设定的,例如可以为待校验数据的数量的一半。
步骤208,基于异常数据,获取异常数据对应的待校验项。
步骤210,获取预设的标准校验项。
其中,待校验项用于与标准校验项进行比较、以确定异常数据存在异常原因的数据项。
标准校验项用于作为比较基础,以确定待校验项是否存在异常。
可选地,待校验项与异常数据的数据属性信息相关,例如异常数据的数据属性信息包括数据定义、数据分类以及数据计算公式,则待校验项对应包括数据定义、数据分类以及数据计算公式。
在一个实施例中,待校验项与标准校验项对应,例如,待校验项对应包括数据定义、数据分类以及数据计算公式,则标准校验项包括标准数据定义、标准数据分类以及标准数据计算公式。
在一个实施例中,在确定待校验数据为异常数据时,获取待校验数据对应的属性信息,通过属性信息确定待校验项。
在其中一个实施例中,待校验项可以为一个或多个,标准校验项对应为一个或多个。
在一个实施例中,待校验项和标准校验项与系统节点对应,不同系统节点对应的待校验项和标准校验项不同。例如,待校验程序包括多个系统节点,分别为第一系统节点和第二系统节点,第一系统节点对应的待校验项包括数据定义和数据分类,对应的标准校验项为标准数据定义和标准数据分类,第二系统节点对应的待校验项包括数据分类和数据计算公式,对应的标准校验项为标准数据分类和标准数据计算公式。
步骤212,根据待校验项和标准校验项生成待校验数据的校验结果,并输出。
在一个实施例中,当获取到待校验项和标准校验项,可以比较待校验项和标准校验项确定异常数据出现异常的原因所在。例如,待校验项为计算公式,标准校验项为标准计算公式时,可以比较计算公式中的系数、所采用的参数等是否相同,当不相同时,可以直接将不相同的部分一起作为校验结果数据,例如的,当所采用的系数不同时,可以将两个系数整体一起作为校验结果输出。
可选地,当待校验项为一个时,获取对应的标准校验项,比较待校验项和标准校验项,当待校验项和标准校验项匹配时,则可以认为当前系统节点没问题,而数据存在异常的原因可能是上游节点数据,则可以针对上游节点进行进一步的校验。
可选地,获取异常数据对应的节点信息,基于节点信息获取上一节点的待校验项以及待校验项对应的标准校验项,根据上一节点的待校验项以及待校验项对应的标准校验项生成校验结果。
其中,节点信息用于表征当前异常数据在数据处理流程中所处的环节。可选地,可以根据节点信息确定上游系统节点,以便可以确定上游系统节点的相关数据是否存在异常,也可以根据节点信息确定下游系统节点,以当下游系统节点的数据存在异常时,可以确定是否为当前系统节点的原因,例如当前系统节点是否将数据准确的传送至对应的下游系统节点。
其中,上一节点用于表征当前系统节点的第一个上游系统节点。
可选地,在确定上游节点后,针对上游系统节点的数据进行校验,获取上游系统节点的数据对应的待校验项,并获取与待校验项对应的标准校验项,根据待校验项和标准校验项之间的匹配确定异常具体的原因所在。若上游系统节点数据进行校验依旧不存在问题,则可以进一步校验上游系统节点的数据,直至不存在上游节点。
在一个实施例中,待校验项为多个,标准校验项为多个;根据待校验项和标准校验生成待校验数据的校验结果,包括:获取任一待校验项;基于待校验项获取对应的待校验项的作用标识;根据作用标识获取与任一待校验项对应的标准校验项。其中,作用标识用于表征待校验项对应的用途信息。例如,作用标识用于表征当前待校验项用于定义数据分类。可选地,每个待校验项具有对应的作用标识,每个标准校验项具有对应的作用标识,可以通过待校验项的作用标识确定用来比较的标准校验项,以便进行比较匹配的待校验项和标准校验项之间适配。
可选地,当任一待校验项与对应的标准校验项不匹配时,根据任一待校验项与对应的标准校验项生成校验结果。在一个实施例中,可以将不匹配的具体信息以比较组的形式一起作为校验结果数据,例如计算公式所用参数不同,则将待校验项对应的待校验参数与标准校验项对应的标准参数整体作为校验结果输出。可选地,也可以当确定不匹配时,生成不匹配标识,将不匹配标识作为校验结果输出。
可选地,当任一待检验项与对应的标准校验项不匹配时,将不匹配时,也可以将不匹配的具体信息以比较组的形式保存,并进一步获取其他待校验项与对应的标准校验项,继续执行基于待校验项获取对应的待校验项的作用标识的步骤,直至多个待校验项与多个标准校验项的匹配完成。并将所有的匹配结果一起作为校验结果输出。
可选地,当任一待校验项与对应的标准校验项相匹配时,从剩余的待校验项中获取任一待校验项,继续执行基于待校验项获取对应的待校验项的作用标识的步骤,直至多个待校验项与多个标准校验项的匹配完成。并将所有的匹配结果一起作为校验结果输出。
可选地,在多个待校验项与多个标准校验项的匹配完成之后,数据校验方法还包括:当多个待校验项与多个标准校验项都匹配时,获取异常数据对应的节点信息;基于节点信息获取上一节点的待校验项以及待校验项对应的标准校验项;根据上一节点的待校验项以及待校验项对应的标准校验项生成校验结果。
可选地,若上一节点对应的上游系统的数据进行校验依旧不存在问题,则可以将当前上游系统节点设定为当前系统节点,并进一步校验当前系统节点的上一节点的数据,直至不存在上一节点。通过循环获取上一节点实现迭代追溯,可以实现整条链路的追溯,实现整条链路中可能存在差异的原因的确定,实现全面、准确地找寻存在的差异信息。
可选地,基于上游系统节点,获取对应的待校验项和标准校验项,具体匹配过程则参见前述步骤212,在此不再赘述。可选地,当多个待校验项和标准校验项不匹配时,同样可以进一步获取上游系统节点,校验上游系统节点的数据,直至不再有上游系统节点。
在一个实施例中,当根据待校验项和标准校验项比较结果生成校验结果后,可以将校验结果输出给终端,由终端用户利用终端基于校验结果进行调整,例如调整待校验项对应的信息。
在一个实施例中,也可以预先设置纠正方案,在确定校验结果后,根据校验结果实现纠正方案的确定,并将纠正方案与校验结果一起发送给终端,由终端用户利用终端基于校验结果对纠正方案的确定,并将确定的结果返回给服务器,由服务器针对返回的确定结果实现处理。例如,校验结果为待校验项对应的计算参数与标准校验项对应的标准计算参数差异因而引起数据计算结果偏差,对应的纠正方案为将待校验项对应的计算参数替换为标准计算参数,将校验结果与纠正方案封装成信息后发送给终端,终端在接收到该信息后判断该纠正方案可行,则利用终端返回确认信息,服务器接收到确认信息后,将待校验项对应的计算参数直接替换为标准校验项对应的标准计算参数。
上述数据校验方法中,根据待校验程序的待校验数据的分布趋势,确定待校验数据中的异常数据,并针对异常数据对应的待校验项与标准校验项的比较,从而确定校验结果后输出,以待校验项和标准校验项为基础生成校验结果,可以快速准确的查找待校验程序存在异常的位置,并确定异常存在的原因,提升数据处理效率,可以实现待校验程序系统的校验。并且,在实现数据校验时,可以针对每个待校验数据设定多个待校验项,从而多角度系统性的对数据进行校验,以清晰的确定差异存在的原因,以便基于确定的差异存在的原因准确地确定纠正措施。进一步地,当多个待校验项与多个标准校验项验证通过后,可以进一步验证上游系统节点是否存在异常,以及异常存在的原因,实现异常追踪,从而可以实现全过程异常追踪,提升问题确定的准确性和效率。
在一个示例性的实施例中,如图3所示,提供一种数据校验方法,应用于如图1所示的服务器,包括步骤302至步骤324。其中:
步骤302,获取待校验数据。
其中,待校验数据为待校验程序在预设时间段内的运行数据。
步骤304,根据待校验数据生成对应的分布趋势。
步骤306,判断分布趋势是否连续;若是,执行步骤324,若否,执行步骤308。
步骤308,获取以不连续处为基础、划分分布趋势得到的第一子分布趋势和第二子分布趋势。
步骤310,根据第一子分布趋势预测不连续处的第一预测数据。
步骤312,根据第二子分布趋势预测不连续处的第二预测数据。
步骤314,判断第一预测数据和第二预测数据是否均为空,若是,则执行步骤324,若否,则执行步骤316。
步骤316,生成不连续处为异常数据的判断结果。
步骤318,基于异常数据,获取异常数据对应的待校验项。
步骤320,获取预设的标准校验项。
步骤322,根据待校验项和标准校验生成待校验数据的校验结果,并输出。
步骤324,输出数据正常的校验结果。
上述数据校验方法中,根据待校验程序的待校验数据的分布趋势,确定待校验数据中的异常数据,并针对异常数据对应的待校验项与标准校验项的比较,从而确定校验结果后输出,以待校验项和标准校验项为基础生成校验结果,可以快速准确的查找待校验程序存在异常的位置,并确定异常存在的原因,提升数据处理效率,可以实现待校验程序系统的校验。并且,在实现数据校验时,可以针对每个待校验数据设定多个待校验项,从而多角度系统的对数据进行校验。
在一个示例性的实施例中,如图4所示,提供一种数据校验方法,应用于如图1所示的服务器,包括步骤402至步骤324。其中:
步骤402,获取待校验数据。
其中,待校验数据为待校验程序在预设时间段内的运行数据。
步骤404,根据待校验数据生成对应的分布趋势。
步骤406,根据分布趋势确定待校验数据中的异常数据。
步骤408,基于异常数据,获取异常数据对应的多个待校验项。
步骤410,获取任一待校验项。
步骤412,基于待校验项获取对应的待校验项的作用标识。
步骤414,根据作用标识获取与任一待校验项对应的标准校验项。
步骤416,判断任一待校验项与标准校验项是否匹配,若是,则执行步骤420,若否,则执行步骤418。
步骤418,生成校验结果。
可选地,校验结果可以为数据校验通过,也可以为数据校验不通过。
在一个实施例中,校验结果可用来表示数据正常,也可用来表示数据异常。
可选地,校验结果表示数据异常时,可以将异常的具体信息封装在校验结果中一并输出,例如,将待校验项的计算参数与标准校验项的标准计算参数不同这一结果一起封装在校验结果中一起输出。
在一个实施例中,当校验结果中存在有原始数据时,当有新的数据需要写入时,则生成校验结果也可以为更新校验结果,以使得所有比较结果均封装在一起生成校验结果后输出。
步骤420,判断多个待校验项与多个标砖校验项是否均匹配完成,若是,则执行步骤424,若否,则执行步骤422。
步骤422,从剩余的待校验项中获取任一待校验项,继续执行步骤416。
步骤424,获取异常数据对应的节点信息。
步骤426,根据节点信息获取上一节点信息。
其中,上一节点信息可用于获取上游系统。
步骤428,判断上一节点信息是否为空,若是,则执行步骤432,若否,则执行步骤430。
可选地,上一节点信息为空则表明不存在上一节点。
在一个实施例中,上一节点信息不为空,则表明还可以进一步获取上一节点,则继续执行步骤430,以便完整整个数据链路的追溯。
步骤430,获取上一节点的多个待校验项以及待校验项对应的多个标准校验项,继续执行步骤410。
步骤432,输出校验结果。
本实施例中,实现待校验项和标准校验项的验证确定数据是否异常,还可以验证上游节点是否存在异常,以及异常存在的原因,实现异常追踪,从而可以实现全过程异常追踪,提升问题确定的准确性和效率。
应该理解的是,虽然如上的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的数据校验方法的数据校验装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个数据校验装置实施例中的具体限定可以参见上文中对于数据校验方法的限定,在此不再赘述。
在一个示例性的实施例中,如图5所示,提供了一种数据校验装置500,包括:数据获取模块502、趋势生成模块504、异常数据确定模块506、待校验项获取模块508、标准项获取模块510和校验模块512,其中:
数据获取模块502,用于获取待校验数据,待校验数据为待校验程序在预设时间段内的运行数据。
趋势生成模块504,用于根据待校验数据生成对应的分布趋势。
异常数据确定模块506,用于根据分布趋势确定待校验数据中的异常数据。
待校验项获取模块508,用于基于异常数据,获取异常数据对应的待校验项。
标准项获取模块510,用于获取预设的标准校验项。
校验模块512,用于根据待校验项和标准校验生成待校验数据的校验结果,并输出。
在一个实施例中,异常数据确定模块506,还用于判断分布趋势是否连续;当分布趋势不连续时,获取以不连续处为基础、划分分布趋势得到的第一子分布趋势和第二子分布趋势;根据第一子分布趋势和第二子分布趋势确定不连续处是否异常。
在一个实施例中,异常数据确定模块506,还用于根据第一子分布趋势预测不连续处 的第一预测数据;根据第二子分布趋势预测不连续处的第二预测数据;当第一预测数据和第二预测数据均为空时,则生成不连续处正常的判断结果;当第一预测数据或第二预测数据不为空时,则生成不连续处异常的判断结果。
在一个实施例中,异常数据确定模块506,还用于获取参考数据,并根据参考数据生成对应的分布趋势;对比参考数据对应的分布趋势和待校验数据对应的分布趋势;根据参考数据对应的分布趋势与待校验数据对应的分布趋势之间的对比结果,确定待校验数据中的异常数据。
在一个实施例中,校验模块512,还用于,当待校验项为多个,标准校验项为多个时,获取任一待校验项;基于待校验项获取对应的待校验项的作用标识;根据作用标识获取与任一待校验项对应的标准校验项;当任一待校验项与对应的标准校验项不匹配时,根据任一待校验项与对应的标准校验项生成校验结果;当任一待校验项与对应的标准校验项相匹配时,从剩余的待校验项中获取任一待校验项,继续执行基于待校验项获取对应的待校验项的作用标识的步骤,直至多个待校验项与多个标准校验项的匹配完成。
在一个实施例中,校验模块512,还用于,在多个待校验项与多个标准校验项的匹配完成之后,当多个待校验项与多个标准校验项都匹配时,获取异常数据对应的节点信息;基于节点信息获取上一节点的待校验项以及待校验项对应的标准校验项;根据上一节点的待校验项以及待校验项对应的标准校验项生成校验结果。
上述数据校验装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个示例性的实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种数据校验方法。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个示例性的实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要符合相关规定。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (10)

1.一种数据校验方法,其特征在于,所述方法包括:
获取待校验数据,所述待校验数据为待校验程序在预设时间段内的运行数据;
根据所述待校验数据生成对应的分布趋势;
根据所述分布趋势确定所述待校验数据中的异常数据;
基于所述异常数据,获取所述异常数据对应的待校验项;
获取预设的标准校验项;
根据所述待校验项和所述标准校验生成所述待校验数据的校验结果,并输出。
2.根据权利要求1所述的方法,其特征在于,所述根据所述分布趋势确定所述待校验数据中的异常数据,包括:
判断所述分布趋势是否连续;
当所述分布趋势不连续时,获取以不连续处为基础、划分所述分布趋势得到的第一子分布趋势和第二子分布趋势;
根据所述第一子分布趋势和第二子分布趋势确定所述不连续处是否异常。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第一子分布趋势和第二子分布趋势确定所述不连续处是否异常,包括:
根据所述第一子分布趋势预测所述不连续处的第一预测数据;
根据所述第二子分布趋势预测所述不连续处的第二预测数据;
当所述第一预测数据和所述第二预测数据均为空时,则生成所述不连续处正常的判断结果;
当所述第一预测数据或所述第二预测数据不为空时,则生成所述不连续处异常的判断结果。
4.根据权利要求1所述的方法,其特征在于,所述根据所述分布趋势确定所述待校验数据中的异常数据,包括:
获取参考数据,并根据所述参考数据生成对应的分布趋势;
对比所述参考数据对应的分布趋势和所述待校验数据对应的分布趋势;
根据所述参考数据对应的分布趋势和所述待校验数据对应的分布趋势的对比结果,确定所述待校验数据中的异常数据。
5.根据权利要求1所述的方法,其特征在于,所述待校验项为多个,所述标准校验项为多个;所述根据所述待校验项和所述标准校验生成所述待校验数据的校验结果,包括:
获取任一所述待校验项;
基于所述待校验项获取对应的所述待校验项的作用标识;
根据所述作用标识获取与所述任一所述待校验项对应的所述标准校验项;
当所述任一所述待校验项与对应的所述标准校验项不匹配时,根据所述任一所述待校验项与对应的所述标准校验项生成所述校验结果;
当所述任一所述待校验项与对应的所述标准校验项相匹配时,从剩余的所述待校验项中获取任一所述待校验项,继续执行基于所述待校验项获取对应的所述待校验项的作用标识的步骤,直至多个所述待校验项与多个所述标准校验项的匹配完成。
6.根据权利要求5所述的方法,其特征在于,在所述多个所述待校验项与多个所述标准校验项的匹配完成之后,所述方法还包括:
当多个所述待校验项与多个所述标准校验项都匹配时,获取所述异常数据对应的节点信息;
基于所述节点信息获取上一节点的待校验项以及所述待校验项对应的标准校验项;
根据所述上一节点的待校验项以及所述待校验项对应的标准校验项生成所述校验结果。
7.一种数据校验装置,其特征在于,所述装置包括:
数据获取模块,用于获取待校验数据,所述待校验数据为待校验程序在预设时间段内的运行数据;
趋势生成模块,用于根据所述待校验数据生成对应的分布趋势;
异常数据确定模块,用于根据所述分布趋势确定所述待校验数据中的异常数据;
待校验项获取模块,用于基于所述异常数据,获取所述异常数据对应的待校验项;
标准项获取模块,用于获取预设的标准校验项;
校验模块,用于根据所述待校验项和所述标准校验生成所述待校验数据的校验结果,并输出。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202410369054.9A 2024-03-28 数据校验方法、装置、计算机设备、存储介质和程序产品 Pending CN118152243A (zh)

Publications (1)

Publication Number Publication Date
CN118152243A true CN118152243A (zh) 2024-06-07

Family

ID=

Similar Documents

Publication Publication Date Title
US10311044B2 (en) Distributed data variable analysis and hierarchical grouping system
US10367888B2 (en) Cloud process for rapid data investigation and data integrity analysis
CN109740799B (zh) 预算数据生成方法、装置、计算机设备和存储介质
CN114443437A (zh) 告警根因输出方法、装置、设备、介质和程序产品
Beutner et al. Nonparametric meta‐analysis for minimal‐repair systems
CN118152243A (zh) 数据校验方法、装置、计算机设备、存储介质和程序产品
Kibzun Comparison of two algorithms for solving a two‐stage bilinear stochastic programming problem with quantile criterion
CN114462859A (zh) 工作流处理方法、装置、计算机设备和存储介质
KR20220115859A (ko) 프로세스의 에지 테이블 표현
US20150269502A1 (en) Method and apparatus for finding process deviations and recommending repairs in a business process
Yaremchuk et al. Big data and similarity-based software reliability assessment: The technique and applied tools
CN116795705A (zh) 异常节点的确定方法、装置和计算机设备
CN116523038A (zh) 数据监控方法、装置、计算机设备和存储介质
CN117726419A (zh) 资源数据处理方法、装置、计算机设备、存储介质
CN117131421A (zh) 数据处理结果的校验方法、装置和计算机设备
US10386822B2 (en) System for rapid identification of sources of variation in complex manufacturing processes
JP6466800B2 (ja) ネットワーク評価システム、サービス故障率算出方法、及びプログラム
CN117196394A (zh) 评价指标处理方法、装置、计算机设备和存储介质
CN117171672A (zh) 产品数据处理方法、装置、计算机设备和存储介质
CN117349862A (zh) 账户权限设置方法、装置、计算机设备和存储介质
CN116521546A (zh) 接口性能的调整方法、装置、计算机设备及存储介质
CN114119170A (zh) 交互产品推荐方法、装置、计算机设备、存储介质
CN117437083A (zh) 基于云边融合智能调度运行平台的电网边缘集群监控方法
CN116051152A (zh) 业务产品生成方法、装置、计算机程序产品和存储介质
CN115408186A (zh) 根因定位方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication