CN108959374B - 数据存储方法、装置及电子设备 - Google Patents

数据存储方法、装置及电子设备 Download PDF

Info

Publication number
CN108959374B
CN108959374B CN201810505103.1A CN201810505103A CN108959374B CN 108959374 B CN108959374 B CN 108959374B CN 201810505103 A CN201810505103 A CN 201810505103A CN 108959374 B CN108959374 B CN 108959374B
Authority
CN
China
Prior art keywords
data
target
target data
data table
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810505103.1A
Other languages
English (en)
Other versions
CN108959374A (zh
Inventor
魏建钟
刘强
杨冬冬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sankuai Online Technology Co Ltd
Original Assignee
Beijing Sankuai Online Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sankuai Online Technology Co Ltd filed Critical Beijing Sankuai Online Technology Co Ltd
Priority to CN201810505103.1A priority Critical patent/CN108959374B/zh
Publication of CN108959374A publication Critical patent/CN108959374A/zh
Application granted granted Critical
Publication of CN108959374B publication Critical patent/CN108959374B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供一种数据存储方法、装置及电子设备,所述方法的一具体实施方式包括:获取目标源数据表中待存储的目标数据;对所述目标数据进行检测,得到检测结果;若所述检测结果指示所述目标数据异常,针对所述目标数据执行预设的修复操作;若所述检测结果指示所述目标数据正常,将所述目标数据存储至数据仓库。该实施方式能够对待存储的目标数据进行检测,在该目标数据正常时,才将该目标数据存入数据仓库,在该目标数据异常时,需要对该目标数据进行修复,避免了将异常的数据加载到数据仓库中,提高了数据仓库的数据质量。

Description

数据存储方法、装置及电子设备
技术领域
本申请涉及数据仓库技术领域,特别涉及一种数据存储方法、装置及电子设备。
背景技术
随着大数据技术的不断发展,数据仓库的建设也变得越来越重要。目前来说,在进行数据仓库建设的过程中,首先将业务系统的数据经过抽取、清洗转换之后加载到目标系统中,以便将分散、零乱、标准不统一的数据整合到一起进行数据仓库的建设。但是,可能会将异常的数据加载到数据仓库中,从而影响了整个数据仓库的数据质量。
发明内容
为了解决上述技术问题之一,本申请提供一种数据存储方法、装置及电子设备。
根据本申请实施例的第一方面,提供一种数据存储方法,包括:
获取目标源数据表中待存储的目标数据;
对所述目标数据进行检测,得到检测结果;
若所述检测结果指示所述目标数据异常,针对所述目标数据执行预设的修复操作;
若所述检测结果指示所述目标数据正常,将所述目标数据存储至数据仓库。
可选的,所述对所述目标数据进行检测,包括:
获取所述目标源数据表对应的验证规则;
基于所述验证规则对所述目标数据进行检测。
可选的,所述验证规则与所述目标源数据表对应的业务类型相匹配。
可选的,所述对所述目标数据进行检测,包括:
确定与所述目标源数据表有业务关联的参考源数据表;
获取与所述目标源数据表及所述参考源数据表匹配的业务关联规则;
基于所述目标数据及所述参考源数据表中的数据获取针对所述业务关联规则的目标指标;
按照所述业务关联规则验证所述目标指标,以对所述目标数据进行检测。
可选的,所述针对所述目标数据执行预设的修复操作,包括:
向所述目标源数据表对应的业务端发送数据修复请求,以请求修复所述目标数据。
可选的,若所述检测结果指示所述目标数据异常,所述方法还包括:
将所述目标数据存储至预设的第一临时数据表,并对所述目标数据进行异常标记。
可选的,所述将所述目标数据存储至数据仓库,包括:
若基于所述第一临时数据表中经过异常标记的数据,确定所述目标数据与所述第一临时数据表无关联,则将所述目标数据存储至预设的第二临时数据表;
若基于所述第一临时数据表中经过异常标记的数据,确定所述目标数据与所述第一临时数据表有关联,则将所述目标数据存储至所述第一临时数据表,并对所述目标数据进行正常标记;
在预设的触发时刻,将存储于所述第二临时数据表中的所述目标数据存储至数据仓库,或者,将存储于所述第一临时数据表中且经过正常标记的所述目标数据存储至数据仓库。
根据本申请实施例的第二方面,提供一种数据存储装置,包括:
获取模块,用于获取目标源数据表中待存储的目标数据;
检测模块,用于对所述目标数据进行检测,得到检测结果;
修复模块,用于在所述检测结果指示所述目标数据异常时,针对所述目标数据执行预设的修复操作;
存储模块,用于在所述检测结果指示所述目标数据正常时,将所述目标数据存储至数据仓库。
根据本申请实施例的第三方面,提供一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面中任一项所述的方法。
根据本申请实施例的第四方面,提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述第一方面中任一项所述的方法。
本申请的实施例提供的技术方案可以包括以下有益效果:
本申请的实施例提供的数据存储方法和装置,通过获取目标源数据表中待存储的目标数据,对目标数据进行检测,得到检测结果。若检测结果指示目标数据异常,则针对该目标数据执行预设的修复操作,若检测结果指示目标数据正常,则将该目标数据存储至数据仓库。由于本实施例能够对待存储的目标数据进行检测,在该目标数据正常时,才将该目标数据存入数据仓库,在该目标数据异常时,需要对该目标数据进行修复,避免了将异常的数据加载到数据仓库中,提高了数据仓库的数据质量。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1是本申请根据一示例性实施例示出的一种数据存储方法的流程图;
图2是本申请根据一示例性实施例示出的另一种数据存储方法的流程图;
图3是本申请根据一示例性实施例示出的另一种数据存储方法的流程图;
图4是本申请根据一示例性实施例示出的另一种数据存储方法的流程图;
图5是本申请根据一示例性实施例示出的一种数据存储装置的框图;
图6是本申请根据一示例性实施例示出的另一种数据存储装置的框图;
图7是本申请根据一示例性实施例示出的另一种数据存储装置的框图;
图8是本申请根据一示例性实施例示出的另一种数据存储装置的框图;
图9是本申请根据一示例性实施例示出的一种电子设备的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
如图1所示,图1是根据一示例性实施例示出的一种数据存储方法的流程图,该方法可以应用于服务器或者服务器集群中,该服务器或者服务器集群可以用于构建和管理数据仓库。该方法包括以下步骤:
在步骤101中,获取目标源数据表中待存储的目标数据。
在步骤102中,对目标数据进行检测,得到检测结果。
在本实施例中,可以从目标源数据表中获取待存储的目标数据。其中,目标源数据表可以是ETL(Extract-Transform-Load,数据提取转换和加载)过程对应的源数据表,例如,目标源数据表可以是业务源系统中生成的数据表等。目标数据可以是目标源数据表中新增的还未存储到数据仓库的数据。
在本实施例中,获取到目标数据后,可以对目标数据进行检测,以确定目标数据是正常还是异常。在一种实现方式中,可以获取与目标源数据表匹配的验证规则,然后基于该验证规则检测目标数据是正常还是异常。
在另一种实现方式中,还可以确定与目标源数据表有业务关联的参考源数据表,获取与目标源数据表及参考源数据表匹配的业务关联规则,基于目标数据及参考源数据表中的数据获取针对上述业务关联规则的目标指标,并按照上述业务关联规则对目标指标进行验证,以检测目标数据是正常还是异常(例如,若目标指标通过验证,则可以确定目标数据正常,若目标指标未通过验证,则可以确定目标数据异常)。
在又一种实现方式中,还可以首先获取目标源数据表对应的验证规则,并基于该验证规则对该目标数据进行验证。如果未通过该验证,则确定该目标数据异常。如果通过该验证,则进一步确定与该目标源数据表有业务关联的参考源数据表。接着,获取与该目标源数据表及该参考源数据表匹配的业务关联规则,基于该目标数据及该参考源数据表中的数据获取针对该业务关联规则的目标指标,并按照该业务关联规则对该目标指标进行验证。如果通过该验证,则确定该目标数据正常。如果未通过该验证,则确定该目标数据异常。
可以理解,还可以通过其它任意合理的方式对目标数据进行检测,本申请对此方面不限定。
在步骤103中,若检测结果指示目标数据异常,针对该目标数据执行预设的修复操作。
在本实施例中,如果检测结果指示目标数据异常,则可以针对该目标数据执行预设的修复操作,以对该目标数据进行修复,得到正常的数据。其中,预设的修复操作可以是任意能够对数据进行修复的操作。例如,可以向目标源数据表对应的业务端发送数据修复请求,以请求该业务端修复目标数据。又例如,还可以获取预设的修复规则,并基于该预设的修复规则对目标数据进行修复。可以理解,本申请对预设的修复操作的具体操作方式方面不限定。
在步骤104中,若检测结果指示目标数据正常,将该目标数据存储至数据仓库。
在本实施例中,如果检测结果指示目标数据正常,则可以将该目标数据存储至数据仓库。在一种实现方式中,可以直接将该目标数据存储至数据仓库中。在另一种实现方式中,还可以先将该目标数据存储至临时的数据表中,并在预设的触发时刻,从临时的数据表中取出该目标数据,并将该目标数据存储至数据仓库。
本申请的上述实施例提供的数据存储方法,通过获取目标源数据表中待存储的目标数据,对目标数据进行检测,得到检测结果。若检测结果指示目标数据异常,则针对该目标数据执行预设的修复操作,若检测结果指示目标数据正常,则将该目标数据存储至数据仓库。由于本实施例能够对待存储的目标数据进行检测,在该目标数据正常时,才将该目标数据存入数据仓库,在该目标数据异常时,需要对该目标数据进行修复,避免了将异常的数据加载到数据仓库中,提高了数据仓库的数据质量。
如图2所示,图2根据一示例性实施例示出的另一种数据存储方法的流程图,该实施例详细描述了对目标数据进行检测的过程,该方法可以应用于服务器或者服务器集群中,该服务器或者服务器集群可以用于构建和管理数据仓库,包括以下步骤:
在步骤201中,获取目标源数据表中待存储的目标数据。
在步骤202中,获取该目标源数据表对应的验证规则。
在步骤203中,基于该验证规则对该目标数据进行检测。
在本实施例中,不同的源数据表可以是针对不同的业务类型而创建的,可以预先针对不同的业务类型分别设定相应的验证规则。
在本实施例中,在对目标数据进行检测的过程中,可以首先获取该目标源数据表对应的验证规则。该目标源数据表对应的验证规则与该目标源数据表对应的业务类型相匹配。具体来说,可以先确定该目标源数据表对应的业务类型,然后,从预存的数据中选取与该业务类型相匹配的验证规则作为该目标源数据表对应的验证规则。接着,基于该验证规则对该目标数据进行检测。
例如,针对订单业务类型,可以预先设定验证规则A,该验证规则A可以包括订单业务在一天之中的有效时间段(如,8:00~22:00),以及订单的有效消费金额(如,2元~1万元)等。如果目标源数据表B对应于订单业务类型,目标数据为目标源数据表B中订单C的相关数据(如,包括订单C的产生时间、订单C的消费金额等),可以基于验证规则A对订单C的相关数据进行检测。若订单C的产生时间不在验证规则A对应的有效时间段范围内,或者订单C的消费金额不在验证规则A对应的有效消费金额范围内,则说明该目标数据异常。
可以理解,针对任意业务类型,可以设定任意合理内容的验证规则,本申请对验证规则的具体内容方面不限定。
在步骤204中,若检测结果指示目标数据异常,针对该目标数据执行预设的修复操作。
在步骤205中,若检测结果指示目标数据正常,将该目标数据存储至数据仓库。
需要说明的是,对于与图1实施例中相同的步骤,在上述图2实施例中不再进行赘述,相关内容可参见图1实施例。
本申请的上述实施例提供的数据存储方法,通过获取目标源数据表中待存储的目标数据,获取该目标源数据表对应的验证规则,基于该验证规则对该目标数据进行检测。在检测结果指示目标数据异常时,针对该目标数据执行预设的修复操作。在检测结果指示目标数据正常时,将该目标数据存储至数据仓库。由于本实施例考虑到了不同的源数据表中的数据可能需要满足不同的规范,因此,针对目标源数据表,采用对应的验证规则对目标数据进行检测,提高了检测结果的准确度,减少了异常数据的漏检率。
如图3所示,图3根据一示例性实施例示出的另一种数据存储方法的流程图,该实施例详细描述了对目标数据进行检测的过程,该方法可以应用于服务器或者服务器集群中,该服务器或者服务器集群可以用于构建和管理数据仓库,包括以下步骤:
在步骤301中,获取目标源数据表中待存储的目标数据。
在步骤302中,确定与该目标源数据表有业务关联的参考源数据表。
在本实施例中,不同的源数据表可以是针对不同的业务类型而创建的,由于一些业务类型之间可能存在关联,因此,一些源数据表之间也可能存在业务关联。例如,订单业务类型,促销业务类型,结算付款业务类型以及结算毛收入业务类型之间存在关联。因此,源数据表D(对应于订单业务类型),源数据表E(对应于促销业务类型),源数据表F(对应于结算付款业务类型)及源数据表G(对应于结算毛收入业务类型)之间也存在业务关联。
在本实施例中,可以预先记录源数据表之间存在的业务关联关系,在对目标数据进行检测的过程中,可以基于预先记录的上述业务关联关系,确定与该目标源数据表有业务关联的源数据表作为参考源数据表。
在步骤303中,获取与该目标源数据表及该参考源数据表匹配的业务关联规则。
在步骤304中,基于该目标数据及该参考源数据表中的数据获取针对该业务关联规则的目标指标。
在步骤305中,按照该业务关联规则验证该目标指标,以对该目标数据进行检测。
在本实施例中,存在业务关联的多个源数据表中的数据可能需要满足一定的规范,因此,可以预先针对每组存在业务关联的源数据表,设定相应的业务关联规则。在对目标数据进行检测的过程中,首先可以获取目标源数据表及参考源数据表匹配的业务关联规则。然后,基于该目标数据及该参考源数据表中的数据获取针对该业务关联规则的目标指标,并按照该业务关联规则验证该目标指标,以对该目标数据进行检测。
例如,可以采用预设的等式来表示业务关联规则,该预设的等式可以为:
Figure BDA0001671227420000091
其中,Mk和Ni均表示目标指标,ak和bi分别表示Mk和Ni的指标系数(例如,指标系数可以为1,或-1等)。
可以理解,还可以采用其它的方式来表示业务关联规则,本申请对业务关联规则的具体内容和方式方面不限定。
例如,目标源数据表D对应于订单业务类型,目标数据为目标源数据表D中,日期为a的一天内的订单数据。因此,可以确定与目标源数据表D有业务关联的参考源数据表分别为参考源数据表E(对应于促销业务类型),参考源数据表F(对应于结算付款业务类型)以及参考源数据表G(对应于结算毛收入业务类型)。并可以获取表示相应的业务关联规则的等式:代收商家金额-商家优惠金额=应付商家金额+毛收入。其中,代收商家金额、商家优惠金额、应付商家金额和毛收入均为针对上述业务关联规则的目标指标。可以根据目标数据以及参考源数据表E、参考源数据表F和参考源数据表G中的数据(日期为a的一天内的数据)计算上述目标指标。然后判断得到的目标指标是否满足上述业务关联规则的等式,从而实现对目标数据进行检测。如果得到的目标指标满足上述业务关联规则的等式,则检测结果指示目标数据正常。如果得到的目标指标不满足上述业务关联规则的等式,则检测结果指示目标数据异常。
在步骤306中,若检测结果指示目标数据异常,针对该目标数据执行预设的修复操作。
在步骤307中,若检测结果指示目标数据正常,将该目标数据存储至数据仓库。
需要说明的是,对于与图1和图2实施例中相同的步骤,在上述图3实施例中不再进行赘述,相关内容可参见图1和图2实施例。
本申请的上述实施例提供的数据存储方法,通过获取目标源数据表中待存储的目标数据,确定与该目标源数据表有业务关联的参考源数据表,获取与该目标源数据表及该参考源数据表匹配的业务关联规则,基于该目标数据及该参考源数据表中的数据获取针对该业务关联规则的目标指标,并按照该业务关联规则验证该目标指标,以对该目标数据进行检测。当检测结果指示目标数据异常时,针对该目标数据执行预设的修复操作。当检测结果指示目标数据正常时,将该目标数据存储至数据仓库。由于本实施例考虑到了存在业务关联的多个源数据表中的数据可能需要满足一定的规范,因此,基于源数据表之间的业务关联关系,设定相应的业务关联规则。采用相应的业务关联规则对目标数据进行检测,能够提高检测结果的准确度,减少异常数据的漏检率。
如图4所示,图4根据一示例性实施例示出的另一种数据存储方法的流程图,该实施例详细描述了执行预设的修复操作以及将目标数据存储至数据仓库的过程,该方法可以应用于服务器或者服务器集群中,该服务器或者服务器集群可以用于构建和管理数据仓库,包括以下步骤:
在步骤401中,获取目标源数据表中待存储的目标数据。
在步骤402中,对目标数据进行检测,得到检测结果。
在步骤403a中,若该检测结果指示该目标数据异常,向目标源数据表对应的业务端发送数据修复请求,以请求修复该目标数据。
在本实施例中,由于目标数据是在目标源数据表对应的业务端生成的,因此,如果确定目标数据异常,则可以向目标源数据表对应的业务端发送数据修复请求,以请求该业务端修复目标数据。从而能够更加高效地修复目标数据。
在步骤403b中,将该目标数据存储至预设的第一临时数据表,并对该目标数据进行异常标记。
在本实施例中,若该检测结果指示该目标数据异常,还可以进一步将该目标数据存储至预设的第一临时数据表,并对该目标数据进行异常标记。其中,该第一临时数据表针对目标源数据表而创建,用于临时存储异常的数据以及经过修复的数据。
在步骤404a中,若该检测结果指示目标数据正常,且基于该第一临时数据表中经过异常标记的数据,确定目标数据与该第一临时数据表无关联时,将目标数据存储至预设的第二临时数据表。
在本实施例中,若该检测结果指示该目标数据正常,可以进一步判断该第一临时数据表中经过异常标记的数据中是否存在与目标数据关联的数据。如果不存在与目标数据关联的数据,则可以确定目标数据与该第一临时数据表无关联,可以将目标数据存储至预设的第二临时数据表。其中,该第二临时数据表也是针对目标源数据表而创建的,用于临时存储正常的数据且未经过修复的数据。
在步骤404b中,当基于该第一临时数据表中经过异常标记的数据,确定目标数据与该第一临时数据表有关联时,将目标数据存储至该第一临时数据表,并对目标数据进行正常标记。
在本实施例中,若该检测结果指示该目标数据正常,进一步判断该第一临时数据表中经过异常标记的数据中是否存在与目标数据关联的数据。如果存在与目标数据关联的数据,则可以确定目标数据与该第一临时数据表有关联,说明该目标数据为修复之后得到的正常数据。可以将该目标数据存储至该第一临时数据表,并对该目标数据进行正常标记。
本实施例中,对步骤404a和步骤404b的先后顺序不做限定,步骤404a可以在步骤404b之前,也可以在步骤404b之后,此外,步骤404a和步骤404b也可同时进行。
在步骤404c中,在预设的触发时刻,将存储于第二临时数据表中的目标数据存储至数据仓库,或者,将存储于第一临时数据表中且经过正常标记的目标数据存储至数据仓库。
在本实施例中,预设的触发时刻可以是周期期满的时刻,也可以是预设事件发生的时刻,还可以是一天中的多个固定时刻等,本申请对预设的触发时刻的具体设定方面不限定。
在本实施例中,如果目标数据正常,则目标数据可能存储于第二临时数据表中,也可能存储于第一临时数据表中且经过正常标记。在预设的触发时刻,可以将第二临时数据表中的数据及第一临时数据表中经过正常标记的数据均存储至数据仓库。因此,在预设的触发时刻,存储于第二临时数据表中的目标数据,或者,存储于第一临时数据表中且经过正常标记的目标数据,会被存储至数据仓库。
需要说明的是,对于与图1-图3实施例中相同的步骤,在上述图4实施例中不再进行赘述,相关内容可参见图1-图3实施例。
本申请的上述实施例提供的数据存储方法,通过获取目标源数据表中待存储的目标数据,对目标数据进行检测,得到检测结果。若该检测结果指示该目标数据异常,向目标源数据表对应的业务端发送数据修复请求,以请求修复该目标数据,并将该目标数据存储至预设的第一临时数据表,同时对该目标数据进行异常标记。若该检测结果指示目标数据正常,且基于该第一临时数据表中经过异常标记的数据,确定目标数据与该第一临时数据表无关联时,将目标数据存储至预设的第二临时数据表。当基于该第一临时数据表中经过异常标记的数据,确定目标数据与该第一临时数据表有关联时,将目标数据存储至该第一临时数据表,并对目标数据进行正常标记。在预设的触发时刻,将存储于第二临时数据表中的目标数据存储至数据仓库,或者,将存储于第一临时数据表中且经过正常标记的目标数据存储至数据仓库。由于本实施例将正常数据与异常数据分别进行管理,并对异常数据进行修复,使得存储至数据仓库的数据均为正常的数据,并且保证了数据的完整性,进一步提高了整个数据仓库的数据质量。
应当注意,尽管在上述的实施例中,以特定顺序描述了本申请方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。相反,流程图中描绘的步骤可以改变执行顺序。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
下面结合一个完整的数据存储的应用实例,对本申请方案进行示意性说明。
应用场景可以为:服务器集群在创建数据仓库的过程中,首先,获取源数据表中的待存储数据。然后,采用上述源数据表对应的验证规则对待存储数据进行第一次验证。还可以进一步获取与上述源数据表有业务关联的源数据表以及匹配的业务关联规则,并基于与上述源数据表有业务关联的源数据表以及匹配的业务关联规则对待存储数据进行第二次验证。如果两次验证均通过,则说明待存储数据正常,如果任意一次验证未通过,则说明待存储数据异常。
接着,将异常的待存储数据存储于预设的第一临时数据表,并进行异常标记,将正常的待存储数据存储于预设的第二临时数据表。针对异常的待存储数据,可以向其源数据表对应的业务端发送修复请求,以请求修复异常的待存储数据。当该业务端完成对数据的修复后,可以将修复后的待存储数据发送给服务器集群。服务器集群继续判断修复后的待存储数据是正常还是异常。如果正常,则可以将修复后的待存储数据存储于第一临时数据表,并进行正常标记。
最后,每隔预设时间段,服务器集群可以将存储于第二临时数据表中的数据以及存储于第一临时数据表中且经过正常标记的数据存储至数据仓库。
可见,应用上述方案,在创建数据仓库的过程中,能够对待存储数据进行检测,将正常的待存储数据与异常的待存储数据分别进行管理,并对异常的待存储数据进行修复。从而避免了将异常的待存储数据加载到数据仓库中,并保证了数据的完整性,提高了整个数据仓库的数据质量。
与前述数据存储方法实施例相对应,本申请还提供了数据存储装置的实施例。
如图5所示,图5是本申请根据一示例性实施例示出的一种数据存储装置框图,该装置可以包括:获取模块501,检测模块502,修复模块503和存储模块504。
其中,获取模块501,用于获取目标源数据表中待存储的目标数据。
检测模块502,用于对上述目标数据进行检测,得到检测结果。
修复模块503,用于在检测结果指示该目标数据异常时,针对该目标数据执行预设的修复操作。
存储模块504,用于在检测结果指示该目标数据正常时,将该目标数据存储至数据仓库。
如图6所示,图6是本申请根据一示例性实施例示出的另一种数据存储装置框图,该实施例在前述图5所示实施例的基础上,检测模块502可以包括:第一获取子模块601和第一检测子模块602。
其中,第一获取子模块601,用于获取上述目标源数据表对应的验证规则。
第一检测子模块602,用于基于该验证规则对该目标数据进行检测。
在一些可选实施方式中,所述验证规则与所述目标源数据表对应的业务类型相匹配。
如图7所示,图7是本申请根据一示例性实施例示出的另一种数据存储装置框图,该实施例在前述图5所示实施例的基础上,检测模块502可以包括:确定子模块701,第二获取子模块702,第三获取子模块703和第二检测子模块704。
其中,确定子模块701,用于确定与上述目标源数据表有业务关联的参考源数据表。
第二获取子模块702,用于获取与该目标源数据表及该参考源数据表匹配的业务关联规则。
第三获取子模块703,用于基于目标数据及参考源数据表中的数据获取针对上述业务关联规则的目标指标。
第二检测子模块704,用于按照上述业务关联规则验证目标指标,以对该目标数据进行检测。
在另一些可选实施方式中,修复模块503被配置用于:向目标源数据表对应的业务端发送数据修复请求,以请求修复目标数据。
如图8所示,图8是本申请根据一示例性实施例示出的另一种数据存储装置框图,该实施例在前述图5所示实施例的基础上,该装置还可以进一步包括:标记模块505。
其中,标记模块505,用于在检测结果指示目标数据异常时,将目标数据存储至预设的第一临时数据表,并对目标数据进行异常标记。
在另一些可选实施方式中,存储模块504被配置用于:
若基于第一临时数据表中经过异常标记的数据,确定目标数据与第一临时数据表无关联,则将目标数据存储至预设的第二临时数据表。若基于第一临时数据表中经过异常标记的数据,确定目标数据与第一临时数据表有关联,则将目标数据存储至第一临时数据表,并对目标数据进行正常标记。在预设的触发时刻,将存储于第二临时数据表中的目标数据存储至数据仓库,或者将存储于第一临时数据表中且经过正常标记的目标数据存储至数据仓库。
应当理解,上述装置可以预先设置在服务器中,也可以通过下载等方式而加载到服务器中。上述装置中的相应模块可以与服务器中的模块相互配合以实现数据存储方案。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本申请方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本申请实施例还提供了一种计算机可读存储介质,该存储介质存储有计算机程序,计算机程序可用于执行上述图1至图4任一实施例提供的数据存储方法。
对应于上述的数据存储方法,本申请实施例还提出了图9所示的根据本申请的一示例性实施例的电子设备的示意结构图。请参考图9,在硬件层面,该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成数据存储装置。当然,除了软件实现方式之外,本申请并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

Claims (7)

1.一种数据存储方法,其特征在于,所述方法包括:
获取目标源数据表中待存储的目标数据;
确定与所述目标源数据表有业务关联的参考源数据表;
获取与所述目标源数据表及所述参考源数据表匹配的业务关联规则;
基于所述目标数据及所述参考源数据表中的数据获取针对所述业务关联规则的目标指标;
按照所述业务关联规则验证所述目标指标,以对所述目标数据进行检测,得到检测结果;
若所述检测结果指示所述目标数据异常,针对所述目标数据执行预设的修复操作;
若所述检测结果指示所述目标数据正常,将所述目标数据存储至数据仓库。
2.根据权利要求1所述的方法,其特征在于,所述针对所述目标数据执行预设的修复操作,包括:
向所述目标源数据表对应的业务端发送数据修复请求,以请求修复所述目标数据。
3.根据权利要求1或2所述的方法,其特征在于,若所述检测结果指示所述目标数据异常,所述方法还包括:
将所述目标数据存储至预设的第一临时数据表,并对所述目标数据进行异常标记。
4.根据权利要求3所述的方法,其特征在于,所述若所述检测结果指示所述目标数据正常,将所述目标数据存储至数据仓库,包括:
若基于所述第一临时数据表中经过异常标记的数据,确定所述目标数据与所述第一临时数据表无关联,则将所述目标数据存储至预设的第二临时数据表;
若基于所述第一临时数据表中经过异常标记的数据,确定所述目标数据与所述第一临时数据表有关联,则将所述目标数据存储至所述第一临时数据表,并对所述目标数据进行正常标记;
在预设的触发时刻,将存储于所述第二临时数据表中的所述目标数据存储至数据仓库,或者,将存储于所述第一临时数据表中且经过正常标记的所述目标数据存储至数据仓库。
5.一种数据存储装置,其特征在于,所述装置包括:
获取模块,用于获取目标源数据表中待存储的目标数据;
确定子模块,用于确定与所述目标源数据表有业务关联的参考源数据表;
第二获取子模块,用于获取与所述目标源数据表及所述参考源数据表匹配的业务关联规则;
第三获取子模块,用于基于所述目标数据及所述参考源数据表中的数据获取针对所述业务关联规则的目标指标;
第二检测子模块,用于按照所述业务关联规则验证所述目标指标,以对所述目标数据进行检测,得到检测结果;
修复模块,用于在所述检测结果指示所述目标数据异常时,针对所述目标数据执行预设的修复操作;
存储模块,用于在所述检测结果指示所述目标数据正常时,将所述目标数据存储至数据仓库。
6.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1-4中任一项所述的方法。
7.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述权利要求1-4中任一项所述的方法。
CN201810505103.1A 2018-05-24 2018-05-24 数据存储方法、装置及电子设备 Active CN108959374B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810505103.1A CN108959374B (zh) 2018-05-24 2018-05-24 数据存储方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810505103.1A CN108959374B (zh) 2018-05-24 2018-05-24 数据存储方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN108959374A CN108959374A (zh) 2018-12-07
CN108959374B true CN108959374B (zh) 2020-12-29

Family

ID=64499413

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810505103.1A Active CN108959374B (zh) 2018-05-24 2018-05-24 数据存储方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN108959374B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110262926B (zh) * 2019-06-05 2021-10-08 世纪龙信息网络有限责任公司 服务器的元数据修复方法、装置、系统和计算机设备
CN112363835A (zh) * 2020-11-11 2021-02-12 深圳供电局有限公司 一种基于网络大数据的智能资源调整方法及系统
CN112613892B (zh) * 2020-12-25 2024-03-15 北京知因智慧科技有限公司 基于业务系统的数据处理方法、装置以及电子设备
CN113049935A (zh) * 2021-03-04 2021-06-29 长鑫存储技术有限公司 半导体智能检测系统、智能检测方法及存储介质
CN116401681A (zh) * 2023-03-13 2023-07-07 濮阳职业技术学院 基于大数据的信息管理方法、可读存储介质及计算机设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103761156A (zh) * 2013-12-13 2014-04-30 北京同有飞骥科技股份有限公司 一种针对文件系统的在线修复方法
CN105574205A (zh) * 2016-01-18 2016-05-11 国家电网公司 分布式计算环境的日志动态分析系统
CN105700989A (zh) * 2016-01-13 2016-06-22 焦点科技股份有限公司 一种日志文件的异常检测与处理的方法与装置
CN107832336A (zh) * 2017-10-10 2018-03-23 北京京东尚科信息技术有限公司 数据处理方法及其系统

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020161778A1 (en) * 2001-02-24 2002-10-31 Core Integration Partners, Inc. Method and system of data warehousing and building business intelligence using a data storage model
US10585969B2 (en) * 2012-07-07 2020-03-10 Jianqing Wu System and method for extending database functions by a web application and computer readable media
CN103440701B (zh) * 2013-09-11 2015-09-23 广州广电运通金融电子股份有限公司 一种钞票的磁信号检测方法及装置
CN103716301A (zh) * 2013-12-04 2014-04-09 深圳市华傲数据技术有限公司 一种基于防火墙的数据修复方法及系统
CN104572999B (zh) * 2015-01-07 2020-02-07 北京数码大方科技股份有限公司 基于异构数据的错误数据的检测方法和装置
CN106708909B (zh) * 2015-11-18 2020-12-08 阿里巴巴集团控股有限公司 数据质量的检测方法和装置
CN105843695A (zh) * 2016-03-15 2016-08-10 深圳市凯立德科技股份有限公司 一种数据存储异常的处理方法、装置及设备
CN107908494B (zh) * 2017-11-10 2021-05-07 泰康保险集团股份有限公司 异常事件的处理方法、装置、电子设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103761156A (zh) * 2013-12-13 2014-04-30 北京同有飞骥科技股份有限公司 一种针对文件系统的在线修复方法
CN105700989A (zh) * 2016-01-13 2016-06-22 焦点科技股份有限公司 一种日志文件的异常检测与处理的方法与装置
CN105574205A (zh) * 2016-01-18 2016-05-11 国家电网公司 分布式计算环境的日志动态分析系统
CN107832336A (zh) * 2017-10-10 2018-03-23 北京京东尚科信息技术有限公司 数据处理方法及其系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
与源头提供的数据进行比较,修复报表特定维度的指标;zhyjtwgsnwxhn;《https://blog.csdn.net/zhyjtwgsnwxhn/article/details/54692751》;20170123;1-2页 *
基于日志分析的AAA服务状态监测系统设计与实现;罗伟;《中国优秀硕士学位论文全文数据库 信息科技辑》;20170315(第3期);I136-723页 *

Also Published As

Publication number Publication date
CN108959374A (zh) 2018-12-07

Similar Documents

Publication Publication Date Title
CN108959374B (zh) 数据存储方法、装置及电子设备
JP6782778B2 (ja) データ処理方法及び装置
US11244404B2 (en) VIN based insurance claim system
US10387236B2 (en) Processing data errors for a data processing system
EP3816916A1 (en) Method and device for storing merchant authentication data into blockchain, and method and device for obtaining merchant authentication data from blockchain
CN108647357B (zh) 数据查询的方法及装置
US20210049715A1 (en) Blockchain-based data procesing method, apparatus, and electronic device
US20120291014A1 (en) System and method for testing the development and updates in a test system using production/live data
CN109582550B (zh) 一种获取全量业务场景故障集合的方法、装置及服务器
US10824500B1 (en) Systems and methods for verifying vehicle identification number (VIN)
CN107578210B (zh) 合同审批流程的自动化测试方法及装置
US9208006B2 (en) Recovery Maturity Model (RMM) for readiness-based control of disaster recovery testing
US7647325B2 (en) Hardware and software identifier categorization and review
US11610160B2 (en) System for validated tracking and management of events associated with equipment during lifetime usage
CN107316176A (zh) 保单处理的控制方法和装置
CN103440460A (zh) 一种应用系统变更验证方法及验证系统
US7434132B2 (en) Method and system of configuring a software program
US11367045B2 (en) System for validated tracking of events associated with equipment during a resource arrangement
CN108876096A (zh) 一种数据处理方法、装置及相关设备
JP2001337846A (ja) ソフトウエア品質検査支援システム及び方法
US20190114597A1 (en) Methods for predictive estimation of repair lines based on historical data and devices thereof
CN111353833A (zh) 一种生成报表的方法和设备
CN105868099A (zh) 分支提交差异检测方法及装置
CN112488562B (zh) 一种业务实现方法及装置
CN113297053A (zh) 测试覆盖率的确定方法、装置和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant