CN113485988A - 一种数据质量监控方法、设备及计算机可读存储介质 - Google Patents
一种数据质量监控方法、设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN113485988A CN113485988A CN202110744952.4A CN202110744952A CN113485988A CN 113485988 A CN113485988 A CN 113485988A CN 202110744952 A CN202110744952 A CN 202110744952A CN 113485988 A CN113485988 A CN 113485988A
- Authority
- CN
- China
- Prior art keywords
- index
- target data
- data
- scoring
- quality
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000012544 monitoring process Methods 0.000 title claims abstract description 49
- 238000003860 storage Methods 0.000 title claims abstract description 14
- 238000013209 evaluation strategy Methods 0.000 claims description 36
- 238000004590 computer program Methods 0.000 claims description 27
- 238000004458 analytical method Methods 0.000 claims description 21
- 239000008280 blood Substances 0.000 claims description 12
- 210000004369 blood Anatomy 0.000 claims description 12
- 238000011156 evaluation Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 description 11
- 238000012806 monitoring device Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000013441 quality evaluation Methods 0.000 description 2
- 238000013523 data management Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000008021 deposition Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000001303 quality assessment method Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/254—Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/283—Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请适用于计算机技术领域,提供了一种数据质量监控方法、设备及计算机可读存储介质,所述方法包括:获取待监控的目标数据及其对应的目标数据层级;获取目标数据层级对应的目标数据质量评分策略;根据目标数据质量评分策略对目标数据进行质量评分,得到目标数据对应的质量评分结果。上述方法中,充分考虑数据仓库中不同层级数据的不同特性,针对不同层级的数据设计出适合它们特性的数据质量评分策略,根据不同层级数据对应的数据质量评分策略直接对目标数据进行质量评分,可以更有针对性、更准确的对数据质量进行监控,同时,将数据质量具体化为质量评分结果,进一步提升了数据质量的辨识度,用户可以更加直观的对数据质量进行监控。
Description
技术领域
本申请属于计算机技术领域,尤其涉及一种数据质量监控方法、设备及计算机可读存储介质。
背景技术
目前工业界的数据质量监控系统主要是面向数据仓库中所有的数据,但是,在进行数据质量监控时,并没有对数据仓库中的数据进行区分,所有的数据都是采用统一的质量评价标准。这样,在进行数据质量监控时,准确性比较低,并且不具有针对性,用户对于数据质量监控的结果也无法进行直观的判断。
发明内容
本申请实施例提供了一种数据质量监控方法、设备及计算机可读存储介质,可以解决上述问题。
第一方面,本申请实施例提供了一种数据质量监控方法,包括:
获取待监控的目标数据及其对应的目标数据层级;
获取所述目标数据层级对应的目标数据质量评分策略;
根据所述目标数据质量评分策略对所述目标数据进行质量评分,得到所述目标数据对应的质量评分结果。
进一步地,所述目标数据质量评分策略包括待评价指标及其对应的指标评价策略;
所述根据所述目标数据质量评分策略对所述目标数据进行质量评分,得到所述目标数据对应的评分结果,包括:
根据所述指标评价策略对所述目标数据进行质量评分,得到所述待评价指标对应的指标评分结果。
进一步地,所述指标评价策略包括待评价指标对应的维度信息及其对应的维度评分策略;
所述根据所述指标评价策略对所述目标数据进行质量评分,得到所述待评价指标对应的指标评分结果,包括:
根据所述维度评分策略确定所述维度信息对应的维度评分结果;
根据所述待评价指标对应的所有所述维度信息对应的维度评分结果,确定所述待评价指标对应的指标评分结果。
进一步地,所述目标数据质量评分策略包括待评价指标及其对应的指标评价策略和指标权重;
所述根据所述指标评价策略对所述目标数据进行质量评分,得到所述待评价指标对应的指标评分结果,包括:
根据所述指标评价策略和所述指标权重对所述目标数据进行质量评分,得到所述待评价指标对应的指标评分结果。
进一步地,所述待评价指标包括规范性指标、准确性指标、可用性指标、完整性指标、时效性指标、一致性指标中的一种或者多种。
进一步地,当所述目标数据层级为数据服务层时,所述待评价指标包括规范性指标,所述规范性指标对应的指标评价策略包括血缘关系维度及其对应的维度评分策略。
进一步地,在所述根据所述目标数据质量评分策略对所述目标数据进行质量评分,得到所述目标数据对应的质量评分结果之后,还包括:
对不同时刻对应的所述目标数据对应的质量评分结果进行分析,生成所述目标数据对应的目标层级分析报告。
进一步地,在所述根据所述目标数据质量评分策略对所述目标数据进行质量评分,得到所述目标数据对应的质量评分结果之后,还包括:
对不同目标数据层级对应的所述目标数据对应的质量评分结果进行分析,生成整体数据质量分析报告。
第二方面,本申请实施例提供了一种数据质量监控装置,包括:
第一获取单元,用于获取待监控的目标数据及其对应的目标数据层级;
第二获取单元,用于获取所述目标数据层级对应的目标数据质量评分策略;
处理单元,用于根据所述目标数据质量评分策略对所述目标数据进行质量评分,得到所述目标数据对应的质量评分结果。
进一步地,所述目标数据质量评分策略包括待评价指标及其对应的指标评价策略;
所述处理单元,具体用于:
根据所述指标评价策略对所述目标数据进行质量评分,得到所述待评价指标对应的指标评分结果。
进一步地,所述指标评价策略包括待评价指标对应的维度信息及其对应的维度评分策略;
所述处理单元,具体用于:
根据所述维度评分策略确定所述维度信息对应的维度评分结果;
根据所述待评价指标对应的所有所述维度信息对应的维度评分结果,确定所述待评价指标对应的指标评分结果。
进一步地,所述目标数据质量评分策略包括待评价指标及其对应的指标评价策略和指标权重;
所述处理单元,具体用于:
根据所述指标评价策略和所述指标权重对所述目标数据进行质量评分,得到所述待评价指标对应的指标评分结果。
进一步地,所述待评价指标包括规范性指标、准确性指标、可用性指标、完整性指标、时效性指标、一致性指标中的一种或者多种。
进一步地,当所述目标数据层级为数据服务层时,所述待评价指标包括规范性指标,所述规范性指标对应的指标评价策略包括血缘关系维度及其对应的维度评分策略。
进一步地,所述数据质量监控装置,还包括:
第一分析单元,用于对不同时刻对应的所述目标数据对应的质量评分结果进行分析,生成所述目标数据对应的目标层级分析报告。
进一步地,所述数据质量监控装置,还包括:
第二分析单元,用于对不同目标数据层级对应的所述目标数据对应的质量评分结果进行分析,生成整体数据质量分析报告。
第三方面,本申请实施例提供了一种数据质量监控设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的数据质量监控方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面所述的数据质量监控方法。
本申请实施例中,获取待监控的目标数据及其对应的目标数据层级;获取目标数据层级对应的目标数据质量评分策略;根据目标数据质量评分策略对目标数据进行质量评分,得到目标数据对应的质量评分结果。上述方法中,充分考虑数据仓库中不同层级数据的不同特性,针对不同层级的数据设计出适合它们特性的数据质量评分策略,根据不同层级数据对应的数据质量评分策略直接对目标数据进行质量评分,可以更有针对性、更准确的对数据质量进行监控,同时,将数据质量具体化为质量评分结果,进一步提升了数据质量的辨识度,用户可以更加直观的对数据质量进行监控。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请第一实施例提供的一种数据质量监控方法的示意图;
图2是本申请第一实施例提供的一种数据质量监控方法中目标层级分析报告的示意图;
图3是本申请第一实施例提供的一种数据质量监控方法中整体数据质量分析报告的示意图;
图4是本申请第二实施例提供的一种数据质量监控装置的示意图;
图5是本申请第三实施例提供的数据质量监控设备的示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
请参见图1,图1是本申请第一实施例提供的一种数据质量监控方法的示意流程图。本实施例中一种数据质量监控方法的执行主体为具有数据质量监控功能的设备,例如,服务器、台式电脑等等。如图1所示的数据质量监控方法可以包括:
S101:获取待监控的目标数据及其对应的目标数据层级。
在本实施例中,建立数仓项目时,可以对数据进行分层,每一个数据分层都有它的作用域,这样在使用表的时候能更方便地定位和理解。而且便于维护数据的准确性,当数据出现问题之后,可以不用修复所有的数据,只需要从有问题的步骤开始修复。
数据分层时可以根据业务需求分成不同的层次,例如,可以将数据分为四个基础层,数据运营层(ODS层)、数据明细层(DWD层)、数据汇总层(DWS层)和数据服务层(ADS层)。基于这个基础分层之上添加新的层次,来满足不同的业务需求。
其中,ODS层是最接近数据源中数据的一层,数据源中的数据,经过抽取、洗净、传输,也就说传说中的ETL之后,装入ODS层。本层的数据,总体上大多是按照源头业务系统的分类方式而分类的。ODS层是数据仓库准备区,为DWD层提供基础原始数据,可减少对业务系统的影响。
DWD层为DW层提供来源明细数据,提供业务系统细节数据的长期沉淀,为未来分析类需求的扩展提供历史数据支撑。
DWS层为DW、ST层提供细粒度数据。
ADS层主要是提供数据产品和数据分析使用的数据,一般会存放在ES、MySQL等系统中供线上系统使用,也可能会存在Hive或者Druid中供数据分析和数据挖掘使用。
可见,不同的数据层级中的数据是具有不同的特征的,在实施本申请中的数据质量监控方法时,设备可以先获取待监控的目标数据及其对应的目标数据层级。其中,待监控的目标数据可以包括多个目标数据层级中的数据,例如,目标数据包括数据运营层中的数据和数据仓库层对应的数据。
其中,目标数据是从数仓各层数据表中获取的,数仓各层数据表为ODS层级、DWD层级、DWS层级、ADS层级的数据表以及其基础信息,基础信息包括表所属层级、表所属域、表名、责任人、生命周期、数据质量总分等等。数据表的详细内容为表中详细存放的信息。
S102:获取所述目标数据层级对应的目标数据质量评分策略。
考虑到不同数据层级中数据具有不同的特征,所以不能采用统一的标准去评价不同数据层级中的数据,举例来说,对于数据表的备注,对于ODS层的数据表来说,就算其备注信息非常模糊,但对数据质量的影响也是非常有限的。但是对于DWD层或者DWS层数据来说,表备注信息意味着使用者了解该表的生成规则,以及用途,适合什么场景,所以表备注信息对于该层数据来说非常重要,对该层数据的数据质量影响很大。
所以,为了更具有针对性的对数据进行质量监控,本实施例中,不同的数据层级需要采用不同的数据质量评分策略。设备获取到目标数据层级后,需要获取目标数据层级对应的目标数据质量评分策略。数据质量评分策略用于对目标数据层级对应的目标数据进行评分,在评分时,数据质量评分策略中可以设置根据目标数据的基础信息进行评分,基础信息可以包括但并不限于创建时间、数据层级、指标名称、规则名称、满足得分值、指标阈值、规则阈值、指标占比、规则类型、最后一次修改时间、最后一次修改人名称、是否启动。
一种实施方式中,本实施例中的数据质量监控方法可以自动实施,设备中可以预先存储数据层级和数据质量评分策略之间的对应关系,设备获取目标数据层级后,自动获取预先设置好的目标数据层级对应的目标数据质量评分策略,根据目标数据质量评分策略对目标数据进行评分。
另一种实施方式中,本实施例中的数据质量监控方法可以通过用户的操作触发实施,即用户进行手动监控,这样,用户可以根据不同的需求对数据质量评分策略进行设置,根据用户的设置确定目标数据层级对应的目标数据质量评分策略,根据目标数据质量评分策略对目标数据进行评分。
S103:根据所述目标数据质量评分策略对所述目标数据进行质量评分,得到所述目标数据对应的质量评分结果。
设备根据目标数据质量评分策略对目标数据进行质量评分,得到目标数据对应的质量评分结果。具体来说,设备可以根据目标数据质量评分策略中包含的各种条件对目标数据进行质量评分,判断目标数据的质量;设备也可以根据目标数据质量评分策略中包含的各种维度信息对目标数据进行质量评分,从各个维度判断目标数据的质量。这里对于质量评分的方法不做限制。
一种实施方式中,目标数据质量评分策略包括待评价指标及其对应的指标评价策略;在设备根据目标数据质量评分策略对目标数据进行质量评分时可以根据指标评价策略对目标数据进行质量评分,得到待评价指标对应的指标评分结果。
其中,待评价指标为针对目标数据的评价指标,通过待评价指标,可以从多个角度全方位的评价目标数据的质量。待评价指标包括规范性指标、准确性指标、可用性指标、完整性指标、时效性指标、一致性指标中的一种或者多种。不同的数据层级的待评价指标可以不同,具体可以根据数据层级中的数据的特征来进行设置。例如,ODS层的待评价指标可以包括规范性指标、准确性指标、完整性指标、时效性指标;ADS层的待评价指标可以包括规范性指标;DWS层的待评价指标可以包括规范性指标、准确性指标、完整性指标、时效性指标和可用性指标。
设备根据指标评价策略对目标数据进行质量评分,可以得到各个待评价指标对应的分数,即,得到待评价指标对应的指标评分结果。
其中,指标评价策略中可以包括待评价指标对应的维度信息及其对应的维度评分策略;在设备根据指标评价策略对所述目标数据进行质量评分时,设备可以根据维度评分策略确定维度信息对应的维度评分结果;根据待评价指标对应的所有维度信息对应的维度评分结果,确定待评价指标对应的指标评分结果。
在本实施例中,每个待评价指标都可以从不同的维度进行评价,不同的待评价指标对应了不同的维度信息,每个维度信息都对应了维度评分策略,设备可以通过维度评分策略确定维度信息对应的维度评分结果。然后,根据待评价指标对应的所有的维度信息对应的维度评分结果来确定该待评价指标对应的指标评分结果。
举例来说,如下表所示,ODS层的待评价指标可以包括规范性指标、准确性指标、完整性指标、时效性指标,规范性指标对应的维度信息包括数据标准、元数据文档、业务规则;准确性指标对应的维度信息包括数据格式合规性、数据重复率。表中每个维度信息后对应的表述即为维度评分策略。
一种实施方式中,所述目标数据质量评分策略包括待评价指标及其对应的指标评价策略和指标权重;设备根据指标评价策略对所述目标数据进行质量评分时,可以根据指标评价策略和指标权重对目标数据进行质量评分,得到所述待评价指标对应的指标评分结果。本实施中,不同数据层级的数据引入不同的指标权重,也可以对不同同数据层级的数据进行特征的区分,更有针对性的对数据质量进行监控。
此外,本实施例中,引入数据血缘关系作为质量监控的维度信息。数据的血缘关系其实也是影响数据质量非常重要的一个维度信息,当目标数据层级为数据服务层时,待评价指标包括规范性指标,规范性指标对应的指标评价策略包括血缘关系维度及其对应的维度评分策略。本实施例中,数据血缘关系需要做到非常明晰,数据链路需要自上往下,无论是需要全链路监控还是删除。
本实施例中,还可以获取目标数据在不同时刻的质量评分结果,例如,获取目标数据近十天内每天下午四点时的质量评分结果。设备对不同时刻对应的目标数据对应的质量评分结果进行分析,生成目标数据对应的目标层级分析报告。其中,分析的方法这里也不做限制,目标层级分析报告根据分析方法确定形式,如图2所示,可以为折线图,饼状图等等。
此外,设备还可以获取不同目标数据层级对应的目标数据对应的质量评分结果,对不同目标数据层级对应的目标数据对应的质量评分结果进行分析,生成整体数据质量分析报告。如图3所示,图3为整体数据质量分析报告的一种示意图。
本申请实施例中,获取待监控的目标数据及其对应的目标数据层级;获取目标数据层级对应的目标数据质量评分策略;根据目标数据质量评分策略对目标数据进行质量评分,得到目标数据对应的质量评分结果。上述方法中,充分考虑数据仓库中不同层级数据的不同特性,针对不同层级的数据设计出适合它们特性的数据质量评分策略,根据不同层级数据对应的数据质量评分策略直接对目标数据进行质量评分,可以更有针对性、更准确的对数据质量进行监控,同时,将数据质量具体化为质量评分结果,进一步提升了数据质量的辨识度,用户可以更加直观的对数据质量进行监控。
此外,本实施例中使用到的数据质量考核维度更多,以及引入质量评分的概念,有效的解决了数据表质量问题发现不及时、数据质量感知度低、数据治理无从下手等一系列问题。让用户清晰的感知到数据表什么维度出了问题,让用户针对性的对数据表进行治理,提升数据质量。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
请参见图4,图4是本申请第二实施例提供的数据质量监控装置的示意图。包括的各单元用于执行图1对应的实施例中的各步骤。具体请参阅图1对应的实施例中的相关描述。为了便于说明,仅示出了与本实施例相关的部分。参见图4,数据质量监控装置4包括:
第一获取单元410,用于获取待监控的目标数据及其对应的目标数据层级;
第二获取单元420,用于获取所述目标数据层级对应的目标数据质量评分策略;
处理单元430,用于根据所述目标数据质量评分策略对所述目标数据进行质量评分,得到所述目标数据对应的质量评分结果。
进一步地,所述目标数据质量评分策略包括待评价指标及其对应的指标评价策略;
所述处理单元430,具体用于:
根据所述指标评价策略对所述目标数据进行质量评分,得到所述待评价指标对应的指标评分结果。
进一步地,所述指标评价策略包括待评价指标对应的维度信息及其对应的维度评分策略;
所述处理单元430,具体用于:
根据所述维度评分策略确定所述维度信息对应的维度评分结果;
根据所述待评价指标对应的所有所述维度信息对应的维度评分结果,确定所述待评价指标对应的指标评分结果。
进一步地,所述目标数据质量评分策略包括待评价指标及其对应的指标评价策略和指标权重;
所述处理单元430,具体用于:
根据所述指标评价策略和所述指标权重对所述目标数据进行质量评分,得到所述待评价指标对应的指标评分结果。
进一步地,所述待评价指标包括规范性指标、准确性指标、可用性指标、完整性指标、时效性指标、一致性指标中的一种或者多种。
进一步地,当所述目标数据层级为数据服务层时,所述待评价指标包括规范性指标,所述规范性指标对应的指标评价策略包括血缘关系维度及其对应的维度评分策略。
进一步地,所述数据质量监控装置4,还包括:
第一分析单元,用于对不同时刻对应的所述目标数据对应的质量评分结果进行分析,生成所述目标数据对应的目标层级分析报告。
进一步地,所述数据质量监控装置4,还包括:
第二分析单元,用于对不同目标数据层级对应的所述目标数据对应的质量评分结果进行分析,生成整体数据质量分析报告。
图5是本申请第三实施例提供的数据质量监控设备的示意图。如图5所示,该实施例的数据质量监控设备5包括:处理器50、存储器51以及存储在所述存储器51中并可在所述处理器50上运行的计算机程序52,例如数据质量监控程序。所述处理器50执行所述计算机程序52时实现上述各个数据质量监控方法实施例中的步骤,例如图1所示的步骤101至103。或者,所述处理器50执行所述计算机程序52时实现上述各装置实施例中各模块/单元的功能,例如图4所示模块410至430的功能。
示例性的,所述计算机程序52可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器51中,并由所述处理器50执行,以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序52在所述数据质量监控设备5中的执行过程。例如,所述计算机程序52可以被分割成第一获取单元、第二获取单元、处理单元,各单元具体功能如下:
第一获取单元,用于获取待监控的目标数据及其对应的目标数据层级;
第二获取单元,用于获取所述目标数据层级对应的目标数据质量评分策略;
处理单元,用于根据所述目标数据质量评分策略对所述目标数据进行质量评分,得到所述目标数据对应的质量评分结果。
所述数据质量监控设备可包括,但不仅限于,处理器50、存储器51。本领域技术人员可以理解,图5仅仅是数据质量监控设备5的示例,并不构成对数据质量监控设备5的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述数据质量监控设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器50可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器51可以是所述数据质量监控设备5的内部存储单元,例如数据质量监控设备5的硬盘或内存。所述存储器51也可以是所述数据质量监控设备5的外部存储设备,例如所述数据质量监控设备5上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述数据质量监控设备5还可以既包括所述数据质量监控设备5的内部存储单元也包括外部存储设备。所述存储器51用于存储所述计算机程序以及所述数据质量监控设备所需的其他程序和数据。所述存储器51还可以用于暂时地存储已经输出或者将要输出的数据。
需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
本申请实施例还提供了一种网络设备,该网络设备包括:至少一个处理器、存储器以及存储在所述存储器中并可在所述至少一个处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意各个方法实施例中的步骤。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。
本申请实施例提供了一种计算机程序产品,当计算机程序产品在移动终端上运行时,使得移动终端执行时实现可实现上述各个方法实施例中的步骤。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/网络设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/网络设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (10)
1.一种数据质量监控方法,其特征在于,包括:
获取待监控的目标数据及其对应的目标数据层级;
获取所述目标数据层级对应的目标数据质量评分策略;
根据所述目标数据质量评分策略对所述目标数据进行质量评分,得到所述目标数据对应的质量评分结果。
2.如权利要求1所述的数据质量监控方法,其特征在于,所述目标数据质量评分策略包括待评价指标及其对应的指标评价策略;
所述根据所述目标数据质量评分策略对所述目标数据进行质量评分,得到所述目标数据对应的评分结果,包括:
根据所述指标评价策略对所述目标数据进行质量评分,得到所述待评价指标对应的指标评分结果。
3.如权利要求2所述的数据质量监控方法,其特征在于,所述指标评价策略包括待评价指标对应的维度信息及其对应的维度评分策略;
所述根据所述指标评价策略对所述目标数据进行质量评分,得到所述待评价指标对应的指标评分结果,包括:
根据所述维度评分策略确定所述维度信息对应的维度评分结果;
根据所述待评价指标对应的所有所述维度信息对应的维度评分结果,确定所述待评价指标对应的指标评分结果。
4.如权利要求1所述的数据质量监控方法,其特征在于,所述目标数据质量评分策略包括待评价指标及其对应的指标评价策略和指标权重;
所述根据所述指标评价策略对所述目标数据进行质量评分,得到所述待评价指标对应的指标评分结果,包括:
根据所述指标评价策略和所述指标权重对所述目标数据进行质量评分,得到所述待评价指标对应的指标评分结果。
5.如权利要求2-4任一项所述的数据质量监控方法,其特征在于,所述待评价指标包括规范性指标、准确性指标、可用性指标、完整性指标、时效性指标、一致性指标中的一种或者多种。
6.如权利要求5所述的数据质量监控方法,其特征在于,当所述目标数据层级为数据服务层时,所述待评价指标包括规范性指标,所述规范性指标对应的指标评价策略包括血缘关系维度及其对应的维度评分策略。
7.如权利要求1所述的数据质量监控方法,其特征在于,在所述根据所述目标数据质量评分策略对所述目标数据进行质量评分,得到所述目标数据对应的质量评分结果之后,还包括:
对不同时刻对应的所述目标数据对应的质量评分结果进行分析,生成所述目标数据对应的目标层级分析报告。
8.如权利要求1所述的数据质量监控方法,其特征在于,在所述根据所述目标数据质量评分策略对所述目标数据进行质量评分,得到所述目标数据对应的质量评分结果之后,还包括:
对不同目标数据层级对应的所述目标数据对应的质量评分结果进行分析,生成整体数据质量分析报告。
9.一种的数据质量监控设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至8任一项所述的方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至8任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110744952.4A CN113485988A (zh) | 2021-06-30 | 2021-06-30 | 一种数据质量监控方法、设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110744952.4A CN113485988A (zh) | 2021-06-30 | 2021-06-30 | 一种数据质量监控方法、设备及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113485988A true CN113485988A (zh) | 2021-10-08 |
Family
ID=77939119
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110744952.4A Pending CN113485988A (zh) | 2021-06-30 | 2021-06-30 | 一种数据质量监控方法、设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113485988A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114490590A (zh) * | 2022-02-16 | 2022-05-13 | 平安科技(深圳)有限公司 | 数据仓库质量评价方法、装置、电子设备及存储介质 |
CN114610702A (zh) * | 2022-03-15 | 2022-06-10 | 云粒智慧科技有限公司 | 数据治理过程的实时质量管控方法、装置、设备及介质 |
CN116450632A (zh) * | 2023-04-18 | 2023-07-18 | 北京卫星信息工程研究所 | 地理样本数据质量评估方法、设备及存储介质 |
CN117151438A (zh) * | 2023-10-31 | 2023-12-01 | 思创数码科技股份有限公司 | 一种数据共享质量分析方法、系统、计算机及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20130126041A (ko) * | 2012-05-10 | 2013-11-20 | 안선주 | 상세임상모델의 질 평가도구, 평가도구 개발 방법 및 그 평가 방법 |
CN108804323A (zh) * | 2018-06-06 | 2018-11-13 | 中国平安人寿保险股份有限公司 | 代码质量监控方法、设备及存储介质 |
CN112348695A (zh) * | 2020-09-16 | 2021-02-09 | 贵州电网有限责任公司 | 一种基于层次分析法的电力数据质量评价模型构建方法 |
-
2021
- 2021-06-30 CN CN202110744952.4A patent/CN113485988A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20130126041A (ko) * | 2012-05-10 | 2013-11-20 | 안선주 | 상세임상모델의 질 평가도구, 평가도구 개발 방법 및 그 평가 방법 |
CN108804323A (zh) * | 2018-06-06 | 2018-11-13 | 中国平安人寿保险股份有限公司 | 代码质量监控方法、设备及存储介质 |
CN112348695A (zh) * | 2020-09-16 | 2021-02-09 | 贵州电网有限责任公司 | 一种基于层次分析法的电力数据质量评价模型构建方法 |
Non-Patent Citations (1)
Title |
---|
程大庆等: ""数据仓库数据质量的治理及体系构建"", 《中国金融电脑》, no. 6, 30 June 2011 (2011-06-30), pages 29 - 33 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114490590A (zh) * | 2022-02-16 | 2022-05-13 | 平安科技(深圳)有限公司 | 数据仓库质量评价方法、装置、电子设备及存储介质 |
CN114610702A (zh) * | 2022-03-15 | 2022-06-10 | 云粒智慧科技有限公司 | 数据治理过程的实时质量管控方法、装置、设备及介质 |
CN116450632A (zh) * | 2023-04-18 | 2023-07-18 | 北京卫星信息工程研究所 | 地理样本数据质量评估方法、设备及存储介质 |
CN116450632B (zh) * | 2023-04-18 | 2023-12-19 | 北京卫星信息工程研究所 | 地理样本数据质量评估方法、设备及存储介质 |
CN117151438A (zh) * | 2023-10-31 | 2023-12-01 | 思创数码科技股份有限公司 | 一种数据共享质量分析方法、系统、计算机及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113485988A (zh) | 一种数据质量监控方法、设备及计算机可读存储介质 | |
US10719767B2 (en) | Computer implemented system for automating the generation of a business decision analytic model | |
US9015118B2 (en) | Determining and presenting provenance and lineage for content in a content management system | |
CN116414815A (zh) | 数据质量检测方法、装置、计算机设备和存储介质 | |
CN108470071A (zh) | 一种数据处理方法及装置 | |
CN113360548A (zh) | 基于数据资产分析的数据处理方法、装置、设备及介质 | |
CN114971891A (zh) | 风险预测方法和装置、处理器及电子设备 | |
CN114840531A (zh) | 基于血缘关系的数据模型重构方法、装置、设备及介质 | |
CN118053125A (zh) | 一种工程进度可视化图像监督方法、装置、设备及介质 | |
CN116823464B (zh) | 数据资产管理平台、电子设备及计算机可读存储介质 | |
CN110858368A (zh) | 一种数据评估服务价值确定系统和方法 | |
CN110704620B (zh) | 一种基于知识图谱的识别相同实体的方法及装置 | |
CN117114412A (zh) | 一种用于危险化学品生产企业的安全预控方法及装置 | |
CN111625720A (zh) | 数据决策项目执行策略的确定方法、装置、设备和介质 | |
CN113780906A (zh) | 机台管理方法、装置及计算机可读存储介质 | |
CN114331740A (zh) | 产业图谱大数据分析及扫描的数字化投资价值管理方法 | |
CN111026705B (zh) | 建筑工程文件管理方法、系统及终端设备 | |
CN113344333A (zh) | 一种可配置的企业征信预警方法、装置、设备及存储介质 | |
CN114004629A (zh) | 数据分析的方法及装置 | |
CN111552814A (zh) | 基于考核指标图谱的考核方案生成方法及装置 | |
CN111813880A (zh) | 一种国土空间规划项目管理方法、系统及存储介质 | |
CN114997123B (zh) | 一种检查企业的方法、装置、电子设备及存储介质 | |
CN117077150B (zh) | 分布式学校资源的信息安全调度预警系统及方法 | |
CN114118619A (zh) | 一种存款利率确定方法、装置、设备及可读存储介质 | |
CN118260354A (zh) | 一种车辆数据检测系统和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |