CN105844390B - 一种数据质量追溯的方法及其装置以及硬件处理器 - Google Patents

一种数据质量追溯的方法及其装置以及硬件处理器 Download PDF

Info

Publication number
CN105844390B
CN105844390B CN201610160404.6A CN201610160404A CN105844390B CN 105844390 B CN105844390 B CN 105844390B CN 201610160404 A CN201610160404 A CN 201610160404A CN 105844390 B CN105844390 B CN 105844390B
Authority
CN
China
Prior art keywords
data
data processing
processing task
determining
blood
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610160404.6A
Other languages
English (en)
Other versions
CN105844390A (zh
Inventor
刘宏斌
国铁龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Zhirong Innovation Technology Development Co ltd
Original Assignee
Tianjin Zhirong Innovation Technology Development Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Zhirong Innovation Technology Development Co ltd filed Critical Tianjin Zhirong Innovation Technology Development Co ltd
Priority to CN201610160404.6A priority Critical patent/CN105844390B/zh
Publication of CN105844390A publication Critical patent/CN105844390A/zh
Application granted granted Critical
Publication of CN105844390B publication Critical patent/CN105844390B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明实施例提供一种数据质量追溯的方法及其装置以及硬件处理器,属于计算机应用技术领域。其中数据质量追溯的方法包括:获取数据处理任务并对所述数据处理任务进行分析;根据所述数据处理任务的分析结果,生成血缘分析图;根据所述血缘分析图,确定出现数据质量问题所在。本发明实施例中,一旦出现数据质量问题,就会在血缘分析图上有客观显现的体现,因此,上述整个过程通过血缘分析图即可直接客观的确定出数据质量的问题所在,定位问题效率高、速度快。

Description

一种数据质量追溯的方法及其装置以及硬件处理器
技术领域
本发明实施例涉及计算机应用技术领域,尤其涉及一种数据质量追溯的方法及其装置以及硬件处理器。
背景技术
当前,IT系统大而集中,且随着业务的不断发展壮大,需要管理和运维的数据也是越来越多、同时各种各样的数据模型也是越来越复杂。目前,面对越来越庞大的数据,数据的有效管理和数据的质量是数据相关工程中最常见也是最难处理的问题。
现有的数据质量管理中很难给出高效的方式追溯数据质量的问题。目前常见处理方式是凭借个人经验判断有可能出现问题的点,然后根据其数据处理过程逐个查看,同时分析每个过程中数据处理的逻辑,从而判断是否有数据质量的问题。
但是,由于现有技术的上述整个过程都是人工处理,工作效率和问题解决的成功率较低。
发明内容
本发明实施例提供一种数据质量问题追溯的方法及其装置以及硬件处理器,可以解决现有技术中出现数据质量问题时的处理方法效率低的技术问题。
本发明实施例提供了一种数据质量问题追溯的方法及其装置以及硬件处理器,其中:
一种数据质量追溯的方法,其包括:
获取数据处理任务并对所述数据处理任务进行分析;
根据所述数据处理任务的分析结果,生成血缘分析图;
根据所述血缘分析图,确定出现数据质量问题所在。
优选地,在本发明一实施例中,所述对所述数据处理任务进行分析包括:
确定所述数据处理任务涉及到的数据单元,以及所述数据处理任务的数据流向关系。
优选地,在本发明一实施例中,所述根据对所述数据处理任务的分析结果,生成血缘分析图包括:
根据所述数据处理任务涉及到的数据单元,以及所述数据处理任务的数据流向关系生成有向图,所述有向图作为血缘分析图。
优选地,在本发明一实施例中,所述根据所述数据处理任务涉及的数据单元,以及所述数据处理任务的数据流向关系生成有向图包括:
根据所述数据处理任务涉及的数据单元,确定所述有向图的节点;
根据所述数据处理任务的数据流向关系,确定所述有向图的有向边,所述有向边的两端分别连接所述有向图中的上一个节点和下一个节点。
优选地,在本发明一实施例中,根据所述血缘分析图,确定出现数据质量问题所在包括:
根据所述血缘分析图,确定出现数据质量问题的数据单元;
和/或
根据所述血缘分析图,确定对出现数据质量问题的数据单元有影响的数据处理任务,以及对出现数据质量问题的数据单元有影响的其他数据单元;
和/或
根据所述血缘分析图,确定受所述出现数据质量问题的数据单元影响的的数据处理任务,以及受所述出现数据质量问题影响的其他数据单元。
一种数据质量追溯的装置,其包括:
分析模块,用于获取数据处理任务并对所述数据处理任务进行分析;
血缘分析图生成模块,用于根据对所述数据处理任务的分析结果,生成血缘分析图;
问题确定模块,用于根据所述血缘分析图,确定出现数据质量问题的问题所在。
优选地,在本发明一实施例中,所述分析模块进一步用于确定所述数据处理任务涉及到的数据单元,以及所述数据处理任务的数据流向关系。
优选地,在本发明一实施例中,所述血缘分析图生成模块进一步用于根据所述数据处理任务涉及到的数据单元,以及所述数据处理任务的数据流向关系,生成血缘分析图。
优选地,在本发明一实施例中,所述血缘分析图生成模块进一步用于根据所述数据处理任务涉及的数据单元,以及所述数据处理任务的数据流向关系生成有向图,所述有向图做为所述血缘分析图。
优选地,在本发明一实施例中,所述血缘分析图生成模块包括:
节点确定子模块,用于根据所述数据处理任务涉及的数据单元,确定所述有向图的节点;
有向边确定子模块,用于根据所述数据处理任务的数据流向关系,确定所述有向图的有向边,所述有向边的两端分别连接所述有向图中的上一个节点和下一个节点。
优选地,在本发明一实施例中,所述问题确定模块进一步用于根据所述血缘分析图,确定出现数据质量问题的数据单元;
和/或
所述问题确定模块进一步用于根据所述血缘分析图,确定对出现数据质量问题的数据单元有影响的数据处理任务,以及对出现数据质量问题的数据单元有影响的其他数据单元;
和/或
所述问题确定模块进一步用于根据所述血缘分析图,确定受所述出现数据质量问题的数据单元影响的的数据处理任务,以及受所述出现数据质量问题影响的其他数据单元。
一种与数据质量追溯装置结合使用的硬件处理器,所述硬件处理器包括执行以下步骤的指令:
获取数据处理任务并对所述数据处理任务进行分析;
根据所述数据处理任务的分析结果,生成血缘分析图;
根据所述血缘分析图确定出现数据质量问题的所在。
本发明实施例中,由于可以自动获取数据处理任务,并进一步对数据处理任务进行解析,根据对所述数据处理任务的分析结果生成血缘分析图,进而根据所述血缘分析图确定出现数据质量问题的所在。即根据本实施例所公开的技术方案,一旦出现数据质量问题,就会在血缘分析图上有客观显现的体现,因此,上述整个过程通过血缘分析图即可直接客观的确定出数据质量的问题所在,无须人工参与,摆脱了人工的主观因素影响,所以定位问题效率高、速度快。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种数据质量追溯的方法实施例的流程图;
图2为本发明一种数据质量追溯的方法实施例所揭示的血缘分析图的结构示意图;
图3为本发明一种数据质量追溯的装置实施例的结构示意图;
图4为本发明实施例血缘分析图生成模块结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,本发明一种数据质量追溯的方法实施例的流程图。本发明实施例提供的一种数据质量追溯的方法,包括:
步骤11,获取数据处理任务并对所述数据处理任务进行分析;
步骤12,根据所述数据处理任务的分析结果,生成血缘分析图;
步骤13,根据所述血缘分析图确定出现数据质量问题的所在。
本实施例中,血缘分析图上可以反映出数据处理任务涉及的各对象以及对象间的关系,比如对于运维管理来说,作为对象的数据单元以及数组单元之间信号的流向关系。
优选地,所述获取数据处理任务并对所述数据处理任务进行分析包括:
确定所述数据处理任务涉及到的数据单元,及所述所述数据处理任务的数据流向关系。
其中,所述数据单元在不同的存储媒介中的体现是不一样的,一般数据处理任务的输出目标可以作为一个数据单元,所述数据单元可以作为数据的源,也可以作为数据处理的数据目标。
本实施例中,为了减少数据处理的任务量,提高准确性,进一步实现数据质量问题的快速定位,在步骤11之前还可以按照设定的规则进行全部或者部分清洗和转换,清洗和转换的对象包括:数据单元及数据处理任务。清洗的规则可以是:筛选出需要的数据单元和数据处理任务、筛选掉不需要的数据单元和数据处理任务,比如有三个运维管理的对象系统A、B、C,但是,只有对象系统A是上述实施例实际的处理对象,因此,需要把系统B和C的数据单元和数据处理任务清除掉。转换则是根据设定的规则将数据单元、数据处理任务进行转换,相当于标准化处理,比如在不同的系统,同一对象用不同的描述进行定义,比如“性别”,在A系统中可能有“男”“女”定义,而在B系统中有“female”“male”定义,因此,转换即为将所有“性别”统一定义为“男”“女”或者“female”“male”。
下面举例进行说明:
举例1:在关系型数据库中,所述关系型数据表中的每一个单元格均可以作为一个数据单元。
举例2:在前端展现中,报表也可以作为一个数据单元。
所述数据处理任务可以是一个数据加工的过程。所述数据加工的过程可以是从源加载数据,然后进行加工,最后将加工的结果输出到目标。每一个数据单元可对应有输入和输出,对数据进行处理之后的保存可以是一个输出,当然也可以有其他形式的输出,输入和输出可以是一个,也可以是多个。
优选地,由于有向图可以表现出数据间的关系,因此,可以将有向图直接作为血缘分析图的具体实现形式。因此,上述实施例中,步骤13中所述根据对所述数据处理任务的分析结果,生成血缘分析图可以包括:
根据所述数据处理任务涉及到的数据单元,以及所述数据处理任务的数据流向关系生成有向图,所述有向图作为血缘分析图。
优选地,在构建有向图时,即所述根据所述数据处理任务涉及的数据单元,以及所述数据处理任务的数据流向关系生成有向图可以包括:
步骤131、根据所述数据处理任务涉及的数据单元,确定所述有向图的节点;
具体地,可以直接将数据单元作为有向图中的节点。
步骤132、根据所述数据处理任务的数据流向关系,确定所述有向图的有向边,所述有向边的两端分别连接所述有向图中的上一个节点和下一个节点。
具体地,可以将数据流向作为有向图的边即有像边。
优选地,根据所述血缘分析图,确定出现数据质量问题所在包括下述情况中的任一一种或多种的组合:
(1)根据所述血缘分析图,确定出现数据质量问题的数据单元;
(2)根据所述血缘分析图,确定导致所述数据单元出现数据质量问题的数据处理任务。
(3)根据所述血缘分析图,确定对出现数据质量问题的数据单元有影响的数据处理任务,以及对出现数据质量问题的数据单元有影响的其他数据单元;
(4)根据所述血缘分析图,确定受所述出现数据质量问题的数据单元影响的的数据处理任务,以及受所述出现数据质量问题影响的其他数据单元。
本实施例中,由于可以自动获取数据处理任务,并进一步对数据处理任务进行解析,根据对所述数据处理任务的分析结果生成血缘分析图,进而根据所述血缘分析图确定出现数据质量问题的所在。即根据本实施例所公开的技术方案,一旦出现数据质量问题,就会在血缘分析图上有客观显现的体现,因此,上述整个过程通过血缘分析图即可直接客观的确定出数据质量的问题所在,无须人工参与,摆脱了人工的主观因素影响,所以定位问题效率高、速度快。
如图2所示,本发明一种数据质量追溯的方法实施例所揭示的血缘分析图的结构示意图。血缘分析图的生成过程,请参考图2,以5个数据单元参与血缘分析图生成为例。本实施例中,根据所述数据处理任务的逻辑以及所述数据处理任务的输入源和输出目标确定出所有数据单元的数据流向。
本实施例中,所有分析出来的结果可以形成一个有向图,其中所述数据单元可以作为所述有向图的节点,其中,所述节点包括数据单元01至数据单元05;所述数据处理任务作为所述有向图的边,其中,所述有向图的边的两端分别连接上一个节点和下一个节点,即上一个数据单元、下一个数据单元,每一个数据处理任务可以是所述有向图中多个节点的边,例如边01'是数据单元01的输出边,边02'是数据单元02的输出边,与此同时边01'和边02'又是数据单元03的两条输入边,边03和边03'是数据单元03的两条输出边,与此同时边03和边03'分别是数据单元04和数据单元05的输入边。
当确定图2中的数据单元03出现数据质量问题时,根据图2所示的血缘分析图可知,能够影响所述出现数据质量问题的数据单元03的数据单元包括:所述数据单元01和所述数据单元02,能够影响所述出现数据质量问题的数据单元03的数据处理任务包括:边01'和边02';同时,根据所述血缘分析图能够确定所有被所述出现数据质量问题的数据单元03所影响的数据单元包括:数据单元04和数据单元05,从而能够确定所有被所述出现数据质量问题的数据单元03所影响的数据处理任务包括:边03'和边04'。在确定所有影响所述出现数据质量问题的数据单元的数据单元和数据处理任务和所有被所述出现数据质量问题的数据单元所影响的数据单元和数据处理任务之后,可以逐个进行修复。
需要说明的是,在初次生成血缘分析图时,也可以执行上述清洗和转换过程,以更为精确和快速的确定出出现数据质量问题的所在。
请参考图3,本发明一种数据质量追溯的装置实施例的结构示意图。本实施例中,数据质量追溯的装置包括分析模块31、血缘分析图生成模块32和问题确定模块33,其中:
所述分析模块31用于获取数据处理任务并对所述数据处理任务进行分析;
所述血缘分析图生成模块32用于根据对所述数据处理任务的分析结果,生成血缘分析图;
所述问题确定模块33用于根据所述血缘分析图,确定出现数据质量问题的问题所在。
优选地,在实施例中,所述分析模块31可以进一步用于确定所述数据处理任务涉及到的数据单元,以及所述数据处理任务的数据流向关系。
优选地,在本实施例中,所述血缘分析图生成模块32可以进一步用于根据所述数据处理任务涉及到的数据单元,以及所述数据处理任务的数据流向关系,生成血缘分析图。
具体地,本实施例中,所述血缘分析图生成模块32可以进一步用于根据所述数据处理任务涉及的数据单元,以及所述数据处理任务的数据流向关系生成有向图,所述有向图做为所述血缘分析图。
优选地,本实施例中,所述问题确定模块33进一步可以用于根据所述血缘分析图,确定出现数据质量问题的数据单元和/或导致所述数据单元出现数据质量问题的数据处理任务。
进一步地,本实施例中,所述问题确定模块33进一步还可以用于根据所述血缘分析图,确定对出现数据质量问题的数据单元有影响的数据处理任务,以及对出现数据质量问题的数据单元有影响的其他数据单元;和/或
所述问题确定模块33进一步还可以用于根据所述血缘分析图,确定受所述出现数据质量问题的数据单元影响的的数据处理任务,以及受所述出现数据质量问题影响的其他数据单元。
本实施例中,在实现上述分析模块31、血缘分析图生成模块32和问题确定模块33进一步的功能时,可以由这些模块本身来实现,也可以搭建对应功能的子模块来实现。
本实施例中,由于可以由分析模块自动获取数据处理任务,并进一步对数据处理任务进行解析,血缘分析图生成模块根据对所述数据处理任务的分析结果生成血缘分析图,比如以数据单元为节点、信号流向关系为有向边形成的有向图作为血缘分析图,进而由问题确定模块根据所述血缘分析图确定出现数据质量问题的所在。即根据本实施例所公开的技术方案,一旦出现数据质量问题,就会在血缘分析图上有客观显现的体现,因此,上述整个过程通过血缘分析图即可直接客观的确定出数据质量的问题所在,无须人工参与,摆脱了人工的主观因素影响,所以定位问题效率高、速度快。
图4为本发明实施例血缘分析图生成模块结构示意图,如图4所示,当有向图做为所述血缘分析图时,所述血缘分析图生成模块32可以具体包括:
节点确定子模块321,用于根据所述数据处理任务涉及的数据单元,确定所述有向图的节点;
有向边确定子模块322,用于根据所述数据处理任务的数据流向关系,确定所述有向图的有向边,所述有向边的两端分别连接所述有向图中的上一个节点和下一个节点。
需要说明的是,在另外一实施例中,也可以由所述血缘分析图生成模块32本身进一步用于根据所述数据处理任务涉及的数据单元,确定所述有向图的节点,以及根据所述数据处理任务的数据流向关系,确定所述有向图的有向边,所述有向边的两端分别连接所述有向图中的上一个节点和下一个节点。
本实施例中,由于可以由分析模块自动获取数据处理任务,并进一步对数据处理任务进行解析,血缘分析图生成模块在根据对所述数据处理任务的分析结果生成血缘分析图时,以数据单元为有向图的节点,以信号流向关系为有向图的有向边从而形成的有向图作为血缘分析图,进而后续可由问题确定模块根据所述血缘分析图确定出现数据质量问题的所在,从而通过血缘分析图即可直接客观的确定出数据质量的问题所在,无须人工参与,摆脱了人工的主观因素影响,所以定位问题效率高、速度快。
本发明一种数据质量追溯的装置实施例中,各个单元的处理过程以及相互合作的具体实现过程可以参考本发明方法实施例的相关描述,这里不再一一描述。
本发明实施例所述的一种数据质量追溯的方法可以通过硬件处理器来实现相关功能。所述硬件处理器在执行本发明实施例提供的一种数据质量追溯的方法,可以包括如下步骤的指令:
获取数据处理任务并对所述数据处理任务进行分析;
根据所述数据处理任务的分析结果,生成血缘分析图;
根据所述血缘分析图确定出现数据质量问题的所在。
上述每个步骤的具体说明或者解释,详见上述图1-图4相关记载,在此不再赘述。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (5)

1.一种数据质量追溯的方法,其特征在于,包括:
获取数据处理任务并对所述数据处理任务进行分析;
根据所述数据处理任务的分析结果,生成血缘分析图;
根据所述血缘分析图,确定出现数据质量问题所在;
其中,所述获取数据处理任务并对所述数据处理任务进行分析,包括:
确定所述数据处理任务涉及到的数据单元,以及所述数据处理任务的数据流向关系;
所述根据所述数据处理任务的分析结果,生成血缘分析图,包括:
根据所述数据处理任务涉及到的数据单元,以及所述数据处理任务的数据流向关系生成有向图,所述有向图作为血缘分析图;
其中,所述根据所述数据处理任务涉及到的数据单元,以及所述数据处理任务的数据流向关系生成有向图,进一步包括:
根据所述数据处理任务涉及的数据单元,确定所述有向图的节点;
根据所述数据处理任务的数据流向关系,确定所述有向图的有向边,所述有向边的两端分别连接所述有向图中的上一个节点和下一个节点。
2.根据权利要求1所述的方法,其特征在于,根据所述血缘分析图,确定出现数据质量问题所在包括:
根据所述血缘分析图,确定出现数据质量问题的数据单元;
和/或
根据所述血缘分析图,确定对出现数据质量问题的数据单元有影响的数据处理任务,以及对出现数据质量问题的数据单元有影响的其他数据单元;
和/或
根据所述血缘分析图,确定受所述出现数据质量问题的数据单元影响的数据处理任务,以及受所述出现数据质量问题影响的其他数据单元。
3.一种数据质量追溯的装置,其特征在于,包括:
分析模块,用于获取数据处理任务并对所述数据处理任务进行分析;
血缘分析图生成模块,用于根据对所述数据处理任务的分析结果,生成血缘分析图;
问题确定模块,用于根据所述血缘分析图,确定出现数据质量问题的问题所在;
其中,所述分析模块进一步用于确定所述数据处理任务涉及到的数据单元,以及所述数据处理任务的数据流向关系;
所述血缘分析图生成模块进一步用于根据所述数据处理任务涉及的数据单元,以及所述数据处理任务的数据流向关系生成有向图,所述有向图做为所述血缘分析图;
所述血缘分析图生成模块包括:
节点确定子模块,用于根据所述数据处理任务涉及的数据单元,确定所述有向图的节点;
有向边确定子模块,用于根据所述数据处理任务的数据流向关系,确定所述有向图的有向边,所述有向边的两端分别连接所述有向图中的上一个节点和下一个节点。
4.根据权利要求3所述的装置,其特征在于,所述问题确定模块进一步用于根据所述血缘分析图,确定出现数据质量问题的数据单元;
和/或
所述问题确定模块进一步用于根据所述血缘分析图,确定对出现数据质量问题的数据单元有影响的数据处理任务,以及对出现数据质量问题的数据单元有影响的其他数据单元;
和/或
所述问题确定模块进一步用于根据所述血缘分析图,确定受所述出现数据质量问题的数据单元影响的数据处理任务,以及受所述出现数据质量问题影响的其他数据单元。
5.一种与数据质量追溯装置结合使用的硬件处理器,其特征在于,所述硬件处理器包括执行以下步骤的指令:
获取数据处理任务并对所述数据处理任务进行分析;
根据所述数据处理任务的分析结果,生成血缘分析图;
根据所述血缘分析图确定出现数据质量问题的所在;
其中,所述获取数据处理任务并对所述数据处理任务进行分析,包括:
确定所述数据处理任务涉及到的数据单元,以及所述数据处理任务的数据流向关系;
所述根据所述数据处理任务的分析结果,生成血缘分析图,包括:
根据所述数据处理任务涉及到的数据单元,以及所述数据处理任务的数据流向关系生成有向图,所述有向图作为血缘分析图;
其中,所述根据所述数据处理任务涉及到的数据单元,以及所述数据处理任务的数据流向关系生成有向图,进一步包括:
根据所述数据处理任务涉及的数据单元,确定所述有向图的节点;
根据所述数据处理任务的数据流向关系,确定所述有向图的有向边,所述有向边的两端分别连接所述有向图中的上一个节点和下一个节点。
CN201610160404.6A 2016-03-21 2016-03-21 一种数据质量追溯的方法及其装置以及硬件处理器 Active CN105844390B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610160404.6A CN105844390B (zh) 2016-03-21 2016-03-21 一种数据质量追溯的方法及其装置以及硬件处理器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610160404.6A CN105844390B (zh) 2016-03-21 2016-03-21 一种数据质量追溯的方法及其装置以及硬件处理器

Publications (2)

Publication Number Publication Date
CN105844390A CN105844390A (zh) 2016-08-10
CN105844390B true CN105844390B (zh) 2022-08-30

Family

ID=56587587

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610160404.6A Active CN105844390B (zh) 2016-03-21 2016-03-21 一种数据质量追溯的方法及其装置以及硬件处理器

Country Status (1)

Country Link
CN (1) CN105844390B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106292583B (zh) * 2016-08-16 2018-08-31 苏州朋泰智能科技有限公司 基于分布式mes的柔性制造系统的纠错方法及装置
CN108694195B (zh) * 2017-04-10 2022-04-12 腾讯科技(深圳)有限公司 一种分布式数据仓库的管理方法及系统
CN109614400A (zh) * 2018-11-30 2019-04-12 深圳前海微众银行股份有限公司 失败任务的影响及溯源分析方法、装置、设备及存储介质
CN112100201B (zh) * 2020-09-30 2024-02-06 东莞盟大集团有限公司 基于大数据技术的数据监测方法、装置、设备和存储介质
CN113468257A (zh) * 2021-07-05 2021-10-01 乐融致新电子科技(天津)有限公司 基于数据仓库的数据质量监控方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004178270A (ja) * 2002-11-27 2004-06-24 Fujitsu Ltd 有向グラフ解析方法、解析装置及びそのプログラム
CN104135387A (zh) * 2014-08-12 2014-11-05 浪潮通信信息系统有限公司 一种基于元模型拓扑的网管数据处理可视化监控方法
CN104346367A (zh) * 2013-07-30 2015-02-11 华为技术有限公司 一种数据集成的方法和装置
CN104424269A (zh) * 2013-08-30 2015-03-18 中国电信股份有限公司 数据血统分析方法与装置
CN104699735A (zh) * 2014-11-20 2015-06-10 国家电网公司 企业级数据中心的数据处理方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104881427A (zh) * 2015-04-01 2015-09-02 北京科东电力控制系统有限责任公司 一种面向电网调控运行的数据血统分析方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004178270A (ja) * 2002-11-27 2004-06-24 Fujitsu Ltd 有向グラフ解析方法、解析装置及びそのプログラム
CN104346367A (zh) * 2013-07-30 2015-02-11 华为技术有限公司 一种数据集成的方法和装置
CN104424269A (zh) * 2013-08-30 2015-03-18 中国电信股份有限公司 数据血统分析方法与装置
CN104135387A (zh) * 2014-08-12 2014-11-05 浪潮通信信息系统有限公司 一种基于元模型拓扑的网管数据处理可视化监控方法
CN104699735A (zh) * 2014-11-20 2015-06-10 国家电网公司 企业级数据中心的数据处理方法及装置

Also Published As

Publication number Publication date
CN105844390A (zh) 2016-08-10

Similar Documents

Publication Publication Date Title
CN105844390B (zh) 一种数据质量追溯的方法及其装置以及硬件处理器
CN109522228B (zh) 接口自动化测试数据构造方法、装置、平台及存储介质
CN109242363B (zh) 一种基于多种质量控制模型的全生命周期测试管理平台
CN113746798B (zh) 基于多维度分析的云网络共享资源异常根因定位方法
CN109815855B (zh) 一种基于机器学习的电子设备自动测试方法及系统
CN111679808B (zh) Rpa机器人应用需求测评方法及装置
CN111767320A (zh) 数据血缘关系确定方法及装置
CN111984826B (zh) 基于xml的数据自动入库方法、系统、装置和存储介质
CN104008046A (zh) 程序的测试方法以及用于测试程序的设备
CN106250390B (zh) 一种分步自动生成sql语言的方法及装置
CN116523244A (zh) 一种基于外包资源的测试人力风险预警方法
CN116823164A (zh) 一种业务审批方法、装置、设备及存储介质
CN111277427A (zh) 一种数据中心网络设备的巡检方法及系统
CN112132544B (zh) 业务系统的巡检方法及装置
CN108805597B (zh) 模型构建方法及装置、数据报表生成方法及装置
CN111737245B (zh) 一种自动修复路网连通性的方法及设备
CN112232960B (zh) 交易应用系统监控方法及装置
CN113392101B (zh) 构建横向联邦树的方法、主服务器、业务平台和系统
CN107229487B (zh) 代码处理方法及装置
CN112328597A (zh) 一种基于表的流计算方法和装置
CN105761119A (zh) 在线人数分布计算方法及装置
CN111291464A (zh) 一种电力系统动态等值方法及装置
CN110750512A (zh) 一种数据库性能评价管理方法及装置
CN116824107B (zh) 一种三维模型审阅信息的处理方法、装置及设备
Herberger et al. Simulated human error probability and its application to dynamic human failure events

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20220714

Address after: 300467 917-2, Chuangzhi building, 482 Zhongxin eco city, Binhai New Area, Tianjin

Applicant after: Tianjin Zhirong Innovation Technology Development Co.,Ltd.

Address before: Room 6184, 6th floor, building 19, No. 68, Xueyuan South Road, Haidian District, Beijing 100081

Applicant before: LE SHI INTERNET INFORMATION & TECHNOLOGY CORP., BEIJING

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant