CN111897806A - 大数据离线数据质量检查方法及装置 - Google Patents

大数据离线数据质量检查方法及装置 Download PDF

Info

Publication number
CN111897806A
CN111897806A CN202010596321.8A CN202010596321A CN111897806A CN 111897806 A CN111897806 A CN 111897806A CN 202010596321 A CN202010596321 A CN 202010596321A CN 111897806 A CN111897806 A CN 111897806A
Authority
CN
China
Prior art keywords
data
check
data quality
inspection
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010596321.8A
Other languages
English (en)
Inventor
赵旭晖
张侦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suning Financial Technology Nanjing Co Ltd
Original Assignee
Suning Financial Technology Nanjing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suning Financial Technology Nanjing Co Ltd filed Critical Suning Financial Technology Nanjing Co Ltd
Priority to CN202010596321.8A priority Critical patent/CN111897806A/zh
Publication of CN111897806A publication Critical patent/CN111897806A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Stored Programmes (AREA)

Abstract

本发明公开一种大数据离线数据质量检查方法及装置,涉及大数据技术领域,对运行在Hive数据仓库上面的数据进行质量检查,推动数据质量的提升。该方法包括:基于数据质量检查系统中预设的检查规则配置检查语句;将检查语句同步至大数据平台的配置表中,由大数据平台的程序脚本执行检查语句并从数据仓库中获取检查结果;数据质量检查系统同步检测结果,同时向用户可视化展示。该装置应用有上述方案所述的方法。

Description

大数据离线数据质量检查方法及装置
技术领域
本发明涉及大数据技术领域,尤其涉及一种大数据离线数据质量检查方法及装置。
背景技术
为了保证数据仓库中数据的正确性和完整性,确保数据在抽取、传输、整合、加载、分析等各个环节不失真及准确表达,并为逐步修正和改善各业务系统中的数据质量、加强业务操作规范化管理等提供依据,数据质量检查是数据仓库建设中必不可少的重要组成部分。缺乏数据质量检查将造成用户对数据不认可、对数据缺少信任、增加构建数据仓库的难度等后果。
在数据仓库建设过程中,数据质量检查需要从源数据分析开始,自始至终全程贯彻落实,并要求得到数据仓库的全体开发人员、管理人员及相关业务人员的积极参与,使各方对数据质量有一个合理的预期和客观的评价,提高数据仓库的使用率和可信度,更好地为决策分析提供服务。
发明内容
本发明的目的在于提供一种大数据离线数据质量检查方法及装置,对运行在Hive数据仓库上面的数据进行质量检查,推动数据质量的提升。
为了实现上述目的,本发明的第一方面提供一种大数据离线数据质量检查方法,包括:
基于数据质量检查系统中预设的检查规则配置检查语句;
将所述检查语句同步至大数据平台的配置表中,由大数据平台的程序脚本执行所述检查语句并从数据仓库中获取检查结果;
数据质量检查系统同步所述检测结果,同时向用户可视化展示。
优选地,数据质量检查系统中预设的检查规则包括:
数据及时性检查规则、字段非空检查规则、字段值域检查规则、字段唯一性检查规则、字段数据长度检查规则、字段特定值占比检查规则、数据量同比检查规则、数据量环比检查规则、记录数一致性检查规则、数据子集检查规则中的一种或多种。
较佳地,基于数据质量检查系统中预设的检查规则配置检查语句的方法包括:
根据检测需求在数据质量检查系统中选择对应的检查规则,并配置检测参数;
基于所选的检查规则和配置的检测参数,自动生成SQL检查语句。
进一步地,在步骤将所述检查语句同步至大数据平台的配置表中,由大数据平台的程序脚本执行所述检查语句并从数据仓库中获取检查结果之前还进行以下配置参数设置:
通过数据质量检查系统中的工作流配置模块,设置检查语句在大数据平台上的定时执行时间;
通过数据质量检查系统中的预定义参数配置模块,对检查语句中的检测参数做定期更新;
通过数据质量检查系统中的源系统配置模块,设置数据仓库中待查数据的归属系统并关联对应责任人;
通过数据质量检查系统中的告警原因配置模块,预设多种产生数据质量问题原因的分类。
优选地,将所述检查语句同步至大数据平台的配置表中,由大数据平台的程序脚本执行所述检查语句并从数据仓库中获取检查结果的方法包括:
通过大数据平台将检查语句和配置参数同步到配置表中,由大数据平台的程序脚本定时执行相应的检查语句对数据仓库的数据执行筛检;
利用大数据平台把检查结果中的合格数据记录到结果表中,把检查结果中的异常数据记录到异常表中。
较佳地,数据质量检查系统同步所述检测结果,同时向用户可视化展示的方法包括:
数据质量检查系统同步结果表和异常表,并根据数据质量问题原因的分类对异常表中的问题数据进行归类;
根据结果表和异常表进行指标计算分析,并将指标计算分析的结果以图表形式向用户展示,所述指标包括数据仓库中被检测数据的及时性指标和准确性指标。
进一步地,数据质量检查系统同步所述检测结果,同时向用户可视化展示之后还包括:
数据质量检查系统将问题数据及其归类结果向相关责任人告警,以提醒相关责任人及时处理该问题数据。
与现有技术相比,本发明提供的大数据离线数据质量检查方法具有以下有益效果:
考虑到现有大数据平台之上的数据仓库限制了底层数据直接被连接获取的权限,本发明采取构建数据质量检查系统的方案,通过调用大数据平台提供的相关组件功能实现数据交换,使得在数据质量检查系统配置完成的检查语句能够同步至大数据平台的配置表中,然后由大数据平台的程序脚本执行检查语句并从数据仓库中获取检查结果,最后由数据质量检查系统同步检测结果,实现向用户的可视化展示。
可见,本发明方案检查语句的配置在数据质量检查系统中操作,检查语句的执行在大数据平台中运行,通过将检查语句的配置与运行分离设计,使得数据质量检测的适用场景更广阔、扩增性能也得到了提升,能够灵活对数据仓库中的离线数据进行大规模检测,推动了数据质量的提升,提高了数据的可用性。
本发明的第二方面提供一种大数据离线数据质量检查装置,应用于上述技术方案所述的大数据离线数据质量检查方法中,所述装置包括:
配置单元,基于数据质量检查系统中预设的检查规则配置检查语句;
检查执行单元,用于将所述检查语句同步至大数据平台的配置表中,由大数据平台的程序脚本执行所述检查语句并从数据仓库中获取检查结果;
结果显示单元,利用数据质量检查系统同步所述检测结果,同时向用户可视化展示。
优选地,还包括:
告警提醒单元,用于将问题数据及其归类结果向相关责任人告警,以提醒相关责任人及时处理该问题数据。
与现有技术相比,本发明提供的大数据离线数据质量检查装置的有益效果与上述技术方案提供的大数据离线数据质量检查方法的有益效果相同,在此不做赘述。
本发明的第三方面提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时执行上述大数据离线数据质量检查方法的步骤。
与现有技术相比,本发明提供的计算机可读存储介质的有益效果与上述技术方案提供的大数据离线数据质量检查方法的有益效果相同,在此不做赘述。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明实施例一中大数据离线数据质量检查方法的流程示意图;
图2为本发明实施例一中数据质量检查系统的系统框架图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其它实施例,均属于本发明保护的范围。
实施例一
请参阅图1,本实施例提供一种大数据离线数据质量检查方法,包括:
基于数据质量检查系统中预设的检查规则配置检查语句;将所述检查语句同步至大数据平台的配置表中,由大数据平台的程序脚本执行所述检查语句并从数据仓库中获取检查结果;数据质量检查系统同步所述检测结果,同时向用户可视化展示。
考虑到现有大数据平台之上的数据仓库限制了底层数据直接被连接获取的权限,本实施例采取构建数据质量检查系统的方案,通过调用大数据平台提供的相关组件功能实现数据交换,使得在数据质量检查系统配置完成的检查语句能够同步至大数据平台的配置表中,然后由大数据平台的程序脚本执行检查语句并从数据仓库中获取检查结果,最后由数据质量检查系统同步检测结果,实现向用户的可视化展示。
可见,本实施例方案检查语句的配置在数据质量检查系统中操作,检查语句的执行在大数据平台中运行,通过将检查语句的配置与运行分离设计,使得数据质量检测的适用场景更广阔、扩增性能也得到了提升,能够灵活对数据仓库中的离线数据进行大规模检测,推动了数据质量的提升,提高了数据的可用性。
上述实施例中数据质量检查系统中预设的检查规则包括:
数据及时性检查规则、字段非空检查规则、字段值域检查规则、字段唯一性检查规则、字段数据长度检查规则、字段特定值占比检查规则、数据量同比检查规则、数据量环比检查规则、记录数一致性检查规则、数据子集检查规则中的一种或多种。
具体实施时,根据收集到的常见问题,按照数据特性将数据质量问题划分为四类,依次为及时性问题、完整性问题、准确性问题和一致性问题,每种数据特性都有一一对应的触发定义,且每种触发定义都对应至少一种检查规则,如下表所示:
Figure BDA0002557338170000061
数据质量检查系统针对每项检查规则都做了相应的场景描述和计算说明,供相关人员参考以快速、准确的配置出所需的检查语句,如下表所示:
Figure BDA0002557338170000062
Figure BDA0002557338170000071
进一步地,上述实施例中基于数据质量检查系统中预设的检查规则配置检查语句的方法包括:
根据检测需求在数据质量检查系统中选择对应的检查规则,并配置检测参数;基于所选的检查规则和配置的检测参数,自动生成SQL检查语句。
具体实施时,数据质量检查系统中每一条检查实例都是依据上表中对应检查规则配置的,配置过程中还需要输入相应的检测参数,根据这些检测参数生成检测实例,在构造SQL检查语句的过程中,需要明确检查通过和不通过的标准,例如在检查支付类型的离线数据中出现了值域为4的数据,那么通过该SQL检查语句检查该数据时,返回的检查结果即为不通过,反之则检查结果为通过。其他规则检测实例的检查原理类似,本实施例对此不做赘述。
上述实施例中在步骤将检查语句同步至大数据平台的配置表中,由大数据平台的程序脚本执行所述检查语句并从数据仓库中获取检查结果之前还进行以下配置参数设置:
通过数据质量检查系统中的工作流配置模块,设置检查语句在大数据平台上的定时执行时间;通过数据质量检查系统中的预定义参数配置模块,对检查语句中的检测参数做定期更新;通过数据质量检查系统中的源系统配置模块,设置数据仓库中待查数据的归属系统并关联对应责任人;通过数据质量检查系统中的告警原因配置模块,预设多种产生数据质量问题原因的分类。
具体实施时,请参阅图2,其中规则配置层的作用主要是定义相关的检查规则和一些配置项,通过源系统配置模块区分待检查的数据是由哪个归属系统产生,如理财系统、支付系统或者会员系统,定位数据质量问题的对应责任人。检查规则实例配置模块的作用是配置SQL检查语句,通过不同的检查需求配置参数生成具体的检查实例,并根据检查实例对应生成SQL检查语句。告警原因配置模块是为了分析产生数据质量问题的原因,总结常见的原因并进行原因分类,如平台问题导致的问题数据、源数据问题导致的问题数据、开发问题导致的问题数据等。工作流配置模块是为了和大数据平台中的任务对应起来,设置SQL检查语句定时执行任务的时间。预定义参数配置模块是为了在生成SQL检查语句的时候支持传入参数的处理,对检查语句中的检测参数做定期更新,如自动替换SQL检查语句中的当天日期,以实现对当天产生数据的定期检查。其他通用配置模块主要用于实现设置初始化、权限控制等功能,本实施例对此不做赘述。
基础功能层是数据质量检查流程的主要实现,通过在大数据平台运行调度任务的方式定时执行检查脚本,检查脚本通过Scala语言实现,逐条执行配置实例对应的SQL检查语句,根据返回的结果值判断检查是否通过。
上述实施例中将检查语句同步至大数据平台的配置表中,由大数据平台的程序脚本执行检查语句并从数据仓库中获取检查结果的方法包括:
通过大数据平台将检查语句和配置参数同步到配置表中,由大数据平台的程序脚本定时执行相应的检查语句对数据仓库的数据执行筛检;利用大数据平台把检查结果中的合格数据记录到结果表中,把检查结果中的异常数据记录到异常表中。
具体实施时,通过在大数据平台中定时执行检查程序脚本,逐条执行检查语句,根据检查语句的返回结果判断检查是否通过并记录到结果表和告警表中,执行检查程序脚本由Scala编写,根据检测参数读取待检查的SQL语句。
上述实施例中数据质量检查系统同步所述检测结果,同时向用户可视化展示的方法包括:
数据质量检查系统同步结果表和异常表,并根据数据质量问题原因的分类对异常表中的问题数据进行归类;根据结果表和异常表进行指标计算分析,并将指标计算分析的结果以图表形式向用户展示,所述指标包括数据仓库中被检测数据的及时性指标和准确性指标。
上述实施例中数据质量检查系统同步检测结果,同时向用户可视化展示之后还包括:
数据质量检查系统将问题数据及其归类结果向相关责任人告警,以提醒相关责任人及时处理该问题数据。
具体实施时,结果表和异常表同步回传数据质量检查系统,以便用户查询查看,另外,数据质量检查系统还可以就检查结果中出现质量问题的数据向相关责任人告警并记录告警状态,如未处理、已分派、已处理等,对于已分派但待处理告警的责任人,通过邮件或即时通讯进行提醒,在其登录数据质量检查系统后查询相关的告警信息,以使责任人分析原因并解决告警问题,同时还将分析结果记录保存,处理之后的告警问题作为知识库保存下来。通过对常见的数据质量问题进行了有效的分类,便于经验的积累和沉淀,有利于促进数据的质量提升。
另外,数据质量检查系统还会根据问题数据归属系统的不同进行分类汇总,计算出每天的数据及时性和准确性指标,这里的及时性是指通过数据及时性检查的告警实例数量占总的实例数量的比值,准确性是指除及时性检查规则之外的其他检查规则中,通过检查的告警实例数量占总的实例数据的比值,每天汇总上述数据信息,通过邮件发送给需要了解整体检查情况的责任人。通过告警通知,提升了问题数据处理的时效性,减少了问题数据的处理的成本。
示例性地,数据质量检查系统提供的检查规则实例表如下:
Figure BDA0002557338170000091
Figure BDA0002557338170000101
用户根据数据质量检查系统中提供的检查规则实例表,配置检测参数后得到的检查实例如下表所示:
Figure BDA0002557338170000102
基于上述检查实例生成SQL检查语句,在大数据平台执行后反馈的告警表如下表所示:
Figure BDA0002557338170000103
Figure BDA0002557338170000111
实施例二
本实施例提供一种大数据离线数据质量检查装置,包括:
配置单元,基于数据质量检查系统中预设的检查规则配置检查语句;
检查执行单元,用于将所述检查语句同步至大数据平台的配置表中,由大数据平台的程序脚本执行所述检查语句并从数据仓库中获取检查结果;
结果显示单元,利用数据质量检查系统同步所述检测结果,同时向用户可视化展示。
优选地,还包括:
告警提醒单元,用于将问题数据及其归类结果向相关责任人告警,以提醒相关责任人及时处理该问题数据。
与现有技术相比,本发明实施例提供的大数据离线数据质量检查装置的有益效果与上述实施例一提供的大数据离线数据质量检查方法的有益效果相同,在此不做赘述。
实施例三
本实施例提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时执行上述大数据离线数据质量检查方法的步骤。
与现有技术相比,本实施例提供的计算机可读存储介质的有益效果与上述技术方案提供的大数据离线数据质量检查方法的有益效果相同,在此不做赘述。
本领域普通技术人员可以理解,实现上述发明方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,上述程序可以存储于计算机可读取存储介质中,该程序在执行时,包括上述实施例方法的各步骤,而的存储介质可以是:ROM/RAM、磁碟、光盘、存储卡等。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种大数据离线数据质量检查方法,其特征在于,包括:
基于数据质量检查系统中预设的检查规则配置检查语句;
将所述检查语句同步至大数据平台的配置表中,由大数据平台的程序脚本执行所述检查语句并从数据仓库中获取检查结果;
数据质量检查系统同步所述检测结果,同时向用户可视化展示。
2.根据权利要求1所述的方法,其特征在于,数据质量检查系统中预设的检查规则包括:
数据及时性检查规则、字段非空检查规则、字段值域检查规则、字段唯一性检查规则、字段数据长度检查规则、字段特定值占比检查规则、数据量同比检查规则、数据量环比检查规则、记录数一致性检查规则、数据子集检查规则中的一种或多种。
3.根据权利要求2所述的方法,其特征在于,基于数据质量检查系统中预设的检查规则配置检查语句的方法包括:
根据检测需求在数据质量检查系统中选择对应的检查规则,并配置检测参数;
基于所选的检查规则和配置的检测参数,自动生成SQL检查语句。
4.根据权利要求1-3任一项所述的方法,其特征在于,在步骤将所述检查语句同步至大数据平台的配置表中,由大数据平台的程序脚本执行所述检查语句并从数据仓库中获取检查结果之前还进行以下配置参数设置:
通过数据质量检查系统中的工作流配置模块,设置检查语句在大数据平台上的定时执行时间;
通过数据质量检查系统中的预定义参数配置模块,对检查语句中的检测参数做定期更新;
通过数据质量检查系统中的源系统配置模块,设置数据仓库中待查数据的归属系统并关联对应责任人;
通过数据质量检查系统中的告警原因配置模块,预设多种产生数据质量问题原因的分类。
5.根据权利要求4所述的方法,其特征在于,将所述检查语句同步至大数据平台的配置表中,由大数据平台的程序脚本执行所述检查语句并从数据仓库中获取检查结果的方法包括:
通过大数据平台将检查语句和配置参数同步到配置表中,由大数据平台的程序脚本定时执行相应的检查语句对数据仓库的数据执行筛检;
利用大数据平台把检查结果中的合格数据记录到结果表中,把检查结果中的异常数据记录到异常表中。
6.根据权利要求5所述的方法,其特征在于,数据质量检查系统同步所述检测结果,同时向用户可视化展示的方法包括:
数据质量检查系统同步结果表和异常表,并根据数据质量问题原因的分类对异常表中的问题数据进行归类;
根据结果表和异常表进行指标计算分析,并将指标计算分析的结果以图表形式向用户展示,所述指标包括数据仓库中被检测数据的及时性指标和准确性指标。
7.根据权利要求6所述的方法,其特征在于,数据质量检查系统同步所述检测结果,同时向用户可视化展示之后还包括:
数据质量检查系统将问题数据及其归类结果向相关责任人告警,以提醒相关责任人及时处理该问题数据。
8.一种大数据离线数据质量检查装置,其特征在于,包括:
配置单元,基于数据质量检查系统中预设的检查规则配置检查语句;
检查执行单元,用于将所述检查语句同步至大数据平台的配置表中,由大数据平台的程序脚本执行所述检查语句并从数据仓库中获取检查结果;
结果显示单元,利用数据质量检查系统同步所述检测结果,同时向用户可视化展示。
9.根据权利要求8所述的装置,其特征在于,还包括:
告警提醒单元,用于将问题数据及其归类结果向相关责任人告警,以提醒相关责任人及时处理该问题数据。
10.一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,其特征在于,计算机程序被处理器运行时执行上述权利要求1至7任一项所述方法的步骤。
CN202010596321.8A 2020-06-28 2020-06-28 大数据离线数据质量检查方法及装置 Pending CN111897806A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010596321.8A CN111897806A (zh) 2020-06-28 2020-06-28 大数据离线数据质量检查方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010596321.8A CN111897806A (zh) 2020-06-28 2020-06-28 大数据离线数据质量检查方法及装置

Publications (1)

Publication Number Publication Date
CN111897806A true CN111897806A (zh) 2020-11-06

Family

ID=73207171

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010596321.8A Pending CN111897806A (zh) 2020-06-28 2020-06-28 大数据离线数据质量检查方法及装置

Country Status (1)

Country Link
CN (1) CN111897806A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112597142A (zh) * 2020-12-26 2021-04-02 中国农业银行股份有限公司 一种数据质量检测方法和数据质量检测引擎
CN112667618A (zh) * 2020-12-30 2021-04-16 湖南长城医疗科技有限公司 一种公共区域卫生平台质控系统及方法
CN112667612A (zh) * 2020-12-25 2021-04-16 建信金融科技有限责任公司 一种数据质量检核方法、装置、电子设备及存储介质
CN113722352A (zh) * 2021-08-31 2021-11-30 航天信息系统工程(北京)有限公司 一种报审价方案的智能数据校验方法、系统及存储介质
CN117131037A (zh) * 2023-10-25 2023-11-28 北京集度科技有限公司 一种数据质量检测方法、装置、系统及智能车辆

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109033381A (zh) * 2018-07-27 2018-12-18 郑州云海信息技术有限公司 一种业务请求的执行方法、装置及设备
CN109359157A (zh) * 2018-08-21 2019-02-19 中国平安人寿保险股份有限公司 数据同步生成方法、装置、计算机设备以及存储介质
CN109933578A (zh) * 2019-03-21 2019-06-25 浪潮软件集团有限公司 一种可配置的自动化数据质量检查方法及系统
CN111177231A (zh) * 2019-12-20 2020-05-19 中国建设银行股份有限公司 报表生成方法和报表生成装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109033381A (zh) * 2018-07-27 2018-12-18 郑州云海信息技术有限公司 一种业务请求的执行方法、装置及设备
CN109359157A (zh) * 2018-08-21 2019-02-19 中国平安人寿保险股份有限公司 数据同步生成方法、装置、计算机设备以及存储介质
CN109933578A (zh) * 2019-03-21 2019-06-25 浪潮软件集团有限公司 一种可配置的自动化数据质量检查方法及系统
CN111177231A (zh) * 2019-12-20 2020-05-19 中国建设银行股份有限公司 报表生成方法和报表生成装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112667612A (zh) * 2020-12-25 2021-04-16 建信金融科技有限责任公司 一种数据质量检核方法、装置、电子设备及存储介质
CN112597142A (zh) * 2020-12-26 2021-04-02 中国农业银行股份有限公司 一种数据质量检测方法和数据质量检测引擎
CN112667618A (zh) * 2020-12-30 2021-04-16 湖南长城医疗科技有限公司 一种公共区域卫生平台质控系统及方法
CN112667618B (zh) * 2020-12-30 2023-06-06 湖南长城医疗科技有限公司 一种公共区域卫生平台质控系统及方法
CN113722352A (zh) * 2021-08-31 2021-11-30 航天信息系统工程(北京)有限公司 一种报审价方案的智能数据校验方法、系统及存储介质
CN117131037A (zh) * 2023-10-25 2023-11-28 北京集度科技有限公司 一种数据质量检测方法、装置、系统及智能车辆

Similar Documents

Publication Publication Date Title
AU2019253860B2 (en) Data quality analysis
CN111897806A (zh) 大数据离线数据质量检查方法及装置
US20200118311A1 (en) Systems and interactive user interfaces for dynamic retrieval, analysis, and triage of data items
CN107908550B (zh) 一种软件缺陷统计处理方法及装置
US11626009B2 (en) Enhanced alert generation system based on real-time manipulation of datasets
US20180285432A1 (en) Extracting and labeling custom information from log messages
CN110262955B (zh) 基于pinpoint的应用性能监控工具
CN113641567B (zh) 一种数据库巡检方法、装置、电子设备及存储介质
CN116823464B (zh) 数据资产管理平台、电子设备及计算机可读存储介质
CN116149947A (zh) 数据模型的质量评估方法、装置、电子设备及存储介质
CN111858236A (zh) 知识图谱监控方法、装置、计算机设备及存储介质
US10885054B2 (en) Tracking metadata changes in multiple data stores and generating alerts for detected data impacts
CN111523764A (zh) 业务架构检测方法、装置、工具、电子设备和介质
CN115481116A (zh) 一种数据质量检验方法及装置
CN111045915A (zh) 一种基于产品功能测试用例的安全测试的方法和装置
CN113434382A (zh) 数据库性能监控方法、装置、电子设备及计算机可读介质
CN113450208A (zh) 贷款风险变动预警、模型训练方法和装置
CN106034044A (zh) 告警分析的方法和装置
CN116401138B (zh) 操作系统的运行状态检测方法、装置、电子设备和介质
CN118035217A (zh) 数据处理方法、装置、电子设备及可读存储介质
CN117196307A (zh) 风控模型的运行状态检测方法、装置、设备及存储介质
CN117950938A (zh) 指标集确定方法及装置、电子设备、计算机可读存储介质
CN112860803A (zh) 一种对账校验的方法、装置、设备及可读存储介质
CN114661605A (zh) 软件测试方法、装置、电子设备、存储介质和程序产品
CN115203024A (zh) 一种数据仓库的测试方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20201106

RJ01 Rejection of invention patent application after publication