CN110580248A - 基于规则库扩充的数据治理方法及装置 - Google Patents

基于规则库扩充的数据治理方法及装置 Download PDF

Info

Publication number
CN110580248A
CN110580248A CN201910834105.XA CN201910834105A CN110580248A CN 110580248 A CN110580248 A CN 110580248A CN 201910834105 A CN201910834105 A CN 201910834105A CN 110580248 A CN110580248 A CN 110580248A
Authority
CN
China
Prior art keywords
rule base
universal
data
target table
data processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910834105.XA
Other languages
English (en)
Inventor
林海
张毅然
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Mininglamp Software System Co ltd
Original Assignee
Beijing Mininglamp Software System Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Mininglamp Software System Co ltd filed Critical Beijing Mininglamp Software System Co ltd
Priority to CN201910834105.XA priority Critical patent/CN110580248A/zh
Publication of CN110580248A publication Critical patent/CN110580248A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于规则库扩充的数据治理方法及装置,该方法包括:基于通用规则库对目标表进行数据处理;如果所述通用规则库中的规则不满足数据处理需求,添加自定义规则以扩充所述通用规则库;基于扩充后的所述通用规则库对所述目标表进行数据处理。在本发明中,先是基于通用规则库进行数据处理,若是通用规则库不满足业务场景需求,则采用自定义的规则扩充规则库,从而解决了通用规则库不满足新数据类型和应用场景需求的问题,既满足了基本的数据处理的需求的同时,也对复杂的业务场景有较好的支持。

Description

基于规则库扩充的数据治理方法及装置
技术领域
本发明涉及数据治理领域,具体而言,涉及一种基于规则库扩充的数据治理方法及装置。
背景技术
在当今各行各业,数据已经成为了一种十分宝贵的资源,于是数据的质量管理的重要性不言而喻,如数据的有效性,准确性,一致性等,而如何保护及处理这些数据,对这些数据的质量问题进行监控,目前常见的方式是构建规则库。
目前,在构建规则库的方面一般为提前设置好一些常见的通用型规则,在处理现有数据的时候再使用这些规则,这种方式对于现有的使用场景可以适应,但其不具有较好的适用性,对于出现新的数据类型和应用场景,现有的规则库极可能满足不了所有的场景需求。
发明内容
本发明实施例提供了一种基于规则库扩充的数据治理方法及装置,以至少解决相关技术中由于出现新的数据类型和应用场景,现有的规则库极可能满足不了所有的场景需求的问题。
根据本发明的一个实施例,提供了一种基于规则库扩充的数据治理方法,包括:基于通用规则库对目标表进行数据处理;如果所述通用规则库中的规则不满足数据处理需求,添加自定义规则以扩充所述通用规则库;基于扩充后的所述通用规则库对所述目标表进行数据处理。
优选地,在基于通用规则库对目标表进行数据处理之前,还包括:根据通用规则构建所述通用规则库。
优选地,如果所述通用规则库中的规则不满足数据处理需求,添加自定义规则以扩充所述通用规则库之前,还包括:判断所述通用规则库中的规则是否满足所述目标表的数据处理需求。
优选地,所述目标表包括新的数据类型。
根据本发明的另一个实施例,提供了一种基于规则库扩充的数据治理装置,包括:基于通用规则库对目标表进行数据处理;如果所述通用规则库中的规则不满足数据处理需求,添加自定义规则以扩充所述通用规则库;基于扩充后的所述通用规则库对所述目标表进行数据处理。
优选地,所述装置还包括构建模块,用于根据通用规则构建所述通用规则库。
优选地,所述装置还包括判断模块,用于判断所述通用规则库中的规则是否满足所述目标表的数据处理需求。
优选地,所述目标表包括新的数据类型。
根据本发明的又一个实施例,还提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
根据本发明的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
在本发明的上述实施例中,先是基于通用规则库进行数据处理,若是通用规则库不满足业务场景需求,则采用自定义的规则扩充规则库,从而解决了通用规则库不满足新数据类型和应用场景需求的问题,既满足了基本的数据处理的需求的同时,也对复杂的业务场景有较好的支持。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的方法运行的计算机终端的结构示意图;
图2是根据本发明实施例的数据治理方法的流程图;
图3是根据本发明可选实施例的基于规则库扩充的数据治理方法的流程图;
图4是根据本发明实施例的基于规则库扩充的数据治理装置的结构框图;
图5是根据本发明可选实施例的基于规则库扩充的数据治理装置的结构框图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
本申请所提供的方法实施例可以在计算机终端、服务器或者类似的运算装置中执行。以运行在计算机终端上为例,图1是本发明实施例的方法运行的计算机终端的硬件结构框图。如图1所示,计算机终端100可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,可选地,上述计算机终端100还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述计算机终端的结构造成限定。例如,计算机终端100还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端100。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,简称为NIC),可与互联网进行通讯。
在本实施例中提供了一种运行于上述计算机终端的数据治理方法,图2是根据本发明实施例的方法流程图,如图2所示,该流程包括如下步骤:
步骤S202,基于通用规则库对目标表进行数据处理;
步骤S204,如果所述通用规则库中的规则不满足数据处理需求,添加自定义规则以扩充所述通用规则库;
步骤S206,基于扩充后的所述通用规则库对所述目标表进行数据处理。
在本实施的步骤S202之前,可根据通用规则预先构建所述通用规则库。
在本实施的步骤S204之前,还可以包括:判断所述通用规则库中的规则是否满足所述目标表的数据处理需求。
在本实施例中,所述目标表可包括新的数据类型,或应用于新的应用场景,因此,通用规则库无法满足对所述目标表的数据处理需求。
为了便于对本发明实施例所提供的技术方案的理解,下面将通过一个具有应用的实施例进行详细描述。
在本实施例提供了一种规则自动化纳入规则库的数据治理方法,在本实施例中,用M表示实体表,用L表示规则库,N表示自定义添加的规则。在本实施例的数据处理过程中,对于实体M表,先采用内置的规则库L中的规则进行数据处理,若是内置的规则库不满足业务场景,则可手动添加自定义规则N,扩充规则库L中的规则,以满足当前的应用场景,这样可对于复杂的应用场景都可以做到很好的支持。
如图3所示,本实施例主要包括如下步骤:
步骤S301,基于通用规则构建规则库L。例如,在规则库L中可内置通用规则L1和L2;
步骤S302,处理目标表M数据;
步骤S303,基于规则库L处理数据;
步骤S304,判断规则库L现有规则是否符合需求,若是,则执行步骤S306,若否,则执行步骤S305;
步骤S305,添加自定义规则至规则库L,以对扩充规则库L,执行步骤306;
步骤S306,基于规则库L处理数据;
步骤S307,数据处理结束。
在本发明的上述实施例中,先是基于内置的规则库进行数据处理,若是内置的规则库不满足复杂的业务场景是,可使用自定义的方式使用定制化的规则,在满足了基本的数据处理的需求的同时,也对复杂的业务场景有较好的支持。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
在本实施例中还提供了一种基于规则库扩充的数据治理装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图4是根据本发明实施例的一种基于规则库扩充的数据治理装置的结构框图,如图4所示,该装置包括第一处理模块10、扩充模块20和第二处理模块30。
第一处理模块10,用于基于通用规则库对目标表进行数据处理。
扩充模块20,用于在所述通用规则库中的规则不满足数据处理需求的情况下,添加自定义规则以扩充所述通用规则库。
第二处理模块30,基于扩充后的所述通用规则库对所述目标表进行数据处理。
图5是根据本发明实施例的数据治理装置的结构框图,如图5所示,该装置除包括图4所示的第一处理模块10、扩充模块20和第二处理模块30外,还包括构建模块40和判断模块50。
构建模块40用于根据通用规则构建所述通用规则库。判断模块50用于判断所述通用规则库中的规则是否满足所述目标表。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
本发明的实施例还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于规则库扩充的数据治理方法,其特征在于,包括:
基于通用规则库对目标表进行数据处理;
如果所述通用规则库中的规则不满足数据处理需求,添加自定义规则以扩充所述通用规则库;
基于扩充后的所述通用规则库对所述目标表进行数据处理。
2.根据权利要求1所述的方法,其特征在于,在基于通用规则库对目标表进行数据处理之前,还包括:
根据通用规则构建所述通用规则库。
3.根据权利要求1所述的方法,其特征在于,如果所述通用规则库中的规则不满足数据处理需求,添加自定义规则以扩充所述通用规则库之前,还包括:
判断所述通用规则库中的规则是否满足所述目标表的数据处理需求。
4.根据权利要求1所述的方法,其特征在于,所述目标表包括新的数据类型。
5.一种基于规则库扩充的数据治理装置,其特征在于,包括:
第一处理模块,用于基于通用规则库对目标表进行数据处理;
扩充模块,用于在所述通用规则库中的规则不满足数据处理需求的情况下,添加自定义规则以扩充所述通用规则库;
第二处理模块,基于扩充后的所述通用规则库对所述目标表进行数据处理。
6.根据权利要求5所述的装置,其特征在于,还包括:
构建模块,用于根据通用规则构建所述通用规则库。
7.根据权利要求5所述的装置,其特征在于,还包括:
判断模块,用于判断所述通用规则库中的规则是否满足所述目标表的数据处理需求。
8.根据权利要求5所述的装置,其特征在于,所述目标表包括新的数据类型。
9.一种计算机可读存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至4任一项中所述的方法。
10.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述权利要求1至4任一项中所述的方法。
CN201910834105.XA 2019-09-04 2019-09-04 基于规则库扩充的数据治理方法及装置 Pending CN110580248A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910834105.XA CN110580248A (zh) 2019-09-04 2019-09-04 基于规则库扩充的数据治理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910834105.XA CN110580248A (zh) 2019-09-04 2019-09-04 基于规则库扩充的数据治理方法及装置

Publications (1)

Publication Number Publication Date
CN110580248A true CN110580248A (zh) 2019-12-17

Family

ID=68812488

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910834105.XA Pending CN110580248A (zh) 2019-09-04 2019-09-04 基于规则库扩充的数据治理方法及装置

Country Status (1)

Country Link
CN (1) CN110580248A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111984623A (zh) * 2020-08-14 2020-11-24 北京人大金仓信息技术股份有限公司 数据库集群自动化部署方法、装置、介质和电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101901222A (zh) * 2009-05-27 2010-12-01 北京启明星辰信息技术股份有限公司 一种sql解析及匹配的方法和系统
CN105447090A (zh) * 2015-11-05 2016-03-30 华中科技大学 一种自动化数据挖掘预处理方法
CN106296399A (zh) * 2015-06-11 2017-01-04 交通银行股份有限公司 业务规则公式化的数据处理方法和系统
WO2017107853A1 (zh) * 2015-12-25 2017-06-29 阿里巴巴集团控股有限公司 一种数据监控管理方法、数据监控方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101901222A (zh) * 2009-05-27 2010-12-01 北京启明星辰信息技术股份有限公司 一种sql解析及匹配的方法和系统
CN106296399A (zh) * 2015-06-11 2017-01-04 交通银行股份有限公司 业务规则公式化的数据处理方法和系统
CN105447090A (zh) * 2015-11-05 2016-03-30 华中科技大学 一种自动化数据挖掘预处理方法
WO2017107853A1 (zh) * 2015-12-25 2017-06-29 阿里巴巴集团控股有限公司 一种数据监控管理方法、数据监控方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111984623A (zh) * 2020-08-14 2020-11-24 北京人大金仓信息技术股份有限公司 数据库集群自动化部署方法、装置、介质和电子设备
CN111984623B (zh) * 2020-08-14 2024-02-09 北京人大金仓信息技术股份有限公司 数据库集群自动化部署方法、装置、介质和电子设备

Similar Documents

Publication Publication Date Title
US20160210632A1 (en) Secured payment method and relevant device and system
EP3396905A1 (en) Method and device for securely sending a message
EP3883188A1 (en) Network function nf management method and nf management device
CN110427494B (zh) 知识图谱的展示方法、装置、存储介质及电子装置
KR20160038878A (ko) 그레이스케일 업그레이드를 위한 방법 및 장치
CN113115331A (zh) 控制方法及通信装置
CN112035344A (zh) 多场景测试方法、装置、设备和计算机可读存储介质
US20140006554A1 (en) System management apparatus, system management method, and storage medium
CN107241312A (zh) 一种权限管理方法及装置
CN110580248A (zh) 基于规则库扩充的数据治理方法及装置
CN110569129A (zh) 资源分配方法及装置、存储介质、电子装置
CN111131324A (zh) 业务系统的登陆方法及装置、存储介质、电子装置
CN110750601A (zh) 基于连接通路的交互方法、装置、存储介质及电子装置
CN113518317B (zh) 提示信息的发送方法和装置、存储介质及电子装置
CN112650710B (zh) 数据迁移的发送方法及装置、存储介质、电子装置
CN113110982B (zh) 数据访问层验证方法及装置、存储介质及电子装置
CN112416488B (zh) 一种用户画像实现的方法、装置、计算机设备及计算机可读存储介质
CN110580172B (zh) 配置规则的验证方法及装置、存储介质、电子装置
CN110647546A (zh) 第三方规则引擎生成方法及装置
CN105187423B (zh) 网络资源的隔离方法、网络资源的隔离系统和移动终端
CN109451016B (zh) 数据下载管理方法、系统及相关设备
US8374593B2 (en) Method of providing mobile application
CN113504981A (zh) 任务调度方法和装置、存储介质及电子设备
CN110928300A (zh) 设备的控制方法及装置、存储介质和电子装置
CN110543470A (zh) 消息预警的方法及装置、存储介质和电子装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20191217