CN114356940B - 电网数据治理系统及方法 - Google Patents

电网数据治理系统及方法 Download PDF

Info

Publication number
CN114356940B
CN114356940B CN202111565897.9A CN202111565897A CN114356940B CN 114356940 B CN114356940 B CN 114356940B CN 202111565897 A CN202111565897 A CN 202111565897A CN 114356940 B CN114356940 B CN 114356940B
Authority
CN
China
Prior art keywords
data
metadata
service data
service
quality
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111565897.9A
Other languages
English (en)
Other versions
CN114356940A (zh
Inventor
陈彬
董灿
萧展辉
唐力
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Southern Power Grid Co Ltd
Information Center of Yunnan Power Grid Co Ltd
Original Assignee
China Southern Power Grid Co Ltd
Information Center of Yunnan Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Southern Power Grid Co Ltd, Information Center of Yunnan Power Grid Co Ltd filed Critical China Southern Power Grid Co Ltd
Priority to CN202111565897.9A priority Critical patent/CN114356940B/zh
Publication of CN114356940A publication Critical patent/CN114356940A/zh
Application granted granted Critical
Publication of CN114356940B publication Critical patent/CN114356940B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供电网数据治理系统及方法,该系统包括:元数据管理模块,其从各个业务数据当中提取对其进行描述的元数据及各个元数据的全链关系和关联关系;本体建模模块,其对业务数据和元数据进行聚类,根据聚类结果和多个元数据相互之间的语义关系建立本体模型;数据资产目录模块,其以知识图谱形式展示本体模型;数据标准管理模块,其建立相应业务数据的数据标准;数据质量检查模块,其根据数据标准进生成数据质量检查规则,对相应元数据所描述的业务数据进行质量检查;质量问题修复模块,其定位有质量问题的业务数据并获取修复案例,生成质量问题修复实例进行修复,并将修复好的业务数据返回给业务系统进行更新,并同步更新展示的数据内容。

Description

电网数据治理系统及方法
技术领域
本发明涉及数据处理技术领域,特别涉及电网数据治理系统及方法。
背景技术
电网系统在运行时会产生大量的业务数据,这些业务数据通常存储在业务系统中。业务数据分为结构化数据和非结构化数据,其中:结构化数据(例如电网运行时间、电网产电量等数据)是存储在数据库中的行数据,可以用数据库二维逻辑表来表现;非结构化数据(例如电网运行实时监控视频、实时监控图像等所包含的信息数据)的数据结构不规则或不完整,没有预定义的数据模型,故不方便用数据库二维逻辑表来表现。
现有一种基于元数据的数据治理系统,其从业务系统中采集电网系统运行时产生的业务数据,再从业务数据中提取元数据进行展示,然后对业务数据进行质量检查,若检查出有业务数据出现质量问题,则对检查出有质量问题的业务数据进行修复,然后将修复好的业务数据返回给业务系统进行更新,并同步更新展示中的元数据。但由于业务数据包含有不方便用数据库二维逻辑表来表现的非结构化数据,故目前难以及时检查出有质量问题的业务数据并加以修复。
发明内容
本发明要解决的技术问题是如何及时检查出有质量问题的业务数据并加以修复。
为解决上述技术问题,本发明提供电网数据治理系统,包括:
元数据管理模块,其从业务系统采集来自电网系统的多个业务数据,从各个业务数据当中提取对其进行描述的元数据及来源信息,根据所述来源信息分析出各个元数据的全链关系和关联关系;
本体建模模块,其识别各个业务数据的数据特征和各个元数据的元数据特征,根据所述数据特征和所述元数据特征分别对所述业务数据和所述元数据进行聚类,然后根据各个元数据的全链关系和关联关系建立起多个元数据相互之间的语义关系,再根据聚类结果和所述语义关系建立本体模型;
数据资产目录模块,其以知识图谱形式展示所述本体模型;
数据标准管理模块,其识别所述本体模型中各个元数据所描述的业务数据的属性,根据所述属性建立相应业务数据的数据标准,并对所述数据标准进行管理;
数据质量检查模块,其从数据标准管理模块中获取所述数据标准,并对所述数据标准进行字段拆解,再根据拆解得到的字段生成数据质量检查规则,然后建立数据质量检查规则与相应元数据的映射关系,根据所述映射关系利用所述数据质量检查规则对相应元数据所描述的业务数据进行质量检查;
质量问题修复模块,其从数据质量检查模块中获取检查出有质量问题的业务数据,并获取对该业务数据进行描述的元数据的全链关系,根据该全链关系对有质量问题的业务数据进行来源定位并获取以往的修复案例,根据所述修复案例生成质量问题修复实例,再根据所述质量问题修复实例对有质量问题的业务数据进行修复,并将修复好的业务数据返回给所述业务系统进行更新,并同步更新数据资产目录模块中展示的数据内容。
优选地,所述数据资产目录模块还展示所述数据质量检查模块的质量检查结果。
优选地,所述全链关系包括血缘关系和影响关系。
优选地,所述数据标准包括完整性数据标准、时效性数据标准、一致性数据标准和准确性数据标准当中的至少一个。
优选地,所述质量问题修复实例包括日期信息实例和作业时间实例当中的至少一个。
本发明还提供电网数据治理方法,包括如下步骤:
A.从业务系统采集来自电网系统的多个业务数据,从各个业务数据当中提取对其进行描述的元数据及来源信息,根据所述来源信息分析出各个元数据的全链关系和关联关系;
B.识别各个业务数据的数据特征和各个元数据的元数据特征,根据所述数据特征和所述元数据特征分别对所述业务数据和所述元数据进行聚类,然后根据各个元数据的全链关系和关联关系建立起多个元数据相互之间的语义关系,再根据聚类结果和所述语义关系建立本体模型;
C.以知识图谱形式展示所述本体模型;
D.识别所述本体模型中各个元数据所描述的业务数据的属性,根据所述属性建立相应业务数据的数据标准,并对所述数据标准进行管理;
E.对所述数据标准进行字段拆解,再根据拆解得到的字段生成数据质量检查规则,然后建立数据质量检查规则与相应元数据的映射关系,根据所述映射关系利用所述数据质量检查规则对相应元数据所描述的业务数据进行质量检查;
F.获取检查出有质量问题的业务数据,并获取对该业务数据进行描述的元数据的全链关系,根据该全链关系对有质量问题的业务数据进行来源定位并获取以往的修复案例,根据所述修复案例生成质量问题修复实例,再根据所述质量问题修复实例对有质量问题的业务数据进行修复,并将修复好的业务数据返回给所述业务系统进行更新,并同步更新展示的数据内容。
优选地,所述步骤E中,在对所述业务数据进行质量检查之后,还展示质量检查结果。
本发明具有以下有益效果:因为数据质量检查规则是根据对数据标准进行字段拆解后得到的字段而生成的,而该数据标准是根据本体模型中的元数据所描述的业务数据的属性而建立的,所以利用该数据质量检查规则对业务数据进行质量检查,就算业务数据包含有非结构化数据也能及时检查出有质量问题的业务数据,然后对该数据质量检查规则进行质量评估所得到的质量问题修复实例就包含有数据标准的字段,这样就能根据该质量问题修复实例及时对检查出有质量问题的业务数据进行来源定位并修复,再将修复好的业务数据返回给业务系统进行更新,并同步更新数据资产目录模块中展示的数据内容。
附图说明
图1是电网数据治理系统的示意图;
图2是电网数据治理方法的流程示意图。
具体实施方式
以下结合具体实施方式对本发明创造作进一步详细说明。
电网数据治理系统如图1所示,包括依次连接的元数据管理模块1、本体建模模块2、数据资产目录模块3、数据标准管理模块4、数据质量检查模块5和质量问题修复模块6,并且,数据质量检查模块5和质量问题修复模块6还连接数据资产目录模块3。
电网系统在运行时会产生大量的业务数据,这些业务数据存储在业务系统中。元数据管理模块1从业务系统采集来自电网系统的多个业务数据,从各个业务数据当中提取对其进行描述的元数据及来源信息,并根据来源信息分析出各个元数据的全链关系和关联关系。其中,全链关系包括血缘关系和影响关系,血缘关系反映元数据的上一级来源对象,影响关系反映元数据的下一级作用对象;关联关系反映各个元数据之间的相互关系,例如时间关系、特征关系。
在数据采集过程中,对业务数据进行ETL(Extract-Transform-Load,抽取-转换-加载)操作,即首先从业务系统抽取(Extract)出所需的业务数据,然后对抽取出的业务数据进行数据清洗,在清洗过程中将不符合要求的业务数据进行过滤和剔除,然后将清洗后的业务数据转换(Transform)成特定的数据格式,最终将业务数据加载(Load)到预先定义好的数据仓库中去。
需要说明的是,业务数据包括结构化数据和非结构化数据,结构化数据是指存储在数据库中的行数据,例如电网运行时间、电网产电量等,其可以用数据库二维逻辑表来表现;非结构化元数据的数据结构不规则或不完整,没有预定义的数据模型,例如电网运行实时监控视频、实时监控图像等所包含的信息数据,故不方便用数据库二维逻辑表来表现。
在元数据管理模块1提取出元数据之后,本体建模模块2识别各个业务数据的数据特征和各个元数据的元数据特征,然后根据数据特征和元数据特征对业务数据和元数据进行聚类,然后根据各个元数据的全链关系和关联关系建立起多个元数据相互之间的语义关系,再根据聚类结果和语义关系建立本体模型。具体地,在聚类过程中将特征相同的数据分为一个类,再根据语义关系将各个类相连起来,这样本体模型包括多个结点和多条边,其中结点代表实体/概念,边代表其两端的实体/概念之间的各种语义关系。例如:第一结点代表机房监控图像,第二结点代表电网系统的机房编号,则这两个结点之间的边代表第二结点是第一结点的来源;第一结点代表机房监控图像,第二结点代表日期2021.01.01,则这两个结点之间的边代表第二结点是第一结点的生成日期。
数据资产目录模块3获取本体建模模块2所建立的本体模型,并以知识图谱形式展示该本体模型。知识图谱是语义网络的知识库,其与本体模型相同,也包括多个结点和多条边,其中结点代表实体/概念,边代表其两端的实体/概念之间的各种语义关系。
数据标准管理模块4从本体模型中识别各个元数据所描述的业务数据的属性,这些属性包括来源属性、名称属性、日期属性、作业时间属性等,数据标准管理模块4根据这些属性建立相应业务数据的数据标准,并对该数据标准进行管理。其中,数据标准(DataStandards)是指保障数据的内外部使用、交换的一致性和准确性的规范性约束,其是进行数据标准化、消除数据业务歧义的主要依据,构建一套完整的数据标准是开展数据标准管理工作的良好基础,有利于打通数据底层的互通性,提升数据的可用性。本实施例中,数据标准包括完整性数据标准、时效性数据标准、一致性数据标准和准确性数据标准当中的至少一个。
数据质量检查模块5从数据标准管理模块4中获取数据标准,并对获取到的数据标准进行字段拆解,再根据拆解得到的字段生成数据质量检查规则,然后建立各个数据质量检查规则与相应元数据的映射关系,根据这些映射关系利用数据质量检查规则对相应元数据所描述的业务数据进行质量检查。例如,数据质量检查模块5从数据标准管理模块4中获得包含日期格式标准的数据标准,该数据标准包含完整性数据标准和准确性数据标准,数据质量检查模块5对该包含日期格式标准的数据标准进行字段拆解之后,得到八条语句,包括:(1)字段长度为8;(2)前四个字段结合起来上限为当前年份;(3)前四个字段结合起来所代表的年份是否代表闰年;(4)第五字段和第六字段结合起来上限为12;(5)当第五字段和第六字段结合起来为01、03、05、07、08、10或12时,后两个字段结合起来上限为31;(6)当第五字段和第六字段结合起来为04、06、09或11时,后两个字段结合起来上限为30;(7)当第五字段和第六字段结合起来为02且前四个字段结合起来所代表的年份代表闰年时,后两个字段结合起来上限为29;(8)当第五字段和第六字段结合起来为02且前四个字段结合起来所代表的年份代表平年时,后两个字段结合起来上限为28。这样,数据质量检查模块5根据这8个语句就能得到字段YYYYMMDD,其中,YYYY代表年份,上限为当前年份;MM代表月份,上限为12;DD代表日,上限按实际情况分为四种:(1)当MM为01、03、05、07、08、10或12时,DD上限为31;(2)当MM为04、06、09或11时,DD上限为30;(3)当MM为02且YYYY代表闰年时,DD上限为29;(4)当MM为2且YYYY代表平年时,DD上限为28。数据质量检查模块5根据拆解得到的字段YYYYMMDD生成用于检查业务数据日期信息的数据质量检查规则,并建立该数据质量检查规则与业务数据日期信息的映射关系,然后根据该映射关系利用该数据质量检查规则对业务数据进行质量检查,在质量检查过程中判断业务数据是否完整和准确,例如:若业务数据的日期信息为2021.01(缺少月份或日),则意味着该业务数据不完整,故数据质量检查不通过;若业务数据的日期信息为01.01,则意味着该业务数据不完整(缺少年份),故数据质量检查不通过;若业务数据的日期信息为2021.01.33,则意味着该业务数据不准确(日超出上限),故数据质量检查不通过;若业务数据的日期信息为2021.01.01,则意味着该业务数据完整且准确,故数据质量检查通过。
需要说明的是,数据质量检查模块5在对某个业务数据进行质量检查并得到质量检查结果之后,还将该业务数据的质量检查结果发送给数据资产目录模块3进行展示。
在数据质量检查模块5检查出存在业务数据有质量问题的情况下,质量问题修复模块6从数据质量检查模块5中获取检查出有质量问题的业务数据,并获取对该业务数据进行描述的元数据的全链关系,再从该全链关系获取其所包含的血缘关系,根据该全链关系所包含的血缘关系获取有质量问题的业务数据的来源信息,根据该来源信息对有质量问题的业务数据进行来源定位,并获取该业务数据以往的修复案例,然后根据该修复案例生成质量问题修复实例,再根据该质量问题修复实例对检查出有质量问题的业务数据进行修复,并将修复好的业务数据返回给业务系统进行更新,并同步更新数据资产目录模块3中展示的数据内容。其中,质量问题修复实例包括实例名、日期、作业时间等数据信息。
例如,某个业务数据为日期信息2021.01.33,则数据资产目录模块3展示对应该日期信息的元数据内容2021.01.33,这意味着该日期信息没有对后两个字段的上限进行限定。此情况下,数据质量检查模块5根据用于检查数据日期信息的数据质量检查规则检查出该业务数据出现了日期信息错误的质量问题,故质量问题修复模块6从数据质量检查模块5中获取该业务数据,并获取对该业务数据进行描述的元数据的全链关系,再从该全链关系获取其所包含的血缘关系,根据该全链关系所包含的血缘关系获取有质量问题的业务数据的来源信息,然后根据该来源信息对有质量问题的业务数据进行来源定位,例如定位得到该有质量问题的业务数据来源于表格一,那么就获取以往对表格一中的日期信息进行修复的修复案例,然后根据该修复案例生成质量问题修复实例,例如,以往对表格一中的日期信息进行修复的修复案例为:对日期信息YYYYMMDD,将YYYY上限定为当前年份,将MM上限定为12,将DD上限定为四种:(1)当MM为01、03、05、07、08、10或12时,DD上限为31;(2)当MM为04、06、09或11时,DD上限为30;(3)当MM为02且YYYY代表闰年时,DD上限为29;(4)当MM为02且YYYY代表平年时,DD上限为28。这样,根据该修复案例就可生成质量问题修复实例,具体地:质量问题修复实例为YYYYMMDD,其中YYYY上限定为当前年份,MM上限定为12,DD上限按实际情况分为四种:(1)当MM为01、03、05、07、08、10或12时,DD上限为31;(2)当MM为04、06、09或11时,DD上限为30;(3)当MM为02且YYYY代表闰年时,DD上限为29;(4)当MM为02且YYYY代表平年时,DD上限为28。
质量问题修复模块6根据该质量问题修复实例对检查出有质量问题的业务数据进行修复,具体地:日期信息2021.01.33当中的33相较于DD的上限31多出2,故质量问题修复模块6按照常规的日期递进规则,将日期信息2021.01.33中的MM(01)加1,得到新的MM为02,然后将日期信息2021.01.33中的DD(33)改为02,最终得到修复好的业务数据为日期信息2021.02.02。质量问题修复模块6将有质量问题的业务数据修复好之后,将修复好的业务数据返回给业务系统进行更新,具体更新为2021.02.02,然后同步更新数据资产目录模块3中展示的数据内容,这样该业务数据原本在数据资产目录模块3所展示的对应业务数据日期信息的数据内容就由2021.01.33更新为2021.02.02。
综上,电网数据治理系统在运行时会执行如图2所示的电网数据治理方法,该方法包括如下步骤:
A.从业务系统采集来自电网系统的多个业务数据,从各个业务数据当中提取对其进行描述的元数据及来源信息,根据来源信息分析出各个元数据的全链关系和关联关系;
B.识别各个业务数据的数据特征和各个元数据的元数据特征,根据数据特征和元数据特征分别对业务数据和元数据进行聚类,然后根据各个元数据的全链关系和关联关系建立起多个元数据相互之间的语义关系,再根据聚类结果和语义关系建立本体模型;
C.以知识图谱形式展示本体模型;
D.识别本体模型中各个元数据所描述的业务数据的属性,根据属性建立相应业务数据的数据标准,并对数据标准进行管理;
E.对数据标准进行字段拆解,再根据拆解得到的字段生成数据质量检查规则,然后建立数据质量检查规则与相应元数据的映射关系,根据所述映射关系利用数据质量检查规则对相应元数据所描述的业务数据进行质量检查;
F.获取检查出有质量问题的业务数据,并获取对该业务数据进行描述的元数据的全链关系,根据该全链关系对有质量问题的业务数据进行来源定位并获取以往的修复案例,根据修复案例生成质量问题修复实例,再根据质量问题修复实例对有质量问题的业务数据进行修复,并将修复好的业务数据返回给业务系统进行更新,并同步更新展示的数据内容。
如上所述仅为本发明创造的实施方式,不以此限定专利保护范围。本领域技术人员在本发明创造的基础上作出非实质性的变化或替换,仍落入专利保护范围。

Claims (8)

1.电网数据治理系统,其特征是,包括:
元数据管理模块,其从业务系统采集来自电网系统的多个业务数据,从各个业务数据当中提取对其进行描述的元数据及来源信息,根据所述来源信息分析出各个元数据的全链关系和关联关系,所述全链关系包括血缘关系和影响关系;
本体建模模块,其识别各个业务数据的数据特征和各个元数据的元数据特征,根据所述数据特征和所述元数据特征分别对所述业务数据和所述元数据进行聚类,然后根据各个元数据的全链关系和关联关系建立起多个元数据相互之间的语义关系,再根据聚类结果和所述语义关系建立本体模型;
数据资产目录模块,其以知识图谱形式展示所述本体模型;
数据标准管理模块,其识别所述本体模型中各个元数据所描述的业务数据的属性,根据所述属性建立相应业务数据的数据标准,并对所述数据标准进行管理;
数据质量检查模块,其从数据标准管理模块中获取所述数据标准,并对所述数据标准进行字段拆解,再根据拆解得到的字段生成数据质量检查规则,然后建立数据质量检查规则与相应元数据的映射关系,根据所述映射关系利用所述数据质量检查规则对相应元数据所描述的业务数据进行质量检查;
质量问题修复模块,其从数据质量检查模块中获取检查出有质量问题的业务数据,并获取对该业务数据进行描述的元数据的全链关系,根据该全链关系对有质量问题的业务数据进行来源定位并获取以往的修复案例,根据所述修复案例生成质量问题修复实例,再根据所述质量问题修复实例对有质量问题的业务数据进行修复,并将修复好的业务数据返回给所述业务系统进行更新,并同步更新数据资产目录模块中展示的数据内容。
2.根据权利要求1所述的电网数据治理系统,其特征是,所述数据资产目录模块还展示所述数据质量检查模块的质量检查结果。
3.根据权利要求1所述的电网数据治理系统,其特征是,所述数据标准包括完整性数据标准、时效性数据标准、一致性数据标准和准确性数据标准当中的至少一个。
4.根据权利要求1所述的电网数据治理系统,其特征是,所述质量问题修复实例包括日期信息实例和作业时间实例当中的至少一个。
5.电网数据治理方法,其特征是,包括如下步骤:
A.从业务系统采集来自电网系统的多个业务数据,从各个业务数据当中提取对其进行描述的元数据及来源信息,根据所述来源信息分析出各个元数据的全链关系和关联关系,所述全链关系包括血缘关系和影响关系;
B.识别各个业务数据的数据特征和各个元数据的元数据特征,根据所述数据特征和所述元数据特征分别对所述业务数据和所述元数据进行聚类,然后根据各个元数据的全链关系和关联关系建立起多个元数据相互之间的语义关系,再根据聚类结果和所述语义关系建立本体模型;
C.以知识图谱形式展示所述本体模型;
D.识别所述本体模型中各个元数据所描述的业务数据的属性,根据所述属性建立相应业务数据的数据标准,并对所述数据标准进行管理;
E.对所述数据标准进行字段拆解,再根据拆解得到的字段生成数据质量检查规则,然后建立数据质量检查规则与相应元数据的映射关系,根据所述映射关系利用所述数据质量检查规则对相应元数据所描述的业务数据进行质量检查;
F.获取检查出有质量问题的业务数据,并获取对该业务数据进行描述的元数据的全链关系,根据该全链关系对有质量问题的业务数据进行来源定位并获取以往的修复案例,根据所述修复案例生成质量问题修复实例,再根据所述质量问题修复实例对有质量问题的业务数据进行修复,并将修复好的业务数据返回给所述业务系统进行更新,并同步更新展示的数据内容。
6.根据权利要求5所述的电网数据治理方法,其特征是,所述步骤E中,在对所述业务数据进行质量检查之后,还展示质量检查结果。
7.根据权利要求5所述的电网数据治理方法,其特征是,所述数据标准包括完整性数据标准、时效性数据标准、一致性数据标准和准确性数据标准当中的至少一个。
8.根据权利要求5所述的电网数据治理方法,其特征是,所述质量问题修复实例包括日期信息实例和作业时间实例当中的至少一个。
CN202111565897.9A 2021-12-20 2021-12-20 电网数据治理系统及方法 Active CN114356940B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111565897.9A CN114356940B (zh) 2021-12-20 2021-12-20 电网数据治理系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111565897.9A CN114356940B (zh) 2021-12-20 2021-12-20 电网数据治理系统及方法

Publications (2)

Publication Number Publication Date
CN114356940A CN114356940A (zh) 2022-04-15
CN114356940B true CN114356940B (zh) 2024-05-14

Family

ID=81100670

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111565897.9A Active CN114356940B (zh) 2021-12-20 2021-12-20 电网数据治理系统及方法

Country Status (1)

Country Link
CN (1) CN114356940B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114780531A (zh) * 2022-05-07 2022-07-22 广州光点信息科技股份有限公司 一种多功能大数据智能分析服务系统及方法
CN115374108B (zh) * 2022-07-22 2023-06-20 北京三维天地科技股份有限公司 一种基于知识图谱技术的数据标准生成与自动映射方法
CN115543973B (zh) * 2022-09-19 2023-06-13 北京三维天地科技股份有限公司 一种基于知识谱图与机器学习的数据质量规则推荐方法
CN117349388B (zh) * 2023-12-05 2024-02-20 南京智绘星图信息科技有限公司 数据时效性确定方法、电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8601326B1 (en) * 2013-07-05 2013-12-03 Palantir Technologies, Inc. Data quality monitors
CN108447534A (zh) * 2018-05-18 2018-08-24 灵玖中科软件(北京)有限公司 一种基于nlp的电子病历数据质量管理方法
CN110019384A (zh) * 2017-08-15 2019-07-16 阿里巴巴集团控股有限公司 一种血缘数据的获取方法、提供血缘数据的方法及装置
CN111563007A (zh) * 2020-04-27 2020-08-21 平安医疗健康管理股份有限公司 运算错误修复方法、装置、计算机系统及可读存储介质
CN112732924A (zh) * 2020-12-04 2021-04-30 国网安徽省电力有限公司 一种基于知识图谱的电网数据资产管理系统与方法
CN113032579A (zh) * 2021-03-25 2021-06-25 中国建设银行股份有限公司 一种元数据血缘分析方法、装置、电子设备和介质
CN113656647A (zh) * 2021-06-02 2021-11-16 韦东庆 一种面向智能运维的工程档案数据管理平台、方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8601326B1 (en) * 2013-07-05 2013-12-03 Palantir Technologies, Inc. Data quality monitors
CN110019384A (zh) * 2017-08-15 2019-07-16 阿里巴巴集团控股有限公司 一种血缘数据的获取方法、提供血缘数据的方法及装置
CN108447534A (zh) * 2018-05-18 2018-08-24 灵玖中科软件(北京)有限公司 一种基于nlp的电子病历数据质量管理方法
CN111563007A (zh) * 2020-04-27 2020-08-21 平安医疗健康管理股份有限公司 运算错误修复方法、装置、计算机系统及可读存储介质
CN112732924A (zh) * 2020-12-04 2021-04-30 国网安徽省电力有限公司 一种基于知识图谱的电网数据资产管理系统与方法
CN113032579A (zh) * 2021-03-25 2021-06-25 中国建设银行股份有限公司 一种元数据血缘分析方法、装置、电子设备和介质
CN113656647A (zh) * 2021-06-02 2021-11-16 韦东庆 一种面向智能运维的工程档案数据管理平台、方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Steering data quality with visual analytics: The complexity challenge;Shixia Liu等;《Visual Informatics》;20181231;第2卷(第4期);191-197 *
时序数据错误检测与修复研究综述;丁小欧等;《智能计算机与应用》;20211201;第11卷(第12期);1-6 *
非结构化数据特征建模与存储方法研究;陈彬;《电子设计工程》;20211119;第29卷(第22期);47-50 *

Also Published As

Publication number Publication date
CN114356940A (zh) 2022-04-15

Similar Documents

Publication Publication Date Title
CN114356940B (zh) 电网数据治理系统及方法
CN105868373B (zh) 电力业务信息系统关键数据处理方法及装置
CN109213747B (zh) 一种数据管理方法及装置
CN109784758B (zh) 基于bim模型的工程质量监管预警系统和方法
CN110851667B (zh) 一种多源头大量数据的整合分析方法及工具
CN111581104A (zh) 一种基于DevOps研发运营一体化的度量方法
CN111080261A (zh) 一种基于大数据的可视化数据资产管理系统
CN111177134A (zh) 适用于海量数据的数据质量分析方法、装置、终端及介质
CN114880405A (zh) 一种基于数据湖的数据处理方法及系统
CN114153914A (zh) 电厂设备缺陷可视化系统、方法、计算机设备及存储介质
CN110688381A (zh) 一种用于产品过程记录追溯的软件产品和软件方法
CN112598142B (zh) 一种风电机组检修工作质量审查辅助方法与系统
CN105677723A (zh) 一种用于工业信号源的数据标签建立与检索方法
US11308104B2 (en) Knowledge graph-based lineage tracking
CN116303741A (zh) 数据展示方法、设备及存储介质
CN114049036A (zh) 数据计算平台、方法、设备及存储介质
CN110597899B (zh) 项目经费管理方法及系统
CN112364095A (zh) 一种数据溯源分析可视化的方法
CN113159118A (zh) 物流数据指标的处理方法、装置、设备及存储介质
CN112396349A (zh) 一种基于业务实体的数据质量监控方法
CN117150097B (zh) 一种执法检查清单自动匹配方法
CN113435701B (zh) 一种消费品质量信息的处理方法和装置
CN113409165B (zh) 电力数据集成方法、装置、电子设备及可读存储介质
CN117909395A (zh) 一种平台数据上报服务方法
CN117370448B (zh) 品牌数字资产洞察分析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant