具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例一提供的电力业务信息系统关键数据处理方法的流程示意图。如图1所示,所述方法包括:
步骤101、获取并存储关键数据。
其中,可具体采用如下方法中的一种或任意多个的组合来获取并存储关键数据:
接收各业务系统推送的关键数据,将接收到的所述关键数据进行存储;和/或
接收用户通过人机交互界面填报的关键数据,将填报的所述关键数据进行存储;和/或
接收通过数据导入形式导入的关键数据,将导入的所述关键数据进行存储;和/或
获取通过对报表数据进行拆分后得到的关键数据,将获取到的所述关键数据进行存储。
步骤102、根据预设的筛查规则,对存储的所有关键数据进行筛查,以筛查出需进行质量检测的关键数据。
具体的,本步骤可采用如下方法实现:
首先,将具有与设定类编码相同的关键数据筛查出,得到第一次筛查结果。
然后,在所述第一次筛查结果中,根据预设的筛查数据时间范围,筛查出具有在所述筛查时间范围内的时间戳的关键数据,得到第二次筛查结果。
其中,所述第二次筛查结果中包含有所述需进行质量检测的关键数据。
这里需要说明的是:本步骤所实现的筛查过程可以设定为按照设定的筛选频率来进行。其中,所述设定筛选频率可以人为设定,本实施例对此不作具体限定。即根据设定的筛查频率,采用如下方法,筛查出需进行质量检测的关键数据:
根据预设的筛查规则,对存储的所有关键数据进行筛查,以筛查出需进行质量检测的关键数据。
步骤103、根据预设的质量检测规则,对所述需进行质量检测的关键数据进行质量检测,并生成对应的检测结果。
在具体实施例过程中,所述预设的质量检测规则可以包括:及时性检测规则、完整性检测规则及准确性检测规则中的任意一种或多种的组合。相应的,本步骤可具体采用如下各步骤实现:
若所述预设的质量检测规则包括有及时性检测规则,则根据所述及时性检测规则中确定的接入时间,判断关键数据的时间戳是否与所述确定的接入时间相符,并得出及时性判断结果;
若所述预设的质量检测规则包括有完整性检测规则,则根据所述完整性检测规则,判断关键数据是否完整,并得出完整性判定结果;
若所述预设的质量检测规则包括有准确性检测规则,则根据所述准确性检测规则,判断关键数据是否准确,并得出准确性判定结果。
其中,上述步骤中:根据所述完整性检测规则,判断关键数据是否完整,并得出完整性判定结果,可具体采用如下方式实现:
判断关键数据的维度信息是否完整,若不完整,则所述关键数据不完整,否则,进行字段值的判断;其中,所述维度信息包含在所述关键数据的属性信息中;
判断关键数据的字段值是否完整,若不完整,则所述关键数据不完整,否则,进行时间戳的判断;
判断关键数据的时间戳是否完整,若不完整,则所述关键数据不完整,否则,进行标准对等判断;
判断关键数据中包含的单位编码和电压等级是否与标准对等,若不对等,则所述关键数据不完整,否则,进行类编码是否在预设字典的查询;
若关键数据的类编码不在所述预设字典中,则关键数据不完整;
若关键数据的类编码在所述预设字典中,则关键数据完整。
这里需要补充的是:当前除了上述各规则外,预设的质量检测规则还可以包括自定义规则。其中,所述自定义规则为用户根据自己的需求设定的规则。
步骤104、获取关键数据的类编码。
步骤105、将所述类编码相同的关键数据以及对应的检测结果,按照设定的质量报告模板生成质量报告。
本实施例提供的技术方案通过对关键数据进行筛查,以在海量的数据中找到需要进行质量检测的关键数据,减少质量检测耗时,提高检测效率;通过对关键数据进行质量检测,可对关键数据进行全面的监控和质量判定,以提高关键数据的参考价值,为关键数据的质量提供保障与支持。
进一步的,如图2所示,上述实施例提供的所述方法还可以包括如下步骤:
步骤106、接收用户通过人机交互界面输入的查询请求,所述查询请求中携带有查询指示信息及查询关键词。
步骤107、根据所述查询关键词,查找出与所述关键词相匹配的关键数据。
步骤108、按照所述查询指示信息,对查找出的所有关键数据进行筛选与统计,得到满足所述查询指示信息的查询结果。
其中,所述查询指示信息包括:按来源查询、按归口业务部门查询、按关联查询、按频率查询、按单位查询和按关键数据明细查询中的任意或多种的组合;
所述关键数据携带有属性信息,所述属性信息包括有:来源信息、归口业务部门信息、关联信息、时间戳和单位信息中的任意一种或多种的组合;
相应的,本步骤108、按照所述查询指示信息,对查找出的所有关键数据进行筛选与统计,得到满足所述查询指示信息的查询结果,可具体由如下步骤实现:
若所述查询指示信息包括有按来源查询,则将包含有与所述查询指示信息中携带的来源信息相同的来源信息的关键数据筛选出来,并进行统计,得到满足所述查询指示信息的查询结果;
若所述查询指示信息包括有按归口业务部门查询,则将包含有与所述查询指示信息中携带的归口业务部门信息相同的归口业务部门信息的关键数据筛选出来,并进行统计,得到满足所述查询指示信息的查询结果;
若所述查询指示信息包括有按关联查询,则根据关键数据的属性信息中包含的关联信息,查询出与所述关键数据相关联的应用,并进行统计,得到满足所述查询指示信息的查询结果;
若所述查询指示信息包括有按频率查询,则根据所述关键数据的属性信息中包含的时间戳,统计所述关键数据在预设时间段内的出现次数,将出现次数大于设定阈值的关键数据筛选出来,并进行统计,得到满足所述查询指示信息的查询结果;
若所述查询指示信息包括有按单位查询,则将包含有与所述查询指示信息中携带的单位信息相同的单位信息的关键数据筛选出来,并进行统计,得到满足所述查询指示信息的查询结果;
若所述查询指示信息包括有按关键数据明细查询,则获取关键数据的明细数据,并进行统计,得到满足所述查询指示信息的查询结果。
进一步的,上述实施例提供的所述方法还可以包括如下步骤:
判断所述质量报告中携带的所述检测结果是否大于设定告警阈值;若大于,则生成告警信息。
进一步的,上述实施例提供的所述方法还可以包括如下步骤:
记录所述质量报告的生成时间,并将所述质量报告及其对应的生成时间进行存储。
通过增加上述步骤可为后续查询提供帮助,以方便用户随时调用某一时间内的所有质量报告,对关键数据进行跟踪查询。
进一步的,上述实施例提供的所述方法还可以包括:
步骤109、接收用户通过人机交互界面输入的统计展示请求。
步骤1010、根据所述统计展示请求,对所有关键数据的检测结果进行统计,并生成对应的统计图表进行展示。
其中,统计图表包括有时间戳信息、关键数据和检测结果。
用户可通过上述步骤对所述关键数据进行统计展示的请求,采用上述方法可为用户提供较为显著的,较为容易观看的图表,以帮助用户对后续的工作进行决策和规划。
下面结合具体的应用实例,对上述实施例提供的方法做进一步的说明。
本应用实例提供了一种能够实现上述方法的应用系统。该应用系统的建设以关键数据核心,以提供更集中的数据管理、更全面的数据校验、更高效的数据利用、更可靠的数据质量为目标,建立以下五大中心,实现对江西电力企业数据质量的的全面管理与监控。图3示出了这五大中心的系统总体功能架构,具体的,这五大中心包括:
第一大中心、资源管理中心。该资源管理中心对各专业、各应用的关键数据进行收集、存储,并完成对每类关键数据的规范定义及关键数据台账的统一管理,同事提供对关键数据的分类统计、分析和检索功能。
该资源管理中心包括:关键数据资源模型管理、关键数据接入、关键数据填报、关键数据导入、关键数据查询管理。当然也能对手工报表数据进行管理。
关键数据模型中,编码、名称、维度、业务时间、存储的数据表、计量单位、来源系统、频率要求、接入时间要求是基本必填信息。
每类关键数据需要定义一个唯一的编码,该编码作为每一条关键数据记录的唯一标识。为满足监控与质量检查的需要,在关键数据模型中,需要对关键数据存储的数据表结构进行统一的定义。
关键数据一般为统计值,每个关键数据有明确的编码规范及维度属性,在具体的使用时候能根据编码及维度进行检索使用。
关键数据查询:提供按各种条件进行检索与统计的功能,包括:查询、统计、趋势分析、对比、告警信息、明细等等。
相关查询:选择某个关键数据,查询出所有与之相关的应用。通过该功能了解当该关键数据出现异常时候将对哪些业务应用关键数据产生影响。
关键数据模型规范如下:
关键数据编码:根据业务应用场景定义不同的关键数据编码规范对关键数据进行唯一编码
关键数据名称:关键数据的完整名称
关键数据简称 :关键数据的简称
关键数据定义 :说明关键数据具体的含义及计算方法
关键数据分类 :人力资源、财务管理、物资管理、项目管理、规划计划、生产管理、运行管理、营销管理、电力交易、综合管理等。
计量单位 :关键数据的基本计量单位,比如千瓦时、 公里、次等
数据精度 :数据的要求的精度(小数位数)
统计口径 :关键数据统计范围, 如全口径、 直管县公司等
关键数据维度:比如按单位、电压等级等维度
计算公式 :对关键数据值的计算方法及规则进行描述
数据归口部门:该关键数据对应的业务部门
关键数据来源系统:该关键数据的来源业务系统,如ERP、PMS
接入频率:该关键数据的更新周期,如日、月、季、年等
数据接入时间要求:更新的具体时间要求,如每月1日接入上个月该资源数据。
关键数据存储的数据表对象名称:该关键数据在数据中心oracle中所存储的数据表名称。多个关键数据可共用相同的数据表。
数据表所属数据库用户:该关键数据在数据中心oracle中所存储的数据表所属Oracle用户
关键数据对应的表结构描述:如对每一关键数据的数据项进行定义,
关键数据明细表:部分关键数据需要接入关键数据的详细数据明细
如:“110kV输电线路条数” 关键数据按模板格式梳理如下:
关键数据编码 |
SC0001 |
关键数据名称 |
输电线路长度-电压等级-110kV |
关键数据简称 |
110kV输电线路条数 |
关键数据分类 |
生产关键数据 |
计量单位 |
条 |
数据精度 |
整数 |
数据频度 |
月 |
关键数据定义 |
电网所辖运行状态的110kV输电线路的条数 |
统计口径 |
全口径 |
计算公式 |
累加 |
数据单位维度要求 |
地市公司 |
数据归口部门 |
生产技术部 |
数据来源系统 |
PMS |
接入频率 |
月度 |
数据接入时间要求 |
每月1日上传上月该关键数据 |
数据应用范围 |
IAS |
数据表对象名称 |
INDEX_DATA_MONTH_PMS |
数据表所属数据库用户 |
ods_Pms |
关键数据对应的表结构描述 |
见《“110kV输电线路长度”关键数据存储结构》 |
关键数据明细表 |
部分关键数据需要接入关键数据的详细数据明细 |
“110kV输电线路长度” 关键数据存储结构如下:
关键数据明细定义:
对部分特殊的关键数据,需要接入关键数据明细表。由于各个关键数据明细的数据结构是不一样的,因此需要根据具体的关键数据接入明细进行分别定义。关键数据明细的接入,由各业务应用系统将制定的关键明细数据发送到数据中心的特定明细表中,该明细的数据结构可以由业务应用系统方根据需要接入的明细要求进行制定。
下面以“输电线路设备台账”数据项明细规范为例说明其定义的格式:
数据项名称 |
数据项描述 |
数据项字段 |
可否为空 |
电压等级 |
电压等级 |
VOLTAGEID |
是 |
所属供电公司 |
所属供电公司 |
organCode |
是 |
线路名称 |
线路名称 |
NAME |
否 |
导线型号 |
导线型号 |
WIRE_XH |
是 |
长期允许载流量 |
长期允许载流量 |
LONGFLUX |
是 |
输送容量 |
输送容量 |
CAPACITY |
是 |
线路长度 |
线路长度 |
LENGTH |
是 |
架空线长度 |
架空线长度 |
ELENGTH |
是 |
电缆长度 |
电缆长度 |
CLENGTH |
是 |
线路杆塔资料 |
线路杆塔资料 |
TOWERINFO |
是 |
正序电阻 |
正序电阻 |
PR1 |
是 |
线路终止站ID |
线路终止站ID |
ENDSTATID |
是 |
…… |
|
|
|
关键数据接入:
关键数据统一存储在ODS数据库中,能从业务系统统计并采集的关键数据,由各业务系统进行关键数据的接入,在一定程度上能有效的保证关键数据接入的及时性与客观性。
关键数据接入方式由各业务应用系统采用JDBC或WEBSERVICE等方式将关键数据信息推送到数据中心即可。接入方式由各业务应用系统自行选择并开发接口程序。
在本模块中,只展现各业务系统接入的关键数据,不提供新增、修改和删除的功能,保证接入关键数据客观一致。
关键数据填报:
提供关键数据的填报功能,按照业务系统或专业部门分类,进行相关关键数据的新增、修改和删除操作。
填报的关键数据统一存储在ODS数据库中,对于不能从业务系统采集的关键数据,可以通过关键数据填报的功能,进行关键数据的录入。关键数据的录入工作由各业务部门制定专门人员定期对这些关键数据进行填报。
关键数据导入:
提供关键数据的批量导入功能,通过设计关键数据导入模板并开发导入程序,进行关键数据的导入操作。
导入的关键数据统一存储在ODS数据库中,不能从业务系统采集的关键数据,可以选择通过采用数据导入的形式,一次性将关键数据导入到系统中。关键数据的导入由各业务部门制定专门人员定期对这些关键数据进行导入处理。
手工报表数据管理:
对各专业的手工报表数据进行关键数据拆分后,通过设置统一的数据报表导入模板,进行手工报表中的关键数据的导入。
需要先将手工报表拆分为关键数据
对报表中的关键数据进行录入或导入(采用统一模板)
关键数据查询统计:
提供按各种条件进行检索与统计的功能。包括:查询、统计、趋势、对比、告警信息、明细等。
其中,按来源系统查询:
一个业务系统可能接入多类关键数据,根据关键数据的来源查询每一类关键数据台账,了解各业务系统业务关键数据接入的情况。如按PMS、ERP、营销管理系统等。
按归口业务部门查询:
查询指定归口业务部门下接入的关键数据台账信息。如按生产技术部、营销部、发展策划部等
按某一关键数据查询:
选择某个关键数据,查询出所有与之相关的应用。通过该功能了解当该关键数据出现异常时候将对哪些业务应用关键数据产生影响。如“110kV输电线路条数”等。
按频率查询:
查询按日、月、年等频率要求接入的关键数据台账
按单位查询:
按单位查询关键数据。
关键数据明细查询 :
当某个关键数据接入了明细数据时,则可以查询该关键数据的明细数据,以便分析和定位该关键数据的关键问题所在以及验证关键数据数值。
关键数据展现:
通过数据表格或数据趋势图、对比图等形式对关键数据进行直观的展现。
第二大中心,质量管理中心。该质量管理中心定义每类关键数据的质量规范,以此为标准实现对接入到数据中心业务数据的及时性、完整性和准确性等方面进行质量检查;根据预置的模板生成质量检查报告,实现对数据质量的评价、监控,为数据质量的预防、数据质量的治理与提升提供辅助支持。
在各类关键数据统一管理的基础上,通过对数据质量检查规则进行设定,实现对各类关键数据质量的监控和分析,形成数据质量报告以实现对数据质量的监控,为提升数据质量提供帮助;配置质量检查策略以及质量检查报告模板,以便对关键数据进行质量检查以及根据检查报告模板生成报告文档;同时,建立数据质量评价标准,对关键数据进行数据质量的考核评价。
质量管理中心包括:检查规则配置管理(及时性规则、完整性规则、准确性规则以及自定义规则)、质量检查测量配置、质量报告模板管理和质量评价模型管理。
其中,检查规则配置管理,针对每一个关键数据,从数据的及时性、完整性、准确性等各个方面定制质量评价规则。每一类关键数据支持多条规则的组合定义;同一类关键数据针对不同单位支持不同的规则定义。
及时性规则:指报送的关键数据是否在要求的时间内,与关键数据的数据接入频率要求是否一致。根据关键数据台帐中的频率要求及接入时间要求两个属性来作为检查规则,当某类数据在要求的时间未接入数据时,则违反了及时性原则。
关键数据的及时性检查规则可具体如下:
根据关键数据频率(日、月、季度、半年、年),设定每个频率确定的关键数据接入时间,以此作为依据进行检查。
到时未接入即为不及时。延时未接入的不放到该类中,放“完整性”检查中。
完整性规则:报送的关键数据是否满足该关键数据每一数据项的要求,与关键数据的数据接入要求是否一致。
完整性规则可具体如下:
1、到检查时候该接入而还未接入的关键数据;
2、维度接入不完整的关键数据;如12个地市公司,其中2个地市公司未接入;
3、字段值不规范,包括必填未填等(需要在梳理的时候制定规范);
4、关键数据日期格式不对(日、年、月、季度、半年)或值的范围不对
5、字典数据不规范的关键数据(如单位编码不对、电压等级不对等)
如电压等级,其取值为
29-65kV;31-110kV;32-220kV;34-500kV
6、关键数据编码未在关键数据字典表中
准确性规则:报送的关键数据是否满足该关键数据每一数据项的要求(如:数据范围、横向与纵向上的一致、明细一致、关联一致),满足关键数据的数据准确性接入要求。
关键数据的准确性检查规则如下:
1、超过阈值的关键数据(本期关键数据值设置阈值,可以是上限、下限或同时上下限)
2、如果关键数据是分层级的,即下级为上级的明细,而且可以直接累加,那么是否需要对累加关键数据与按维护划分的明细关键数据(下级关键数据)进行累计结果的校验?
3、明细到关键数据的合计校验
4、建立关键数据之间的相互校验关系进行交叉校验
5、通过对前N个连续周期内的关键数据进行对比判断(如设定规则,允许与平均值、最大或最小值偏差的范围);
6、通过对前N个同期周期内的关键数据值进行对比判断(如设定规则,允许与平均值、最大或最小值偏差的范围);日关键数据的同期为月,月、季度、半年同期为年。
7、通过对关键数据值在同一周期内不同单位直接的对比进行判断(如设定规则、允许与平均值、最大或最小值偏差的范围)。
自定义规则:允许用户根据自身对关键数据的关注度,对特定关键数据进行自定义规则的检查,主要包括对关键数据值(计划值、累计值)的规则定义。如:自定义某关键数据的值>=99;作为自定义检查规则。自定义规则的检查结果,由定义该检查规则的用户或该用户所属的单位内可见。
质量检查策略配置:数据中心关键数据种类繁多,每一类关键数据对其质量的检查需要细化到组成该关键数据的每一个数据项,要对海量的数据进行逐条逐项的扫描、比对、判断是一项极为耗时的执行过程。因此,通常情况下根据关键数据属性要求的不同而制定不同的检查策略。质量检查测量定义包括如下内容:
1、质量检查规则:
2、关键数据检查范围:对哪些类关键数据进行检查。一次质量检查可同时对多类关键数据进行检查。
3、数据时间范围:每一类进入ODS的数据都要求有时间戳,大部分关键数据在ODS中都是一个随时间记录数据不断递增的。因此从执行效率上来说不可能每次对进入到ODS的该类数据进行全面的检查,而是应该根据具体的要求按照时间戳来进行过滤设置。
4、任务调度定义:由于质量检查极为耗时,一般以预先设定的方式来定义执行时间,可定义为一次性检查,也可按周期定义为重复性多次执行。
系统中可同时配置多个检查策略,策略可通过复制的方式进行新的快速调整及定义,并通过启、停操作来启动质量检查过程的执行。
数据质量检查的目的是为了提升数据质量。因此每次检查执行后需要输出规范的、可清晰阅读的数据质量检查报告来为运维管理人员、各单位人员、数据归口部门人员作为依据来采取措施提升数据质量。
对关键数据的检查按逐个类别进行,每一类又需要按照接入的周期要求逐个周期的检查,通过周期检查该类数据是否按要求接入判断其接入的完整性;每个周期内需要逐条数据进行检查以判断其及时性;每条数据需要进行逐项的检查以判断其及时性、完整性和准确性。而这些所有的检查结果,需要进行结构化的输出以便进行阅读与查询。
为了便于面向不同的人员阅读,在质量检查测量配置的时候,关键数据范围尽可能按来源系统、业务应用、归口部门等进行筛选分类,以便对于报告的阅读者更有针对性。例如:按来源系统,其生成的报告可提交给接口开发商,使之从技术上考虑如何提高数据质量;按业务应用则报告可提供给业务应用的建设厂商使之能够了解所使用的业务数据存在的问题以便对这些问题给其应用产生的影响进行评估;而按归口部门则其报告可提交给这些关键数据的归口部门从日常业务系统的使用方面进行协调以提升数据质量。
质量评价模型管理:
简历数据质量评价标准,主要从关键数据的及时性、完整性、准确性等方面进行数据质量的考核评价。按数据的责任单位、责任部门、来源业务系统、所属专业等建立不同的数据质量评价模型。
考核模型支持规则配置、数据范围配置、计算公式定义、评分标准定义、评价周期定义、排名方式定义以及评价版本管理等功能。
质量评价标准需要根据实际考核或评价要求进行建立,以下给出一个大致的质量评价的简要模型,参照如下表:
第三大中心,质量监控中心。该质量监控中心针对关键数据接入范围、规范要求以及日常的应用及运维管理要求,对关键数据的接入情况、数据及时性、数据完整性与数据准确性等进行全面的监控及告警提醒。
包括:告警规则配置管理、数据质量监控(及时性监控、完整性监控、准确性监控和自定义监控)、告警与提醒。
告警规则配置管理,
数据告警规则:对关键数据的及时性、准确性、完整性以及自定义的其他监控的关键数据(如:计划值、累计值等)进行告警规则的配置。
数据质量监控,实现对数据质量的图像化监控,直观、实时的发现数据质量存在的问题以及对各单位、各专业关键数据综合情况的监控;支持根据预定义的规则及对象进行存在质量问题的关键数据的监控。
及时性监控:定义不同的监控关键数据类别,每个类别中可包含任意个监控关键数据,但这些关键数据的数据接入频率要求必须一致。根据配置的关键数据的及时性检查规则,对关键数据进行监控,并生成图形化的监控图形(气泡图)展示。监控图像的横向为需要监控的关键数据,纵向为该关键数据最近几个接入周期。
完整性监控:指报送的关键数据是否满足该关键数据每一数据项的要求,与关键数据的数据接入要求是否一致 。根据配置的关键数据的完整性检查规则,采用气泡图,通过不同颜色的来标示其完整性状态:灰色-未接入、蓝色-正常、橙色-完整但不准确、红色-不完整。
准确性监控:关键数据的准确性:指报送的关键数据是否满足该关键数据每一数据项的要求(如:数据范围、横向与纵向上的一致、明细一致、关联一致),满足关键数据的数据准确性接入要求。
根据配置的关键数据的准确性检查规则,采用曲线趋势图或柱状对比图来进行结果的展示
自定义监控:根据自定义的质量规则进行监控,如:设置某个关键数据的目标监控值,当未达到该关键数据值时,系统自动监控并告警,同时生成监控告警信息。
告警与提醒:根据配置的告警规则,对关键数据的及时性、准确性、完整性、以及自定义的其他监控的关键数据(如:计划值、累计值等)进行告警,当不符合设置的告警规则(如:超过设置的告警值)时,系统自动生成告警信息,并对管理人员或专责进行手机短消息提醒告警。
第四大中心,综合评价中心。该综合评价中心根据日常的应用与运维需要进行调整扩充,建立评价体系,提供评价工具,结合关键数据监控情况与质量检查结果等信息,采用自动和手动相结合的方式,开展数据质量工作的评价,发现问题,及时整改,提高应用水平。
综合评价中心:根据质量检查规则,进行关键数据检查,并生成质量检查报告;根据质量考核评价标准,进行关键数据的考核评价,并生成质量评价报告。同时,支持将检查结果以及评价结果数据进行导出,并能将结果数据根据质量报告模板或考核评价模板,自动生成doc文件或转成pdf和ceb等格式文件。
综合评价中心包括:数据质量检查、数据质量报告管理、质量报告的检索与追踪、数据质量考核评价。
数据质量检查:根据数据质量的检查规则实现对数据质量的核查,核查结果须明确数据存在的质量问题,并指导数据质量提升的整改工作的开展。主要检查关键数据的及时性、完整性、准确性以及用户自定义的检查规则。
数据质量报告管理:支持根据定义的质量报告模板的格式进行质量检查报告的自动生成,并按照检查报告模板格式进行文档的导出、质量检查报告的分发以及报告的统一管理与查询。
质量报告的检索与追踪:质量报告的检索:质量检查报告时按照不同的时间周期进行检查和生成的,因此可以通过定义对检查报告结果数据进行结构化的存储,以便于根据不同的组合条件对每类数据的质量过程进行追踪。
数据质量考核评价:可根据考核评价模型,针对不同的考核对象(如责任单位、专业部门、来源业务系统等),周期性的进行数据质量考核评价工作,量化各考核对象的数据质量水平,实现评分与排名等功能,辅助数据质量考核工作的开展。
以数据报表的方式,对每个业务应用或单位,详细的列出每个质量管控考核评价的得分及排名情况以及综合水平的总得分与排名。
第五大中心,系统管理中心。该系统管理中心包括:基础数据管理、运维知识库、对外数据接口与交换、系统管理(组织机构管理、角色管理、用户管理、权限配置管理、系统参数配置、系统日志管理和密码维护)等。
其中,基础数据主要包括系统运行中的各种基础性数据,如:各种数据字典信息,包括各种枚举数据。如:电压等级、关键数据类别、专业类别、业务部门类别等。
运维知识库:实现对数据常见问题的处理以及业务运维过程中问题的发现手段、表现方式、诊断方法及解决方案进行归类、总结,形成典型业务经验知识库供,建立详细的应急预案,供查阅、学习。并提供知识检索功能,可以按主题、检索关键字等进行模糊查询。
对外数据接口与交换:实现与其他系统的数据接口,如:数据交换、数据导入导出等;实现短信息接口进行各种告警信息的提醒。
这里需要补充的是:本发明实施例提供的所述方法所要管控的管控对象为:
基础关键数据类数据:主要包括运营监测关键数据、同业对标关键数据以及IAS关键数据;
关键数据明细数据:部分关键数据需要接入明细
其他专项应用所涉及的数据,如:手工报表类数据等。
需要说明的是:对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
如图4所示,本发明实施例二提供的一种面向电力业务信息系统的关键数据处理装置的结构示意图。如图4所示,本实施例二提供的所述装置包括:
第一获取模块1,用于获取并存储关键数据;
筛选模块2,用于根据预设的筛查规则,对存储的所有关键数据进行筛查,以筛查出需进行质量检测的关键数据;
检测模块3,用于根据预设的质量检测规则,对所述需进行质量检测的关键数据进行质量检测,并生成对应的检测结果;
第二获取模块4,用于获取关键数据的类编码;
生产模块5,用于将所述类编码相同的关键数据以及对应的检测结果,按照设定的质量报告模板生成质量报告。
本实施例提供的技术方案通过对关键数据进行筛查,以在海量的数据中找到需要进行质量检测的关键数据,减少质量检测耗时,提高检测效率;通过对关键数据进行质量检测,可对关键数据进行全面的监控和质量判定,以提高关键数据的参考价值,为关键数据的质量提供保障与支持。
进一步的,所述第一获取模块,具体用于:
接收各业务系统推送的关键数据,将接收到的所述关键数据进行存储;和/或
接收用户通过人机交互界面填报的关键数据,将接收到的所述关键数据进行存储;和/或
接收通过数据导入形式导入的关键数据,将导入的所述关键数据进行存储;和/或
获取通过对报表数据进行关键数据拆分后得到的关键数据,将获取到的所述关键数据进行存储。
进一步的,上述实施例二提供的所述装置还包括如下各模块:
第一接收模块,用于接收用户通过人机交互界面输入的查询请求,所述查询请求中携带有查询指示信息及查询关键词;
查找模块,用于根据所述查询关键词,查找出与所述关键词相匹配的关键数据;
查询模块,用于按照所述查询指示信息,对查找出的所有关键数据进行筛选与统计,得到满足所述查询指示信息的查询结果。
其中,所述查询指示信息包括:按来源查询、按归口业务部门查询、按关联查询、按频率查询、按单位查询和按关键数据明细查询中的任意一种或多种的组合;
所述关键数据携带有属性信息,所述属性信息包括有:来源信息、归口业务部门信息、关联信息、时间戳和单位信息中的任意一种或多种的组合;
相应的,
所述查询模块,具体用于:
若所述查询指示信息包括有按来源查询,则将包含有与所述查询指示信息中携带的来源信息相同的来源信息的关键数据筛选出来,并进行统计,得到满足所述查询指示信息的查询结果;
若所述查询指示信息包括有按归口业务部门查询,则将包含有与所述查询指示信息中携带的归口业务部门信息相同的归口业务部门信息的关键数据筛选出来,并进行统计,得到满足所述查询指示信息的查询结果;
若所述查询指示信息包括有按关联查询,则根据关键数据的属性信息中包含的关联信息,查询出与所述关键数据相关联的应用,并进行统计,得到满足所述查询指示信息的查询结果;
若所述查询指示信息包括有按频率查询,则根据所述关键数据的属性信息中包含的时间戳,统计所述关键数据在预设时间段内的出现次数,将出现次数大于设定阈值的关键数据筛选出来,并进行统计,得到满足所述查询指示信息的查询结果;
若所述查询指示信息包括有按单位查询,则将包含有与所述查询指示信息中携带的单位信息相同的单位信息的关键数据筛选出来,并进行统计,得到满足所述查询指示信息的查询结果;
若所述查询指示信息包括有按关键数据明细查询,则获取关键数据的明细数据,并进行统计,得到满足所述查询指示信息的查询结果。
进一步的,上述实施例中所述的筛选模块,具体用于:
将具有与设定类编码相同的关键数据筛查出,得到第一次筛查结果;
在所述第一次筛查结果中,根据预设的筛查数据时间范围,筛查出具有在所述筛查时间范围内的时间戳的关键数据,得到第二次筛查结果;
其中,所述第二次筛查结果中包含有所述需进行质量检测的关键数据。
进一步的,上述实施例中的所述筛选模块,具体用于:
根据设定的筛查频率,采用如下方法,筛查出需进行质量检测的关键数据:
根据预设的筛查规则,对存储的所有关键数据进行筛查,以筛查出需进行质量检测的关键数据。
进一步的,所述预设的质量检测规则包括:及时性检测规则、完整性检测规则及准确性检测规则中的任意一种或多种的组合;相应的,
所述检测模块,具体用于:
若所述预设的质量检测规则包括有及时性检测规则,则根据所述及时性检测规则中确定的接入时间,判断关键数据的时间戳是否与所述确定的接入时间相符,并得出及时性判断结果;
若所述预设的质量检测规则包括有完整性检测规则,则根据所述完整性检测规则,判断关键数据是否完整,并得出完整性判定结果;
若所述预设的质量检测规则包括有准确性检测规则,则根据所述准确性检测规则,判断关键数据是否准确,并得出准确性判定结果。
进一步的,上述实施例提供的所述装置还可以包括如下模块:
判断模块,用于判断所述质量报告中携带的所述检测结果是否大于设定告警阈值;若大于,则生成告警信息。
进一步的,上述实施例提供的所述装置还可以包括如下模块:
记录存储模块,用于记录所述质量报告的生成时间,并将所述质量报告及其对应的生成时间进行存储。
进一步的,上述实施例提供的所述装置还可以包括如下模块:
第二接收模块,用于接收用户通过人机交互界面输入的统计展示请求;
统计模块,用于根据所述统计展示请求,对所有关键数据的检测结果进行统计,并生成对应的统计图表进行展示;
其中,统计图表包括有时间戳信息、关键数据和检测结果。
这里需要说明的是:本实施例提供的所述装置可以实现上述实施例一提供的所述方法,具体的实现过程可参见上述实施例一中相应的内容,此次不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
可以理解的是,上述方法及交换机中的相关特征可以相互参考。另外,上述实施例中的“第一”、“第二”等是用于区分各实施例,而并不代表各实施例的优劣。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例提供的装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。