发明内容
因此,本发明要解决的技术问题在于克服现有技术中的电力资产的标签及其与算法的关系等涉及到的数据比较零散,导致电力资产画像难以构成的问题,从而提供一种基于图数据库的电力资产画像构建方法及装置。
本发明实施例提供一种基于图数据库的电力资产画像构建方法,包括:接收用户输入的电力资产的维度信息;根据所述维度信息获取所述电力资产的多个标签;根据所述标签对应的算法对所述标签进行分类;根据标签的分类及其与电力资产的关联关系构建电力资产的图数据模型;根据所述图数据模型中所述标签的分类及其对应的算法进行计算,生成电力资产画像。
在一实施例中,上述的根据所述标签对应的算法对所述标签进行分类,包括:将从数据库中获取的标签划分为直接获取类标签;将通过逻辑计算获取的标签划分为计算类标签;将通过数据挖掘算法获取的标签划分为挖掘类标签。
在一实施例中,上述的根据标签的分类及其与电力资产的关联关系构建电力资产的图数据模型,包括:根据所述标签的分类,提取标签关联的数据表字段及标签指标值;通过所述标签对应的算法计算所述标签关联的计算结果;根据所述数据表字段、标签指标值、计算结果及其关联关系构成所述图数据库。
在一实施例中,上述的根据标签的分类及其与电力资产的关联关系构建电力资产的图数据模型,包括:根据所述标签的分类,提取标签关联的数据表字段及标签指标值;通过所述标签对应的算法计算所述标签关联的计算结果;根据所述计算结果在预设查询字典中查找对应的输出结果;根据所述数据表字段、标签指标值、输出结果及其关联关系构成所述图数据库。
本发明实施例还提供一种基于图数据库的电力资产画像构建装置,包括:维度信息接收模块,用于接收用户输入的电力资产的维度信息;标签获取模块,用于根据所述维度信息获取所述电力资产的多个标签;标签分类模块,用于根据所述标签对应的算法对所述标签进行分类;图数据模型构建模块,用于根据标签的分类及其与电力资产的关联关系构建电力资产的图数据模型;电力资产画像生成模块,用于根据所述图数据模型中所述标签的分类及其对应的算法进行计算,生成电力资产画像。
在一实施例中,上述的标签分类模块具体用于:将从数据库中获取的标签划分为直接获取类标签;将通过逻辑计算获取的标签划分为计算类标签;将通过数据挖掘算法获取的标签划分为挖掘类标签。
在一实施例中,上述的图数据模型构建模块具体用于:根据所述标签的分类,提取标签关联的数据表字段及标签指标值;通过所述标签对应的算法计算所述标签关联的计算结果;根据所述数据表字段、标签指标值、计算结果及其关联关系构成所述图数据库。
在一实施例中,上述的图数据模型构建模块具体用于:根据所述标签的分类,提取标签关联的数据表字段及标签指标值;通过所述标签对应的算法计算所述标签关联的计算结果;根据所述计算结果在预设查询字典中查找对应的输出结果;根据所述数据表字段、标签指标值、输出结果及其关联关系构成所述图数据库。
本发明实施例还提供一种非暂态计算机可读存储介质,所述的非暂态计算机可读存储介质存储计算机指令,所述计算机指令被处理器执行时实现如上所述的基于图数据库的电力资产画像构建方法。
本发明实施例还提供一种基于图数据库的电力资产画像构建设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行如权利要求1-4中任一项所述的基于图数据库的电力资产画像构建方法。
本发明技术方案,具有如下优点:基于电力资产的维度及其标签构建图数据库,与传统关系型数据库相比,图数据库的存储方式更适合复杂的关联关系查询,可显著提高电力资产画像效率以及画像结果查询的速度,从而提高对电力设备数据的处理工作的效率。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
实施例1
本发明实施例提供一种基于图数据库的电力资产画像构建方法,如图1所示,该电力资产画像构建方法主要包括如下步骤:
步骤S11:接收用户输入的电力资产的维度信息;
步骤S12:根据维度信息获取电力资产的多个标签;
步骤S13:根据标签对应的算法对标签进行分类;
步骤S14:根据标签的分类及其与电力资产的关联关系构建电力资产的图数据模型;
步骤S15:根据图数据模型中标签的分类及其对应的算法进行计算,生成电力资产画像。
通过上述的步骤S11至步骤S15,本发明实施例的基于图数据库的电力资产画像构建方法,基于电力资产的维度及其标签构建图数据库,与传统关系型数据库相比,图数据库的存储方式更适合复杂的关联关系查询,可显著提高电力资产画像效率以及画像结果查询的速度,从而提高对电力设备数据的处理工作的效率。
以下对本发明实施例的基于图数据库的电力资产画像构建方法中的各个步骤做进一步说明。
上述的步骤S11,接收用户输入的电力资产的维度信息。在构建电力资产画像的初始阶段,可先获取用户输入的构建的要求,例如电力资产的维度信息。
上述的步骤S12,根据维度信息获取电力资产的多个标签。
在一实施例中,是以电力设备为变压器为例,从不同维度,罗列出关于变压器的标签。基于电力资产自身的特性以及产品管理的需求,资产标签库建立时可从3个维度入手:成本维度、效能维度和预防性检修维度。例如,成本维度的标签包括投入期成本和报废成本等;效能维度的标签包括使用效率和产品质量等;预防性检修维度的标签包括健康指数等。
上述的步骤S13,根据标签对应的算法对标签进行分类。
具体地,可将上述步骤S11及步骤S12中获取的电力资产标签分为直接获取类标签、计算类标签和挖掘类标签。从统计学上将数据分为四种类型,分别是定类数据、定序数据、定居数据、定比变量。
1.定类数据(Nominal):名义级数据,数据的最低级,表示个体在属性上的特征或类别上的不同变量,仅仅是一种标志,没有序次关系。定类数据为直接获取类标签。例如,设备编码。
2.定序数据(Ordinal):数据的中间级,用数字表示个体在某个有序状态中所处的位置,不能做四则运算。定序数据为挖掘类标签,例如,“成本评价等级”,成本很低=1,成本较低=2,成本较高=3,成本很高=4。
3.定距数据(Interval):具有间距特征的变量,有单位,没有绝对零点,可以做加减运算,不能做乘除运算。定距数据为逻辑运算类标签。例如,运行时长、巡视时长等。
4.定比数据(Ratio):数据的最高级,既有测量单位,也有绝对零点。定比数据为挖掘类标签,例如故障概率。
其中,直接获取类标签一般为静止不变的,时间权重没有变化。通常是产品的一些静态属性,一般不随时间的变化而变化,并且其取值通常也很容易得到。直接获取类标签大部分来源于设备台帐表。数据类型一般为字符串型。这类标签可从数据库中直接获取,不需要进一步加工和运算。这种方法多应用于属性标签,主要描述资产的基本信息。比如:变压器ID、设备名称、设备编码、所属站房、所属地市、资产单位、电压等级、生产厂家、投运年限(年)、使用环境等标签。
逻辑运算类标签指通过简单的逻辑计算即可得到的标签,多为能够体现资产运行信息的行为标签。能体现资产的运行信息。是资产的动态标签,是对资产所处使用寿命周期的体现,需要随着时间的变化而更新。数据类型一般为离散型、连续型数据。例如运行时长、巡视时长、巡视次数、故障次数、故障时长、缺陷存在时长、缺陷总次数、一般缺陷次数、严重缺陷次数、紧急缺陷次数、检修时长等。
算法挖掘类标签指需要通过机器学习等数据挖掘算法建模来得到的标签。多应用于评价类标签、预测类标签。数据类型一般为离散型、连续型数据。比如,故障概率标签等。
上述的步骤S14,根据标签的分类及其与电力资产的关联关系构建电力资产的图数据模型。
具体地,是以变压器与三种标签类型被作为图数据模型中的结点,并且使其直接相连,其关联关系为标签类型。每一标签也被作为结点且同其所归属的标签类别相连,关联关系为包含标签。每个标签又与其相对应的算法结点相连。
其中,直接获取类标签的标签值直接来源于一个业务数据表的某个字段。例如,“名称”标签的标签值是“台账表”的“名称”字段。挖掘类标签的标签值来源于一个挖掘流的计算结果,而挖掘流可通过数据挖掘算法进行计算。在一较佳实施例中,挖掘流可以挂接一查询字典,用以将挖掘流输出的数值型结果翻译成定性的标识。例如,资产健康情况是一个挖掘类标签,其挖掘流的计算值可能为80,而用户可能无法理解80的具体含义,所以需要一个查询字典来定性数值型,如定义80-90的健康指数表示“优秀”。计算类标签的标签值来源于一个定制算法组件的计算结果,例如可以编写一个OSGI组件实现该计算过程。画像建模时,将此组件关联到一个标签,作为此标签的算法。画像计算时,此算法组件的计算结果就是此标签的标签值。
上述的步骤S15,根据图数据模型中标签的分类及其对应的算法进行计算,生成电力资产画像。
电力资产画像的计算是依据上述的电力资产画像的图数据模型,按照一定的时间周期定期执行,每次计算都会生成一幅电力资产的画像。如图2所示,画像计算首先需要读取画像模型,找到画像模型包含的标签及标签配置的算法。依据标签的分类,提取标签关联的数据表字段、执行标签关联的计算组件、执行标签关联的挖掘流,得到相应的计算结果。从数据表中提取的表字段可以直接作为标签值进行保存;计算组件及挖掘流的计算结果,可能需要查询字典进行翻译,以将数值型结果转换成定性的标识。上述计算过程中的中间结果的作用是描述标签值的影响因素的指标。例如,变压器的健康状况可能与工作环境平均温度有关,极寒或者极热都会导致变压器的健康状况不佳。因此,工作环境平均温度就可以作为健康状况标签值的影响因素指标。标签的计算组件、挖掘流会输出中间结果,以便描述标签值计算结果产生的原因。影响标签值的指标可以分为三类,分别是,正向指标、逆向指标、适度指标。正向指标的指标数据越大,标签值就越理想;反向指标的指标数据越小,标签值就越理想;适度指标的指标数据越接近最佳点,标签值就越理想。
在一较佳实施例中,如图3所示,计算生成的电力资产画像结果存储在图数据库中,通过增加画像对象节点、标签值节点、标签值与算法(或者字典标识值)的关联关系的方式保存画像计算结果。各个统计周期画像的标签值需要增加标签值节点进行保存。建立统计周期节点与“标签值”节点(其中包含了标签值与中间结果)的“标签值”关系,以记录标签值属于的统计周期。需要记录标签值对应的字典标识,以记录标签值对应的算法及翻译字典。因此建立了标签值节点与画像模型的字典值节点的关联关系。如果标签值可以直接使用,不需要查字典以转换成字典标识,存储画像结果时,可以直接将标签值节点关联到画像模型的算法节点。
本发明实施例提出的基于图数据库的电力资产画像构建方法,提出了构建电力资产画像模型的思路,以及电力资产画像和其模型在图数据库中的存储方式。画像技术可辅助电力企业准确了解资产现状、发现存在问题、制订并执行相应措施。另外,与传统关系型数据库相比,图数据库的存储方式更适合复杂的关联关系查询,可显著提高电力资产画像效率以及画像结果查询的速度。
实施例2
本发明实施例提供一种基于图数据库的电力资产画像构建装置,如图4所示,该电力资产画像构建装置主要包括:维度信息接收模块1、标签获取模块2、标签分类模块3、图数据模型构建模块4及电力资产画像生成模块5。
其中,上述的维度信息接收模块1用于接收用户输入的电力资产的维度信息;标签获取模块2用于根据维度信息获取电力资产的多个标签;标签分类模块3用于根据标签对应的算法对标签进行分类;图数据模型构建模块4用于根据标签的分类及其与电力资产的关联关系构建电力资产的图数据模型;电力资产画像生成模块5用于根据图数据模型中标签的分类及其对应的算法进行计算,生成电力资产画像。
通过上述的各个组成部分之间的协同工作,本发明实施例的基于图数据库的电力资产画像构建装置,基于电力资产的维度及其标签构建图数据库,与传统关系型数据库相比,图数据库的存储方式更适合复杂的关联关系查询,可显著提高电力资产画像效率以及画像结果查询的速度,从而提高对电力设备数据的处理工作的效率。
以下对本发明实施例的基于图数据库的电力资产画像构建装置中的各个组成部分及其功能做进一步说明。
上述的维度信息接收模块1,用于接收用户输入的电力资产的维度信息。在构建电力资产画像的初始阶段,可先获取用户输入的构建的要求,例如电力资产的维度信息。
上述的标签获取模块2,用于根据维度信息获取电力资产的多个标签。
在一实施例中,是以电力设备为变压器为例,从不同维度,罗列出关于变压器的标签。基于电力资产自身的特性以及产品管理的需求,资产标签库建立时可从3个维度入手:成本维度、效能维度和预防性检修维度。例如,成本维度的标签包括投入期成本和报废成本等;效能维度的标签包括使用效率和产品质量等;预防性检修维度的标签包括健康指数等。
上述的标签分类模块3,用于根据标签对应的算法对标签进行分类。
具体地,可将上述标签获取模块2获取的电力资产标签分为直接获取类标签、计算类标签和挖掘类标签。从统计学上将数据分为四种类型,分别是定类数据、定序数据、定居数据、定比变量。
1.定类数据(Nominal):名义级数据,数据的最低级,表示个体在属性上的特征或类别上的不同变量,仅仅是一种标志,没有序次关系。定类数据为直接获取类标签。例如,设备编码。
2.定序数据(Ordinal):数据的中间级,用数字表示个体在某个有序状态中所处的位置,不能做四则运算。定序数据为挖掘类标签,例如,“成本评价等级”,成本很低=1,成本较低=2,成本较高=3,成本很高=4。
3.定距数据(Interval):具有间距特征的变量,有单位,没有绝对零点,可以做加减运算,不能做乘除运算。定距数据为逻辑运算类标签。例如,运行时长、巡视时长等。
4.定比数据(Ratio):数据的最高级,既有测量单位,也有绝对零点。定比数据为挖掘类标签,例如故障概率。
其中,直接获取类标签一般为静止不变的,时间权重没有变化。通常是产品的一些静态属性,一般不随时间的变化而变化,并且其取值通常也很容易得到。直接获取类标签大部分来源于设备台帐表。数据类型一般为字符串型。这类标签可从数据库中直接获取,不需要进一步加工和运算。这种方法多应用于属性标签,主要描述资产的基本信息。比如:变压器ID、设备名称、设备编码、所属站房、所属地市、资产单位、电压等级、生产厂家、投运年限(年)、使用环境等标签。
逻辑运算类标签指通过简单的逻辑计算即可得到的标签,多为能够体现资产运行信息的行为标签。能体现资产的运行信息。是资产的动态标签,是对资产所处使用寿命周期的体现,需要随着时间的变化而更新。数据类型一般为离散型、连续型数据。例如运行时长、巡视时长、巡视次数、故障次数、故障时长、缺陷存在时长、缺陷总次数、一般缺陷次数、严重缺陷次数、紧急缺陷次数、检修时长等。
算法挖掘类标签指需要通过机器学习等数据挖掘算法建模来得到的标签。多应用于评价类标签、预测类标签。数据类型一般为离散型、连续型数据。比如,故障概率标签等。
上述的图数据模型构建模块4,用于根据标签的分类及其与电力资产的关联关系构建电力资产的图数据模型。
具体地,是以变压器与三种标签类型被作为图数据模型中的结点,并且使其直接相连,其关联关系为标签类型。每一标签也被作为结点且同其所归属的标签类别相连,关联关系为包含标签。每个标签又与其相对应的算法结点相连。
其中,直接获取类标签的标签值直接来源于一个业务数据表的某个字段。例如,“名称”标签的标签值是“台账表”的“名称”字段。挖掘类标签的标签值来源于一个挖掘流的计算结果,而挖掘流可通过数据挖掘算法进行计算。在一较佳实施例中,挖掘流可以挂接一查询字典,用以将挖掘流输出的数值型结果翻译成定性的标识。例如,资产健康情况是一个挖掘类标签,其挖掘流的计算值可能为80,而用户可能无法理解80的具体含义,所以需要一个查询字典来定性数值型,如定义80-90的健康指数表示“优秀”。计算类标签的标签值来源于一个定制算法组件的计算结果,例如可以编写一个OSGI组件实现该计算过程。画像建模时,将此组件关联到一个标签,作为此标签的算法。画像计算时,此算法组件的计算结果就是此标签的标签值。
上述的电力资产画像生成模块5,用于根据图数据模型中标签的分类及其对应的算法进行计算,生成电力资产画像。
具体地,电力资产画像生成模块5所执行的电力资产画像的计算是依据上述的电力资产画像的图数据模型,按照一定的时间周期定期执行,每次计算都会生成一幅电力资产的画像。画像计算首先需要读取画像模型,找到画像模型包含的标签及标签配置的算法。依据标签的分类,提取标签关联的数据表字段、执行标签关联的计算组件、执行标签关联的挖掘流,得到相应的计算结果。从数据表中提取的表字段可以直接作为标签值进行保存;计算组件及挖掘流的计算结果,可能需要查询字典进行翻译,以将数值型结果转换成定性的标识。上述计算过程中的中间结果的作用是描述标签值的影响因素的指标。例如,变压器的健康状况可能与工作环境平均温度有关,极寒或者极热都会导致变压器的健康状况不佳。因此,工作环境平均温度就可以作为健康状况标签值的影响因素指标。标签的计算组件、挖掘流会输出中间结果,以便描述标签值计算结果产生的原因。影响标签值的指标可以分为三类,分别是,正向指标、逆向指标、适度指标。正向指标的指标数据越大,标签值就越理想;反向指标的指标数据越小,标签值就越理想;适度指标的指标数据越接近最佳点,标签值就越理想。
在一较佳实施例中,计算生成的电力资产画像结果存储在图数据库中,通过增加画像对象节点、标签值节点、标签值与算法(或者字典标识值)的关联关系的方式保存画像计算结果。各个统计周期画像的标签值需要增加标签值节点进行保存。建立统计周期节点与“标签值”节点(其中包含了标签值与中间结果)的“标签值”关系,以记录标签值属于的统计周期。需要记录标签值对应的字典标识,以记录标签值对应的算法及翻译字典。因此建立了标签值节点与画像模型的字典值节点的关联关系。如果标签值可以直接使用,不需要查字典以转换成字典标识,存储画像结果时,可以直接将标签值节点关联到画像模型的算法节点。
本发明实施例提出的基于图数据库的电力资产画像构建装置,提出了构建电力资产画像模型的思路,以及电力资产画像和其模型在图数据库中的存储方式。画像技术可辅助电力企业准确了解资产现状、发现存在问题、制订并执行相应措施。另外,与传统关系型数据库相比,图数据库的存储方式更适合复杂的关联关系查询,可显著提高电力资产画像效率以及画像结果查询的速度。
实施例3
本发明实施例还提供一种基于图数据库的电力资产画像构建设备,如图5所示,该设备包括一个或多个处理器510以及存储器520,图5中以一个处理器510为例。
处理器510、存储器520可以通过总线或者其他方式连接,图5中以通过总线连接为例。
处理器510可以为中央处理器(Central Processing Unit,CPU)。处理器510还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器520作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本申请实施例中的基于图数据库的电力资产画像构建方法对应的程序指令/模块(例如,图2所示的维度信息接收模块1、标签获取模块2、标签分类模块3、图数据模型构建模块4及电力资产画像生成模块5)。处理器510通过运行存储在存储器520中的非暂态软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例的基于图数据库的电力资产画像构建方法。
存储器520可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据基于图数据库的电力资产画像构建装置的使用所创建的数据等。此外,存储器520可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器520可选包括相对于处理器510远程设置的存储器,这些远程存储器可以通过网络连接至列表项操作的处理装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个模块存储在所述存储器520中,当被所述一个或者多个处理器510执行时,执行如图1所示的方法。
上述产品可执行本发明实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,具体可参见如图1所示的实施例中的相关描述。
实施例4
本发明实施例还提供了一种非暂态计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的基于图数据库的电力资产画像构建方法。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory,ROM)、随机存储记忆体(Random Access Memory,RAM)、快闪存储器(FlashMemory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。