具体实施方式
参考图1,本发明一实施例中的图谱类数据存储方法,包括如下步骤。
S110:根据接收的图谱类数据获取对应所属电力系统资源的统一资源标识、量测值ID和数据信息量值。
图谱类数据可以是图谱文件或者是二进制形式等非结构形式的数据。电力系统的统一资源标识表征图谱类数据对应的电力系统及设备编号,量测值ID表征图谱类数据对应的测量指标,数据信息量值为对应测量指标的数量值,用来衡量测量指标的优劣。
具体地,本实施例中,步骤S110可以是根据图谱文件的元数据获取该图谱文件对应所属电力系统资源的统一标识和数量信息量值,针对图谱文件,量测值ID可以根据波形异动情况由图谱对应分析算法确定。
例如,参考图2,一应用例中,变压器红外监测程序产生一个变压器红外图谱文件,文件名称为:TransFormerInfraredFile_001。红外图谱文件中的信息表征了变压器的健康状态。该红外图谱文件的元数据信息如下:
电力系统资源的统一资源标识:Transformer_001,表示监测的变压器的统一资源标识。
量测值ID:Meas_Health,表示该红外图谱文件对应的变压器健康状态。
数据信息量值:85,表示变压器健康数值。
S130:根据预设的电网模型库、电力系统资源的统一资源标识、量测值ID和数据信息量值获取图谱类数据的数据特征信息。通过获取数据特征信息,即可即时解析图谱类数据,提取关键信息。
在其中一实施例中,参考图3,步骤S130包括步骤S131至步骤S133。
S131:根据电力系统资源的统一资源标识查询预设的电网模型库,获取对应的地理区域和容器信息。
预设的电网模型库存储管理了电网公司所有地理区域、线路、变电站、设备信息以及量测信息。查询预设的电网模型库中与电力系统资源的统一资源标识对应的数据,即可得到图谱类数据对应所属电力系统的所在地理区域和容器信息。容器信息包括厂站或线路等信息。
例如,一应用例中,参考图2,根据红外图谱文件的元数据以及预设的电网模型库,抽取出红外图谱的数据特征信息如下:
根据红外图谱文件的元数据中的“电力系统资源的统一资源标识:Transformer_001”,从电网模型库中查找到对应的地理区域为“广东电网”,容器为“天河站”,监测的设备为“1#主变”。
S132:根据量测值ID和数据信息量值获取当前状态评级值。
当前状态评级值指与图谱类数据对应的容器所处的当前状态信息,可以是根据数据信息量值分析量测值ID对应的状态等级。例如,将获取的数据信息量值与预设的范围值进行比较,判断数据信息量值属于哪个等级的范围值,则判定量测值ID为对应范围的等级。
例如,根据红外图谱文件的元数据中的“量测值ID:Meas_Health”、“数据信息量值:85”分析出“电力系统资源的统一资源标识:Transformer_001”对应的“广东电网、天河站、1#主变”的健康状况为“良好”。
S133:根据地理区域、容器信息和当前状态评级值获取数据特征信息。
将地理区域、容器信息和当前状态评级值联合构成数据特征信息,可整体概括图谱类数据所表征的对象以及对象的状态。
在其中一实施例中,参考图4,步骤S130之前,还包括步骤S120。
S120:获取图谱类数据的采集时间。例如,参考图2,一应用例中,红外图谱文件的采集时间为2015-10-01。具体地,步骤S120可以是在步骤S110之后,也可以是在步骤S110之前。
对应地,步骤S130为,根据预设的电网模型库、图谱类数据的采集时间、电力系统资源的统一资源标识、量测值ID和数据信息量值获取图谱类数据的数据特征信息。因此数据特征信息还包括图谱类数据的采集时间,提高了数据特征信息的完整性和丰富性。
对应地,步骤S133具体为:根据地理区域、容器信息、当前状态评级值和图谱类数据的采集时间获取数据特征信息。
S150:获取图谱类数据的统一资源标识,将图谱类数据的统一资源标识和数据特征信息进行组合存为逻辑中心点文件,将逻辑中心点文件存储于分布式文件系统的命名节点。
本实施例中,图谱类数据的统一资源标识包含图谱类数据的访问地址和文件名。逻辑中心点文件包含了图谱类数据的数据特征信息和对应的统一资源标识,存储于分布式文件系统的命名节点,用户可以根据数据特征信息和图谱类数据的统一资源标识查找数据节点,提高数据访问的便利性。
S170:将图谱类数据存储于分布式文件系统中的数据节点。
图谱类数据存储于数据节点,图谱类数据的统一资源标识和数据特征信息存储于命名节点,用户访问图谱类数据时,能够根据数据特征信息或图谱类数据的统一资源标识查询分布式文件系统中命名节点的资源列表,并快速检索出数据节点中存储的图谱类数据,同时也能支持单独对图谱数据的快速检索,提高了数据访问的效率。
图谱类数据存储于分布式文件系统的数据节点,多个数据节点对应关联一个命名节点,该命名节点存储有一个逻辑中心点文件,该逻辑中心点文件包含有多个图谱类数据的统一资源标识和数据特征信息。每一个图谱类数据的统一资源标识对应唯一的一个图谱类数据例如(一个图谱文件)。一应用例中,将红外图谱文件存储于数据节点,将数据特征信息及红外图谱文件的统一资源标识存为逻辑中心点文件存储于命名节点,得到如图5所示的分布式文件系统。
在其中一实施例中,参考图4,步骤S170之后,还包括步骤S190。
S190:根据接收的访问指令查询得到命名节点中对应的图谱类数据的统一资源标识,根据查询到的图谱类数据的统一资源标识和对应数据特征信息获取对应数据节点存储的图谱类数据并输出。
访问指令具体可以是对应数据特征信息的过滤条件。通过使用数据特征信息过滤,可以快速定位到指定的图谱类数据,提高用户的数据访问效率。
数据的访问可以通过建立通用数据访问服务实现。其中,通用数据访问服务可与命名节点交互,用于对数据特征信息及图谱类数据的统一资源标识进行各类查询的支持。
例如,参考图6,一应用例中,用户想查看一下“天河站”所有的主变红外图谱文件。用户通过客户端输入过滤条件:“图谱类数据的同一资源标识=Substation_TianHe”,客户端通过通用数据访问服务查询命名节点中数据特征信息与统一资源标识,根据该命名节点中的统一资源标识结合过滤条件查找对应的数据节点存储的图谱文件,从而获得天河站所有主变的图谱数据文件。
在其中一实施例中,参考图4,步骤S170之后,还包括步骤S210。
S210:根据数据中心系统的管理页面接收的历史数据整理指令查询得到命名节点中对应的图谱类数据的统一资源标识,根据查询到的图谱类数据的统一资源标识和对应数据特征信息获取对应数据节点存储的图谱类数据并进行数据的添加或删除。
历史数据整理指令由管理员通过数据中心系统的管理页面进行执行,具体可以是时间范围条件。在无需解析图谱类数据的情况下,根据时间范围条件结合命名节点中统一资源标识和数据特征信息查询出需要整理的图谱类数据,例如可以是通过通用数据访问服务进行查找,然后对查找到的图谱类数据执行整理操作。因此,能有效移除过期低价值图谱类数据,节省存储空间和投资,实现图谱数据存储空间的有效管理。
数据的整理操作可以通过建立图谱数据存储管理命令实现,在通过通用数据访问服务查找到对应的图谱类数据后,图谱数据存储管理命令可以对查找到的数据进行添加或删除。可以理解,在其他实施例中,图谱数据存储管理命令还可以执行其他类型的数据管理操作。
例如,参考图6,管理员希望删除2015年10月5日之前的图谱文件。管理员在数据中心系统的管理页面,录入时间查询条件:“dateTime<2015年10月5日”,通用数据访问服务返回对应该时间的图谱文件列表。管理员确定执行删除操作后,图谱数据存储管理命令接受图谱文件统一资源标识列表,通过分布式文件系统的命名节点执行删除图谱文件操作。
通用数据访问服务和图谱数据存储管理命令作为图谱数据管理服务。具体地,建立数据访问服务和图谱数据存储管理命令之后,还可以将命名节点的地址和图谱数据管理服务的访问方式发布于数据中心系统的信息页面上。
上述图谱类数据存储方法,根据图谱类数据获取对应所属电力系统资源的统一资源标识、量测值ID和数据信息量值,根据预设的电网模型库、电力系统资源的统一资源标识、量测值ID和数据信息量值获取图谱类数据的数据特征信息,可以即时解析图谱类数据,提取关键信息;通过将数据特征信息和图谱类数据的统一资源标识进行组合存为逻辑中心点文件并将逻辑中心点文件存储于分布式文件系统的命名节点,将图谱类数据存储于分布式文件系统的数据节点,使得用户访问图谱类数据时,能够根据数据特征信息或图谱类数据的统一资源标识快速查询分布式文件系统中命名节点资源列表,并快速检索出关联数据节点中存储的图谱类数据,不需要解析,同时也能支持单独对图谱数据的快速检索,提高了数据访问的效率。
参考图7,本发明一实施例中的图谱类数据存储系统,包括第一数据获取模块110、第二数据获取模块130、命名节点存储模块150和数据节点存储模块170。
第一数据获取模块110用于根据接收的图谱类数据获取对应所属电力系统资源的统一资源标识、量测值ID和数据信息量值。
图谱类数据可以是图谱文件或者是二进制形式等非结构形式的数据。电力系统的统一资源标识表征图谱类数据对应的电力系统及设备编号,量测值ID表征图谱类数据对应的测量指标,数据信息量值为对应测量指标的数量值,用来衡量测量指标的优劣。
具体地,本实施例中,第一数据获取模块110可以是图谱文件的根据元数据获取对应该图谱文件对应所属电力系统资源的统一标识和数量信息量值,针对图谱文件,量测值ID可以根据波形异动情况由图谱对应分析算法确定。
例如,参考图2,一应用例中,变压器红外监测程序产生一个变压器红外图谱文件,文件名称为:TransFormerInfraredFile_001。红外图谱文件中的信息表征了变压器的健康状态。该红外图谱文件的元数据信息如下:
电力系统资源的统一资源标识:Transformer_001,表示监测的变压器的统一资源标识。
量测值ID:Meas_Health,表示该红外图谱文件对应的变压器健康状态。
数据信息量值:85,表示变压器健康数值。
第二数据获取模块130用于根据预设的电网模型库、电力系统资源的统一资源标识、量测值ID和数据信息量值获取图谱类数据的数据特征信息。通过获取数据特征信息,即可即时解析图谱类数据,提取关键信息。
在其中一实施例中,参考图8,第二数据获取模块130包括数据查询单元131、数据分析单元132和数据特征信息获取单元133。
数据查询单元131用于根据电力系统资源的统一资源标识查询预设的电网模型库,获取对应的地理区域和容器信息。
预设的电网模型库存储管理了电网公司所有地理区域、线路、变电站、设备信息以及量测信息。查询预设的电网模型库中与电力系统资源的统一资源标识对应的数据,即可得到图谱类数据对应所属电力系统的所在地理区域和容器信息。容器信息包括厂站或线路等信息。
例如,一应用例中,参考图2,根据红外图谱文件的元数据以及预设的电网模型库,抽取出红外图谱的数据特征信息如下:
根据红外图谱文件的元数据中的“电力系统资源的统一资源标识:Transformer_001”,从电网模型库中查找到对应的地理区域为“广东电网”,容器为“天河站”,监测的设备为“1#主变”。
数据分析单元132用于根据量测值ID和数据信息量值获取当前状态评级值。
当前状态评级值指与图谱类数据对应的容器所处的当前状态信息,可以是根据数据信息量值分析量测值ID对应的状态等级。例如,将获取的数据信息量值与预设的范围值进行比较,判断数据信息量值属于哪个等级的范围值,则判定量测值ID为对应范围的等级。
例如,根据红外图谱文件的元数据中的“量测值ID:Meas_Health”、“数据信息量值:85”分析出“电力系统资源的统一资源标识:Transformer_001”对应的“广东电网、天河站、1#主变”的健康状况为“良好”。
数据特征信息获取单元133用于根据地理区域、容器信息和当前状态评级值获取数据特征信息。
将地理区域、容器信息和当前状态评级值联合构成数据特征信息,可整体概括图谱类数据所表征的对象以及对象的状态。
命名节点存储模块150用于获取图谱类数据的统一资源标识,将图谱类数据的统一资源标识和数据特征信息进行组合存为逻辑中心点文件,将逻辑中心点文件存储于分布式文件系统的命名节点。
本实施例中,图谱类数据的统一资源标识包含图谱类数据的访问地址。逻辑中心点文件包含了图谱类数据的数据特征信息和对应的统一资源标识,存储于分布式文件系统的命名节点,用户可以根据数据特征信息和图谱类数据的统一资源标识查找数据节点,提高数据访问的便利性。
数据节点存储模块170用于将图谱类数据存储于分布式文件系统中的数据节点。
图谱类数据存储于数据节点,图谱类数据的统一资源标识和数据特征信息存储于命名节点,用户访问图谱类数据时,能够根据数据特征信息或图谱类数据的统一资源标识查询分布式文件系统中命名节点的资源列表,并快速检索出数据节点中存储的图谱类数据,同时也能支持单独对图谱数据的快速检索,提高了数据访问的效率。
图谱类数据存储于分布式文件系统的数据节点,多个数据节点对应关联一个命名节点,该命名节点存储有一个逻辑中心点文件,该逻辑中心点文件包含有多个图谱类数据的统一资源标识和数据特征信息。每一个图谱类数据的统一资源标识对应唯一的一个图谱类数据例如(一个图谱文件)。一应用例中,将红外图谱文件存储于数据节点,将数据特征信息及红外图谱文件的统一资源标识存为逻辑中心点文件存储于命名节点,得到如图5所示的分布式文件系统。
在其中一实施例中,参考图9,图谱类数据存储系统还包括采集时间获取模块120,用于获取图谱类数据的采集时间。例如,参考图2,一应用例中,红外图谱文件的采集时间为2015-10-01。
对应地,第二数据获取模块130根据预设的电网模型库、图谱类数据的采集时间、电力系统资源的统一资源标识、量测值ID和数据信息量值获取图谱类数据的数据特征信息,提高了数据特征信息的完整性和丰富性。对应地,数据特征信息获取单元133根据地理区域、容器信息、当前状态评级值和图谱类数据的采集时间获取数据特征信息。
在其中一实施例中,参考图9,图谱类数据存储系统还包括访问查询模块190,用于根据接收的访问指令查询得到命名节点中对应的图谱类数据的统一资源标识,根据查询到的图谱类数据的统一资源标识和对应数据特征信息获取对应数据节点存储的图谱类数据并输出。
访问指令具体可以是对应数据特征信息的过滤条件。通过使用数据特征信息过滤,可以快速定位到指定的图谱类数据,提高用户的数据访问效率。
数据的访问可以通过建立通用数据访问服务实现。其中,通用数据访问服务可与命名节点交互,用于对数据特征信息及图谱类数据的统一资源标识进行各类查询的支持。
例如,参考图6,一应用例中,用户想查看一下“天河站”所有的主变红外图谱文件。用户通过客户端程序输入过滤条件:“图谱类和数据的同一资源标识=Substation_TianHe”,客户端程序通过数据管理服务的通用数据访问服务查询命名节点中数据特征信息和统一资源标识,根据该命名节点统一资源标识结合过滤条件查找对应的数据节点存储的图谱文件,从而获得天河站所有主变的图谱数据文件。
在其中一实施例中,参考图9,图谱类数据存储系统还包括数据管理模块210,用于根据数据中心系统的管理页面接收的历史数据整理指令查询得到命名节点中对应的图谱类数据的统一资源标识,根据查询到的图谱类数据的统一资源标识和对应数据特征信息获取对应数据节点存储的图谱类数据并进行数据的添加或删除。
历史数据整理指令由管理员通过数据中心系统的管理页面进行执行,具体可以是时间范围条件。在无需解析图谱类数据的情况下,根据时间范围条件结合命名节点中统一资源标识和数据特征信息查询出需要整理的图谱类数据,例如可以是通过通用数据访问服务进行查找,然后对查找到的图谱类数据执行整理操作。因此,能有效移除过期低价值图谱类数据,节省存储空间和投资,实现图谱数据存储空间的有效管理。
数据的整理操作可以通过建立图谱数据存储管理命令实现,在通过通用数据访问服务查找到对应历史数据整理指令的图谱类数据后,图谱数据存储管理命令可以对查找到的数据进行添加或删除。可以理解,在其他实施例中,图谱数据存储管理命令还可以执行其他类型的数据管理操作。
例如,参考图6,管理员希望删除2015年10月5日之前的图谱文件。管理员在数据中心系统的管理页面,录入时间查询条件:“dateTime<2015年10月5日”,通用数据访问服务返回对应时间的图谱文件列表。管理员确定执行删除操作后,图谱数据存储管理命令接受图谱文件统一资源标识列表,通过分布式文件系统的命名节点执行删除图谱文件操作。
通用数据访问服务和图谱数据存储管理命令作为图谱数据管理服务。具体地,建立数据访问服务和图谱数据存储管理命令之后,还可以将命名节点的地址和图谱数据管理服务的访问方式发布于数据中心系统的信息页面上。
上述图谱类数据存储系统,第一数据获取模块110根据图谱类数据获取对应所属电力系统资源的统一资源标识、量测值ID和数据信息量值;第二数据获取模块130根据预设的电网模型库、电力系统资源的统一资源标识、量测值ID和数据信息量值获取图谱类数据的数据特征信息,可以即时解析图谱类数据,提取关键信息;命名节点存储模块150将数据特征信息和图谱类数据的统一资源标识进行组合存为逻辑中心点文件并将逻辑中心点文件存储于分布式文件系统的命名节点,数据节点存储模块170将图谱类数据存储于分布式文件系统的数据节点。因此,用户访问图谱类数据时,能够根据数据特征信息或图谱类数据的统一资源标识查询分布式文件系统中对应的命名节点资源列表,并快速检索出关联数据节点中存储的图谱类数据,不需要解析,同时也能支持单独对图谱数据的快速检索,提高了数据访问的效率。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。