CN115544276B - 计量装置知识图谱构建方法和计量装置档案核查方法 - Google Patents

计量装置知识图谱构建方法和计量装置档案核查方法 Download PDF

Info

Publication number
CN115544276B
CN115544276B CN202211529071.1A CN202211529071A CN115544276B CN 115544276 B CN115544276 B CN 115544276B CN 202211529071 A CN202211529071 A CN 202211529071A CN 115544276 B CN115544276 B CN 115544276B
Authority
CN
China
Prior art keywords
data
metering
metering device
archive
knowledge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211529071.1A
Other languages
English (en)
Other versions
CN115544276A (zh
Inventor
龚起航
郑楷洪
周尚礼
曾璐琨
李胜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southern Power Grid Digital Grid Research Institute Co Ltd
Original Assignee
Southern Power Grid Digital Grid Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southern Power Grid Digital Grid Research Institute Co Ltd filed Critical Southern Power Grid Digital Grid Research Institute Co Ltd
Priority to CN202211529071.1A priority Critical patent/CN115544276B/zh
Publication of CN115544276A publication Critical patent/CN115544276A/zh
Application granted granted Critical
Publication of CN115544276B publication Critical patent/CN115544276B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/30Administration of product recycling or disposal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Artificial Intelligence (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Primary Health Care (AREA)
  • Water Supply & Treatment (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Sustainable Development (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及一种计量装置知识图谱构建方法、装置、计算机设备和存储介质。所述方法包括:从多个相互独立的电网子系统获取计量装置的多源异构数据,采用与多源异构数据的数据类型对应的实体抽取策略,抽取出多源异构数据中的计量实体和计量实体关系,对抽取出的计量实体和计量实体关系进行知识融合,得到知识融合结果数据,对知识融合结果数据进行知识加工,得到计量装置知识图谱。本申请还提供一种计量装置档案核查方法、装置、计算机设备和存储介质,采用该方法能实现计量装置档案的在线核查,提高计量装置的维护效率。本申请还涉及一种计量装置缺陷类型分析方法。采用本方法能实现故障计量装置缺陷类型的快速定位,提高计量装置的维护效率。

Description

计量装置知识图谱构建方法和计量装置档案核查方法
技术领域
本申请涉及电力电网技术领域,特别是涉及一种计量装置知识图谱构建方法、装置、计算机设备、存储介质和计算机程序产品、计量装置档案核查方法、装置、计算机设备、存储介质和计算机程序产品、以及计量装置缺陷类型分析方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
随着数字电网建设的推进,系统接入的计量装置数量以及计量装置采集的信息量日益增加,相应的,维护计量装置的工作难度也有所提升。电力计量装置在电能计量等方面扮演着重要角色。
然而,包括计量系统、调度系统、营销系统在内的电网子系统间尚存在交互壁垒,数据不能及时互通,对于非结构化数据挖掘水平较低,无法提取多维度的海量计量装置信息,因此,运维人员无法有效地维护计量装置,维护效率低下。
由此可见,需要提供一种能够提高计量装置的维护效率的方案。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高计量装置的维护效率的计量装置知识图谱构建方法、装置、计算机设备、存储介质和计算机程序产品、计量装置档案核查方法、装置、计算机设备、存储介质和计算机程序产品、以及计量装置缺陷类型分析方法、装置、计算机设备、存储介质和计算机程序产品方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种计量装置知识图谱构建方法。方法包括:
从多个相互独立的电网子系统获取计量装置的多源异构数据;
采用与多源异构数据的数据类型对应的实体抽取策略,抽取出多源异构数据中的计量实体和计量实体关系;
对抽取出的计量实体和计量实体关系进行知识融合,得到知识融合结果数据;
对知识融合结果数据进行知识加工,得到计量装置知识图谱。
在一个实施例中,数据类型包括结构化数据、半结构化数据和非结构化数据;
采用与多源异构数据的数据类型对应的实体抽取策略,抽取出多源异构数据中的计量实体和计量实体关系包括:
针对结构化数据,通过预设的设计转换关系,将结构化数据中的关系模式转换为本体概念,将结构化数据中的关系数据转为本体实例;
针对半结构化数据,将半结构化数据转换为结构化数据,再通过预设的设计转换关系,将转换后的结构化数据中的关系模式转换为本体概念,将结构化数据中的关系数据转为本体实例;
针对非结构化数据,采用基于规则的实体抽取方法,抽取出多源异构数据中的计量实体,并采用基于snowball的关系抽取方法,抽取出多源异构数据中的计量实体。
在一个实施例中,对抽取出的计量实体和计量实体关系进行知识融合,得到知识融合结果数据包括:
采用基于图的实体统一方法,提取每一计量实体的实体特征以及关系特征;
基于实体特征和关系特征,构建计量实体的特征向量;
计算计量实体之间特征向量的相似度;
根据相似度,对抽取出的计量实体和计量实体关系进行知识融合。
第二方面,本申请还提供了一种计量装置知识图谱构建装置。装置包括:
多源数据获取模块,从多个相互独立的电网子系统获取计量装置的多源异构数据;
数据抽取模块,用于采用与多源异构数据的数据类型对应的实体抽取策略,抽取出多源异构数据中的计量实体和计量实体关系;
知识融合模块,用于对抽取出的计量实体和计量实体关系进行知识融合,得到知识融合结果数据;
知识图谱构建模块,用于对知识融合结果数据进行知识加工,得到计量装置知识图谱。
第三方面,本申请还提供了一种计算机设备。计算机设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述计量装置知识图谱构建方法中的步骤。
第四方面,本申请还提供了一种计算机可读存储介质。计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述计量装置知识图谱构建方法中的步骤。
第五方面,本申请还提供了一种计算机程序产品。计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述计量装置知识图谱构建方法中的步骤。
上述计量装置知识图谱构建方法、装置、计算机设备、存储介质和计算机程序产品,从多个相互独立的电网子系统获取计量装置的多源异构数据,再通计量实体抽取、实体关系抽取、知识融合和知识加工,建立了计量装置知识图谱,实现了多个电网子系统之间的跨系统的信息融合,当需要对计量装置进行维护时,可以直接通过查询计量装置知识图谱的方式,获取相应的信息,进而能够支持对计量装置的高效维护。
第六方面,本申请还提供了一种计量装置档案核查方法。方法包括:
响应档案核查消息,获取计量装置档案增量数据;
根据预设的档案核查规则,将计量装置档案增量数据与已存的计量装置档案数据进行比较,识别出发生突变的异常档案数据;
将异常档案数据在已构建的计量装置档案库中进行语义搜索,得到异常档案数据的关联档案数据;
比对关联档案数据与异常档案数据,根据比对结果,更新计量装置档案库;
其中,计量装置档案库采用上述计量装置知识图谱构建方法构建。
第七方面,本申请还提供了一种计量装置档案核查装置。装置包括:
增量数据获取模块,用于响应档案核查消息,获取计量装置档案增量数据;
异常档案数据识别模块,用于根据预设的档案核查规则,将计量装置档案增量数据与已存的量装置档案数据进行比较,识别出发生突变的异常档案数据;
语义搜索模块,将异常档案数据在已构建的计量装置档案库中进行语义搜索,得到异常档案数据的关联档案数据;
档案库更新模块,用于比对关联档案数据与异常档案数据,根据比对结果,更新计量装置档案库;
其中,计量装置档案库采用上述的计量装置知识图谱构建方法构建。
第八方面,本申请还提供了一种计算机设备。计算机设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述计量装置档案核查方法中的步骤。
第九方面,本申请还提供了一种计算机可读存储介质。计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述计量装置档案核查方法中的步骤。
上述计量装置档案核查方法、装置、计算机设备、存储介质和计算机程序产品,通过预设的档案核查规则,将计量装置档案增量数据与已存的计量装置档案数据进行比较,识别出发生突变的异常档案数据,将异常档案数据在已构建的计量装置档案库中进行语义搜索,得到异常档案数据的关联档案数据,能够实现计量装置档案的在线核查,及时发现异常并更新计量装置档案库,提高了计量装置的维护效率。
第十方面,本申请还提供了一种计算机程序产品。计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述计量装置知识图谱构建方法中的步骤。
第十一方面,本申请还提供了一种计量装置缺陷类型分析方法。方法包括:
获取故障计量装置的生产批次记录数据;
将生产批次记录数据在已构建的计量装置知识图谱进行关联查询,得到同批次计量装置的装置属性数据,同批次计量装置是与故障计量装置属于同一批次的计量装置;
对比同批次计量装置的装置属性数据和生产批次记录数据,得到计量装置家族缺陷类型分析结果;
其中,计量装置知识图谱采用上述计量装置知识图谱构建方法构建。
第十二方面,本申请还提供了一种计量装置缺陷类型分析装置。装置包括:
数据获取模块,用于获取故障计量装置的生产批次记录数据;
关联查询模块,用于将生产批次记录数据在已构建的计量装置知识图谱进行关联查询,得到同批次计量装置的装置属性数据,同批次计量装置是与故障计量装置属于同一批次的计量装置;
缺陷类型分析模块,用于对比同批次计量装置的装置属性数据和生产批次记录数据,得到计量装置家族缺陷类型分析结果;
其中,计量装置知识图谱采用上述计量装置知识图谱构建方法构建。
第十三方面,本申请还提供了一种计算机设备。计算机设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述计量装置缺陷类型分析方法中的步骤。
第十四方面,本申请还提供了一种计算机可读存储介质。计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述计量装置缺陷类型分析方法中的步骤。
第十五方面,本申请还提供了一种计算机程序产品。计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述计量装置缺陷类型分析方法中的步骤。
上述计量装置缺陷类型分析方法、装置、计算机设备、存储介质和计算机程序产品,通过将发生故障的计量装置的生产批次记录数据在已构建的计量装置知识图谱进行关联查询,得到同批次计量装置的装置属性数据,对比同批次计量装置的装置属性数据和生产批次记录数据,得到计量装置家族缺陷类型分析结果。整个过程,通过计量装置知识图谱的扩展应用,实现了故障计量装置缺陷类型的快速定位,提高了计量装置的维护效率。
附图说明
图1为一个实施例中计量装置知识图谱构建方法、计量装置档案核查方法或计量装置缺陷类型分析方法的应用环境图;
图2为一个实施例中计量装置知识图谱构建方法的流程示意图;
图3为一个实施例中计量装置知识图谱构建方法的详细流程示意图;
图4为一个实施例中计量装置档案核查方法的流程示意图;
图5为一个实施例中计量装置档案核查方法的应用场景示意图;
图6为一个实施例中计量装置缺陷类型分析方法的流程示意图;
图7为一个实施例中计量装置缺陷类型分析方法的应用场景示意图;
图8为一个实施例中计量装置知识图谱构建装置的结构框图;
图9为一个实施例中计量装置档案核查装置的结构框图;
图10为一个实施例中计量装置缺陷类型分析装置的结构框图;
图11为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的计量装置知识图谱构建方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。具体的,可以是运维人员通过终端102发送计量装置知识图谱构建消息至服务器104,服务器104响应该消息,从多个相互独立的电网子系统获取计量装置的多源异构数据,采用与多源异构数据的数据类型对应的实体抽取策略,抽取出多源异构数据中的计量实体和计量实体关系,对抽取出的计量实体和计量实体关系进行知识融合,得到知识融合结果数据,对知识融合结果数据进行知识加工,得到计量装置知识图谱。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种计量装置知识图谱构建方法,以该方法应用于图1中的服务器104为例进行说明,包括以下步骤:
步骤S202,从多个相互独立的电网子系统获取计量装置的多源异构数据。
计量装置是指能用以直接或间接测出被测对象量值的装置,包括电能计量装置、高压计量装置以及里程计价表检定装置等。本电网子系统可以包括电网计量系统、调度系统、营销系统以及其他电网子系统。本实施例中,计量装置以电能计量装置为例,电网子系统以相互独立的电网计量系统、调度系统、营销系统为例进行说明。在实际应用中,获取计量装置的多源异构数据之前,技术人员可根据已有的计量领域专业知识和计量业务需求,初步确定计量装置知识图谱的模型结构。知识图谱,是结构化的语义知识库,用于迅速描述物理世界中的概念及其相互关系。在建模过程中,为了减少不必要的分支节点,提高图谱查询效率,可将静态数据作为实体,动态数据作为属性储存。实体即知识图谱中的节点,包括计量装置、用户、台区、线路等拓扑结构相对固定的数据。实体与实体间的关系通过图谱中边的形式表现。设备运行状态,在运时间,电量,电压,功率等动态数据通过实体属性的形式的存储。然后,基于构建的计量装置知识图谱的模型结构,从电网计量系统、调度系统和营销系统中抽取出计量装置相关的多源异构数据。
步骤S204,采用与多源异构数据的数据类型对应的实体抽取策略,抽取出多源异构数据中的计量实体和计量实体关系。
计量实体是指与计量装置相关信息对应的实体,例如装置、台区、线路、计量装置的生产批次数据、日电量以及核算日期等信息对应的实体。计量实体关系是指计量实体的语义关系。在实际应用中,抽取出的多源异构数据包括多种类型的数据。具体的,从计量系统、调度系统、营销系统等获取计量装置相关的多源异构数据,其中包括结构化数据、半结构化数据和非结构化数据。结构化数据主要为各系统存储的关系型数据库,包括档案数据、指标数据、电量数据、告警数据等。半结构化数据包括工作计划、年报月报等具有某种特征的数据。非结构化数据包括社保故障报告,电能计量装置的说明等纯文本数据。具体实施时,可以是针对不同类型数据,对应预设不同的实体抽取策略,然后,以有针对性地对各类型数据进行实体抽取和实体关系抽取。实体抽取又称为命名实体识别,是指从文本数据集中自动定位、识别出命名实体。本实施例中,将文本中的实体定位并分类为预先定义的类别,如装置、台区、线路等。实体关系抽取是从文本中抽取实体语义关系,如装置a属于台区a等。
步骤S206,对抽取出的计量实体和计量实体关系进行知识融合,得到知识融合结果数据。
抽取出计量实体和计量实体关系后,需要对其进行整合,以消除矛盾和歧义,比如某些实体可能有多种表达,某个特定称谓也许对应于多个不同的实体等。因此,需要对抽取出的计量实体和计量实体关系进行知识融合,以得到知识融合结果。具体的,知识融合过程可以包括对计量实体和计量实体关系进行实体链接和知识合并两部分,其中,实体链接过程包括指代消解和实体消歧等处理。
步骤S208,对知识融合结果数据进行知识加工,得到计量装置知识图谱。
当对抽取出的计量实体和计量实体关系完成指代消解和实体消歧等知识融合处理后,可以是对融合后的计量实体和计量实体关系进行知识加工,具体的,知识加工包括本体抽取、知识推理和质量评估。其中,本体抽取过程可以采用人工编辑的方式手动构建,也可以以数据驱动的自动化方式构建本体。本实施例中,以采用自动化的方式构建本体,具体包括实体并列关系相似度计算 → 实体上下位关系抽取 → 本体的生成。当完成本体构建后,得到一个知识图谱的雏形,但此时,知识图谱之间大多数关系都是残缺的,缺失值非常严重,故需要使用知识推理技术,对实体间的关系、实体的属性值以及本体的概念层次关系进行知识推理,进一步完善知识图谱。本实施例中,知识推理技术可以采用基于概率图模型的关系推理技术,也可以采用基于深度学习的关系推理技术。质量评估过程是指对知识图谱中知识的可信度进行量化,通过舍弃置信度较低的知识来保障知识图谱的质量。经过上述知识加工过程后,得到计量装置知识图谱。
上述计量装置知识图谱构建方法中,从多个相互独立的电网子系统获取计量装置的多源异构数据,再通计量实体抽取、实体关系抽取、知识融合和知识加工,建立了计量装置知识图谱,实现了多个电网子系统之间的跨系统的信息融合,当需要对计量装置进行维护时,可以直接通过查询计量装置知识图谱的方式,获取相应的信息,进而能够支持对计量装置的高效维护。
如图3所示,在一个实施例中,数据类型包括结构化数据、半结构化数据和非结构化数据;
步骤S204包括:步骤S224,针对结构化数据,通过预设的设计转换关系,将结构化数据中的关系模式转换为本体概念,将结构化数据中的关系数据转为本体实例,针对半结构化数据,将半结构化数据转换为结构化数据,再通过预设的设计转换关系,将转换后的结构化数据中的关系模式转换为本体概念,将结构化数据中的关系数据转为本体实例;针对非结构化数据,采用基于规则的实体抽取方法,抽取出多源异构数据中的计量实体,并采用基于snowball的关系抽取方法,抽取出多源异构数据中的计量实体。
具体实施时,针对不同数据类型,采用不同实体抽取策略的过程可以是:对于结构化数据,由于数据库本身结构完整便于移植,可以通过预设的设计转换规则,将系统数据库表中的字段和信息转换为本体中的概念和信息。对于半结构化数据,需要对其进行结构化处理转化成结构化数据,然后,再采用结构化数据的方法进行知识抽取,即通过预设的设计转换规则,将系统数据库表中的字段和信息转换为本体中的概念和信息。对于非结构化的纯文本数据,可以采用基于规则的实体抽取方法,抽取出多源异构数据中的计量实体,具体的,可以是基于规则的实体抽取方法通过将文本与事先建立的计量词典库进行匹配从而得到实体。采用基于snowball的关系抽取方法,抽取出多源异构数据中的计量实体。基于snowball的关系抽取属于半监督学习方法,根据已知的种子库建立规则库,对文本与规则库的规则计算相似度,相似度大于预设的相似度阈值的列入元组库,再将元组库与种子库进行对比,保留相似度得分大于预设相似度阈值,删除相似度得分小于预设相似度阈值的文本,最后得到的元组库就包含了文本抽取的关系。本实施例中,针对不同数据类型的数据,采用不同的实体抽取策略抽取计量实体和计量实体关系,更具针对性且抽取效率更高。
如图3所示,在一个实施例中,步骤S206包括:
步骤S226,采用基于图的实体统一方法,提取每一计量实体的实体特征以及关系特征,基于实体特征和关系特征,构建计量实体的特征向量,计算计量实体之间特征向量的相似度,根据相似度,对抽取出的计量实体和计量实体关系进行知识融合。
本实施例中,对计量实体和计量实体关系进行知识融合的过程包括采用实体统一算法对不同电网子系统抽取的知识包括计量实体和计量实体关系进行融合。实体统一的目的是对给定的多个实体,判断是否指向同一个实体。在不同系统中,同一个实体可能有不同的表达方式,因此需要将不同系统抽取的实体进行统一。采用基于图的实体统一方法,提取计量实体的个体特征和关系相关特征,然后基于实体特惠总能和关系特征,建立计量实体的特征向量,如果特征向量相似度的计算大于预设的相似度阈值,则判断两个计量实体为同一个实体。以此方式,完成对不同电网子系统抽取的知识的融合。本实施例中,通过实体统一算法,能够高效快速地完成对计量实体和计量实体关系的知识融合。
在另一个实施例中,本申请实施例提供了一种计量装置档案核查方法,可以应用于如图1所示的应用环境中。具体的,可以是运维人员通过终端102发送计量装置档案核查消息至服务器104,服务器104响应档案核查消息,获取计量装置档案增量数据,根据预设的档案核查规则,将计量装置档案增量数据与已存的计量装置档案数据进行比较,识别出发生突变的异常档案数据,将异常档案数据在已构建的计量装置档案库中进行语义搜索,得到异常档案数据的关联档案数据,比对关联档案数据与异常档案数据,根据比对结果,更新计量装置档案库。其中,计量装置知识库采用上述计量装置知识图谱构建方法构建。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图4所示,提供了一种计量装置档案核查方法,以该方法应用于图1中的服务器104为例进行说明,包括以下步骤:
步骤S302,响应档案核查消息,获取计量装置档案增量数据。
计量装置档案增量数据为当前时间系统中计量装置的档案数据的新增数据。计量装置档案数据包括计量装置的属性数据、核算电量数据等数据。本实施例中,计量装置仍以电能计量装置为例进行说明。具体实施时,数据采集终端会实时或周期性将采集的计量装置的档案数据传输至服务器。当运维人员通过终端发送档案核查消息至服务器时,服务器响应该消息,获取当前时间,系统中的计量装置档案数据的增量数据。
步骤S304,根据预设的档案核查规则,将计量装置档案增量数据与已存的计量装置档案数据进行比较,识别出发生突变的异常档案数据。
在实际应用中,开发人员可以预先在得到的计量装置知识图谱上建立计量装置档案核查的知识应用,得到计量装置档案库。具体的,包括根据计量装置相关的业务需求,构建计量装置档案核查规则,以便于计量装置的档案核查。具体实施时,根据预设的档案核查规则比较计量装置档案增量数据与已存的计量装置档案数据,可以是针对每个维度,将当天的增量数据与前一天的档案数据进行比较,也可以是将当天的增量数据与历史时期内的如近一个月的计量装置的档案数据的平均值进行比较,具体可视实际情况而定,在此不做限定。具体比较时,可以是针对日期、日核算电量等其他维度,将计量装置档案增量数据与已存的计量装置档案数据逐一比较,以识别出发生突变的异常档案数据,若某个维度的增量数据与已存数据的变化趋势差别大于差值阈值,则判定该维度的数据发生了突变为异常数据。举例说明,如图5所示,阻抗和台区分别是调度系统和计量系统的负荷统计口径,对于同一线路下的调度系统负荷估算电量和计量系统表码核算电量应保持一致性,根据档案核查规则,当检测出调度系统的负荷估算电量由当前时间的2022年3月1日的20011千瓦时突变到2022年3月2日的42324千瓦时,则可判定调度系统的估算电量发生了异常突变,将其标记为异常档案数据。档案核查规则可以是以响应档案核查消息的时候触发,获取当前时间系统中的计量装置档案数据的增量数据,也可以是以预设的周期定时触发,即到达预设的时间周期时,自动触发档案核查规则。
步骤S306,将异常档案数据在已构建的计量装置档案库中进行语义搜索,得到异常档案数据的关联档案数据,其中,计量装置知识图谱采用上述计量装置知识图谱构建方法构建。
承接上述实施例,若识别出异常档案数据后,可根据异常档案数据中的实体属性,在已构建的计量装置档案库中进行语义搜索,得到异常档案数据的关联档案数据。以上一个实施例的示例进行说明,异常档案数据为调度系统负荷估算电量,可根据出现异常的计量装置的实体属性,在已构建的计量装置档案库中进行语义搜索,得到如图5的关联档案数据。
步骤S308,比对关联档案数据与异常档案数据,根据比对结果,更新计量装置档案库。
得到关联档案数据后,可按照发突变的维度,对比关联档案数据与异常档案数据,根据比对结果,判断该计量装置的档案数据是否存在异常,若存在异常,则需要更新该计量装置档案库。承接上一实施例,关联档案数据显示同一计量装置在计量系统表码核算电量结果中,2022年3月2日的日电量为21124千瓦时,相较于2022年3月1日,变化值并未超出预设差值阈值,属于正常数据。由此可见,计量装置档案库中,2022年3月2日中调度系统负荷估算电量的数据存在异常,届时可修正更新该日的调度系统负荷估算电量。或者发送数据异常提醒消息至终端,以通知运维人员根据比对结果,更新计量装置档案库。
上述计量装置档案核查方法、装置、计算机设备、存储介质和计算机程序产品,通过预设的档案核查规则,将计量装置档案增量数据与已存的计量装置档案数据进行比较,识别出发生突变的异常档案数据,将异常档案数据在已构建的计量装置档案库中进行语义搜索,得到异常档案数据的关联档案数据,能够实现计量装置档案的在线核查,及时发现异常并更新计量装置档案库,提高了计量装置的维护效率。
在另一个实施例中,本申请实施例提供了一种计量装置档案核查方法,可以应用于如图1所示的应用环境中。具体的,可以是运维人员通过终端102发送计量装置缺陷类型分析消息至服务器104,服务器104响应计量装置缺陷类型分析消息,获取故障计量装置的生产批次记录数据,将生产批次记录数据在已构建的计量装置知识图谱进行关联查询,得到同批次计量装置的装置属性数据,同批次计量装置是与故障计量装置属于同一批次的计量装置,对比同批次计量装置的装置属性数据和生产批次记录数据,得到计量装置家族缺陷类型分析结果,其中,计量装置知识图谱采用上述计量装置知识图谱构建方法构建。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图6所示,提供了一种计量装置缺陷类型分析方法,以该方法应用于图1中的服务器104为例进行说明,包括以下步骤:
步骤S402,获取故障计量装置的生产批次记录数据。
故障计量装置为已知出现故障的计量装置。生产批次记录数据包括生产厂家、生产时间以及生产批号等数据。可以理解的是,故障计量装置的数量可以为一个,也可以为多个。
步骤S404,将生产批次记录数据在已构建的计量装置知识图谱进行关联查询,得到同批次计量装置的装置属性数据,同批次计量装置是与故障计量装置属于同一批次的计量装置。
本实施例中,计量装置知识图谱采用上述计量装置知识图谱构建方法构建。获取故障计量装置的生产批次记录数据后,可将生产批次记录数据已构建的计量装置知识图谱进行关联查询,得到故障计量装置的同批次计量装置的装置属性数据,包括装置编号、生产厂家、生产时间和生产批号等数据。举例说明,若发现故障的计量装置1和计量装置2的异常类型均为电量异常且生产批次一致,可初步判定该批次的计量装置可能出现了家族缺陷,则可将计量装置1和计量装置3的生产厂家和生产时间在计量装置知识图谱进行关联查询,得到计量装置1和计量装置3的同批次计量装置的装置属性数据,查询结果如图7所示。
步骤S406,对比同批次计量装置的装置属性数据和生产批次记录数据,得到计量装置家族缺陷类型分析结果。
查询得到同批次计量装置的装置属性数据之后,可对比同批次计量装置的装置属性数据和生产批次记录数据,以确定计量装置是否发生家族缺陷,得到计量装置家族缺陷类型分析结果。承接上一实施例中的示例,计量装置1和计量装置3的异常类型均为电量异常,且查询到二者的生产厂家和生产批次一致,初步判断可能存在设备家族性缺陷。之后通过筛查该厂家1的同一批次设备运行情况,可以辅助实现设备家族缺陷的快速定位,得到故障计量装置的缺陷类型,即家族缺陷和非家族缺陷。如图7所示,若查询到同批次的计量装置2出现了时钟异常,可确定该厂家的同一批次的计量装置出现了家族缺陷。届时,可发送家族缺陷排查提醒消息至终端,以通知运维人员及时排查该厂家的同批次的计量装置是否有异常,并回收出现异常的计量装置。
上述计量装置缺陷类型分析方法、装置、计算机设备、存储介质和计算机程序产品,通过将发生故障的计量装置的生产批次记录数据在已构建的计量装置知识图谱进行关联查询,得到同批次计量装置的装置属性数据,对比同批次计量装置的装置属性数据和生产批次记录数据,得到计量装置家族缺陷类型分析结果。整个过程,通过计量装置知识图谱的扩展应用,实现了故障计量装置缺陷类型的快速定位,提高了计量装置的维护效率。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的计量装置知识图谱构建方法的计量装置知识图谱构建装置、一种用于实现上述所涉及计量装置档案核查方法的计量装置档案核查装置、以及一种用于实现上述计量装置缺陷类型分析方法的计量装置缺陷类型分析装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的多个上述装置实施例中的具体限定可以参见上文中对于计量装置知识图谱构建方法、计量装置档案核查方法以及计量装置缺陷类型分析方法的限定,在此不再赘述。
在一个实施例中,如图8所示,提供了一种计量装置知识图谱构建装置,包括:多源数据获取模块510、数据抽取模块520、知识融合模块530和知识图谱构建模块540,其中:
多源数据获取模块510,从多个相互独立的电网子系统获取计量装置的多源异构数据。
数据抽取模块520,用于采用与多源异构数据的数据类型对应的实体抽取策略,抽取出多源异构数据中的计量实体和计量实体关系。
知识融合模块530,用于对抽取出的计量实体和计量实体关系进行知识融合,得到知识融合结果数据。
知识图谱构建模块540,用于对知识融合结果数据进行知识加工,得到计量装置知识图谱。
上述计量装置知识图谱构建装置,从多个相互独立的电网子系统获取计量装置的多源异构数据,再通计量实体抽取、实体关系抽取、知识融合和知识加工,建立了计量装置知识图谱,实现了多个电网子系统之间的跨系统的信息融合,当需要对计量装置进行维护时,可以直接通过查询计量装置知识图谱的方式,获取相应的信息,进而能够支持对计量装置的高效维护。
在一个实施例中,数据类型包括结构化数据、半结构化数据和非结构化数据;
数据抽取模块520还用于针对结构化数据,通过预设的设计转换关系,将结构化数据中的关系模式转换为本体概念,将结构化数据中的关系数据转为本体实例;针对半结构化数据,将半结构化数据转换为结构化数据,再通过预设的设计转换关系,将转换后的结构化数据中的关系模式转换为本体概念,将结构化数据中的关系数据转为本体实例;针对非结构化数据,采用基于规则的实体抽取方法,抽取出多源异构数据中的计量实体,并采用基于snowball的关系抽取方法,抽取出多源异构数据中的计量实体。
在一个实施例中,知识融合模块530还用于采用基于图的实体统一方法,提取每一计量实体的实体特征以及关系特征,基于实体特征和关系特征,构建计量实体的特征向量,计算计量实体之间特征向量的相似度,根据相似度,对抽取出的计量实体和计量实体关系进行知识融合。
在一个实施例中,如图9所示,提供了一种计量装置档案核查装置,包括:增量数据获取模块610、异常档案数据识别模块620、语义搜索模块630和档案库更新模块640,其中:
增量数据获取模块610,用于响应档案核查消息,获取计量装置档案增量数据。
异常档案数据识别模块620,用于根据预设的档案核查规则,将计量装置档案增量数据与已存的量装置档案数据进行比较,识别出发生突变的异常档案数据。
语义搜索模块630,将异常档案数据在已构建的计量装置档案库中进行语义搜索,得到异常档案数据的关联档案数据,其中,计量装置档案库采用上述的计量装置知识图谱构建方法构建。
档案库更新模块640,用于比对关联档案数据与异常档案数据,根据比对结果,更新计量装置档案库。
上述计量装置档案核查装置,通过预设的档案核查规则,将计量装置档案增量数据与已存的计量装置档案数据进行比较,识别出发生突变的异常档案数据,将异常档案数据在已构建的计量装置档案库中进行语义搜索,得到异常档案数据的关联档案数据,能够实现计量装置档案的在线核查,及时发现异常并更新计量装置档案库,提高了计量装置的维护效率。
在一个实施例中,如图10所示,提供了一种计量装置缺陷类型分析装置,包括:数据获取模块710、关联查询模块720和缺陷类型分析模块730,其中:
数据获取模块710,用于获取故障计量装置的生产批次记录数据。
关联查询模块720,用于将生产批次记录数据在已构建的计量装置知识图谱进行关联查询,得到同批次计量装置的装置属性数据,同批次计量装置是与故障计量装置属于同一批次的计量装置,其中,计量装置知识图谱采用上述计量装置知识图谱构建方法构建。
缺陷类型分析模块730,用于对比同批次计量装置的装置属性数据和生产批次记录数据,得到计量装置家族缺陷类型分析结果。
上述计量装置缺陷类型分析装置,通过将发生故障的计量装置的生产批次记录数据在已构建的计量装置知识图谱进行关联查询,得到同批次计量装置的装置属性数据,对比同批次计量装置的装置属性数据和生产批次记录数据,得到计量装置家族缺陷类型分析结果。整个过程,通过计量装置知识图谱的扩展应用,实现了故障计量装置缺陷类型的快速定位,提高了计量装置的维护效率。
上述计量装置知识图谱构建装置、计量装置档案核查装置以及计量装置缺陷类型分析装置。中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图11所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储计量装置的多源异构数据、故障装置的生产批次数据以及计量装置档案增量数据等数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种计量装置知识图谱构建方法、计量装置档案核查方法以及计量装置缺陷类型分析方法。
本领域技术人员可以理解,图11中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述计量装置知识图谱构建方法、计量装置档案核查方法或计量装置缺陷类型分析方法中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述计量装置知识图谱构建方法、计量装置档案核查方法或计量装置缺陷类型分析方法中的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述计量装置知识图谱构建方法、计量装置档案核查方法或计量装置缺陷类型分析方法中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (10)

1.一种计量装置知识图谱构建方法,其特征在于,所述方法包括:
从多个相互独立的电网子系统获取计量装置的多源异构数据,所述多源异构数据的数据类型包括结构化数据、半结构化数据和非结构化数据;
针对结构化数据,通过预设的设计转换关系,将结构化数据中的关系模式转换为本体概念,将结构化数据中的关系数据转为本体实例,针对半结构化数据,将所述半结构化数据转换为结构化数据,再通过预设的设计转换关系,将转换后的结构化数据中的关系模式转换为本体概念,将结构化数据中的关系数据转为本体实例,针对非结构化数据,将所述非结构化数据与预先建立的计量词典库进行匹配,抽取出所述多源异构数据中的计量实体,并采用基于snowball的关系抽取方法,抽取出所述多源异构数据中的计量实体关系;
采用基于图的实体统一方法,提取每一计量实体的实体特征以及关系特征,基于所述实体特征和所述关系特征,构建所述计量实体的特征向量,计算所述计量实体之间特征向量的相似度,根据所述相似度,对抽取出的所述计量实体和所述计量实体关系进行知识融合,得到知识融合结果数据;
对所述知识融合结果数据进行实体并列关系相似度计算、实体上下位关系抽取以及本体生成处理,得到初始计量装置知识图谱;
对所述初始计量装置知识图谱中计量实体间的关系、实体的属性值以及本体的概念层次关系进行知识推理,得到中间计量装置知识图谱;
对所述中间计量装置知识图谱中的知识的可信度进行量化,舍弃置信度低于预设置信度阈值的知识,得到计量装置知识图谱。
2.一种计量装置档案核查方法,其特征在于,所述方法包括:
响应档案核查消息,获取计量装置档案增量数据;
根据预设的档案核查规则,将所述计量装置档案增量数据与已存的计量装置档案数据进行比较,识别出发生突变的异常档案数据;
将所述异常档案数据在已构建的计量装置档案库中进行语义搜索,得到所述异常档案数据的关联档案数据;
比对所述关联档案数据与所述异常档案数据,根据比对结果,更新所述计量装置档案库;
其中,所述计量装置档案库采用如权利要求1所述的计量装置知识图谱构建方法构建。
3.一种计量装置缺陷类型分析方法,其特征在于,所述方法包括:
获取故障计量装置的生产批次记录数据;
将所述生产批次记录数据在已构建的计量装置知识图谱进行关联查询,得到同批次计量装置的装置属性数据,所述同批次计量装置是与所述故障计量装置属于同一批次的计量装置;
对比所述同批次计量装置的装置属性数据和所述生产批次记录数据,得到计量装置家族缺陷类型分析结果;
其中,所述计量装置知识图谱采用如权利要求1所述的计量装置知识图谱构建方法构建。
4.一种计量装置知识图谱构建装置,其特征在于,所述装置包括:
多源数据获取模块,从多个相互独立的电网子系统获取计量装置的多源异构数据,所述多源异构数据的数据类型包括结构化数据、半结构化数据和非结构化数据;
数据抽取模块,用于针对结构化数据,通过预设的设计转换关系,将结构化数据中的关系模式转换为本体概念,将结构化数据中的关系数据转为本体实例,针对半结构化数据,将所述半结构化数据转换为结构化数据,再通过预设的设计转换关系,将转换后的结构化数据中的关系模式转换为本体概念,将结构化数据中的关系数据转为本体实例,针对非结构化数据,将所述非结构化数据与预先建立的计量词典库进行匹配,抽取出所述多源异构数据中的计量实体,并采用基于snowball的关系抽取方法,抽取出所述多源异构数据中的计量实体关系;
知识融合模块,用于采用基于图的实体统一方法,提取每一计量实体的实体特征以及关系特征,基于所述实体特征和所述关系特征,构建所述计量实体的特征向量,计算所述计量实体之间特征向量的相似度,根据所述相似度,对抽取出的所述计量实体和所述计量实体关系进行知识融合,得到知识融合结果数据;
知识图谱构建模块,用于对所述知识融合结果数据进行实体并列关系相似度计算、实体上下位关系抽取以及本体生成处理,得到初始计量装置知识图谱,对所述初始计量装置知识图谱中计量实体间的关系、实体的属性值以及本体的概念层次关系进行知识推理,得到中间计量装置知识图谱,对所述中间计量装置知识图谱中的知识的可信度进行量化,舍弃置信度低于预设置信度阈值的知识,得到计量装置知识图谱。
5.一种计量装置档案核查装置,其特征在于,所述装置包括:
增量数据获取模块,用于响应档案核查消息,获取计量装置档案增量数据;
异常档案数据识别模块,用于根据预设的档案核查规则,将所述计量装置档案增量数据与已存的量装置档案数据进行比较,识别出发生突变的异常档案数据;
语义搜索模块,将所述异常档案数据在已构建的计量装置档案库中进行语义搜索,得到所述异常档案数据的关联档案数据;
档案库更新模块,用于比对所述关联档案数据与所述异常档案数据,根据比对结果,更新所述计量装置档案库;
其中,所述计量装置档案库采用如权利要求1所述的计量装置知识图谱构建方法构建。
6.一种计量装置缺陷类型分析装置,其特征在于,所述装置包括:
数据获取模块,用于获取故障计量装置的生产批次记录数据;
关联查询模块,用于将所述生产批次记录数据在已构建的计量装置知识图谱进行关联查询,得到同批次计量装置的装置属性数据,所述同批次计量装置是与所述故障计量装置属于同一批次的计量装置;
缺陷类型分析模块,用于对比所述同批次计量装置的装置属性数据和所述生产批次记录数据,得到计量装置家族缺陷类型分析结果;
其中,所述计量装置知识图谱采用如权利要求1所述的计量装置知识图谱构建方法构建。
7.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现以下步骤:
从多个相互独立的电网子系统获取计量装置的多源异构数据,所述多源异构数据的数据类型包括结构化数据、半结构化数据和非结构化数据;
针对结构化数据,通过预设的设计转换关系,将结构化数据中的关系模式转换为本体概念,将结构化数据中的关系数据转为本体实例,针对半结构化数据,将所述半结构化数据转换为结构化数据,再通过预设的设计转换关系,将转换后的结构化数据中的关系模式转换为本体概念,将结构化数据中的关系数据转为本体实例,针对非结构化数据,采用基于规则的实体抽取方法,抽取出所述多源异构数据中的计量实体,并采用基于snowball的关系抽取方法,抽取出所述多源异构数据中的计量实体;
采用基于图的实体统一方法,提取每一计量实体的实体特征以及关系特征,基于所述实体特征和所述关系特征,构建所述计量实体的特征向量,计算所述计量实体之间特征向量的相似度,根据所述相似度,对抽取出的所述计量实体和所述计量实体关系进行知识融合,得到知识融合结果数据;
对所述知识融合结果数据进行实体并列关系相似度计算、实体上下位关系抽取以及本体生成处理,得到初始计量装置知识图谱;
对所述初始计量装置知识图谱中计量实体间的关系、实体的属性值以及本体的概念层次关系进行知识推理,得到中间计量装置知识图谱;
对所述中间计量装置知识图谱中的知识的可信度进行量化,舍弃置信度低于预设置信度阈值的知识,得到计量装置知识图谱。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现以下步骤:
响应档案核查消息,获取计量装置档案增量数据;
根据预设的档案核查规则,将所述计量装置档案增量数据与已存的计量装置档案数据进行比较,识别出发生突变的异常档案数据;
将所述异常档案数据在已构建的计量装置档案库中进行语义搜索,得到所述异常档案数据的关联档案数据;
比对所述关联档案数据与所述异常档案数据,根据比对结果,更新所述计量装置档案库;
其中,所述计量装置档案库采用如权利要求1所述的计量装置知识图谱构建方法构建。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现以下步骤:
获取故障计量装置的生产批次记录数据;
将所述生产批次记录数据在已构建的计量装置知识图谱进行关联查询,得到同批次计量装置的装置属性数据,所述同批次计量装置是与所述故障计量装置属于同一批次的计量装置;
对比所述同批次计量装置的装置属性数据和所述生产批次记录数据,得到计量装置家族缺陷类型分析结果;
其中,所述计量装置知识图谱采用如权利要求1所述的计量装置知识图谱构建方法构建。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至3中任一项所述的方法的步骤。
CN202211529071.1A 2022-12-01 2022-12-01 计量装置知识图谱构建方法和计量装置档案核查方法 Active CN115544276B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211529071.1A CN115544276B (zh) 2022-12-01 2022-12-01 计量装置知识图谱构建方法和计量装置档案核查方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211529071.1A CN115544276B (zh) 2022-12-01 2022-12-01 计量装置知识图谱构建方法和计量装置档案核查方法

Publications (2)

Publication Number Publication Date
CN115544276A CN115544276A (zh) 2022-12-30
CN115544276B true CN115544276B (zh) 2023-04-07

Family

ID=84722118

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211529071.1A Active CN115544276B (zh) 2022-12-01 2022-12-01 计量装置知识图谱构建方法和计量装置档案核查方法

Country Status (1)

Country Link
CN (1) CN115544276B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112148893A (zh) * 2020-09-25 2020-12-29 南方电网数字电网研究院有限公司 能源分析知识图谱构建方法与能源分析可视化方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110275919B (zh) * 2019-06-18 2021-06-18 合肥工业大学 数据集成方法及装置
CN110598770B (zh) * 2019-08-30 2022-04-08 华中师范大学 一种多空间融合学习环境构建方法和装置
CN110674311A (zh) * 2019-09-05 2020-01-10 国家电网有限公司 一种基于知识图谱的电力资产异构数据融合方法
CN111881290A (zh) * 2020-06-17 2020-11-03 国家电网有限公司 一种基于加权语义相似度的配网多源网架实体融合方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112148893A (zh) * 2020-09-25 2020-12-29 南方电网数字电网研究院有限公司 能源分析知识图谱构建方法与能源分析可视化方法

Also Published As

Publication number Publication date
CN115544276A (zh) 2022-12-30

Similar Documents

Publication Publication Date Title
US20220137612A1 (en) Transformer fault diagnosis and positioning system based on digital twin
CN108197132B (zh) 一种基于图数据库的电力资产画像构建方法及装置
CN110570012B (zh) 一种基于Storm的电厂生产设备故障预警方法及系统
CN110879377B (zh) 基于深度信念网络的计量装置故障溯源方法
CN114676883A (zh) 基于大数据的电网运行管理方法、装置、设备及存储介质
CN115563477B (zh) 谐波数据识别方法、装置、计算机设备和存储介质
Han et al. Research on quality problems management of electric power equipment based on knowledge–data fusion method
Yuan et al. Multi-source data processing and fusion method for power distribution internet of things based on edge intelligence
CN107862459B (zh) 一种基于大数据的计量设备状态评估方法及系统
CN117390015A (zh) 电池护照的存储方法、设备及存储介质
CN115544276B (zh) 计量装置知识图谱构建方法和计量装置档案核查方法
CN116245033A (zh) 人工智能驱动的电力系统分析方法及智能软件平台
CN116993306A (zh) 基于知识图谱的网络协同制造系统的构建方法和装置
CN116596574A (zh) 电网用户画像构建方法及系统
CN112256735B (zh) 一种用电监测方法、装置、计算机设备和存储介质
Wang et al. Short-term probability density function forecasting of industrial loads based on ConvLSTM-MDN
CN112416904A (zh) 电力数据规范化处理方法及装置
CN115209441A (zh) 基站退服告警预测方法、装置、设备及存储介质
Xiong et al. Forecasting ultra‐short‐term wind power by multiview gated recurrent unit neural network
Rijayanti et al. LSTM Model-based Prediction of the Variations in Load Power Data from Industrial Manufacturing Machines
Fallah Tehrani et al. A class of monotone kernelized classifiers on the basis of the Choquet integral
Li et al. Abnormal line loss identification and category classification of distribution networks based on semi-supervised learning and hierarchical classification
Liu et al. Short-Term Load Prediction Based on Typical Daily Feature Selection and Time Convolutional Neural Network
Xie et al. K-means Traceability Study of Abnormal Electricity Based on Graph Neural Network
CN116169666A (zh) 电网风险的处理方法、装置、设备、存储介质和产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant