CN115221318A - 基于数据统一语义表征的设备健康档案库构建方法及系统 - Google Patents
基于数据统一语义表征的设备健康档案库构建方法及系统 Download PDFInfo
- Publication number
- CN115221318A CN115221318A CN202210676122.7A CN202210676122A CN115221318A CN 115221318 A CN115221318 A CN 115221318A CN 202210676122 A CN202210676122 A CN 202210676122A CN 115221318 A CN115221318 A CN 115221318A
- Authority
- CN
- China
- Prior art keywords
- equipment
- health
- data
- substation
- equipment state
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000036541 health Effects 0.000 title claims abstract description 143
- 238000010276 construction Methods 0.000 title abstract description 5
- 239000013598 vector Substances 0.000 claims abstract description 48
- 238000000034 method Methods 0.000 claims abstract description 41
- 238000011156 evaluation Methods 0.000 claims abstract description 22
- 238000004458 analytical method Methods 0.000 claims abstract description 12
- 238000013145 classification model Methods 0.000 claims abstract description 7
- 230000006870 function Effects 0.000 claims description 29
- 238000013507 mapping Methods 0.000 claims description 22
- 230000007547 defect Effects 0.000 claims description 18
- 238000012544 monitoring process Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 13
- 238000007726 management method Methods 0.000 claims description 9
- 238000004519 manufacturing process Methods 0.000 claims description 8
- 238000012360 testing method Methods 0.000 claims description 8
- 238000013528 artificial neural network Methods 0.000 claims description 7
- 230000003068 static effect Effects 0.000 claims description 6
- 230000008439 repair process Effects 0.000 claims description 5
- 230000008859 change Effects 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000008030 elimination Effects 0.000 claims description 3
- 238000003379 elimination reaction Methods 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 230000004927 fusion Effects 0.000 abstract description 3
- 238000003058 natural language processing Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 7
- 238000012423 maintenance Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 238000007689 inspection Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000009529 body temperature measurement Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 210000001503 joint Anatomy 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Water Supply & Treatment (AREA)
- Artificial Intelligence (AREA)
- Tourism & Hospitality (AREA)
- Primary Health Care (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Public Health (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于数据统一语义表征的设备健康档案库构建方法及系统,本发明包括分别输入不同来源的设备状态数据;从设备状态数据中抽取出健康特征,分别建立各个变电站设备的设备状态健康子档案;对各个设备状态健康子档案进行统一语义表征并融合为完整的设备状态健康档案;将完整的设备状态健康档案中健康特征进行向量化表示为特征向量;构建基于特征向量的分类模型以实现变电站设备状态的分类和评估。本发明能解决现有技术中由于没有充分融合和统一表征多源异构数据,导致变电站设备健康档案库构建复杂、准确度不高的问题,对专家和经验数据的依赖较少,以数据驱动的形式结合自然语言处理方法自动构建档案库,更容易与设备分析方法对接。
Description
技术领域
本发明涉及电网设备评估技术,具体涉及一种基于数据统一语义表征的设备健康档案库构建方法及系统。
背景技术
随着国内电网的迅速发展,电网设备数量成倍增加,传统的定期计划检修模式没有根据各设备的状态安排设备的检修周期,导致状态较好的设备过度检修,状态较差的设备则可能处于检修不足的状态;对电网设备运行维护采用精细化、规范化和更为科学的检修策略,在确保电网连续、稳定、安全、可靠运行的前提下实现电网设备运行维护资源消耗的最小化,已成为电网企业设备管理发展的必然趋势。当前设备变现站设备积累了红外监测数据,在线监测数据,缺陷数据等大量设备数据,目前这些数据分散在各个系统、基层单位线下表格中,专业之间数据交流、共享、及时更新难度大,不利于对设备状态进行全面评价。利用现有设备历史缺陷、修试记录、状态评价、线下一次设备历史红外测温图、台账数据、在线监测等数据多维度联动立体设备健康档案,与检修计划智能关联,实现设备差异化运检,提升运检质效。变电站异常信息存在多种不同结构的数据类型,对设备的直接状态分类提出了挑战,传统一般采用文本分类的方法,将不同的状态描述文本作为输入训练分类模型,缺点是设备的不同数据表之间容易存在数据的冗余和矛盾,往往需要人工凭借经验融合不同的数据库,对健康档案的生成和分析产生很大的障碍,效率不高。因此,如何融合多源异构数据并进行统一语义表征来实现电网变量站设备健康档案的构建已经成为一个急需解决的技术问题。
发明内容
本发明要解决的技术问题:针对现有技术的上述问题,提供一种基于数据统一语义表征的设备健康档案库构建方法及系统,本发明旨在解决现有技术中由于没有充分融合和统一表征多源异构数据,导致变电站设备健康档案库构建复杂、准确度不高的问题,本发明对专家和经验数据的依赖较少,主要以数据驱动的形式结合自然语言处理方法自动构建档案库,生产的健康档案库也更容易与设备分析方法对接。
为了解决上述技术问题,本发明采用的技术方案为:
一种基于数据统一语义表征的设备健康档案库构建方法,包括:
S1,分别输入不同来源的设备状态数据;
S2,从设备状态数据中抽取出健康特征;
S3,基于健康特征分别建立各个变电站设备的设备状态健康子档案;
S4,对各个设备状态健康子档案进行统一语义表征并融合为完整的设备状态健康档案;
S5,将完整的设备状态健康档案中健康特征进行向量化表示为特征向量;
S6,构建基于特征向量的分类模型以实现变电站设备状态的分类和评估。
可选地,步骤S1中的来源包括变电站生产管理系统、变电站在线监测系统以及变电站设备台账,不同来源的设备状态数据包括主变设备数据、主变评价数据、主变告警数据、主变修试数据、主变缺陷数据和变电站数据。
可选地,步骤S2中的健康特征包括直接特征和间接特征,其中直接特征是指变电站设备的静态数据特征,所述静态数据特征是指不随时间发生变化的数据特征;所述间接特征是指变电站设备对应的时序监测数据,所述时序监测数据随时间发生变化。
可选地,所述直接特征包括设备ID、设备名称、设备类型、电压等级、设备型号、生产厂家、投运日期、出厂日期、变电站ID、变电站名称、变电站电压等级、所属城市、所属区县、变电站类型及生产管理系统评价;所述间接特征包括缺陷频率、缺陷趋势、缺陷性质、消缺状态、验收评价、隐患状态、扣分值、告警频率、告警趋势、告警等级、告警类型及试验结论。
可选地,步骤S4包括:
S4.1,提取各个设备状态健康子档案的语义信息;
S4.2,将各个设备状态健康子档案的语义信息进行设备状态实体的对齐和链接,形成面向设备状态分析的统一语义表示体系;
S4.3,将所有面向设备状态分析的统一语义表示体系的设备状态健康子档案融合建立完整的设备状态健康档案以用于实现对变电站设备健康状态的分类和评估。
可选地,步骤S4.2中进行设备状态实体的对齐是指采用匹配函数将不同设备状态子档案库的实体在向量空间层面映射对齐,所述匹配函数为多层神经网络,其输入为标注的设备状态实体和待判断的设备状态实体、输出为在向量空间中的向量,且利用人工标注的实体对齐数据集S设计和训练匹配函数以保证不同来源数据的语义一致性和映射损失最小,且语义一致性和映射损失的计算函数表达式为:
L=Lmerge(CD1,CD2)+Lbase(ρ,S),
上式中,L表示语义一致性和映射损失,Lmerge(CD1,CD2)表示根据分布式向量表示V1和V2每一项差的绝对值和,其中分布式向量表示V1为根据设备状态健康子档案CD1为人工标注的实体对齐数据集S的分布式向量表示,分布式向量表示V2为根据设备状态健康子档案CD2为人工标注的实体对齐数据集S的分布式向量表示,Lbase(ρ,S)表示匹配函数ρ基于人工标注的实体对齐数据集S将设备状态健康子档案CD1和设备状态健康子档案CD2的特征映射到正确的设备状态实体的概率。
可选地,步骤S5中将完整的设备状态健康档案中健康特征进行向量化表示为特征向量时,针对间接特征为采用归一化映射函数将其归一化到[0,1]区间;针对直接特征为采用多头序列编码:首先针对该直接特征的特征值进行排序并构建唯一队列,将唯一队列中的每一个特征值映射到不同的序列号;然后将唯一队列中的每一个特征值采用将其对应的序列号除以序列号总和的方式作为该特征值的多头序列编码结果。
可选地,步骤S6中构建基于特征向量的分类模型为多层感知器分类网络,所述多层感知器分类网络包括依次相连的输入层、隐藏层以及输出层;在训练多层感知器分类网络时,将特征向量作为多层感知器分类网络的输入,并将多层感知器分类网络的输出与已知标签进行比较,并相应地调整多层感知器分类网络中网络参数的权重,直至达到允许迭代的最大数量或多层感知器分类网络的准确度大于设定值。
此外,本发明还提供一种基于数据统一语义表征的设备健康档案库构建系统,包括相互连接的微处理器和存储器,所述微处理器被编程或配置以执行所述基于数据统一语义表征的设备健康档案库构建方法的步骤。
此外,本发明还提供一种计算机可读存储介质,其中存储有计算机程序,所述计算机程序用于被微处理器编程或配置以执行所述基于数据统一语义表征的设备健康档案库构建方法的步骤。
和现有技术相比,本发明主要具有下述优点:本发明包括分别输入不同来源的设备状态数据;从设备状态数据中抽取出健康特征;基于健康特征分别建立各个变电站设备的设备状态健康子档案;对各个设备状态健康子档案进行统一语义表征并融合为完整的设备状态健康档案;将完整的设备状态健康档案中健康特征进行向量化表示为特征向量;构建基于特征向量的分类模型以实现变电站设备状态的分类和评估,本发明能够解决现有技术中由于没有充分融合和统一表征多源异构数据,导致变电站设备健康档案库构建复杂、准确度不高的问题,本发明对专家和经验数据的依赖较少,主要以数据驱动的形式结合自然语言处理方法自动构建档案库,生产的健康档案库也更容易与设备分析方法对接。本发明将不同来源的设备状态数据分别进行数据处理,针对不同的设备状态数据分别识别获得语义信息,建立设备健康档案的子档案;将不同的子档案的语义信息进行设备状态实体的对齐和链接,形成一个面向设备状态分析的统一语义表示体系,建立完整的设备健康档案库;然后用分布式学习方法转化设备状态信息为向量,结合自编码器进行特征压缩和提取,运用全连接深度神经网络实现状态分类;根据状态分类结果,计算设备健康等级,更新变电站设备健康档案库。相比于传统方法,本发明基于多源异构数据统一语义表征构建方法,充分考虑了和变电站设备相关的多源监测数据,可以更全面、准确、动态、地监测变电站设备的健康情况,为实现设备差异化运检提供数据支撑。
附图说明
图1为本发明实施例方法的基本流程示意图。
具体实施方式
如图1所示,本实施例基于数据统一语义表征的设备健康档案库构建方法包括:
S1,分别输入不同来源的设备状态数据;
S2,从设备状态数据中抽取出健康特征;
S3,基于健康特征分别建立各个变电站设备的设备状态健康子档案;
S4,对各个设备状态健康子档案进行统一语义表征并融合为完整的设备状态健康档案;
S5,将完整的设备状态健康档案中健康特征进行向量化表示为特征向量;
S6,构建基于特征向量的分类模型以实现变电站设备状态的分类和评估。
本实施例中,步骤S1中的来源包括变电站生产管理系统、变电站在线监测系统以及变电站设备台账,不同来源的设备状态数据包括主变设备数据、主变评价数据、主变告警数据、主变修试数据、主变缺陷数据和变电站数据。需要说明的是,变电站生产管理系统、变电站在线监测系统以及变电站设备台账均为变电站的公知数据来源,在此不再详述;主变设备数据、主变评价数据、主变告警数据、主变修试数据、主变缺陷数据和变电站数据也是变电站管理的基本数据,其中的主变是指主变压器,也是变电站基本设备,在此不再详述。
本实施例中,步骤S2中的健康特征包括直接特征和间接特征,其中直接特征是指变电站设备的静态数据特征,所述静态数据特征是指不随时间发生变化的数据特征;所述间接特征是指变电站设备对应的时序监测数据,所述时序监测数据随时间发生变化。
本实施例中,直接特征包括设备ID、设备名称、设备类型、电压等级、设备型号、生产厂家、投运日期、出厂日期、变电站ID、变电站名称、变电站电压等级、所属城市、所属区县、变电站类型及生产管理系统评价(PMS评价);间接特征包括缺陷频率、缺陷趋势、缺陷性质、消缺状态、验收评价、隐患状态、扣分值、告警频率、告警趋势、告警等级、告警类型及试验结论,直接特征和间接特征一共组成了27项健康特征。
步骤S3中基于健康特征分别建立各个变电站设备的设备状态健康子档案时,设备状态健康子档案是设备健康档案的一个具体的来源,设备状态健康子档案同样由27项健康特征值表示,分别用字符、数字和文本等数据类型进行表达,构成结构化的特征数据。例如,某一变电站设备的设备状态健康子档案为:“dca1d13e31ff8080814d7c4ca3014ddca0b38940c0,鼎功变#1主变A相,主变压器,交流500kV,ODFS-334000/500,山东电力设备有限公司,2015/6/28,2014/11/1,500kV,鼎功变电站,d748881f91ff8080814d7c4ca3014dd747785d2d4c,35,长沙,长沙,4,0.19,0.20,0.28,0.33,0.33,0,0.06,0,0,0,0,0.33”。
本实施例中,步骤S4包括:
S4.1,提取各个设备状态健康子档案的语义信息;需要说明的是,提取语义信息可根据需要现有的语义信息提取模型,本实施例中仅为对语义信息的利用,不涉及对语义信息提取方法的改进,故对提取语义信息的详细实现不再详述。
S4.2,将各个设备状态健康子档案的语义信息进行设备状态实体的对齐和链接,形成面向设备状态分析的统一语义表示体系;设备状态实体是指用一个文本关键词来表示设备健康状态的某个特征表达,如“鼎功变#1主变A相”是指变压器名称的一个状态描述,可以此描述作为设备状态实体来对这个设备进行表示,具体表示的是鼎功1号变电站A相的主变压器;如“主变压器”是设备健康状态的类型特征描述,因此“主变压器”可以作为设备状态实体表示设备类型的一个取值。基于设备状态实体,可以利用实体对齐的方法,将表示同一个实际对象的实体对象进行合并和统一。
S4.3,将所有面向设备状态分析的统一语义表示体系的设备状态健康子档案融合建立完整的设备状态健康档案以用于实现对变电站设备健康状态的分类和评估。
本实施例中,步骤S4.2中进行设备状态实体的对齐是指采用匹配函数将不同设备状态子档案库的实体在向量空间层面映射对齐,所述匹配函数为多层神经网络,其输入为标注的设备状态实体和待判断的设备状态实体、输出为在向量空间中的向量,且利用人工标注的实体对齐数据集S设计和训练匹配函数以保证不同来源数据的语义一致性和映射损失最小,且语义一致性和映射损失的计算函数表达式为:
L=Lmerge(CD1,CD2)+Lbase(ρ,S),
上式中,L表示语义一致性和映射损失,Lmerge(CD1,CD2)表示根据分布式向量表示V1和V2每一项差的绝对值和,其中分布式向量表示V1为根据设备状态健康子档案CD1为人工标注的实体对齐数据集S的分布式向量表示,分布式向量表示V2为根据设备状态健康子档案CD2为人工标注的实体对齐数据集S的分布式向量表示,Lbase(ρ,S)表示匹配函数ρ基于人工标注的实体对齐数据集S将设备状态健康子档案CD1和设备状态健康子档案CD2的特征映射到正确的设备状态实体的概率,其中设备状态健康子档案CD1和设备状态健康子档案CD2是指针对同一个变电站设备的来源不同的两个设备状态健康子档案,通过对设备状态健康子档案CD1和设备状态健康子档案CD2中不同特征的分析和融合,实现档案合并成完整的设备健康档案。
采用匹配函数将不同设备状态子档案库的实体在向量空间层面映射对齐,重点是利用标注数据设计和训练向量匹配函数,保证不同来源数据语义的一致性和映射损失最小,人工标注的实体对齐数据集S是人工标注好的实体集合,内容是设备档案相关的自然语言实体对象,用来表示设备不同的状态;格式是一个实体构成一行,每一行包含序号和实体名称。标注的过程是用户根据经验进行标注,确定表示状态的关键词,作为实体进行标注,加入集合。实体对齐的过程是利用训练数据将调整不同设备状态子档案库的编码方案(可采用独热编码、分布式编码等,本实施例中采用分布式编码)和匹配函数使得语义一致性和映射损失最小。
子档案库中的语义信息主要是实体信息,明确不同子档案库中同一个实体的不同表示方式,将其映射到同一个实体。因此,本实施例中,将所有面向设备状态分析的统一语义表示体系的设备状态健康子档案融合建立完整的设备状态健康档案以用于实现对变电站设备健康状态的分类和评估,利用统一语义表征来抽象表示所有数据类型中蕴含的语义关系。
本实施例中,步骤S5中将完整的设备状态健康档案中健康特征进行向量化表示为特征向量时,针对间接特征为采用归一化映射函数将其归一化到[0,1]区间;针对直接特征为采用多头序列编码:首先针对该直接特征的特征值进行排序并构建唯一队列,将唯一队列中的每一个特征值映射到不同的序列号;然后将唯一队列中的每一个特征值采用将其对应的序列号除以序列号总和的方式作为该特征值的多头序列编码结果。
间接特征通过一系列的归一化映射函数将不同的数据范围归一化到[0,1]区间,不同间接特征的归一化映射函数可以相同也可以不同。以变电站设备的告警趋势为例,告警趋势是衡量一个设备告警发生时间远近的特征,告警趋势的归一化映射函数如下公式:
由公式定义F取值范围是[0,1],告警趋势特征表示的是设备告警发生的趋势大小,告警趋势越大说明设备告警发生可能性越大,即告警趋势F越大设备健康程度越低。直接特征数据类型为字符串,具体分为文本、时间、数值等不同的异构表示,本实施例中针对不同异构数据的统一和通用的向量化表示编码方法:多头序列编码(Multi HeadSequence),有效地解决了文本、时间、数值等不同的异构表示的问题。
将唯一队列中的每一个特征值采用将其对应的序列号除以序列号总和的方式作为该特征值的多头序列编码结果,可表示为:
由于序列的唯一性,序列号也能保证编码的唯一性,从而可以将不同直接特征编码形成向量表示。
本实施例中,步骤S6中构建基于特征向量的分类模型为多层感知器分类网络,所述多层感知器分类网络包括依次相连的输入层、隐藏层以及输出层,在工作时,输入层是由训练集的实例特征向量传入,经过连接节点的权重传入下一层,上一层的输出是下一层的输入,最终通过输出层输出结果;在训练多层感知器分类网络时,将特征向量作为多层感知器分类网络的输入,并将多层感知器分类网络的输出与已知标签进行比较,并相应地调整多层感知器分类网络中网络参数的权重(权重通常以随机初始化值开始),直至达到允许迭代的最大数量或多层感知器分类网络的准确度大于设定值。本实施例中,多层感知器分类网络计算变电站设备的状态等级分为4级:1至4级分别对应正常状态、注意状态、异常状态以及严重状态。设备档案库中任一特征发生变化后,按照步骤S1~S6即可重新计算设备健康等级,并更新变电站设备健康档案库。
综上所述,本实施例基于数据统一语义表征的设备健康档案库构建方法将不同来源的设备状态数据分别进行数据处理,针对不同的设备状态数据分别识别获得语义信息,建立设备健康档案的子档案;将不同的子档案的语义信息进行设备状态实体的对齐和链接,形成一个面向设备状态分析的统一语义表示体系,建立完整的设备健康档案库;然后用分布式学习方法转化设备状态信息为向量,结合自编码器进行特征压缩和提取,运用全连接深度神经网络实现状态分类;根据状态分类结果,计算设备健康等级,更新变电站设备健康档案库。相比于传统方法,本发明基于多源异构数据统一语义表征构建方法,充分考虑了和变电站设备相关的多源监测数据和时序运行数据,可以更全面、准确、动态、地监测变电站设备的健康情况,为实现设备差异化运检提供数据支撑。
此外,本实施例还提供一种基于数据统一语义表征的设备健康档案库构建系统,包括相互连接的微处理器和存储器,所述微处理器被编程或配置以执行前述基于数据统一语义表征的设备健康档案库构建方法的步骤。此外,本实施例还提供一种计算机可读存储介质,其中存储有计算机程序,所述计算机程序用于被微处理器编程或配置以执行前述基于数据统一语义表征的设备健康档案库构建方法的步骤。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可读存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种基于数据统一语义表征的设备健康档案库构建方法,其特征在于,包括:
S1,分别输入不同来源的设备状态数据;
S2,从设备状态数据中抽取出健康特征;
S3,基于健康特征分别建立各个变电站设备的设备状态健康子档案;
S4,对各个设备状态健康子档案进行统一语义表征并融合为完整的设备状态健康档案;
S5,将完整的设备状态健康档案中健康特征进行向量化表示为特征向量;
S6,构建基于特征向量的分类模型以实现变电站设备状态的分类和评估。
2.根据权利要求1所述的基于数据统一语义表征的设备健康档案库构建方法,其特征在于,步骤S1中的来源包括变电站生产管理系统、变电站在线监测系统以及变电站设备台账,不同来源的设备状态数据包括主变设备数据、主变评价数据、主变告警数据、主变修试数据、主变缺陷数据和变电站数据。
3.根据权利要求1所述的基于数据统一语义表征的设备健康档案库构建方法,其特征在于,步骤S2中的健康特征包括直接特征和间接特征,其中直接特征是指变电站设备的静态数据特征,所述静态数据特征是指不随时间发生变化的数据特征;所述间接特征是指变电站设备对应的时序监测数据,所述时序监测数据随时间发生变化。
4.根据权利要求3所述的基于数据统一语义表征的设备健康档案库构建方法,其特征在于,所述直接特征包括设备ID、设备名称、设备类型、电压等级、设备型号、生产厂家、投运日期、出厂日期、变电站ID、变电站名称、变电站电压等级、所属城市、所属区县、变电站类型及生产管理系统评价;所述间接特征包括缺陷频率、缺陷趋势、缺陷性质、消缺状态、验收评价、隐患状态、扣分值、告警频率、告警趋势、告警等级、告警类型及试验结论。
5.根据权利要求1所述的基于数据统一语义表征的设备健康档案库构建方法,其特征在于,步骤S4包括:
S4.1,提取各个设备状态健康子档案的语义信息;
S4.2,将各个设备状态健康子档案的语义信息进行设备状态实体的对齐和链接,形成面向设备状态分析的统一语义表示体系;
S4.3,将所有面向设备状态分析的统一语义表示体系的设备状态健康子档案融合建立完整的设备状态健康档案以用于实现对变电站设备健康状态的分类和评估。
6.根据权利要求5所述的基于数据统一语义表征的设备健康档案库构建方法,其特征在于,步骤S4.2中进行设备状态实体的对齐是指采用匹配函数将不同设备状态子档案库的实体在向量空间层面映射对齐,所述匹配函数为多层神经网络,其输入为标注的设备状态实体和待判断的设备状态实体、输出为在向量空间中的向量,且利用人工标注的实体对齐数据集S设计和训练匹配函数以保证不同来源数据的语义一致性和映射损失最小,且语义一致性和映射损失的计算函数表达式为:
L=Lmerge(CD1,CD2)+Lbase(ρ,S),
上式中,L表示语义一致性和映射损失,Lmerge(CD1,CD2)表示根据分布式向量表示V1和V2每一项差的绝对值和,其中分布式向量表示V1为根据设备状态健康子档案CD1为人工标注的实体对齐数据集S的分布式向量表示,分布式向量表示V2为根据设备状态健康子档案CD2为人工标注的实体对齐数据集S的分布式向量表示,Lbase(ρ,S)表示匹配函数ρ基于人工标注的实体对齐数据集S将设备状态健康子档案CD1和设备状态健康子档案CD2的特征映射到正确的设备状态实体的概率。
7.根据权利要求3所述的基于数据统一语义表征的设备健康档案库构建方法,其特征在于,步骤S5中将完整的设备状态健康档案中健康特征进行向量化表示为特征向量时,针对间接特征为采用归一化映射函数将其归一化到[0,1]区间;针对直接特征为采用多头序列编码:首先针对该直接特征的特征值进行排序并构建唯一队列,将唯一队列中的每一个特征值映射到不同的序列号;然后将唯一队列中的每一个特征值采用将其对应的序列号除以序列号总和的方式作为该特征值的多头序列编码结果。
8.根据权利要求7所述的基于数据统一语义表征的设备健康档案库构建方法,其特征在于,步骤S6中构建基于特征向量的分类模型为多层感知器分类网络,所述多层感知器分类网络包括依次相连的输入层、隐藏层以及输出层;在训练多层感知器分类网络时,将特征向量作为多层感知器分类网络的输入,并将多层感知器分类网络的输出与已知标签进行比较,并相应地调整多层感知器分类网络中网络参数的权重,直至达到允许迭代的最大数量或多层感知器分类网络的准确度大于设定值。
9.一种基于数据统一语义表征的设备健康档案库构建系统,包括相互连接的微处理器和存储器,其特征在于,所述微处理器被编程或配置以执行权利要求1~8中任意一项所述基于数据统一语义表征的设备健康档案库构建方法的步骤。
10.一种计算机可读存储介质,其中存储有计算机程序,其特征在于,所述计算机程序用于被微处理器编程或配置以执行权利要求1~8中任意一项所述基于数据统一语义表征的设备健康档案库构建方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210676122.7A CN115221318A (zh) | 2022-06-15 | 2022-06-15 | 基于数据统一语义表征的设备健康档案库构建方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210676122.7A CN115221318A (zh) | 2022-06-15 | 2022-06-15 | 基于数据统一语义表征的设备健康档案库构建方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115221318A true CN115221318A (zh) | 2022-10-21 |
Family
ID=83607094
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210676122.7A Pending CN115221318A (zh) | 2022-06-15 | 2022-06-15 | 基于数据统一语义表征的设备健康档案库构建方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115221318A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116610988A (zh) * | 2023-07-17 | 2023-08-18 | 北京量子伟业信息技术股份有限公司 | 一种电子档案管理方法、设备及介质 |
CN117257302A (zh) * | 2023-09-20 | 2023-12-22 | 湖北万维科技发展有限责任公司 | 人员心理健康状态评估方法及系统 |
CN117764631A (zh) * | 2024-02-22 | 2024-03-26 | 山东中翰软件有限公司 | 基于源端静态数据建模的数据治理优化方法及系统 |
-
2022
- 2022-06-15 CN CN202210676122.7A patent/CN115221318A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116610988A (zh) * | 2023-07-17 | 2023-08-18 | 北京量子伟业信息技术股份有限公司 | 一种电子档案管理方法、设备及介质 |
CN117257302A (zh) * | 2023-09-20 | 2023-12-22 | 湖北万维科技发展有限责任公司 | 人员心理健康状态评估方法及系统 |
CN117764631A (zh) * | 2024-02-22 | 2024-03-26 | 山东中翰软件有限公司 | 基于源端静态数据建模的数据治理优化方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115221318A (zh) | 基于数据统一语义表征的设备健康档案库构建方法及系统 | |
CN104798043B (zh) | 一种数据处理方法和计算机系统 | |
CN107169628B (zh) | 一种基于大数据互信息属性约简的配电网可靠性评估方法 | |
Redl et al. | Automatic SLA matching and provider selection in grid and cloud computing markets | |
KR102286415B1 (ko) | 제품수명주기에 따른 수명주기별 온라인과 오프라인 정보분석 서비스 시스템 | |
CN113590698B (zh) | 基于人工智能技术的数据资产分类建模与分级保护方法 | |
Deng et al. | Metaverse-driven remote management solution for scene-based energy storage power stations | |
CN115564071A (zh) | 一种电力物联网设备数据标签生成方法及系统 | |
CN110910026A (zh) | 一种跨省输电线路线损智能管理与决策方法及系统 | |
CN114548494B (zh) | 一种可视化造价数据预测智能分析系统 | |
CN116861924A (zh) | 基于人工智能的项目风险预警方法及系统 | |
CN112950316A (zh) | 基于微调bert模型的电力零售套餐向量表示方法 | |
CN117273133A (zh) | 配电网多源异构数据知识图谱的构建方法 | |
Bian et al. | Research on an Artificial Intelligence‐Based Professional Ability Evaluation System from the Perspective of Industry‐Education Integration | |
CN107798137B (zh) | 一种基于可加模型的多源异构数据融合架构系统 | |
CN118132750A (zh) | 电力行业客户服务数据的处理方法及装置 | |
Chrisnanto et al. | The uses of educational data mining in academic performance analysis at higher education institutions (case study at UNJANI) | |
CN114048325A (zh) | 基于知识图谱的案件处理方法及装置、存储介质 | |
CN116842263A (zh) | 一种智能问答式理财顾问模型的训练处理方法及装置 | |
Yang et al. | Advancing bridge construction monitoring: AI-based building information modeling for intelligent structural damage recognition | |
Regla et al. | Research Network Analysis, Agenda Mapping and Research Productivity Monitoring: Insights from a Higher Education in the Philippines | |
Wei et al. | A Data-Driven Human–Machine Collaborative Product Design System Toward Intelligent Manufacturing | |
CN112685608A (zh) | 一种基于cypher的电网调度领域知识属性图模型构建方法 | |
CN108664590A (zh) | 一种枸杞数据识别方法 | |
JP7185888B1 (ja) | 情報処理システム、情報処理方法及び情報処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |