CN110990561B - 电力设备缺陷文本自动分类实现方法 - Google Patents

电力设备缺陷文本自动分类实现方法 Download PDF

Info

Publication number
CN110990561B
CN110990561B CN201910972121.5A CN201910972121A CN110990561B CN 110990561 B CN110990561 B CN 110990561B CN 201910972121 A CN201910972121 A CN 201910972121A CN 110990561 B CN110990561 B CN 110990561B
Authority
CN
China
Prior art keywords
defect
classification
text
defect text
standard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910972121.5A
Other languages
English (en)
Other versions
CN110990561A (zh
Inventor
吴向宏
梁杰
陆金龙
李建红
陈杭升
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Huayun Information Technology Co Ltd
Original Assignee
Zhejiang Huayun Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Huayun Information Technology Co Ltd filed Critical Zhejiang Huayun Information Technology Co Ltd
Priority to CN201910972121.5A priority Critical patent/CN110990561B/zh
Publication of CN110990561A publication Critical patent/CN110990561A/zh
Application granted granted Critical
Publication of CN110990561B publication Critical patent/CN110990561B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • G06F16/322Trees
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及电力系统领域,尤其涉及电力设备缺陷文本自动分类实现方法,包括:以输变电一次设备缺陷分类标准作为分类依据,建立树形结构模型;通过树路径匹配方法,将待分类的缺陷文本同生成的树结构进行树路径匹配,找到该缺陷文本对应的分类标准,最终确定该缺陷文本的分类结果。本发明的有益效果:当缺陷文本信息较为完整时,能够准确地找到其对应的分类标准,做出分类结果;而当缺陷文本不完整或者描述不够清晰时,会给出选项,让用户通过选择提升缺陷文本的质量,进而确定对应分类标准,准确评级。

Description

电力设备缺陷文本自动分类实现方法
技术领域
本发明涉及电力系统领域,尤其涉及电力设备缺陷文本自动分类实现方法。
背景技术
随着智能电网、泛在电力物联网的建设和发展,电力系统在运行、维护过程中逐渐引入新的技术或工具,改善或优化原有工作流程。在巡视过程中发现的缺陷信息,需要由巡视人员手工详细记录,并判断缺陷严重等级。这些记录下来的缺陷信息被称为缺陷文本。全寿命周期内的缺陷文本能反映电力设备的历史健康状态,同时也能反映设备的可靠性信息,因此从缺陷文本中能够挖掘出实用信息。缺陷文本通常包含了由设备分层确定的缺陷位置、缺陷详细描述、缺陷等级三部分内容。其中,前两个部分可称作缺陷说明,而缺陷等级指的是缺陷的严重程度,依据标准可分为“一般”、“严重”和“危急”三个等级,通常与缺陷说明相对应。目前缺陷严重等级分类工作主要依赖人工完成,一方面效率低,另一方面当遇到复杂问题时,会出现因知识结构和经验局限难以做出判断的情况,容易出现误分类。
发明内容
为解决上述问题,本发明提出电力设备缺陷文本自动分类实现方法。
电力设备缺陷文本自动分类实现方法,包括:
以输变电一次设备缺陷分类标准作为分类依据,建立树形结构模型;
通过树路径匹配方法,将待分类的缺陷文本同生成的树结构进行树路径匹配,找到该缺陷文本对应的分类标准,最终确定该缺陷文本的分类结果。
优选的,所述树形结构模型包括依次向下的8层结构:设备类型、设备种类、部件类型、部件种类、部位、缺陷描述、分类依据、分类结果,根节点作为第0层。
优选的,所述通过树路径匹配方法,将待分类的缺陷文本同生成的树结构进行树路径匹配,找到该缺陷文本对应的分类标准包括:
根据缺陷文本内容,按照字匹配的方式,从树形结构模型的根节点开始,对其子节点进行搜索,得到备选节点,再在所述备选节点的子节点中搜索,以此类推,直到结束,最终得到所有匹配到的分类标准。
优选的,所述通过树路径匹配方法,将待分类的缺陷文本同生成的树结构进行树路径匹配,找到该缺陷文本对应的分类标准还包括:
当在某一层出现无法匹配到任何节点的情况时,将该层所有节点均作为备选节点。
优选的,还包括:
若缺陷文本存在缺失信息,则通过人机交互的方式,不断对缺陷文本的缺失信息进行补充,逐步筛选出唯一对应的分类标准,最终确定该缺陷文本的分类结果。
优选的,所述则通过人机交互的方式,不断对缺陷文本的缺失信息进行补充,逐步筛选出唯一对应的分类标准,最终确定该缺陷文本的分类结果包括:
S31:由用户输入待分类的缺陷文本,按所述的树路径匹配算法找到其对应的所有可能路径,每条路径对应为一条分类标准;
S32:判断是否只找到了一条分类标准,若是,则可以根据该标准直接得到分类结果,结束评级;若否,则进入步骤33;
S33:从第一层机构开始,逐个寻找分类标准的分支;
S34:将所有分支作为备选选项展示给用户,由用户进行选择,实现缺陷文本的补充和完善;
S35:根据用户的选择,删去其余分支,返回步骤S32。
本发明的有益效果:
当缺陷文本信息较为完整时,能够准确地找到其对应的分类标准,做出分类结果;而当缺陷文本不完整或者描述不够清晰时,会给出选项,让用户通过选择提升缺陷文本的质量,进而确定对应分类标准,准确评级。
附图说明
下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1是本发明一实施例一种电力设备缺陷文本自动分类实现方法的流程图;
图2是本发明一实施例一种电力设备缺陷文本自动分类实现方法中树形结构模型的示意图;
图3是本发明一实施例一种电力设备缺陷文本自动分类实现方法中步骤S3的流程图;
图4是本发明一实施例一种电力设备缺陷文本自动分类实现方法中步骤S31~S35的流程图。
具体实施方式
以下结合附图,对本发明的技术方案作进一步的描述,但本发明并不限于这些实施例。
本发明的基本思想是以输变电一次设备缺陷分类标准作为分类依据,将其表示为后续需要的树形结构;为便于移动设备使用,分类方法采用较为简单、对设备性能要求不高的树路径匹配方法,将待分类的缺陷文本同生成的树结构进行树路径匹配,找到对应的分类标准;通过交互界面,实现了缺陷文本输入、缺失信息补充、评级结果展示等功能,采取人机交互的方式,不断对缺陷文本的缺失信息进行补充,逐步筛选出唯一对应的分类标准,最终确定该缺陷文本的分类结果。
基于上述思想,本发明一实施例提出一种电力设备缺陷文本自动分类实现方法,如图1所示,包括以下步骤:
S1:以输变电一次设备缺陷分类标准作为分类依据,建立树形结构模型;
S2:通过树路径匹配方法,将待分类的缺陷文本同生成的树结构进行树路径匹配,找到该缺陷文本对应的分类标准,最终确定该缺陷文本的分类结果。
在本实施例中,以国家电网公司发布的Q/GDW1906-2013输变电一次设备缺陷分类标准作为分类依据,将标准按照分层和从属关系,分成设备类型、设备种类、部件类型、部件种类、部位、缺陷描述、分类依据、分类结果8层结构,其中分类依据指的是描述缺陷程度的信息,比如“漏油”对应的漏油速度等。因此,可以将其表示为树形结构模型:根节点表示树的第0层,其向下的每一层依次对应标准中的一层结构,具体如图2所示。
一条待分类的完整的缺陷文本,应包含设备类型、设备种类、部件类型、部件种类、部位、缺陷描述、分类依据7层结构。当这些结构内容均确定时,根据标准就能够得到对应的分类结果。从树的角度看,缺陷说明等级分类,就是在树形结构模型中,找到缺陷文本对应的路径,进而根据这条路径对应的分类结果完成分类。因此,可以将这个步骤转化为树的路径匹配过程,即根据缺陷文本内容,按照简单字匹配的方式,从树形结构模型的根节点开始,对其子节点进行搜索,得到备选节点,再在这些备选节点的子节点中搜索,以此类推,直到结束,最终得到所有匹配到的标准。其中,简单字匹配指的是,对每个节点,在待分类的缺陷说明中寻找是否出现树节点内容,当出现相同内容时,匹配成功。也就是说,只有当节点包含的内容在缺陷说明中完全相同地出现时才算找到。
由于实际缺陷说明文本的记录受到记录人的专业知识、经验、记录习惯等影响,一般存在以下问题:一方面,容易遗漏部分内容,使缺陷不够明确。常出现的问题是遗漏部分设备分层的缺陷位置信息、缺陷程度等关键信息,甚至完全缺少缺陷描述。另一方面,缺陷说明文本涉及电力专业领域知识,含有许多电气专业名词,且因工作人员的经验、习惯不同,对于缺陷设备部件以及具体缺陷可能有不同的表述方式。因此,当缺陷说明文本不完整或表述与标准有差别时,在某一层可能出现无法匹配到任何节点的情况,因此考虑将该层所有节点均作为备选节点,使搜索继续进行。
作为本实施例的优选,如图3所示,本电力设备缺陷文本自动分类实现方法还包括以下步骤:
S3:若缺陷文本存在缺失信息,则通过人机交互的方式,不断对缺陷文本的缺失信息进行补充,逐步筛选出唯一对应的分类标准,最终确定该缺陷文本的分类结果。
由于缺陷文本可能存在不足,上述树路径匹配算法可能会匹配到多条分类标准,进而得到多个分类结果,导致无法确定缺陷文本的等级。因此,为唯一确定对应标准,需要对缺陷文本进行补充和完善,保证缺陷文本的质量。为此,本发明提出通过人机交互的方式,在记录者输入缺陷说明后,程序会根据匹配到的标准找到缺失信息,让记录者对缺陷说明进行补充,不断重复这个过程,直到最终确定唯一一条标准,据此得到评级结果。图4为上述过程的流程图,具体步骤如下:
S31:由用户输入待分类的缺陷文本,按所述的树路径匹配算法找到其对应的所有可能路径,每条路径对应为一条分类标准;
S32:判断是否只找到了一条分类标准,若是,则可以根据该标准直接得到分类结果,结束评级;若否,则进入步骤33;
S33:从第一层机构开始,逐个寻找分类标准的分支;
S34:将所有分支作为备选选项展示给用户,由用户进行选择,实现缺陷文本的补充和完善;
S35:根据用户的选择,删去其余分支,返回步骤S32。
本发明使用Flask框架,实现了用户交互界面的编写,包括缺陷文本输入界面、备选选项界面(包括选项的展示和选择)以及最后的评级结果可视化界面。其中,在备选选项界面,选项被制作成超链接的形式,用户可通过点击具体的选项完成选择,而程序则能够接收用户点击的选项信息,对标准进行筛选或者直接得出分类结果。因此,可以使用这些界面,由计算机自动完成缺陷文本的评级工作,且把该条文本按照标准文本进行记录。
实施例一
以“主变分接开关储油柜渗油”作为测试文本1。输入文本后,根据树路径匹配方法,仅匹配到1条分类标准,具体是“主变压器->油浸变压器->分接开关->有载开关->储油柜->渗油->有轻微渗油,未形成油滴->一般”。因此,不需要用户进行补充,根据分类标准对应的分类结果,可以直接确定该缺陷文本的评级应为“一般”。
实施例二
以“主变储油柜漏油”作为测试文本2。可以看出,这条缺陷文本不够完整,缺少了设备种类、缺陷程度描述等内容。输入缺陷文本后,根据树路径匹配方法,程序匹配到6条标准,如表1所示,其中“/”表示该标准不具有这层内容。匹配到多条分类标准,说明输入的缺陷文本不够完整或表述不清,需要用户进行补充,从而确定出最符合实际情况的分类标准。接下来,开始寻找这些标准中第一个出现差异的位置,从表1可知是部件类型。因此,程序将弹出两个选项供用户选择,即“本体”和“分接开关”。若用户选择“本体”,则程序将排除4、5、6三条分类标准,从1、2、3中继续进行判断,由表可知这三条标准的部件种类、部位、缺陷描述均相同,需要判断的是缺陷的分类依据或者说缺陷程度。程序会把三个选项展示给用户,用户做出选择后,标准将唯一确定,因此程序可以得出最终的分类结果。同理,若用户选择“分接开关”,则程序将排除1、2、3三条标准,剩余的4、5、6三条分类标准,同样仅在缺陷分类依据上有所不同,在经过用户的选择后,程序也能够得到分类结果。
表1测试文本2匹配标准
实施例三
以“主变分接开关储油柜附近有油迹”作为测试文本3。在分类标准中,并没有“附近有油迹”这种缺陷描述,也就是说,缺陷文本的表述方式与标准存在差异。因此,进行标准匹配时,匹配得到10条标准,如表2所示。从表中可以看出,根据“主变”“分接开关”“储油柜”三个信息,已经成功找到对应的设备部件,但由于缺陷描述不够准确,程序只能将所有可能的缺陷情况全部找出。接下来,程序将根据缺陷描述的不同给出选项供用户选择,包括“渗油”、“漏油”、“油位过高”、“油位过低”、“油位不可见”、“油位模糊”、“油位计破损”、“油位异常发信”8个选项。当用户选择除“漏油”外的其他选项时,即可找出唯一对应的标准,确定分类结果;而当用户选择“漏油”时,程序会再次给出分类依据选项,让用户确定缺陷程度,从而确定分类标准,得到分类结果。
表2测试文本3匹配标准
以上的文本测试中,既包括表述较为完整清晰的,也包括缺少部分信息或表述上有一定偏差的。从结果可以看出,当缺陷文本信息较为完整时,能够准确地找到其对应的分类标准,做出分类结果;而当缺陷文本不完整或者描述不够清晰时,会给出选项,让用户通过选择提升缺陷文本的质量,进而确定对应分类标准,准确评级。因此,通过本发明所述的电力设备缺陷文本自动分类实现方法,可以保证录入的缺陷文本的质量,且能自动给出缺陷文本的评级结果,分类结果准确。
本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

Claims (4)

1.电力设备缺陷文本自动分类实现方法,其特征在于,包括:
以输变电一次设备缺陷分类标准作为分类依据,建立树形结构模型;
通过树路径匹配方法,将待分类的缺陷文本同生成的树结构进行树路径匹配,找到该缺陷文本对应的分类标准,最终确定该缺陷文本的分类结果;
所述通过树路径匹配方法,将待分类的缺陷文本同生成的树结构进行树路径匹配,找到该缺陷文本对应的分类标准包括:
根据缺陷文本内容,按照字匹配的方式,从树形结构模型的根节点开始,对其子节点进行搜索,得到备选节点,再在所述备选节点的子节点中搜索,以此类推,直到结束,最终得到所有匹配到的分类标准;
当在某一层出现无法匹配到任何节点的情况时,将该层所有节点均作为备选节点。
2.根据权利要求1所述的电力设备缺陷文本自动分类实现方法,其特征在于,所述树形结构模型包括依次向下的8层结构:设备类型、设备种类、部件类型、部件种类、部位、缺陷描述、分类依据、分类结果,根节点作为第0层。
3.根据权利要求1所述的电力设备缺陷文本自动分类实现方法,其特征在于,还包括:
若缺陷文本存在缺失信息,则通过人机交互的方式,不断对缺陷文本的缺失信息进行补充,逐步筛选出唯一对应的分类标准,最终确定该缺陷文本的分类结果。
4.根据权利要求3所述的电力设备缺陷文本自动分类实现方法,其特征在于,所述则通过人机交互的方式,不断对缺陷文本的缺失信息进行补充,逐步筛选出唯一对应的分类标准,最终确定该缺陷文本的分类结果包括:
S31:由用户输入待分类的缺陷文本,按所述的树路径匹配算法找到其对应的所有可能路径,每条路径对应为一条分类标准;
S32:判断是否只找到了一条分类标准,若是,则可以根据该标准直接得到分类结果,结束评级;若否,则进入步骤33;
S33:从第一层机构开始,逐个寻找分类标准的分支;
S34:将所有分支作为备选选项展示给用户,由用户进行选择,实现缺陷文本的补充和完善;
S35:根据用户的选择,删去其余分支,返回步骤S32。
CN201910972121.5A 2019-10-14 2019-10-14 电力设备缺陷文本自动分类实现方法 Active CN110990561B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910972121.5A CN110990561B (zh) 2019-10-14 2019-10-14 电力设备缺陷文本自动分类实现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910972121.5A CN110990561B (zh) 2019-10-14 2019-10-14 电力设备缺陷文本自动分类实现方法

Publications (2)

Publication Number Publication Date
CN110990561A CN110990561A (zh) 2020-04-10
CN110990561B true CN110990561B (zh) 2023-08-29

Family

ID=70081904

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910972121.5A Active CN110990561B (zh) 2019-10-14 2019-10-14 电力设备缺陷文本自动分类实现方法

Country Status (1)

Country Link
CN (1) CN110990561B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114416988B (zh) * 2022-01-17 2024-07-05 国网福建省电力有限公司 基于自然语言处理的缺陷自动评级及处置建议推送方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105844416A (zh) * 2016-03-28 2016-08-10 国网江苏省电力公司电力科学研究院 一种用于变电站设备故障缺陷分析的综合数据管理系统
CN108628873A (zh) * 2017-03-17 2018-10-09 腾讯科技(北京)有限公司 一种文本分类方法、装置和设备
CN109977228A (zh) * 2019-03-21 2019-07-05 浙江大学 电网设备缺陷文本的信息辨识方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4908995B2 (ja) * 2006-09-27 2012-04-04 株式会社日立ハイテクノロジーズ 欠陥分類方法及びその装置並びに欠陥検査装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105844416A (zh) * 2016-03-28 2016-08-10 国网江苏省电力公司电力科学研究院 一种用于变电站设备故障缺陷分析的综合数据管理系统
CN108628873A (zh) * 2017-03-17 2018-10-09 腾讯科技(北京)有限公司 一种文本分类方法、装置和设备
CN109977228A (zh) * 2019-03-21 2019-07-05 浙江大学 电网设备缺陷文本的信息辨识方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种故障树结构缺陷检测算法研究;岳鑫;杜军威;胡强;王延平;;青岛科技大学学报(自然科学版)(第05期) *

Also Published As

Publication number Publication date
CN110990561A (zh) 2020-04-10

Similar Documents

Publication Publication Date Title
CN111563509B (zh) 一种基于tesseract的变电站端子排识别方法及系统
CN104424087A (zh) 一种web页面元素定位的方法,装置及系统
CN111091006B (zh) 一种实体意图体系的建立方法、装置、设备和介质
CN104679658A (zh) Web页面的测试方法和系统
CN103425640A (zh) 一种多媒体问答系统及方法
CN110348020A (zh) 一种英文单词拼写纠错方法、装置、设备及可读存储介质
CN111858905B (zh) 模型训练方法、信息识别方法、装置、电子设备及存储介质
JP2013113663A (ja) 試験モジュール生成装置、試験手順生成装置、生成方法、プログラム、および試験装置
CN110990561B (zh) 电力设备缺陷文本自动分类实现方法
CN105279089A (zh) 一种获取页面元素的方法及装置
CN104375934A (zh) 一种Android手机软件可靠性测试方法
CN104615669A (zh) 一种数据订正方法、装置及系统
CN104572999A (zh) 基于异构数据的错误数据的检测方法和装置
CN111523815A (zh) 一种电网工程评审方法、装置、电子设备和存储介质
CN110941910A (zh) 一种电网三维设计评审智能辅助方法及系统
CN104461864A (zh) 一种基于Eclipse插件的Java源代码缺陷检测方法及其系统
CN117709306A (zh) 一种基于大语言模型的文献综述生成方法
CN107389007A (zh) 一种自动检查电源信号线的方法及装置
CN117381177A (zh) 一种激光切割数控系统的参数自动导引方法及装置
CN104239212A (zh) 测试用例的查询方法及装置、测试用例的建立方法及装置
CN113377683B (zh) 软件测试用例的生成方法、系统、设备、终端、介质及应用
CN109754162A (zh) 用于生成工业零部件工令单的数据处理方法及装置
CN108491440A (zh) 一种gnss非实时数据溯源可视化方法和系统
CN114443493A (zh) 一种测试案例生成方法、装置、电子设备和存储介质
CN114416988B (zh) 基于自然语言处理的缺陷自动评级及处置建议推送方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant