CN105677833A - 一种基于文本挖掘技术提取断路器故障特征信息的方法 - Google Patents

一种基于文本挖掘技术提取断路器故障特征信息的方法 Download PDF

Info

Publication number
CN105677833A
CN105677833A CN201610004282.1A CN201610004282A CN105677833A CN 105677833 A CN105677833 A CN 105677833A CN 201610004282 A CN201610004282 A CN 201610004282A CN 105677833 A CN105677833 A CN 105677833A
Authority
CN
China
Prior art keywords
circuit breaker
breaker failure
fault
text
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610004282.1A
Other languages
English (en)
Other versions
CN105677833B (zh
Inventor
黄绪勇
王闸
孙鹏
王秀利
耿苏杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electric Power Research Institute of Yunnan Power System Ltd
Original Assignee
Electric Power Research Institute of Yunnan Power System Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electric Power Research Institute of Yunnan Power System Ltd filed Critical Electric Power Research Institute of Yunnan Power System Ltd
Priority to CN201610004282.1A priority Critical patent/CN105677833B/zh
Publication of CN105677833A publication Critical patent/CN105677833A/zh
Application granted granted Critical
Publication of CN105677833B publication Critical patent/CN105677833B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Fuzzy Systems (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Breakers (AREA)

Abstract

本发明公开的基于文本挖掘技术提取断路器故障特征信息的方法,包括:获取断路器故障信息,采用向量空间模型表示方法将其转化为计算机可识别的结构化信息,建立断路器故障文本;比较所述断路器故障文本内断路器故障信息的相似度,将所述断路器故障信息进行分类;统计词频,抽取高频词;结合供电企业信息系统中断路器采购记录资料以及高压断路器国家技术标准,自定义分词词库;基于词典匹配的方法,对分词后的断路器故障文本进行词性标注;将标注信息抽取和高频词汇补充相结合,识别和提取各类型故障的表征词;建立断路器故障表征信息与部件之间以及部件与部件之间的关联关系。有利于发现和提取导致故障发生的深层原因,为预防断路器故障提供依据。

Description

一种基于文本挖掘技术提取断路器故障特征信息的方法
技术领域
本发明涉及输变电设备管理技术领域,更为具体地说,涉及一种基于文本挖掘技术提取断路器故障特征信息的方法。
背景技术
断路器(circuitbreaker)是指能够关合、承载和开断正常回路条件下的电流并能关合、在规定的时间内承载和开断异常回路条件下的电流的开关位置,在电力输送的过程中,起到重要作用。如此,在我国大型电网企业管理信息系统中,由各变电站节点输入的有关断路器故障描述文本形成了规模庞大的资料库。作为电力系统中最重要的开关设备之一,断路器由多个子部件组成,结构复杂,了解和掌握其常见的故障类型和表征信息,及其与部件之间的关联关系,可以帮助实现对断路器健康状态的实时监测,保证电力系统的安全与稳定运行,具有重要的经济和实际意义。
一般的网页和其它行业领域文本资料不同,电网企业信息系统中有关断路器故障信息的资料库在存储格式和记录方式上具有独特性。在存储格式上,企业信息系统中多以表格的形式存储断路器的故障历史信息。每行记录着一次断路器故障信息,由设备型号、生产厂家、投运时间、故障大类别、故障详细情况及原因分析等列记录模块构成,具有一定的结构化特征;其中故障详细情况及原因分析列记录是非结构化的文本描述。企业的每个地方分局(或变电站)所记录的故障详细情况及原因分析文本描述因人而异,呈现非结构化特征。
因此,如何从这些断路器故障半结构化文本资料中提取特征信息,准确建立故障类型和各部件之间的关联关系,实现断路器故障智能化分析成为供电企业信息系统亟待解决的技术问题。
发明内容
本发明的目的是提供一种基于文本挖掘技术提取断路器故障特征信息的方法,实现断路器故障智能化分析。
为了解决上述技术问题,本发明提供如下技术方案:
本发明提供的一种基于文本挖掘技术提取断路器故障特征信息的方法,所述方法主要包括:
获取断路器故障信息,采用向量空间模型表示方法将其转化为计算机可识别的结构化信息,建立断路器故障文本;
比较所述断路器故障文本内断路器故障信息的相似度,将所述断路器故障信息进行分类;
统计词频,抽取高频词;
结合供电企业信息系统中断路器采购记录资料以及高压断路器国家技术标准,自定义分词词库;
基于词典匹配的方法,对分词后的断路器故障文本进行词性标注;
将标注信息抽取和高频词汇补充相结合,识别和提取各类型故障的表征词;
建立断路器故障表征信息与部件之间、以及部件与部件之间的关联关系;
其中:分词词库包括供电企业所采用断路器的型号、部件标准名称、生产厂家以及常用的故障特征描述词等。
优选的,上述基于文本挖掘技术提取断路器故障特征信息的方法中,所述判断所述断路器故障文本内断路器故障信息的相似度,将所述断路器故障信息进行分类,具体包括:
采用jaccard相似度度量算法,将断路器的故障类型进行聚类和名称标准化,并据此对故障详细情况文本进行分类。
优选的,上述基于文本挖掘技术提取断路器故障特征信息的方法中,所述统计词频,抽取高频词,具体还包括:生成各类型故障发生的比率×词语矩阵D,统计各不同类型故障发生的次数,计算其比率,其中,词语矩阵D为断路器常见故障类型及其对应的发生比率构成的矩阵。
优选的,上述基于文本挖掘技术提取断路器故障特征信息的方法中,所述方法还包括,将各类型故障详细资料文本进行分词和语义消歧。
优选的,上述基于文本挖掘技术提取断路器故障特征信息的方法中,所述识别和提取各类型故障的表征词,还包括:统计所述表征词,提取高频词。
优选的,上述基于文本挖掘技术提取断路器故障特征信息的方法中,所述方法还包括,提取发生各类型故障的断路器型号及其生产厂家信息,并统计词频。
优选的,上述基于文本挖掘技术提取断路器故障特征信息的方法中,所述方法还包括,构建所述断路器故障特征信息结构图。
优选的,上述基于文本挖掘技术提取断路器故障特征信息的方法中,所述统计各不同类型故障发生的次数,计算其比率,具体包括
其中,i和j为常数,y(gi)表示断路器故障类型gi发生的次数,初始值设为0,N表示断路器故障信息中元素总个数,
其中dk表示发生次数最多的第k类故障名称,p为比率。
本发明提供基于文本挖掘技术提取断路器故障特征信息的方法,利用文本挖掘技术从这些断路器故障半结构化文本资料中提取特征信息,准确建立故障类型和各部件之间的关联关系,实现断路器故障智能化分析成为供电企业信息系统需要解决的现实技术问题。基于相似度的计算和比较,对断路器的故障类型进行聚类和标准化,并以此为依据对文本进行分组处理;设计正向最大匹配分词算法对分组后的文本进行分词,基于词典匹配方法标注词性,结合排除法,识别和提取各类型故障的常见表征信息;基于共现准则和统计方法,分别建立各故障表征与断路器部件之间、以及部件与部件之间的关联关系,有利于发现和提取导致故障发生的深层原因,为预防断路器故障提供依据。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1是本发明实施例提供的基于文本挖掘技术提取断路器故障特征信息的方法的流程图;
图2是本发明实施例提供的文本分词实现过程图;
图3是本发明实施例提供的矩阵D、B和P分层构建断路器故障特征信息结构图
图4是本发明实施例提供的结构图实现可视化的转化图。
具体实施方式
本发明实施例提供的一种基于文本挖掘技术提取断路器故障特征信息的方法,实现断路器故障智能化分析。
为了使本技术领域的人员更好地理解本发明实施例中的技术方案,并使本发明实施例的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明实施例中的技术方案作进一步详细的说明。
参考附图1,该图示出了本发明提供的基于文本挖掘技术提取断路器故障特征信息的方法的结构流程图,其主要包括:
S101:获取断路器故障信息,采用向量空间模型表示方法将其转化为计算机可识别的结构化信息,建立断路器故障文本。
提取断路器故障信息表中“故障类型”列信息,采用向量空间模型表示方法将其转化为计算机可识别的结构化信息,形成断路器故障文本,记为向量G。
S102:比较所述断路器故障文本内断路器故障信息的相似度,将所述断路器故障信息进行分类。
优选的,采用jaccard相似度度量算法,对向量G中断路器的故障类型进行聚类和名称标准化,并据此对故障详细情况文本进行分组。向量G中任意两个元素gi和gj之间的相似度度量公式如下:
gi、gj∈G1,,且i<j,。
根据断路器故障记录表述方式的差异程度设置常数θ(0<θ<1),根据经验设置θ值。记录方式的差异越大,则θ的取值越低。通过比较jaccard(gi,gj)与θ的大小,将故障信息进行聚类、标准化和分组:
若jaccard(gi,gj)≥θ,则将gi和gj归为同类型故障,并以字符数少的词语对gi或gj进行替换,更新向量G,并将gi和gj对应的故障信息文本分为一组;
若jaccard(gi,gj)<θ,则认为gi和gj分别表示两类不同的故障类型。
S103:统计词频,抽取高频词。
将断路器故障信息进行词频统计,统计出故障信息中相同或相似的故障出现的次数,将其中出现次数较多的故障信息进行抽取。
优选的,根据以下公式统计G中各不同类型故障发生的次数:
其中,i和j为常数,y(gi)表示断路器故障类型gi发生的次数,初始值设为0;N表示向量G中元素总个数。在此基础上,抽取发生次数最多的前m种故障类型,并计算其比率:
其中,dk表示发生次数最多的第k类故障名称,p为比率。由此,可以得到由断路器常见故障类型及其对应的发生比率所构成的矩阵D。相应地,文本资料也被分为m个类型进行处理。
S104:结合供电企业信息系统中断路器采购记录资料以及高压断路器国家技术标准,自定义分词词库。
结合供电企业信息系统中断路器采购记录资料以及高压断路器国家技术标准,根据专家经验自定义分词词库E,包括供电企业所采用断路器的型号、部件标准名称、生产厂家以及常用的故障特征描述词等。
例如:E={变电站,SF6断路器,玉溪,昆明,曲靖,保山,草铺,昭通,丽江,临沧,文山,厂口,LW13-550,DHB4R-SR,DT2-550F3,美国阿海珐(AREVA),法国梅兰日兰(MG)公司,陕西西安西开高压电气股份有限公司,开断元件,绝缘支座,基座,操动机构,绝缘套管,接地外壳,出头,导电部分,灭弧室,分合闸时间,局部放电,开断磨损,燃弧时间,三相,分闸线圈,刚合速度,刚分速度,气体压力,控制回路}。根据实际情况可进行自主设计。
S105:基于词典匹配的方法,对分词后的断路器故障文本进行词性标注。
基于字符串匹配方法对各类型故障详细资料文本进行分词和语义消歧。
具体实现方式,初始化设置当前位置计数器j=0和设置字符的最大取值个数为2t;
从当前计数器开始,判断该位置字符是否为汉字字符:若是汉字字符,则k=2i,否则取k=i;查找向量E中与k等长的字段作匹配处理:若匹配成功,则将该字段作为一个词切分开来,更新计数器的当前位置;否则,i=i+1,重新匹配,其中i=1至t;
更新计数器的当前位置j=j+2t,重复上述步骤,直至文本结束,参见附图2,该图示出了分词实现过程。
分别建立断路器的型号词典E1、生产厂家词典E2、断路器部件名称词典E3、专家经验建立的故障表征词组词典E4和供电企业分局地点词典E5。例如:
E1=(SF6断路器,LW13-550,DHB4R-SR,DT2-550F3,……)
E2=(美国阿海珐(AREVA),法国梅兰日兰(MG)公司,陕西西安西开高压电气股份有限公司,……)
E3=(绝缘支座,基座,操动机构,绝缘套管,接地外壳,导电部分,灭弧室,三相,分闸线圈,……)
E4=(分合闸不同步,局部放电,开断磨损,漏气,拒分,……)
E5=(玉溪,昆明,曲靖,保山,草铺,昭通,丽江,临沧,文山,厂口,……)
S106:将标注信息抽取和高频词汇补充相结合,识别和提取各类型故障的表征词。
提取文本中标注词性为“故障表征词”的词语,保存至向量Ti;其次,采集并调用停用词和常用词词库,基于词库匹配方法删除文本中的无效信息;然后提取未标注词性的词语,生成补充词库Ti *,统计词频,抽取高频词对Ti向量进行补充。
对Ti向量中元素进行词频统计,抽取高频词,生成比率×词语矩阵B。同时统计词频和计算比率,方法与上述中出现的相同,提取向量Ti中出现比率较大的表征词,作为第i类型故障发生时的表达形式。
S107:建立断路器故障表征信息与部件之间、以及部件与部件之间的关联关系。
对于发生同类型故障的断路器,故障表征情况的不同,在很大程度上对应着不同的故障原因。本发明首先采用共现原则首先建立部件或生产厂家等信息与断路器各种故障表征词之间的关联关系,即若某部件名与Bi(i∈[1,m])中任意元素在文本任意语句中出现,则认为该部件与具有该特征的断路器故障的产生有关联,抽取对象,生成向量Yij。然后,基于统计方法判断向量Y中各元素之间是否具有关联关系,以此作为判断该故障是单因素还是多因素共同作用结果的依据。
统计断路器部件词频,抽取高频词,并生成比率×词语矩阵Pij。步骤如(3),从而得到导致各种特征下断路器故障的部件原因,及其所对应的发生比率。
根据矩阵D、B和P分层构建断路器故障特征信息结构图(P为占有比),如图3:
优选的,根据标签提取发生各类型故障的断路器型号及其生产厂家信息,并统计词频。如此可以分析那些型号及其生产厂家易出现的问题,并提前预测。
具体实例
云南电网公司信息系统中的断路器故障特征信息的提取。其中断路器故障特征信息资料如表1所示:
表1断路器故障信息表
提取表中缺陷分类列信息,构成多维向量G1。即:
G1=(SF6渗漏-密度继电器,控制回路,SF6渗漏,机构,机构,机构-漏气)。
采用jaccard相似度度量和比较方法,对向量G1中断路器的故障类型进行聚类和名称标准化,并据此对故障详细情况文本进行分组。根据jaccard相似度计算公式,得到:
jaccard(g1,g3)=0.375>0.35;
jaccard(g4,g5)=1>0.35;
jaccard(g5,g6)=0.5>0.35;
其他元素之间相似度为0,因此将该文本分为三组进行处理和知识提取,并得到更新后的G1为:G1=(SF6渗漏,控制回路,SF6渗漏,机构,机构,机构)
统计词频,抽取高频词,并生成比率×词语矩阵D。根据词频统计公式可以得到各类型故障发生的次数分别为2,1,3,对应的比率为0.33,0.17和0.5,本实例所涉及的文本资料较少,因此对这几类故障全部保留,即有矩阵D为:
自定义分词词库E:
E={变电站,SF6断路器,玉溪,昆明,曲靖,保山,草铺,昭通,丽江,临沧,文山,厂口,LW13-550,DHB4R-SR,DT2-550F3,美国阿海珐(AREVA),法国梅兰日兰(MG)公司,陕西西安西开高压电气股份有限公司,开断元件,绝缘支座,基座,操动机构,绝缘套管,接地外壳,出头,导电部分,灭弧室,分合闸时间,局部放电,开断磨损,燃弧时间,三相,分闸线圈,刚合速度,刚分速度,气体压力,控制回路,……}
基于字符串匹配的分词方法对各类型故障详细资料文本进行分词和语义消歧。本实例依据向量E和正向最大匹配分词算法对各组文本分别进行分词,以第3组“机构”类型故障的第二段文本为例,可以得到如下分词结果:
“500KV//厂口//变电站//500KV//厂口//曲靖//1//回线5813//断路器//陕西西安西开高压电气股份有限公司//5年//B相//放气阀//关//不紧//有//漏气//现象//电机//启动//打压//约//2//小时//一次//已//处理”。
以上段文本为例可以得到如下标签信息:
故障断路器所在分局:厂口
生产厂家:陕西西安西开高压电器股份有限公司
故障表征:漏气
涉及部件:放气阀,电机
采用标注信息抽取和排除法相结合的方法,识别和提取各类型故障的表征词。首先根据标注结果可以得到T3=(漏气,拒分);结合排除法后,并经过人工查询后对T3进行补充,得到T3=(漏气,拒分,分合闸不同步)。
对Ti向量中元素进行词频统计,抽取高频词,生成比率×词语矩阵Bi。词频和比率的计算如上述步骤三,提取Ti向量中出现比率较大的表征词,作为第i类型故障发生时所常见的表现形式。以T3为例,得到
基于共现准则,断路器故障表征信息与部件之间关联分析。本发明首先采用共现原则初步建立部件与断路器各种故障表征词之间的关联关系,即若某部件名与Bi(i∈[1,m])中任意元素在文本任一语句中出现,则认为该部件与具有该特征的断路器故障的产生有关联,抽取对象,生成向量Yij。然后,基于统计方法判断向量Yij中各元素之间是否具有关联关系,以此作为判断该故障是单因素还是多因素共同作用结果的依据。以B3为例,得到:Y31=φ、Y32=(放气阀)、Y33=(分闸线圈),表明造成机构-漏气故障的部件为放气阀,机构-分合闸不同步故障的发生则与分闸线圈有关联。
统计词频,抽取高频词,并生成比率×词语矩阵Pij。步骤如3),从而得到导致各种特征下断路器故障的部件原因,及其对应的发生比率。以B3为例,得到
根据矩阵D、B和P可以得到该段文本中包含断路器三种类型的故障信息,及其对应的故障特点和原因,以结构图实现该信息的可视化,如图4:
另外,从挖掘结果中可以提取发生每种类型故障的断路器型号和生产厂家信息,以及各厂家所提供断路器的故障次数统计结果,如下述表2所示。
表2该文本资料中所提取的故障断路器的型号与生产厂家信息
本发明提供基于文本挖掘技术提取断路器故障特征信息的方法,利用文本挖掘技术从这些断路器故障半结构化文本资料中提取特征信息,准确建立故障类型和各部件之间的关联关系,实现断路器故障智能化分析成为供电企业信息系统需要解决的现实技术问题。基于相似度的计算和比较,对断路器的故障类型进行聚类和标准化,并以此为依据对文本进行分组处理;设计正向最大匹配分词算法对分组后的文本进行分词,基于词典匹配方法标注词性,结合排除法,识别和提取各类型故障的常见表征信息;基于共现准则和统计方法,分别建立各故障表征与断路器部件之间、以及部件与部件之间的关联关系,有利于发现和提取导致故障发生的深层原因,为预防断路器故障提供依据。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其它实施例的不同之处。
以上所述的本发明实施方式,并不构成对本发明保护范围的限定。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于文本挖掘技术提取断路器故障特征信息的方法,其特征在于,所述方法主要包括:
获取断路器故障信息,采用向量空间模型表示方法将其转化为计算机可识别的结构化信息,建立断路器故障文本;
比较所述断路器故障文本内断路器故障信息的相似度,将所述断路器故障信息进行分类;
统计词频,抽取高频词;
结合供电企业信息系统中断路器采购记录资料以及高压断路器国家技术标准,自定义分词词库;
基于词典匹配的方法,对分词后的断路器故障文本进行词性标注;
将标注信息抽取和高频词汇补充相结合,识别和提取各类型故障的表征词;
建立断路器故障表征信息与部件之间、以及部件与部件之间的关联关系;
其中:分词词库包括供电企业所采用断路器的型号、部件标准名称、生产厂家以及常用的故障特征描述词等。
2.根据权利要求1所述的基于文本挖掘技术提取断路器故障特征信息的方法,其特征在于,所述判断所述断路器故障文本内断路器故障信息的相似度,将所述断路器故障信息进行分类,具体包括:
采用jaccard相似度度量算法,将断路器的故障类型进行聚类和名称标准化,并据此对故障详细情况文本进行分类。
3.根据权利要求2所述的基于文本挖掘技术提取断路器故障特征信息的方法,其特征在于,所述统计词频,抽取高频词,具体还包括:生成各类型故障发生的比率×词语矩阵D,统计各不同类型故障发生的次数,计算其比率,其中,词语矩阵D为断路器常见故障类型及其对应的发生比率构成的矩阵。
4.根据权利要求1所述的基于文本挖掘技术提取断路器故障特征信息的方法,其特征在于,所述方法还包括,将各类型故障详细资料文本进行分词和语义消歧。
5.根据权利要求1所述的基于文本挖掘技术提取断路器故障特征信息的方法,其特征在于,所述识别和提取各类型故障的表征词,还包括:统计所述表征词,提取高频词。
6.根据权利要求1所述的基于文本挖掘技术提取断路器故障特征信息的方法,其特征在于,所述方法还包括,提取发生各类型故障的断路器型号及其生产厂家信息,并统计词频。
7.根据权利要求1-5任意一项所述的基于文本挖掘技术提取断路器故障特征信息的方法,其特征在于,所述方法还包括,构建所述断路器故障特征信息结构图。
8.根据权利要求3所述的基于文本挖掘技术提取断路器故障特征信息的方法,其特征在于,所述统计各不同类型故障发生的次数,计算其比率,具体包括
y ( g i ) = y ( g i ) + 1 , j a c c o r d ( g i , g j ) = 1 y ( g i ) , j a c c o r d ( g i , g j ) &NotEqual; 1 , 1 &le; i < j &le; N
其中,i和j为常数,y(gi)表示断路器故障类型gi发生的次数,初始值设为0,N表示断路器故障信息中元素总个数,
p ( d k ) = y ( d k ) &Sigma; i = 1 m y ( d i ) , k &Element; &lsqb; 1 , m &rsqb; ,
其中dk表示发生次数最多的第k类故障名称,p为比率。
CN201610004282.1A 2016-01-06 2016-01-06 一种基于文本挖掘技术提取断路器故障特征信息的方法 Active CN105677833B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610004282.1A CN105677833B (zh) 2016-01-06 2016-01-06 一种基于文本挖掘技术提取断路器故障特征信息的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610004282.1A CN105677833B (zh) 2016-01-06 2016-01-06 一种基于文本挖掘技术提取断路器故障特征信息的方法

Publications (2)

Publication Number Publication Date
CN105677833A true CN105677833A (zh) 2016-06-15
CN105677833B CN105677833B (zh) 2019-03-12

Family

ID=56298881

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610004282.1A Active CN105677833B (zh) 2016-01-06 2016-01-06 一种基于文本挖掘技术提取断路器故障特征信息的方法

Country Status (1)

Country Link
CN (1) CN105677833B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107340766A (zh) * 2017-07-10 2017-11-10 浙江大学 基于相似度的电力调度告警信号文本归类及故障诊断方法
CN107391727A (zh) * 2017-08-01 2017-11-24 北京航空航天大学 设备故障序列模式的挖掘方法及装置
CN108268446A (zh) * 2018-01-16 2018-07-10 国网重庆市电力公司电力科学研究院 一种缺陷信息的处理方法及装置
CN108388601A (zh) * 2018-02-02 2018-08-10 腾讯科技(深圳)有限公司 故障的分类方法、存储介质及计算机设备
CN108664538A (zh) * 2017-11-30 2018-10-16 全球能源互联网研究院有限公司 一种输变电设备疑似家族性缺陷的自动辨识方法及系统
CN108985465A (zh) * 2018-05-21 2018-12-11 许继电气股份有限公司 一种换流站故障分类方法及系统
CN109471936A (zh) * 2018-10-11 2019-03-15 上海叔本华智能科技有限公司 一种用于对设备维护信息进行特征分类的方法和系统
CN109684447A (zh) * 2018-12-13 2019-04-26 贵州电网有限责任公司 一种基于文本挖掘的电网调度运行日志故障信息分析方法
CN110059319A (zh) * 2019-04-22 2019-07-26 上海化学工业区公共管廊有限公司 一种基于关键词共现的管廊故障分析方法
CN110991184A (zh) * 2019-12-10 2020-04-10 国网青海省电力公司 一种基于综合字典特性的继电保护定值自适应校核方法
CN114625771A (zh) * 2022-03-11 2022-06-14 北京企名片科技有限公司 一种用于数据信息特征的提取方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103837770A (zh) * 2014-02-26 2014-06-04 广东电网公司电力科学研究院 电力设备缺陷检测维护方法
CN104021180A (zh) * 2014-06-09 2014-09-03 南京航空航天大学 一种组合式软件缺陷报告分类方法
CN104866574A (zh) * 2015-05-23 2015-08-26 浙江大学 一种基于knn算法的断路器缺陷等级划分方法
CN105159822A (zh) * 2015-08-12 2015-12-16 南京航空航天大学 一种基于文本词性和程序调用关系的软件缺陷定位方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103837770A (zh) * 2014-02-26 2014-06-04 广东电网公司电力科学研究院 电力设备缺陷检测维护方法
CN104021180A (zh) * 2014-06-09 2014-09-03 南京航空航天大学 一种组合式软件缺陷报告分类方法
CN104866574A (zh) * 2015-05-23 2015-08-26 浙江大学 一种基于knn算法的断路器缺陷等级划分方法
CN105159822A (zh) * 2015-08-12 2015-12-16 南京航空航天大学 一种基于文本词性和程序调用关系的软件缺陷定位方法

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107340766A (zh) * 2017-07-10 2017-11-10 浙江大学 基于相似度的电力调度告警信号文本归类及故障诊断方法
CN107340766B (zh) * 2017-07-10 2019-04-12 浙江大学 基于相似度的电力调度告警信号文本归类及故障诊断方法
CN107391727A (zh) * 2017-08-01 2017-11-24 北京航空航天大学 设备故障序列模式的挖掘方法及装置
CN108664538B (zh) * 2017-11-30 2022-02-01 全球能源互联网研究院有限公司 一种输变电设备疑似家族性缺陷的自动辨识方法及系统
CN108664538A (zh) * 2017-11-30 2018-10-16 全球能源互联网研究院有限公司 一种输变电设备疑似家族性缺陷的自动辨识方法及系统
CN108268446A (zh) * 2018-01-16 2018-07-10 国网重庆市电力公司电力科学研究院 一种缺陷信息的处理方法及装置
CN108388601A (zh) * 2018-02-02 2018-08-10 腾讯科技(深圳)有限公司 故障的分类方法、存储介质及计算机设备
CN108985465A (zh) * 2018-05-21 2018-12-11 许继电气股份有限公司 一种换流站故障分类方法及系统
CN109471936A (zh) * 2018-10-11 2019-03-15 上海叔本华智能科技有限公司 一种用于对设备维护信息进行特征分类的方法和系统
CN109684447A (zh) * 2018-12-13 2019-04-26 贵州电网有限责任公司 一种基于文本挖掘的电网调度运行日志故障信息分析方法
CN110059319A (zh) * 2019-04-22 2019-07-26 上海化学工业区公共管廊有限公司 一种基于关键词共现的管廊故障分析方法
CN110059319B (zh) * 2019-04-22 2022-11-18 上海化学工业区公共管廊有限公司 一种基于关键词共现的管廊故障分析方法
CN110991184A (zh) * 2019-12-10 2020-04-10 国网青海省电力公司 一种基于综合字典特性的继电保护定值自适应校核方法
CN110991184B (zh) * 2019-12-10 2023-04-07 国网青海省电力公司 一种基于综合字典特性的继电保护定值自适应校核方法
CN114625771A (zh) * 2022-03-11 2022-06-14 北京企名片科技有限公司 一种用于数据信息特征的提取方法

Also Published As

Publication number Publication date
CN105677833B (zh) 2019-03-12

Similar Documents

Publication Publication Date Title
CN105677833A (zh) 一种基于文本挖掘技术提取断路器故障特征信息的方法
CN108549650B (zh) 一种智能变电站防误闭锁逻辑规则源端配置方法及系统
CN107844466B (zh) 一种故障录波文件分析模型自动生成系统及方法
CN108376966B (zh) 智能变电站防误闭锁逻辑间隔关联关系分析方法及系统
CN105335342A (zh) 一种智能变电站scd配置文件虚端子联线正确性自动审查方法
CN102957203A (zh) 一种电气设备防误操作方法、装置和系统
CN111832977A (zh) 一种基于自然语言解析的检修申请自动成票方法
CN116561941B (zh) 一种scd虚回路模板模型及其建模与应用方法
Kong et al. Entity extraction of electrical equipment malfunction text by a hybrid natural language processing algorithm
CN111509660A (zh) 一种基于配网线路的保护定值智能整定系统
CN110955694A (zh) 一种变电站智能告警通用规则库的描述方法及系统
CN107066490A (zh) 基于App平台的电气试验专业资料查询系统
CN103366060B (zh) 变电站三维设计电气断面图设备材料表的生成方法
CN112949271A (zh) 一种检修安全措施分析方法及系统
CN112148897A (zh) 一种电力系统故障信息自动检索归类方法及系统
CN107256464A (zh) 一种基于可视化软件系统的变电站安全措施填写方法
CN111553158A (zh) 一种基于BiLSTM-CRF模型的电力调度领域命名实体识别方法及系统
CN108304947A (zh) 基于scd文件对象模型的二次设备安全优化方法及系统
Ravi et al. Substation transformer failure analysis through text mining
CN115659955A (zh) 一种评审意见智能校核方法
CN112506173B (zh) 单台稳控装置策略测试方法
Zhang et al. Chinese named entity recognition of transformer bushing fault based on BiLSTM-CRF
Fauzi et al. AN ANALYSIS CAUSES OF LINE DISTURBANCE IN ELECTRICITY DISTRIBUTION IN PT. PLN (PERSERO), ULP EAST BINJAI
CN109522045B (zh) 一种基于信息流图的智能变电站二次系统快速配置方法
CN110971000A (zh) 一种馈线自动化定值设置的系统及其设置方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant