CN112131344A - 基于自动聚类技术的电力设备故障诊断方法及系统 - Google Patents
基于自动聚类技术的电力设备故障诊断方法及系统 Download PDFInfo
- Publication number
- CN112131344A CN112131344A CN202010995664.1A CN202010995664A CN112131344A CN 112131344 A CN112131344 A CN 112131344A CN 202010995664 A CN202010995664 A CN 202010995664A CN 112131344 A CN112131344 A CN 112131344A
- Authority
- CN
- China
- Prior art keywords
- fault
- word
- power equipment
- management module
- words
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 67
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000005516 engineering process Methods 0.000 title claims abstract description 28
- 238000012549 training Methods 0.000 claims abstract description 39
- 238000012545 processing Methods 0.000 claims abstract description 38
- 238000004088 simulation Methods 0.000 claims abstract description 11
- 230000008569 process Effects 0.000 claims abstract description 8
- 238000007726 management method Methods 0.000 claims description 59
- 230000011218 segmentation Effects 0.000 claims description 28
- 238000007781 pre-processing Methods 0.000 claims description 11
- 238000001914 filtration Methods 0.000 claims description 10
- 230000002159 abnormal effect Effects 0.000 claims description 9
- 238000013021 overheating Methods 0.000 claims description 6
- 238000012544 monitoring process Methods 0.000 claims description 5
- 238000007599 discharging Methods 0.000 claims description 3
- 238000010891 electric arc Methods 0.000 claims description 3
- 238000009413 insulation Methods 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 230000001052 transient effect Effects 0.000 claims description 3
- GNFTZDOKVXKIBK-UHFFFAOYSA-N 3-(2-methoxyethoxy)benzohydrazide Chemical compound COCCOC1=CC=CC(C(=O)NN)=C1 GNFTZDOKVXKIBK-UHFFFAOYSA-N 0.000 claims description 2
- 238000013075 data extraction Methods 0.000 claims description 2
- 238000010801 machine learning Methods 0.000 claims description 2
- 230000000391 smoking effect Effects 0.000 claims description 2
- 238000001514 detection method Methods 0.000 abstract description 10
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 239000000779 smoke Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3335—Syntactic pre-processing, e.g. stopword elimination, stemming
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R31/00—Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
- G01R31/50—Testing of electric apparatus, lines, cables or components for short-circuits, continuity, leakage current or incorrect line connections
- G01R31/56—Testing of electric apparatus
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Power Engineering (AREA)
- Artificial Intelligence (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及电力设备故障检测技术领域,公开了一种基于自动聚类技术的电力设备故障诊断系统,包括故障库管理模块、模型训练模块、设备管理模块、停用词管理模块、用户词典管理模块、故障诊断模拟库模块和系统管理模块,能够基于自动聚类技术实现电力设备故障的自动化检测,提高了电力设备故障诊断的效率和准确率,保障了电力设备的安全;通过其模型训练模块可以实现模拟故障诊断和检测过程,优化专业技术人员的培养方案、节省人员培养成本。与此同时,也相应提供了一种检测方法,使用了上述基于自动聚类技术的电力设备故障系统,相比于现有的依靠有经验的技术人员人工判断,准确率更高、处理更为及时、成本更低。
Description
技术领域
本发明涉及电力设备故障检测技术领域,尤其涉及一种基于自动聚类技术的电力设备故障诊断方法及系统。
背景技术
当前,电力行业中,在电力设备发生故障时,通常需要作业人员前往现场查看设备情况,根据自身的经验判断是否发生故障及设备故障类型,进而进行检修作业并记录故障情况和作业信息,或通过监测仪器监测设备的运行数据,通过数据分析判断设备的运行状况及健康水平。
现有的设备故障诊断方法为人为判断,主要依靠作业人员的经验和水平,在现有模式下,培养一名经验丰富的专业人员需要几年甚至更久的时间,时间成本和经济成本较高。当故障复杂程度高于作业人员的处理水平时,将出现难以及时诊断设备故障类型、寻求故障解决方案的情况,导致故障处理不及时,造成长时间停机的影响,从而产生较大的经济损失。特殊情况下,短期内不解决故障,甚至可能造成大范围断电或其他危急情况发生。由此可见,及时进行电力设备的故障诊断和故障解决的重要性可见一斑。
发明内容
(一)要解决的技术问题
本发明实施例提供基于自动聚类技术的电力设备故障诊断方法及系统,用以实现电力设备故障诊断的自动化和智能化,提高电力设备故障的诊断效率,降低专业技术人员的培养周期,节省培养成本。
(二)发明内容
本发明实施例提供基于自动聚类技术的电力设备故障诊断系统,包括:
故障库管理模块,用于导入故障案例数据和对已导入的故障案例数据进行分类管理;
模型训练模块,用于对故障诊断模型进行训练;
设备管理模块,用于对涉及故障诊断的设备进行分类管理,针对各类不同的设备构建不同的故障案例数据和故障诊断模型;
停用词管理模块,用于管理停用词,通过该模块实现对停用词库的增、删、改、查操作;
用户词典管理模块,用于为不同类型的设备生成用户词典,并实现对用户词典后续的增、删、改、查操作;
故障诊断模拟库模块,用于模拟故障信息,供用户进行模拟故障诊断训练;
系统管理模块,用于对本系统进行权限管理、系统设置和阈值设置操作。
优选的,模型训练模块还包括分类器训练模块,分类器训练模块用于对导入的故障案例数据进行分类与后续深度优化训练,以提高故障诊断模型的训练效率。
优选的,停用词管理模块包括相对停用词管理模块和绝对管理词模块。
基于自动聚类技术的电力设备故障诊断方法,采用如上述基于自动聚类技术的电力设备故障诊断系统,包括以下步骤:
步骤一、故障案例数据导入,通过故障库管理模块向所述基于自动聚类技术的电力设备故障诊断系统导入现有的故障案例数据;
步骤二、文本预处理,对步骤一中导入的故障案例数据进行分词处理和停用词处理;
步骤三、数据提取与分类,从步骤二中文本预处理后的故障案例数据提取有效信息,并通过所述分类器训练模块将提取出来的有效信息分类成故障现象、故障检查项和故障处理方案三种类型;
步骤四、建立故障诊断模型,通过所述设备管理模块,结合所述故障现象、故障检查项和故障处理方案,使用机器学习的方法建立故障诊断模型;
步骤五、模型优化,向导入所述基于自动聚类技术的电力设备故障诊断系统导入新的故障案例数据,并对所述分类器训练模块更新所述故障现象、故障检查项和故障处理方案三种类型的信息;同时,对所述故障诊断模型进行更新。
优选的,步骤二的文本预处理过程中,采用了结巴分词算法进行分词处理,然后通过所述停用词管理模块进行停用词处理。
优选的,分词处理具体包括以下步骤:
步骤a、基于Trie树结构实现高效的词图扫描,生成句子中汉字所有可能成词情况所构成的有向无环图;
步骤b、采用动态规划查找最大概率路径,找出基于词频的最大切分组合;
步骤c、对于未登录词,采用基于汉字成词能力的HMM模型,使用Viterbi算法进行处理。
优选的,停用词处理包括以下步骤:
步骤d、将文本进行分解和类化,以压缩词库的规模;
步骤e、查找绝对停用词并过滤绝对停用词,其中绝对停用词包括与语料特异性质无关的词;
步骤f、查找相对停用词并过滤相对停用词,其中相对停用词采用自然语言而非离散关键词的组合表述;
步骤g、动态识别停用词,基于与一个词相关联的上下文的文本长度和词的位置计算所述词为停用词的条件概率,将条件概率大于预设条件概率阈值的词识别为停用词并进行过滤。
优选的,在步骤二,事先通过所述用户词典管理模块预设常用词的用户词典,作为分词处理的参照词库;
优选的,每一条故障案例数据均包括故障现象、故障原因、故障类型、故障发现时间、故障模式、故障判明方法、故障影响。
优选的,对于故障现象有瞬态、参数超标、警报、异响、振动、过热、冒烟、拉弧、起火预设关键词进行描述,对于故障原因有松动、断裂、谐振、短路、过载预设关键词进行描述;对于故障类型预设有放电、过热、漏油、异音、绝缘低、监测仪表异常关键词进行描述。
(三)有益效果
本发明实施例提供的基于自动聚类技术的电力设备故障系统,包括故障库管理模块、模型训练模块、设备管理模块、停用词管理模块、用户词典管理模块、故障诊断模拟库模块和系统管理模块,能够基于自动聚类技术实现电力设备故障的自动化检测,提高了电力设备故障诊断的效率和准确率,保障了电力设备的安全;通过其模型训练模块可以实现模拟故障诊断和检测过程,优化专业技术人员的培养方案、节省人员培养成本。与此同时,也相应提供了一种检测方法,使用了上述基于自动聚类技术的电力设备故障系统,相比于现有的依靠有经验的技术人员人工判断,准确率更高、处理更为及时、成本更低。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例中的基于自动聚类技术的电力设备故障诊断系统的结构示意图。
图2是本发明实施例中的基于自动聚类技术的电力设备故障诊断方法的流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明实施例的描述中,需要说明的是,除非另有明确的规定和限定,术语“第一”“第二”“第三”是为了清楚说明产品部件进行的编号,不代表任何实质性区别。“上”“下”“左”“右”的方向均以附图所示方向为准。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明实施例中的具体含义。
需要说明的是,除非另有明确的规定和限定,术语“连接”应做广义理解,例如,可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以具体情况理解上述术语在发明实施例中的具体含义。
图1是本发明实施例中的基于自动聚类技术的电力设备故障系统的结构示意图,包括故障库管理模块、模型训练模块、设备管理模块、停用词管理模块、用户词典管理模块、故障诊断模拟库模块和系统管理模块七大模块。其中,故障库管理模块,用于导入故障案例数据和对已导入的故障案例数据进行分类管理;模型训练模块,用于对故障诊断模型进行训练;设备管理模块,用于对涉及故障诊断的设备进行分类管理,针对各类不同的设备构建不同的故障案例数据和故障诊断模型;停用词管理模块,用于管理停用词,通过该模块实现对停用词库的增、删、改、查操作;用户词典管理模块,用于为不同类型的设备生成用户词典,并实现对用户词典后续的增、删、改、查操作;故障诊断模拟库模块,用于模拟故障信息,供用户进行模拟故障诊断训练;系统管理模块,用于对本系统进行权限管理、系统设置和阈值设置操作。
为了提高模型训练的效率,模型训练模块还包括分类器训练模块,分类器训练模块用于对导入的故障案例数据进行分类与后续深度优化训练,以提高故障诊断模型的训练效率。因为停用词又分为相对停用词和绝对停用词,对应的停用词管理模块包括相对停用词管理模块和绝对管理词模块,将相对停用词和绝对停用词分开处理,一方面提高了停用词处理效率,另外一方面增强了停用词的完备性,减小漏停的可能性。
各个模块的工作原理如下:故障库管理模块接受外部导入的现有的故障处理案例,对已导入的故障案例数据进行分类管理,供模型训练模块建立和训练故障诊断模型。在模型训练模型建立与训练之前,首先要对相关案例进行文本预处理,将自然语言处理成方便计算机识别的形式。文本预处理包括分词处理和停用词处理,中文分词是文本挖掘的基础,中文分词技术属于自然语言处理技术范畴,对于一句话,人可以通过自己的知识来明白哪些是词,哪些不是词,但如何让计算机也能理解?其处理过程就是分词算法。对于输入的一段中文,成功的进行中文分词,可以达到电脑自动识别语句含义的效果,本系统的分词处理是为了提高系统对故障关键字的识别率。停用词则属于对自然分词结果的一种人工干预,停用词是指对分类毫无贡献的无用词,如语气词、副词、连词、介词虚词,对于一些与分类结果无关的噪声词,需要作为停用词在分词之后剔除。本发明同样制定了停用词词典,除了一些功能词语如“在”、“的”、“里面”常见的停用词,还总结了故障案例文本中有的如“现场”、“同时”作为停用词,进一步的,对于不同的设备也会选取部分专属停用词,例如:出入口、读卡器、热电偶、插件和推力。文本预处理完成后,将故障库中的信息进行结构化处理,变成表格的形式,自此才能针对各类不同的设备构建不同的故障案例数据和故障诊断模型,故障诊断模型建立后,需要继续导入新的模型案例对故障诊断模型进行优化和升级。停用词处理主要通过停用词管理模块实现,但是文本的预处理过程也需要结合用户词典进行,用于词典的增删改查通过用户词典管理模块进行。
同时该系统也可用于技术人员的训练,其故障诊断模拟库模块可以形成模拟诊断库、模拟各类故障情形,技术人员通过该模拟诊断库学习如何应对各种故障情况,在训练中提高故障处理水平。
图2是本发明实施例中的基于自动聚类技术的电力设备故障诊断方法的流程图,具体步骤如下:
S1、导入已有的故障案例记录,建立故障案例库。在本发明中,通过导入不同类型的设备故障案例记录,可以建立不同种类的故障案例库,从而构建多个类型故障的诊断模型。
S2、进行文本预处理,将故障案例库中的数据进行分词处理,分词是指将连续的字序列按照一定的规范重新组合成词序列,在本发明中,使用HMM模型和Viterbi算法,并借助自行编纂的电力设备领域部分词典对故障案例文本进行分词。中文分词是中文文本处理的一个基础性工作,利用结巴分词进行中文分词,具体方法如下:
a、基于Trie树结构实现高效的词图扫描,生成句子中汉字所有可能成词情况所构成的有向无环图;
b、采用动态规划查找最大概率路径,找出基于词频的最大切分组合;
c、对于未登录词,采用基于汉字成词能力的HMM模型,使用Viterbi算法。
S3、提取进行分词处理后的数据中的专业名词和停用词(停用词是指对分类毫无贡献的无用词,如语气词、副词、连词、介词虚词),并过滤停用词,具体方法包括:
d、将文本进行分解和类化,以压缩词库的规模;
e、查找绝对停用词并过滤绝对停用词,其中绝对停用词包括与语料特异性质无关的词;
f、查找相对停用词并过滤相对停用词,其中相对停用词采用自然语言而非离散关键词的组合表述;
g、动态识别停用词,基于与一个词相关联的上下文的文本长度和词的位置计算所述词为停用词的条件概率,将条件概率大于预设条件概率阈值的词识别为停用词并进行过滤。
例如,对于一些与分类结果无关的噪声词,需要作为停用词在分词之后剔除。本发明同样制定了停用词词典,除了一些功能词语如“在”、“的”、“里面”常见的停用词,还总结了故障案例文本中有的如“现场”、“同时”作为停用词。
S4、进行故障库文本提取,将故障库中的信息进行结构化处理,变成表格的形式,从中提取设备故障信息,故障信息包括故障现象、故障原因、故障处理措施、发现时间、故障模式、故障判明方法、故障影响,实现故障信息的录入。在本发明中,对于故障现象的描述有瞬态、参数超标、警报、异响、振动、过热、冒烟、拉弧、起火关键词,对于故障原因的描述有松动、断裂、谐振、短路、过载关键词,对于故障类型的描述有放电、过热、漏油、异音、绝缘低、监测仪表异常关键词。
S5、将预处理后的故障库数据进行分类,将故障案例数据分为以下三类:故障现象、故障检查、故障处理方案,构建分类器模型,所述分类器模型能够提取文本数据并进行自动匹配,将故障信息分为故障现象、故障检查项和故障处理方案这三类;
S6、建立故障诊断模型,利用初始故障案例库中的数据对故障诊断模型进行训练,输入故障现象,输出故障检查项和故障处理方案。每一个故障案例可以包含多个故障现象,每一个故障现象也可能出现在多个不同的故障案例中。每一个故障案例中都包含有一系列有序的检查项,但只有一个唯一对应的故障处理方案。
上述故障诊断模型的具体步骤包括:
h、输入故障信息,系统提取该故障现象的关键词,将目标故障的基本信息和所述系统故障案例库中每一个故障案例的故障基本信息进行对比,从故障案例库中,确定与目标故障相似度超过预设相似度阈值的故障案例为典型故障案例。
i、根据所述现场故障实际信息对所述典型故障案例进行优化,确定所述目标故障的优化故障诊断案例。
j、根据优化故障诊断案例对系统进行故障诊断,将优化后的故障诊断案例带入步骤S1和S2,输出对应故障案例的基本信息,包括故障原因、故障类型、故障解决方案,完成故障诊断。
S7、系统将新的故障案例存储至案例库中,进行数据更新,对故障诊断模型和分类器模型进行优化。
通过该系统,用户可输入故障现象,通过模型输出故障解决方案。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.基于自动聚类技术的电力设备故障诊断系统,其特征在于,包括:
故障库管理模块,用于导入故障案例数据和对已导入的故障案例数据进行分类管理;
模型训练模块,用于对故障诊断模型进行训练;
设备管理模块,用于对涉及故障诊断的设备进行分类管理,针对各类不同的设备构建不同的故障案例数据和故障诊断模型;
停用词管理模块,用于管理停用词,通过该模块实现对停用词库的增、删、改、查操作;
用户词典管理模块,用于为不同类型的设备生成用户词典,并实现对用户词典后续的增、删、改、查操作;
故障诊断模拟库模块,用于模拟故障信息,供用户进行模拟故障诊断训练;
系统管理模块,用于对本系统进行权限管理、系统设置和阈值设置操作。
2.根据权利要求1所述的基于自动聚类技术的电力设备故障诊断系统,其特征在于,所述模型训练模块还包括分类器训练模块,所述分类器训练模块用于对导入的故障案例数据进行分类与后续深度优化训练,以提高所述故障诊断模型的训练效率。
3.根据权利要求1所述的基于自动聚类技术的电力设备故障诊断系统,其特征在于,所述停用词管理模块包括相对停用词管理模块和绝对管理词模块。
4.基于自动聚类技术的电力设备故障诊断方法,其特征在于,采用如上述权利要求1至3中任意一项所述的基于自动聚类技术的电力设备故障诊断系统,包括以下步骤:
步骤一、故障案例数据导入,通过故障库管理模块向所述基于自动聚类技术的电力设备故障诊断系统导入现有的故障案例数据;
步骤二、文本预处理,对步骤一中导入的故障案例数据进行分词处理和停用词处理;
步骤三、数据提取与分类,从步骤二中文本预处理后的故障案例数据提取有效信息,并通过所述分类器训练模块将提取出来的有效信息分类成故障现象、故障检查项和故障处理方案三种类型;
步骤四、建立故障诊断模型,通过所述设备管理模块,结合所述故障现象、故障检查项和故障处理方案,使用机器学习的方法建立故障诊断模型;
步骤五、模型优化,向导入所述基于自动聚类技术的电力设备故障诊断系统导入新的故障案例数据,并对所述分类器训练模块更新所述故障现象、故障检查项和故障处理方案三种类型的信息;同时,对所述故障诊断模型进行更新。
5.根据权利要求4所述的基于自动聚类技术的电力设备故障诊断方法,其特征在于,所述步骤二的文本预处理过程中,采用了结巴分词算法进行分词处理,然后通过所述停用词管理模块进行停用词处理。
6.根据权利要求5所述的基于自动聚类技术的电力设备故障诊断方法,其特征在于,所述分词处理具体包括以下步骤:
步骤a、基于Trie树结构实现高效的词图扫描,生成句子中汉字所有可能成词情况所构成的有向无环图;
步骤b、采用动态规划查找最大概率路径,找出基于词频的最大切分组合;
步骤c、对于未登录词,采用基于汉字成词能力的HMM模型,使用Viterbi算法进行处理。
7.根据权利要求5所述的基于自动聚类技术的电力设备故障诊断方法,其特征在于,所述停用词处理包括以下步骤:
步骤d、将文本进行分解和类化,以压缩词库的规模;
步骤e、查找绝对停用词并过滤绝对停用词,其中绝对停用词包括与语料特异性质无关的词;
步骤f、查找相对停用词并过滤相对停用词,其中相对停用词采用自然语言而非离散关键词的组合表述;
步骤g、动态识别停用词,基于与一个词相关联的上下文的文本长度和词的位置计算所述词为停用词的条件概率,将条件概率大于预设条件概率阈值的词识别为停用词并进行过滤。
8.根据权利要求4所述的基于自动聚类技术的电力设备故障诊断方法,其特征在于,在所述步骤二,事先通过所述用户词典管理模块预设常用词的用户词典,作为分词处理的参照词库。
9.根据权利要求4所述的基于自动聚类技术的电力设备故障诊断方法,其特征在于,所述每一条故障案例数据均包括故障现象、故障原因、故障类型、故障发现时间、故障模式、故障判明方法、故障影响故障信息。
10.根据权利要求9所述的基于自动聚类技术的电力设备故障诊断方法,其特征在于,对于所述故障现象有瞬态、参数超标、警报、异响、振动、过热、冒烟、拉弧、起火预设关键词进行描述,对于所述故障原因有松动、断裂、谐振、短路、过载预设关键词进行描述;对于故障类型预设有放电、过热、漏油、异音、绝缘低、监测仪表异常关键词进行描述。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010995664.1A CN112131344A (zh) | 2020-09-21 | 2020-09-21 | 基于自动聚类技术的电力设备故障诊断方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010995664.1A CN112131344A (zh) | 2020-09-21 | 2020-09-21 | 基于自动聚类技术的电力设备故障诊断方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112131344A true CN112131344A (zh) | 2020-12-25 |
Family
ID=73841767
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010995664.1A Pending CN112131344A (zh) | 2020-09-21 | 2020-09-21 | 基于自动聚类技术的电力设备故障诊断方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112131344A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112818008A (zh) * | 2021-01-21 | 2021-05-18 | 中广核工程有限公司 | 核电调试故障智能诊断的方法、系统、介质及电子设备 |
CN113485306A (zh) * | 2021-07-28 | 2021-10-08 | 成都斯普智和信息技术有限公司 | 一种轻量级的装备故障诊断移动终端及其诊断方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103149475A (zh) * | 2013-02-05 | 2013-06-12 | 广东电网公司 | 电力设备故障诊断方法及系统 |
CN108182523A (zh) * | 2017-12-26 | 2018-06-19 | 新疆金风科技股份有限公司 | 故障数据的处理方法和装置、计算机可读存储介质 |
US20180234174A1 (en) * | 2017-02-14 | 2018-08-16 | The Boeing Company | System and method for optical time-domain reflectometry and design data wire testing |
-
2020
- 2020-09-21 CN CN202010995664.1A patent/CN112131344A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103149475A (zh) * | 2013-02-05 | 2013-06-12 | 广东电网公司 | 电力设备故障诊断方法及系统 |
US20180234174A1 (en) * | 2017-02-14 | 2018-08-16 | The Boeing Company | System and method for optical time-domain reflectometry and design data wire testing |
CN108182523A (zh) * | 2017-12-26 | 2018-06-19 | 新疆金风科技股份有限公司 | 故障数据的处理方法和装置、计算机可读存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112818008A (zh) * | 2021-01-21 | 2021-05-18 | 中广核工程有限公司 | 核电调试故障智能诊断的方法、系统、介质及电子设备 |
CN113485306A (zh) * | 2021-07-28 | 2021-10-08 | 成都斯普智和信息技术有限公司 | 一种轻量级的装备故障诊断移动终端及其诊断方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9886478B2 (en) | Aviation field service report natural language processing | |
US8489601B2 (en) | Knowledge extraction methodology for unstructured data using ontology-based text mining | |
KR101498331B1 (ko) | 텍스트 세그먼트를 가진 문서로부터 용어를 추출하기 위한 시스템 | |
CN111427775B (zh) | 一种基于Bert模型的方法层次缺陷定位方法 | |
CN110888973B (zh) | 一种监控信息表自动结构化梳理的方法 | |
CN112131344A (zh) | 基于自动聚类技术的电力设备故障诊断方法及系统 | |
CN116821310B (zh) | 一种基于大模型和知识图谱的企业知识库问答系统 | |
CN112468440A (zh) | 基于知识图谱的工控系统攻击线索发现系统 | |
CN112818008A (zh) | 核电调试故障智能诊断的方法、系统、介质及电子设备 | |
US12100394B2 (en) | System and a method for detecting point anomaly | |
CN114912435A (zh) | 基于频繁项集算法的电力文本知识发现方法及设备 | |
CN113158695A (zh) | 一种面向多语言混合文本的语义审核方法与系统 | |
CN110704638A (zh) | 一种基于聚类算法的电力文本词典构造方法 | |
CN117035099A (zh) | 基于大模型和知识图谱的企业知识库问答对生成方法 | |
CN110895566A (zh) | 一种车辆评估方法和装置 | |
CN118300860A (zh) | 一种基于机器学习和高级语义映射的电力网络异常检测系统 | |
CN113486179A (zh) | 基于维修工单的产品数据分析方法及系统 | |
KR20220041337A (ko) | 유사어로 검색어 갱신 및 핵심 문서를 추출하기 위한 그래프 생성 시스템 및 이를 이용한 그래프 생성 방법 | |
CN113642321B (zh) | 面向金融领域的因果关系提取方法和系统 | |
CN115994531A (zh) | 一种多维度文本综合辨识方法 | |
EP3447655A1 (en) | A revision system and method for revising translated texts with reduction of false positives | |
KR20220041336A (ko) | 중요 키워드 추천 및 핵심 문서를 추출하기 위한 그래프 생성 시스템 및 이를 이용한 그래프 생성 방법 | |
CN111382227A (zh) | 一种电力调度文本的处理方法及系统 | |
Quochi et al. | A MWE acquisition and lexicon builder web service | |
CN115587599B (zh) | 一种机器翻译语料的质量检测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201225 |