CN106228280A - 电网运行监控信息辨识分类系统 - Google Patents
电网运行监控信息辨识分类系统 Download PDFInfo
- Publication number
- CN106228280A CN106228280A CN201610538554.6A CN201610538554A CN106228280A CN 106228280 A CN106228280 A CN 106228280A CN 201610538554 A CN201610538554 A CN 201610538554A CN 106228280 A CN106228280 A CN 106228280A
- Authority
- CN
- China
- Prior art keywords
- document
- warning information
- clusters
- text
- max
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 78
- 238000012545 processing Methods 0.000 claims abstract description 29
- 239000013598 vector Substances 0.000 claims abstract description 28
- 238000007621 cluster analysis Methods 0.000 claims abstract description 26
- 238000007781 pre-processing Methods 0.000 claims abstract description 16
- 238000000034 method Methods 0.000 claims description 34
- 239000011159 matrix material Substances 0.000 claims description 21
- 230000006870 function Effects 0.000 claims description 20
- 230000008859 change Effects 0.000 claims description 14
- 238000003064 k means clustering Methods 0.000 claims description 13
- 230000001174 ascending effect Effects 0.000 claims description 7
- 230000019771 cognition Effects 0.000 claims description 7
- 230000006872 improvement Effects 0.000 claims description 7
- 238000012360 testing method Methods 0.000 claims description 7
- 238000005070 sampling Methods 0.000 description 6
- 230000002159 abnormal effect Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Artificial Intelligence (AREA)
- Water Supply & Treatment (AREA)
- Game Theory and Decision Science (AREA)
- Primary Health Care (AREA)
- Quality & Reliability (AREA)
- Probability & Statistics with Applications (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Public Health (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了电网运行监控信息辨识分类系统,包括:信息预处理模块,用于对电网运行监控信息进行预处理,形成有效的告警信息文本;文本特征向量建立模块,用于建立所述有效的告警信息文本的空间特征向量,将告警信息文本中的任意文档表征为一个二维向量;聚类处理模块,用于对所述有效的告警信息文本进行聚类分析;告警信息辨识模块,用于对新生成的告警信息文本进行智能识别,辨识新生成的告警信息文本代表的现实意义。本发明实现了对告警信号的自动核对和辨识,达到提高电网设备告警信号的辨识效率,防止信号的漏看和错误辨识的现象,保障电网安全稳定运行的目的。
Description
技术领域
本发明涉及电网调度监控的人工智能技术领域,具体涉及电网运行监控信息辨识分类系统。
背景技术
目前绝大部分110kV及以上电压等级的变电站都采用集中监控的模式进行管理,现场电力设备的异常和告警信号都通过通信设施直接传输到调控中心,以文本的形式展示给电网监控人员。
相关技术中,关于电网异常信号的监视主要采用人工监屏的方式,设正值一人、副职两人进行监屏。然而人工监屏受到外部影响因素较多,当电网正常操作和电网设备异常时都会发出大量的电气量信号、物理信号,这些异常信号的筛选和辨识会消耗监控人员大量时间,若不能及时判断故障发生情况则会影响事故处理的及时性。而一旦发生信号漏看或辨识错误的现象,则会对电网设备造成不可估量的损失。
发明内容
针对上述问题,本发明提供电网运行监控信息辨识分类系统。
本发明的目的采用以下技术方案来实现:
电网运行监控信息辨识分类系统,包括信息预处理模块、文本特征向量建立模块、聚类处理模块和告警信息辨识模块;所述信息预处理模块用于对电网运行监控信息进行预处理,将历史告警信号输入,按时段划分告警信号,每隔5秒统计一次最近5秒内发出的监控信息个数,以30s为时间跨度形成对应的监控信息文档,并排除监控信息异常的监控信息文档,最终形成有效的告警信息文本;所述文本特征向量建立模块用于建立所述有效的告警信息文本的空间特征向量,将告警信息文本中的任意文档表征为一个二维向量;所述聚类处理模块用于对所述有效的告警信息文本进行聚类分析;所述告警信息辨识模块用于对新生成的告警信息文本进行智能识别,辨识新生成的告警信息文本代表的现实意义。
其中,所述新生成的告警信息文本为由每隔10s统计一次最近30秒的电网运行监控信息组成的告警信息文本。
其中,所述聚类处理模块采用改进k-means聚类方法对所述有效的告警信息文本进行聚类分析,具体为:
1)将所述有效的告警信息文本具有n个文档,对n个文档进行向量化,通过夹角余弦函数计算所有文档两两之间的相似度,得到相似度矩阵XS;
2)对相似度矩阵XS的每一行进行求和,计算出每一个文档与整个告警信息文本的相似度,设XS=[sim(ai,aj)]n×n,i,j=1,…,n,其中sim(ai,aj)表示文档ai,aj间的相似度,求和公式为:
3)按降序排列XSp,p=1,…,n,设XSp按从大到小排列的前4个值为XSmax,XSmax-1,XSmax-2,XSmax-3,若选择与最大值XSmax相对应的文档作为第一个初始的聚簇中心,否则选择与XSmax,XSmax-1,XSmax-2,XSmax-3对应的四个文档的均值作为第一个初始的簇中心,T为设定的比例值;
4)将最大值为XSmax对应的矩阵中行向量的元素进行升序排列,假设前k-1个最小的元素为XSpq,q=1,…,k-1,选择前k-1个最小的元素XSpq相对应的文档作为剩余的k-1个初始的聚簇中心,其中所述k值的设定方法为:设定k值可能取值的区间,通过测试k的不同取值,并对区间内的各个值进行聚类,通过比较协方差,确定聚类之间的显著性差异,从而来探査聚类的类型信息,并最终确定合适的k值;
5)计算剩余文档与各初始的聚簇中心之间的相似度,将剩余文档分发到相似度最高的聚簇中,形成变化后的k个聚簇;
6)计算变化后的聚簇中各文档的均值,将其作为更新后的聚簇中心代替更新前的聚簇中心;
7)若更新前的聚簇中心与更新后的聚簇中心相同,或者目标函数达到了最小值,停止更新,此时得到的K个聚簇则基本处于正交形态,其特征向量可以代表不同的典型告警信号模板,通过查看不同聚簇中的文档人工识别该聚簇代表的告警信号的现实意义;所述目标函数为:
其中,Cl表示k个聚簇中的第l个聚簇,ax为第l个聚簇中的文档,为第l个聚簇的中心。
其中,所述设定的比例值T的取值范围为[1.45,1.55]。
本发明的有益效果为:
1、以调度监控收到的告警信号为样本,通过聚类分析的方法形成典型告警信号的特征向量,从而实现对告警信号的自动核对和辨识,达到提高电网设备告警信号的辨识效率,防止信号的漏看和错误辨识的现象,保障电网安全稳定运行的目的;
2、设置的聚类处理模块采用改进k-means聚类方法对有效的告警信息文本进行聚类分析,有效避免单一采取随机抽样方法所带来的偶然性,解决原有算法在选取k值以及初始化聚类中心时所存在的问题,提高了聚类稳定性,进一步提高了电网运行监控信息辨识的精度。
附图说明
利用附图对本发明作进一步说明,但附图中的实施例不构成对本发明的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。
图1是本发明各模块的连接示意图;
图2是本发明系统运行的流程示意图。
附图标记:
信息预处理模块1、文本特征向量建立模块2、聚类处理模块3、告警信息辨识模块4。
具体实施方式
结合以下实施例对本发明作进一步描述。
实施例1
参见图1、图2,本实施例的电网运行监控信息辨识分类系统,电网运行监控信息辨识分类系统,包括信息预处理模块1、文本特征向量建立模块2、聚类处理模块3和告警信息辨识模块4;所述信息预处理模块1用于对电网运行监控信息进行预处理,将历史告警信号输入,按时段划分告警信号,每隔5秒统计一次最近5秒内发出的监控信息个数,以30s为时间跨度形成对应的监控信息文档,并排除监控信息异常的监控信息文档,最终形成有效的告警信息文本;所述文本特征向量建立模块2用于建立所述有效的告警信息文本的空间特征向量,将告警信息文本中的任意文档表征为一个二维向量;所述聚类处理模块3用于对所述有效的告警信息文本进行聚类分析;所述告警信息辨识模块4用于对新生成的告警信息文本进行智能识别,辨识新生成的告警信息文本代表的现实意义。
其中,所述新生成的告警信息文本为由每隔10s统计一次最近30秒的电网运行监控信息组成的告警信息文本。
其中,所述聚类处理模块3采用改进k-means聚类方法对所述有效的告警信息文本进行聚类分析,具体为:
1)将所述有效的告警信息文本具有n个文档,对n个文档进行向量化,通过夹角余弦函数计算所有文档两两之间的相似度,得到相似度矩阵XS;
2)对相似度矩阵XS的每一行进行求和,计算出每一个文档与整个告警信息文本的相似度,设XS=[sim(ai,aj)]n×n,i,j=1,…,n,其中sim(ai,aj)表示文档ai,aj间的相似度,求和公式为:
3)按降序排列XSp,p=1,…,n,设XSp按从大到小排列的前4个值为XSmax,XSmax-1,XSmax-2,XSmax-3,若选择与最大值XSmax相对应的文档作为第一个初始的聚簇中心,否则选择与XSmax,XSmax-1,XSmax-2,XSmax-3对应的四个文档的均值作为第一个初始的簇中心,T为设定的比例值;
4)将最大值为XSmax对应的矩阵中行向量的元素进行升序排列,假设前k-1个最小的元素为XSpq,q=1,…,k-1,选择前k-1个最小的元素XSpq相对应的文档作为剩余的k-1个初始的聚簇中心,其中所述k值的设定方法为:设定k值可能取值的区间,通过测试k的不同取值,并对区间内的各个值进行聚类,通过比较协方差,确定聚类之间的显著性差异,从而来探査聚类的类型信息,并最终确定合适的k值;
5)计算剩余文档与各初始的聚簇中心之间的相似度,将剩余文档分发到相似度最高的聚簇中,形成变化后的k个聚簇;
6)计算变化后的聚簇中各文档的均值,将其作为更新后的聚簇中心代替更新前的聚簇中心;
7)若更新前的聚簇中心与更新后的聚簇中心相同,或者目标函数达到了最小值,停止更新,此时得到的K个聚簇则基本处于正交形态,其特征向量可以代表不同的典型告警信号模板,通过查看不同聚簇中的文档人工识别该聚簇代表的告警信号的现实意义;所述目标函数为:
其中,Cl表示k个聚簇中的第l个聚簇,ax为第l个聚簇中的文档,为第l个聚簇的中心。
其中,所述设定的比例值T的取值范围为[1.45,1.55]。
本实施例以调度监控收到的告警信号为样本,通过聚类分析的方法形成典型告警信号的特征向量,从而实现对告警信号的自动核对和辨识,达到提高电网设备告警信号的辨识效率,防止信号的漏看和错误辨识的现象,保障电网安全稳定运行的目的;设置的聚类处理模块3采用改进k-means聚类方法对有效的告警信息文本进行聚类分析,有效避免单一采取随机抽样方法所带来的偶然性,解决原有算法在选取k值以及初始化聚类中心时所存在的问题,提高了聚类稳定性,进一步提高了电网运行监控信息辨识的精度,其中比例值T=1.45,电网运行监控信息辨识的精度提高了4.5%。
实施例2
参见图1、图2,本实施例的电网运行监控信息辨识分类系统,电网运行监控信息辨识分类系统,包括信息预处理模块1、文本特征向量建立模块2、聚类处理模块3和告警信息辨识模块4;所述信息预处理模块1用于对电网运行监控信息进行预处理,将历史告警信号输入,按时段划分告警信号,每隔5秒统计一次最近5秒内发出的监控信息个数,以30s为时间跨度形成对应的监控信息文档,并排除监控信息异常的监控信息文档,最终形成有效的告警信息文本;所述文本特征向量建立模块2用于建立所述有效的告警信息文本的空间特征向量,将告警信息文本中的任意文档表征为一个二维向量;所述聚类处理模块3用于对所述有效的告警信息文本进行聚类分析;所述告警信息辨识模块4用于对新生成的告警信息文本进行智能识别,辨识新生成的告警信息文本代表的现实意义。
其中,所述新生成的告警信息文本为由每隔10s统计一次最近30秒的电网运行监控信息组成的告警信息文本。
其中,所述聚类处理模块3采用改进k-means聚类方法对所述有效的告警信息文本进行聚类分析,具体为:
1)将所述有效的告警信息文本具有n个文档,对n个文档进行向量化,通过夹角余弦函数计算所有文档两两之间的相似度,得到相似度矩阵XS;
2)对相似度矩阵XS的每一行进行求和,计算出每一个文档与整个告警信息文本的相似度,设XS=[sim(ai,aj)]n×n,i,j=1,…,n,其中sim(ai,aj)表示文档ai,aj间的相似度,求和公式为:
3)按降序排列XSp,p=1,…,n,设XSp按从大到小排列的前4个值为XSmax,XSmax-1,XSmax-2,XSmax-3,若选择与最大值XSmax相对应的文档作为第一个初始的聚簇中心,否则选择与XSmax,XSmax-1,XSmax-2,XSmax-3对应的四个文档的均值作为第一个初始的簇中心,T为设定的比例值;
4)将最大值为XSmax对应的矩阵中行向量的元素进行升序排列,假设前k-1个最小的元素为XSpq,q=1,…,k-1,选择前k-1个最小的元素XSpq相对应的文档作为剩余的k-1个初始的聚簇中心,其中所述k值的设定方法为:设定k值可能取值的区间,通过测试k的不同取值,并对区间内的各个值进行聚类,通过比较协方差,确定聚类之间的显著性差异,从而来探査聚类的类型信息,并最终确定合适的k值;
5)计算剩余文档与各初始的聚簇中心之间的相似度,将剩余文档分发到相似度最高的聚簇中,形成变化后的k个聚簇;
6)计算变化后的聚簇中各文档的均值,将其作为更新后的聚簇中心代替更新前的聚簇中心;
7)若更新前的聚簇中心与更新后的聚簇中心相同,或者目标函数达到了最小值,停止更新,此时得到的K个聚簇则基本处于正交形态,其特征向量可以代表不同的典型告警信号模板,通过查看不同聚簇中的文档人工识别该聚簇代表的告警信号的现实意义;所述目标函数为:
其中,Cl表示k个聚簇中的第l个聚簇,ax为第l个聚簇中的文档,为第l个聚簇的中心。
其中,所述设定的比例值T的取值范围为[1.45,1.55]。
本实施例以调度监控收到的告警信号为样本,通过聚类分析的方法形成典型告警信号的特征向量,从而实现对告警信号的自动核对和辨识,达到提高电网设备告警信号的辨识效率,防止信号的漏看和错误辨识的现象,保障电网安全稳定运行的目的;设置的聚类处理模块3采用改进k-means聚类方法对有效的告警信息文本进行聚类分析,有效避免单一采取随机抽样方法所带来的偶然性,解决原有算法在选取k值以及初始化聚类中心时所存在的问题,提高了聚类稳定性,进一步提高了电网运行监控信息辨识的精度,其中比例值T=1.48,电网运行监控信息辨识的精度提高了3.8%。
实施例3
参见图1、图2,本实施例的电网运行监控信息辨识分类系统,电网运行监控信息辨识分类系统,包括信息预处理模块1、文本特征向量建立模块2、聚类处理模块3和告警信息辨识模块4;所述信息预处理模块1用于对电网运行监控信息进行预处理,将历史告警信号输入,按时段划分告警信号,每隔5秒统计一次最近5秒内发出的监控信息个数,以30s为时间跨度形成对应的监控信息文档,并排除监控信息异常的监控信息文档,最终形成有效的告警信息文本;所述文本特征向量建立模块2用于建立所述有效的告警信息文本的空间特征向量,将告警信息文本中的任意文档表征为一个二维向量;所述聚类处理模块3用于对所述有效的告警信息文本进行聚类分析;所述告警信息辨识模块4用于对新生成的告警信息文本进行智能识别,辨识新生成的告警信息文本代表的现实意义。
其中,所述新生成的告警信息文本为由每隔10s统计一次最近30秒的电网运行监控信息组成的告警信息文本。
其中,所述聚类处理模块3采用改进k-means聚类方法对所述有效的告警信息文本进行聚类分析,具体为:
1)将所述有效的告警信息文本具有n个文档,对n个文档进行向量化,通过夹角余弦函数计算所有文档两两之间的相似度,得到相似度矩阵XS;
2)对相似度矩阵XS的每一行进行求和,计算出每一个文档与整个告警信息文本的相似度,设XS=[sim(ai,aj)]n×n,i,j=1,…,n,其中sim(ai,aj)表示文档ai,aj间的相似度,求和公式为:
3)按降序排列XSp,p=1,…,n,设XSp按从大到小排列的前4个值为XSmax,XSmax-1,XSmax-2,XSmax-3,若选择与最大值XSmax相对应的文档作为第一个初始的聚簇中心,否则选择与XSmax,XSmax-1,XSmax-2,XSmax-3对应的四个文档的均值作为第一个初始的簇中心,T为设定的比例值;
4)将最大值为XSmax对应的矩阵中行向量的元素进行升序排列,假设前k-1个最小的元素为XSpq,q=1,…,k-1,选择前k-1个最小的元素XSpq相对应的文档作为剩余的k-1个初始的聚簇中心,其中所述k值的设定方法为:设定k值可能取值的区间,通过测试k的不同取值,并对区间内的各个值进行聚类,通过比较协方差,确定聚类之间的显著性差异,从而来探査聚类的类型信息,并最终确定合适的k值;
5)计算剩余文档与各初始的聚簇中心之间的相似度,将剩余文档分发到相似度最高的聚簇中,形成变化后的k个聚簇;
6)计算变化后的聚簇中各文档的均值,将其作为更新后的聚簇中心代替更新前的聚簇中心;
7)若更新前的聚簇中心与更新后的聚簇中心相同,或者目标函数达到了最小值,停止更新,此时得到的K个聚簇则基本处于正交形态,其特征向量可以代表不同的典型告警信号模板,通过查看不同聚簇中的文档人工识别该聚簇代表的告警信号的现实意义;所述目标函数为:
其中,Cl表示k个聚簇中的第l个聚簇,ax为第;个聚簇中的文档,为第l个聚簇的中心。
其中,所述设定的比例值T的取值范围为[1.45,1.55]。
本实施例以调度监控收到的告警信号为样本,通过聚类分析的方法形成典型告警信号的特征向量,从而实现对告警信号的自动核对和辨识,达到提高电网设备告警信号的辨识效率,防止信号的漏看和错误辨识的现象,保障电网安全稳定运行的目的;设置的聚类处理模块3采用改进k-means聚类方法对有效的告警信息文本进行聚类分析,有效避免单一采取随机抽样方法所带来的偶然性,解决原有算法在选取k值以及初始化聚类中心时所存在的问题,提高了聚类稳定性,进一步提高了电网运行监控信息辨识的精度,其中比例值T=1.50,电网运行监控信息辨识的精度提高了5.2%。
实施例4
参见图1、图2,本实施例的电网运行监控信息辨识分类系统,电网运行监控信息辨识分类系统,包括信息预处理模块1、文本特征向量建立模块2、聚类处理模块3和告警信息辨识模块4;所述信息预处理模块1用于对电网运行监控信息进行预处理,将历史告警信号输入,按时段划分告警信号,每隔5秒统计一次最近5秒内发出的监控信息个数,以30s为时间跨度形成对应的监控信息文档,并排除监控信息异常的监控信息文档,最终形成有效的告警信息文本;所述文本特征向量建立模块2用于建立所述有效的告警信息文本的空间特征向量,将告警信息文本中的任意文档表征为一个二维向量;所述聚类处理模块3用于对所述有效的告警信息文本进行聚类分析;所述告警信息辨识模块4用于对新生成的告警信息文本进行智能识别,辨识新生成的告警信息文本代表的现实意义。
其中,所述新生成的告警信息文本为由每隔10s统计一次最近30秒的电网运行监控信息组成的告警信息文本。
其中,所述聚类处理模块3采用改进k-means聚类方法对所述有效的告警信息文本进行聚类分析,具体为:
1)将所述有效的告警信息文本具有n个文档,对n个文档进行向量化,通过夹角余弦函数计算所有文档两两之间的相似度,得到相似度矩阵XS;
2)对相似度矩阵XS的每一行进行求和,计算出每一个文档与整个告警信息文本的相似度,设XS=[sim(ai,aj)]n×n,i,j=1,…,n,其中sim(ai,aj)表示文档ai,aj间的相似度,求和公式为:
3)按降序排列XSp,p=1,…,n,设XSp按从大到小排列的前4个值为XSmax,XSmax-1,XSmax-2,XSmax-3,若选择与最大值XSmax相对应的文档作为第一个初始的聚簇中心,否则选择与XSmax,XSmax-1,XSmax-2,XSmax-3对应的四个文档的均值作为第一个初始的簇中心,T为设定的比例值;
4)将最大值为XSmax对应的矩阵中行向量的元素进行升序排列,假设前k-1个最小的元素为XSpq,q=1,…,k-1,选择前k-1个最小的元素XSpq相对应的文档作为剩余的k-1个初始的聚簇中心,其中所述k值的设定方法为:设定k值可能取值的区间,通过测试k的不同取值,并对区间内的各个值进行聚类,通过比较协方差,确定聚类之间的显著性差异,从而来探査聚类的类型信息,并最终确定合适的k值;
5)计算剩余文档与各初始的聚簇中心之间的相似度,将剩余文档分发到相似度最高的聚簇中,形成变化后的k个聚簇;
6)计算变化后的聚簇中各文档的均值,将其作为更新后的聚簇中心代替更新前的聚簇中心;
7)若更新前的聚簇中心与更新后的聚簇中心相同,或者目标函数达到了最小值,停止更新,此时得到的K个聚簇则基本处于正交形态,其特征向量可以代表不同的典型告警信号模板,通过查看不同聚簇中的文档人工识别该聚簇代表的告警信号的现实意义;所述目标函数为:
其中,Cl表示k个聚簇中的第l个聚簇,ax为第l个聚簇中的文档,为第l个聚簇的中心。
其中,所述设定的比例值T的取值范围为[1.45,1.55]。
本实施例以调度监控收到的告警信号为样本,通过聚类分析的方法形成典型告警信号的特征向量,从而实现对告警信号的自动核对和辨识,达到提高电网设备告警信号的辨识效率,防止信号的漏看和错误辨识的现象,保障电网安全稳定运行的目的;设置的聚类处理模块3采用改进k-means聚类方法对有效的告警信息文本进行聚类分析,有效避免单一采取随机抽样方法所带来的偶然性,解决原有算法在选取k值以及初始化聚类中心时所存在的问题,提高了聚类稳定性,进一步提高了电网运行监控信息辨识的精度,其中比例值T=1.52,电网运行监控信息辨识的精度提高了4.6%。
实施例5
参见图1、图2,本实施例的电网运行监控信息辨识分类系统,电网运行监控信息辨识分类系统,包括信息预处理模块1、文本特征向量建立模块2、聚类处理模块3和告警信息辨识模块4;所述信息预处理模块1用于对电网运行监控信息进行预处理,将历史告警信号输入,按时段划分告警信号,每隔5秒统计一次最近5秒内发出的监控信息个数,以30s为时间跨度形成对应的监控信息文档,并排除监控信息异常的监控信息文档,最终形成有效的告警信息文本;所述文本特征向量建立模块2用于建立所述有效的告警信息文本的空间特征向量,将告警信息文本中的任意文档表征为一个二维向量;所述聚类处理模块3用于对所述有效的告警信息文本进行聚类分析;所述告警信息辨识模块4用于对新生成的告警信息文本进行智能识别,辨识新生成的告警信息文本代表的现实意义。
其中,所述新生成的告警信息文本为由每隔10s统计一次最近30秒的电网运行监控信息组成的告警信息文本。
其中,所述聚类处理模块3采用改进k-means聚类方法对所述有效的告警信息文本进行聚类分析,具体为:
1)将所述有效的告警信息文本具有n个文档,对n个文档进行向量化,通过夹角余弦函数计算所有文档两两之间的相似度,得到相似度矩阵XS;
2)对相似度矩阵XS的每一行进行求和,计算出每一个文档与整个告警信息文本的相似度,设XS=[sim(ai,aj)]n×n,i,j=1,…,n,其中sim(ai,aj)表示文档ai,aj间的相似度,求和公式为:
3)按降序排列XSp,p=1,…,n,设XSp按从大到小排列的前4个值为XSmax,XSmax-1,XSmax-2,XSmax-3,若选择与最大值XSmax相对应的文档作为第一个初始的聚簇中心,否则选择与XSmax,XSmax-1,XSmax-2,XSmax-3对应的四个文档的均值作为第一个初始的簇中心,T为设定的比例值;
4)将最大值为XSmax对应的矩阵中行向量的元素进行升序排列,假设前k-1个最小的元素为XSpq,q=1,…,k-1,选择前k-1个最小的元素XSpq相对应的文档作为剩余的k-1个初始的聚簇中心,其中所述k值的设定方法为:设定k值可能取值的区间,通过测试k的不同取值,并对区间内的各个值进行聚类,通过比较协方差,确定聚类之间的显著性差异,从而来探査聚类的类型信息,并最终确定合适的k值;
5)计算剩余文档与各初始的聚簇中心之间的相似度,将剩余文档分发到相似度最高的聚簇中,形成变化后的k个聚簇;
6)计算变化后的聚簇中各文档的均值,将其作为更新后的聚簇中心代替更新前的聚簇中心;
7)若更新前的聚簇中心与更新后的聚簇中心相同,或者目标函数达到了最小值,停止更新,此时得到的K个聚簇则基本处于正交形态,其特征向量可以代表不同的典型告警信号模板,通过查看不同聚簇中的文档人工识别该聚簇代表的告警信号的现实意义;所述目标函数为:
其中,Cl表示k个聚簇中的第l个聚簇,ax为第l个聚簇中的文档,为第l个聚簇的中心。
其中,所述设定的比例值T的取值范围为[1.45,1.55]。
本实施例以调度监控收到的告警信号为样本,通过聚类分析的方法形成典型告警信号的特征向量,从而实现对告警信号的自动核对和辨识,达到提高电网设备告警信号的辨识效率,防止信号的漏看和错误辨识的现象,保障电网安全稳定运行的目的;设置的聚类处理模块3采用改进k-means聚类方法对有效的告警信息文本进行聚类分析,有效避免单一采取随机抽样方法所带来的偶然性,解决原有算法在选取k值以及初始化聚类中心时所存在的问题,提高了聚类稳定性,进一步提高了电网运行监控信息辨识的精度,其中比例值T=1.55,电网运行监控信息辨识的精度提高了4%。
最后应当说明的是,以上实施例仅用以说明本发明的技术方案,而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细地说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。
Claims (4)
1.电网运行监控信息辨识分类系统,其特征在于,包括信息预处理模块、文本特征向量建立模块、聚类处理模块和告警信息辨识模块;所述信息预处理模块用于对电网运行监控信息进行预处理,将历史告警信号输入,按时段划分告警信号,每隔5秒统计一次最近5秒内发出的监控信息个数,以30s为时间跨度形成对应的监控信息文档,并排除监控信息异常的监控信息文档,最终形成有效的告警信息文本;所述文本特征向量建立模块用于建立所述有效的告警信息文本的空间特征向量,将告警信息文本中的任意文档表征为一个二维向量;所述聚类处理模块用于对所述有效的告警信息文本进行聚类分析;所述告警信息辨识模块用于对新生成的告警信息文本进行智能识别,辨识新生成的告警信息文本代表的现实意义。
2.根据权利要求1所述的电网运行监控信息辨识分类系统,其特征在于,所述新生成的告警信息文本为由每隔10s统计一次最近30秒的电网运行监控信息组成的告警信息文本。
3.根据权利要求1所述的电网运行监控信息辨识分类系统,其特征在于,所述聚类处理模块采用改进k-means聚类方法对所述有效的告警信息文本进行聚类分析,具体为:
1)将所述有效的告警信息文本具有n个文档,对n个文档进行向量化,通过夹角余弦函数计算所有文档两两之间的相似度,得到相似度矩阵XS;
2)对相似度矩阵XS的每一行进行求和,计算出每一个文档与整个告警信息文本的相似度,设XS=[sim(ai,aj)]n×n,i,j=1,…,n,其中sim(ai,aj)表示文档ai,aj间的相似度,求和公式为:
3)按降序排列XSp,p=1,…,n,设XSp按从大到小排列的前4个值为XSmax,XSmax-1,XSmax-2,XSmax-3,若选择与最大值XSmax相对应的文档作为第一个初始的聚簇中心,否则选择与XSmax,XSmax-1,XSmax-2,XSmax-3对应的四个文档的均值作为第一个初始的簇中心,T为设定的比例值;
4)将最大值为XSmax对应的矩阵中行向量的元素进行升序排列,假设前k-1个最小的元素为XSpq,q=1,…,k-1,选择前k-1个最小的元素XSpq相对应的文档作为剩余的k-1个初始的聚簇中心,其中所述k值的设定方法为:设定k值可能取值的区间,通过测试k的不同取值,并对区间内的各个值进行聚类,通过比较协方差,确定聚类之间的显著性差异,从而来探査聚类的类型信息,并最终确定合适的k值;
5)计算剩余文档与各初始的聚簇中心之间的相似度,将剩余文档分发到相似度最高的聚簇中,形成变化后的k个聚簇;
6)计算变化后的聚簇中各文档的均值,将其作为更新后的聚簇中心代替更新前的聚簇中心;
7)若更新前的聚簇中心与更新后的聚簇中心相同,或者目标函数达到了最小值,停止更新,此时得到的K个聚簇则基本处于正交形态,其特征向量可以代表不同的典型告警信号模板,通过查看不同聚簇中的文档人工识别该聚簇代表的告警信号的现实意义;所述目标函数为:
其中,Cl表示k个聚簇中的第l个聚簇,ax为第l个聚簇中的文档,为第l个聚簇的中心。
4.根据权利要求3述的电网运行监控信息辨识分类系统,其特征在于,所述设定的比例值T的取值范围为[1.45,1.55]。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610538554.6A CN106228280A (zh) | 2016-07-06 | 2016-07-06 | 电网运行监控信息辨识分类系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610538554.6A CN106228280A (zh) | 2016-07-06 | 2016-07-06 | 电网运行监控信息辨识分类系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106228280A true CN106228280A (zh) | 2016-12-14 |
Family
ID=57518940
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610538554.6A Withdrawn CN106228280A (zh) | 2016-07-06 | 2016-07-06 | 电网运行监控信息辨识分类系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106228280A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107315777A (zh) * | 2017-05-31 | 2017-11-03 | 国家电网公司 | 一种基于k最近邻算法的电网监控信号的分类压缩方法 |
CN108399221A (zh) * | 2018-02-11 | 2018-08-14 | 山东建筑大学 | 基于大数据关联分析的室内电气设备分类识别方法与系统 |
CN109977228A (zh) * | 2019-03-21 | 2019-07-05 | 浙江大学 | 电网设备缺陷文本的信息辨识方法 |
CN110321555A (zh) * | 2019-06-11 | 2019-10-11 | 国网江苏省电力有限公司南京供电分公司 | 一种基于循环神经网络模型的电网信号分类方法 |
CN113553358A (zh) * | 2021-07-27 | 2021-10-26 | 国网天津市电力公司电力科学研究院 | 一种基于数据挖掘的电网设备无效数据辨识方法及装置 |
-
2016
- 2016-07-06 CN CN201610538554.6A patent/CN106228280A/zh not_active Withdrawn
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107315777A (zh) * | 2017-05-31 | 2017-11-03 | 国家电网公司 | 一种基于k最近邻算法的电网监控信号的分类压缩方法 |
CN108399221A (zh) * | 2018-02-11 | 2018-08-14 | 山东建筑大学 | 基于大数据关联分析的室内电气设备分类识别方法与系统 |
CN108399221B (zh) * | 2018-02-11 | 2021-07-30 | 山东建筑大学 | 基于大数据关联分析的室内电气设备分类识别方法与系统 |
CN109977228A (zh) * | 2019-03-21 | 2019-07-05 | 浙江大学 | 电网设备缺陷文本的信息辨识方法 |
CN110321555A (zh) * | 2019-06-11 | 2019-10-11 | 国网江苏省电力有限公司南京供电分公司 | 一种基于循环神经网络模型的电网信号分类方法 |
CN113553358A (zh) * | 2021-07-27 | 2021-10-26 | 国网天津市电力公司电力科学研究院 | 一种基于数据挖掘的电网设备无效数据辨识方法及装置 |
CN113553358B (zh) * | 2021-07-27 | 2022-12-06 | 国网天津市电力公司电力科学研究院 | 一种基于数据挖掘的电网设备无效数据辨识方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106228280A (zh) | 电网运行监控信息辨识分类系统 | |
CN106909487B (zh) | 应用于信息系统的预警方法及装置 | |
CN104363106B (zh) | 一种基于大数据技术的电力信息通信故障预警分析方法 | |
JP2020017952A (ja) | 警告するための方法と装置 | |
CN110084158B (zh) | 一种基于智能算法的用电设备识别方法 | |
CN106950945B (zh) | 一种基于量纲可变型独立元分析模型的故障检测方法 | |
CN110381126A (zh) | 基于边缘计算的用电设备识别方法、系统、设备及介质 | |
CN106656669B (zh) | 一种基于阈值自适应设置的设备参数异常检测系统及方法 | |
CN111080105A (zh) | 基于电压时序数据的台区户变关系识别方法及系统 | |
CN104993974B (zh) | 一种识别设备工作状态的检测方法以及上位机 | |
CN106998265A (zh) | 一种监控方法及其装置 | |
CN116125361B (zh) | 电压互感器误差评估方法、系统、电子设备及存储介质 | |
CN110413703B (zh) | 基于人工智能的监控指标数据的分类方法及相关设备 | |
Prajapati et al. | Control charts for monitoring the autocorrelated process parameters: a literature review | |
CN105871581A (zh) | 云计算中报警信息的处理方法及装置 | |
CN105577402A (zh) | 基于历史数据的业务异常监控方法及设备 | |
CN116980958B (zh) | 一种基于数据识别的无线设备电故障监测方法及系统 | |
CN113344133A (zh) | 一种时序行为异常波动检测方法及系统 | |
CN105243499A (zh) | 订单分配方法及系统 | |
CN112421770A (zh) | 一种配电自动化系统的自动辅助巡检方法及系统 | |
CN105891625B (zh) | 基于能量流的电力系统次同步振荡扰动源辨别方法 | |
CN110677290A (zh) | 基于退火算法及神经网络模型的电力通信运维风险预警方法 | |
CN112508316B (zh) | 实时异常检测系统中的自适应异常判定方法和装置 | |
CN106096060A (zh) | 海洋网络安全风险防御系统 | |
CN117193088B (zh) | 一种工业设备监控方法、装置以及服务器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C04 | Withdrawal of patent application after publication (patent law 2001) | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20161214 |