CN112269779A - 一种用于电力设备缺陷的大数据分析系统和方法 - Google Patents
一种用于电力设备缺陷的大数据分析系统和方法 Download PDFInfo
- Publication number
- CN112269779A CN112269779A CN202011188480.0A CN202011188480A CN112269779A CN 112269779 A CN112269779 A CN 112269779A CN 202011188480 A CN202011188480 A CN 202011188480A CN 112269779 A CN112269779 A CN 112269779A
- Authority
- CN
- China
- Prior art keywords
- defect
- data
- equipment
- big data
- time sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000007547 defect Effects 0.000 title claims abstract description 227
- 238000007405 data analysis Methods 0.000 title claims abstract description 19
- 238000000034 method Methods 0.000 title claims abstract description 18
- 238000004458 analytical method Methods 0.000 claims abstract description 38
- 238000012545 processing Methods 0.000 claims abstract description 25
- 238000013499 data model Methods 0.000 claims abstract description 12
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 8
- 238000010801 machine learning Methods 0.000 claims abstract description 5
- 238000005516 engineering process Methods 0.000 claims description 26
- 238000013075 data extraction Methods 0.000 claims description 15
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000007418 data mining Methods 0.000 claims description 5
- 230000007774 longterm Effects 0.000 claims description 5
- 230000001932 seasonal effect Effects 0.000 claims description 5
- 238000000354 decomposition reaction Methods 0.000 claims description 4
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 claims description 4
- 230000000007 visual effect Effects 0.000 claims description 4
- 238000007689 inspection Methods 0.000 claims description 3
- 230000010354 integration Effects 0.000 claims description 3
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000004140 cleaning Methods 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000012300 Sequence Analysis Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000005553 drilling Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000013112 stability test Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009469 supplementation Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2471—Distributed queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2474—Sequence data queries, e.g. querying versioned data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Probability & Statistics with Applications (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Quality & Reliability (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本发明涉及一种用于电力设备缺陷的大数据分析系统,包括三层架构:缺陷大数据处理层:用于对设备缺陷大数据进行整合和数据处理;缺陷大数据模型层:内置缺陷大数据机器学习算法,用于对缺陷业务数据进行时序模型分析、主要设备缺陷状态分析和缺陷信息画像分析;缺陷大数据应用层:用于对设备缺陷业务数据进行可视化展示。与现有技术相比,本发明具有准确性高且效率高的等优点。
Description
技术领域
本发明涉及电力大数据技术和设备缺陷应用领域,尤其是涉及一种用于电力设备缺陷的大数据分析系统和方法。
背景技术
安全是企业发展的最基本前提,电网安全更关系到社会经济的稳定发展。电网安全中输变电设备的安全是电网安全、可靠、稳定运行的基础,对电网有着重大意义。电力设备缺陷分析是电力设备管理的一个重要组成部分,电力设备存在缺陷的多少,直接反映出电力设备健康程度,对设备的运行状态进行准确的评估、诊断和预测,有助于提升电网设备智能化水平,同时能够提高供电可靠性,从根本上提高电力设备的运行维护水平,为变电站安全运行服务。
智能电网中存在的海量数据中隐含着高价值的信息,依靠传统的数据库查询检索机制提取这些信息的价值是十分困难的,准确性低的同时,效率也很低下,迫切需要自动、智能地将待处理的数据转化为有价值的信息,对输变电安全、可靠、稳定运行的智能水平提出了更高的要求,而大数据技术正可以为此提供技术支撑和实现手段。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种准确性高且效率高的用于电力设备缺陷的大数据分析系统和方法。
本发明的目的可以通过以下技术方案来实现:
一种用于电力设备缺陷的大数据分析系统,包括三层架构:
缺陷大数据处理层:用于对设备缺陷大数据进行整合和数据处理;
缺陷大数据模型层:内置缺陷大数据机器学习算法,用于对缺陷业务数据进行时序模型分析、主要设备缺陷状态分析和缺陷信息画像分析;
缺陷大数据应用层:用于对设备缺陷业务数据进行可视化展示。
进一步地,所述的缺陷大数据处理层利用开源大数据技术,对异构数据源数据进行数据抽取和数据处理,并进行数据整合,分别生成供缺陷大数据模型层和缺陷大数据应用层使用的缺陷业务数据。
更进一步地,所述的开源大数据技术包括开源数据抽取技术和开源大数据离线批处理技术。所述开源数据抽取技术包括使用DataX组件,编写数据抽取脚本,进行相关数据抽取工作。所述开源大数据离线批处理技术,包括使用Spark技术对抽取的数据进行数据清洗及数据插值。
更进一步地,所述的缺陷大数据处理层采用T+1方案进行数据抽取,并实现数据同步。
进一步地,所述的缺陷业务数据包括设备台账数据、设备缺陷记录数据和设备缺陷明细数据。所述的设备台账数据包括设备编码、设备名称、生产厂家等设备基础信息,以及设备资产单位名称、设备主人名称等设备运维单位信息,所述的设备缺陷记录数据包括缺陷主设备编号、发现人相关信息、消缺人相关信息、验收人相关信息及登记人相关信息,所述的设备缺陷明细数据包括缺陷具体部件信息以及缺陷原因分类、原因定义相关信息和缺陷内容、责任原因、技术原因等信息。
进一步地,所述的缺陷大数据模型层对缺陷业务数据进行时序模型分析、主要设备缺陷状态分析和缺陷信息画像分析具体包括:
结合设备缺陷记录数据和设备缺陷明细数据,进行缺陷时序模型分析,获取设备缺陷时序信息的预测结果;
结合设备缺陷记录数据、设备缺陷明细数据和设备台账数据,进行主要设备缺陷状态分析,获取主要设备缺陷类型的占比;
结合设备缺陷记录数据、设备缺陷明细数据和设备台账数据,进行缺陷信息画像分析,获取设备缺陷信息的关键词结果集。
更进一步地,所述的主要设备包括主变压器和断路器。
进一步地,所述的缺陷大数据应用层通过开源BI工具实现拖拽式数据挖掘,进行可视化展示。
一种用于所述的电力设备缺陷大数据分析系统的时序模型分析方法,包括以下步骤:
S11:获取设备缺陷时序信息数据,所述的设备缺陷时序信息数据包括缺陷记录数据和设备缺陷明细数据;
S12:对缺陷时序信息进行平稳性检验,并获取自相关系数;
S13:对缺陷时序信息进行模型分解,将缺陷时序信息分解为长期趋势、季节趋势和随机成分;
S14:依据BIC准则进行模型参数调整;
S15:对设备缺陷时序信息数据使用ARIMA模型进行时序信息预测并将预测结果信息保存。
一种用于所述的电力设备缺陷大数据分析系统的缺陷信息画像分析方法,包括以下步骤:
S21:获取设备缺陷业务数据并构建设备缺陷信息词典,所述的缺陷业务数据包括设备台账数据、设备缺陷记录数据和设备缺陷明细数据;
S22:创建中文停用词词典;
S23:计算设备缺陷信息词典中各词的词频并转换为词频矩阵;
S24:计算词权重并进行关键词提取;
S25:将关键词结果集保存。
与现有技术相比,本发明具有以下优点:
1)本发明的系统包括缺陷大数据处理层、缺陷大数据模型层和缺陷大数据应用层,技术架构统一,通过时间序列算法、分词算法和前端可拖拽式数据挖掘,能够满足大数据情况下的业务场景准确解析,提高电力设备缺陷大数据分析的准确性和可靠性,提高电网电力安全性;
2)本发明中缺陷大数据处理层,利用了电力缺陷大数据技术,结合开源大数据处理技术完成了从海量数据到简单业务模型的快速转换,从复杂繁琐的业务逻辑转变为简单抽象的电力缺陷业务数据模型,实现了动态高效地业务数据查询,为缺陷大数据模型层和缺陷大数据应用层服务提供了敏捷快速的业务数据服务接口,提高电力设备数据分析效率;
3)本发明中的缺陷大数据应用层,提供了可拖拽式的软件客户端,可通过PC、大屏等各类终端设备,实现人机交互,智能化程度高,方便针对各项业务开展数据分析汇报。
附图说明
图1为本发明的系统架构图;
图2为本发明方法中关于缺陷时间序列模型解析的流程示意图;
图3为本发明方法中关于缺陷设备信息画像解析的流程示意图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
实施例
本发明一种电力设备缺陷的大数据分析系统及方法可以有效处理电网生产建设中产生的大量输变电缺陷数据,并深度挖掘这些数据的潜在价值,助推电力行业对缺陷管控方向的变革。
如图1所示,为本发明一种电力设备缺陷的大数据分析系统的系统架构图,采用三层架构技术方案:
底层是缺陷大数据处理层:用于对设备缺陷大数据进行整合和数据处理,结合开源大数据的数据抽取技术与存储技术,优化了缺陷数据同步解析速度,提高了入口效率和更新频率;
缺陷大数据处理层利用开源大数据技术,包括开源数据抽取技术和开源大数据离线批处理技术,开源数据抽取技术包括使用DataX组件,编写数据抽取脚本,进行相关数据抽取工作。开源大数据离线批处理技术,包括使用Spark技术对抽取的数据进行数据清洗及数据插值,对异构数据源数据进行数据抽取和数据处理,并进行数据整合,分别生成供缺陷大数据模型层和缺陷大数据应用层使用的缺陷业务数据,其中,数据抽取采用T+1方案进行数据抽取,并实现数据同步,缺陷业务数据包括设备台账数据、设备缺陷记录数据和设备缺陷明细数据。
其中,设备台账数据包括设备编码、设备名称、生产厂家等设备基础信息,设备资产单位名称、设备主人名称等设备运维单位信息,设备缺陷记录数据包括缺陷主设备编号,发现人相关信息,消缺人相关信息,验收人相关信息及登记人相关信息,设备缺陷明细数据包括缺陷具体部件信息,缺陷原因分类、原因定义相关信息,缺陷内容、责任原因、技术原因等信息。
电力缺陷大数据主要来源于PMS系统中的缺陷记录数据与设备台账数据等。但是PMS系统采集到的缺陷数据往往是不完整、有噪声和不一致的。因此需要首先通过对数据中数据为空值、缺陷性质为危急严重以及时间字段不在查询范围内的数据,进行插值补充数据等操作,然后通过对数据清洗后的设备缺陷数据进行离线计算,生成设备缺陷时间序列表、设备缺陷信息画像表和设备缺陷BI分析表等以满足后续场景的应用。
中间是缺陷大数据模型层:内置缺陷大数据机器学习算法,用于对缺陷业务数据进行时序模型分析、主要设备缺陷状态分析和缺陷信息画像分析,利用机器学习技术,结合底层缺陷基础数据,进行设备缺陷时间序列分析、设备缺陷信息画像分析、设备缺陷信息关联下钻等,使业务分析更加多元化,能够满足不同的业务分析需求;
其中,对缺陷业务数据进行时序模型分析、主要设备缺陷状态分析和缺陷信息画像分析具体为:
结合设备缺陷记录数据和设备缺陷明细数据,进行缺陷时序模型分析,获取设备缺陷时序信息的预测结果;
结合设备缺陷记录数据、设备缺陷明细数据和设备台账数据,进行主要设备缺陷状态分析,获取主要设备缺陷类型的占比,主要设备包括主变压器和断路器;
结合设备缺陷记录数据、设备缺陷明细数据和设备台账数据,进行缺陷信息画像分析,获取设备缺陷信息的关键词结果集。
设备缺陷时间序列分析主要是对于设备时间序列表中的数据,采用时间序列算法对模型进行训练,以获取设备缺陷在近几年的大趋势、各个季节的季节性趋势以及未来几个月的预测趋势;设备缺陷信息画像分析主要是对于设备缺陷信息画像数据,采用Jieba词库进行分词,并使用TF-IDF算法对主变压器和断路器等主要设备进行关键词提取。
顶层是缺陷大数据应用层:用于对设备缺陷业务数据进行可视化展示,该层使用一种开源BI工具实现拖拽式数据挖掘技术构建应用,通过前端拖拽式数据挖掘,快速构建各类缺陷指标场景应用,并且支持通过前端页面拖拽减少开发工作量,实现快速开发,基于开源可视化组件库和设计器METABASE,实现可以配置化的可视化业务分析场景。
如图2所示,本发明还提供用于电力设备缺陷大数据分析的系统的时序模型分析方法,包括以下步骤:
S11:获取设备缺陷时序信息数据,包括设备缺陷记录数据和设备缺陷明细数据;
设备缺陷时序信息数据,为目标对象影响因子的历史数据,即为对目标对象的数值具有影响作用的各类因素在过去一段时间内若干时间节点的数值序列。在本实施例中,目标对象为某类型设备的缺陷数量。
S12:对设备缺陷时序信息数据进行平稳性检验,并获取自相关系数;
平稳性检验具体为:将步骤S11中数据显示为时序图,并分析其年周期成分和长期趋势成分,检测其是否为平稳序列;
备缺陷时序信息数据序列具有快速衰减的特点,说明该序列为非纯随机序列,因此自相关系数是该序列蕴含的相关信息,说明序列的历史信息对未来有影响,具有研究价值。
S13:对缺陷时序信息进行模型分解,
具体地,将步骤S11中的原始时序数据分离成不同的成分。使用statsmodels模块的X-11分解过程,它主要将时序数据通过seasonal_decompose的加法模型分解成长期趋势、季节趋势和随机成分,即时序数据=长期趋势+季节趋势+随机成分。
S14:对时序模型依据BIC准则进行参数调整;
依据BIC准则识别模型的p、q值,通常认为BIC值越小的模型相对更优。BIC准则综合考虑了残差大小和自变量的个数,残差越小BIC值越小,自变量个数越多BIC值越大。
S15:对缺陷时序信息数据使用ARIMA模型进行时序信息预测并将预测结果信息保存至数据库。
对步骤S13中分解出来的趋势部分单独用ARIMA模型做训练,预测出趋势数据后,加上周期数据即作为最终的预测结果。
如图3所示,本发明还提供一种用于电力设备缺陷大数据分析的系统的缺陷信息画像分析方法,包括以下步骤:
S21:输入设备缺陷数据并构建设备缺陷信息词典;
设备缺陷数据包括设备台账数据、设备缺陷记录数据和设备缺陷明细数据,为从缺陷大数据处理层获取的设备缺陷业务数据。缺陷信息词典,是通过现有的电力行业词汇以及缺陷数据和全业务链路过程中的问题数据寻找行业专用词,并添加到词典中形成的。
S22:创建中文停用词词典;
中文停用词词典内存放需要去除的停用词,包括虚拟词、语气助词、副词、符号、一个字的词等。
S23:计算缺陷数据词频并转换为词频矩阵;
数据词频矩阵,为缺陷数据词频基于矩阵的分布表示,通常又称为语义分布模型PU,该方法的主要思想是构建一个共现矩阵,矩阵的每行对应一个单词,每列表示一种上下文(通常是一篇文章),而每个元素的值为对应单词与上下文在语料库中的共现次数。因此,每个单词可由矩阵中对应的行向量表示,而任意两个单词的相似性可直接由它们向量的相似性衡量。
S24:计算关键词权重并进行关键词提取;
关键词权重为逆文本频率(Inverse Document Frequency,IDF),其表示关键词的主题预测能力(权重),表示为其中D为全部文档数,DF(ω)为包含关键词ω的文档数量,利用IDF的思想,文档与查询的相关性计算为以IDF为权重,对M个关键词ω1~ωM的词频TF(ω1)~TF(ωM)的加权求和:TF(ω1)·IDF(ω1)+TF(ω2)·IDF(ω2)+…+TF(ωM)·IDF(ωM)。
S25:将关键词结果集保存至数据库。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的工作人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种用于电力设备缺陷的大数据分析系统,其特征在于,包括三层架构:
缺陷大数据处理层:用于对设备缺陷大数据进行整合和数据处理;
缺陷大数据模型层:内置缺陷大数据机器学习算法,用于对缺陷业务数据进行时序模型分析、主要设备缺陷状态分析和缺陷信息画像分析;
缺陷大数据应用层:用于对设备缺陷业务数据进行可视化展示。
2.根据权利要求1所述的一种用于电力设备缺陷的大数据分析系统,其特征在于,所述的缺陷大数据处理层利用开源大数据技术,对异构数据源数据进行数据抽取和数据处理,并进行数据整合,分别生成供缺陷大数据模型层和缺陷大数据应用层使用的缺陷业务数据。
3.根据权利要求2所述的一种用于电力设备缺陷的大数据分析系统,其特征在于,所述的开源大数据技术包括开源数据抽取技术和开源大数据离线批处理技术。
4.根据权利要求3所述的一种用于电力设备缺陷的大数据分析系统,其特征在于,所述的缺陷大数据处理层采用T+1方案进行数据抽取,并实现数据同步。
5.根据权利要求1或2所述的一种用于电力设备缺陷的大数据分析系统,其特征在于,所述的缺陷业务数据包括设备台账数据、设备缺陷记录数据和设备缺陷明细数据。
6.根据权利要求5所述的一种用于电力设备缺陷的大数据分析系统,其特征在于,所述的缺陷大数据模型层对缺陷业务数据进行时序模型分析、主要设备缺陷状态分析和缺陷信息画像分析具体包括:
结合设备缺陷记录数据和设备缺陷明细数据,进行缺陷时序模型分析,获取设备缺陷时序信息的预测结果;
结合设备缺陷记录数据、设备缺陷明细数据和设备台账数据,进行主要设备缺陷状态分析,获取主要设备缺陷类型的占比;
结合设备缺陷记录数据、设备缺陷明细数据和设备台账数据,进行缺陷信息画像分析,获取设备缺陷信息的关键词结果集。
7.根据权利要求6所述的一种用于电力设备缺陷的大数据分析系统,其特征在于所述的主要设备包括主变压器和断路器。
8.根据权利要求1所述的一种用于电力设备缺陷的大数据分析系统,其特征在于,所述的缺陷大数据应用层通过开源BI工具实现拖拽式数据挖掘,进行可视化展示。
9.一种用于如权利要求1所述的用于电力设备缺陷大数据分析系统的时序模型分析方法,其特征在于,包括以下步骤:
S11:获取设备缺陷时序信息数据,所述的设备缺陷时序信息数据包括缺陷记录数据和设备缺陷明细数据;
S12:对缺陷时序信息进行平稳性检验,并获取自相关系数;
S13:对缺陷时序信息进行模型分解,将缺陷时序信息分解为长期趋势、季节趋势和随机成分;
S14:依据BIC准则进行模型参数调整;
S15:对设备缺陷时序信息数据使用ARIMA模型进行时序信息预测并将预测结果信息保存。
10.一种用于如权利要求1所述的用于电力设备缺陷大数据分析系统的缺陷信息画像分析方法,其特征在于,包括以下步骤:
S21:获取设备缺陷业务数据并构建设备缺陷信息词典,所述的缺陷业务数据包括设备台账数据、设备缺陷记录数据和设备缺陷明细数据;
S22:创建中文停用词词典;
S23:计算设备缺陷信息词典中各词的词频并转换为词频矩阵;
S24:计算词权重并进行关键词提取;
S25:将关键词结果集保存。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011188480.0A CN112269779A (zh) | 2020-10-30 | 2020-10-30 | 一种用于电力设备缺陷的大数据分析系统和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011188480.0A CN112269779A (zh) | 2020-10-30 | 2020-10-30 | 一种用于电力设备缺陷的大数据分析系统和方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112269779A true CN112269779A (zh) | 2021-01-26 |
Family
ID=74344442
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011188480.0A Pending CN112269779A (zh) | 2020-10-30 | 2020-10-30 | 一种用于电力设备缺陷的大数据分析系统和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112269779A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113656390A (zh) * | 2021-08-13 | 2021-11-16 | 国网辽宁省电力有限公司信息通信分公司 | 一种基于缺陷设备的电力设备缺陷标签画像方法 |
WO2023020194A1 (zh) * | 2021-08-19 | 2023-02-23 | 天津市普迅电力信息技术有限公司 | 一种基于随机森林和支持向量机的能源数据异常原因分析方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105093033A (zh) * | 2015-09-01 | 2015-11-25 | 华中电网有限公司 | 一种基于电网多源信息的故障综合分析系统及分析方法 |
CN106651188A (zh) * | 2016-12-27 | 2017-05-10 | 贵州电网有限责任公司贵阳供电局 | 一种输变电设备多源状态评估数据处理方法及其应用 |
CN107506863A (zh) * | 2017-08-25 | 2017-12-22 | 国家电网公司 | 一种基于大数据电网实物资产运维检修费用预测方法 |
CN107730079A (zh) * | 2017-09-15 | 2018-02-23 | 广西电网有限责任公司电力科学研究院 | 一种基于数据挖掘的输变电设备缺陷画像方法 |
CN107832781A (zh) * | 2017-10-18 | 2018-03-23 | 扬州大学 | 一种面向多源数据的软件缺陷表示学习方法 |
CN108564254A (zh) * | 2018-03-15 | 2018-09-21 | 国网四川省电力公司绵阳供电公司 | 基于大数据的配电设备状态可视化平台 |
CN108664538A (zh) * | 2017-11-30 | 2018-10-16 | 全球能源互联网研究院有限公司 | 一种输变电设备疑似家族性缺陷的自动辨识方法及系统 |
-
2020
- 2020-10-30 CN CN202011188480.0A patent/CN112269779A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105093033A (zh) * | 2015-09-01 | 2015-11-25 | 华中电网有限公司 | 一种基于电网多源信息的故障综合分析系统及分析方法 |
CN106651188A (zh) * | 2016-12-27 | 2017-05-10 | 贵州电网有限责任公司贵阳供电局 | 一种输变电设备多源状态评估数据处理方法及其应用 |
CN107506863A (zh) * | 2017-08-25 | 2017-12-22 | 国家电网公司 | 一种基于大数据电网实物资产运维检修费用预测方法 |
CN107730079A (zh) * | 2017-09-15 | 2018-02-23 | 广西电网有限责任公司电力科学研究院 | 一种基于数据挖掘的输变电设备缺陷画像方法 |
CN107832781A (zh) * | 2017-10-18 | 2018-03-23 | 扬州大学 | 一种面向多源数据的软件缺陷表示学习方法 |
CN108664538A (zh) * | 2017-11-30 | 2018-10-16 | 全球能源互联网研究院有限公司 | 一种输变电设备疑似家族性缺陷的自动辨识方法及系统 |
CN108564254A (zh) * | 2018-03-15 | 2018-09-21 | 国网四川省电力公司绵阳供电公司 | 基于大数据的配电设备状态可视化平台 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113656390A (zh) * | 2021-08-13 | 2021-11-16 | 国网辽宁省电力有限公司信息通信分公司 | 一种基于缺陷设备的电力设备缺陷标签画像方法 |
WO2023020194A1 (zh) * | 2021-08-19 | 2023-02-23 | 天津市普迅电力信息技术有限公司 | 一种基于随机森林和支持向量机的能源数据异常原因分析方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110633330B (zh) | 事件发现方法、装置、设备及存储介质 | |
Sleiman et al. | A survey on region extractors from web documents | |
US11907659B2 (en) | Item recall method and system, electronic device and readable storage medium | |
CN104392006B (zh) | 一种事件查询处理方法及装置 | |
CN109753502B (zh) | 一种基于NiFi的数据采集方法 | |
CN106708929B (zh) | 视频节目的搜索方法和装置 | |
CN113836131B (zh) | 一种大数据清洗方法、装置、计算机设备及存储介质 | |
CN103186541A (zh) | 一种映射关系生成方法及装置 | |
US20080177702A1 (en) | Retrieving case-based reasoning information from archive records | |
CN112269779A (zh) | 一种用于电力设备缺陷的大数据分析系统和方法 | |
CN103869999A (zh) | 对输入法所产生的候选项进行排序的方法及装置 | |
CN113886708A (zh) | 基于用户信息的产品推荐方法、装置、设备及存储介质 | |
CN106372083A (zh) | 一种有争议性新闻线索自动发现的方法及系统 | |
Tan et al. | Constructing and Interpreting Causal Knowledge Graphs from News | |
CN104240107A (zh) | 社群数据筛选系统及其方法 | |
CN116596412A (zh) | 人才类型画像的实现方法及系统 | |
CN114691835A (zh) | 基于文本挖掘的审计计划数据生成方法、装置和设备 | |
CN113032653A (zh) | 一种基于大数据的舆情监测平台 | |
Hu et al. | A classification model of power operation inspection defect texts based on graph convolutional network | |
CN110929085B (zh) | 基于元语义分解的电力客服留言生成模型样本处理系统及方法 | |
CN114491232A (zh) | 信息查询方法、装置、电子设备和存储介质 | |
CN113505117A (zh) | 基于数据指标的数据质量评估方法、装置、设备及介质 | |
CN114325384A (zh) | 一种基于电机故障知识的众包采集系统及方法 | |
US11726972B2 (en) | Directed data indexing based on conceptual relevance | |
CN114547231A (zh) | 一种数据溯源的方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |