CN110941620A - 基于深度学习的电力系统数据库表空间预测方法 - Google Patents
基于深度学习的电力系统数据库表空间预测方法 Download PDFInfo
- Publication number
- CN110941620A CN110941620A CN201911234707.8A CN201911234707A CN110941620A CN 110941620 A CN110941620 A CN 110941620A CN 201911234707 A CN201911234707 A CN 201911234707A CN 110941620 A CN110941620 A CN 110941620A
- Authority
- CN
- China
- Prior art keywords
- database table
- data
- power system
- data set
- table space
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 25
- 238000013135 deep learning Methods 0.000 title claims abstract description 18
- 238000012549 training Methods 0.000 claims abstract description 8
- 230000011218 segmentation Effects 0.000 claims abstract description 7
- 238000012545 processing Methods 0.000 claims abstract description 6
- 238000007637 random forest analysis Methods 0.000 claims description 4
- 238000012544 monitoring process Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2477—Temporal data queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Public Health (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本发明公开了一种基于深度学习的电力系统数据库表空间预测方法,包括获取原始历史数据并处理;对处理后的数据进行数据集分割和合并得到基础数据集;选取基础数据集的特征作为目标特征;选定时间窗口;采用数据集对选定的模型进行训练和修正从而得到数据库表空间预测模型;采用数据库表空间预测模型对电力系统的实际数据库表进行表空间的预测从而得到预测结果。本发明方法能够预测电力系统的数据库表空间的使用情况,而且能够根据预测结果进行数据库表空间的扩展,而且本发明方法可靠性高、准确率高且实施简单方便。
Description
技术领域
本发明属于电气自动化领域,具体涉及一种基于深度学习的电力系统数据库表空间预测方法。
背景技术
随着经济技术的发展和人们生活水平的提高,电能已经成为了人们生产和生活中必不可少的二次能源,给人们的生产和生活带来了无尽的便利。
Zabbix是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。zabbix能监视各种网络参数,保证服务器系统的安全运营;并提供灵活的通知机制以让系统管理员快速定位/解决存在的各种问题。通过Zabbix监控数据库表空间大小,一旦表空间不足,Zabbix会及时给出告警信息。
目前,电网系统中一般采用Zabbix监控数据库表空间大小;一旦表空间不足,Zabbix会及时给出告警信息。出现告警信息后,电力系统的数据库表空间容量是采用人为扩展方式来扩展。通过日常运维的工作统计,如果可能在非工作时间需要人为介入并进行数据库表空间的扩展,则会安排工作人员在非工作时间值班,并适时进行数据库表空间的扩展。
但是,明显的,目前的数据库表空间的监测,还处于简单的被动阶段,被动的监测数据库表空间的增长,并适时进行人工扩展,费时费力,而且成本较高。
发明内容
本发明的目的在于提供一种可靠性高、准确率高且实施简单方便的基于深度学习的电力系统数据库表空间预测方法。
本发明提供的这种基于深度学习的电力系统数据库表空间预测方法,包括如下步骤:
S1.获取电力系统的数据库表的原始历史数据;
S2.对步骤S1获取的原始历史数据进行数据处理;
S3.对步骤S2得到的处理后的数据进行数据集分割和合并,得到基础数据集;
S4.选取步骤S3得到的基础数据集的特征作为目标特征;
S5.选定时间窗口;
S6.根据选定的时间窗口,采用数据集对选定的模型进行训练和修正,从而得到数据库表空间预测模型;
S7.采用步骤S6得到的数据库表空间预测模型对电力系统的实际数据库表进行表空间的预测,从而得到预测结果。
所述的基于深度学习的电力系统数据库表空间预测方法,还包括如下步骤:
S8.根据步骤S7的预测结果,自动对电力系统数据库表空间进行扩展。
步骤S1所述的原始历史数据,具体为一条原始历史数据,包括系统名称、数据库名、日期、表空间名、剩余容量、总计容量和剩余率;其中系统名称为该条原始历史数据所对应的数据库所属的电力系统的系统名称;数据库名为系统名称在数据库内的唯一对应值;表空间名为该条原始历史数据所记录的数据库表的表名称;剩余容量为该条原始历史数据所对应的数据库表的剩余容量;总计容量为该条原始历史数据所对应的数据库表的总容量;剩余率为该条原始历史数据所对应的数据库表的剩余容量除以总计容量的值。
步骤S2所述的对步骤S1获取的原始历史数据进行数据处理,具体为对步骤S1获取的原始历史数据,对其中的缺失值进行填补,从而得到完整的历史数据。
所述的填补,具体为针对缺失值,通过日期和总计容量,找到该数据库表前一天的数据进行填充。
步骤S3所述的对步骤S2得到的处理后的数据进行数据集分割和合并,得到基础数据集,具体为采用如下步骤进行数据集分割和合并:
A.将处理后的数据,根据系统名称分为若干个数据子集;
B.用总计容量减去剩余容量,得到新的特征属性:已使用容量;
C.针对步骤A得到的每一个数据子集,以不同的数据库为单位,根据表空间名将每一个数据子集在分割为若干个子数据子集;
D.在步骤C的每一个子数据子集中,仅保留日期和已使用容量,并删除剩余所有的属性;
E.将步骤D得到的各个子数据子集中的数据合并成一个数据子集,从而得到最终的基础数据集。
步骤S4所述的选取步骤S3得到的基础数据集的特征作为目标特征,具体为选定基础数据集中的数据表的前一天与后一天的已使用容量的容量差作为目标特征,计算剩余特征与目标特征之间的相关系数,并删除相关系数不符合设定值的剩余特征,从而得到基础数据集中的若干个特征。
所述的计算剩余特征与目标特征之间的相关系数,具体为计算剩余特征与目标特征之间的皮尔森相关系数。
步骤S6所述的采用数据集对选定的模型进行训练和修正,具体为采用数据集对选定的随机森林模型进行训练和修正。
本发明提供的这种基于深度学习的电力系统数据库表空间预测方法,通过对电力系统数据库表的历史数据进行获取、处理和筛选,并采用随机森林模型对历史数据进行学习,从而得到预测模型,并根据预测模型对电力系统数据库表空间进行实时预测,因此本发明方法能够预测电力系统的数据库表空间的使用情况,而且能够根据预测结果进行数据库表空间的扩展,而且本发明方法可靠性高、准确率高且实施简单方便。
附图说明
图1为本发明方法的方法流程示意图。
具体实施方式
如图1所示为本发明方法的方法流程示意图:本发明提供的这种基于深度学习的电力系统数据库表空间预测方法,包括如下步骤:
S1.获取电力系统的数据库表的原始历史数据;具体为一条原始历史数据,包括系统名称、数据库名、日期、表空间名、剩余容量、总计容量和剩余率;其中系统名称为该条原始历史数据所对应的数据库所属的电力系统的系统名称;数据库名为系统名称在数据库内的唯一对应值;表空间名为该条原始历史数据所记录的数据库表的表名称;剩余容量为该条原始历史数据所对应的数据库表的剩余容量;总计容量为该条原始历史数据所对应的数据库表的总容量;剩余率为该条原始历史数据所对应的数据库表的剩余容量除以总计容量的值;
S2.对步骤S1获取的原始历史数据进行数据处理;具体为对步骤S1获取的原始历史数据,对其中的缺失值进行填补,从而得到完整的历史数据;
在具体实施时,针对缺失值,通过日期和总计容量,找到该数据库表前一天的数据进行填充;
S3.对步骤S2得到的处理后的数据进行数据集分割和合并,得到基础数据集;具体为采用如下步骤进行数据集分割和合并:
A.将处理后的数据,根据系统名称分为若干个数据子集;
B.用总计容量减去剩余容量,得到新的特征属性:已使用容量;
C.针对步骤A得到的每一个数据子集,以不同的数据库为单位,根据表空间名将每一个数据子集在分割为若干个子数据子集;
D.在步骤C的每一个子数据子集中,仅保留日期和已使用容量,并删除剩余所有的属性;
E.将步骤D得到的各个子数据子集中的数据合并成一个数据子集,从而得到最终的基础数据集;
S4.选取步骤S3得到的基础数据集的特征作为目标特征;具体为选定基础数据集中的数据表的前一天与后一天的已使用容量的容量差作为目标特征,计算剩余特征与目标特征之间的相关系数(可以采用皮尔森相关系数),并删除相关系数不符合设定值的剩余特征,从而得到基础数据集中的若干个特征;
S5.选定时间窗口;
S6.根据选定的时间窗口,采用数据集对选定的模型进行训练和修正,从而得到数据库表空间预测模型;具体为采用数据集对选定的随机森林模型进行训练和修正;
S7.采用步骤S6得到的数据库表空间预测模型对电力系统的实际数据库表进行表空间的预测,从而得到预测结果;
S8.根据步骤S7的预测结果,自动对电力系统数据库表空间进行扩展。
Claims (9)
1.一种基于深度学习的电力系统数据库表空间预测方法,包括如下步骤:
S1.获取电力系统的数据库表的原始历史数据;
S2.对步骤S1获取的原始历史数据进行数据处理;
S3.对步骤S2得到的处理后的数据进行数据集分割和合并,得到基础数据集;
S4.选取步骤S3得到的基础数据集的特征作为目标特征;
S5.选定时间窗口;
S6.根据选定的时间窗口,采用数据集对选定的模型进行训练和修正,从而得到数据库表空间预测模型;
S7.采用步骤S6得到的数据库表空间预测模型对电力系统的实际数据库表进行表空间的预测,从而得到预测结果。
2.根据权利要求1所述的基于深度学习的电力系统数据库表空间预测方法,其特征在于还包括如下步骤:
S8.根据步骤S7的预测结果,自动对电力系统数据库表空间进行扩展。
3.根据权利要求2所述的基于深度学习的电力系统数据库表空间预测方法,其特征在于步骤S1所述的原始历史数据,具体为一条原始历史数据,包括系统名称、数据库名、日期、表空间名、剩余容量、总计容量和剩余率;其中系统名称为该条原始历史数据所对应的数据库所属的电力系统的系统名称;数据库名为系统名称在数据库内的唯一对应值;表空间名为该条原始历史数据所记录的数据库表的表名称;剩余容量为该条原始历史数据所对应的数据库表的剩余容量;总计容量为该条原始历史数据所对应的数据库表的总容量;剩余率为该条原始历史数据所对应的数据库表的剩余容量除以总计容量的值。
4.根据权利要求3所述的基于深度学习的电力系统数据库表空间预测方法,其特征在于步骤S2所述的对步骤S1获取的原始历史数据进行数据处理,具体为对步骤S1获取的原始历史数据,对其中的缺失值进行填补,从而得到完整的历史数据。
5.根据权利要求4所述的基于深度学习的电力系统数据库表空间预测方法,其特征在于所述的填补,具体为针对缺失值,通过日期和总计容量,找到该数据库表前一天的数据进行填充。
6.根据权利要求5所述的基于深度学习的电力系统数据库表空间预测方法,其特征在于步骤S3所述的对步骤S2得到的处理后的数据进行数据集分割和合并,得到基础数据集,具体为采用如下步骤进行数据集分割和合并:
A.将处理后的数据,根据系统名称分为若干个数据子集;
B.用总计容量减去剩余容量,得到新的特征属性:已使用容量;
C.针对步骤A得到的每一个数据子集,以不同的数据库为单位,根据表空间名将每一个数据子集在分割为若干个子数据子集;
D.在步骤C的每一个子数据子集中,仅保留日期和已使用容量,并删除剩余所有的属性;
E.将步骤D得到的各个子数据子集中的数据合并成一个数据子集,从而得到最终的基础数据集。
7.根据权利要求6所述的基于深度学习的电力系统数据库表空间预测方法,其特征在于步骤S4所述的选取步骤S3得到的基础数据集的特征作为目标特征,具体为选定基础数据集中的数据表的前一天与后一天的已使用容量的容量差作为目标特征,计算剩余特征与目标特征之间的相关系数,并删除相关系数不符合设定值的剩余特征,从而得到基础数据集中的若干个特征。
8.根据权利要求7所述的基于深度学习的电力系统数据库表空间预测方法,其特征在于所述的计算剩余特征与目标特征之间的相关系数,具体为计算剩余特征与目标特征之间的皮尔森相关系数。
9.根据权利要求8所述的基于深度学习的电力系统数据库表空间预测方法,其特征在于步骤S6所述的采用数据集对选定的模型进行训练和修正,具体为采用数据集对选定的随机森林模型进行训练和修正。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911234707.8A CN110941620A (zh) | 2019-12-05 | 2019-12-05 | 基于深度学习的电力系统数据库表空间预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911234707.8A CN110941620A (zh) | 2019-12-05 | 2019-12-05 | 基于深度学习的电力系统数据库表空间预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110941620A true CN110941620A (zh) | 2020-03-31 |
Family
ID=69909883
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911234707.8A Pending CN110941620A (zh) | 2019-12-05 | 2019-12-05 | 基于深度学习的电力系统数据库表空间预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110941620A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022062777A1 (zh) * | 2020-09-22 | 2022-03-31 | 中兴通讯股份有限公司 | 数据管理方法、数据管理装置及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150134904A1 (en) * | 2013-11-12 | 2015-05-14 | International Business Machines Corporation | Thick and thin data volume management |
CN109976975A (zh) * | 2019-03-26 | 2019-07-05 | 北京大道云行科技有限公司 | 一种磁盘容量预测方法、装置、电子设备及存储介质 |
CN110532156A (zh) * | 2019-08-22 | 2019-12-03 | 北京宝兰德软件股份有限公司 | 一种容量预测方法及装置 |
-
2019
- 2019-12-05 CN CN201911234707.8A patent/CN110941620A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150134904A1 (en) * | 2013-11-12 | 2015-05-14 | International Business Machines Corporation | Thick and thin data volume management |
CN109976975A (zh) * | 2019-03-26 | 2019-07-05 | 北京大道云行科技有限公司 | 一种磁盘容量预测方法、装置、电子设备及存储介质 |
CN110532156A (zh) * | 2019-08-22 | 2019-12-03 | 北京宝兰德软件股份有限公司 | 一种容量预测方法及装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022062777A1 (zh) * | 2020-09-22 | 2022-03-31 | 中兴通讯股份有限公司 | 数据管理方法、数据管理装置及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114282434A (zh) | 一种工业设备健康管理系统及方法 | |
EP3968243A1 (en) | Method and apparatus for realizing model training, and computer storage medium | |
CN112016908A (zh) | 基于bim的施工进度监测方法、系统、电子设备及存储介质 | |
EP4020315A1 (en) | Method, apparatus and system for determining label | |
CN112580678A (zh) | 一种构造云化网络告警根因关系树模型方法和装置 | |
CN106228270B (zh) | 一种大数据驱动的挤压设备的能耗预测方法及其系统 | |
WO2019196869A1 (zh) | 一种确定巡检基站列表的方法以及巡检装置 | |
CN106855958B (zh) | 机台零件剩余寿命预测系统与方法 | |
CN113872813B (zh) | 一种载波通信设备全生命周期管理方法及系统 | |
CN114444231B (zh) | 模具剩余寿命在线自适应预测方法、装置、设备及介质 | |
CN113032905B (zh) | 深空航天器的综合状态评估方法及装置 | |
CN109684320B (zh) | 监测数据在线清洗的方法和设备 | |
CN115562225A (zh) | 工业机器人运维管理方法、装置、计算机设备和存储介质 | |
CN115619382B (zh) | 一种电力调度可视化管理方法及系统 | |
CN109002924B (zh) | 一种配网故障抢修预测分析系统及方法 | |
CN113502870A (zh) | 挖掘机工况判定方法及装置 | |
CN113435703A (zh) | 一种基于scada数据建模风电机组故障分析系统 | |
CN115828390A (zh) | 一种面向水利水电工程安全监测的四预功能实现方法 | |
CN106776316A (zh) | 一种电力信息软件缺陷预防方法 | |
CN110941620A (zh) | 基于深度学习的电力系统数据库表空间预测方法 | |
CN102065449A (zh) | 一种基于聚类ls-svm的移动通信话务量预测方法 | |
CN206977446U (zh) | 一种变电站运维平台故障自动诊断与快速恢复系统 | |
CN117521498A (zh) | 一种充电桩引导式故障诊断预测方法及系统 | |
CN116227754B (zh) | 一种橡胶手套的生产自适应优化控制方法及系统 | |
CN117200352A (zh) | 一种基于云边融合的光伏发电调控方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200331 |