CN111680764B - 一种行业复工复产程度监控方法 - Google Patents

一种行业复工复产程度监控方法 Download PDF

Info

Publication number
CN111680764B
CN111680764B CN202010811555.XA CN202010811555A CN111680764B CN 111680764 B CN111680764 B CN 111680764B CN 202010811555 A CN202010811555 A CN 202010811555A CN 111680764 B CN111680764 B CN 111680764B
Authority
CN
China
Prior art keywords
enterprises
enterprise
industry
reworking
clustering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010811555.XA
Other languages
English (en)
Other versions
CN111680764A (zh
Inventor
郑斌
潘巍巍
侯素颖
丁麒
郭兰兰
沈百强
肖涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Zhejiang Electric Power Co Ltd
Marketing Service Center of State Grid Zhejiang Electric Power Co Ltd
Original Assignee
State Grid Zhejiang Electric Power Co Ltd
Marketing Service Center of State Grid Zhejiang Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Zhejiang Electric Power Co Ltd, Marketing Service Center of State Grid Zhejiang Electric Power Co Ltd filed Critical State Grid Zhejiang Electric Power Co Ltd
Priority to CN202010811555.XA priority Critical patent/CN111680764B/zh
Publication of CN111680764A publication Critical patent/CN111680764A/zh
Application granted granted Critical
Publication of CN111680764B publication Critical patent/CN111680764B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/251Fusion techniques of input or preprocessed data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Health & Medical Sciences (AREA)
  • Educational Administration (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Probability & Statistics with Applications (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种行业复工复产程度监控方法,包括:步骤1,获取企业历年电力资源相关多元异构数据,并将多元异构数据进行融合;步骤2,选择若干个多元异构数据的特征值,并根据若干个特征值对企业进行聚类;步骤3,在同一个聚类下的企业为同一行业的企业,首先获取当年企业的使用电力资源程度数据,构建企业复工复产电力指数曲线,然后系统计算同一行业的企业平均使用电力资源程度数据,构建行业复工复产电力指数曲线,企业复工复产电力指数曲线与行业复工复产电力指数曲线比较判断企业复工复产程度,行业复工复产电力指数曲线与往年数据相比判断行业复工复产程度。本发明的监控方法可以有效准确的判断行业的整体复工复产情况。

Description

一种行业复工复产程度监控方法
技术领域
本发明涉及能耗检测技术领域,尤其是指一种行业复工复产程度监控方法。
背景技术
复工复产,是指因特殊原因、特殊时期、非常时期而使全部或大部分企事业单位不能进行生产活动、生产经营活动、停工停产后,由国家和地方政府统一指导的复工与复产相关事项及系列问题。但是,目前对于行业复工复产的监控缺乏有效的方法,不能对行业的企业复工复产程度做出准确判断,更不能了解行业整体的复工复产的程度。企业用电能耗是企业复工复产的重要指标,因此通过企业用电能耗的监控进而可以达到对行业整体复工复产程度进行有效的监控。
发明内容
本发明的目的是克服目前对于行业复工复产的监控缺乏有效的方法,不能对行业的企业复工复产程度做出准确判断,更不能了解行业整体的复工复产的程度的缺陷,提供一种行业复工复产程度监控方法。
本发明的目的是通过下述技术方案予以实现的:
一种行业复工复产程度监控方法,包括以下步骤:
步骤1,获取企业历年电力资源相关多元异构数据,并将多元异构数据进行融合;
步骤2,选择若干个多元异构数据的特征值,并根据若干个特征值对企业进行聚类;
步骤3,在同一个聚类下的企业为同一行业的企业,首先获取当年企业的电力资源使用数据,构建企业复工复产电力指数曲线,然后系统计算同一行业的企业平均电力资源使用数据,构建行业复工复产电力指数曲线,企业复工复产电力指数曲线与行业复工复产电力指数曲线比较判断企业复工复产程度,行业复工复产电力指数曲线与往年数据相比判断行业复工复产程度。
在对行业复工复产进行监控时,对行业准确的分类是对行业复工复产的准确判断的前提,现有行业的分类往往只是根据GDP,企业登记的经营范围等来分,但是行业用电情况是对行业复工复产程度一个重要的判断指标,因此需要通过企业用电情况对企业进行归类,用电情况相似的企业判断为同一行业。本方案根据企业历年的电力资源多元异构数据的特征对企业使用电力资源情况进行统计,通过多元异构数据来对企业进行聚类,聚类后的企业判断为同一行业的企业,同一行业的企业用电情况类似,因此当年企业的电力资源使用数据也大致类似。企业或行业复工复产电力指数曲线包括停产期、恢复期、波动区、平稳生产区和停产期,停产期为表示企业或行业未消耗电力或者消耗的电力显著低于正常生产的水平,且波动较小;恢复期的曲线通常为电力消耗增长的曲线,表示企业或行业正在进行复工复产;波动区表示企业已经达到了正常生产的电能消耗水平,但是电能消耗不稳定;平稳生产区表示企业进入了正常生产,完成了复工复产。通过企业或行业复工复产电力指数曲线可以清楚直观的了解企业或行业的复工复产水平。
作为一种优选方案,所述的步骤2中,聚类方法具体包括以下子步骤:
子步骤1,选择若干个多元异构数据的特征值,并对特征值做归一化处理;
子步骤2,选取若干个企业为聚类中心企业,则其他企业为待聚类企业;
子步骤3,根据待聚类企业的多元异构数据的特征值和聚类中心企业的多元异构数据的特征值计算欧式距离,若一个待聚类企业与某个聚类中心企业距离最短,则将这一个待聚类企业分到此聚类中心企业的类中,完成初始聚类;
子步骤4,初始聚类完成后,计算此聚类下所有企业所对应的均值作为该类别新的聚类中心,离聚类中心最近的企业为聚类中心企业;
子步骤5,判断重新选取的聚类中心企业是否和子步骤2中的聚类中心企业相同,若相同,则聚类完成跳转至步骤3,若不相同,则重复子步骤3和子步骤4,直到重新选取的聚类中心企业和子步骤2中的聚类中心企业相同或达到设定的最大迭代次数,跳转至步骤3。
欧式距离计算的公式为:
Figure 455609DEST_PATH_IMAGE001
其中,m表示多元异构数据的m个维度,k表示多元异构数据的第k个维度,Dij表示多元异构数据点ai到聚类中心企业中心点Mj的欧式距离。
子步骤4更新聚类中心的方法可以更为准确的寻找出最优的聚类中心,选取当前聚类中所有点的重心作为新的中心点,达到了最优的行业划分,子步骤5中,多次迭代优化可以寻找出最优的聚类中心,同时设置最大迭代次数,避免出现重新选取的聚类中心企业和子步骤2中的聚类中心企业始终不同导致一直需要重新选取的情况。
作为一种优选方案,所述的步骤2中,聚类方法具体包括以下子步骤:
子步骤1,选择若干个多元异构数据的特征值,并对特征值做归一化处理;
子步骤2,选取若干个企业为聚类中心企业,则其他企业为待聚类企业;
子步骤3,根据待聚类企业的多元异构数据的特征值和聚类中心企业的多元异构数据的特征值计算欧式距离,若一个待聚类企业与某个聚类中心企业距离最短,则将这一个待聚类企业分到此聚类中心企业的类中,完成初始聚类;
子步骤4,初始聚类完成后,计算此聚类下每一个企业和其他企业的欧式距离,并计算这些欧式距离的和,若一个企业的欧式距离和最小,则重新选取此企业为聚类中心企业;
子步骤5,判断重新选取的聚类中心企业是否和子步骤2中的聚类中心企业相同,若相同,则聚类完成跳转至步骤3,若不相同,则重复子步骤3和子步骤4,直到重新选取的聚类中心企业和子步骤2中的聚类中心企业相同或达到设定的最大迭代次数,跳转至步骤3。
选取当前聚类中所有点的重心作为新的中心点作为重新选取聚类中心企业的方法中,受到数据异常点的影响较大,选取的重心点准确度可能较低,因此,采用了子步骤4中计算这些欧式距离的和的方法来重新选取聚类中心企业的方法,这种方法不会受到异常点的影响,因此选取的聚类中心企业也更为准确。
作为一种优选方案,所述的子步骤2中,选取若干个企业为聚类中心企业的具体方法为:首先根据历年企业平均用电量设定若干个用电量区域,将企业划分在若干个用电量区域内,在每个用电量区域内根据限制条件选取至少一个聚类中心企业,限制条件为获取企业历年的复工复产的恢复天数,并计算恢复天数的平均值,若企业每年的恢复天数和平均值的方差和小于设定的第一阈值,则选取这个企业为聚类中心企业,在单个用电量区域下若选取的聚类中心企业数量大于设定的第二阈值,则寻找平均用电量最接近的两个聚类中心企业,去除其中一个聚类中心企业,直到聚类中心企业数量小于等于设定的第二阈值为止。
若干个用电量区域首先用于区别不同能耗层级的企业,进行第一步的分类,其次根据限制条件选取至少一个聚类中心企业,限制条件的选取确保了选取复工复产最稳定的企业作为初始聚类中心企业,同时初始聚类中心企业的数量不宜过多,因此企业数量大于设定的第二阈值则会相应删除一定数量的聚类中心企业。初始中心点选择的好坏直接影响聚类运行效率以及最终聚类结果。
作为一种优选方案,所述的恢复天数的具体判断方法为:
首先对企业的用电数据进行平滑处理得出用电数据与日期的关系曲线;然后在超过设定的停工时间后,企业开始用电的日期为恢复天数起始日期,寻找起始日期后曲线的第一个拐点,若在第一个拐点后的一定时期内,曲线的斜率的绝对值始终小于设定的第三阈值,则判断此拐点后企业进入平稳生产期,此拐点对应的日期为恢复天数结束日期,恢复天数结束日期与恢复天数起始日期之差为恢复天数;若在第一个拐点后的一定时期内,曲线的斜率的绝对值始终大于等于设定的第三阈值,则判断此拐点后企业未进入平稳生产期,继续寻找第一个拐点后的下一个拐点,判断下一个拐点对应的日期是否为恢复天数结束日期,直到得出恢复天数结束日期为止。
用电数据与日期的关系曲线可以直观反应企业用电数据,进而掌握企业的复工复产情况,出现拐点是企业结束恢复期的一个标志,但是第一个拐点不一定就直接说明企业结束恢复期,有可能存在波动,因此还需要判断出现拐点后曲线的斜率,若斜率的绝对值始终大于等于设定的第三阈值,说明企业的用电情况变化还很剧烈,表明企业用电情况进入波动期,继续寻找下一个拐点并进行判断。
作为一种优选方案,在所述的根据历年企业平均用电量划分若干个用电量区域后,获取企业平均用电量逐年增长或逐年下降的企业,构建此类企业平均用电量的拟合曲线,预估今年企业的平均用电量,若今年企业的平均用电量超过原先划分的企业所属用电量区域,则将此企业划分在预估今年企业的平均用电量所属用电量区域内。
企业随着时间的增加也会扩大生产规模或减小生产规模,因此需要根据历年的企业平均用电量来判断企业今年的平均用电量,否则会出现聚类不准确的问题。
作为一种优选方案,所述的聚类设有聚类范围,若待聚类企业与聚类中心企业的欧式距离的最小值大于设定值,在此待聚类企业不进行聚类分析。
设定聚类范围的值,避免了一些数据异常点对于行业判断的影响,数据异常点通常为一些用电情况特殊的企业,在进行聚类分析的时候应该排除这些用电情况特殊的企业,这些企业的用电情况可以单独分析。
作为一种优选方案,构建行业复工复产电力指数曲线的具体方法为:
步骤a,随机选取一个聚类下一定数量的企业,企业的数量大于此聚类下所有企业数量的一半,获取企业平均用电和日期关系曲线;
步骤b,重复步骤a,直到获取了N条企业平均用电和日期关系曲线;
步骤c,对所有企业平均用电和日期关系曲线的上的数字进行平均值计算,得到平均值曲线,在所有企业平均用电和日期关系曲线中与平均值曲线方差最小的曲线作为行业复工复产电力指数曲线。
作为一种优选方案,在步骤3中,行业复工复产电力指数曲线与往年数据相比判断行业复工复产程度具体方法为:通过行业复工复产电力指数曲线对行业复工复产程度进行分类,若还未进入复工复产阶段,则判断此类行业未进行复工复产,若进入复工复产阶段,则判断此类行业正在进行复工复产,同时根据已经进入复工复产阶段的天数和历年复工复产的总天数预估行业进入完全产能阶段需要的天数,若行业进入完全产能阶段,则判断此类行业已经完成了复工复产,记录复工复产所需要的天数。
作为一种优选方案,在步骤3中,行业复工复产电力指数曲线与往年数据相比判断行业复工复产程度具体方法为:若行业进入复工复产阶段后,计算用电量与往年完全产能阶段的平均用电量的比值,比值为复工复产完成系数,根据已进入复工复产阶段的日均用电量增量,预估行业进入完全产能阶段需要的天数,或根据已进入复工复产阶段的用电量曲线,计算曲线斜率,预估行业进入完全产能阶段需要的天数。
作为一种优选方案,多元异构数据包括企业历年的能耗数据、企业隶属供,变或配电站设备信息数据、企业历年能耗层级数据、企业每年正常用电天数数据、企业最高用电量月份统计数据、企业最高用电量每日时间分布数据和企业的分类。
本发明的有益效果是:行业复工复产程度监控方法通过企业用电信息对行业内的企业进行科学的聚类,有效准确的判断行业的整体复工复产情况。同时,通过行业复工复产电力指数曲线或企业复工复产电力指数曲线可以预测行业或企业的复工复产能耗水平,对行业或企业的未来用电情况有较好的参考价值。
附图说明
图1是本发明的一种流程图;
图2是本发明的企业聚类后的示意图;
图3是本发明的企业的一种用电数据与日期的关系曲线示意图;
图4是本发明的企业的另一种用电数据与日期的关系曲线示意图。
具体实施方式
下面结合附图和实施例对本发明进一步描述。
实施例1:
一种行业复工复产程度监控方法,如图1所示,包括以下步骤:
步骤1,获取企业历年电力资源相关多元异构数据,并将多元异构数据进行融合;
步骤2,选择若干个多元异构数据的特征值,并根据若干个特征值对企业进行聚类;
步骤3,在同一个聚类下的企业为同一行业的企业,首先获取当年企业的电力资源使用数据,构建企业复工复产电力指数曲线,然后系统计算同一行业的企业平均电力资源使用数据,构建行业复工复产电力指数曲线,企业复工复产电力指数曲线与行业复工复产电力指数曲线比较判断企业复工复产程度,行业复工复产电力指数曲线与往年数据相比判断行业复工复产程度。
在对行业复工复产进行监控时,对行业准确的分类是对行业复工复产的准确判断有的前提,现有的行业的分类往往只是根据GDP,企业登记的经营范围等,但是行业用电情况是对行业复工复产程度一个重要的判断指标,因此需要通过企业用电情况对企业进行归类,用电情况相似的企业判断为同一行业。本方案根据企业历年的电力资源多元异构数据的特征对企业使用电力资源情况进行统计,通过多元异构数据来对企业进行聚类,聚类后的企业判断为同一行业的企业,同一行业的企业用电情况类似,因此当年企业的电力资源使用数据也大致类似。企业或行业复工复产电力指数曲线包括停产期、恢复期、波动区、平稳生产区和停产期,停产期为表示企业或行业未消耗电力或者消耗的电力显著低于正常生产的水平,且波动较小;恢复期的曲线通常为电力消耗增长的曲线,表示企业或行业正在进行复工复产;波动区表示企业已经达到了正常生产的电能消耗水平,但是电能消耗不稳定;平稳生产区表示企业进入了正常生产,完成了复工复产。通过企业或行业复工复产电力指数曲线可以清楚直观的了解企业或行业的复工复产水平。
多元异构数据包括企业历年的能耗数据、企业隶属供电站或变电站或配电站设备信息数据、企业历年能耗层级数据、企业每年正常用电天数数据、企业最高用电量月份统计数据、企业最高用电量每日时间分布数据和企业的分类。
所述的步骤2中,聚类方法具体包括以下子步骤:
子步骤1,选择若干个多元异构数据的特征值,并对特征值做归一化处理;
子步骤2,选取若干个企业为聚类中心企业,则其他企业为待聚类企业;
子步骤3,根据待聚类企业的多元异构数据的特征值和聚类中心企业的多元异构数据的特征值计算欧式距离,若一个待聚类企业与某个聚类中心企业距离最短,则将这一个待聚类企业分到此聚类中心企业的类中,完成初始聚类;
子步骤4,初始聚类完成后,计算此聚类下所有企业所对应的均值作为该类别新的聚类中心,离聚类中心最近的企业为聚类中心企业;
子步骤5,判断重新选取的聚类中心企业是否和子步骤2中的聚类中心企业相同,若相同,则聚类完成跳转至步骤3,若不相同,则重复子步骤3和子步骤4,直到重新选取的聚类中心企业和子步骤2中的聚类中心企业相同或达到设定的最大迭代次数,跳转至步骤3。
欧式距离计算的公式为:
Figure 841591DEST_PATH_IMAGE002
其中,m表示多元异构数据的m个维度,k表示多元异构数据的第k个维度,Dij表示多元异构数据点ai到聚类中心企业中心点Mj的欧式距离。
子步骤4更新聚类中心的方法可以更为准确的寻找出最优的聚类中心,选取当前聚类中所有点的重心作为新的中心点,达到了最优的行业划分,子步骤5中,多次迭代优化可以寻找出最优的聚类中心,同时设置最大迭代次数,避免出现重新选取的聚类中心企业和子步骤2中的聚类中心企业始终不同导致一直需要重新选取的情况。
其中,历年能耗数据、企业每年正常用电天数数据、企业最高用电量每日时间分布数据等特征值直接可以直接进行归一化处理,而企业隶属供,变或配电站设备信息数据、企业历年能耗层级数据、企业最高用电量月份统计数据和企业的分类等数据需要构建隶属度函数,根据隶属度函数判断数据的隶属度再进行归一化处理,多元异构数据的特征值就可以成为聚类的基础。
所述的子步骤2中,选取若干个企业为聚类中心企业的具体方法为:首先根据历年企业平均用电量设定若干个用电量区域,将企业划分在若干个用电量区域内,在每个用电量区域内根据限制条件选取至少一个聚类中心企业,限制条件为获取企业历年的复工复产的恢复天数,并计算恢复天数的平均值,若企业每年的恢复天数和平均值的方差和小于设定的第一阈值,则选取这个企业为聚类中心企业,在单个用电量区域下若选取的聚类中心企业数量大于设定的第二阈值,则寻找平均用电量最接近的两个聚类中心企业,去除其中一个聚类中心企业,直到聚类中心企业数量小于等于设定的第二阈值为止。
若干个用电量区域首先用于区别不同能耗层级的企业,进行第一步的分类,其次根据限制条件选取至少一个聚类中心企业,限制条件的选取确保了选取复工复产最稳定的企业作为初始聚类中心企业,同时初始聚类中心企业的数量不宜过多,因此企业数量大于设定的第二阈值则会相应删除一定数量的聚类中心企业。初始中心点选择的好坏直接影响聚类运行效率以及最终聚类结果。
所述恢复天数的具体判断方法为:
首先对企业的用电数据进行平滑处理得出用电数据与日期的关系曲线;然后在超过设定的停工时间后,企业开始用电的日期为恢复天数起始日期,寻找起始日期后曲线的第一个拐点,若在第一个拐点后的一定时期内,曲线的斜率的绝对值始终小于设定的第三阈值,则判断此拐点后企业进入平稳生产期,此拐点对应的日期为恢复天数结束日期,恢复天数结束日期与恢复天数起始日期之差为恢复天数;若在第一个拐点后的一定时期内,曲线的斜率的绝对值始终大于等于设定的第三阈值,则判断此拐点后企业未进入平稳生产期,继续寻找第一个拐点后的下一个拐点,判断下一个拐点对应的日期是否为恢复天数结束日期,直到得出恢复天数结束日期为止。
如图3所示,第一个拐点日期为2-10,表明企业进入恢复期,2-10即为恢复天数起始日期。如图4所示,第一个拐点日期为2-21,表明企业进入恢复期,2-10即为恢复天数起始日期。在图3中,2-14即为即为起始日期后曲线的第一个拐点,且曲线的斜率的绝对值小于设定的阈值,表明企业进入平稳生产期。在图4中,2-21即为起始日期后曲线的第一个拐点,但是由于曲线的斜率的绝对值大于设定的阈值,则判断此拐点后企业未进入平稳生产期,继续寻找第一个拐点后的下一个拐点,在2-24后,曲线的斜率的绝对值小于设定的阈值,企业进入平稳生产期,2-21至2-24即为波动期。
用电数据与日期的关系曲线可以直观反应企业用电数据,进而掌握企业的复工复产情况,出现拐点是企业结束恢复期的一个标志,但是第一个拐点不一定就直接说明企业结束恢复期,有可能存在波动,因此还需要判断出现拐点后曲线的斜率,若斜率的绝对值始终大于等于设定的第三阈值,说明企业的用电情况变化还很剧烈,表明企业用电情况进入波动期,需继续寻找下一个拐点并进行判断。
在所述的根据历年企业平均用电量划分若干个用电量区域后,获取企业平均用电量逐年增长或逐年下降的企业,构建此类企业平均用电量的拟合曲线,预估今年企业的平均用电量,若今年企业的平均用电量超过原先划分的企业所属用电量区域,则将此企业划分在预估今年企业的平均用电量所属用电量区域内。
企业随着时间的增加也会扩大生产规模或减小生产规模,因此需要根据历年的企业平均用电量来判断企业今年的平均用电量,否则会出现聚类不准确的问题。
所述的聚类设有聚类范围,若待聚类企业与聚类中心企业的欧式距离的最小值大于设定值,在此待聚类企业不进行聚类分析。
设定聚类范围的值,避免了一些数据异常点对于行业判断的影响,数据异常点通常为一些用电情况特殊的企业,在进行聚类分析的时候应该排除这些用电情况特殊的企业,这些企业的用电情况可以单独分析。
如图2所示,对部分企业进行聚类分析后,得出三部分聚类,一个聚类范围包含一个行业内所有用电指数相似的企业,然后可以对一个行业内的企业的复工复产进行分析。图中的黑点为未被聚类的企业,这些企业的欧式距离离聚类中心较远,因此需要排除这些用电情况特殊的企业。
构建行业复工复产电力指数曲线的具体方法为:
步骤a,随机选取一个聚类下一定数量的企业,企业的数量大于此聚类下所有企业数量的一半,获取企业平均用电和日期关系曲线;
步骤b,重复步骤a,直到获取了N条企业平均用电和日期关系曲线;
步骤c,对所有企业平均用电和日期关系曲线的上的数字进行平均值计算,得到平均值曲线,在所有企业平均用电和日期关系曲线中与平均值曲线方差最小的曲线作为行业复工复产电力指数曲线。
在步骤3中,行业复工复产电力指数曲线与往年数据相比判断行业复工复产程度具体方法为:通过行业复工复产电力指数曲线对行业复工复产程度进行分类,若还未进入复工复产阶段,则判断此类行业未进行复工复产,若进入复工复产阶段,则判断此类行业正在进行复工复产,同时根据已经进入复工复产阶段的天数和历年复工复产的总天数预估行业进入完全产能阶段需要的天数,若行业进入完全产能阶段,则判断此类行业已经完成了复工复产,记录复工复产所需要的天数。
实施例2:一种行业复工复产程度监控方法,其原理和实施方法与实施例1基本相同,不同之处在于,所述的步骤2中,聚类方法具体包括以下子步骤:
子步骤1,选择若干个多元异构数据的特征值,并对特征值做归一化处理;
子步骤2,选取若干个企业为聚类中心企业,则其他企业为待聚类企业;
子步骤3,根据待聚类企业的多元异构数据的特征值和聚类中心企业的多元异构数据的特征值计算欧式距离,若一个待聚类企业与某个聚类中心企业距离最短,则将这一个待聚类企业分到此聚类中心企业的类中,完成初始聚类;
子步骤4,初始聚类完成后,计算此聚类下每一个企业和其他企业的欧式距离,并计算这些欧式距离的和,若一个企业的欧式距离和最小,则重新选取此企业为聚类中心企业;
子步骤5,判断重新选取的聚类中心企业是否和子步骤2中的聚类中心企业相同,若相同,则聚类完成跳转至步骤3,若不相同,则重复子步骤3和子步骤4,直到重新选取的聚类中心企业和子步骤2中的聚类中心企业相同或达到设定的最大迭代次数,跳转至步骤3。
选取当前聚类中所有点的重心作为新的中心点作为重新选取聚类中心企业的方法中,受到数据异常点的影响较大,选取的重心点准确度可能较低,因此,采用了子步骤4中计算这些欧式距离的和的方法来重新选取聚类中心企业的方法,这种方法不会受到异常点的影响,因此选取的聚类中心企业也更为准确。
实施例3:一种行业复工复产程度监控方法,其原理和实施方法与实施例1基本相同,不同之处在于在步骤3中,行业复工复产电力指数曲线与往年数据相比判断行业复工复产程度具体方法为:若行业进入复工复产阶段后,计算用电量与往年完全产能阶段的平均用电量的比值,比值为复工复产完成系数,根据已进入复工复产阶段的日均用电量增量,预估行业进入完全产能阶段需要的天数,或根据已进入复工复产阶段的用电量曲线,计算曲线斜率,预估行业进入完全产能阶段需要的天数。
以上所述的实施例只是本发明的一种较佳的方案,并非对本发明作任何形式上的限制,在不超出权利要求所记载的技术方案的前提下还有其它的变体及改型。

Claims (7)

1.一种行业复工复产程度监控方法,其特征是,包括以下步骤:
步骤1,获取企业历年电力资源相关多元异构数据,并将多元异构数据进行融合;
步骤2,选择若干个多元异构数据的特征值,并根据若干个特征值对企业进行聚类;
步骤3,在同一个聚类下的企业为同一行业的企业,首先获取当年企业的电力资源使用数据,构建企业复工复产电力指数曲线,然后系统计算同一行业的企业平均电力资源使用数据,构建行业复工复产电力指数曲线,企业复工复产电力指数曲线与行业复工复产电力指数曲线比较判断企业复工复产程度,行业复工复产电力指数曲线与往年数据相比判断行业复工复产程度;
所述的步骤2中,聚类方法具体包括以下子步骤:
子步骤1,选择若干个多元异构数据的特征值,并对特征值做归一化处理;
子步骤2,选取若干个企业为聚类中心企业,则其他企业为待聚类企业;
子步骤3,根据待聚类企业的多元异构数据的特征值和聚类中心企业的多元异构数据的特征值计算欧式距离,若一个待聚类企业与某个聚类中心企业距离最短,则将这一个待聚类企业分到此聚类中心企业的类中,完成初始聚类;
子步骤4,初始聚类完成后,计算此聚类下所有企业所对应的均值作为该聚类新的聚类中心,离聚类中心最近的企业为聚类中心企业;
子步骤5,判断重新选取的聚类中心企业是否和子步骤2中的聚类中心企业相同,若相同,则聚类完成跳转至步骤3,若不相同,则重复子步骤3和子步骤4,直到重新选取的聚类中心企业和子步骤2中的聚类中心企业相同或达到设定的最大迭代次数,跳转至步骤3;
或所述的步骤2中,聚类方法具体包括以下子步骤:
子步骤1,选择若干个多元异构数据的特征值,并对特征值做归一化处理;
子步骤2,选取若干个企业为聚类中心企业,则其他企业为待聚类企业;
子步骤3,根据待聚类企业的多元异构数据的特征值和聚类中心企业的多元异构数据的特征值计算欧式距离,若一个待聚类企业与某个聚类中心企业距离最短,则将这一个待聚类企业分到此聚类中心企业的类中,完成初始聚类;
子步骤4,初始聚类完成后,计算此聚类下每一个企业和其他企业的欧式距离,并计算这些欧式距离的和,若一个企业的欧式距离和最小,则重新选取此企业为聚类中心企业;
子步骤5,判断重新选取的聚类中心企业是否和子步骤2中的聚类中心企业相同,若相同,则聚类完成跳转至步骤3,若不相同,则重复子步骤3和子步骤4,直到重新选取的聚类中心企业和子步骤2中的聚类中心企业相同或达到设定的最大迭代次数,跳转至步骤3;
所述的子步骤2中,选取若干个企业为聚类中心企业的具体方法为:首先根据历年企业平均用电量设定若干个用电量区域,将企业划分在若干个用电量区域内,在每个用电量区域内根据限制条件选取至少一个聚类中心企业,限制条件为获取企业历年的复工复产的恢复天数,并计算恢复天数的平均值,若企业每年的恢复天数和平均值的方差和小于设定的第一阈值,则选取这个企业为聚类中心企业,在单个用电量区域下若选取的聚类中心企业数量大于设定的第二阈值,则寻找平均用电量最接近的两个聚类中心企业,去除其中一个聚类中心企业,直到聚类中心企业数量小于等于设定的第二阈值为止;
在所述的根据历年企业平均用电量划分若干个用电量区域后,获取企业平均用电量逐年增长或逐年下降的企业,构建此类企业平均用电量的拟合曲线,预估今年企业的平均用电量,若今年企业的平均用电量超过原先划分的企业所属用电量区域,则将此企业划分在预估今年企业的平均用电量所属用电量区域内。
2.根据权利要求1所述的一种行业复工复产程度监控方法,其特征是,所述的恢复天数的具体判断方法为:
首先对企业的用电数据进行平滑处理得出用电数据与日期的关系曲线;然后在超过设定的停工时间后,企业开始用电的日期为恢复天数起始日期,寻找起始日期后曲线的第一个拐点,若在第一个拐点后的一定时期内,曲线的斜率的绝对值始终小于设定的第三阈值,则判断此拐点后企业进入平稳生产期,此拐点对应的日期为恢复天数结束日期,恢复天数结束日期与恢复天数起始日期之差为恢复天数;若在第一个拐点后的一定时期内,曲线的斜率的绝对值始终大于等于设定的第三阈值,则判断此拐点后企业未进入平稳生产期,继续寻找第一个拐点后的下一个拐点,判断下一个拐点对应的日期是否为恢复天数结束日期,直到得出恢复天数结束日期为止。
3.根据权利要求1所述的一种行业复工复产程度监控方法,其特征是,所述的聚类设有聚类范围,若待聚类企业与聚类中心企业的欧式距离的最小值大于设定值,在此待聚类企业不进行聚类分析。
4.根据权利要求1所述的一种行业复工复产程度监控方法,其特征是,构建行业复工复产电力指数曲线的具体方法为:
步骤a,随机选取一个聚类下一定数量的企业,企业的数量大于此聚类下所有企业数量的一半,获取企业平均用电和日期关系曲线;
步骤b,重复步骤a,直到获取了N条企业平均用电和日期关系曲线;
步骤c,对所有企业平均用电和日期关系曲线的上的数字进行平均值计算,得到平均值曲线,在所有企业平均用电和日期关系曲线中与平均值曲线方差最小的曲线作为行业复工复产电力指数曲线。
5.根据权利要求1所述的一种行业复工复产程度监控方法,其特征是,在步骤3中,行业复工复产电力指数曲线与往年数据相比判断行业复工复产程度具体方法为:通过行业复工复产电力指数曲线对行业复工复产程度进行分类,若还未进入复工复产阶段,则判断此类行业未进行复工复产,若进入复工复产阶段,则判断此类行业正在进行复工复产,同时根据已经进入复工复产阶段的天数和历年复工复产的总天数预估行业进入完全产能阶段需要的天数,若行业进入完全产能阶段,则判断此类行业已经完成了复工复产,记录复工复产所需要的天数。
6.根据权利要求1所述的一种行业复工复产程度监控方法,其特征是,在步骤3中,行业复工复产电力指数曲线与往年数据相比判断行业复工复产程度具体方法为:若行业进入复工复产阶段后,计算用电量与往年完全产能阶段的平均用电量的比值,比值为复工复产完成系数,根据已进入复工复产阶段的日均用电量增量,预估行业进入完全产能阶段需要的天数,或根据已进入复工复产阶段的用电量曲线,计算曲线斜率,预估行业进入完全产能阶段需要的天数。
7.根据权利要求1所述的一种行业复工复产程度监控方法,其特征是,多元异构数据包括企业历年的能耗数据、企业隶属供,变或配电站设备信息数据、企业历年能耗层级数据、企业每年正常用电天数数据、企业最高用电量月份统计数据、企业最高用电量每日时间分布数据和企业的分类。
CN202010811555.XA 2020-08-13 2020-08-13 一种行业复工复产程度监控方法 Active CN111680764B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010811555.XA CN111680764B (zh) 2020-08-13 2020-08-13 一种行业复工复产程度监控方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010811555.XA CN111680764B (zh) 2020-08-13 2020-08-13 一种行业复工复产程度监控方法

Publications (2)

Publication Number Publication Date
CN111680764A CN111680764A (zh) 2020-09-18
CN111680764B true CN111680764B (zh) 2020-10-27

Family

ID=72438621

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010811555.XA Active CN111680764B (zh) 2020-08-13 2020-08-13 一种行业复工复产程度监控方法

Country Status (1)

Country Link
CN (1) CN111680764B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112327775A (zh) * 2020-11-10 2021-02-05 夏洋 一种基于人工智能的企业复工复产程度监控系统及方法
CN112308341A (zh) * 2020-11-23 2021-02-02 国网北京市电力公司 电力数据的处理方法和装置
CN112614005B (zh) * 2020-11-30 2024-04-30 国网北京市电力公司 企业复工状态的处理方法和装置
CN112434962B (zh) * 2020-12-01 2021-08-24 国网江苏省电力有限公司营销服务中心 基于电力负荷数据的企业用户状态评估方法和系统
CN112633666A (zh) * 2020-12-18 2021-04-09 国网安徽省电力有限公司合肥供电公司 一种基于K-means聚类算法的电力企业用户复工状况监测方法
CN113935568A (zh) * 2021-08-30 2022-01-14 国网江苏省电力有限公司物资分公司 一种在生产力恢复阶段制定采购策略的辅助决策方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106257505A (zh) * 2016-07-28 2016-12-28 国家电网公司 一种基于行业协同和供需侧响应的电力预警指数构建方法
CN108734355A (zh) * 2018-05-24 2018-11-02 国网福建省电力有限公司 一种应用于电能质量综合治理场景的短期电力负荷并行预测方法及系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10346148B2 (en) * 2013-08-12 2019-07-09 Amazon Technologies, Inc. Per request computer system instances
CN107273669B (zh) * 2017-05-27 2018-08-17 水利部交通运输部国家能源局南京水利科学研究院 生态清淤工程水生态修复效果的监控方法
CN111191687B (zh) * 2019-12-14 2023-02-10 贵州电网有限责任公司 基于改进K-means算法的电力通信数据聚类方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106257505A (zh) * 2016-07-28 2016-12-28 国家电网公司 一种基于行业协同和供需侧响应的电力预警指数构建方法
CN108734355A (zh) * 2018-05-24 2018-11-02 国网福建省电力有限公司 一种应用于电能质量综合治理场景的短期电力负荷并行预测方法及系统

Also Published As

Publication number Publication date
CN111680764A (zh) 2020-09-18

Similar Documents

Publication Publication Date Title
CN111680764B (zh) 一种行业复工复产程度监控方法
WO2022110557A1 (zh) 一种台区户变关系异常诊断方法及装置
CN111724278A (zh) 一种面向电力多元负荷用户的精细分类方法及系统
CN111476435B (zh) 基于密度峰值的充电桩负荷预测方法
CN111160401A (zh) 一种基于均值漂移和XGBoost的异常用电判别方法
CN111784093B (zh) 一种基于电力大数据分析的企业复工辅助判断方法
CN110826641B (zh) 一种基于聚类分析归类居民用电情况的系统及方法
CN116976707B (zh) 基于用电信息采集的用户用电数据异常分析方法及系统
CN108989092A (zh) 一种无线网络预测方法、电子设备及存储介质
CN116821832A (zh) 针对高压工商业用户用电负荷的异常数据辨识与修正方法
CN117035513A (zh) 一种智慧工业园区能源运行智能监测管理系统及方法
CN111881961A (zh) 基于数据挖掘的配电网故障风险等级预测方法
CN114417971A (zh) 一种基于k近邻密度峰值聚类的电力数据异常值检测算法
CN114519651A (zh) 基于电力大数据的智能配电方法
CN114565293A (zh) 一种工业负荷提供长周期需求响应能力的评估方法
CN110689324A (zh) 一种配电变压器检测结果的辅助评判方法
CN107274025B (zh) 一种实现用电模式智能识别与管理的系统和方法
CN115378143B (zh) 电力营销智能稽查系统
CN113298148B (zh) 一种面向生态环境评价的不平衡数据重采样方法
CN112256766A (zh) 用于能源采集终端的用电行为分析方法
Wang et al. Analysis of user’s power consumption behavior based on k-means
CN113869782B (zh) 基于时序分解企业用电数据以识别环保管控异常的方法
CN115169904A (zh) 一种关键风险因子识别方法、装置、移动终端及存储介质
CN111695599B (zh) 一种用户用电负荷时间弹性识别方法
CN117236532B (zh) 一种基于负荷数据的用电高峰负荷预测的方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant