CN115936291A - 海量数据下基于多能源协同企业能耗动态标准库构建方法 - Google Patents
海量数据下基于多能源协同企业能耗动态标准库构建方法 Download PDFInfo
- Publication number
- CN115936291A CN115936291A CN202210176806.0A CN202210176806A CN115936291A CN 115936291 A CN115936291 A CN 115936291A CN 202210176806 A CN202210176806 A CN 202210176806A CN 115936291 A CN115936291 A CN 115936291A
- Authority
- CN
- China
- Prior art keywords
- energy consumption
- enterprise
- data
- cluster
- energy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供海量数据下基于多能源协同企业能耗动态标准库构建方法,获取企业能耗数据;对企业能耗连续和离散缺失数据分别进行填补;判别企业使用能源类型;对企业能耗进行分类,以及对时间场景进行划分;基于参数寻优策略生成最优DBSCAN参数MinPts和Eps;基于自适应DBSCAN聚类求解企业各能耗类型动态标准区间;按照企业能耗场景合并各能耗类型下的动态标准区间。本发明考虑到企业能耗分类及时间场景划分;提出基于多能源协调运用的企业能耗动态标准区间建立,提高对于企业能耗异常研判的准确性。
Description
背景技术
伴随能源对当今社会经济发展重要性的提升,能源缺乏问题也逐渐成为大家关注的焦点。而企业能耗问题是影响综合能耗的关键,因此企业能耗异常研判将成为节能减排的重中之重。
现有的企业能耗动态标准区间,对处理运用综合能源的企业存在一定的缺陷。一是没有考虑多种能源协调运用下的企业能耗动态标准区间的构建;二是采用一般的聚类算法导致得到的动态标准区间精确度较低;三是并没有对企业分工序进行能耗异常判断,降低了企业能耗研判的准确性。
发明内容
本发明提供的海量数据下基于多能源协同企业能耗动态标准库构建方法,将获得的能耗数据统一折算为标准煤;对企业能耗连续和离散缺失数据分别进行填补;判别企业使用能源类型;企业能耗场景划分和工序能耗计算;自适应DBSCAN算法对企业能耗数据进行聚类;求解企业各能耗类型动态标准区间;本发明考虑到企业能耗分类及时间场景划分,提出基于多能源协调运用的企业能耗动态标准区间建立,提高对于企业能耗异常研判的准确性。
本发明提供的海量数据下基于多能源协同企业能耗动态标准库构建方法包括:
S1、获取企业能耗数据;
S2、对企业能耗连续和离散缺失数据分别进行填补;
S3、判别企业使用能源类型;
S4、对企业能耗进行分类,以及对时间场景进行划分;
S5、基于参数寻优策略生成最优DBSCAN参数MinPts和Eps;
S6、基于自适应DBSCAN聚类求解企业各能耗类型动态标准区间;
S7、按照企业能耗场景合并各能耗类型下的动态标准区间。
进一步需要说明的是,步骤S1中企业能耗数据的值用于判断企业能耗是否存在异常;
还用于建立企业能耗动态标准区间;
还用于将企业各能源消耗折算为吨标煤数据。
进一步需要说明的是,步骤S3还包括对企业能耗数据预处理,判别企业使用能源类型;
对离散缺失数据占比大和连续缺失的能耗数据视作异常数据,具有异常数据的企业相关步骤视为异常;
对于离散缺失数据,通过计算离散缺失数据的前后数据平均值来进行自动填补。
进一步需要说明的是,步骤S4中对各能源消耗数据依据四季和节假日划分场景,并对工序能耗进行计算,具体步骤如下所述:
S41、将企业能耗划分为原料消耗,能源能耗和厂用电;
S42、根据企业类型匹配相关工序,并按工序对能源能耗类型数据进行分类;
S43、将同一工序内的能源分为耗热类和耗电类,将耗热类能源消耗进行数据合并;
S44、将企业能耗数据按照四季,节假日划分为8个场景,在S41-S43能源分类的基础上按照不同场景进行分析。
进一步需要说明的是,步骤S4中对能耗分类的场景划分中将企业能耗分为原料消耗和能源消耗,并对两种消耗类型数据单独分析;原料消耗是将其折算为吨标煤数据,按照以下所给出的公式:
式中li指企业所用能源的能耗量;pi指企业所用能源的标准煤转换系数;
将能源消耗分解为企业用电和企业化石能源消耗;对于企业用电数据单独分析;将所属企业化石能源消耗的数据进行折算合并分析,计算公式如下:
Eh=pg·lg+pc·lc+ps·ls
式中lg,lc,ls指企业天然气,煤,石油的能耗值;pg,pc,ps指企业所用天然气,煤,石油的标准煤转换系数。
进一步需要说明的是,步骤S5中基于参数寻优策略生成最优DBSCAN 参数MinPts和Eps,包括步骤如下:
S51、计算所有数据点到其第K个最近邻距离,并求得平均值作为K-平均邻域距离;
在K-平均邻域距离基础上生成所有K值的Eps参数集合记作E;
S52、生成所有K值的MinPts参数集记作M,生成公式如下:
式中,n为数据集中的对象总个数,Ni为第i个对象的Eps邻域对象数量;
S53、选用不同K值下的MinPts和Eps参数进行聚类分析,即寻找参数集合E和M中对应K值的参数作为DBSCAN聚类的参数进行聚类;
S54、对不同K值生成的聚类结果进行簇数分析,当连续3次生成簇类个数一致时将此聚类个数作为最佳聚类个数;
S55、寻找最佳聚类个数下的最优K值,进而确定最优MinPts和Eps参数。
进一步需要说明的是,步骤S5中采用适合数据集的参数MinPts和Eps 进行聚类分析,具体步骤如下:
S501、定义N(p,Eps)为以点p为圆心Eps为半径的圆内数据点的个数,计算N(p,Eps)值判断该店是否为核心点,如果N(p,Eps)>=MinPts,该点为核心点;
S502、如果N(p,Eps)<MinPts,且在其他核点圆形区域内,则属于边缘点;
S503、如果既不是核点又不是边缘点,则为离群点;
S504、重复步骤S501-S503,直到所有点都有明确分类。
进一步需要说明的是,步骤S6中将自适应DBSCAN聚类后的数据分为主簇和副簇,选择包含数据点数最多的簇作为主簇,并将主簇作为动态标准区间的主体;
采用簇心扩展法选定动态标准区间的上下限;通过定义指标判断两簇之间的距离:簇类C1和C2的距离等于两个簇类所有样本对距离平方和的平均:
企业能耗动态标准区间的上下限选取方式为:
式中mcmax为主簇上界,mcmin为主簇下界,Cm、Cu和Cl分别为主簇、上簇、下簇,dist(Cm,Cu)为主簇与上簇的簇间距,dist(Cm,Cl)为主簇和下簇的簇间距,nm、 nu、nl分别为主簇、上簇、下簇数据个数。
进一步需要说明的是,步骤S7中将企业能耗进行场景合,并按企业工序进行异常判断,具体包括如下步骤:
S71、将所有场景分别进行聚类分析并获得相对应的动态标准区间,将区间内数值由小到大排列,记作Ni[a1,a2]形式;
其中a1为场景标准区间能耗最小值,a2为场景标准区间能耗最大值,i 为场景标号;
S72、随机挑选一个场景N11与N1i进行比较,N1i为除N10外的所有场景数据,计算N1i与N11区间相似度,公式如下:
S73、遍历所有N1i求得区间相似度sim,设置相似度阈值λ=0.8,挑选sim>λ的场景;
S74、将挑选出来的场景进行众数及最值比对,剔除比对结果较差的场景;
S75、重复步骤S71-S74,直到所有场景比对完毕。
从以上技术方案可以看出,本发明具有以下优点:
本发明提供的海量数据下基于多能源协同企业能耗动态标准库构建方法通过获取企业能耗数据;对企业能耗连续和离散缺失数据分别进行填补;判别企业使用能源类型;企业能耗场景划分和工序能耗计算;自适应DBSCAN 算法对企业能耗数据进行聚类;求解企业各能耗类型动态标准区间;本发明考虑到企业能耗分类及时间场景划分;提出基于多能源协调运用的企业能耗动态标准区间建立,提高对于企业能耗异常研判的准确性。
附图说明
为了更清楚地说明本发明的技术方案,下面将对描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的海量数据下基于多能源协同企业能耗动态标准库构建方法流程图。
图2为本发明的为生成最优DBSCAN参数MinPts和Eps的流程图。
图3为本发明的某一场景不同K值下的聚类数分析图。
图4为本发明的某一场景不同K值下的密度参数取值图。
图5为本发明的基于簇心扩展法建立的企业能耗动态标准区间图。
图6为本发明的企业能耗动态标准区间的预警线图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供的海量数据下基于多能源协同企业能耗动态标准库构建方法是运用海量数据下考虑多能源协调构建方法,其所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
本发明提供的海量数据下基于多能源协同企业能耗动态标准库构建方法附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
现在结合附图对本发明作进一步详细的说明。
如附图1和2所示,本发明提供了海量数据下考虑多能源协调运用的海量数据下基于多能源协同企业能耗动态标准库构建方法,包括如下步骤:
S1、获取企业能耗数据;采用数据预处理方法剔除异常数据,填补缺失数据。
企业能耗类型多样,需将企业各能源消耗折算为吨标煤数据进行综合分析,能源折算标准煤参考系数如表一所示:
表一
能源名称 | 平均低位发热量 | 折标准煤系数 |
原煤 | 20 908kJ/kg(5 000kcal/kg) | 0.714 3kgce/kg |
天然气 | <![CDATA[38 931kJ/m<sup>3</sup>(9 310kcal/m<sup>3</sup>)]]> | <![CDATA[1.330 0kgce/m<sup>3</sup>]]> |
电力 | 3 600kJ/(kW·h) | 0.122 9kgce/(kW·h) |
热 | — | 0.034 12kgce/MJ |
获得的经折算后的原始历史企业能耗数据存在少量缺失数据和异常数据,所以在进行数据聚类分析建立企业能耗动态标准区间前需要对数据进行相应的数据预处理;
S11、企业多种能耗综合计算;
企业用能并非单一的一种能耗,企业用能种类常包含煤,天然气等一次能源和热,电等二次能源;若要对企业能耗进行分析比较,需将能耗数值统一转化为标准煤进行计算;考虑到标准煤是对能源所含热值进行归算,而企业对煤和天然气的使用也多为燃烧,恰好符合折算为标准煤的条件,折算公式为:
式中li指企业所用能源的能耗量;pi指企业所用能源的标准煤转换系数;
S12、采取分类处理离散缺失和连续缺失数据的原则进行企业能耗缺失数据填补;
对于历史能耗数据中的离散缺失数据,采用取其前后两个数据平均值进行填补;而连续缺失数据则面临缺失数据较多且无法寻找周围数据规律的问题,故而以去年对应时间连续数据趋势作为参考数据,以连续缺失数据前一个值为基准按照此参考数据趋势进行填补,具体计算公式为:
式中is,ie分别指原始数据连续缺失数据前后值;rs,re为参考数据对应原始数据is,ie位置上的数值,ni为第i个原始数据数值,ri为第i个参考数据数值。
选取某水泥企业能耗数据作为样本,挑选部分缺失数据按照上述缺失值处理方式进行处理,将处理结果统计如表二所示:
表二
离散数据填补结果
连续数据填补结果
S2、企业能耗分类及时间场景划分。
企业用能大致包含企业原料消耗,能源能耗两大类;其中原料消耗可单一对数据进行聚类分析建立标准即可;而能源能耗包含企业用电,企业化石能源消耗等,化石能源中天然气和煤炭通常在同一工序中一起使用;而且企业能耗受季节和节假日影响出现数值上的起伏,故建立多维场景下的企业工序能耗计算标准。
S21、基于时间场景企业能耗场景划分;
本发明考虑四季变化可能会影响企业能耗,如果不按时间场景划分可能导致最终企业标准库并不能适应企业所有场景,导致企业能耗异常判断错误。故建立按季节规则的初始场景分组,具体规则如表三所示:
表三
季节 | 月份 | 组别 |
春 | 3月-5月 | 1 |
夏 | 6月-8月 | 2 |
秋 | 9月-11月 | 3 |
冬 | 12月-2月 | 4 |
将企业能耗数据按时间初步分为4个组别,并对每个组别分别研究。
S22、基于能耗分类的场景划分;
S221、在S21的基础上,将企业能耗分为原料消耗和能源消耗,并对两种消耗类型数据单独分析;原料消耗按照S11所给出的多种能耗综合计算方法对各种类能源进行折算合并统一分析;
S222、将能源消耗进一步分解为企业用电和企业化石能源消耗;对于企业用电数据单独分析;将所属企业化石能源消耗的数据进行折算合并分析,计算公式如下:
Eh=pg·lg+pc·lc+ps·ls
式中lg,lc,ls指企业天然气,煤,石油的能耗值;pg,pc,ps指企业所用天然气,煤,石油的标准煤转换系数。
最终建立基于能耗分类和时间分类的企业能耗场景划分,如表四所示:
表四
季节 | 原料消耗 | 企业用电 | 企业化石能源消耗 |
春 | 1 | 5 | 9 |
夏 | 2 | 6 | 10 |
秋 | 3 | 7 | 11 |
冬 | 4 | 8 | 12 |
S3、基于参数寻优策略生成最优DBSCAN参数MinPts和Eps。
DBSCAN聚类算法将簇定义为密度相连的点的最大集合,能够把具有足够高密度的区域划分为簇,并可在噪声的空间数据库中发现任意形状的聚类。
S31、计算所有数据点到其第K个最近邻距离,并求得其平均值作为K- 平均邻域距离;在此基础上生成所有K值的Eps参数集合记作E;
S32、生成所有K值的MinPts参数集记作M,生成公式如下:
式中,n为数据集中的对象总个数,Ni为第i个对象的Eps邻域对象数量。
S33、选用不同K值下的MinPts和Eps参数进行聚类分析,即寻找参数集合E和M中对应K值的参数作为DBSCAN聚类的参数进行聚类;
S34、对不同K值生成的聚类结果进行簇数分析,当连续3次生成簇类个数一致时将此聚类个数作为最佳聚类个数;
S35、定义密度参数D,在确定最佳聚类个数的前提下,D值越小聚类效果越好。寻找最佳聚类个数下的最优K值,进而确定最优MinPts和Eps参数。
密度参数D公式为:
S4、基于自适应DBSCAN聚类算法求得企业能耗动态标准区间。
采用适合数据集的参数MinPts和Eps进行聚类分析,DBSCAN聚类具体过程如下:
S41、定义N(p,Eps)为以点p为圆心Eps为半径的圆内数据点的个数,计算N(p,Eps)值判断该店是否为核心点,如果N(p,Eps)>=MinPts,该点为核心点;
S42、如果N(p,Eps)<MinPts,且在其他核点圆形区域内,则属于边缘点;
S43、如果既不是核点又不是边缘点,则为离群点;
S44、重复步骤S41-S43,直到所有点都有明确分类。
选择包含数据点数最多的簇作为主簇,并将主簇作为动态标准区间的主体;但仅仅考虑单个簇类会使得数据流失严重且所形成的动态标准区间会陷入局部标准,使得最终企业能耗异常判断出现偏差。故采用簇心扩展法选定动态标准区间的上下限y upper和ylower:
首先,定义指标去判断两簇之间的距离;
簇类C1和C2的距离等于两个簇类所有样本对距离平方和的平均,如下公式:
然后,完成上下限的选定:
式中mcmax为主簇上界,mcmin为主簇下界,Cm、Cu和Cl分别为主簇、上簇、下簇,dist(Cm,Cu)为主簇与上簇的簇间距,dist(Cm,Cl)为主簇和下簇的簇间距,nm、 nu、nl分别为主簇、上簇、下簇数据个数。
S5、基于区间相似度合并企业能耗场景,获得企业能耗动态标准区间集。
S51、将所有场景分别进行聚类分析并获得相对应的动态标准区间,将区间内数值由小到大排列,记作Ni[a1,a2]形式;其中a1为场景标准区间能耗最小值,a2为场景标准区间能耗最大值,i为场景标号;
S52、随机挑选一个场景N11与N1i进行比较,N1i为除N10外的所有场景数据,计算N1i与N11区间相似度,公式如下:
S53、遍历所有N1i求得区间相似度sim,设置相似度阈值λ=0.8,挑选sim>λ的场景;
S54、将挑选出来的场景进行众数及最值比对,剔除比对结果较差的场景;
S55、重复步骤S51-S54,直到所有场景比对完毕。
应用本发明的考虑多能源协调运用的企业能耗动态标准区间构建一个具体实施例如下:
计算所有数据点到其第K个最近邻距离(K=1,…70),得到对应K的Eps 参数集合和MinPts集合,依次选取参数进行DBSCAN聚类;选取该企业某一场景进行K和聚类数关系分析,如图3所示。
对不同K值生成的聚类结果进行簇数分析,当连续3次生成簇类个数一致时将此聚类个数作为最佳聚类个数;由图4可知选取k=3作为最佳聚类个数。
定义密度参数D,在确定最佳聚类个数的前提下,D值越小聚类效果越好。密度参数D公式为:
已通过K和聚类数的关系图获得最佳聚类个数为3,K值可能取值范围为[10,50]由图像可知,密度阈值随K值的增大而减小;继而,取K=10进行 DBSCAN参数的求解。选取参数Eps=0.8,MinPts=7,进行DBSCAN聚类分析,得到图5。
所得簇类信息如表五所示:
表五
簇类 | 数据点个数 |
1 | 129 |
2 | 47 |
3 | 27 |
计算聚类所得3个簇集的中心,聚类中心分别为9.58,13.72,15.14;采用簇心点扩展法选取动态标准区间的上下限,并结合企业标准得到预警线为 11.65,14.43,16.14(企业标准),如图6所示。
计算某企业各场景能耗动态标准区间的相似度如表七所示:
表七
Sim | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |
1 | 1 | 0.45 | 0.91 | 0.37 | 0.76 | 0.49 | 0.26 | 0.38 | 0.68 | 0.70 | 0.61 | 0.28 |
2 | 0.45 | 1 | 0.32 | 0.69 | 0.36 | 0.60 | 0.68 | 0.67 | 0.43 | 0.55 | 0.51 | 0.58 |
3 | 0.91 | 0.32 | 1 | 0.35 | 0.69 | 0.73 | 0.21 | 0.58 | 0.52 | 0.74 | 0.74 | 0.59 |
4 | 0.37 | 0.69 | 0.35 | 1 | 0.28 | 0.64 | 0.20 | 0.70 | 0.45 | 0.62 | 0.37 | 0.40 |
5 | 0.76 | 0.36 | 0.69 | 0.28 | 1 | 0.20 | 0.89 | 0.27 | 0.68 | 0.29 | 0.23 | 0.78 |
6 | 0.49 | 0.6 | 0.73 | 0.64 | 0.2 | 1 | 0.45 | 0.41 | 0.71 | 0.72 | 0.38 | 0.6 |
7 | 0.26 | 0.68 | 0.21 | 0.2 | 0.89 | 0.45 | 1 | 0.58 | 0.63 | 0.75 | 0.74 | 0.7 |
8 | 0.38 | 0.67 | 0.58 | 0.7 | 0.27 | 0.41 | 0.58 | 1 | 0.51 | 0.76 | 0.61 | 0.79 |
9 | 0.68 | 0.43 | 0.52 | 0.45 | 0.68 | 0.71 | 0.63 | 0.51 | 1 | 0.35 | 0.84 | 0.83 |
10 | 0.7 | 0.55 | 0.74 | 0.62 | 0.29 | 0.72 | 0.75 | 0.76 | 0.35 | 1 | 0.31 | 0.59 |
11 | 0.61 | 0.51 | 0.74 | 0.37 | 0.23 | 0.38 | 0.74 | 0.61 | 0.84 | 0.31 | 1 | 0.80 |
12 | 0.28 | 0.58 | 0.59 | 0.4 | 0.78 | 0.6 | 0.7 | 0.79 | 0.83 | 0.59 | 0.80 | 1 |
设置相似度阈值ψ=0.8,当sim(N1i,N11)>ψ时可将两场景进行合并,从而节省计算时间,提高企业能耗异常研判的效率;根据上表各场景企业能耗动态标准区间相似度可得:场景1、3,场景5、7,场景9、11,场景9、12,场景11、12可进行合并;获得合并后场景的动态标准区间。
本发明企业能耗多场景动态标准区间结果如表八所示:
表八
企业能耗动态区间下限 | 企业能耗动态区间上限 | |
场景1,3 | 15.69 | 18.35 |
场景2,4 | 14.26 | 17.49 |
场景5,7 | 11.65 | 16.14 |
场景6,8 | 13.58 | 18.36 |
场景9,11,12 | 18.35 | 26.25 |
场景10 | 17.25 | 24.38 |
综上,本发明提出对企业能耗连续和离散缺失数据分别进行填补,解决数据异常及缺失问题;提出采用自适应DBSCAN算法对企业能耗数据进行聚类,求解企业各能耗类型动态标准区间;本发明还考虑到企业能耗分类及时间场景划分,提出基于多能源协调运用的企业能耗动态标准区间建立,提高对于企业能耗异常研判的准确性。
本发明涉及的海量数据下基于多能源协同企业能耗动态标准库构建方法可以在终端上使用。终端可以包括诸如笔记本电脑、数字广播接收器、个人数字助理(PDA,Personal Digital Assistant)、平板电脑(PAD)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。
本发明实现海量数据下基于多能源协同企业能耗动态标准库构建方法是结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属技术领域的技术人员能够理解,本发明实现的海量数据下基于多能源协同企业能耗动态标准库构建方法各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (9)
1.海量数据下基于多能源协同企业能耗动态标准库构建方法,其特征在于,方法包括:
S1、获取企业能耗数据;
S2、对企业能耗连续和离散缺失数据分别进行填补;
S3、判别企业使用能源类型;
S4、对企业能耗进行分类,以及对时间场景进行划分;
S5、基于参数寻优策略生成最优DBSCAN参数MinPts和Eps;
S6、基于自适应DBSCAN聚类求解企业各能耗类型动态标准区间;
S7、按照企业能耗场景合并各能耗类型下的动态标准区间。
2.根据权利要求1所述的海量数据下基于多能源协同企业能耗动态标准库构建方法,其特征在于,
步骤S1中企业能耗数据的值用于判断企业能耗是否存在异常;
还用于建立企业能耗动态标准区间;
还用于将企业各能源消耗折算为吨标煤数据。
3.根据权利要求1所述的海量数据下基于多能源协同企业能耗动态标准库构建方法,其特征在于,
步骤S3还包括对企业能耗数据预处理,判别企业使用能源类型;
对离散缺失数据占比大和连续缺失的能耗数据视作异常数据,具有异常数据的企业相关步骤视为异常;
对于离散缺失数据,通过计算离散缺失数据的前后数据平均值来进行自动填补。
4.根据权利要求1所述的海量数据下基于多能源协同企业能耗动态标准库构建方法,其特征在于,
步骤S4中对各能源消耗数据依据四季和节假日划分场景,并对工序能耗进行计算,具体步骤如下所述:
S41、将企业能耗划分为原料消耗,能源能耗和厂用电;
S42、根据企业类型匹配相关工序,并按工序对能源能耗类型数据进行分类;
S43、将同一工序内的能源分为耗热类和耗电类,将耗热类能源消耗进行数据合并;
S44、将企业能耗数据按照四季,节假日划分为8个场景,在S41-S43能源分类的基础上按照不同场景进行分析。
6.根据权利要求1所述的海量数据下基于多能源协同企业能耗动态标准库构建方法,其特征在于,
步骤S5中基于参数寻优策略生成最优DBSCAN参数MinPts和Eps,包括步骤如下:
S51、计算所有数据点到其第K个最近邻距离,并求得平均值作为K-平均邻域距离;
在K-平均邻域距离基础上生成所有K值的Eps参数集合记作E;
S52、生成所有K值的MinPts参数集记作M,生成公式如下:
式中,n为数据集中的对象总个数,Ni为第i个对象的Eps邻域对象数量;
S53、选用不同K值下的MinPts和Eps参数进行聚类分析,即寻找参数集合E和M中对应K值的参数作为DBSCAN聚类的参数进行聚类;
S54、对不同K值生成的聚类结果进行簇数分析,当连续3次生成簇类个数一致时将此聚类个数作为最佳聚类个数;
S55、寻找最佳聚类个数下的最优K值,进而确定最优MinPts和Eps参数。
7.根据权利要求1所述的海量数据下基于多能源协同企业能耗动态标准库构建方法,其特征在于,
步骤S5中采用适合数据集的参数MinPts和Eps进行聚类分析,具体步骤如下:
S501、定义N(p,Eps)为以点p为圆心Eps为半径的圆内数据点的个数,计算N(p,Eps)值判断该店是否为核心点,如果N(p,Eps)>=MinPts,该点为核心点;
S502、如果N(p,Eps)<MinPts,且在其他核点圆形区域内,则属于边缘点;
S503、如果既不是核点又不是边缘点,则为离群点;
S504、重复步骤S501-S503,直到所有点都有明确分类。
8.根据权利要求1所述的海量数据下基于多能源协同企业能耗动态标准库构建方法,其特征在于,
步骤S6中将自适应DBSCAN聚类后的数据分为主簇和副簇,选择包含数据点数最多的簇作为主簇,并将主簇作为动态标准区间的主体;
采用簇心扩展法选定动态标准区间的上下限;通过定义指标判断两簇之间的距离:簇类C1和C2的距离等于两个簇类所有样本对距离平方和的平均:
企业能耗动态标准区间的上下限选取方式为:
式中mcmax为主簇上界,mcmin为主簇下界,Cm、Cu和Cl分别为主簇、上簇、下簇,dist(Cm,Cu)为主簇与上簇的簇间距,dist(Cm,Cl)为主簇和下簇的簇间距,nm、nu、nl分别为主簇、上簇、下簇数据个数。
9.根据权利要求1所述的海量数据下基于多能源协同企业能耗动态标准库构建方法,其特征在于,
步骤S7中将企业能耗进行场景合,并按企业工序进行异常判断,具体包括如下步骤:
S71、将所有场景分别进行聚类分析并获得相对应的动态标准区间,将区间内数值由小到大排列,记作Ni[a1,a2]形式;
其中a1为场景标准区间能耗最小值,a2为场景标准区间能耗最大值,i为场景标号;
S72、随机挑选一个场景N11与N1i进行比较,N1i为除N10外的所有场景数据,计算N1i与N11区间相似度,公式如下:
S73、遍历所有N1i求得区间相似度sim,设置相似度阈值λ=0.8,挑选sim>λ的场景;
S74、将挑选出来的场景进行众数及最值比对,剔除比对结果较差的场景;
S75、重复步骤S71-S74,直到所有场景比对完毕。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210176806.0A CN115936291A (zh) | 2022-02-24 | 2022-02-24 | 海量数据下基于多能源协同企业能耗动态标准库构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210176806.0A CN115936291A (zh) | 2022-02-24 | 2022-02-24 | 海量数据下基于多能源协同企业能耗动态标准库构建方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115936291A true CN115936291A (zh) | 2023-04-07 |
Family
ID=86699628
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210176806.0A Pending CN115936291A (zh) | 2022-02-24 | 2022-02-24 | 海量数据下基于多能源协同企业能耗动态标准库构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115936291A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117236522A (zh) * | 2023-11-10 | 2023-12-15 | 四川智源能诚售电有限公司 | 一种电力能耗管理方法、系统、电子设备及介质 |
-
2022
- 2022-02-24 CN CN202210176806.0A patent/CN115936291A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117236522A (zh) * | 2023-11-10 | 2023-12-15 | 四川智源能诚售电有限公司 | 一种电力能耗管理方法、系统、电子设备及介质 |
CN117236522B (zh) * | 2023-11-10 | 2024-02-13 | 四川智源能诚售电有限公司 | 一种电力能耗管理方法、系统、电子设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111199016B (zh) | 一种基于DTW的改进K-means的日负荷曲线聚类方法 | |
CN110781332A (zh) | 基于复合聚类算法的电力居民用户日负荷曲线聚类方法 | |
CN111724278A (zh) | 一种面向电力多元负荷用户的精细分类方法及系统 | |
CN109657891B (zh) | 一种基于自适应k-means++算法的负荷特性分析方法 | |
CN111415192A (zh) | 基于大数据的用户用水性质预测方法 | |
CN115936291A (zh) | 海量数据下基于多能源协同企业能耗动态标准库构建方法 | |
CN115618249A (zh) | 一种基于LargeVis降维与DBSCAN聚类的低压配电台区相位识别方法 | |
CN116821832A (zh) | 针对高压工商业用户用电负荷的异常数据辨识与修正方法 | |
CN114004271A (zh) | 一种基于树状基学习器的混合特征数据聚类方法及系统 | |
CN117113126A (zh) | 一种基于改进聚类算法的行业用电特性分析方法 | |
CN112001441A (zh) | 一种基于Kmeans-AHC混合聚类算法的配电网线损异常检测方法 | |
CN113112177A (zh) | 一种基于混合指标的台区线损处理方法及系统 | |
CN111914930A (zh) | 一种基于自适应微簇融合的密度峰值聚类方法 | |
CN114219245B (zh) | 基于大数据的乡村电力指数评价方法、装置及存储介质 | |
Wang et al. | Analysis of user’s power consumption behavior based on k-means | |
CN113780686A (zh) | 一种面向分布式电源的虚拟电厂运行方案优化方法 | |
Shen et al. | A Novel AI-based Method for EV Charging Load Profile Clustering | |
CN112560947A (zh) | 基于能源供需结构分析的聚类方法及装置 | |
CN111598357A (zh) | 基于容量利用小时数和高斯分布的月度用电量预测方法 | |
Liu et al. | Power data sampling model based on multi-layer sensing and prediction | |
CN113609303B (zh) | 一种基于知识图谱的国内外电力市场研究热点追踪方法 | |
CN111553413B (zh) | 一种基于粗糙集的用户用电行为聚类结果评价方法 | |
CN112836926B (zh) | 基于电力大数据的企业经营状况评估方法 | |
CN114417972A (zh) | 一种基于主成分分析和密度峰值聚类的用户用电行为分析方法 | |
CN114565401A (zh) | 影响家庭用户以电代气能源减碳业务开展的多重因素分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |