CN115081515A - 能效评价模型构建方法、装置、终端及存储介质 - Google Patents

能效评价模型构建方法、装置、终端及存储介质 Download PDF

Info

Publication number
CN115081515A
CN115081515A CN202210620204.XA CN202210620204A CN115081515A CN 115081515 A CN115081515 A CN 115081515A CN 202210620204 A CN202210620204 A CN 202210620204A CN 115081515 A CN115081515 A CN 115081515A
Authority
CN
China
Prior art keywords
energy efficiency
factor
model
evaluation
initial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210620204.XA
Other languages
English (en)
Inventor
任鹏
孙胜博
申洪涛
陶鹏
张洋瑞
高波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
Marketing Service Center of State Grid Hebei Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
Marketing Service Center of State Grid Hebei Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, Marketing Service Center of State Grid Hebei Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN202210620204.XA priority Critical patent/CN115081515A/zh
Publication of CN115081515A publication Critical patent/CN115081515A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/80Management or planning
    • Y02P90/82Energy audits or management systems therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及能源技术领域,尤其涉及一种能效评价模型构建方法、装置、终端及存储介质,本发明方法首先获取评价目标的分类,然后,根据分类,确定评价目标的相关因素,接着,根据相关因素,获取多个数据样本。再接着,将多个数据样本输入至初始模型,对初始模型进行训练,直至初始模型的输出与能效偏差小于阈值。最后,固定初始模型的参数,作为能效评价模型。整个方法首先确定目标主体的分类,基于分类确定相关因素,因此,可以不必获取那些相关性不高的参量,减小模型构建的复杂程度,削减了无关因素对模型构建的影响,通过已有数据构建、训练模型,其构建方式简单,模型输出的能效准确度高。

Description

能效评价模型构建方法、装置、终端及存储介质
技术领域
本发明涉及能源技术领域,尤其涉及一种能效评价模型构建方法、装置、终端及存储介质。
背景技术
节能提效、绿色发展成为世界各国国民经济和社会发展的重要任务,是培育发展新动能、提升绿色竞争力的重点举措,还是经济社会健康可持续发展、改善生态环境质量的重要支撑。助力社会节能环保、绿色生态环境健康发展,降低社会整体碳排放量和碳排放强度的呼声日益高涨。坚决遏制高耗能、高排放、低水平项目盲目发展,推动能耗向碳排放总量和强度转变,完善减污降碳激励约束,加快形成绿色生产生活方式,是能源战略中重要的一环。
能效分析工作在实际运行中,存在重点用能单位计量种类单一、采用人工分析时普通管理者分析能力有限和专业诊断人员不足等问题,造成能效数据采集缺失、堆砌等质量不高等情况,无法从数据中准确及时挖掘隐含信息,难以准确及时发现高耗能点,且无法给出节能的建设性建议,未发挥出用电信息采集系统分钟级采集的效果,最终无法满足为用户准确提供节能降耗方案的效果。
目前,现有的重点能效用户能效分析方法存在着如下问题:
1、例如传统的近邻聚类算法更多适用于长期存在的故障(以周、月为计算单位),在利用余弦相似性和欧几里得距离相似性后,依然存在此方法更侧重于找出故障原因,且只对发生单一故障才有效等问题,自动诊断能力略显不足。
2、不少研究均未进行实际数据的验证,也存在研究人员仅凭人工分析实测能效数据的现象。
3、对重点耗能用户能效较为成体系的评价指标还只存在于空调中,对其他用能系统和设备的评价尚不完善(意味着在技术上也没有足够完善的评价标准)。
基于此,需要开发设计出一种能效评价模型构建方法,以解决现有技术中,能效评价模型构建不精准,导致能源资源浪费的问题。
发明内容
本发明实施方式提供了一种能效评价模型构建方法、装置、终端及存储介质,用于解决现有技术中能效评价模型不精准的问题。
第一方面,本发明实施方式提供了一种能效评价模型构建方法,包括:
获取评价目标的分类,所述分类用于表征所述评价目标归属的类别;
根据所述分类,确定所述评价目标的相关因素,其中,所述相关因素与所述评价目标的能效相关;
根据所述相关因素,获取多个数据样本,其中,数据样本基于评价目标的相关因素以及能效构建;
将所述多个数据样本输入至初始模型,对所述初始模型进行训练,直至所述初始模型的输出与所述能效偏差小于阈值;
固定所述初始模型的参数,作为能效评价模型。
在一种可能实现的方式中,所述相关因素通过以下步骤确定:
获得多个因子集,其中,因子集包括多个由评价目标的因子和评价目标的能效构成的因子对;
对于每个因子集,根据第一公式确定因子与能效的相关系数,其中,所述第一公式为:
Figure BDA0003674526060000021
式中,ρ为相关系数,cov(X,Y)为协方差,σx为因子的标准差,σy为能效的标准差;
将所述相关系数绝对值高于阈值的因子,作为相关因素。
在一种可能实现的方式中,所述相关因素通过以下步骤确定:
获得多个因子集,其中,因子集包括多个由评价目标的因子和评价目标的能效构成的因子对;
对于每个因子集,根据第二公式确定因子与能效的相关系数,其中,所述第二公式为:
Figure BDA0003674526060000031
式中,ρ为相关系数,n为因子对的数量,di为因子对中因子和能效的排序差,其中,所述排序差为对因子和能效分别按照相同的排序方式排序后,因子和能效的排位差;
将所述相关系数绝对值高于阈值的因子,作为相关因素。
在一种可能实现的方式中,所述根据所述相关因素,获取多个数据样本,包括:
获取多个评价参量集,其中,评价参量集基于评价目标获取,所述评价参量集包括能效以及根据多个所述相关因素获取的参量;
随机选取预设数量的参量集作为初始中心;
归类步骤:对于每个评价参量集,计算与各个初始中心的距离,以及,加入距离最小的初始中心所在的类;
计算每个类的中心作为聚类中心;
若所述聚类中心与所述初始中心的距离大于阈值,则将所述聚类中心作为初始中心,并跳转至所述归类步骤;
否则,将所述聚类中心作为数据样本。
在一种可能实现的方式中,所述对于每个评价参量集,计算与各个初始中心的距离,包括:
对于每个评价参量集,根据第三公式计算与各个初始中心的距离,所述第三公式为:
Figure BDA0003674526060000041
式中,d(x,y)为评价参量集与初始中心的距离,m为参量的数量,xi为评价参量集的参量,yi为初始中心的参量,ρi为参量对应相关因素的相关系数,xm+1为评价参量集的能效,ym+1为初始中心的能效,ρm+1为相关系数计算公式取值的最大极限。
在一种可能实现的方式中,所述初始模型基于神经网络模型构建,包括:
输入层、全连接的中间层以及输出层;
其中,中间层的激活函数为:
Figure BDA0003674526060000042
式中,f(h)为激活函数,a为大于0且小于1的常数,h为激活函数的输入。
在一种可能实现的方式中,所述将所述多个数据样本输入至初始模型,对所述初始模型进行训练,直至所述初始模型的输出与所述能效偏差小于阈值,包括:
对所述数据样本进行预处理获得输入变量以及标签,其中,所述预处理用于调整数据样本中各个参量的权重,所述标签用于表征对应参量的能效;
输入步骤:将多个所述输入变量输入至初始模型,获取所述初始模型的输出;
根据所述输出以及所述标签,确定残差;
若所述残差大于阈值,则采用反向传播算法,更新所述初始模型中各个节点的权重参数并跳转至所述输入步骤;
其中,所述对所述数据样本进行预处理,包括:
对每个所述数据样本进行如下处理:
将数据样本的能效做为数据样本的标签;
根据数据样本的每个参量以及第四公式生成所述输入变量,所述第四公式为:
x′=x
式中,x′为输入变量,ρ为参量对应相关因素的相关系数,x为参量。
第二方面,本发明实施方式提供了一种能效评价模型构建装置,包括:
类别确定模块,用于获取评价目标的分类,所述分类用于表征所述评价目标归属的类别;
相关因素确定模块,用于根据所述分类,确定所述评价目标的相关因素,其中,所述相关因素与所述评价目标的能效相关;
数据样本获取模块,用于根据所述相关因素,获取多个数据样本,其中,数据样本基于评价目标的相关因素以及能效构建;
模型训练模块,用于将所述多个数据样本输入至初始模型,对所述初始模型进行训练,直至所述初始模型的输出与所述能效偏差小于阈值;
以及,
定型模块,用于固定所述初始模型的参数,作为能效评价模型。
第三方面,本发明实施方式提供了一种终端,包括存储器以及处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上第一方面或第一方面的任一种可能的实现方式所述方法的步骤。
第四方面,本发明实施方式提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上第一方面或第一方面的任一种可能的实现方式所述方法的步骤。
本发明实施方式与现有技术相比存在的有益效果是:
本发明实施方式公开了的一种能效评价模型构建方法,其首先获取评价目标的分类,然后,根据分类,确定评价目标的相关因素,接着,根据相关因素,获取多个数据样本。再接着,将多个数据样本输入至初始模型,对初始模型进行训练,直至初始模型的输出与能效偏差小于阈值。最后,固定初始模型的参数,作为能效评价模型。整个方法首先确定目标主体的分类,基于分类确定相关因素,因此,可以不必获取那些相关性不高的参量,减小模型构建的复杂程度,削减了无关因素对模型构建的影响,基于相关因素构建模型,并通过相关因素训练、调整模型参数,最终实现模型构建的方式,可以不必关心相关因素与能效之间的关系式,而构建出复杂逻辑关系式,通过已有数据构建、训练模型,其构建方式简单,模型输出的能效准确度高。
附图说明
为了更清楚地说明本发明实施方式中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施方式提供的能效评价模型构建方法的流程图;
图2是本发明实施方式提供的能效评价模型构建装置功能框图;
图3是本发明实施方式提供的终端功能框图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施方式。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施方式中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图通过具体实施方式来进行说明。
下面对本发明的实施例作详细说明,本实例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
图1为本发明实施方式提供的能效评价模型构建方法的流程图。
如图1所示,其示出了本发明实施方式提供的能效评价模型构建方法的实现流程图,详述如下:
在步骤101中,获取评价目标的分类,所述分类用于表征所述评价目标归属的类别。
在步骤102中,根据所述分类,确定所述评价目标的相关因素,其中,所述相关因素与所述评价目标的能效相关。
在一些实施方式中,所述相关因素通过以下步骤确定:
获得多个因子集,其中,因子集包括多个由评价目标的因子和评价目标的能效构成的因子对;
对于每个因子集,根据第一公式确定因子与能效的相关系数,其中,所述第一公式为:
Figure BDA0003674526060000071
式中,ρ为相关系数,cov(X,Y)为协方差,σx为因子的标准差,σy为能效的标准差;
将所述相关系数绝对值高于阈值的因子,作为相关因素。
在一些实施方式中,所述相关因素通过以下步骤确定:
获得多个因子集,其中,因子集包括多个由评价目标的因子和评价目标的能效构成的因子对;
对于每个因子集,根据第二公式确定因子与能效的相关系数,其中,所述第二公式为:
Figure BDA0003674526060000072
式中,ρ为相关系数,n为因子对的数量,di为因子对中因子和能效的排序差,其中,所述排序差为对因子和能效分别按照相同的排序方式排序后,因子和能效的排位差;
将所述相关系数绝对值高于阈值的因子,作为相关因素。
示例性地,能效受多种可能的因素影响,构建表达式表达因素与能效之间的关系,其工作量庞大,且精准度确不高。
例如,对于一个用电设备,其能效除受设计上的因素,如用电设备的各部分尺寸、材料的影响外,还可能跟外界条件有关,例如,环境温度、负荷率、电源质量。对不同的用电设备,统一建立一个包含所有可知的影响因素的模型,显然,既加大了数据获取的工作量,又增加了模型构建的难度和复杂程度。
因此,有必要针对不同类别的目标,获取不同的影响因素,根据这些影响因素构建模型,可以明显的降低模型的复杂程度和数据获取的种类、数量。
例如,对于制冷设备,其能效跟环境温度负相关,且相关性很强,环境温度越低,制冷效果越好,能效越高。而对于电机类产品,如果电机类产品工作在满负荷状态,那么效率就接近设计的效率,也就是能效主要和负载率有关,环境对能效的影响不是那么大。
由此可见,对于不同类的产品选择不同的因素,是十分有必要的。然而,一旦影响因素确定下来,不同类的产品就可以通过一个共用的模板模型,在这个共用的模板模型上,调整模板的参量,从而实现根据产品分门别类的构建不同的模型。
分类方式上多数产品有很多种现有的经验可以借鉴,例如,同步电机可以额归入到直流电机类,电加热设备可以归入到电加热设备类。而对于一些新产品,基本就属于无监督类分类方式了,具体来说,就是根据产品各种属性,找到与之相似的点,然后,根据相似点划分到最接近的类别。
在确定了分类后,一个重要的步骤就是选择这个类相关的因素,也就是主要影响这类产品能效的因素。
一种实施方式为采用皮尔逊(Pearson)相关系数确定的方法,具体来说,就是对于某类目标,获取多个样本的能效和因素对,然后根据这些因素对,分别计算能效的标准差和因素的标准差,以及,能效和因素的协方差,然后根据下式,就可以获得能效和因素的相关系数:
Figure BDA0003674526060000091
式中,ρ为相关系数,cov(X,Y)为协方差,σx为因子的标准差,σy为能效的标准差;
对每个因素均获得了相关系数后,保留那些相关系数较高的因素,作为相关因素,而那些相关性不强或者不相关的因素,就被舍弃。
采用皮尔逊相关系数需要首先将因素量化,还要符合一定的条件,例如,数据需要符合正态分布,只有符合预定条件后,方能通过上述公式计算相关系数。
然而,事实上,有些因素不容易被量化,例如,气味的难闻程度,人们可以将其按照从最乐意接受到最难接受分出若干层级,确不能将其量化,这时就需要采用另一种统计相关性的计算方法,斯皮尔曼(Spearman)相关系数确定方法,具体的操作上来说,就是对因素和能效,按照预定的顺序,例如,从小到大的顺序进行排列,因为因素和能效构成数据对,那么数据对中因素和能效两者之间的排序差就可以很容易的获得,根据下式就可以确定相关系数。
Figure BDA0003674526060000092
式中,ρ为相关系数,n为因子对的数量,di为因子对中因子和能效的排序差,其中,所述排序差为对因子和能效分别按照相同的排序方式排序后,因子和能效的排位差。
因此,经过上述步骤,就确定了那些对能效等级有影响的因素。
在步骤103中,根据所述相关因素,获取多个数据样本,其中,数据样本基于评价目标的相关因素以及能效构建。
在一些实施方式中,步骤103包括:
获取多个评价参量集,其中,评价参量集基于评价目标获取,所述评价参量集包括能效以及根据多个所述相关因素获取的参量。
随机选取预设数量的参量集作为初始中心。
归类步骤:对于每个评价参量集,计算与各个初始中心的距离,以及,加入距离最小的初始中心所在的类。
计算每个类的中心作为聚类中心。
若所述聚类中心与所述初始中心的距离大于阈值,则将所述聚类中心作为初始中心,并跳转至所述归类步骤。
否则,将所述聚类中心作为数据样本。
在一些实施方式中,所述对于每个评价参量集,计算与各个初始中心的距离,包括:
对于每个评价参量集,根据第三公式计算与各个初始中心的距离,所述第三公式为:
Figure BDA0003674526060000101
式中,d(x,y)为评价参量集与初始中心的距离,m为参量的数量,xi为评价参量集的参量,yi为初始中心的参量,ρi为参量对应相关因素的相关系数,xm+1为评价参量集的能效,ym+1为初始中心的能效,ρm+1为相关系数计算公式取值的最大极限。
示例性地,我们总期望获得的样本够多,以确保最终确定模型的精度足够高,然而,数据越多,带来的数据处理过程的烦恼也随之剧增,因此,有必要对数据进行处理,在尽量少的数据的情况下,保留原数据的精度。
一种可行的方式为采用聚类算法,获取多个样本的聚类中心,然后,基于聚类中心构建模型,显然,聚类中心能代表聚类中心周边的数据,却降低了数据总数量。
一种聚类算法就是先确定聚类后的数量,也就是期望降低到的数据总量,例如,聚类前数据总量为k,如果预设的聚类中心数量是j(很显然j小于k),那么,消减掉的数据量就是k-j,聚类中心数量越少,消减掉的数据就越多。
在获取到消减后的数据量后,根据消减后数据量随机抽取参量集作为初始中心,例如,抽取了j个参量集作为初始中心,然后,对于每个参量集分别归类到这j个中最近的一个类中,在划分好类以后,计算类的中心作为聚类中心,如果初始中心与聚类中心距离大于预设值,则将聚类中心作为初始中心,再次执行归类、计算聚类中心操作,直到聚类中心与初始中心距离小于预设值,此时,聚类中心就可以作为数据的样本。
在计算参量集与初始中心的距离的方式上,一种计算方式如下式:
Figure BDA0003674526060000111
式中,d(x,y)为评价参量集与初始中心的距离,m为参量的数量,xi为评价参量集的参量,yi为初始中心的参量,ρi为参量对应相关因素的相关系数,xm+1为评价参量集的能效,ym+1为初始中心的能效,ρm+1为相关系数计算公式取值的最大极限。
我们可以看出,这个计算公式首先有个权重项-相关系数,对于相关系数绝对值大的参量,其计算距离的权重也就越大,这样就能更好的体现重要的参量的距离因素,值得说明的是,能效也是参量集的一部分,其计算距离时权重取相关系数计算公式的最大极值,例如采用斯皮尔曼相关系数计算公式的情形,其取数值1。
通过上述步骤,我们就将数据量进行了削减,并保持了足够的数据精度。
在步骤104中,将所述多个数据样本输入至初始模型,对所述初始模型进行训练,直至所述初始模型的输出与所述能效偏差小于阈值。
在一些实施方式中,所述初始模型基于神经网络模型构建,包括:
输入层、全连接的中间层以及输出层;
其中,中间层的激活函数为:
Figure BDA0003674526060000112
式中,f(h)为激活函数,a为大于0且小于1的常数,h为激活函数的输入。
在一些实施方式中,步骤104包括:
对所述数据样本进行预处理获得输入变量以及标签,其中,所述预处理用于调整数据样本中各个参量的权重,所述标签用于表征对应参量的能效。
输入步骤:将多个所述输入变量输入至初始模型,获取所述初始模型的输出。
根据所述输出以及所述标签,确定残差。
若所述残差大于阈值,则采用反向传播算法,更新所述初始模型中各个节点的权重参数并跳转至所述输入步骤。
其中,所述对所述数据样本进行预处理,包括:
对每个所述数据样本进行如下处理:
将数据样本的能效做为数据样本的标签。
根据数据样本的每个参量以及第四公式生成所述输入变量,所述第四公式为:
x′=ρx
式中,x′为输入变量,ρ为参量对应相关因素的相关系数,x为参量。
示例性地,初始模型的一种实施方式为采用神经网络结构,在一些应用场景中,采用BP神经网络模型,其中激活函数充分考虑在反向传播可能存在的梯度消失的可能,激活函数采用:
Figure BDA0003674526060000121
式中,f(h)为激活函数,a为大于0且小于1的常数,h为激活函数的输入
在模型训练上,首先,通过数据样本的预处理,制作输入变量和标签。然后,将输入变量输入到初始模型,获取初始模型的输出,根据输出和标签确定的残差,通过反向传播算法,更新初始模型各个神经元节点的权重参数,然后再次进行输入变量输入到初始模型的操作,如果残差小于预设值,那么就可以认为迭代完成。
在输入变量和标签的制作上,一种实施方式是将能效作为标签,将参量与参量对应的相关因素的相关系数的乘积作为输入变量,也即下式所表达的:
x′=ρx
式中,x′为输入变量,ρ为参量对应相关因素的相关系数,x为参量。
在步骤105中,固定所述初始模型的参数,作为能效评价模型。
示例性地,在经过迭代后,初始模型的输出与标签偏差小于阈值,即说明初始模型训练结束,模型构建完成。
本发明能效评价模型构建方法实施方式,其首先获取评价目标的分类,分类用于表征评价目标归属的类别,然后,根据分类,确定评价目标的相关因素,接着,根据相关因素,获取多个数据样本。再接着,将多个数据样本输入至初始模型,对初始模型进行训练,直至初始模型的输出与能效偏差小于阈值。最后,固定初始模型的参数,作为能效评价模型。整个方法首先确定目标主体的分类,基于分类确定相关因素,因此,可以不必获取那些相关性不高的参量,减小模型构建的复杂程度,削减了无关因素对模型构建的影响,基于相关因素构建模型,并通过相关因素训练、调整模型参数,最终实现模型构建的方式,可以不必关心相关因素与能效之间的关系式,而构建出复杂逻辑关系式,通过已有数据构建、训练模型,其构建方式简单,模型输出的能效准确度高。
应理解,上述实施方式中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施方式的实施过程构成任何限定。
以下为本发明的装置实施方式,对于其中未详尽描述的细节,可以参考上述对应的方法实施方式。
图2是本发明实施方式提供的能效评价模型构建装置功能框图,参照图2,能效评价模型构建装置2包括:类别确定模块201、相关因素确定模块202、数据样本获取模块203、模型训练模块204以及定型模块205。
类别确定模块201,用于获取评价目标的分类,所述分类用于表征所述评价目标归属的类别;
相关因素确定模块202,用于根据所述分类,确定所述评价目标的相关因素,其中,所述相关因素与所述评价目标的能效相关;
数据样本获取模块203,用于根据所述相关因素,获取多个数据样本,其中,数据样本基于评价目标的相关因素以及能效构建;
模型训练模块204,用于将所述多个数据样本输入至初始模型,对所述初始模型进行训练,直至所述初始模型的输出与所述能效偏差小于阈值;
定型模块205,用于固定所述初始模型的参数,作为能效评价模型。
图3是本发明实施方式提供的终端的功能框图。如图3所示,该实施方式的终端3包括:处理器300和存储器301,所述存储器301中存储有可在所述处理器300上运行的计算机程序302。所述处理器300执行所述计算机程序302时实现上述各个能效评价模型构建方法及实施方式中的步骤,例如图1所示的步骤101至步骤105。
示例性的,所述计算机程序302可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器301中,并由所述处理器300执行,以完成本发明。
所述终端3可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端3可包括,但不仅限于,处理器300、存储器301。本领域技术人员可以理解,图3仅仅是终端3的示例,并不构成对终端3的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端还可以包括输入输出设备、网络接入设备、总线等。
所称处理器300可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器301可以是所述终端3的内部存储单元,例如终端3的硬盘或内存。所述存储器301也可以是所述终端3的外部存储设备,例如所述终端3上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字卡(Secure Digital,SD),闪存卡(Flash Card)等。进一步地,所述存储器301还可以既包括所述终端3的内部存储单元也包括外部存储设备。所述存储器301用于存储所述计算机程序以及所述终端所需的其他程序和数据。所述存储器301还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施方式中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施方式中的对应过程,在此不再赘述。
在上述实施方式中,对各个实施方式的描述都各有侧重,某个实施方式中没有详述或记载的部分,可以参见其它实施方式的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施方式描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施方式中,应该理解到,所揭露的装置/终端和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端实施方式仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
另外,在本发明各个实施方式中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施方式方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个能效评价模型构建方法及能效评价模型构建装置实施方式的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、电载波信号、电信信号以及软件分发介质等。
以上所述实施方式仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施方式对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施方式技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种能效评价模型构建方法,其特征在于,包括:
获取评价目标的分类,所述分类用于表征所述评价目标归属的类别;
根据所述分类,确定所述评价目标的相关因素,其中,所述相关因素与所述评价目标的能效相关;
根据所述相关因素,获取多个数据样本,其中,数据样本基于评价目标的相关因素以及能效构建;
将所述多个数据样本输入至初始模型,对所述初始模型进行训练,直至所述初始模型的输出与所述能效偏差小于阈值;
固定所述初始模型的参数,作为能效评价模型。
2.根据权利要求1所述的能效评价模型构建方法,其特征在于,所述相关因素通过以下步骤确定:
获得多个因子集,其中,因子集包括多个由评价目标的因子和评价目标的能效构成的因子对;
对于每个因子集,根据第一公式确定因子与能效的相关系数,其中,所述第一公式为:
Figure FDA0003674526050000011
式中,ρ为相关系数,cov(X,Y)为协方差,σx为因子的标准差,σy为能效的标准差;
将所述相关系数绝对值高于阈值的因子,作为相关因素。
3.根据权利要求1所述的能效评价模型构建方法,其特征在于,所述相关因素通过以下步骤确定:
获得多个因子集,其中,因子集包括多个由评价目标的因子和评价目标的能效构成的因子对;
对于每个因子集,根据第二公式确定因子与能效的相关系数,其中,所述第二公式为:
Figure FDA0003674526050000021
式中,ρ为相关系数,n为因子对的数量,di为因子对中因子和能效的排序差,其中,所述排序差为对因子和能效分别按照相同的排序方式排序后,因子和能效的排位差;
将所述相关系数绝对值高于阈值的因子,作为相关因素。
4.根据权利要求2或3所述的能效评价模型构建方法,其特征在于,所述根据所述相关因素,获取多个数据样本,包括:
获取多个评价参量集,其中,评价参量集基于评价目标获取,所述评价参量集包括能效以及根据多个所述相关因素获取的参量;
随机选取预设数量的参量集作为初始中心;
归类步骤:对于每个评价参量集,计算与各个初始中心的距离,以及,加入距离最小的初始中心所在的类;
计算每个类的中心作为聚类中心;
若所述聚类中心与所述初始中心的距离大于阈值,则将所述聚类中心作为初始中心,并跳转至所述归类步骤;
否则,将所述聚类中心作为数据样本。
5.根据权利要求4所述的能效评价模型构建方法,其特征在于,所述对于每个评价参量集,计算与各个初始中心的距离,包括:
对于每个评价参量集,根据第三公式计算与各个初始中心的距离,所述第三公式为:
Figure FDA0003674526050000022
式中,d(x,y)为评价参量集与初始中心的距离,m为参量的数量,xi为评价参量集的参量,yi为初始中心的参量,ρi为参量对应相关因素的相关系数,xm+1为评价参量集的能效,ym+1为初始中心的能效,ρm+1为相关系数计算公式取值的最大极限。
6.根据权利要求1-3任一项所述的能效评价模型构建方法,其特征在于,所述初始模型基于神经网络模型构建,包括:
输入层、全连接的中间层以及输出层;
其中,中间层的激活函数为:
Figure FDA0003674526050000031
式中,f(h)为激活函数,a为大于0且小于1的常数,h为激活函数的输入。
7.根据权利要求4所述的能效评价模型构建方法,其特征在于,所述将所述多个数据样本输入至初始模型,对所述初始模型进行训练,直至所述初始模型的输出与所述能效偏差小于阈值,包括:
对所述数据样本进行预处理获得输入变量以及标签,其中,所述预处理用于调整数据样本中各个参量的权重,所述标签用于表征对应参量的能效;
输入步骤:将多个所述输入变量输入至初始模型,获取所述初始模型的输出;
根据所述输出以及所述标签,确定残差;
若所述残差大于阈值,则采用反向传播算法,更新所述初始模型中各个节点的权重参数并跳转至所述输入步骤;
其中,所述对所述数据样本进行预处理,包括:
对每个所述数据样本进行如下处理:
将数据样本的能效做为数据样本的标签;
根据数据样本的每个参量以及第四公式生成所述输入变量,所述第四公式为:
x′=ρx
式中,x′为输入变量,ρ为参量对应相关因素的相关系数,x为参量。
8.一种能效评价模型构建装置,其特征在于,包括:
类别确定模块,用于获取评价目标的分类,所述分类用于表征所述评价目标归属的类别;
相关因素确定模块,用于根据所述分类,确定所述评价目标的相关因素,其中,所述相关因素与所述评价目标的能效相关;
数据样本获取模块,用于根据所述相关因素,获取多个数据样本,其中,数据样本基于评价目标的相关因素以及能效构建;
模型训练模块,用于将所述多个数据样本输入至初始模型,对所述初始模型进行训练,直至所述初始模型的输出与所述能效偏差小于阈值;
以及,
定型模块,用于固定所述初始模型的参数,作为能效评价模型。
9.一种终端,包括存储器以及处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上的权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上的权利要求1至7中任一项所述方法的步骤。
CN202210620204.XA 2022-06-01 2022-06-01 能效评价模型构建方法、装置、终端及存储介质 Pending CN115081515A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210620204.XA CN115081515A (zh) 2022-06-01 2022-06-01 能效评价模型构建方法、装置、终端及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210620204.XA CN115081515A (zh) 2022-06-01 2022-06-01 能效评价模型构建方法、装置、终端及存储介质

Publications (1)

Publication Number Publication Date
CN115081515A true CN115081515A (zh) 2022-09-20

Family

ID=83249638

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210620204.XA Pending CN115081515A (zh) 2022-06-01 2022-06-01 能效评价模型构建方法、装置、终端及存储介质

Country Status (1)

Country Link
CN (1) CN115081515A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116432908A (zh) * 2023-04-18 2023-07-14 国网河北省电力有限公司雄安新区供电公司 近零碳园区的碳核算方法、装置、终端及存储介质
CN116842327A (zh) * 2023-05-18 2023-10-03 中国地质大学(北京) 资源量评价中异常数据的处理方法、装置及设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116432908A (zh) * 2023-04-18 2023-07-14 国网河北省电力有限公司雄安新区供电公司 近零碳园区的碳核算方法、装置、终端及存储介质
CN116842327A (zh) * 2023-05-18 2023-10-03 中国地质大学(北京) 资源量评价中异常数据的处理方法、装置及设备
CN116842327B (zh) * 2023-05-18 2024-05-10 中国地质大学(北京) 资源量评价中异常数据的处理方法、装置及设备

Similar Documents

Publication Publication Date Title
CN107766929B (zh) 模型分析方法及装置
CN110458187B (zh) 一种恶意代码家族聚类方法和系统
CN115081515A (zh) 能效评价模型构建方法、装置、终端及存储介质
CN108345908A (zh) 电网数据的分类方法、分类设备及存储介质
CN105786711A (zh) 一种数据分析的方法及装置
CN110310012B (zh) 数据分析方法、装置、设备及计算机可读存储介质
CN111537884A (zh) 获取动力电池寿命数据的方法、装置、计算机设备及介质
CN116187835A (zh) 一种基于数据驱动的台区理论线损区间估算方法及系统
CN114676749A (zh) 一种基于数据挖掘的配电网运行数据异常判定方法
CN116128544A (zh) 一种电力营销异常营业数据的主动稽核方法和系统
CN108830302B (zh) 一种图像分类方法、训练方法、分类预测方法及相关装置
CN110472659A (zh) 数据处理方法、装置、计算机可读存储介质和计算机设备
CN117435489A (zh) 基于需求文档自动分析软件功能点方法及系统
US20230419195A1 (en) System and Method for Hierarchical Factor-based Forecasting
CN113919449B (zh) 基于精准模糊聚类算法的居民电力数据聚类方法及装置
CN114282657A (zh) 一种市场数据长期预测模型训练方法、装置、设备及存储介质
CN109241146A (zh) 集群环境下的学生智助方法和系统
CN114742599A (zh) 一种基于自训练的用户价值分层方法、装置、存储介质及设备
CN113705920A (zh) 火电厂用水数据样本集的生成方法和终端设备
CN105654112B (zh) 一种高效的物联网标识编码划分方法
CN114462901B (zh) 有源配电网电能质量评价方法、装置、终端及存储介质
CN118070134B (zh) 一种园区内用户用电能耗预测方法及系统
CN118690891A (zh) 一种基于可解释模型的学生成绩预测系统方法及相关设备
Laihanen Distribution-based Subpopulation Framework and on Its Applications in the Aviation Industry
CN118537057A (zh) 基于大数据的电力需求预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination