CN116050507A - 一种二氧化碳排放监测方法与系统 - Google Patents

一种二氧化碳排放监测方法与系统 Download PDF

Info

Publication number
CN116050507A
CN116050507A CN202310092735.0A CN202310092735A CN116050507A CN 116050507 A CN116050507 A CN 116050507A CN 202310092735 A CN202310092735 A CN 202310092735A CN 116050507 A CN116050507 A CN 116050507A
Authority
CN
China
Prior art keywords
domain
data
domain data
carbon dioxide
discriminator
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310092735.0A
Other languages
English (en)
Other versions
CN116050507B (zh
Inventor
黄涛
马大卫
陈剑
王正风
李梓楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei Zhongke Liheng Intelligent Technology Co ltd
Electric Power Research Institute of State Grid Anhui Electric Power Co Ltd
Original Assignee
Hefei Zhongke Liheng Intelligent Technology Co ltd
Electric Power Research Institute of State Grid Anhui Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei Zhongke Liheng Intelligent Technology Co ltd, Electric Power Research Institute of State Grid Anhui Electric Power Co Ltd filed Critical Hefei Zhongke Liheng Intelligent Technology Co ltd
Priority to CN202310092735.0A priority Critical patent/CN116050507B/zh
Publication of CN116050507A publication Critical patent/CN116050507A/zh
Application granted granted Critical
Publication of CN116050507B publication Critical patent/CN116050507B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/80Management or planning
    • Y02P90/84Greenhouse gas [GHG] management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Development Economics (AREA)
  • Biophysics (AREA)
  • General Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Educational Administration (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明的一种二氧化碳排放监测方法与系统,其方法包括以下步骤,对源域和目标域数据进行采集,得到有标签的源域数据以及无标签的目标域数据;对源域数据和目标域数据进行归一化处理;采用双流结构构建二氧化碳排放监测模型;对二氧化碳排放监测模型进行训练和测试;采用测试好的二氧化碳排放监测模型进行二氧化碳排放监测。而本发明基于深度无监督迁移学习方法可以在缺少目标域标签的情况下训练出模型。与传统的对抗式领域自适应方法相比,本发明采用双流结构,同时关注边缘分布差异的影响和条件分布的差异,通过平衡因子表示特征可迁移性与可分性的相对重要性。

Description

一种二氧化碳排放监测方法与系统
技术领域
本发明涉及二氧化碳浓度监测技术领域,具体涉及一种二氧化碳排放监测方法与系统。
背景技术
碳中和的一个有效途径是碳交易,而碳交易的前提是准确的碳监测。对于不同型号的碳排放设备,碳排放数据的数据分布可能会发生很大变化,所以根据随机采集的训练样本直接构建的二氧化碳浓度预测模型的泛化性较差,从而将导致训练过程中采用的训练样本集与预测过程中的预测样本集在数据分布上存在较大差异,影响二氧化碳浓度预测的准确度。
发明内容
本发明提出的一种二氧化碳排放监测方法,可至少解决上述技术问题之一。
为实现上述目的,本发明采用了以下技术方案:
一种二氧化碳排放监测方法,包括以下步骤,
对源域和目标域数据进行采集,得到有标签的源域数据以及无标签的目标域数据;
对源域数据和目标域数据进行归一化处理;
采用双流结构构建二氧化碳排放监测模型;
对二氧化碳排放监测模型进行训练和测试;
采用测试好的二氧化碳排放监测模型进行二氧化碳排放监测。
进一步的,对源域和目标域数据进行采集,得到有标签的源域数据以及无标签的目标域数据;具体包括,
获取第一碳排放设备对应的第一碳排放数据和第二碳排放设备对应的第二碳排放数据,其中,所述第一碳排放设备和所述第二碳排放设备的型号不同;以第一碳排放设备作为源域数据,第二碳排放设备作为目标域数据;对源域和目标域数据进行采集,得到有标签的源域数据<Xs,Ys>以及无标签的目标域数据Xt,其中X表示数据,Y表示其对应标签。
进一步的,所述采用双流结构构建二氧化碳排放监测模型,具体包括,
所述二氧化碳排放监测模型包括两个特征提取神经网络G1,G2;两个标签分类器C1,C2,C1为初级分类器,C2为终极分类器;一个对抗领域鉴别器D,其中D包括全局鉴别器Gd和局部鉴别器
Figure BDA0004070825950000021
k=1,2,…,K,K为数据类别数;以及分布差异显式度量模块,模型搭建的方法如下:
S31、选择设定的网络作为特征提取器,将有标签的源域数据以及无标签的目标域数据输入到G1,G2中,经过G1,G2的输出特征为fs1,ft1,fs2,ft2,其中fs1,ft1分别表示Xs经过G1的输出特征、Xt经过G1输出特征;fs2,ft2分别表示Xs经过G2的输出特征、Xt经过G2输出特征;
S32、采用源域有标签数据进行训练标签分类器,采用交叉熵损失训练,标签分类器损失通用表达式如下:
Figure BDA0004070825950000022
Ds表示源域数据,ns表示源域数据个数,
Figure BDA0004070825950000023
表示Xi属于k类的概率,Cy表示标签分类器,Gf表示特征提取器;
S33、将fs1,ft1作为对抗领域鉴别器D的输入,D通过鉴别输入特征来自源域或目标域;域鉴别器由多层感知机以及Softmax函数构成;将源域数据标记为1,目标域数据标记为0,对于一个样本的输入,输出该样本来自源域或目标域,根据实际结果与预测值计算出领域判别器的损失值;
S34、为平衡其可迁移性与可分性引入一个平衡因子τ:
用基于线性判别分析的鉴别评估方法maxJ(W)来衡量域中类别的可分性,其定义如下:
Figure BDA0004070825950000031
其中,Sb为类间散射矩阵,Sw为类内散射矩阵;进一步将估计值进行归一化处理,得到
Figure BDA0004070825950000032
平衡因子τ定义如下:
Figure BDA0004070825950000033
其中较小的
Figure BDA0004070825950000034
表示更好的域对齐,较小的
Figure BDA0004070825950000035
表示更好的类可鉴别性;
S35、结合上述S31、S32、S33、S34,最终上层结构的损失定义为:
Figure BDA0004070825950000036
其中,τ和ω均为网络自计算出的参数;
S36、在下层结构中,根据最大均值差异方法的优点,选择使用联合分布的希尔伯特空间嵌入来测量两个联合分布P和Q的差异,将一个域中的分布转移到再生核希尔伯特空间RKHS中,通过直接计算RKHS中源域和目标域的MMD距离,得到其联合概率分布损失:
Figure BDA0004070825950000037
PS(xs,ys),PT(xT,yT)分别表示源域和目标域的联合概率分布,
Figure BDA0004070825950000041
分别表示Ds,Dt中第i个数据对应的RKHS中的特征,
Figure BDA0004070825950000042
分别表示Ds,Dt中第i和j个数据对应的类标签。
进一步的,步骤S33中,以交叉熵损失函数训练,则对抗领域鉴别器的损失表示为:
Figure BDA0004070825950000043
x∈Xs∪Xt,m表示一个batch的样本数量,di表示第i个样本的域标签,
Figure BDA0004070825950000044
表示第i个样本经过D的输出,θG1d分别表示G1、D中参数;
其中全局域鉴别器Gd损失表示为:
Figure BDA0004070825950000045
Ds表示源域数据,Dt表示目标域数据,ns,nt分别表示Ds,Dt中数据个数,Lce表示以交叉熵损失作为域分类器的损失函数;
局部域鉴别器细分为K个域鉴别器
Figure BDA0004070825950000046
k=1,2,…,K,每个类鉴别器都负责匹配与类k相关联的源域数据和目标域数据,目标域上的划分根据标签分类器产生的伪标签来进行;局部域鉴别器的损失函数计算为:
Figure BDA0004070825950000047
Figure BDA0004070825950000048
是域鉴别器,
Figure BDA0004070825950000049
是域鉴别器对应的类k的交叉熵损失,
Figure BDA00040708259500000410
是Xi被预测为k类的概率分布。
进一步的,步骤S33中使用
Figure BDA00040708259500000411
来衡量域鉴别器的重要性,包括将全局域鉴别器的全局
Figure BDA00040708259500000412
表示为:
Figure BDA00040708259500000413
局部域鉴别器的局部
Figure BDA00040708259500000414
表示为:
Figure BDA0004070825950000051
Figure BDA0004070825950000052
分别表示源域和目标域中k类的样本,
Figure BDA0004070825950000053
表示k类上的局部子域鉴别器的损失,最终,动态对抗因子ω被表示为:
Figure BDA0004070825950000054
在上述对抗式领域自适应结构中,其最终学习目标表示为:
Figure BDA0004070825950000055
Figure BDA0004070825950000056
分别表示G1,C1,Gd,
Figure BDA0004070825950000057
的参数,其中ω的值通过网络自计算得到。
进一步的,所述对二氧化碳排放监测模型进行训练还包括,
S41、上层结构中,将Xs,Xt作为G1输入,采用对抗性训练来训练G1和D得到最优参数;由于目标域不含标签,则只采用源域数据训练C1,将训练后的C1用于目标域数据类别的预测,C1的输出作为目标域数据的伪标签
Figure BDA0004070825950000058
C1的训练损失如下:
Figure BDA0004070825950000059
结合S35可得到上层结构中的损失:
Figure BDA00040708259500000510
S42、下层结构中将Xs,Xt作为G2的输入,得到经G2提取后的特征Zs,Zt,Zs,Zt分别为Xs,Xt经过G2得到的输出特征;利用<Xs,Ys>,<Zt,
Figure BDA00040708259500000511
>计算Ljmmd
S43、为了整合训练后G1,G2的迁移能力,将Xs通过G1,G2的输出进行融合,并将融合后的特征作为C2的输入进行训练,C2的训练损失表示如下:
Figure BDA0004070825950000061
S44、根据上面S41、S42、S43所述的网络损失,模型的优化目标表示为
Figure BDA0004070825950000062
另一方面,本发明还公开一种计算机可读存储系统,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如上述方法的步骤。
由上述技术方案可知,本发明的二氧化碳排放监测方法与系统,具体为基于深度迁移学习的无监督二氧化碳排放监测方法具有如下优点和效果:在迁移学习过程中目标域数据的标签通常难以获取或获取的代价非常大。用普通的非迁移方法仅仅使用源域有标注数据训练的模型直接用于对目标域进行预测结果往往不能令人满意。而基于深度无监督迁移学习方法可以在缺少目标域标签的情况下训练出模型。与传统的对抗式领域自适应方法相比,本发明采用双流结构,同时关注边缘分布差异的影响和条件分布的差异,通过平衡因子表示特征可迁移性与可分性的相对重要性。
附图说明
图1是本发明的模型原理图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。
本实施例所述的二氧化碳排放监测方法,简单的说包括如下步骤:1)收集数据;
2)数据预处理;
3)模型搭建;
4)模型训练;
5)模型测试。
结合图1以下具体说明:
上述步骤1)获取第一碳排放设备对应的第一碳排放数据和第二碳排放设备对应的第二碳排放数据,其中,所述第一碳排放设备和所述第二碳排放设备的型号不同;以第一碳排放设备作为源域数据,第二碳排放设备作为目标域数据;对源域和目标域数据进行采集,得到有标签的源域数据<Xs,Ys>以及无标签的目标域数据Xt,其中X表示碳排放数据,Y表示其对应标签;以采集电厂的碳排放数据集为例,某个采样时间的温度、湿度、用煤量等数据组成特征向量,一个特征向量即为一个样本X,X为d维的横向量,d表示特征维度,Y是标量,也即为样本对应的标签,表示二氧化碳浓度,通过一段时间的数据收集,可以得到标注样本集合{(xi,yi),i=1,…,n},对不同型号的锅炉进行区分,可以得到对应到每个型号锅炉的标注样本集合。
上述步骤2)包括对源域数据和目标域数据进行归一化处理,本实施例选用常用minmax进行归一化处理,其目的是为了消除原始数据样本中的数量级差异化、数据取值范围不一样、数据趋势不明显等问题对模型训练的影响,同时也能够提高模型精度以及模型训练速度。
上述步骤3)包括以下部分:
模型网络采用双流结构,主要包括两个特征提取神经网络G1,G2;两个标签分类器C1,C2,C1为初级分类器,C2为终极分类器;一个对抗领域鉴别器D,其中D包括全局鉴别器Gd和局部鉴别器
Figure BDA0004070825950000071
k=1,2,…,K,K为数据类别数;以及分布差异显式度量模块,模型搭建的方法如下:
31)选择合适的网络作为特征提取器,将有标签的源域数据以及无标签的目标域数据输入到G1,G2中,经过G1,G2的输出特征为fs1,ft1,fs2,ft2,其中fs1,ft1分别表示Xs经过G1的输出特征、Xt经过G1输出特征;fs2,ft2分别表示Xs经过G2的输出特征、Xt经过G2输出特征;G1、G2可采用Resnet、VGG以及多重CNN网络等。其中,G1和G2使用同一种网络,可以具有不同参数,
32)C1、C2为常规的标签分类器,如神经网络、支持向量机;用于对数据进行分类。采用源域有标签数据进行训练标签分类器,若采用交叉熵损失训练,标签分类器损失通用表达式如下:
Figure BDA0004070825950000081
Ds表示源域数据,ns表示源域数据个数,
Figure BDA0004070825950000082
表示Xi属于k类的概率,Cy表示标签分类器,Gf表示特征提取器。
33)将fs1,ft1作为对抗领域鉴别器D的输入,D通过鉴别输入特征来自源域或目标域从而能够减少源域和目标域数据之间的边缘分布差异;常用的域鉴别器由多层感知机以及Softmax函数构成;将源域数据标记为1,目标域数据标记为0,如对于一个样本的输入,输出该样本来自源域或目标域,根据实际结果与预测值计算出领域判别器的损失值。若以交叉熵损失函数训练,则对抗领域鉴别器的损失可表示为:
Figure BDA0004070825950000083
x∈Xs∪Xt,m表示一个batch的样本数量,di表示第i个样本的域标签,
Figure BDA0004070825950000084
表示第i个样本经过D的输出,θG1d分别表示G1、D中参数。
其中全局域鉴别器Gd损失可表示为:
Figure BDA0004070825950000091
Ds表示源域数据,Dt表示目标域数据,ns,nt分别表示Ds,Dt中数据个数,Lce表示以交叉熵损失作为域分类器的损失函数;
局部域鉴别器细分为K个域鉴别器
Figure BDA0004070825950000092
k=1,2,…,K,每个类鉴别器都负责匹配与类k相关联的源域数据和目标域数据,目标域上的划分根据标签分类器产生的伪标签来进行。局部域鉴别器的损失函数可计算为:
Figure BDA0004070825950000093
Figure BDA0004070825950000094
是域鉴别器,
Figure BDA0004070825950000095
是域鉴别器对应的类k的交叉熵损失,
Figure BDA0004070825950000096
是Xi被预测为k类的概率分布,ns,nt分别表示源域和目标域样本数量。
使用A-distance来衡量域鉴别器的重要性,将全局域鉴别器的全局
Figure BDA0004070825950000097
表示为:
Figure BDA0004070825950000098
局部域鉴别器的局部
Figure BDA0004070825950000099
表示为:
Figure BDA00040708259500000910
Figure BDA00040708259500000915
分别表示源域和目标域中第k类的样本,
Figure BDA00040708259500000916
表示k类上的局部子域鉴别器的损失。最终,动态对抗因子ω被表示为:
Figure BDA00040708259500000911
在上述对抗式领域自适应结构中,其最终学习目标可表示为:
Figure BDA00040708259500000912
Figure BDA00040708259500000913
分别表示G1,C1,Gd,
Figure BDA00040708259500000914
的参数,其中ω的值通过网络自计算得到。
34)域鉴别器保证了特征所包含的可迁移性,但过于关注数据的可迁移性会导致数据中类别的可分性降低,为平衡其可迁移性与可分性引入一个平衡因子τ:
最大均值差异MMD(Ds,Dt)是一种常用的计算两个域间数据分布对齐程度的估计方法,在此用于衡量域的可迁移性;用基于线性判别分析的鉴别评估方法maxJ(W)来衡量域中类别的可分性,其定义如下:
Figure BDA0004070825950000101
其中,Sb为类间散射矩阵,Sw为类内散射矩阵。显然,maxJ(W)越大,意味着更好的可分性。
由于这两个评价标准的估计值通常不在同一个数量级上,因此需要进一步将估计值进行归一化处理,得到
Figure BDA0004070825950000102
Figure BDA0004070825950000103
平衡因子τ定义如下:
Figure BDA0004070825950000104
其中较小的
Figure BDA0004070825950000105
表示更好的域对齐,较小的
Figure BDA0004070825950000106
表示更好的类可鉴别性。
35)结合上述31)32)33)34),最终上层结构的损失定义为:
Figure BDA0004070825950000107
其中,τ和ω均为网络自计算出的参数。
36)在下层结构中,本发明根据最大均值差异方法的优点,选择使用联合分布的希尔伯特空间嵌入来测量两个联合分布P和Q的差异,将一个域中的分布转移到再生核希尔伯特空间(RKHS)中,通过直接计算RKHS中源域和目标域的MMD距离,可以得到其联合概率分布损失:
Figure BDA0004070825950000111
PS(xs,ys),PT(xT,yT)分别表示源域和目标域的联合概率分布,
Figure BDA0004070825950000112
分别表示Ds,Dt中第i个数据对应的RKHS中的特征,
Figure BDA0004070825950000113
分别表示Ds,Dt中第i和j个数据对应的类标签。
上述步骤4)包括:
41)上层结构中,将Xs,Xt作为G1输入,采用对抗性训练来训练G1和D得到最优参数;由于目标域不含标签,则只采用源域数据训练C1,将训练后的C1用于目标域数据类别的预测,C1的输出作为目标域数据的伪标签
Figure BDA0004070825950000114
C1的训练损失如下:
Figure BDA0004070825950000115
结合35)可得到上层结构中的损失:
Figure BDA0004070825950000116
42)下层结构中将Xs,Xt作为G2的输入,得到经G2提取后的特征Zs,Zt,Zs,Zt分别为Xs,Xt经过G2得到的输出特征;利用
Figure BDA0004070825950000117
Figure BDA0004070825950000118
计算Ljmmd
43)为了整合训练后G1,G2的迁移能力,将Xs通过G1,G2的输出进行融合,并将融合后的特征作为C2的输入进行训练,C2的训练损失表示如下:
Figure BDA0004070825950000119
44)根据上面41)42)43)所讨论的网络损失,本发明所提出的模型的优化目标可以表示为
Figure BDA0004070825950000121
上述步骤5,训练结束后,使用特征提取器G1、G2和分类网络C2对测试数据进行预测。
本发明的二氧化碳排放监测方法,基于深度无监督迁移学习方法可以在缺少目标域标签的情况下训练出模型。与传统的对抗式领域自适应方法相比,本发明采用双流结构,同时关注边缘分布差异的影响和条件分布的差异,通过平衡因子表示特征可迁移性与可分性的相对重要性。
又一方面,本发明还公开一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如上述任一方法的步骤。
再一方面,本发明还公开一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如上述任一方法的步骤。
在本申请提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一方法的步骤。
可理解的是,本发明实施例提供的系统与本发明实施例提供的方法相对应,相关内容的解释、举例和有益效果可以参考上述方法中的相应部分。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (9)

1.一种二氧化碳排放监测方法,其特征在于,包括以下步骤,
对源域和目标域数据进行采集,得到有标签的源域数据以及无标签的目标域数据;
对源域数据和目标域数据进行归一化处理;
采用双流结构构建二氧化碳排放监测模型;
对二氧化碳排放监测模型进行训练和测试;
采用测试好的二氧化碳排放监测模型进行二氧化碳排放监测。
2.根据权利要求1所述的二氧化碳排放监测方法,其特征在于:对源域和目标域数据进行采集,得到有标签的源域数据以及无标签的目标域数据;具体包括,
获取第一碳排放设备对应的第一碳排放数据和第二碳排放设备对应的第二碳排放数据,其中,所述第一碳排放设备和所述第二碳排放设备的型号不同;以第一碳排放设备作为源域数据,第二碳排放设备作为目标域数据;对源域和目标域数据进行采集,得到有标签的源域数据<Xs,Ys>以及无标签的目标域数据Xt,其中X表示数据,Y表示其对应标签。
3.根据权利要求1所述的二氧化碳排放监测方法,其特征在于:所述采用双流结构构建二氧化碳排放监测模型,具体包括,
所述二氧化碳排放监测模型包括两个特征提取神经网络G1,G2;两个标签分类器C1,C2,C1为初级分类器,C2为终极分类器;一个对抗领域鉴别器D,其中D包括全局鉴别器Gd和局部鉴别器
Figure FDA0004070825910000011
K为数据类别数;以及分布差异显式度量模块,模型搭建的方法如下:
S31、选择设定的网络作为特征提取器,将有标签的源域数据以及无标签的目标域数据输入到G1,G2中,经过G1,G2的输出特征为fs1,ft1,fs2,ft2,其中fs1,ft1分别表示Xs经过G1的输出特征、Xt经过G1输出特征;fs2,ft2分别表示Xs经过G2的输出特征、Xt经过G2输出特征;
S32、采用源域有标签数据进行训练标签分类器,采用交叉熵损失训练,标签分类器损失通用表达式如下:
Figure FDA0004070825910000021
Ds表示源域数据,ns表示源域数据个数,
Figure FDA0004070825910000022
表示Xi属于k类的概率,Cy表示标签分类器,Gf表示特征提取器;
S33、将fs1,ft1作为对抗领域鉴别器D的输入,D通过鉴别输入特征来自源域或目标域;域鉴别器由多层感知机以及Softmax函数构成;将源域数据标记为1,目标域数据标记为0,对于一个样本的输入,输出该样本来自源域或目标域,根据实际结果与预测值计算出领域判别器的损失值;
S34、为平衡其可迁移性与可分性引入一个平衡因子τ:
用基于线性判别分析的鉴别评估方法maxJ(W)来衡量域中类别的可分性,其定义如下:
Figure FDA0004070825910000023
其中,Sb为类间散射矩阵,Sw为类内散射矩阵;进一步将估计值进行归一化处理,得到
Figure FDA0004070825910000024
平衡因子τ定义如下:
Figure FDA0004070825910000025
其中较小的
Figure FDA0004070825910000026
表示更好的域对齐,较小的
Figure FDA0004070825910000027
表示更好的类可鉴别性;
S35、结合上述S31、S32、S33、S34,最终上层结构的损失定义为:
Figure FDA0004070825910000028
其中,τ和ω均为网络自计算出的参数;
S36、在下层结构中,根据最大均值差异方法的优点,选择使用联合分布的希尔伯特空间嵌入来测量两个联合分布P和Q的差异,将一个域中的分布转移到再生核希尔伯特空间RKHS中,通过直接计算RKHS中源域和目标域的MMD距离,得到其联合概率分布损失:
Figure FDA0004070825910000031
PS(xs,ys),PT(xT,yT)分别表示源域和目标域的联合概率分布,
Figure FDA0004070825910000032
分别表示Ds,Dt中第i个数据对应的RKHS中的特征,
Figure FDA0004070825910000033
分别表示Ds,Dt中第i和j个数据对应的类标签。
4.根据权利要求3所述的二氧化碳排放监测方法,其特征在于:所述G1、G2采用Resnet、VGG以及多重CNN网络。
5.根据权利要求3所述的二氧化碳排放监测方法,其特征在于:
C1、C2为常规的标签分类器,包括神经网络、支持向量机,用于对数据进行分类。
6.根据权利要求3所述的二氧化碳排放监测方法,其特征在于:
步骤S33中,以交叉熵损失函数训练,则对抗领域鉴别器的损失表示为:
Figure FDA0004070825910000034
x∈Xs∪Xt,m表示一个batch的样本数量,di表示第i个样本的域标签,
Figure FDA0004070825910000035
表示第i个样本经过D的输出,θG1,θd分别表示G1、D中参数;
其中全局域鉴别器Gd损失表示为:
Figure FDA0004070825910000036
Ds表示源域数据,Dt表示目标域数据,ns,nt分别表示Ds,Dt中数据个数,Lce表示以交叉熵损失作为域分类器的损失函数;
局部域鉴别器细分为K个域鉴别器
Figure FDA0004070825910000037
每个类鉴别器都负责匹配与类k相关联的源域数据和目标域数据,目标域上的划分根据标签分类器产生的伪标签来进行;局部域鉴别器的损失函数计算为:
Figure FDA0004070825910000041
Figure FDA0004070825910000042
是域鉴别器,
Figure FDA0004070825910000043
是域鉴别器对应的类k的交叉熵损失,
Figure FDA0004070825910000044
是Xi被预测为k类的概率分布。
7.根据权利要求6所述的二氧化碳排放监测方法,其特征在于:
步骤S33中使用
Figure FDA0004070825910000045
来衡量域鉴别器的重要性,包括将全局域鉴别器的全局
Figure FDA0004070825910000046
表示为:
Figure FDA0004070825910000047
局部域鉴别器的局部
Figure FDA0004070825910000048
表示为:
Figure FDA0004070825910000049
Figure FDA00040708259100000410
分别表示源域和目标域中k类的样本,
Figure FDA00040708259100000411
表示k类上的局部子域鉴别器的损失,最终,动态对抗因子ω被表示为:
Figure FDA00040708259100000412
在上述对抗式领域自适应结构中,其最终学习目标表示为:
Figure FDA00040708259100000413
θfyd,
Figure FDA00040708259100000414
分别表示G1,C1,Gd,
Figure FDA00040708259100000415
的参数,其中ω的值通过网络自计算得到。
8.根据权利要求3所述的二氧化碳排放监测方法,其特征在于:
所述对二氧化碳排放监测模型进行训练还包括,
S41、上层结构中,将Xs,Xt作为G1输入,采用对抗性训练来训练G1和D得到最优参数;由于目标域不含标签,则只采用源域数据训练C1,将训练后的C1用于目标域数据类别的预测,C1的输出作为目标域数据的伪标签
Figure FDA0004070825910000051
C1的训练损失如下:
Figure FDA0004070825910000052
结合S35可得到上层结构中的损失:
Figure FDA0004070825910000053
S42、下层结构中将Xs,Xt作为G2的输入,得到经G2提取后的特征Zs,Zt,Zs,Zt分别为Xs,Xt经过G2得到的输出特征;利用<Zs,Ys>,
Figure FDA0004070825910000054
计算Ljmmd
S43、为了整合训练后G1,G2的迁移能力,将Xs通过G1,G2的输出进行融合,并将融合后的特征作为C2的输入进行训练,C2的训练损失表示如下:
Figure FDA0004070825910000055
S44、根据上面S41、S42、S43所述的网络损失,模型的优化目标表示为
Figure FDA0004070825910000056
9.一种计算机可读存储系统,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至8中任一项所述方法的步骤。
CN202310092735.0A 2023-01-18 2023-01-18 一种二氧化碳排放监测方法与系统 Active CN116050507B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310092735.0A CN116050507B (zh) 2023-01-18 2023-01-18 一种二氧化碳排放监测方法与系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310092735.0A CN116050507B (zh) 2023-01-18 2023-01-18 一种二氧化碳排放监测方法与系统

Publications (2)

Publication Number Publication Date
CN116050507A true CN116050507A (zh) 2023-05-02
CN116050507B CN116050507B (zh) 2023-12-22

Family

ID=86116325

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310092735.0A Active CN116050507B (zh) 2023-01-18 2023-01-18 一种二氧化碳排放监测方法与系统

Country Status (1)

Country Link
CN (1) CN116050507B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108062753A (zh) * 2017-12-29 2018-05-22 重庆理工大学 基于深度对抗学习的无监督域自适应脑肿瘤语义分割方法
CN109117817A (zh) * 2018-08-28 2019-01-01 摩佰尔(天津)大数据科技有限公司 人脸识别的方法及装置
CN110458038A (zh) * 2019-07-19 2019-11-15 天津理工大学 基于双链深度双流网络的小数据跨域动作识别方法
CN112819059A (zh) * 2021-01-26 2021-05-18 中国矿业大学 一种基于流行保持迁移学习的滚动轴承故障诊断方法
CN113076927A (zh) * 2021-04-25 2021-07-06 华南理工大学 基于多源域迁移的指静脉识别方法及系统
CN113902166A (zh) * 2021-09-07 2022-01-07 南方电网大数据服务有限公司 大数据融合碳排放治理、预测分析模型方法
CN114511912A (zh) * 2022-03-14 2022-05-17 东南大学 基于双流卷积神经网络的跨库微表情识别方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108062753A (zh) * 2017-12-29 2018-05-22 重庆理工大学 基于深度对抗学习的无监督域自适应脑肿瘤语义分割方法
CN109117817A (zh) * 2018-08-28 2019-01-01 摩佰尔(天津)大数据科技有限公司 人脸识别的方法及装置
CN110458038A (zh) * 2019-07-19 2019-11-15 天津理工大学 基于双链深度双流网络的小数据跨域动作识别方法
CN112819059A (zh) * 2021-01-26 2021-05-18 中国矿业大学 一种基于流行保持迁移学习的滚动轴承故障诊断方法
CN113076927A (zh) * 2021-04-25 2021-07-06 华南理工大学 基于多源域迁移的指静脉识别方法及系统
CN113902166A (zh) * 2021-09-07 2022-01-07 南方电网大数据服务有限公司 大数据融合碳排放治理、预测分析模型方法
CN114511912A (zh) * 2022-03-14 2022-05-17 东南大学 基于双流卷积神经网络的跨库微表情识别方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
RUI GONG, WEN LI: "DLOW:Domain Flow and Application", INTERNATIONAL JOURNAL OF COMPUTER VISION *
陈江涛;英;郭朝令;孙为民;周建强;李献忠;杨小琨;: "基于双循环流化床的生物质制氢近零排放系统设计", 应用能源技术, no. 01 *

Also Published As

Publication number Publication date
CN116050507B (zh) 2023-12-22

Similar Documents

Publication Publication Date Title
CN112446591B (zh) 一种用于学生综合能力评价的零样本评价方法
CN111949535B (zh) 基于开源社区知识的软件缺陷预测装置及方法
CN112756759B (zh) 点焊机器人工作站故障判定方法
CN111861966B (zh) 模型训练方法、装置及缺陷检测方法、装置
CN108492298A (zh) 基于生成对抗网络的多光谱图像变化检测方法
CN111080117A (zh) 设备风险标签的构建方法、装置、电子设备及存储介质
CN114723994B (zh) 一种基于双分类器对抗增强网络的高光谱图像分类方法
CN111753877B (zh) 一种基于深度神经网络迁移学习的产品质量检测方法
CN115471739A (zh) 基于自监督对比学习的跨域遥感场景分类与检索方法
CN115019133A (zh) 基于自训练和标签抗噪的图像中弱目标的检测方法及系统
Zhang et al. Enabling rapid large-scale seismic bridge vulnerability assessment through artificial intelligence
CN116050507B (zh) 一种二氧化碳排放监测方法与系统
Maletzke et al. The Importance of the Test Set Size in Quantification Assessment.
CN116304941A (zh) 一种基于多模型组合的海洋数据质量控制方法及装置
CN116502705A (zh) 兼用域内外数据集的知识蒸馏方法和计算机设备
CN116434273A (zh) 一种基于单正标签的多标记预测方法及系统
Keerthana et al. Accurate prediction of fake job offers using machine learning
CN114757097A (zh) 一种线路故障诊断方法及装置
CN116451083A (zh) 一种基于深度迁移学习的无监督二氧化碳排放监测方法
CN112559798B (zh) 音频内容质量的检测方法及装置
Kaltenborn et al. Automatic classification and segmentation of Snow Micro Penetrometer profiles with machine learning algorithms
CN115808504B (zh) 一种用于浓度预测的气体传感器在线漂移补偿方法
Zakeri et al. Automation and Computational Intelligence for Road Maintenance and Management: Advances and Applications
Mohammed Applying Ensemble Classifier, K-Nearest Neighbor and Decision Tree for Predicting Oral Reading Rate Levels
CN117541562A (zh) 基于不确定性估计的半监督无参考图像质量评价方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant