CN117951457A - 基于生物炭的负碳产品碳减排量核算方法及系统 - Google Patents

基于生物炭的负碳产品碳减排量核算方法及系统 Download PDF

Info

Publication number
CN117951457A
CN117951457A CN202410348066.3A CN202410348066A CN117951457A CN 117951457 A CN117951457 A CN 117951457A CN 202410348066 A CN202410348066 A CN 202410348066A CN 117951457 A CN117951457 A CN 117951457A
Authority
CN
China
Prior art keywords
data
numerical
biochar
carbon
emission reduction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410348066.3A
Other languages
English (en)
Inventor
张文斌
聂原宽
张家平
王建新
张金红
龙泽望
刘言甫
王玉云
赵羊羊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Carbonneutral Bio Gas Co ltd
Original Assignee
Shenzhen Carbonneutral Bio Gas Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Carbonneutral Bio Gas Co ltd filed Critical Shenzhen Carbonneutral Bio Gas Co ltd
Priority to CN202410348066.3A priority Critical patent/CN117951457A/zh
Publication of CN117951457A publication Critical patent/CN117951457A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及人工智能技术领域,公开了一种基于生物炭的负碳产品碳减排量核算方法及系统。所述方法包括:对生物炭的负碳产品进行数据采集和数据类型划分,得到文本生物炭数据和数值生物炭数据;对文本生物炭数据进行语义分析和多维度环境影响因子分析,得到多维度环境影响因子;对数值生物炭数据进行数据增强和特征数据点搜索,得到碳减排特征数据点集;将多维度环境影响因子和碳减排特征数据点集输入预置的双层堆叠回归集成模型进行负碳产品碳减排量预测,得到碳减排量预测数据,本申请提高了生物炭的负碳产品碳减排量核算准确率和效率。

Description

基于生物炭的负碳产品碳减排量核算方法及系统
技术领域
本申请涉及人工智能技术领域,尤其涉及一种基于生物炭的负碳产品碳减排量核算方法及系统。
背景技术
生物炭作为一种负碳材料,近年来在减缓气候变化和土壤改良等领域显示出了巨大的潜力。其通过将生物质废弃物转化为稳定的碳储存形式,不仅能有效减少温室气体的排放,还能改善土壤质量,增加农作物产量。然而,随着生物炭应用范围的不断扩大,如何准确评估生物炭产品在不同应用场景中的实际碳减排效果成为了一个亟需解决的问题。
目前,对于生物炭负碳产品碳减排量的核算方法缺乏统一标准,使得碳减排量的计算结果存在较大的不确定性。不同研究采用的方法和参数差异较大,导致碳减排量的评估结果难以比较,这对于生物炭产品的市场化推广和碳交易具有一定的不利影响。特别是在缺少具体、可靠的核算工具和模型的情况下,生物炭的碳减排潜力难以被充分认证和利用。此外,生物炭负碳产品碳减排量的核算复杂度较高,涉及到的环境影响因素多样,包括生物炭的生产、运输、应用等多个阶段。这些环境影响因素之间存在复杂的相互作用,对碳减排量的预测造成了额外的挑战。
发明内容
本申请提供了一种基于生物炭的负碳产品碳减排量核算方法及系统,本申请提高了生物炭的负碳产品碳减排量核算准确率和效率。
第一方面,本申请提供了一种基于生物炭的负碳产品碳减排量核算方法,所述基于生物炭的负碳产品碳减排量核算方法包括:
对生物炭的负碳产品进行数据采集和数据类型划分,得到文本生物炭数据和数值生物炭数据;
对所述文本生物炭数据进行语义分析和多维度环境影响因子分析,得到多维度环境影响因子;
对所述数值生物炭数据进行数据增强和特征数据点搜索,得到碳减排特征数据点集;
将所述多维度环境影响因子和所述碳减排特征数据点集输入预置的双层堆叠回归集成模型进行负碳产品碳减排量预测,得到碳减排量预测数据。
第二方面,本申请提供了一种基于生物炭的负碳产品碳减排量核算系统,所述基于生物炭的负碳产品碳减排量核算系统包括:
采集模块,用于对生物炭的负碳产品进行数据采集和数据类型划分,得到文本生物炭数据和数值生物炭数据;
分析模块,用于对所述文本生物炭数据进行语义分析和多维度环境影响因子分析,得到多维度环境影响因子;
搜索模块,用于对所述数值生物炭数据进行数据增强和特征数据点搜索,得到碳减排特征数据点集;
预测模块,用于将所述多维度环境影响因子和所述碳减排特征数据点集输入预置的双层堆叠回归集成模型进行负碳产品碳减排量预测,得到碳减排量预测数据。
本申请第三方面提供了一种计算机设备,包括:存储器和至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中的所述指令,以使得所述计算机设备执行上述的基于生物炭的负碳产品碳减排量核算方法。
本申请的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的基于生物炭的负碳产品碳减排量核算方法。
本申请提供的技术方案中,通过对生物炭负碳产品进行细致的数据采集和数据类型划分,将文本数据和数值数据分开处理,大大提高了数据处理的效率和准确性。通过语义分析和多维度环境影响因子分析,能够深入挖掘文本生物炭数据背后的环境影响信息,为碳减排量预测提供了更为丰富和精确的输入参数。利用数据增强和特征数据点搜索技术,有效提升了数值生物炭数据的质量和可用性。通过对数值数据进行缺失值处理、异常值处理和数据标准化等预处理步骤,确保了数据准确性和一致性,从而使得碳减排特征数据点集的生成更加准确,进一步提高了碳减排量预测的准确度。采用的双层堆叠回归集成模型,结合了随机森林模型、GBDT模型和深度神经网络模型的优势,不仅提高了模型的泛化能力,还通过注意力机制层加强了模型对关键特征的识别能力。这种高级的模型融合策略,使得能够更加精确地预测生物炭负碳产品的碳减排量,进而提高了生物炭的负碳产品碳减排量核算准确率和效率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以基于这些附图获得其他的附图。
图1为本申请实施例中基于生物炭的负碳产品碳减排量核算方法的一个实施例示意图;
图2为本申请实施例中基于生物炭的负碳产品碳减排量核算系统的一个实施例示意图。
具体实施方式
本申请实施例提供了一种基于生物炭的负碳产品碳减排量核算方法及系统。本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本申请实施例的具体流程进行描述,请参阅图1,本申请实施例中基于生物炭的负碳产品碳减排量核算方法的一个实施例包括:
步骤101、对生物炭的负碳产品进行数据采集和数据类型划分,得到文本生物炭数据和数值生物炭数据;
可以理解的是,本申请的执行主体可以为基于生物炭的负碳产品碳减排量核算系统,还可以是终端或者服务器,具体此处不做限定。本申请实施例以服务器为执行主体为例进行说明。
具体的,对生物炭负碳产品进行碳减排动态模拟和碳排放关联数据采集,获取包含广泛环境参数和操作条件的碳排放关联数据集。采用数据标签化技术对碳排放关联数据集中的信息进行文本和数值标签化处理,将原始数据转化为更加结构化、易于分析的格式。对文本标签和数值标签进行聚类中心计算,通过分析和处理标签数据的分布特性,确定各个类别中心,这有助于理解数据的内在结构,有效地将复杂的数据集中的数据项根据其特征聚集成不同的组,每组都有一个代表性的中心,即聚类中心。通过聚类模型对文本聚类中心以及数值聚类中心进行标签数据分类,通过机器学习算法,根据已计算出的聚类中心,对所有数据进行分类,最终得到结构化且标签化的文本生物炭数据和数值生物炭数据。
步骤102、对文本生物炭数据进行语义分析和多维度环境影响因子分析,得到多维度环境影响因子;
具体的,对文本生物炭数据进行文本向量化,将文本数据转换为多个高维空间向量,使得原始的文本信息能够在数学上被计算机理解和处理。通过转换,将文本中的每一段信息编码为一个点在高维空间中的表示,增强数据处理的灵活性和效率。对多个高维空间向量进行相似度计算,通过评估向量之间的距离或角度,得到向量相似度数据。基于向量相似度数据,通过支持向量机(SVM)技术筛选这些向量,区分出与研究目标最相关的向量,即目标空间向量。筛选过程基于数据的模式识别,旨在缩小分析的范围,聚焦于最具信息价值的数据部分。通过语义聚类将目标空间向量分组,每组代表一类特定的语义信息。语义聚类基于它们所代表的文本内容的内在意义,有助于细化和理解数据的结构。对语义空间向量进行语义增强和语义分析,得到更加丰富和细化的语义特征集合。通过对语义特征集合进行环境影响因子识别,提取出与碳减排量核算直接相关的初始环境影响因子。这些因子直接关联到生物炭产品对环境的影响。对多个初始环境影响因子进行多维度融合,通过综合考虑它们之间的相互作用和影响,形成一个全面、多角度的环境影响因子体系。
步骤103、对数值生物炭数据进行数据增强和特征数据点搜索,得到碳减排特征数据点集;
具体的,对数值生物炭数据进行缺失值处理,填补或剔除数据集中的缺失值,以确保后续分析的完整性和准确性,得到第一数值数据。对第一数值数据进行异常值处理,通过识别和纠正那些可能扭曲数据分析结果的异常数据点,得到第二数值数据。对第二数值数据进行数据标准化处理,将数据调整到统一的量度上,消除数据间的量纲影响,得到第三数值数据。对第三数值数据进行数据分布调整,通过对数据分布进行优化,使其更接近正态分布或其他理想的分布形态,这有助于提高后续机器学习模型的准确性和稳定性,得到的目标数值数据在形态上更适合进行分析。对目标数值数据进行特征提取和特征数据增强。特征提取旨在识别出那些对碳减排量预测最有影响力的数据特征,而特征数据增强则通过技术手段增强这些特征的表达能力,得到增强数值数据。基于二维连通图模型对增强数值数据进行特征数据点搜索,利用图论原理识别数据集中相互连接的特征点集。在该模型中,数据点被视为图中的节点,而数据点之间的关系则通过边来表示。通过分析这些节点和边的结构,有效地搜索出那些对碳减排量核算具有关键影响的特征数据点集。
进一步地,对目标数值数据进行主成分分析(PCA),识别出数据中的主要变量方向,从而减少数据的维度而不损失太多信息,提取出代表原始数据集关键信息的主成分数值特征。通过遗传算法对主成分数值特征进行特征种群初始化,通过迭代过程生成多个优化后的第一数值特征种群。遗传算法提高了搜索的全局性,确保从主成分中提取到的特征能够有效反映数据的核心属性。对多个第一数值特征进行特征交叉与组合,不同特征种群的个体通过交叉配对和基因重组,生成第二数值特征后代。基于遗传算法的交叉组合策略,有助于发现和创造出更为精确的特征组合,从而在复杂的数据环境中寻找到最有效的特征表达方式。根据数值特征序列对多个第二数值特征进行特征选择,通过评估第二数值特征的贡献或重要性,将其组织成一个有序序列。基于数值特征序列进行特征选择,筛选出与目标变量关联最紧密的数值特征,即第三数值特征。通过这种选择机制,能够进一步减少特征维度,提高模型的计算效率和预测准确性。对第三数值特征进行特征数据增强,提升它们的表达能力和预测性能。
进一步地,基于二维连通图模型对增强数值数据进行二维连通图映射,将每个数据点转化为一个节点,节点之间的连接关系代表了数据点之间的相互依赖或联系,得到数值二维连通图。通过两层时空图卷积网络对数值二维连通图进行时空特征数据点搜索,该网络能够同时考虑数据点在空间上的邻接关系和在时间序列上的依赖关系,得到多个第一特征数据点。通过单层时空图卷积网络对第一特征数据点进行特征降维处理,精炼和简化特征表示,获得更为精准和高效的特征数据点集。通过减少数据点的维度,提高后续分析和计算的效率。得到的第二特征数据点集合是对原始数据特征的一个高度浓缩和抽象,保留了数据中最核心和最有价值的信息。对第二特征数据点进行集合转换,得到最终的碳减排特征数据点集。集合转换过程是将经过层层筛选和提炼的特征数据点集合化,使其能够直接用于碳减排量的核算和预测。
步骤104、将多维度环境影响因子和碳减排特征数据点集输入预置的双层堆叠回归集成模型进行负碳产品碳减排量预测,得到碳减排量预测数据;
具体的,对碳减排特征数据点集进行数据集特征映射和序列化处理,将碳减排数据点集转换成一种结构化的数据形式,得到碳减排特征序列。确保数据在进入模型之前具有统一和规范的格式,提高数据处理效率和模型训练的准确性。通过多维度环境影响因子对碳减排特征序列进行序列向量化加权处理,得到碳减排环境特征影响向量。通过考虑环境影响因子的加权,增强特征序列的表达力,并确保模型能够充分考虑环境因素对碳减排量的影响,提高预测结果的准确性和可靠性。将碳减排环境特征影响向量输入预置的双层堆叠回归集成模型中,该模型由第一层基模型和第二层目标模型组成。在第一层基模型中,通过随机森林模型和GBDT(梯度提升决策树)模型从碳减排环境特征影响向量中提取特征信息,生成第一和第二目标特征向量。将目标特征向量输入第二层的深度神经网络模型中,该模型包括注意力机制层和回归预测层,能够进一步细化和加强特征的表达。通过注意力机制层,模型能够自动识别并赋予不同特征向量以不同的权重,使得模型在预测时能够更加关注于那些对碳减排量预测最有影响的特征。通过回归预测层对注意力加权向量进行负碳产品碳减排量预测,得到碳减排量预测数据。
本申请实施例中,通过对生物炭负碳产品进行细致的数据采集和数据类型划分,将文本数据和数值数据分开处理,大大提高了数据处理的效率和准确性。通过语义分析和多维度环境影响因子分析,能够深入挖掘文本生物炭数据背后的环境影响信息,为碳减排量预测提供了更为丰富和精确的输入参数。利用数据增强和特征数据点搜索技术,有效提升了数值生物炭数据的质量和可用性。通过对数值数据进行缺失值处理、异常值处理和数据标准化等预处理步骤,确保了数据准确性和一致性,从而使得碳减排特征数据点集的生成更加准确,进一步提高了碳减排量预测的准确度。采用的双层堆叠回归集成模型,结合了随机森林模型、GBDT模型和深度神经网络模型的优势,不仅提高了模型的泛化能力,还通过注意力机制层加强了模型对关键特征的识别能力。这种高级的模型融合策略,使得能够更加精确地预测生物炭负碳产品的碳减排量,进而提高了生物炭的负碳产品碳减排量核算准确率和效率。
在一具体实施例中,执行步骤101的过程可以具体包括如下步骤:
(1)对生物炭的负碳产品进行碳减排动态模拟和碳排放关联数据采集,得到碳排放关联数据集;
(2)对碳排放关联数据集进行文本和数值标签化,得到碳排放关联数据集中的文本标签和数值标签;
(3)对文本标签和数值标签进行聚类中心计算,得到文本聚类中心以及数值聚类中心;
(4)通过聚类模型对文本聚类中心以及数值聚类中心进行标签数据分类,得到文本生物炭数据和数值生物炭数据。
具体的,对生物炭的负碳产品进行碳减排动态模拟和碳排放关联数据采集。使用模拟软件或者实际测量工具跟踪和记录生物炭在不同条件下的碳减排性能,以及相关的碳排放数据。例如,可以通过设置不同的使用场景和条件,如生物炭用于土壤改良、水质净化或作为生物质能源,记录下各种情况下的碳绑定量和碳排放量,从而获得一个包含大量数据点的碳排放关联数据集。对碳排放关联数据集进行文本和数值标签化,将数据集中的非结构化和结构化信息进行分类和标记。文本标签化涉及识别数据集中的描述性信息,如生物炭的来源、处理方法或应用场景,并将这些信息转化为易于处理的标签形式。数值标签化则是对数据集中的量化信息,如碳减排量、碳排放量进行标记,使之能够进行进一步的数学处理和分析。对文本标签和数值标签进行聚类中心计算,识别数据集中的主要趋势和模式。通过分析文本标签和数值标签,计算出每个类别的中心点,即聚类中心。这些聚类中心代表了数据集中最典型的特征和属性,可以帮助理解生物炭的碳减排效果与特定因素之间的关系。例如,通过聚类分析,可能发现特定处理方式下的生物炭在某些应用场景中展现出更优的碳减排效能。通过聚类模型对文本聚类中心和数值聚类中心进行标签数据分类,将碳排放关联数据集中的数据点划分为不同的类别,每个类别代表了一种特定的生物炭类型和其碳减排特性。通过将相似的数据点归类,简化数据的复杂性,使得可以针对特定的生物炭类型或应用场景进行更深入的碳减排量预测和分析。
在一具体实施例中,执行步骤102的过程可以具体包括如下步骤:
(1)对文本生物炭数据进行文本向量化,得到多个高维空间向量;
(2)对多个高维空间向量进行相似度计算,得到向量相似度数据;
(3)通过支持向量机,根据向量相似度数据对多个高维空间向量进行向量筛选,得到多个目标空间向量;
(4)对多个目标空间向量进行语义聚类,得到多组语义空间向量;
(5)对多组语义空间向量进行语义增强和语义分析,得到语义特征集合;
(6)对语义特征集合进行环境影响因子识别,得到多个初始环境影响因子;
(7)对多个初始环境影响因子进行多维度融合,得到多维度环境影响因子。
具体的,将文本生物炭数据转换成文本向量,通过文本向量化技术如TF-IDF或Word2Vec,把文本信息编码成高维空间向量。高维空间向量能够在数学上代表原始文本的内容,捕捉其语义和上下文信息。例如,对于描述生物炭来源、处理方法和应用领域的文本数据,向量化后,每一个生物炭样本的描述就转换成了一个点在高维空间中的位置。对高维空间向量进行相似度计算,如使用余弦相似度,确定哪些向量在语义上更接近。这可以揭示不同生物炭样本描述之间的内在联系,帮助识别相似的生物炭特性或应用场景。通过相似度计算,获得一个相似度数据矩阵,为后续的向量筛选提供依据。采用支持向量机(SVM)等机器学习算法根据向量相似度数据对高维空间向量进行筛选,得到与碳减排量预测任务最相关的目标空间向量。SVM通过构建一个决策边界来区分不同的数据点,优化这些决策边界,从而选出能够最好地代表数据集关键特性的向量。例如,如果某些生物炭样本的向量在处理方法上与碳减排效率高的样本相似,这些向量就会被筛选出来作为目标空间向量。对多个目标空间向量进行语义聚类,将具有相似语义特征的向量分组,每一组代表一类特定的环境影响或生物炭特性。通过各种聚类算法,如K-means或层次聚类,识别出生物炭数据中的主要主题和模式,比如某些特定的处理方法可能会导致更高的碳减排效益。对聚类得到的每组语义空间向量进行语义增强和语义分析,细化和强化每一组向量的语义表示。使用NLP技术提取更深层次的语义特征,或者利用深度学习模型来捕获向量间复杂的关系,得到富含信息的语义特征集合,这些特征集合详细描述了生物炭样本的环境影响因子。对语义特征集合进行环境影响因子识别,挑选出与碳减排直接相关的特征。包括使用决策树、关联规则挖掘等数据挖掘技术识别对碳减排量有显著影响的环境影响因子。例如,通过分析,可能发现某些特定的生物炭处理方法或应用场景与高碳减排效益强相关。将多个初始环境影响因子进行多维度融合,构建一个综合的、多维度的环境影响因子框架。该框架不仅考虑了单一因素的影响,还包括这些因素之间的相互作用和复合效应。例如,通过多维度融合,得到一个综合指标,该指标不仅反映了生物炭的原材料类型、处理方法对碳减排的直接影响,还考虑了这些因素如何在不同应用场景下相互作用,影响最终的碳减排效果。
在一具体实施例中,执行步骤103的过程可以具体包括如下步骤:
(1)对数值生物炭数据进行缺失值处理,得到第一数值数据,并对第一数值数据进行异常值处理,得到第二数值数据;
(2)对第二数值数据进行数据标准化处理,得到第三数值数据,并对第三数值数据进行数据分布调整,得到目标数值数据;
(3)对目标数值数据进行特征提取和特征数据增强,得到增强数值数据;
(4)基于二维连通图模型对增强数值数据进行特征数据点搜索,得到碳减排特征数据点集。
具体的,对数值生物炭数据进行缺失值处理。缺失值的存在可能是由于数据采集过程中的误差或遗漏所致,其处理方法包括删除含有缺失值的记录、填补缺失值或使用模型预测缺失值。例如,如果一个关于生物炭使用效率的数据集中某些记录的碳减排量数据缺失,通过已有数据的平均值或中位数来填补,或者利用更复杂的插值方法或预测模型来估计缺失值。处理后得到第一数值数据。对第一数值数据进行异常值处理,剔除可能影响分析结果的异常数据点。异常值可能是由于数据录入错误、测量误差或者是真实的、非典型的观测结果。可以采用统计方法,如基于Z分数或IQR(四分位数范围)的方法,来识别和处理这些异常值。例如,如果在生物炭碳减排量的数据集中存在极端高或低的值,这些值可能扭曲了整体的分析结果,因此需要被识别出来并进行相应处理,得到的第二数值数据将更加真实反映大多数生物炭产品的碳减排性能。对第二数值数据进行数据标准化处理,通过将数据缩放到一个特定的范围或分布,以消除不同量纲和量级带来的影响,保证不同数据之间的可比性。例如,通过Z分数标准化或将数据缩放到0到1之间,确保所有生物炭产品的性能数据在相同的尺度上进行比较。对数据分布进行调整,比如通过对数转换或Box-Cox转换等方法优化数据的分布特性,使之更接近正态分布。对目标数值数据进行特征提取和增强,从数据中识别出对碳减排量预测最具影响力的特征,并通过技术手段增强这些特征的表达。包括使用主成分分析(PCA)减少数据的维度,或者利用深度学习模型捕获数据中的复杂模式。例如,深度学习模型可以从生物炭的物理化学属性数据中学习到如何最有效地预测其碳减排能力。基于二维连通图模型对增强数值数据进行特征数据点搜索,利用图论原理识别数据中的关键特征点,这些特征点代表了最能影响生物炭产品碳减排量的因素。通过构建数据点之间的连通图,并应用图卷积网络等算法,从复杂数据中提取出与碳减排量紧密相关的特征数据点集,这些数据点集为生物炭产品的碳减排量提供了准确的预测依据。
在一具体实施例中,执行步骤对目标数值数据进行特征提取和特征数据增强,得到增强数值数据的过程可以具体包括如下步骤:
(1)对目标数值数据进行主成分特征提取,得到主成分数值特征;
(2)通过遗传算法对主成分数值特征进行特征种群初始化,得到多个第一数值特征;
(3)对多个第一数值特征进行特征交叉与组合,生成多个第二数值特征;
(4)对多个第二数值特征进行数值特征排序,得到数值特征序列;
(5)根据数值特征序列对多个第二数值特征进行特征选择,得到多个第三数值特征;
(6)对多个第三数值特征进行特征数据增强,得到增强数值数据。
具体的,对目标数值数据进行主成分特征提取。主成分分析(PCA)是一种常用的数据降维技术,通过转换原始数据到一个新的坐标系统中,使得在新坐标系统的前几个坐标轴上数据的方差最大。第一主成分捕获数据中最大的方差,第二主成分捕获剩余方差中最大的部分,以此类推。通过这种方式,从复杂的目标数值数据中提取出几个最重要的主成分数值特征,这些特征概括了数据的主要变化信息,忽略噪声和不重要的变化,从而简化后续处理的复杂度。通过遗传算法对主成分数值特征进行特征种群初始化,构建初始的特征种群。遗传算法是一种模拟自然进化过程的搜索算法,通过选择、交叉(杂交)、变异等操作来迭代地优化解决方案。每个主成分特征可以被看作是一个个体,而所有的个体共同构成了一个种群。通过随机选择和组合这些个体的特征,生成多个新的第一数值特征个体。对第一数值特征进行特征交叉与组合,增加特征种群的多样性。选取两个或多个第一数值特征个体作为父本,通过某种交叉规则,如单点交叉、两点交叉或均匀交叉,将父本的特征组合生成子代个体,即第二数值特征。这些新生成的第二数值特征包含了父本特征的不同组合,增加了寻找最优特征组合的可能性。对第二数值特征进行排序,根据它们在模型中的重要性或贡献度进行排序,生成数值特征序列。排序过程基于特征对模型性能的贡献度进行,如通过计算特征对模型预测误差的影响,或者使用特征选择算法如随机森林中的特征重要性得分来确定每个特征的排序。根据数值特征序列对第二数值特征进行选择,筛选出最有潜力的特征组合作为第三数值特征。剔除那些对模型性能提升贡献小的特征,只保留那些最重要的特征。对第三数值特征进行特征数据增强,提高它们的预测能力。特征数据增强可以通过多种方式实现,例如,可以通过构造特征的非线性组合、应用特征转换技术如多项式展开或对数变换,或者使用深度学习模型自动学习特征的高级表示。
在一具体实施例中,执行步骤基于二维连通图模型对增强数值数据进行特征数据点搜索,得到碳减排特征数据点集的过程可以具体包括如下步骤:
(1)基于二维连通图模型对增强数值数据进行二维连通图映射,得到数值二维连通图;
(2)通过两层时空图卷积网络对数值二维连通图进行时空特征数据点搜索,得到多个第一特征数据点;
(3)通过单层时空图卷积网络对多个第一特征数据点进行特征降维处理,得到多个第二特征数据点;
(4)对多个第二特征数据点进行集合转换,得到碳减排特征数据点集。
具体的,基于二维连通图模型对增强数值数据进行二维连通图映射,将每个数据点视为图中的一个节点,数据点之间的相互作用和关联性通过边来表示。例如,基于生物炭数据中的地理位置信息或时间序列信息构建这种二维连通图,其中节点可能代表特定时间点上某地区的生物炭应用效果,边则代表时间序列上的连续性或不同地区间的相互影响。得到的数值二维连通图增加了数据结构的可解释性和分析的深度。通过两层时空图卷积网络对数值二维连通图进行处理,挖掘图中的时空特征并识别出与碳减排量预测密切相关的第一特征数据点。时空图卷积网络是一种专为处理图数据设计的深度学习模型,能够同时考虑节点的空间位置和时间变化,捕捉复杂的时空依赖关系。在处理过程中,网络的第一层主要负责捕捉局部时空特征,而第二层则进一步整合这些局部特征。例如,第一层可能识别出某些时间段内特定地区生物炭使用对碳排放的影响,而第二层则可能揭示出不同地区之间生物炭使用效果的相互关系和差异。通过单层时空图卷积网络对第一特征数据点进行特征降维处理。简化特征空间,去除冗余信息,同时保留最关键的特征,以便更准确地进行碳减排量预测。单层网络对特征进行优化和精炼,确保最终的特征集中每个特征都是对预测任务有用的。通过特征降维,从时空特征中提炼出更为精确和有效的第二特征数据点,这些特征点代表了生物炭数据中最能影响碳减排量预测的核心信息。将第二特征数据点进行集合转换,得到最终的碳减排特征数据点集。对特征点进行重新组织和优化,构建一个既包含足够信息又便于处理的特征集合,直接用于碳减排量的预测模型。
在一具体实施例中,执行步骤104的过程可以具体包括如下步骤:
(1)对碳减排特征数据点集进行数据集特征映射和序列化处理,得到碳减排特征序列;
(2)通过多维度环境影响因子对碳减排特征序列进行序列向量化加权处理,得到碳减排环境特征影响向量;
(3)将碳减排环境特征影响向量输入预置的双层堆叠回归集成模型,双层堆叠回归集成模型包括:第一层基模型和第二层目标模型,第一层基模型包括:随机森林模型和GBDT模型,第二层目标模型包括深度神经网络模型;
(4)通过随机森林模型对碳减排环境特征影响向量进行特征提取,得到第一目标特征向量;
(5)通过GBDT模型对碳减排环境特征影响向量进行特征提取,得到第二目标特征向量;
(6)将第一目标特征向量和第二目标特征向量输入深度神经网络模型,深度神经网络模型包括注意力机制层和回归预测层;
(7)通过注意力机制层对第一目标特征向量和第二目标特征向量进行向量加权融合,得到注意力加权向量;
(8)通过回归预测层对注意力加权向量进行负碳产品碳减排量预测,得到碳减排量预测数据。
具体的,对碳减排特征数据点集进行数据集特征映射和序列化处理,将这些数据转换成一种适合机器学习模型处理的格式。特征映射涉及到将各种形式的数据(如分类数据、连续数据)转换为机器学习算法可以有效处理的数值特征。序列化处理则是将处理后的数据组织成一系列有序的数据点,以便于进行时间序列分析或其他需要考虑数据点顺序的分析。例如,如果碳减排特征数据点集包含了不同时间点上生物炭使用量和相应的碳减排效果数据,这些数据首先需要被转换成数值特征,并按照时间顺序排列,形成碳减排特征序列。通过多维度环境影响因子对碳减排特征序列进行序列向量化加权处理,将序列数据转换成向量形式,并根据多维度环境影响因子对这些向量进行加权。这能够确保模型在分析和预测碳减排量时能够充分考虑到环境因素的影响。例如,不同地区的生物炭使用可能受到当地气候、土壤类型等环境因素的影响,这些因素都需要在模型中得到反映。将加权后的碳减排环境特征影响向量输入预置的双层堆叠回归集成模型。该模型由两个层次组成:第一层基模型和第二层目标模型。在第一层,通过随机森林模型和GBDT模型从碳减排环境特征影响向量中提取关键特征,生成两组目标特征向量。随机森林和GBDT模型能够有效识别出与碳减排量密切相关的特征。将这两组目标特征向量输入第二层的深度神经网络模型中。该深度神经网络模型包括注意力机制层和回归预测层,其中,注意力机制层用于对来自不同基模型的特征向量进行加权融合,突出最重要的特征,而回归预测层则基于这些融合后的特征进行最终的碳减排量预测。注意力机制层通过学习不同特征的重要性分布,确保模型在预测时能够更加关注对预测结果影响最大的特征。通过回归预测层对注意力加权向量进行碳减排量预测,输出碳减排量预测数据。利用深度学习模型的拟合能力,根据输入的特征向量预测出生物炭负碳产品的碳减排量。例如,模型可能会学习到特定类型的生物炭在特定条件下的碳减排效率。
上面对本申请实施例中基于生物炭的负碳产品碳减排量核算方法进行了描述,下面对本申请实施例中基于生物炭的负碳产品碳减排量核算系统进行描述,请参阅图2,本申请实施例中基于生物炭的负碳产品碳减排量核算系统一个实施例包括:
采集模块201,用于对生物炭的负碳产品进行数据采集和数据类型划分,得到文本生物炭数据和数值生物炭数据;
分析模块202,用于对文本生物炭数据进行语义分析和多维度环境影响因子分析,得到多维度环境影响因子;
搜索模块203,用于对数值生物炭数据进行数据增强和特征数据点搜索,得到碳减排特征数据点集;
预测模块204,用于将多维度环境影响因子和碳减排特征数据点集输入预置的双层堆叠回归集成模型进行负碳产品碳减排量预测,得到碳减排量预测数据。
通过上述各个组成部分的协同合作,通过对生物炭负碳产品进行细致的数据采集和数据类型划分,将文本数据和数值数据分开处理,大大提高了数据处理的效率和准确性。通过语义分析和多维度环境影响因子分析,能够深入挖掘文本生物炭数据背后的环境影响信息,为碳减排量预测提供了更为丰富和精确的输入参数。利用数据增强和特征数据点搜索技术,有效提升了数值生物炭数据的质量和可用性。通过对数值数据进行缺失值处理、异常值处理和数据标准化等预处理步骤,确保了数据准确性和一致性,从而使得碳减排特征数据点集的生成更加准确,进一步提高了碳减排量预测的准确度。采用的双层堆叠回归集成模型,结合了随机森林模型、GBDT模型和深度神经网络模型的优势,不仅提高了模型的泛化能力,还通过注意力机制层加强了模型对关键特征的识别能力。这种高级的模型融合策略,使得能够更加精确地预测生物炭负碳产品的碳减排量,进而提高了生物炭的负碳产品碳减排量核算准确率和效率。
本申请还提供一种计算机设备,所述计算机设备包括存储器和处理器,存储器中存储有计算机可读指令,计算机可读指令被处理器执行时,使得处理器执行上述各实施例中的所述基于生物炭的负碳产品碳减排量核算方法的步骤。
本申请还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行所述基于生物炭的负碳产品碳减排量核算方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,系统和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.一种基于生物炭的负碳产品碳减排量核算方法,其特征在于,所述基于生物炭的负碳产品碳减排量核算方法包括:
对生物炭的负碳产品进行数据采集和数据类型划分,得到文本生物炭数据和数值生物炭数据;
对所述文本生物炭数据进行语义分析和多维度环境影响因子分析,得到多维度环境影响因子;
对所述数值生物炭数据进行数据增强和特征数据点搜索,得到碳减排特征数据点集;
将所述多维度环境影响因子和所述碳减排特征数据点集输入预置的双层堆叠回归集成模型进行负碳产品碳减排量预测,得到碳减排量预测数据。
2.根据权利要求1所述的基于生物炭的负碳产品碳减排量核算方法,其特征在于,所述对生物炭的负碳产品进行数据采集和数据类型划分,得到文本生物炭数据和数值生物炭数据,包括:
对生物炭的负碳产品进行碳减排动态模拟和碳排放关联数据采集,得到碳排放关联数据集;
对所述碳排放关联数据集进行文本和数值标签化,得到所述碳排放关联数据集中的文本标签和数值标签;
对所述文本标签和所述数值标签进行聚类中心计算,得到文本聚类中心以及数值聚类中心;
通过聚类模型对所述文本聚类中心以及所述数值聚类中心进行标签数据分类,得到文本生物炭数据和数值生物炭数据。
3.根据权利要求1所述的基于生物炭的负碳产品碳减排量核算方法,其特征在于,所述对所述文本生物炭数据进行语义分析和多维度环境影响因子分析,得到多维度环境影响因子,包括:
对所述文本生物炭数据进行文本向量化,得到多个高维空间向量;
对所述多个高维空间向量进行相似度计算,得到向量相似度数据;
通过支持向量机,根据所述向量相似度数据对所述多个高维空间向量进行向量筛选,得到多个目标空间向量;
对所述多个目标空间向量进行语义聚类,得到多组语义空间向量;
对所述多组语义空间向量进行语义增强和语义分析,得到语义特征集合;
对所述语义特征集合进行环境影响因子识别,得到多个初始环境影响因子;
对所述多个初始环境影响因子进行多维度融合,得到多维度环境影响因子。
4.根据权利要求1所述的基于生物炭的负碳产品碳减排量核算方法,其特征在于,所述对所述数值生物炭数据进行数据增强和特征数据点搜索,得到碳减排特征数据点集,包括:
对所述数值生物炭数据进行缺失值处理,得到第一数值数据,并对所述第一数值数据进行异常值处理,得到第二数值数据;
对所述第二数值数据进行数据标准化处理,得到第三数值数据,并对所述第三数值数据进行数据分布调整,得到目标数值数据;
对所述目标数值数据进行特征提取和特征数据增强,得到增强数值数据;
基于二维连通图模型对所述增强数值数据进行特征数据点搜索,得到碳减排特征数据点集。
5.根据权利要求4所述的基于生物炭的负碳产品碳减排量核算方法,其特征在于,所述对所述目标数值数据进行特征提取和特征数据增强,得到增强数值数据,包括:
对所述目标数值数据进行主成分特征提取,得到主成分数值特征;
通过遗传算法对所述主成分数值特征进行特征种群初始化,得到多个第一数值特征;
对所述多个第一数值特征进行特征交叉与组合,生成多个第二数值特征;
对所述多个第二数值特征进行数值特征排序,得到数值特征序列;
根据所述数值特征序列对所述多个第二数值特征进行特征选择,得到多个第三数值特征;
对所述多个第三数值特征进行特征数据增强,得到增强数值数据。
6.根据权利要求4所述的基于生物炭的负碳产品碳减排量核算方法,其特征在于,所述基于二维连通图模型对所述增强数值数据进行特征数据点搜索,得到碳减排特征数据点集,包括:
基于二维连通图模型对所述增强数值数据进行二维连通图映射,得到数值二维连通图;
通过两层时空图卷积网络对所述数值二维连通图进行时空特征数据点搜索,得到多个第一特征数据点;
通过单层时空图卷积网络对所述多个第一特征数据点进行特征降维处理,得到多个第二特征数据点;
对所述多个第二特征数据点进行集合转换,得到碳减排特征数据点集。
7.根据权利要求6所述的基于生物炭的负碳产品碳减排量核算方法,其特征在于,所述将所述多维度环境影响因子和所述碳减排特征数据点集输入预置的双层堆叠回归集成模型进行负碳产品碳减排量预测,得到碳减排量预测数据,包括:
对所述碳减排特征数据点集进行数据集特征映射和序列化处理,得到碳减排特征序列;
通过所述多维度环境影响因子对所述碳减排特征序列进行序列向量化加权处理,得到碳减排环境特征影响向量;
将所述碳减排环境特征影响向量输入预置的双层堆叠回归集成模型,所述双层堆叠回归集成模型包括:第一层基模型和第二层目标模型,所述第一层基模型包括:随机森林模型和GBDT模型,所述第二层目标模型包括深度神经网络模型;
通过所述随机森林模型对所述碳减排环境特征影响向量进行特征提取,得到第一目标特征向量;
通过所述GBDT模型对所述碳减排环境特征影响向量进行特征提取,得到第二目标特征向量;
将所述第一目标特征向量和所述第二目标特征向量输入所述深度神经网络模型,所述深度神经网络模型包括注意力机制层和回归预测层;
通过所述注意力机制层对所述第一目标特征向量和所述第二目标特征向量进行向量加权融合,得到注意力加权向量;
通过所述回归预测层对所述注意力加权向量进行负碳产品碳减排量预测,得到碳减排量预测数据。
8.一种基于生物炭的负碳产品碳减排量核算系统,其特征在于,所述基于生物炭的负碳产品碳减排量核算系统包括:
采集模块,用于对生物炭的负碳产品进行数据采集和数据类型划分,得到文本生物炭数据和数值生物炭数据;
分析模块,用于对所述文本生物炭数据进行语义分析和多维度环境影响因子分析,得到多维度环境影响因子;
搜索模块,用于对所述数值生物炭数据进行数据增强和特征数据点搜索,得到碳减排特征数据点集;
预测模块,用于将所述多维度环境影响因子和所述碳减排特征数据点集输入预置的双层堆叠回归集成模型进行负碳产品碳减排量预测,得到碳减排量预测数据。
9.一种计算机设备,其特征在于,所述计算机设备包括:存储器和至少一个处理器,所述存储器中存储有指令;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述计算机设备执行如权利要求1-7中任一项所述的基于生物炭的负碳产品碳减排量核算方法。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,其特征在于,所述指令被处理器执行时实现如权利要求1-7中任一项所述的基于生物炭的负碳产品碳减排量核算方法。
CN202410348066.3A 2024-03-26 2024-03-26 基于生物炭的负碳产品碳减排量核算方法及系统 Pending CN117951457A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410348066.3A CN117951457A (zh) 2024-03-26 2024-03-26 基于生物炭的负碳产品碳减排量核算方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410348066.3A CN117951457A (zh) 2024-03-26 2024-03-26 基于生物炭的负碳产品碳减排量核算方法及系统

Publications (1)

Publication Number Publication Date
CN117951457A true CN117951457A (zh) 2024-04-30

Family

ID=90801841

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410348066.3A Pending CN117951457A (zh) 2024-03-26 2024-03-26 基于生物炭的负碳产品碳减排量核算方法及系统

Country Status (1)

Country Link
CN (1) CN117951457A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115660918A (zh) * 2022-09-20 2023-01-31 浙江工业大学 一种工业园区碳排放计算及预测方法
CN117391258A (zh) * 2023-12-08 2024-01-12 深圳碳中和生物燃气股份有限公司 一种负碳排放的预测方法、装置、设备及存储介质
CN117391727A (zh) * 2023-12-07 2024-01-12 深圳碳中和生物燃气股份有限公司 一种负碳排放的碳中和方法及系统
EP4307189A1 (en) * 2022-07-15 2024-01-17 Mother Nature Resources Limited System and method for simulating and predicting forecasts for carbon emissions

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4307189A1 (en) * 2022-07-15 2024-01-17 Mother Nature Resources Limited System and method for simulating and predicting forecasts for carbon emissions
CN115660918A (zh) * 2022-09-20 2023-01-31 浙江工业大学 一种工业园区碳排放计算及预测方法
CN117391727A (zh) * 2023-12-07 2024-01-12 深圳碳中和生物燃气股份有限公司 一种负碳排放的碳中和方法及系统
CN117391258A (zh) * 2023-12-08 2024-01-12 深圳碳中和生物燃气股份有限公司 一种负碳排放的预测方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
Xu et al. Applied data mining
Zandkarimi et al. A generic framework for trace clustering in process mining
CN111667022A (zh) 用户数据处理方法、装置、计算机设备和存储介质
Dhaenens et al. Metaheuristics for big data
Lee et al. Technology opportunity analysis based on recombinant search: patent landscape analysis for idea generation
Pan et al. Clustering of designers based on building information modeling event logs
Fang et al. Patent2Vec: Multi-view representation learning on patent-graphs for patent classification
Ciaburro et al. Python Machine Learning Cookbook: Over 100 recipes to progress from smart data analytics to deep learning using real-world datasets
Nural et al. Using meta-learning for model type selection in predictive big data analytics
Weng et al. An efficient stacking model of multi-label classification based on Pareto optimum
Kakarash et al. Multi-label feature selection using density-based graph clustering and ant colony optimization
Jiang et al. An intelligent recommendation approach for online advertising based on hybrid deep neural network and parallel computing
Dutt et al. Forecasting the Grant Duration of a Patent using Predictive Analytics
Riesener et al. Methodology for Automated Master Data Management using Artificial Intelligence
CN117951457A (zh) 基于生物炭的负碳产品碳减排量核算方法及系统
Theodorou et al. Synthesize extremely high-dimensional longitudinal electronic health records via hierarchical autoregressive language model
He et al. Semisupervised network embedding with differentiable deep quantization
KR102096328B1 (ko) 처방적 분석 기반 지능형 연구정보 고부가 가치화 제공 플랫폼 및 그 방법
Kumbhar et al. Web mining: A Synergic approach resorting to classifications and clustering
Knyazeva et al. Topological data analysis approach for weighted networks embedding
JP5623344B2 (ja) 縮約素性生成装置、方法、プログラム、モデル構築装置及び方法
Sam et al. Customer Churn Prediction using Machine Learning Models
CN116302042B (zh) 协议要素内容推荐方法、装置和计算机设备
Chenna Comparative study of dimension reduction approaches with respect to visualization in 3-dimensional space
Lintao et al. Patent2Vec: Multi-view representation learning on patent-graphs for patent classification

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination