CN117522211B - 碳足迹信息采集方法及装置 - Google Patents

碳足迹信息采集方法及装置 Download PDF

Info

Publication number
CN117522211B
CN117522211B CN202311541107.2A CN202311541107A CN117522211B CN 117522211 B CN117522211 B CN 117522211B CN 202311541107 A CN202311541107 A CN 202311541107A CN 117522211 B CN117522211 B CN 117522211B
Authority
CN
China
Prior art keywords
carbon footprint
data set
dimension
classification
footprint data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311541107.2A
Other languages
English (en)
Other versions
CN117522211A (zh
Inventor
卢焱
史依茗
米文博
相辉
郭路遥
王凯
张静
王宏宇
张弘媛
杨青倬
李献辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hebei Wenshu Technology Co ltd
State Grid Hebei Public Bidding Co ltd
State Grid Hebei Electric Power Co ltd Material Branch
State Grid Corp of China SGCC
Original Assignee
Hebei Wenshu Technology Co ltd
State Grid Hebei Public Bidding Co ltd
State Grid Hebei Electric Power Co ltd Material Branch
State Grid Corp of China SGCC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hebei Wenshu Technology Co ltd, State Grid Hebei Public Bidding Co ltd, State Grid Hebei Electric Power Co ltd Material Branch, State Grid Corp of China SGCC filed Critical Hebei Wenshu Technology Co ltd
Priority to CN202311541107.2A priority Critical patent/CN117522211B/zh
Publication of CN117522211A publication Critical patent/CN117522211A/zh
Application granted granted Critical
Publication of CN117522211B publication Critical patent/CN117522211B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Educational Administration (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Marketing (AREA)
  • Evolutionary Biology (AREA)
  • Software Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Quality & Reliability (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Operations Research (AREA)
  • Computational Linguistics (AREA)
  • Remote Sensing (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种碳足迹信息采集方法及装置,涉及碳排放信息存储技术领域,包括:首先获取碳足迹数据集;然后从碳足迹数据集中随机提取维度数据,根据每个提取的维度数据对所述碳足迹数据集和预设标准数据集进行分类,直至所述碳足迹数据集被单独划分出一类,得到分类次数,根据所述分类次数与维度数量的比值进行验证和更新;最后将所述碳足迹数据集分布式存储于多个服务器。本发明实施方式基于分类的方式,验证碳足迹数据集的准确性,因此,保证了碳足迹数据集的准确性。由于在验证过程中,采用分布式的多个服务器独立进行运算,根据多个服务器的运算结果,确定验证数据的准确性,因此,计算过程更为快速,更可靠,验证结果更值得信赖。

Description

碳足迹信息采集方法及装置
技术领域
本发明涉及碳排放信息存储技术领域,尤其涉及一种碳足迹信息采集方法及装置。
背景技术
二氧化碳排放量急剧增加,已经成为导致人类所面临的全球变暖等环境问题的重要源头,而制造业仍是能源消耗以及碳排放的主力军。在这样的客观环境下,全球制造业都在寻求更加高效、低排放的生产模式,降低产品全生命周期的碳排放量,即降低产品碳足迹。
碳足迹核算是降低产品生命周期碳足迹的第一步,也是最关键的一步。目前,核算企业产品碳足迹方法主要是基于生命周期评价理论,考虑产品材料制备、产品制造、运输、销售、使用、处置等全生命周期各个阶段的碳排放,对于离散制造业,尤其以产品制造阶段的碳排放数据清单的收集最为复杂和耗时。并且,在核算后碳排放数据仍旧存在各种不足,例如,与已有的数据存在较大的偏差,并且在数据存储安全上存在易于改写的问题。
一种现有技术中,基于区块链实现碳足迹监测分析与评估,包括:数据处理系统、区域链和终端设备;数据处理系统与区域链连接,数据处理系统用于采集、计算碳足迹数据,并对计算后的碳足迹数据进行分析,得到分析结果;区域链还与终端设备连接,区域链用于对碳足迹数据进行汇总,并为终端设备提供查询服务;终端设备用于查询碳足迹数据以及分析结果。相较于第三方公司核查的方式,通过采集设备定时或接受指令对数据进行上传的方式能够节省人力、物力,同时保证了数据的真实、有效性。同时充分发挥区块链在促进数据共享,建设可信体系等方面的应用,打通企业碳核查体系中的机构间数据孤岛,提升各参与方之间的协同水平。
这种对碳足迹信息监测方法,仅针对碳足迹数据本身进行分析,仅能发现一些较为明显的数据错误,对于一些异常数据的发现能力欠佳。
基于此,需要开发一种碳足迹信息采集方法。
发明内容
本发明实施例提供了一种碳足迹信息采集方法及装置,以解决现有技术中对异常碳足迹信息判断不准确的问题。
第一方面,本发明实施例提供了一种碳足迹信息采集方法,包括:
获取碳足迹数据集,其中,所述碳足迹数据集包括用于表征阶段性产能对应的多个碳排放指标消耗量的维度数据;
从所述碳足迹数据集中随机提取维度数据,根据每个提取的维度数据与预设的标准数据集中的同维度数据对所述碳足迹数据集和预设标准数据集进行分类,直至所述碳足迹数据集被单独划分出一类,得到分类次数,根据所述分类次数与维度数量的比值进行验证,以确定所述碳足迹数据集的准确性,其中,所述分类次数与维度数量的比值与所述碳足迹数据集的准确性正相关;
将满足准确性要求的碳足迹数据集分布式存储于多个服务器。
在一种可能的实现方式中,所述从所述碳足迹数据集中随机提取维度数据,根据每个提取的维度数据与预设的标准数据集中的同维度数据对所述碳足迹数据集和预设标准数据集进行分类,直至所述碳足迹数据集被单独划分出一类,得到分类次数,根据所述分类次数与维度数量的比值进行验证,以确定所述碳足迹数据集的准确性,包括:
将所述碳足迹数据集发送到所述多个服务器;
获取多个分类次数,其中,分类次数根据将所述碳足迹数据集通过维度分类的方式从所述多个历史碳足迹数据集中分离出时所需的次数确定,所述多个分类次数基于所述多个服务器获取;
根据所述多个分类次数以及验证通过次数阈值确定验证通过率,其中,所述验证通过率为所述多个分类次数中高于所述验证通过次数阈值的分类次数在所述多个分类次数中的占比;
若所述验证通过率低于通过率阈值,则将所述碳足迹数据集确定为异常数据集。
在一种可能的实现方式中,所述获取多个分类次数,包括:
对于所述多个服务器中的每个服务器,执行如下步骤:
获取所述碳足迹数据集的多个维度;
从所述碳足迹数据集中随机选择一个维度,作为分类维度;
根据所述分类维度、所述碳足迹数据集以及所述多个历史碳足迹数据集,确定分类值,其中,所述分类值为根据维度最大值与维度最小值之间随机确定的值,所述维度最大值为所述碳足迹数据集以及所述多个历史碳足迹数据集中在所述分类维度的最大值,所述维度最小值为所述碳足迹数据集以及所述多个历史碳足迹数据集中在所述分类维度的最小值;
根据所述分类维度以及所述分类值,将包含有所述碳足迹数据集的类进行划分,获得分类结果;
若所述分类结果中,所述碳足迹数据集独立为一类,则将维度选择的次数作为分类次数;
否则,从所述多个维度中未曾作为分类维度的维度中,随机选择一个维度,作为分类维度,并跳转至所述根据所述分类维度、所述碳足迹数据集以及所述多个历史碳足迹数据集,确定分类值的步骤。
在一种可能的实现方式中,所述根据所述分类维度、所述碳足迹数据集以及所述多个历史碳足迹数据集,确定分类值,包括:
根据第一公式、所述分类维度、所述碳足迹数据集以及所述多个历史碳足迹数据集,确定分类值,其中,所述第一公式为:
式中,CTV为分类值,DMmin为维度最小值,DMmax为维度最大值,RT为当前时刻,PN1为第一质数常数,PN2为第二质数常数,mod为余数运算。
在一种可能的实现方式中,在所述将所述碳足迹数据集确定为异常数据集之后,根据所述多个分类次数中不高于所述验证通过次数阈值的分类次数所对应的分类过程,确定问题维度,包括:
获取多个目标分类过程,其中,目标分类过程为不高于所述验证通过次数阈值的分类次数所对应的分类过程;
获取多个维度数据集,其中,维度数据集包括目标分类过程中所应用的多个维度,所述多个维度数据集与所述多个目标分类过程一一对应;
将所述多个维度数据集中的每个数据集分别进行维度排列,获得多个维度排序数据集,其中,维度排序数据集中的多个维度按照目标分类过程中应用维度的顺序排列;
计算每个维度在所述多个维度排序数据集中的位次的和,作为维度的位次和;
选择位次和最大的维度作为问题维度。
在一种可能的实现方式中,在所述将所述碳足迹数据集确定为异常数据集之后,根据所述问题维度对所述碳足迹数据集进行再验证或更新,包括:
若所述问题维度包括产能维度,则将所述碳足迹数据集中的数据进行变换,以使得所述碳足迹数据集中产能维度数据位于历史产能维度区间,并跳转至所述根据所述多个分类次数以及验证通过次数阈值确定验证通过率的步骤,其中,所述历史产能维度区间的上限为所述多个历史碳足迹数据集对应产能维度数据的最大值,所述历史产能维度区间的下限为所述多个历史碳足迹数据集对应产能维度数据的最小值;
否则,输出所述问题维度并根据所述问题维度更新所述碳足迹数据集。
在一种可能的实现方式中,所述将所述碳足迹数据集分布式存储于多个服务器,包括:
对于所述多个服务器中的每个服务器,执行如下步骤:
获取前端哈希值,其中,所述前端哈希值为多个区块中最后一个区块的后端哈希值,所述多个区块依次链接成数据链而建立在存储区上并分别存储所述多个历史碳足迹数据集;
根据所述前端哈希值以及所述碳足迹数据集生成附加随机码;
根据所述前端哈希值、所述碳足迹数据集以及所述附加随机码生成后端哈希值;
在存储区上新建区块,并将所述前端哈希值、所述碳足迹数据集、所述附加随机码以及所述后端哈希值存储于所述新建区块。
在一种可能的实现方式中,所述根据所述前端哈希值以及所述碳足迹数据集生成附加随机码,包括:
将所述前端哈希值、当前时刻以及所述碳足迹数据集中的数据进行组合,构成组合数据;
根据所述组合数据生成本地随机码;
获取多个异地随机码,其中,异地随机码为其他服务器的本地随机码;
将所述本地随机码以及所述多个异地随机码进行组合,获得所述附加随机码。
在一种可能的实现方式中,在所述在存储区上新建区块之前,包括:
比较所述多个服务器生成的后端哈希值;
若所述多个服务器生成的后端哈希值中的多数后端哈希值未占到总数的一半以上,则跳转至所述获取前端哈希值的步骤。
第二方面,本发明实施例提供了一种碳足迹信息采集装置,包括:
信息获取模块,用于获取碳足迹数据集,其中,所述碳足迹数据集包括用于表征阶段性产能对应的多个碳排放指标消耗量的维度数据;
信息验证模块,用于从所述碳足迹数据集中随机提取维度数据,根据每个提取的维度数据与预设的标准数据集中的同维度数据对所述碳足迹数据集和预设标准数据集进行分类,直至所述碳足迹数据集被单独划分出一类,得到分类次数,根据所述分类次数与维度数量的比值进行验证,以确定所述碳足迹数据集的准确性,其中,所述分类次数与维度数量的比值与所述碳足迹数据集的准确性正相关;
以及,
信息存储模块,用于将将满足准确性要求的碳足迹数据集分布式存储于多个服务器。
本发明实施方式相对现有技术的有益效果:
本发明实施例提供一种碳足迹信息采集方法及装置,其首先获取碳足迹数据集,其中,所述碳足迹数据集包括用于表征阶段性产能对应的多个碳排放指标消耗量的维度数据;然后从所述碳足迹数据集中随机提取维度数据,根据每个提取的维度数据与预设的标准数据集中的同维度数据对所述碳足迹数据集和预设标准数据集进行分类,直至所述碳足迹数据集被单独划分出一类,得到分类次数,根据所述分类次数与维度数量的比值进行验证和更新;最后将所述碳足迹数据集分布式存储于多个服务器。本发明实施方式基于统计将碳足迹数据集分类为独立个体所需分类次数,并将所需步骤的数量超过验证通过次数阈值的所述碳足迹数据集作为不准确数据集的方式,验证碳足迹数据集的准确性,因此,保证了碳足迹数据集的准确性。
本发明实施方式通过将碳足迹数据集分布式的存储于多个独立的服务器,且通过链表式数据链接和存储,因此,数据存储的可靠性更高,增加了数据修改时的代价和难度,数据更可靠。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的碳足迹信息采集方法的实现流程图;
图2是本发明实施例提供的碳足迹数据集通过维度分类过程原理图;
图3是本发明实施例提供的碳足迹信息采集装置的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图通过具体实施例来进行说明。
图1为本发明实施例提供的碳足迹信息采集方法的实现流程图,详述如下:
在步骤101中,获取碳足迹数据集,其中,所述碳足迹数据集包括用于表征阶段性产能对应的多个碳排放指标消耗量的维度数据。
在步骤102中,从所述碳足迹数据集中随机提取维度数据,根据每个提取的维度数据与预设的标准数据集中的同维度数据对所述碳足迹数据集和预设标准数据集进行分类,直至所述碳足迹数据集被单独划分出一类,得到分类次数,根据所述分类次数与维度数量的比值进行验证,以确定所述碳足迹数据集的准确性,其中,所述分类次数与维度数量的比值与所述碳足迹数据集的准确性正相关。
在一些实施方式中,步骤102包括:
将所述碳足迹数据集发送到所述多个服务器;
获取多个分类次数,其中,分类次数根据将所述碳足迹数据集通过维度分类的方式从所述多个历史碳足迹数据集中分离出时所需的次数确定,所述多个分类次数基于所述多个服务器获取;
根据所述多个分类次数以及验证通过次数阈值确定验证通过率,其中,所述验证通过率为所述多个分类次数中高于所述验证通过次数阈值的分类次数在所述多个分类次数中的占比;
若所述验证通过率低于通过率阈值,则将所述碳足迹数据集确定为异常数据集。
在一些实施方式中,所述获取多个分类次数,包括:
对于所述多个服务器中的每个服务器,执行如下步骤:
获取所述碳足迹数据集的多个维度;
从所述碳足迹数据集中随机选择一个维度,作为分类维度;
根据所述分类维度、所述碳足迹数据集以及所述多个历史碳足迹数据集,确定分类值,其中,所述分类值为根据维度最大值与维度最小值之间随机确定的值,所述维度最大值为所述碳足迹数据集以及所述多个历史碳足迹数据集中在所述分类维度的最大值,所述维度最小值为所述碳足迹数据集以及所述多个历史碳足迹数据集中在所述分类维度的最小值;
根据所述分类维度以及所述分类值,将包含有所述碳足迹数据集的类进行划分,获得分类结果;
若所述分类结果中,所述碳足迹数据集独立为一类,则将维度选择的次数作为分类次数;
否则,从所述多个维度中未曾作为分类维度的维度中,随机选择一个维度,作为分类维度,并跳转至所述根据所述分类维度、所述碳足迹数据集以及所述多个历史碳足迹数据集,确定分类值的步骤。
在一些实施方式中,所述根据所述分类维度、所述碳足迹数据集以及所述多个历史碳足迹数据集,确定分类值,包括:
根据第一公式、所述分类维度、所述碳足迹数据集以及所述多个历史碳足迹数据集,确定分类值,其中,所述第一公式为:
式中,CTV为分类值,DMmin为维度最小值,DMmax为维度最大值,RT为当前时刻,PN1为第一质数常数,PN2为第二质数常数,mod为余数运算。
在一些实施方式中,所述将所述碳足迹数据集确定为异常数据集之后,根据所述多个分类次数中不高于所述验证通过次数阈值的分类次数所对应的分类过程,确定问题维度,包括:
获取多个目标分类过程,其中,目标分类过程为不高于所述验证通过次数阈值的分类次数所对应的分类过程;
获取多个维度数据集,其中,维度数据集包括目标分类过程中所应用的多个维度,所述多个维度数据集与所述多个目标分类过程一一对应;
将所述多个维度数据集中的每个数据集分别进行维度排列,获得多个维度排序数据集,其中,维度排序数据集中的多个维度按照目标分类过程中应用维度的顺序排列;
计算每个维度在所述多个维度排序数据集中的位次的和,作为维度的位次和;
选择位次和最大的维度作为问题维度。
在一些实施方式中,在所述将所述碳足迹数据集确定为异常数据集之后,根据所述问题维度对所述碳足迹数据集进行再验证或更新,包括:
若所述问题维度包括产能维度,则将所述碳足迹数据集中的数据进行变换,以使得所述碳足迹数据集中产能维度数据位于历史产能维度区间,并跳转至所述根据所述多个分类次数以及验证通过次数阈值确定验证通过率的步骤,其中,所述历史产能维度区间的上限为所述多个历史碳足迹数据集对应产能维度数据的最大值,所述历史产能维度区间的下限为所述多个历史碳足迹数据集对应产能维度数据的最小值;
否则,输出所述问题维度并根据所述问题维度更新所述碳足迹数据集。
示例性地,本发明实施方式是将阶段性产能与同期的多种碳排放指标数据汇集形成碳足迹数据集,例如,对于某产品的生产过程,其预定的生产周期为第35-36周,该阶段的产能为D1,同期消耗的、直接的电耗、天然气、热能、水以及原材料分别为D2、D3、D4、D5以及D6,将这些数据汇总就获得了碳足迹数据集。
碳足迹数据集是否合理,需要进行合理性验证,并在验证不通过时,指示出数据的不合理之处,针对不合理的数据进行调整后重新验证,如此往复直至满足验证的条件。
一种验证方式是通过将碳足迹数据集与历史碳足迹数据集进行混合后,尝试对混合的结果进行分类,当碳足迹数据集被分类为独立的个体时,统计分类过程所需的步骤。可以预见,当碳足迹数据集与历史碳足迹数据集差别较大时,将碳足迹数据集从历史碳足迹数据集中分离出来,需要的步骤较少,而当碳足迹数据集与历史碳足迹数据集差别较小时,将碳足迹数据集从历史碳足迹数据集中分离出来,需要的步骤较多。因此,本发明实施方式通过统计分类过程所需的步骤,完成对碳足迹数据集数据合理性的验证。需要明确的是,这里的历史碳足迹数据集是往期经过验证的碳足迹数据集,这些数据集存储于服务器上。
具体实现方面,本发明实施方式将碳足迹数据集发送到多个服务器,每个服务器上分别存储有历史碳足迹数据集,通过分类的步骤后,获得一个分类次数的结果,多个分类次数的结果进行排行,统计高于通过次数阈值的分类次数占比,当高于这个占比时,说明数据是可信的,反之,则需要定位问题维度,并根据问题所在的维度对数据进行再验证或者更新。通过次数的阈值一般根据数据的可能的最多的步骤数量来确定,例如,一种方式中,每个步骤均通过维度进行分类。对于上述碳足迹数据集的示例中,共有D1-D6六个数据,分别对应产能、电耗、天然气、热能、水以及原材料六个维度,若经过半数以上的维度(步骤)方能将碳足迹数据集进行分离,说明该碳足迹数据集可信度较佳,若少于半数的维度(步骤)就能将碳足迹数据集分离出来,说明可信度较差,在这种情形下,应当将通过次数阈值设定为维度的一半,对于上述示例应当为3。
本发明实施方式提供了一种采用维度进行数据分类的示例,该示例原理如图2所示,图中碳足迹数据集201与历史碳足迹数据集202分布于预定的空间内,每个分类步骤分别从碳足迹数据集201的维度中选取一个维度,并基于在这个维度下碳足迹数据集201以及历史碳足迹数据集202分布的区间,设置一个分类值203,从而将预定空间内的数据集分割为两部分,如果两部分中包含有碳足迹数据集201的部分仅包含碳足迹数据集201,则说明碳足迹数据集201被分离,分类完成。否则,将包含有碳足迹数据集201的部分作为目标部分,并从从未被选择过的维度中随机选取一个维度,基于这个维度生成分类值203,根据这个分类值203,再次分割数据集,直到碳足迹数据集201被分离出来。
上述过程提到了,分离时是基于随机确定的维度,基于维度中的数值区间,确定一个随机的分割值,本发明实施方式提供了一种确定随机分类值的计算方式:
式中,CTV为分类值,DMmin为维度最小值,DMmax为维度最大值,RT为当前时刻,PN1为第一质数常数,PN2为第二质数常数,mod为余数运算。
在未通过验证时,本发明实施方式还对数据的问题维度进行了定位,其定位的过程是对于每个服务器的验证过程,按照验证时所采用的维度进行排序,获得维度排序数据集,从而获得与多个服务器相对应的多个维度排序数据集。对于每个维度,分别从多个维度排序数据集中抽取排序值相加,作为维度的位次和,选择位次和最大的维度作为问题维度。
若问题维度是产能维度,还需要进行二次验证,二次验证时,将碳足迹数据集中的数据分别乘以一个系数,使得碳足迹数据集的产能维度数据位于历史碳足迹数据集的产能维度数据之间,一般取区间的中值,调整好以后,再次进行验证。
当问题维度不是产能维度时,需要更新碳足迹数据集,直到满足验证条件。
在步骤103中,将所述碳足迹数据集分布式存储于多个服务器。
在一些实施方式中,步骤103包括:
对于所述多个服务器中的每个服务器,执行如下步骤:
获取前端哈希值,其中,所述前端哈希值为多个区块中最后一个区块的后端哈希值,所述多个区块依次链接成数据链而建立在存储区上并分别存储所述多个历史碳足迹数据集;
根据所述前端哈希值以及所述碳足迹数据集生成附加随机码;
根据所述前端哈希值、所述碳足迹数据集以及所述附加随机码生成后端哈希值;
在存储区上新建区块,并将所述前端哈希值、所述碳足迹数据集、所述附加随机码以及所述后端哈希值存储于所述新建区块。
在一些实施方式中,所述根据所述前端哈希值以及所述碳足迹数据集生成附加随机码,包括:
将所述前端哈希值、当前时刻以及所述碳足迹数据集中的数据进行组合,构成组合数据;
根据所述组合数据生成本地随机码;
获取多个异地随机码,其中,异地随机码为其他服务器的本地随机码;
将所述本地随机码以及所述多个异地随机码进行组合,获得所述附加随机码。
在一些实施方式中,在所述在存储区上新建区块之前,包括:
比较所述多个服务器生成的后端哈希值;
若所述多个服务器生成的后端哈希值中的多数后端哈希值未占到总数的一半以上,则跳转至所述获取前端哈希值的步骤。
示例性地,在数据存储方面,本发明实施方式采用数据链的方式存储于多个分布式的服务器。具体来说,在每个服务器的存储区上建有依次链接的区块,每个区块分别对应的存储有历史碳足迹数据集。本发明实施方式通过将碳足迹数据集分布式的存储于多个独立的服务器,且通过链表式数据链接和存储,数据存储的可靠性更高,增加了数据修改时的代价和难度,数据更可靠。
这多个历史碳足迹数据集是通过前端哈希值和后端哈希值链接的,具体来说,前端哈希值是标识前一区块的,而后端哈希值是标识当前区块的。并且,后端哈希值在产生时,需要考虑多个因素,这其中包括需要存储的碳足迹数据集、前端哈希值、加密性和存储数据的准确性。
本发明实施方式根据前端哈希值和碳足迹数据集生成附加随机码,再根据前端哈希值、需要存储的碳足迹数据集核附加随机码生成后端哈希值,多个服务器的后端哈希值验证一致性后,在存储区上新建区块,并将前端哈希值、需要存储的碳足迹数据集、附加随机码以及后端哈希值存储于新建区块上。
这其中一个关键的步骤是生成附加随机码,一种实施方式中,将前端哈希值、当前时刻以及碳足迹数据集中的数据进行组合构成组合数据,然后按照预定的规则,根据这个组合数据生成本地随机码。规则方面,可以采用字典的方式,将组合数据映射为一个编码或索引。本地随机码与异地随机码,也就是其他服务器是本地随机码进行组合,构成附加随机码。
在进行存储前,还要进行后端哈希值的验证,一种验证方式是验证后端哈希值的一致性,例如,将多个服务器生成的后端哈希值进行比较,统计其中数值最多的哈希值在总数中的占比,当占比达到一半以上时,对碳足迹数据集进行存储,否则返回到后端哈希值重新计算的步骤。
本发明实施方式首先获取碳足迹数据集,其中,所述碳足迹数据集表征阶段性产能对应的多个碳排放指标消耗量;然后对所述碳足迹数据集通过维度分类的方式,验证和更新所述碳足迹数据集,直至所述碳足迹数据集的数据满足归类条件,其中,所述维度分类基于对所述碳足迹数据集以及数据库中的多个历史碳足迹数据集进行分类;最后将所述碳足迹数据集加入多个存储区,其中,所述多个存储区与多个服务器一一对应。本发明实施方式基于分类的方式,验证碳足迹数据集的准确性,因此,保证了碳足迹数据集的准确性。由于在验证过程中,采用分布式的多个服务器独立进行运算,根据多个服务器的运算结果,确定验证数据的准确性,因此,计算过程更为快速,更可靠,验证结果更值得信赖。
本发明实施方式通过将碳足迹数据集分布式的存储于多个独立的服务器,且通过链表式数据链接和存储,因此,数据存储的可靠性更高,增加了数据修改时的代价和难度,数据更可靠。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
以下为本发明的装置实施例,对于其中未详尽描述的细节,可以参考上述对应的方法实施例。
图3示出了本发明实施例提供的碳足迹信息采集装置的结构示意图,为了便于说明,仅示出了与本发明实施例相关的部分,详述如下:
如图3所示,碳足迹信息采集装置3包括:信息获取模块301、信息验证模块302以及信息存储模块303,其中:
信息获取模块301,用于获取碳足迹数据集,其中,所述碳足迹数据集包括用于表征阶段性产能对应的多个碳排放指标消耗量的维度数据;
信息验证模块302,用于从所述碳足迹数据集中随机提取维度数据,根据每个提取的维度数据与预设的标准数据集中的同维度数据对所述碳足迹数据集和预设标准数据集进行分类,直至所述碳足迹数据集被单独划分出一类,得到分类次数,根据所述分类次数与维度数量的比值进行验证,以确定所述碳足迹数据集的准确性,其中,所述分类次数与维度数量的比值与所述碳足迹数据集的准确性正相关;
以及,
信息存储模块303,用于将将满足准确性要求的碳足迹数据集分布式存储于多个服务器。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的模板、单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所述模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个碳足迹信息采集方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器、随机存取存储器、电载波信号、电信信号以及软件分发介质等。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (7)

1.一种碳足迹信息采集方法,其特征在于,包括:
获取碳足迹数据集,其中,所述碳足迹数据集包括用于表征阶段性产能对应的多个碳排放指标消耗量的维度数据;
从所述碳足迹数据集中随机提取维度数据,根据每个提取的维度数据与预设的标准数据集中的同维度数据对所述碳足迹数据集和预设标准数据集进行分类,直至所述碳足迹数据集被单独划分出一类,得到分类次数,根据所述分类次数与维度数量的比值进行验证,以确定所述碳足迹数据集的准确性,其中,所述分类次数与维度数量的比值与所述碳足迹数据集的准确性正相关;
将满足准确性要求的碳足迹数据集分布式存储于多个服务器;
其中,
所述从所述碳足迹数据集中随机提取维度数据,根据每个提取的维度数据与预设的标准数据集中的同维度数据对所述碳足迹数据集和预设标准数据集进行分类,直至所述碳足迹数据集被单独划分出一类,得到分类次数,根据所述分类次数与维度数量的比值进行验证,以确定所述碳足迹数据集的准确性,包括:
将所述碳足迹数据集发送到所述多个服务器;
获取多个分类次数,其中,分类次数根据将所述碳足迹数据集通过维度分类的方式从多个历史碳足迹数据集中分离出时所需的次数确定,所述多个分类次数基于所述多个服务器获取;
根据所述多个分类次数以及验证通过次数阈值确定验证通过率,其中,所述验证通过率为所述多个分类次数中高于所述验证通过次数阈值的分类次数在所述多个分类次数中的占比;
若所述验证通过率低于通过率阈值,则将所述碳足迹数据集确定为异常数据集;
所述获取多个分类次数,包括:
对于所述多个服务器中的每个服务器,执行如下步骤:
获取所述碳足迹数据集的多个维度;
从所述碳足迹数据集中随机选择一个维度,作为分类维度;
根据第一公式、所述分类维度、所述碳足迹数据集以及所述多个历史碳足迹数据集,确定分类值,其中,所述第一公式为:
式中,为分类值,/>为维度最小值,/>为维度最大值,/>为当前时刻,为第一质数常数,/>为第二质数常数,/>为余数运算;
根据所述分类维度以及所述分类值,将包含有所述碳足迹数据集的类进行划分,获得分类结果;
若所述分类结果中,所述碳足迹数据集独立为一类,则将维度选择的次数作为分类次数;
否则,从所述多个维度中未曾作为分类维度的维度中,随机选择一个维度,作为分类维度,并跳转至所述根据所述分类维度、所述碳足迹数据集以及所述多个历史碳足迹数据集,确定分类值的步骤。
2.根据权利要求1所述的碳足迹信息采集方法,其特征在于,在所述将所述碳足迹数据集确定为异常数据集之后,根据所述多个分类次数中不高于所述验证通过次数阈值的分类次数所对应的分类过程,确定问题维度,包括:
获取多个目标分类过程,其中,目标分类过程为不高于所述验证通过次数阈值的分类次数所对应的分类过程;
获取多个维度数据集,其中,维度数据集包括目标分类过程中所应用的多个维度,所述多个维度数据集与所述多个目标分类过程一一对应;
将所述多个维度数据集中的每个数据集分别进行维度排列,获得多个维度排序数据集,其中,维度排序数据集中的多个维度按照目标分类过程中应用维度的顺序排列;
计算每个维度在所述多个维度排序数据集中的位次的和,作为维度的位次和;
选择位次和最大的维度作为问题维度。
3.根据权利要求2所述的碳足迹信息采集方法,其特征在于,在所述将所述碳足迹数据集确定为异常数据集之后,根据所述问题维度对所述碳足迹数据集进行再验证或更新,包括:
若所述问题维度包括产能维度,则将所述碳足迹数据集中的数据进行变换,以使得所述碳足迹数据集中产能维度数据位于历史产能维度区间,并跳转至所述根据所述多个分类次数以及验证通过次数阈值确定验证通过率的步骤,其中,所述历史产能维度区间的上限为所述多个历史碳足迹数据集对应产能维度数据的最大值,所述历史产能维度区间的下限为所述多个历史碳足迹数据集对应产能维度数据的最小值;
否则,输出所述问题维度并根据所述问题维度更新所述碳足迹数据集。
4.根据权利要求1-3任一项所述的碳足迹信息采集方法,其特征在于,所述将满足准确性要求的碳足迹数据集分布式存储于多个服务器,包括:
对于所述多个服务器中的每个服务器,执行如下步骤:
获取前端哈希值,其中,所述前端哈希值为多个区块中最后一个区块的后端哈希值,所述多个区块依次链接成数据链而建立在存储区上并分别存储所述多个历史碳足迹数据集;
根据所述前端哈希值以及所述碳足迹数据集生成附加随机码;
根据所述前端哈希值、所述碳足迹数据集以及所述附加随机码生成后端哈希值;
在存储区上新建区块,并将所述前端哈希值、所述碳足迹数据集、所述附加随机码以及所述后端哈希值存储于所述新建区块。
5.根据权利要求4所述的碳足迹信息采集方法,其特征在于,所述根据所述前端哈希值以及所述碳足迹数据集生成附加随机码,包括:
将所述前端哈希值、当前时刻以及所述碳足迹数据集中的数据进行组合,构成组合数据;
根据所述组合数据生成本地随机码;
获取多个异地随机码,其中,异地随机码为其他服务器的本地随机码;
将所述本地随机码以及所述多个异地随机码进行组合,获得所述附加随机码。
6.根据权利要求4所述的碳足迹信息采集方法,其特征在于,在所述在存储区上新建区块之前,包括:
比较所述多个服务器生成的后端哈希值;
若所述多个服务器生成的后端哈希值中的多数后端哈希值未占到总数的一半以上,则跳转至所述获取前端哈希值的步骤。
7.一种碳足迹信息采集装置,其特征在于,用于实现如权利要求1所述的碳足迹信息采集方法,所述碳足迹信息采集装置包括:
信息获取模块,用于获取碳足迹数据集,其中,所述碳足迹数据集包括用于表征阶段性产能对应的多个碳排放指标消耗量的维度数据;
信息验证模块,用于从所述碳足迹数据集中随机提取维度数据,根据每个提取的维度数据与预设的标准数据集中的同维度数据对所述碳足迹数据集和预设标准数据集进行分类,直至所述碳足迹数据集被单独划分出一类,得到分类次数,根据所述分类次数与维度数量的比值进行验证,以确定所述碳足迹数据集的准确性,其中,所述分类次数与维度数量的比值与所述碳足迹数据集的准确性正相关;
以及,
信息存储模块,用于将将满足准确性要求的碳足迹数据集分布式存储于多个服务器。
CN202311541107.2A 2023-11-17 2023-11-17 碳足迹信息采集方法及装置 Active CN117522211B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311541107.2A CN117522211B (zh) 2023-11-17 2023-11-17 碳足迹信息采集方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311541107.2A CN117522211B (zh) 2023-11-17 2023-11-17 碳足迹信息采集方法及装置

Publications (2)

Publication Number Publication Date
CN117522211A CN117522211A (zh) 2024-02-06
CN117522211B true CN117522211B (zh) 2024-04-16

Family

ID=89756336

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311541107.2A Active CN117522211B (zh) 2023-11-17 2023-11-17 碳足迹信息采集方法及装置

Country Status (1)

Country Link
CN (1) CN117522211B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013132292A1 (en) * 2012-03-09 2013-09-12 Lingham Sri Scalable autonomous energy cost and carbon footprint management system
CN108647730A (zh) * 2018-05-14 2018-10-12 中国科学院计算技术研究所 一种基于历史行为共现的数据划分方法及系统
CN115719152A (zh) * 2022-11-29 2023-02-28 布瑞克农业大数据科技集团有限公司 一种农业碳排放管理方法和系统
CN115730772A (zh) * 2022-11-29 2023-03-03 苏州博萃循环科技有限公司 换电站全生命周期碳足迹的确定系统、方法及计算机设备
CN115755614A (zh) * 2022-11-25 2023-03-07 南方电网数字平台科技(广东)有限公司 基于碳排监测的用能优化调控方法及装置
CN116030210A (zh) * 2023-01-10 2023-04-28 深圳润澄金景科技服务有限公司 碳排放数据统计方法、电子设备及存储介质
CN116167657A (zh) * 2023-02-10 2023-05-26 国网电力科学研究院武汉能效测评有限公司 一种企业全生命周期碳足迹评价方法和系统、存储介质
CN116467366A (zh) * 2023-04-17 2023-07-21 中国科学院空天信息创新研究院 一种基于区块链的碳足迹监测分析与评估系统
CN116613895A (zh) * 2023-07-21 2023-08-18 国网天津市电力公司信息通信公司 一种智能电网电力数据异常检测方法和系统
CN116704750A (zh) * 2023-05-06 2023-09-05 浙江大学 一种基于聚类算法的交通状态识别方法、电子设备、介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230186364A1 (en) * 2021-12-09 2023-06-15 Target Brands, Inc. Item dimensions outlier detection sytems and methods

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013132292A1 (en) * 2012-03-09 2013-09-12 Lingham Sri Scalable autonomous energy cost and carbon footprint management system
CN108647730A (zh) * 2018-05-14 2018-10-12 中国科学院计算技术研究所 一种基于历史行为共现的数据划分方法及系统
CN115755614A (zh) * 2022-11-25 2023-03-07 南方电网数字平台科技(广东)有限公司 基于碳排监测的用能优化调控方法及装置
CN115719152A (zh) * 2022-11-29 2023-02-28 布瑞克农业大数据科技集团有限公司 一种农业碳排放管理方法和系统
CN115730772A (zh) * 2022-11-29 2023-03-03 苏州博萃循环科技有限公司 换电站全生命周期碳足迹的确定系统、方法及计算机设备
CN116030210A (zh) * 2023-01-10 2023-04-28 深圳润澄金景科技服务有限公司 碳排放数据统计方法、电子设备及存储介质
CN116167657A (zh) * 2023-02-10 2023-05-26 国网电力科学研究院武汉能效测评有限公司 一种企业全生命周期碳足迹评价方法和系统、存储介质
CN116467366A (zh) * 2023-04-17 2023-07-21 中国科学院空天信息创新研究院 一种基于区块链的碳足迹监测分析与评估系统
CN116704750A (zh) * 2023-05-06 2023-09-05 浙江大学 一种基于聚类算法的交通状态识别方法、电子设备、介质
CN116613895A (zh) * 2023-07-21 2023-08-18 国网天津市电力公司信息通信公司 一种智能电网电力数据异常检测方法和系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于生命周期的机电产品碳足迹评价与实现方法;王欣;李文强;李彦;;机械设计与制造;20160508(05);论文全文 *
张翠侠 ; 刘从虎 ; 张明玉 ; 刘长义 ; .机械加工车间碳足迹监测与预警方法及关键技术.计算机集成制造系统.2015,(10),论文全文. *

Also Published As

Publication number Publication date
CN117522211A (zh) 2024-02-06

Similar Documents

Publication Publication Date Title
CN110659207B (zh) 基于核谱映射迁移集成的异构跨项目软件缺陷预测方法
CN111614491A (zh) 一种面向电力监控系统安全态势评估指标选取方法及系统
CN106708738B (zh) 一种软件测试缺陷预测方法及系统
CN111143838B (zh) 数据库用户异常行为检测方法
Axelsson Using normalized compression distance for classifying file fragments
CN104750800A (zh) 一种基于出行时间特征的机动车聚类方法
CN103871044A (zh) 一种图像签名生成方法和图像验证方法及装置
CN115794803B (zh) 一种基于大数据ai技术的工程审计问题监测方法与系统
CN110544047A (zh) 一种不良数据辨识方法
CN113486983A (zh) 一种用于反欺诈处理的大数据办公信息分析方法及系统
CN116012131A (zh) 一种用于评估用户信贷风险的方法、系统、装置以及介质
CN117155771B (zh) 一种基于工业物联网的设备集群故障溯源方法及装置
CN113487241A (zh) 企业环保信用等级的分类方法、装置、设备及存储介质
CN117743601A (zh) 一种自然资源知识图谱补全方法、装置、设备及介质
CN117522211B (zh) 碳足迹信息采集方法及装置
CN111417132B (zh) 小区的划分方法、装置及设备
CN114330440B (zh) 基于模拟学习判别的分布式电源负荷异常识别方法及系统
CN113705920B (zh) 火电厂用水数据样本集的生成方法和终端设备
CN111127184B (zh) 一种分布式组合信用评估方法
CN113205442A (zh) 基于区块链的电子政务数据反馈管理方法及装置
CN113505117A (zh) 基于数据指标的数据质量评估方法、装置、设备及介质
CN112258235A (zh) 一种电力营销稽核新业务发现方法及系统
Bass et al. Utility-scale Building Type Assignment Using Smart Meter Data
CN113723835B (zh) 火电厂用水评估方法和终端设备
CN111160401B (zh) 一种基于均值漂移和XGBoost的异常用电判别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant