CN117150407A - 一种工业碳排放数据的异常检测方法 - Google Patents
一种工业碳排放数据的异常检测方法 Download PDFInfo
- Publication number
- CN117150407A CN117150407A CN202311134141.8A CN202311134141A CN117150407A CN 117150407 A CN117150407 A CN 117150407A CN 202311134141 A CN202311134141 A CN 202311134141A CN 117150407 A CN117150407 A CN 117150407A
- Authority
- CN
- China
- Prior art keywords
- layer
- carbon emission
- emission data
- industrial carbon
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 title claims abstract description 59
- 229910052799 carbon Inorganic materials 0.000 title claims abstract description 59
- 238000001514 detection method Methods 0.000 title claims abstract description 28
- 230000005856 abnormality Effects 0.000 title claims abstract description 15
- 239000011159 matrix material Substances 0.000 claims abstract description 23
- 238000012360 testing method Methods 0.000 claims abstract description 16
- 230000002159 abnormal effect Effects 0.000 claims abstract description 15
- 238000005516 engineering process Methods 0.000 claims abstract description 5
- 238000007781 pre-processing Methods 0.000 claims abstract description 4
- 230000006870 function Effects 0.000 claims description 17
- 238000000034 method Methods 0.000 claims description 15
- 238000012549 training Methods 0.000 claims description 9
- 230000004913 activation Effects 0.000 claims description 7
- 206010007559 Cardiac failure congestive Diseases 0.000 claims description 4
- 206010019280 Heart failures Diseases 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 2
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000002485 combustion reaction Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000005431 greenhouse gas Substances 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2123/00—Data types
- G06F2123/02—Data types in the time domain, e.g. time-series data
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/80—Management or planning
- Y02P90/84—Greenhouse gas [GHG] management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Tourism & Hospitality (AREA)
- Biomedical Technology (AREA)
- Economics (AREA)
- Evolutionary Biology (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Educational Administration (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
Abstract
本发明涉及一种工业碳排放数据的异常检测方法,包括以下内容对工业碳排放数据进行预处理,获得碳排放的时间序列T;采用矩阵轮廓技术对时间序列T进行特征提取,获得时间序列T的特征序列;根据所述特征序列建立预测模型,在所述预测模型输入测试集获得测试集的预测特征序列;将特征序列与预测特征序列进行对比,计算预测误差值,将误差值高于阈值的数据作为异常数据点。本发明通过设置阈值来实现工业碳排放数据的异常检测,检测的精确度较高。
Description
技术领域
本发明涉及工业碳排放异常检测领域,特别涉及一种基于矩阵轮廓技术的工业碳排放数据的异常检测方法。
背景技术
随着经济快速发展,不同产业体系逐渐成型,随之而来的碳排放也将不断增加、扩大。促进高能耗行业和领域的减碳迫在眉睫。在此背景下,对产业内企业的碳排放数据进行分级分类显得尤为重要,这有助于分析碳排放量的驱动因素以及碳管理效率的影响因素,为企业和管理部门提供减排决策的客观参考。
企业的碳排放数据实质上属于时间序列数据,这类数据具有强烈的周期性、季节性,带有一定量的噪声等特点,对于企业碳排放数据的异常实际上就是对于这类时间序列数据的异常检测。对于企业来说,企业碳排放主要来源是由购买的能源(包括电力、蒸汽、加热和冷却)产生的间接排放,以及工业过程中直接燃烧产生的温室气体排放。对于大部分企业来说,掌握碳排放方面的异常信息和变化,就能实现对碳排放的进一步把控,因此,有效针对企业的碳排放异常检测方式是很有必要的。
发明内容
本发明提出了一种工业碳排放数据的异常检测方法,并设计了预测模型,称为MP-GRU模型,全称为Matrix Profile-Gated Recurrent Unit,该预测模型可以应用于工业领域,实现工业碳排放的异常检测。
本发明引入矩阵轮廓这一算法来获取工业碳排放时间序列数据的特征。对时间序列预测使用了门控循环单元(GRU)网络模型,相较于传统RNN,GRU网络模型对长期依赖有着很好的支持,信息持久性较高,相较于LSTM,GRU网络模型的参数量更少,更容易收敛。所述预测模型对输入的工业碳排放时间序列数据使用矩阵轮廓技术获取其特征,再使用GRU网络模型对其特征进行预测。最后,在异常检测步骤中,将预测的数据与原始工业碳排放时间序列数据进行矩阵轮廓技术提取后的特征数据进行对比,计算每个数据点的误差值,并设置阈值为平均值的三倍标准差,将大于阈值的数据标记为异常数据点。
本发明提出的一种工业碳排放数据的异常检测方法,包括以下步骤:
S1、对工业碳排放数据进行预处理,获得碳排放的时间序列T,T={t1,t2,…,tn},n是时间序列T的长度;
S2、采用矩阵轮廓技术对时间序列T进行特征提取,获得时间序列T的特征序列;
S3、根据所述步骤S2的特征序列建立预测模型,在所述预测模型输入测试集获得测试集的预测特征序列;所述测试集是步骤S1的时间序列T;
S4、将步骤S2的特征序列与步骤S4的预测特征序列进行对比,计算预测误差值,将误差值高于阈值的数据作为异常数据点。
进一步地,所述步骤S2包含以下内容:
获取时间序列的所有子序列间的欧式距离;
其中一个子序列Ti,m表示从i点开始,长度为m的连续的数据点,Ti,m={ti,ti+1,…,ti+m-1},1≤i≤n–m+1;欧式距离Di={di,1,di,2,…,di,n-m+1},其中di,j是子序列Ti,m和子序列Tj,m之间的欧式距离,1≤i,j≤n–m+1;
以及去除距离轮廓中的重叠部分;
获取矩阵轮廓;
矩阵轮廓P={min(D1),min(D2),…,min(Dn-m+1)},表示每个子序列与其欧式距离最近的非自身匹配子序列。
进一步地,所述步骤S3的预测模型,包括GRU层,dropout层和全连接网络层。
进一步地,所述GRU层具有两层结构,第一层的GRU层单元数量为32,第二层的GRU层单元数量为16,第一层的GRU层后设有第一层dropout层,第二层的GRU层后设有第二层dropout层;第二层dropout层的输出连接全连接网络层,所述全连接网络层的层数为2层。
进一步地,预测模型中加入了激活函数引入非线性关系,从而提高模型的学习能力。
进一步地,所述激活函数是线性整流函数ReLU,预测模型通过梯度下降法最小化损失函数,对网络结构中的权重等参数反向进行逐层调整,通过不断进行迭代训练提高网络对于目标任务的辨识精度。所述目标任务是步骤S3中获得测试集的预测特征序列
进一步地,预测模型的参数为:
dropout层的遗忘率d=0.1;
GRU的层数n=2和时间窗口windows=5;
模型训练的批次大小batch_size=32和轮次epoch=100;
当损失函数的值小于0.1时,模型训练完毕。
进一步地,对所述预测模型进行评估,使用包括精确率、Recall、F1分数、MCC指标,在充血性心力衰竭数据集上评估所述预测模型的性能;
所述精确率表示了在所有预测为正的样本中实际正样本的概率,其表达公式为:
其中TP表示将正类预测为正类数,FP表示将负类预测为正类数,精确率越接近1则说明预测模型表现越好;
召回率Recall表示的是样本中的正例被预测正确的概率,表达公式为:
其中FN表示将正类预测为负类数,Recall越接近1则说明预测模型表现越好;
F1分数表达公式为:
其中Pre表示精确率,Recall表示召回率,F1分数越接近1则说明模型表现越好;
MCC是一个描述实际分类与预测分类之间的相关系数,表达公式为:
其中TN表示将负类预测为负类数,MCC越接近1则说明模型表现越好。
进一步地,所述步骤S1还包含对工业碳排放数据进行数据去重、数据格式转换、数据缺失值处理的步骤。
本发明使用MP-GRU模型,通过轮廓矩阵这一算法来提取工业碳排放时间序列数据的特征,并且对时间序列预测使用了门控循环单元(GRU)网络模型,最后通过设置阈值来实现工业碳排放数据的异常检测,检测的精确度较高,这有助于企业掌握碳排放方面的异常信息和变化,从而实现对碳排放的进一步把控,为企业的碳管理提供客观的参考。
附图说明
图1为本发明的预测模型示意图;
图2为本发明的预测模型结构图;
图3为异常检测结果曲线图;
图4为本发明的异常检测方法流程图。
具体实施方式
以下结合附图和具体实施方式对本发明提出的一种工业碳排放数据的异常检测方法作进一步详细说明。
图1为本发明MP-GRU预测模型的整体框架,其中工业碳排放数据为输入的时间序列T数据。所以在步骤S1工业碳排放数据预处理步骤,首先需要明确企业的碳排放数据收集的范围和目标,例如确定收集的时间段、收集的区域、收集的排放类型等。然后要对收集到的数据进行数据清洗,包括数据去重、数据格式转换、数据缺失值处理等。在数据清洗过程中,需要注意数据的准确性、完整性和一致性。数据清洗完成后,就得到了预测模型的输入碳排放时间序列T,T={t1,t2,…,tn},n是T的长度。
在步骤S2碳排放时间序列特征提取步骤中,将预处理后的时间序列T输入到矩阵轮廓单元中,进行时间序列的特征提取,输出为输入的时间序列T的特征序列。矩阵轮廓单元所用到的矩阵轮廓技术的具体的步骤为:
(1)计算获取时间序列的所有子序列间的欧式距离。
对于一个时间序列T,子序列Ti,m表示从i点开始,长度为m的连续的数据点,即Ti,m={ti,ti+1,…,ti+m-1},1≤i≤n–m+1。一般来说,子序列的长度n是基于领域知识来设置的。
通过计算子序列Ti,m和时间序列T的所有子序列的欧式距离,可以得到子序列Ti,m一个距离轮廓Di,Di={di,1,di,2,…,di,n-m+1},其中di,j(1≤i,j≤n–m+1)是Ti,m和Tj,m之间的欧式距离。
(2)忽略不重要的匹配,关注于非自身匹配。
对于子序列Ti,m的距离轮廓Di,第i个位置的值di,i代表子序列与其自身的欧拉距离,即为0。同时,第i个位置前后的值也接近于0,这是因为子序列Ti,m与另一个子序列Tj,m有重叠部分。若两个子序列有重叠部分,例如子序列Ti,m和另一个子序列Tj,m都是T的子序列,该两个子序列在T中有重叠部分,就表示两个子序列有重叠。若子序列的长度为m,那么i的前后指的是i–m+1≤j≤i+m–1。本发明所用到的矩阵轮廓技术关注于非自身匹配,所以忽略上述两种不重要的匹配。
需要说明的是,忽略指的是在Di中去除对应的数据点,因为后续求的轮廓矩阵P里面的每一项是Di中的最小值,若不去除重叠部分,即与自身的匹配,那么Di的最小值一定为0,轮廓矩阵P也就没有意义。关注则表示的是在Di中保留对应的数据点。
(3)计算获取矩阵轮廓。
对于一个时间序列T,矩阵轮廓P={min(D1),min(D2),…,min(Dn-m+1)},其中1≤i≤n–m+1,表示每个子序列与其欧式距离最近的非自身匹配子序列。
由上述三个步骤(1)(2)(3)可以看出,矩阵轮廓技术可以提取出输入时间序列T的特征序列,它能反映出子序列在整个时间序列T中的其他子序列的相似性。
在步骤S3的预测中,建立了基于GRU的时间序列预测模型,如图2所示,包括GRU层,dropout层和全连接网络层。在所述预测模型输入测试集获得测试集的预测特征序列;测试集是步骤S1的时间序列T。
所述GRU层具有两层结构,第一层的GRU单元数量为32,第二层的GRU单元数量为16,每层GRU层后都有一层dropout。第二层的GRU单元后的为第二层dropout层的输出连接全连接网络层,所述全连接网络层的层数为2层,最后得到基于GRU的时间序列预测模型的最终输出。
由于大多数碳排放数据都是非线性的,线性运算无法表达计算效果,所以在模型中加入激活函数引入非线性关系,从而提高模型的学习能力。所述模型的激活函数选择ReLU,全称为“Rectified Linear Unit”中文翻译为线性整流函数,此算法无需指数运算,运算速度较快,故选其为训练的激活函数。模型通过梯度下降法最小化损失函数,这里损失函数是均方误差,对网络结构中的权重等参数反向进行逐层调整,通过不断进行迭代训练提高网络对于目标任务的辨识精度。所述标任务是步骤S3中获得测试集的预测特征序列。
另外的预测模型的参数为:
dropout层的遗忘率d=0.1;
GRU的层数n=2和时间窗口windows=5;
模型训练的批次大小batch_size=32和轮次epoch=100;
当损失函数较小时,模型训练完毕。利用训练好的预测模型输入测试集,即可利用预测模型得到输入测试集的预测序列,完成预测步骤。
在异常检测步骤,将步骤S3得到的预测序列与S2步骤得到的时序数据特征,即预测前的时间序列,计算一组预测误差值:PE={AE1,AE2,…,AEn-m+1},其中AEi为预测序列与预测前时间序列的每个点的值的差的绝对值。
最后,本发明选择平均值加三倍标准差作为阈值,高于阈值的数据作为异常数据点。再将对应的异常数据点对应回S2步骤的输入,即原时间序列T,就能得到原序列的异常数据点,异常检测结果如图3所示。
为了体现出本发明所述方法的可行性与准确性,在模型性能评估部分,使用精确率、Recall、F1分数、MCC等指标,在Chfdb_chf13数据集上来评估模型的性能。Chfdb全称是BIDMC Congestive Heart Failure Database,中文翻译为充血性心力衰竭数据集,Chf13是其中的一组数据集。该数据来源于公开数据集:https://www.physionet.org/content/ chfdb/1.0.0/。
精确率表示了在所有预测为正的样本中实际正样本的概率,表达公式如下:
其中TP表示将正类预测为正类数,FP为表示将负类预测为正类数,精确率越接近1则说明模型表现越好。
召回率Recall表示的是样本中的正例被预测正确的概率,表达公式如下:
其中FN表示将正类预测为负类数,Recall越接近1则说明模型表现越好。
F1分数兼顾了精确率和召回率,表达公式如下:
其中Pre表示精确率,Recall表示召回率,F1 Score越接近1则说明模型表现越好。
MCC是一个描述实际分类与预测分类之间的相关系数,表达公式如下:
其中TN为True Negative,表示将负类预测为负类数,MCC越接近1则说明模型表现越好。
利用keras2.9.0平台,在Jupyter上进行模型的训练,结果显示,本专利所采用MP-GRU模型的精确率,Recall,F1 Score,MCC分别为0.78,1,0.876,0.846,都十分接近1,说明本专利所采用的MP-GRU模型可以较高精确地实现工业碳排放数据的异常检测。keras是构建预测模型所使用的Python库名称,2.9.0为版本号,keras库主要包含了Python编写的各种高级神经网络应用接口。
本发明具有以下有益效果:
本发明使用MP-GRU模型,通过轮廓矩阵这一算法来提取工业碳排放时间序列数据的特征,并且对时间序列预测使用了门控循环单元(GRU)网络模型,最后通过设置阈值来实现工业碳排放数据的异常检测,检测的精确度较高,这有助于企业掌握碳排放方面的异常信息和变化,从而实现对碳排放的进一步把控,为企业的碳管理提供客观的参考。
尽管本发明的内容已经通过上述优选实施例作了详细介绍,但应当认识到上述的描述不应被认为是对本发明的限制。在本领域技术人员阅读了上述内容后,对于本发明的多种修改和替代都将是显而易见的。因此,本发明的保护范围应由所附的权利要求来限定。
Claims (10)
1.一种工业碳排放数据的异常检测方法,包括以下步骤:
S1、对工业碳排放数据进行预处理,获得碳排放的时间序列T,T={t1,t2,…,tn},n是时间序列T的长度;
S2、采用矩阵轮廓技术对时间序列T进行特征提取,获得时间序列T的特征序列;
S3、根据所述步骤S2的特征序列建立预测模型,在所述预测模型输入测试集获得测试集的预测特征序列;所述测试集是步骤S1的时间序列T;
S4、将步骤S2的特征序列与步骤S3的预测特征序列进行对比,计算预测误差值,将误差值高于阈值的数据作为异常数据点。
2.如权利要求1所述的工业碳排放数据的异常检测方法,其特征在于,所述步骤S2包含以下内容:
获取时间序列T的所有子序列间的欧式距离;
其中一个子序列Ti,m表示从i点开始,长度为m的连续的数据点,Ti,m={ti,ti+1,…,ti+m-1},1≤i≤n–m+1;距离轮廓Di={di,1,di,2,…,di,n-m+1},其中di,j是子序列Ti,m和子序列Tj,m之间的欧式距离,1≤i,j≤n–m+1;
以及去除距离轮廓中的重叠部分;
获取矩阵轮廓;
矩阵轮廓P={min(D1),min(D2),…,min(Dn-m+1)},表示每个子序列与其欧式距离最近的非自身匹配子序列。
3.如权利要求1所述的工业碳排放数据的异常检测方法,其特征在于,所述步骤S3的预测模型,包括GRU层,dropout层和全连接网络层。
4.如权利要求3所述的工业碳排放数据的异常检测方法,其特征在于,所述GRU层具有两层结构,第一层的GRU层单元数量为32,第二层的GRU层单元数量为16,第一层的GRU层后设有第一层dropout层,第二层的GRU层后设有第二层dropout层;第二层dropout层的输出连接全连接网络层,所述全连接网络层的层数为2层。
5.如权利要求4所述的工业碳排放数据的异常检测方法,其特征在于,预测模型中加入了激活函数引入非线性关系,以提高预测模型的学习能力。
6.如权利要求5所述的工业碳排放数据的异常检测方法,其特征在于,所述激活函数是线性整流函数,预测模型通过梯度下降法最小化损失函数,对预测模型的网络结构中的权重参数反向进行逐层调整,通过进行迭代训练提高网络对于目标任务的辨识精度,所述目标任务是步骤S3中获得测试集的预测特征序列。
7.如权利要求6所述的工业碳排放数据的异常检测方法,其特征在于,预测模型的参数包括:
dropout层的遗忘率d=0.1;
GRU的层数n=2和时间窗口windows=5;
模型训练的批次大小batch_size=32和轮次epoch=100。
8.如权利要求6所述的工业碳排放数据的异常检测方法,其特征在于,当损失函数的值小于0.1时,预测模型训练完毕。
9.如权利要求3所述的工业碳排放数据的异常检测方法,其特征在于,对所述预测模型进行评估,使用包括精确率、召回率、F1分数、MCC指标,在充血性心力衰竭数据集上评估所述预测模型的性能;
所述精确率表示了在所有预测为正的样本中实际正样本的概率,其表达公式为:
其中TP表示将正类预测为正类数,FP表示将负类预测为正类数,精确率越接近1则说明预测模型表现越好;
召回率Recall表示的是样本中的正例被预测正确的概率,表达公式为:
其中FN表示将正类预测为负类数,Recall越接近1则说明预测模型表现越好;
F1分数表达公式为:
其中Pre表示精确率,Recall表示召回率,F1分数越接近1则说明模型表现越好;
MCC是一个描述实际分类与预测分类之间的相关系数,表达公式为:
其中TN表示将负类预测为负类数,MCC越接近1则说明模型表现越好。
10.如权利要求1所述的工业碳排放数据的异常检测方法,其特征在于,所述步骤S1还包含对工业碳排放数据进行数据去重、数据格式转换、数据缺失值处理的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311134141.8A CN117150407A (zh) | 2023-09-04 | 2023-09-04 | 一种工业碳排放数据的异常检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311134141.8A CN117150407A (zh) | 2023-09-04 | 2023-09-04 | 一种工业碳排放数据的异常检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117150407A true CN117150407A (zh) | 2023-12-01 |
Family
ID=88900387
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311134141.8A Pending CN117150407A (zh) | 2023-09-04 | 2023-09-04 | 一种工业碳排放数据的异常检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117150407A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117992806A (zh) * | 2024-04-07 | 2024-05-07 | 中清能源(杭州)有限公司 | 一种基于时序数据分析的碳核算方法 |
Citations (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110619420A (zh) * | 2019-07-31 | 2019-12-27 | 广东工业大学 | 一种基于Attention-GRU的短期住宅负荷预测方法 |
CN110879874A (zh) * | 2019-11-15 | 2020-03-13 | 北京工业大学 | 一种天文大数据光变曲线异常检测方法 |
US20200210393A1 (en) * | 2018-09-14 | 2020-07-02 | Verint Americas Inc. | Framework and method for the automated determination of classes and anomaly detection methods for time series |
CN111860982A (zh) * | 2020-07-06 | 2020-10-30 | 东北大学 | 一种基于vmd-fcm-gru的风电场短期风电功率预测方法 |
WO2021037280A2 (zh) * | 2020-06-30 | 2021-03-04 | 深圳前海微众银行股份有限公司 | 基于rnn的反洗钱模型的训练方法、装置、设备及介质 |
CN112948155A (zh) * | 2019-12-11 | 2021-06-11 | 中移(苏州)软件技术有限公司 | 模型训练方法、状态预测方法、装置、设备及存储介质 |
CN113048807A (zh) * | 2021-03-15 | 2021-06-29 | 太原理工大学 | 一种空冷机组背压异常检测方法 |
CN113658423A (zh) * | 2020-10-23 | 2021-11-16 | 秦胜君 | 基于循环门控单元的车辆轨迹异常检测方法 |
CN113837480A (zh) * | 2021-09-29 | 2021-12-24 | 河北工业大学 | 基于改进gru和差分误差补偿的冲击性负荷预测方法 |
CN115063588A (zh) * | 2022-06-29 | 2022-09-16 | 深圳前海微众银行股份有限公司 | 一种数据处理方法、装置、设备及存储介质 |
CN115081726A (zh) * | 2022-07-06 | 2022-09-20 | 东北电力大学 | 一种基于预测的低碳调度方法 |
US20220374700A1 (en) * | 2021-05-21 | 2022-11-24 | Adp, Llc | Time-Series Anomaly Detection Via Deep Learning |
CN115409314A (zh) * | 2022-06-13 | 2022-11-29 | 国网浙江省电力有限公司丽水供电公司 | 一种基于设备识别的企业实时碳排放计量方法 |
CN115484102A (zh) * | 2022-09-16 | 2022-12-16 | 上海交通大学宁波人工智能研究院 | 一种面向工业控制系统的异常检测系统和方法 |
CN115510975A (zh) * | 2022-09-28 | 2022-12-23 | 山东省计算中心(国家超级计算济南中心) | 基于并行Transofmer-GRU的多变量时序异常检测方法及系统 |
KR102488789B1 (ko) * | 2022-01-18 | 2023-01-17 | (주)플레이오니 | 인공지능 기반 단일 클래스 이상 탐지 모델을 이용한 예측 분류 방법, 장치 및 프로그램 |
CN115688035A (zh) * | 2022-10-19 | 2023-02-03 | 江苏电力信息技术有限公司 | 一种基于自监督学习的时序电力数据异常检测方法 |
CN115809405A (zh) * | 2022-12-05 | 2023-03-17 | 河北工业大学 | 基于多特征融合的风机主轴齿轮箱温度异常检测方法 |
CN115964258A (zh) * | 2022-12-30 | 2023-04-14 | 天翼物联科技有限公司 | 基于多时序分析的物联网卡异常行为分级监测方法及系统 |
CN116010885A (zh) * | 2022-12-21 | 2023-04-25 | 重庆邮电大学 | 一种长序列条件下的车辆异常时空数据检测方法及系统 |
US20230186101A1 (en) * | 2021-04-01 | 2023-06-15 | Chongqing University Of Posts And Telecommunications | Time series data adversarial sample generating method and system, electronic device, and storage medium |
CN116361635A (zh) * | 2023-06-02 | 2023-06-30 | 中国科学院成都文献情报中心 | 一种多维时序数据异常检测方法 |
CN116402191A (zh) * | 2023-03-08 | 2023-07-07 | 广东工业大学 | 基于碳排放的产业结构优化方法、设备及存储介质 |
CN116431432A (zh) * | 2023-03-09 | 2023-07-14 | 哈尔滨工业大学 | 一种kpi异常检测方法、电子设备及存储介质 |
CN116451118A (zh) * | 2023-04-19 | 2023-07-18 | 西安电子科技大学 | 基于深度学习的雷达光电异常值检测方法 |
CN116523104A (zh) * | 2023-03-17 | 2023-08-01 | 厦门大学 | 基于情景感知和深度学习的异常群体流量预测方法及装置 |
-
2023
- 2023-09-04 CN CN202311134141.8A patent/CN117150407A/zh active Pending
Patent Citations (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200210393A1 (en) * | 2018-09-14 | 2020-07-02 | Verint Americas Inc. | Framework and method for the automated determination of classes and anomaly detection methods for time series |
CN110619420A (zh) * | 2019-07-31 | 2019-12-27 | 广东工业大学 | 一种基于Attention-GRU的短期住宅负荷预测方法 |
CN110879874A (zh) * | 2019-11-15 | 2020-03-13 | 北京工业大学 | 一种天文大数据光变曲线异常检测方法 |
CN112948155A (zh) * | 2019-12-11 | 2021-06-11 | 中移(苏州)软件技术有限公司 | 模型训练方法、状态预测方法、装置、设备及存储介质 |
WO2021037280A2 (zh) * | 2020-06-30 | 2021-03-04 | 深圳前海微众银行股份有限公司 | 基于rnn的反洗钱模型的训练方法、装置、设备及介质 |
CN111860982A (zh) * | 2020-07-06 | 2020-10-30 | 东北大学 | 一种基于vmd-fcm-gru的风电场短期风电功率预测方法 |
CN113658423A (zh) * | 2020-10-23 | 2021-11-16 | 秦胜君 | 基于循环门控单元的车辆轨迹异常检测方法 |
CN113048807A (zh) * | 2021-03-15 | 2021-06-29 | 太原理工大学 | 一种空冷机组背压异常检测方法 |
US20230186101A1 (en) * | 2021-04-01 | 2023-06-15 | Chongqing University Of Posts And Telecommunications | Time series data adversarial sample generating method and system, electronic device, and storage medium |
US20220374700A1 (en) * | 2021-05-21 | 2022-11-24 | Adp, Llc | Time-Series Anomaly Detection Via Deep Learning |
CN113837480A (zh) * | 2021-09-29 | 2021-12-24 | 河北工业大学 | 基于改进gru和差分误差补偿的冲击性负荷预测方法 |
KR102488789B1 (ko) * | 2022-01-18 | 2023-01-17 | (주)플레이오니 | 인공지능 기반 단일 클래스 이상 탐지 모델을 이용한 예측 분류 방법, 장치 및 프로그램 |
CN115409314A (zh) * | 2022-06-13 | 2022-11-29 | 国网浙江省电力有限公司丽水供电公司 | 一种基于设备识别的企业实时碳排放计量方法 |
CN115063588A (zh) * | 2022-06-29 | 2022-09-16 | 深圳前海微众银行股份有限公司 | 一种数据处理方法、装置、设备及存储介质 |
CN115081726A (zh) * | 2022-07-06 | 2022-09-20 | 东北电力大学 | 一种基于预测的低碳调度方法 |
CN115484102A (zh) * | 2022-09-16 | 2022-12-16 | 上海交通大学宁波人工智能研究院 | 一种面向工业控制系统的异常检测系统和方法 |
CN115510975A (zh) * | 2022-09-28 | 2022-12-23 | 山东省计算中心(国家超级计算济南中心) | 基于并行Transofmer-GRU的多变量时序异常检测方法及系统 |
CN115688035A (zh) * | 2022-10-19 | 2023-02-03 | 江苏电力信息技术有限公司 | 一种基于自监督学习的时序电力数据异常检测方法 |
CN115809405A (zh) * | 2022-12-05 | 2023-03-17 | 河北工业大学 | 基于多特征融合的风机主轴齿轮箱温度异常检测方法 |
CN116010885A (zh) * | 2022-12-21 | 2023-04-25 | 重庆邮电大学 | 一种长序列条件下的车辆异常时空数据检测方法及系统 |
CN115964258A (zh) * | 2022-12-30 | 2023-04-14 | 天翼物联科技有限公司 | 基于多时序分析的物联网卡异常行为分级监测方法及系统 |
CN116402191A (zh) * | 2023-03-08 | 2023-07-07 | 广东工业大学 | 基于碳排放的产业结构优化方法、设备及存储介质 |
CN116431432A (zh) * | 2023-03-09 | 2023-07-14 | 哈尔滨工业大学 | 一种kpi异常检测方法、电子设备及存储介质 |
CN116523104A (zh) * | 2023-03-17 | 2023-08-01 | 厦门大学 | 基于情景感知和深度学习的异常群体流量预测方法及装置 |
CN116451118A (zh) * | 2023-04-19 | 2023-07-18 | 西安电子科技大学 | 基于深度学习的雷达光电异常值检测方法 |
CN116361635A (zh) * | 2023-06-02 | 2023-06-30 | 中国科学院成都文献情报中心 | 一种多维时序数据异常检测方法 |
Non-Patent Citations (1)
Title |
---|
薛涛,等: "基于门控循环单元的多维时序上下文异常检测方法", 西安工程大学学报, vol. 36, no. 6, 31 December 2022 (2022-12-31), pages 108 - 114 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117992806A (zh) * | 2024-04-07 | 2024-05-07 | 中清能源(杭州)有限公司 | 一种基于时序数据分析的碳核算方法 |
CN117992806B (zh) * | 2024-04-07 | 2024-06-04 | 中清能源(杭州)有限公司 | 一种基于时序数据分析的碳核算方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Amra et al. | Students performance prediction using KNN and Naïve Bayesian | |
CN107092582B (zh) | 一种基于残差后验的异常值在线检测及置信度评估方法 | |
CN112767997A (zh) | 一种基于多尺度卷积注意力神经网络的蛋白质二级结构预测方法 | |
CN117150407A (zh) | 一种工业碳排放数据的异常检测方法 | |
Shen et al. | Weighted nonlinear dynamic system for deep extraction of nonlinear dynamic latent variables and industrial application | |
CN114282443B (zh) | 基于mlp-lstm有监督联合模型的剩余使用寿命预测方法 | |
CN111914897A (zh) | 一种基于孪生长短时间记忆网络的故障诊断方法 | |
CN112329974B (zh) | 基于lstm-rnn的民航安保事件行为主体识别与预测方法及系统 | |
CN114757432A (zh) | 基于流程日志和多任务学习的未来执行活动及时间预测方法及系统 | |
CN111881299A (zh) | 基于复制神经网络的离群事件检测与识别方法 | |
CN116796275A (zh) | 一种工业设备多模态时序异常检测方法 | |
Dutta et al. | Forecasting of Campus Placement for Students Using Ensemble Voting Classifier | |
Mounika et al. | Machine learning and deep learning models for diagnosis of parkinson’s disease: a performance analysis | |
Xu et al. | Global attention mechanism based deep learning for remaining useful life prediction of aero-engine | |
Li et al. | Knowledge enhanced ensemble method for remaining useful life prediction under variable working conditions | |
JP4328362B2 (ja) | 言語解析モデル学習装置、言語解析モデル学習方法、言語解析モデル学習プログラム及びその記録媒体 | |
CN115994204A (zh) | 适用于少样本场景的国防科技文本结构化语义分析方法 | |
CN113326371B (zh) | 一种融合预训练语言模型与抗噪声干扰远程监督信息的事件抽取方法 | |
CN114171206A (zh) | 模型训练、传感病预测方法、装置、设备及存储介质 | |
Zhang et al. | Sequential information bottleneck network for RUL prediction | |
CN115309736B (zh) | 基于自监督学习多头注意力网络的时序数据异常检测方法 | |
CN118098288B (zh) | 一种基于自学习标签校正的弱监督语音抑郁症检测方法 | |
Malik et al. | Automated system for concrete damage classification identification using Naïve-Bayesian classifier | |
CN117292749A (zh) | 一种基于bert特征编码技术和深度学习组合模型的抗菌肽预测方法 | |
Rathnakumar et al. | B-BACN: Bayesian Boundary-Aware Convolutional Network for Crack Characterization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |