CN111489041B - 预测污染物异常排放的方法、装置、计算机设备 - Google Patents

预测污染物异常排放的方法、装置、计算机设备 Download PDF

Info

Publication number
CN111489041B
CN111489041B CN202010582358.5A CN202010582358A CN111489041B CN 111489041 B CN111489041 B CN 111489041B CN 202010582358 A CN202010582358 A CN 202010582358A CN 111489041 B CN111489041 B CN 111489041B
Authority
CN
China
Prior art keywords
time
sequence
abnormal
data sequence
detection data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010582358.5A
Other languages
English (en)
Other versions
CN111489041A (zh
Inventor
肖枫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An International Smart City Technology Co Ltd
Original Assignee
Ping An International Smart City Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An International Smart City Technology Co Ltd filed Critical Ping An International Smart City Technology Co Ltd
Priority to CN202010582358.5A priority Critical patent/CN111489041B/zh
Publication of CN111489041A publication Critical patent/CN111489041A/zh
Application granted granted Critical
Publication of CN111489041B publication Critical patent/CN111489041B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Primary Health Care (AREA)
  • Educational Administration (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及区块链技术领域,提供预测污染物异常排放的方法、装置、计算机设备和存储介质,包括:获取企业在预设时间序列中排放污染物检测因子的检测数据序列:计算检测数据序列中邻近时间之间的距离;从检测数据序列中提取出预测序列,并计算预测序列中邻近时间之间的距离;从检测数据序列中提取出多个与预测序列最近邻的样本;从样本中提取出对应的重组训练样本;通过多元时间序列的跨事务关联规则分析方法对重组训练样本进行处理,得到事务集合;通过扩展分步Apriori分析方法,计算事务集合中各个事务之间的频繁项集的关联规则,以得到预测模型。本申请得到的预测模型便于预测出企业在未来出现异常排放的时间。

Description

预测污染物异常排放的方法、装置、计算机设备
技术领域
本申请涉及区块链技术领域,特别涉及一种预测污染物异常排放的方法、装置、计算机设备和存储介质。
背景技术
随着人们生活水平的逐步提高,人们对周边的居住环境有了越来越高的要求。物联网的传感器已经陆续布局在城市不同的环境中,例如水生态,大气,和工业企业中。企业排放污染物超标时将影响到居民用户的健康,因此需要相应的监管机关对企业排放的污染物进行监管以及预警。而目前对环境进行监管的监管机关只能知晓在过去时间段内企业的污染物排放是否超标,而无法预测该企业将来排放异常的时间,因而无法作出提前预警以及提前规避。
发明内容
本申请的主要目的为提供一种预测污染物异常排放的方法、装置、计算机设备和存储介质,旨在克服目前无法对企业异常排放污染物进行提前预警的缺陷。
为实现上述目的,本申请提供了一种预测污染物异常排放的方法,包括以下步骤:
获取企业在预设时间序列中排放污染物检测因子的检测数据序列:Q1=T1,T2,...Ti,Tj;其中,T1,T2,Ti,Tj,分别表示所述企业对应的检测因子在预设时间序列中的t1,t2,ti,tj时刻的检测值;其中,j=i+1;
计算所述检测数据序列中邻近时间之间的距离;
从所述检测数据序列中提取出预测序列,并计算所述预测序列中邻近时间之间的距离;
根据所述检测数据序列中邻近时间之间的距离以及所述预测序列中邻近时间之间的距离,从所述检测数据序列中提取出多个与所述预测序列最近邻的样本;其中,所述最近邻的样本数量为n个;
以w为时间步,从所述样本中提取出对应的重组训练样本;
通过多元时间序列的跨事务关联规则分析方法对所述重组训练样本进行处理,得到n-w+1个事务集合;
通过扩展分步Apriori分析方法,计算所述事务集合中各个事务之间的频繁项集的关联规则,以得到预测模型;并将所述检测数据序列输入至所述预测模型中,预测所述企业出现污染物异常排放的时间节点。
进一步地,所述计算所述检测数据序列中邻近时间之间的距离,包括:
通过标准化欧式距离计算所述检测数据序列中邻近时间之间的距离,其中邻近时间为两个相邻时刻,分别为ti,tj
计算公式为:
Figure GDA0002648081270000021
QTi,j是两个相邻时间的点乘,m是时间窗,μi是Ti,m的均值,μj是Tj,m的均值,σi是Ti,m的标准差,σj是Tj,m的标准差;
QTi,j=QTi-1,j-1-ti-1*tj-1+ti+m-1*tj+m-1
进一步地,所述t1=t0+Δt,ti=t0+iΔt,tj=t0+jΔt。
进一步地,所述通过扩展分步Apriori分析方法,计算所述事务集合中各个事务之间的频繁项集的关联规则,以得到预测模型的步骤之后,包括:
基于所述预测模型,预测所述企业的污染物的异常排放信息,所述异常排放信息包括异常时间、企业信息以及异常的污染物检测因子;
获取所述异常时间的节点数量,并判断所述节点数量是否大于阈值;
若大于,则将所述异常排放信息添加至预设预警模板中生成初始预警图片;
从所述异常时间中获取最接近当前时间的目标异常时间,获取目标异常时间与当前时间的差值;
根据数据库中预存的差值与标签的对应关系,获取对应所述差值的标签;
将所述标签作为图层,并将所述企业信息合成至所述图层中,得到目标图层;
根据所述异常时间、企业信息以及异常的污染物检测因子生成防伪码;
将所述目标图层合成至所述初始预警图片中,并将所述防伪码添加至所述初始预警图片中,得到预警图片;
将所述预警图片发送至所述企业对应的管理终端。
进一步地,所述根据所述异常时间、企业信息以及异常的污染物检测因子生成防伪码的步骤,包括:
将每一个所述异常时间分别与所述企业信息进行组合得到第一组合信息;
将各个所述第一组合信息分别进行哈希计算之后进行拼接得到第二组合信息;
对所述第二组合信息进行哈希计算得到对应的哈希值;
将所述哈希值与所述异常的污染物检测因子进行拼接并进行哈希计算,得到所述防伪码。
进一步地,所述方法还包括:
将所述检测数据序列以及所述预测模型存储于区块链中。
本申请还提供了一种预测污染物异常排放的装置,包括:
第一获取单元,用于获取企业在预设时间序列中排放污染物检测因子的检测数据序列:Q1=T1,T2,...Ti,Tj;其中,T1,T2,Ti,Tj,分别表示所述企业对应的检测因子在预设时间序列中的t1,t2,ti,tj时刻的检测值;其中,j=i+1;
第一计算单元,用于计算所述检测数据序列中邻近时间之间的距离;
第二计算单元,用于从所述检测数据序列中提取出预测序列,并计算所述预测序列中邻近时间之间的距离;
第一提取单元,用于根据所述检测数据序列中邻近时间之间的距离以及所述预测序列中邻近时间之间的距离,从所述检测数据序列中提取出多个与所述预测序列最近邻的样本;其中,所述最近邻的样本数量为n个;
第二提取单元,用于以w为时间步,从所述样本中提取出对应的重组训练样本;
处理单元,用于通过多元时间序列的跨事务关联规则分析方法对所述重组训练样本进行处理,得到n-w+1个事务集合;
第三计算单元,用于通过扩展分步Apriori分析方法,计算所述事务集合中各个事务之间的频繁项集的关联规则,以得到预测模型;并将所述检测数据序列输入至所述预测模型中,预测所述企业出现污染物异常排放的时间节点。
进一步地,所述第一计算单元计算所述检测数据序列中邻近时间之间的距离,包括:
通过标准化欧式距离计算所述检测数据序列中邻近时间之间的距离,其中邻近时间为两个相邻时刻,分别为ti,tj
计算公式为:
Figure GDA0002648081270000041
QTi,j是两个相邻时间的点乘,m是时间窗,μi是Ti,m的均值,μj是Tj,m的均值,σi是Ti,m的标准差,σj是Tj,m的标准差;
QTi,j=QTi-1,j-1-ti-1*tj-1+ti+m-1*tj+m-1
进一步地,所述t1=t0+Δt,ti=t0+iΔt,tj=t0+jΔt。
进一步地,所述装置还包括:
预测单元,用于基于所述预测模型,预测所述企业的污染物的异常排放信息,所述异常排放信息包括异常时间、企业信息以及异常的污染物检测因子;
判断单元,用于获取所述异常时间的节点数量,并判断所述节点数量是否大于阈值;
第一生成单元,用于若大于,则将所述异常排放信息添加至预设预警模板中生成初始预警图片;
第二获取单元,用于从所述异常时间中获取最接近当前时间的目标异常时间,获取目标异常时间与当前时间的差值;
第三获取单元,用于根据数据库中预存的差值与标签的对应关系,获取对应所述差值的标签;
第一合成单元,用于将所述标签作为图层,并将所述企业信息合成至所述图层中,得到目标图层;
第二生成单元,用于根据所述异常时间、企业信息以及异常的污染物检测因子生成防伪码;
第二合成单元,用于将所述目标图层合成至所述初始预警图片中,并将所述防伪码添加至所述初始预警图片中,得到预警图片;
发送单元,用于将所述预警图片发送至所述企业对应的管理终端。
进一步地,所述第二生成单元,具体用于:
将每一个所述异常时间分别与所述企业信息进行组合得到第一组合信息;
将各个所述第一组合信息分别进行哈希计算之后进行拼接得到第二组合信息;
对所述第二组合信息进行哈希计算得到对应的哈希值;
将所述哈希值与所述异常的污染物检测因子进行拼接并进行哈希计算,得到所述防伪码。
本申请还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
本申请提供的预测污染物异常排放的方法、装置、计算机设备和存储介质,包括:获取企业在预设时间序列中排放污染物检测因子的检测数据序列:计算所述检测数据序列中邻近时间之间的距离;从所述检测数据序列中提取出预测序列,并计算所述预测序列中邻近时间之间的距离;根据所述检测数据序列中邻近时间之间的距离以及所述预测序列中邻近时间之间的距离,从所述检测数据序列中提取出多个与所述预测序列最近邻的样本;以w为时间步,从所述样本中提取出对应的重组训练样本;通过多元时间序列的跨事务关联规则分析方法对所述重组训练样本进行处理,得到n-w+1个事务集合;通过扩展分步Apriori分析方法,计算所述事务集合中各个事务之间的频繁项集的关联规则,以得到预测模型;并基于所述预测模型预测所述企业出现污染物异常排放的时间节点。本申请根据企业在预设时间序列中排放污染物检测因子的检测数据序列,训练得到预测企业中污染物的异常排放的预测模型,从而预测出企业在未来出现异常排放的时间节点,从而便于做出提前预警。
附图说明
图1是本申请一实施例中预测污染物异常排放的方法步骤示意图;
图2是本申请一实施例中预测污染物异常排放的装置结构框图;
图3为本申请一实施例的计算机设备的结构示意框图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
参照图1,本申请一实施例中提供了一种预测污染物异常排放的方法,包括以下步骤:
步骤S1,获取企业在预设时间序列中排放污染物检测因子的检测数据序列:Q1=T1,T2,...Ti,Tj;其中,T1,T2,Ti,Tj,分别表示所述企业对应的检测因子在预设时间序列中的t1,t2,ti,tj时刻的检测值;其中,j=i+1;
步骤S2,计算所述检测数据序列中邻近时间之间的距离;
步骤S3,从所述检测数据序列中提取出预测序列,并计算所述预测序列中邻近时间之间的距离;
步骤S4,根据所述检测数据序列中邻近时间之间的距离以及所述预测序列中邻近时间之间的距离,从所述检测数据序列中提取出多个与所述预测序列最近邻的样本;其中,所述最近邻的样本数量为n个;
步骤S5,以w为时间步,从所述样本中提取出对应的重组训练样本;
步骤S6,通过多元时间序列的跨事务关联规则分析方法对所述重组训练样本进行处理,得到n-w+1个事务集合;
步骤S7,通过扩展分步Apriori分析方法,计算所述事务集合中各个事务之间的频繁项集的关联规则,以得到预测模型;并将所述检测数据序列输入至所述预测模型中,预测所述企业出现污染物异常排放的时间节点。
在本实施例中,企业在排放废气、废水时,涉及多种主要污染物例如废气中的二氧化硫、氮氧化物等,废水中的各种重金属等。任意一种污染物都是一个检测因子,任意一种污染物超标,都会对环境造成严重破坏。
如上述步骤S1所述的,上述检测数据序列中包含了某企业排放中涉及的所有污染物的检测数据;多组上述检测数据序列指的是企业在不同时间段排放的主要污染物的检测数据,每一个时间段的检测数据都是一组检测数据序列。当企业既涉及废气排放,又涉及废水排放时,由于本申请对所有的检测因子统一监控,只需要按照指定时间段对污染物进行检测以得到多组检测数据,不需要对废气、废水进行分开监控。
如上述步骤S2所述的,在本实施例中,计算检测数据序列邻近时间之间的距离(即临近时间距离)的过程中,可以采用是标准欧氏距离、马氏距离、余弦距离等方式进行计算。
如上述步骤S3-S4所述的,从所述检测数据序列中取出预测序列Q,例如上述预测序列Q的时间步为w,则Q=Tj-w,Tj-w+1,...,Tj;进而再计算预测序列中邻近时间之间的距离。
在本实施例中,从检测数据序列中提取出与预测序列Q最相似的n个样本,即通过对比检测数据序列中邻近时间之间的距离以及所述预测序列中邻近时间之间的距离,从检测数据序列中找到最近邻的序列作为对应的样本,最近邻指的是与预测序列Q的距离差值小于阈值的检测数据序列。再通过SAX(Symbolic Aggregate Approximation)算法,对取出的数据序列进行符号化处理,得到样本数据。
如上述步骤S5所述的,以w为时间步,从所述样本中提取出对应的重组训练样本,例如其一个重组训练样本可以为S=Ti-w,Ti-w+1,...,Ti。
如上述步骤S6所述的,通过多元时间序列的跨事务关联规则分析方法对w个重组训练样本进行处理,得到n-w+1个事务集合:
q1,c1,q2,c2,…,qw,cw
q2,c2,q3,c3,…,qw+1,cw+1
qn-w,cn-w,qn-w+1,cn-w+1,…,qn,cn
在本实施例中,根据预测时间步w,对提取出n个样本进行处理,得到n个样本对应的w为时间步的重组训练样本,将n个重组样本作为预测模型的训练数据;训练数据包括的训练样本的时间步为w-1,即重组训练样本中具有w-1个时间步的特征;其中,上述特征包括相关数据的权重、偏置,以及相应的权值等。
如上述步骤S7所述的,通过扩展分步Apriori分析方法,计算所述事务集合中各个事务之间的频繁项集的关联规则,以得到预测模型。在本实施例中,上述扩展分步Apriori分析方法是一种深度学习中在大规模数据集中寻找有趣关系的非监督学习算法,可以挖掘上述数据序列中数据间的频繁项集,得到关联规则,该关联规则即为预测模型,进而使用关联规则对数据进行预测。其中,频繁项集指的是支持度大于最小支持度阈值的项集。通过将企业排放的检测数据序列输入预测模型,便可以输出未来出现异常排放的时间,可以将预测模型用于检测企业中的异常排放,给有关部门推送异常排放严重的企业信息和异常排放时间,便于更高效和精准地进行监督和管理。
在一实施例中,所述计算所述检测数据序列中邻近时间之间的距离,包括:
通过标准化欧式距离计算所述检测数据序列中邻近时间之间的距离,其中邻近时间为两个相邻时刻,分别为ti,tj
计算公式为:
Figure GDA0002648081270000081
QTi,j是两个相邻时间的点乘,m是时间窗,μi是Ti,m的均值,μj是Tj,m的均值,σi是Ti,m的标准差,σj是Tj,m的标准差;
其中,Ti,m指的是在所述检测数据序列中的ti时刻,以m为时间窗内的所有检测值数据;Tj,m指的是在所述检测数据序列中的tj时刻,以m为时间窗内的所有检测值数据。
QTi,j=QTi-1,j-1-ti-1*tj-1+ti+m-1*tj+m-1
在一实施例中,上述预设时间序列指的是等间隔时间序列,其中,定义间隔时间为△t,则所述t1=t0+Δt,ti=t0+iΔt,tj=t0+jΔt。
在本实施例中,上述预设时间序列的时间间隔长度为等时间间隔,上述检测数据序列至少为两组,且检测时间段相对应;其中,采集的时间单位可以是多尺度的,可以是分钟、小时、天、周、月或年,为了保证检测结果的准确性,检测数据序列应该包括企业一个完整的生产周期所需要的最短时间的不同检测数据序列,例如,企业的一个完整的生产周期所需要的最短时间为一天,则检测这一企业的时间间隔可以按照小于或等于天为单位的时间间隔,如每半小时为单位采集检测数据。可选的,当检测数据序列的样本越多时,检测数据的预测结果越准确。
在另一实施例中,所述通过扩展分步Apriori分析方法,计算所述事务集合中各个事务之间的频繁项集的关联规则,以得到预测模型的步骤S7之后,包括:
步骤S8,基于所述预测模型,预测所述的企业污染物的异常排放信息,所述异常排放信息包括异常时间、企业信息以及异常的污染物检测因子;
步骤S9,获取所述异常时间的节点数量,并判断所述节点数量是否大于阈值;若异常时间的节点数量大于阈值,则表明该企业将出现大量的异常排放节点,则应当进行提前预警,进行重点关注。
步骤S10,若大于,则将所述异常排放信息添加至预设预警模板中生成初始预警图片;上述预设预警模板可以是一个文本文档,将上述异常排放信息对应添加至上述文本文档对应的字段中,再将上述文本文档转换成图片,即得到上述初始预警图片。
步骤S11,从所述异常时间中获取最接近当前时间的目标异常时间,获取目标异常时间与当前时间的差值;差值越小,表明距离当前时间越短,则紧急度越高。
步骤S12,根据数据库中预存的差值与标签的对应关系,获取对应所述差值的标签;上述标签包括多种,例如,普通、紧急、特别紧急等,可以理解的是差值越小所对应的紧急程度越高。
步骤S13,将所述标签作为图层,并将所述企业信息合成至所述图层中,得到目标图层;为了表达出上述标签的唯一性,需要在上述标签对应的图层中添加对应的企业信息。
步骤S14,根据所述异常时间、企业信息以及异常的污染物检测因子生成防伪码;上述防伪码为唯一标识码,用作于后续预警图片的防伪标识,避免非法用户制作假冒的预警图片欺骗企业。
步骤S15,将所述目标图层合成至所述初始预警图片中,并将所述防伪码添加至所述初始预警图片中,得到预警图片;为了引起相关企业的重视,需要将上述标签所形成的目标图层合成至初始预警图片中,同时为了加强上述预警图片的防伪性,需要将上述防伪码一并添加在上述初始预警图片中,以得到上述预警图片。
步骤S16,将所述预警图片发送至所述企业对应的管理终端。
在一实施例中,所述根据所述异常时间、企业信息以及异常的污染物检测因子生成防伪码的步骤S14,包括:
将每一个所述异常时间分别与所述企业信息进行组合得到第一组合信息;
将各个所述第一组合信息分别进行哈希计算之后进行拼接得到第二组合信息;
对所述第二组合信息进行哈希计算得到对应的哈希值;
将所述哈希值与所述异常的污染物检测因子进行拼接并进行哈希计算,得到所述防伪码。
在本实施例中,企业对应的管理终端接收到上述预警图片时,则可以在验证从上述预警图片中提取出对应的异常时间、企业信息以及异常的污染物检测因子,并按照上述防伪码的生成方式,对应生成一个验证码,进而再对比上述上述验证码与添加在上述预警图片中的防伪码是否一致,若一致,则表明预警图片为真实,企业可以采信,并针对预警图片中的信息进行提前预警;若不一致,则上述预警图片为假冒图片,企业可以不用理会。
在上述实施例中,将所述检测数据序列以及所述预测模型存储于区块链中。其中,区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层。
参照图2,本申请一实施例中还提供了一种预测污染物异常排放的装置,包括:
第一获取单元10,用于获取企业在预设时间序列中排放污染物检测因子的检测数据序列:Q1=T1,T2,...Ti,Tj;其中,T1,T2,Ti,Tj,分别表示所述企业对应的检测因子在预设时间序列中的t1,t2,ti,tj时刻的检测值;其中,j=i+1;
第一计算单元20,用于计算所述检测数据序列中邻近时间之间的距离;
第二计算单元30,用于从所述检测数据序列中提取出预测序列,并计算所述预测序列中邻近时间之间的距离;
第一提取单元40,用于根据所述检测数据序列中邻近时间之间的距离以及所述预测序列中邻近时间之间的距离,从所述检测数据序列中提取出多个与所述预测序列最近邻的样本;其中,所述最近邻的样本数量为n个;
第二提取单元50,用于以w为时间步,从所述样本中提取出对应的重组训练样本;
处理单元60,用于通过多元时间序列的跨事务关联规则分析方法对所述重组训练样本进行处理,得到n-w+1个事务集合;
第三计算单元70,用于通过扩展分步Apriori分析方法,计算所述事务集合中各个事务之间的频繁项集的关联规则,以得到预测模型;并将所述检测数据序列输入至所述预测模型中,预测所述企业出现污染物异常排放的时间节点。
在一实施例中,所述第一计算单元20计算所述检测数据序列中邻近时间之间的距离,包括:
通过标准化欧式距离计算所述检测数据序列中邻近时间之间的距离,其中邻近时间为两个相邻时刻,分别为ti,tj
计算公式为:
Figure GDA0002648081270000121
QTi,j是两个相邻时间的点乘,m是时间窗,μi是Ti,m的均值,μj是Tj,m的均值,σi是Ti,m的标准差,σj是Tj,m的标准差;
QTi,j=QTi-1,j-1-ti-1*tj-1+ti+m-1*tj+m-1
在一实施例中,所述t1=t0+Δt,ti=t0+iΔt,tj=t0+jΔt。
在另一实施例中,所述装置还包括:
预测单元,用于基于所述预测模型,预测所述的企业污染物的异常排放信息,所述异常排放信息包括异常时间、企业信息以及异常的污染物检测因子;
判断单元,用于获取所述异常时间的节点数量,并判断所述节点数量是否大于阈值;
第一生成单元,用于若大于,则将所述异常排放信息添加至预设预警模板中生成初始预警图片;
第二获取单元,用于从所述异常时间中获取最接近当前时间的目标异常时间,获取目标异常时间与当前时间的差值;
第三获取单元,用于根据数据库中预存的差值与标签的对应关系,获取对应所述差值的标签;
第一合成单元,用于将所述标签作为图层,并将所述企业信息合成至所述图层中,得到目标图层;
第二生成单元,用于根据所述异常时间、企业信息以及异常的污染物检测因子生成防伪码;
第二合成单元,用于将所述目标图层合成至所述初始预警图片中,并将所述防伪码添加至所述初始预警图片中,得到预警图片;
发送单元,用于将所述预警图片发送至所述企业对应的管理终端。
在本实施例中,所述第二生成单元,具体用于:
将每一个所述异常时间分别与所述企业信息进行组合得到第一组合信息;
将各个所述第一组合信息分别进行哈希计算之后进行拼接得到第二组合信息;
对所述第二组合信息进行哈希计算得到对应的哈希值;
将所述哈希值与所述异常的污染物检测因子进行拼接并进行哈希计算,得到所述防伪码。
在一实施例中,上述装置,还包括:
存储单元,用于将所述检测数据序列以及所述预测模型存储于区块链中。其中,区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层。
在本实施例中,上述各个单元的具体实现,请参照上述方法实施例中的具体实现,在此不再进行赘述。
参照图3,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储污染物排放数据等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种检测污染物异常排放的方法。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种检测污染物异常排放的方法。可以理解的是,本实施例中的计算机可读存储介质可以是易失性可读存储介质,也可以为非易失性可读存储介质。
综上所述,为本申请实施例中提供的预测污染物异常排放的方法、装置、计算机设备和存储介质,包括:获取企业在预设时间序列中排放污染物检测因子的检测数据序列:计算所述检测数据序列中邻近时间之间的距离;从所述检测数据序列中提取出预测序列,并计算所述预测序列中邻近时间之间的距离;根据所述检测数据序列中邻近时间之间的距离以及所述预测序列中邻近时间之间的距离,从所述检测数据序列中提取出多个与所述预测序列最近邻的样本;以w为时间步,从所述样本中提取出对应的重组训练样本;通过多元时间序列的跨事务关联规则分析方法对重组训练样本进行处理,得到n-w+1个事务集合;通过扩展分步Apriori分析方法,计算所述事务集合中各个事务之间的频繁项集的关联规则,以得到预测模型;其中,所述预测模型用于预测企业中污染物的异常排放。本申请根据企业在预设时间序列中排放污染物检测因子的检测数据序列,训练得到预测企业中污染物的异常排放的预测模型,并基于预测模型预测出企业在未来出现异常排放的时间节点,从而便于做出提前预警。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM通过多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (10)

1.一种预测污染物异常排放的方法,其特征在于,包括以下步骤:
获取企业在预设时间序列中排放污染物检测因子的检测数据序列:Q1=T1,T2,...Ti,Tj;其中,T1,T2,Ti,Tj,分别表示所述企业对应的检测因子在预设时间序列中的t1,t2,ti,tj时刻的检测值;其中,j=i+1;
计算所述检测数据序列中邻近时间之间的距离;
从所述检测数据序列中提取出预测序列,并计算所述预测序列中邻近时间之间的距离;
根据所述检测数据序列中邻近时间之间的距离以及所述预测序列中邻近时间之间的距离,从所述检测数据序列中提取出多个与所述预测序列最近邻的样本;其中,所述最近邻的样本数量为n个;
以w为时间步,从所述样本中提取出对应的重组训练样本;
通过多元时间序列的跨事务关联规则分析方法对所述重组训练样本进行处理,得到n-w+1个事务集合;
通过扩展分步Apriori分析方法,计算所述事务集合中各个事务之间的频繁项集的关联规则,以得到预测模型;并将所述检测数据序列输入至所述预测模型中,预测所述企业出现污染物异常排放的时间节点。
2.根据权利要求1所述的预测污染物异常排放的方法,其特征在于,所述计算所述检测数据序列中邻近时间之间的距离,包括:
通过标准化欧式距离计算所述检测数据序列中邻近时间之间的距离,其中邻近时间为两个相邻时刻,分别为ti,tj
计算公式为:
Figure FDA0002648081260000011
QTi,j是两个相邻时间的点乘,m是时间窗,μi是Ti,m的均值,μj是Tj,m的均值,σi是Ti,m的标准差,σj是Tj,m的标准差;
QTi,j=QTi-1,j-1-ti-1*tj-1+ti+m-1*tj+m-1
3.根据权利要求1所述的预测污染物异常排放的方法,其特征在于,所述t1=t0+Δt,ti=t0+iΔt,tj=t0+jΔt。
4.根据权利要求1所述的预测污染物异常排放的方法,其特征在于,所述通过扩展分步Apriori分析方法,计算所述事务集合中各个事务之间的频繁项集的关联规则,以得到预测模型的步骤之后,包括:
基于所述预测模型,预测所述企业的污染物的异常排放信息,所述异常排放信息包括异常时间、企业信息以及异常的污染物检测因子;
获取所述异常时间的节点数量,并判断所述节点数量是否大于阈值;
若大于,则将所述异常排放信息添加至预设预警模板中生成初始预警图片;
从所述异常时间中获取最接近当前时间的目标异常时间,获取目标异常时间与当前时间的差值;
根据数据库中预存的差值与标签的对应关系,获取对应所述差值的标签;
将所述标签作为图层,并将所述企业信息合成至所述图层中,得到目标图层;
根据所述异常时间、企业信息以及异常的污染物检测因子生成防伪码;
将所述目标图层合成至所述初始预警图片中,并将所述防伪码添加至所述初始预警图片中,得到预警图片;
将所述预警图片发送至所述企业对应的管理终端。
5.根据权利要求4所述的预测污染物异常排放的方法,其特征在于,所述根据所述异常时间、企业信息以及异常的污染物检测因子生成防伪码的步骤,包括:
将每一个所述异常时间分别与所述企业信息进行组合得到第一组合信息;
将各个所述第一组合信息分别进行哈希计算之后进行拼接得到第二组合信息;
对所述第二组合信息进行哈希计算得到对应的哈希值;
将所述哈希值与所述异常的污染物检测因子进行拼接并进行哈希计算,得到所述防伪码。
6.根据权利要求1所述的预测污染物异常排放的方法,其特征在于,所述方法还包括:
将所述检测数据序列以及所述预测模型存储于区块链中。
7.一种预测污染物异常排放的装置,其特征在于,包括:
第一获取单元,用于获取企业在预设时间序列中排放污染物检测因子的检测数据序列:Q1=T1,T2,...Ti,Tj;其中,T1,T2,Ti,Tj,分别表示所述企业对应的检测因子在预设时间序列中的t1,t2,ti,tj时刻的检测值;其中,j=i+1;
第一计算单元,用于计算所述检测数据序列中邻近时间之间的距离;
第二计算单元,用于从所述检测数据序列中提取出预测序列,并计算所述预测序列中邻近时间之间的距离;
第一提取单元,用于根据所述检测数据序列中邻近时间之间的距离以及所述预测序列中邻近时间之间的距离,从所述检测数据序列中提取出多个与所述预测序列最近邻的样本;其中,所述最近邻的样本数量为n个;
第二提取单元,用于以w为时间步,从所述样本中提取出对应的重组训练样本;
处理单元,用于通过多元时间序列的跨事务关联规则分析方法对所述重组训练样本进行处理,得到n-w+1个事务集合;
第三计算单元,用于通过扩展分步Apriori分析方法,计算所述事务集合中各个事务之间的频繁项集的关联规则,以得到预测模型;并将所述检测数据序列输入至所述预测模型中,预测所述企业出现污染物异常排放的时间节点。
8.根据权利要求7所述的预测污染物异常排放的装置,其特征在于,所述第一计算单元计算所述检测数据序列中邻近时间之间的距离,包括:
通过标准化欧式距离计算所述检测数据序列中邻近时间之间的距离,其中邻近时间为两个相邻时刻,分别为ti,tj
计算公式为:
Figure FDA0002648081260000041
QTi,j是两个相邻时间的点乘,m是时间窗,μi是Ti,m的均值,μj是Tj,m的均值,σi是Ti,m的标准差,σj是Tj,m的标准差;
QTi,j=QTi-1,j-1-ti-1*tj-1+ti+m-1*tj+m-1
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202010582358.5A 2020-06-23 2020-06-23 预测污染物异常排放的方法、装置、计算机设备 Active CN111489041B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010582358.5A CN111489041B (zh) 2020-06-23 2020-06-23 预测污染物异常排放的方法、装置、计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010582358.5A CN111489041B (zh) 2020-06-23 2020-06-23 预测污染物异常排放的方法、装置、计算机设备

Publications (2)

Publication Number Publication Date
CN111489041A CN111489041A (zh) 2020-08-04
CN111489041B true CN111489041B (zh) 2020-10-16

Family

ID=71795916

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010582358.5A Active CN111489041B (zh) 2020-06-23 2020-06-23 预测污染物异常排放的方法、装置、计算机设备

Country Status (1)

Country Link
CN (1) CN111489041B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114757296B (zh) * 2022-04-29 2022-12-13 广东技术师范大学 一种基于协同数据的污染物分析方法和装置
CN115290831B (zh) * 2022-09-30 2024-02-13 深圳市益清源环保科技有限公司 一种空气质量检测方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104809511A (zh) * 2014-01-28 2015-07-29 国际商业机器公司 绝缘子污染预测方法及设备
CN111125641A (zh) * 2019-12-25 2020-05-08 广州博进信息技术有限公司 一种大气污染异常识别与成因分析方法、装置及存储介质

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102682573B (zh) * 2012-03-31 2016-08-03 上海海洋大学 一种基于时间序列分析的风暴潮灾害预警系统
US10296838B2 (en) * 2014-01-07 2019-05-21 Sk Techx Co., Ltd. Apparatus and method for changing alarm information in accordance with weather
WO2016129715A1 (ko) * 2015-02-10 2016-08-18 주식회사 주빅스 환경 재난, 재해 조기감지를 위한 대기질 예측 및 관리 시스템
US10635760B2 (en) * 2016-03-21 2020-04-28 Weatherford Technology Holdings, Llc Real-time fluid contamination prediction using bilinear programming
CN106290737A (zh) * 2016-08-29 2017-01-04 淮沪电力有限公司田集第二发电厂 电厂污染物排放值预测方法
CN107193056A (zh) * 2017-05-09 2017-09-22 西南石油大学 空气污染物监测预警方法及云平台
CN107633254A (zh) * 2017-07-25 2018-01-26 平安科技(深圳)有限公司 建立预测模型的装置、方法及计算机可读存储介质
CN110135622B (zh) * 2019-04-12 2021-05-04 山东开创云计算有限公司 一种河水水质污染预测方法和装置
CN110276409A (zh) * 2019-06-27 2019-09-24 腾讯科技(深圳)有限公司 一种时间序列异常检测方法、装置、服务器和存储介质
CN110807577A (zh) * 2019-10-15 2020-02-18 中国石油天然气集团有限公司 污染排放预测方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104809511A (zh) * 2014-01-28 2015-07-29 国际商业机器公司 绝缘子污染预测方法及设备
CN111125641A (zh) * 2019-12-25 2020-05-08 广州博进信息技术有限公司 一种大气污染异常识别与成因分析方法、装置及存储介质

Also Published As

Publication number Publication date
CN111489041A (zh) 2020-08-04

Similar Documents

Publication Publication Date Title
CN111489041B (zh) 预测污染物异常排放的方法、装置、计算机设备
Garcia et al. Random forest for malware classification
CN105897714A (zh) 基于dns流量特征的僵尸网络检测方法
CN112527630B (zh) 测试用例生成方法、装置、计算机设备和存储介质
CN111818198B (zh) 域名检测方法、域名检测装置和设备以及介质
CN113791926A (zh) 智能告警分析方法、装置、设备及存储介质
CN113839817A (zh) 一种网络资产风险评估方法、装置及系统
CN114079579B (zh) 一种恶意加密流量检测方法及装置
CN112329865A (zh) 基于自编码器的数据异常识别方法、装置和计算机设备
CN111191201A (zh) 基于数据埋点的用户识别方法、装置、设备及存储介质
CN111818101B (zh) 网络安全性的检测方法、装置、计算机设备和存储介质
CN111897695A (zh) 获取kpi异常数据样本的方法、装置和计算机设备
CN112767008A (zh) 企业营收趋势的预测方法、装置、计算机设备及存储介质
Smarra et al. Learning methods for structural damage detection via entropy‐based sensors selection
CN113127626A (zh) 基于知识图谱的推荐方法、装置、设备及可读存储介质
CN116401464A (zh) 一种职业用户画像的构建方法、装置、设备及存储介质
CN113947076A (zh) 保单数据的检测方法、装置、计算机设备及存储介质
Sakhare et al. Classification of criminal data using J48-Decision Tree algorithm
CN111679953B (zh) 基于人工智能的故障节点识别方法、装置、设备和介质
Dervilis et al. A non‐linear manifold strategy for SHM approaches
CN116366303A (zh) 基于深度学习的网络异常检测方法、装置、设备及介质
CN115454788A (zh) 一种日志异常检测方法、装置、设备及存储介质
CN113923058B (zh) 一种非即时能源数据分析的大数据预警方法与装置
CN117236826B (zh) 物流托盘的码放识别方法、装置、设备及存储介质
CN115941265B (zh) 一种应用于云服务的大数据攻击处理方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant