CN112669190A - 污染源异常排放行为的检测方法、装置及计算机设备 - Google Patents
污染源异常排放行为的检测方法、装置及计算机设备 Download PDFInfo
- Publication number
- CN112669190A CN112669190A CN202110287736.1A CN202110287736A CN112669190A CN 112669190 A CN112669190 A CN 112669190A CN 202110287736 A CN202110287736 A CN 202110287736A CN 112669190 A CN112669190 A CN 112669190A
- Authority
- CN
- China
- Prior art keywords
- probability value
- pollution source
- detected
- data
- abnormal emission
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Testing And Monitoring For Control Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种污染源异常排放行为的检测方法、装置及计算机设备,主要在于能够提高污染源异常排放行为的检测精度,提升监测结果的准确性。其中方法包括:获取待检测污染源对应的多维度属性数据;分别计算所述待检测污染源在所述多维度属性数据下存在异常排放行为的第一概率值和不存在异常排放行为的第二概率值;若所述第一概率值大于所述第二概率值,则判定所述待检测污染源存在疑似异常排放行为。本发明适用于污染源异常排放行为的监测。
Description
技术领域
本发明涉及人工智能技术领域,尤其是涉及一种污染源异常排放行为的检测方法、装置及计算机设备。
背景技术
大气污染成因涉及污染物排放情况、化学转化、气象条件变化、污染传输等方面,其中污染物排放是主因,由于大气污染物排放源具有数量多、种类杂、分布广等特点,对污染源的监管面临着监管人员数量少、监管区域大、不能及时发现问题等客观困难,因此如何实现对污染源的有效监管是亟待解决的问题。
目前,在对污染源进行异常排放检测的过程中,通常只对单一维度的监测数据进行阈值分析,并根据分析结果判定污染源是否存在异常排放行为。然而,与污染源异常排放相关的因素有很多,这种对单一维度的监测数据进行阈值分析的方式,无法综合考虑其他因素对检测结果的影响,从而导致污染源异常排放行为的检测精度较低。
发明内容
本发明提供了一种污染源异常排放行为的检测方法、装置及计算机设备,主要在于能够提高污染源异常排放行为的检测精度,提升监测结果的准确性。
根据本发明的第一个方面,提供一种污染源异常排放行为的检测方法,包括:
获取待检测污染源的多维度属性数据;
分别计算所述待检测污染源在所述多维度属性数据下存在异常排放行为的第一概率值和不存在异常排放行为的第二概率值;
若所述第一概率值大于所述第二概率值,则判定所述待检测污染源存在疑似异常排放行为。
根据本发明的第二个方面,提供一种污染源异常排放行为的检测装置,包括:
获取单元,用于获取待检测污染源的多维度属性数据;
计算单元,用于分别计算所述待检测污染源在所述多维度属性数据下存在异常排放行为的第一概率值和不存在异常排放行为的第二概率值;
确定单元,用于若所述第一概率值大于所述第二概率值,则判定所述待检测污染源存在疑似异常排放行为。
根据本发明的第三个方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤:
获取待检测污染源的多维度属性数据;
分别计算所述待检测污染源在所述多维度属性数据下存在异常排放行为的第一概率值和不存在异常排放行为的第二概率值;
若所述第一概率值大于所述第二概率值,则判定所述待检测污染源存在疑似异常排放行为。
根据本发明的第四个方面,提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以下步骤:
获取待检测污染源的多维度属性数据;
分别计算所述待检测污染源在所述多维度属性数据下存在异常排放行为的第一概率值和不存在异常排放行为的第二概率值;
若所述第一概率值大于所述第二概率值,则判定所述待检测污染源存在疑似异常排放行为。
本发明提供的一种污染源异常排放行为的检测方法、装置及计算机设备,与目前只对单一维度的监测数据进行阈值分析的方式相比,本发明能够获取待检测污染源的多维度属性数据;并分别计算所述待检测污染源在所述多维度属性数据下存在异常排放行为的第一概率值和不存在异常排放行为的第二概率值;若所述第一概率值大于所述第二概率值,则判定所述待检测污染源存在疑似异常排放行为,由此通过对待检测污染源的多维度属性数据进行综合分析,能够得到待检测污染源在多维度属性数据下存在异常排放行为的第一概率值和不存在异常排放行为的第二概率值,进而通过比较第一概率值和第二概率值,能够判定待检测污染源是否存在异常排放行为,提高了污染源异常排放行为的检测精度。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了本发明实施例提供的一种污染源异常排放行为的检测方法流程图;
图2示出了本发明实施例提供的另一种污染源异常排放行为的检测方法流程图;
图3示出了本发明实施例提供的一种污染源异常排放行为的检测装置的结构示意图;
图4示出了本发明实施例提供的另一种污染源异常排放行为的检测装置的结构示意图;
图5示出了本发明实施例提供的一种计算机设备的实体结构示意图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
目前,对单一维度的监测数据进行阈值分析的方式,无法综合考虑其他因素对检测结果的影响,从而导致污染源异常排放行为的检测精度较低。
为了解决上述问题,本发明实施例提供了一种污染源异常排放行为的检测方法,如图1所示,所述方法包括:
101、获取待检测污染源的多维度属性数据。
其中,待检测污染源具体指会进行污染排放的企业或者区域,区域具体包括省份、城市、县城、乡镇、园区等,如对某企业或者某园区进行污染源异常排放检测,多维度属性数据可以包括生态环境质量数据、污染源管理数据和物联网监管数据等,生态环境质量数据具体包括空气质量自动站监测、地面微型站、卫星遥感反演、无人机及走航车等手段监测获取的空气质量数据,污染源管理数据具体包括污染源的位置信息、所属行业信息、企业评价信息、工商数据、周边土地利用数据和执法检查数据等,物联网监管数据具体包括视频监控数据、环保设施用水数据和用电监控数据等,需要说明的是,本发明实施例中的多维度属性数据不仅局限于上述列举的数据,还可以包括其他维度数据,如气象数据、舆情信息和互联网兴趣点等。
为了克服现有技术中对污染源异常排放行为检测精度较低的问题,本发明实施例,通过收集待检测污染源的多维度属性数据,并对该多维度属性数据进行综合分析,进而根据综合分析结果判定待检测污染源是否存在异常排放行为,由此能够提高对污染源异常排放行为的检测精度。本发明实施例主要应用于对污染源进行异常排放行为检测的场景,本发明实施例的执行主体为能够进行异常排放行为检测的装置或者设备,具体可以设置在客户端或者服务器一侧。
对于本发明实施例,当需要对污染源的异常排放行为进行检测时,需要收集待检测污染源的多维度属性数据,具体地,首先确定待检测污染源的空间范围,具体可以按照行政区划或者网格来进行划分,如待检测污染源的空间范围为省、市、县、乡镇、园区、50公里*50公里的矩形范围、半径20公里的圆形范围,之后确定数据收集的时间段,该时间段具体可以为一年、半年、3个月、一个月、5月3日至5月13日等。具体根据确定的时间段收集数据时,可以从空气质量发布网站、卫星数据发布网站和监测设备等获取环境质量监测数据,从生态环境部门发布的大气污染源排放清单、重污染天气应急减排清单、执法检查或监督帮扶台账等获取污染源管理数据,从视频监控、环保设施用户数据、用电监控数据获取物联网监管数据,也可以从相关部门和互联网发布的信息中获取其他维度数据,如从气象信息发布站获取气象数据,从社交网站获取舆情数据,从互联网获取网络兴趣点数据。
进一步地,在收集完相应时间段的数据后,可以根据待检测污染源的地理位置信息或者名称信息对收集的多维度数据进行整合,位置信息具体包括待检测污染源的经纬度信息,例如,根据某企业的名称字段或者位置字段,从大量数据中筛选出针对该企业的不同来源数据,并进行数据整合,形成针对该企业的统一数据集,也可以依据其他字段对数据进行筛选和整合,本发明实施例不做具体限定,由此按照上述方式能够获取针对该企业的多维度属性数据,以便对多维度属性数据进行综合分析,判定待检测污染源是否存在异常排放行为。
需要说明的是,本发明实施例中待检测污染源不仅可以指企业,也可以指园区、乡镇、城市等,同理可以根据园区、乡镇或者城市的字段信息,从大量数据中筛选出针对园区、乡镇或者城市的不同来源数据进行整合,能够得到针对园区、乡镇或者城市的统一数据集,此外,在本发明实施例中,园区的空间范围要大于企业的空间范围,园区中可以包含多个企业,在不需要对污染源进行精确定位时,可以仅针对某个园区、某乡镇或者某城市进行污染排放异常检测。
102、分别计算所述待检测污染源在所述多维度属性数据下存在异常排放行为的第一概率值和不存在异常排放行为的第二概率值。
对于本发明实施例,通过对待检测污染源的多维度属性数据进行综合分析,计算待检测污染源在多维度属性数据下存在异常排放行为的第一概率值和不存在异常排放行为的第二概率值,能够对待检测污染源进行分类,进而根据该分类结果能够确定待检测污染源是否存在异常排放行为,具体地,将待检测污染源的多维度属性数据输入至预设异常排放识别贝叶斯模型,能够得到待检测污染源在多维度属性数据下存在异常行为的第一概率值和不存在异常行为的第二概率值,进而通过比较第一概率值和第二概率值的大小,判定待检测污染源是否存在异常排放行为,由此利用预设异常排放识别贝叶斯模型能够对待检测污染源的多维度属性数据进行综合分析,进而根据该综合分析结果,能够判定待检测污染源是否存在异常排放行为,相比于现有技术中仅对单一维度的数据进行阈值分析,本发明实施例对污染源异常排放行为的检测精度更高。
103、若所述第一概率值大于所述第二概率值,则判定所述待检测污染源存在疑似异常排放行为。
对于本发明实施例,在利用预设异常排放识别贝叶斯模型计算出的待检测污染源在多维度属性数据下存在异常排放行为的第一概率值和不存在异常排放行为的第二概率值之后,比较第一概率值和第二概率值的大小,如果第一概率值大于第二概率值,则确定待检测污染源存在异常排放行为,可以发出报警信息,并通知相关负责人员监督污染源进行整改;如果第一概率值小于第二概率值,则确定待检测污染源不存在异常排放行为,由此通过定期采集待检测污染源的多维度属性数据,并利用预设异常排放识别贝叶斯模型对其进行综合分析,能够实现对污染源的有效监管。
本发明实施例提供的一种污染源异常排放行为的检测方法、装置及计算机设备,与目前只对单一维度的监测数据进行阈值分析的方式相比,本发明能够获取待检测污染源的多维度属性数据;并分别计算所述待检测污染源在所述多维度属性数据下存在异常排放行为的第一概率值和不存在异常排放行为的第二概率值;若所述第一概率值大于所述第二概率值,则判定所述待检测污染源存在疑似异常排放行为,由此通过对待检测污染源的多维度属性数据进行综合分析,能够得到待检测污染源在多维度属性数据下存在异常排放行为的第一概率值和不存在异常排放行为的第二概率值,进而通过比较第一概率值和第二概率值,能够判定待检测污染源是否存在异常排放行为,提高了污染源异常排放行为的检测精度。
进一步的,为了更好的说明上述对污染源异常排放行为的检测过程,作为对上述实施例的细化和扩展,本发明实施例提供了另一种污染源异常排放行为的检测方法,如图2所示,所述方法包括:
201、收集待检测污染源的多维度监测数据,对所述多维度监测数据进行缺失值补值处理,得到补值处理后的多维度监测数据。
对于本发明实施例,异常排放行为与污染源的很多维度数据相关,例如,在某污染源用电量上升且周边环境污染浓度升上时,该污染源存在异常排放行为的可能性较大,污染源的多维度数据具体可以包括污染源所属行业、所在位置、环境管理水平、用电监控数据等,在实际应用中,可以根据业务需求可以将污染源的数据维度划分的更加细致,本发明实施例仅选取部分维度数据进行说明,但并不以此为限,在本发明实施例中,污染源的多维度数据包括污染源的行业信息、位置信息、环境空气质量数据、环境空气质量同比变化和/或环比变化、污染排放监测浓度、污染排放监测浓度同比变化和/或者环比变化、用电量数据、用电量同比变化和/或环比变化等,可以从监测设备、相关部门和相关发布网站上收集待检测污染源在特定时间段内的多维度监测数据,或者可以直接从监测设备、相关部门和相关发布网站上收集包含多个污染源的监测数据,之后再根据待检测污染源的特定字段对收集的数据进行整合,得到待检测污染源的多维度监测数据,其中,特定字段可以包括污染源的位置信息、名称信息等,例如,企业的名称为亚美化肥厂,则可以从收集的数据中将与亚美化肥厂字段相关的数据筛选出来,并进行整合,得到待检测污染源亚美化肥厂的多维度监测数据,以便对多维度监测数据进行预处理后,对其进行综合性分析。
进一步地,得到待检测污染源的多维度监测数据后,为了能够利用预设异常排放识别贝叶斯模型对多维度监测数据进行综合分析,需要先对多维度监测数据进行预处理,其中,预处理过程包括缺失值补值处理和离散化处理。针对缺失值处理过程,可以通过计算多维监测数据的平均值,利用该平均值进行补值处理,例如,需要获取待检测污染源在7月份的环境空气质量数据,由于没有7月份的环境空气质量数据,可以通过获取这一年中其他所有月份的环境空气质量数据,并计算其对应的平均值,将该平均值确定为待检测污染源在7月份的环境空气质量数据,此外,还可以采用预设内差值算法对待检测污染源的多维监测数据进行缺失值补值处理,例如,在对7月份的环境空气质量数据进行补值的过程中,可以将其他11个月的环境质量空气数据拟合成一条曲线f(x),拟合过程中尽量可能保证这11个月的环境质量空气数据通过这条曲线f(x),之后利用函数f(x)估算7月份待检测污染源的环境空气质量数据,从而实现利用预设插值算法实现对多维度监测数据进行补值处理。
202、对所述补值处理后的多维度监测数据进行离散化处理,得到所述待检测污染源的多维度属性数据。
对于本发明实施例,由于预设异常排放识别贝叶斯模型的输入数据为离散型的数据,因此在得到经过补值处理的多维度数据后,还需要对补值处理后的多维度监测数据进行离散化处理,进而能够得到待检测污染源的多维度属性数据,针对离散化处理的具体过程,作为一种可选实施方式,步骤202具体包括:确定所述补值处理后的多维度监测数据的类别信息;基于所述类别信息,对所述补值后的多维度监测数据进行离散化处理,得到所述待检测污染源的多维度属性数据。
具体地,针对待检测污染源的行业信息,可以按照其对应的监管类型对待检测污染源的所属行业进行分类,如可以将待检测污染源的所属行业划分为重点行业和非重点行业,还可以按照活动水平对用电量的敏感程度将待检测污染源的所属行业划分为活动水平对用电量高敏感行业、活动水平对用电量高敏感行业和活动水平对用电量低敏感行业,如果待检测污染源的所属行业为短流程钢铁、铁合金、铸件、电解铝、石墨电极、有色金属压延、水泥、砖瓦窑、耐火材料、岩矿棉、玻璃钢、防水建筑材料制造、涂料制造、油墨制造、纤维素醚、包装印刷、人造板制造、塑料人造革与合成革制造、制鞋、橡胶制品制造、家具制造和工业涂装等,则将待检测污染源的所属行业划分为活动水平对用电量高敏感行业;如果待检测污染源的所属行业为长流程钢铁、铸造用生铁、焦化、氧化铝、炭素、钼冶炼、再生铜铝铅锌、陶瓷、非电石企业配套的石灰窑、铸造、炭黑、制药、农药制造、汽车整车制造、工程机械制电石企业配套的石灰窑、铸造、炭黑、制药、农药制造、汽车整车制造、工程机械制造,则将待检测污染源的所属行业划分为活动水平对用电量中敏感行业;如果待检测污染源的所属行业为玻璃、炼油与石油化工、煤制氮肥、铜冶炼、铅锌冶炼等,则将待检测污染源的所属行业划分为活动水平对用电量低敏感行业,由此能够将待检测污染源的行业信息进行分类,进而通过对其分类实现对行业信息的离散化处理。
针对待检测污染源的位置信息,可以按照其所属的区县进行分类;针对环境空气质量数据,可以按照四分位法对其进行分类,例如,需要确定7月份的环境空气质量数据的类别,可以将这一年1-12月份的环境空气质量数据从大到小或者从小到大进行排名,根据排名结果对7月份的环境空气质量数据进行划分,如果7月份的环境空气质量数据的排名处于前四分之一,则确定7月份的环境空气质量数据属于A1类;如果7月份的环境空气质量数据的排名处于第二个四分之一,则确定7月份的环境空气质量数据属于A2类;如果7月份的环境空气质量数据的排名处于第三个四分之一,则确定7月份的环境空气质量数据属于A3类;如果7月份的环境空气质量数据处于最后一个四分之一,则确定7月份的环境空气质量数据属于A4类,由此能够实现利用4分为法对空气质量数据进行分类,此外,还可以按照阈值标准将空气质量数据划分至相应的类别,例如,将空气质量数据PM2.5划分成5类,包括:A1类0-35微克/立方米,A2类35-75微克/立方米,A3类75-115微克/立方米,A4类115-150微克/立方米,A5类大于150微克/立方米,如果7月份PM2.5的值为40,则确定7月份的空气质量数据PM2.5属于A2类。
针对环境空气质量同比变化和/或环比变化,也可以利用四分位法或者按照特定阈值,将其划分至相应的类别,例如,将环境空气质量同比变化分化成6类,分别为A1类小于-20%,A2类-20%~-10%,A3类-10%~-0%,A4类0~10%,A5类10~20%,A6类大于20%,如果7月份环境控制质量同比变化为15%,则确定7月份的空气质量数据属于A5类。同理,污染排放监测浓度可以参照环境空气质量数据进行分类,污染排放监测浓度同比变化和/或环比变化可以参照环境空气质量同比变化和/或环比变化进行分类。进一步地,针对用电量数据,由于用电量数据范围较大可以对其进行对数取值处理,之后按照标准阈值对其进行分类;针对用电量同比变化和/或环比变化可以参照环境空气质量同比变化和/或环比变化进行分类,如果还有其他维度的监测数据,也可以采用相似方法对其进行分类,或者根据行业经验对其进行分类,由此通过对多维度监测数据进行分类,能够实现对多维度数据进行离散化处理,得到待检测污染源的多维度属性数据,以便利用预设异常排放识别贝叶斯模型对多维度属性数据进行综合分析。
203、分别计算所述待检测污染源在所述多维度属性数据下存在异常排放行为的第一概率值和不存在异常排放行为的第二概率值。
对于本发明实施例,为了对待检测污染源的多维度属性数据进行综合分析,计算待检测污染源在多维度属性数据下存在异常排放行为的第一概率值和不存在异常排放行为的第二概率值,步骤203具体包括:获取样本污染源的多维度样本属性数据,并基于所述多维度样本属性数据构建预设异常排放识别贝叶斯模型;利用所述预设异常排放识别贝叶斯模型计算所述样本污染源存在异常排放行为的第三概率值和不存在异常排放行为的第四概率值,以及所述多维度属性数据分别在存在异常排放行为条件下的第五概率值和不存在异常排放行为条件下的第六概率值;根据所述第三概率值、所述第四概率值、所述第五概率值和所述第六概率值,计算所述待检测污染源在多维度属性下存在异常排放行为的第一概率值和不存在异常排放行为的第二概率值。进一步地,所述根据所述第三概率值、所述第四概率值、所述第五概率值和所述第六概率值,计算所述待检测污染源在多维度属性下存在异常排放行为的第一概率值和不存在异常排放行为的第二概率值,包括:将所述第三概率值和所述第五概率值相乘,得到所述待检测污染源在多维度属性下存在异常排放行为的第一概率值;将所述第四概率值和所述第六概率值相乘,得到所述待检测污染源在多维度属性下不存在异常排放行为的第二概率值。
具体地,表1为样本污染源的多维度样本属性数据,在确定待检测污染源的多维度属性数据之后,根据多维度样本属性数据和待检测污染源的多维度属性数据,利用预设异常排放识别贝叶斯算法计算第一概率值和第二概率值,为了更好的说明第一概率值和第二概率值的计算过程,本发明实施例以多维度属性数据行业信息、位置信息和环境空气质量数据为例详细说明计算过程。
表1
例如,待检测污染源的多维度属性数据为重点行业、B区、A1类,利用上述表中的多维度样本属性数据,推测待检测污染源是否存在异常排放行为,具体需要分别计算待检测污染源在多维度属性数据下存在异常排放行为的第一概率值和不存在异常排放行为的第二概率值,计算公式如下:
其中,C0代表污染源存在异常排放行为,C1代表污染源不存在异常排放行为,和分别代表污染源在多维度属性数据下存在异常排放行为的第一概率值和不存在异常排放行为的第二概率值,P(C0)代表污染源存在异常排放行为的第三概率值,P(C1)代表污染源不存在异常排放行为的第四概率值,代表多维度属性数据在存在异常排放行为条件下的第五概率值,代表多维度属性数据在不存在异常排放行为条件下的第六概率值。
在本发明实施例中,根据表格中的样本属性数据可以得出P(C0)=P(C1)=1/2,之后再计算第五概率值和第六概率值,并将第三概率值和第五概率值相乘,第四概率值和第六概率值相乘,最终将相乘结果比较大小,便能够得知待检测污染源是否存在排放异常行为。在计算第五概率值和第六概率值的过程中,由于假定行业信息、位置信息和环境空气质量数据之间是相互独立的,因此可以到计算公式:
其中,根据表1中的样本属性数据可以得出P(A1/C0)=2/4=1/2,P(A2/C0)=2/4=1/2,P(A3/C0)=1/4,P(A1/C1)=1/4,P(A2/C1)=0,P(A3/C1)=2/4=1/2,由此可以得到=1/16,=0,因此,能够确定待检测污染源存在异常排放行为。
在具体应用场景中,构建完成预设异常排放识别贝叶斯模型之后,为了保证模型的准确度,还需要利用验证集对模型的准确度进行验证,基于此,所述方法还包括:利用数据验证集对构建的预设异常排放识别贝叶斯模型进行准确度验证,得到检测结果正确的数据量;将所述检测结果正确的数据量除以所述数据验证集的总数据量,得到所述预设异常排放识别贝叶斯模型的准确度;若所述预设异常排放识别贝叶斯模型的准确度小于预设准确度,则对所述预设异常排放识别贝叶斯模型进行参数优化。
具体地,统计数据验证集中检测结果正确的数据量以及数据验证集的总数据量,将检测结果正确的数据量除以总数据量,得到预设异常排放识别贝叶斯模型的准确度,如果预设异常排放识别贝叶斯模型的准确度小于预设准确度,则可以筛选出验证集中结果错误的多维度验证属性数据,并分析结果错误的多维度验证属性数据所划分的类别,进而细化样本属性的分类,基于此,所述对所述预设异常排放识别贝叶斯模型进行参数优化,包括:确定所述数据验证集中检测结果错误的多维度验证属性数据的类别信息,并将所述多维度样本属性数据按照所属类别信息进行细化;基于细化后的多维度样本属性数据,训练所述预设异常排放识别贝叶斯模型。例如,通过分析确定结果错误的验证属性数据环境空气质量数据按照标准阈值被分为6类,而样本属性数据环境空气质量数据分为5类,为了提高预设异常排放识别贝叶斯模型的识别精度,需要将样本属性数据环境空气质量数据细化为6类,进而利用细化后的多维度样本属性数据和预设异常排放识别贝叶斯模型,综合分析待检测污染源是否存在异常排放行为。
此外,还可以通过调节预设异常排放识别贝叶斯模型中的拉普拉斯参数,提高模型的识别精度,基于此,所述方法包括:对所述预设异常排放识别贝叶斯模型中的拉普拉斯参数进行调整,直至调整后的预设异常排放识别贝叶斯模型通过准确度验证。具体地,计算P(A1/C0)的公式如下:
P(A1/C0)=(存在异常排放行为的样本中属于A1类的样本总数+a)/(存在异常排放行为的样本总数+a)
其中,a为拉普拉斯参数,通过拉普拉斯参数可以避免计算的概率值为0,例如,当待检测污染源某维度的属性数据属于A1类,而相应维度的样本属性数据不存在A1类,此时计算的概率值为0,这样会导致分析结果存在偏差,因此为了避免计算的概率值为0,可以添加拉普拉斯参数,如果模型的准确度没有达到预设准确度要求,则可以对拉普拉斯参数进行调整,如将其从1调整至0.8,然后重新对模型进行验证,重复该过程直至调整后的预设异常排放识别贝叶斯模型通过准确度验证。
204、若所述第一概率值大于所述第二概率值,则判定所述待检测污染源存在疑似异常排放行为。
本发明实施例提供的另一种污染源异常排放行为的检测方法、装置及计算机设备,与目前只对单一维度的监测数据进行阈值分析的方式相比,本发明能够获取待检测污染源的多维度属性数据;并分别计算所述待检测污染源在所述多维度属性数据下存在异常排放行为的第一概率值和不存在异常排放行为的第二概率值;若所述第一概率值大于所述第二概率值,则判定所述待检测污染源存在疑似异常排放行为,由此通过对待检测污染源的多维度属性数据进行综合分析,能够得到待检测污染源在多维度属性数据下存在异常排放行为的第一概率值和不存在异常排放行为的第二概率值,进而通过比较第一概率值和第二概率值,能够判定待检测污染源是否存在异常排放行为,提高了污染源异常排放行为的检测精度。
进一步地,作为图1的具体实现,本发明实施例提供了一种污染源异常排放行为的检测装置,如图3所示,所述装置包括:获取单元31、计算单元32和确定单元33。
所述获取单元31,可以用于获取待检测污染源的多维度属性数据。
所述计算单元32,可以用于分别计算所述待检测污染源在所述多维度属性数据下存在异常排放行为的第一概率值和不存在异常排放行为的第二概率值。
所述确定单元33,可以用于若所述第一概率值大于所述第二概率值,则判定所述待检测污染源存在疑似异常排放行为。
在具体应用场景中,为了计算计算所述待检测污染源在所述多维度属性数据下存在异常排放行为的第一概率值和不存在异常排放行为的第二概率值,如图4所示,所述计算单元32包括:构建模块321和计算模块322。
所述构建模块321,可以用于获取样本污染源的多维度样本属性数据,并基于所述多维度样本属性数据构建预设异常排放识别贝叶斯模型。
所述计算模块322,可以用于利用所述预设异常排放识别贝叶斯模型计算所述样本污染源存在异常排放行为的第三概率值和不存在异常排放行为的第四概率值,以及所述多维度属性数据分别在存在异常排放行为条件下的第五概率值和不存在异常排放行为条件下的第六概率值。
所述计算模块322,还可以用于根据所述第三概率值、所述第四概率值、所述第五概率值和所述第六概率值,计算所述待检测污染源在多维度属性下存在异常排放行为的第一概率值和不存在异常排放行为的第二概率值。
在具体应用场景中,所述计算模块322,具体可以用于将所述第三概率值和所述第五概率值相乘,得到所述待检测污染源在多维度属性下存在异常排放行为的第一概率值;将所述第四概率值和所述第六概率值相乘,得到所述待检测污染源在多维度属性下不存在异常排放行为的第二概率值。
进一步地,为了验证预设异常排放识别贝叶斯模型的准确度,所述计算单元32还包括:验证模块323、相除模块324和优化模块325。
所述验证模块323,可以用于利用数据验证集对构建的预设异常排放识别贝叶斯模型进行准确度验证,得到检测结果正确的数据量。
所述相除模块324,可以用于将所述检测结果正确的数据量除以所述数据验证集的总数据量,得到所述预设异常排放识别贝叶斯模型的准确度。
所述优化模块325,可以用于若所述预设异常排放识别贝叶斯模型的准确度小于预设准确度,则对所述预设异常排放识别贝叶斯模型进行参数优化。
在具体应用场景中,为了对对预设异常排放识别贝叶斯模型进行参数优化,所述优化模块325,具体可以用于确定所述数据验证集中检测结果错误的多维度验证属性数据的类别信息,并将所述多维度样本属性数据按照所述类别信息进行细化;基于细化后的多维度样本属性数据,训练所述预设异常排放识别贝叶斯模型;或者对所述预设异常排放识别贝叶斯模型中的拉普拉斯参数进行调整,直至调整后的预设异常排放识别贝叶斯模型通过准确度验证。
在具体应用场景中,为了获取待检测污染源的多维度属性数据,所述获取单元31,包括:收集模块311、补值模块312和离散模块313。
所述收集模块311,可以用于收集待检测污染源的多维度监测数据。
所述补值模块312,可以用于对所述多维度监测数据进行缺失值补值处理,得到补值处理后的多维度监测数据。
所述离散模块313,可以用于对所述补值处理后的多维度监测数据进行离散化处理,得到所述待检测污染源的多维度属性数据。
进一步地,为了对多维度监测数据进行离散化处理,所述离散模块313,包括:确定子模块和离散子模块。
所述确定子模块,可以用于确定所述补值处理后的多维度监测数据的类别信息。
所述离散子模块,可以用于基于所述类别信息,对所述补值后的多维度监测数据进行离散化处理,得到所述待检测污染源的多维度属性数据。
需要说明的是,本发明实施例提供的一种污染源异常排放行为的检测装置所涉及各功能模块的其他相应描述,可以参考图1所示方法的对应描述,在此不再赘述。
基于上述如图1所示方法,相应的,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤:获取待检测污染源的多维度属性数据;分别计算所述待检测污染源在所述多维度属性数据下存在异常排放行为的第一概率值和不存在异常排放行为的第二概率值;若所述第一概率值大于所述第二概率值,则判定所述待检测污染源存在疑似异常排放行为。
基于上述如图1所示方法和如图3所示装置的实施例,本发明实施例还提供了一种计算机设备的实体结构图,如图5所示,该计算机设备包括:处理器41、存储器42、及存储在存储器42上并可在处理器上运行的计算机程序,其中存储器42和处理器41均设置在总线43上所述处理器41执行所述程序时实现以下步骤:获取待检测污染源的多维度属性数据;分别计算所述待检测污染源在所述多维度属性数据下存在异常排放行为的第一概率值和不存在异常排放行为的第二概率值;若所述第一概率值大于所述第二概率值,则判定所述待检测污染源存在疑似异常排放行为。
通过本发明的技术方案,本发明能够获取待检测污染源的多维度属性数据;并分别计算所述待检测污染源在所述多维度属性数据下存在异常排放行为的第一概率值和不存在异常排放行为的第二概率值;若所述第一概率值大于所述第二概率值,则判定所述待检测污染源存在疑似异常排放行为,由此通过对待检测污染源的多维度属性数据进行综合分析,能够得到待检测污染源在多维度属性数据下存在异常排放行为的第一概率值和不存在异常排放行为的第二概率值,进而通过比较第一概率值和第二概率值,能够判定待检测污染源是否存在异常排放行为,提高了污染源异常排放行为的检测精度。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。
Claims (10)
1.一种污染源异常排放行为的检测方法,其特征在于,包括:
获取待检测污染源的多维度属性数据;
分别计算所述待检测污染源在所述多维度属性数据下存在异常排放行为的第一概率值和不存在异常排放行为的第二概率值;
若所述第一概率值大于所述第二概率值,则判定所述待检测污染源存在疑似异常排放行为。
2.根据权利要求1所述的方法,其特征在于,所述分别计算所述待检测污染源在所述多维度属性数据下存在异常排放行为的第一概率值和不存在异常排放行为的第二概率值,包括:
获取样本污染源的多维度样本属性数据,并基于所述多维度样本属性数据构建预设异常排放识别贝叶斯模型;
利用所述预设异常排放识别贝叶斯模型计算所述样本污染源存在异常排放行为的第三概率值和不存在异常排放行为的第四概率值,以及所述多维度属性数据分别在存在异常排放行为条件下的第五概率值和不存在异常排放行为条件下的第六概率值;
根据所述第三概率值、所述第四概率值、所述第五概率值和所述第六概率值,计算所述待检测污染源在多维度属性下存在异常排放行为的第一概率值和不存在异常排放行为的第二概率值。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第三概率值、所述第四概率值、所述第五概率值和所述第六概率值,计算所述待检测污染源在多维度属性下存在异常排放行为的第一概率值和不存在异常排放行为的第二概率值,包括:
将所述第三概率值和所述第五概率值相乘,得到所述待检测污染源在多维度属性下存在异常排放行为的第一概率值;
将所述第四概率值和所述第六概率值相乘,得到所述待检测污染源在多维度属性下不存在异常排放行为的第二概率值。
4.根据权利要求2所述的方法,其特征在于,在所述基于所述多维度样本属性数据构建预设异常排放识别贝叶斯模型之后,所述方法还包括:
利用数据验证集对构建的预设异常排放识别贝叶斯模型进行准确度验证,得到检测结果正确的数据量;
将所述检测结果正确的数据量除以所述数据验证集的总数据量,得到所述预设异常排放识别贝叶斯模型的准确度;
若所述预设异常排放识别贝叶斯模型对应的准确度小于预设准确度,则对所述预设异常排放识别贝叶斯模型进行参数优化。
5.根据权利要求4所述的方法,其特征在于,所述对所述预设异常排放识别贝叶斯模型进行参数优化,包括:
确定所述数据验证集中检测结果错误的多维度验证属性数据的类别信息,并将所述多维度样本属性数据按照所述类别信息进行细化;
基于细化后的多维度样本属性数据,训练所述预设异常排放识别贝叶斯模型;或者
对所述预设异常排放识别贝叶斯模型中的拉普拉斯参数进行调整,直至调整后的预设异常排放识别贝叶斯模型通过准确度验证。
6.根据权利要求1所述的方法,其特征在于,所述获取待检测污染源的多维度属性数据,包括:
收集待检测污染源的多维度监测数据;
对所述多维度监测数据进行缺失值补值处理,得到补值处理后的多维度监测数据;
对所述补值处理后的多维度监测数据进行离散化处理,得到所述待检测污染源的多维度属性数据。
7.根据权利要求6所述的方法,其特征在于,所述对所述补值处理后的多维度监测数据进行离散化处理,得到所述待检测污染源的多维度属性数据,包括:
确定所述补值处理后的多维度监测数据的类别信息;
基于所述类别信息,对所述补值后的多维度监测数据进行离散化处理,得到所述待检测污染源的多维度属性数据。
8.一种污染源异常排放行为的检测装置,其特征在于,包括:
获取单元,用于获取待检测污染源的多维度属性数据;
计算单元,用于分别计算所述待检测污染源在所述多维度属性数据下存在异常排放行为的第一概率值和不存在异常排放行为的第二概率值;
确定单元,用于若所述第一概率值大于所述第二概率值,则判定所述待检测污染源存在疑似异常排放行为。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110287736.1A CN112669190B (zh) | 2021-03-17 | 2021-03-17 | 污染源异常排放行为的检测方法、装置及计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110287736.1A CN112669190B (zh) | 2021-03-17 | 2021-03-17 | 污染源异常排放行为的检测方法、装置及计算机设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112669190A true CN112669190A (zh) | 2021-04-16 |
CN112669190B CN112669190B (zh) | 2021-07-20 |
Family
ID=75399597
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110287736.1A Active CN112669190B (zh) | 2021-03-17 | 2021-03-17 | 污染源异常排放行为的检测方法、装置及计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112669190B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116090709A (zh) * | 2023-04-10 | 2023-05-09 | 广东慧航天唯科技有限公司 | 基于金属加工监控的偷排预警分析方法及系统 |
CN116976733A (zh) * | 2023-07-31 | 2023-10-31 | 青岛熙正数字科技有限公司 | 一种基于大数据的大气污染源在线监测数据评估系统 |
CN117236971A (zh) * | 2023-09-21 | 2023-12-15 | 中节能天融科技有限公司 | 多工况排放数据造假检测方法、装置及系统和存储介质 |
CN117373557A (zh) * | 2023-12-05 | 2024-01-09 | 山东清控生态环境产业发展有限公司 | 基于多维数据的溯源方法及系统 |
CN117436532A (zh) * | 2023-12-21 | 2024-01-23 | 中用科技有限公司 | 一种洁净室气态分子污染物根因分析方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105844301A (zh) * | 2016-04-05 | 2016-08-10 | 北华航天工业学院 | 基于贝叶斯源识别的土壤中重金属污染源解析方法 |
US10444108B1 (en) * | 2012-12-22 | 2019-10-15 | Picarro Inc. | Systems and methods for likelihood-based detection of gas leaks using mobile survey equipment |
CN111610407A (zh) * | 2020-05-18 | 2020-09-01 | 国网江苏省电力有限公司电力科学研究院 | 基于朴素贝叶斯的电缆老化状态评估方法和装置 |
CN112364940A (zh) * | 2020-12-03 | 2021-02-12 | 苏州深蓝空间遥感技术有限公司 | 基于多源数据的大气污染物源解析方法、存储介质及设备 |
-
2021
- 2021-03-17 CN CN202110287736.1A patent/CN112669190B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10444108B1 (en) * | 2012-12-22 | 2019-10-15 | Picarro Inc. | Systems and methods for likelihood-based detection of gas leaks using mobile survey equipment |
CN105844301A (zh) * | 2016-04-05 | 2016-08-10 | 北华航天工业学院 | 基于贝叶斯源识别的土壤中重金属污染源解析方法 |
CN111610407A (zh) * | 2020-05-18 | 2020-09-01 | 国网江苏省电力有限公司电力科学研究院 | 基于朴素贝叶斯的电缆老化状态评估方法和装置 |
CN112364940A (zh) * | 2020-12-03 | 2021-02-12 | 苏州深蓝空间遥感技术有限公司 | 基于多源数据的大气污染物源解析方法、存储介质及设备 |
Non-Patent Citations (1)
Title |
---|
童英华,田立勤,李靖: "基于贝叶斯网络的雾霾重点污染源排放预测", 《计算机工程与设计》 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116090709A (zh) * | 2023-04-10 | 2023-05-09 | 广东慧航天唯科技有限公司 | 基于金属加工监控的偷排预警分析方法及系统 |
CN116976733A (zh) * | 2023-07-31 | 2023-10-31 | 青岛熙正数字科技有限公司 | 一种基于大数据的大气污染源在线监测数据评估系统 |
CN116976733B (zh) * | 2023-07-31 | 2024-04-02 | 青岛熙正数字科技有限公司 | 一种基于大数据的大气污染源在线监测数据评估系统 |
CN117236971A (zh) * | 2023-09-21 | 2023-12-15 | 中节能天融科技有限公司 | 多工况排放数据造假检测方法、装置及系统和存储介质 |
CN117373557A (zh) * | 2023-12-05 | 2024-01-09 | 山东清控生态环境产业发展有限公司 | 基于多维数据的溯源方法及系统 |
CN117373557B (zh) * | 2023-12-05 | 2024-02-27 | 山东清控生态环境产业发展有限公司 | 基于多维数据的溯源方法及系统 |
CN117436532A (zh) * | 2023-12-21 | 2024-01-23 | 中用科技有限公司 | 一种洁净室气态分子污染物根因分析方法 |
CN117436532B (zh) * | 2023-12-21 | 2024-03-22 | 中用科技有限公司 | 一种洁净室气态分子污染物根因分析方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112669190B (zh) | 2021-07-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112669190B (zh) | 污染源异常排放行为的检测方法、装置及计算机设备 | |
Balbin et al. | Predictive analytics on open big data for supporting smart transportation services | |
CN109522603B (zh) | 基于云平台的车载拉格朗日实时大气污染溯源系统及方法 | |
Ali et al. | Data quality assurance for volunteered geographic information | |
Wang et al. | Predictability of road traffic and congestion in urban areas | |
Dias et al. | Modelling of human exposure to air pollution in the urban environment: a GPS-based approach | |
CN110727717B (zh) | 网格化大气污染强度的监控方法、装置、设备和存储介质 | |
Tella et al. | GIS-based air quality modelling: Spatial prediction of PM10 for Selangor State, Malaysia using machine learning algorithms | |
CN112288247B (zh) | 一种基于空间交互关系的土壤重金属风险识别方法 | |
CN117116382B (zh) | 引水工程影响下受水湖泊水质时空预测方法和系统 | |
CN114329245A (zh) | 一种空气污染的溯源方法、装置、服务器及存储介质 | |
CN111930864B (zh) | 基于监测数据的网格化清单优化方法和装置 | |
CN114218976B (zh) | 臭氧前体物高值区精细化排放源追溯定位方法和系统 | |
Dong et al. | A gridded establishment dataset as a proxy for economic activity in China | |
CN117421643B (zh) | 基于人工智能的生态环境遥感数据分析方法及系统 | |
CN112738729A (zh) | 一种用手机信令数据判别探亲返乡游客的方法及系统 | |
Depsky et al. | High-resolution gridded estimates of population sociodemographics from the 2020 census in California | |
Yao et al. | Analyzing the effects of rainfall on urban traffic-congestion bottlenecks | |
CN114822709A (zh) | 大气污染多粒度精准成因分析方法及装置 | |
Althuwaynee et al. | Spatial identification and temporal prediction of air pollution sources using conditional bivariate probability function and time series signature | |
Marty et al. | Global poverty estimation using private and public sector big data sources | |
CN113688506A (zh) | 基于微站等多维数据的潜在大气污染源识别方法 | |
CN110515961B (zh) | 一种基于时空大数据的基础地理信息更新需求评价方法 | |
Nolan et al. | Solving sampling bias problems in presence–absence or presence‐only species data using zero‐inflated models | |
Magnusson | Uncertainty and the design of in-situ biodiversity-monitoring programs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP01 | Change in the name or title of a patent holder | ||
CP01 | Change in the name or title of a patent holder |
Address after: 100071 Beijing Fengtai Auto Museum West Road No. 8 Courtyard 1 Building 6 Floor 606 Patentee after: Beijing Yingshi Ruida Technology Co.,Ltd. Address before: 100071 Beijing Fengtai Auto Museum West Road No. 8 Courtyard 1 Building 6 Floor 606 Patentee before: BEIJING INSIGHTS VALUE TECHNOLOGY Co.,Ltd. |