一种尾气检测作弊监管系统及方法
技术领域
本发明属于尾气治理技术领域,尤其涉及一种尾气检测作弊监管系统及方法。
背景技术
目前,业内常用的现有技术是这样的:
视频监控检测过程,及工作人员凭借观察数据,比如检测值过小等进行判断。
目前,作弊数据只能通过人工审核,经验审核。甚至,更多的情况是接受到了民众的投诉,政府部门按照流程进行督查,效果甚微。
对于海量数据,人工成本很高,每天武汉市会产生几十万条监测数据,那么人工审核效率低下。使用机器远程实时监控,又不能保证实时监控的数据的可靠性,那么,对于这种人工干预的“异常”数据,往往会存在一定的规律性,找出“异常”数据之间的规律,提供检查机关相应的决策参考,可以大大的提高对不法企业的监管,对环境的有力保护。
综上所述,现有技术存在的问题是:
人工判断,人力成本很高,并且受人力成本限制,只能抽样检查,不能全覆盖对所有检测过程和数据进行监控;
现场操作不规范:现场工作人员因主观或客观原因,在操作过程中未按照标准流程执行,导致尾气采集不达标,如漏气、混入空气等,直接影响到尾气检测结果的准确性。
检测工控机伪造作弊数据:
部分厂家的工控机可能存在作弊设置接口,在作弊模式下,工控机先将接收到的数据进行篡改再上传至检测中心,从而影响尾气检测结果的准确性。
发明内容
针对现有技术存在的问题,本发明提供了一种尾气检测作弊监管系统及方法。本发明节省人力成本,实现全覆盖监控检测数据,有效治理尾气检测防作弊行为。
本发明是这样实现的,一种尾气检测作弊监管方法,所述尾气检测作弊监管方法包括:
固定规则筛查:识别无效的检测数据;对于出现无效数据的检测过程进行停止;
识别无效的检测数据:一些重要指标值重复出现,例如如CO、HC、NO值为0、0.2、0等数值比较小,并且大量重复出现的数据量,不受检查车辆和环境的影响。
检测过程:操作人员操作不规范,比如车辆上需要操作人员随着检测过程不断调整车辆的加速度等,但实际操作人员不按照检测过程要求操作等。
现场稽查:直接与检测仪器进行对接,读取历史记录,直接与上传到服务器的记录进行对比,判断出数据是否篡改;
进行对比,判断:目前数据库数据来自集成系统,检测仪器把获取到的数据上传到集成系统中,集成系统再保存到数据库,在集成系统接收数据接口的位置是可以对数据进行篡改,将异常数据修改为正常数据。因此,另外使用一套数据接收设备,直接和检测仪器对接,保存仪器采集的数据,然后将现场稽查的数据与集成系统的数据进行一一对比,既可以判断是否发生篡改。
基于机器学习的作弊模式识别:通过数据分析和人工介入的方式,识别异常数据;
通过长期环保系统开发及维护经验,总结出部分数据特征,包括检测时间异常分析、检测时间过短分析、检测线小时检测量异常分析、检测站小时检测量异常、检测站日检测量异常分析、检测线日检测量异常分析、检测线通过率异常分析、检测站通过率异常分析、检测设备通过率异常分析、检测线检测数据重复分析、同一辆车历史检测记录异常分析。
识别方法:根据已识别重要数据特征在区间
(注:[平均值-k倍的标准差,平均值+k倍的标准差])内,则是正常数据,该区间之外的为异常数据。
通过对统计方法判别法识别异常值中拉依达准则、格拉布斯准则、狄克逊准则进行模型计算,其中,拉依达准则
算法最优,正确率最高。
对检测数据中的核心指标进行分类和学习,寻找频繁重复的数据模式,进行人工筛查。
通过关联算法,利用分析过程数据与结果数据、车辆属性及检测结果数据的关联关系,对于不符合的规则进行预警。
通过关联算法:是现有数据分析算法,分析过程数据与结果数据采用最小二乘法,车辆属性及检测结果数据采用Pearson相关系数。
分析过程数据与结果数据:一条结果数据对应多条过程数据,如结果数据的CO与之相关的过程数据有(CO1、CO2…CON),采用最小二乘法算出相关性,如果某辆车的某次结果数据与过程数据的相关性与已计算出来的相关性相差过大,则可以怀疑其数据存在作弊。
车辆属性及检测结果数据:采用Pearson相关系数,如果某辆车的某次结果数据与车辆属性类别的相关性与已计算出来的相关性相差过大,则可以怀疑其数据存在作弊。
预警:(1)防作弊系统界面提示预警,(2)向相关监督人员微信发送异常数据预警。
进一步,异常数据分析包括:检测时间异常分析、检测时间过短分析、检测线小时检测量异常分析、检测站小时检测量异常、检测站日检测量异常分析、检测线日检测量异常分析、检测线通过率异常分析、检测站通过率异常分析、检测设备通过率异常分析、检测线检测数据重复分析、同一辆车历史检测记录异常分析。通过历史经验积累可获的数据。
进一步,基于机器学习的作弊模式识别中,通过随机森林和神经网络算法,对不同厂商、不同车辆的数据进行分析处理,分析异常数据,识别异常模式。
随机森林和神经网络算法:使用数据生成的模型由长期优化算法得到,
进行分析处理,分析异常数据,识别异常模式:通过车辆属性、检测设备、检测人员、检测数据利用随机森林和神经网络算法进行判断。
本发明另一目的在于提供一种实现所述尾气检测作弊监管方法的计算机程序。
本发明另一目的在于提供一种实现所述尾气检测作弊监管方法的信息数据处理终端。
本发明另一目的在于提供一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行所述的尾气检测作弊监管方法。
本发明另一目的在于提供一种尾气检测作弊监管系统包括:
固定规则筛查模块,用于识别无效的检测数据;对于出现无效数据的检测过程进行停止;
现场稽查模块,用于直接与检测仪器进行对接,读取历史记录,直接与上传到服务器的记录进行对比,判断出数据是否篡改;
基于机器学习的作弊模式识别模块,通过数据分析和人工介入的方式,识别异常数据;
对检测数据中的核心指标进行分类和学习,寻找频繁重复的数据模式,进行人工筛查。
预警模块,通过关联算法,利用分析过程数据与结果数据、车辆属性及检测结果数据的关联关系,对于不符合的规则进行预警。
本发明另一目的在于提供一种搭载有所述尾气检测作弊监管系统的信息数据处理终端。
综上所述,本发明的优点及积极效果为:
为进一步完善优化机动车环保检任务,有效监管检测业务,在已有的机动车检测大数据基础分析之上,结合在尾气检测业务规划和管理方面积累的经验,对武汉市各个排查站、检测线及检测设备进行数据监测、分析和处理,实现对武汉市机动车环保信息的监测数据进行防作弊预警、决策辅助分析等应用,大大提高环保部门对机动车环保的有力监控,从而实现智慧城市。
附图说明
图1是本发明实施例提供的尾气检测作弊监管方法流程图。
图2是本发明实施例提供的尾气检测作弊监管系统示意图。
图中:1、固定规则筛查模块;2、现场稽查模块;3、基于机器学习的作弊模式识别模块;4、预警模块。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
现有技术中,现场操作不规范:现场工作人员因主观或客观原因,在操作过程中未按照标准流程执行,导致尾气采集不达标,如漏气、混入空气等,直接影响到尾气检测结果的准确性。
检测工控机伪造作弊数据:部分厂家的工控机可能存在作弊设置接口,在作弊模式下,工控机先将接收到的数据进行篡改再上传至检测中心,从而影响尾气检测结果的准确性。
如图1所示,本发明实施例提供的尾气检测作弊监管方法,包括:
S101:固定规则筛查:主要针对现场操作不规范情况,对各种检测方法,设置对应的规则,识别无效的检测数据。对于出现无效数据的检测过程,立即停止监测过程。
S102:现场稽查:主要针对工控机伪造数据情况,开发一套硬件设备对接系统,直接与检测仪器进行对接,读取历史记录,直接与上传到服务器的记录进行对比,可以判断出数据是否篡改。
S103:基于机器学习的作弊模式识别:针对操作不规范和工控机伪造数据两种情况,通过数据分析和人工介入的方式,识别异常数据。
S104:对检测数据中的核心指标进行分类和学习,寻找频繁重复的数据模式,进行人工筛查。通过关联算法,利用分析过程数据与结果数据、车辆属性及检测结果数据等的关联关系,对于不符合的规则进行预警。
已实现的分类作弊类型有:检测时间异常分析、检测时间过短分析、检测线小时检测量异常分析、检测站小时检测量异常、检测站日检测量异常分析、检测线日检测量异常分析、检测线通过率异常分析、检测站通过率异常分析、检测设备通过率异常分析、检测线检测数据重复分析、同一辆车历史检测记录异常
通过随机森林和神经网络算法,对不同厂商、不同车辆的数据进行分析处理,分析异常数据,识别异常模式。
固定规则筛查中,识别无效的检测数据:一些重要指标值重复出现,例如如CO、HC、NO值为0、0.2、0等数值比较小,并且大量重复出现的数据量,不受检查车辆和环境的影响。
检测过程:操作人员操作不规范,比如车辆上需要操作人员随着检测过程不断调整车辆的加速度等,但实际操作人员不按照检测过程要求操作等。
现场稽查中,进行对比,判断:目前数据库数据来自集成系统,检测仪器把获取到的数据上传到集成系统中,集成系统再保存到数据库,在集成系统接收数据接口的位置是可以对数据进行篡改,将异常数据修改为正常数据。因此,另外使用一套数据接收设备,直接和检测仪器对接,保存仪器采集的数据,然后将现场稽查的数据与集成系统的数据进行一一对比,既可以判断是否发生篡改。
基于机器学习的作弊模式识别中,通过长期环保系统开发及维护经验,总结出部分数据特征,包括检测时间异常分析、检测时间过短分析、检测线小时检测量异常分析、检测站小时检测量异常、检测站日检测量异常分析、检测线日检测量异常分析、检测线通过率异常分析、检测站通过率异常分析、检测设备通过率异常分析、检测线检测数据重复分析、同一辆车历史检测记录异常分析。识别方法:根据已识别重要数据特征在区间
(注:[平均值-k倍的标准差,平均值+k倍的标准差])内,则是正常数据,该区间之外的为异常数据。
通过对统计方法判别法识别异常值中拉依达准则、格拉布斯准则、狄克逊准则进行模型计算,其中,拉依达准则
算法最优,正确率最高。
对检测数据中的核心指标进行分类和学习,寻找频繁重复的数据模式,进行人工筛查。
通过关联算法:是现有数据分析算法,分析过程数据与结果数据采用最小二乘法,车辆属性及检测结果数据采用Pearson相关系数。
分析过程数据与结果数据:一条结果数据对应多条过程数据,如结果数据的CO与之相关的过程数据有(CO1、CO2…CON),采用最小二乘法算出相关性,如果某辆车的某次结果数据与过程数据的相关性与已计算出来的相关性相差过大,则可以怀疑其数据存在作弊。
车辆属性及检测结果数据中,预警:(1)防作弊系统界面提示预警,(2)向相关监督人员微信发送异常数据预警。
如图2所示,本发明实施例提供一种尾气检测作弊监管系统,包括:
固定规则筛查模块1,用于识别无效的检测数据;对于出现无效数据的检测过程进行停止;
现场稽查模块2,用于直接与检测仪器进行对接,读取历史记录,直接与上传到服务器的记录进行对比,判断出数据是否篡改;
基于机器学习的作弊模式识别模块3,通过数据分析和人工介入的方式,识别异常数据;
对检测数据中的核心指标进行分类和学习,寻找频繁重复的数据模式,进行人工筛查。
预警模块4,通过关联算法,利用分析过程数据与结果数据、车辆属性及检测结果数据的关联关系,对于不符合的规则进行预警。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。