CN113591824A - 交通违法数据录入异常检测方法和装置 - Google Patents

交通违法数据录入异常检测方法和装置 Download PDF

Info

Publication number
CN113591824A
CN113591824A CN202111168287.5A CN202111168287A CN113591824A CN 113591824 A CN113591824 A CN 113591824A CN 202111168287 A CN202111168287 A CN 202111168287A CN 113591824 A CN113591824 A CN 113591824A
Authority
CN
China
Prior art keywords
target
illegal
audit
auditor
monitoring point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111168287.5A
Other languages
English (en)
Other versions
CN113591824B (zh
Inventor
卢朝晖
王昂千
寿智振
张建鑫
周檑胜
徐百超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Traffic Police Brigade Of Zhuji Public Security Bureau
Zhejiang Lijia Electronic Technology Co ltd
Original Assignee
Traffic Police Brigade Of Zhuji Public Security Bureau
Zhejiang Lijia Electronic Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Traffic Police Brigade Of Zhuji Public Security Bureau, Zhejiang Lijia Electronic Technology Co ltd filed Critical Traffic Police Brigade Of Zhuji Public Security Bureau
Priority to CN202111168287.5A priority Critical patent/CN113591824B/zh
Publication of CN113591824A publication Critical patent/CN113591824A/zh
Application granted granted Critical
Publication of CN113591824B publication Critical patent/CN113591824B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/017Detecting movement of traffic to be counted or controlled identifying vehicles
    • G08G1/0175Detecting movement of traffic to be counted or controlled identifying vehicles by photographing vehicles, e.g. when violating traffic rules

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供一种交通违法数据录入异常检测方法和装置,所述方法包括:确定所述目标审核人员对应的整体违法率;确定所述目标审核人员所处理的任一目标监控点对应的交通违法率模型指示的违法率区间;确定所述目标审核人员对应的整体违法率区间;确定检测周期内所述目标审核人员对应的审核照片中的目标车牌号,并根据所述目标车牌号确定所述目标审核人员对应的交通违法数据录入异常检测结果。本发明实施例提供的交通违法数据录入异常检测方法和装置,提高了审核人员录入异常检测的准确率,并能够鲁棒地适应审核数据的多样性。

Description

交通违法数据录入异常检测方法和装置
技术领域
本申请涉及计算机技术领域,特别涉及一种交通违法数据录入异常的判断方法和装置。
背景技术
交通监控系统通过预先安装在道路各监控点的监控设备(如:枪机、球机、全景相机等)采集监控照片,并依据交通行为识别算法自动从监控照片中识别出交通违法行为。然而,交通行为识别算法的准确率有限,经过识别的可能存在交通违法行为的照片还需经过人工审核,过滤掉识别错误的照片后,才能得到最终的交通违法数据。审核人员会将筛选出的交通违法数据录入交通管理平台,作为车辆交通违法的凭证。
然而,在人工审核照片的过程中,存在审核人员为协助交通违法者逃避处罚,将交通违法者对应的监控照片在人工审核阶段筛选掉、以避免该监控照片录入到交通管理平台的情形。现有技术中为了对交通违法数据录入异常进行检测会设计相应的检测算法,例如基于审核人员录入照片的数量进行评估,又例如对审核人员录入照片的数量在其所审核照片中的占比进行评估。然而这些方法的检测结果不准确,对审核人员数据录入异常的检测结果不但误检率高,漏检率也高,主要原因包括:检测条件过于简单,不能够鲁棒地适应审核数据的多样性;其次,由于不同的审核人员面对的审核任务量不同,所分配到的审核任务对应的监控点的审核难度也不同,因此现有技术中的检测条件缺乏对于不同审核人员的审核任务的适应性;审核人员所处理的审核照片往往是随机分配的,因此审核人员违规行为样本量小而分散,使得现有的检测方法难以检测出数据录入异常。
发明内容
本申请实施例的目的在于提供一种交通违法数据录入异常的判断方法、装置、电子设备和计算机可读存储介质,用于判断交通违法数据的录入异常行为。
第一方面,本发明实施例提供了一种交通违法数据录入异常检测方法,包括:
根据检测周期内目标审核人员对应的任务分组中所处理的审核照片的数量以及录入的违法凭证的数量,确定所述目标审核人员对应的整体违法率;其中,所述违法凭证是从所述审核照片中生成的;
确定所述目标审核人员所处理的任一目标监控点对应的交通违法率模型指示的违法率区间;
根据检测周期内所述目标审核人员所处理的每一目标监控点对应的违法率区间和审核照片数量,确定所述目标审核人员对应的整体违法率区间;
若所述目标审核人员对应的整体违法率不属于所述整体违法率区间,和/或,所述目标审核人员对应的整体违法率与其他审核人员对应的整体违法率之间的差值均大于预设阈值,则确定检测周期内所述目标审核人员对应的审核照片中的目标车牌号,并根据所述目标车牌号确定所述目标审核人员对应的交通违法数据录入异常检测结果。
可选地,所述交通违法率模型为基于神经网络的第一交通违法率模型,对应地,所述确定所述目标审核人员所处理的任一目标监控点对应的交通违法率模型指示的违法率区间,具体包括:
根据所述目标审核人员所处理的任一目标监控点在多个历史计算周期内的违法凭证的数量和审核照片的数量,计算出多个历史违法率;
将所述目标审核人员所处理的任一目标监控点在检测周期内的天气状况对应的平均环境系数、以及道路条件对应的路况系数以及多个历史计算周期内的历史违法率输入到第一交通违法率模型,得到所述目标审核人员所处理的任一目标监控点对应的第一交通违法率模型输出的违法率区间;
其中,第一交通违法率模型是以所述目标监控点在模型构建周期内的天气状况对应的样本平均环境系数、以及道路条件对应的样本路况系数以及多个历史计算周期内的样本历史违法率为训练样本,并以对应的人工标注的违法率区间为标签训练得到的。
可选地,所述交通违法率模型为基于概率密度函数的第二交通违法率模型,对应地,所述确定所述目标审核人员所处理的任一目标监控点对应的交通违法率模型指示的违法率区间,具体包括:
根据所述目标审核人员所处理的任一目标监控点在多个历史计算周期内的违法凭证的数量和审核照片的数量,计算出多个历史违法率;
依据所述多个历史违法率拟合得到所述目标监控点对应的概率密度函数,作为所述监控点对应的第二交通违法率模型;其中,所述第二交通违法率模型指示的违法率区间根据所述第二交通违法率模型的均值和标准差确定。
可选地,所述根据所述目标车牌号确定所述目标审核人员对应的交通违法数据录入异常检测结果,包括:
根据所述目标车牌号,从检测周期内所述目标审核人员对应的审核照片中筛选出待验证数据集;
由目标督查人员对所述待验证数据集进行审核,确定督查违法率;
根据所述标督查人员确定的督查违法率和所述目标审核人员对应的整体违法率,确定所述目标审核人员对应的交通违法数据录入异常检测结果。
可选地,所述根据所述目标车牌号,从检测周期内所述目标审核人员对应的审核照片中筛选出待验证数据集,包括:
确定检测周期内所述目标审核人员对应的审核照片,作为任务数据集;
确定检测周期内所述目标审核人员对应的违法凭证中出现的目标车牌号,并从所述任务数据集中删除与所述目标车牌号对应的审核照片,得到中间数据集;
筛选出所述中间数据集中出现次数达到指定数值的车牌号对应的审核照片构成待检数据集,并从所述中间数据集中删除所述待检数据集中的审核照片;
从所述中间数据集中随机抽取指定数量的审核照片加入所述待检数据集,并将所述待检数据集中的审核照片作为待验证数据。
可选地,在所述确定所述目标审核人员对应的整体违法率之前,所述方法还包括:
依据每一目标监控点的审核照片的数量和所述目标监控点对应的违法类型信息,计算每一目标监控点的审核工作量;
依据同一目标地理位置内每一目标监控点的审核工作量和所述目标审核人员的数量,计算各目标地理位置对应的第一平均子审核工作量;
基于每一目标地理位置内各目标监控点的审核工作量和所述目标地理位置对应的第一平均子审核工作量,为每一目标审核人员分配所述目标地理位置内各监控点对应的审核照片;
依据分配给所述目标审核人员的所有目标地理位置内的审核照片,生成所有目标审核人员对应的任务分组。
可选地,在所述确定所述目标审核人员对应的整体违法率之前,所述方法还包括:
依据每一目标监控点的审核照片的数量和所述目标监控点对应的违法类型信息,计算每一目标监控点的审核工作量;
依据属于同一目标违法类型的每一目标监控点的审核工作量和所述目标审核人员的数量,计算所述各目标违法类型对应的第二平均子审核工作量;
基于每一目标违法类型信息对应的各目标监控点的审核工作量和所述目标违法类型对应的第二平均子审核工作量,为每一目标审核人员分配所述目标违法类型对应的各监控点对应的审核照片;
依据分配给所述目标审核人员的所有目标违法类型对应的审核照片,生成所有目标审核人员对应的任务分组。
第二方面,本发明实施例提供了一种交通违法数据录入异常检测装置,包括:
整体计算模块,用于根据检测周期内目标审核人员对应的任务分组中所处理的审核照片的数量以及录入的违法凭证的数量,确定所述目标审核人员对应的整体违法率;其中,所述违法凭证是从所述审核照片中生成的;
监控点计算模块,用于确定所述目标审核人员所处理的任一目标监控点对应的交通违法率模型指示的违法率区间;
区间确定模块,用于根据检测周期内所述目标审核人员所处理的每一目标监控点对应的违法率区间和审核照片数量,确定所述目标审核人员对应的整体违法率区间;
检测结果确定模块,用于若所述目标审核人员对应的整体违法率不属于所述整体违法率区间,和/或,所述目标审核人员对应的整体违法率与其他审核人员对应的整体违法率之间的差值均大于预设阈值,则确定检测周期内所述目标审核人员对应的审核照片中的目标车牌号,并根据所述目标车牌号确定所述目标审核人员对应的交通违法数据录入异常检测结果。
第三方面,本发明实施例提供了一种电子设备,所述电子设备包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行第一方面所述的交通违法数据录入异常检测方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序可由处理器执行以完成第一方面所述的交通违法数据录入异常检测方法。
本发明实施例提供的交通违法数据录入异常检测方法、装置、电子设备和计算机可读存储介质,基于每一监控点所对应的特定的交通违法率模型计算违法率区间,并基于审核人员处理的多个目标监控点的完整任务计算出整体违法率区间从而确定审核人员是否疑似存在录入异常,进而通过审核人员对应的审核照片中的目标车牌号的排查来最终确定审核人员是否存在交通违法数据录入异常,使得异常录入数据更为集中,通过为监控点设计特定的交通违法模型提高了审核人员录入异常检测的准确率,并能够鲁棒地适应审核数据的多样性。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍。
图1为本申请一实施例提供的交通违法数据录入异常的判断方法的应用场景示意图;
图2为本申请一实施例提供的电子设备的结构示意图;
图3为本申请一实施例提供的交通违法数据录入异常检测方法的流程示意图;
图4为本申请一实施例提供的第一交通违法率模型的确定方法的流程示意图;
图5为本申请一实施例提供的第二交通违法率模型的确定方法的流程示意图;
图6为本申请一实施例提供的交通违法数据录入异常检测方法的流程示意图;
图7为本申请一实施例提供的待验证数据集的确定方法的流程示意图;
图8为本申请一实施例提供的任务分配方法的流程示意图;
图9为本申请又一实施例提供的任务分配方法的流程示意图;
图10为本申请再一实施例提供的任务分配方法的流程示意图;
图11为本申请一实施例提供的交通违法数据录入异常检测装置的框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
图1为本申请实施例提供的交通违法数据录入异常检测方法的应用场景示意图。如图1所示,该应用场景包括客户端20和服务端30;客户端20可以是主机、手机、平板电脑等用户终端,用于响应于审核人员审核操作,向交通管理平台输入的违法凭证;服务端30可以是搭载交通管理平台的服务器、服务器集群或云计算中心,可以依据审核结果判断录入异常行为。
如图2所示,本实施例提供一种电子设备1,包括:至少一个处理器11和存储器12,图2中以一个处理器11为例。处理器11和存储器12通过总线10连接,存储器12存储有可被处理器11执行的指令,指令被处理器11执行,以使电子设备1可执行下述的实施例中方法的全部或部分流程。在一实施例中,电子设备1可以是上述服务端30,用于执行交通违法数据录入异常检测方法。
存储器12可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read Only Memory,简称EPROM),可编程只读存储器(Programmable Red-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。
本申请还提供了一种计算机可读存储介质,存储介质存储有计算机程序,计算机程序可由处理器11执行以完成本申请提供的交通违法数据录入异常检测方法。
基于上述任一实施例,附图3示出了本发明实施例提供的交通违法数据录入异常检测方法的流程示意图,具体包括如下内容。
步骤310:根据检测周期内目标审核人员对应的任务分组中所处理的审核照片的数量以及录入的违法凭证的数量,确定所述目标审核人员对应的整体违法率;其中,所述违法凭证是从所述审核照片中生成的。
本发明实施例中每个审核人员对应一个任务分组,任务分组中包括由审核人员需要处理的审核照片,审核照片是由检测点的监控设备所拍摄的初步判断具有违法行为、并交由审核人员进一步进行人工审核的数据。审核照片在审核人员所使用的审核系统中也附带有审核照片内违法行为涉及的车牌号、审核照片对应的监控点标识、审核照片对应的交通违法行为类型等信息。监控点标识表示采集审核照片的具体监控点。这里,监控点表示布置在道路上的监控设备,该监控设备可对自身范围内的车辆进行监控,并依据自身的交通行为识别算法确定存在交通违法行为的车辆,并采集指示交通违法行为的审核照片传输至交通管理平台。交通违法行为可以包括超速、未系安全带、闯红灯、违停、压线、行车打电话等。
在本发明实施例中的审核人员所使用的审核系统以及交通管理平台等系统中,审核人员可以通过审核人员标识来指示特点的审核人员,示例性的,审核人员标识可以是审核人员的工号。
审核人员对任务分组中的审核照片进行审核后,可以确定交通行为识别算法识别正确的审核照片作为违法凭证。该违法凭证经过人工审核,可以确切地指示交通违法行为。也就是说,违法凭证是从审核照片中生成的。
本发明实施例中的检测周期是指进行交通违法数据录入异常检测时采集审核人员的审核数据的时间范围,可基于实际应用需求进行配置。示例性的,检测周期可以是一个月。相应地,在对某一审核人员进行交通违法数据录入异常检测时,可以采集过去一个月内该审核人员的审核数据,并基于该审核数据检测该审核人员是否存在交通违法数据录入异常。
针对检测周期内目标审核人员对应的任务分组,可以统计其总共所处理的审核照片的数量,并统计其审核完成后总共录入交通管理平台的违法凭证的数量,计算出检测周期内目标审核人员对应的整体违法率,本发明实施例中的整体违法率可以是指目标审核人员在检测周期内录入交通管理平台的违法凭证的数量占审核照片的数量的比例,可通过如下公式(1)计算:
Figure P_210928114653182_182584001
(1)
其中,r为整体违法率;m为目标审核人员在检测周期内录入交通管理平台的违法凭证的数量;n为目标审核人员在检测周期内所处理的审核照片的数量。
步骤320:确定所述目标审核人员所处理的任一目标监控点对应的交通违法率模型指示的违法率区间。
在本发明实施例中,每次在确定审核人员对应的任务分组时,会将同一目标监控点的监控数据分配给同一个审核人员,便于交通违法数据录入异常的检测。其原因在于,对于审核人员为协助交通违法者逃避处罚,将交通违法者对应的监控照片在人工审核阶段筛选掉、以避免该监控照片录入到交通管理平台的情形,特点车辆被拍摄到的监控照片往往会集中出现在特定的监控点,例如检测周期内某目标车辆的3次违停违法行为可能均出现在同一地点、被同一监控设备拍摄到。如果将这三个审核照片通过随机分配的方式分配给了三名审核人员,一旦某一审核人员出现的录入异常,由于异常情形的分散会导致异常情形更难以被检测到。如何保证同一目标监控点的监控数据分配给同一个审核人员,后续实施例中提供的任务分配方法中会进一步详细说明。
本发明实施例中以目标监控点为单位设计了相应的交通违法率模型,来确定所述目标审核人员所处理的任一目标监控点对应的交通违法率模型指示的违法率区间。该交通违法率模型指示的违法率区间是指审核人员在审核该目标监控点的审核照片时可以被认定为不存在异常情形的违法率的数据区间,即可以认为审核人员在该监控点的数据录入无误、该监控点为正常审核监控点。可以理解的是,违法率区间可以是一个数值范围,包括上限值和下限值。违法率的计算方式和整体违法率的计算方式相似,即计算目标审核人员所处理的任一目标监控点对应时录入的违法凭证的数量占所处理的审核照片的数量的比例。
本发明实施例中每一监控点由于在交通道路条件、驶经该监控点的驾驶员的行为习惯、天气状况等因素的影响,每一监控点对应的交通违法率模型都不同。对于同一监控点而言,在交通道路条件、驶经该监控点的驾驶员的行为习惯、天气状况等因素差异不大的情况下,监控点对应的交通违法率模型指示的违法率区间在统计学上可以呈现较好的一致性。
同样地,在每次进行交通违法数据录入异常检测时,由于检测周期内交通道路条件、驶经该监控点的驾驶员的行为习惯、天气状况均可能会发生一定的变化,因此可以定期基于检测周期内的数据重新确定目标监控点对应的交通违法率模型。
本发明实施例中交通违法率模型的具体确定方法在后续实施例中会详细说明。
步骤330:根据检测周期内所述目标审核人员所处理的每一目标监控点对应的违法率区间和审核照片数量,确定所述目标审核人员对应的整体违法率区间。
在步骤320中确定了目标审核人员所处理的任一目标监控点对应的交通违法率模型指示的违法率区间后,由于审核人员需要处理的多个目标监控点的审核照片,因此为了评估审核人员在检测周期内整体的数据录入是否存在异常,还需要进一步确定审核人员在处理多个目标监控点的审核照片时对应的整体违法率区间。
本步骤中整体违法率区间根据多个目标监控点对应的违法率区间进行确定,并根据目标监控点对应的审核照片的数量赋予各违法率区间以权值,来合理地确定整体违法率区间。整体违法率区间具体的计算方法可以是通过分别对违法率区间的上限值和下限值进行加权平均计算得到。例如审核人员A处理了3个监控点的监控照片各100张,3个监控点对应的交通违法率模型指示的违法率区间分别为[0.1,0.15],[0.08,0.12],[0.06,0.09],各违法率区间的上限值加权平均后为0.08,各违法率区间的下限值加权平均后为0.12,因此整体违法率区间的计算结果为[0.08, 0.12];又例如审核人员B处理了2个监控点的监控照片分别为100张和200张,2个监控点对应的交通违法率模型指示的违法率区间分别为[0.1,0.15],[0.07,0.12],那么各违法率区间的上限值加权平均后为0.08,各违法率区间的下限值加权平均后为0.13,因此整体违法率区间的计算结果为[0.08, 0.13]。
步骤340:若所述目标审核人员对应的整体违法率不属于所述整体违法率区间,和/或,所述目标审核人员对应的整体违法率与其他审核人员对应的整体违法率之间的差值均大于预设阈值,则确定检测周期内所述目标审核人员对应的审核照片中的目标车牌号,并根据所述目标车牌号确定所述目标审核人员对应的交通违法数据录入异常检测结果。
在步骤310和330分别计算得到了目标审核人员对应的整体违法率和整体违法率区间后,本步骤中的第一个判断条件为整体违法率是否不属于所述整体违法率区间。
此外,本步骤中的第二个判断条件为目标审核人员对应的整体违法率与其他审核人员对应的整体违法率之间的差值均大于预设阈值,该阈值可以根据本领域技术人员的经验进行设置。由于不同审核人员分配的任务有所不同,因此不同审核人员对应的整体违法率也会有所不同。但一般而言,不同审核人员对应的整体违法率之间不会有很明显的差别。本步骤中的第二个判断条件是在某审核人员的整体违法率数据明显存在较大异常时可以快速判断该审核人员的数据录入存在异常。
本步骤中的两个判断条件之间是“和/或”的关系,即两个判断条件至少满足其中之一,即可初步判断该审核人员存在异常,需要对该审核人员所处理的审核照片以及录入的违法凭证进行进一步检测。该检测过程实际中可以由督查人员进行。
具体地,在判断目标审核人员潜在存在异常的情况下,可以基于检测周期内所述目标审核人员对应的审核照片中的目标车牌号,来确定目标审核人员对应的交通违法数据录入异常检测结果。其原因在于审核人员的异常录入情形往往对应了特定的车辆,因此,后续的异常检测结果的确定是根据审核人员对应的审核照片中的目标车牌号来确定的。该具体过程将在后续实施例中详细说明。
本发明实施例提供的交通违法数据录入异常检测方法,基于每一监控点所对应的特定的交通违法率模型计算违法率区间,并基于审核人员处理的多个目标监控点的完整任务计算出整体违法率区间从而确定审核人员是否疑似存在录入异常,进而通过审核人员对应的审核照片中的目标车牌号的排查来最终确定审核人员是否存在交通违法数据录入异常,使得异常录入数据更为集中,通过为监控点设计特定的交通违法模型提高了审核人员录入异常检测的准确率,并能够鲁棒地适应审核数据的多样性。
基于上述任一实施例,附图4示出了本发明实施例提供的第一交通违法率模型的确定方法的流程示意图,具体包括如下内容。
步骤410,根据所述目标审核人员所处理的任一目标监控点在多个历史计算周期内的违法凭证的数量和审核照片的数量,计算出多个历史违法率。
步骤420,将所述目标审核人员所处理的任一目标监控点在检测周期内的天气状况对应的平均环境系数、以及道路条件对应的路况系数以及多个历史计算周期内的历史违法率输入到第一交通违法率模型,得到所述目标审核人员所处理的任一目标监控点对应的第一交通违法率模型输出的违法率区间。
本实施例中介绍了第一交通违法率模型的确定方法,第一交通违法率模型是一个基于神经网络构建的模型。在确定目标监控点对应的第一交通违法率模型时,该模型的确定主要和目标监控点的天气状况、道路条件、驶经该监控点的驾驶员的行为习惯等三个主要因素相关。其中天气状况可以是指目标监控点所在位置的日照长度、雨水状况、积雪结冰状况等;道路条件可以是指目标监控点所在位置的车流量、是否为道路枢纽、是否配备有非机动车道等;驶经该监控点的驾驶员的行为习惯主要是指驶经该监控点的车辆违章的情况是否严重,可以通过违法率这样的指标来反映。将上述三个因素相关的数据输入至第一交通违法率模型中,可以得到第一交通违法率模型输出的目标监控设备对应的违法率区间。其数学含有可以理解为,违法率区间对应了一个违法率的平均值,并在平均值的基础上进行数值上的上下浮动,该违法率区间用于认定审核人员在该监控点的数据录入无误、该监控点为正常审核监控点。
具体地,本实施例首先需要计算检测周期内目标监控点对应的驶经该监控点的驾驶员的行为习惯,可以根据所述目标审核人员所处理的任一目标监控点在多个历史计算周期内的违法凭证的数量和审核照片的数量,计算出多个历史违法率。历史计算周期指在在审核历史中为审核人员分配任务并由系统计算审核人员所处理的任一目标监控点的违法率的周期。示例性的,系统可以每天为审核人员分配审核任务,并在每天的审核任务完成后计算和记录审核人员当天的违法率数据。示例性地,本发明实施例中的一个检测周期检测的数据可以设置为过去7天的审核数据,按照每1天为一个历史计算周期,那么可以根据过去7天内每一天的违法凭证的数量和审核照片的数量,计算出过去7天内每一天的历史违法率。
然后,本发明实施例需要将所述目标审核人员所处理的任一目标监控点在检测周期内的天气状况对应的平均环境系数、以及道路条件对应的路况系数以及多个历史计算周期内的历史违法率输入到第一交通违法率模型,得到所述目标审核人员所处理的任一目标监控点对应的第一交通违法率模型输出的违法率区间。示例性地,第一交通违法率模型的输入可以是检测周期内的平均环境系数、路况系数以及前7天中每一天的历史违法率。
其中,多个历史计算周期内的历史违法率已根据步骤410计算得到。天气状况对应的平均环境系数可以由系统预设一个天气状况与平均环境系数的映射表,系统在应用第一交通违法率模型时可以自动获取检测周期内的天气状况,然后通过映射表得到相应的平均环境系数。示例性地,当监控点在检测周期内多为积雪结冰情况时,对应的平均环境系数可以设置为4;当监控点在检测周期内多为降雨情况时,对应的平均环境系数可以设置为3;当监控点在检测周期内日照时长较长时,对应的平均环境系数可以设置为2;当监控点在检测周期内日照时长较短时,对应的平均环境系数可以设置为1。具体地天气状况与平均环境系数的映射关系也可以根据其他更复杂的合理方式进行设置,本发明实施例不做具体限定,能够体现出天气状况对最终输出的违法率区间的影响即可。
与天气状况因素类似,道路条件与路况系数之间的映射关系可以由系统预设一个天气状况与平均环境系数的映射表,系统在设置监控点时可以录入该监控点是否为道路枢纽、是否配备有非机动车道等固定参数,然后在应用第一交通违法率模型时可以根据交通系统的统计数据自动获取车流量等参数,然后通过映射表得到相应的路况系数。示例性地,当监控点为道路枢纽时,对应的路况系数可以设置为4;当监控点未配备有非机动车道时,对应的平均环境系数可以设置为3;当监控点在检测周期内平均车流量较大时,对应的平均环境系数可以设置为2;当监控点在检测周期内平均车流量较小时,对应的平均环境系数可以设置为1。具体的道路条件与路况系数之间的映射关系也可以根据其他更复杂的合理方式进行设置,本发明实施例不做具体限定,能够体现出道路条件对最终输出的违法率区间的影响即可。检测周期由于时间跨度不长,可以用平均环境系数来大致反映检测周期内的整体天气状况。
需要说明的是,在确定违法率区间时,天气状况与道路条件等因素对违法率区间的取值范围有较大影响。根据研究分析,对于天气状况较为恶劣的情形或交通条件较为复杂的情形,违法事件发生的情形偶然性越大,对审核人员进行审核工作的要求越高,审核人员对应的违法率数据的波动范围也应该相应地越大,反映在违法率区间上限值和下限值之间的差距也越大。此时在使用违法率区间对审核人员的异常情形进行评估时,体现出了更大的数值容忍范围。因此,本发明实施例中应用第一交通违法率模型时引入了天气状况、道路条件、驶经该监控点的驾驶员的行为习惯等三个主要因素作为输入,所输出的违法率区间可以适应不同条件下的监控点情形,所得到的违法率区间对审核人员的异常情形进行评估时评估结果更加准确。检测周期由于时间跨度不长,可以用路况系数来大致反映检测周期内的整体道路条件。
本发明实施例中的第一交通违法率模型可以采用神经网络中的深度残差网络(DRN: Deep residual networks),模型中的具体层数根据驶经该监控点的驾驶员的行为习惯数据的维度来确定,即本方法中检测周期的长度。当检测周期更长时,用于表征驶经该监控点的驾驶员的行为习惯数据的历史违法率数据的维度也就更高。深度残差网络可以将多维度的输入数据信息较好地映射到较深层次的模型数据层中,因此在模型输入数据的维度较低或较高时,均能映射出较为鲁棒的违法率区间结果。此外,本发明实施例中的第一交通违法率模型也可以采用LSTM等其他神经网络模型,在根据天气状况、道路条件、驶经该监控点的驾驶员的行为习惯输出违法率区间数据时,也可能得到较为鲁棒的结果。
本发明实施例中的第一交通违法率模型是以所述目标监控点在模型构建周期内的天气状况对应的样本平均环境系数、以及道路条件对应的样本路况系数以及多个历史计算周期内的样本历史违法率为训练样本,并以对应的人工标注的违法率区间为标签训练得到的。在训练阶段,为了体现样本的多样性,可以根据检测周期的长度在目标监控点对应的历史数据中选择任意的数据集作为训练样本。示例性地,一份训练样本可以包括当年1月1日至1月7日这7天内的平均环境系数、路况系数以及每一天的历史违法率,具体在训练过程中被称为样本平均环境系数、样本路况系数和样本历史违法率。本发明实施例样本选取的时间范围被称为模型构建周期,经过实验可知,模型构建周期一般可以选择前90天左右的时间范围,因为90天的时间范围大致能够覆盖不同类型的天气状况和道路条件,使用该模型构建周期的数据构建的训练样本,所训练出来的第一交通违法率模型鲁棒性较好,同时样本数据量也不会过大从而影响模型训练的效率。具体地,在90天的时间范围内,可以选择第1天至第7天的数据作为一份训练样本,选择第2天到第8天的数据作为一份训练样本,以此类推,共可以获得84份训练样本。
在第一交通违法率模型的训练过程中,还需要确定每一份样本对应的标签值,该标签值是根据该训练样本进行人工标注得到的违法率区间。示例性地,可以首先根据7天的样本历史违法率中的最小值和最大值分别作为违法率区间的初始下限值和初始上限值,例如0.1和0.12,然后根据训练样本中的样本平均环境系数和样本路况系数确定一个容忍值,用于扩大作为标签的违法率区间的数值范围。容忍值取值为0到1之间,样本平均环境系数和样本路况系数越高时,相应地容忍值越低,具体容忍值的计算方式可以根据用户实际需求进行设置。例如当容忍值为0.8时,相应地将初始下限值乘以0.8,将初始上限值除以0.8,最终确定的样本对应的标签值为[0.08,0.15]。
根据上述示例,在获取了84份样本及其对应的标签后,进而可以训练目标监控点对应的第一交通违法率模型。基于神经网络的第一交通违法率模型的训练过程中的损失函数的计算以及模型参数的迭代调整,均与现有技术类似,本发明实施例不做具体赘述。
本发明实施例提供的第一交通违法率模型的确定方法,为不同的监控点设计了不同的第一交通违法率模型,该模型在计算违法率区间时不仅考虑到了历史违法率数据,还考虑到了天气状况、道路条件等因素,并在训练第一交通违法率模型时涉及了样本和标签的确定方式,从而使得第一交通违法率模型能够较好地满足不同条件下的不同监控点适应性地确定违法率区间的需要,进而能够更加准确地评估目标审核人员处理的目标监控点是否存在数据录入异常。
基于上述任一实施例,附图5示出了本发明实施例提供的第二交通违法率模型的确定方法,具体包括如下内容。
步骤510,根据所述目标审核人员所处理的任一目标监控点在多个历史计算周期内的违法凭证的数量和审核照片的数量,计算出多个历史违法率。
步骤520,依据所述多个历史违法率拟合得到所述目标监控点对应的概率密度函数,作为所述监控点对应的第二交通违法率模型。
上一实施例中介绍的第一交通违法率模型适用于本发明实施例中介绍的交通违法数据录入异常检测方法的任何场景中,具有较强的鲁棒性,能够适应审核数据的多样性,但模型训练过程较为复杂,当检测周期较短、检测频率较高时存在一定的效率问题,因此适用于检测周期为7天到1个月左右的应用场景。而本实施例中介绍的交通违法率模型是基于概率密度函数的第二交通违法率模型,适用于检测周期较短、检测频率较高的应用场景,该场景中数据的多样性程度较低,例如郊区设置的监控点存在车流量比较固定的现象,又例如部分城市的气候变化较小、天气状况稳定。对于该类场景的监控点而言,平均环境系数和/或路况系数均区别不大,因此无需考虑上述两个因素,直接根据驶经不同监控点的驾驶员的行为习惯来确定对应的第二交通违法率模型即可。
本实施例首先通过步骤510计算多个历史违法率,该步骤与上一实施例中的步骤410相同,此处不再赘述。
然后,可以获取对应于目标监控点的第二交通违法率模型所指示的违法率区间。步骤520直接通过函数拟合的方式,依据多个历史违法率数据拟合得到目标监控点对应的概率密度函数。示例性的,交通违法率模型可以是正态分布的概率密度函数,可通过如下公式(2)来表示:
Figure P_210928114653231_231398001
(2)
其中,x表示违法率;f(x)表示对应于违法率的概率;μ表示违法率的均值;σ表示违法率的标准差。
上述函数反映出在根据多个历史违法率的数据所拟合出的概率密度函数,该函数中违法率的均值μ可以看做是违法率区间取值的平均值,违法率的标准差σ可以看作是违法率区间取值的波动程度。该概率密度函数在本场景中的数学含义在于,由于该概率密度函数符合正态分布的态势,因此,基于均值μ和标准差σ构建的违法率区间,在不存在异常录入情况时概率密度函数的取值应该位于该违法率区间中。如果取值超过该违法率区间,则代表存在数据录入异常的概率较大。具体在这种情况下,交通违法率模型指示的违法率区间可以是(μ-σ,μ+σ)。该概率密度函数拟合过程可以通过Matlab等第三方工具实现,将多个历史违法率的数据输入至该类第三方工具后,选择拟合函数的类型为正态分布的概率密度函数,即可确定相应的均值μ和标准差σ,进而确定违法率区间。
本发明实施例提供的第二交通违法率模型,通过构建概率密度函数来拟合多个历史违法率数据,从而确定目标监控点对应的违法率区间,该方法适用于检测周期较短、检测频率较高、数据的多样性程度较低的简单应用场景,能同时兼顾违法率区间确定的准确性和效率。
基于上述任一实施例,附图6示出了本发明实施例提供的交通违法数据录入异常检测方法的流程示意图,具体包括如下内容。
步骤610,根据所述目标车牌号,从检测周期内所述目标审核人员对应的审核照片中筛选出待验证数据集。
本发明实施例中的待验证数据集用于在前述实施例提供的方法初步认定审核人员的审核数据存在潜在的异常行为的基础上,进一步地验证该审核人员是否存在录入异常行为。
具体地,当确定任一审核人员在监测周期内对应的整体违法率达到存在异常时,可以从该监测周期内与审核人员对应的审核照片中筛选出多个审核照片,作为待验证数据集。示例性的,本步骤是根据审核人员对应的审核照片中的目标车牌号,来确定待验证数据集。其原因在于审核人员的异常录入情形往往对应了特定的车辆,因此,待验证数据集的确定是根据审核人员对应的审核照片中的目标车牌号来确定的。
步骤620,由目标督查人员对所述待验证数据集进行审核,确定督查违法率。
本发明实施例中进一步地验证该审核人员是否存在录入异常行为,是由目标督查人员实施的。目标督查人员是交通违法数据审核系统中对审核人员的审核工作进行监督的工作人员。具体地,当前述实施例提供的方法初步认定审核人员的审核数据存在潜在的异常行为时,系统可以向目标督查人员发出预警消息,由目标督查人员介入后续录入异常的检测工作。
示例性地,目标督查人员可以根据人工审核的方式对待验证数据集进行二次审核,得到目标督查人员所确定的违法凭证的数量。进而可以根据该违法凭证的数量占待验证数据集的比例,得到对应的督查违法率。
步骤630,根据所述标督查人员确定的督查违法率和所述目标审核人员对应的整体违法率,确定所述目标审核人员对应的交通违法数据录入异常检测结果。
在目标督查人员确定了督查违法率后,可以比较目标督查人员的督查违法率以及目标审核人员对应的整体违法率,如果两者之差大于预设的阈值,则最终确定所述目标审核人员对应的交通违法数据录入存在异常。
基于上述任一实施例,附图7示出了本申请实施例提供的待验证数据集的确定方法的流程示意图,所述根据所述目标车牌号,从检测周期内所述目标审核人员对应的审核照片中筛选出待验证数据集,具体包括如下内容。
步骤710,确定检测周期内所述目标审核人员对应的审核照片,作为任务数据集。
服务端可以根据检测周期内审核人员标识对应的审核照片构造任务数据集。该任务数据集中包括审核人员标识指示的审核人员在检测周期内审核过的所有审核照片。
步骤720,确定检测周期内所述目标审核人员对应的违法凭证中出现的目标车牌号,并从所述任务数据集中删除与所述目标车牌号对应的审核照片,得到中间数据集。
前述实施例中提到,审核系统以及录入系统中的审核照片均可以附带审核照片中的车牌号信号。系统可以对检测周期内审核人员标识对应的审核人员录入的违法凭证进行检查,从而统计出多个目标车牌号。系统可以从任务数据集中删除与目标车牌号对应的审核照片,以剩余的审核照片构成中间数据集。
步骤730,筛选出所述中间数据集中出现次数达到指定数值的车牌号对应的审核照片构成待检数据集,并从所述中间数据集中删除所述待检数据集中的审核照片。
其中,指定数值可以是经验值,用于筛选构成待检数据集的审核照片。示例性的,指定数值为3,系统可以对中间数据集中审核照片中的车牌号进行统计,若有车牌号在不同的审核照片出现至少3次,可以将该车牌号对应的审核照片放入待检数据集中。
在构成待检数据集之后,系统可以从中间数据集中删除待检数据集中的审核照片。
步骤740,从所述中间数据集中随机抽取指定数量的审核照片加入所述待检数据集,并将所述待检数据集中的审核照片作为待验证数据。
其中,指定数量可以是经验值。系统可以从经过删除的中间数据集中随机抽取指定数量的审核照片,放入待检数据集中。待检数据集中的审核照片可以作为待验证数据。
本发明实施例提供的待验证数据集的确定方法,确定了如何进一步评估目标审核人员是否存在录入异常情况的数据基础,本方法通过排除审核人员已经录入的审核照片作为安全数据,并统计未录入照片中出现频率较高的车牌号对应的审核照片作为重点督查的风险数据,同时还在待验证数据集中加入了随机抽样的审核照片以保证数据的全面性,从而能够准确地评估目标审核人员是否存在录入异常情况。
基于上述任一实施例,在确定所述目标审核人员对应的整体违法率之前,服务端可以将各监控点采集的审核照片分配给各审核人员。为避免不同审核人员因工作量不同影响审核质量,可以在分配审核任务时,保证各审核人员的工作量大致相同。在进行任务分配时还需要考虑其他影响数据录入异常检测准确性的任务分配因素,具体通过下述实施例进行说明。
参见图8,为本申请一实施例提供的任务分配方法的流程示意图,如图8所示,该方法可以如下步骤810-步骤830。
步骤810:依据每一监控点的审核照片的数据量和对应于监控点的违法类型信息,计算总审核工作量和对应于监控点的单一监控点工作量。
这里,违法类型信息指示交通违法行为。
各监控点对应的违法类型信息预先确定;而对于不同交通违法行为,审核人员审核一份审核照片的时长是不同的。示例性的,对于超速的审核照片,审核人员可以5秒钟审核一份审核照片;对于未系安全带,审核人员需要15秒钟审核一份审核照片。服务端可以依据对应于监控点的违法类型信息确定该监控点下审核照片的单位审核时长。
此外,对于不同的交通违法行为,交通行为识别算法的准确性也不一样。示例性的,对于超速而言,交通行为识别算法的准确率极高,审核人员可从100份审核照片中确定95份违法凭证;对于未系安全带,交通行为识别算法的准确率较低,审核人员可从20份审核照片中确定1份违法凭证。为此,通过审核难度系数表示确定1份违法凭证所需要的审核照片的数量。
针对每一监控点,服务端可以基于该监控点的审核照片的数据量、违法类型信息和与违法类型信息对应的审核难度系数,计算出该监控点对应的单一监控点工作量,并可累加各监控点的单一监控点工作量,获得总审核工作量。单一监控点工作量的计算方式可通过如下公式来表示:
Figure P_210928114653260_260701001
(3)
其中,ti表示第i个监控点的单一监控点工作量;npi表示第i个监控点的审核照片的数据量;Wi表示与第i个监控点的违法类型信息对应的审核难度系数;spi表示与第i个监控点的违法类型信息对应的单个审核照片的平均审核时长;sw表示输入一个违法凭证的时长。
总审核工作量的计算方式可通过如下公式来表示:
Figure P_210928114653291_291948001
(4)
其中,T表示总审核工作量;ti表示第i个监控点的单一监控点工作量;N表示监控点总量。
步骤820:依据审核人员标识总量和总审核工作量,确定平均审核工作量。
审核人员标识总量与审核人员总量相同,服务端在计算出总审核工作量后,可以根据审核人员标识总量求均值,从而得到平均审核工作量。
步骤830:基于各监控点的单一监控点工作量和平均审核工作量,为每一审核人员标识分配与若干监控点对应的审核照片,生成对应于审核人员标识的任务分组。
在确定出平均审核工作量之后,服务端可以以此为基准,对各监控点的单一监控点工作量进行累加,直到累加结果与平均审核工作量的差异小于预设比值阈值(示例性的,该比值阈值可以是5%),此时,以各监控点的审核照片构成一个任务分组。服务端可以从剩余的监控点中继续选择单一监控点工作量进行累加。这个过程重复多次,从而获得与审核人员标识总量相同数量的任务分组,并为各任务分组配置审核人员标识,从而实现任务平均分配。
参见图9,为本申请又一实施例提供的任务分配方法的流程示意图,如图9所示,该方法可以包括如下步骤910-步骤940。
步骤910:依据每一目标监控点的审核照片的数量和所述目标监控点对应的违法类型信息,计算每一目标监控点的审核工作量。
服务端可以通过前文中的公式计算每个单一监控点的单一监控点工作量。
步骤920:依据同一目标地理位置内每一目标监控点的审核工作量和所述目标审核人员的数量,计算各目标地理位置对应的第一平均子审核工作量。
服务端上可以预配置各监控点的地理位置信息,从而可依据地理位置对不同监控点进行划分。
针对每一地理位置内的多个监控点,服务端可以累加所有监控点的单一监控点工作量,并以累加结果对审核人员标识总量求均值,从而得到对应于地理位置的第一平均子审核工作量。其中,第一平均子审核工作量是单个地理位置内以审核人员标识总量求均值后的工作量。
步骤930:基于每一目标地理位置内各目标监控点的审核工作量和所述目标地理位置对应的第一平均子审核工作量,为每一目标审核人员分配所述目标地理位置内各监控点对应的审核照片。
在确定出每个地理位置对应的第一平均子审核工作量之后,针对任一地理位置,服务端可以以该地理位置的第一平均子审核工作量为基准,对该地理位置内各监控点的单一监控点工作量进行累加,直到累加结果与第一平均子审核工作量的差异小于预设比值,此时,以各监控点的审核照片构成一个子任务分组。服务端可以从剩余的监控点中继续选择单一监控点工作量进行累加。这个过程重复多次,从而获得与审核人员标识总量相同数量的子任务分组,并为各子任务分组配置审核人员标识,从而实现对地理位置内任务的平均分配。
步骤940:依据分配给所述目标审核人员的所有目标地理位置内的审核照片,生成所有目标审核人员对应的任务分组。
在将所有地理位置内的审核照片都划分出子任务分组、并配置审核人员标识后,针对每一审核人员标识对应的多个子任务分组,服务端可以将多个子任务分组进行合并,从而获得对应于审核人员标识的任务分组。
通过上述措施,可以将各地理位置内的审核照片平均分配给不同审核人员标识指示的审核人员,从而使得不同审核人员所处理的审核照片在地理分布上具有一致性,有助于后续获得有效的交通违法率模型,便于判断异常录入行为的准确性。
参见图10,为本申请再一实施例提供的任务分配方法的流程示意图,如图10所示,该方法可以包括如下步骤1010-步骤1040。
步骤1010:依据每一目标监控点的审核照片的数量和所述目标监控点对应的违法类型信息,计算每一目标监控点的审核工作量。
服务端可以通过前文中的公式计算每个单一监控点的单一监控点工作量。
步骤1020:依据属于同一目标违法类型的每一目标监控点的审核工作量和所述目标审核人员的数量,计算所述各目标违法类型对应的第二平均子审核工作量。
服务端上可以预配置各监控点的违法类型信息,从而可依据违法类型信息对不同监控点进行划分。
针对每一违法类型信息对应的多个监控点,服务端可以累加所有监控点的单一监控点工作量,并以累加结果对审核人员标识总量求均值,从而得到对应于违法类型信息的第二平均子审核工作量。其中,第二平均子审核工作量是任一违法类型信息对应的总工作量以审核人员标识总量求均值后的工作量。
步骤1030:基于每一目标违法类型信息对应的各目标监控点的审核工作量和所述目标违法类型对应的第二平均子审核工作量,为每一目标审核人员分配所述目标违法类型对应的各监控点对应的审核照片。
在确定出每一违法类型信息对应的第二平均子审核工作量之后,针对任一违法类型信息,服务端可以以该违法类型信息对应的第二平均子审核工作量为基准,对该违法类型信息对应的各监控点的单一监控点工作量进行累加,直到累加结果与第一平均子审核工作量的差异小于预设比值,此时,以各监控点的审核照片构成一个子任务分组。服务端可以从剩余的监控点中继续选择单一监控点工作量进行累加。这个过程重复多次,从而获得与审核人员标识总量相同数量的子任务分组,并为各子任务分组配置审核人员标识,从而实现平均分配与违法类型信息对应的审核任务。
步骤1040:依据分配给所述目标审核人员的所有目标违法类型对应的审核照片,生成所有目标审核人员对应的任务分组。
在将所有违法类型信息对应的审核照片都划分出子任务分组、并配置审核人员标识后,针对每一审核人员标识对应的多个子任务分组,服务端可以将多个子任务分组进行合并,从而获得对应于审核人员标识的任务分组。
通过上述措施,可以将各违法类型信息对应的审核照片平均分配给不同审核人员标识指示的审核人员,从而使得不同审核人员所处理的审核照片在交通违法行为上具有一致性,有助于后续获得有效的交通违法率模型,便于判断异常录入行为的准确性。
图11是本发明一实施例的一种交通违法数据录入异常检测装置的框图,如图11所示,该装置可以包括:
整体计算模块1110,用于根据检测周期内目标审核人员对应的任务分组中所处理的审核照片的数量以及录入的违法凭证的数量,确定所述目标审核人员对应的整体违法率;其中,所述违法凭证是从所述审核照片中生成的;
监控点计算模块1120,用于确定所述目标审核人员所处理的任一目标监控点对应的交通违法率模型指示的违法率区间;
区间确定模块1130,用于根据检测周期内所述目标审核人员所处理的每一目标监控点对应的违法率区间和审核照片数量,确定所述目标审核人员对应的整体违法率区间;
检测结果确定模块1140,用于若所述目标审核人员对应的整体违法率不属于所述整体违法率区间,和/或,所述目标审核人员对应的整体违法率与其他审核人员对应的整体违法率之间的差值均大于预设阈值,则确定检测周期内所述目标审核人员对应的审核照片中的目标车牌号,并根据所述目标车牌号确定所述目标审核人员对应的交通违法数据录入异常检测结果。
上述装置中各个模块的功能和作用的实现过程具体详见上述交通违法数据录入异常检测方法中对应步骤的实现过程,在此不再赘述。
在本申请所提供的几个实施例中,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

Claims (10)

1.一种交通违法数据录入异常检测方法,其特征在于,包括:
根据检测周期内目标审核人员对应的任务分组中所处理的审核照片的数量以及录入的违法凭证的数量,确定所述目标审核人员对应的整体违法率;其中,所述违法凭证是从所述审核照片中生成的;
确定所述目标审核人员所处理的任一目标监控点对应的交通违法率模型指示的违法率区间;
根据检测周期内所述目标审核人员所处理的每一目标监控点对应的违法率区间和审核照片数量,确定所述目标审核人员对应的整体违法率区间;
若所述目标审核人员对应的整体违法率不属于所述整体违法率区间,和/或,所述目标审核人员对应的整体违法率与其他审核人员对应的整体违法率之间的差值均大于预设阈值,则确定检测周期内所述目标审核人员对应的审核照片中的目标车牌号,并根据所述目标车牌号确定所述目标审核人员对应的交通违法数据录入异常检测结果。
2.根据权利要求1所述的方法,其特征在于,所述交通违法率模型为基于神经网络的第一交通违法率模型,对应地,所述确定所述目标审核人员所处理的任一目标监控点对应的交通违法率模型指示的违法率区间,具体包括:
根据所述目标审核人员所处理的任一目标监控点在多个历史计算周期内的违法凭证的数量和审核照片的数量,计算出多个历史违法率;
将所述目标审核人员所处理的任一目标监控点在检测周期内的天气状况对应的平均环境系数、以及道路条件对应的路况系数以及多个历史计算周期内的历史违法率输入到第一交通违法率模型,得到所述目标审核人员所处理的任一目标监控点对应的第一交通违法率模型输出的违法率区间;
其中,第一交通违法率模型是以所述目标监控点在模型构建周期内的天气状况对应的样本平均环境系数、以及道路条件对应的样本路况系数以及多个历史计算周期内的样本历史违法率为训练样本,并以对应的人工标注的违法率区间为标签训练得到的。
3.根据权利要求1所述的方法,其特征在于,所述交通违法率模型为基于概率密度函数的第二交通违法率模型,对应地,所述确定所述目标审核人员所处理的任一目标监控点对应的交通违法率模型指示的违法率区间,具体包括:
根据所述目标审核人员所处理的任一目标监控点在多个历史计算周期内的违法凭证的数量和审核照片的数量,计算出多个历史违法率;
依据所述多个历史违法率拟合得到所述目标监控点对应的概率密度函数,作为所述监控点对应的第二交通违法率模型;其中,所述第二交通违法率模型指示的违法率区间根据所述第二交通违法率模型的均值和标准差确定。
4.根据权利要求1所述的方法,其特征在于,所述根据所述目标车牌号确定所述目标审核人员对应的交通违法数据录入异常检测结果,包括:
根据所述目标车牌号,从检测周期内所述目标审核人员对应的审核照片中筛选出待验证数据集;
由目标督查人员对所述待验证数据集进行审核,确定督查违法率;
根据所述标督查人员确定的督查违法率和所述目标审核人员对应的整体违法率,确定所述目标审核人员对应的交通违法数据录入异常检测结果。
5.根据权利要求4所述的方法,其特征在于,所述根据所述目标车牌号,从检测周期内所述目标审核人员对应的审核照片中筛选出待验证数据集,包括:
确定检测周期内所述目标审核人员对应的审核照片,作为任务数据集;
确定检测周期内所述目标审核人员对应的违法凭证中出现的目标车牌号,并从所述任务数据集中删除与所述目标车牌号对应的审核照片,得到中间数据集;
筛选出所述中间数据集中出现次数达到指定数值的车牌号对应的审核照片构成待检数据集,并从所述中间数据集中删除所述待检数据集中的审核照片;
从所述中间数据集中随机抽取指定数量的审核照片加入所述待检数据集,并将所述待检数据集中的审核照片作为待验证数据。
6.根据权利要求1所述的方法,其特征在于,在所述确定所述目标审核人员对应的整体违法率之前,所述方法还包括:
依据每一目标监控点的审核照片的数量和所述目标监控点对应的违法类型信息,计算每一目标监控点的审核工作量;
依据同一目标地理位置内每一目标监控点的审核工作量和所述目标审核人员的数量,计算各目标地理位置对应的第一平均子审核工作量;
基于每一目标地理位置内各目标监控点的审核工作量和所述目标地理位置对应的第一平均子审核工作量,为每一目标审核人员分配所述目标地理位置内各监控点对应的审核照片;
依据分配给所述目标审核人员的所有目标地理位置内的审核照片,生成所有目标审核人员对应的任务分组。
7.根据权利要求1所述的方法,其特征在于,在所述确定所述目标审核人员对应的整体违法率之前,所述方法还包括:
依据每一目标监控点的审核照片的数量和所述目标监控点对应的违法类型信息,计算每一目标监控点的审核工作量;
依据属于同一目标违法类型的每一目标监控点的审核工作量和所述目标审核人员的数量,计算所述各目标违法类型对应的第二平均子审核工作量;
基于每一目标违法类型信息对应的各目标监控点的审核工作量和所述目标违法类型对应的第二平均子审核工作量,为每一目标审核人员分配所述目标违法类型对应的各监控点对应的审核照片;
依据分配给所述目标审核人员的所有目标违法类型对应的审核照片,生成所有目标审核人员对应的任务分组。
8.一种交通违法数据录入异常检测装置,其特征在于,包括:
整体计算模块,用于根据检测周期内目标审核人员对应的任务分组中所处理的审核照片的数量以及录入的违法凭证的数量,确定所述目标审核人员对应的整体违法率;其中,所述违法凭证是从所述审核照片中生成的;
监控点计算模块,用于确定所述目标审核人员所处理的任一目标监控点对应的交通违法率模型指示的违法率区间;
区间确定模块,用于根据检测周期内所述目标审核人员所处理的每一目标监控点对应的违法率区间和审核照片数量,确定所述目标审核人员对应的整体违法率区间;
检测结果确定模块,用于若所述目标审核人员对应的整体违法率不属于所述整体违法率区间,和/或,所述目标审核人员对应的整体违法率与其他审核人员对应的整体违法率之间的差值均大于预设阈值,则确定检测周期内所述目标审核人员对应的审核照片中的目标车牌号,并根据所述目标车牌号确定所述目标审核人员对应的交通违法数据录入异常检测结果。
9.一种电子设备,其特征在于,所述电子设备包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行权利要求1-7任意一项所述的交通违法数据录入异常检测方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序可由处理器执行以完成权利要求1-7任意一项所述的交通违法数据录入异常检测方法。
CN202111168287.5A 2021-10-08 2021-10-08 交通违法数据录入异常检测方法和装置 Active CN113591824B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111168287.5A CN113591824B (zh) 2021-10-08 2021-10-08 交通违法数据录入异常检测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111168287.5A CN113591824B (zh) 2021-10-08 2021-10-08 交通违法数据录入异常检测方法和装置

Publications (2)

Publication Number Publication Date
CN113591824A true CN113591824A (zh) 2021-11-02
CN113591824B CN113591824B (zh) 2022-02-01

Family

ID=78242924

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111168287.5A Active CN113591824B (zh) 2021-10-08 2021-10-08 交通违法数据录入异常检测方法和装置

Country Status (1)

Country Link
CN (1) CN113591824B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113947392A (zh) * 2021-12-22 2022-01-18 浙江力嘉电子科技有限公司 交通数据审核任务中的异常确定方法和装置
CN114495244A (zh) * 2022-04-08 2022-05-13 深圳前海中电慧安科技有限公司 电像计算数据异常检测方法、装置、设备及存储介质
CN116362625A (zh) * 2023-05-26 2023-06-30 华南理工大学 一种能源资源消费数据多层级校验系统及方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105741596A (zh) * 2016-03-21 2016-07-06 江苏智通交通科技有限公司 电子警察系统检测可靠性控制方法及系统
CN106448149A (zh) * 2016-05-16 2017-02-22 江苏智通交通科技有限公司 道路交通事故预警方法
CN106529902A (zh) * 2016-10-19 2017-03-22 苏州市吴江区公安局 非现场执法人员审核质量检测方法和系统
CN107644532A (zh) * 2017-09-20 2018-01-30 中山大学 一种基于贝叶斯网络的交通违法行为严重等级预测方法
WO2018140022A1 (en) * 2017-01-26 2018-08-02 Ford Global Technologies, Llc Autonomous vehicle providing driver education
CN109949569A (zh) * 2019-02-18 2019-06-28 广东中标数据科技股份有限公司 一种交通违法数据审核系统及其实现方法
CN111951144A (zh) * 2020-08-26 2020-11-17 腾讯科技(深圳)有限公司 一种违章路段的确定方法、设备及计算机可读存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105741596A (zh) * 2016-03-21 2016-07-06 江苏智通交通科技有限公司 电子警察系统检测可靠性控制方法及系统
CN106448149A (zh) * 2016-05-16 2017-02-22 江苏智通交通科技有限公司 道路交通事故预警方法
CN106529902A (zh) * 2016-10-19 2017-03-22 苏州市吴江区公安局 非现场执法人员审核质量检测方法和系统
WO2018140022A1 (en) * 2017-01-26 2018-08-02 Ford Global Technologies, Llc Autonomous vehicle providing driver education
CN107644532A (zh) * 2017-09-20 2018-01-30 中山大学 一种基于贝叶斯网络的交通违法行为严重等级预测方法
CN109949569A (zh) * 2019-02-18 2019-06-28 广东中标数据科技股份有限公司 一种交通违法数据审核系统及其实现方法
CN111951144A (zh) * 2020-08-26 2020-11-17 腾讯科技(深圳)有限公司 一种违章路段的确定方法、设备及计算机可读存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ARASH J ET AL: "《Investigating Cyclist Violations at Signal-Controlled Intersections Using Naturalistic Cycling Data》", 《IEEE》 *
LI YX ET AL: "《Analysis and Prediction of Intersection Traffic Violations Using Automated Enforcement System Data》", 《SCIENCEDIRECT》 *
钟宁: "《超速行驶的道路交通安全风险管控研究》", 《中国优秀博硕士学位论文全文数据库(硕士)工程科技Ⅰ辑》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113947392A (zh) * 2021-12-22 2022-01-18 浙江力嘉电子科技有限公司 交通数据审核任务中的异常确定方法和装置
CN113947392B (zh) * 2021-12-22 2022-03-15 浙江力嘉电子科技有限公司 交通数据审核任务中的异常确定方法和装置
CN114495244A (zh) * 2022-04-08 2022-05-13 深圳前海中电慧安科技有限公司 电像计算数据异常检测方法、装置、设备及存储介质
CN114495244B (zh) * 2022-04-08 2022-07-12 深圳前海中电慧安科技有限公司 电像计算数据异常检测方法、装置、设备及存储介质
CN116362625A (zh) * 2023-05-26 2023-06-30 华南理工大学 一种能源资源消费数据多层级校验系统及方法
CN116362625B (zh) * 2023-05-26 2023-08-15 华南理工大学 一种能源资源消费数据多层级校验系统及方法

Also Published As

Publication number Publication date
CN113591824B (zh) 2022-02-01

Similar Documents

Publication Publication Date Title
CN113591824B (zh) 交通违法数据录入异常检测方法和装置
CN111128399B (zh) 一种基于人流密度的流行病疫情风险等级评估方法
CN108965826B (zh) 监控方法、装置、处理设备及存储介质
US8036960B2 (en) System and method for coordinating the collection, analysis and storage of payroll information provided to government agencies by government contractors
US9262914B2 (en) Rogue vehicle detection
CN112633395B (zh) 异常数据的检测方法、装置、计算机设备和存储介质
CN107633030B (zh) 基于数据模型的信用评估方法及装置
CN106295351B (zh) 一种风险识别方法及装置
CN112711757B (zh) 一种基于大数据平台的数据安全集中管控方法及系统
CN110991999A (zh) 执法裁量效率的提高方法、装置、计算机设备及存储介质
CN110969190A (zh) 非法营运车辆检测方法、介质、设备及装置
WO2019062192A1 (zh) 业务员行为风险甄别管理方法、应用服务器及计算机可读存储介质
CN113947392B (zh) 交通数据审核任务中的异常确定方法和装置
CN111611519A (zh) 一种个人异常行为检测方法及装置
CN115689396A (zh) 污染物排放管控方法、装置、设备及介质
CN110533094B (zh) 一种用于驾驶员的评价方法和系统
CN117151513A (zh) 评价交通安全的方法、装置、设备及存储介质
CN110019947B (zh) 一种数据提取方法及装置
CN105825130A (zh) 一种信息安全预警方法及装置
CN114708728B (zh) 一种识别交通高峰期的方法、电子设备及存储介质
KR102362808B1 (ko) 상황별 근로자위험도 측정 방법
CN105069467B (zh) 车辆油位数据的筛选方法和装置
CN114971887A (zh) 信贷系统的作业监控方法及装置、存储介质、电子设备
CN114022114A (zh) 基于电信行业的数据治理平台
Ryguła et al. A Model for Identifying Road Risk Class

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant