CN107885795B - 一种卡口数据的数据校验方法、系统和装置 - Google Patents
一种卡口数据的数据校验方法、系统和装置 Download PDFInfo
- Publication number
- CN107885795B CN107885795B CN201711000886.XA CN201711000886A CN107885795B CN 107885795 B CN107885795 B CN 107885795B CN 201711000886 A CN201711000886 A CN 201711000886A CN 107885795 B CN107885795 B CN 107885795B
- Authority
- CN
- China
- Prior art keywords
- data
- detection
- probability
- gate
- missed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2474—Sequence data queries, e.g. querying versioned data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2477—Temporal data queries
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0108—Measuring and analyzing of parameters relative to traffic conditions based on the source of data
- G08G1/0116—Measuring and analyzing of parameters relative to traffic conditions based on the source of data from roadside infrastructure, e.g. beacons
Abstract
本发明公开了一种卡口数据的数据校验方法、系统和装置,方法包括:根据已有的卡口检测数据和漏检卡口的特征推算漏检卡口的可能出行路径;根据漏检卡口的可能出行路径和历史卡口数据库,采用贝叶斯概率模型回溯推算出对应于漏检卡口的所有可能出行路径的漏检概率;根据回溯推算出的漏检概率,结合历史卡口数据库的数据对漏检卡口进行数据检验和补全;计算卡口的检出率。本发明基于贝叶斯概率论、数据反推技术和数据的自校验原理,操作简易方便,适用面广;采用了贝叶斯条件概率论的方法分析出漏检卡口中所有可能出行路径的漏检概率,并结合已有的卡口检测数据计算出卡口的各类检出率,能保证较高的计算精度。本发明可广泛应用于数据挖掘领域。
Description
技术领域
本发明涉及数据挖掘领域,尤其是一种卡口数据的数据校验方法、系统和装置。
背景技术
高清车辆卡口系统在实际交通管理中应用广泛,其卡口通过采用先进的光电、计算机、图像处理、模式识别和远程数据访问等技术,对监控路段的机动车道、非机动车道进行全天候实时监控并记录相关图像数据。该卡口系统的前端处理系统对所拍摄的图像进行分析,从中自动获取车辆的通过时间、地点、行驶方向、号牌号码、号牌颜色、车身颜色等数据,并将获取到的信息通过计算机网络传输到卡口系统控制中心的数据库中进行数据存储、查询、比对等处理,当发现肇事逃逸、违规或可疑车辆时,系统会自动向拦截系统及相关人员发出告警信号等。该卡口系统还能发现道路拥堵路段,及时发布实时的交通拥堵信息。
但是高清车辆卡口系统目前仍有一定的误差率,最典型的误差就是卡口漏检。造成卡口对车辆漏检的原因有很多,包括但不限于:1)卡口拍摄本身需要一定的时间,若同时间经过的车辆数量太多,由于摄像头延时等因素,会出现遗漏拍摄的情况;2)同一方向车道上,大型车辆在转弯、变道、掉头等时刻往往会遮挡其他小车的车牌信息;3)卡口拍摄位置、角度问题,如出现逆光、侧光拍摄或受建筑物遮挡的时候,会导致图像清晰度受影响而无法识别的情况;4)恶劣天气,如大雾、暴雨雪、台风或夜晚光线不足情况下,卡口拍摄受外界影响而会出现漏检的情况;5)卡口设备出现故障而造成漏检。由于道路卡口常有漏检等误差情况,如何利用卡口自身数据库信息反推出漏检的数据,同时对检测的数据进行校验,减少卡口检出率计算误差的产生,就成了一项值得推广的技术。
在传统的道路交通数据校验中,除道路卡口数据外,还需较多地利用别的手段获取的其他类型数据,如常规交通检测软件、视频监控、车辆抓拍图片信息、浮动车GPS数据等。常规交通软件检测,不能全面反映道路运行实际情况,与实际情况脱节,无法获悉实际的路口交通检测率。而视频监控和车辆抓拍的图片信息,其信息量都很大,调出数据和图片时费时费力。浮动车GPS数据根据道路行驶车辆装载的GPS定位系统或手机定位装置测速,能了解道路车辆运行情况,但由于装有GPS装置且可以获取数据的数量有限,其检测的车辆也只有有限的车型,受抽样调查的样本容量较小的影响,误差率较大;同时由于该数据获取手段和数据格式的不同,其在实际操作中存在数据格式转换、数据导入输出的难度大的问题。
综上所述,目前的道路交通数据校验方法需要获取车载GPS、视频监控、抓拍图像、软件检测等其他类型数据,操作较为繁琐和复杂,适用面较窄,精度不高,不利于后续进行卡口的检出率(如交叉口卡口的检出率、路段卡口的检出率等)计算,亟待进一步完善和提高。
发明内容
为解决上述技术问题,本发明的第一目的在于:提供一种操作简易方便、适用面广和精度高的,卡口数据的数据校验方法。
本发明的第二目的在于:提供一种操作简易方便、适用面广和精度高的,卡口数据的数据校验系统。
本发明的第三目的在于:提供一种操作简易方便、适用面广和精度高的,卡口数据的数据校验装置。
本发明所采取的第一技术方案是:
一种卡口数据的数据校验方法,包括以下步骤:
根据已有的卡口检测数据和漏检卡口的特征推算漏检卡口的可能出行路径;
根据漏检卡口的可能出行路径和历史卡口数据库,采用贝叶斯概率模型回溯推算出对应于漏检卡口的所有可能出行路径的漏检概率;
根据回溯推算出的漏检概率,结合历史卡口数据库的数据对漏检卡口进行数据检验和补全;
根据数据检验和补全的结果计算卡口的检出率。
进一步,所述根据已有的卡口检测数据和漏检卡口的特征推算漏检卡口的可能出行路径这一步骤,具体包括:
确定研究范围和时间段;
在研究范围和时间段内根据历史卡口数据库中所有相同车牌的车辆经过两个相邻卡口的时间差,得到完整的单次出行链数据;
根据漏检卡口界定的原则,推算漏检卡口的可能出行路径。
进一步,所述在研究范围和时间段内根据历史卡口数据库中所有相同车牌的车辆经过两个相邻卡口的时间差,得到完整的单次出行链数据这一步骤,具体包括:
根据历史卡口数据库的卡口过车时间记录,计算历史卡口数据库中所有相同车牌的车辆经过两相邻卡口的时间差;
判断计算出的时间差是否大于设定的时间阈值,若是,则判定两相邻卡口为非单次出行卡口,反之,则判定两相邻卡口为单次出行卡口;
将同一车牌的车辆中所有属于单次出行卡口的数据整合成完整的单次出行链数据,所述完整的单次出行链数据中第一个数据所对应的卡口为同一车牌的车辆的起始卡口,所述完整的单次出行链数据中最后一个数据所对应的卡口为同一车牌的车辆的终点卡口。
进一步,所述根据漏检卡口的可能出行路径和历史卡口数据库,采用贝叶斯概率模型回溯推算出对应于漏检卡口的所有可能出行路径的漏检概率这一步骤,具体包括:
根据漏检卡口在历史卡口数据库中选择回溯推算的起始节点和终点节点;
计算起始节点与终点节点间每条可能出行路径的概率P(βi),其中,βi为起始节点与终点节点间的第i条可能出行路径,i为正整数;
分析可能出行路径βi中在历史卡口数据库内已有检测数据的卡口所占的比例P(α|βi);
根据可能出行路径βi和比例P(α|βi)采用贝叶斯概率模型计算对应于漏检卡口的所有可能出行路径的漏检概率,所述对应于漏检卡口的所有可能出行路径的漏检概率P(βi|α)计算公式为:其中,k为贝叶斯概率模型的累计参数。
进一步,所述根据回溯推算出的漏检概率,结合历史卡口数据库的数据对漏检卡口进行数据检验和补全这一步骤,具体包括:
求出所有可能出行路径的漏检概率P(βi|α)中的最大概率max[P(βi|α)]以及最大概率max[P(βi|α)]对应的可能出行路径;
根据最大概率max[P(βi|α)]对应的可能出行路径进行回溯计算,结合历史卡口数据库中已有的卡口检测数据对漏检卡口的数据进行自校验和补全。
进一步,所述根据最大概率max[P(βi|α)]对应的可能出行路径进行回溯计算,结合历史卡口数据库中已有的卡口检测数据对漏检卡口的数据进行自校验和补全这一步骤,具体包括:
以最大概率max[P(βi|α)]对应的可能出行路径作为当前回溯路径;
根据判断的结果执行相应的操作:若当前回溯路径满足设定的校验条件,则直接执行下一步骤,反之,则以次最大概率对应的可能出行路径作为当前回溯路径重新判断当前回溯路径是否满足设定的校验条件,其中,次最大概率为除当前回溯路径对应的概率之外的其它概率最大值;
根据历史卡口数据库中已有的过车时间记录,当前回溯路径起始节点和终点节点间的车辆的平均行驶时间以及已有检测数据的卡口的过车时间记录,对漏检卡口的过车时间记录进行补全,得到漏检卡口补全后的过车时间记录。
本发明所采取的第二技术方案是:
一种卡口数据的数据校验系统,包括:
预处理模块,用于根据已有的卡口检测数据和漏检卡口的特征推算漏检卡口的可能出行路径;
回溯推算模块,用于根据漏检卡口的可能出行路径和历史卡口数据库,采用贝叶斯概率模型回溯推算出对应于漏检卡口的所有可能出行路径的漏检概率;
补全和检验模块,用于根据回溯推算出的漏检概率,结合历史卡口数据库的数据对漏检卡口进行数据检验和补全;
卡口检出率计算模块,用于根据数据检验和补全的结果计算卡口的检出率。
进一步,所述回溯推算模块包括:
选择单元,用于根据漏检卡口在历史卡口数据库中选择回溯推算的起始节点和终点节点;
计算单元,用于计算起始节点与终点节点间每条可能出行路径的概率P(βi),其中,βi为起始节点与终点节点间的第i条可能出行路径,i为正整数;
分析单元,用于分析可能出行路径βi中在历史卡口数据库内已有检测数据的卡口所占的比例P(α|βi);
漏检概率计算单元,用于根据可能出行路径βi和比例P(α|βi)采用贝叶斯概率模型计算对应于漏检卡口的所有可能出行路径的漏检概率,所述对应于漏检卡口的所有可能出行路径的漏检概率P(βi|α)计算公式为:其中,k为贝叶斯概率模型的累计参数。
进一步,所述补全和检验模块包括:
最大概率获取单元,用于求出所有可能出行路径的漏检概率P(βi|α)中的最大概率max[P(βi|α)]以及最大概率max[P(βi|α)]对应的可能出行路径;
自校验和补全单元,用于根据最大概率max[P(βi|α)]对应的可能出行路径进行回溯计算,结合历史卡口数据库中已有的卡口检测数据对漏检卡口的数据进行自校验和补全。
本发明所采取的第三技术方案是:
一种卡口数据的数据校验装置,包括:
存储器,用于存放程序;
处理器,用于执行所述程序以用于:
根据已有的卡口检测数据和漏检卡口的特征推算漏检卡口的可能出行路径;
根据漏检卡口的可能出行路径和历史卡口数据库,采用贝叶斯概率模型回溯推算出对应于漏检卡口的所有可能出行路径的漏检概率;
根据回溯推算出的漏检概率,结合历史卡口数据库的数据对漏检卡口进行数据检验和补全;
根据数据检验和补全的结果计算卡口的检出率。
本发明的方法的有益效果是:先推算漏检卡口的可能出行路径,然后根据历史卡口数据库和漏检卡口,采用贝叶斯概率模型回溯推算出对应于漏检卡口的所有可能出行路径的漏检概率,接着根据回溯推算出的漏检概率,结合历史卡口数据库的数据对漏检卡口进行数据检验和补全,最后根据数据检验和补全的结果计算卡口的检出率,基于贝叶斯概率论、数据反推技术和数据的自校验原理,只需利用历史卡口数据库已有的卡口检测数据就能进行数据补全和校验,不需要获取车载GPS、视频监控、抓拍图像、软件检测等其他类型数据进行数据补全计算,操作简易方便,适用面广;采用了贝叶斯条件概率论的方法分析出漏检卡口所有可能出行路径的漏检概率,并结合历史卡口数据库已有的卡口检测数据,对漏检卡口缺失的数据进行补全和校验,最后计算出卡口的各类检出率,能保证较高的计算精度。
本发明的系统的有益效果是:先在预处理模块中推算漏检卡口的可能出行路径,然后在回溯推算模块中根据历史卡口数据库和漏检卡口,采用贝叶斯概率模型回溯推算出对应于漏检卡口的所有可能出行路径的漏检概率,接着在补全和检验模块中根据回溯推算出的漏检概率,结合历史卡口数据库的数据对漏检卡口进行数据检验和补全,最后在卡口检出率计算模块中根据数据检验和补全的结果计算卡口的检出率,基于贝叶斯概率论、数据反推技术和数据的自校验原理,只需利用历史卡口数据库已有的卡口检测数据就能进行数据补全和校验,不需要获取车载GPS、视频监控、抓拍图像、软件检测等其他类型数据进行数据补全计算,操作简易方便,适用面广;在回溯推算模块中采用了贝叶斯条件概率论的方法分析出漏检卡口中所有可能出行路径的漏检概率,并在补全和检验模块中结合历史卡口数据库已有的卡口检测数据,对漏检卡口缺失的数据进行补全和校验,最后计算出卡口的各类检出率,能保证较高的计算精度。
本发明的装置的有益效果是:处理器在执行存储器存放的程序时,先推算漏检卡口的可能出行路径,然后根据历史卡口数据库和漏检卡口,采用贝叶斯概率模型回溯推算出对应于漏检卡口的所有可能出行路径的漏检概率,接着根据回溯推算出的漏检概率,结合历史卡口数据库的数据对漏检卡口进行数据检验和补全,最后根据数据检验和补全的结果计算卡口的检出率,基于贝叶斯概率论、数据反推技术和数据的自校验原理,只需利用历史卡口数据库已有的卡口检测数据就能进行数据补全和校验,不需要获取车载GPS、视频监控、抓拍图像、软件检测等其他类型数据进行数据补全计算,操作简易方便,适用面广;采用了贝叶斯条件概率论的方法分析出漏检卡口所有可能出行路径的漏检概率,并结合历史卡口数据库已有的卡口检测数据,对漏检卡口缺失的数据进行补全和校验,最后计算出卡口的各类检出率,能保证较高的计算精度。
附图说明
图1为本发明一种卡口数据的数据校验方法的步骤流程图;
图2为本发明实施例一的步骤流程图;
图3为本发明实施例一路网卡口数据反推示意图。
具体实施方式
参照图1,一种卡口数据的数据校验方法,包括以下步骤:
根据已有的卡口检测数据和漏检卡口的特征推算漏检卡口的可能出行路径;
根据漏检卡口的可能出行路径和历史卡口数据库,采用贝叶斯概率模型回溯推算出对应于漏检卡口的所有可能出行路径的漏检概率;
根据回溯推算出的漏检概率,结合历史卡口数据库的数据对漏检卡口进行数据检验和补全;
根据数据检验和补全的结果计算卡口的检出率。
其中,历史卡口数据库中所有卡口名称均为已知,但有部分卡口的检测数据(如车辆经过该卡口的时刻,即卡口的过车时间记录)因被漏检而未知。
漏检卡口,是相对于给定的起点卡口和终点卡口来说的,具体是指在起点卡口和终点卡口之间满足如下任一情形的卡口:缺失记录的、有检验记录但无法识别的、有检验记录但有明显误差或错误的。
在数据补全的基础上,本发明可计算卡口的各类检出率。卡口的检出率包括:交叉口卡口的检出率、路段卡口的检出率、区域路网卡口的检出率、特殊事件的卡口检出率等。
本发明基于贝叶斯概率论、数据反推技术和数据的自校验原理,用历史卡口数据库中已有的车辆轨迹分布规律,参考贝叶斯概率论的方法分析漏检卡口所有可能出行路径的出行概率,并优先使用可能出行路径中出行概率大的数值,结合用历史卡口数据库中已有的过车时间记录,对漏检卡口的过车数据进行补全,具有可靠、成熟的理论和数据基础,能保证较高的校验精度,有利于后续进行卡口的检出率计算。
进一步作为优选的实施方式,所述根据已有的卡口检测数据和漏检卡口的特征推算漏检卡口的可能出行路径这一步骤,具体包括:
确定研究范围和时间段;
在研究范围和时间段内根据历史卡口数据库中所有相同车牌的车辆经过两个相邻卡口的时间差,得到完整的单次出行链数据;
根据漏检卡口界定的原则,推算漏检卡口的可能出行路径。
本发明先根据已有的卡口检测数据确定完整的出行链,再根据漏检卡口的特征进行漏检数据的界定,最后进行可能出行路径的推算,从而在筛选出单次出行链中的漏检卡口后,即可推算出漏检卡口的可能出行路径。漏检卡口界定的原则可根据漏检卡口的特征预先设定。
进一步作为优选的实施方式,所述在研究范围和时间段内根据历史卡口数据库中所有相同车牌的车辆经过两个相邻卡口的时间差,得到完整的单次出行链数据这一步骤,具体包括:
根据历史卡口数据库的卡口过车时间记录,计算历史卡口数据库中所有相同车牌的车辆经过两相邻卡口的时间差;
判断计算出的时间差是否大于设定的时间阈值,若是,则判定两相邻卡口为非单次出行卡口,反之,则判定两相邻卡口为单次出行卡口;
将同一车牌的车辆中所有属于单次出行卡口的数据整合成完整的单次出行链数据,所述完整的单次出行链数据中第一个数据所对应的卡口为同一车牌的车辆的起始卡口,所述完整的单次出行链数据中最后一个数据所对应的卡口为同一车牌的车辆的终点卡口。
进一步作为优选的实施方式,所述根据漏检卡口的可能出行路径和历史卡口数据库,采用贝叶斯概率模型回溯推算出对应于漏检卡口的所有可能出行路径的漏检概率这一步骤,具体包括:
根据漏检卡口在历史卡口数据库中选择回溯推算的起始节点和终点节点;
计算起始节点与终点节点间每条可能出行路径的概率P(βi),其中,βi为起始节点与终点节点间的第i条可能出行路径,i为正整数;
分析可能出行路径βi中在历史卡口数据库内已有检测数据的卡口所占的比例P(α|βi);
根据可能出行路径βi和比例P(α|βi)采用贝叶斯概率模型计算对应于漏检卡口的所有可能出行路径的漏检概率,所述对应于漏检卡口的所有可能出行路径的漏检概率P(βi|α)计算公式为:其中,k为贝叶斯概率模型的累计参数。
本发明回溯推算的起始节点和终点节点根据漏检卡口进行选取,其需要满足的条件是:起始节点到终点节点间的路径至少有2条,且至少有一条路径包含漏检卡口。回溯推算的起始节点和终点节点可在不满足设定的校验条件时重新进行选择和调整。
进一步作为优选的实施方式,所述根据回溯推算出的漏检概率,结合历史卡口数据库的数据对漏检卡口进行数据检验和补全这一步骤,具体包括:
求出所有可能出行路径的漏检概率P(βi|α)中的最大概率max[P(βi|α)]以及最大概率max[P(βi|α)]对应的可能出行路径;
根据最大概率max[P(βi|α)]对应的可能出行路径进行回溯计算,结合历史卡口数据库中已有的卡口检测数据对漏检卡口的数据进行自校验和补全。
进一步作为优选的实施方式,所述根据最大概率max[P(βi|α)]对应的可能出行路径进行回溯计算,结合历史卡口数据库中已有的卡口检测数据对漏检卡口的数据进行自校验和补全这一步骤,具体包括:
以最大概率max[P(βi|α)]对应的可能出行路径作为当前回溯路径;
根据判断的结果执行相应的操作:若当前回溯路径满足设定的校验条件,则直接执行下一步骤,反之,则以次最大概率对应的可能出行路径作为当前回溯路径重新判断当前回溯路径是否满足设定的校验条件,其中,次最大概率为除当前回溯路径对应的概率之外的其它概率最大值;
根据历史卡口数据库中已有的过车时间记录,当前回溯路径起始节点和终点节点间的车辆的平均行驶时间以及已有检测数据的卡口的过车时间记录,对漏检卡口的过车时间记录进行补全,得到漏检卡口补全后的过车时间记录。
与图1的方法相对应,本发明还提供了一种卡口数据的数据校验系统,包括:
预处理模块,用于根据已有的卡口检测数据和漏检卡口的特征推算漏检卡口的可能出行路径;
回溯推算模块,用于根据漏检卡口的可能出行路径和历史卡口数据库,采用贝叶斯概率模型回溯推算出对应于漏检卡口的所有可能出行路径的漏检概率;
补全和检验模块,用于根据回溯推算出的漏检概率,结合历史卡口数据库的数据对漏检卡口进行数据检验和补全;
卡口检出率计算模块,用于根据数据检验和补全的结果计算卡口的检出率。
进一步作为优选的实施方式,所述回溯推算模块包括:
选择单元,用于根据漏检卡口在历史卡口数据库中选择回溯推算的起始节点和终点节点;
计算单元,用于计算起始节点与终点节点间每条可能出行路径的概率P(βi),其中,βi为起始节点与终点节点间的第i条可能出行路径,i为正整数;
分析单元,用于分析可能出行路径βi中在历史卡口数据库内已有检测数据的卡口所占的比例P(α|βi);
漏检概率计算单元,用于根据可能出行路径βi和比例P(α|βi)采用贝叶斯概率模型计算对应于漏检卡口的所有可能出行路径的漏检概率,所述对应于漏检卡口的所有可能出行路径的漏检概率P(βi|α)计算公式为:其中,k为贝叶斯概率模型的累计参数。
进一步作为优选的实施方式,所述补全和检验模块包括:
最大概率获取单元,用于求出所有可能出行路径的漏检概率P(βi|α)中的最大概率max[P(βi|α)]以及最大概率max[P(βi|α)]对应的可能出行路径;
自校验和补全单元,用于根据最大概率max[P(βi|α)]对应的可能出行路径进行回溯计算,结合历史卡口数据库中已有的卡口检测数据对漏检卡口的数据进行自校验和补全。
与图1的方法相对应,本发明还提供了一种卡口数据的数据校验装置,包括:
存储器,用于存放程序;
处理器,用于执行所述程序以用于:
根据已有的卡口检测数据和漏检卡口的特征推算漏检卡口的可能出行路径;
根据漏检卡口的可能出行路径和历史卡口数据库,采用贝叶斯概率模型回溯推算出对应于漏检卡口的所有可能出行路径的漏检概率;
根据回溯推算出的漏检概率,结合历史卡口数据库的数据对漏检卡口进行数据检验和补全;
根据数据检验和补全的结果计算卡口的检出率。
下面结合说明书附图和具体实施例对本发明作进一步解释和说明。
实施例一
针对现有技术操作较为繁琐和复杂,适应面较窄,精度不高的问题,本发明提出了一种卡口数据的数据校验方法、系统和装置。本发明主要基于道路网络中历史卡口数据库已有的卡口检测数据,对漏检卡口的过车记录信息等数据进行校检和补全,实现了检测数据的自校验,提高了道路卡口检测的精度,并能计算出卡口的各类检出率。
本发明涉及到的专有名词如下:
高清车辆卡口系统:该卡口系统采用了先进的光电技术、图像处理技术和模式识别技术对过往的每一辆汽车均拍下车辆的图像,并自动识别出车辆的牌照,并将所采集到的车辆的信息数据均保存在服务器数据库中,用于车辆的缉查布控、道路拥堵判断等。
自校检:数据的自校检属于数据校检的一种,常用的数据校检是指为保证数据的完整、准确,用另一种算法或别的数据源对原始数据计算出的一个校验值,如果该校验值和原数据提供的校验值一样,则说明数据是准确的。而自校检则不需要运用别的数据源,只用自身已有的数据,通过逆向反推、数据清洗、挖掘等技术对原计算数据结果进行校验。自校验使得高清车辆卡口系统仅需根据道路卡口自身数据进行数据校检,不需要其他部门的数据,操作简便,适宜在更多的范围推广。
贝叶斯公式:用于描述计算两个条件概率之间的关系的公式。例如P(A|B)和P(B|A),按照贝叶斯概率论的乘法法则,可以立刻得出:P(A∩B)=P(A)*P(B|A)=P(B)*P(A|B)。
卡口的检出率:指卡口有完整检测数据的比例,即在搜集的卡口检测数据中,已有检测且能识别的卡口数量占统计范围内卡口数量的比例,漏检、无法识别、检验记录为空值的均不列入检出率的计算范围。
本发明对于任意路网,可根据已有的历史卡口检测数据库,对漏检卡口数据进行自校检,并计算出卡口的检出率。如图2所示,卡口的检出率计算过程如下:
第一步:数据预处理:用于划分单次的出行,并根据划分的结果推算漏检卡口的可能出行路径。
如图2所示,数据预处理中划分单次的出行这一过程可进一步细分为:
首先,划定研究范围和时间段,确定首次和末次出行交叉口点。
然后,根据历史卡口数据库的卡口过车时间记录,计算历史卡口数据库中所有相同车牌的车辆经过两个相邻卡口的时间差Δt,若时间差Δt大于设定的时间阈值,则认为是非单次出行(即两个相邻卡口为非单次出行卡口),反之,则认为是单次出行(即两个相邻卡口为单次出行卡口)。
最后,把其他符合单次出行要求的同一车牌的数据形成完整的单次出行数据链,存入历史卡口数据库中,以备下一步根据划分的结果推算漏检卡口的可能出行路径的过程。
如表1(表1中,CARPLATE为车牌号,PALTECOLORTAIL为车牌号的颜色编码,THROUGHTIME为卡口的车辆经过时刻,ADDRESSNAME为卡口的地址名称,ADDRESSID为卡口的地址编码,DRIVEDIRRECTION为卡口的车道方向)所示,车牌号为XXX的车辆,该车辆的多个卡口过车时间记录显示,在2017年2月3日早上有过一次完整的单次出行,从广州市越秀区的先烈南路至荔湾区的恒宝华庭附近;而在2017年2月3日上午的后续出行中,由于其与荔湾区的恒宝华庭卡口的过车时间差大于1.5小时,则可认为前往茶窖、花地大道等地的出行和早上从广州市越秀区的先烈南路至荔湾区的恒宝华庭的出行为非同次的出行。
表1
第二步:在已有的过车记录中挑选漏检卡口以及相应可能出行路径的出行概率。
此步骤可进一步细分为:
Step1:推算漏检卡口的可能出行路径:根据已有卡口数据,确定单次完整出行链,并确定起始卡口,参考卡口漏检的界定原则,得出漏检卡口的可能出行路径。
Step2:采用贝叶斯概率论的算法分析出漏检卡口所有可能出行路径的出行概率。
贝叶斯概率论的算法将调用已有路网中历史卡口检测数据库,运用贝叶斯理论,用选定类型的车辆在车辆全部可能出行路径中的比例作为主要参数,进行漏检卡口所有可能出行路径的出行概率计算。
如图3所示,在已有的历史卡口检测数据库中,假设在两个任意推算节点(11)和(m-1,n)之间有若干个出行路径:β1、β2…βi,假定在这两个推算节点间车辆选择每条可能出行路径出行的概率为P(βi),βi是不相容事件,且∑P(βi)=1。若这些可能出行路径中的卡口在历史卡口检测数据库中是已有检测数据的,则其几率(即可能出行路径βi中在历史卡口数据库内已有检测数据的卡口所占的比例)定义为P(α|βi)。对这2个推算节点之间的所有可能的已有完整检测数据的路径,出现k条路径的累计比例就是根据贝叶斯概率论,通过统计累计比例和各自的可能出行路径的出行几率等指标,则对应漏检卡口漏检的各条可能出行路径的比例P(βi|α)反推计算结果如下式所示:
通过上式求得漏检卡口所有可能出行路径βi的漏检概率后,再求出这些漏检概率中的最大值max[P(βi|α)],max[P(βi|α)]即为漏检卡口车辆的最大可能出行路径的漏检概率。
第三步:补全漏检过车记录值,得出自校验结果。
如图2所示,本发明根据上述最大可能概率max[P(βi|α)]的路径进行回溯计算,结合历史卡口检测数据库中已有卡口检测数据的路径中任意2个推算节点的车辆的平均行驶时间,以及已有检测数据的卡口过车时间记录数据,求得漏检卡口对应的所缺过车时间记录。如果回溯路径中多个数据缺失,或回溯路径中已检测卡口数据较少,则选择上述概率P(βi|α)数值次之的路径进行回溯计算,再依次类推选择其他概率对应的线路。如果缺失数据太多,则应重新选择新的研究范围和时间段(即调整起始节点和终点节点)。
本发明参考贝叶斯概率模型的方法,利用已有车辆出行记录的次数比例作为概率参数,是运用条件概率在交通出行路径选择中的应用之一。此方法可操作性较强,不仅适合指定区域内城市道路网中的应用,还可以推广应用至高速公路卡口系统中,来对高速公路卡口漏检数据进行补全处理。
第四步:根据数据补全的结果计算卡口的各类检出率,包括:交叉口卡口的检出率、路段卡口的检出率、区域路网卡口的检出率、特殊事件的卡口检出率等。
本实施例具有以下优点:
1)用已有数据库中的车辆轨迹分布规律,参考贝叶斯概率论的方法分析可能路径的出行概率。
2)基于数据反推技术,用已有路网的交通分布规律补全卡口漏检数据和进行数据自校验。
3)基础数据仅有卡口的历史检测数据,不需要其他类型的数据,操作简便,适用面广,同时还可以对其他手段如GPS检测的数据进行校核,有利于提升卡口检出率的计算精度。
和现有技术相比,本发明的方案主要利用贝叶斯条件概率论原理,选出所有可能的可出行路径,并优先使用几率大的数值,结合历史卡口数据库中已有的过车行车时间,对缺失的过车数据进行补全,并计算卡口的检出率。该方案只需利用已有的历史卡口检测数据库的数据即可完成数据自校验,不需要获取车载GPS、视频监控、抓拍图像、软件检测等其他类型数据进行数据补全计算,操作简易方便,且具有可靠、成熟的理论和数据基础,能保证较高的卡口检出率计算精度。
以上是对本发明的较佳实施进行了具体说明,但本发明并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。
Claims (6)
1.一种卡口数据的数据校验方法,其特征在于:包括以下步骤:
根据已有的卡口检测数据和漏检卡口的特征推算漏检卡口的可能出行路径;
根据漏检卡口的可能出行路径和历史卡口数据库,采用贝叶斯概率模型回溯推算出对应于漏检卡口的所有可能出行路径的漏检概率;
根据回溯推算出的漏检概率,结合历史卡口数据库的数据对漏检卡口进行数据检验和补全;
根据数据检验和补全的结果计算卡口的检出率;
所述根据漏检卡口的可能出行路径和历史卡口数据库,采用贝叶斯概率模型回溯推算出对应于漏检卡口的所有可能出行路径的漏检概率这一步骤,具体包括:
根据漏检卡口在历史卡口数据库中选择回溯推算的起始节点和终点节点;
计算起始节点与终点节点间每条可能出行路径的概率P(βi),其中,βi为起始节点与终点节点间的第i条可能出行路径,i为正整数;
分析可能出行路径βi中在历史卡口数据库内已有检测数据的卡口所占的比例P(α|βi);
根据可能出行路径βi和比例P(α|βi)采用贝叶斯概率模型计算对应于漏检卡口的所有可能出行路径的漏检概率,所述对应于漏检卡口的所有可能出行路径的漏检概率P(βi|α)计算公式为:其中,k为贝叶斯概率模型的累计参数;
所述根据回溯推算出的漏检概率,结合历史卡口数据库的数据对漏检卡口进行数据检验和补全这一步骤,具体包括:
求出所有可能出行路径的漏检概率P(βi|α)中的最大概率max[P(βi|α)]以及最大概率max[P(βi|α)]对应的可能出行路径;
根据最大概率max[P(βi|α)]对应的可能出行路径进行回溯计算,结合历史卡口数据库中已有的卡口检测数据对漏检卡口的数据进行自校验和补全。
2.根据权利要求1所述的一种卡口数据的数据校验方法,其特征在于:所述根据已有的卡口检测数据和漏检卡口的特征推算漏检卡口的可能出行路径这一步骤,具体包括:
确定研究范围和时间段;
在研究范围和时间段内根据历史卡口数据库中所有相同车牌的车辆经过两个相邻卡口的时间差,得到完整的单次出行链数据;
根据漏检卡口界定的原则,推算漏检卡口的可能出行路径。
3.根据权利要求2 所述的一种卡口数据的数据校验方法,其特征在于:所述在研究范围和时间段内根据历史卡口数据库中所有相同车牌的车辆经过两个相邻卡口的时间差,得到完整的单次出行链数据这一步骤,具体包括:
根据历史卡口数据库的卡口过车时间记录,计算历史卡口数据库中所有相同车牌的车辆经过两相邻卡口的时间差;
判断计算出的时间差是否大于设定的时间阈值,若是,则判定两相邻卡口为非单次出行卡口,反之,则判定两相邻卡口为单次出行卡口;
将同一车牌的车辆中所有属于单次出行卡口的数据整合成完整的单次出行链数据,所述完整的单次出行链数据中第一个数据所对应的卡口为同一车牌的车辆的起始卡口,所述完整的单次出行链数据中最后一个数据所对应的卡口为同一车牌的车辆的终点卡口。
4.根据权利要求1所述的一种卡口数据的数据校验方法,其特征在于:所述根据最大概率max[P(βi|α)]对应的可能出行路径进行回溯计算,结合历史卡口数据库中已有的卡口检测数据对漏检卡口的数据进行自校验和补全这一步骤,具体包括:
以最大概率max[P(βi|α)]对应的可能出行路径作为当前回溯路径;
根据判断的结果执行相应的操作:若当前回溯路径满足设定的校验条件,则直接执行下一步骤,反之,则以次最大概率对应的可能出行路径作为当前回溯路径重新判断当前回溯路径是否满足设定的校验条件,其中,次最大概率为除当前回溯路径对应的概率之外的其它概率最大值;
根据历史卡口数据库中已有的过车时间记录,当前回溯路径起始节点和终点节点间的车辆的平均行驶时间以及已有检测数据的卡口的过车时间记录,对漏检卡口的过车时间记录进行补全,得到漏检卡口补全后的过车时间记录。
5.一种卡口数据的数据校验系统,其特征在于:包括:
预处理模块,用于根据已有的卡口检测数据和漏检卡口的特征推算漏检卡口的可能出行路径;
回溯推算模块,用于根据漏检卡口的可能出行路径和历史卡口数据库,采用贝叶斯概率模型回溯推算出对应于漏检卡口的所有可能出行路径的漏检概率;
补全和检验模块,用于根据回溯推算出的漏检概率,结合历史卡口数据库的数据对漏检卡口进行数据检验和补全;
卡口检出率计算模块,用于根据数据检验和补全的结果计算卡口的检出率;
所述回溯推算模块包括:
选择单元,用于根据漏检卡口在历史卡口数据库中选择回溯推算的起始节点和终点节点;
计算单元,用于计算起始节点与终点节点间每条可能出行路径的概率P(βi),其中,βi为起始节点与终点节点间的第i条可能出行路径,i为正整数;
分析单元,用于分析可能出行路径βi中在历史卡口数据库内已有检测数据的卡口所占的比例P(α|βi);
漏检概率计算单元,用于根据可能出行路径βi和比例P(α|βi)采用贝叶斯概率模型计算对应于漏检卡口的所有可能出行路径的漏检概率,所述对应于漏检卡口的所有可能出行路径的漏检概率P(βi|α)计算公式为:其中,k为贝叶斯概率模型的累计参数;
所述补全和检验模块包括:
最大概率获取单元,用于求出所有可能出行路径的漏检概率P(βi|α)中的最大概率max[P(βi|α)]以及最大概率max[P(βi|α)]对应的可能出行路径;
自校验和补全单元,用于根据最大概率max[P(βi|α)]对应的可能出行路径进行回溯计算,结合历史卡口数据库中已有的卡口检测数据对漏检卡口的数据进行自校验和补全。
6.一种卡口数据的数据校验装置,其特征在于:包括:
存储器,用于存放程序;
处理器,用于执行所述程序以用于:
根据已有的卡口检测数据和漏检卡口的特征推算漏检卡口的可能出行路径;
根据漏检卡口的可能出行路径和历史卡口数据库,采用贝叶斯概率模型回溯推算出对应于漏检卡口的所有可能出行路径的漏检概率;
根据回溯推算出的漏检概率,结合历史卡口数据库的数据对漏检卡口进行数据检验和补全;
根据数据检验和补全的结果计算卡口的检出率;
所述根据漏检卡口的可能出行路径和历史卡口数据库,采用贝叶斯概率模型回溯推算出对应于漏检卡口的所有可能出行路径的漏检概率这一步骤,具体包括:
根据漏检卡口在历史卡口数据库中选择回溯推算的起始节点和终点节点;
计算起始节点与终点节点间每条可能出行路径的概率P(βi),其中,βi为起始节点与终点节点间的第i条可能出行路径,i为正整数;
分析可能出行路径βi中在历史卡口数据库内已有检测数据的卡口所占的比例P(α|βi);
根据可能出行路径βi和比例P(α|βi)采用贝叶斯概率模型计算对应于漏检卡口的所有可能出行路径的漏检概率,所述对应于漏检卡口的所有可能出行路径的漏检概率P(βi|α)计算公式为:其中,k为贝叶斯概率模型的累计参数;
所述根据回溯推算出的漏检概率,结合历史卡口数据库的数据对漏检卡口进行数据检验和补全这一步骤,具体包括:
求出所有可能出行路径的漏检概率P(βi|α)中的最大概率max[P(βi|α)]以及最大概率max[P(βi|α)]对应的可能出行路径;
根据最大概率max[P(βi|α)]对应的可能出行路径进行回溯计算,结合历史卡口数据库中已有的卡口检测数据对漏检卡口的数据进行自校验和补全。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711000886.XA CN107885795B (zh) | 2017-10-24 | 2017-10-24 | 一种卡口数据的数据校验方法、系统和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711000886.XA CN107885795B (zh) | 2017-10-24 | 2017-10-24 | 一种卡口数据的数据校验方法、系统和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107885795A CN107885795A (zh) | 2018-04-06 |
CN107885795B true CN107885795B (zh) | 2021-05-25 |
Family
ID=61782249
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711000886.XA Active CN107885795B (zh) | 2017-10-24 | 2017-10-24 | 一种卡口数据的数据校验方法、系统和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107885795B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108717790B (zh) * | 2018-07-06 | 2021-02-26 | 广州市交通运输研究所 | 一种基于卡口车牌识别数据的车辆出行分析方法 |
CN109087508B (zh) * | 2018-08-30 | 2021-09-21 | 广州市市政工程设计研究总院有限公司 | 基于高清卡口数据的毗邻区域交通量分析方法及系统 |
CN110958423B (zh) * | 2018-09-26 | 2021-08-31 | 浙江宇视科技有限公司 | 一种车辆检测率确定方法及装置 |
CN109448363B (zh) * | 2018-09-30 | 2021-06-08 | 佳都科技集团股份有限公司 | 基于轨迹预测的嫌疑车辆智能封控方法、系统及处理终端 |
CN111833591A (zh) * | 2019-04-17 | 2020-10-27 | 北京嘀嘀无限科技发展有限公司 | 交通卡口的信息校验方法、装置、电子设备与存储介质 |
CN110362557B (zh) * | 2019-05-27 | 2022-04-26 | 华南理工大学 | 一种基于机器学习和车牌识别数据的缺失路径修复方法 |
CN111369790B (zh) * | 2019-10-16 | 2021-11-09 | 杭州海康威视系统技术有限公司 | 过车记录校正方法、装置、设备及存储介质 |
CN113763696B (zh) * | 2020-06-01 | 2023-05-02 | 杭州海康威视数字技术股份有限公司 | 一种车辆路径重构方法、装置、电子设备及存储介质 |
CN112201045A (zh) * | 2020-09-29 | 2021-01-08 | 北京计算机技术及应用研究所 | 一种用于填补汽车电子标识漏读数据的方法 |
CN112289024B (zh) * | 2020-10-23 | 2022-04-05 | 杭州海康威视系统技术有限公司 | 一种交通事件信息的识别方法、装置、设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106940931A (zh) * | 2017-02-28 | 2017-07-11 | 江苏智通交通科技有限公司 | 基于定位数据的卡口设备数据质量检验方法 |
CN107195180A (zh) * | 2017-06-08 | 2017-09-22 | 青岛海信网络科技股份有限公司 | 一种基于电警数据的交通出行轨迹提取方法和装置 |
CN107590999A (zh) * | 2017-08-18 | 2018-01-16 | 广东方纬科技有限公司 | 一种基于卡口数据的交通状态判别方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120284315A1 (en) * | 2011-05-04 | 2012-11-08 | Microsoft Corporation | Optimization of non-deterministic computational paths |
-
2017
- 2017-10-24 CN CN201711000886.XA patent/CN107885795B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106940931A (zh) * | 2017-02-28 | 2017-07-11 | 江苏智通交通科技有限公司 | 基于定位数据的卡口设备数据质量检验方法 |
CN107195180A (zh) * | 2017-06-08 | 2017-09-22 | 青岛海信网络科技股份有限公司 | 一种基于电警数据的交通出行轨迹提取方法和装置 |
CN107590999A (zh) * | 2017-08-18 | 2018-01-16 | 广东方纬科技有限公司 | 一种基于卡口数据的交通状态判别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107885795A (zh) | 2018-04-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107885795B (zh) | 一种卡口数据的数据校验方法、系统和装置 | |
US11593344B2 (en) | Updating high definition maps based on age of maps | |
US20240044662A1 (en) | Updating high definition maps based on lane closure and lane opening | |
CN109923595B (zh) | 一种基于浮动车数据的城市道路交通异常检测方法 | |
Hua et al. | Vehicle tracking and speed estimation from traffic videos | |
CN111275975B (zh) | 一种交叉口转向流量数据的获取方法、装置和存储介质 | |
Hinz | Detection and counting of cars in aerial images | |
CN111275969B (zh) | 一种基于道路环境智能识别的车辆轨迹填充方法 | |
CN113487759A (zh) | 一种停车巡检方法、装置、移动巡逻设备及巡检系统 | |
Wang et al. | Realtime wide-area vehicle trajectory tracking using millimeter-wave radar sensors and the open TJRD TS dataset | |
CN109493606A (zh) | 一种高速公路上违停车辆的识别方法及系统 | |
Platinsky et al. | Collaborative augmented reality on smartphones via life-long city-scale maps | |
CN105744223A (zh) | 视频数据处理方法和装置 | |
CN113850237B (zh) | 基于视频和轨迹数据的网联车目标检测评价方法及系统 | |
CN114771548A (zh) | 用于高级驾驶辅助系统测试和验证的数据记录 | |
US20210398425A1 (en) | Vehicular information systems and methods | |
Jamshidi et al. | Fusion of digital map traffic signs and camera-detected signs | |
Bäumler et al. | ‘Generating representative test scenarios: The fuse for representativity (Fuse4Rep) process model for collecting and analysing traffic observation data | |
Morris et al. | A Real-Time Truck Availability System for the State of Wisconsin | |
Majumder | An Approach to Counting Vehicles from Pre-Recorded Video Using Computer Algorithms | |
Higuchi et al. | Monitoring live parking availability by vision-based vehicular crowdsensing | |
Dahiya et al. | Exploring the performance of streaming-data-driven traffic state estimation method using complete trajectory data | |
Jomrich et al. | Lane Accurate Detection of Map Changes based on Low Cost Smartphone Data. | |
CN113380049A (zh) | 车辆的违规检测方法、装置、服务器和存储介质 | |
Fourati et al. | Trajectory based monitoring of saturation flow rate with video calibration: a case study |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |