CN114202929B - 一种基于中小客车通行行为的非法营运车辆识别方法 - Google Patents

一种基于中小客车通行行为的非法营运车辆识别方法 Download PDF

Info

Publication number
CN114202929B
CN114202929B CN202111525497.5A CN202111525497A CN114202929B CN 114202929 B CN114202929 B CN 114202929B CN 202111525497 A CN202111525497 A CN 202111525497A CN 114202929 B CN114202929 B CN 114202929B
Authority
CN
China
Prior art keywords
vehicle
days
vehicles
passenger car
travel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111525497.5A
Other languages
English (en)
Other versions
CN114202929A (zh
Inventor
陈欢
罗建平
刘本章
尹杰丽
喻莲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Jiaoxin Investment Technology Co ltd
Original Assignee
Guangzhou Jiaoxin Investment Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Jiaoxin Investment Technology Co ltd filed Critical Guangzhou Jiaoxin Investment Technology Co ltd
Priority to CN202111525497.5A priority Critical patent/CN114202929B/zh
Publication of CN114202929A publication Critical patent/CN114202929A/zh
Application granted granted Critical
Publication of CN114202929B publication Critical patent/CN114202929B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/017Detecting movement of traffic to be counted or controlled identifying vehicles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0137Measuring and analyzing of parameters relative to traffic conditions for specific applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • Traffic Control Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于中小客车通行行为的非法营运车辆识别方法,包括以下步骤:S1:获取某区域某时间段内的中小客车出行的OD数据,对OD数据进行清洗与预处理;S2:基于S1处理后的中小客车出行OD数据,设置可反映中小客车通行行为特征的指标,包括出行强度、时间维度、空间维度,获取每辆车的相应指标。本发明提出的一种基于中小客车通行行为的非法营运车辆识别方法,通过提取中小客车通行行为特征,将车辆划分为不同的类别,将具有相似通行特征的车辆划分到同一类别,并对出行中小客车进行群体类别辨识,将识别出具有营运行为特征的车辆群体,再进一步划分为合法营运车辆和非法营运车辆。

Description

一种基于中小客车通行行为的非法营运车辆识别方法
技术领域
本发明涉及车辆识别技术领域,特别涉及一种基于中小客车通行行为的非法营运车辆识别方法。
背景技术
近年来随着经济社会的快速发展,城市化过程快速推进,城市交通管理水平也有很大提高,但是城市交通管理中仍然面临诸多难题。汽车保有量迅速增加与居民出行需求迅猛增长,交通需求增长速度远大于道路建设速度,道路交通拥堵问题日益突出;道路中仍存在的大量非法营运车辆,该类车辆未经受过相关交通运输安全的检查,并且游离于城市交通运输管理之外,不仅会扰乱正常交通运输秩序,损害乘客合法权益,甚至给乘客带来人身伤害,为城市交通管理和运输安全带来了大量的隐患。
传统的非法营运车辆发现主要是通过执法人员人工进行。为了提升非法营运车辆识别效率,提升道路出行效率和提升交通服务水平,采用主动挖掘出非法营运车辆,有基于卡口拍照数据,利用图片识别方法发现非法从事网约车客运的嫌疑车辆;有基于高速收费流水数据,从非营运车辆的运动轨迹提取循环通行数据,并计算循环通行数据中的在途时间所占比例与循环通行数据的次数,通过设置阈值判断车辆是否为非法营运车辆。
传统的非法营运车辆发现主要是通过执法人员人工进行。其缺点是成本高、执行效率低、耗时长、检查的区域有限,可能带来不良的社会影响。而采用主动挖掘出非法营运车辆,基于卡口拍照数据利用图片识别方法发现非法从事网约车客运的嫌疑车辆的方法容易受天气、光线等影响卡口拍照图片质量,影响图片识别准确率,进而非法营运车辆识别准确率,此外,图片识别方法需整理车辆大规模图片数据,处理速度较慢;基于高速收费流水数据,从非营运车辆的运动轨迹提取循环通行数据,并计算循环通行数据中的在途时间所占比例与循环通行数据的次数,通过设置阈值判断车辆是否为非法营运车辆的方法,只能分析高速上的非法营运车辆,不能分析普通路上的非法营运车辆。此外,现有方法只能识别单一的车辆群体,例如营运车辆与非法营运车辆,而忽视了其它类型的车辆,大大降低识别的范围与精确度。
发明内容
本发明的目的在于提供一种基于中小客车通行行为的非法营运车辆识别方法,基于中小客车通行行为的非法营运车辆识别方法,通过中小客车卡口过车数据、高速过车数据、出租车、网约车数据以及道路监控数据提取中小客车通行行为特征,将车辆划分为不同的类别,将具有相似通行特征的车辆划分到同一类别,并对出行中小客车进行群体类别辨识,将识别出具有营运行为特征的车辆群体,再进一步划分为合法营运车辆和非法营运车辆。此外,其它的分类结果能为交通管理人员进行精细化的、更有针对性的道路交通管控提供依据,进而提升交通管控效率及服务水平,以满足车辆正常出行需求,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于中小客车通行行为的非法营运车辆识别方法,包括以下步骤:
S1:获取某区域某时间段内的中小客车出行的OD数据,对OD数据进行清洗与预处理;
S2:基于S1处理后的中小客车出行OD数据,设置可反映中小客车通行行为特征的指标,包括出行强度、时间维度、空间维度,获取每辆车的相应指标;
S3:对S2获取的每辆车的相应指标进行最大最小归一化处理,通过对原始车辆指标数据进行变换把数据映射到[0,1]之间;
S4:利用K-means++聚类算法对S3处理后的中小客车通行行为特征指标数据进行聚类,获取每辆车的通行行为特征标签;
S5:分析S4获取的中小客车通行行为特征标签类别的指标分布情况,定义各类出行车辆群体;
S6:利用S4获取的标签样本数据,结合S5定义的各类通行特征的中小客车群体,构建树模型,分析中小客车通行行为特征的指标重要性,提取各类出行车辆的群体的识别规则;
S7:利用S6获取的营运车辆群体的识别规则与通行行为特征重要性,并基于营运形态出行车辆群体特征分布对非法营运车辆识别规则的阈值进行修正,对道路出行非法营运的中小客车进行识别。
优选的,所述S1中还需要获取某区域某时间段内车辆的车主登记信息、长时间停靠位置,并建立关联车辆表;
车主登记信息:车辆归属人员的信息,对于同一车主的多辆车进行标识,以同一车主为共同点,建立关联;
停靠位置:一天中超过6小时的停靠位置信息,对于同一停靠位置信息的多辆车进行标识,并以同一停靠位置为共同点,建立关联。
优选的,所述停靠位置的同一停靠位置信息包括住宅停车场、住宅周边停车场所,停靠频率是以月为单位,每月超过n次。
优选的,所述S1中对OD数据进行清洗与预处理包括以下步骤:
S11:过滤车牌识别错误的中小客车出行OD数据;
S12:过滤出行天数低于2天(不含)的车辆,定义为零星出行;
S13:过滤出行天数大于1天,且工作日出行天数低于2天(不含)的车辆,定义为休闲游玩。
优选的,所述S2中出行强度包括以下指标:
周末出行天数:在周末车辆全天有出行的天数总和;
工作日出行天数:在工作日车辆全天有出行的天数总和;
工作日日均出行次数:工作日有出行的总次数与工作有日出行的总天数的比值;
周末日均出行次数:周末有出行的总次数与周末有出行的总天数的比值;
时间维度包括以下指标:
工作日日均平峰出行次数:工作日非早晚高峰有出行的总次数与工作日有出行的总天数的比值;
工作日日均早高峰出行次数:工作日7:00-9:00有出行的总次数与工作日有出行的总天数的比值;
工作日日均晚高峰出行次数:工作日17:00-19:00有出行的总次数与工作日有出行的总天数的比值;
空间维度包括以下指标:
每天首次起始点的最大概率:在车辆每天的首次出行中,以最常选择的起始点进行出行的天数与车辆所有出行天数中的比值;
最常出行OD的占比:同一OD出行次数的最大值与总OD出行次数的比值。
优选的,所述S4包括以下步骤:
S41:利用手肘法确定最佳聚类簇数K;
S42:利用聚类算法对归一化后的中小客车通行特征指标划分为K个簇;
S43:获取每辆车对应的聚类簇标签。
优选的,所述S6包括以下步骤:
S61:给S4获取的样本数据打上定义的通行特征车辆类别标签;
S62:按照一定的比例将样本标签数据随机划分为训练集和测试集,训练树模型,并调整参数,使测试集准确率高于A%,A通常取值80-100;
S63:利用S62的树模型,提取指标特征的重要性与不同类别的中小客车通行行为特征识别规则。
优选的,所述S7包括以下步骤:
S71:将中小客车通行行为特征按照重要性值从大到小排序,筛选排名较高的前3-5个通行行为指标;
S72:分析营运形态出行车辆群体特征分布,计算出各通行行为特征的四分位数;
S73:对营运车辆识别规则中重要性排名较高的3-5个通行行为指标阈值基于四分位数修正;
S74:基于修正后的营运车辆识别规则识别非法营运的车辆。
优选的,所述S74中识别非法营运的车辆的方法具体包括以下步骤:
S741:先在识别出的营运车辆群体中,按照周末出行天数、工作日出行天数从大到小排序,再按照每天首次起始点的最大概率从小到大排序,选取Top N中没有注册营运资格证的车辆,判断为疑似非法营运车辆;
S742:在识别出的营运车辆群体中,按照每天首次起始点的最大概率从小到大排序,取Top N’数据中以同一共同点存在的关联车辆,调取最常出行OD占比均符合营运车辆群体通行特征的关联车辆;
分别对同一车主的关联车辆的周末出行天数求和、同一共同点关联车辆的工作日出行天数求和,同一车主的关联车辆的周末出行天数之和、工作日出行天数之和均符合营运车辆群体通行特征的,且同一车主的所有关联车辆中均无注册营运资格证,则Top N’数据中该同一车主的关联车辆全部判断为疑似非法营运车辆;
对同一停靠位置的关联车辆,调取车辆归属人员的信息,比对社会关系,车主为共同生活的家庭成员关系的,分别对同一停靠位置的关联车辆的周末出行天数求和、同一停靠位置的关联车辆的工作日出行天数求和,同一停靠位置的关联车辆的周末出行天数之和、工作日出行天数之和均符合营运车辆群体通行特征的,且同一停靠位置的所有关联车辆中均无注册营运资格证,则Top N’数据中该同一停靠位置的关联车辆全部判断为疑似非法营运车辆。
与现有技术相比,本发明的有益效果是:本发明提出的一种基于中小客车通行行为的非法营运车辆识别方法,通过中小客车卡口过车数据、高速过车数据、出租车、网约车数据以及道路监控数据提取中小客车通行行为特征,将车辆划分为不同的类别,将具有相似通行特征的车辆划分到同一类别,并对出行中小客车进行群体类别辨识,将识别出具有营运行为特征的车辆群体,再进一步划分为合法营运车辆和非法营运车辆。此外,其它的分类结果能为交通管理人员进行精细化的、更有针对性的道路交通管控提供依据,进而提升交通管控效率及服务水平,以满足车辆正常出行需求。
附图说明
图1为本发明的整体框架图;
图2为本发明的S1流程图;
图3为本发明的S4流程图;
图4为本发明的聚类簇数K=5不同簇数量对应簇内误方差图;
图5为本发明的S6流程图;
图6为本发明的S7流程图;
图7为本发明的实施例二识别非法营运车辆的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一:
请参阅图1-图6,一种基于中小客车通行行为的非法营运车辆识别方法,包括以下步骤:
S1:获取某区域某时间段内的中小客车出行的OD数据,获取X市5月份的所有中小客车的OD数据,原始中小客车OD数据来源于中小客车卡口过车数据、高速过车数据、出租车与网约车数据,具体示例如:
序号 车牌号 O点时间 O点名称 D点时间 D点名称
1 粤A12345 2021-09-01 06:00 00 黄埔大道1号 2021-09-01 06:48 00 开创大道1号
2 粤A12345 2021-09-04 08:00 00 黄埔大道1号 2021-09-04 08:30 00 儿童公园
3 粤A12345 2021-09-06 08:15 00 黄埔大道1号 2021-09-06 09:15 00 开创大道1号
4 粤A12345 2021-09-06 18:15 00 开创大道1号 2021-09-06 19:35 00 黄埔大道1号
5 粤A23456 2021-09-04 10:00 00 黄埔大道3号 2021-09-04 10:30 00 儿童公园
6 粤A233222 2021-09-04 10:00 00 黄埔大道3号 2021-09-04 10:30 00 儿童公园
7 粤A54321 2021-09-04 10:00 00 黄埔大道3号 2021-09-04 10:30 00 儿童公园
8 粤A54321 2021-09-05 18:15 00 开创大道3号 2021-09-05 19:35 00 黄埔大道3号
对OD数据进行清洗与预处理包括以下步骤:
S11:过滤车牌识别错误的中小客车出行OD数据,过滤车牌识别错误的中小客车出行OD记录,如下表;
序号 车牌号 O点时间 O点名称 D点时间 D点名称
6 粤A233222 2021-09-04 10:00 00 黄埔大道3号 2021-09-04 10:30 00 儿童公园
S12:过滤出行天数低于2天(不含)的车辆,定义为零星出行,如下表;
序号 车牌号 O点时间 O点名称 D点时间 D点名称
5 粤A23456 2021-09-04 10:00 00 黄埔大道3号 2021-09-04 10:30 00 儿童公园
S13:过滤出行天数大于1天,且工作日出行天数低于2天(不含)的车辆,定义为休闲游玩:
序号 车牌号 O点时间 O点名称 D点时间 D点名称
7 粤A54321 2021-09-04 10:00 00 黄埔大道3号 2021-09-04 10:30 00 儿童公园
8 粤A54321 2021-09-05 18:15 00 开创大道3号 2021-09-05 19:35 00 黄埔大道3号
经过步骤1处理后得到的中小客车出行OD数据如下:
序号 车牌号 O点时间 O点名称 D点时间 D点名称
1 粤A12345 2021-09-01 06:00 00 黄埔大道1号 2021-09-01 06:48 00 开创大道1号
2 粤A12345 2021-09-04 08:00 00 黄埔大道1号 2021-09-04 08:30 00 儿童公园
3 粤A12345 2021-09-06 08:15 00 黄埔大道1号 2021-09-06 09:15 00 开创大道1号
4 粤A12345 2021-09-06 18:15 00 开创大道1号 2021-09-06 19:35 00 黄埔大道1号
S2:基于S1处理后的中小客车出行OD数据,设置可反映中小客车通行行为特征的指标,包括出行强度、时间维度、空间维度,获取每辆车的相应指标,其中出行强度包括以下指标:
周末出行天数:在周末车辆全天有出行的天数总和,本实施例中,粤A12345周末出行天数为1天(2021年9月4日为周六);
工作日出行天数:在工作日车辆全天有出行的天数总和,本实施例中,粤A12345工作日出行天数为2天(2021年9月1日为周三、2021年9月6日为周一);
工作日日均出行次数:工作日有出行的总次数与工作有日出行的总天数的比值,本实施例中,粤A12345工作日出行总次数为3次,工作日出行总天数为2天,工作日日均出行次数为1.5;
周末日均出行次数:周末有出行的总次数与周末有出行的总天数的比值,本实施例中,粤A12345周末出行总次数为1次,周末出行总天数为1天,工作日日均出行次数为1;
时间维度包括以下指标:
工作日日均平峰出行次数:工作日非早晚高峰有出行的总次数与工作日有出行的总天数的比值,本实施例中,粤A12345工作日非早晚高峰出行总次数为1次,工作日出行总天数为2天,工作日日均平峰出行次数为0.5;
工作日日均早高峰出行次数:工作日7:00-9:00有出行的总次数与工作日有出行的总天数的比值,本实施例中,粤A12345工作日早高峰出行总次数为1次,工作日出行总天数为2天,工作日日均早高峰出行次数为0.5;
工作日日均晚高峰出行次数:工作日17:00-19:00有出行的总次数与工作日有出行的总天数的比值,本实施例中,粤A12345工作日晚高峰出行总次数为1次,工作日出行总天数为2天,工作日日均晚高峰出行次数为0.5;
空间维度包括以下指标:
每天首次起始点的最大概率:在车辆每天的首次出行中,以最常选择的起始点进行出行的天数与车辆所有出行天数中的比值,本实施例中,粤A12345每天首次出行中最常选择的起始地点为黄埔大道1号,出行天数为3天,车辆总出行天数为3,每天首次起始点的最大概率为1;
最常出行OD的占比:同一OD出行次数的最大值与总OD出行次数的比值,本实施例中,粤A12345最常出行OD为黄埔大道1号至开创大道1号,出行次数为2,总OD出行次数为4,最常出行OD占比为0.5。
Figure BDA0003410188090000091
S3:对S2获取的每辆车的相应指标进行最大最小归一化处理,通过对原始车辆指标数据进行变换把数据映射到[0,1]之间,利用最大最小归一化计算公式
Figure BDA0003410188090000092
对指标进行归一化处理;
本实施例中,周末出行天数的最大值为7天,最小值为0天,因此,粤A12345对应的周末出行天数归一化值为
Figure BDA0003410188090000093
其它指标按照同样的方式计算。
Figure BDA0003410188090000094
S4:利用K-means++聚类算法对S3处理后的中小客车通行行为特征指标数据进行聚类,获取每辆车的通行行为特征标签,具体步骤如下:
S41:利用手肘法确定最佳聚类簇数K=5;
S42:利用K-means++聚类算法对归一化后的中小客车通行特征指标划分为K=5个簇;
S43:获取每辆车对应的聚类簇标签。
S5:分析S4获取的中小客车通行行为特征标签类别的指标分布情况,定义各类出行车辆群体,分别为通勤形态、营运形态、商务出行、休闲游玩、其它形态;
Figure BDA0003410188090000101
分析上表的结果,定义各类出行车辆群体:
第1类:商务出行,周末出行天数极低、工作日日均出行次数高、周末日均出行次数低、每天首次起始点的最大概率高、最常出行OD占比高;
第2类:休闲游玩,周末出行天数较高、周末日均出行次数较高、工作日日均早高峰出行次数较低;
第3类:通勤形态,工作日出行天数、工作日日均早高峰出行次数、每天首次起始点的最大概率、最常出行OD占比均高;
第4类:其他出行
第5类:营运形态,周末与工作日出行天数高、工作日与周末日均出行次数高、每天首次起始点的最大概率低、最常出行OD占比低。
S6:利用S4获取的标签样本数据,结合S5定义的各类通行特征的中小客车群体,构建树模型,分析中小客车通行行为特征的指标重要性,提取各类出行车辆的群体的识别规则,具体步骤如下:
S61:给S4获取的样本数据打上定义的通行特征车辆类别标签;
Figure BDA0003410188090000111
S62:按照3:2的比例将样本标签数据随机划分为训练集和测试集,训练树模型,并调整参数,使测试集准确率高于A%,A取值为85%;
S63:利用S62的树模型,提取指标特征的重要性与不同类别的中小客车通行行为特征识别规则,指标特征的重要性如下:
序号 指标特征名称 特征重要性
1 周末出行天数 0.336
2 工作日出行天数 0.286
3 每天首次起始点的最大概率 0.226
4 周末日均出行次数 0.057
5 最常出行OD占比 0.053
6 工作日日均出行次数 0.025
7 工作日日均早高峰出行次数 0.008
8 工作日日均晚高峰出行次数 0.005
9 工作日日均平峰出行次数 0.004
S7:利用S6获取的营运车辆群体的识别规则与通行行为特征重要性,并基于营运形态出行车辆群体特征分布对非法营运车辆识别规则的阈值进行修正,对道路出行非法营运的中小客车进行识别,具体步骤如下:
S71:将中小客车通行行为特征按照重要性值从大到小排序,筛选排名较高的前4个通行行为指标,分别为周末出行天数、工作日出行天数、每天首次起始点的最大概率、周末日均出行次数;
S72:分析营运形态出行车辆群体特征分布,计算出各通行行为特征的四分位数,如下表所示:
周末出行天数 工作日出行天数 每天首次起始点的最大概率 周末日均出行次数
最小值 3 6 0.0062 1
第一个四分位 5 14 0.1731 2
中位数 6 16 0.2667 2.5
第三个四分位 7 18 0.39 3.17
最大值 7 19 0.8714 79.86
S73:对营运车辆识别规则中重要性排名较高的3-5个通行行为指标阈值基于四分位数修正,本实施例中,提取出的营运车辆群体的规则为:每天首次起始点的最大概率为小于0.872,最常出行OD的占比为小于0.288,工作日出行天数大于6天,周末出行天数大于3天,结合各通行行为特征四分位数分布,修正后的营运车辆识别规则为每天首次起始点的最大概率为小于0.39,最常出行OD的占比为小于0.288,工作日出行天数大于16天,周末出行天数大于6天,在划分为营运车辆的群体中,有98.59%的出租车被识别为营运车辆,说明该识别方法较为准确;
S74:基于修正后的营运车辆识别规则识别非法营运的车辆,先在识别出的营运车辆群体中,按照周末出行天数、工作日出行天数从大到小排序,再按照每天首次起始点的最大概率从小到大排序,选取Top N中没有注册营运资格证的车辆,判断为疑似非法营运车辆。
实施例二:
请参阅图7,本实施例中,基于中小客车通行行为的非法营运车辆识别方法,包括以下步骤:
S1:获取某区域某时间段内的中小客车出行的OD数据,对OD数据进行清洗与预处理,在获取OD数据的同时,还需要获取某区域某时间段内车辆的车主登记信息、长时间停靠位置,并建立关联车辆表;
车主登记信息:车辆归属人员的信息,对于同一车主的多辆车进行标识,以同一车主为共同点,建立关联;
停靠位置:一天中超过6小时的停靠位置信息,对于同一停靠位置信息的多辆车进行标识,并以同一停靠位置为共同点,建立关联;停靠位置的同一停靠位置信息包括住宅停车场、住宅周边停车场所,停靠频率是以月为单位,每月超过n次;
S2:基于S1处理后的中小客车出行OD数据,设置可反映中小客车通行行为特征的指标,包括出行强度、时间维度、空间维度,获取每辆车的相应指标;
S3:对S2获取的每辆车的相应指标进行最大最小归一化处理,通过对原始车辆指标数据进行变换把数据映射到[0,1]之间;
S4:利用K-means++聚类算法对S3处理后的中小客车通行行为特征指标数据进行聚类,获取每辆车的通行行为特征标签;
S5:分析S4获取的中小客车通行行为特征标签类别的指标分布情况,定义各类出行车辆群体;
S6:利用S4获取的标签样本数据,结合S5定义的各类通行特征的中小客车群体,构建树模型,分析中小客车通行行为特征的指标重要性,提取各类出行车辆的群体的识别规则;
S7:利用S6获取的营运车辆群体的识别规则与通行行为特征重要性,并基于营运形态出行车辆群体特征分布对非法营运车辆识别规则的阈值进行修正,对道路出行非法营运的中小客车进行识别,具体识别方法如下:
步骤一:在识别出的营运车辆群体中,按照每天首次起始点的最大概率从小到大排序,取Top N’数据中以同一共同点存在的关联车辆,调取最常出行OD占比均符合营运车辆群体通行特征的关联车辆;
步骤二:分别对同一车主的关联车辆的周末出行天数求和、同一共同点关联车辆的工作日出行天数求和,同一车主的关联车辆的周末出行天数之和、工作日出行天数之和均符合营运车辆群体通行特征的,且同一车主的所有关联车辆中均无注册营运资格证,则Top N’数据中该同一车主的关联车辆全部判断为疑似非法营运车辆,同一车主在拥有两辆或者两辆以上的车辆时,如果采用轮换驾驶,非法营运,一般难以觉察,通过建立同一车主的车辆关联,可以将同一车主的多辆车数据汇总,在排除有注册营运资格证的情况下,同一人驾驶多辆车出现每天首次起始点、最常出行OD占比均符合营运车辆群体通行特征的车辆,一般归类为休闲游玩形态,再通过比对周末出行天数之和和工作日出行天数之和,可以确定该车主是否为非法营运人员,从而确定非法营运车辆;
步骤三:对同一停靠位置的关联车辆,调取车辆归属人员的信息,比对社会关系,车主为共同生活的家庭成员关系的,分别对同一停靠位置的关联车辆的周末出行天数求和、同一停靠位置的关联车辆的工作日出行天数求和,同一停靠位置的关联车辆的周末出行天数之和、工作日出行天数之和均符合营运车辆群体通行特征的,且同一停靠位置的所有关联车辆中均无注册营运资格证,则Top N’数据中该同一停靠位置的关联车辆全部判断为疑似非法营运车辆,停靠位置数据来源于道路监控数据,对于同一家庭中,往往有不止一辆车,家庭中的某一成员开不同车实现非法营运也是有可能的,通过相对固定的车辆停靠信息,确定车主的住所,再通过相同停靠点的车辆的车主关系,判断该车辆是否存在非法营运。
本实施例中的其他步骤与实施例一相同,通过增加车主登记信息、停靠位置调查,为后续的一人驾驶多辆车实现非法营运的筛查提供基础,能够扩大非法营运的筛查范围。
综上所述:本基于中小客车通行行为的非法营运车辆识别方法,通过中小客车卡口过车数据、高速过车数据、出租车、网约车数据以及道路监控数据提取中小客车通行行为特征,将车辆划分为不同的类别,将具有相似通行特征的车辆划分到同一类别,并对出行中小客车进行群体类别辨识,将识别出具有营运行为特征的车辆群体,再进一步划分为合法营运车辆和非法营运车辆。此外,其它的分类结果能为交通管理人员进行精细化的、更有针对性的道路交通管控提供依据,进而提升交通管控效率及服务水平,以满足车辆正常出行需求。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (7)

1.一种基于中小客车通行行为的非法营运车辆识别方法,其特征在于,包括以下步骤:
S1:获取某区域某时间段内的中小客车出行的OD数据,对OD数据进行清洗与预处理;
S2:基于S1处理后的中小客车出行OD数据,设置可反映中小客车通行行为特征的指标,包括出行强度、时间维度、空间维度,获取每辆车的相应指标;
S3:对S2获取的每辆车的相应指标进行最大最小归一化处理,通过对原始车辆指标数据进行变换把数据映射到[0,1]之间;
S4:利用K-means++聚类算法对S3处理后的中小客车通行行为特征指标数据进行聚类,获取每辆车的通行行为特征标签;
S5:分析S4获取的中小客车通行行为特征标签类别的指标分布情况,定义各类出行车辆群体;
S6:利用S4获取的标签样本数据,结合S5定义的各类通行特征的中小客车群体,构建树模型,分析中小客车通行行为特征的指标重要性,提取各类出行车辆的群体的识别规则;
S7:利用S6获取的营运车辆群体的识别规则与通行行为特征重要性,并基于营运形态出行车辆群体特征分布对非法营运车辆识别规则的阈值进行修正,对道路出行非法营运的中小客车进行识别;
具体如下:
S71:将中小客车通行行为特征按照重要性值从大到小排序,筛选排名较高的前3-5个通行行为指标;
S72:分析营运形态出行车辆群体特征分布,计算出各通行行为特征的四分位数;
S73:对营运车辆识别规则中重要性排名较高的3-5个通行行为指标阈值基于四分位数修正;
S74:基于修正后的营运车辆识别规则识别非法营运的车辆:
S741:先在识别出的营运车辆群体中,按照周末出行天数、工作日出行天数从大到小排序,再按照每天首次起始点的最大概率从小到大排序,选取Top N中没有注册营运资格证的车辆,判断为疑似非法营运车辆;
S742:在识别出的营运车辆群体中,按照每天首次起始点的最大概率从小到大排序,取Top N’数据中以同一共同点存在的关联车辆,调取最常出行OD占比均符合营运车辆群体通行特征的关联车辆;
分别对同一车主的关联车辆的周末出行天数求和、同一共同点关联车辆的工作日出行天数求和,同一车主的关联车辆的周末出行天数之和、工作日出行天数之和均符合营运车辆群体通行特征的,且同一车主的所有关联车辆中均无注册营运资格证,则Top N’数据中该同一车主的关联车辆全部判断为疑似非法营运车辆;
对同一停靠位置的关联车辆,调取车辆归属人员的信息,比对社会关系,车主为共同生活的家庭成员关系的,分别对同一停靠位置的关联车辆的周末出行天数求和、同一停靠位置的关联车辆的工作日出行天数求和,同一停靠位置的关联车辆的周末出行天数之和、工作日出行天数之和均符合营运车辆群体通行特征的,且同一停靠位置的所有关联车辆中均无注册营运资格证,则Top N’数据中该同一停靠位置的关联车辆全部判断为疑似非法营运车辆。
2.如权利要求1所述的一种基于中小客车通行行为的非法营运车辆识别方法,其特征在于:所述S1中还需要获取某区域某时间段内车辆的车主登记信息、长时间停靠位置,并建立关联车辆表;
车主登记信息:车辆归属人员的信息,对于同一车主的多辆车进行标识,以同一车主为共同点,建立关联;
停靠位置:一天中超过6小时的停靠位置信息,对于同一停靠位置信息的多辆车进行标识,并以同一停靠位置为共同点,建立关联。
3.如权利要求2所述的一种基于中小客车通行行为的非法营运车辆识别方法,其特征在于:所述停靠位置的同一停靠位置信息包括住宅停车场、住宅周边停车场所,停靠频率是以月为单位,每月超过n次,n为停靠次数≥1。
4.如权利要求1所述的一种基于中小客车通行行为的非法营运车辆识别方法,其特征在于:所述S1中对OD数据进行清洗与预处理包括以下步骤:
S11:过滤车牌识别错误的中小客车出行OD数据;
S12:过滤出行天数低于2天的车辆,定义为零星出行;
S13:过滤出行天数大于1天,且工作日出行天数低于2天的车辆,定义为休闲游玩。
5.如权利要求1所述的一种基于中小客车通行行为的非法营运车辆识别方法,其特征在于:所述S2中出行强度包括以下指标:
周末出行天数:在周末车辆全天有出行的天数总和;
工作日出行天数:在工作日车辆全天有出行的天数总和;
工作日日均出行次数:工作日有出行的总次数与工作有日出行的总天数的比值;
周末日均出行次数:周末有出行的总次数与周末有出行的总天数的比值;
时间维度包括以下指标:
工作日日均平峰出行次数:工作日非早晚高峰有出行的总次数与工作日有出行的总天数的比值;
工作日日均早高峰出行次数:工作日7:00-9:00有出行的总次数与工作日有出行的总天数的比值;
工作日日均晚高峰出行次数:工作日17:00-19:00有出行的总次数与工作日有出行的总天数的比值;
空间维度包括以下指标:
每天首次起始点的最大概率:在车辆每天的首次出行中,以最常选择的起始点进行出行的天数与车辆所有出行天数中的比值;
最常出行OD的占比:同一OD出行次数的最大值与总OD出行次数的比值。
6.如权利要求1所述的一种基于中小客车通行行为的非法营运车辆识别方法,其特征在于:所述S4包括以下步骤:
S41:利用手肘法确定最佳聚类簇数K;
S42:利用聚类算法对归一化后的中小客车通行特征指标划分为K个簇;
S43:获取每辆车对应的聚类簇标签。
7.如权利要求1所述的一种基于中小客车通行行为的非法营运车辆识别方法,其特征在于:所述S6包括以下步骤:
S61:给S4获取的样本数据打上定义的通行特征车辆类别标签;
S62:按照一定的比例将样本标签数据随机划分为训练集和测试集,训练树模型,并调整参数,使测试集准确率高于A%,A通常取值80-100;
S63:利用S62的树模型,提取指标特征的重要性与不同类别的中小客车通行行为特征识别规则。
CN202111525497.5A 2021-12-14 2021-12-14 一种基于中小客车通行行为的非法营运车辆识别方法 Active CN114202929B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111525497.5A CN114202929B (zh) 2021-12-14 2021-12-14 一种基于中小客车通行行为的非法营运车辆识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111525497.5A CN114202929B (zh) 2021-12-14 2021-12-14 一种基于中小客车通行行为的非法营运车辆识别方法

Publications (2)

Publication Number Publication Date
CN114202929A CN114202929A (zh) 2022-03-18
CN114202929B true CN114202929B (zh) 2022-12-06

Family

ID=80653528

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111525497.5A Active CN114202929B (zh) 2021-12-14 2021-12-14 一种基于中小客车通行行为的非法营运车辆识别方法

Country Status (1)

Country Link
CN (1) CN114202929B (zh)

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105809193B (zh) * 2016-03-07 2019-03-26 山东大学 一种基于kmeans算法的非法运营车辆的识别方法
CN105976617B (zh) * 2016-03-21 2019-01-22 江苏智通交通科技有限公司 非法营运车辆检测方法和系统
DE102018210852A1 (de) * 2018-07-02 2020-01-02 Robert Bosch Gmbh Verfahren zum Ermitteln von rechtswidrigem Fahrverhalten durch ein Fahrzeug
CN109493608B (zh) * 2018-12-06 2020-10-16 湖南科创信息技术股份有限公司 非法营运车辆的识别方法及系统和计算机可读的存储介质
CN110598999B (zh) * 2019-08-21 2022-05-10 广东方纬科技有限公司 基于个体数据的交通出行分析方法、系统及存储介质
CN110570655B (zh) * 2019-09-19 2021-03-05 安徽百诚慧通科技有限公司 基于层次聚类和决策树的车辆特征评估方法
CN110969190B (zh) * 2019-11-07 2023-05-12 厦门大学 非法营运车辆检测方法、介质、设备及装置
CN111862606B (zh) * 2020-07-22 2022-10-21 南京瑞栖智能交通技术产业研究院有限公司 一种基于多源数据的非法营运车辆识别方法
CN112364072A (zh) * 2020-10-27 2021-02-12 南威软件股份有限公司 一种涉车非营运车营运发现方法、装置、设备和介质

Also Published As

Publication number Publication date
CN114202929A (zh) 2022-03-18

Similar Documents

Publication Publication Date Title
CN109993215B (zh) 一种基于交通大数据的路径诱导方法
CN109408557B (zh) 一种基于多重对应和K-means聚类的交通事故成因分析方法
CN110807919A (zh) 基于过车数据的城市路网交通运行态势评价方法
CN110942640B (zh) 一种主动发现非法从事网约车客运的嫌疑车辆的方法
CN109035768B (zh) 一种出租车绕路行为的识别方法
Xiong et al. Understanding operation patterns of urban online ride-hailing services: A case study of Xiamen
CN115035491A (zh) 一种基于联邦学习的驾驶行为路况预警方法
Quintanar Man vs. machine: An investigation of speeding ticket disparities based on gender and race
CN114999181B (zh) 一种基于etc系统数据的高速公路车辆速度异常识别方法
CN115713858A (zh) 一种基于交通大数据的智慧交通运行管控系统
CN110400469B (zh) 基于人车关联分析的准驾不符违法行为预警方法
CN116645646A (zh) 一种用于停车异常检测预警方法及系统
Fageda Measuring the impact of ride‐hailing firms on urban congestion: The case of Uber in Europe
CN112767686B (zh) 一种基于多源数据融合的公路网汽车排放估算方法
CN114202929B (zh) 一种基于中小客车通行行为的非法营运车辆识别方法
CN116092037B (zh) 融合轨迹空间-语义特征的车辆类型识别方法
CN116596307A (zh) 一种基于公交运营安全数据构建驾驶员安全画像模型的方法
CN112309129B (zh) 一种基于卡口车牌识别的车辆出行特征分类的od矩阵形成方法
CN114201530A (zh) 一种疑似非正常营运客车提前甄别及预防式监管方法
CN114913690A (zh) 交通精细化监控方法、系统和可读存储介质
CN113945958A (zh) 一种基于出租车gps数据的路段中寻客状态车辆识别方法
CN114331181A (zh) 基于大数据的车辆驾驶行为风险分析方法
CN113807669A (zh) 一种城市道路交叉口客货分离系统改造的方案评选方法
Yuan et al. Study of driving cycle of city tour bus based on coupled GA-K-means and HMM algorithms: a case study in Beijing
CN112733891B (zh) 对出行链断链时公交ic卡乘客进行下车站点识别的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant