CN115631632A - 一种基于车辆的轨迹特征识别网约车的方法和系统 - Google Patents

一种基于车辆的轨迹特征识别网约车的方法和系统 Download PDF

Info

Publication number
CN115631632A
CN115631632A CN202211629302.6A CN202211629302A CN115631632A CN 115631632 A CN115631632 A CN 115631632A CN 202211629302 A CN202211629302 A CN 202211629302A CN 115631632 A CN115631632 A CN 115631632A
Authority
CN
China
Prior art keywords
license plate
final
initial
vehicle
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211629302.6A
Other languages
English (en)
Other versions
CN115631632B (zh
Inventor
徐涛
吴楠
蒋修强
胡大明
卢小军
王金涛
王方舟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Ma Niu Technology Co ltd
Original Assignee
Beijing Ma Niu Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Ma Niu Technology Co ltd filed Critical Beijing Ma Niu Technology Co ltd
Priority to CN202211629302.6A priority Critical patent/CN115631632B/zh
Publication of CN115631632A publication Critical patent/CN115631632A/zh
Application granted granted Critical
Publication of CN115631632B publication Critical patent/CN115631632B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Marketing (AREA)
  • Analytical Chemistry (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及一种基于车辆的轨迹特征识别网约车的方法和系统,其方法包括获取目标城市的车辆轨迹信息;根据所述车辆轨迹信息确定评价参数数据;随后对所述评价参数数据进行聚类,得到多个起始类别;然后计算每一个起始类别中出租车车牌号占对应起始类别中全部车牌号的起始平均值和起始标准差值;判断所述起始平均值和所述起始标准差值是否达到均衡点;若否,则重新聚类起始类别中的评价参数数据得到最终类别,并计算每一个最终类别中出租车车牌号占对应最终类别中全部车牌号的最终平均值和最终标准差值,所述最终标准差值和最终平均值均达到均衡点;基于预设伴随算法,根据最终类别确定网约车的车牌号。本申请具有快速识别网约车的效果。

Description

一种基于车辆的轨迹特征识别网约车的方法和系统
技术领域
本申请涉及车辆管理的领域,尤其是涉及一种基于车辆的轨迹特征识别网约车的方法和系统。
背景技术
目前各类网约车发展迅猛,已经覆盖很大比例的打车出行需求,而这些网约车因为运营自由、规范登记不完善、数据不共享等原因,在公安越来越多的数据分析场景中,需要先识别出那些私家车在从事运营越来越重要。
发明内容
为了快速识别网约车,本申请提供一种基于车辆的轨迹特征识别网约车的方法和系统。
本申请目的一是提供一种基于车辆的轨迹特征识别网约车的方法。
本申请的上述目的一是通过以下技术方案得以实现的:
一种基于车辆的轨迹特征识别网约车的方法,包括;
获取目标城市的车辆轨迹信息,所述车辆轨迹信息包括车牌号、车辆通过卡口时间和车辆通过卡口地点;
基于预设派生字段,根据所述车辆轨迹信息确定评价参数数据;
基于预设欧式距离计算方法,对所述评价参数数据进行聚类,得到多个起始类别;
基于预设出租车匹配规则,对所述起始类别中出租车车牌号进行标记,得到起始标记结果;
根据所述起始标记结果计算出租车车牌号在对应起始类别的占比,得到起始占比结果;
计算多个起始占比结果的起始平均值和起始标准差值;
判断所述起始平均值和起始标准差值是否达到均衡点;
若否,则基于预设欧式距离计算方法,对所述评价参数数据重新聚类,直至最终平均值和最终标准差值均达到均衡点;
调取最终占比结果中不小于最终平均值的最终类别,将最终类别中的非出租车车牌号进行筛选,得到筛选结果;
基于预设伴随算法,根据所述最终类别确定网约车的车牌号。
通过采用上述技术方案,通过获取目标城市内的车牌号、车辆通过卡口时间和车辆通过卡口地点,并根据车牌号、车辆通过卡口时间和车辆确定评价参数数据,基于预设欧式距离计算方法,对所有的评价参数数据进行聚类,能够得到多个起始类型,随后计算起始类型中出租车车牌号在该起始类型中的占比,可以能够得到多个起始占比结果,再计算多个起始占比结果的起始平均值和起始标准差值,起始平均值和起始标准差值越大越好,因此,对所有的车牌号和车牌号对应的评价参数数据进行重新聚类、标记和计算占比,直到最终平均值和最终标准差值均满足均衡点,随后,调取最终占比结果中不小于最终平均值的最终类别,将最终类别中的非出租车车牌号进行筛选,此时筛选的非出租车车牌号已经和出租车车牌号有较高的相似性车辆,最后,基于预设伴随算法,根据所述筛选结果确定网约车的车牌号,能够达到快速识别网约车的效果。
本申请在一较佳示例中可以进一步配置为:所述评价参数数据包括活动天数、活动月数、活动年数、平均每月活动天数、平均每年活动天数、平均每日活动地点数、平均每日活动记录数和平均每日活动小时数。
本申请在一较佳示例中可以进一步配置为:所述基于预设派生字段,根据所述车辆轨迹信息确定评价参数数据,包括;
根据预设派生字段和车辆通过卡口时间确定每个车牌号的活动天数、活动月数和活动年数;
根据所述活动天数确定每个车牌号的平均每月活动天数和平均每年活动天数;
根据所述车辆通过卡口地点确定每个车牌号的平均每日活动地点数和平均每日活动地点数;
根据所述车辆通过卡口时间确定每个车牌号的平均每日活动小时数。
本申请在一较佳示例中可以进一步配置为:所述根据预设派生字段和车辆通过卡口时间确定每个车牌号的活动天数,包括;
所述预设派生字段包括年-月-日、年-月和年;
根据所述年-月-日、年-月和年和车辆通过卡口时间确定每个车牌号的活动天数。
本申请在一较佳示例中可以进一步配置为:所述根据预设派生字段和车辆通过卡口时间确定每个车牌号的活动月数,包括;
根据所述年-月和年和车辆通过卡口时间确定每个车牌号的活动月数。
本申请在一较佳示例中可以进一步配置为:所述根据预设派生字段和车辆通过卡口时间确定每个车牌号的活动月数,包括;
根据所述年和车辆通过卡口时间确定每个车牌号的活动年数。
本申请在一较佳示例中可以进一步配置为:所述基于预设欧式距离计算方法,对所述评价参数数据进行聚类,得到多个起始类别,包括;
对所述评价参数数据进行归一化,得到归一化数据;
根据所述预设欧式距离计算方法对归一化数据进行聚类,得到多个类别。
本申请在一较佳示例中可以进一步配置为:所述基于预设欧式距离计算方法,对所述评价参数数据重新聚类,直至最终平均值和最终标准差值均达到均衡点,包括;
重新聚类起始类别中的车牌号,得到最终类别;
基于预设出租车匹配规则,对所述最终类别中出租车车牌号进行标记,得到最终标记结果;
根据所述最终标记结果计算出租车车牌号在对应最终类别的占比,得到最终占比结果;
计算多个最终占比结果的最终平均值和最终标准差值,所述最终平均值和最终标准差值均达到均衡点。
本申请在一较佳示例中可以进一步配置为:所述基于预设伴随算法,根据所述筛选结果确定网约车的车牌号,包括;
将所述车牌号和用户终端串号进行绑定,得到绑定结果;
根据所述绑定结果计算过往车辆中的每日平均载客数;
筛选所述车辆中的每日平均载客数大于预设阈值的车牌号,该车牌号为网约车车牌号。
本申请目的二是提供一种基于车辆的轨迹特征识别网约车的系统。
本申请的上述目的二是通过以下技术方案得以实现的:
一种基于车辆的轨迹特征识别网约车的系统,包括;
获取模块,用于获取目标城市的车辆轨迹信息;
第一确定模块,用于基于预设派生字段,根据所述车辆轨迹信息确定评价参数数据;
聚类模块,用于基于预设欧式距离计算方法,对所述评价参数数据进行聚类,得到多个起始类别;
标记模块,用于基于预设出租车匹配规则,对所述起始类别中出租车车牌号进行标记,得到起始标记结果;
计算模块,用于根据所述起始标记结果计算出租车车牌号在对应起始类别的占比,得到起始占比结果;用于计算多个起始占比结果的起始平均值和起始标准差值;
判断模块,用于判断所述起始平均值和起始标准差值是否达到均衡点;
迭代模块,用于基于预设欧式距离计算方法,对所述评价参数数据重新聚类,直至最终平均值和最终标准差值均达到均衡点;
筛选模块,用于调取最终占比结果中不小于最终平均值的最终类别,将最终类别中的非出租车车牌号进行筛选,得到筛选结果;
第二确定模块,用于基于预设伴随算法,根据所述最终类别确定网约车的车牌号。
综上所述,本申请包括以下有益技术效果:
通过采用上述技术方案,通过获取目标城市内的车牌号、车辆通过卡口时间和车辆通过卡口地点,并根据车牌号、车辆通过卡口时间和车辆确定评价参数数据,基于预设欧式距离计算方法,对所有的评价参数数据进行聚类,能够得到多个起始类型,随后计算起始类型中出租车车牌号在该起始类型中的占比,可以能够得到多个起始占比结果,再计算多个起始占比结果的起始平均值和起始标准差值,起始平均值和起始标准差值越大越好,因此,对所有的车牌号和车牌号对应的评价参数数据进行重新聚类、标记和计算占比,直到最终平均值和最终标准差值均满足均衡点,随后,调取最终占比结果中不小于最终平均值的最终类别,将最终类别中的非出租车车牌号进行筛选,此时筛选的非出租车车牌号已经和出租车车牌号有较高的相似性车辆,最后,基于预设伴随算法,根据所述筛选结果确定网约车的车牌号,能够达到快速识别网约车的效果。
附图说明
图1是本申请实施例的一种基于车辆的轨迹特征识别网约车的方法的流程示意图。
图2是本申请实施例的一种基于车辆的轨迹特征识别网约车的系统的系统示意图。
附图标记说明:21、获取模块;22、第一确定模块;23、聚类模块;24、标记模块;25、计算模块;26、判断模块;27、迭代模块;28、筛选模块;29、第二确定模块。
具体实施方式
以下结合附图对本申请作进一步详细说明。
本具体实施例仅仅是对本申请的解释,其并不是对本申请的限制,本领域技术人员在阅读完本说明书后可以根据需要对本实施例做出没有创造性贡献的修改,但只要在本申请的权利要求范围内都受到专利法的保护。
本申请实施例提供一种基于车辆的轨迹特征识别网约车的方法,主要应用在车辆识别的场景中。具体的,目前出租车都会进行备案,公安部门能够随时获取出租车的资料,但是,网约车并不会进行备案,同时,网约车因为运营自由、规范登记不完善、数据不共享等原因,公安部门由于无法获取网约车的资料,在规范交通时会遇到困难,因此,快速识别网约车车牌号变得越来越重要,本申请提供的方案能够达到快速识别网约车的效果。
下面结合说明书附图对本申请实施例作进一步详细描述。
一种基于车辆的轨迹特征识别网约车的方法的主要流程描述如下。
如图1所示:
步骤S100:获取车辆轨迹信息,根据车辆轨迹信息构建第一数据集。
目标城市内,在各个卡口均会设置有帧码设备和摄像头,帧码设备用于采集通过卡口的车辆内的人员的用户终端串号,该用户终端串号包括司机用户终端串号和乘坐人员的用户终端串号。摄像头用于采集车辆轨迹信息,车辆轨迹信息为网约车的车辆轨迹信息、出租车的车辆轨迹信息以及其它车的车辆轨迹信息,其中,其它车包括私家车、卡车和货车等。
车辆轨迹信息包括车牌号、车辆通过卡口时间和车辆通过卡口地点,其中,车辆通过卡口时间为摄像头采集车辆车牌号的时间,车辆通过卡口地点为摄像头采集车辆车牌号的地点,也就是摄像头的放置地点。
随后,对车辆的车牌号、车辆通过卡口时间和车辆通过卡口地点进行汇总,构建第一数据集。
步骤S200:根据第一数据集和预设派生字段确定评价参数数据,并构建第二数据集。
预设派生字段包括年-月-日、年-月和年,其中,年-月-日的格式为如2022-01-01所示,年-月的格式为如2022-01所示,年的格式为如2022所示。
根据年-月-日、年-月、年和车辆通过卡口时间确定每个车牌号的活动天数。对第一数据集内的车牌号进行筛选汇总,针对每个车牌号进行分组汇总所年-月-日的唯一个数为每个车牌号的活动天数,也就是无论这个车牌号在同一天出现多少次,都记为一次,同理,活动月数和活动年数也是这样得到。其中,活动天数、活动月数和活动年数均为参数评价数据,参数评价数据还包括平均每月活动天数、平均每年活动天数、平均每日活动地点数量、平均每日活动记录数和平均每日活动。
根据活动天数确定平均每月活动天数和平均每年活动天数,以一年时间为例,一年内的平均每月活动天数=一年内的活动天数/12,一年内的平均每年活动天数=一年内的活动天数/1,当年数发生改变时,平均每月活动天数和平均每年活动天数也会发生改变,平均每月活动天数和平均每年活动天数这两个参数评价数据是用于评估车辆活动的稳定性。
根据车辆通过卡口地点确定每个车牌号的平均每日活动地点数,以一年时间为例,首先,根据第一数据集确定每个车牌号每日车辆通过卡口地点数,需要注意的是,对车辆通过卡口地点进行唯一计数,也就是无论这一天多少次通过该车辆通过卡口地点,都记为一次;随后,汇总这一年内每日车辆通过卡口地点数的总和,得到总和活动地点数;最后,该车牌号的平均每日活动地点数=总和活动地点数/365。平均每日活动地点数用于评估车辆在目标城市内的活动广度。
根据车辆通过卡口地点确定每个车牌号的平均每日活动记录数,以一年时间为例,首先,根据第一数据集确定每个车牌号每日车辆通过卡口地点数,需要注意的是,并不对车辆通过卡口地点进行唯一计数,也就是这一天内车牌号出现多少次就记为多少次;随后,汇总这一年内每日车辆通过卡口地点数的总和,得到总和活动记录数;最后,该车牌号的平均每日活动记录数=总和活动记录数/365。平均每日活动记录数用于评估车辆在目标城市内的活动频繁性。
根据车辆通过卡口时间确定每个车牌号的平均每日活动小时数,同样以一年时间为例,首先,根据第一数据集确定每个车牌号的最早车辆通过卡口时间和最晚车辆通过卡口时间,最早车辆通过卡口时间为该车牌号当天第一次采集到的车辆通过卡口时间,最晚车辆通过卡口时间为该车牌号当天最后一次采集到的车辆通过卡口时间;随后,根据最早车辆通过卡口时间和最晚车辆通过卡口时间确定当天的活动小时数,并对一年内每天的活动小时数进行汇总求和,得到总和活动小时数;最后,该车牌号的平均每日活动小时数=总和活动小时数/365。平均每日活动小时数用于评估车辆在目标城市内的运行繁忙性。
随后,根据车牌号和车牌号对应的上述八个评价参数数据构建第二数据集。
步骤300:基于欧式距离计算方法,对第二数据集内的评价参数数据进行聚类,并构建第三数据集。
具体的,首先,对第二数据集内的每个车牌号的八个评价参数数据进行归一化,得到归一化数据,归一化计算方法为:
Figure 283459DEST_PATH_IMAGE001
(1)
其中,X1为该车牌号的评价参数数据的归一化数据,X为该评价参数数据的原始数据,Xmin为该类型的所有的评价参数数据的最小值,Xmax为该类型的所有的评价参数数据的最大值,需要知道的是,在每组评价参数数据中均加入一个数值0,该数值0为Xmin。如表一所示,为该实施例的第二数据集:
表一
Figure 731758DEST_PATH_IMAGE002
由归一化计算方法可以得到每个车牌号的评价参数数据的归一化数据。如表二所示:
表二
Figure 42653DEST_PATH_IMAGE003
将评价参数数据进行归一化,是为了统一每个车牌号的评价参数数据的量纲,增强评价参数数据之间的关联性。
随后,基于预设欧式距离计算方法,对评价参数数据的归一化数据进行聚类,并得到聚类结果,聚类结果中包括有多个不同起始类别,每个起始类别中均包括有多个相似的评价参数数据的归一化数据。
欧氏距离计算法的公式为:
Figure 719754DEST_PATH_IMAGE004
(2)
其中
Figure 330863DEST_PATH_IMAGE005
为一个车辆对象,
Figure 418905DEST_PATH_IMAGE006
为另一个车辆对象,
Figure 764567DEST_PATH_IMAGE007
代表的
Figure 494626DEST_PATH_IMAGE005
车辆对象的第
Figure 694663DEST_PATH_IMAGE008
个指标,
Figure 953606DEST_PATH_IMAGE009
代表的
Figure 989826DEST_PATH_IMAGE006
车辆对象的第
Figure 257996DEST_PATH_IMAGE008
个指标,
Figure 109278DEST_PATH_IMAGE010
代表有
Figure 818083DEST_PATH_IMAGE010
个指标。
最后,根据聚类结果构建第三数据集。
步骤S400:对第三数据集内的出租车车牌号进行筛选,计算出租车车牌号在所对应的起始类型组中的占比,得到起始占比结果,并计算多个起始占比结果的起始平均值和起始标准差值。
预设出租出匹配规则为在目标城市内,出租车的车牌号有一定的编码规则,如北京的京B开头的属于出租车。按照预设出租车匹配规则,匹配第三数据集中的所有车牌号,对出租车车牌号进行标记。
上述已知起始类别有多个,分别统计每个起始类别中的出租车车牌号的数量,并计算出租车车牌号的数量在该起始类别中的占比,得到起始占比结果。因为起始类别有多个,因此起始占比结果同样有多个。
根据起始占比结果确定起始标准差值和起始平均值。
如起始占比结果有5个,分别为0.1、0.3、0.5、0.6和0.8,计算起始占比结果的起始 平均值
Figure 325288DEST_PATH_IMAGE011
,计算起始占比结果的标准差值
Figure 131570DEST_PATH_IMAGE012
,起始标准差 值代表出租车车牌号起始占比结果的离散程度,起始标准差值越大,则说明一定程度上起 始类别更明显有效,起始平均值代表出租车车牌号起始占比结果的占比比例,以一种起始 类别来看,起始平均值越大,说明该种起始类别中的出租车车牌号越高,因此,起始平均值 和起始标准差值都是越大越好。
步骤S500:对第二数据集内的车牌号和车牌号对应的归一化数据进行重新聚类、标记和计算占比,直至最终类别满足最终标准差值和最终平均值均达到均衡点,并将非出租车车牌号进行筛选,构建第四数据集。
具体的,首先判断起始平均值和起始标准差值是否均达到均衡点,均衡点位于平均值的变化曲线和标准差值的变化曲线的最高交点处;
若是,则起始平均值为最终平均值,起始标准差值为最终标准差值,且并不需要对第二数据集内的车牌号和车牌号对应的归一化数据进行重新聚类、标记和计算占比;
若否,则需要需要对第二数据集内的车牌号和车牌号对应的归一化数据进行重新聚类、标记和计算占比,直至最终类别满足最终标准差值和最终平均值均达到均衡点。
由上述可知,起始占比结果的起始平均值和起始标准差值都是越大越好,但是,起始平均值和起始标准差值不可能同时达到最大,因此,根据起始平均值和起始标准差值重复上述步骤S400,即:
重新聚类起始类别中的车牌号,得到最终类别;
基于预设出租车匹配规则,对最终类别中出租车车牌号进行标记,得到最终标记结果;
根据最终标记结果计算出租车车牌号在对应最终类别的占比,得到最终占比结果;
计算多个最终占比结果的最终平均值和最终标准差值,最终平均值和最终标准差值均达到均衡点。
最终平均值和最终标准差值均达到均衡点之后,筛选最终占比结果不小于最终平均值的最终类别,这些最终类别中的非出租车车牌号与出租车车牌号有较高的行为相似性,这些非出租车车牌号的车辆可能是网约车,也可能是其它车辆,如企业招待车辆等。
随后将非出租车车牌号筛选出来,得到筛选结果,将筛选结果进行汇总,构建第四数据集。
步骤S600:根据预设伴随算法和第四数据集确定第五数据集,第五数据集内包括网约车车牌号。
将车牌号和用户终端串号进行绑定,得到绑定结果。在车辆通过帧码设备时,帧码设备会采集到车辆内司机的用户终端串号和乘坐人员的用户终端串号。
根据绑定结果计算过往车辆中的平均每日载客数。如在第一天,A车辆通过第一卡口的时候,帧码设备采集到用户终端串号是X和Y, A车辆通过第二卡口的时候,帧码设备采集到用户终端串号是X和M, A车辆通过第三卡口的时候,帧码设备采集到用户终端串号是X和N,则第一天A车辆的载客数是6;在第二天,A车辆通过第一卡口的时候,帧码设备采集到用户终端串号是X、Y和M, A车辆通过第二卡口的时候,帧码设备采集到用户终端串号是X、Y和N, A车辆通过第三卡口的时候,帧码设备采集到用户终端串号是X和Z,则第一天A车辆的载客数是8;A车辆在这两天的平均每日载客数是7。
需要注意的是,帧码设备采集到用户终端串号采用唯一值,如A车辆通过第一卡口的时候,帧码设备采集到用户终端串号是X和Y, A车辆通过第二卡口的时候,帧码设备采集到用户终端串号是X和Y, A车辆通过第三卡口的时候,帧码设备采集到用户终端串号是X和Y,则该天A车辆的载客数是2。
筛选车辆中的平均每日载客数大于预设阈值的车牌号,该车牌号为网约车车牌号。预设阈值是出租车的平均每日载客数,预设阈值是根据实际情况而设定的。
通过采用上述技术方案,通过获取目标城市内的车牌号、车辆通过卡口时间和车辆通过卡口地点,并根据车牌号、车辆通过卡口时间和车辆确定评价参数数据,基于预设欧式距离计算方法,对所有的评价参数数据进行聚类,能够得到多个起始类型,随后计算起始类型中出租车车牌号在该起始类型中的占比,可以能够得到多个起始占比结果,再计算多个起始占比结果的起始平均值和起始标准差值,起始平均值和起始标准差值越大越好,因此,对所有的车牌号和车牌号对应的评价参数数据进行重新聚类、标记和计算占比,直到最终平均值和最终标准差值均满足均衡点,随后,调取最终占比结果中不小于最终平均值的最终类别,将最终类别中的非出租车车牌号进行筛选,此时筛选的非出租车车牌号已经和出租车车牌号有较高的相似性车辆,最后,基于预设伴随算法,根据所述筛选结果确定网约车的车牌号,能够达到快速识别网约车车牌号的效果。
如图2所示的一种基于车辆的轨迹特征识别网约车的系统,包括获取模块21、第一确定模块22、聚类模块23、标记模块24、计算模块25、判断模块26、迭代模块27、筛选模块28和第二确定模块29,其中:
获取模块21,用于获取目标城市的车辆轨迹信息;
第一确定模块22,用于基于预设派生字段,根据所述车辆轨迹信息确定评价参数数据;
聚类模块23,用于基于预设欧式距离计算方法,对所述评价参数数据进行聚类,得到多个起始类别;
标记模块24,用于基于预设出租车匹配规则,对所述起始类别中出租车车牌号进行标记,得到起始标记结果;
计算模块25,用于根据所述起始标记结果计算出租车车牌号在对应起始类别的占比,得到起始占比结果;用于计算多个起始占比结果的起始平均值和起始标准差值;
判断模块26,用于判断所述起始平均值和起始标准差值是否达到均衡点;
迭代模块27,用于基于预设欧式距离计算方法,对所述评价参数数据重新聚类,直至最终平均值和最终标准差值均达到均衡点;
筛选模块28,用于调取最终占比结果中不小于最终平均值的最终类别,将最终类别中的非出租车车牌号进行筛选,得到筛选结果;
第二确定模块29,用于基于预设伴随算法,根据所述最终类别确定网约车的车牌号。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的申请范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离前述申请构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中申请的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (10)

1.一种基于车辆的轨迹特征识别网约车的方法,其特征在于:包括;
获取目标城市的车辆轨迹信息,所述车辆轨迹信息包括车牌号、车辆通过卡口时间和车辆通过卡口地点;
基于预设派生字段,根据所述车辆轨迹信息确定评价参数数据;
基于预设欧式距离计算方法,对所述评价参数数据进行聚类,得到多个起始类别;
基于预设出租车匹配规则,对所述起始类别中出租车车牌号进行标记,得到起始标记结果;
根据所述起始标记结果计算出租车车牌号在对应起始类别的占比,得到起始占比结果;
计算多个起始占比结果的起始平均值和起始标准差值;
判断所述起始平均值和起始标准差值是否达到均衡点;
若否,则基于预设欧式距离计算方法,对所述评价参数数据重新聚类,直至最终平均值和最终标准差值均达到均衡点;
调取最终占比结果中不小于最终平均值的最终类别,将最终类别中的非出租车车牌号进行筛选,得到筛选结果;
基于预设伴随算法,根据所述最终类别确定网约车的车牌号。
2.根据权利要求1所述的一种基于车辆的轨迹特征识别网约车的方法,其特征在于:所述评价参数数据包括活动天数、活动月数、活动年数、平均每月活动天数、平均每年活动天数、平均每日活动地点数、平均每日活动记录数和平均每日活动小时数。
3.根据权利要求2所述的一种基于车辆的轨迹特征识别网约车的方法,其特征在于:所述基于预设派生字段,根据所述车辆轨迹信息确定评价参数数据,包括;
根据预设派生字段和车辆通过卡口时间确定每个车牌号的活动天数、活动月数和活动年数;
根据所述活动天数确定每个车牌号的平均每月活动天数和平均每年活动天数;
根据所述车辆通过卡口地点确定每个车牌号的平均每日活动地点数和平均每日活动地点数;
根据所述车辆通过卡口时间确定每个车牌号的平均每日活动小时数。
4.根据权利要求3所述的一种基于车辆的轨迹特征识别网约车的方法,其特征在于:所述根据预设派生字段和车辆通过卡口时间确定每个车牌号的活动天数,包括;
所述预设派生字段包括年-月-日、年-月和年;
根据所述年-月-日、年-月和年和车辆通过卡口时间确定每个车牌号的活动天数。
5.根据权利要求4所述的一种基于车辆的轨迹特征识别网约车的方法,其特征在于:所述根据预设派生字段和车辆通过卡口时间确定每个车牌号的活动月数,包括;
根据所述年-月和年和车辆通过卡口时间确定每个车牌号的活动月数。
6.根据权利要求4所述的一种基于车辆的轨迹特征识别网约车的方法,其特征在于:所述根据预设派生字段和车辆通过卡口时间确定每个车牌号的活动月数,包括;
根据所述年和车辆通过卡口时间确定每个车牌号的活动年数。
7.根据权利要求1所述的一种基于车辆的轨迹特征识别网约车的方法,其特征在于:所述基于预设欧式距离计算方法,对所述评价参数数据进行聚类,得到多个起始类别,包括;
对所述评价参数数据进行归一化,得到归一化数据;
根据所述预设欧式距离计算方法对归一化数据进行聚类,得到多个类别。
8.根据权利要求1所述的一种基于车辆的轨迹特征识别网约车的方法,其特征在于:所述基于预设欧式距离计算方法,对所述评价参数数据重新聚类,直至最终平均值和最终标准差值均达到均衡点,包括;
重新聚类起始类别中的车牌号,得到最终类别;
基于预设出租车匹配规则,对所述最终类别中出租车车牌号进行标记,得到最终标记结果;
根据所述最终标记结果计算出租车车牌号在对应最终类别的占比,得到最终占比结果;
计算多个最终占比结果的最终平均值和最终标准差值,所述最终平均值和最终标准差值均达到均衡点。
9.根据权利要求1所述的一种基于车辆的轨迹特征识别网约车的方法,其特征在于:所述基于预设伴随算法,根据所述筛选结果确定网约车的车牌号,包括;
将所述车牌号和用户终端串号进行绑定,得到绑定结果;
根据所述绑定结果计算过往车辆中的每日平均载客数;
筛选所述车辆中的每日平均载客数大于预设阈值的车牌号,该车牌号为网约车车牌号。
10.一种基于车辆的轨迹特征识别网约车的系统,其特征在于:包括;
获取模块(21),用于获取目标城市的车辆轨迹信息;
第一确定模块(22),用于基于预设派生字段,根据所述车辆轨迹信息确定评价参数数据;
聚类模块(23),用于基于预设欧式距离计算方法,对所述评价参数数据进行聚类,得到多个起始类别;
标记模块(24),用于基于预设出租车匹配规则,对所述起始类别中出租车车牌号进行标记,得到起始标记结果;
计算模块(25),用于根据所述起始标记结果计算出租车车牌号在对应起始类别的占比,得到起始占比结果;用于计算多个起始占比结果的起始平均值和起始标准差值;
判断模块(26),用于判断所述起始平均值和起始标准差值是否达到均衡点;
迭代模块(27),用于基于预设欧式距离计算方法,对所述评价参数数据重新聚类,直至最终平均值和最终标准差值均达到均衡点;
筛选模块(28),用于调取最终占比结果中不小于最终平均值的最终类别,将最终类别中的非出租车车牌号进行筛选,得到筛选结果;
第二确定模块(29),用于基于预设伴随算法,根据所述最终类别确定网约车的车牌号。
CN202211629302.6A 2022-12-19 2022-12-19 一种基于车辆的轨迹特征识别网约车的方法和系统 Active CN115631632B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211629302.6A CN115631632B (zh) 2022-12-19 2022-12-19 一种基于车辆的轨迹特征识别网约车的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211629302.6A CN115631632B (zh) 2022-12-19 2022-12-19 一种基于车辆的轨迹特征识别网约车的方法和系统

Publications (2)

Publication Number Publication Date
CN115631632A true CN115631632A (zh) 2023-01-20
CN115631632B CN115631632B (zh) 2023-04-21

Family

ID=84910607

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211629302.6A Active CN115631632B (zh) 2022-12-19 2022-12-19 一种基于车辆的轨迹特征识别网约车的方法和系统

Country Status (1)

Country Link
CN (1) CN115631632B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105976617A (zh) * 2016-03-21 2016-09-28 江苏智通交通科技有限公司 非法营运车辆检测方法和系统
CN107301433A (zh) * 2017-07-14 2017-10-27 南京华苏科技有限公司 基于聚类判别模型的网约车鉴别方法和系统
CN108171976A (zh) * 2017-12-29 2018-06-15 合肥工业大学 基于在途数据的车辆用途识别方法
CN109145982A (zh) * 2018-08-17 2019-01-04 上海汽车集团股份有限公司 驾驶员的身份识别方法及装置、存储介质、终端
CN110942640A (zh) * 2019-12-04 2020-03-31 无锡华通智能交通技术开发有限公司 一种主动发现非法从事网约车客运的嫌疑车辆的方法
CN113160551A (zh) * 2021-01-12 2021-07-23 北京品恩科技股份有限公司 一种基于交通大数据伴随模型运用方法
CN114201530A (zh) * 2021-12-02 2022-03-18 合肥学院 一种疑似非正常营运客车提前甄别及预防式监管方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105976617A (zh) * 2016-03-21 2016-09-28 江苏智通交通科技有限公司 非法营运车辆检测方法和系统
CN107301433A (zh) * 2017-07-14 2017-10-27 南京华苏科技有限公司 基于聚类判别模型的网约车鉴别方法和系统
CN108171976A (zh) * 2017-12-29 2018-06-15 合肥工业大学 基于在途数据的车辆用途识别方法
CN109145982A (zh) * 2018-08-17 2019-01-04 上海汽车集团股份有限公司 驾驶员的身份识别方法及装置、存储介质、终端
CN110942640A (zh) * 2019-12-04 2020-03-31 无锡华通智能交通技术开发有限公司 一种主动发现非法从事网约车客运的嫌疑车辆的方法
CN113160551A (zh) * 2021-01-12 2021-07-23 北京品恩科技股份有限公司 一种基于交通大数据伴随模型运用方法
CN114201530A (zh) * 2021-12-02 2022-03-18 合肥学院 一种疑似非正常营运客车提前甄别及预防式监管方法

Also Published As

Publication number Publication date
CN115631632B (zh) 2023-04-21

Similar Documents

Publication Publication Date Title
US9262914B2 (en) Rogue vehicle detection
US20100030586A1 (en) Systems & methods of calculating and presenting automobile driving risks
CN112447041B (zh) 识别车辆的营运行为的方法、装置及计算设备
CN107645709B (zh) 一种确定人员信息的方法及装置
CN112579718B (zh) 一种城市用地功能的识别方法、装置及终端设备
CN110942640B (zh) 一种主动发现非法从事网约车客运的嫌疑车辆的方法
CN112363999B (zh) 一种公共交通的客流分析方法、装置、设备、存储介质
CN115080638B (zh) 微观仿真的多源数据融合分析方法、电子设备及存储介质
CN111949701B (zh) 一种基于轨迹相似度的移动对象出行规律分析方法及装置
CN110853156A (zh) 融合公交gps轨迹与ic卡数据的乘客od识别方法
Ridgeway Cincinnati police department traffic stops: Applying RAND's framework to analyze racial disparities
CN111861765B (zh) 一种车辆保险理赔智能反欺诈方法
US20140074672A1 (en) Fraud tracking network
Massobrio et al. Urban data analysis for the public transportation system of Montevideo, Uruguay
CN110491157B (zh) 一种基于停车场数据和卡口数据的车辆关联方法
CN115631632A (zh) 一种基于车辆的轨迹特征识别网约车的方法和系统
CN113077182A (zh) 一种车辆维保异常监测系统及方法
CN111369790B (zh) 过车记录校正方法、装置、设备及存储介质
CN114201530B (zh) 一种疑似非正常营运客车提前甄别及预防式监管方法
CN117076788A (zh) 一种基于多维感知数据的人员落脚点位分析方法和系统
CN112766567B (zh) 一种城市路网规划实施效果的评价方法、系统以及存储介质
CN115587128A (zh) 一种用于小区的实有人口积分管理系统
CN109934233B (zh) 一种运输业务识别方法和系统
CN113779171A (zh) 对象落脚点的确定方法、装置、存储介质及电子装置
CN111885503A (zh) 一种车牌分配方法及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant