CN114422973B - 一种基于大数据的网约车司机智能识别方法、系统及可读存储介质 - Google Patents

一种基于大数据的网约车司机智能识别方法、系统及可读存储介质 Download PDF

Info

Publication number
CN114422973B
CN114422973B CN202210320903.2A CN202210320903A CN114422973B CN 114422973 B CN114422973 B CN 114422973B CN 202210320903 A CN202210320903 A CN 202210320903A CN 114422973 B CN114422973 B CN 114422973B
Authority
CN
China
Prior art keywords
users
data
user
value
base station
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210320903.2A
Other languages
English (en)
Other versions
CN114422973A (zh
Inventor
成立立
张广志
刘增礼
于笑博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beiling Rongxin Datalnfo Science and Technology Ltd
Original Assignee
Beiling Rongxin Datalnfo Science and Technology Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beiling Rongxin Datalnfo Science and Technology Ltd filed Critical Beiling Rongxin Datalnfo Science and Technology Ltd
Priority to CN202210320903.2A priority Critical patent/CN114422973B/zh
Publication of CN114422973A publication Critical patent/CN114422973A/zh
Application granted granted Critical
Publication of CN114422973B publication Critical patent/CN114422973B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/20Services signaling; Auxiliary data signalling, i.e. transmitting data via a non-traffic channel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/30Services specially adapted for particular environments, situations or purposes
    • H04W4/40Services specially adapted for particular environments, situations or purposes for vehicles, e.g. vehicle-to-pedestrians [V2P]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本申请实施例提供了基于大数据的网约车司机智能识别方法、系统及可读存储介质。该方法,包括:获取道路区域内移动用户的特征数据信息并识别SIM卡用户并根据SIM卡用户在预设时间段内呼叫信息及路径表数据筛选出第一类别用户,根据第一类别用户手机信令数据获取IMSI基站交互信息数据包筛选出第二类别用户,根据第二类别用户在预设时间切片内移动数据识别用户属性获得第三类别用户,根据移动用户识别模型检验第三类别用户的用户属性获得目标网约车用户;从而基于大数据对道路区域内移动用户进行数据智慧识别实现对移动用户信息的采集和处理,再通过移动信息数据辨别出网约车用户,实现对网约车用户的精准识别和网约车用户相关数据统计,并保障网约车司乘安全。

Description

一种基于大数据的网约车司机智能识别方法、系统及可读存 储介质
技术领域
本申请涉及道路信息及网约车技术领域,具体而言,涉及一种基于大数据的网约车司机智能识别方法、系统及可读存储介质。
背景技术
随着共享经济的多样化发展,网约车越来越普及,过多的网约车方便了居民的生活,但也造成交通堵塞、交通安全隐患以及城市噪音尾气污染以及司乘安全事件产生的弊端,因此关注网约车运行状况对处理解决城市道路交通拥堵状况,提升城市管理水平和实现城市道路有序治理具有至关重要的作用。
而目前由于很多网约车外观和普通私家车一样,因此难以对网约车司机及网约车注册用户进行有效识别,更难以实时准确的掌握网约车运行状况,现有手段是通过网约车车号注册信息进行识别,但缺乏精准度和瞬时性,无法实现对道路区域内网约车司机及用户的有效识别。
针对上述问题,目前亟待有效的技术解决方案。
发明内容
本申请实施例的目的在于提供一种基于大数据的网约车司机智能识别方法、系统及可读存储介质,可以提高对道路区域内网约车用户情况的精准识别精确度。
本申请实施例还提供了一种基于大数据的网约车司机智能识别方法,包括以下步骤:
获取道路区域内移动用户的特征数据信息;
根据所述移动用户的特征数据信息识别SIM卡用户并根据所述SIM卡用户在预设时间段内呼叫信息及路径表数据筛选出第一类别用户;
获取所述第一类别用户的手机信令数据,根据所述手机信令数据获取所述第一类别用户的IMSI基站交互信息数据包;
根据所述第一类别用户的IMSI基站交互信息数据包筛选出第二类别用户;
根据所述第二类别用户在预设时间切片内移动数据识别用户属性获得第三类别用户;
根据移动用户识别模型检验所述第三类别用户的用户属性获得目标网约车用户。
可选的,在本申请实施例所述的基于大数据的网约车司机智能识别方法中,所述根据所述移动用户的特征数据信息识别SIM卡用户并根据所述SIM卡用户在预设时间段内呼叫信息及路径表数据筛选出第一类别用户,包括:
根据所述移动用户的特征数据信息中的话费套餐数据识别SIM卡用户;
获取所述SIM卡用户在工作日早晚高峰预设时间段内的呼叫信息,包括呼叫频次、每次通话时长以及每次通话对方SIM卡注册地址;
获取所述SIM卡用户在所述预设时间段内呼叫间隔的路径差值集成路径表数据;
根据所述SIM卡用户的呼叫信息和路径表数据获取寻呼特征值;
根据所述寻呼特征值与第一预设阈值对比筛选出第一类别用户。
可选的,在本申请实施例所述的基于大数据的网约车司机智能识别方法中,所述获取所述第一类别用户的手机信令数据,根据所述手机信令数据获取所述第一类别用户的IMSI基站交互信息数据包,包括:
获取所述第一类别用户的手机信令数据,包括信号交换数据、基站响应数据以及区间响应数据;
根据所述信号交换数据获取所述第一类别用户IMSI基站的交互频量值;
根据所述基站响应数据获取所述第一类别用户IMSI基站的覆盖范围值;
根据所述基站响应数据获取所述第一类别用户IMSI基站的响应离散点信息值;
根据所述第一类别用户IMSI基站的交互频量值、覆盖范围值及离散点信息值合成IMSI基站交互信息数据包。
可选的,在本申请实施例所述的基于大数据的网约车司机智能识别方法中,还包括:
所述交互频量值根据所述手机信令与IMSI基站在预设时间段内的交互频次获得;
所述覆盖范围值根据所述手机信令在预设时间段内与IMSI基站响应覆盖数量和响应区域范围获得;
所述响应离散点信息值根据手机信令在预设时间段行进密度与IMSI基站漂移信息点的离散点信息检测值获得。
可选的,在本申请实施例所述的基于大数据的网约车司机智能识别方法中,所述根据所述第一类别用户的IMSI基站交互信息数据包筛选出第二类别用户,包括:
获取基站交互数据库;
所述基站交互数据库包括各类用户在各区域、各时段的IMSI基站交互数据集;
获取所述基站交互数据库中移动运营类用户在所述预设时间段内各道路区域内的IMSI基站交互数据集;
所述移动运营类用户的IMSI基站交互数据集包括交互频量阈值、覆盖范围阈值以及响应离散点信息阈值;
根据所述第一类别用户IMSI基站交互信息数据包的交互频量值、覆盖范围值以及响应离散点信息值与所述交互频量阈值、覆盖范围阈值以及响应离散点信息阈值进行阈值对比;
根据所述阈值对比结果中所述交互频量值、覆盖范围值以及响应离散点信息值均分别大于所述交互频量阈值、覆盖范围阈值以及响应离散点信息阈值的第一类别用户标记为第二类别用户。
可选的,在本申请实施例所述的基于大数据的网约车司机智能识别方法中,所述根据所述第二类别用户在预设时间切片内移动数据识别用户属性获得第三类别用户,包括:
获取所述第二类别用户在预设时间段内的移动区域;
根据所述移动区域内的基站信息对所述基站覆盖范围区域进行栅格划分;
将所述预设时间段进行切片处理获得预设时间切片段;
根据所述第二类别用户在预设时间切片段内的基站栅格响应点获得栅格响应数据;
所述栅格响应数据包括栅格速率以及栅格重复率;
获取所述栅格速率大于预设第二阈值且栅格重复率小于预设第三阈值的第二类别用户标记为第三类别用户。
可选的,在本申请实施例所述的基于大数据的网约车司机智能识别方法中,所述根据移动用户识别模型检验所述第三类别用户的用户属性获得目标网约车用户,包括:
建立移动用户识别模型;
所述移动用户识别模型包括各类移动用户在各时间段、各区域内的移动数据信息;
所述移动数据信息包括交互频量值、覆盖范围值、栅格速率、栅格重复率以及用户活力值;
获取多个已知网约车用户在所述预设时间段和所述道路区域内的交互频量值、覆盖范围值、栅格速率以及栅格重复率;
分别将所述多个已知网约车用户的交互频量值、覆盖范围值、栅格速率以及栅格重复率输入所述移动用户识别模型得到每个所述已知网约车用户的用户活力值;
根据所述每个已知网约车用户的用户活力值进行平均化计算得到网约车用户活力均值;
将所述第三类别用户的交互频量值、覆盖范围值、栅格速率以及栅格重复率输入所述移动用户识别模型得到第三类别用户活力值;
根据所述第三类别用户活力值与所述网约车用户活力均值进行阈值对比;
根据所述阈值对比结果对所述第三类别用户进行属性判定,若判定通过,则将所述第三类别用户标记为目标网约车用户。
第二方面,本申请实施例提供了一种基于大数据的网约车司机智能识别系统,该系统包括:存储器及处理器,所述存储器中包括基于大数据的网约车司机智能识别方法的程序,所述基于大数据的网约车司机智能识别方法的程序被所述处理器执行时实现以下步骤:
获取道路区域内移动用户的特征数据信息;
根据所述移动用户的特征数据信息识别SIM卡用户并根据所述SIM卡用户在预设时间段内呼叫信息及路径表数据筛选出第一类别用户;
获取所述第一类别用户的手机信令数据,根据所述手机信令数据获取所述第一类别用户的IMSI基站交互信息数据包;
根据所述第一类别用户的IMSI基站交互信息数据包筛选出第二类别用户;
根据所述第二类别用户在预设时间切片内移动数据识别用户属性获得第三类别用户;
根据移动用户识别模型检验所述第三类别用户的用户属性获得目标网约车用户。
可选的,在本申请实施例所述的基于大数据的网约车司机智能识别系统中,所述根据所述移动用户的特征数据信息识别SIM卡用户并根据所述SIM卡用户在预设时间段内呼叫信息及路径表数据筛选出第一类别用户,包括:
根据所述移动用户的特征数据信息中的话费套餐数据识别SIM卡用户;
获取所述SIM卡用户在工作日早晚高峰预设时间段内的呼叫信息,包括呼叫频次、每次通话时长以及每次通话对方SIM卡注册地址;
获取所述SIM卡用户在所述预设时间段内呼叫间隔的路径差值集成路径表数据;
根据所述SIM卡用户的呼叫信息和路径表数据获取寻呼特征值;
根据所述寻呼特征值与第一预设阈值对比筛选出第一类别用户。
第三方面,本申请实施例还提供了一种可读存储介质,所述可读存储介质中包括基于大数据的网约车司机智能识别方法程序,所述基于大数据的网约车司机智能识别方法程序被处理器执行时,实现如上述任一项所述的一种基于大数据的网约车司机智能识别方法的步骤。
由上可知,本申请实施例提供的基于大数据的网约车司机智能识别方法、系统及可读存储介质通过获取道路区域内移动用户的特征数据信息并识别SIM卡用户并根据SIM卡用户在预设时间段内呼叫信息及路径表数据筛选出第一类别用户,根据第一类别用户手机信令数据获取IMSI基站交互信息数据包筛选出第二类别用户,根据第二类别用户在预设时间切片内移动数据识别用户属性获得第三类别用户,根据移动用户识别模型检验第三类别用户的用户属性获得目标网约车用户;从而基于大数据对道路区域内移动用户进行数据智慧识别实现对移动用户信息的采集和处理,再通过移动信息数据辨别出网约车用户,实现对网约车用户的精准识别和网约车用户相关数据统计,并保障网约车司乘安全。
本申请的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请实施例了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的基于大数据的网约车司机智能识别方法的一种流程图。
图2为本申请实施例提供的基于大数据的网约车司机智能识别系统的一种结构示意图。
具体实施方式
下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到,相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
请参照图1,图1是本申请一些实施例中的一种基于大数据的网约车司机智能识别方法的流程图。该基于大数据的网约车司机智能识别方法用于终端设备中,例如电脑终端等。该基于大数据的网约车司机智能识别方法,包括以下步骤:
S101、获取道路区域内移动用户的特征数据信息;
S102、根据所述移动用户的特征数据信息识别SIM卡用户并根据所述SIM卡用户在预设时间段内呼叫信息及路径表数据筛选出第一类别用户;
S103、获取所述第一类别用户的手机信令数据,根据所述手机信令数据获取所述第一类别用户的IMSI基站交互信息数据包;
S104、根据所述第一类别用户的IMSI基站交互信息数据包筛选出第二类别用户;
S105、根据所述第二类别用户在预设时间切片内移动数据识别用户属性获得第三类别用户;
S106、根据移动用户识别模型检验所述第三类别用户的用户属性获得目标网约车用户。
需要说明的是,为实现对网约车司机用户的识别,通过对道路区域内移动用户的种类识别,根据移动用户特征信息包括话费套餐区别出SIM卡用户和物联网卡用户,根据SIM卡用户在预设时间内的呼叫信息及对应路径表数据筛选出第一类用户,再通过对第一类用户的手机信令数据获取IMSI基站交互信息数据包,根据第一类别用户的IMSI基站交互信息数据包筛选出第二类别用户以识别移动运营类用户,再根据第二类别用户在预设时间切片内移动数据识别用户属性获得第三类别用户,区分出外卖配送或快递员,最后根据移动用户识别模型通过已知网约车用户对第三类别用户进行属性检验以获得目标网约车用户。
根据本发明实施例,所述根据所述移动用户的特征数据信息识别SIM卡用户并根据所述SIM卡用户在预设时间段内呼叫信息及路径表数据筛选出第一类别用户,具体为:
根据所述移动用户的特征数据信息中的话费套餐数据识别SIM卡用户;
获取所述SIM卡用户在工作日早晚高峰预设时间段内的呼叫信息,包括呼叫频次、每次通话时长以及每次通话对方SIM卡注册地址;
获取所述SIM卡用户在所述预设时间段内呼叫间隔的路径差值集成路径表数据;
根据所述SIM卡用户的呼叫信息和路径表数据获取寻呼特征值;
根据所述寻呼特征值与第一预设阈值对比筛选出第一类别用户。
需要说明的是,移动用户通常有物联网卡和SIM卡用户,为筛选出SIM卡用户,根据用户特征数据信息的话费套餐数据进行识别,获取SIM卡用户在工作日早晚高峰时段的呼叫信息包括呼叫频次、通话时长以及通话对方卡注册地,并根据两次间隔呼叫发出位置之间的路径差集成路径表数据,路径表数据是对预设时间段内每次间隔呼叫之间的位置路径差的数据条的数据集成,再根据呼叫信息和路径表数据获取该SIM卡用户的寻呼特征值,根据寻呼特征值与第一预设阈值进行对比,将大于阈值的SIM卡用户筛选为第一类别用户,通过筛选可获取具有高寻呼频次、长通话时长以及较长间隔呼叫间距离差的SIM卡用户,此类用户可初步筛出具有快速移动、高通话频次且为本地通话特征的移动用户,此类特征符合网约车司机用户的特征;
其中,所述寻呼特征值的获取计算方法为:
Figure 271887DEST_PATH_IMAGE001
其中,
Figure 352975DEST_PATH_IMAGE002
为特征系数,
Figure 172027DEST_PATH_IMAGE003
为第i次通话时长,
Figure 614073DEST_PATH_IMAGE004
为第i次通话对方SIM卡注册地址参数,其中,注册地址为本地时
Figure 592393DEST_PATH_IMAGE004
为1,注册地址为外地时
Figure 188591DEST_PATH_IMAGE004
为0,n为预设时间段内呼叫频次数,
Figure 619572DEST_PATH_IMAGE005
为第i次呼叫与i-1次呼叫之间的位置路径差,T为寻呼特征值,i为n次呼叫中的第i次。
根据本发明实施例,所述获取所述第一类别用户的手机信令数据,根据所述手机信令数据获取所述第一类别用户的IMSI基站交互信息数据包,具体为:
获取所述第一类别用户的手机信令数据,包括信号交换数据、基站响应数据以及区间响应数据;
根据所述信号交换数据获取所述第一类别用户IMSI基站的交互频量值;
根据所述基站响应数据获取所述第一类别用户IMSI基站的覆盖范围值;
根据所述基站响应数据获取所述第一类别用户IMSI基站的响应离散点信息值;
根据所述第一类别用户IMSI基站的交互频量值、覆盖范围值及离散点信息值合成IMSI基站交互信息数据包。
需要说明的是,为进一步从筛出的第一类别用户中准确筛选出网约车司机用户,需根据用户手机与基站之间的交互信息进行进一步筛选,获取第一类别用户的手机信令数据包括号交换数据、基站响应数据以及区间响应数据,分别是第一类别用户与IMSI基站的交互频量值、覆盖范围值以及响应离散点信息值,根据用户的三个信令数据值进行判断。
根据本发明实施例,还包括:
所述交互频量值根据所述手机信令与IMSI基站在预设时间段内的交互频次获得;
所述覆盖范围值根据所述手机信令在预设时间段内与IMSI基站响应覆盖数量和响应区域范围获得;
所述响应离散点信息值根据手机信令在预设时间段行进密度与IMSI基站漂移信息点的离散点信息检测值获得。
需要说明的是,交互频量值是反映预设时间段内用户手机进行通话时与基站的信号交互频次,交互频次越高说明通话频率越高;覆盖范围值是反映预设时间段内与用户手机交互响应的基站数量和覆盖区域,覆盖范围值越大说明用户经过的基站范围越大;响应离散点信息值是检测用户手机与基站漂移信息点间的响应度关系,设置响应离散点信息值,用于检测预设时间段内手机信令行进密度与基站漂移信息点间的聚集度,根据用户手机信令在预设时间段内行进密集度集与响应的基站漂移信息集之间进行密集度鉴权,根据鉴权结果作为响应离散点信息值,响应离散点信息值越大说明用户手机交互基站密集度和强度越高,说明用户使用网约车平台或导航等手机软件的频次越高;
其中,所述响应离散点信息值的计算方法为:
设定预设时间段内用户手机信令任一中心正态分布的行进密度为
Figure 107054DEST_PATH_IMAGE006
,Q为预设时间段内用户手机信令行进密度集,且
Figure 80826DEST_PATH_IMAGE007
,又设任一IMSI基站漂移信息点
Figure 972559DEST_PATH_IMAGE008
以及IMSI基站漂移信息集W,满足
Figure 782514DEST_PATH_IMAGE009
,若满足
Figure 558841DEST_PATH_IMAGE010
,则
Figure 246174DEST_PATH_IMAGE011
为离散点信息,其中,
Figure 964600DEST_PATH_IMAGE012
为阈值取0.7;
则响应离散点信息值
Figure 979961DEST_PATH_IMAGE013
,其中,R为响应离散点信息值,n为满足
Figure 950191DEST_PATH_IMAGE014
的取值个数,i和j为任一取值次数。
根据本发明实施例,所述根据所述第一类别用户的IMSI基站交互信息数据包筛选出第二类别用户,具体为:
获取基站交互数据库;
所述基站交互数据库包括各类用户在各区域、各时段的IMSI基站交互数据集;
获取所述基站交互数据库中移动运营类用户在所述预设时间段内各道路区域内的IMSI基站交互数据集;
所述移动运营类用户的IMSI基站交互数据集包括交互频量阈值、覆盖范围阈值以及响应离散点信息阈值;
根据所述第一类别用户IMSI基站交互信息数据包的交互频量值、覆盖范围值以及响应离散点信息值与所述交互频量阈值、覆盖范围阈值以及响应离散点信息阈值进行阈值对比;
根据所述阈值对比结果中所述交互频量值、覆盖范围值以及响应离散点信息值均分别大于所述交互频量阈值、覆盖范围阈值以及响应离散点信息阈值的第一类别用户标记为第二类别用户。
需要说明的是,为排除非运营车辆手机用户样本造成的干扰,获取基站交互数据库中已注册移动运营类车辆用户的手机信令与IMSI基站交互数据,根据已注册多个移动运营类车辆用户在基站交互数据库的交互数据集统计获取的数据阈值与第一类别用户的对应数据进行阈值对比,根据对比结果筛选出满足阈值对比要求的用户标记为第二类别用户,进一步精准识别网约车司机用户的筛选范围,其中基站交互数据库是城市基站网络平台的大数据库,可通过查询获取移动运营类用户的交互信息数据,移动运营类用户可通过移动运营网络或第三方平台中已注册的车辆司机的信息进行获取。
根据本发明实施例,所述根据所述第二类别用户在预设时间切片内移动数据识别用户属性获得第三类别用户,具体为:
获取所述第二类别用户在预设时间段内的移动区域;
根据所述移动区域内的基站信息对所述基站覆盖范围区域进行栅格划分;
将所述预设时间段进行切片处理获得预设时间切片段;
根据所述第二类别用户在预设时间切片段内的基站栅格响应点获得栅格响应数据;
所述栅格响应数据包括栅格速率以及栅格重复率;
获取所述栅格速率大于预设第二阈值且栅格重复率小于预设第三阈值的第二类别用户标记为第三类别用户。
需要说明的是,为识别出快递或送货类车辆用户以及外卖车辆用户与网约车司机用户进行区分,根据网约车司机用户途径折返重复度低于其他快递送货外卖类车辆用户这一特征进行甄别,网约车司机在单位时间片段内的移动漂移重复率较低但位移距离较大,因此根据第二类别用户在预设时间段内的移动区域内的基站覆盖区域进行栅格划分,对基站覆盖区域各栅格的第二类别用户手机与基站信号响应强度定义为基站栅格响应点,并将预设时间段进行切片处理获得预设时间切片段,根据单位预设时间切片段的基站栅格响应点的涵盖数量获得栅格速率,根据预设累积预设时间切片段内基站栅格响应点的重复度获得栅格重复率,将栅格速率和栅格重复率合成栅格响应数据,再将第二类别用户的栅格响应数据中栅格速率大于预设第二阈值,且栅格重复率小于预设第三阈值的第二类别用户标记为第三类别用户,实现对网约车司机用户的进一步精准筛选。
根据本发明实施例,所述根据移动用户识别模型检验所述第三类别用户的用户属性获得目标网约车用户,具体为:
建立移动用户识别模型;
所述移动用户识别模型包括各类移动用户在各时间段、各区域内的移动数据信息;
所述移动数据信息包括交互频量值、覆盖范围值、栅格速率、栅格重复率以及用户活力值;
获取多个已知网约车用户在所述预设时间段和所述道路区域内的交互频量值、覆盖范围值、栅格速率以及栅格重复率;
分别将所述多个已知网约车用户的交互频量值、覆盖范围值、栅格速率以及栅格重复率输入所述移动用户识别模型得到每个所述已知网约车用户的用户活力值;
根据所述每个已知网约车用户的用户活力值进行平均化计算得到网约车用户活力均值;
将所述第三类别用户的交互频量值、覆盖范围值、栅格速率以及栅格重复率输入所述移动用户识别模型得到第三类别用户活力值;
根据所述第三类别用户活力值与所述网约车用户活力均值进行阈值对比;
根据所述阈值对比结果对所述第三类别用户进行属性判定,若判定通过,则将所述第三类别用户标记为目标网约车用户。
需要说明的是,为验证筛选出的第三类别用户是否是网约车司机用户,建立移动用户识别模型,该模型包括各类移动用户在各时间段、各区域内的移动数据信息,移动数据信息包括交互频量值、覆盖范围值、栅格速率、栅格重复率以及用户活力值,该移动用户识别模型是根据历史大量移动用户的移动数据信息进行训练获得的,根据历史移动用户样本的交互频量值、覆盖范围值、栅格速率、栅格重复率以及用户活力值输入至初始移动用户识别模型中进行自学习得到输出值,若输出值大于预设阈值则学习停止,获得移动用户识别模型;
根据多个已知网约车用户在预设时间段和道路区域内的交互频量值、覆盖范围值、栅格速率以及栅格重复率输入移动用户识别模型得到每个样本用户的用户活力值,再根据得到的所有已知样本用户的用户活力值进行平均化计算得到网约车用户活力均值,再将第三类别用户的交互频量值、覆盖范围值、栅格速率以及栅格重复率输入移动用户识别模型得到第三类别用户活力值,根据第三类别用户活力值与网约车用户活力均值进行阈值对比,若第三类别用户活力值大于网约车用户活力均值的阈值,则验证通过,第三类别用户为目标网约车用户,其中本方案中网约车用户活力均值的阈值设置为90%。
如图2所示,本发明还公开了一种基于大数据的网约车司机智能识别系统,包括存储器201和处理器202,所述存储器中包括基于大数据的网约车司机智能识别方法程序,所述基于大数据的网约车司机智能识别方法程序被所述处理器执行时实现如下步骤:
获取道路区域内移动用户的特征数据信息;
根据所述移动用户的特征数据信息识别SIM卡用户并根据所述SIM卡用户在预设时间段内呼叫信息及路径表数据筛选出第一类别用户;
获取所述第一类别用户的手机信令数据,根据所述手机信令数据获取所述第一类别用户的IMSI基站交互信息数据包;
根据所述第一类别用户的IMSI基站交互信息数据包筛选出第二类别用户;
根据所述第二类别用户在预设时间切片内移动数据识别用户属性获得第三类别用户;
根据移动用户识别模型检验所述第三类别用户的用户属性获得目标网约车用户。
需要说明的是,为实现对网约车司机用户的识别,通过对道路区域内移动用户的种类识别,根据移动用户特征信息包括话费套餐区别出SIM卡用户和物联网卡用户,根据SIM卡用户在预设时间内的呼叫信息及对应路径表数据筛选出第一类用户,再通过对第一类用户的手机信令数据获取IMSI基站交互信息数据包,根据第一类别用户的IMSI基站交互信息数据包筛选出第二类别用户以识别移动运营类用户,再根据第二类别用户在预设时间切片内移动数据识别用户属性获得第三类别用户,区分出外卖配送或快递员,最后根据移动用户识别模型通过已知网约车用户对第三类别用户进行属性检验以获得目标网约车用户。
根据本发明实施例,所述根据所述移动用户的特征数据信息识别SIM卡用户并根据所述SIM卡用户在预设时间段内呼叫信息及路径表数据筛选出第一类别用户,具体为:
根据所述移动用户的特征数据信息中的话费套餐数据识别SIM卡用户;
获取所述SIM卡用户在工作日早晚高峰预设时间段内的呼叫信息,包括呼叫频次、每次通话时长以及每次通话对方SIM卡注册地址;
获取所述SIM卡用户在所述预设时间段内呼叫间隔的路径差值集成路径表数据;
根据所述SIM卡用户的呼叫信息和路径表数据获取寻呼特征值;
根据所述寻呼特征值与第一预设阈值对比筛选出第一类别用户。
需要说明的是,移动用户通常有物联网卡和SIM卡用户,为筛选出SIM卡用户,根据用户特征数据信息的话费套餐数据进行识别,获取SIM卡用户在工作日早晚高峰时段的呼叫信息包括呼叫频次、通话时长以及通话对方卡注册地,并根据两次间隔呼叫发出位置之间的路径差集成路径表数据,路径表数据是对预设时间段内每次间隔呼叫之间的位置路径差的数据条的数据集成,再根据呼叫信息和路径表数据获取该SIM卡用户的寻呼特征值,根据寻呼特征值与第一预设阈值进行对比,将大于阈值的SIM卡用户筛选为第一类别用户,通过筛选可获取具有高寻呼频次、长通话时长以及较长间隔呼叫间距离差的SIM卡用户,此类用户可初步筛出具有快速移动、高通话频次且为本地通话特征的移动用户,此类特征符合网约车司机用户的特征;
其中,所述寻呼特征值的获取计算方法为:
Figure 380778DEST_PATH_IMAGE015
其中,
Figure 755259DEST_PATH_IMAGE016
为特征系数,
Figure 648129DEST_PATH_IMAGE017
为第i次通话时长,
Figure 15525DEST_PATH_IMAGE018
为第i次通话对方SIM卡注册地址参数,其中,注册地址为本地时
Figure 480048DEST_PATH_IMAGE018
为1,注册地址为外地时
Figure 540276DEST_PATH_IMAGE018
为0,n为预设时间段内呼叫频次数,
Figure 530229DEST_PATH_IMAGE019
为第i次呼叫与i-1次呼叫之间的位置路径差,T为寻呼特征值,i为n次呼叫中的第i次。
根据本发明实施例,所述获取所述第一类别用户的手机信令数据,根据所述手机信令数据获取所述第一类别用户的IMSI基站交互信息数据包,具体为:
获取所述第一类别用户的手机信令数据,包括信号交换数据、基站响应数据以及区间响应数据;
根据所述信号交换数据获取所述第一类别用户IMSI基站的交互频量值;
根据所述基站响应数据获取所述第一类别用户IMSI基站的覆盖范围值;
根据所述基站响应数据获取所述第一类别用户IMSI基站的响应离散点信息值;
根据所述第一类别用户IMSI基站的交互频量值、覆盖范围值及离散点信息值合成IMSI基站交互信息数据包。
需要说明的是,为进一步从筛出的第一类别用户中准确筛选出网约车司机用户,需根据用户手机与基站之间的交互信息进行进一步筛选,获取第一类别用户的手机信令数据包括号交换数据、基站响应数据以及区间响应数据,分别是第一类别用户与IMSI基站的交互频量值、覆盖范围值以及响应离散点信息值,根据用户的三个信令数据值进行判断。
根据本发明实施例,还包括:
所述交互频量值根据所述手机信令与IMSI基站在预设时间段内的交互频次获得;
所述覆盖范围值根据所述手机信令在预设时间段内与IMSI基站响应覆盖数量和响应区域范围获得;
所述响应离散点信息值根据手机信令在预设时间段行进密度与IMSI基站漂移信息点的离散点信息检测值获得。
需要说明的是,交互频量值是反映预设时间段内用户手机进行通话时与基站的信号交互频次,交互频次越高说明通话频率越高;覆盖范围值是反映预设时间段内与用户手机交互响应的基站数量和覆盖区域,覆盖范围值越大说明用户经过的基站范围越大;响应离散点信息值是检测用户手机与基站漂移信息点间的响应度关系,设置响应离散点信息值,用于检测预设时间段内手机信令行进密度与基站漂移信息点间的聚集度,根据用户手机信令在预设时间段内行进密集度集与响应的基站漂移信息集之间进行密集度鉴权,根据鉴权结果作为响应离散点信息值,响应离散点信息值越大说明用户手机交互基站密集度和强度越高,说明用户使用网约车平台或导航等手机软件的频次越高;
其中,所述响应离散点信息值的计算方法为:
设定预设时间段内用户手机信令任一中心正态分布的行进密度为
Figure 576683DEST_PATH_IMAGE020
,Q为预设时间段内用户手机信令行进密度集,且
Figure 981863DEST_PATH_IMAGE021
,又设任一IMSI基站漂移信息点
Figure 698146DEST_PATH_IMAGE022
以及IMSI基站漂移信息集W,满足
Figure 565608DEST_PATH_IMAGE023
,若满足
Figure 274807DEST_PATH_IMAGE024
,则
Figure 475106DEST_PATH_IMAGE025
为离散点信息,其中,
Figure 752504DEST_PATH_IMAGE026
为阈值取0.7;
则响应离散点信息值
Figure 717049DEST_PATH_IMAGE027
,其中,R为响应离散点信息值,n为满足
Figure 229939DEST_PATH_IMAGE028
的取值个数,i和j为任一取值次数。
根据本发明实施例,所述根据所述第一类别用户的IMSI基站交互信息数据包筛选出第二类别用户,具体为:
获取基站交互数据库;
所述基站交互数据库包括各类用户在各区域、各时段的IMSI基站交互数据集;
获取所述基站交互数据库中移动运营类用户在所述预设时间段内各道路区域内的IMSI基站交互数据集;
所述移动运营类用户的IMSI基站交互数据集包括交互频量阈值、覆盖范围阈值以及响应离散点信息阈值;
根据所述第一类别用户IMSI基站交互信息数据包的交互频量值、覆盖范围值以及响应离散点信息值与所述交互频量阈值、覆盖范围阈值以及响应离散点信息阈值进行阈值对比;
根据所述阈值对比结果中所述交互频量值、覆盖范围值以及响应离散点信息值均分别大于所述交互频量阈值、覆盖范围阈值以及响应离散点信息阈值的第一类别用户标记为第二类别用户。
需要说明的是,为排除非运营车辆手机用户样本造成的干扰,获取基站交互数据库中已注册移动运营类车辆用户的手机信令与IMSI基站交互数据,根据已注册多个移动运营类车辆用户在基站交互数据库的交互数据集统计获取的数据阈值与第一类别用户的对应数据进行阈值对比,根据对比结果筛选出满足阈值对比要求的用户标记为第二类别用户,进一步精准识别网约车司机用户的筛选范围,其中基站交互数据库是城市基站网络平台的大数据库,可通过查询获取移动运营类用户的交互信息数据,移动运营类用户可通过移动运营网络或第三方平台中已注册的车辆司机的信息进行获取。
根据本发明实施例,所述根据所述第二类别用户在预设时间切片内移动数据识别用户属性获得第三类别用户,具体为:
获取所述第二类别用户在预设时间段内的移动区域;
根据所述移动区域内的基站信息对所述基站覆盖范围区域进行栅格划分;
将所述预设时间段进行切片处理获得预设时间切片段;
根据所述第二类别用户在预设时间切片段内的基站栅格响应点获得栅格响应数据;
所述栅格响应数据包括栅格速率以及栅格重复率;
获取所述栅格速率大于预设第二阈值且栅格重复率小于预设第三阈值的第二类别用户标记为第三类别用户。
需要说明的是,为识别出快递或送货类车辆用户以及外卖车辆用户与网约车司机用户进行区分,根据网约车司机用户途径折返重复度低于其他快递送货外卖类车辆用户这一特征进行甄别,网约车司机在单位时间片段内的移动漂移重复率较低但位移距离较大,因此根据第二类别用户在预设时间段内的移动区域内的基站覆盖区域进行栅格划分,对基站覆盖区域各栅格的第二类别用户手机与基站信号响应强度定义为基站栅格响应点,并将预设时间段进行切片处理获得预设时间切片段,根据单位预设时间切片段的基站栅格响应点的涵盖数量获得栅格速率,根据预设累积预设时间切片段内基站栅格响应点的重复度获得栅格重复率,将栅格速率和栅格重复率合成栅格响应数据,再将第二类别用户的栅格响应数据中栅格速率大于预设第二阈值,且栅格重复率小于预设第三阈值的第二类别用户标记为第三类别用户,实现对网约车司机用户的进一步精准筛选。
根据本发明实施例,所述根据移动用户识别模型检验所述第三类别用户的用户属性获得目标网约车用户,具体为:
建立移动用户识别模型;
所述移动用户识别模型包括各类移动用户在各时间段、各区域内的移动数据信息;
所述移动数据信息包括交互频量值、覆盖范围值、栅格速率、栅格重复率以及用户活力值;
获取多个已知网约车用户在所述预设时间段和所述道路区域内的交互频量值、覆盖范围值、栅格速率以及栅格重复率;
分别将所述多个已知网约车用户的交互频量值、覆盖范围值、栅格速率以及栅格重复率输入所述移动用户识别模型得到每个所述已知网约车用户的用户活力值;
根据所述每个已知网约车用户的用户活力值进行平均化计算得到网约车用户活力均值;
将所述第三类别用户的交互频量值、覆盖范围值、栅格速率以及栅格重复率输入所述移动用户识别模型得到第三类别用户活力值;
根据所述第三类别用户活力值与所述网约车用户活力均值进行阈值对比;
根据所述阈值对比结果对所述第三类别用户进行属性判定,若判定通过,则将所述第三类别用户标记为目标网约车用户。
需要说明的是,为验证筛选出的第三类别用户是否是网约车司机用户,建立移动用户识别模型,该模型包括各类移动用户在各时间段、各区域内的移动数据信息,移动数据信息包括交互频量值、覆盖范围值、栅格速率、栅格重复率以及用户活力值,该移动用户识别模型是根据历史大量移动用户的移动数据信息进行训练获得的,根据历史移动用户样本的交互频量值、覆盖范围值、栅格速率、栅格重复率以及用户活力值输入至初始移动用户识别模型中进行自学习得到输出值,若输出值大于预设阈值则学习停止,获得移动用户识别模型;
根据多个已知网约车用户在预设时间段和道路区域内的交互频量值、覆盖范围值、栅格速率以及栅格重复率输入移动用户识别模型得到每个样本用户的用户活力值,再根据得到的所有已知样本用户的用户活力值进行平均化计算得到网约车用户活力均值,再将第三类别用户的交互频量值、覆盖范围值、栅格速率以及栅格重复率输入移动用户识别模型得到第三类别用户活力值,根据第三类别用户活力值与网约车用户活力均值进行阈值对比,若第三类别用户活力值大于网约车用户活力均值的阈值,则验证通过,第三类别用户为目标网约车用户,其中本方案中网约车用户活力均值的阈值设置为90%。
本发明第三方面提供了一种可读存储介质,所述可读存储介质中包括一种基于大数据的网约车司机智能识别方法程序,所述基于大数据的网约车司机智能识别方法程序被处理器执行时,实现如上述任一项所述的一种基于大数据的网约车司机智能识别方法的步骤。
本发明公开的一种基于大数据的网约车司机智能识别方法、系统及可读存储介质,通过获取道路区域内移动用户的特征数据信息并识别SIM卡用户并根据SIM卡用户在预设时间段内呼叫信息及路径表数据筛选出第一类别用户,根据第一类别用户手机信令数据获取IMSI基站交互信息数据包筛选出第二类别用户,根据第二类别用户在预设时间切片内移动数据识别用户属性获得第三类别用户,根据移动用户识别模型检验第三类别用户的用户属性获得目标网约车用户;从而基于大数据对道路区域内移动用户进行数据智慧识别实现对移动用户信息的采集和处理,再通过移动信息数据辨别出网约车用户,实现对网约车用户的精准识别和网约车用户相关数据统计,并保障网约车司乘安全。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

Claims (7)

1.一种基于大数据的网约车司机智能识别方法,其特征在于,包括以下步骤:
获取道路区域内移动用户的特征数据信息;
根据所述移动用户的特征数据信息识别SIM卡用户并根据所述SIM卡用户在预设时间段内呼叫信息及路径表数据筛选出第一类别用户;
获取所述第一类别用户的手机信令数据,根据所述手机信令数据获取所述第一类别用户的IMSI基站交互信息数据包;
根据所述第一类别用户的IMSI基站交互信息数据包筛选出第二类别用户;
根据所述第二类别用户在预设时间切片内移动数据识别用户属性获得第三类别用户;
根据移动用户识别模型检验所述第三类别用户的用户属性获得目标网约车用户;
所述根据所述移动用户的特征数据信息识别SIM卡用户并根据所述SIM卡用户在预设时间段内呼叫信息及路径表数据筛选出第一类别用户,包括:
根据所述移动用户的特征数据信息中的话费套餐数据识别SIM卡用户;
获取所述SIM卡用户在工作日早晚高峰预设时间段内的呼叫信息,包括呼叫频次、每次通话时长以及每次通话对方SIM卡注册地址;
获取所述SIM卡用户在所述预设时间段内呼叫间隔的路径差值集成路径表数据;
根据所述SIM卡用户的呼叫信息和路径表数据获取寻呼特征值;
根据所述寻呼特征值与第一预设阈值对比筛选出第一类别用户;
所述根据所述第一类别用户的IMSI基站交互信息数据包筛选出第二类别用户,包括:
获取基站交互数据库;
所述基站交互数据库包括各类用户在各区域、各时段的IMSI基站交互数据集;
获取所述基站交互数据库中移动运营类用户在所述预设时间段内各道路区域内的IMSI基站交互数据集;
所述移动运营类用户的IMSI基站交互数据集包括交互频量阈值、覆盖范围阈值以及响应离散点信息阈值;
根据所述第一类别用户IMSI基站交互信息数据包的交互频量值、覆盖范围值以及响应离散点信息值与所述交互频量阈值、覆盖范围阈值以及响应离散点信息阈值进行阈值对比;
根据所述阈值对比结果中所述交互频量值、覆盖范围值以及响应离散点信息值均分别大于所述交互频量阈值、覆盖范围阈值以及响应离散点信息阈值的第一类别用户标记为第二类别用户。
2.根据权利要求1所述的基于大数据的网约车司机智能识别方法,其特征在于,所述获取所述第一类别用户的手机信令数据,根据所述手机信令数据获取所述第一类别用户的IMSI基站交互信息数据包,包括:
获取所述第一类别用户的手机信令数据,包括信号交换数据、基站响应数据以及区间响应数据;
根据所述信号交换数据获取所述第一类别用户IMSI基站的交互频量值;
根据所述基站响应数据获取所述第一类别用户IMSI基站的覆盖范围值;
根据所述区间响应数据获取所述第一类别用户IMSI基站的响应离散点信息值;
根据所述第一类别用户IMSI基站的交互频量值、覆盖范围值及离散点信息值合成IMSI基站交互信息数据包。
3.根据权利要求2所述的基于大数据的网约车司机智能识别方法,其特征在于,还包括:
所述交互频量值根据所述手机信令与IMSI基站在预设时间段内的交互频次获得;
所述覆盖范围值根据所述手机信令在预设时间段内与IMSI基站响应覆盖数量和响应区域范围获得;
所述响应离散点信息值根据手机信令在预设时间段行进密度与IMSI基站漂移信息点的离散点信息检测值获得。
4.根据权利要求1所述的基于大数据的网约车司机智能识别方法,其特征在于,所述根据所述第二类别用户在预设时间切片内移动数据识别用户属性获得第三类别用户,包括:
获取所述第二类别用户在预设时间段内的移动区域;
根据所述移动区域内的基站信息对所述基站覆盖范围区域进行栅格划分;
将所述预设时间段进行切片处理获得预设时间切片段;
根据所述第二类别用户在预设时间切片段内的基站栅格响应点获得栅格响应数据;
所述栅格响应数据包括栅格速率以及栅格重复率;
获取所述栅格速率大于预设第二阈值且栅格重复率小于预设第三阈值的第二类别用户标记为第三类别用户。
5.根据权利要求4所述的基于大数据的网约车司机智能识别方法,其特征在于,所述根据移动用户识别模型检验所述第三类别用户的用户属性获得目标网约车用户,包括:
建立移动用户识别模型;
所述移动用户识别模型包括各类移动用户在各时间段、各区域内的移动数据信息;
所述移动数据信息包括交互频量值、覆盖范围值、栅格速率、栅格重复率以及用户活力值;
获取多个已知网约车用户在所述预设时间段和所述道路区域内的交互频量值、覆盖范围值、栅格速率以及栅格重复率;
分别将所述多个已知网约车用户的交互频量值、覆盖范围值、栅格速率以及栅格重复率输入所述移动用户识别模型得到每个所述已知网约车用户的用户活力值;
根据所述每个已知网约车用户的用户活力值进行平均化计算得到网约车用户活力均值;
将所述第三类别用户的交互频量值、覆盖范围值、栅格速率以及栅格重复率输入所述移动用户识别模型得到第三类别用户活力值;
根据所述第三类别用户活力值与所述网约车用户活力均值进行阈值对比;
根据所述阈值对比结果对所述第三类别用户进行属性判定,若判定通过,则将所述第三类别用户标记为目标网约车用户。
6.一种基于大数据的网约车司机智能识别系统,其特征在于,该系统包括:存储器及处理器,所述存储器中包括基于大数据的网约车司机智能识别方法的程序,所述基于大数据的网约车司机智能识别方法的程序被所述处理器执行时实现以下步骤:
获取道路区域内移动用户的特征数据信息;
根据所述移动用户的特征数据信息识别SIM卡用户并根据所述SIM卡用户在预设时间段内呼叫信息及路径表数据筛选出第一类别用户;
获取所述第一类别用户的手机信令数据,根据所述手机信令数据获取所述第一类别用户的IMSI基站交互信息数据包;
根据所述第一类别用户的IMSI基站交互信息数据包筛选出第二类别用户;
根据所述第二类别用户在预设时间切片内移动数据识别用户属性获得第三类别用户;
根据移动用户识别模型检验所述第三类别用户的用户属性获得目标网约车用户;
所述根据所述移动用户的特征数据信息识别SIM卡用户并根据所述SIM卡用户在预设时间段内呼叫信息及路径表数据筛选出第一类别用户,包括:
根据所述移动用户的特征数据信息中的话费套餐数据识别SIM卡用户;
获取所述SIM卡用户在工作日早晚高峰预设时间段内的呼叫信息,包括呼叫频次、每次通话时长以及每次通话对方SIM卡注册地址;
获取所述SIM卡用户在所述预设时间段内呼叫间隔的路径差值集成路径表数据;
根据所述SIM卡用户的呼叫信息和路径表数据获取寻呼特征值;
根据所述寻呼特征值与第一预设阈值对比筛选出第一类别用户;
所述根据所述第一类别用户的IMSI基站交互信息数据包筛选出第二类别用户,包括:
获取基站交互数据库;
所述基站交互数据库包括各类用户在各区域、各时段的IMSI基站交互数据集;
获取所述基站交互数据库中移动运营类用户在所述预设时间段内各道路区域内的IMSI基站交互数据集;
所述移动运营类用户的IMSI基站交互数据集包括交互频量阈值、覆盖范围阈值以及响应离散点信息阈值;
根据所述第一类别用户IMSI基站交互信息数据包的交互频量值、覆盖范围值以及响应离散点信息值与所述交互频量阈值、覆盖范围阈值以及响应离散点信息阈值进行阈值对比;
根据所述阈值对比结果中所述交互频量值、覆盖范围值以及响应离散点信息值均分别大于所述交互频量阈值、覆盖范围阈值以及响应离散点信息阈值的第一类别用户标记为第二类别用户。
7.一种可读存储介质,其特征在于,所述可读存储介质中包括基于大数据的网约车司机智能识别方法程序,所述基于大数据的网约车司机智能识别方法程序被处理器执行时,实现如权利要求1至5中任一项所述的一种基于大数据的网约车司机智能识别方法的步骤。
CN202210320903.2A 2022-03-30 2022-03-30 一种基于大数据的网约车司机智能识别方法、系统及可读存储介质 Active CN114422973B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210320903.2A CN114422973B (zh) 2022-03-30 2022-03-30 一种基于大数据的网约车司机智能识别方法、系统及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210320903.2A CN114422973B (zh) 2022-03-30 2022-03-30 一种基于大数据的网约车司机智能识别方法、系统及可读存储介质

Publications (2)

Publication Number Publication Date
CN114422973A CN114422973A (zh) 2022-04-29
CN114422973B true CN114422973B (zh) 2022-06-28

Family

ID=81264277

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210320903.2A Active CN114422973B (zh) 2022-03-30 2022-03-30 一种基于大数据的网约车司机智能识别方法、系统及可读存储介质

Country Status (1)

Country Link
CN (1) CN114422973B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115209342B (zh) * 2022-06-29 2023-06-06 北京融信数联科技有限公司 一种地铁司机识别方法、系统和可读存储介质
CN115002680B (zh) * 2022-07-28 2022-12-27 北京融信数联科技有限公司 基于手机信令的人群职业类型获取方法、系统和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110460962A (zh) * 2019-08-15 2019-11-15 智慧足迹数据科技有限公司 轨道交通用户识别方法和装置
CN110969861A (zh) * 2019-12-20 2020-04-07 中国移动通信集团黑龙江有限公司 一种车辆识别方法、装置、设备及计算机存储介质
CN111862606A (zh) * 2020-07-22 2020-10-30 南京瑞栖智能交通技术产业研究院有限公司 一种基于多源数据的非法营运车辆识别方法
WO2020238631A1 (zh) * 2019-05-31 2020-12-03 南京瑞栖智能交通技术产业研究院有限公司 一种基于手机信令数据的人群类型识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104699717B (zh) * 2013-12-10 2019-01-18 中国银联股份有限公司 数据挖掘方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020238631A1 (zh) * 2019-05-31 2020-12-03 南京瑞栖智能交通技术产业研究院有限公司 一种基于手机信令数据的人群类型识别方法
CN110460962A (zh) * 2019-08-15 2019-11-15 智慧足迹数据科技有限公司 轨道交通用户识别方法和装置
CN110969861A (zh) * 2019-12-20 2020-04-07 中国移动通信集团黑龙江有限公司 一种车辆识别方法、装置、设备及计算机存储介质
CN111862606A (zh) * 2020-07-22 2020-10-30 南京瑞栖智能交通技术产业研究院有限公司 一种基于多源数据的非法营运车辆识别方法

Also Published As

Publication number Publication date
CN114422973A (zh) 2022-04-29

Similar Documents

Publication Publication Date Title
CN114422973B (zh) 一种基于大数据的网约车司机智能识别方法、系统及可读存储介质
CN104301896B (zh) 诈骗短信智能监控告警系统和方法
CN107040894A (zh) 一种基于手机信令数据的居民出行od获取方法
CN110969861B (zh) 一种车辆识别方法、装置、设备及计算机存储介质
CN114741612B (zh) 一种基于大数据的消费习惯分类方法、系统和存储介质
CN106951446A (zh) 金融信息推送方法和装置
CN108924253A (zh) 基于车联网的天气预告方法及车联网系统
CN101430829A (zh) 一种基于gsm数据网进行交通疏导的方法及系统
CN106504524A (zh) 一种基于移动信令动态划分高速公路路段的方法
CN110167030B (zh) 识别骚扰电话的方法、装置、电子设备和存储介质
CN117391894A (zh) 一种巡逻机器人协同违章取证方法、系统及介质
CN109756887B (zh) 高铁伴随移动端识别方法、装置及计算机可读存储介质
CN110933601B (zh) 目标区域确定方法、装置、设备和介质
CN111275967B (zh) 一种基于智慧灯杆的建筑物活跃度计算方法及系统
CN114827921A (zh) 一种基于信令大数据的高速出行应用方法及系统
CN114463703A (zh) 一种共享单车停放管理系统及方法
CN115412854A (zh) 车辆同乘判断方法、装置、电子设备及存储介质
CN107067783A (zh) 基于交通事件推送的出行线路引导系统及方法
CN117435449B (zh) 一种用户画像分析方法、装置、电子设备及存储介质
CN111680718B (zh) 检测出租车非法聚集的方法、系统及计算机可读存储介质
CN115438824B (zh) 地铁站入站耗时的预测方法及计算机可读存储介质
CN109637133A (zh) 一种城市道路/路段的车辆速度评估方法及系统
CN107945298A (zh) 路径标识、识别方法、复合通行卡、控制器、系统、服务器
CN112615966B (zh) 一种猫池终端识别方法
CN115209342B (zh) 一种地铁司机识别方法、系统和可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant