CN110876112B - 高速用户的识别方法、装置和计算机可读存储介质 - Google Patents

高速用户的识别方法、装置和计算机可读存储介质 Download PDF

Info

Publication number
CN110876112B
CN110876112B CN201810920310.3A CN201810920310A CN110876112B CN 110876112 B CN110876112 B CN 110876112B CN 201810920310 A CN201810920310 A CN 201810920310A CN 110876112 B CN110876112 B CN 110876112B
Authority
CN
China
Prior art keywords
base station
user
speed user
passing
speed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810920310.3A
Other languages
English (en)
Other versions
CN110876112A (zh
Inventor
陆中远
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Corp Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN201810920310.3A priority Critical patent/CN110876112B/zh
Publication of CN110876112A publication Critical patent/CN110876112A/zh
Application granted granted Critical
Publication of CN110876112B publication Critical patent/CN110876112B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/025Services making use of location information using location based information parameters
    • H04W4/027Services making use of location information using location based information parameters using movement velocity, acceleration information

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Devices For Checking Fares Or Tickets At Control Points (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本公开涉及一种高速用户的识别方法、装置和计算机可读存储介质,涉及移动通信技术领域。该方法包括:获取待识别话单中用户在单位时间内途经的基站数;将基站数大于第一阈值的用户确定为高速用户样本;提取待识别话单中的待识别用户的用户信息、位置移动信息和在单位时间内的途经基站信息;将用户信息、途经基站信息和位置移动信息输入机器学习模型,以确定待识别用户是否为疑似高速用户;通过比较疑似高速用户途经不同基站的时间差和高速用户样本途经不同基站的时间差,确定疑似高速用户是否为高速用户。本公开的技术方案能够扩大适用范围、提高识别的准确率。

Description

高速用户的识别方法、装置和计算机可读存储介质
技术领域
本公开涉及移动通信技术领域,特别涉及一种高速用户的识别方法、高速用户的识别装置和计算机可读存储介质。
背景技术
五高场景(高铁、高速、高校、高价值、高密度)下的无线网络建设和优化是运营商在无线领域的重点课题。如何识别跟踪高速典型场景下用户(即高速用户),以对高速场景的网络覆盖和质量进行评估,决定了运营商是否能提供更好的无线网络服务。
在相关技术中,通过定期路测来获取高速沿线的信号覆盖和感知情况;或者通过站台的车次、位置信息进行预过滤;或者采用固定的速度阈值进行用户筛选和识别;或者通过对接外部票务系统进行高速用户识别。
发明内容
本公开的发明人发现上述相关技术中存在如下问题:依赖外部数据和设施的支持,导致适用范围小;仅通过速度进行识别,导致识别准确率低。
鉴于此,本公开提出了一种高速用户的识别技术方案,能够扩大适用范围、提高识别准确率。
根据本公开的一些实施例,提供了一种高速用户的识别方法,包括:获取待识别话单中用户在单位时间内途经的基站数;将所述基站数大于第一阈值的用户确定为高速用户样本;提取所述待识别话单中的待识别用户的用户信息、位置移动信息和在单位时间内的途经基站信息;将所述用户信息、所述途经基站信息和所述位置移动信息输入机器学习模型,以确定所述待识别用户是否为疑似高速用户;通过比较所述疑似高速用户途经不同基站的时间差和所述高速用户样本途经不同基站的时间差,确定所述疑似高速用户是否为高速用户。
在一些实施例中,还通过比较所述疑似高速用户途经不同基站的顺序和不同基站的预设排列顺序,确定所述疑似高速用户是否为高速用户。
在一些实施例中,将所述待识别话单中的各基站组合为多个基站对,所述基站对中包括两个不同基站;获取所述高速用户样本途经各基站对的时间差;计算多个所述高速用户样本途经所述各基站对的时间差的均值和方差;根据所述时间差的均值和方差,确定所述各基站对的时间差范围;在所述疑似高速用户途经基站对的时间差落在该基站对的所述时间差范围内的情况下,将该基站对确定为匹配基站对。
在一些实施例中,在所述疑似高速用户途经基站对中两个基站的顺序与这两个基站的预设排列顺序一致的情况下,将该基站对确定为正序基站对;在所述匹配基站对的数量与途经总数的比值大于第二阈值,且所述正序基站对的数量与所述途经总数的比值大于第三阈值的情况下,确定所述疑似高速用户为高速用户,所述途经总数为所述疑似高速用户途经基站对的总数;或者在所述匹配基站对的数量与所述途经总数的比值大于所述第二阈值,且所述正序基站对的数量与所述途经总数的比值小于第四阈值的情况下,确定所述疑似高速用户为高速用户,所述第四阈值小于所述第三阈值。
在一些实施例中,该方法还包括:按照经纬度将高速路段所在区域划分为多个栅格;确定各栅格内主小区的ID以获取基站列表;提取所述基站列表中基站的话单作为所述待识别话单。
在一些实施例中,所述用户信息包括:是否为外省用户;所述途经基站信息包括:经过的高铁基站数量、经过的非高铁基站数量、经过的高铁基站数量占比、经过的基站数中的多项;所述位置移动信息包括:最大经纬度偏移距离、在单位时间内的最大经纬度偏移。
在一些实施例中,将所述基站数小于第五阈值的用户确定为低速用户样本,所述第五阈值小于所述第一阈值;其中,所述机器学习模型以所述待识别话单中的各用户的所述用户信息、所述位置移动信息和所述在单位时间内的途经基站信息为输入,以高速用户或低速用户为输出,以所述高速用户样本和所述低速用户样本为验证依据进行训练。
根据本公开的另一些实施例,提供一种高速用户的识别装置,包括:获取单元,用于获取待识别话单中用户在单位时间内途经的基站数;提取单元,用于提取所述待识别话单中的待识别用户的用户信息、位置移动信息和在单位时间内的途经基站信息;确定单元,用于将所述基站数大于第一阈值的用户确定为高速用户样本,将所述用户信息、所述途经基站信息和所述位置移动信息输入机器学习模型,以确定所述待识别用户是否为疑似高速用户,通过比较所述疑似高速用户途经不同基站的时间差和所述高速用户样本途经不同基站的时间差,确定所述疑似高速用户是否为高速用户。
在一些实施例中,所述确定单元还通过比较所述疑似高速用户途经不同基站的顺序和不同基站的预设排列顺序,确定所述疑似高速用户是否为高速用户。
在一些实施例中,该装置还包括:组合单元,用于将所述待识别话单中的各基站组合为多个基站对,所述基站对中包括两个不同基站;其中,所述获取单元获取所述高速用户样本途经各基站对的时间差;所述确定单元计算多个所述高速用户样本途经所述各基站对的时间差的均值和方差,根据所述时间差的均值和方差,确定所述各基站对的时间差范围,在所述疑似高速用户途经基站对的时间差落在该基站对的所述时间差范围内的情况下,将该基站对确定为匹配基站对。
在一些实施例中,所述确定单元还用于执行如下步骤:在所述疑似高速用户途经基站对中两个基站的顺序与所述高速用户样本途经该基站对中两个基站的顺序一致的情况下,将该基站对确定为正序基站对;在所述匹配基站对的数量与途经总数的比值大于第二阈值,且所述正序基站对的数量与所述途经总数的比值大于第三阈值的情况下,确定所述疑似高速用户为高速用户,所述途经总数为所述疑似高速用户途经基站对的总数;或者在所述匹配基站对的数量与所述途经总数的比值大于所述第二阈值,且所述正序基站对的数量与所述途经总数的比值小于第四阈值的情况下,确定所述疑似高速用户为高速用户,所述第四阈值小于所述第三阈值。
在一些实施例中,该装置还包括:划分单元用于按照经纬度将高速路段所在区域划分为多个栅格;其中,所述获取单元确定各栅格内主小区的ID以获取基站列表,提取所述基站列表中基站的话单作为所述待识别话单。
在一些实施例中,将所述基站数小于第五阈值的用户确定为低速用户样本,所述第五阈值小于所述第一阈值;其中,所述机器学习模型以所述待识别话单中的各用户的所述用户信息、所述位置移动信息和所述在单位时间内的途经基站信息为输入,以高速用户或低速用户为输出,以所述高速用户样本和所述低速用户样本为验证依据进行训练。
根据本公开的又一些实施例,提供一种高速用户的识别装置,包括:存储器;和耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器装置中的指令,执行上述任一个实施例中的高速用户的识别方法中的一个或多个步骤。
根据本公开的再一些实施例,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一个实施例中的高速用户的识别方法中的一个或多个步骤。
在上述实施例中,无需依赖外部数据和设施,通过话单中的相关信息即可识别高速用户,从而扩大了适用范围;利用机器学习模型和高速用户样本的统计特性对高速用户进行双重识别,从而提高了识别的准确率。
附图说明
构成说明书的一部分的附图描述了本公开的实施例,并且连同说明书一起用于解释本公开的原理。
参照附图,根据下面的详细描述,可以更加清楚地理解本公开,其中:
图1示出本公开的高速用户的识别方法的一些实施例的流程图;
图2示出本公开的待识别话单的获取方法的一些实施例的流程图;
图3示出图1中的步骤150的一些实施例的流程图;
图4示出图1中的步骤150的另一些实施例的流程图;
图5示出本公开的高速用户的识别装置的一些实施例的框图;
图6示出本公开的高速用户的识别装置的另一些实施例的框图;
图7示出本公开的高速用户的识别装置的又一些实施例的框图。
具体实施方式
现在将参照附图来详细描述本公开的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。
在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
图1示出本公开的高速用户的识别方法的一些实施例的流程图。
如图1所示,该方法包括:步骤110,获取途经的基站数;步骤120,确定高速用户样本;步骤130,提取相关信息;步骤140,确定疑似高速用户;和步骤150,确定高速用户。
在步骤110中,获取待识别话单中用户在单位时间内途经的基站数。例如,待识别话单可以是XDR(External Data Representation,外部数据表示法)话单,XDR话单包含的信息较全面,这样能够对没有发生过语音或互联网业务的用户进行识别,从而提高识别率、扩大适用范围。
在一些实施例中,可以提取待识别话单中各用户途经的基站,按时间顺序对途经的基站进行排序,并统计各用户在单位时间内容(例如,一小时内)途经的基站数量。
在一些实施例中,可以获取高速路段所在区域的基站列表,提取基站列表中基站的话单作为待识别话单。高速路段可以是用户进行高速移动的路段,高速用户可以是进行高速移动的用户。例如,高速路段所在区域可以是高铁、高速公路、地铁、城铁等高速场景,高速用户是在这些高速场景下的用户。例如,待识别话单中可以包括各用户的MSISDN(Mobile Subscriber International ISDN/PSTN number,移动用户号码)、用户接入的ECGI(E-UTRAN Cell Global Identifier,演进型-通用移动通信系统陆地无线接入网小区全局标识符)和话单发生时间。
在一些实施例中,可以通过图2中的步骤获取待识别话单。
图2示出本公开的待识别话单的获取方法的一些实施例的流程图。
如图2所示,该方法包括:步骤101,划分栅格;步骤102,获取基站列表;和步骤103,获取待识别话单。
在步骤101中,按照经纬度将高速路段所在区域划分为多个栅格。例如,栅格的大小可以设置为20×20m2至50×50m2
在步骤102中,确定各栅格内主小区的ID以获取基站列表。例如,可以根据携带AGPS(Assisted Global Positioning System,辅助全球卫星定位系统)经纬度的MRO(Mobility Robustness Optimization,移动鲁棒性优化)数据,获取各栅格内的主小区的ECGI,根据ECGI生成高速路段所在区域中所有基站的基站列表。例如,MRO数据是由用户终端测量并上报的无线信号拨测数据,携带AGPS经纬度的MRO数据可以包括:测量时终端的经纬度,测量时基站的ECGI、信号测量值等字段。
在步骤103中,提取基站列表中基站的话单作为待识别话单。例如,可以在现网的无线DPI(Deep Packet Inspection,深度报文检测)设备里提取用户信令面和控制面的所有XDR话单;然后,采集出基站列表中各ECGI下的所有用户当天的所有XDR话单作为待识别话单。
在上述实施例中,相较于相关技术采用的根据基站本身覆盖范围的经纬度获取基站列表的方式,通过划分栅格提取基站列表能够提高基站列表中包含基站的准确性。
这是因为,基站小区的无线覆盖范围各不相同(例如,室分基站覆盖范围很小),如果按基站最大覆盖范围获取基站列表,可能道路两侧2000米范围的小区都要纳入小区列表,从而导致准确性低。而且,同一经纬度的不同小区的方向角也不同,背对着道路的小区为无效小区,侧对道路的小区也可能为无效小区,从而导致相关技术提取的基站列表误差较大。
通过上面的实施例获取了待识别话单及其记录的途径基站数后,就可以通过图1中的步骤120-150识别高速用户了。
在步骤120中,在基站数大于第一阈值的情况下,将用户确定为高速用户样本。
在一些实施例中,还可以设置第五阈值,第五阈值小于第一阈值。在基站数大于第一阈值的情况下,将用户确定为高速用户样本;在基站数小于第五阈值的情况下,将用户确定为低速用户样本。
在步骤130中,提取待识别话单中的待识别用户的用户信息、位置移动信息和在单位时间内的途经基站信息。待识别用户可以是待识别话单中高速用户样本以外的用户,也可以是待识别话单中高速用户样本和低速用户样本以外的用户。用户信息可以是标识用户所在地的信息,途经基站信息可以是标识用户途经的基站数量、高速路段的基站数量的信息。
例如,用户信息可以包括是否为外省用户,途经基站信息可以包括经过的高铁基站数量、经过的非高铁基站数量、经过的高铁基站数量占比、经过的基站数中的多项,位置移动信息可以包括最大经纬度偏移距离、在单位时间内的最大经纬度偏移。
在一些实施例中,以待识别话单中的各用户的用户信息、位置移动信息和在单位时间内的途经基站信息为输入,以是否为高速用户或低速用户为输出,以高速用户样本(标记为正样本)和低速用户样本(标记为负样本)为验证依据训练机器学习模型。
例如,可以设置最低查全率(例如,95%)作为训练基线来训练机器学习模型。还可以选取FAR-FRR(False Acceptance Rate-False Rejection Rate,误识率-拒识别率)低的机器学习模型进行训练。例如,可以将机器学习模型的FAR-FRR曲线作为ROC(ReceiverOperator characteristic Curve,受试者工作特征曲线),选取ROC的AUC(Area UnderCurve,曲线下面积)值小的机器学习模型。
这样,正样本和负样本可以标记出明显是高速或低速的用户,再以用户的多维度信息为输入训练机器学习模型能够提高机器学习模型的准确度,从而提高高速用户识别的准确度。
在步骤140中,将用户信息、途经基站信息和位置移动信息输入机器学习模型,以确定待识别用户是否为疑似高速用户。这样,可以剔除一部分较为明显的非高速用户,筛选出疑似高速用户进行进一步识别,从而提高识别准确率。
在步骤150中,通过比较疑似高速用户途经不同基站的时间差和高速用户样本途经不同基站的时间差,确定疑似高速用户是否为高速用户。
在一些实施例中,可以通过图3中的步骤比较途经不同基站的时间差。
图3示出图1中的步骤150的一些实施例的流程图。
如图3所示,步骤150包括:步骤1510,组合基站对;步骤1520,获取时间差;步骤1530,计算均值和方差;步骤1540,确定时间差范围;和步骤1550,确定匹配基站对。
在步骤1510中,将待识别话单中的各基站组合为多个基站对,基站对中包括两个不同基站。
在一些实施例中,待识别话单中共有M个基站,这些基站的小区分别覆盖一个或多个栅格。将这M个基站两两配对,以形成多个基站对。
在一些实施例中,可以按照设置的栅格排列顺序(例如,按照高速路段在一定方向上的延伸顺序设置栅格的顺序),预设各基站的排列顺序,即对这些基站小区进行排序编码。例如,覆盖起点栅格的基站小区的编码为0,按照栅格的排列顺序连续编码,直到覆盖最后一个栅格的基站小区的编码为M-1。例如,排序编码过程中如果遇到之前编码过的重复的基站小区(同一基站小区覆盖多个栅格),则跳过该小区继续编码。这样,相当于设置了一个参考移动方向,为用户的移动方向的判断提供可靠标准。
在步骤1520中,获取高速用户样本途经各基站对的时间差。例如,可以提取各高速用户样本在这M个基站的小区内产生的话单,从话单中提取各高速用户样本途经各基站对的时间差。
在一些实施例中,高速用户样本共有K个,对于基站Bi和基站Bj组成的基站对(Bi,Bj),高速用户样本k从基站Bi移动到基站Bj的时间差为Tij,0≤i≤M-1,0≤j≤M-1,0≤k≤K。
在步骤1530中,计算多个高速用户样本途经各基站对的时间差的均值和方差。例如,K个高速用户样本途经基站对(Bi,Bj)的时间差均值为
Figure BDA0001764036740000091
标准差为σij
在步骤1540中,根据时间差的均值和方差,确定各基站对的时间差范围。例如,可以确定基站对(Bi,Bj)的时间差范围为:
Figure BDA0001764036740000101
p和q均为大于等于1的整数,例如p=1、q=3。这个时间差范围可以表征高速用户途经基站对(Bi,Bj)所用的时间,可以作为识别高速用户的依据。
在一些实施例中,可以建立时间差范围矩阵UT,UT为M×M维矩阵,UT中的元素
Figure BDA0001764036740000102
在步骤1550中,在疑似高速用户途经基站对的时间差落在该基站对的时间差范围内的情况下,将该基站对确定为匹配基站对。在一些实施例中,如果匹配基站对的数量大于预设阈值,则判断疑似高速用户为高速用户。
在一些实施例中,可以建立疑似高速用户的时间差矩阵VT,VT为M×M维矩阵,VT中的元素VT(i,j)为疑似高速用户途经基站对(Bi,Bj)的时间差tij。例如,可以从待识别话单中获取tij,如果疑似高速用户没有产生途经基站对(Bi,Bj)的话单,则tij=0。例如,可以比较VT中的元素是否落入UT中相应元素的时间差范围内,从而获取匹配基站对的数量。
在一些实施例中,可以计算匹配基站对的数量与疑似高速用户途经基站对的总数(即VT中非零元素的数量)的比值,将该比值与预设阈值比较,如果大于预设阈值则将该疑似高速用户确定为高速用户。
在一些实施例中,在步骤1550后也可以通过图4中的步骤确定疑似高速用户是否为高速用户。
图4示出图1中的步骤150的另一些实施例的流程图。
如图4所示,在图3的基础上步骤150还包括:步骤1560,确定正序基站对;和步骤1570,确定高速用户。
在步骤1560中,在疑似高速用户途经基站对中两个基站的顺序与该两个基站的预设排列顺序一致的情况下,将该基站对确定为正序基站对。
在一些实施例中,如上所述,在预设排列顺序中基站编号越大排序越靠后。可以建立基站的预设排列顺序矩阵UR,UR为M×M维矩阵,如果i≥j,则UR中的元素UR(i,j)=1;如果i<j,则UR中的元素UR(i,j)=-1。
还可以建立疑似高速用户的途经顺序矩阵VR,VR为M×M维矩阵。对于VR中的元素VR(i,j),如果疑似高速用户途径Bi的时间τi大于(晚于)途经Bj的时间τj,则VR(i,j)=1;如果疑似高速用户途径Bi的时间τi小于(早于)途经Bj的时间τj,则VR(i,j)=-1;如果疑似高速用户不存在从Bi到Bj的话单,则VR(i,j)=0。
在一些实施例中,可以统计VR中的元素与UR中的相应元素相等的数量作为正序基站对的数量。计算正序基站对的数量与疑似高速用户途经基站对的总数(即VR或VT中非零元素的数量)的比值。
在步骤1570中,在匹配基站对的数量与途经总数的比值大于第二阈值,且正序基站对的数量与途经总数的比值大于第三阈值的情况下,确定疑似高速用户为高速用户。例如,第二阈值可以为50%,第三阈值可以为80%。正序基站对的数量与途经总数的比值大于第三阈值说明疑似高速用户的移动方向与预设的基站排列顺序基本相同,没有在基站间作往复移动,因此可以确定为高速用户。
在匹配基站对的数量与途经总数的比值大于第二阈值,且正序基站对的数量与途经总数的比值小于第四阈值的情况下,确定疑似高速用户为高速用户,第四阈值小于所述第三阈值。例如,第四阈值可以为20%。正序基站对的数量与途经总数的比值小于第三阈值说明疑似高速用户的移动方向与预设的基站排列顺序基本相反,没有在基站间作往复移动,因此可以确定为高速用户。
在上述实施例中,无需依赖外部数据和设施,通过话单中的相关信息即可识别高速用户,从而扩大了适用范围;利用机器学习模型和高速用户样本的统计特性对高速用户进行双重识别,从而提高了识别的准确率。
图5示出本公开的高速用户的识别装置的一些实施例的框图。
如图5所示,识别装置5包括:获取单元51、提取单元52和确定单元53。
获取单元51获取待识别话单中用户在单位时间内途经的基站数。在一些实施例中,识别装置5还包括划分单元55,用于按照经纬度将高速路段所在区域划分为多个栅格,。获取单元51确定各栅格内主小区的ID以获取基站列表,提取基站列表中基站的话单作为待识别话单。
提取单元52提取待识别话单中的待识别用户的用户信息、位置移动信息和在单位时间内的途经基站信息。
确定单元53在基站数大于第一阈值的情况下,将用户确定为高速用户样本,将用户信息、途经基站信息和位置移动信息输入机器学习模型,以确定待识别用户是否为疑似高速用户,通过比较疑似高速用户途经不同基站的时间差和高速用户样本途经不同基站的时间差,确定疑似高速用户是否为高速用户。
在一些实施例中,确定单元53还通过比较疑似高速用户途经不同基站的顺序和高速用户样本途经不同基站的顺序,确述疑似高速用户是否为高速用户。
在一些实施例中,识别装置5还包括组合单元,用于将待识别话单中的各基站组合为多个基站对,基站对中包括两个不同基站。获取单元51获取高速用户样本途经各基站对的时间差。确定单元53计算多个高速用户样本途经各基站对的时间差的均值和方差,根据时间差的均值和方差,确定各基站对的时间差范围,在疑似高速用户途经基站对的时间差落在该基站对的时间差范围内的情况下,将该基站对确定为匹配基站对。
在一些实施例中,在疑似高速用户途经基站对中两个基站的顺序与该两个基站的预设排列顺序一致的情况下,确定单元53将该基站对确定为正序基站对。
在匹配基站对的数量与途经总数的比值大于第二阈值,且正序基站对的数量与途经总数的比值大于第三阈值的情况下,确定单元53确定疑似高速用户为高速用户。
在匹配基站对的数量与途经总数的比值大于第二阈值,且正序基站对的数量与途经总数的比值小于第四阈值的情况下,确定单元53确定疑似高速用户为高速用户。
在一些实施例中,确定单元在基站数小于第五阈值的情况下,将用户确定为低速用户样本,用以训练机器学习模型。
在上述实施例中,无需依赖外部数据和设施,通过话单中的相关信息即可识别高速用户,从而扩大了适用范围;利用机器学习模型和高速用户样本的统计特性对高速用户进行双重识别,从而提高了识别的准确率。
图6示出本公开的高速用户的识别装置的另一些实施例的框图。
如图6所示,该实施例的高速用户的识别装置6包括:存储器61以及耦接至该存储器61的处理器62,处理器62被配置为基于存储在存储器61中的指令,执行本公开中任意一个实施例中的高速用户的识别方法中的一个或多个步骤。
其中,存储器61例如可以包括系统存储器、固定非易失性存储介质等。系统存储器例如存储有操作系统、应用程序、引导装载程序(Boot Loader)、数据库以及其他程序等。
图7示出本公开的高速用户的识别装置的又一些实施例的框图。
如图7所示,该实施例的高速用户的识别装置7包括:存储器710以及耦接至该存储器710的处理器720,处理器720被配置为基于存储在存储器710中的指令,执行前述任意一个实施例中的高速用户的识别方法。
存储器710例如可以包括系统存储器、固定非易失性存储介质等。系统存储器例如存储有操作系统、应用程序、引导装载程序(Boot Loader)以及其他程序等。
高速用户的识别装置7还可以包括输入输出接口730、网络接口740、存储接口750等。这些接口730、740、750以及存储器710和处理器720之间例如可以通过总线760连接。其中,输入输出接口730为显示器、鼠标、键盘、触摸屏等输入输出设备提供连接接口。网络接口740为各种联网设备提供连接接口。存储接口740为SD卡、U盘等外置存储设备提供连接接口。
本领域内的技术人员应当明白,本公开的实施例可提供为方法、系统、或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
至此,已经详细描述了根据本公开的高速用户的识别方法、高速用户的识别装置和计算机可读存储介质。为了避免遮蔽本公开的构思,没有描述本领域所公知的一些细节。本领域技术人员根据上面的描述,完全可以明白如何实施这里公开的技术方案。
可能以许多方式来实现本公开的方法和系统。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和系统。用于所述方法的步骤的上述顺序仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。
虽然已经通过示例对本公开的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上示例仅是为了进行说明,而不是为了限制本公开的范围。本领域的技术人员应该理解,可在不脱离本公开的范围和精神的情况下,对以上实施例进行修改。本公开的范围由所附权利要求来限定。

Claims (16)

1.一种高速用户的识别方法,包括:
获取待识别话单中用户在单位时间内途经的基站数;
将所述基站数大于第一阈值的用户确定为高速用户样本;
提取所述待识别话单中的待识别用户的用户信息、位置移动信息和在单位时间内的途经基站信息;
将所述用户信息、所述途经基站信息和所述位置移动信息输入机器学习模型,以确定所述待识别用户是否为疑似高速用户;
通过比较所述疑似高速用户途经不同基站的时间差和所述高速用户样本途经不同基站的时间差,确定所述疑似高速用户是否为高速用户。
2.根据权利要求1所述的识别方法,其中,所述确定所述疑似高速用户是否为高速用户包括:
还通过比较所述疑似高速用户途经不同基站的顺序和不同基站的预设排列顺序,确定所述疑似高速用户是否为高速用户。
3.根据权利要求1或2所述的识别方法,其中,所述比较所述疑似高速用户途经不同基站的时间差和所述高速用户样本途经不同基站的时间差包括:
将所述待识别话单中的各基站组合为多个基站对,所述基站对中包括两个不同基站;
获取所述高速用户样本途经各基站对的时间差;
计算多个所述高速用户样本途经所述各基站对的时间差的均值和方差;
根据所述时间差的均值和方差,确定所述各基站对的时间差范围;
在所述疑似高速用户途经基站对的时间差落在该基站对的所述时间差范围内的情况下,将该基站对确定为匹配基站对。
4.根据权利要求3所述的识别方法,其中,所述确定所述疑似高速用户是否为高速用户包括:
在所述疑似高速用户途经基站对中两个基站的顺序与这两个基站的预设排列顺序一致的情况下,将该基站对确定为正序基站对;
在所述匹配基站对的数量与途经基站对的总数的比值大于第二阈值,且所述正序基站对的数量与所述途经基站对的总数的比值大于第三阈值的情况下,确定所述疑似高速用户为高速用户,所述途经基站对的总数为所述疑似高速用户途经基站对的总数;或者
在所述匹配基站对的数量与所述途经基站对的总数的比值大于所述第二阈值,且所述正序基站对的数量与所述途经基站对的总数的比值小于第四阈值的情况下,确定所述疑似高速用户为高速用户,所述第四阈值小于所述第三阈值。
5.根据权利要求1或2所述的识别方法,还包括:
按照经纬度将高速路段所在区域划分为多个栅格;
确定各栅格内主小区的ID以获取基站列表;
提取所述基站列表中基站的话单作为所述待识别话单。
6.根据权利要求1或2所述的识别方法,其中,
所述用户信息包括:是否为外省用户;
所述途经基站信息包括:经过的高铁基站数量、经过的非高铁基站数量、经过的高铁基站数量占比、经过的基站数中的多项;
所述位置移动信息包括:最大经纬度偏移距离、在单位时间内的最大经纬度偏移。
7.根据权利要求1或2所述的识别方法,还包括:
将所述基站数小于第五阈值的用户确定为低速用户样本,所述第五阈值小于所述第一阈值;
其中,所述机器学习模型以所述待识别话单中的各用户的所述用户信息、所述位置移动信息和所述在单位时间内的途经基站信息为输入,以高速用户或低速用户为输出,以所述高速用户样本和所述低速用户样本为验证依据进行训练。
8.一种高速用户的识别装置,包括:
获取单元,用于获取待识别话单中用户在单位时间内途经的基站数;
提取单元,用于提取所述待识别话单中的待识别用户的用户信息、位置移动信息和在单位时间内的途经基站信息;
确定单元,用于将所述基站数大于第一阈值的用户确定为高速用户样本,将所述用户信息、所述途经基站信息和所述位置移动信息输入机器学习模型,以确定所述待识别用户是否为疑似高速用户,通过比较所述疑似高速用户途经不同基站的时间差和所述高速用户样本途经不同基站的时间差,确定所述疑似高速用户是否为高速用户。
9.根据权利要求8所述的识别装置,其中,
所述确定单元还通过比较所述疑似高速用户途经不同基站的顺序和不同基站的预设排列顺序,确定所述疑似高速用户是否为高速用户。
10.根据权利要求8或9所述的识别装置,还包括:
组合单元,用于将所述待识别话单中的各基站组合为多个基站对,所述基站对中包括两个不同基站;
其中,所述获取单元获取所述高速用户样本途经各基站对的时间差;
所述确定单元计算多个所述高速用户样本途经所述各基站对的时间差的均值和方差,根据所述时间差的均值和方差,确定所述各基站对的时间差范围,在所述疑似高速用户途经基站对的时间差落在该基站对的所述时间差范围内的情况下,将该基站对确定为匹配基站对。
11.根据权利要求10所述的识别装置,其中,
所述确定单元用于执行如下步骤:
在所述疑似高速用户途经基站对中两个基站的顺序与这两个基站的预设排列顺序一致的情况下,将该基站对确定为正序基站对;
在所述匹配基站对的数量与途经基站对的总数的比值大于第二阈值,且所述正序基站对的数量与所述途经基站对的总数的比值大于第三阈值的情况下,确定所述疑似高速用户为高速用户,所述途经基站对的总数为所述疑似高速用户途经基站对的总数;或者
在所述匹配基站对的数量与所述途经基站对的总数的比值大于所述第二阈值,且所述正序基站对的数量与所述途经基站对的总数的比值小于第四阈值的情况下,确定所述疑似高速用户为高速用户,所述第四阈值小于所述第三阈值。
12.根据权利要求8或9所述的识别装置,还包括:
划分单元用于按照经纬度将高速路段所在区域划分为多个栅格;
其中,所述获取单元确定各栅格内主小区的ID以获取基站列表,提取所述基站列表中基站的话单作为所述待识别话单。
13.根据权利要求8或9所述的识别装置,其中,
所述用户信息包括:是否为外省用户;
所述途经基站信息包括:经过的高铁基站数量、经过的非高铁基站数量、经过的高铁基站数量占比、经过的基站数中的多项;
所述位置移动信息包括:最大经纬度偏移距离、在单位时间内的最大经纬度偏移。
14.根据权利要求8或9所述的识别装置,其中,
将所述基站数小于第五阈值的用户确定为低速用户样本,所述第五阈值小于所述第一阈值;
其中,所述机器学习模型以所述待识别话单中的各用户的所述用户信息、所述位置移动信息和所述在单位时间内的途经基站信息为输入,以高速用户或低速用户为输出,以所述高速用户样本和所述低速用户样本为验证依据进行训练。
15.一种高速用户的识别装置,包括:
存储器;和
耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器装置中的指令,执行权利要求1-7任一项所述的高速用户的识别方法中的一个或多个步骤。
16.一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现权利要求1-7任一项所述的高速用户的识别方法中的一个或多个步骤。
CN201810920310.3A 2018-08-14 2018-08-14 高速用户的识别方法、装置和计算机可读存储介质 Active CN110876112B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810920310.3A CN110876112B (zh) 2018-08-14 2018-08-14 高速用户的识别方法、装置和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810920310.3A CN110876112B (zh) 2018-08-14 2018-08-14 高速用户的识别方法、装置和计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN110876112A CN110876112A (zh) 2020-03-10
CN110876112B true CN110876112B (zh) 2021-04-06

Family

ID=69714226

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810920310.3A Active CN110876112B (zh) 2018-08-14 2018-08-14 高速用户的识别方法、装置和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN110876112B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111624640B (zh) * 2020-04-24 2023-02-24 汉海信息技术(上海)有限公司 定位方法、装置、电子设备及存储介质
CN112182132B (zh) * 2020-09-28 2024-03-26 北京红山信息科技研究院有限公司 一种地铁用户的识别方法、系统、设备和存储介质
CN114363405B (zh) * 2021-05-26 2023-09-22 科大国创云网科技有限公司 基于上网话单与mr用户轨迹的司机群体识别方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105636104A (zh) * 2014-10-27 2016-06-01 北京市天元网络技术股份有限公司 移动通信网络中高速移动用户通话识别的方法及系统
CN106131865A (zh) * 2016-07-19 2016-11-16 浪潮软件集团有限公司 一种基于高铁沿线的网络质量分析方法
CN106157657A (zh) * 2015-04-14 2016-11-23 香港生产力促进局 一种移动用户的运动状态识别系统及其方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9414276B2 (en) * 2011-12-31 2016-08-09 Telefonaktiebolaget L M Ericsson (Publ) Mobility management method and apparatus in high speed railway
CN104217608B (zh) * 2013-05-29 2018-02-23 星贝瑞有限公司 基于公交工具的信息服务方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105636104A (zh) * 2014-10-27 2016-06-01 北京市天元网络技术股份有限公司 移动通信网络中高速移动用户通话识别的方法及系统
CN106157657A (zh) * 2015-04-14 2016-11-23 香港生产力促进局 一种移动用户的运动状态识别系统及其方法
CN106131865A (zh) * 2016-07-19 2016-11-16 浪潮软件集团有限公司 一种基于高铁沿线的网络质量分析方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于数据挖掘的手机用户出行方式识别研究;李振邦等;《黑龙江科技信息》;20141205;全文 *

Also Published As

Publication number Publication date
CN110876112A (zh) 2020-03-10

Similar Documents

Publication Publication Date Title
CN108156626B (zh) 轨道交通无线网络质量评估方法、装置及介质
CN110876112B (zh) 高速用户的识别方法、装置和计算机可读存储介质
CN109996278B (zh) 道路网络质量评估方法、装置、设备及介质
CN109492788B (zh) 预测人流量以及建立人流量预测模型的方法及相关设备
CN107040894A (zh) 一种基于手机信令数据的居民出行od获取方法
CN107767669A (zh) 基于WiFi和蓝牙识别的公交线路客流OD估计方法
CN110781711A (zh) 目标对象识别方法、装置、电子设备及存储介质
JP2012198870A (ja) ユーザ行動認識装置および方法
CN113537172B (zh) 人群密度确定方法、装置、设备及存储介质
CN104408923B (zh) 交通状态评估方法和装置
CN112651307B (zh) 一种人员轨迹追踪方法、系统、装置及存储介质
CN109995566A (zh) 网络故障定位方法、装置、设备及介质
CN111222381A (zh) 用户出行方式识别方法、装置、电子设备及存储介质
CN111866776A (zh) 一种基于手机信令数据的人口测算方法及装置
CN106934773A (zh) 视频运动目标与Mac地址匹配方法
US20120218150A1 (en) Management server, population information calculation management server, non-populated area management method, and population information calculation method
CN110377687A (zh) 用户出行方式判别方法、装置和服务器
CN108770057B (zh) 预定指纹库的确定方法及指纹定位方法、装置、存储介质
CN115665665A (zh) 移动路径识别方法、识别装置、电子设备和可读存储介质
Ghorpade et al. An integrated stop-mode detection algorithm for real world smartphone-based travel survey
CN112214677A (zh) 一种兴趣点推荐方法、装置、电子设备及存储介质
CN114501336B (zh) 一种公路出行量测算方法、装置、电子设备及存储介质
CN110781256A (zh) 基于发送位置数据确定与Wi-Fi相匹配的POI的方法及装置
CN109994128B (zh) 语音质量问题定位方法、装置、设备及介质
CN108573265B (zh) 人流量统计方法及统计系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant