CN114302333A - 用户识别方法及装置、电子设备及介质 - Google Patents

用户识别方法及装置、电子设备及介质 Download PDF

Info

Publication number
CN114302333A
CN114302333A CN202111619404.5A CN202111619404A CN114302333A CN 114302333 A CN114302333 A CN 114302333A CN 202111619404 A CN202111619404 A CN 202111619404A CN 114302333 A CN114302333 A CN 114302333A
Authority
CN
China
Prior art keywords
user
type
data
target
track
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111619404.5A
Other languages
English (en)
Inventor
谭志远
候继江
康晨
孟繁骥
高智衡
宫云平
陈喜洲
陈园光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Corp Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN202111619404.5A priority Critical patent/CN114302333A/zh
Publication of CN114302333A publication Critical patent/CN114302333A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Traffic Control Systems (AREA)

Abstract

本公开关于一种用户识别方法及装置、电子设备及介质,涉及计算机技术领域。该方法包括:根据各个小区的覆盖范围,获取与机场区域范围有重叠的目标小区;根据目标小区的小区类型,从用户轨迹数据中提取出与机场区域范围有交集的目标用户轨迹数据;根据目标用户轨迹数据的指标信息和机场区域的参数信息,识别出目标用户轨迹数据的用户类型。该方法能够反映出区域真实网络覆盖情况,避免相关技术中通过基站粗定位和手机号码归属地的方式进行识别出现的错算、漏算或多算问题,能够减少对大范围小区下的用户进行分析的计算量,提高用户识别的准确性。

Description

用户识别方法及装置、电子设备及介质
技术领域
本公开涉及计算机技术领域,尤其涉及一种用户识别方法及装置、电子设备及介质。
背景技术
机场作为交通枢纽,是当前应急服务重要保障场景之一,对机场的客流统计分析属于当前主要研究课题。由于用户隐私、售票渠道多、航空公司多以及动态改签等原因,直接获得旅客数据比较困难。除了旅客,还有大量的送机人员、机场工作人员、路过机场的人员等,给客流统计分析也带来困难。
相关技术中,通过基站粗定位和手机号码归属地的方式,对机场旅客进行识别,然后进行客流统计分析。但是这种方式容易错算、漏算或多算,不能对旅客精准识别,也不能对机场人流分类,影响客流统计分析结果。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开提供一种用户识别方法及装置、电子设备及介质,能够避免相关技术中通过基站粗定位和手机号码归属地的方式进行识别出现的错算、漏算或多算问题,提高用户识别的准确性。本公开的技术方案如下:
根据本公开实施例的一个方面,提供一种用户识别方法,包括:根据各个小区的覆盖范围,获取与机场区域范围有重叠的目标小区;根据所述目标小区的小区类型,从用户轨迹数据中提取出与所述机场区域范围有交集的目标用户轨迹数据;根据所述目标用户轨迹数据的指标信息和机场区域的参数信息,识别出所述目标用户轨迹数据的用户类型。
在本公开的一个实施例中,所述方法还包括:根据测量报告和S1MME信令,生成所述用户轨迹数据;以及,若所述用户轨迹数据为根据所述测量报告中的辅助全球定位系统AGPS定位信息得到的,则标记所述用户轨迹数据为第一定位类型;若所述用户轨迹数据为根据所述测量报告中的AGPS定位信息,基于机器学习算法预测得到的,则标记所述用户轨迹数据为第二定位类型;若所述用户轨迹数据为根据所述测量报告中的主服务小区的经纬度信息得到的,则标记所述用户轨迹数据为第三定位类型;若所述用户轨迹数据为利用所述S1MME信令中的基站经纬度信息得到的,则标记所述用户轨迹数据为第四定位类型。
在本公开的一个实施例中,所述方法还包括:若所述目标小区的覆盖范围与所述机场区域范围的重叠部分占所述目标小区的覆盖范围的比率为100%,则标记所述目标小区为第一类型;若所述目标小区的覆盖范围与所述机场区域范围的重叠部分占所述目标小区的覆盖范围的比率大于等于第一预设比例,则标记所述目标小区为第二类型;若所述目标小区的覆盖范围与所述机场区域范围的重叠部分占所述目标小区的覆盖范围的比率大于等于第二预设比例、且小于所述第一预设比例,则标记所述目标小区为第三类型;若所述目标小区的覆盖范围与所述机场区域范围的重叠部分占所述目标小区的覆盖范围的比率小于所述第二预设比例,则标记所述目标小区为第四类型。
在本公开的一个实施例中,根据所述目标小区的小区类型,从用户轨迹数据中提取出与所述机场区域范围有交集的目标用户轨迹数据,包括:若所述目标小区的小区类型为所述第一类型或所述第二类型,则从所述用户轨迹数据中提取出第一轨迹类型的用户轨迹数据,其中,所述第一轨迹类型的用户轨迹数据包括所述目标小区中的第一定位类型、第二定位类型、第三定位类型和第四定位类型的用户轨迹数据;若所述目标小区的小区类型为所述第三类型或所述第四类型,则从所述用户轨迹数据中提取出第二轨迹类型的用户轨迹数据,其中,所述第二轨迹类型的用户轨迹数据包括所述目标小区中的第一定位类型和第二定位类型的用户轨迹数据,且所述第二轨迹类型的用户轨迹数据在所述机场区域范围内;若所述目标小区的小区类型为所述第三类型,则从所述用户轨迹数据中提取出第三轨迹类型的用户轨迹数据,其中,所述第三轨迹类型的用户轨迹数据包括所述目标小区中的第三定位类型的用户轨迹数据,且所述第三轨迹类型的用户轨迹数据在所述机场区域范围内。
在本公开的一个实施例中,所述方法还包括:根据所述第一轨迹类型的用户轨迹数据、所述第二轨迹类型的用户轨迹数据和所述第三轨迹类型的用户轨迹数据,获取目标用户。
在本公开的一个实施例中,根据所述目标小区的小区类型,从用户轨迹数据中提取出与所述机场区域范围有交集的目标用户轨迹数据,包括:从所述用户轨迹数据中提取出第四轨迹类型的用户轨迹数据,其中,所述第四轨迹类型的用户轨迹数据为所述目标用户在所述机场区域范围外的轨迹数据。
在本公开的一个实施例中,根据所述目标用户轨迹数据的指标信息和机场区域的参数信息,识别出所述目标用户轨迹数据的用户类型,包括:获取所述目标用户轨迹数据的指标信息、所述目标用户轨迹数据的前一周期用户轨迹数据信息、所述目标用户轨迹数据的下一周期用户轨迹数据信息;根据获取的指标信息、所述机场区域的参数信息、所述前一周期用户轨迹数据信息和所述下一周期用户轨迹数据信息,对所述目标用户轨迹数据进行分析,识别出所述目标用户轨迹数据的用户类型。
在本公开的一个实施例中,所述目标用户轨迹数据的指标信息包括:第一时间、第二时间、第一距离、第二距离、第三距离、驻留时长、轨迹类型、反复出现次数、轨迹点的距离和、经过的小区数;其中,所述第一时间为用户轨迹数据的最早时间,所述第二时间为用户轨迹数据的最晚时间,所述第一距离为用户轨迹数据中进入所述机场区域范围前的最远距离,所述第二距离为用户轨迹数据中进入所述机场区域范围期间的最远距离,所述第三距离为用户轨迹数据中离开所述机场区域范围后的最远距离。
在本公开的一个实施例中,所述机场区域的参数信息包括:异地往返时长阈值、机场跑道距离区域中心最远距离、常驻天数阈值、工作时长阈值。
在本公开的一个实施例中,所述用户类型包括:到达旅客、出发旅客、中转旅客、外地往返旅客、本地往返旅客、工作人员、频繁往返机场人员、接送人员、路过人员。
根据本公开实施例的另一方面,提供一种用户识别装置,包括:获取模块,用于根据各个小区的覆盖范围,获取与机场区域范围有重叠的目标小区;提取模块,用于根据所述目标小区的小区类型,从用户轨迹数据中提取出与所述机场区域范围有交集的目标用户轨迹数据;识别模块,用于根据所述目标用户轨迹数据的指标信息和机场区域的参数信息,识别出所述目标用户轨迹数据的用户类型。
在本公开的一个实施例中,所述获取模块还用于:根据测量报告和S1MME信令,生成所述用户轨迹数据。以及,所述装置还包括标记模块,用于:若所述用户轨迹数据为根据所述测量报告中的AGPS定位信息得到的,则标记所述用户轨迹数据为第一定位类型;若所述用户轨迹数据为根据所述测量报告中的AGPS定位信息,基于机器学习算法预测得到的,则标记所述用户轨迹数据为第二定位类型;若所述用户轨迹数据为根据所述测量报告中的主服务小区的经纬度信息得到的,则标记所述用户轨迹数据为第三定位类型;若所述用户轨迹数据为利用所述S1MME信令中的基站经纬度信息得到的,则标记所述用户轨迹数据为第四定位类型。
在本公开的一个实施例中,所述标记模块还用于:若所述目标小区的覆盖范围与所述机场区域范围的重叠部分占所述目标小区的覆盖范围的比率为100%,则标记所述目标小区为第一类型;若所述目标小区的覆盖范围与所述机场区域范围的重叠部分占所述目标小区的覆盖范围的比率大于等于第一预设比例,则标记所述目标小区为第二类型;若所述目标小区的覆盖范围与所述机场区域范围的重叠部分占所述目标小区的覆盖范围的比率大于等于第二预设比例、且小于所述第一预设比例,则标记所述目标小区为第三类型;若所述目标小区的覆盖范围与所述机场区域范围的重叠部分占所述目标小区的覆盖范围的比率小于所述第二预设比例,则标记所述目标小区为第四类型。
在本公开的一个实施例中,所述提取模块还用于:若所述目标小区的小区类型为所述第一类型或所述第二类型,则从所述用户轨迹数据中提取出第一轨迹类型的用户轨迹数据,其中,所述第一轨迹类型的用户轨迹数据包括所述目标小区中的第一定位类型、第二定位类型、第三定位类型和第四定位类型的用户轨迹数据;若所述目标小区的小区类型为所述第三类型或所述第四类型,则从所述用户轨迹数据中提取出第二轨迹类型的用户轨迹数据,其中,所述第二轨迹类型的用户轨迹数据包括所述目标小区中的第一定位类型和第二定位类型的用户轨迹数据,且所述第二轨迹类型的用户轨迹数据在所述机场区域范围内;若所述目标小区的小区类型为所述第三类型,则从所述用户轨迹数据中提取出第三轨迹类型的用户轨迹数据,其中,所述第三轨迹类型的用户轨迹数据包括所述目标小区中的第三定位类型的用户轨迹数据,且所述第三轨迹类型的用户轨迹数据在所述机场区域范围内。
在本公开的一个实施例中,所述提取模块还用于:根据所述第一轨迹类型的用户轨迹数据、所述第二轨迹类型的用户轨迹数据和所述第三轨迹类型的用户轨迹数据,获取目标用户。
在本公开的一个实施例中,所述提取模块还用于:从所述用户轨迹数据中提取出第四轨迹类型的用户轨迹数据,其中,所述第四轨迹类型的用户轨迹数据为所述目标用户在所述机场区域范围外的轨迹数据。
在本公开的一个实施例中,所述识别模块还用于:获取所述目标用户轨迹数据的指标信息、所述目标用户轨迹数据的前一周期用户轨迹数据信息、所述目标用户轨迹数据的下一周期用户轨迹数据信息;根据获取的指标信息、所述机场区域的参数信息、所述前一周期用户轨迹数据信息和所述下一周期用户轨迹数据信息,对所述目标用户轨迹数据进行分析,识别出所述目标用户轨迹数据的用户类型。
在本公开的一个实施例中,所述目标用户轨迹数据的指标信息包括:第一时间、第二时间、第一距离、第二距离、第三距离、驻留时长、轨迹类型、反复出现次数、轨迹点的距离和、经过的小区数;其中,所述第一时间为用户轨迹数据的最早时间,所述第二时间为用户轨迹数据的最晚时间,所述第一距离为用户轨迹数据中进入所述机场区域范围前的最远距离,所述第二距离为用户轨迹数据中进入所述机场区域范围期间的最远距离,所述第三距离为用户轨迹数据中离开所述机场区域范围后的最远距离。
在本公开的一个实施例中,所述机场区域的参数信息包括:异地往返时长阈值、机场跑道距离区域中心最远距离、常驻天数阈值、工作时长阈值。
在本公开的一个实施例中,所述用户类型包括:到达旅客、出发旅客、中转旅客、外地往返旅客、本地往返旅客、工作人员、频繁往返机场人员、接送人员、路过人员。
根据本公开实施例的又一方面,提供一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现上述的用户识别方法。
根据本公开实施例的又一方面,提供一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述的用户识别方法。
本公开的实施例提供的技术方案至少带来以下有益效果:可以从各个小区的覆盖范围进行分析,获取与机场区域范围有重叠的目标小区,进而根据目标小区的小区类型,提取出与机场区域范围有交集的用户轨迹,接着利用轨迹包含的指标信息和机场区域的参数信息对这些轨迹进行分析,识别出其对应的用户类型,能够反映出区域真实网络覆盖情况,避免相关技术中通过基站粗定位和手机号码归属地的方式进行识别出现的错算、漏算或多算问题,并且根据目标小区的小区类型提取用户轨迹,满足对目标小区下的用户进行分析,能够减少对大范围小区下的用户进行分析的计算量,提高用户识别的准确性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的用户识别方法的流程图;
图2是根据一示例性实施例示出的机场区域与目标小区的示意图;
图3是根据又一示例性实施例示出的用户识别方法的流程图;
图4是根据一示例性实施例示出的用户识别装置框图;
图5是根据一示例性实施例示出的用户识别的电子设备的结构框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
需要说明的是,本公开所涉及的用户信息,包括但不限于用户设备信息、用户个人信息等,均为经用户授权或者经过各方充分授权的信息。
本公开实施例提供的方法可以由任意类型的电子设备执行,例如服务器或者终端设备,或者服务器和终端设备的交互执行。终端设备以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
其中,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。
终端设备可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。
图1是根据一示例性实施例示出的用户识别方法的流程图。如图1所示,用户识别方法包括以下步骤。
步骤S110,根据各个小区的覆盖范围,获取与机场区域范围有重叠的目标小区。
步骤S120,根据目标小区的小区类型,从用户轨迹数据中提取出与机场区域范围有交集的目标用户轨迹数据。
步骤S130,根据目标用户轨迹数据的指标信息和机场区域的参数信息,识别出目标用户轨迹数据的用户类型。
本公开实施例提供的用户识别方法中,可以从各个小区的覆盖范围进行分析,获取与机场区域范围有重叠的目标小区,进而根据目标小区的小区类型,提取出与机场区域范围有交集的用户轨迹,接着利用轨迹包含的指标信息和机场区域的参数信息对这些轨迹进行分析,识别出其对应的用户类型,能够反映出区域真实网络覆盖情况,避免相关技术中通过基站粗定位和手机号码归属地的方式进行识别出现的错算、漏算或多算问题,并且根据目标小区的小区类型提取用户轨迹,满足对目标小区下的用户进行分析,能够减少对大范围小区下的用户进行分析的计算量,提高用户识别的准确性。
在步骤S110中,可以对各个小区的覆盖范围进行分析,获取到与机场区域范围具有重叠部分的小区,确定获取到的小区为目标小区。其中,可以根据带有辅助全球定位系统(Assisted Global Positioning System,AGPS)定位信息的测量报告(MeasurementReport,MR)进行分析,得到各个小区的覆盖范围。用户通过移动终端使用互联网业务时,会周期性产生可用来评估无线环境质量的MR。MR中可以包括时间提前量(Timing advance,TA)、参考信号接收功率(Reference Signal Receiving Power,RSRP)、物理小区识别码(Physical Cell Identification,PCI)、绝对无线频率信道号(E-UTRA Absolute RadioFrequency Channel Number,EARFCN)等信息。此外,约有2%左右的MR中带有AGPS定位信息,可以利用带有AGPS定位信息的MR确定各个小区的覆盖范围,具体实现可以为:将MR中的AGPS定位信息栅格化处理,根据栅格化处理结果将各个小区所覆盖的栅格连在一起,得到各个小区的覆盖范围。
需要注意的是,目标小区的数量为一个或多个,每个目标小区与机场区域的重叠程度是不同的。若某目标小区与机场区域的重叠部分较多,则说明该目标小区越接近机场区域的中心部分,那么若用该目标小区中的用户行为轨迹分析用户类型,得到的结果越准确。所以,在获取到目标小区后,可以标记小区类型,后续根据小区类型提取出目标用户轨迹数据。
在示例性实施例中,用户识别方法还可以包括:若目标小区的覆盖范围与机场区域范围的重叠部分占目标小区的覆盖范围的比率为100%,则标记目标小区为第一类型;若目标小区的覆盖范围与机场区域范围的重叠部分占目标小区的覆盖范围的比率大于等于第一预设比例,则标记目标小区为第二类型;若目标小区的覆盖范围与机场区域范围的重叠部分占目标小区的覆盖范围的比率大于等于第二预设比例、且小于第一预设比例,则标记目标小区为第三类型;若目标小区的覆盖范围与机场区域范围的重叠部分占目标小区的覆盖范围的比率小于第二预设比例,则标记目标小区为第四类型。
可见,小区类型可以包括第一类型、第二类型、第三类型和第四类型。目标小区的小区类型可以由该目标小区的覆盖率决定的,其中,该目标小区的覆盖率为该目标小区的覆盖范围与机场区域范围的重叠部分占该目标小区的覆盖范围的比率。还有,第一预设比例大于第二预设比例,如第一预设比例为80%,第二预设比例为50%,那么可以得到:(1)如果目标小区为第一类型,则说明该目标小区的覆盖率为100%,即该目标小区的覆盖范围在机场区域范围内;(2)如果目标小区为第二类型,则说明该目标小区的覆盖率大于等于80%;(3)如果目标小区为第三类型,则说明该目标小区的覆盖率大于等于50%、且小于80%;(4)如果目标小区为第四类型,则说明该目标小区的覆盖率小于50%。
图2是根据一示例性实施例示出的机场区域与目标小区的示意图。参见图2,与机场区域范围有重叠的小区有小区A、B、C、D和E。小区A和小区B的覆盖范围在机场区域范围内,其小区类型均为第一类型,小区C的小区类型为第二类型,小区D的小区类型为第三类型,小区E的小区类型为第四类型。
当然,第一类型、第二类型、第三类型和第四类型用于区分小区的覆盖率,也可以用其他形式表示。比如,若目标小区的覆盖率为100%,则标记其小区类型为C0;若目标小区的覆盖率大于等于第一预设比例,则标记其小区类型为C1;若目标小区的覆盖率大于等于第二预设比例、且小于第一预设比例,则标记其小区类型为C2;若目标小区的覆盖率小于第二预设比例,则标记其小区类型为C3。
在步骤S120中,可以根据目标小区的小区类型,从用户轨迹数据中提取出与机场区域范围有交集的目标用户轨迹数据。
在示例性实施例中,用户识别方法还可以包括:根据测量报告和S1MME信令,生成用户轨迹数据。以及,若用户轨迹数据为根据测量报告中的辅助全球定位系统AGPS定位信息得到的,则标记用户轨迹数据为第一定位类型;若用户轨迹数据为根据测量报告中的AGPS定位信息,基于机器学习算法预测得到的,则标记用户轨迹数据为第二定位类型;若用户轨迹数据为根据测量报告中的主服务小区的经纬度信息得到的,则标记用户轨迹数据为第三定位类型;若用户轨迹数据为利用S1MME信令中的基站经纬度信息得到的,则标记用户轨迹数据为第四定位类型。
具体的,可以以MR精定位为主,以S1MME信令为辅,通过聚类及异常点剔除等算法拟合并生成用户轨迹数据,以及将生成的用户轨迹数据标记为第一定位类型、第二定位类型、第三定位类型或第四定位类型。上文已经说明MR中可以包括TA、RSRP、PCI、EARFCN,约有2%左右的MR中带有AGPS定位信息。S1MME为控制平面接口,其可以将基站和移动性管理实体(MME)相连,主要完成S1接口(即,基站LTE eNodeB与分组核心网EPC之间的通讯接口)的无线接入承载控制、接口专用的操作维护等功能。
本公开实施例中,不同定位类型的用户轨迹数据的获取方式是不同的。对于带有AGPS定位信息的MR,可以直接根据AGPS定位信息生成用户轨迹数据,将生成的用户轨迹数据标记为第一定位类型。此外,还可以利用带有AGPS定位信息的MR,结合MR中的TA、RSRP、PCI、EARFCN信息构建指纹库。然后可以基于机器学习算法,预测不带有AGPS定位信息的MR中的AGPS定位信息。进而根据预测得到的AGPS定位信息生成用户轨迹数据,以及标记生成的用户轨迹数据为第二定位类型。还有,如果MR中的TA、RSRP、PCI、EARFCN信息缺失而导致无法预测该MR中的AGPS定位信息,则可以根据MR中的主服务小区的经纬线信息,生成用户轨迹数据,并标记为第三定位类型。另外,还可以利用S1MME信令中的基站经纬度信息生成用户轨迹数据,并标记为第四定位类型。利用S1MME信令中的基站经纬度信息生成用户轨迹数据的过程中,可以利用基站经纬度信息,并结合小区的实际覆盖范围对基站经纬度信息进行纠偏。
第一定位类型的用户轨迹数据为直接通过AGPS定位信息得到的,第二定位类型的用户轨迹数据为预测AGPS定位信息得到的,第三定位类型的用户轨迹数据为通过主服务小区的经纬度信息得到的,第四定位类型的用户轨迹数据为通过基站经纬度信息得到的。因此,用户轨迹数据的准确度从高到低为:第一定位类型的用户轨迹数据、第二定位类型的用户轨迹数据、第三定位类型的用户轨迹数据、第四定位类型的用户轨迹数据。当然,第一定位类型、第二定位类型、第三定位类型和第四定位类型用于区分用户轨迹数据的获取方式,也可以用其他形式表示。比如,若用户轨迹数据为根据MR中的AGPS定位信息得到的,则标记其为AGPS定位类型;若用户轨迹数据为根据MR中的AGPS定位信息,基于机器学习算法预测得到的,则标记其为ML定位类型;若用户轨迹数据为根据MR中的主服务小区的经纬度信息得到的,则标记其为SC定位类型;若用户轨迹数据为利用S1MME信令中的基站经纬度信息得到的,则标记其为S1定位类型。
需要注意的是,生成用户轨迹数据的过程中需要严格遵守用户隐私包含措施,对MR和S1MME信令中涉及用户隐私数据进行加密或脱敏。
针对不同小区类型的目标小区,采用不同的轨迹提取策略提取用户轨迹数据,并标记轨迹类型。在示例性实施例中,根据目标小区的小区类型,从用户轨迹数据中提取出与机场区域范围有交集的目标用户轨迹数据,可以包括:
(1)若目标小区的小区类型为第一类型或第二类型,则从用户轨迹数据中提取出第一轨迹类型的用户轨迹数据。其中,第一轨迹类型的用户轨迹数据包括目标小区中的第一定位类型、第二定位类型、第三定位类型和第四定位类型的用户轨迹数据。
考虑到第一类型和第二类型的目标小区与机场区域范围的重叠部分比较多,也就是说第一类型和第二类型的目标小区位于机场区域范围的中心部分的概率比较大,或者说如果某用户的轨迹在第一类型和第二类型的目标小区范围内,那么该用户的轨迹越能表示其用户类型。因此,如果目标小区的小区类型为第一类型或第二类型,那么将该小区内的所有定位类型的用户轨迹数据提取出来。并且,将提取出来的用户轨迹数据标记为第一轨迹类型。
(2)若目标小区的小区类型为第三类型或第四类型,则从用户轨迹数据中提取出第二轨迹类型的用户轨迹数据。其中,第二轨迹类型的用户轨迹数据包括目标小区中的第一定位类型和第二定位类型的用户轨迹数据,且第二轨迹类型的用户轨迹数据在机场区域范围内。
考虑到第三类型和第四类型的目标小区与机场区域范围的重叠部分没有第一类型和第二类型的目标小区与机场区域范围的重叠部分多,因此如果目标小区的小区类型为第三类型或第四类型,那么提取该目标小区内的部分用户轨迹数据。具体的,可以将第三类型或第四类型的目标小区内的第一定位类型和第二定位类型的用户轨迹数据提取出来,并且提取出来的用户轨迹数据需要在机场区域范围内。此外,将提取处理的用户轨迹数据标记为第二轨迹类型。
(3)若目标小区的小区类型为第三类型,则从用户轨迹数据中提取出第三轨迹类型的用户轨迹数据。其中,第三轨迹类型的用户轨迹数据包括目标小区中的第三定位类型的用户轨迹数据,且第三轨迹类型的用户轨迹数据在机场区域范围内。
还有,对于第三类型的目标小区,可以将该目标小区内的第三定位类型的用户轨迹数据提取出来,并且提取出来的用户轨迹数据需要在机场区域范围内,还可以标记为第三轨迹类型。
在示例性实施例中,用户识别方法还可以包括:根据第一轨迹类型的用户轨迹数据、第二轨迹类型的用户轨迹数据和第三轨迹类型的用户轨迹数据,获取目标用户。以及,根据目标小区的小区类型,从用户轨迹数据中提取出与机场区域范围有交集的目标用户轨迹数据,还可以包括:从用户轨迹数据中提取出第四轨迹类型的用户轨迹数据,其中,第四轨迹类型的用户轨迹数据为目标用户在机场区域范围外的轨迹数据。
为了准确识别出用户类型,除了提取机场区域范围内的用户轨迹数据,还可以提取机场区域范围外的用户轨迹数据。具体的,在获取到第一轨迹类型、第二轨迹类型和第三轨迹类型的用户轨迹数据后,可以对提取的用户轨迹数据去重以得到目标用户,然后提取出目标用户在机场区域范围外的用户轨迹数据,以及将提取出的用户轨迹数据标记为第四轨迹类型。其中,可以根据实际情况确定机场区域范围外所对应的具体范围。比如,机场位于A市,机场区域范围外可以为除了机场区域范围的A市区域范围。
本公开实施例中,确定与机场区域范围重叠的目标小区后,可以根据重叠程度确定目标小区的小区类型,还可以根据用户轨迹数据的生成方式确定用户轨迹数据的定位类型,进而针对不同目标小区,采用不同的提取策略提取该目标小区的用户轨迹数据,表1为轨迹提取规则表。
表1轨迹提取规则表
Figure BDA0003437386900000141
当然,第一轨迹类型、第二轨迹类型、第三轨迹类型和第四轨迹类型用于区分用户轨迹数据的提取类型,也可以用其他形式表示。比如,可以用0、1、2、3表示轨迹的提取类型。需要注意的是,按用户维度汇总数据时,如果同一用户有多种轨迹类型,那么提取轨迹类型值中最小的,即优先提取第一轨迹类型的用户轨迹,再是第二轨迹类型的用户轨迹,然后是第三轨迹类型的用户轨迹,最后是第四轨迹类型的用户轨迹,这样做的原因是轨迹类型值越小,则说明其可信度越高,即对其进行分析,识别出来的用户类型越准确。
步骤S130,根据目标用户轨迹数据的指标信息和机场区域的参数信息,识别出目标用户轨迹数据的用户类型。
其中,目标用户轨迹数据的指标信息可以包括:第一时间、第二时间、第一距离、第二距离、第三距离、驻留时长、轨迹类型、反复出现次数、轨迹点的距离和、经过的小区数。
第一时间为用户轨迹数据的最早时间。针对每个目标用户的轨迹数据,分别提取轨迹数据中不同轨迹类型时,数据时间戳最小值。
第二时间为用户轨迹数据的最晚时间。针对每个目标用户的轨迹数据,分别提取轨迹数据中不同轨迹类型时,数据时间戳最晚值。
第一距离为用户轨迹数据中进入机场区域范围前的最远距离。第一距离为用户轨迹数据中进入机场区域范围前的轨迹点距离区域中心的最远距离。如果最早时间就在区域里面,那么第一距离为空。
第二距离为用户轨迹数据中进入机场区域范围期间的最远距离。第二距离为用户轨迹数据中进入机场区域最早时间和最晚时间轨迹点间,如果存在区域外轨迹点,选取这个轨迹点中的最远距离,该选取的距离为第二距离。如果中途未离开区域,那么第二距离为空。
第三距离为用户轨迹数据中离开机场区域范围后的最远距离。第三距离为用户轨迹数据中离开机场区域范围后的轨迹点距离区域中心的最远距离。如果最晚时间就在区域里面,那么第三距离为空。
驻留时长可以包括在机场区域范围内和在机场区域范围外的驻留时长。
驻留时刻数可以为在机场区域范围内和在机场区域范围外的打点时刻数。如,将用户轨迹数据按15分钟刻度打点,全天分成96个时刻,统计每刻打点次数。
轨迹类型为目标用户轨迹数据的提取类型。需要注意的是,如果同一用户有多种轨迹类型,那么提取轨迹类型值中最小的。
反复出现次数可以为用户在机场区域内和机场区域外反复出现的次数。需要注意的是,每次出现的时长大于预设的时长阈值、且与机场区域中心距离大于预设的距离阈值。
轨迹点的距离和可以为将用户轨迹数据中的所有轨迹点按照时间序列排序,然后计算相邻两点间的距离,最后累加求和得到的。
经过的小区数可以为用户轨迹数据所包含的小区中属于目标小区的数量a。当然,也可以获取用户经过的小区比率,即用户轨迹数据所包含的小区中属于目标小区的数量a占目标小区总数b的比率a/b*100%。
在确定机场区域范围后,可以配置该机场区域的参数信息,具体可以包括:异地往返时长阈值Duration_OUT_IN、机场跑道距离区域中心最远距离Distance_Center、常驻天数阈值Stay_Days_Limit、工作时长阈值Work_Time_Limit。
异地往返时长阈值Duration_OUT_IN可以为该机场距离周边最近机场的往返时长并预留办事及路上时长。比如,与广州白云机场最近的机场为湖南长沙机场,最短往返时间约为120分钟,预留办事及路上时长为300分钟,那么累加得到420分钟,则广州白云机场的异地往返时长阈值为420分钟。
机场跑道距离区域中心最远距离Distance_Center可以用来评估到达航班用户最早轨迹点距离机场区域中心距离的阈值,还可以用来评估出发航班用户最后轨迹点距离机场区域中心距离的阈值。一般情况下,可以在实际测量距离基础上增加500米~1000米。
常驻天数阈值Stay_Days_Limit为1个月内在机场区域出现的天数阈值,如14天,其用来判断是否为机场工作人员。
工作时长阈值Work_Time_Limit包括白班工作时长阈值和晚班时长阈值,分别表示白天工作时长和晚上工作时间。白班工作时长阈值可以用来判断是否为机场白班工作人员,如设置为6小时。相应地,晚班时长阈值可以用来判断是否为机场晚班工作人员,如设置为6小时。
机场区域的参数信息还可以包括区域中心点经纬度坐标和睡眠时段范围。其中,睡眠时段范围可以根据不同时区进行配置,如配置为凌晨0点到5点,在睡眠时段范围期间的轨迹可中断。
用户类型可以包括:到达旅客、出发旅客、中转旅客、外地往返旅客、本地往返旅客、工作人员、频繁往返机场人员、接送人员、路过人员。其中,工作人员可以包括白班工作人员、晚班工作人员和常驻(白班+晚班)工作人员。
在示例性实施例中,根据目标用户轨迹数据的指标信息和机场区域的参数信息,识别出目标用户轨迹数据的用户类型,可以包括:获取目标用户轨迹数据的指标信息、目标用户轨迹数据的前一周期用户轨迹数据信息、目标用户轨迹数据的下一周期用户轨迹数据信息;根据获取的指标信息、机场区域的参数信息、前一周期用户轨迹数据信息和下一周期用户轨迹数据信息,对目标用户轨迹数据进行分析,识别出目标用户轨迹数据的用户类型。
对用户轨迹数据进行分析时,除了考虑用户轨迹数据的指标信息、机场区域的参数信息外,为了提高用户类型识别的准确性,还可以考虑用户的前一周期的轨迹数据和下一周期的轨迹数据。本公开实施例中,以预设时间周期对用户轨迹数据进行分析,如对用户每天的轨迹数据进行分析,识别出该用户的用户类型。为了能够准确识别出用户类型,可以结合前一周期用户轨迹数据和下一周期用户轨迹数据。比如,目标用户轨迹数据为用户1在星期二的轨迹数据,那么可以结合用户1在星期一和星期三的轨迹数据进行分析。表2为用户类型的识别规则表。
表2用户类型的识别规则表
Figure BDA0003437386900000171
Figure BDA0003437386900000181
Figure BDA0003437386900000191
需要注意的是,表2中的预设值均可以根据实际情况配置,如根据机场作息时间不同调整。还有,当目标用户轨迹数据满足识别规则中的条件,则该目标用户轨迹数据的用户类型为该识别规则对应的用户类型。如某目标用户轨迹数据满足如下条件,则该目标用户轨迹数据的用户类型为到达:(1)轨迹点最早出现在机场区域内或区域附近,即在Distance_Center所定义范围内;(2)最后轨迹点出现在机场区域外(如市区)且距离大于Distance_Center;(3)前一周期无轨迹、或前一周期用户轨迹数据的最晚时间与目标用户轨迹数据的最早时间之间的间隙时长大于Duration_OUT_IN;(4)a/b>=3/b,即用户至少经过三个以上目标小区;(5)轨迹类型为第一轨迹类型或第二轨迹类型。
可以看出,本公开实施例提供的用户识别方法中,可以利用各个用户类型的轨迹数据特征,如轨迹突然消失(航班出发)、突然出现(航班到达),设置不同用户类型的识别规则,进而可以按照设置的识别规则,根据出现在机场区域范围的目标用户轨迹数据的指标信息、以及机场区域的参数信息,识别出用户类型,即确定出用户的类别标签,实现对机场客流多维度统计分析,如分析用户来源地。
此外,本公开实施例中,用户轨迹数据可以按照轨迹点时间序列分段统计,如每15分钟统计一次,即将1小时分成4个刻度进行统计,也可以每10分钟统计一次。目的是通过刻度打点,统计用户驻留时刻数,不能简单通过起始时间计算得到驻留时长。针对每个刻度内轨迹数据进行统计得到机场区域中心最远距离、轨迹类型、定位次数、最早/晚时间、经过的目标小区等指标信息。
在上述按轨迹点统计的基础上,还可以按照天汇总统计如下信息:用户进入区域前/中/后最远距离、区域内外轨迹点间隙最大时长、驻留时长、工作/休息时段区域内外打点时刻数、用户轨迹类型(多个取最小值)、各种定位类型最早最晚时间、各轨迹类型定位总次数、所经目标小区数量占机场区域的目标小区总数的比率、区域内外最大时长、区域内外最早/晚时差。根据这些统计信息,按天识别用户类型。此外,还可以按照月汇总统计。具体的,统计用户在机场区域出现总天数、机场区域内/外平均驻留时长及驻留时刻数、各类标签天数(即,被识别为各个用户类型的天数)、节假日出现天数等。
对于目标用户轨迹数据,还可以统计目标用户的前一周期的轨迹数据。如D为某天,提取目标用户在D-1天的轨迹数据并进行统计,可以统计D-1天的轨迹点最早出现时间、轨迹点的最晚出现时间、轨迹点距离区域中心最远及最近距离、轨迹点是否有落入区域范围内、落入区域范围次数、总驻留时长、驻留时刻数等信息,还可以统计D-1天轨迹最晚时间距离D天最早轨迹之间的时长及距离等。此外,也可以统计目标用户的下一周期的轨迹数据。如D为某天,提取目标用户在D+1天的轨迹数据并进行统计,可以统计D+1天的轨迹点最早出现时间、轨迹点的最晚出现时间、轨迹点距离区域中心最远及最近距离、轨迹点是否有落入区域范围内、落入区域范围次数、总驻留时长、驻留时刻数等信息,还可以统计D+1天轨迹最早时间距离D天最晚轨迹之间的时长及距离等。
本公开实施例提供的用户识别方法,可以从各个小区的覆盖范围进行分析,获取与机场区域范围有重叠的目标小区,进而根据目标小区的小区类型,提取出与机场区域范围有交集的用户轨迹,接着利用轨迹包含的指标信息和机场区域的参数信息对这些轨迹进行分析,识别出其对应的用户类型,能够反映出区域真实网络覆盖情况,避免相关技术中通过基站粗定位和手机号码归属地的方式进行识别出现的错算、漏算或多算问题,并且根据目标小区的小区类型提取用户轨迹,满足对目标小区下的用户进行分析,能够减少对大范围小区下的用户进行分析的计算量,提高用户识别的准确性。
图3是根据又一示例性实施例示出的用户识别方法的流程图。如图3所示,用户识别方法可以包括如下部分。
(1)机场区域框选和配置。在地图上选取出机场区域范围和机场区域包含的各个场景,如机场出发厅、到达厅及候机室。配置该机场区域的参数信息,如异地往返时长阈值、机场跑道距离区域中心最远距离、常驻天数阈值、工作时长阈值、区域中心点经纬度坐标、睡眠时段范围等。
(2)MR中的AGPS定位信息预测、小区覆盖范围计算。利用带有AGPS定位信息的MR和MR中的TA、RSRP等信息构建指纹库;然后基于机器学习算法,预测不带有AGPS定位信息的MR中的AGPS定位信息。此外,还可以利用带有AGPS定位信息的MR计算各小区的实际覆盖范围。
(3)用户轨迹数据生成。以MR为主、S1MME信令为辅,通过聚类及异常点剔除等算法生成用户轨迹数据。以及,根据用户轨迹数据的生成方式不同,标记用户轨迹数据的定位类型,如标记为第一定位类型、第二定位类型、第三定位类型、第四定位类型,再如标记为AGPS定位类型、ML定位类型、SC定位类型、S1定位类型。
(4)获取机场区域对应的目标小区。通过判断机场区域范围与各个小区的区域范围是否重叠,得到目标小区。然后,根据各个目标小区的区域范围与机场区域范围的重叠程度,标记各个目标小区的小区类型,如标记为第一类型、第二类型、第三类型和第四类型,再如标记为C0、C1、C2和C3。
(5)目标用户轨迹数据的提取。具体的,可以按照表1所示的轨迹提取规则,按各个目标小区的小区类型提取目标小区下不同定位类型的用户轨迹数据。在提取到目标小区内的用户轨迹数据后,可以去重得到目标用户,然后将这些目标用户在区域外的轨迹数据提取出来。此外,提取出目标用户轨迹数据后,可以标记该轨迹数据的轨迹类型。
(6)识别目标用户轨迹数据的用户类型。具体的,可以按照表2所示的识别规则,对目标用户轨迹数据进行分析,得到其对应的用户类型。也就是说,按用户维度统计出轨迹点各时段到区域中心距离(前/中/后)、驻留时长、轨迹点间隙最大时长、轨迹点间距离之和、驻留打点时刻数、工作时段/休息时段打点时刻数、所经目标小区与总目标小区占比、最早最晚时间、轨迹类型等信息,然后根据统计信息识别出用户类型,如到达、出发、中转、外地往返、本地往返、路过人员、工作人员。
(7)轨迹追踪分析、区域用户月统计、重新识别用户类型、客流统计分析。按月统计分析区域用户驻留情况,以及结合轨迹和月统计数据重新对区域用户进行识别,并输出统计分析结果。
图4是根据一示例性实施例示出的用户识别装置框图。参照图4,该装置可以包括:获取模块410、提取模块420、识别模块430和标记模块440。
该获取模块410可用于:根据各个小区的覆盖范围,获取与机场区域范围有重叠的目标小区。
该提取模块420可用于:根据目标小区的小区类型,从用户轨迹数据中提取出与机场区域范围有交集的目标用户轨迹数据。
该识别模块430可用于:根据目标用户轨迹数据的指标信息和机场区域的参数信息,识别出目标用户轨迹数据的用户类型。
在示例性实施例中,该获取模块410还可用于:根据测量报告和S1MME信令,生成用户轨迹数据。该标记模块440可用于:若用户轨迹数据为根据测量报告中的AGPS定位信息得到的,则标记用户轨迹数据为第一定位类型;若用户轨迹数据为根据测量报告中的AGPS定位信息,基于机器学习算法预测得到的,则标记用户轨迹数据为第二定位类型;若用户轨迹数据为根据测量报告中的主服务小区的经纬度信息得到的,则标记用户轨迹数据为第三定位类型;若用户轨迹数据为利用S1MME信令中的基站经纬度信息得到的,则标记用户轨迹数据为第四定位类型。
在示例性实施例中,该标记模块440还可用于:若目标小区的覆盖范围与机场区域范围的重叠部分占目标小区的覆盖范围的比率为100%,则标记目标小区为第一类型;若目标小区的覆盖范围与机场区域范围的重叠部分占目标小区的覆盖范围的比率大于等于第一预设比例,则标记目标小区为第二类型;若目标小区的覆盖范围与机场区域范围的重叠部分占目标小区的覆盖范围的比率大于等于第二预设比例、且小于第一预设比例,则标记目标小区为第三类型;若目标小区的覆盖范围与机场区域范围的重叠部分占目标小区的覆盖范围的比率小于第二预设比例,则标记目标小区为第四类型。
在示例性实施例中,该提取模块420还可用于:若目标小区的小区类型为第一类型或第二类型,则从用户轨迹数据中提取出第一轨迹类型的用户轨迹数据,其中,第一轨迹类型的用户轨迹数据包括目标小区中的第一定位类型、第二定位类型、第三定位类型和第四定位类型的用户轨迹数据;若目标小区的小区类型为第三类型或第四类型,则从用户轨迹数据中提取出第二轨迹类型的用户轨迹数据,其中,第二轨迹类型的用户轨迹数据包括目标小区中的第一定位类型和第二定位类型的用户轨迹数据,且第二轨迹类型的用户轨迹数据在机场区域范围内;若目标小区的小区类型为第三类型,则从用户轨迹数据中提取出第三轨迹类型的用户轨迹数据,其中,第三轨迹类型的用户轨迹数据包括目标小区中的第三定位类型的用户轨迹数据,且第三轨迹类型的用户轨迹数据在机场区域范围内。
在示例性实施例中,该提取模块420还可用于:根据第一轨迹类型的用户轨迹数据、第二轨迹类型的用户轨迹数据和第三轨迹类型的用户轨迹数据,获取目标用户。
在示例性实施例中,该提取模块420还可用于:从用户轨迹数据中提取出第四轨迹类型的用户轨迹数据,其中,第四轨迹类型的用户轨迹数据为目标用户在机场区域范围外的轨迹数据。
在示例性实施例中,该识别模块430还可用于:获取目标用户轨迹数据的指标信息、目标用户轨迹数据的前一周期用户轨迹数据信息、目标用户轨迹数据的下一周期用户轨迹数据信息;根据获取的指标信息、机场区域的参数信息、前一周期用户轨迹数据信息和下一周期用户轨迹数据信息,对目标用户轨迹数据进行分析,识别出目标用户轨迹数据的用户类型。
在示例性实施例中,目标用户轨迹数据的指标信息可以包括:第一时间、第二时间、第一距离、第二距离、第三距离、驻留时长、轨迹类型、反复出现次数、轨迹点的距离和、经过的小区数;其中,第一时间为用户轨迹数据的最早时间,第二时间为用户轨迹数据的最晚时间,第一距离为用户轨迹数据中进入机场区域范围前的最远距离,第二距离为用户轨迹数据中进入机场区域范围期间的最远距离,第三距离为用户轨迹数据中离开机场区域范围后的最远距离。
在示例性实施例中,机场区域的参数信息可以包括:异地往返时长阈值、机场跑道距离区域中心最远距离、常驻天数阈值、工作时长阈值。
在示例性实施例中,用户类型可以包括:到达旅客、出发旅客、中转旅客、外地往返旅客、本地往返旅客、工作人员、频繁往返机场人员、接送人员、路过人员。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图5是根据一示例性实施例示出的用户识别的电子设备的结构框图。需要说明的是,图示出的电子设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
下面参照图5来描述根据本发明的这种实施方式的电子设备500。图5显示的电子设备500仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,电子设备500以通用计算设备的形式表现。电子设备500的组件可以包括但不限于:上述至少一个处理单元510、上述至少一个存储单元520、连接不同系统组件(包括存储单元520和处理单元510)的总线530。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元510执行,使得所述处理单元510执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元510可以执行如图1中所示的步骤S110,根据各个小区的覆盖范围,获取与机场区域范围有重叠的目标小区;步骤S120,根据目标小区的小区类型,从用户轨迹数据中提取出与机场区域范围有交集的目标用户轨迹数据;步骤S130,根据目标用户轨迹数据的指标信息和机场区域的参数信息,识别出目标用户轨迹数据的用户类型。
存储单元520可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)5201和/或高速缓存存储单元5202,还可以进一步包括只读存储单元(ROM)5203。
存储单元520还可以包括具有一组(至少一个)程序模块5205的程序/实用工具5204,这样的程序模块5205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线530可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备500也可以与一个或多个外部设备600(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备500交互的设备通信,和/或与使得该电子设备500能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口550进行。并且,电子设备500还可以通过网络适配器540与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器540通过总线530与电子设备500的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备500使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
在本公开的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。
根据本发明实施方式的用于实现上述方法的程序产品,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
此外,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本公开实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由所附的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (13)

1.一种用户识别方法,其特征在于,包括:
根据各个小区的覆盖范围,获取与机场区域范围有重叠的目标小区;
根据所述目标小区的小区类型,从用户轨迹数据中提取出与所述机场区域范围有交集的目标用户轨迹数据;
根据所述目标用户轨迹数据的指标信息和机场区域的参数信息,识别出所述目标用户轨迹数据的用户类型。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据测量报告和S1MME信令,生成所述用户轨迹数据;以及,
若所述用户轨迹数据为根据所述测量报告中的辅助全球定位系统AGPS定位信息得到的,则标记所述用户轨迹数据为第一定位类型;
若所述用户轨迹数据为根据所述测量报告中的AGPS定位信息,基于机器学习算法预测得到的,则标记所述用户轨迹数据为第二定位类型;
若所述用户轨迹数据为根据所述测量报告中的主服务小区的经纬度信息得到的,则标记所述用户轨迹数据为第三定位类型;
若所述用户轨迹数据为利用所述S1MME信令中的基站经纬度信息得到的,则标记所述用户轨迹数据为第四定位类型。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若所述目标小区的覆盖范围与所述机场区域范围的重叠部分占所述目标小区的覆盖范围的比率为100%,则标记所述目标小区为第一类型;
若所述目标小区的覆盖范围与所述机场区域范围的重叠部分占所述目标小区的覆盖范围的比率大于等于第一预设比例,则标记所述目标小区为第二类型;
若所述目标小区的覆盖范围与所述机场区域范围的重叠部分占所述目标小区的覆盖范围的比率大于等于第二预设比例、且小于所述第一预设比例,则标记所述目标小区为第三类型;
若所述目标小区的覆盖范围与所述机场区域范围的重叠部分占所述目标小区的覆盖范围的比率小于所述第二预设比例,则标记所述目标小区为第四类型。
4.根据权利要求3所述的方法,其特征在于,根据所述目标小区的小区类型,从用户轨迹数据中提取出与所述机场区域范围有交集的目标用户轨迹数据,包括:
若所述目标小区的小区类型为所述第一类型或所述第二类型,则从所述用户轨迹数据中提取出第一轨迹类型的用户轨迹数据,其中,所述第一轨迹类型的用户轨迹数据包括所述目标小区中的第一定位类型、第二定位类型、第三定位类型和第四定位类型的用户轨迹数据;
若所述目标小区的小区类型为所述第三类型或所述第四类型,则从所述用户轨迹数据中提取出第二轨迹类型的用户轨迹数据,其中,所述第二轨迹类型的用户轨迹数据包括所述目标小区中的第一定位类型和第二定位类型的用户轨迹数据,且所述第二轨迹类型的用户轨迹数据在所述机场区域范围内;
若所述目标小区的小区类型为所述第三类型,则从所述用户轨迹数据中提取出第三轨迹类型的用户轨迹数据,其中,所述第三轨迹类型的用户轨迹数据包括所述目标小区中的第三定位类型的用户轨迹数据,且所述第三轨迹类型的用户轨迹数据在所述机场区域范围内。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
根据所述第一轨迹类型的用户轨迹数据、所述第二轨迹类型的用户轨迹数据和所述第三轨迹类型的用户轨迹数据,获取目标用户。
6.根据权利要求5所述的方法,其特征在于,根据所述目标小区的小区类型,从用户轨迹数据中提取出与所述机场区域范围有交集的目标用户轨迹数据,包括:
从所述用户轨迹数据中提取出第四轨迹类型的用户轨迹数据,其中,所述第四轨迹类型的用户轨迹数据为所述目标用户在所述机场区域范围外的轨迹数据。
7.根据权利要求1所述的方法,其特征在于,根据所述目标用户轨迹数据的指标信息和机场区域的参数信息,识别出所述目标用户轨迹数据的用户类型,包括:
获取所述目标用户轨迹数据的指标信息、所述目标用户轨迹数据的前一周期用户轨迹数据信息、所述目标用户轨迹数据的下一周期用户轨迹数据信息;
根据获取的指标信息、所述机场区域的参数信息、所述前一周期用户轨迹数据信息和所述下一周期用户轨迹数据信息,对所述目标用户轨迹数据进行分析,识别出所述目标用户轨迹数据的用户类型。
8.根据权利要求1至7任一所述的方法,其特征在于,所述目标用户轨迹数据的指标信息包括:第一时间、第二时间、第一距离、第二距离、第三距离、驻留时长、轨迹类型、反复出现次数、轨迹点的距离和、经过的小区数;其中,
所述第一时间为用户轨迹数据的最早时间,所述第二时间为用户轨迹数据的最晚时间,所述第一距离为用户轨迹数据中进入所述机场区域范围前的最远距离,所述第二距离为用户轨迹数据中进入所述机场区域范围期间的最远距离,所述第三距离为用户轨迹数据中离开所述机场区域范围后的最远距离。
9.根据权利要求1至7任一所述的方法,其特征在于,所述机场区域的参数信息包括:异地往返时长阈值、机场跑道距离区域中心最远距离、常驻天数阈值、工作时长阈值。
10.根据权利要求1至7任一所述的方法,其特征在于,所述用户类型包括:到达旅客、出发旅客、中转旅客、外地往返旅客、本地往返旅客、工作人员、频繁往返机场人员、接送人员、路过人员。
11.一种用户识别装置,其特征在于,包括:
获取模块,用于根据各个小区的覆盖范围,获取与机场区域范围有重叠的目标小区;
提取模块,用于根据所述目标小区的小区类型,从用户轨迹数据中提取出与所述机场区域范围有交集的目标用户轨迹数据;
识别模块,用于根据所述目标用户轨迹数据的指标信息和机场区域的参数信息,识别出所述目标用户轨迹数据的用户类型。
12.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至10中任一项所述的方法。
13.一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如权利要求1至10中任一项所述的方法。
CN202111619404.5A 2021-12-27 2021-12-27 用户识别方法及装置、电子设备及介质 Pending CN114302333A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111619404.5A CN114302333A (zh) 2021-12-27 2021-12-27 用户识别方法及装置、电子设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111619404.5A CN114302333A (zh) 2021-12-27 2021-12-27 用户识别方法及装置、电子设备及介质

Publications (1)

Publication Number Publication Date
CN114302333A true CN114302333A (zh) 2022-04-08

Family

ID=80970220

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111619404.5A Pending CN114302333A (zh) 2021-12-27 2021-12-27 用户识别方法及装置、电子设备及介质

Country Status (1)

Country Link
CN (1) CN114302333A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116456281A (zh) * 2023-05-12 2023-07-18 中国电信股份有限公司广东研究院 基于种子用户轨迹确定共址用户的方法及相关设备

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120209658A1 (en) * 2009-08-24 2012-08-16 Kazuhisa Shibayama Population mobility estimation system, population mobility estimation method, and population mobility estimation program
JP2017021855A (ja) * 2016-10-19 2017-01-26 株式会社Agoop 情報処理システム、人口流量推定装置、プログラム、情報処理方法及び人口流量を推定する方法
CN107659642A (zh) * 2017-09-22 2018-02-02 中国联合网络通信集团有限公司 机场人员识别方法及装置
CN108696863A (zh) * 2017-04-11 2018-10-23 中国移动通信集团广东有限公司 一种基于lte信令识别机场旅客的方法和基站
CN109996299A (zh) * 2017-12-30 2019-07-09 中国移动通信集团河北有限公司 高铁用户识别方法、装置、设备及介质
CN110020980A (zh) * 2019-04-08 2019-07-16 江苏号百信息服务有限公司 基于手机信令数据的机场到发旅客识别与客情分析方法
CN110113718A (zh) * 2019-05-31 2019-08-09 南京瑞栖智能交通技术产业研究院有限公司 一种基于手机信令数据的铁路交通枢纽人口类型识别方法
CN110245981A (zh) * 2019-05-31 2019-09-17 南京瑞栖智能交通技术产业研究院有限公司 一种基于手机信令数据的人群类型识别方法
CN111651529A (zh) * 2020-05-26 2020-09-11 河北师范大学 基于手机信令数据的机场航空旅客分类识别方法
CN113282575A (zh) * 2021-03-29 2021-08-20 中铁第一勘察设计院集团有限公司 基于手机信令的铁路车站客流特征提取方法
CN113282637A (zh) * 2021-04-16 2021-08-20 北京工业大学 景区游客识别方法、装置、电子设备及存储介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120209658A1 (en) * 2009-08-24 2012-08-16 Kazuhisa Shibayama Population mobility estimation system, population mobility estimation method, and population mobility estimation program
JP2017021855A (ja) * 2016-10-19 2017-01-26 株式会社Agoop 情報処理システム、人口流量推定装置、プログラム、情報処理方法及び人口流量を推定する方法
CN108696863A (zh) * 2017-04-11 2018-10-23 中国移动通信集团广东有限公司 一种基于lte信令识别机场旅客的方法和基站
CN107659642A (zh) * 2017-09-22 2018-02-02 中国联合网络通信集团有限公司 机场人员识别方法及装置
CN109996299A (zh) * 2017-12-30 2019-07-09 中国移动通信集团河北有限公司 高铁用户识别方法、装置、设备及介质
CN110020980A (zh) * 2019-04-08 2019-07-16 江苏号百信息服务有限公司 基于手机信令数据的机场到发旅客识别与客情分析方法
CN110113718A (zh) * 2019-05-31 2019-08-09 南京瑞栖智能交通技术产业研究院有限公司 一种基于手机信令数据的铁路交通枢纽人口类型识别方法
CN110245981A (zh) * 2019-05-31 2019-09-17 南京瑞栖智能交通技术产业研究院有限公司 一种基于手机信令数据的人群类型识别方法
CN111651529A (zh) * 2020-05-26 2020-09-11 河北师范大学 基于手机信令数据的机场航空旅客分类识别方法
CN113282575A (zh) * 2021-03-29 2021-08-20 中铁第一勘察设计院集团有限公司 基于手机信令的铁路车站客流特征提取方法
CN113282637A (zh) * 2021-04-16 2021-08-20 北京工业大学 景区游客识别方法、装置、电子设备及存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
姚海芳;冯天楠;刘劲松;: "基于手机信令数据的机场航空旅客分类识别研究――以石家庄正定国际机场为例", 地理与地理信息科学, no. 03, 15 May 2020 (2020-05-15) *
程志华;: "基于手机信令数据的旅游交通客流特征分析――以乌鲁木齐市为例", 运输经理世界, no. 02, 5 April 2018 (2018-04-05) *
陈欢;: "基于手机信令数据的人员出行特征跟踪调查", 交通与运输(学术版), no. 01, 30 June 2017 (2017-06-30) *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116456281A (zh) * 2023-05-12 2023-07-18 中国电信股份有限公司广东研究院 基于种子用户轨迹确定共址用户的方法及相关设备

Similar Documents

Publication Publication Date Title
Bolbol et al. Inferring hybrid transportation modes from sparse GPS data using a moving window SVM classification
US8825383B1 (en) Extracting patterns from location history
US9313233B2 (en) Systems and methods for detecting associated devices
CN102595323A (zh) 基于手机定位数据的居民出行特征参数的获取方法
Liang et al. Individual travel behavior modeling of public transport passenger based on graph construction
Holleczek et al. Detecting weak public transport connections from cellphone and public transport data
Kujala et al. Estimation and monitoring of city-to-city travel times using call detail records
CN111212383A (zh) 区域常住人口数量的确定方法、装置、服务器和介质
CN111311193B (zh) 公共服务资源的配置方法和装置
Burkhard et al. On the requirements on spatial accuracy and sampling rate for transport mode detection in view of a shift to passive signalling data
CN108549976A (zh) 智慧旅游大数据分析方法
Yao et al. Understanding human activity and urban mobility patterns from massive cellphone data: Platform design and applications
Chen et al. Extracting bus transit boarding stop information using smart card transaction data
CN114302333A (zh) 用户识别方法及装置、电子设备及介质
CN105512996A (zh) 旅客最常出发地确定方法及系统
Chen et al. A travel mode identification framework based on cellular signaling data
CN118094382A (zh) 一种民用机场进港航空器滑入机坪道口预测方法及系统
Ou et al. Big data processing and analysis on the impact of COVID-19 on public transport delay
CN117807556A (zh) 一种人群疏散交通方式识别方法、系统
CN112699955A (zh) 一种用户分类方法、装置、设备及存储介质
CN109446437B (zh) 信息挖掘方法、装置、服务器及存储介质
Tu et al. Uncovering online sharing vehicle mobility patterns from massive GPS trajectories
Li et al. Travel patterns analysis of urban residents using automated fare collection system
Zhang et al. Extracting the complete travel trajectory of subway passengers based on mobile phone data
CN112566025B (zh) 公交客流来源去向识别方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination