CN110020980B - 基于手机信令数据的机场到发旅客识别与客情分析方法 - Google Patents

基于手机信令数据的机场到发旅客识别与客情分析方法 Download PDF

Info

Publication number
CN110020980B
CN110020980B CN201910275733.9A CN201910275733A CN110020980B CN 110020980 B CN110020980 B CN 110020980B CN 201910275733 A CN201910275733 A CN 201910275733A CN 110020980 B CN110020980 B CN 110020980B
Authority
CN
China
Prior art keywords
mobile phone
airport
signaling data
passenger
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910275733.9A
Other languages
English (en)
Other versions
CN110020980A (zh
Inventor
刘玲慧
王拓
黄强松
苏正洋
李青林
张雯
沙文萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Haobai Technology Co ltd
Original Assignee
Jiangsu Haobai Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Haobai Technology Co ltd filed Critical Jiangsu Haobai Technology Co ltd
Priority to CN201910275733.9A priority Critical patent/CN110020980B/zh
Publication of CN110020980A publication Critical patent/CN110020980A/zh
Application granted granted Critical
Publication of CN110020980B publication Critical patent/CN110020980B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • G06Q50/40
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/029Location-based management or tracking services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/30Services specially adapted for particular environments, situations or purposes
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Abstract

本发明公开了一种基于手机信令数据的机场到发旅客识别与客情分析方法,借助手机信令数据,通过机场区域手机用户清单抽取、飞机出行相关用户清单提取、飞机出行相关用户全市范围手机信令数据的读取与预处理、机场到发旅客识别4个步骤实现对用户的出行身份的详细识别,进而分析机场到发旅客量,挖掘客流属性特征。识别过程只需要知道用户当日首条手机信令数据和当日末条手机信令数据的区域位置,辅以中间的区域位置,较为准确地判别出用户的出行身份,进一步分析机场到达与出发旅客的客流量、客流属性、来源、去向等客情特征,为机场这一大型综合枢纽的客流管理与运力组织提供辅助决策。本发明误判几率小,受异常数据干扰影响低。

Description

基于手机信令数据的机场到发旅客识别与客情分析方法
技术领域
本发明涉及大数据技术领域,具体而言涉及一种基于手机信令数据的机场到发旅客识别与客情分析方法。
背景技术
机场客流统计和分析对机场的运行、甚至机场所在城市的城市规划和日常管理来讲至关重要,机场客流统计项目包括机场到达与出发客流量、客流属性、客流来源、客流去向等等,在掌握机场客流情况的前提下,有助于机场调整自身基建、航班航次、机场交通、机场工作人员调配等等。
前述机场客流统计项目均为动态数据,受多种因素影响,需要采用实时分析的方式,目前,通常选择对机场票务数据进行分析来获取前述信息,但这种方式存在两个问题。第一个问题,机场票务数据通常为隐私数据,难以获取或者获取不及时;第二个问题,这种分析方式,较难考虑到送机人员、或者路过机场人员带来的影响。
随着信息化和大数据技术的普及,通过手机信令数据获取居民的出行状况等技术手段开始出现。在无线通信系统中,信令是除了传输用户信息之外,为使全网有序工作,用来保证正常通信所需要的控制信号。信令触发的主要流程包括手机关机、主叫、被叫、收发短信、服务请求、位置区切换等。无通信系统记录的信令数据包含上报时间、用户标识、上报类型、基站CI编号、基站经纬度等可以反映用户实时位置的关键信息。
手机信令数据具有连续性和普遍性,可以对全网的用户进行全天候的覆盖。利用手机信令位置数据,可实现机场这一大型综合枢纽全域客流的实时监测。目前有利用用户乘坐飞机时手机开关机这一简单特征,监测信令数据在机场出现和消失情况,以区分机场到达与机场出发的旅客。这样虽然可以解决机场票务数据难以获取,数据获取不及时的难题,但该判断方式容易导致误判。
专利号为CN201811030386.5的发明专利“基于手机信令数据的机场旅客出行OD识别方法”中,公开了一种借助手机信令数据对机场旅客出行OD进行判断识别的方法,包括机场旅客出行定位点形成、定位点移动状态判断、出行起讫点判断、交通小区匹配与交通量统计四个步骤。在该方法中,一方面没有考虑到机场工作人员和机场常驻人员的因素,另一方面,该方法需要通过手机信令数据判断机场旅客的移动轨迹、行进方向,进一步判断每个定位点的特征是移动点或者停留点,也就是说,必须对每个用户的手机信令数据进行连续性分析,导致数据运算量较大,运行速度较慢,甚至当用户因为某些原因导致信令数据中断时,分析出现错误。
发明内容
本发明目的在于提供一种基于手机信令数据的机场到发旅客识别与客情分析方法,借助手机信令数据,通过机场区域手机用户清单抽取、飞机出行相关用户清单提取、飞机出行相关用户全市范围手机信令数据的读取与预处理、机场到发旅客识别4个步骤实现飞机出行用户中机场到达与机场出发旅客识别,为用户打上机场到达或机场出发的特征标签,同时进一步分析机场到达与出发旅客的客流量、客流属性、来源、去向等客情特征,为机场这一大型综合枢纽的客流管理与运力组织提供辅助决策。
为达成上述目的,结合图1,本发明提出一种基于手机信令数据的机场到发旅客识别与客情分析方法,所述方法包括:
S1:获取分析时段机场区域范围内的手机信令数据,抽取所述手机信令数据对应的手机用户的加密后的手机号码作为该手机用户的唯一标识码,创建机场区域手机用户清单。
S2:判定并且剔除所述机场区域手机用户清单的机场工作人员、机场区域常驻人员,生成飞机出行相关用户清单。
S3:获取所述飞机出行相关用户清单所对应的机场所在城市范围内的手机信令数据,生成手机信令数据集,对获取的手机信令数据集进行预处理。
S4:结合预处理后的手机信令数据集,根据设定的识别规则以识别所述飞机出行相关用户清单中每个手机用户的出行身份。
本发明提出,通过获取分析时段机场区域范围内的手机信令数据,获取这一时段范围内在机场区域出现过的机场区域手机用户清单,机场区域手机用户清单中包括机场到发旅客、机场工作人员、机场区域常驻人员、送机人员、路过机场人员等多种类型的用户。在机场区域手机用户清单中,按照对机场客流管理的影响等级由高到低排序,为机场到发旅客、送机人员、路过机场人员、机场工作人员/机场区域常驻人员,其中,机场到发旅客直接对机场航班、机场周边交通产生影响,送机人员、路过机场人员不对机场航班产生影响,但对机场周边交通产生影响。
以对机场客流管理的影响等级为例,由于机场工作人员/机场区域常驻人员对机场客流管理影响较小,本发明提出,从所述机场区域手机用户清单判别并剔除机场工作人员、机场区域常驻人员,生成飞机出行相关用户清单。飞机出行相关用户对机场客流管理影响较大,其中,机场到发旅客既对机场航班造成影响,也对机场交通和城市交通造成影响,而送机人员、路过机场人员对机场航班无影响,对机场交通和城市交通的影响较大,因此本发明提出,需要通过下述方式进一步判断飞机出行相关用户的出行身份:
获取所述飞机出行相关用户清单所对应的机场所在城市范围内的手机信令数据,生成手机信令数据集,对获取的手机信令数据集进行预处理后,结合预处理后的手机信令数据集,根据设定的识别规则以识别所述飞机出行相关用户清单中每个手机用户的出行身份,所述出行身份至少包括机场到达旅客、机场出发旅客、当天往返旅客、送机人员、路过机场人员。
在一些例子中,步骤S4中,所述结合预处理后的手机信令数据集,根据设定的识别规则以识别所述飞机出行相关用户清单中每个手机用户的出行身份的过程包括以下步骤:
S41:定义机场区域边界外的机场所在城市范围内的基站CI编号集为C2
S42:依次分析所述手机出行相关用户清单中的每个手机用户所对应的手机信令数据的CI编号,若所述手机用户的当日首条手机信令数据记录的CI编号属于机场基站CI集C1,则进入步骤S43,否则进入步骤S44。
S43:判断所述手机用户的当日末条手机信令数据记录的CI编号是否属于机场外基站CI集C2,如果是,判定该手机用户为机场到达旅客,否则,判定该手机用户为当天往返旅客。
S44:判断所述手机用户的当日末条手机信令数据记录的CI编号是否属于机场基站CI集C1,如果是,判定该手机用户为机场出发旅客,否则,判定所述手机用户属于送机人员和/或路过机场人员。
在前述飞机出行相关用户的出行身份识别清楚的前提下,所述方法还包括:
S5:输出并保存机场到达旅客和机场出发旅客的用户清单,根据设定的分析规则对机场到发旅客进行客情分析,为机场这一大型综合枢纽的客流管理与运力组织提供辅助决策。
优选的,所述客情分析包括到达与出发客流量、机场到达旅客和机场出发旅客在机场的停留时间、机场到达旅客和机场出发旅客的客流属性、机场到达旅客的来源省份和/或地市分布、机场到达旅客的市内目的地、机场出发旅客的市内来源地、机场出发旅客的目的省份和/或地市分布。
应当理解,在识别出飞机出行相关用户清单中每个手机用户的出行身份基础上,可以实现多种目的客情分析,例如送机人员和/或路过机场人员对机场周边交通运输的影响、对机场周边商铺的消费能力,机场到发旅客对航班的影响、对机场候机区域商铺的消费能力等等,用户可以根据实际需求,结合飞机出行相关用户清单中每个手机用户的出行身份数据,做进一步的客情分析。
以上本发明的技术方案,与现有相比,其显著的有益效果在于:
1)借助手机信令数据,通过飞机出行相关用户清单提取、飞机出行相关用户全市范围手机信令数据的读取与预处理、机场到发旅客识别、机场到发旅客的客情分析四个步骤,实现飞机出行用户中机场到达与机场出发旅客识别,为用户打上机场到达或机场出发的特征标签,同时进一步分析机场到达与出发旅客的客流量、客流属性、来源、去向等客情特征,为机场这一大型综合枢纽的客流管理与运力组织提供辅助决策。
2)对用户的出行身份进行了详细的识别,并且识别过程中无需对用户的连续行进方向进行分析,只需要知道用户当日首条手机信令数据和当日末条手机信令数据的区域位置,辅以中间的区域位置,即可较为准确地判别出用户的出行身份,从而获得更为精准的机场交通用户数据。
3)误判几率小,受异常数据干扰影响低。
应当理解,前述构思以及在下面更加详细地描述的额外构思的所有组合只要在这样的构思不相互矛盾的情况下都可以被视为本公开的发明主题的一部分。另外,所要求保护的主题的所有组合都被视为本公开的发明主题的一部分。
结合附图从下面的描述中可以更加全面地理解本发明教导的前述和其他方面、实施例和特征。本发明的其他附加方面例如示例性实施方式的特征和/或有益效果将在下面的描述中显见,或通过根据本发明教导的具体实施方式的实践中得知。
附图说明
附图不意在按比例绘制。在附图中,在各个图中示出的每个相同或近似相同的组成部分可以用相同的标号表示。为了清晰起见,在每个图中,并非每个组成部分均被标记。现在,将通过例子并参考附图来描述本发明的各个方面的实施例,其中:
图1是本发明的基于手机信令数据的机场到发旅客识别与客情分析方法的流程图。
图2是本发明的其中一种例子的方法流程图。
具体实施方式
为了更了解本发明的技术内容,特举具体实施例并配合所附图式说明如下。
结合图1,一种基于手机信令数据的机场到发旅客识别与客情分析方法,其特征在于,所述方法包括:
S1:获取分析时段机场区域范围内的手机信令数据,抽取所述手机信令数据对应的手机用户的加密后的手机号码作为该手机用户的唯一标识码,创建机场区域手机用户清单。
机场区域手机用户清单中包括机场到发旅客、机场工作人员、机场区域常驻人员、送机人员、路过机场人员等多种类型的用户。在机场区域手机用户清单中,若按照对机场客流管理的影响等级由高到低排序,为机场到发旅客、送机人员、路过机场人员、机场工作人员/机场区域常驻人员。
S2:判定并且剔除所述机场区域手机用户清单的机场工作人员、机场区域常驻人员,生成飞机出行相关用户清单。
由于机场工作人员/机场区域常驻人员对机场客流管理影响较小,本发明提出,从所述机场区域手机用户清单判别并剔除机场工作人员、机场区域常驻人员,生成飞机出行相关用户清单。
S3:获取所述飞机出行相关用户清单所对应的机场所在城市范围内的手机信令数据,生成手机信令数据集,对获取的手机信令数据集进行预处理。
S4:结合预处理后的手机信令数据集,根据设定的识别规则以识别所述飞机出行相关用户清单中每个手机用户的出行身份。
飞机出行相关用户对机场客流管理影响较大,其中,机场到发旅客既对机场航班造成影响,也对机场交通和城市交通造成影响,而送机人员、路过机场人员则对机场交通和城市交通的影响较大,因此本发明提出,需要进一步判断飞机出行相关用户的出行身份。优选的,所述出行身份包括机场到达旅客、机场出发旅客、当天往返旅客、送机人员、路过机场人员。
一、创建机场区域手机用户清单
结合图2,步骤S1中,所述获取分析时段内机场区域范围内的手机信令数据,抽取所述手机信令数据对应的手机用户的加密后的手机号码作为该手机用户的唯一标识码,创建机场区域手机用户清单的过程包括以下步骤:
S11:根据运营商移动通信网络基站的经纬度与城市机场分布区域边界,提取机场区域范围内所有基站的CI编号(即基站扇区的编号),组成机场基站CI集C1
S12:获取所有CI编号Ci属于机场基站CI集C1的手机信令数据,抽取所述手机信令数据对应的手机用户的加密后的手机号码作为该手机用户的唯一标识码,创建机场区域手机用户清单。
在符合运营商数据安全管理流程的环境下,读取运营商的手机信令数据,在分析时段内,若某条信令数据记录的CI编号Ci∈C1,则认为该条信令记录对应的手机用户在机场出现过,并抽取该手机用户的唯一标识码——加密后的手机号码,最后获得规定时间段内所有在机场区域出现过的机场区域手机用户的加密手机号码清单。
二、生成飞机出行相关用户清单
从机场区域手机用户的加密手机号码清单中剔除机场工作人员和机场区域常驻人员的手机号码,生成飞机出行相关用户的加密手机号码清单集M。
步骤S2中,所述判定并且剔除所述机场区域手机用户清单的机场工作人员、机场区域常驻人员,生成飞机出行相关用户清单的过程包括以下步骤:
S21:依次分析所述机场区域手机用户清单中的每个手机用户的历史数据,以识别每个手机用户的身份是否为出行身份:
1)若其中任意一个手机用户在过去X个工作日中,有X1个工作日的工作时段内在机场区域停留时长均超过第一设定时长,则判定该手机用户属于机场工作人员,X1<X。
2)若其中任意一个手机用户在过去Y天中,有Y1天的夜间休息时段在机场区域停留时长均超过第二设定时长,则判定该手机用户属于机场区域常驻人员,Y1<Y。
3)否则,判定该手机用户属于飞机出行相关用户。
S22:从所述机场区域手机用户清单中剔除所述机场区域手机用户清单的机场工作人员、机场区域常驻人员,生成飞机出行相关用户清单。
例如,机场工作人员判定方法如下:过去几个月中有足够天数的工作日于工作时段内在机场区域停留时长超过一定时长的人员;机场区域常驻人员判定方法如下:过去几个月中有足够天数于夜间休息时段在机场区域停留时长超过一定时长的人员。
具体的,按照机场工作人员判定规则,抽取过去一个月22个工作日中有11个工作日天及以上于9:00-18:00(机场工作时段)在机场停留时长超过4小时及以上的人员清单。
3)按照机场区域常驻人员判定规则,抽取过去一个月中有15天及以上于22:00-06:00(夜间休息时段)在指机场区域停留时长超过4小时及以上的人员清单,例如出租车司机、机场区域内的住户等等。
三、生成手机信令数据集,对获取的手机信令数据集进行预处理
步骤S3中,所述获取所述飞机出行相关用户清单所对应的机场所在城市范围内的手机信令数据,生成手机信令数据集,对获取的手机信令数据集进行预处理的过程包括以下步骤:
S31:以飞机出行相关用户清单为索引,从移动运营商通信网络记录的信令数据库中读取每个飞机出行相关用户在机场所在城市范围内产生的手机信令数据,生成手机信令数据集。
S32:对所述手机信令数据集进行预处理,所述预处理包括信令数据中有效位置信息字段提取、信令位置类数据时间排序、乒乓效应位置点合并、轨迹漂移点剔除、相邻时刻重复位置点合并。
根据飞机出行用户的加密手机号码,从移动运营商通信网络记录的信令数据库中读取所有用户在机场所在城市全市范围内的产生的手机信令数据,生成手机信令数据集。对获取的手机信令数据集进行预处理,所述预处理包括信令数据中有效位置信息字段提取、信令位置类数据时间排序、乒乓效应位置点合并、轨迹漂移点剔除、相邻时刻重复位置点合并。具体的:
(1)对于所有飞机出行相关用户的信令数据中有效位置信息,按时间序列进行排序。
(2)对信令位置类数据按时间先后进行迭代,对于相邻的信令位置上报时刻,当记录的位置点之间来回切换的次数大于等于2,则认为发生了乒乓效应,合并相关位置点。
(3)对信令位置类数据按时间先后进行迭代,若出现相邻信令数据记录时刻位置点之间的距离大于设定的阈值,则认为发生位置漂移,剔除漂移点位置信息。
(4)对于连续时间段内,用户信令位置类数据中记录的基站CI相同,则认为在这一时间段内该用户的位置点没有发生变化,将这一连续时间段内的多条信令数据合并成一条。
下面通过一个具体的例子对前述预处理过程进行阐述。
步骤S32中,所述对所述手机信令数据集进行预处理的过程包括以下步骤:
S321:定义飞机出行相关用户i在时刻j上传的手机信令数据中的位置类信息为Di(Mi,Tij,Cij,Lonij,Latij),其中,Mi为用户i的加密手机号,Tij为该手机信令数据的上报时间,Cij为该手机信令数据所对应的基站CI编号,Lonij为该手机信令数据所对应的基站经度,Latij为该手机信令数据所对应的基站纬度。
S322:针对每个飞机出行相关用户,将其所对应的所有手机信令数据中的位置类信息按照时间先后顺序进行排序。
S322:针对每个手机出行相关用户,将其所对应的所有手机信令数据中的位置类信息按时间先后进行迭代处理:
1)如果Cij≠Ci(j+1),且Cij=Ci(j+2)、Ci(j+1)=Ci(j+3),则认为发生了乒乓效应,合并相关位置点:合并Di(Mi,Tij,Cij,Lonij,Latij)和Di(Mi,Ti(j+2),Ci(j+2),Loni(j+2),Lati(j+2))为Di(Mi,Tij,Cij,Lonij,Latij),合并Di(Mi,Ti(j+1),Ci(j+1),Loni(j+1),Lati(j+1))和Di(Mi,Ti(j+3),Ci(j+3),Loni(j+3),Lati(j+3))为Di(Mi,Ti(j+1),Ci(j+1),Loni(j+1),Lati(j+1))。
2)如果相邻时刻Tij和Ti(j+1)记录的(Lonij,Latij)和(Loni(j+1),Lati(j+1))之间的距离大于设定距离阈值,则认为发生位置漂移,剔除漂移点位置信息,例如剔除Di(Mi,Ti(j+1),Ci(j+1),Loni(j+1),Lati(j+1))。
3)如果相邻时刻Tij和Ti(j+1)记录的Cij=Ci(j+1),则认为在Tij至Ti(j+1)这一时间段内该用户的位置点没有发生变化,将这一连续时间段内的多条信令数据合并成一条,例如合并Di(Mi,Tij,Cij,Lonij,Latij)和Di(Mi,Ti(j+1),Ci(j+1),Loni(j+1),Lati(j+1))为Di(Mi,Tij,Cij,Lonij,Latij)。
四、识别所述飞机出行相关用户清单中每个手机用户的出行身份
步骤S4中,所述结合预处理后的手机信令数据集,根据设定的识别规则以识别所述飞机出行相关用户清单中每个手机用户的出行身份的过程包括以下步骤:
S41:定义机场区域边界外的机场所在城市范围内的基站CI编号集为C2
S42:依次分析所述手机出行相关用户清单中的每个手机用户所对应的手机信令数据的CI编号,若所述手机用户的当日首条手机信令数据记录的CI编号属于机场基站CI集C1,则进入步骤S43,否则进入步骤S44。
S43:判断所述手机用户的当日末条手机信令数据记录的CI编号是否属于机场外基站CI集C2,如果是,判定该手机用户为机场到达旅客,否则,判定该手机用户为当天往返旅客。
S44:判断所述手机用户的当日末条手机信令数据记录的CI编号是否属于机场基站CI集C1,如果是,判定该手机用户为机场出发旅客,否则,判定所述手机用户属于送机人员和/或路过机场人员。即:
1)若所述手机用户的当日首条手机信令数据记录的CI编号属于机场基站CI集C1,且所述手机用户的当日末条手机信令数据记录的CI编号是否属于机场外基站CI集C2,判定该手机用户为机场到达旅客。
2)若所述手机用户的当日首条手机信令数据记录的CI编号和当日末条手机信令数据记录的CI编号均属于机场基站CI集C1,判定该手机用户为当天往返旅客。
3)判断所述手机用户的当日首条手机信令数据记录的CI编号属于机场外基站CI集C2,且所述手机用户的当日末条手机信令数据记录的CI编号是否属于机场基站CI集C1,判定该手机用户为机场出发旅客。
4)否则,判定所述手机用户属于送机人员和/或路过机场人员。
下面通过一个例子对前述判别过程进行阐述。
定义除机场区域边界外的机场所在城市范围内的基站CI编号集为C2,当Cij∈C1时,记一天中Tij最小值为Tmin(i,1),最大值为Tmax(i,1),当Cij∈C2,记录一天中Tij最小值为Tmin(i,2),最大值为Tmax(i,2)。
a)当Tmin(i,1)<Tmax(i,1)<Tmin(i,2)<Tmax(i,2)时,用户i的行程为:首次出现在机场区域内,继而出行并于当天停留在机场所在城市除机场外的区域(为了便于描述,下面以市内替代机场所在城市除机场外的区域),则认为用户i为机场到达旅客。
b)当Tmin(i,2)<Tmax(i,2)<Tmin(i,1)<Tmax(i,1)时,用户i的行程为:首次出现在市内,出行至机场区域内并且当天未再返回市内,则认为用户i为机场出发旅客。
c)当Tmin(i,1)<Tmin(i,2)<Tmax(i,2)<Tmax(i,1)时,用户i的行程为:首次出现在机场区域,中间出行至市内,继而返回机场区域,并于当天未在返回市内,则认为用户i当天往返,即该用户既是机场的到达旅客,也是机场的出发旅客。
d)当Tmin(i,2)<Tmin(i,1)<Tmax(i,1)<Tmax(i,2)时,用户i的行程为:首次出现在在市内,中间出现在机场区域,并于当天返回了市内,则认为用户i为送机人员或是路过机场人员。
采用前述方法,对用户的出行身份进行了详细的划分,并且识别过程中无需对用户的连续行进方向进行分析,只需要知道用户当日首条手机信令数据和当日末条手机信令数据的区域位置,辅以中间的区域位置,即可较为准确地判别出用户的出行身份,从而获得更为精准的机场交通用户数据,运算量小,运算速度快。另外,即使用户的某几条信令数据错误、或者信令数据因某些因素消失一段时间,也很难影响到最终的识别结果,误判几率小,受异常数据干扰影响低。
五、根据设定的分析规则对机场到发旅客进行客情分析
结合图1,在前述飞机出行相关用户的出行身份识别清楚的前提下,所述方法还包括:
S5:输出并保存机场到达旅客和机场出发旅客的用户清单,根据设定的分析规则对机场到发旅客进行客情分析,为机场这一大型综合枢纽的客流管理与运力组织提供辅助决策。
优选的,所述客情分析包括到达与出发客流量、机场到达旅客和机场出发旅客在机场的停留时间、机场到达旅客和机场出发旅客的客流属性、机场到达旅客的来源省份和/或地市分布、机场到达旅客的市内目的地、机场出发旅客的市内来源地、机场出发旅客的目的省份和/或地市分布。
在某些特殊场合下,还需要结合到达旅客的手机号码的归属地、手机号码登记信息、机场出发旅客在飞离机场后第一次出现的手机漫游数据,对机场到发旅客进行客情分析,例如:
1)在用户打上机场到达旅客和机场出发旅客标签的基础上,按规定时间段统计分析机场的到达与出发客流量、机场到达客与出发旅客在机场的停留时间等。
2)根据到达与出发旅客的手机号码登记信息,统计分析机场到达与出发旅客的性别与年龄属性分布情况等。
3)根据到达旅客的手机号码的归属地,统计分析机场到达旅客飞抵机场前的来源省份和/地市分布等。
4)根据到达旅客离开机场后在机场所在城市区域内上报的位置类信令数据,分析到达旅客的市内目的地。其中,目的地判定规则为:用户离开交通枢纽后,按时间序列排序,第一个停留时间超过2小时的区县为其目的地。
5)根据出发旅客到达机场前在机场所在城市区域内上报的位置信令数据,分析出发旅客的市内来源地。其中,出发旅客来源地判定规则:用户达到交通枢纽前,按时间序列排序,最后一个停留时间超过2小时的区县为其来源地。
6)根据出发旅客在飞离机场后,第一次出现的手机漫游数据,分析出发旅客的去向省份和/或城市分布。
利用本发明方法,按照实施方案所述,以南京禄口机场作为研究对象,对机场的到达与出发旅客进行识别,统计分析了2018年9月一个月的机场出发旅客量。与实际票务数据对比分析,准确率达到90%。在识别禄口机场出发旅客的基础上分析得到:出发旅客的男女性别占比分别为47.09%和52.91%;年龄分布情况为22岁以下3.55%,23-35岁32.28%,36-45岁26.68%,46-55岁24.87%,56岁以上12.61%;出发旅客的平均停留时长为187min。
在本公开中参照附图来描述本发明的各方面,附图中示出了许多说明的实施例。本公开的实施例不必定义在包括本发明的所有方面。应当理解,上面介绍的多种构思和实施例,以及下面更加详细地描述的那些构思和实施方式可以以很多方式中任意一种来实施,这是因为本发明所公开的构思和实施例并不限于任何实施方式。另外,本发明公开的一些方面可以单独使用,或者与本发明公开的其他方面的任何适当组合来使用。
虽然本发明已以较佳实施例揭露如上,然其并非用以限定本发明。本发明所属技术领域中具有通常知识者,在不脱离本发明的精神和范围内,当可作各种的更动与润饰。因此,本发明的保护范围当视权利要求书所界定者为准。

Claims (8)

1.一种基于手机信令数据的机场到发旅客识别与客情分析方法,其特征在于,所述方法包括:
S1:获取分析时段机场区域范围内的手机信令数据,抽取所述手机信令数据对应的手机用户的加密后的手机号码作为该手机用户的唯一标识码,创建机场区域手机用户清单;
S2:判定并且剔除所述机场区域手机用户清单的机场工作人员、机场区域常驻人员,生成飞机出行相关用户清单;
S3:获取所述飞机出行相关用户清单所对应的机场所在城市范围内的手机信令数据,生成手机信令数据集,对获取的手机信令数据集进行预处理;具体包括如下子步骤:
S31:以飞机出行相关用户清单为索引,从移动运营商通信网络记录的信令数据库中读取每个飞机出行相关用户在机场所在城市范围内产生的手机信令数据,生成手机信令数据集;
S32:对所述手机信令数据集进行预处理,所述预处理包括信令数据中有效位置信息字段提取、信令位置类数据时间排序、乒乓效应位置点合并、轨迹漂移点剔除、相邻时刻重复位置点合并;
所述对所述手机信令数据集进行预处理的过程包括以下步骤:
S321:定义飞机出行相关用户i在时刻j上传的手机信令数据中的位置类信息为Di(Mi,Tij,Cij,Lonij,Latij),其中,Mi为用户i的加密手机号,Tij为该手机信令数据的上报时间,Cij为该手机信令数据所对应的基站CI编号,Lonij为该手机信令数据所对应的基站经度,Latij为该手机信令数据所对应的基站纬度;
S322:针对每个飞机出行相关用户,将其所对应的所有手机信令数据中的位置类信息按照时间先后顺序进行排序;
S322:针对每个手机出行相关用户,将其所对应的所有手机信令数据中的位置类信息按时间先后进行迭代处理:
1)如果Cij≠Ci(j+1),且Cij=Ci(j+2)、Ci(j+1)=Ci(j+3),则合并Di(Mi,Tij,Cij,Lonij,Latij)和Di(Mi,Ti(j+2),Ci(j+2),Loni(j+2),Lati(j+2))为Di(Mi,Tij,Cij,Lonij,Latij),合并Di(Mi,Ti(j+1),Ci(j+1),Loni(j+1),Lati(j+1))和Di(Mi,Ti(j+3),Ci(j+3),Loni(j+3),Lati(j+3))为Di(Mi,Ti(j+1),Ci(j+1),Loni(j+1),Lati(j+1));
2)如果相邻时刻Tij和Ti(j+1)记录的(Lonij,Latij)和(Loni(j+1),Lati(j+1))之间的距离大于设定距离阈值,剔除Di(Mi,Ti(j+1),Ci(j+1),Loni(j+1),Lati(j+1));
3)如果相邻时刻Tij和Ti(j+1)记录的Cij=Ci(j+1),则合并Di(Mi,Tij,Cij,Lonij,Latij)和Di(Mi,Ti(j+1),Ci(j+1),Loni(j+1),Lati(j+1))为Di(Mu,Tuj,Cij,Lonij,Latij);
S4:结合预处理后的手机信令数据集,根据设定的识别规则以识别所述飞机出行相关用户清单中每个手机用户的出行身份。
2.根据权利要求1所述的基于手机信令数据的机场到发旅客识别与客情分析方法,其特征在于,所述出行身份包括机场到达旅客、机场出发旅客、当天往返旅客、送机人员、路过机场人员。
3.根据权利要求1所述的基于手机信令数据的机场到发旅客识别与客情分析方法,其特征在于,步骤S1中,所述获取分析时段内机场区域范围内的手机信令数据,抽取所述手机信令数据对应的手机用户的加密后的手机号码作为该手机用户的唯一标识码,创建机场区域手机用户清单的过程包括以下步骤:
S11:根据运营商移动通信网络基站的经纬度与城市机场分布区域边界,提取机场区域范围内所有基站的CI编号,组成机场基站CI集C1
S12:获取所有CI编号Ci属于机场基站CI集C1的手机信令数据,抽取所述手机信令数据对应的手机用户的加密后的手机号码作为该手机用户的唯一标识码,创建机场区域手机用户清单。
4.根据权利要求1所述的基于手机信令数据的机场到发旅客识别与客情分析方法,其特征在于,步骤S2中,所述判定并且剔除所述机场区域手机用户清单的机场工作人员、机场区域常驻人员,生成飞机出行相关用户清单的过程包括以下步骤:
依次分析所述机场区域手机用户清单中的每个手机用户的历史数据,以识别每个手机用户的身份是否为出行身份:
1)若其中任意一个手机用户在过去X个工作日中,有X1个工作日的工作时段内在机场区域停留时长均超过第一设定时长,则判定该手机用户属于机场工作人员,X1<X;
2)若其中任意一个手机用户在过去Y天中,有Y1天的夜间休息时段在机场区域停留时长均超过第二设定时长,则判定该手机用户属于机场区域常驻人员,Y1<Y;
3)否则,判定该手机用户属于飞机出行相关用户;
从所述机场区域手机用户清单中剔除所述机场区域手机用户清单的机场工作人员、机场区域常驻人员,生成飞机出行相关用户清单。
5.根据权利要求1所述的基于手机信令数据的机场到发旅客识别与客情分析方法,其特征在于,步骤S4中,所述结合预处理后的手机信令数据集,根据设定的识别规则以识别所述飞机出行相关用户清单中每个手机用户的出行身份的过程包括以下步骤:
S41:定义机场区域边界外的机场所在城市范围内的基站CI编号集为C2
S42:依次分析所述手机出行相关用户清单中的每个手机用户所对应的手机信令数据的CI编号,若所述手机用户的首条手机信令数据记录的CI编号属于机场基站CI集C1,则进入步骤S43,否则进入步骤S44;
S43:判断所述手机用户的末条手机信令数据记录的CI编号是否属于机场外基站CI集C2,如果是,判定该手机用户为机场到达旅客,否则,判定该手机用户为当天往返旅客;
S44:判断所述手机用户的末条手机信令数据记录的CI编号是否属于机场基站CI集C1,如果是,判定该手机用户为机场出发旅客,否则,判定所述手机用户属于送机人员和/或路过机场人员。
6.根据权利要求1-5任意一项中所述的基于手机信令数据的机场到发旅客识别与客情分析方法,其特征在于,所述方法还包括:
输出并保存机场到达旅客和机场出发旅客的用户清单;
根据设定的分析规则对机场到发旅客进行客情分析。
7.根据权利要求6所述的基于手机信令数据的机场到发旅客识别与客情分析方法,其特征在于,所述方法还包括:
结合到达旅客的手机号码的归属地、手机号码登记信息、机场出发旅客在飞离机场后第一次出现的手机漫游数据,对机场到发旅客进行客情分析。
8.根据权利要求7所述的基于手机信令数据的机场到发旅客识别与客情分析方法,其特征在于,所述客情分析包括到达与出发客流量、机场到达旅客和机场出发旅客在机场的停留时间、机场到达旅客和机场出发旅客的客流属性、机场到达旅客的来源省份和/或地市分布、机场到达旅客的市内目的地、机场出发旅客的市内来源地、机场出发旅客的目的省份和/或地市分布。
CN201910275733.9A 2019-04-08 2019-04-08 基于手机信令数据的机场到发旅客识别与客情分析方法 Active CN110020980B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910275733.9A CN110020980B (zh) 2019-04-08 2019-04-08 基于手机信令数据的机场到发旅客识别与客情分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910275733.9A CN110020980B (zh) 2019-04-08 2019-04-08 基于手机信令数据的机场到发旅客识别与客情分析方法

Publications (2)

Publication Number Publication Date
CN110020980A CN110020980A (zh) 2019-07-16
CN110020980B true CN110020980B (zh) 2023-08-18

Family

ID=67190760

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910275733.9A Active CN110020980B (zh) 2019-04-08 2019-04-08 基于手机信令数据的机场到发旅客识别与客情分析方法

Country Status (1)

Country Link
CN (1) CN110020980B (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110751102B (zh) * 2019-10-22 2023-12-22 天津财经大学 京津冀三地机场客流关联性分析方法及装置
CN111385753B (zh) * 2019-10-24 2022-01-04 南京瑞栖智能交通技术产业研究院有限公司 一种基于手机信令数据的医疗设施可达性评估方法
CN112804639B (zh) * 2019-11-14 2022-07-12 中国电信股份有限公司 预出行用户识别和装置、计算机可读存储介质
CN113079465A (zh) * 2020-01-06 2021-07-06 深圳市嘉盈资讯有限公司 一种基于运营商数据的机场新下机乘客分析方法及系统
CN111476409B (zh) * 2020-03-30 2023-07-18 海南太美航空股份有限公司 一种新航线开通的预测方法、系统及设备
CN111601240B (zh) * 2020-04-21 2021-06-15 上海因势智能科技有限公司 基于移动终端和基站进行人群轨迹计算的方法
CN111651529A (zh) * 2020-05-26 2020-09-11 河北师范大学 基于手机信令数据的机场航空旅客分类识别方法
CN112087743A (zh) * 2020-09-18 2020-12-15 广州瀚信通信科技股份有限公司 一种面向智慧交通的高铁虚拟卡口到发旅客分析方法
CN112100310A (zh) * 2020-11-19 2020-12-18 南京中孚信息技术有限公司 一种基于电查电围数据的身份识别方法及系统
CN112633108B (zh) * 2020-11-20 2023-04-07 移通科技(杭州)有限公司 基于数据治理的人流监测分析系统和方法
CN112469073B (zh) * 2020-11-24 2021-07-09 中国信息通信研究院 在通信网络中确定乒乓效应号码的方法、装置及存储介质
CN112822639A (zh) * 2020-12-18 2021-05-18 河北师范大学 基于手机信令的进出港旅客机场腹地范围划定方法
CN113283508B (zh) * 2021-05-28 2023-11-10 中国联合网络通信集团有限公司 客流预测方法、装置、设备及存储介质
CN114040495A (zh) * 2021-10-13 2022-02-11 广州瀚信通信科技股份有限公司 基于手机位置信息的联防联控方法及装置
CN114302333A (zh) * 2021-12-27 2022-04-08 中国电信股份有限公司 用户识别方法及装置、电子设备及介质
CN116304594B (zh) * 2023-05-11 2023-09-08 北京融信数联科技有限公司 一种基于通信数据的用户区域识别方法、系统及介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108696863A (zh) * 2017-04-11 2018-10-23 中国移动通信集团广东有限公司 一种基于lte信令识别机场旅客的方法和基站
CN108961134A (zh) * 2018-09-05 2018-12-07 北京工业大学 基于手机信令数据的机场旅客出行od识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104732756A (zh) * 2013-12-24 2015-06-24 中兴通讯股份有限公司 一种利用移动通信数据挖掘进行公交规划的方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108696863A (zh) * 2017-04-11 2018-10-23 中国移动通信集团广东有限公司 一种基于lte信令识别机场旅客的方法和基站
CN108961134A (zh) * 2018-09-05 2018-12-07 北京工业大学 基于手机信令数据的机场旅客出行od识别方法

Also Published As

Publication number Publication date
CN110020980A (zh) 2019-07-16

Similar Documents

Publication Publication Date Title
CN110020980B (zh) 基于手机信令数据的机场到发旅客识别与客情分析方法
US10674315B2 (en) Method and device for judging intercity transportation mode based on mobile phone data
US10311660B2 (en) Passenger flow determination
CN111653099B (zh) 基于手机信令数据的公交客流od获取方法
CN111079875A (zh) 基于多源数据的公共交通客流监测方法、装置和存储介质
WO2015096400A1 (zh) 一种利用移动通信数据挖掘进行公交规划的方法
US9843920B2 (en) Monitoring transport systems network traffic using mobile communications network usage records
Yong et al. Mining metro commuting mobility patterns using massive smart card data
CN111932925A (zh) 一种公共交通站点的出行客流的确定方法、装置及系统
CN115168529B (zh) 一种基于手机定位数据的枢纽客流溯源方法
Iliopoulou et al. Identifying spatio-temporal patterns of bus bunching in urban networks
CN108563717A (zh) 一种基于信息融合的共享单车故障识别与应用系统
CN110910293A (zh) 一种基于基站位置的地铁人群行为标签识别方法
CN112118548A (zh) 一种大数据识别常住人口与流动人口的方法和存储设备
Guo et al. Exploring potential travel demand of customized bus using smartcard data
Burrieza-Galán et al. A methodology for understanding passenger flows combining mobile phone records and airport surveys: Application to Madrid-Barajas Airport after the COVID-19 outbreak
Lu et al. Taxi queue, passenger queue or no queue?
Jang et al. Pedestrian mode identification, classification and characterization by tracking mobile data
Song et al. Public transportation service evaluations utilizing seoul transportation card data
Chen et al. Extracting bus transit boarding and alighting information using smart card transaction data
Lwin et al. Identification of various transport modes and rail transit behaviors from mobile CDR data: A case of Yangon City
Pokusaev et al. Anomalies in transport data
CN114141008A (zh) 一种基于手机信令数据的新型共享公共交通服务区域选取方法
Wang et al. Travel patterns analysis of urban residents using automated fare collection system
Li-Jun et al. Evaluation of the reliability of bus service based on gps and smart card data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: No. 501, Zhongshan South Road, Nanjing, Jiangsu 210000

Applicant after: Jiangsu Haobai Technology Co.,Ltd.

Address before: No. 501, Zhongshan South Road, Nanjing, Jiangsu 210000

Applicant before: JIANGSU BEST TONE INFORMATION SERVICE CO.,LTD.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant