CN107222886B - 一种基于手机数据测算城际人信综合联系强度的方法 - Google Patents

一种基于手机数据测算城际人信综合联系强度的方法 Download PDF

Info

Publication number
CN107222886B
CN107222886B CN201710321840.1A CN201710321840A CN107222886B CN 107222886 B CN107222886 B CN 107222886B CN 201710321840 A CN201710321840 A CN 201710321840A CN 107222886 B CN107222886 B CN 107222886B
Authority
CN
China
Prior art keywords
city
data
day
days
cities
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201710321840.1A
Other languages
English (en)
Other versions
CN107222886A (zh
Inventor
邹亚华
刘胜平
陈明威
陆俊贤
王璐婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Yundi Information Technology Co ltd
Original Assignee
Shanghai Yundi Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Yundi Information Technology Co ltd filed Critical Shanghai Yundi Information Technology Co ltd
Priority to CN201710321840.1A priority Critical patent/CN107222886B/zh
Publication of CN107222886A publication Critical patent/CN107222886A/zh
Application granted granted Critical
Publication of CN107222886B publication Critical patent/CN107222886B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/08Testing, supervising or monitoring using real traffic
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Tourism & Hospitality (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Quality & Reliability (AREA)
  • Educational Administration (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Remote Sensing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种基于手机数据测算城际人信综合联系强度的方法,该方法通过获取两城市的手机信令数据和手机点对点通讯数据,通过识别、剔除后获得有效的数据,进而测算获得两城市之间的交互通讯量和双向客流量,识别其与手机网络总用户量的比值,并根据工作日与休息日的不同情况赋予不同的权重,进而综合测算得出两城之间的人信综合联系强度。本发明的优点是,充分依托现有的无线通信网络信息资源,利用已有手机网络中的时间、空间数据,综合测算取得城际人信综合联系强度,实现低成本、高采样、低误测、高实效地获取城际人信综合联系强度,其测算结果具有可比性、科学性、实用性和综合性。

Description

一种基于手机数据测算城际人信综合联系强度的方法
技术领域
本发明属于数据测算技术领域,具体涉及一种基于手机数据测算城际人信综合联系强度的方法。
背景技术
近年来,随着我国城市化高速发展,全国的城市化率已经超过了50%。由于现代交通和通讯的便利条件,城市群越来越多,城市之间的联系越来越密切,这种密切联系尤其反映在城际之间的人流、通讯流的总量不断增加。因此,如何衡量城市之间的联系密切情况,就需要使用联系强度的概念,而这一概念一直得不到准确的衡量和测算。
在区域城市发展研究、城市规划、交通规划以及城市管理中,迫切需要衡量与测算出城际联系强度,并且这种强度测算最好不是单一指标,既要有客流联系的考量,也要有通讯流联系的考量。
由此,引入了“城际人信综合联系强度”的概念,具体是指综合测算两城市之间的双向客流量和交互通讯量。
发明内容
本发明的目的是根据上述现有技术的不足之处,提供一种基于手机数据测算城际人信综合联系强度的方法,该方法根据两城市之间的交互通讯量和双向客流量,识别其与手机网络总用户量的比值,并根据工作日与休息日的不同情况赋予不同的权重,进而综合测算得出两城之间的人信综合联系强度,即综合考量了工作日、周末、双向客流量、交互通讯量四种不同因素。
本发明目的实现由以下技术方案完成:
一种基于手机数据测算城际人信综合联系强度的方法,其特征在于所述方法包括以下步骤:
(1)获取任一手机运营商分别在城市A和B中连续n天的手机信令数据,n≥28,识别测算所述手机信令数据中的每日有效用户总量,将城市A和B在n天内的各工作日有效用户总量
Figure GDA0002292726130000011
分别拼接成数列{A(1)}、{B(1)},将城市A和B在n天内的各休息日有效用户总量
Figure GDA0002292726130000012
分别拼接成数列{A(0)}、{B(0)};其中,i表示n天内的第i个工作日,j表示n天内的第j个休息日;
(2)获取所述手机运营商分别在城市A和B中连续n天的通讯数据,n≥28,识别测算所述通讯数据中的每日有效用户总量,将城市A和B在n天内的各工作日有效用户总量
Figure GDA0002292726130000021
分别拼接成数列{a(1)}、{b(1)},将城市A和B在n天内的各休息日有效用户总量
Figure GDA0002292726130000022
分别拼接成数列{a(0)}、{b(0)};其中,i表示n天内的第i个工作日,j表示n天内的第j个休息日;
(3)对所述手机信令数据在n天内的有效用户总量的稳定性进行检验,剔除其中不符合稳定性条件的日期;对所述通讯数据在n天内的有效用户总量的稳定性进行检验,剔除其中不符合稳定性条件的日期;经过稳定性检验、剔除不符合稳定性条件的日期后,从剩下的日期中挑选,挑选条件必须满足:A、B两城日期同步、日期连续、天数大于等于7天的数据,舍弃其余不连续日期的所有数据,整理得到如下各组数据:
Figure GDA0002292726130000023
其中,i≥5,j≥2,并且i和j在日历表上连续;
(4)根据步骤(1)和(3),识别、测算城市A和B之间基于所述手机信令数据的工作日和休息日的双向客流量
Figure GDA0002292726130000024
客流量以人次计;
(5)根据步骤(2)和(3),识别、测算城市A和B之间基于所述通讯数据的工作日和休息日的交互通讯量
Figure GDA0002292726130000025
交互通讯量以人次计;
(6)基于步骤(4)和(5)所获得的数据,进行突发性检查:当城市A和B同为工作日或同为休息日时的双向客流量相差大于10%时,或是当城市A和B同为工作日或同为休息日时的双向交互通讯量相差大于15%时,剔除对应该日期的所有数据;之后,从剩下的天数中挑选,条件须满足城市A和B时期同步、日期连续、天数等于7天的数据,舍弃其余日期的所有数据,整理得到如下各组数据:
Figure GDA0002292726130000026
其中,i=1~5,j=1~2,并且i和j在日历表上连续;
(7)根据步骤(6),整理城际人信综合联系强度测算的基础数据,包括信令数据有效用户总量均值
Figure GDA0002292726130000027
通讯数据有效用户总量均值
Figure GDA0002292726130000028
Figure GDA0002292726130000029
两城双向客流量均值
Figure GDA00022927261300000210
两城交互通讯量均值
Figure GDA00022927261300000211
Figure GDA00022927261300000212
其中,
Figure GDA00022927261300000213
分别表示城市A工作日、休息日信令数据有效用户总量均值;
Figure GDA00022927261300000214
分别表示城市B工作日、休息日信令数据有效用户总量均值;
Figure GDA00022927261300000215
Figure GDA00022927261300000216
分别表示城市A工作日、休息日的通讯数据有效用户总量均值;
Figure GDA00022927261300000217
分别表示城市B工作日、休息日的通讯数据有效用户总量均值;
Figure GDA00022927261300000218
分别表示工作日、休息日的两城双向客流量均值;
Figure GDA00022927261300000219
分别表示工作日、休息日的两城交互通讯量均值;
(8)根据步骤(7),利用信令数据有效用户总量均值
Figure GDA00022927261300000220
和两城双向客流量均值
Figure GDA0002292726130000031
分别计算获得工作日和休息日的城际客流联系强度;利用通讯数据有效用户总量均值
Figure GDA0002292726130000032
和两城交互通讯量均值
Figure GDA0002292726130000033
分别计算工作日和休息日的城际通讯流联系强度;依此,计算城际人信综合联系强度。
步骤(1)中,识别测算所述手机信令数据中的每日有效用户总量的方法为:所述手机信令数据中的每个用户记录须满足驻留时长可靠性条件,才可识别为当天所在城市的有效用户,所述可靠性条件为:
TZs-TZr≥120分钟
其中,TZs是指在一天计时周期内,用户于所在城市的尾记录的时间;TZr是指在一天计时周期内,用户于所在城市的首记录的时间。
步骤(2)中,识别测算所述通讯数据中的每日有效用户总量的方法为:在一天的计时周期内,任意用户在所在城市的所述通讯数据中显示有“打电话、接电话、发送短信、接收短信”中的任何一个数据记录,才可识别为当天所在城市的有效用户。
步骤(3)中,对所述手机信令数据在n天内的有效用户总量的稳定性进行检验的方法为:基于步骤(1),分别对工作日与休息日的四组数据{A(1)}、{B(1)}、{A(0)}、{B(0)}做环比2日移动平均:
Figure GDA0002292726130000034
Figure GDA0002292726130000035
Figure GDA00022927261300000311
Figure GDA0002292726130000036
Figure GDA0002292726130000037
表明城市A的工作日数据不稳定,剔除第i+1天城市A和B的所有数据;
Figure GDA0002292726130000038
表明城市B的工作日数据不稳定,剔除第i+1天城市A和B的所有数据;
Figure GDA0002292726130000039
表明城市A的休息日数据不稳定,剔除第j+1天城市A和B的所有数据;
Figure GDA00022927261300000310
表明城市B的休息日数据不稳定,剔除第j+1天城市A和B的所有数据;
对所述通讯数据在n天内的有效用户总量的稳定性进行检验的方法为:基于步骤(2),分别对工作日与休息日四组数据
Figure GDA0002292726130000041
做环比2日移动平均:
Figure GDA0002292726130000042
Figure GDA0002292726130000043
Figure GDA0002292726130000044
Figure GDA0002292726130000045
Figure GDA0002292726130000046
表明城市A的工作日数据不稳定,剔除第i+1天城市A和B的所有数据;
Figure GDA0002292726130000047
表明城市B的工作日数据不稳定,剔除第i+1天城市A和B的所有数据;
Figure GDA0002292726130000048
表明城市A的休息日数据不稳定,剔除第j+1天城市A和B的所有数据;
Figure GDA0002292726130000049
表明城市B的休息日数据不稳定,剔除第j+1天城市A和B的所有数据。
步骤(4)中所述双向客流量的测算方法为:在一天的计时周期内,同一个手机用户在城市A和B中的所述手机信令数据中均有记录,且每次在城市A或B中的驻留时间均超过1小时以上,则识别该手机用户为有效停留;手机用户在城市A和B中停留时间的先后顺序分为如下情况,均识别为双向客流量的有效计次:
计为1次的:A→B,或B→A;
计为2次的:A→B→A,或B→A→B;
…;
计为2n-1次的:A→B→…→B,或B→A→…→A;
计为2n次的:A→B→…→A,或B→A→…→B;
基于上述有效计次,分别测算工作日和休息日每天城市A与城市B之间的双向客流总量:
Figure GDA00022927261300000410
Figure GDA00022927261300000411
步骤(5)中所述交互通讯量的测算方法为:在满足打电话双方或是收发短信的双方分别在城市A和城市B内的情况下,进行城市A和B之间交互通讯的有效计次,有效计次包括如下情况:
城市A和城市B内的所有手机呼出电话次数,包括城市A内手机呼城市B内手机或座机,城市B内手机呼城市A内手机或座机;
城市A和城市B内的所有接收非手机打来音讯电话次数;
城市A和城市B内所有发出短信的次数;
基于上述有效计次,分别测算工作日和休息日每天城市A和B之间的交互通讯总量:
Figure GDA0002292726130000051
Figure GDA0002292726130000052
步骤(6)中的所述突发性检查分为双向客流量的突发性检查和交互通讯量的突发性检查;所述双向客流量的突发性检查的方法为:分别对工作日与休息日两组数据{F(1)}、{F(0)}做环比2日移动平均:
Figure GDA0002292726130000053
Figure GDA0002292726130000054
Figure GDA0002292726130000055
表明城市A和B的工作日双向客流量通不过所述双向客流量的突发性检查,剔除第i+1天城市A和B的所有数据;
Figure GDA0002292726130000056
表明城市A和B的休息日双向客流量通不过所述双向客流量的突发性检查,剔除第j+1天城市A和B的所有数据;
所述交互通讯量的突发性检查的方法为:分别对工作日与休息日两组数据{f(1)}、{f(0)}做环比2日移动平均:
Figure GDA0002292726130000057
Figure GDA0002292726130000058
Figure GDA0002292726130000059
表明城市A和B的工作日交互通讯量通不过所述交互通讯量的突发性检查,剔除第i+1天城市A和B的所有数据;
Figure GDA00022927261300000510
表明城市A和B的休息日交互通讯量通不过所述交互通讯量的突发性检查,剔除第j+1天城市A和B的所有数据。
步骤(7)中,所述信令数据有效用户总量均值
Figure GDA00022927261300000511
的计算方法如下:
Figure GDA0002292726130000061
Figure GDA0002292726130000062
Figure GDA0002292726130000063
Figure GDA0002292726130000064
所述通讯数据有效用户总量均值
Figure GDA0002292726130000065
的计算方法如下:
Figure GDA0002292726130000066
Figure GDA0002292726130000067
Figure GDA0002292726130000068
Figure GDA0002292726130000069
所述两城双向客流量均值
Figure GDA00022927261300000610
的计算方法如下:
Figure GDA00022927261300000611
Figure GDA00022927261300000612
所述两城交互通讯量均值
Figure GDA00022927261300000613
的计算方法如下:
Figure GDA00022927261300000614
Figure GDA00022927261300000615
步骤(8)中城际人信综合联系强度的计算方法如下:
(8.1)分别计算工作日和休息日的城际客流联系强度:
工作日城市A对于城市B的客流联系强度
Figure GDA00022927261300000616
休息日城市A对于城市B的客流联系强度
Figure GDA00022927261300000617
工作日城市B对于城市A的客流联系强度
Figure GDA00022927261300000618
休息日城市B对于城市A的客流联系强度
Figure GDA0002292726130000071
(8.2)分别计算工作日和休息日的城际通讯流强度:
工作日城市A对于城市B的城际通讯流强度
Figure GDA0002292726130000072
休息日城市A对于城市B的城际通讯流强度
Figure GDA0002292726130000073
工作日城市B对于城市A的城际通讯流强度
Figure GDA0002292726130000074
休息日城市B对于城市A的城际通讯流强度
Figure GDA0002292726130000075
(8.3)计算城际客流联系强度:
城市A对于城市B的客流联系强度
Figure GDA0002292726130000076
城市B对于城市A的客流联系强度
Figure GDA0002292726130000077
(8.4)计算城际通讯流强度:
城市A对于城市B的城际通讯流强度
Figure GDA0002292726130000078
城市B对于城市A的城际通讯流强度
Figure GDA0002292726130000079
(8.5)分别计算工作日和休息日城际人信综合联系强度:
工作日城市A对于城市B的人信综合联系强度
Figure GDA00022927261300000710
休息日城市A对于城市B的人信综合联系强度
Figure GDA00022927261300000711
工作日城市B对于城市A的人信综合联系强度
Figure GDA00022927261300000712
休息日城市B对于城市A的人信综合联系强度
Figure GDA00022927261300000713
(8.6)计算城际人信综合联系强度:
城市A对于城市B人信综合联系强度IA~B=IFA~B*80%+ifa~b*20%;
城市B对于城市A人信综合联系强度IB~A=IFB~A*80%+ifb~a*20%。
本发明的优点是,充分依托现有的无线通信网络信息资源,利用已有手机网络中的时间、空间数据,通过对工作日、休息日、两城市双向客流量、两城市交互通讯量等各种维度的综合测算,取得城际人信综合联系强度,实现低成本、高采样、低误测、高实效地获取城际人信综合联系强度,其测算结果具有可比性、科学性、实用性和综合性。
附图说明
图1为本发明中基于手机数据测算城际人信综合联系强度的方法流程框图。
具体实施方式
以下结合附图通过实施例对本发明的特征及其它相关特征作进一步详细说明,以便于同行业技术人员的理解:
实施例:如图1所示,本实施例具体涉及一种基于手机数据测算城际人信综合联系强度的方法,该方法需要确定两个待研究的城市,即城市A和B,以测算这两个城市的人信综合联系强度,具体包括如下步骤:
【步骤1】获取一家手机网络运营商分别在城市A和B的手机信令数据(简称信令数据),对于信令数据的条件要求为:a)时期相同,连续n天,n≥28,连续n天的数据,必然包含至少20个工作日、4个周六、4个周日;b)信令数据必须包含手机用户ID、时间戳、位置戳等字段信息,并包括开关机、接打电话、收发短信、切换基站、上网下网、基站定时唤醒等事件类型。
(步骤1.1)选取同期数据、分组:
将两个城市n天的数据分别分成两组,一组为工作日(周一至周五)的数据A(1)、B(1),另一组为休息日(周六、日)的数据A(0)、B(0)
例如:城市A获取数据起始日期为2016-11-19、最后日期为2016-12-22;城市B获取数据起始日期为2016-11-18、最后日期为2016-12-20。首先,选取城市A与城市B同期的数据,即取AB两城日期同为2016-11-19至2016-12-20共32天的数据。然后将工作日与休息日的数据分组,分别整理如下:
工作日城市A的数据日期为:(2016-11-21为周一)A11-21到A11-25、A11-28到A12-02、A12-05到A12-09、A12-12到A12-16、A12-19、A12-20(共22天);
工作日城市B的数据日期为:B11-21到B11-25、B11-28到B12-02、B12-05到B12-11、B12-14到B12-18;
休息日城市A的数据日期为:(2016-11-19为周六)A11-19、A11-20、A11-26、A11-27、A12-03、A12-04、A12-10、A12-11、A12-17、A12-18(共10天);
休息日城市B的数据日期为:B11-19、B11-20、B11-26、B11-27、B12-03、B12-04、B12-10、B12-11、B12-17、B12-18。
(步骤1.2)识别信令数据有效用户:
信令数据中的每个用户记录须满足驻留时长可靠性条件,才可识别为当天所在城市的有效用户,该可靠性条件为:
TZs-TZr≥120分钟
其中,TZs是指在一天计时周期内,用户于所在城市的尾记录的时间;TZr是指在一天计时周期内,用户于所在城市的首记录的时间;
例如:日期2016-11-30,这一天为周三,是工作日,计算时间从该日凌晨00:00:00到夜里24:00:00。城市A的四个手机用户分别为路人甲、乙、丙、丁,他们在城市A留下的信令数据记录如下表:
Figure GDA0002292726130000091
表(1):信令数据城市A用户首尾记录
上表中,路人甲、路人乙和路人丁的TZs-TZr均大于或等于120分钟,被识别为有效用户,记录到当天有效用户总量
Figure GDA0002292726130000092
中,而路人丙的TZs-TZr由于小于120分钟,故不被记录到当天有效用户总量中。计算城市A当日有效用户总量=∑(所有被识别为有效用户的数量)=2389541。
(步骤1.3)对每天的信令数据有效用户总量分别按工作日和休息日拼接成数列:
对22个工作日城市A每天的有效用户总量数据
Figure GDA0002292726130000093
将其拼接成数列{A(1)},按日期进行先后的排列,如下表所示:
i=1~22 日期 星期 {A<sup>(1)</sup>}
i=01 2016-11-21 2408223
i=02 2016-11-22 2397954
i=03 2016-11-23 1851336
……
i=08 2016-11-30 2389541
……
i=22 2016-12-20 2375648
表(2):信令数据工作日城市A每天用户总量
同样地,对10个休息日城市A每天的有效用户总量数据
Figure GDA0002292726130000094
将其拼接成连续数列{A(0)},按日期先后进行排列,如下表所示:
j=1~10 日期 星期 {A<sup>(0)</sup>}
j=01 2016-11-19 2356678
j=02 2016-11-20 2349924
j=03 2016-11-26 1691376
……
j=10 2016-12-18 2275483
表(3):信令数据休息日城市A每天用户总量
同样地,将工作日和休息日城市B的有效用户每天总量也按上述步骤一一整理排序,组成连续数列{B(1)}、{B(0)}。
【步骤2】获取该家手机网络运营商分别在城市A和B的通讯数据,对于通讯数据的条件要求为:a)与步骤1获取的信令数据的时期相同,连续n天,n≥28,连续n天的数,必然包含至少20个工作日、4个周六、4个周日;b)通讯数据必须包含手机用户ID、时间戳、位置戳等字段信息,并包括打电话、接电话、发送短信、接收短信等事件类型。
(步骤2.1)选取同期数据、分组:
将两个城市n天的数据分别分成两组,一组为工作日(周一至周五)的数据a(1)、b(1),另一组为休息日(周六、日)的数据a(0)、b(0)
例如:城市A获取数据起始日期为2016-11-15、最后日期为2016-12-28;城市B获取数据起始日期为2016-11-14、最后日期为2016-12-21。对照步骤1.1信令数据的日期,选取同期的数据,即取AB两城日期同为2016-11-19至2016-12-20共32天的数据。其中工作日22个,休息日10个。然后将工作日与休息日的数据分组,分别整理如下:
工作日城市A的数据日期为:(2016-11-21为周一)a11-21到a11-25、a11-28到a12-02、a12-05到a12-09、a12-12到a12-16、a12-19、a12-20(共22天);
工作日城市B的数据日期为:b11-21到b11-25、b11-28到b12-02、b12-05到b12-11、b12-14到b12-18。
休息日城市A的数据日期为:(2016-11-19为周六)a11-19、a11-20、a11-26、a11-27、a12-03、a12-04、a12-10、a12-11、a12-17、a12-18(共10天);
休息日城市B的数据日期为:b11-19、b11-20、b11-26、b11-27、b12-03、b12-04、b12-10、b12-11、b12-17、b12-18。
(步骤2.2)识别通讯数据有效用户
通讯数据中的有效用户必须满足通讯活跃性条件,即一个用户在某一天某个城市的通讯数据显示有“打电话、接电话、发送短信、接收短信”其中的任何一个数据记录,才识别为当天该城市的有效用户。
例如:日期2016-12-17,这一天为周六,是休息日,计算时间从该日凌晨00:00:00到夜里24:00:00。城市B的四个手机用户分别为路人#1、#2、#3、#4,他们在城市B留下的通讯数据记录如下表:
Figure GDA0002292726130000111
表(4):通讯数据城市B用户记录
上表中,路人#1、路人#3和路人#4当天有符合条件的通讯数据记录,被识别为有效用户,记录到当天有效用户总量b(0)中。路人#2由于没有任何记录,故不被记录到当天用户总量。计算城市B当日有效用户总量=∑(所有被识别为有效用户的数量)=1253216。
(步骤2.3)对每天的通讯数据有效用户总量分别按工作日和休息日拼接成数列:
对10个休息日城市B每天的有效用户总量
Figure GDA0002292726130000112
将其拼接成连续数列{b(0)},按日期先后进行排列,如下表所示:
j=1~10 日期 星期 {b<sup>(0)</sup>}
j=01 2016-11-19 1262283
j=02 2016-11-20 1260305
j=03 2016-11-26 1257495
j=04 2016-11-27 651373
……
j=09 2016-12-17 1253216
j=10 2016-12-18 1251638
表(5):通讯数据休息日城市B每天用户总量
同样地,对22个工作日城市B每天的有效用户总量数据
Figure GDA0002292726130000113
将其拼接成连续数列{b(1)},按日期先后进行排列,如下表所示:
i=1~22 日期 星期 {b<sup>(1)</sup>}
1=01 2016-11-21 1356656
i=02 2016-11-22 1349938
……
i=07 2016-11-29 891344
……
i=22 2016-12-20 1375664
表(6):通讯数据工作日城市B每天用户总量
同样地,将城市A的有效用户每天总量也按上述步骤一一整理排序,组成连续数列{a(1)}、{a(0)}。
【步骤3】经过步骤1、步骤2获取、识别和测算所得到的数据,必须检测手机数据的稳定性和连续性。
(步骤3.1)信令数据有效用户总量的稳定性检验:
基于步骤1,分别对工作日与休息日的四组数据{A(1)}、{B(1)}、{A(0)}、{B(0)}做环比2日移动平均:
Figure GDA0002292726130000121
Figure GDA0002292726130000122
Figure GDA0002292726130000123
Figure GDA0002292726130000124
Figure GDA0002292726130000125
表明城市A的工作日数据不稳定,剔除第i+1天城市A和B的所有数据;
Figure GDA0002292726130000126
表明城市B的工作日数据不稳定,剔除第i+1天城市A和B的所有数据;
Figure GDA0002292726130000127
表明城市A的休息日数据不稳定,剔除第j+1天城市A和B的所有数据;
Figure GDA0002292726130000128
表明城市B的休息日数据不稳定,剔除第j+1天城市A和B的所有数据;
由表(2),经检测:
Figure GDA0002292726130000129
Figure GDA00022927261300001210
表明城市A的11月23日(工作日i=3对应日期)的数据不稳定,因此,对应11月23日整天的数据应当剔除。
由表(3),经检测:
Figure GDA00022927261300001211
Figure GDA00022927261300001212
表明城市A的11月26日(休息日j=3对应日期)的数据不稳定,因此,对应11月26日整天的数据应当剔除。
同理,由于城市B的11月30日、12月17日的数据都不符合稳定性检测,应当剔除。
(布置3.2)通讯数据有效用户总量的稳定性检验:
基于步骤2,分别对工作日与休息日四组数据
Figure GDA0002292726130000131
做环比2日移动平均:
Figure GDA0002292726130000132
Figure GDA0002292726130000133
Figure GDA0002292726130000134
Figure GDA0002292726130000135
Figure GDA0002292726130000136
表明城市A的工作日数据不稳定,剔除第i+1天城市A和B的所有数据;
Figure GDA0002292726130000137
表明城市B的工作日数据不稳定,剔除第i+1天城市A和B的所有数据;
Figure GDA0002292726130000138
表明城市A的休息日数据不稳定,剔除第j+1天城市A和B的所有数据;
Figure GDA0002292726130000139
表明城市B的休息日数据不稳定,剔除第j+1天城市A和B的所有数据。
由表(5),经检测:
Figure GDA00022927261300001310
Figure GDA00022927261300001311
表明城市B的11月27日(休息日j=4对应日期)的数据不稳定,因此,对应11月27日整天的数据应当剔除。
由表(6),经检测:
Figure GDA00022927261300001312
Figure GDA00022927261300001313
表明城市B的11月29日(工作日j=7对应日期)的数据不稳定,因此,对应11月29日整天的数据应当剔除。
同理,按以上方法经检测、由于城市A的12月13日、15日的数据都不符合稳定性检测,应当剔除。
(步骤3.3)连续性检验:
经过稳定性检验、剔除不符合条件的日期后,从剩下的天数中挑选,挑选条件必须满足:AB两城时期同步、日期连续、天数大于等于7天的数据(舍弃其余不连续日期的所有数据)。
经过步骤3.1和步骤3.2的稳定性检验,日期2016-11-23、26、27、29、30和2016-12-13、15、17的数据被剔除,剩下的日期中2016-11-19、20、21、22和2016-12-14、18、19、20的数据虽然通过了稳定性检验,但是日期连续都不超过7天,应当舍弃。
最后仅有日期2016-12-01到12-12连续12天数据是符合要求的,整理得到如下各组数据:
Figure GDA0002292726130000141
其中,i≥5,j≥2,并且i和j在日历表上是连续的,这种连续可以从一周的任何一天开始,并保证连续7天以上,工作日、休息日与对应日期连续排列,详见下表:
i=1~8 日期 星期
i=1 2016-12-01
i=2 2016-12-02
i=3 2016-12-05
……
i=7 2016-12-09
i=8 2016-12-12
表(7):工作日与对应日期连续排列表
j=1~4 日期 星期
j=1 2016-12-03
j=2 2016-12-04
j=3 2016-12-10
j=4 2016-12-11
表(8):休息日与对应日期连续排列表
表(7)和表(8)分别是通过有效性、连续性检测后得到的工作日和休息日的连续12天的数据,其中,工作日有8个,休息日有4个,且从2016-12-01至2016-12-12日的日期是连续的。
【步骤4】在步骤1、步骤3的基础上,进一步识别、测算城市A和城市B之间的(基于信令数据的)工作日和休息日的双向客流量
Figure GDA0002292726130000142
客流量以人次计;其步骤如下:
(步骤4.1)识别有效停留:
在一天中,同一个手机用户在城市A和城市B的信令数据中均有记录(表示该手机用户去过AB两城),并且每次在城市A或者城市B的驻留时间均超过1小时以上,才识别为有效停留。
对于每一用户的有效停留条件为:
TLs-TLr≥60分钟
TLs:在一次停留城市内,一个用户的尾记录的时间;
TLr:在一次停留城市内,一个用户的首记录的时间;
例如:日期2016-12-06(工作日),某些手机用户有甲、丁,他们分别在城市A和城市B留下的数据记录如下表:
Figure GDA0002292726130000151
表(9):2016-12-06用户甲在AB两城的有效停留表
Figure GDA0002292726130000161
表(10):2016-12-06用户丁在AB两城的有效停留表
(步骤4.2)识别双向客流量的有效计次:
满足上述条件情况,用户甲和丁被识别为该手机用户在城市A或B有效停留。按照一个手机用户在城市A与城市B中停留时间的先后顺序有如下排列情况,均识别为双向客流量的有效计次:
计为1次的:A→B,或B→A;
计为2次的:A→B→A,或B→A→B;
…;
计为2n-1次的:A→B→…→B,或B→A→…→A;
计为2n次的:A→B→…→A,或B→A→…→B;
n≥2;1、2n-1为奇数次停留计次,2、2n为偶数次停留计次。因此上述排列情况已经涵盖了所有可能发生的有效计次,没有遗漏。)
根据表(9)和表(10),按照上述方法,测算出用户甲的有效计次为3次、用户丁的有效计次为2次。
(步骤4.3)测算每天AB两城双向客流总量:
基于上述有效计次,分别测算工作日和休息日每天城市A与城市B之间的双向客流总量:
Figure GDA0002292726130000162
Figure GDA0002292726130000171
经过测算工作日、休息日AB两城双向客流每天总量如下两表:
Figure GDA0002292726130000172
表(11):工作日与对应日期双向客流量测算表
Figure GDA0002292726130000173
表(12):休息日与对应日期双向客流量测算表
【步骤5】在步骤2、步骤3的基础上,识别、测算城市A和城市B之间的(基于通讯数据的)工作日和休息日的交互通讯量
Figure GDA0002292726130000174
交互通讯量以人次计。
(步骤5.1)识别交互通讯:
AB两城之间,每次交互通讯必须满足以下识别条件:打电话的双方必须分别在城市A和城市B两地(包含双方都是手机用户或者其中一方是手机用户的情况),并且每次通话时间在6秒钟(包含)以上,或者收发短信的双方必须分别在城市A和城市B两地。
TCh≥6秒钟,其中,TCh为通话时长。
例如:日期2016-12-10(休息日),某些手机用户有#1、#4,在与另一个城市进行点对点通讯留下的通讯数据记录分别如下表:
Figure GDA0002292726130000175
表(13):2016-12-10用户#1在AB两城的通讯数据记录
Figure GDA0002292726130000181
表(14):2016-12-10用户#4在AB两城的通讯数据记录
(步骤5.2)识别有效计次:
满足上述条件情况下,在识别有效计次时应当剔除重复计次也不能减漏计次,具体做法是根据通讯数据记录,对如下情形,均为识别为有效计次:
城市A+城市B的所有手机呼出电话次数(包括A城手机呼B城手机或座机,B城手机呼A城手机或座机);
城市A+城市B的所有接收非手机打来音讯电话次数;
城市A+城市B的所有发出短信次数。
(“城市A+城市B的所有接收手机打来电话次数”和“城市A+城市B的所有接收短信次数”与前者统计重复,所以不再计次)
根据表(13)和表(14),识别有效计次如下表:
Figure GDA0002292726130000182
表(15):2016-12-10用户#1在AB两城的通讯数据的有效记录
Figure GDA0002292726130000191
表(16):2016-12-10用户#4在AB两城的通讯数据的有效记录
根据表(15)和表(16),按照上述方法,测算出用户#1的有效计次为3次、用户#4的有效计次为1次。
步骤(5.3)测算每天AB两城交互通讯总量:
Figure GDA0002292726130000192
Figure GDA0002292726130000193
经过测算工作日休息日AB两城交互通讯每天总量如下两表:
i=1~8 日期 星期 f<sub>i</sub><sup>(1)</sup>
i=1 2016-12-01 72453
i=2 2016-12-02 72756
i=3 2016-12-05 68351
……
i=7 2016-12-09 72376
i=8 2016-12-12 112656
表(17):工作日与对应日期交互通讯量测算表
j=1~4 日期 星期 f<sub>j</sub><sup>(0)</sup>
j=1 2016-12-03 66436
j=2 2016-12-04 65376
j=3 2016-12-10 65516
j=4 2016-12-11 65890
表(18):休息日与对应日期交互通讯量测算表
【步骤6】双向客流量和交互通讯量的突发性检测:当AB两城或其中一个城市发生重大事件(如国际会议、全国比赛等等),数据量出现反常,会干扰双向客流量和交互通讯量的最后结果。因此要进行突发性检验。当同为工作日或同为休息日的双向客流量相差大于10%,或者当同为工作日或同为休息日的交互通讯量相差大于15%,表明数据不稳定、或者有突发事件干扰,剔除对应这一天的所有数据。
基于步骤4、步骤5获取、识别和测算所得到的数据,进行突发性检验,具体步骤如下:
(步骤6.1)双向客流量的突发性检测:
基于步骤4,分别对工作日与休息日两组数据{F(1)}、{F(0)}做环比2日移动平均:
Figure GDA0002292726130000201
Figure GDA0002292726130000202
Figure GDA0002292726130000203
表明城市A和B的工作日双向客流量通不过所述双向客流量的突发性检查,剔除第i+1天城市A和B的所有数据;
Figure GDA0002292726130000204
表明城市A和B的休息日双向客流量通不过所述双向客流量的突发性检查,剔除第j+1天城市A和B的所有数据。
由表(11)、表(12),经检测:
Figure GDA0002292726130000205
Figure GDA0002292726130000206
表明AB两城市12月2日(工作日第i=2天对应日期)的双向客流量通不过数据突发性检验,剔除12月2日A、B两城的所有数据。
(步骤6.2)交互通讯量的突发性检验:
基于步骤5,分别对工作日与休息日两组数据{f(1)}、{f(0)}做环比2日移动平均:
Figure GDA0002292726130000207
Figure GDA0002292726130000208
Figure GDA0002292726130000209
表明城市A和B的工作日交互通讯量通不过所述交互通讯量的突发性检查,剔除第i+1天城市A和B的所有数据;
Figure GDA00022927261300002010
表明城市A和B的休息日交互通讯量通不过所述交互通讯量的突发性检查,剔除第j+1天城市A和B的所有数据。
由表(17)、表(18),经检测:
Figure GDA00022927261300002011
Figure GDA0002292726130000211
表明AB两城市12月12日(工作日第i=8天对应日期)的交互通讯量通不过数据突发性检验,剔除12月12日(工作日第i=8天)A、B两城的所有数据。
(步骤6.3)连续性检验和数据整理:
经过突发性检验、剔除不符合条件日期的数据后,从剩下的天数中挑选,条件必须满足:AB两城时期同步、日期连续、天数等于7天的数据(舍弃其余日期的所有数据),整理得到如下各组数据:
Figure GDA0002292726130000212
a、
Figure GDA0002292726130000213
Figure GDA0002292726130000214
其中,i=1~5,j=1~2,并且i和j在日历表上是连续的7天(5个工作日和2个休息日,也称为全周期)。
经过步骤6.1和步骤6.2,现有符合条件的连续数据的共有9天,即2016-12-03至2016-12-11,其中日期12-03、12-04、12-10、12-11为周六、周日,其余为工作日。因此,我们选定2016-12-03至2016-12-09这7天的数据做样本(符合5个工作日和2个休息日,并且7天日期是连续的要求),也称为全周期。现将7天的数据整理成下表:
Figure GDA0002292726130000215
表(19):突发性检测和连续性检测后的7天数据
【步骤7】整理城际人信综合联系强度测算的基础数据,包括信令数据有效用户总量均值
Figure GDA0002292726130000216
通讯数据有效用户总量均值
Figure GDA0002292726130000217
Figure GDA0002292726130000218
两城双向客流量均值
Figure GDA0002292726130000219
两城交互通讯量均值
Figure GDA00022927261300002110
Figure GDA00022927261300002111
(步骤7.1)计算整理AB两城的信令数据有效用户总量均值:
根据步骤1、3、4、6,分别测算城市A和城市B的工作日和休息日的信令数据有效用户总量均值
Figure GDA00022927261300002112
具体如下:
(式01)城市A工作日用户总量均值
Figure GDA00022927261300002113
Figure GDA0002292726130000221
(式02)城市A休息日用户总量均值A(0)
Figure GDA0002292726130000222
(式03)城市B工作日用户总量均值
Figure GDA0002292726130000223
Figure GDA0002292726130000224
(式04)城市B休息日用户总量均值
Figure GDA0002292726130000225
Figure GDA0002292726130000226
(步骤7.2)计算整理AB两城的通讯数据有效用户总量均值:
根据步骤2、3、5、6,分别测算城市A和城市B的工作日和休息日的通讯数据有效用户总量均值
Figure GDA0002292726130000227
具体如下:
(式05)城市A工作日用户总量均值
Figure GDA0002292726130000228
Figure GDA0002292726130000229
(式06)城市A休息日用户总量均值
Figure GDA00022927261300002210
Figure GDA00022927261300002211
(式07)城市B工作日用户总量均值
Figure GDA00022927261300002212
Figure GDA00022927261300002213
(式08)城市B休息日用户总量均值
Figure GDA00022927261300002214
Figure GDA00022927261300002215
(步骤7.3)计算整理AB两城的双向客流量均值:
根据步骤1、3、4、6,分别测算工作日和休息日的两城双向客流量均值
Figure GDA00022927261300002216
Figure GDA00022927261300002217
具体如下:
(式09)工作日双向客流量均值
Figure GDA00022927261300002218
Figure GDA00022927261300002219
(式10)休息日双向客流量均值
Figure GDA00022927261300002220
Figure GDA00022927261300002221
(步骤7.4)计算整理AB两城的交互通讯量均值:
根据步骤2、3、5、6,分别测算工作日和休息日的两城交互通讯量均值
Figure GDA0002292726130000231
Figure GDA0002292726130000232
具体如下:
(式11)工作日交互通讯量均值
Figure GDA0002292726130000233
Figure GDA0002292726130000234
(式12)休息日交互通讯量均值
Figure GDA0002292726130000235
Figure GDA0002292726130000236
【步骤8】根据步骤7,计算各种城际人信综合联系强度,分别如下:
(步骤8.1)工作日和休息日的客流联系强度:
考虑到城际联系的复杂性、研究使用的广泛性,我们从单一因子的城际联系强度到多因子城际联系强度,作了详细计算。并且,多因子城际联系强度更能综合地、真实地反映城市之间联系的密切性如何。单一因子是指仅考虑工作日或者休息日某一种“流”的大小,例如工作日城市A对于城市B的客流联系强度,又例如休息日城市B对于城市A的通讯量联系强度等等,都是指单一因子的城际联系强度。
多因子联系强度是指综合考虑工作日与休息日以后的联系强度,还有综合考虑双向客流与交互通讯流以后的联系强度,以及考虑工作日、休息日、双向客流、交互通讯流所有因子的城际联系强度。
根据(式01)~(式04)、(式09)、(式10),分别计算工作日和休息日城际客流联系强度,如下:
(式13)工作日城市A对于城市B的客流联系强度
Figure GDA0002292726130000237
Figure GDA0002292726130000238
(式14)休息日城市A对于城市B的客流联系强度
Figure GDA0002292726130000239
Figure GDA00022927261300002310
(式15)工作日城市B对于城市A的客流联系强度
Figure GDA00022927261300002311
Figure GDA00022927261300002312
(式16)休息日城市B对于城市A的客流联系强度
Figure GDA00022927261300002313
Figure GDA00022927261300002314
(步骤8.2)根据(式05)~(式08)、(式11)、(式12),分别计算工作日和休息日城际通讯流联系强度,即工作日和休息日的通讯流联系强度单独计算,如下:
(式17)工作日城市A对于城市B的通讯流联系强度
Figure GDA0002292726130000241
Figure GDA0002292726130000242
(式18)休息日城市A对于城市B的通讯流联系强度
Figure GDA0002292726130000243
Figure GDA0002292726130000244
(式19)工作日城市B对于城市A的通讯流联系强度
Figure GDA0002292726130000245
Figure GDA0002292726130000246
(式20)休息日城市B对于城市A的通讯流联系强度
Figure GDA0002292726130000247
Figure GDA0002292726130000248
步骤8.1和8.2所计算的城际联系强度,是区分了工作日和休息日以后的单一联系强度,因此还有必要综合考虑工作日与休息日合并起来后的城际联系强度。
(步骤8.3)工作日和休息日合并在一起计算客流联系强度:
根据(式13)~(式16),计算城际客流联系强度,如下:
(式21)城市A对于城市B的客流联系强度IFA~B
Figure GDA0002292726130000249
(式22)城市B对于城市A的客流联系强度IFB~A
Figure GDA00022927261300002410
(步骤8.4)工作日和休息日合并在一起计算通讯流联系强度:
根据(式17)~(式20),计算城际通讯流联系强度,如下:
(式23)城市A对于城市B的通讯流联系强度ifa~b
Figure GDA00022927261300002411
(式24)城市B对于城市A的通讯流联系强度ifb~a
Figure GDA00022927261300002412
(步骤8.5)单独计算工作日和休息日的客流与通讯流综合联系强度:
根据(式13)~(式20)式,分别计算工作日和休息日城际人信综合联系强度,如下:
(式25)工作日城市A对于城市B的人信综合联系强度
Figure GDA0002292726130000251
(式26)休息日城市A对于城市B的人信综合联系强度
Figure GDA0002292726130000252
(式27)工作日城市B对于城市A的人信综合联系强度
Figure GDA0002292726130000253
(式28)休息日城市B对于城市A的人信综合联系强度
Figure GDA0002292726130000254
(步骤8.6)根据(式21)~(式24),计算城际人信综合联系强度,如下:
(式29)城市A对于城市B人信综合联系强度
IA~B=IFA~B*80%+ifa~b*20%=0.03636*80%+0.03193*20%=0.0355
(式30)城市B对于城市A人信综合联系强度
IB~A=IFB~A*80%+ifb~a*20%=0.05756*80%+0.05161*20%=0.0564
其中,(式29)就是综合考虑了工作日、休息日、双向客流、交互通讯流四个因子的城市A对于城市B的人信综合联系强度。(式30)就是综合考虑了工作日、休息日、双向客流、交互通讯流四个因子的城市B对于城市A的人信综合联系强度。
联系强度越大,表示两个城市之间的联系越紧密。随着现代城市经济的发展,城际联系是不可或略的研究热点,通过对城际联系强度的描述,研究者可以轻松把握城市之间的联系密切性,从而了解城际发展的内在联系。有了强度,就可以建立联系标准的分类,进而可以帮助研究城际联系强度大小数值的分类标准,例如:0<I<0.01为微弱联系,0.01≤I<0.03为一般联系,0.03≤I<0.06为紧密联系,I≥0.06以上为同城化联系,等等。I为两城之间的人信综合联系强度,例如:IA~B=0.028,IB~A=0.056,表明对于城市A来讲,两城的联系紧密性为一般联系,对于城市B来讲,两城的联系紧密性为紧密联系,也就是城市B更加依附于城市A。
不同性质的城市,表现出的城际联系强度特征也不一样。例如旅游城市的休息日联系强度会大于工作日的联系强度,此时可以用单一因子联系强度更有助于分析旅游城市的城际联系特征。
由于工作日与周末是两种不同的时期,城际的客流与通讯流会有不同的特征,上述各种强度分别表征了在不同时期的城际客流与通讯流,并依据这种特点对城际联系强度进行综合考量,最后测算出城际人信综合联系强度。过程中还包括了基于工作日、周末、两城市双向客流量、两城市交互通讯量等四种不同角度测算城际联系强度,使得这些强度更广泛地适用于各种不同领域对城际联系的研究。
其中,(式13)~(式16)为单因子客流联系强度,(式17)~(式20)为单因子通讯流联系强度;(式21)、(式22)为全周期客流联系强度,(式23)、(式24)为全周期通讯流联系强度;(式25)~(式28)为区分工作日、休息日的城际人信综合联系强度;(式29)为城市A对于城市B人信综合联系强度,(式30)为城市B对于城市A人信综合联系强度。

Claims (9)

1.一种基于手机数据测算城际人信综合联系强度的方法,其特征在于所述方法包括以下步骤:
(1)获取任一手机运营商分别在城市A和B中连续n天的手机信令数据,n≥28,识别测算所述手机信令数据中的每日有效用户总量,将城市A和B在n天内的各工作日有效用户总量
Figure FDA0002292726120000011
分别拼接成数列{A(1)}、{B(1)},将城市A和B在n天内的各休息日有效用户总量
Figure FDA0002292726120000012
分别拼接成数列{A(0)}、{B(0)};其中,i表示n天内的第i个工作日,j表示n天内的第j个休息日;
(2)获取所述手机运营商分别在城市A和B中连续n天的通讯数据,n≥28,识别测算所述通讯数据中的每日有效用户总量,将城市A和B在n天内的各工作日有效用户总量
Figure FDA0002292726120000013
分别拼接成数列{a(1)}、{b(1)},将城市A和B在n天内的各休息日有效用户总量
Figure FDA0002292726120000014
分别拼接成数列{a(0)}、{b(0)};其中,i表示n天内的第i个工作日,j表示n天内的第j个休息日;
(3)对所述手机信令数据在n天内的有效用户总量的稳定性进行检验,剔除其中不符合稳定性条件的日期;对所述通讯数据在n天内的有效用户总量的稳定性进行检验,剔除其中不符合稳定性条件的日期;经过稳定性检验、剔除不符合稳定性条件的日期后,从剩下的日期中挑选,挑选条件必须满足:A、B两城日期同步、日期连续、天数大于等于7天的数据,舍弃其余不连续日期的所有数据,整理得到如下各组数据:
Figure FDA0002292726120000015
其中,i≥5,j≥2,并且i和j在日历表上连续;
(4)根据步骤(1)和(3),识别、测算城市A和B之间基于所述手机信令数据的工作日和休息日的双向客流量
Figure FDA0002292726120000016
客流量以人次计;
(5)根据步骤(2)和(3),识别、测算城市A和B之间基于所述通讯数据的工作日和休息日的交互通讯量
Figure FDA0002292726120000017
交互通讯量以人次计;
(6)基于步骤(4)和(5)所获得的数据,进行突发性检查:当城市A和B同为工作日或同为休息日时的双向客流量相差大于10%时,或是当城市A和B同为工作日或同为休息日时的双向交互通讯量相差大于15%时,剔除对应该日期的所有数据;之后,从剩下的天数中挑选,条件须满足城市A和B时期同步、日期连续、天数等于7天的数据,舍弃其余日期的所有数据,整理得到如下各组数据:
Figure FDA0002292726120000018
其中,i=1~5,j=1~2,并且i和j在日历表上连续;
(7)根据步骤(6),整理城际人信综合联系强度测算的基础数据,包括信令数据有效用户总量均值
Figure FDA0002292726120000021
通讯数据有效用户总量均值
Figure FDA0002292726120000022
Figure FDA0002292726120000023
两城双向客流量均值
Figure FDA0002292726120000024
两城交互通讯量均值
Figure FDA0002292726120000025
Figure FDA0002292726120000026
其中,
Figure FDA0002292726120000027
分别表示城市A工作日、休息日信令数据有效用户总量均值;
Figure FDA0002292726120000028
分别表示城市B工作日、休息日信令数据有效用户总量均值;
Figure FDA0002292726120000029
Figure FDA00022927261200000210
分别表示城市A工作日、休息日的通讯数据有效用户总量均值;
Figure FDA00022927261200000211
分别表示城市B工作日、休息日的通讯数据有效用户总量均值;
Figure FDA00022927261200000212
分别表示工作日、休息日的两城双向客流量均值;
Figure FDA00022927261200000213
分别表示工作日、休息日的两城交互通讯量均值;
(8)根据步骤(7),利用信令数据有效用户总量均值
Figure FDA00022927261200000214
和两城双向客流量均值
Figure FDA00022927261200000215
分别计算获得工作日和休息日的城际客流联系强度;利用通讯数据有效用户总量均值
Figure FDA00022927261200000216
和两城交互通讯量均值
Figure FDA00022927261200000217
分别计算工作日和休息日的城际通讯流联系强度;
依此,计算城际人信综合联系强度。
2.根据权利要求1所述的一种基于手机数据测算城际人信综合联系强度的方法,其特征在于步骤(1)中,识别测算所述手机信令数据中的每日有效用户总量的方法为:所述手机信令数据中的每个用户记录须满足驻留时长可靠性条件,才可识别为当天所在城市的有效用户,所述可靠性条件为:
TZs-TZr≥120分钟
其中,TZs是指在一天计时周期内,用户于所在城市的尾记录的时间;TZr是指在一天计时周期内,用户于所在城市的首记录的时间。
3.根据权利要求1所述的一种基于手机数据测算城际人信综合联系强度的方法,其特征在于步骤(2)中,识别测算所述通讯数据中的每日有效用户总量的方法为:在一天的计时周期内,任意用户在所在城市的所述通讯数据中显示有“打电话、接电话、发送短信、接收短信”中的任何一个数据记录,才可识别为当天所在城市的有效用户。
4.根据权利要求1所述的一种基于手机数据测算城际人信综合联系强度的方法,其特征在于步骤(3)中,对所述手机信令数据在n天内的有效用户总量的稳定性进行检验的方法为:基于步骤(1),分别对工作日与休息日的四组数据{A(1)}、{B(1)}、{A(0)}、{B(0)}做环比2日移动平均:
Figure FDA00022927261200000218
Figure FDA00022927261200000219
Figure FDA00022927261200000220
Figure FDA0002292726120000031
Figure FDA0002292726120000032
表明城市A的工作日数据不稳定,剔除第i+1天城市A和B的所有数据;
Figure FDA0002292726120000033
表明城市B的工作日数据不稳定,剔除第i+1天城市A和B的所有数据;
Figure FDA0002292726120000034
表明城市A的休息日数据不稳定,剔除第j+1天城市A和B的所有数据;
Figure FDA0002292726120000035
表明城市B的休息日数据不稳定,剔除第j+1天城市A和B的所有数据;
对所述通讯数据在n天内的有效用户总量的稳定性进行检验的方法为:基于步骤(2),分别对工作日与休息日四组数据
Figure FDA0002292726120000036
做环比2日移动平均:
Figure FDA0002292726120000037
Figure FDA0002292726120000038
Figure FDA0002292726120000039
Figure FDA00022927261200000310
Figure FDA00022927261200000311
表明城市A的工作日数据不稳定,剔除第i+1天城市A和B的所有数据;
Figure FDA00022927261200000312
表明城市B的工作日数据不稳定,剔除第i+1天城市A和B的所有数据;
Figure FDA00022927261200000313
表明城市A的休息日数据不稳定,剔除第j+1天城市A和B的所有数据;
Figure FDA00022927261200000314
表明城市B的休息日数据不稳定,剔除第j+1天城市A和B的所有数据。
5.根据权利要求1所述的一种基于手机数据测算城际人信综合联系强度的方法,其特征在于步骤(4)中所述双向客流量的测算方法为:在一天的计时周期内,同一个手机用户在城市A和B中的所述手机信令数据中均有记录,且每次在城市A或B中的驻留时间均超过1小时以上,则识别该手机用户为有效停留;手机用户在城市A和B中停留时间的先后顺序分为如下情况,均识别为双向客流量的有效计次:
计为1次的:A→B,或B→A;
计为2次的:A→B→A,或B→A→B;
…;
计为2n-1次的:A→B→…→B,或B→A→…→A;
计为2n次的:A→B→…→A,或B→A→…→B;
基于上述有效计次,分别测算工作日和休息日每天城市A与城市B之间的双向客流总量:
Figure FDA0002292726120000041
Figure FDA0002292726120000042
6.根据权利要求1所述的一种基于手机数据测算城际人信综合联系强度的方法,其特征在于步骤(5)中所述交互通讯量的测算方法为:在满足打电话双方或是收发短信的双方分别在城市A和城市B内的情况下,进行城市A和B之间交互通讯的有效计次,有效计次包括如下情况:
城市A和城市B内的所有手机呼出电话次数,包括城市A内手机呼城市B内手机或座机,城市B内手机呼城市A内手机或座机;
城市A和城市B内的所有接收非手机打来音讯电话次数;
城市A和城市B内所有发出短信的次数;
基于上述有效计次,分别测算工作日和休息日每天城市A和B之间的交互通讯总量:
Figure FDA0002292726120000043
Figure FDA0002292726120000044
7.根据权利要求1所述的一种基于手机数据测算城际人信综合联系强度的方法,其特征在于步骤(6)中的所述突发性检查分为双向客流量的突发性检查和交互通讯量的突发性检查;所述双向客流量的突发性检查的方法为:分别对工作日与休息日两组数据{F(1)}、{F(0)}做环比2日移动平均:
Figure FDA0002292726120000045
Figure FDA0002292726120000046
Figure FDA0002292726120000047
表明城市A和B的工作日双向客流量通不过所述双向客流量的突发性检查,剔除第i+1天城市A和B的所有数据;
Figure FDA0002292726120000051
表明城市A和B的休息日双向客流量通不过所述双向客流量的突发性检查,剔除第j+1天城市A和B的所有数据;
所述交互通讯量的突发性检查的方法为:分别对工作日与休息日两组数据{f(1)}、{f(0)}做环比2日移动平均:
Figure FDA0002292726120000052
Figure FDA0002292726120000053
Figure FDA0002292726120000054
表明城市A和B的工作日交互通讯量通不过所述交互通讯量的突发性检查,剔除第i+1天城市A和B的所有数据;
Figure FDA0002292726120000055
表明城市A和B的休息日交互通讯量通不过所述交互通讯量的突发性检查,剔除第j+1天城市A和B的所有数据。
8.根据权利要求1所述的一种基于手机数据测算城际人信综合联系强度的方法,其特征在于步骤(7)中,所述信令数据有效用户总量均值
Figure FDA0002292726120000056
Figure FDA0002292726120000057
的计算方法如下:
Figure FDA0002292726120000058
Figure FDA0002292726120000059
Figure FDA00022927261200000510
Figure FDA00022927261200000511
所述通讯数据有效用户总量均值
Figure FDA00022927261200000512
的计算方法如下:
Figure FDA00022927261200000513
Figure FDA00022927261200000514
Figure FDA00022927261200000515
Figure FDA00022927261200000516
所述两城双向客流量均值
Figure FDA00022927261200000517
的计算方法如下:
Figure FDA0002292726120000061
Figure FDA0002292726120000062
所述两城交互通讯量均值
Figure FDA0002292726120000063
的计算方法如下:
Figure FDA0002292726120000064
Figure FDA0002292726120000065
9.根据权利要求1所述的一种基于手机数据测算城际人信综合联系强度的方法,其特征在于步骤(8)中城际人信综合联系强度的计算方法如下:
(8.1)分别计算工作日和休息日的城际客流联系强度:
工作日城市A对于城市B的客流联系强度
Figure FDA0002292726120000066
休息日城市A对于城市B的客流联系强度
Figure FDA0002292726120000067
工作日城市B对于城市A的客流联系强度
Figure FDA0002292726120000068
休息日城市B对于城市A的客流联系强度
Figure FDA0002292726120000069
(8.2)分别计算工作日和休息日的城际通讯流强度:
工作日城市A对于城市B的城际通讯流强度
Figure FDA00022927261200000610
休息日城市A对于城市B的城际通讯流强度
Figure FDA00022927261200000611
工作日城市B对于城市A的城际通讯流强度
Figure FDA00022927261200000612
休息日城市B对于城市A的城际通讯流强度
Figure FDA00022927261200000613
(8.3)计算城际客流联系强度:
城市A对于城市B的客流联系强度
Figure FDA00022927261200000614
城市B对于城市A的客流联系强度
Figure FDA00022927261200000615
(8.4)计算城际通讯流强度:
城市A对于城市B的城际通讯流强度
Figure FDA00022927261200000616
城市B对于城市A的城际通讯流强度
Figure FDA00022927261200000617
(8.5)分别计算工作日和休息日城际人信综合联系强度:
工作日城市A对于城市B的人信综合联系强度
Figure FDA0002292726120000071
休息日城市A对于城市B的人信综合联系强度
Figure FDA0002292726120000072
工作日城市B对于城市A的人信综合联系强度
Figure FDA0002292726120000073
休息日城市B对于城市A的人信综合联系强度
Figure FDA0002292726120000074
(8.6)计算城际人信综合联系强度:
城市A对于城市B人信综合联系强度IA~B=IFA~B*80%+ifa~b*20%;
城市B对于城市A人信综合联系强度IB~A=IFB~A*80%+ifb~a*20%。
CN201710321840.1A 2017-05-09 2017-05-09 一种基于手机数据测算城际人信综合联系强度的方法 Expired - Fee Related CN107222886B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710321840.1A CN107222886B (zh) 2017-05-09 2017-05-09 一种基于手机数据测算城际人信综合联系强度的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710321840.1A CN107222886B (zh) 2017-05-09 2017-05-09 一种基于手机数据测算城际人信综合联系强度的方法

Publications (2)

Publication Number Publication Date
CN107222886A CN107222886A (zh) 2017-09-29
CN107222886B true CN107222886B (zh) 2020-04-14

Family

ID=59944033

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710321840.1A Expired - Fee Related CN107222886B (zh) 2017-05-09 2017-05-09 一种基于手机数据测算城际人信综合联系强度的方法

Country Status (1)

Country Link
CN (1) CN107222886B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110334135A (zh) * 2019-06-04 2019-10-15 武汉大学 一种基于微博轨迹数据的城市联结强度计算方法
CN113194152B (zh) * 2021-05-18 2022-04-19 同济大学 一种基于手机信令数据的低活动强度建设用地识别方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105488120A (zh) * 2015-11-23 2016-04-13 上海川昱信息科技有限公司 基于手机大数据实时采集人口空间分布与大客流预警方法
CN105513351A (zh) * 2015-12-17 2016-04-20 北京亚信蓝涛科技有限公司 一种基于大数据的交通出行特征数据提取方法
CN105893491A (zh) * 2016-03-29 2016-08-24 东南大学 一种基于区域城际流强度测算模型的划定大都市圈的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105488120A (zh) * 2015-11-23 2016-04-13 上海川昱信息科技有限公司 基于手机大数据实时采集人口空间分布与大客流预警方法
CN105513351A (zh) * 2015-12-17 2016-04-20 北京亚信蓝涛科技有限公司 一种基于大数据的交通出行特征数据提取方法
CN105893491A (zh) * 2016-03-29 2016-08-24 东南大学 一种基于区域城际流强度测算模型的划定大都市圈的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Large-Scale Mobile Traffic Analysis: A Survey;Naboulsi D 等;《IEEE Communications Surveys & Tutorials》;20151015;全文 *
基于手机信令的大范围人流移动分析;唐小勇;《重庆交通大学学报(自然科学版)》;20170115;全文 *

Also Published As

Publication number Publication date
CN107222886A (zh) 2017-09-29

Similar Documents

Publication Publication Date Title
Calabrese et al. Estimating Origin-Destination flows using opportunistically collected mobile phone location data from one million users in Boston Metropolitan Area
Wang et al. Transportation mode inference from anonymized and aggregated mobile phone call detail records
CN102595323B (zh) 基于手机定位数据的居民出行特征参数的获取方法
CN106295787B (zh) 一种基于移动信令的客流统计方法及装置
Naboulsi et al. Classifying call profiles in large-scale mobile traffic datasets
CN107040894A (zh) 一种基于手机信令数据的居民出行od获取方法
von Mörner Application of call detail records-chances and obstacles
CN109165779B (zh) 一种基于多源大数据与长短期记忆神经网络模型的人口数量预测方法
CN107222886B (zh) 一种基于手机数据测算城际人信综合联系强度的方法
Sørensen et al. Use of mobile phone data for analysis of number of train travellers
CN101814112A (zh) 处理数据的方法和装置
CN111210056A (zh) 电价方案确定方法、装置、计算机设备和存储介质
CN104573874A (zh) 一种公交线路的规划方法和装置
CN114741612B (zh) 一种基于大数据的消费习惯分类方法、系统和存储介质
Vanhoof et al. Performance and sensitivities of home detection on mobile phone data
CN108989060A (zh) 一种对运营商流量计费检测准确性的方法及检测系统
CN114501336B (zh) 一种公路出行量测算方法、装置、电子设备及存储介质
CN111600993A (zh) 一种根据短信进行行程提醒的方法和装置
CN101155380B (zh) 无线网络测试数据的整合系统及方法
CN102256255A (zh) 一种基于时间和地理位置冲突的反并卡侦测方法
CN115988422A (zh) 基于出行链解析的多层次轨道交通换乘客流提取方法
CN116957528A (zh) 一种对多来源打卡数据自动生成考勤结果的方法及系统
Naboulsi et al. Human mobility flows in the city of Abidjan
CN108418644B (zh) 信号处理方法及装置
CN116594974A (zh) 一种基于会员行为日志的智慧工会app活跃度分析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200414