CN107222886B - 一种基于手机数据测算城际人信综合联系强度的方法 - Google Patents
一种基于手机数据测算城际人信综合联系强度的方法 Download PDFInfo
- Publication number
- CN107222886B CN107222886B CN201710321840.1A CN201710321840A CN107222886B CN 107222886 B CN107222886 B CN 107222886B CN 201710321840 A CN201710321840 A CN 201710321840A CN 107222886 B CN107222886 B CN 107222886B
- Authority
- CN
- China
- Prior art keywords
- city
- data
- day
- days
- cities
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000004891 communication Methods 0.000 claims abstract description 147
- 230000002452 interceptive effect Effects 0.000 claims abstract description 63
- 230000002457 bidirectional effect Effects 0.000 claims abstract description 52
- 230000011664 signaling Effects 0.000 claims abstract description 49
- 230000008030 elimination Effects 0.000 claims abstract description 4
- 238000003379 elimination reaction Methods 0.000 claims abstract description 4
- 238000007689 inspection Methods 0.000 claims description 24
- 238000004364 calculation method Methods 0.000 claims description 19
- 238000012360 testing method Methods 0.000 claims description 11
- 230000000284 resting effect Effects 0.000 claims description 9
- 230000001360 synchronised effect Effects 0.000 claims description 8
- 230000003203 everyday effect Effects 0.000 claims description 7
- 230000002354 daily effect Effects 0.000 claims description 4
- 238000005259 measurement Methods 0.000 abstract description 9
- 238000005070 sampling Methods 0.000 abstract description 2
- 239000004615 ingredient Substances 0.000 description 9
- 238000001514 detection method Methods 0.000 description 5
- 238000011161 development Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000013112 stability test Methods 0.000 description 3
- 230000002547 anomalous effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/08—Testing, supervising or monitoring using real traffic
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0876—Network utilisation, e.g. volume of load or congestion level
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Computer Networks & Wireless Communication (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Tourism & Hospitality (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Quality & Reliability (AREA)
- Educational Administration (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Remote Sensing (AREA)
- Environmental & Geological Engineering (AREA)
- Mobile Radio Communication Systems (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种基于手机数据测算城际人信综合联系强度的方法,该方法通过获取两城市的手机信令数据和手机点对点通讯数据,通过识别、剔除后获得有效的数据,进而测算获得两城市之间的交互通讯量和双向客流量,识别其与手机网络总用户量的比值,并根据工作日与休息日的不同情况赋予不同的权重,进而综合测算得出两城之间的人信综合联系强度。本发明的优点是,充分依托现有的无线通信网络信息资源,利用已有手机网络中的时间、空间数据,综合测算取得城际人信综合联系强度,实现低成本、高采样、低误测、高实效地获取城际人信综合联系强度,其测算结果具有可比性、科学性、实用性和综合性。
Description
技术领域
本发明属于数据测算技术领域,具体涉及一种基于手机数据测算城际人信综合联系强度的方法。
背景技术
近年来,随着我国城市化高速发展,全国的城市化率已经超过了50%。由于现代交通和通讯的便利条件,城市群越来越多,城市之间的联系越来越密切,这种密切联系尤其反映在城际之间的人流、通讯流的总量不断增加。因此,如何衡量城市之间的联系密切情况,就需要使用联系强度的概念,而这一概念一直得不到准确的衡量和测算。
在区域城市发展研究、城市规划、交通规划以及城市管理中,迫切需要衡量与测算出城际联系强度,并且这种强度测算最好不是单一指标,既要有客流联系的考量,也要有通讯流联系的考量。
由此,引入了“城际人信综合联系强度”的概念,具体是指综合测算两城市之间的双向客流量和交互通讯量。
发明内容
本发明的目的是根据上述现有技术的不足之处,提供一种基于手机数据测算城际人信综合联系强度的方法,该方法根据两城市之间的交互通讯量和双向客流量,识别其与手机网络总用户量的比值,并根据工作日与休息日的不同情况赋予不同的权重,进而综合测算得出两城之间的人信综合联系强度,即综合考量了工作日、周末、双向客流量、交互通讯量四种不同因素。
本发明目的实现由以下技术方案完成:
一种基于手机数据测算城际人信综合联系强度的方法,其特征在于所述方法包括以下步骤:
(1)获取任一手机运营商分别在城市A和B中连续n天的手机信令数据,n≥28,识别测算所述手机信令数据中的每日有效用户总量,将城市A和B在n天内的各工作日有效用户总量分别拼接成数列{A(1)}、{B(1)},将城市A和B在n天内的各休息日有效用户总量分别拼接成数列{A(0)}、{B(0)};其中,i表示n天内的第i个工作日,j表示n天内的第j个休息日;
(2)获取所述手机运营商分别在城市A和B中连续n天的通讯数据,n≥28,识别测算所述通讯数据中的每日有效用户总量,将城市A和B在n天内的各工作日有效用户总量分别拼接成数列{a(1)}、{b(1)},将城市A和B在n天内的各休息日有效用户总量分别拼接成数列{a(0)}、{b(0)};其中,i表示n天内的第i个工作日,j表示n天内的第j个休息日;
(3)对所述手机信令数据在n天内的有效用户总量的稳定性进行检验,剔除其中不符合稳定性条件的日期;对所述通讯数据在n天内的有效用户总量的稳定性进行检验,剔除其中不符合稳定性条件的日期;经过稳定性检验、剔除不符合稳定性条件的日期后,从剩下的日期中挑选,挑选条件必须满足:A、B两城日期同步、日期连续、天数大于等于7天的数据,舍弃其余不连续日期的所有数据,整理得到如下各组数据:其中,i≥5,j≥2,并且i和j在日历表上连续;
(6)基于步骤(4)和(5)所获得的数据,进行突发性检查:当城市A和B同为工作日或同为休息日时的双向客流量相差大于10%时,或是当城市A和B同为工作日或同为休息日时的双向交互通讯量相差大于15%时,剔除对应该日期的所有数据;之后,从剩下的天数中挑选,条件须满足城市A和B时期同步、日期连续、天数等于7天的数据,舍弃其余日期的所有数据,整理得到如下各组数据:其中,i=1~5,j=1~2,并且i和j在日历表上连续;
(7)根据步骤(6),整理城际人信综合联系强度测算的基础数据,包括信令数据有效用户总量均值通讯数据有效用户总量均值 两城双向客流量均值两城交互通讯量均值 其中,分别表示城市A工作日、休息日信令数据有效用户总量均值;分别表示城市B工作日、休息日信令数据有效用户总量均值; 分别表示城市A工作日、休息日的通讯数据有效用户总量均值;分别表示城市B工作日、休息日的通讯数据有效用户总量均值;分别表示工作日、休息日的两城双向客流量均值;分别表示工作日、休息日的两城交互通讯量均值;
(8)根据步骤(7),利用信令数据有效用户总量均值和两城双向客流量均值分别计算获得工作日和休息日的城际客流联系强度;利用通讯数据有效用户总量均值和两城交互通讯量均值分别计算工作日和休息日的城际通讯流联系强度;依此,计算城际人信综合联系强度。
步骤(1)中,识别测算所述手机信令数据中的每日有效用户总量的方法为:所述手机信令数据中的每个用户记录须满足驻留时长可靠性条件,才可识别为当天所在城市的有效用户,所述可靠性条件为:
TZs-TZr≥120分钟
其中,TZs是指在一天计时周期内,用户于所在城市的尾记录的时间;TZr是指在一天计时周期内,用户于所在城市的首记录的时间。
步骤(2)中,识别测算所述通讯数据中的每日有效用户总量的方法为:在一天的计时周期内,任意用户在所在城市的所述通讯数据中显示有“打电话、接电话、发送短信、接收短信”中的任何一个数据记录,才可识别为当天所在城市的有效用户。
步骤(3)中,对所述手机信令数据在n天内的有效用户总量的稳定性进行检验的方法为:基于步骤(1),分别对工作日与休息日的四组数据{A(1)}、{B(1)}、{A(0)}、{B(0)}做环比2日移动平均:
步骤(4)中所述双向客流量的测算方法为:在一天的计时周期内,同一个手机用户在城市A和B中的所述手机信令数据中均有记录,且每次在城市A或B中的驻留时间均超过1小时以上,则识别该手机用户为有效停留;手机用户在城市A和B中停留时间的先后顺序分为如下情况,均识别为双向客流量的有效计次:
计为1次的:A→B,或B→A;
计为2次的:A→B→A,或B→A→B;
…;
计为2n-1次的:A→B→…→B,或B→A→…→A;
计为2n次的:A→B→…→A,或B→A→…→B;
基于上述有效计次,分别测算工作日和休息日每天城市A与城市B之间的双向客流总量:
步骤(5)中所述交互通讯量的测算方法为:在满足打电话双方或是收发短信的双方分别在城市A和城市B内的情况下,进行城市A和B之间交互通讯的有效计次,有效计次包括如下情况:
城市A和城市B内的所有手机呼出电话次数,包括城市A内手机呼城市B内手机或座机,城市B内手机呼城市A内手机或座机;
城市A和城市B内的所有接收非手机打来音讯电话次数;
城市A和城市B内所有发出短信的次数;
基于上述有效计次,分别测算工作日和休息日每天城市A和B之间的交互通讯总量:
步骤(6)中的所述突发性检查分为双向客流量的突发性检查和交互通讯量的突发性检查;所述双向客流量的突发性检查的方法为:分别对工作日与休息日两组数据{F(1)}、{F(0)}做环比2日移动平均:
所述交互通讯量的突发性检查的方法为:分别对工作日与休息日两组数据{f(1)}、{f(0)}做环比2日移动平均:
步骤(8)中城际人信综合联系强度的计算方法如下:
(8.1)分别计算工作日和休息日的城际客流联系强度:
(8.2)分别计算工作日和休息日的城际通讯流强度:
(8.3)计算城际客流联系强度:
(8.4)计算城际通讯流强度:
(8.5)分别计算工作日和休息日城际人信综合联系强度:
城市A对于城市B人信综合联系强度IA~B=IFA~B*80%+ifa~b*20%;
城市B对于城市A人信综合联系强度IB~A=IFB~A*80%+ifb~a*20%。
本发明的优点是,充分依托现有的无线通信网络信息资源,利用已有手机网络中的时间、空间数据,通过对工作日、休息日、两城市双向客流量、两城市交互通讯量等各种维度的综合测算,取得城际人信综合联系强度,实现低成本、高采样、低误测、高实效地获取城际人信综合联系强度,其测算结果具有可比性、科学性、实用性和综合性。
附图说明
图1为本发明中基于手机数据测算城际人信综合联系强度的方法流程框图。
具体实施方式
以下结合附图通过实施例对本发明的特征及其它相关特征作进一步详细说明,以便于同行业技术人员的理解:
实施例:如图1所示,本实施例具体涉及一种基于手机数据测算城际人信综合联系强度的方法,该方法需要确定两个待研究的城市,即城市A和B,以测算这两个城市的人信综合联系强度,具体包括如下步骤:
【步骤1】获取一家手机网络运营商分别在城市A和B的手机信令数据(简称信令数据),对于信令数据的条件要求为:a)时期相同,连续n天,n≥28,连续n天的数据,必然包含至少20个工作日、4个周六、4个周日;b)信令数据必须包含手机用户ID、时间戳、位置戳等字段信息,并包括开关机、接打电话、收发短信、切换基站、上网下网、基站定时唤醒等事件类型。
(步骤1.1)选取同期数据、分组:
将两个城市n天的数据分别分成两组,一组为工作日(周一至周五)的数据A(1)、B(1),另一组为休息日(周六、日)的数据A(0)、B(0)。
例如:城市A获取数据起始日期为2016-11-19、最后日期为2016-12-22;城市B获取数据起始日期为2016-11-18、最后日期为2016-12-20。首先,选取城市A与城市B同期的数据,即取AB两城日期同为2016-11-19至2016-12-20共32天的数据。然后将工作日与休息日的数据分组,分别整理如下:
工作日城市A的数据日期为:(2016-11-21为周一)A11-21到A11-25、A11-28到A12-02、A12-05到A12-09、A12-12到A12-16、A12-19、A12-20(共22天);
工作日城市B的数据日期为:B11-21到B11-25、B11-28到B12-02、B12-05到B12-11、B12-14到B12-18;
休息日城市A的数据日期为:(2016-11-19为周六)A11-19、A11-20、A11-26、A11-27、A12-03、A12-04、A12-10、A12-11、A12-17、A12-18(共10天);
休息日城市B的数据日期为:B11-19、B11-20、B11-26、B11-27、B12-03、B12-04、B12-10、B12-11、B12-17、B12-18。
(步骤1.2)识别信令数据有效用户:
信令数据中的每个用户记录须满足驻留时长可靠性条件,才可识别为当天所在城市的有效用户,该可靠性条件为:
TZs-TZr≥120分钟
其中,TZs是指在一天计时周期内,用户于所在城市的尾记录的时间;TZr是指在一天计时周期内,用户于所在城市的首记录的时间;
例如:日期2016-11-30,这一天为周三,是工作日,计算时间从该日凌晨00:00:00到夜里24:00:00。城市A的四个手机用户分别为路人甲、乙、丙、丁,他们在城市A留下的信令数据记录如下表:
表(1):信令数据城市A用户首尾记录
上表中,路人甲、路人乙和路人丁的TZs-TZr均大于或等于120分钟,被识别为有效用户,记录到当天有效用户总量中,而路人丙的TZs-TZr由于小于120分钟,故不被记录到当天有效用户总量中。计算城市A当日有效用户总量=∑(所有被识别为有效用户的数量)=2389541。
(步骤1.3)对每天的信令数据有效用户总量分别按工作日和休息日拼接成数列:
i=1~22 | 日期 | 星期 | {A<sup>(1)</sup>} |
i=01 | 2016-11-21 | 一 | 2408223 |
i=02 | 2016-11-22 | 二 | 2397954 |
i=03 | 2016-11-23 | 三 | 1851336 |
…… | |||
i=08 | 2016-11-30 | 三 | 2389541 |
…… | |||
i=22 | 2016-12-20 | 二 | 2375648 |
表(2):信令数据工作日城市A每天用户总量
j=1~10 | 日期 | 星期 | {A<sup>(0)</sup>} |
j=01 | 2016-11-19 | 六 | 2356678 |
j=02 | 2016-11-20 | 日 | 2349924 |
j=03 | 2016-11-26 | 六 | 1691376 |
…… | |||
j=10 | 2016-12-18 | 日 | 2275483 |
表(3):信令数据休息日城市A每天用户总量
同样地,将工作日和休息日城市B的有效用户每天总量也按上述步骤一一整理排序,组成连续数列{B(1)}、{B(0)}。
【步骤2】获取该家手机网络运营商分别在城市A和B的通讯数据,对于通讯数据的条件要求为:a)与步骤1获取的信令数据的时期相同,连续n天,n≥28,连续n天的数,必然包含至少20个工作日、4个周六、4个周日;b)通讯数据必须包含手机用户ID、时间戳、位置戳等字段信息,并包括打电话、接电话、发送短信、接收短信等事件类型。
(步骤2.1)选取同期数据、分组:
将两个城市n天的数据分别分成两组,一组为工作日(周一至周五)的数据a(1)、b(1),另一组为休息日(周六、日)的数据a(0)、b(0)。
例如:城市A获取数据起始日期为2016-11-15、最后日期为2016-12-28;城市B获取数据起始日期为2016-11-14、最后日期为2016-12-21。对照步骤1.1信令数据的日期,选取同期的数据,即取AB两城日期同为2016-11-19至2016-12-20共32天的数据。其中工作日22个,休息日10个。然后将工作日与休息日的数据分组,分别整理如下:
工作日城市A的数据日期为:(2016-11-21为周一)a11-21到a11-25、a11-28到a12-02、a12-05到a12-09、a12-12到a12-16、a12-19、a12-20(共22天);
工作日城市B的数据日期为:b11-21到b11-25、b11-28到b12-02、b12-05到b12-11、b12-14到b12-18。
休息日城市A的数据日期为:(2016-11-19为周六)a11-19、a11-20、a11-26、a11-27、a12-03、a12-04、a12-10、a12-11、a12-17、a12-18(共10天);
休息日城市B的数据日期为:b11-19、b11-20、b11-26、b11-27、b12-03、b12-04、b12-10、b12-11、b12-17、b12-18。
(步骤2.2)识别通讯数据有效用户
通讯数据中的有效用户必须满足通讯活跃性条件,即一个用户在某一天某个城市的通讯数据显示有“打电话、接电话、发送短信、接收短信”其中的任何一个数据记录,才识别为当天该城市的有效用户。
例如:日期2016-12-17,这一天为周六,是休息日,计算时间从该日凌晨00:00:00到夜里24:00:00。城市B的四个手机用户分别为路人#1、#2、#3、#4,他们在城市B留下的通讯数据记录如下表:
表(4):通讯数据城市B用户记录
上表中,路人#1、路人#3和路人#4当天有符合条件的通讯数据记录,被识别为有效用户,记录到当天有效用户总量b(0)中。路人#2由于没有任何记录,故不被记录到当天用户总量。计算城市B当日有效用户总量=∑(所有被识别为有效用户的数量)=1253216。
(步骤2.3)对每天的通讯数据有效用户总量分别按工作日和休息日拼接成数列:
j=1~10 | 日期 | 星期 | {b<sup>(0)</sup>} |
j=01 | 2016-11-19 | 六 | 1262283 |
j=02 | 2016-11-20 | 日 | 1260305 |
j=03 | 2016-11-26 | 六 | 1257495 |
j=04 | 2016-11-27 | 日 | 651373 |
…… | |||
j=09 | 2016-12-17 | 六 | 1253216 |
j=10 | 2016-12-18 | 日 | 1251638 |
表(5):通讯数据休息日城市B每天用户总量
i=1~22 | 日期 | 星期 | {b<sup>(1)</sup>} |
1=01 | 2016-11-21 | 一 | 1356656 |
i=02 | 2016-11-22 | 二 | 1349938 |
…… | |||
i=07 | 2016-11-29 | 二 | 891344 |
…… | |||
i=22 | 2016-12-20 | 二 | 1375664 |
表(6):通讯数据工作日城市B每天用户总量
同样地,将城市A的有效用户每天总量也按上述步骤一一整理排序,组成连续数列{a(1)}、{a(0)}。
【步骤3】经过步骤1、步骤2获取、识别和测算所得到的数据,必须检测手机数据的稳定性和连续性。
(步骤3.1)信令数据有效用户总量的稳定性检验:
基于步骤1,分别对工作日与休息日的四组数据{A(1)}、{B(1)}、{A(0)}、{B(0)}做环比2日移动平均:
由表(2),经检测:
由表(3),经检测:
同理,由于城市B的11月30日、12月17日的数据都不符合稳定性检测,应当剔除。
(布置3.2)通讯数据有效用户总量的稳定性检验:
由表(5),经检测:
由表(6),经检测:
同理,按以上方法经检测、由于城市A的12月13日、15日的数据都不符合稳定性检测,应当剔除。
(步骤3.3)连续性检验:
经过稳定性检验、剔除不符合条件的日期后,从剩下的天数中挑选,挑选条件必须满足:AB两城时期同步、日期连续、天数大于等于7天的数据(舍弃其余不连续日期的所有数据)。
经过步骤3.1和步骤3.2的稳定性检验,日期2016-11-23、26、27、29、30和2016-12-13、15、17的数据被剔除,剩下的日期中2016-11-19、20、21、22和2016-12-14、18、19、20的数据虽然通过了稳定性检验,但是日期连续都不超过7天,应当舍弃。
最后仅有日期2016-12-01到12-12连续12天数据是符合要求的,整理得到如下各组数据:
i=1~8 | 日期 | 星期 |
i=1 | 2016-12-01 | 四 |
i=2 | 2016-12-02 | 五 |
i=3 | 2016-12-05 | 一 |
…… | ||
i=7 | 2016-12-09 | 五 |
i=8 | 2016-12-12 | 一 |
表(7):工作日与对应日期连续排列表
j=1~4 | 日期 | 星期 |
j=1 | 2016-12-03 | 六 |
j=2 | 2016-12-04 | 日 |
j=3 | 2016-12-10 | 六 |
j=4 | 2016-12-11 | 日 |
表(8):休息日与对应日期连续排列表
表(7)和表(8)分别是通过有效性、连续性检测后得到的工作日和休息日的连续12天的数据,其中,工作日有8个,休息日有4个,且从2016-12-01至2016-12-12日的日期是连续的。
(步骤4.1)识别有效停留:
在一天中,同一个手机用户在城市A和城市B的信令数据中均有记录(表示该手机用户去过AB两城),并且每次在城市A或者城市B的驻留时间均超过1小时以上,才识别为有效停留。
对于每一用户的有效停留条件为:
TLs-TLr≥60分钟
TLs:在一次停留城市内,一个用户的尾记录的时间;
TLr:在一次停留城市内,一个用户的首记录的时间;
例如:日期2016-12-06(工作日),某些手机用户有甲、丁,他们分别在城市A和城市B留下的数据记录如下表:
表(9):2016-12-06用户甲在AB两城的有效停留表
表(10):2016-12-06用户丁在AB两城的有效停留表
(步骤4.2)识别双向客流量的有效计次:
满足上述条件情况,用户甲和丁被识别为该手机用户在城市A或B有效停留。按照一个手机用户在城市A与城市B中停留时间的先后顺序有如下排列情况,均识别为双向客流量的有效计次:
计为1次的:A→B,或B→A;
计为2次的:A→B→A,或B→A→B;
…;
计为2n-1次的:A→B→…→B,或B→A→…→A;
计为2n次的:A→B→…→A,或B→A→…→B;
n≥2;1、2n-1为奇数次停留计次,2、2n为偶数次停留计次。因此上述排列情况已经涵盖了所有可能发生的有效计次,没有遗漏。)
根据表(9)和表(10),按照上述方法,测算出用户甲的有效计次为3次、用户丁的有效计次为2次。
(步骤4.3)测算每天AB两城双向客流总量:
基于上述有效计次,分别测算工作日和休息日每天城市A与城市B之间的双向客流总量:
经过测算工作日、休息日AB两城双向客流每天总量如下两表:
表(11):工作日与对应日期双向客流量测算表
表(12):休息日与对应日期双向客流量测算表
(步骤5.1)识别交互通讯:
AB两城之间,每次交互通讯必须满足以下识别条件:打电话的双方必须分别在城市A和城市B两地(包含双方都是手机用户或者其中一方是手机用户的情况),并且每次通话时间在6秒钟(包含)以上,或者收发短信的双方必须分别在城市A和城市B两地。
TCh≥6秒钟,其中,TCh为通话时长。
例如:日期2016-12-10(休息日),某些手机用户有#1、#4,在与另一个城市进行点对点通讯留下的通讯数据记录分别如下表:
表(13):2016-12-10用户#1在AB两城的通讯数据记录
表(14):2016-12-10用户#4在AB两城的通讯数据记录
(步骤5.2)识别有效计次:
满足上述条件情况下,在识别有效计次时应当剔除重复计次也不能减漏计次,具体做法是根据通讯数据记录,对如下情形,均为识别为有效计次:
城市A+城市B的所有手机呼出电话次数(包括A城手机呼B城手机或座机,B城手机呼A城手机或座机);
城市A+城市B的所有接收非手机打来音讯电话次数;
城市A+城市B的所有发出短信次数。
(“城市A+城市B的所有接收手机打来电话次数”和“城市A+城市B的所有接收短信次数”与前者统计重复,所以不再计次)
根据表(13)和表(14),识别有效计次如下表:
表(15):2016-12-10用户#1在AB两城的通讯数据的有效记录
表(16):2016-12-10用户#4在AB两城的通讯数据的有效记录
根据表(15)和表(16),按照上述方法,测算出用户#1的有效计次为3次、用户#4的有效计次为1次。
步骤(5.3)测算每天AB两城交互通讯总量:
经过测算工作日休息日AB两城交互通讯每天总量如下两表:
i=1~8 | 日期 | 星期 | f<sub>i</sub><sup>(1)</sup> |
i=1 | 2016-12-01 | 四 | 72453 |
i=2 | 2016-12-02 | 五 | 72756 |
i=3 | 2016-12-05 | 一 | 68351 |
…… | |||
i=7 | 2016-12-09 | 五 | 72376 |
i=8 | 2016-12-12 | 一 | 112656 |
表(17):工作日与对应日期交互通讯量测算表
j=1~4 | 日期 | 星期 | f<sub>j</sub><sup>(0)</sup> |
j=1 | 2016-12-03 | 六 | 66436 |
j=2 | 2016-12-04 | 日 | 65376 |
j=3 | 2016-12-10 | 六 | 65516 |
j=4 | 2016-12-11 | 日 | 65890 |
表(18):休息日与对应日期交互通讯量测算表
【步骤6】双向客流量和交互通讯量的突发性检测:当AB两城或其中一个城市发生重大事件(如国际会议、全国比赛等等),数据量出现反常,会干扰双向客流量和交互通讯量的最后结果。因此要进行突发性检验。当同为工作日或同为休息日的双向客流量相差大于10%,或者当同为工作日或同为休息日的交互通讯量相差大于15%,表明数据不稳定、或者有突发事件干扰,剔除对应这一天的所有数据。
基于步骤4、步骤5获取、识别和测算所得到的数据,进行突发性检验,具体步骤如下:
(步骤6.1)双向客流量的突发性检测:
基于步骤4,分别对工作日与休息日两组数据{F(1)}、{F(0)}做环比2日移动平均:
由表(11)、表(12),经检测:
(步骤6.2)交互通讯量的突发性检验:
基于步骤5,分别对工作日与休息日两组数据{f(1)}、{f(0)}做环比2日移动平均:
由表(17)、表(18),经检测:
(步骤6.3)连续性检验和数据整理:
经过突发性检验、剔除不符合条件日期的数据后,从剩下的天数中挑选,条件必须满足:AB两城时期同步、日期连续、天数等于7天的数据(舍弃其余日期的所有数据),整理得到如下各组数据:a、 其中,i=1~5,j=1~2,并且i和j在日历表上是连续的7天(5个工作日和2个休息日,也称为全周期)。
经过步骤6.1和步骤6.2,现有符合条件的连续数据的共有9天,即2016-12-03至2016-12-11,其中日期12-03、12-04、12-10、12-11为周六、周日,其余为工作日。因此,我们选定2016-12-03至2016-12-09这7天的数据做样本(符合5个工作日和2个休息日,并且7天日期是连续的要求),也称为全周期。现将7天的数据整理成下表:
表(19):突发性检测和连续性检测后的7天数据
(步骤7.1)计算整理AB两城的信令数据有效用户总量均值:
(式02)城市A休息日用户总量均值A(0)
(步骤7.2)计算整理AB两城的通讯数据有效用户总量均值:
(步骤7.3)计算整理AB两城的双向客流量均值:
(步骤7.4)计算整理AB两城的交互通讯量均值:
【步骤8】根据步骤7,计算各种城际人信综合联系强度,分别如下:
(步骤8.1)工作日和休息日的客流联系强度:
考虑到城际联系的复杂性、研究使用的广泛性,我们从单一因子的城际联系强度到多因子城际联系强度,作了详细计算。并且,多因子城际联系强度更能综合地、真实地反映城市之间联系的密切性如何。单一因子是指仅考虑工作日或者休息日某一种“流”的大小,例如工作日城市A对于城市B的客流联系强度,又例如休息日城市B对于城市A的通讯量联系强度等等,都是指单一因子的城际联系强度。
多因子联系强度是指综合考虑工作日与休息日以后的联系强度,还有综合考虑双向客流与交互通讯流以后的联系强度,以及考虑工作日、休息日、双向客流、交互通讯流所有因子的城际联系强度。
根据(式01)~(式04)、(式09)、(式10),分别计算工作日和休息日城际客流联系强度,如下:
(步骤8.2)根据(式05)~(式08)、(式11)、(式12),分别计算工作日和休息日城际通讯流联系强度,即工作日和休息日的通讯流联系强度单独计算,如下:
步骤8.1和8.2所计算的城际联系强度,是区分了工作日和休息日以后的单一联系强度,因此还有必要综合考虑工作日与休息日合并起来后的城际联系强度。
(步骤8.3)工作日和休息日合并在一起计算客流联系强度:
根据(式13)~(式16),计算城际客流联系强度,如下:
(式21)城市A对于城市B的客流联系强度IFA~B
(式22)城市B对于城市A的客流联系强度IFB~A
(步骤8.4)工作日和休息日合并在一起计算通讯流联系强度:
根据(式17)~(式20),计算城际通讯流联系强度,如下:
(式23)城市A对于城市B的通讯流联系强度ifa~b
(式24)城市B对于城市A的通讯流联系强度ifb~a
(步骤8.5)单独计算工作日和休息日的客流与通讯流综合联系强度:
根据(式13)~(式20)式,分别计算工作日和休息日城际人信综合联系强度,如下:
(式25)工作日城市A对于城市B的人信综合联系强度
(式26)休息日城市A对于城市B的人信综合联系强度
(式27)工作日城市B对于城市A的人信综合联系强度
(式28)休息日城市B对于城市A的人信综合联系强度
(步骤8.6)根据(式21)~(式24),计算城际人信综合联系强度,如下:
(式29)城市A对于城市B人信综合联系强度
IA~B=IFA~B*80%+ifa~b*20%=0.03636*80%+0.03193*20%=0.0355
(式30)城市B对于城市A人信综合联系强度
IB~A=IFB~A*80%+ifb~a*20%=0.05756*80%+0.05161*20%=0.0564
其中,(式29)就是综合考虑了工作日、休息日、双向客流、交互通讯流四个因子的城市A对于城市B的人信综合联系强度。(式30)就是综合考虑了工作日、休息日、双向客流、交互通讯流四个因子的城市B对于城市A的人信综合联系强度。
联系强度越大,表示两个城市之间的联系越紧密。随着现代城市经济的发展,城际联系是不可或略的研究热点,通过对城际联系强度的描述,研究者可以轻松把握城市之间的联系密切性,从而了解城际发展的内在联系。有了强度,就可以建立联系标准的分类,进而可以帮助研究城际联系强度大小数值的分类标准,例如:0<I<0.01为微弱联系,0.01≤I<0.03为一般联系,0.03≤I<0.06为紧密联系,I≥0.06以上为同城化联系,等等。I为两城之间的人信综合联系强度,例如:IA~B=0.028,IB~A=0.056,表明对于城市A来讲,两城的联系紧密性为一般联系,对于城市B来讲,两城的联系紧密性为紧密联系,也就是城市B更加依附于城市A。
不同性质的城市,表现出的城际联系强度特征也不一样。例如旅游城市的休息日联系强度会大于工作日的联系强度,此时可以用单一因子联系强度更有助于分析旅游城市的城际联系特征。
由于工作日与周末是两种不同的时期,城际的客流与通讯流会有不同的特征,上述各种强度分别表征了在不同时期的城际客流与通讯流,并依据这种特点对城际联系强度进行综合考量,最后测算出城际人信综合联系强度。过程中还包括了基于工作日、周末、两城市双向客流量、两城市交互通讯量等四种不同角度测算城际联系强度,使得这些强度更广泛地适用于各种不同领域对城际联系的研究。
其中,(式13)~(式16)为单因子客流联系强度,(式17)~(式20)为单因子通讯流联系强度;(式21)、(式22)为全周期客流联系强度,(式23)、(式24)为全周期通讯流联系强度;(式25)~(式28)为区分工作日、休息日的城际人信综合联系强度;(式29)为城市A对于城市B人信综合联系强度,(式30)为城市B对于城市A人信综合联系强度。
Claims (9)
1.一种基于手机数据测算城际人信综合联系强度的方法,其特征在于所述方法包括以下步骤:
(1)获取任一手机运营商分别在城市A和B中连续n天的手机信令数据,n≥28,识别测算所述手机信令数据中的每日有效用户总量,将城市A和B在n天内的各工作日有效用户总量分别拼接成数列{A(1)}、{B(1)},将城市A和B在n天内的各休息日有效用户总量分别拼接成数列{A(0)}、{B(0)};其中,i表示n天内的第i个工作日,j表示n天内的第j个休息日;
(2)获取所述手机运营商分别在城市A和B中连续n天的通讯数据,n≥28,识别测算所述通讯数据中的每日有效用户总量,将城市A和B在n天内的各工作日有效用户总量分别拼接成数列{a(1)}、{b(1)},将城市A和B在n天内的各休息日有效用户总量分别拼接成数列{a(0)}、{b(0)};其中,i表示n天内的第i个工作日,j表示n天内的第j个休息日;
(3)对所述手机信令数据在n天内的有效用户总量的稳定性进行检验,剔除其中不符合稳定性条件的日期;对所述通讯数据在n天内的有效用户总量的稳定性进行检验,剔除其中不符合稳定性条件的日期;经过稳定性检验、剔除不符合稳定性条件的日期后,从剩下的日期中挑选,挑选条件必须满足:A、B两城日期同步、日期连续、天数大于等于7天的数据,舍弃其余不连续日期的所有数据,整理得到如下各组数据:其中,i≥5,j≥2,并且i和j在日历表上连续;
(6)基于步骤(4)和(5)所获得的数据,进行突发性检查:当城市A和B同为工作日或同为休息日时的双向客流量相差大于10%时,或是当城市A和B同为工作日或同为休息日时的双向交互通讯量相差大于15%时,剔除对应该日期的所有数据;之后,从剩下的天数中挑选,条件须满足城市A和B时期同步、日期连续、天数等于7天的数据,舍弃其余日期的所有数据,整理得到如下各组数据:其中,i=1~5,j=1~2,并且i和j在日历表上连续;
(7)根据步骤(6),整理城际人信综合联系强度测算的基础数据,包括信令数据有效用户总量均值通讯数据有效用户总量均值 两城双向客流量均值两城交互通讯量均值 其中,分别表示城市A工作日、休息日信令数据有效用户总量均值;分别表示城市B工作日、休息日信令数据有效用户总量均值; 分别表示城市A工作日、休息日的通讯数据有效用户总量均值;分别表示城市B工作日、休息日的通讯数据有效用户总量均值;分别表示工作日、休息日的两城双向客流量均值;分别表示工作日、休息日的两城交互通讯量均值;
(8)根据步骤(7),利用信令数据有效用户总量均值和两城双向客流量均值分别计算获得工作日和休息日的城际客流联系强度;利用通讯数据有效用户总量均值和两城交互通讯量均值分别计算工作日和休息日的城际通讯流联系强度;
依此,计算城际人信综合联系强度。
2.根据权利要求1所述的一种基于手机数据测算城际人信综合联系强度的方法,其特征在于步骤(1)中,识别测算所述手机信令数据中的每日有效用户总量的方法为:所述手机信令数据中的每个用户记录须满足驻留时长可靠性条件,才可识别为当天所在城市的有效用户,所述可靠性条件为:
TZs-TZr≥120分钟
其中,TZs是指在一天计时周期内,用户于所在城市的尾记录的时间;TZr是指在一天计时周期内,用户于所在城市的首记录的时间。
3.根据权利要求1所述的一种基于手机数据测算城际人信综合联系强度的方法,其特征在于步骤(2)中,识别测算所述通讯数据中的每日有效用户总量的方法为:在一天的计时周期内,任意用户在所在城市的所述通讯数据中显示有“打电话、接电话、发送短信、接收短信”中的任何一个数据记录,才可识别为当天所在城市的有效用户。
4.根据权利要求1所述的一种基于手机数据测算城际人信综合联系强度的方法,其特征在于步骤(3)中,对所述手机信令数据在n天内的有效用户总量的稳定性进行检验的方法为:基于步骤(1),分别对工作日与休息日的四组数据{A(1)}、{B(1)}、{A(0)}、{B(0)}做环比2日移动平均:
5.根据权利要求1所述的一种基于手机数据测算城际人信综合联系强度的方法,其特征在于步骤(4)中所述双向客流量的测算方法为:在一天的计时周期内,同一个手机用户在城市A和B中的所述手机信令数据中均有记录,且每次在城市A或B中的驻留时间均超过1小时以上,则识别该手机用户为有效停留;手机用户在城市A和B中停留时间的先后顺序分为如下情况,均识别为双向客流量的有效计次:
计为1次的:A→B,或B→A;
计为2次的:A→B→A,或B→A→B;
…;
计为2n-1次的:A→B→…→B,或B→A→…→A;
计为2n次的:A→B→…→A,或B→A→…→B;
基于上述有效计次,分别测算工作日和休息日每天城市A与城市B之间的双向客流总量:
7.根据权利要求1所述的一种基于手机数据测算城际人信综合联系强度的方法,其特征在于步骤(6)中的所述突发性检查分为双向客流量的突发性检查和交互通讯量的突发性检查;所述双向客流量的突发性检查的方法为:分别对工作日与休息日两组数据{F(1)}、{F(0)}做环比2日移动平均:
所述交互通讯量的突发性检查的方法为:分别对工作日与休息日两组数据{f(1)}、{f(0)}做环比2日移动平均:
9.根据权利要求1所述的一种基于手机数据测算城际人信综合联系强度的方法,其特征在于步骤(8)中城际人信综合联系强度的计算方法如下:
(8.1)分别计算工作日和休息日的城际客流联系强度:
(8.2)分别计算工作日和休息日的城际通讯流强度:
(8.3)计算城际客流联系强度:
(8.4)计算城际通讯流强度:
(8.5)分别计算工作日和休息日城际人信综合联系强度:
(8.6)计算城际人信综合联系强度:
城市A对于城市B人信综合联系强度IA~B=IFA~B*80%+ifa~b*20%;
城市B对于城市A人信综合联系强度IB~A=IFB~A*80%+ifb~a*20%。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710321840.1A CN107222886B (zh) | 2017-05-09 | 2017-05-09 | 一种基于手机数据测算城际人信综合联系强度的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710321840.1A CN107222886B (zh) | 2017-05-09 | 2017-05-09 | 一种基于手机数据测算城际人信综合联系强度的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107222886A CN107222886A (zh) | 2017-09-29 |
CN107222886B true CN107222886B (zh) | 2020-04-14 |
Family
ID=59944033
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710321840.1A Expired - Fee Related CN107222886B (zh) | 2017-05-09 | 2017-05-09 | 一种基于手机数据测算城际人信综合联系强度的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107222886B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110334135A (zh) * | 2019-06-04 | 2019-10-15 | 武汉大学 | 一种基于微博轨迹数据的城市联结强度计算方法 |
CN113194152B (zh) * | 2021-05-18 | 2022-04-19 | 同济大学 | 一种基于手机信令数据的低活动强度建设用地识别方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105488120A (zh) * | 2015-11-23 | 2016-04-13 | 上海川昱信息科技有限公司 | 基于手机大数据实时采集人口空间分布与大客流预警方法 |
CN105513351A (zh) * | 2015-12-17 | 2016-04-20 | 北京亚信蓝涛科技有限公司 | 一种基于大数据的交通出行特征数据提取方法 |
CN105893491A (zh) * | 2016-03-29 | 2016-08-24 | 东南大学 | 一种基于区域城际流强度测算模型的划定大都市圈的方法 |
-
2017
- 2017-05-09 CN CN201710321840.1A patent/CN107222886B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105488120A (zh) * | 2015-11-23 | 2016-04-13 | 上海川昱信息科技有限公司 | 基于手机大数据实时采集人口空间分布与大客流预警方法 |
CN105513351A (zh) * | 2015-12-17 | 2016-04-20 | 北京亚信蓝涛科技有限公司 | 一种基于大数据的交通出行特征数据提取方法 |
CN105893491A (zh) * | 2016-03-29 | 2016-08-24 | 东南大学 | 一种基于区域城际流强度测算模型的划定大都市圈的方法 |
Non-Patent Citations (2)
Title |
---|
Large-Scale Mobile Traffic Analysis: A Survey;Naboulsi D 等;《IEEE Communications Surveys & Tutorials》;20151015;全文 * |
基于手机信令的大范围人流移动分析;唐小勇;《重庆交通大学学报(自然科学版)》;20170115;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN107222886A (zh) | 2017-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Calabrese et al. | Estimating Origin-Destination flows using opportunistically collected mobile phone location data from one million users in Boston Metropolitan Area | |
Wang et al. | Transportation mode inference from anonymized and aggregated mobile phone call detail records | |
CN102595323B (zh) | 基于手机定位数据的居民出行特征参数的获取方法 | |
CN106295787B (zh) | 一种基于移动信令的客流统计方法及装置 | |
Naboulsi et al. | Classifying call profiles in large-scale mobile traffic datasets | |
CN107040894A (zh) | 一种基于手机信令数据的居民出行od获取方法 | |
von Mörner | Application of call detail records-chances and obstacles | |
CN109165779B (zh) | 一种基于多源大数据与长短期记忆神经网络模型的人口数量预测方法 | |
CN107222886B (zh) | 一种基于手机数据测算城际人信综合联系强度的方法 | |
Sørensen et al. | Use of mobile phone data for analysis of number of train travellers | |
CN101814112A (zh) | 处理数据的方法和装置 | |
CN111210056A (zh) | 电价方案确定方法、装置、计算机设备和存储介质 | |
CN104573874A (zh) | 一种公交线路的规划方法和装置 | |
CN114741612B (zh) | 一种基于大数据的消费习惯分类方法、系统和存储介质 | |
Vanhoof et al. | Performance and sensitivities of home detection on mobile phone data | |
CN108989060A (zh) | 一种对运营商流量计费检测准确性的方法及检测系统 | |
CN114501336B (zh) | 一种公路出行量测算方法、装置、电子设备及存储介质 | |
CN111600993A (zh) | 一种根据短信进行行程提醒的方法和装置 | |
CN101155380B (zh) | 无线网络测试数据的整合系统及方法 | |
CN102256255A (zh) | 一种基于时间和地理位置冲突的反并卡侦测方法 | |
CN115988422A (zh) | 基于出行链解析的多层次轨道交通换乘客流提取方法 | |
CN116957528A (zh) | 一种对多来源打卡数据自动生成考勤结果的方法及系统 | |
Naboulsi et al. | Human mobility flows in the city of Abidjan | |
CN108418644B (zh) | 信号处理方法及装置 | |
CN116594974A (zh) | 一种基于会员行为日志的智慧工会app活跃度分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20200414 |