CN110753307A - 一种基于居民调查数据获取带有标签的手机信令轨迹数据方法 - Google Patents
一种基于居民调查数据获取带有标签的手机信令轨迹数据方法 Download PDFInfo
- Publication number
- CN110753307A CN110753307A CN201911019390.6A CN201911019390A CN110753307A CN 110753307 A CN110753307 A CN 110753307A CN 201911019390 A CN201911019390 A CN 201911019390A CN 110753307 A CN110753307 A CN 110753307A
- Authority
- CN
- China
- Prior art keywords
- mobile phone
- data
- travel
- phone signaling
- resident
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000011664 signaling Effects 0.000 title claims abstract description 130
- 238000000034 method Methods 0.000 title claims abstract description 22
- 238000012216 screening Methods 0.000 claims abstract description 24
- 230000004927 fusion Effects 0.000 claims abstract description 7
- 238000011160 research Methods 0.000 claims description 25
- 230000000717 retained effect Effects 0.000 claims description 2
- 238000004891 communication Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/029—Location-based management or tracking services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Educational Administration (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Computer Networks & Wireless Communication (AREA)
- General Health & Medical Sciences (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明公开了一种基于居民调查数据获取带有标签的手机信令轨迹数据方法,包括以下步骤:S1获取手机信令轨迹数据以及居民出行调查数据的基本属性信息;S2基于手机基站与交通小区的空间对应关系将手机出行OD转化成交通小区出行OD;S3针对不同日期提取手机信令轨迹数据以及居民出行调查数据的特征集合,对数据进行时间纬度上的初步融合;S4基于每一条居民出行调查数据的出行特征属性,在所设定的匹配规则下对手机信令轨迹数据进行初步筛选匹配;S5结合出行者与手机用户的个人特征属性,完成对居民出行调查数据与手机信令轨迹数据最终的特征匹配,获得带有标签的手机信令轨迹数据。实现了手机信令数据大样本与居民出行调查数据小样本的数据融合。
Description
技术领域
本发明涉及大数据、小数据匹配领域,具体是一种带有标签的手机信令轨迹数据获取方法。
背景技术
通信与互联网技术的发展与普及应用,应运而生的是对其背后蕴藏的大量潜在信息的大数据的挖掘研究。据工信部统计,截止2015年底,全国手机用户已达12.86亿,手机普及率为每百人94.5部。其手机信令数据以其内涵丰富、采样率高以及时效性好等优良特性吸引了大量学者的关注。然而手机信令数据出于保护隐私以及数据采集字段自身的一些局限性的缘故,很难获取准确的带有标签的样本信息,如出行者的类型属性以及出行方式,这将阻碍交通分析、交通规划等相关专题研究的进一步推进。
从通信网络获取的手机信令数据是由运营商经过匿名处理的位置大数据,一方面得益于其不涉及用户隐私在很多宏观领域的研究中得到了广泛的应用,另一方面匿名的特性也给研究带来了一些阻碍。尤其是在颗粒度较为精细的个体出行链研究中,由于很难获取到该用户真实的出行信息,导致无法搭建数据与真实场景之间桥梁,很难检验科研结果的准确性。
传统居民调查是由当地规划部门组织,获取居民交通需求最基本的途径,尽管在大数据发展如火如荼的今天,传统抽样调查仍是不可被抛弃的交通信息获取手段。北京、上海等大城市都开展过多次综合交通调查,而且建立了长效机制,定期组织开展综合交通调查以及各种专项交通调查。一方面传统居民出行调查得到的个人属性以及出行信息的完整度较高,包含有性别、年龄、出行目的、出行方式等属性。另一方面由于居民出行调查的组织者是当地政府部门,而且采用的是分级抽样调查的方法,可以有效的避免获取的样本数据在人群和时空分布上的偏向性,更具随机性。
相比于手机信令轨迹数据,居民出行调查数据是一种属性丰富的抽样小数据,这两类数据源的融合匹配为手机轨迹样本的出行方式标签获取提供了一条新思路。
目前,对于大数据与小数据匹配结合的研究较少,相近的有张晨等人提出的一种基于多签到数据的标签匹配算法。包括以下步骤:1)基于单个用户的多种签到数据间具有时间和空间相近的时空相关性,计算多个标签之间的正负关系;2)基于标签之间的正负关系,构建面向多签到数据的符号网络;3)摒弃不适用于签到数据符号网络的分割条件,并通过增加权值分布密度来改进已有FEC社区发现算法的分割机制,以适应签到数据符号网络的特性,实现多标签的划分;4)利用仿真实验分析实现多类别的签到数据的标签匹配。该方案局限于匹配同一用户具有时空相关性的不同种类的签到数据,而由于居民调查出行数据是由人工填写获取,存在时间和空间纬度的误差。
发明内容
本发明针对背景技术中存在的问题:现有的多源数据特征标签匹配方法中,对于所匹配的数据源时空相关性要求较高。而同一用户产生的各类不同的数据中,由于误差的存在会导致数据源间时空相关性差,使得最终匹配结果精度不高。
本发明基于居民调查数据与手机信令轨迹数据,根据数据的出行特征及个体属性特征相关性的特点,从数据样本整体角度出发,提取出行者的出行相关特征以及用户基本属性信息,通过时空分类汇聚进行初步处理。然后基于每一条居民出行调查数据的出行特征属性,在所设定的匹配规则下对手机信令轨迹数据进行初步筛选匹配。最后结合出行者与手机用户的个人特征属性,完成对居民出行调查数据与手机信令轨迹数据最终的特征匹配,得到匹配成功的手机信令轨迹数据的扩展属性,实现手机信令数据大样本与居民出行调查数据小样本的数据融合。
技术方案:
一种基于居民调查数据获取带有标签的手机信令轨迹数据方法,包括以下步骤:
S1、获取手机信令轨迹数据以及居民出行调查数据的基本属性信息;
S2、基于手机基站与交通小区的空间对应关系将手机出行OD转化成交通小区出行OD;
S3、针对不同日期提取手机信令轨迹数据以及居民出行调查数据的特征集合,对数据进行时间纬度上的初步融合;
S4、基于每一条居民出行调查数据的出行特征属性,在所设定的匹配规则下对手机信令轨迹数据进行初步筛选匹配;
S5、结合出行者与手机用户的个人特征属性,完成对居民出行调查数据与手机信令轨迹数据最终的特征匹配,得到匹配成功的手机信令轨迹数据的扩展属性,即获得带有标签的手机信令轨迹数据。
优选的,步骤S1先获取研究地区研究时间范围内的手机信令轨迹数据与居民出行调查数据,然后从运营商获取对应手机用户基本个人特征属性信息。
优选的,所述基本个人特征属性信息包括性别、年龄。
具体的,步骤S2基于手机基站与交通小区的空间对应关系将手机出行OD转化成交通小区出行OD,包括以下步骤:
S21、遍历居民出行调查数据集,对研究范围内所划分的交通小区进行统一编号;
S22、根据先验经验知识并结合研究区域实际情况,利用Arcgis的相交分析工具确定基站与交通小区对应表;
S23、根据已确定的基站与交通小区对应表,将通过手机信令数据提取出来的基于基站的出行OD汇聚成基于交通小区的出行OD。
优选的,步骤S3对所获取的研究地区研究时间范围内的手机信令数据与居民出行调查数据特征集合,从时间特征纬度上根据不同的日期进行分类汇聚,将同一日期的居民出行调查数据与手机信令轨迹数据进行初步融合。
具体的,步骤S4基于每一条居民出行调查数据的出行特征属性,在所设定的匹配规则下对手机信令轨迹数据进行初步筛选匹配,包括以下步骤:
S41、遍历居民出行调查数据集,基于每一条居民出行调查数据的出行起讫点特征属性O_id与D_id对手机信令轨迹数据集进行筛选匹配,筛选出具有相同O_id与D_id特征属性的手机信令轨迹数据子集;其中:O_id表示出行起点所在交通小区编号,D_id表示出行终点所在交通小区编号;
S42、针对上一步骤中每一条居民调查出行数据及其初步筛选匹配出的手机信令轨迹数据子集,分别提取第i条居民出行调查数据特征属性中的出发时间O_time_i和到达时间D_time_i,i=1,2,3...以及与其对应手机信令轨迹数据子集中第j条数据特征属性中的出发时间leave_timeij和到达时间arrive_timeij,j=1,2,3...,对每一条手机信令轨迹数据计算与其相对应的居民出行调查数据的出发时间误差值TO ij与到达时间误差值TD ij:
TO ij=|O_timei-leave_timeij|(i=1,2,3...;j=1,2,3...)
TD ij=|D_timei-arrive_timeij|(i=1,2,3...;j=1,2,3...)
S43、遍历手机信令轨迹数据集,对于每一条居民出行调查数据对应的手机信令轨迹数据子集进行时间误差的阈值判别:
若第i条居民出行调查数据对应的第j条手机信令轨迹数据能够满足TO ij≤T1且TD ij≤T2的阈值条件,则保留,其中T1和T2为设定的阈值;否则,将该条手机信令轨迹数据从第i条居民出行调查数据对应的手机信令轨迹数据子集中删除;
即得到基于居民出行调查数据出行特征属性的初步匹配结果。
作为一条居民出行调查数据与手机信令轨迹数据的特征匹配规则,步骤S5结合出行者与手机用户的个人特征属性,完成对居民出行调查数据与手机信令轨迹数据的特征匹配,包括根据每一条居民出行调查数据中出行者的性别特征sex,对其匹配的手机信令轨迹数据子集的用户性别特征进行筛选,仅保留其匹配子集中性别特征相同的手机信令轨迹数据。
作为一条居民出行调查数据与手机信令轨迹数据的特征匹配规则,步骤S5结合出行者与手机用户的个人特征属性,完成对居民出行调查数据与手机信令轨迹数据的特征匹配,包括遍历居民出行调查数据集,基于每一条居民出行调查数据的出行者年龄特征属性age对其对应的手机信令轨迹数据子集进一步的筛选匹配:筛选出年龄相差小于等于2岁的手机信令轨迹数据进行保留;其他数据从匹配集中删除。
作为一条居民出行调查数据与手机信令轨迹数据的特征匹配规则,步骤S5结合出行者与手机用户的个人特征属性,完成对居民出行调查数据与手机信令轨迹数据的特征匹配,包括遍历居民出行调查数据集,统计每一条居民出行调查数据所匹配的手机信令轨迹数据子集中元素个数,记为N,进行以下的规则判别:
若N=0,则该条居民出行调查数据没有成功匹配的手机信令轨迹数据,将其从居民出行调查数据集中剔除;
若N=1,则该条居民出行调查数据成功匹配了唯一一条的手机信令轨迹数据,将其保留;
若N≥1,则该条居民出行调查数据存在多条手机信令轨迹数据与其匹配,匹配未成功,将其从居民出行调查数据集中剔除。
本发明的有益效果:
在以往的研究中,获取样本数据(小数据)的主要途径是通过征集志愿者调查记录一天的出行信息,同时在征得志愿者本人同意并签署授权书的前提下从通信运营商处提取该用户的手机信令数据进行研究。尽管手机数据是一种易获取,经济性和适用性高的交通大数据源,但是研究所需的带有出行者真实出行信息(包括出行轨迹、出行时间、出行方式等)的标签样本的可获取性较差。此外,受限于研究机构的规模和性质,招募的志愿者群体可能存在倾向性导致获取的标签出行样本在出行群体上具有偏差性。比如高校性质的研究机构志愿者大多为学生群体,其活动范围、出行目的和出行方式都较为局限。
本发明基于居民出行调查数据与手机信令轨迹数据来获取带有标签的手机信令轨迹数据。具体的:居民出行调查数据中包含有居民的性别、年龄、每条出行记录的出发交通小区编号、到达交通小区编号、出发时间、到达时间。从手机信令数据中提取出来的出行基站轨迹信息中也包含每条出行轨迹的出发点和到达点(记录单元为基站)、轨迹出发时间和到达时间以及通过IMSI号对应的该用户的性别和年龄。通过这些特征属性的对应可以将手机信令数据提取出来的出行轨迹与居民出行调查数据进行匹配,当两条记录在设定的规则下匹配成功时则可得到该手机信令出行轨迹的出行方式、出行目的等个人出行信息及家庭属性信息,从而获取包含有不同人群、不同时刻、不同交通出行方式等的手机轨迹样本数据。
本发明基于居民调查数据与手机信令轨迹数据,根据数据的出行特征及个体属性特征相关性的特点,从数据样本整体角度出发,提取出行者的出行相关特征以及用户基本属性信息,通过时空分类汇聚进行初步处理。然后基于每一条居民出行调查数据的出行特征属性,在所设定的匹配规则下对手机信令轨迹数据进行初步筛选匹配。最后结合出行者与手机用户的个人特征属性,完成对居民出行调查数据与手机信令轨迹数据最终的特征匹配,得到匹配成功的手机信令轨迹数据的扩展属性,实现手机信令数据大样本与居民出行调查数据小样本的数据融合。
附图说明
图1是本发明的方案流程图
具体实施方式
居民出行调查数据中包含有居民的性别、年龄、每条出行记录的出发交通小区编号、到达交通小区编号、出发时间、到达时间。从手机信令数据中提取出来的出行基站轨迹信息中也包含每条出行轨迹的出发点和到达点(记录单元为基站)、轨迹出发时间和到达时间以及通过IMSI号对应的该用户的性别和年龄。通过这些特征属性的对应可以将手机信令数据提取出来的出行轨迹与居民出行调查数据进行匹配,当两条记录在设定的规则下匹配成功时则可得到该手机信令出行轨迹的出行方式、出行目的等个人出行信息及家庭属性信息,从而获取包含有不同人群、不同时刻、不同交通出行方式等的手机轨迹样本数据。
下面结合图1和具体实施例对本发明作进一步描述。
步骤S1中以2017年南京市城市与交通规划设计研究院股份有限公司与苏州规划设计研究院股份有限公司在昆山联合开展的大规模综合交通调查中居民出行调查数据结合此期间内的昆山市移动手机信令数据为例,其中居民出行调查采取家访调查的方式,由调查人员上门收发出行调查表格。该次调查中随机抽取了城市集中建设区家庭5150户,外围村镇250户,最终收集到有效的出行数据共38598条。调查中根据昆山市用地规模、土地利用性质和规划布局特点确定了交通小区边界,以村委会和居委会为基本单元将昆山市划分成531个交通小区,出行起讫点的录入均以交通小区为依据。
居民出行调查中出行者的基本属性信息如表1所示:
表1出行者基本属性信息
此期间内在昆山市出现的手机用户基本属性信息如表2所示:
表2手机用户基本属性信息
此期间内在昆山市出现的手机用户出行轨迹记录属性信息如表3所示:
表3手机用户出行轨迹记录属性信息
步骤S2中基于空间对应关系利用Arcgis相交分析工具所得到的手机基站与交通小区对应表,部分示例为对应交通小区180的所有基站ID如表4所示,基于基站的手机信令数据出行OD汇聚转化为基于交通小区的手机信令数据出行OD如表5所示。
表4基站与交通小区对应表
表5基于交通小区的手机信令数据出行OD示例
步骤S3中从时间特征纬度上根据不同的日期进行分类汇聚,将同一日期的居民出行调查数据与手机信令轨迹数据进行初步融合,案例中所选取的6月18日的居民调查数据部分示例如表6所示:
表6 6月18日居民出行调查数据示例
步骤S4中基于居民出行调查数据的出行特征属性,在所设定的匹配规则下对手机信令轨迹数据进行初步筛选匹配结果,匹配规则:
S41、遍历居民出行调查数据集,基于每一条居民出行调查数据的出行起讫点特征属性O_id与D_id对手机信令轨迹数据集进行筛选匹配,筛选出具有相同O_id与D_id特征属性的手机信令轨迹数据子集。
S42、针对上一步骤中每一条居民调查出行数据及其初步筛选匹配出的手机信令轨迹数据子集,分别提取第i条居民出行调查数据特征属性中的出发时间O_time_i和到达时间D_time_i(i=1,2,3...)以及与其对应手机信令轨迹数据子集中第j条数据特征属性中的出发时间leave_timeij和到达时间arrive_timeij(j=1,2,3...),对每一条手机信令轨迹数据计算与其相对应的居民出行调查数据的出发时间误差值TO ij与到达时间误差值TD ij:
TO ij=|O_timei-leave_timeij|(i=1,2,3...;j=1,2,3...)
TD ij=|D_timei-arrive_timeij|(i=1,2,3...;j=1,2,3...)
S43、遍历手机信令轨迹数据集,对于每一条居民出行调查数据对应的手机信令轨迹数据子集进行时间误差的阈值判别:
若第i条居民出行调查数据对应的第j条手机信令轨迹数据能够满足TO ij≤30min与TD ij≤30min的阈值条件,则保留;否则,将该条手机信令轨迹数据从第i条居民出行调查数据对应的手机信令轨迹数据子集中删除。
仅基于居民出行调查数据的出行特征属性条件下,根据所设定的匹配规则下筛选匹配到的手机信令轨迹数据条数记为match_num,如表7所示:
表7初步筛选匹配结果示例
步骤S5中结合出行者与手机用户的个人特征属性,完成对居民出行调查数据与手机信令轨迹数据最终的特征匹配,匹配步骤为:
S51、根据每一条居民出行调查数据中出行者的性别特征sex,对其匹配的手机信令轨迹数据子集的用户性别特征进行筛选,仅保留其匹配子集中性别特征相同的手机信令轨迹数据;
S52、遍历居民出行调查数据集,基于每一条居民出行调查数据的出行者年龄特征属性age对其对应的手机信令轨迹数据子集进一步的筛选匹配:筛选出年龄相差小于等于2岁的手机信令轨迹数据进行保留;其他数据从匹配集中删除。
S53、遍历居民出行调查数据集,统计每一条居民出行调查数据所匹配的手机信令轨迹数据子集中元素个数,记为N,进行以下的规则判别:
若N=0,则该条居民出行调查数据没有成功匹配的手机信令轨迹数据,将其从居民出行调查数据集中剔除;
若N=1,则该条居民出行调查数据成功匹配了唯一一条的手机信令轨迹数据,将其保留;
若N≥1,则该条居民出行调查数据存在多条手机信令轨迹数据与其匹配,匹配未成功,将其从居民出行调查数据集中剔除;
经过匹配后,共得到5861条匹配成功的手机出行轨迹数据,部分示例如表8所示。id为居民出行调查数据的编号,type为出行方式的类别,1为步行、2为自行车、3为小汽车、4为公交车、5为小汽车,O_time和D_time分别表示居民出行调查数据中填写的出发时刻和到达时刻,O_id和D_id分别表示起终点所在交通小区编号,sex为该用户的性别,age为年龄,leave_time和arrive_time分别表示匹配成功的手机出行轨迹中第一个停留点(出行起点)的离开时间和第二个停留点(出行终点)的到达时间。
表8部分匹配数据示例
至此,获得高精度的带有标签的手机信令轨迹数据。
以上实施例仅用于说明本发明的技术方案,而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细地说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的实质和范围。
Claims (9)
1.一种基于居民调查数据获取带有标签的手机信令轨迹数据方法,其特征在于包括以下步骤:
S1、获取手机信令轨迹数据以及居民出行调查数据的基本属性信息;
S2、基于手机基站与交通小区的空间对应关系将手机出行OD转化成交通小区出行OD;
S3、针对不同日期提取手机信令轨迹数据以及居民出行调查数据的特征集合,对数据进行时间纬度上的初步融合;
S4、基于每一条居民出行调查数据的出行特征属性,在所设定的匹配规则下对手机信令轨迹数据进行初步筛选匹配;
S5、结合出行者与手机用户的个人特征属性,完成对居民出行调查数据与手机信令轨迹数据最终的特征匹配,得到匹配成功的手机信令轨迹数据的扩展属性,即获得带有标签的手机信令轨迹数据。
2.如权利要求1所述的一种基于居民调查数据获取带有标签的手机信令轨迹数据方法,其特征在于步骤S1先获取研究地区研究时间范围内的手机信令轨迹数据与居民出行调查数据,然后从运营商获取对应手机用户基本个人特征属性信息。
3.如权利要求1所述的一种基于居民调查数据获取带有标签的手机信令轨迹数据方法,其特征在于所述基本个人特征属性信息包括性别、年龄。
4.如权利要求1所述的一种基于居民调查数据获取带有标签的手机信令轨迹数据方法,其特征在于步骤S2基于手机基站与交通小区的空间对应关系将手机出行OD转化成交通小区出行OD,包括以下步骤:
S21、遍历居民出行调查数据集,对研究范围内所划分的交通小区进行统一编号;
S22、根据先验经验知识并结合研究区域实际情况,利用Arcgis的相交分析工具确定基站与交通小区对应表;
S23、根据已确定的基站与交通小区对应表,将通过手机信令数据提取出来的基于基站的出行OD汇聚成基于交通小区的出行OD。
5.如权利要求1所述的一种基于居民调查数据获取带有标签的手机信令轨迹数据方法,其特征在于步骤S3对所获取的研究地区研究时间范围内的手机信令数据与居民出行调查数据特征集合,从时间特征纬度上根据不同的日期进行分类汇聚,将同一日期的居民出行调查数据与手机信令轨迹数据进行初步融合。
6.如权利要求1所述的一种基于居民调查数据获取带有标签的手机信令轨迹数据方法,其特征在于步骤S4基于每一条居民出行调查数据的出行特征属性,在所设定的匹配规则下对手机信令轨迹数据进行初步筛选匹配,包括以下步骤:
S41、遍历居民出行调查数据集,基于每一条居民出行调查数据的出行起讫点特征属性O_id与D_id对手机信令轨迹数据集进行筛选匹配,筛选出具有相同O_id与D_id特征属性的手机信令轨迹数据子集;其中:O_id表示出行起点所在交通小区编号,D_id表示出行终点所在交通小区编号;
S42、针对上一步骤中每一条居民调查出行数据及其初步筛选匹配出的手机信令轨迹数据子集,分别提取第i条居民出行调查数据特征属性中的出发时间O_time_i和到达时间D_time_i,i=1,2,3...以及与其对应手机信令轨迹数据子集中第j条数据特征属性中的出发时间leave_timeij和到达时间arrive_timeij,j=1,2,3...,对每一条手机信令轨迹数据计算与其相对应的居民出行调查数据的出发时间误差值TO ij与到达时间误差值TD ij:
TO ij=|O_timei-leave_timeij|(i=1,2,3...;j=1,2,3...)
TD ij=|D_timei-arrive_timeij|(i=1,2,3...;j=1,2,3...)
S43、遍历手机信令轨迹数据集,对于每一条居民出行调查数据对应的手机信令轨迹数据子集进行时间误差的阈值判别:
若第i条居民出行调查数据对应的第j条手机信令轨迹数据能够满足TO ij≤T1且TD ij≤T2的阈值条件,则保留,其中T1和T2为设定的阈值;否则,将该条手机信令轨迹数据从第i条居民出行调查数据对应的手机信令轨迹数据子集中删除;
即得到基于居民出行调查数据出行特征属性的初步匹配结果。
7.如权利要求1所述的一种基于居民调查数据获取带有标签的手机信令轨迹数据方法,其特征在于步骤S5结合出行者与手机用户的个人特征属性,完成对居民出行调查数据与手机信令轨迹数据的特征匹配,包括根据每一条居民出行调查数据中出行者的性别特征sex,对其匹配的手机信令轨迹数据子集的用户性别特征进行筛选,仅保留其匹配子集中性别特征相同的手机信令轨迹数据。
8.如权利要求1所述的一种基于居民调查数据获取带有标签的手机信令轨迹数据方法,其特征在于步骤S5结合出行者与手机用户的个人特征属性,完成对居民出行调查数据与手机信令轨迹数据的特征匹配,包括遍历居民出行调查数据集,基于每一条居民出行调查数据的出行者年龄特征属性age对其对应的手机信令轨迹数据子集进一步的筛选匹配:筛选出年龄相差小于等于2岁的手机信令轨迹数据进行保留;其他数据从匹配集中删除。
9.如权利要求1所述的一种基于居民调查数据获取带有标签的手机信令轨迹数据方法,其特征在于步骤S5结合出行者与手机用户的个人特征属性,完成对居民出行调查数据与手机信令轨迹数据的特征匹配,包括遍历居民出行调查数据集,统计每一条居民出行调查数据所匹配的手机信令轨迹数据子集中元素个数,记为N,进行以下的规则判别:
若N=0,则该条居民出行调查数据没有成功匹配的手机信令轨迹数据,将其从居民出行调查数据集中剔除;
若N=1,则该条居民出行调查数据成功匹配了唯一一条的手机信令轨迹数据,将其保留;
若N≥1,则该条居民出行调查数据存在多条手机信令轨迹数据与其匹配,匹配未成功,将其从居民出行调查数据集中剔除。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911019390.6A CN110753307B (zh) | 2019-10-24 | 2019-10-24 | 一种基于居民调查数据获取带有标签的手机信令轨迹数据方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911019390.6A CN110753307B (zh) | 2019-10-24 | 2019-10-24 | 一种基于居民调查数据获取带有标签的手机信令轨迹数据方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110753307A true CN110753307A (zh) | 2020-02-04 |
CN110753307B CN110753307B (zh) | 2020-10-30 |
Family
ID=69279790
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911019390.6A Active CN110753307B (zh) | 2019-10-24 | 2019-10-24 | 一种基于居民调查数据获取带有标签的手机信令轨迹数据方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110753307B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111521191A (zh) * | 2020-04-20 | 2020-08-11 | 中国农业科学院农业信息研究所 | 一种基于信令数据的移动电话用户移动路径地图匹配方法 |
CN111653099A (zh) * | 2020-06-10 | 2020-09-11 | 南京瑞栖智能交通技术产业研究院有限公司 | 基于手机信令数据的公交客流od获取方法 |
CN113407906A (zh) * | 2021-05-13 | 2021-09-17 | 东南大学 | 一种基于手机信令数据的交通出行分布阻抗函数的确定方法 |
CN113569977A (zh) * | 2021-08-05 | 2021-10-29 | 东南大学 | 一种基于手机信令数据的出行目的识别方法 |
CN114141008A (zh) * | 2021-10-29 | 2022-03-04 | 东南大学 | 一种基于手机信令数据的新型共享公共交通服务区域选取方法 |
CN114885293A (zh) * | 2022-04-26 | 2022-08-09 | 和智信(山东)大数据科技有限公司 | 一种基于深度学习的信令轨迹恢复方法、系统及存储介质 |
CN116233759A (zh) * | 2023-04-25 | 2023-06-06 | 北京城建交通设计研究院有限公司 | 一种居民出行轨迹调查方法及系统 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120275273A1 (en) * | 2007-02-09 | 2012-11-01 | Shotspotter, Inc. | Acoustic survey methods in weapons location systems |
CN105142106A (zh) * | 2015-07-29 | 2015-12-09 | 西南交通大学 | 基于手机信令数据的出行者职住地识别与出行链刻画方法 |
CN106197458A (zh) * | 2016-08-10 | 2016-12-07 | 重庆邮电大学 | 一种基于手机信令数据和导航路线数据的手机用户出行方式识别方法 |
CN106485921A (zh) * | 2016-12-07 | 2017-03-08 | 北京航空航天大学 | 一种基于社交数据的区域高速路网车流状态分析方法 |
CN107480784A (zh) * | 2017-06-28 | 2017-12-15 | 青岛科技大学 | 一种基于深度学习的手机信令数据行人交通轨迹预测方法 |
CN107886723A (zh) * | 2017-11-13 | 2018-04-06 | 深圳大学 | 一种交通出行调查数据处理方法 |
CN107958031A (zh) * | 2017-11-20 | 2018-04-24 | 上海市城市建设设计研究总院(集团)有限公司 | 基于融合数据的居民出行od分布提取方法 |
CN108269019A (zh) * | 2018-01-22 | 2018-07-10 | 珠海市规划设计研究院 | 一种居民出行调查方法及系统 |
CN109561386A (zh) * | 2018-11-23 | 2019-04-02 | 东南大学 | 一种基于多源定位数据的城市居民出行活动模式获取方法 |
CN109684373A (zh) * | 2018-11-26 | 2019-04-26 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 基于出行和话单数据分析的重点关系人发现方法 |
CN110351664A (zh) * | 2019-07-12 | 2019-10-18 | 重庆市交通规划研究院 | 基于手机信令的用户活动空间识别方法 |
-
2019
- 2019-10-24 CN CN201911019390.6A patent/CN110753307B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120275273A1 (en) * | 2007-02-09 | 2012-11-01 | Shotspotter, Inc. | Acoustic survey methods in weapons location systems |
CN105142106A (zh) * | 2015-07-29 | 2015-12-09 | 西南交通大学 | 基于手机信令数据的出行者职住地识别与出行链刻画方法 |
CN106197458A (zh) * | 2016-08-10 | 2016-12-07 | 重庆邮电大学 | 一种基于手机信令数据和导航路线数据的手机用户出行方式识别方法 |
CN106485921A (zh) * | 2016-12-07 | 2017-03-08 | 北京航空航天大学 | 一种基于社交数据的区域高速路网车流状态分析方法 |
CN107480784A (zh) * | 2017-06-28 | 2017-12-15 | 青岛科技大学 | 一种基于深度学习的手机信令数据行人交通轨迹预测方法 |
CN107886723A (zh) * | 2017-11-13 | 2018-04-06 | 深圳大学 | 一种交通出行调查数据处理方法 |
CN107958031A (zh) * | 2017-11-20 | 2018-04-24 | 上海市城市建设设计研究总院(集团)有限公司 | 基于融合数据的居民出行od分布提取方法 |
CN108269019A (zh) * | 2018-01-22 | 2018-07-10 | 珠海市规划设计研究院 | 一种居民出行调查方法及系统 |
CN109561386A (zh) * | 2018-11-23 | 2019-04-02 | 东南大学 | 一种基于多源定位数据的城市居民出行活动模式获取方法 |
CN109684373A (zh) * | 2018-11-26 | 2019-04-26 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 基于出行和话单数据分析的重点关系人发现方法 |
CN110351664A (zh) * | 2019-07-12 | 2019-10-18 | 重庆市交通规划研究院 | 基于手机信令的用户活动空间识别方法 |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111521191A (zh) * | 2020-04-20 | 2020-08-11 | 中国农业科学院农业信息研究所 | 一种基于信令数据的移动电话用户移动路径地图匹配方法 |
CN111653099A (zh) * | 2020-06-10 | 2020-09-11 | 南京瑞栖智能交通技术产业研究院有限公司 | 基于手机信令数据的公交客流od获取方法 |
CN113407906A (zh) * | 2021-05-13 | 2021-09-17 | 东南大学 | 一种基于手机信令数据的交通出行分布阻抗函数的确定方法 |
CN113407906B (zh) * | 2021-05-13 | 2024-02-02 | 东南大学 | 一种基于手机信令数据的交通出行分布阻抗函数的确定方法 |
CN113569977A (zh) * | 2021-08-05 | 2021-10-29 | 东南大学 | 一种基于手机信令数据的出行目的识别方法 |
CN113569977B (zh) * | 2021-08-05 | 2022-11-18 | 东南大学 | 一种基于手机信令数据的出行目的识别方法 |
CN114141008A (zh) * | 2021-10-29 | 2022-03-04 | 东南大学 | 一种基于手机信令数据的新型共享公共交通服务区域选取方法 |
CN114885293A (zh) * | 2022-04-26 | 2022-08-09 | 和智信(山东)大数据科技有限公司 | 一种基于深度学习的信令轨迹恢复方法、系统及存储介质 |
CN114885293B (zh) * | 2022-04-26 | 2022-12-20 | 和智信(山东)大数据科技有限公司 | 一种基于深度学习的信令轨迹恢复方法、系统及存储介质 |
CN116233759A (zh) * | 2023-04-25 | 2023-06-06 | 北京城建交通设计研究院有限公司 | 一种居民出行轨迹调查方法及系统 |
CN116233759B (zh) * | 2023-04-25 | 2023-07-28 | 北京城建交通设计研究院有限公司 | 一种居民出行轨迹调查方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110753307B (zh) | 2020-10-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110753307B (zh) | 一种基于居民调查数据获取带有标签的手机信令轨迹数据方法 | |
CN110245981B (zh) | 一种基于手机信令数据的人群类型识别方法 | |
CN109583640A (zh) | 一种基于多源定位数据的城市出行客流属性识别方法 | |
Long et al. | Combining smart card data and household travel survey to analyze jobs–housing relationships in Beijing | |
CN112133090A (zh) | 一种基于手机信令数据的多方式交通分布模型构建方法 | |
CN111653099B (zh) | 基于手机信令数据的公交客流od获取方法 | |
CN110110902B (zh) | 一种共享单车接驳轨道交通站点的可达性测算方法 | |
CN110472066A (zh) | 一种城市地理语义知识图谱的构建方法 | |
CN106096623A (zh) | 一种犯罪识别与预测方法 | |
CN105718946A (zh) | 一种基于地铁刷卡数据的乘客出行行为分析方法 | |
CN109684373B (zh) | 基于出行和话单数据分析的重点关系人发现方法 | |
CN108694463B (zh) | 一种城市轨道交通站点进出站客流预测方法 | |
CN109359162A (zh) | 一种基于gis的学校选址方法 | |
CN108717676A (zh) | 基于多数据融合的不同尺度下的职住空间评价方法及系统 | |
CN109146155B (zh) | 基于多源数据融合的城市交通出行需求确定方法及系统 | |
CN111581315A (zh) | 一种公共服务设施可达性计算方法及装置 | |
CN112000755B (zh) | 一种基于手机信令数据的区域出行廊道识别方法 | |
Zhang et al. | Using street view images to identify road noise barriers with ensemble classification model and geospatial analysis | |
Li et al. | GIS monitoring of traveler flows based on big data | |
CN107657006B (zh) | 基于时空特性的公共自行车ic卡与地铁ic卡匹配方法 | |
CN106547862A (zh) | 基于流形学习的交通大数据降维处理方法 | |
CN117056823A (zh) | 一种识别共享单车通勤用户职业类型的方法及系统 | |
CN109493601B (zh) | 一种公交支线设置方法 | |
Yao et al. | Analysis of key commuting routes based on spatiotemporal trip chain | |
CN108681741B (zh) | 基于ic卡和居民调查数据的地铁通勤人群信息融合方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |