CN108650632A - 一种基于职住对应关系和时空间核聚类的驻点判断方法 - Google Patents
一种基于职住对应关系和时空间核聚类的驻点判断方法 Download PDFInfo
- Publication number
- CN108650632A CN108650632A CN201810402579.2A CN201810402579A CN108650632A CN 108650632 A CN108650632 A CN 108650632A CN 201810402579 A CN201810402579 A CN 201810402579A CN 108650632 A CN108650632 A CN 108650632A
- Authority
- CN
- China
- Prior art keywords
- point
- space
- cluster
- clustering
- stationary point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 25
- 238000004458 analytical method Methods 0.000 claims abstract description 25
- 230000011664 signaling Effects 0.000 claims abstract description 19
- 239000011159 matrix material Substances 0.000 claims abstract description 6
- 238000013461 design Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 6
- 230000015572 biosynthetic process Effects 0.000 claims description 4
- 238000007621 cluster analysis Methods 0.000 claims description 3
- 238000012797 qualification Methods 0.000 claims description 3
- 238000003786 synthesis reaction Methods 0.000 claims description 3
- 238000012795 verification Methods 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 15
- 238000005457 optimization Methods 0.000 abstract 1
- 238000005070 sampling Methods 0.000 abstract 1
- 238000005516 engineering process Methods 0.000 description 7
- 238000006073 displacement reaction Methods 0.000 description 6
- 238000007726 management method Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 241001269238 Data Species 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000000556 factor analysis Methods 0.000 description 1
- 230000003694 hair properties Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000009333 weeding Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/029—Location-based management or tracking services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/08—Testing, supervising or monitoring using real traffic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W64/00—Locating users or terminals or network equipment for network management purposes, e.g. mobility management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Mobile Radio Communication Systems (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明提供一种基于职住对应关系和时空间核聚类的驻点判断方法,按照采样要求获取指定时间段内高频率信号触发、具有时空间关联特征的用户信令数据和用户上网数据,通过两轮职住对应关系和时空核聚类分析,形成较粗粒度具有时空活动特征的时空间驻点集合,对获得的时空间驻点集合进行校验和算法优化,并进行特殊人群活动特征分析,最终形成基于交通小区的OD矩阵出行表,从而为交通规划和交通需求管理提供满足时空出行活动链特征的大数据支撑。本发明结合职住对应关系和时空间核聚类分析各自的优势,最终形成具有时空活动特征的驻点序列,进一步提高了交通出行OD矩阵的合理性和精确性,并有效地降低了成本。
Description
技术领域
本发明涉及交通规划和交通需求管理的技术领域,具体是一种基于职住对应关系和时空间核聚类的驻点判断方法,可为交通规划和交通需求管理提供满足时空出行活动链特征的大数据支撑。
背景技术
交通OD出行矩阵是在交通网络中基于交通小区的起点——讫点出行的特征矩阵(Origin—Destination Matrix),用于描述城市交通区域间的交通出行量分布情况,是构建交通规划模型的重要组成部分。传统的交通OD矩阵是基于个体交通出行调查数据进行统计分析的处理过程,需要经过起讫点抽样调查、数据扩样和OD矩阵整理三个步骤,分析处理结果可反映城市交通需求分布特征。
基于传统交通调查的OD出行矩阵分析处理过程,需要耗费大量人力、物力、资金和时间,并且不可频繁进行。随着手机终端普及,通过手机定位技术获取用户交通出行信息具有成本低、覆盖范围广等优点,使得手机数据作为现有交通数据采集技术的重要补充,并为居民时空出行的OD特征提取提供了很好的技术支持。由于手机定位数据是基于用户使用行为的高频率触发数据,而对于满足交通规划需求的OD 矩阵更关注交通出行的起讫点(OD)活动,手机定位数据包含大量交通出行活动过程中的冗余数据,因此,基于手机定位技术的OD出行矩阵,其关键技术在于对手机定位数据的驻点判断。
目前针对手机定位技术的驻点判断,主要是对手机用户出行时间序列的位移状态判断,通过对每一个位移点的出行时间、矩离、速度等要素分析,实现对位移点出行驻留状态的判断。该驻点判断技术缺点在于忽略了用户出行活动和出行目的特征,比如一般用户出行活动:通勤、生活、娱乐、出游等活动,通勤出行的链式出行活动可由交通三要素的时间序列判断,而对于生活、娱乐出行,如商场、公园、大型娱乐区等,有多个基站覆盖,并同时在多个基站有长时间驻留,则有可能被判定为多次驻留点,而对于交通出行OD矩阵来说,一次出行目的活动的出行应该被判定为一次出行,因此,基于时间序列的位移状态判定,会忽略出行目的活动特征,造成不满足交通出行OD活动特征的驻点误判。
发明内容
针对现有OD驻点判断方法中存在的缺陷,本发明提供了一种低成本、高准确度的基于职住对应关系和时空间核聚类的驻点判断方法,其具体步骤如下:
步骤1:采集手机信令数据、上网数据,所述手机信令数据包括用户画像标签属性数据;
步骤2:利用步骤1采集到的手机信令数据和上网数据,提取半年内手机触发数据进行职住判断:首先,对半年内常发性的地点进行空间聚类,再根据停留时间间隔在空间聚类点发生的频次进行高频分析,对满足时空间要求的高频点进行职住判断,其中,居住地判断要结合夜晚常发性开关机频次进行频度权重分析判断,就业地判断要结合用户年龄标签进行基于时长的频繁项集居民就业特征判断,获得用户的居住地以及就业地,即得到职住分布特征;
步骤3:基于步骤2得到的职住分布特征,进行时空间核聚类分析:首先,将获取到的手机信令数据按时间顺序进行排列,并将具有中心聚类特征和时空出行特征的点集,进行基于时空间关联的时空间核聚类分析,从而去除信号漂移点和连续短距离具有中心聚类特征的逗留点,并结合职住分布特征,对于满足职住分布特征的驻点进行标记,而对于不满足职住分布特征的驻点进一步进行时空间聚类分析,进一步判断是否属于驻点,形成具有时空间关联特征的时空间驻点集合序列;
步骤4:基于步骤3的时空间驻点集合序列,进行时空间序列的交通三要素判断,进一步判断时空间序列是否属于交通意义上的驻留点,形成交通意义上的时空间驻点集合序列,并通过时空间出行特征,完成对长距离出行短时停留的拐点判定;
步骤5:将步骤4得到的交通意义上的时空间驻点集合序列进一步进行步骤3的时空间核聚类分析,并结合土地利用的功能区识别,进一步判断满足时空间出行特征的交通意义上的时空间驻点集合序列是否在时空间具有关联特征,进一步进行时空间核聚类,形成具有时空间出行特征的时空间驻点集合;
步骤6:将不同出行特征人群的手机信令数据在地图上打点进行出行特征分类,完成对特征人群出行特征的校验,对步骤5获得的时空间驻点集合进行校验,判断算法是否满足不同出行特征人群数据,如果满足出行特征,则校验合格,否则,进一步优化步骤3和步骤4的时空间出行特征分析算法,并进行特殊人群出行特征分析;
步骤7:根据交通小区划分方案,将运营商基站与交通小区进行匹配,将每个出行者的起讫点映射到相应的交通小区上,最终形成基于交通小区的OD矩阵出行表。
优选地,所述手机触发数据包括用户编号、基站编号、时间戳、事件类型、经度、纬度、号码区段、个体年龄、性别、是否学生、是否退休人员。
优选地,所述步骤2中,居住地判断具体为:首先,对提取的半年内手机触发数据进行同一手机号时间序列排序,居住地判断的时间范围界定为晚上21:00至凌晨07:00之间;再对同一用户编号的手机数据进行空间聚类,形成空间聚类点簇;基于空间聚类点簇,对不同停留时长的频繁项集进行分析,并结合夜晚用户开关机事件发生地进行权重分析,并根据停留时间越长、出现次数越多、开关机事件发生地越多权重越大的原则,进行权重设计;再根据频繁项集的权重值,统计空间聚类点簇的权重居住地概率,计算该空间聚类点簇中权重居住地概率最大值,该空间聚类点簇中权重概率最大值即为居住地。
优选地,所述步骤2中,就业地判断具体为:首先,对提取的半年内手机触发数据进行同一手机号时间序列排序,就业地判断的时间范围界定为白天9:00至下午16:00之间,并且,根据运营商用户画像标签属性数据,排除退休老人和未成年人,然后对剩余人群进行就业地判断;对同一用户编号的手机数据进行空间聚类,形成空间聚类点簇;基于空间聚类点簇,对不同停留时长的频繁项集进行分析,并根据停留时间越长、出现次数越多权重越大的原则,进行权重设计;再根据频繁项集的权重值,统计空间聚类点簇的权重就业地概率,计算该空间聚类点簇中权重就业地概率最大值,并且,判断:如果所述权重就业地概率最大值的空间聚类点簇与居住地不在同一聚类中,并且所述权重就业地概率最大值大于隶属度阈值,则判定为就业地;若所述权重就业地概率最大值小于隶属度阈值,再对较大的权重就业地概率值对应的空间聚类点簇的聚类中心点分析,若各个聚类中心点簇的中心点聚类小于聚类阈值,则将几个空间聚类点簇合成一个聚类,再根据频繁项集的权重值,统计合成的空间聚类点簇的权重就业地概率,若此时最大的权重就业地概率大于隶属度阈值,并且,其对应的空间聚类点簇与居住地不在同一聚类中,则判定为就业地;否则不判断为就业地位置。
优选地,所述去除信号漂移点具体为:对于某个用户按时间排序的轨迹点数据,如同时满足第i 点与第i+1点的距离大于漂移距离阈值,漂移速度大于漂移速度阈值,且第i点与第i+1点的距离远大于第i点与第i+2点距离,则判断第i+1点为长距离漂移数据,予以剔除。
优选地,所述去除连续短距离具有中心聚类特征的逗留点具体为:将某个用户统计得到的所有驻点进行前后驻点间距离判断,对于聚类中心小于相邻聚类的距离阈值的停留点且时间间隔小于相邻聚类的时间阈值的停留点进行合并,重复这种合并,直到所有停留点前后之间距离大于相邻聚类的距离阈值。
优选地,所述长距离出行短时停留的拐点判定具体为:对于某个用户按时间排序的轨迹点数据,对于其中一个驻点S_i,计算其与第i+1点的距离D_i_i+1,如果第i+2点与驻点S_i的距离D_i_i+2>D_i_i+1, 则最大距离maxDist=D_i_i+2,以此类推,计算最远距离点为D_i_i+n,若驻点S_i与第n+1点的距离大于驻点S_i与第n+2点的距离,并且,驻点S_i与第n+1点的距离大于距离阈值,驻点S_i与第n+2点的速度小于速度阈值,则说明长距离出行的出行距离和速度发生骤降现象,则判定为驻点状态。
本发明根据高频率信号触发、具有时空间关联特征的用户信令数据和用户上网数据,通过职住对应关系和时空间核聚类分析,提出了一种满足用户出行特征的驻点判断方法,并基于该驻点判断方法,最终生成用户出行OD矩阵,为交通规划和交通需求管理提供了满足时空出行活动链特征的大数据支撑;本发明的驻点判断方法符合国家法律隐私规定,具备如下有益效果:
1)本发明能够满足用户职住对应关系和出行特征,相对传统交通调查,具有获取方式简单、成本较低,信息样本大、取样时间灵活、自动化获取等优点;
2)本发明基于手机信令数据和上网数据进行职住判断,其中居住地判断要结合夜晚常发性开关机频次进行频度权重分析判断,就业地判断需要结合用户年龄标签进行基于时长的频繁项集居民就业特征判断,上述判断提高了职住对应关系判断的精度,精确的职住对应关系判断有效地提高了通勤出行时间序列驻点判断的准确性;
3)本发明通过时空间核聚类分析消除了信号漂移点和连续短距离具有中心聚类特征的逗留点,有效地提高了手机用户出行活动驻点判断的准确性和合理性;
4)本发明对于长距离出行短时停留的拐点进行了有效地判定,长距离出行短时停留如接送行为、配送行为等均满足时间序列特征的位移状态判定,长距离出行的最远点可能为驻点,也可能不是,其进一步判定有效地保证了驻点判断的精度;
5)本发明结合职住对应关系和时空间核聚类分析各自的优势,最终形成具有时空活动特征的驻点序列,进一步提高了交通出行OD矩阵的合理性和精确性,并有效地降低了成本。
附图说明
图1基于职住对应关系和时空间核聚类的驻点判断方法流程图;
图2出行规律通勤用户出行轨迹和驻点;
图3长距离出行轨迹和驻点;
图4短距离多次出行的用户轨迹和驻点;
图5具有长距离出行拐点的用户出行轨迹和驻点。
具体实施方式
下面结合附图对本发明的具体实施方式作详细说明,参见附图1,具体实施步骤如下:
步骤1:获取手机信令数据、上网数据。手机信令数据和上网数据样例如表1,所述手机信令数据包括用户画像标签属性数据,用户画像标签属性数据样例如表2;
表1手机信令数据和上网数据样例
表2用户画像标签属性数据样例
步骤2:利用步骤1采集到的手机信令数据和上网数据,提取半年内手机触发数据进行职住判断,确定职住地LiveLoc和就业地WorkLoc,得到职住分布特征;该手机触发数据包含用户编号、基站编号、时间戳、事件类型、经度、纬度、号码区段、个体年龄、性别、是否学生、是否退休人员等标签属性信息。
步骤2.1:居住地判断:首先,先提取步骤1半年内手机触发数据,并进行同一手机号时间序列排序,居住地判断的时间范围界定为晚上21:00至凌晨07:00之间;再对同一用户编号的手机数据进行空间聚类,形成空间聚类点簇Clus_n;基于空间聚类点簇Clus_n,对不同停留时长Tstay的频繁项集 PTsay:进行分析,并结合夜晚用户开关机事件发生地进行权重分析,根据停留时间越长、出现次数越多、开关机事件发生地越多权重越大的原则,进行权重设计;再根据频繁项集的权重值wi,统计空间聚类点簇Clus_n的权重居住地概率PTsay_i,再计算权重居住地概率最大值PTsay_i_max,该空间聚类点簇中权重概率最大值(PTsay_i_max)Clus_n即为居住地。
步骤2.2:就业地判断:首先,基于步骤2.1排序的半年内手机触发数据,就业地判断的时间范围界定为白天9:00至16:00之间,并且,根据运营商用户画像标签属性数据,排除退休老人和未成年人,然后对剩余人群进行就业地判断;与居住地判断类似,对同一用户编号的手机数据进行空间聚类,形成空间聚类点簇Clus_d;基于空间聚类点簇Clus_d,对不同停留时长Tstay的频繁项集 PTsay:进行分析,并根据停留时间越长、出现次数越多权重越大的原则,进行权重设计;再根据频繁项集的权重值wi,统计空间聚类点簇Clus_d的权重就业地概率PTsay_i,计算该空间聚类点簇中权重就业地概率最大值(PTsay_i_max)Clus_d,并且,判断如果所述权重就业地概率最大值 (PTsay_i_max)Clus_d的空间聚类点簇与居住地不在同一聚类中,并且所述权重就业地概率最大值 (PTsay_i_max)Clus_d大于隶属度阈值,则判定为就业地;若小于隶属度阈值,再对较大的权重就业地概率值(PTsay_i)Clus_d对应的空间聚类点簇的聚类中心点Clus_d_center分析,若各个聚类中心点簇的中心点聚类dist_d_center小于聚类阈值,则将几个空间聚类点簇合成一个聚类,再根据频繁项集的权重值wi,统计合成的空间聚类点簇Clus_d的权重就业地概率,若最大的权重就业地概率(PTsay_i_max)Clus_d_center大于隶属度阈值,并且,最大的权重就业地概率(PTsay_i_max)Clus_d_center的空间聚类点簇与居住地不在同一聚类中,则判定为就业地;否则不判断就业地位置。
步骤3:基于步骤2得到的职住分布特征,进行时空间核聚类分析,剔除信号漂移点和连续短距离具有中心聚类特征的逗留点。
步骤3.1:时空间核聚类分析,获取时空间关联的核聚类集。基于职住分布特征,按时间顺序排列手机信令数据D,首先,对于每个用户第一个点选取第1个点M1和第2个点M2,计算两个点的聚类中心,如果M1、M2到聚类中心的距离均小于距离阈值d1,则认为M1、M2有可能构成一次停留。递归至第3个点M3,计算M1、M2、M3的聚类中心,如果聚类中心与M1、M2、M3的距离小于距离阈值d1,则认为M1、M2、 M3有可能处于同一停留区域,以此类推,当第n个点Mn到前n个点的聚类中心的距离大于距离阈值d1,则停止循环。并计算M1与Mn-1之间的时间差△t,如果△t大于停留时间阈值T,则认为构成一次停留, M1、M2、M3…Mn-1处于同一核聚类停留区域,M1发生的时刻即为此次停留的开始时刻,Mn-1发生的时刻即为此次停留的结束时间,将满足时空间阈值的聚类点生成核聚类集,而对于不满足核聚类的点生成点集{N1,N2,…Nn},再进行基于时间序列特征分析。
步骤3.1.1:时间阈值判定,剔除无效的空间聚类点:如果△t小于停留时间阈值T,则认为M1、 M2、M3…Mn-1不能构成一次出行,仅为出行过程的轨迹点,则剔除掉M1点,按照步骤3.1的方法判断Mn 与M1、M2、M3…Mn的聚类中心是否小于距离阈值d1以及时间差△t是否大于停留时间阈值T,循环进行,直到剔除掉Mn-1点,此时认为Mn与之前时刻的轨迹点无法形成有效聚类,即Mn为出行过程后的轨迹点,则按照步骤3.1的方法继续判断Mn及其之后的轨迹点,直至将该用户的定位数据遍历完毕,对于不满足核聚类的点生成点集{N1,N2,…Nn}。
步骤3.1.2:对于长距离信号漂移点的判定:对于某个用户按时间排序的轨迹点数据,如同时满足第i点与第i+1点距离大于漂移距离阈值td_wave,漂移速度大于漂移速度阈值tv_wave,且第i点与第 i+1点的距离远大于第i点与第i+2点距离,则判断i+1点为长距离漂移数据,予以剔除。
步骤3.1.3:空间阈值判定,空间距离较近的聚类进行合并,剔除连续短距离具有中心聚类特征的逗留点:将该用户统计得到的所有驻点进行前后驻点间距离判断,对于聚类中心小于d2(相邻聚类的距离阈值)的停留点且时间间隔小于t2(相邻聚类的时间阈值)进行合并。重复这种合并,直到所有停留点前后之间距离大于d2,算法结束。
步骤3.2:基于职住的驻点判定:对于用户的核聚类点集M2、M3…Mn,若步骤2.1和2.2生成的职住点在核聚类点集内,则将职住地点定义为驻点,若职住地不在核聚类点集内,则核聚类点集M2、M3…Mn的聚类中心则为驻点。
步骤4:由基于步骤3的不满足时空间核聚类的时间序列点集N和时空间核聚类点集M的聚类中心点集MC构成时空间驻点集合序列,生成排序的时间序列,再进行时空出行特征的驻留判断,计算每一个位置点与后一个位置点的时间差T、距离D和出行速度V,如果时间、距离和速度满足驻留点的阈值判断,则适用于交通意义上的驻留点,则判定为驻留点。
步骤4.1:对于长距离出行短时停留的拐点判定:但对于长距离出行短时停留如接送行为、配送行为等均满足时间序列特征的位移状态判定,长距离出行的最远点可能为驻点,需进一步进行判定,本次提出距离和速度的骤减原则进行判定。对于某个用户按时间排序的轨迹点数据,如一个驻点S_i,计算下一个点i+1的距离D_i_i+1如果i+2与S_i距离D_i_i+2>D_i_i+1,则最大距离为maxDist=D_i_i+2,以此类推,计算最远距离点为D_i_i+n,若驻点S_i与第n+1点距离大于S_i与第n+2点距离,并且,S_i与第n+1点距离大于距离阈值,S_i与第n+2点速度小于速度阈值,则说明长距离出行的出行距离和速度发生骤降现象,则判定为驻点状态。
步骤5:将步骤4形成的交通意义上的时空间驻点集合序列进一步进行步骤3的时空间聚类分析,并结合现状土地利用特征进行功能区识别,进一步判断满足时空间出行特征的驻点集合序列是否在时空间具有关联特征,进一步进行时空间聚类,形成具有时空间活动特征的时空间驻点集合。
步骤6:进行不同活动特征驻点校验:对步骤5获得的时空间驻点集合进行校验,判断算法是否满足不同活动特征人群数据,满足特征,则校验合格,否则,进一步优化步骤3和步骤4的时空出行特征分析算法。并进行特殊人群活动特征分析,例如,出行规律通勤用户出行轨迹和驻点,如图2所示;长距离出行轨迹和驻点,如图3所示;短距离多次出行的用户轨迹和驻点,如图4所示;具有长距离出行拐点的用户出行轨迹和驻点,如图5所示。
步骤7:根据交通小区划分方案,将运营商基站与交通小区进行匹配,将每个出行者的起讫点映射到相应的交通小区上,基于驻点生成OD出行表。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
Claims (7)
1.一种基于职住对应关系和时空间核聚类的驻点判断方法,其特征在于判断的具体步骤如下:
步骤1:采集手机信令数据、上网数据,所述手机信令数据包括用户画像标签属性数据;
步骤2:利用步骤1采集到的手机信令数据和上网数据,提取半年内手机触发数据进行职住判断:首先,对半年内常发性的地点进行空间聚类,再根据停留时间间隔在空间聚类点发生的频次进行高频分析,对满足时空间要求的高频点进行职住判断,其中,居住地判断要结合夜晚常发性开关机频次进行频度权重分析判断,就业地判断要结合用户年龄标签进行基于时长的频繁项集居民就业特征判断,获得用户的居住地以及就业地,即得到职住分布特征;
步骤3:基于步骤2得到的职住分布特征,进行时空间核聚类分析:首先,将获取到的手机信令数据按时间顺序进行排列,并将具有中心聚类特征和时空出行特征的点集,进行基于时空间关联的时空间核聚类分析,从而去除信号漂移点和连续短距离具有中心聚类特征的逗留点,并结合职住分布特征,对于满足职住分布特征的驻点进行标记,而对于不满足职住分布特征的驻点进一步进行时空间聚类分析,进一步判断是否属于驻点,形成具有时空间关联特征的时空间驻点集合序列;
步骤4:基于步骤3的时空间驻点集合序列,进行时空间序列的交通三要素判断,进一步判断时空间序列是否属于交通意义上的驻留点,形成交通意义上的时空间驻点集合序列,并通过时空间出行特征,完成对长距离出行短时停留的拐点判定;
步骤5:将步骤4得到的交通意义上的时空间驻点集合序列进一步进行步骤3的时空间核聚类分析,并结合土地利用的功能区识别,进一步判断满足时空间出行特征的交通意义上的时空间驻点集合序列是否在时空间具有关联特征,进一步进行时空间核聚类,形成具有时空间出行特征的时空间驻点集合;
步骤6:将不同出行特征人群的手机信令数据在地图上打点进行出行特征分类,完成对特征人群出行特征的校验,对步骤5获得的时空间驻点集合进行校验,判断算法是否满足不同出行特征人群数据,如果满足出行特征,则校验合格,否则,进一步优化步骤3和步骤4的时空间出行特征分析算法,并进行特殊人群出行特征分析;
步骤7:根据交通小区划分方案,将运营商基站与交通小区进行匹配,将每个出行者的起讫点映射到相应的交通小区上,最终形成基于交通小区的OD矩阵出行表。
2.根据权利要求1所述的基于职住对应关系和时空间核聚类的驻点判断方法,其特征在于:所述手机触发数据包括用户编号、基站编号、时间戳、事件类型、经度、纬度、号码区段、个体年龄、性别、是否学生、是否退休人员。
3.根据权利要求1-2任一项所述的基于职住对应关系和时空间核聚类的驻点判断方法,其特征在于:所述步骤2中,居住地判断具体为:首先,对提取的半年内手机触发数据进行同一手机号时间序列排序,居住地判断的时间范围界定为晚上21:00至凌晨07:00之间;再对同一用户编号的手机数据进行空间聚类,形成空间聚类点簇;基于空间聚类点簇,对不同停留时长的频繁项集进行分析,并结合夜晚用户开关机事件发生地进行权重分析,并根据停留时间越长、出现次数越多、开关机事件发生地越多权重越大的原则,进行权重设计;再根据频繁项集的权重值,统计空间聚类点簇的权重居住地概率,计算该空间聚类点簇中权重居住地概率最大值,该空间聚类点簇中权重概率最大值即为居住地。
4.根据权利要求1-3任一项所述的基于职住对应关系和时空间核聚类的驻点判断方法,其特征在于:所述步骤2中,就业地判断具体为:首先,对提取的半年内手机触发数据进行同一手机号时间序列排序,就业地判断的时间范围界定为白天9:00至下午16:00之间,并且,根据运营商用户画像标签属性数据,排除退休老人和未成年人,然后对剩余人群进行就业地判断;对同一用户编号的手机数据进行空间聚类,形成空间聚类点簇;基于空间聚类点簇,对不同停留时长的频繁项集进行分析,并根据停留时间越长、出现次数越多权重越大的原则,进行权重设计;再根据频繁项集的权重值,统计空间聚类点簇的权重就业地概率,计算该空间聚类点簇中权重就业地概率最大值,并且,判断:如果所述权重就业地概率最大值的空间聚类点簇与居住地不在同一聚类中,并且所述权重就业地概率最大值大于隶属度阈值,则判定为就业地;若所述权重就业地概率最大值小于隶属度阈值,再对较大的权重就业地概率值对应的空间聚类点簇的聚类中心点分析,若各个聚类中心点簇的中心点聚类小于聚类阈值,则将几个空间聚类点簇合成一个聚类,再根据频繁项集的权重值,统计合成的空间聚类点簇的权重就业地概率,若此时最大的权重就业地概率大于隶属度阈值,并且,其对应的空间聚类点簇与居住地不在同一聚类中,则判定为就业地;否则不判断为就业地位置。
5.根据权利要求1-4任一项所述的基于职住对应关系和时空间核聚类的驻点判断方法,其特征在于:所述去除信号漂移点具体为:对于某个用户按时间排序的轨迹点数据,如同时满足第i点与第i+1点的距离大于漂移距离阈值,漂移速度大于漂移速度阈值,且第i点与第i+1点的距离远大于第i点与第i+2点距离,则判断第i+1点为长距离漂移数据,予以剔除。
6.根据权利要求1-5任一项所述的基于职住对应关系和时空间核聚类的驻点判断方法,其特征在于:所述去除连续短距离具有中心聚类特征的逗留点具体为:将某个用户统计得到的所有驻点进行前后驻点间距离判断,对于聚类中心小于相邻聚类的距离阈值的停留点且时间间隔小于相邻聚类的时间阈值的停留点进行合并,重复这种合并,直到所有停留点前后之间距离大于相邻聚类的距离阈值。
7.根据权利要求1-6任一项所述的基于职住对应关系和时空间核聚类的驻点判断方法,其特征在于:所述长距离出行短时停留的拐点判定具体为:对于某个用户按时间排序的轨迹点数据,对于其中一个驻点S_i,计算其与第i+1点的距离D_i_i+1,如果第i+2点与驻点S_i的距离D_i_i+2>D_i_i+1,则最大距离maxDist=D_i_i+2,以此类推,计算最远距离点为D_i_i+n,若驻点S_i与第n+1点的距离大于驻点S_i与第n+2点的距离,并且,驻点S_i与第n+1点的距离大于距离阈值,驻点S_i与第n+2点的速度小于速度阈值,则说明长距离出行的出行距离和速度发生骤降现象,则判定为驻点状态。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810402579.2A CN108650632B (zh) | 2018-04-28 | 2018-04-28 | 一种基于职住对应关系和时空间核聚类的驻点判断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810402579.2A CN108650632B (zh) | 2018-04-28 | 2018-04-28 | 一种基于职住对应关系和时空间核聚类的驻点判断方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108650632A true CN108650632A (zh) | 2018-10-12 |
CN108650632B CN108650632B (zh) | 2020-05-26 |
Family
ID=63748231
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810402579.2A Active CN108650632B (zh) | 2018-04-28 | 2018-04-28 | 一种基于职住对应关系和时空间核聚类的驻点判断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108650632B (zh) |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109495848A (zh) * | 2018-12-18 | 2019-03-19 | 成都方未科技有限公司 | 一种用户空间定位的方法 |
CN109634998A (zh) * | 2018-11-19 | 2019-04-16 | 北京通途永久科技有限公司 | 一种基于手机信令大数据的交通出行特征分析平台 |
CN109840872A (zh) * | 2019-01-08 | 2019-06-04 | 福建福诺移动通信技术有限公司 | 一种基于运营商信令数据计算城市通勤模型的方法 |
CN109887275A (zh) * | 2019-01-26 | 2019-06-14 | 深圳市新城市规划建筑设计股份有限公司 | 一种多源轨迹数据居民通勤分析系统及方法 |
CN109918582A (zh) * | 2019-03-06 | 2019-06-21 | 上海评驾科技有限公司 | 一种基于时空数据的用户单兴趣点识别的方法 |
CN110533038A (zh) * | 2019-09-04 | 2019-12-03 | 广州市交通规划研究院 | 一种基于信息数据的城市活力区和中心城区边界识别的方法 |
CN110868689A (zh) * | 2019-11-25 | 2020-03-06 | 智慧足迹数据科技有限公司 | 常住人口确定方法、装置和电子设备 |
CN110990443A (zh) * | 2019-10-28 | 2020-04-10 | 上海城市交通设计院有限公司 | 一种基于手机信令的职住人口特征估算方法 |
CN111126653A (zh) * | 2018-11-01 | 2020-05-08 | 百度在线网络技术(北京)有限公司 | 用户职住地预测方法、装置及存储介质 |
CN111198972A (zh) * | 2019-12-30 | 2020-05-26 | 中国联合网络通信集团有限公司 | 用户职住地识别方法、装置、控制设备及存储介质 |
CN111246379A (zh) * | 2020-01-13 | 2020-06-05 | 北京工业大学 | 一种利用手机信令数据判别城市功能区的方法 |
CN111417075A (zh) * | 2018-12-18 | 2020-07-14 | 北京融信数联科技有限公司 | 一种基于移动通信大数据的用户工作地识别方法 |
CN111582948A (zh) * | 2020-05-25 | 2020-08-25 | 北京航空航天大学 | 一种基于手机信令数据与poi兴趣点的个体行为分析方法 |
CN111669819A (zh) * | 2019-03-07 | 2020-09-15 | 广州慧睿思通信息科技有限公司 | 空地协同的定位方法、设备、系统及存储介质 |
CN112101999A (zh) * | 2020-09-16 | 2020-12-18 | 智慧足迹数据科技有限公司 | 用户识别方法、装置、电子设备和计算机可读存储介质 |
CN112215666A (zh) * | 2020-11-03 | 2021-01-12 | 广州市交通规划研究院 | 一种基于手机定位数据的不同出行活动目的特征识别方法 |
CN112434225A (zh) * | 2020-12-13 | 2021-03-02 | 天津市市政工程设计研究院 | 一种基于过程聚类的手机信令驻留点提取方法 |
CN115442758A (zh) * | 2022-09-05 | 2022-12-06 | 广州瀚信通信科技股份有限公司 | 一种用户出行方式确定方法、装置、终端设备以及存储介质 |
CN116738073A (zh) * | 2022-09-21 | 2023-09-12 | 荣耀终端有限公司 | 常驻地的识别方法、设备及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070218900A1 (en) * | 2006-03-17 | 2007-09-20 | Raj Vasant Abhyanker | Map based neighborhood search and community contribution |
CN102281498A (zh) * | 2011-07-28 | 2011-12-14 | 北京大学 | 手机通话数据中用户通勤od的挖掘方法 |
CN104252527A (zh) * | 2014-09-02 | 2014-12-31 | 百度在线网络技术(北京)有限公司 | 一种确定移动用户的常驻点信息的方法和装置 |
CN105142106A (zh) * | 2015-07-29 | 2015-12-09 | 西南交通大学 | 基于手机信令数据的出行者职住地识别与出行链刻画方法 |
CN105513351A (zh) * | 2015-12-17 | 2016-04-20 | 北京亚信蓝涛科技有限公司 | 一种基于大数据的交通出行特征数据提取方法 |
CN106792514A (zh) * | 2016-11-30 | 2017-05-31 | 南京华苏科技有限公司 | 基于信令数据的用户职住地分析方法 |
CN107040894A (zh) * | 2017-04-21 | 2017-08-11 | 杭州市综合交通研究中心 | 一种基于手机信令数据的居民出行od获取方法 |
CN107305590A (zh) * | 2017-06-14 | 2017-10-31 | 北京市交通信息中心 | 一种基于手机信令数据的城市交通出行特征确定方法 |
-
2018
- 2018-04-28 CN CN201810402579.2A patent/CN108650632B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070218900A1 (en) * | 2006-03-17 | 2007-09-20 | Raj Vasant Abhyanker | Map based neighborhood search and community contribution |
CN102281498A (zh) * | 2011-07-28 | 2011-12-14 | 北京大学 | 手机通话数据中用户通勤od的挖掘方法 |
CN104252527A (zh) * | 2014-09-02 | 2014-12-31 | 百度在线网络技术(北京)有限公司 | 一种确定移动用户的常驻点信息的方法和装置 |
CN105142106A (zh) * | 2015-07-29 | 2015-12-09 | 西南交通大学 | 基于手机信令数据的出行者职住地识别与出行链刻画方法 |
CN105513351A (zh) * | 2015-12-17 | 2016-04-20 | 北京亚信蓝涛科技有限公司 | 一种基于大数据的交通出行特征数据提取方法 |
CN106792514A (zh) * | 2016-11-30 | 2017-05-31 | 南京华苏科技有限公司 | 基于信令数据的用户职住地分析方法 |
CN107040894A (zh) * | 2017-04-21 | 2017-08-11 | 杭州市综合交通研究中心 | 一种基于手机信令数据的居民出行od获取方法 |
CN107305590A (zh) * | 2017-06-14 | 2017-10-31 | 北京市交通信息中心 | 一种基于手机信令数据的城市交通出行特征确定方法 |
Non-Patent Citations (1)
Title |
---|
苗壮: "基于手机信令数据的数据清洗挖掘与居民职住空间分析", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
Cited By (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111126653A (zh) * | 2018-11-01 | 2020-05-08 | 百度在线网络技术(北京)有限公司 | 用户职住地预测方法、装置及存储介质 |
CN111126653B (zh) * | 2018-11-01 | 2022-06-17 | 百度在线网络技术(北京)有限公司 | 用户职住地预测方法、装置及存储介质 |
CN109634998A (zh) * | 2018-11-19 | 2019-04-16 | 北京通途永久科技有限公司 | 一种基于手机信令大数据的交通出行特征分析平台 |
CN109495848A (zh) * | 2018-12-18 | 2019-03-19 | 成都方未科技有限公司 | 一种用户空间定位的方法 |
CN111417075A (zh) * | 2018-12-18 | 2020-07-14 | 北京融信数联科技有限公司 | 一种基于移动通信大数据的用户工作地识别方法 |
CN111417075B (zh) * | 2018-12-18 | 2023-06-06 | 北京融信数联科技有限公司 | 一种基于移动通信大数据的用户工作地识别方法 |
CN109840872A (zh) * | 2019-01-08 | 2019-06-04 | 福建福诺移动通信技术有限公司 | 一种基于运营商信令数据计算城市通勤模型的方法 |
CN109887275A (zh) * | 2019-01-26 | 2019-06-14 | 深圳市新城市规划建筑设计股份有限公司 | 一种多源轨迹数据居民通勤分析系统及方法 |
CN109918582B (zh) * | 2019-03-06 | 2023-06-20 | 上海评驾科技有限公司 | 一种基于时空数据的用户单兴趣点识别的方法 |
CN109918582A (zh) * | 2019-03-06 | 2019-06-21 | 上海评驾科技有限公司 | 一种基于时空数据的用户单兴趣点识别的方法 |
CN111669819A (zh) * | 2019-03-07 | 2020-09-15 | 广州慧睿思通信息科技有限公司 | 空地协同的定位方法、设备、系统及存储介质 |
CN110533038A (zh) * | 2019-09-04 | 2019-12-03 | 广州市交通规划研究院 | 一种基于信息数据的城市活力区和中心城区边界识别的方法 |
CN110533038B (zh) * | 2019-09-04 | 2022-04-12 | 广州市交通规划研究院 | 一种基于信息数据的城市活力区和中心城区边界识别的方法 |
CN110990443A (zh) * | 2019-10-28 | 2020-04-10 | 上海城市交通设计院有限公司 | 一种基于手机信令的职住人口特征估算方法 |
CN110868689B (zh) * | 2019-11-25 | 2020-12-08 | 智慧足迹数据科技有限公司 | 常住人口确定方法、装置和电子设备 |
CN110868689A (zh) * | 2019-11-25 | 2020-03-06 | 智慧足迹数据科技有限公司 | 常住人口确定方法、装置和电子设备 |
CN111198972A (zh) * | 2019-12-30 | 2020-05-26 | 中国联合网络通信集团有限公司 | 用户职住地识别方法、装置、控制设备及存储介质 |
CN111198972B (zh) * | 2019-12-30 | 2023-05-09 | 中国联合网络通信集团有限公司 | 用户职住地识别方法、装置、控制设备及存储介质 |
CN111246379A (zh) * | 2020-01-13 | 2020-06-05 | 北京工业大学 | 一种利用手机信令数据判别城市功能区的方法 |
CN111582948A (zh) * | 2020-05-25 | 2020-08-25 | 北京航空航天大学 | 一种基于手机信令数据与poi兴趣点的个体行为分析方法 |
CN111582948B (zh) * | 2020-05-25 | 2023-04-18 | 北京航空航天大学 | 一种基于手机信令数据与poi兴趣点的个体行为分析方法 |
CN112101999A (zh) * | 2020-09-16 | 2020-12-18 | 智慧足迹数据科技有限公司 | 用户识别方法、装置、电子设备和计算机可读存储介质 |
CN112215666A (zh) * | 2020-11-03 | 2021-01-12 | 广州市交通规划研究院 | 一种基于手机定位数据的不同出行活动目的特征识别方法 |
CN112434225B (zh) * | 2020-12-13 | 2022-06-21 | 天津市赛英工程建设咨询管理有限公司 | 一种基于过程聚类的手机信令驻留点提取方法 |
CN112434225A (zh) * | 2020-12-13 | 2021-03-02 | 天津市市政工程设计研究院 | 一种基于过程聚类的手机信令驻留点提取方法 |
CN115442758A (zh) * | 2022-09-05 | 2022-12-06 | 广州瀚信通信科技股份有限公司 | 一种用户出行方式确定方法、装置、终端设备以及存储介质 |
CN116738073A (zh) * | 2022-09-21 | 2023-09-12 | 荣耀终端有限公司 | 常驻地的识别方法、设备及存储介质 |
CN116738073B (zh) * | 2022-09-21 | 2024-03-22 | 荣耀终端有限公司 | 常驻地的识别方法、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN108650632B (zh) | 2020-05-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108650632A (zh) | 一种基于职住对应关系和时空间核聚类的驻点判断方法 | |
Conrow et al. | Comparing spatial patterns of crowdsourced and conventional bicycling datasets | |
CN104318324B (zh) | 基于出租车gps记录的机场巴士站点及路线规划方法 | |
CN111681421B (zh) | 基于手机信令数据的对外客运枢纽集疏空间分布分析方法 | |
CN112133090A (zh) | 一种基于手机信令数据的多方式交通分布模型构建方法 | |
US7917458B2 (en) | Temporal-influenced geospatial modeling system and method | |
CN105206048A (zh) | 一种基于交通od数据的城市居民群体换乘模式发现系统及方法 | |
CN108920481A (zh) | 一种基于手机定位数据的道路网重建方法及系统 | |
CN108629000A (zh) | 一种手机轨迹数据聚类的群体行为特征提取方法及系统 | |
Zhou et al. | A data-driven method for trip ends identification using large-scale smartphone-based GPS tracking data | |
CN110188803A (zh) | 基于出租车轨迹数据的出行时空模式识别方法与系统 | |
CN112215666A (zh) | 一种基于手机定位数据的不同出行活动目的特征识别方法 | |
CN107527313A (zh) | 用户活动模式划分及属性推测方法 | |
CN110716935A (zh) | 基于网约车出行的轨迹数据分析与可视化方法及系统 | |
CN112668375B (zh) | 景区内游客分布分析系统及方法 | |
Feng et al. | Towards big data analytics and mining for UK traffic accident analysis, visualization & prediction | |
Caigang et al. | Nonlinear and threshold effects of traffic condition and built environment on dockless bike sharing at street level | |
WO2023143000A1 (zh) | 一种基于多源大数据的老龄友好街道建成环境审计系统 | |
CN109254984B (zh) | 基于od数据感知城市动态结构演化规律的可视分析方法 | |
CN115098564A (zh) | 一种乘客出行需求分析方法及系统 | |
CN113435867B (zh) | 智慧城市运营方法、系统和可读存储介质 | |
CN113327079B (zh) | 一种基于网约车轨迹的路径选择潜在因素可视分析方法 | |
Gong et al. | Spatio-temporal parking occupancy forecasting integrating parking sensing records and street-level images | |
Hugo et al. | New conceptualisation of settlement for demography: beyond the rural/urban dichotomy | |
Yao et al. | Trip end identification based on spatial-temporal clustering algorithm using smartphone positioning data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP03 | Change of name, title or address |
Address after: 510030 floors 1-6 on the west side of No. 10 Guangwei Road, Yuexiu District, Guangzhou City, Guangdong Province Patentee after: Guangzhou transportation planning and Research Institute Co.,Ltd. Address before: 510030 floor 10, No. 80, Jixiang Road, Guangzhou, Guangdong Patentee before: GUANGZHOU TRANSPORT PLANNING Research Institute |
|
CP03 | Change of name, title or address |