CN111737605A - 一种基于手机信令数据的出行目的识别方法及装置 - Google Patents
一种基于手机信令数据的出行目的识别方法及装置 Download PDFInfo
- Publication number
- CN111737605A CN111737605A CN202010658543.8A CN202010658543A CN111737605A CN 111737605 A CN111737605 A CN 111737605A CN 202010658543 A CN202010658543 A CN 202010658543A CN 111737605 A CN111737605 A CN 111737605A
- Authority
- CN
- China
- Prior art keywords
- travel
- data
- poi
- base station
- trip
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 66
- 230000011664 signaling Effects 0.000 title claims abstract description 46
- 239000013598 vector Substances 0.000 claims description 30
- 238000011160 research Methods 0.000 claims description 26
- 238000004458 analytical method Methods 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000006073 displacement reaction Methods 0.000 claims description 12
- 238000012216 screening Methods 0.000 claims description 7
- 238000012986 modification Methods 0.000 claims description 5
- 230000004048 modification Effects 0.000 claims description 5
- 238000012937 correction Methods 0.000 claims description 3
- 238000004422 calculation algorithm Methods 0.000 abstract description 13
- 230000006399 behavior Effects 0.000 abstract description 11
- 238000010801 machine learning Methods 0.000 abstract description 9
- 238000003064 k means clustering Methods 0.000 abstract description 2
- 238000005192 partition Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 8
- 230000006854 communication Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000007621 cluster analysis Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 230000004308 accommodation Effects 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000000586 desensitisation Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000000686 essence Substances 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/20—Services signaling; Auxiliary data signalling, i.e. transmitting data via a non-traffic channel
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Business, Economics & Management (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Mathematical Physics (AREA)
- Evolutionary Biology (AREA)
- Remote Sensing (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Traffic Control Systems (AREA)
- Navigation (AREA)
Abstract
本发明涉及出行目的识别技术领域,尤其涉及一种基于手机信令数据的出行目的识别方法及装置。出行目的识别方法,步骤:提取OD数据,划分人口类型及职住地;获取POI及基站位置,并分别与其所在地块关联,形成位置对应关系;基于出行终点基站所在地块与该地块对应的POI类型及职住地的对应关系对出行目的进行初步识别,提取特征参数基于K‑means聚类算法对剩余样本进行聚类,最终获取出行目的;由人口类型,对出行目的结果进行修正。本实施例基于手机信令数据及POI点,通过机器学习算法对居民出行目的进行划分,同时结合人群的出行行为特性对结果进行修正,该方法不仅减少了对先验经验知识的依赖与需求,而且可以避免单一规则判别法所带来的主观性。
Description
技术领域
本发明涉及出行目的识别技术领域,具体地,涉及基于手机信令 数据的出行目的识别方法及装置。
背景技术
通信与互联网技术的发展与普及应用,应运而生的是对其背后蕴 藏的大量潜在信息的大数据的挖掘研究。手机作为一种便携式通讯设 备随着经济的发展已经在国民中快速普及,截止2016年,我国手机 拥有量己超过96部/百人,除了部分交通从属群体比如老人和小孩, 在国内大部分地区基本上人人都拥有手机,手机终端为了满足用户通 讯和上网的需求会与邻近的蜂窝基站建立联系,同时记录下用户接入 基站的时间和基站的位置信息,其能实时追踪个体并提供用户位置的 特点为出行信息的采集提供了一条新思路。出行目的作为交通调查中 的一项关键内容,对交通分析、交通规划等相关专题研究至关重要。 目前有大量的GPS、视频监控设备可以感知并记录个体实时位置信息, 但是对于出行目的相关的主观出行行为信息却无法直接通过信息设 备进行感知。
兴趣点是描述特定活动与服务场所的点位,泛指一切可以抽象为 点的地理对象,尤其是一些与人们生活密切相关的地理实体,如学校、 银行、餐馆、加油站、医院、超市等。目前国内主流的地图软件包括 高德、百度均开放有API接口供用户下载兴趣点相关信息,兴趣点在 很大程度上代表了一个区域的土地使用状况,而土地利用是出行生成 活动的主要决定因素,所以土地利用的类别将决定居民出行活动的行 为特性。
手机信令数据出于保护隐私以及数据采集字段自身的一些局限 性的缘故,很难大规模的获取到准确的带有标签的样本信息,这给出 行行为信息分析挖掘带来了一定的难度。对于无法获取标签的特征分 析问题,机器学习中的聚类算法提供了一种较好的解决思路。聚类方 法在各种科学领域已有长久的研究历史,k-means,作为其中一种最 流行最普遍的聚类算法于1955年首次提出。在k-means算法提出后 的六十几年里,陆续有上千种聚类算法被学者提出,但是k-means算 法目前仍被广泛应用于各个领域。该算法是一种成熟有效的无标签样 本分类方法,通过测量样本本质间的相似度来对样本进行聚合分组。
在出行目的识别特征选取方面,现有的诸多研究结合了乘客出行 的时间属性和空间属性,但是识别的过程中仍然存在很多问题。一方 面,空间属性通常以土地利用类型来表征,然而土地利用性质只是在 规划用地时一个相对综合的类型表征,一般来说一个使用同样的土地 利用类型数据,但是会存在超过一种以上的POI点类型,比如商业用 地地块上会有商超以及旅馆等类型的POI,因此空间属性的精确表达 有待提高。另一方面,除了和出行目的直接相关联的时空属性外,对 于用地类型较为综合的地块较少考虑不同人群的出行行为特性,导致 识别结果可靠性较低。
本发明发明人在实现本发明的过程中,发现:目前,现有的基于 位置信息的出行目的识别研究的数据源大部分是GPS数据,手机信令 数据方面相对较少。相比于手机信令数据,GPS位置数据的定位更为 精确,但是必须有特定的采集设备或者数据获取协议,而手机信令数 据是移动通信过程中所产生的副产品,且经过了匿名脱敏处理不涉及 用户,更适宜于全样本的出行特征获取。另一方面,现有研究在进行 出行目的识别时,大部分只是基于出行端点的POI特性,但是随着城 市用地越来越复杂,居民出行越来越多样化,仅根据POI很难对出行 目的进行准确的识别。
发明内容
针对现有技术的上述缺陷,本发明的主要目的在于提供一种基于 手机信令数据的出行目的识别方法,主要步骤包括:
从手机信令数据中提取OD数据,从地图中获取城市的POI点数 据;
从OD数据中获取用户停驻时间特征,并以停驻时间特征的划分 出人口类型及职住地;
获取POI点数据中的POI位置以及基站位置,并分别与其所在地 块相关联,形成位置对应关系;
基于出行目的中的出行终点对应的基站所在地块分别与该地块 对应的POI类型以及用户职住地之间的对应关系,进行出行目的识 别,对识别到的出行目的分类获得预划分集在未被识别到的出行目的 中提取出出发时间、逗留时间、各类出行目的对应的POI熵值特征, 并使用聚类算法对出行目的进行二次划分,获得第二划分集,将预划 分集与第二划分集结合获得出行目的集;
根据人口类型,对出行目的集进行修正,最终识别出出行目。
进一步的,所述出行目的集的获取步骤包括:
通过OD数据中用户停驻时间特性判断职住地及人口类型,在此 基础上根据出行终点基站分别与职住地以及各类型POI点的位置对 应关系,对出行目的进行预划分,获得的预分类集;
提取出未被预划分的OD数据的时间特征和出行目的所对应的 POI熵值特征组成的特征集,并筛选出最优特征子集;
通过最优特征子集对未预划分成功的OD数据进行聚类,结合特 征参数含义对聚类簇进行出行目的识别分类,获得第二划分集;
并将第二划分集加入到预分类集中,获得出行目的集。
进一步的,所述预划分获得的预分类集主要步骤:
根据用户OD数据中的停留时间特征,对其职住地以及人口类型 进行判断;
根据基站与地块的位置对应关系,形成基站与地块匹配集,根据 POI与地块的位置对应关系,形成POI与地块匹配集,以地块为媒介 对基站与POI点进行关联,将获取的POI类型分别进行匹配,建立关 联关系;
再通过出行终点基站与用户职住地的对应关系以及终点基站所 在地块的POI类型对出行目的进行分类,从而获得预分类集。
进一步的,所述最优特征子集的获取方法:
还需要基于聚类模型对其他几类出行目的进行进一步的分类,在 经预划分后未识别出的出行目的的数据中提取特征参数集,具体如 下:提取出在预划分中没有识别出的出行数据形成未识别的出行集, 从出行集中获取包括出行的出行时间、逗留时间、是否为工作日、一 周内在该出行终点的停留次数、用户人口类型、出发时刻的特征参数, 将相同的特征参数聚类成最优特征子集。
进一步的,所述对聚类簇进行出行目的识别分类主要步骤:
从未识别的出行集的最优特征子集中随机选择k个样本作为初 始均值向量;
遍历最优特征子集,计算每个最优特征子集与各均值向量的欧式 距离,并根据与其距离最近的均值向量确定其簇标记;
划分完所有样本后,重新计算均值向量,
经过重新计算的均值向量后再次进行欧式距离计算及确定其簇 标记,直到当前均值向量均未再更新后,输出簇划分后的聚类集合;
根据出行目的的类型对应POI熵值依次定义出聚类集合中每个 簇所属出行目的,定义后的出行目的的类型对应POI占比越大则该中 心簇的未识别的出行集即归入该类型的出行目的。
进一步的,获取OD数据的主要步骤包括:
对手机信令数据进行去噪处理获得用户定位轨迹数据;
根据用户定位轨迹数据中定位点的时空属性识别轨迹数据中的 停留点数据以及位移点数据;
根据识别出的停留点数据和位移点数据划分用户出行的OD数 据;
并通过地图提供的API接口获取研究城市的POI点数据。
进一步的,从OD数据中获取时间特征主要步骤包括:
对于在研究时间范围内,用户在工作时间区间以及居住时间区间 内各逗留地的逗留时间长短,分别进行职住地识别;
遍历经过数据去噪处理后的OD数据集合,分别统计在研究时间 范围内用户在研究城市出现的天数,并根据出现的天数进行区分人口 类型。
进一步的,获取POI点数据中的POI位置及基站位置,并且分别 与所在地块相关联,形成位置对应关系,具体步骤如下:
将地块地理信息数据、POI点数据以及城市基站数据使用连接分 析工具,将POI点数据与地块进行匹配;具体的,
若某POI点处于某地块范围内,则该POI点与该地块匹配成功; 否则,将该POI点与直线距离最近的地块进行匹配,获得POI位置与 地块对应关系;
若某基站处于某地块范围内,则该基站与该地块匹配成功;否则, 将该基站点与直线距离最近的地块进行匹配,获得基站位置与地块对 应关系;
进一步的,根据人口类型,出行目的集进行修正,包括以下步骤:
对于识别出职住地中的常住人口,判断在工作日时间特征工作时 间段内非工作的出行,具体判断方法:
若存在,则判断公务类出行目的POI占比是否大于零,若成立则 将该次出行的出行目的修正为公务;若不成立则不进行修改;
对于商旅人口,判断该人口在访客期间有无旅游或就医出行,若 不存在,提取其在工作日工作时间段的所有出行,若存在购物、休闲 内出行,则将其修正为公务。
实施例中是基于手机信令数据与POI点数据,从数据样本整体角 度出发,在识别出行OD的基础上,通过职驻地识别、典型POI点特 征对出行目的进行预划分,然后利用目的地逗留时间、到达频次、对 应目的POI等特征运用无监督机器学习的k-means聚类分析法对出行 目的进行识别,最后根据不同人群的出行时间、出行行为特性对结果 进行修正,提高模型的可靠性。运用机器学习的方法对出行目的识别, 充分挖掘了手机信令数据中蕴含的信息,降低了对先验知识的需求, 并减少人为干预,提高了方法的客观性。
实施例还公开了一种基于手机信令数据的出行目的识别装置,主 要包括:
数据获取模块,用于从手机信令数据中获取OD数据,及获取地 图中城市的POI点数据;
数据分类模块,用于从OD数据中获取停驻时间特征,并以停驻 时间特征划分出人口类型及职住地;
位置对应模块,用于获取POI点数据中的POI位置及基站位置, 并且分别与所在地块相关联,形成位置对应关系;
分类模块,用于基于出行目的中的出行终点对应的基站所在地块 分别与该地块对应的POI类型以及用户职住地之间的对应关系,进行 出行目的识别获得出行目的集;
数据修正模块,用于根据人口类型,对出行目的集进行修正,最 终识别出出行目的。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方 案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简 单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记 标识。附图中,各元件或部分并不一定按照实际的比例绘制。
图1是本发明中一实施例的基于手机信令数据的出行目的识别 方法的流程图;
图2是本发明中一实施例的获取OD数据的的流程图;
图3是本发明中一实施例的从OD数据中划分出人口类型及职住 地的流程图;
图4是本发明中一实施例的所述出行目的集的获取的流程图;
图5是本发明中一实施例的对出行目的进行预划分获得的预分 类集的流程图;
图6是本发明中一实施例的对未分类的出行进行进一步的分类 的流程图;
图7是本发明中一实施例的基于手机信令数据的出行目的识别 装置的示意图。
具体实施方式
下面将结合附图对本发明技术方案的实施例进行详细的描述。以 下实施例仅用于更加清楚地说明本发明的技术方案,因此只作为示 例,而不能以此来限制本发明的保护范围。
首先需要说明的是,在本发明各实施例中,所涉及的术语为:
手机信令数据,是指移动通信网络主动或被动、定期或不定期的 为与手机用户的移动终端保持联系所产生的一系列控制指令,包括了 手机识别码、时间戳、事件类型、基站编号、基站经纬度、号码归属 地等字段。
OD,是交通中由起点到终点一次出行的简称,“O”来源于英文 ORIGIN,指出行的出发地点,“D”来源于英文DESTINATION,指出行的 目的地。
k-means算法,是指一种将数据集在某些方面相似的数据成员进 行分类组织的无监督算法。
兴趣点是描述特定活动与服务场所的点位,泛指一切可以抽象为 点的地理对象,尤其是一些与人们生活密切相关的地理实体,如学校、 银行、餐馆、加油站、医院、超市等。目前国内主流的地图软件包括 高德、百度均开放有API接口供用户下载兴趣点相关信息,兴趣点在 很大程度上代表了一个区域的土地使用状况,而土地利用是出行生成 活动的主要决定因素,所以土地利用的类别将决定居民出行活动的行 为特性。
下面,将通过几个具体的实施例对发明实施例提供的一种基于手 机信令数据的出行目的识别方法及装置进行详细介绍和说明。
一种基于手机信令数据的出行目的识别方法,主要步骤包括:
步骤S210:从手机信令数据中提取OD数据,从地图中获取城市 的POI点数据;
获取OD数据的主要步骤包括:
步骤S610:对手机信令数据进行去噪处理获得定位的用户轨迹 数据;
步骤S620:根据用户定位轨迹数据中定位点的时空属性识别轨 迹数据中的停留点数据以及位移点数据;
步骤S630:根据识别出的停留点数据和位移点数据划分用户出 行的OD数据;
步骤S640:并通过地图提供的API接口获取研究城市的POI点 数据。
可以理解的,实施例是数据源的手机信令数据是一种近似全样本 且空间全覆盖,时间连续的位置数据,且获取简单经济无需额外的感 知设备,高德POI点数据有开放的API接口供免费下载且相比于土地 使用性质信息,高德POI点数据空间属性更为丰富更新也更为及时。
实际实施例中,首先,是对获取到的手机信令数据进行去噪处理, 所述去噪处理包括重复定位、乒乓定位以及漂移定位数据的处理,从 而得到较为准确的用户定位轨迹信息;
再,根据去噪处理后的定位点的时空属性,用于识别轨迹中的停 留点以及位移点,既计算当前轨迹点的停留时间以及与下一个轨迹点 的空间距离。如,当该轨迹点的停留时间大于40min,且与下一轨迹 点的空间距离大于800m时,将该轨迹点标记为停留点,其余为位移 点。具体的时空阈值可根据研究城市的出行特点以及基站覆盖范围决 定。
接着,根据识别出的停留点和位移点划分出用户的出行OD信息。 其中,一段出行OD包括两个连续的停留点以及中间的位移点组成, 末端的停留点认为是用户本次出行OD的出行目的地,也是进行出行 目的识别的重要依据之一。
同时,通过高德提供的API接口获取要研究城市的POI点信息。 其中,所述POI点信息包括餐饮服务、风景名胜、公共设施、金融保 险、公司企业、科教文化、商务住宅、体育休闲、停车设施、医疗保 健及政府机构共十一类兴趣点,然后再获取的POI点信息中保留与出行目的关联度强的兴趣点,而剔除公共设施、金融保险、停车设施这 三类兴趣点,从而获得所需的POI点信息。
步骤S220:从OD数据中获取用户停驻时间特征,并以停驻时间 特征的划分出人口类型及职住地;
从OD数据中划分出人口类型及职住地的主要步骤包括:
步骤S710:对于在研究时间范围内,用户在工作时间区间以及 居住时间区间内各逗留地的逗留时间长短,分别进行职住地识别;
步骤S720:遍历经过数据去噪处理后的OD数据形成的出行目的 集合,分别统计在研究时间范围内所有出现的用户出现的天数,并根 据出现的天数进行区分人口类型。
进一步的,所述根据出现的天数进行区分人口类型,具体的如下:
当用户一天出现的时间小于某阀值认定为过客;
当用户在某个一个月内,出现的天数大于某个阀值,并且日停留 时间大于某个阀值,则认定为常住人口;当用户在某个一个月内,出 现的天数小于某个阀值,并且工作日内出现时间占较大时,将该用户 标记为商旅人口。
实际实施例中,OD数据中划分出人口类型及职住地如下:
对于在研究时间范围内,出现的每一个用户进行研究。根据手机 用户在确定的研究时间段区间内各逗留地的逗留时间长短,分别进行 职住地识别。实施例中,确定的研究时间段是,根据经验知识并结合 研究地块实际情况,确定工作时间区间,如一般为早上九点至下午六 点;以及居住时间区间,如一般为晚上十一点至第二天早上七点。根 据工作时间区间和居住时间区间,用户的停留时间判断停留地是否是 职住地,即在上述时间期间的停留地为职住地。
遍历经过数据去噪处理后的所有OD数据的集合,进而分别统计 在研究时间范围内,如选取一个月,在该研究时间内所有出现的用户 出现的天数,从而判断出用户的人口类型。
具体的,当某用户在某天出现时间小于或等于两小时时,将该用 户标记为过客,且该天不计入后续判断的累加天数中,即剔除该OD 数据;当在一个月内用户出现天数大于7天时,且日均停留时间大于 8h时,将该用户标记为常住人口;当在一个月内某用户出现天数小 于等于7天时,且工作日内出现时间占全部出现时间不小于三分之二 时,将该用户标记为商旅人口。
步骤S230:获取POI点数据中的POI位置以及基站位置,并分 别与其所在地块相关联,形成位置对应关系;
获取POI点数据中的POI位置和基站位置,并且分别与所在地块 相关联,形成位置对应关系,具体步骤如下:
将地块地理信息数据、POI点数据以及城市基站数据使用连接分 析工具,将POI点数据与地块进行匹配;具体的,
若某POI点处于某地块范围内,则该POI点与该地块匹配成功; 否则,将该POI点与直线距离最近的地块进行匹配,获得POI位置与 地块对应关系;
若某基站处于某地块范围内,则该基站与该地块匹配成功;否则, 将该基站点与直线距离最近的地块进行匹配,获得基站位置与地块对 应关系;
实际实施例中,具体的如下:
将由当地规划局提供的地块的地理信息数据、地图的POI点数据 以及城市的基站信息导入ArcGIS中。通过ArcGIS中的连接分析工具, 将POI信息与地块进行匹配。具体的,如,若某兴趣点处于某地块范 围内,则认为该兴趣点直接与所处地块匹配成功;否则,将该兴趣点 与直线距离最近的地块进行匹配,从而形成POI信息中的兴趣点与地 块的匹配关系。
在基站位置周围300m内设置为缓冲区,通过ArcGIS中的相交分 析工具,将基站对应的缓冲区与地块进行相交,确定基站的覆盖地块 范围,从而形成基站与地块的匹配关系。
这里需要说明的是,这里的POI点数据获取的地图包括高德、百 度及谷歌等地图。
实施例是基于地块与POI的匹配以及基站与地块的匹配,通过实 际地块为媒介,建立了基站与POI的对应关系,相比于以往直接建立 缓冲区或泰森多边形的方法结合了现实地块分布与基站覆盖范围两 个因素,提高了基站与POI对应准确性。
步骤S240:基于出行目的中的出行终点对应的基站所在地块分 别与该地块对应的POI类型以及用户职住地之间的对应关系,进行出 行目的识别,对识别到的出行目的分类获得预划分集在未被识别到的 出行目的中提取出出发时间、逗留时间、各类出行目的对应的POI熵 值特征,并使用聚类算法对出行目的进行二次划分,获得第二划分集, 将预划分集与第二划分集结合获得出行目的集;
所述出行目的集的获取步骤包括:
步骤S810:通过OD数据中用户停驻时间特性判断职住地及人口 类型,在此基础上根据出行终点基站分别与职住地以及各类型POI点 的位置对应关系,对出行目的进行预划分,获得的预分类集;
步骤S820:提取出未被预划分的OD数据的时间特征和出行目的 所对应的POI熵值特征组成的特征集,并筛选出最优特征子集;
步骤S830:通过最优特征子集对未预划分成功的OD数据进行聚 类,结合特征参数含义对聚类簇进行出行目的识别分类,获得第二划 分集;
并将第二划分集加入到预分类集中,获得出行目的集。
实施例中,从识别方法的角度,该实施例中可以更加充分挖掘手 机信令数据中的出行特征相关信息,首先根据职住地识别对通勤以及 典型POI点位对就医等具有明显空间地块属性的出行目的进行预划 分,再利用机器学习的方法从全局的角度分析出行目的,最后根据不 同人群的出行行为特性结合时空属性对结果进行修正,该方法不仅减 少了对先验经验知识的依赖与需求,提高了方法的适用性,而且可以 避免单一规则判别法所带来的主观性。
实施例进一步的,所述预划分获得的预分类集主要步骤:
步骤S8101:根据用户OD数据中的停留时间特征,对其职住地 以及人口类型进行判断;
步骤S8102:根据基站与地块的位置对应关系,形成基站与地块 匹配集,根据POI与地块的位置对应关系,形成POI与地块匹配集, 以地块为媒介对基站与POI点进行关联,将获取的POI类型分别进行 匹配,建立关联关系;
步骤S8103:再通过出行终点基站与用户职住地的对应关系以及 终点基站所在地块的POI类型对出行目的进行分类,从而获得预分类 集。
实际实施例中,具体的如下:
结合现有交通调查的分类情况,将用户的出行目的划分为包括分 别为回家(旅馆)、上班(上学)、公务(商务)、就医、旅游、休闲、 购物和其他的大类。其中前三类回家(旅馆)、上班(上学)、公务(商 务)的出行时间和地点较为固定,因此设为刚性出行需求。而就医、 旅游、休闲、购物和其他这几类时间和地点不固定,为弹性出行需求。 实施例将每一类出行目的与相关兴趣点进行分类关联,如表1所示:
表一出行目的与相关兴趣点类别关联表
出行目的 | 兴趣点 |
回家 | 商务住宅、住宿服务 |
上班(上学) | 政府机构、科教文化、公司企业 |
公务(商务) | 政府机构、公司企业 |
就医 | 医疗保健 |
旅游 | 风景名胜 |
休闲 | 体育休闲 |
购物 | 购物服务 |
对识别出的职住地的用户,当一次出行的终点基站与职住地基站 距离在800m范围内,则认为该次出行的出行目的为上班(上学)、回 家。
筛选出风景名胜类型的兴趣点,找到兴趣点对应的所属地块的地 块集合T。当一次出行的终点对应的基站所覆盖的其中一个或多个地 块位于该地块集合T中,且不属于职住地的出行目的,则认为该次出 行的出行目的为旅游。
筛选出医疗保健类型的兴趣点,找到兴趣点对应的所属地块的地 块集合H。当一次出行的终点基站所处地块位于该地块集合中,且不 属于职住地的出行目的,则认为该次出行的出行目的为就医。
实施例进一步的,所述最优特征子集的获取方法,具体如下:
还需要基于聚类模型对其他几类出行目的进行进一步的分类,在 经预划分后未识别出的出行目的的数据中提取特征参数集,具体如 下:提取出在预划分中没有识别出的出行数据形成未识别的出行集, 从出行集中获取包括出行的出行时间、逗留时间、是否为工作日、一 周内在该出行终点的停留次数、用户人口类型、出发时刻的特征参数。
步骤S8201:提取出在预划分中没有识别出的出行形成未识别的 出行集,并且获取出行在出行终点处的时间特征,并通过时间特征进 行标记;
步骤S8202:通过未识别的初步出行分类集中各个分类集的欧氏 距离计算获得初步出行分类集的欧氏距离;
步骤S8203:再计算获得初步出行分类集中各个分类集相互之间 的相似性度量和离散型变量;
步骤S8204:再用相似性度量和离散型变量计算出初步出行分类 集中各个分类集相互之间的距离熵;
步骤S8205:最后用距离熵经过计算获得初步出行分类集总体距 离熵;
步骤S8206:采用后向消除法作为搜索策略,遍历特征集,计算 每次除去一个特征的总体距离熵,取值最小的总体距离熵对应去除的 特征即为最不重要特征,然后从特征集中剔除这个特征,将其放到新 特征集中;
步骤S8207:重复上述过程一次迭代直到所有特征都转移到了新 特征集中,将新特征集逆序即得到特征的重要性排序。
实施例中具体的:提取该次出行在出行终点处的停留时间:具体 如,是否为工作日,是工作日标记为1、非工作日标记为0。一周内 在该出行终点的停留次数、用户人口类型(常住人口标记为1,商旅 人口标记为2)以及该次出行的出发时刻(当出发时刻处于上午6点 -12点标记为1,当出行时刻处于下午13点至17点标记为2,当出 发时刻处于晚上18点至22点标记为3,当出发时刻处于夜间23点 至第二天凌晨5点标记为4)。
实际实施例中,假设某基站覆盖地块范围内,公务(商务)、购 物、休闲三种活动对应的POI数目分别为Ni(i=1,2,3),总和为N。
再,遍历所有样本集合,计算各样本间提取的特征变量的欧氏距 离,样本xi和xj之间的欧氏距离Dij计算公式如下(其中maxk和mink分 别表示第k个特征的最大值与最小值,M表示特征数):
离散变量间的相似性计算公式如下,其中M为离散型变量数:
计算各样本之间的距离熵,样本xi和xj之间的距离熵Eij计算公式 如下:
Eij=-SijlogSij-(1-Sij)*log(1-Sij)
计算样本总体的距离熵,计算公式如下,其中N表示样本数:
采用后向消除法作为搜索策略,遍历特征集,计算每次除去一个 特征的总体距离熵,取值最小的总体距离熵对应去除的特征即为最不 重要特征,然后从特征集中剔除这个特征,将其放到新特征集中;
重复上述过程一次迭代直到所有特征都转移到了新特征集中,将 新特征集逆序即得到特征的重要性排序,获得最优特征子集。
实施例进一步的,所述对聚类簇进行出行目的识别分类主要步 骤,具体的如下:
根据提取出的特征参数,使用K-means聚类算法对预划分中未识 别成功的最优特征子集进行聚类,结合特征参数含义对各聚类簇进行 出行目的识别,包括以下步骤:
步骤S8301:从未识别的出行集的最优特征子集中随机选择k个 样本作为初始均值向量;
具体的如:从最优特征子集中随机选择k个集作为样本作为初始 均值向量{μ1,μ2,...,μk};
步骤S8302:遍历最优特征子集,计算每个最优特征子集与各均 值向量的欧式距离,并根据与其距离最近的均值向量确定其簇标记;
具体的如:遍历样本集,计算每个样本x与各均值向量的欧式距 离,并根据与其距离最近的均值向量μi确定其簇标记Ci;
步骤S8303:划分完所有样本后,重新计算均值向量,计算公式 如下:
步骤S8304:经过重新计算的均值向量后再次进行欧式距离计算 及确定其簇标记,直到当前均值向量均未再更新后,输出簇划分后的 聚类集合;
具体的如:循环重复步骤S8302,直到当前均值向量均未更新, 输出簇划分的聚类集合C={C1,C2,...,Ck};
步骤S8305:根据出行目的的类型对应POI熵值依次定义出聚类 集合中每个簇所属出行目的根据出行目的的类型对应POI熵值依次 定义出聚类集合中每个簇所属出行目的,定义后的出行目的的类型对 应POI占比越大则该中心簇的未识别的出行集即归入该类型的出行 目的。
具体的如:对于公务(商务)、购物、休闲三种活动对应的POI数目 分别为Ni(i=1,2,3),总和为N,特征参数POI熵值计算公式如下: 当中心簇的特征参数满足P1>P2,且P1>P3时,则该中心簇 代表的出行目的为公务,当中心簇的特征参数满足P2>P1,且P2>P3时,则该中心簇代表 的出行目的为购物,当中心簇的特征参数满足P3>P1,且P3>P2时,则该中心簇代表的出 行目的为休闲。
步骤S250:根据人口类型,对出行目的集进行修正,最终识别 出出行目的。
根据人口类型,出行目的集进行修正,包括以下步骤:
对于识别出职住地中的常住人口,判断在工作日时间特征工作时 间段内非工作的出行,具体判断方法:
若存在,则判断公务类出行目的POI占比是否大于零,若成立则 将该次出行的出行目的修正为公务;若不成立则不进行修改;
对于商旅人口,判断该人口在访客期间有无旅游或就医出行,若 不存在,提取其在工作日工作时间段的所有出行,若存在购物、休闲 内出行,则将其修正为公务。
实施例利用的手机信令数据能获取人出行的数据,包括出发时间 地点、到达时间地点等时间和位置的信息数据,但是该数据中缺少行 为信息,比如出行目的,而对出行目的的预判可有效的提高对交通分 析、交通规划等至关重要。实施例是中对出行目的的识别主要包括: 是在识别出用户上班、家庭住址的基础上,对于回家、上班这类目的 可以直接识别;同时对于医院景点这类具有很明显地点特征的出行目 的进行识别;再通过聚类建模的方法,提取和出行目的相关的特征参 数,比如停留时间,终点用地性质的熵值从而借助机器学习进行识别, 如此对所有的目的完成识别。并且本实施例还根据人口类型对某些目的进行修正来提高精度,主要依据是不同人口类型是会存在不同的出 行特性的,降低了对先验知识的需求,并减少人为干预,提高了方法 的客观性。
实际实施例中,具体的如下:
实施例中是基于手机信令数据与POI点数据,从数据样本整体角 度出发,在识别出行OD的基础上,通过职驻地识别、典型POI点特 征对出行目的进行预划分,然后利用目的地逗留时间、到达频次、对 应目的POI等特征运用无监督机器学习的k-means聚类分析法对出行 目的进行识别,最后根据不同人群的出行时间、出行行为特性对结果 进行修正,提高模型的可靠性。运用机器学习的方法对出行目的识别, 充分挖掘了手机信令数据中蕴含的信息,降低了对先验知识的需求, 并减少人为干预,提高了方法的客观性。
实施方式中还公开了一种基于手机信令数据的出行目的识别装 置,主要包括:
数据获取模块101,用于从手机信令数据中获取OD数据,及获 取地图中城市的POI点数据;
数据分类模块102,用于从OD数据中获取停驻时间特征,并以 停驻时间特征划分出人口类型及职住地;
位置对应模块103,用于获取POI点数据中的POI位置及基站位 置,并且分别与所在地块相关联,形成位置对应关系;
分类模块104,用于基于出行目的中的出行终点对应的基站所在 地块分别与该地块对应的POI类型以及用户职住地之间的对应关系, 进行出行目的识别获得出行目的集;
数据修正模块105,用于根据人口类型,对出行目的集进行修正, 最终完成出行OD数据的出行目的分析。
进一步的,所述分类模块104包括:
预分类模块,用于通过OD数据中用户停驻时间特性判断职住地 及人口类型,在此基础上根据出行终点基站分别与职住地以及各类型 POI点的位置对应关系,对出行目的进行预划分,获得的预分类集;
获取最优特征子集模块,用于提取出未被预划分的OD数据的时 间特征和出行目的所对应的POI熵值特征组成的特征集,并筛选出最 优特征子集;
第二划分模块,用于通过最优特征子集对未预划分成功的OD数 据进行聚类,结合特征参数含义对聚类簇进行出行目的识别分类,获 得第二划分集;
并将第二划分集加入到预分类集中,获得出行目的集。
进一步的,所述预分类模块包括:
类型判断模块,用于根据用户OD数据中的停留时间特征,对其 职住地以及人口类型进行判断;
关联模块,用于根据基站与地块的位置对应关系,形成基站与地 块匹配集,根据POI与地块的位置对应关系,形成POI与地块匹配集, 以地块为媒介对基站与POI点进行关联,将获取的POI类型分别进行 匹配,建立关联关系;
对应分类模块,用于再通过出行终点基站与用户职住地的对应关 系以及终点基站所在地块的POI类型对出行目的进行分类,从而获得 预分类集。
进一步的,所述获取最优特征子集模块进一步的:
还用于基于聚类模型对其他几类出行目的进行进一步的分类,在 经预划分后未识别出的出行目的的数据中提取特征参数集,具体如 下:提取出在预划分中没有识别出的出行数据形成未识别的出行集, 从出行集中获取包括出行的出行时间、逗留时间、是否为工作日、一 周内在该出行终点的停留次数、用户人口类型、出发时刻的特征参数, 将相同的特征参数聚类成最优特征子集。
进一步的,所述第二划分模块包括:
初始均值向量获取模块,用于从未识别的出行集的最优特征子集 中随机选择k个样本作为初始均值向量;
簇标记模块,用于遍历最优特征子集,计算每个最优特征子集与 各均值向量的欧式距离,并根据与其距离最近的均值向量确定其簇标 记;
聚类模块,用于划分完所有样本后,重新计算均值向量,经过重 新计算的均值向量后再次进行欧式距离计算及确定其簇标记,直到当 前均值向量均未再更新后,输出簇划分后的聚类集合;
类型归类模块,用于根据出行目的的类型对应POI熵值依次定义 出聚类集合中每个簇所属出行目的,定义后的出行目的的类型对应 POI占比越大则该中心簇的未识别的出行集即归入该类型的出行目 的。
进一步的,所述数据获取模块101包括:
数据处理模块,用于对手机信令数据进行去噪处理获得用户定位 轨迹数据;
数据识别模块,用于根据用户定位轨迹数据中定位点的时空属性 识别轨迹数据中的停留点数据以及位移点数据;
OD数据划分模块,用于根据识别出的停留点数据和位移点数据 划分用户出行的OD数据;
POI点数据获取模块,用于通过地图提供的API接口获取研究城 市的POI点数据。
进一步的,所述数据分类模块102包括:
职住地识别模块,用于对于在研究时间范围内,用户在工作时间 区间以及居住时间区间内各逗留地的逗留时间长短,分别进行职住地 识别;
人口类型识别模块,用于遍历经过数据去噪处理后的OD数据集 合,分别统计在研究时间范围内用户在研究城市出现的天数,并根据 出现的天数进行区分人口类型。
进一步的,所述位置对应模块103,
用于将地块地理信息数据、POI点数据以及城市基站数据使用连 接分析工具,将POI点数据与地块进行匹配;具体的包括,
POI点对应关系获取模块,用于判断若某POI点处于某地块范围 内,则该POI点与该地块匹配成功;否则,将该POI点与直线距离最 近的地块进行匹配,获得POI位置与地块对应关系;
基站对应关系获取模块,用于判断若某基站处于某地块范围内, 则该基站与该地块匹配成功;否则,将该基站点与直线距离最近的地 块进行匹配,获得基站位置与地块对应关系。
进一步的,根据人口类型,出行目的集进行修正,包括:
常住人口修正模块,用于对于识别出职住地中的常住人口,判断 在工作日时间特征工作时间段内非工作的出行,具体判断方法:
若存在,则判断公务类出行目的POI占比是否大于零,若成立则 将该次出行的出行目的修正为公务;若不成立则不进行修改;
商旅人口修正模块,用于对于商旅人口,判断该人口在访客期间 有无旅游或就医出行,若不存在,提取其在工作日工作时间段的所有 出行,若存在购物、休闲内出行,则将其修正为公务。
本实施例利用的手机信令数据能获取人出行的数据,包括出发时 间地点、到达时间地点等时间和位置的信息数据,但是该数据中缺少 行为信息,比如出行目的,而对出行目的的预判可有效的提高对交通 分析、交通规划等至关重要。实施例是中对出行目的的识别主要包括: 是在识别出用户上班、家庭住址的基础上,对于回家、上班这类目的 可以直接识别;同时对于医院景点这类具有很明显地点特征的出行目 的进行识别;再通过聚类建模的方法,提取和出行目的相关的特征参 数,比如停留时间,终点用地性质的熵值从而借助机器学习进行识别, 如此对所有的目的完成识别。并且本实施例还根据人口类型对某些目 的进行修正来提高精度,主要依据是不同人口类型是会存在不同的出 行特性的,降低了对先验知识的需求,并减少人为干预,提高了方法 的客观性。
本实施例还提供了一种计算机可读存储介质,所述存储介质中存 储有计算机可执行指令,所述计算机可执行指令由处理器加载并执行 本实施例上述的一种基于手机信令数据的出行目的识别方法。
可选地,在本实施例中,上述存储介质可以位于计算机网络的多 个网络服务器中的至少一个网络服务器。可选地,在本实施例中,上 述存储介质可以包括但不限于:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、 磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案, 而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明, 本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载 的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替 换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各 实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的 范围当中。尤其是,只要不存在结构冲突,各个实施例中所提到的各 项技术特征均可以任意方式组合起来。本发明并不局限于文中公开的 特定实施例,而是包括落入权利要求的范围内的所有技术方案。
Claims (10)
1.一种基于手机信令数据的出行目的识别方法,其特征在于,主要步骤包括:
从手机信令数据中提取OD数据,从地图中获取城市的POI点数据;
从OD数据中获取用户停驻时间特征,并以停驻时间特征的划分出人口类型及职住地;
获取POI点数据中的POI位置以及基站位置,并分别与其所在地块相关联,形成位置对应关系;
基于出行目的中的出行终点对应的基站所在地块分别与该地块对应的POI类型以及用户职住地之间的对应关系,进行出行目的识别获得出行目的集;
根据人口类型,对出行目的集进行修正,最终识别出出行目的。
2.根据权利要求1所述的基于手机信令数据的出行目的识别方法,其特征在于,所述出行目的集的获取步骤包括:
通过OD数据中用户停驻时间特性判断职住地及人口类型,在此基础上根据出行终点基站分别与职住地以及各类型POI点的位置对应关系,对出行目的进行预划分,获得的预分类集;
提取出未被预划分的OD数据的时间特征和出行目的所对应的POI熵值特征组成的特征集,并筛选出最优特征子集;
通过最优特征子集对未预划分成功的OD数据进行聚类,结合特征参数含义对聚类簇进行出行目的识别分类,获得第二划分集;
并将第二划分集加入到预分类集中,获得出行目的集。
3.根据权利要求2所述的基于手机信令数据的出行目的识别方法,其特征在于,所述预划分获得的预分类集主要步骤:
根据用户OD数据中的停留时间特征,对其职住地以及人口类型进行判断;
根据基站与地块的位置对应关系,形成基站与地块匹配集,根据POI与地块的位置对应关系,形成POI与地块匹配集,以地块为媒介对基站与POI点进行关联;
将获取的POI类型分别进行匹配,建立关联关系;
再通过出行终点基站与用户职住地的对应关系以及终点基站所在地块的POI类型对出行目的进行分类,从而获得预分类集。
4.根据权利要求2所述的基于手机信令数据的出行目的识别方法,其特征在于,所述最优特征子集的获取方法:
基于聚类模型对出行目的进行进一步的分类,在经预划分后未识别出的出行目的的数据中提取特征参数集,具体如下:提取出在预划分中没有识别出的出行数据形成未识别的出行集,从出行集中获取包括出行的出行时间、逗留时间、是否为工作日、一周内在该出行终点的停留次数、用户人口类型、出发时刻的特征参数,通过特征筛选方法获取最优特征子集。
5.根据权利要求2所述的基于手机信令数据的出行目的识别方法,其特征在于,所述对聚类簇进行出行目的识别分类主要步骤:
从未识别的出行集的最优特征子集中随机选择k个样本作为初始均值向量;
遍历最优特征子集,计算每个最优特征子集与各均值向量的欧式距离,并根据与其距离最近的均值向量确定其簇标记;
划分完所有样本后,重新计算均值向量,
经过重新计算的均值向量后再次进行欧式距离计算及确定其簇标记,直到当前均值向量均未再更新后,输出簇划分后的聚类集合;
根据出行目的的类型对应POI熵值依次定义出聚类集合中每个簇所属出行目的,定义后的出行目的的类型对应POI占比越大则该中心簇的未识别的出行集即归入该类型的出行目的。
6.根据权利要求1所述的基于手机信令数据的出行目的识别方法,其特征在于,获取OD数据的主要步骤包括:
对手机信令数据进行去噪处理获得用户定位轨迹数据;
根据用户定位轨迹数据中定位点的时空属性识别轨迹数据中的停留点数据以及位移点数据;
根据识别出的停留点数据和位移点数据划分用户出行的OD数据;
并通过地图提供的API接口获取研究城市的POI点数据。
7.根据权利要求1所述的基于手机信令数据的出行目的识别方法,其特征在于,从OD数据中获取时间特征主要步骤包括:
对于在研究时间范围内,用户在工作时间区间以及居住时间区间内各逗留地的逗留时间长短,分别进行职住地识别;
遍历经过数据去噪处理后的OD数据集合,分别统计在研究时间范围内用户在研究城市出现的天数,并根据出现的天数进行区分人口类型。
8.根据权利要求1所述的基于手机信令数据的出行目的识别方法,其特征在于,获取POI点数据中的POI位置及基站位置,并且分别与所在地块相关联,形成位置对应关系,具体步骤如下:
将地块地理信息数据、POI点数据以及城市基站数据使用连接分析工具,将POI点数据与地块进行匹配;具体的,
若某POI点处于某地块范围内,则该POI点与该地块匹配成功;否则,将该POI点与直线距离最近的地块进行匹配,获得POI位置与地块对应关系;
若某基站处于某地块范围内,则该基站与该地块匹配成功;否则,将该基站点与直线距离最近的地块进行匹配,获得基站位置与地块对应关系。
9.根据权利要求1所述的基于手机信令数据的出行目的识别方法,其特征在于,根据人口类型,出行目的集进行修正,包括以下步骤:
对于识别出职住地中的常住人口,判断在工作日时间特征工作时间段内非工作的出行,具体判断方法:
若存在,则判断公务类出行目的POI占比是否大于零,若成立则将该次出行的出行目的修正为公务;若不成立则不进行修改;
对于商旅人口,判断该人口在访客期间有无旅游或就医出行,若不存在,提取其在工作日工作时间段的所有出行,若存在购物、休闲内出行,则将其修正为公务。
10.一种基于手机信令数据的出行目的识别装置,其特征在于,主要包括:
数据获取模块,用于从手机信令数据中获取OD数据,及获取地图中城市的POI点数据;
数据分类模块,用于从OD数据中获取停驻时间特征,并以停驻时间特征划分出人口类型及职住地;
位置对应模块,用于获取POI点数据中的POI位置及基站位置,并且分别与所在地块相关联,形成位置对应关系;
分类模块,用于基于出行目的中的出行终点对应的基站所在地块分别与该地块对应的POI类型以及用户职住地之间的对应关系,进行出行目的识别获得出行目的集;
数据修正模块,用于根据人口类型,对出行目的集进行修正,最终识别出出行目的。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010658543.8A CN111737605A (zh) | 2020-07-09 | 2020-07-09 | 一种基于手机信令数据的出行目的识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010658543.8A CN111737605A (zh) | 2020-07-09 | 2020-07-09 | 一种基于手机信令数据的出行目的识别方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111737605A true CN111737605A (zh) | 2020-10-02 |
Family
ID=72655912
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010658543.8A Pending CN111737605A (zh) | 2020-07-09 | 2020-07-09 | 一种基于手机信令数据的出行目的识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111737605A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112215666A (zh) * | 2020-11-03 | 2021-01-12 | 广州市交通规划研究院 | 一种基于手机定位数据的不同出行活动目的特征识别方法 |
CN112541551A (zh) * | 2020-12-16 | 2021-03-23 | 中国联合网络通信集团有限公司 | 加油站用户信息处理方法、装置及服务器 |
CN112633108A (zh) * | 2020-11-20 | 2021-04-09 | 移通科技(杭州)有限公司 | 基于数据治理的人流监测分析系统和方法 |
CN112685659A (zh) * | 2021-03-19 | 2021-04-20 | 上海钐昆网络科技有限公司 | 目标地点确定方法、装置、电子设备及计算机存储介质 |
CN112734216A (zh) * | 2021-01-04 | 2021-04-30 | 长安大学 | 一种基于通信定位数据的居民出行目的的识别方法 |
CN112784901A (zh) * | 2021-01-22 | 2021-05-11 | 北京航空航天大学 | 一种基于位置数据的行人出行分类检测方法和系统 |
CN112949784A (zh) * | 2021-05-13 | 2021-06-11 | 深圳市城市交通规划设计研究中心股份有限公司 | 一种居民出行链模型构建方法及居民出行链获取方法 |
CN113011924A (zh) * | 2021-03-24 | 2021-06-22 | 华南理工大学 | 农贸市场物流配送与服务体系识别方法、系统、设备及介质 |
CN113407906A (zh) * | 2021-05-13 | 2021-09-17 | 东南大学 | 一种基于手机信令数据的交通出行分布阻抗函数的确定方法 |
CN114298880A (zh) * | 2021-12-29 | 2022-04-08 | 南京大学 | 基于公共交通方式优势出行距离确定城市用地规模的方法 |
CN115086880A (zh) * | 2022-08-22 | 2022-09-20 | 广州市城市规划勘测设计研究院 | 一种出行特征识别方法、装置、设备及存储介质 |
CN116206452A (zh) * | 2023-05-04 | 2023-06-02 | 北京城建交通设计研究院有限公司 | 一种城市交通出行的稀疏数据特征分析方法和系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106096631A (zh) * | 2016-06-02 | 2016-11-09 | 上海世脉信息科技有限公司 | 一种基于手机大数据的流动人口分类识别分析方法 |
CN108133302A (zh) * | 2016-12-01 | 2018-06-08 | 上海浦东建筑设计研究院有限公司 | 一种基于大数据的公共自行车潜在需求预测方法 |
CN109561386A (zh) * | 2018-11-23 | 2019-04-02 | 东南大学 | 一种基于多源定位数据的城市居民出行活动模式获取方法 |
CN109583640A (zh) * | 2018-11-23 | 2019-04-05 | 东南大学 | 一种基于多源定位数据的城市出行客流属性识别方法 |
CN110245981A (zh) * | 2019-05-31 | 2019-09-17 | 南京瑞栖智能交通技术产业研究院有限公司 | 一种基于手机信令数据的人群类型识别方法 |
-
2020
- 2020-07-09 CN CN202010658543.8A patent/CN111737605A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106096631A (zh) * | 2016-06-02 | 2016-11-09 | 上海世脉信息科技有限公司 | 一种基于手机大数据的流动人口分类识别分析方法 |
CN108133302A (zh) * | 2016-12-01 | 2018-06-08 | 上海浦东建筑设计研究院有限公司 | 一种基于大数据的公共自行车潜在需求预测方法 |
CN109561386A (zh) * | 2018-11-23 | 2019-04-02 | 东南大学 | 一种基于多源定位数据的城市居民出行活动模式获取方法 |
CN109583640A (zh) * | 2018-11-23 | 2019-04-05 | 东南大学 | 一种基于多源定位数据的城市出行客流属性识别方法 |
CN110245981A (zh) * | 2019-05-31 | 2019-09-17 | 南京瑞栖智能交通技术产业研究院有限公司 | 一种基于手机信令数据的人群类型识别方法 |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112215666A (zh) * | 2020-11-03 | 2021-01-12 | 广州市交通规划研究院 | 一种基于手机定位数据的不同出行活动目的特征识别方法 |
CN112633108A (zh) * | 2020-11-20 | 2021-04-09 | 移通科技(杭州)有限公司 | 基于数据治理的人流监测分析系统和方法 |
CN112541551A (zh) * | 2020-12-16 | 2021-03-23 | 中国联合网络通信集团有限公司 | 加油站用户信息处理方法、装置及服务器 |
CN112541551B (zh) * | 2020-12-16 | 2023-11-24 | 中国联合网络通信集团有限公司 | 加油站用户信息处理方法、装置及服务器 |
CN112734216A (zh) * | 2021-01-04 | 2021-04-30 | 长安大学 | 一种基于通信定位数据的居民出行目的的识别方法 |
CN112784901B (zh) * | 2021-01-22 | 2023-04-07 | 北京航空航天大学 | 一种基于位置数据的行人出行分类检测方法和系统 |
CN112784901A (zh) * | 2021-01-22 | 2021-05-11 | 北京航空航天大学 | 一种基于位置数据的行人出行分类检测方法和系统 |
CN112685659A (zh) * | 2021-03-19 | 2021-04-20 | 上海钐昆网络科技有限公司 | 目标地点确定方法、装置、电子设备及计算机存储介质 |
CN113011924A (zh) * | 2021-03-24 | 2021-06-22 | 华南理工大学 | 农贸市场物流配送与服务体系识别方法、系统、设备及介质 |
CN113407906A (zh) * | 2021-05-13 | 2021-09-17 | 东南大学 | 一种基于手机信令数据的交通出行分布阻抗函数的确定方法 |
CN112949784A (zh) * | 2021-05-13 | 2021-06-11 | 深圳市城市交通规划设计研究中心股份有限公司 | 一种居民出行链模型构建方法及居民出行链获取方法 |
CN113407906B (zh) * | 2021-05-13 | 2024-02-02 | 东南大学 | 一种基于手机信令数据的交通出行分布阻抗函数的确定方法 |
CN114298880A (zh) * | 2021-12-29 | 2022-04-08 | 南京大学 | 基于公共交通方式优势出行距离确定城市用地规模的方法 |
CN115086880A (zh) * | 2022-08-22 | 2022-09-20 | 广州市城市规划勘测设计研究院 | 一种出行特征识别方法、装置、设备及存储介质 |
CN116206452A (zh) * | 2023-05-04 | 2023-06-02 | 北京城建交通设计研究院有限公司 | 一种城市交通出行的稀疏数据特征分析方法和系统 |
CN116206452B (zh) * | 2023-05-04 | 2023-08-15 | 北京城建交通设计研究院有限公司 | 一种城市交通出行的稀疏数据特征分析方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111737605A (zh) | 一种基于手机信令数据的出行目的识别方法及装置 | |
Zhao et al. | A trajectory clustering approach based on decision graph and data field for detecting hotspots | |
CN107291888B (zh) | 基于机器学习统计模型的入住酒店附近生活推荐系统方法 | |
CN107633067B (zh) | 一种基于人员行为规律和数据挖掘方法的群体识别方法 | |
CN106096631B (zh) | 一种基于手机大数据的流动人口分类识别分析方法 | |
Chung et al. | A trip reconstruction tool for GPS-based personal travel surveys | |
CN106931974B (zh) | 基于移动终端gps定位数据记录计算个人通勤距离的方法 | |
US8612134B2 (en) | Mining correlation between locations using location history | |
US8838586B2 (en) | Relevancy ranking for map-related search | |
US10013494B2 (en) | Interest profile of a user of a mobile application | |
CN105894089A (zh) | 一种征信模型的建立方法、征信确定方法及对应装置 | |
KR20180006871A (ko) | 주문들을 분배하기 위한 방법들 및 시스템들 | |
CN105718576B (zh) | 与地理特征相关的个性化位置推荐系统 | |
CN104661306B (zh) | 移动终端被动定位方法及系统 | |
CN112215666A (zh) | 一种基于手机定位数据的不同出行活动目的特征识别方法 | |
CN111178179B (zh) | 一种基于像元尺度的城市功能区的识别方法及装置 | |
CN110263840B (zh) | 一种线路分析方法、装置及程序产品、存储介质 | |
CN110503485B (zh) | 地理区域分类方法及装置、电子设备、存储介质 | |
CN111104468B (zh) | 一种基于语义轨迹推断用户活动的方法 | |
Chen et al. | An analysis of movement patterns between zones using taxi GPS data | |
CN106886911A (zh) | 一种基于用户电信行为特征的旅游产品规划方法及装置 | |
CN112015937B (zh) | 一种图片地理定位方法及系统 | |
Nuzir et al. | Dynamic Land-Use Map Based on Twitter Data. | |
CN112364776A (zh) | 一种城市功能区识别模型建立、分类方法及装置 | |
Yu et al. | RePiDeM: A refined POI demand modeling based on multi-source data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201002 |