CN112508425B - 一种用于弹性公交系统的城市出行用户画像体系构建方法 - Google Patents
一种用于弹性公交系统的城市出行用户画像体系构建方法 Download PDFInfo
- Publication number
- CN112508425B CN112508425B CN202011471127.3A CN202011471127A CN112508425B CN 112508425 B CN112508425 B CN 112508425B CN 202011471127 A CN202011471127 A CN 202011471127A CN 112508425 B CN112508425 B CN 112508425B
- Authority
- CN
- China
- Prior art keywords
- travel
- bus
- elastic
- user
- level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010276 construction Methods 0.000 title claims description 11
- 238000000034 method Methods 0.000 claims abstract description 9
- 238000002372 labelling Methods 0.000 claims abstract description 8
- 238000012546 transfer Methods 0.000 claims description 39
- 238000004458 analytical method Methods 0.000 claims description 12
- 238000005516 engineering process Methods 0.000 claims description 10
- 230000003203 everyday effect Effects 0.000 claims description 9
- 230000002354 daily effect Effects 0.000 claims description 6
- 230000004308 accommodation Effects 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000007418 data mining Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A30/00—Adapting or protecting infrastructure or their operation
- Y02A30/60—Planning or developing urban green infrastructure
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Finance (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Accounting & Taxation (AREA)
- Tourism & Hospitality (AREA)
- Game Theory and Decision Science (AREA)
- Educational Administration (AREA)
- Data Mining & Analysis (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种用于弹性公交系统的城市出行用户画像体系构建方法,包括以下步骤:根据城市用地分类标准对13类POI数据进行重分类;利用TF‑IDF算法计算主要POI类型,赋予公交站点功能属性。基于弹性公交出行记录数据提取弹性公交OD,关联站点功能属性信息,并提取用户公交使用指标;关联用户基本属性,构建多级用户出行指标体系。基于定量的多级用户出行指标体系,进行出行指标标签化,获得用户事实标签以及模型标签。构建多级多粒度公交用户出行标签体系,即公交用户出行画像体系。建立公交用户全方位信息,分析城市居民公交出行画像,为公共交通的规划与调度提供数据基础,从而引导城市居民公交绿色出行。
Description
技术领域
本发明涉及公共交通出行领域和交通大数据领域,尤其涉及一种用于弹性公交系统的城市出行用户画像体系构建方法。
背景技术
用户画像又称用户角色(Persona),是互联网营销的主要客户分类技术,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,几乎所有的互联网公司都会通过勾画目标用户,建立目标用户的全方位线索信息,进一步找出用户的兴趣点进行精准营销,利用数据挖掘寻求有用的信息和潜在的商业机会。
公共交通出行的用户画像目的和传统基于营销的用户画像目的不同,采集的技术手段也不一样。因此,需要一种针对于公共交通网络的用户画像体系构建方法。
发明内容
发明目的:本发明提出一种公共交通领域的用户画像体系构建方法,结合大数据技术、指标体系构建技术、交通工程领域知识、市场分析技术等多学科交叉知识,设计了适用于弹性公交系统的城市居民出行用户画像指标体系,解决了新兴出行方式下城市居民出行用户画像过程中定量分析和多维度指标不足的难题。
技术方案:为实现本发明的目的,本发明所采用的技术方案是:一种用于弹性公交系统的城市出行用户画像体系构建方法,包括如下步骤:
1)获取公交站点功能属性:基于城市13类POI数据,根据城市用地分类标准对所有类别POI数据进行重新分类;以公交站点为中心,对半径R米内各类POI数据,利用TF-IDF算法计算权重;赋予公交站点功能属性,单一功能区或混合功能区;
2)基于弹性公交出行记录提取公交出行OD数据:结合弹性公交出行记录数据,基于大数据预处理技术,进行原始数据信息不完整记录的剔除,并筛选出行时长,出行距离不满足阈值的出行记录,进行剔除,最终获取用户上下车时间和地点记录;
3)构建多级用户出行指标体系:基于完整弹性公交出行OD数据,匹配关联站点功能属性信息,并进行时空统计分析提取用户公交使用指标;关联用户基本信息,获取用户基本指标;
4)出行指标标签化:针对多级用户出行指标体系中的连续变量指标,进行离散处理,完成出行指标标签化,获得用户事实标签以及模型标签;
5)构建公交用户出行画像体系:基于指标分级的指标选取与体系搭建技术,分别从弹性公交用户属性、日常交通出行特征、和弹性公交使用特征三个方面,依次分解,并实现底层指标的标签化,构建多级多粒度公交用户出行标签体系,即公交用户出行画像体系。
进一步的,所述步骤1)的实施步骤为:
11)基于城市13类POI数据,根据城市用地分类标准对所有类别POI数据进行重新分类;13类POI数据包括有:餐饮服务、风景名胜、公共设施、公司企业、购物服务、科教文化服务、金融保险服务、商务住宅、生活服务、体育休闲服务、医疗保健服务、政府机构及团体、住宿服务;重新分类后6类POI数据包括:居住用地、公共管理与服务用地、公共休闲服务用地、商业服务用地、工业用地、绿地与广场用地;
12)以公交站点为中心,对半径R米内各类POI数据,利用TF-IDF算法计算权重:将一条POI数据的类型标签视为一个单词,将以站点为中心、半径R米内的单位功能区所包含的所有POI数据视为一个文档,所有站点功能区包含的POI总和视为文档库;以单位功能区内部的POI类型种类、数量为输入,执行TF-IDF算法;计算每个单位区块中各POI的TF-IDF值,用该值表示POI的综合权重;
w=TF*IDF
式中,w为权重,TF表示POI类型出现频率,IDF表示逆向出现频率,N(x)为POI类型x在某公交站点出现的次数,N为某公交站点的POI总数,A为公交站点数,A(x)为公交站点包含POI类型x的数量;
13)赋予公交站点功能属性,单一功能区或混合功能区:
当站点区域内的某一类POI占该区域所有POI的综合权重达到p%及以上,则定义该站点区域为单一功能区,其属性由综合比例最高的POI类型确定;
当站点区域内所有类型的POI的综合权重均没有达到p%,则定义该站点区域为混合功能区,其属性由综合比例前n名的POI类型确定;
当站点区域内不包含任何POI类型,则通过计算相邻单元属性来确定站点功能属性。
进一步的,所述步骤2)中的完整的弹性公交出行记录数据包括的字段有:公交卡用户唯一ID;上车时间;上车公交站点编号;下车时间;下车公交站点编号;对弹性公交出行记录数据清洗,剔除原始数据集中的信息不完整的数据。
进一步的,所述步骤3)中多级用户出行指标体系包括一级指标:用户基本指标及公交出行指标;用户基本指标包括二级指标:年龄、性别、职业、公交卡类型、是否在分析对象城市居住、收入;公交出行指标包括二级指标:站点出行频次、时间出行规律性、空间出行规律性、换乘公交比例、出行时长、出行距离、出行频率、家距离最近站点距离、弹性公交等待时间、弹性公交出行比例。
进一步的,所述站点出行频次是指各个站点出行总次数;所述时间出行规律性是指每日各个时间段是否产生出行;所述空间出行规律性是指每日各个出行链是否产生出行;所述换乘公交比例是指换乘出行总次数;所述出行时长包括平均出行时长、最长出行时长;所述出行距离包括平均出行距离、最长出行距离;所述出行频率是指每日公交出行总次数;所述弹性公交等待时间包括平均等待时间、最长等待时间;所述弹性公交出行比例是指弹性公交出行总次数。
进一步的,所述步骤4)中出行指标标签化包括:用户事实标签以及用户模型标签;
所述的用户事实标签包括:年龄、性别、职业、公交卡类型、是否在分析对象城市居住、收入水平、居住地、工作地;所述的用户模型标签包括:娱乐出行程度、工作出行程度、偏好站点、偏好区域、时间出行规律性、空间出行规律性、换乘程度、换乘站点、弹性公交等待时间、弹性公交出行比例、弹性公交偏好站点、家距离最近站点距离、最长出行时长、最长出行距离、公交使用强度、公交使用连续性。
进一步的,所述的娱乐出行程度是指用地功能属性为娱乐属性的公交站点出行程度;所述的工作出行程度是指用地功能属性为工作属性的公交站点出行程度;所述的偏好站点是指出行次数高于所有使用站点平均水平的公交站点;所述的偏好区域是指出行次数高于所有到达交通小区平均水平的城市交通小区;
所述的时间出行规律性:根据每日各个时间段是否产生出行;所述空间出行规律性:根据每日各个出行链是否产生出行;所述的换乘程度:根据换乘总次数占出行总次数的比例;所述的换乘站点:换乘次数高于所有站点平均水平的公交站点;所述的弹性公交等待时间:根据平均弹性公交等待时间;所述的弹性公交出行比例:根据弹性公交出行次数占出行总次数的比例;
所述的弹性公交偏好站点:弹性公交出行高于所有站点平均水平的公交站点;所述的家距离最近站点距离:根据家距离最近站点距离;所述的最长出行时长:根据最长公交出行记录所消耗时长;最长出行距离:根据最长公交出行记录所行驶距离;公交使用强度:每日平均乘车次数;公交使用连续性:历史连续乘车天数平均值。
进一步的,所述步骤5)中的多级多粒度公交用户出行标签体系,即公交用户出行画像体系包括一级标签:用户基本信息、出行行为信息、公交使用信息;
51)用户基本信息中包括二级标签:基础标签及位置标签;二级基础标签包括三级标签:年龄、性别、职业、公交卡类型、是否在分析对象城市居住、收入水平;二级位置标签包括三级标签:居住地、工作地;
52)出行行为信息中包括二级标签:出行习惯、偏好出行、出行规律性;二级出行习惯包括三级标签:娱乐出行程度、工作出行程度;二级偏好出行包括三级标签:偏好站点、偏好区域;二级出行规律性包括三级标签:时间出行规律性、空间出行规律性;
53)公交使用信息中包括二级标签:换乘特性、弹性公交、公交便利度、公交容忍度、公交依赖度:二级换乘特性包括三级标签:换乘程度、换乘站点;二级弹性公交包括三级标签:弹性公交等待时间、弹性公交出行比例、弹性公交偏好站点;二级公交便利度包括三级标签:家距离最近站点距离;二级公交容忍度包括三级标签:最长出行时长、最长出行距离;二级公交依赖度包括三级标签:公交使用强度、公交使用连续性。
有益效果:与现有技术相比,本发明的技术方案具有以下有益的技术效果:
本发明的用于公交网络的城市居民出行画像体系构建方法,弥补了用户画像中公共交通用户出行画像的研究空白。同时,本发明用于公交网络的城市居民出行画像体系构建方法是公共交通领域用于非集计用户个体出行特征的创新性应用,同时是用户画像在公交需求管理中的重要应用。
附图说明
图1是本发明的方法流程示意图;
图2是本发明的POI数据分类示意图。
具体实施方式
下面结合附图和实施例对本发明的技术方案作进一步的说明。
本发明所述的用于弹性公交系统的城市出行用户画像体系构建方法,流程如图1所示,具体实现包括以下步骤:
1)获取公交站点功能属性:基于城市13类POI数据,根据城市用地分类标准对所有类别POI数据进行重新分类;以公交站点为中心,对半径500米内各类POI数据,利用TF-IDF算法计算权重;赋予公交站点功能属性,单一功能区或混合功能区。
11)基于城市13类POI数据,根据城市用地分类标准对所有类别POI数据进行重新分类;13类POI数据包括有:餐饮服务、风景名胜、公共设施、公司企业、购物服务、科教文化服务、金融保险服务、商务住宅、生活服务、体育休闲服务、医疗保健服务、政府机构及团体、住宿服务;重新分类后6类POI数据包括:居住用地、公共管理与服务用地、公共休闲服务用地、商业服务用地、工业用地、绿地与广场用地;
12)以公交站点为中心,对半径500米内各类POI数据,利用TF-IDF算法计算权重:将一条POI数据的类型标签视为一个单词,将以站点为中心、半径500米内的单位功能区所包含的所有POI数据视为一个文档,所有站点功能区包含的POI总和视为文档库;以单位功能区内部的POI类型种类、数量为输入,执行TF-IDF算法;计算每个单位区块中各POI的TF-IDF值,用该值表示POI的综合权重;
w=TF*IDF
式中,w为权重,TF表示POI类型出现频率,IDF表示逆向出现频率,N(x)为POI类型x在某公交站点出现的次数,N为某公交站点的POI总数,A为公交站点数,A(x)为公交站点包含POI类型x的数量;
13)赋予公交站点功能属性,单一功能区或混合功能区:
当站点区域内的某一类POI占该区域所有POI的综合权重达到50%及以上,则定义该站点区域为单一功能区,其属性由综合比例最高的POI类型确定;
当站点区域内所有类型的POI的综合权重均没有达到50%,则定义该站点区域为混合功能区,其属性由综合比例前2名的POI类型确定;
当站点区域内不包含任何POI类型,则通过计算相邻单元属性来确定站点功能属性。
2)基于弹性公交出行记录提取公交出行OD数据:结合弹性公交出行记录数据,基于大数据预处理技术,进行原始数据信息不完整记录的剔除,并筛选出行时长,出行距离不满足阈值的不合理出行记录,进行剔除,最终获取用户上下车时间和地点记录。
完整的弹性公交出行记录数据包括的字段有:公交卡用户唯一ID;上车时间;上车公交站点编号;下车时间;下车公交站点编号;对弹性公交出行记录数据清洗,剔除原始数据集中的信息不完整的数据。不合理出行记录指的是记录到的出行时长,出行距离不合理,包括以下几类:时长小于2分钟,大于1小时;距离小于1公里,大于30公里;距离时间比值大于60公里/小时,小于5公里/小时。
3)构建多级用户出行指标体系:基于完整弹性公交出行OD数据,匹配关联站点功能属性信息,并进行时空统计分析提取用户公交使用指标;关联用户基本信息,获取用户基本指标。
所述的多级用户出行指标体系包括一级指标:用户基本指标及公交出行指标;用户基本指标包括二级指标:年龄、性别、职业、公交卡类型、是否在分析对象城市居住、收入;公交出行指标包括二级指标:站点出行频次、时间出行规律性、空间出行规律性、换乘公交比例、出行时长、出行距离、出行频率、家距离最近站点距离、弹性公交等待时间、弹性公交出行比例。
所述站点出行频次是指各个站点出行总次数;所述时间出行规律性是指每日各个时间段是否产生出行;所述空间出行规律性是指每日各个出行链是否产生出行;所述换乘公交比例是指换乘出行总次数;所述出行时长包括平均出行时长、最长出行时长;所述出行距离包括平均出行距离、最长出行距离;所述出行频率是指每日公交出行总次数;所述弹性公交等待时间包括平均等待时间、最长等待时间;所述弹性公交出行比例是指弹性公交出行总次数。
4)出行指标标签化:针对多级用户出行指标体系中的连续变量指标,进行离散处理,完成出行指标标签化,获得用户事实标签以及模型标签。
所述的用户事实标签包括:年龄、性别、职业、公交卡类型、是否在分析对象城市居住、收入水平、居住地、工作地;所述的用户模型标签包括:娱乐出行程度、工作出行程度、偏好站点、偏好区域、时间出行规律性、空间出行规律性、换乘程度、换乘站点、弹性公交等待时间、弹性公交出行比例、弹性公交偏好站点、家距离最近站点距离、最长出行时长、最长出行距离、公交使用强度、公交使用连续性。
所述的娱乐出行程度是指用地功能属性为娱乐属性的公交站点出行程度;所述的工作出行程度是指用地功能属性为工作属性的公交站点出行程度;所述的偏好站点是指出行次数高于所有使用站点平均水平的公交站点;所述的偏好区域是指出行次数高于所有到达交通小区平均水平的城市交通小区;所述的时间出行规律性:根据每日各个时间段是否产生出行;所述空间出行规律性:根据每日各个出行链是否产生出行;所述的换乘程度:根据换乘总次数占出行总次数的比例;所述的换乘站点:换乘次数高于所有站点平均水平的公交站点;所述的弹性公交等待时间:根据平均弹性公交等待时间;所述的弹性公交出行比例:根据弹性公交出行次数占出行总次数的比例;所述的弹性公交偏好站点:弹性公交出行高于所有站点平均水平的公交站点;所述的家距离最近站点距离:根据家距离最近站点距离;所述的最长出行时长:根据最长公交出行记录所消耗时长;最长出行距离:根据最长公交出行记录所行驶距离;公交使用强度:每日平均乘车次数;公交使用连续性:历史连续乘车天数平均值。
5)构建公交用户出行画像体系:基于指标分级的指标选取与体系搭建技术,分别从弹性公交用户属性、日常交通出行特征、和弹性公交使用特征三个方面,依次分解,并实现底层指标的标签化,构建多级多粒度公交用户出行标签体系,即公交用户出行画像体系,包括一级标签:用户基本信息、出行行为信息、公交使用信息。
51)用户基本信息中包括二级标签:基础标签及位置标签;二级基础标签包括三级标签:年龄、性别、职业、公交卡类型、是否在分析对象城市居住、收入水平;二级位置标签包括三级标签:居住地、工作地;
52)出行行为信息中包括二级标签:出行习惯、偏好出行、出行规律性;二级出行习惯包括三级标签:娱乐出行程度、工作出行程度;二级偏好出行包括三级标签:偏好站点、偏好区域;二级出行规律性包括三级标签:时间出行规律性、空间出行规律性;
53)公交使用信息中包括二级标签:换乘特性、弹性公交、公交便利度、公交容忍度、公交依赖度:二级换乘特性包括三级标签:换乘程度、换乘站点;二级弹性公交包括三级标签:弹性公交等待时间、弹性公交出行比例、弹性公交偏好站点;二级公交便利度包括三级标签:家距离最近站点距离;二级公交容忍度包括三级标签:最长出行时长、最长出行距离;二级公交依赖度包括三级标签:公交使用强度、公交使用连续性。本发明的公交用户出行指标体系,如表1所示。
表1
本发明的公交用户出行画像体系,如表2所示。
表2
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。
Claims (2)
1.一种用于弹性公交系统的城市出行用户画像体系构建方法,其特征在于,该方法包括以下步骤:
1)获取公交站点功能属性:基于城市13类POI数据,根据城市用地分类标准对所有类别POI数据进行重新分类;以公交站点为中心,对半径R米内各类POI数据,利用TF-IDF算法计算权重;赋予公交站点功能属性,单一功能区或混合功能区;
11)基于城市13类POI数据,根据城市用地分类标准对所有类别POI数据进行重新分类;13类POI数据包括有:餐饮服务、风景名胜、公共设施、公司企业、购物服务、科教文化服务、金融保险服务、商务住宅、生活服务、体育休闲服务、医疗保健服务、政府机构及团体、住宿服务;重新分类后6类POI数据包括:居住用地、公共管理与服务用地、公共休闲服务用地、商业服务用地、工业用地、绿地与广场用地;
12)以公交站点为中心,对半径R米内各类POI数据,利用TF-IDF算法计算权重:将一条POI数据的类型标签视为一个单词,将以站点为中心、半径R米内的单位功能区所包含的所有POI数据视为一个文档,所有站点功能区包含的POI总和视为文档库;以单位功能区内部的POI类型种类、数量为输入,执行TF-IDF算法;计算每个单位区块中各POI的TF-IDF值,用该值表示POI的综合权重;
w=TF*IDF
式中,w为权重,TF表示POI类型出现频率,IDF表示逆向出现频率,N(x)为POI类型x在某公交站点出现的次数,N为某公交站点的POI总数,A为公交站点数,A(x)为公交站点包含POI类型x的数量;
13)赋予公交站点功能属性,单一功能区或混合功能区:
当站点区域内的某一类POI占该区域所有POI的综合权重达到p%及以上,则定义该站点区域为单一功能区,其属性由综合比例最高的POI类型确定;
当站点区域内所有类型的POI的综合权重均没有达到p%,则定义该站点区域为混合功能区,其属性由综合比例前n名的POI类型确定;
当站点区域内不包含任何POI类型,则通过计算相邻单元属性来确定站点功能属性;
2)基于弹性公交出行记录提取公交出行OD数据:结合弹性公交出行记录数据,基于大数据预处理技术,进行原始数据信息不完整记录的剔除,并筛选出行时长,出行距离不满足阈值的出行记录,进行剔除,最终获取用户上下车时间和地点记录;
所述弹性公交出行记录数据包括的字段有:公交卡用户唯一ID、上车时间、上车公交站点编号、下车时间和下车公交站点编号;
3)构建多级用户出行指标体系:基于完整弹性公交出行OD数据,匹配关联站点功能属性信息,并进行时空统计分析提取用户公交使用指标;关联用户基本信息,获取用户基本指标;
所述多级用户出行指标体系包括一级指标:用户基本指标及公交出行指标;
所述用户基本指标包括二级指标:年龄、性别、职业、公交卡类型、是否在分析对象城市居住以及收入;
所述公交出行指标包括二级指标:站点出行频次、时间出行规律性、空间出行规律性、换乘公交比例、出行时长、出行距离、出行频率、家距离最近站点距离、弹性公交等待时间以及弹性公交出行比例;
4)出行指标标签化:针对多级用户出行指标体系中的连续变量指标,进行离散处理,完成出行指标标签化,获得用户事实标签以及用户模型标签;
所述的用户事实标签包括:年龄、性别、职业、公交卡类型、是否在分析对象城市居住、收入水平、居住地以及工作地;
所述的用户模型标签包括:娱乐出行程度、工作出行程度、偏好站点、偏好区域、时间出行规律性、空间出行规律性、换乘程度、换乘站点、弹性公交等待时间、弹性公交出行比例、弹性公交偏好站点、家距离最近站点距离、最长出行时长、最长出行距离、公交使用强度以及公交使用连续性;
所述的娱乐出行程度是指用地功能属性为娱乐属性的公交站点出行程度;所述的工作出行程度是指用地功能属性为工作属性的公交站点出行程度;所述的偏好站点是指出行次数高于所有使用站点平均水平的公交站点;所述的偏好区域是指出行次数高于所有到达交通小区平均水平的城市交通小区;
所述的时间出行规律性:根据每日各个时间段是否产生出行;所述空间出行规律性:根据每日各个出行链是否产生出行;所述的换乘程度:根据换乘总次数占出行总次数的比例;所述的换乘站点:换乘次数高于所有站点平均水平的公交站点;所述的弹性公交等待时间:根据平均弹性公交等待时间;所述的弹性公交出行比例:根据弹性公交出行次数占出行总次数的比例;
所述的弹性公交偏好站点:弹性公交出行高于所有站点平均水平的公交站点;所述的家距离最近站点距离:根据家距离最近站点距离;所述的最长出行时长:根据最长公交出行记录所消耗时长;最长出行距离:根据最长公交出行记录所行驶距离;公交使用强度:每日平均乘车次数;公交使用连续性:历史连续乘车天数平均值;
5)构建公交用户出行画像体系:基于指标分级的指标选取与体系搭建技术,分别从弹性公交用户属性、日常交通出行特征和弹性公交使用特征三个方面,依次分解,并实现底层指标的标签化,构建多级多粒度公交用户出行标签体系,即公交用户出行画像体系;
所述的公交用户出行画像体系包括一级标签:用户基本信息、出行行为信息、公交使用信息;
51)用户基本信息中包括二级标签:基础标签及位置标签;二级基础标签包括三级标签:年龄、性别、职业、公交卡类型、是否在分析对象城市居住以及收入水平;二级位置标签包括三级标签:居住地和工作地;
52)出行行为信息中包括二级标签:出行习惯、偏好出行和出行规律性;二级出行习惯包括三级标签:娱乐出行程度和工作出行程度;二级偏好出行包括三级标签:偏好站点和偏好区域;二级出行规律性包括三级标签:时间出行规律性和空间出行规律性;
53)公交使用信息中包括二级标签:换乘特性、弹性公交、公交便利度、公交容忍度以及公交依赖度:二级换乘特性包括三级标签:换乘程度和换乘站点;二级弹性公交包括三级标签:弹性公交等待时间、弹性公交出行比例和弹性公交偏好站点;二级公交便利度包括三级标签:家距离最近站点距离;二级公交容忍度包括三级标签:最长出行时长和最长出行距离;二级公交依赖度包括三级标签:公交使用强度和公交使用连续性。
2.根据权利要求1所述的用于弹性公交系统的城市出行用户画像体系构建方法,其特征在于,所述站点出行频次是指各个站点出行总次数;所述时间出行规律性是指每日各个时间段是否产生出行;所述空间出行规律性是指每日各个出行链是否产生出行;所述换乘公交比例是指换乘出行总次数;所述出行时长包括平均出行时长、最长出行时长;所述出行距离包括平均出行距离、最长出行距离;所述出行频率是指每日公交出行总次数;所述弹性公交等待时间包括平均等待时间、最长等待时间;所述弹性公交出行比例是指弹性公交出行总次数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011471127.3A CN112508425B (zh) | 2020-12-14 | 2020-12-14 | 一种用于弹性公交系统的城市出行用户画像体系构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011471127.3A CN112508425B (zh) | 2020-12-14 | 2020-12-14 | 一种用于弹性公交系统的城市出行用户画像体系构建方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112508425A CN112508425A (zh) | 2021-03-16 |
CN112508425B true CN112508425B (zh) | 2024-03-15 |
Family
ID=74973123
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011471127.3A Active CN112508425B (zh) | 2020-12-14 | 2020-12-14 | 一种用于弹性公交系统的城市出行用户画像体系构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112508425B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112800210B (zh) * | 2021-04-06 | 2021-06-18 | 湖南师范大学 | 基于海量公交数据的人群画像算法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105206048A (zh) * | 2015-11-05 | 2015-12-30 | 北京航空航天大学 | 一种基于交通od数据的城市居民群体换乘模式发现系统及方法 |
CN111612549A (zh) * | 2020-05-28 | 2020-09-01 | 中认英泰检测技术有限公司 | 一种平台运营服务系统的构建方法 |
CN111898793A (zh) * | 2020-06-08 | 2020-11-06 | 东南大学 | 一种组合出行方式下考虑用户感知差异性的路径选择方法 |
-
2020
- 2020-12-14 CN CN202011471127.3A patent/CN112508425B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105206048A (zh) * | 2015-11-05 | 2015-12-30 | 北京航空航天大学 | 一种基于交通od数据的城市居民群体换乘模式发现系统及方法 |
CN111612549A (zh) * | 2020-05-28 | 2020-09-01 | 中认英泰检测技术有限公司 | 一种平台运营服务系统的构建方法 |
CN111898793A (zh) * | 2020-06-08 | 2020-11-06 | 东南大学 | 一种组合出行方式下考虑用户感知差异性的路径选择方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112508425A (zh) | 2021-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Foltýnová et al. | Sustainable urban mobility: One definition, different stakeholders’ opinions | |
Kong et al. | Time-location-relationship combined service recommendation based on taxi trajectory data | |
CN110245981B (zh) | 一种基于手机信令数据的人群类型识别方法 | |
Ma et al. | Understanding commuting patterns using transit smart card data | |
Vanoutrive et al. | What determines carpooling to workplaces in Belgium: location, organisation, or promotion? | |
Maria Kockelman | Travel behavior as function of accessibility, land use mixing, and land use balance: evidence from San Francisco Bay Area | |
Tóth et al. | Tourism and accessibility: An integrated approach | |
CN103714139B (zh) | 一种移动海量客户群识别的并行数据挖掘方法 | |
Prillwitz et al. | Moving towards sustainability? Mobility styles, attitudes and individual travel behaviour | |
Choudhury et al. | Modelling preferences for smart modes and services: a case study in Lisbon | |
Li et al. | Exploring the causal relationship between bicycle choice and trip chain pattern | |
Ferrer-Rosell et al. | Airline type and tourist expenditure: Are full service and low cost carriers converging or diverging? | |
Beairsto et al. | Identifying locations for new bike-sharing stations in Glasgow: an analysis of spatial equity and demand factors | |
Tushara et al. | Mode choice modelling for work trips in Calicut City | |
Yildiz et al. | Planning for meals-on-wheels: algorithms and application | |
Chen et al. | The impact of rainfall on the temporal and spatial distribution of taxi passengers | |
CN110647692A (zh) | 一种基于大数据的多维文旅数据监测及呈现方法 | |
Shirzadi Babakan et al. | An agent-based evaluation of impacts of transport developments on the modal shift in Tehran, Iran | |
Che et al. | The impact of internet celebrity economy on sustainable city design: From the perspectives of economics and carbon emissions | |
Chen et al. | A practical approach to determining critical macroeconomic factors in air-traffic volume based on K-means clustering and decision-tree classification | |
CN112508425B (zh) | 一种用于弹性公交系统的城市出行用户画像体系构建方法 | |
Joh et al. | Exploring the use of travel information–identifying contextual market segmentation in Seoul, Korea | |
CN108681741B (zh) | 基于ic卡和居民调查数据的地铁通勤人群信息融合方法 | |
Lee et al. | Benefit estimation for different types of bikeways using contingent valuation method | |
Sinniah et al. | The framework for assessing public transportation by using competitiveness index indicators |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |