CN112508425A - 一种用于弹性公交系统的城市出行用户画像体系构建方法 - Google Patents

一种用于弹性公交系统的城市出行用户画像体系构建方法 Download PDF

Info

Publication number
CN112508425A
CN112508425A CN202011471127.3A CN202011471127A CN112508425A CN 112508425 A CN112508425 A CN 112508425A CN 202011471127 A CN202011471127 A CN 202011471127A CN 112508425 A CN112508425 A CN 112508425A
Authority
CN
China
Prior art keywords
bus
trip
travel
user
elastic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011471127.3A
Other languages
English (en)
Other versions
CN112508425B (zh
Inventor
张文波
张福俭
张珺玮
刘志远
陈思源
王云珊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN202011471127.3A priority Critical patent/CN112508425B/zh
Publication of CN112508425A publication Critical patent/CN112508425A/zh
Application granted granted Critical
Publication of CN112508425B publication Critical patent/CN112508425B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A30/00Adapting or protecting infrastructure or their operation
    • Y02A30/60Planning or developing urban green infrastructure

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Tourism & Hospitality (AREA)
  • Game Theory and Decision Science (AREA)
  • Educational Administration (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种用于弹性公交系统的城市出行用户画像体系构建方法,包括以下步骤:根据城市用地分类标准对13类POI数据进行重分类;利用TF‑IDF算法计算主要POI类型,赋予公交站点功能属性。基于弹性公交出行记录数据提取弹性公交OD,关联站点功能属性信息,并提取用户公交使用指标;关联用户基本属性,构建多级用户出行指标体系。基于定量的多级用户出行指标体系,进行出行指标标签化,获得用户事实标签以及模型标签。构建多级多粒度公交用户出行标签体系,即公交用户出行画像体系。建立公交用户全方位信息,分析城市居民公交出行画像,为公共交通的规划与调度提供数据基础,从而引导城市居民公交绿色出行。

Description

一种用于弹性公交系统的城市出行用户画像体系构建方法
技术领域
本发明涉及公共交通出行领域和交通大数据领域,尤其涉及一种用于弹性公交系统的城市出行用户画像体系构建方法。
背景技术
用户画像又称用户角色(Persona),是互联网营销的主要客户分类技术,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,几乎所有的互联网公司都会通过勾画目标用户,建立目标用户的全方位线索信息,进一步找出用户的兴趣点进行精准营销,利用数据挖掘寻求有用的信息和潜在的商业机会。
公共交通出行的用户画像目的和传统基于营销的用户画像目的不同,采集的技术手段也不一样。因此,需要一种针对于公共交通网络的用户画像体系构建方法。
发明内容
发明目的:本发明提出一种公共交通领域的用户画像体系构建方法,结合大数据技术、指标体系构建技术、交通工程领域知识、市场分析技术等多学科交叉知识,设计了适用于弹性公交系统的城市居民出行用户画像指标体系,解决了新兴出行方式下城市居民出行用户画像过程中定量分析和多维度指标不足的难题。
技术方案:为实现本发明的目的,本发明所采用的技术方案是:一种用于弹性公交系统的城市出行用户画像体系构建方法,包括如下步骤:
1)获取公交站点功能属性:基于城市13类POI数据,根据城市用地分类标准对所有类别POI数据进行重新分类;以公交站点为中心,对半径R米内各类POI数据,利用TF-IDF算法计算权重;赋予公交站点功能属性,单一功能区或混合功能区;
2)基于弹性公交出行记录提取公交出行OD数据:结合弹性公交出行记录数据,基于大数据预处理技术,进行原始数据信息不完整记录的剔除,并筛选出行时长,出行距离不满足阈值的出行记录,进行剔除,最终获取用户上下车时间和地点记录;
3)构建多级用户出行指标体系:基于完整弹性公交出行OD数据,匹配关联站点功能属性信息,并进行时空统计分析提取用户公交使用指标;关联用户基本信息,获取用户基本指标;
4)出行指标标签化:针对多级用户出行指标体系中的连续变量指标,进行离散处理,完成出行指标标签化,获得用户事实标签以及模型标签;
5)构建公交用户出行画像体系:基于指标分级的指标选取与体系搭建技术,分别从弹性公交用户属性、日常交通出行特征、和弹性公交使用特征三个方面,依次分解,并实现底层指标的标签化,构建多级多粒度公交用户出行标签体系,即公交用户出行画像体系。
进一步的,所述步骤1)的实施步骤为:
11)基于城市13类POI数据,根据城市用地分类标准对所有类别POI数据进行重新分类;13类POI数据包括有:餐饮服务、风景名胜、公共设施、公司企业、购物服务、科教文化服务、金融保险服务、商务住宅、生活服务、体育休闲服务、医疗保健服务、政府机构及团体、住宿服务;重新分类后6类POI数据包括:居住用地、公共管理与服务用地、公共休闲服务用地、商业服务用地、工业用地、绿地与广场用地;
12)以公交站点为中心,对半径R米内各类POI数据,利用TF-IDF算法计算权重:将一条POI数据的类型标签视为一个单词,将以站点为中心、半径R米内的单位功能区所包含的所有POI数据视为一个文档,所有站点功能区包含的POI总和视为文档库;以单位功能区内部的POI类型种类、数量为输入,执行TF-IDF算法;计算每个单位区块中各POI的TF-IDF值,用该值表示POI的综合权重;
Figure BDA0002833816990000021
Figure BDA0002833816990000022
w=TF*IDF
式中,w为权重,TF表示POI类型出现频率,IDF表示逆向出现频率,N(x)为POI类型x在某公交站点出现的次数,N为某公交站点的POI总数,A为公交站点数,A(x)为公交站点包含POI类型x的数量;
13)赋予公交站点功能属性,单一功能区或混合功能区:
当站点区域内的某一类POI占该区域所有POI的综合权重达到p%及以上,则定义该站点区域为单一功能区,其属性由综合比例最高的POI类型确定;
当站点区域内所有类型的POI的综合权重均没有达到p%,则定义该站点区域为混合功能区,其属性由综合比例前n名的POI类型确定;
当站点区域内不包含任何POI类型,则通过计算相邻单元属性来确定站点功能属性。
进一步的,所述步骤2)中的完整的弹性公交出行记录数据包括的字段有:公交卡用户唯一ID;上车时间;上车公交站点编号;下车时间;下车公交站点编号;对弹性公交出行记录数据清洗,剔除原始数据集中的信息不完整的数据。
进一步的,所述步骤3)中多级用户出行指标体系包括一级指标:用户基本指标及公交出行指标;用户基本指标包括二级指标:年龄、性别、职业、公交卡类型、是否在分析对象城市居住、收入;公交出行指标包括二级指标:站点出行频次、时间出行规律性、空间出行规律性、换乘公交比例、出行时长、出行距离、出行频率、家距离最近站点距离、弹性公交等待时间、弹性公交出行比例。
进一步的,所述站点出行频次是指各个站点出行总次数;所述时间出行规律性是指每日各个时间段是否产生出行;所述空间出行规律性是指每日各个出行链是否产生出行;所述换乘公交比例是指换乘出行总次数;所述出行时长包括平均出行时长、最长出行时长;所述出行距离包括平均出行距离、最长出行距离;所述出行频率是指每日公交出行总次数;所述弹性公交等待时间包括平均等待时间、最长等待时间;所述弹性公交出行比例是指弹性公交出行总次数。
进一步的,所述步骤4)中出行指标标签化包括:用户事实标签以及用户模型标签;
所述的用户事实标签包括:年龄、性别、职业、公交卡类型、是否在分析对象城市居住、收入水平、居住地、工作地;所述的用户模型标签包括:娱乐出行程度、工作出行程度、偏好站点、偏好区域、时间出行规律性、空间出行规律性、换乘程度、换乘站点、弹性公交等待时间、弹性公交出行比例、弹性公交偏好站点、家距离最近站点距离、最长出行时长、最长出行距离、公交使用强度、公交使用连续性。
进一步的,所述的娱乐出行程度是指用地功能属性为娱乐属性的公交站点出行程度;所述的工作出行程度是指用地功能属性为工作属性的公交站点出行程度;所述的偏好站点是指出行次数高于所有使用站点平均水平的公交站点;所述的偏好区域是指出行次数高于所有到达交通小区平均水平的城市交通小区;
所述的时间出行规律性:根据每日各个时间段是否产生出行;所述空间出行规律性:根据每日各个出行链是否产生出行;所述的换乘程度:根据换乘总次数占出行总次数的比例;所述的换乘站点:换乘次数高于所有站点平均水平的公交站点;所述的弹性公交等待时间:根据平均弹性公交等待时间;所述的弹性公交出行比例:根据弹性公交出行次数占出行总次数的比例;
所述的弹性公交偏好站点:弹性公交出行高于所有站点平均水平的公交站点;所述的家距离最近站点距离:根据家距离最近站点距离;所述的最长出行时长:根据最长公交出行记录所消耗时长;最长出行距离:根据最长公交出行记录所行驶距离;公交使用强度:每日平均乘车次数;公交使用连续性:历史连续乘车天数平均值。
进一步的,所述步骤5)中的多级多粒度公交用户出行标签体系,即公交用户出行画像体系包括一级标签:用户基本信息、出行行为信息、公交使用信息;
51)用户基本信息中包括二级标签:基础标签及位置标签;二级基础标签包括三级标签:年龄、性别、职业、公交卡类型、是否在分析对象城市居住、收入水平;二级位置标签包括三级标签:居住地、工作地;
52)出行行为信息中包括二级标签:出行习惯、偏好出行、出行规律性;二级出行习惯包括三级标签:娱乐出行程度、工作出行程度;二级偏好出行包括三级标签:偏好站点、偏好区域;二级出行规律性包括三级标签:时间出行规律性、空间出行规律性;
53)公交使用信息中包括二级标签:换乘特性、弹性公交、公交便利度、公交容忍度、公交依赖度:二级换乘特性包括三级标签:换乘程度、换乘站点;二级弹性公交包括三级标签:弹性公交等待时间、弹性公交出行比例、弹性公交偏好站点;二级公交便利度包括三级标签:家距离最近站点距离;二级公交容忍度包括三级标签:最长出行时长、最长出行距离;二级公交依赖度包括三级标签:公交使用强度、公交使用连续性。
有益效果:与现有技术相比,本发明的技术方案具有以下有益的技术效果:
本发明的用于公交网络的城市居民出行画像体系构建方法,弥补了用户画像中公共交通用户出行画像的研究空白。同时,本发明用于公交网络的城市居民出行画像体系构建方法是公共交通领域用于非集计用户个体出行特征的创新性应用,同时是用户画像在公交需求管理中的重要应用。
附图说明
图1是本发明的方法流程示意图;
图2是本发明的POI数据分类示意图。
具体实施方式
下面结合附图和实施例对本发明的技术方案作进一步的说明。
本发明所述的用于弹性公交系统的城市出行用户画像体系构建方法,流程如图1所示,具体实现包括以下步骤:
1)获取公交站点功能属性:基于城市13类POI数据,根据城市用地分类标准对所有类别POI数据进行重新分类;以公交站点为中心,对半径500米内各类POI数据,利用TF-IDF算法计算权重;赋予公交站点功能属性,单一功能区或混合功能区。
11)基于城市13类POI数据,根据城市用地分类标准对所有类别POI数据进行重新分类;13类POI数据包括有:餐饮服务、风景名胜、公共设施、公司企业、购物服务、科教文化服务、金融保险服务、商务住宅、生活服务、体育休闲服务、医疗保健服务、政府机构及团体、住宿服务;重新分类后6类POI数据包括:居住用地、公共管理与服务用地、公共休闲服务用地、商业服务用地、工业用地、绿地与广场用地;
12)以公交站点为中心,对半径500米内各类POI数据,利用TF-IDF算法计算权重:将一条POI数据的类型标签视为一个单词,将以站点为中心、半径500米内的单位功能区所包含的所有POI数据视为一个文档,所有站点功能区包含的POI总和视为文档库;以单位功能区内部的POI类型种类、数量为输入,执行TF-IDF算法;计算每个单位区块中各POI的TF-IDF值,用该值表示POI的综合权重;
Figure BDA0002833816990000041
Figure BDA0002833816990000042
w=TF*IDF
式中,w为权重,TF表示POI类型出现频率,IDF表示逆向出现频率,N(x)为POI类型x在某公交站点出现的次数,N为某公交站点的POI总数,A为公交站点数,A(x)为公交站点包含POI类型x的数量;
13)赋予公交站点功能属性,单一功能区或混合功能区:
当站点区域内的某一类POI占该区域所有POI的综合权重达到50%及以上,则定义该站点区域为单一功能区,其属性由综合比例最高的POI类型确定;
当站点区域内所有类型的POI的综合权重均没有达到50%,则定义该站点区域为混合功能区,其属性由综合比例前2名的POI类型确定;
当站点区域内不包含任何POI类型,则通过计算相邻单元属性来确定站点功能属性。
2)基于弹性公交出行记录提取公交出行OD数据:结合弹性公交出行记录数据,基于大数据预处理技术,进行原始数据信息不完整记录的剔除,并筛选出行时长,出行距离不满足阈值的不合理出行记录,进行剔除,最终获取用户上下车时间和地点记录。
完整的弹性公交出行记录数据包括的字段有:公交卡用户唯一ID;上车时间;上车公交站点编号;下车时间;下车公交站点编号;对弹性公交出行记录数据清洗,剔除原始数据集中的信息不完整的数据。不合理出行记录指的是记录到的出行时长,出行距离不合理,包括以下几类:时长小于2分钟,大于1小时;距离小于1公里,大于30公里;距离时间比值大于60公里/小时,小于5公里/小时。
3)构建多级用户出行指标体系:基于完整弹性公交出行OD数据,匹配关联站点功能属性信息,并进行时空统计分析提取用户公交使用指标;关联用户基本信息,获取用户基本指标。
所述的多级用户出行指标体系包括一级指标:用户基本指标及公交出行指标;用户基本指标包括二级指标:年龄、性别、职业、公交卡类型、是否在分析对象城市居住、收入;公交出行指标包括二级指标:站点出行频次、时间出行规律性、空间出行规律性、换乘公交比例、出行时长、出行距离、出行频率、家距离最近站点距离、弹性公交等待时间、弹性公交出行比例。
所述站点出行频次是指各个站点出行总次数;所述时间出行规律性是指每日各个时间段是否产生出行;所述空间出行规律性是指每日各个出行链是否产生出行;所述换乘公交比例是指换乘出行总次数;所述出行时长包括平均出行时长、最长出行时长;所述出行距离包括平均出行距离、最长出行距离;所述出行频率是指每日公交出行总次数;所述弹性公交等待时间包括平均等待时间、最长等待时间;所述弹性公交出行比例是指弹性公交出行总次数。
4)出行指标标签化:针对多级用户出行指标体系中的连续变量指标,进行离散处理,完成出行指标标签化,获得用户事实标签以及模型标签。
所述的用户事实标签包括:年龄、性别、职业、公交卡类型、是否在分析对象城市居住、收入水平、居住地、工作地;所述的用户模型标签包括:娱乐出行程度、工作出行程度、偏好站点、偏好区域、时间出行规律性、空间出行规律性、换乘程度、换乘站点、弹性公交等待时间、弹性公交出行比例、弹性公交偏好站点、家距离最近站点距离、最长出行时长、最长出行距离、公交使用强度、公交使用连续性。
所述的娱乐出行程度是指用地功能属性为娱乐属性的公交站点出行程度;所述的工作出行程度是指用地功能属性为工作属性的公交站点出行程度;所述的偏好站点是指出行次数高于所有使用站点平均水平的公交站点;所述的偏好区域是指出行次数高于所有到达交通小区平均水平的城市交通小区;所述的时间出行规律性:根据每日各个时间段是否产生出行;所述空间出行规律性:根据每日各个出行链是否产生出行;所述的换乘程度:根据换乘总次数占出行总次数的比例;所述的换乘站点:换乘次数高于所有站点平均水平的公交站点;所述的弹性公交等待时间:根据平均弹性公交等待时间;所述的弹性公交出行比例:根据弹性公交出行次数占出行总次数的比例;所述的弹性公交偏好站点:弹性公交出行高于所有站点平均水平的公交站点;所述的家距离最近站点距离:根据家距离最近站点距离;所述的最长出行时长:根据最长公交出行记录所消耗时长;最长出行距离:根据最长公交出行记录所行驶距离;公交使用强度:每日平均乘车次数;公交使用连续性:历史连续乘车天数平均值。
5)构建公交用户出行画像体系:基于指标分级的指标选取与体系搭建技术,分别从弹性公交用户属性、日常交通出行特征、和弹性公交使用特征三个方面,依次分解,并实现底层指标的标签化,构建多级多粒度公交用户出行标签体系,即公交用户出行画像体系,包括一级标签:用户基本信息、出行行为信息、公交使用信息。
51)用户基本信息中包括二级标签:基础标签及位置标签;二级基础标签包括三级标签:年龄、性别、职业、公交卡类型、是否在分析对象城市居住、收入水平;二级位置标签包括三级标签:居住地、工作地;
52)出行行为信息中包括二级标签:出行习惯、偏好出行、出行规律性;二级出行习惯包括三级标签:娱乐出行程度、工作出行程度;二级偏好出行包括三级标签:偏好站点、偏好区域;二级出行规律性包括三级标签:时间出行规律性、空间出行规律性;
53)公交使用信息中包括二级标签:换乘特性、弹性公交、公交便利度、公交容忍度、公交依赖度:二级换乘特性包括三级标签:换乘程度、换乘站点;二级弹性公交包括三级标签:弹性公交等待时间、弹性公交出行比例、弹性公交偏好站点;二级公交便利度包括三级标签:家距离最近站点距离;二级公交容忍度包括三级标签:最长出行时长、最长出行距离;二级公交依赖度包括三级标签:公交使用强度、公交使用连续性。本发明的公交用户出行指标体系,如表1所示。
表1
Figure BDA0002833816990000071
本发明的公交用户出行画像体系,如表2所示。
表2
Figure BDA0002833816990000072
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。

Claims (8)

1.一种用于弹性公交系统的城市出行用户画像体系构建方法,其特征在于,该方法包括以下步骤:
1)获取公交站点功能属性:基于城市13类POI数据,根据城市用地分类标准对所有类别POI数据进行重新分类;以公交站点为中心,对半径R米内各类POI数据,利用TF-IDF算法计算权重;赋予公交站点功能属性,单一功能区或混合功能区;
2)基于弹性公交出行记录提取公交出行OD数据:结合弹性公交出行记录数据,基于大数据预处理技术,进行原始数据信息不完整记录的剔除,并筛选出行时长,出行距离不满足阈值的出行记录,进行剔除,最终获取用户上下车时间和地点记录;
3)构建多级用户出行指标体系:基于完整弹性公交出行OD数据,匹配关联站点功能属性信息,并进行时空统计分析提取用户公交使用指标;关联用户基本信息,获取用户基本指标;
4)出行指标标签化:针对多级用户出行指标体系中的连续变量指标,进行离散处理,完成出行指标标签化,获得用户事实标签以及模型标签;
5)构建公交用户出行画像体系:基于指标分级的指标选取与体系搭建技术,分别从弹性公交用户属性、日常交通出行特征、和弹性公交使用特征三个方面,依次分解,并实现底层指标的标签化,构建多级多粒度公交用户出行标签体系,即公交用户出行画像体系。
2.根据权利要求1所述的用于弹性公交系统的城市出行用户画像体系构建方法,其特征在于,所述步骤1)的实施步骤为:
11)基于城市13类POI数据,根据城市用地分类标准对所有类别POI数据进行重新分类;13类POI数据包括有:餐饮服务、风景名胜、公共设施、公司企业、购物服务、科教文化服务、金融保险服务、商务住宅、生活服务、体育休闲服务、医疗保健服务、政府机构及团体、住宿服务;重新分类后6类POI数据包括:居住用地、公共管理与服务用地、公共休闲服务用地、商业服务用地、工业用地、绿地与广场用地;
12)以公交站点为中心,对半径R米内各类POI数据,利用TF-IDF算法计算权重:将一条POI数据的类型标签视为一个单词,将以站点为中心、半径R米内的单位功能区所包含的所有POI数据视为一个文档,所有站点功能区包含的POI总和视为文档库;以单位功能区内部的POI类型种类、数量为输入,执行TF-IDF算法;计算每个单位区块中各POI的TF-IDF值,用该值表示POI的综合权重;
Figure FDA0002833816980000011
Figure FDA0002833816980000012
w=TF*IDF
式中,w为权重,TF表示POI类型出现频率,IDF表示逆向出现频率,N(x)为POI类型x在某公交站点出现的次数,N为某公交站点的POI总数,A为公交站点数,A(x)为公交站点包含POI类型x的数量;
13)赋予公交站点功能属性,单一功能区或混合功能区:
当站点区域内的某一类POI占该区域所有POI的综合权重达到p%及以上,则定义该站点区域为单一功能区,其属性由综合比例最高的POI类型确定;
当站点区域内所有类型的POI的综合权重均没有达到p%,则定义该站点区域为混合功能区,其属性由综合比例前n名的POI类型确定;
当站点区域内不包含任何POI类型,则通过计算相邻单元属性来确定站点功能属性。
3.根据权利要求1所述的用于弹性公交系统的城市出行用户画像体系构建方法,其特征在于,所述步骤2)中的完整的弹性公交出行记录数据包括的字段有:公交卡用户唯一ID;上车时间;上车公交站点编号;下车时间;下车公交站点编号;对弹性公交出行记录数据清洗,剔除原始数据集中的信息不完整的数据。
4.根据权利要求1所述的用于弹性公交系统的城市出行用户画像体系构建方法,其特征在于,所述步骤3)中多级用户出行指标体系包括一级指标:用户基本指标及公交出行指标;用户基本指标包括二级指标:年龄、性别、职业、公交卡类型、是否在分析对象城市居住、收入;公交出行指标包括二级指标:站点出行频次、时间出行规律性、空间出行规律性、换乘公交比例、出行时长、出行距离、出行频率、家距离最近站点距离、弹性公交等待时间、弹性公交出行比例。
5.根据权利要求4所述的用于弹性公交系统的城市出行用户画像体系构建方法,其特征在于,所述站点出行频次是指各个站点出行总次数;所述时间出行规律性是指每日各个时间段是否产生出行;所述空间出行规律性是指每日各个出行链是否产生出行;所述换乘公交比例是指换乘出行总次数;所述出行时长包括平均出行时长、最长出行时长;所述出行距离包括平均出行距离、最长出行距离;所述出行频率是指每日公交出行总次数;所述弹性公交等待时间包括平均等待时间、最长等待时间;所述弹性公交出行比例是指弹性公交出行总次数。
6.根据权利要求1所述的用于弹性公交系统的城市出行用户画像体系构建方法,其特征在于,所述步骤4)中出行指标标签化包括:用户事实标签以及用户模型标签;
所述的用户事实标签包括:年龄、性别、职业、公交卡类型、是否在分析对象城市居住、收入水平、居住地、工作地;所述的用户模型标签包括:娱乐出行程度、工作出行程度、偏好站点、偏好区域、时间出行规律性、空间出行规律性、换乘程度、换乘站点、弹性公交等待时间、弹性公交出行比例、弹性公交偏好站点、家距离最近站点距离、最长出行时长、最长出行距离、公交使用强度、公交使用连续性。
7.根据权利要求6所述的用于弹性公交系统的城市出行用户画像体系构建方法,其特征在于,所述的娱乐出行程度是指用地功能属性为娱乐属性的公交站点出行程度;所述的工作出行程度是指用地功能属性为工作属性的公交站点出行程度;所述的偏好站点是指出行次数高于所有使用站点平均水平的公交站点;所述的偏好区域是指出行次数高于所有到达交通小区平均水平的城市交通小区;
所述的时间出行规律性:根据每日各个时间段是否产生出行;所述空间出行规律性:根据每日各个出行链是否产生出行;所述的换乘程度:根据换乘总次数占出行总次数的比例;所述的换乘站点:换乘次数高于所有站点平均水平的公交站点;所述的弹性公交等待时间:根据平均弹性公交等待时间;所述的弹性公交出行比例:根据弹性公交出行次数占出行总次数的比例;
所述的弹性公交偏好站点:弹性公交出行高于所有站点平均水平的公交站点;所述的家距离最近站点距离:根据家距离最近站点距离;所述的最长出行时长:根据最长公交出行记录所消耗时长;最长出行距离:根据最长公交出行记录所行驶距离;公交使用强度:每日平均乘车次数;公交使用连续性:历史连续乘车天数平均值。
8.根据权利要求1所述的用于弹性公交系统的城市出行用户画像体系构建方法,其特征在于,所述步骤5)中的多级多粒度公交用户出行标签体系,即公交用户出行画像体系包括一级标签:用户基本信息、出行行为信息、公交使用信息;
51)用户基本信息中包括二级标签:基础标签及位置标签;二级基础标签包括三级标签:年龄、性别、职业、公交卡类型、是否在分析对象城市居住、收入水平;二级位置标签包括三级标签:居住地、工作地;
52)出行行为信息中包括二级标签:出行习惯、偏好出行、出行规律性;二级出行习惯包括三级标签:娱乐出行程度、工作出行程度;二级偏好出行包括三级标签:偏好站点、偏好区域;二级出行规律性包括三级标签:时间出行规律性、空间出行规律性;
53)公交使用信息中包括二级标签:换乘特性、弹性公交、公交便利度、公交容忍度、公交依赖度:二级换乘特性包括三级标签:换乘程度、换乘站点;二级弹性公交包括三级标签:弹性公交等待时间、弹性公交出行比例、弹性公交偏好站点;二级公交便利度包括三级标签:家距离最近站点距离;二级公交容忍度包括三级标签:最长出行时长、最长出行距离;二级公交依赖度包括三级标签:公交使用强度、公交使用连续性。
CN202011471127.3A 2020-12-14 2020-12-14 一种用于弹性公交系统的城市出行用户画像体系构建方法 Active CN112508425B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011471127.3A CN112508425B (zh) 2020-12-14 2020-12-14 一种用于弹性公交系统的城市出行用户画像体系构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011471127.3A CN112508425B (zh) 2020-12-14 2020-12-14 一种用于弹性公交系统的城市出行用户画像体系构建方法

Publications (2)

Publication Number Publication Date
CN112508425A true CN112508425A (zh) 2021-03-16
CN112508425B CN112508425B (zh) 2024-03-15

Family

ID=74973123

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011471127.3A Active CN112508425B (zh) 2020-12-14 2020-12-14 一种用于弹性公交系统的城市出行用户画像体系构建方法

Country Status (1)

Country Link
CN (1) CN112508425B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112800210A (zh) * 2021-04-06 2021-05-14 湖南师范大学 基于海量公交数据的人群画像算法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105206048A (zh) * 2015-11-05 2015-12-30 北京航空航天大学 一种基于交通od数据的城市居民群体换乘模式发现系统及方法
CN111612549A (zh) * 2020-05-28 2020-09-01 中认英泰检测技术有限公司 一种平台运营服务系统的构建方法
CN111898793A (zh) * 2020-06-08 2020-11-06 东南大学 一种组合出行方式下考虑用户感知差异性的路径选择方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105206048A (zh) * 2015-11-05 2015-12-30 北京航空航天大学 一种基于交通od数据的城市居民群体换乘模式发现系统及方法
CN111612549A (zh) * 2020-05-28 2020-09-01 中认英泰检测技术有限公司 一种平台运营服务系统的构建方法
CN111898793A (zh) * 2020-06-08 2020-11-06 东南大学 一种组合出行方式下考虑用户感知差异性的路径选择方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112800210A (zh) * 2021-04-06 2021-05-14 湖南师范大学 基于海量公交数据的人群画像算法

Also Published As

Publication number Publication date
CN112508425B (zh) 2024-03-15

Similar Documents

Publication Publication Date Title
Vanoutrive et al. What determines carpooling to workplaces in Belgium: location, organisation, or promotion?
Narayanan et al. Electric cargo cycles-A comprehensive review
Li et al. Exploring the causal relationship between bicycle choice and trip chain pattern
Cheng et al. Travel behavior of the urban low-income in China: case study of Huzhou City
Schiebel et al. Border effects on the travel mode choice of resident and crossborder workers in Luxembourg
Tang et al. Identification and interpretation of spatial–temporal mismatch between taxi demand and supply using global positioning system data
Tushara et al. Mode choice modelling for work trips in Calicut City
Qiao et al. Is ride-hailing competing or complementing public transport? A perspective from affordability
Lila et al. Modeling the Choice of Tele-work and its Effects on Travel Behaviour in Indian context
Kowald et al. Determinants of mobility resource ownership in Switzerland: changes between 2000 and 2010
Ji et al. Research on classification and influencing factors of metro commuting patterns by combining smart card data and household travel survey data
Guo et al. Exploring potential travel demand of customized bus using smartcard data
McBride et al. Sequence analysis of place-travel fragmentation in California
CN112508425A (zh) 一种用于弹性公交系统的城市出行用户画像体系构建方法
Sala et al. Generating demand responsive bus routes from social network data analysis
Vanoutrive et al. Rail commuting to workplaces in Belgium: a multilevel approach
US20230245007A1 (en) User segmentation method based on toll data of expressway electronic toll collection
Rasaizadi et al. Machine learning approach versus probabilistic approach to model the departure time of non-mandatory trips
CN116662860A (zh) 一种基于能源大数据的用户画像与分类方法
Yi et al. Rural tourism demand: Duration modeling for drive tourists’ length of stay in rural areas of the United States
Kim et al. A comparative study of aggregate and disaggregate gravity models using Seoul metropolitan subway trip data
Vanoutrive The Modal Split of Cities: A Workplace‐Based Mixed Modelling Perspective
Sinniah et al. The framework for assessing public transportation by using competitiveness index indicators
Ehreke et al. Greening Household Behaviour and Transport
Yue et al. Classification and determinants of high-speed rail stations using multi-source data: A case study in Jiangsu Province, China

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant