CN110457299B - 基于共享单车骑行数据的站点影响范围确定方法和装置 - Google Patents

基于共享单车骑行数据的站点影响范围确定方法和装置 Download PDF

Info

Publication number
CN110457299B
CN110457299B CN201910629867.6A CN201910629867A CN110457299B CN 110457299 B CN110457299 B CN 110457299B CN 201910629867 A CN201910629867 A CN 201910629867A CN 110457299 B CN110457299 B CN 110457299B
Authority
CN
China
Prior art keywords
riding
station
data
shared bicycle
distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910629867.6A
Other languages
English (en)
Other versions
CN110457299A (zh
Inventor
王书灵
苗建瑞
蒋熙
万峰
王宜堂
张旭
王璐瑶
胡坤堒
张若惠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jiaotong University
Original Assignee
Beijing Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jiaotong University filed Critical Beijing Jiaotong University
Priority to CN201910629867.6A priority Critical patent/CN110457299B/zh
Publication of CN110457299A publication Critical patent/CN110457299A/zh
Application granted granted Critical
Publication of CN110457299B publication Critical patent/CN110457299B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0645Rental transactions; Leasing transactions

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Finance (AREA)
  • Computational Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Development Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Strategic Management (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Biology (AREA)
  • Quality & Reliability (AREA)
  • Economics (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Business, Economics & Management (AREA)
  • Algebra (AREA)
  • Marketing (AREA)
  • Software Systems (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明实施例提供了一种基于共享单车骑行数据的站点影响范围确定方法和装置,通过经分析处理得到的站点骑行数据集,确定站点合理影响范围最大半径与其范围内骑行数量,进一步通过分析计算确定站点实际影响范围。本发明提供的站点影响范围确定方法从数据驱动角度确定站点的实际影响范围,实用性高且具有普适性,为轨道客流组织及客流预测等方面的研究奠定基础。

Description

基于共享单车骑行数据的站点影响范围确定方法和装置
技术领域
本发明实施例涉及城市交通控制技术领域,具体涉及一种基于共享单车骑行数据的站点影响范围确定方法和装置。
背景技术
随着城市交通的快速发展,共享单车的出现对解决城市交通问题提供了很大帮助,共享单车数据的应用也越来越广泛。另一方面,轨道交通因其运量大、速度快、班次密、安全舒适等特点,在城市交通中发挥的作用也越来越明显,也是备受出行者青睐的交通方式之一。为适应出行者特点,以及应对日益复杂的客流组织工作,如何对共享单车数据进行清洗,并据此确定站点合理的影响范围成为值得探究的问题。
现有的站点影响范围确定方法,通常根据经验简单选择一个确定的数值,这种方法与实际情况割裂,打破了各交通方式间的联系;亦或通过交通调查,根据调查数据进行分析确定,这种方法耗费大量人力物力,且结果与问卷质量直接相关,偶然因素影响不可控。
发明内容
本发明的实施例提供了一种基于共享单车骑行数据的站点影响范围确定方法和装置,用以解决现有技术中存在的相应问题。
为了实现上述目的,本发明采取了如下技术方案。
本发明提供的一种基于共享单车骑行数据的站点影响范围确定方法,包括:
S1对站点出入口范围内的共享单车骑行数据进行处理,获取站点的骑行数据集;
S2基于站点的骑行数据集,分析每个站点骑行数量随骑行距离的变化规律,根据该变化规律确定站点合理影响范围半径的最大值;
S3根据站点合理影响最大半径范围内的骑行数量确定站点的实际影响范围。
优选地,步骤S1中,站点出入口范围内的共享单车骑行数据包括多组共享单车数据样本和站点出入口数据样本;
共享单车数据样本包括:交易编号、开锁经纬度、关锁经纬度、开锁时刻、关锁时刻,以及,骑行时长和/或骑行距离;
站点出入口数据样本包括:站点名称、出入口名称和出入口经纬度。
优选地,步骤S1包括如下子步骤:
S1.1选取关锁点在站点出入口范围内的共享单车数据样本;
S1.2计算每组共享单车数据样本的平均骑行速度数据;
S1.3对该多个平均骑行速度数据进行辨识,获得平均骑行速度数据在设定速度范围内的若干个有效共享单车数据样本;
S1.4将该有效共享单车数据样本与站点出入口数据样本进行合并,获得站点骑行数据集。
优选地,步骤S1.2中的平均骑行速度数据由如下任一一种方式获得:
当共享单车数据样本包括交易编号、开锁经纬度、关锁经纬度、开锁时刻、关锁时刻、骑行时长、骑行距离时,平均骑行速度数据由计算公式
Figure BDA0002128376570000021
获得,其中di为骑行距离,ti为骑行时长;
当共享单车数据样本缺失骑行距离时,平均骑行速度数据由计算公式
Figure BDA0002128376570000022
获得,其中,Mj为开锁经纬度与站点出入口之间的曼哈顿距离值,tj为骑行时长;
当共享单车数据样本缺失骑行时长时,平均骑行速度数据由计算公式
Figure BDA0002128376570000023
获得,其中,dk为骑行距离,τk为开关锁间隔,其由开锁时刻、关锁时刻计算获得。
优选地,当开锁经纬度、关锁经纬度、出入口经纬度为WGS-84坐标系,将开锁经纬度、关锁经纬度、出入口经纬度的坐标值转换成欧式距离值D和/或曼哈顿距离值M,
欧式距离值D的计算公式为:
f(Lng1,Lat1,Lng2,Lat2)=D;
曼哈顿距离值M的计算公式为:g(Lng1,Lat1,Lng2,Lat2)=M;
其中,Lng1,Lat1,Lng2,Lat2分别为轨道出入口经纬度、开锁经纬度或关锁经纬度,f,g为转换函数,D为欧式距离值,M为曼哈顿距离值。
优选地,步骤S2包括如下子步骤:
S2.1将站点骑行数据集中的骑行距离离散化,通过统计获得各个骑行距离内的骑行数量;
S2.2将骑行数量与骑行距离之间的变化规律以函数式ψ(d)=n的形式输出,其中,n为累计骑行数量,d为骑行距离,ψ为转换函数;
S2.3求解函数式ψ(d)=n,获得站点合理影响范围半径的最大值。
优选地,步骤S2.1还包括如下子步骤:
S2.1.1以站点为中心向外辐射若干次;
S2.1.2在辐射距离内设置若干间隔;
S2.1.3统计每道辐射距离内每个间隔的共享单车开锁点数量,获得骑行距离内的骑行数量。
优选地,步骤S3包括如下子步骤:
S3.1分析站点骑行数据集与站点合理影响最大半径范围之间的关系,获得站点合理影响最大半径范围内的共享单车骑行点;
S3.2通过对该共享单车骑行点进行几何运算,获得站点实际影响范围,并以多边形的形式输出。
第二方面,本发明提供一种基于共享单车骑行数据的站点影响范围确定装置,包括:
骑行数据集采集处理模块:用于对站点出入口范围内的共享单车骑行数据进行处理,获取站点骑行数据集;
数据分析建模模块:用于根据站点骑行数据集,分析每个站点骑行数量随骑行距离的变化,根据该变化的规律确定站点合理影响范围半径的最大值;
图表计算输出模块:根据站点合理影响最大半径范围内的骑行数量确定站点实际影响范围。
优选地,
骑行数据集采集处理模块,具体用于选取关锁点在站点出入口范围内的共享单车数据样本;
计算每组共享单车数据样本的平均骑行速度数据,对该多个平均骑行速度数据进行辨识,获得平均骑行速度数据在设定速度范围内的若干个有效共享单车数据样本;
将该有效共享单车数据样本与站点出入口数据样本进行合并,获得站点骑行数据集。
优选地,
数据分析建模模块,具体用于将站点骑行数据集中的骑行距离离散化,通过统计获得各个骑行距离内的骑行数量;
将骑行数量与骑行距离之间的变化规律以函数式ψ(d)=n的形式输出,其中,n为累计骑行数量,d为骑行距离,ψ为转换函数;
求解函数式ψ(d)=n,获得站点合理影响范围半径的最大值。
优选地,
图表计算输出模块,具体用于分析站点骑行数据集与站点合理影响最大半径范围之间的关系,获得站点合理影响最大半径范围内的共享单车骑行点;
通过对该共享单车骑行点进行几何运算,获得站点实际影响范围,并以多边形的形式输出。
由上述本发明的实施例提供的技术方案可以看出,本发明实施例提供的一种基于共享单车骑行数据的站点影响范围确定方法和装置,通过经分析处理得到的站点骑行数据集,确定站点合理影响范围最大半径与其范围内骑行数量,进一步通过分析计算确定站点实际影响范围。本发明提供的站点影响范围确定方法从数据驱动角度确定站点的实际影响范围,实用性高且具有普适性,为轨道客流组织及客流预测等方面的研究奠定基础。
另一方面,在本发明提供的方法中,还对共享单车数据进行清洗,提高了共享单车数据质量和可用性。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的基于共享单车骑行数据的站点影响范围确定方法的处理流程图;
图2为本发明提供的基于共享单车骑行数据的站点影响范围确定方法的共享单车骑行数据预处理的流程图;
图3为本发明提供的基于共享单车骑行数据的站点影响范围确定方法的骑行数量与骑行距离之间变化规律图;
图4为通过本发明提供的基于共享单车骑行数据的站点影响范围确定方法分析计算输出得到的站点实际影响范围图;
图5为本发明提供的基于共享单车骑行数据的站点影响范围确定装置的系统结构框图。
图中:51.骑行数据集采集处理模块52.数据分析建模模块53.图表计算输出模块。
具体实施方式
下面详细描述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
为便于对本发明实施例的理解,下面将结合附图以几个具体实施例为例做进一步的解释说明,且各个实施例并不构成对本发明实施例的限定。
参见图1,本发明提供的一种基于共享单车骑行数据的站点影响范围确定方法,其包括如下步骤:
S1对站点出入口范围内的共享单车骑行数据进行处理,获取站点的骑行数据集;上述站点可以为城市轨道交通站点。
S2基于所述站点的骑行数据集,分析每个所述站点骑行数量随骑行距离的变化规律,根据该变化规律确定站点合理影响范围半径的最大值;
S3根据站点合理影响最大半径范围内的骑行数量确定站点实际影响范围。
其中,面向站点出入口层面的共享单车骑行数据包括多组共享单车数据样本和站点出入口数据样本;
每组共享单车数据样本包括了交易编号,每个交易编号代表一单骑行交易,通过该单骑行交易信息可以获得如下相关联的数据:开锁经纬度、关锁经纬度、开锁时刻、关锁时刻,以及,骑行时长和/或骑行距离;
站点出入口数据样本包括:站点名称、出入口名称和出入口经纬度。
基于上述数据样本,作为本发明的优选实施例,用于获取站点骑行数据集方式包括如下子步骤:
S1.1选取关锁点在站点出入口范围内的所述共享单车数据样本;
S1.2计算每组共享单车数据样本的平均骑行速度数据;
S1.3对该多个平均骑行速度数据进行辨识,获得若干个有效共享单车数据样本;
S1.4将该有效共享单车数据样本与所述站点出入口数据样本进行合并,获得站点骑行数据集。
其中,站点出入口范围应当被理解为站点出入口与共享单车的合理接驳距离,即骑行者从关锁点到轨道出入口能够接受的最大步行距离,其可以由本领域技术人员根据实际情况适当设置。
在获得平均骑行速度数据的优选实施例中,如图2所示,其可以包括如下几种实施方式;
方式一:
当所述共享单车数据样本内数据比较完整,即包括交易编号、开锁经纬度、关锁经纬度、开锁时刻、关锁时刻、骑行时长、骑行距离时,所述平均骑行速度数据由计算式
Figure BDA0002128376570000061
获得,其中di为所述骑行距离,ti为所述骑行时长;
方式二:
当所述共享单车数据样本缺失所述骑行距离时,所述平均骑行速度数据由计算式
Figure BDA0002128376570000071
获得,其中,Mj为开锁经纬度与站点出入口之间的曼哈顿距离值,tj为所述骑行时长;
方式三:
当所述共享单车数据样本缺失所述骑行时长时,所述平均骑行速度数据由计算式
Figure BDA0002128376570000072
获得,其中,dk为所述骑行距离,τk为开关锁间隔,其由所述开锁时刻、关锁时刻计算获得;
上述实施方式可以根据多组共享单车交易单内数据组成情况需要任选一种多次实施;
本领域技术人员应能理解上述平均骑行速度的计算方法仅为举例,其他现有的或今后可能出现的平均骑行速度的计算方法如可适用于本发明实施例,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
对经过计算获得的平均骑行速度数据进行辨识的方式为,判断平均骑行速度值是否在合理范围内,该合理范围的选取因素包括目前共享单车设计时速、道路路况、骑行者身体状况等,也可以通过一些运动计步类应用程序监测的记录进行统计获得;例如该合理范围可以设定为10~30km/h,该具体数值不够成对本发明的限制;
当计算获得的平均骑行速度数据位于合理范围内,则其为有效共享单车数据样本,并将该样本录入骑行数据集中;当执行上述多种计算平均骑行速度的实施方式时,其可以先进行计算,然后统一进行辨识、录入,也可以分别同时进行计算、辨识、录入的作业;通过对平均骑行速度数据的辨识,能够有效增加站点骑行数据集的可靠度。
需要注意的是,步骤1.4中,一个站点往往有多个出入口,上述数据处理是针对每个出入口的,因此在合并数据集时应该取交集,即站点的骑行数据集中不存在重复统计的数据记录。
此外,还应当理解的是,如果骑行距离和骑行时长均缺失,则该项数据样不予采用。
为了便于地理位置及距离值的运算,在一些优选的实施例中,开锁经纬度、关锁经纬度、出入口经纬度坐标值采用目前常用卫星导航坐标系,例如可以采用目前广泛使用的GPS框架下的WGS-84坐标系;基于WGS-84坐标系的经纬度坐标值,在本实施例中,还具有将上述经纬度坐标值转换成欧式距离值和/或曼哈顿距离值的过程,
欧式距离值D的计算公式为:
f(Lng1,Lat1,Lng2,Lat2)=D;
曼哈顿距离值M的计算公式为:g(Lng1,Lat1,Lng2,Lat2)=M;
其中,Lng1,Lat1,Lng2,Lat2分别为轨道出入口经纬度、开锁经纬度或关锁经纬度,f,g为转换函数,其可以通过一些编程软件获得,D为欧式距离值,M为曼哈顿距离值;上述子步骤在步骤1.1之后、步骤1.2之前予以执行。
作为步骤S2的进一步实施例,其包括如下子步骤:
S2.1将所述站点骑行数据集中的所述骑行距离离散化,通过统计获得骑行距离内的骑行数量;
S2.2将骑行数量与骑行距离之间的变化规律以函数式ψ(d)=n的形式输出,其中,n为累计骑行数量,d为骑行距离,ψ为转换函数;
S2.3求解函数式ψ(d)=n,获得站点合理影响范围半径的最大值;
其中,在步骤S2.1中,骑行距离离散化具体为包括如下子步骤:
S2.1.1以站点为中心向外沿圆周周向或实际道路分布方向辐射若干次;
S2.1.2在辐射距离内设置若干间隔;该间隔可以根据实际需要设定,例如50m,其本身不构成对本发明的限制;
S2.1.3统计每道辐射距离内每个间隔的共享单车开锁点数量,获得骑行距离内的骑行数量;
在步骤2.2中,于输出函数式之前还可以先通过图表的方式直观地得出骑行数量与骑行距离之间的变化规律,例如采用图3这种柱状图与函数曲线图相结合的形式,可以看出,随着骑行距离的增加骑行数量有明显上升,而当骑行距离继续增加时,骑行数量有明显下降;进一步以累计骑行数量(截止到某个骑行距离点时的总骑行数量)为因变量,构造出其与骑行距离之间的函数关系,即ψ(d)=n;
通过求解该函数式,并通过曲线图的形式输出后(图3)可以看出,该曲线呈现“S”型,因此其有两个斜率变化最大的点,在该两点中取横坐标较大值d2即为站点合理影响范围半径的最大值。
作为步骤S3的进一步实施例,其包括如下子步骤:
S3.1分析所述站点骑行数据集与站点合理影响最大半径范围之间的关系,获得站点合理影响最大半径范围内的共享单车骑行点,即共享单车开锁点;
S3.2通过对该共享单车骑行点进行几何运算,获得所述站点实际影响范围,并以多边形的形式输出;例如图4所示的,侧边数量较多的半球一侧共享单车开锁点数量较多,则该侧半球方向即为站点实际影响范围。
在本发明提供的实施例中,数据的输入、处理以及相关计算式的导入、求解可以借助现有技术中的应用软件完成,例如在一种优选的实施例中,借助ArcGIS地理处理工具以及Python或MATLAB完成相应的工作;作为一个示例性的工作流程,其为:
选取一个站点,获取该站点推测影响范围内的共享单车数据样本,并将其联通该站点的出入口数据样本一起输入ArcGIS10.0,并且利用Python将WGS-84坐标系下的经纬度转换成欧式距离和曼哈顿距离,其计算公式为与
f(Lng1,Lat1,Lng2,Lat2)=D
g(Lng1,Lat1,Lng2,Lat2)=M,其中,Lng1,Lat1,Lng2,Lat2分别为轨道出入口经纬度、开锁经纬度或关锁经纬度,f,g为转换函数,其可以通过一些编程软件获得,D为欧式距离值,M为曼哈顿距离值;
选取关锁点在站点出入口范围内的所述共享单车数据样本;计算每组共享单车数据样本的平均骑行速度数据,并对该多个平均骑行速度数据进行辨识,获得若干个有效共享单车数据样本;将该有效共享单车数据样本与所述站点出入口数据样本进行合并,获得站点骑行数据集,其以csv文件格式输出;
将所述站点骑行数据集中的所述骑行距离离散化,以站点为中心向外沿圆周周向或实际道路分布方向辐射若干次,在辐射距离内设置若干间隔,统计每道辐射距离内每个间隔的共享单车开锁点数量,获得骑行距离内的骑行数量;绘制骑行数量与骑行距离之间的变化规律的柱状图;将骑行数量与骑行距离之间的变化规律以函数式ψ(d)=n的形式输出,其中,n为累计骑行数量,d为骑行距离,ψ为转换函数;通过Python或MATLAB求解函数式ψ(d)=n,并将其以曲线图的形式在柱状图上合并绘制输出;取斜率变化最大且横坐标值较大点,其横坐标值d2即为站点合理影响范围半径的最大值;
将站点骑行数据集csv文件导入ArcGIS10.0,并转换成站点骑行数据集shp文件;以站点为中心生成合理影响范围最大半径的Buffer缓冲区,并与站点骑行数据集shp文件相交,得到合理影响范围最大半径的共享单车骑行点;基于该共享单车骑行点,利用ArcGIS10.0的“ArcToolbox-数据管理工具-要素-最小边界几何”功能进行几何运算,得到以多边形的形式输出的站点实际影响范围。
本领域技术人员应能理解上述借助ArcGIS地理处理工具以及Python或MATLAB的应用类型仅为举例,其他现有的或今后可能出现的地理及编程应用类型如可适用于本发明实施例,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
第二方面,本发明提供了一种基于共享单车骑行数据的站点影响范围确定装置,该装置的结构示意图如图5所示,包括如下的模块:
骑行数据集采集处理模块51:用于对站点出入口范围内的共享单车骑行数据进行处理,获取站点站点骑行数据集;
数据分析建模模块52:用于根据所述站点骑行数据集,分析每个站点骑行数量随骑行距离的变化,根据该变化的规律确定站点合理影响范围半径的最大值;
图表计算输出模块53:根据站点合理影响最大半径范围内的骑行数量确定站点实际影响范围。
进一步的,数据分析建模模块的工作过程包括:
选取一个站点,获取该站点推测影响范围内的共享单车数据样本,并将其联通该站点的出入口数据样本一起输入ArcGIS10.0,并且利用Python将WGS-84坐标系下的经纬度转换成欧式距离和曼哈顿距离,其计算公式为与
f(Lng1,Lat1,Lng2,Lat2)=D
g(Lng1,Lat1,Lng2,Lat2)=M,其中,Lng1,Lat1,Lng2,Lat2分别为轨道出入口经纬度、开锁经纬度或关锁经纬度,f,g为转换函数,其可以通过一些编程软件获得,D为欧式距离值,M为曼哈顿距离值;
选取关锁点在站点出入口范围内的所述共享单车数据样本;计算每组共享单车数据样本的平均骑行速度数据,并对该多个平均骑行速度数据进行辨识,获得若干个有效共享单车数据样本;将该有效共享单车数据样本与所述站点出入口数据样本进行合并,获得站点骑行数据集,其以csv文件格式输出,并传输至数据分析建模模块;
数据分析建模模块的工作过程包括:
将所述站点骑行数据集中的所述骑行距离离散化,以站点为中心向外沿圆周周向或实际道路分布方向辐射若干次,在辐射距离内设置若干间隔,统计每道辐射距离内每个间隔的共享单车开锁点数量,获得骑行距离内的骑行数量;绘制骑行数量与骑行距离之间的变化规律的柱状图;将骑行数量与骑行距离之间的变化规律以函数式ψ(d)=n的形式输出,其中,n为累计骑行数量,d为骑行距离,ψ为转换函数;通过Python或MATLAB求解函数式ψ(d)=n,并将其以曲线图的形式在柱状图上合并绘制输出;取斜率变化最大且横坐标值较大点,其横坐标值d2即为站点合理影响范围半径的最大值;完成上述过程后,数据分析建模模块将站点骑行数据集与站点合理影响范围半径的最大值传输至图表计算输出模块;
图表计算输出模块的工作过程包括:
将站点骑行数据集csv文件导入ArcGIS10.0,并转换成站点骑行数据集shp文件;以站点为中心生成合理影响范围最大半径的Buffer缓冲区,并与站点骑行数据集shp文件相交,得到合理影响范围最大半径的共享单车骑行点;基于该共享单车骑行点,利用ArcGIS10.0的“ArcToolbox-数据管理工具-要素-最小边界几何”功能进行几何运算,得到以多边形的形式输出的站点实际影响范围。
当需要分析处理多个站点出入口范围内共享单车骑行数据时,上述工作过程被执行多次;
用本发明实施例的装置进行基于共享单车骑行数据的站点影响范围确定的具体过程与前述方法实施例类似,此处不再赘述。
综上所述,本发明实施例提供的一种基于共享单车骑行数据的站点影响范围确定方法和装置,通过经分析处理得到的站点骑行数据集,确定站点合理影响范围最大半径与其范围内骑行数量,进一步通过分析计算确定站点实际影响范围。本发明提供的站点影响范围确定方法从数据驱动角度确定站点的实际影响范围,实用性高且具有普适性,为轨道客流组织及客流预测等方面的研究奠定基础。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (7)

1.基于共享单车骑行数据的站点影响范围确定方法,其特征在于,包括:
S1对站点出入口范围内的共享单车骑行数据进行处理,获取站点的骑行数据集;
S2基于所述站点的骑行数据集,分析每个所述站点骑行数量随骑行距离的变化规律,根据该变化规律确定站点合理影响范围半径的最大值;
S3根据站点合理影响最大半径范围内的骑行数量确定站点的实际影响范围;
步骤S1中,所述站点出入口范围内的共享单车骑行数据包括多组共享单车数据样本和站点出入口数据样本;
所述共享单车数据样本包括:交易编号、开锁经纬度、关锁经纬度、开锁时刻、关锁时刻,以及,骑行时长和/或骑行距离;
所述站点出入口数据样本包括:站点名称、出入口名称和出入口经纬度;
步骤S1包括如下子步骤:
S1.1选取关锁点在站点出入口范围内的所述共享单车数据样本;
S1.2计算每组共享单车数据样本的平均骑行速度数据;
S1.3对该多个平均骑行速度数据进行辨识,获得平均骑行速度数据在设定速度范围内的若干个有效共享单车数据样本;
S1.4将该有效共享单车数据样本与所述站点出入口数据样本进行合并,获得站点骑行数据集;
步骤S1.2中的所述平均骑行速度数据由如下任一一种方式获得:
当所述共享单车数据样本包括交易编号、开锁经纬度、关锁经纬度、开锁时刻、关锁时刻、骑行时长、骑行距离时,所述平均骑行速度数据由计算公式
Figure FDA0003435351360000011
获得,其中di为所述骑行距离,ti为所述骑行时长;
当所述共享单车数据样本缺失所述骑行距离时,所述平均骑行速度数据由计算公式
Figure FDA0003435351360000012
获得,其中,Mj为开锁经纬度与站点出入口之间的曼哈顿距离值,tj为所述骑行时长;
当所述共享单车数据样本缺失所述骑行时长时,所述平均骑行速度数据由计算公式
Figure FDA0003435351360000021
获得,其中,dk为所述骑行距离,τk为开关锁间隔,其由所述开锁时刻、关锁时刻计算获得;
当所述开锁经纬度、关锁经纬度、出入口经纬度为WGS-84坐标系,将所述开锁经纬度、关锁经纬度、出入口经纬度的坐标值转换成欧式距离值D和/或曼哈顿距离值M,
欧式距离值D的计算公式为:
f(Lng1,Lat1,Lng2,Lat2)=D;
曼哈顿距离值M的计算公式为:g(Lng1,Lat1,Lng2,Lat2)=M;
其中,Lng1,Lat1,Lng2,Lat2分别为轨道出入口经纬度、开锁经纬度或关锁经纬度,f,g为转换函数,D为欧式距离值,M为曼哈顿距离值;
步骤S2包括如下子步骤:
S2.1将所述站点骑行数据集中的所述骑行距离离散化,通过统计获得各个骑行距离内的骑行数量;
S2.2将骑行数量与骑行距离之间的变化规律以函数式ψ(d)=n的形式输出,其中,n为累计骑行数量,d为骑行距离,ψ为转换函数;
S2.3求解函数式ψ(d)=n,获得站点合理影响范围半径的最大值。
2.根据权利要求1所述的方法,其特征在于,步骤S2.1还包括如下子步骤:
S2.1.1以站点为中心向外辐射若干次;
S2.1.2在辐射距离内设置若干间隔;
S2.1.3统计每道辐射距离内每个间隔的共享单车开锁点数量,获得骑行距离内的骑行数量。
3.根据权利要求2所述的方法,其特征在于,步骤S3包括如下子步骤:
S3.1分析所述站点骑行数据集与站点合理影响最大半径范围之间的关系,获得站点合理影响最大半径范围内的共享单车骑行点;
S3.2通过对该共享单车骑行点进行几何运算,获得所述站点实际影响范围,并以多边形的形式输出。
4.一种基于共享单车骑行数据的站点影响范围确定装置,其特征在于,执行如权利要求1至3任一所述的方法,包括:
骑行数据集采集处理模块:用于对站点出入口范围内的共享单车骑行数据进行处理,获取站点骑行数据集;
数据分析建模模块:用于根据所述站点骑行数据集,分析每个站点骑行数量随骑行距离的变化,根据该变化的规律确定站点合理影响范围半径的最大值;
图表计算输出模块:根据站点合理影响最大半径范围内的骑行数量确定站点实际影响范围。
5.根据权利要求4所述的装置,其特征在于,
所述骑行数据集采集处理模块,具体用于选取关锁点在站点出入口范围内的所述共享单车数据样本;
计算每组共享单车数据样本的平均骑行速度数据,对该多个平均骑行速度数据进行辨识,获得平均骑行速度数据在设定速度范围内的若干个有效共享单车数据样本;
将该有效共享单车数据样本与所述站点出入口数据样本进行合并,获得站点骑行数据集。
6.根据权利要求4所述的装置,其特征在于,
所述数据分析建模模块,具体用于将所述站点骑行数据集中的所述骑行距离离散化,通过统计获得各个骑行距离内的骑行数量;
将骑行数量与骑行距离之间的变化规律以函数式ψ(d)=n的形式输出,其中,n为累计骑行数量,d为骑行距离,ψ为转换函数;
求解函数式ψ(d)=n,获得站点合理影响范围半径的最大值。
7.根据权利要求4所述的装置,其特征在于,
所述图表计算输出模块,具体用于分析所述站点骑行数据集与站点合理影响最大半径范围之间的关系,获得站点合理影响最大半径范围内的共享单车骑行点;
通过对该共享单车骑行点进行几何运算,获得所述站点实际影响范围,并以多边形的形式输出。
CN201910629867.6A 2019-07-12 2019-07-12 基于共享单车骑行数据的站点影响范围确定方法和装置 Active CN110457299B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910629867.6A CN110457299B (zh) 2019-07-12 2019-07-12 基于共享单车骑行数据的站点影响范围确定方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910629867.6A CN110457299B (zh) 2019-07-12 2019-07-12 基于共享单车骑行数据的站点影响范围确定方法和装置

Publications (2)

Publication Number Publication Date
CN110457299A CN110457299A (zh) 2019-11-15
CN110457299B true CN110457299B (zh) 2022-06-14

Family

ID=68482816

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910629867.6A Active CN110457299B (zh) 2019-07-12 2019-07-12 基于共享单车骑行数据的站点影响范围确定方法和装置

Country Status (1)

Country Link
CN (1) CN110457299B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111553761A (zh) * 2020-04-23 2020-08-18 天津市城市规划设计研究院 一种提取共享单车接驳轨道骑行的方法
CN113240898B (zh) * 2021-04-30 2022-11-22 云上青海大数据产业有限公司 一种大数据信息采集方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107578619A (zh) * 2017-09-11 2018-01-12 东南大学 基于ic卡数据测定地铁站点公共自行车服务范围的方法
CN107590239A (zh) * 2017-09-11 2018-01-16 东南大学 一种基于ic卡数据测定地铁站点公共自行车接驳半径的方法
CN109508865A (zh) * 2018-10-19 2019-03-22 东南大学 基于时空使用模式的地铁站辐射范围内共享单车的部署方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018030319A1 (ja) * 2016-08-12 2018-02-15 パナソニックIpマネジメント株式会社 測距システム、および、移動体システム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107578619A (zh) * 2017-09-11 2018-01-12 东南大学 基于ic卡数据测定地铁站点公共自行车服务范围的方法
CN107590239A (zh) * 2017-09-11 2018-01-16 东南大学 一种基于ic卡数据测定地铁站点公共自行车接驳半径的方法
CN109508865A (zh) * 2018-10-19 2019-03-22 东南大学 基于时空使用模式的地铁站辐射范围内共享单车的部署方法

Also Published As

Publication number Publication date
CN110457299A (zh) 2019-11-15

Similar Documents

Publication Publication Date Title
Shen et al. Review of GPS travel survey and GPS data-processing methods
CN108242149A (zh) 一种基于交通数据的大数据分析方法
US11514276B2 (en) System and method for detecting and classifying recurrent stops of a vehicle fleet
CN109844832A (zh) 一种基于行程时间分布的多模态交通异常检测方法
CN102324128A (zh) 基于ic卡记录的公交站间od客流预测方法及装置
CN104778245A (zh) 基于海量车牌识别数据的相似轨迹挖掘方法及装置
CN104508719A (zh) 驾驶辅助系统以及驾驶辅助方法
CN110457299B (zh) 基于共享单车骑行数据的站点影响范围确定方法和装置
Taff et al. Dimensions of alternative transportation experience in Yosemite and Rocky Mountain National Parks
CN102521965A (zh) 基于车牌识别数据的交通需求管理措施效果评价方法
Hora et al. Estimation of Origin-Destination matrices under Automatic Fare Collection: the case study of Porto transportation system
CN106707301A (zh) 一种基于定位数据的勤务巡线考核方法
CN110837973B (zh) 一种基于交通出行数据的人类出行选择信息挖掘方法
Fang et al. Identifying activities and trips with GPS data
Das et al. A fuzzy logic based transport mode detection framework in urban environment
CN109903555A (zh) 一种基于大数据的公交乘客下车数据预测方法及系统
CN104269057A (zh) 一种基于浮动车od数据的卡口传感器部署方法
CN112418556A (zh) 一种基于互联网共享平台下的网格化服务体系
Shen et al. Should we change the rules for trip identification for GPS travel records
Wolf et al. Applying GPS data to understand travel behavior
CN109800903A (zh) 一种基于出租车轨迹数据的盈利路线规划方法
Duan et al. Comprehending and analyzing multiday trip-chaining patterns of freight vehicles using a multiscale method with prolonged trajectory data
Rieser-Schüssler Capitalising modern data sources for observing and modelling transport behaviour
Giannotti et al. Mining mobility behavior from trajectory data
US10121212B1 (en) System and method for transportation demand management

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant