CN111429000B - 一种基于站点聚类的共享单车取还站点推荐方法及系统 - Google Patents

一种基于站点聚类的共享单车取还站点推荐方法及系统 Download PDF

Info

Publication number
CN111429000B
CN111429000B CN202010208141.8A CN202010208141A CN111429000B CN 111429000 B CN111429000 B CN 111429000B CN 202010208141 A CN202010208141 A CN 202010208141A CN 111429000 B CN111429000 B CN 111429000B
Authority
CN
China
Prior art keywords
station
clustering
site
vehicle
activity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010208141.8A
Other languages
English (en)
Other versions
CN111429000A (zh
Inventor
乔少杰
韩楠
罗佳
丁鹏
肖月强
李斌勇
张吉烈
张永清
元昌安
覃晓
郑皎凌
彭京
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Shendasen Technology Co ltd
Chengdu University of Information Technology
Original Assignee
Chengdu Shendasen Technology Co ltd
Chengdu University of Information Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Shendasen Technology Co ltd, Chengdu University of Information Technology filed Critical Chengdu Shendasen Technology Co ltd
Priority to CN202010208141.8A priority Critical patent/CN111429000B/zh
Publication of CN111429000A publication Critical patent/CN111429000A/zh
Application granted granted Critical
Publication of CN111429000B publication Critical patent/CN111429000B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06315Needs-based resource requirements planning or analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0639Item locations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0645Rental transactions; Leasing transactions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Development Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Tourism & Hospitality (AREA)
  • Game Theory and Decision Science (AREA)
  • Educational Administration (AREA)
  • Evolutionary Biology (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Primary Health Care (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种基于站点聚类的共享单车取还站点推荐方法及系统,该方法包括构建单车转移网络并计算站点活跃度,对共享单车系统内站点进行二级聚类,利用多特征LSTM网络对单车需求量进行预测,向用户推荐共享单车取还站点。本发明根据历史行程记录和站点分布数据,构建出单车转移网络,得到每个站点的活跃度,综合考虑站点位置和单车使用模式,对站点进行二级聚类,并分析天气和时间因素对聚簇内单车需求量的影响,选取关键特征构建三维向量,使用多特征LSTM网络预测不同时间段聚簇内单车需求,能够显著提高单车需求量预测准确性,实现向用户合理推荐共享单车取还站点,进而提高用户的出行效率。

Description

一种基于站点聚类的共享单车取还站点推荐方法及系统
技术领域
本发明属于共享单车系统技术领域,具体涉及一种基于站点聚类的共享单车取还站点推荐方法及系统。
背景技术
近几年共享单车系统在全世界广泛流行,共享单车成为一种主要的出行手段,成为智慧城市中不可或缺的交通工具。随着人们环保意识的提升,越来越多的人更加重视以绿色环保的方式出行。此外,共享单车真正解决了“最后一公里”问题,改变了人们的生活方式。一定数量的共享单车为用户提供点到点的出行方案,可以有效改善交通拥堵现象。
尽管共享单车为出行带来诸多便利,成为一种主流出行方式,但是如何以高效的方式运营共享单车系统具有一定挑战性。首先,在共享单车系统中,用户可以在不同站点任意借车和还车,且用户的借车和还车行为是随机和动态变化的,存在诸多的不确定性,使得共享单车系统不平衡。其次,由于供应商无法通过改变用户用车习惯的方式使系统达到平衡,因此各个站点内产生单车供应需求不平衡现象时,供应商需要在站点间重新分配单车以确保单车系统的正常运行。再者,如何对大规模共享单车借/还车数据进行分析,从中抽取有价值的出行行为特征,成为一个研究难点。
人类活动的随机性不可避免地会造成站点内可用单车数量和停车桩数量无法满足实时需求。各个站点所处位置和单车使用规律存在差异,站点需求预测问题是指通过分析各个站点借车和还车的规律来预测未来一段时间内各个站点的需求量,进而提高单车系统的服务质量。Huang等人针对每个站点共享单车数量预测问题提出了基于高斯泊松分布的算法,使用非齐次泊松描述借/还车过程,近似估计外部因素对单车使用的影响,计算借还车数量的平均值估计单车的使用量。算法不足之处在于训练时间较长。Huthaifa等人使用传统机器学习方法对每个站点进行预测,使用最小二乘回归算法来减少共享单车网络中站点预测模型的数量。此外,利用随机森林和最小二乘提升法研究多种因素对预测结果的影响。Li等人提出一种层次式预测模型来预测一段时间后簇内每个站点取/放车的数量,所提方法优势在于:可以处理不平衡天气分布问题;保证簇间取车概率总和为1;不足之处在于:所提的层次预测模型仅将站点聚合成静态簇,没有考虑外部环境的影响,且当外部环境变化时无法保证算法准确性。
发明内容
针对现有技术中存在的以上问题,本发明提供了一种基于站点聚类的共享单车取还站点推荐方法及系统,通过对单车需求量进行准确预测,实现向用户合理推荐共享单车取还站点,进而提高用户的出行效率。
为了达到上述发明目的,本发明采用的技术方案为:
一种基于站点聚类的共享单车取还站点推荐方法,包括以下步骤:
S1、构建单车转移网络,并计算站点活跃度;
S2、采用基于数据场的二级聚类算法对共享单车系统内站点进行二级聚类;
S3、利用多特征LSTM网络对单车需求量进行预测;
S4、根据预测的单车需求量向用户推荐共享单车取还站点。
本发明的有益效果是:在共享单车系统中,用户的借车和还车行为是随机的,且受天气、时间等动态因素影响,使得现有方法对单车需求量的预测准确性相对较低;本发明根据历史行程记录和站点分布数据,构建出单车转移网络,得到每个站点的活跃度,综合考虑站点位置和单车使用模式,对站点进行二级聚类,并分析天气和时间因素对聚簇内单车需求量的影响,选取关键特征构建三维向量,使用多特征LSTM网络预测不同时间段聚簇内单车需求,能够显著提高单车需求量预测准确性,实现向用户合理推荐共享单车取还站点,进而提高用户的出行效率。
进一步地,所述步骤S1包括以下分步骤:
S11、将单车转移网络定义为加权有向图网络G=(S,E),其中,S表示单车站点的集合,E表示边的集合,网络中的每个顶点表示一个站点,每条有向边表示两个站点间存在单车转移,边上的权值表示两个站点间的单车转移数量;
S12、结合借车站点对自身活跃度影响和还车站点对借车站点活跃度的影响,计算借车站点的活跃度P,其计算公式表示为:
P=(1-α)*M+α*H
其中,M表示借车站点对自身活跃度产生的影响,H表示还车站点对借车站点活跃度产生的影响,α表示阻尼因子;
S13、采用幂迭代法通过迭代公式迭代计算各站点活跃度,其迭代公式表示为:
Vk+1=M*vk
其中,Vk+1表示第k+1次迭代时各站点活跃度,vk表示第k次迭代时各站点活跃度;
当计算得到的各站点活跃度满足设定收敛条件时,停止迭代,得到最终的站点活跃度。
进一步地,所述站点的活跃度计算公式具体为:
Figure BDA0002421874890000041
其中,Pi表示站点si的活跃度,ni out表示从站点si借出的单车数量,out(i)表示从站点si借车的其他站点的集合,wij表示站点sj对站点si活跃度贡献,Pj表示站点sj的活跃度。
采用上述进一步方案的有益效果是:本发明通过将站点间的单车转移网络表示为一个加权有向图网络,并且同时考虑借车站点对自身的活跃度影响和还车站点对借车站点的活跃度影响,使得借车站点的活跃度计算更为准确。
进一步地,所述步骤S2包括以下分步骤:
S21、采用轮廓系数评估方法确定前q个活跃度最高的站点作为簇心,基于站点地理位置,按照势场大小,将其他站点加入到这q个簇心所在聚簇;
S22、对每个站点生成单车转移矩阵;
S23、同时考虑站点位置和单车转移矩阵,对单车站点进行第二次数据场聚类;
S24、重复步骤S22和步骤S23,如果聚类结果与上次相同或者达到迭代次数,则聚类过程结束。
进一步地,所述步骤S21中将单车转移网络作为一个势场,计算站点s对站点si所产生的势
Figure BDA0002421874890000042
其计算公式为:
Figure BDA0002421874890000043
其中,||s-si||表示站点s到站点si的距离,ε表示影响因子;
聚类时将站点加入到势最大的簇中心所在聚簇。
进一步地,所述单车转移矩阵为站点si内单车转移模式,即站点si内单车在特定时间段转移到其他聚簇的概率,其矩阵的行对应不同的时间段,矩阵的列对应不同的聚簇,矩阵元素(Ti)l,j表示在时间段l从站点si内借的单车停留在聚簇Cj的概率。
采用上述进一步方案的有益效果是:每个站点的单车使用量受多种因素影响,如天气,时间和站点间关联等,使得单车使用量波动较大,难以发现周期性和规律性,因此无法保证预测的准确性;本发明采用基于数据场的二级聚类算法,将特征相似的站点聚集到一个聚簇,其周期性和规律性更为明显,相比于单个站点,对单车需求的预测准确性也得以提高;并且考虑站点位置和单车转移模式,方便用户在距离相近的站点借/还车,使得对各个聚簇内单车的需求预测更为精确。
进一步地,所述步骤S3包括以下分步骤:
S31、对与单车需求量相关的各个天气特征和时间特征分别进行可视化分析,挖掘影响单车需求量的特征作为输入特征;
S32、根据步骤S31得到的输入特征构建特征向量;
S33、利用多特征LSTM网络根据步骤S32构建的特征向量预测在不同天气状况下每个聚簇下一时间段内的单车需求量。
进一步地,所述步骤S32中构建的特征向量具体为:
Fi,t=(Oi,t-1,F1 i,t,…,Fn i,t,Oi,t)
其中,Fi,t表示在当前时间段t内聚簇Ci的特征向量,Oi,t-1表示上一时间段t-1内聚簇Ci的借车数量,Fn i,t表示当前时间段t内聚簇Ci的n个天气特征,Oi,t表示当前时间段t内聚簇Ci的借车数量。
进一步地,所述步骤S33中的预测模型具体为:
Oi,t+1=DeepMF(Fi,t-l,…,Fi,t-1,Fi,t)
其中,Oi,t+1表示下一时间段t+1内聚簇Ci的单车需求量,Fi,t-l表示前时间段t-l内聚簇Ci的特征向量。
采用上述进一步方案的有益效果是:本发明利用长短时记忆网络LSTM构建一个多特征LSTM网络模型,采用DeepMF算法根据时间和天气特征预测在不同时刻不同天气状况下的单车需求量,利用其长时间记忆的特性,有效解决梯度消失的问题;通过dropout技术控制预测模型的规模,从而增强预测模型的泛化能力。
本发明还提出了一种基于站点聚类的共享单车取还站点推荐系统,所述推荐系统应用上述共享单车取还站点推荐方法进行共享单车取还站点推荐。
附图说明
图1是本发明基于站点聚类的共享单车取还站点推荐方法流程图;
图2是本发明实施例中共享单车转移网络拓扑图;
图3是本发明实施例中单车转移网络示意图;
图4是本发明实施例中基于数据场的二级聚类过程示意图;
图5是本发明实施例中天气特征统计分析示意图;
图6是本发明实施例中时间特征统计分析示意图;
图7是本发明实施例中多特征LSTM记忆细胞结构示意图;
图8是本发明实施例中多特征LSTM记忆细胞结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
如图1所示,本发明实施例提供了一种基于站点聚类的共享单车取还站点推荐方法,包括以下步骤S1至S4:
S1、构建单车转移网络,并计算站点活跃度;
在本发明的一个可选实施例中,上述步骤S1包括以下分步骤:
S11、将单车转移网络定义为加权有向图网络G=(S,E),其中,S表示单车站点的集合,E表示边的集合,网络中的每个顶点表示一个站点,每条有向边表示两个站点间存
在本实施例中,本发明将共享单车系统中站点间的单车转移网络表示为一个加权有向图网络。在该网络内,每个顶点代表一个站点,每条有向边表示两个站点间存在单车转移,边上的权值表示两个站点间的单车转移数量。根据PageRank算法思想:基于互联网里的网页被引用量计算该网页的重要性,进而对网页排名。因此单车站点活跃度可以类比为网页重要性,如果很多站点内单车都是从站点si转移来的,或者一个活跃度很高的站点sj内有单车从站点si转移而来,则站点si的活跃度Pi会因此增大。
单车转移网络定义为一个加权有向图网络G=(S,E),S={Σsi|i=1,2,…,n},E={Σeij|i,j=1,2,…,n},其中,S表示单车站点的集合,E表示边的集合,eij代表一条从站点si到站点sj的转移边。
如图2所示,在单车转移网络中,站点间存在转移边,每条边包含一个属性tij,代表从站点si到站点sj的单车转移量t。
S12、结合借车站点对自身活跃度影响和还车站点对借车站点活跃度的影响,计算借车站点的活跃度P,其计算公式表示为:
P=(1-α)*M+α*H
其中,M表示借车站点对自身活跃度产生的影响,H表示还车站点对借车站点活跃度产生的影响,α表示阻尼因子;
在本实施例中,在单车转移网络中,从站点借出的单车数量越多,则表明该站点的活跃度越高。站点的活跃度主要受两个方面的影响:1)考虑借车站点对自身的活跃度影响,借出的单车数量越多,该借车站点的活跃度相应地也越高;2)考虑还车站点对借车站点的活跃度影响,得到每个还车站点sj分别对其借车站点si的活跃度贡献,进而获得借车站点的活跃度。
本发明用M表示借车站点对自身活跃度产生的影响,H表示还车站点对借车站点产生的活跃度,得到所有站点活跃度矩阵P,其计算公式表示为:
P=(1-α)*M+α*H
其中,M表示借车站点对自身活跃度产生的影响,H表示还车站点对借车站点活跃度产生的影响,α表示阻尼因子。
活跃度贡献wij代表站点sj对站点si活跃度大小的影响。如果站点sj内的单车数量为nj,其中,从站点si转移到站点sj的单车数量为ni,j,则ni,j/nj表示站点sj对站点si活跃度贡献wij
站点活跃度Pi表示站点si被用户访问的概率,用于衡量站点si的重要性。站点si的活跃度计算公式具体为:
Figure BDA0002421874890000081
其中,Pi表示站点si的活跃度,ni out表示从站点si借出的单车数量,out(i)表示从站点si借车的其他站点的集合,wij表示站点sj对站点si活跃度贡献,Pj表示站点sj的活跃度。
S13、采用幂迭代法通过迭代公式迭代计算各站点活跃度,其迭代公式表示为:
Vk+1=M*vk
其中,Vk+1表示第k+1次迭代时各站点活跃度,vk表示第k次迭代时各站点活跃度;
当计算得到的各站点活跃度满足设定收敛条件时,停止迭代,得到最终的站点活跃度。
如图3所示,为一个含有A,B,C,D四个站点的单车转移网络,当有单车从站点A转移到站点B,则添加一条从A到B的有向边,边上的数字表示转移单车的数量,如:有14辆单车从站点A转移到站点B。
图3中所有站点初始活跃度取为1/4,α取值为0.8,第k次迭代时各站点活跃度为vk,通过迭代公式不断迭代,当满足收敛条件后,得到最终的站点活跃度。
S2、采用基于数据场的二级聚类算法对共享单车系统内站点进行二级聚类;
在本发明的一个可选实施例中,由于每个站点的单车使用量受多种因素影响,如天气,时间和站点间关联等,使得单车使用量波动较大,难以发现周期性和规律性,因此无法保证预测的准确性;从现实因素考虑,一个城市设立有很多站点,且多数站点间距离很近,如果用户无法在一个站点借/还车,选择在附近站点借/还车也很方便;如果遇到突发情况,通常影响的是一个区域范围,此时预测单个站点的单车需求并不能满足用户需求。因此采用聚类方法,将特征相似的站点聚集到一个聚簇,其周期性和规律性更为明显,相比于单个站点,对单车需求的预测准确性也得以提高。
本发明提出了一种基于数据场的二级聚类算法TLDF(Two-Level clusteringbased on Data Field),其考虑站点位置,方便用户在距离相近的站点借/还车。此外,算法考虑单车转移模式,使得对各个聚簇内单车的需求预测更为精确。
基于数据场的二级聚类算法包括两个阶段:第一阶段是为每个站点找距其最近的簇心,并将其划分给该簇心所对应的聚簇;第二阶段是对每个站点生成单车转移矩阵,同时考虑两个因素进行二级聚类。
上述步骤S2包括以下分步骤:
S21、采用轮廓系数评估方法确定前q个活跃度最高的站点作为簇心,基于站点地理位置,按照势场大小,将其他站点加入到这q个簇心所在聚簇;
在本实施例中,本发明基于数据场的聚类算法参考物理学势场的概念,在复杂网络中,各个节点间的影响是相互的,节点在网络中重要性越大,则其影响范围也越大。因此可以把复杂网络类比为一个势场,聚类时将节点加入到势最大的簇中心所在聚簇。在单车转移网络中,站点s对站点si所产生的势
Figure BDA0002421874890000101
的计算公式为:
Figure BDA0002421874890000102
其中,||s-si||表示站点s到站点si的距离,ε表示影响因子,调节站点间的相互影响程度。
本发明基于站点位置对单车站点{si}n i=1利用数据场聚类算法得到q个聚簇{Ck,1,Ck,2,…,Ck,q}。
S22、对每个站点生成单车转移矩阵;
在本实施例中,单车转移矩阵Ti表示站点si内单车转移模式,即站点si内单车在特定时间段转移到其他聚簇的概率。其矩阵的行对应不同的时间段,矩阵的列对应不同的聚簇,矩阵元素(Ti)l,j表示在时间段l从站点si内借的单车停留在聚簇Cj的概率。
例如单车转移矩阵T1,表示站点s1的单车转移模式:
Figure BDA0002421874890000111
矩阵的行对应7个时间段:工作日的7:00am-11:00am(早高峰),11:00am-5:00pm(上班),5:00pm-9:00pm(晚高峰),9:00pm-7:00am(休息)和节假日的0:00am-9:00am(休息),9:00am-7:00pm(休闲)和7:00pm-12:00pm(休息),矩阵的列分别表示3个不同的聚簇。矩阵元素(Ti)l,j表示在时间段l,从站点si内借的单车停留在聚簇Cj的概率,如:(T1)2,3表示在时间段11:00am-5:00pm从站点s1内借的单车停在聚簇C3的概率为0.8。
本发明针对每一个站点si生成单车转移矩阵Ti,i=1,...,n;
S23、同时考虑站点位置和单车转移矩阵,对单车站点进行第二次数据场聚类;
在本实施例中,本发明基于站点地理位置和历史行程记录Ti,对单车站点{si}n i=1使用数据场聚类算法,得到q个聚簇{Ck,1,Ck,2,…,Ck,q}。
S24、重复步骤S22和步骤S23,如果聚类结果与上次相同或者达到迭代次数,则聚类过程结束。
在本实施例中,本发明判断步骤S23得到的聚类结果{Ck,1,Ck,2,…,Ck,q}是否与上次聚类结果{Ck-1,1,Ck-1,2,…,Ck-1,q}相同,或者达到总迭代次数,若是则聚类过程结束,得到q个站点聚簇{CK,1,CK,2,…,CK,q}。
如图4所示,描述了8个单车站点采用基于数据场的二级聚类迭代过程,s1,s4,s6为三个初始簇心站点。在TLDF算法的一级聚类中只考虑站点位置,将剩余的站点划分到距离最近的簇心所在聚簇,得到{C0,1,C0,2,C0,3},在二级聚类中同时考虑站点位置和单车使用模式,由于簇心s4对站点s5产生的势更大,故将s5重新划分到s4所在聚簇。二级聚类过程迭代k次,直至达到迭代终止条件。
S3、利用多特征LSTM网络对单车需求量进行预测;
在本发明的一个可选实施例中,上述步骤S3包括以下分步骤:
S31、对与单车需求量相关的各个天气特征和时间特征分别进行可视化分析,挖掘影响单车需求量的特征作为输入特征;
在本实施例中,本发明首先分析时间和天气特性,然后将他们作为关键因素预测在不同时刻不同天气状况下的单车需求量。
天气对共享单车的使用情况具有显著影响,因为天气会影响到用户的安全出行,其影响因素包括:气候、温度、海平面气压、相对湿度、阵风速率、可见度、风速等。通常,在晴天单车使用量比下雨天明显增多,下雨天用车条件恶劣,比如道路积水易滑等。当可见度较低时,用户视野会变窄,安全性降低,用户会选择其他方式出行。此外,当室外温度适宜、风速较小、湿度低的情况下单车使用率更高,用户更容易在这种环境条件下出行。
本发明采用可视化分析方法对与单车需求量相关的各个天气特征进行分析,挖掘对单车需求量最大的天气特征作为输入特征,下面分别以温度和空气相对湿度为例进行统计分析,结果如图5所示。
图5(a)表明温度对借车数量的影响,温度在46到60华氏度之间的用车需求最多,当温度低于46华氏度或高于60华氏度时单车需求量都会明显减少。图5(b)表明湿度对借车数量的影响,湿度在34%到61%之间的平均用车需求整体偏大,当湿度大于61%时单车需求量整体偏小。本发明将天气因素融合到预测模型中,可以提高共享单车需求预测的准确性。
在一天中,单车的使用频率和不同时刻具有很大关联。用户在工作日的用车习惯更有规律性,一般在上下班高峰期用单车往来于公交站与地铁站,所以用车量相对集中。但在夜间随着公交地铁等公共交通开始下班,共享单车使用量会出现上下波动。用户在周末使用单车的习惯具有较大随机性,没有明显的波动规律。本发明采用可视化分析方法对与单车需求量相关的各类时间特征进行分析,以星期和时刻作为输入特征进行统计分析,结果如图6所示。
图6(a)表明星期对借车数量的影响,工作日对单车需求量均较大,而在周末的需求较小。图6(b)表明时刻对借车数量的影响,上下班高峰期对单车需求明显增多,而在其余时刻的需求量趋于平缓。
S32、根据步骤S31得到的输入特征构建特征向量;
在本实施例中,在多特征LSTM网络模型中,为了更好地获得准确的预测结果,仅仅通过原数据无法呈现出其中包含的规律,因此本发明将步骤S31得到的天气和时间的输入特征转化为向量形式,以当前时间段t内天气特征和前一个时间段{t-1}内借车数量来预测下一个时间段{t+1}内借车的数量为例,构建特征向量,具体为:
Fi,t=(Oi,t-1,F1 i,t,…,Fn i,t,Oi,t)
其中,Fi,t表示在当前时间段t内聚簇Ci的特征向量,Oi,t-1表示上一时间段t-1内聚簇Ci的借车数量,Fn i,t表示当前时间段t内聚簇Ci的n个天气特征,Oi,t表示当前时间段t内聚簇Ci的借车数量。
S33、利用多特征LSTM网络根据步骤S32构建的特征向量预测在不同天气状况下每个聚簇下一时间段内的单车需求量。
在本实施例中,本发明利用长短时记忆网络LSTM构建一个多特征LSTM网络模型,提出DeepMF算法(DeepMulti Features LSTM network)预测单车需求,以30分钟为时间间隔对每个聚簇内的单车需求进行预测。
本发明提出的多特征LSTM网络区别与传统神经网络模型之处在于多特征LSTM网络引入了记忆细胞的概念,利用其具有长时间记忆的特性,有效解决梯度消失的问题,不仅仅是上一时刻,较远时刻的信息也可以传播到当前时刻;并且通过dropout技术控制模型的规模,预测模型的泛化能力也有所增强。多特征LSTM网络记忆细胞结构如图7所示。
多特征LSTM网络记忆细胞结构包括遗忘门,输入门,输出门和细胞状态。遗忘门以一定概率控制是否遗忘上一层的隐藏细胞状态。输入门以一定概率控制是否将当前时间段t内单车需求量xt传递到隐藏状态Ct。输出门以一定概率控制是否将隐藏状态ht传递到当前时间段t内单车需求量ht。其中,δ表示Sigmoid函数。
在单车需求预测问题中的输入是三维向量(samples,timesteps,features),其中samples、timesteps、features分别表示训练样本数量、时间步长和Fi,t的特征数量。在多特征LSTM网络模型中输入三维向量,使用最近l个时间段状态信息,即timesteps=l,预测在不同天气状况下每个聚簇下一时间段内的单车需求。
单车需求量预测模型具体为:
Oi,t+1=DeepMF(Fi,t-l,…,Fi,t-1,Fi,t)
其中,Oi,t+1表示下一时间段t+1内聚簇Ci的单车需求量,Fi,t-l表示前时间段t-l内聚簇Ci的特征向量。
多特征LSTM网络通过记忆细胞的三个控制门,以一定概率控制是否将前l个时间段内单车的需求量作用于当前时间段,实现长时间记忆。多特征LSTM网络结构如图8所示。ht不仅与当前时间段的状态xt有关,而且与前l个时间段的状态有关,ht可表示为f(u*xt+wt-1*St-1+wt-2*St-2+…+wt-s*St-l),其中,St-l表示隐含层的中间状态,进而实现与前面l个时间段的状态关联。
S4、根据预测的单车需求量向用户推荐共享单车取还站点。
在本发明的一个可选实施例中,根据步骤S3预测得到每个聚簇下一时间段内的单车需求量,即可以得到每个聚簇内站点下一时间段用户取还的共享单车数量,本发明通过设定推荐条件,将满足推荐条件的共享单车取还站点向用户进行推荐,从而方便用户提前安排时间及线路规划,能够在上下班高峰期就近找到足够数量的取车站点或不太拥挤的换车站点,提高用户的出行效率,改善用户的使用体验。
上述推荐条件具体可以设置一个单车需求阈值,这里的单车需求阈值采用对应聚簇在上一周的当前时间段内平均单车需求量进行设定,这样避免了人工设置阈值带来的每次推荐结果的不确定性和导致推荐结果的不准确性问题,通过比较步骤S3预测得到每个聚簇下一时间段内的单车需求量和设定的单车需求阈值,将低于单车需求阈值的共享单车取还站点向用户进行推荐。
本发明实施例还提供了一种基于站点聚类的共享单车取还站点推荐系统,该推荐系统应用上述共享单车取还站点推荐方法进行共享单车取还站点推荐。
上述推荐系统可以包括存储器、处理器以及计算机程序,其中计算机程序存储在存储器中,并配置为由处理器执行以实现如上所述的任一种共享单车推荐方法。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (5)

1.一种基于站点聚类的共享单车取还站点推荐方法,其特征在于,包括以下步骤:
S1、构建单车转移网络,并计算站点活跃度,包括以下分步骤:
S11、将单车转移网络定义为加权有向图网络G=(S,E),其中,S表示单车站点的集合,E表示边的集合,网络中的每个顶点表示一个站点,每条有向边表示两个站点间存在单车转移,边上的权值表示两个站点间的单车转移数量;
S12、结合借车站点对自身活跃度影响和还车站点对借车站点活跃度的影响,计算借车站点的活跃度P,其计算公式表示为:
P=(1-α)*M+α*H
其中,M表示借车站点对自身活跃度产生的影响,H表示还车站点对借车站点活跃度产生的影响,α表示阻尼因子;
S13、采用幂迭代法通过迭代公式迭代计算各站点活跃度,其迭代公式表示为:
Vk+1=M*vk
其中,Vk+1表示第k+1次迭代时各站点活跃度,vk表示第k次迭代时各站点活跃度;
当计算得到的各站点活跃度满足设定收敛条件时,停止迭代,得到最终的站点活跃度,计算公式具体为:
Figure FDA0002965030020000011
其中,Pi表示站点si的活跃度,ni out表示从站点si借出的单车数量,out(i)表示从站点si借车的其他站点的集合,wij表示站点sj对站点si活跃度贡献,Pj表示站点sj的活跃度;
S2、采用基于数据场的二级聚类算法对共享单车系统内站点进行二级聚类,包括以下分步骤:
S21、采用轮廓系数评估方法确定前q个活跃度最高的站点作为簇心,基于站点地理位置,按照势场大小,将其他站点加入到这q个簇心所在聚簇;具体为将单车转移网络作为一个势场,计算站点s对站点si所产生的势
Figure FDA0002965030020000022
其计算公式为:
Figure FDA0002965030020000021
其中,||s-si||表示站点s到站点si的距离,ε表示影响因子;
聚类时将站点加入到势最大的簇中心所在聚簇;
S22、对每个站点生成单车转移矩阵;所述单车转移矩阵为站点si内单车转移模式,即站点si内单车在特定时间段转移到其他聚簇的概率,其矩阵的行对应不同的时间段,矩阵的列对应不同的聚簇,矩阵元素(Ti)l,j表示在时间段l从站点si内借的单车停留在聚簇Cj的概率;
S23、同时考虑站点位置和单车转移矩阵,对单车站点进行第二次数据场聚类;
S24、重复步骤S22和步骤S23,如果聚类结果与上次相同或者达到迭代次数,则聚类过程结束;
S3、利用多特征LSTM网络对单车需求量进行预测;
S4、根据预测的单车需求量向用户推荐共享单车取还站点。
2.如权利要求1所述的基于站点聚类的共享单车取还站点推荐方法,其特征在于,所述步骤S3包括以下分步骤:
S31、对与单车需求量相关的各个天气特征和时间特征分别进行可视化分析,挖掘影响单车需求量的特征作为输入特征;
S32、根据步骤S31得到的输入特征构建特征向量;
S33、利用多特征LSTM网络根据步骤S32构建的特征向量预测在不同天气状况下每个聚簇下一时间段内的单车需求量。
3.如权利要求2所述的基于站点聚类的共享单车取还站点推荐方法,其特征在于,所述步骤S32中构建的特征向量具体为:
Fi,t=(Oi,t-1,F1 i,t,…,Fn i,t,Oi,t)
其中,Fi,t表示在当前时间段t内聚簇Ci的特征向量,Oi,t-1表示上一时间段t-1内聚簇Ci的借车数量,Fn i,t表示当前时间段t内聚簇Ci的n个天气特征,Oi,t表示当前时间段t内聚簇Ci的借车数量。
4.如权利要求3所述的基于站点聚类的共享单车取还站点推荐方法,其特征在于,所述步骤S33中的预测模型具体为:
Oi,t+1=DeepMF(Fi,t-l,…,Fi,t-1,Fi,t)
其中,Oi,t+1表示下一时间段t+1内聚簇Ci的单车需求量,Fi,t-l表示前时间段t-l内聚簇Ci的特征向量。
5.一种基于站点聚类的共享单车取还站点推荐系统,其特征在于,所述推荐系统应用如权利要求1-4任一所述共享单车取还站点推荐方法进行共享单车取还站点推荐。
CN202010208141.8A 2020-03-23 2020-03-23 一种基于站点聚类的共享单车取还站点推荐方法及系统 Active CN111429000B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010208141.8A CN111429000B (zh) 2020-03-23 2020-03-23 一种基于站点聚类的共享单车取还站点推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010208141.8A CN111429000B (zh) 2020-03-23 2020-03-23 一种基于站点聚类的共享单车取还站点推荐方法及系统

Publications (2)

Publication Number Publication Date
CN111429000A CN111429000A (zh) 2020-07-17
CN111429000B true CN111429000B (zh) 2021-05-28

Family

ID=71555379

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010208141.8A Active CN111429000B (zh) 2020-03-23 2020-03-23 一种基于站点聚类的共享单车取还站点推荐方法及系统

Country Status (1)

Country Link
CN (1) CN111429000B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112258029B (zh) * 2020-10-21 2024-04-09 北京交通大学 地铁站周边共享单车的需求预测方法
CN112132236B (zh) * 2020-11-20 2021-03-26 深圳市城市交通规划设计研究中心股份有限公司 一种基于聚类算法的需求子区划分、线路规划方法及装置
CN112836951B (zh) * 2021-01-26 2023-10-24 深圳市泰比特科技有限公司 一种基于大数据的共享单车云平台智能调度方法及系统
CN113344240A (zh) * 2021-04-26 2021-09-03 山东师范大学 一种共享单车流量预测方法及系统
CN115564319B (zh) * 2022-12-05 2023-04-18 北京工业大学 一种共享单车的调度方法、装置及可读存储介质
CN116798234B (zh) * 2023-08-28 2024-01-26 北京阿帕科蓝科技有限公司 车站参数信息的确定方法、装置、计算机设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016045696A (ja) * 2014-08-22 2016-04-04 ▲蔦▼井株式会社 シェアサイクルシステム
CN108898822A (zh) * 2018-06-15 2018-11-27 西南交通大学 一种推荐共享单车借车点和还车点的方法
CN108960476A (zh) * 2018-03-30 2018-12-07 山东师范大学 基于ap-ti聚类的共享单车流量预测方法及装置
CN109543922A (zh) * 2018-12-20 2019-03-29 西安电子科技大学 用于有桩共享单车站点群的分时段借还量预测方法
CN110210656A (zh) * 2019-05-21 2019-09-06 上海交通大学 基于站点行为分析的共享单车流量预测方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016045696A (ja) * 2014-08-22 2016-04-04 ▲蔦▼井株式会社 シェアサイクルシステム
CN108960476A (zh) * 2018-03-30 2018-12-07 山东师范大学 基于ap-ti聚类的共享单车流量预测方法及装置
CN108898822A (zh) * 2018-06-15 2018-11-27 西南交通大学 一种推荐共享单车借车点和还车点的方法
CN109543922A (zh) * 2018-12-20 2019-03-29 西安电子科技大学 用于有桩共享单车站点群的分时段借还量预测方法
CN110210656A (zh) * 2019-05-21 2019-09-06 上海交通大学 基于站点行为分析的共享单车流量预测方法及系统

Also Published As

Publication number Publication date
CN111429000A (zh) 2020-07-17

Similar Documents

Publication Publication Date Title
CN111429000B (zh) 一种基于站点聚类的共享单车取还站点推荐方法及系统
CN109544911B (zh) 一种基于lstm-cnn的城市路网交通状态预测方法
CN104217250B (zh) 一种基于历史数据的城市轨道交通新线开通客流预测方法
CN115953104B (zh) 一种基于蜣螂优化算法的混合车队调度方法
CN111160639B (zh) 基于用户出行时空分布特性的电动汽车充电负荷预测方法
CN108288112A (zh) 基于用户出行模拟的区域电动汽车充电站负荷预测方法
Liu et al. Control method of urban intelligent parking guidance system based on Internet of Things
Tang et al. Online operations of automated electric taxi fleets: An advisor-student reinforcement learning framework
Qiao et al. A dynamic convolutional neural network based shared-bike demand forecasting model
Yang et al. A data-driven approach for optimizing the EV charging stations network
Jia et al. Hierarchical prediction based on two-level affinity propagation clustering for bike-sharing system
CN114066503A (zh) 一种基于构建虚拟服务片区进行出租车需求预测的方法
CN116797274A (zh) 一种基于Attention-LSTM-LightGBM的共享单车需求量预测方法
CN113609693B (zh) 基于改进累积前景理论的异质性车主充电行为建模方法
Zhong et al. Charging navigation strategy for electric vehicles considering empty-loading ratio and dynamic electricity price
Ma et al. Investigating the impact of spatial-temporal grid size on the microscopic forecasting of the inflow and outflow gap in a free-floating bike-sharing system
CN114358449A (zh) 基于图神经网络的电动汽车充电负荷时空分布预测方法
CN114781707A (zh) 针对交通工作人员调度的优化方法及系统
Guo et al. An electric vehicle charging load prediction model for different functional areas based on multithreaded acceleration
CN114119075B (zh) 一种大型综合体配建停车场内差异化定价策略制定方法
CN113705891B (zh) 基于mra-bas-bp算法的城市商办综合体建筑停车需求预测方法
CN105469157A (zh) 路侧停车需求对停车费率敏感度的空间异质性分析方法
Beecham et al. A visual analytics approach to understanding cycling behaviour
CN115495661A (zh) 一种基于用户长短期偏好的自适应兴趣点推荐方法
CN114548517A (zh) 一种电动汽车充电负荷的估算与建模方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant