CN110175656A - 基于城市群白货流量的提高列车编组效率的城市聚类模型 - Google Patents

基于城市群白货流量的提高列车编组效率的城市聚类模型 Download PDF

Info

Publication number
CN110175656A
CN110175656A CN201910479120.7A CN201910479120A CN110175656A CN 110175656 A CN110175656 A CN 110175656A CN 201910479120 A CN201910479120 A CN 201910479120A CN 110175656 A CN110175656 A CN 110175656A
Authority
CN
China
Prior art keywords
cluster
city
distance
algorithm
heroin
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910479120.7A
Other languages
English (en)
Other versions
CN110175656B (zh
Inventor
冀振燕
宋晓军
陈诚
皮怀雨
聂泽姝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jiaotong University
Original Assignee
Beijing Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jiaotong University filed Critical Beijing Jiaotong University
Priority to CN201910479120.7A priority Critical patent/CN110175656B/zh
Publication of CN110175656A publication Critical patent/CN110175656A/zh
Application granted granted Critical
Publication of CN110175656B publication Critical patent/CN110175656B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及基于城市群白货流量的提高列车编组效率的城市聚类模型。该城市聚类模型通过聚类算法找出热点区域对,得到白货运量较大的运输区间,从而为铁路列车编组和开行固定班列提供数据支持。首先利用k‑means聚类算法,使用经纬度输入算法,可以得到彼此之间距离较近的城市簇;然后从历史数据中取出所有的开行路线并将它们归类到对应的城市簇对中,并可得到城市簇之间的距离和吨数;最后通过一定的条件过滤得到符合要求的城市簇,即可以开行的班列。目前算法设置的距离为大于800千米,吨数大于100万吨,聚类得到的城市簇数量可以手动调节,通过观察得到较好的类别数。

Description

基于城市群白货流量的提高列车编组效率的城市聚类模型
技术领域
本发明涉及聚类系统的原型聚类算法和经纬度算法,提出了一种基于城市群白货流量的提高列车编组效率的城市聚类模型。
背景技术
本发明为了铁路运输的实际应用需求——对城市群白货流向的分析,融合了原型聚类算法和经纬度距离算法等,建立了基于城市群白货流量的提高列车编组效率的城市聚类模型。该模型目的是将距离较近城市根据发送吨数或到达吨数聚集成一个城市簇,对于开行固定货运班列、提高列车编组效率有重要参考价值。城市聚类可以得到城市簇,然后通过筛选热门城市簇对,依托我国目前重点推进的“五纵四横”运输通道,优化铁路白货物流运输体系。
发明内容
本发明引入了原型聚类算法和经纬度距离算法。
上述模型包含了如下步骤:
(1)读取城市经纬度;
(2)输入k-means聚类算法;
(3)计算城市簇之间的距离;
(4)按距离过滤城市簇对;
(5)计算城市簇之间的白货流量;
(6)按流量吨数过滤城市簇对。
具体步骤如附图1所示。
步骤具体说明如下:
为了得到热点区域,先要找到城市密度较大的区域,以这些区域为基础,寻找区域间的热门线路。当区域间的货运量和货运距离达到一定要求时,这样的区域对包含的两个区域则为满足条件的热点区域。在地图上,城市的中心用经纬度表示,每个城市都有自己特定的经纬度。距离越近的城市,对应经度和纬度之间的差值的绝对值之和越小。利用k-means聚类算法,使用经纬度输入算法,则可以得到彼此之间距离较近的城市簇。城市簇之间的距离可以通过经纬度来计算。
计算出城市簇之后,需要计算城市簇之间所有的开行路线。此时应该从历史数据中取出所有的开行路线,然后将他们归类到对应的城市簇对中。这样就可以得到城市簇两两之间所有的开行路线情况,由此可计算出城市簇之间的发送和到达吨数。
得到城市簇之间的距离和吨数之后,则可以通过一定的条件过滤得到符合要求的城市簇,即可以开行的班列。目前算法设置的距离为大于800千米,吨数大于100万吨,聚类得到的城市簇数量可以手动调节,通过观察得到较好的类别数。
附图说明
附图1是基于城市群白货流量的提高列车编组效率的城市聚类模型的流程图。
附图2是设置k=2时对数据样例进行聚类的聚类过程和最终聚类结果示意图,聚类模型是迭代式推进的,直到相邻迭代差值达到一阈值或迭代次数达到阈值停止。
附图3是传统的k-means聚类算法的流程图。
附图4是对给定城市的城市群聚类结果,输入城市的经纬度表示位置,预设K个城市簇中心,利用聚类迭代到最终结果。
附图5展示了K值设置为50时,发送城市簇至到达城市簇总吨数大于100万吨且运输距离大于800 千米的聚类结果。
附图6展示了K值设置为30时,发送城市簇至到达城市簇总吨数大于100万吨且运输距离大于800 千米的聚类结果。
附图7展示了K值设置为20时,发送城市簇至到达城市簇总吨数大于100万吨且运输距离大于800 千米的聚类结果。
具体实施方式
根据说明书中的方法介绍,实施基于城市群白货流量的提高列车编组效率的城市聚类模型需要如下步骤:
(1)读取城市经纬度
①获取接口
②输入城市名称
③获取经纬度
(2)输入k-means聚类算法
①预设k值
②计算簇均值作为聚类中心
③优化迭代
(3)计算城市簇之间的距离
(4)按距离过滤城市簇对
①设置距离条件
②筛选过滤
(5)计算城市簇之间的白货流量
(6)按流量吨数过滤城市簇对
①设置吨数条件
②筛选过滤
除了说明书中的步骤外,还需要对模型结果进行评价,以保证结果的可靠性。
本模型中核心的算法是原型聚类算法。
原型聚类也称为“基于原型的聚类”,此类算法假设聚类结构能通过一组原型刻画,在现实聚类任务中极为常用。通常情形下,算法对原型进行初始化,然后对原型进行迭代更新求解,采用不同的原型表示,不同的求解方式将产生不同的算法,k均值算法(k-means)是最为常用的原型聚类算法之一。
k-means算法中的k代表类簇个数,means代表类簇内数据对象的均值(这种均值是一种对类簇中心的描述),因此,k-means算法又称为k-均值算法。k-means算法是一种基于划分的聚类算法,以距离作为数据对象间相似性度量的标准,即数据对象间的距离越小,则它们的相似性越高,则它们越有可能在同一个类簇。数据对象间距离的计算有很多种,k-means算法通常采用欧氏距离来计算数据对象间的距离。下面给出欧式距离的计算公式:
其中,D表示数据对象的属性个数。
项目采用k-means聚类算法,通过设置不同的K值,来聚集距离较近的城市群。k-means算法根据预先设定的k值将样本分为k个簇,每个簇的均值用μk来表示,这些均值被看作每个簇的中心。k-means 算法的目的是要找到k个簇中心,使得每个样本离簇中心的欧式距离的平方误差之和最小:
其中,N表示样本总数,K表示簇的个数;rnk表示样本n是否在簇k内,若在则为1,反之为0;xn表示第n个样本点,μk表示第k个簇的均值;Ck表示第k个簇的样本集合。直接寻找rnk和μk来最小化J并不容易,所以k-means算法采取了贪心策略,采取迭代优化来求近似解:先固定μk,选择最优的rnk,只要将数据点归类到离其最近的那个中心就能保证J最小。下一步则固定rnk,再求最优的μk
如附图2所示,设置k=2,初始化2个类簇中心,分别为图中的红色和蓝色标记;然后计算各个数据对象到聚类中心的距离,把数据对象划分至距离其最近的聚类中心所在类簇中;接着根据所得类簇,使用所有点坐标的平均值来代表新的聚类中心;然后继续计算各个数据对象到聚类中心的距离,把数据对象划分至距离其最近的聚类中心所在类簇中;接着根据所得类簇,继续更新类簇中心。一直迭代,直到达到最大迭代次数,或者两次迭代的差值小于某一阈值时,迭代终止,得到最终聚类结果。传统的k-means算法的流程如附图3所示。
在城市聚类问题中,将城市的经纬度作为输入,然后设定K个簇中心,这时算法会在图中随机选择K 个点。地图中的每个城市都属于最近的一个簇中心,将属于同一个簇的城市经纬度求均值,得到新的簇中心,不断迭代,直至误差平方和J最小,得到城市聚类结果,如附图4所示。
根据附图4中的城市簇,计算两两之间的货运量,货运量通过合并相同城市间的货票数据得到。为了开发白货的主要运输方向,降低铁路物流成本,提高货物集结效率,货运量和运输距离需要达到一定的阈值。因此,根据铁路企业提供的运输距离和吨数要求,求出符合条件的城市簇对。
附图5、6、7展示了K值分别设置为50、30、20时,发送城市簇至到达城市簇总吨数大于100万吨且运输距离大于800千米的聚类结果。

Claims (5)

1.基于城市群白货流量的提高列车编组效率的城市聚类模型,其特征主要在于城市聚类和条件筛选;上述模型包含了以下步骤:
(1)读取城市经纬度;
(2)输入k-means聚类算法;
(3)计算城市簇之间的距离;
(4)按距离过滤城市簇对;
(5)计算城市簇之间的白货流量;
(6)按流量吨数过滤城市簇对。
2.权利要求1中所描述的(2)输入k-means聚类算法步骤,其特征在于k-means算法中的k代表类簇个数,means代表类簇内数据对象的均值(这种均值是一种对类簇中心的描述),因此k-means算法又称为k-均值算法;k-means算法是一种基于划分的聚类算法,以距离作为数据对象间相似性度量的标准,即数据对象间的距离越小,则它们的相似性越高,则它们越有可能在同一个类簇;数据对象间距离的计算有很多种,k-means算法通常采用欧氏距离来计算数据对象间的距离;下面给出欧式距离的计算公式,其中D表示数据对象的属性个数:
项目采用k-means聚类算法,通过设置不同的K值,来聚集距离较近的城市群;k-means算法根据预先设定的k值将样本分为k个簇,每个簇的均值用μk来表示,这些均值被看作每个簇的中心;
k-means算法的目的是要找到k个簇中心,使得每个样本离簇中心的欧式距离的平方误差之和最小:
其中,N表示样本总数,K表示簇的个数,rnk表示样本n是否在簇k内,若在则为1,反之为0,xn表示第n个样本点,μk表示第k个簇的均值,Ck表示第k个簇的样本集合;直接寻找rnk和μk来最小化J并不容易,所以k-means算法采取了贪心策略,采取迭代优化来求近似解:先固定μk,选择最优的rnk,只要将数据点归类到离其最近的那个中心就能保证J最小,下一步则固定rnk,再求最优的μk
3.权利要求1中所描述的(3)计算城市簇之间的距离,其特征在于利用经纬度的距离算法求解。
4.权利要求1中所描述的(5)计算城市簇之间的白货流量,其特征在于通过合并相同城市间的货票数据得到;权利要求1中所描述的(4)/(6)按距离/白货流量过滤城市簇对步骤,其特征在于为了开发白货的主要运输方向,降低铁路物流成本,提高货物集结效率,货运量和运输距离需要达到一定的阈值,因此根据铁路企业提供的运输距离和流量吨数要求,求出符合条件的城市簇对。
5.K值分别设置为50、30、20时,发送城市簇至到达城市簇总吨数大于100万吨且运输距离大于800千米的聚类结果。
CN201910479120.7A 2019-06-04 2019-06-04 基于城市群白货流量的提高列车编组效率的城市聚类模型 Active CN110175656B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910479120.7A CN110175656B (zh) 2019-06-04 2019-06-04 基于城市群白货流量的提高列车编组效率的城市聚类模型

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910479120.7A CN110175656B (zh) 2019-06-04 2019-06-04 基于城市群白货流量的提高列车编组效率的城市聚类模型

Publications (2)

Publication Number Publication Date
CN110175656A true CN110175656A (zh) 2019-08-27
CN110175656B CN110175656B (zh) 2021-08-31

Family

ID=67697666

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910479120.7A Active CN110175656B (zh) 2019-06-04 2019-06-04 基于城市群白货流量的提高列车编组效率的城市聚类模型

Country Status (1)

Country Link
CN (1) CN110175656B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111767355A (zh) * 2020-06-24 2020-10-13 中电科华云信息技术有限公司 一种基于活动中心点圈层扩散组织监控感知区的方法

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8861873B2 (en) * 2010-06-01 2014-10-14 Hewlett-Packard Development Company, L.P. Image clustering a personal clothing model
CN104217250A (zh) * 2014-08-07 2014-12-17 北京市交通信息中心 一种基于历史数据的城市轨道交通新线开通客流预测方法
US9075701B2 (en) * 2012-05-04 2015-07-07 Electronics And Telecommunications Research Institute Apparatus and method for monitoring abnormal state of vehicle using clustering technique
CN105117595A (zh) * 2015-08-19 2015-12-02 大连理工大学 一种基于浮动车数据的私家车出行数据集成方法
CN105206057A (zh) * 2015-09-30 2015-12-30 哈尔滨工业大学深圳研究生院 基于浮动车居民出行热点区域的检测方法及系统
CN105389639A (zh) * 2015-12-15 2016-03-09 上海汽车集团股份有限公司 基于机器学习的物流运输路径规划方法、装置及系统
CN106059816A (zh) * 2016-06-17 2016-10-26 中联物流(中国)有限公司 中转库选址方法和系统
CN106203895A (zh) * 2015-05-06 2016-12-07 重庆邮电大学 一种物流虚拟运行仿真系统
CN106886872A (zh) * 2017-01-20 2017-06-23 淮阴工学院 一种基于聚类和余弦相似度的物流推荐方法
CN108053062A (zh) * 2017-12-11 2018-05-18 北京航空航天大学 一种基于多源数据的定制公交线路生成方法
CN108764518A (zh) * 2018-04-10 2018-11-06 天津大学 一种基于物联网大数据的交通资源动态优化方法
US20180332480A1 (en) * 2017-05-10 2018-11-15 Facebook, Inc. Multi-Hop Wireless Network Planning
CN109359682A (zh) * 2018-10-11 2019-02-19 北京市交通信息中心 一种基于f-dbscan迭代聚类的机场巴士候选站点筛选方法

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8861873B2 (en) * 2010-06-01 2014-10-14 Hewlett-Packard Development Company, L.P. Image clustering a personal clothing model
US9075701B2 (en) * 2012-05-04 2015-07-07 Electronics And Telecommunications Research Institute Apparatus and method for monitoring abnormal state of vehicle using clustering technique
CN104217250A (zh) * 2014-08-07 2014-12-17 北京市交通信息中心 一种基于历史数据的城市轨道交通新线开通客流预测方法
CN106203895A (zh) * 2015-05-06 2016-12-07 重庆邮电大学 一种物流虚拟运行仿真系统
CN105117595A (zh) * 2015-08-19 2015-12-02 大连理工大学 一种基于浮动车数据的私家车出行数据集成方法
CN105206057A (zh) * 2015-09-30 2015-12-30 哈尔滨工业大学深圳研究生院 基于浮动车居民出行热点区域的检测方法及系统
CN105389639A (zh) * 2015-12-15 2016-03-09 上海汽车集团股份有限公司 基于机器学习的物流运输路径规划方法、装置及系统
CN106059816A (zh) * 2016-06-17 2016-10-26 中联物流(中国)有限公司 中转库选址方法和系统
CN106886872A (zh) * 2017-01-20 2017-06-23 淮阴工学院 一种基于聚类和余弦相似度的物流推荐方法
US20180332480A1 (en) * 2017-05-10 2018-11-15 Facebook, Inc. Multi-Hop Wireless Network Planning
CN108053062A (zh) * 2017-12-11 2018-05-18 北京航空航天大学 一种基于多源数据的定制公交线路生成方法
CN108764518A (zh) * 2018-04-10 2018-11-06 天津大学 一种基于物联网大数据的交通资源动态优化方法
CN109359682A (zh) * 2018-10-11 2019-02-19 北京市交通信息中心 一种基于f-dbscan迭代聚类的机场巴士候选站点筛选方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
卓金武 等: "《MATLAB在数学建模中的应用 第2版》", 30 September 2014, 北京航空航天大学出版社 *
王长琼 等: "基于谱聚类算法的城市快递客户聚类研究", 《武汉理工大学学报(信息与管理工程版)》 *
莫宗楠: "铁路零散白货快运班列开行方案研究", 《中国优秀硕士学位论文全文数据库》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111767355A (zh) * 2020-06-24 2020-10-13 中电科华云信息技术有限公司 一种基于活动中心点圈层扩散组织监控感知区的方法
CN111767355B (zh) * 2020-06-24 2024-02-27 中电科华云信息技术有限公司 一种基于活动中心点圈层扩散组织监控感知区的方法

Also Published As

Publication number Publication date
CN110175656B (zh) 2021-08-31

Similar Documents

Publication Publication Date Title
CN112543427B (zh) 基于信令轨迹及大数据分析识别城市交通走廊的方法与系统
CN105608505A (zh) 一种基于手机信令数据的居民轨道交通出行方式识别方法
CN109389163B (zh) 一种基于地形图的无人机影像分类系统及方法
CN106651027B (zh) 一种基于社交网络的互联网班车线路优化方法
CN108734129A (zh) 手机及车辆定位分析方法及系统
CN110472999B (zh) 基于地铁和共享单车数据的客流模式分析方法及装置
WO2022083166A1 (zh) 一种卡口数据缺失下的车辆行车轨迹重建方法及系统
CN107729938B (zh) 一种基于公交接驳辐射区特征的轨道站点分类方法
CN110008413A (zh) 一种交通出行问题查询方法和装置
CN110555992B (zh) 一种基于gps轨迹数据的出租车行驶路径信息提取方法
CN103473612A (zh) 面向超大规模物流配送的选址与运输优化方法
CN102346844B (zh) 一种货车下心盘螺栓丢失故障识别装置及其识别方法
CN103455578A (zh) 一种基于关联规则和双聚类的航空客户数据挖掘方法
CN105956542B (zh) 一种结构线束统计匹配的高分遥感影像道路提取方法
CN114363842B (zh) 基于手机信令数据的公交乘客下车站点预测方法及装置
CN114330106A (zh) 城市公共交通规划方法
CN110414113A (zh) 自动生成铁路站场平面总体布置图的方法
Rodrigues et al. Measures in sectorization problems
US11932290B2 (en) Systems and methods for auditing assets
TW202131221A (zh) 用於判定道路交會點之方法、資料處理設備及電腦程式產品
CN110175656A (zh) 基于城市群白货流量的提高列车编组效率的城市聚类模型
Choi Utilizing unet for the future traffic map prediction task traffic4cast challenge 2020
CN107067727B (zh) 一种基于模糊knn特征匹配的道路交通服务水平评价方法
CN115630988A (zh) 陆路综合交通可达性测算方法和装置
CN114358386A (zh) 一种基于预约出行需求的双出行模式合乘站点生成方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant