CN109711773A - 一种基于聚类算法的集装箱货物流向流量统计方法 - Google Patents
一种基于聚类算法的集装箱货物流向流量统计方法 Download PDFInfo
- Publication number
- CN109711773A CN109711773A CN201811513149.4A CN201811513149A CN109711773A CN 109711773 A CN109711773 A CN 109711773A CN 201811513149 A CN201811513149 A CN 201811513149A CN 109711773 A CN109711773 A CN 109711773A
- Authority
- CN
- China
- Prior art keywords
- standard attribute
- file
- standard
- container
- container cargo
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及运输数据统计分析领域,提供一种基于聚类算法的集装箱货物流向流量统计方法,包括:根据集装箱货物运输单据内容形成标准属性模板、将集装箱运输单据融合成标准属性文件、对所有标准属性文件进行聚类、选取标准属性文件Nx所在的簇、将该簇中所有运输单据基于规则进行分类、计算运输节点之间的集装箱运输量、输出信息。本发明能够对某一特定集装箱货物的运输情况进行检索,不仅能够提高对物流中海量运输单据信息的利用效率,而且能够为需求用户提供指定的具体信息。
Description
技术领域
本发明涉及运输数据统计分析领域,提供一种基于聚类算法的集装箱货物流向流量统计方法。
背景技术
集装箱货物流量及其流向是衡量地区之间物流运输往来情况的关键指标。当前国内乃至全球货运量都在逐年上涨,各个国家、港口都对自身集装箱信息进行统计。特别是随着经济的持续繁荣发展,各种有关货运数据信息量飞速增长,各个统计主体都积累了大量的运输数据。这些数据是主体掌握自身发展状况、预测发展前景、制定战略目标的重要依据。能否有效地利用这些数据,对未来物流行业的发展至关重要。但是各运输主体的信息数据一般只包括粗略的统计信息,如吞吐量、货种、货重、箱重、装车量、货物运输量、货物周转量等等。这些数据来源信息庞大,各个港口的统计口径并不一致,使得计算集装箱整体的流动情况很困难。
但是目前多数对集装箱货物数据信息的研究,都着眼于对规范统计管理指标体系、或对现有数据进行分析预测。而对于某一特定集装箱货物的具体运输情况往往隐藏于海量数据之中,给需要这些特定属性信息的需求者带来极大的不便。
发明内容
本发明的目的在于,针对现有技术的缺陷,提供一种基于聚类算法的集装箱货物流向流量统计方法,其能够对某一特定集装箱货物的运输情况进行检索,不仅能够提高对物流中海量运输单据信息的利用效率,而且能够为需求用户提供指定的具体信息。
本发明实现上述目的所采用的技术方案如下。
一种基于聚类算法的集装箱货物流向流量统计方法,包括以下步骤:
(1)根据集装箱货物运输单据内容形成标准属性模板;
(2)将所有集装箱货物运输单据融合成标准属性文件;
(3)对所有标准属性文件进行聚类;
(4)选取标准属性文件Nx所在的簇;
(5)将步骤(4)选取的簇中所有标准属性文件基于规则进行分类;
(6)计算运输节点之间的集装箱运输量;
(7)输出信息。
在上述技术方案中,步骤(1)所述的“根据集装箱货物运输单据内容形成标准属性模板”,集装箱货物运输单据有多种种类,如海运提单、国际铁路货物联运运单等等。这些集装箱货物运输单据一般都包括商品名称、件数、毛重、尺码、承运组织、运送组织、交付组织、发货人、收货人、装运地、卸货地、最终目的地等属性。将集装箱货物运输单据按照以上属性整合成一个标准属性模板。
在上述技术方案中,步骤(2)所述的“将集装箱货物运输单据融合成标准属性文件”,将各港口所有集装箱运输单据与属性模板融合,生成标准属性文件集N={N1,N2,......Nn},Ni代表第i个运输单据形成的标准属性文件,i=1,2,......,n;将用户需求与属性模板融合,生成标准属性文件Nx。
在上述技术方案中,步骤(3)所述的“对所有标准属性文件进行聚类”,将标准属性文件集N={N1,N2,......Nn}和标准属性文件Nx汇总形成集合,每个属性文件都是集合中的对象,属性文件的各个属性是对象的特征;利用K-均值聚类方法将集合中的对象,根据对象的特征划分成不同的簇。
在上述技术方案中,步骤(4)所述的“选取标准属性文件Nx所在的簇”,选择标准属性文件Nx所在的簇分类,提取簇中其他与标准属性文件Nx相似的标准属性文件,即标准属性集Ns={Ns1,Ns2,……Nsm},其中m≤n。
在上述技术方案中,步骤(5)所述的“基于规则进行分类”,使用IF-THEN规则进行分类。
IF-THEN规则,使用基于规则的序,根据规则质量的度量,把规则组织成一个优先权列表。在使用规则序时,规则集成为决策表。使用规则序,最先出现在决策表中的被触发的规则具有最高优先权。将标准属性文件Ns={Ns1,Ns2,……Nsm}分为,与标准属性文件Nx相同装运地和卸货地的集合Y,Ny={Ny1,Ny2,……,Nyr},r≤m≤n。
在上述技术方案中,步骤(6)所述的“计算运输节点之间的集装箱运输量”,根据标准属性集合Ny={Ny1,Ny2,……,Nyr},提取Ny中的各毛重属性ωtfg,即装运地Vf和卸货地Vg之间的流量ω,由下式计算
在上述技术方案中,步骤(7)所述的“输出信息”,输出集合{装运地Vf、卸货地Vg、装运地Vf与卸货地Vg之间的流量ω}。
本发明基于聚类算法的集装箱货物流向流量统计方法,对各个运输节点中的海量运输单据进行汇总,并与标准模板相融合,形成标准属性文件。然后对标准属性文件进行数据挖掘,将与需求相似的集装箱运输单据提取出来,大大缩小搜索域。最后根据特定需求分类、并汇总,得出港口集装箱流向和流量。因此,本发明可以节约需求者在海量数据中搜索的人力物力,提高搜索的准确性,还能够提高对物流中海量运输单据信息的利用效率,有利于各主体方便快捷获取特定信息,为预测、计划提供有力支撑。
附图说明
图1是本发明实施例方法的流程图。
图2是本发明实施例使用IF-THEN规则对标准属性文件分类示意图。
具体实施方式
下面将结合附图,对本发明中的技术方案进行清楚、完整地描述。
如图1所示,本发明实施例一种基于聚类算法的集装箱货物流向流量统计方法,包括以下步骤:
(1)根据集装箱货物运输单据内容形成标准属性模板;
(2)将所有集装箱货物运输单据融合成标准属性文件;
(3)对所有标准属性文件进行聚类;
(4)选取标准属性文件Nx所在的簇;
(5)将步骤(4)选取的簇中所有标准属性文件基于规则进行分类;
(6)计算运输节点之间的集装箱运输量;
(7)输出信息。
所述的根据集装箱货物运输单据内容形成标准属性模板,集装箱货物运输单据信息包括:商品名称、件数、毛重、尺码、承运组织、运送组织、交付组织、发货人、收货人、装运地、卸货地、最终目的地,根据这些属性信息整理合成一个标准属性模板。
所述的融合生成标准属性文件,首先将各运输节点所有集装箱运输单据与标准属性模板融合,生成标准属性文件集N={N1,N2,......Nn},Ni代表第i个运输单据形成的标准属性文件,i=1,2,......,n;再者将用户具体需求进行提取,与属性模板融合后生成标准属性文件Nx。
进一步地,所述的对所有标准属性文件进行聚类,将标准属性文件集N={N1,N2,......Nn}和标准属性文件Nx汇总形成新的集合,每个属性文件都是集合中的单个对象,各个标准属性文件的属性是对应对象的特征;利用K-均值将可将集合根据特征划分成不同的簇。
利用K-均值将集合划分成不同的簇。
K-均值算法流程如下:
从集合M={Mi}中任意选择k个对象作为初始簇中心;
根据簇中对象的均值,将每个对象分配到最相似的簇;
更新簇均值,即重新计算每个簇中对象的均值;
重复迭代,直到不再发生变化。
所述的选取标准属性文件Nx所在的簇,选择标准属性文件Nx所在的簇分类,提取簇中其他与标准属性文件Nx相似的标准属性文件。
所述的将簇中所有标准属性文件基于规则进行分类,提取簇中其他与标准属性文件Nx相似的标准属性文件,使用IF-THEN规则对他们进行分类。
所述的IF-THEN规则,使用基于规则的序,根据规则质量的度量,把规则组织成一个优先权列表:1商品名称、2装运地、3卸货地。在使用规则序时,规则集成为决策表。使用规则序,最先出现在决策表中的被触发的规则具有最高优先权。
如图2所示,需求信息为在标准属性文件Nx中的装运地P1和卸货地P2之间运输的商品A的数量。则可提取商品名称A、装运地P1和卸货地P2,根据IF-THEN规则,得到类W1、类W2、类W3、类W4,其中类W3就是需求所指的装运地P1和卸货地P2的货物Y集合,Ny={Ny1,Ny2,……,Nyr},r≤m≤n。
所述的计算港口之间的集装箱运输量,根据标准属性集合Ny={Ny1,Ny2,……,Nyr},提取Ny中的各毛重属性ωtfg,即装运地Vf和卸货地Vg之间的流量ω。由下式计算:
所述的输出信息,输出集合{装运地Vf、卸货地Vg、装运地Vf与卸货地Va之间的流量ω}。
本说明书中未作详细描述的内容,属于本专业技术人员公知的现有技术。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。
Claims (8)
1.一种基于聚类算法的集装箱货物流向流量统计方法,其特征在于该方法包括以下步骤:
(1)根据集装箱货物运输单据内容形成标准属性模板;
(2)将所有集装箱运输单据融合成标准属性文件;
(3)对所有标准属性文件进行聚类;
(4)选取标准属性文件Nx所在的簇;
(5)将步骤(4)选取的簇中所有标准属性文件基于规则进行分类;
(6)计算运输节点之间的集装箱运输量;
(7)输出信息。
2.根据权利要求1所述的基于聚类算法的集装箱货物流向流量统计方法,其特征在于:步骤(1)所述的“根据集装箱货物运输单据内容形成标准属性模板”,集装箱货物运输单据内容包括商品名称、件数、毛重、尺码、承运组织、运送组织、交付组织、发货人、收货人、装运地、卸货地、最终目的地,将集装箱货物运输单据按照以上属性整合成一个标准属性模板。
3.根据权利要求1所述的基于聚类算法的集装箱货物流向流量统计方法,其特征在于:步骤(2)所述的“将所有集装箱运输单据融合成标准属性文件”,将各港口所有集装箱运输单据与标准属性模板融合,生成标准属性文件集N={N1,N2,......Nn},Ni代表第i个运输单据形成的标准属性文件,i=1,2,……,n;将用户需求与标准属性模板融合,生成标准属性文件Nx。
4.根据权利要求1所述的基于聚类算法的集装箱货物流向流量统计方法,其特征在于:步骤(3)所述的“对所有标准属性文件进行聚类”,将标准属性文件集N={N1,N2,......Nn}和标准属性文件Nx汇总形成集合,每个属性文件都是集合中的对象,属性文件的各个属性是对象的特征;利用K-均值聚类方法将集合中的对象,根据对象的特征划分成不同的簇。
5.根据权利要求1所述的基于聚类算法的集装箱货物流向流量统计方法,其特征在于:步骤(4)所述的“选取标准属性文件Nx所在的簇”,选择标准属性文件Nx所在的簇分类,提取簇中其他与标准属性文件Nx相似的标准属性文件,即标准属性集Ns={Ns1,Ns2,……Nsm},其中m≤n。
6.根据权利要求1所述的基于聚类算法的集装箱货物流向流量统计方法,其特征在于:步骤(5)所述的“基于规则进行分类”,使用IF-THEN规则进行分类,将标准属性集Ns={Ns1,Ns2,……Nsm}分为与标准属性文件Nx相同装运地和卸货地的集合Y,Ny={Ny1,Ny2,……,Nyr},r≤m≤n。
7.根据权利要求1所述的基于聚类算法的集装箱货物流向流量统计方法,其特征在于:步骤(6)所述的“计算运输节点之间的集装箱运输量”,根据标准属性集合Y,Ny={Ny1,Ny2,……,Nyr},提取Ny中的各毛重属性ωtfg,即装运地Vf和卸货地Vg之间的流量ω,由下式计算
8.根据权利要求1所述的基于聚类算法的集装箱货物流向流量统计方法,其特征在于:步骤(7)所述的“输出信息”,输出集合{装运地Vf、卸货地Vg、装运地Vf与卸货地Vg之间的流量ω}。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811513149.4A CN109711773B (zh) | 2018-12-11 | 2018-12-11 | 一种基于聚类算法的集装箱货物流向流量统计方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811513149.4A CN109711773B (zh) | 2018-12-11 | 2018-12-11 | 一种基于聚类算法的集装箱货物流向流量统计方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109711773A true CN109711773A (zh) | 2019-05-03 |
CN109711773B CN109711773B (zh) | 2022-08-26 |
Family
ID=66255682
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811513149.4A Active CN109711773B (zh) | 2018-12-11 | 2018-12-11 | 一种基于聚类算法的集装箱货物流向流量统计方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109711773B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111126910A (zh) * | 2019-12-20 | 2020-05-08 | 贵州黔岸科技有限公司 | 基于物联网的运输全程管控系统及方法 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060015396A1 (en) * | 2004-05-13 | 2006-01-19 | Johannes Blomeyer | System and method for optimizing the utilization of a cargo space and for maximizing the revenue from a cargo transport |
JP2011123690A (ja) * | 2009-12-11 | 2011-06-23 | Railway Technical Research Institute | 貨物駅と線区に基づいた貨物流動計測システム |
CN103425740A (zh) * | 2013-07-11 | 2013-12-04 | 南京邮电大学 | 一种面向物联网的基于语义聚类的物资信息检索方法 |
CN104751163A (zh) * | 2013-12-27 | 2015-07-01 | 同方威视技术股份有限公司 | 对货物进行自动分类识别的透视检查系统和方法 |
CN106557829A (zh) * | 2015-09-30 | 2017-04-05 | 百度在线网络技术(北京)有限公司 | 用车业务中获取需求与运力不匹配区域的方法和装置 |
CN106919577A (zh) * | 2015-12-24 | 2017-07-04 | 北京奇虎科技有限公司 | 基于搜索词进行搜索推荐的方法、装置和搜索引擎 |
CN107844885A (zh) * | 2017-09-05 | 2018-03-27 | 北京小度信息科技有限公司 | 信息推送方法和装置 |
US20180121829A1 (en) * | 2016-11-01 | 2018-05-03 | International Business Machines Corporation | Training a machine to automate spot pricing of logistics services in a large-scale network |
CN108038651A (zh) * | 2017-12-29 | 2018-05-15 | 西华大学 | 一种物流运输监控追溯管理系统 |
CN108268465A (zh) * | 2016-12-30 | 2018-07-10 | 广东精点数据科技股份有限公司 | 一种面向混合数据模型的文本搜索技术 |
CN108280213A (zh) * | 2018-01-31 | 2018-07-13 | 佛山市聚成知识产权服务有限公司 | 一种大数据的分析系统 |
-
2018
- 2018-12-11 CN CN201811513149.4A patent/CN109711773B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060015396A1 (en) * | 2004-05-13 | 2006-01-19 | Johannes Blomeyer | System and method for optimizing the utilization of a cargo space and for maximizing the revenue from a cargo transport |
JP2011123690A (ja) * | 2009-12-11 | 2011-06-23 | Railway Technical Research Institute | 貨物駅と線区に基づいた貨物流動計測システム |
CN103425740A (zh) * | 2013-07-11 | 2013-12-04 | 南京邮电大学 | 一种面向物联网的基于语义聚类的物资信息检索方法 |
CN104751163A (zh) * | 2013-12-27 | 2015-07-01 | 同方威视技术股份有限公司 | 对货物进行自动分类识别的透视检查系统和方法 |
CN106557829A (zh) * | 2015-09-30 | 2017-04-05 | 百度在线网络技术(北京)有限公司 | 用车业务中获取需求与运力不匹配区域的方法和装置 |
CN106919577A (zh) * | 2015-12-24 | 2017-07-04 | 北京奇虎科技有限公司 | 基于搜索词进行搜索推荐的方法、装置和搜索引擎 |
US20180121829A1 (en) * | 2016-11-01 | 2018-05-03 | International Business Machines Corporation | Training a machine to automate spot pricing of logistics services in a large-scale network |
CN108268465A (zh) * | 2016-12-30 | 2018-07-10 | 广东精点数据科技股份有限公司 | 一种面向混合数据模型的文本搜索技术 |
CN107844885A (zh) * | 2017-09-05 | 2018-03-27 | 北京小度信息科技有限公司 | 信息推送方法和装置 |
CN108038651A (zh) * | 2017-12-29 | 2018-05-15 | 西华大学 | 一种物流运输监控追溯管理系统 |
CN108280213A (zh) * | 2018-01-31 | 2018-07-13 | 佛山市聚成知识产权服务有限公司 | 一种大数据的分析系统 |
Non-Patent Citations (1)
Title |
---|
崔艳萍等: "集装箱铁水联运业务流程及共享信息研究", 《铁道货运》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111126910A (zh) * | 2019-12-20 | 2020-05-08 | 贵州黔岸科技有限公司 | 基于物联网的运输全程管控系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109711773B (zh) | 2022-08-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Gu et al. | A hierarchical solution evaluation method and a hybrid algorithm for the vehicle routing problem with drones and multiple visits | |
CN101535971B (zh) | 预报集装箱密度的系统和方法 | |
CN107609719A (zh) | 一种物流作业运输线路优化系统及其使用方法 | |
KR101965598B1 (ko) | 이상탐지시스템 내의 데이터에 대한 이상을 탐지하는 장치 및 그 방법 | |
Wang et al. | The effect of distance on cargo flows: a case study of Chinese imports and their hinterland destinations | |
CN108038651A (zh) | 一种物流运输监控追溯管理系统 | |
CN106529854A (zh) | 一种基于分类算法的快递配送、接收系统及方法 | |
Pavlenko et al. | Management of the grain supply chain during the conflict period: case study Ukraine. | |
CN106845702A (zh) | 一种基于公共交通的快递配送方法 | |
CN109784819A (zh) | 货运安检分类分级系统及其分级方法 | |
CN109118138A (zh) | 一票多件预先生成面单的方法及计算机可读存储介质 | |
CN105303349A (zh) | 一种铁路货运业务预警方法 | |
JP2000339373A (ja) | 運送パターン選出方法およびその装置並びに記録媒体 | |
CN109711773A (zh) | 一种基于聚类算法的集装箱货物流向流量统计方法 | |
Thompson et al. | Shared freight networks in metropolitan areas | |
Hsu et al. | Direct versus terminal routing on a maritime hub-and-spoke container network | |
CN108499881A (zh) | 基于NuPIC的快递智能分拣算法与系统 | |
Kotowska et al. | The decision tree approach for the choice of freight transport mode: the shippers’ perspective in terms of seaport hinterland connections | |
Reynolds-Feighan | Comparative analysis of air freight networks in regional markets around the globe | |
Trimmer et al. | Calculating maritime shipping emissions per traded commodity | |
Kurenkov et al. | Development of logistics models for oil cargo transportation to reduce logistics costs and improve wagon mileage | |
Mohri et al. | Modeling the container selection for freight transportation: case study of Iran | |
Park et al. | Service model development and importance analysis using shared economic service-As a specialization center for mail service | |
Tae-Woo Lee et al. | Integrated transport and logistics for sustainable global trade | |
Larni-Fooeik et al. | Insights into the application of the traveling salesman problem to logistics without considering financial risk: A bibliometric study |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |