CN112132184B - 一种基于n阶近邻分析聚类的配送中心选址方法 - Google Patents

一种基于n阶近邻分析聚类的配送中心选址方法 Download PDF

Info

Publication number
CN112132184B
CN112132184B CN202010848654.5A CN202010848654A CN112132184B CN 112132184 B CN112132184 B CN 112132184B CN 202010848654 A CN202010848654 A CN 202010848654A CN 112132184 B CN112132184 B CN 112132184B
Authority
CN
China
Prior art keywords
points
sample point
sample
dataset
order neighbor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010848654.5A
Other languages
English (en)
Other versions
CN112132184A (zh
Inventor
张贵军
陈驰
武楚雄
王浩文
李亭
周晓根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN202010848654.5A priority Critical patent/CN112132184B/zh
Publication of CN112132184A publication Critical patent/CN112132184A/zh
Application granted granted Critical
Publication of CN112132184B publication Critical patent/CN112132184B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/083Shipping

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)
  • Complex Calculations (AREA)

Abstract

一种基于N阶近邻分析聚类的配送中心选址方法,首先,根据候选地址的地位位置信息,初始化研究对象的样本数据集;然后,计算样本点的N阶近邻距离和方差值,结合次序统计的相关原理来分析样本数据点簇间特性,得到合适的聚类数目K值;最终,结合聚类算法将样本数据集划分为簇内相似度高的K的簇,最终均值向量对应的候选点即为配送中心的最佳选址。本发明提供一种实用性强的基于N阶近邻分析聚类簇的配送中心选址方法。

Description

一种基于N阶近邻分析聚类的配送中心选址方法
技术领域
本发明涉及机器学习、统计学分析、选址规划、模式识别等领域,尤其涉及的是一种基于N阶近邻分析聚类的配送中心选址方法。
背景技术
物流配送中心选址问题是指在一个具有若干供应网点的区域内,选一个或者多个地址设置物流配送中心的规划过程,它在整个物流系统中占有非常重要的地位,属于物流管理战略层的研究问题。由于配送中心选址的决策不仅直接关系到日后配送中心自身的运营成本和服务水平,而且关系到整个社会物流系统的合理化,同时配送中心的建设投资大、周期长、回收缓慢,且一经选定后就将长期经营,因此配送中心选址是配送中心建设项目规划中首要也是至关重要的环节。正是基于配送中心位置的重要作用,迫切需要对其选址问题开展研究。
近年来,随着人工智能领域的不断发展,机器学习领域的研究方法,被成功地应用于许多传统领域,并且取得了不错的成果。聚类分析是机器学习领域中常用的无监督学习方法,它根据对象之间的差异性,把不同类的对象区分开。作为数据分析的工具,其重要性在各个领域都得到了广泛的认可,聚类分析的目的是寻找数据集中的自然分组,将数据集分为几个差异明显的簇,簇是指相似元素的集合,聚类后的每一个簇内数据点的相似程度高,不同簇内的数据点差异性大。
目前,针对配送中心选址问题,通常采用的解析法、最优化规划方法、启发式算法等,此类方法通常求解时间复杂度高,求解精度很难保证,如启发式算法,在寻优求解的过程中,常常会陷入局部最优解,导致最终的求解结果出现偏差。以配送中心的候选点为研究对象,采用聚类的方式,将候选点划分为若干个合适的簇,选取最终各个聚类簇的聚类中心作为配送中心,也是一种效率较高的解决方案,但聚类算法大多数需要在算法运行前给定聚类簇的个数,才能很好地进行。然而,在大部分的实际应用过程中,通常聚类簇的个数是不可能事先知道的,而且也很难预先指定聚类个数,因此,如何选择恰当的聚类个数是一个非常复杂而又必须面对的问题。
因此,目前的配送中心选址方法是存在很大的局限性,很难保证问题求解的精准性、求解的时效性,需要改进。
发明内容
为了解决现有的配送中心选址方法求解问题的精度低,时效性差的问题,本发明提出了一种基于N阶近邻分析聚类的配送中心选址方法,通过分析研究对象点分布特性,采用基于N阶近邻分析自适应地确定出合适的聚类簇数目,以此来指导聚类算法完成对配送中心候选点的聚类划分,选取聚类后的每个簇中的聚类中心作为配送中心。
本发明解决其技术问题所采用的技术方案是:
一种基于N阶近邻分析聚类的配送中心选址方法,包括以下步骤:
1)根据候选点的地理位置信息,初始化为二维地理坐标特征的样本点数据集D={x1,x2,...,xM},M为候选点的数量,初始化聚类数目K=1;
2)定义为样本点xi的一阶近邻距离,即xi与数据集中其他样本点之间的最近距离,/>为样本点xi的二阶近邻距离,即xi与数据集中其他样本点之间的第二近距离;依次类推,/>为xi的n阶近邻距离;
3)计算样本点的n阶近邻距离,过程如下:
3.1)从数据集D中取出一个目标样本点xi,i∈{1,2,...,M};
3.2)再从数据集D中取出不同于xi的一个样本点xj,j∈{1,2,...,M};
3.3)计算两个样本点xi和xj之间的欧式距离dij,其中dij=||xi-xj||2
3.4)迭代步骤3.2)和步骤3.3)直到xj取完数据集中除xi之外的所有点,再将所求的距离按照从小到大排序,即得到样本点xi的n阶近邻距离,其中n∈{1,2,..,M-1};
3.5)更新目标样本点xi,即从数据集中随机取出新的目标样本点xi′,令xi=xi′,迭代步骤3.2)、3.3)和步骤3.4),直到xi取完数据集中的所有样本点为止;
4)计算样本点的n阶近邻距离的平均值和平方均值/>其中/> 其中n∈{1,2,..,M-1};
5)分析数据集中样本点之间的离散程度,确定合适的聚类数目K值,过程如下:
5.1)计算数据集中样本点的N阶近邻方差其中n∈{1,2,...,M-1};
5.2)根据次序统计的相关原理,当满足时,/>和n+1满足线性关系,其中ε是趋近于0的数;
5.3)根据5.1)计算得到的各个样本点之间簇间方差的结果,代入中,当满足该式的不等关系时,更新K=K+1;
6)从数据集D中随机选取K个数据点作为聚类的初始均值向量T={t1,t2,L,tK};
7)计算样本点xi到各均值向量tk的距离:dist(xi,tk)=||xi-tk||2,根据距离最近的均值向量确定xi的簇标记:λi=arg mink∈{1,2,L,K} dist(xi,tk),将样本点xi划入相应的簇;
8)更新均值向量tk:计算当前簇中每一个样本点到其他样本点的距离之和,并将距离之和最小的样本点记为新的均值向量t′k,若tk′≠tk,则令tk=tk′,迭代步骤7),否则,进行步骤9);
9)当前均值向量tk均不再发生变化,将聚类后的簇划分出来,此时最终的均值向量集合T中的K个均值向量所对应的候选点即为配送中心的最佳选址位置。
本发明的有益效果为:在普遍缺少先验知识的情况下,通过计算研究对象点的N阶近邻距离,分析得到当前研究对象合适的聚类簇数目,从而指导聚类算法完成对候选点的聚类划分,实现了实用性强、效率高的配送中心选址方法。
附图说明
图1是一种基于N阶近邻分析聚类的配送中心选址方法流程图。
图2是配送中心候选点的分布图。
图3是配送中心选址结果分布图。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1至图3,一种基于N阶近邻分析聚类的配送中心选址方法,包括以下步骤:
1)根据候选点的地理位置信息,初始化为二维地理坐标特征的样本点数据集D={x1,x2,...,xM},M为候选点的数量,初始化聚类数目K=1;
2)定义为样本点xi的一阶近邻距离,即xi与数据集中其他样本点之间的最近距离,/>为样本点xi的二阶近邻距离,即xi与数据集中其他样本点之间的第二近距离;依次类推,/>为xi的n阶近邻距离;
3)计算样本点的n阶近邻距离,过程如下:
3.1)从数据集D中取出一个目标样本点xi,i∈{1,2,...,M};
3.2)再从数据集D中取出不同于xi的一个样本点xj,j∈{1,2,...,M};
3.3)计算两个样本点xi和xj之间的欧式距离dij,其中dij=||xi-xj||2
3.4)迭代步骤3.2)和步骤3.3)直到xj取完数据集中除xi之外的所有点,再将所求的距离按照从小到大排序,即得到样本点xi的n阶近邻距离,其中n∈{1,2,..,M-1};
3.5)更新目标样本点xi,即从数据集中随机取出新的目标样本点xi′,令xi=xi′,迭代步骤3.2)、3.3)和步骤3.4),直到xi取完数据集中的所有样本点为止;
4)计算样本点的n阶近邻距离的平均值和平方均值/>其中/> 其中n∈{1,2,..,M-1};
5)分析数据集中样本点之间的离散程度,确定合适的聚类数目K值,过程如下:
5.1)计算数据集中样本点的N阶近邻方差其中n∈{1,2,...,M-1};
5.2)根据次序统计的相关原理,当满足时,/>和n+1满足线性关系,其中ε是趋近于0的数;
5.3)根据5.1)计算得到的各个样本点之间簇间方差的结果,代入中,当满足该式的不等关系时,更新K=K+1;
6)从数据集D中随机选取K个数据点作为聚类的初始均值向量T={t1,t2,L,tK};
7)计算样本点xi到各均值向量tk的距离:dist(xi,tk)=||xi-tk||2,根据距离最近的均值向量确定xi的簇标记:λi=arg mink∈{1,2,L,K} dist(xi,tk),将样本点xi划入相应的簇;
8)更新均值向量tk:计算当前簇中每一个样本点到其他样本点的距离之和,并将距离之和最小的样本点记为新的均值向量t′k,若tk′≠tk,则令tk=tk′,迭代步骤7),否则,进行步骤9);
9)当前均值向量tk均不再发生变化,将聚类后的簇划分出来,此时最终的均值向量集合T中的K个均值向量所对应的候选点即为配送中心的最佳选址位置。
本实施例以从29个候选地址中选取合适的若干个配送中心为例,一种基于N阶近邻分析的聚类簇个数确定方法,包括以下步骤:
1)根据候选点的地理位置信息,初始化为二维地理坐标特征的样本点数据集D={x1,x2,...,xM},候选点的数量M=29,初始化聚类数目K=1;
2)定义为样本点xi的一阶近邻距离,即xi与数据集中其他样本点之间的最近距离,/>为样本点xi的二阶近邻距离,即xi与数据集中其他样本点之间的第二近距离;依次类推,/>为xi的n阶近邻距离;
3)计算样本点的n阶近邻距离,过程如下:
3.1)从数据集D中取出一个目标样本点xi,i∈{1,2,...,M};
3.2)再从数据集D中取出不同于xi的一个样本点xj,j∈{1,2,...,M};
3.3)计算两个样本点xi和xj之间的欧式距离dij,其中dij=||xi-xj||2
3.4)迭代步骤3.2)和步骤3.3)直到xj取完数据集中除xi之外的所有点,再将所求的距离按照从小到大排序,即得到样本点xi的n阶近邻距离,其中n∈{1,2,..,M-1};
3.5)更新目标样本点xi,即从数据集中随机取出新的目标样本点xi′,令xi=xi′,迭代步骤3.2)、3.3)和步骤3.4),直到xi取完数据集中的所有样本点为止;
4)计算样本点的n阶近邻距离的平均值和平方均值/>其中/>
5)分析数据集中样本点之间的离散程度,确定合适的聚类数目K值,过程如下:
5.1)计算数据集中样本点的N阶近邻方差其中n∈{1,2,...,M-1};
5.2)根据次序统计的相关原理,当满足时,/>和n+1满足线性关系,其中ε=0.01;
5.3)根据5.1)计算得到的各个样本点之间簇间方差的结果,代入中,当满足该式的不等关系时,更新K=K+1;
6)从数据集D中随机选取K个数据点作为聚类的初始均值向量T={t1,t2,L,tK};
7)计算样本点xi到各均值向量tk的距离:dist(xi,tk)=||xi-tk||2,根据距离最近的均值向量确定xi的簇标记:λi=arg mink∈{1,2,L,K} dist(xi,tk),将样本点xi划入相应的簇;
8)更新均值向量tk:计算当前簇中每一个样本点到其他样本点的距离之和,并将距离之和最小的样本点记为新的均值向量t′k,若tk′≠tk,则令tk=tk′,迭代步骤7),否则,进行步骤9);
9)直到当前的均值向量tk均不再发生变化,将聚类后的簇划分出来,此时最终的均值向量集合T中的5个均值向量所对应的候选点,即[5,12,23,27,29]为配送中心的最佳选址位置。
以从29个候选地址中选取合适的若干个配送中心为例,运用以上方法得到该数据集的最佳聚类簇的个数为5,其算法流程如图1所示,配送中心候选点的分布图如图2所示;配送中心选址的结果如图3所示。
以上阐述是本发明给出的一个实施的预测效果,本发明不仅适合上述实施例,在不偏离本发明基本思想及不超出本发明实质内容的前提下可对其做种种改进加以实施。

Claims (1)

1.一种基于N阶近邻分析聚类的配送中心选址方法,其特征在于:所述方法包括以下步骤:
1)根据候选点的地理位置信息,初始化为二维地理坐标特征的样本点数据集D={x1,x2,...,xM},M为候选点的数量,初始化聚类数目K=1;
2)定义为样本点xi的一阶近邻距离,即xi与数据集中其他样本点之间的最近距离,为样本点xi的二阶近邻距离,即xi与数据集中其他样本点之间的第二近距离;依次类推,为xi的n阶近邻距离;
3)计算样本点的n阶近邻距离,过程如下:
3.1)从数据集D中取出一个目标样本点xi,i∈{1,2,...,M};
3.2)再从数据集D中取出不同于xi的一个样本点xj,j∈{1,2,...,M};
3.3)计算两个样本点xi和xj之间的欧式距离dij,其中dij=||xi-xj||2
3.4)迭代步骤3.2)和步骤3.3)直到xj取完数据集中除xi之外的所有点,再将所求的距离按照从小到大排序,即得到样本点xi的n阶近邻距离,其中n∈{1,2,..,M-1};
3.5)更新目标样本点xi,即从数据集中随机取出新的目标样本点xi′,令xi=xi′,迭代步骤3.2)、3.3)和步骤3.4),直到xi取完数据集中的所有样本点为止;
4)计算样本点的n阶近邻距离的平均值和平方均值/>其中/>
5)分析数据集中样本点之间的离散程度,确定合适的聚类数目K值,过程如下:
5.1)计算数据集中样本点的N阶近邻方差其中n∈{1,2,...,M-1};
5.2)根据次序统计的相关原理,当满足时,/>和n+1满足线性关系,其中ε是趋近于0的数;
5.3)根据5.1)计算得到的各个样本点之间簇间方差的结果,代入中,当满足该式的不等关系时,更新K=K+1;
6)从数据集D中随机选取K个数据点作为聚类的初始均值向量T={t1,t2,L,tK};
7)计算样本点xi到各均值向量tk的距离:dist(xi,tk)=||xi-tk||2,根据距离最近的均值向量确定xi的簇标记:λi=arg mink∈{1,2,L,K}dist(xi,tk),将样本点xi划入相应的簇;
8)更新均值向量tk:计算当前簇中每一个样本点到其他样本点的距离之和,并将距离之和最小的样本点记为新的均值向量t′k,若tk′≠tk,则令tk=tk′,迭代步骤7),否则,进行步骤9);
9)当前均值向量tk均不再发生变化,将聚类后的簇划分出来,此时最终的均值向量集合T中的K个均值向量所对应的候选点即为配送中心的最佳选址位置。
CN202010848654.5A 2020-08-21 2020-08-21 一种基于n阶近邻分析聚类的配送中心选址方法 Active CN112132184B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010848654.5A CN112132184B (zh) 2020-08-21 2020-08-21 一种基于n阶近邻分析聚类的配送中心选址方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010848654.5A CN112132184B (zh) 2020-08-21 2020-08-21 一种基于n阶近邻分析聚类的配送中心选址方法

Publications (2)

Publication Number Publication Date
CN112132184A CN112132184A (zh) 2020-12-25
CN112132184B true CN112132184B (zh) 2024-05-10

Family

ID=73851034

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010848654.5A Active CN112132184B (zh) 2020-08-21 2020-08-21 一种基于n阶近邻分析聚类的配送中心选址方法

Country Status (1)

Country Link
CN (1) CN112132184B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114742593A (zh) * 2022-04-22 2022-07-12 北京信息科技大学 一种物流仓储中心优化选址方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103593747A (zh) * 2013-11-07 2014-02-19 银江股份有限公司 一种基于meanshift分类的大规模客户点分类配送方法
WO2019242520A1 (zh) * 2018-06-20 2019-12-26 菜鸟智能物流控股有限公司 物流配送站点规划方法和服务器
CN110619351A (zh) * 2019-08-14 2019-12-27 浙江工业大学 一种基于改进k-means算法的菜鸟驿站选址方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103593747A (zh) * 2013-11-07 2014-02-19 银江股份有限公司 一种基于meanshift分类的大规模客户点分类配送方法
WO2019242520A1 (zh) * 2018-06-20 2019-12-26 菜鸟智能物流控股有限公司 物流配送站点规划方法和服务器
CN110619351A (zh) * 2019-08-14 2019-12-27 浙江工业大学 一种基于改进k-means算法的菜鸟驿站选址方法

Also Published As

Publication number Publication date
CN112132184A (zh) 2020-12-25

Similar Documents

Publication Publication Date Title
CN106886795B (zh) 基于图像中的显著物体的物体识别方法
CN104765768B (zh) 海量人脸库的快速准确检索方法
Qi et al. K*-means: An effective and efficient k-means clustering algorithm
CN105223546B (zh) 基于接收信号强度和参考点位置双聚类的室内定位方法
CN113344019A (zh) 一种决策值选取初始聚类中心改进的K-means算法
CN112132014B (zh) 基于非督导金字塔相似性学习的目标重识别方法及系统
CN112132184B (zh) 一种基于n阶近邻分析聚类的配送中心选址方法
CN110543913A (zh) 一种基于遗传算法的近邻传播聚类方法
CN110781295A (zh) 一种多标记数据的特征选择方法及装置
CN117274650A (zh) 基于遥感-众源语义深度聚类的城市功能区识别方法
CN112559587B (zh) 基于城市语义图谱的轨迹时空语义模式提取方法
CN114332172A (zh) 一种基于协方差矩阵改进的激光点云配准方法
CN113240209A (zh) 一种基于图神经网络的城市产业集群发展路径预测方法
CN115828108B (zh) 一种基于形状匹配的运动目标轨迹相似片段提取方法
CN110532867B (zh) 一种基于黄金分割法的人脸图像聚类方法
CN110909037A (zh) 一种频繁轨迹模式的挖掘方法及装置
CN115344693B (zh) 一种基于传统算法和神经网络算法融合的聚类方法
CN115862385A (zh) 基于标准飞行程序的机场终端区航空器飞行模式挖掘方法
Du et al. ParSymG: a parallel clustering approach for unsupervised classification of remotely sensed imagery
CN111079089B (zh) 一种基于区间划分的基站数据异常检测方法
Puspita et al. Clustering-based sales forecasting in a forklift distributor
CN115062708A (zh) 一种基于轨迹偏差点嵌入和深度聚类的异常节点检测方法
CN113936246A (zh) 基于联合局部特征判别性学习的无监督目标行人重识别方法
CN110689082A (zh) 一种使用optics与离线批处理优化的轨迹聚类算法
Shi et al. A study of support vector regression-based fuzzy c-means algorithm on incomplete data clustering

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant