CN112132184A - 一种基于n阶近邻分析聚类的配送中心选址方法 - Google Patents
一种基于n阶近邻分析聚类的配送中心选址方法 Download PDFInfo
- Publication number
- CN112132184A CN112132184A CN202010848654.5A CN202010848654A CN112132184A CN 112132184 A CN112132184 A CN 112132184A CN 202010848654 A CN202010848654 A CN 202010848654A CN 112132184 A CN112132184 A CN 112132184A
- Authority
- CN
- China
- Prior art keywords
- data set
- sample point
- points
- sample
- order neighbor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 14
- 238000010187 selection method Methods 0.000 title claims abstract description 11
- 239000013598 vector Substances 0.000 claims abstract description 33
- 238000000034 method Methods 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 9
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 4
- 238000004422 calculation algorithm Methods 0.000 abstract description 6
- 238000010586 diagram Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/083—Shipping
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Development Economics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Game Theory and Decision Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
- Complex Calculations (AREA)
Abstract
一种基于N阶近邻分析聚类的配送中心选址方法,首先,根据候选地址的地位位置信息,初始化研究对象的样本数据集;然后,计算样本点的N阶近邻距离和方差值,结合次序统计的相关原理来分析样本数据点簇间特性,得到合适的聚类数目K值;最终,结合聚类算法将样本数据集划分为簇内相似度高的K的簇,最终均值向量对应的候选点即为配送中心的最佳选址。本发明提供一种实用性强的基于N阶近邻分析聚类簇的配送中心选址方法。
Description
技术领域
本发明涉及机器学习、统计学分析、选址规划、模式识别等领域,尤其涉及的是一种基于N阶近邻分析聚类的配送中心选址方法。
背景技术
物流配送中心选址问题是指在一个具有若干供应网点的区域内,选一个或者多个地址设置物流配送中心的规划过程,它在整个物流系统中占有非常重要的地位,属于物流管理战略层的研究问题。由于配送中心选址的决策不仅直接关系到日后配送中心自身的运营成本和服务水平,而且关系到整个社会物流系统的合理化,同时配送中心的建设投资大、周期长、回收缓慢,且一经选定后就将长期经营,因此配送中心选址是配送中心建设项目规划中首要也是至关重要的环节。正是基于配送中心位置的重要作用,迫切需要对其选址问题开展研究。
近年来,随着人工智能领域的不断发展,机器学习领域的研究方法,被成功地应用于许多传统领域,并且取得了不错的成果。聚类分析是机器学习领域中常用的无监督学习方法,它根据对象之间的差异性,把不同类的对象区分开。作为数据分析的工具,其重要性在各个领域都得到了广泛的认可,聚类分析的目的是寻找数据集中的自然分组,将数据集分为几个差异明显的簇,簇是指相似元素的集合,聚类后的每一个簇内数据点的相似程度高,不同簇内的数据点差异性大。
目前,针对配送中心选址问题,通常采用的解析法、最优化规划方法、启发式算法等,此类方法通常求解时间复杂度高,求解精度很难保证,如启发式算法,在寻优求解的过程中,常常会陷入局部最优解,导致最终的求解结果出现偏差。以配送中心的候选点为研究对象,采用聚类的方式,将候选点划分为若干个合适的簇,选取最终各个聚类簇的聚类中心作为配送中心,也是一种效率较高的解决方案,但聚类算法大多数需要在算法运行前给定聚类簇的个数,才能很好地进行。然而,在大部分的实际应用过程中,通常聚类簇的个数是不可能事先知道的,而且也很难预先指定聚类个数,因此,如何选择恰当的聚类个数是一个非常复杂而又必须面对的问题。
因此,目前的配送中心选址方法是存在很大的局限性,很难保证问题求解的精准性、求解的时效性,需要改进。
发明内容
为了解决现有的配送中心选址方法求解问题的精度低,时效性差的问题,本发明提出了一种基于N阶近邻分析聚类的配送中心选址方法,通过分析研究对象点分布特性,采用基于N阶近邻分析自适应地确定出合适的聚类簇数目,以此来指导聚类算法完成对配送中心候选点的聚类划分,选取聚类后的每个簇中的聚类中心作为配送中心。
本发明解决其技术问题所采用的技术方案是:
一种基于N阶近邻分析聚类的配送中心选址方法,包括以下步骤:
1)根据候选点的地理位置信息,初始化为二维地理坐标特征的样本点数据集D={x1,x2,...,xM},M为候选点的数量,初始化聚类数目K=1;
3)计算样本点的n阶近邻距离,过程如下:
3.1)从数据集D中取出一个目标样本点xi,i∈{1,2,...,M};
3.2)再从数据集D中取出不同于xi的一个样本点xj,j∈{1,2,...,M};
3.3)计算两个样本点xi和xj之间的欧式距离dij,其中dij=||xi-xj||2;
3.4)迭代步骤3.2)和步骤3.3)直到xj取完数据集中除xi之外的所有点,再将所求的距离按照从小到大排序,即得到样本点xi的n阶近邻距离,其中n∈{1,2,..,M-1};
3.5)更新目标样本点xi,即从数据集中随机取出新的目标样本点xi′,令xi=xi′,迭代步骤3.2)、3.3)和步骤3.4),直到xi取完数据集中的所有样本点为止;
5)分析数据集中样本点之间的离散程度,确定合适的聚类数目K值,过程如下:
6)从数据集D中随机选取K个数据点作为聚类的初始均值向量T={t1,t2,L,tK};
7)计算样本点xi到各均值向量tk的距离:dist(xi,tk)=||xi-tk||2,根据距离最近的均值向量确定xi的簇标记:λi=arg mink∈{1,2,L,K} dist(xi,tk),将样本点xi划入相应的簇;
8)更新均值向量tk:计算当前簇中每一个样本点到其他样本点的距离之和,并将距离之和最小的样本点记为新的均值向量t′k,若tk′≠tk,则令tk=tk′,迭代步骤7),否则,进行步骤9);
9)当前均值向量tk均不再发生变化,将聚类后的簇划分出来,此时最终的均值向量集合T中的K个均值向量所对应的候选点即为配送中心的最佳选址位置。
本发明的有益效果为:在普遍缺少先验知识的情况下,通过计算研究对象点的N阶近邻距离,分析得到当前研究对象合适的聚类簇数目,从而指导聚类算法完成对候选点的聚类划分,实现了实用性强、效率高的配送中心选址方法。
附图说明
图1是一种基于N阶近邻分析聚类的配送中心选址方法流程图。
图2是配送中心候选点的分布图。
图3是配送中心选址结果分布图。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1至图3,一种基于N阶近邻分析聚类的配送中心选址方法,包括以下步骤:
1)根据候选点的地理位置信息,初始化为二维地理坐标特征的样本点数据集D={x1,x2,...,xM},M为候选点的数量,初始化聚类数目K=1;
3)计算样本点的n阶近邻距离,过程如下:
3.1)从数据集D中取出一个目标样本点xi,i∈{1,2,...,M};
3.2)再从数据集D中取出不同于xi的一个样本点xj,j∈{1,2,...,M};
3.3)计算两个样本点xi和xj之间的欧式距离dij,其中dij=||xi-xj||2;
3.4)迭代步骤3.2)和步骤3.3)直到xj取完数据集中除xi之外的所有点,再将所求的距离按照从小到大排序,即得到样本点xi的n阶近邻距离,其中n∈{1,2,..,M-1};
3.5)更新目标样本点xi,即从数据集中随机取出新的目标样本点xi′,令xi=xi′,迭代步骤3.2)、3.3)和步骤3.4),直到xi取完数据集中的所有样本点为止;
5)分析数据集中样本点之间的离散程度,确定合适的聚类数目K值,过程如下:
6)从数据集D中随机选取K个数据点作为聚类的初始均值向量T={t1,t2,L,tK};
7)计算样本点xi到各均值向量tk的距离:dist(xi,tk)=||xi-tk||2,根据距离最近的均值向量确定xi的簇标记:λi=arg mink∈{1,2,L,K} dist(xi,tk),将样本点xi划入相应的簇;
8)更新均值向量tk:计算当前簇中每一个样本点到其他样本点的距离之和,并将距离之和最小的样本点记为新的均值向量t′k,若tk′≠tk,则令tk=tk′,迭代步骤7),否则,进行步骤9);
9)当前均值向量tk均不再发生变化,将聚类后的簇划分出来,此时最终的均值向量集合T中的K个均值向量所对应的候选点即为配送中心的最佳选址位置。
本实施例以从29个候选地址中选取合适的若干个配送中心为例,一种基于N阶近邻分析的聚类簇个数确定方法,包括以下步骤:
1)根据候选点的地理位置信息,初始化为二维地理坐标特征的样本点数据集D={x1,x2,...,xM},候选点的数量M=29,初始化聚类数目K=1;
3)计算样本点的n阶近邻距离,过程如下:
3.1)从数据集D中取出一个目标样本点xi,i∈{1,2,...,M};
3.2)再从数据集D中取出不同于xi的一个样本点xj,j∈{1,2,...,M};
3.3)计算两个样本点xi和xj之间的欧式距离dij,其中dij=||xi-xj||2;
3.4)迭代步骤3.2)和步骤3.3)直到xj取完数据集中除xi之外的所有点,再将所求的距离按照从小到大排序,即得到样本点xi的n阶近邻距离,其中n∈{1,2,..,M-1};
3.5)更新目标样本点xi,即从数据集中随机取出新的目标样本点xi′,令xi=xi′,迭代步骤3.2)、3.3)和步骤3.4),直到xi取完数据集中的所有样本点为止;
5)分析数据集中样本点之间的离散程度,确定合适的聚类数目K值,过程如下:
6)从数据集D中随机选取K个数据点作为聚类的初始均值向量T={t1,t2,L,tK};
7)计算样本点xi到各均值向量tk的距离:dist(xi,tk)=||xi-tk||2,根据距离最近的均值向量确定xi的簇标记:λi=arg mink∈{1,2,L,K} dist(xi,tk),将样本点xi划入相应的簇;
8)更新均值向量tk:计算当前簇中每一个样本点到其他样本点的距离之和,并将距离之和最小的样本点记为新的均值向量t′k,若tk′≠tk,则令tk=tk′,迭代步骤7),否则,进行步骤9);
9)直到当前的均值向量tk均不再发生变化,将聚类后的簇划分出来,此时最终的均值向量集合T中的5个均值向量所对应的候选点,即[5,12,23,27,29]为配送中心的最佳选址位置。
以从29个候选地址中选取合适的若干个配送中心为例,运用以上方法得到该数据集的最佳聚类簇的个数为5,其算法流程如图1所示,配送中心候选点的分布图如图2所示;配送中心选址的结果如图3所示。
以上阐述是本发明给出的一个实施的预测效果,本发明不仅适合上述实施例,在不偏离本发明基本思想及不超出本发明实质内容的前提下可对其做种种改进加以实施。
Claims (1)
1.一种基于N阶近邻分析聚类的配送中心选址方法,其特征在于:所述方法包括以下步骤:
1)根据候选点的地理位置信息,初始化为二维地理坐标特征的样本点数据集D={x1,x2,...,xM},M为候选点的数量,初始化聚类数目K=1;
3)计算样本点的n阶近邻距离,过程如下:
3.1)从数据集D中取出一个目标样本点xi,i∈{1,2,...,M};
3.2)再从数据集D中取出不同于xi的一个样本点xj,j∈{1,2,...,M};
3.3)计算两个样本点xi和xj之间的欧式距离dij,其中dij=||xi-xj||2;
3.4)迭代步骤3.2)和步骤3.3)直到xj取完数据集中除xi之外的所有点,再将所求的距离按照从小到大排序,即得到样本点xi的n阶近邻距离,其中n∈{1,2,..,M-1};
3.5)更新目标样本点xi,即从数据集中随机取出新的目标样本点xi′,令xi=xi′,迭代步骤3.2)、3.3)和步骤3.4),直到xi取完数据集中的所有样本点为止;
5)分析数据集中样本点之间的离散程度,确定合适的聚类数目K值,过程如下:
6)从数据集D中随机选取K个数据点作为聚类的初始均值向量T={t1,t2,L,tK};
7)计算样本点xi到各均值向量tk的距离:dist(xi,tk)=||xi-tk||2,根据距离最近的均值向量确定xi的簇标记:λi=arg mink∈{1,2,L,K}dist(xi,tk),将样本点xi划入相应的簇;
8)更新均值向量tk:计算当前簇中每一个样本点到其他样本点的距离之和,并将距离之和最小的样本点记为新的均值向量t′k,若tk′≠tk,则令tk=tk′,迭代步骤7),否则,进行步骤9);
9)当前均值向量tk均不再发生变化,将聚类后的簇划分出来,此时最终的均值向量集合T中的K个均值向量所对应的候选点即为配送中心的最佳选址位置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010848654.5A CN112132184B (zh) | 2020-08-21 | 2020-08-21 | 一种基于n阶近邻分析聚类的配送中心选址方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010848654.5A CN112132184B (zh) | 2020-08-21 | 2020-08-21 | 一种基于n阶近邻分析聚类的配送中心选址方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112132184A true CN112132184A (zh) | 2020-12-25 |
CN112132184B CN112132184B (zh) | 2024-05-10 |
Family
ID=73851034
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010848654.5A Active CN112132184B (zh) | 2020-08-21 | 2020-08-21 | 一种基于n阶近邻分析聚类的配送中心选址方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112132184B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114742593A (zh) * | 2022-04-22 | 2022-07-12 | 北京信息科技大学 | 一种物流仓储中心优化选址方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103593747A (zh) * | 2013-11-07 | 2014-02-19 | 银江股份有限公司 | 一种基于meanshift分类的大规模客户点分类配送方法 |
WO2019242520A1 (zh) * | 2018-06-20 | 2019-12-26 | 菜鸟智能物流控股有限公司 | 物流配送站点规划方法和服务器 |
CN110619351A (zh) * | 2019-08-14 | 2019-12-27 | 浙江工业大学 | 一种基于改进k-means算法的菜鸟驿站选址方法 |
-
2020
- 2020-08-21 CN CN202010848654.5A patent/CN112132184B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103593747A (zh) * | 2013-11-07 | 2014-02-19 | 银江股份有限公司 | 一种基于meanshift分类的大规模客户点分类配送方法 |
WO2019242520A1 (zh) * | 2018-06-20 | 2019-12-26 | 菜鸟智能物流控股有限公司 | 物流配送站点规划方法和服务器 |
CN110619351A (zh) * | 2019-08-14 | 2019-12-27 | 浙江工业大学 | 一种基于改进k-means算法的菜鸟驿站选址方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114742593A (zh) * | 2022-04-22 | 2022-07-12 | 北京信息科技大学 | 一种物流仓储中心优化选址方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112132184B (zh) | 2024-05-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111191732B (zh) | 一种基于全自动学习的目标检测方法 | |
Guijo-Rubio et al. | Time-series clustering based on the characterization of segment typologies | |
Kotsakos et al. | Time-series data clustering | |
CN113344019A (zh) | 一种决策值选取初始聚类中心改进的K-means算法 | |
Hong et al. | Learning assignment order of instances for the constrained k-means clustering algorithm | |
CN112115780A (zh) | 一种基于深度多模型协同的半监督行人重识别方法 | |
CN110543913A (zh) | 一种基于遗传算法的近邻传播聚类方法 | |
CN114556364A (zh) | 基于相似度运算符排序的神经架构搜索 | |
CN111695612A (zh) | 一种基于聚类的半监督识别方法 | |
CN112132184A (zh) | 一种基于n阶近邻分析聚类的配送中心选址方法 | |
Wei et al. | Edge devices clustering for federated visual classification: A feature norm based framework | |
CN114359604A (zh) | 一种基于多飞行器轨迹数据的队形识别模型构建方法 | |
CN115828108B (zh) | 一种基于形状匹配的运动目标轨迹相似片段提取方法 | |
CN110909037A (zh) | 一种频繁轨迹模式的挖掘方法及装置 | |
CN115344693B (zh) | 一种基于传统算法和神经网络算法融合的聚类方法 | |
CN115062708A (zh) | 一种基于轨迹偏差点嵌入和深度聚类的异常节点检测方法 | |
Garai | Application of genetic algorithm in numerous scientific fields | |
Liu et al. | Swarm intelligence for classification of remote sensing data | |
CN116108217A (zh) | 一种基于深度哈希编码和多任务预测的逃费车辆相似图片检索方法 | |
CN111079089B (zh) | 一种基于区间划分的基站数据异常检测方法 | |
CN113936246A (zh) | 基于联合局部特征判别性学习的无监督目标行人重识别方法 | |
CN112101086A (zh) | 一种基于链接预测的人脸聚类方法 | |
CN110689082A (zh) | 一种使用optics与离线批处理优化的轨迹聚类算法 | |
Wang et al. | Research on fast and parallel clustering method for trajectory data | |
Dai et al. | Self-supervised pairing image clustering and its application in cyber manufacturing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |