CN117591904B - 一种基于密度聚类的货车聚类方法 - Google Patents
一种基于密度聚类的货车聚类方法 Download PDFInfo
- Publication number
- CN117591904B CN117591904B CN202410072493.3A CN202410072493A CN117591904B CN 117591904 B CN117591904 B CN 117591904B CN 202410072493 A CN202410072493 A CN 202410072493A CN 117591904 B CN117591904 B CN 117591904B
- Authority
- CN
- China
- Prior art keywords
- clustering
- data
- truck
- point
- points
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 239000013598 vector Substances 0.000 claims abstract description 43
- 238000004458 analytical method Methods 0.000 claims abstract description 26
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 17
- 238000007621 cluster analysis Methods 0.000 claims abstract description 7
- 230000002159 abnormal effect Effects 0.000 claims description 6
- 238000004140 cleaning Methods 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 230000003068 static effect Effects 0.000 claims description 3
- 238000005406 washing Methods 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 abstract description 9
- 238000004904 shortening Methods 0.000 abstract description 4
- 238000007405 data analysis Methods 0.000 abstract description 2
- 238000010801 machine learning Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 2
- 239000004744 fabric Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000000586 desensitisation Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S19/00—Satellite radio beacon positioning systems; Determining position, velocity or attitude using signals transmitted by such systems
- G01S19/38—Determining a navigation solution using signals transmitted by a satellite radio beacon positioning system
- G01S19/39—Determining a navigation solution using signals transmitted by a satellite radio beacon positioning system the satellite radio beacon positioning system transmitting time-stamped messages, e.g. GPS [Global Positioning System], GLONASS [Global Orbiting Navigation Satellite System] or GALILEO
- G01S19/42—Determining position
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/083—Shipping
- G06Q10/0833—Tracking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Remote Sensing (AREA)
- Radar, Positioning & Navigation (AREA)
- Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Development Economics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Entrepreneurship & Innovation (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Probability & Statistics with Applications (AREA)
- Computer Networks & Wireless Communication (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开一种基于密度聚类的货车聚类方法,涉及交通管理数据分析技术领域,包括以下步骤:OD分析,将货车实时GPS数据源转为OD点,并计算GeoHash值;聚类分析,采用改进的DBSCAN算法,初步计算出货车的聚类情况,得到初步货车聚类区域;区域合并,对初步货车聚类区域进行基于词向量的相似度分析,并进行空间合并,得到最终聚类区域。本发明引入采用的是货车的实时点位数据,从根源上解决数据准确性;通过构建GeoHash结构来优化查找邻居点的过程,缩短DBSCAN的计算时间;聚类算法中利用词向量相似度的分析方法,降低因密度聚类领域半径设置过小,导致的聚类区域结果过于小且离散,提高数据的可用性和鲁棒性。
Description
技术领域
本发明涉及交通管理数据智能分析技术领域,尤其是涉及一种基于密度聚类的货车聚类方法。
背景技术
交通管理领域,特别是对于货车的管理领域,经常采用货车聚类分析,货车的聚类分析是一种将货车根据其特征参数分类的方法,目的是更好地理解货车的不同类型,优化货车管理,或是为了设计更加精确的物流方案。聚类分析在这里是一个无监督学习的过程,它不需要预先定义货车类型的标签,而是通过分析货车的一些关键特性自行确定类别。
目前,在交通管理领域对货车聚类区域,主要两种方案:
第一种方案:交通管理人员根据业务管理经验,筛选出平时重点管理的区域
第二种方案:利用电子警察和车辆卡口等设备,获得黄牌货车的过车数据,通过设备点位来构建货车的OD点来分析货车的聚类情况。
两种现有方案分别存在以下问题
第一种方案采用的人工经验,会有如下问题:
1)局限性强:对交通管理人员的经验依赖极大,无法全局掌握货车的聚类情况;
2)时效性差:货车聚类的更新,依赖于交通管理人员日常工作的频率更新或范围的扩大。
第二种方案采用的策略依赖于电子警察和车辆卡口等设备数据源进行分析,会有如下问题:
1)设备布置限制目的地追踪:由于设备主要部署在路口或特定路段,导致无法精准追踪货车的最终目的地。实际上,货车的起点和终点被限制在了设备的起点和终点,从而无法得到真实目的地的信息。
2)聚类计算方法简单:目前所使用的货车聚类计算方法较为简单,主要是以设备的起点和终点为基础进行合并统计。这种方法导致了信息丢失,未能充分反映货车的真实行动轨迹和目的地。
3)聚类结果难落实:由于分析结果只能呈现为热力图分布或相对较高粒度的数据,无法与具体的主体企业关联起来。这限制了数据分析的深度和广度,也降低了对交通管理的实际支持。
因此货车管理领域亟需解决以下问题:
1)选择合适数据源:选择更为合适的数据源,提高最后结果的有效性。
2)增强系统性:引入机器学习的方法,降低对交通管理人员经验的依赖。
3)优化聚类算法,采用更复杂、高效的聚类算法,并考虑时空因素,以保留更多货车的真实行动轨迹和目的地信息。
发明内容
为了解决上述技术问题,本发明提供一种基于密度聚类的货车聚类方法。采用如下的技术方案:
一种基于密度聚类的货车聚类方法,包括以下步骤:
步骤1,OD分析,获取货车实时GPS数据源,将货车实时GPS数据源转为OD点,并计算GeoHash值;
步骤2,聚类分析,采用改进的DBSCAN算法,初步计算出货车的聚类情况,得到初步货车聚类区域;
步骤3,区域合并,对初步货车聚类区域进行基于词向量的相似度分析,并进行空间合并,得到最终聚类区域。
通过采用上述技术方案,相对于传统的方式,引入采用的是货车的实时点位数据,从根源上解决数据准确性;
采用了密度聚类的机器学习算法,无需事先设定区域或区域数量,即可计算出货车聚类区域的货车数量、面积及中心点等信息;
通过构建GeoHash结构来优化查找邻居点的过程,缩短DBSCAN的计算时间;
聚类算法中利用词向量相似度的分析方法,合并聚类分析出来的聚类区域结果,降低因密度聚类领域半径设置过小,导致的聚类区域结果过于小且离散,提高数据的可用性。
可选的,步骤1包括以下子步骤:
步骤11,从货车实时GPS数据源队列中获取货车的主要参数,主要参数是唯一识别码数据、经纬度定位数据和定位时间点数据;
步骤12,根据同一辆货车定位的后先顺序对OD点进行更新,同时根据前后两个时间点区间的时间差,判断是否产生新的OD点;
步骤13,计算OD点的GeoHash的值。
可选的,在步骤11后,分别对货车定位唯一识别码数据、经纬度定位数据和定位时间点数据三个参数进行非空、时间异常、空间异常的数据校验和清洗。
通过采用上述技术方案,货车聚类的OD(Origin-Destination)分析是从收集到的货车行驶轨迹数据中提取并分析货车出行的出发地与目的地信息。这些OD信息对于理解和优化城市内的货物运输流动至关重要。
在进行货车聚类的OD分析时,首先需要收集货车实时GPS数据源队列中获取货车的主要参数,主要参数是唯一识别码数据、经纬度定位数据和定位时间点数据,这三个数据是与聚类分析关联度最大的三个数据,更新计算OD点的GeoHash的值为后续的聚类分析提供更加准确的数据。
可选的,步骤2包括以下子步骤:
步骤21,清洗掉OD轨迹过短或静止不动的OD数据,形成有效OD数据集;
步骤22,初始化DBSCAN的算法参数领域半径和密度阈值;
步骤23,遍历有效OD数据集,找到任意一个核心点,对核心点进行扩充;
步骤24,取出核心点的GeoHash九宫格内的所有点;
步骤25,寻找从核心点出发GeoHash九宫格内的所有密度相连的点;
步骤26,遍历核心点的邻域内的所有核心点,寻找与这些数据点密度相连的点,直到没有可以扩充的点为止;
步骤27,重新扫描有效OD数据集,寻找没有被聚类的核心点,再重复上述步骤23到步骤26对核心点进行扩充,直到有效OD数据集中没有新的核心点为止;
步骤28,计算聚类区的边界和中心点,并通过GIS地理信息系统得到中心点的AOI,形成初步货车聚类区域。
可选的,领域半径应小于GeoHash的km误差。
可选的,步骤24的具体方法是:获取核心点的自身的GeoHash值,加上其八邻域GeoHash组成九宫格,取出九宫格所有的点。
通过采用上述技术方案,构建GeoHash结构来优化查找邻居点的过程,缩短DBSCAN的计算时间,提高方法的可用性。
可选的,步骤3包括以下子步骤:
步骤31,遍历基本的货车聚类区域数据集,去掉AOI区域为空的数据,并提取货车聚类区域AOI值;
步骤32,对聚类区域中心点的距离进行比较,选出小于1km的中心点,称为相近的中心点;
步骤33,对相近的两个的中心点地址进行分词,每个分词代表空间的一个维度,将文本转化为多维空间的向量;
步骤34,根据词向量余弦的公式计算出相似度值;
步骤35,合并相似度高于设定相似度阈值的区域,重新计算区域的边界和中心点;
步骤36,直到货车聚类区域数据集都完成中心点地址两两比较,形成最终聚类区域。
通过采用上述技术方案,构建GeoHash结构来优化查找邻居点的过程,缩短DBSCAN的计算时间,提高方法的可用性。
可选的,步骤34中词向量余弦的公式如下:
其中是词向量余弦;/>是其中一个中心点地址A的词向量;/>是另一个中心点地址B的词向量;/>是词向量A的模长;/>是词向量B的模长;/>是词向量A在第i维的坐标值;/>是向量B在第i维的坐标值。
通过采用上述技术方案,聚类算法中利用词向量相似度的分析方法,合并聚类分析出来的聚类区域结果,降低因密度聚类领域半径设置过小,导致的聚类区域结果过于小且离散,提高数据的可用性和鲁棒性。
可选的,步骤35中,相似度阈值是0.85。
综上所述,本发明包括以下至少有益技术效果:
本发明能提供一种基于密度聚类的货车聚类方法,引入采用的是货车的实时点位数据,从根源上解决数据准确性;采用了密度聚类的机器学习算法,无需事先设定区域或区域数量,即可计算出货车聚类区域的货车数量、面积及中心点等信息;通过构建GeoHash结构来优化查找邻居点的过程,缩短DBSCAN的计算时间;聚类算法中利用词向量相似度的分析方法,合并聚类分析出来的聚类区域结果,降低因密度聚类领域半径设置过小,导致的聚类区域结果过于小且离散,提高数据的可用性和鲁棒性。
附图说明
图1是本发明一种基于密度聚类的货车聚类方法的流程示意图;
图2是本发明一种基于密度聚类的货车聚类方法步骤1的子步骤流程示意图;
图3是本发明一种基于密度聚类的货车聚类方法步骤2的子步骤流程示意图;
图4是本发明一种基于密度聚类的货车聚类方法步骤3的子步骤流程示意图。
具体实施方式
以下结合附图对本发明作进一步详细说明。
本发明实施例公开一种基于密度聚类的货车聚类方法。
参照图1-图4,实施例1,一种基于密度聚类的货车聚类方法,包括以下步骤:
步骤1,OD分析,获取货车实时GPS数据源,将货车实时GPS数据源转为OD点,并计算GeoHash值;
步骤2,聚类分析,采用改进的DBSCAN算法,初步计算出货车的聚类情况,得到初步货车聚类区域;
步骤3,区域合并,对初步货车聚类区域进行基于词向量的相似度分析,并进行空间合并,得到最终聚类区域。
相对于传统的方式,引入采用的是货车的实时点位数据,从根源上解决数据准确性;
采用了密度聚类的机器学习算法,无需事先设定区域或区域数量,即可计算出货车聚类区域的货车数量、面积及中心点等信息;
通过构建GeoHash结构来优化查找邻居点的过程,缩短DBSCAN的计算时间;
聚类算法中利用词向量相似度的分析方法,合并聚类分析出来的聚类区域结果,降低因密度聚类领域半径设置过小,导致的聚类区域结果过于小且离散,提高数据的可用性。
参照图2,实施例2,步骤1包括以下子步骤:
步骤11,从货车实时GPS数据源队列中获取货车的主要参数,主要参数是唯一识别码数据、经纬度定位数据和定位时间点数据;
步骤12,根据同一辆货车定位的后先顺序对OD点进行更新,同时根据前后两个时间点区间的时间差,判断是否产生新的OD点;
步骤13,计算OD点的GeoHash的值。
实施实例3,步骤12的具体的方法是,货车W实时位置数据队列如表1,唯一识别码脱敏处理,仅为符号代替,时间差的阈值为30分钟;
表1
货车W某次行程O点为P1,并将D点也赋值为P1,当获取P2时,计算P2与P1的时间差为30秒,小于30分钟,更新D点的值为P2,当获取P2点时,再次计算P2与P3的时间差为30秒,少于30分钟,再次更新D点的值为P3,当获取P4时,计算P3与P4的时间差为39分钟,大于30分钟。此时货车某次行程的OD点为(P1,P3),P4为下次行程的0点;
步骤12的具体的方法是, GeoHash长度取6位,km误差在0.6km,如将货车W行程中的O点和D点经纬度分别计算出6位GeoHash值,如表2:
表2
在步骤11后,分别对货车定位唯一识别码数据、经纬度定位数据和定位时间点数据三个参数进行非空、时间异常、空间异常的数据校验和清洗。
货车聚类的OD(Origin-Destination)分析是从收集到的货车行驶轨迹数据中提取并分析货车出行的出发地与目的地信息。这些OD信息对于理解和优化城市内的货物运输流动至关重要。
在进行货车聚类的OD分析时,首先需要收集货车实时GPS数据源队列中获取货车的主要参数,主要参数是唯一识别码数据、经纬度定位数据和定位时间点数据,这三个数据是与聚类分析关联度最大的三个数据,更新计算OD点的GeoHash的值为后续的聚类分析提供更加准确的数据。
参照图3,实施例4,步骤2包括以下子步骤:
步骤21,清洗掉OD轨迹过短或静止不动的OD数据,形成有效OD数据集;
步骤22,初始化DBSCAN的算法参数领域半径和密度阈值;
步骤23,遍历有效OD数据集,找到任意一个核心点,对核心点进行扩充;
步骤24,取出核心点的GeoHash九宫格内的所有点;
步骤25,寻找从核心点出发GeoHash九宫格内的所有密度相连的点;
步骤26,遍历核心点的邻域内的所有核心点,寻找与这些数据点密度相连的点,直到没有可以扩充的点为止;
步骤27,重新扫描有效OD数据集,寻找没有被聚类的核心点,再重复上述步骤23到步骤26对核心点进行扩充,直到有效OD数据集中没有新的核心点为止;
步骤28,计算聚类区的边界和中心点,并通过GIS地理信息系统得到中心点的AOI,形成初步货车聚类区域。
实施例5,步骤22中,领域半径应小于GeoHash的km误差,GeoHash取6位,km误差为0.6km。领域半径取0.5km
步骤24的具体方法是:如核心点的自身的GeoHash值为wx4ey6,加上八邻域GeoHash组成九宫格,取出GeoHash等于wx4ey6,wx4ey5,wx4ey7,wx4ey4,wx4ey1,wx4ey3,wx4ey9,wx4eyd,wx4eye的所有点。
构建GeoHash结构来优化查找邻居点的过程,缩短DBSCAN的计算时间,提高方法的可用性,对于既具有离散性,又具有一定的集中趋势的数据集效果更佳。
参照图4,实施例6,步骤3包括以下子步骤:
步骤31,遍历基本的货车聚类区域数据集,去掉AOI区域为空的数据,并提取货车聚类区域AOI值;
步骤32,对聚类区域中心点的距离进行比较,选出相近的中心点;
步骤33,对相近的两个的中心点地址进行分词,每个分词代表空间的一个维度,将文本转化为多维空间的向量;
步骤34,根据词向量余弦的公式计算出相似度值;
步骤35,合并相似度高于设定相似度阈值的区域,重新计算区域的边界和中心点;
步骤36,直到货车聚类区域数据集都完成中心点地址两两比较,形成最终聚类区域。
实施例7,步骤34中词向量余弦的公式如下:
其中是词向量余弦;/>是其中一个中心点地址A的词向量;/>是另一个中心点地址B的词向量;/>是词向量A的模长;/>是词向量B的模长;/>是词向量A在第i维的坐标值;/>是词向量B在第i维的坐标值。
步骤35中,相似度阈值是0.85。
具体实施例:步骤33中,如两个中心点AOI地址“卡萨布兰尼物流园一区”,“卡萨布兰尼流园二区”,分词分成T1={卡,萨,布,兰,尼,物,流,园,一,区},T2={卡,萨,布,兰,尼,物,流,园,二,区},转化出T1词向量A={1,1,1,1,1,1,1,1,0,1,1},T2的词向量B={1,1,1,1,1,1,1,1,1,0,1}。
根据词向量余弦的公式计算出相似度值,上述词向量参数代入到,计算的余弦相似度为0.9大于相似度阈值0.85,合并区域,重新计算区域的边界和中心点。
以上均为本发明的较佳实施例,并非以此限制本发明的保护范围,故:凡依本发明的结构、形状、原理所做的等效变化,均应涵盖于本发明的保护范围之内。
Claims (7)
1.一种基于密度聚类的货车聚类方法,其特征在于,包括以下步骤:
步骤1,OD分析,获取货车实时GPS数据源,将货车实时GPS数据源转为OD点,并计算GeoHash值;
步骤2,聚类分析,采用改进的DBSCAN算法,初步计算出货车的聚类情况,得到初步货车聚类区域;
步骤3,区域合并,对初步货车聚类区域进行基于词向量的相似度分析,并进行空间合并,得到最终聚类区域;
步骤2包括以下子步骤:
步骤21,清洗掉OD轨迹过短或静止不动的OD数据,形成有效OD数据集;
步骤22,初始化DBSCAN的算法参数领域半径和密度阈值;
步骤23,遍历有效OD数据集,找到任意一个核心点,对核心点进行扩充;
步骤24,取出核心点的GeoHash九宫格内的所有点;
步骤25,寻找从核心点出发GeoHash九宫格内的所有密度相连的点;
步骤26,遍历核心点的邻域内的所有核心点,寻找与这些数据点密度相连的点,直到没有可以扩充的点为止;
步骤27,重新扫描有效OD数据集,寻找没有被聚类的核心点,再重复上述步骤23到步骤26对核心点进行扩充,直到有效OD数据集中没有新的核心点为止;
步骤28,计算聚类区的边界和中心点,并通过GIS地理信息系统得到中心点的AOI,形成初步货车聚类区域;
步骤3包括以下子步骤:
步骤31,遍历初步的货车聚类区域数据集,去掉AOI区域为空的数据,并提取货车聚类区域AOI值;
步骤32,对聚类区域中心点的距离进行比较,选出小于1km的中心点,称为相近的中心点;
步骤33,对相近的两个的中心点地址进行分词,每个分词代表空间的一个维度,将文本转化为多维空间的向量;
步骤34,根据词向量余弦的公式计算出相似度值;
步骤35,合并相似度高于设定相似度阈值的区域,重新计算区域的边界和中心点;
步骤36,直到货车聚类区域数据集都完成中心点地址两两比较,形成最终聚类区域。
2.根据权利要求1所述的一种基于密度聚类的货车聚类方法,其特征在于,步骤1包括以下子步骤:
步骤11,从货车实时GPS数据源队列中获取货车的主要参数,主要参数是唯一识别码数据、经纬度定位数据和定位时间点数据;
步骤12,根据同一辆货车定位的后先顺序对OD点进行更新,同时根据前后两个时间点区间的时间差,判断是否产生新的OD点;
步骤13,计算OD点的GeoHash的值。
3.根据权利要求2所述的一种基于密度聚类的货车聚类方法,其特征在于,在步骤11后,分别对货车定位唯一识别码数据、经纬度定位数据和定位时间点数据三个参数进行非空、时间异常、空间异常的数据校验和清洗。
4.根据权利要求1所述的一种基于密度聚类的货车聚类方法,其特征在于,步骤22中,领域半径应小于GeoHash的km误差。
5.根据权利要求1所述的一种基于密度聚类的货车聚类方法,其特征在于,步骤24的具体方法是:获取核心的自身的GeoHash值,加上其八邻域GeoHash组成九宫格,取出九宫格所有的点。
6.根据权利要求1所述的一种基于密度聚类的货车聚类方法,其特征在于,步骤34中词向量余弦的公式如下:
,
其中是词向量余弦;/>是其中一个中心点地址A的词向量;/>是另一个中心点地址B的词向量;/>是词向量A的模长;/>是词向量B的模长;/>是词向量A在第i维的坐标值;/>是向量B在第i维的坐标值。
7.根据权利要求1所述的一种基于密度聚类的货车聚类方法,其特征在于,步骤35中,相似度阈值是0.85。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410072493.3A CN117591904B (zh) | 2024-01-18 | 2024-01-18 | 一种基于密度聚类的货车聚类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410072493.3A CN117591904B (zh) | 2024-01-18 | 2024-01-18 | 一种基于密度聚类的货车聚类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117591904A CN117591904A (zh) | 2024-02-23 |
CN117591904B true CN117591904B (zh) | 2024-04-16 |
Family
ID=89911898
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410072493.3A Active CN117591904B (zh) | 2024-01-18 | 2024-01-18 | 一种基于密度聚类的货车聚类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117591904B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109993184A (zh) * | 2017-12-30 | 2019-07-09 | 华为技术有限公司 | 一种数据融合的方法以及数据融合设备 |
CN110597943A (zh) * | 2019-09-16 | 2019-12-20 | 腾讯科技(深圳)有限公司 | 基于人工智能的兴趣点处理方法、装置及电子设备 |
CN113420595A (zh) * | 2021-05-21 | 2021-09-21 | 北京达佳互联信息技术有限公司 | 数据处理方法、装置、电子设备及存储介质 |
CN113868351A (zh) * | 2021-09-09 | 2021-12-31 | 同盾科技有限公司 | 一种地址聚类方法、装置、电子设备及存储介质 |
CN115436972A (zh) * | 2022-08-31 | 2022-12-06 | 湖南省交通科学研究院有限公司 | 基于重载货车gps轨迹识别停留点的方法、系统及介质 |
CN115660220A (zh) * | 2022-12-03 | 2023-01-31 | 中邮科通信技术股份有限公司 | 基于GeoHash算法的潮汐停车群智优化方法 |
CN117037471A (zh) * | 2023-07-19 | 2023-11-10 | 长春市市政工程设计研究院有限责任公司 | 基于gps轨迹数据的货车工作区域及行驶路径识别方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI385544B (zh) * | 2009-09-01 | 2013-02-11 | Univ Nat Pingtung Sci & Tech | 基於密度式之資料分群方法 |
-
2024
- 2024-01-18 CN CN202410072493.3A patent/CN117591904B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109993184A (zh) * | 2017-12-30 | 2019-07-09 | 华为技术有限公司 | 一种数据融合的方法以及数据融合设备 |
CN110597943A (zh) * | 2019-09-16 | 2019-12-20 | 腾讯科技(深圳)有限公司 | 基于人工智能的兴趣点处理方法、装置及电子设备 |
CN113420595A (zh) * | 2021-05-21 | 2021-09-21 | 北京达佳互联信息技术有限公司 | 数据处理方法、装置、电子设备及存储介质 |
CN113868351A (zh) * | 2021-09-09 | 2021-12-31 | 同盾科技有限公司 | 一种地址聚类方法、装置、电子设备及存储介质 |
CN115436972A (zh) * | 2022-08-31 | 2022-12-06 | 湖南省交通科学研究院有限公司 | 基于重载货车gps轨迹识别停留点的方法、系统及介质 |
CN115660220A (zh) * | 2022-12-03 | 2023-01-31 | 中邮科通信技术股份有限公司 | 基于GeoHash算法的潮汐停车群智优化方法 |
CN117037471A (zh) * | 2023-07-19 | 2023-11-10 | 长春市市政工程设计研究院有限责任公司 | 基于gps轨迹数据的货车工作区域及行驶路径识别方法 |
Non-Patent Citations (3)
Title |
---|
Disatra: A Real-Time Distributed Abstract Trajectory Clustering;Chen, Liang et al.;LECTURE NOTES IN ARTIFICIAL INTELLIGENCE;20220101;第619-635页 * |
一种基于划分的不同参数值的DBSCAN算法;熊忠阳, 孙思, 张玉芳, 王秀琼;计算机工程与设计;20050928(09);第2319-2321页 * |
空间密度聚类模式挖掘方法DBSCAN研究回顾与进展;伏家云;靖常峰;杜明义;;测绘科学;20180910(12);第54-61页 * |
Also Published As
Publication number | Publication date |
---|---|
CN117591904A (zh) | 2024-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106840176B (zh) | Gps时空数据增量路网实时更新和轨迹匹配系统 | |
CN110968617B (zh) | 一种基于位置字段的路网关键路段相关性分析方法 | |
CN110472999B (zh) | 基于地铁和共享单车数据的客流模式分析方法及装置 | |
CN110490507B (zh) | 一种物流网络的新增线路检测方法、装置及设备 | |
CN101710422B (zh) | 基于全局流形原型聚类算法与分水岭算法的图像分割方法 | |
CN112732905B (zh) | 一种基于知识图谱的交通事故分析与防控方法及系统 | |
CN103136757A (zh) | 基于流形距离的两阶段聚类算法的sar图像分割方法 | |
CN111539432A (zh) | 一种利用众源数据辅助遥感影像提取城市道路的方法 | |
CN111190891A (zh) | 一种多语义轨迹数据分段存储方法 | |
CN112507624A (zh) | 一种城际公路出行方式识别模型构建、识别方法及装置 | |
CN115862331A (zh) | 考虑卡口网络拓扑结构的车辆出行轨迹重构方法 | |
CN117591904B (zh) | 一种基于密度聚类的货车聚类方法 | |
CN116824868B (zh) | 车辆非法停驻点识别及拥堵预测方法、装置、设备及介质 | |
CN105335758A (zh) | 一种基于视频费舍尔向量描述符的车型识别方法 | |
CN113932821A (zh) | 基于连续窗口平均方向特征的轨迹地图匹配方法 | |
CN113573238A (zh) | 一种基于手机信令的联程旅客出行链识别方法 | |
CN117689693A (zh) | 一种基于图对比自监督学习的异常局部轨迹检测方法和装置 | |
CN112164223B (zh) | 基于云平台的智能交通信息处理方法及装置 | |
CN117542195A (zh) | 一种交通运行状态识别方法、装置、设备及介质 | |
CN112801181A (zh) | 城市信令交通流用户分类、预测方法、存储介质及系统 | |
CN116484244A (zh) | 基于聚类模型的自动驾驶事故发生机制分析方法 | |
CN113449403B (zh) | 一种基于分层网络划分的复杂网络节点评价方法 | |
CN111444286A (zh) | 一种基于轨迹数据的远距离交通节点关联性挖掘方法 | |
CN115662124A (zh) | 一种基于网络编码的gps轨迹数据路段流量匹配方法 | |
CN109492116B (zh) | 人物关系网络构建的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |