CN114419357B - 数据处理方法、装置、计算机及可读存储介质 - Google Patents
数据处理方法、装置、计算机及可读存储介质 Download PDFInfo
- Publication number
- CN114419357B CN114419357B CN202210230988.5A CN202210230988A CN114419357B CN 114419357 B CN114419357 B CN 114419357B CN 202210230988 A CN202210230988 A CN 202210230988A CN 114419357 B CN114419357 B CN 114419357B
- Authority
- CN
- China
- Prior art keywords
- node
- path
- nodes
- sequence
- path nodes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims abstract description 43
- 238000003860 storage Methods 0.000 title claims abstract description 25
- 238000003672 processing method Methods 0.000 title abstract description 11
- 238000000034 method Methods 0.000 claims abstract description 76
- 239000011159 matrix material Substances 0.000 claims description 105
- 230000008569 process Effects 0.000 claims description 29
- 230000004927 fusion Effects 0.000 claims description 27
- 238000004590 computer program Methods 0.000 claims description 22
- 230000006870 function Effects 0.000 claims description 14
- 238000010606 normalization Methods 0.000 claims description 10
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 238000000638 solvent extraction Methods 0.000 claims 4
- 238000005192 partition Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 27
- 238000004458 analytical method Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000013475 authorization Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000005295 random walk Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例公开了一种数据处理方法、装置、计算机及可读存储介质,本申请实施例可应用于地图领域,该方法包括:获取V个路径节点,通过对V个路径节点进行游走遍历,得到由V个路径节点组成的M个路径序列;从M个路径序列中获取节点对,基于节点对中的第一路径节点,预测V个路径节点分别与第一路径节点之间的节点关联概率,通过V个路径节点分别对应的节点关联概率以及节点对中的第二路径节点,确定V个路径节点分别对应的节点关联特征;第一路径节点和第二路径节点处于同一个路径序列中;基于节点关联特征对V个路径节点进行聚类处理,得到用于对路网进行区域划分的节点集合。采用本申请,可以提高路网区域划分的准确性。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种数据处理方法、装置、计算机及可读存储介质。
背景技术
随着城市的划分,交通的发展,路网所覆盖的范围越来越大,路网所包括的交通路线等也越来越复杂,在对交通路线到交通路线之间进行路线轨迹等的分析时,由于交通路线的数量较多,分布较为复杂,可能会导致对交通路线的分析覆盖率较低。因此,可能会对路网进行区域划分,一般情况下,是基于交通路线所处的地理区域,确定交通路线所在的区域,从而实现对路网的区域划分,通过这一方式,划分得到的区域的范围较大,每个区域中所包括的交通路线数量较多,导致路网划分可能不准确。
发明内容
本申请实施例提供了一种数据处理方法、装置、计算机及可读存储介质,可以提高路网区域划分的准确性。
本申请实施例一方面提供了一种数据处理方法,该方法包括:
获取V个路径节点,通过对V个路径节点进行游走遍历,得到由V个路径节点组成的M个路径序列;V为正整数;M为正整数;
从M个路径序列中获取节点对,基于节点对中的第一路径节点,预测V个路径节点分别与第一路径节点之间的节点关联概率,通过V个路径节点分别对应的节点关联概率以及节点对中的第二路径节点,确定V个路径节点分别对应的节点关联特征;第一路径节点和第二路径节点处于同一个路径序列中;
基于节点关联特征对V个路径节点进行聚类处理,得到用于对路网进行区域划分的节点集合。
本申请实施例一方面提供了一种数据处理装置,该装置包括:
节点获取模块,用于获取V个路径节点;
序列获取模块,用于通过对V个路径节点进行游走遍历,得到由V个路径节点组成的M个路径序列;V为正整数;M为正整数;
节点对获取模块,用于从M个路径序列中获取节点对;
特征确定模块,用于基于节点对中的第一路径节点,预测V个路径节点分别与第一路径节点之间的节点关联概率,通过V个路径节点分别对应的节点关联概率以及节点对中的第二路径节点,确定V个路径节点分别对应的节点关联特征;第一路径节点和第二路径节点处于同一个路径序列中;
节点聚类模块,用于基于节点关联特征对V个路径节点进行聚类处理,得到用于对路网进行区域划分的节点集合。
其中,V个路径节点包括路径节点i;M个路径序列包括路径节点i对应的路径序列;i为小于或等于V的正整数;
该序列获取模块,包括:
第一游走单元,用于以路径节点i为序列起点,从路径节点i的邻接节点中选取序列起点对应的第二个序列节点,从第二个序列节点的邻接节点中选取序列起点对应的第三个序列节点,直至得到序列起点对应的第j个序列节点;j为正整数;
第一序列确定单元,用于若序列起点对应的第j个序列节点不存在邻接节点,或j为序列长度阈值,则将序列起点对应的第j个序列节点确定为序列起点对应的序列终点,基于序列起点至序列终点确定路径节点i对应的路径序列。
其中,V个路径节点包括路径节点i;M个路径序列包括路径节点i对应的路径序列;i为小于或等于V的正整数;
该序列获取模块,包括:
第二游走单元,用于以路径节点i为序列起点,将路径节点i的邻接节点确定为序列起点所关联的第一个子序列,将第一个子序列所包括的路径节点的邻接节点,确定为序列起点所关联的第二个子序列,直至得到序列起点所关联的第d个子序列;d为正整数;
第二序列确定单元,用于若第d个子序列所包括的路径节点不存在邻接节点,或序列起点以及序列起点关联的第一个子序列至第d个子序列所包括的路径节点的总数量大于或等于序列长度阈值,则根据序列起点以及序列起点关联的第一个子序列至第d个子序列所包括的路径节点,确定路径节点i对应的路径序列。
其中,该序列获取模块,包括:
完整遍历单元,用于以V个路径节点分别作为第一序列起点,以V个第一序列起点分别在V个路径节点中进行游走遍历,得到V个路径节点分别对应的第一遍历序列;
随机遍历单元,用于从V个路径节点中随机选取第二序列起点,以第二序列起点在V个路径节点中进行游走遍历,得到第二序列起点所对应的第二遍历序列;
第三序列确定单元,用于根据V个路径节点分别对应的第一遍历序列,以及第二序列起点所对应的第二遍历序列,确定M个路径序列。
其中,该节点对获取模块,包括:
序列选取单元,用于在M个路径序列中,将包含V个路径节点中的第i个路径节点的路径序列,确定为目标路径序列;i为小于或等于V的正整数;
共现获取单元,用于获取节点共现窗口尺寸,在目标路径序列中,获取与第i个路径节点之间的序列距离小于或等于节点共现窗口尺寸的共现路径节点;
节点对组成单元,用于将第i个路径节点所关联的共现路径节点与第i个路径节点,组成第i个路径节点所对应的节点对;第i个路径节点是指第i个路径节点所对应的节点对中的第一路径节点;第i个路径节点所关联的共现路径节点,是指第i个路径节点所对应的节点对中的第二路径节点。
其中,该节点对获取模块,包括:
频次筛选单元,用于从M个路径序列中,获取V个路径节点分别对应的出现频次,基于出现频次从V个路径节点中获取第一路径节点;
该节点对组成单元,还用于从M个路径序列中,获取与第一路径节点处于同一路径序列的第二路径节点,将第一路径节点与第二路径节点组成节点对。
其中,该特征确定模块,包括:
特征识别单元,用于获取特征识别模型,获取节点对中的第一路径节点的第一节点特征;特征识别模型包括第一初始参数矩阵及第二初始参数矩阵;
特征转换单元,用于将第一节点特征输入特征识别模型,采用特征识别模型中的第一初始参数矩阵对第一节点特征进行特征转换,得到隐藏特征;
概率预测单元,用于采用特征识别模型中的第二初始参数矩阵对隐藏特征进行特征预测,得到V个路径节点分别与第一路径节点之间的节点关联概率;
参数调整单元,用于通过V个路径节点分别对应的节点关联概率以及节点对中的第二路径节点,对第一初始参数矩阵与第二初始参数矩阵进行参数调整;
矩阵生成单元,用于直至得到第一初始参数矩阵对应的第一参数矩阵,以及第二初始参数矩阵对应的第二参数矩阵;第一参数矩阵与第二参数矩阵用于预测与节点对相匹配的节点关联概率;
特征确定单元,用于从第一参数矩阵或第二参数矩阵中,确定V个路径节点分别对应的节点关联特征。
其中,该概率预测单元,包括:
特征预测子单元,用于采用特征识别模型中的第二初始参数矩阵对隐藏特征进行特征预测,得到V个路径节点分别对应的路径特征;
归一处理子单元,用于对V个路径节点分别对应的路径特征进行特征归一化处理,得到V个路径节点分别与第一路径节点之间的节点关联概率。
其中,该参数调整单元,包括:
概率获取子单元,用于在V个路径节点分别对应的节点关联概率中,获取节点对中的第二路径节点的目标关联概率;
参数调整子单元,用于根据目标关联概率,与剩余路径节点对应的节点关联概率,生成损失函数,基于损失函数对第一初始参数矩阵与第二初始参数矩阵进行参数调整;剩余路径节点是指V个路径节点中除了节点对中的第一路径节点及第二路径节点之外的路径节点。
其中,该节点聚类模块,包括:
属性获取单元,用于获取V个路径节点所对应的节点属性类型,获取V个路径节点在节点属性类型中分别对应的节点属性特征;
特征融合单元,用于对V个路径节点分别对应的节点关联特征,与V个路径节点分别对应的节点属性特征进行特征融合,得到V个路径节点分别对应的节点融合特征;
融合聚类单元,用于基于V个路径节点分别对应的节点融合特征,对V个路径节点进行聚类处理,得到用于对路网进行区域划分的节点集合。
其中,该节点聚类模块,包括:
间距获取单元,用于基于节点关联特征,获取第i个路径节点分别与V个路径节点之间的节点间距;
距离确定单元,用于将具有最小的节点间距的路径节点,确定为第i个路径节点的最小邻接节点,将最小的节点间距确定为第i个路径节点的可达距离,直至得到V个路径节点分别对应的最小邻接节点及可达距离;i为小于或等于V的正整数;
树构建单元,用于以V个路径节点作为树节点,以V个路径节点与V个路径节点分别对应的最小邻接节点之间构建树边,构建路径节点树;
树切分单元,用于基于V个路径节点分别对应的可达距离,对路径节点树进行切分,得到k个子路径节点树;k为正整数;
集合组成单元,用于将每个子路径节点树中所包括的路径节点,组成用于对路网进行区域划分的节点集合。
其中,该间距获取单元,包括:
距离获取子单元,用于获取第i个路径节点的节点关联特征,与V个路径节点分别对应的节点关联特征之间的特征距离,从V个特征距离中获取第i个路径节点的第一节点距离,直至得到V个路径节点分别对应的第一节点距离;
间距确定子单元,用于从第i个路径节点的第一节点距离、第p个路径节点的第一节点距离,以及第i个路径节点的节点关联特征与第p个路径节点的节点关联特征之间的特征距离中,确定第i个路径节点与第p个路径节点之间的节点间距,直至得到第i个路径节点分别与V个路径节点之间的节点间距;p为小于或等于V的正整数。
其中,该树切分单元,具体用于:
对V个路径节点分别对应的可达距离进行排序,依次对排序后的可达距离在路径节点树中所对应的树边进行切分,直至切分得到的子树所包括的路径节点的数量小于或等于最小簇尺寸,将路径节点的数量小于或等于最小簇尺寸时所得到的子树确定为k个子路径节点树。
其中,该节点聚类模块,包括:
该间距获取单元,用于基于节点关联特征,获取第i个路径节点分别与V个路径节点之间的节点间距;
该距离确定单元,用于将具有最小的节点间距的路径节点,确定为第i个路径节点的最小邻接节点,将最小的节点间距确定为第i个路径节点的可达距离,直至得到V个路径节点分别对应的最小邻接节点及可达距离;i为小于或等于V的正整数;
边连接单元,用于以V个路径节点作为子树节点,对V个路径节点分别对应的可达距离由小到大进行排序,依次构建排序后的可达距离所对应的路径节点及最小邻接节点之间的子树边,直至得到由V个路径节点组成的k个子路径节点树;k为正整数,每个子路径节点树所包括的路径节点的数量大于或等于最小簇尺寸;
该集合组成单元,用于将每个子路径节点树中所包括的路径节点,组成用于对路网进行区域划分的节点集合。
其中,该节点聚类模块,包括:
数据获取单元,用于获取k个初始聚类中心,基于节点关联特征,获取V个路径节点分别到k个初始聚类中心的初始聚类距离;
初始聚类单元,用于基于V个路径节点分别到k个初始聚类中心的初始聚类距离,将V个路径节点划分至k个初始聚类中心所对应的初始集合中;
更新聚类单元,用于获取k个初始集合分别对应的更新聚类中心,基于V个路径节点分别到k个初始集合分别对应的更新聚类中心的更新聚类距离,将V个路径节点划分至k个更新聚类中心所对应的更新集合中;
聚类迭代单元,用于若k个更新集合不满足节点聚类条件,则将k个更新集合确定为k个初始集合,通过该更新聚类单元返回执行获取k个初始集合分别对应的更新聚类中心的过程;
集合确定单元,用于若k个更新集合满足节点聚类条件,则将k个更新集合确定为用于对路网进行区域划分的节点集合。
其中,该节点聚类模块,包括:
待处理获取单元,用于从V个路径节点中获取待处理路径节点;待处理路径节点是指未进行节点聚类处理的路径节点;
数量获取单元,用于获取位于待处理路径节点的节点邻域的路径节点的邻接数量;位于待处理路径节点的节点邻域的路径节点是指与待处理路径节点之间的特征距离小于或等于邻域半径的路径节点;特征距离是指对应的路径节点的节点关联特征与待处理路径节点的节点关联特征之间的距离;
节点扩充单元,用于若邻接数量大于或等于最小集合节点数,则基于待处理路径节点及位于待处理路径节点的节点邻域的路径节点,进行节点扩充,得到待处理路径节点所对应的密度可达节点,将待处理路径节点与密度可达节点组成用于对路网进行区域划分的节点集合,通过该待处理获取单元返回执行从V个路径节点中获取待处理路径节点的过程,直至V个路径节点中不存在待处理路径节点;
节点处理单元,用于若邻接数量小于最小集合节点数,则通过该待处理获取单元返回执行从V个路径节点中获取待处理路径节点的过程。
其中,该装置还包括:
路径查询模块,用于响应针对起始路径节点至终止路径节点的路径查询请求,获取终止路径节点所在的目标节点集合;起始路径节点属于V个路径节点,终止路径节点属于V个路径节点;
轨迹获取模块,用于获取目标节点集合所包括的路径节点,获取起始路径节点至目标节点集合所包括的路径节点的第一轨迹路径,获取目标节点集合所包括的路径节点至终止路径节点的第二轨迹路径;
轨迹确定模块,用于根据第一轨迹路径及第二轨迹路径,确定起始路径节点至终止路径节点的目标轨迹路径。
本申请实施例一方面提供了一种计算机设备,包括处理器、存储器、输入输出接口;
处理器分别与存储器和输入输出接口相连,其中,输入输出接口用于接收数据及输出数据,存储器用于存储计算机程序,处理器用于调用该计算机程序,以使包含该处理器的计算机设备执行本申请实施例一方面中的数据处理方法。
本申请实施例一方面提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,该计算机程序适于由处理器加载并执行,以使得具有该处理器的计算机设备执行本申请实施例一方面中的数据处理方法。
本申请实施例一方面提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行本申请实施例一方面中的各种可选方式中提供的方法。换句话说,该计算机指令被处理器执行时实现本申请实施例一方面中的各种可选方式中提供的方法。
实施本申请实施例,将具有如下有益效果:
在本申请实施例中,获取V个路径节点,通过对V个路径节点进行游走遍历,得到由V个路径节点组成的M个路径序列;从M个路径序列中获取节点对,基于节点对中的第一路径节点,预测V个路径节点分别与第一路径节点之间的节点关联概率,通过V个路径节点分别对应的节点关联概率以及节点对中的第二路径节点,确定V个路径节点分别对应的节点关联特征;第一路径节点和第二路径节点处于同一个路径序列中;基于节点关联特征对V个路径节点进行聚类处理,得到用于对路网进行区域划分的节点集合。通过对V个路径节点进行游走遍历,得到可以体现各个路径节点之间的关联关系的路径序列,即,该路径序列可以表示所包括的路径节点之间的结构特征,也就是路径节点与路径节点之间的连接关系,而且,由于对路径节点的游走遍历,使得路径序列中的相邻的路径节点之间可能相似,在一定程度上保留了路径节点与路径节点之间的同质性,因此,通过路径序列构建节点对,使得节点对中的第一路径节点与第二路径节点之间的共现概率较大,从而使得通过节点对所提取到的节点关联特征,可以体现路径节点与路径节点之间的结构,进而使得聚类结果中也保留了该结构性,提高路网区域划分的准确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种数据处理场景示意图;
图2是本申请实施例提供的一种数据处理的方法流程图;
图3是本申请实施例提供的一种路网拓扑结构示意图;
图4是本申请实施例提供的一种路径序列示意图;
图5是本申请实施例提供了一种模型结构示意图;
图6是本申请实施例提供的一种节点聚类场景示意图;
图7是本申请实施例提供的一种树形切分场景示意图;
图8是本申请实施例提供的一种树形构建场景示意图;
图9是本申请实施例提供的一种路网区域划分流程示意图;
图10是本申请实施例提供的一种关联聚类场景示意图;
图11是本申请实施例提供的一种序列生成方法流程图;
图12是本申请实施例提供的一种数据处理装置示意图;
图13是本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
其中,若在本申请中需要收集对象(如用户等)数据,则在收集前、收集中,显示提示界面或者弹窗,该提示界面或者弹窗用于提示用户当前正在搜集XXXX数据,仅仅在获取到用户对该提示界面或者弹窗发出确认操作后,开始执行数据获取的相关的步骤,否则结束。而且,对于获取到的用户数据,会在合理合法的场景或用途等上进行使用。可选的,在一些需要使用用户数据但未得到用户授权的场景中,还可以向用户请求授权,在授权通过时,再使用用户数据。
在本申请实施例中,请参见图1,图1是本申请实施例提供的一种数据处理场景示意图。如图1所示,计算机设备可以获取V个路径节点101,V为正整数,其中,计算机设备可以对V个路径节点101进行游走遍历,得到由V个路径节点组成的M个路径序列,其中,M为正整数,以M为2所示,该M个路径序列可以包括路径序列1021及路径序列1022等。进一步地,计算机设备可以从M个路径序列中,获取节点对103,该节点对103包括第一路径节点及第二路径节点,可选的,该节点对103的数量可以为一个或至少两个等,在此不做限制。其中,以第一路径节点与第二路径节点为例,计算机设备可以基于节点对103中的第一路径节点,预测V个路径节点101分别与第一路径节点之间的节点关联概率,其中,处于同一个节点对中的路径节点之间的共现概率越大,也就是说,要使得通过节点对中的一个路径节点预测得到该节点对中的另一个路径节点的节点关联概率较大,因此,可以通过V个路径节点101分别对应的节点关联概率以及节点对103中的第二路径节点,确定V个路径节点101分别对应的节点关联特征。进一步地,可以基于节点关联特征对V个路径节点101进行聚类处理,得到用于对路网进行区域划分的节点集合104,其中,该节点集合104的数量可以为一个或至少两个,以两个节点集合为例,该节点集合104可以包括如图1所示的节点集合1041及节点集合1042等。
通过以上过程,使得节点对是在路径序列的基础上所得到的,也就是说,第一路径节点与第二路径节点的共现概率较大,通过第一路径节点进行预测,以得到其他的路径节点的节点关联概率,即与第一路径节点之间的节点关联概率,而第一路径节点与第二路径节点处于同一个节点对,两者的共现概率较大,从而可以通过节点对,以及第一路径节点分别与V个路径节点之间的节点关联概率,进行预测,得到V个路径节点分别对应的节点关联特征,使得得到的节点关联特征可以体现各个路径节点之间的共现关系,即保留了各个路径节点之间的结构性特征,从而可以通过节点关联特征对V个路径节点进行聚类处理,可以提高聚类结果的准确性及可靠性。
其中,路网是指交通路线之间的连接关系,以及交通路线节点构建的地图侧的网络结构。交通路线(link),是指切割出的各个路段,可以认为是整个地图网络中的最小单元。可选的,该路网可以包括但不限于实际路网及虚拟路网等,其中,实际路网可以认为对应实际地图,如现实中的交通路线所组成的路网,虚拟路网可以认为对应虚拟地图等,如游戏中的交通路线所组成的路网等,在此不做限制。
可以理解的是,本申请实施例中所提及的计算机设备包括但不限于终端设备或服务器。换句话说,计算机设备可以是服务器或终端设备,也可以是服务器和终端设备组成的系统。其中,以上所提及的终端设备可以是一种电子设备,包括但不限于手机、平板电脑、台式电脑、笔记本电脑、掌上电脑、车载设备、增强现实/虚拟现实(Augmented Reality/Virtual Reality,AR/VR)设备、头盔显示器、智能电视、可穿戴设备、智能音箱、数码相机、摄像头及其他具备网络接入能力的移动互联网设备(mobile internet device,MID),或者火车、轮船、飞行等场景下的终端设备等。其中,以上所提及的服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、车路协同、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
可选的,本申请实施例中所涉及的数据可以存储在计算机设备中,或者可以基于云存储技术或区块链网络对该数据进行存储,在此不做限制。
进一步地,请参见图2,图2是本申请实施例提供的一种数据处理的方法流程图。如图2所示,在图2所描述的方法实施例中,该数据处理过程包括如下步骤:
步骤S201,获取V个路径节点。
在本申请实施例中,计算机设备可以获取V个路径节点,V为正整数。计算机设备可以获取路网拓扑结构,从路网拓扑结构中获取V个路径节点,其中,该路径节点可以认为是路网拓扑结构中的一个交通路线(link),可选的,该路网拓扑结构可以是实际路网(如现实路网等)的拓扑结构,也可以是虚拟路网(如游戏中的路网等)的拓扑结构,也就是说,该路网拓扑结构对应路网,该路网包括V个路径节点。可选的,计算机设备可以获取路网所包括的交通道路,获取路线尺寸,基于路线尺寸及路线交点,对路网所包括的交通道路进行切割,得到组成该路网的V个路径节点,其中,该路线交点可以认为是道路拐点或道路交叉点等。举例来说,在游戏中,获取该游戏所包括的游戏地图,获取该游戏地图中的交通道路,基于路线尺寸及路线交点,对该游戏地图中的交通道路进行切割,得到组成该游戏地图的V个路径节点;或者,获取该游戏地图所对应的路网拓扑结构,从路网拓扑结构中获取组成该游戏地图的V个路径节点(即组成该游戏地图对应的路网的V个路径节点)。其中,该游戏可以是任意一种具备游戏地图的游戏。换句话说,本申请可以应用于任意一个具有地图的场景中,计算机设备可以获取组成该地图所对应的路网的V个路径节点。
举例来说,参见图3,图3是本申请实施例提供的一种路网拓扑结构示意图。如图3所示,该路网拓扑结构中包括V个路径节点,如路径节点L1、路径节点L2、…、路径节点L8及路径节点L9。其中,图3中的圈用于表示路网中的路径节点(link),连线表示两个link之间存在拓扑关系(或者称为邻接关系)。其中,一般情况下,在网络结构(如路网拓扑结构等)中,结构性表示路径节点的邻接关系相似,如路径节点L1与路径节点L7均具有4个邻接节点等;同质性表示路径节点与该路径节点的邻接节点之间的特征相似,如路径节点L1的特征与路径节点L1的邻接节点(如路径节点L2、路径节点L3或路径节点L4等)的特征等。其中,该结构性还可以表示各个路径节点在路网中的结构关系,如邻接关系等;同质性可以表示各个路径节点的属性数据等。
步骤S202,通过对V个路径节点进行游走遍历,得到由V个路径节点组成的M个路径序列。
在本申请实施例中,计算机设备可以以V个路径节点中的任意一个路径节点作为序列起点,对V个路径节点进行游走遍历,得到路径序列,通过以上过程,可以获取由V个路径节点组成的M个路径序列,M为正整数。例如,计算机设备可以从V个路径节点中获取序列起点,基于序列起点对V个路径节点进行游走遍历,得到由V个路径节点组成的M个路径序列,其中,序列起点的数量可以为一个或至少两个,当序列起点的数量为至少两个时,M个路径序列分别对应的序列起点中可能存在相同的序列起点。例如,以M为3为例,假定该M个路径序列包括路径序列1“link1—>link3—>link8”、路径序列2“link1—>link2—>link5—>link6”及路径序列3“link2—>link4—>link7”,其中,路径序列1的序列起点与路径序列2的序列起点相同,路径序列3的序列起点与路径序列1的序列起点及路径序列2的序列起点均不相同,其中,link用于表示路径节点,例如,link1表示路径节点1,link2表示路径节点2等。
其中,以一个序列起点为例,一种路径序列生成方式下,该V个路径节点包括路径节点i;M个路径序列包括路径节点i对应的路径序列;i为小于或等于V的正整数,也就是说,路径节点i可以是V个路径节点中的任意一个路径节点。具体的,计算机设备可以以路径节点i为序列起点,从路径节点i的邻接节点中选取序列起点对应的第二个序列节点,从第二个序列节点的邻接节点中选取序列起点对应的第三个序列节点,直至得到序列起点对应的第j个序列节点;j为正整数。其中,计算机设备在从路径节点i的邻接节点中选取序列起点对应的第二个序列节点时,可以是从路径节点i的邻接节点中随机选取一个路径节点,将选取到的路径节点,确定为序列起点对应的第二个序列节点;或者,获取历史轨迹路线,从历史轨迹路线中,获取路径节点i的邻接节点位于该路径节点i的邻接位置处的历史邻接频次,将路径节点i的邻接节点中具有最大的历史邻接频次的邻接节点,确定为序列起点对应的第二个序列节点等,例如,在历史轨迹路线中,出现了3次“路径节点i—>路径节点2”,则可以认为针对路径节点i的路径节点2的历史邻接频次为3。同理,可以从第二个序列节点的邻接节点中选取序列起点对应的第三个序列节点,…,直至得到序列起点对应的第j个序列节点。
进一步地,若序列起点对应的第j个序列节点不存在邻接节点,或j为序列长度阈值,则将序列起点对应的第j个序列节点确定为序列起点对应的序列终点,基于序列起点至序列终点确定路径节点i对应的路径序列。其中,可以在序列起点对应的第j个序列节点不存在邻接节点时,将序列起点对应的第j个序列节点确定为序列起点对应的序列终点;也可以在j为序列长度阈值时,将序列起点对应的第j个序列节点确定为序列起点对应的序列终点;或者,可以在满足序列起点对应的第j个序列节点不存在邻接节点,或j为序列长度阈值中的任意一个时,将序列起点对应的第j个序列节点确定为序列起点对应的序列终点等。其中,由于每个路径节点所对应的邻接节点的数量可能是零个、一个或至少两个,在路径节点的邻接节点的数量为至少两个时,从路径节点的邻接节点中选取该路径节点的下一个序列节点时,会有多种不同的情况,因此,在以一个路径节点作为序列起点时,可以得到一个或至少两个不同的路径序列。同理,可以得到由V个路径节点组成的M个路径序列,该M个路径序列中可能存在具有相同的序列起点的路径序列。
一种路径序列生成方式下,该V个路径节点包括路径节点i;M个路径序列包括路径节点i对应的路径序列;i为小于或等于V的正整数。以路径节点i为序列起点,将路径节点i的邻接节点确定为序列起点所关联的第一个子序列,将第一个子序列所包括的路径节点的邻接节点,确定为序列起点所关联的第二个子序列,直至得到序列起点所关联的第d个子序列;d为正整数。若第d个子序列所包括的路径节点不存在邻接节点,或序列起点以及序列起点关联的第一个子序列至第d个子序列所包括的路径节点的总数量大于或等于序列长度阈值,则根据序列起点以及序列起点关联的第一个子序列至第d个子序列所包括的路径节点,确定路径节点i对应的路径序列。
可选的,计算机设备可以以路径节点i为序列起点,将该序列起点添加至初始序列中,将序列起点作为遍历指针节点,获取该遍历指针节点所对应的邻接节点,将该遍历指针节点所对应的邻接节点添加至该初始序列中。若当前的初始序列中所包括的路径节点的数量小于序列长度阈值,则将该遍历指针节点在当前的初始序列中的下一个路径节点确定为遍历指针节点,返回执行获取该遍历指针节点所对应的邻接节点的过程;若当前的初始序列中所包括的路径节点的数量大于或等于序列长度阈值,则将包含的路径节点的数量大于或等于序列长度阈值的初始序列确定为路径节点i对应的路径序列。例如,假定该路径节点i为路径节点L1,序列长度阈值为10,获取该路径节点L1的邻接节点,包括路径节点L2及路径节点L3,将序列起点(即路径节点L1)作为遍历指针节点,将遍历指针节点的邻接节点添加至初始序列中,此时的初始序列为“路径节点L1—>路径节点L2—>路径节点L3”,包含3个路径节点,小于序列长度阈值;将遍历指针节点(即路径节点L1)在当前的初始序列中的下一个路径节点(即路径节点L2)确定为遍历指针节点,获取该遍历指针节点(即路径节点L2)的邻接节点,如路径节点L4,将该遍历指针节点的邻接节点添加至初始序列中,此时的初始序列为“路径节点L1—>路径节点L2—>路径节点L3—>路径节点L4”,包含4个路径节点,小于序列长度阈值;将遍历指针节点(即路径节点L2)在当前的初始序列中的下一个路径节点(即路径节点L3)确定为遍历指针节点,获取该遍历指针节点(即路径节点L3)的邻接节点,如路径节点L5及路径节点L6,将该遍历指针节点的邻接节点添加至初始序列中,此时的初始序列为“路径节点L1—>路径节点L2—>路径节点L3—>路径节点L4—>路径节点L5—>路径节点L6”,包含6个路径节点,小于序列长度阈值;…若得到包含的路径节点的数量大于或等于序列长度阈值的初始序列,则将该包含的路径节点的数量大于或等于序列长度阈值的初始序列,确定为路径节点L1对应的路径序列。
可选的,计算机设备可以以V个路径节点分别作为第一序列起点,以V个第一序列起点分别在V个路径节点中进行游走遍历,得到V个路径节点分别对应的第一遍历序列。其中,以V个第一序列起点分别在V个路径节点中进行游走遍历的过程,可以参见上述路径序列生成方式,在此不再进行赘述。通过对V个路径节点进行全量游走,即,将每个路径节点都作为序列起点进行游走遍历,使得路网中的所有路径节点均被采样,提高路径节点的采样覆盖率。可选的,由于路径节点的下一个序列节点的选取不同,可以得到不同的路径序列,因此,以同一个路径节点作为序列起点可能得到多个不同的路径序列。可选的,计算机设备可以多次执行上述以V个路径节点分别作为第一序列起点,以V个第一序列起点分别在V个路径节点中进行游走遍历,得到V个路径节点分别对应的第一遍历序列的过程,可以增加路径节点与路径节点之间的结构关系的保留范围,从而进一步提高后续的节点关联特征所保留的节点间的共现性,进而提高节点聚类的准确性。
进一步地,计算机设备从V个路径节点中随机选取第二序列起点,以第二序列起点在V个路径节点中进行游走遍历,得到第二序列起点所对应的第二遍历序列。其中,以第二序列起点在V个路径节点中进行游走遍历的过程,可以参见上述路径序列生成方式,在此不再进行赘述。其中,该过程可以随机选取作为序列起点的路径节点,以提高样本的随机性。可选的,计算机设备可以多次执行上述从V个路径节点中随机选取第二序列起点,以第二序列起点在V个路径节点中进行游走遍历,得到第二序列起点所对应的第二遍历序列的过程,增加随机样本的数量,在保障路径节点的覆盖率的情况下,提高样本的随机性。其中,该样本用于进行节点关联特征提取。
进一步地,根据V个路径节点分别对应的第一遍历序列,以及第二序列起点所对应的第二遍历序列,确定M个路径序列。
举例来说,请参见图4,图4是本申请实施例提供的一种路径序列示意图。如图4所示,在路网401中,该交通道路由V个路径节点组成,该交通道路如图4中的双线所示,对图4中的双线进行切割,得到V个路径节点,其中,以路径节点402为序列起点,对V个路径节点进行游走遍历,得到路径序列403(如黑色的粗实线所示)。
步骤S203,从M个路径序列中获取节点对。
在本申请实施例中,计算机设备可以从M个路径序列中获取节点对,其中,该节点对包括第一路径节点与第二路径节点,该第一路径节点和第二路径节点处于同一个路径序列中。
具体的,计算机设备可以在M个路径序列中,将包含V个路径节点中的第i个路径节点的路径序列,确定为目标路径序列;i为小于或等于V的正整数。例如,假定第i个路径节点为link3,将包含第i个路径节点的路径序列,确定为目标路径序列,该目标路径序列的数量可以为一个或至少两个,例如,该目标路径序列为[link1,link2,link3,link4,link5]。在目标路径序列中,将与第i个路径节点处于同一个路径序列的路径节点,确定为第i个路径节点的共现路径节点。可选的,计算机设备可以在获取第i个路径节点的共现路径节点时,可以限制该共现路径节点与第i个路径节点之间的距离,即节点共现窗口尺寸,具体的,计算机设备可以获取节点共现窗口尺寸,在目标路径序列中,获取与第i个路径节点之间的序列距离小于或等于节点共现窗口尺寸的共现路径节点。其中,可以认为处于同一个路径序列中的各个路径节点之间共现的概率,比处于不同路径序列中的路径节点之间共现的概率要大,而在同一个路径序列中,距离越近的两个路径节点之间共现的概率越大,例如,上述例举的目标路径序列中,link3与link2之间共现的概率,大于link3与link1之间共现的概率。因此,可以在第i个路径节点所在的目标路径序列中,获取第i个路径节点的共现路径节点。可选的,为了减少需要处理的数据量,可以限制第i个路径节点的共现路径节点的数量,即,选取与第i个路径节点之间共现概率较大的路径节点,因此,可以获取节点共现窗口尺寸,在目标路径序列中,获取与第i个路径节点之间的序列距离小于或等于节点共现窗口尺寸的共现路径节点,也就是说,在基于节点共现窗口尺寸得到的节点对中所包括的两个路径节点,在对应的路径序列中的距离,不超过该节点共现窗口尺寸,该节点共现窗口尺寸相当于是一个距离范围,在获取第i个路径节点的共现路径节点时,是在该节点共现窗口尺寸所限制的距离范围内进行节点的获取。例如,在目标路径序列中,节点共现窗口尺寸为2,则该第i个路径节点(即link3)的共现路径节点包括link1、link2、link4及link5。进一步地,将第i个路径节点所关联的共现路径节点与第i个路径节点,组成第i个路径节点所对应的节点对,如,包括节点对[link3,link1]、节点对[link3,link2]、节点对[link3,link4]及节点对[link3,link5]。其中,第i个路径节点是指第i个路径节点所对应的节点对中的第一路径节点;第i个路径节点所关联的共现路径节点,是指第i个路径节点所对应的节点对中的第二路径节点。以上述方式获取节点对,可以保留所有出现频次的路径节点,该出现频次可以用于表示路径节点在M个路径序列中出现的次数,提高节点覆盖率,进而提高特征提取的准确性。
可选的,从M个路径序列中,获取V个路径节点分别对应的出现频次,基于出现频次从V个路径节点中获取第一路径节点。通过出现频次对路径节点进行筛选,保留影响力较高的路径节点,从而减少需要处理的数据量,提高特征提取的效率。进一步地,可以从M个路径序列中,获取与第一路径节点处于同一路径序列的第二路径节点,将第一路径节点与第二路径节点组成节点对。或者,可以从M个路径序列中,获取第一路径节点所在的第一路径序列,获取节点共现窗口尺寸,在第一路径序列中,获取与第一路径节点之间的序列距离小于或等于节点共现窗口尺寸的第二路径节点,将第一路径节点与第二路径节点组成第一路径节点所对应的节点对。
步骤S204,基于节点对中的第一路径节点,预测V个路径节点分别与第一路径节点之间的节点关联概率,通过V个路径节点分别对应的节点关联概率以及节点对中的第二路径节点,确定V个路径节点分别对应的节点关联特征。
在本申请实施例中,计算机设备可以获取特征识别模型,获取节点对中的第一路
径节点的第一节点特征;特征识别模型包括第一初始参数矩阵及第二初始参数矩阵。将第
一节点特征输入特征识别模型,采用特征识别模型中的第一初始参数矩阵对第一节点特征
进行特征转换,得到隐藏特征;采用特征识别模型中的第二初始参数矩阵对隐藏特征进行
特征预测,得到V个路径节点分别与第一路径节点之间的节点关联概率。例如,参见图5,图5
是本申请实施例提供的一种模型结构示意图。如图5所示,计算机设备可以将第一节点特征
501(x1,x2,x3,x4,…,xV)输入特征识别模型,采用特征识别模型中的第一初始参数矩阵W对
第一节点特征501进行特征转换,得到隐藏特征502(h1,h2,h3,…,hN),其中,第一初始参数
矩阵W的维度可以认为是V*N。可选的,一种可能的特征转换方式为,其中,h用
于表示隐藏特征,W用于表示第一初始参数矩阵,x用于表示第一节点特征。其中,该第一节
点特征501可以认为是基于词向量转换(word2vec)技术、节点向量转换(node2vec)技术或
预训练的语言表征模型(Bidirectional Encoder Representation from Transformers,
bert)等中的任意一种方式得到的,在此不做限制。进一步地,采用特征识别模型中的第二
初始参数矩阵W',对隐藏特征502进行特征预测,得到V个路径节点分别与第一路径节点之
间的节点关联概率503,该节点关联概率503可以认为是一个V维的向量,如图5中的(y1,y2,
y3,y4,…,yV),例如,y1用于表示路径节点L1与第一路径节点之间的节点关联概率,y2用于表
示路径节点L2与第一路径节点之间的节点关联概率等。可选的,一种可能的特征预测方式
为,其中,h用于表示隐藏特征,W'用于表示第二初始参数矩阵,y用于表示V个
路径节点分别与第一路径节点之间的节点关联概率。
进一步地,可以通过V个路径节点分别对应的节点关联概率以及节点对中的第二路径节点,对第一初始参数矩阵与第二初始参数矩阵进行参数调整,直至得到第一初始参数矩阵对应的第一参数矩阵,以及第二初始参数矩阵对应的第二参数矩阵;第一参数矩阵与第二参数矩阵用于预测与节点对相匹配的节点关联概率。也就是说,在第一参数矩阵与第二参数矩阵的条件下,预测V个路径节点分别与第一路径节点之间的节点关联概率,与节点对是相匹配的。例如,在节点对(link1,link2)中,在第一参数矩阵与第二参数矩阵下,输入link1的节点特征,得到的link2所对应的节点关联概率较大。
可选的,该节点对的数量为一个或至少两个,计算机设备可以基于节点对,依次对第一初始参数矩阵及第二初始参数矩阵进行参数调整,直至得到第一参数矩阵及第二参数矩阵。或者,计算机设备可以基于节点对,获取与第一路径节点处于同一个节点对的第二路径节点集合,该第二路径节点集合包括一个或至少两个第二路径节点,每个第二路径节点与第一路径节点组成一个节点对,基于第二路径节点集合对第一初始参数矩阵及第二初始参数矩阵进行参数调整,得到第一参数矩阵及第二参数矩阵,其中,在参数调整时,可以使得第二路径节点集合所包括的第二路径节点的节点关联概率的综合概率越大,进而得到第一参数矩阵及第二参数矩阵,可选的,该综合概率可以是第二路径节点集合所包括的第二路径节点的节点关联概率的均值、均方差或极大值等,在此不做限制,通过对节点对进行整合,以进行参数调整,可以减少需要进行训练的节点对的数据量,进而提高特征提取的效率。其中,在对第一初始参数矩阵及第二初始参数矩阵进行参数调整时,会将该特征识别模型中的信息融合至第一初始参数矩阵及第二初始参数矩阵中,从而得到第一参数矩阵及第二参数矩阵,使得该第一参数矩阵及第二参数矩阵,可以体现节点对中的路径节点之间的共现关系,又可以用于表征V个路径节点的节点特征。进一步地,可以从第一参数矩阵或第二参数矩阵中,确定V个路径节点分别对应的节点关联特征。
可选的,在采用特征识别模型中的第二初始参数矩阵对隐藏特征进行特征预测,得到V个路径节点分别与第一路径节点之间的节点关联概率时,可以采用特征识别模型中的第二初始参数矩阵对隐藏特征进行特征预测,得到V个路径节点分别对应的路径特征,可以记作(u1,u2,u3,u4,…,uV);对V个路径节点分别对应的路径特征进行特征归一化处理,得到V个路径节点分别与第一路径节点之间的节点关联概率y。其中,该特征归一化处理可以是通过公式①实现:
如公式①所示,yf用于表示第f个路径节点与第一路径节点之间的节点关联概率,uf用于表示第f个路径节点的路径特征。
或者,该特征归一化处理可以是通过公式②实现:
如公式②所示,yf用于表示第f个路径节点与第一路径节点之间的节点关联概率,uf用于表示第f个路径节点的路径特征。exp()用于表示指数函数等。
可选的,该特征归一化处理方式不仅限于上述方式,其他的归一化方式也可以,如逻辑回归(softmax)方法等。
可选的,在通过V个路径节点分别对应的节点关联概率以及节点对中的第二路径节点,对第一初始参数矩阵与第二初始参数矩阵进行参数调整时,计算机设备可以在V个路径节点分别对应的节点关联概率中,获取节点对中的第二路径节点的目标关联概率;根据目标关联概率,与剩余路径节点对应的节点关联概率,生成损失函数,基于损失函数对第一初始参数矩阵与第二初始参数矩阵进行参数调整;剩余路径节点是指V个路径节点中除了节点对中的第一路径节点及第二路径节点之外的路径节点。
步骤S205,基于节点关联特征对V个路径节点进行聚类处理,得到用于对路网进行区域划分的节点集合。
在本申请实施例中,计算机设备可以基于节点关联特征,对V个路径节点进行聚类处理,得到用于对路网进行区域划分的节点集合。
其中,计算机设备可以基于节点关联特征,获取第i个路径节点分别与V个路径节点之间的节点间距,将具有最小的节点间距的路径节点,确定为第i个路径节点的最小邻接节点,将最小的节点间距确定为第i个路径节点的可达距离,直至得到V个路径节点分别对应的最小邻接节点及可达距离;i为小于或等于V的正整数。基于V个路径节点分别对应的最小邻接节点及可达距离,构建k个子路径节点树,将每个子路径节点树所包括的路径节点,确定为用于进行路网区域划分的节点集合。其中,在实际的路网中,拓扑密度分布差异可能较大,“热门”区域的link连接关系丰富,“冷门”区域的link连接关系较少,通过对路径节点的可达距离等的确定,考虑不同区域的密度分布,从而使得可以得到所有路径节点,以达到拓扑高连接性的所有路径节点聚类,进而提高聚类效果。
可选的,一种节点集合生成方式,计算机设备可以基于节点关联特征,获取第i个路径节点分别与V个路径节点之间的节点间距,将具有最小的节点间距的路径节点,确定为第i个路径节点的最小邻接节点,将最小的节点间距确定为第i个路径节点的可达距离,直至得到V个路径节点分别对应的最小邻接节点及可达距离;i为小于或等于V的正整数。参见图6,图6是本申请实施例提供的一种节点聚类场景示意图。如图6所示,得到路径节点1对应的可达距离及最小邻接节点,路径节点2对应的可达距离及最小邻接节点,…,以及路径节点V对应的可达距离及最小邻接节点。进一步地,以V个路径节点作为树节点,以V个路径节点与V个路径节点分别对应的最小邻接节点之间构建树边,构建路径节点树,如图6中的路径节点树601所示。基于V个路径节点分别对应的可达距离,对路径节点树进行切分,得到k个子路径节点树;k为正整数。将每个子路径节点树中所包括的路径节点,组成用于对路网进行区域划分的节点集合,如图6中的节点集合602,其中,该图6中的实线用于表示可达距离,虚线用于表示在某个可达距离下所对应的路径节点的节点数量。
其中,在基于节点关联特征,获取第i个路径节点分别与V个路径节点之间的节点间距时,计算机设备可以获取第i个路径节点的节点关联特征,与V个路径节点分别对应的节点关联特征之间的特征距离,从V个特征距离中获取第i个路径节点的第一节点距离,直至得到V个路径节点分别对应的第一节点距离。可选的,以第i个路径节点为例,计算机设备可以获取最小样本数,对V个特征距离进行排序,从排序后的V个特征距离中,获取第t个特征距离,将第t个特征距离确定为第i个路径节点的第一节点距离,其中,t为最小样本数,可选的,可以将第i个路径节点的第一节点距离记作core(Li)。进一步地,从第i个路径节点的第一节点距离、第p个路径节点的第一节点距离,以及第i个路径节点的节点关联特征与第p个路径节点的节点关联特征之间的特征距离中,确定第i个路径节点与第p个路径节点之间的节点间距,直至得到第i个路径节点分别与V个路径节点之间的节点间距;p为小于或等于V的正整数。其中,该第i个路径节点与第p个路径节点之间的节点间距,可以是第i个路径节点的第一节点距离、第p个路径节点的第一节点距离,以及第i个路径节点的节点关联特征与第p个路径节点的节点关联特征之间的特征距离中的最大值,如max{core(Li),core(Lp),dis(Li,Lp)},也可以是均值,如ave{core(Li),core(Lp),dis(Li,Lp)}等,在此不做限制。其中,core(Li)用于表示第i个路径节点的第一节点距离,core(Lp)用于表示第p个路径节点的第一节点距离,dis(Li,Lp)用于表示第i个路径节点的节点关联特征与第p个路径节点的节点关联特征之间的特征距离。
进一步地,在基于V个路径节点分别对应的可达距离,对路径节点树进行切分,得到k个子路径节点树时,计算机设备可以对V个路径节点分别对应的可达距离进行排序,依次对排序后的可达距离在路径节点树中所对应的树边进行切分,直至切分得到的子树所包括的路径节点的数量小于或等于最小簇尺寸,将路径节点的数量小于或等于最小簇尺寸时所得到的子树确定为k个子路径节点树;或者直至切分得到的子树所包括的路径节点的数量与最小簇尺寸之间的差值,小于或等于节点数量阈值,将差值小于或等于节点数量阈值时所得到的子树确定为k个子路径节点树等。
举例来说,请参见图7,图7是本申请实施例提供的一种树形切分场景示意图。如图7所示,在路径节点树701中,该树节点用于表示路径节点,树边用于连接路径节点及该路径节点的最小邻接节点,树边的权重用于表示对应的路径节点的可达距离。计算机设备可以对V个路径节点分别对应的可达距离进行排序,依次对排序后的可达距离在路径节点树中所对应的树边进行切分,假定最小的可达距离对应树边7011,对该树边7011进行切分,得到子树7021及子树7022;假定第二小的可达距离对应树边7012,位于子树7022中,对子树7022的树边7012进行切分,得到子树7031及子树7032;…;直至得到k个子树,此处以k大于或等于4为例,如子树7041、子树7042、子树7043及子树704k等,其中,每个子树所包括的路径节点的数量均可以认为满足最小簇尺寸,如小于或等于最小簇尺寸,或与最小簇尺寸之间的差值小于或等于节点数量阈值等。将k个子树确定为k个子路径节点树。
可选的,一种节点集合生成方式,计算机设备可以基于节点关联特征,获取第i个路径节点分别与V个路径节点之间的节点间距,将具有最小的节点间距的路径节点,确定为第i个路径节点的最小邻接节点,将最小的节点间距确定为第i个路径节点的可达距离,直至得到V个路径节点分别对应的最小邻接节点及可达距离;i为小于或等于V的正整数。其中,该节点间距、可达距离及最小邻接节点等的获取方式,可以参见上述的节点集合生成方式中的相关描述。进一步地,可以以V个路径节点作为子树节点,对V个路径节点分别对应的可达距离由小到大进行排序,依次构建排序后的可达距离所对应的路径节点及最小邻接节点之间的子树边,直至得到由V个路径节点组成的k个子路径节点树;k为正整数,每个子路径节点树所包括的路径节点的数量大于或等于最小簇尺寸。将每个子路径节点树中所包括的路径节点,组成用于对路网进行区域划分的节点集合。
举例来说,参见图8,图8是本申请实施例提供的一种树形构建场景示意图。如图8所示,假定V个路径节点包括路径节点8011、路径节点8012、路径节点8013、路径节点8014、路径节点8015及路径节点8016,对V个路径节点分别对应的可达距离由小到大进行排序,假定得到{(路径节点8015,路径节点8016,3)、(路径节点8014,路径节点8013,5)、(路径节点8011,路径节点8012,6)、(路径节点8016,路径节点8011,9)…},其中,此处的(L1,L2,dismin)用于表示路径节点L1的最小邻接节点为路径节点L2,路径节点L1的可达距离为dismin,如(路径节点8011,路径节点8012,6)表示路径节点8011的最小邻接节点为路径节点8012,可达距离为6。依次构建排序后的可达距离所对应的路径节点及最小邻接节点之间的子树边,如依次构建可达距离“3”对应的路径节点8015及路径节点8016之间的子树边、可达距离“5”对应的路径节点8014及路径节点8013之间的子树边、…,直至得到由V个路径节点组成的k个子路径节点树,假定最小簇尺寸为2,得到子路径节点树8021及子路径节点树8022。将子路径节点树所包括的路径节点,组成用于对路网进行区域划分的节点集合,例如,子路径节点树8021对应的节点集合包括路径节点8011、路径节点8012、路径节点8015及路径节点8016,子路径节点树8022对应的节点集合包括路径节点8013及路径节点8014等。
可选的,一种节点集合生成方式,计算机设备可以获取k个初始聚类中心,基于节点关联特征,获取V个路径节点分别到k个初始聚类中心的初始聚类距离。基于V个路径节点分别到k个初始聚类中心的初始聚类距离,将V个路径节点划分至k个初始聚类中心所对应的初始集合中。获取k个初始集合分别对应的更新聚类中心,基于V个路径节点分别到k个初始集合分别对应的更新聚类中心的更新聚类距离,将V个路径节点划分至k个更新聚类中心所对应的更新集合中。若k个更新集合不满足节点聚类条件,则将k个更新集合确定为k个初始集合,返回执行获取k个初始集合分别对应的更新聚类中心的过程。若k个更新集合满足节点聚类条件,则将k个更新集合确定为用于对路网进行区域划分的节点集合。
可选的,一种节点集合生成方式,计算机设备可以从V个路径节点中获取待处理路径节点;待处理路径节点是指未进行节点聚类处理的路径节点。获取位于待处理路径节点的节点邻域的路径节点的邻接数量;位于待处理路径节点的节点邻域的路径节点是指与待处理路径节点之间的特征距离小于或等于邻域半径的路径节点;特征距离是指对应的路径节点的节点关联特征与待处理路径节点的节点关联特征之间的距离。若邻接数量大于或等于最小集合节点数,则基于待处理路径节点及位于待处理路径节点的节点邻域的路径节点,进行节点扩充,得到待处理路径节点所对应的密度可达节点,将待处理路径节点与密度可达节点组成用于对路网进行区域划分的节点集合,返回执行从V个路径节点中获取待处理路径节点的过程,直至V个路径节点中不存在待处理路径节点。若邻接数量小于最小集合节点数,则返回执行从V个路径节点中获取待处理路径节点的过程。
其中,以上为可选的几种节点集合生成方式。
可选的,计算机设备可以获取V个路径节点所对应的节点属性类型,获取V个路径节点在节点属性类型中分别对应的节点属性特征。其中,该节点属性类型包括但不限于地理位置类型、路径方向类型及区域划码类型等,其中,该区域划码类型用于表示路径节点所在的区域的编码的属性类型等。对V个路径节点分别对应的节点关联特征,与V个路径节点分别对应的节点属性特征进行特征融合,得到V个路径节点分别对应的节点融合特征。基于V个路径节点分别对应的节点融合特征,对V个路径节点进行聚类处理,得到用于对路网进行区域划分的节点集合。其中,该基于节点融合特征,对V个路径节点进行聚类处理的过程,可以参见上述直接基于节点关联特征对V个路径节点进行聚类处理的过程(即上述描述的节点集合生成方式),将其中的节点关联特征替换为节点融合特征,即可以认为是基于节点融合特征,对V个路径节点进行聚类处理的方式,在此不再进行赘述。
可选的,本申请可以将路径节点至路径节点的分析场景,泛化至路径节点至区域,或者区域至路径节点,或者区域至区域的分析场景中,以提高对路径节点的覆盖范围,在一定程度上增加可供分析的数据量,提高节点分析效率及准确性等。
例如,在将路径节点至路径节点的分析场景,泛化至路径节点至区域的分析场景中,可以用于路径查询及交通分析等。例如,一种可能的场景下,响应针对起始路径节点至终止路径节点的路径查询请求,获取终止路径节点所在的目标节点集合;起始路径节点属于V个路径节点,终止路径节点属于V个路径节点。获取目标节点集合所包括的路径节点,获取起始路径节点至目标节点集合所包括的路径节点的第一轨迹路径,获取目标节点集合所包括的路径节点至终止路径节点的第二轨迹路径。根据第一轨迹路径及第二轨迹路径,确定起始路径节点至终止路径节点的目标轨迹路径。也就是说,目标轨迹路径包括了由起始路径节点直接至终止路径节点的轨迹路径,还包括了由起始路径节点至终止路径节点所在的区域(即目标节点集合)中的任意一个中转路径节点,再由该中转路径节点至终止路径节点的轨迹路径,提高了路径规划的泛化性及容错性,在存在交通情况较差(如拥堵等)的轨迹路径时,仍然可以得到到达目的地(即终止路径节点)的轨迹路径,从而提高路径规划的实用性。
例如,在将路径节点至路径节点的分析场景,泛化至区域至区域的分析场景中,可以用于路径查询、交通分析及熟路建模等。例如,一种可能的场景下,响应针对第一待检测路径节点至第二待检测路径节点的熟路建模请求,获取第一待检测路径节点所在的第一节点集合,获取第二待检测路径节点所在的第二节点集合,获取第一节点集合中的第一泛化路径节点至第二节点集合中的第二泛化路径节点之间的历史路径轨迹,直至得到第一节点集合中的任意一个路径节点至第二节点集合中的任意一个路径节点之间的历史路径轨迹,其中,第一泛化路径节点是指第一节点集合中的任意一个路径节点,第二泛化路径节点是指第二节点集合中的任意一个路径节点。根据第一节点集合中的任意一个路径节点至第二节点集合中的任意一个路径节点之间的历史路径轨迹,得到第一节点集合所对应的第一区域至第二节点集合所对应的第二区域的熟路。其中,可以将第一节点集合中的任意一个路径节点至第二节点集合中的任意一个路径节点之间的历史路径轨迹,确定为第一节点集合所对应的第一区域至第二节点集合所对应的第二区域的熟路。或者,可以将出现次数大于或等于熟路频次阈值的历史路径轨迹,确定为第一节点集合所对应的第一区域至第二节点集合所对应的第二区域的熟路。或者,可以基于历史路径轨迹的出现次数对历史路径轨迹进行排序,从排序后的历史路径轨迹中,获取第一节点集合所对应的第一区域至第二节点集合所对应的第二区域的熟路等。
例如,一种可能的场景下,响应针对下游路径节点的选择请求,获取该选择请求所对应的第一请求路径节点及第二请求路径节点,获取第二请求路径节点所在的第三节点集合,获取第一请求路径节点至第三节点集合中所包括的路径节点的历史路径轨迹。获取第一请求路径节点的邻接节点在历史路径轨迹中的历史选择频次,基于第一请求路径节点的邻接节点所对应的历史选择频次,从第一请求路径节点的邻接节点中获取该第一请求路径节点的下游路径节点。
其中,以上为例举的几种本申请所能应用到的场景,并不仅限于上述场景,在需要对路径节点进行泛化的场景中均可使用。
在本申请实施例中,可以通过对V个路径节点进行游走遍历,得到可以体现各个路径节点之间的关联关系的路径序列,即,该路径序列可以表示所包括的路径节点之间的结构特征,也就是路径节点与路径节点之间的连接关系,而且,由于对路径节点的游走遍历,使得路径序列中的相邻的路径节点之间可能相似,在一定程度上保留了路径节点与路径节点之间的同质性,因此,通过路径序列构建节点对,使得节点对中的第一路径节点与第二路径节点之间的共现概率较大,从而使得通过节点对所提取到的节点关联特征,可以体现路径节点与路径节点之间的结构,进而使得聚类结果中也保留了该结构性,提高路网区域划分的准确性。
可选的,可以参见图9,图9是本申请实施例提供的一种路网区域划分流程示意图。如图9所示,该过程包括如下步骤:
步骤S901,轨迹路径游走。
在本申请实施例中,计算机设备可以获取路网所包括的V个路径节点,对V个路径节点进行轨迹路径游走遍历,得到由V个路径节点组成的M个路径序列,可以参见图2中的步骤S201至步骤S202所示的具体描述。
步骤S902,训练路径节点的节点关联特征。
在本申请实施例中,计算机设备可以从M个路径序列中获取节点对,基于节点对中的第一路径节点,预测V个路径节点分别与第一路径节点之间的节点关联概率,通过V个路径节点分别对应的节点关联概率以及节点对中的第二路径节点,确定V个路径节点分别对应的节点关联特征。具体可以参见图2中的步骤S203至步骤S204所示的具体描述。例如,在该情况下,进行节点聚类,可能产生如图10所示的聚类结果,即图10是本申请实施例提供的一种关联聚类场景示意图,在对路网1001进行节点聚类处理,在极小概率下,可能会导致区域1002中的某个路径节点与区域1003中的某个路径节点聚类至一个节点集合中,因此,可以执行步骤S903。也就是说,在基于节点关联特征进行节点聚类时,可以减少需要处理的数据量,提高特征处理的效率。进一步可选的,可以执行步骤S903,提高节点聚类的准确性。
步骤S903,在节点关联特征中融合地理位置信息。
在本申请实施例中,计算机设备可以获取V个路径节点所对应的节点属性类型,以地理位置属性为例,获取该V个路径节点的地理位置信息,基于V个地理位置信息得到V个路径节点分别对应的节点属性特征,对V个路径节点分别对应的节点关联特征,与V个路径节点分别对应的节点属性特征进行特征融合,得到V个路径节点分别对应的节点融合特征。例如,该地理位置信息包括位置经度信息及位置纬度信息,计算机设备可以将第i个路径节点的节点关联特征与节点属性特征进行特征拼接,得到第i个路径节点的节点融合特征。例如,节点关联特征的维度为N,以节点属性特征为经纬度特征为例,得到节点融合特征(节点关联特征,经度,维度),假定该节点融合特征的维度为(N+2)。或者,可以获取节点关联特征中的属性维度,在节点关联特征的属性维度中增加节点属性特征,得到节点融合特征。例如,可以在节点关联特征的第一维度中增加位置经度信息所对应的经度特征,在第二维度中增加位置纬度信息所对应的纬度特征,得到节点融合特征,其中,该第一维度为节点关联特征的奇数位,第二维度为节点关联特征的偶数位,或者,该第一维度为节点关联特征的偶数位,第二维度为节点关联特征的奇数位等。
步骤S904,对V个路径节点进行聚类。
在本申请实施例中,计算机设备可以对V个路径节点进行聚类,得到用于对路网进行区域划分的节点集合。具体可以参见图2中的步骤S205所示的具体描述。
其中,对轨迹路径游走可以参见图11所示,图11是本申请实施例提供的一种序列生成方法流程图。如图11所示,该过程可以包括如下步骤:
步骤S1101,遍历路径节点。
在本申请实施例中,计算机设备可以遍历路径节点,具体可以遍历路网,得到组成路网的V个路径节点。
步骤S1102,获取路径节点的邻接节点。
在本申请实施例中,计算机设备可以获取V个路径节点分别对应的邻接节点。
步骤S1103,节点随机游走遍历。
在本申请实施例中,计算机设备可以对V个路径节点进行随机游走遍历。
步骤S1104,生成路径序列。
在本申请实施例中,计算机设备可以基于随机游走遍历结果,生成由V个路径节点组成的M个路径序列。
其中,上述步骤S1101至步骤S1104可以参见图2中的步骤S201至步骤S202所示的具体描述。
进一步地,请参见图12,图12是本申请实施例提供的一种数据处理装置示意图。该数据处理装置可以是运行于计算机设备中的一个计算机程序(包括程序代码等),例如该数据处理装置可以为一个应用软件;该装置可以用于执行本申请实施例提供的方法中的相应步骤。如图12所示,该数据处理装置1200可以用于图2所对应实施例中的计算机设备,具体的,该装置可以包括:节点获取模块11、序列获取模块12、节点对获取模块13、特征确定模块14及节点聚类模块15。
节点获取模块11,用于获取V个路径节点;
序列获取模块12,用于通过对V个路径节点进行游走遍历,得到由V个路径节点组成的M个路径序列;V为正整数;M为正整数;
节点对获取模块13,用于从M个路径序列中获取节点对;
特征确定模块14,用于基于节点对中的第一路径节点,预测V个路径节点分别与第一路径节点之间的节点关联概率,通过V个路径节点分别对应的节点关联概率以及节点对中的第二路径节点,确定V个路径节点分别对应的节点关联特征;第一路径节点和第二路径节点处于同一个路径序列中;
节点聚类模块15,用于基于节点关联特征对V个路径节点进行聚类处理,得到用于对路网进行区域划分的节点集合。
其中,V个路径节点包括路径节点i;M个路径序列包括路径节点i对应的路径序列;i为小于或等于V的正整数;
该序列获取模块12,包括:
第一游走单元12a,用于以路径节点i为序列起点,从路径节点i的邻接节点中选取序列起点对应的第二个序列节点,从第二个序列节点的邻接节点中选取序列起点对应的第三个序列节点,直至得到序列起点对应的第j个序列节点;j为正整数;
第一序列确定单元12b,用于若序列起点对应的第j个序列节点不存在邻接节点,或j为序列长度阈值,则将序列起点对应的第j个序列节点确定为序列起点对应的序列终点,基于序列起点至序列终点确定路径节点i对应的路径序列。
其中,V个路径节点包括路径节点i;M个路径序列包括路径节点i对应的路径序列;i为小于或等于V的正整数;
该序列获取模块12,包括:
第二游走单元12c,用于以路径节点i为序列起点,将路径节点i的邻接节点确定为序列起点所关联的第一个子序列,将第一个子序列所包括的路径节点的邻接节点,确定为序列起点所关联的第二个子序列,直至得到序列起点所关联的第d个子序列;d为正整数;
第二序列确定单元12d,用于若第d个子序列所包括的路径节点不存在邻接节点,或序列起点以及序列起点关联的第一个子序列至第d个子序列所包括的路径节点的总数量大于或等于序列长度阈值,则根据序列起点以及序列起点关联的第一个子序列至第d个子序列所包括的路径节点,确定路径节点i对应的路径序列。
其中,该序列获取模块12,包括:
完整遍历单元12e,用于以V个路径节点分别作为第一序列起点,以V个第一序列起点分别在V个路径节点中进行游走遍历,得到V个路径节点分别对应的第一遍历序列;
随机遍历单元12f,用于从V个路径节点中随机选取第二序列起点,以第二序列起点在V个路径节点中进行游走遍历,得到第二序列起点所对应的第二遍历序列;
第三序列确定单元12g,用于根据V个路径节点分别对应的第一遍历序列,以及第二序列起点所对应的第二遍历序列,确定M个路径序列。
其中,该节点对获取模块13,包括:
序列选取单元13a,用于在M个路径序列中,将包含V个路径节点中的第i个路径节点的路径序列,确定为目标路径序列;i为小于或等于V的正整数;
共现获取单元13b,用于获取节点共现窗口尺寸,在目标路径序列中,获取与第i个路径节点之间的序列距离小于或等于节点共现窗口尺寸的共现路径节点;
节点对组成单元13c,用于将第i个路径节点所关联的共现路径节点与第i个路径节点,组成第i个路径节点所对应的节点对;第i个路径节点是指第i个路径节点所对应的节点对中的第一路径节点;第i个路径节点所关联的共现路径节点,是指第i个路径节点所对应的节点对中的第二路径节点。
其中,该节点对获取模块13,包括:
频次筛选单元13d,用于从M个路径序列中,获取V个路径节点分别对应的出现频次,基于出现频次从V个路径节点中获取第一路径节点;
该节点对组成单元13c,还用于从M个路径序列中,获取与第一路径节点处于同一路径序列的第二路径节点,将第一路径节点与第二路径节点组成节点对。
其中,该特征确定模块14,包括:
特征识别单元14a,用于获取特征识别模型,获取节点对中的第一路径节点的第一节点特征;特征识别模型包括第一初始参数矩阵及第二初始参数矩阵;
特征转换单元14b,用于将第一节点特征输入特征识别模型,采用特征识别模型中的第一初始参数矩阵对第一节点特征进行特征转换,得到隐藏特征;
概率预测单元14c,用于采用特征识别模型中的第二初始参数矩阵对隐藏特征进行特征预测,得到V个路径节点分别与第一路径节点之间的节点关联概率;
参数调整单元14d,用于通过V个路径节点分别对应的节点关联概率以及节点对中的第二路径节点,对第一初始参数矩阵与第二初始参数矩阵进行参数调整;
矩阵生成单元14e,用于直至得到第一初始参数矩阵对应的第一参数矩阵,以及第二初始参数矩阵对应的第二参数矩阵;第一参数矩阵与第二参数矩阵用于预测与节点对相匹配的节点关联概率;
特征确定单元14f,用于从第一参数矩阵或第二参数矩阵中,确定V个路径节点分别对应的节点关联特征。
其中,该概率预测单元14c,包括:
特征预测子单元141c,用于采用特征识别模型中的第二初始参数矩阵对隐藏特征进行特征预测,得到V个路径节点分别对应的路径特征;
归一处理子单元142c,用于对V个路径节点分别对应的路径特征进行特征归一化处理,得到V个路径节点分别与第一路径节点之间的节点关联概率。
其中,该参数调整单元14d,包括:
概率获取子单元141d,用于在V个路径节点分别对应的节点关联概率中,获取节点对中的第二路径节点的目标关联概率;
参数调整子单元142d,用于根据目标关联概率,与剩余路径节点对应的节点关联概率,生成损失函数,基于损失函数对第一初始参数矩阵与第二初始参数矩阵进行参数调整;剩余路径节点是指V个路径节点中除了节点对中的第一路径节点及第二路径节点之外的路径节点。
其中,该节点聚类模块15,包括:
属性获取单元15a,用于获取V个路径节点所对应的节点属性类型,获取V个路径节点在节点属性类型中分别对应的节点属性特征;
特征融合单元15b,用于对V个路径节点分别对应的节点关联特征,与V个路径节点分别对应的节点属性特征进行特征融合,得到V个路径节点分别对应的节点融合特征;
融合聚类单元15c,用于基于V个路径节点分别对应的节点融合特征,对V个路径节点进行聚类处理,得到用于对路网进行区域划分的节点集合。
其中,该节点聚类模块15,包括:
间距获取单元15d,用于基于节点关联特征,获取第i个路径节点分别与V个路径节点之间的节点间距;
距离确定单元15e,用于将具有最小的节点间距的路径节点,确定为第i个路径节点的最小邻接节点,将最小的节点间距确定为第i个路径节点的可达距离,直至得到V个路径节点分别对应的最小邻接节点及可达距离;i为小于或等于V的正整数;
树构建单元15f,用于以V个路径节点作为树节点,以V个路径节点与V个路径节点分别对应的最小邻接节点之间构建树边,构建路径节点树;
树切分单元15g,用于基于V个路径节点分别对应的可达距离,对路径节点树进行切分,得到k个子路径节点树;k为正整数;
集合组成单元15h,用于将每个子路径节点树中所包括的路径节点,组成用于对路网进行区域划分的节点集合。
其中,该间距获取单元15d,包括:
距离获取子单元151d,用于获取第i个路径节点的节点关联特征,与V个路径节点分别对应的节点关联特征之间的特征距离,从V个特征距离中获取第i个路径节点的第一节点距离,直至得到V个路径节点分别对应的第一节点距离;
间距确定子单元152d,用于从第i个路径节点的第一节点距离、第p个路径节点的第一节点距离,以及第i个路径节点的节点关联特征与第p个路径节点的节点关联特征之间的特征距离中,确定第i个路径节点与第p个路径节点之间的节点间距,直至得到第i个路径节点分别与V个路径节点之间的节点间距;p为小于或等于V的正整数。
其中,该树切分单元15g,具体用于:
对V个路径节点分别对应的可达距离进行排序,依次对排序后的可达距离在路径节点树中所对应的树边进行切分,直至切分得到的子树所包括的路径节点的数量小于或等于最小簇尺寸,将路径节点的数量小于或等于最小簇尺寸时所得到的子树确定为k个子路径节点树。
其中,该节点聚类模块15,包括:
该间距获取单元15d,用于基于节点关联特征,获取第i个路径节点分别与V个路径节点之间的节点间距;
该距离确定单元15e,用于将具有最小的节点间距的路径节点,确定为第i个路径节点的最小邻接节点,将最小的节点间距确定为第i个路径节点的可达距离,直至得到V个路径节点分别对应的最小邻接节点及可达距离;i为小于或等于V的正整数;
边连接单元15i,用于以V个路径节点作为子树节点,对V个路径节点分别对应的可达距离由小到大进行排序,依次构建排序后的可达距离所对应的路径节点及最小邻接节点之间的子树边,直至得到由V个路径节点组成的k个子路径节点树;k为正整数,每个子路径节点树所包括的路径节点的数量大于或等于最小簇尺寸;
该集合组成单元15h,用于将每个子路径节点树中所包括的路径节点,组成用于对路网进行区域划分的节点集合。
其中,该节点聚类模块15,包括:
数据获取单元15j,用于获取k个初始聚类中心,基于节点关联特征,获取V个路径节点分别到k个初始聚类中心的初始聚类距离;
初始聚类单元15k,用于基于V个路径节点分别到k个初始聚类中心的初始聚类距离,将V个路径节点划分至k个初始聚类中心所对应的初始集合中;
更新聚类单元15l,用于获取k个初始集合分别对应的更新聚类中心,基于V个路径节点分别到k个初始集合分别对应的更新聚类中心的更新聚类距离,将V个路径节点划分至k个更新聚类中心所对应的更新集合中;
聚类迭代单元15m,用于若k个更新集合不满足节点聚类条件,则将k个更新集合确定为k个初始集合,通过该更新聚类单元15l返回执行获取k个初始集合分别对应的更新聚类中心的过程;
集合确定单元15n,用于若k个更新集合满足节点聚类条件,则将k个更新集合确定为用于对路网进行区域划分的节点集合。
其中,该节点聚类模块15,包括:
待处理获取单元15o,用于从V个路径节点中获取待处理路径节点;待处理路径节点是指未进行节点聚类处理的路径节点;
数量获取单元15p,用于获取位于待处理路径节点的节点邻域的路径节点的邻接数量;位于待处理路径节点的节点邻域的路径节点是指与待处理路径节点之间的特征距离小于或等于邻域半径的路径节点;特征距离是指对应的路径节点的节点关联特征与待处理路径节点的节点关联特征之间的距离;
节点扩充单元15q,用于若邻接数量大于或等于最小集合节点数,则基于待处理路径节点及位于待处理路径节点的节点邻域的路径节点,进行节点扩充,得到待处理路径节点所对应的密度可达节点,将待处理路径节点与密度可达节点组成用于对路网进行区域划分的节点集合,通过该待处理获取单元15o返回执行从V个路径节点中获取待处理路径节点的过程,直至V个路径节点中不存在待处理路径节点;
节点处理单元15r,用于若邻接数量小于最小集合节点数,则通过该待处理获取单元15o返回执行从V个路径节点中获取待处理路径节点的过程。
其中,该装置1200还包括:
路径查询模块16,用于响应针对起始路径节点至终止路径节点的路径查询请求,获取终止路径节点所在的目标节点集合;起始路径节点属于V个路径节点,终止路径节点属于V个路径节点;
轨迹获取模块17,用于获取目标节点集合所包括的路径节点,获取起始路径节点至目标节点集合所包括的路径节点的第一轨迹路径,获取目标节点集合所包括的路径节点至终止路径节点的第二轨迹路径;
轨迹确定模块18,用于根据第一轨迹路径及第二轨迹路径,确定起始路径节点至终止路径节点的目标轨迹路径。
本申请实施例提供了一种数据处理装置,该装置可以获取V个路径节点,通过对V个路径节点进行游走遍历,得到由V个路径节点组成的M个路径序列;从M个路径序列中获取节点对,基于节点对中的第一路径节点,预测V个路径节点分别与第一路径节点之间的节点关联概率,通过V个路径节点分别对应的节点关联概率以及节点对中的第二路径节点,确定V个路径节点分别对应的节点关联特征;第一路径节点和第二路径节点处于同一个路径序列中;基于节点关联特征对V个路径节点进行聚类处理,得到用于对路网进行区域划分的节点集合。通过对V个路径节点进行游走遍历,得到可以体现各个路径节点之间的关联关系的路径序列,即,该路径序列可以表示所包括的路径节点之间的结构特征,也就是路径节点与路径节点之间的连接关系,而且,由于对路径节点的游走遍历,使得路径序列中的相邻的路径节点之间可能相似,在一定程度上保留了路径节点与路径节点之间的同质性,因此,通过路径序列构建节点对,使得节点对中的第一路径节点与第二路径节点之间的共现概率较大,从而使得通过节点对所提取到的节点关联特征,可以体现路径节点与路径节点之间的结构,进而使得聚类结果中也保留了该结构性,提高路网区域划分的准确性。
参见图13,图13是本申请实施例提供的一种计算机设备的结构示意图。如图13所示,本申请实施例中的计算机设备可以包括:一个或多个处理器1301、存储器1302和输入输出接口1303。该处理器1301、存储器1302和输入输出接口1303通过总线1304连接。存储器1302用于存储计算机程序,该计算机程序包括程序指令,输入输出接口1303用于接收数据及输出数据;处理器1301用于执行存储器1302存储的程序指令。
其中,该处理器1301可以执行如下操作:
获取V个路径节点,通过对V个路径节点进行游走遍历,得到由V个路径节点组成的M个路径序列;V为正整数;M为正整数;
从M个路径序列中获取节点对,基于节点对中的第一路径节点,预测V个路径节点分别与第一路径节点之间的节点关联概率,通过V个路径节点分别对应的节点关联概率以及节点对中的第二路径节点,确定V个路径节点分别对应的节点关联特征;第一路径节点和第二路径节点处于同一个路径序列中;
基于节点关联特征对V个路径节点进行聚类处理,得到用于对路网进行区域划分的节点集合。
在一些可行的实施方式中,该处理器1301可以是中央处理单元(centralprocessing unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(digitalsignal processor,DSP)、专用集成电路(application specific integrated circuit,ASIC)、现成可编程门阵列(field-programmable gate array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
该存储器1302可以包括只读存储器和随机存取存储器,并向处理器1301和输入输出接口1303提供指令和数据。存储器1302的一部分还可以包括非易失性随机存取存储器。例如,存储器1302还可以存储设备类型的信息。
具体实现中,该计算机设备可通过其内置的各个功能模块执行如该图2中各个步骤所提供的实现方式,具体可参见该图2中各个步骤所提供的实现方式,在此不再赘述。
本申请实施例通过提供一种计算机设备,包括:处理器、输入输出接口、存储器,通过处理器获取存储器中的计算机程序,执行该图2中所示方法的各个步骤,进行数据处理操作。本申请实施例实现了获取V个路径节点,通过对V个路径节点进行游走遍历,得到由V个路径节点组成的M个路径序列;从M个路径序列中获取节点对,基于节点对中的第一路径节点,预测V个路径节点分别与第一路径节点之间的节点关联概率,通过V个路径节点分别对应的节点关联概率以及节点对中的第二路径节点,确定V个路径节点分别对应的节点关联特征;第一路径节点和第二路径节点处于同一个路径序列中;基于节点关联特征对V个路径节点进行聚类处理,得到用于对路网进行区域划分的节点集合。通过对V个路径节点进行游走遍历,得到可以体现各个路径节点之间的关联关系的路径序列,即,该路径序列可以表示所包括的路径节点之间的结构特征,也就是路径节点与路径节点之间的连接关系,而且,由于对路径节点的游走遍历,使得路径序列中的相邻的路径节点之间可能相似,在一定程度上保留了路径节点与路径节点之间的同质性,因此,通过路径序列构建节点对,使得节点对中的第一路径节点与第二路径节点之间的共现概率较大,从而使得通过节点对所提取到的节点关联特征,可以体现路径节点与路径节点之间的结构,进而使得聚类结果中也保留了该结构性,提高路网区域划分的准确性。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序适于由该处理器加载并执行图2中各个步骤所提供的数据处理方法,具体可参见该图2中各个步骤所提供的实现方式,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机可读存储介质实施例中未披露的技术细节,请参照本申请方法实施例的描述。作为示例,计算机程序可被部署为在一个计算机设备上执行,或者在位于一个地点的多个计算机设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算机设备上执行。
该计算机可读存储介质可以是前述任一实施例提供的数据处理装置或者该计算机设备的内部存储单元,例如计算机设备的硬盘或内存。该计算机可读存储介质也可以是该计算机设备的外部存储设备,例如该计算机设备上配备的插接式硬盘,智能存储卡(smart media card,SMC),安全数字(secure digital,SD)卡,闪存卡(flash card)等。进一步地,该计算机可读存储介质还可以既包括该计算机设备的内部存储单元也包括外部存储设备。该计算机可读存储介质用于存储该计算机程序以及该计算机设备所需的其他程序和数据。该计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
本申请实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行图2中的各种可选方式中所提供的方法,实现了对V个路径节点进行游走遍历,得到可以体现各个路径节点之间的关联关系的路径序列,即,该路径序列可以表示所包括的路径节点之间的结构特征,也就是路径节点与路径节点之间的连接关系,而且,由于对路径节点的游走遍历,使得路径序列中的相邻的路径节点之间可能相似,在一定程度上保留了路径节点与路径节点之间的同质性,因此,通过路径序列构建节点对,使得节点对中的第一路径节点与第二路径节点之间的共现概率较大,从而使得通过节点对所提取到的节点关联特征,可以体现路径节点与路径节点之间的结构,进而使得聚类结果中也保留了该结构性,提高路网区域划分的准确性。
本申请实施例的说明书和权利要求书及附图中的术语“第一”、“第二”等是用于区别不同对象,而非用于描述特定顺序。此外,术语“包括”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或设备没有限定于已列出的步骤或模块,而是可选地还包括没有列出的步骤或模块,或可选地还包括对于这些过程、方法、装置、产品或设备固有的其他步骤单元。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在该说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例提供的方法及相关装置是参照本申请实施例提供的方法流程图和/或结构示意图来描述的,具体可由计算机程序指令实现方法流程图和/或结构示意图的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。这些计算机程序指令可提供到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或结构示意图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或结构示意图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或结构示意一个方框或多个方框中指定的功能的步骤。
本申请实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本申请实施例装置中的模块可以根据实际需要进行合并、划分和删减。
以上所揭露的仅为本申请较佳实施例而已,当然不能以此来限定本申请之权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖的范围。
Claims (20)
1.一种数据处理方法,其特征在于,所述方法包括:
获取V个路径节点,从所述V个路径节点中获取序列起点,基于所述序列起点对所述V个路径节点进行游走遍历,得到由所述V个路径节点组成的M个路径序列;V为正整数;M为正整数;所述序列起点的数量为一个或至少两个;
从所述M个路径序列中获取节点对,基于所述节点对中的第一路径节点,预测所述V个路径节点分别与所述第一路径节点之间的节点关联概率,通过所述V个路径节点分别对应的节点关联概率以及所述节点对中的第二路径节点,确定所述V个路径节点分别对应的节点关联特征;所述第一路径节点和所述第二路径节点处于同一个路径序列中;
基于所述节点关联特征对所述V个路径节点进行聚类处理,得到用于对路网进行区域划分的节点集合;所述路网包括所述V个路径节点。
2.如权利要求1所述的方法,其特征在于,所述V个路径节点包括路径节点i;所述M个路径序列包括所述路径节点i对应的路径序列;i为小于或等于V的正整数;
所述从所述V个路径节点中获取序列起点,基于所述序列起点对所述V个路径节点进行游走遍历,得到由所述V个路径节点组成的M个路径序列,包括:
以所述路径节点i为序列起点,从所述路径节点i的邻接节点中选取所述序列起点对应的第二个序列节点,从所述第二个序列节点的邻接节点中选取所述序列起点对应的第三个序列节点,直至得到序列起点对应的第j个序列节点;j为正整数;
若所述序列起点对应的第j个序列节点不存在邻接节点,或j为序列长度阈值,则将所述序列起点对应的第j个序列节点确定为所述序列起点对应的序列终点,基于所述序列起点至所述序列终点确定所述路径节点i对应的路径序列。
3.如权利要求1所述的方法,其特征在于,所述V个路径节点包括路径节点i;所述M个路径序列包括所述路径节点i对应的路径序列;i为小于或等于V的正整数;
所述从所述V个路径节点中获取序列起点,基于所述序列起点对所述V个路径节点进行游走遍历,得到由所述V个路径节点组成的M个路径序列,包括:
以所述路径节点i为序列起点,将所述路径节点i的邻接节点确定为所述序列起点所关联的第一个子序列,将所述第一个子序列所包括的路径节点的邻接节点,确定为所述序列起点所关联的第二个子序列,直至得到所述序列起点所关联的第d个子序列;d为正整数;
若所述第d个子序列所包括的路径节点不存在邻接节点,或所述序列起点以及所述序列起点关联的第一个子序列至第d个子序列所包括的路径节点的总数量大于或等于序列长度阈值,则根据所述序列起点以及所述序列起点关联的第一个子序列至第d个子序列所包括的路径节点,确定所述路径节点i对应的路径序列。
4.如权利要求1所述的方法,其特征在于,所述从所述V个路径节点中获取序列起点,基于所述序列起点对所述V个路径节点进行游走遍历,得到由所述V个路径节点组成的M个路径序列,包括:
以所述V个路径节点分别作为第一序列起点,以V个第一序列起点分别在所述V个路径节点中进行游走遍历,得到所述V个路径节点分别对应的第一遍历序列;
从所述V个路径节点中随机选取第二序列起点,以所述第二序列起点在所述V个路径节点中进行游走遍历,得到所述第二序列起点所对应的第二遍历序列;
根据所述V个路径节点分别对应的第一遍历序列,以及所述第二序列起点所对应的第二遍历序列,确定M个路径序列。
5.如权利要求1所述的方法,其特征在于,所述从所述M个路径序列中获取节点对,包括:
在所述M个路径序列中,将包含所述V个路径节点中的第i个路径节点的路径序列,确定为目标路径序列;i为小于或等于V的正整数;
获取节点共现窗口尺寸,在所述目标路径序列中,获取与所述第i个路径节点之间的序列距离小于或等于所述节点共现窗口尺寸的共现路径节点;
将所述第i个路径节点所关联的所述共现路径节点与所述第i个路径节点,组成所述第i个路径节点所对应的节点对;所述第i个路径节点是指所述第i个路径节点所对应的节点对中的所述第一路径节点;所述第i个路径节点所关联的所述共现路径节点,是指所述第i个路径节点所对应的节点对中的所述第二路径节点。
6.如权利要求1所述的方法,其特征在于,所述从所述M个路径序列中获取节点对,包括:
从所述M个路径序列中,获取所述V个路径节点分别对应的出现频次,基于所述出现频次从所述V个路径节点中获取所述第一路径节点;
从所述M个路径序列中,获取与所述第一路径节点处于同一路径序列的所述第二路径节点,将所述第一路径节点与所述第二路径节点组成节点对。
7.如权利要求1所述的方法,其特征在于,所述基于所述节点对中的第一路径节点,预测所述V个路径节点分别与所述第一路径节点之间的节点关联概率,通过所述V个路径节点分别对应的节点关联概率以及所述节点对中的第二路径节点,确定所述V个路径节点分别对应的节点关联特征,包括:
获取特征识别模型,获取所述节点对中的第一路径节点的第一节点特征;所述特征识别模型包括第一初始参数矩阵及第二初始参数矩阵;
将所述第一节点特征输入所述特征识别模型,采用所述特征识别模型中的所述第一初始参数矩阵对所述第一节点特征进行特征转换,得到隐藏特征;
采用所述特征识别模型中的所述第二初始参数矩阵对所述隐藏特征进行特征预测,得到所述V个路径节点分别与所述第一路径节点之间的节点关联概率;
通过所述V个路径节点分别对应的节点关联概率以及所述节点对中的第二路径节点,对所述第一初始参数矩阵与所述第二初始参数矩阵进行参数调整,直至得到所述第一初始参数矩阵对应的第一参数矩阵,以及所述第二初始参数矩阵对应的第二参数矩阵;所述第一参数矩阵与所述第二参数矩阵用于预测与所述节点对相匹配的节点关联概率;
从所述第一参数矩阵或所述第二参数矩阵中,确定所述V个路径节点分别对应的节点关联特征。
8.如权利要求7所述的方法,其特征在于,所述采用所述特征识别模型中的所述第二初始参数矩阵对所述隐藏特征进行特征预测,得到所述V个路径节点分别与所述第一路径节点之间的节点关联概率,包括:
采用所述特征识别模型中的所述第二初始参数矩阵对所述隐藏特征进行特征预测,得到所述V个路径节点分别对应的路径特征;
对所述V个路径节点分别对应的路径特征进行特征归一化处理,得到所述V个路径节点分别与所述第一路径节点之间的节点关联概率。
9.如权利要求7所述的方法,其特征在于,所述通过所述V个路径节点分别对应的节点关联概率以及所述节点对中的第二路径节点,对所述第一初始参数矩阵与所述第二初始参数矩阵进行参数调整,包括:
在所述V个路径节点分别对应的节点关联概率中,获取所述节点对中的第二路径节点的目标关联概率;
根据所述目标关联概率,与剩余路径节点对应的节点关联概率,生成损失函数,基于所述损失函数对所述第一初始参数矩阵与所述第二初始参数矩阵进行参数调整;所述剩余路径节点是指所述V个路径节点中除了所述节点对中的第一路径节点及第二路径节点之外的路径节点。
10.如权利要求1所述的方法,其特征在于,所述基于所述节点关联特征对所述V个路径节点进行聚类处理,得到用于对路网进行区域划分的节点集合,包括:
获取所述V个路径节点所对应的节点属性类型,获取所述V个路径节点在所述节点属性类型中分别对应的节点属性特征;
对所述V个路径节点分别对应的节点关联特征,与所述V个路径节点分别对应的节点属性特征进行特征融合,得到所述V个路径节点分别对应的节点融合特征;
基于所述V个路径节点分别对应的节点融合特征,对所述V个路径节点进行聚类处理,得到用于对路网进行区域划分的节点集合。
11.如权利要求1所述的方法,其特征在于,所述基于所述节点关联特征对所述V个路径节点进行聚类处理,得到用于对路网进行区域划分的节点集合,包括:
基于所述节点关联特征,获取第i个路径节点分别与所述V个路径节点之间的节点间距,将具有最小的节点间距的路径节点,确定为所述第i个路径节点的最小邻接节点,将所述最小的节点间距确定为所述第i个路径节点的可达距离,直至得到所述V个路径节点分别对应的最小邻接节点及可达距离;i为小于或等于V的正整数;
以所述V个路径节点作为树节点,以所述V个路径节点与所述V个路径节点分别对应的最小邻接节点之间构建树边,构建路径节点树;
基于所述V个路径节点分别对应的可达距离,对所述路径节点树进行切分,得到k个子路径节点树;k为正整数;
将每个子路径节点树中所包括的路径节点,组成用于对路网进行区域划分的节点集合。
12.如权利要求11所述的方法,其特征在于,所述基于所述节点关联特征,获取第i个路径节点分别与所述V个路径节点之间的节点间距,包括:
获取第i个路径节点的节点关联特征,与所述V个路径节点分别对应的节点关联特征之间的特征距离,从V个特征距离中获取所述第i个路径节点的第一节点距离,直至得到所述V个路径节点分别对应的第一节点距离;
从所述第i个路径节点的第一节点距离、第p个路径节点的第一节点距离,以及所述第i个路径节点的节点关联特征与所述第p个路径节点的节点关联特征之间的特征距离中,确定所述第i个路径节点与所述第p个路径节点之间的节点间距,直至得到所述第i个路径节点分别与所述V个路径节点之间的节点间距;p为小于或等于V的正整数。
13.如权利要求11所述的方法,其特征在于,所述基于所述V个路径节点分别对应的可达距离,对所述路径节点树进行切分,得到k个子路径节点树,包括:
对所述V个路径节点分别对应的可达距离进行排序,依次对排序后的可达距离在所述路径节点树中所对应的树边进行切分,直至切分得到的子树所包括的路径节点的数量小于或等于最小簇尺寸,将路径节点的数量小于或等于最小簇尺寸时所得到的子树确定为k个子路径节点树。
14.如权利要求1所述的方法,其特征在于,所述基于所述节点关联特征对所述V个路径节点进行聚类处理,得到用于对路网进行区域划分的节点集合,包括:
基于所述节点关联特征,获取第i个路径节点分别与所述V个路径节点之间的节点间距,将具有最小的节点间距的路径节点,确定为所述第i个路径节点的最小邻接节点,将所述最小的节点间距确定为所述第i个路径节点的可达距离,直至得到所述V个路径节点分别对应的最小邻接节点及可达距离;i为小于或等于V的正整数;
以所述V个路径节点作为子树节点,对所述V个路径节点分别对应的可达距离由小到大进行排序,依次构建排序后的可达距离所对应的路径节点及最小邻接节点之间的子树边,直至得到由所述V个路径节点组成的k个子路径节点树;k为正整数,每个子路径节点树所包括的路径节点的数量大于或等于最小簇尺寸;
将每个子路径节点树中所包括的路径节点,组成用于对路网进行区域划分的节点集合。
15.如权利要求1所述的方法,其特征在于,所述基于所述节点关联特征对所述V个路径节点进行聚类处理,得到用于对路网进行区域划分的节点集合,包括:
获取k个初始聚类中心,基于所述节点关联特征,获取所述V个路径节点分别到所述k个初始聚类中心的初始聚类距离;
基于所述V个路径节点分别到所述k个初始聚类中心的初始聚类距离,将所述V个路径节点划分至所述k个初始聚类中心所对应的初始集合中;
获取k个初始集合分别对应的更新聚类中心,基于所述V个路径节点分别到所述k个初始集合分别对应的更新聚类中心的更新聚类距离,将所述V个路径节点划分至k个更新聚类中心所对应的更新集合中;
若k个更新集合不满足节点聚类条件,则将所述k个更新集合确定为所述k个初始集合,返回执行所述获取k个初始集合分别对应的更新聚类中心的过程;
若所述k个更新集合满足所述节点聚类条件,则将所述k个更新集合确定为用于对路网进行区域划分的节点集合。
16.如权利要求1所述的方法,其特征在于,所述基于所述节点关联特征对所述V个路径节点进行聚类处理,得到用于对路网进行区域划分的节点集合,包括:
从所述V个路径节点中获取待处理路径节点;所述待处理路径节点是指未进行节点聚类处理的路径节点;
获取位于所述待处理路径节点的节点邻域的路径节点的邻接数量;所述位于所述待处理路径节点的节点邻域的路径节点是指与所述待处理路径节点之间的特征距离小于或等于邻域半径的路径节点;所述特征距离是指对应的路径节点的节点关联特征与所述待处理路径节点的节点关联特征之间的距离;
若所述邻接数量大于或等于最小集合节点数,则基于所述待处理路径节点及位于所述待处理路径节点的节点邻域的路径节点,进行节点扩充,得到所述待处理路径节点所对应的密度可达节点,将所述待处理路径节点与所述密度可达节点组成用于对路网进行区域划分的节点集合,返回执行所述从所述V个路径节点中获取待处理路径节点的过程,直至所述V个路径节点中不存在所述待处理路径节点;
若所述邻接数量小于最小集合节点数,则返回执行所述从所述V个路径节点中获取待处理路径节点的过程。
17.如权利要求1所述的方法,其特征在于,所述方法还包括:
响应针对起始路径节点至终止路径节点的路径查询请求,获取所述终止路径节点所在的目标节点集合;所述起始路径节点属于所述V个路径节点,所述终止路径节点属于所述V个路径节点;
获取所述目标节点集合所包括的路径节点,获取所述起始路径节点至所述目标节点集合所包括的路径节点的第一轨迹路径,获取所述目标节点集合所包括的路径节点至所述终止路径节点的第二轨迹路径;
根据所述第一轨迹路径及所述第二轨迹路径,确定所述起始路径节点至所述终止路径节点的目标轨迹路径。
18.一种数据处理装置,其特征在于,所述装置包括:
节点获取模块,用于获取V个路径节点;
序列获取模块,用于从所述V个路径节点中获取序列起点,基于所述序列起点对所述V个路径节点进行游走遍历,得到由所述V个路径节点组成的M个路径序列;V为正整数;M为正整数;所述序列起点的数量为一个或至少两个;
节点对获取模块,用于从所述M个路径序列中获取节点对;
特征确定模块,用于基于所述节点对中的第一路径节点,预测所述V个路径节点分别与所述第一路径节点之间的节点关联概率,通过所述V个路径节点分别对应的节点关联概率以及所述节点对中的第二路径节点,确定所述V个路径节点分别对应的节点关联特征;所述第一路径节点和所述第二路径节点处于同一个路径序列中;
节点聚类模块,用于基于所述节点关联特征对所述V个路径节点进行聚类处理,得到用于对路网进行区域划分的节点集合。
19.一种计算机设备,其特征在于,包括处理器、存储器、输入输出接口;
所述处理器分别与所述存储器和所述输入输出接口相连,其中,所述输入输出接口用于接收数据及输出数据,所述存储器用于存储计算机程序,所述处理器用于调用所述计算机程序,以使得所述计算机设备执行权利要求1-17任一项所述的方法。
20.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序适于由处理器加载并执行,以使得具有所述处理器的计算机设备执行权利要求1-17任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210230988.5A CN114419357B (zh) | 2022-03-10 | 2022-03-10 | 数据处理方法、装置、计算机及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210230988.5A CN114419357B (zh) | 2022-03-10 | 2022-03-10 | 数据处理方法、装置、计算机及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114419357A CN114419357A (zh) | 2022-04-29 |
CN114419357B true CN114419357B (zh) | 2022-06-21 |
Family
ID=81263252
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210230988.5A Active CN114419357B (zh) | 2022-03-10 | 2022-03-10 | 数据处理方法、装置、计算机及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114419357B (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113065074A (zh) * | 2021-04-02 | 2021-07-02 | 大连理工大学 | 一种基于知识图谱和自注意力机制的轨迹目的地预测的方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10119826B2 (en) * | 2015-05-19 | 2018-11-06 | Verizon Connect Ireland Limited | System and method for accelerating route search |
CN105354221A (zh) * | 2015-09-30 | 2016-02-24 | 百度在线网络技术(北京)有限公司 | 路径查询方法及装置 |
JP6794762B2 (ja) * | 2016-10-17 | 2020-12-02 | 日本電気株式会社 | 経路管理装置、経路管理方法及びプログラム |
US10671936B2 (en) * | 2017-04-06 | 2020-06-02 | Universite Paris Descartes | Method for clustering nodes of a textual network taking into account textual content, computer-readable storage device and system implementing said method |
CN107222410B (zh) * | 2017-06-29 | 2020-09-15 | 广州杰赛科技股份有限公司 | 链接预测的方法、装置、终端及计算机可读存储介质 |
CN112985371B (zh) * | 2019-12-12 | 2023-02-28 | 杭州海康威视数字技术股份有限公司 | 路径确定方法、装置及设备 |
CN113807457A (zh) * | 2021-09-26 | 2021-12-17 | 北京市商汤科技开发有限公司 | 确定路网表征信息的方法、装置、设备及存储介质 |
-
2022
- 2022-03-10 CN CN202210230988.5A patent/CN114419357B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113065074A (zh) * | 2021-04-02 | 2021-07-02 | 大连理工大学 | 一种基于知识图谱和自注意力机制的轨迹目的地预测的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114419357A (zh) | 2022-04-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102378859B1 (ko) | 맵 궤적 매칭 데이터의 품질을 결정하는 방법, 장치, 서버 및 매체 | |
CN110008413B (zh) | 一种交通出行问题查询方法和装置 | |
JP2018528415A (ja) | ナビゲーション参照点特定及びナビゲーション方法、装置並びに記憶媒体 | |
CN107145991B (zh) | 一种考虑路段相关性的时变随机网络动态路径搜索方法 | |
CN111815946A (zh) | 一种异常路段的确定方法、装置、存储介质和电子设备 | |
CN111027743A (zh) | 基于分层路网的od最优路径搜索方法及装置 | |
CN116036604B (zh) | 数据处理方法、装置、计算机及可读存储介质 | |
CN114881315A (zh) | 行程到达时间确定方法、装置、电子设备和存储介质 | |
CN117221087A (zh) | 告警根因定位方法、装置及介质 | |
KR20210117235A (ko) | 위치 기반 경로 데이터베이스의 관리 방법 및 이를 수행하는 서버 | |
CN112700073B (zh) | 公交线路规划方法和装置 | |
CN113239138B (zh) | 地图匹配方法、装置、计算机设备和存储介质 | |
CN114419357B (zh) | 数据处理方法、装置、计算机及可读存储介质 | |
CN116698075A (zh) | 路网数据处理方法、装置、电子设备及存储介质 | |
Sasaki et al. | Road segment interpolation for incomplete road data | |
CN114245329B (zh) | 通行方式识别方法、装置、设备及存储介质 | |
CN114399124B (zh) | 路径数据处理、路径规划方法、装置和计算机设备 | |
CN111047107A (zh) | 公路通行时间预测方法、装置、电子设备和存储介质 | |
CN115775367A (zh) | 道路目标检测方法、检测装置、电子设备及存储介质 | |
CN111552759B (zh) | 一种行动轨迹相关数据的获取方法、装置、设备及介质 | |
CN110674843A (zh) | 一种停车场实体的生成方法及系统 | |
CN116150699B (zh) | 基于深度学习的交通流预测方法、装置、设备及介质 | |
CN116612421B (zh) | 一种融合多源空间数据的建成环境识别方法及设备 | |
Khanna et al. | Mining entry gates for points of interest | |
CN118839819A (zh) | 通行时间预测方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40070006 Country of ref document: HK |