CN112785082B - 基于学习的路网最短路距离近似计算模型训练方法和装置 - Google Patents
基于学习的路网最短路距离近似计算模型训练方法和装置 Download PDFInfo
- Publication number
- CN112785082B CN112785082B CN202110166417.5A CN202110166417A CN112785082B CN 112785082 B CN112785082 B CN 112785082B CN 202110166417 A CN202110166417 A CN 202110166417A CN 112785082 B CN112785082 B CN 112785082B
- Authority
- CN
- China
- Prior art keywords
- road network
- training
- shortest distance
- distance
- nodes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Operations Research (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Traffic Control Systems (AREA)
Abstract
本申请提出一种基于学习的路网最短路距离近似计算模型训练方法和装置,涉及信息检索技术领域,其中,方法包括:获取城市对应的道路信息,根据道路信息生成城市对应的路网;将路网中的每个节点随机初始化为低维向量表示;获取路网对应的训练数据;其中,每个训练数据包括:出发地样本、目的地样本和最短路距离标签;用训练数据对路网结点的向量表示进行训练,根据向量表示之间的向量距离与最短路距离标签的误差调整路网最短路距离近似计算模型的参数,生成最终的路网最短路距离近似计算模型。由此,基于路网最短路距离近似计算模型可以快速有效获取出发地和目的地的最短路径。
Description
技术领域
本申请涉及信息检索技术领域,尤其涉及一种基于学习的路网最短路距离近似计算模型训练方法和装置。
背景技术
目前,在交通出行领域,路网两点间最短路距离计算是一个重要的课题,其在许多实际应用中扮演重要角色,例如查找附近的出租车/饭店等。路网两点间最短路距离指的是将城市道路建模为路网图,然后对于出发地和目的地对应的路网结点,计算两点间最短路径的总长度。针对该问题有大量的研究工作,但是目前仍存在较大的局限性,相关技术中,利用优先队列,在图中逐步找出路径距离由近到远的结点及路径长度,直到找到目的结点,得到对应最短路径长度,但是这种算法在大数据集上需要大量计算时间;针对这个问题,一些研究者通过建立高效的索引减小搜索空间,提高搜索速度,但还是无法达到很高的速度;一些研究者为了提高计算速度,申请一些近似算法,但是这些方法均难以在保持低误差率的同时大幅提高计算速度。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本申请的第一个目的在于提出一种基于学习的路网最短路距离近似计算模型训练方法,用基于学习的方法在低维空间中捕捉路网结点间的距离关系,从而高速地计算出近似最短路距离,同时保持很低的误差率。
本申请的第二个目的在于提出一种基于学习的路网最短路距离近似计算模型训练装置。
为达上述目的,本申请第一方面实施例提出了一种基于学习的路网最短路距离近似计算模型训练方法,包括:
获取城市对应的道路信息,根据所述道路信息生成所述城市对应的路网;其中,所述路网的节点表示位置信息,节点之间的路径表示节点对应位置信息的距离信息;
将所述路网中的每个节点随机初始化为低维向量表示,获取所述路网对应的训练数据,其中,每个训练数据包括:出发地样本、目的地样本和最短路距离标签;
将所述训练数据输入路网最短路距离近似计算模型进行训练,获取每个训练数据对应的训练最短路距离,根据所述训练最短路距离与所述最短路距离标签的误差调整所述路网最短路距离近似计算模型的参数,直到所述误差小于预设阈值,生成所述路网最短路距离近似计算模型。
本申请实施例的基于学习的路网最短路距离近似计算模型训练方法,通过获取城市对应的道路信息,根据道路信息生成城市对应的路网;将路网中的每个节点随机初始化为低维向量表示;获取路网对应的训练数据;将训练数据输入路网最短路距离近似计算模型进行训练,获取每个训练数据对应的训练最短路距离,根据训练最短路距离与最短路距离标签的误差调整路网最短路距离近似计算模型的参数直到误差小于预设阈值,生成路网最短路距离近似计算模型。由此,基于路网最短路距离近似计算模型可以快速有效获取出发地和目的地的最短路径。
可选地,在本申请的一个实施例中,所述获取所述路网对应的训练数据,包括:
获取所述路网中任意两个结点对应全局嵌入向量的第一范数距离表示所述任意两个结点对应的路网最短路距离标签;其中,所述任意两个结点分别为所述出发地样本和所述目的地样本。
可选地,在本申请的一个实施例中,所述将所述训练数据输入路网最短路距离近似计算模型进行训练,获取每个训练数据对应的训练最短路距离,包括:
使用图划分算法递归地对所述路网进行处理,获取多个子图,将所述多个子图分别进行图划分,递归执行至每个子图中只有一个点,获取层次树;其中,所述层次树中的每个结点具有对应的一低维向量表示作为所述每个节点的局部嵌入向量,所述每个节点到根节点路径上所有结点的局部嵌入的总和作为所述每个节点的全局嵌入向量;
随机选取多个子图对,并在每个子图对的两个子图中分别随机选取一个结点,并获取两个节点的全局嵌入向量计算第一范数距离,获取所述训练最短路距离。
可选地,在本申请的一个实施例中,所述的方法,还包括:
获取数量小于结点总数的地标集合,并从所述地标集合中的确定所述路网对应的训练数据,其中,每个训练数据包括:出发地样本、目的地样本和最短路距离标签。
可选地,在本申请的一个实施例中,获取当前嵌入矩阵在验证数据集上的误差距离分布,根据所述误差距离分布选取下一轮的训练数据。
为达上述目的,本申请第二方面实施例提出了一种基于学习的路网最短路距离近似计算模型的计算方法,包括:
接收路径计算请求;其中,所述路径计算请求包括出发地和目的地;
获取所述出发地的出发全局嵌入向量,以及获取所述目的地的目的全局嵌入向量;
计算所述出发全局嵌入向量和所述目的全局嵌入向量的第一范数距离并输出。
为达上述目的,本申请第三方面实施例提出了一种基于学习的路网最短路距离近似计算模型训练装置,包括:
第一获取模块,用于获取城市对应的道路信息,根据所述道路信息生成所述城市对应的路网;其中,所述路网的节点表示位置信息,节点之间的路径表示节点对应位置信息的距离信息;
第二获取模块,用于将所述路网中的每个节点随机初始化为低维向量表示;
第三获取模块,用于获取所述路网对应的训练数据,其中,每个训练数据包括:出发地样本、目的地样本和最短路距离标签;
处理模块,用于将所述训练数据输入路网最短路距离近似计算模型进行训练,获取每个训练数据对应的训练最短路距离,根据所述训练最短路距离与所述最短路距离标签的误差调整所述路网最短路距离近似计算模型的参数,直到所述误差小于预设阈值,生成所述路网最短路距离近似计算模型。
本申请实施例的基于学习的路网最短路距离近似计算模型训练装置,通过获取城市对应的道路信息,根据道路信息生成城市对应的路网;将路网中的每个节点随机初始化为低维向量表示;获取路网对应的训练数据;将训练数据输入路网最短路距离近似计算模型进行训练,获取每个训练数据对应的训练最短路距离,根据训练最短路距离与最短路距离标签的误差调整路网最短路距离近似计算模型的参数直到误差小于预设阈值,生成路网最短路距离近似计算模型。由此,基于路网最短路距离近似计算模型可以快速有效获取出发地和目的地的最短路径。
为达上述目的,本申请第四方面实施例提出了一种基于学习的路网最短路距离近似计算模型的计算装置,包括:
接收模块,用于接收路径计算请求;其中,所述路径计算请求包括出发地和目的地;
第四获取模块,用于获取所述出发地的出发全局嵌入向量,以及获取所述目的地的目的全局嵌入向量;
计算模块,用于计算所述出发全局嵌入向量和所述目的全局嵌入向量的第一范数距离并输出。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请实施例一所提供的一种基于学习的路网最短路距离近似计算模型训练方法的流程示意图;
图2是本申请所述的路网最短路距离近似计算模型的嵌入表示和使用方法示例图;
图3是本申请所述的路网最短路嵌入模型的整体训练框架;
图4是本申请所述的层次化模型表示和训练模块示例图;
图5给出了利用本申请设计的路网最短路近似计算模型的流程图;
图6为本申请实施例所提供的一种基于学习的路网最短路距离近似计算模型训练装置的结构示意图;
图7为本申请实施例所提供的一种基于学习的路网最短路距离近似计算模型的计算装置的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
下面参考附图描述本申请实施例的基于学习的路网最短路距离近似计算模型训练方法和装置。
图1为本申请实施例一所提供的一种基于学习的路网最短路距离近似计算模型训练方法的流程示意图。
基于上述描述,交通出行领域一个重要的问题是计算路网中两点最短路距离,即给定出发/到达点,计算两点间最短路径的长度。针对这样的问题,本申请提出了一个基于学习的近似方法,可以达到极高计算速度、极低近似误差和很好的拓展性。该方法的主要框架是先把路网嵌入到一个捕捉结点间距离关系的低维空间中,然后用空间中向量间的1范数距离来近似最短路距离。该方法设计的训练模型包含两个模块:层次化模型表示和训练模块、训练数据选择模块。首先,使用一个层次化的模型来表示路网的嵌入,然后用由上到下的层次化方法来高效训练此模型。训练程序包含子图嵌入训练、结点嵌入训练和主动学习微调三个过程,即由粗粒度过渡为细粒度,最后精细微调。第一步,通过逐层图划分把结点组织成层次树结构,然后逐层进行子图嵌入的训练;第二步,进行所有结点嵌入的训练;第三步,在现有嵌入的高误差处进行加强训练。然后,为三个不同粒度的过程分别设计了相匹配的训练数据选择方法,确保每个过程得到高质量的嵌入,分别是子图级别样本选取、基于地标结点的样本选取、基于误差的样本选取。本申请利用训练得到的树形结构嵌入矩阵设计了高效的k近邻查询算法和范围查询算法。该算法的主要思路是利用树结点的嵌入计算得到树结点到查询点的最短路距离下限,在树的遍历过程中,将下限大于输出上限的结点剪枝。
如图1所示,该基于学习的路网最短路距离近似计算模型训练方法包括以下步骤:
步骤101,获取城市对应的道路信息,根据道路信息生成城市对应的路网;其中,路网的节点表示位置信息,节点之间的路径表示节点对应位置信息的距离信息。
步骤102,将路网中的每个节点随机初始化为低维向量表示,获取路网对应的训练数据,其中,每个训练数据包括:出发地样本、目的地样本和最短路距离标签。
步骤103,将训练数据输入路网最短路距离近似计算模型进行训练,获取每个训练数据对应的训练最短路距离,根据训练最短路距离与最短路距离标签的误差调整路网最短路距离近似计算模型的参数,直到误差小于预设阈值,生成路网最短路距离近似计算模型。
在本申请实施例中,路网指的是一个城市的道路系统,其可表示为有向图的形式。其中,路网的路段表示为有向图的边,路段间的交叉口表示为有向图的结点,每条边的边权表示路段的长度,出发地和目的地指的是路网结点,即唯一的结点编号表示。
在本申请实施例中,路径指的是任一条连接出发地和目的地的边序列,其中相邻的边首尾相连,路网最短路距离指的是出发地和目的地结点间所有路径中的最短总长度,路网嵌入指的是将路网中的每个结点嵌入到一低维向量空间中,将整个路网用一嵌入矩阵来表示,其中两两向量的1范数距离可用以近似对应路网结点的最短路距离。
在本申请实施例中,获取嵌入矩阵中任意两个结点对应嵌入向量的第一范数距离表示任意两个结点对应的路网最短路距离标签;其中,任意两个结点分别为出发地样本和目的地样本。
在本申请实施例中,将训练数据输入路网最短路距离近似计算模型进行训练,获取每个训练数据对应的训练最短路距离,包括:使用图划分算法递归地对所述路网进行处理,获取多个子图,将多个子图分别进行图划分,递归执行至每个子图中只有一个点,获取层次树;其中,层次树中的每个结点具有对应的一低维向量表示作为每个节点的局部嵌入向量,每个节点到根节点路径上所有结点的局部嵌入的总和作为每个节点的全局嵌入向量;随机选取多个子图对,并在每个子图对的两个子图中分别随机选取一个结点,并获取两个节点的全局嵌入向量计算第一范数距离,获取训练最短路距离。
在本申请实施例中,获取数量小于结点总数的地标集合,并从地标集合中的确定路网对应的训练数据,其中,每个训练数据包括:出发地样本、目的地样本和最短路距离标签。
需要说明的是,本申请数量小于结点总数中的小于一般优选远远小于,数量和结点总数之间的差值小于预设阈值,其中,预设阈值一般设置比较大,以获取的训练数据训练出的模型更加准确。
在本申请实施例中,获取验证数据集,根据验证数据集对路网最短路距离近似计算模型进行验证。
在本申请实施例中,获取当前嵌入矩阵在验证数据集上的误差距离分布,根据误差距离分布选取下一轮的训练数据
具体地,高效近似计算模型包含两大模块,分别是层次化模型表示和训练模块、训练数据选择模块;层次化模型表示和训练模块指的是使用一个图划分得到的层次化模型来表示路网的嵌入,然后用由粗粒度到细粒度的层次化方法训练该模型的方法;图划分指的是将图中结点划分成若干部分,每个部分保留原图中首尾结点都属于该部分的边,得到若干子图。在划分过程中使得横跨两子图的边数量尽量少;层次化路网嵌入模型指的是将递归图划分得到的层次树中的每个结点都嵌入为一低维向量作为其局部表示,层次树中任一结点到根节点路径上所有结点的局部表示向量的总和作为其全局表示;层次化训练方法指的是在层次树结构中,先固定下层结点的局部嵌入,训练上层结点的局部嵌入,再逐渐向下转移;直到固定所有非叶结点的局部嵌入,只训练叶节点的局部嵌入;最后进行主动学习微调;嵌入训练指的是对于一个训练数据(出发地,目的地,最短路距离)集合,将起止地对应两个路网结点的全局嵌入计算1范数距离,再与最短路距离计算MSE(均方误差)作为样本损失,最后使用SGD(随机梯度下降)更新涉及到的所有局部嵌入。
具体地,主动学习微调指的是对于子图嵌入训练和结点嵌入训练得到的嵌入矩阵,不断根据其在验证数据集上的误差-距离分布来找出需要加强训练的距离区间,然后下一轮训练在这些区间内取更多的数据作为训练集,以此训练出更加精细、误差更小的模型。
具体地,验证数据集上的误差-距离分布指的是将训练数据的实际最短路距离划分成若干区间,用各个区间上的数据的平均误差率反映这一分布,训练数据选择模块指的是为层次化模型表示和训练模块的3个阶段设计不同的训练数据选取方法。
具体地,子图嵌入训练中,使用如下训练数据选取方法:先随机选取若干个子图对,再在每个子图对的两个子图中分别随机选取一个结点。这样各个子图可以均匀得到训练数据;结点嵌入训练中,使用如下训练数据选取方法:先挑选出数量远小于结点总数的地标集合,然后不断选取(地标,结点,最短路距离)作为训练数据。这样可以减少训练中嵌入向量更新中的冲突,加快收敛。
具体地,主动学习微调中,使用如下训练数据选取方法:获取当前嵌入矩阵在验证数据集上的误差-距离分布,然后以此分布作为比例在各个区间选取训练数据用于下一轮的训练。这样可以不断减小大误差区间的误差,提高模型的准确度和稳定性。
具体地,k近邻查询算法和范围查询算法指的是,遍历上述层次树结构,利用上述最短路距离计算方法求出每个遍历到的树结点到查询点的距离,作为对应子图中所有点到查询点的距离下限,将下限大于输出上限的结点剪枝,输出其他遍历到的叶结点对应的路网结点。
作为一种场景实现,定义相关概念以及问题:路网,最短路距离和最短路距离近似计算问题;基于Tensorflow深度学习框架实现权利1所述的层次化模型表示和训练模块;使用训练数据选择模块选取数据基于Tensorflow深度学习框架训练S2模块中模型的参数;将层次化嵌入向量树转为路网结点嵌入矩阵。
举例而言,形式化定义路网最短路距离计算问题,明确问题的输入输出;设计基于学习的路网嵌入表示模型,用1范数向量距离表示路网最短路距离;设计层次化模型表示和训练模块;设计训练数据选择模块;利用训练数据和层次化模型表示和训练模块训练路网嵌入表示模型中的路网嵌入。
具体地,在上述形式化定义路网最短路距离计算问题时,明确了问题的输入和输出分别如下:输入指的是路网图和出发地、目的地对应的路网结点;输出是出发地、目的地结点间最短路径长度,图2左侧是最短路径的一个示例。
具体地,如图2右侧所示,嵌入矩阵中任意两个结点对应嵌入向量的1范数距离可用来表示两个结点对应的路网最短路距离,即本申请将路网图结点间的最短路距离关系嵌入到了低维向量空间(嵌入矩阵)中。
具体地,路网最短路嵌入模型的训练方法,训练的总体框架如图3所示,分别为层次化模型表示和训练模块(上半部分)和训练数据选择模块。其中又按照训练粒度从大到小分为3个训练阶段,分别是子图嵌入训练、结点嵌入训练、主动学习微调。训练数据选择模块为上述3个阶段分别设计了不同的训练样本选取方法。
具体地,使用图划分算法递归地将路网图组织成一树形结构(如图4左侧部分所示),然后由上到下地进行上述3个阶段的训练。上述图划分算法指的是将图中结点划分成若干部分,每个部分保留原图中首尾结点都属于该部分的边,得到若干子图。在划分过程中使得横跨两子图的边数量尽量少。对路网图进行图划分,再将所得子图分别进行图划分,递归执行至子图中只有一个点(即底层的子图集合都是单独的路网结点),得到一个子图规模由大到小,子图数量由少到多的层次树。层次树中的每个结点(代表一子图或一路网结点)都有一低维向量作为其局部嵌入,如该结点到根节点路径上所有结点的局部嵌入的总和作为其全局嵌入,如第一阶段,由上到下逐层训练该层的子图嵌入,如图4右侧部分所示。其中嵌入训练指的是对于一个训练数据(出发地,目的地,最短路距离)集合,将起止地对应两个路网结点的全局嵌入计算1范数距离,与最短路距离计算MSE(均方误差)作为样本损失,使用SGD(随机梯度下降)更新涉及到的所有局部嵌入。训练由上到下地进行,体现为学习的嵌入由上层到下层逐渐转移,具体来说,先在较高层取较大的学习率,重点训练高层局部嵌入,如然后慢慢向下转移,变成下层取较大学习率,重点训练低层局部嵌入,如第二阶段,只训练底层的嵌入,即结点嵌入,即固定除叶结点外的嵌入,只有结点嵌入学习率非0;第三阶段,通过主动选择有针对性的样本,加强训练此路网最短路嵌入模型中准确率较低的部分。
具体地,本申请所述的训练数据选择模块为上述3个训练分别有针对性地提供训练样本集合,即结点对及其真实最短路距离。对于子图嵌入训练阶段,该模块使用如下训练数据选取方法:先随机选取若干个子图对,再在每个子图对的两个子图中分别随机选取一个结点;对于结点嵌入训练阶段,使用如下训练数据选取方法:先挑选出数量远小于结点总数的地标集合,然后不断选取(地标,结点,最短路距离)作为训练数据;对于主动学习微调阶段,使用如下训练数据选取方法:获取当前嵌入矩阵在验证数据集上的误差-距离分布,即验证集各个距离尺度区间上的平均误差率,然后以此分布作为比例在各个区间选取训练数据用于下一轮的训练。
图5给出了利用本申请设计的路网最短路近似计算模型的流程图,包括以下步骤:
步骤201,接收路径计算请求;其中,路径计算请求包括出发地和目的地。
步骤202,获取出发地的出发全局嵌入向量,以及获取目的地的目的全局嵌入向量。
步骤203,计算所出发全局嵌入向量和目的全局嵌入向量的第一范数距离并输出。
具体地,给定出发地、目的地对应的路网结点输入,该模型利用路网结点编号从本申请训练好的路网最短路嵌入矩阵中取出对应的两个嵌入向量;计算上述两个嵌入向量的1范数距离作为路网最短路距离的近似解并输出。
本申请实施例的基于学习的路网最短路距离近似计算模型训练方法,通过获取城市对应的道路信息,根据道路信息生成城市对应的路网;将路网中的每个节点嵌入到一低维向量空间中获取路网对应的嵌入矩阵;根据嵌入矩阵获取路网对应的训练数据;将训练数据输入路网最短路距离近似计算模型进行训练,获取每个训练数据对应的训练最短路距离,根据训练最短路距离与最短路距离标签的误差调整路网最短路距离近似计算模型的参数直到误差小于预设阈值,生成路网最短路距离近似计算模型。由此,基于路网最短路距离近似计算模型可以快速有效获取出发地和目的地的最短路径。
为了实现上述实施例,本申请还提出一种基于学习的路网最短路距离近似计算模型训练装置。
图6为本申请实施例提供的一种基于学习的路网最短路距离近似计算模型训练装置的结构示意图。
如图6所示,该基于学习的路网最短路距离近似计算模型训练装置包括:第一获取模块610、第二获取模块620、第三获取模块630和处理模块。
第一获取模块610,用于获取城市对应的道路信息,根据所述道路信息生成所述城市对应的路网;其中,所述路网的节点表示位置信息,节点之间的路径表示节点对应位置信息的距离信息。
第二获取模块620,用于将所述路网中的每个节点随机初始化为低维向量表示。
第三获取模块630,用于获取所述路网对应的训练数据,其中,每个训练数据包括:出发地样本、目的地样本和最短路距离标签。
处理模块640,用于将所述训练数据输入路网最短路距离近似计算模型进行训练,获取每个训练数据对应的训练最短路距离,根据所述训练最短路距离与所述最短路距离标签的误差调整所述路网最短路距离近似计算模型的参数,直到所述误差小于预设阈值,生成所述路网最短路距离近似计算模型。
在本申请实施例中,第三获取模块630,具体用于:获取所述嵌入矩阵中任意两个结点对应嵌入向量的第一范数距离表示所述任意两个结点对应的路网最短路距离标签;其中,所述任意两个结点分别为所述出发地样本和所述目的地样本。
本申请实施例的基于学习的路网最短路距离近似计算模型训练装置,通过获取城市对应的道路信息,根据道路信息生成城市对应的路网;将路网中的每个节点随机初始化为低维向量表示;获取路网对应的训练数据;将训练数据输入路网最短路距离近似计算模型进行训练,获取每个训练数据对应的训练最短路距离,根据训练最短路距离与最短路距离标签的误差调整路网最短路距离近似计算模型的参数直到误差小于预设阈值,生成路网最短路距离近似计算模型。由此,基于路网最短路距离近似计算模型可以快速有效获取出发地和目的地的最短路径。
需要说明的是,前述对基于学习的路网最短路距离近似计算模型训练方法实施例的解释说明也适用于该实施例的基于学习的路网最短路距离近似计算模型训练装置,此处不再赘述。
图7为本申请实施例所提供的一种基于学习的路网最短路距离近似计算模型的计算装置的结构示意图。
如图7所示,该基于学习的路网最短路距离近似计算模型的计算装置包括:接收模块710、第四获取模块720和计算模块730。
接收模块710,用于接收路径计算请求;其中,所述路径计算请求包括出发地和目的地。
第四获取模块720,用于获取所述出发地的出发全局嵌入向量,以及获取所述目的地的目的全局嵌入向量。
计算模块730,用于计算所述出发全局嵌入向量和所述目的全局嵌入向量的第一范数距离并输出。
本申请实施例的基于学习的路网最短路距离近似计算模型的计算装置,通过接收路径计算请求;其中,所述路径计算请求包括出发地和目的地;获取所述出发地的出发全局嵌入向量,以及获取所述目的地的目的全局嵌入向量;计算所述出发全局嵌入向量和所述目的全局嵌入向量的第一范数距离并输出。由此,可以捕捉路网中各结点的距离关系并高效地计算出任意两点间低误差的近似最短路距离。
需要说明的是,前述对基于学习的路网最短路距离近似计算模型的计算方法实施例的解释说明也适用于该实施例的基于学习的路网最短路距离近似计算模型的计算装置,此处不再赘述。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (8)
1.一种基于学习的路网最短路距离近似计算模型训练方法,其特征在于,包括以下步骤:
获取城市对应的道路信息,根据所述道路信息生成所述城市对应的路网;其中,所述路网的节点表示位置信息,节点之间的路径表示节点对应位置信息的距离信息;
将所述路网中的每个节点随机初始化为低维向量表示,获取所述路网对应的训练数据,其中,每个训练数据包括:出发地样本、目的地样本和最短路距离标签;
将所述训练数据输入路网最短路距离近似计算模型进行训练,获取每个训练数据对应的训练最短路距离,根据所述训练最短路距离与所述最短路距离标签的误差调整所述路网最短路距离近似计算模型的参数,直到所述误差小于预设阈值,生成所述路网最短路距离近似计算模型,其中,所述将所述训练数据输入路网最短路距离近似计算模型进行训练,获取每个训练数据对应的训练最短路距离,包括:使用图划分算法递归地对所述路网进行处理,获取多个子图,将所述多个子图分别进行图划分,递归执行至每个子图中只有一个点,获取层次树;其中,所述层次树中的每个结点具有对应的一低维向量表示作为所述每个节点的局部嵌入向量,所述每个节点到根节点路径上所有结点的局部嵌入的总和作为所述每个节点的全局嵌入向量;随机选取多个子图对,并在每个子图对的两个子图中分别随机选取一个结点,并获取两个节点的全局嵌入向量计算第一范数距离,获取所述训练最短路距离。
2.如权利要求1所述的方法,其特征在,所述获取所述路网对应的训练数据,包括:
获取所述路网中任意两个结点对应全局嵌入向量的第一范数距离表示所述任意两个结点对应的路网最短路距离标签;其中,所述任意两个结点分别为所述出发地样本和所述目的地样本。
3.如权利要求1所述的方法,其特征在,还包括:
获取数量小于结点总数的地标集合,并从所述地标集合中的确定所述路网对应的训练数据,其中,每个训练数据包括:出发地样本、目的地样本和最短路距离标签。
4.如权利要求1所述的方法,其特征在,还包括:
获取当前嵌入矩阵在验证数据集上的误差距离分布,根据所述误差距离分布选取下一轮的训练数据。
5.一种如权利要求1-4任一项所述的基于学习的路网最短路距离近似计算模型的计算方法,其特征在于,包括以下步骤:
接收路径计算请求;其中,所述路径计算请求包括出发地和目的地;
获取所述出发地的出发全局嵌入向量,以及获取所述目的地的目的全局嵌入向量;
计算所述出发全局嵌入向量和所述目的全局嵌入向量的第一范数距离并输出。
6.一种基于学习的路网最短路距离近似计算模型训练装置,其特征在于,包括:
第一获取模块,用于获取城市对应的道路信息,根据所述道路信息生成所述城市对应的路网;其中,所述路网的节点表示位置信息,节点之间的路径表示节点对应位置信息的距离信息;
第二获取模块,用于将所述路网中的每个节点随机初始化为低维向量表示;
第三获取模块,用于获取所述路网对应的训练数据,其中,每个训练数据包括:出发地样本、目的地样本和最短路距离标签;
处理模块,用于将所述训练数据输入路网最短路距离近似计算模型进行训练,获取每个训练数据对应的训练最短路距离,根据所述训练最短路距离与所述最短路距离标签的误差调整所述路网最短路距离近似计算模型的参数,直到所述误差小于预设阈值,生成所述路网最短路距离近似计算模型,其中,所述处理模块,具体用于:使用图划分算法递归地对所述路网进行处理,获取多个子图,将所述多个子图分别进行图划分,递归执行至每个子图中只有一个点,获取层次树;其中,所述层次树中的每个结点具有对应的一低维向量表示作为所述每个节点的局部嵌入向量,所述每个节点到根节点路径上所有结点的局部嵌入的总和作为所述每个节点的全局嵌入向量;随机选取多个子图对,并在每个子图对的两个子图中分别随机选取一个结点,并获取两个节点的全局嵌入向量计算第一范数距离,获取所述训练最短路距离。
7.如权利要求6所述的装置,其特征在,所述第三获取模块,具体用于:
获取所述路网中任意两个结点对应全局嵌入向量的第一范数距离表示所述任意两个结点对应的路网最短路距离标签;其中,所述任意两个结点分别为所述出发地样本和所述目的地样本。
8.一种如权利要求6或7所述的基于学习的路网最短路距离近似计算模型的计算装置,其特征在于,包括:
接收模块,用于接收路径计算请求;其中,所述路径计算请求包括出发地和目的地;
第四获取模块,用于获取所述出发地的出发全局嵌入向量,以及获取所述目的地的目的全局嵌入向量;
计算模块,用于计算所述出发全局嵌入向量和所述目的全局嵌入向量的第一范数距离并输出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110166417.5A CN112785082B (zh) | 2021-02-04 | 2021-02-04 | 基于学习的路网最短路距离近似计算模型训练方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110166417.5A CN112785082B (zh) | 2021-02-04 | 2021-02-04 | 基于学习的路网最短路距离近似计算模型训练方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112785082A CN112785082A (zh) | 2021-05-11 |
CN112785082B true CN112785082B (zh) | 2022-10-21 |
Family
ID=75761111
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110166417.5A Active CN112785082B (zh) | 2021-02-04 | 2021-02-04 | 基于学习的路网最短路距离近似计算模型训练方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112785082B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113626654B (zh) * | 2021-07-16 | 2023-09-15 | 苏州大学 | 一种基于表示学习的批量最短路径查询方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6890069B2 (ja) * | 2017-08-31 | 2021-06-18 | 株式会社東芝 | 情報処理装置、情報処理方法及びコンピュータプログラム |
CN111415024A (zh) * | 2019-01-04 | 2020-07-14 | 北京嘀嘀无限科技发展有限公司 | 一种到达时间预估方法以及预估装置 |
CN111982138B (zh) * | 2020-07-09 | 2022-06-28 | 北京百度网讯科技有限公司 | 预测模型获取及路径规划方法、装置及存储介质 |
-
2021
- 2021-02-04 CN CN202110166417.5A patent/CN112785082B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN112785082A (zh) | 2021-05-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102693266B (zh) | 搜索数据库的方法、生成索引结构的导航设备和方法 | |
WO2006119482A2 (en) | Method for data clustering and classification by a graph theory model -- network partition into high density subgraphs | |
CN108279016A (zh) | Had地图的平滑处理方法和装置、导航系统及自动驾驶系统 | |
CN109992786A (zh) | 一种语义敏感的rdf知识图谱近似查询方法 | |
Bastani et al. | Machine-assisted map editing | |
CN110059264A (zh) | 基于知识图谱的地点检索方法、设备及计算机存储介质 | |
CN112785082B (zh) | 基于学习的路网最短路距离近似计算模型训练方法和装置 | |
CN115408410A (zh) | 电子地图数据与地图采集数据的匹配方法、装置及设备 | |
CN111209805A (zh) | 一种车道线众包数据的多道路片段数据的快速融合优化方法 | |
CN112033418A (zh) | 一种离线地图匹配方法 | |
CN112269848B (zh) | 一种众包轨迹数据融合方法及装置 | |
Rehrl et al. | Optimization and evaluation of a high-performance open-source map-matching implementation | |
Li et al. | Trajectory representation learning based on road network partition for similarity computation | |
Cho et al. | A basis of spatial big data analysis with map-matching system | |
CN112766385B (zh) | 一种众源矢量线数据几何匹配与属性融合方法 | |
CN113514072A (zh) | 一种面向导航数据与大比例尺制图数据的道路匹配方法 | |
CN111177190B (zh) | 数据处理方法、装置、电子设备及可读存储介质 | |
CN115049103A (zh) | 一种面向单源最短路径的并行图遍历方法 | |
CN114996278A (zh) | 一种基于强化学习的路网最短路径距离计算方法 | |
CN116994434B (zh) | 应用路网传感器对交通状态进行测量的信号传输系统 | |
Salani et al. | Pathwise: a flexible, open-source library for the resource constrained shortest path | |
CN112115072B (zh) | 时序图的处理方法及装置 | |
CN118552656B (zh) | 车道线拟合优化方法、装置、计算机设备及存储介质 | |
Vanhove | Alternative routing algorithms for road networks | |
CN117346790A (zh) | 基于路径规划算法的航迹管理方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |