CN110009455A - 一种基于网络表示学习的网约共享出行人员匹配方法 - Google Patents
一种基于网络表示学习的网约共享出行人员匹配方法 Download PDFInfo
- Publication number
- CN110009455A CN110009455A CN201910262393.6A CN201910262393A CN110009455A CN 110009455 A CN110009455 A CN 110009455A CN 201910262393 A CN201910262393 A CN 201910262393A CN 110009455 A CN110009455 A CN 110009455A
- Authority
- CN
- China
- Prior art keywords
- node
- altogether
- passenger
- driver
- multiply
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000008569 process Effects 0.000 title claims abstract description 28
- 239000013598 vector Substances 0.000 claims abstract description 42
- 238000005070 sampling Methods 0.000 claims description 14
- 239000013604 expression vector Substances 0.000 claims description 9
- 230000000694 effects Effects 0.000 claims description 7
- 238000013508 migration Methods 0.000 claims description 7
- 230000005012 migration Effects 0.000 claims description 7
- 238000005295 random walk Methods 0.000 claims description 6
- 239000012141 concentrate Substances 0.000 claims description 3
- 238000011478 gradient descent method Methods 0.000 claims description 2
- 230000006872 improvement Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Algebra (AREA)
- Artificial Intelligence (AREA)
- Computational Mathematics (AREA)
- Development Economics (AREA)
- Evolutionary Computation (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Computing Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Tourism & Hospitality (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Traffic Control Systems (AREA)
Abstract
一种基于网络表示学习的共乘匹配方法,根据乘客的起点和终点与司机原始路径的关系,将共乘分为两类:第一类是端点共乘,另一类是沿途共乘,乘客需要从起点步行至上车点,然后达成共乘,再由下车点步行至目的地,共乘路径轨迹是乘客轨迹的一部分;构建异质共乘网络,使用网络表示学习模型对异质共乘网络进行表示学习,得到用户节点的低维向量表示;计算司机与乘客节点的余弦相似度,并将计算得到的余弦相似值由大到小排序,返回与司机相似度数值最高的前k个乘客,作为可以共乘的乘客,达成共乘。本发明提出的共乘推荐方法比传统的仅使用距离推荐的方法更加可靠,语义理解性直观,能够准确发现潜在的共乘用户,为其提供更为快捷方便的服务。
Description
技术领域
本发明属于群体推荐领域,具体涉及一种基于网络表示学习的网约共享出行人员匹配方法。
背景技术
随着网约车平台和APP的日益发展,共乘出行逐渐被大众认知和接受,同时随着相关出行技术的发展,例如出行路线匹配、出行群体发现、路线规划、出行行为分析等相关工作的研究,共乘也成为了一种方便可行的出行模式。通过对共乘匹配的研究可以为用户提供更好的出行体验和更高的出行效率。
网络表示学习以及共乘出行的使用与影响使得共乘匹配方法的研究受到了很多的关注。在共乘匹配的研究中,主要的问题是如何将乘客准确地分配给司机,以及如何将不同出行群体之间的共乘匹配最优化。传统的匹配方法仅仅依赖于乘客和驾驶员之间的地理距离,并没有考虑到乘客或驾驶员与其他特征的关系,比如出行者和目的地、时间之间的关系。而异构信息网络能为共乘匹配提供更加有效的分析方法。因此通过利用用户、时间与地点位置信息构建的异构网络来从共乘信息中学习潜在语义,并且从用户轨迹和情感中提取特征,可以更好地为用户提供合适的共乘匹配关系。
发明内容
针对共乘出行的用户匹配问题,本发明的目的是提出一种基于网络表示学习的网约共享出行人员匹配方法。本发明采用异构信息网络中的元路径理论,将司机与乘客之间的匹配转换为异质共乘网络中节点的相似性度量问题,建立基于“司机-乘客”结构的共乘行为特征模型,并根据不同的共乘情况将模型分为端点共乘和沿途共乘。模型从司机和乘客各自的出发时间、上下车位置出发,结合机器学习中的skip-gram模型,分析特征间关系,推理司机和乘客间的共乘可能性,为共乘出行的优质服务提供支持。
为实现上述目的,本发明采用如下的技术方案:
一种基于网络表示学习的网约共享出行人员匹配方法,包括以下步骤:
步骤一:共乘分类
在司机原始路径确定的情况下,根据乘客的起点和终点与司机原始路径的关系,将共乘分为两类:第一类是端点共乘,乘客的起点和终点在司机的原始路径上;另一类是沿途共乘,乘客的起点和终点都不在司机的原始路径上,乘客需要从起点步行至上车点,然后达成共乘,再由下车点步行至目的地,共乘路径轨迹是乘客轨迹的一部分;
步骤二:构建异质共乘网络
将司机与乘客的请求信息表示为异质共乘网络形式,乘客与司机之间通过位置与时间信息相连接,从而构建异质共乘网络,该异质共乘网络中节点的类型包括用户、地点、时间段以及活动;
步骤三:使用网络表示学习模型对异质共乘网络进行表示学习,得到用户节点的低维向量表示;
步骤四:根据用户节点的低维向量表示计算司机与乘客节点的余弦相似度,并将计算得到的余弦相似值由大到小排序,返回与司机相似度数值最高的前k个乘客,作为可以共乘的乘客,达成共乘。
本发明进一步的改进在于,步骤一中,司机与乘客的请求信息包括司机起点和终点、离开时间、司机轨迹、上下车位置、乘客起点和终点以及上下车时间。
本发明进一步的改进在于,步骤二中,异质共乘网络中节点的类型包括用户、地点、时间段以及活动。
本发明进一步的改进在于,步骤三中,进行表示学习的过程具体包括以下两个步骤:
1)生成节点序列集:元路径指导节点在异质共乘网络中的游走,生成固定长度的节点序列集;
2)将生成的固定长度的节点序列集输入到skip-gram模型中进行训练,获取司机与乘客节点的向量表示。
本发明进一步的改进在于,步骤1)中,对于端点共乘,构建结构为ULTLU的元路径;对于沿途共乘,在时间段相同的约束下,构建结构为ULU的元路径。
本发明进一步的改进在于,步骤三中,进行表示学习的具体过程如下:
首先,给定具体的元路径通过元路径来指导节点在异质共乘网络中的随机游走,生成固定长度的节点序列集;其次,对于固定长度的节点序列集中任意用户节点vu,假设某一节点在序列集中的位置序号是j,则该方法会选取节点集vj-c,…,vj+c作为邻居节点,c是skip-gram中窗口大小的一半;因此,给定用户节点vu,skip-gram模型的目标是最大化具有异构邻居节点的上下文的条件概率:
其中,Na(vu)是节点vu邻居节点的集合,是节点类型的集合,p(vj-c,…,vj+c|vu;θ)为在已知中心节点的条件下,上下文的条件概率;
在假设各个节点间相互独立的情况下,在已知中心节点的条件下,上下文的条件概率为logp(vj-c,…,vj+c|vu;θ)进一步分解为其中的p(vk|vu;θ)使用softmax函数定义了给定节点vu的上下文节点vk的条件概率;
其中表示节点vu的表示向量;
根据给定节点vu的上下文节点vk的条件概率生成表示向量,再采用负采样来优化表示向量,得到异质共乘网络中每个用户节点的低维向量表示。
本发明进一步的改进在于,随机游走的游走概率如下:
公式(1)中,a表示节点类型,是路径上的一个a类型节点,表示沿着预定义的元路径上节点的邻居节点数量,ε表示网络中的链路集合,vi+1,表示两个节点在网络中能够构成一条链路,fv(vi+1)=a+1指的节点vi+1是a+1类型的节点;
公式(2)表示选取的元路径均为对称元路径。
本发明进一步的改进在于,采用负采样来优化表示向量的具体过程如下:
其中 是vu的随机负节点样本的集合,负采样节点集根据噪声分布p(v′u)来采样,
然后使用随机梯度下降方法使得对数似然函数最大化,来更新(5)式中节点的向量表示,具体如式(6)、式(7)所示,得到异质共乘网络中每个用户节点的低维向量表示;
其中函数表明了v′u是否是上下文邻居节点vk。
与现有技术相比,本发明的有益效果在于:
与普通的共乘推荐机制不同,本发明采用乘客和司机的地点和时间信息构造共乘异构网络,并区分出两种不同的共乘类型。对这两种类型选取生成对称元路径,并针对不同的共乘类型对元路径序列集的生成添加了不同的限制。通过负采样skip-gram对序列集进行表示学习,生成表示向量,最后使用余弦相似度计算用户表示向量间的相似值进行共乘推荐。本发明提出的共乘推荐方法比传统的仅使用距离推荐的方法更加可靠,语义理解性直观,能够准确发现潜在的共乘用户,为其提供更为快捷方便的服务。
附图说明
图1为本发明构建的异质共乘网络的拓扑结构图。
具体实施方式
以下结合附图对本发明提出的共乘匹配方法进行具体说明。
本发明的一种基于网络表示学习的网约共享出行人员匹配方法,包括以下步骤:
步骤一:共乘分类
在司机原始路径确定的情况下,根据乘客的起点和终点与司机原始路径的关系,将共乘分为两类:第一类是端点共乘,乘客的起点和终点在司机的原始路径上;另一类是沿途共乘,乘客的起点和终点都不在司机的原始路径上,乘客需要从起点步行至上车点,然后达成共乘,再由下车点步行至目的地,共乘路径轨迹是乘客轨迹的一部分;
司机与乘客的请求信息包括司机起点和终点、离开时间、司机轨迹、上下车位置、乘客起点和终点以及上下车时间。
步骤二:构建异质共乘网络
将司机与乘客的请求信息表示为异质共乘网络形式,乘客与司机之间通过位置与时间信息相连接,从而构建异质共乘网络,该异质共乘网络中节点的类型包括用户、地点、时间段以及活动;
步骤三:使用网络表示学习模型对异质共乘网络进行表示学习,得到用户节点的低维向量表示;
步骤三中,进行表示学习的过程具体包括以下两个步骤:
1)生成节点序列集:元路径指导节点在异质共乘网络中的游走,生成固定长度的节点序列集。对于端点共乘,构建结构为ULTLU的元路径;对于路途共乘,在时间段相同的约束下,构建结构为ULU的元路径。
2)将生成的固定长度的节点序列集输入到skip-gram模型中进行训练,获取司机与乘客节点的向量表示。
根据不同的共乘类型,使用不同的对称元路径来进行表示学习。对于端点共乘,使用ULTLU元路径,意味着在相同的时间到达相同地点的乘客与司机可以共乘,ULTLU中的第一个U表示用户节点,此处代表司机,第二个U表示用户节点,此处代表乘客,L表示乘车地点或下车地点,T表示对应地点上下车时间所处的时间段。对于沿途共乘,由于司机和乘客的出发地和目的地不同,因此乘客乘车前和下车后,仍需要花费额外的时间步行到乘车点和目的地,由此,基于ULU元路径,在司机和乘客对处于同一时间段的条件限定下,获取到最佳上车地点作为乘车地点L,(L表示乘车地点或下车地点)该元路径意味着司机和乘客在该时间段有最佳相遇点作为乘车地点L,可以共乘。
步骤三中,进行表示学习的具体过程如下:
首先,给定具体的元路径通过元路径来指导节点在异质共乘网络中的随机游走,生成固定长度的节点序列集;随机游走的游走概率如下:
公式(1)中,a表示节点类型,是路径上的一个a类型节点,表示沿着预定义的元路径上节点的邻居节点数量,ε表示网络中的链路集合,vi+1,表示两个节点在网络中能够构成一条链路,fv(vi+1)=a+1指的节点vi+1是a+1类型的节点。
公式(2)表示选取的元路径均为对称元路径。
其次,对于固定长度的节点序列集中任意用户节点vu,假设某一节点在序列集中的位置序号是j,则该方法会选取节点集vj-c,…,vj+c作为邻居节点,c是skip-gram中窗口大小的一半;因此,给定用户节点vu,skip-gram模型的目标是最大化具有异构邻居节点的上下文的条件概率:
其中,Na(vu)是节点vu邻居节点的集合,是节点类型的集合,p(vj-c,…,vj+c|vu;θ)为在已知中心节点的条件下,上下文的条件概率。
在假设各个节点间相互独立的情况下,在已知中心节点的条件下,上下文的条件概率为log p(vj-c,…,vj+c|vu;θ)进一步分解为其中的p(vk|vu;θ)使用softmax函数定义了给定节点vu的上下文节点vk的条件概率。
其中表示节点vu的表示向量。
根据给定节点vu的上下文节点vk的条件概率生成表示向量,再采用负采样来优化表示向量,得到异质共乘网络中每个用户节点的低维向量表示。
采用负采样来优化表示向量的具体过程如下:
其中 是vu的随机负节点样本的集合,负采样节点集根据噪声分布p(v′u)来采样,
然后使用随机梯度下降(SGD)方法使得对数似然函数最大化,来更新(5)式中节点的向量表示,具体如式(6)、式(7)所示,得到异质共乘网络中每个用户节点的低维向量表示。
其中函数表明了v′u是否是上下文邻居节点vk。
步骤四:根据用户节点的低维向量表示计算司机与乘客节点的余弦相似度,并将计算得到的余弦相似值由大到小排序,返回与司机相似度数值最高的前k个乘客,作为可以共乘的乘客,达成共乘。其中k的大小由司机所能搭载的最大乘客量决定。
实施例1
步骤一:数据分类提取;
本发明的实验数据来源于滴滴盖亚数据开放计划提供的成都局部地区数据,包括司机的gps轨迹数据和乘客的订单数据,实验中对司机和乘客进行编号,提取乘客的出发地和目的地以及司机的轨迹和对应时间,其中,司机轨迹的第一个点当做司机的出发点,轨迹终止点作为司机的目的地。本发明根据乘客的起始点与司机轨迹的关系,将共乘类型分为端点共乘和沿途共乘两类。
具体地,对于端点共乘,乘客的起点和终点在司机的原始路径上;沿途共乘则是乘客的起点和终点都不在司机的原始路径上,乘客需要从起点步行至上车点,然后达成共乘,再由下车点步行至目的地,共乘路径轨迹只是乘客轨迹的一部分。
此外对于两类共乘,还需满足以下条件。此处使用如下符号进行分析。将d表示为司机,p表示为乘客,每位司机和乘客都有自己的出发地O和目的地D。对于共乘,x表示为乘客的上车位置,y表示为乘客的下车位置。TT(O,D)表示乘客p或司机d的出发地O到目的地D所需的行驶时间,DTimed表示司机d从某个位置的出发时间,DTimep表示乘客p从某个位置的出发时间。对于端点共乘类型,只有当符合以下条件时,司机d才能将p作为共乘乘客进行端点共乘:
式中,TT(Op,Dp)表示乘客p的出发地O到目的地D所需的行驶时间,TT(Od,Dd)表示司机d的出发地O到目的地D所需的行驶时间;
沿途共乘是一种典型的出行方式,乘客从出发地点步行到最佳相遇点,在出发时间出行,共乘一段时间后,选择司机轨迹上离乘客目的地最近的地点下车,然后步行到目的地。此处使用MTp表示乘客p从起始出发地到乘车地与最终目的地到下车地之间的最大步行时间。因此对于沿途共乘,如果符合以下情况,司机可以让该乘客进行共乘:
式中,TT(xp,yp)表示乘客p的出发地O到目的地D所需的行驶时间。
对于最佳相遇点的选择,本发明采用迪杰斯特拉算法得到司机与乘客的最佳相遇点,并将该点作为乘客的上车位置。
步骤二:将步骤一提取的地点和时间数据进行预处理,构建共乘异构信息网络:
定义1异构信息网络(HIN)被定义为具有多种类型的节点和/或多种类型的链路的网络。它可以表示为H=(v,ε),其中v是一组节点,ε是一组链接。链接可以是加权的,未加权的,定向的或无向的。节点类型映射函数将节点映射到预定义类型,链接类型映射函数将链接映射到预定义链接类型。
异构信息网络由通过网络间边缘连接的不同但相关的节点组成。此处的“不同”意味着-网络的顶点具有不同类型,“相关”则意味着两个节点具有特定类型的交互或关系。
本发明构造的异质共乘网络如图1所示。对于两种类型的共乘,本发明构造了相同的网络模式,两类共乘均是以司机和乘客的时间和地点约束来匹配司机和乘客,该网络模式中的节点类型包括:位置(L),时间(T),活动(A)和用户(即乘客或司机)(U)。其中用户类型节点(U)包括司机和乘客,其中乘客以p开头从1开始顺序编号,司机以d开头从1开始顺序编号;本发明对时间进行了序列化模糊化处理,其按照每隔半个小时将一天24小时划分为了48个时段,具体为从00:00:00开始,每半个小时为一个时间段,将时间段进行编号(1~48),将每个时间段对应的编号作为时间类型节点(T)。对于位置类型的节点(L),选取乘客的上下车地点做为位置类型节点,在端点共乘中,以乘客的O和D做为位置类型节点,因为在端点共乘中,乘客的OD在司机轨迹上,乘客的上下车地点就是乘客的OD点,在沿途共乘中,以司机和乘客的最佳相遇点做为位置类型节点,因为在沿途共乘中,乘客和司机均需要到达最佳相遇点才能达成共乘。对于活动类型节点(A),本发明通过百度API转换得到每个位置的类型,包括房地产、教育机构等。异质共乘网络中的链接类型000位置发生某个活动,位置之间的路径以及时间段的范围。对于每个位置l∈L,存在一组用户的链接,活动和一组出发时间属于链接类型它还可以包含连接两个位置的路线信息,以及一些乘客走到相遇点进行乘车的时间间隔信息。可以由该网络构建形如ULU的元路径,表示出各个不同类型节点的关系。例如U-L链接表示一个用户从某个位置出发或是打算到达某目的地,表现出停留的关系;L-T链接则可表示在某个时间段有从某地出发或到达某地的行为发生;
步骤三:根据不同的共乘类型,选择相应的元路径,使用网络表示学习模型对异质共乘网络进行表示学习,得到用户节点的低维向量表示;
构建异质共乘网络的目的是在司机和乘客之间建立联系,为了体现出二者具有相同的目的或要求,此处使用对称元路径来表示这种关系。其中元路径定义如下:
定义2(元路径)元路径是在网络模式上定义的路径,并以 的形式表示,该形式表示两个给定节点类型之间的组成关系。元路径通常以对称方式使用,即其第一个节点V1与最后一个节点Vm类型相同。
对于端点共乘,使用ULTLU元路径,意味着在相同的时间到达相同地点的乘客与司机可以共乘。其中的两个U分别作为司机和乘客,L表示乘车地点或下车地点,T表示对应地点上下车时所处的时间段。对于沿途共乘,由于司机和乘客的出发地和目的地不同,因此乘客乘车前和下车后,仍需要花费额外的时间步行到乘车点和目的地,这类共乘相比端点共乘更具有复杂性。基于ULU元路径,该元路径中的L代表最佳相遇点。表示能够在同一时段到达同一相遇点的司机和乘客可以达到共乘。对于获取最佳相遇点的迪杰斯特拉算法,首先将包含对应司机和乘客轨迹的轨迹网络作为输入,通过该算法获取到二者OD在路网上的最短路径,将其作为最佳相遇点。
网络表示学习能够将网络中的节点表示成低维稠密的实值的向量形式,本发明通过输入基于对称元路径的节点序列集,将节点以one-hot编码方式编码为初始向量后再进行低维向量的转换。
本发明中,网络表示学习分为两个阶段:首先第一阶段是元路径指导节点在异质共乘网络中的随机游走,进一步生成固定长度的节点序列集。
以端点共乘使用的ULTLU类型元路径为例,如果当前节点为用户(U)类型,则ULTLU元路径指导下的下一跳节点为L类型,跳转概率如公式(1)所示,L类型的下一节点为T类型,本发明所生成的每个节点序列长度为5。
随机游走的游走概率如下:
公式(1)中,其中的节点用a来表示节点类型,是路径上的一个a类型节点,表示沿着预定义的元路径上节点的邻居节点数量,ε表示网络中的链路集合,vi+1,则表示两个节点在网络中可以构成一条链路,fv(vi+1)=a+1指的节点vi+1是a+1的类型。因此,在元路径的指导下,只有当下一个节点vi+1是a+1类型的节点时,随机游走可以进行下去。公式(2)则表示使用的元路径是对称元路径。
第二阶段将长度为5的节点序列集输入到skip-gram模型中进行训练,获取司机与乘客节点的向量表示。
此处使用skip-gram模型来为每个用户类型U的节点构建特征向量,并在skip-gram模型中使用了负采样来优化表示向量。对于序列集中任意用户节点vu,假设该节点在某个序列中的位置序号是j,该方法会选取t类型的节点集vj-c,…,vj+c作为邻居节点,c是skip-gram中设置的窗口大小的一半。因此,给定用户节点vu,skip-gram模型的目标是最大化具有异构邻居节点的上下文的条件概率:
Na(vu)是节点vu邻居节点的集合,是节点类型的集合。在假设各个节点间相互独立的情况下,logp(vj-c,…,vj+c|vu;θ)可以进一步分解为其中的p(vk|vu;θ)则使用softmax函数定义了给定节点vu的上下文节点vk的条件概率。
其中表示节点vu的表示向量。
除了使用上下文节点集的关系来生成向量,还使用了负采样的方法来优化表示向量,该方法能够去除无关节点对目标向量的影响,使得不同分类的向量间的区分更加明显。该方法的似然函数如下:
其中 是vu的随机负节点样本的集合,包括vj-c,…,vj+c以外的其余节点,负采样节点集根据噪声分布p(v′u)来采样,即 部分意味着随机负节点的采样期望遵循着概率密度函数p(v′u)。然后使用随机梯度下降(SGD)来最大化对数似然函数:
其中函数表明了v′u是否是上下文邻居节点vk。本发明中,生成的向量维度为128维,其中skip-gram使用的窗口大小c设置为2,负采样的样本数量为5。
步骤四:根据用户节点的低维向量表示通过余弦相似度算法计算司机和乘客的相似度,将相似度结果从大到小排列,因此获得与司机相似度数值最高的前k个乘客,作为可以共乘的乘客,达成共乘。其中k的大小由司机所能搭载的最大乘客量决定。
通过余弦相似度算法计算司机和乘客的相似度的具体过程如下:
对于任意一对用户节点vi,vj,其表示向量Xi,Xj的余弦相似度sim(vi,vj)定义如下
其中,Xi为节点vi的向量,Xj为节点vj的向量;当||Xi||=||Xj||=1时,余弦相似度等价于欧几里得距离,这允许在归一化之后使用近似最近邻搜索能够有效地定位给定节点vi的前k个相似节点(乘客)。因此,给定先前学习的用户(司机)向量,通过计算其表示向量Xi和Xj之间的余弦相似性来找到给定司机的潜在乘客。具有最大相似性的k个乘客被识别为共乘参与者,然后可以对候选人进行排名并观察共乘类型。
本发明使用滴滴用户的轨迹数据集构造异构共乘异构网络模型,并对不同类型的共乘进行了分类。提出两类元路径的定义,并在共乘网络中生成出元路径序列集,对其进行负采样skip-gram生成用户的表示向量,最后采用余弦相似性算法实现用户间的相似性计算,使用前k相似度预测可以进行共乘的乘客。本发明提出的共乘推荐方法比传统的仅使用距离推荐的方法更加可靠,语义理解性直观,能够准确发现潜在的共乘用户,为其提供更为快捷方便的服务。
Claims (8)
1.一种基于网络表示学习的网约共享出行人员匹配方法,其特征在于,包括以下步骤:
步骤一:共乘分类
在司机原始路径确定的情况下,根据乘客的起点和终点与司机原始路径的关系,将共乘分为两类:第一类是端点共乘,乘客的起点和终点在司机的原始路径上;另一类是沿途共乘,乘客的起点和终点都不在司机的原始路径上,乘客需要从起点步行至上车点,然后达成共乘,再由下车点步行至目的地,共乘路径轨迹是乘客轨迹的一部分;
步骤二:构建异质共乘网络
将司机与乘客的请求信息表示为异质共乘网络形式,乘客与司机之间通过位置与时间信息相连接,从而构建异质共乘网络;
步骤三:使用网络表示学习模型对异质共乘网络进行表示学习,得到用户节点的低维向量表示;
步骤四:根据用户节点的低维向量表示计算司机与乘客节点的余弦相似度,并将计算得到的余弦相似值由大到小排序,返回与司机相似度数值最高的前k个乘客,作为可以共乘的乘客,达成共乘。
2.根据权利要求1所述的一种基于网络表示学习的网约共享出行人员匹配方法,其特征在于,步骤一中,司机与乘客的请求信息包括司机起点和终点、离开时间、司机轨迹、上下车位置、乘客起点和终点以及上下车时间。
3.根据权利要求1所述的一种基于网络表示学习的网约共享出行人员匹配方法,其特征在于,步骤二中,异质共乘网络中节点的类型包括用户、地点、时间段以及活动。
4.根据权利要求1所述的一种基于网络表示学习的网约共享出行人员匹配方法,其特征在于,步骤三中,进行表示学习的过程具体包括以下两个步骤:
1)生成节点序列集:元路径指导节点在异质共乘网络中的游走,生成固定长度的节点序列集;
2)将生成的固定长度的节点序列集输入到skip-gram模型中进行训练,获取司机与乘客节点的向量表示。
5.根据权利要求4所述的一种基于网络表示学习的网约共享出行人员匹配方法,其特征在于,步骤1)中,对于端点共乘,构建结构为ULTLU的元路径;对于沿途共乘,在时间段相同的约束下,构建结构为ULU的元路径。
6.根据权利要求4所述的一种基于网络表示学习的网约共享出行人员匹配方法,其特征在于,步骤三中,进行表示学习的具体过程如下:
首先,给定具体的元路径通过元路径来指导节点在异质共乘网络中的随机游走,生成固定长度的节点序列集;其次,对于固定长度的节点序列集中任意用户节点vu,假设某一节点在序列集中的位置序号是j,则该方法会选取节点集vj-c,…,vj+c作为邻居节点,c是skip-gram中窗口大小的一半;因此,给定用户节点vu,skip-gram模型的目标是最大化具有异构邻居节点的上下文的条件概率:
其中,Na(vu)是节点vu邻居节点的集合,是节点类型的集合,p(vj-c,…,vj+c|vu;θ)为在已知中心节点的条件下,上下文的条件概率;
在假设各个节点间相互独立的情况下,在已知中心节点的条件下,上下文的条件概率为log p(vj-c,…,vj+c|vu;θ)进一步分解为其中的p(vk|vu;θ)使用softmax函数定义了给定节点vu的上下文节点vk的条件概率;
其中表示节点vu的表示向量;
根据给定节点vu的上下文节点vk的条件概率生成表示向量,再采用负采样来优化表示向量,得到异质共乘网络中每个用户节点的低维向量表示。
7.根据权利要求6所述的一种基于网络表示学习的网约共享出行人员匹配方法,其特征在于,随机游走的游走概率如下:
公式(1)中,a表示节点类型,是路径上的一个a类型节点,表示沿着预定义的元路径上节点的邻居节点数量,ε表示网络中的链路集合,vi+1,表示两个节点在网络中能够构成一条链路,fv(vi+1)=a+1指的节点vi+1是a+1类型的节点;
公式(2)表示选取的元路径均为对称元路径。
8.根据权利要求6所述的一种基于网络表示学习的网约共享出行人员匹配方法,其特征在于,采用负采样来优化表示向量的具体过程如下:
其中 是vu的随机负节点样本的集合,负采样节点集根据噪声分布p(v′u)来采样,
然后使用随机梯度下降方法使得对数似然函数最大化,来更新(5)式中节点的向量表示,具体如式(6)、式(7)所示,得到异质共乘网络中每个用户节点的低维向量表示;
其中函数表明了v′u是否是上下文邻居节点vk。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910262393.6A CN110009455B (zh) | 2019-04-02 | 2019-04-02 | 一种基于网络表示学习的网约共享出行人员匹配方法 |
PCT/CN2019/107011 WO2020199524A1 (zh) | 2019-04-02 | 2019-09-20 | 一种基于网络表示学习的网约共享出行人员匹配方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910262393.6A CN110009455B (zh) | 2019-04-02 | 2019-04-02 | 一种基于网络表示学习的网约共享出行人员匹配方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110009455A true CN110009455A (zh) | 2019-07-12 |
CN110009455B CN110009455B (zh) | 2022-02-15 |
Family
ID=67169532
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910262393.6A Expired - Fee Related CN110009455B (zh) | 2019-04-02 | 2019-04-02 | 一种基于网络表示学习的网约共享出行人员匹配方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN110009455B (zh) |
WO (1) | WO2020199524A1 (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020199524A1 (zh) * | 2019-04-02 | 2020-10-08 | 长安大学 | 一种基于网络表示学习的网约共享出行人员匹配方法 |
CN112964266A (zh) * | 2021-02-04 | 2021-06-15 | 西北大学 | 一种网约服务拼单路线规划方法及存储介质 |
CN113159357A (zh) * | 2020-01-07 | 2021-07-23 | 北京嘀嘀无限科技发展有限公司 | 数据处理方法、装置、电子设备及计算机可读存储介质 |
CN113345590A (zh) * | 2021-06-29 | 2021-09-03 | 安徽大学 | 一种基于异质图的用户心理健康监测方法及系统 |
CN113361916A (zh) * | 2021-06-04 | 2021-09-07 | 付鑫 | 一种考虑截单情景的多模式共享出行融合调度优化系统 |
CN113656746A (zh) * | 2021-07-21 | 2021-11-16 | 东南大学 | 一种动态结构下考虑群体异质性的出行方式链选择方法 |
CN113888138A (zh) * | 2021-10-27 | 2022-01-04 | 重庆邮电大学 | 一种基于区块链和网络表示学习推荐的项目管理方法 |
CN117119387A (zh) * | 2023-10-25 | 2023-11-24 | 北京市智慧交通发展中心(北京市机动车调控管理事务中心) | 基于手机信令数据的用户出行链的构建方法和装置 |
WO2024001151A1 (zh) * | 2022-06-30 | 2024-01-04 | 东南大学 | 一种网约车共享出行人车匹配方法 |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112311608B (zh) * | 2020-11-25 | 2022-09-23 | 中国人民解放军66136部队 | 一种多层异质网络空间节点表征方法 |
CN112580945A (zh) * | 2020-12-08 | 2021-03-30 | 吉首大学 | 基于多相关系数的派单方法及车辆调度优化系统 |
CN113239266B (zh) * | 2021-04-07 | 2023-03-14 | 中国人民解放军战略支援部队信息工程大学 | 基于局部矩阵分解的个性化推荐方法及系统 |
CN113326884B (zh) * | 2021-06-11 | 2023-06-16 | 之江实验室 | 大规模异构图节点表示的高效学习方法及装置 |
CN113626654B (zh) * | 2021-07-16 | 2023-09-15 | 苏州大学 | 一种基于表示学习的批量最短路径查询方法 |
CN113642625B (zh) * | 2021-08-06 | 2024-02-02 | 北京交通大学 | 一种城市轨道交通乘客个体出行目的推断的方法及系统 |
CN113642796B (zh) * | 2021-08-18 | 2024-06-04 | 北京航空航天大学 | 基于历史数据的动态共享电动自动驾驶车辆路径规划方法 |
CN113902200B (zh) * | 2021-10-14 | 2024-07-12 | 中国平安财产保险股份有限公司 | 一种路径匹配方法、装置、设备及计算机可读存储介质 |
CN113947245B (zh) * | 2021-10-20 | 2024-07-09 | 辽宁工程技术大学 | 一种基于订单累积量的多乘客多司机共乘匹配方法及系统 |
CN114124729A (zh) * | 2021-11-23 | 2022-03-01 | 重庆邮电大学 | 一种基于元路径的动态异质网络表示方法 |
CN114461934A (zh) * | 2021-12-31 | 2022-05-10 | 北京工业大学 | 基于动态交通网络的多模态出行方式融合推荐方法 |
CN114547408B (zh) * | 2022-01-18 | 2024-04-02 | 北京工业大学 | 一种基于细粒度学生时空行为异质网表征的相似学生搜索方法 |
CN114595480B (zh) * | 2022-03-04 | 2024-04-02 | 中国科学技术大学 | 具有个性化位置隐私保护的实时乘客和司机匹配方法 |
CN115495678B (zh) * | 2022-11-21 | 2023-04-07 | 中南大学 | 一种基于稀疏蜂窝信令数据的共乘匹配方法、系统及设备 |
CN117252318B (zh) * | 2023-09-26 | 2024-04-09 | 武汉理工大学 | 一种智能网联汽车群机协同拼车调度方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105631531A (zh) * | 2015-11-26 | 2016-06-01 | 东莞酷派软件技术有限公司 | 行车好友推荐方法、行车好友推荐装置和服务器 |
CN106447387A (zh) * | 2016-08-31 | 2017-02-22 | 上海交通大学 | 基于共享账户乘客预测的机票个性化推荐方法 |
CN106503022A (zh) * | 2015-09-08 | 2017-03-15 | 北京邮电大学 | 推送推荐信息的方法和装置 |
CN108256590A (zh) * | 2018-02-23 | 2018-07-06 | 长安大学 | 一种基于复合元路径的相似出行者识别方法 |
CN109544900A (zh) * | 2018-11-21 | 2019-03-29 | 长安大学 | 一种面向乘客和司机共乘出行的隐私保留的路径匹配方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009007965A2 (en) * | 2007-07-09 | 2009-01-15 | Technion Research & Development Foundation Ltd | Routing methods for multiple geographical entities |
CN110009455B (zh) * | 2019-04-02 | 2022-02-15 | 长安大学 | 一种基于网络表示学习的网约共享出行人员匹配方法 |
-
2019
- 2019-04-02 CN CN201910262393.6A patent/CN110009455B/zh not_active Expired - Fee Related
- 2019-09-20 WO PCT/CN2019/107011 patent/WO2020199524A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106503022A (zh) * | 2015-09-08 | 2017-03-15 | 北京邮电大学 | 推送推荐信息的方法和装置 |
CN105631531A (zh) * | 2015-11-26 | 2016-06-01 | 东莞酷派软件技术有限公司 | 行车好友推荐方法、行车好友推荐装置和服务器 |
CN106447387A (zh) * | 2016-08-31 | 2017-02-22 | 上海交通大学 | 基于共享账户乘客预测的机票个性化推荐方法 |
CN108256590A (zh) * | 2018-02-23 | 2018-07-06 | 长安大学 | 一种基于复合元路径的相似出行者识别方法 |
CN109544900A (zh) * | 2018-11-21 | 2019-03-29 | 长安大学 | 一种面向乘客和司机共乘出行的隐私保留的路径匹配方法 |
Non-Patent Citations (2)
Title |
---|
LEI TANG ET AL.: "Efficient Ridesharing Framework for Ride-matching via Heterogeneous Network Embedding", 《ACM TRANSACTIONS ON KNOWLEDGE DISCOVERY FROM DATA》 * |
陈君: "基于异质信息网络的出行行为分析及相似性度量方法研究", 《中国优秀博硕士学位论文全文数据库(硕士) 工程科技II辑》 * |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020199524A1 (zh) * | 2019-04-02 | 2020-10-08 | 长安大学 | 一种基于网络表示学习的网约共享出行人员匹配方法 |
CN113159357A (zh) * | 2020-01-07 | 2021-07-23 | 北京嘀嘀无限科技发展有限公司 | 数据处理方法、装置、电子设备及计算机可读存储介质 |
CN113159357B (zh) * | 2020-01-07 | 2023-11-24 | 北京嘀嘀无限科技发展有限公司 | 数据处理方法、装置、电子设备及计算机可读存储介质 |
CN112964266B (zh) * | 2021-02-04 | 2022-08-19 | 西北大学 | 一种网约服务拼单路线规划方法及存储介质 |
CN112964266A (zh) * | 2021-02-04 | 2021-06-15 | 西北大学 | 一种网约服务拼单路线规划方法及存储介质 |
CN113361916A (zh) * | 2021-06-04 | 2021-09-07 | 付鑫 | 一种考虑截单情景的多模式共享出行融合调度优化系统 |
CN113345590A (zh) * | 2021-06-29 | 2021-09-03 | 安徽大学 | 一种基于异质图的用户心理健康监测方法及系统 |
CN113345590B (zh) * | 2021-06-29 | 2022-12-16 | 安徽大学 | 一种基于异质图的用户心理健康监测方法及系统 |
CN113656746A (zh) * | 2021-07-21 | 2021-11-16 | 东南大学 | 一种动态结构下考虑群体异质性的出行方式链选择方法 |
CN113888138A (zh) * | 2021-10-27 | 2022-01-04 | 重庆邮电大学 | 一种基于区块链和网络表示学习推荐的项目管理方法 |
CN113888138B (zh) * | 2021-10-27 | 2024-05-14 | 重庆邮电大学 | 一种基于区块链和网络表示学习推荐的项目管理方法 |
WO2024001151A1 (zh) * | 2022-06-30 | 2024-01-04 | 东南大学 | 一种网约车共享出行人车匹配方法 |
CN117119387A (zh) * | 2023-10-25 | 2023-11-24 | 北京市智慧交通发展中心(北京市机动车调控管理事务中心) | 基于手机信令数据的用户出行链的构建方法和装置 |
CN117119387B (zh) * | 2023-10-25 | 2024-01-23 | 北京市智慧交通发展中心(北京市机动车调控管理事务中心) | 基于手机信令数据的用户出行链的构建方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2020199524A1 (zh) | 2020-10-08 |
CN110009455B (zh) | 2022-02-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110009455A (zh) | 一种基于网络表示学习的网约共享出行人员匹配方法 | |
Bi et al. | Daily tourism volume forecasting for tourist attractions | |
CN108053062A (zh) | 一种基于多源数据的定制公交线路生成方法 | |
CN106488405B (zh) | 一种融合个体与近邻移动规律的位置预测方法 | |
CN106714110A (zh) | 一种Wi‑Fi位置指纹地图自动构建方法及系统 | |
Sampathkumar et al. | Majority voting based hybrid ensemble classification approach for predicting parking availability in smart city based on IoT | |
Le Minh Kieu et al. | Large-scale transit market segmentation with spatial-behavioural features | |
CN115204478A (zh) | 一种结合城市兴趣点和时空因果关系的公共交通流量预测方法 | |
CN113780665B (zh) | 一种基于增强循环神经网络的私家车停留位置预测方法和系统 | |
Ma et al. | Multi-attention graph neural networks for city-wide bus travel time estimation using limited data | |
CN116017407A (zh) | 一种手机信令数据驱动的居民出行方式可靠辨识方法 | |
CN113159371B (zh) | 基于跨模态数据融合的未知目标特征建模与需求预测方法 | |
CN112395502A (zh) | 一种页面显示方法、装置、电子设备及计算机存储介质 | |
Cuenca-Jara et al. | Classification of spatio-temporal trajectories from volunteer geographic information through fuzzy rules | |
CN106980644B (zh) | 一种异构城市数据的个体人际关系可视推理方法 | |
CN116862325A (zh) | 一种城市轨道交通乘客出行链推断方法及系统 | |
Xu et al. | A taxi dispatch system based on prediction of demand and destination | |
Thu et al. | Multi-source data analysis for bike sharing systems | |
CN116592903B (zh) | 车路协同环境下群体偏好的生态驾驶路径实时规划方法 | |
CN114169659A (zh) | 一种犯罪时空风险预测及决策调度方法和装置 | |
CN111125886A (zh) | 一种基于三种不同行为的人群疏散仿真系统及仿真方法 | |
Ajani et al. | Dynamic path planning approaches based on artificial intelligence and machine learning | |
CN115062708A (zh) | 一种基于轨迹偏差点嵌入和深度聚类的异常节点检测方法 | |
Hanna | Urban complexity | |
Zhou et al. | Refined taxi demand prediction with ST-Vec |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20220215 |