CN117575298B - 一种基于关联规则的城际拼车订单调度方法、装置及设备 - Google Patents
一种基于关联规则的城际拼车订单调度方法、装置及设备 Download PDFInfo
- Publication number
- CN117575298B CN117575298B CN202410060546.XA CN202410060546A CN117575298B CN 117575298 B CN117575298 B CN 117575298B CN 202410060546 A CN202410060546 A CN 202410060546A CN 117575298 B CN117575298 B CN 117575298B
- Authority
- CN
- China
- Prior art keywords
- passenger
- transaction
- city
- vehicle
- scheduling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000005065 mining Methods 0.000 claims abstract description 25
- 238000004422 calculation algorithm Methods 0.000 claims description 19
- 238000004364 calculation method Methods 0.000 claims description 17
- 230000000875 corresponding effect Effects 0.000 claims description 10
- 238000005457 optimization Methods 0.000 claims description 8
- 238000011176 pooling Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 4
- 230000002596 correlated effect Effects 0.000 claims description 4
- 230000006870 function Effects 0.000 claims description 4
- 230000010354 integration Effects 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 6
- 238000007418 data mining Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 241000287196 Asthenes Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000003912 environmental pollution Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000000284 resting effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06311—Scheduling, planning or task assignment for a person or group
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
- G06N5/025—Extracting rules from data
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Strategic Management (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Fuzzy Systems (AREA)
- Quality & Reliability (AREA)
- Probability & Statistics with Applications (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种基于关联规则的城际拼车订单调度方法、装置及设备,方法包括:获取历史人工调度中城市v和城市w之间的每一趟车辆行程的调度数据;提取调度数据中的网格区块位置信息作为特征项,将调度数据转换为事务列表;对事务列表内的事务的重复出现的特征进行编码处理,获得编码后的事务;使用关联规则挖掘方法挖掘获得编码后的事务的关联规则;根据建立的整数线性规划模型,基于所述关联规则中的提升度对订单进行匹配,并根据匹配结果获取优先队列,以基于优先队列实现调度车辆。本发明为司机提供基于专家经验的订单组合,提高司机的收入,缓解司机工作时间不平衡问题,增加了企业车辆资源利用率。
Description
技术领域
本发明涉及城际客运规划技术领域,具体而言,涉及一种基于关联规则的城际拼车订单调度方法、装置及设备。
背景技术
城际拼车出行模式指的是一个公司管理的出租车车队在两个城市之间往返运行,专门为用户提供城际拼车出行服务。本文考虑的是城际拼车出行的订单匹配和调度方式。城际间拼车的出行模式可以给用户门到门的出行服务,同时很好地缓解交通拥堵和环境污染问题。城际拼车中的订单匹配模式主要是调度员为司机匹配订单。然而在自动化智能调度中,传统的基于距离或时间的订单匹配方法,例如专利CN116663811A过于理想化,会造成司机、调度员和乘客的不满,尤其是司机的不满,无法对城际间订单和车辆的复杂情况进行合理的分配。本文在“附图说明”的图8部分给出了传统基于距离、时间的匹配方法失效的案例并且说明了失效的原因。在真实的城际拼车出行应用场景中,基于传统匹配方法的订单匹配模式降低了司机的收入,造成了企业资源的浪费。此外传统调度方法很容易出现司机工作时间不平衡的现象。调度员是领域专家,他们专门匹配城市v和城市w之间的车辆和订单,他们的调度结果是调度员、司机、乘客共同商议的结果,具有很高的认同度。关联规则挖掘可以通过历史上人工调度的数据,挖掘历史上每一趟行程的订单空间分布的频繁项集和关联规则,通过关联规则为司机分配更符合人工历史调度经验的订单。此外可以通过一个优先级队列用于调度管理车队,从而平衡司机工作时间。有鉴于此,申请人在研究了现有的技术后特提出本申请。
发明内容
本发明提供了一种基于关联规则挖掘的城际拼车订单调度方法、装置及设备,以改善上述技术问题中的至少一个。
本发明实施例提供了一种基于关联规则的城际拼车订单调度方法,其包含:
S1,获取历史人工调度中城市v和城市w之间的每一趟车辆行程的调度数据;
S2,提取所述调度数据中的网格区块位置信息作为特征项,将所述调度数据转换为事务列表;
S3,对所述事务列表内的事务的重复出现的特征进行编码处理,获得编码后的事务;
S4,使用关联规则挖掘方法挖掘获得所述编码后的事务的关联规则;所述关联规则用于表征所述事务列表的事务特征项之间出现频次的关系;
S5,根据建立的整数线性规划模型,基于所述关联规则中的提升度对订单进行匹配,并根据匹配结果获取优先队列,以基于优先队列实现调度车辆。
优选地,在步骤S1中: 设在原始的调度数据中,r是某一个乘客请求,由一个元组构成,,其中/>是乘客请求r的起点坐标,/>是乘客请求r的终点坐标,坐标信息由经纬度构成;/>是乘客上车坐标对应的网格区块编号,/>是乘客下车坐标对应的网格区块编号;/>是乘客请求r的上车时间,/>是乘客请求r的下车时间;
则所述网格区块位置信息为元组r中的;
在提取网格区块位置信息作为特征项之后,将获得的事务列表记为X,事务列表中的第i条事务记作,记事务/>中的第j项为/>;/>表示为了服务这趟行程,车辆从车场出发,行驶经过的网格区块编号。
优选地,在步骤S2中,
定义函数为:在事务/>中,从第1个特征项到第j个特征项中,特征项/>出现的次数;
则对于每一条事务,对事务内的每一项进行编码处理,将编码后的新的事务的第j个特征项记为/>,编码的具体方法如公式(1)所示:
其中M代表的是系统中网格区块的总数量;
根据所有编码后的特征项获得编码后的事务。
优选地,给定编码后的事务,通过公式(2)计算某一个特征项在一个事务中出现的次数,通过公式(3)计算某个特征项原本的网格编号:
其中表示对/>的结果向下取整,mod表示取模运算。
优选地,在使用关联规则挖掘方法挖掘获得所述编码后的事务的关联规则时:
使用的最小支持度计数为,最小支持度计数直观上的含义为:只要某元素在整个事务列表中出现超过/>次,则认为是频繁的;
最小置信度为,最小置信度直观上的含义为:对于给定的前项,后项出现的概率至少为/>。
优选地,在步骤S5中:
设开始运行时,一共有K辆车分别位于城市v和城市w,对于第k辆车,其状态参数集,其中/>是车辆k的当前状态;/>是车辆k的累计工作时长;是车辆出行次数,每当车辆从车场出发,车辆出行次数加一次;/>是车辆将要服务的一组乘客请求;
设城市v拥有辆车,则城市w拥有/>辆车,每辆车的载客量均为C;
在订单调度阶段,分别用两个优先队列管理两个城市的车场的车辆,越小则优先级越高;当有多辆车能够服务同一组订单时,选择优先队列头部即优先级最高的车俩对行程/>进行服务;
在订单匹配阶段,将当前累积的订单请求存放在待服务订单集合中,每当/>中累积的订单请求个数达到/>,并且系统当前时间小于系统停止运行时间END,执行一次调度算法,把当前接受进行服务的乘客请求/>放入已服务订单集合/>中,当前拒绝进行服务的乘客请求/>仍然保存在/>中;
乘客请求之间的匹配看作是一个不等积集合划分问题,通过建立整数线性规划模型求解该问题。
优选地,对于整数线性规划模型:
用表示/>中的第/>个乘客请求,将/>中的/>名乘客分配到/>个空集合中,第b个集合记为/>,优化目标是最大化所有集合的分数;其中:
决策变量:表示/>中第a个乘客请求是否分配到第b个集合中;/>表示/>中第a个乘客请求分配到第b个集合中,/>表示/>中第a个乘客请求不分配到第b个集合中;优化目标为:/>
即最大化划分出的所有个集合的分数;
受到约束:
公式(5)保证中每个元素至多被分配到一个集合中;公式(6)保证每一个集合最少有c个元素,c即为了平衡出行成本的最小载客量,最多有C个元素,C即车辆的最大载客量;公式(7)是二进制变量约束;
其中的计算方式基于关联规则中的提升度;具体来说有公式(8):
是集合/>的第g个长度大于1的非空子集,任意集合/>都会有个长度大于1非空子集;
Y是所有与前件相关联的后件的集合,所以bk就是Y后件集合中的一个后件,表示前件/>与后件/>的提升度;提升度的具体计算方法:
其中是前件/>发生的概率,/>是后件/>发生的概率,是前件/>和后件/>同时发生的概率;当lift(/>,/>)>1,则说明/>和/>是正相关的,前件/>的出现增加了后件/>出现的概率;当lift(/>,/>)<1,则说明/>和/>是负相关的,前件/>的出现减小了后件/>出现的概率;当lift(/>,/>)=1,则说明前件/>和后件/>没有关联;/>代表集合/>的所有子集中存在关联规则的子集的数量。
本发明实施例还提供了一种基于关联规则的城际拼车订单调度装置,其包括:
调度数据获取单元,用于获取历史人工调度中城市v和城市w之间的每一趟车辆行程的调度数据;
特征项提取单元,用于提取所述调度数据中的网格区块位置信息作为特征项,将所述调度数据转换为事务列表;
编码单元,用于对所述事务列表内的事务的重复出现的特征进行编码处理,获得编码后的事务;
关联规则挖掘单元,用于使用关联规则挖掘方法挖掘获得所述编码后的事务的关联规则;所述关联规则用于表征所述事务列表的事务特征项之间出现频次的关系;
调度单元,用于根据建立的整数线性规划模型,基于所述关联规则中的提升度对订单进行匹配,并根据匹配结果获取优先队列,以基于优先队列实现调度车辆。
本发明实施例还提供了一种基于关联规则的城际拼车订单调度设备,其包括存储器以及处理器,所述存储器内存储有计算机程序,所述计算机程序能够被所述处理器执行,以实现如上述的基于关联规则的城际拼车订单调度方法。
综上所述,本发明实施例的基于关联规则的城际拼车订单调度方法 通过关联规则的分数计算为司机分配订单,通过优先队列管理车队进行调度,能够为司机提供基于领域专家经验的订单组合,提高了司机的收入,缓解司机工作时间不平衡的问题,增加了企业车辆资源的利用率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是本发明第一实施例提供的基于关联规则的城际拼车订单匹配方法的流程示意图。
图2是编码蜂窝网格的示意图。
图3是某市部分网格区域的示意图。
图4是分数匹配的具体伪代码示意图。
图5是调度算法的流程图示意图。
图6是车辆分配算法伪代码示意图。
图7是一个简单小规模实例的调度流程示意图。
图8是说明传统时间、距离约束失效的示意图。
图9是本发明第二实施例提供的基于关联规则的城际拼车订单匹配装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,本发明第一实施例提供一种基于关联规则的城际拼车订单匹配方法,具体包括以下步骤:
S1、获取历史人工调度中城市v和城市w之间的每一趟车辆行程的调度数据。
S2,提取所述调度数据中的网格区块位置信息作为特征项,将所述调度数据转换为事务列表。
在本实施例中,在原始的调度数据中,设r是某一个乘客请求,由一个元组构成,,其中/>是乘客请求r的起点坐标,/>是乘客请求r的终点坐标,坐标信息由经纬度构成,例如/>;是乘客上车坐标对应的网格区块编号,/>是乘客下车坐标对应的网格区块编号,例如,说明乘客r的起点在第3个网格区块,终点在第7个网格区块;/>是乘客请求r的上车时间,/>是乘客请求r的下车时间。所以网格区块位置信息指的就是r元组中的,提取网格区块位置信息作为特征项(Item)之后,获得的事务列表记为X,如表1所示:
表1
事务列表中的第i条事务,记作,将记事务/>中的第j个项为/>。具体来说,对于ID=1,即事务/>,有/>。事务{1,2,8,8}表示为了服务这趟行程,车辆从车场出发,行驶经过的网格区块的编号是1、2、8,共3个区块。更具体来说,在这趟行程中,车辆从车场出发,在网格区块1、2接上两名乘客,这两名乘客的终点恰好都为网格区块8,于是在网格区块8放下这两名乘客。
S3,对所述事务列表内的事务的重复出现的特征进行编码处理,获得编码后的事务。
传统的数据挖掘方法,对于一条事务,只关心特征是否在事务中出现,而不关心特征出现的次数。而在城际网约车拼车的复杂场景中,特征出现的次数是至关重要的。
基于此,在本实施例中,将事务列表的每一个事务中重复出现的特征进行特殊编码处理。
具体地,定义函数为:在事务/>中,从第1个特征项到第j个特征项中,特征项/>出现的次数。对于每一条事务/>,对事务内的每一个项进行编码处理,将编码后的新的事务的第j个特征项记为/>,编码的具体方法如公式(1)所示:
其中M代表的是系统中网格区块的总数量(系统中网格区块编号为0到M-1)。
以为例,不妨设系统中网格区块的总数量M=10,即一共有10个网格区块,编号从0到9,根据公式(1),一种示例如表2所示:
表2
转换后的事务记为,则/>。这使得任何传统的关联规则挖掘算法(Apriori或FP-Growth等)都可以挖掘城际拼车出行中的网格编号特征项之间的关联关系。
此外该编码方式是具备一定数学性质的:可以通过向下取整的除法快速知道特征在事务中出现的次数;可以通过取模运算快速知道特征原本的网格编号。形式上来说,给定编码后的事务,通过公式(2)可以计算某一个特征项在一个事务中出现的次数,公式(3)可以计算某个特征原本的网格编号:
其中表示对/>的结果向下取整,mod表示取模运算。
以转换后的新事务为例,同样M=10,一种示例如表3所示:
表3
通过样例可见对编码后的事务进行解码的计算结果与原事务的含义完全一致。需要说明公式(1)(2)(3)不仅仅对该例子有作用,而是具有通用性的,适用于各种情况。
系统网格覆盖和编号的一种示意情况请参阅图2。
S4,使用关联规则挖掘方法挖掘获得所述编码后的事务的关联规则;所述关联规则用于表征所述事务列表的事务特征项之间出现频次的关系。
在实施例中,使用关联规则挖掘算法挖掘频繁项集和关联规则,使用的最小支持度计数为,所以该参数设定直观上的含义为:只要某元素在整个事务列表中出现超过/>次,则认为是频繁的。最小置信度/>,该参数设定直观上的含义为:对于给定的前项,后项出现的概率至少为/>。由于数据由领域专家调度生成,任何结果都是合理的结果,所以会将最小支持度和最小置信度设置为一个足够小的值。需要说明,不论使用什么关联规则挖掘算法,获得的关联规则表一定是相同的,只是程序运行性能上会有所差异。本发明使用的是传统的Apriori算法,此外本发明也尝试使用了FP-Growth算法,二者得到的结果相同,Apriori算法运行速度更慢,但在本发明中能够在给定时间内计算出关联规则,故使用最典型的Apriori算法。
S5,根据建立的整数线性规划模型,基于所述关联规则中的提升度对订单进行匹配,并根据匹配结果获取优先队列,以基于优先队列实现调度车辆。
在本实施例中,设城市v和城市w分别有一个中心车场用于给司机休息和充电。在系统开始运行时,一共有K辆车分别位于两个城市,对于第k辆车,其状态参数集,其中/>是车辆k的当前状态;/>是车辆k的累计工作时长;是车辆出行次数,每当车辆从车场出发,车辆出行次数加一次;/>是车辆将要服务的一组乘客请求。
在本实施例中,进一步的设城市v拥有辆车,则城市w拥有/>辆车,每辆车的载客量均为C。分别用两个优先队列管理两个车场的车辆,/>越小则优先级越高。当有多辆车可以服务同一组订单时,会选择优先队列头部即优先级最高的车俩对行程/>进行服务,这可以平衡司机的工作时长,缓解部司机工作时长不平衡的问题。
进一步地,在订单匹配阶段,将当前累积的订单请求存放在待服务订单集合中,每当/>中累积的订单请求个数达到/>,并且系统当前时间小于系统停止运行时间END,执行一次调度算法。把当前接受进行服务的乘客请求/>放入已服务订单集合/>中,当前拒绝进行服务的乘客请求/>仍然保存在/>中。乘客请求/>是一个元组,/>,其中/>是乘客请求r的起点坐标,/>是乘客请求r的终点坐标;/>是乘客上车坐标对应的网格区块编号,/>是乘客下车坐标对应的网格区块编号;/>是乘客请求r的上车时间,/>是乘客请求r的下车时间。乘客请求/>之间的匹配可以看作是一个不等积集合划分问题,可以建立整数线性规划(ILP)模型求解该问题,形式上来说:
用表示/>中的第/>个乘客请求,将/>中的/>名乘客分配到/>个空集合中,第b个集合记为/>,优化目标是最大化所有集合的分数。
决策变量为,表示/>中第a个乘客请求是否分配到第b个集合中。/>表示中第a个乘客请求分配到第b个集合中,/>表示/>中第a个乘客请求不分配到第b个集合中。本实施例的优化目标为:
即最大化划分出的所有个集合的分数。
受到约束:
公式(5)保证中每个元素至多被分配到一个集合中;公式(6)保证每一个集合最少有c个元素,c即为了平衡出行成本的最小载客量,最多有C个元素,C即车辆的最大载客量;公式(7)是二进制变量约束。
其中的计算方式基于关联规则中的提升度。分数计算的伪代码请参阅图4,具体来说有公式(8):
是集合/>的第g个长度大于1的非空子集,任意集合/>都会有个长度大于1非空子集;
Y是所有与前件相关联的后件的集合,所以bk就是Y后件集合中的一个后件,表示前件/>与后件/>的提升度。提升度的具体计算方法:
其中是前件/>发生的概率,/>是后件/>发生的概率,是前件/>和后件/>同时发生的概率。当lift(/>,/>)>1,则说明/>和/>是正相关的,前件/>的出现增加了后件/>出现的概率;当lift(/>,/>)<1,则说明/>和/>是负相关的,前件/>的出现减小了后件/>出现的概率;当lift(/>,/>)=1,则说明前件/>和后件/>没有关联。/>代表集合/>的所有子集中存在关联规则的子集的数量。
例如某两城市的总网格数M=180,关联规则表的内容如表4所示:
表4
一种典型场景请参阅图3,这是从某城市v到另一城市w的一种送客下车路线,网格数M=180。传统调度方法会认为和/>两种网格路线是相同的,即认为均是先行驶到网格3然后再行驶到网格20。但实际上根据领域专家的描述,/>这种路线比/>要更优,甚至可以/>是非常差的路线。然而这种痛点场景在本发明的提升度计算方法中得到了缓解,本发明分数计算方法计算出的分数如表5 所示:
表5
可以发现本实施例的分数计算方法符合了领域专家的期望。需要说明,本发明并不是只能解决上述这种特定情况,上述情况是一个典型例子,本发明方法而是具有通用性的。
分数评价函数的时间复杂度最坏情况下是O,其中C是车辆最大载客量。不过通常用于拼车的网约车不会有大太的车辆容量,也就是在公式(6)的限制下,实际上的C并不大。在本发明的现实背景下,车辆的最大载客量为6,也就是C的最大值为6,此时的时间复杂度是O/>= O/>= O(384),也就是说事实上score函数计算需要的时间复杂度在公式(6)的限制下,即便最坏情况下也是常数级别的,即O(1)。所以该模型的线性性质依然得到了保证,能够使用Gurobi、CPLEX等商业求解器对该整数线性规划模型进行求解。
本实施例不需要考虑司机行驶时间等约束,因为这些约束在提升度分数中得到了保证。也不需要在订单匹配的同时计算最优路径,为划分出的每一个集合节省了大量计算时间。因为本发明的调度方法可以在订单匹配完成后,通过调用例如百度地图、高德地图等路线规划api对行程路线进行最优路径计算,这些商业路径规划器都能在极短时间内计算出最优路径,不会耽误司机的出行时间。
每当集合划分完成,按照集合内元素个数从多到少的顺序将订单组合分配给队列头部的司机。乘客请求个数越多则通常需要更长的工作时间进行服务,这样每次处于队列头部(即累计工作时间最短)的司机会获得更长的行驶时间,从而缓解司机工作时间不平衡的问题。
系统算法运行的流程图和伪代码请参阅图5和图6。
一种简单情况下的算法执行过程请参阅图7。
本文对于蓝海(福建)信息科技有限公司的城际客运订单数据进行数值仿真,选取的订单信息是2023年7月1日的所有订单数据,总订单667条。
使用的辅助数据集也来自蓝海(福建)信息科技有限公司从2022年1月1日到2023年的6月30日的所有历史调度数据,共28054条行程,用于数据挖掘。
使用的订单匹配的对比算法是传统的基于时间的调度算法,使用的车辆调度的算法是基于普通队列的方法,特点是先进先出(FIFO)。均使用CPLEX求解器求解ILP模型。传统调度方法不能达到专家期望的原因请参阅图8。
实验参数设置如表6所示:
表6
评价方法和指标如表7所示:
表7
其中|ex|符号均表示集合ex的长度。
实验结果如表8所示:
表8
实验结果分析:
可以发现,两种方法完成订单数相近,但是本实施例的车辆平均载客数更高,这说明司机可以获得更高的收入。不过与之相应的,更多的载客数必定意味着更长的车辆行驶时间,这是符合现实情况的。在本实施例的基于优先队列的调度方法下,车辆工作时间不平衡程度有明显的缓解。本实施例的提升度分数上与传统方法有非常明显的提升,说明实施例能够让司机更多地按照熟悉的、领域专家认可的模式接送客。
综上所述,本发明实施例的基于关联规则的城际拼车订单调度方法 通过关联规则的分数计算为司机分配订单,通过优先队列管理车队进行调度,能够为司机提供基于领域专家经验的订单组合,提高了司机的收入,缓解司机工作时间不平衡的问题,增加了企业车辆资源的利用率。
请参阅图9,本发明第二实施例还提供了一种基于关联规则的城际拼车订单调度装置,其包括:
调度数据获取单元210,用于获取历史人工调度中城市v和城市w之间的每一趟车辆行程的调度数据;
特征项提取单元220,用于提取所述调度数据中的网格区块位置信息作为特征项,将所述调度数据转换为事务列表;
编码单元230,用于对所述事务列表内的事务的重复出现的特征进行编码处理,获得编码后的事务;
关联规则挖掘单元240,用于使用关联规则挖掘方法挖掘获得所述编码后的事务的关联规则;所述关联规则用于表征所述事务列表的事务特征项之间出现频次的关系;
调度单元250,用于根据建立的整数线性规划模型,基于所述关联规则中的提升度对订单进行匹配,并根据匹配结果获取优先队列,以基于优先队列实现调度车辆。
本发明第三实施例还提供了一种基于关联规则的城际拼车订单调度设备,其包括存储器以及处理器,所述存储器内存储有计算机程序,所述计算机程序能够被所述处理器执行,以实现如上述的基于关联规则的城际拼车订单调度方法。
以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。
Claims (5)
1.一种基于关联规则的城际拼车订单调度方法,其特征在于,包含:
S1,获取历史人工调度中城市v和城市w之间的每一趟车辆行程的调度数据;其中,设在原始的调度数据中,r是某一个乘客请求,由一个元组构成,,/>是乘客请求r的起点坐标,/>是乘客请求r的终点坐标,坐标信息由经纬度构成;/>是乘客上车坐标对应的网格区块编号,/>是乘客下车坐标对应的网格区块编号;/>是乘客请求r的上车时间,/>是乘客请求r的下车时间;则所述网格区块位置信息为元组r中的/>;在提取网格区块位置信息作为特征项之后,将获得的事务列表记为X,事务列表中的第i条事务记作,记事务/>中的第j项为/>;/>表示为了服务这趟行程,车辆从车场出发,行驶经过的网格区块编号;
S2,提取所述调度数据中的网格区块位置信息作为特征项,将所述调度数据转换为事务列表;其中,定义函数为:在事务/>中,从第1个特征项到第j个特征项中,/>出现的次数;则对于每一条事务/>,对事务内的每一项进行编码处理,将编码后的新的事务的第j个特征项记为/>,编码的具体方法如公式(1)所示:
其中M代表的是系统中网格区块的总数量;根据所有编码后的特征项获得编码后的事务;
S3,对所述事务列表内的事务的重复出现的特征进行编码处理,获得编码后的事务;
S4,使用关联规则挖掘方法挖掘获得所述编码后的事务的关联规则;所述关联规则用于表征所述事务列表的事务特征项之间出现频次的关系;
S5,根据建立的整数线性规划模型,基于所述关联规则中的提升度对订单进行匹配,并根据匹配结果获取优先队列,以基于优先队列实现调度车辆
其中,在步骤S5中:
设开始运行时,一共有K辆车分别位于城市v和城市w,对于第k辆车,其状态参数集,其中/>是车辆k的当前状态;/>是车辆k的累计工作时长;是车辆出行次数,每当车辆从车场出发,车辆出行次数加一次;/>是车辆将要服务的一组乘客请求;
设城市v拥有辆车,则城市w拥有/>辆车,每辆车的载客量均为C;
在订单调度阶段,分别用两个优先队列管理两个城市的车场的车辆,越小则优先级越高;当有多辆车能够服务同一组订单时,选择优先队列头部即优先级最高的车俩对行程/>进行服务;
在订单匹配阶段,将当前累积的订单请求存放在待服务订单集合中,每当/>中累积的订单请求个数达到/>,并且系统当前时间小于系统停止运行时间END,执行一次调度算法,把当前接受进行服务的乘客请求/>放入已服务订单集合/>中,当前拒绝进行服务的乘客请求/>仍然保存在/>中;
乘客请求之间的匹配看作是一个不等积集合划分问题,通过建立整数线性规划模型求解该问题;对于整数线性规划模型:
用表示/>中的第/>个乘客请求,将/>中的/>名乘客分配到/>个空集合中,第b个集合记为/>,优化目标是最大化所有集合的分数;其中:
决策变量:表示/>中第a个乘客请求是否分配到第b个集合中;/>表示/>中第a个乘客请求分配到第b个集合中,/>表示/>中第a个乘客请求不分配到第b个集合中;优化目标为:
即最大化划分出的所有个集合的分数;
受到约束:
公式(5)保证中每个元素至多被分配到一个集合中;公式(6)保证每一个集合最少有c个元素,c即为了平衡出行成本的最小载客量,最多有C个元素,C即车辆的最大载客量;公式(7)是二进制变量约束;
其中的计算方式基于关联规则中的提升度;具体来说有公式(8):
是集合/>的第g个长度大于1的非空子集,任意集合/>都会有个长度大于1非空子集;
Y是所有与前件相关联的后件的集合,所以bk就是Y后件集合中的一个后件,表示前件/>与后件/>的提升度;提升度的具体计算方法:
其中是前件/>发生的概率,/>是后件/>发生的概率,/>是前件/>和后件/>同时发生的概率;当lift(/>,/>)>1,则说明/>和/>是正相关的,前件/>的出现增加了后件/>出现的概率;当lift(/>,/>)<1,则说明/>和/>是负相关的,前件/>的出现减小了后件/>出现的概率;当lift(/>,/>)=1,则说明前件和后件/>没有关联;/>代表集合/>的所有子集中存在关联规则的子集的数量。
2.根据权利要求1所述的基于关联规则的城际拼车订单调度方法,其特征在于,
给定编码后的事务,通过公式(2)计算某一个特征项在一个事务中出现的次数,通过公式(3)计算某个特征项原本的网格编号:
其中表示对/>的结果向下取整,mod表示取模运算。
3.根据权利要求1所述的基于关联规则的城际拼车订单调度方法,其特征在于,在使用关联规则挖掘方法挖掘获得所述编码后的事务的关联规则时:
使用的最小支持度计数为,最小支持度计数直观上的含义为:只要某元素在整个事务列表中出现超过/>次,则认为是频繁的;
最小置信度为,最小置信度直观上的含义为:对于给定的前项,后项出现的概率至少为/>。
4.一种基于关联规则的城际拼车订单调度装置,其特征在于,包括:
调度数据获取单元,用于获取历史人工调度中城市v和城市w之间的每一趟车辆行程的调度数据;其中,设在原始的调度数据中,r是某一个乘客请求,由一个元组构成,,/>是乘客请求r的起点坐标,/>是乘客请求r的终点坐标,坐标信息由经纬度构成;/>是乘客上车坐标对应的网格区块编号,/>是乘客下车坐标对应的网格区块编号;/>是乘客请求r的上车时间,/>是乘客请求r的下车时间;则所述网格区块位置信息为元组r中的/>;在提取网格区块位置信息作为特征项之后,将获得的事务列表记为X,事务列表中的第i条事务记作/>,记事务/>中的第j项为/>;/>表示为了服务这趟行程,车辆从车场出发,行驶经过的网格区块编号;
特征项提取单元,用于提取所述调度数据中的网格区块位置信息作为特征项,将所述调度数据转换为事务列表;其中,定义函数为:在事务/>中,从第1个特征项到第j个特征项中,/>出现的次数;则对于每一条事务/>,对事务内的每一项进行编码处理,将编码后的新的事务的第j个特征项记为/>,编码的具体方法如公式(1)所示:
其中M代表的是系统中网格区块的总数量;根据所有编码后的特征项获得编码后的事务;
编码单元,用于对所述事务列表内的事务的重复出现的特征进行编码处理,获得编码后的事务;
关联规则挖掘单元,用于使用关联规则挖掘方法挖掘获得所述编码后的事务的关联规则;所述关联规则用于表征所述事务列表的事务特征项之间出现频次的关系;
调度单元,用于根据建立的整数线性规划模型,基于所述关联规则中的提升度对订单进行匹配,并根据匹配结果获取优先队列,以基于优先队列实现调度车辆;其中,设开始运行时,一共有K辆车分别位于城市v和城市w,对于第k辆车,其状态参数集,其中/>是车辆k的当前状态;/>是车辆k的累计工作时长;是车辆出行次数,每当车辆从车场出发,车辆出行次数加一次;/>是车辆将要服务的一组乘客请求;
设城市v拥有辆车,则城市w拥有/>辆车,每辆车的载客量均为C;
在订单调度阶段,分别用两个优先队列管理两个城市的车场的车辆,越小则优先级越高;当有多辆车能够服务同一组订单时,选择优先队列头部即优先级最高的车俩对行程/>进行服务;
在订单匹配阶段,将当前累积的订单请求存放在待服务订单集合中,每当/>中累积的订单请求个数达到/>,并且系统当前时间小于系统停止运行时间END,执行一次调度算法,把当前接受进行服务的乘客请求/>放入已服务订单集合/>中,当前拒绝进行服务的乘客请求/>仍然保存在/>中;
乘客请求之间的匹配看作是一个不等积集合划分问题,通过建立整数线性规划模型求解该问题;对于整数线性规划模型:
用表示/>中的第/>个乘客请求,将/>中的/>名乘客分配到/>个空集合中,第b个集合记为/>,优化目标是最大化所有集合的分数;其中:
决策变量:表示/>中第a个乘客请求是否分配到第b个集合中;/>表示/>中第a个乘客请求分配到第b个集合中,/>表示/>中第a个乘客请求不分配到第b个集合中;优化目标为:
即最大化划分出的所有个集合的分数;
受到约束:
公式(5)保证中每个元素至多被分配到一个集合中;公式(6)保证每一个集合最少有c个元素,c即为了平衡出行成本的最小载客量,最多有C个元素,C即车辆的最大载客量;公式(7)是二进制变量约束;
其中的计算方式基于关联规则中的提升度;具体来说有公式(8):
是集合/>的第g个长度大于1的非空子集,任意集合/>都会有个长度大于1非空子集;
Y是所有与前件相关联的后件的集合,所以bk就是Y后件集合中的一个后件,表示前件/>与后件/>的提升度;提升度的具体计算方法:
其中是前件/>发生的概率,/>是后件/>发生的概率,/>是前件/>和后件/>同时发生的概率;当lift(/>,/>)>1,则说明/>和/>是正相关的,前件/>的出现增加了后件/>出现的概率;当lift(/>,/>)<1,则说明/>和/>是负相关的,前件/>的出现减小了后件/>出现的概率;当lift(/>,/>)=1,则说明前件和后件/>没有关联;/>代表集合/>的所有子集中存在关联规则的子集的数量。
5.一种基于关联规则的城际拼车订单调度设备,其特征在于,包括存储器以及处理器,所述存储器内存储有计算机程序,所述计算机程序能够被所述处理器执行,以实现如权利要求1至3任意一项所述的基于关联规则的城际拼车订单调度方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410060546.XA CN117575298B (zh) | 2024-01-16 | 2024-01-16 | 一种基于关联规则的城际拼车订单调度方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410060546.XA CN117575298B (zh) | 2024-01-16 | 2024-01-16 | 一种基于关联规则的城际拼车订单调度方法、装置及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117575298A CN117575298A (zh) | 2024-02-20 |
CN117575298B true CN117575298B (zh) | 2024-04-30 |
Family
ID=89892201
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410060546.XA Active CN117575298B (zh) | 2024-01-16 | 2024-01-16 | 一种基于关联规则的城际拼车订单调度方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117575298B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104408910A (zh) * | 2014-11-24 | 2015-03-11 | 无锡清华信息科学与技术国家实验室物联网技术中心 | 多方有益的出租车拼车调度方法 |
CN104933136A (zh) * | 2015-06-15 | 2015-09-23 | 北方工业大学 | 基于海量车牌自动识别数据的动态拼车方法和系统 |
CN106897919A (zh) * | 2017-02-28 | 2017-06-27 | 百度在线网络技术(北京)有限公司 | 用车类型预测模型建立、信息提供方法及装置 |
CN107609107A (zh) * | 2017-09-13 | 2018-01-19 | 大连理工大学 | 一种基于多源城市数据的出行共现现象可视化分析方法 |
CN111932341A (zh) * | 2020-08-10 | 2020-11-13 | 北京嘀嘀无限科技发展有限公司 | 一种确定拼车订单的方法和系统 |
CN116324838A (zh) * | 2020-10-07 | 2023-06-23 | 北京嘀嘀无限科技发展有限公司 | 用于通过叫车平台调度共享乘车的系统和方法 |
CN116663811A (zh) * | 2023-05-17 | 2023-08-29 | 华侨大学 | 一种城际客运的往返动态拼车的调度匹配方法和装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200234582A1 (en) * | 2016-01-03 | 2020-07-23 | Yosef Mintz | Integrative system and methods to apply predictive dynamic city-traffic load balancing and perdictive parking control that may further contribute to cooperative safe driving |
US10817806B2 (en) * | 2016-07-29 | 2020-10-27 | Xerox Corporation | Predictive model for supporting carpooling |
US20220163336A1 (en) * | 2020-11-25 | 2022-05-26 | Uber Technologies, Inc. | Rideshare system implementing peak-shaving for fleet vehicle operators |
-
2024
- 2024-01-16 CN CN202410060546.XA patent/CN117575298B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104408910A (zh) * | 2014-11-24 | 2015-03-11 | 无锡清华信息科学与技术国家实验室物联网技术中心 | 多方有益的出租车拼车调度方法 |
CN104933136A (zh) * | 2015-06-15 | 2015-09-23 | 北方工业大学 | 基于海量车牌自动识别数据的动态拼车方法和系统 |
CN106897919A (zh) * | 2017-02-28 | 2017-06-27 | 百度在线网络技术(北京)有限公司 | 用车类型预测模型建立、信息提供方法及装置 |
CN107609107A (zh) * | 2017-09-13 | 2018-01-19 | 大连理工大学 | 一种基于多源城市数据的出行共现现象可视化分析方法 |
CN111932341A (zh) * | 2020-08-10 | 2020-11-13 | 北京嘀嘀无限科技发展有限公司 | 一种确定拼车订单的方法和系统 |
CN116324838A (zh) * | 2020-10-07 | 2023-06-23 | 北京嘀嘀无限科技发展有限公司 | 用于通过叫车平台调度共享乘车的系统和方法 |
CN116663811A (zh) * | 2023-05-17 | 2023-08-29 | 华侨大学 | 一种城际客运的往返动态拼车的调度匹配方法和装置 |
Non-Patent Citations (3)
Title |
---|
Assessing the Potential of Carpooling for Reducing Vehicle Kilometers Traveled;Aina Rasoldier, Alain Girault, Sophie Quinton 等;2023 International Conference on ICT for Sustainability (ICT4S);20231027;全文 * |
基于个性化需求的拼车路径匹配算法研究;郭会;王丽侠;;计算机技术与发展;20170104(01);全文 * |
基于大数据的出租车需求预测和拼车算法研究;徐彤坤;中国优秀硕士学位论文全文数据库工程科技Ⅱ辑;20200215;第2-4节 * |
Also Published As
Publication number | Publication date |
---|---|
CN117575298A (zh) | 2024-02-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110047279B (zh) | 一种基于订单数据确定共享单车调度量的方法 | |
Boyacı et al. | An integrated optimization-simulation framework for vehicle and personnel relocations of electric carsharing systems with reservations | |
CN108242149B (zh) | 一种基于交通数据的大数据分析方法 | |
Ma et al. | Designing optimal autonomous vehicle sharing and reservation systems: A linear programming approach | |
CN108162771B (zh) | 一种电动汽车智能充电导航方法 | |
CN108009650A (zh) | 网约车服务请求处理方法、装置和服务器 | |
CN107563683A (zh) | 一种城市内乘客及货物协同运输方法及系统 | |
GB2535718A (en) | Resource management | |
CN108009653B (zh) | 订单管理方法、装置、服务器和计算机可读存储介质 | |
WO2019003672A1 (ja) | 交通需要予測装置、及び交通需要予測方法 | |
CN105184409A (zh) | 定制公交规划线路出行需求热力图构建方法 | |
CN106875670A (zh) | Spark平台下基于GPS数据的出租车调配方法 | |
CN111340318B (zh) | 一种车辆动态调度方法、装置及终端设备 | |
CN104991967A (zh) | 一种搭乘出租车的推荐方法、系统及客户端 | |
Wu et al. | Predicting peak load of bus routes with supply optimization and scaled Shepard interpolation: A newsvendor model | |
CN110826951A (zh) | 运输线路配载方法、装置、电子设备及计算机可读介质 | |
CN116324838A (zh) | 用于通过叫车平台调度共享乘车的系统和方法 | |
CN115018208A (zh) | 一种城市轨道运力优化方法、电子设备及其存储介质 | |
CN117575298B (zh) | 一种基于关联规则的城际拼车订单调度方法、装置及设备 | |
CN114971136A (zh) | 一种公交及巡游小巴调度方法 | |
CN110610284A (zh) | 信息处理方法以及信息处理装置 | |
CN114548461A (zh) | 一种利用网约车订单数据动态预测乘客等候时长的方法 | |
CN112183791A (zh) | 网约车调度方法、装置、电子设备及存储介质 | |
JP6391771B1 (ja) | イールド管理評価指標取得方法、イールド管理評価方法および移動体の座席販売システム | |
CN115841287B (zh) | 一种混合车队动态路径规划方法及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |