CN109948822B - 一种地理区域内网约车供需缺口预测方法 - Google Patents

一种地理区域内网约车供需缺口预测方法 Download PDF

Info

Publication number
CN109948822B
CN109948822B CN201711397967.8A CN201711397967A CN109948822B CN 109948822 B CN109948822 B CN 109948822B CN 201711397967 A CN201711397967 A CN 201711397967A CN 109948822 B CN109948822 B CN 109948822B
Authority
CN
China
Prior art keywords
area
prediction
supply
block
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711397967.8A
Other languages
English (en)
Other versions
CN109948822A (zh
Inventor
柯锦涛
杨海
郑宏煜
陈喜群
贾倚天
龚平华
叶杰平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Didi Infinity Technology and Development Co Ltd
Original Assignee
Beijing Didi Infinity Technology and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Didi Infinity Technology and Development Co Ltd filed Critical Beijing Didi Infinity Technology and Development Co Ltd
Priority to CN201711397967.8A priority Critical patent/CN109948822B/zh
Publication of CN109948822A publication Critical patent/CN109948822A/zh
Application granted granted Critical
Publication of CN109948822B publication Critical patent/CN109948822B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种地理区域内网约车供需缺口预测方法,包括:将地理区域划分为多个正六边形的区域单元;将若干所述区域单元进行拼接得到至少一个区域块;确定所述区域块的预测用特征参数;区域块的预测用特征参数为其包含的各正六边形区域单元的预测用特征参数的组合;将所述区域块的预测用特征参数输入一个训练好的供需缺口预测模型;以及供需缺口预测模型输出预测结果,所述预测结果为所述区域块包含的各正六边形区域单元的预测结果的组合。

Description

一种地理区域内网约车供需缺口预测方法
技术领域
本发明涉及运力调度领域,特别涉及一种利用深度学习方法预测车辆供需缺口的方法。
背景技术
随着移动互联网技术的快速发展,网约车服务冲击了传统的出租车行业,并对人们的出行方式产生了重要的影响。与传统的出租车服务相比,网约车服务更加的方便、高效并且舒适。通过精确的预测在未来某段时间内某个区域的乘客数量和空闲司机数量,平台可以调度附近空闲区域的司机前往繁忙区域以维持繁忙区域的供需平衡。
在实际的调度过程中,一个区域在一定时间段内的订单需求量是相对固定的,而车辆在这个区域内却是连续不断的变化的。
因此该区域内的空闲司机的提供量相对难确定,所以需要提供一种新的方法来确定这种供需关系。
发明内容
本发明一方面提供了一种一种地理区域内网约车供需缺口预测方法,包括:将地理区域划分为多个正六边形的区域单元;将若干所述区域单元进行拼接得到至少一个区域块;确定所述区域块的预测用特征参数;区域块的预测用特征参数为其包含的各正六边形区域单元的预测用特征参数的组合;将所述区域块的预测用特征参数输入一个训练好的供需缺口预测模型;以及供需缺口预测模型输出预测结果,所述预测结果为所述区域块包含的各正六边形区域单元的预测结果的组合。
在本发明中,所述区域块包括一个中心区域单元以及多个外围区域单元。
在本发明中,至少一个区域单元属于多个区域块。
在本发明中,所述方法进一步包括:使用所述供需缺口预测模型计算不同的区域块的预测结果;对于至少一个区域单元,获取至少两个由不同区域块确定的该区域单元的预测结果;将所述至少一个区域单元的多个预测结果求均值作为所述至少一个区域单元的供需缺口预测结果。
在本发明中,将所述区域块的预测用特征参数输入一个训练好的供需缺口预测模型包括:将所述特征参数映射到一个坐标系中,转化为至少一个张量;以及将所述至少一个张量输入到所述坐标系对应的一个训练好的供需缺口预测模型中。
在本发明中,所述坐标系为以下任一种:正交坐标系、奇偶坐标系或立方坐标系。
本发明另一方面提供了一种地理区域内网约车供需缺口预测模型训练方法,包括:将地理区域划分为多个正六边形的区域单元;将若干所述区域单元进行拼接得到至少一个区域块;确定所述区域块的训练用特征参数;区域块的训练用特征参数为其包含的各正六边形区域单元的训练用特征参数的组合;将所述训练用特征参数输入到一个数学模型中进行训练。
在本发明中,所述特征参数的种类包括以下种类中的至少一种:供应相关参数、需求相关参数、匹配相关参数、交通状况相关参数、位置相关参数、天气相关参数、或时间相关参数。
在本发明中,每种特征参数种类下进一步至少包括以下一种时间属性的特征参数:长期特征、或短期特征。
本发明另一方面提供了一种地理区域内网约车供需缺口预测系统,包括:区域划分模块,用于将地理区域划分为多个正六边形的区域单元;区域拼接模块,将若干所述区域单元进行拼接得到至少一个区域块;特征参数确定模块,用于确定至少一个区域块的预测用特征参数;区域块的预测用特征参数为其包含的各正六边形区域单元的预测用特征参数的组合;以及预测模型,用于根据所述至少一个区域块的预测用特征参数计算并输出预测结果;所述预测结果为所述区域块包含的各正六边形区域单元的预测结果的组合。
在本发明中,所述区域块包括一个中心区域单元以及多个外围区域单元。
在本发明中,至少一个区域单元属于多个区域块。
在本发明中,所述系统还包括预测结果优化模块,用于:使用所述供需缺口预测模型计算不同的区域块的预测结果;对于至少一个区域单元,获取至少两个由不同区域块确定的该区域单元的预测结果;将所述至少一个区域单元的多个预测结果求均值作为所述至少一个区域单元的供需缺口预测结果。
在本发明中,预测模型还用于:将所述特征参数映射到一个坐标系中,转化为至少一个张量;以及基于所述至少一个张量计算预测结果。
在本发明中,所述坐标系为以下任一种:正交坐标系、奇偶坐标系或立方坐标系。
本发明另一方面提供了一种地理区域内网约车供需缺口预测模型训练系统,包括:区域划分模块,用于将地理区域划分为多个正六边形的区域单元;区域拼接模块,用于将若干所述区域单元进行拼接得到至少一个区域块;特征参数确定模块,用于确定所述区域块的训练用特征参数;区域块的训练用特征参数为其包含的各正六边形区域单元的训练用特征参数的组合;以及模型训练模块,用于将所述训练用特征参数输入到一个数学模型中进行训练。
在本发明中,所述特征参数的种类包括以下种类中的至少一种:供应相关参数、需求相关参数、匹配相关参数、交通状况相关参数、位置相关参数、天气相关参数、或时间相关参数。
在本发明中,每种特征参数种类下进一步至少包括以下一种时间属性的特征参数:长期特征或短期特征。
本发明另一方面提供了一种地理区域内网约车供需缺口预测装
置,包括:至少一个处理器,以及可执行指令,所述指令被至少一个处理器执行时,导致所述至少一个处理器实现前述的方法。
本发明另一方面提供了一种计算机可读存储介质,其特征在于,包括可执行指令,所述指令被至少一个处理器执行时,导致所述至少一个处理器实现前述的方法。
与现有技术相比,本发明的有益效果表现如下:
一、采用六边形分割的方法使得相邻区域的定义更加明确,拥有更大的边缘/面积比例,显著的各项同性等。
二、采用根据区域块推算区域单元供需缺口的方法并取平均值,可以提升算法的精确度。
附图说明
图1是本发明提供的一种示例性供需缺口预测系统的示意图;
图2是本发明提供的一种供需缺口预测方法流程图;
图3A-3D是本发明提供的一种六边形区域划分方法以及三种坐标映射方法示意图;
图4是本发明提供的一种供需缺口预测模型训练方法示意图;以及
图5是本发明提供的一种利用训练好的模型预测供需缺口的方法示意图。
具体实施方式
下面通过具体实施例并结合附图对本发明做进一步描述。
图1是本发明提供的一种示例性供需缺口预测系统100的示意图。例如,供需缺口预测系统100可以是一个提供运输服务的在线运输服务平台,所述运输服务可以包括出租车预定、代驾服务、运送车辆、拼车、公交服务、司机雇佣和短程运输。按需服务系统100可以是一个包括一个服务器110、一个网络120、一个请求方终端130、一个提供方终端140和一个数据库150的在线平台。服务器110可以包括一个处理引擎112。
在一些实施例中,服务器110可以是一个单个的服务器或者一个服务器群。所述服务器群可以是集中式的或分布式的(例如,服务器110可以是一个分布式的系统)。在一些实施例中,服务器110可以是本地的或远程的。例如,服务器110可以通过网络120访问存储在请求方终端130、提供方终端140和/或数据库150中的信息和/或数据。再例如,服务器110可以直接连接到请求方终端130、提供方终端140和/或数据库150以访问存储的信息和/或数据。在一些实施例中,服务器110可以在一个云平台上实现。仅仅举个例子,所述云平台可以包括私有云、公共云、混合云、社区云、分布云、跨云、多云等或上述举例的任意组合。
在一些实施例中,服务器110可以包括一个处理引擎112。处理引擎112可以处理与服务请求相关的信息和/或数据以执行本申请描述的一个或多个功能。例如,处理引擎112可以基于某一地区未来某一时段预测的车辆供需状况调度至少一个提供方终端140。在一些实施例中,处理引擎112可以包括一个或多个处理引擎(例如,单核处理引擎或多核处理引擎)。仅仅举个例子,处理引擎112可以包括一个或多个硬件处理器,例如中央处理器(CPU)、专用集成电路(ASIC)、专用指令集处理器(ASIP)、图像处理器(GPU)、物理运算处理器(PPU)、数字信号处理器(DSP)、现场可编辑门阵列(FPGA)、可编辑逻辑器件(PLD)、控制器、微控制器单元、精简指令集计算机(RISC)、微处理器等或上述举例的任意组合。
处理引擎112可以包括一个区域划分模块,用于所述地理区域划分为多个由正六边形区域单元组成的区域块;一个特征参数确定模块,用于确定至少一个区域块的预测用特征参数以及训练用特征参数;一个预测模型,用于根据所述至少一个区域块的预测用特征参数计算并输出每个正六边形区域单元的供需缺口预测结果,以及一个模型训练模块,用于将所述训练用特征参数输入到一个数学模型中进行训练。
网络120可以促进信息和/或数据的交换。在一些实施例中,供需缺口预测系统100中的一个或多个部件(例如,服务器110、请求方终端130、提供方终端140和数据库150)可以通过网络120向供需缺口预测系统100中的其他部件发送信息和/或数据。例如,服务器110可以通过网络120从请求方终端130获取/得到服务请求。在一些实施例中,网络120可以是有线网络或无线网络中的任意一种,或其组合。仅仅举个例子,网络120可以包括电缆网络、有线网络、光纤网络、远程通信网络、内联网、互联网、局域网(LAN)、广域网(WAN)、无线局域网(WLAN)、城域网(MAN)、公共开关电话网络(PSTN)、蓝牙网络、ZigBee网络、近场通讯(NFC)网络等或上述举例的任意组合。在一些实施例中,网络120可以包括一个或多个网络接入点。例如,网络120可能包括有线或无线网络接入点,如基站和/或互联网交换点120-1、120-2、……。通过接入点,供需缺口预测系统100的一个或多个部件可能连接到网络120以交换数据和/或信息。
在一些实施例中,请求方可以是请求方终端130的用户。在一些实施例中,请求方终端130的使用者可以是请求方之外的其他人。例如,请求方终端130的用户A可以使用请求方终端130为用户B发送一个服务请求或从服务器110接收服务和/或信息或指示。在一些实施例中,提供方可以是提供方终端140的用户。在一些实施例中,服务方终端140的使用者可以是服务方之外的其他人。例如,服务方终端140的用户C可以使用服务方终端140为用户D接收一个服务请求和/或从服务器110接收信息或指示。在一些实施例中,“请求方”和“请求方终端”可以交换使用,“提供方”和“提供方终端”可以交换使用。
在一些实施例中,请求方终端130可以包括移动设备130-1、平板电脑130-2、便携式电脑130-3、汽车的内置设备130-4等或上述举例的任意组合。在一些实施例中,移动设备130-1可以包括智能家居设备、可穿戴设备、智能移动设备、虚拟现实设备、增强现实设备等或上述举例的任意组合。在一些实施例中,智能家居设备可以包括智能照明设备、智能电器的控制设备、智能监测设备、智能电视、智能摄像机、对讲机等或上述举例的任意组合。在一些实施例中,可穿戴设备可以包括智能手环、智能鞋袜、智能眼镜、智能头盔、智能手表、智能衣物、智能背包、智能配饰等或上述举例的任意组合。在一些实施例中,智能移动设备可以包括智能手机、掌上电脑、游戏设备、导航设备、POS机等或上述举例的任意组合。在一些实施例中,虚拟现实设备和/或增强现实设备可以包括虚拟现实头盔、虚拟现实眼镜、虚拟现实眼罩、增强现实头盔、增强现实眼镜、增强现实眼罩等或上述举例的任意组合。例如,虚拟现实设备和/或增强现实设备可以包括谷歌眼镜、VR眼镜、微软Hololens、三星GearVR等。在一些实施例中,汽车的内置设备130-4可以包括车载电脑、车载电视等。在一些实施例中,请求方终端130可以是一个带有定位技术的设备,该定位技术可以用于定位请求方和/或请求方终端130的位置。
在一些实施例中,提供方终端140可以是与请求方终端130相似或相同的设备。在一些实施例中,提供方终端140可以是一个带有定位技术的设备,该定位技术可以用于定位提供方和/或提供方终端140的位置。在一些实施例中,请求方终端130和/或提供方终端140可以与其他定位设备通信以确定请求方、请求方终端130、提供方和/或提供方终端140的位置。在一些实施例中,请求方终端130和/或提供方终端140可以将定位信息发送至服务器110。
数据库150可以存储数据和/或指令。在一些实施例中,数据库150可以存储从请求方终端130和/或提供方终端140获得的数据。在一些实施例中,数据库150可以存储供服务器110执行或使用的数据和/或指令,服务器110可以通过执行或使用所述数据和/或指令以实现本申请描述的示例性方法。在一些实施例中,数据库150可以包括大容量存储器、可移动存储器、挥发性读写存储器、只读存储器(ROM)等或上述举例的任意组合。示例性的大容量存储器可以包括磁盘、光盘、固态硬盘等。示例性的可移动存储器可以包括闪存盘、软盘、光盘、记忆卡、压缩硬盘、磁带等。示例性的挥发性只读存储器可以包括随机存储器(RAM)。示例性的随机存储器可以包括动态随机存储器(DRAM)、双数据率同步动态随机存储器(DDRSDRAM)、静态随机存储器(SRAM)、可控硅随机存储器(T-RAM)和零电容存储器(Z-RAM)等。示例性的只读存储器可以包括掩蔽型只读存储器(MROM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPEROM)、电可擦除可编程只读存储器(EEPROM)、压缩硬盘只读存储器(CD-ROM)和数字多功能硬盘只读存储器等。在一些实施例中,数据库150可以在一个云平台上实现。仅仅举个例子,所述云平台可以包括私有云、公共云、混合云、社区云、分布云、跨云、多云等或上述举例的任意组合。
在一些实施例中,数据库150可以与网络120连接以与供需缺口预测系统100的一个或多个部件(例如,服务器110、请求方终端130、提供方终端140等)通信。供需缺口预测系统100的一个或多个部件可以通过网络120访问存储在数据库150中的数据或指令。在一些实施例中,数据库150可以直接与供需缺口预测系统100的一个或多个部件(例如,服务器110、请求方终端130、提供方终端140等)连接或通信。在一些实施例中,数据库150可以是服务器110的一部分。
在一些实施例中,供需缺口预测系统100的一个或多个部件(例如,服务器110、请求方终端130、提供方终端140等)可以拥有访问数据库150的许可。在一些实施例中,当满足一个或多个条件时,供需缺口预测系统100的一个或多个部件可以读取和/或修改与请求方、提供方和/或公众相关的信息。例如,服务器110可以在一个服务之后读取和/或修改一个或多个用户的信息。再例如,当从请求方终端130接收到一个服务请求时,提供方终端140可以访问与所述请求方相关的信息,但提供方终端140无法修改请求方的相关信息。
在一些实施例中,供需缺口预测系统100的一个或多个部件的信息交换可以通过请求一个服务的方式实现。所述服务请求的客体可以是任何产品。在一些实施例中,所述产品可以是有形产品或无形产品。有形产品可以包括食品、医药、商品、化学产品、电器、衣物、小汽车、房屋、奢侈品等或上述举例的任意组合。无形产品可以包括服务产品、金融产品、知识产品、互联网产品等或上述举例的任意组合。互联网产品可以包括个人主机产品、网站产品、移动互联网产品、商业主机产品、嵌入式产品等或上述举例的任意组合。移动互联网产品可以用于移动终端的软件、程序、系统等或上述举例的任意组合。移动终端可以包括平板电脑、便携式电脑、移动手机、掌上电脑(PDA)、智能手表、POS机、车载电脑、车载电视、可穿戴设备等或上述举例的任意组合。例如,所述产品可以是用于电脑或移动手机中的任意的软件和/或应用程序。所述软件和/或应用程序可以与社交、购物、交通、娱乐、学习、投资等或上述举例的任意组合有关。在一些实施例中,与交通相关的软件和/或应用程序可以包括出行软件和/或应用程序、交通工具调度软件和/或应用程序、地图软件和/或应用程序等。在交通工具调度软件和/或应用程序中,交通工具可以包括马、马车、人力车(例如独轮手推车、自行车、三轮车等)、汽车(例如,出租车、公共汽车、私家车等)、火车、地铁、船舶、航空器(例如,飞机、直升机、航天飞机、火箭、热气球等)等或上述举例的任意组合。
在一些实施例中,每个终端130和/或140可以存储与一个或多个区域(例如,城市、城市的一个或多个部分、区、州、国家等)相关的地图数据。在一些实施例中,终端130和/或140可以在线和/或离线访问地图数据以实现与本申请一致的一个或多个实施例。在一些实施例中,终端130和/或140可以从一个或多个服务器请求地图110数据。
图2是本发明提供的一种供需缺口预测方法流程图。在一些实施例中,所述供需缺口预测方法可以由处理引擎112执行。在实际的调度过程中,一个区域在一定时间段内的订单需求量是相对固定的,而车辆在这个区域内却是连续不断的变化的。可以用供需缺口
Figure BDA0001518922440000131
来表示这种供需关系。其中d∈D,t∈T,i∈L,且
Figure BDA0001518922440000132
[0,+∞)。D表示设定的日期范围,T表示一天中设定的时间间隔总数,L表示对该区域划分的区域单元总数。
在202中,所述处理引擎112可以获取一个区域内的历史订单数据,所述历史订单数据包括一系列历史特征参数。
在一些实施例中,所述区域可以是一个国家,一个城市,一个街区,或者任意大小的区域。所述区域可以被分成一系列的区域单元进行分别研究。所述历史订单可以包括当前时刻之前任何时刻发生的订单数据。所述历史订单数据可以通过网络120从资料库150获取。所述特征可以被分为几个类别。例如可以分为供应相关参数、需求相关参数、匹配相关参数、交通状况相关参数、位置相关参数、天气相关参数、以及时间相关参数。
在一些实施例中,所述供应相关参数可以包括在特定区域单元内特定时间段内经过的司机数量,司机在每个区域单元中各个时间段所停留的时间,司机的行驶距离和时间等。这些供应相关参数可以根据司机的行驶轨迹得到。所述供应相关参数可表示为
Figure BDA0001518922440000141
其中d,t,和i的含义与供需缺口
Figure BDA0001518922440000142
中的含义相同。
在一些实施例中,所述需求相关参数可以包括订单请求数量,用户打开客户端的数量,订单预估价以及等待时间等。所述需求相关参数可以表示为
Figure BDA0001518922440000143
在一些实施例中,所述匹配相关参数可以反应供需匹配过程中的匹配效率和匹配摩擦,可以包括成功匹配的订单,没有成功匹配的订单,订单应答率,平均应答时间等。所述匹配相关参数可以表示为
Figure BDA0001518922440000144
在一些实施例中,所述交通状况相关参数可以包括网约车的流入及流出量(反应在一个区域单元的时间窗口内有多少汽车接到或放下了乘客),平均的流入流出量及行驶距离。所述交通状况相关参数可以表示为
Figure BDA0001518922440000145
在一些实施例中,所述位置相关参数可以包括一个区域单元的经纬度信息,且可以表示为
Figure BDA0001518922440000146
在一些实施例中,所述天气相关参数可以包括天气状况,降水,风速以及PM2.5等。所述天气状况可以包括雪、晴、雨、多云和雾灯。所述天气相关参数可以表示为
Figure BDA0001518922440000147
在一些实施例中,所述时间相关参数可以包括每天的时间信息和每周的时间信息。在本申请中,每天被分为48个时间窗口。所述时间相关参数可以表示为
Figure BDA0001518922440000151
在204中,所述处理引擎112将所述区域划分为一系列相同大小的且紧密排列的正六边形区域单元,所述每个区域单元对应一部分与该区域单元有关的历史订单数据中的对应历史特征参数。例如,在图3A中,目标区域被划分成了19个全等的正六边形区域单元。所述正六边形区域可以组成一个区域块来进行研究。在一些具体实施例中,以某一正六边形区域单元为中心向周围扩展得到所述区域块。例如图3A中的0~6可以作为一个区域块,再例如图3A中的0~18。
在后续的卷进神经网络模型训练中,由于正六边形分割不像四边形分割一样可以直接转化为矩阵,所以用
Figure BDA0001518922440000152
来表示以区域单元i0为中心的区域块,其中n表示中心区域单元周围区域单元的层数。例如,一个区域单元外围第一层有6个相邻区域单元,外围第二层有12个相邻区域单元。单层区域块可以表示为向量
Figure BDA0001518922440000153
(i0,i1,…,i6),双层区域块可以表示为向量
Figure BDA0001518922440000154
n层区域块中每一层的编号都从中心区域单元左侧开始算起。这样
Figure BDA0001518922440000155
即可以表示以i0为中心区域单元n层区域块。
在区域被划分为区域单元后,202中获取的历史订单数据可以对应到每一个区域单元中。例如,某订单的用户发送订单时位于A区域单元中,则可以将该订单数据中的需求相关参数对应到A区域单元中。所以,划分完的区域单元都会对应各自的历史特征参数。
在206中,所述处理引擎112可以将所述一系列六边形区域单元及其对应的历史特征参数作为一个供需缺口预测模型的输入并训练该供需缺口预测模型。所述缺口预测模型可以是卷积神经网络模型。所述六边形区域单元或区域块可以首先被一个映射函数转换为一系列矩阵或张量的形式。在本申请中,提供了三种可以用来完成这个映射的函数,分别利用三种坐标系来完成映射,包括正交坐标系、奇偶坐标系和立方坐标系。
如图3B所示,将y轴旋转30°即可得到正交坐标系,且每一个区域单元都可以表示为x轴读数与y轴读数的交点。同样的,如图3C所示,x轴与y轴垂直,每个区域单元仍然可以表示为x轴读数与y轴读数的交点,但是区别在于只有偶数读数才对应一个区域单元。同样的,如图3D所示,三个互相成120°夹角的坐标轴构成该立方坐标系,每个区域单元的中心分别对应三个坐标轴上的读数。
在一些实施例中,用
Figure BDA0001518922440000161
Figure BDA0001518922440000162
来分别表示由正交坐标系、奇偶坐标系和立方坐标系进行映射的以区域单元i0为中心的n层区域块。例如,一层的区域块可以用三种映射函数分别表示为
Figure BDA0001518922440000163
具体为公式:
Figure BDA0001518922440000164
Figure BDA0001518922440000165
Figure BDA0001518922440000171
在一些实施例中,区域单元i的特征参数可以表示为
Figure BDA0001518922440000172
那么以i0为中心区域单元的区域块的特征参数就可以表示为一个N×L的参数矩阵
Figure BDA0001518922440000173
其中N表示n层区域块向量的长度。在一些实施例中,上述映射函数可以分别表示为
Figure BDA00015189224400001710
Figure BDA0001518922440000174
所述映射函数将所述区域块的特征参数矩阵映射为张量
Figure BDA0001518922440000175
所述区域块的标签
Figure BDA0001518922440000176
Figure BDA0001518922440000177
其维度为N×1,同样可以由所述三种映射函数转换为标签张量
Figure BDA0001518922440000178
所述卷积神经网络模型的训练流程如图4所示。所述历史订单数据中的特征参数401可以对应到区域块402中的每一个区域单元。所述卷积神经网络模型的第一层403可以是所述三种映射函数中的一种。所述卷积神经网络模型的第一层可以将输入的特征参数矩阵及标签向量转化为3D张量(如果映射函数为立方坐标系映射,则为4D张量),例如,
Figure BDA0001518922440000179
然后所述张量传输到所述卷积神经网络模型的一系列卷积层以及批量规范化层404。其中,第一层卷积层的通道数等于输入的张量(L)中特征参数的数量,并且通道数量随着卷积层数成比例减少(L/2,L/4,…)。最后一层的卷积层仅包含一个通道,使得输出的张量与标签张量形式上保持一致,例如前述的
Figure BDA0001518922440000181
在一些实施例中,以fconv表示所述的卷积神经网络模型,则标签的估计值可以表示为(以正交坐标映射方式为例):
Figure BDA0001518922440000182
其中
Figure BDA0001518922440000183
表示标签的估计值,
Figure BDA0001518922440000184
表示输入模型的用正交坐标映射的特征参数张量。同样的,用奇偶坐标系映射时,可以分别表示为
Figure BDA0001518922440000185
用立方坐标系映射时,可以分别表示为
Figure BDA0001518922440000186
W表示加权参数,b表示截距。
在一些实施例中,可以用一个正则化的目标函数来训练所述卷积神经网络模型。例如,对于正交映射的卷积神经网络模型,可以有:
Figure BDA0001518922440000187
上式中第一项使得估计标签值与真实标签值之间的差值最小,第二项是一个L2范数正则化项以减少模型的复杂度以及避免过度拟合。其中W表示所有的加权参数,且系数α用来平衡偏差与方差之间的权衡。确定了W以及b即可认为该卷积神经网络模型训练完毕。
在208中,所述处理引擎112可以根据历史特征参数预测所述区域单元对应的实时特征参数。在利用训练好的模型进行供需缺口预测时,首先需要对待预测区域及时间段内的特征参数进行预测。该预测可以根据待预测时间之前的历史订单数据来预测。其中历史订单数据又可以分为短期数据和长期数据。所述短期数据可以是至待预测时间段当天的之前几个小时,所述长期数据可以是待预测时间段前一天,前一周,前一个月等周期性的订单数据。短期数据可以反映订单数据的变化趋势,而长期数据则可以反映出待预测时间段内订单数据的周期性变化规律。在一些实施例中,可以根据短期数据和长期数据来对待预测时间段的订单数据进行预测。所述待预测时间段的订单数据包括预测用的特征参数,这样的命名方式仅仅出于与训练用特征参数相区别的目的。
在一些实施例中,长期数据可以包括过去四周该时间段订单数据的平均值,周中/周末该时间段的订单数据平均值,前一周该时间段的订单数据,前一天该时间段的订单数据等。以时间段t和t-1的供应相关参数为例,在预测
Figure BDA0001518922440000191
时:
过去四周该订单数据中供应相关参数在t时段的平均值为
Figure BDA0001518922440000192
t-1时段的平均值为
Figure BDA0001518922440000193
前一周该订单数据中的供应相关参数在t时段的平均值为
Figure BDA0001518922440000194
在t-1时段的值为
Figure BDA0001518922440000195
Figure BDA0001518922440000196
前一天该订单数据中的供应相关参数在t时段的值为
Figure BDA0001518922440000197
Figure BDA0001518922440000198
在t-1时段的值为
Figure BDA0001518922440000199
在周中/周末该订单数据中的供应相关参数在t时段的平均值为
Figure BDA0001518922440000201
在t-1时段的平均值为
Figure BDA0001518922440000202
Figure BDA0001518922440000203
其中集合P(d)包括历史数据中所有的周中和周末,d表示一个周中或周末。
在一些实施例中,可以提取多个短期数据来预测待测时间段的订单信息。例如,待测时间段为t时,可以提取t-1时间段和t-2时间段的订单数据。其中t-1时间段对应的供应相关参数可以是
Figure BDA0001518922440000204
t-2时间段对应的供应相关参数可以是
Figure BDA0001518922440000205
则时间段t内的供应相关参数可以被预测为
Figure BDA0001518922440000206
Figure BDA0001518922440000207
通过上述方法,可以根据需要由订单数据中历史特征参数预测出所述区域单元对应的实时特征参数。
在210中,所述处理引擎112可以将所述区域内区域单元的实时特征参数输入所述供需缺口预测模型以获取每个区域单元的实时供需缺口。图5是根据本申请的一些实施例提供的利用训练好的模型预测供需缺口的示意图。以正交坐标系的映射函数为例,501是由映射函数将目标区域的特征参数转化为张量后的结果。将该张量输入到训练好的模型中。根据公式(4)可以得到以i为中心的区域块的预测的标签张量,例如
Figure BDA0001518922440000208
每一个区域单元都会使用训练好的模型计算得到一个以该区域单元为中心的区域块的张量。在该实施例中,通过一个映射函数的逆函数fs-vmap可以将所述区域块的预测标签张量
Figure BDA0001518922440000211
转化为该区域块中各区域单元的预测的标签向量
Figure BDA0001518922440000212
如公式(6)所示:
Figure BDA0001518922440000213
其中,
Figure BDA0001518922440000214
为一个长度为N的向量,所述长度N与以i为中心的区域块中区域单元的个数相同,例如
Figure BDA0001518922440000215
其中,
Figure BDA0001518922440000216
表示由以i为中心的区域块预测出的区域单元j的供需缺口。
在一些实施例中,区域单元i的供需缺口可以直接由以i为中心的区域块得到。在一些实施例中,区域单元j的供需缺口可以由所有可以预测区域单元j供需缺口的区域单元进行预测后取平均值得到,即:
Figure BDA0001518922440000217
以图4为例,需要预测的区域为区域单元W。图中502表示由以区域单元A为中心的区域块预测出的区域单元W的供需缺口,503表示由以区域单元B为中心的区域块预测出的区域单元W的供需缺口,504表示由以区域单元C为中心的区域块预测出的区域单元W的供需缺口。在遍历了所有可以预测区域单元W的供需缺口的区域块后,将所有的区域单元W的预测结果取平均值,即可得到区域单元W供需缺口的最终预测结果。这种取平均值的算法可以显著提高预测的精确性以及稳定性。
以上所述仅为本发明的优选实施而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (16)

1.一种地理区域内网约车供需缺口预测方法,包括:
将地理区域划分为多个正六边形的区域单元;其中,所述多个正六边形的区域单元大小相同且紧密排列;
将若干所述区域单元进行拼接得到至少一个区域块;其中,所述区域块包括一个中心区域单元以及多个外围区域单元;
确定区域块的预测用特征参数;区域块的预测用特征参数为其包含的各正六边形区域单元的预测用特征参数的组合;
将区域块的预测用特征参数输入一个训练好的供需缺口预测模型;
供需缺口预测模型输出区域块的预测结果,所述预测结果为所述区域块包含的各正六边形区域单元的预测结果的组合;
所述方法还包括:
使用所述供需缺口预测模型计算不同的区域块的预测结果;
对于至少一个区域单元,获取至少两个由不同区域块确定的该区域单元的预测结果;
将所述至少一个区域单元的多个预测结果求均值作为所述至少一个区域单元的供需缺口预测结果。
2.根据权利要求1所述的方法,其特征在于,将所述区域块的预测用特征参数输入一个训练好的供需缺口预测模型包括:
将所述特征参数映射到一个坐标系中,转化为至少一个张量;以及
将所述至少一个张量输入到所述坐标系对应的一个训练好的供需缺口预测模型中。
3.根据权利要求2所述的方法,其中所述坐标系为以下任一种:正交坐标系、奇偶坐标系或立方坐标系。
4.如权利要求1~3任一项所述的方法中的供需缺口预测模型训练方法,包括:
将地理区域划分为多个正六边形的区域单元;其中,所述多个正六边形的区域单元大小相同且紧密排列;
将若干所述区域单元进行拼接得到至少一个区域块;其中,所述区域块包括一个中心区域单元以及多个外围区域单元;
确定所述区域块的训练用特征参数;区域块的训练用特征参数为其包含的各正六边形区域单元的训练用特征参数的组合;将所述训练用特征参数输入到一个数学模型中进行训练。
5.根据权利要求4所述的方法,所述特征参数的种类包括以下种类中的至少一种:供应相关参数、需求相关参数、匹配相关参数、交通状况相关参数、位置相关参数、天气相关参数、或时间相关参数。
6.根据权利要求5所述的方法,其特征在于,每种特征参数种类下进一步至少包括以下一种时间属性的特征参数:长期特征、或短期特征。
7.一种地理区域内网约车供需缺口预测系统,包括:
区域划分模块,用于将地理区域划分为多个正六边形的区域单元;其中,所述多个正六边形的区域单元大小相同且紧密排列;
区域拼接模块,将若干所述区域单元进行拼接得到至少一个区域块;其中,所述区域块包括一个中心区域单元以及多个外围区域单元;
特征参数确定模块,用于确定至少一个区域块的预测用特征参数;区域块的预测用特征参数为其包含的各正六边形区域单元的预测用特征参数的组合;以及
供需缺口预测模型,用于根据所述至少一个区域块的预测用特征参数计算并输出区域块的预测结果;所述预测结果为区域块包含的各正六边形区域单元的预测结果的组合;
预测结果优化模块,用于:使用所述供需缺口预测模型计算不同的区域块的预测结果;对于至少一个区域单元,获取至少两个由不同区域块确定的该区域单元的预测结果;将所述至少一个区域单元的多个预测结果求均值作为所述至少一个区域单元的供需缺口预测结果。
8.根据权利要求7所述的预测系统,其特征在于,供需缺口预测模型还用于:
将所述特征参数映射到一个坐标系中,转化为至少一个张量;以及
基于所述至少一个张量计算预测结果。
9.根据权利要求8所述的预测系统,其中所述坐标系为以下任一种:正交坐标系、奇偶坐标系或立方坐标系。
10.如权利要求1~3任一项所述的方法中的供需缺口预测模型训练系统,包括:
区域划分模块,用于将地理区域划分为多个正六边形的区域单元;其中,所述多个正六边形的区域单元大小相同且紧密排列;
区域拼接模块,用于将若干所述区域单元进行拼接得到至少一个区域块;其中,所述区域块包括一个中心区域单元以及多个外围区域单元;
特征参数确定模块,用于确定所述区域块的训练用特征参数;区域块的训练用特征参数为其包含的各正六边形区域单元的训练用特征参数的组合;以及
模型训练模块,用于将所述训练用特征参数输入到一个数学模型中进行训练。
11.根据权利要求10所述的训练系统,所述特征参数的种类包括以下种类中的至少一种:供应相关参数、需求相关参数、匹配相关参数、交通状况相关参数、位置相关参数、天气相关参数、或时间相关参数。
12.根据权利要求11所述的训练系统,其特征在于,每种特征参数种类下进一步至少包括以下一种时间属性的特征参数:长期特征或短期特征。
13.一种地理区域内网约车供需缺口预测装置,包括:
至少一个处理器,以及
可执行指令,所述指令被至少一个处理器执行时,导致所述至少一个处理器实现如权利要求1~3任意一项所述的方法。
14.一种地理区域内网约车供需缺口预测模型训练装置,包括:
至少一个处理器,以及
可执行指令,所述指令被至少一个处理器执行时,导致所述至少一个处理器实现如权利要求4~6任意一项所述的方法。
15.一种计算机可读存储介质,其特征在于,包括可执行指令,所述指令被至少一个处理器执行时,导致所述至少一个处理器实现如权利要求1~3任意一项所述的方法。
16.一种计算机可读存储介质,其特征在于,包括可执行指令,所述指令被至少一个处理器执行时,导致所述至少一个处理器实现如权利要求4~6任意一项所述的方法。
CN201711397967.8A 2017-12-21 2017-12-21 一种地理区域内网约车供需缺口预测方法 Active CN109948822B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711397967.8A CN109948822B (zh) 2017-12-21 2017-12-21 一种地理区域内网约车供需缺口预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711397967.8A CN109948822B (zh) 2017-12-21 2017-12-21 一种地理区域内网约车供需缺口预测方法

Publications (2)

Publication Number Publication Date
CN109948822A CN109948822A (zh) 2019-06-28
CN109948822B true CN109948822B (zh) 2022-10-21

Family

ID=67006075

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711397967.8A Active CN109948822B (zh) 2017-12-21 2017-12-21 一种地理区域内网约车供需缺口预测方法

Country Status (1)

Country Link
CN (1) CN109948822B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111833088A (zh) * 2019-09-17 2020-10-27 北京嘀嘀无限科技发展有限公司 一种供需预测方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103854472A (zh) * 2012-12-05 2014-06-11 深圳先进技术研究院 出租车云智能调度方法及系统
CN105118013A (zh) * 2015-07-29 2015-12-02 北京嘀嘀无限科技发展有限公司 一种订单的分配方法及装置
CN105139089A (zh) * 2015-08-20 2015-12-09 北京嘀嘀无限科技发展有限公司 一种平衡出行供需的方法及设备
CN106127329A (zh) * 2016-06-16 2016-11-16 北京航空航天大学 订单预测方法与装置
CN107103383A (zh) * 2017-03-28 2017-08-29 大连理工大学 一种基于打车热点的动态拼车调度方法
CN107392389A (zh) * 2017-08-03 2017-11-24 重庆大学 基于arima模型的出租车调度处理方法
CN107491827A (zh) * 2016-06-13 2017-12-19 滴滴(中国)科技有限公司 一种车辆资源调度处理方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103854472A (zh) * 2012-12-05 2014-06-11 深圳先进技术研究院 出租车云智能调度方法及系统
CN105118013A (zh) * 2015-07-29 2015-12-02 北京嘀嘀无限科技发展有限公司 一种订单的分配方法及装置
CN105139089A (zh) * 2015-08-20 2015-12-09 北京嘀嘀无限科技发展有限公司 一种平衡出行供需的方法及设备
CN107491827A (zh) * 2016-06-13 2017-12-19 滴滴(中国)科技有限公司 一种车辆资源调度处理方法及系统
CN106127329A (zh) * 2016-06-16 2016-11-16 北京航空航天大学 订单预测方法与装置
CN107103383A (zh) * 2017-03-28 2017-08-29 大连理工大学 一种基于打车热点的动态拼车调度方法
CN107392389A (zh) * 2017-08-03 2017-11-24 重庆大学 基于arima模型的出租车调度处理方法

Also Published As

Publication number Publication date
CN109948822A (zh) 2019-06-28

Similar Documents

Publication Publication Date Title
TWI670677B (zh) 用於推薦預估到達時間的系統和方法
CN109478364B (zh) 确定预计到达时间的方法及系统
JP6677802B2 (ja) 到着時間を推定するための方法およびシステム
CN109155104B (zh) 推荐估计到达时间的系统和方法
US20200050938A1 (en) Systems and methods for improvement of index prediction and model building
AU2020239623B2 (en) Systems and methods for determining an estimated time of arrival
CN110537212B (zh) 确定预估到达时间的系统与方法
CN110520913B (zh) 确定预估到达时间的系统和方法
CN111862585B (zh) 用于交通预测的系统和方法
CN108713326B (zh) 分配按需服务请求的系统及方法
JP7047096B2 (ja) オンラインツーオフラインサービスに関する推定された到着時間を決定するためのシステムおよび方法
JP2018533778A (ja) 共有可能な注文を割り当てるためのシステムおよび方法
JP6780029B2 (ja) 経路計画のためのシステム及び方法
CN112154473A (zh) 用于推荐上车点的系统和方法
WO2020019237A1 (en) Systems and methods for dispatching service providers
CN110689719B (zh) 用于识别封闭路段的系统和方法
CN109948822B (zh) 一种地理区域内网约车供需缺口预测方法
CN111223293B (zh) 分析交通拥堵的系统和方法
WO2022126354A1 (en) Systems and methods for obtaining estimated time of arrival in online to offline services
CN113924460A (zh) 确定服务请求的推荐信息的系统和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant