CN111984880A - 一种历史订单中真实上车点挖掘的方法和系统 - Google Patents
一种历史订单中真实上车点挖掘的方法和系统 Download PDFInfo
- Publication number
- CN111984880A CN111984880A CN202010842118.4A CN202010842118A CN111984880A CN 111984880 A CN111984880 A CN 111984880A CN 202010842118 A CN202010842118 A CN 202010842118A CN 111984880 A CN111984880 A CN 111984880A
- Authority
- CN
- China
- Prior art keywords
- point
- points
- time
- driver
- historical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000005065 mining Methods 0.000 title claims description 25
- 238000010801 machine learning Methods 0.000 claims abstract description 31
- 238000012549 training Methods 0.000 claims description 23
- 238000012545 processing Methods 0.000 description 10
- 230000003190 augmentative effect Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- 238000009412 basement excavation Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 235000012054 meals Nutrition 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0633—Lists, e.g. purchase orders, compilation or processing
- G06Q30/0635—Processing of requisition or of purchase orders
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Traffic Control Systems (AREA)
Abstract
本公开的实施例提供一种挖掘真实上车点的方法,该方法包括:获取历史行驶轨迹;基于历史行驶轨迹,确定一个或多个停留点;获取与停留点相关的特征信息;特征信息至少反映停留点的地理位置信息;基于特征信息和机器学习模型,从一个或多个停留点中确定真实上车点。
Description
技术领域
本公开的实施例涉及网约车领域,特别涉及一种挖掘历史订单中的真实上车点的方法及系统。
背景技术
网约车平台在接到用户订单时会为用户推荐最佳上车点,推荐上车点的点位是基于历史订单中真实上车点得到的。目前,通常基于下订单后的司乘历史轨迹,分别获得司机的停留点和乘客的停留点,然后利用一定的规则基于停留点得到真实上车点。对于采用规则获取的真实上车点,一般为人工随机抽取100单,通过一定的策略核实获取的真实上车点是否正确。由于人工核实会掺杂有大量的主观因素,且耗费大量的时间和人力成本,使得真实上车点的确定存在准确率不足的问题。因此,有必要提供一种准确率和效率高的真实上车点的挖掘方法。
发明内容
本公开的实施例中的一个方面提供一种挖掘真实上车点的方法,所述方法包括:获取历史行驶轨迹;基于所述历史行驶轨迹,确定一个或多个停留点;获取与所述停留点相关的特征信息;所述特征信息至少反映所述停留点的地理位置信息;基于所述特征信息和机器学习模型,从所述一个或多个停留点中确定真实上车点。
本公开的实施例中的另一个方面提供一种挖掘真实上车点的系统,所述系统包括:历史轨迹获取模块,用于获取历史行驶轨迹;停留点确定模块,用于基于所述历史行驶轨迹,确定一个或多个停留点;特征信息获取模块,用于获取与所述停留点相关的特征信息;所述特征信息至少反映所述停留点的地理位置信息;真实上车点确定模块,用于基于所述特征信息和机器学习模型,从所述一个或多个停留点中确定真实上车点。
本公开的实施例中的另一方面提供一种真实上车点的装置,所述装置包括至少一个处理器以及至少一个存储器;所述至少一个存储器用于存储计算机指令;所述计算机指令被所述至少一个处理器执行时,导致所述装置实现本公开中任一实施例所述真实上车点挖掘方法对应的操作。
本公开的实施例中的另一方面提供一种计算机可读存储介质,其特征在于所述存储介质存储计算机指令,当计算机读取存储介质中的计算机指令后,计算机运行本公开中任一实施例所述真实上车点挖掘方法。
附图说明
本公开将以示例性实施例的方式进一步说明,这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的,在这些实施例中,相同的编号表示相同的结构,其中:
图1是根据本申请的一些实施例所示的挖掘真实上车点的系统的应用场景示意图;
图2是根据本申请的一些实施例所示的挖掘真实上车点的系统模块图;
图3是根据本申请的一些实施例所示的挖掘真实上车点的方法的示例性流程图;
图4是根据本申请的一些实施例所示的确定停留点的示例性流程图。
具体实施方式
为了更清楚地说明本公开实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本公开的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本公开应用于其它类似情景。除非从语言环境中显而易见或另做说明,图中相同标号代表相同结构或操作。
应当理解,本文使用的“系统”、“装置”、“单元”和/或“模组”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换所述词语。
如本公开和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。
本公开中使用了流程图用来说明根据本公开的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
本公开的实施例中所提供的一种历史订单中真实上车点挖掘的方法和系统可以应用于互联网服务的线上服务平台,涵盖了众多领域。例如,可以是运输服务的线上运输服务平台。在一些实施例中,挖掘真实上车点系统可以应用于网约车服务,例如出租车呼叫、快车呼叫、专车呼叫、小巴呼叫、拼车、公交服务、司机雇佣和接送服务等。在一些实施例中,挖掘真实上车点系统还可以应用于代驾服务、快递、外卖等。例如,为代驾服务的司机提供真实上车点,为快递服务提供真实停车点,为外卖服务提供真实上车点(取餐)或真实停车点(送餐)等。在一些替代性实施例中,挖掘真实上车点系统还可以应用于游戏服务、出行(如旅游)服务、教育(如在线教育)服务等领域。
在一些实施例中,得到真实上车点的方法需要获取司机轨迹和乘客轨迹产生交集的时间窗口,在该时间窗口内,从乘客的停留点和司机的停留点中取某一个点,如果该点到司乘双方其他停留点的距离最小,则该停留点即为真实上车点;对于采用规则获取的真实上车点,人工随机抽取100单,通过一定的策略核实获取的真实上车点是否正确,需要耗费大量人力物力。
在一些实施例中,还可以使用预设算法在历史行驶轨迹中确定若干停留点,并通过机器学习模型在若干停留点中挖掘真实上车点。从而将真实上车点(真实上车点为停留点子集)挖掘问题建模为机器学习问题,从而节省了时间,提高了效率。
图1是根据本申请的一些实施例所示的挖掘真实上车点的系统的应用场景示意图。
如图1所示。在一些实施例中,在一些实施例中,挖掘真实上车点系统100可以包括服务器110、网络120、用户终端130(例如用户终端130-1、130-2......和/或130-n)以及数据库140。在一些实施例中,服务器110可以包括处理设备112。
在一些实施例中,服务器110可以用于处理与真实上车点相关的信息和/或数据。服务器110可以是独立的服务器或者服务器组。该服务器组可以是集中式的或者分布式的(如:服务器110可以是分布系统)。在一些实施例中该服务器110可以是区域的或者远程的,服务器110可通过网络120访问存储于用户终端130、数据库140中的信息和/或资料。例如,服务器110可以通过网络访问数据库140中历史订单,进而获取对应的司乘双方的历史行驶轨迹。例如,服务器110还可以获取数据库140中与所述停留点相关的特征信息。在一些实施例中,服务器110可直接与用户终端130、数据库140连接以访问存储于其中的信息和/或资料。在一些实施例中,服务器110可在云平台上执行。例如,该云平台可包括私有云、公共云、混合云、社区云、分散式云、内部云等中的一种或其任意组合。
在一些实施例中,服务器110可包含处理设备112。该处理设备112可处理与服务请求有关的数据和/或信息,以执行一个或多个本公开的实施例中中描述的功能。例如处理设备112可以接收用户终端130发送的用车请求信号,向用户提供推荐上车点。在一些实施例中,处理设备112可包含一个或多个子处理设备(如:单芯处理设备或多核多芯处理设备)。
在一些实施例中,网络120可促进数据和/或信息的交换。在一些实施例中,挖掘真实上车点系统100中的一个或多个组件(如:服务器110、用户终端130、存储设备140)可通过网络120发送数据和/或信息给挖掘真实上车点系统100中的其他组件。例如,历史订单日志以及用户的操作日志可以通过网络120储存在数据库140中。在一些实施例中,网络120可是任意类型的有线或无线网络。例如,网络120可包括一缆线网络、有线网络、光纤网络、电信网络、内部网络、网际网络、区域网络(LAN)、广域网络(WAN)、无线区域网络(WLAN)、都会区域网络(MAN)、公共电话交换网络(PSTN)、蓝芽网络、ZigBee网络、近场通讯(NFC)网络等或以上任意组合。在一些实施例中,网络120可包括一个或多个网络进出点。例如,网络120可包含有线或无线网络进出点,如基站和/或网际网络交换点120-1、120-2、…,通过这些进出点,挖掘真实上车点系统100的一个或多个组件可连接到网络120上以交换数据和/或信息。
在一些实施例中,用户可以通过用户终端(客户端)130获取推荐上车点,司机可以通过用户终端(司机端)130获取推荐停车点。在一些实施例中,用户终端130可包括移动装置130-1、平板电脑130-2、膝上型电脑130-3、机动车内建装置130-4等中的一种或其任意组合。在一些实施例中,移动装置130-1可包括智能家居装置、可穿戴装置、智能行动装置、虚拟实境装置、增强实境装置等或其任意组合。在一些实施例中,智能家具装置可包括智能照明装置、智能电器的控制装置、智能监测装置、智能电视、智能摄像机、对讲机等或其任意组合。在一些实施例中,可穿戴装置可包括智能手环、智能鞋袜、智能眼镜、智能头盔、智能手表、智能衣物、智能背包、智能配饰等或其任意组合。在一些实施例中,智能行动装置可包括智能电话、个人数位助理(PDA)、游戏装置、导航装置、POS装置等或其任意组合。在一些实施例中,虚拟实境装置和/或增强实境装置可包括虚拟实境头盔、虚拟实境眼镜、虚拟实境眼罩、增强实境头盔、增强实境眼镜、增强实境眼罩等或上述举例的任意组合。在一些实施例中,用户终端130可包括具有定位功能的装置,以确定用户和/或用户终端130的位置。
在一些实施例中,数据库140可存储资料和/或指令。在一些实施例中,数据库140可存储从用户终端130获取的资料。例如,数据库140可以存储从用户终端130上获取的用户对推荐上车点的反馈信息。例如,数据库140可以存储从服务器110获取的若干个停留点信息。再例如,数据库140还可以存储从服务器110获取的基于机器学习模型确定的真实上车点,并把其作为较优的推荐上车点进行存储。在一些实施例中,数据库140可存储供服务器110执行或使用的信息和/或指令,以执行本公开的实施例中中描述的示例性方法。在一些实施例中,数据库140可包括大容量存储器、可移动存储器、挥发性读写存储器(例如随机存取存储器RAM)、只读存储器(ROM)等或以上任意组合。在一些实施例中,数据库140可在云平台上实现。例如,该云平台可包括私有云、公共云、混合云、社区云、社区云、分散式云、内部云等或以上任意组合。
在一些实施例中,数据库140可与网络120连接以与挖掘真实上车点系统100的一个或多个部件(如服务器110、用户终端130等)通讯。挖掘真实上车点系统100的一个或多个组件可通过网络120访问存储于数据库140中的资料或指令。在一些实施例中,数据库140可直接与挖掘真实上车点系统100中的一个或多个组件(如服务器110、用户终端130等)连接或通讯。在一些实施例中,数据库140可以是服务器110的一部分。
图2是根据本申请的一些实施例所示的挖掘真实上车点的系统模块图。
如图2所示,在一些实施例中,该挖掘真实上车点系统200可以包括历史轨迹获取模块210、停留点确定模块220、特征信息获取模块230和真实上车点确定模块240。
在一些实施例中,历史轨迹获取模块210用于获取历史行驶轨迹。在一些实施例中,历史行驶轨迹至少包括在执行历史订单过程中司机的历史行驶轨迹和/或乘客的历史行驶轨迹。
在一些实施例中,历史轨迹至少可以包括处于司乘汇合时间窗内的司机的历史行驶轨迹和/或乘客的历史行驶轨迹。其中,司乘汇合时间窗至少包括司机接到乘客的时间点。
在一些实施例中,停留点确定模块220用于基于所述历史行驶轨迹,确定一个或多个停留点。在一些实施例中,停留点确定模块220还用于在所述历史行驶轨迹中,选取在所述司乘汇合时间窗内空间密度大于密度阈值的轨迹点作为第一组停留点。
在一些实施例中,停留点确定模块220还用于基于所述第一组停留点中某停留点的出现时间以及时间阈值,确定第一时间和第二时间,所述第二时间与第一时间的时间差小于所述时间阈值;在第一组停留点中,选取在第一时间和第二时间之间出现的历史行驶轨迹停留点选取为第二组停留点。
在一些实施例中,特征信息获取模块230用于获取与停留点相关的特征信息,其中,特征信息至少反映停留点的地理位置信息。
在一些实施例中,真实上车点确定模块240用于基于特征信息和机器学习模型,从一个或多个停留点中确定真实上车点。在一些实施例中,真实上车点确定模块240可以通过机器学习模型确定一个或多个停留点作为真实上车点的概率值;基于概率值确定真实上车点。
在一些实施例中,挖掘真实上车点的系统200还可以包括训练模块,所述训练模块用于:获取训练样本集;训练样本集包括一组或多组停留点以及用户对推荐上车点的反馈信息;确定与停留点相关的特征信息,作为输入数据;基于反馈信息确定停留点的标记信息,作为参考标准;利用输入数据及其对应的参考标准训练初始机器学习模型;获得训练好的机器学习模型。
应当理解,图2所示的系统及其模块可以利用各种方式来实现。例如,在一些实施例中,系统及其模块可以通过硬件、软件或者软件和硬件的结合来实现。其中,硬件部分可以利用专用逻辑来实现;软件部分则可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域技术人员可以理解上述的方法和系统可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本公开的实施例中的系统及其模块不仅可以有诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用例如由各种类型的处理器所执行的软件实现,还可以由上述硬件电路和软件的结合(例如,固件)来实现。
需要注意的是,以上对于候选项显示、确定系统及其模块的描述,仅为描述方便,并不能把本公开限制在所举实施例范围之内。可以理解,对于本领域的技术人员来说,在了解该系统的原理后,可能在不背离这一原理的情况下,对各个模块进行任意组合,或者构成子系统与其他模块连接。例如,在一些实施例中,例如,图2中披露的第一确定模块和第二确定模块可以是一个系统中的不同模块,也可以是一个模块实现上述的两个或两个以上模块的功能。例如,各个模块可以共用一个存储模块,各个模块也可以分别具有各自的存储模块。诸如此类的变形,均在本公开的保护范围之内。
图3是根据本申请的一些实施例所示的挖掘真实上车点的方法的示例性流程图。
如图3所示,挖掘真实上车点的方法可以包括如下步骤:
步骤310、获取历史行驶轨迹。在一些实施例中,步骤310可以由历史轨迹获取模块210执行。
在一些实施例中,历史行驶轨迹可以指乘客的历史轨迹或者司机驾驶的交通工具沿道路行动的历史轨迹。在一些实施例中,历史轨迹不一定正好在道路上,也可能在道路附近,例如乘客可以在室内,或者在室外的非道路部分。历史轨迹可以是多个轨迹点的集合。在一些实施例中,历史轨迹点可以由用户终端130和/或交通工具沿道路行动的历史GPS位置数据组成,所述位置数据包括但不限于图片、文字等。在一些实施例中,历史行驶轨迹可以是图片,用于将行驶路线实时显示在用户终端130界面。在一些实施例中,历史行驶轨迹可以是文字,用于书面提醒用户行驶路线。在一些实施例中,历史行驶轨迹可以通过在用户终端130和/或交通工具安装的GPS信息采集装置采集并储存在至数据库140和/或用户终端130。
在一些实施例中,用户可以是指发起和/或接收服务请求的用户。例如,目标用户可以是司机、乘客等。在一些实施例中,服务请求是需要使用服务的用户所提交的对服务的需求。例如,可以是用户下单使用在线打车服务,也可以是用户启动在线打车的下单过程。
在一些实施例中,历史行驶轨迹至少包括在执行历史订单过程中司机的历史行驶轨迹和/或乘客的历史行驶轨迹。其中,历史订单是指已经发生过的订单,历史订单涉及的历史用户也可以不限于当前的用户。在一些实施例中,历史订单可以包括历史用户的订单号、手机号、定位点信息、上车/停车点信息等。在一些实施例中,上车/停车点信息可以包括历史用户在上车/停车时对应的位置信息。定位点信息可以包括目标用户发起服务请求时的地理位置信息。在一些实施例中,地理位置信息可以包括经纬度、所在区域等。
在一些实施例中,历史轨迹获取模块210可以访问储存于数据库140和用户终端130中的数据以获取至少包括司机的历史行驶轨迹和/或乘客的历史行驶轨迹。在一些实施例中,历史轨迹获取模块210可以包括第一历史轨迹获取模块和第二历史轨迹获取模块。第一历史轨迹获取模块可以用于访问储存于数据库140中的数据以获取司机的历史行驶轨迹,第二历史轨迹获取模块可以用于访问储存于用户终端130中的数据以获取乘客的历史行驶轨迹。
在一些实施例中,历史行驶轨迹至少可以包括处于司乘汇合时间窗内的司机的历史行驶轨迹和/或乘客的历史行驶轨迹。在一些实施例中,司乘汇合时间窗用于表示司机和乘客在这个时间窗内可能已经汇合,对应地,司乘汇合时间窗至少包括司机接到乘客的时间点。司乘汇合时间窗的计算方式有很多种,在一些实施例中,司乘汇合时间窗可以是始于乘客发出服务请求(即下单)并由司机接收服务请求(即接单),终于司机接到乘客滑动app确定乘客已上车。此外,在一些实施例中,由于存在司机在接到乘客之前滑动app的情况,该情况会对历史轨迹获取模块210获取历史行驶轨迹造成一定影响。因此,在一些实施例中,司乘汇合时间窗的截止时间可以有一定的延后。例如,在司机滑动app后延后30秒、延后1分钟等。
在一些实施例中,也可以先判断司机接到乘客的时间点,然后以这个时间点为中心向前或向后偏差一定时间范围来确定司乘汇合时间窗。例如,判断司机接到乘客的时间点为13:00,则可以向前5分钟,向后3分钟,最终确定司乘汇合时间窗为12:55~13:03。在一些实施例中,司机接到乘客的时间点可以通过司机滑动app确定乘客已上车来确定。在一些实施例中,司机接到乘客的时间点也可以通过GPS对司机和乘客的地理位置信息来确定。例如,司机和乘客的地理位置之间的距离首次小于预设阈值(例如,1米)时,则判断司机已经接到乘客,即对应的时间点判断为司机接到乘客的时间点。
步骤320,基于所述历史行驶轨迹,确定一个或多个停留点。在一些实施例中,该步骤可以由停留点确定模块220执行。
在一些实施例中,停留点可以是用户在执行历史订单过程中司机和/或乘客作一定时间停留的轨迹点。例如,司机接单并到达推荐上车点等待乘客上车的轨迹点,或乘客下单并到达推荐上车点等待司机停车的轨迹点。
在一些实施例中,可以根据步骤310中获取的司乘汇合时间窗内的轨迹点,并基于一定规则来确定一个或多个停留点。
在一些实施例中,基于一定规则确定一个或多个停留点可以包括:选取历史行驶轨迹中在司乘汇合时间窗内空间密度大于密度阈值的轨迹点作为第一组停留点。在一些实施例中,空间密度可以是指轨迹点在空间上的分布密度或密集程度。在一些实施例中,在一定地理区域范围内,轨迹点的数量越多,则空间密度越大。在一些实施例中,当司乘汇合时间窗内轨迹点的空间密度大于密度阈值时,可以说明司机和/或乘客在这些轨迹点停留或有停留的倾向,因此可以将其作为第一组停留点。其中,密度阈值可以依据历史订单中,司乘汇合时间窗内轨迹点密度阈值的中位数设定,例如5个、10个等。
为了确定第一组停留点,在一些实施例中,可以预先设定一个预设区域,该预设区域可以是与历史行驶轨迹点处于同一地图显示中的区域,并至少包含一部分轨迹点。预设区域可以是任意形状,例如,圆形、方形等。
在一些实施例中,可以在地图设定预设区域(例如设定一个圆作为预设区域),确定处于司乘汇合时间窗内的司乘双方在该圆内的轨迹点的数量,并将在该圆内的轨迹点的数量与密度阈值进行比较。如果在该圆内的轨迹点的数量大于密度阈值,则判断处于该圆内的历史轨迹点密集,并选取该圆内的轨迹点作为第一组停留点。在一些实施例中,预设区域的范围可以根据比较的结果进行调整。
在另一些实施例中,也可以基于轨迹点的密集度来确定第一组停留点。在一些实施例中,轨迹点的密集度可以用一个轨迹点群两两轨迹点的间隔距离间的最大值来度量。例如,可以获取的司乘汇合时间窗内的轨迹点,将这些轨迹点随机划分成若干轨迹点群,进而可以将密集度小于距离阈值的轨迹点群作为第一组停留点。在一些实施例中,间隔距离可以是相邻两个轨迹点的实际距离。实际距离可以指相邻两个轨迹点在实际行驶的道路上间隔的距离。距离阈值可以根据实际情况设定。在一些实施例中,司机的轨迹点对应的距离阈值可以大于乘客的轨迹点对应的距离阈值。例如,司机的轨迹点对应的距离阈值为2m,乘客的轨迹点对应的距离阈值为1m。
在一些实施例中,第一组停留点的选取也可以基于上述预选停留点进行,即在上述预选停留点中选取空间密度大于密度阈值的点作为第一组停留点。需要说明的是,前述实施例中的历史轨迹可以相当于历史行驶轨迹。
在一些实施例中,基于一定规则确定一个或多个停留点还可以包括:当停留点确定模块220确定的第一组停留点过多时,为了提高停留点的准确性,需要对第一组停留点继续进行筛选。在一些实施例中,可以从时间维度进行进一步筛选。
在一些实施例中,停留点确定模块220可以基于所述第一组停留点中某停留点的出现时间以及预设的时间阈值,确定第一时间和第二时间,所述第二时间与第一时间的时间差小于所述时间阈值;在第一组停留点中将在第一时间和第二时间之间出现的历史行驶轨迹停留点选取为第二组停留点。
第一时间可以是指用于筛选第一组停留点的开始时间。在一些实施例中,第一时间可以由停留点确定模块220中的第一时间确定模块确定。第二时间可以是指用于筛选第一组停留点的截止时间。在一些实施例中,第二时间可以由停留点确定模块220中的第二时间确定模块确定。某停留点的出现时间可以是第一时间至第二时间之间的某一时刻。在一些实施例中,某停留点的出现时间可以由停留点确定模块220中的出现时间确定模块确定。在一些实施例中,时间阈值由第一时间确定模块和第二时间确定模块共同确定。其中,第二时间与第一时间的时间差可以小于时间阈值。例如,第二时间与第一时间的时间差小于3min。例如,出现时间确定模块确定某停留点出现时间为1:30,第一时间确定模块确定第一时间为1:29,第二时间确定模块确定第二时间为1:32,则停留点确定模块220选取第一组停留点中处于1:29~1:30之间的停留点作为第二组停留点。
步骤330、获取与所述停留点相关的特征信息。在一些实施例中,该步骤可以由特征信息获取模块230执行。
在一些实施例中,与停留点相关的特征信息至少可以反映停留点的地理位置信息,包括但不限于:地理坐标(例如经纬度坐标)、停留点确定模块220设定的预设区域的范围、预设区域内的第一个点和最后一个点之间的时间差以及密集度等。在一些实施例中,特征信息可以是语音、图像、文字等。
在一些实施例中,与停留点相关的特征信息可以通过机器自动处理获取。具体的,特征信息获取模块230可以通过访问储存在用户终端130和/或数据库140中的历史订单,并通过机器自动处理历史订单数据以提取特征信息。机器自动处理可以是基于某些算法对历史订单数据进行处理。
在一些实施例中,与停留点相关的特征信息也可以通过人工处理获取。具体的,特征信息获取模块230可以通过访问储存在用户终端130和/或数据库140中的历史订单数据,再将历史订单通过人工进行筛选,提取出与停留点相关的特征信息。
步骤340、基于所述特征信息和机器学习模型,从所述一个或多个停留点中确定真实上车点。在一些实施例中,该步骤可以由真实上车点确定模块240执行。
在一些实施例中,真实上车点可以是指乘客实际的上车点和/或者司机实际的停车点。在一些实施例中,可以通过机器学习模型对上述停留点的特征信息进行处理,从一个或多个停留点中确定真实上车点。
在一些实施例中,可以基于机器学习模型对特征信息进行处理,得到一个或多个停留点的概率值,基于概率值确定真实上车点。其中,概率值可以是指在步骤320获取的一个或多个停留点被选取作为真实上车点的概率。
在一些实施例中,真实上车点确定模块240可以将一个或多个真实上车点的概率值进行由大到小排序,选取排序中的top 1-top n作为真实上车点。其中,n是指需要获取的真实上车点数量,例如,n=3。在一些实施例中,也可以选取排序中的top 1作为真实上车点。在另一些实施例中,真实上车点确定模块240还可以直接选取概率值最高的停留点作为真实上车点,而不用进行排序。
具体的,将停留点对应的特征信息输入到训练好的机器学习模型中,机器学习模型可以输出前文中选取的一个或多个停留点能够作为真实上车点的概率值。在一些实施例中,输入机器学习模型的停留点信息可以是前文所述的预选停留点信息;也可以是第一组停留点信息;也可以是第二组停留点信息。在一些实施例中,机器学习模型可以包括GBDT模型、多层神经网络模型。
在一些实施例中,机器学习模型的获取方法可以由训练模块执行,包括如下步骤:
(一)获取训练样本集,其中,训练样本集包括停留点以及用户对推荐上车点的反馈信息。
在一些实施例中,反馈信息可以理解为用户对推荐上车点的满意度,在一些实施例中,所述反馈信息可以通过用户的操作日志直接或间接获取。其中,操作日志是指用户在订单执行期间的操作,包括但不限于是否与司机通话及通话内容(比如,确认上车点、与司机协商修改上车位置)、用户发出服务请求前是否修改上车点及修改后的上车点等。具体的,训练模块可以通过访问储存在用户终端130和/或数据库140中的历史订单数据提取反馈信息。在一些实施例中,可以通过人工处理从历史订单数据提取反馈信息,也可以通过机器自动处理从历史订单数据提取反馈信息。例如,可以是人工查阅历史订单,将其中涉及推荐上车点的操作日志记录并作为反馈信息;也可以是机器基于人为制定的规则,自动记录历史订单中涉及推荐上车点的操作日志。对于停留点的相关介绍可以在本公开的一个或多个实施例中找到,此处将不再赘述。
(二)确定与停留点相关的特征信息,作为输入数据。在一些实施例中,训练模块可以通过访问用户终端130和/或数据库140中的历史订单数据获取与所述停留点相关的特征信息。关于特征信息的介绍在本公开的一个或多个实施例中可以找到,此处不再赘述。
(三)基于反馈信息确定停留点的标记信息,作为参考标准。作为参考标准的标记信息一并输入到机器学习模型中。在一些实施例中,训练模块可以基于机器学习的标记技术,例如,基于聚类对一个或多个停留点进行标记。在一些实施例中,训练模块可以手动标记一个或多个停留点作为参考标准。在一些实施例中,标记信息可以包括将作为真实上车点的停留点标记标签“1”,以及将未作为真实上车点的停留点标记标签“0”。
(四)利用输入数据及其对应的参考标准训练初始机器学习模型。将一个或多个停留点对应的特征信息及其对应的参考标准输入到初始机器学习模型中进行训练,训练的目的在于确定模型的参数。在一些实施例中,训练的方法可以包括但不限于交替最小二乘法(alternating least square,ALS)、随机梯度下降法(SGD)或者有限记忆BFGS(Broyden,Fletcher,Goldfarb和Shanno)等。
在本公开的另一些实施例中,提供了一种挖掘真实上车点的装置,包括至少一个处理器以及至少一个存储器;所述至少一个存储器用于存储计算机指令,所述至少一个处理器用于执行所述计算机指令中的至少部分指令以实现如上所述的挖掘真实上车点的方法。
在本公开的又一些实施例中,提供了一种用于挖掘真实上车点的计算机可读存储介质,所述存储介质存储计算机指令,当所述计算机指令被处理器执行时实现如上所述的推荐上车点方法。
参见图4所示,图4是根据本申请的一些实施例所示的确定停留点的示例性流程图。在一些实施例中,确定停留点的步骤可以包括获取历史行驶轨迹,并基于一定规则确定一个或多个停留点,其中,获取历史行驶轨迹可以由历史轨迹获取模块210执行,基于一定规则确定一个或多个停留点可以由停留点确定模块220执行。
具体的,历史轨迹获取模块210获取司机和乘客的历史行驶轨迹点后,停留点确定模块220首先对司乘轨迹点进行第一次判断,即判断司乘轨迹点的停留时间是否超过司乘汇合时间窗,所述司乘轨迹点指的是司机或乘客的历史行驶轨迹点,若司乘轨迹点不在上述司乘汇合时间窗内,则判断结果为“否”,则该司乘轨迹点不是停留点,若司乘轨迹点在上述司乘汇合时间窗内,则判断结果为“是”,再对司乘轨迹点进行第二次判断。
进一步地,第二次判断可以是判断司乘轨迹点的空间分布是否密集,若司机或乘客的轨迹点的空间密度小于密度阈值,则判断结果为“否”,则该司乘轨迹点不是停留点,若司机或乘客的轨迹点的空间密度大于密度阈值,判断结果为“是”,并把其作为第一组停留点。在一些实施例中,可以对第一组停留点进行进一步筛选判断,即再对司乘轨迹点进行第三次判断;也可以直接把所述第一组停留点作为最终的停留点,对其进行真实上车点的挖掘。
在一些实施例中,第三次判断可以是判断司乘轨迹点的时间分布是否密集,若司机或乘客的行驶轨迹点中对应的时间差大于预设的时间阈值,则判断结果为“否”,则该司乘轨迹点不是停留点,若司机或乘客的形式轨迹点中对应的时间差小于预设的时间阈值,则判断结果为“是”,则该轨迹点是停留点。其中,司机或乘客的行驶轨迹点中对应的时间差可以理解为:在司机或乘客的行驶轨迹点对应的各个时间中,最大时间值和最小时间值的差值。
图4中揭示的实施例仅作为示例性参考,不应当给本公开的一个或多个实施例带来任何限定。在一些实施例中,上述三个判断步骤的先后顺序可以打乱,也可以仅选择其中的一个或部分判断步骤来选取停留点。例如,在一些实施例中,可以先判断“是否超过司乘汇合时间窗”,然后判断“司乘轨迹点的时间分布是否密集”;最后判断“司乘轨迹点的空间分布是否密集”;在一些实施例中,判断“是否超过司乘汇合时间窗”以及“司乘轨迹点的空间分布是否密集”后的判断结果可以直接作为停留点的选取结果。
本公开实施例可能带来的有益效果包括但不限于:(1)基于用户行为能够对停留点进行动态打分,将真实上车点(真实上车点为停留点子集)挖掘问题建模为机器学习问题,从而提高获得的真实上车点的准确率,进而提高上车点推荐的准确率和有效性(2)本公开基于机器学习模型筛选真实上车点,节省了人工核实真实上车点准确性的时间。
需要说明的是,不同实施例可能产生的有益效果不同,在不同的实施例里,可能产生的有益效果可以是以上任意一种或几种的组合,也可以是其他任何可能获得的有益效果。
应当理解,图1所示的模块可以利用各种方式来实现。例如,在一些实施例中,系统及其模块可以通过硬件、软件或者软件和硬件的结合来实现。其中,硬件部分可以利用专用逻辑来实现;软件部分则可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域技术人员可以理解上述的方法和系统可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本公开的系统及其模块不仅可以有诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用例如由各种类型的处理器所执行的软件实现,还可以由上述硬件电路和软件的结合(例如,固件)来实现。
Claims (16)
1.一种挖掘真实上车点的方法,其特征在于,所述方法包括:
获取历史行驶轨迹;
基于所述历史行驶轨迹,确定一个或多个停留点;
获取与所述停留点相关的特征信息;所述特征信息至少反映所述停留点的地理位置信息;
基于所述特征信息和机器学习模型,从所述一个或多个停留点中确定真实上车点。
2.根据权利要求1所述的方法,其特征在于,基于所述特征信息和机器学习模型,从所述一个或多个停留点中确定真实上车点包括:
确定所述一个或多个停留点的概率值;
基于所述概率值确定真实上车点。
3.根据权利要求1所述的方法,其特征在于,所述历史行驶轨迹至少包括在执行历史订单过程中司机的历史行驶轨迹和/或乘客的历史行驶轨迹。
4.根据权利要求3所述的方法,其特征在于,所述历史行驶轨迹至少包括处于司乘汇合时间窗内的司机的历史行驶轨迹和/或乘客的历史行驶轨迹;所述司乘汇合时间窗至少包括司机接到乘客的时间点。
5.根据权利要求1或4所述的方法,其特征在于,基于所述历史行驶轨迹,确定一个或多个停留点包括:
在所述历史行驶轨迹中,选取在所述司乘汇合时间窗内空间密度大于密度阈值的轨迹点作为第一组停留点。
6.根据权利要求5所述的方法,其特征在于,基于所述历史行驶轨迹,确定一个或多个停留点还包括:
基于所述第一组停留点中某停留点的出现时间以及时间阈值,确定第一时间和第二时间,所述第二时间与第一时间的时间差小于所述时间阈值;
在第一组停留点中,选取在第一时间和第二时间之间出现的停留点作为第二组停留点。
7.根据权利要求1所述的方法,其特征在于,所述机器学习模型基于以下训练方法得到:
获取训练样本集;所述训练样本集包括停留点以及用户对推荐上车点的反馈信息;
确定与所述停留点相关的特征信息,作为输入数据;
基于所述反馈信息确定所述停留点的标记信息,作为参考标准;
利用输入数据及其对应的参考标准训练初始机器学习模型;
获得训练好的机器学习模型。
8.一种挖掘真实上车点的系统,其特征在于,所述系统包括:
历史轨迹获取模块,用于获取历史行驶轨迹;
停留点确定模块,用于基于所述历史行驶轨迹,确定一个或多个停留点;
特征信息获取模块,用于获取与所述停留点相关的特征信息;所述特征信息至少反映所述停留点的地理位置信息;
真实上车点确定模块,用于基于所述特征信息和机器学习模型,从所述一个或多个停留点中确定真实上车点。
9.根据权利要求8所述的系统,其特征在于,所述真实上车点确定模块还用于确定所述一个或多个停留点的概率值;基于所述概率值确定真实上车点。
10.根据权利要求8所述的系统,其特征在于,所述历史行驶轨迹至少包括在执行历史订单过程中司机的历史行驶轨迹和/或乘客的历史行驶轨迹。
11.根据权利要求10所述的系统,其特征在于,所述历史行驶轨迹至少包括处于司乘汇合时间窗内的司机的历史行驶轨迹和/或乘客的历史行驶轨迹;所述司乘汇合时间窗至少包括司机接到乘客的时间点。
12.根据权利要求8或11所述的系统,其特征在于,所述停留点确定模块还用于:
在所述历史行驶轨迹中,选取在所述司乘汇合时间窗内空间密度大于密度阈值的轨迹点作为第一组停留点。
13.根据权利要求12所述的系统,其特征在于,所述停留点确定模块还用于:
基于所述第一组停留点中某停留点的出现时间以及时间阈值,确定第一时间和第二时间,所述第二时间与第一时间的时间差小于所述时间阈值;
在第一组停留点中,选取在第一时间和第二时间之间出现的停留点作为第二组停留点。
14.根据权利要求8所述的系统,其特征在于,所述系统还包括训练模块,所述训练模块用于:
获取训练样本集;所述训练样本集包括一个或多个停留点以及用户对推荐上车点的反馈信息;
确定与所述停留点相关的特征信息,作为输入数据;
基于所述反馈信息确定所述停留点的标记信息,作为参考标准;
利用输入数据及其对应的参考标准训练初始机器学习模型;
获得训练好的机器学习模型。
15.一种挖掘真实上车点的装置,其特征在于,所述装置包括至少一个处理器以及至少一个存储器;
所述至少一个存储器用于存储计算机指令;
所述至少一个处理器用于执行所述计算机指令中的至少部分指令以实现权利要求1~7中任意一项所述的操作。
16.一种计算机可存储介质,其特征在于,所述存储介质存储有计算机指令,当所述计算机指令中的至少部分指令被处理器执行时,实现权利要求1~7中任意一项所述的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010842118.4A CN111984880B (zh) | 2020-08-20 | 2020-08-20 | 一种历史订单中真实上车点挖掘的方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010842118.4A CN111984880B (zh) | 2020-08-20 | 2020-08-20 | 一种历史订单中真实上车点挖掘的方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111984880A true CN111984880A (zh) | 2020-11-24 |
CN111984880B CN111984880B (zh) | 2024-07-19 |
Family
ID=73442353
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010842118.4A Active CN111984880B (zh) | 2020-08-20 | 2020-08-20 | 一种历史订单中真实上车点挖掘的方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111984880B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112989222A (zh) * | 2021-03-04 | 2021-06-18 | 北京嘀嘀无限科技发展有限公司 | 一种位置确定方法、装置及电子设备 |
CN113052397A (zh) * | 2021-04-19 | 2021-06-29 | 北京百度网讯科技有限公司 | 上车信息的确定方法、装置、电子设备和存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150219464A1 (en) * | 2014-02-04 | 2015-08-06 | Here Global B.V. | Method and apparatus for providing passenger embarkation points for points of interests |
CN110210604A (zh) * | 2019-05-21 | 2019-09-06 | 北京邮电大学 | 一种终端设备移动轨迹预测方法及装置 |
CN110533081A (zh) * | 2019-08-07 | 2019-12-03 | 北京三快在线科技有限公司 | 一种确定上车点信息的方法、装置、设备及存储介质 |
CN110909096A (zh) * | 2019-10-31 | 2020-03-24 | 腾讯科技(深圳)有限公司 | 推荐上车点确定方法及装置、存储介质、电子设备 |
CN111192110A (zh) * | 2019-12-23 | 2020-05-22 | 南京领行科技股份有限公司 | 一种上车中心点的确定方法及装置 |
CN111507494A (zh) * | 2020-04-17 | 2020-08-07 | 北京嘀嘀无限科技发展有限公司 | 订单处理方法和系统、计算机可读存储介质 |
-
2020
- 2020-08-20 CN CN202010842118.4A patent/CN111984880B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150219464A1 (en) * | 2014-02-04 | 2015-08-06 | Here Global B.V. | Method and apparatus for providing passenger embarkation points for points of interests |
CN110210604A (zh) * | 2019-05-21 | 2019-09-06 | 北京邮电大学 | 一种终端设备移动轨迹预测方法及装置 |
CN110533081A (zh) * | 2019-08-07 | 2019-12-03 | 北京三快在线科技有限公司 | 一种确定上车点信息的方法、装置、设备及存储介质 |
CN110909096A (zh) * | 2019-10-31 | 2020-03-24 | 腾讯科技(深圳)有限公司 | 推荐上车点确定方法及装置、存储介质、电子设备 |
CN111192110A (zh) * | 2019-12-23 | 2020-05-22 | 南京领行科技股份有限公司 | 一种上车中心点的确定方法及装置 |
CN111507494A (zh) * | 2020-04-17 | 2020-08-07 | 北京嘀嘀无限科技发展有限公司 | 订单处理方法和系统、计算机可读存储介质 |
Non-Patent Citations (2)
Title |
---|
康军;张凡;段宗涛;黄山;: "基于LightGBM的乘客候车路段推荐方法", 测控技术, no. 02 * |
蔡小路;曹阳;董蒲;: "基于速度的轨迹停留点识别算法", 计算机系统应用, no. 04 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112989222A (zh) * | 2021-03-04 | 2021-06-18 | 北京嘀嘀无限科技发展有限公司 | 一种位置确定方法、装置及电子设备 |
CN112989222B (zh) * | 2021-03-04 | 2024-06-04 | 北京嘀嘀无限科技发展有限公司 | 一种位置确定方法、装置及电子设备 |
CN113052397A (zh) * | 2021-04-19 | 2021-06-29 | 北京百度网讯科技有限公司 | 上车信息的确定方法、装置、电子设备和存储介质 |
CN113052397B (zh) * | 2021-04-19 | 2024-04-09 | 北京百度网讯科技有限公司 | 上车信息的确定方法、装置、电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111984880B (zh) | 2024-07-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3318985B1 (en) | Driving route matching method and apparatus and storage medium | |
CN107247718B (zh) | 一种地图数据的更新方法和装置、导航系统及服务器 | |
CN110909096B (zh) | 推荐上车点确定方法及装置、存储介质、电子设备 | |
CN106092113B (zh) | 预行驶道路预估系统、方法、导航客户端及服务器 | |
CN105160880B (zh) | 一种车辆载客状态的预估方法及装置 | |
US6834252B2 (en) | Method of and apparatus for analyzing population distribution, and computer product | |
CN105144259B (zh) | 交通监察和指导系统 | |
CN104933643A (zh) | 一种景区信息推送方法和装置 | |
CN110741225B (zh) | 确定目标站点的系统和方法 | |
DE112009000070T5 (de) | Systeme und Verfahren zum Bereitstellen einer Navigationsunterstützung unter Verwendung eines sozialen Online-Netzwerks | |
JP6992684B2 (ja) | 情報処理装置および情報処理方法 | |
CN111984880A (zh) | 一种历史订单中真实上车点挖掘的方法和系统 | |
CN103994771A (zh) | 一种景区智能导航应用系统及其使用方法 | |
CN112556717B (zh) | 出行方式筛选方法和出行路线推荐方法和装置 | |
CN111859178A (zh) | 一种推荐上车点的方法和系统 | |
CN104636457B (zh) | 一种位置搜索认知的方法及装置 | |
CN106850921B (zh) | 为特定用户确定电话号码优先级列表 | |
CN112652186A (zh) | 一种停车场寻车方法、客户端和存储介质 | |
CN111831764A (zh) | 一种停留站点的确定方法、装置、电子设备和介质 | |
CN111127282A (zh) | 用于确定推荐位置的系统和方法 | |
CN112507240A (zh) | 一种基于位置信息与出行方式的商家信息获取方法及系统 | |
CN116823535A (zh) | 一种基于多模态大模型的行程规划及智能导览系统 | |
CN115129998A (zh) | 一种融合游客和景区状态信息的景点推荐方法及系统 | |
CN114282734A (zh) | 室内参观引导方法、装置、电子设备与存储介质 | |
US20210056493A1 (en) | Device for creating and managing itineraries |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |