CN111651437B - 一种数据清洗方法、装置、电子设备及存储介质 - Google Patents

一种数据清洗方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN111651437B
CN111651437B CN202010307261.3A CN202010307261A CN111651437B CN 111651437 B CN111651437 B CN 111651437B CN 202010307261 A CN202010307261 A CN 202010307261A CN 111651437 B CN111651437 B CN 111651437B
Authority
CN
China
Prior art keywords
target
target track
track point
point
points
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010307261.3A
Other languages
English (en)
Other versions
CN111651437A (zh
Inventor
安凯强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Didi Infinity Technology and Development Co Ltd
Original Assignee
Beijing Didi Infinity Technology and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Didi Infinity Technology and Development Co Ltd filed Critical Beijing Didi Infinity Technology and Development Co Ltd
Priority to CN202010307261.3A priority Critical patent/CN111651437B/zh
Publication of CN111651437A publication Critical patent/CN111651437A/zh
Application granted granted Critical
Publication of CN111651437B publication Critical patent/CN111651437B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/02Reservations, e.g. for tickets, services or events

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Development Economics (AREA)
  • Remote Sensing (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供了一种数据清洗方法、装置、电子设备及存储介质,其中,该数据清洗方法包括:获取目标订单对应的行程轨迹中的多个目标轨迹点;基于每个所述目标轨迹点与该目标轨迹点对应的相邻目标轨迹点之间的距离,确定该目标轨迹点与其相邻目标轨迹点之间的相似度;对所述多个目标轨迹点进行分组,得到多组目标轨迹点;基于每组目标轨迹点对应的总相似度,确定所述行程轨迹中的异常轨迹点,并对所述异常轨迹点进行清洗。本申请通过对目标订单对应的行程轨迹中的异常轨迹点进行清洗,提高了服务器的处理效率以及处理结果的准确度,进而提高了网约车平台的服务质量。

Description

一种数据清洗方法、装置、电子设备及存储介质
技术领域
本申请涉及数据处理技术领域,具体而言,涉及一种数据清洗方法、装置、电子设备及存储介质。
背景技术
网约车平台能够为用户提供多种服务,比如,出行服务。网约车平台在为用户提供出行服务的过程中,会收集用户行程中的轨迹点,并对该行程轨迹点进行处理,以保证用户的出行安全以及为用户提供出行服务。
目前,在用户的订单行程中,用户端通过全球定位系统(Global PositioningSystem,GPS)实时获取用户行程中的轨迹点,并将轨迹点发送给网约车平台,由网约车平台对轨迹点进行处理。但是,实际中,用户端的设备精度、用户行程中的信号强弱和地形位置等因素均会影响GPS的定位精度,这就使得获取的轨迹点中可能存在飘点、瞬移等问题,相应的,存在飘点、瞬移等问题的轨迹点会导致服务器的处理效率低、处理结果的准确度差,进而降低了网约车平台的服务质量。
发明内容
有鉴于此,本申请的目的在于提供一种数据清洗方法、装置、电子设备及存储介质,通过对目标订单对应的行程轨迹中的异常轨迹点进行清洗,提高了服务器的处理效率以及处理结果的准确度,进而提高了网约车平台的服务质量。
第一方面,本申请实施例提供了一种数据清洗方法,所述方法包括:
获取目标订单对应的行程轨迹中的多个目标轨迹点;
基于每个所述目标轨迹点与该目标轨迹点对应的相邻目标轨迹点之间的距离,确定该目标轨迹点与其相邻目标轨迹点之间的相似度;
对所述多个目标轨迹点进行分组,得到多组目标轨迹点;
基于每组目标轨迹点对应的总相似度,确定所述行程轨迹中的异常轨迹点,并对所述异常轨迹点进行清洗。
在一种可能的实施方式中,所述获取目标订单对应的行程轨迹中的多个目标轨迹点,包括:
对所述目标订单对应的行程轨迹进行网格化处理,确定包括所述行程轨迹中各个轨迹点的目标网格;
从每个所述目标网格包括的至少一个轨迹点中,选取每个所述目标网格对应的目标轨迹点,得到所述行程轨迹对应的多个目标轨迹点。
在一种可能的实施方式中,所述从每个所述目标网格包括的至少一个轨迹点中,选取每个所述目标网格对应的目标轨迹点,包括:
获取每个所述目标网格包括的至少一个轨迹点;
针对每个所述目标网格,从该目标网格包括的至少一个轨迹点中选取距离所述目标网格的中心点最近的一个轨迹点,作为该目标网格对应的目标轨迹点;或者,从该目标网格包括的至少一个轨迹点中随机选取一个轨迹点,作为该目标网格对应的目标轨迹点。
在一种可能的实施方式中,所述数据清洗方法还包括:
基于每个所述目标轨迹点与其相邻目标轨迹点之间的相似度,获取对应的相似度满足第一阈值的第一目标轨迹点和对应的相似度满足第二阈值的第二目标轨迹点;
针对任意两个相邻的第一目标轨迹点,获取该两个相邻的第一目标轨迹点之间的第二目标轨迹点的个数;
若所述第二目标轨迹点的个数小于第三阈值,则对所述第二目标轨迹点进行清洗。
在一种可能的实施方式中,所述基于每个所述目标轨迹点与该目标轨迹点对应的相邻目标轨迹点之间的距离,确定该目标轨迹点与其相邻目标轨迹点之间的相似度,包括:
针对每个所述目标轨迹点,计算该目标轨迹点和该目标轨迹点之前的第一相邻目标轨迹点之间的欧式距离;
根据所述欧式距离与第四阈值的比较结果,确定该目标轨迹点与其相邻目标轨迹点之间的相似度。
在一种可能的实施方式中,所述基于每个所述目标轨迹点与该目标轨迹点对应的相邻目标轨迹点之间的距离,确定该目标轨迹点与其相邻目标轨迹点之间的相似度,还包括:
针对每个所述目标轨迹点,根据该目标轨迹点和该目标轨迹点之前的第一相邻目标轨迹点确定第一线段,以及,根据该目标轨迹点和该目标轨迹点之后的第二相邻目标轨迹点确定第二线段;
根据所述第一线段和所述第二线段之间的度量参数,确定该目标轨迹点与其相邻目标轨迹点之间的相似度。
在一种可能的实施方式中,所述根据所述第一线段和所述第二线段之间的度量参数,确定该目标轨迹点与其相邻目标轨迹点之间的相似度,包括:
根据每一个所述度量参数及该度量参数对应的权重值,确定参考分值;根据所述参考分值与第五阈值的比较结果,确定该目标轨迹点与其相邻目标轨迹点之间的相似度;
或者,
根据所述度量参数与所述度量参数对应的第六阈值的比较结果,确定该目标轨迹点与其相邻目标轨迹点之间的相似度。
在一种可能的实施方式中,所述度量参数包括以下至少之一:
所述第一线段与所述第二线段之间的长度差;
所述第一线段对应的第一方向与所述第二线段对应的第二方向的夹角;其中,所述第一方向为所述第一相邻目标轨迹点指向所述目标轨迹点的方向,所述第二方向为所述目标轨迹点指向所述第二相邻目标轨迹点的方向。
在一种可能的实施方式中,所述基于每组目标轨迹点对应的总相似度,确定所述行程轨迹中的异常轨迹点,包括:
根据每组目标轨迹点中每一个目标轨迹点对应的相似度,确定该组目标轨迹点对应的总相似度;
若该组目标轨迹点对应的总相似度位于预设阈值范围内,则确定该组目标轨迹点为异常轨迹点。
在一种可能的实施方式中,在对所述异常轨迹点进行清洗之后,所述方法还包括:
获取所述目标订单对应的清洗后的目标行程轨迹;
基于所述目标行程轨迹,确定所述目标订单对应的服务信息;
将所述服务信息发送给用户端。
在一种可能的实施方式中,在对所述异常轨迹点进行清洗之后,所述方法还包括:
获取所述目标订单对应的清洗后的目标行程轨迹;
将所述目标行程轨迹作为一种行车特征输入到训练好的绕路检测模型中,得到所述目标订单是否绕路的检测结果。
第二方面,本申请实施例还提供了一种数据清洗装置,所述装置包括:
第一获取模块,用于获取目标订单对应的行程轨迹中的多个目标轨迹点;
第一确定模块,用于基于每个所述目标轨迹点与该目标轨迹点对应的相邻目标轨迹点之间的距离,确定该目标轨迹点与其相邻目标轨迹点之间的相似度;
分组模块,用于对所述多个目标轨迹点进行分组,得到多组目标轨迹点;
第二确定模块,用于基于每组目标轨迹点对应的总相似度,确定所述行程轨迹中的异常轨迹点;
第一清洗模块,用于对所述异常轨迹点进行清洗。
在一种可能的实施方式中,所述第一获取模块获取目标订单对应的行程轨迹中的多个目标轨迹点,包括:
对所述目标订单对应的行程轨迹进行网格化处理,确定包括所述行程轨迹中各个轨迹点的目标网格;
从每个所述目标网格包括的至少一个轨迹点中,选取每个所述目标网格对应的目标轨迹点,得到所述行程轨迹对应的多个目标轨迹点。
在一种可能的实施方式中,所述第一获取模块从每个所述目标网格包括的至少一个轨迹点中,选取每个所述目标网格对应的目标轨迹点,包括:
获取每个所述目标网格包括的至少一个轨迹点;
针对每个所述目标网格,从该目标网格包括的至少一个轨迹点中选取距离所述目标网格的中心点最近的一个轨迹点,作为该目标网格对应的目标轨迹点;或者,从该目标网格包括的至少一个轨迹点中随机选取一个轨迹点,作为该目标网格对应的目标轨迹点。
在一种可能的实施方式中,所述数据清洗装置还包括:
第二获取模块,用于基于每个所述目标轨迹点与其相邻目标轨迹点之间的相似度,获取对应的相似度满足第一阈值的第一目标轨迹点和对应的相似度满足第二阈值的第二目标轨迹点;
第三获取模块,用于针对任意两个相邻的第一目标轨迹点,获取该两个相邻的第一目标轨迹点之间的第二目标轨迹点的个数;
第二清洗模块,用于若所述第二目标轨迹点的个数小于第三阈值,则对所述第二目标轨迹点进行清洗。
在一种可能的实施方式中,所述第一确定模块基于每个所述目标轨迹点与该目标轨迹点对应的相邻目标轨迹点之间的距离,确定该目标轨迹点与其相邻目标轨迹点之间的相似度,包括:
针对每个所述目标轨迹点,计算该目标轨迹点和该目标轨迹点之前的第一相邻目标轨迹点之间的欧式距离;
根据所述欧式距离与第四阈值的比较结果,确定该目标轨迹点与其相邻目标轨迹点之间的相似度。
在一种可能的实施方式中,所述第一确定模块基于每个所述目标轨迹点与该目标轨迹点对应的相邻目标轨迹点之间的距离,确定该目标轨迹点与其相邻目标轨迹点之间的相似度,还包括:
针对每个所述目标轨迹点,根据该目标轨迹点和该目标轨迹点之前的第一相邻目标轨迹点确定第一线段,以及,根据该目标轨迹点和该目标轨迹点之后的第二相邻目标轨迹点确定第二线段;
根据所述第一线段和所述第二线段之间的度量参数,确定该目标轨迹点与其相邻目标轨迹点之间的相似度。
在一种可能的实施方式中,所述第一确定模块根据所述第一线段和所述第二线段之间的度量参数,确定该目标轨迹点与其相邻目标轨迹点之间的相似度,包括:
根据每一个所述度量参数及该度量参数对应的权重值,确定参考分值;根据所述参考分值与第五阈值的比较结果,确定该目标轨迹点与其相邻目标轨迹点之间的相似度;
或者,
根据所述度量参数与所述度量参数对应的第六阈值的比较结果,确定该目标轨迹点与其相邻目标轨迹点之间的相似度。
在一种可能的实施方式中,所述度量参数包括以下至少之一:
所述第一线段与所述第二线段之间的长度差;
所述第一线段对应的第一方向与所述第二线段对应的第二方向的夹角;其中,所述第一方向为所述第一相邻目标轨迹点指向所述目标轨迹点的方向,所述第二方向为所述目标轨迹点指向所述第二相邻目标轨迹点的方向。
在一种可能的实施方式中,所述第二确定模块基于每组目标轨迹点对应的总相似度,确定所述行程轨迹中的异常轨迹点,包括:
根据每组目标轨迹点中每一个目标轨迹点对应的相似度,确定该组目标轨迹点对应的总相似度;
若该组目标轨迹点对应的总相似度位于预设阈值范围内,则确定该组目标轨迹点为异常轨迹点。
在一种可能的实施方式中,所述数据清洗装置还包括:
第四获取模块,用于在对所述异常轨迹点进行清洗之后,获取所述目标订单对应的清洗后的目标行程轨迹;
第三确定模块,用于基于所述目标行程轨迹,确定所述目标订单对应的服务信息;
发送模块,用于将所述服务信息发送给用户端。
在一种可能的实施方式中,所述数据清洗装置还包括:
第五获取模块,用于在对所述异常轨迹点进行清洗之后,获取所述目标订单对应的清洗后的目标行程轨迹;
输入模块,用于将所述目标行程轨迹作为一种行车特征输入到训练好的绕路检测模型中,得到所述目标订单是否绕路的检测结果。
第三方面,本申请实施例还提供了一种电子设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如第一方面中任一项所述的数据清洗方法的步骤。
第四方面,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如第一方面中任一项所述的数据清洗方法的步骤。
本申请实施例提供了一种数据清洗方法、装置、电子设备及存储介质,在获取到目标订单对应的行程轨迹中的多个目标轨迹点后,基于每个目标轨迹点与该目标轨迹点对应的相邻目标轨迹点之间的距离,确定该目标轨迹点与其相邻目标轨迹点之间的相似度;再对多个目标轨迹点进行分组,并基于每组目标轨迹点对应的总相似度,确定行程轨迹中的异常轨迹点,并对异常轨迹点进行清洗。这样,通过对目标订单对应的行程轨迹中的异常轨迹点进行清洗,提高了服务器的处理效率以及对行程中轨迹点的处理结果的准确度,进而提高了网约车平台的服务质量。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例提供的一种行程轨迹中飘点的示意图;
图2示出了本申请实施例提供的一种数据清洗系统的架构示意图;
图3示出了本申请实施例提供的一种数据清洗方法的流程图;
图4示出了本申请实施例提供的另一种数据清洗方法的流程图;
图5示出了本申请实施例提供的另一种数据清洗方法的流程图;
图6示出了本申请实施例提供的另一种数据清洗方法的流程图;
图7示出了本申请实施例提供的另一种数据清洗方法的流程图;
图8示出了本申请实施例提供的另一种数据清洗方法的流程图;
图9a示出了本申请实施例提供的另一种数据清洗方法的流程图;
图9b示出了第一线段对应的第一方向与第二线段对应的第二方向的夹角的示意图;
图10示出了本申请实施例提供的另一种数据清洗方法的流程图;
图11示出了本申请实施例提供的另一种数据清洗方法的流程图;
图12示出了本申请实施例提供的一种数据清洗装置的结构示意图;
图13示出了本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解,本申请中附图仅起到说明和描述的目的,并不用于限定本申请的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应该理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。
另外,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了使得本领域技术人员能够使用本申请内容,结合特定应用场景“网约车领域”,给出以下实施方式。对于本领域技术人员来说,在不脱离本申请的精神和范围的情况下,可以将这里定义的一般原理应用于其他实施例和应用场景。虽然本申请主要围绕“网约车领域”进行描述,但是应该理解,这仅是一个示例性实施例。
考虑到在用户的订单行程中,用户端定位的用户行程中的轨迹点会受到用户端的设备精度、用户行程中的信号强弱和地形位置等因素的影响,这就使得获取的轨迹点中可能存在飘点、瞬移等问题,如图1示出的飘点,相应的,存在飘点、瞬移等问题的轨迹点会导致服务器的处理效率低、处理结果的准确度差,进而降低了网约车平台的服务质量。基于此,本申请实施例提供了一种数据清洗方法、装置、电子设备及存储介质,通过对目标订单对应的行程轨迹中的异常轨迹点进行清洗,提高了服务器的处理效率以及处理结果的准确度,进而提高了网约车平台的服务质量。
需要说明的是,本申请实施例中将会用到术语“包括”,用于指出其后所声明的特征的存在,但并不排除增加其它的特征。
本申请中的术语“用户端”可以指“服务请求端”(比如乘客端或者请求共享车辆的请求端),也可以指“服务提供端”(比如司机端);“用户”可以指代请求服务、订购服务、提供服务或促成服务的提供的个人、实体或工具。例如,用户可以是服务请求方、乘客、驾驶员(比如司机)、操作员等,或其任意组合。
本申请中使用的定位技术可以基于全球定位系统(Global Positioning System,GPS)、全球导航卫星系统(Global Navigation Satellite System,GLONASS),罗盘导航系统(COMPASS)、伽利略定位系统、准天顶卫星系统(Quasi-Zenith Satellite System,QZSS)、无线保真(Wireless Fidelity,WiFi)定位技术等,或其任意组合。一个或多个上述定位系统可以在本申请中互换使用。
图2是本申请实施例提供的一种数据清洗系统200的架构示意图。例如,该数据清洗系统200可以是用于诸如出租车、快车、拼车、代驾服务、公共汽车服务、驾驶员租赁、共享车辆、或班车服务之类的运输服务、或其任意组合的在线运输服务平台。数据清洗系统200可以包括服务器210(即网约车平台)、网络220、用户端230、和数据库240中的一种或多种。
在一些实施例中,服务器210可以包括处理器。处理器可以处理有关的信息和/或数据,以执行本申请中描述的一个或多个功能。例如,处理器可以从来自用户端230的多个轨迹点中选取异常轨迹点并进行清洗。在一些实施例中,处理器可以包括一个或多个处理核(例如,单核处理器(S)或多核处理器(M))。仅作为举例,处理器可以包括中央处理单元(Central Processing Unit,CPU)、专用集成电路(Application Specific IntegratedCircuit,ASIC)、专用指令集处理器(Application Specific Instruction-setProcessor,ASIP)、图形处理单元(Graphics Processing Unit,GPU)、物理处理单元(Physics Processing Unit,PPU)、数字信号处理器(Digital Signal Processor,DSP)、现场可编程门阵列(Field Programmable Gate Array,FPGA)、可编程逻辑器件(Programmable Logic Device,PLD)、控制器、微控制器单元、简化指令集计算机(ReducedInstruction Set Computing,RISC)、或微处理器等,或其任意组合。
在一些实施例中,用户端230,用于向服务器210提供目标订单对应的行程轨迹中的多个轨迹点。用户端230可以为移动设备,比如为以下设备中的一种或多种:智能终端设备、智能家居设备、可穿戴设备、智能移动设备、虚拟现实设备、或增强现实设备等,也可以是平板计算机、膝上型计算机、或机动车辆中的内置设备等。
在一些实施例中,数据库240可以连接到网络220以与数据清洗系统200中的一个或多个组件(例如,服务器210、用户端230)通信。数据清洗系统200中的一个或多个组件可以经由网络220访问存储在数据库240中的数据或指令。在一些实施例中,数据库240可以直接连接到数据清洗系统200中的一个或多个组件,或者,数据库240也可以是服务器210的一部分。
需要说明的是,本申请实施例提供的数据清洗方法,可以由数据清洗系统200中的服务器210执行,也可以由用户端230执行。其中,在由用户端230执行上述数据清洗方法时,用户端230在获取目标订单对应的行程轨迹中的多个轨迹点之后,从上述多个轨迹点中选取异常轨迹点,并对异常轨迹点进行清洗,再将清洗后的轨迹点发送给服务器210,以便服务器210对清洗后的轨迹点进行处理。
下面结合上述图2示出的数据清洗系统200中描述的内容,对本申请实施例提供的数据清洗方法进行详细说明。
参照图3所示,为本申请实施例提供的一种数据清洗方法的流程图,该方法可以由服务器210来执行,所述方法具体如下步骤:
S301、获取目标订单对应的行程轨迹中的多个目标轨迹点。
S302、基于每个所述目标轨迹点与该目标轨迹点对应的相邻目标轨迹点之间的距离,确定该目标轨迹点与其相邻目标轨迹点之间的相似度。
S303、对所述多个目标轨迹点进行分组,得到多组目标轨迹点。
S304、基于每组目标轨迹点对应的总相似度,确定所述行程轨迹中的异常轨迹点,并对所述异常轨迹点进行清洗。
本申请实施例提供的数据清洗方法,通过对目标订单对应的行程轨迹中的异常轨迹点进行清洗,再对清洗后的轨迹点进行处理,以保证用户的出行安全以及为用户提供出行服务,提高了服务器的处理效率以及对行程中轨迹点的处理结果的准确度,进而提高了网约车平台的服务质量。
下面对本示例性实施例中的数据清洗方法的各步骤作进一步的说明。
S301、获取目标订单对应的行程轨迹中的多个目标轨迹点。
在一种实施方式中,服务器基于来自服务请求端的服务请求(也即出行请求)和服务提供端对该服务请求的服务响应,生成相应的目标订单,并将该目标订单的订单信息发送给匹配的服务请求端,或者,发送给服务请求端和服务提供端,以便开启该目标订单对应的行程。
其中,在用户使用共享车辆的情况下,将目标订单的订单信息发送给匹配的服务请求端,比如,请求共享车辆的请求端;在用户接受快车等驾驶员租赁类服务的情况下,将目标订单的订单信息发送给匹配的服务请求端和服务提供端,比如,乘客端和司机端。
在本申请实施例中,服务器基于服务请求端的服务请求的服务类型,将服务请求发送给匹配该服务类型的服务提供端,并根据服务提供端的响应结果,生成匹配该服务类型的目标订单。其中,出行服务的服务类型包括车辆租赁类(比如共享汽车、共享单车等)和驾驶员租赁类(比如快车、代驾等)。
本申请实施例中,用户端可以为服务请求端,也可以为服务提供端;这里,以用户端为服务请求端为例,用户端在接收到目标订单后,实时获取该目标订单对应的行程轨迹中的轨迹点,并实时将获取到的轨迹点发送给服务器,服务器则在接收到目标订单对应的轨迹点后,从目标订单对应的多个轨迹点中选取符合预设条件的目标轨迹点。
这里,行程轨迹中的轨迹点即行程轨迹中的位置点,也即一个经纬度点。
S302、基于每个所述目标轨迹点与该目标轨迹点对应的相邻目标轨迹点之间的距离,确定该目标轨迹点与其相邻目标轨迹点之间的相似度。
在本申请实施例中,服务器在接收到用户端发送的目标订单对应的多个轨迹点后,记录每个轨迹点的接收时间,相应的,服务器在从多个轨迹点中选取了目标轨迹点后,基于每个目标轨迹点的接收时间,确定多个目标轨迹点之间的排列顺序,并基于多个目标轨迹点之间的排列顺序,确定每个目标轨迹点对应的相邻轨迹点,进而确定每个目标轨迹点与该目标轨迹点的相邻轨迹点之间的相似度。这里,相似度表示在映射空间(也即真实场景对应的虚拟空间)下,该目标轨迹点与其相邻目标轨迹点之间是否相似,也即该目标轨迹点与其相邻目标轨迹点是否为同一类。
在一种实施方式中,获取每个目标轨迹点之前的第一相邻目标轨迹点,并基于每个目标轨迹点与该目标轨迹点之前的第一相邻目标轨迹点之间的距离,确定该目标轨迹点与该目标轨迹点的相邻轨迹点之间的相似度。
在另一种实施方式中,获取每个目标轨迹点之前的第一相邻目标轨迹点以及每个目标轨迹点之后的第二相邻目标轨迹点,并基于每个目标轨迹点分别与该目标轨迹点之前的第一相邻目标轨迹点、该目标轨迹点之后的第二相邻目标轨迹点之间的距离,确定该目标轨迹点与该目标轨迹点的相邻轨迹点之间的相似度。
本申请实施例中,若确定该目标轨迹点与该目标轨迹点的相邻轨迹点相似,则将该目标轨迹点对应的相似度设置为第一数值,比如为0;若确定该目标轨迹点与该目标轨迹点的相邻轨迹点不相似,则将该目标轨迹点对应的相似度设置为第二数值,比如为1。
在本申请实施例中,第一个目标轨迹点不存在对应的第一相邻目标轨迹点,相应的,服务器在确定了第一个目标轨迹点之后,将该目标轨迹点对应的相似度设置为第一数值,也即设置该第一个目标轨迹点对应的相似度为0。
举例来讲,服务器选取了3个目标轨迹点,这三个目标轨迹点按照对应的排列顺序依次为:目标轨迹点1、目标轨迹点2、目标轨迹点3;服务器确定目标轨迹点1为第一个目标轨迹点,则将该目标轨迹点对应的相似度设置为0;针对目标轨迹点2,若确定目标轨迹点2与其相邻轨迹点相似,则将该目标轨迹点对应的相似度设置为0;若确定目标轨迹点2与其相邻轨迹点不相似,则将该目标轨迹点对应的相似度设置为1;针对目标轨迹点3,若确定目标轨迹点3与其相邻轨迹点相似,则将该目标轨迹点对应的相似度设置为0;若确定目标轨迹点3与其相邻轨迹点不相似,则将该目标轨迹点对应的相似度设置为1。
S303、对所述多个目标轨迹点进行分组,得到多组目标轨迹点。
在一种可能的实施方式中,服务器根据多个目标轨迹点对应的排列顺序以及每组目标轨迹点对应的预设数量,对多个目标轨迹点进行分组,得到多组目标轨迹点。比如,目标订单对应9个目标轨迹点,分别为目标轨迹点1、目标轨迹点2、目标轨迹点3、目标轨迹点4、目标轨迹点5、目标轨迹点6、目标轨迹点7、目标轨迹点8、目标轨迹点9,相应的,服务器将目标轨迹点1、目标轨迹点2、目标轨迹点3划分为第一组目标轨迹点,将目标轨迹点4、目标轨迹点5、目标轨迹点6划分为第二组目标轨迹点,将目标轨迹点7、目标轨迹点8、目标轨迹点9划分为第三组目标轨迹点。
在另一种可能的实施方式中,针对每个目标轨迹点,服务器确定该目标轨迹点之前的第一相邻目标轨迹点以及该目标轨迹点之后的第二相邻目标轨迹点,并将该目标轨迹点,该目标轨迹点分别对应的第一相邻目标轨迹点和第二相邻目标轨迹点,确定为一组目标轨迹点。可选的,被分组后的目标轨迹点可以再次作为目标轨迹点进行分组,也可以不再作为目标轨迹点进行分组。
S304、基于每组目标轨迹点对应的总相似度,确定所述行程轨迹中的异常轨迹点,并对所述异常轨迹点进行清洗。
本申请实施例中,针对每组目标轨迹点,服务器根据该组目标轨迹点中每一个目标轨迹点对应的相似度(也即该组目标轨迹点中每一个目标轨迹点与其相邻目标轨迹点之间的相似度),确定该组目标轨迹点对应的总相似度,并根据该组目标轨迹点对应的总相似度,确定该组目标轨迹点是否为行程轨迹中的异常轨迹点,这里,若该组目标轨迹点对应的总相似度位于预设阈值范围内,则确定该组目标轨迹点为异常轨迹点,当确定该组目标轨迹点为异常轨迹点后,对该组目标轨迹点进行清洗,也即删除该组目标轨迹点。这里,预设阈值范围为根据实际情况预先设置好的阈值范围,在本申请实施例中,比如为【2~3】。
比如,第一组目标轨迹点包括目标轨迹点1、目标轨迹点2和目标轨迹点3,其中,目标轨迹点1对应相似度为“0”,目标轨迹点2对应相似度为“1”,目标轨迹点3对应相似度为“1”,则该组目标轨迹点中每个目标轨迹点对应的总相似度为0+1+1=2,该总相似度位于预设阈值范围(比如,【2~3】)内,相应的,确定该组目标轨迹点为异常轨迹点,也即该组目标轨迹点中的每个目标轨迹点均为异常轨迹点;相应的,服务器对第一组目标轨迹点(包括目标轨迹点1、目标轨迹点2和目标轨迹点3)进行清洗,即删除目标轨迹点1、目标轨迹点2和目标轨迹点3。
考虑到用户端基于GPS收集轨迹点的频率较快,比如,用户端每隔2-3秒收集一个GPS轨迹点,对于一次距离较长的行程,可能收集成千上万的轨迹点,然而这些轨迹点之间存在一定的冗余度,服务器基于这些轨迹点进行处理,会造成存储成本上升、模型不稳定等问题。因此,本申请实施例中,在确定每个目标轨迹点对应的相似度之前,对来自用户端的多个轨迹点预处理,以清洗冗余的轨迹点。
进一步的,如图4所示,所述获取目标订单对应的行程轨迹中的多个目标轨迹点,包括:
S401、对所述目标订单对应的行程轨迹进行网格化处理,确定包括所述行程轨迹中各个轨迹点的目标网格。
本申请实施例中,服务器在生成目标订单之后,获取目标订单对应的行程轨迹,并确定行程轨迹对应的目标区域,之后,服务器对该目标区域进行网格化处理,得到多个网格,进一步的,服务器从这些网格中选取包括行程轨迹中各个轨迹点的目标网格。
其中,行程轨迹对应的目标区域可以是路段级区域(比如,中关村街道),也可以是区级区域(比如北京市海淀区),还可以是市级区域(比如北京市)。
可选的,服务器对该目标区域进行网格化处理包括:服务器基于预设的横向间隔距离和纵向间隔距离,对目标区域进行网格化处理,将目标区域划分为多个网格,比如,预设的横向间隔距离为3,预设的纵向间隔距离为3,对横坐标∈[0,6]和纵坐标∈[0,6]的目标区域进行网格化处理,得到横坐标∈[0,3]和纵坐标∈[0,3]对应的网格1、横坐标∈[0,3]和纵坐标∈[3,6]对应的网格2、横坐标∈[3,6]和纵坐标∈[0,3]对应的网格3、横坐标∈[3,6]和纵坐标∈[3,6]对应的网格4,其中,网格1、网格2、网格4中包括行程轨迹中的轨迹点,因此,确定网格1、网格2、网格4为该目标订单对应的目标网格。
S402、从每个所述目标网格包括的至少一个轨迹点中,选取每个所述目标网格对应的目标轨迹点,得到所述行程轨迹对应的多个目标轨迹点。
本申请实施例中,每个目标网格中可能包括一个或者多个轨迹点,当目标网格包括多个轨迹点时,从每个目标网格包括的多个轨迹点中选取一个轨迹点,作为该目标网格对应的目标轨迹点。
作为一种可能的实施方式,针对每一个目标网格,确定该目标网格包括的轨迹点的个数,若该目标网格包括一个轨迹点,则将该轨迹点确定为该目标网格对应的目标轨迹点,若该目标网格包括多个轨迹点,则从该目标网格包括的多个轨迹点中选取一个轨迹点,作为该目标网格对应的目标轨迹点。
比如,目标网格1包括轨迹点1和轨迹点2,目标网格2包括轨迹点3,将轨迹点1确定为目标网格1的目标轨迹点,将轨迹点3确定为目标网格2的目标轨迹点。
基于网格化处理的方式,能够对密集的轨迹点中的冗余轨迹点进行清洗,以便对清洗后的轨迹点进行处理,减少了占用的服务器的存储空间,同时,提高了服务器的处理效率。
本申请实施例中,提供了两种选取目标网格对应的目标轨迹点的方法,具体如下:
第一、如图5所示,所述从每个所述目标网格包括的至少一个轨迹点中,选取每个所述目标网格对应的目标轨迹点,包括:
S501、获取每个所述目标网格包括的至少一个轨迹点。
S502、针对每个所述目标网格,从该目标网格包括的至少一个轨迹点中选取距离所述目标网格的中心点最近的一个轨迹点,作为该目标网格对应的目标轨迹点。
结合步骤501和步骤502,针对每个目标网格,获取该目标网格包括的至少一个轨迹点,根据该目标网格包括的每个轨迹点的位置,以及该目标网格的中心点的位置,计算每个轨迹点与该目标网格的中心点的距离,根据每个轨迹点与该目标网格的中心点的距离,将对应的距离最小的轨迹点作为该目标网格对应的目标轨迹点。
比如,目标网格1包括轨迹点1和轨迹点2,目标网格1的中心点的位置信息为(1.5,1.5),轨迹点1的位置信息为(1.5,1),轨迹点2的位置信息为(1.5,2.5),相应的,轨迹点1与目标网格1的中心点的距离为0.5,轨迹点2与目标网格1的中心点的距离为1,由于轨迹点1距离目标网格1的距离最短,因此,轨迹点1为目标网格1的目标轨迹点。
第二、如图6所示,所述从每个所述目标网格包括的至少一个轨迹点中,选取每个所述目标网格对应的目标轨迹点,包括:
S601、获取每个所述目标网格包括的至少一个轨迹点。
S602、针对每个所述目标网格,从该目标网格包括的至少一个轨迹点中随机选取一个轨迹点,作为该目标网格对应的目标轨迹点。
结合步骤601和步骤602,针对每个目标网格,获取该目标网格包括的至少一个轨迹点,从上述至少一个轨迹点中随机选取一个轨迹点,作为该目标网格对应的目标轨迹点。
比如,目标网格1包括轨迹点1和轨迹点2,随机选取轨迹点1作为该目标网格1对应的目标轨迹点。
考虑到用户端采集的飘点可能为连续多个且多个飘点之间的距离较近,实际中,上述飘点数量通常还是会远远小于正常行程轨迹中的轨迹点数量,基于此,本申请实施例中,在分组之前,可以先选出连续多个飘点,并删除这些飘点。
如图7所示,本申请实施例提供的一种数据清洗方法,所述方法还包括:
S701、基于每个所述目标轨迹点与其相邻目标轨迹点之间的相似度,获取对应的相似度满足第一阈值的第一目标轨迹点和对应的相似度满足第二阈值的第二目标轨迹点。
在本申请实施例中,服务器获取每个目标轨迹点对应的相似度(也即该目标轨迹点与其相邻目标轨迹点之间的相似度),并判断每个目标轨迹点对应的相似度是满足第一阈值(比如,二者相似对应的数值1)还是满足第二阈值(比如,二者相似对应的数值0);相应的,服务器从这些目标轨迹点中,获取对应的相似度满足第一阈值的第一目标轨迹点(即获取对应的相似度为1的第一目标轨迹点),以及,获取对应的相似度满足第二阈值的第二目标轨迹点(即获取对应的相似度为0的第二目标轨迹点)。这里,第一阈值和第二阈值分别为根据实际情况预先设置好的阈值,在本申请实施例中,比如,第一阈值为“1”,第二阈值为“0”。
比如,目标轨迹点1对应的相似度为0,目标轨迹点2对应的相似度为1,目标轨迹点3对应的相似度为1,目标轨迹点4对应的相似度为0,目标轨迹点5对应的相似度为0,目标轨迹点6对应的相似度为1,目标轨迹点7对应的相似度为1,目标轨迹点8对应的相似度为0。
相应的,目的轨迹点2、目标轨迹点3、目标轨迹点4、目标轨迹点7为第一目标轨迹点,目的轨迹点1、目标轨迹点4、目标轨迹点5、目标轨迹点8为第二目标轨迹点。
S702、针对任意两个相邻的第一目标轨迹点,获取该两个相邻的第一目标轨迹点之间的第二目标轨迹点的个数。
本申请实施例中,相邻两个第一目标轨迹点指的是不考虑第二目标轨迹点的任意两个相邻的第一目标轨迹点,相应的,任意两个相邻的第一目标轨迹点之间可能存在多个第二目标轨迹点,因此,针对每一组相邻的第一目标轨迹点,获取该组相邻的第一目标轨迹点之间的第二目标轨迹点的个数。
比如,目标轨迹点2对应的相似度为1,目标轨迹点3对应的相似度为1,目标轨迹点2和目标轨迹点3为一组相邻的第一目标轨迹点,这两个第一目标轨迹点之间的第二目标轨迹点的个数为0;目标轨迹点3和目标轨迹点6为另一组相邻的第一目标轨迹点,这两个第一目标轨迹点之间的第二目标轨迹点的个数为2。
S703、若所述第二目标轨迹点的个数小于第三阈值,则对所述第二目标轨迹点进行清洗。
考虑到用户端采集的飘点可能为连续多个且多个飘点之间的距离较近,但飘点数量通常还是会远远小于正常行程轨迹中的轨迹点数量,本申请实施例中,针对每组第一目标轨迹点,若该组第一目标轨迹点之间包括的第二目标轨迹点的个数小于第三阈值,则确定该组第一目标轨迹点之间包括的第二目标轨迹点为异常轨迹点(即连续的飘点),因此,服务器对上述第二目标轨迹点进行清洗。这里,第三阈值可以是根据历史数据统计得出,比如,历史行程轨迹中连续飘点个数的平均值为N,第三阈值为(N-2),也可以是根据实际情况预先设置好的阈值。
本申请实施例中,在对多个目标轨迹点进行分组,得到多组目标轨迹点之前,服务器对第二目标轨迹点进行清洗,并对清洗后得到的目标轨迹点进行分组处理,得到多组目标轨迹点。
另外,服务器也可以直接对获取的多个目标轨迹点进行分组,在基于每组目标轨迹点对应的总相似度,确定所述行程轨迹中的异常轨迹点,并对所述异常轨迹点进行清洗之后,再次通过步骤701至703的步骤对上述第二目标轨迹点进行清洗,得到目标订单对应的清洗后的目标轨迹点。
通过上述方式,本申请可以从目标轨迹点中查找连续多个间距较小的飘点,并对这些飘点进行清洗,提高异常轨迹点查找的准确度。
在本申请实施例中,提供了两种确定目标轨迹点与其相邻目标轨迹点之间相似度的方式,具体如下:
第一,如图8所示,所述基于每个所述目标轨迹点与该目标轨迹点对应的相邻目标轨迹点之间的距离,确定该目标轨迹点与其相邻目标轨迹点之间的相似度,包括:
S801、针对每个所述目标轨迹点,计算该目标轨迹点和该目标轨迹点之前的第一相邻目标轨迹点之间的欧式距离。
本申请实施例中,针对第一个目标轨迹点,将该第一个目标轨迹点对应的相似度设置为相似度对应的第一数值(比如0);针对除第一个目标轨迹点之外的每一个目标轨迹点,获取该目标轨迹点之前的第一相邻目标轨迹点,根据该目标轨迹点的位置和该目标轨迹点之前的第一相邻目标轨迹点的位置,计算该目标轨迹点和其对应的第一相邻目标轨迹点之间的欧式距离。这里,上述欧氏距离可以是二维欧氏距离,也可以是三维欧式距离。
可选的,服务器基于目标轨迹点对应的排列顺序,确定除第一个目标轨迹点之外的每一个目标轨迹点之前的第一相邻目标轨迹点。比如,目标轨迹点1对应的接收时间为2020年3月6日08点08分08秒,目标轨迹点2对应的接收时间为2020年3月6日08点08分10秒,目标轨迹点3对应的接收时间为2020年3月6日08点08分12秒,则目标轨迹点1是目标轨迹点2的第一相邻目标轨迹点。
S802、根据所述欧式距离与第四阈值的比较结果,确定该目标轨迹点与其相邻目标轨迹点之间的相似度。
在本申请实施例中,针对除第一个目标轨迹点之外的每个目标轨迹点,将该目标轨迹点对应的欧氏距离与预设的第四阈值进行比较,若该欧式距离小于第四阈值,则确定该目标轨迹点与其相邻目标轨迹点相似,相应的,设置该目标轨迹点对应的相似度为0;若该欧式距离大于等于第四阈值,则确定该目标轨迹点与其相邻目标轨迹点不相似,相应的,设置该目标轨迹点对应的相似度为1。这里,第四阈值可以是根据历史数据统计得出,比如,将历史行程轨迹中正常轨迹点之间的最大欧氏距离确定为第四阈值,也可以是根据实际情况预先设置好的阈值。
其中,上述第四阈值与以下因素中至少之一相关:用户端获取轨迹点的时间间隔、目标订单对应的车辆类型(比如汽车或者单车)、目标订单对应的行程中的路况信息等。
第二,如图9a所示,所述基于每个所述目标轨迹点与该目标轨迹点对应的相邻目标轨迹点之间的距离,确定该目标轨迹点与其相邻目标轨迹点之间的相似度,还包括:
S901、针对每个所述目标轨迹点,根据该目标轨迹点和该目标轨迹点之前的第一相邻目标轨迹点确定第一线段,以及,根据该目标轨迹点和该目标轨迹点之后的第二相邻目标轨迹点确定第二线段。
在本申请实施例中,针对第一个目标轨迹点和最后一个目标轨迹点,将该第一个目标轨迹点和最后一个目标轨迹点对应的相似度均设置为相似对应的第一数值(比如0)。
针对除第一个目标轨迹点和最后一个目标轨迹点之外的每一个目标轨迹点,根据该目标轨迹点的位置和该目标轨迹点之前的第一相邻目标轨迹点的位置确定第一线段,根据该目标轨迹点的位置和该目标轨迹点之后的第二相邻目标轨迹点的位置确定第二线段;可选的,第一线段对应的第一方向为从第一相邻目标轨迹点指向该目标轨迹点的方向;第二线段对应的第二方向为从该目标轨迹点指向第二相邻目标轨迹点的方向。
其中,服务器基于目标轨迹点对应的排列顺序,确定除第一个目标轨迹点和最后一个目标轨迹点之外的每一个目标轨迹点之前的第一相邻目标轨迹点,以及每一个目标轨迹点之后的第二相邻目标轨迹点。
比如,目标轨迹点1对应的接收时间为2020年3月6日08点08分08秒,目标轨迹点2对应的接收时间为2020年3月6日08点08分10秒,目标轨迹点3对应的接收时间为2020年3月6日08点08分12秒,则目标轨迹点1是目标轨迹点2的第一相邻目标轨迹点,目标轨迹点3是目标轨迹点2的第二相邻目标轨迹点。
S902、根据所述第一线段和所述第二线段之间的度量参数,确定该目标轨迹点与其相邻目标轨迹点之间的相似度。
在本申请实施例中,针对除第一个目标轨迹点和最后一个目标轨迹点之外的每一个目标轨迹点,根据该目标轨迹点对应的第一线段和该目标轨迹点对应的第二线段,确定所述第一线段和所述第二线段之间的度量参数,并将该度量参数与相应的阈值进行比较,并基于比较结果,确定该目标轨迹点与其相邻目标轨迹点之间的相似度。
本申请实施例中,所述第一线段和所述第二线段之间的度量参数包括以下至少之一:
所述第一线段与所述第二线段之间的长度差。
所述第一线段对应的第一方向与所述第二线段对应的第二方向的夹角;其中,所述第一方向为所述第一相邻目标轨迹点指向所述目标轨迹点的方向,所述第二方向为所述目标轨迹点指向所述第二相邻目标轨迹点的方向。
如图9b所示,第一线段对应的第一方向为左侧箭头所指的方向,第二线段对应的第二方向为右侧箭头所指的方向,第一线段对应的第一方向与第二线段对应的第二方向的夹角为角α。
相应的,本申请实施例中,所述根据所述第一线段和所述第二线段之间的度量参数,确定该目标轨迹点与其相邻目标轨迹点之间的相似度,包括:
1、根据每一个所述度量参数及该度量参数对应的权重值,确定参考分值;根据所述参考分值与第五阈值的比较结果,确定该目标轨迹点与其相邻目标轨迹点之间的相似度。
本申请实施例中,针对除第一个目标轨迹点和最后一个目标轨迹点之外的每个目标轨迹点,计算该目标轨迹点的每一个度量参数与该度量参数对应的权重值的乘积,并计算每一个度量参数对应的乘积的和值,作为该目标轨迹点对应的参考分值,将上述参考分值与预设的第五阈值进行比较,若上述参考分值小于预设的第五阈值,则确定该目标轨迹点与其相邻目标轨迹点相似,相应的,将该目标轨迹点对应的相似度设置为0;若上述参考分值大于等于预设的第五阈值,则确定该目标轨迹点与其相邻目标轨迹点不相似,相应的,将该目标轨迹点对应的相似度设置为1。这里,第五阈值为根据实际情况预先设置好的阈值。
其中,多个度量参数对应的权重值的和值等于1,比如,度量参数包括:第一线段与第二线段之间的长度差(第一度量参数)、第一线段对应的第一方向与第二线段对应的第二方向的夹角(第二度量参数),第一度量参数和第二度量参数分别对应的权重值的和值等于1,第一度量参数对应的权重值为0.4,第二度量参数对应的权重值为0.6。
2、根据所述度量参数与所述度量参数对应的第六阈值的比较结果,确定该目标轨迹点与其相邻目标轨迹点之间的相似度。
本申请实施例中,针对除第一个目标轨迹点和最后一个目标轨迹点之外的每个目标轨迹点,将该目标轨迹点对应的每一个度量参数分别与该度量参数对应的第六阈值进行比较,若每一个度量参数均小于该度量参数对应的第六阈值,则确定该目标轨迹点与其相邻目标轨迹点相似,相应的,将该目标轨迹点对应的相似度设置为0;若至少存在一个度量参数大于等于该度量参数对应的第六阈值,则确定该目标轨迹点与其相邻目标轨迹点不相似,相应的,将该目标轨迹点对应的相似度设置为1。
比如,目标轨迹点对应的度量参数为第一线段对应的第一方向与第二线段对应的第二方向的夹角,若目标轨迹点对应的该夹角小于90度,则确定该目标轨迹点与其相邻目标轨迹点相似。
在得到目标订单对应的清洗后的目标轨迹点后,服务器可以对目标订单对应的清洗后的目标轨迹点进行处理,本申请实施例中,提供了两种应用场景下的处理方式,具体如下:
第一,如图10所示,在对所述异常轨迹点进行清洗之后,所述方法还包括:
S1001、获取所述目标订单对应的清洗后的目标行程轨迹。
在本申请实施例中,服务器获取目标订单对应的清洗后的目标轨迹点,根据该目标订单对应的清洗后的目标轨迹点,生成该目标订单对应的清洗后的目标行程轨迹。
S1002、基于所述目标行程轨迹,确定所述目标订单对应的服务信息。
在本申请实施例中,在目标订单完成后,服务器基于该目标订单对应的目标行程轨迹,确定该目标订单对应的服务信息。其中,该服务信息可以为目标订单对应的行程中的定位信息,还可以为目标订单对应的费用信息。
在一种实施方式中,在目标订单对应的行程中,服务器基于该目标行程轨迹,实时生成该目标订单行程中的定位信息,并将该定位信息发送给用户端,以便用户端显示实时定位信息。
在另外一种实施方式中,在目标订单对应的行程结束后,服务器基于该目标行程轨迹以及其他相关信息(比如,车辆类型、服务类型),生成该目标订单对应的费用信息,并将该费用信息发送给用户端,以便用户端响应该费用信息。
S1003、将所述服务信息发送给用户端。
在本申请实施例中,将目标订单对应的服务信息发送给用户端,以使用户端显示上述服务信息,其中,用户端包括服务请求端和服务提供端。
实际中,将目标订单对应的实时定位信息发送给用户端(比如共享车辆的请求端),以使用户端显示该实时定位信息;将目标订单对应的费用信息发送给用户端(比如,司机端和乘客端),以使乘客端完成费用支付,结束该次出行服务。
第二、如图11所示,在对所述异常轨迹点进行清洗之后,所述方法还包括:
S1101、获取所述目标订单对应的清洗后的目标行程轨迹。
在本申请实施例中,服务器获取目标订单对应的清洗后的目标轨迹点,根据该目标订单对应的清洗后的目标轨迹点,生成该目标订单对应的清洗后的目标行程轨迹。
S1102、将所述目标行程轨迹作为一种行车特征输入到训练好的绕路检测模型中,得到所述目标订单是否绕路的检测结果。
在本申请实施例中,该目标行程轨迹可以作为一种行车特征,该行车特征结合其他行车特征(比如,目标订单对应的行驶时长、出发地信息、目的地信息、路况信息等)对绕路检测模型进行训练,得到训练好的绕路检测模型。
另外,在应用过程中,该目标行程轨迹也可以作为一种行车特征,该行车特征结合其他行车特征(比如,目标订单对应的行驶时长、出发地信息、目的地信息、路况信息等)输入到上述预先训练好的绕路检测模型中,由绕路检测模型基于训练好的参数对输入的上述行车特征进行计算,输出该目标订单是否绕路的检测结果。
本申请实施例中,通过如下方式训练绕路检测模型:预先构建训练样本,该训练样本包括多个历史订单,每个历史订单中包括目标行程轨迹等行车特征和该历史订单对应的绕路检测结果,在训练绕路检测模型时,将包括目标行程轨迹等的行车特征作为绕路检测模型的输入,将绕路检测结果作为绕路检测模型的输出,训练绕路检测模型(即训练绕路检测模型的参数)。
针对该目标订单,用户端还可以对该绕路检测模型的输出结果进行反馈,基于用户端的反馈结果,对绕路检测模型的参数进行优化。
通过清洗后的目标行程轨迹训练绕路检测模型,提高了绕路检测模型的精度和稳定性;基于清洗后的目标行程轨迹确定是否绕路,提高了绕路检测结果的准确性;通过用户的绕路反馈结果对绕路检测模型的参数进行优化,进一步提高了绕路检测模型的精度和稳定性。
本申请实施例提供了一种数据清洗方法,通过对目标订单对应的行程轨迹中的异常轨迹点进行清洗,提高了服务器的处理效率以及对行程中轨迹点的处理结果的准确度,进而提高了网约车平台的服务质量。
基于同一发明构思,本申请实施例中还提供了与上述数据清洗方法对应的数据清洗装置,由于本申请实施例中的装置解决问题的原理与本申请实施例上述数据清洗方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
参照图12所示,为本申请实施例提供的一种数据清洗装置1200的结构示意图,该数据清洗装置1200包括:
第一获取模块1201,用于获取目标订单对应的行程轨迹中的多个目标轨迹点;
第一确定模块1202,用于基于每个所述目标轨迹点与该目标轨迹点对应的相邻目标轨迹点之间的距离,确定该目标轨迹点与其相邻目标轨迹点之间的相似度;
分组模块1203,用于对所述多个目标轨迹点进行分组,得到多组目标轨迹点;
第二确定模块1204,用于基于每组目标轨迹点对应的总相似度,确定所述行程轨迹中的异常轨迹点;
第一清洗模块1205,用于对所述异常轨迹点进行清洗。
在一种可能的实施方式中,第一获取模块1201获取目标订单对应的行程轨迹中的多个目标轨迹点,包括:
对所述目标订单对应的行程轨迹进行网格化处理,确定包括所述行程轨迹中各个轨迹点的目标网格;
从每个所述目标网格包括的至少一个轨迹点中,选取每个所述目标网格对应的目标轨迹点,得到所述行程轨迹对应的多个目标轨迹点。
在一种可能的实施方式中,第一获取模块1201从每个所述目标网格包括的至少一个轨迹点中,选取每个所述目标网格对应的目标轨迹点,包括:
获取每个所述目标网格包括的至少一个轨迹点;
针对每个所述目标网格,从该目标网格包括的至少一个轨迹点中选取距离所述目标网格的中心点最近的一个轨迹点,作为该目标网格对应的目标轨迹点;或者,从该目标网格包括的至少一个轨迹点中随机选取一个轨迹点,作为该目标网格对应的目标轨迹点。
在一种可能的实施方式中,所述数据清洗装置1200还包括:
第二获取模块,用于基于每个所述目标轨迹点与其相邻目标轨迹点之间的相似度,获取对应的相似度满足第一阈值的第一目标轨迹点和对应的相似度满足第二阈值的第二目标轨迹点;
第三获取模块,用于针对任意两个相邻的第一目标轨迹点,获取该两个相邻的第一目标轨迹点之间的第二目标轨迹点的个数;
第二清洗模块,用于若所述第二目标轨迹点的个数小于第三阈值,则对所述第二目标轨迹点进行清洗。
在一种可能的实施方式中,第一确定模块1202基于每个所述目标轨迹点与该目标轨迹点对应的相邻目标轨迹点之间的距离,确定该目标轨迹点与其相邻目标轨迹点之间的相似度,包括:
针对每个所述目标轨迹点,计算该目标轨迹点和该目标轨迹点之前的第一相邻目标轨迹点之间的欧式距离;
根据所述欧式距离与第四阈值的比较结果,确定该目标轨迹点与其相邻目标轨迹点之间的相似度。
在一种可能的实施方式中,第一确定模块1202基于每个所述目标轨迹点与该目标轨迹点对应的相邻目标轨迹点之间的距离,确定该目标轨迹点与其相邻目标轨迹点之间的相似度,还包括:
针对每个所述目标轨迹点,根据该目标轨迹点和该目标轨迹点之前的第一相邻目标轨迹点确定第一线段,以及,根据该目标轨迹点和该目标轨迹点之后的第二相邻目标轨迹点确定第二线段;
根据所述第一线段和所述第二线段之间的度量参数,确定该目标轨迹点与其相邻目标轨迹点之间的相似度。
在一种可能的实施方式中,第一确定模块1202根据所述第一线段和所述第二线段之间的度量参数,确定该目标轨迹点与其相邻目标轨迹点之间的相似度,包括:
根据每一个所述度量参数及该度量参数对应的权重值,确定参考分值;根据所述参考分值与第五阈值的比较结果,确定该目标轨迹点与其相邻目标轨迹点之间的相似度;
或者,
根据所述度量参数与所述度量参数对应的第六阈值的比较结果,确定该目标轨迹点与其相邻目标轨迹点之间的相似度。
在一种可能的实施方式中,所述度量参数包括以下至少之一:
所述第一线段与所述第二线段之间的长度差;
所述第一线段对应的第一方向与所述第二线段对应的第二方向的夹角;其中,所述第一方向为所述第一相邻目标轨迹点指向所述目标轨迹点的方向,所述第二方向为所述目标轨迹点指向所述第二相邻目标轨迹点的方向。
在一种可能的实施方式中,第二确定模块1204基于每组目标轨迹点对应的总相似度,确定所述行程轨迹中的异常轨迹点,包括:
根据每组目标轨迹点中每一个目标轨迹点对应的相似度,确定该组目标轨迹点对应的总相似度;
若该组目标轨迹点对应的总相似度位于预设阈值范围内,则确定该组目标轨迹点为异常轨迹点。
在一种可能的实施方式中,所述数据清洗装置1200还包括:
第四获取模块,用于在对所述异常轨迹点进行清洗之后,获取所述目标订单对应的清洗后的目标行程轨迹;
第三确定模块,用于基于所述目标行程轨迹,确定所述目标订单对应的服务信息;
发送模块,用于将所述服务信息发送给用户端。
在一种可能的实施方式中,所述数据清洗装置1200还包括:
第五获取模块,用于在对所述异常轨迹点进行清洗之后,获取所述目标订单对应的清洗后的目标行程轨迹;
输入模块,用于将所述目标行程轨迹作为一种行车特征输入到训练好的绕路检测模型中,得到所述目标订单是否绕路的检测结果。
本申请实施例提供了一种数据清洗装置,在获取到目标订单对应的行程轨迹中的多个目标轨迹点后,基于每个目标轨迹点与该目标轨迹点对应的相邻目标轨迹点之间的距离,确定该目标轨迹点与其相邻目标轨迹点之间的相似度;再对多个目标轨迹点进行分组,并基于每组目标轨迹点对应的总相似度,确定行程轨迹中的异常轨迹点,并对异常轨迹点进行清洗。这样,通过对目标订单对应的行程轨迹中的异常轨迹点进行清洗,提高了服务器的处理效率以及对行程中轨迹点的处理结果的准确度,进而提高了网约车平台的服务质量。
如图13所示,本申请实施例还提供了一种电子设备1300,所述电子设备1300包括:处理器1301、存储器1302和总线,所述存储器1302存储有所述处理器1301可执行的机器可读指令,当电子设备运行时,所述处理器1301与所述存储器1302之间通过总线通信,所述处理器1301执行所述机器可读指令,以执行如上述实施例提供的数据清洗方法的步骤。
具体地,上述存储器1302和处理器1301能够为通用的存储器和处理器,这里不做具体限定,当处理器1301运行存储器1302存储的计算机程序时,能够执行上述实施例提供的数据清洗方法。
对应于上述数据清洗方法,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述实施例提供的数据清洗方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考方法实施例中的对应过程,本申请中不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (13)

1.一种数据清洗方法,其特征在于,所述方法包括:
获取目标订单对应的行程轨迹中的多个目标轨迹点;
基于每个所述目标轨迹点与该目标轨迹点对应的相邻目标轨迹点之间的距离,确定该目标轨迹点与其相邻目标轨迹点之间的相似度;
对所述多个目标轨迹点进行分组,得到多组目标轨迹点;
基于每组目标轨迹点对应的总相似度,确定所述行程轨迹中的异常轨迹点,并对所述异常轨迹点进行清洗;
其中,所述基于每组目标轨迹点对应的总相似度,确定所述行程轨迹中的异常轨迹点,包括:根据每组目标轨迹点中每一个目标轨迹点对应的相似度,确定该组目标轨迹点对应的总相似度;若该组目标轨迹点对应的总相似度位于预设阈值范围内,则确定该组目标轨迹点为异常轨迹点。
2.根据权利要求1所述的数据清洗方法,其特征在于,所述获取目标订单对应的行程轨迹中的多个目标轨迹点,包括:
对所述目标订单对应的行程轨迹进行网格化处理,确定包括所述行程轨迹中各个轨迹点的目标网格;
从每个所述目标网格包括的至少一个轨迹点中,选取每个所述目标网格对应的目标轨迹点,得到所述行程轨迹对应的多个目标轨迹点。
3.根据权利要求2所述的数据清洗方法,其特征在于,所述从每个所述目标网格包括的至少一个轨迹点中,选取每个所述目标网格对应的目标轨迹点,包括:
获取每个所述目标网格包括的至少一个轨迹点;
针对每个所述目标网格,从该目标网格包括的至少一个轨迹点中选取距离所述目标网格的中心点最近的一个轨迹点,作为该目标网格对应的目标轨迹点;或者,从该目标网格包括的至少一个轨迹点中随机选取一个轨迹点,作为该目标网格对应的目标轨迹点。
4.根据权利要求1所述的数据清洗方法,其特征在于,所述方法还包括:
基于每个所述目标轨迹点与其相邻目标轨迹点之间的相似度,获取对应的相似度满足第一阈值的第一目标轨迹点和对应的相似度满足第二阈值的第二目标轨迹点;
针对任意两个相邻的第一目标轨迹点,获取该两个相邻的第一目标轨迹点之间的第二目标轨迹点的个数;
若所述第二目标轨迹点的个数小于第三阈值,则对所述第二目标轨迹点进行清洗。
5.根据权利要求1所述的数据清洗方法,其特征在于,所述基于每个所述目标轨迹点与该目标轨迹点对应的相邻目标轨迹点之间的距离,确定该目标轨迹点与其相邻目标轨迹点之间的相似度,包括:
针对每个所述目标轨迹点,计算该目标轨迹点和该目标轨迹点之前的第一相邻目标轨迹点之间的欧式距离;
根据所述欧式距离与第四阈值的比较结果,确定该目标轨迹点与其相邻目标轨迹点之间的相似度。
6.根据权利要求1所述的数据清洗方法,其特征在于,所述基于每个所述目标轨迹点与该目标轨迹点对应的相邻目标轨迹点之间的距离,确定该目标轨迹点与其相邻目标轨迹点之间的相似度,还包括:
针对每个所述目标轨迹点,根据该目标轨迹点和该目标轨迹点之前的第一相邻目标轨迹点确定第一线段,以及,根据该目标轨迹点和该目标轨迹点之后的第二相邻目标轨迹点确定第二线段;
根据所述第一线段和所述第二线段之间的度量参数,确定该目标轨迹点与其相邻目标轨迹点之间的相似度。
7.根据权利要求6所述的数据清洗方法,其特征在于,所述根据所述第一线段和所述第二线段之间的度量参数,确定该目标轨迹点与其相邻目标轨迹点之间的相似度,包括:
根据每一个所述度量参数及该度量参数对应的权重值,确定参考分值;根据所述参考分值与第五阈值的比较结果,确定该目标轨迹点与其相邻目标轨迹点之间的相似度;
或者,
根据所述度量参数与所述度量参数对应的第六阈值的比较结果,确定该目标轨迹点与其相邻目标轨迹点之间的相似度。
8.根据权利要求6所述的数据清洗方法,其特征在于,所述度量参数包括以下至少之一:
所述第一线段与所述第二线段之间的长度差;
所述第一线段对应的第一方向与所述第二线段对应的第二方向的夹角;其中,所述第一方向为所述第一相邻目标轨迹点指向所述目标轨迹点的方向,所述第二方向为所述目标轨迹点指向所述第二相邻目标轨迹点的方向。
9.根据权利要求1所述的数据清洗方法,其特征在于,在对所述异常轨迹点进行清洗之后,所述方法还包括:
获取所述目标订单对应的清洗后的目标行程轨迹;
基于所述目标行程轨迹,确定所述目标订单对应的服务信息;
将所述服务信息发送给用户端。
10.根据权利要求1所述的数据清洗方法,其特征在于,在对所述异常轨迹点进行清洗之后,所述方法还包括:
获取所述目标订单对应的清洗后的目标行程轨迹;
将所述目标行程轨迹作为一种行车特征输入到训练好的绕路检测模型中,得到所述目标订单是否绕路的检测结果。
11.一种数据清洗装置,其特征在于,所述装置包括:
第一获取模块,用于获取目标订单对应的行程轨迹中的多个目标轨迹点;
第一确定模块,用于基于每个所述目标轨迹点与该目标轨迹点对应的相邻目标轨迹点之间的距离,确定该目标轨迹点与其相邻目标轨迹点之间的相似度;
分组模块,用于对所述多个目标轨迹点进行分组,得到多组目标轨迹点;
第二确定模块,用于基于每组目标轨迹点对应的总相似度,确定所述行程轨迹中的异常轨迹点;
第一清洗模块,用于对所述异常轨迹点进行清洗;
第二确定模块基于每组目标轨迹点对应的总相似度,确定所述行程轨迹中的异常轨迹点,包括:根据每组目标轨迹点中每一个目标轨迹点对应的相似度,确定该组目标轨迹点对应的总相似度;若该组目标轨迹点对应的总相似度位于预设阈值范围内,则确定该组目标轨迹点为异常轨迹点。
12.一种电子设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如权利要求1至10任一项所述的数据清洗方法的步骤。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至10任一项所述的数据清洗方法的步骤。
CN202010307261.3A 2020-04-17 2020-04-17 一种数据清洗方法、装置、电子设备及存储介质 Active CN111651437B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010307261.3A CN111651437B (zh) 2020-04-17 2020-04-17 一种数据清洗方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010307261.3A CN111651437B (zh) 2020-04-17 2020-04-17 一种数据清洗方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN111651437A CN111651437A (zh) 2020-09-11
CN111651437B true CN111651437B (zh) 2021-05-11

Family

ID=72346607

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010307261.3A Active CN111651437B (zh) 2020-04-17 2020-04-17 一种数据清洗方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN111651437B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112597137A (zh) * 2020-12-03 2021-04-02 广州启盟信息科技有限公司 位置感应数据清洗处理方法、装置及系统
CN113465616B (zh) * 2021-06-28 2023-06-16 湖北亿咖通科技有限公司 轨迹异常点检测方法和装置、电子设备及存储介质
CN113836123A (zh) * 2021-07-22 2021-12-24 南京沃旭通讯科技有限公司 一种基于距离、角度的轨迹清洗方法
CN113657340B (zh) * 2021-08-26 2023-09-05 重庆紫光华山智安科技有限公司 轨迹匹配方法及相关装置
CN115829584A (zh) * 2022-12-02 2023-03-21 首约科技(北京)有限公司 飘点的确定方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105225494A (zh) * 2015-11-03 2016-01-06 中兴软创科技股份有限公司 基于电子警察数据的车辆轨迹跟踪方法与装置
CN107016126A (zh) * 2017-05-12 2017-08-04 西南交通大学 一种基于序列模式挖掘的多用户模型移动轨迹预测方法
CN110276020A (zh) * 2019-04-22 2019-09-24 阿里巴巴集团控股有限公司 识别用户出行目的地的方法和装置
CN110646824A (zh) * 2019-09-30 2020-01-03 郑州威科姆华大北斗导航科技有限公司 一种多种定位方式实现运动轨迹漂移点过滤计算的方法
CN110749319A (zh) * 2018-12-19 2020-02-04 北京嘀嘀无限科技发展有限公司 一种路线偏移检测的方法、装置和电子设备

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8462987B2 (en) * 2009-06-23 2013-06-11 Ut-Battelle, Llc Detecting multiple moving objects in crowded environments with coherent motion regions
CN101719220A (zh) * 2009-12-02 2010-06-02 北京航空航天大学 基于有向截尾均值距离的轨迹聚类方法
CN104239556B (zh) * 2014-09-25 2017-07-28 西安理工大学 基于密度聚类的自适应轨迹预测方法
CN106650771A (zh) * 2016-09-29 2017-05-10 百度在线网络技术(北京)有限公司 基于聚类分析的轨迹去噪方法以及装置
US11562168B2 (en) * 2018-07-16 2023-01-24 Here Global B.V. Clustering for K-anonymity in location trajectory data
CN109583505A (zh) * 2018-12-05 2019-04-05 百度在线网络技术(北京)有限公司 一种多传感器的物体关联方法、装置、设备及介质
CN110162586B (zh) * 2019-05-24 2021-10-19 中国科学院地理科学与资源研究所 一种适用于移动目标分支轨迹的相似度查询系统及方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105225494A (zh) * 2015-11-03 2016-01-06 中兴软创科技股份有限公司 基于电子警察数据的车辆轨迹跟踪方法与装置
CN107016126A (zh) * 2017-05-12 2017-08-04 西南交通大学 一种基于序列模式挖掘的多用户模型移动轨迹预测方法
CN110749319A (zh) * 2018-12-19 2020-02-04 北京嘀嘀无限科技发展有限公司 一种路线偏移检测的方法、装置和电子设备
CN110276020A (zh) * 2019-04-22 2019-09-24 阿里巴巴集团控股有限公司 识别用户出行目的地的方法和装置
CN110646824A (zh) * 2019-09-30 2020-01-03 郑州威科姆华大北斗导航科技有限公司 一种多种定位方式实现运动轨迹漂移点过滤计算的方法

Also Published As

Publication number Publication date
CN111651437A (zh) 2020-09-11

Similar Documents

Publication Publication Date Title
CN111651437B (zh) 一种数据清洗方法、装置、电子设备及存储介质
Hashemi et al. A critical review of real-time map-matching algorithms: Current issues and future directions
CN110969857B (zh) 一种交通信息处理方法及装置
US9738279B2 (en) Method for determining a lane course of a lane
CN111326015A (zh) 一种停车点推荐方法及装置
CN111856521B (zh) 数据处理方法、装置、电子设备和存储介质
EP3432287A1 (en) Navigation driving metric
CN111696343A (zh) 一种轨迹数据处理方法及装置
JP6708134B2 (ja) 走行データ収集システム、及び走行データ収集センタ
CN111324824A (zh) 一种目的地推荐方法、其装置、电子设备及可读存储介质
WO2015068030A1 (en) Vehicle position identifying system and vehicle position identifying method
CN110782656B (zh) 一种道路瓶颈点识别方法、装置、电子设备及存储介质
CN111832376A (zh) 一种车辆逆行检测方法、装置、电子设备及存储介质
CN109726489A (zh) 一种建立辅助驾驶数据库的方法及系统
CN111860904B (zh) 上车点排序的方法及装置
CN111859171A (zh) 一种信息推送方法、装置、电子设备及存储介质
CN111415024A (zh) 一种到达时间预估方法以及预估装置
CN111323035A (zh) 一种行驶偏航的检测方法、检测装置及可读存储介质
Hashemi A testbed for evaluating network construction algorithms from GPS traces
CN110542425A (zh) 导航路径选择方法、导航装置、计算机设备及可读介质
CN112561643B (zh) 一种拼车订单处理方法、装置、电子设备及存储介质
CN111859176B (zh) 一种信息推荐方法、装置、电子设备及存储介质
CN110798793B (zh) 车辆间相对位置确定方法、装置
CN111832768A (zh) 一种poi特征的生成方法、装置、电子设备和存储介质
CN111831931B (zh) 一种上车点排序、信息排序的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant