CN111881225A - 一种修正上车点名称的方法和系统 - Google Patents

一种修正上车点名称的方法和系统 Download PDF

Info

Publication number
CN111881225A
CN111881225A CN202010248720.5A CN202010248720A CN111881225A CN 111881225 A CN111881225 A CN 111881225A CN 202010248720 A CN202010248720 A CN 202010248720A CN 111881225 A CN111881225 A CN 111881225A
Authority
CN
China
Prior art keywords
recommended
point
poi
cluster
names
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010248720.5A
Other languages
English (en)
Inventor
陈铭权
吴治斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Didi Infinity Technology and Development Co Ltd
Original Assignee
Beijing Didi Infinity Technology and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Didi Infinity Technology and Development Co Ltd filed Critical Beijing Didi Infinity Technology and Development Co Ltd
Priority to CN202010248720.5A priority Critical patent/CN111881225A/zh
Publication of CN111881225A publication Critical patent/CN111881225A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Economics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Remote Sensing (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Navigation (AREA)

Abstract

本申请实施例公开了一种修正上车点名称的方法和系统。所述方法包括:从多个历史运输订单中获取多个推荐上车点,所述推荐上车点由运输服务平台从推荐上车点数据库中选择并推荐,所述推荐上车点包括位置信息以及上车点名称;基于所述多个推荐上车点的位置信息,利用聚类算法将所述多个推荐上车点分成一个或以上类簇;基于所述一个或以上类簇,确定一个或以上POI区域及其名称;基于所述一个或以上POI区域的名称对各POI区域内部的推荐上车点在推荐上车点数据库中的上车点名称进行修正。本申请通过基于一个或以上POI区域的名称对各POI区域内部的推荐上车点在推荐上车点数据库中的上车点名称进行修正,提高了各推荐上车点的名称合理性。

Description

一种修正上车点名称的方法和系统
技术领域
本申请涉及出行技术领域,特别涉及一种修正上车点名称的方法和系统。
背景技术
随着互联网技术的发展,公众越来越愿意选择网约车出行。用户在使用网约车平台打车时,网约车平台可以根据用户的当前位置定位、历史打车习惯或者根据用户输入的检索词等,从推荐上车点数据库中选择并向用户推荐上车点。但是由于,比如,推荐上车点数据库中上车点的名称一开始就命名错误、推荐上车点数据库数据更新不及时等原因,网约车平台推荐的推荐上车点的名称有可能是不准确的。这就可能导致司机接驾地址有较大偏差,降低网约车平台的运行效率并给司乘带来不好的用户体验。因此,针对上述问题,有必要提供一种修正上车点名称的方法和系统以自动识别出不准确的上车点名称,并对所述不准确的上车点名称进行修正。
发明内容
本申请实施例之一提供一种修正上车点名称的方法。所述方法包括:从多个历史运输订单中获取多个推荐上车点,所述推荐上车点由运输服务平台从推荐上车点数据库中选择并推荐,所述推荐上车点包括位置信息以及上车点名称;基于所述多个推荐上车点的位置信息,利用聚类算法将所述多个推荐上车点分成一个或以上类簇;基于所述一个或以上类簇,确定一个或以上POI区域及其名称;基于所述一个或以上POI区域的名称对各POI区域内部的推荐上车点在推荐上车点数据库中的上车点名称进行修正。
本申请实施例之一提供一种修正上车点名称的系统。所述系统包括:获取模块,用于从多个历史运输订单中获取多个推荐上车点,所述推荐上车点由运输服务平台从推荐上车点数据库中选择并推荐,所述推荐上车点包括位置信息以及上车点名称;聚类模块,用于基于所述多个推荐上车点的位置信息,利用聚类算法将所述多个推荐上车点分成一个或以上类簇;确定模块,用于基于所述一个或以上类簇,确定一个或以上POI区域及其名称;修正模块,用于基于所述一个或以上POI区域的名称对各POI区域内部的推荐上车点在推荐上车点数据库中的上车点名称进行修正。
本申请实施例之一提供一种修正上车点名称的装置。所述装置包括至少一个处理器和至少一个存储设备,所述存储设备用于存储指令,当所述至少一个处理器执行所述指令时,实现本申请实施例中任一项所述的方法。
本申请实施例之一提供一种计算机可读存储介质,所述存储介质存储计算机指令,当计算机读取所述存储介质中的所述计算机指令后,所述计算机执行本申请实施例中任一项所述的方法。
附图说明
本申请将以示例性实施例的方式进一步说明,这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的,在这些实施例中,相同的编号表示相同的结构,其中:
图1是根据本申请的一些实施例所示的上车点名称修正系统的示例性应用场景示意图;
图2是根据本申请的一些实施例所示的上车点名称修正系统的示例性模块图;
图3是根据本申请的一些实施例所示的修正上车点名称的示例性流程图;
图4是根据本申请的一些实施例所示的POI区域的示意图;
图5是根据本申请的一些实施例所示的迭代修正上车点名称的示例性流程图;以及
图6是根据本申请的一些实施例所示的训练评估模型的示例性流程图。
具体实施方式
为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其它类似情景。除非从语言环境中显而易见或另做说明,图中相同标号代表相同结构或操作。
应当理解,本文使用的“系统”、“装置”、“单元”和/或“模组”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换所述词语。
如本申请和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。
本申请中使用了流程图用来说明根据本申请的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
本申请的实施例可以应用于不同的运输系统,例如,出租车、专车、顺风车、巴士、代驾等。本申请描述的“乘客”、“乘客端”、“乘客终端”、“顾客”、“需求者”、“服务需求者”、“服务请求者”、“消费者”、“消费方”、“使用需求者”等是可以互换的,是指需要或者订购服务的一方,可以是个人,也可以是工具。同样地,本申请描述的“司机”、“司机端”、“司机终端”、“提供者”、“供应者”、“服务提供者”、“服务者”、“服务方”等也是可以互换的,是指提供服务或者协助提供服务的个人、工具或者其他实体等。另外,本申请描述的“用户”可以是需要或者订购服务的一方,也可以是提供服务或者协助提供服务的一方。
图1是根据本申请的一些实施例所示的上车点名称修正系统的示例性应用场景示意图。
在运输服务行业中,运输服务平台常常会根据一些策略(如基于定位、用户习惯或用户检索词等)从推荐上车点数据库中选择并向用户推荐运输相关地点名称,如上车点名称,然而在一些具体场景中,由于比如,服务平台最开始对推荐上车点数据库中的某些上车点的命名就是错误的或某些地点已经更名,但是推荐上车点数据库中对应这些地点的上车点没有相应更新等原因,可能导致推荐的地点名称不准确,为此,有必要提供一种修正上车点名称的方法及系统,对不准确的地点名称进行自动检测并相应修正。
上车点名称修正系统100可以从多个历史运输订单中获取多个推荐上车点并基于所述多个推荐上车点的位置信息,利用聚类算法将所述多个推荐上车点分成一个或以上类簇,然后基于所述一个或以上类簇,确定一个或以上POI(Point of Interest,兴趣点)区域及其名称。进一步,上车点名称修正系统100可以基于所述一个或以上POI区域的名称对各POI区域内部的推荐上车点在推荐上车点数据库中的上车点名称进行修正。上车点名称修正系统100可以是用于互联网或者其它网络的服务平台。例如,上车点名称修正系统100可以用于为交通运输提供服务的线上服务平台。在一些实施例中,上车点名称修正系统100可以应用于网约车服务,例如出租车呼叫、快车呼叫、专车呼叫、小巴呼叫、拼车、公交服务、司机雇佣和接送服务等。在一些实施例中,上车点名称修正系统100还可以应用于代驾、快递、外卖等。在另一些实施例中,上车点名称修正系统100还可以应用于出行(如旅游)服务领域。上车点名称修正系统100可以包括服务器110、网络120、服务请求者终端130、服务提供者终端140和存储设备150。
在一些实施例中,服务器110可以用于处理与服务请求有关的信息和/或数据,例如,用于处理在线打车的服务请求。具体的,服务器可以从服务请求者终端130接收服务请求,并处理该服务请求以向服务请求者终端130推荐上车点名称。又例如,服务器可以向服务提供者终端140分配服务请求。在一些实施例中,服务器110可以是单个的服务器或者服务器群组。所述服务器群可以是集中式的或分布式的(例如,服务器110可以是分布式的系统)。在一些实施例中,服务器110可以是本地的或远程的。例如,服务器110可以通过网络120访问存储在服务请求者终端130、存储设备150中的信息和/或数据。再例如,服务器110可以直接连接到服务请求者终端130、存储设备150以访问存储的信息和/或数据。在一些实施例中,服务器110可以在一个云平台上实现。仅作为示例,所述云平台可以包括私有云、公共云、混合云、社区云、分布云、云之间、多重云等或上述举例的任意组合。
网络120可以促进信息和/或数据的交换。在一些实施例中,上车点名称修正系统100中的一个或以上组件(例如,服务器110、服务请求者终端130、服务提供者终端140和存储设备150)可以通过网络120向/从上车点名称修正系统100中的其他组件发送/接收信息和/或数据。例如,服务器110可以通过网络120从/向服务请求者终端130或服务提供者终端140接收/分配服务请求。在一些实施例中,网络120可以为任意形式的有线或无线网络或其任意组合。仅作为示例,网络120可以包括缆线网络、有线网络、光纤网络、远程通信网络、内部网络、互联网、局域网(LAN)、广域网(WAN)、无线局域网(WLAN)、城域网(MAN)、广域网(WAN)、公共交换电话网络(PSTN)、蓝牙网络、紫蜂网络、近场通讯(NFC)网络、全球移动通讯系统(GSM)网络、码分多址(CDMA)网络、时分多址(TDMA)网络、通用分组无线服务(GPRS)网络、增强数据速率GSM演进(EDGE)网络、宽带码分多址接入(WCDMA)网络、高速下行分组接入(HSDPA)网络、长期演进(LTE)网络、用户数据报协议(UDP)网络、传输控制协议/互联网协议(TCP/IP)网络、短讯息服务(SMS)网络、无线应用协议(WAP)网络、超宽带(UWB)网络、红外线等或其任意组合。在一些实施例中,上车点名称修正系统100可以包括一个或以上网络接入点。例如,上车点名称修正系统100可以包括有线或无线网络接入点,例如基站和/或无线接入点120-1、120-2、…,上车点名称修正系统100的一个或以上组件可以通过其连接到网络120以交换数据和/或信息。
在一些实施例中,服务请求者终端130和/或服务提供者终端140可以是与请求直接相关的个人、工具或其他实体。服务请求者可以使用服务请求者终端130发送运输订单请求,该运输订单请求中可以包括推荐上车点(服务请求者发单前由平台根据用户的定位信息、检索词或者历史打车行为推荐)、发单时间、起始地、目的地等数据。服务器110接收到该运输订单请求后,为该运输订单请求匹配服务提供者,然后向该服务提供者终端140发送该运输订单。服务提供者终端140接收该运输订单后去接送服务请求者。
在一些实施例中,服务请求者终端130可以包括移动设备130-1、平板电脑130-2、笔记本电脑130-3、以及机动车辆中的车载设备130-4等或其任意组合。在一些实施例中,移动设备130-1可以包括智能家居设备、可穿戴设备、智能移动设备、虚拟现实设备、增强现实设备等或其任意组合。在一些实施例中,智能家居设备可以包括智能照明设备、智能电器控制设备、智能监控设备、智能电视、智能摄像机、对讲机等或其任意组合。在一些实施例中,可穿戴设备可以包括智能手镯、智能鞋袜、智能眼镜、智能头盔、智能手表、智能穿着、智能背包、智能配件等或其任意组合。在一些实施例中,智能移动设备可以包括智能电话、个人数字助理(PDA)、游戏设备、导航设备、销售点(POS)等或其任意组合。在一些实施例中,虚拟现实设备和/或增强现实设备可以包括虚拟现实头盔、虚拟现实眼镜、虚拟现实眼罩、增强型虚拟现实头盔、增强现实眼镜、增强现实眼罩等或其任意组合。例如,虚拟现实设备和/或增强现实设备可以包括Google Glass、Oculus Rift、HoloLens或Gear VR等。在一些实施例中,机动车辆中的车载设备130-4可以包括车载计算机、车载电视等。在一些实施例中,服务请求者终端130可以是具有定位技术的设备,用于定位服务请求者和/或服务请求者终端130的位置。
在一些实施例中,服务提供者终端140可以与服务请求者终端130类似或相同的设备。在一些实施例中,服务请求者终端130/服务提供者终端140可以是具有定位功能的装置。在一些实施例中,服务请求者终端130和/或服务提供者终端140可以与另一定位设备通信以确定服务请求者、服务请求者终端130、服务提供者和/或服务提供者终端140的位置。在一些实施例中,服务提供者终端140可以包括移动设备140-1、平板电脑140-2、笔记本电脑140-3、以及机动车辆中的车载设备140-4等或其任意组合。在一些实施例中,服务请求者终端130和/或服务提供者终端140可以将位置信息发送到服务器110。
存储设备150可以存储与服务请求相关的数据和/或指令。在一些实施例中,存储设备150可以存储从服务请求者终端130和/或服务提供者终端140获得/获取的数据。在一些实施例中,存储设备150可以存储推荐上车点数据库、历史运输订单、聚类算法、初始机器学习模型等等。在一些实施例中,存储设备150可以存储服务器110用于执行或使用来完成本申请中描述的示例性方法的数据和/或指令。在一些实施例中,存储设备150可以包括大容量存储器、可移动存储器、易失性读写存储器、只读存储器(ROM)等或其任意组合。示例性的大容量储存器可以包括磁盘、光盘、固态磁盘等。示例性可移动存储器可以包括闪存驱动器、软盘、光盘、存储卡、压缩盘、磁带等。示例性的挥发性只读存储器可以包括随机存取内存(RAM)。示例性的RAM可包括动态RAM(DRAM)、双倍速率同步动态RAM(DDR SDRAM)、静态RAM(SRAM)、闸流体RAM(T-RAM)和零电容RAM(Z-RAM)等。示例性的ROM可以包括掩模ROM(MROM)、可编程ROM(PROM)、可擦除可编程ROM(PEROM)、电子可擦除可编程ROM(EPEROM)、光盘ROM(CD-ROM)和数字通用磁盘ROM等。在一些实施例中,所述存储设备150可以在云平台上实现。仅作为示例,所述云平台可以包括私有云、公共云、混合云、社区云、分布云、内部云、多层云等或其任意组合。
在一些实施例中,存储设备150可以连接到网络120以与上车点名称修正系统100中的一个或以上组件(例如,服务器110、服务请求者终端130、服务提供者终端140)通信。上车点名称修正系统100中的一个或以上组件可以通过网络120访问存储设备150中存储的数据或指令。在一些实施例中,存储设备150可以与上车点名称修正系统100中的一个或以上组件(例如,服务器110、服务请求者终端130、服务提供者终端140等)直接连接或通信。在一些实施例中,存储设备150可以是服务器110的一部分。
图2是根据本申请一些实施例所示的上车点名称修正系统的示例性模块图。该系统200可以从多个历史运输订单中获取多个推荐上车点并基于所述多个推荐上车点的位置信息,利用聚类算法将所述多个推荐上车点分成一个或以上类簇,然后基于所述一个或以上类簇,确定一个或以上POI区域及其名称。进一步,该系统200可以基于所述一个或以上POI区域的名称对各POI区域内部的推荐上车点在推荐上车点数据库中的上车点名称进行修正。如图2所示,系统200可以包括获取模块210、聚类模块220、确定模块230以及修正模块240。
获取模块210可以用于从多个历史运输订单中获取多个推荐上车点。关于从多个历史运输订单中获取多个推荐上车点的更多内容可以参见步骤310的描述,在此不作赘述。
聚类模块220可以用于基于所述多个推荐上车点的位置信息,利用聚类算法将所述多个推荐上车点分成一个或以上类簇。关于基于所述多个推荐上车点的位置信息,利用聚类算法将所述多个推荐上车点分成一个或以上类簇的更多内容可以参见步骤320的描述,在此不作赘述。
确定模块230可以用于基于所述一个或以上类簇,确定一个或以上POI区域及其名称。在一些实施例中,对所述一个或以上类簇中的每一个,确定模块230可以确定该类簇的中心点。进一步,确定模块230可以基于该类簇中一个或多个推荐上车点到该类簇的中心点的距离确定该类簇的类簇半径。基于该类簇的中心点及类簇半径,确定模块230可以确定其对应的POI区域。具体的,确定模块230可以指定该类簇的中心点为其对应的POI区域的中心,该类簇的类簇半径为其对应的POI区域的辐射半径。基于该类簇中的一个或多个推荐上车点的上车点名称,确定模块230可以确定该POI区域的名称。关于基于所述一个或以上类簇,确定一个或以上POI区域及其名称的更多内容可以参见步骤330的描述,在此不作赘述。
修正模块240可以用于基于所述一个或以上POI区域的名称对各POI区域内部的推荐上车点在推荐上车点数据库中的上车点名称进行修正。在一些实施例中,对所述一个或以上POI区域中的每一个,修正模块240可以将该POI区域的名称作为该POI区域内的推荐上车点的上车点名称。在一些实施例中,一个或多个推荐上车点属于两个或以上所述POI区域,所述一个或多个推荐上车点中的每一个的上车点名称包括所述两个或以上所述POI区域的名称。在一些实施例中,对所述一个或以上POI区域中的每一个,修正模块240可以基于该POI区域的中心到其中各推荐上车点的距离,确定该POI区域内各推荐上车点的名称置信度。关于基于所述一个或以上POI区域的名称对各POI区域内部的推荐上车点在推荐上车点数据库中的上车点名称进行修正的更多内容可以参见步骤340的描述,在此不作赘述。
修正模块240可以用于迭代进行利用经训练的评估模型对各POI区域内部的推荐上车点在推荐上车点数据库中的上车点名称进行修正的步骤,以及所述基于所述一个或以上POI区域的名称对各POI区域内部的推荐上车点在推荐上车点数据库中的上车点名称进行修正的步骤,直到满足迭代终止条件,得到各推荐上车点的最终的上车点名称。关于对各POI区域内部的推荐上车点在推荐上车点数据库中的上车点名称进行迭代修正的更多内容可以参见图5的描述,在此不作赘述。
修正模块240可以用于基于所述一个或多个推荐上车点以及所述一个或多个POI区域,获得一个或多个带标签的训练样本,以及利用所述一个或多个训练样本对初始机器学习模型进行训练,获得所述评估模型。关于通过训练初始机器学习模型获得评估模型的更多内容可以参见图6的描述,在此不作赘述。
应当理解,图2所示的系统及其模块可以利用各种方式来实现。例如,在一些实施例中,系统及其模块可以通过硬件、软件或者软件和硬件的结合来实现。其中,硬件部分可以利用专用逻辑来实现;软件部分则可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域技术人员可以理解上述的方法和系统可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本申请的系统及其模块不仅可以有诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用例如由各种类型的处理器所执行的软件实现,还可以由上述硬件电路和软件的结合(例如,固件)来实现。
需要注意的是,以上对于上车点名称修正系统及其模块的描述,仅为描述方便,并不能把本申请限制在所举实施例范围之内。可以理解,对于本领域的技术人员来说,在了解该系统的原理后,可能在不背离这一原理的情况下,对各个模块进行任意组合,或者构成子系统与其他模块连接。例如,在一些实施例中,例如,图2中披露的获取模块210、聚类模块220、确定模块230以及修正模块240可以是一个系统中的不同模块,也可以是一个模块实现上述的两个或两个以上模块的功能。例如,聚类模块220和确定模块230可以是两个模块,也可以是一个模块同时具有将所述多个推荐上车点分成一个或以上类簇和确定一个或以上POI区域及其名称的功能。例如,各个模块可以共用一个存储模块,各个模块也可以分别具有各自的存储模块。诸如此类的变形,均在本申请的保护范围之内。
图3是根据本申请的一些实施例所示的修正上车点名称的示例性流程图。在一些实施例中,流程300可以由服务器处理。本申请的服务器可以指的是图1中的服务器110。如图3所示,该修正上车点名称的方法可以包括:
步骤310,从多个历史运输订单中获取多个推荐上车点。具体的,步骤310可以由获取模块210执行。
在一些实施例中,运输订单可以包括快车订单、拼车订单、顺风车订单。在一些实施例中,历史运输订单可以包括当前时刻之前(如,6个月、3个月、1个月、1周)的运输订单。
在一些实施例中,所述推荐上车点可以由运输服务平台(如,上车点名称修正系统100中的服务器110)从推荐上车点数据库中选择并推荐。在一些实施例中,所述推荐上车点可以包括位置信息以及上车点名称。所述推荐上车点位置信息可以包括推荐上车点的经纬度。所述推荐上车点名称可以是推荐上车点对应的地理位置的名称。在一些实施例中,推荐上车点名称和位置信息可以对应并存储在存储器(如,上车点名称修正系统100中的存储设备150)中。服务器可以直接从所述存储器中获取所述推荐上车点的位置信息和名称。
在一些实施例中,运输服务平台可以基于服务请求者发送运输订单时的定位位置,或服务请求者发送运输订单时输入的检索词进行自动推荐。仅作为示例,服务器可以获取服务请求者的发单位置,并基于发单位置从推荐上车点数据库中召回一个或多个推荐上车点进行推荐。本申请对上车点推荐的策略不做任何限制。
在一些实施例中,运输订单中可以包含推荐上车点信息。如,来自历史运输订单的推荐上车点可以是运输服务平台推送后服务请求者接受(例如,服务请求者将其作为订单的起始地)的上车点,或者运输服务平台推送过但服务请求者未选用的上车点。例如,历史运输订单可以对运输服务平台向服务请求者推送的推荐上车点进行记录,在一些实施例中,历史运输订单还可以记录有服务请求者对推荐上车点的处置结果,包括但不限于接受或者忽略。
步骤320,基于所述多个推荐上车点的位置信息,利用聚类算法将所述多个推荐上车点分成一个或以上类簇。具体的,步骤320可以由聚类模块220执行。
在一些实施例中,聚类算法可以包括K-Means聚类算法、均值漂移聚类算法、具噪声基于密度的空间聚类算法、高斯混合模型的期望最大化聚类算法、凝聚层次聚类算法等等。在一些实施例中,类簇可以为多个推荐上车点的集合,这些推荐上车点的经纬度与同一个类簇中其他推荐上车点的经纬度的距离较近,与其他类簇中推荐上车点的经纬度的距离较远。
步骤330,基于所述一个或以上类簇,确定一个或以上POI区域及其名称。具体的,步骤330可以由确定模块230执行。在一些实施例中,服务器可以执行步骤330。
在一些实施例中,POI区域可以为多个定位点围成的封闭区域,该POI区域有对应的经纬度范围。在一些实施例中,POI区域有与之对应的POI区域的名称。POI区域的名称可以为区别某一POI区域与其他POI区域的专属名词,例如“XX小区”、“XX大厦”、“XX商场”等等。
在一些实施例中,对所述一个或以上类簇中的每一个,服务器可以确定该类簇的中心点。例如,服务器可以获取该类簇中一个或多个推荐上车点中的每一个的位置坐标,然后计算所述一个或多个推荐上车点的位置坐标的平均值作为该类簇的中心点的位置坐标。进一步,服务器可以基于该类簇中一个或多个推荐上车点到该类簇的中心点的距离确定该类簇的类簇半径。例如,服务器可以选取该类簇中的推荐上车点到该类簇的中心点的距离的最大值作为该类簇的类簇半径。基于该类簇的中心点及类簇半径,服务器可以确定其对应的POI区域。具体的,服务器可以指定该类簇的中心点为其对应的POI区域的中心,该类簇的类簇半径为其对应的POI区域的辐射半径。该类簇对应的POI区域可以为以该类簇的中心点为中心,以该类簇的类簇半径为半径的圆形区域。基于该类簇中的一个或多个推荐上车点的上车点名称服务器可以确定该POI区域的名称。仅作为示例,服务器可以指定该类簇中数量最多的推荐上车点的上车点名称作为该POI区域的名称。仅作为另一示例,服务器可以将该类簇的中心点对应的推荐上车点的上车点名称确定为该POI区域的名称。该类簇的中心点对应的推荐上车点可以是指中心点所在的推荐上车点或离中心点最近的推荐上车点。关于POI区域的更多内容可以参见图4的详细描述,在此不作赘述。
步骤340,基于所述一个或以上POI区域的名称对各POI区域内部的推荐上车点在推荐上车点数据库中的上车点名称进行修正。具体的,步骤340可以由修正模块240执行。
在一些实施例中,对所述一个或以上POI区域中的每一个,服务器可以将该POI区域的名称作为该POI区域内的推荐上车点的上车点名称。具体的,对于该POI区域内的推荐上车点,服务器可以判断该推荐上车点的名称是否与该POI区域的名称相同。如果该推荐上车点的名称与该POI区域的名称不相同,服务器可以修改该推荐上车点的名称为该POI区域的名称。例如,该POI区域的名称为“A大厦”,该POI区域内某个上车点a的名称为“B大厦”,则服务器可以修改该上车点a的名称为“A大厦”。
在一些实施例中,一个或多个推荐上车点属于两个或以上所述POI区域,所述一个或多个推荐上车点中的每一个的上车点名称包括所述两个或以上所述POI区域的名称。具体的,当一个或多个推荐上车点属于两个或以上所述POI区域时,则服务器可以根据所述两个或以上所述POI区域的名称修改该一个或多个推荐上车点的名称。例如,某个上车点c同时在名称为“A大厦”的POI区域和名称为“B大厦”的POI区域内,则服务器可以修改该上车点c的名称为“A大厦”和“B大厦间”。
在一些实施例中,可以对每个推荐上车点的上车点名称确定其名称置信度,该名称置信度反映了该上车点名称作为该推荐上车点的名称的合理性权重。在一些实施例中,对所述一个或以上POI区域中的每一个,服务器可以基于该POI区域的中心到其中各推荐上车点的距离,确定该POI区域内各推荐上车点的名称置信度。例如,所述名称置信度负相关于其推荐上车点到其所属POI区域的中心的距离和其所属POI区域的辐射半径的比例。例如,假设某个POI区域的辐射半径为100m,该POI区域内的某个上车点d距离该POI区域的中心的距离为50m,则该上车点d的名称置信度可以为x*100/50,其中x可以是服务器110的默认值,例如,1、10或100,也可以根据不同情况进行调整。服务器可以根据该上车点的名称置信度确定该上车点的名称是否合理。具体的,服务器可以确定该上车的名称置信度是否大于阈值。若该上车的名称置信度大于或等于阈值,则服务器可以确定该上车点的名称合理。若该上车的名称置信度小于阈值,则服务器可以确定该上车点的名称不合理。该阈值可以是服务器110的默认值,例如,1、10或100,也可以根据不同情况进行调整,例如根据上述x的取值调整。在一些实施例中,当服务器需要向服务请求者推荐上车点时,则可以优先选择推荐上车点数据库中名称置信度较高的上车点名称,进而提高了推荐准确性。又例如,当一些推荐上车点具有多个上车点名称时,可以将名称置信度较高的上车点名称作为其名称。
在一些实施例中,服务器可以迭代进行利用经训练的评估模型对各POI区域内部的推荐上车点在推荐上车点数据库中的上车点名称进行修正的步骤,以及所述基于所述一个或以上POI区域的名称对各POI区域内部的推荐上车点在推荐上车点数据库中的上车点名称进行修正的步骤,即步骤340,直到满足迭代终止条件,得到各推荐上车点的最终的上车点名称。关于推荐上车点数据库中的上车点名称的迭代的修订的更多内容可以参见图5的详细描述,在此不作赘述。
应当注意的是,上述有关流程300的描述仅仅是为了示例和说明,而不限定本申请的适用范围。对于本领域技术人员来说,在本申请的指导下可以对流程300进行各种修正和改变。然而,这些修正和改变仍在本申请的范围之内。例如,流程300中的步骤320和步骤330可以合并为一个步骤,在该步骤中可以同时将所述多个推荐上车点分成一个或以上类簇和确定一个或以上POI区域及其名称。又例如,x和阈值的取值可以不限于流程300中列举的数值,还可以为其他值。
图4是根据本申请的一些实施例所示的POI区域的示意图。
如图4所示,类簇1与类簇2是基于推荐上车点的位置信息聚类得到的。在一个类簇中,可能存在名称不相同的推荐上车点。例如,在类簇1中,具有名称1的推荐上车点表示为“※1”,具有其他名称的推荐上车点表示为“※2”;在类簇2中,具有名称1的推荐上车点表示为“△1”,具有其他名称的推荐上车点表示为“△2”。
O1为类簇1中心点的位置坐标,亦为类簇1对应的POI区域1的中心,其可以是类簇1中所有推荐上车点(例如,※1,※2)的位置坐标的平均值;O2为类簇2中心点的位置坐标,亦为类簇2对应的POI区域2的中心,其可以是类簇2中所有推荐上车点(例如“△1”,“△2”)的位置坐标的平均值。类簇1中所有推荐上车点(例如,※1,※2)距离POI区域1的中心O1的距离(例如,r1,R1)的最大值,如R1,可以作为与该POI区域1的辐射半径;类簇2中所有推荐上车点(例如“△1”,“△2”)距离POI区域2的中心O2的距离的最大值,如R2,可以作为与该POI区域2的辐射半径。POI区域1可以为以中心点O1为圆心,以辐射半径R1为半径的圆形区域;POI区域2可以为以中心点O2为圆心,以辐射半径R2为半径的圆形区域。类簇1中数量最多的推荐上车点※1的名称1作为POI区域1的名称;类簇2中数量最多的推荐上车点△2的名称2作为POI区域2的名称。
如果POI区域1中的推荐上车点的名称与POI区域1的名称不同,例如推荐上车点※2,则修改该推荐上车点※2的名称为POI区域1的名称1;如果POI区域2中的推荐上车点的名称与POI区域2的名称不同,例如推荐上车点△1,则修改该推荐上车点△1的名称为POI区域2的名称2。如图4所示,POI区域1和POI区域2可能具有交叉区域,在该交叉区域内的推荐上车点e的名称可以包括POI区域1和POI区域2的名称,例如该推荐上车点e名称可以为名称1+名称2。
在POI区域1内的推荐上车点(例如,※1,※2)的名称置信度可以基于该推荐上车点距离POI区域1的中心点O1的距离和POI区域1的辐射半径R1确定。例如,距离中心点O1的距离为r1的推荐上车点名称置信度与r1/R1负相关。在POI区域2内的推荐上车点(例如,“△1”,“△2”)的名称置信度可以基于该推荐上车点距离POI区域2的中心点O2的距离和POI区域2的辐射半径R2确定。例如,距离中心点O2的距离为r2的推荐上车点名称置信度与r2/R2负相关。
图5是根据本申请的一些实施例所示的迭代修正上车点名称的示例性流程图。在一些实施例中,流程500可以由服务器处理。在一些实施例中,流程500可以由修正模块240执行。如图5所示,该迭代修正上车点名称的方法可以包括:
步骤510,使用评估模型对各POI区域内部的推荐上车点在推荐上车点数据库中的上车点名称进行修正。
在一些实施例中,服务器可以获取各POI区域的特征数据和各POI区域内部的推荐上车点的特征数据。所述POI区域的特征数据可以包括辐射半径、中心、热度、属性、周围环境、与其他POI的关系以及所述中心与所述推荐上车点的距离中一种或多种的组合。POI区域的热度可以为乘客在该POI区域内部发送的历史运输订单的数量,该数量越多,表示该POI区域的热度越高。POI区域的属性可以指该POI区域可以归属的类别,比如公交站、地铁站、学校等等。POI区域的周围环境可以反映该POI区域的路况信息,包括但不限于人流量、是否有修路或者是否具有交通管制等信息。POI区域与其他POI区域的关系可以指该POI区域是其他POI区域的父POI区域或子POI区域,比如,名称为“XX大厦A座”的POI区域是名称为“XX大厦”的子POI区域,名称为“XX大厦”的POI区域是名称为“XX大厦A座”的父POI区域。所述推荐上车点的特征数据可以包括该推荐上车点的位置信息、该推荐上车点的类型、该推荐上车点热度中一种或多种的组合。推荐上车点的类型可以包括商圈、学校、地铁站、步行街、小区等。推荐上车点热度可以为乘客在该推荐上车点上车的历史运输订单的数量,该数量越多,表示该推荐上车点热度越高。
进一步,服务器可以使用评估模型处理各POI区域的特征数据和各POI区域内部的推荐上车点的特征数据(例如,将各推荐上车点中的每一个的特征数据与各POI区域的特征数据一一组合,输入评估模型),获得各推荐上车点的上车点名称的合理性分值。仅作为示例,合理性分值可以包括5分(非常合理)、4分(合理)、3分(较合理)、2分(不合理)和1分(非常不合理)等等。
基于该合理性分值,服务器可以修正各POI区域内部的推荐上车点在推荐上车点数据库中的上车点名称。仅作为示例,服务器可以将某一个推荐上车点得分最高的POI区域名称作为该推荐上车点在推荐上车点数据库中的上车点名称。
在一些实施例中,训练评估模型的方法可以包括获得一个或多个带标签的训练样本,然后利用所述一个或多个训练样本对初始机器学习模型进行训练,获得所述评估模型。关于评估模型的训练方法的更多内容可以参见图6的详细描述,在此不作赘述。
步骤520,基于所述一个或以上POI区域的名称对各POI区域内部的推荐上车点在推荐上车点数据库中的上车点名称进行修正。该步骤等同于流程300中的步骤340,其更多内容可以参见图3中步骤340的详细描述,在此不作赘述。
在一些实施例中,基于一个或以上POI区域的名称修正后的各POI区域内部的推荐上车点在推荐上车点数据库中的上车点名称可以被输入到评估模型以进行进一步修正,即迭代的执行步骤510和步骤520,直到满足迭代终止条件,得到各推荐上车点的最终的上车点名称。该迭代终止条件可以为执行预设数量的迭代次数或各POI区域内部的推荐上车点在推荐上车点数据库中的上车点名称不再发生变化。该预设数量的迭代次数可以是服务器110的默认值,例如,100次、500次,也可以根据不同情况进行调整。
在一些实施例中,基于一个或以上POI区域的名称修正后的各POI区域内部的推荐上车点在推荐上车点数据库中的上车点名称还可以被用于训练评估模型,然后再利用训练好的评估模型对各POI区域内部的推荐上车点在推荐上车点数据库中的上车点名称进行修正,即执行步骤510,如此迭代循环,直到满足迭代终止条件,得到各推荐上车点的最终的上车点名称。
可以理解,使用两种修正方法迭代更新各推荐上车点的名称,可以进一步提高修正结果的准确性,根据修正结果更新推荐上车点数据库,可以进一步提高上车点推荐的准确性,改善用户体验。
应当注意的是,上述有关流程500的描述仅仅是为了示例和说明,而不限定本申请的适用范围。对于本领域技术人员来说,在本申请的指导下可以对流程500进行各种修正和改变。然而,这些修正和改变仍在本申请的范围之内。例如,合理性分值不限于步骤510中列举的分值,还可以为其他值,比如,100、90、80、…、30、20、10等等。
图6是根据本申请的一些实施例所示的训练评估模型的示例性流程图。在一些实施例中,流程600可以由服务器处理。在一些实施例中,流程600可以由修正模块240执行。如图6所示,该训练评估模型的方法可以包括:
步骤610,基于所述一个或多个推荐上车点以及所述一个或多个POI区域,获得一个或多个带标签的训练样本。
在一些实施例中,所述训练样本包括一个推荐上车点的特征数据与一个POI区域的特征数据。该推荐上车点的特征数据可以包括该推荐上车点到其对应POI区域的中心的距离、该推荐上车点的类型、该推荐上车点热度中一种或多种的组合。该POI区域的特征数据可以包括辐射半径、中心、热度、属性、周围环境、与其他POI的关系以及所述中心与所述推荐上车点的距离中一种或多种的组合。在一些实施例中,训练样本可以提取自历史运输订单,该历史运输订单可以是与前述历史运输订单不同的历史运输订单。在一些实例中,所述训练样本可以基于流程300修正后的推荐上车点以及POI区域获得训练样本。可以理解,训练样本的准确度得到了提升,进而得到的评估模型的预测准确度也会得到优化。
在一些实施例中,所述训练样本的标签反映所述POI区域的名称为所述推荐上车点的上车点名称的名称置信度。在一些实施例中,名称置信度可以基于用户的反馈结果获得(如用户对某次推荐上车点的反馈为满意,可以确定该推荐上车点的名称置信度较高,反之则较低),或者基于图3中步骤340的方式获得。仅作为示例,在某一训练样本中,已知该训练样本中推荐上车点的名称为其对应POI区域的名称的名称置信度为100,则该训练样本的标签为100。在一些实施例中,训练样本的标记过程可以通过人工或计算机程序进行。
在一些实施例中,还可以将训练样本进行划分,划分为训练集和验证集。训练集用于评估模型的训练,验证集用于验证评估模型的训练效果。具体的,可以对训练样本按一定的比例进行划分。例如,划分比例可以是训练集80%、验证集20%。
步骤620,利用所述一个或多个训练样本对初始机器学习模型进行训练,获得所述评估模型。
在一些实施例中,所述初始机器学习模型可以包括决策模型。在一些实施例中,决策模型可以包括提升树(Boosting tree)、自适应提升树(Adaptive Boosting Tree,AdaBoost)、梯度提升决策树(Gradient Boosting Decision Tree,GBDT)、极端梯度提升树(Extreme Gradient Boosting,XGBoost)等。在一些实施例中,初始机器学习模型可以根据训练情况调整内部参数。
在一些实施例中,还可以基于模型的预测结果以及样本真实值构造损失函数,并基于损失函数的梯度值反向对模型中的参数进行调整,使模型优化。在一些实施例中,在训练过程中,可以将验证集中的样本数据输入到训练后的模型中进行计算,获得输出值(即验证结果),并根据验证结果(例如,模型处于欠拟合和/或过拟合状态)对模型参数进行调整以使模型优化。所述验证集中的数据与所述初始机器学习模型的训练数据独立同分布,且没有交集。对比样本数据的验证结果与相应样本数据的标识,判断训练结果是否达到要求。如果训练结果未达到要求,则重新准备样本数据或者重新划分训练集、验证集,进行继续训练。如果训练结果达到要求,则可以停止模型训练,并将最终的模型作为所需要的评估模型输出。
应当注意的是,上述有关流程600的描述仅仅是为了示例和说明,而不限定本申请的适用范围。对于本领域技术人员来说,在本申请的指导下可以对流程600进行各种修正和改变。然而,这些修正和改变仍在本申请的范围之内。例如,训练样本的标签不限于步骤610中列举的分值,还可以为其他值,比如,1、5、10等等。
本申请实施例可能带来的有益效果包括但不限于:(1)基于一个或以上POI区域的名称对各POI区域内部的推荐上车点在推荐上车点数据库中的上车点名称进行修正,提高了各推荐上车点的名称合理性;(2)使用两种修正方法迭代更新各推荐上车点的名称,提高了修正结果的准确性;(3)对推荐上车点数据库进行了更新,提高了服务器后续从推荐上车点数据库中向用户推送推荐上车点的名称的准确率,进一步提高网约车平台的运行效率和司乘的用户体验。需要说明的是,不同实施例可能产生的有益效果不同,在不同的实施例里,可能产生的有益效果可以是以上任意一种或几种的组合,也可以是其他任何可能获得的有益效果。
上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本申请的限定。虽然此处并没有明确说明,本领域技术人员可能会对本申请进行各种修改、改进和修正。该类修改、改进和修正在本申请中被建议,所以该类修改、改进、修正仍属于本申请示范实施例的精神和范围。
同时,本申请使用了特定词语来描述本申请的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本申请至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外,本申请的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
此外,本领域技术人员可以理解,本申请的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们的任何新的和有用的改进。相应地,本申请的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外,本申请的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。
计算机存储介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等,或合适的组合形式。计算机存储介质可以是除计算机可读存储介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机存储介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤电缆、RF、或类似介质,或任何上述介质的组合。
本申请各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写,包括面向对象编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Python等,常规程序化编程语言如C语言、Visual Basic、Fortran 2003、Perl、COBOL 2002、PHP、ABAP,动态编程语言如Python、Ruby和Groovy,或其他编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或服务器上运行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网(LAN)或广域网(WAN),或连接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软件即服务(SaaS)。
此外,除非权利要求中明确说明,本申请所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本申请流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本申请实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或移动设备上安装所描述的系统。
同理,应当注意的是,为了简化本申请披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本申请实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本申请对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
一些实施例中使用了描述成分、属性数量的数字,应当理解的是,此类用于实施例描述的数字,在一些示例中使用了修饰词“大约”、“近似”或“大体上”来修饰。除非另外说明,“大约”、“近似”或“大体上”表明所述数字允许有±20%的变化。相应地,在一些实施例中,说明书和权利要求中使用的数值参数均为近似值,该近似值根据个别实施例所需特点可以发生改变。在一些实施例中,数值参数应考虑规定的有效数位并采用一般位数保留的方法。尽管本申请一些实施例中用于确认其范围广度的数值域和参数为近似值,在具体实施例中,此类数值的设定在可行范围内尽可能精确。
针对本申请引用的每个专利、专利申请、专利申请公开物和其他材料,如文章、书籍、说明书、出版物、文档等,特此将其全部内容并入本申请作为参考。与本申请内容不一致或产生冲突的申请历史文件除外,对本申请权利要求最广范围有限制的文件(当前或之后附加于本申请中的)也除外。需要说明的是,如果本申请附属材料中的描述、定义、和/或术语的使用与本申请所述内容有不一致或冲突的地方,以本申请的描述、定义和/或术语的使用为准。
最后,应当理解的是,本申请中所述实施例仅用以说明本申请实施例的原则。其他的变形也可能属于本申请的范围。因此,作为示例而非限制,本申请实施例的替代配置可视为与本申请的教导一致。相应地,本申请的实施例不仅限于本申请明确介绍和描述的实施例。

Claims (26)

1.一种修正上车点名称的方法,其特征在于,所述方法包括:
从多个历史运输订单中获取多个推荐上车点,所述推荐上车点由运输服务平台从推荐上车点数据库中选择并推荐,所述推荐上车点包括位置信息以及上车点名称;
基于所述多个推荐上车点的位置信息,利用聚类算法将所述多个推荐上车点分成一个或以上类簇;
基于所述一个或以上类簇,确定一个或以上POI区域及其名称;
基于所述一个或以上POI区域的名称对各POI区域内部的推荐上车点在推荐上车点数据库中的上车点名称进行修正。
2.如权利要求1所述的方法,其特征在于,所述基于所述一个或以上类簇,确定一个或以上POI区域及其名称,包括对所述一个或以上类簇中的每一个:
确定该类簇的中心点,基于所述类簇中一个或多个推荐上车点到所述类簇的中心点的距离确定所述类簇的类簇半径;
基于该类簇的中心点及类簇半径确定其对应的POI区域,所述类簇的中心点为所述POI区域的中心,所述类簇半径为所述POI区域的辐射半径;
基于该类簇中的一个或多个推荐上车点的上车点名称确定该POI区域的名称。
3.如权利要求2所述的方法,其特征在于,所述基于该类簇中的一个或多个推荐上车点的上车点名称确定该POI区域的名称,包括:
指定该类簇中数量最多的推荐上车点的上车点名称作为该POI区域的名称。
4.如权利要求2所述的方法,其特征在于,所述确定所述类簇的中心点,包括:
获取所述类簇中一个或多个推荐上车点中的每一个的位置坐标;以及
计算所述一个或多个推荐上车点的位置坐标的平均值作为所述类簇的中心点的位置坐标。
5.如权利要求2所述的方法,其特征在于,所述基于所述类簇中一个或多个推荐上车点到所述类簇的中心点的距离确定所述类簇的类簇半径,包括:
选取所述类簇中的推荐上车点到所述中心点的距离的最大值作为所述类簇的类簇半径。
6.如权利要求1所述的方法,其特征在于,所述基于所述一个或以上POI区域的名称对各POI区域内部的推荐上车点在推荐上车点数据库中的上车点名称进行修正,包括,对所述一个或以上POI区域中的每一个:
将该POI区域的名称作为该POI区域内的推荐上车点的上车点名称。
7.如权利要求6所述的方法,其特征在于,一个或多个推荐上车点属于两个或以上所述POI区域,所述一个或多个推荐上车点中的每一个的上车点名称包括所述两个或以上所述POI区域的名称。
8.如权利要求7所述的方法,其特征在于,所述基于所述一个或以上POI区域的名称对各POI区域内部的推荐上车点在推荐上车点数据库中的上车点名称进行修正,还包括,对所述一个或以上POI区域中的每一个:
基于该POI区域的中心到其中各推荐上车点的距离,确定该POI区域内各推荐上车点的名称置信度。
9.如权利要求8所述的方法,其特征在于,所述名称置信度负相关于其推荐上车点到其所属POI区域的中心的距离和其所属POI区域的辐射半径的比例。
10.如权利要求1所述的方法,其特征在于,还包括:
迭代进行利用经训练的评估模型对各POI区域内部的推荐上车点在推荐上车点数据库中的上车点名称进行修正的步骤,以及所述基于所述一个或以上POI区域的名称对各POI区域内部的推荐上车点在推荐上车点数据库中的上车点名称进行修正的步骤,直到满足迭代终止条件,得到各推荐上车点的最终的上车点名称。
11.如权利要求10所述的方法,其特征在于,所述评估模型通过以下方法获取:
基于所述一个或多个推荐上车点以及所述一个或多个POI区域,获得一个或多个带标签的训练样本,其中,所述训练样本包括一个推荐上车点的特征数据与一个POI区域的特征数据,所述标签反映所述POI区域的名称为所述推荐上车点的上车点名称的名称置信度;
利用所述一个或多个训练样本对初始机器学习模型进行训练,获得所述评估模型。
12.如权利要求10所述的方法,其特征在于,所述推荐上车点的特征数据包括其位置信息;
所述POI区域的特征数据包括以下中的至少一种:辐射半径、中心、热度、属性、周围环境、与其他POI的关系以及所述中心与所述推荐上车点的距离。
13.一种修正上车点名称的系统,其特征在于,所述系统包括:
获取模块,用于从多个历史运输订单中获取多个推荐上车点,所述推荐上车点由运输服务平台从推荐上车点数据库中选择并推荐,所述推荐上车点包括位置信息以及上车点名称;
聚类模块,用于基于所述多个推荐上车点的位置信息,利用聚类算法将所述多个推荐上车点分成一个或以上类簇;
确定模块,用于基于所述一个或以上类簇,确定一个或以上POI区域及其名称;
修正模块,用于基于所述一个或以上POI区域的名称对各POI区域内部的推荐上车点在推荐上车点数据库中的上车点名称进行修正。
14.如权利要求13所述的系统,其特征在于,为基于所述一个或以上类簇,确定一个或以上POI区域及其名称,所述确定模块还用于对所述一个或以上类簇中的每一个:
确定该类簇的中心点,基于所述类簇中一个或多个推荐上车点到所述类簇的中心点的距离确定所述类簇的类簇半径;
基于该类簇的中心点及类簇半径确定其对应的POI区域,所述类簇的中心点为所述POI区域的中心,所述类簇半径为所述POI区域的辐射半径;
基于该类簇中的一个或多个推荐上车点的上车点名称确定该POI区域的名称。
15.如权利要求14所述的系统,其特征在于,为基于该类簇中的一个或多个推荐上车点的上车点名称确定该POI区域的名称,所述确定模块还用于:
指定该类簇中数量最多的推荐上车点的上车点名称作为该POI区域的名称。
16.如权利要求14所述的系统,其特征在于,为确定所述类簇的中心点,所述确定模块还用于:
获取所述类簇中一个或多个推荐上车点中的每一个的位置坐标;以及
计算所述一个或多个推荐上车点的位置坐标的平均值作为所述类簇的中心点的位置坐标。
17.如权利要求14所述的系统,其特征在于,为基于所述类簇中一个或多个推荐上车点到所述类簇的中心点的距离确定所述类簇的类簇半径,所述确定模块还用于:
选取所述类簇中的推荐上车点到所述中心点的距离的最大值作为所述类簇的类簇半径。
18.如权利要求13所述的系统,其特征在于,为基于所述一个或以上POI区域的名称对各POI区域内部的推荐上车点在推荐上车点数据库中的上车点名称进行修正,所述修正模块还用于对所述一个或以上POI区域中的每一个:
将该POI区域的名称作为该POI区域内的推荐上车点的上车点名称。
19.如权利要求18所述的系统,其特征在于,一个或多个推荐上车点属于两个或以上所述POI区域,所述一个或多个推荐上车点中的每一个的上车点名称包括所述两个或以上所述POI区域的名称。
20.如权利要求19所述的系统,其特征在于,为基于所述一个或以上POI区域的名称对各POI区域内部的推荐上车点在推荐上车点数据库中的上车点名称进行修正,所述修正模块还用于对所述一个或以上POI区域中的每一个:
基于该POI区域的中心到其中各推荐上车点的距离,确定该POI区域内各推荐上车点的名称置信度。
21.如权利要求20所述的系统,其特征在于,所述名称置信度负相关于其推荐上车点到其所属POI区域的中心的距离和其所属POI区域的辐射半径的比例。
22.如权利要求13所述的系统,其特征在于,所述修正模块还用于:
迭代进行利用经训练的评估模型对各POI区域内部的推荐上车点在推荐上车点数据库中的上车点名称进行修正的步骤,以及所述基于所述一个或以上POI区域的名称对各POI区域内部的推荐上车点在推荐上车点数据库中的上车点名称进行修正的步骤,直到满足迭代终止条件,得到各推荐上车点的最终的上车点名称。
23.如权利要求22所述的系统,其特征在于,所述修正模块还用于:
基于所述一个或多个推荐上车点以及所述一个或多个POI区域,获得一个或多个带标签的训练样本,其中,所述训练样本包括一个推荐上车点的特征数据与一个POI区域的特征数据,所述标签反映所述POI区域的名称为所述推荐上车点的上车点名称的名称置信度;
利用所述一个或多个训练样本对初始机器学习模型进行训练,获得所述评估模型。
24.如权利要求22所述的系统,其特征在于,所述推荐上车点的特征数据包括其位置信息;
所述POI区域的特征数据包括以下中的至少一种:辐射半径、中心、热度、属性、周围环境、与其他POI的关系以及所述中心与所述推荐上车点的距离。
25.一种修正上车点名称的装置,其特征在于,所述装置包括至少一个处理器和至少一个存储设备,所述存储设备用于存储指令,当所述至少一个处理器执行所述指令时,实现如权利要求1~12中任一项所述的方法。
26.一种计算机可读存储介质,所述存储介质存储计算机指令,当计算机读取所述存储介质中的所述计算机指令后,所述计算机执行如权利要求1~12中任一项所述的方法。
CN202010248720.5A 2020-04-01 2020-04-01 一种修正上车点名称的方法和系统 Pending CN111881225A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010248720.5A CN111881225A (zh) 2020-04-01 2020-04-01 一种修正上车点名称的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010248720.5A CN111881225A (zh) 2020-04-01 2020-04-01 一种修正上车点名称的方法和系统

Publications (1)

Publication Number Publication Date
CN111881225A true CN111881225A (zh) 2020-11-03

Family

ID=73154285

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010248720.5A Pending CN111881225A (zh) 2020-04-01 2020-04-01 一种修正上车点名称的方法和系统

Country Status (1)

Country Link
CN (1) CN111881225A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113139139A (zh) * 2021-04-28 2021-07-20 北京百度网讯科技有限公司 用于确定上车点的方法、装置、电子设备和介质
CN113160601A (zh) * 2021-03-31 2021-07-23 广州宸祺出行科技有限公司 一种用于公共场所上车点的动态的更新方法及系统
CN114579890A (zh) * 2022-04-26 2022-06-03 阿里巴巴(中国)有限公司 上车点名称推荐方法、装置、设备及存储介质
CN115658839A (zh) * 2022-12-27 2023-01-31 深圳依时货拉拉科技有限公司 Poi数据的挖掘方法、装置、计算机设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010231560A (ja) * 2009-03-27 2010-10-14 Zenrin Co Ltd 地図データ誤り修正装置
CN104156443A (zh) * 2014-08-13 2014-11-19 北京嘀嘀无限科技发展有限公司 地理兴趣点模糊改写系统
CN105138708A (zh) * 2015-09-30 2015-12-09 北京奇虎科技有限公司 一种兴趣点名称的识别方法和装置
CN107506499A (zh) * 2017-09-30 2017-12-22 百度在线网络技术(北京)有限公司 兴趣点与建筑物之间建立逻辑关系的方法、装置及服务器
CN109325185A (zh) * 2018-07-16 2019-02-12 北京三快在线科技有限公司 一种确定上车点的方法、装置、设备及存储介质
CN110457420A (zh) * 2019-08-13 2019-11-15 腾讯云计算(北京)有限责任公司 兴趣点位置识别方法、装置、设备及存储介质
CN110533081A (zh) * 2019-08-07 2019-12-03 北京三快在线科技有限公司 一种确定上车点信息的方法、装置、设备及存储介质
CN110597943A (zh) * 2019-09-16 2019-12-20 腾讯科技(深圳)有限公司 基于人工智能的兴趣点处理方法、装置及电子设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010231560A (ja) * 2009-03-27 2010-10-14 Zenrin Co Ltd 地図データ誤り修正装置
CN104156443A (zh) * 2014-08-13 2014-11-19 北京嘀嘀无限科技发展有限公司 地理兴趣点模糊改写系统
CN105138708A (zh) * 2015-09-30 2015-12-09 北京奇虎科技有限公司 一种兴趣点名称的识别方法和装置
CN107506499A (zh) * 2017-09-30 2017-12-22 百度在线网络技术(北京)有限公司 兴趣点与建筑物之间建立逻辑关系的方法、装置及服务器
CN109325185A (zh) * 2018-07-16 2019-02-12 北京三快在线科技有限公司 一种确定上车点的方法、装置、设备及存储介质
CN110533081A (zh) * 2019-08-07 2019-12-03 北京三快在线科技有限公司 一种确定上车点信息的方法、装置、设备及存储介质
CN110457420A (zh) * 2019-08-13 2019-11-15 腾讯云计算(北京)有限责任公司 兴趣点位置识别方法、装置、设备及存储介质
CN110597943A (zh) * 2019-09-16 2019-12-20 腾讯科技(深圳)有限公司 基于人工智能的兴趣点处理方法、装置及电子设备

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113160601A (zh) * 2021-03-31 2021-07-23 广州宸祺出行科技有限公司 一种用于公共场所上车点的动态的更新方法及系统
CN113139139A (zh) * 2021-04-28 2021-07-20 北京百度网讯科技有限公司 用于确定上车点的方法、装置、电子设备和介质
CN113139139B (zh) * 2021-04-28 2023-09-22 北京百度网讯科技有限公司 用于确定上车点的方法、装置、电子设备和介质
CN114579890A (zh) * 2022-04-26 2022-06-03 阿里巴巴(中国)有限公司 上车点名称推荐方法、装置、设备及存储介质
CN114579890B (zh) * 2022-04-26 2022-07-29 阿里巴巴(中国)有限公司 上车点名称推荐方法、装置、设备及存储介质
CN115658839A (zh) * 2022-12-27 2023-01-31 深圳依时货拉拉科技有限公司 Poi数据的挖掘方法、装置、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
CN111881225A (zh) 一种修正上车点名称的方法和系统
US20200134648A1 (en) Methods and systems for preventing user churn
CN109478275B (zh) 分配服务请求的系统和方法
US11011057B2 (en) Systems and methods for generating personalized destination recommendations
CN109313036B (zh) 路线规划的系统及方法
JP2019511020A (ja) 到着時間を推定するための方法およびシステム
US10785595B2 (en) Systems and methods for updating sequence of services
CN111859178B (zh) 一种推荐上车点的方法和系统
US20200300650A1 (en) Systems and methods for determining an estimated time of arrival for online to offline services
CN111861647A (zh) 一种推荐上车点的方法和系统
CN111047130B (zh) 用于交通分析和管理的方法和系统
CN112055867B (zh) 用于推荐个性化上车位置的系统和方法
US20200167812A1 (en) Systems and methods for determining a fee of a service request
CN111932341A (zh) 一种确定拼车订单的方法和系统
WO2021052451A1 (zh) 一种确定预估到达时间的方法和系统
CN110839346A (zh) 用于分配服务请求的系统和方法
CN111882112B (zh) 一种预测到达时间的方法和系统
CN112041858A (zh) 提供出行建议的系统和方法
CN110782648A (zh) 确定预计到达时间的系统和方法
CN111400425B (zh) 一种路径自动优化选择的方法和系统
CN110689719B (zh) 用于识别封闭路段的系统和方法
CN111201421A (zh) 用于确定在线上到线下服务中的最优运输服务类型的系统和方法
CN111881369A (zh) 一种推荐上车点名称准确性检测方法和系统
CN111159317A (zh) 用于确定路径拓扑关系的系统和方法
CN111881367A (zh) 一种推荐上车点方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination