CN111291914A - 一种群体聚集场景的预测方法、装置、设备及存储介质 - Google Patents

一种群体聚集场景的预测方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN111291914A
CN111291914A CN201811490106.9A CN201811490106A CN111291914A CN 111291914 A CN111291914 A CN 111291914A CN 201811490106 A CN201811490106 A CN 201811490106A CN 111291914 A CN111291914 A CN 111291914A
Authority
CN
China
Prior art keywords
user
service
aggregation
information
drinking
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811490106.9A
Other languages
English (en)
Inventor
李奘
郄小虎
卓呈祥
曹利锋
杜龙志
杨文君
凌宏博
孔欢欢
侯帅鹏
杨晓庆
王艳梅
刘刚刚
路劲
谢君
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Didi Infinity Technology and Development Co Ltd
Original Assignee
Beijing Didi Infinity Technology and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Didi Infinity Technology and Development Co Ltd filed Critical Beijing Didi Infinity Technology and Development Co Ltd
Priority to CN201811490106.9A priority Critical patent/CN111291914A/zh
Publication of CN111291914A publication Critical patent/CN111291914A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • G06Q50/265Personal security, identity or safety

Abstract

本申请提供了一种群体聚集场景的预测方法、装置、设备及存储介质,涉及聚集场景预测技术领域。其中,所述方法包括:获取在最近预设时间段内产生的多个服务订单;所述服务订单中包括用户信息和订单服务信息;根据所述服务订单中包括的所述用户信息,确定多个所述服务订单所表征的用户关联关系信息;根据多个所述服务订单的订单服务信息以及所述用户关联关系信息,预测所述最近预设时间段内所述服务订单对应的用户处于目标聚集场景的概率。本申请中,通过表征聚集场景特征的订单服务信息和用户关联关系信息这两方面特征来预测用户处于目标聚集场景的概率,提高了预测准确度。

Description

一种群体聚集场景的预测方法、装置、设备及存储介质
技术领域
本申请涉及聚集场景预测技术领域,具体而言,涉及一种群体聚集场 景的预测方法、装置、设备及存储介质。
背景技术
群体聚集场景是指很多人聚集到一起从事相应的活动。在群体聚集场 景下,会存在较大概率的服务需求或者存在较大概率发生危险行为。因此, 通过预测聚集场景概率能够为聚集场景提供相应服务或者监控聚集场景的 危险行为。
在聚集群体具有出行服务需求的场景下,聚集群体通常存在较大概率 的使用网约车平台进行约车。在该场景下,目前预测群体聚集场景的方法 通常是基于服务订单数量,来预测用户处于目标聚集场景的概率。但是, 上述预测方法不够准确,因此,如何准确的预测群体聚集场景概率是一个 亟待考虑的问题。
发明内容
有鉴于此,本申请实施例的目的在于提供一种群体聚集场景的预测方 法、装置、设备及存储介质,通过表征聚集场景特征的订单服务信息和用 户关联关系信息这两方面特征来预测用户处于目标聚集场景的概率,提高 了预测准确度。
本申请第一方面提供了一种群体聚集场景的预测方法,包括:
获取在最近预设时间段内产生的多个服务订单;所述服务订单中包括 用户信息和订单服务信息;
根据所述服务订单中包括的所述用户信息,确定多个所述服务订单所 表征的用户关联关系信息;
根据多个所述服务订单的订单服务信息以及所述用户关联关系信息, 预测所述最近预设时间段内所述服务订单对应的用户处于目标聚集场景的 概率。
进一步的,本申请第一方面提供的群体聚集场景的预测方法中,所述 根据所述服务订单中包括的所述用户信息,确定多个所述服务订单所表征 的用户关联关系信息,包括:
获取对应于所述用户信息的用户关系网络;
根据所述用户关系网络以及所述多个服务订单中包括的所述用户信 息,得到多个所述服务订单所表征的用户关联关系信息。
进一步的,本申请第一方面提供的群体聚集场景的预测方法中,所述 获取对应于所述用户信息的用户关系网络,包括:
根据在所述最近预设时间段之前的历史时间段内产生的历史服务订单 的用户信息和订单服务信息,生成对应于所述用户信息的用户关系网络。
进一步的,本申请第一方面提供的群体聚集场景的预测方法中,所述 订单服务信息中包括位置信息;所述根据多个所述服务订单的订单服务信 息以及所述用户关联关系信息,预测所述最近预设时间段内所述服务订单 对应的用户处于目标聚集场景的概率,包括:
根据多个所述服务订单中的位置信息以及多个所述服务订单所表征的 用户关联关系信息,确定所述服务订单对应的用户在所述位置信息对应的 目标区域的聚集行为特征的特征值;
根据用户在所述目标区域的聚集行为特征的特征值,确定最近预设时 间段内用户在所述目标区域的聚集场景概率。
进一步的,本申请第一方面提供的群体聚集场景的预测方法中,所述 聚集行为特征包括以下特征中的一个或多个:群体散场特征;群体聚集特 征;区域行为特征。
进一步的,本申请第一方面提供的群体聚集场景的预测方法中,若所 述位置信息包括出发地位置,所述聚集行为特征包括群体散场特征;根据 以下步骤确定所述目标区域的群体散场特征的特征值:
判断在最近第一预设时间段内是否存在多个第一目标服务订单,所述 多个第一目标服务订单的出发地位置对应第一目标区域、且用户信息之间 相互关联;
根据判断结果,确定所述目标区域的群体散场特征的特征值。
进一步的,本申请第一方面提供的群体聚集场景的预测方法中,若所 述位置信息包括目的地位置,所述聚集行为特征包括群体聚集特征;根据 以下步骤确定所述目标区域的群体聚集特征的特征值:
判断在最近第一预设时间段之前的第二预设时间段内是否存在目的地 位置对应第二目标区域、且包括的用户信息之间相互关联的多个第二目标 服务订单;
根据判断结果,确定所述目标区域的群体聚集特征的特征值。
进一步的,本申请第一方面提供的群体聚集场景的预测方法中,所述 聚集行为特征包括区域行为特征;根据以下步骤确定所述目标区域的区域 行为特征的特征值:
根据所述服务订单包括的位置信息,确定所述位置信息对应的目标区 域的行为类别;
判断最近第一预设时间段内是否存在包括与所述目标区域的行为类别 相匹配的订单类型的多个第三目标服务订单;
根据判断结果,确定所述目标区域的区域行为特征的特征值。
进一步的,本申请第一方面提供的群体聚集场景的预测方法中,所述 根据判断结果,确定所述目标区域的区域行为特征的特征值,包括:
获取服务提供方针对多个所述第三目标服务订单的区域行为反馈信 息;
根据所述区域行为反馈信息以及所述判断结果,确定所述目标区域的 区域行为特征值。
进一步的,本申请第一方面提供的群体聚集场景的预测方法中,所述 聚集场景包括聚集饮酒场景。
进一步的,本申请第一方面提供的群体聚集场景的预测方法中,所述 根据用户在所述目标区域的聚集行为特征的特征值,确定最近预设时间段 内用户在所述目标区域的聚集场景概率,包括:
将所述目标区域的聚集行为特征的特征值,以及以下信息对应的特征 值中的至少一种输入到训练好的聚集饮酒预测模型中,得到最近预设时间 段内用户在所述目标区域的聚集饮酒概率:
所述目标区域的兴趣点POI类别;所述用户关联关系信息;所述目标 区域的历史聚集饮酒概率;所述服务订单对应的用户饮酒特征。
进一步的,本申请第一方面提供的群体聚集场景的预测方法中,通过 以下方法确定所述目标区域的历史聚集饮酒概率,包括:
根据所述目标区域中历史代驾订单的个数以及全部区域中历史代驾订 单的个数,确定所述目标区域的历史聚集饮酒概率。
进一步的,本申请第一方面提供的群体聚集场景的预测方法中,通过 以下方法确定所述目标区域的历史聚集饮酒概率,还包括:
根据所述目标区域中针对历史服务订单的醉酒反馈信息的个数,以及 全部区域中针对所述历史服务订单的醉酒反馈信息的个数,确定所述目标 区域的历史聚集饮酒概率。
进一步的,本申请第一方面提供的群体聚集场景的预测方法中,通过 以下方法确定所述服务订单对应的用户饮酒特征,包括:
获取多个所述服务订单分别对应的用户操作行为数据;
根据多个所述服务订单分别对应的用户操作行为数据,确定多个所述 服务订单对应的用户饮酒特征。
进一步的,本申请第一方面提供的群体聚集场景的预测方法中,所述 用户操作行为数据至少包括以下数据中的一种或多种:输入位置信息的次 数、行走步速、发送服务订单的时间、操作错误记录。
进一步的,本申请第一方面提供的群体聚集场景的预测方法中,所述 聚集饮酒预测模型的训练方法,包括:
获取多个样本数据;所述样本数据为:包括聚集饮酒特征的正样本数 据和包括其他聚集行为特征的负样本数据;
将所述聚集饮酒特征和所述其他聚集行为特征作为解释变量,将聚集 饮酒结果作为被解释变量,构建非线性模型,并通过多个所述样本数据对 所述非线性模型进行训练,得到所述聚集饮酒预测模型;其中,聚集饮酒 结果包括:聚集饮酒特征对应的聚集饮酒结果和其他聚集行为特征对应的 非聚集饮酒结果。
进一步的,本申请第一方面提供的群体聚集场景的预测方法中,所述 根据多个所述服务订单的订单服务信息以及所述用户关联关系信息,预测 所述最近预设时间段内所述服务订单对应的用户处于目标聚集场景的概率 之后,所述方法还包括:
根据用户处于目标聚集场景的概率,调度与所述目标聚集场景相匹配 的服务。
本申请第二方面提供了一种群体聚集场景的预测装置,包括:
获取模块,用于获取在最近预设时间段内产生的多个服务订单;所述 服务订单中包括用户信息和订单服务信息;
确定模块,用于根据所述服务订单中包括的所述用户信息,确定多个 所述服务订单所表征的用户关联关系信息;
预测模块,用于根据多个所述服务订单的订单服务信息以及所述用户 关联关系信息,预测所述最近预设时间段内所述服务订单对应的用户处于 目标聚集场景的概率。
进一步的,本申请第二方面提供的群体聚集场景的预测装置中,所述 确定模块,具体用于:
获取对应于所述用户信息的用户关系网络;
根据所述用户关系网络以及所述多个服务订单中包括的所述用户信 息,得到多个所述服务订单所表征的用户关联关系信息。
进一步的,本申请第二方面提供的群体聚集场景的预测装置中,所述 确定模块,具体用于:
根据在所述最近预设时间段之前的历史时间段内产生的历史服务订单 的用户信息和订单服务信息,生成对应于所述用户信息的用户关系网络。
进一步的,本申请第二方面提供的群体聚集场景的预测装置中,所述 订单服务信息中包括位置信息;所述预测模块,具体用于:
根据多个所述服务订单中的位置信息以及多个所述服务订单所表征的 用户关联关系信息,确定所述服务订单对应的用户在所述位置信息对应的 目标区域的聚集行为特征的特征值;
根据用户在所述目标区域的聚集行为特征的特征值,确定最近预设时 间段内用户在所述目标区域的聚集场景概率。
进一步的,本申请第二方面提供的群体聚集场景的预测装置中,所述 聚集行为特征包括以下特征中的一个或多个:群体散场特征;群体聚集特 征;区域行为特征。
进一步的,本申请第二方面提供的群体聚集场景的预测装置中,若所 述位置信息包括出发地位置,所述聚集行为特征包括群体散场特征;所述 预测模块,还用于:
判断在最近第一预设时间段内是否存在多个第一目标服务订单,所述 多个第一目标服务订单的出发地位置对应第一目标区域、且用户信息之间 相互关联;
根据判断结果,确定所述目标区域的群体散场特征的特征值。
进一步的,本申请第二方面提供的群体聚集场景的预测装置中,若所 述位置信息包括目的地位置,所述聚集行为特征包括群体聚集特征;所述 预测模块,还用于:
判断在最近第一预设时间段之前的第二预设时间段内是否存在目的地 位置对应第二目标区域、且包括的用户信息之间相互关联的多个第二目标 服务订单;
根据判断结果,确定所述目标区域的群体聚集特征的特征值。
进一步的,本申请第二方面提供的群体聚集场景的预测装置中,所述 聚集行为特征包括区域行为特征;所述预测模块,还用于:
根据所述服务订单包括的位置信息,确定所述位置信息对应的目标区 域的行为类别;
判断最近第一预设时间段内是否存在包括与所述目标区域的行为类别 相匹配的订单类型的多个第三目标服务订单;
根据判断结果,确定所述目标区域的区域行为特征的特征值。
进一步的,本申请第二方面提供的群体聚集场景的预测装置中,所述 预测模块,具体用于:
获取服务提供方针对多个所述第三目标服务订单的区域行为反馈信 息;
根据所述区域行为反馈信息以及所述判断结果,确定所述目标区域的 区域行为特征值。
进一步的,本申请第二方面提供的群体聚集场景的预测装置中,所述 聚集场景包括聚集饮酒场景。
进一步的,本申请第二方面提供的群体聚集场景的预测装置中,所述 预测模块,具体用于:
将所述目标区域的聚集行为特征的特征值,以及以下信息对应的特征 值中的至少一种输入到训练好的聚集饮酒预测模型中,得到最近预设时间 段内用户在所述目标区域的聚集饮酒概率:
所述目标区域的兴趣点POI类别;所述用户关联关系信息;所述目标 区域的历史聚集饮酒概率;所述服务订单对应的用户饮酒特征。
进一步的,本申请第二方面提供的群体聚集场景的预测装置中,所述 确定模块,还用于根据所述目标区域中历史代驾订单的个数以及全部区域 中历史代驾订单的个数,确定所述目标区域的历史聚集饮酒概率。
进一步的,本申请第二方面提供的群体聚集场景的预测装置中,所述 确定模块,还用于:
根据所述目标区域中针对历史服务订单的醉酒反馈信息的个数,以及 全部区域中针对所述历史服务订单的醉酒反馈信息的个数,确定所述目标 区域的历史聚集饮酒概率。
进一步的,本申请第二方面提供的群体聚集场景的预测装置中,所述 确定模块,还用于:
获取多个所述服务订单分别对应的用户操作行为数据;
根据多个所述服务订单分别对应的用户操作行为数据,确定多个所述 服务订单对应的用户饮酒特征。
进一步的,本申请第二方面提供的群体聚集场景的预测装置中,所述 用户操作行为数据至少包括以下数据中的一种或多种:输入位置信息的次 数、行走步速、发送服务订单的时间、操作错误记录。
进一步的,本申请第二方面提供的群体聚集场景的预测装置中,还包 括模型训练模块;
所述获取模块,还用于获取多个样本数据;所述样本数据为:包括聚 集饮酒特征的正样本数据和包括其他聚集行为特征的负样本数据;
所述模型训练模块,用于将所述聚集饮酒特征和所述其他聚集行为特 征作为解释变量,将聚集饮酒结果作为被解释变量,构建非线性模型,并 通过多个所述样本数据对所述非线性模型进行训练,得到所述聚集饮酒预 测模型;其中,聚集饮酒结果包括:聚集饮酒特征对应的聚集饮酒结果和 其他聚集行为特征对应的非聚集饮酒结果。
进一步的,本申请第二方面提供的群体聚集场景的预测装置中,还包 括:
调度模块,用于根据用户处于目标聚集场景的概率,调度与所述目标 聚集场景相匹配的服务。
本申请第三方面提供了一种电子设备,包括:处理器、存储介质和总 线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备 运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行 所述机器可读指令,以执行时执行如第一方面任一项所述的群体聚集场景 的预测方法的步骤。
本申请第四方面提供了一种计算机可读存储介质,该计算机可读存储 介质上存储有计算机程序,该计算机程序被处理器运行时执行如第一方面 任一项所述的群体聚集场景的预测方法的步骤。
本申请实施例提供的一种群体聚集场景的预测方法、装置、设备及存 储介质,通过获取在最近预设时间段内产生的多个服务订单;然后,根据 多个服务订单中包括的用户信息,确定多个服务订单所表征的用户关联关 系信息;最后,根据多个服务订单的订单服务信息以及所述用户关联关系 信息这两个特征,共同预测最近预设时间段内服务订单对应的用户处于目 标聚集场景的概率。本申请实施例中,通过表征聚集场景特征的订单服务信息和用户关联关系信息这两方面特征来预测用户处于目标聚集场景的概 率,提高了预测准确度。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实 施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需 要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些 实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲, 在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的一种群体聚集场景的预测方法的流 程图。
图2示出了本申请实施例所提供的另一种群体聚集场景的预测方法的 流程图。
图3示出了本申请实施例所提供的另一种群体聚集场景的预测方法的 流程图。
图4示出了本申请实施例所提供的另一种群体聚集场景的预测方法的 流程图。
图5示出了本申请实施例所提供的另一种群体聚集场景的预测方法的 流程图。
图6示出了本申请实施例所提供的另一种群体聚集场景的预测方法的 流程图。
图7示出了本申请实施例所提供的一种群体聚集场景的预测装置的结 构示意图.
图8示出了本申请实施例所提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本 申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描 述,应当理解,本申请中附图仅起到说明和描述的目的,并不用于限定本 申请的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。 本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应该 理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可 以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下, 可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多 个操作。
另外,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实 施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不 同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的 详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的 选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳 动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
随着互联网的快速发展和普及,越来越多的互联网产品应用到人们的 日常生活中,例如当前较为流行的网约车平台。通常情况下,在聚集场景 中,聚集群体会存在较大概率的服务需求,比如出行服务需求。相应的, 聚集群体也会有较大概率的使用网约车平台进行约车。目前,网约车平台 为了更好的对聚集群体提供服务,通常是基于出行订单的数量,来预测用 户是否处于目标聚集场景,根据预测结果来进行车辆调度,以更好的为目 标聚集场景下的用户提供服务。但是,仅仅基于订单的数量无法准确的预 测用户是否处于目标聚集场景。
本申请实施例提供的一种群体聚集场景的预测方法、装置、设备及存 储介质,通过获取在最近预设时间段内产生的多个服务订单;然后,根据 多个服务订单中包括的用户信息,确定多个服务订单所表征的用户关联关 系信息;最后,根据多个服务订单的订单服务信息以及用户关联关系信息 这两个特征,共同预测最近预设时间段内服务订单对应的用户处于目标聚 集场景的概率。本申请实施例中,通过表征聚集场景特征的订单服务信息和用户关联关系信息这两方面特征来预测用户处于目标聚集场景的概率, 提高了预测准确度。
如图1所示,为本申请实施例提供的一种群体聚集场景的预测方法, 所述方法应用于服务器,所述方法包括:
S101、获取在最近预设时间段内产生的多个服务订单;所述服务订单 中包括用户信息和订单服务信息。
本申请实施例中,当用户使用网约车平台的客户端打车时,服务器中 会产生相应的出行订单(即上述服务订单),该出行订单包括打车订单和代 驾订单。作为一种实施方式,服务器中按照预设的时间周期获取当前时间 周期内(即上述最近预设时间段内)的多个出行订单。其中,每个出行订 单中均包括订单服务信息和用户信息;上述订单服务信息至少包括位置信 息且每个位置信息均对应一个区域。上述用户信息可以为用户的注册账号 (比如用户名、手机号等)。其中,每个用户对应的注册账号均不同。
比如,预设的时间周期为10分钟,若当前时间为晚上9点10分时, 服务器中可以获取晚上9点到9点10分这个时间段内的多个出行订单。
S102、根据所述服务订单中包括的所述用户信息,确定多个所述服务 订单所表征的用户关联关系信息。
本申请实施例中,确定用户关联关系信息的方法如下:获取对应于用 户信息的用户关系网络,然后,根据上述用户关系网络以及多个服务订单 中包括的用户信息,得到多个服务订单所表征的用户关联关系信息。
作为第一种可选的实施方式,用户在服务器中进行注册时,通过用户 终端提交的注册信息中既包括自己的用户信息,也包括关联用户的用户信 息,服务器基于用户终端提交的注册信息生成上述用户关系网络。
作为第二种可选的实施方式,服务器通过访问用户终端的通讯录获取 其他用户信息与该用户终端对应的用户信息的关联关系,并基于该关联关 系,生成用户关系网络。比如,当用户信息为手机号时,服务器通过访问 用户终端的通讯录获取其他手机号与当前手机号的关联关系,并基于该关 联关系,生成用户关系网络。
作为第三种可选的实施方式,服务器根据历史出行订单以及具有关联 关系的用户之间的出行行为特征生成上述用户关系网络。
S103、根据多个所述服务订单的订单服务信息以及所述用户关联关系 信息,预测所述最近预设时间段内所述服务订单对应的用户处于目标聚集 场景的概率。
其中,一个时间片和一个区域对应一个时空单元。本申请实施例中, 将最近预设时间段和一个位置信息对应的目标区域,作为一个目标时空单 元,得到对应于多个服务订单的多个目标时空单元。服务器基于多个服务 订单的订单服务信息以及用户关联关系信息,预测上述多个目标时空单元 下用户处于目标聚集场景的概率。
如上所述,用户关系网络可以是服务器根据历史订单以及具有关联关 系的用户之间的出行行为特征生成的。其中,服务器生成上述用户关系网 络的方法具体如下:根据在所述最近预设时间段之前的历史时间段内产生 的历史服务订单的用户信息和订单服务信息,生成对应于用户信息的用户 关系网络。
本申请实施例中,网约车平台所使用的基础地图数据展现了全国中各 个兴趣点(Point of Interest,PoI)点的地理属性分类(即PoI类别)。服务 器基于基础地图数据中的各个PoI点,将全国划分为多个以PoI点为中心的 区域。基于此,利用多个历史服务订单中的位置信息以及用户信息,可以 预测多个服务订单所表征的用户关联关系信息,如同事和好友等。其中, 用户关系网络的生成方法包括:
结合全国各个区域的POI点类别,确定多个历史服务订单的位置信息 对应的POI点类别,比如住宅区、办公园区等。结合一段时间内(比如1 年内)用户每天早晚的出行规律,推断出用户的家和公司所在的POI点。 例如,一年内,一个用户每周中高频率早上从同一地点出发且晚上回到该 同一地点,可以推测出此地点具有较高概率是用户居住的家附近。相似地, 一年内,一个用户每周中高频率的早上到达同一地点且晚上从该同一地点 出发,可以推测出此地点具有较高概率是用户的公司。基于上述信息,可 以推测出用户之间的同事关系,以及居住地相同关系。此外,结合各种用 户之间的共现关系,可以推测用户之间的其他关联关系。例如,两个用户 高频率在同一时刻、同一地点通过同一无线网络打车,可以推测这两个用 户的关系是家人或好友。通过挖掘上述关系,构建出对应于用户信息的用 户关系网络。
进一步的,如图2所示,本申请实施例提供的群体聚集场景的预测方 法中,所述订单服务信息中包括位置信息;其中,根据多个所述服务订单 的订单服务信息以及所述用户关联关系信息,预测所述最近预设时间段内 所述服务订单对应的用户处于目标聚集场景的概率,包括:
S201、根据多个所述服务订单中的位置信息以及多个所述服务订单所 表征的用户关联关系信息,确定所述服务订单对应的用户在所述位置信息 对应的目标区域的聚集行为特征的特征值。
本申请实施例中,上述聚集行为特征包括以下特征中的一个或多个: 群体散场特征;群体聚集特征;区域行为特征。
其中,具有关联关系的多个用户在最近第一预设时间段内从同一个目 标区域打车离开,能够表征该目标区域在最近预设时间段内具有群体散场 特征;具有关联关系的多个用户在最近第一预设时间段之前的第二预设时 间段内打车来到同一个目标区域,能够表征该目标区域在最近预设时间段 内具有群体聚集特征。基于一个目标区域对应的POI类别,以及在最近预 设时间段内该目标区域内的出行订单类型、出行订单数量以及服务提供方(比如司机)对出行订单的投诉信息等,能够表征该目标区域在最近预设 时间段内具有区域行为特征。
因此,基于出行订单的数量、出行订单中的位置信息、该位置信息所 属目标区域的PoI类别以及多个出行订单所表征的用户关联关系信息,能够 分别确定上述群体散场特征、群体聚集特征以及区域行为特征。
本申请实施例中,针对上述三个特征中的任一特征,若存在该特征, 则该特征对应的特征值为1;若不存在该特征,则该特征对应的特征值为0。 或者,基于多个出行订单是否存在上述三个特征的结果,来确定表征是否 具有上述三个特征的一个特征值。
S202、根据用户在所述目标区域的聚集行为特征的特征值,确定最近 预设时间段内用户在所述目标区域的聚集场景概率。
本申请实施例中,服务器中预先训练好聚集场景预测模型,针对最近 预设时间段内任一目标区域,服务器在得到该目标区域的聚集行为特征对 应的特征值后,将该特征值输入到预先训练好的聚集场景预测模型中,得 到该目标区域在最近预设时间段内下用户处于目标聚集场景的概率。
进一步的,在网约车领域中,较为常见的目标聚集场景为聚集饮酒场 景。通常来说,很多的乘客醉酒都是发生在群体聚集饮酒的场景下,在群 体聚集饮酒的情况下,饮酒者无法准确辨别自己的状态,从而更易醉酒。 因此,发现特定时间和地点(即一个目标时空单元)是否存在群体聚集饮 酒对于网约车平台具有重要意义。
下面结合聚众饮酒场景对本申请提供的技术方案进行详细说明。需要 说明的是,上述聚众饮酒场景仅作为本申请列举出的一种可适用的应用场 景,以便于对本申请进行更好的理解和说明,但本申请并不限定于应用在 上述场景,还可以在其它任何需要服务器预测用户处于目标聚集场景的概 率,以便服务器基于预测的用户处于目标聚集场景的概率为聚集群体提供 服务或者监控聚集群体的危险行为的应用场景中。
在聚集饮酒场景下,上述聚集行为特征为聚集饮酒特征。下面对聚集 饮酒场景中,聚集饮酒特征的确定方法进行详细说明。
其中,聚集饮酒特征包括以下特征中的一种或多种:群体散场特征、 群体聚集特征、区域饮酒特征。本申请实施例中,根据以下步骤确定最近 预设时间段内该目标区域的聚集饮酒特征的特征值:
(1)若所述位置信息包括出发地位置,所述聚集行为特征包括群体散 场特征;如图3所示,根据以下步骤确定所述目标区域的群体散场特征的 特征值:
S301、判断在最近第一预设时间段内是否存在多个第一目标服务订单, 所述多个第一目标服务订单的出发地位置对应第一目标区域、且用户信息 之间相互关联。
本申请实施例中,通过多个服务订单判断是否存在较短时间内的群体 散场特征。其中,群体散场特征可以通过挖掘多个服务订单中的用户关联 关系信息(也即乘客关系网络)最近第一预设时间段内的出行订单来推测。 例如最近20分钟内,所有出现的出行订单中,检测到一个多个相互关联的 乘客分别发出的出行订单,则确定为群体散场特征。
S302、根据判断结果,确定所述目标区域的群体散场特征的特征值。
作为一种实施方式,服务器若确定存在散场特征,则确定最近预设时 间段内该目标区域的群体散场特征的特征值为1;若确定不存在散场特征, 则确定最近预设时间段内该目标区域的群体散场特征的特征值为0。
(2)若所述位置信息包括目的地位置,所述聚集行为特征包括群体聚 集特征;如图4所示,根据以下步骤确定所述目标区域的群体聚集特征的 特征值:
S401、判断在最近第一预设时间段之前的第二预设时间段内是否存在 目的地位置对应第二目标区域、且包括的用户信息之间相互关联的多个第 二目标服务订单。
本申请实施例中,通过多个出行订单确定最近第一预设时间段之前的 第二预设时间段内是否有群体聚集特征。其中,群体聚集特征可以通过挖 掘多个服务订单中乘客关系网络在第一预设时间段之前且满足大于一定时 间段的第二预设时间段中是否有群体聚集特征。例如在2个小时前,发现 有好友关系的两个乘客打车来到同一饮酒区域。
S402、根据判断结果,确定所述目标区域的群体聚集特征的特征值。
本步骤中,服务器若确定存在群体聚集特征,则确定最近预设时间段 内该目标区域的群体散场特征的特征值为1;服务器若确定不存在群体聚集 特征,则确定最近预设时间段内该目标区域的群体聚集特征的特征值为0。
(3)本申请实施例提供的群体聚集场景的预测方法中,所述聚集行为 特征包括区域行为特征;如图5所示,根据以下步骤确定所述目标区域的 区域行为特征的特征值:
S501、根据所述服务订单包括的位置信息,确定所述位置信息对应的 目标区域的行为类别。
本申请实施例中,上述位置信息包括出发地位置和目的地位置。出发 地位置和目的地位置均能确定目标区域的行为类别。比如,出发地为酒吧, 可以确定出发地所属目标区域的行为类别为“饮酒”。比如,目的地位置为 酒吧,可以确定目的地位置所属目标区域的行为类别为“饮酒”。
S502、判断最近第一预设时间段内是否存在包括与所述目标区域的行 为类别相匹配的订单类型的多个第三目标服务订单。
本申请实施例中,与上述目标区域的饮酒行为类别相匹配为区域饮酒 特征,服务器通过多个出行订单确定是否存在较短时间内多名乘客的区域 饮酒特征。其中,上述多人可以具有关联关系,也可以不具有关联关系。
比如,目标区域的行为类别为饮酒,服务器可以通过目标区域的高于 频次的出行订单(包括打车订单和代驾订单)来挖掘。例如,检测到最近 20分钟有5个代驾订单,2个打车订单(包括快车和出租车),其中,有4 个出行订单的出发点为酒吧且目的地为居民区,则确定存在区域饮酒特征。
S503、根据判断结果,确定所述目标区域的区域行为特征的特征值。
作为一种实施方式,服务器若确定存在所述目标区域的区域饮酒特征, 则确定最近预设时间段内该目标区域的区域饮酒特征的特征值为1;若确定 不存在区域饮酒特征,则确定最近预设时间段内该目标区域的区域饮酒特 征的特征值为0。
在一种实施方式中,服务器可以单独根据是否存在上述多个第三目标 服务订单的判断结果,确定最近预设时间段内该目标区域的区域饮酒特征 的特征值。
在另一种实施方式中,服务器获取服务提供方针对多个第三目标服务 订单的区域行为反馈信息;然后,根据区域行为反馈信息以及多个第三目 标服务订单的判断结果,共同确定最近预设时间段内该目标区域的区域饮 酒特征值。其中,区域行为反馈信息可以是司机对醉酒乘客的打车订单的 取消信息,也可以是司机对醉酒乘客的打车订单的投诉信息等。
进一步的,本申请实施例提供的群体聚集场景的预测方法中,根据用 户在所述目标区域的聚集行为特征的特征值,确定最近预设时间段内用户 在所述目标区域的聚集场景概率,包括:
将所述目标区域的聚集行为特征的特征值,以及以下信息对应的特征 值中的至少一种输入到训练好的聚集饮酒预测模型中,得到最近预设时间 段内用户在所述目标区域的聚集饮酒概率:其中,以下信息包括:目标区 域的兴趣点POI类别;用户关联关系信息;目标区域的历史聚集饮酒概率 服务订单对应的用户饮酒特征。
在一种实施方式下,针对目标区域的聚集行为特征的特征值;目标区 域的兴趣点POI类别的特征值;用户关联关系信息的特征值;目标区域的 历史聚集饮酒概率的特征值;服务订单对应的用户饮酒特征的特征值;这 五个特征,可以单独将这五个特征作为输入特征值,将输入特征值输入到 训练好的聚集饮酒预测模型中,得到最近预设时间段内用户在该目标区域 的聚集饮酒概率。
在另一种实施方式下,针对目标区域的聚集行为特征的特征值;目标 区域的兴趣点POI类别的特征值;用户关联关系信息的特征值;目标区域 的历史聚集饮酒概率的特征值;所述服务订单对应的用户饮酒特征;将上 述五个特征值进行任意组合作为输入特征值,将输入特征值输入到训练好 的聚集饮酒预测模型中,得到最近预设时间段内用户在所述目标区域的聚 集饮酒概率。
本申请实施例中,将全部的上述五个特征的特征值作为输入特征值, 将输入特征值输入到训练好的聚集饮酒预测模型中,得到最近预设时间段 内用户在目标区域的聚集饮酒概率。
进一步的,本申请实施例中,通过以下方式确定目标区域的POI类别: 网约车平台所使用的基础地图数据展现了全国中各个兴趣点(point of Interest,POI)点的地理属性分类(即POI类别),服务器基于基础地图数 据中的各个POI点,将全国划分为多个以POI点为中心的区域。因此,服 务器首先确定多个服务订单中位置信息所属的目标区域,然后,通过基础 地图数据可以确定各个目标区域均的POI类别。
进一步的,本申请实施例中,确定目标区域的历史聚集饮酒概率的方 法包括:获取目标区域的历史出行订单,并基于历史出行订单确定该目标 区域在各个时间段的历史聚集饮酒概率。其中,上述历史出行订单中包括: 历史代驾订单和历史打车订单。这里,服务器可以单独基于历史代驾订单, 确定目标区域在各个时间段的历史聚集饮酒概率。服务器也可以单独基于 历史打车订单,确定目标区域在各个时间段的历史聚集饮酒概率。服务器 也可以同时基于历史代驾订单和历史打车订单,确定目标区域在各个时间 段的历史聚集饮酒概率。
下面分别说明上述三种情况下,服务器确定目标区域的历史聚集饮酒 概率的方法:
第一,单独基于历史代驾订单的方法:服务器根据目标区域中的史代 驾订单的个数以及全部区域中历史代驾订单的个数,确定目标区域的历史 聚集饮酒概率。
具体实施方式中,服务器从代驾平台中获取各个区域在各个时间段(其 中,一个时间段和一个区域对应一个时空单元)的历史代驾订单的个数, 服务器通过上述各个时空单元的历史代驾订单的个数,确定各个时空单元 的饮酒订单出现频次,进而计算任一区域在各个时间段内出现聚集饮酒的 离线醉酒指数。例如,首先计算每个时空单元的饮酒订单出现频次(x), 然后得到所有时空单元分布的均值(u)和方差(σ),最后针对每一个时 空单元都计算其标准化结果(x-u)/σ作为该时空单元的醉酒指数。
第二,单独基于历史打车订单的方法:服务器根据各个时空单元中针 对历史服务订单的醉酒反馈信息(即司机对乘客的醉酒投诉信息)的个数, 确定各个时空单元的饮酒订单出现频次,进而计算任一区域在各个时间段 内出现聚集饮酒的离线醉酒指数。例如,首先计算每个时空单元的饮酒订 单出现频次(x),然后得到所有时空单元分布的均值(u)和方差(σ), 最后针对每一个时空单元都计算其标准化结果(x-u)/σ作为该时空单元的醉酒指数。
第三,同时基于历史代驾订单和历史打车订单的方法:服务器根据各 个时空单元的历史代驾订单的个数,以及,各个时空单元中针对历史服务 订单的醉酒反馈信息(即司机对乘客的醉酒投诉信息)的个数,确定各个 时空单元的饮酒订单出现频次,进而计算任一区域在各个时间段内出现聚 集饮酒的离线醉酒指数。例如,首先计算每个时空单元的饮酒订单出现频 次(x),然后得到所有时空单元分布的均值(u)和方差(σ),最后针对 每一个时空单元都计算其标准化结果(x-u)/σ作为该时空单元的醉酒指数。
进一步的,如图6所示,本申请实施例提供的群体聚集场景的预测方 法中,通过如下方法确定服务订单对应的用户饮酒特征:
S601、获取多个所述服务订单分别对应的用户操作行为数据。
本申请实施例中,用户终端中实时采集用户操作行为数据并上报给服 务器进行存储。服务器获取存储的对应于上述多个服务订单的用户操作行 为数据。其中,上述用户操作行为数据至少包括以下数据中的一种或多种: 输入位置信息的次数、行走步速、发送服务订单的时间、操作错误记录。
S602、根据多个所述服务订单分别对应的用户操作行为数据,确定多 个所述服务订单对应的用户饮酒特征。
本申请实施例中,服务器通过获取到的用户个体在发送出行订单过程 中的信号,预测每一个个体用户的醉酒程度。例如,服务器获取用户在用 户终端中输入地址信息(包括出发地址和目的地址)的次数、用户的平均 步速、用户从打开用户终端中的应用程序(Application,App)到发送出行 订单的花费时间、操作App时的各种错误等信息来预测个体的实时醉酒程 度。
本申请实施例中,用户处于聚集饮酒场景对应的特征包括:目标区域 的聚集行为特征、目标区域的兴趣点POI类别、用户关联关系信息的特征 值、目标区域的历史聚集饮酒概率、服务订单对应的用户饮酒特征。本申 请实施例中,基于上述多个特征训练聚集饮酒预测模型。其中,上述聚集 饮酒预测模型的训练方法,包括:
获取多个样本数据;多个样本数据为:包括聚集饮酒特征的正样本数 据,负样本数据为包括其他聚集行为特征的负样本数据。然后,将聚集饮 酒特征和其他聚集行为特征作为解释变量,将聚集饮酒结果作为被解释变 量,构建非线性模型,并通过多个样本数据对上述非线性模型进行训练, 得到聚集饮酒预测模型;其中,聚集饮酒结果包括:聚集饮酒特征对应的 聚集饮酒结果和其他聚集行为特征对应的非聚集饮酒结果。
这里,首先需要确定聚集饮酒预测模型的样本数据。样本数据描述了 一个POI点在一个时间窗口内是否为聚集饮酒。本申请实施例中,通过一 些启发性规则或聚集饮酒关联的强特征规则来挖掘聚集饮酒预测模型的正 样本数据。
其中,上述启发性规则可以为:若在时间段A中,司机针对乘客B在 位置C的快车订单进行醉酒投诉且投诉成立,则在时间段A下位置C对应 聚集饮酒场景。聚集饮酒关联的强特征规则可以为,某个POI点在短时间 内有多名同事或者好友同时发出代驾呼叫,对应聚集饮酒场景。对于负样 本,则可以通过对其他场景的随机采样获得,比如,某个POI点在短时间 内有多名好友同时发出快车呼叫,对应聚集逛街场景;某个POI点在短时 间内有多名同事同时发出快车呼叫,对应下班场景等。
基于上述方法,选取大量的正样本和负样本。本申请实施例中,负样 本的数量大于正样本的数量,比如,负样本数量为正样本的数量的3倍。
本申请实施例中,有了样本数据后,将聚集饮酒特征和其他聚集行为 特征作为解释变量,将聚集饮酒特征对应的聚集饮酒结果和其他聚集行为 特征对应的非聚集饮酒结果作为被解释变量,构建非线性模型。其中,该 非线性模型用于来预测一个地点在某一时间段内是否是聚集饮酒。其中, 上述非线性模型可以采用梯度提升树(Gradient BoostedTrees)或者神经网 络等算法获得。
针对聚集场景饮酒场景的正样本数据中的特征,在基于上述特征进行 模型训练之前,需要对上述特征进行相应处理,并将处理后的特征输入到 非线性模型中进行模型训练。之后,训练得到的聚集饮酒预测模型则可以 提供到线上环境对各个实时场景进行预测打分,来估计各个区域在各个时 间段下的聚集饮酒的概率。
其中,对上述特征的相应处理包括归一化处理、离散化处理、虚拟编 码(dummycoding)处理、缺失值填充处理和相关性处理等。
进一步的,本申请实施例提供的聚集场景的预测方法中,在根据多个 所述服务订单的订单服务信息以及所述用户关联关系信息,预测所述最近 预设时间段内所述服务订单对应的用户处于目标聚集场景的概率之后,所 述方法还包括:根据用户处于目标聚集场景的概率,调度与所述目标聚集 场景相匹配的服务。
本申请实施例中,服务器获取的多个出行订单可以是待处理的出行订 单,也可以是已完成的出行订单。
针对待处理出行订单,服务器可以根据预测的该待处理出行订单对应 的乘客处于聚集饮酒场景的概率,来为该待处理出行订单提供相匹配的服 务。比如,针对醉酒概率高的乘客发出的第一类型的出行订单(比如打车 订单,具体包括快车订单、出租车订单等),服务器则为该类型的出行订单 调度优质司机,以保证醉酒乘客的安全。这里,优质司机可以为评分值高 于预设分数阈值的司机。
针对已完成出行订单,服务器可以根据预测的该已完成出行订单对应 的乘客处于聚集饮酒场景的概率,来为该已完成出行订单包括的位置信息 对应的目标区域提供相匹配的服务。比如,针对目标区域在一个时间段内 的乘客处于聚集饮酒场景的概率较高,服务器则可以通知代驾公司在该时 间段内之后的预设时间段内往该目标区域调度更多的代驾司机,或者,服 务器在之后每天的该时间段内往该目标区域调度更多的代驾司机。
如图7所示,本申请第二实施例提供了一种群体聚集场景的预测装置, 用于执行上述群体聚集场景的预测方法,所述装置包括:
获取模块701,用于获取在最近预设时间段内产生的多个服务订单;所 述服务订单中包括用户信息和订单服务信息;
确定模块702,用于根据所述服务订单中包括的所述用户信息,确定多 个所述服务订单所表征的用户关联关系信息;
预测模块703,用于根据多个所述服务订单的订单服务信息以及所述用 户关联关系信息,预测所述最近预设时间段内所述服务订单对应的用户处 于目标聚集场景的概率。
进一步的,本申请实施例提供的群体聚集场景的预测装置中,确定模 块702,具体用于:
获取对应于所述用户信息的用户关系网络;
根据所述用户关系网络以及所述多个服务订单中包括的所述用户信 息,得到多个所述服务订单所表征的用户关联关系信息。
进一步的,本申请实施例提供的群体聚集场景的预测装置中,确定模 块702,具体用于:
根据在所述最近预设时间段之前的历史时间段内产生的历史服务订单 的用户信息和订单服务信息,生成对应于所述用户信息的用户关系网络。
进一步的,本申请实施例提供的群体聚集场景的预测装置中,所述订 单服务信息中包括位置信息;预测模块703,具体用于:
根据多个所述服务订单中的位置信息以及多个所述服务订单所表征的 用户关联关系信息,确定所述服务订单对应的用户在所述位置信息对应的 目标区域的聚集行为特征的特征值;
根据用户在所述目标区域的聚集行为特征的特征值,确定最近预设时 间段内用户在所述目标区域的聚集场景概率。
进一步的,本申请实施例提供的群体聚集场景的预测装置中,所述聚 集行为特征包括以下特征中的一个或多个:群体散场特征;群体聚集特征; 区域行为特征。
进一步的,本申请实施例提供的群体聚集场景的预测装置中,若所述 位置信息包括出发地位置,所述聚集行为特征包括群体散场特征;预测模 块703,还用于:
判断在最近第一预设时间段内是否存在多个第一目标服务订单,所述 多个第一目标服务订单的出发地位置对应第一目标区域、且用户信息之间 相互关联;
根据判断结果,确定所述目标区域的群体散场特征的特征值。
进一步的,本申请实施例提供的群体聚集场景的预测装置中,若所述 位置信息包括目的地位置,所述聚集行为特征包括群体聚集特征;预测模 块703,还用于:
判断在最近第一预设时间段之前的第二预设时间段内是否存在目的地 位置对应第二目标区域、且包括的用户信息之间相互关联的多个第二目标 服务订单;
根据判断结果,确定所述目标区域的群体聚集特征的特征值。
进一步的,本申请实施例提供的群体聚集场景的预测装置中,所述聚 集行为特征包括区域行为特征;预测模块703,还用于:
根据所述服务订单包括的位置信息,确定所述位置信息对应的目标区 域的行为类别;
判断最近第一预设时间段内是否存在包括与所述目标区域的行为类别 相匹配的订单类型的多个第三目标服务订单;
根据判断结果,确定所述目标区域的区域行为特征的特征值。
进一步的,本申请实施例提供的群体聚集场景的预测装置中,预测模 块703,具体用于:
获取服务提供方针对多个所述第三目标服务订单的区域行为反馈信 息;
根据所述区域行为反馈信息以及所述判断结果,确定所述目标区域的 区域行为特征值。
进一步的,本申请实施例提供的群体聚集场景的预测装置中,所述聚 集场景包括聚集饮酒场景。
进一步的,本申请实施例提供的群体聚集场景的预测装置中,预测模 块703,具体用于:
将所述目标区域的聚集行为特征的特征值,以及以下信息对应的特征 值中的至少一种输入到训练好的聚集饮酒预测模型中,得到最近预设时间 段内用户在所述目标区域的聚集饮酒概率:
所述目标区域的兴趣点POI类别;所述用户关联关系信息;所述目标 区域的历史聚集饮酒概率;所述服务订单对应的用户饮酒特征。
进一步的,本申请实施例提供的群体聚集场景的预测装置中,确定模 块702,还用于根据所述目标区域中历史代驾订单的个数以及全部区域中历 史代驾订单的个数,确定所述目标区域的历史聚集饮酒概率。
进一步的,本申请实施例提供的群体聚集场景的预测装置中,确定模 块702,还用于:
根据所述目标区域中针对历史服务订单的醉酒反馈信息的个数,以及 全部区域中针对所述历史服务订单的醉酒反馈信息的个数,确定所述目标 区域的历史聚集饮酒概率。
进一步的,本申请实施例提供的群体聚集场景的预测装置中,确定模 块702,还用于:
获取多个所述服务订单分别对应的用户操作行为数据;
根据多个所述服务订单分别对应的用户操作行为数据,确定多个所述 服务订单对应的用户饮酒特征。
进一步的,本申请实施例提供的群体聚集场景的预测装置中,所述用 户操作行为数据至少包括以下数据中的一种或多种:输入位置信息的次数、 行走步速、发送服务订单的时间、操作错误记录。
进一步的,本申请实施例提供的群体聚集场景的预测装置,还包括模 型训练模块;
获取模块701,还用于获取多个样本数据;所述样本数据为:包括聚集 饮酒特征的正样本数据和包括其他聚集行为特征的负样本数据;
模型训练模块,用于将所述聚集饮酒特征和所述其他聚集行为特征作 为解释变量,将聚集饮酒结果作为被解释变量,构建非线性模型,并通过 多个所述样本数据对所述非线性模型进行训练,得到所述聚集饮酒预测模 型;其中,聚集饮酒结果包括:聚集饮酒特征对应的聚集饮酒结果和其他 聚集行为特征对应的非聚集饮酒结果。
进一步的,本申请实施例提供的群体聚集场景的预测装置,还包括:
调度模块,用于根据用户处于目标聚集场景的概率,调度与所述目标 聚集场景相匹配的服务。
图8为本申请实施例提供的计算机设备的结构示意图,如图8所示, 本申请第三实施例提供的一种计算机设备80,包括:处理器802、存储器 801和总线,存储器801存储执行指令,当计算机设备80运行时,处理器 802与存储器801之间通过总线通信,处理器802执行所述执行指令使得计 算机设备80执行第一方面所述的群体聚集场景的预测方法。
具体地,上述存储器801和处理器802能够为通用的存储器和处理器, 这里不做具体限定,当处理器802运行存储器801存储的计算机程序时, 能够执行上述群体聚集场景的预测方法。
对应于上述群体聚集场景的预测方法,本申请第四实施例提供的一种 计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算 机可执行指令可执行本申请第一实施例所述的群体聚集场景的预测方法。
需要说明的是,本申请实施例中将会用到术语“包括”,用于指出其后 所声明的特征的存在,但并不排除增加其它的特征。
本申请中的术语“乘客”和“用户”可互换使用,以指代可以请求或 订购服务的个人、实体或工具。本申请中的术语“司机”和“服务提供方”、 可互换使用,以指代可以提供服务的个人、实体或工具。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述 描述的系统和装置的具体工作过程,可以参考方法实施例中的对应过程, 本申请中不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭 露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实 施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分, 实际实现时可以有另外的划分方式,又例如,多个模块或组件可以结合或 者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所 显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信 接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形 式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的, 作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地 方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的 部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元 中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在 一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使 用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。 基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的 部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软 件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可 以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述 方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、 RAM、磁碟或者光盘等各种可以存储程序代码的存储介质。
以上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此, 任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到 变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范 围应以权利要求的保护范围为准。

Claims (36)

1.一种群体聚集场景的预测方法,其特征在于,包括:
获取在最近预设时间段内产生的多个服务订单;所述服务订单中包括用户信息和订单服务信息;
根据所述服务订单中包括的所述用户信息,确定多个所述服务订单所表征的用户关联关系信息;
根据多个所述服务订单的订单服务信息以及所述用户关联关系信息,预测所述最近预设时间段内所述服务订单对应的用户处于目标聚集场景的概率。
2.根据权利要求1所述的群体聚集场景的预测方法,其特征在于,所述根据所述服务订单中包括的所述用户信息,确定多个所述服务订单所表征的用户关联关系信息,包括:
获取对应于所述用户信息的用户关系网络;
根据所述用户关系网络以及所述多个服务订单中包括的所述用户信息,得到多个所述服务订单所表征的用户关联关系信息。
3.根据权利要求2所述的群体聚集场景的预测方法,其特征在于,所述获取对应于所述用户信息的用户关系网络,包括:
根据在所述最近预设时间段之前的历史时间段内产生的历史服务订单的用户信息和订单服务信息,生成对应于所述用户信息的用户关系网络。
4.根据权利要求1所述的群体聚集场景的预测方法,其特征在于,所述订单服务信息中包括位置信息;所述根据多个所述服务订单的订单服务信息以及所述用户关联关系信息,预测所述最近预设时间段内所述服务订单对应的用户处于目标聚集场景的概率,包括:
根据多个所述服务订单中的位置信息以及多个所述服务订单所表征的用户关联关系信息,确定所述服务订单对应的用户在所述位置信息对应的目标区域的聚集行为特征的特征值;
根据用户在所述目标区域的聚集行为特征的特征值,确定最近预设时间段内用户在所述目标区域的聚集场景概率。
5.根据权利要求4所述的群体聚集场景的预测方法,其特征在于,所述聚集行为特征包括以下特征中的一个或多个:群体散场特征;群体聚集特征;区域行为特征。
6.根据权利要求5所述的群体聚集场景的预测方法,其特征在于,若所述位置信息包括出发地位置,所述聚集行为特征包括群体散场特征;根据以下步骤确定所述目标区域的群体散场特征的特征值:
判断在最近第一预设时间段内是否存在多个第一目标服务订单,所述多个第一目标服务订单的出发地位置对应第一目标区域、且用户信息之间相互关联;
根据判断结果,确定所述目标区域的群体散场特征的特征值。
7.根据权利要求5所述的群体聚集场景的预测方法,其特征在于,若所述位置信息包括目的地位置,所述聚集行为特征包括群体聚集特征;根据以下步骤确定所述目标区域的群体聚集特征的特征值:
判断在最近第一预设时间段之前的第二预设时间段内是否存在目的地位置对应第二目标区域、且包括的用户信息之间相互关联的多个第二目标服务订单;
根据判断结果,确定所述目标区域的群体聚集特征的特征值。
8.根据权利要求5所述的群体聚集场景的预测方法,其特征在于,所述聚集行为特征包括区域行为特征;根据以下步骤确定所述目标区域的区域行为特征的特征值:
根据所述服务订单包括的位置信息,确定所述位置信息对应的目标区域的行为类别;
判断最近第一预设时间段内是否存在包括与所述目标区域的行为类别相匹配的订单类型的多个第三目标服务订单;
根据判断结果,确定所述目标区域的区域行为特征的特征值。
9.根据权利要求8所述的群体聚集场景的预测方法,其特征在于,所述根据判断结果,确定所述目标区域的区域行为特征的特征值,包括:
获取服务提供方针对多个所述第三目标服务订单的区域行为反馈信息;
根据所述区域行为反馈信息以及所述判断结果,确定所述目标区域的区域行为特征值。
10.根据权利要求4所述的群体聚集场景的预测方法,其特征在于,所述聚集场景包括聚集饮酒场景。
11.根据权利要求10所述的群体聚集场景的预测方法,其特征在于,所述根据用户在所述目标区域的聚集行为特征的特征值,确定最近预设时间段内用户在所述目标区域的聚集场景概率,包括:
将所述目标区域的聚集行为特征的特征值,以及以下信息对应的特征值中的至少一种输入到训练好的聚集饮酒预测模型中,得到最近预设时间段内用户在所述目标区域的聚集饮酒概率:
所述目标区域的兴趣点POI类别;所述用户关联关系信息;所述目标区域的历史聚集饮酒概率;所述服务订单对应的用户饮酒特征。
12.根据权利要求11所述的群体聚集场景的预测方法,其特征在于,通过以下方法确定所述目标区域的历史聚集饮酒概率,包括:
根据所述目标区域中历史代驾订单的个数以及全部区域中历史代驾订单的个数,确定所述目标区域的历史聚集饮酒概率。
13.根据权利要求11所述的群体聚集场景的预测方法,其特征在于,通过以下方法确定所述目标区域的历史聚集饮酒概率,还包括:
根据所述目标区域中针对历史服务订单的醉酒反馈信息的个数,以及全部区域中针对所述历史服务订单的醉酒反馈信息的个数,确定所述目标区域的历史聚集饮酒概率。
14.根据权利要求11所述的群体聚集场景的预测方法,其特征在于,通过以下方法确定所述服务订单对应的用户饮酒特征,包括:
获取多个所述服务订单分别对应的用户操作行为数据;
根据多个所述服务订单分别对应的用户操作行为数据,确定多个所述服务订单对应的用户饮酒特征。
15.根据权利要求14所述的群体聚集场景的预测方法,其特征在于,所述用户操作行为数据至少包括以下数据中的一种或多种:输入位置信息的次数、行走步速、发送服务订单的时间、操作错误记录。
16.根据权利要求11所述的群体聚集场景的预测方法,其特征在于,所述聚集饮酒预测模型的训练方法,包括:
获取多个样本数据;所述样本数据为:包括聚集饮酒特征的正样本数据和包括其他聚集行为特征的负样本数据;
将所述聚集饮酒特征和所述其他聚集行为特征作为解释变量,将聚集饮酒结果作为被解释变量,构建非线性模型,并通过多个所述样本数据对所述非线性模型进行训练,得到所述聚集饮酒预测模型;其中,聚集饮酒结果包括:聚集饮酒特征对应的聚集饮酒结果和其他聚集行为特征对应的非聚集饮酒结果。
17.根据权利要求1~16任一项所述的群体聚集场景的预测方法,其特征在于,所述根据多个所述服务订单的订单服务信息以及所述用户关联关系信息,预测所述最近预设时间段内所述服务订单对应的用户处于目标聚集场景的概率之后,所述方法还包括:
根据用户处于目标聚集场景的概率,调度与所述目标聚集场景相匹配的服务。
18.一种群体聚集场景的预测装置,其特征在于,包括:
获取模块,用于获取在最近预设时间段内产生的多个服务订单;所述服务订单中包括用户信息和订单服务信息;
确定模块,用于根据所述服务订单中包括的所述用户信息,确定多个所述服务订单所表征的用户关联关系信息;
预测模块,用于根据多个所述服务订单的订单服务信息以及所述用户关联关系信息,预测所述最近预设时间段内所述服务订单对应的用户处于目标聚集场景的概率。
19.根据权利要求18所述的群体聚集场景的预测装置,其特征在于,所述确定模块,具体用于:
获取对应于所述用户信息的用户关系网络;
根据所述用户关系网络以及所述多个服务订单中包括的所述用户信息,得到多个所述服务订单所表征的用户关联关系信息。
20.根据权利要求19所述的群体聚集场景的预测装置,其特征在于,所述确定模块,具体用于:
根据在所述最近预设时间段之前的历史时间段内产生的历史服务订单的用户信息和订单服务信息,生成对应于所述用户信息的用户关系网络。
21.根据权利要求18所述的群体聚集场景的预测装置,其特征在于,所述订单服务信息中包括位置信息;所述预测模块,具体用于:
根据多个所述服务订单中的位置信息以及多个所述服务订单所表征的用户关联关系信息,确定所述服务订单对应的用户在所述位置信息对应的目标区域的聚集行为特征的特征值;
根据用户在所述目标区域的聚集行为特征的特征值,确定最近预设时间段内用户在所述目标区域的聚集场景概率。
22.根据权利要求21所述的群体聚集场景的预测装置,其特征在于,所述聚集行为特征包括以下特征中的一个或多个:群体散场特征;群体聚集特征;区域行为特征。
23.根据权利要求22所述的群体聚集场景的预测装置,其特征在于,若所述位置信息包括出发地位置,所述聚集行为特征包括群体散场特征;所述预测模块,还用于:
判断在最近第一预设时间段内是否存在多个第一目标服务订单,所述多个第一目标服务订单的出发地位置对应第一目标区域、且用户信息之间相互关联;
根据判断结果,确定所述目标区域的群体散场特征的特征值。
24.根据权利要求22所述的群体聚集场景的预测装置,其特征在于,若所述位置信息包括目的地位置,所述聚集行为特征包括群体聚集特征;所述预测模块,还用于:
判断在最近第一预设时间段之前的第二预设时间段内是否存在目的地位置对应第二目标区域、且包括的用户信息之间相互关联的多个第二目标服务订单;
根据判断结果,确定所述目标区域的群体聚集特征的特征值。
25.根据权利要求22所述的群体聚集场景的预测装置,其特征在于,所述聚集行为特征包括区域行为特征;所述预测模块,还用于:
根据所述服务订单包括的位置信息,确定所述位置信息对应的目标区域的行为类别;
判断最近第一预设时间段内是否存在包括与所述目标区域的行为类别相匹配的订单类型的多个第三目标服务订单;
根据判断结果,确定所述目标区域的区域行为特征的特征值。
26.根据权利要求25所述的群体聚集场景的预测装置,其特征在于,所述预测模块,具体用于:
获取服务提供方针对多个所述第三目标服务订单的区域行为反馈信息;
根据所述区域行为反馈信息以及所述判断结果,确定所述目标区域的区域行为特征值。
27.根据权利要求21所述的群体聚集场景的预测装置,其特征在于,所述聚集场景包括聚集饮酒场景。
28.根据权利要求27所述的群体聚集场景的预测装置,其特征在于,所述预测模块,具体用于:
将所述目标区域的聚集行为特征的特征值,以及以下信息对应的特征值中的至少一种输入到训练好的聚集饮酒预测模型中,得到最近预设时间段内用户在所述目标区域的聚集饮酒概率:
所述目标区域的兴趣点POI类别;所述用户关联关系信息;所述目标区域的历史聚集饮酒概率;所述服务订单对应的用户饮酒特征。
29.根据权利要求28所述的群体聚集场景的预测装置,其特征在于,所述确定模块,还用于根据所述目标区域中历史代驾订单的个数以及全部区域中历史代驾订单的个数,确定所述目标区域的历史聚集饮酒概率。
30.根据权利要求28所述的群体聚集场景的预测装置,其特征在于,所述确定模块,还用于:
根据所述目标区域中针对历史服务订单的醉酒反馈信息的个数,以及全部区域中针对所述历史服务订单的醉酒反馈信息的个数,确定所述目标区域的历史聚集饮酒概率。
31.根据权利要求28所述的群体聚集场景的预测装置,其特征在于,所述确定模块,还用于:
获取多个所述服务订单分别对应的用户操作行为数据;
根据多个所述服务订单分别对应的用户操作行为数据,确定多个所述服务订单对应的用户饮酒特征。
32.根据权利要求31所述的群体聚集场景的预测装置,其特征在于,所述用户操作行为数据至少包括以下数据中的一种或多种:输入位置信息的次数、行走步速、发送服务订单的时间、操作错误记录。
33.根据权利要求28所述的群体聚集场景的预测装置,其特征在于,还包括模型训练模块;
所述获取模块,还用于获取多个样本数据;所述样本数据为:包括聚集饮酒特征的正样本数据和包括其他聚集行为特征的负样本数据;
所述模型训练模块,用于将所述聚集饮酒特征和所述其他聚集行为特征作为解释变量,将聚集饮酒结果作为被解释变量,构建非线性模型,并通过多个所述样本数据对所述非线性模型进行训练,得到所述聚集饮酒预测模型;其中,聚集饮酒结果包括:聚集饮酒特征对应的聚集饮酒结果和其他聚集行为特征对应的非聚集饮酒结果。
34.根据权利要求18~33任一项所述的群体聚集场景的预测装置,其特征在于,还包括:
调度模块,用于根据用户处于目标聚集场景的概率,调度与所述目标聚集场景相匹配的服务。
35.一种电子设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行时执行如权利要求1至17任一所述的群体聚集场景的预测方法的步骤。
36.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至17任一所述的群体聚集场景的预测方法的步骤。
CN201811490106.9A 2018-12-06 2018-12-06 一种群体聚集场景的预测方法、装置、设备及存储介质 Pending CN111291914A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811490106.9A CN111291914A (zh) 2018-12-06 2018-12-06 一种群体聚集场景的预测方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811490106.9A CN111291914A (zh) 2018-12-06 2018-12-06 一种群体聚集场景的预测方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN111291914A true CN111291914A (zh) 2020-06-16

Family

ID=71025211

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811490106.9A Pending CN111291914A (zh) 2018-12-06 2018-12-06 一种群体聚集场景的预测方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN111291914A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112926796A (zh) * 2021-03-22 2021-06-08 广州宸祺出行科技有限公司 一种基于特定场景的下车点推荐方法及装置
CN113286262A (zh) * 2021-05-13 2021-08-20 Oppo广东移动通信有限公司 服务提供方法及装置、计算机可读存储介质和电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002140462A (ja) * 2000-10-31 2002-05-17 Proto International Corp 残価予測システム及びその方法、保険料算出システム及びその方法、並びにコンピュータ上で動作する残価予測プログラム又は保険料算出プログラムを記録した記録媒体
CN104599088A (zh) * 2015-02-13 2015-05-06 北京嘀嘀无限科技发展有限公司 基于订单的调度方法和调度系统
CN106557942A (zh) * 2015-09-30 2017-04-05 百度在线网络技术(北京)有限公司 一种用户关系的识别方法和装置
CN106875066A (zh) * 2017-02-28 2017-06-20 百度在线网络技术(北京)有限公司 用车出行行为的预测方法、装置、服务器以及存储介质
CN106897919A (zh) * 2017-02-28 2017-06-27 百度在线网络技术(北京)有限公司 用车类型预测模型建立、信息提供方法及装置
CN107305667A (zh) * 2016-04-18 2017-10-31 滴滴(中国)科技有限公司 基于出行习惯的用户画像获取方法及装置
CN108364220A (zh) * 2018-03-06 2018-08-03 雷学军 一种共享生态的方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002140462A (ja) * 2000-10-31 2002-05-17 Proto International Corp 残価予測システム及びその方法、保険料算出システム及びその方法、並びにコンピュータ上で動作する残価予測プログラム又は保険料算出プログラムを記録した記録媒体
CN104599088A (zh) * 2015-02-13 2015-05-06 北京嘀嘀无限科技发展有限公司 基于订单的调度方法和调度系统
CN106557942A (zh) * 2015-09-30 2017-04-05 百度在线网络技术(北京)有限公司 一种用户关系的识别方法和装置
CN107305667A (zh) * 2016-04-18 2017-10-31 滴滴(中国)科技有限公司 基于出行习惯的用户画像获取方法及装置
CN106875066A (zh) * 2017-02-28 2017-06-20 百度在线网络技术(北京)有限公司 用车出行行为的预测方法、装置、服务器以及存储介质
CN106897919A (zh) * 2017-02-28 2017-06-27 百度在线网络技术(北京)有限公司 用车类型预测模型建立、信息提供方法及装置
CN108364220A (zh) * 2018-03-06 2018-08-03 雷学军 一种共享生态的方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112926796A (zh) * 2021-03-22 2021-06-08 广州宸祺出行科技有限公司 一种基于特定场景的下车点推荐方法及装置
CN112926796B (zh) * 2021-03-22 2023-12-22 广州宸祺出行科技有限公司 一种基于特定场景的下车点推荐方法及装置
CN113286262A (zh) * 2021-05-13 2021-08-20 Oppo广东移动通信有限公司 服务提供方法及装置、计算机可读存储介质和电子设备
CN113286262B (zh) * 2021-05-13 2022-10-21 Oppo广东移动通信有限公司 服务提供方法及装置、计算机可读存储介质和电子设备

Similar Documents

Publication Publication Date Title
US11830297B2 (en) Method for determining driving characteristics of a vehicle
RU2721176C2 (ru) Системы и способы для предсказания поведения пользователя на основе данных о местоположении
US11443388B2 (en) Detecting transportation company trips in a vehicle based upon on-board audio signals
US10567935B1 (en) Connected services configuration for connecting a mobile device to applications to perform tasks
US9111403B2 (en) Systems and methods for tracking device control and report
EP3332365A1 (en) Systems and methods for adjusting ride-sharing schedules and routes
AU2018284301B2 (en) Customized communications for network systems
CN111325374B (zh) 一种订单取消概率的预测方法、装置和电子设备
US20140108058A1 (en) Method and System to Determine Auto Insurance Risk
CN110782111B (zh) 一种风险评估方法和系统
RU2595551C1 (ru) Навигатор для общественного транспорта
CN111275228B (zh) 预测方法、装置、电子设备及存储介质
WO2014028377A2 (en) Apparatus and method for detecting driving performance data
CN111832901A (zh) 网约车监控方法、装置、服务器和存储介质
US11669756B2 (en) Partitioning sensor based data to generate driving pattern map
CN110782301A (zh) 一种拼单方法、装置、电子设备及计算机可读存储介质
US10560797B2 (en) Information processing device and method
CN111291914A (zh) 一种群体聚集场景的预测方法、装置、设备及存储介质
CN111858790A (zh) 一种绕路提醒的方法、装置、电子设备及介质
JP2020533713A (ja) 少なくとも1つの保険会社を推奨するための人口知能システムおよび方法
CN111598274A (zh) 基于取消异常的风险识别方法、系统、装置及存储介质
CN111461368B (zh) 异常订单处理方法、装置、设备及计算机可读存储介质
CN111310961A (zh) 数据预测方法、装置、电子设备和计算机可读存储介质
CN106921687B (zh) 一种信息推送方法、服务器和终端
CN111353093A (zh) 问题推荐方法、装置、服务器及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
AD01 Patent right deemed abandoned

Effective date of abandoning: 20230228

AD01 Patent right deemed abandoned