CN111291772B - 信息的推送方法、装置、电子设备和计算机可读存储介质 - Google Patents

信息的推送方法、装置、电子设备和计算机可读存储介质 Download PDF

Info

Publication number
CN111291772B
CN111291772B CN201811489044.XA CN201811489044A CN111291772B CN 111291772 B CN111291772 B CN 111291772B CN 201811489044 A CN201811489044 A CN 201811489044A CN 111291772 B CN111291772 B CN 111291772B
Authority
CN
China
Prior art keywords
target
new service
cluster group
regional
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811489044.XA
Other languages
English (en)
Other versions
CN111291772A (zh
Inventor
付俊强
杜龙志
任悦
李奘
卓呈祥
郄小虎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Didi Infinity Technology and Development Co Ltd
Original Assignee
Beijing Didi Infinity Technology and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Didi Infinity Technology and Development Co Ltd filed Critical Beijing Didi Infinity Technology and Development Co Ltd
Priority to CN201811489044.XA priority Critical patent/CN111291772B/zh
Publication of CN111291772A publication Critical patent/CN111291772A/zh
Application granted granted Critical
Publication of CN111291772B publication Critical patent/CN111291772B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0207Discounts or incentives, e.g. coupons or rebates

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种信息的推送方法、装置、电子设备和计算机可读存储介质,其中,该方法包括:获取多个待推送信息的目标区域,并对多个目标区域进行聚类分析,得到至少一个区域聚类分组;确定每个区域聚类分组区域内新服务请求方的转化率,其中,新服务请求方为多个目标区域内的新注册且还未过发起服务订单的服务请求方,转化率为新服务请求方发起服务订单的概率;基于转化率确定各个区域聚类分组中的新服务请求方对应的待推送信息,并向各个区域聚类分组中的新服务请求方发送对应的待推送信息。本申请通过向每个聚类分组中的新服务请求方发送对应的待推送信息的方式,能够实现针对各个目标区域的特点发送对应的待推送信息的技术效果。

Description

信息的推送方法、装置、电子设备和计算机可读存储介质
技术领域
本申请涉及互联网的技术领域,具体而言,涉及一种信息的推送方法、装置、电子设备和计算机可读存储介质。
背景技术
目前,随着互联网技术的快速发展,网约车平台也逐渐在人们的生活中开始普及。网约车平台中一般包含快车服务、拼车服务、出租车服务、顺风车服务、专车服务等多种服务。用户在使用网约平台发起服务订单时,可根据自身需求的不同选择不同的服务。
为了鼓励新用户使用网约车平台,网约车平台会对潜在用户使用一些招新策略。在现有技术中,招新策略是对新加入的用户发送优惠劵,例如,对全国范围内新加入网约车平台的用户发送优惠劵。但是,在现有技术的方法中,是向全国范围内的全部新注册用户发送相同的优惠劵。若发放相同的优惠劵,那么将无法针对各个区域的特点来实现优惠劵的发放,这将不利于新注册的用户转化为老用户。
发明内容
有鉴于此,本申请实施例的目的在于提供一种信息的推送方法、装置、电子设备和计算机可读存储介质,通过向每个聚类分组中的新服务请求方发送对应的待推送信息的方式,能够实现针对各个目标区域的特点发送对应的待推送信息的技术效果。
根据本申请的一个方面,提供一种电子设备,可以包括一个或多个存储介质和一个或多个与存储介质通信的处理器。一个或多个存储介质存储有处理器可执行的机器可读指令。当电子设备运行时,处理器与存储介质之间通过总线通信,处理器执行所述机器可读指令,以执行一个或多个以下操作:
获取多个待推送信息的目标区域,并对多个目标区域进行聚类分析,得到至少一个区域聚类分组;确定每个区域聚类分组所属区域内新服务请求方的转化率,其中,所述新服务请求方为所述多个目标区域内的新注册且还未过发起服务订单的服务请求方,所述转化率为所述新服务请求方发起服务订单的概率;基于所述转化率确定各个区域聚类分组中的新服务请求方对应的待推送信息,并向各个区域聚类分组中的新服务请求方发送所述对应的待推送信息,其中,所述待推送信息包括:待推送的优惠信息和所述待推送的优惠信息的类型信息。
在本申请较佳的实施例中,对所述多个目标区域进行聚类分析,得到至少一个区域聚类分组包括:获取各个目标区域的特征数据,其中,所述特征数据包括以下至少一种:目标区域的属性信息、目标区域内的竞品信息、服务业务信息、服务提供方的特征数据、服务请求方的特征数据;利用所述特征数据对所述多个目标区域进行分类,得到至少一个区域聚类分组。
在本申请较佳的实施例中,利用所述特征数据对所述多个目标区域进行分类包括:对所述各个目标区域的特征数据进行数据转化处理,得到处理结果;所述数据转化处理至少包括下述之一:归一化处理和离散化处理;所述处理结果中包括各个目标区域所对应各个特征数据的特征值;基于所述处理结果对所述多个目标区域进行分类。
在本申请较佳的实施例中,基于所述处理结果对所述多个目标区域进行分类包括:对所述处理结果进行相关性处理,以从所述处理结果中提取多个关联性大于预设关联性的特征数据,得到目标数据结果;基于所述目标数据结果对所述多个目标区域进行聚类分析。
在本申请较佳的实施例中,基于所述目标数据结果对所述多个目标区域进行聚类分析包括:基于所述目标数据结果构建所述多个目标区域的层次聚类树状图;基于所述层次聚类树状图确定所述至少一个区域聚类分组。
在本申请较佳的实施例中,基于所述目标数据结果构建所述多个目标区域的层次聚类树状图包括:将初始区域聚类分组作为目标区域聚类分组,反复执行以下步骤,直至将所述多个目标区域归为一类;一个目标区域对应一个初始区域聚类分组:基于所述目标数据结果计算所述目标区域聚类分组中任意两个区域聚类分组之间的相似度,得到多个相似度;将所述多个相似度中小于预设相似度的任意两个区域聚类分组划分为相同的类别,得到新的区域聚类分组;将所述新的区域聚类分组和所述目标区域聚类分组中除所述新的区域聚类分组之外的其他区域聚类分组重新作为所述目标区域聚类分组。
在本申请较佳的实施例中,基于所述层次聚类树状图确定所述至少一个区域聚类分组包括:确定所述至少一个区域聚类分组的数量信息;基于所述数量信息在所述层次聚类树状图中确定所述至少一个区域聚类分组,以及每个区域聚类分组所属的目标区域。
在本申请较佳的实施例中,确定每个区域聚类分组所属区域内新服务请求方的转化率包括:获取所述新服务请求方的特征数据;按照所述至少一个区域聚类分组对所述新服务请求方的特征数据进行划分,得到所属于各个区域聚类分组的新服务请求方的特征数据;基于所述所属于各个区域聚类分组的新服务请求方的特征数据确定每个区域聚类分组所属区域内新服务请求方的转化率。
在本申请较佳的实施例中,基于所述所属于各个区域聚类分组的新服务请求方的特征数据确定每个区域聚类分组所属区域内新服务请求方的转化率包括:确定区域聚类分组Ai所对应的机器学习模型,其中,所述机器学习模型包括:集成树模型或者深度学习模型;其中,i依次取1至I,I为所述区域聚类分组的数量;基于所述机器学习模型对所述区域聚类分组Ai所属的新服务请求方的特征数据进行分析,以预测所述区域聚类分组Ai中各个新服务请求方的转化率。
在本申请较佳的实施例中,基于所述转化率确定各个区域聚类分组中的新服务请求方对应的待推送信息包括:按照所述转化率将各个区域聚类分组内的新服务请求方划分为多个层次,从而得到多个第一层次;针对每个区域聚类分组所对应的第一层次,按照第一层次的实际转化率对每个区域聚类分组所对应的第一层次进行排序,得到目标排序结果;基于所述目标排序结果确定各个所述区域聚类分组内新服务请求方的待推送信息。
在本申请较佳的实施例中,通过以下方式确定每个第一层次的实际转化率,具体包括:获取历史时间段内所述多个目标区域的新服务请求方的历史特征数据;确定所述历史时间段的新服务请求方中所属于各个区域聚类分组的新服务请求方;基于确定出的所属于各个区域聚类分组的新服务请求方的历史特征数据,预测所述区域聚类分组内新服务请求方的转化率;按照预测出的转化率对所属于各个区域聚类分组内的新服务请求方进行排序,得到第一排序结果;基于所述第一排序结果将每个区域聚类分组划分为多个层次,得到多个第二层次;确定所述多个第二层次中每个第二层次实际转化率,并将所述多个第二层次的实际转化率确定为所述多个第一层次的实际转化率。
在本申请较佳的实施例中,基于所述目标排序结果确定各个所述区域聚类分组内新服务请求方的待推送信息包括:确定每个所述区域聚类分组中各个第一层次的待推送信息,并向各个所述第一层次中的新服务请求方发送对应的待推送信息。
根据本申请的另一个方面,还提供一种信息的推送装置,包括:获取单元,用于获取多个待推送信息的目标区域;聚类分析单元,用于对多个目标区域进行聚类分析,得到至少一个区域聚类分组;第一确定单元,用于确定每个区域聚类分组所属区域内新服务请求方的转化率,其中,所述新服务请求方为所述多个目标区域内的新注册且还未过发起服务订单的服务请求方,所述转化率为所述新服务请求方发起服务订单的概率;第二确定单元,用于基于所述转化率确定各个区域聚类分组中的新服务请求方对应的待推送信息;发送单元,用于向各个区域聚类分组中的新服务请求方发送所述对应的待推送信息,其中,所述待推送信息包括:待推送的优惠信息和所述待推送的优惠信息的类型信息。
在本申请较佳的实施例中,所述聚类分析单元包括:第一获取模块,用于获取各个目标区域的特征数据,其中,所述特征数据包括以下至少一种:目标区域的属性信息、目标区域内的竞品信息、服务业务信息、服务提供方的特征数据、服务请求方的特征数据;聚类分析模块,用于利用所述特征数据对所述多个目标区域进行分类,得到至少一个区域聚类分组。
在本申请较佳的实施例中,所述聚类分析模块用于:对所述各个目标区域的特征数据进行数据转化处理,得到处理结果;所述数据转化处理至少包括下述之一:归一化处理和离散化处理;所述处理结果中包括各个目标区域所对应各个特征数据的特征值;基于所述处理结果对所述多个目标区域进行分类。
在本申请较佳的实施例中,所述聚类分析模块还用于:对所述处理结果进行相关性处理,以从所述处理结果中提取多个关联性大于预设关联性的特征数据,得到目标数据结果;基于所述目标数据结果对所述多个目标区域进行聚类分析。
在本申请较佳的实施例中,所述聚类分析模块还用于:基于所述目标数据结果构建所述多个目标区域的层次聚类树状图;基于所述层次聚类树状图确定所述至少一个区域聚类分组。
在本申请较佳的实施例中,所述聚类分析模块还用于:将初始区域聚类分组作为目标区域聚类分组,反复执行以下步骤,直至将所述多个目标区域归为一类;一个目标区域对应一个初始区域聚类分组:基于所述目标数据结果计算所述目标区域聚类分组中任意两个区域聚类分组之间的相似度,得到多个相似度;将所述多个相似度中小于预设相似度的任意两个区域聚类分组划分为相同的类别,得到新的区域聚类分组;将所述新的区域聚类分组和所述目标区域聚类分组中除所述新的区域聚类分组之外的其他区域聚类分组重新作为所述目标区域聚类分组。
在本申请较佳的实施例中,所述聚类分析模块还用于:确定所述至少一个区域聚类分组的数量信息;基于所述数量信息在所述层次聚类树状图中确定所述至少一个区域聚类分组,以及每个区域聚类分组所属的目标区域。
在本申请较佳的实施例中,所述确定单元包括:第二获取模块,用于获取所述新服务请求方的特征数据;第一划分模块,用于按照所述至少一个区域聚类分组对所述新服务请求方的特征数据进行划分,得到所属于各个区域聚类分组的新服务请求方的特征数据;确定模块,用于基于所述所属于各个区域聚类分组的新服务请求方的特征数据确定每个区域聚类分组所属区域内新服务请求方的转化率。
在本申请较佳的实施例中,所述确定模块用于:确定区域聚类分组Ai所对应的机器学习模型,其中,所述机器学习模型包括:集成树模型或者深度学习模型;其中,i依次取1至I,I为所述区域聚类分组的数量;基于所述机器学习模型对所述区域聚类分组Ai所属的新服务请求方的特征数据进行分析,以预测所述区域聚类分组Ai中各个新服务请求方的转化率。
在本申请较佳的实施例中,所述第二确定单元包括:第二划分模块,用于按照所述转化率将各个区域聚类分组内的新服务请求方划分为多个层次,从而得到多个第一层次;排序模块,用于针对每个区域聚类分组所对应的第一层次,按照第一层次的实际转化率对每个区域聚类分组所对应的第一层次进行排序,得到目标排序结果;确定模块,用于基于所述目标排序结果确定各个所述区域聚类分组内新服务请求方的待推送信息。
在本申请较佳的实施例中,所述装置通过以下方式确定每个第一层次的实际转化率,具体包括:获取历史时间段内所述多个目标区域的新服务请求方的历史特征数据;确定所述历史时间段的新服务请求方中所属于各个区域聚类分组的新服务请求方;基于确定出的所属于各个区域聚类分组的新服务请求方的历史特征数据,预测所述区域聚类分组内新服务请求方的转化率;按照预测出的转化率对所属于各个区域聚类分组内的新服务请求方进行排序,得到第一排序结果;基于所述第一排序结果将每个区域聚类分组划分为多个层次,得到多个第二层次;确定所述多个第二层次中每个第二层次实际转化率,并将所述多个第二层次的实际转化率确定为所述多个第一层次的实际转化率。
在本申请较佳的实施例中,所述确定和发送模块还用于:确定每个所述区域聚类分组中各个第一层次的待推送信息,并向各个所述第一层次中的新服务请求方发送对应的待推送信息。
根据本申请的另一个方面,还提供一种电子设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行时执行上述任一所述的信息的推送方法的步骤。
根据本申请的另一个方面,还提供一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述任一所述的信息的推送方法的步骤。
在本实施例中,首先获取多个待推送信息的目标区域,并对目标区域进行聚类分析,得到至少一个区域聚类分组;然后,确定每个区域聚类分组所属区域内新服务请求方的转化率;最后,基于转化率确定各个区域聚类分组中的新服务请求方对应的待推送信息,并向各个区域聚类分组中的新服务请求方发送对应的待推送信息。通过上述描述可知,在本实施例中,通过向每个聚类分组中的新服务请求方发送对应的待推送信息的方式,能够实现针对各个目标区域的特点发送对应的待推送信息的技术效果。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的一种电子设备100的框图;
图2示出了示出了本申请实施例所提供的一种信息的推送方法的流程图;
图3示出了示出了本申请实施例所提供的第一种可选地信息的推送方法的流程图;
图4示出了示出了本申请实施例所提供的第二种可选地信息的推送方法的流程图;
图5示出了示出了本申请实施例所提供的第三种可选地信息的推送方法的流程图;
图6示出了示出了本申请实施例所提供的一种层次聚类树状图的示意图;
图7示出了示出了本申请实施例所提供的另一种层次聚类树状图的示意图;
图8示出了示出了本申请实施例所提供的又一种层次聚类树状图的示意图;
图9示出了示出了本申请实施例所提供的第四种可选地信息的推送方法的流程图;
图10示出了示出了本申请实施例所提供的第五种可选地信息的推送方法的流程图;
图11示出了示出了本申请实施例所提供的一种信息的推送装置的示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解,本申请中附图仅起到说明和描述的目的,并不用于限定本申请的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应该理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。
另外,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,本申请实施例中将会用到术语“包括”,用于指出其后所声明的特征的存在,但并不排除增加其它的特征。
本申请中的术语“服务”和“订单”可互换使用,以指代由乘客、服务请求方、司机、服务提供方、或供应商等、或其任意组合发起的服务请求。接受该“服务”或“订单”的可以是乘客、服务请求方、司机、服务提供方、或供应商等、或其任意组合。服务可以是收费的或免费的。
图1示出根据本申请的一些实施例的可以实现本申请提供的信息的推送方法的电子设备100的示例性硬件和软件组件的示意图。
电子设备100可以是通用计算机或特殊用途的计算机,两者都可以用于实现本申请的信息的推送方法。本申请尽管仅示出了一个计算机,但是为了方便起见,可以在多个类似平台上以分布式方式实现本申请描述的功能,以均衡处理负载。
例如,电子设备100可以包括连接到网络的网络端口110、用于执行程序指令的一个或多个处理器120、通信总线130、和不同形式的存储介质140,例如,磁盘、ROM、或RAM,或其任意组合。示例性地,计算机平台还可以包括存储在ROM、RAM、或其他类型的非暂时性存储介质、或其任意组合中的程序指令。根据这些程序指令可以实现本申请的方法。电子设备100还包括计算机与其他输入输出设备(例如键盘、显示屏)之间的输入/输出(Input/Output,I/O)接口150。
上述存储介质140存储有处理器120可执行的机器可读指令,当电子设备运行时,处理器120与存储介质140之间通过总线通信,处理器执行机器可读指令,以执行时执行下述信息的推送方法的步骤。另外,存储介质也可以称为计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行下述信息的推送方法的步骤。
为了便于说明,在电子设备100中仅描述了一个处理器。然而,应当注意,本申请中的电子设备100还可以包括多个处理器,因此本申请中描述的一个处理器执行的步骤也可以由多个处理器联合执行或单独执行。例如,若电子设备100的处理器执行步骤A和步骤B,则应该理解,步骤A和步骤B也可以由两个不同的处理器共同执行或者在一个处理器中单独执行。例如,第一处理器执行步骤A,第二处理器执行步骤B,或者第一处理器和第二处理器共同执行步骤A和B。
参见图2所示的一种信息的推送方法的流程图。
图2所示的信息的推送方法以应用在服务器端为例进行说明,该方法包括如下步骤:
步骤S202,获取多个待推送信息的目标区域,并对多个目标区域进行聚类分析,得到至少一个区域聚类分组;
在本实施例中,每个目标区域可以为一个城市,例如,可以为北京市、天津市、上海市、河北省、河南省等省市;又例如,还可以为河北省的唐山市,廊坊市等等。该目标区域还可以为一个城市的多个区,例如,天津市的和平区、南开区等等。具体地,可以根据实际需要设定目标区域的,本实施例中不做具体限定。
在本实施例中,可以结合多个目标区域之间的特点(或者特征)对其进行聚类分析,进而,得到至少一个区域聚类分组。例如,东北三省(黑龙江省、吉林省和辽宁省)有相同的特点或者特征,可以归为一个相同的区域聚类分组;又例如,广东和浙江省有相同的特点或特征,可以归为一个相同的区域聚类分组。
步骤S204,确定每个区域聚类分组所属区域内新服务请求方的转化率,其中,所述新服务请求方为所述多个目标区域内的新注册且还未过发起服务订单的服务请求方,所述转化率为所述新服务请求方发起服务订单的概率;
在本实施例中,转化率可以理解为该新服务请求方通过服务请求方客户端发起服务订单的概率。
步骤S206,基于所述转化率确定各个区域聚类分组中的新服务请求方对应的待推送信息,并向各个区域聚类分组中的新服务请求方发送所述对应的待推送信息,其中,所述待推送信息包括:待推送的优惠信息和所述待推送的优惠信息的类型信息。
在本实施例中,在确定各个区域聚类分组所属区域内新服务请求方的转化率之后,就可以基于转化率向新服务请求方发送对应的待推送信息。其中,可以根据转化率的不同向新服务请求方发送不同的待推送信息。
在本实施例中,首先获取多个待推送信息的目标区域,并对目标区域进行聚类分析,得到至少一个区域聚类分组;然后,确定每个区域聚类分组所属区域内新服务请求方的转化率;最后,基于转化率确定各个区域聚类分组中的新服务请求方对应的待推送信息,并向各个区域聚类分组中的新服务请求方发送对应的待推送信息。通过上述描述可知,在本实施例中,通过向每个聚类分组中的新服务请求方发送对应的待推送信息的方式,能够实现针对各个目标区域的特点发送对应的待推送信息的技术效果。
通过上述描述可知,在本实施例中,首先,获取多个待推送信息的目标区域,然后,对多个目标区域进行聚类分析,得到至少一个区域聚类分组。
2在一个可选的实施方式中,如图3所示,步骤S202,对所述多个目标区域进行聚类分析,得到至少一个区域聚类分组包括如下步骤:
步骤S301,获取各个目标区域的特征数据,其中,所述特征数据包括以下至少一种:目标区域的属性信息、目标区域内的竞品信息、服务业务信息、服务提供方的特征数据、服务请求方的特征数据;
步骤S302,利用所述特征数据对所述多个目标区域进行分类,得到至少一个区域聚类分组。
在本实施例中,在获取到多个目标区域之后,可以获取每个目标区域的特征信息。
目标区域的属性信息可以包括以下至少之一:目标区域的面积、目标区域中核心区的人口密度、目标区域的人均工资、目标区域的高峰车速、目标区域内的网约车新政等信息。除此之外,还可以包括其他用于表征目标区域属性的特征信息,本实施例对此不做具体限定。
目标区域内的竞品信息包括以下至少之一:目标区域内其他网约车平台的服务提供方的数量、其他网约车平台服务提供方的接单量、出租车的数量和出租车的接单量等。
服务业务信息包括以下至少之一:本发明所提供的网约车平台中各项服务的市场份额和成交总额。例如,快车的市场份额、快车的成交总额GMV(Gross MerchandiseVolume)、专车的市场份额、专车的成交总额GMV、渗透率。
服务提供方的特征数据包括以下至少之一:目标区域内服务提供方的渗透率、目标区域内服务提供方是本地人的占比、目标区域内全职服务提供方的占比、目标区域内全职服务提供方的人数、目标区域内全职服务提供方的工作时长、目标区域内兼职服务提供方的占比、目标区域内兼职服务提供方的人数、目标区域内兼职服务提供方的在线时长等。
服务请求方的特征数据包括以下至少之一:目标区域内服务请求方的总数量、目标区域内服务请求方的日均发单量、目标区域内服务请求方的日均成交总额GMV、目标区域内服务请求方的日均完单人数、目标区域内注册的新客数量、目标区域内新客的日均注册量、目标区域内新客的日均单量、目标区域内新客的日均成交总额GMV、目标区域内新客的日均完单人数等信息。
在提取得到上述各个目标区域的特征数据之后,就可以利用各个目标区域的特征数据对多个目标区域进行聚类分组,得到至少一个区域聚类分组。
在本实施例的一个可选实施方式中,如图4所示,步骤S302,利用所述特征数据对所述多个目标区域进行分类包括如下步骤:
步骤S401,对所述各个目标区域的特征数据进行数据转化处理,得到处理结果;所述数据转化处理至少包括下述之一:归一化处理和离散化处理;所述处理结果中包括各个目标区域所对应各个特征数据的特征值;
步骤S402,基于所述处理结果对所述多个目标区域进行分类。
在本实施例中,在得到各个目标区域的特征数据之后,可以依次对特征数据进行归一化处理和离散化处理。
具体地,归一化处理是指将各个特征数据的特征值范围归一到0-1之间。离散化指将特征数据中的连续特征或者枚举特征转化成多个离散值。
假设,目标区域的数量为N,各个目标区域的特征数据的数量为S,那么每个目标区域就对应包含S个特征数据的特征值。也即,在本实施例中,获取的各个目标区域的特征数据可以为一个N*S形式的矩阵数据,称之为目标矩阵(也即,上述处理结果)。其中,目标矩阵可以为N*S形式的矩阵。N可以为该目标矩阵的行数,每一行表示一个目标区域,S为该目标矩阵的列数,每一列表示一个特征数据对应的特征值。
总体来说,目标矩阵(或者处理结果)中包括各个目标区域所对应的各个特征数据的特征值。也即,目标矩阵中任意一个数值Pn,s表示目标区域n所对应的第s个特征数据的特征值。
在本实施例中,如图5所示,步骤S402,基于所述处理结果对所述多个目标区域进行分类包括如下步骤:
步骤S501,对所述处理结果进行相关性处理,以从所述处理结果中提取多个关联性大于预设关联性的特征数据,得到目标数据结果;
步骤S502,基于所述目标数据结果对所述多个目标区域进行聚类分析。
具体地,在本实施例中,相关性处理使用了PCA(Principal Component Analysis,主成分分析)。
在本实施例中,可以通过PCA对特征数据进行相关性分析,以对上述处理结果进行降维处理,得到目标数据结果。其中,目标数据结果为目标矩阵降维之后的新特征矩阵。通过筛选出前T个特征数据,得到N*T维的新特征矩阵,其中,T<S。
在T个特征数据中,主要包含以下特征数据:目标区域内服务请求方的总数量、目标区域内服务请求方的日均发单量、目标区域内服务请求方的日均成交总额GMV、目标区域内服务请求方的日均完单人数、目标区域内注册的新客数量、目标区域内新客的日均注册量、目标区域内新客的日均单量、目标区域内新客的日均成交总额GMV、目标区域内新客的日均完单人数等信息。
通过上述描述可知,在本实施例中,基于特征数据之间的关联性来对多个目标区域进行聚类分析的方式,能够更加准确的对多个目标区域进行聚类分析,从而得到更加准确的区域聚类分组。
在本实施例的一个可选实施方式中,步骤S502,基于所述目标数据结果对所述多个目标区域进行聚类分析包括如下步骤:
步骤S5021,基于所述目标数据结果构建所述多个目标区域的层次聚类树状图;
步骤S5022,基于所述层次聚类树状图确定所述至少一个区域聚类分组。
具体地,在本实施例中,可以基于上述目标数据结果(即,N*T维的新特征矩阵)构建多个目标区域的层次聚类树状图。然后,基于层次聚类树状图确定所述至少一个区域聚类分组。
在本实施例中,基于所述目标数据结果构建所述多个目标区域的层次聚类树状图包括:
将初始区域聚类分组作为目标区域聚类分组,反复执行以下步骤,直至将所述多个目标区域归为一类;一个目标区域对应一个初始区域聚类分组:
计算步骤,基于所述目标数据结果计算所述目标区域聚类分组中任意两个区域聚类分组之间的相似度,得到多个相似度;
划分步骤,将所述多个相似度中小于预设相似度的任意两个区域聚类分组划分为相同的类别,得到新的区域聚类分组;
将所述新的区域聚类分组和所述目标区域聚类分组中除所述新的区域聚类分组之外的其他区域聚类分组重新作为所述目标区域聚类分组,并继续执行上述计算步骤和划分步骤。
下面,将具体描述上述层次聚类树状图的构建过程,具体过程描述如下:
步骤S1,把N个目标区域中的每个目标区域都单独为一类;得到初始区域聚类分组,并将该初始区域聚类分组作为目标区域聚类分组,执行以下步骤;
步骤S2,通过计算目标区域聚类分组中任意两个目标区域聚类分组的相似度方式计算任意两个目标区域之间的相似度,例如,欧几里得距离,得到多个相似度;
步骤S3,将多个相似度中小于预设相似度任意两个目标区域划分为相同的类别,从而得到新的区域聚类分组。也即,将最相似的两个目标区域归为一类,类的总数减1;
步骤S4,将新的区域聚类分组和目标区域聚类分组中除新的区域聚类分组作为上述目标区域聚类分组,并返回执行上述步骤S2,直至将所述多个目标区域归为一类。
如图6所示即为一个层次聚类树状图。在如图6所示的层次聚类树状图中,包含10个目标区域,分别为Q1至Q10。
按照上述步骤S1至步骤S4所描述的可知。首先,将上述Q1至Q10这10个目标区域都单独为一类;得到初始区域聚类分组,其中,该初始区域聚类分组依次为B1至B10,并将该初始区域聚类分组作为目标区域聚类分组。
然后,计算目标区域聚类分组B1至B10中任意两个目标区域聚类分组的相似度。通过相似度可知,将目标区域聚类分组B1至目标区域聚类分组B4归为相同的类别,得到新的区域聚类分组B11。
之后,继续计算新的区域聚类分组B11、目标区域聚类分组B5、目标区域聚类分组B6,目标区域聚类分组B7,目标区域聚类分组B8,目标区域聚类分组B9和目标区域聚类分组B10。
通过相似度可知,将新的区域聚类分组B11和目标区域聚类分组B5归为相同的类别,得到新的区域聚类分组B12。以及将目标区域聚类分组B6和目标区域聚类分组B7归为相同的类别,得到新的区域聚类分组B13。
如图6所示,继续将新的区域聚类分组B12和新的区域聚类分组B13归为相同的类别,得到新的区域聚类分组B14,以及将目标区域聚类分组B8和目标区域聚类分组B9归为相同的类别,得到新的区域聚类分组B15。
如图6所示,继续将新的区域聚类分组B14和新的区域聚类分组B15归为相同的类别,得到新的区域聚类分组B16,最后,将新的区域聚类分组B16和目标区域聚类分组B10归为相同的类别,得到最终的区域聚类分组B17。
在本实施例中,在得到如图6所示的层次聚类树状图之后,就可以基于层次聚类树状图确定至少一个区域聚类分组。
在一个可选的实施方式中,步骤S5022,基于所述层次聚类树状图确定所述至少一个区域聚类分组包括如下步骤:
首先,确定所述至少一个区域聚类分组的数量信息;
然后,基于所述数量信息在所述层次聚类树状图中确定所述至少一个区域聚类分组,以及每个区域聚类分组所属的目标区域。
在本实施例中,可以根据得到的层次聚类树状图以及所需要的类数进行逐次向下分解获取对应的至少一个区域聚类分组。
例如,如图7所示,从右往左看,开始出现了2条横线,利用一个竖线在此竖着切一刀,这样将10个目标区域划分为2类。
一个区域聚类分组中包括:目标区域A1-A9,另外一个区域聚类分组中包括:目标区域A10。
例如,如图8所示,从右往左看,将10个目标区域划分为3类。
第一个区域聚类分组中包括:目标区域A1-A7;第二个区域聚类分组中包括:A8和A9;第二个区域聚类分组中包括:A10。
因此,在本实施例中,在确定出如图6所示的层次聚类树状图之后,就可以按照上述所描述的方式对层次聚类树状图进行逐次向下分解获取对应的至少一个区域聚类分组。
通过上述描述可知,在本实施例中,在按照上述所描述的方式,能够更加灵活得到至少一个区域聚类分组,从而满足用户的不同需求,避免得到固定的区域聚类分组以无法满足用户需求的问题。
在本实施例中,在对多个目标区域进行聚类分析,得到至少一个区域聚类分组之后,就可以确定每个区域聚类分组所属区域内新服务请求方的转化率。
在一个可选的实施方式中,如图9所示,步骤S204,确定每个区域聚类分组所属区域内新服务请求方的转化率包括如下步骤:
步骤S901,获取所述新服务请求方的特征数据;
步骤S902,按照所述至少一个区域聚类分组对所述新服务请求方的特征数据进行划分,得到所属于各个区域聚类分组的新服务请求方的特征数据;
步骤S903,基于所述所属于各个区域聚类分组的新服务请求方的特征数据确定每个区域聚类分组所属区域内新服务请求方的转化率。
在本实施例中,新服务请求方的特征数据又可以称为乘客拉新数据。在得到至少一个区域聚类分组,可以按照至少一个区域聚类分组对该乘客拉新数据划分成L个不同的数据集,其中,L为至少一个区域聚类分组的数量。其中,每个数据集即为所属于各个区域聚类分组的新服务请求方的特征数据。
针对至少一个区域聚类分组中任意一个区域聚类分组Ai,可以采用下述方式确定其所属区域内新服务请求方的转化率,具体包括:
首先,确定区域聚类分组Ai所对应的机器学习模型;其中,i依次取1至I,I为所述区域聚类分组的数量,其中,机器学习模型包括:集成树模型或者深度学习模型;
然后,基于所述机器学习模型对所述区域聚类分组Ai所属的新服务请求方的特征数据进行分析,以预测所述区域聚类分组Ai中各个新服务请求方的转化率。
在本实施例中,通过不同的机器学习模型对L个不同的数据集进行分析,以预测得到每个区域聚类分组中各个新服务请求方的转化率。
需要说明的是,在本实施例中,机器学习模型可以为神经网络模型;机器学习模型还可以为集成树模型,例如,XGBoost模型,除此之外,还可以选择为其他的模型,本实施例对此不作具体限定。
以区域聚类分组Ai为例来进行说明,首先,确定区域聚类分组Ai所对应的XGBoost模型,然后,利用该XGBoost模型对区域聚类分组Ai所对应的数据集进行预测,以预测得到区域聚类分组Ai中各个新服务请求方的转化率。
通过上述描述可知,在本实施例中,针对不同的区域聚类分组,采用不同的机器学习模型(例如,XGBoost模型)对其所对应的数据集进行预测。由于区域聚类分组之间对应不同的特征,因此采用上述方式,能够更加准确的预测出各个区域聚类分组各个新服务请求方的转化率。
在一个可选的实施方式中,如图10所示,步骤S206,基于所述转化率向各个分类组中的新服务请求方发送对应的待推送信息包括如下步骤:
步骤S1001,按照所述转化率将各个区域聚类分组内的新服务请求方划分为多个层次,从而得到多个第一层次;
步骤S1002,针对每个区域聚类分组所对应的第一层次,按照第一层次的实际转化率对每个区域聚类分组所对应的第一层次进行排序,得到目标排序结果;
步骤S1003,基于所述目标排序结果确定各个所述区域聚类分组内新服务请求方的待推送信息。
在本实施例中,首先,按照对各个区域聚类分组内新服务请求方的转化率进行排序。然后,对每个区域聚类分组划分成k层,得到多个第一层次。例如,可以按照2-8原则分成3层,分别是20%、30%、50%。
之后,针对每个区域聚类分组所对应的第一层次,按照第一层次的实际转化率对其进行排序。由此得到全新分层转化率排序结果(即,目标排序结果)。在得到目标排序结果之后,就可以对不同区域聚类分组内不同转化率的人群进行个性化活动。
可选地,基于所述目标排序结果确定各个所述区域聚类分组内新服务请求方的待推送信息包括如下步骤:
确定每个所述区域聚类分组中各个第一层次的待推送信息,并向各个所述第一层次中的新服务请求方发送对应的待推送信息。
具体地,在本实施例中,针对区域聚类分组Ai,可以按照该区域聚类分组Ai内划分的第一层次确定待推送信息。例如,将区域聚类分组Ai内新服务请求方的转化率划分成k个第一层次,并按照各个第一层次的实际转化率对k个第一层次进行排序之后,可以按照目标排序结果确定各个第一层次所对应的待推送信息。
需要说明的是,在本实施例中,不同区域聚类分组之间发送的待推送信息可以相同,还可以不同。
例如,首先确定向区域聚类分组A1发送第一类型优惠信息,并向区域聚类分组A2发送第二类型优惠信息。之后,向区域聚类分组A1中的k个第一层次依次发送不同的所属于第一类型优惠信息的优惠子信息,并向区域聚类分组A2中的k个第一层次依次发送不同的所属于第二类型优惠信息的优惠子信息,以此实现对不同区域聚类分组不同转化率的人群进行个性化活动。
在本实施例中,可以通过以下方式确定每个第一层次的实际转化率,具体包括:
获取历史时间段内所述多个目标区域的新服务请求方的历史特征数据;确定所述历史时间段的新服务请求方中所属于各个区域聚类分组的新服务请求方;基于确定出的所属于各个区域聚类分组的新服务请求方的历史特征数据,预测所述区域聚类分组内新服务请求方的转化率;按照预测出的转化率对所属于各个区域聚类分组内的新服务请求方进行排序,得到第一排序结果;基于所述第一排序结果将每个区域聚类分组划分为多个层次,得到多个第二层次;确定所述多个第二层次中每个第二层次实际转化率,并将所述多个第二层次的实际转化率确定为所述多个第一层次的实际转化率。
具体地,在本实施例中,选取历史上的某一天数据,其中,历史上的某一天即为历史时间段,该数据即为历史时间段内所述多个目标区域的新服务请求方的历史特征数据(以下简称为历史特征数据)。然后,根据所得机器学习模型去预测历史特征数据中每个新服务请求方的转化率。
之后,按照预测出的转化率对所属于各个区域聚类分组内的新服务请求方进行排序,得到第一排序结果。并基于第一排序结果将各个区域聚类分组划分成k个第二层次。例如,按照2-8原则分成3层,分别是20%、30%、50%。最后,确定k个第二层次中每个第二层次实际转化率,并将多个第二层次的实际转化率确定为多个层次的实际转化率。
例如,确定出区域聚类分组Ai内k个第二层次中每个第二层次实际转化率,此时,就可以将其作为区域聚类分组Ai内k个第一层次中每个第一层次实际转化率。
通过上述描述可知,在本实施例中,通过向每个聚类分组中的新服务请求方发送对应的待推送信息的方式,能够实现针对各个目标区域的特点发送对应的待推送信息的技术效果。
图11是示出本申请的一些实施例的信息的推送装置的框图,该信息的推送装置实现的功能对应上述方法执行的步骤。该装置可以理解为上述服务器,或服务器的处理器,也可以理解为独立于上述服务器或处理器之外的在服务器控制下实现本申请功能的组件,如图所示,信息的推送装置可以包括:获取单元10,聚类分析单元20,第一确定单元30,第二确定单元40和发送单元50;
获取单元10,用于获取多个待推送信息的目标区域;
聚类分析单元20,用于对多个目标区域进行聚类分析,得到至少一个区域聚类分组;
第一确定单元30,用于确定每个区域聚类分组所属区域内新服务请求方的转化率,其中,所述新服务请求方为所述多个目标区域内的新注册且还未过发起服务订单的服务请求方,所述转化率为所述新服务请求方发起服务订单的概率;
第二确定单元40,用于基于所述转化率确定各个区域聚类分组中的新服务请求方对应的待推送信息;
发送单元50,用于向各个区域聚类分组中的新服务请求方发送所述对应的待推送信息,其中,所述待推送信息包括:待推送的优惠信息和所述待推送的优惠信息的类型信息。
在本实施例中,首先获取多个待推送信息的目标区域,并对目标区域进行聚类分析,得到至少一个区域聚类分组;然后,确定每个区域聚类分组所属区域内新服务请求方的转化率;最后,基于转化率确定各个区域聚类分组中的新服务请求方对应的待推送信息,并向各个区域聚类分组中的新服务请求方发送对应的待推送信息。通过上述描述可知,在本实施例中,通过向每个聚类分组中的新服务请求方发送对应的待推送信息的方式,能够实现针对各个目标区域的特点发送对应的待推送信息的技术效果。
可选地,所述聚类分析单元包括:第一获取模块,用于获取各个目标区域的特征数据,其中,所述特征数据包括以下至少一种:目标区域的属性信息、目标区域内的竞品信息、服务业务信息、服务提供方的特征数据、服务请求方的特征数据;聚类分析模块,用于利用所述特征数据对所述多个目标区域进行分类,得到至少一个区域聚类分组。
可选地,所述聚类分析模块用于:对所述各个目标区域的特征数据进行数据转化处理,得到处理结果;所述数据转化处理至少包括下述之一:归一化处理和离散化处理;所述处理结果中包括各个目标区域所对应各个特征数据的特征值;基于所述处理结果对所述多个目标区域进行分类。
可选地,所述聚类分析模块还用于:对所述处理结果进行相关性处理,以从所述处理结果中提取多个关联性大于预设关联性的特征数据,得到目标数据结果;基于所述目标数据结果对所述多个目标区域进行聚类分析。
可选地,所述聚类分析模块还用于:基于所述目标数据结果构建所述多个目标区域的层次聚类树状图;基于所述层次聚类树状图确定所述至少一个区域聚类分组。
可选地,所述聚类分析模块还用于:将初始区域聚类分组作为目标区域聚类分组,反复执行以下步骤,直至将所述多个目标区域归为一类;一个目标区域对应一个初始区域聚类分组:基于所述目标数据结果计算所述目标区域聚类分组中任意两个区域聚类分组之间的相似度,得到多个相似度;将所述多个相似度中小于预设相似度的任意两个区域聚类分组划分为相同的类别,得到新的区域聚类分组;将所述新的区域聚类分组和所述目标区域聚类分组中除所述新的区域聚类分组之外的其他区域聚类分组重新作为所述目标区域聚类分组。
可选地,所述聚类分析模块还用于:确定所述至少一个区域聚类分组的数量信息;基于所述数量信息在所述层次聚类树状图中确定所述至少一个区域聚类分组,以及每个区域聚类分组所属的目标区域。
可选地,所述确定单元包括:第二获取模块,用于获取所述新服务请求方的特征数据;第一划分模块,用于按照所述至少一个区域聚类分组对所述新服务请求方的特征数据进行划分,得到所属于各个区域聚类分组的新服务请求方的特征数据;确定模块,用于基于所述所属于各个区域聚类分组的新服务请求方的特征数据确定每个区域聚类分组所属区域内新服务请求方的转化率。
可选地,所述确定模块用于:确定区域聚类分组Ai所对应的机器学习模型;其中,i依次取1至I,I为所述区域聚类分组的数量,机器学习模型包括:集成树模型或者深度学习模型;基于所述机器学习模型对所述区域聚类分组Ai所属的新服务请求方的特征数据进行分析,以预测所述区域聚类分组Ai中各个新服务请求方的转化率。
可选地,所述第二确定单元包括:第二划分模块,用于按照所述转化率将各个区域聚类分组内的新服务请求方划分为多个层次,从而得到多个第一层次;排序模块,用于针对每个区域聚类分组所对应的第一层次,按照第一层次的实际转化率对每个区域聚类分组所对应的第一层次进行排序,得到目标排序结果;确定模块,用于基于所述目标排序结果确定各个所述区域聚类分组内新服务请求方的待推送信息。
可选地,所述装置通过以下方式确定每个第一层次的实际转化率,具体包括:获取历史时间段内所述多个目标区域的新服务请求方的历史特征数据;确定所述历史时间段的新服务请求方中所属于各个区域聚类分组的新服务请求方;基于确定出的所属于各个区域聚类分组的新服务请求方的历史特征数据,预测所述区域聚类分组内新服务请求方的转化率;按照预测出的转化率对所属于各个区域聚类分组内的新服务请求方进行排序,得到第一排序结果;基于所述第一排序结果将每个区域聚类分组划分为多个层次,得到多个第二层次;确定所述多个第二层次中每个第二层次实际转化率,并将所述多个第二层次的实际转化率确定为所述多个第一层次的实际转化率。
可选地,所述确定和发送模块还用于:确定每个所述区域聚类分组中各个第一层次的待推送信息,并向各个所述第一层次中的新服务请求方发送对应的待推送信息。
在本实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述任一所述的信息的推送方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考方法实施例中的对应过程,本申请中不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (24)

1.一种信息的推送方法,其特征在于,包括:
获取多个待推送信息的目标区域,并对多个目标区域进行聚类分析,得到至少一个区域聚类分组;
确定每个区域聚类分组所属区域内新服务请求方的转化率,其中,所述新服务请求方为所述多个目标区域内的新注册且还未过发起服务订单的服务请求方,所述转化率为所述新服务请求方发起服务订单的概率;
基于所述转化率确定各个区域聚类分组中新服务请求方对应的待推送信息,并向各个区域聚类分组中的新服务请求方发送所述对应的待推送信息,其中,所述待推送信息包括:待推送的优惠信息和/或所述待推送的优惠信息的类型信息;
其中,确定每个区域聚类分组所属区域内新服务请求方的转化率包括:
获取所述新服务请求方的特征数据;
按照所述至少一个区域聚类分组对所述新服务请求方的特征数据进行划分,得到所属于各个区域聚类分组的新服务请求方的特征数据;
基于所述所属于各个区域聚类分组的新服务请求方的特征数据确定每个区域聚类分组所属区域内新服务请求方的转化率。
2.根据权利要求1所述的方法,其特征在于,对所述多个目标区域进行聚类分析,得到至少一个区域聚类分组包括:
获取各个目标区域的特征数据,其中,所述特征数据包括以下至少一种:目标区域的属性信息、目标区域内的竞品信息、服务业务信息、服务提供方的特征数据、服务请求方的特征数据;
利用所述特征数据对所述多个目标区域进行分类,得到至少一个区域聚类分组。
3.根据权利要求2所述的方法,其特征在于,利用所述特征数据对所述多个目标区域进行分类包括:
对所述各个目标区域的特征数据进行数据转化处理,得到处理结果;所述数据转化处理至少包括下述之一:归一化处理和离散化处理;所述处理结果中包括各个目标区域所对应各个特征数据的特征值;
基于所述处理结果对所述多个目标区域进行分类。
4.根据权利要求3所述的方法,其特征在于,基于所述处理结果对所述多个目标区域进行分类包括:
对所述处理结果进行相关性处理,以从所述处理结果中提取多个关联性大于预设关联性的特征数据,得到目标数据结果;
基于所述目标数据结果对所述多个目标区域进行聚类分析。
5.根据权利要求4所述的方法,其特征在于,基于所述目标数据结果对所述多个目标区域进行聚类分析包括:
基于所述目标数据结果构建所述多个目标区域的层次聚类树状图;
基于所述层次聚类树状图确定所述至少一个区域聚类分组。
6.根据权利要求5所述的方法,其特征在于,基于所述目标数据结果构建所述多个目标区域的层次聚类树状图包括:
将初始区域聚类分组作为目标区域聚类分组,反复执行以下步骤,直至将所述多个目标区域归为一类;一个目标区域对应一个初始区域聚类分组:
基于所述目标数据结果计算所述目标区域聚类分组中任意两个区域聚类分组之间的相似度,得到多个相似度;
将所述多个相似度中小于预设相似度的任意两个区域聚类分组划分为相同的类别,得到新的区域聚类分组;
将所述新的区域聚类分组和所述目标区域聚类分组中除所述新的区域聚类分组之外的其他区域聚类分组重新作为所述目标区域聚类分组。
7.根据权利要求5所述的方法,其特征在于,基于所述层次聚类树状图确定所述至少一个区域聚类分组包括:
确定所述至少一个区域聚类分组的数量信息;
基于所述数量信息在所述层次聚类树状图中确定所述至少一个区域聚类分组,以及每个区域聚类分组所属的目标区域。
8.根据权利要求1所述的方法,其特征在于,基于所述所属于各个区域聚类分组的新服务请求方的特征数据确定每个区域聚类分组所属区域内新服务请求方的转化率包括:
确定区域聚类分组Ai所对应的机器学习模型;其中,i依次取1至I,I为所述区域聚类分组的数量,其中,所述机器学习模型包括:集成树模型或者深度学习模型;
基于所述机器学习模型对所述区域聚类分组Ai所属的新服务请求方的特征数据进行分析,以预测所述区域聚类分组Ai中各个新服务请求方的转化率。
9.根据权利要求1所述的方法,其特征在于,基于所述转化率确定各个区域聚类分组中的新服务请求方对应的待推送信息包括:
按照所述转化率将各个区域聚类分组内的新服务请求方划分为多个层次,从而得到多个第一层次;
针对每个区域聚类分组所对应的第一层次,按照第一层次的实际转化率对每个区域聚类分组所对应的第一层次进行排序,得到目标排序结果;
基于所述目标排序结果确定各个所述区域聚类分组内新服务请求方的待推送信息。
10.根据权利要求9所述的方法,其特征在于,通过以下方式确定每个第一层次的实际转化率,具体包括:
获取历史时间段内所述多个目标区域的新服务请求方的历史特征数据;
确定所述历史时间段的新服务请求方中所属于各个区域聚类分组的新服务请求方;
基于确定出的所属于各个区域聚类分组的新服务请求方的历史特征数据,预测所述区域聚类分组内各个新服务请求方的转化率;
按照预测出的转化率对所属于各个区域聚类分组内的新服务请求方进行排序,得到第一排序结果;
基于所述第一排序结果将每个区域聚类分组划分为多个层次,得到多个第二层次;
确定所述多个第二层次中每个第二层次实际转化率,并将所述多个第二层次的实际转化率确定为所述多个第一层次的实际转化率。
11.根据权利要求9所述的方法,其特征在于,基于所述目标排序结果确定各个所述区域聚类分组内新服务请求方的待推送信息包括:
确定每个所述区域聚类分组中各个第一层次的待推送信息,并向各个所述第一层次中的新服务请求方发送对应的待推送信息。
12.一种信息的推送装置,其特征在于,包括:
获取单元,用于获取多个待推送信息的目标区域;
聚类分析单元,用于对多个目标区域进行聚类分析,得到至少一个区域聚类分组;
第一确定单元,用于确定每个区域聚类分组所属区域内新服务请求方的转化率,其中,所述新服务请求方为所述多个目标区域内的新注册且还未过发起服务订单的服务请求方,所述转化率为所述新服务请求方发起服务订单的概率;
第二确定单元,用于基于所述转化率确定各个区域聚类分组中的新服务请求方对应的待推送信息;
发送单元,用于向各个区域聚类分组中的新服务请求方发送所述对应的待推送信息,其中,所述待推送信息包括:待推送的优惠信息和所述待推送的优惠信息的类型信息;
第二获取模块,用于获取所述新服务请求方的特征数据;
第一划分模块,用于按照所述至少一个区域聚类分组对所述新服务请求方的特征数据进行划分,得到所属于各个区域聚类分组的新服务请求方的特征数据;
确定模块,用于基于所述所属于各个区域聚类分组的新服务请求方的特征数据确定每个区域聚类分组所属区域内新服务请求方的转化率。
13.根据权利要求12所述的装置,其特征在于,所述聚类分析单元包括:
第一获取模块,用于获取各个目标区域的特征数据,其中,所述特征数据包括以下至少一种:目标区域的属性信息、目标区域内的竞品信息、服务业务信息、服务提供方的特征数据、服务请求方的特征数据;
聚类分析模块,用于利用所述特征数据对所述多个目标区域进行分类,得到至少一个区域聚类分组。
14.根据权利要求13所述的装置,其特征在于,所述聚类分析模块用于:
对所述各个目标区域的特征数据进行数据转化处理,得到处理结果;所述数据转化处理至少包括下述之一:归一化处理和离散化处理;所述处理结果中包括各个目标区域所对应各个特征数据的特征值;
基于所述处理结果对所述多个目标区域进行分类。
15.根据权利要求14所述的装置,其特征在于,所述聚类分析模块还用于:
对所述处理结果进行相关性处理,以从所述处理结果中提取多个关联性大于预设关联性的特征数据,得到目标数据结果;
基于所述目标数据结果对所述多个目标区域进行聚类分析。
16.根据权利要求15所述的装置,其特征在于,所述聚类分析模块还用于:
基于所述目标数据结果构建所述多个目标区域的层次聚类树状图;
基于所述层次聚类树状图确定所述至少一个区域聚类分组。
17.根据权利要求16所述的装置,其特征在于,所述聚类分析模块还用于:
将初始区域聚类分组作为目标区域聚类分组,反复执行以下步骤,直至将所述多个目标区域归为一类;一个目标区域对应一个初始区域聚类分组:
基于所述目标数据结果计算所述目标区域聚类分组中任意两个区域聚类分组之间的相似度,得到多个相似度;
将所述多个相似度中小于预设相似度的任意两个区域聚类分组划分为相同的类别,得到新的区域聚类分组;
将所述新的区域聚类分组和所述目标区域聚类分组中除所述新的区域聚类分组之外的其他区域聚类分组重新作为所述目标区域聚类分组。
18.根据权利要求16所述的装置,其特征在于,所述聚类分析模块还用于:
确定所述至少一个区域聚类分组的数量信息;
基于所述数量信息在所述层次聚类树状图中确定所述至少一个区域聚类分组,以及每个区域聚类分组所属的目标区域。
19.根据权利要求12所述的装置,其特征在于,所述确定模块用于:
确定区域聚类分组Ai所对应的机器学习模型;其中,i依次取1至I,I为所述区域聚类分组的数量,其中,所述机器学习模型包括:集成树模型或者深度学习模型;
基于所述机器学习模型对所述区域聚类分组Ai所属的新服务请求方的特征数据进行分析,以预测所述区域聚类分组Ai中各个新服务请求方的转化率。
20.根据权利要求12所述的装置,其特征在于,所述第二确定单元包括:
第二划分模块,用于按照所述转化率将各个区域聚类分组内的新服务请求方划分为多个层次,从而得到多个第一层次;
排序模块,用于针对每个区域聚类分组所对应的第一层次,按照第一层次的实际转化率对每个区域聚类分组所对应的第一层次进行排序,得到目标排序结果;
确定模块,用于基于所述目标排序结果确定各个所述区域聚类分组内新服务请求方的待推送信息。
21.根据权利要求20所述的装置,其特征在于,所述装置通过以下方式确定每个第一层次的实际转化率,具体包括:
获取历史时间段内所述多个目标区域的新服务请求方的历史特征数据;
确定所述历史时间段的新服务请求方中所属于各个区域聚类分组的新服务请求方;
基于确定出的所属于各个区域聚类分组的新服务请求方的历史特征数据,预测所述区域聚类分组内新服务请求方的转化率;
按照预测出的转化率对所属于各个区域聚类分组内的新服务请求方进行排序,得到第一排序结果;
基于所述第一排序结果将每个区域聚类分组划分为多个层次,得到多个第二层次;
确定所述多个第二层次中每个第二层次实际转化率,并将所述多个第二层次的实际转化率确定为所述多个第一层次的实际转化率。
22.根据权利要求20所述的装置,其特征在于,所述确定和发送模块还用于:
确定每个所述区域聚类分组中各个第一层次的待推送信息,并向各个所述第一层次中的新服务请求方发送对应的待推送信息。
23.一种电子设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行时执行如权利要求1至11任一所述的信息的推送方法的步骤。
24.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至11任一所述的信息的推送方法的步骤。
CN201811489044.XA 2018-12-06 2018-12-06 信息的推送方法、装置、电子设备和计算机可读存储介质 Active CN111291772B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811489044.XA CN111291772B (zh) 2018-12-06 2018-12-06 信息的推送方法、装置、电子设备和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811489044.XA CN111291772B (zh) 2018-12-06 2018-12-06 信息的推送方法、装置、电子设备和计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN111291772A CN111291772A (zh) 2020-06-16
CN111291772B true CN111291772B (zh) 2024-04-16

Family

ID=71021152

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811489044.XA Active CN111291772B (zh) 2018-12-06 2018-12-06 信息的推送方法、装置、电子设备和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111291772B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016062411A (ja) * 2014-09-19 2016-04-25 ヤフー株式会社 情報分析装置、情報分析方法および情報分析プログラム
CN106101222A (zh) * 2016-06-08 2016-11-09 腾讯科技(深圳)有限公司 信息的推送方法和装置
CN107844885A (zh) * 2017-09-05 2018-03-27 北京小度信息科技有限公司 信息推送方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016127918A1 (zh) * 2015-02-13 2016-08-18 北京嘀嘀无限科技发展有限公司 一种运力调度方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016062411A (ja) * 2014-09-19 2016-04-25 ヤフー株式会社 情報分析装置、情報分析方法および情報分析プログラム
CN106101222A (zh) * 2016-06-08 2016-11-09 腾讯科技(深圳)有限公司 信息的推送方法和装置
CN107844885A (zh) * 2017-09-05 2018-03-27 北京小度信息科技有限公司 信息推送方法和装置

Also Published As

Publication number Publication date
CN111291772A (zh) 2020-06-16

Similar Documents

Publication Publication Date Title
CN106933956B (zh) 数据挖掘方法和装置
CN111614690B (zh) 一种异常行为检测方法及装置
CN105893406A (zh) 群体用户画像方法及系统
CN105183870A (zh) 一种利用微博位置信息的城市功能区探测方法及系统
CN111209400B (zh) 一种数据分析的方法及装置
CN111192090A (zh) 航班的座位分配方法、装置、存储介质和电子设备
CN106447387A (zh) 基于共享账户乘客预测的机票个性化推荐方法
CN111309815A (zh) 一种关系图谱的处理方法、装置和电子设备
CN111310961A (zh) 数据预测方法、装置、电子设备和计算机可读存储介质
AU2021204470A1 (en) Benefit surrender prediction
CN111095328A (zh) 用于检测和响应于交易模式的系统和方法
CN111291772B (zh) 信息的推送方法、装置、电子设备和计算机可读存储介质
CN106611339B (zh) 种子用户筛选方法、产品的用户影响力评价方法及装置
Zhang et al. Dynamic time warp-based clustering: Application of machine learning algorithms to simulation input modelling
CN112395499A (zh) 信息推荐方法及装置、电子设备、存储介质
CN111260384B (zh) 服务订单处理方法、装置、电子设备及存储介质
CN111222923A (zh) 一种判断潜在客户的方法及装置、电子设备和存储介质
CN106055665A (zh) 基于异常值剔除的情境感知Web服务推荐方法和系统
Figueredo et al. An immune-inspired technique to identify heavy goods vehicles incident hot spots
CN115311001A (zh) 一种基于多重投票算法的预测用户换机倾向的方法及系统
CN107093149A (zh) 在线好友关系强度评估方法及系统
CN111062555B (zh) 城市画像的构建方法、装置、介质及电子设备
CN111698332A (zh) 业务对象的分配方法、装置、设备及存储介质
CN112785163A (zh) 职业识别方法、装置、设备及介质
CN109684549A (zh) 目标数据预测方法、装置、电子设备及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant