CN111275470A - 服务发起概率预测方法及其模型的训练方法和装置 - Google Patents

服务发起概率预测方法及其模型的训练方法和装置 Download PDF

Info

Publication number
CN111275470A
CN111275470A CN201811474808.8A CN201811474808A CN111275470A CN 111275470 A CN111275470 A CN 111275470A CN 201811474808 A CN201811474808 A CN 201811474808A CN 111275470 A CN111275470 A CN 111275470A
Authority
CN
China
Prior art keywords
training
service
probability
classification
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811474808.8A
Other languages
English (en)
Other versions
CN111275470B (zh
Inventor
付俊强
杜龙志
刘澍
李奘
卓呈祥
郄小虎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Didi Infinity Technology and Development Co Ltd
Original Assignee
Beijing Didi Infinity Technology and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Didi Infinity Technology and Development Co Ltd filed Critical Beijing Didi Infinity Technology and Development Co Ltd
Priority to CN201811474808.8A priority Critical patent/CN111275470B/zh
Publication of CN111275470A publication Critical patent/CN111275470A/zh
Application granted granted Critical
Publication of CN111275470B publication Critical patent/CN111275470B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0207Discounts or incentives, e.g. coupons or rebates
    • G06Q30/0224Discounts or incentives, e.g. coupons or rebates based on user history

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供了一种服务发起概率预测方法及其模型的训练方法和装置;其中,该训练方法包括:从训练对象的终端获取与服务客户端有关的操作行为数据;从操作行为数据中获取影响服务发起概率的特征数据和实际发起服务数据,并根据特征数据确定训练样本;通过第一分类子模型和第二分类子模型,输出训练对象发起服务的概率预测值;根据概率预测值与实际发起服务数据,训练第一分类子模型和第二分类子模型,得到服务发起概率模型。本申请实施例中,训练得到的服务发起概率模型可以较为准确地预测用户的服务发起概率,后续可以根据模型的预测结果合理地向用户提供优惠资源,以激励用户发起服务,从而提高平台的活跃度和整体收益。

Description

服务发起概率预测方法及其模型的训练方法和装置
技术领域
本申请涉及数据处理技术领域,具体而言,涉及一种服务发起概率预测方法及其模型的训练方法和装置。
背景技术
对于打车、租车或其他的服务平台中,有很多用户注册完成后没有发起首次服务,或者在预设时间段内没有发起服务;该情况下,为了鼓励用户使用平台服务,系统常会采取激励措施,如向用户发放优惠券等;相关技术中,系统难以知晓用户在未来预设时间段内的下单概率,常根据用户过去一段时间是否下单为用户提供优惠政策,以激励用户下单;但该优惠政策的提供标准合理性较差,不利于提高平台整体的收益。
发明内容
有鉴于此,本申请实施例的目的在于提供一种服务发起概率预测方法及其模型的训练方法和装置,以较为准确地预测用户的服务发起概率,后续可以根据模型的预测结果合理地向用户提供优惠资源,以激励用户发起服务,从而提高平台的活跃度和整体收益。
根据本申请的一个方面,提供一种电子设备,可以包括一个或多个存储介质和一个或多个与存储介质通信的处理器。一个或多个存储介质存储有处理器可执行的机器可读指令。当电子设备运行时,处理器与存储介质之间通过总线通信,处理器执行所述机器可读指令,以执行一个或多个以下操作:
从训练对象的终端获取与服务客户端有关的操作行为数据;从操作行为数据中获取影响服务发起概率的特征数据和实际发起服务数据,并根据特征数据确定训练样本;将训练样本输入至第一分类子模型,输出训练样本对应的分类值;将训练样本和训练样本对应的分类值输入至第二分类子模型,输出训练对象发起服务的概率预测值;根据概率预测值与实际发起服务数据,训练第一分类子模型和第二分类子模型,得到服务发起概率模型。
在一些实施例中,上述特征数据包括服务客户端的访问行为特征、服务发起行为特征、注册行为特征、好友关系特征、终端上与服务客户端有关的第三方客户端的分布特征、激励资源量特征和训练对象的身份属性特征中的多种。
在一些实施例中,上述根据特征数据确定训练样本的步骤,包括:对所述特征数据进行数据转化处理;所述数据转化处理至少包括下述之一:归一化处理、离散化处理和缺失值填充处理;根据转化处理后的所述特征数据生成所述特征数据对应的训练样本。
在一些实施例中,上述根据转化处理后的特征数据生成特征数据对应的训练样本的步骤,包括:从处理后的特征数据中提取预设种类的特征数据;预设种类的数量为至少两种;按照预设的特征分组,将提取的特征数据中,属于同一分组的特征数据进行矩阵变换,得到每个分组对应的组合特征;将处理后的特征数据,以及组合特征确定为训练样本。
在一些实施例中,上述第一分类子模型包括集成树模型;将训练样本输入至第一分类子模型,输出训练样本对应的分类值的步骤,包括:通过集成树模型中的分类树,对训练样本进行分类处理,得到训练样本在分类树中的叶子节点值,将叶子节点值确定为训练样本对应的分类值。
在一些实施例中,上述集成树模型中预设有多个分类子树;通过集成树模型中的分类树,对训练样本进行分类处理,得到训练样本在分类树中的叶子节点值的步骤,包括:将训练样本分别输入至每个分类子树中;通过每个分类子树对训练样本进行分类处理,得到每个分类子树中输出的叶子节点值;将每个分类子树中输出的叶子节点值,或者每个分类子树中输出的叶子节点值的总和作为最终的叶子节点值。
在一些实施例中,上述第二分类子模型包括逻辑回归模型;将训练样本和训练样本对应的分类值输入至第二分类子模型,输出训练对象发起服务的概率预测值的步骤,包括:通过逻辑回归模型中的边界判定函数,计算训练样本和训练样本对应的分类值对应的函数值;根据函数值的绝对值,确定训练对象发起服务的概率预测值。
在一些实施例中,上述根据函数值的绝对值,确定训练对象发起服务的概率预测值的步骤,包括:通过逻辑回归模型中的概率函数,将函数值映射至预设的概率区间,得到训练对象发起服务的概率预测值。
在一些实施例中,上述得到服务发起概率模型之后,方法还包括:获取服务发起概率模型训练完成后,每个训练对象的训练样本和训练样本对应的概率预测值;计算每个训练样本的假正例率值和真正例率值;根据计算出的每个训练样本的假正例率值和真正例率值,在预设的二维坐标轴上绘制ROC曲线;求取ROC曲线与二维坐标轴中的X轴的包围面积,将包围面积确定为服务发起概率模型的预测能力的评估结果;判断预测能力的评估结果是否满足预设的评估阈值,如果否,继续训练服务发起概率模型,直至服务发起概率模型的预测能力的评估结果满足评估阈值。
根据本申请的另一个方面,还提供一种服务发起概率预测方法,该方法应用于安装有服务发起概率模型的设备;服务发起概率模型通过上述服务发起概率模型的训练方法训练得到;方法包括:获取目标对象对终端的操作行为数据;操作行为数据中包含目标对象的激励资源量特征;将操作行为数据输入至服务发起概率模型中,输出目标对象发起服务的概率预测值。
在一些实施例中,上述将操作行为数据输入至服务发起概率模型中,输出目标对象发起服务的概率预测值的步骤,包括:将操作行为数据输入至服务发起概率模型中,输出目标对象发起服务的第一概率预测值;调整目标对象的操作行为数据中的激励资源量特征;激励资源量特征包括是否向目标对象发放优惠券、以及优惠券的额度;将调整后的目标对象的操作行为数据再次输入至服务发起概率模型中,输出目标对象的发起服务的第二概率预测值。
在一些实施例中,上述方法还包括:根据第一概率预测值和第二概率预测值,确定是否向目标对象发放优惠券,以及发放的优惠券的额度。
根据本申请的另一个方面,还提供一种服务发起概率模型的训练装置,装置包括:第一数据获取模块,用于从训练对象的终端获取与服务客户端有关的操作行为数据;样本确定模块,用于从操作行为数据中获取影响服务发起概率的特征数据和实际发起服务数据,并根据特征数据确定训练样本;第一输入模块,用于将训练样本输入至第一分类子模型,输出训练样本对应的分类值;第二输入模块,用于将训练样本和训练样本对应的分类值输入至第二分类子模型,输出训练对象发起服务的概率预测值;训练模块,用于根据概率预测值与实际发起服务数据,训练第一分类子模型和第二分类子模型,得到服务发起概率模型。
在一些实施例中,上述特征数据包括服务客户端的访问行为特征、服务发起行为特征、注册行为特征、好友关系特征、终端上与服务客户端有关的第三方客户端的分布特征、激励资源量特征和训练对象的身份属性特征中的多种。
在一些实施例中,上述样本确定模块,用于:对特征数据进行数据转化处理,得到特征数据对应的训练样本;数据转化处理至少包括下述之一:归一化处理、离散化处理和缺失值填充处理。
在一些实施例中,上述样本确定模块,用于:从处理后的特征数据中提取预设种类的特征数据;预设种类的数量为至少两种;按照预设的特征分组,将提取的特征数据中,属于同一分组的特征数据进行矩阵变换,得到每个分组对应的组合特征;将处理后的特征数据,以及组合特征确定为训练样本。
在一些实施例中,上述第一分类子模型包括集成树模型;上述第一输入模块,用于:通过集成树模型中的分类树,对训练样本进行分类处理,得到训练样本在分类树中的叶子节点值,将叶子节点值确定为训练样本对应的分类值。
在一些实施例中,上述集成树模型中预设有多个分类子树;上述第一输入模块,用于:将训练样本分别输入至每个分类子树中;通过每个分类子树对训练样本进行分类处理,得到每个分类子树中输出的叶子节点值;将每个分类子树中输出的叶子节点值,或者每个分类子树中输出的叶子节点值的总和作为最终的叶子节点值。
在一些实施例中,上述第二分类子模型包括逻辑回归模型;上述第二输入模块,用于:通过逻辑回归模型中的边界判定函数,计算训练样本和训练样本对应的分类值对应的函数值;根据函数值的绝对值,确定训练对象发起服务的概率预测值。
在一些实施例中,上述第二输入模块,用于:通过逻辑回归模型中的概率函数,将函数值映射至预设的概率区间,得到训练对象发起服务的概率预测值。
在一些实施例中,上述装置还包括:样本和预测值获取模块,用于获取服务发起概率模型训练完成后,每个训练对象的训练样本和训练样本对应的概率预测值;计算模块,用于计算每个训练样本的假正例率值和真正例率值;曲线绘制模块,用于根据计算出的每个训练样本的假正例率值和真正例率值,在预设的二维坐标轴上绘制ROC曲线;评估结果确定模块,用于求取ROC曲线与二维坐标轴中的X轴的包围面积,将包围面积确定为服务发起概率模型的预测能力的评估结果;判断模块,用于判断预测能力的评估结果是否满足预设的评估阈值,如果否,继续训练服务发起概率模型,直至服务发起概率模型的预测能力的评估结果满足评估阈值。
根据本申请的另一个方面,还提供一种服务发起概率预测装置,装置设置于安装有服务发起概率模型的设备;服务发起概率模型通过上述服务发起概率模型的训练方法训练得到;装置包括:第二数据获取模块,用于获取目标对象对终端的操作行为数据;操作行为数据中包含目标对象的激励资源量特征;数据输入模块,用于将操作行为数据输入至服务发起概率模型中,输出目标对象发起服务的概率预测值。
在一些实施例中,上述数据输入模块,用于:将操作行为数据输入至服务发起概率模型中,输出目标对象发起服务的第一概率预测值;调整目标对象的操作行为数据中的激励资源量特征;激励资源量特征包括是否向目标对象发放优惠券、以及优惠券的额度;将调整后的目标对象的操作行为数据再次输入至服务发起概率模型中,输出目标对象的发起服务的第二概率预测值。
在一些实施例中,上述装置还包括:优惠确定模块,用于根据第一概率预测值和第二概率预测值,确定是否向目标对象发放优惠券,以及发放的优惠券的额度。
根据本申请的另一个方面,还提供一种电子设备,包括:处理器、存储介质和总线,存储介质存储有处理器可执行的机器可读指令,当电子设备运行时,处理器与存储介质之间通过总线通信,处理器执行机器可读指令,以执行时执行如上述服务发起概率模型的训练方法,或者如上述服务发起概率预测方法的步骤。
根据本申请的另一个方面,还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上述服务发起概率模型的训练方法,或者如上述服务发起概率预测方法的步骤。
基于上述任一方面,首先从训练对象的终端获取与服务客户端有关的操作行为数据;再从操作行为数据中获取影响服务发起概率的特征数据和实际发起服务数据,并根据特征数据确定训练样本;进而通过第一分类子模型和第二分类子模型输出训练对象发起服务的概率预测值;最后根据概率预测值与实际发起服务数据,训练第一分类子模型和第二分类子模型,得到服务发起概率模型。上述方式中,通过与服务客户端有关的操作行为数据确定训练样本,进而训练得到服务发起概率模型,通过该模型可以较为准确地预测用户的服务发起概率,后续可以根据模型的预测结果合理地向用户提供优惠资源,以激励用户发起服务,从而提高平台的活跃度和整体收益。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的一种电子设备的示例性硬件和软件组件的示意图;
图2示出了本申请实施例所提供的一种服务发起概率模型的训练方法的流程图;
图3示出了本申请实施例所提供的另一种服务发起概率模型的训练方法的流程图;
图4示出了本申请实施例所提供的一种服务发起概率模型的示意图;
图5示出了本申请实施例所提供的另一种服务发起概率模型的训练方法的流程图;
图6示出了本申请实施例所提供的一种服务发起概率预测方法的流程图;
图7示出了本申请实施例所提供的另一种服务发起概率预测方法的流程图;
图8示出了本申请实施例所提供的一种服务发起概率模型的训练装置的结构示意图;
图9示出了本申请实施例所提供的一种服务发起概率预测装置的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解,本申请中附图仅起到说明和描述的目的,并不用于限定本申请的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应该理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。
另外,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,本申请实施例中将会用到术语“包括”,用于指出其后所声明的特征的存在,但并不排除增加其它的特征。
本申请中的术语“服务”和“订单”可互换使用,以指代由乘客、服务请求方、司机、服务提供方、或供应商等、或其任意组合发起的服务请求。接受该“服务”或“订单”的可以是乘客、服务请求方、司机、服务提供方、或供应商等、或其任意组合。服务可以是收费的或免费的。
图1示出根据本申请的一些实施例的可以实现本申请提供的服务发起概率模型的训练方法和服务发起概率预测方法的电子设备100的示例性硬件和软件组件的示意图。
电子设备100可以是通用计算机或特殊用途的计算机,两者都可以用于实现本申请的服务发起概率模型的训练方法和服务发起概率预测方法。本申请尽管仅示出了一个计算机,但是为了方便起见,可以在多个类似平台上以分布式方式实现本申请描述的功能,以均衡处理负载。
例如,电子设备100可以包括连接到网络的网络端口110、用于执行程序指令的一个或多个处理器120、通信总线130、和不同形式的存储介质140,例如,磁盘、ROM、或RAM,或其任意组合。示例性地,计算机平台还可以包括存储在ROM、RAM、或其他类型的非暂时性存储介质、或其任意组合中的程序指令。根据这些程序指令可以实现本申请的方法。电子设备100还包括计算机与其他输入输出设备(例如键盘、显示屏)之间的输入/输出(Input/Output,I/O)接口150。
上述存储介质140存储有处理器120可执行的机器可读指令,当电子设备运行时,处理器120与存储介质140之间通过总线通信,处理器执行机器可读指令,以执行时执行下述道路地图的构建方法的步骤。另外,存储介质也可以称为计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行下述服务发起概率模型的训练方法的步骤,或者服务发起概率预测方法的步骤。
为了便于说明,在电子设备100中仅描述了一个处理器。然而,应当注意,本申请中的电子设备100还可以包括多个处理器,因此本申请中描述的一个处理器执行的步骤也可以由多个处理器联合执行或单独执行。例如,若电子设备100的处理器执行步骤A和步骤B,则应该理解,步骤A和步骤B也可以由两个不同的处理器共同执行或者在一个处理器中单独执行。例如,第一处理器执行步骤A,第二处理器执行步骤B,或者第一处理器和第二处理器共同执行步骤A和B。
基于上述电子设备的描述,本申请实施例首先描述一种服务发起概率模型的训练方法,如图2所示,该方法包括如下步骤:
步骤S202,从训练对象的终端获取与服务客户端有关的操作行为数据;
该训练对象通常为服务客户端的用户,本实施例中,训练对象与用户可以互换;训练对象的终端可以是手机、平板电脑、台式电脑、专用终端等;终端上安装有服务客户端,该服务客户端可以为应用程序,也可以通过浏览器访问。与服务客户端有关的操作行为数据可以为用户操作该服务客户端的数据、用户操作与服务客户端相关联的数据、以及用户操作终端的数据等。
步骤S204,从操作行为数据中获取影响服务发起概率的特征数据和实际发起服务数据,并根据特征数据确定训练样本;
由上述可知,操作行为数据包含有用户各个方面的操作数据,覆盖面广且数据量较大,因而需要从操作行为数据中获取可以影响服务发起概率的特征数据;影响服务发起概率的特征数据通常与用户发起服务操作相关联,例如,用户访问该服务客户端的次数时间、访问该服务客户端的页面、停留时间、页面操作、服务发起操作、以及用户注册行为、享受优惠行为等特征数据;另外,该特征数据还可以包含与服务客户端相关联的特征数据,如用户将服务客户端的信息分享给好友的操作、终端的连网操作、用户个人信息等。
上述发起服务或服务发起也可以理解为用户下订单的操作;实际发起服务数据通常为用户的下单数据,如在预设时间段内的下单数量、下单频率等;该实际发起服务数据用于与模型预测结果进行比较,从而使模型在训练过程中调整模型参数,使预测结果逐渐接近实际发起服务数据,提高预测准确率。
考虑到上述从操作行为数据中获取到的特征数据中,常常包含有一些坏数据、缺失值等,且各特征数据的单位不同,导致各类特征数据的数值差异较大,这些都会影响模型的训练效果,因而特征数据不能直接输入至模型中进行训练,需要预先对特征数据进行清洗、归一化、离散化等,得到训练样本,该训练样本通常与后续的模型相匹配,且有利于模型的训练过程。
步骤S206,将训练样本输入至第一分类子模型,输出训练样本对应的分类值;
该第一分类子模型通常使用可以实现分类的机器学习模型实现,如集成树模型、贝叶斯模型、决策树模型等;模型在进行分类过程中,通常会以数值的形式输出训练样本的分类结果,该分类结果即为训练样本对应的分类值。以集成树模型为例,该模型中包含有多层分支,根据训练样本与各层分支的匹配程度,将训练样本逐步划分,直至到达分支末端(也可以称为叶子节点值),该分支末端对应的权重值,即训练样本的分类值。
步骤S208,将训练样本和训练样本对应的分类值输入至第二分类子模型,输出训练对象发起服务的概率预测值;
该第二分类子模型通常使用可以实现概率预测的机器学习模型实现,如逻辑回归模型、支持向量机模型等;模型在预测概率时,通常会通过预设函数计算训练样本的函数值,进而再将函数值进行归一化处理,映射至概率区间中;模型在训练过程中,会不断调整上述预设函数中的各项参数,以使输出的概率预测值与用户实际的服务发起情况相贴近。
步骤S210,根据上述概率预测值与实际发起服务数据,训练第一分类子模型和第二分类子模型,得到服务发起概率模型。
上述实际发起服务数据可以为用户在预设时间段是否发起服务,以及发起服务的次数等;为了便于训练,该实际发起服务的数据可以简化为“发起服务”或“没有发起服务”;在上述模型训练过程中,可以根据概率预测值与实际发起服务数据的相似程度,调整上述第一分类子模型和第二分类子模型中的参数,直至该相似程度接近并且收敛,得到上述服务发起概率模型。
例如,“发起服务”可以用于1表示,“没有发起服务”可以用0表示;如果对于某一训练样本,概率预测值为0.4,即用户发起服务的概率为0.4,而该训练样本对应的实际发起服务数据为“发起服务”,此时,模型输出的概率预测值(即0.4)与实际发起服务数据(即1)相差较大,需要调整上述第一分类子模型和第二分类子模型中的参数,继续训练。而如果上述训练样本,概率预测值为0.95,即用户发起服务的概率为0.95,而该训练样本对应的实际发起服务数据为“发起服务”,此时,模型输出的概率预测值(即0.95)与实际发起服务数据(1)差距较小,并且经多次训练后,概率预测值与实际发起服务数据的差距不再变化,此时可以停止训练,得到上述服务发起概率模型。
本发明实施例提供的一种服务发起概率模型的训练方法,首先从训练对象的终端获取与服务客户端有关的操作行为数据;再从操作行为数据中获取影响服务发起概率的特征数据和实际发起服务数据,并根据特征数据确定训练样本;进而通过第一分类子模型和第二分类子模型输出训练对象发起服务的概率预测值;最后根据概率预测值与实际发起服务数据,训练第一分类子模型和第二分类子模型,得到服务发起概率模型。上述方式中,通过与服务客户端有关的操作行为数据确定训练样本,进而训练得到服务发起概率模型,通过该模型可以较为准确地预测用户的服务发起概率,后续可以根据模型的预测结果合理地向用户提供优惠资源,以激励用户发起服务,从而提高平台的活跃度和整体收益。
本发明实施例提供的另一种服务发起概率模型的训练方法,该方法在上述实施例所提供方法的基础上实现;本实施例中,具体描述特征数据的具体内容、以及对特征数据的具体处理方式。
为了能够准确地预测用户的服务发起概率,通常需要获取尽可能全面的特征数据,基于此,本实施例中的服务发起概率模型在训练过程中,使用的特征数据包括服务客户端的访问行为特征、服务发起行为特征、注册行为特征、好友关系特征、终端上与服务客户端有关的第三方客户端的分布特征、激励资源量特征和训练对象的身份属性特征中的多种。
具体而言,服务客户端的访问行为特征,也可以称为APP(Application,应用程序)特征,包括用户在预设时间段内打开APP的次数、冒泡次数、访问APP内各个页面的次数、停留在APP中各个页面的时间、用户点击APP内各个页面的步骤、点击顺序、以及与时间跨度相关的特征等;其中,上述冒泡次数中的冒泡,可以理解为用户已经进行发起服务的操作,如对于租车服务而言,用户已经输入了出发地、目的地,但并未确定下单,该过程称为一次冒泡。与时间跨度相关的特征可以理解为用户在APP内的各点击操作的时间间隔,也可以理解为上一个点击行为与下一个点击行为的时间间隔;以租车服务为例,用户点击目的地输入框到目的地输入完毕的时间间隔、完成上述冒泡过程到确定下单的时间间隔、从首次进入快车服务发起界面到进行单车服务发起界面的时间间隔等等。需要说明的是,上述APP即服务客户端,即用户发起服务的APP。
上述服务发起行为特征,也可以称为冒泡特征,冒泡过程具体可以参见上文描述。该冒泡特征通常包含用户在预设时间段内输入的出发地和目的地之间的行驶时间、行驶距离、冒泡次数、冒泡的时间信息、服务发起次数等。通常,上述打开APP的次数大于冒泡次数,该冒泡次数大于服务发起次数。上述注册行为特征通常包括用户从开始注册账户到注册完成的时间(也可以称为注册账户的速度)、输入的手机号、输入手机号的次数等用户在注册过程中的行为特征。上述好友关系特征通常包括与服务客户端所在的终端共享同一无线网络(如Wi-Fi网络)的终端对应的其他用户、用户将服务客户端的信息通过即时通讯软件分享给好友的特征、用户将服务客户端的红包分享给好友的特征等。
上述终端上与服务客户端有关的第三方客户端的分布特征(也可以称为证据权重特征)通常包含服务客户端所在的终端安装的各类APP,尤其是与该服务客户端提供的服务近似,具有竞争关系的APP等。上述激励资源量特征具体可以为用户目前享有的优惠特征,如折扣类型、折扣幅度、优惠券类型、优惠券额度、优惠券数量等。上述训练对象的身份属性特征通常包括用户的年龄、性别、消费水平、家庭住址、工作单位信息、用户的服务客户端绑定的支付账号、服务客户端注册渠道、是否经常外出旅游等特征;其中,服务客户端注册渠道可以理解为用户下载APP并注册的途径,如通过应用商城下载并注册、通过服务客户端的推广广告进行下载页面并注册等。
上述多种特征数据均可以从服务客户端有关的操作行为数据中提取得到;在实际实现时,可以提取上述提供的所有种类的特征数据,也可以根据实际需求选择部分种类的特征数据。通常,上述好友关系特征、服务发起次数、冒泡次数等特征较为常用。可以理解的是,特征数据越全面,训练得到的服务发起概率模型的预测结果越准确。本实施例中可以将上述特征数据全部提取出来,基于提取出的特征数据确定训练样本,全面的特征数据可以使上述服务发起概率模型的预测结果更加准确。
基于上述对特征数据的描述,本实施例中的服务发起概率模型的训练方法,如图3所示,包括如下步骤:
步骤S302,从训练对象的终端获取与服务客户端有关的操作行为数据;
步骤S304,从操作行为数据中获取影响服务发起概率的特征数据和实际发起服务数据;
步骤S306,对特征数据进行数据转化处理;该数据转化处理至少包括下述之一:归一化处理、离散化处理和缺失值填充处理。
考虑到上述特征数据中,各类的特征数据通常采用不同的单位,如时间信息采用时间单位、距离信息采用长度单位、次数频率信息通常为“1”等;为了便于模型训练,使得输入的训练样本的单位、格式与第一分类子模型和第二分类子模型相匹配,因而需要进行归一化处理,可以将上述特征数据去除单位限制,转化为无量纲的纯数值,便于不同单位或量级的数据能够比较和加权;具体可以通过预设的映射函数,将特征数据映射至预设区间中,也可以将数据按照预设比例进行缩放,使数据落入预设区间中,该预设区间可以为[0,1]区间等。
上述特征数据中,某些类型的特征数据为连续数据,即在预设的区间内,某一用户对应的特征数据的取值可以为该区间内的任意数值;但是这种连续数据不利于模型对特征数据进行计算和分类,因此,可以将连续数据对应的区间划分为多个子区间,每个子区间用对应的符合或整数值表征;划分子区间的过程中,可以用等宽法,即个子区间的数据宽度相同,也可以用等频法,对于当前范围的特征数据,落入每个子区域的数量相同。通过上述方式对上述特征数据进行离散化后,可以得到维度较高的特征数据,如400-500维特征数据;离散化的过程,除了利于模型进行计算分类,还可以从特征数据中引入一些分线性特征,以使模型更加方便地进行特征处理和分类。
上述特征数据中,对于某一用户而言,其操作行为数据中可能不具有全部的种类的特征数据,如该用户可能不具有好友关系特征、或者不具有身份属性特征中的年龄特征等;因而获得的特征据中可能会存在缺失值;如果将存在缺失值的特征数据输入至模型中,则会对模型的训练效果产生负面影响;因此,在确定训练样本时,需要将特征数据进行缺失值填充处理,具体而言,可以将该缺失值对应的特征数据的平均值填入该缺失值的位置中,也可以根据该缺失值对应用户的其他特征数据,生成合理的数据,将生成的数据填入该缺失值的位置中。
另外,除上述提到的归一化处理、离散化处理和缺失值填充处理这三种数据转化处理方式之外,还可以对特征数据进行异常值分析,提取出特征数据明细偏离正常数值范围的数据,提取出的数据即为异常值,进而对这些异常值进行修正处理。
在实际实现时,上述归一化处理、离散化处理和缺失值填充处理这三种数据转化处理方式的顺序可以根据需要进行设置,通常情况下,大多会先对特征数据进行缺失值填充处理、继而再进行归一化处理和离散化处理;数据转化处理后得到的特征数据可以作为训练样本输入至后续的第一分类子模型中;另一种方式中,可以对转化处理后得到的特征数据进一步处理,得到最终的训练样本,如下述步骤所述。
步骤S308,从处理后的特征数据中提取预设种类的特征数据;该预设种类的数量为至少两种;
为了进一步提高特征数据的丰富性,还可以对部分特征数据进行再处理,从而得到新的特征数据;首先,需要从上述处理后的特征数据中提取预设种类的特征数据;该预设种类可以预先设置,如特征数据中的服务发起行为特征和注册行为特征,具体可以为服务发起行为特征中的冒泡次数和注册行为特征中的注册天数。该预设种类的数量通常至少为两种,以基于这些特征数据进行组合等再处理,得到新的特征;当然,上述预设种类的数量也可以为多种。
步骤S310,按照预设的特征分组,将提取的特征数据中,属于同一分组的特征数据进行矩阵变换,得到每个分组对应的组合特征;
上述特征分组可以预先设定;例如,上述提取到的预设种类的特征数据共包括四种,分别为特征数据A、特征数据B、特征数据C和特征数据D;该特征分组可以为特征数据A和特征数据B划分为一组,特征数据C和特征数据D划分为一组。对于同一分组的特征数据,可以将该分组的特征数据进行矩阵变换,如矩阵的旋转、缩放、切变、反射以及正投影等,得到分组对应的组合特征。例如,上述特征数据A为用户注册天数,该数据特征A经离散化后得到的特征向量为[1,n],上述特征数据B为用户最近一次冒泡距离当前时间的天数,特征数据B经离散化后得到的特征向量为[1,m],两个特征向量经矩阵变换后,得到组合矩阵[1,m*n],该组合矩阵即为该对应的组合特征。另外,可以得到服务发起次数与打开APP次数的比例特征、冒泡次数与打开APP次数的比例特征等组合特征。
步骤S312,将处理后的特征数据,以及组合特征确定为训练样本。
步骤S314,将训练样本输入至第一分类子模型,输出训练样本对应的分类值;
步骤S316,将训练样本和训练样本对应的分类值输入至第二分类子模型,输出训练对象发起服务的概率预测值;
步骤S318,根据概率预测值与实际发起服务数据,训练第一分类子模型和第二分类子模型,得到服务发起概率模型。
上述方式中,通过与服务客户端有关的操作行为数据确定多种特征数据,进而再基于多种特征数据得到组合特征,可以使模型的训练样本更加丰富,使得训练得到的模型准确率更高,后续可以根据模型的预测结果合理地向用户提供优惠资源,以激励用户发起服务,从而提高平台的活跃度和整体收益。
本发明实施例提供的另一种服务发起概率模型的训练方法,该方法在上述实施例所提供方法的基础上实现;本实施例中,具体描述第一分类子模型输出分类值,以及第二分类子模型输出概率预测值的过程。图4所示为一种服务发起概率模型的示意图;本实施例中的第一分类子模型可以通过集成树模型实现;该集成树模型具体可以为提升数模型(也可以称为GBDT模型)、Xgboost模型等。第二分类子模型可以通过逻辑回归模型实现,也可以称为LR模型。特征数据经数据转化后得到训练样本,该训练样本输入至集成树模型后,输出分类值;该分类值和训练样本输入至逻辑回归模型,输出概率预测值。基于此,本实施例中的服务发起概率模型的训练方法,如图5所示,包括如下步骤:
步骤S502,从训练对象的终端获取与服务客户端有关的操作行为数据;
步骤S504,从操作行为数据中获取影响服务发起概率的特征数据和实际发起服务数据;
步骤S506,对特征数据进行数据转化处理;该数据转化处理至少包括下述之一:归一化处理、离散化处理和缺失值填充处理。
步骤S508,从处理后的特征数据中提取预设种类的特征数据;该预设种类的数量为至少两种;
步骤S510,按照预设的特征分组,将提取的特征数据中,属于同一分组的特征数据进行矩阵变换,得到每个分组对应的组合特征;
步骤S512,将处理后的特征数据,以及组合特征确定为训练样本。
步骤S514,通过集成树模型中的分类树,对训练样本进行分类处理,得到训练样本在分类树中的叶子节点值,将叶子节点值确定为训练样本对应的分类值。
该集成树模型中的分类树中,可以设置多层分类节点,每个分类节点中设置决策条件以及不同的分支,根据训练样本与决策条件的匹配程度,可以确定该训练样本下一步该走哪个分支;直至走到分类树的末端,即叶子节点;每个叶子节点预先分配有不同的权重值,训练样本走到哪个叶子节点,该叶子节点的权重值即该训练样本对应的叶子节点值,即训练样本对应的分类值。在模型训练过程中,集成树模型中的各个分类节点的决策条件以及各个叶子节点的权重值会不断调整,以使最终输出的结果与用户的真实服务发起数据相匹配。
为了进一步提高集成树模型的分类合理程度,上述集成树模型中预设有多个分类子树;每个分类子树中包含的决策条件通常不同,例如可以将决策条件进行分组,每组决策条件形成一个分类子树。基于此,上述步骤S414还可以通过下述步骤实现:
步骤01,将训练样本分别输入至每个分类子树中;
步骤02,通过每个分类子树对训练样本进行分类处理,得到每个分类子树中输出的叶子节点值;
步骤03,将每个分类子树中输出的叶子节点值,或者每个分类子树中输出的叶子节点值的总和作为最终的叶子节点值。
例如,上述集成树模型中包含有两个分类子树,分别是分类子树1和分类子树2,训练样本A经分类子树1分类后得到的叶子节点值是+2,经分类子树2分类后得到的叶子节点值是0.9;此时该训练样本A的最终的叶子节点值可以为+2、0.9,也可以为0.9+2=2.9。再如,训练样本B经分类子树1分类后得到的叶子节点值是-1,经分类子树2分类后得到的叶子节点值是0.9;此时该训练样本A的最终的叶子节点值可以为-1、0.9,也可以为0.9-1=-0.1。
步骤S516,通过逻辑回归模型中的边界判定函数,计算训练样本和训练样本对应的分类值对应的函数值;
该边界判定函数f(x)=0可以为直线、曲线或者封闭曲线;当训练样本和训练样本对应的分类值代入f(x)时,即可得到对应的函数值。在模型训练过程中,逻辑回归模型中的边界判定函数的形状、参数等通常会不断调整,以使最终的概率预测值与用户的真实服务发起数据相匹配。
步骤S518,根据函数值的绝对值,确定训练对象发起服务的概率预测值。
上述得到的函数值的绝对值,可以理解为该训练样本对应的函数值与f(x)=0的距离,距离越近,说明该训练样本分类越清晰,距离越远,说明该训练样本分类越模糊。具体到本实施例中,f(x)=0可以对应概率预测值为0.5,f(x)小于0时,可以对应概率预测值小于0.5;f(x)大于0时,可以对应概率预测值大于0.5。
通常,上述边界判定函数输出的函数值范围较大,为了得到函数值对应的概率预测值,通常还需要对函数值进行进一步处理,如,通过逻辑回归模型中的概率函数,将函数值映射至预设的概率区间,得到训练对象发起服务的概率预测值。该概率函数具体可以为Sigmoid函数,当然也可以为其他映射函数;可以理解,上述概率区间通常为[0,1]。
步骤S520,根据概率预测值与实际发起服务数据,训练第一分类子模型和第二分类子模型,得到服务发起概率模型。
上述步骤中,通过不断比较概率预测值与实际发起服务数据,可以在模型训练过程中不断调整内部参数,以使概率预测值与实际发起服务数据相贴近,保证模型的预测正确率满足预设的正确率阈值,但是,除正确率外,模型通常还需要满足其他性能要求,如对训练样本的依赖性、预测稳定性等。基于此,上述得到服务发起概率模型之后,该模型还可以通过下述步骤进行进一步的评估:
步骤11,获取服务发起概率模型训练完成后,每个训练对象的训练样本和训练样本对应的概率预测值;
步骤12,计算每个训练样本的假正例率值和真正例率值;
假正例率值也可以称为假阳性率,或误诊率;假正例率值为模型错误预测为正实例的负实例占所有负实例的比值,具体到本实施例中,假正例率值为模型错误预测为已发起服务的未发起服务的训练样本占所有未发起服务的训练样本的比值;真正例率值也可以称为真阳性率,或敏感度;真正例率值为模型预测的正确的正实例占所有正实例的比值,具体到本实施例中,真正例率值为模型预测正确的已发起服务的的训练样本占所有已发起服务的训练样本的比值。
步骤13,根据计算出的每个训练样本的假正例率值和真正例率值,在预设的二维坐标轴上绘制ROC曲线;
步骤14,求取ROC曲线与二维坐标轴中的X轴的包围面积,将包围面积确定为服务发起概率模型的预测能力的评估结果;
该二维坐标轴上,通常X轴坐标为假正例率值,Y轴坐标为真正例率值。ROC曲线通常为梯形曲线。在实际实现时,可以无需真正画出ROC曲线,也可以根据上述每个训练样本的假正例率值和真正例率值,直接求取对应的ROC曲线与二维坐标轴中的X轴的包围面积。该包围面积也可以称为AUC(Area under the Curve of ROC)值,该AUC值可以用于评估模型的预测能力;该AUC值的取值通常在1.0至0.5之间。如果得到的AUC值越接近于1,则说明该服务发起概率模型的预测能力越好,预测能力越稳定。
步骤15,判断预测能力的评估结果是否满足预设的评估阈值,如果否,继续训练服务发起概率模型,直至服务发起概率模型的预测能力的评估结果满足评估阈值。
上述评估方式也可以称为AUC评估方式,通过该评估可以使服务发起概率模型不仅具有较高的预测准确率,也可以具有较高的预测的稳定性,使模型各方面性能满足预测需求。
对应于上述服务发起概率模型的训练方法,本发明实施例还提供一种服务发起概率预测方法,该方法应用于安装有服务发起概率模型的设备;该服务发起概率模型通过上述服务发起概率模型的训练方法训练得到;如图6所示,该方法包括如下步骤:
步骤S602,获取目标对象对终端的操作行为数据;该操作行为数据中包含目标对象的激励资源量特征;
该目标对象通常为服务客户端的用户,本实施例中,目标对象和用户可以互换;该激励资源量特征具体可以为用户目前享有的优惠特征,如折扣类型、折扣幅度、优惠券类型、优惠券额度、优惠券数量等。
步骤S604,将操作行为数据输入至服务发起概率模型中,输出目标对象发起服务的概率预测值。
上述服务发起概率预测方法,获取到目标对象对终端的操作行为数据后,将该操作行为数据输入至服务发起概率模型中,即可输出目标对象发起服务的概率预测值。通过上述方式,可以获取当前用户在当前享有的优惠激励下,再次发起服务的概率,尤其是对于已注册用户但并未发起首次服务的用户,可以或者该用户发起首次用户的概率;如果得到的概率预测值较低,可以继续向该用户发送优惠激励,但如果概率预测值较高,则无需向该用户发送优惠激励,从而使得优惠激励的发放更加合理,从整体上提高平台的收益。
如图7所示,本实施例还提供另一种服务发起概率预测方法,该方法包括下述步骤:
步骤S702,获取目标对象对终端的操作行为数据;该操作行为数据中包含目标对象的激励资源量特征;
步骤S704,将操作行为数据输入至服务发起概率模型中,输出目标对象发起服务的第一概率预测值;
步骤S706,调整目标对象的操作行为数据中的激励资源量特征;该激励资源量特征包括是否向目标对象发放优惠券、以及优惠券的额度;
步骤S708,将调整后的目标对象的操作行为数据再次输入至服务发起概率模型中,输出目标对象的发起服务的第二概率预测值。
如果上述目标对象的操作行为数据中的激励资源量特征为零,则上述第一概率预测值即为该目标对象在自然状态下的服务发起概率;调整目标对象的操作行为数据中的激励资源量特征,具体可以为该目标对象设置预设额度的优惠卷,将该预设额度的优惠卷作为该目标对象的操作行为数据中的新的激励资源量特征,则上述第二概率预测值即为该目标对象在该预设额度的优惠卷的激励下的服务发起概率。
步骤S710,根据第一概率预测值和第二概率预测值,确定是否向目标对象发放优惠券,以及发放的优惠券的额度。
如果经激励资源量特征调整后得到的第二概率预测值远远高于激励资源量特征调整前的第一概率预测值,则可以按照调整后的激励资源量特征向该目标对象发放优惠券;而如果第二概率预测值与第一概率预测值相差几乎不大,则可以继续调整上述激励资源量特征,直至得到一个较高的第二概率预测值,按照该较高的第二概率预测值对应的激励资源量特征,向该目标对象发放优惠券。但如果激励资源量特征增加到一定程度后,第二概率预测值与第一概率预测值始终相差不大,考虑到平台的整体利益,通常不再向该目标对象发放优惠券;该方式中,通过调整激励资源量特征,从而得到向该目标对象发放优惠卷的合理额度,以较大概率的激励用户发起服务,从而提高平台的活跃度,保障平台整体利益。
对应于上述服务发起概率模型的训练方法实施例,参见图8所示的一种服务发起概率模型的训练装置的结构示意图,该服务发起概率模型的训练装置实现的功能对应上述方法执行的步骤。该装置可以理解为上述服务器,或服务器的处理器,也可以理解为独立于上述服务器或处理器之外的在服务器控制下实现本申请功能的组件,如图8所示,该装置包括:
第一数据获取模块80,用于从训练对象的终端获取与服务客户端有关的操作行为数据;
样本确定模块81,用于从操作行为数据中获取影响服务发起概率的特征数据和实际发起服务数据,并根据特征数据确定训练样本;
第一输入模块82,用于将训练样本输入至第一分类子模型,输出训练样本对应的分类值;
第二输入模块83,用于将训练样本和训练样本对应的分类值输入至第二分类子模型,输出训练对象发起服务的概率预测值;
训练模块84,用于根据概率预测值与实际发起服务数据,训练第一分类子模型和第二分类子模型,得到服务发起概率模型。
上述服务发起概率模型的训练装置,首先从训练对象的终端获取与服务客户端有关的操作行为数据;再从操作行为数据中获取影响服务发起概率的特征数据和实际发起服务数据,并根据特征数据确定训练样本;进而通过第一分类子模型和第二分类子模型输出训练对象发起服务的概率预测值;最后根据概率预测值与实际发起服务数据,训练第一分类子模型和第二分类子模型,得到服务发起概率模型。上述方式中,通过与服务客户端有关的操作行为数据确定训练样本,进而训练得到服务发起概率模型,通过该模型可以较为准确地预测用户的服务发起概率,后续可以根据模型的预测结果合理地向用户提供优惠资源,以激励用户发起服务,从而提高平台的活跃度和整体收益。
上述服务发起概率模型的训练装置中的模块可以经由有线连接或无线连接彼此连接或通信。有线连接可以包括金属线缆、光缆、混合线缆等,或其任意组合。无线连接可以包括通过LAN、WAN、蓝牙、ZigBee、或NFC等形式的连接,或其任意组合。两个或更多个模块可以组合为单个模块,并且任何一个模块可以分成两个或更多个单元。
在一些实施例中,上述特征数据包括服务客户端的访问行为特征、服务发起行为特征、注册行为特征、好友关系特征、终端上与服务客户端有关的第三方客户端的分布特征、激励资源量特征和训练对象的身份属性特征中的多种。
在一些实施例中,上述样本确定模块,用于:对特征数据进行数据转化处理,根据转化处理后的特征数据生成特征数据对应的训练样本;数据转化处理至少包括下述之一:归一化处理、离散化处理和缺失值填充处理。
在一些实施例中,上述样本确定模块,用于:从处理后的特征数据中提取预设种类的特征数据;预设种类的数量为至少两种;按照预设的特征分组,将提取的特征数据中,属于同一分组的特征数据进行矩阵变换,得到每个分组对应的组合特征;将处理后的特征数据,以及组合特征确定为训练样本。
在一些实施例中,上述第一分类子模型包括集成树模型;上述第一输入模块,用于:通过集成树模型中的分类树,对训练样本进行分类处理,得到训练样本在分类树中的叶子节点值,将叶子节点值确定为训练样本对应的分类值。
在一些实施例中,上述集成树模型中预设有多个分类子树;上述第一输入模块,用于:将训练样本分别输入至每个分类子树中;通过每个分类子树对训练样本进行分类处理,得到每个分类子树中输出的叶子节点值;将每个分类子树中输出的叶子节点值,或者每个分类子树中输出的叶子节点值的总和作为最终的叶子节点值。
在一些实施例中,上述第二分类子模型包括逻辑回归模型;上述第二输入模块,用于:通过逻辑回归模型中的边界判定函数,计算训练样本和训练样本对应的分类值对应的函数值;根据函数值的绝对值,确定训练对象发起服务的概率预测值。
在一些实施例中,上述第二输入模块,用于:通过逻辑回归模型中的概率函数,将函数值映射至预设的概率区间,得到训练对象发起服务的概率预测值。
在一些实施例中,上述装置还包括:样本和预测值获取模块,用于获取服务发起概率模型训练完成后,每个训练对象的训练样本和训练样本对应的概率预测值;计算模块,用于计算每个训练样本的假正例率值和真正例率值;曲线绘制模块,用于根据计算出的每个训练样本的假正例率值和真正例率值,在预设的二维坐标轴上绘制ROC曲线;评估结果确定模块,用于求取ROC曲线与二维坐标轴中的X轴的包围面积,将包围面积确定为服务发起概率模型的预测能力的评估结果;判断模块,用于判断预测能力的评估结果是否满足预设的评估阈值,如果否,继续训练服务发起概率模型,直至服务发起概率模型的预测能力的评估结果满足评估阈值。
对应于上述服务发起概率预测方法实施例,参见图9所示的一种服务发起概率预测装置的结构示意图;该服务发起概率预测装置实现的功能对应上述方法执行的步骤。该装置可以理解为上述服务器,或服务器的处理器,也可以理解为独立于上述服务器或处理器之外的在服务器控制下实现本申请功能的组件;该装置设置于安装有服务发起概率模型的设备;服务发起概率模型通过上述服务发起概率模型的训练方法训练得到;如图9所示,该装置包括:
第二数据获取模块90,用于获取目标对象对终端的操作行为数据;操作行为数据中包含目标对象的激励资源量特征;
数据输入模块91,用于将操作行为数据输入至服务发起概率模型中,输出目标对象发起服务的概率预测值。
上述服务发起概率预测装置,获取到目标对象对终端的操作行为数据后,将该操作行为数据输入至服务发起概率模型中,即可输出目标对象发起服务的概率预测值。通过上述方式,可以获取当前用户在当前享有的优惠激励下,再次发起服务的概率,尤其是对于已注册用户但并未发起首次服务的用户,可以或者该用户发起首次用户的概率;如果得到的概率预测值较低,可以继续向该用户发送优惠激励,但如果概率预测值较高,则无需向该用户发送优惠激励,从而使得优惠激励的发放更加合理,从整体上提高平台的收益。
上述服务发起概率预测装置中的模块可以经由有线连接或无线连接彼此连接或通信。有线连接可以包括金属线缆、光缆、混合线缆等,或其任意组合。无线连接可以包括通过LAN、WAN、蓝牙、ZigBee、或NFC等形式的连接,或其任意组合。两个或更多个模块可以组合为单个模块,并且任何一个模块可以分成两个或更多个单元。
在一些实施例中,上述数据输入模块,用于:将操作行为数据输入至服务发起概率模型中,输出目标对象发起服务的第一概率预测值;调整目标对象的操作行为数据中的激励资源量特征;激励资源量特征包括是否向目标对象发放优惠券、以及优惠券的额度;将调整后的目标对象的操作行为数据再次输入至服务发起概率模型中,输出目标对象的发起服务的第二概率预测值。
在一些实施例中,上述装置还包括:优惠确定模块,用于根据第一概率预测值和第二概率预测值,确定是否向目标对象发放优惠券,以及发放的优惠券的额度。
本实施例所提供的装置,其实现原理及产生的技术效果和前述实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
本实施例还提供一种电子设备,包括:处理器、存储介质和总线,存储介质存储有处理器可执行的机器可读指令,当电子设备运行时,处理器与存储介质之间通过总线通信,处理器执行机器可读指令,以执行时执行上述服务发起概率模型的训练方法,或者如上述服务发起概率预测方法的步骤。
本实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上述服务发起概率模型的训练方法,或者如上述服务发起概率预测方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考方法实施例中的对应过程,本申请中不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (26)

1.一种服务发起概率模型的训练方法,其特征在于,所述方法包括:
从训练对象的终端获取与服务客户端有关的操作行为数据;
从所述操作行为数据中获取影响服务发起概率的特征数据和实际发起服务数据,并根据所述特征数据确定训练样本;
将所述训练样本输入至第一分类子模型,输出所述训练样本对应的分类值;
将所述训练样本和所述训练样本对应的分类值输入至第二分类子模型,输出所述训练对象发起服务的概率预测值;
根据所述概率预测值与所述实际发起服务数据,训练所述第一分类子模型和所述第二分类子模型,得到服务发起概率模型。
2.根据权利要求1所述的方法,其特征在于,所述特征数据包括服务客户端的访问行为特征、服务发起行为特征、注册行为特征、好友关系特征、所述终端上与所述服务客户端有关的第三方客户端的分布特征、激励资源量特征和所述训练对象的身份属性特征中的多种。
3.根据权利要求1所述的方法,其特征在于,根据所述特征数据确定训练样本的步骤,包括:
对所述特征数据进行数据转化处理;所述数据转化处理至少包括下述之一:归一化处理、离散化处理和缺失值填充处理;
根据转化处理后的所述特征数据生成所述特征数据对应的训练样本。
4.根据权利要求3所述的方法,其特征在于,根据转化处理后的所述特征数据生成所述特征数据对应的训练样本的步骤,包括:
从处理后的所述特征数据中提取预设种类的特征数据;所述预设种类的数量为至少两种;
按照预设的特征分组,将提取的所述特征数据中,属于同一分组的特征数据进行矩阵变换,得到每个分组对应的组合特征;
将处理后的所述特征数据,以及所述组合特征确定为训练样本。
5.根据权利要求1所述的方法,其特征在于,所述第一分类子模型包括集成树模型;
将所述训练样本输入至第一分类子模型,输出所述训练样本对应的分类值的步骤,包括:
通过所述集成树模型中的分类树,对所述训练样本进行分类处理,得到所述训练样本在所述分类树中的叶子节点值,将所述叶子节点值确定为所述训练样本对应的分类值。
6.根据权利要求5所述的方法,其特征在于,所述集成树模型中预设有多个分类子树;
通过所述集成树模型中的分类树,对所述训练样本进行分类处理,得到所述训练样本在所述分类树中的叶子节点值的步骤,包括:
将所述训练样本分别输入至每个所述分类子树中;
通过每个所述分类子树对所述训练样本进行分类处理,得到每个所述分类子树中输出的叶子节点值;
将每个所述分类子树中输出的叶子节点值,或者每个所述分类子树中输出的叶子节点值的总和作为最终的叶子节点值。
7.根据权利要求1所述的方法,其特征在于,所述第二分类子模型包括逻辑回归模型;
所述将所述训练样本和所述训练样本对应的分类值输入至第二分类子模型,输出所述训练对象发起服务的概率预测值的步骤,包括:
通过所述逻辑回归模型中的边界判定函数,计算所述训练样本和所述训练样本对应的分类值对应的函数值;
根据所述函数值的绝对值,确定所述训练对象发起服务的概率预测值。
8.根据权利要求7所述的方法,其特征在于,根据所述函数值的绝对值,确定所述训练对象发起服务的概率预测值的步骤,包括:
通过所述逻辑回归模型中的概率函数,将所述函数值映射至预设的概率区间,得到所述训练对象发起服务的概率预测值。
9.根据权利要求1所述的方法,其特征在于,得到服务发起概率模型之后,所述方法还包括:
获取所述服务发起概率模型训练完成后,每个训练对象的训练样本和所述训练样本对应的概率预测值;
计算每个所述训练样本的假正例率值和真正例率值;
根据计算出的每个所述训练样本的假正例率值和真正例率值,在预设的二维坐标轴上绘制ROC曲线;
求取所述ROC曲线与所述二维坐标轴中的X轴的包围面积,将所述包围面积确定为所述服务发起概率模型的预测能力的评估结果;
判断所述预测能力的评估结果是否满足预设的评估阈值,如果否,继续训练所述服务发起概率模型,直至所述服务发起概率模型的预测能力的评估结果满足所述评估阈值。
10.一种服务发起概率预测方法,其特征在于,所述方法应用于安装有服务发起概率模型的设备;所述服务发起概率模型通过权利要求1-9任一项所述的方法训练得到;所述方法包括:
获取目标对象对终端的操作行为数据;所述操作行为数据中包含所述目标对象的激励资源量特征;
将所述操作行为数据输入至服务发起概率模型中,输出所述目标对象发起服务的概率预测值。
11.根据权利要求10所述的方法,其特征在于,所述将所述操作行为数据输入至服务发起概率模型中,输出所述目标对象发起服务的概率预测值的步骤,包括:
将所述操作行为数据输入至服务发起概率模型中,输出所述目标对象发起服务的第一概率预测值;
调整所述目标对象的操作行为数据中的激励资源量特征;所述激励资源量特征包括是否向所述目标对象发放优惠券、以及所述优惠券的额度;
将调整后的所述目标对象的操作行为数据再次输入至服务发起概率模型中,输出所述目标对象的发起服务的第二概率预测值。
12.根据权利要求11所述的方法,其特征在于,所述方法还包括:
根据所述第一概率预测值和所述第二概率预测值,确定是否向所述目标对象发放优惠券,以及发放的所述优惠券的额度。
13.一种服务发起概率模型的训练装置,其特征在于,所述装置包括:
第一数据获取模块,用于从训练对象的终端获取与服务客户端有关的操作行为数据;
样本确定模块,用于从所述操作行为数据中获取影响服务发起概率的特征数据和实际发起服务数据,并根据所述特征数据确定训练样本;
第一输入模块,用于将所述训练样本输入至第一分类子模型,输出所述训练样本对应的分类值;
第二输入模块,用于将所述训练样本和所述训练样本对应的分类值输入至第二分类子模型,输出所述训练对象发起服务的概率预测值;
训练模块,用于根据所述概率预测值与所述实际发起服务数据,训练所述第一分类子模型和所述第二分类子模型,得到服务发起概率模型。
14.根据权利要求13所述的装置,其特征在于,所述特征数据包括服务客户端的访问行为特征、服务发起行为特征、注册行为特征、好友关系特征、所述终端上与所述服务客户端有关的第三方客户端的分布特征、激励资源量特征和所述训练对象的身份属性特征中的多种。
15.根据权利要求13所述的装置,其特征在于,所述样本确定模块,用于:
对所述特征数据进行数据转化处理;根据转化处理后的所述特征数据生成所述特征数据对应的训练样本;所述数据转化处理至少包括下述之一:归一化处理、离散化处理和缺失值填充处理。
16.根据权利要求15所述的装置,其特征在于,所述样本确定模块,用于:
从处理后的所述特征数据中提取预设种类的特征数据;所述预设种类的数量为至少两种;
按照预设的特征分组,将提取的所述特征数据中,属于同一分组的特征数据进行矩阵变换,得到每个分组对应的组合特征;
将处理后的所述特征数据,以及所述组合特征确定为训练样本。
17.根据权利要求13所述的装置,其特征在于,所述第一分类子模型包括集成树模型;
所述第一输入模块,用于:
通过所述集成树模型中的分类树,对所述训练样本进行分类处理,得到所述训练样本在所述分类树中的叶子节点值,将所述叶子节点值确定为所述训练样本对应的分类值。
18.根据权利要求17所述的装置,其特征在于,所述集成树模型中预设有多个分类子树;
所述第一输入模块,用于:
将所述训练样本分别输入至每个所述分类子树中;
通过每个所述分类子树对所述训练样本进行分类处理,得到每个所述分类子树中输出的叶子节点值;
将每个所述分类子树中输出的叶子节点值,或者每个所述分类子树中输出的叶子节点值的总和作为最终的叶子节点值。
19.根据权利要求13所述的装置,其特征在于,所述第二分类子模型包括逻辑回归模型;
所述第二输入模块,用于:
通过所述逻辑回归模型中的边界判定函数,计算所述训练样本和所述训练样本对应的分类值对应的函数值;
根据所述函数值的绝对值,确定所述训练对象发起服务的概率预测值。
20.根据权利要求19所述的装置,其特征在于,所述第二输入模块,用于:
通过所述逻辑回归模型中的概率函数,将所述函数值映射至预设的概率区间,得到所述训练对象发起服务的概率预测值。
21.根据权利要求13所述的装置,其特征在于,所述装置还包括:
样本和预测值获取模块,用于获取所述服务发起概率模型训练完成后,每个训练对象的训练样本和所述训练样本对应的概率预测值;
计算模块,用于计算每个所述训练样本的假正例率值和真正例率值;
曲线绘制模块,用于根据计算出的每个所述训练样本的假正例率值和真正例率值,在预设的二维坐标轴上绘制ROC曲线;
评估结果确定模块,用于求取所述ROC曲线与所述二维坐标轴中的X轴的包围面积,将所述包围面积确定为所述服务发起概率模型的预测能力的评估结果;
判断模块,用于判断所述预测能力的评估结果是否满足预设的评估阈值,如果否,继续训练所述服务发起概率模型,直至所述服务发起概率模型的预测能力的评估结果满足所述评估阈值。
22.一种服务发起概率预测装置,其特征在于,所述装置设置于安装有服务发起概率模型的设备;所述服务发起概率模型通过权利要求1-9任一项所述的方法训练得到;所述装置包括:
第二数据获取模块,用于获取目标对象对终端的操作行为数据;所述操作行为数据中包含所述目标对象的激励资源量特征;
数据输入模块,用于将所述操作行为数据输入至服务发起概率模型中,输出所述目标对象发起服务的概率预测值。
23.根据权利要求22所述的装置,其特征在于,所述数据输入模块,用于:
将所述操作行为数据输入至服务发起概率模型中,输出所述目标对象发起服务的第一概率预测值;
调整所述目标对象的操作行为数据中的激励资源量特征;所述激励资源量特征包括是否向所述目标对象发放优惠券、以及所述优惠券的额度;
将调整后的所述目标对象的操作行为数据再次输入至服务发起概率模型中,输出所述目标对象的发起服务的第二概率预测值。
24.根据权利要求23所述的装置,其特征在于,所述装置还包括:
优惠确定模块,用于根据所述第一概率预测值和所述第二概率预测值,确定是否向所述目标对象发放优惠券,以及发放的所述优惠券的额度。
25.一种电子设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行时执行如权利要求1至9任一所述的服务发起概率模型的训练方法,或者如权利要求10至12任一所述的服务发起概率预测方法的步骤。
26.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至9任一所述的服务发起概率模型的训练方法,或者如权利要求10至12任一所述的服务发起概率预测方法的步骤。
CN201811474808.8A 2018-12-04 2018-12-04 服务发起概率预测方法及其模型的训练方法和装置 Active CN111275470B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811474808.8A CN111275470B (zh) 2018-12-04 2018-12-04 服务发起概率预测方法及其模型的训练方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811474808.8A CN111275470B (zh) 2018-12-04 2018-12-04 服务发起概率预测方法及其模型的训练方法和装置

Publications (2)

Publication Number Publication Date
CN111275470A true CN111275470A (zh) 2020-06-12
CN111275470B CN111275470B (zh) 2023-12-01

Family

ID=71001382

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811474808.8A Active CN111275470B (zh) 2018-12-04 2018-12-04 服务发起概率预测方法及其模型的训练方法和装置

Country Status (1)

Country Link
CN (1) CN111275470B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111860494A (zh) * 2020-06-16 2020-10-30 北京航空航天大学 图像目标检测的优化方法、装置、电子设备和存储介质
CN112270348A (zh) * 2020-10-21 2021-01-26 中国银联股份有限公司 用户激活方法、模型训练方法、装置、设备及存储介质
CN113129080A (zh) * 2021-05-13 2021-07-16 北京大米科技有限公司 一种数据处理方法及装置
CN113420165A (zh) * 2021-06-11 2021-09-21 北京达佳互联信息技术有限公司 二分类模型的训练、多媒体数据的分类方法及装置
CN114169906A (zh) * 2020-09-11 2022-03-11 腾讯科技(深圳)有限公司 电子券推送方法、装置
CN116737697A (zh) * 2023-08-10 2023-09-12 云筑信息科技(成都)有限公司 建筑行业物料主数据管理方法、装置及电子设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130304676A1 (en) * 2012-05-14 2013-11-14 Qualcomm Incorporated On-device real-time behavior analyzer
US20160110653A1 (en) * 2014-10-20 2016-04-21 Xerox Corporation Method and apparatus for predicting a service call for digital printing equipment from a customer
US9462313B1 (en) * 2012-08-31 2016-10-04 Google Inc. Prediction of media selection consumption using analysis of user behavior
KR20160115515A (ko) * 2015-03-27 2016-10-06 금오공과대학교 산학협력단 모바일 기반 라이프로그를 이용한 사용자 행동 예측 시스템 및 방법
CN106503562A (zh) * 2015-09-06 2017-03-15 阿里巴巴集团控股有限公司 一种风险识别方法及装置
CN107369052A (zh) * 2017-08-29 2017-11-21 北京小度信息科技有限公司 用户注册行为预测方法、装置及电子设备
CN108121997A (zh) * 2016-11-29 2018-06-05 Sap欧洲公司 使用机器学习模型的图像数据中的对象分类
CN108388924A (zh) * 2018-03-08 2018-08-10 平安科技(深圳)有限公司 一种数据分类方法、装置、设备及计算机可读存储介质
CN108876436A (zh) * 2018-05-25 2018-11-23 广东工业大学 一种基于集成模型的电商优惠券使用概率预测方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130304676A1 (en) * 2012-05-14 2013-11-14 Qualcomm Incorporated On-device real-time behavior analyzer
US9462313B1 (en) * 2012-08-31 2016-10-04 Google Inc. Prediction of media selection consumption using analysis of user behavior
US20160110653A1 (en) * 2014-10-20 2016-04-21 Xerox Corporation Method and apparatus for predicting a service call for digital printing equipment from a customer
KR20160115515A (ko) * 2015-03-27 2016-10-06 금오공과대학교 산학협력단 모바일 기반 라이프로그를 이용한 사용자 행동 예측 시스템 및 방법
CN106503562A (zh) * 2015-09-06 2017-03-15 阿里巴巴集团控股有限公司 一种风险识别方法及装置
CN108121997A (zh) * 2016-11-29 2018-06-05 Sap欧洲公司 使用机器学习模型的图像数据中的对象分类
CN107369052A (zh) * 2017-08-29 2017-11-21 北京小度信息科技有限公司 用户注册行为预测方法、装置及电子设备
CN108388924A (zh) * 2018-03-08 2018-08-10 平安科技(深圳)有限公司 一种数据分类方法、装置、设备及计算机可读存储介质
CN108876436A (zh) * 2018-05-25 2018-11-23 广东工业大学 一种基于集成模型的电商优惠券使用概率预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
REFINITIV创新实验室ARGO: "预测概率的逻辑回归算法", Retrieved from the Internet <URL:https://blog.csdn.net/IamThinker2011/ar https://blog.csdn.net/IamThinker2011/article/details/83096449> *
毛躍霖: "汽车服务企业客户流失预测模型的分析与应用", 《汽车服务企业客户流失预测模型的分析与应用 经济与管理科学辑》, no. 07, pages 150 - 308 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111860494A (zh) * 2020-06-16 2020-10-30 北京航空航天大学 图像目标检测的优化方法、装置、电子设备和存储介质
CN111860494B (zh) * 2020-06-16 2023-07-07 北京航空航天大学 图像目标检测的优化方法、装置、电子设备和存储介质
CN114169906A (zh) * 2020-09-11 2022-03-11 腾讯科技(深圳)有限公司 电子券推送方法、装置
CN114169906B (zh) * 2020-09-11 2024-03-22 腾讯科技(深圳)有限公司 电子券推送方法、装置
CN112270348A (zh) * 2020-10-21 2021-01-26 中国银联股份有限公司 用户激活方法、模型训练方法、装置、设备及存储介质
CN113129080A (zh) * 2021-05-13 2021-07-16 北京大米科技有限公司 一种数据处理方法及装置
CN113420165A (zh) * 2021-06-11 2021-09-21 北京达佳互联信息技术有限公司 二分类模型的训练、多媒体数据的分类方法及装置
CN113420165B (zh) * 2021-06-11 2024-03-05 北京达佳互联信息技术有限公司 二分类模型的训练、多媒体数据的分类方法及装置
CN116737697A (zh) * 2023-08-10 2023-09-12 云筑信息科技(成都)有限公司 建筑行业物料主数据管理方法、装置及电子设备
CN116737697B (zh) * 2023-08-10 2023-10-20 云筑信息科技(成都)有限公司 建筑行业物料主数据管理方法、装置及电子设备

Also Published As

Publication number Publication date
CN111275470B (zh) 2023-12-01

Similar Documents

Publication Publication Date Title
CN111275470B (zh) 服务发起概率预测方法及其模型的训练方法和装置
TWI676783B (zh) 用於預估到達時間之方法及系統
EP3635675A1 (en) Systems and methods for allocating orders
CN112819576B (zh) 充电站推荐模型的训练方法、装置、及充电站的推荐方法
CN111310055A (zh) 一种信息推荐方法、装置、电子设备及存储介质
US20190147468A1 (en) Location evaluation
CN106530010A (zh) 融合时间因素的协同过滤方法和装置
CN111858873A (zh) 一种推荐内容的确定方法、装置、电子设备及存储介质
CN111582539A (zh) 配送时长获取、配送时长预测模型生成的方法、装置
CN112948951A (zh) 建筑模型创建方法与装置、处理服务器
CN111859172B (zh) 信息推送方法、装置、电子设备和计算机可读存储介质
CN111143555A (zh) 基于大数据的客户画像生成方法、装置、设备及存储介质
CN110288296A (zh) 识别配送方适合混合送模式的方法及装置
CN112037775A (zh) 语音识别方法、装置、设备及存储介质
CN110674208B (zh) 用于确定用户的职住地信息的方法和装置
CN108563786B (zh) 文本分类和展示方法、装置、计算机设备及存储介质
WO2018024222A1 (zh) 应用推荐方法、装置及服务器
CN112767032A (zh) 一种信息处理方法、装置、电子设备及存储介质
TW201842474A (zh) 活動推薦系統和方法
CN111401388A (zh) 数据挖掘方法、装置、服务器及可读存储介质
CN107077475A (zh) 根据产品/用户标签和共安装图推荐产品捆绑包的系统和方法
CN111274471A (zh) 信息推送方法、装置、服务器及可读存储介质
CN111353797A (zh) 资源分配方法、装置以及电子设备
CN111612183A (zh) 信息处理方法、装置、电子设备及计算机可读存储介质
CN111242711A (zh) 信息提示方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant