CN112600756A - 业务数据的处理方法及装置 - Google Patents

业务数据的处理方法及装置 Download PDF

Info

Publication number
CN112600756A
CN112600756A CN202010921560.6A CN202010921560A CN112600756A CN 112600756 A CN112600756 A CN 112600756A CN 202010921560 A CN202010921560 A CN 202010921560A CN 112600756 A CN112600756 A CN 112600756A
Authority
CN
China
Prior art keywords
sub
crowd
feature
user
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010921560.6A
Other languages
English (en)
Other versions
CN112600756B (zh
Inventor
陈云禾
姜瑞欣
毛丹琪
彭赋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JD Digital Technology Holdings Co Ltd
Original Assignee
JD Digital Technology Holdings Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JD Digital Technology Holdings Co Ltd filed Critical JD Digital Technology Holdings Co Ltd
Priority to CN202010921560.6A priority Critical patent/CN112600756B/zh
Publication of CN112600756A publication Critical patent/CN112600756A/zh
Application granted granted Critical
Publication of CN112600756B publication Critical patent/CN112600756B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/24Traffic characterised by specific attributes, e.g. priority or QoS
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/29Flow control; Congestion control using a combination of thresholds

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例提供一种业务数据的处理方法及装置,该方法包括:对用户人群的特征集合中的特征进行离散化处理,获取多个特征子集;根据多个特征子集,将用户人群划分为多个子人群;分别计算每个子人群在业务的多个第一数据值下的目标指标的增量;根据每个子人群在业务的多个第一数据值下的目标指标的增量,对多个子人群的第一数据值进行优化;向终端设备发送使用终端设备的用户所属的子人群的优化后的第一数据值。与现有技术相比,本申请通过先将用户人群的特征集合划分为特征子集,再根据特征子集对将用户人群划分为多个子人群,使得具有相同特征的用户可以划分至同一子人群中,进而提高了人群划分的准确率。

Description

业务数据的处理方法及装置
技术领域
本发明涉及信息技术领域,尤其涉及一种业务数据的处理方法及装置。
背景技术
随着流量红利的消退,运营人员越来越重视由精细化运营带来的额外业 务增量。对用户人群进行细分以及对不同类型的用户人群配置最适合的利益 点等业务数据的处理,是常见的精细化运营方式,可以提高各项业务的人群 的转化率。
现有的业务数据的处理方法,首先通过业务理解或者数据驱动方法,将 用户人群划分为不同的子人群,随后,再测试各个子人群的多种利益点。最 后,根据各个子人群的对于每个利益点的实际转化率,对各个子人群的利益 点进行优化。其中,数据驱动方法包括有卡方检验、皮尔森相关系数和决策 树的基尼系数等方法。
然而,现有的技术中通过业务理解或者数据驱动方法对人群进行的划分, 往往与实际业务中用户所属的人群不一致,进而导致人群划分的准确率较低。
发明内容
本申请实施例提供一种业务数据的处理方法及装置,以解决现有技术中 人群划分的准确率较低的问题。
第一方面,本申请实施例提供一种业务数据的处理方法,所述方法包括:
对用户人群的特征集合中的特征进行离散化处理,获取多个特征子集;
根据所述多个特征子集,将所述用户人群划分为多个子人群,属于同一 子人群的用户具有相同的特征;
分别计算每个子人群在业务的多个第一数据值下的目标指标的增量;
根据所述每个子人群在业务的多个第一数据值下的目标指标的增量,对 所述多个子人群的第一数据值进行优化;
向终端设备发送使用所述终端设备的用户所属的子人群的优化后的第一 数据值,所述优化后的第一数据值用于辅助所述终端设备执行针对所述业务 的付款操作。
一种可选的实施方式中,所述对用户人群的特征集合中的特征进行离散 化处理,获取多个特征子集,包括:
根据离散化阈值,对所述用户人群的特征集合中的特征进行离散化处理, 获取多个特征子集。
一种可选的实施方式中,在所述根据离散化阈值,对所述用户人群的特 征集合中的特征进行离散化处理,获取多个特征子集之前,所述方法还包括:
通过百分位数遍历算法,对所述特征集合中每个特征进行处理,确定所 述离散化阈值。
一种可选的实施方式中,所述根据所述多个特征子集,将所述用户人群 划分为多个子人群,包括:
根据预设的特征个数,对所述多个特征子集中的特征进行交叉选取,组 成多个可用特征组合;
根据所述多个可用特征组合,将所述用户人群划分为多个子人群。
一种可选的实施方式中,所述对所述多个子人群的第一数据值进行优化, 包括:
根据所述业务的总成本数据或人均成本数据,对所述多个子人群的第一 数据值进行优化。
一种可选的实施方式中,在所述对用户人群的特征集合中的特征进行离 散化处理,获取多个特征子集之前,所述方法还包括:
根据目标特征属性,对用户人群的特征库中的特征进行筛选,确定所述 用户人群的特征集合。
一种可选的实施方式中,在所述确定所述用户人群的特征集合之前,所 述方法还包括:
接收终端设备发送的用户数据;
对所述用户数据进行特征提取,并将提取到的特征存入所述用户人群的 特征库中。
一种可选的实施方式中,在分别计算每个子人群在业务的多个第一数据 值下的目标指标的增量之前,所述方法还包括:
接收管理设备发送的指示信息,所述指示信息用于指示所述目标指标。
一种可选的实施方式中,所述目标特征属性包括以下至少一项:单一特 征的稳定性、特征的覆盖度及不同特征之间的相关性。
第二方面,本申请实施例提供一种业务数据的处理装置,所述装置包括:
处理模块,用于对用户人群的特征集合中的特征进行离散化处理,获取 多个特征子集;根据所述多个特征子集,将所述用户人群划分为多个子人群, 属于同一子人群的用户具有相同的特征;分别计算每个子人群在业务的多个 第一数据值下的目标指标的增量;根据所述每个子人群在业务的多个第一数 据值下的目标指标的增量,对所述多个子人群的第一数据值进行优化;
发送模块,用于向终端设备发送使用所述终端设备的用户所属的子人群 的优化后的第一数据值,所述优化后的第一数据值用于辅助所述终端设备执 行针对所述业务的付款操作。
一种可选的实施方式中,所述处理模块,具体用于根据离散化阈值,对 所述用户人群的特征集合中的特征进行离散化处理,获取多个特征子集。
一种可选的实施方式中,所述处理模块,还用于通过百分位数遍历算法, 对所述特征集合中每个特征进行处理,确定所述离散化阈值。
一种可选的实施方式中,所述处理模块,具体用于根据预设的特征个数, 对所述多个特征子集中的特征进行交叉选取,组成多个可用特征组合;根据 所述多个可用特征组合,将所述用户人群划分为多个子人群。
一种可选的实施方式中,所述处理模块,具体用于根据所述业务的总成 本数据或人均成本数据,对所述多个子人群的第一数据值进行优化。
一种可选的实施方式中,所述处理模块,还用于根据目标特征属性,对 用户人群的特征库中的特征进行筛选,确定所述用户人群的特征集合。
一种可选的实施方式中,所述装置还包括接收模块,用于接收终端设备 发送的用户数据;
所述处理模块,还用于对所述用户数据进行特征提取,并将提取到的特 征存入所述用户人群的特征库中。
一种可选的实施方式中,所述接收模块,还用于接收管理设备发送的指 示信息,所述指示信息用于指示所述目标指标。
一种可选的实施方式中,所述目标特征属性包括以下至少一项:单一特 征的稳定性、特征的覆盖度及不同特征之间的相关性。
第三方面,本申请还提供一种电子设备,包括:
处理器;以及
存储器,用于存储所述处理器的计算机程序;
其中,所述处理器被配置为通过执行所述计算机程序来实现第一方面中 任意一种可能的方法。
第四方面,本发明还提供一种存储有计算机指令的非瞬时计算机可读 存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现 第一方面中任意一种可能的方法。
本申请实施例提供的业务数据的处理方法及装置,通过对用户人群的 特征集合中的特征进行离散化处理,获取多个特征子集;根据多个特征子 集,将用户人群划分为多个子人群,属于同一子人群的用户具有相同的特 征;分别计算每个子人群在业务的多个第一数据值下的目标指标的增量; 根据每个子人群在业务的多个第一数据值下的目标指标的增量,对多个子 人群的第一数据值进行优化;向终端设备发送使用终端设备的用户所属的 子人群的优化后的第一数据值,优化后的第一数据值用于辅助终端设备执 行针对业务的付款操作。与现有技术相比,本申请通过先将用户人群的特 征集合划分为特征子集,再根据特征子集对将用户人群划分为多个子人群, 使得具有相同特征的用户可以划分至同一子人群中,进而提高了人群划分 的准确率。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或 现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述 中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出 创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种业务数据的处理方法的应用场景示意 图;
图2为本申请实施例提供的一种业务数据的处理方法的流程示意图;
图3为本申请实施例提供的另一种业务数据的处理方法的流程示意图;
图4为本申请实施例提供的再一种业务数据的处理方法的流程示意图;
图5为本申请实施例提供的又一种业务数据的处理方法的流程示意图;
图6为本申请实施例提供的一种业务数据的处理装置的结构示意图;
图7为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申 请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述, 显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于 本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获 得的所有其他实施例,都属于本申请保护的范围。
现有的业务数据的处理方法,首先通过业务理解或者数据驱动方法,将 用户人群划分为不同的子人群,随后,再测试各个子人群的多种第一数据值。 最后,根据各个子人群的对于每个第一数据值的实际转化率,对各个子人群 的第一数据值进行优化。其中,数据驱动方法包括有卡方检验、皮尔森相关 系数和决策树的基尼系数等方法。
然而,现有的技术中通过业务理解或者数据驱动方法对人群进行的划分, 往往与实际业务中用户所属的人群不一致,进而导致人群划分的准确率较低。
为解决上述问题,本申请提供了一种业务数据的处理方法及装置,以提 高人群划分的准确率。在本申请中,将用户人群的特征集合中的特征划分为 多个特征子集,再基于不同特征子集对用户人群进行划分,可以提高人群划 分的准确率,使其符合实际的业务增量,进而可以提高业务数据的优化结果。
下面对本申请的应用场景进行说明。
图1为本申请实施例提供的一种业务数据的处理方法的应用场景示意图。 如图1所示,服务器101将使用终端设备102、终端设备103、终端设备104 和终端设备105的用户划分为不同的子人群,并为不同的子人群配置对应的 第一数据值。随后,服务器101分别向终端设备102、终端设备103、终端设 备104和终端设备105发送对应的第一数据值,终端设备102、终端设备103、 终端设备104和终端设备105在接收到服务器101发送的第一数据值后,可 以使用第一数据值进行付款操作。
其中,第一数据值可以为利益点,示例性的,可以为优惠券等,在进行 付款操作时,终端设备可以采用接收到的优惠券抵扣部分付款金额。
上述终端设备可以是手机(mobile phone)、平板电脑(pad)、带无线收 发功能的电脑、虚拟现实(virtual reality,VR)终端设备、增强现实(augmented reality,AR)终端设备、工业控制(industrial control)中的无线终端、远程 手术(remote medicalsurgery)中的无线终端、智能电网(smart grid)中的无 线终端、智慧家庭(smart home)中的无线终端等。本申请实施例中,用于实 现终端的功能的装置可以是终端设备,也可以是能够支持终端实现该功能的 装置,例如芯片系统,该装置可以被安装在终端设备中。本申请实施例中, 芯片系统可以由芯片构成,也可以包括芯片和其他分立器件。
上述服务可以是但不限于单个网络服务器、多个网络服务器组成的服务 器组或基于云计算的由大量计算机或网络服务器构成的云。其中,云计算是 分布式计算的一种,由一群松散耦合的计算机组成的一个超级虚拟计算机。
需要说明的是,本申请技术方案的应用场景可以是图1中的优惠支付场 景,但不限于此,还可以应用于其他需要进行业务数据处理的场景。
可以理解,上述业务数据的处理方法可以通过本申请实施例提供的业务 数据的处理装置实现,业务数据的处理装置可以是某个设备的部分或全部, 例如为上述服务器或服务器的芯片。
下面以集成或安装有相关执行代码的服务器为例,以具体地实施例对本 申请实施例的技术方案进行详细说明。下面这几个具体的实施例可以相互结 合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图2为本申请实施例提供的一种业务数据的处理方法的流程示意图,本 实施例涉及的是如何服务器如何确定业务的多个第一数据值下的目标指标的 增量的过程。如图2所示,该方法包括:
S201、对用户人群的特征集合中的特征进行离散化处理,获取多个特征 子集。
本申请中,若需要对业务数据进行处理,可以首先获取该业务对应的用 户人群的特征集合,再对用户人群的特征集合中的特征进行离散化处理,将 用户人群的特征集合划分为多个特征子集。
其中,特征可以包括交易偏好、用户年龄、付款方式等,本申请实施例 对于特征的类型不做限制,可以根据实际情况具体设置。
本申请实施例对于如何对特征集合中的特征进行离散化处理不做限制。 一种可选的实施方式中,可以根据离散化阈值,对用户人群的特征集合中的 特征进行离散化处理,获取多个特征子集。上述离散化阈值可以通过百分位 数遍历算法,对特征集合中每个特征进行处理后确定的。
示例性的,若对于具有强业务逻辑的特征集合中的特征,可以选用实际 业务中可解释性较强的离散化阈值。具体的,可以通过百分位数遍历的方法, 对特征集合中每一特征在不同分位数处切分后得到的各个子人群对应的目标 指标的增量进行对比,再将最大增量对应的阈值作为离散化阈值。
此外,本申请实施例对于如何确定用户人群的特征集合也不做限制,在 一些实施例中,服务器可以接收终端设备发送的用户数据,并对用户数据进 行特征提取,将提取到的特征存入用户人群的特征库中。随后,服务器根据 目标特征属性,对用户人群的特征库中的特征进行筛选,确定用户人群的特 征集合。
其中,目标特征属性包括以下至少一项:单一特征的稳定性、特征的覆 盖度及不同特征之间的相关性。
S202、根据多个特征子集,将用户人群划分为多个子人群,属于同一子 人群的用户具有相同的特征。
在本步骤中,在服务器对用户人群的特征集合中的特征进行离散化处理, 获取多个特征子集之后,还可以根据多个特征子集,将用户人群划分为多个 子人群。
在一些实施例中,服务器可以根据预设的特征个数,对多个特征子集中 的特征进行交叉选取,组成多个可用特征组合。随后,再根据多个可用特征 组合,将用户人群划分为多个子人群。
本申请对于特征个数不做限制,可以根据实际情况选择最优的特征个数, 该最优的特征个数可以通过系统默认值或用户手动设定来确定。
示例性的,若特征个数为2,则服务器每次随机从两个特征子集交叉选 取特征,组合成一个特征组合。随后,基于所有可组成的所有特征组合,将 用户人群划分为多个子人群。
S203、分别计算每个子人群在业务的多个第一数据值下的目标指标的增 量。
在本步骤中,当服务器将用户人群划分为多个子人群后,可以分别计算 每个子人群在业务的多个第一数据值下的目标指标的增量。
其中,第一数据值可以为用户的的利益点,示例性的,可例如优惠券等, 目标指标可例如下单人数、交易金额等。
本申请实施例对于如何计算每个子人群在业务的多个第一数据值下的目 标指标的增量不做限制,示例的,可以采用公式(1)和公式(2)计算每个 子人群在业务的多个第一数据值下的目标指标的增量。公式(1)和公式(2) 如下所示:
Figure BDA0002666908510000081
Figure BDA0002666908510000082
其中,δA为子人群A的目标指标的增量,σA为子人群A的成本增量,
Figure BDA0002666908510000083
为子人群A的测试组的子人群数量,
Figure BDA0002666908510000084
为子人群A的控制组的子人群数 量,
Figure BDA0002666908510000085
为子人群A的测试组的目标转换率,
Figure BDA0002666908510000086
为子人群A的控制组的目 标转换率,
Figure BDA0002666908510000087
为子人群A的测试组的总成本,
Figure BDA0002666908510000088
为子人群A的控制组的 总成本。
需要说明的是,本申请实施例对于如何目标指标不作限制,在一些实施 例中,管理设备可以主动向服务器发送指示信息,该指示信息用于指示目标 指标,服务器在接收管理设备发送的指示信息,可以根据指示信息指示确定 目标指标。
S204、根据每个子人群在业务的多个第一数据值下的目标指标的增量, 对多个子人群的第一数据值进行优化。
在本步骤中,当服务器计算出每个子人群在业务的多个第一数据值下的 目标指标的增量后,可以根据每个子人群在业务的多个第一数据值下的目标 指标的增量,对多个子人群的第一数据值进行优化。
本申请实施例如何对多个子人群的第一数据值进行优化不作限制,在一 种可选的实施方式中,可以在不同的限制条件下,将多个第一数据值下的目 标指标的增量输入线性规划模型中,从而获取线性规划模型输出的优化数据。 其中,限制条件可以包括业务的总成本数据或人均成本数据。需要说明的是, 本申请实施例对于线性规划模型不作限制,可以根据实际情况具体设置。
S205、向终端设备发送使用终端设备的用户所属的子人群的优化后的第 一数据值,优化后的第一数据值用于辅助终端设备执行针对业务的付款操作。
在本步骤中,当服务器对多个子人群的第一数据值进行优化后,可以向 终端设备发送使用终端设备的用户所属的子人群的优化后的第一数据值,从 而使得终端设备根据优化后的第一数据值进行付款操作。
其中,第一数据值可例如优惠券,终端设备在接收到优化后的第一数据 值后,可以基于使用该终端设备的用户所在的子群体自动匹配合适的优惠券, 并在付款时自动使用优惠券。
本申请实施例提供的业务数据的处理方法,通过对用户人群的特征集 合中的特征进行离散化处理,获取多个特征子集;根据多个特征子集,将 用户人群划分为多个子人群,属于同一子人群的用户具有相同的特征;分 别计算每个子人群在业务的多个第一数据值下的目标指标的增量;根据每 个子人群在业务的多个第一数据值下的目标指标的增量,对多个子人群的 第一数据值进行优化;向终端设备发送使用终端设备的用户所属的子人群 的优化后的第一数据值,优化后的第一数据值用于辅助终端设备执行针对 业务的付款操作。与现有技术相比,本申请通过先将用户人群的特征集合 划分为特征子集,再根据特征子集对将用户人群划分为多个子人群,使得 具有相同特征的用户可以划分至同一子人群中,进而提高了人群划分的准 确率。
此外,在本申请中,可以在当前成本约束条件下通过对不同人群分配 最优第一数据值,使其符合实际的业务最大增量,提高业务数据的优化结 果。
在上述实施例的基础上,下面对于如何生成用户人群的特征集合进行说 明。图3为本申请实施例提供的另一种业务数据的处理方法的流程示意图, 如图3所示,该方法包括:
S301、接收终端设备发送的用户数据。
在本申请中,终端设备可以实时收集用户使用上述业务是产生的用户数 据,并将用户数据上报给服务器,以供服务器对业务数据进行处理。
在一些实施实施例中,终端设备在上报业务数据前,还可以对业务数据 进行隐私处理,去除业务数据中的隐私信息,仅保留与业务相关的信息。
S302、对用户数据进行特征提取,并将提取到的特征存入用户人群的特 征库中。
在本步骤中,当服务器接收到终端设备发送的用户数据后,可以对用户 数据进行特征提取,并将提取到的特征存入用户人群的特征库中。
其中,特征可以包括交易偏好、用户年龄、付款方式等,本申请实施例 对于特征的类型不做限制,可以根据实际情况具体设置。
S303、根据目标特征属性,对用户人群的特征库中的特征进行筛选,确 定用户人群的特征集合。
其中,目标特征属性包括以下至少一项:单一特征的稳定性、特征的覆 盖度及不同特征之间的相关性。
示例性的,针对特征库中的特征的筛选,可以根据在当前目标所针对的 用户群体的表现,如单一特征的稳定性、特征的覆盖度及不同特征之间的相 关性等来进行,例如,可以通过单一特征的稳定性、特征的覆盖度及不同特 征之间的相关性,筛选出在当前目标人群不同时间周期内表现稳定且相关性 较低的特征作为用户人群的特征集合中的特征。
S304、对用户人群的特征集合中的特征进行离散化处理,获取多个特征 子集。
S305、根据多个特征子集,将用户人群划分为多个子人群,属于同一子 人群的用户具有相同的特征。
S306、分别计算每个子人群在业务的多个第一数据值下的目标指标的增 量。
S307、根据每个子人群在业务的多个第一数据值下的目标指标的增量, 对多个子人群的第一数据值进行优化。
S308、向终端设备发送使用终端设备的用户所属的子人群的优化后的第 一数据值,优化后的第一数据值用于辅助终端设备执行针对业务的付款操作。
S304-S308的技术名词、技术效果、技术特征,以及可选实施方式,可参 照图2所示的S201-S205理解,对于重复的内容,在此不再累述。
在本申请中,服务器先接收终端设备发送的用户数据,随后,对用户数 据进行特征提取,并将提取到的特征存入用户人群的特征库中。最后,服务 器根据目标特征属性,对用户人群的特征库中的特征进行筛选,确定用户人 群的特征集合。通过该方式,可以筛选出合适的用户人群的特征集合,为保 证最终优化的的稳定度和提升度。
在上述实施例的基础上,下面对于如何将用户人群划分为多个子人群进 行说明。图4为本申请实施例提供的再一种业务数据的处理方法的流程示意 图,如图4所示,该方法包括:
S401、通过百分位数遍历算法,对特征集合中每个特征进行处理,确定 离散化阈值。
示例性的,若对于具有强业务逻辑的特征集合中的特征,可以选用实际 业务中可解释性较强的离散化阈值。具体的,可以通过百分位数遍历的方法, 对特征集合中每一特征在不同分位数处切分后得到的各个子人群对应的目标 指标的增量进行对比,再将最大增量对应的阈值作为离散化阈值。
S402、根据离散化阈值,对用户人群的特征集合中的特征进行离散化处 理,获取多个特征子集。
S403、根据预设的特征个数,对多个特征子集中的特征进行交叉选取, 组成多个可用特征组合。
本申请对于特征个数不做限制,可以根据实际情况选择最优的特征个数, 该最优的特征个数可以通过系统默认值或用户手动设定来确定。
示例性的,若特征个数为2,则服务器每次随机从两个特征子集交叉选 取特征,组合成一个特征组合。随后,基于所有可组成的所有特征组合,将 用户人群划分为多个子人群。
S404、根据多个可用特征组合,将用户人群划分为多个子人群。
在本申请实施例中,一个特征组合可以对应于一个子人群,可以采用特 征组合中的特征将人群划分到对应的子人群中。
S405、分别计算每个子人群在业务的多个第一数据值下的目标指标的增 量。
S406、根据每个子人群在业务的多个第一数据值下的目标指标的增量, 对多个子人群的第一数据值进行优化。
S407、向终端设备发送使用终端设备的用户所属的子人群的优化后的第 一数据值,优化后的第一数据值用于辅助终端设备执行针对业务的付款操作。
S405-S407的技术名词、技术效果、技术特征,以及可选实施方式,可参 照图2所示的S203-S205理解,对于重复的内容,在此不再累述。
在上述实施例的基础上,下面对于如何对多个子人群的第一数据值进行 优化进行说明。图5为本申请实施例提供的又一种业务数据的处理方法的流 程示意图,如图5所示,该方法包括:
S501、对用户人群的特征集合中的特征进行离散化处理,获取多个特征 子集。
S502、根据多个特征子集,将用户人群划分为多个子人群,属于同一子 人群的用户具有相同的特征。
S503、分别计算每个子人群在业务的多个第一数据值下的目标指标的增 量。
S501-S503的技术名词、技术效果、技术特征,以及可选实施方式,可参 照图2所示的S201-S203理解,对于重复的内容,在此不再累述。
S504、根据业务的总成本数据或人均成本数据,对多个子人群的第一数 据值进行优化。
在本申请中,在确定每个子人群在业务的多个第一数据值下的目标指标 的增量后,可以基于不同的策略,对多个子人群的第一数据值进行优化。其 中,上述策略可以基于业务的总成本数据或人均成本数据。
下面两种优化第一数据值的方式分布进行说明。
第一种方式中,基于业务的总成本数据对多个子人群的第一数据值进行 优化。示例性的,上述第一数据值的优化可以采用线性规划模型的方式来进 行,其中,针对第i组子人群的第j个第一数据值,线性规划模型的输入包括 aij、bij、eij、xij、Dj、C。
其中,aij为组i在第j第一数据值下的增量下单人数, bij为组i在第j第一数据值下的下单人数, eij为组i在第j第一数据值下的用券率, xij为组i在第j第一数据值下的切量占比,Dj为第j第一数据值金额, C为总成本,i∈I,j∈J。
相应的,若目标指标为下单人数,则最大增量的下单人数可以如公式(3) 所示。
Figure BDA0002666908510000131
此时,可以采用如下限制条件,对多个子人群的第一数据值进行优化。 限制条件为:(1)
Figure BDA0002666908510000132
各组切量占比≥0。(2)
Figure BDA0002666908510000133
组i总切量占比≤1。(3)∑i,j∈I,Jbij*eij*xij*Dj≤ C,总成本≤C。
第二种方式中,基于人均成本数据对多个子人群的第一数据值进行优化。 示例性的,上述第一数据值的优化可以采用线性规划模型的方式来进行,其 中,针对第i组子人群的第j个第一数据值,线性规划模型的同样输入包括aij、 bij、eij、xij、Dj、C。相应的,若目标指标为下单人数,则最大增量的下单人 数同样可以如公式(3)所示。
此外,可以采用如下限制条件,对多个子人群的第一数据值进行优化。 限制条件为:(1)
Figure BDA0002666908510000134
各组切量占比≥0。(2)
Figure BDA0002666908510000135
组i总切量占比≤1。(3)
Figure BDA0002666908510000136
Figure BDA0002666908510000137
在本申请中,可以基于线性规划模型,解决营销手段千人千面的实际诉 求,从而以最大化增量或最小化成本为目的,在限定成本或给定增量的前提 下自动化完成策略全流程设计。
S505、向终端设备发送使用终端设备的用户所属的子人群的优化后的第 一数据值,优化后的第一数据值用于辅助终端设备执行针对业务的付款操作。
S505的技术名词、技术效果、技术特征,以及可选实施方式,可参照图 2所示的S205理解,对于重复的内容,在此不再累述。
本申请实施例提供的业务数据的处理方法,通过对用户人群的特征集合 中的特征进行离散化处理,获取多个特征子集;根据多个特征子集,将用户 人群划分为多个子人群,属于同一子人群的用户具有相同的特征;分别计算 每个子人群在业务的多个第一数据值下的目标指标的增量;根据每个子人群 在业务的多个第一数据值下的目标指标的增量,对多个子人群的第一数据值 进行优化;向终端设备发送使用终端设备的用户所属的子人群的优化后的第 一数据值,优化后的第一数据值用于辅助终端设备执行针对业务的付款操作。 与现有技术相比,本申请通过先将用户人群的特征集合划分为特征子集,再 根据特征子集对将用户人群划分为多个子人群,使得具有相同特征的用户可 以划分至同一子人群中,进而提高了人群划分的准确率。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤 可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读 取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述 的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介 质。
图6为本申请实施例提供的一种业务数据的处理装置的结构示意图。该 业务数据的处理装置可以通过软件、硬件或者两者的结合实现,可例如上述 实施例中的服务器或服务器的芯片,以执行上述实施例中的业务数据的处理 装置。如图6所示,该业务数据的处理装置600包括:
处理模块601,用于对用户人群的特征集合中的特征进行离散化处理, 获取多个特征子集;根据多个特征子集,将用户人群划分为多个子人群,属 于同一子人群的用户具有相同的特征;分别计算每个子人群在业务的多个第 一数据值下的目标指标的增量;根据每个子人群在业务的多个第一数据值下 的目标指标的增量,对多个子人群的第一数据值进行优化;
发送模块602,用于向终端设备发送使用终端设备的用户所属的子人群 的优化后的第一数据值,优化后的第一数据值用于辅助终端设备执行针对业 务的付款操作。
一种可选的实施方式中,处理模块601,具体用于根据离散化阈值,对 用户人群的特征集合中的特征进行离散化处理,获取多个特征子集。
一种可选的实施方式中,处理模块601,还用于通过百分位数遍历算法, 对特征集合中每个特征进行处理,确定离散化阈值。
一种可选的实施方式中,处理模块601,具体用于根据预设的特征个数, 对多个特征子集中的特征进行交叉选取,组成多个可用特征组合;根据多个 可用特征组合,将用户人群划分为多个子人群。
一种可选的实施方式中,处理模块601,具体用于根据业务的总成本数 据或人均成本数据,对多个子人群的第一数据值进行优化。
一种可选的实施方式中,处理模块601,还用于根据目标特征属性,对 用户人群的特征库中的特征进行筛选,确定用户人群的特征集合。
一种可选的实施方式中,装置还包括接收模块603,用于接收终端设备 发送的用户数据;
处理模块601,还用于对用户数据进行特征提取,并将提取到的特征存 入用户人群的特征库中。
一种可选的实施方式中,接收模块603,还用于接收管理设备发送的指 示信息,指示信息用于指示目标指标。
一种可选的实施方式中,目标特征属性包括以下至少一项:单一特征的 稳定性、特征的覆盖度及不同特征之间的相关性。
需要说明的,图6所示实施例提供的业务数据的处理装置,可用于执行 上述任意实施例所提供的方法,具体实现方式和技术效果类似,这里不再进 行赘述。
图7为本申请实施例提供的一种电子设备的结构示意图。如图7所示, 该电子设备可以包括:至少一个处理器701和存储器702。图7示出的是以 一个处理器为例的电子设备。
存储器702,用于存放程序。具体地,程序可以包括程序代码,程序代 码包括计算机操作指令。
存储器702可能包含高速RAM存储器,也可能还包括非易失性存储器 (non-volatile memory),例如至少一个磁盘存储器。
处理器701用于执行存储器702存储的计算机执行指令,以实现上述业 务数据的处理方法;
其中,处理器701可能是一个中央处理器(Central Processing Unit,简称 为CPU),或者是特定集成电路(Application Specific Integrated Circuit,简 称为ASIC),或者是被配置成实施本申请实施例的一个或多个集成电路。
可选的,在具体实现上,如果通信接口、存储器702和处理器701独立 实现,则通信接口、存储器702和处理器701可以通过总线相互连接并完成 相互间的通信。总线可以是工业标准体系结构(Industry Standard Architecture, 简称为ISA)总线、外部设备互连(Peripheral Component,简称为PCI)总线 或扩展工业标准体系结构(Extended IndustryStandard Architecture,简称为 EISA)总线等。总线可以分为地址总线、数据总线、控制总线等,但并不表 示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果通信接口、存储器702和处理器701集成 在一块芯片上实现,则通信接口、存储器702和处理器701可以通过内部接 口完成通信。
本申请实施例还提供了一种芯片,包括处理器和接口。其中接口用于输 入输出处理器所处理的数据或指令。处理器用于执行以上方法实施例中提供 的方法。该芯片可以应用于业务数据的处理装置中。
本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以 包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存 取存储器(RAM,RandomAccess Memory)、磁盘或者光盘等各种可以存储 程序代码的介质,具体的,该计算机可读存储介质中存储有程序信息,程序 信息用于上述业务数据的处理方法。
本申请实施例还提供一种程序,该程序在被处理器执行时用于执行以上 方法实施例提供的业务数据的处理方法。
本申请实施例还提供一种程序产品,例如计算机可读存储介质,该程序 产品中存储有指令,当其在计算机上运行时,使得计算机执行上述方法实施 例提供的业务数据的处理方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意 组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形 式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执 行计算机程序指令时,全部或部分地产生按照本发明实施例的流程或功能。 计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。 计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储 介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用 户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、 计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能 够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据 中心等数据存储设备。可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、 光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD)) 等。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对 其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通 技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改, 或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并 不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种业务数据的处理方法,其特征在于,所述方法包括:
对用户人群的特征集合中的特征进行离散化处理,获取多个特征子集;
根据所述多个特征子集,将所述用户人群划分为多个子人群,属于同一子人群的用户具有相同的特征;
分别计算每个子人群在业务的多个第一数据值下的目标指标的增量;
根据所述每个子人群在业务的多个第一数据值下的目标指标的增量,对所述多个子人群的第一数据值进行优化;
向终端设备发送使用所述终端设备的用户所属的子人群的优化后的第一数据值,所述优化后的第一数据值用于辅助所述终端设备执行针对所述业务的付款操作。
2.根据权利要求1所述的方法,其特征在于,所述对用户人群的特征集合中的特征进行离散化处理,获取多个特征子集,包括:
根据离散化阈值,对所述用户人群的特征集合中的特征进行离散化处理,获取多个特征子集。
3.根据权利要求2所述的方法,其特征在于,在所述根据离散化阈值,对所述用户人群的特征集合中的特征进行离散化处理,获取多个特征子集之前,所述方法还包括:
通过百分位数遍历算法,对所述特征集合中每个特征进行处理,确定所述离散化阈值。
4.根据权利要求1所述的方法,其特征在于,所述根据所述多个特征子集,将所述用户人群划分为多个子人群,包括:
根据预设的特征个数,对所述多个特征子集中的特征进行交叉选取,组成多个可用特征组合;
根据所述多个可用特征组合,将所述用户人群划分为多个子人群。
5.根据权利要求1所述的方法,其特征在于,所述对所述多个子人群的第一数据值进行优化,包括:
根据所述业务的总成本数据或人均成本数据,对所述多个子人群的第一数据值进行优化。
6.根据权利要求1所述的方法,其特征在于,在所述对用户人群的特征集合中的特征进行离散化处理,获取多个特征子集之前,所述方法还包括:
根据目标特征属性,对用户人群的特征库中的特征进行筛选,确定所述用户人群的特征集合。
7.根据权利要求6所述的方法,其特征在于,在所述确定所述用户人群的特征集合之前,所述方法还包括:
接收终端设备发送的用户数据;
对所述用户数据进行特征提取,并将提取到的特征存入所述用户人群的特征库中。
8.根据权利要求6所述的方法,其特征在于,在分别计算每个子人群在业务的多个第一数据值下的目标指标的增量之前,所述方法还包括:
接收管理设备发送的指示信息,所述指示信息用于指示所述目标指标。
9.根据权利要求6-8任一项所述的方法,其特征在于,所述目标特征属性包括以下至少一项:单一特征的稳定性、特征的覆盖度及不同特征之间的相关性。
10.一种业务数据的处理装置,其特征在于,所述装置包括:
处理模块,用于对用户人群的特征集合中的特征进行离散化处理,获取多个特征子集;根据所述多个特征子集,将所述用户人群划分为多个子人群,属于同一子人群的用户具有相同的特征;分别计算每个子人群在业务的多个第一数据值下的目标指标的增量;根据所述每个子人群在业务的多个第一数据值下的目标指标的增量,对所述多个子人群的第一数据值进行优化;
发送模块,用于向终端设备发送使用所述终端设备的用户所属的子人群的优化后的第一数据值,所述优化后的第一数据值用于辅助所述终端设备执行针对所述业务的付款操作。
CN202010921560.6A 2020-09-04 2020-09-04 业务数据的处理方法及装置 Active CN112600756B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010921560.6A CN112600756B (zh) 2020-09-04 2020-09-04 业务数据的处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010921560.6A CN112600756B (zh) 2020-09-04 2020-09-04 业务数据的处理方法及装置

Publications (2)

Publication Number Publication Date
CN112600756A true CN112600756A (zh) 2021-04-02
CN112600756B CN112600756B (zh) 2023-08-04

Family

ID=75180118

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010921560.6A Active CN112600756B (zh) 2020-09-04 2020-09-04 业务数据的处理方法及装置

Country Status (1)

Country Link
CN (1) CN112600756B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160225006A1 (en) * 2015-01-30 2016-08-04 Fujitsu Limited Utilization of coupons in residential demand response
US20180012246A1 (en) * 2016-07-08 2018-01-11 Ali Kamarei Method of Selectively Displaying Electronic Coupons In Real Time Depending On Market Conditions
CN110070399A (zh) * 2019-04-24 2019-07-30 北京三快在线科技有限公司 一种优惠券推送方法及装置
CN110390548A (zh) * 2018-04-20 2019-10-29 北京嘀嘀无限科技发展有限公司 优惠券派发策略的选择方法及装置
CN110634010A (zh) * 2018-06-25 2019-12-31 北京嘀嘀无限科技发展有限公司 一种确定优惠券发放策略的方法及装置
CN111598597A (zh) * 2019-02-21 2020-08-28 北京京东尚科信息技术有限公司 用于发送信息的方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160225006A1 (en) * 2015-01-30 2016-08-04 Fujitsu Limited Utilization of coupons in residential demand response
US20180012246A1 (en) * 2016-07-08 2018-01-11 Ali Kamarei Method of Selectively Displaying Electronic Coupons In Real Time Depending On Market Conditions
CN110390548A (zh) * 2018-04-20 2019-10-29 北京嘀嘀无限科技发展有限公司 优惠券派发策略的选择方法及装置
CN110634010A (zh) * 2018-06-25 2019-12-31 北京嘀嘀无限科技发展有限公司 一种确定优惠券发放策略的方法及装置
CN111598597A (zh) * 2019-02-21 2020-08-28 北京京东尚科信息技术有限公司 用于发送信息的方法和装置
CN110070399A (zh) * 2019-04-24 2019-07-30 北京三快在线科技有限公司 一种优惠券推送方法及装置

Also Published As

Publication number Publication date
CN112600756B (zh) 2023-08-04

Similar Documents

Publication Publication Date Title
CN108833458B (zh) 一种应用推荐方法、装置、介质及设备
CN109787960B (zh) 异常流量数据识别方法、装置、介质及电子设备
CN105744005A (zh) 客户定位分析方法及服务器
CN103150696A (zh) 选择目标增值业务潜在客户的方法及装置
CN111596924B (zh) 一种微服务划分方法和装置
CN110689084B (zh) 一种异常用户识别方法及装置
CN108805174A (zh) 聚类方法及装置
CN111652661B (zh) 一种手机客户端用户流失预警处理方法
CN112764920A (zh) 一种边缘应用部署方法、装置、设备和存储介质
CN111598360A (zh) 服务策略确定方法、装置及电子设备
CN113051183A (zh) 一种测试数据的推荐方法、系统、电子设备及存储介质
CN109165947B (zh) 账户信息确定方法、装置及服务器
CN112990769A (zh) 业务处理方法、装置、电子设备和存储介质
CN108961071B (zh) 自动预测组合业务收益的方法及终端设备
CN112600756A (zh) 业务数据的处理方法及装置
CN114968933A (zh) 数据中心的日志的分类方法和装置
CN114021642A (zh) 数据处理方法、装置、电子设备和存储介质
CN114925275A (zh) 产品推荐方法、装置、计算机设备及存储介质
CN113656046A (zh) 一种应用部署方法和装置
CN113705184A (zh) 自定义报表的生成方法及装置、存储介质、电子设备
CN111210109A (zh) 基于关联用户预测用户风险的方法、装置和电子设备
CN112734352A (zh) 一种基于数据维度的单据审核方法和装置
CN113194039B (zh) 系统数据流量的切分方法和装置、电子设备和存储介质
CN110895564A (zh) 一种潜在客户数据处理方法和装置
CN109344185A (zh) 一种数据获取方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: Room 221, 2 / F, block C, 18 Kechuang 11th Street, Daxing District, Beijing, 100176

Applicant after: Jingdong Technology Holding Co.,Ltd.

Address before: Room 221, 2 / F, block C, 18 Kechuang 11th Street, Beijing Economic and Technological Development Zone, 100176

Applicant before: Jingdong Digital Technology Holding Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant