CN112580902A - 对象数据处理方法、装置、计算机设备和存储介质 - Google Patents

对象数据处理方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN112580902A
CN112580902A CN202110217636.1A CN202110217636A CN112580902A CN 112580902 A CN112580902 A CN 112580902A CN 202110217636 A CN202110217636 A CN 202110217636A CN 112580902 A CN112580902 A CN 112580902A
Authority
CN
China
Prior art keywords
dimension
strategy
portrait
behavior data
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110217636.1A
Other languages
English (en)
Other versions
CN112580902B (zh
Inventor
郑森烈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202110217636.1A priority Critical patent/CN112580902B/zh
Publication of CN112580902A publication Critical patent/CN112580902A/zh
Application granted granted Critical
Publication of CN112580902B publication Critical patent/CN112580902B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Medical Informatics (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种对象数据处理方法、装置、计算机设备和存储介质。该方法涉及机器学习领域的决策树模型,方法包括:根据与对象画像数据的各画像维度对应的对象行为数据中属于对样本对象实施目标策略的第一命中类别的占比,将与各画像维度对应的对象行为数据转换为对应目标策略的策略效果;将与各画像维度对应的策略效果输入决策树模型,以决策树模型中节点所表示的画像维度组合对应的策略效果最优化为目标,对决策树模型进行训练,得到群体划分决策树;基于从群体划分决策树的根节点到叶子节点所表示的各细分群体分别对应的策略效果,确定对应目标策略的较优细分群体。采用本方法能够提高从测试结果中挖掘细分群体策略结果的效率。

Description

对象数据处理方法、装置、计算机设备和存储介质
技术领域
本申请涉及计算机技术领域,特别是涉及一种对象数据处理方法、装置、计算机设备和存储介质。
背景技术
A/B测试是将被测试对象划分为A组和B组,对A组对象实施目标策略,对B组对象不实施目标策略,通过分析A组和B组的被测试对象的对象行为数据的差异,来确定对优化指标最有效的策略。
随着计算机技术和人工智能技术的发展,A/B测试有了广泛的应用。比如,在互联网产品优化场景下,通过A/B测试的测试结果来确定是否上线优化策略。在互联网产品上线初期,优化策略往往能够获得整体被测试对象的认可,即A/B测试的测试结果呈现明显的倾向,而随着互联网产品的不断优化,后续的优化策略往往只能获得部分被测试对象的认可,即A/B测试的测试结果不能呈现明显的倾向,此时需要从更细粒度的层面分析测试结果,通常是将被测试对象划分为不同的细分群体,从测试结果中挖掘各细分群体对应的测试结果,以获得测试效果好的细分群体。
然而,目前的细粒度分析方式,是对被测试对象的不同画像维度的不同属性进行组合,从而将被测试对象划分为不同的细分群体。画像维度比如包括城市、年龄和性别等,城市的属性值比如包括北京、上海、深圳、广州等,年龄的属性值比如1-100岁,性别的属性值包括男性和女性,由于画像维度众多、画像维度的属性值众多等因素,对不同的属性值进行组合,常常会遭遇组合爆炸的问题,导致计算性能瓶颈,进而导致从测试结果中挖掘细分群体测试结果的效率低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提升从测试结果中挖掘细分群体测试结果的效率的对象数据处理方法、装置、计算机设备和存储介质。
一种对象数据处理方法,该方法包括:
获取各样本对象对应的对象画像数据、对象行为数据以及对应目标策略的命中类别,命中类别包括对样本对象实施目标策略的第一命中类别和未对样本对象实施目标策略的第二命中类别中的一种;
根据与对象画像数据的各画像维度对应的对象行为数据中属于第一命中类别的占比,将与各画像维度对应的对象行为数据转换为对应目标策略的策略效果;
将与各画像维度对应的策略效果输入决策树模型,以决策树模型中节点所表示的画像维度组合对应的策略效果最优化为目标,对决策树模型进行训练,得到群体划分决策树;
基于从群体划分决策树的根节点到叶子节点所表示的各细分群体分别对应的策略效果,确定对应目标策略的较优细分群体。
在一个实施例中,该方法还包括:
对各样本对象对应的对象画像数据进行分类,得到各画像维度及属于各画像维度的维度属性;
对各样本对象对应的对象行为数据按维度属性进行归类,得到对应各维度属性的对象行为数据;
根据属于相同画像维度的维度属性所对应的对象行为数据,获得各画像维度对应的对象行为数据。
在一个实施例中,根据与对象画像数据的各画像维度对应的对象行为数据中属于第一命中类别的占比,将与各画像维度对应的对象行为数据转换为对应目标策略的策略效果,包括:
对于每个画像维度,确定画像维度所包括的维度属性;
对于每个维度属性,确定维度属性对应的对象行为数据中属于第一命中类别的占比,根据占比将维度属性对应的对象行为数据转换为维度属性对应的策略效果;
根据画像维度包括的所有维度属性各自对应的策略效果,计算画像维度对应目标策略的策略效果。
在一个实施例中,根据占比将维度属性对应的对象行为数据转换为维度属性对应的策略效果,包括:
根据占比确定属于第一命中类别的对象行为数据的第一权重系数;
根据占比确定属于第二命中类别的对象行为数据的第二权重系数;
按第一权重系数,将维度属性对应的对象行为数据中属于第一命中类别的样本对象对应的对象行为数据,转换为样本对象对应的策略效果;
按第二权重系数,将维度属性对应的对象行为数据中属于第二命中类别的样本对象对应的对象行为数据,转换为样本对象对应的策略效果;
对维度属性对应的每个样本对象的策略效果求平均值,获得维度属性对应的策略效果。
在一个实施例中,属于第一命中类别的样本对象对应的策略效果通过以下公式计算得到:
Figure DEST_PATH_IMAGE001
其中,
Figure 838090DEST_PATH_IMAGE002
表示属于第一命中类别的第
Figure DEST_PATH_IMAGE003
个样本对象对应的策略效果;
Figure 670174DEST_PATH_IMAGE004
表示画 像维度,
Figure DEST_PATH_IMAGE005
表示画像维度的第
Figure 851887DEST_PATH_IMAGE006
个维度属性;
Figure DEST_PATH_IMAGE007
表示第
Figure 57478DEST_PATH_IMAGE006
个维度属性对应的对象行为 数据中属于第一命中类别的占比;
Figure 687043DEST_PATH_IMAGE008
表示属于第一命中类别的第
Figure 126246DEST_PATH_IMAGE003
个样本对象的对象行 为数据;
属于第二命中类别的样本对象对应的策略效果通过以下公式计算得到:
Figure DEST_PATH_IMAGE009
其中,
Figure 618757DEST_PATH_IMAGE010
表示属于第二命中类别的第
Figure 316455DEST_PATH_IMAGE003
个样本对象对应的策略效果;
Figure 410313DEST_PATH_IMAGE004
表示画像 维度,
Figure 20417DEST_PATH_IMAGE005
表示画像维度的第
Figure 957149DEST_PATH_IMAGE006
个维度属性;
Figure 707805DEST_PATH_IMAGE007
表示第
Figure 780803DEST_PATH_IMAGE006
个维度属性对应的对象行为数 据中属于第一命中类别的占比;
Figure DEST_PATH_IMAGE011
表示属于第二命中类别的第
Figure 30650DEST_PATH_IMAGE003
个样本对象的对象行为数 据。
在一个实施例中,根据画像维度包括的所有维度属性各自对应的策略效果,计算画像维度对应目标策略的策略效果,包括:
根据画像维度包括的各维度属性各自对应的策略效果以及各维度属性对应的每个样本对象的策略效果,对各维度属性对应的每个样本对象的策略效果求均方误差;
对画像维度包括的所有维度属性各自对应的均方误差求和,获得画像维度对应目标策略的策略效果。
在一个实施例中,将与各画像维度对应的策略效果输入决策树模型,以决策树模型中节点所表示的画像维度组合对应的策略效果最优化为目标,对决策树模型进行训练,得到群体划分决策树,包括:
将与各画像维度对应的策略效果输入决策树模型;
根据各画像维度对应目标策略的策略效果,确定决策树模型的根节点;
迭代地确定当前决策树模型中从根节点到末尾子节点构成的画像维度组合,将当前确定的画像维度组合与各剩余画像维度构成的各候选画像维度组合分别对应的对象行为数据转换为相应策略效果,并根据各策略效果从各剩余画像维度中确定以末尾子节点为父节点的子节点后,获得更新的决策树模型;
基于停止迭代时的决策树模型,获得群体划分决策树。
在一个实施例中,该方法还包括:
确定根节点表示的画像维度与各剩余画像维度构成的各候选画像维度组合分别对应的对象行为数据;
按照各候选画像维度组合对应的对象行为数据中属于第一命中类别的占比,将各候选画像维度组合对应的对象行为数据转换为各候选画像维度组合对应的策略效果;
根据各候选画像维度组合对应的策略效果,从各剩余画像维度中确定与根节点相连的子节点。
在一个实施例中,将当前确定的画像维度组合与各剩余画像维度构成的各候选画像维度组合分别对应的对象行为数据转换为相应策略效果,包括:
分别确定各候选画像维度组合所包括的维度组合属性;
对样本对象对应的对象行为数据按维度组合属性进行归类,得到各维度组合属性分别对应的对象行为数据;
根据属于相同候选画像维度组合的维度组合属性所对应的对象行为数据,获得各候选画像维度组合对应的对象行为数据;
根据各候选画像维度组合对应的对象行为数据中属于第一命中类别的占比,将与各候选画像维度组合对应的对象行为数据转换为对应目标策略的策略效果。
在一个实施例中,根据各候选画像维度组合对应的对象行为数据中属于第一命中类别的占比,将与各候选画像维度组合对应的对象行为数据转换为对应目标策略的策略效果,包括:
对于每个候选画像维度组合,确定候选画像维度组合所包括的维度组合属性;
对于每个维度组合属性,确定维度组合属性对应的对象行为数据中属于第一命中类别的占比,根据占比将维度组合属性对应的对象行为数据转换为维度组合属性对应的策略效果;
根据候选画像维度组合包括的所有维度组合属性各自对应的策略效果,计算候选画像维度组合对应目标策略的策略效果。
在一个实施例中,根据占比将维度组合属性对应的对象行为数据转换为维度组合属性对应的策略效果,包括:
根据占比确定属于第一命中类别的对象行为数据的第一权重系数;
根据占比确定属于第二命中类别的对象行为数据的第二权重系数;
按第一权重系数,将维度组合属性对应的对象行为数据中属于第一命中类别的样本对象对应的对象行为数据,转换为样本对象对应的策略效果;
按第二权重系数,将维度组合属性对应的对象行为数据中属于第二命中类别的样本对象对应的对象行为数据,转换为样本对象对应的策略效果;
对维度组合属性对应的每个样本对象的策略效果求平均值,获得维度组合属性对应的策略效果。
在一个实施例中,根据候选画像维度组合包括的所有维度组合属性各自对应的策略效果,计算候选画像维度组合对应目标策略的策略效果,包括:
对归类至维度组合属性的每个样本对象的策略效果求均方误差;
对候选画像维度组合包括的所有维度组合属性各自对应的均方误差求和,获得候选画像维度组合对应目标策略的策略效果。
在一个实施例中,根据各策略效果从各剩余画像维度中确定以末尾子节点为父节点的子节点,包括:
确定各候选画像维度组合对应的策略效果中,策略效果最小值对应的画像维度组合;
将构成策略效果最小值对应的画像维度组合的剩余画像维度,作为决策树模型中以末尾子节点为父节点的子节点。
在一个实施例中,该方法还包括:
在更新决策树模型时,确定决策树模型中从根节点到子节点构成的画像维度组合对应的样本对象数量;
修剪样本对象数量小于预设阈值的子节点。
在一个实施例中,基于从群体划分决策树的根节点到叶子节点所表示的各细分群体分别对应的策略效果,确定对应目标策略的较优细分群体,包括:
基于停止迭代时群体划分决策树中从根节点到叶子节点所表示的各细分群体分别对应的策略效果,将大于阈值的策略效果所对应的细分群体,作为较优细分群体。
在一个实施例中,该方法还包括:
获得群体划分决策树后,从根节点开始遍历群体划分决策树;
当从根节点到当前遍历到的节点所构成的画像维度组合所对应的样本对象数量小于预设阈值时,从群体划分决策树修剪当前遍历到的节点。
在一个实施例中,该方法还包括:
获取与各对象标识对应的对象画像数据;
根据对象画像数据确定与较优细分群体匹配的目标对象标识;
对以目标对象标识登录的目标应用程序实施目标策略。
一种对象数据处理装置,该装置包括:
获取模块,用于获取各样本对象对应的对象画像数据、对象行为数据以及对应目标策略的命中类别,命中类别包括对样本对象实施目标策略的第一命中类别和未对样本对象实施目标策略的第二命中类别中的一种;
转换模块,用于根据与对象画像数据的各画像维度对应的对象行为数据中属于第一命中类别的占比,将与各画像维度对应的对象行为数据转换为对应目标策略的策略效果;
训练模块,用于将与各画像维度对应的策略效果输入决策树模型,以决策树模型中节点所表示的画像维度组合对应的策略效果最优化为目标,对决策树模型进行训练,得到群体划分决策树;
确定模块,用于基于从群体划分决策树的根节点到叶子节点所表示的各细分群体分别对应的策略效果,确定对应目标策略的较优细分群体。
一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现以下步骤:
获取各样本对象对应的对象画像数据、对象行为数据以及对应目标策略的命中类别,命中类别包括对样本对象实施目标策略的第一命中类别和未对样本对象实施目标策略的第二命中类别中的一种;
根据与对象画像数据的各画像维度对应的对象行为数据中属于第一命中类别的占比,将与各画像维度对应的对象行为数据转换为对应目标策略的策略效果;
将与各画像维度对应的策略效果输入决策树模型,以决策树模型中节点所表示的画像维度组合对应的策略效果最优化为目标,对决策树模型进行训练,得到群体划分决策树;
基于从群体划分决策树的根节点到叶子节点所表示的各细分群体分别对应的策略效果,确定对应目标策略的较优细分群体。
一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取各样本对象对应的对象画像数据、对象行为数据以及对应目标策略的命中类别,命中类别包括对样本对象实施目标策略的第一命中类别和未对样本对象实施目标策略的第二命中类别中的一种;
根据与对象画像数据的各画像维度对应的对象行为数据中属于第一命中类别的占比,将与各画像维度对应的对象行为数据转换为对应目标策略的策略效果;
将与各画像维度对应的策略效果输入决策树模型,以决策树模型中节点所表示的画像维度组合对应的策略效果最优化为目标,对决策树模型进行训练,得到群体划分决策树;
基于从群体划分决策树的根节点到叶子节点所表示的各细分群体分别对应的策略效果,确定对应目标策略的较优细分群体。
一种计算机程序,计算机程序包括计算机指令,计算机指令存储在计算机可读存储介质中,计算机设备的处理器从计算机可读存储介质读取计算机指令,处理器执行计算机指令,使得计算机设备执行上述方法的步骤。
获取各样本对象对应的对象画像数据、对象行为数据以及对应目标策略的命中类别,命中类别包括对样本对象实施目标策略的第一命中类别和未对样本对象实施目标策略的第二命中类别中的一种;
根据与对象画像数据的各画像维度对应的对象行为数据中属于第一命中类别的占比,将与各画像维度对应的对象行为数据转换为对应目标策略的策略效果;
将与各画像维度对应的策略效果输入决策树模型,以决策树模型中节点所表示的画像维度组合对应的策略效果最优化为目标,对决策树模型进行训练,得到群体划分决策树;
基于从群体划分决策树的根节点到叶子节点所表示的各细分群体分别对应的策略效果,确定对应目标策略的较优细分群体。
上述对象数据处理方法、装置、计算机设备和存储介质,一方面,根据与对象画像数据的各画像维度对应的对象行为数据中属于第一命中类别的占比,将与各画像维度对应的对象行为数据转换为对应目标策略的策略效果,解决了在AB测试场景下无法获取样本对象的策略效果的问题,使得本申请实施例可基于决策树算法从测试结果中挖掘细分群体的策略结果;另一方面,将与各画像维度对应的策略效果输入决策树模型,以决策树模型中节点所表示的画像维度组合对应的策略效果最优化为目标,对决策树模型进行训练得到群体划分决策树,基于从群体划分决策树的根节点到叶子节点所表示的各细分群体分别对应的策略效果,即可确定对应目标策略的较优细分群体,由于以决策树模型中节点所表示的画像维度组合对应的策略效果最优化为目标训练决策树模型,能够减少画像维度组合数量,且能够保证群体划分决策树中节点所表示的画像维度组合具有局部最优的特性,从而避免传统技术中组合爆炸的问题,提高从测试结果中挖掘细分群体策略结果的效率。
附图说明
图1为一个实施例中对象数据处理方法的应用环境图;
图2为一个实施例中对象数据处理方法的流程示意图;
图3为一个实施例中决策树模型的训练数据的示意图;
图4(a)为一个实施例中计算画像维度对应的策略效果的流程示意图;
图4(b)为另一个实施例中计算画像维度对应的策略效果的流程示意图;
图5为一个实施例中群体划分决策树的示意图;
图6(a)为一个实施例中计算候选画像维度组合对应的策略效果的流程示意图;
图6(b)为另一个实施例中计算候选画像维度组合对应的策略效果的流程示意图;
图7为一个实施例中获取维度属性对应的策略效果的细化流程示意图;
图8为另一个实施例中对象数据处理方法的流程示意图;
图9为一个实施例中对象数据处理装置的结构框图;
图10为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的对象数据处理方法,涉及人工智能(ArtificialIntelligence, AI)技术,人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
本申请实施例提供的对象数据处理方法,主要涉及人工智能领域的机器学习(Machine Learning, ML)技术。机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
本申请实施例提供的对象数据处理方法,涉及区块链技术。区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层。
区块链底层平台可以包括用户管理、基础服务、智能合约以及运营监控等处理模块。其中,用户管理模块负责所有区块链参与者的身份信息管理,包括维护公私钥生成(账户管理)、密钥管理以及用户真实身份和区块链地址对应关系维护(权限管理)等,并且在授权的情况下,监管和审计某些真实身份的交易情况,提供风险控制的规则配置(风控审计);基础服务模块部署在所有区块链节点设备上,用来验证业务请求的有效性,并对有效请求完成共识后记录到存储上,对于一个新的业务请求,基础服务先对接口适配解析和鉴权处理(接口适配),然后通过共识算法将业务信息加密(共识管理),在加密之后完整一致的传输至共享账本上(网络通信),并进行记录存储;智能合约模块负责合约的注册发行以及合约触发和合约执行,开发人员可以通过某种编程语言定义合约逻辑,发布到区块链上(合约注册),根据合约条款的逻辑,调用密钥或者其它的事件触发执行,完成合约逻辑,同时还提供对合约升级注销的功能;运营监控模块主要负责产品发布过程中的部署、配置的修改、合约设置、云适配以及产品运行中的实时状态的可视化输出,例如:告警、监控网络情况、监控节点设备健康状态等。
平台产品服务层提供典型应用的基本能力和实现框架,开发人员可以基于这些基本能力,叠加业务的特性,完成业务逻辑的区块链实现。应用服务层提供基于区块链方案的应用服务给业务参与方进行使用。
本申请实施例提供的对象数据处理方法,主要涉及机器学习领域的决策树技术。例如,在本申请实施例中,将与对象画像数据的各画像维度对应的策略效果输入决策树模型,以决策树模型中节点所表示的画像维度组合对应的策略效果最优化为目标,对决策树模型进行训练,得到群体划分决策树,这样,基于从群体划分决策树的根节点到叶子节点所表示的各细分群体分别对应的策略效果,即可确定对应目标策略的较优细分群体,也即是测试效果好的细分群体。
本申请提供的对象数据处理方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。终端102获取各样本对象对应的对象画像数据、对象行为数据以及对应目标策略的命中类别,命中类别包括对样本对象实施目标策略的第一命中类别和未对样本对象实施目标策略的第二命中类别中的一种,将各样本对象对应的对象画像数据、对象行为数据以及对应目标策略的命中类别发送至服务器104,服务器104根据与对象画像数据的各画像维度对应的对象行为数据中属于第一命中类别的占比,将与各画像维度对应的对象行为数据转换为对应目标策略的策略效果,将与各画像维度对应的策略效果输入决策树模型,以决策树模型中节点所表示的画像维度组合对应的策略效果最优化为目标,对决策树模型进行训练,得到群体划分决策树,基于从群体划分决策树的根节点到叶子节点所表示的各细分群体分别对应的策略效果,确定对应目标策略的较优细分群体,服务器104可将较优细分群体发送至终端102。
在另一些实施例中,终端102或者服务器104也可以独立完成较优细分群体的筛选。以终端102为例,终端102获取各样本对象对应的对象画像数据、对象行为数据以及对应目标策略的命中类别,根据与对象画像数据的各画像维度对应的对象行为数据中属于第一命中类别的占比,将与各画像维度对应的对象行为数据转换为对应目标策略的策略效果,将与各画像维度对应的策略效果输入决策树模型,以决策树模型中节点所表示的画像维度组合对应的策略效果最优化为目标,对决策树模型进行训练,得到群体划分决策树,基于从群体划分决策树的根节点到叶子节点所表示的各细分群体分别对应的策略效果,确定对应目标策略的较优细分群体。
其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
本申请实施例提供的对象数据处理方法,其执行主体可以是本申请实施例提供的对象数据处理装置,或者集成了该对象数据处理装置的计算机设备,其中该对象数据处理装置可以采用硬件或软件的方式实现。计算机设备可以是图1中所示的终端102或服务器104。
本申请实施例提供的对象数据处理方法,可应用于对A/B测试的测试结果进行细粒度分析,从测试结果中挖掘各细分群体对应的测试结果,以获得测试效果好的细分群体。在一个实施例中,本申请实施例可应用于互联网产品上线场景,具体是对互联网产品上线场景中所采用的A/B测试的测试结果进行细粒度分析,从测试结果中挖掘测试效果好的细分群体,以对测试效果好的细分群体上线A/B测试的测试内容。比如,测试内容可以是针对互联网产品提出的新方案或者优化方案,从测试结果中挖掘测试效果好的细分群体,以对测试效果好的细分群体针对性上线新方案或者优化方案。
在一个实施例中,如图2所示,提供了一种对象数据处理方法,本实施例主要以该方法应用于计算机设备(上述图1中的终端102或服务器104)来举例说明,包括以下步骤:
步骤S202,获取各样本对象对应的对象画像数据、对象行为数据以及对应目标策略的命中类别,命中类别包括对样本对象实施目标策略的第一命中类别和未对样本对象实施目标策略的第二命中类别中的一种。
其中,样本对象是A/B测试的被测试对象。目标策略是A/B测试的测试内容。在一个实施例中,目标策略可以是针对互联网产品的实施方案,比如用户界面(UI,UserInterface)设计方案、文案策划方案、页面布局方案、功能设计方案、算法设计方案,等等。目标策略可以是针对互联网产品所提出的新方案或者优化方案,比如针对传统的用户界面所提出的优化设计方案。
其中,命中类别用于描述样本对象所命中的测试类别。在本申请实施例中,计算机设备将各样本对象划分至第一命中类别和第二命中类别,对第一命中类别的样本对象实施目标策略,对第二命中类别的样本对象不实施目标策略。计算机设备可对第二命中类别的样本对象实施除目标策略以外的其它策略,也可不对样本对象实施任何策略。
其中,对象行为数据是描述用户行为的数据,用户行为比如点击行为、浏览行为、互动行为等,对象行为数据比如点击率、浏览时长、互动次数等。对象行为数据可反映样本对象在A/B测试中的测试结果,对象行为数据与A/B测试的优化指标相匹配,比如A/B测试的优化指标为点击率,对象行为数据也为点击率。
其中,对象画像数据是描述用户属性的数据。用户属性可以是用户所固有的生理特性,比如年龄、性别等;用户属性也可以是用户作为社会人所具有的特性,比如居住地、学历、行业、收入等;用户属性还可以是用户作为互联网产品使用者所具有的特性,比如注册时长、在线时长等。
举例说明,参照图3,图3为一个实施例中决策树模型的训练数据的示意图。以目标策略为用户界面的优化设计方案为例,对第一命中类别的样本对象实施优化设计方案对应的用户界面,对第二命中类别的样本对象实施传统的用户界面。可以看到,各样本对象对应的对象画像数据可以是各样本对象的居住地、性别、年龄、注册时长等,各样本对象对应的对象行为数据可以是各样本对象在所属命中类别对应的用户界面的点击率。
在一个实施例中,计算机设备获取各样本对象对应的对象画像数据、对象行为数据以及对应目标策略的命中类别。
下面介绍一下发明人的思路:
发明人发现,传统的细粒度分析方式大多是先对被测试对象的不同属性的属性值进行组合,将被测试对象划分为不同的细分群体,从测试结果中挖掘各细分群体对应的测试结果,以获得测试效果好的细分群体。但是,这种细粒度分析方式常常遭遇组合爆炸的问题,导致计算性能瓶颈,进而导致从测试结果中挖掘细分群体测试结果的效率低。为了提升从测试结果中挖掘细分群体测试结果的效率,就需要解决组合爆炸的问题,鉴于决策树算法具有特征选择的特性,发明人想到可基于决策树算法从测试结果中挖掘细分群体对应的测试结果。
其中,决策树算法是机器学习领域中的分类与回归方法。在决策树模型的训练过程中,不断地从训练数据中筛选当前最优特征作为节点,各节点以对应的特征作为分裂标准,节点的分支表示分裂结果,由此由上至下递归地生成节点,最终训练好的决策树呈树形结构。由于不断地选择当前最优特征作为节点,能够减少决策树中节点所表示的组合数量,且能够保证决策树中节点所表示的组合具有局部最优的特性。
发明人发现,基于决策树算法分析A/B测试的测试结果存在技术障碍。决策树算法需要样本对象的策略效果作为训练数据,这里的策略效果定义为对样本对象实施目标策略和未对样本对象实施目标策略时,样本对象的对象行为数据的差异。而由于A/B测试的特性,无法同时获得对样本对象实施目标策略和未对样本对象实施目标策略时,样本对象的对象行为数据,也就是说,无法获得样本对象的策略效果。为此,发明人经过大量的研究发现,样本对象的策略效果可基于样本对象的对象行为数据转换得到,故本申请实施例可先将样本对象的对象行为数据转换为样本对象的策略效果,再基于决策树算法从测试结果中挖掘细分群体对应的测试结果。
步骤S204,根据与对象画像数据的各画像维度对应的对象行为数据中属于第一命中类别的占比,将与各画像维度对应的对象行为数据转换为对应目标策略的策略效果。
其中,画像维度可用于描述对象画像数据所包括的用户属性。继续参照图3,对象画像数据的画像维度可以是居住地、性别、年龄、注册时长等。在另一些实施例中,画像维度也可用于描述对象画像数据所包括的属性值。继续参照图3,对象画像数据的画像维度可以是深圳、上海、男性、女性、>20岁、≤20岁、>3年、≤3年等。下面以画像维度用于描述对象画像数据所包括的用户属性为例,介绍本申请实施例的方案。
在一个实施例中,每个画像维度可划分为多于一个维度属性,维度属性用于描述各样本对象在画像维度下的属性值,以画像维度为性别为例,性别所包括的维度属性为男性和女性。对于具有连续属性的画像维度,比如年龄、注册时长、居住地(比如居住地包括深圳、上海、武汉、长沙等多个城市)等,计算机设备可基于通用的离散化策略确定至少一个划分点,根据至少一个划分点生成画像维度的维度属性。通用的离散化策略比如二分法等。以年龄为例,年龄所包括的维度属性可以是>20岁、≤20岁;以居住地为例,居住地所包括的维度属性可以是二线以上城市、二线及以下城市。
在一个实施例中,计算机设备对各样本对象对应的对象画像数据进行分类,得到各画像维度及属于各画像维度的维度属性;对各样本对象对应的对象行为数据按维度属性进行归类,得到对应各维度属性的对象行为数据;根据属于相同画像维度的维度属性所对应的对象行为数据,获得各画像维度对应的对象行为数据。
在一个实施例中,画像维度对应的对象行为数据,可以是画像维度所包括的维度属性各自对应的对象行为数据,维度属性对应的对象行为数据,可以是满足维度属性的样本对象的对象行为数据。
继续参照图3,计算机设备对各样本对象对应的对象画像数据进行分类,得到居住地、性别、年龄、注册时长等画像维度,以及属于居住地的维度属性深圳、上海,属于性别的维度属性女性和男性,属于年龄的维度属性>20岁、≤20岁,属于注册时长的维度属性>3年、≤3年。计算机设备对各样本对象对应的对象行为数据按维度属性进行归类,以居住地为例,居住地所包括的维度属性为深圳、上海,深圳对应的对象行为数据是对象1、对象2和对象5的点击率,上海对应的对象行为数据是对象3和对象4的点击率,居住地对应的对象行为数据是对象1、对象2、对象3、对象4和对象5的点击率。
在一个实施例中,画像维度对应目标策略的策略效果,可由画像维度所包括的维度属性对应目标策略的策略效果计算得到,维度属性对应目标策略的策略效果,可由满足维度属性的样本对象的策略效果计算得到。继续参照图3,以居住地为例,居住地对应的策略效果,可由深圳和上海各自对应的策略效果计算得到,深圳对应的策略效果,可由对象1、对象2和对象5的策略效果计算得到。
在一个实施例中,步骤S204包括:对于每个画像维度,确定画像维度所包括的维度属性;对于每个维度属性,确定维度属性对应的对象行为数据中属于第一命中类别的占比,根据占比将维度属性对应的对象行为数据转换为维度属性对应的策略效果;根据画像维度包括的所有维度属性各自对应的策略效果,计算画像维度对应目标策略的策略效果。
在一个实施例中,计算机设备获取画像维度包括的所有维度属性,根据各维度属性分别对应的对象行为数据中属于第一命中类别的占比,将各维度属性对应的对象行为数据转换为对应目标策略的策略效果,根据画像维度包括的所有维度属性分别对应目标策略的策略效果,计算画像维度对应目标策略的策略效果。
在一个实施例中,对于每个维度属性,计算机设备确定维度属性对应的对象行为数据中属于第一命中类别的占比,根据占比将满足维度属性的样本对象的对象行为数据,转换为样本对象对应目标策略的策略效果,基于满足维度属性的样本对象的策略效果,获得维度属性对应的策略效果。
在一个实施例中,计算机设备根据样本对象的对象行为数据,以及样本对象所属的维度属性对应的对象行为数据中属于第一命中类别的占比,计算样本对象对应目标策略的策略效果。关于样本对象的策略效果的具体计算方式,可参照后续实施例,在此不再赘述。
举例说明,参照图4(a),图4(a)为一个实施例中计算画像维度对应的策略效果的流程示意图。以画像维度为居住地为例,对于居住地在深圳的对象1、对象2和对象5,计算机设备根据对象1、对象2和对象5的对象行为数据中属于第一命中类别的占比,以及对象1、对象2和对象5的对象行为数据,计算得到对象1、对象2和对象5的策略效果,根据对象1、对象2和对象5的策略效果,计算得到深圳对应的策略效果;同理,计算机设备根据对象3和对象4的策略效果,计算得到上海对应的策略效果;计算机设备根据深圳对应的策略效果以及上海对应的策略效果,计算得到居住地对应的策略效果。
关于画像维度对应目标策略的策略效果的计算方式,可采用以下步骤:
在一个实施例中,计算机设备根据画像维度包括的所有维度属性各自对应的策略效果,计算画像维度对应的策略效果,计算方式可以是对画像维度包括的所有维度属性各自对应的策略效果求和或者求均值等。在该种求解方式中,计算机设备根据满足维度属性的样本对象的策略效果,计算维度属性对应的策略效果,计算方式可以是对满足维度属性的样本对象的策略效果求和或者求均值等。在该种求解方式中,画像维度对应的策略效果,可用于反映画像维度对应的样本对象的整体策略效果。为了方便介绍,在后续实施例中将该种求解方式称为第一种求解方式。
在一个实施例中,计算机设备根据画像维度包括的各维度属性各自对应的策略效果以及各维度属性对应的每个样本对象的策略效果,对各维度属性对应的样本对象的策略效果求均方误差;对画像维度包括的所有维度属性各自对应的均方误差求和或者求均值等,获得画像维度对应目标策略的策略效果。在该种求解方式中,计算机设备对满足维度属性的样本对象的策略效果求均值,得到维度属性对应的策略效果。为了方便介绍,在后续实施例中将该种求解方式称为第二种求解方式。
举例说明,参照图4(b),图4(b)为另一个实施例中计算画像维度对应的策略效果的流程示意图。以画像维度为居住地为例,对于居住地在深圳的对象1、对象2和对象5,计算机设备对对象1、对象2和对象5的策略效果求均值,计算得到深圳对应的策略效果;同理,计算机设备对对象3和对象4的策略效果求均值,计算得到上海对应的策略效果;计算机设备根据深圳对应的策略效果以及对象1、对象2和对象5的策略效果,对对象1、对象2和对象5的策略效果求均方误差,并根据上海对应的策略效果以及对象3和对象4的策略效果,对对象3和对象4的策略效果求均方误差;计算机设备对深圳和上海各自对应的均方误差求和,获得居住地对应的策略效果。
继续参照图4(b),以深圳为例,深圳对应的均方误差的求解方式可以是:计算机设备对对象1、对象2和对象5的策略效果求均值,根据对象1的策略效果与均值之差、对象2的策略效果与均值之差、对象5的策略效果与均值之差的平方和,获得深圳对应的均方误差。在第二种求解方式中,画像维度对应的策略效果,可用于反映以画像维度作为分裂标准分裂后,每个维度属性对应的样本对象的策略效果的分布离散程度。
步骤S206,将与各画像维度对应的策略效果输入决策树模型,以决策树模型中节点所表示的画像维度组合对应的策略效果最优化为目标,对决策树模型进行训练,得到群体划分决策树。
其中,画像维度组合可以是多于一个画像维度的组合,比如“年龄-居住地”;画像维度组合也可以是多于一个维度属性的组合,比如“20岁以上-深圳”;画像维度组合还可以是画像维度与维度属性的组合,比如“20岁以上-居住地”。下面以画像维度组合为画像维度与维度属性的组合,介绍本申请实施例的方案。
在群体划分决策树中,群体划分决策树包括根节点、子节点和叶子节点三种类型的节点,根节点是群体划分决策树的起始节点,子节点是群体划分决策树的中间节点,叶子节点是群体划分决策树的末尾节点,叶子节点不具备分裂特性。参照图5,图5为一个实施例中群体划分决策树的示意图,其中节点502为根节点,节点504、节点506均为子节点,节点508、节点510均为叶子节点。
在一个实施例中,计算机设备将与各画像维度对应的策略效果输入决策树模型,根据各画像维度对应目标策略的策略效果,确定作为根节点的画像维度。继续参照图5,可以看到,根节点以对应的画像维度作为分裂标准,根节点的分支表示维度属性,根节点的分支同时也作为与其它节点相连的桥梁。接着,计算机设备以决策树模型中节点所表示的画像维度组合对应的策略效果最优化作为筛选标准,不断地从剩余的画像维度中筛选画像维度作为子节点。继续参照图5,可以看到,子节点以对应的画像维度作为分裂标准,子节点的分支表示维度属性,子节点的分支同时也作为与其它节点相连的桥梁。由此由上至下递归地生成节点,最终训练好的群体划分决策树呈树形结构。
在一个实施例中,计算机设备可根据决策树模型中各节点所构成的群体划分路径,确定各节点所表示的画像维度组合。群体划分路径包括多于一个节点以及节点之间的分支。继续参照图5,节点502与节点506所构成的群体划分路径为:节点502-年龄>20岁-节点504-居住地为上海-节点506。
在一个实施例中,计算机设备可根据决策树模型中各节点所构成的群体划分路径涵盖的维度属性,以及群体划分路径的末尾节点表示的画像维度,确定各节点所表示的画像维度组合。继续参照图5,节点502与节点506所构成的群体划分路径所涵盖的维度属性包括:“年龄>20岁”、“居住地为上海”,节点502与节点506所构成的群体划分路径的末尾节点表示的画像维度为“性别”,节点502与节点506所表示的画像维度组合为:“年龄>20岁-居住地为上海-性别”。
在一个实施例中,计算机设备以决策树模型中节点所表示的画像维度组合对应的策略效果最优化作为筛选标准,从剩余的画像维度中选取画像维度作为节点。关于策略效果最优化的原理,可参照后续实施例,在此不再赘述。继续参照图5,以生成节点506为例,节点502与节点506所表示的画像维度组合为:“年龄>20岁-居住地为上海-X”,X的取值可为“注册时长”或者“性别”。计算机设备根据画像维度组合“年龄>20岁-居住地为上海-性别”和“年龄>20岁-居住地为上海-注册时长”各自对应的策略效果,以画像维度组合对应的策略效果最优化作为筛选标准,选取“性别”或者“注册时长”作为节点506。
在决策树模型的训练过程中,计算机设备先生成决策树模型的根节点,接着生成与根节点相连的第一子节点,根节点与第一子节点通过根节点的分支相连接,再生成与第一子节点相连的第二子节点,第一子节点与第二子节点通过第一子节点的分支相连接,就这样不断地生成决策树模型的子节点,直至生成决策树模型的叶子节点。
下面介绍根节点的生成方式:
在一个实施例中,计算机设备将与各画像维度对应的策略效果输入决策树模型,根据各画像维度对应目标策略的策略效果,确定决策树模型的根节点。
在一个实施例中,计算机设备以根节点所表示的画像维度对应的策略效果最优化作为筛选标准,从各画像维度中选取根节点。
在一个实施例中,计算机设备将各画像维度对应的策略效果中,最优策略效果对应的画像维度作为根节点。本实施例中,计算机设备可采用上述第一种求解方式计算画像维度对应的策略效果。由于在第一种求解方式中,画像维度对应的策略效果,可用于反映画像维度对应的样本对象的整体策略效果,选取最优策略效果对应的画像维度作为根节点,使得根节点以该画像维度作为分裂标准分裂后,各维度属性对应的样本对象的策略效果最优,有利于快速查找策略效果较优的细分群体。
在一个实施例中,计算机设备将各画像维度对应的策略效果中,策略效果最小值对应的画像维度作为根节点。本实施例中,计算机设备可采用上述第二种求解方式计算画像维度对应的策略效果。由于在第二种求解方式中,画像维度对应的策略效果,可用于反映以画像维度作为分裂标准分裂后,每个维度属性对应的样本对象的策略效果的分布离散程度,选取策略效果最小值对应的画像维度作为根节点,使得根节点以该画像维度作为分裂标准分裂后,对于每个维度属性来说,该维度属性对应的样本对象的策略效果的分布离散程度最小,也即是该维度属性对应的样本对象的策略效果最为接近,分裂效果最好,有利于快速挖掘各细分群体对应的策略效果。
在一个实施例中,计算机设备迭代地确定当前决策树模型中从根节点到末尾子节点构成的画像维度组合,将当前确定的画像维度组合与各剩余画像维度构成的各候选画像维度组合分别对应的对象行为数据转换为相应策略效果,并根据各策略效果从各剩余画像维度中确定以末尾子节点为父节点的子节点后,获得更新的决策树模型;基于停止迭代时的决策树模型,获得群体划分决策树。
其中,末尾子节点是决策树模型训练时新生成的、当前处于决策树模型末尾的子节点,并非特指某一个子节点。在决策树模型的训练过程中,计算机设备先生成决策树模型的根节点,接着生成与根节点相连接的第一子节点,接着生成与第一子节点相连接的第二子节点,此时第一子节点为第二子节点的父节点,就这样不断地生成决策树模型的子节点,直至生成决策树模型的叶子节点。末尾子节点用于指代决策树模型训练时不断生成的各个子节点。
在决策树模型的训练过程中,计算机设备不断生成决策树模型的子节点,每新生成一个子节点,即确定一个由根节点与新生成的子节点所构成的画像维度组合。对于当前确定的画像维度组合,其对应的剩余画像维度,是除了由根节点与新生成的子节点所构成的群体划分路径中包含的画像维度以外的其它画像维度。继续参照图5,以当前确定的画像维度组合为“20岁以上-居住地”为例,其对应的剩余画像维度为:“注册时长”和“性别”。
可以理解,对于具有连续属性的画像维度,比如年龄、注册时长等,若选取不同的划分点,则可作为不同的画像维度参与决策树模型的训练过程,比如图5中的“年龄(>20岁、≤20岁)”、“年龄(>10岁、≤10岁)”。
在一个实施例中,当全部的画像维度均筛选作为决策树模型的节点时,停止迭代。在另一些实施例中,当决策树模型的每条群体划分路径均包括全部的画像维度时,停止迭代。
下面以生成第一子节点为例,介绍子节点的生成方式:
在一个实施例中,计算机设备获取根节点表示的画像维度与各剩余画像维度构成的各候选画像维度组合分别对应的对象行为数据,将各候选画像维度组合分别对应的对象行为数据转换为各候选画像维度组合对应的策略效果,根据各候选画像维度组合对应的策略效果,从各剩余画像维度中确定与根节点相连的子节点。
其中,根节点对应的剩余画像维度,是除了根节点表示的画像维度以外的其它画像维度。
在一个实施例中,由于根节点可分裂为多于一个分支,对于根节点的每个分支,计算机设备获取该分支表示的维度属性与根节点对应的剩余画像维度构成的各候选画像维度组合,根据各候选画像维度组合对应的策略效果,从剩余画像维度中确定与根节点通过该分支相连的子节点。
在一个实施例中,每个画像维度组合可包括多于一个维度组合属性,维度组合属性是多于一个维度属性的组合。继续参照图3,画像维度组合“20岁以上-居住地”所包括的维度组合属性可以是:“20岁以上-深圳”、“20岁以上-上海”等。由此可见,维度组合属性可用于描述满足多于一个维度属性的细分群体。
在一个实施例中,候选画像维度组合对应目标策略的策略效果,可由候选画像维度组合所包括的维度组合属性对应目标策略的策略效果计算得到,维度组合属性对应目标策略的策略效果,可由满足维度组合属性的样本对象的策略效果计算得到。继续参照图3,候选画像维度组合“20岁以上-居住地”对应的策略效果,可由“20岁以上-深圳”和“20岁以上-上海”各自对应的策略效果计算得到,“20岁以上-深圳”对应的策略效果,可由对象1和对象5的策略效果计算得到。
在一个实施例中,计算机设备根据各候选画像维度组合对应的对象行为数据中属于第一命中类别的占比,将各候选画像维度组合对应的对象行为数据转换为各候选画像维度组合对应的策略效果。
在一个实施例中,候选画像维度组合对应的对象行为数据,可以是候选画像维度组合所包括的维度组合属性各自对应的对象行为数据,维度组合属性对应的对象行为数据,可以是满足维度组合属性的样本对象的对象行为数据。继续参照图3,“20岁以上-深圳”对应的对象行为数据是对象1和对象5的点击率,“20岁以上-上海”对应的对象行为数据是对象3和对象4的点击率,候选画像维度组合“20岁以上-居住地”对应的对象行为数据是对象1、对象3、对象4和对象5的点击率。
在一个实施例中,对于每个候选画像维度组合,确定候选画像维度组合所包括的维度组合属性;对于每个维度组合属性,确定维度组合属性对应的对象行为数据中属于第一命中类别的占比,根据占比将维度组合属性对应的对象行为数据转换为维度组合属性对应的策略效果;根据候选画像维度组合包括的所有维度组合属性各自对应的策略效果,计算候选画像维度组合对应目标策略的策略效果。
在一个实施例中,计算机设备获取候选画像维度组合包括的所有维度组合属性,根据各维度组合属性分别对应的对象行为数据中属于第一命中类别的占比,将各维度组合属性对应的对象行为数据转换为对应目标策略的策略效果,根据候选画像维度组合包括的所有维度组合属性分别对应目标策略的策略效果,计算候选画像维度组合对应目标策略的策略效果。
在一个实施例中,对于每个维度组合属性,计算机设备确定维度组合属性对应的对象行为数据中属于第一命中类别的占比,根据占比将满足维度组合属性的样本对象的对象行为数据,转换为样本对象对应目标策略的策略效果,基于满足维度组合属性的样本对象的策略效果,获得维度组合属性对应的策略效果。
在一个实施例中,计算机设备根据样本对象的对象行为数据,以及样本对象所属的维度组合属性对应的对象行为数据中属于第一命中类别的占比,计算样本对象对应目标策略的策略效果。关于样本对象的策略效果的具体计算方式,可参照后续实施例,在此不再赘述。
举例说明,参照图6(a),图6(a)为一个实施例中计算候选画像维度组合对应的策略效果的流程示意图。以候选画像维度组合为“20岁以上-居住地”为例,对于20岁以上且居住地在深圳的对象1和对象5,计算机设备根据对象1和对象5的对象行为数据中属于第一命中类别的占比,以及对象1和对象5的对象行为数据,计算得到对象1和对象5的策略效果,根据对象1和对象5的策略效果,计算得到“20岁以上-深圳”对应的策略效果;同理,计算机设备根据对象3和对象4的策略效果,计算得到“20岁以上-上海”对应的策略效果;计算机设备根据“20岁以上-深圳”对应的策略效果以及“20岁以上-上海”对应的策略效果,计算得到“20岁以上-居住地”对应的策略效果。
关于候选画像维度组合对应目标策略的策略效果的计算方式,可采用以下步骤:
在一个实施例中,计算机设备根据候选画像维度组合包括的所有维度组合属性各自对应的策略效果,计算候选画像维度组合对应的策略效果,计算方式可以是对候选画像维度组合包括的所有维度组合属性各自对应的策略效果求和或者求均值等。在该种求解方式中,计算机设备根据满足维度组合属性的样本对象的策略效果,计算维度组合属性对应的策略效果,计算方式可以是对满足维度组合属性的样本对象的策略效果求和或者求均值等。在该种求解方式中,候选画像维度组合对应的策略效果,可用于反映候选画像维度组合对应的样本对象的整体策略效果。为了方便介绍,在后续实施例中将该种求解方式称为第三种求解方式。
在一个实施例中,计算机设备对归类至维度组合属性的每个样本对象的策略效果求均方误差;对候选画像维度组合包括的所有维度组合属性各自对应的均方误差求和或者求均值等,获得候选画像维度组合对应目标策略的策略效果。在该种求解方式中,计算机设备对满足维度组合属性的样本对象的策略效果求均值,得到维度组合属性对应的策略效果。为了方便介绍,在后续实施例中将该种求解方式称为第四种求解方式。
举例说明,参照图6(b),图6(b)为另一个实施例中计算候选画像维度组合对应的策略效果的流程示意图。以候选画像维度组合为“20岁以上-居住地”为例,对于20岁以上且居住地在深圳的对象1和对象5,计算机设备对对象1和对象5的策略效果求均值,计算得到“20岁以上-深圳”对应的策略效果;同理,计算机设备对对象3和对象4的策略效果求均值,计算得到“20岁以上-上海”对应的策略效果;计算机设备根据“20岁以上-深圳”对应的策略效果以及对象1和对象5的策略效果,对对象1和对象5的策略效果求均方误差,并根据“20岁以上-上海”对应的策略效果以及对象3和对象4的策略效果,对对象3和对象4的策略效果求均方误差;计算机设备对“20岁以上-深圳”和“20岁以上-上海”各自对应的均方误差求和,获得“20岁以上-居住地”对应的策略效果。
继续参照图6(b),以“20岁以上-深圳”为例,“20岁以上-深圳”对应的均方误差的求解方式可以是:计算机设备对对象1和对象5的策略效果求均值,根据对象1的策略效果与均值之差、对象5的策略效果与均值之差的平方和,获得“20岁以上-深圳”对应的均方误差。在第四种求解方式中,候选画像维度组合对应的策略效果,可用于反映以候选画像维度组合包含的画像维度作为分裂标准分裂后,对于每个维度组合属性来说,该维度组合属性对应的样本对象的策略效果的分布离散程度。
在一个实施例中,计算机设备以根节点与第一子节点所表示的画像维度组合对应的策略效果最优化作为筛选标准,从各剩余画像维度中选取第一子节点。
在一个实施例中,计算机设备将各候选画像维度组合对应的策略效果中,最优策略效果的候选画像维度组合包含的画像维度作为第一子节点。本实施例中,计算机设备可采用上述第三种求解方式计算候选画像维度组合对应的策略效果。由于在第三种求解方式中,候选画像维度组合对应的策略效果,可用于反映候选画像维度组合对应的样本对象的整体策略效果,选取最优策略效果的候选画像维度组合包含的画像维度作为第一子节点,使得第一子节点以该画像维度作为分裂标准分裂后,各维度组合属性对应的样本对象的策略效果最优,有利于快速查找策略效果较优的细分群体。
在一个实施例中,计算机设备确定各候选画像维度组合对应的策略效果中,策略效果最小值对应的画像维度组合;将构成策略效果最小值对应的画像维度组合的剩余画像维度,作为决策树模型中以末尾子节点为父节点的子节点。计算机设备将各候选画像维度组合对应的策略效果中,策略效果最小值对应的候选画像维度组合包含的画像维度作为第一子节点。本实施例中,计算机设备可采用上述第四种求解方式计算候选画像维度组合对应的策略效果。由于在第四种求解方式中,候选画像维度组合对应的策略效果,可用于反映以候选画像维度组合包含的画像维度作为分裂标准分裂后,每个维度组合属性对应的样本对象的策略效果的分布离散程度,选取策略效果最小值对应的候选画像维度组合包含的画像维度作为第一子节点,使得第一子节点以该画像维度作为分裂标准分裂后,每个维度组合属性对应的样本对象的策略效果的分布离散程度最小,也即是维度组合属性对应的样本对象的策略效果最为接近,分裂效果最好,有利于快速挖掘各细分群体对应的策略效果。
步骤S208,基于从群体划分决策树的根节点到叶子节点所表示的各细分群体分别对应的策略效果,确定对应目标策略的较优细分群体。
其中,维度组合属性可用于描述满足多于一个维度属性的细分群体。在一个实施例中,计算机设备可根据群体划分决策树中各节点所构成的群体划分路径涵盖的维度属性,确定各节点所表示的细分群体。继续参照图5,节点502与节点506所构成的群体划分路径所涵盖的维度属性包括:“年龄>20岁”、“居住地为上海”,节点502与节点506所表示的细分群体为:“上海20岁以上的对象”。
如前所述,在决策树模型的训练过程中,计算各节点所表示的细分群体的策略效果。在一个实施例中,群体划分决策树中各节点对应有策略效果,其中,根节点对应的策略效果,可用于描述所有样本对象的策略效果;群体划分决策树中除根节点以外的其它节点对应的策略效果,可用于描述以该节点作为末尾节点的群体划分路径所描述的细分群体的策略效果。继续参照图5,节点506对应的策略效果,用于表示节点502、节点504与节点506构成的群体划分路径所描述的细分群体的策略效果,也即是“上海20岁以上的对象”的策略效果。
在一个实施例中,计算机设备基于停止迭代时群体划分决策树中从根节点到叶子节点所表示的各细分群体分别对应的策略效果,将大于阈值的策略效果所对应的细分群体,作为较优细分群体。其中,阈值以及较优细分群体的数量可根据实际应用进行设定,本申请不做具体限定。继续参照图5,可以看到,节点510对应的策略效果最优,节点502与节点510所表示的细分群体为:“10岁及以上且20岁以下的女性对象”,也就是说,对应目标策略的最优策略效果的细分群体为“10岁及以上且20岁以下的女性对象”。
上述对象数据处理方法中,一方面,根据与对象画像数据的各画像维度对应的对象行为数据中属于第一命中类别的占比,将与各画像维度对应的对象行为数据转换为对应目标策略的策略效果,解决了在A/B测试场景下无法获取样本对象的策略效果的问题,使得本申请实施例可基于决策树算法从测试结果中挖掘细分群体的策略结果;另一方面,将与各画像维度对应的策略效果输入决策树模型,以决策树模型中节点所表示的画像维度组合对应的策略效果最优化为目标,对决策树模型进行训练得到群体划分决策树,基于从群体划分决策树的根节点到叶子节点所表示的各细分群体分别对应的策略效果,即可确定对应目标策略的较优细分群体,由于以决策树模型中节点所表示的画像维度组合对应的策略效果最优化为目标训练决策树模型,能够减少画像维度组合数量,且能够保证群体划分决策树中节点所表示的画像维度组合具有局部最优的特性,从而避免传统技术中组合爆炸的问题,提高从测试结果中挖掘细分群体策略结果的效率。
在一个实施例中,参照图7,根据占比将维度属性对应的对象行为数据转换为维度属性对应的策略效果,包括:
步骤S702,根据占比确定属于第一命中类别的对象行为数据的第一权重系数,按第一权重系数,将维度属性对应的对象行为数据中属于第一命中类别的样本对象对应的对象行为数据,转换为样本对象对应的策略效果。
发明人发现,样本对象策略效果与对象行为数据之间存在如下转换关系:
Figure 300350DEST_PATH_IMAGE012
其中,
Figure DEST_PATH_IMAGE013
表示第
Figure 277534DEST_PATH_IMAGE014
个样本对象的策略效果,
Figure DEST_PATH_IMAGE015
表示
Figure 283667DEST_PATH_IMAGE014
个样本对象的平均策略效 果;
Figure 734109DEST_PATH_IMAGE016
表示第
Figure 379854DEST_PATH_IMAGE014
个样本对象属于第一命中类别时的对象行为数据,
Figure DEST_PATH_IMAGE017
表示第
Figure 36094DEST_PATH_IMAGE014
个样本对象 属于第二命中类别时的对象行为数据;当样本对象属于第一命中类别时,
Figure 330023DEST_PATH_IMAGE018
取值为1,当样 本对象属于第二命中类别时,
Figure DEST_PATH_IMAGE019
取值为0;
Figure 905360DEST_PATH_IMAGE004
表示画像维度,
Figure 789134DEST_PATH_IMAGE005
表示画像维度的第
Figure 904857DEST_PATH_IMAGE006
个维 度属性;
Figure 321801DEST_PATH_IMAGE020
表示第
Figure 864778DEST_PATH_IMAGE006
个维度属性对应的对象行为数据中属于第一命中类别的占比。
在一个实施例中,属于第一命中类别的样本对象对应的策略效果通过以下公式计算得到:
Figure DEST_PATH_IMAGE021
其中,
Figure 298164DEST_PATH_IMAGE022
表示属于第一命中类别的第
Figure 469776DEST_PATH_IMAGE014
个样本对象对应的策略效果;
Figure 491959DEST_PATH_IMAGE004
表示画 像维度,
Figure 956569DEST_PATH_IMAGE005
表示画像维度的第
Figure 64203DEST_PATH_IMAGE006
个维度属性;
Figure 662674DEST_PATH_IMAGE020
表示第
Figure 523052DEST_PATH_IMAGE006
个维度属性对应的对象行为 数据中属于第一命中类别的占比;
Figure 673410DEST_PATH_IMAGE008
表示属于第一命中类别的第
Figure 19072DEST_PATH_IMAGE014
个样本对象的对象行 为数据;
在一个实施例中,属于第二命中类别的样本对象对应的策略效果通过以下公式计算得到:
Figure DEST_PATH_IMAGE023
其中,
Figure 588944DEST_PATH_IMAGE010
表示属于第二命中类别的第
Figure 54560DEST_PATH_IMAGE014
个样本对象对应的策略效果;
Figure 392132DEST_PATH_IMAGE004
表示画像 维度,
Figure 208778DEST_PATH_IMAGE005
表示画像维度的第
Figure 522954DEST_PATH_IMAGE006
个维度属性;
Figure 249601DEST_PATH_IMAGE020
表示第
Figure 7342DEST_PATH_IMAGE006
个维度属性对应的对象行为数 据中属于第一命中类别的占比;
Figure 62017DEST_PATH_IMAGE011
表示属于第二命中类别的第
Figure 930615DEST_PATH_IMAGE014
个样本对象的对象行为数 据步骤S704,根据占比确定属于第二命中类别的对象行为数据的第二权重系数,按第二权 重系数,将维度属性对应的对象行为数据中属于第二命中类别的样本对象对应的对象行为 数据,转换为样本对象对应的策略效果。
步骤S706,对维度属性对应的每个样本对象的策略效果求平均值,获得维度属性对应的策略效果。
本实施例中,根据样本对象的对象行为数据,以及样本对象所属的维度属性对应的对象行为数据中属于第一命中类别的占比,计算样本对象对应目标策略的策略效果,解决了在AB测试场景下无法获取样本对象的策略效果的问题,使得本申请实施例可基于决策树算法从测试结果中挖掘细分群体的策略结果。
在一个实施例中,将当前确定的画像维度组合与各剩余画像维度构成的各候选画像维度组合分别对应的对象行为数据转换为相应策略效果,包括:分别确定各候选画像维度组合所包括的维度组合属性;对样本对象对应的对象行为数据按维度组合属性进行归类,得到各维度组合属性分别对应的对象行为数据;根据属于相同候选画像维度组合的维度组合属性所对应的对象行为数据,获得各候选画像维度组合对应的对象行为数据;根据各候选画像维度组合对应的对象行为数据中属于第一命中类别的占比,将与各候选画像维度组合对应的对象行为数据转换为对应目标策略的策略效果。
下面以生成第二子节点为例,简要介绍子节点的生成方式:
在一个实施例中,由于第一子节点可分裂为多于一个分支,对于第一子节点的每个分支,计算机设备获取该分支表示的维度组合属性与第一子节点对应的剩余画像维度构成的各候选画像维度组合,根据各候选画像维度组合对应的策略效果,从剩余画像维度中确定与第一子节点通过该分支相连的子节点。
在一个实施例中,每个画像维度组合可包括多于一个维度组合属性,维度组合属性是多于一个维度属性的组合。继续参照图3,画像维度组合“20岁以上-上海-性别”所包括的维度组合属性可以是:“20岁以上-上海-男性”、“20岁以上-上海-女性”等。
在一个实施例中,候选画像维度组合对应目标策略的策略效果,可由候选画像维度组合所包括的维度组合属性对应目标策略的策略效果计算得到,维度组合属性对应目标策略的策略效果,可由满足维度组合属性的样本对象的策略效果计算得到。继续参照图3,以当前确定的画像维度组合与剩余画像维度构成的候选画像维度组合为 “20岁以上-上海-性别”为例,“20岁以上-上海-性别”对应的策略效果,可由“20岁以上-上海-男性”和“20岁以上-上海-女性”各自对应的策略效果计算得到,“20岁以上-上海-男性”对应的策略效果,可由对象4的策略效果计算得到。
在一个实施例中,计算机设备根据各候选画像维度组合对应的对象行为数据中属于第一命中类别的占比,将各候选画像维度组合对应的对象行为数据转换为各候选画像维度组合对应的策略效果。
在一个实施例中,候选画像维度组合对应的对象行为数据,可以是候选画像维度组合所包括的维度组合属性各自对应的对象行为数据,维度组合属性对应的对象行为数据,可以是满足维度组合属性的样本对象的对象行为数据。继续参照图3,“20岁以上-上海-男性”对应的对象行为数据是对象4的点击率,“20岁以上-上海-女性”对应的对象行为数据是对象3的点击率,候选画像维度组合“20岁以上-上海-性别”对应的对象行为数据是对象3和对象4的点击率。
在一个实施例中,对于每个候选画像维度组合,确定候选画像维度组合所包括的维度组合属性;对于每个维度组合属性,确定维度组合属性对应的对象行为数据中属于第一命中类别的占比,根据占比将维度组合属性对应的对象行为数据转换为维度组合属性对应的策略效果;根据候选画像维度组合包括的所有维度组合属性各自对应的策略效果,计算候选画像维度组合对应目标策略的策略效果。
在一个实施例中,计算机设备获取候选画像维度组合包括的所有维度组合属性,根据各维度组合属性分别对应的对象行为数据中属于第一命中类别的占比,将各维度组合属性对应的对象行为数据转换为对应目标策略的策略效果,根据候选画像维度组合包括的所有维度组合属性分别对应目标策略的策略效果,计算候选画像维度组合对应目标策略的策略效果。
在一个实施例中,对于每个维度组合属性,计算机设备确定维度组合属性对应的对象行为数据中属于第一命中类别的占比,根据占比将满足维度组合属性的样本对象的对象行为数据,转换为样本对象对应目标策略的策略效果,基于满足维度组合属性的样本对象的策略效果,获得维度组合属性对应的策略效果。
在一个实施例中,计算机设备根据样本对象的对象行为数据,以及样本对象所属的维度组合属性对应的对象行为数据中属于第一命中类别的占比,计算样本对象对应目标策略的策略效果。
关于候选画像维度组合对应目标策略的策略效果的计算方式,可采用上述第三种求解方式或者第四种求解方式,在此不再赘述。在采用上述第三种求解方式时,计算机设备将各候选画像维度组合对应的策略效果中,最优策略效果的候选画像维度组合包含的画像维度作为第二子节点。在采用上述第四种求解方式时,计算机设备确定各候选画像维度组合对应的策略效果中,策略效果最小值对应的画像维度组合;将构成策略效果最小值对应的画像维度组合的剩余画像维度作为第二子节点。
在一个实施例中,根据占比将维度组合属性对应的对象行为数据转换为维度组合属性对应的策略效果,包括:根据占比确定属于第一命中类别的对象行为数据的第一权重系数;根据占比确定属于第二命中类别的对象行为数据的第二权重系数;按第一权重系数,将维度组合属性对应的对象行为数据中属于第一命中类别的样本对象对应的对象行为数据,转换为样本对象对应的策略效果;按第二权重系数,将维度组合属性对应的对象行为数据中属于第二命中类别的样本对象对应的对象行为数据,转换为样本对象对应的策略效果;对维度组合属性对应的每个样本对象的策略效果求平均值,获得维度组合属性对应的策略效果。
关于将维度组合属性对应的对象行为数据转换为维度组合属性对应的策略效果的具体实施方式,可参照上述将维度属性对应的对象行为数据转换为维度属性对应的策略效果的实施例,在此不再赘述。
本实施例中,将各候选画像维度组合分别对应的对象行为数据转换为相应策略效果,解决了在AB测试场景下无法获取样本对象的策略效果的问题,使得本申请实施例可基于决策树算法从测试结果中挖掘细分群体的策略结果。
在一个实施例中,该方法还包括:在更新决策树模型时,确定决策树模型中从根节点到子节点构成的画像维度组合对应的样本对象数量;修剪样本对象数量小于预设阈值的子节点。
本实施例中,在决策树模型的训练过程中,计算机设备确定从根节点到子节点构成的画像维度组合对应的样本对象数量,若样本对象数量小于预设阈值,则修剪该子节点,以消除由于样本对象数量少导致的数据不置信问题。
在一个实施例中,该方法还包括:获得群体划分决策树后,从根节点开始遍历群体划分决策树;当从根节点到当前遍历到的节点所构成的画像维度组合所对应的样本对象数量小于预设阈值时,从群体划分决策树修剪当前遍历到的节点。
本实施例中,获得群体划分决策树后,计算机设备从根节点开始遍历群体划分决策树,当从根节点到当前遍历到的节点所构成的画像维度组合所对应的样本对象数量小于预设阈值时,则修剪当前遍历到的节点,以消除由于样本对象数量少导致的数据不置信问题。
在一个实施例中,该方法还包括:获取与各对象标识对应的对象画像数据;根据对象画像数据确定与较优细分群体匹配的目标对象标识;对以目标对象标识登录的目标应用程序实施目标策略。
其中,对象标识用于唯一标识对象。
本申请实施例可应用于互联网产品上线场景,具体是对互联网产品上线场景中所采用的A/B测试的测试结果进行细粒度分析,从测试结果中挖掘测试效果好的细分群体,以对测试效果好的细分群体上线A/B测试的测试内容。比如,测试内容可以是针对互联网产品提出的新方案或者优化方案,从测试结果中挖掘测试效果好的细分群体,以对测试效果好的细分群体针对性上线新方案或者优化方案。
具体地,计算机设备获取与各对象标识对应的对象画像数据,根据对象画像数据确定与较优细分群体匹配的目标对象标识,对以目标对象标识登录的目标应用程序实施目标策略。
本实施例中,从测试结果中挖掘测试效果好的细分群体,以对测试效果好的细分群体针对性上线新方案或者优化方案,提高信息转化效率。
在一个实施例中,如图8所示,提供了一种对象数据处理方法,本实施例主要以该方法应用于计算机设备(上述图1中的终端102或服务器104)来举例说明,包括以下步骤:
步骤S802,获取各样本对象对应的对象画像数据、对象行为数据以及对应目标策略的命中类别,命中类别包括对样本对象实施目标策略的第一命中类别和未对样本对象实施目标策略的第二命中类别中的一种。
步骤S804,对于每个画像维度,确定画像维度所包括的维度属性,对于每个维度属性,确定维度属性对应的对象行为数据中属于第一命中类别的占比,根据占比将维度属性对应的对象行为数据转换为维度属性对应的策略效果。
具体地,计算机设备根据占比确定属于第一命中类别的对象行为数据的第一权重系数;根据占比确定属于第二命中类别的对象行为数据的第二权重系数;按第一权重系数,将维度属性对应的对象行为数据中属于第一命中类别的样本对象对应的对象行为数据,转换为样本对象对应的策略效果;按第二权重系数,将维度属性对应的对象行为数据中属于第二命中类别的样本对象对应的对象行为数据,转换为样本对象对应的策略效果;对维度属性对应的每个样本对象的策略效果求平均值,获得维度属性对应的策略效果。
步骤S806,对维度属性对应的每个样本对象的策略效果求平均值,获得维度属性对应的策略效果根据画像维度包括的各维度属性各自对应的策略效果以及各维度属性对应的每个样本对象的策略效果,对各维度属性对应的每个样本对象的策略效果求均方误差,对画像维度包括的所有维度属性各自对应的均方误差求和,获得画像维度对应目标策略的策略效果。
步骤S808,将与各画像维度对应的策略效果输入决策树模型,根据各画像维度对应目标策略的策略效果,确定决策树模型的根节点。
步骤S810,确定根节点表示的画像维度与各剩余画像维度构成的各候选画像维度组合分别对应的对象行为数据,按照各候选画像维度组合对应的对象行为数据中属于第一命中类别的占比,将各候选画像维度组合对应的对象行为数据转换为各候选画像维度组合对应的策略效果,根据各候选画像维度组合对应的策略效果,从各剩余画像维度中确定与根节点相连的子节点。
步骤S812,迭代地确定当前决策树模型中从根节点到末尾子节点构成的画像维度组合,将当前确定的画像维度组合与各剩余画像维度构成的各候选画像维度组合分别对应的对象行为数据转换为相应策略效果,并根据各策略效果从各剩余画像维度中确定以末尾子节点为父节点的子节点后,获得更新的决策树模型,基于停止迭代时的决策树模型,获得群体划分决策树。
在决策树模型的训练过程中,计算机设备先生成决策树模型的根节点,接着生成与根节点相连的第一子节点,根节点与第一子节点通过根节点的分支相连接,再生成与第一子节点相连的第二子节点,第一子节点与第二子节点通过第一子节点的分支相连接,就这样不断地生成决策树模型的子节点,直至生成决策树模型的叶子节点。
在一个实施例中,计算机设备以决策树模型中节点所表示的画像维度组合对应的策略效果最优化作为筛选标准,从剩余的画像维度中选取画像维度作为节点。
在一个实施例中,当全部的画像维度均筛选作为决策树模型的节点时,停止迭代。在另一些实施例中,当决策树模型的每条群体划分路径均包括全部的画像维度时,停止迭代。
具体地,计算机设备分别确定各候选画像维度组合所包括的维度组合属性;对样本对象对应的对象行为数据按维度组合属性进行归类,得到各维度组合属性分别对应的对象行为数据;根据属于相同候选画像维度组合的维度组合属性所对应的对象行为数据,获得各候选画像维度组合对应的对象行为数据;根据各候选画像维度组合对应的对象行为数据中属于第一命中类别的占比,将与各候选画像维度组合对应的对象行为数据转换为对应目标策略的策略效果。
具体地,对于每个候选画像维度组合,计算机设备确定候选画像维度组合所包括的维度组合属性;对于每个维度组合属性,确定维度组合属性对应的对象行为数据中属于第一命中类别的占比,根据占比将维度组合属性对应的对象行为数据转换为维度组合属性对应的策略效果;根据候选画像维度组合包括的所有维度组合属性各自对应的策略效果,计算候选画像维度组合对应目标策略的策略效果。
具体地,计算机设备根据占比确定属于第一命中类别的对象行为数据的第一权重系数;根据占比确定属于第二命中类别的对象行为数据的第二权重系数;按第一权重系数,将维度组合属性对应的对象行为数据中属于第一命中类别的样本对象对应的对象行为数据,转换为样本对象对应的策略效果;按第二权重系数,将维度组合属性对应的对象行为数据中属于第二命中类别的样本对象对应的对象行为数据,转换为样本对象对应的策略效果;对维度组合属性对应的每个样本对象的策略效果求平均值,获得维度组合属性对应的策略效果。
具体地,计算机设备对维度组合属性对应的每个样本对象的策略效果求平均值,获得维度组合属性对应的策略效果;对归类至维度组合属性的每个样本对象的策略效果求均方误差;对候选画像维度组合包括的所有维度组合属性各自对应的均方误差求和,获得候选画像维度组合对应目标策略的策略效果。
步骤S814,基于从群体划分决策树的根节点到叶子节点所表示的各细分群体分别对应的策略效果,确定对应目标策略的较优细分群体。
上述对象数据处理方法,一方面,根据与对象画像数据的各画像维度对应的对象行为数据中属于第一命中类别的占比,将与各画像维度对应的对象行为数据转换为对应目标策略的策略效果,解决了在A/B测试场景下无法获取样本对象的策略效果的问题,使得本申请实施例可基于决策树算法从测试结果中挖掘细分群体的策略结果;另一方面,将与各画像维度对应的策略效果输入决策树模型,以决策树模型中节点所表示的画像维度组合对应的策略效果最优化为目标,对决策树模型进行训练得到群体划分决策树,基于从群体划分决策树的根节点到叶子节点所表示的各细分群体分别对应的策略效果,即可确定对应目标策略的较优细分群体,由于以决策树模型中节点所表示的画像维度组合对应的策略效果最优化为目标训练决策树模型,能够减少画像维度组合数量,且能够保证群体划分决策树中节点所表示的画像维度组合具有局部最优的特性,从而避免传统技术中组合爆炸的问题,提高从测试结果中挖掘细分群体策略结果的效率。
应该理解的是,虽然图2、图7-8的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2、图7-8中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图9所示,提供了一种对象数据处理装置,该装置可以采用软件模块或硬件模块,或者是二者的结合成为计算机设备的一部分,该装置具体包括:获取模块902、转换模块904、训练模块906和确定模块908,其中:
获取模块902,用于获取各样本对象对应的对象画像数据、对象行为数据以及对应目标策略的命中类别,命中类别包括对样本对象实施目标策略的第一命中类别和未对样本对象实施目标策略的第二命中类别中的一种;
转换模块904,用于根据与对象画像数据的各画像维度对应的对象行为数据中属于第一命中类别的占比,将与各画像维度对应的对象行为数据转换为对应目标策略的策略效果;
训练模块906,用于将与各画像维度对应的策略效果输入决策树模型,以决策树模型中节点所表示的画像维度组合对应的策略效果最优化为目标,对决策树模型进行训练,得到群体划分决策树;
确定模块908,用于基于从群体划分决策树的根节点到叶子节点所表示的各细分群体分别对应的策略效果,确定对应目标策略的较优细分群体。
在一个实施例中,获取模块902,还用于:对各样本对象对应的对象画像数据进行分类,得到各画像维度及属于各画像维度的维度属性;对各样本对象对应的对象行为数据按维度属性进行归类,得到对应各维度属性的对象行为数据;根据属于相同画像维度的维度属性所对应的对象行为数据,获得各画像维度对应的对象行为数据。
在一个实施例中,转换模块904,还用于:对于每个画像维度,确定画像维度所包括的维度属性;对于每个维度属性,确定维度属性对应的对象行为数据中属于第一命中类别的占比,根据占比将维度属性对应的对象行为数据转换为维度属性对应的策略效果;根据画像维度包括的所有维度属性各自对应的策略效果,计算画像维度对应目标策略的策略效果。
在一个实施例中,转换模块904,还用于:根据占比确定属于第一命中类别的对象行为数据的第一权重系数;根据占比确定属于第二命中类别的对象行为数据的第二权重系数;按第一权重系数,将维度属性对应的对象行为数据中属于第一命中类别的样本对象对应的对象行为数据,转换为样本对象对应的策略效果;按第二权重系数,将维度属性对应的对象行为数据中属于第二命中类别的样本对象对应的对象行为数据,转换为样本对象对应的策略效果;对维度属性对应的每个样本对象的策略效果求平均值,获得维度属性对应的策略效果。
在一个实施例中,转换模块904,还用于通过以下公式计算属于第一命中类别的样本对象对应的策略效果:
Figure 888601DEST_PATH_IMAGE024
其中,
Figure 20505DEST_PATH_IMAGE022
表示属于第一命中类别的第
Figure 562476DEST_PATH_IMAGE014
个样本对象对应的策略效果;
Figure 703607DEST_PATH_IMAGE004
表示画 像维度,
Figure 778748DEST_PATH_IMAGE005
表示画像维度的第
Figure 347133DEST_PATH_IMAGE006
个维度属性;
Figure 376400DEST_PATH_IMAGE020
表示第
Figure 321222DEST_PATH_IMAGE006
个维度属性对应的对象行为 数据中属于第一命中类别的占比;
Figure 876968DEST_PATH_IMAGE008
表示属于第一命中类别的第
Figure 151609DEST_PATH_IMAGE014
个样本对象的对象行 为数据。
转换模块904,还用于通过以下公式计算属于第二命中类别的样本对象对应的策略效果:
Figure DEST_PATH_IMAGE025
其中,
Figure 730489DEST_PATH_IMAGE010
表示属于第二命中类别的第
Figure 213423DEST_PATH_IMAGE014
个样本对象对应的策略效果;
Figure 997577DEST_PATH_IMAGE004
表示画像 维度,
Figure 907764DEST_PATH_IMAGE005
表示画像维度的第
Figure 911623DEST_PATH_IMAGE006
个维度属性;
Figure 463827DEST_PATH_IMAGE020
表示第
Figure 994166DEST_PATH_IMAGE006
个维度属性对应的对象行为数 据中属于第一命中类别的占比;
Figure 858610DEST_PATH_IMAGE011
表示属于第二命中类别的第
Figure 599033DEST_PATH_IMAGE014
个样本对象的对象行为数 据。
在一个实施例中,转换模块904,还用于:根据画像维度包括的各维度属性各自对应的策略效果以及各维度属性对应的每个样本对象的策略效果,对各维度属性对应的每个样本对象的策略效果求均方误差;对画像维度包括的所有维度属性各自对应的均方误差求和,获得画像维度对应目标策略的策略效果。
在一个实施例中,训练模块906,还用于:将与各画像维度对应的策略效果输入决策树模型;根据各画像维度对应目标策略的策略效果,确定决策树模型的根节点;迭代地确定当前决策树模型中从根节点到末尾子节点构成的画像维度组合,将当前确定的画像维度组合与各剩余画像维度构成的各候选画像维度组合分别对应的对象行为数据转换为相应策略效果,并根据各策略效果从各剩余画像维度中确定以末尾子节点为父节点的子节点后,获得更新的决策树模型;基于停止迭代时的决策树模型,获得群体划分决策树。
在一个实施例中,训练模块906,还用于:确定根节点表示的画像维度与各剩余画像维度构成的各候选画像维度组合分别对应的对象行为数据;按照各候选画像维度组合对应的对象行为数据中属于第一命中类别的占比,将各候选画像维度组合对应的对象行为数据转换为各候选画像维度组合对应的策略效果;根据各候选画像维度组合对应的策略效果,从各剩余画像维度中确定与根节点相连的子节点。
在一个实施例中,训练模块906,还用于:分别确定各候选画像维度组合所包括的维度组合属性;对样本对象对应的对象行为数据按维度组合属性进行归类,得到各维度组合属性分别对应的对象行为数据;根据属于相同候选画像维度组合的维度组合属性所对应的对象行为数据,获得各候选画像维度组合对应的对象行为数据;根据各候选画像维度组合对应的对象行为数据中属于第一命中类别的占比,将与各候选画像维度组合对应的对象行为数据转换为对应目标策略的策略效果。
在一个实施例中,训练模块906,还用于:对于每个候选画像维度组合,确定候选画像维度组合所包括的维度组合属性;对于每个维度组合属性,确定维度组合属性对应的对象行为数据中属于第一命中类别的占比,根据占比将维度组合属性对应的对象行为数据转换为维度组合属性对应的策略效果;根据候选画像维度组合包括的所有维度组合属性各自对应的策略效果,计算候选画像维度组合对应目标策略的策略效果。
在一个实施例中,训练模块906,还用于:根据占比确定属于第一命中类别的对象行为数据的第一权重系数;根据占比确定属于第二命中类别的对象行为数据的第二权重系数;按第一权重系数,将维度组合属性对应的对象行为数据中属于第一命中类别的样本对象对应的对象行为数据,转换为样本对象对应的策略效果;按第二权重系数,将维度组合属性对应的对象行为数据中属于第二命中类别的样本对象对应的对象行为数据,转换为样本对象对应的策略效果;对维度组合属性对应的每个样本对象的策略效果求平均值,获得维度组合属性对应的策略效果。
在一个实施例中,训练模块906,还用于:对归类至维度组合属性的每个样本对象的策略效果求均方误差;对候选画像维度组合包括的所有维度组合属性各自对应的均方误差求和,获得候选画像维度组合对应目标策略的策略效果。
在一个实施例中,训练模块906,还用于:确定各候选画像维度组合对应的策略效果中,策略效果最小值对应的画像维度组合;将构成策略效果最小值对应的画像维度组合的剩余画像维度,作为决策树模型中以末尾子节点为父节点的子节点。
在一个实施例中,训练模块906,还用于:在更新决策树模型时,确定决策树模型中从根节点到子节点构成的画像维度组合对应的样本对象数量;修剪样本对象数量小于预设阈值的子节点。
在一个实施例中,确定模块908,还用于:基于停止迭代时群体划分决策树中从根节点到叶子节点所表示的各细分群体分别对应的策略效果,将大于阈值的策略效果所对应的细分群体,作为较优细分群体。
在一个实施例中,对象数据处理装置还包括修剪模块,修剪模块,还用于:获得群体划分决策树后,从根节点开始遍历群体划分决策树;当从根节点到当前遍历到的节点所构成的画像维度组合所对应的样本对象数量小于预设阈值时,从群体划分决策树修剪当前遍历到的节点。
在一个实施例中,对象数据处理装置还包括实施模块,实施模块,还用于:获取与各对象标识对应的对象画像数据;根据对象画像数据确定与较优细分群体匹配的目标对象标识;对以目标对象标识登录的目标应用程序实施目标策略。
关于对象数据处理装置的具体限定可以参见上文中对于对象数据处理方法的限定,在此不再赘述。上述对象数据处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
上述对象数据处理装置中,一方面,根据与对象画像数据的各画像维度对应的对象行为数据中属于第一命中类别的占比,将与各画像维度对应的对象行为数据转换为对应目标策略的策略效果,解决了在AB测试场景下无法获取样本对象的策略效果的问题,使得本申请实施例可基于决策树算法从测试结果中挖掘细分群体的策略结果;另一方面,将与各画像维度对应的策略效果输入决策树模型,以决策树模型中节点所表示的画像维度组合对应的策略效果最优化为目标,对决策树模型进行训练得到群体划分决策树,基于从群体划分决策树的根节点到叶子节点所表示的各细分群体分别对应的策略效果,即可确定对应目标策略的较优细分群体,由于以决策树模型中节点所表示的画像维度组合对应的策略效果最优化为目标训练决策树模型,能够减少画像维度组合数量,且能够保证群体划分决策树中节点所表示的画像维度组合具有局部最优的特性,从而避免传统技术中组合爆炸的问题,提高从测试结果中挖掘细分群体策略结果的效率。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储对象数据处理数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种对象数据处理方法。
本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (15)

1.一种对象数据处理方法,其特征在于,所述方法包括:
获取各样本对象对应的对象画像数据、对象行为数据以及对应目标策略的命中类别,所述命中类别包括对所述样本对象实施所述目标策略的第一命中类别和未对所述样本对象实施所述目标策略的第二命中类别中的一种;
根据与所述对象画像数据的各画像维度对应的对象行为数据中属于所述第一命中类别的占比,将与各所述画像维度对应的对象行为数据转换为对应所述目标策略的策略效果;
将与各所述画像维度对应的策略效果输入决策树模型,以所述决策树模型中节点所表示的画像维度组合对应的策略效果最优化为目标,对所述决策树模型进行训练,得到群体划分决策树;
基于从所述群体划分决策树的根节点到叶子节点所表示的各细分群体分别对应的策略效果,确定对应所述目标策略的较优细分群体。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对各所述样本对象对应的对象画像数据进行分类,得到各所述画像维度及属于各所述画像维度的维度属性;
对各所述样本对象对应的对象行为数据按所述维度属性进行归类,得到对应各所述维度属性的对象行为数据;
根据属于相同画像维度的维度属性所对应的对象行为数据,获得各所述画像维度对应的对象行为数据。
3.根据权利要求2所述的方法,其特征在于,所述根据与所述对象画像数据的各画像维度对应的对象行为数据中属于所述第一命中类别的占比,将与各所述画像维度对应的对象行为数据转换为对应所述目标策略的策略效果,包括:
对于每个画像维度,确定所述画像维度所包括的维度属性;
对于每个维度属性,确定所述维度属性对应的对象行为数据中属于所述第一命中类别的占比,根据所述占比将所述维度属性对应的对象行为数据转换为所述维度属性对应的策略效果;
根据所述画像维度包括的所有维度属性各自对应的策略效果,计算所述画像维度对应所述目标策略的策略效果。
4.根据权利要求3所述的方法,其特征在于,所述根据所述占比将所述维度属性对应的对象行为数据转换为所述维度属性对应的策略效果,包括:
根据所述占比确定属于所述第一命中类别的对象行为数据的第一权重系数;
根据所述占比确定属于所述第二命中类别的对象行为数据的第二权重系数;
按所述第一权重系数,将所述维度属性对应的对象行为数据中属于所述第一命中类别的样本对象对应的对象行为数据,转换为样本对象对应的策略效果;
按所述第二权重系数,将所述维度属性对应的对象行为数据中属于所述第二命中类别的样本对象对应的对象行为数据,转换为样本对象对应的策略效果;
对所述维度属性对应的每个样本对象的策略效果求平均值,获得所述维度属性对应的策略效果。
5.根据权利要求4所述的方法,其特征在于,属于所述第一命中类别的样本对象对应的策略效果通过以下公式计算得到:
Figure 230165DEST_PATH_IMAGE001
其中,
Figure 768593DEST_PATH_IMAGE002
表示属于所述第一命中类别的第
Figure 825411DEST_PATH_IMAGE003
个样本对象对应的策略效果;
Figure 982854DEST_PATH_IMAGE004
表示所述 画像维度,
Figure 808728DEST_PATH_IMAGE005
表示所述画像维度的第
Figure 783637DEST_PATH_IMAGE006
个维度属性;
Figure 579948DEST_PATH_IMAGE007
表示所述第
Figure 790349DEST_PATH_IMAGE006
个维度属性对应 的对象行为数据中属于所述第一命中类别的占比;
Figure 346096DEST_PATH_IMAGE008
表示属于所述第一命中类别的第
Figure 367272DEST_PATH_IMAGE003
个样本对象的对象行为数据;
属于所述第二命中类别的样本对象对应的策略效果通过以下公式计算得到:
Figure 133103DEST_PATH_IMAGE009
其中,
Figure 130884DEST_PATH_IMAGE010
表示属于所述第二命中类别的第
Figure 806716DEST_PATH_IMAGE003
个样本对象对应的策略效果;
Figure 248062DEST_PATH_IMAGE004
表示所述 画像维度,
Figure 251921DEST_PATH_IMAGE005
表示所述画像维度的第
Figure 804125DEST_PATH_IMAGE006
个维度属性;
Figure 334463DEST_PATH_IMAGE007
表示所述第
Figure 263406DEST_PATH_IMAGE006
个维度属性对应 的对象行为数据中属于所述第一命中类别的占比;
Figure 3829DEST_PATH_IMAGE011
表示属于所述第二命中类别的第
Figure 500670DEST_PATH_IMAGE003
个 样本对象的对象行为数据。
6.根据权利要求3所述的方法,其特征在于,所述根据所述画像维度包括的所有维度属性各自对应的策略效果,计算所述画像维度对应所述目标策略的策略效果,包括:
根据所述画像维度包括的各所述维度属性各自对应的策略效果以及各所述维度属性对应的每个样本对象的策略效果,对各所述维度属性对应的每个样本对象的策略效果求均方误差;
对所述画像维度包括的所有维度属性各自对应的均方误差求和,获得所述画像维度对应所述目标策略的策略效果。
7.根据权利要求1所述的方法,其特征在于,所述将与各所述画像维度对应的策略效果输入决策树模型,以所述决策树模型中节点所表示的画像维度组合对应的策略效果最优化为目标,对所述决策树模型进行训练,得到群体划分决策树,包括:
将与各所述画像维度对应的所述策略效果输入所述决策树模型;
根据各所述画像维度对应所述目标策略的策略效果,确定所述决策树模型的根节点;
迭代地确定当前所述决策树模型中从所述根节点到末尾子节点构成的画像维度组合,将当前确定的画像维度组合与各剩余画像维度构成的各候选画像维度组合分别对应的对象行为数据转换为相应策略效果,并根据各所述策略效果从各剩余画像维度中确定以所述末尾子节点为父节点的子节点后,获得更新的决策树模型;
基于停止迭代时的决策树模型,获得所述群体划分决策树。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
确定所述根节点表示的画像维度与各剩余画像维度构成的各候选画像维度组合分别对应的对象行为数据;
按照各候选画像维度组合对应的对象行为数据中属于所述第一命中类别的占比,将各候选画像维度组合对应的对象行为数据转换为各候选画像维度组合对应的策略效果;
根据各候选画像维度组合对应的策略效果,从各剩余画像维度中确定与所述根节点相连的子节点。
9.根据权利要求7所述的方法,其特征在于,所述将当前确定的画像维度组合与各剩余画像维度构成的各候选画像维度组合分别对应的对象行为数据转换为相应策略效果,包括:
分别确定各候选画像维度组合所包括的维度组合属性;
对所述样本对象对应的对象行为数据按所述维度组合属性进行归类,得到各所述维度组合属性分别对应的对象行为数据;
根据属于相同候选画像维度组合的维度组合属性所对应的对象行为数据,获得各候选画像维度组合对应的对象行为数据;
根据各候选画像维度组合对应的对象行为数据中属于所述第一命中类别的占比,将与各候选画像维度组合对应的对象行为数据转换为对应所述目标策略的策略效果。
10.根据权利要求9所述的方法,其特征在于,所述根据各候选画像维度组合对应的对象行为数据中属于所述第一命中类别的占比,将与各候选画像维度组合对应的对象行为数据转换为对应所述目标策略的策略效果,包括:
对于每个候选画像维度组合,确定所述候选画像维度组合所包括的维度组合属性;
对于每个维度组合属性,确定所述维度组合属性对应的对象行为数据中属于所述第一命中类别的占比,根据所述占比将所述维度组合属性对应的对象行为数据转换为所述维度组合属性对应的策略效果;
根据所述候选画像维度组合包括的所有维度组合属性各自对应的策略效果,计算所述候选画像维度组合对应所述目标策略的策略效果。
11.根据权利要求10所述的方法,其特征在于,所述根据所述占比将所述维度组合属性对应的对象行为数据转换为所述维度组合属性对应的策略效果,包括:
根据所述占比确定属于所述第一命中类别的对象行为数据的第一权重系数;
根据所述占比确定属于所述第二命中类别的对象行为数据的第二权重系数;
按所述第一权重系数,将所述维度组合属性对应的对象行为数据中属于所述第一命中类别的样本对象对应的对象行为数据,转换为样本对象对应的策略效果;
按所述第二权重系数,将所述维度组合属性对应的对象行为数据中属于所述第二命中类别的样本对象对应的对象行为数据,转换为样本对象对应的策略效果;
对所述维度组合属性对应的每个样本对象的策略效果求平均值,获得所述维度组合属性对应的策略效果。
12.根据权利要求10所述的方法,其特征在于,所述根据所述候选画像维度组合包括的所有维度组合属性各自对应的策略效果,计算所述候选画像维度组合对应所述目标策略的策略效果,包括:
对归类至所述维度组合属性的每个样本对象的策略效果求均方误差;
对所述候选画像维度组合包括的所有维度组合属性各自对应的均方误差求和,获得所述候选画像维度组合对应所述目标策略的策略效果。
13.根据权利要求7所述的方法,其特征在于,所述根据各所述策略效果从各剩余画像维度中确定以所述末尾子节点为父节点的子节点,包括:
确定各候选画像维度组合对应的策略效果中,策略效果最小值对应的画像维度组合;
将构成所述策略效果最小值对应的画像维度组合的剩余画像维度,作为所述决策树模型中以所述末尾子节点为父节点的子节点。
14.根据权利要求7所述的方法,其特征在于,所述方法还包括:
在更新所述决策树模型时,确定所述决策树模型中从根节点到所述子节点构成的画像维度组合对应的样本对象数量;
修剪所述样本对象数量小于预设阈值的子节点。
15.根据权利要求1所述的方法,其特征在于,所述基于从所述群体划分决策树的根节点到叶子节点所表示的各细分群体分别对应的策略效果,确定对应所述目标策略的较优细分群体,包括:
基于停止迭代时所述群体划分决策树中从所述根节点到叶子节点所表示的各细分群体分别对应的策略效果,将大于阈值的策略效果所对应的细分群体,作为所述较优细分群体。
CN202110217636.1A 2021-02-26 2021-02-26 对象数据处理方法、装置、计算机设备和存储介质 Active CN112580902B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110217636.1A CN112580902B (zh) 2021-02-26 2021-02-26 对象数据处理方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110217636.1A CN112580902B (zh) 2021-02-26 2021-02-26 对象数据处理方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN112580902A true CN112580902A (zh) 2021-03-30
CN112580902B CN112580902B (zh) 2021-06-11

Family

ID=75114073

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110217636.1A Active CN112580902B (zh) 2021-02-26 2021-02-26 对象数据处理方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN112580902B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113822432A (zh) * 2021-04-06 2021-12-21 京东科技控股股份有限公司 样本数据的处理方法、装置、电子设备及存储介质
CN114513460A (zh) * 2022-01-28 2022-05-17 新华三技术有限公司 决策树的生成方法及装置
CN117556802A (zh) * 2024-01-12 2024-02-13 碳丝路文化传播(成都)有限公司 一种基于大语言模型的用户画像方法、装置、设备及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7937336B1 (en) * 2007-06-29 2011-05-03 Amazon Technologies, Inc. Predicting geographic location associated with network address
CN107230133A (zh) * 2017-05-26 2017-10-03 努比亚技术有限公司 一种数据处理方法、设备和计算机存储介质
CN107682178A (zh) * 2017-08-30 2018-02-09 国信优易数据有限公司 一种移动用户上网操作行为预测方法和装置
CN107818344A (zh) * 2017-10-31 2018-03-20 上海壹账通金融科技有限公司 用户行为进行分类和预测的方法和系统
CN110880124A (zh) * 2019-09-29 2020-03-13 清华大学 转化率评估方法及装置
CN111460384A (zh) * 2020-03-31 2020-07-28 北京百度网讯科技有限公司 策略的评估方法、装置和设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7937336B1 (en) * 2007-06-29 2011-05-03 Amazon Technologies, Inc. Predicting geographic location associated with network address
CN107230133A (zh) * 2017-05-26 2017-10-03 努比亚技术有限公司 一种数据处理方法、设备和计算机存储介质
CN107682178A (zh) * 2017-08-30 2018-02-09 国信优易数据有限公司 一种移动用户上网操作行为预测方法和装置
CN107818344A (zh) * 2017-10-31 2018-03-20 上海壹账通金融科技有限公司 用户行为进行分类和预测的方法和系统
CN110880124A (zh) * 2019-09-29 2020-03-13 清华大学 转化率评估方法及装置
CN111460384A (zh) * 2020-03-31 2020-07-28 北京百度网讯科技有限公司 策略的评估方法、装置和设备

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113822432A (zh) * 2021-04-06 2021-12-21 京东科技控股股份有限公司 样本数据的处理方法、装置、电子设备及存储介质
CN113822432B (zh) * 2021-04-06 2024-02-06 京东科技控股股份有限公司 样本数据的处理方法、装置、电子设备及存储介质
CN114513460A (zh) * 2022-01-28 2022-05-17 新华三技术有限公司 决策树的生成方法及装置
CN114513460B (zh) * 2022-01-28 2023-09-15 新华三技术有限公司 决策树的生成方法及装置
CN117556802A (zh) * 2024-01-12 2024-02-13 碳丝路文化传播(成都)有限公司 一种基于大语言模型的用户画像方法、装置、设备及介质
CN117556802B (zh) * 2024-01-12 2024-04-05 碳丝路文化传播(成都)有限公司 一种基于大语言模型的用户画像方法、装置、设备及介质

Also Published As

Publication number Publication date
CN112580902B (zh) 2021-06-11

Similar Documents

Publication Publication Date Title
CN112580902B (zh) 对象数据处理方法、装置、计算机设备和存储介质
CN113011895B (zh) 关联账户样本筛选方法、装置和设备及计算机存储介质
CN113822315A (zh) 属性图的处理方法、装置、电子设备及可读存储介质
CN114398669B (zh) 基于隐私保护计算和跨组织的联合信用评分方法及装置
CN109767312A (zh) 一种信用评估模型训练、评估方法与装置
EP4104107A1 (en) Method for injecting human knowledge into ai models
CN112258250A (zh) 基于网络热点的目标用户识别方法、装置和计算机设备
Du et al. Detection of key figures in social networks by combining harmonic modularity with community structure-regulated network embedding
CN115049397A (zh) 识别社交网络中的风险账户的方法及装置
CN116340793A (zh) 一种数据处理方法、装置、设备以及可读存储介质
CN115310589A (zh) 一种基于深度图自监督学习的群体识别方法及系统
CN115658971A (zh) 基于注意力机制的多层异质网络节点重要度评估方法
Gong et al. Latent evolution model for change point detection in time-varying networks
Del Castillo et al. Modeling mechanisms of cultural diversity and ethnicity in hunter–gatherers
CN113989544A (zh) 一种基于深度图卷积网络的群体发现方法
KR102663767B1 (ko) Ai기반 가상자산 고위험 지갑주소 db 자동 업데이트 방법
CN111126607B (zh) 一种模型训练的数据处理方法、装置与系统
Gong et al. A data-driven smart evaluation framework for teaching effect based on fuzzy comprehensive analysis
Hashemi et al. Multi-objective Optimization for Computer Security and Privacy.
Supriya et al. A Hybrid Federated Learning Model for Insurance Fraud Detection
CN116545679A (zh) 一种工业情境安全基础框架及网络攻击行为特征分析方法
CN114745288B (zh) 基于区块链和动态赋权的复杂网络抗毁性模型量化方法
CN114297498B (zh) 一种基于关键传播结构感知的意见领袖识别方法和装置
CN114265954B (zh) 基于位置与结构信息的图表示学习方法
CN112116441B (zh) 金融风险分类模型的训练方法、分类方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40041325

Country of ref document: HK