CN109992699B - 用户群的优化方法及装置、存储介质、计算机设备 - Google Patents

用户群的优化方法及装置、存储介质、计算机设备 Download PDF

Info

Publication number
CN109992699B
CN109992699B CN201910152473.6A CN201910152473A CN109992699B CN 109992699 B CN109992699 B CN 109992699B CN 201910152473 A CN201910152473 A CN 201910152473A CN 109992699 B CN109992699 B CN 109992699B
Authority
CN
China
Prior art keywords
user group
target
target user
grouping
grouping rule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910152473.6A
Other languages
English (en)
Other versions
CN109992699A (zh
Inventor
邓悦
金戈
徐亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910152473.6A priority Critical patent/CN109992699B/zh
Publication of CN109992699A publication Critical patent/CN109992699A/zh
Priority to PCT/CN2019/097890 priority patent/WO2020173043A1/zh
Application granted granted Critical
Publication of CN109992699B publication Critical patent/CN109992699B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种用户群的优化方法及装置、存储介质、计算机设备,该方法包括:获取决策树模型分群得到的目标用户群集合和用户群总集合,其中,目标用户群集合包括与决策树模型的每个叶子节点分别对应的第一用户群,用户群总集合包括与决策树模型的每个节点分别对应的第二用户群;若在目标用户群集合中目标质量用户的数量小于预设覆盖阈值,则根据第一用户群对应的分群规则数量和用户群总集合中与第一用户群节点的父节点对应的第二用户群,生成新的目标用户群集合,其中,新的目标用户群集合中目标质量用户的数量大于或等于预设覆盖阈值;根据新的目标用户群集合,确定最终的用户群。本申请的用户群优化方法简单有效。

Description

用户群的优化方法及装置、存储介质、计算机设备
技术领域
本申请涉及数据处理技术领域,尤其是涉及到一种用户群的优化方法及装置、存储介质、计算机设备。
背景技术
现有的基于决策树的用户分群方法中,为了保证每个用户群的目标分类人群占比,通常会对决策树分类模型设置很多分群规则,使得每个用户群都对应有多条分群规则,但是从分群的结果来看,这种过于细致的分群规则会导致每个用户群保留的用户数量较少,从整体来看全部的用户群所覆盖的目标分类人群达不到预期数量。
而现有的用户群优化方式中,通常通过重新建立分群规则,重新训练决策树的方法解决上述问题,这种方法在分群规则复杂、用户数据量较大时会耗费很多时间。目前,还没有一种能够快速有效进行用户群优化的方法。
发明内容
有鉴于此,本申请提供了一种用户群的优化方法及装置、存储介质、计算机设备,无需重新制定决策树分类模型的规则即可提高目标分类人群覆盖量,提升了用户群的优化效率。
根据本申请的一个方面,提供了一种用户群的优化方法,包括:
获取决策树模型分群得到的目标用户群集合和用户群总集合,其中,所述目标用户群集合包括与所述决策树模型的每个叶子节点分别对应的第一用户群,所述用户群总集合包括与所述决策树模型的每个节点分别对应的第二用户群;
若在所述第一用户群中目标质量用户的数量小于预设覆盖阈值,则根据所述第一用户群对应的分群规则数量和所述用户群总集合中与所述第一用户群节点的父节点对应的所述第二用户群,生成新的目标用户群集合,其中,所述新的目标用户群集合中所述目标质量用户的数量大于或等于所述预设覆盖阈值;
根据所述新的目标用户群集合,确定最终的用户群。
根据本申请的另一方面,提供了一种用户群的优化装置,包括:
用户群集合建立模块,用于获取决策树模型分群得到的目标用户群集合和用户群总集合,其中,所述目标用户群集合包括与所述决策树模型的每个叶子节点分别对应的第一用户群,所述用户群总集合包括与所述决策树模型的每个节点分别对应的第二用户群;
用户群优化模块,用于若在所述目标用户群集合中目标质量用户的数量小于预设覆盖阈值,则根据所述第一用户群对应的分群规则数量和所述用户群总集合中与所述第一用户群节点的父节点对应的所述第二用户群,生成新的目标用户群集合,其中,所述新的目标用户群集合中所述目标质量用户的数量大于或等于所述预设覆盖阈值;
用户群确定模块,用于根据所述新的目标用户群集合,确定最终的用户群。
依据本申请又一个方面,提供了一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述用户群的优化方法。
依据本申请再一个方面,提供了一种计算机设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述用户群的优化方法。
借由上述技术方案,本申请提供的一种用户群的优化方法及装置、存储介质、计算机设备,与现有的用户群优化方式相比,本申请在基于决策树模型的用户分群方式基础上,继续创建目标用户群集合和用户群总集合,其中目标用户群集合中包括的用户群对应决策树模型的叶子节点,而用户群总集合包括的用户群对应决策树模型的节点。在目标用户群集合中目标质量用户的数量小于预设覆盖阈值时,由于在目标用户群集合中用户群对应的分群规则数量越多,其相应从父节点分群时可能剔除的目标质量用户越多,因此为了提高目标质量用户的数量可结合其在用户群总集合中的父节点用户群进行查找更多的目标质量用户,进而根据目标用户群集合中用户群对应的分群规则数量和该用户群在用户群总集合中的父节点用户群这两个重要因素,可生成目标质量用户的数量大于或等于预设覆盖阈值的新目标用户群集合,即为最终优化的分群结果。整个优化方案过程简单,无需重新建立分群规则和重新训练决策树,即可有效提高目标用户群集合中的目标质量用户的数量,使得用户群的优化变得更加快捷准确,从而提高了用户分群效率。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1示出了本申请实施例提供的一种用户群的优化方法的流程示意图;
图2示出了本申请实施例提供的另一种用户群的优化方法的流程示意图;
图3示出了本申请实施例提供的一种用户群的优化装置的结构示意图;
图4示出了本申请实施例提供的另一种用户群的优化装置的结构示意图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本申请。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
在本实施例中提供了一种用户群的优化方法,如图1所示,该方法包括:
步骤101,获取决策树模型分群得到的目标用户群集合和用户群总集合,其中,目标用户群集合包括与决策树模型的每个叶子节点分别对应的第一用户群,用户群总集合包括与决策树模型的每个节点分别对应的第二用户群。
在本申请中,为了得到互相之间没有交集的用户群,采用决策树对样本用户进行分群,具体地,利用事先制定好的分群规则构建决策树分类模型,并利用模型对样本用户进行分群,得到多个用户群,其中,决策树的每个节点都对应有一个用户群。
应用预设决策树分类模型对样本用户进行分类后,利用决策树的每个叶子节点对应的用户群构建目标用户群,其中,目标用户群中包含的所有样本用户个体各不相同。另外,利用决策树的每个节点对应的用户群构建用户群总集合,从而便于后续利用用户群总集合对目标用户群进行优化。
步骤102,若在目标用户群集合中目标质量用户的数量小于预设覆盖阈值,则根据第一用户群对应的分群规则数量和用户群总集合中与第一用户群节点的父节点对应的第二用户群,生成新的目标用户群集合,其中,新的目标用户群集合中目标质量用户的数量大于或等于预设覆盖阈值。
如果目标用户群集合中所包含的第一用户群中目标质量用户的数量小于预设覆盖阈值,说明目前得到的目标用户群集合不符合目标人群覆盖预期人数应进行用户群优化以使其满足预期。具体地,可以根据目标用户群集合中用户群对应的分群规则数量和该用户群在用户群总集合中的父节点用户群这两个重要因素,可生成目标质量用户的数量大于或等于预设覆盖阈值的新目标用户群集合。
例如,可以根据每个第一用户群对应的分群规则数量寻找需要被优化的第一用户群,详细来说,如果第一用户群对应的分群规则数量较多,也就意味着该群对应的分群规则更为细致,那么该群则很可能成为目标质量用户占比较高的用户群,而在设置这类用户群的分群规则时往往会因为过度考虑如何保证提高目标质量用户占比而忽略了目标质量用户的覆盖数量,因此优先考虑对这类用户群进行优化。进而确定需要优化的第一用户群之后,还应考虑如何对其进行优化,本申请提供的方法为找到第一用户群在决策树模型中的节点,利用第一用户群节点的父节点对应的第二用户群对需要优化的第一用户群进行替换,这是因为由于需要优化的第一用户群是根据该父节点对应的第二用户群得来的,所以父节点对应的第二用户群所包含的目标质量用户的数量一定大于或等于需要优化的第一用户群,若进行替换,则新的目标用户群集合中所包含的目标质量用户的数量一定大于或等于原有的目标用户群集合。其中,需要在用户群总集合中寻找父节点对应的第二用户群。
另外,如果一次优化后,目标用户群集合包含的目标质量用户的数量仍然小于预设覆盖阈值,则需要继续进行优化,直到目标质量用户的数量大于或等于预设覆盖阈值,以达到优化目的。
步骤103,根据新的目标用户群集合,确定最终的用户群。
目标用户群集合包含的目标质量用户的数量大于或等于预设覆盖阈值后,则可以将目标用户群集合中包含的全部用户群确定为最终的优化后的用户群,实现优化目的。
通过应用本实施例的技术方案,与现有的用户群优化方式相比,本申请在基于决策树模型的用户分群方式基础上,继续创建目标用户群集合和用户群总集合,其中目标用户群集合中包括的用户群对应决策树模型的叶子节点,而用户群总集合包括的用户群对应决策树模型的节点。在目标用户群集合中目标质量用户的数量小于预设覆盖阈值时,由于在目标用户群集合中用户群对应的分群规则数量越多,其相应从父节点分群时可能剔除的目标质量用户越多,因此为了提高目标质量用户的数量可结合其在用户群总集合中的父节点用户群进行查找更多的目标质量用户,进而根据目标用户群集合中用户群对应的分群规则数量和该用户群在用户群总集合中的父节点用户群这两个重要因素,可生成目标质量用户的数量大于或等于预设覆盖阈值的新目标用户群集合,即为最终优化的分群结果。整个优化方案过程简单,无需重新建立分群规则和重新训练决策树,即可有效提高目标用户群集合中的目标质量用户的数量,使得用户群的优化变得更加快捷准确,从而提高了用户分群效率。
进一步的,作为上述实施例具体实施方式的细化和扩展,为了完整说明本实施例的具体实施过程,提供了另一种用户群的优化方法,如图2所示,该方法包括:
步骤201,获取决策树模型分群得到的目标用户群集合和用户群总集合,其中,目标用户群集合包括与决策树模型的每个叶子节点分别对应的第一用户群,用户群总集合包括与决策树模型的每个节点分别对应的第二用户群。
利用决策树模型对用户进行分群,并根据所得用户群建立目标用户群集合以及用户群总集合,从而利用用户群总集合对目标用户群集合进行优化。
步骤202,若在目标用户群集合中目标质量用户的数量小于预设覆盖阈值,则根据第一用户群对应的分群规则数量,确定第一目标用户群,其中,第一目标用户群为目标用户群集合中分群规则数量最多的第一用户群。
在上述实施例中,具体地,若分群规则数量最多的第一用户群包括多个,则确定多个分群规则数量最多的第一用户群中的任意一个为第一目标用户群。
如果目标用户群集合的目标质量用户数量低于预设覆盖阈值,则在目标用户群集合中,搜索分群规则最多的第一用户群,其中,如果分群规则数量最多的用户群有多个,可以选其中任意一个作为第一目标用户群。
需要说明的是,如果分群规则数量最多的用户群包括多个,还可以选择用户群中人数最少的用户群作为第一目标用户群。上述两种选择第一目标用户群的方式本申请在此不做限定,本领域技术人员可以任意选择或采用其他方法确定第一目标用户群。
步骤203,根据第一目标用户群,在用户群总集合中搜索第二目标用户群,其中,第二目标用户群对应的节点为第一目标用户群对应的节点的父节点。
在上述实施例中,具体地,第一用户群和第二用户群中的任意一个用户群对应有一条分群规则或按顺序排列的多条分群规则。
每个用户群都对应有一条或者多条分群规则,分群规则的顺序与对应的决策树模型上的节点的分群规则顺序一致。
例如,决策树分类模型的一个节点对应的分类规则自上而下分别为:职业为白领的用户、受教育程度为大学本科及本科以上的用户、每年购买理财产品超过1万元的用户……那么,该节点的对应用户群的分群规则按照顺序依次分别为职业为白领的用户、受教育程度为大学本科及本科以上的用户、每年购买理财产品超过1万元的用户……
作为本申请的一个具体实施例,上述步骤203可以包括:
步骤2031,将第一目标用户群对应的分群规则确定为第一分群规则,并将第一分群规则的最后一条删除得到第二分群规则。
确定第一目标用户群对应的第一分群规则后,将第一分群规则删除最后一条得到第二分群规则,这是因为每个用户群的分群规则都是按照顺序排列的,因此将第一分群规则删除最后一条后剩余的分群规则即为第一目标用户群节点的父节点对应的分群规则。
另外,具体地,确定第一分群规则的方式可以包括:
第一,若第一目标用户群中目标质量用户占比大于或等于预设占比阈值,则将第一目标用户群对应的分群规则确定为第一分群规则,其中,第一目标用户群中目标质量用户占比为第一目标用户群中目标质量用户的数量与第一目标用户群中全部用户的数量的比值;
第二,若第一目标用户群中目标质量用户占比小于预设占比阈值,则返回确定第一目标用户群的步骤重新确定第一目标用户群,直至重新确定的第一目标用户群中目标质量用户占比大于或等于预设占比阈值后,将重新确定的第一目标用户群对应的分群规则确定为第一分群规则。
在利用分群规则数量筛选第一目标用户群的基础上,第一目标用户群还需要满足目标质量用户占比条件,具体地,确定分群规则数量最多的第一目标用户群后,计算第一目标用户群中的目标质量用户数量与第一目标用户群中全部用户数量的比值,如果这个比值大于或等于预设占比阈值,说明可以对第一目标用户群进行优化,则确定第一目标用户群对应的第一分群规则,以便利用第一分群规则实现第一目标用户群的优化。
如果上述比值小于预设占比阈值,说明该第一目标用户群质量较低,而相较于这个用户群对应的父节点的用户群来说,该用户群的分群规则更为细致,质量应该更高,所以如果仍然以该第一目标用户群对应的分群规则作为基础进行分群规则的删减,将会导致删减后的分群规则所对应的用户群质量比第一目标用户群质量更低,因为满足删减后的分群规则的用户群对应的决策树模型节点是第一目标用户群对应的决策树模型节点的父节点,而用户群优化除了要保证整体的目标质量用户覆盖数量,还需要尽可能保证每个用户群中目标质量用户占比,则此时不宜仍选用该第一目标用户群,而应重新确定质量更高的用户群作为第一目标用户群。
具体地,重新确定的第一目标用户群应该满足的条件为:第一,与原有的第一目标用户群不同;第二,分群规则数量最多;第三,目标质量用户占比大于或等于预设占比阈值。按照上述条件搜索到新的第一目标用户群之后,根据新的第一目标用户群确定第一分群规则。
步骤2032,根据第二分群规则,在用户群总集合中搜索与第二分群规则对应的第二目标用户群。
另外,具体地,搜索第二目标用户群的方式具体包括:
第一,在用户群总集合中搜索与第二分群规则对应的第二用户群,若与第二分群规则对应的第二用户群中目标质量用户占比大于或等于预设占比阈值,则将与第二分群规则对应的第二用户群确定为第二目标用户群,其中,第二目标用户群中的目标质量用户占比为第二目标用户群中目标质量用户的数量与第二目标用户群中全部用户的数量的比值;
第二,若与第二分群规则对应的第二用户群中目标质量用户占比大于或等于预设占比阈值,则返回确定第一目标用户群的步骤重新确定第一目标用户群,直至与第二分群规则对应的第二用户群中目标质量用户占比大于或等于预设占比阈值。
根据第二分群规则在用户群总集合中搜索对应的用户群,并计算该用户群中目标质量用户数量与全部用户数量的比值,如果该比值大于或等于预设占比阈值,说明该用户群的质量较好,而该用户群为第一目标用户群的父节点对应的用户群,该用户群包含的总人数应高于第一目标用户群,如果作为第一目标用户群的替换用户群,有助于提高目标用户群集合中目标质量用户的数量。
另外,在本实施例中,与第一目标用户群需满足的条件相似的,若与第二分群规则对应的用户群中目标质量用户占比小于预设占比阈值,则应在目标用户群集合中重新确定与原有的第一目标用户群不同的新的第一目标用户群,进而确定第一分群规则、第二分群规则,并按照上述规则重新确定第二目标用户群。
步骤204,将目标用户群集合中的第一目标用户群替换为第二目标用户群,生成新的目标用户群集合。
确定第二目标用户群之后,将目标用户群集合中的第一目标用户群替换为第二目标用户群,由于对于决策树分类模型来说,第二目标用户群对应的节点为第一目标用户群对应的节点的父节点,并且第一目标用户群与第二目标用户群都满足目标质量用户占比大于或等于预设用户群目标样本占比阈值,因此替换后的目标用户群集合中,目标质量用户的覆盖数量将会有所提高,也即提高了目标用户群集合的质量,并且第二目标用户群中目标质量用户的占比也是大于或等于预设占比阈值的,因此将第一目标用户群替换为第二目标用户群也能够保证用户群的较高质量。
步骤205,查询新的目标用户群集合中任意一个第一用户群对应的分群规则,并在其他第一用户群对应的分群规则包括任意一个第一用户群对应的分群规则时,删除目标用户群集合中的其他第一用户群。
将第一目标用户群替换为第二目标用户群,本质上是将决策树模型中父节点对应的用户群替换为子节点对应的用户群,而一个父节点又可以对应一个或多个子节点,若与第二目标用户群相应的节点对应有多个子节点,那么目标用户群集合中将可能出现多个用户群包括的用户相互重叠的现象,因此需要将重叠的用户进行去重。具体地,父节点对应的用户群用户一定包括所有子节点对应的用户群用户,因此在目标用户群中父节点和子节点对应的用户群同时存在的情况下,删除子节点对应的用户群,或者说,如果任一用户群对应的分群规则全部包含在另一个用户群对应的分群规则内,则将另一个用户群从目标用户群集合中删除,从而去掉目标用户群集合中的重复用户。
步骤206,计算新的目标用户群集合包含的第一用户群的数量。
对于目标用户群集合中所包含的用户群来说,除了要尽量满足每个用户群的目标质量用户占比达到预设占比阈值以及所有用户群所包含的目标质量用户的总数量达到预设覆盖阈值以外,还需保证一定的用户群数量,因此在确定最终的用户群之前,还需要计算目标用户群集合中的用户群数量是否符合预期数量。
步骤207,若第一用户群的数量大于或等于预设用户群阈值,则计算新的目标用户群集合中目标质量用户的数量。
如果目标用户群集合中的用户群数量大于或等于预设目标用户群数量阈值,说明此时用户群的数量满足分群期望数量,则可以进一步地判断目标用户群集合所涵盖的目标质量用户的数量是否达到预设目标用户群数量阈值,从而实现用户群的优化。
另外,在本申请的实施例中,具体地,若第一用户群的数量大于或等于预设用户群阈值,则返回搜索第一目标用户群的步骤重新确定第一目标用户群。从而根据新的第一目标用户群确定第一分群规则,进而确定第二分群规则以及对应的第二目标用户群,并重新进行用户群的替换。以使目标用户群集合所包含的用户群满足预设目标用户群数量阈值的条件,得到更优质的用户群。
步骤208,若新的目标用户群集合中目标质量用户的数量小于预设覆盖阈值,则返回确定第一目标用户群的步骤重新确定第一目标用户群,直至新的目标用户群集合中目标指令用户的数量大于或等于预设覆盖阈值,其中,重新确定的第一目标用户群为与原有的第一目标用户群不同的分群规则数量最多的第一用户群。
如果目标用户群集合中的目标质量用户的数量仍然小于预设覆盖阈值,说明需要继续对目标用户群集合进行优化,则返回第一目标用户群搜索步骤,在目标用户群集合中搜索与原有的第一目标用户群不同的,且对应的分群规则数量最多的,同时目标质量用户占比大于或等于预设用户群目标样本占比阈值的新的第一目标用户群。从而根据新的第一目标用户群重新进行优化,以使目标用户群集合符合预期,提高目标质量用户的覆盖数量。
通过应用本实施例的技术方案,无需重新制定决策树分类模型的规则,利用已有的用户群及其对应的分群规则,将已有的用户群进行重新组合,用分群规则较少的用户群替代分群规则过于细致的用户群,其中上述分群规则较少的用户群节点为上述分群规则过于细致的用户群节点的父节点,以提高目标质量用户的覆盖数量,并加入用户群数量低于预设目标用户群数量阈值的防护机制,保证用户群数量的基础上,满足了目标质量用户的覆盖数量,实现了用户群的优化。
进一步的,作为图1方法的具体实现,本申请实施例提供了一种用户群的优化装置,如图3所示,该装置包括:用户群集合建立模块31、用户群优化模块32、用户群确定模块33。
用户群集合建立模块31,用于获取决策树模型分群得到的目标用户群集合和用户群总集合,其中,目标用户群集合包括与决策树模型的叶子节点对应的第一用户群,用户群总集合包括与决策树模型的每个节点对应的第二用户群;
用户群优化模块32,用于若在目标用户群集合中目标质量用户的数量小于预设覆盖阈值,则根据第一用户群对应的分群规则数量和用户群总集合中与第一用户群节点的父节点对应的第二用户群,生成新的目标用户群集合,其中,新的目标用户群集合中目标质量用户的数量大于或等于预设覆盖阈值;
用户群确定模块33,用于根据新的目标用户群集合,确定最终的用户群。
在具体的应用场景中,如图4所示,用户群优化模块32,具体包括:第一目标用户群确定单元321、第二目标用户群确定单元322、替换单元323。
第一目标用户群确定单元321,用于根据第一用户群对应的分群规则数量,确定第一目标用户群,其中,第一目标用户群为目标用户群集合中分群规则数量最多的第一用户群;
第二目标用户群确定单元322,用于根据第一目标用户群,在用户群总集合中搜索第二目标用户群,其中,第二目标用户群对应的节点为第一目标用户群对应的节点的父节点;
替换单元323,用于将目标用户群集合中的第一目标用户群替换为第二目标用户群,生成新的目标用户群集合;
第一目标用户群确定单元321,还用于若新的目标用户群集合中目标质量用户的数量小于预设覆盖阈值,则返回确定第一目标用户群的步骤重新确定第一目标用户群,直至新的目标用户群集合中目标指令用户的数量大于或等于预设覆盖阈值,其中,重新确定的第一目标用户群为与原有的第一目标用户群不同的分群规则数量最多的第一用户群。
在本申请的实施例中,具体地,第一用户群和第二用户群中的任意一个用户群对应有一条分群规则或按顺序排列的多条分群规则。
在具体的应用场景中,如图4所示,第二目标用户群确定单元322,具体包括:分群规则确定子单元3221、第二目标用户群确定子单元3222。
分群规则确定子单元3221,用于将第一目标用户群对应的分群规则确定为第一分群规则,并将第一分群规则的最后一条删除得到第二分群规则;
第二目标用户群确定子单元3222,用于根据第二分群规则,在用户群总集合中搜索与第二分群规则对应的第二目标用户群。
分群规则确定子单元3221,还用于若第一目标用户群中目标质量用户占比大于或等于预设占比阈值,则将第一目标用户群对应的分群规则确定为第一分群规则,其中,第一目标用户群中目标质量用户占比为第一目标用户群中目标质量用户的数量与第一目标用户群中全部用户的数量的比值;
若第一目标用户群中目标质量用户占比小于预设占比阈值,则返回确定第一目标用户群的步骤重新确定第一目标用户群,直至重新确定的第一目标用户群中目标质量用户占比大于或等于预设占比阈值后,将重新确定的第一目标用户群对应的分群规则确定为第一分群规则。
在具体的应用场景中,如图4所示,用户群优化模块32,还包括:删除单元324、用户群数量计算单元325、目标质量用户数量计算单元326。
删除单元324,用于将目标用户群集合中的第一目标用户群替换为第二目标用户群,生成新的目标用户群集合之后,查询新的目标用户群集合中任意一个第一用户群对应的分群规则,并在其他第一用户群对应的分群规则包括任意一个第一用户群对应的分群规则时,删除目标用户群集合中的其他第一用户群。
用户群数量计算单元325,用于删除目标用户群集合中的其他第一用户群之后,计算新的目标用户群集合包含的第一用户群的数量;
目标质量用户数量计算单元326,用于若第一用户群的数量大于或等于预设用户群阈值,则计算新的目标用户群集合中目标质量用户的数量。
第二目标用户群确定子单元3222,具体用于在用户群总集合中搜索与第二分群规则对应的第二用户群,若与第二分群规则对应的第二用户群中目标质量用户占比大于或等于预设占比阈值,则将与第二分群规则对应的第二用户群确定为第二目标用户群,其中,第二目标用户群中的目标质量用户占比为第二目标用户群中目标质量用户的数量与第二目标用户群中全部用户的数量的比值;
若与第二分群规则对应的第二用户群中目标质量用户占比大于或等于预设占比阈值,则返回确定第一目标用户群的步骤重新确定第一目标用户群,直至与第二分群规则对应的第二用户群中目标质量用户占比大于或等于预设占比阈值。
需要说明的是,本申请实施例提供的一种用户群的优化装置所涉及各功能单元的其他相应描述,可以参考图1和图2中的对应描述,在此不再赘述。
基于上述如图1和图2所示方法,相应的,本申请实施例还提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述如图1和图2所示的用户群的优化方法。
基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施场景所述的方法。
基于上述如图1、图2所示的方法,以及图3、图4所示的虚拟装置实施例,为了实现上述目的,本申请实施例还提供了一种计算机设备,具体可以为个人计算机、服务器、网络设备等,该计算机设备包括存储介质和处理器;存储介质,用于存储计算机程序;处理器,用于执行计算机程序以实现上述如图1和图2所示的用户群的优化方法。
可选地,该计算机设备还可以包括用户接口、网络接口、摄像头、射频(RadioFrequency,RF)电路,传感器、音频电路、WI-FI模块等等。用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard)等,可选用户接口还可以包括USB接口、读卡器接口等。网络接口可选的可以包括标准的有线接口、无线接口(如蓝牙接口、WI-FI接口)等。
本领域技术人员可以理解,本实施例提供的一种计算机设备结构并不构成对该计算机设备的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。
存储介质中还可以包括操作系统、网络通信模块。操作系统是管理和保存计算机设备硬件和软件资源的程序,支持信息处理程序以及其它软件和/或程序的运行。网络通信模块用于实现存储介质内部各组件之间的通信,以及与该实体设备中其它硬件和软件之间通信。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可以借助软件加必要的通用硬件平台的方式来实现,也可以通过硬件实现基于决策树模型的用户分群方式基础上,继续创建目标用户群集合和用户群总集合,其中目标用户群集合中包括的用户群对应决策树模型的叶子节点,而用户群总集合包括的用户群对应决策树模型的节点。在目标用户群集合中目标质量用户的数量小于预设覆盖阈值时,由于在目标用户群集合中用户群对应的分群规则数量越多,其相应从父节点分群时可能剔除的目标质量用户越多,因此为了提高目标质量用户的数量可结合其在用户群总集合中的父节点用户群进行查找更多的目标质量用户,进而根据目标用户群集合中用户群对应的分群规则数量和该用户群在用户群总集合中的父节点用户群这两个重要因素,可生成目标质量用户的数量大于或等于预设覆盖阈值的新目标用户群集合,即为最终优化的分群结果。整个优化方案过程简单,无需重新建立分群规则和重新训练决策树,即可有效提高目标用户群集合中的目标质量用户的数量,使得用户群的优化变得更加快捷准确,从而提高了用户分群效率。
本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本申请所必须的。本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本申请序号仅仅为了描述,不代表实施场景的优劣。以上公开的仅为本申请的几个具体实施场景,但是,本申请并非局限于此,任何本领域的技术人员能思之的变化都应落入本申请的保护范围。

Claims (7)

1.一种用户群的优化方法,其特征在于,包括:
获取决策树模型分群得到的目标用户群集合和用户群总集合,其中,所述目标用户群集合包括与所述决策树模型的每个叶子节点分别对应的第一用户群,所述用户群总集合包括与所述决策树模型的每个节点分别对应的第二用户群;
若在所述目标用户群集合中目标质量用户的数量小于预设覆盖阈值,则根据所述第一用户群对应的分群规则数量,确定第一目标用户群,其中,所述第一目标用户群为所述目标用户群集合中所述分群规则数量最多的所述第一用户群;
将所述第一目标用户群对应的分群规则确定为第一分群规则,并将所述第一分群规则的最后一条删除得到第二分群规则;在所述用户群总集合中搜索与所述第二分群规则对应的所述第二用户群,若与所述第二分群规则对应的所述第二用户群中所述目标质量用户占比大于或等于预设占比阈值,则将与所述第二分群规则对应的所述第二用户群确定为第二目标用户群,其中,所述第二目标用户群中的所述目标质量用户占比为所述第二目标用户群中所述目标质量用户的数量与所述第二目标用户群中全部用户的数量的比值,所述第二目标用户群对应的节点为所述第一目标用户群对应的节点的父节点;
若与所述第二分群规则对应的所述第二用户群中所述目标质量用户占比小于所述预设占比阈值,则返回所述确定第一目标用户群的步骤重新确定第一目标用户群,直至与所述第二分群规则对应的所述第二用户群中所述目标质量用户占比大于或等于所述预设占比阈值;
将所述目标用户群集合中的所述第一目标用户群替换为所述第二目标用户群,生成新的目标用户群集合;
若所述新的目标用户群集合中所述目标质量用户的数量小于所述预设覆盖阈值,则返回所述确定第一目标用户群的步骤重新确定第一目标用户群,直至所述新的目标用户群集合中所述目标质量用户的数量大于或等于所述预设覆盖阈值,其中,重新确定的所述第一目标用户群为与原有的所述第一目标用户群不同的所述分群规则数量最多的所述第一用户群;
根据所述新的目标用户群集合,确定最终的用户群。
2.根据权利要求1所述的方法,其特征在于,所述将所述第一目标用户群对应的分群规则确定为第一分群规则,具体包括:
若所述第一目标用户群中所述目标质量用户占比大于或等于预设占比阈值,则将所述第一目标用户群对应的分群规则确定为所述第一分群规则,其中,所述第一目标用户群中所述目标质量用户占比为所述第一目标用户群中所述目标质量用户的数量与所述第一目标用户群中全部用户的数量的比值;
若所述第一目标用户群中所述目标质量用户占比小于所述预设占比阈值,则返回所述确定第一目标用户群的步骤重新确定第一目标用户群,直至重新确定的所述第一目标用户群中所述目标质量用户占比大于或等于预设占比阈值后,将重新确定的所述第一目标用户群对应的分群规则确定为所述第一分群规则。
3.根据权利要求1所述的方法,其特征在于,所述将所述目标用户群集合中的所述第一目标用户群替换为所述第二目标用户群,生成新的目标用户群集合之后,所述方法还包括:
查询所述新的目标用户群集合中任意一个第一用户群对应的分群规则,并在其他第一用户群对应的分群规则包括所述任意一个第一用户群对应的分群规则时,删除所述目标用户群集合中的所述其他第一用户群。
4.根据权利要求3所述的方法,其特征在于,所述删除所述目标用户群集合中的所述其他第一用户群之后,所述方法还包括:
计算所述新的目标用户群集合包含的第一用户群的数量;
若所述第一用户群的数量大于或等于预设用户群阈值,则计算所述新的目标用户群集合中所述目标质量用户的数量。
5.一种用户群的优化装置,其特征在于,包括:
用户群集合建立模块,用于获取决策树模型分群得到的目标用户群集合和用户群总集合,其中,所述目标用户群集合包括与所述决策树模型的每个叶子节点分别对应的第一用户群,所述用户群总集合包括与所述决策树模型的每个节点分别对应的第二用户群;
用户群优化模块,用于:若在所述目标用户群集合中目标质量用户的数量小于预设覆盖阈值,则根据所述第一用户群对应的分群规则数量,确定第一目标用户群,其中,所述第一目标用户群为所述目标用户群集合中所述分群规则数量最多的所述第一用户群;
将所述第一目标用户群对应的分群规则确定为第一分群规则,并将所述第一分群规则的最后一条删除得到第二分群规则;在所述用户群总集合中搜索与所述第二分群规则对应的所述第二用户群,若与所述第二分群规则对应的所述第二用户群中所述目标质量用户占比大于或等于预设占比阈值,则将与所述第二分群规则对应的所述第二用户群确定为第二目标用户群,其中,所述第二目标用户群中的所述目标质量用户占比为所述第二目标用户群中所述目标质量用户的数量与所述第二目标用户群中全部用户的数量的比值,所述第二目标用户群对应的节点为所述第一目标用户群对应的节点的父节点;
若与所述第二分群规则对应的所述第二用户群中所述目标质量用户占比小于所述预设占比阈值,则返回所述确定第一目标用户群的步骤重新确定第一目标用户群,直至与所述第二分群规则对应的所述第二用户群中所述目标质量用户占比大于或等于所述预设占比阈值;
将所述目标用户群集合中的所述第一目标用户群替换为所述第二目标用户群,生成新的目标用户群集合;
若所述新的目标用户群集合中所述目标质量用户的数量小于所述预设覆盖阈值,则返回所述确定第一目标用户群的步骤重新确定第一目标用户群,直至所述新的目标用户群集合中所述目标质量用户的数量大于或等于所述预设覆盖阈值,其中,重新确定的所述第一目标用户群为与原有的所述第一目标用户群不同的所述分群规则数量最多的所述第一用户群;
用户群确定模块,用于根据所述新的目标用户群集合,确定最终的用户群。
6.一种存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至4中任一项所述的用户群的优化方法。
7.一种计算机设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至4中任一项所述的用户群的优化方法。
CN201910152473.6A 2019-02-28 2019-02-28 用户群的优化方法及装置、存储介质、计算机设备 Active CN109992699B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910152473.6A CN109992699B (zh) 2019-02-28 2019-02-28 用户群的优化方法及装置、存储介质、计算机设备
PCT/CN2019/097890 WO2020173043A1 (zh) 2019-02-28 2019-07-26 用户群的优化方法及装置、计算机非易失性可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910152473.6A CN109992699B (zh) 2019-02-28 2019-02-28 用户群的优化方法及装置、存储介质、计算机设备

Publications (2)

Publication Number Publication Date
CN109992699A CN109992699A (zh) 2019-07-09
CN109992699B true CN109992699B (zh) 2023-08-11

Family

ID=67129955

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910152473.6A Active CN109992699B (zh) 2019-02-28 2019-02-28 用户群的优化方法及装置、存储介质、计算机设备

Country Status (2)

Country Link
CN (1) CN109992699B (zh)
WO (1) WO2020173043A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109992699B (zh) * 2019-02-28 2023-08-11 平安科技(深圳)有限公司 用户群的优化方法及装置、存储介质、计算机设备
CN110929752B (zh) * 2019-10-18 2023-06-20 平安科技(深圳)有限公司 基于知识驱动和数据驱动的分群方法及相关设备
CN111105266B (zh) * 2019-11-11 2023-10-27 建信金融科技有限责任公司 基于改进决策树的客户分群方法及装置
CN112016979B (zh) * 2020-09-08 2023-07-18 平安科技(深圳)有限公司 用户分群方法、装置、设备和计算机可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015192521A1 (zh) * 2014-06-20 2015-12-23 中兴通讯股份有限公司 用户服务模式选择方法、导频信息发送方法及装置和存储介质
WO2018145609A1 (zh) * 2017-02-07 2018-08-16 广州市动景计算机科技有限公司 广告展示控制方法、设备、服务器及客户端
CN108810060A (zh) * 2017-05-05 2018-11-13 阿里巴巴集团控股有限公司 业务信息的提供、接收、用户聚合方法、服务器及客户端
CN109101562A (zh) * 2018-07-13 2018-12-28 中国平安人寿保险股份有限公司 寻找目标群体的方法、装置、计算机设备及存储介质
CN109242012A (zh) * 2018-08-27 2019-01-18 平安科技(深圳)有限公司 分组归纳方法及装置、电子装置及计算机可读存储介质
CN109271592A (zh) * 2018-09-30 2019-01-25 东软集团股份有限公司 一种物品推荐方法、装置、存储介质及程序产品

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103729478B (zh) * 2014-01-26 2016-11-09 重庆邮电大学 基于MapReduce的LBS兴趣点发现方法
CN105808698B (zh) * 2016-03-03 2020-04-07 江苏大学 一种面向物联网用户查询请求的TOP-k位置兴趣点推荐方法
CN109992699B (zh) * 2019-02-28 2023-08-11 平安科技(深圳)有限公司 用户群的优化方法及装置、存储介质、计算机设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015192521A1 (zh) * 2014-06-20 2015-12-23 中兴通讯股份有限公司 用户服务模式选择方法、导频信息发送方法及装置和存储介质
WO2018145609A1 (zh) * 2017-02-07 2018-08-16 广州市动景计算机科技有限公司 广告展示控制方法、设备、服务器及客户端
CN108810060A (zh) * 2017-05-05 2018-11-13 阿里巴巴集团控股有限公司 业务信息的提供、接收、用户聚合方法、服务器及客户端
CN109101562A (zh) * 2018-07-13 2018-12-28 中国平安人寿保险股份有限公司 寻找目标群体的方法、装置、计算机设备及存储介质
CN109242012A (zh) * 2018-08-27 2019-01-18 平安科技(深圳)有限公司 分组归纳方法及装置、电子装置及计算机可读存储介质
CN109271592A (zh) * 2018-09-30 2019-01-25 东软集团股份有限公司 一种物品推荐方法、装置、存储介质及程序产品

Also Published As

Publication number Publication date
CN109992699A (zh) 2019-07-09
WO2020173043A1 (zh) 2020-09-03

Similar Documents

Publication Publication Date Title
CN109992699B (zh) 用户群的优化方法及装置、存储介质、计算机设备
JP7343568B2 (ja) 機械学習のためのハイパーパラメータの識別および適用
TWI743428B (zh) 目標用戶群體的確定方法和裝置
CN110321422A (zh) 在线训练模型的方法、推送方法、装置以及设备
JP5755822B1 (ja) 類似度算出システム、類似度算出方法およびプログラム
CN108509617A (zh) 知识库构建、基于知识库的智能问答方法及装置、存储介质、终端
EP3001332A1 (en) Target user determination method, device and network server
CN109685204B (zh) 图像处理方法及装置、存储介质及电子设备
JP2018514857A (ja) データ処理方法及び装置
EP3176717A2 (en) Control method, processing apparatus, and non-transitory computer-readable recording medium
EP3358474A1 (en) Route search method, device and apparatus, and non-volatile computer storage medium
CN111652468A (zh) 业务流程的生成方法、装置、存储介质及计算机设备
CN111158828A (zh) 应用程序app的用户界面确定方法及装置、存储介质
CN108182200B (zh) 基于语义相似度的关键词拓展方法和装置
CN111737473A (zh) 文本分类方法、装置及设备
CN111737608A (zh) 企业信息检索结果排序方法及装置
JP2014074961A (ja) 商品推薦装置及び方法及びプログラム
JP2014174781A (ja) アイテム推薦システム、アイテム推薦方法およびアイテム推薦プログラム
CN111429200A (zh) 一种内容关联方法及装置、存储介质、计算机设备
CN110968790A (zh) 基于大数据的潜在客户智能推荐方法、设备和存储介质
CN110705889A (zh) 一种企业筛选方法、装置、设备及存储介质
CN109753994A (zh) 用户画像方法、装置、计算机可读存储介质及电子设备
CN111080343B (zh) 基于多用户的房源搜索方法及系统
CN105069064B (zh) 词汇的获取方法及装置、推送方法及装置
US11676050B2 (en) Systems and methods for neighbor frequency aggregation of parametric probability distributions with decision trees using leaf nodes

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant