CN110533447A - 数据筛选方法及装置、存储介质、电子装置 - Google Patents

数据筛选方法及装置、存储介质、电子装置 Download PDF

Info

Publication number
CN110533447A
CN110533447A CN201910488925.8A CN201910488925A CN110533447A CN 110533447 A CN110533447 A CN 110533447A CN 201910488925 A CN201910488925 A CN 201910488925A CN 110533447 A CN110533447 A CN 110533447A
Authority
CN
China
Prior art keywords
user group
user
feature
default
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910488925.8A
Other languages
English (en)
Inventor
衣建中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Koubei Network Technology Co Ltd
Original Assignee
Zhejiang Koubei Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Koubei Network Technology Co Ltd filed Critical Zhejiang Koubei Network Technology Co Ltd
Priority to CN201910488925.8A priority Critical patent/CN110533447A/zh
Publication of CN110533447A publication Critical patent/CN110533447A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • G06Q30/0271Personalized advertisement

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种数据筛选方法及装置、存储介质、电子装置,其中,该方法包括:在数据库的第一用户群中筛选具备指定标签的第二用户群,其中,所述指定标签用于标记存在目标业务需求的用户;提取所述第一用户群的预设特征,其中,所述预设特征包括历史行为特征和用户属性特征;根据所述预设特征在所述第二用户群中选择第三用户群。通过本发明,解决了相关技术中因没有明确有需求用户群体时通过广告投放、活动引流等手段去获取用户流量而存在的浪费成本和运营资源的技术问题,明确了目标业务类广告的投放目标,从而降低了目标业务类广告的投放成本和运营资源的有益效果。

Description

数据筛选方法及装置、存储介质、电子装置
技术领域
本发明涉及计算机领域,具体而言,涉及一种数据筛选方法及装置、存储介质、电子装置。
背景技术
相关技术中限制婚嫁行业GMV(全称为Gross Merchandise Volume,网站成交金额)和利润的最主要因素就是客资数量,而流量作为客资获取的入口,拓展流量、丰富婚嫁人群来源成为最迫切的业务需求之一。
相关技术中,app婚嫁行业目前获取用户流量的方法多种多样,但是都依赖于广告投放、活动引流等手段,其中广告投放类渠道客资获取成本较高,且总数较少,而活动引流投放,一般经过活动玩法开发-招商-上线等多个阶段,消耗大量的开发和运营资源,并且需要等待特殊的时间节点。
针对相关技术中存在的上述问题,目前尚未发现有效的解决方案。
发明内容
为了解决相关技术存在的上述问题,本发明实施例提供了一种数据筛选方法及装置、存储介质、电子装置。
根据本发明的一个实施例,提供了一种数据筛选方法,包括:在数据库的第一用户群中筛选具备指定标签的第二用户群,其中,所述指定标签用于标记存在目标业务需求的用户;提取所述第一用户群的预设特征,其中,所述预设特征包括历史行为特征和用户属性特征;根据所述预设特征在所述第二用户群中选择第三用户群。
可选的,在根据所述预设特征在所述第二用户群中选择第三用户群之后,所述方法还包括:将所述第三用户群确定为目标群体;向所述目标群体推送目标业务类的活动通知。
可选的,根据所述预设特征在所述第二用户群中选择第三用户群包括:确定每个预设特征的目标群体指标TGI;基于TGI在所述第二用户群中选择第三用户群。
可选的,确定每个预设特征的目标群体指标TGI包括:针对每一个预设特征,在所述第一用户群和所述第二用户群中分别确定具备第一预设特征的第一用户数和第二用户数,其中,所述第一预设特征为多个所述预设特征中的任一预设特征;计算所述第一用户数与所述第一用户群的数量的第一比值,以及计算所述第二用户数与所述第二用户群的数量的第二比值;将所述第二比值与所述第一比值的第三比值确定为所述第一预设特征的TGI。
可选的,基于TGI在所述第二用户群中选择第三用户群,包括:对每一个预设特征的TGI进行排序,并在多个预设特征中选择TGI最大的N个预设特征,其中,N为正整数;在所述第二用户群中选择具有所述N个预设特征中任意M个预设特征的用户作为所述第三用户群,其中,1≤M≤N。在本实施例中,
可选的,在对每一个预设特征的TGI进行排序之前,上述方法还包括:对所述预设特征中的一个或多个预设特征的TGI指数进行调整。
可选的,在数据库的第一用户群中筛选具备指定标签的第二用户群包括以下至少之一:在数据库的所述第一用户群中筛选具备第一指定标签的第二用户群,其中,所述第一指定标签用于标记已经预约目标业务的用户;在数据库的所述第一用户群中筛选具备第二指定标签的第二用户群,其中,所述第二指定标签用于标记已经反馈接受目标业务的用户;在数据库的所述第一用户群中筛选具备第三指定标签的第二用户群,其中,所述第三指定标签用于标记商户确认的实际已经接受目标业务的用户;在数据库的所述第一用户群中筛选具备第四指定标签的第二用户群,其中,所述第四指定标签用于标记第三方确认的实际已经接受目标业务的用户。
可选的,提取所述第一用户群的预设特征包括以下之一:提取所述第一用户群的预设行为特征,其中,所述预设行为特征包括:在本地系统产生的第一历史行为特征,在第三方系统产生的第二历史行为特征;提取所述第一用户群的预设用户属性特征。
根据本发明的另一个实施例,提供了一种数据筛选装置,包括:筛选模块,用于在数据库的第一用户群中筛选具备指定标签的第二用户群,其中,所述指定标签用于标记存在目标业务需求的用户;提取模块,用于提取所述第一用户群的预设特征,其中,所述预设特征包括历史行为特征和用户属性特征;选择模块,用于根据所述预设特征在所述第二用户群中选择第三用户群。
可选的,上述装置包括:确定模块,用于所述选择模块在在根据所述预设特征在所述第二用户群中选择第三用户群之后,将所述第三用户群确定为目标群体;推送模块,用于向所述目标群体推送目标业务类的活动通知。
可选的,所述选择模块包括:确定单元,用于确定每个预设特征的目标群体指标TGI;选择单元,用于基于TGI在所述第二用户群中选择第三用户群。
可选的,所述确定单元包括:第一确定子单元,用于针对每一个预设特征,在所述第一用户群和所述第二用户群中分别确定具备第一预设特征的第一用户数和第二用户数,其中,所述第一预设特征为多个所述预设特征中的任一预设特征;计算子单元,用于计算所述第一用户数与所述第一用户群的数量的第一比值,以及计算所述第二用户数与所述第二用户群的数量的第二比值;第二确定子单元,用于将所述第二比值与所述第一比值的第三比值确定为所述第一预设特征的TGI。
可选的,所述选择单元包括:第一选择子单元,用于对每一个预设特征的TGI进行排序,并在多个预设特征中选择TGI最大的N个预设特征,其中,N为正整数;第二选择子单元,用于在所述第二用户群中选择具有所述N个预设特征中任意M个预设特征的用户作为所述第三用户群,其中,1≤M≤N。
可选的,上述装置还包括:调整模块,用于在所述第一选择子单元对每一个预设特征的TGI进行排序之前,对所述预设特征中的一个或多个预设特征的TGI指数进行调整。
可选的,所述筛选模块包括以下至少之一:第一筛选单元,用于在数据库的所述第一用户群中筛选具备第一指定标签的第二用户群,其中,所述第一指定标签用于标记已经预约目标业务的用户;第二筛选单元,用于在数据库的所述第一用户群中筛选具备第二指定标签的第二用户群,其中,所述第二指定标签用于标记已经反馈接受目标业务的用户;第三筛选单元,用于在数据库的所述第一用户群中筛选具备第三指定标签的第二用户群,其中,所述第三指定标签用于标记商户确认的实际已经接受目标业务的用户;第四筛选单元,用于在数据库的所述第一用户群中筛选具备第四指定标签的第二用户群,其中,所述第四指定标签用于标记第三方确认的实际已经接受目标业务的用户。
可选的,所述提取模块包括以下之一:第一提取单元,用于提取所述第一用户群的预设行为特征,其中,所述预设行为特征包括:在本地系统产生的第一历史行为特征,在第三方系统产生的第二历史行为特征;第二提取单元,用于提取所述第一用户群的预设用户属性特征。
根据本发明的又一个实施例,还提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
根据本发明的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
通过本发明,从所有人群中筛选具有被标记有目标业务需求的种子用户群,根据提取到的用户的预设特征从种子用户群中确定目标用户群体,提高了目标业务与目标用户的匹配度,对明确了的目标用户群体投放目标业务类广告等活动,避免了因不明确目标用户群体投放广告的成本和运营资源的浪费,因此,解决了相关技术中因不明确有目标业务需求得用户群体时通过广告投放、活动引流等手段去获取用户流量而存在的浪费成本和运营资源的技术问题,从而降低了目标业务类广告的投放成本和运营资源的有益效果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明实施例的一种数据筛选方法的服务器结构框图;
图2是根据本发明实施例的一种数据筛选方法的流程图;
图3是本发明实施例在商户app标记预约状态的页面示意图;
图4是根据本发明实施例提供的一种数据筛选方法的整体流程图;
图5是根据本发明实施例提供的一种种子用户清洗流程图;
图6是根据本发明实施例提供的目标群体指标TGI的计算流程图;
图7是根据本发明实施例提供的一种数据筛选装置的结构示意图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
实施例1
本申请实施例一所提供的方法实施例可以在移动终端、计算机终端、服务器或者类似的运算装置中执行。以运行在服务器上为例,图1是本发明实施例的一种数据筛选方法的服务器结构框图。如图1所示,服务器可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,可选地,上述服务器还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述服务器的结构造成限定。例如,服务器还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的一种数据筛选方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至服务器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括服务器的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
在本实施例中提供了一种数据筛选方法,图2是根据本发明实施例的一种数据筛选方法的流程图,如图2所示,该流程包括如下步骤:
步骤S202,在数据库的第一用户群中筛选具备指定标签的第二用户群,其中,指定标签用于标记存在目标业务需求的用户;
其中,本实施例中的用户群为存储在数据库中的标识真实用户的标识数据,如姓名、电话号码、身份证号、账号等。
优选地,本实施例中的目标业务可以为婚嫁业务,婚嫁业务可以包括结婚、出嫁、定亲、相亲、离婚等业务,数据库可以是婚嫁类软件,或者是具备婚嫁类业务的线上平台的数据库,该数据库用于存储和管理在软件或平台触发过婚嫁类业务的用户账号,并按照用户的历史行为动作(如预约,成交,浏览等)打上各种标签。
本实施例中的第一用户群为数据库记录的所有用户,具备指定标签的第二用户群为数据库中存在婚嫁需求的具有发展潜质的种子用户群。
步骤S204,提取第一用户群的预设特征,其中,所述预设特征包括历史行为特征和用户属性特征;
本实施例中的预设特征可以是用户在具有婚嫁类相关业务的应用客户端上产生的历史行为特征,或者是在用户本身具有的适于婚嫁的用户属性特征等。
步骤S206,根据预设特征在第二用户群中选择第三用户群。
通过本发明,从所有人群中筛选具有被标记有婚嫁需求的种子用户群,根据提取到的用户的预设特征从种子用户群中确定目标用户群体,提高了目标业务与目标用户的匹配度,对明确了的目标用户群体投放婚嫁类广告等活动,避免了因不明确目标用户群体投放广告的成本和运营资源的浪费,因此,解决了相关技术中因不明确有婚嫁需求得用户群体时通过广告投放、活动引流等手段去获取用户流量而存在的浪费成本和运营资源的技术问题,从而降低了婚嫁类广告的投放成本和运营资源的有益效果。
在一个可选的实施例中,在根据预设特征在第二用户群中选择第三用户群之后,还包括:将第三用户群确定为目标群体;向目标群体推送目标业务类的活动通知。目标群体与目标业务匹配,在本实施例中,在向确定的目标群体推送目标业务类的活动通知,可以避免相关技术中为了获取用户流量向不确定的用户群体中投放广告,活动引流等手段而导致的浪费成本和运营资源的问题。
在一个可选的示例中,从所有用户(即上述第一用户群)中获取在具有婚嫁类相关业务的应用程序上点击预约按钮并实际到过店的用户群(即上述第二用户群),从该用户群中根据预设特征再筛选出目标用户群,比如筛选出年龄段从24-34岁的目标用户群,向24-34岁的目标用户群推送广告婚纱拍摄相关活动通知或者婚纱礼服活动的通知等。
在本实施例的一个可选实施方式中,根据预设特征在第二用户群中选择第三用户群包括:确定每个预设特征的目标群体指标(Target Group Index,TGI);基于TGI在第二用户群中选择第三用户群。本实施例中,通过目标计算目标群体指标TGI来反映每一个预设特征在特定研究范围内的强势或弱势,以便掌握每一个预设特征所在的用户群,在所有人群中的强势或弱势。
在一个可选的实施例中,确定每个预设特征的目标群体指标TGI包括:针对每一个预设特征,在第一用户群和第二用户群中分别确定具备第一预设特征的第一用户数和第二用户数,其中,第一预设特征为多个预设特征中的任一预设特征;计算第一用户数与第一用户群的数量的第一比值,以及计算第二用户数与第二用户群的数量的第二比值;将第二比值与第一比值的第三比值确定为第一预设特征的TGI。
根据上述的实施方式,针对单个预设特征计算该特征的TGI指标,假设该预设特征为未婚,所有用户数量为10万,种子用户群有6万人,先确定所有用户群中是“未婚”的用户数量(比如5万)和种子用户群中是特征“未婚”的用户数量(比如4万);计算所有用户群中“未婚”的用户数量占所有用户数量的第一比值为:5/10=1/2,以及种子用户群中“未婚”的用户数量占种子用户群的第二比值4/6=2/3;因此单个预设特征“未婚”的TGI为(2/3)/(1/2)=4/3,其中,4/3表明未婚人数在对婚嫁有需求的人数中所占比例的强弱。
可选的,基于TGI在第二用户群中选择第三用户群,包括:对每一个预设特征的TGI进行排序,并在多个预设特征中选择TGI最大的N个预设特征,其中,N为正整数;在第二用户群中选择具有N个预设特征中任意M个预设特征的用户作为第三用户群,其中,1≤M≤N。
在本实施例的一个可选实施方式中,计算每一个预设特征的TGI指标之后,将所有的TGI指标可以按照从大到小进行排序,或者按照其他约定进行排序;再根据预设规则在排序后的TGI指标中选择若干个TGI指标,例如预设规则设置为选择TGI指标大小排在前五个的预设特征,最后筛选出排序在前五个的预设特征的用户群(即上述第三用户群)。
可选的,在对每一个预设特征的TGI进行排序之前,还包括:对预设特征中的一个或多个预设特征的TGI指数进行调整。在本实施例中,计算出每一个预设特征的TGI指标之后按照从大到小排序之前,需要根据目标业务的预设特征进行微调,例如婚嫁类种子用户群,点击过预约到店的可能并不多,此时需要给是否点击过预约到店按钮的预设特征加上权重,以此来提高点击过预约到店的TGI指标,具体根据实际计算调整即可。
可选地,在数据库的第一用户群中筛选具备指定标签的第二用户群包括以下至少之一:在数据库的第一用户群中筛选具备第一指定标签的第二用户群,其中,第一指定标签用于标记已经预约目标业务的用户;在数据库的第一用户群中筛选具备第二指定标签的第二用户群,其中,第二指定标签用于标记已经反馈接受目标业务的用户;在数据库的第一用户群中筛选具备第三指定标签的第二用户群,其中,第三指定标签用于标记商户确认的实际已经接受目标业务的用户;在数据库的第一用户群中筛选具备第四指定标签的第二用户群,其中,第四指定标签用于标记第三方确认的实际已经接受目标业务的用户,其中,第三方可以是用户和商户之外的平台客服等。除此之外,比如婚嫁业务,还可以是浏览过婚嫁业务的用户标签,成交过婚嫁业务的用户的用户标签等。
在通过多个标签进行筛选时,在筛选过后还可以合并去重,取交集。
在一个可选的实施方式中,上述第一指定标签用于标记实际预约的用户,可以是用户点击过“预约按钮”并实际到店的,换言之,比如婚嫁业务,婚嫁业务中真正有效的种子用户;上述第二指定标签用于标记为接收商户反馈预约的,即商户对用户预约后进行过反馈且有效的用户;上述第三指定标签用于标记用户被商户备注了反馈预约;上述第四指定标签用于标记被客服备注反馈预约,例如客服经过电话联系了用户,明确了用户有实际需求的。
可选的,提取第一用户群的预设特征包括以下之一:提取第一用户群的预设行为特征,其中,预设行为特征包括:在本地系统产生的第一历史行为特征,在第三方系统产生的第二历史行为特征;提取第一用户群的预设用户属性特征。在一个可选的实施方式中,历史行为特征包括用户在具有婚嫁业务的应用程序上进行过特定操作的行为,例如,在百合网app上的婚嫁类店铺中曾经下单购买过婚嫁类目的商品的行为记录;或者在其他类似应用程序上进行过特定操作的行为;或者是用户自身具有的用户属性特征,例如:年龄,性别,身份,是否结婚等等。
下面结合婚嫁业务的具体实施例对本发明提供的方案进一步地说明。
本实施例的方案除了数据库之外,还包括用户侧app和商户app,其中,数据库是一个人群库:用于管理进行活动、营销投放的人群集合;用户侧app:为提供给用户使用的app,具备浏览、预约、交易等功能模块;商户app:提供给商户使用的app,可以管理店铺、商品以及用户的历史预约记录、历史浏览记录等;用户侧app和商户app还包括婚嫁店铺页,在app婚嫁频道页中婚嫁类店铺的页面,提供了店铺简介、商品购买、预约到店等功能;
用户侧app提供给用户的预约功能,用户点击预约到店按钮后,会弹出对话弹层,在用户留下联系信息并确认预约后,商户app会收到预约记录并主动联系用户;
在商户app中,表征商户对用户消费阶段的标记,商户可以选择某一条预约记录,标记当前用户为如“已到店”、“待到店”、“无意向”等,如图3所示,图3是本发明实施例在商户app标记预约状态的页面示意图;商户还可以反馈预约备注:商户对某条预约记录的留言,表征当前预约记录的一些反馈信息,包括有“已下单”、“已留微信待跟进”、“虚假用户”、“电话不通”等;
除此之外,平台的客服也可以反馈预约备注,app客服可以联系一部分用户进行预约确认,如果当前联系方式无效或者用户实际无需求,则会将该预约记录反馈为无效,否则反馈为有效。
图4是根据本发明实施例提供的一种数据筛选方法的整体流程图,如图4所示,具体流程分为如下几个步骤:
步骤S402,种子用户标签清洗;
图5是根据本发明实施例提供的一种种子用户清洗流程图,如图5所示,该过程主要是指从所有用户中,清洗出婚嫁业务真正有效的种子用户群,“有效”的定义为:用户经过“预约到店”操作并实际到店,商户反馈有效,或者客服经过电话联系用户反馈有实际需求。种子用户的清洗包括以下过程:
1、清洗实际预约用户:统计近180天内,在app的婚嫁类店铺页点击过预约到店按钮,并且有预约记录(排除掉点击了预约到店后续但并没有留下信息进行预约)的用户。
2、清洗商户反馈标签:1)清洗商户反馈预约状态为“已到店”或者“待到店”的用户,这两个状态表示商户已跟用户联系过并且用户即将到店洽谈或者已经到店;2)清洗商户反馈预约备注中包含有“已到店”、“已加微信”、“客资有效”等字段的预约记录对应的用户。
3、清洗客服反馈标签:清洗客服反馈预约备注包含有“已到店”、“已加微信”、“客资有效”等字段的预约记录对应的用户。
4)生成种子用户:合并去上述三个过程中的用户群并重,从而得到婚嫁人群库的种子用户。
步骤S404,种子用户特征清洗;至少包括以下过程:
1、用户侧app特征(即上述在本地系统上产生的第一历史行为特征):用户在app上的特征(即上述预设特征)有:是否在婚嫁类店铺点击过预约按钮,是否在婚嫁类店铺点击过电话咨询按钮,是否有过婚嫁类目商品的操作记录(包括点击商品详情页,加入购物车等),是否下单购买过婚嫁类目的商品,是否访问过婚嫁类目的店铺页;
2、用户基础特征(即上述用户属性特征):用户基础特征主要包括消费等级,年龄,性别,身份,是否结婚,是否有小孩,所属省份,所属城市,app店铺消费次数等等;
3、其他特征(即上述在第三方系统上产生的第二历史行为特征):其他特征包括如用户在京东上的搜索记录特征,指的是用户近30天是否在京东使用过婚嫁相关的搜索词(如婚纱,喜糖等)进行搜索,以及搜索的次数。
步骤S406,显著特征计算(即上述预设特征的目标群体指标TGI);计算流程如图6所示,图6是根据本发明实施例提供的目标群体指标TGI的计算流程图。
计算公式为:
计算逻辑过程为:某一个特征,首先根据种子用户是否有该特征,统计种子用户中有该特征的用户数并除以种子用户总数,然后计算全网用户(此处全网用户定义为,访问过用户侧app首页的用户)中有该特征的用户数并除以全网用户总数,最后将得到的两个值相除,得出显著特征值。
步骤S408,业务规则调整;
计算出每个特征的显著特征值之后按照从大到小排序,此时需要根据婚嫁业务的特征进行微调,例如婚嫁类种子用户,点击过预约到店的可能并不多,此时需要给是否点击过预约到店按钮特征加上权重,具体根据实际计算调整即可。
步骤S410,特征排序和圈人、投放;
经过上述步骤,在全网用户中,圈出用户包含有排序前五的特征值为真的用户,作为有婚嫁需求的人群库,可以向该人群库定向投放广告、推送信息或者展示应用程序上婚嫁的一些活动等。
实施例2
在本实施例中还提供了一种数据筛选装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图7是根据本发明实施例提供的一种数据筛选装置的结构示意图,如图7所示,该装置包括:
筛选模块702,用于在数据库的第一用户群中筛选具备指定标签的第二用户群,其中,所述指定标签用于标记存在目标业务需求的用户;提取模块704,连接至上述筛选模块702,用于提取所述第一用户群的预设特征,其中,预设特征包括历史行为特征和用户属性特征;选择模块706,连接至上述提取模块704,用于根据所述预设特征在所述第二用户群中选择第三用户群。
可选的,所述装置包括:确定模块,用于所述选择模块,在根据所述预设特征在所述第二用户群中选择第三用户群之后,将所述第三用户群确定为目标群体;推送模块,用于向所述目标群体推送目标业务类的活动通知。
可选的,所述选择模块706包括:确定单元,用于确定每个预设特征的目标群体指标TGI;选择单元,用于基于TGI在所述第二用户群中选择第三用户群。
可选的,所述确定单元包括:第一确定子单元,用于针对每一个预设特征,在所述第一用户群和所述第二用户群中分别确定具备第一预设特征的第一用户数和第二用户数,其中,所述第一预设特征为多个所述预设特征中的任一预设特征;计算子单元,用于计算所述第一用户数与所述第一用户群的数量的第一比值,以及计算所述第二用户数与所述第二用户群的数量的第二比值;第二确定子单元,用于将所述第二比值与所述第一比值的第三比值确定为所述第一预设特征的TGI。
可选的,所述选择单元包括:第一选择子单元,用于对每一个预设特征的TGI进行排序,并在多个预设特征中选择TGI最大的N个预设特征,其中,N为正整数;第二选择子单元,用于在所述第二用户群中选择具有所述N个预设特征中任意M个预设特征的用户作为所述第三用户群,其中,1≤M≤N。
可选的,所述装置还包括:调整模块,用于在所述第一选择子单元对每一个预设特征的TGI进行排序之前,对所述预设特征中的一个或多个预设特征的TGI指数进行调整。
可选的,所述筛选模块702包括以下至少之一:第一筛选单元,用于在数据库的所述第一用户群中筛选具备第一指定标签的第二用户群,其中,所述第一指定标签用于标记已经预约目标业务的用户;第二筛选单元,用于在数据库的所述第一用户群中筛选具备第二指定标签的第二用户群,其中,所述第二指定标签用于标记已经反馈接受目标业务的用户;第三筛选单元,用于在数据库的所述第一用户群中筛选具备第三指定标签的第二用户群,其中,所述第三指定标签用于标记商户确认的实际已经接受目标业务的用户;第四筛选单元,用于在数据库的所述第一用户群中筛选具备第四指定标签的第二用户群,其中,所述第四指定标签用于标记第三方确认的实际已经接受目标业务的用户。
可选的,所述提取模块704包括以下之一:第一提取单元,用于提取所述第一用户群的预设行为特征,其中,所述预设行为特征包括:在本地系统产生的第一历史行为特征,在第三方系统产生的第二历史行为特征;第二提取单元,用于提取所述第一用户群的预设用户属性特征。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
实施例3
本发明的实施例还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例的一个方面中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,在数据库的第一用户群中筛选具备指定标签的第二用户群,其中,所述指定标签用于标记存在目标业务需求的用户;
S2,提取所述第一用户群的预设特征,其中,所述预设特征包括历史行为特征和用户属性特征;
S3,根据所述预设特征在所述第二用户群中选择第三用户群。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
可选地,在本实施例的一个方面中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,在数据库的第一用户群中筛选具备指定标签的第二用户群,其中,所述指定标签用于标记存在目标业务需求的用户;
S2,提取所述第一用户群的预设特征,其中,所述预设特征包括历史行为特征和用户属性特征;
S3,根据所述预设特征在所述第二用户群中选择第三用户群。
可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (11)

1.一种数据筛选方法,其特征在于,包括:
在数据库的第一用户群中筛选具备指定标签的第二用户群,其中,所述指定标签用于标记存在目标业务需求的用户;
提取所述第一用户群的预设特征,其中,所述预设特征包括历史行为特征和用户属性特征;
根据所述预设特征在所述第二用户群中选择第三用户群。
2.根据权利要求1所述的方法,其特征在于,在根据所述预设特征在所述第二用户群中选择第三用户群之后,所述方法还包括:
将所述第三用户群确定为目标群体;
向所述目标群体推送目标业务类的活动通知。
3.根据权利要求1所述的方法,其特征在于,根据所述预设特征在所述第二用户群中选择第三用户群包括:
确定每个预设特征的目标群体指标TGI;
基于TGI在所述第二用户群中选择第三用户群。
4.根据权利要求3所述的方法,其特征在于,确定每个预设特征的TGI包括:
针对每一个预设特征,在所述第一用户群和所述第二用户群中分别确定具备第一预设特征的第一用户数和第二用户数,其中,所述第一预设特征为多个所述预设特征中的任一预设特征;
计算所述第一用户数与所述第一用户群的数量的第一比值,以及计算所述第二用户数与所述第二用户群的数量的第二比值;
将所述第二比值与所述第一比值的第三比值确定为所述第一预设特征的TGI。
5.根据权利要求3所述的方法,其特征在于,基于TGI在所述第二用户群中选择第三用户群,包括:
对每一个预设特征的TGI进行排序,并在多个预设特征中选择TGI最大的N个预设特征,其中,N为正整数;
在所述第二用户群中选择具有所述N个预设特征中任意M个预设特征的用户作为所述第三用户群,其中,1≤M≤N。
6.根据权利要求5所述的方法,其特征在于,在对每一个预设特征的TGI进行排序之前,所述方法还包括:
对所述预设特征中的一个或多个预设特征的TGI指数进行调整。
7.根据权利要求1所述的方法,其特征在于,在数据库的第一用户群中筛选具备指定标签的第二用户群包括以下至少之一:
在数据库的所述第一用户群中筛选具备第一指定标签的第二用户群,其中,所述第一指定标签用于标记已经预约目标业务的用户;
在数据库的所述第一用户群中筛选具备第二指定标签的第二用户群,其中,所述第二指定标签用于标记已经反馈接受目标业务的用户;
在数据库的所述第一用户群中筛选具备第三指定标签的第二用户群,其中,所述第三指定标签用于标记商户确认的实际已经接受目标业务的用户;
在数据库的所述第一用户群中筛选具备第四指定标签的第二用户群,其中,所述第四指定标签用于标记第三方确认的实际已经接受目标业务的用户。
8.根据权利要求1所述的方法,其特征在于,提取所述第一用户群的预设特征包括以下之一:
提取所述第一用户群的预设行为特征,其中,所述预设行为特征包括:在本地系统产生的第一历史行为特征,在第三方系统产生的第二历史行为特征;
提取所述第一用户群的预设用户属性特征。
9.一种数据筛选装置,其特征在于,包括:
筛选模块,用于在数据库的第一用户群中筛选具备指定标签的第二用户群,其中,所述指定标签用于标记存在目标业务需求的用户;
提取模块,用于提取所述第一用户群的预设特征,其中,所述预设特征包括历史行为特征和用户属性特征;
选择模块,用于根据所述预设特征在所述第二用户群中选择第三用户群。
10.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行权利要求1至8任一项中所述的方法。
11.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行权利要求1至8任一项中所述的方法。
CN201910488925.8A 2019-06-06 2019-06-06 数据筛选方法及装置、存储介质、电子装置 Pending CN110533447A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910488925.8A CN110533447A (zh) 2019-06-06 2019-06-06 数据筛选方法及装置、存储介质、电子装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910488925.8A CN110533447A (zh) 2019-06-06 2019-06-06 数据筛选方法及装置、存储介质、电子装置

Publications (1)

Publication Number Publication Date
CN110533447A true CN110533447A (zh) 2019-12-03

Family

ID=68659343

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910488925.8A Pending CN110533447A (zh) 2019-06-06 2019-06-06 数据筛选方法及装置、存储介质、电子装置

Country Status (1)

Country Link
CN (1) CN110533447A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111582944A (zh) * 2020-05-14 2020-08-25 北京金山安全软件有限公司 广告的人群拓展方法、装置、设备及存储介质
CN112765431A (zh) * 2020-12-17 2021-05-07 北京橙色云科技有限公司 需求信息的处理方法、装置以及存储介质
CN113095872A (zh) * 2021-03-23 2021-07-09 上海嵩恒网络科技股份有限公司 广告用户的分析方法、系统、电子设备和存储介质
CN113536848A (zh) * 2020-04-17 2021-10-22 中国移动通信集团广东有限公司 一种数据处理方法、装置及电子设备
CN113536131A (zh) * 2021-07-27 2021-10-22 拉扎斯网络科技(上海)有限公司 一种数据处理方法和装置,存储介质和电子设备
CN113743968A (zh) * 2020-05-29 2021-12-03 北京沃东天骏信息技术有限公司 信息投放方法、装置及设备
CN116579666A (zh) * 2023-07-11 2023-08-11 北京大也智慧数据科技服务有限公司 线下广告的评估方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103150696A (zh) * 2011-12-06 2013-06-12 中兴通讯股份有限公司 选择目标增值业务潜在客户的方法及装置
CN106682013A (zh) * 2015-11-09 2017-05-17 阿里巴巴集团控股有限公司 用于数据推送的方法和设备
CN107025578A (zh) * 2017-04-13 2017-08-08 上海艾德韦宣股份有限公司 一种大数据智能营销系统及营销方法
CN107679899A (zh) * 2017-09-26 2018-02-09 北京智云联众科技有限公司 一种广告屏的内容投放方法和装置
CN108319612A (zh) * 2017-01-17 2018-07-24 百度在线网络技术(北京)有限公司 受众媒体推荐方法和系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103150696A (zh) * 2011-12-06 2013-06-12 中兴通讯股份有限公司 选择目标增值业务潜在客户的方法及装置
CN106682013A (zh) * 2015-11-09 2017-05-17 阿里巴巴集团控股有限公司 用于数据推送的方法和设备
CN108319612A (zh) * 2017-01-17 2018-07-24 百度在线网络技术(北京)有限公司 受众媒体推荐方法和系统
CN107025578A (zh) * 2017-04-13 2017-08-08 上海艾德韦宣股份有限公司 一种大数据智能营销系统及营销方法
CN107679899A (zh) * 2017-09-26 2018-02-09 北京智云联众科技有限公司 一种广告屏的内容投放方法和装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
蒋三庚等: "《北京商务中心区(CBD)发展指数研究 北京市哲学社会科学CBD发展研究基地2015年度报告》", 31 October 2016, 首都经济贸易大学出版社 *
赵旭隆等: "《智能营销——数字生态下的营销革命》", 28 February 2016, 上海文艺出版社 *
高晓虹: "《中国新闻传播研究2012》", 31 August 2014, 中国传媒大学出版社 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113536848A (zh) * 2020-04-17 2021-10-22 中国移动通信集团广东有限公司 一种数据处理方法、装置及电子设备
CN113536848B (zh) * 2020-04-17 2024-03-19 中国移动通信集团广东有限公司 一种数据处理方法、装置及电子设备
CN111582944A (zh) * 2020-05-14 2020-08-25 北京金山安全软件有限公司 广告的人群拓展方法、装置、设备及存储介质
CN111582944B (zh) * 2020-05-14 2023-08-22 北京金山安全软件有限公司 广告的人群拓展方法、装置、设备及存储介质
CN113743968A (zh) * 2020-05-29 2021-12-03 北京沃东天骏信息技术有限公司 信息投放方法、装置及设备
CN112765431A (zh) * 2020-12-17 2021-05-07 北京橙色云科技有限公司 需求信息的处理方法、装置以及存储介质
CN113095872A (zh) * 2021-03-23 2021-07-09 上海嵩恒网络科技股份有限公司 广告用户的分析方法、系统、电子设备和存储介质
CN113536131A (zh) * 2021-07-27 2021-10-22 拉扎斯网络科技(上海)有限公司 一种数据处理方法和装置,存储介质和电子设备
CN116579666A (zh) * 2023-07-11 2023-08-11 北京大也智慧数据科技服务有限公司 线下广告的评估方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN110533447A (zh) 数据筛选方法及装置、存储介质、电子装置
JP4422173B2 (ja) 移動端末に対する広告情報配信システムおよび配信方法
KR100786795B1 (ko) 인터넷 광고 서비스 시스템 및 방법
CN106326248A (zh) 数据库数据的存储方法和装置
CN110147821A (zh) 目标用户群体确定方法、装置、计算机设备及存储介质
CN102081774A (zh) 养卡识别方法及系统
CN108416616A (zh) 投诉举报类别的排序方法和装置
CN107220745B (zh) 一种意图行为数据的识别方法、系统及设备
CN105405049A (zh) 智能记账方法及系统
CN105975537A (zh) 一种应用程序的排序方法及装置
CN109493110A (zh) 基于资金交易的奖励控制方法及装置
CN102063678A (zh) 一种向网友在线派发礼品的方法和装置
CN107317884A (zh) 信息交互系统及方法
WO2021129342A1 (zh) 数据处理方法、装置、设备、存储介质及计算机程序
CN107678808A (zh) 页面信息选取方案生成方法及装置
CN106934686A (zh) 一种自助下单的方法及系统
CN108053271A (zh) 一种应用于商圈的智能卡券推荐与分发的系统与方法
CN112784039A (zh) 一种分配在线客服的方法、装置和存储介质
CN110191183A (zh) 精准智能推送方法、系统、装置及计算机可读存储介质
CN106874321A (zh) 一种可插拔的数据检索方法和装置
CN110232591A (zh) 一种页面推广方法、页面推广系统及服务器
CN107949858A (zh) 信息管理装置及信息管理方法
CN106202371A (zh) 媒体文件的处理方法、装置和广告分析方法
CN108776857A (zh) Nps短信调研方法、系统、计算机设备和存储介质
CN109919667A (zh) 一种用于识别企业ip的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20191203