CN111127095A - 目标受众兴趣分析方法、装置、设备及存储介质 - Google Patents

目标受众兴趣分析方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN111127095A
CN111127095A CN201911333633.3A CN201911333633A CN111127095A CN 111127095 A CN111127095 A CN 111127095A CN 201911333633 A CN201911333633 A CN 201911333633A CN 111127095 A CN111127095 A CN 111127095A
Authority
CN
China
Prior art keywords
target
interest
sample set
sample data
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911333633.3A
Other languages
English (en)
Other versions
CN111127095B (zh
Inventor
田丹丹
丁若谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Miaozhen Information Technology Co Ltd
Original Assignee
Miaozhen Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Miaozhen Information Technology Co Ltd filed Critical Miaozhen Information Technology Co Ltd
Priority to CN201911333633.3A priority Critical patent/CN111127095B/zh
Publication of CN111127095A publication Critical patent/CN111127095A/zh
Application granted granted Critical
Publication of CN111127095B publication Critical patent/CN111127095B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0242Determining effectiveness of advertisements
    • G06Q30/0244Optimization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • G06Q30/0271Personalized advertisement

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)

Abstract

本申请提供一种目标受众兴趣分析方法、装置、设备及存储介质,涉及数据分析技术领域。该方法包括:获取目标样本集;根据目标样本集与预设样本集的匹配量,计算目标样本集在各兴趣标签的占比;其中,预设样本集中包括多组样本数据和至少一个兴趣标签;根据所述目标样本集在各兴趣标签的占比,从至少一个兴趣标签中确定目标兴趣标签。相对于现有技术,避免了通过大量调研个体级数据对样本数据的兴趣进行分析,造成成本较高的问题。

Description

目标受众兴趣分析方法、装置、设备及存储介质
技术领域
本申请涉及数据分析技术领域,具体而言,涉及一种目标受众兴趣分析方法、装置、设备及存储介质。
背景技术
在广告和市场营销等行业中,目标受众(Target Audience)是指广告或营销活动所针对的群体,这一群体一般由具有共同的年龄段、性别、教育程度、收入等属性的成员组成。例如,一个广告活动可能针对20-30岁的女性群体,则20-30岁的女性群体即为该广告活动的目标受众。
现有技术中,一般通过个体级的数据对每个用户的消费特征、历史行为和个人信息进行分析,从而更加了解用户的需求或兴趣点,方便后续的精准营销。
但是这种分析方式个体级的数据需要购买,成本较高,且安全性不高,涉及到用户的隐私。
发明内容
本申请的目的在于,针对上述现有技术中的不足,提供一种目标受众兴趣分析方法、装置、设备及存储介质,以解决现有技术中通过个体级数据对样本数据的兴趣进行分析,造成成本较高的问题。
为实现上述目的,本申请实施例采用的技术方案如下:
第一方面,本申请一实施例提供了一种目标受众兴趣分析方法,所述方法包括:
获取目标样本集;
根据目标样本集与预设样本集的匹配量,计算目标样本集在各兴趣标签的占比;其中,预设样本集中包括多组样本数据和至少一个兴趣标签;
根据所述目标样本集在各兴趣标签的占比,从至少一个兴趣标签中确定目标兴趣标签。
可选地,所述获取目标样本集之前,所述方法还包括:
获取所述预设样本集中的多组样本数据;
确定每组样本数据的至少一个兴趣标签;
根据各组样本数据及所述每组样本数据的至少一个兴趣标签,计算所述各组样本数据中每个兴趣标签的占比。
可选地,所述根据目标样本集与预设样本集的匹配量,计算目标样本集在每个兴趣标签的占比,包括:
根据所述目标样本集和所述预设样本集,分别计算所述目标样本集与各组样本数据的匹配量,和所述根据目标样本集与预设样本集的匹配量;
根据所述目标样本集与各组样本数据的匹配量,和各组样本数据中目标兴趣标签的占比,计算所述目标样本集与所述各组样本数据的目标兴趣标签的匹配量;
根据所述目标样本集与所述各组样本数据的目标兴趣标签的匹配量,和所述目标样本集与所述预设样本集的总匹配量,计算所述目标样本集在目标兴趣标签的占比。
可选地,所述计算所述目标样本集在目标兴趣标签的占比,包括:
根据所述目标样本集与所述各组样本数据的各兴趣标签的匹配量,计算所述目标样本集与目标兴趣标签的总匹配量;
根据所述总匹配量,和所述目标样本集与所述预设样本集的匹配量,计算所述目标样本集在目标兴趣标签的占比。
可选地,所述获取所述预设样本集中的多组样本数据,包括:
获取样本数据集;
对所述样本数据集进行分组,得到所述多组样本数据,其中所述每组样本数据中具有所述至少一个兴趣标签对应的历史行为数据。
可选地,所述确定每组样本数据的至少一个兴趣标签,包括:
根据所述每组样本数据中的历史行为数据,为所述每组样本数据匹配对应的兴趣标签。
可选地,所述方法还包括:
确定所述每组样本数据中各兴趣标签的占比;
若同一兴趣标签在不同组样本数据中的占比差值在预设范围内,则对所述样本数据集进行重新分组,直至重新分组后的不同组样本数据中同一兴趣标签的占比差值超出所述预设范围。
第二方面,本申请另一实施例提供了一种目标受众兴趣分析装置,所述装置包括:获取模块、计算模块和确定模块,其中:
所述获取模块,用于获取目标样本集;
所述计算模块,用于根据目标样本集和预设样本集中各组样本数据的匹配量,计算目标样本集在每个兴趣标签的占比;其中,预设样本集中包括多组样本数据和至少一个兴趣标签;
所述确定模块,用于根据所述目标样本集在每个兴趣标签的占比,从至少一个兴趣标签中确定目标兴趣标签。
可选地,所述获取模块,还用于获取所述预设样本集中的多组样本数据;
所述确定模块,还用于确定每组样本数据的至少一个兴趣标签;
所述计算模块,还用于根据所述多组样本数据及所述每组样本数据的至少一个兴趣标签,计算所述多组样本数据中每个兴趣标签的占比。
可选地,所述计算模块,还用于根据所述目标样本集和所述预设样本集,分别计算所述目标样本集与各组样本数据的匹配量,和所述根据目标样本集与预设样本集的匹配量;根据所述目标样本集与各组样本数据的匹配量,和各组样本数据中目标兴趣标签的占比,计算所述目标样本集与所述各组样本数据的目标兴趣标签的匹配量;根据所述目标样本集与所述各组样本数据的目标兴趣标签的匹配量,和所述目标样本集与所述预设样本集的匹配量,计算所述目标样本集在目标兴趣标签的占比。
可选地,所述计算模块,还用于根据所述目标样本集与所述各组样本数据的各兴趣标签的匹配量,计算所述目标样本集与目标兴趣标签的总匹配量;根据所述总匹配量,和所述目标样本集与所述预设样本集的匹配量,计算所述目标样本集在目标兴趣标签的占比。
可选地,所述装置还包括:分组模块,其中:
所述获取模块,还用于获取样本数据集;
所述分组模块,用于对所述样本数据集进行分组,得到所述多组样本数据,其中所述每组样本数据中具有所述至少一个兴趣标签对应的历史行为数据。
可选地,所述装置还包括:匹配模块,用于根据所述每组样本数据中的历史行为数据,为所述每组样本数据匹配对应的兴趣标签。
可选地,所述确定模块,还用于确定所述每组样本数据中各兴趣标签的占比;
所述分组模块,还用于若同一兴趣标签在不同组样本数据中的占比差值在预设范围内,则对所述样本数据集进行重新分组,直至重新分组后的不同组样本数据中同一兴趣标签的占比差值超出所述预设范围。
第三方面,本申请另一实施例提供了一种分析设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当所述分析设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如上述第一方面任一所述方法的步骤。
第四方面,本申请另一实施例提供了一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如上述第一方面任一所述方法的步骤。
本申请的有益效果是:采用本申请提供的目标受众兴趣分析方法,首先确定目标样本集和预设样本集的匹配量,计算目标样本集在各兴趣标签的占比,随后根据计算结果,从至少一个兴趣标签中确定目标兴趣标签,这样的处理方式使得目标受众的兴趣分析是基于样本数据分析的,而不是个体级的分析,且不需要获取个体级的数据,节省了成本,并且安全性高,不会涉及用户的隐私。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请一实施例提供的目标受众兴趣分析方法的流程示意图;
图2为本申请另一实施例提供的目标受众兴趣分析方法的流程示意图;
图3为本申请另一实施例提供的目标受众兴趣分析方法的流程示意图;
图4为本申请一实施例提供的目标受众兴趣分析装置的结构示意图;
图5为本申请另一实施例提供的目标受众兴趣分析装置的结构示意图;
图6为本申请另一实施例提供的目标受众兴趣分析装置的结构示意图;
图7为本申请一实施例提供的分析设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。
图1为本申请一实施例提供的一种目标受众兴趣分析方法的流程示意图,如图1所示,该方法包括:
S101:获取目标样本集。
其中,目标样本集为用户预先设置好的,是一个待分析的受众集合。
S102:根据目标样本集与预设样本集的匹配量,计算目标样本集在各兴趣标签的占比。
其中,预设样本集中包括多组样本数据和至少一个兴趣标签。
其中,目标样本集与预设样本集的匹配量即为:目标样本集中与预设样本集中重合的样本数据的数量,根据匹配量可以进一步计算目标样本在预设样本集的各兴趣标签上的占比情况。
S103:根据目标样本集在各兴趣标签的占比,从至少一个兴趣标签中确定目标兴趣标签。
其中,目标兴趣标签为分析得到的用户较为感兴趣的兴趣标签,可以用于指示后期广告投放的方向,提升广告投放的回报率。
可选地,在本申请的一个实施例中,若兴趣标签为多个,可以在多个兴趣标签中,根据各兴趣标签的占比对各兴趣标签进行排名,选择排名靠前的三个兴趣标签作为目标兴趣标签;但也可以选择排名靠前的两个、四个或五个兴趣标签作为目标兴趣标签,具体目标兴趣标签的确定方式可以根据用户需要设计,本申请在此不做任何限制。
采用本申请提供的目标受众兴趣分析方法,首先确定目标样本集和预设样本集的匹配量,计算目标样本集在各兴趣标签的占比,随后根据计算结果,从至少一个兴趣标签中确定目标兴趣标签,这样的处理方式使得目标受众的兴趣分析是基于样本数据分析的,而不是个体级的分析,且不需要获取个体级的数据,节省了成本,并且安全性高,不会涉及用户的隐私。
图2为本申请另一实施例提供的一种目标受众兴趣分析方法的流程示意图,如图2所示,S101之前,该方法还包括:
S104:获取预设样本集中的多组样本数据。
其中,多组样本数据的每组样本数据中,样本数据的数量均一致,即各组样本数据的样本量相同。
S105:确定每组样本数据的至少一个兴趣标签。
可选地,在本申请的一个实施例中,可以通过加密等技术,在保证数据安全的前提下,通过拥有样本受众真实行为的第一方应用程序,为每组样本数据匹配至少一个兴趣标签。
可选地,在本申请的一个实施例中,可以根据每组样本数据中的历史行为数据,为每组样本数据匹配对应的兴趣标签。
S106:根据各组样本数据及每组样本数据的至少一个兴趣标签,计算各组样本数据中每个兴趣标签的占比。
可选地,每个兴趣标签的占比的计算方式可以为:各组样本数据中该兴趣标签的匹配量,与各组样本数据的样本量之商。举例说明,设当前需要计算样本分组X中兴趣标签A的占比,则计算方式为:样本分组X中A的匹配量/样本分组X的样本量。
可选地,在本申请的一个实施例中,该方法还包括:确定每组样本数据中各兴趣标签的占比;若同一兴趣标签在不同组样本数据中的占比差值在预设范围内,则对样本数据集进行重新分组,直至重新分组后的不同组样本数据中同一兴趣标签的占比差值超出预设范围。
可选地,在本申请的一个实施例中,预设范围为5%,举例说明:例如各分组中,家电消费这一兴趣标签在各组中的比例均为5%-10%,则对当前样本数据集重新分组,直至各组不同组样本数据中同一兴趣标签的占比差值超出预设范围。但是预设范围的具体设置并不以上述实施例为限,也可以设置为3%或10%,具体预设范围的设置可以根据用户需要确定,本申请在此不做任何限制。
可选地,每组样本数据包括:行为信息和人口属性信息。
其中,行为信息可以包括下述至少一项:用户ID信息、访问时间、用户终端信息;人口属性信息可以包括下述至少一项:常驻信息、性别信息、年龄信息、学历信息、收入信息、职业信息。具体行为信息和人口属性信息的设置可以根据用户需要调整,本申请在此不做任何限制。
可选地,对样本数据集进行分组时,可以根据行为信息进行分组,也可以根据人口属性进行分组,只需分组后得到多个样本数量一致的样本数据组即可。
举例说明:设当前样本数据集中包括全国的十万个样本数据,则可以根据样本数据中,各样本的省份信息对样本进行分类,得到各省份对应的样本数据组;也可以根据样本的年龄信息进行分类,得到各年龄段对应的样本数据组;还可以根据样本的终端信息进行分组,得到各终端设备对应的样本数据组,具体分组的方式可以根据用户需要设计,本申请在此不做任何限制。
图3为本申请另一实施例提供的一种目标受众兴趣分析方法的流程示意图,如图3所示,S104之前,该方法还包括:
S107:获取样本数据集。
可选地,获取样本数据集的方式可以为:在第三方招募网站会员登陆页面嵌入代码,或者在客户端植入模块等方式,具体获取样本数据集的方式可以根据用户需要设计,本申请在此不做任何限制。
S108:对样本数据集进行分组,得到多组样本数据。
其中,每组样本数据中具有至少一个兴趣标签对应的历史行为数据。
由于企业竞争及用户隐私保护等数据安全的压力,拥有目标受众真实行为数据的应用程序APP不可能对外提供用户个体级的数据,但是通过将样本数据集进行分组,返回各组样本数据集在各兴趣标签上有过历史行为的样本数是可行的,这样的返回方式不但可以保护用户的隐私,并且不需要获取个体级的样本数据进行处理分析,直接获取各兴趣标签对应的历史行为数据,不但减少了数据处理的复杂程度,并且保护了用户的隐私安全。
可选地,在本申请的一个实施例中,S103可包括:
根据目标样本集和预设样本集,分别计算目标样本集与各组样本数据的匹配量,和目标样本集与预设样本集的总匹配量。
其中,即分别计算目标样本集与各组样本数据中,样本的重合量,举例说明:每一组样本数据与目标样本集的重合量即为该组样本数据与目标样本集的匹配量;目标样本集与预设样本集的总匹配量,即为目标样本集与预设样本集中样本重合的总量。
根据目标样本集与各组样本数据的匹配量,和各组样本数据中目标兴趣标签的占比,计算目标样本集与各组样本数据的目标兴趣标签的匹配量。
举例说明,当前得到样本分组X1的数据与目标样本集的重合量为Y,且当前样本分组X1中,目标兴趣标签A的占比为n%,则目标样本集与样本分组X1的目标兴趣标签A的匹配量可以根据n%*Y计算得到。
根据目标样本集与各组样本数据的目标兴趣标签的匹配量,和目标样本集与预设样本集的匹配量,计算目标样本集在目标兴趣标签的占比。
可选地,在本申请的一个实施例中,可以根据目标样本集与各组样本数据的各兴趣标签的匹配量,计算目标样本集与目标兴趣标签的总匹配量;根据总匹配量,和目标样本集与预设样本集的匹配量,计算目标样本集在目标兴趣标签的占比。
举例说明:设预设样本集中有两个样本分组X1和X2,且当前目标样本集与预设样本集的匹配量为Z,目标样本集与样本分组X1的目标兴趣标签A的匹配量为n%*Y,目标样本集与样本分组X2的目标兴趣标签A的匹配量为m%*T(即样本分组X2的数据与目标样本集的重合量为T,且当前样本分组X2中,目标兴趣标签A的占比为m%),则首先将兴趣标签A在样本分组X1和X2中的匹配量累加,就可得到目标样本集与目标兴趣标签A的总匹配量:m%*T+n%*Y,随后根据(m%*T+n%*Y)/Z计算得到目标样本集在目标兴趣标签A的占比。
举例说明目标受众兴趣分析方法的完整处理流程,假设当前的预设样本数据集包括4个分组:Group1、Group2、Group3、Group4,每个分组分别有N个样本,通过兴趣标签的匹配,为这四个分组分别匹配家电消费、食品饮料、美妆个护三个兴趣标签,匹配后的预设样本数据集的形式如下所示:
Group1 Group2 Group3 Group4
家电消费 a11 a12 a13 a14
食品饮料 a21 a22 a23 a24
美妆个护 a31 a32 a33 a34
总匹配量 N1 N2 N3 N4
其中a11-a34均为大于0的正整数,用于表示当前分组下对应兴趣标签的匹配量;举例说明:a31表示Group1分组下,美妆个护的匹配量,即Group1分组下对美妆个护感兴趣的样本数量。
随后根据GroupX兴趣标签A匹配量/GroupX匹配量=GroupX兴趣标签A比例,分别计算得到目标样本集与每个分组对应的兴趣标签A的占比。
其中,GroupX兴趣标签A匹配量即为目标样本集与GroupX兴趣标签A下样本数据重合的数量,GroupX匹配量即为目标样本集与GroupX中样本数据重合的数量,GroupX兴趣标签A比例即为目标样本集与GroupX中兴趣标签A的占比。
通过上面的匹配结果,很容易计算得到目标样本集在各分组GroupX的各兴趣标签上的比例,计算结果如下所示:
Group1 Group2 Group3 Group4
家电消费 a11/N1 a12/N2 a13/N3 a14/N4
食品饮料 a21/N1 a22/N3 a23/N3 a24/N4
美妆个护 a31/N1 a32/N3 a33/N3 a34/N4
随后,根据各分组在各兴趣标签上的比例,判断各分组在同一兴趣标签上的表现区分是否明显,即判断各分组在同一兴趣标签上的占比差值是否在预设范围内,若在预设范围内,则说明当前兴趣标签在各样本中的区分度不明显,则对上述样本数据集重新分组,并重新计算分组后的各分组在同一兴趣标签上的占比差值是否在预设范围内,直到各分组在每个兴趣标签上都有较明显的区分,说明当前分组后的样本数据为可参考的样本数据,随即继续进行后续的分析,判断广告活动的目标受众兴趣。
各Group属性A总匹配量/各Group总匹配量=属性A比例。
其中,各Group属性A总匹配量为根据目标样本集与各GroupX兴趣标签A匹配量累加得到的,各Group总匹配量即为目标样本集与预设样本集的总匹配量,属性A的比例即为在当前目标样本集中,属性A所占的感兴趣受众的比例,比例越高,说明目标受众对属性A越感兴趣。
至此,即可分析目标受众对各兴趣标签的感兴趣程度,从各兴趣标签中确定目标兴趣标签。
采用本申请提供的目标受众兴趣分析方法,可以在保证用户隐私的情况下,对预设样本数据集进行分组,并对每组的兴趣标签进行分析,确定每个兴趣标签的占比。确定目标样本集和预设样本集的匹配量,计算目标样本集在各兴趣标签的占比,根据计算结果,从至少一个兴趣标签中确定目标兴趣标签,这样的处理方式无需挖掘每个用户的兴趣点,就可以得到样本数据集的兴趣占比,根据分析结果确定的目标兴趣表象,来指导广告的投放或优化广告的效果,从而提高了投资的回报率。
图4为本申请一实施例提供的目标受众兴趣分析装置的结构示意图,如图4所示,该装置包括:获取模块201、计算模块202和确定模块203,其中:
获取模块201,用于获取目标样本集。
计算模块202,用于根据目标样本集和预设样本集中各组样本数据的匹配量,计算目标样本集在每个兴趣标签的占比;其中,预设样本集中包括多组样本数据和至少一个兴趣标签。
确定模块203,用于根据目标样本集在每个兴趣标签的占比,从至少一个兴趣标签中确定目标兴趣标签。
可选地,获取模块201,还用于获取预设样本集中的多组样本数据。
确定模块203,还用于确定每组样本数据的至少一个兴趣标签。
计算模块202,还用于根据多组样本数据及每组样本数据的至少一个兴趣标签,计算多组样本数据中每个兴趣标签的占比。
可选地,计算模块202,还用于根据目标样本集和预设样本集,分别计算目标样本集与各组样本数据的匹配量,和根据目标样本集与预设样本集的匹配量;根据目标样本集与各组样本数据的匹配量,和各组样本数据中目标兴趣标签的占比,计算目标样本集与各组样本数据的目标兴趣标签的匹配量;根据目标样本集与各组样本数据的目标兴趣标签的匹配量,和目标样本集与预设样本集的匹配量,计算目标样本集在目标兴趣标签的占比。
可选地,计算模块202,还用于根据目标样本集与各组样本数据的各兴趣标签的匹配量,计算目标样本集与目标兴趣标签的总匹配量;根据总匹配量,和目标样本集与预设样本集的匹配量,计算目标样本集在目标兴趣标签的占比。
图5为本申请一实施例提供的目标受众兴趣分析装置的结构示意图,如图5所示,该装置还包括:分组模块204,其中:
获取模块201,还用于获取样本数据集。
分组模块204,用于对样本数据集进行分组,得到多组样本数据,其中每组样本数据中具有至少一个兴趣标签对应的历史行为数据。
图6为本申请一实施例提供的目标受众兴趣分析装置的结构示意图,如图6所示,该装置还包括:匹配模块205,用于根据每组样本数据中的历史行为数据,为每组样本数据匹配对应的兴趣标签。
可选地,确定模块203,还用于确定每组样本数据中各兴趣标签的占比。
分组模块204,还用于若同一兴趣标签在不同组样本数据中的占比差值在预设范围内,则对样本数据集进行重新分组,直至重新分组后的不同组样本数据中同一兴趣标签的占比差值超出预设范围。
上述装置用于执行前述实施例提供的方法,其实现原理和技术效果类似,在此不再赘述。
以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器(digital singnal processor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(CentralProcessing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,简称SOC)的形式实现。
图7为本申请一实施例提供的分析设备的结构示意图,该分析设备可以集成于终端设备或者终端设备的芯片。
如图7所示,该分析设备包括:处理器501、存储介质502和总线503。
处理器501用于存储程序,处理器501调用存储介质502存储的程序,以执行上述图1-图3对应的方法实施例。具体实现方式和技术效果类似,这里不再赘述。
可选地,本申请还提供一种程序产品,例如存储介质,该存储介质上存储有计算机程序,包括程序,该程序在被处理器运行时执行上述方法对应的实施例。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(英文:processor)执行本申请各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取存储器(英文:Random Access Memory,简称:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

Claims (10)

1.一种目标受众兴趣分析方法,其特征在于,所述方法包括:
获取目标样本集;
根据目标样本集与预设样本集的匹配量,计算目标样本集在各兴趣标签的占比;其中,预设样本集中包括多组样本数据和至少一个兴趣标签;
根据所述目标样本集在各兴趣标签的占比,从至少一个兴趣标签中确定目标兴趣标签。
2.如权利要求1所述的方法,其特征在于,所述获取目标样本集之前,所述方法还包括:
获取所述预设样本集中的多组样本数据;
确定每组样本数据的至少一个兴趣标签;
根据各组样本数据及所述每组样本数据的至少一个兴趣标签,计算所述各组样本数据中每个兴趣标签的占比。
3.如权利要求1所述的方法,其特征在于,所述根据目标样本集与预设样本集的匹配量,计算目标样本集在每个兴趣标签的占比,包括:
根据所述目标样本集和所述预设样本集,分别计算所述目标样本集与各组样本数据的匹配量,和所述目标样本集与所述预设样本集的总匹配量;
根据所述目标样本集与各组样本数据的匹配量,和各组样本数据中目标兴趣标签的占比,计算所述目标样本集与所述各组样本数据的目标兴趣标签的匹配量;
根据所述目标样本集与所述各组样本数据的目标兴趣标签的匹配量,和所述目标样本集与所述预设样本集的总匹配量,计算所述目标样本集在目标兴趣标签的占比。
4.如权利要求3所述的方法,其特征在于,所述计算所述目标样本集在目标兴趣标签的占比,包括:
根据所述目标样本集与所述各组样本数据的各兴趣标签的匹配量,计算所述目标样本集与目标兴趣标签的总匹配量;
根据所述总匹配量,和所述目标样本集与所述预设样本集的匹配量,计算所述目标样本集在目标兴趣标签的占比。
5.如权利要求2所述的方法,其特征在于,所述获取所述预设样本集中的多组样本数据,包括:
获取样本数据集;
对所述样本数据集进行分组,得到所述多组样本数据,其中所述每组样本数据中具有所述至少一个兴趣标签对应的历史行为数据。
6.如权利要求5所述的方法,其特征在于,所述确定每组样本数据的至少一个兴趣标签,包括:
根据所述每组样本数据中的历史行为数据,为所述每组样本数据匹配对应的兴趣标签。
7.根据权利要求5所述的方法,其特征在于,所述方法还包括:
确定所述每组样本数据中各兴趣标签的占比;
若同一兴趣标签在不同组样本数据中的占比差值在预设范围内,则对所述样本数据集进行重新分组,直至重新分组后的不同组样本数据中同一兴趣标签的占比差值超出所述预设范围。
8.一种目标受众兴趣分析装置,其特征在于,所述装置包括:获取模块、计算模块和确定模块,其中:
所述获取模块,用于获取目标样本集;
所述计算模块,用于根据目标样本集和预设样本集中各组样本数据的匹配量,计算目标样本集在每个兴趣标签的占比;其中,预设样本集中包括多组样本数据和至少一个兴趣标签;
所述确定模块,用于根据所述目标样本集在每个兴趣标签的占比,从至少一个兴趣标签中确定目标兴趣标签。
9.一种分析设备,其特征在于,所述设备包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当所述分析设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行上述权利要求1-7任一项所述的方法。
10.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述权利要求1-7任一项所述的方法。
CN201911333633.3A 2019-12-20 2019-12-20 目标受众兴趣分析方法、装置、设备及存储介质 Active CN111127095B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911333633.3A CN111127095B (zh) 2019-12-20 2019-12-20 目标受众兴趣分析方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911333633.3A CN111127095B (zh) 2019-12-20 2019-12-20 目标受众兴趣分析方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN111127095A true CN111127095A (zh) 2020-05-08
CN111127095B CN111127095B (zh) 2023-05-30

Family

ID=70500977

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911333633.3A Active CN111127095B (zh) 2019-12-20 2019-12-20 目标受众兴趣分析方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN111127095B (zh)

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101520878A (zh) * 2009-04-03 2009-09-02 华为技术有限公司 向用户进行广告推送的方法、装置和系统
US8676650B1 (en) * 2011-08-16 2014-03-18 Google Inc. Allocating and pricing geo-located advertisements for display on maps
CN104598449A (zh) * 2013-10-30 2015-05-06 Sap欧洲公司 基于偏好的聚类
US20160055236A1 (en) * 2014-08-21 2016-02-25 Affectomatics Ltd. Personalized experience scores based on measurements of affective response
CN107657500A (zh) * 2016-12-03 2018-02-02 平安证券股份有限公司 股票推荐方法及服务器
CN108062410A (zh) * 2017-12-29 2018-05-22 北京奇元科技有限公司 一种确定对象兴趣点的方法及装置
CN108319612A (zh) * 2017-01-17 2018-07-24 百度在线网络技术(北京)有限公司 受众媒体推荐方法和系统
CN108416630A (zh) * 2018-03-16 2018-08-17 北京焦点新干线信息技术有限公司 一种目标受众的确定方法及装置
CN108629608A (zh) * 2017-03-22 2018-10-09 腾讯科技(深圳)有限公司 用户数据处理方法及装置
CN108769190A (zh) * 2018-05-28 2018-11-06 广州招点信息科技有限公司 一种基于用户消费行为的活动邀请推送方法及系统
CN109345317A (zh) * 2018-10-24 2019-02-15 口口相传(北京)网络技术有限公司 用户口味偏好信息的确定方法及装置
CN109858970A (zh) * 2019-02-02 2019-06-07 中国银行股份有限公司 一种用户行为预测方法、装置及存储介质
CN109951512A (zh) * 2019-01-09 2019-06-28 平安科技(深圳)有限公司 用户偏好确定方法、系统、电子设备及存储介质
US20190259070A1 (en) * 2016-10-20 2019-08-22 Suzhou Deepleaper Information And Technology Company Limited Advertising information pushing method, device and system, server, and computer readable medium
CN110163712A (zh) * 2018-03-09 2019-08-23 葛芮 一种商品信息推送方法及系统

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101520878A (zh) * 2009-04-03 2009-09-02 华为技术有限公司 向用户进行广告推送的方法、装置和系统
US8676650B1 (en) * 2011-08-16 2014-03-18 Google Inc. Allocating and pricing geo-located advertisements for display on maps
CN104598449A (zh) * 2013-10-30 2015-05-06 Sap欧洲公司 基于偏好的聚类
US20160055236A1 (en) * 2014-08-21 2016-02-25 Affectomatics Ltd. Personalized experience scores based on measurements of affective response
US20190259070A1 (en) * 2016-10-20 2019-08-22 Suzhou Deepleaper Information And Technology Company Limited Advertising information pushing method, device and system, server, and computer readable medium
CN107657500A (zh) * 2016-12-03 2018-02-02 平安证券股份有限公司 股票推荐方法及服务器
CN108319612A (zh) * 2017-01-17 2018-07-24 百度在线网络技术(北京)有限公司 受众媒体推荐方法和系统
CN108629608A (zh) * 2017-03-22 2018-10-09 腾讯科技(深圳)有限公司 用户数据处理方法及装置
CN108062410A (zh) * 2017-12-29 2018-05-22 北京奇元科技有限公司 一种确定对象兴趣点的方法及装置
CN110163712A (zh) * 2018-03-09 2019-08-23 葛芮 一种商品信息推送方法及系统
CN108416630A (zh) * 2018-03-16 2018-08-17 北京焦点新干线信息技术有限公司 一种目标受众的确定方法及装置
CN108769190A (zh) * 2018-05-28 2018-11-06 广州招点信息科技有限公司 一种基于用户消费行为的活动邀请推送方法及系统
CN109345317A (zh) * 2018-10-24 2019-02-15 口口相传(北京)网络技术有限公司 用户口味偏好信息的确定方法及装置
CN109951512A (zh) * 2019-01-09 2019-06-28 平安科技(深圳)有限公司 用户偏好确定方法、系统、电子设备及存储介质
CN109858970A (zh) * 2019-02-02 2019-06-07 中国银行股份有限公司 一种用户行为预测方法、装置及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
李德玉;翁小奎;李艳红;: "基于用户兴趣域的混合数据聚类标签算法" *
赵世峰;: "新零售背景下面向未来的消费者标签系统的研究与设计" *

Also Published As

Publication number Publication date
CN111127095B (zh) 2023-05-30

Similar Documents

Publication Publication Date Title
CN110472154B (zh) 一种资源推送方法、装置、电子设备及可读存储介质
CN111062757A (zh) 基于多路径寻优匹配的信息推荐方法及系统
WO2010138512A1 (en) Measuring impact of online advertising campaigns
CN108629698A (zh) 一种保险产品的定价方法、装置、终端设备及存储介质
CN110083634B (zh) 基于数据分析的订单处理方法、装置、设备及存储介质
CN109543940B (zh) 活动评估方法、装置、电子设备及存储介质
CN108961073B (zh) 一种保险产品的推荐方法、存储介质和服务器
CN108269107A (zh) 用户信息处理方法及装置
CN110019774B (zh) 标签分配方法、装置、存储介质及电子装置
Xiao et al. Parameter identification for the discretely observed geometric fractional Brownian motion
CN115249170A (zh) 一种基于5g消息的营销客群触达方法和装置
CN114021735A (zh) 一种联邦学习中数据处理的方法及装置
CN105096150B (zh) 需求方平台的数据处理方法及需求方平台
CN111127095B (zh) 目标受众兴趣分析方法、装置、设备及存储介质
CN111009299A (zh) 相似药品推荐方法及系统、服务器及介质
CN111008871A (zh) 一种房地产复购客户跟进数量计算方法、装置及存储介质
CN116430207A (zh) 芯片的pat参数确定方法、装置、电子设备及存储介质
CN110796379A (zh) 业务渠道的风险评估方法、装置、设备及存储介质
CN115687790A (zh) 基于大数据的广告推送方法、系统及云平台
CN113220741B (zh) 互联网广告虚假流量识别方法、系统、设备及存储介质
CN107545347B (zh) 用于防控风险的属性确定方法、装置及服务器
CN115705581A (zh) 广告推荐成功率预测、广告推荐方法及装置
CN110175296B (zh) 网络图中的节点推荐方法和服务器以及存储介质
CN112700285A (zh) 用于预测用户属性标签的方法及装置、设备
CN113870010A (zh) 基于机器学习的数据处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant