CN111143346B - 标签组的差异性确定方法、装置、电子设备及可读介质 - Google Patents
标签组的差异性确定方法、装置、电子设备及可读介质 Download PDFInfo
- Publication number
- CN111143346B CN111143346B CN201811300751.XA CN201811300751A CN111143346B CN 111143346 B CN111143346 B CN 111143346B CN 201811300751 A CN201811300751 A CN 201811300751A CN 111143346 B CN111143346 B CN 111143346B
- Authority
- CN
- China
- Prior art keywords
- determining
- label
- tag
- group
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开实施例公开了一种标签组的差异性确定方法、装置、电子设备及可读介质。该方法包括:若存在标签组需要进行流量区分度计算,则在样本数据中统计所述标签组内各标签的展示代价数据;根据所述各标签的展示代价数据,确定标签组的流量区分度;根据所述标签组的流量区分度,确定所述标签组是否具有差异性。通过采用本公开所提供的技术方案,可以实现对标签进行更加科学的评估,从而提高标签质量的效果。
Description
技术领域
本公开实施例涉及数据建模技术领域,尤其涉及一种标签组的差异性确定方法、装置、电子设备及可读介质。
背景技术
随着经济社会的迅速发展,移动终端以及各种各样的应用程序进入到广大用户的生活中。对于信息展示者而言,如何能够提升自己的知名度,被更多的用户所知晓,对于信息展示是相当重要的一个环节。
目前,展示信息在确定展示信息目标时,往往是以标签为准。如果存在相应的标签,则进行展示,如果不存在相应的标签,则不进行展示。然而随着数据量的不断增加,用户人群的逐渐扩大,信息展示所依赖的标签在不断的扩大和精细化。而在得到新标签需要确定是否上线时,现有技术的做法就是盲目上线,这样导致依赖标签所展示的信息的下载或者浏览转化率下降,对信息展示者而言效果极差。
发明内容
本公开实施例提供一种标签组的差异性确定方法、装置、电子设备及可读介质,可以实现对标签进行更加科学的评估,从而提高标签质量的效果。
第一方面,本公开实施例提供了一种标签组的差异性确定方法,该方法包括:
若存在标签组需要进行流量区分度计算,则在样本数据中统计所述标签组内各标签的展示代价数据;
根据所述各标签的展示代价数据,确定标签组的流量区分度;
根据所述标签组的流量区分度,确定所述标签组是否具有差异性。
进一步的,根据所述各标签的展示代价数据,确定标签组的流量区分度,包括:
根据所述各标签的展示代价数据,利用单因素方差分析法确定标签组中各标签之间的流量区分度。
进一步的,在利用单因素方差分析法确定标签组中各标签之间的流量区分度之后,所述方法还包括:
获取目标行业组,在样本数据中统计所述目标行业组内各行业的展示代价数据;
利用双因素方差分析法确定标签组中各标签在预设行业类型中各行业之间的流量区分度。
进一步的,在确定所述标签组具有显著差异性之后,所述方法还包括:
根据所述标签组确定目标人群,并对所述目标人群进行信息展示。
进一步的,根据所述标签组确定目标人群,并对所述目标人群进行信息展示,包括:
确定所述标签组中符合预设流量转化效率标准的标签确定为目标标签;
将具有所述目标标签的人群确定为目标人群;
对所述目标人群进行信息展示。
进一步的,根据所述标签组确定目标人群,并对所述目标人群进行信息展示,包括:
确定所述标签组中符合预设流量转化效率标准,且确定所述标签组中符合预设转化成本的标签,作为目标标签;
将具有所述目标标签的人群确定为目标人群;
对所述目标人群进行信息展示。
第二方面,本公开实施例还提供了一种标签组的差异性确定装置,该装置包括:
展示代价数据统计模块,用于若存在标签组需要进行流量区分度计算,则在样本数据中统计所述标签组内各标签的展示代价数据;
流量区分度确定模块,用于根据所述各标签的展示代价数据,确定标签组的流量区分度;
差异性确定模块,用于根据所述标签组的流量区分度,确定所述标签组是否具有差异性。
进一步的,所述流量区分度确定模块包括:
标签流量区分度确定单元,用于根据所述各标签的展示代价数据,利用单因素方差分析法确定标签组中各标签之间的流量区分度。
进一步的,所述流量区分度确定模块还包括:
行业展示代价数据统计单元,用于获取目标行业组,在样本数据中统计所述目标行业组内各行业的展示代价数据;
行业流量区分度确定单元,用于利用双因素方差分析法确定标签组中各标签在预设行业类型中各行业之间的流量区分度。
进一步的,所述装置还包括:
信息目标人群确定模块,用于根据所述标签组确定目标人群,并对所述目标人群进行信息展示。
进一步的,所述信息目标人群确定模块包括:
第一目标标签确定单元,用于确定所述标签组中符合预设流量转化效率标准的标签确定为目标标签;
第一目标人群确定单元,用于将具有所述目标标签的人群确定为目标人群;
第一信息展示单元,用于对所述目标人群进行信息展示。
进一步的,根据所述标签组确定目标人群,并对所述目标人群进行信息展示,包括:
第二目标标签确定单元,用于确定所述标签组中符合预设流量转化效率标准,且确定所述标签组中符合预设转化代价的标签,作为目标标签;
第二目标人群确定单元,用于将具有所述目标标签的人群确定为目标人群;
第二信息展示单元,用于对所述目标人群进行信息展示。
第三方面,本公开实施例提供了一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器运行的计算机程序,所述处理器执行所述计算机程序时实现如本公开实施例所述的标签组的差异性确定方法。
第四方面,本公开实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如本公开实施例所述的标签组的差异性确定方法。
本公开实施例所提供的技术方案,通过存在标签组需要进行流量区分度计算,则在样本数据中统计所述标签组内各标签的展示代价数据;根据所述各标签的展示代价数据,确定标签组的流量区分度;根据所述标签组的流量区分度,确定所述标签组是否具有差异性。通过采用本公开所提供的技术方案,可以实现对标签进行更加科学的评估,从而提高标签质量的效果。
附图说明
图1是本公开实施例一提供的标签组的差异性确定方法的流程图;
图2是本公开实施例一提供的标签组的差异性确定方法的流程图;
图3是本公开实施例一提供的标签组的差异性确定方法的流程图;
图4是本公开实施例二提供的标签组的差异性确定装置的结构示意图;
图5是本公开实施例三提供的一种电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本公开作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本公开,而非对本公开的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本公开相关的部分而非全部结构。
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
下述各实施例中,每个实施例中同时提供了可选特征和示例,实施例中记载的各个特征可进行组合,形成多个可选方案,不应将每个编号的实施例仅视为一个技术方案。
实施例一
图1是本公开实施例一提供的标签组的差异性确定方法的流程图,本实施例可适用新标签上线前的标签评估的情况,该方法可以由本公开实施例所提供的标签组的差异性确定装置来执行,该装置可以由软件和/或硬件的方式来实现,并可集成于客户端、终端以及服务器等电子设备中。
如图1所示,所述标签组的差异性确定方法包括:
S110、若存在标签组需要进行流量区分度计算,则在样本数据中统计所述标签组内各标签的展示代价数据。
其中,标签组可以是多个标签的集合,如职业标签,其中就包含了医生、教师等职业。标签组可以是已经上线的标签组,其中上线可以是在线上已经被使用的标签,还可以是刚刚挖掘出来的一组标签。存在标签组需要进行流量区分度的计算的情况,可以是对一组刚刚挖掘出来的标签进行上线前的测试,还可以是对已经上线的标签进行标签质量评估。其中流量区分度可以理解为基于流量的标签组中各个标签之间的区分程度,值得说明的是,流量区分度不只有标签这一个维度因素的影响,还可以有其他维度的影响,比如行业、年龄等。
在本技术方案中,样本数据对于还没有上线的标签而言,可以是测试周期内获得的测试数据,对于已经上线的标签而言,可以是在线上使用过程中所获取的数据。在本公开提供的技术方案中,可以把测试数据的测试时长设置在30天以上,这样设置的好处是可以保证数据量的充足,以及不会十分严重的影响标签的上线速度。
在本技术方案中,展示代价数据可以是每1000个展示所消耗的代价。本技术方案可以得到标签与标签之间的展示代价数据分布差异是否显著的流量区分度。
S120、根据所述各标签的展示代价数据,确定标签组的流量区分度。
其中,流量区分度可以是每个标签在流量上面的区分程度。在确定每个标签的展示代价数据之后,可以利用计分方法来确定标签之间的流量区分度。例如对每个标签建立坐标系,横坐标为展示代价数据的数值大小,纵坐标为在这一数值下的样本数目,可以对每个标签得到一个类似于正态分布的曲线,进一步的,计算正态分布曲线在某一段范围内与坐标系所围成的面积,就可以得到各个标签之间的流量区分度。可以理解的,上述采用计分方法来确定流量区分度的方案仅仅为一个示例,具体的可以采用任何一种能够确定标签与标签之间在展示代价数据的分布差异是否显著的计算方式来计算流量区分度。
S130、根据所述标签组的流量区分度,确定所述标签组是否具有差异性。
其中,可以根据流量区分度与设定阈值之间的大小关系,来确定标签组是否具有差异性。
本公开实施例所提供的技术方案,通过若存在标签组需要进行流量区分度计算,则在样本数据中统计所述标签组内各标签的展示代价数据;根据所述各标签的展示代价数据,确定标签组的流量区分度;根据所述标签组的流量区分度,确定所述标签组是否具有差异性。通过采用本公开所提供的技术方案,可以实现对标签进行更加科学的评估,从而提高标签质量的效果。
在上述技术方案的基础上,可选的,根据所述各标签的展示代价数据,确定标签组的流量区分度,包括:根据所述各标签的展示代价数据,利用单因素方差分析法确定标签组中各标签之间的流量区分度。
记A,B,C为试验中状态发生变化的因素,称因素在试验中所取的不同状态为水平。
设因素A有a个水平,记为A1,A2,···,Aa;因素B有b个水平,记为B1,B2,···,Bb等。
若试验中只有一个变动的因素,就称为单因素试验;若有两个变动的因素,就称为双因素试验;若有两个以上的变动因素,则称为多因素试验。
方差分析的基本假设是指,设因素A在水平Ai下的某项指标为总体Xi,则假定:
Xi~N(μi,σ2),Xi相互独立;
就是要检验原假设H0:μ1=μ2=···=μa是否成立。
若拒绝H0,就说明因素A对试验结果有显著影响,进一步还应确定使效果达到最佳的水平。
若不能拒绝H0,则说明因素A对该项指标无显著影响,试验结果中的差异主要是由其他未加控制的因素和试验误差所引起的。
虽然可以用两两t检验法来检验各μi间是否存在显著差异,但t检验无法检验多个因素间的交互效应,而这正是方差分析要解决的主要问题。
其中,单因素方差分析的基本思路如下:
将因素的不同水平和随机误差对试验结果的影响进行分离,并比较两者中哪一个对试验结果xij的影响起主要作用。若因素的不同水平对试验结果xij的影响是主要的,就拒绝H0,说明因素A对试验结果有显著影响;若试验结果xij中的差异主要是由随机误差引起的,就不能拒绝H0,说明因素A对试验结果无显著影响。为此,需要对总的偏差平方和进行分解。
称其中的ST为总的偏差平方和,它反映了样本数据xij间总的差异量的大小。为便于对ST进行分解,记水平Ai下的样本均值为
其中,由于单因素方差的定义是要忽略交叉项的,所以忽略这一项,认为Se和SA独立;/>反映了各样本(同一水平)内的数据差异,主要是由随机误差所引起的,称为误差平方和或组内平方和。/>反映了各样本(不同水平)间数据的差异,主要是由因素A的不同水平效应间的差异引起的,称为因素A的平方和或组间平方和。
利用SA和Se之比就可以构造出检验H0的统计量。可以证明,当H0为真时,统计量故在给定水平a下,若F>Fa(a-1,N-a),就拒绝H0,说明各水平Ai的效应间存在显著差异,或称因素A的作用是显著的。
本技术方案这样设置的好处是可以利用方差分析法来对标签的影响是否显著进行判断,以得到标签组中各个标签的差异性是否明显,如果标签的差异性明显,那么在标签使用的过程中可以更加准确的定位目标人群,从而提高信息展示者的信息展示效果。
图2是本公开实施例一提供的标签组的差异性确定方法的流程图。本技术方案是在上述技术方案中的各个可选方案为基础进行具体化。优化为在利用单因素方差分析法确定标签组中各标签之间的流量区分度之后,所述方法还包括:获取目标行业组,在样本数据中统计所述目标行业组内各行业的展示代价数据;利用双因素方差分析法确定标签组中各标签在预设行业类型中各行业之间的流量区分度。
如图2所示,所述标签组的差异性确定方法包括:
S210、若存在标签组需要进行流量区分度计算,则在样本数据中统计所述标签组内各标签的展示代价数据。
S220、根据所述各标签的展示代价数据,利用单因素方差分析法确定标签组中各标签之间的流量区分度。
S230、获取目标行业组,在样本数据中统计所述目标行业组内各行业的展示代价数据。
其中,行业组中可以包含一个或者多个行业,在本实施例中,目标行业组可以至少包含信息展示者的所属行业。这样设置的好处是有利于提供针对与其所在行业比较详细的标签分析结果,为信息展示者提供更加有效的可使用的标签。
S240、利用双因素方差分析法确定标签组中各标签在预设行业类型中各行业之间的流量区分度。
类似于上述的单因素方差分析,双因素方差分析不仅在上述的标签组内各标签进行流量区分度的确定,还在各个行业之间进行流量区分度的确定。
在本技术方案中,以无交互作用时的双因素试验作为示例进行说明。
设试验中有A,B两个变动的因素,因素A取a个水平,因素B取b个水平。在Ai和Bj组合下的试验效果为总体Xij。
Xij~N(μij,σ2),且相互独立,其中i=1,2,...,a;j=1,2,...,b。
当不考虑交互作用时,在两个因素的各水平Ai和Bj组合下只需分别进行一次试验,记试验结果为xij。
同样,称αi为因素A的水平Ai的效应;βj为因素B的水平Bj的效应。并称为一般平均,则xij=μij+εij=μ+αi+βj+εij;
在无交互作用的双因素方差分析中,要检验的原假设有以下两个:
H01:α1=α2=···=αa=0;
H02:β1=β2=···=βb=0。
若拒绝H01,说明因素A的作用显著;
若拒绝H02,说明因素B的作用显著。
与单因素方差分析完全类似地,可将总的偏差平方和ST分解为以下三项:
其中Se仅反映了随机误差引起的数据波动,称为误差平方和;
SA主要是由因素A各水平效应的不同所产生的差异,称为因素A的平方和或A的组间平方和。
SB主要是由因素B各水平效应的不同所产生的差异,称为因素B的平方和或B的组间平方和。
同样可以证明:当H01为真时,统计量:
当H02为真时,统计量:
当FA>F(a-1,(a-1)(b-1))时,拒绝H01;
当FB>F(b-1,(a-1)(b-1))时,拒绝H02。
S250、根据所述标签组的流量区分度,确定所述标签组是否具有差异性。
其中,此处的差异性既表现在标签组中各标签之间是否具有差异性,还表现在针对其中的一个行业或者多个行业,标签组中各个标签是否具有差异性。也就是说,如果经计算确定,当前标签组在行业中的学生、教师、医生以及互联网行业中,如果尽在学生行业当中差异性较好,而在其他三个行业中差异性较差,则在利用当前标签组作为其他三个行业展示信息的标签时,效果显然是很差的,所以,可以确定当前标签不适宜作为其他三个行业的信息展示者的信息展示依据。
本技术方案在上述各技术方案的基础上,提供了一种利用双因素方差分析法来确定标签组中各个标签是否具有显著差异性的方法。这样设置的好处是可以根据信息展示者的所属行业来确定是否使用该标签,从而为信息展示者带来更好的信息展示效果。
图3是本公开实施例一提供的标签组的差异性确定方法的流程图。本技术方案在上述技术方案中的各个可选方案为基础进行具体化。
如图3所示,所述标签组的差异性确定方法包括:
S310、若存在标签组需要进行流量区分度计算,则在样本数据中统计所述标签组内各标签的展示代价数据。
S320、根据所述各标签的展示代价数据,确定标签组的流量区分度。
S330、根据所述标签组的流量区分度,确定所述标签组是否具有差异性。
S340、根据所述标签组确定目标人群,并对所述目标人群进行信息展示。
在确定当前标签组的各个标签之间存在差异性之后,可以根据所述标签组确定目标人群,例如根据换机用户确定一个目标人群,进而并对具有换机用户的标签的目标人群进行信息展示。其中,换机用户需要与当前标签组中其他标签具有差异性,否则将无法确定根据换机用户这一标签所确定的目标人群是否为信息展示者想要展示的目标人群。
本技术方案在上述各技术方案的基础上,提供了一种在确定标签具有差异性之后的标签组的使用方法,通过采用本方法对信息进行展示,可以提高依据标签进行信息展示的效果,提高下载或者观看转化率。
在上述各技术方案的基础上,可选的,根据所述标签组确定目标人群,并对所述目标人群进行信息展示,包括:确定所述标签组中符合预设流量转化效率标准的标签确定为目标标签;将具有所述目标标签的人群确定为目标人群;对所述目标人群进行信息展示。其中,为流量转化率设定的流量转化率标准可以是行业的流量转化率的平均值,可以在样本数据中,对每个标签的流量转化率进行统计,对于超过上述平均值的标签确定为目标标签,进而根据目标标签确定目标人群。这样设置的好处是不仅可以确定标签组中各个标签之间是存在显著差异性的,还能够根据行业信息展示的流量转化率平均水平,以超过这一平均水平的标签作为目标标签,从而为信息展示者提供更加有效的目标标签进行信息展示,达到提高信息展示转化率的效果。
在上述各技术方案的基础上,可选的,根据所述标签组确定目标人群,并对所述目标人群进行信息展示,包括:确定所述标签组中符合预设流量转化效率标准,且确定所述标签组中符合预设转化代价的标签,作为目标标签;将具有所述目标标签的人群确定为目标人群;对所述目标人群进行信息展示。其中,转化代价可以是一个标签的所有流量中,展示代价除以转化数量所得到的转化代价。在为信息展示者提供目标标签之前,可以对各个标签在样本数据中所体现的转化代价进行统计,在转化率超过一定水平的基础上,可以将转化代价较低的标签作为目标标签,这样设置的好处是不仅可以提高转化率,还能够降低信息展示者的信息展示代价。
实施例二
图4是本公开实施例二提供的标签组的差异性确定装置的结构示意图。如图4所示,所述标签组的差异性确定装置,包括:
展示代价数据统计模块410,用于若存在标签组需要进行流量区分度计算,则在样本数据中统计所述标签组内各标签的展示代价数据;
流量区分度确定模块420,用于根据所述各标签的展示代价数据,确定标签组的流量区分度;
差异性确定模块430,用于根据所述标签组的流量区分度,确定所述标签组是否具有差异性。
本公开实施例所提供的技术方案,通过存在标签组需要进行流量区分度计算,则在样本数据中统计所述标签组内各标签的展示代价数据;根据所述各标签的展示代价数据,确定标签组的流量区分度;根据所述标签组的流量区分度,确定所述标签组是否具有差异性。通过采用本公开所提供的技术方案,可以实现对标签进行更加科学的评估,从而提高标签质量的效果。
在上述各实施例的基础上,可选的,所述流量区分度确定模块420包括:
标签流量区分度确定单元,用于根据所述各标签的展示代价数据,利用单因素方差分析法确定标签组中各标签之间的流量区分度。
在上述各实施例的基础上,可选的,所述流量区分度确定模块420还包括:
行业展示代价数据统计单元,用于获取目标行业组,在样本数据中统计所述目标行业组内各行业的展示代价数据;
行业流量区分度确定单元,用于利用双因素方差分析法确定标签组中各标签在预设行业类型中各行业之间的流量区分度。
在上述各实施例的基础上,可选的,所述装置还包括:
信息目标人群确定模块,用于根据所述标签组确定目标人群,并对所述目标人群进行信息展示。
在上述各实施例的基础上,可选的,所述信息目标人群确定模块包括:
第一目标标签确定单元,用于确定所述标签组中符合预设流量转化效率标准的标签确定为目标标签;
第一目标人群确定单元,用于将具有所述目标标签的人群确定为目标人群;
第一信息展示单元,用于对所述目标人群进行信息展示。
在上述各实施例的基础上,可选的,根据所述标签组确定目标人群,并对所述目标人群进行信息展示,包括:
第二目标标签确定单元,用于确定所述标签组中符合预设流量转化效率标准,且确定所述标签组中符合预设转化代价的标签,作为目标标签;
第二目标人群确定单元,用于将具有所述目标标签的人群确定为目标人群;
第二信息展示单元,用于对所述目标人群进行信息展示。
上述产品可执行本公开任意实施例所提供的方法,具备执行方法相应的功能模块和有益效果。
实施例三
图5是本公开实施例三提供的一种电子设备的结构示意图。下面参考图5,其示出了适于用来实现本公开实施例的电子设备500的结构示意图。本公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载电子设备(例如车载导航电子设备)等等的电子设备以及诸如数字TV、台式计算机等等的固定电子设备。图5示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图5所示,电子设备500可以包括处理装置(例如中央处理器、图形处理器等)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储装置508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有电子设备500操作所需的各种程序和数据。处理装置501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
通常,以下装置可以连接至I/O接口505:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置506;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置507;包括例如磁带、硬盘等的存储装置508;以及通信装置509。通信装置509可以允许电子设备500与其他设备进行无线或有线通信以交换数据。虽然图5示出了具有各种装置的电子设备500,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置509从网络上被下载和安装,或者从存储装置508被安装,或者从ROM502被安装。在该计算机程序被处理装置501执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读介质或者是上述两者的任意组合。计算机可读介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:若存在标签组需要进行流量区分度计算,则在样本数据中统计所述标签组内各标签的展示代价数据;根据所述各标签的展示代价数据,确定标签组的流量区分度;根据所述标签组的流量区分度,确定所述标签组是否具有差异性。
或者,上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:若存在标签组需要进行流量区分度计算,则在样本数据中统计所述标签组内各标签的展示代价数据;根据所述各标签的展示代价数据,确定标签组的流量区分度;根据所述标签组的流量区分度,确定所述标签组是否具有差异性。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,模块、单元的名称在某种情况下并不构成对该模块、单元本身的限定。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (8)
1.一种标签组的差异性确定方法,其特征在于,包括:
若存在标签组需要进行流量区分度计算,则在样本数据中统计所述标签组内各标签的展示代价数据;
根据所述各标签的展示代价数据,确定标签组的流量区分度;
根据所述标签组的流量区分度,确定所述标签组是否具有差异性;
在确定所述标签组具有显著差异性之后,根据所述标签组确定目标人群,并对所述目标人群进行信息展示,包括:确定所述标签组中符合预设流量转化效率标准的标签确定为目标标签;将具有所述目标标签的人群确定为目标人群;对所述目标人群进行信息展示。
2.根据权利要求1所述的方法,其特征在于,根据所述各标签的展示代价数据,确定标签组的流量区分度,包括:
根据所述各标签的展示代价数据,利用单因素方差分析法确定标签组中各标签之间的流量区分度。
3.根据权利要求2所述的方法,其特征在于,在利用单因素方差分析法确定标签组中各标签之间的流量区分度之后,所述方法还包括:
获取目标行业组,在样本数据中统计所述目标行业组内各行业的展示代价数据;
利用双因素方差分析法确定标签组中各标签在预设行业类型中各行业之间的流量区分度。
4.根据权利要求1所述的方法,其特征在于,根据所述标签组确定目标人群,并对所述目标人群进行信息展示,包括:
确定所述标签组中符合预设流量转化效率标准,且确定所述标签组中符合预设转化代价的标签,作为目标标签;
将具有所述目标标签的人群确定为目标人群;
对所述目标人群进行信息展示。
5.一种标签组的差异性确定装置,其特征在于,包括:
展示代价数据统计模块,用于若存在标签组需要进行流量区分度计算,则在样本数据中统计所述标签组内各标签的展示代价数据;
流量区分度确定模块,用于根据所述各标签的展示代价数据,确定标签组的流量区分度;
差异性确定模块,用于根据所述标签组的流量区分度,确定所述标签组是否具有差异性;
所述装置还包括:信息目标人群确定模块,用于根据所述标签组确定目标人群,并对所述目标人群进行信息展示;
其中,所述信息目标人群确定模块包括:
第一目标标签确定单元,用于确定所述标签组中符合预设流量转化效率标准的标签确定为目标标签;
第一目标人群确定单元,用于将具有所述目标标签的人群确定为目标人群;
第一信息展示单元,用于对所述目标人群进行信息展示。
6.根据权利要求5所述的装置,其特征在于,所述流量区分度确定模块包括:
标签流量区分度确定单元,用于根据所述各标签的展示代价数据,利用单因素方差分析法确定标签组中各标签之间的流量区分度。
7.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-4中任一项所述的标签组的差异性确定方法。
8.一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-4中任一项所述的标签组的差异性确定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811300751.XA CN111143346B (zh) | 2018-11-02 | 2018-11-02 | 标签组的差异性确定方法、装置、电子设备及可读介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811300751.XA CN111143346B (zh) | 2018-11-02 | 2018-11-02 | 标签组的差异性确定方法、装置、电子设备及可读介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111143346A CN111143346A (zh) | 2020-05-12 |
CN111143346B true CN111143346B (zh) | 2023-08-25 |
Family
ID=70516213
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811300751.XA Active CN111143346B (zh) | 2018-11-02 | 2018-11-02 | 标签组的差异性确定方法、装置、电子设备及可读介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111143346B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113837669B (zh) * | 2021-11-26 | 2022-03-18 | 腾讯科技(深圳)有限公司 | 一种标签体系的评价指标构建方法和相关装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102750289A (zh) * | 2011-04-19 | 2012-10-24 | 富士通株式会社 | 标签组分类方法、设备和数据混合方法、设备 |
CN107392655A (zh) * | 2017-07-03 | 2017-11-24 | 携程计算机技术(上海)有限公司 | 优惠券推送方法、系统、存储介质、电子设备及分流方法 |
CN108090499A (zh) * | 2017-11-13 | 2018-05-29 | 中国科学院自动化研究所 | 基于最大信息三元组筛选网络的数据主动标注方法和系统 |
CN108415978A (zh) * | 2018-02-09 | 2018-08-17 | 北京腾云天下科技有限公司 | 用户标签存储方法、用户画像计算方法及计算设备 |
CN108509626A (zh) * | 2018-04-08 | 2018-09-07 | 百度在线网络技术(北京)有限公司 | 用于验证数据的方法和装置 |
CN108665318A (zh) * | 2018-05-16 | 2018-10-16 | 广州虎牙信息科技有限公司 | 有效用户标签筛选方法、装置、存储介质和计算机设备 |
CN110189163A (zh) * | 2019-04-30 | 2019-08-30 | 北京三快在线科技有限公司 | 推广内容的评价方法、装置、电子设备和存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090132935A1 (en) * | 2007-11-15 | 2009-05-21 | Yahoo! Inc. | Video tag game |
US8346776B2 (en) * | 2010-05-17 | 2013-01-01 | International Business Machines Corporation | Generating a taxonomy for documents from tag data |
US10339471B2 (en) * | 2017-01-17 | 2019-07-02 | International Business Machines Corporation | Ensemble based labeling |
-
2018
- 2018-11-02 CN CN201811300751.XA patent/CN111143346B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102750289A (zh) * | 2011-04-19 | 2012-10-24 | 富士通株式会社 | 标签组分类方法、设备和数据混合方法、设备 |
JP2012226740A (ja) * | 2011-04-19 | 2012-11-15 | Fujitsu Ltd | タググループ分類方法、装置及びデータマッシュアップ方法、装置 |
CN107392655A (zh) * | 2017-07-03 | 2017-11-24 | 携程计算机技术(上海)有限公司 | 优惠券推送方法、系统、存储介质、电子设备及分流方法 |
CN108090499A (zh) * | 2017-11-13 | 2018-05-29 | 中国科学院自动化研究所 | 基于最大信息三元组筛选网络的数据主动标注方法和系统 |
CN108415978A (zh) * | 2018-02-09 | 2018-08-17 | 北京腾云天下科技有限公司 | 用户标签存储方法、用户画像计算方法及计算设备 |
CN108509626A (zh) * | 2018-04-08 | 2018-09-07 | 百度在线网络技术(北京)有限公司 | 用于验证数据的方法和装置 |
CN108665318A (zh) * | 2018-05-16 | 2018-10-16 | 广州虎牙信息科技有限公司 | 有效用户标签筛选方法、装置、存储介质和计算机设备 |
CN110189163A (zh) * | 2019-04-30 | 2019-08-30 | 北京三快在线科技有限公司 | 推广内容的评价方法、装置、电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111143346A (zh) | 2020-05-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109726390B (zh) | 文档处理方法、装置、电子设备和存储介质 | |
CN109376419B (zh) | 一种数据模型的生成方法、装置、电子设备及可读介质 | |
CN111401228B (zh) | 视频目标标注方法、装置及电子设备 | |
CN109815448B (zh) | 幻灯片生成方法及装置 | |
CN112395188B (zh) | 一种面向测试的软件项目开发方法、装置、电子设备及存储介质 | |
CN111738316B (zh) | 零样本学习的图像分类方法、装置及电子设备 | |
CN111460288B (zh) | 用于检测新闻事件的方法和装置 | |
CN110795554B (zh) | 目标信息分析方法、装置、设备及存储介质 | |
CN111327913B (zh) | 消息处理方法、装置及电子设备 | |
CN110765752A (zh) | 试题的生成方法、装置、电子设备及计算机可读存储介质 | |
CN111143346B (zh) | 标签组的差异性确定方法、装置、电子设备及可读介质 | |
CN111209432A (zh) | 信息获取的方法、装置、电子设备及计算机可读介质 | |
CN111832354A (zh) | 目标对象年龄识别方法、装置及电子设备 | |
CN111160285B (zh) | 一种获取板书信息的方法、装置、介质和电子设备 | |
CN112863277A (zh) | 一种直播教学的互动方法、装置、介质和电子设备 | |
CN110879868A (zh) | 顾问方案生成方法、装置、系统、电子设备及介质 | |
CN113053531A (zh) | 医疗数据处理方法、装置、计算机可读存储介质及设备 | |
CN111857935B (zh) | 文字生成方法和装置 | |
CN109492695B (zh) | 数据建模的样本处理方法、装置、电子设备及可读介质 | |
CN111428544B (zh) | 一种场景识别方法、装置、电子设备及存储介质 | |
CN111461227B (zh) | 样本生成方法、装置、电子设备和计算机可读介质 | |
CN112346630B (zh) | 状态确定方法、装置、设备和计算机可读介质 | |
CN117573979A (zh) | 目标内容推荐方法、装置、电子设备及计算机可读存储介质 | |
CN112580964A (zh) | 学生综合素质评测方法、装置、电子设备及介质 | |
CN117649459A (zh) | 图像绘制方法、数据生成方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |