CN110704648B - 用户行为属性的确定方法、装置、服务器及存储介质 - Google Patents

用户行为属性的确定方法、装置、服务器及存储介质 Download PDF

Info

Publication number
CN110704648B
CN110704648B CN201910922087.0A CN201910922087A CN110704648B CN 110704648 B CN110704648 B CN 110704648B CN 201910922087 A CN201910922087 A CN 201910922087A CN 110704648 B CN110704648 B CN 110704648B
Authority
CN
China
Prior art keywords
target
content
multimedia files
stability
preset number
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910922087.0A
Other languages
English (en)
Other versions
CN110704648A (zh
Inventor
张志伟
杨德兴
陈晓晖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN201910922087.0A priority Critical patent/CN110704648B/zh
Publication of CN110704648A publication Critical patent/CN110704648A/zh
Application granted granted Critical
Publication of CN110704648B publication Critical patent/CN110704648B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/483Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/435Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Strategic Management (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Development Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本公开公开了一种用户行为属性的确定方法、装置、服务器及存储介质,属于互联网技术领域。所述方法包括:根据预设数量个目标多媒体文件的内容特征及其内容所属的内容类别中至少一项,确定目标用户上传多媒体文件的稳定性数值;根据上传多媒体文件的稳定性数值,确定目标用户上传多媒体文件的稳定性。本公开通过提取每个目标多媒体文件的内容特征,并确定每个目标多媒体文件的内容所属的内容类别,进而根据预设数量个目标多媒体文件的内容特征及其内容所属的内容类别中至少一项,确定目标用户上传多媒体文件的稳定性数值,进而确定目标用户上传多媒体文件的稳定性,从而基于所确定的上传多媒体文件的稳定性,有针对性地进行用户推荐及广告推广。

Description

用户行为属性的确定方法、装置、服务器及存储介质
技术领域
本公开涉及互联网技术领域,特别涉及一种用户行为属性的确定方法、装置、服务器及存储介质。
背景技术
近年来,随着短视频应用的发展,很多用户在闲暇之余会向短视频应用的UGC(User Generated Content,用户原创内容)平台上传原创的多媒体文件,以进行娱乐消遣。为了更好地服务用户,UGC平台可确定用户行为属性,并根据用户行为属性,从上传多媒体文件的用户中,选取上传多媒体文件比较稳定的优质用户,进而将优质用户推荐给其他用户,从而使得其他用户可及时观看到优质用户所上传的多媒体文件,同时也可选择性地向这些优质用户推荐信息,以满足优质用户的信息获取需求。由于用户行为属性作为用户推荐及广告推广重要前提,因此,如何确定用户行为属性,成为本领域技术人员亟需解决的问题。
发明内容
本公开实施例提供了一种用户行为属性的确定方法、装置、服务器及存储介质,从而有针对性地进行用户推荐及广告推广。所述技术方案如下:
本公开实施例的第一方面,提供了一种用户行为属性的确定方法,所述方法包括:
从目标用户所上传的多媒体文件中,获取预设数量个目标多媒体文件;
提取每个目标多媒体文件的内容特征;
确定每个目标多媒体文件的内容所属的内容类别;
根据预设数量个目标多媒体文件的内容特征及其内容所属的内容类别中至少一项,确定所述目标用户上传多媒体文件的稳定性数值;
根据所述目标用户上传多媒体文件的稳定性数值,确定所述目标用户上传多媒体文件的稳定性,所述稳定性用于表征所述目标用户上传的多媒体文件在内容上维持不变的程度。
在本公开的另一个实施例中,所述提取每个目标多媒体文件的内容特征,包括:
将每个目标多媒体文件输入到特征提取模型中,输出每个目标多媒体文件的内容特征,所述特征提取模型用于提取多媒体文件的内容特征。
在本公开的另一个实施例中,所述确定每个目标多媒体文件的内容所属的内容类别,包括:
将每个目标多媒体文件输入到内容分类模型中,输出每个目标多媒体文件的内容所属的内容类别,所述内容分类模型用于基于多媒体文件,确定多媒体文件的内容所属的内容类别。
在本公开的另一个实施例中,所述根据预设数量个目标多媒体文件的内容特征及其内容所属的内容类别中至少一项,确定所述目标用户上传多媒体文件的稳定性数值,包括:
计算任意两个目标多媒体文件的内容特征之间的余弦距离;
根据任意两个目标多媒体文件的内容特征之间的余弦距离,确定预设数量个目标多媒体文件的内容特征的平均余弦距离;
将所述预设数量个目标多媒体文件的内容特征的平均余弦距离,确定为所述目标用户上传多媒体文件的稳定性数值。
在本公开的另一个实施例中,所述根据预设数量个目标多媒体文件的内容特征及其内容所属的内容类别中至少一项,确定所述目标用户上传多媒体文件的稳定性数值,包括:
根据预设数量个目标多媒体文件的内容所属的内容类别,确定所述预设数量个目标多媒体文件的信息熵,所述信息熵用于表征所述预设数量个目标多媒体文件的内容属于不同内容类别的不确定性程度;
对所述预设数量个目标多媒体文件的信息熵进行归一化,得到所述预设数量个目标多媒体文件的熵的稳定性数值;
将所述预设数量个目标多媒体文件的熵的稳定性数值,确定为所述目标用户上传多媒体文件的稳定性数值。
在本公开的另一个实施例中,所述根据预设数量个目标多媒体文件的内容特征及其内容所属的内容类别中至少一项,确定所述目标用户上传多媒体文件的稳定性数值,包括:
计算任意两个目标多媒体文件的内容特征之间的余弦距离;
根据任意两个目标多媒体文件的内容特征之间的余弦距离,确定预设数量个目标多媒体文件的内容特征的平均余弦距离;
根据所述预设数量个目标多媒体文件的内容所属的内容类别,确定所述预设数量个目标多媒体文件的信息熵,所述信息熵用于表征所述预设数量个目标多媒体文件的内容属于不同内容类别的不确定性程度;
对所述预设数量个目标多媒体文件的信息熵进行归一化,得到所述预设数量个目标多媒体文件的熵的稳定性数值;
将所述预设数量个目标多媒体文件的内容特征的平均余弦距离和熵的稳定性数值相乘,得到所述目标用户上传多媒体文件的稳定性数值。
在本公开的另一个实施例中,所述根据预设数量个目标多媒体文件的内容所属的内容类别,确定所述预设数量个目标多媒体文件的信息熵,包括:
根据所述预设数量个目标多媒体文件的内容所属的内容类别,确定每种内容类别的类别概率;
根据每种内容类别及其类别概率,确定所述预设数量个目标多媒体文件的信息熵。
在本公开的另一个实施例中,所述根据所述目标用户上传多媒体文件的稳定性数值,确定所述目标用户上传多媒体文件的稳定性,包括:
根据所述目标用户上传多媒体文件的稳定性数值,对所述目标用户的稳定性进行排序,如果所述目标用户位于前预设位数,则确定所述目标用户上传多媒体文件的稳定。
在本公开的另一个实施例中,所述根据所述目标用户上传多媒体文件的稳定性数值,确定所述目标用户上传多媒体文件的稳定性,包括:
将所述目标用户上传多媒体文件的稳定性数值与指定阈值进行比较,如果所述目标用户上传多媒体文件的稳定性数值大于所述指定阈值,则确定所述目标用户上传多媒体文件的稳定。
本公开实施例的第二方面,提供了一种用户行为属性的确定装置,所述装置包括:
获取模块,用于从目标用户所上传的多媒体文件中,获取预设数量个目标多媒体文件;
提取模块,用于提取每个目标多媒体文件的内容特征;
确定模块,用于确定每个目标多媒体文件的内容所属的内容类别;
所述确定模块,用于根据预设数量个目标多媒体文件的内容特征及其内容所属的内容类别中至少一项,确定所述目标用户上传多媒体文件的稳定性数值;
所述确定模块,用于根据所述目标用户上传多媒体文件的稳定性数值,确定所述目标用户上传多媒体文件的稳定性,所述稳定性用于表征所述目标用户上传的多媒体文件在内容上维持不变的程度。
在本公开的另一个实施例中,所述提取模块,用于将每个目标多媒体文件输入到特征提取模型中,输出每个目标多媒体文件的内容特征,所述特征提取模型用于提取多媒体文件的内容特征。
在本公开的另一个实施例中,所述确定模块,用于将每个目标多媒体文件输入到内容分类模型中,输出每个目标多媒体文件的内容所属的内容类别,所述内容分类模型用于基于多媒体文件,确定多媒体文件的内容所属的内容类别。
在本公开的另一个实施例中,所述确定模块,用于计算任意两个目标多媒体文件的内容特征之间的余弦距离;根据任意两个目标多媒体文件的内容特征之间的余弦距离,确定预设数量个目标多媒体文件的内容特征的平均余弦距离;将所述预设数量个目标多媒体文件的内容特征的平均余弦距离,确定为所述目标用户上传多媒体文件的稳定性数值。
在本公开的另一个实施例中,所述确定模块,用于根据预设数量个目标多媒体文件的内容所属的内容类别,确定所述预设数量个目标多媒体文件的信息熵,所述信息熵用于表征所述预设数量个目标多媒体文件的内容属于不同内容类别的不确定性程度;对所述预设数量个目标多媒体文件的信息熵进行归一化,得到所述预设数量个目标多媒体文件的熵的稳定性数值;将所述预设数量个目标多媒体文件的熵的稳定性数值,确定为所述目标用户上传多媒体文件的稳定性数值。
在本公开的另一个实施例中,所述确定模块,用于计算任意两个目标多媒体文件的内容特征之间的余弦距离;根据任意两个目标多媒体文件的内容特征之间的余弦距离,确定预设数量个目标多媒体文件的内容特征的平均余弦距离;根据所述预设数量个目标多媒体文件的内容所属的内容类别,确定所述预设数量个目标多媒体文件的信息熵,所述信息熵用于表征所述预设数量个目标多媒体文件的内容属于不同内容类别的不确定性程度;对所述预设数量个目标多媒体文件的信息熵进行归一化,得到所述预设数量个目标多媒体文件的熵的稳定性数值;将所述预设数量个目标多媒体文件的内容特征的平均余弦距离和熵的稳定性数值相乘,得到所述目标用户上传多媒体文件的稳定性数值。
在本公开的另一个实施例中,所述确定模块,用于根据所述预设数量个目标多媒体文件的内容所属的内容类别,确定每种内容类别的类别概率;根据每种内容类别及其类别概率,确定所述预设数量个目标多媒体文件的信息熵。
在本公开的另一个实施例中,所述确定模块,用于根据所述目标用户上传多媒体文件的稳定性数值,对所述目标用户的稳定性进行排序,如果所述目标用户位于前预设位数,则确定所述目标用户上传多媒体文件的稳定。
在本公开的另一个实施例中,所述确定模块,用于将所述目标用户上传多媒体文件的稳定性数值与指定阈值进行比较,如果所述目标用户上传多媒体文件的稳定性数值大于所述指定阈值,则确定所述目标用户上传多媒体文件的稳定。
本公开实施例的第三方面,提供了一种服务器,所述服务器包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现用户行为属性的确定方法。
本公开实施例的第四方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现用户行为属性的确定方法。
本公开实施例提供的技术方案至少带来以下有益效果:
通过提取每个目标多媒体文件的内容特征,并确定每个目标多媒体文件的内容所属的内容类别,进而根据预设数量个目标多媒体文件的内容特征及其内容所属的内容类别中至少一项,确定目标用户上传多媒体文件的稳定性数值,进而确定目标用户上传多媒体文件的稳定性,从而基于所确定的上传多媒体文件的稳定性,有针对性地进行用户推荐及广告推广。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种用户行为属性的确定方法所涉及的实施环境。
图2是根据一示例性实施例示出的一种用户行为属性的确定方法流程图。
图3是根据一示例性实施例示出的一种用户行为属性的确定装置的框图。
图4是根据一示例性实施例示出的一种用于用户行为属性的确定的服务器。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
本公开所涉及的用户信息可以为经用户授权或者经过各方充分授权的信息。
请参考图1,其示出了本公开实施例提供的用户行为属性的确定方法所涉及的实施环境,该实施环境包括:终端101和服务器102。
其中,终端101可以为智能手机、平板电脑、笔记本电脑等,本公开实施例不对终端101的产品类型作具体的限定。终端101中安装短视频应用,基于所安装的短视频应用可向服务器102上传所录制的多媒体文件。
服务器102为短视频应用的后台服务器,该服务器102具有存储能力,能够存储各个用户上传的多媒体文件;该服务器102还具有计算能力,能够确定用户上传多媒体文件的稳定性。
上述终端101与服务器102之间可通过有线网络或无线网络进行通信。
图2是根据一示例性实施例示出的一种用户行为属性的确定方法的流程图,如图2所示,确定用户行为属性的方法用于服务器中,包括以下步骤。
在步骤S201中,服务器从目标用户所上传的多媒体文件中,获取预设数量个目标多媒体文件。
其中,预设数量根据对用户上传多媒体文件稳定性的确定精度进行设置,可以为100个、200个等,本公开实施例不对预设数量作具体的限定。多媒体文件包括视频文件、音频文件、图片、文本等等。
服务器获取预设数量个目标多媒体文件时,可从目标用户所上传的多媒体文件中选取上传时间与当前时间最近的预设数量个多媒体文件,并将所选取的预设数量个多媒体文件,作为所获取的预设数量个目标多媒体文件;服务器还可按照预设规则,从目标用户所上传的多媒体文件中,选取预设数量个多媒体文件,并将所选取的预设数量个多媒体文件,作为所获取的预设数量个目标多媒体文件,该预设规则可以为每间隔预设时间选取一个多媒体文件,如该预设时间可以为1天、2天等,预设规则也可以为文件大小为预设大小,如20M、30M等。
在步骤S202中,服务器提取每个目标多媒体文件的内容特征。
其中,内容特征为与多媒体文件的内容的相关特征,该内容特征能够区分具有不同内容的多媒体文件。服务器提取每个目标多媒体文件的内容特征时,可将每个目标多媒体文件输入到特征提取模型中,输出每个目标多媒体文件的内容特征,该特征提取模型可根据训练样本多媒体文件及其内容特征训练得到,该特征提取模型用于提取多媒体文件的内容特征;服务器还可基于特征提取算法,提取每个目标多媒体文件的内容特征。
在步骤S203中,服务器确定每个目标多媒体文件的内容所属的内容类别。
服务器确定每个目标多媒体文件的内容所属的内容类别时,可将每个目标多媒体文件输入到内容分类模型中,输出每个目标多媒体文件的内容所属的内容类别,该内容分类模型可根据训练样本多媒体文件及其内容所属的类别训练得到,该内容分类模型用于基于多媒体文件,确定多媒体文件的内容所属的内容类别。
需要说明的是,上述以采用不同的模型分别提取目标多媒体文件的内容特征及确定目标多媒体文件的内容所属的内容类别为例,实际上,提取目标多媒体文件的内容特征及确定目标多媒体文件的内容所属的内容类别还可基于同一模型执行。
在步骤S204中,服务器根据预设数量个目标多媒体文件的内容特征及其内容所属的内容类别中至少一项,确定目标用户上传多媒体文件的稳定性数值。
服务器根据预设数量个目标多媒体文件的内容特征及其内容所属的内容类别中至少一项,确定目标用户上传多媒体文件的稳定性数值时,包括以下几种情况:
第一种情况、服务器根据预设数量个目标多媒体文件的内容特征,确定目标用户上传多媒体文件的稳定性数值。
S20411、服务器计算任意两个目标多媒体文件的内容特征之间的余弦距离。
对于任意两个目标多媒体文件i和j的内容特征分别为featurei和featurej,则两个目标多媒体文件的内容特征之间的余弦距离为cosine(featurei,featurej)。设定featurei为(a1,a2,...,an),featurej为(b1,b2,...,bn),则
Figure BDA0002217881870000081
S20412、服务器根据任意两个目标多媒体文件的内容特征之间的余弦距离,确定预设数量个目标多媒体文件的内容特征的平均余弦距离。
服务器获取任意两个目标多媒体文件的内容特征之间的余弦距离,并通过预设数量个目标多媒体文件中两个目标多媒体文件的内容特征之间的余弦距离的平均值,得到预设数量个目标多媒体文件的内容特征的平均余弦距离。
设定预设数量为K,任意两个目标多媒体文件i和j的内容特征分别为featurei和featurej,则K个目标多媒体文件的内容特征的平均余弦距离
Figure BDA0002217881870000082
S20413、服务器将预设数量个目标多媒体文件的内容特征的平均余弦距离,确定为目标用户上传多媒体文件的稳定性数值。
基于所得到的预设数量个目标多媒体文件的内容特征的平均余弦距离,服务器可将该预设数量个目标多媒体文件的内容特征的平均余弦距离作为目标用户上传多媒体文件的稳定性数值。其中,稳定性数值用于衡量用户上传多媒体文件的稳定性,该稳定性数值的取值范围为0~1。
由于平均余弦距离能够度量预设数量个目标多媒体文件在内容上的相似程度,平均余弦距离越小,表征预设数量个目标多媒体文件在内容上的差异性越大,平均余弦距离越大,表征预设数量个目标多媒体文件在内容上的差异性越小,因而将预设数量个目标多媒体文件的内容特征的平均余弦距离作为目标用户上传多媒体文件的稳定性数值,可以衡量出目标用户上传的多媒体文件在内容上维持不变的程度,进而根据衡量结果准确地选取上传内容稳定的优质用户,并将该优质用户推荐给关注该优质用户所上传的内容或对该优质用户所上传内容感兴趣的其他用户。当然,还可根据该优质用户所上传的内容,向该优质用户推送相关的广告,使得广告的投放更具针对性。
第二种情况、服务器根据预设数量个目标多媒体文件的内容所属的内容类别,确定目标用户上传多媒体文件的稳定性数值。
S20421、服务器根据预设数量个目标多媒体文件的内容所属的内容类别,确定预设数量个目标多媒体文件的信息熵。
其中,信息熵作为信息含量的量化指标,用于进一步优化参数,在本公开实施例中用于优化目标多媒体文件的内容类别,能够表征预设数量个目标多媒体文件的内容属于不同内容类别的不确定性程度。
服务器根据预设数量个目标多媒体文件的内容所属的内容类别,确定预设数量个目标多媒体文件的信息熵时,可采用如下方法:
S204211、服务器根据预设数量个目标多媒体文件的内容所属的内容类别,确定每种内容类别的类别概率。
服务器根据预设数量个目标多媒体文件的内容所属的内容类别,确定每种内容类别的数量,进而通过计算每种内容类别的数量与预设数量的比值,得到每种内容类别的类别概率。
S204212、服务器根据每种内容类别及其类别概率,确定预设数量个目标多媒体文件的信息熵。
服务器根据每种内容类别及其类别概率,可采用如下公式,确定预设数量个目标多媒体文件的信息熵H(x):
Figure BDA0002217881870000101
其中,t为任一每种内容类别,n为内容类别的数量,pt为内容类别的类别概率。
例如,内容分类模型所能输出的内容类别为“猫”、“狗”、“猴”、“哈士奇”,将10个目标多媒体文件输入到内容分类模型中,输出的10个目标多媒体文件的内容所属内容类别为[“猫”、“狗”、“猴”、“哈士奇”、“猫”、“狗”、“猴”、“哈士奇”、“猫”、“狗”]。对于“猫”、“狗”、“猴”、“哈士奇”的类别概率分别为
Figure BDA0002217881870000102
则10个目标多媒体文件的信息熵
Figure BDA0002217881870000103
S20422、服务器对预设数量个目标多媒体文件的信息熵进行归一化,得到预设数量个目标多媒体文件的熵的稳定性数值。
设定预设数量为K,根据K个目标多媒体文件的信息熵,服务器应用以下公式,对K个目标多媒体文件的信息熵进行归一化,得到K个目标多媒体文件的熵的稳定性数值stableentropy
Figure BDA0002217881870000104
其中,Hk(x)为K个目标多媒体文件的信息熵,Hk max为K个目标多媒体文件的信息熵的最大值。
Figure BDA0002217881870000105
当目标多媒体文件的数量确定时,该Hk max为定值。
S20423、服务器将预设数量个目标多媒体文件的熵的稳定性数值,确定为目标用户上传多媒体文件的稳定性数值。
基于得到的预设数量个目标多媒体文件的熵的稳定性数值,服务器可将预设数量个目标多媒体文件的熵的稳定性数值,作为目标用户上传多媒体文件的稳定性数值。
由于信息熵能够表征预设数量个目标多媒体文件的内容属于不同内容类别的不确定性程度,对预设数量个目标多媒体文件的信息熵进行归一化得到的熵的稳定性数值越小,表征预设数量个目标多媒体文件在内容上的差异性越大,熵的稳定性数值越大,表征预设数量个目标多媒体文件在内容上的差异性越小,因而将预设数量个目标多媒体文件的熵的稳定性数值作为目标用户上传多媒体文件的稳定性数值,可以衡量出目标用户上传的多媒体文件在内容上维持不变的程度,进而根据衡量结果准确地选取上传内容稳定的优质用户,并将该优质用户推荐给关注该优质用户所上传的内容或对该优质用户所上传内容感兴趣的其他用户。当然,还可根据该优质用户所上传的内容,向该优质用户推送相关的广告,使得广告的投放更具针对性。
第三种情况、服务器根据预设数量个目标多媒体文件的内容特征及其内容所属的内容类别,确定目标用户上传多媒体文件的稳定性数值。
S20431、服务器计算任意两个目标多媒体文件的内容特征之间的余弦距离。
S20432、服务器根据任意两个目标多媒体文件的内容特征之间的余弦距离,确定预设数量个目标多媒体文件的内容特征的平均余弦距离。
S20433、服务器根据预设数量个目标多媒体文件的内容所属的内容类别,确定预设数量个目标多媒体文件的信息熵。
S20434、服务器对预设数量个目标多媒体文件的信息熵进行归一化,得到预设数量个目标多媒体文件的熵的稳定性数值。
S20435、服务器将预设数量个目标多媒体文件的内容特征的平均余弦距离和熵的稳定性数值相乘,得到目标用户上传多媒体文件的稳定性数值。
设定预设数量个目标多媒体文件的内容特征的平均余弦距离为stablefeature,预设数量个目标多媒体文件的熵的稳定性数值为stableentropy,则stableuser=stablefeature*stableentropy
同时采用平均余弦距离及熵的稳定性数值可以更准确地确定出目标用户上传多媒体文件的稳定性数值,进而能够更精确地选取上传内容稳定的优质用户,并将该优质用户推荐给关注该优质用户所上传的内容或对该优质用户所上传内容感兴趣的其他用户。当然,还可根据该优质用户所上传的内容,向该优质用户推送相关的广告,使得广告的投放更具针对性。
S205、服务器根据目标用户上传多媒体文件的稳定性数值,确定目标用户上传多媒体文件的稳定性。
其中,稳定性用于表征目标用户上传的多媒体文件在内容上维持不变的程度,当目标用户上传多媒体文件的稳定,则可以确定该目标用户经常上传关于同一内容的多媒体文件;当目标用户上传多媒体文件的不稳定,则可以确定该目标用户经常上传不同内容的多媒体文件。
服务器根据目标用户上传多媒体文件的稳定性数值,确定目标用户上传多媒体文件的稳定性时,包括但不限于如下几种方式:
第一种方式、服务器根据目标用户上传多媒体文件的稳定性数值,对目标用户的稳定性进行排序,得到目标用户在向服务器上传多媒体文件的全部用户中的排序结果。如果目标用户位于前预设位数,则确定目标用户上传多媒体文件在内容上是稳定的。其中,预设位数可以为100位、200位等。
本公开根据目标用户上传多媒体文件的稳定性数值,对目标用户的稳定性进行排序,得到目标用户在全部用户中的排序结果,该排序结果能够反映出目标用户在全部用户中所上传的多媒体文件在内容上的稳定性程度,进而基于该排序结果可以准确地选取出上传内容相对稳定的优质用户,从而有针对性地进行用户推荐及广告推广。
第二种方式、服务器将目标用户上传多媒体文件的稳定性数值与指定阈值进行比较,如果目标用户上传多媒体文件的稳定性数值大于指定阈值,则确定目标用户上传多媒体文件在内容上是稳定的。其中,指定阈值用于界定用户上传的多媒体文件在内容上是否稳定,当用户上传多媒体文件的稳定性数值大于指定阈值,可以确定该用户上传的多媒体文件在内容上是稳定的;当用户上传多媒体文件的稳定性数值小于指定阈值,可以确定该用户上传的多媒体文件在内容上是不稳定的。该指定阈值可以为0.8、0.9等。
本公开通过设置指定阈值,并将指定阈值与目标用户上传多媒体文件的稳定性数值进行比较,从而可以准确地选取出上传内容相对稳定的优质用户,从而有针对性地进行用户推荐及广告推广。
本公开实施例提供的方法,通过提取每个目标多媒体文件的内容特征,并确定每个目标多媒体文件的内容所属的内容类别,进而根据预设数量个目标多媒体文件的内容特征及其内容所属的内容类别中至少一项,确定目标用户上传多媒体文件的稳定性数值,进而确定目标用户上传多媒体文件的稳定性,从而基于所确定的上传多媒体文件的稳定性,有针对性地进行用户推荐及广告推广。
参见图3,本公开实施例提供了一种用户行为属性的确定装置,该装置包括:获取模块301、提取模块302及确定模块303。
该获取模块301被配置为从目标用户所上传的多媒体文件中,获取预设数量个目标多媒体文件;
该提取模块302被配置为提取每个目标多媒体文件的内容特征;
该确定模块303被配置为确定每个目标多媒体文件的内容所属的内容类别;
该确定模块303被配置为根据预设数量个目标多媒体文件的内容特征及其内容所属的内容类别中至少一项,确定目标用户上传多媒体文件的稳定性数值;
该确定模块303被配置为根据目标用户上传多媒体文件的稳定性数值,确定目标用户上传多媒体文件的稳定性,稳定性用于表征目标用户上传的多媒体文件在内容上维持不变的程度。
在本公开的另一个实施例中,该提取模块302被配置为将每个目标多媒体文件输入到特征提取模型中,输出每个目标多媒体文件的内容特征,特征提取模型用于提取多媒体文件的内容特征。
在本公开的另一个实施例中,该确定模块303被配置为将每个目标多媒体文件输入到内容分类模型中,输出每个目标多媒体文件的内容所属的内容类别,内容分类模型用于基于多媒体文件,确定多媒体文件的内容所属的内容类别。
在本公开的另一个实施例中,该确定模块303被配置为计算任意两个目标多媒体文件的内容特征之间的余弦距离;根据任意两个目标多媒体文件的内容特征之间的余弦距离,确定预设数量个目标多媒体文件的内容特征的平均余弦距离;将预设数量个目标多媒体文件的内容特征的平均余弦距离,确定为目标用户上传多媒体文件的稳定性数值。
在本公开的另一个实施例中,该确定模块303被配置为根据预设数量个目标多媒体文件的内容所属的内容类别,确定预设数量个目标多媒体文件的信息熵,该信息熵用于表征预设数量个目标多媒体文件的内容属于不同内容类别的不确定性程度;对预设数量个目标多媒体文件的信息熵进行归一化,得到预设数量个目标多媒体文件的熵的稳定性数值;将预设数量个目标多媒体文件的熵的稳定性数值,确定为目标用户上传多媒体文件的稳定性数值。
在本公开的另一个实施例中,该确定模块303被配置为计算任意两个目标多媒体文件的内容特征之间的余弦距离;根据任意两个目标多媒体文件的内容特征之间的余弦距离,确定预设数量个目标多媒体文件的内容特征的平均余弦距离;根据预设数量个目标多媒体文件的内容所属的内容类别,确定预设数量个目标多媒体文件的信息熵,该信息熵用于表征预设数量个目标多媒体文件的内容属于不同内容类别的不确定性程度;对预设数量个目标多媒体文件的信息熵进行归一化,得到预设数量个目标多媒体文件的熵的稳定性数值;将预设数量个目标多媒体文件的内容特征的平均余弦距离和熵的稳定性数值相乘,得到目标用户上传多媒体文件的稳定性数值。
在本公开的另一个实施例中,该确定模块303被配置为根据预设数量个目标多媒体文件的内容所属的内容类别,确定每种内容类别的类别概率;根据每种内容类别及其类别概率,确定预设数量个目标多媒体文件的信息熵。
在本公开的另一个实施例中,该确定模块303被配置为根据目标用户上传多媒体文件的稳定性数值,对目标用户的稳定性进行排序,如果目标用户位于前预设位数,则确定目标用户上传多媒体文件的稳定。
在本公开的另一个实施例中,该确定模块303被配置为将目标用户上传多媒体文件的稳定性数值与指定阈值进行比较,如果目标用户上传多媒体文件的稳定性数值大于指定阈值,则确定目标用户上传多媒体文件的稳定。
综上,本公开实施例提供的装置,通过提取每个目标多媒体文件的内容特征,并确定每个目标多媒体文件的内容所属的内容类别,进而根据预设数量个目标多媒体文件的内容特征及其内容所属的内容类别中至少一项,确定目标用户上传多媒体文件的稳定性数值,进而确定目标用户上传多媒体文件的稳定性,从而基于所确定的上传多媒体文件的稳定性,有针对性地进行用户推荐及广告推广。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图4是根据一示例性实施例示出的一种用于用户行为属性确定的服务器。参照图4,服务器400包括处理组件422,其进一步包括一个或多个处理器,以及由存储器432所代表的存储器资源,用于存储可由处理组件422的执行的指令,例如应用程序。存储器432中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件422被配置为执行指令,以执行上述用户行为属性的确定方法中服务器所执行的功能。
服务器400还可以包括一个电源组件426被配置为执行服务器400的电源管理,一个有线或无线网络接口450被配置为将服务器400连接到网络,和一个输入输出(I/O)接口458。服务器400可以操作基于存储在存储器432的操作系统,例如Windows ServerTM,Mac OSXTM,UnixTM,LinuxTM,FreeBSDTM或类似。
本公开实施例提供的服务器,通过提取每个目标多媒体文件的内容特征,并确定每个目标多媒体文件的内容所属的内容类别,进而根据预设数量个目标多媒体文件的内容特征及其内容所属的内容类别中至少一项,确定目标用户上传多媒体文件的稳定性数值,进而确定目标用户上传多媒体文件的稳定性,从而基于所确定的上传多媒体文件的稳定性,有针对性地进行用户推荐及广告推广。
本公开实施例提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如图2所示的用户行为属性的确定方法。
本公开实施例提供的计算机可读存储介质,通过提取每个目标多媒体文件的内容特征,并确定每个目标多媒体文件的内容所属的内容类别,进而根据预设数量个目标多媒体文件的内容特征及其内容所属的内容类别中至少一项,确定目标用户上传多媒体文件的稳定性数值,进而确定目标用户上传多媒体文件的稳定性,从而基于所确定的上传多媒体文件的稳定性,有针对性地进行用户推荐及广告推广。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (10)

1.一种用户行为属性的确定方法,其特征在于,所述方法包括:
从目标用户所上传的多媒体文件中,获取预设数量个目标多媒体文件;
提取每个目标多媒体文件的内容特征;
确定每个目标多媒体文件的内容所属的内容类别;
计算任意两个目标多媒体文件的内容特征之间的余弦距离;
根据任意两个目标多媒体文件的内容特征之间的余弦距离,确定所述预设数量个目标多媒体文件的内容特征的平均余弦距离;
根据所述预设数量个目标多媒体文件的内容所属的内容类别,确定所述预设数量个目标多媒体文件的信息熵,所述信息熵用于表征所述预设数量个目标多媒体文件的内容属于不同内容类别的不确定性程度;
对所述预设数量个目标多媒体文件的信息熵进行归一化,得到所述预设数量个目标多媒体文件的熵的稳定性数值;
将所述预设数量个目标多媒体文件的内容特征的平均余弦距离和熵的稳定性数值相乘,得到所述目标用户上传多媒体文件的稳定性数值;
根据所述目标用户上传多媒体文件的稳定性数值,确定所述目标用户上传多媒体文件的稳定性,所述稳定性用于表征所述目标用户上传的多媒体文件在内容上维持不变的程度。
2.根据权利要求1所述的方法,其特征在于,所述根据预设数量个目标多媒体文件的内容所属的内容类别,确定所述预设数量个目标多媒体文件的信息熵,包括:
根据所述预设数量个目标多媒体文件的内容所属的内容类别,确定每种内容类别的类别概率;
根据每种内容类别及其类别概率,确定所述预设数量个目标多媒体文件的信息熵。
3.根据权利要求1或2所述的方法,其特征在于,所述根据所述目标用户上传多媒体文件的稳定性数值,确定所述目标用户上传多媒体文件的稳定性,包括:根据所述目标用户上传多媒体文件的稳定性数值,对所述目标用户的稳定性进行排序,如果所述目标用户位于前预设位数,则确定所述目标用户上传多媒体文件的稳定。
4.根据权利要求1或2所述的方法,其特征在于,所述根据所述目标用户上传多媒体文件的稳定性数值,确定所述目标用户上传多媒体文件的稳定性,包括:
将所述目标用户上传多媒体文件的稳定性数值与指定阈值进行比较,如果所述目标用户上传多媒体文件的稳定性数值大于所述指定阈值,则确定所述目标用户上传多媒体文件的稳定。
5.一种用户行为属性的确定装置,其特征在于,所述装置包括:
获取模块,用于从目标用户所上传的多媒体文件中,获取预设数量个目标多媒体文件;
提取模块,用于提取每个目标多媒体文件的内容特征;
确定模块,用于确定每个目标多媒体文件的内容所属的内容类别;
所述确定模块,用于计算任意两个目标多媒体文件的内容特征之间的余弦距离;根据任意两个目标多媒体文件的内容特征之间的余弦距离,确定预设数量个目标多媒体文件的内容特征的平均余弦距离;根据所述预设数量个目标多媒体文件的内容所属的内容类别,确定所述预设数量个目标多媒体文件的信息熵,所述信息熵用于表征所述预设数量个目标多媒体文件的内容属于不同内容类别的不确定性程度;对所述预设数量个目标多媒体文件的信息熵进行归一化,得到所述预设数量个目标多媒体文件的熵的稳定性数值;将所述预设数量个目标多媒体文件的内容特征的平均余弦距离和熵的稳定性数值相乘,得到所述目标用户上传多媒体文件的稳定性数值;
所述确定模块,用于根据所述目标用户上传多媒体文件的稳定性数值,确定所述目标用户上传多媒体文件的稳定性,所述稳定性用于表征所述目标用户上传的多媒体文件在内容上维持不变的程度。
6.根据权利要求5所述的装置,其特征在于,所述确定模块,用于根据所述预设数量个目标多媒体文件的内容所属的内容类别,确定每种内容类别的类别概率;根据每种内容类别及其类别概率,确定所述预设数量个目标多媒体文件的信息熵。
7.根据权利要求 5或6所述的装置,其特征在于,所述确定模块,用于根据所述目标用户上传多媒体文件的稳定性数值,对所述目标用户的稳定性进行排序,如果所述目标用户位于前预设位数,则确定所述目标用户上传多媒体文件的稳定。
8.根据权利要求5或6所述的装置,其特征在于,所述确定模块,用于将所述目标用户上传多媒体文件的稳定性数值与指定阈值进行比较,如果所述目标用户上传多媒体文件的稳定性数值大于所述指定阈值,则确定所述目标用户上传多媒体文件的稳定。
9.一种服务器,其特征在于,所述服务器包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如权利要求1至4中任一项所述的用户行为属性的确定方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如权利要求1至4中任一项所述的用户行为属性的确定方法。
CN201910922087.0A 2019-09-27 2019-09-27 用户行为属性的确定方法、装置、服务器及存储介质 Active CN110704648B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910922087.0A CN110704648B (zh) 2019-09-27 2019-09-27 用户行为属性的确定方法、装置、服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910922087.0A CN110704648B (zh) 2019-09-27 2019-09-27 用户行为属性的确定方法、装置、服务器及存储介质

Publications (2)

Publication Number Publication Date
CN110704648A CN110704648A (zh) 2020-01-17
CN110704648B true CN110704648B (zh) 2022-07-01

Family

ID=69197763

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910922087.0A Active CN110704648B (zh) 2019-09-27 2019-09-27 用户行为属性的确定方法、装置、服务器及存储介质

Country Status (1)

Country Link
CN (1) CN110704648B (zh)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5341605B2 (ja) * 2009-04-30 2013-11-13 株式会社エヌ・ティ・ティ・ドコモ レコメンド情報生成装置およびレコメンド情報生成方法
CN106599191B (zh) * 2016-12-14 2021-02-19 阿里巴巴(中国)有限公司 用户属性分析方法及装置
CN107070943B (zh) * 2017-05-05 2020-02-07 兰州理工大学 基于流量特征图和感知哈希的工业互联网入侵检测方法
CN108170845B (zh) * 2018-01-17 2020-10-13 腾讯音乐娱乐科技(深圳)有限公司 多媒体数据处理方法、装置及存储介质
CN109191167A (zh) * 2018-07-17 2019-01-11 阿里巴巴集团控股有限公司 一种目标用户的挖掘方法和装置

Also Published As

Publication number Publication date
CN110704648A (zh) 2020-01-17

Similar Documents

Publication Publication Date Title
CN108921221B (zh) 用户特征的生成方法、装置、设备及存储介质
CN107563500B (zh) 一种基于用户头像的视频推荐方法及系统
US9348898B2 (en) Recommendation system with dual collaborative filter usage matrix
WO2017181612A1 (zh) 个性化视频推荐方法及装置
CN108287857B (zh) 表情图片推荐方法及装置
CN109783671B (zh) 一种以图搜图的方法、计算机可读介质及服务器
CN110717099B (zh) 一种推荐影片的方法及终端
CN110223186B (zh) 用户相似度确定方法以及信息推荐方法
WO2018090545A1 (zh) 融合时间因素的协同过滤方法、装置、服务器和存储介质
CN105894028B (zh) 用户识别方法和装置
CN108491540B (zh) 文本信息推送方法、装置及智能终端
CN111708942B (zh) 多媒体资源推送方法、装置、服务器及存储介质
WO2019061664A1 (zh) 电子装置、基于用户上网数据的产品推荐方法及存储介质
CN113538070B (zh) 用户生命价值周期检测方法、装置和计算机设备
CN110807472B (zh) 图像识别方法、装置、电子设备及存储介质
CN110046251A (zh) 社区内容风险评估方法及装置
US20150278907A1 (en) User Inactivity Aware Recommendation System
CN110995681B (zh) 用户识别方法、装置、电子设备及存储介质
CN113656699B (zh) 用户特征向量确定方法、相关设备及介质
CN110968802A (zh) 一种用户特征的分析方法、分析装置及可读存储介质
CN116521936B (zh) 一种基于用户行为分析的课程推荐方法、装置及存储介质
CN113468421A (zh) 基于向量匹配技术的产品推荐方法、装置、设备及介质
CN115204436A (zh) 检测业务指标异常原因的方法、装置、设备及介质
CN115687790B (zh) 基于大数据的广告推送方法、系统及云平台
CN110704648B (zh) 用户行为属性的确定方法、装置、服务器及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant