CN113076487A - 一种用户兴趣表征及内容推荐方法、装置和设备 - Google Patents

一种用户兴趣表征及内容推荐方法、装置和设备 Download PDF

Info

Publication number
CN113076487A
CN113076487A CN202110482030.0A CN202110482030A CN113076487A CN 113076487 A CN113076487 A CN 113076487A CN 202110482030 A CN202110482030 A CN 202110482030A CN 113076487 A CN113076487 A CN 113076487A
Authority
CN
China
Prior art keywords
user
tag
interest
vector
user interest
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110482030.0A
Other languages
English (en)
Other versions
CN113076487B (zh
Inventor
何咏倩
梁召
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing IQIYI Science and Technology Co Ltd
Original Assignee
Beijing IQIYI Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing IQIYI Science and Technology Co Ltd filed Critical Beijing IQIYI Science and Technology Co Ltd
Priority to CN202110482030.0A priority Critical patent/CN113076487B/zh
Publication of CN113076487A publication Critical patent/CN113076487A/zh
Application granted granted Critical
Publication of CN113076487B publication Critical patent/CN113076487B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种用户兴趣表征及内容推荐方法、装置和设备,可以应用于计算机应用技术领域,可以包括:获取不同用户感兴趣标签对应的标签向量;针对一用户感兴趣标签,标签向量为表征用户感兴趣标签的向量;确定用户对不同用户感兴趣标签的偏好程度;针对每一用户感兴趣标签,将用户对用户感兴趣标签的偏好程度作为权重,将权重与用户感兴趣标签对应的标签向量相乘,得到用户感兴趣标签对应的加权向量;将各个用户感兴趣标签对应的加权向量进行向量池化,得到用户兴趣表征向量,用户兴趣表征向量用于表征用户的用户兴趣。能够实现对用户兴趣进行表征,提高用户兴趣表征的精准度。

Description

一种用户兴趣表征及内容推荐方法、装置和设备
技术领域
本发明涉及计算机应用技术领域,特别是涉及一种用户兴趣表征及内容推荐方法、装置和设备。
背景技术
在推荐领域,一般基于用户兴趣为用户推荐其感兴趣的内容。用户兴趣的表征直接影响推荐效果,如何对用户兴趣进行表征是推荐过程中需要考虑的重要内容。
发明内容
本发明实施例的目的在于提供一种用户兴趣表征及内容推荐方法、装置和设备,以实现对用户兴趣进行表征,提高用户兴趣表征的精准度。具体技术方案如下:
在本发明实施的第一方面,首先提供了一种用户兴趣表征方法,包括:
获取不同用户感兴趣标签对应的标签向量,其中,所述用户感兴趣标签是用户对语料库中内容有操作行为的所述内容对应的标签;针对一用户感兴趣标签,所述标签向量为表征所述用户感兴趣标签的向量;
确定所述用户对不同用户感兴趣标签的偏好程度;
针对每一用户感兴趣标签,将所述用户对所述用户感兴趣标签的所述偏好程度作为权重,将所述权重与所述用户感兴趣标签对应的标签向量相乘,得到所述用户感兴趣标签对应的加权向量;
将各个所述用户感兴趣标签对应的所述加权向量进行向量池化,得到用户兴趣表征向量,所述用户兴趣表征向量用于表征所述用户的用户兴趣。
可选的,所述确定所述用户对不同用户感兴趣标签的偏好程度,包括:
获取预设时间范围内所述用户针对不同用户感兴趣标签的行为信息;针对一用户感兴趣标签,所述行为信息表征所述用户对所述用户感兴趣标签对应的内容的行为;
基于所述行为信息,确定所述用户对不同用户感兴趣标签的偏好分数,并将所述偏好分数作为所述偏好程度。
可选的,所述行为信息包括所述用户对所述用户感兴趣标签对应的内容的行为次数和行为时间;
所述基于所述行为信息,确定所述用户对不同用户感兴趣标签的偏好分数,包括:
针对每一用户感兴趣标签,通过如下公式:score=historyScore×decayRatio,确定所述用户对所述用户感兴趣标签的偏好分数;
其中,score为所述偏好分数,historyScore=k×S,k为所述用户在所述用户感兴趣标签上的行为次数,S为每次行为获得的分数;
Figure BDA0003049628360000021
lambda为负数超参,circle为行为周期,windowN为经历的周期次数,delta为两次行为的时间差。
可选的,在所述将各个所述用户感兴趣标签对应的所述加权向量进行向量池化,得到用户兴趣表征向量之后,所述方法还包括:
基于所述用户兴趣表征向量进行内容推荐。
在本发明实施的第二方面,还提供了一种内容推荐方法,包括:
获取不同用户感兴趣标签对应的标签向量,其中,所述用户感兴趣标签是用户对语料库中内容有操作行为的所述内容对应的标签;针对一用户感兴趣标签,所述标签向量为表征所述用户感兴趣标签的向量;
确定所述用户对不同用户感兴趣标签的偏好程度;
针对每一用户感兴趣标签,将所述用户对所述用户感兴趣标签的所述偏好程度作为权重,将所述权重与所述用户感兴趣标签对应的标签向量相乘,得到所述用户感兴趣标签对应的加权向量;
将各个所述用户感兴趣标签对应的所述加权向量进行向量池化,得到用户兴趣表征向量,所述用户兴趣表征向量用于表征所述用户的用户兴趣;
获取排序特征;
将所述用户兴趣表征向量与所述排序特征输入排序模型,基于所述排序模型的输出为所述用户推荐内容。
在本发明实施的第三方面,还提供了一种用户兴趣表征装置,包括:
获取模块,用于获取不同用户感兴趣标签对应的标签向量,其中,所述用户感兴趣标签是用户对语料库中内容有操作行为的所述内容对应的标签;针对一用户感兴趣标签,所述标签向量为表征所述用户感兴趣标签的向量;
确定模块,用于确定所述用户对不同用户感兴趣标签的偏好程度;
加权模块,用于针对每一用户感兴趣标签,将所述用户对所述用户感兴趣标签的所述偏好程度作为权重,将所述权重与所述用户感兴趣标签对应的标签向量相乘,得到所述用户感兴趣标签对应的加权向量;
池化模块,用于将各个所述用户感兴趣标签对应的所述加权向量进行向量池化,得到用户兴趣表征向量,所述用户兴趣表征向量用于表征所述用户的用户兴趣。
可选的,所述确定模块,具体用于获取预设时间范围内所述用户针对不同用户感兴趣标签的行为信息;针对一用户感兴趣标签,所述行为信息表征所述用户对所述用户感兴趣标签对应的内容的行为;基于所述行为信息,确定所述用户对不同用户感兴趣标签的偏好分数,并将所述偏好分数作为所述偏好程度。
可选的,所述行为信息包括所述用户对所述用户感兴趣标签对应的内容的行为次数和行为时间;
所述确定模块,具体用于针对每一用户感兴趣标签,通过如下公式:score=historyScore×decayRatio,确定所述用户对所述用户感兴趣标签的偏好分数;
其中,score为所述偏好分数,historyScore=k×S,k为所述用户在所述用户感兴趣标签上的行为次数,S为每次行为获得的分数;
Figure BDA0003049628360000031
lambda为负数超参,circle为行为周期,windowN为经历的周期次数,delta为两次行为的时间差。
所述装置还包括:
可选的,所述装置还包括推荐模块,用于在所述将各个所述用户感兴趣标签对应的所述加权向量进行向量池化,得到用户兴趣表征向量之后,基于所述用户兴趣表征向量进行内容推荐。
在本发明实施的第四方面,还提供了一种内容推荐装置,包括:用户兴趣表征装置、获得模块和排序推荐模块;
所述用户兴趣表征装置,包括:
获取模块,用于获取不同用户感兴趣标签对应的标签向量,其中,所述用户感兴趣标签是用户对语料库中内容有操作行为的所述内容对应的标签;针对一用户感兴趣标签,所述标签向量为表征所述用户感兴趣标签的向量;
确定模块,用于确定所述用户对不同用户感兴趣标签的偏好程度;
加权模块,用于针对每一用户感兴趣标签,将所述用户对所述用户感兴趣标签的所述偏好程度作为权重,将所述权重与所述用户感兴趣标签对应的标签向量相乘,得到所述用户感兴趣标签对应的加权向量;
池化模块,用于将各个所述用户感兴趣标签对应的所述加权向量进行向量池化,得到用户兴趣表征向量,所述用户兴趣表征向量用于表征所述用户的用户兴趣;
所述获得模块,用于获得排序特征;
所述排序推荐模块,用于将所述用户兴趣表征向量与所述排序特征输入排序模型,基于所述排序模型的输出为所述用户推荐内容。
在本发明实施的又一方面,还提供了一种用户兴趣表征设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现第一方面所述的方法步骤。
在本发明实施的又一方面,还提供了一种内容推荐设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现第二方面所述的方法步骤。
本发明实施例提供的用户兴趣表征及内容推荐方法、装置和设备,在表征用户兴趣的过程中,考虑用户对不同感兴趣标签偏好程度的不一致性,先确定用户对不同用户感兴趣标签的偏好程度,针对每一用户感兴趣标签,将用户对用户感兴趣标签的偏好程度作为权重,将权重与用户感兴趣标签对应的标签向量相乘,得到用户感兴趣标签对应的加权向量,再将各个用户感兴趣标签对应的加权向量进行向量池化,得到用户兴趣表征向量。如此,依据将用户对用户感兴趣标签的偏好程度作为权重进行加权后的标签向量进行向量池化,能够使得到的用户兴趣表征向量更加贴近用户兴趣,能够提高用户兴趣表征的精准度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例提供的用户兴趣表征方法的流程图;
图2为本发明实施例中确定用户对不同用户感兴趣标签的偏好程度的流程图;
图3为本发明实施例中应用用户兴趣表征方法的流程示意图;
图4为本发明实施例提供的内容推荐方法的流程图;
图5为本发明实施例提供的用户兴趣表征装置的结构示意图;
图6为本发明实施例提供的内容推荐装置的结构示意图;
图7为本发明实施例提供的用户兴趣表征设备的结构示意图;
图8为本发明实施例提供的内容推荐设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
可以通过用户画像描述用户兴趣。对用户画像而言,其具体实现方式为,为语料库中所有内容打上相匹配的标签,当用户点击内容进行查看时,即把内容上的标签记录到用户画像中,用以描述用户兴趣,而每一个标签都具有特定的表征向量,可以理解为标签向量,将用户画像中多个标签对应的多个表征向量进行向量池化,得到表征用户兴趣的特征,并将向量池化得到的该特征与其他特征(可以包括待推荐内容的特征)一起输入排序模型进行学习,以对待推荐给用户的内容进行排序,并依据排序结果为用户推荐内容。其中,向量池化可以包括将多个表征向量进行求和或求平均值等。用户画像中的标签即用户感兴趣标签。
但是,该方式存在一个显著弊端,即用户对各个标签的偏好程度(也可以理解为感兴趣程度)是不一致的,直接让向量池化会损失掉用户的偏好程度信息。
用户可能对多个标签感兴趣,也即对多个标签对应的内容感兴趣。但是,用户对多个感兴趣标签的感兴趣程度是不一致的,也可以理解为用户对多个不同用户感兴趣标签的偏好程度是不一样的。如果在表征用户兴趣的过程中,仅考虑用户是否对该标签感兴趣,直接将用户感兴趣的标签对应的标签向量进行向量池化,则不能准确反映用户兴趣。为了提高用户兴趣表征的精准度,使得用户兴趣的表征更加贴近实际的用户兴趣,本发明实施例中考虑用户对各个用户感兴趣标签的偏好程度的不一致性,确定用户对不同用户感兴趣标签的偏好程度,对不同的用户感兴趣标签增加对应的权重,基于加权后的标签向量进行向量池化,得到表征用户的用户兴趣的用户兴趣表征向量。
下面对本发明实施例提供的用户兴趣表征方法进行详细说明。
本发明实施例提供的用户兴趣表征方法的执行主体可以是电子设备。电子设备可以是服务器、终端等等。
本发明实施例提供了一种用户兴趣表征方法,可以包括:
获取不同用户感兴趣标签对应的标签向量,其中,用户感兴趣标签是用户对语料库中内容有操作行为的内容对应的标签;针对一用户感兴趣标签,标签向量为表征用户感兴趣标签的向量;
确定用户对不同用户感兴趣标签的偏好程度;
针对每一用户感兴趣标签,将用户对用户感兴趣标签的偏好程度作为权重,将权重与用户感兴趣标签对应的标签向量相乘,得到用户感兴趣标签对应的加权向量;
将各个用户感兴趣标签对应的加权向量进行向量池化,得到用户兴趣表征向量,用户兴趣表征向量用于表征用户的用户兴趣。
本发明实施例中,在表征用户兴趣的过程中,考虑用户对不同感兴趣标签偏好程度的不一致性,先确定用户对不同用户感兴趣标签的偏好程度,针对每一用户感兴趣标签,将用户对用户感兴趣标签的偏好程度作为权重,将权重与用户感兴趣标签对应的标签向量相乘,得到用户感兴趣标签对应的加权向量,再将各个用户感兴趣标签对应的加权向量进行向量池化,得到用户兴趣表征向量。如此,依据将用户对用户感兴趣标签的偏好程度作为权重进行加权后的标签向量进行向量池化,能够使得到的用户兴趣表征向量更加贴近用户兴趣,能够提高用户兴趣表征的精准度。
图1为本发明实施例提供的用户兴趣表征方法的流程图。参见图1,本发明实施例提供的用户兴趣表征方法,可以包括:
S101,获取不同用户感兴趣标签对应的标签向量。
其中,用户感兴趣标签是用户对语料库中内容有操作行为的内容对应的标签。
针对一用户感兴趣标签,标签向量为表征用户感兴趣标签的向量。
一种可实现方式中,本发明实施例中可以实时获取每一个用户感兴趣标签,以及感兴趣标签对应的标签向量。
具体地,可以当检测到用户对语料库中的内容有操作行为时,则将内容对应的标签确定为用户感兴趣标签;获取用户感兴趣标签对应的标签向量。其中,操作行为可以包括点击行为等等。
可以预先为语料库中的内容打上相匹配的标签,每一标签具有特定的表征向量,即标签向量。
另一种可实现方式中,本发明实施例可以将获取的多个用户感兴趣标签记录到用户画像中,再统一获取用户画像中记录的各个用户感兴趣标签对应的标签向量。
具体地,当检测到用户点击语料库中的内容进行查看时,则将该内容对应的标签作为用户感兴趣标签,并将该用户感兴趣标签记录到用户画像。统一获取用户画像中各个用户感兴趣标签对应的标签向量。
S102,确定用户对不同用户感兴趣标签的偏好程度。
可以通过用户对用户感兴趣标签所对应的内容的操作行为反映用户对不同感兴趣标签的偏好程度。
具体地,可以在用户对用户感兴趣标签所对应的内容进行操作时,如点击该内容并查看,可以记录操作行为对应的行为信息。如行为时间、行为对象,等等。如此,可以基于该行为信息确定用户对不同用户感兴趣标签的偏好程度。
S103,针对每一用户感兴趣标签,将用户对用户感兴趣标签的偏好程度作为权重,将权重与用户感兴趣标签对应的标签向量相乘,得到用户感兴趣标签对应的加权向量。
S104,将各个用户感兴趣标签对应的加权向量进行向量池化,得到用户兴趣表征向量。
用户兴趣表征向量用于表征用户的用户兴趣。
向量池化可以理解为将多个向量进行融合。融合的结果即为用户兴趣表征向量。
向量池化可以包括将多个加权向量进行求和或求平均值等运算,运算的结果即为用户兴趣表征向量。
本发明实施例中,先确定用户对不同用户感兴趣标签的偏好程度,针对每一用户感兴趣标签,将用户对用户感兴趣标签的偏好程度作为权重,将权重与用户感兴趣标签对应的标签向量相乘,得到用户感兴趣标签对应的加权向量,再将各个用户感兴趣标签对应的加权向量进行向量池化,得到用户兴趣表征向量。如此,依据将用户对用户感兴趣标签的偏好程度作为权重进行加权后的标签向量进行向量池化,能够使得到的用户兴趣表征向量更加贴近用户兴趣,能够提高用户兴趣表征的精准度。本发明实施例中采用一种兴趣加权方式,可以捕捉到用户对不同兴趣的偏好程度,更加贴合用户的真实兴趣。
图2为本发明实施例中确定用户对不同用户感兴趣标签的偏好程度的流程图。参见图2,S102:确定用户对不同用户感兴趣标签的偏好程度,可以包括:
S1021,获取预设时间范围内用户针对不同用户感兴趣标签的行为信息。
针对一用户感兴趣标签,行为信息表征用户对用户感兴趣标签对应的内容的行为。
S1022,基于行为信息,确定用户对不同用户感兴趣标签的偏好分数,并将偏好分数作为偏好程度。
一种可选的实施例中,行为信息可以包括用户对用户感兴趣标签对应的内容的行为次数和行为时间。
S1022中基于行为信息,确定用户对不同用户感兴趣标签的偏好分数,可以包括:
针对每一用户感兴趣标签,通过如下公式:score=historyScore×decayRatio,确定用户对用户感兴趣标签的偏好分数;
其中,score为偏好分数,historyScore=k×S,k为用户在用户感兴趣标签上的行为次数,S为每次行为获得的分数;
Figure BDA0003049628360000091
lambda为负数超参,circle为行为周期,windowN为经历的周期次数,delta为两次行为的时间差。
可以将标签在用户画像中的分数与标签向量一起输入特征预处理阶段;求取用户画像分数与标签向量的乘积,获得加权向量。
本发明实施例中,针对每一用户感兴趣标签,确定用户对用户感兴趣标签的偏好分数,将用户对用户感兴趣标签的偏好程度作为权重,将权重与用户感兴趣标签对应的标签向量相乘,得到用户感兴趣标签对应的加权向量,再将各个用户感兴趣标签对应的加权向量进行向量池化,得到用户兴趣表征向量的用户兴趣的表征方法,也可以理解为结合tagattention(标签注意力)的用户深度兴趣建模。
用户感兴趣标签可以是用户画像中记录的标签。可以计算用户对用户感兴趣标签的偏好分数,也可以理解为用户感兴趣标签在用户画像中的用户画像分数,用户感兴趣标签可以包括多个,多个感兴趣标签对应的标签向量形成标签向量矩阵。如图3所示,结合tagattention的用户深度兴趣建模过程中,可以基于多个感兴趣标签对应的标签向量形成标签向量矩阵,以及针对各个感兴趣标签在用户画像中的用户画像分数,计算乘积,具体地,每一个感兴趣标签对应的用户画像分数与标签向量矩阵中该感兴趣标签对应的标签向量求乘积,可以得到每个感兴趣标签对应的加权向量,将各个加权向量进行池化,得到一个池化后的向量,还向量即为得到的表征用户兴趣的用户兴趣表征向量。
本发明采用tag attention的方式对用户兴趣进行加权,可以更精准地表示用户兴趣。且采用用户画像中用户对标签的偏好分数作为权重,简单有效,能够快速且准确地表示用户对不同感兴趣标签的偏好程度。如此,使用该偏好分数作为权重,对标签向量进行加权,并对加权后的标签向量进行向量池化,能够在提高表征用户兴趣精准度的同时,实现简单高效的效果。
在所述将各个所述用户感兴趣标签对应的所述加权向量进行向量池化,得到用户兴趣表征向量之后,还可以包括:基于所述用户兴趣表征向量进行内容推荐。
具体地,可以获得排序特征;将用户兴趣表征向量与排序特征输入排序模型,基于排序模型的输出为用户推荐内容。
本发明还提供了一种内容推荐方法,如图4所示,可以包括:
S401,获取不同用户感兴趣标签对应的标签向量。
其中,用户感兴趣标签是用户对语料库中内容有操作行为的内容对应的标签;针对一用户感兴趣标签,标签向量为表征用户感兴趣标签的向量。
S402,确定用户对不同用户感兴趣标签的偏好程度。
S403,针对每一用户感兴趣标签,将用户对用户感兴趣标签的偏好程度作为权重,将权重与用户感兴趣标签对应的标签向量相乘,得到用户感兴趣标签对应的加权向量。
S404,将各个用户感兴趣标签对应的加权向量进行向量池化,得到用户兴趣表征向量,用户兴趣表征向量用于表征用户的用户兴趣。
S401至S404实现用户兴趣表征,通过上述实施例中用户兴趣表征方法的方法步骤实现。
S405,获得排序特征。
排序特征可以理解为对待推荐内容进行排序时所需特征中除用户兴趣特征之外的特征。本发明实施例中排序特征包括除用户兴趣表征向量之外的其他特征。具体地,排序特征可以包括待推荐内容的特征,用户属性特征,等等。
其中,待推荐内容可以是视频、音频等等。
S406,将用户兴趣表征向量与排序特征输入排序模型,基于排序模型的输出为用户推荐内容。
可以结合待推荐内容的特征,用户属性特征等,判断各个待推荐内容与用户的匹配度,按照匹配度从高到低或者从低到高的顺序对待推荐给用户的内容进行排序,并根据排序结果进行推荐。
本发明实施例中基于tag attention进行用户深度兴趣建模,采用用户对用户感兴趣标签的偏好程度对用户兴趣的表征向量进行加权,最终对加权向量池化作为用户兴趣的表征特征,也即上述用户兴趣表征向量,更加贴近用户兴趣。基于该用户兴趣的表征特征对待推荐给用户的内容进行排序,能够优化排序结构。且基于排序结果为用户推荐,能够更准确地为用户进行推荐,提升用户体验。总的来讲,采用tag attention的方式对用户兴趣进行加权,可以更精准地表示用户兴趣,进而优化排序效果,提升用户体验。
对应于上述实施例提供的用户兴趣表征方法,本发明实施例还提供了一种用户兴趣表征装置,如图5所示,可以包括:
获取模块501,用于获取不同用户感兴趣标签对应的标签向量,其中,用户感兴趣标签是用户对语料库中内容有操作行为的内容对应的标签;针对一用户感兴趣标签,标签向量为表征用户感兴趣标签的向量;
确定模块502,用于确定用户对不同用户感兴趣标签的偏好程度;
加权模块503,用于针对每一用户感兴趣标签,将用户对用户感兴趣标签的偏好程度作为权重,将权重与用户感兴趣标签对应的标签向量相乘,得到用户感兴趣标签对应的加权向量;
池化模块504,用于将各个用户感兴趣标签对应的加权向量进行向量池化,得到用户兴趣表征向量,用户兴趣表征向量用于表征用户的用户兴趣。
可选的,确定模块502,具体用于获取预设时间范围内用户针对不同用户感兴趣标签的行为信息;针对一用户感兴趣标签,行为信息表征用户对用户感兴趣标签对应的内容的行为;基于行为信息,确定用户对不同用户感兴趣标签的偏好分数,并将偏好分数作为偏好程度。
可选的,行为信息包括用户对用户感兴趣标签对应的内容的行为次数和行为时间;
确定模块502,具体用于针对每一用户感兴趣标签,通过如下公式:score=historyScore×decayRatio,确定用户对用户感兴趣标签的偏好分数;
其中,score为偏好分数,historyScore=k×S,k为用户在用户感兴趣标签上的行为次数,S为每次行为获得的分数;
Figure BDA0003049628360000121
lambda为负数超参,circle为行为周期,windowN为经历的周期次数,delta为两次行为的时间差。
所述装置还包括:推荐模块(图中未示出),用于在所述将各个所述用户感兴趣标签对应的所述加权向量进行向量池化,得到用户兴趣表征向量之后,基于所述用户兴趣表征向量进行内容推荐。
图6为本发明实施例提供的内容推荐装置的结构示意图。参见图6,本发明实施例还提供了一种内容推荐装置,可以包括:用户兴趣表征装置、获得模块505和排序推荐模块506;
用户兴趣表征装置,包括:
获取模块501,用于获取不同用户感兴趣标签对应的标签向量,其中,用户感兴趣标签是用户对语料库中内容有操作行为的内容对应的标签;针对一用户感兴趣标签,标签向量为表征用户感兴趣标签的向量;
确定模块502,用于确定用户对不同用户感兴趣标签的偏好程度;
加权模块503,用于针对每一用户感兴趣标签,将用户对用户感兴趣标签的偏好程度作为权重,将权重与用户感兴趣标签对应的标签向量相乘,得到用户感兴趣标签对应的加权向量;
池化模块504,用于将各个用户感兴趣标签对应的加权向量进行向量池化,得到用户兴趣表征向量,用户兴趣表征向量用于表征用户的用户兴趣;
获得模块505,用于获得排序特征;
排序推荐模块506,用于将用户兴趣表征向量与排序特征输入排序模型,基于排序模型的输出为用户推荐内容。
本发明实施例还提供了一种用户兴趣表征设备,如图7所示,包括处理器701、通信接口702、存储器703和通信总线704,其中,处理器701,通信接口702,存储器703通过通信总线704完成相互间的通信。
存储器703,用于存放计算机程序;
处理器701,用于执行存储器703上所存放的程序时,实现上述用户兴趣表征方法的方法步骤。
本发明实施例还提供了一种内容推荐设备,如图8所示,包括处理器801、通信接口802、存储器803和通信总线804,其中,处理器801,通信接口802,存储器803通过通信总线804完成相互间的通信。
存储器803,用于存放计算机程序;
处理器801,用于执行存储器803上所存放的程序时,实现上述用户兴趣表征方法的方法步骤。
上述设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processor,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例中用户兴趣表征方法的方法步骤。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例中内容推荐方法的方法步骤。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中用户兴趣表征方法的方法步骤。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中内容推荐方法的方法步骤。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备、计算机可读存储介质以及计算机程序产品实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (12)

1.一种用户兴趣表征方法,其特征在于,包括:
获取不同用户感兴趣标签对应的标签向量,其中,所述用户感兴趣标签是用户对语料库中内容有操作行为的所述内容对应的标签;针对一用户感兴趣标签,所述标签向量为表征所述用户感兴趣标签的向量;
确定所述用户对不同用户感兴趣标签的偏好程度;
针对每一用户感兴趣标签,将所述用户对所述用户感兴趣标签的所述偏好程度作为权重,将所述权重与所述用户感兴趣标签对应的标签向量相乘,得到所述用户感兴趣标签对应的加权向量;
将各个所述用户感兴趣标签对应的所述加权向量进行向量池化,得到用户兴趣表征向量,所述用户兴趣表征向量用于表征所述用户的用户兴趣。
2.根据权利要求1所述的方法,其特征在于,所述确定所述用户对不同用户感兴趣标签的偏好程度,包括:
获取预设时间范围内所述用户针对不同用户感兴趣标签的行为信息;针对一用户感兴趣标签,所述行为信息表征所述用户对所述用户感兴趣标签对应的内容的行为;
基于所述行为信息,确定所述用户对不同用户感兴趣标签的偏好分数,并将所述偏好分数作为所述偏好程度。
3.根据权利要求2所述的方法,其特征在于,所述行为信息包括所述用户对所述用户感兴趣标签对应的内容的行为次数和行为时间;
所述基于所述行为信息,确定所述用户对不同用户感兴趣标签的偏好分数,包括:
针对每一用户感兴趣标签,通过如下公式:score=historyScore×decayRatio,确定所述用户对所述用户感兴趣标签的偏好分数;
其中,score为所述偏好分数,historyScore=k×S,k为所述用户在所述用户感兴趣标签上的行为次数,S为每次行为获得的分数;
Figure FDA0003049628350000011
lambda为负数超参,circle为行为周期,windowN为经历的周期次数,delta为两次行为的时间差。
4.根据权利要求1至3任一项所述的方法,其特征在于,在所述将各个所述用户感兴趣标签对应的所述加权向量进行向量池化,得到用户兴趣表征向量之后,所述方法还包括:
基于所述用户兴趣表征向量进行内容推荐。
5.一种内容推荐方法,其特征在于,包括:
获取不同用户感兴趣标签对应的标签向量,其中,所述用户感兴趣标签是用户对语料库中内容有操作行为的所述内容对应的标签;针对一用户感兴趣标签,所述标签向量为表征所述用户感兴趣标签的向量;
确定所述用户对不同用户感兴趣标签的偏好程度;
针对每一用户感兴趣标签,将所述用户对所述用户感兴趣标签的所述偏好程度作为权重,将所述权重与所述用户感兴趣标签对应的标签向量相乘,得到所述用户感兴趣标签对应的加权向量;
将各个所述用户感兴趣标签对应的所述加权向量进行向量池化,得到用户兴趣表征向量,所述用户兴趣表征向量用于表征所述用户的用户兴趣;
获取排序特征;
将所述用户兴趣表征向量与所述排序特征输入排序模型,基于所述排序模型的输出为所述用户推荐内容。
6.一种用户兴趣表征装置,其特征在于,包括:
获取模块,用于获取不同用户感兴趣标签对应的标签向量,其中,所述用户感兴趣标签是用户对语料库中内容有操作行为的所述内容对应的标签;针对一用户感兴趣标签,所述标签向量为表征所述用户感兴趣标签的向量;
确定模块,用于确定所述用户对不同用户感兴趣标签的偏好程度;
加权模块,用于针对每一用户感兴趣标签,将所述用户对所述用户感兴趣标签的所述偏好程度作为权重,将所述权重与所述用户感兴趣标签对应的标签向量相乘,得到所述用户感兴趣标签对应的加权向量;
池化模块,用于将各个所述用户感兴趣标签对应的所述加权向量进行向量池化,得到用户兴趣表征向量,所述用户兴趣表征向量用于表征所述用户的用户兴趣。
7.根据权利要求6所述的装置,其特征在于,所述确定模块,具体用于获取预设时间范围内所述用户针对不同用户感兴趣标签的行为信息;针对一用户感兴趣标签,所述行为信息表征所述用户对所述用户感兴趣标签对应的内容的行为;基于所述行为信息,确定所述用户对不同用户感兴趣标签的偏好分数,并将所述偏好分数作为所述偏好程度。
8.根据权利要求7所述的装置,其特征在于,所述行为信息包括所述用户对所述用户感兴趣标签对应的内容的行为次数和行为时间;
所述确定模块,具体用于针对每一用户感兴趣标签,通过如下公式:score=historyScore×decayRatio,确定所述用户对所述用户感兴趣标签的偏好分数;
其中,score为所述偏好分数,historyScore=k×S,k为所述用户在所述用户感兴趣标签上的行为次数,S为每次行为获得的分数;
Figure FDA0003049628350000031
lambda为负数超参,circle为行为周期,windowN为经历的周期次数,delta为两次行为的时间差。
9.根据权利要求6至8任一项所述的装置,其特征在于,所述装置还包括:
推荐模块,用于在所述将各个所述用户感兴趣标签对应的所述加权向量进行向量池化,得到用户兴趣表征向量之后,基于所述用户兴趣表征向量进行内容推荐。
10.一种内容推荐装置,其特征在于,包括:用户兴趣表征装置、获得模块和排序推荐模块;
所述用户兴趣表征装置,包括:
获取模块,用于获取不同用户感兴趣标签对应的标签向量,其中,所述用户感兴趣标签是用户对语料库中内容有操作行为的所述内容对应的标签;针对一用户感兴趣标签,所述标签向量为表征所述用户感兴趣标签的向量;
确定模块,用于确定所述用户对不同用户感兴趣标签的偏好程度;
加权模块,用于针对每一用户感兴趣标签,将所述用户对所述用户感兴趣标签的所述偏好程度作为权重,将所述权重与所述用户感兴趣标签对应的标签向量相乘,得到所述用户感兴趣标签对应的加权向量;
池化模块,用于将各个所述用户感兴趣标签对应的所述加权向量进行向量池化,得到用户兴趣表征向量,所述用户兴趣表征向量用于表征所述用户的用户兴趣;
所述获得模块,用于获得排序特征;
所述排序推荐模块,用于将所述用户兴趣表征向量与所述排序特征输入排序模型,基于所述排序模型的输出为所述用户推荐内容。
11.一种用户兴趣表征设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-4任一所述的方法步骤。
12.一种内容推荐设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求5所述的方法步骤。
CN202110482030.0A 2021-04-30 2021-04-30 一种用户兴趣表征及内容推荐方法、装置和设备 Active CN113076487B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110482030.0A CN113076487B (zh) 2021-04-30 2021-04-30 一种用户兴趣表征及内容推荐方法、装置和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110482030.0A CN113076487B (zh) 2021-04-30 2021-04-30 一种用户兴趣表征及内容推荐方法、装置和设备

Publications (2)

Publication Number Publication Date
CN113076487A true CN113076487A (zh) 2021-07-06
CN113076487B CN113076487B (zh) 2024-03-08

Family

ID=76616323

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110482030.0A Active CN113076487B (zh) 2021-04-30 2021-04-30 一种用户兴趣表征及内容推荐方法、装置和设备

Country Status (1)

Country Link
CN (1) CN113076487B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113626707A (zh) * 2021-08-11 2021-11-09 北京百度网讯科技有限公司 一种兴趣描述信息获得方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110489639A (zh) * 2019-07-15 2019-11-22 北京奇艺世纪科技有限公司 一种内容推荐方法及装置
CN110674410A (zh) * 2019-10-08 2020-01-10 北京物灵科技有限公司 用户画像构建、内容推荐方法、装置及设备
CN111191124A (zh) * 2019-12-23 2020-05-22 东软集团股份有限公司 确定兴趣标签权重的方法、装置、存储介质及电子设备
CN111625715A (zh) * 2020-05-09 2020-09-04 北京达佳互联信息技术有限公司 信息提取方法、装置、电子设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110489639A (zh) * 2019-07-15 2019-11-22 北京奇艺世纪科技有限公司 一种内容推荐方法及装置
CN110674410A (zh) * 2019-10-08 2020-01-10 北京物灵科技有限公司 用户画像构建、内容推荐方法、装置及设备
CN111191124A (zh) * 2019-12-23 2020-05-22 东软集团股份有限公司 确定兴趣标签权重的方法、装置、存储介质及电子设备
CN111625715A (zh) * 2020-05-09 2020-09-04 北京达佳互联信息技术有限公司 信息提取方法、装置、电子设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113626707A (zh) * 2021-08-11 2021-11-09 北京百度网讯科技有限公司 一种兴趣描述信息获得方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN113076487B (zh) 2024-03-08

Similar Documents

Publication Publication Date Title
CN107341716B (zh) 一种恶意订单识别的方法、装置及电子设备
CN110825957B (zh) 基于深度学习的信息推荐方法、装置、设备及存储介质
US10958748B2 (en) Resource push method and apparatus
CN106651542B (zh) 一种物品推荐的方法及装置
CN108829808B (zh) 一种页面个性化排序方法、装置及电子设备
CN110717098B (zh) 基于元路径的上下文感知用户建模方法、序列推荐方法
CN106023015B (zh) 课程学习路径推荐方法及装置
CN110008397B (zh) 一种推荐模型训练方法及装置
CN112529663B (zh) 商品推荐方法、装置、终端设备及存储介质
CN112000819A (zh) 多媒体资源推荐方法、装置、电子设备及存储介质
CN107766467B (zh) 一种信息检测方法、装置、电子设备及存储介质
CN111159563B (zh) 用户兴趣点信息的确定方法、装置、设备及存储介质
CN113873330B (zh) 视频推荐方法、装置、计算机设备和存储介质
CN111275205A (zh) 虚拟样本的生成方法、终端设备及存储介质
CN112818162A (zh) 图像检索方法、装置、存储介质和电子设备
CN113076487B (zh) 一种用户兴趣表征及内容推荐方法、装置和设备
CN111444447A (zh) 内容推荐页面的展现方法及装置
CN111400516B (zh) 标签确定方法、电子设备及存储介质
CN112989118A (zh) 视频召回方法及装置
CN110262906B (zh) 接口标签推荐方法、装置、存储介质和电子设备
CN111597380A (zh) 一种推荐视频确定方法、装置、电子设备及存储介质
CN113836412A (zh) 一种信息推荐方法、装置、电子设备及存储介质
CN113837836A (zh) 模型推荐方法、装置、设备及存储介质
CN112612955A (zh) 基于深度学习的产品推送方法及系统
CN111984867A (zh) 一种网络资源确定方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant