CN111552883B - 内容推荐方法及计算机可读存储介质 - Google Patents
内容推荐方法及计算机可读存储介质 Download PDFInfo
- Publication number
- CN111552883B CN111552883B CN202010401218.3A CN202010401218A CN111552883B CN 111552883 B CN111552883 B CN 111552883B CN 202010401218 A CN202010401218 A CN 202010401218A CN 111552883 B CN111552883 B CN 111552883B
- Authority
- CN
- China
- Prior art keywords
- target user
- user group
- recommended content
- behavior information
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 239000013598 vector Substances 0.000 claims description 33
- 238000004422 calculation algorithm Methods 0.000 claims description 23
- 238000004590 computer program Methods 0.000 claims description 6
- 230000010365 information processing Effects 0.000 abstract description 2
- 230000006399 behavior Effects 0.000 description 130
- 238000004364 calculation method Methods 0.000 description 9
- 238000003064 k means clustering Methods 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000003542 behavioural effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及信息处理领域,特别涉及一种内容推荐方法及计算机可读存储介质。内容推荐方法,包括:根据用户的用户信息,对所述用户进行聚类,得到若干个目标用户群;获取所述目标用户群的行为信息;根据所述目标用户群的行为信息,获取所述目标用户群的推荐内容集合;根据所述目标用户群的推荐内容集合,获取所述目标用户群内每个用户的推荐内容。采用本申请的实施例,能够为用户提供丰富的且贴合用户兴趣的推荐内容。
Description
技术领域
本申请涉及信息处理领域,特别涉及一种内容推荐方法及计算机可读存储介质。
背景技术
随着互联网的日益普及,人们能够通过互联网获取到的信息也日益丰富,包括但不限于文章、图片、视频等等。通常来说,以互联网产品为例,互联网产品会根据一个用户对产品的过往使用行为,来在海量信息中为用户筛选出可能感兴趣的信息来提供给用户,以提高用户粘度。然而,发明人发现相关技术中存在如下问题:由于新用户使用产品的时间较短或还未使用过产品,因此新用户对产品的过往使用行为较少或没有,从而导致难以根据新用户的过往使用行为来进行信息的筛选,筛选出的信息也难以贴合新用户的兴趣,进一步导致了较差的互联网产品使用体验感。
发明内容
本申请实施例的目的在于提供一种内容推荐方法及计算机可读存储介质,能够为用户提供丰富的且贴合用户兴趣的推荐内容。
为解决上述技术问题,本申请的实施例提供了一种内容推荐方法,包括:根据用户的用户信息,对所述用户进行聚类,得到若干个目标用户群;获取所述目标用户群的行为信息;根据所述目标用户群的行为信息,获取所述目标用户群的推荐内容集合;根据所述目标用户群的推荐内容集合,获取所述目标用户群内每个用户的推荐内容。
本申请的实施例还提供了一种内容推荐装置,包括:聚类模块,用于根据用户的用户信息,对所述用户进行聚类,得到若干个目标用户群;第一获取模块,用于获取所述目标用户群的行为信息;第二获取模块,用于根据所述目标用户群的行为信息,获取所述目标用户群的推荐内容集合;第三获取模块,用于根据所述目标用户群的推荐内容集合,获取所述目标用户群内每个用户的推荐内容。
本申请的实施例还提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时实现上述的内容推荐方法。
本申请实施例相对于现有技术而言,根据用户的用户信息,对所述用户进行聚类,得到若干个目标用户群;获取所述目标用户群的行为信息;根据所述目标用户群的行为信息,获取所述目标用户群的推荐内容集合;根据所述目标用户群的推荐内容集合,获取所述目标用户群内每个用户的推荐内容。由于根据用户的用户信息对用户进行了聚类,那么再获取聚类得到的目标用户群的行为信息,就是将目标用户群内多个用户的行为信息进行了聚合,得到的目标用户群的行为信息较为丰富,从而避免了单个用户的行为信息过少导致无法进行后续处理的情况;根据多样化的目标用户群能够得到丰富的推荐内容集合,从而有助于为目标用户群内用户提供可选性高的推荐内容以用于筛选,从丰富的推荐内容集合中筛选出的推荐内容也更易贴合用户的兴趣,以提升用户的使用体验感。
另外,所述获取所述目标用户群的行为信息,包括:根据所述目标用户群内每个用户和所述目标用户群的聚类中心之间的距离,合并所述目标用户群内每个用户的行为信息,得到所述目标用户群的行为信息。上述提供了一种获取目标用户群的行为信息的方式,由于目标用户群内用户的行为信息还是存在差异,而用户和聚类中心之间的距离能够反映用户与目标用户群的相似度,因此根据不同用户与目标用户群的不同相似度来合并每个用户的行为信息,能够得到较为合理的用户群的行为信息,避免了直接合并时可能忽视了个体差异的问题。
另外,所述根据所述目标用户群内每个用户和所述目标用户群的聚类中心之间的距离,合并所述目标用户群内每个用户的行为信息,得到所述目标用户群的行为信息,包括:根据所述目标用户群内每个用户和所述聚类中心之间的距离,计算所述每个用户的行为权重;根据每个所述用户的行为权重和行为信息,计算所述目标用户群的行为信息。上述提供了一种具体计算目标用户群的行为信息的方式,使用行为权重来表示用户与目标用户群的相似度,简洁明了。
另外,每个用户的行为权重,通过以下公式计算得到:
其中,所述wi,j表示目标用户群i内用户j的行为权重;所述di,j表示所述用户j和所述目标用户群i的聚类中心之间的距离;所述max(di)表示所述目标用户群i内的用户和所述目标用户群i的聚类中心之间的最大距离。
另外,目标用户群的行为信息,通过以下公式计算得到:
其中,所述new_scorei,k表示目标用户群i的第k个行为信息;所述n表示所述目标用户群i内的用户数量;所述scorek表示所述用户j的第k个行为信息。
另外,根据所述目标用户群的行为信息,获取所述目标用户群的推荐内容集合,包括:根据所述目标用户群的行为信息,获取所述目标用户群的相似目标用户群;根据所述相似目标用户群的行为信息,获取所述目标用户群的推荐内容集合。通过相似目标用户群的行为信息来获取目标用户群的推荐内容集合,也就是共用了其他用户群的兴趣喜好,减少了推荐内容集合不完全、较片面的情况,具有较强的推荐全新内容的能力。
另外,根据所述目标用户群的推荐内容集合,获取所述目标用户群内每个用户的推荐内容,包括:计算所述目标用户群内每个用户与所述推荐内容集合内每个推荐内容之间的相似度;根据所述相似度,获取所述每个用户的推荐内容。
另外,计算所述目标用户群内每个用户与所述推荐内容集合内每个推荐内容之间的相似度,包括:根据所述每个用户的用户信息和预设嵌入算法,计算所述每个用户的用户向量,且根据所述每个推荐内容和所述预设嵌入算法,计算所述每个推荐内容的内容向量;计算每个所述用户向量和每个所述内容向量之间的相似度。通过预设的嵌入算法预先处理得到用户向量和内容向量,再进行相似度的计算,相较于直接对庞大的原始数据进行计算,有效降低了庞大的计算量,提升了相似度的计算效率。
附图说明
一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定。
图1是根据本申请第一实施例中的内容推荐方法的流程图;
图2是根据本申请第一实施例中步骤103的具体实现方式的流程图;
图3是根据本申请第一实施例中步骤104的具体实现方式的流程图;
图4是根据本申请第二实施例中的内容推荐方法的流程图;
图5是根据本申请第二实施例中步骤202的流程图;
图6是根据本申请第三实施例中内容推荐装置的结构方框图;
图7是根据本申请第四实施例中电子设备的结构方框图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合附图对本申请的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本申请各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。
本申请的第一实施例涉及一种内容推荐方法,其具体流程如图1所示,包括:
步骤101,根据用户的用户信息,对用户进行聚类,得到若干个目标用户群;
步骤102,获取目标用户群的行为信息;
步骤103,根据目标用户群的行为信息,获取目标用户群的推荐内容集合;
步骤104,根据目标用户群的推荐内容集合,获取目标用户群内每个用户的推荐内容。
下面对本实施例中的内容推荐方法进行举例说明。
在步骤101中,用户的用户信息可以包括用户基础信息,例如用户的性别、年龄、地区等等,当面对新用户时也能够获取到这些基础信息;在获取到用户的用户信息后,将用户信息输入聚类算法,以对用户进行聚类;其中,聚类算法是对数据进行分组的一种算法,理论上通过聚类的到的组,同一组内的数据之间具有相同的属性或是特征,不同组的数据之间存在一定的属性或是特征的差异。
本实施例中,用户的用户信息还可以包括:用户名称信息和用户头像信息,其中,用户名称信息可以理解为用户的昵称,用户头像信息可以理解为用户的头像图片。可以理解的是,通常用户会选择自己喜好的人或物作为昵称或头像,以展示自身的喜好,因此用户的名称信息和用户的头像信息,相较于用户的基础信息,能够较好地、明显地反映出用户的兴趣喜好;即使在新用户的行为信息较少的情况下,也能够根据用户名称信息和用户头像信息来对用户进行聚类,有助于将兴趣相近的用户聚类到同一个用户群中去,使得聚类结果更为细致。
例如,采用用户名称信息、用户头像信息和用户基础信息对用户进行聚类,可包括以下步骤。首先,获取用户名称信息的特征,和用户头像信息的特征;其中,在获取用户名称信息的特征时,可先通过分词技术对用户名称信息(昵称)进行分词,得到用户名称信息中的关键词;将用户名称信息中的关键词向量化,将关键词向量输入卷积神经网络模型,得到输出的关键词特征向量,作为用户名称信息的特征;同理,在获取用户头像信息的特征时,可将用户头像信息(头像图片)输入卷积神经网络模型,得到输出的图片特征向量,作为用户头像信息的特征;同理,还可将用户基础信息输入卷积神经网络模型,得到输出的基础信息特征向量,作为用户基础信息的特征。在得到上述若干种特征向量后,将若干种特征向量输入聚类算法,以对用户进行聚类。
本实施例中,聚类算法可以是k-means聚类算法、mean-shift聚类算法等等,在此不做具体限制;以k-means聚类算法为例,将用户信息输入k-means聚类算法后,得到n个目标用户群k1-kn,每个目标用户群包括若干个用户。由于使用k-means聚类算法时,聚类的粒度是可控的,从而得到的目标用户群的大小也是可控的,可控的目标用户群有助于贴合不同场景下的需求,以得到多样化的目标用户群。
在步骤102中,获取目标用户群的行为信息。由于目标用户群是由用户组成的,因此可以将目标用户群视作一个整体,将目标用户群内每个用户的行为信息进行整合处理,得到目标用户群的行为信息;这样得到的目标用户群的行为信息较为丰富,从而避免了单个用户的行为信息过少导致无法进行后续处理的情况。
在本实施例中,用户的行为信息,可以理解为用户对互联网产品的过往使用行为,包括但不限于用户在互联网平台上对文字、图片、视频等内容的点击行为、观看行为、分享行为、评论行为、点赞行为等。可以理解的是,诸如上述的行为均可量化表示,例如,以用户的行为信息为用户对视频的观看行为为例,在对用户进行聚类后,得到n个目标用户群k1-kn内用户的行为信息可如下表1所示;其中,视频名称下对应的数字“1”表示用户对视频的观看行为为“已观看”,视频名称下对应的数字“0”表示用户对视频的观看行为为“未观看”。
表1
用户 | 用户群 | 视频A | 视频B | 视频C | 视频D | 视频E | 视频F | 视频G | 视频H | …… |
用户1 | 用户群1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | …… |
用户2 | 用户群1 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 1 | …… |
用户3 | 用户群2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | …… |
用户4 | 用户群2 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | …… |
用户5 | 用户群2 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | …… |
用户6 | 用户群1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | …… |
用户7 | 用户群k | 1 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | …… |
…… | …… | …… | …… | …… | …… | …… | …… | …… | …… | …… |
上述仅为举例说明,用户对视频的观看行为也可以通过用户对视频的评分来表示,等等。
由于每个目标用户群内用户的行为信息可量化表示,因此可以对每个目标用户群内每个用户的行为信息进行整合处理,得到目标用户群的行为信息。仍以表1为例,可将目标用户群1内用户(如表1中用户1、用户2、用户6等)对视频A的观看行为(即视频A对应的数字“1”或“0”)求和,作为目标用户群1对视频A的观看行为,将目标用户群1内用户对视频B的观看行为求和,作为目标用户群1对视频B的观看行为……以此类推;由于求和后的数字并不局限于“1”或“0”,因此可预设一视频对应的数字越大,目标用户群对该视频的兴趣度越高,等等。可以理解的是,上述仅为举例说明,并不对获取目标用户群的行为信息这一步骤构成限定。
在步骤103中,根据目标用户群的行为信息,获取目标用户群的推荐内容集合。可以理解的是,可以根据目标用户群的行为信息,获取目标用户群较为感兴趣的内容(即上文举例的文章、图片、视频等),再从内容库中筛选出与目标用户群较为感兴趣的内容相似的其他内容,作为目标用户群的推荐内容集合。
另外,本实施例中还提供了一种步骤103的具体实现方式,即通过用户协同过滤的方式来获取目标用户群的推荐内容集合,如图2所示,包括以下步骤。
步骤1031,根据目标用户群的行为信息,获取目标用户群的相似目标用户群。
步骤1032,根据相似目标用户群的行为信息,获取目标用户群的推荐内容集合。
具体地说,步骤1031至步骤1032可以理解为采用了基于用户的协同过滤方法:将每个目标用户群都视作一个整体,根据余弦相似度的计算公式,计算一个给定目标用户群与其他目标用户群之间的相似度,然后根据相似度得到给定目标用户群的一个相似目标用户群;获取相似目标用户群的行为信息,根据相似目标用户群的行为信息对应的内容和给定目标用户群的行为信息对应的内容,筛选出一定的内容,作为目标用户群的推荐内容集合。
在一个实例中,以用户的行为信息为用户对视频的观看行为,且观看行为通过用户对视频的评分来表示为例,给定了目标用户群为用户群1,计算得到目标用户群1的相似目标用户群为目标用户群99;根据用户群99对视频的观看行为,获取用户群99观看过(即用户群99进行过评分)的视频,从中筛选出评分最高且用户群1未观看过(即用户群1未进行过评分)的N部视频,作为用户群1的推荐内容集合。可以理解的是,由于用户群1的推荐内容集合中是用户群1未观看过的视频,因此较好地为用户群1推荐了全新的内容,有助于获取用户群1的更多兴趣喜好数据;通过采用上述基于用户的协同过滤方法,就是共用了其他用户群的兴趣喜好,减少了推荐内容集合不完全、较片面的情况,具有较强的推荐全新内容的能力。另外,可以理解的是,推荐内容还可以是上文举例的文章、图片等,在此不做具体限制。
在步骤104中,根据目标用户群的推荐内容集合,获取目标用户群内每个用户的推荐内容。本实施例中提供了一种步骤104的具体实现方式,如图3所示,包括以下步骤。
步骤1041,计算目标用户群内每个用户与推荐内容集合内每个推荐内容之间的相似度。
步骤1042,根据相似度,获取每个用户的推荐内容。
具体地说,由于目标用户群的推荐内容集合是根据整个目标用户群的行为信息获取到的,并不一定符合目标用户群内每个用户的兴趣偏好,因此可以在获取到推荐内容集合后,再将目标用户群内的每个用户作为一个整体,分别计算每个用户分别与推荐内容集合中的每个推荐内容的相似度,根据相似度的高低进行推荐内容的选择,以有针对性地为每个用户推荐与用户相似度高的内容,也就是符合用户兴趣偏好的内容。
更具体地说,计算目标用户群内每个用户与推荐内容集合内每个推荐内容之间的相似度,包括:
(1)根据每个用户的用户信息和预设嵌入算法,计算每个用户的用户向量,且根据每个推荐内容和预设嵌入算法,计算每个推荐内容的内容向量;
(2)计算每个用户向量和每个内容向量之间的相似度。
考虑到互联网平台上的内容数量和用户数量都较为庞大,如果直接进行用户和推荐内容之间的相似度会造成庞大的计算量,因此本实施例中通过预设的嵌入算法对用户的用户信息和推荐内容进行计算,得到用户向量和内容向量,再对用户向量和内容向量进行相似度的计算,有效降低了庞大的计算量,提升了相似度的计算效率;其中,预设的嵌入算法可以理解为embedding算法,经embedding算法计算得到的向量所包含的数据量大幅降低;用户的用户信息可以理解为步骤101中所提到的基础信息、名称信息和头像信息等。
在得到用户向量和内容向量后,可采用余弦相似度计算公式等计算每个用户的特征向量与每个推荐内容的特征向量之间的距离,作为用户与推荐内容之间的相似度,此处不再赘述。
本实施例相对于现有技术而言,根据用户的用户信息,对所述用户进行聚类,得到若干个目标用户群;获取所述目标用户群的行为信息;根据所述目标用户群的行为信息,获取所述目标用户群的推荐内容集合;根据所述目标用户群的推荐内容集合,获取所述目标用户群内每个用户的推荐内容。由于根据用户的用户信息对用户进行了聚类,那么再获取聚类得到的目标用户群的行为信息,就是将目标用户群内多个用户的行为信息进行了聚合,得到的目标用户群的行为信息较为丰富,从而避免了单个用户的行为信息过少导致无法进行后续处理的情况;由于聚类的粒度是可控的,从而得到的目标用户群的大小也是可控的,可控的目标用户群有助于贴合不同场景下的需求,以得到多样化的目标用户群;根据多样化的目标用户群能够得到丰富的推荐内容集合,从而有助于为目标用户群内用户提供可选性高的推荐内容以用于筛选,从丰富的推荐内容集合中筛选出的推荐内容也更易贴合用户的兴趣,以提升用户的使用体验感。
本申请第二实施例涉及一种内容推荐方法,与第一实施例大致相同,在第一实施例的基础上提供了获取目标用户群的行为信息的实现方式。本实施例中的内容推荐方法,其具体流程如图4所示,下面对图4所示的内容推荐方法进行举例说明。
步骤201,根据用户的用户信息,对用户进行聚类,得到若干个目标用户群;此步骤与步骤101大致相同,此处不再赘述。
步骤202,根据目标用户群内每个用户和目标用户群的聚类中心之间的距离,合并目标用户群内每个用户的行为信息,得到目标用户群的行为信息。
具体地说,在对用户进行聚类时,每个目标用户群都具有一个聚类中心,每个用户都会被聚类至与聚类中心的距离较近的目标用户群中去,也就是说每个目标用户群内用户与该目标用户群的聚类中心之类的距离也是已知的。在一个实例中,目标用户群内每个用户和目标用户群的聚类中心之间的距离可如表2中第3列所示(第3列的类目“距离”为“用户与用户群的聚类中心之间的距离”),用户和聚类中心之间的距离用于表示用户与目标用户群的相似度。
表2
用户 | 用户群 | 距离 | 视频A | 视频B | 视频C | 视频D | 视频E | 视频F | 视频G | …… |
用户1 | 用户群1 | 0.1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | …… |
用户2 | 用户群1 | 0.02 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | …… |
用户3 | 用户群2 | 0.5 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | …… |
用户4 | 用户群2 | 0.3 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | …… |
用户5 | 用户群2 | 0.24 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | …… |
用户6 | 用户群1 | 0.81 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | …… |
用户7 | 用户群k | 0.05 | 1 | 0 | 1 | 0 | 0 | 0 | 0 | …… |
…… | …… | …… | …… | …… | …… | …… | …… | …… | …… | …… |
本步骤202具体包括如图5所示的步骤2021和步骤2022。
步骤2021,根据目标用户群内每个用户和聚类中心之间的距离,计算每个用户的行为权重;每个用户的行为权重通过以下公式计算得到:
其中,wi,j表示目标用户群i内用户j的行为权重;di,j表示用户j和目标用户群i的聚类中心之间的距离;max(di)表示目标用户群i内的用户和目标用户群i的聚类中心之间的最大距离。本实施例中,若一给定用户离聚类中心越近,则给定用户的行为权重越大,可以视为给定用户与目标用户群的相似度越大,从而给定用户的行为信息越能影响到目标用户群的行为信息。
步骤2022,根据每个用户的行为权重和行为信息,计算目标用户群的行为信息;目标用户群的行为信息,通过以下公式计算得到:
其中,new_scorei,k表示目标用户群i的第k个行为信息;n表示目标用户群i内的用户数量;scorej,k表示用户j的第k个行为信息。可以理解的是,由于用户的行为权重越大,其行为信息越能影响到目标用户群的行为信息,因此通过上述公式,对目标用户群内每个用户的行为信息进行加权求和,以得到目标用户群的行为信息。
在一个实例中,仍以表1为例,目标用户群1内每个用户对视频A的观看行为通过数字scorej,1表示,则在计算视频A的加权求和结果作为目标用户群1的第1个行为信息时,
new_score1,1=w1,1×score1,1+w1,2×score2,1+…+w1,n×scoren,1;以此类推。
最终得到各目标用户群的行为信息可例如表3所示。
用户群 | 视频A | 视频B | 视频C | 视频D | 视频E | 视频F | 视频G | 视频H |
用户群1 | 2.07 | 0 | 2.14 | 0 | 3.11 | 0 | 0 | 1.3 |
用户群2 | 1.01 | 0 | 0 | 1.42 | 0 | 0 | 0.93 | 0.5 |
用户群3 | 0.83 | 0 | 3.8 | 0 | 0 | 5.3 | 1.91 | 0 |
…… | …… | …… | …… | …… | …… | …… | …… | …… |
步骤203,根据目标用户群的行为信息,获取目标用户群的推荐内容集合;此步骤与步骤103大致相同,此处不再赘述。
步骤204,根据目标用户群的推荐内容集合,获取目标用户群内每个用户的推荐内容;此步骤与步骤104大致相同,此处不再赘述。
本实施例相对于现有技术而言,提供了一种获取目标用户群的行为信息的方式:由于目标用户群内用户的行为信息还是存在差异,而用户和聚类中心之间的距离能够反映用户与目标用户群的相似度,因此根据不同用户与目标用户群的不同相似度来合并每个用户的行为信息,能够得到较为合理的用户群的行为信息,避免了直接合并时可能忽视了个体差异的问题。
本申请第三实施例涉及一种内容推荐装置,如图6所示,包括:聚类模块301,第一获取模块302,第二获取模块303和第三获取模块304。
聚类模块301,用于根据用户的用户信息,对所述用户进行聚类,得到若干个目标用户群;
第一获取模块302,用于获取所述目标用户群的行为信息;
第二获取模块303,用于根据所述目标用户群的行为信息,获取所述目标用户群的推荐内容集合;
第三获取模块304,用于根据所述目标用户群的推荐内容集合,获取所述目标用户群内每个用户的推荐内容。
在一个实例中,第一获取模块302获取所述目标用户群的行为信息,包括:根据所述目标用户群内每个用户和所述目标用户群的聚类中心之间的距离,合并所述目标用户群内每个用户的行为信息,得到所述目标用户群的行为信息。
在一个实例中,第一获取模块302根据所述目标用户群内每个用户和所述目标用户群的聚类中心之间的距离,合并所述目标用户群内每个用户的行为信息,得到所述目标用户群的行为信息,包括:根据所述目标用户群内每个用户和所述聚类中心之间的距离,计算所述每个用户的行为权重;根据每个所述用户的行为权重和行为信息,计算所述目标用户群的行为信息。
在一个实例中,每个用户的行为权重,通过以下公式计算得到:
其中,所述wi,j表示目标用户群i内用户j的行为权重;所述di,j表示所述用户j和所述目标用户群i的聚类中心之间的距离;所述max(di)表示所述目标用户群i内的用户和所述目标用户群i的聚类中心之间的最大距离。
在一个实例中,目标用户群的行为信息,通过以下公式计算得到:
其中,所述new_scorei,k表示目标用户群i的第k个行为信息;所述n表示所述目标用户群i内的用户数量;所述scorej,k表示所述用户j的第k个行为信息。
在一个实例中,第二获取模块030根据所述目标用户群的行为信息,获取所述目标用户群的推荐内容集合,包括:根据所述目标用户群的行为信息,获取所述目标用户群的相似目标用户群;根据所述相似目标用户群的行为信息,获取所述目标用户群的推荐内容集合。
在一个实例中,第三获取模块304根据所述目标用户群的推荐内容集合,获取所述目标用户群内每个用户的推荐内容,包括:计算所述目标用户群内每个用户与所述推荐内容集合内每个推荐内容之间的相似度;根据所述相似度,获取所述每个用户的推荐内容。
在一个实例中,第三获取模块304计算所述目标用户群内每个用户与所述推荐内容集合内每个推荐内容之间的相似度,包括:根据所述每个用户的用户信息和预设嵌入算法,计算所述每个用户的用户向量,且根据所述每个推荐内容和所述预设嵌入算法,计算所述每个推荐内容的内容向量;计算每个所述用户向量和每个所述内容向量之间的相似度。
不难发现,本实施例为与第一或第二实施例的相对应的装置实施例,本实施例可与第一或第二实施例互相配合实施。第一或第二实施例中提到的相关技术细节在本实施例中依然有效,为了减少重复,这里不再赘述。相应的,实施例中提到的相关技术细节也可应用在第一或第二实施例中。
值得一提的是,本实施例中所涉及到的各模块均为逻辑模块,在实际应用中,一个逻辑单元可以是一个物理单元,也可以是一个物理单元的一部分,还可以以多个物理单元的组合实现。此外,为了突出本发明的创新部分,本实施例中并没有将与解决本发明所提出的技术问题关系不太密切的单元引入,但这并不表明本实施例中不存在其它的单元。
本申请第四实施例涉及一种电子设备,如图7所示,包括:包括至少一个处理器401;以及,与至少一个处理器401通信连接的存储器402;其中,存储器402存储有可被至少一个处理器401执行的指令,指令被至少一个处理器401执行,以使至少一个处理器401能够执行上述的内容推荐方法。
其中,存储器402和处理器401采用总线方式连接,总线可以包括任意数量的互联的总线和桥,总线将一个或多个处理器401和存储器402的各种电路连接在一起。总线还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路连接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件,也可以是多个元件,比如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。经处理器401处理的数据通过天线在无线介质上进行传输,进一步,天线还接收数据并将数据传送给处理器401。
处理器401负责管理总线和通常的处理,还可以提供各种功能,包括定时,外围接口,电压调节、电源管理以及其他控制功能。而存储器402可以被用于存储处理器401在执行操作时所使用的数据。
本申请第五实施例涉及一种计算机可读存储介质,存储有计算机程序。计算机程序被处理器执行时实现上述内容推荐方法实施例。
即,本领域技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域的普通技术人员可以理解,上述各实施方式是实现本申请的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本申请的精神和范围。
Claims (8)
1.一种内容推荐方法,其特征在于,包括:
根据用户的用户信息,对所述用户进行聚类,得到若干个目标用户群;
获取所述目标用户群的行为信息;
根据所述目标用户群的行为信息,获取所述目标用户群的推荐内容集合;
根据所述目标用户群的推荐内容集合,获取所述目标用户群内每个用户的推荐内容;
所述根据所述目标用户群的行为信息,获取所述目标用户群的推荐内容集合,包括:
根据所述目标用户群的行为信息,获取所述目标用户群的相似目标用户群;
根据所述相似目标用户群的行为信息,获取所述目标用户群的推荐内容集合;
所述根据所述目标用户群的推荐内容集合,获取所述目标用户群内每个用户的推荐内容,包括:
计算所述目标用户群内每个用户与所述推荐内容集合内每个推荐内容之间的相似度;
根据所述相似度,获取所述每个用户的推荐内容。
2.根据权利要求1所述的内容推荐方法,其特征在于,所述获取所述目标用户群的行为信息,包括:
根据所述目标用户群内每个用户和所述目标用户群的聚类中心之间的距离,合并所述目标用户群内每个用户的行为信息,得到所述目标用户群的行为信息。
3.根据权利要求2所述的内容推荐方法,其特征在于,所述根据所述目标用户群内每个用户和所述目标用户群的聚类中心之间的距离,合并所述目标用户群内每个用户的行为信息,得到所述目标用户群的行为信息,包括:
根据所述目标用户群内每个用户和所述聚类中心之间的距离,计算所述每个用户的行为权重;
根据每个所述用户的行为权重和行为信息,计算所述目标用户群的行为信息。
4.根据权利要求3所述的内容推荐方法,其特征在于,所述每个用户的行为权重,通过以下公式计算得到:
其中,所述wi,j表示目标用户群i内用户j的行为权重;所述di,j表示所述用户j和所述目标用户群i的聚类中心之间的距离;所述max(di)表示所述目标用户群i内的用户和所述目标用户群i的聚类中心之间的最大距离。
5.根据权利要求4所述的内容推荐方法,其特征在于,所述目标用户群的行为信息,通过以下公式计算得到:
其中,所述new_scorei,k表示目标用户群i的第k个行为信息;所述n表示所述目标用户群i内的用户数量;所述scorej,k表示所述用户j的第k个行为信息。
6.根据权利要求1所述的内容推荐方法,其特征在于,所述计算所述目标用户群内每个用户与所述推荐内容集合内每个推荐内容之间的相似度,包括:
根据所述每个用户的用户信息和预设嵌入算法,计算所述每个用户的用户向量,且根据所述每个推荐内容和所述预设嵌入算法,计算所述每个推荐内容的内容向量;
计算每个所述用户向量和每个所述内容向量之间的相似度。
7.一种内容推荐装置,其特征在于,包括:
聚类模块,用于根据用户的用户信息,对所述用户进行聚类,得到若干个目标用户群;
第一获取模块,用于获取所述目标用户群的行为信息;
第二获取模块,用于根据所述目标用户群的行为信息,获取所述目标用户群的推荐内容集合;
所述根据所述目标用户群的行为信息,获取所述目标用户群的推荐内容集合,包括:
根据所述目标用户群的行为信息,获取所述目标用户群的相似目标用户群;
根据所述相似目标用户群的行为信息,获取所述目标用户群的推荐内容集合;
第三获取模块,用于根据所述目标用户群的推荐内容集合,获取所述目标用户群内每个用户的推荐内容;
所述根据所述目标用户群的推荐内容集合,获取所述目标用户群内每个用户的推荐内容,包括:
计算所述目标用户群内每个用户与所述推荐内容集合内每个推荐内容之间的相似度;
根据所述相似度,获取所述每个用户的推荐内容。
8.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的内容推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010401218.3A CN111552883B (zh) | 2020-05-13 | 2020-05-13 | 内容推荐方法及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010401218.3A CN111552883B (zh) | 2020-05-13 | 2020-05-13 | 内容推荐方法及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111552883A CN111552883A (zh) | 2020-08-18 |
CN111552883B true CN111552883B (zh) | 2023-12-12 |
Family
ID=72001578
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010401218.3A Active CN111552883B (zh) | 2020-05-13 | 2020-05-13 | 内容推荐方法及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111552883B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112182419A (zh) * | 2020-09-11 | 2021-01-05 | 支付宝(杭州)信息技术有限公司 | 基于隐私保护的社群聚类方法及装置 |
CN113590901A (zh) * | 2021-07-30 | 2021-11-02 | 深圳豹耳科技有限公司 | 一种基于用户分群的物料推荐方法、装置、设备及存储介质 |
CN115099323A (zh) * | 2022-06-17 | 2022-09-23 | 抖音视界(北京)有限公司 | 内容小组确定方法、装置、介质及电子设备 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103077220A (zh) * | 2012-12-29 | 2013-05-01 | 中国科学院深圳先进技术研究院 | 一种基于用户群关联度的个性化推荐方法及系统 |
CN103927347A (zh) * | 2014-04-01 | 2014-07-16 | 复旦大学 | 一种基于用户行为模型和蚁群聚类的协同过滤推荐算法 |
CN104123315A (zh) * | 2013-04-28 | 2014-10-29 | 百度在线网络技术(北京)有限公司 | 多媒体文件的推荐方法和推荐服务器 |
CN104504098A (zh) * | 2014-12-29 | 2015-04-08 | 北京奇虎科技有限公司 | 信息推荐方法和装置 |
CN105321089A (zh) * | 2014-07-16 | 2016-02-10 | 苏宁云商集团股份有限公司 | 基于多算法融合的电子商务推荐方法和系统 |
CN106708953A (zh) * | 2016-11-28 | 2017-05-24 | 西安电子科技大学 | 基于离散粒子群优化的局部社区检测协同过滤推荐方法 |
CN106997347A (zh) * | 2016-01-22 | 2017-08-01 | 华为技术有限公司 | 信息推荐方法及服务器 |
CN107633430A (zh) * | 2017-09-20 | 2018-01-26 | 哈尔滨工业大学 | 一种基于群体社区的商品推荐方法 |
CN107657347A (zh) * | 2017-09-30 | 2018-02-02 | 桂林电子科技大学 | 一种面向群组的旅游推荐方法 |
CN108763314A (zh) * | 2018-04-26 | 2018-11-06 | 深圳市腾讯计算机系统有限公司 | 一种兴趣推荐方法、装置、服务器及存储介质 |
CN109102371A (zh) * | 2018-08-22 | 2018-12-28 | 平安科技(深圳)有限公司 | 商品推荐方法、装置、计算机设备及存储介质 |
CN109360057A (zh) * | 2018-10-12 | 2019-02-19 | 平安科技(深圳)有限公司 | 信息推送方法、装置、计算机设备及存储介质 |
CN110502704A (zh) * | 2019-08-12 | 2019-11-26 | 山东师范大学 | 一种基于注意力机制的群组推荐方法及系统 |
-
2020
- 2020-05-13 CN CN202010401218.3A patent/CN111552883B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103077220A (zh) * | 2012-12-29 | 2013-05-01 | 中国科学院深圳先进技术研究院 | 一种基于用户群关联度的个性化推荐方法及系统 |
CN104123315A (zh) * | 2013-04-28 | 2014-10-29 | 百度在线网络技术(北京)有限公司 | 多媒体文件的推荐方法和推荐服务器 |
CN103927347A (zh) * | 2014-04-01 | 2014-07-16 | 复旦大学 | 一种基于用户行为模型和蚁群聚类的协同过滤推荐算法 |
CN105321089A (zh) * | 2014-07-16 | 2016-02-10 | 苏宁云商集团股份有限公司 | 基于多算法融合的电子商务推荐方法和系统 |
CN104504098A (zh) * | 2014-12-29 | 2015-04-08 | 北京奇虎科技有限公司 | 信息推荐方法和装置 |
CN106997347A (zh) * | 2016-01-22 | 2017-08-01 | 华为技术有限公司 | 信息推荐方法及服务器 |
CN106708953A (zh) * | 2016-11-28 | 2017-05-24 | 西安电子科技大学 | 基于离散粒子群优化的局部社区检测协同过滤推荐方法 |
CN107633430A (zh) * | 2017-09-20 | 2018-01-26 | 哈尔滨工业大学 | 一种基于群体社区的商品推荐方法 |
CN107657347A (zh) * | 2017-09-30 | 2018-02-02 | 桂林电子科技大学 | 一种面向群组的旅游推荐方法 |
CN108763314A (zh) * | 2018-04-26 | 2018-11-06 | 深圳市腾讯计算机系统有限公司 | 一种兴趣推荐方法、装置、服务器及存储介质 |
CN109102371A (zh) * | 2018-08-22 | 2018-12-28 | 平安科技(深圳)有限公司 | 商品推荐方法、装置、计算机设备及存储介质 |
CN109360057A (zh) * | 2018-10-12 | 2019-02-19 | 平安科技(深圳)有限公司 | 信息推送方法、装置、计算机设备及存储介质 |
CN110502704A (zh) * | 2019-08-12 | 2019-11-26 | 山东师范大学 | 一种基于注意力机制的群组推荐方法及系统 |
Non-Patent Citations (6)
Title |
---|
Guan, Yong Liang ; Joo Chong, Peter Han.Two-Phase Cooperative Broadcasting Based on Batched Network Code.IEEE Transactions on Communications.2016,(第2期),全文. * |
Hanhoon Kang ; Seong Joon Yoo ; Dongil Han.Implementation of a User Preference-based Fashion Recommendation System.ICEIC : International Conference on Electronics, Informations and Communications.2008,全文. * |
Xu, Xiaoli ; Praveen Kumar, Meenakshi Sundaram Gandhi * |
孙楠军 ; 刘天时 ; .基于项目分类和用户群体兴趣的协同过滤算法.计算机工程与应用.2015,(第10期),全文. * |
张海燕,丁峰,姜丽红.基于模糊聚类的协同过滤推荐方法.计算机仿真.2005,(第08期),全文. * |
杨武 ; 唐瑞 ; 卢玲.基于内容的推荐与协同过滤融合的新闻推荐方法.计算机应用.2016,第36卷(第002期),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN111552883A (zh) | 2020-08-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111552883B (zh) | 内容推荐方法及计算机可读存储介质 | |
US20200265077A1 (en) | Media content discovery and character organization techniques | |
CN106326391B (zh) | 多媒体资源推荐方法及装置 | |
WO2017181612A1 (zh) | 个性化视频推荐方法及装置 | |
US9449256B1 (en) | Providing image candidates based on diverse adjustments to an image | |
CN110321422A (zh) | 在线训练模型的方法、推送方法、装置以及设备 | |
CN107894998B (zh) | 视频推荐方法及装置 | |
US20170124590A1 (en) | Digital magazine recommendations by topic | |
WO2013189738A1 (en) | Method and apparatus for content recommendation | |
US10380209B2 (en) | Systems and methods of providing recommendations of content items | |
Lin et al. | Personalized channel recommendation on live streaming platforms | |
CN112074828A (zh) | 训练图像嵌入模型和文本嵌入模型 | |
CN111291217B (zh) | 一种内容推荐方法、装置、电子设备以及计算机可读介质 | |
CN106649733B (zh) | 一种基于无线接入点情境分类与感知的在线视频推荐方法 | |
CN109213933B (zh) | 内容项推荐方法、装置、设备及存储介质 | |
CN109063080B (zh) | 一种视频推荐方法及装置 | |
DE102021000450A1 (de) | Empfehlungssystem auf Grundlage einer Trendsetter-Inferenz | |
WO2016077103A1 (en) | Automatic selection of images for an application | |
CN112685637A (zh) | 一种智能设备的智能交互方法及智能设备 | |
CN108848152B (zh) | 一种对象推荐的方法及服务器 | |
CN116383363A (zh) | 一种虚拟宠物聊天系统 | |
CN108804492B (zh) | 用于多媒体对象推荐的方法及装置 | |
Scarpa et al. | A Collaborative Filtering Recommendation Algorithm based on Cluster Analysis | |
CN113194360B (zh) | 视频推荐方法、装置、服务器及存储介质 | |
CN110598045B (zh) | 视频推荐方法、装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |