CN109165975A - 标签推荐方法、装置、计算机设备及存储介质 - Google Patents
标签推荐方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN109165975A CN109165975A CN201810902677.2A CN201810902677A CN109165975A CN 109165975 A CN109165975 A CN 109165975A CN 201810902677 A CN201810902677 A CN 201810902677A CN 109165975 A CN109165975 A CN 109165975A
- Authority
- CN
- China
- Prior art keywords
- label
- user
- target user
- similar users
- cluster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0203—Market surveys; Market polls
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Abstract
本发明实施例提供了一种标签推荐方法、装置、计算机设备及存储介质。本发明实施例基于目标用户的相似用户群体所使用的标签情况来向该目标用户推荐其未使用过的标签,不仅能利用相似用户群体的共同标签偏好推荐符合目标用户个性偏好的标签,还实现相似用户群体使用标签的统一化,避免用户使用的标签过于分散的情况,同时统一化的标签数据有利于后续分析用户的共同喜好,对用户群体进行其它个性化的营销推广策划。
Description
技术领域
本发明涉及互联网技术领域,尤其涉及一种标签推荐方法、装置、计算机设备及存储介质。
背景技术
随着电子商务的快速发展,推荐系统已经被广泛研究和应用,推荐系统通过提取分析用户的资料、行为等信息来获取用户的喜好。标签是当前的电子商务网络时代中标识资源或者用户的一种数据,通过用户使用的标签数据可以分析出用户的兴趣喜好,以此帮助电商找到特定用户为其推荐可能购买的产品。而标签数据一般由电商平台或社交平台提供给用户选择使用,数量和类别固定有限,且不一定符合用户的情况,而当电商平台提供的标签没有适合用户喜好的标签时,一般由用户自定义标签,有着相同喜好的用户对相同性质的事物自定义的标签可能不一样,用户越多,自定义的标签越杂乱,造成标签多样化和难以统一化,这不利于电商或社交平台后续利用标签数据分析用户的喜好。
发明内容
本发明实施例提供了一种标签推荐方法、装置、计算机设备及存储介质,旨在向用户推荐统一化的标签,以避免用户使用的标签过于分散的情况。
第一方面,本发明实施例提供了一种标签推荐方法,该方法包括:利用网络爬虫技术爬取网络上的原始标签数据;获取用户-商品评分矩阵,所述用户-商品评分矩阵包括所有用户以及所述所有用户对所有商品的评分,所述所有用户包括目标用户以及若干其他用户;根据所述用户-商品评分矩阵计算每一其他用户与所述目标用户的相似度,以得到所述目标用户的相似用户群体;获取所述相似用户群体所使用过的第一标签;将所述第一标签进行归类以得到每个所述第一标签所属的类簇;分析每一类簇中的第一标签被所述相似用户群体中的用户所使用的情况;根据每一类簇中的第一标签被所述相似用户群体所使用的情况向所述目标用户推荐对应类簇中的标签。
第二方面,本发明实施例还提供了一种标签推荐装置,所述标签推荐装置包括用于实现第一方面所述的标签推荐方法的单元。
第三方面,本发明实施例还提供了一种计算机设备,包括存储器,以及与所述存储器相连的处理器;所述存储器用于存储实现标签推荐方法的计算机程序;所述处理器用于运行所述存储器中存储的计算机程序,以执行如上述第一方面所述的方法。
第四方面,本发明实施例提供了一种存储介质,所述存储介质存储有一个或者一个以上计算机程序,所述一个或者一个以上计算机程序可被一个或者一个以上的处理器执行,以实现上述第一方面所述的方法。
本发明实施例提供的标签推荐方法、装置、计算机设备及存储介质,基于目标用户的相似用户群体所使用的标签情况来向该目标用户推荐其未使用过的标签,不仅能利用相似用户群体的共同标签偏好推荐符合目标用户个性偏好的标签,还实现相似用户群体使用标签的统一化,避免用户使用的标签过于分散的情况,同时统一化的标签数据有利于后续分析用户的共同喜好,对用户群体进行其它个性化的营销推广策划。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例提供的一种标签推荐方法的流程示意图;
图2是本发明一实施例提供的一种标签推荐方法的子流程示意图;
图3是本发明另一实施例提供的一种标签推荐方法的子流程示意图;
图4是本发明另一实施例提供的一种标签推荐方法的子流程示意图;
图5是本发明一实施例提供的一种标签推荐装置的示意性框图;
图6是本发明一实施例提供的一种标签推荐装置的子单元示意性框图;
图7是本发明另一实施例提供的一种标签推荐装置的子单元示意性框图;
图8是本发明另一实施例提供的一种标签推荐装置的子单元示意性框图;
图9是本发明实施例提供的一种计算机设备的结构示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
也应当理解,尽管术语第一、第二等可以在此用来描述各种元素,但这些元素不应该受限于这些术语,这些术语仅用来将这些元素彼此区分开。
图1为本发明实施例提供的一种标签推荐方法的流程示意图,该方法可应用于终端,终端可以是智能手机、平板电脑、笔记本电脑、台式电脑、等具有通信功能的电子设备。该方法包括步骤S101~S106。
S101、获取用户-商品评分矩阵,所述用户-商品评分矩阵包括所有用户以及所述所有用户对所有商品的评分,所述所有用户包括一目标用户以及若干其他用户。
目前各个商品消费平台都记录有用户购买商品的购买评分记录,通过网络爬虫技术可以爬取到这些购买评分记录,将这些购买评分记录进行统计可以得到所有用户对所有商品的评分矩阵,即用户-商品评分矩阵。所有用户指的是进行过商品购买评分的全部用户,所有商品指的是商品消费平台所包括的全部商品,上述步骤S101中的其他用户是相对于目标用户而言,二者的身份可以转换,当需要向一个用户推荐商品时,该用户则作为目标用户,剩余的用户即为其他用户。
S102、根据所述用户-商品评分矩阵计算每一其他用户与所述目标用户的相似度,以得到所述目标用户的相似用户群体。
本发明实施例是基于用户的协同过滤思想向目标用户进行资源推荐,基于用户的协同过滤思想是通过使用统计技术寻找与目标用户具有相同偏好的邻居,即相似用户(群体),然后根据目标用户的邻居的喜好产生向目标用户的推荐。
如图2所示,步骤S102包括步骤S1021-S1023。
S1021、根据所述用户-商品评分矩阵计算所述目标用户对应的目标用户向量及所述若干其他用户对应的若干比较用户向量。
假设用户-商品评分矩阵如下表1所示:
表1:
假设U1为目标用户,U2-Um其他用户,在一实施例中,另一用户对应的用户向量的向量维数等于商品的数量,即有n个商品,用户向量的维数为n,将用户进行过评分的商品对应的一个维度的向量值为1,未进行评分对应的向量值为0,则U1的目标用户向量为U2的待比较用户向量U3的待比较用户向量其中省略号省略的向量值均为0。
因用户未进行过评分对应的一维度的向量值为0,因此,为了用户向量的简洁性,可以根据两个待比较的用户进行评分过的所有商品对用户向量进行简化,例如,将U2与U1相比较,两人进行评分过的所用商品为I1、I2和I3共3个,因此可将用户向量简化为为3维,U1的目标用户向量为U2的待比较用户向量若将U3与U1相比较,两人进行评分过的所用商品为I1、I2、I3和I4共4个,因此可将用户向量简化为4维,则
S1022、基于余弦相似性分别计算每一比较用户向量与所述目标用户向量的相似度。
在本实施例中,基于余弦相似性寻找目标用户的相似用户,即根据以下公式计算两个用户之前的相似度:
若则目标用户U1与其他用户U2之间的相似性若则目标用户U1与其他用户U2之间的相似性
S1023、若所述相似度大于或等于阈值,将所述相似度对应的其他用户确认为相似用户,以得到所述相似用户群体。
设置一阈值,若两个用户的相似度大于或等于该阈值,说明这两个用户相似,即互为相似用户。在本发明中,该阈值为0.5-0.7,在一实施例中,该阈值选择为0.5、0.6或0.7。
通过计算每一其他用户与目标用户的相似度即可得到目标用户的相似用户群体。
S103、获取所述相似用户群体所使用过的第一标签。
标签是用户用来对资源的分类,通过用户使用标签的频繁程度可以分析出用户对某一类资源的兴趣。在本发明实施例中,将相似用户群体使用过的任意标签称为第一标签。
S104、将所述第一标签进行归类以得到每个所述第一标签所属的类簇。
将相似用户群体所使用过的全部标签进行归类,找得不同的第一标签分别属于哪一个类簇的标签,通过此方式可以分析相似用户群体可能对哪些标签类簇中的标签感兴趣。
需要说明的是,在进行第一标签的归类之前,或进行该标签推荐方法之前,需要将网络上曾经被使用过的标签进行聚类,得到不同的类簇,清楚不同类簇中包含有哪些标签,而后才可以进行步骤S104中的将第一标签进行归类,找到每一个第一标签所述的类簇;另外,第一标签所属的类簇中除包含第一标签外还包含其它标签,即未被相似用户群体使用过的标签。
对网络上的标签进行聚类包括以下过程:
(1)利用网络爬虫技术爬取网络上的原始标签数据;
(2)将所述原始标签数据分为频繁标签和非频繁标签;
(3)将频繁标签进行聚类以得到不同的类簇以及每个类簇所包含的频繁标签。
首先利用爬虫技术在网络上爬取不同用户使用过的标签数据,得到原始标签数据,爬取的网络可设置,主要为主流的网络,例如新浪微博、各大电商网络平台、百度等当前知名度高的网页。由于用户一开始可以使用任意文字或者词组作为商品的标签,因此,标签一般杂乱、范围广,为了标签的重要性和集中性,需要将原始标签划分为频繁标签和非频繁标签,剔除非频繁的标签,留取频繁标签;频繁标签指的是被多个用户(例如100个用户以上)使用过的标签,且被标注过在多个商品(例如100个商品以上)上;非频繁的标签不常被用户使用,因此剔除。将频繁标签进行聚类后可以得到不同的类簇以及每个类簇所包含的频繁标签。标签是一种文字资源,利用现有的语料库以及word2vec算法可训练得到任意标签的词向量,得到频繁标签的词向量后,利用DBScan模型将频繁标签的词向量进行聚类得到标签的类簇。
得到标签的类簇之后,当用户的行为产生触发标签推荐的触发事件,则利用本发明的标签推荐方法对用户行进标签推荐。例如,医用在购物之后欲对购买的商品进行评价,评价过程需要用户对商品标记标签,则用户的评价操作可视为触发事件。
S105、分析每一类簇中的第一标签被所述相似用户群体中的用户所使用的情况。
S106、根据每一类簇的第一标签被所述相似用户群体所使用的情况向所述目标用户推荐对应类簇中的标签。
将每一个第一标签进行归类之后,分析每一类簇的第一标签被相似用户群体使用的情况,由于相似用户群体中每个用户对相同的资源有相同的偏好,因此可根据每一类簇的第一类标签被相似用户使用的整体情况来预测相似用户群体对哪一类簇的标签更感兴趣,从而预测目标用户对哪一类簇的标签更感兴趣,向目标用户推荐其更为感兴趣的标签。
在一实施例中,步骤S105具体包括:分别计算每一类簇中的第一标签被所述相似用户群体所使用的总频数。
某一类簇的第一标签被相似用户群体所使用的情况可通过其所包含的全部第一标签被相似用户群体所使用的总频数来表示;一类簇中所包含的全部第一标签被相似用户群体所使用的总频数根据该类簇中每个第一标签被该相似用户群体使用的情况来计算。
进一步地,如图3所示,步骤S105包括步骤S1051-S1052。
S1051、根据每个相似用户对应的相似度及每个相似用户使用一第一标签的次数计算该一第一标签被所述相似用户群体所使用的频数。
S1052、计算同一类簇中所有第一标签被所述相似用户群体所使用的频数之和,将所述频数之和确认为对应类簇的第一标签被所述相似用户群体所使用的总频数。
假设该类簇中具有K个第一标签,第j个第一标签被第i个相似用户使用的频数根据公式fij=si*Qij计算,其中fij表示第i个相似用户使用该第j个第一标签的频数,si表示第i个相似用户与目标用户的相似度,Qij表示第i个相似用户使用该第j个第一标签的使用次数。利用相似度作为标签使用频繁度的加权值,用户之间越相似,用户间的偏好越趋近相同,因此相似度越高,权重越高,则对应的相似用户使用标签的情况的参考度更重要,这对标签推荐的个性化更强。
假设该相似用户群体中具有M个相似用户,则该第j个第一标签被所述相似用户群体所使用的频数(用Fj表示)等于M个相似用户使用该第j个第一标签的频数之和,即
同一类簇中所有第一标签被所述相似用户群体所使用的频数之和,即步骤S1052中的总频数,其计算公式如下:
在一实施例中,步骤S106具体包括:根据每一类簇的第一标签对应的总频数向所述目标用户推荐对应类簇中的标签。
总频数越大,说明对应类簇的第一标签被使用得越频繁,该类簇中的标签被该相似用户群体以及目标用户使用的概率越高,将该类簇中的标签推荐给目标用户,避免同一用户群体自定义的标签导致标签过于分散,从而实现相似用户群体使用标签的统一化。
进一步地,如图4所示,步骤S106包括步骤S1061-S1064。
S1061、获取总频数排位在前的预设数量的类簇所包含的所有标签。
依据总频数从高到低的顺序将类簇进行排序,获取TopN个类簇,即总频数较高的前预设个(N个)类簇,N为1-4。在一实施例中,N取值为2或3。
TopN个类簇作为相似用户群体较为频繁使用的标签,也代表了该目标用户较为频繁使用的标签。
S1062、获取所述目标用户使用过的标签。
S1063、依据所述目标用户使用过的标签,在所述所有标签中获取所述目标用户未使用过的标签。
S1064、将所获取的未使用过的标签推荐给所述目标用户。
获取该TopN个类簇中所包含的未被目标用户使用过的标签全部推荐,形成不同类簇的推荐标签列表反馈给目标用户,进而用户可以在不同的推荐标签列表中选择对应类簇的标签。
本发明实施例提供的标签推荐方法,基于目标用户的相似用户群体所使用的标签情况来向该目标用户推荐其未使用过的标签,不仅能利用相似用户群体的共同标签偏好推荐符合目标用户个性偏好的标签,还实现相似用户群体使用标签的统一化,避免用户使用的标签过于分散的情况,同时统一化的标签数据有利于后续分析用户的共同喜好,对用户群体进行其它个性化的营销推广策划。
图5为本发明实施例提供的一种标签推荐装置100的示意性框图。该标签推荐装置100包括用于执行上述标签推荐方法的单元,该装置可以被配置于台式电脑、平板电脑、手提电脑、等终端中。该标签推荐装置100包括第一获取单元101、第一计算单元102、第二获取单元103、归类单元104、分析单元105以及推荐单元106。
第一获取单元101用于获取用户-商品评分矩阵,所述用户-商品评分矩阵包括所有用户以及所述所有用户对所有商品的评分,所述所有用户包括一目标用户以及若干其他用户。
第一计算单元102用于根据所述用户-商品评分矩阵计算每一其他用户与目标用户的相似度,以得到所述目标用户的相似用户群体。
第二获取单元103用于获取所述相似用户群体所使用过的第一标签。
归类单元104用于将所述第一标签进行归类以得到每个所述第一标签所属的类簇。
分析单元105,用于分析每一类簇中的第一标签被所述相似用户群体中的用户所使用的情况。
推荐单元106用于根据每一类簇的第一标签被所述相似用户群体所使用的情况向所述目标用户推荐对应类簇中的标签。
在一实施例中,如图6所示,所述第一计算单元102包括以下子单元:
第一计算子单元1021,用于根据所述用户-商品评分矩阵计算所述目标用户对应的目标用户向量及所述若干其他用户对应的若干比较用户向量;
第二计算子单元1022,用于基于余弦相似性分别计算每一比较用户向量与所述目标用户向量的相似度;以及
确认子单元1023,用于若所述相似度大于或等于阈值,将所述相似度对应的其他用户确认为相似用户,以得到所述相似用户群体。
在一实施例中,所述分析单元105具体用于:分别计算每一类簇中的第一标签被所述相似用户群体所使用的总频数。
所述推荐单元106具体用于:根据每一类簇的第一标签对应的总频数向所述目标用户推荐对应类簇中的标签。
在一实施例中,如图7所示,所述分析单元105包括:
第三计算子单元1051,用于根据每个相似用户对应的相似度及每个相似用户使用一第一标签的次数计算该一第一标签被所述相似用户群体所使用的频数;以及
第四计算子单元1052,用于计算同一类簇中所有第一标签被所述相似用户群体所使用的频数之和,将所述频数之和确认为对应类簇的第一标签被所述相似用户群体所使用的总频数。
在一实施例中,如图8所示,所述第推荐单元106包括:
第一获取子单元1061,用于获取总频数排位在前的预设数量的类簇所包含的所有标签;
第二获取子单元1062,用于获取所述目标用户使用过的标签;
第三获取子单元1063,用于依据所述目标用户使用过的标签,在所述所有标签中获取所述目标用户未使用过的标签;以及
推荐子单元1064,用于将所获取的未使用过的标签推荐给所述目标用户。
上述标签推荐装置100与前述标签推荐方法对应,本实施例中对标签推荐装置100未详尽之处可参考前述方法实施例,此处不做赘述。
上述标签推荐装置100可以实现为一种计算机程序的形式,计算机程序可以在如图9所示的计算机设备上运行。
图9为本发明实施例提供的一种计算机设备200的结构示意性框图。该计算机设备200,该计算机设备200可以是终端,也可以是服务器,其中,终端可以是智能手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等具有通信功能的电子设备。服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。
该计算机设备200,包括通过系统总线201连接的处理器202、存储器和网络接口205,其中,存储器可以包括非易失性存储介质203和内存储器204。
该计算机设备200的非易失性存储介质203可存储操作系统2031和计算机程序2032,该计算机程序2032被执行时,可使得处理器202执行一种标签推荐方法。该内存储器204为非易失性存储介质203中的计算机程序2032的运行提供环境。该计算机设备200的处理器202用于提供计算和控制能力,支撑整个计算机设备200的运行。计算机设备200的网络接口205用于进行网络通信,如发送分配的任务、接收数据等。
本领域技术人员可以理解,图9中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定,在其他实施例中,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。例如,在一些实施例中,计算机设备可以仅包括存储器及处理器,在这样的实施例中,存储器及处理器的结构及功能与图9所示实施例一致,在此不再赘述。
处理器202运行非易失性存储介质203中的计算机程序2032时,处理器202执行以下步骤:获取用户-商品评分矩阵,所述用户-商品评分矩阵包括所有用户以及所述所有用户对所有商品的评分,所述所有用户包括一目标用户以及若干其他用户;根据所述用户-商品评分矩阵计算每一其他用户与目标用户的相似度,以得到所述目标用户的相似用户群体;获取所述相似用户群体所使用过的第一标签;将所述第一标签进行归类以得到每个所述第一标签所属的类簇;分析每一类簇中的第一标签被所述相似用户群体中的用户所使用的情况;根据每一类簇的第一标签被所述相似用户群体所使用的情况向所述目标用户推荐对应类簇中的标签。
在一实施例中,所述处理器202在执行所述根据所述用户-商品评分矩阵计算每一其他用户与目标用户的相似度,以得到所述目标用户的相似用户群体的步骤时,具体执行以下步骤:根据所述用户-商品评分矩阵计算所述目标用户对应的目标用户向量及所述若干其他用户对应的若干比较用户向量;基于余弦相似性分别计算每一比较用户向量与所述目标用户向量的相似度;若所述相似度大于或等于阈值,将所述相似度对应的其他用户确认为相似用户,以得到所述相似用户群体。
在一实施例中,所述处理器202在执行所述分析每一类簇中的第一标签被所述相似用户群体中的用户所使用的情况的步骤时,具体执行以下步骤:分别计算每一类簇中的第一标签被所述相似用户群体所使用的总频数。
在一实施例中,所述处理器202在执行所述根据每一类簇的第一标签被所述相似用户群体所使用的情况向所述目标用户推荐对应类簇中的标签的步骤时,具体执行以下步骤:根据每一类簇的第一标签对应的总频数向所述目标用户推荐对应类簇中的标签。
在一实施例中,所述处理器202在执行所述分别计算每一类簇中的第一标签被所述相似用户群体所使用的总频数的步骤时,具体执行以下步骤:根据每个相似用户对应的相似度及每个相似用户使用一第一标签的次数计算该一第一标签被所述相似用户群体所使用的频数;计算同一类簇中所有第一标签被所述相似用户群体所使用的频数之和,将所述和确认为对应类簇的第一标签被所述相似用户群体所使用的总频数。
在一实施例中,所述处理器202在执行所述根据每一类簇的第一标签对应的总频数向所述目标用户推荐对应类簇中的标签的步骤时,具体执行以下步骤:获取总频数排位在前的预设数量的类簇所包含的所有标签;获取所述目标用户使用过的标签;依据所述目标用户使用过的标签,在所述所有标签中获取所述目标用户未使用过的标签;将所获取的未使用过的标签推荐给所述目标用户。
应当理解,在本申请实施例中,处理器202可以是中央处理单元(CentralProcessing Unit,CPU),该处理器202还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成。该计算机程序包括程序指令,计算机程序可存储于一存储介质中,该存储介质为计算机可读存储介质。该程序指令被该计算机系统中的至少一个处理器执行,以实现上述方法的实施例的流程步骤。
因此,本发明还提供一种存储介质,所述存储介质存储有一个或者一个以上计算机程序,所述一个或者一个以上计算机程序可被一个或者一个以上的处理器执行,可实现以下步骤:获取用户-商品评分矩阵,所述用户-商品评分矩阵包括所有用户以及所述所有用户对所有商品的评分,所述所有用户包括目标用户以及若干其他用户;根据所述用户-商品评分矩阵计算每一其他用户与目标用户的相似度,以得到所述目标用户的相似用户群体;获取所述相似用户群体所使用过的第一标签;将所述第一标签进行归类以得到每个所述第一标签所属的类簇;分析每一类簇中的第一标签被所述相似用户群体中的用户所使用的情况;根据每一类簇的第一标签被所述相似用户群体所使用的情况向所述目标用户推荐对应类簇中的标签。
在一实施例中,在实现所述根据所述用户-商品评分矩阵计算每一其他用户与目标用户的相似度,以得到所述目标用户的相似用户群体的步骤时,具体实现以下步骤:根据所述用户-商品评分矩阵计算所述目标用户对应的目标用户向量及所述若干其他用户对应的若干比较用户向量;基于余弦相似性分别计算每一比较用户向量与所述目标用户向量的相似度;若所述相似度大于或等于阈值,将所述相似度对应的其他用户确认为相似用户,以得到所述相似用户群体。
在一实施例中,在实现所述分析每一类簇中的第一标签被所述相似用户群体中的用户所使用的情况的步骤时,具体实现以下步骤:分别计算每一类簇中的第一标签被所述相似用户群体所使用的总频数。
在一实施例中,在实现所述根据每一类簇的第一标签被所述相似用户群体所使用的情况向所述目标用户推荐对应类簇中的标签的步骤时,具体实现以下步骤:根据每一类簇的第一标签对应的总频数向所述目标用户推荐对应类簇中的标签。
在一实施例中,在实现所述分别计算每一类簇中的第一标签被所述相似用户群体所使用的总频数的步骤时,具体实现以下步骤:根据每个相似用户对应的相似度及每个相似用户使用一第一标签的次数计算该一第一标签被所述相似用户群体所使用的频数;计算同一类簇中所有第一标签被所述相似用户群体所使用的频数之和,将所述和确认为对应类簇的第一标签被所述相似用户群体所使用的总频数。
在一实施例中,在实现所述根据每一类簇的第一标签对应的总频数向所述目标用户推荐对应类簇中的标签的步骤时,具体实现以下步骤:获取总频数排位在前的预设数量的类簇所包含的所有标签;获取所述目标用户使用过的标签;依据所述目标用户使用过的标签,在所述所有标签中获取所述目标用户未使用过的标签;将所获取的未使用过的标签推荐给所述目标用户。
所述存储介质可以是U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的计算机可读存储介质。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的。例如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本发明实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。
该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种标签推荐方法,其特征在于,包括:
获取用户-商品评分矩阵,所述用户-商品评分矩阵包括所有用户以及所述所有用户对所有商品的评分,所述所有用户包括一目标用户以及若干其他用户;
根据所述用户-商品评分矩阵计算每一其他用户与所述目标用户的相似度,以得到所述目标用户的相似用户群体;
获取所述相似用户群体所使用过的第一标签;
将所述第一标签进行归类以得到每个所述第一标签所属的类簇;
分析每一类簇中的第一标签被所述相似用户群体中的用户所使用的情况;
根据每一类簇的第一标签被所述相似用户群体所使用的情况向所述目标用户推荐对应类簇中的标签。
2.根据权利要求1所述的标签推荐方法,其特征在于,所述根据所述用户-商品评分矩阵计算每一其他用户与所述目标用户的相似度,以得到所述目标用户的相似用户群体,包括:
根据所述用户-商品评分矩阵计算所述目标用户对应的目标用户向量及所述若干其他用户对应的若干比较用户向量;
基于余弦相似性分别计算每一比较用户向量与所述目标用户向量的相似度;
若所述相似度大于或等于阈值,将所述相似度对应的其他用户确认为相似用户,以得到所述相似用户群体。
3.根据权利要求1所述的标签推荐方法,其特征在于,所述分析每一类簇中的第一标签被所述相似用户群体中的用户所使用的情况,包括:
分别计算每一类簇中的第一标签被所述相似用户群体所使用的总频数;
所述根据不同类簇的第一标签被所述相似用户群体所使用的情况向所述目标用户推荐对应类簇中的标签,包括:
根据每一类簇的第一标签对应的总频数向所述目标用户推荐对应类簇中的标签。
4.根据权利要求3所述的标签推荐方法,其特征在于,所述分别计算每一类簇中的第一标签被所述相似用户群体所使用的总频数,包括:
根据每个相似用户对应的相似度及每个相似用户使用一第一标签的次数计算该一第一标签被所述相似用户群体所使用的频数;
计算同一类簇中所有第一标签被所述相似用户群体所使用的频数之和,将所述频数之和确认为对应类簇的第一标签被所述相似用户群体所使用的总频数。
5.根据权利要求3所述的标签推荐方法,其特征在于,所述根据每一类簇的第一标签对应的总频数向所述目标用户推荐对应类簇中的标签,包括:
获取总频数排位在前的预设数量的类簇所包含的所有标签;
获取所述目标用户使用过的标签;
依据所述目标用户使用过的标签,在所述所有标签中获取所述目标用户未使用过的标签;
将所获取的未使用过的标签推荐给所述目标用户。
6.一种标签推荐装置,其特征在于,包括:
第一获取单元,用于获取用户-商品评分矩阵,所述用户-商品评分矩阵包括所有用户以及所述所有用户对所有商品的评分,所述所有用户包括一目标用户以及若干其他用户;
第一计算单元,用于根据所述用户-商品评分矩阵计算每一其他用户与所述目标用户的相似度,以得到所述目标用户的相似用户群体;
第二获取单元,用于获取所述相似用户群体所使用过的第一标签;
归类单元,用于将所述第一标签进行归类以得到每个所述第一标签所属的类簇;
分析单元,用于分析每一类簇中的第一标签被所述相似用户群体中的用户所使用的情况;
推荐单元,用于根据每一类簇的第一标签被所述相似用户群体所使用的情况向所述目标用户推荐对应类簇中的标签。
7.根据权利要求6所述的标签推荐装置,其特征在于,所述第一计算单元,包括:
第一计算子单元,用于根据所述用户-商品评分矩阵计算所述目标用户对应的目标用户向量及所述若干其他用户对应的若干比较用户向量;
第二计算子单元,用于基于余弦相似性分别计算每一比较用户向量与所述目标用户向量的相似度;
确认子单元,用于若所述相似度大于或等于阈值,将所述相似度对应的其他用户确认为相似用户,以得到所述相似用户群体。
8.根据权利要求6所述的标签推荐装置,其特征在于,所述分析单元具体用于:
分别计算每一类簇中的第一标签被所述相似用户群体所使用的总频数;
所述推荐单元具体用于:根据不同类簇的第一标签对应的总频数向所述目标用户推荐对应类簇中的标签。
9.一种计算机设备,其特征在于,包括存储器,以及与所述存储器相连的处理器;
所述存储器用于存储实现标签推荐方法的计算机程序;
所述处理器用于运行所述存储器中存储的计算机程序,以执行如权利要求1至5任一项所述的方法。
10.一种存储介质,其特征在于,所述存储介质存储有一个或者一个以上计算机程序,所述一个或者一个以上计算机程序可被一个或者一个以上的处理器执行,以实现如权利要求1至5任一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810902677.2A CN109165975B (zh) | 2018-08-09 | 2018-08-09 | 标签推荐方法、装置、计算机设备及存储介质 |
PCT/CN2018/108915 WO2020029412A1 (zh) | 2018-08-09 | 2018-09-30 | 标签推荐方法、装置、计算机设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810902677.2A CN109165975B (zh) | 2018-08-09 | 2018-08-09 | 标签推荐方法、装置、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109165975A true CN109165975A (zh) | 2019-01-08 |
CN109165975B CN109165975B (zh) | 2023-05-16 |
Family
ID=64895309
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810902677.2A Active CN109165975B (zh) | 2018-08-09 | 2018-08-09 | 标签推荐方法、装置、计算机设备及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN109165975B (zh) |
WO (1) | WO2020029412A1 (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110135893A (zh) * | 2019-04-16 | 2019-08-16 | 深圳壹账通智能科技有限公司 | 潜在用户的确定方法、装置、计算机设备及存储介质 |
CN110929166A (zh) * | 2019-12-27 | 2020-03-27 | 咪咕文化科技有限公司 | 一种内容推荐的方法、电子设备和存储介质 |
CN110992137A (zh) * | 2019-11-27 | 2020-04-10 | 上海风秩科技有限公司 | 一种产品的推荐方法、装置、电子设备及存储介质 |
CN111831894A (zh) * | 2019-04-23 | 2020-10-27 | 北京嘀嘀无限科技发展有限公司 | 一种信息匹配方法及装置 |
CN111861759A (zh) * | 2020-06-15 | 2020-10-30 | 北京百分点信息科技有限公司 | 产品与客户群体的匹配方法和系统 |
CN112182390A (zh) * | 2020-09-29 | 2021-01-05 | 中国平安人寿保险股份有限公司 | 一种函件推送方法、装置、计算机设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103412948A (zh) * | 2013-08-27 | 2013-11-27 | 北京交通大学 | 基于聚类的协同过滤的商品推荐方法及系统 |
CN103678431A (zh) * | 2013-03-26 | 2014-03-26 | 南京邮电大学 | 一种基于标准标签和项目评分的推荐方法 |
CN103838756A (zh) * | 2012-11-23 | 2014-06-04 | 阿里巴巴集团控股有限公司 | 一种确定推送信息的方法及装置 |
CN104463637A (zh) * | 2014-12-23 | 2015-03-25 | 北京石油化工学院 | 一种基于电商平台的商品推荐方法、装置及服务器 |
US20160125503A1 (en) * | 2013-06-05 | 2016-05-05 | Beijing Jingdong Shangke Information Technology Co., Ltd | Method, apparatus and system for recommending product information |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103729360A (zh) * | 2012-10-12 | 2014-04-16 | 腾讯科技(深圳)有限公司 | 一种兴趣标签推荐方法及系统 |
CN103198418A (zh) * | 2013-03-15 | 2013-07-10 | 北京亿赞普网络技术有限公司 | 一种应用推荐方法和系统 |
CN108205682B (zh) * | 2016-12-19 | 2021-10-08 | 同济大学 | 一种用于个性化推荐的融合内容和行为的协同过滤方法 |
CN108334645A (zh) * | 2018-04-10 | 2018-07-27 | 华中科技大学 | 一种基于图模型反馈更新的活动推荐方法 |
-
2018
- 2018-08-09 CN CN201810902677.2A patent/CN109165975B/zh active Active
- 2018-09-30 WO PCT/CN2018/108915 patent/WO2020029412A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103838756A (zh) * | 2012-11-23 | 2014-06-04 | 阿里巴巴集团控股有限公司 | 一种确定推送信息的方法及装置 |
CN103678431A (zh) * | 2013-03-26 | 2014-03-26 | 南京邮电大学 | 一种基于标准标签和项目评分的推荐方法 |
US20160125503A1 (en) * | 2013-06-05 | 2016-05-05 | Beijing Jingdong Shangke Information Technology Co., Ltd | Method, apparatus and system for recommending product information |
CN103412948A (zh) * | 2013-08-27 | 2013-11-27 | 北京交通大学 | 基于聚类的协同过滤的商品推荐方法及系统 |
CN104463637A (zh) * | 2014-12-23 | 2015-03-25 | 北京石油化工学院 | 一种基于电商平台的商品推荐方法、装置及服务器 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110135893A (zh) * | 2019-04-16 | 2019-08-16 | 深圳壹账通智能科技有限公司 | 潜在用户的确定方法、装置、计算机设备及存储介质 |
CN111831894A (zh) * | 2019-04-23 | 2020-10-27 | 北京嘀嘀无限科技发展有限公司 | 一种信息匹配方法及装置 |
CN110992137A (zh) * | 2019-11-27 | 2020-04-10 | 上海风秩科技有限公司 | 一种产品的推荐方法、装置、电子设备及存储介质 |
CN110992137B (zh) * | 2019-11-27 | 2023-09-01 | 上海风秩科技有限公司 | 一种产品的推荐方法、装置、电子设备及存储介质 |
CN110929166A (zh) * | 2019-12-27 | 2020-03-27 | 咪咕文化科技有限公司 | 一种内容推荐的方法、电子设备和存储介质 |
CN110929166B (zh) * | 2019-12-27 | 2023-10-20 | 咪咕文化科技有限公司 | 一种内容推荐的方法、电子设备和存储介质 |
CN111861759A (zh) * | 2020-06-15 | 2020-10-30 | 北京百分点信息科技有限公司 | 产品与客户群体的匹配方法和系统 |
CN112182390A (zh) * | 2020-09-29 | 2021-01-05 | 中国平安人寿保险股份有限公司 | 一种函件推送方法、装置、计算机设备及存储介质 |
CN112182390B (zh) * | 2020-09-29 | 2024-02-09 | 中国平安人寿保险股份有限公司 | 一种函件推送方法、装置、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2020029412A1 (zh) | 2020-02-13 |
CN109165975B (zh) | 2023-05-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109165975A (zh) | 标签推荐方法、装置、计算机设备及存储介质 | |
Shinde et al. | Hybrid personalized recommender system using centering-bunching based clustering algorithm | |
CN109102371A (zh) | 商品推荐方法、装置、计算机设备及存储介质 | |
Ma et al. | Recommender systems with social regularization | |
Yan et al. | P‐Rank: An indicator measuring prestige in heterogeneous scholarly networks | |
CN104217030B (zh) | 一种根据服务器搜索日志数据进行用户分类的方法和装置 | |
JP2014500988A (ja) | テキストセットの照合 | |
CN102411596A (zh) | 一种信息推荐方法及系统 | |
CN109064293A (zh) | 商品推荐方法、装置、计算机设备及存储介质 | |
CN102982042A (zh) | 一种个性化内容推荐方法、平台以及系统 | |
CN103885951A (zh) | 一种图文信息的投放、生成方法及装置 | |
CN110033331A (zh) | 一种优惠券的发放方法、系统及终端设备 | |
CN112750011A (zh) | 商品推荐方法、装置和电子设备 | |
JP2008299542A (ja) | コンテンツ提供方法、コンテンツ提供装置、コンテンツ提供プログラムおよびコンテンツ提供システム | |
CN108335132A (zh) | 应用程序的分析方法、装置、存储介质及终端 | |
CN111967914A (zh) | 基于用户画像的推荐方法、装置、计算机设备和存储介质 | |
CN109977316A (zh) | 一种并行式文章推荐方法、装置、设备及存储介质 | |
Prando et al. | Content-based Recommender System using Social Networks for Cold-start Users. | |
CN110473073A (zh) | 线性加权推荐的方法及装置 | |
Domann et al. | Real-time News Recommendations using Apache Spark. | |
Zhou et al. | Enhancing collaborative filtering with multi-label classification | |
CN110428277B (zh) | 推荐产品的触达方法、存储介质和程序产品 | |
CN109190027A (zh) | 多源推荐方法、终端、服务器、计算机设备、可读介质 | |
CN110019774A (zh) | 标签分配方法、装置、存储介质及电子装置 | |
CN107274247A (zh) | 基于云计算的智慧感知推荐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |