CN109360057A - 信息推送方法、装置、计算机设备及存储介质 - Google Patents

信息推送方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN109360057A
CN109360057A CN201811190462.9A CN201811190462A CN109360057A CN 109360057 A CN109360057 A CN 109360057A CN 201811190462 A CN201811190462 A CN 201811190462A CN 109360057 A CN109360057 A CN 109360057A
Authority
CN
China
Prior art keywords
commodity
vector
user
scoring
product name
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811190462.9A
Other languages
English (en)
Other versions
CN109360057B (zh
Inventor
吴壮伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201811190462.9A priority Critical patent/CN109360057B/zh
Publication of CN109360057A publication Critical patent/CN109360057A/zh
Application granted granted Critical
Publication of CN109360057B publication Critical patent/CN109360057B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了信息推送方法、装置、计算机设备及存储介质。该方法通对初始用户‑评分矩阵中新用户所缺少的商品评分,经过与缺少商品评分对应商品名称的相似商品的评分进行加权计算后以进行补充,将调整后用户‑评分矩阵用于根据皮尔逊相似度选择目标用户的相似用户聚类结果,最后根据相似用户聚类结果中每一行向量和与每一行向量与对应的皮尔逊相似度,得到商品推荐行向量,由商品推荐行向量得到商品推荐列表。该方法避免了仅采用协同过滤的推荐算法对新用户进行商品推荐时,因新用户缺少历史评分数据,而导致冷启动的问题。

Description

信息推送方法、装置、计算机设备及存储介质
技术领域
本发明涉及信息推送技术领域,尤其涉及一种信息推送方法、装置、计算机设备及存储介质。
背景技术
目前,在基于互联网的在线商城上进行网络购物已越来越频繁,这些在线商城对用户进行商品推荐时,通常使用的是基于协同过滤的推荐算法(协同过滤算法,原理是用户喜欢那些具有相似兴趣的用户喜欢过的商品,比如你的朋友喜欢电影哈利波特I,那么就会推荐给你,这是最简单的基于用户的协同过滤算法)。但是对新用户进行商品推荐时,遇到了冷启动的问题,即新用户没有历史评分数据,导致了系统无法推送数据,从而影响到推荐过程。
目前,另一种常用的是基于内容的推荐系统的,但是单独使用基于内容的推荐系统,存在计算量大,而且准确率低的问题。
发明内容
本发明实施例提供了一种信息推送方法、装置、计算机设备及存储介质,旨在解决现有技术中商品信息推荐使用人工编辑的推荐列表或基于协同过滤算法得到的推荐列表,无法准确根据用户的当前实际需求实时响应较为精准的推荐结果,从而影响到推荐过程的问题。
第一方面,本发明实施例提供了一种信息推送方法,其包括:
获取初始用户-评分矩阵;
若所述初始用户-评分矩阵中包括空白值,根据所述空白值所对应商品名称及该商品名称对应的商品聚类簇,得到空白值对应的商品加权评分;
将所述空白值更新为对应的商品加权评分,得到调整后用户-评分矩阵;
获取在所述调整后用户-评分矩阵选中的行向量对应的目标用户,根据目标用户对应的行向量与所述调整后用户-评分矩阵中其他行向量之间的皮尔逊相似度的排序结果,获取预设个数的行向量以作为相似用户聚类结果;以及
根据相似用户聚类结果中每一行向量和与每一行向量与对应的皮尔逊相似度,得到商品推荐行向量,由商品推荐行向量得到商品推荐列表,将所述商品推荐列表推送至目标用户对应的接收端。
第二方面,本发明实施例提供了一种信息推送装置,其包括:
初始矩阵获取单元,用于获取初始用户-评分矩阵;
补全值获取单元,用于若所述初始用户-评分矩阵中包括空白值,根据所述空白值所对应商品名称及该商品名称对应的商品聚类簇,得到空白值对应的商品加权评分;
调整矩阵获取单元,用于将所述空白值更新为对应的商品加权评分,得到调整后用户-评分矩阵;
相似用户聚类单元,用于获取在所述调整后用户-评分矩阵选中的行向量对应的目标用户,根据目标用户对应的行向量与所述调整后用户-评分矩阵中其他行向量之间的皮尔逊相似度的排序结果,获取预设个数的行向量以作为相似用户聚类结果;
推荐列表获取单元,用于根据相似用户聚类结果中每一行向量和与每一行向量与对应的皮尔逊相似度,得到商品推荐行向量,由商品推荐行向量得到商品推荐列表,将所述商品推荐列表推送至目标用户对应的接收端。
第三方面,本发明实施例又提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的信息推送方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其中所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的信息推送方法。
本发明实施例提供了一种信息推送方法、装置、计算机设备及存储介质。该方法通过对初始用户-评分矩阵中新用户所缺少的商品评分,经过与缺少商品评分对应商品名称的相似商品的评分进行加权计算后以进行补充,将调整后用户-评分矩阵用于根据皮尔逊相似度选择目标用户的相似用户聚类结果,最后根据相似用户聚类结果中每一行向量和与每一行向量与对应的皮尔逊相似度,得到商品推荐行向量,由商品推荐行向量得到商品推荐列表。该方法避免了仅采用协同过滤的推荐算法对新用户进行商品推荐时,因新用户缺少历史评分数据,而导致冷启动的问题。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的信息推送方法的流程示意图;
图2为本发明实施例提供的信息推送方法的另一流程示意图;
图3为本发明实施例提供的信息推送方法的子流程示意图;
图4为本发明实施例提供的信息推送方法的另一子流程示意图;
图5为本发明实施例提供的信息推送方法的另一子流程示意图;
图6为本发明实施例提供的信息推送装置的示意性框图;
图7为本发明实施例提供的信息推送装置的另一示意性框图;
图8为本发明实施例提供的信息推送装置的子单元示意性框图;
图9为本发明实施例提供的信息推送装置的另一子单元示意性框图;
图10为本发明实施例提供的信息推送装置的另一子单元示意性框图;
图11为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1,图1是本发明实施例提供的信息推送方法的流程示意图,该信息推送方法应用于管理服务器中,该方法通过安装于管理服务器中的应用软件进行执行,管理服务器即是用于进行信息推送的企业终端。
如图1所示,该方法包括步骤S110~S150。
S110、获取初始用户-评分矩阵。
在本实施例中,用户-评分矩阵表示用户对商品(项目可以理解为具体的商品)的评分,用户-评分矩阵的横轴为项目,纵轴为用户,当中的值是用户i对项目j的评分。例如用户-评分矩阵S为3×2的矩阵,如:
其中,用户-评分矩阵S中第一行的行向量表示用户1分别针对商品1和商品2的评分,第二行的行向量表示用户2分别针对商品1和商品2的评分,第三行的行向量表示用户3分别针对商品1和商品2的评分。
若用户1为新用户,其由于未购买商品2,故对其评分为空白值,但为了不影响后续对目标用户匹配相似用户时,需将空白值补全,得到所有值均非空白值的用户-评分矩阵。
在一实施例中,如图2所示,步骤S110之前还包括:
S101、获取历史商品信息集合,通过词频-逆文本频率指数模型对所述历史商品信息集合中每一历史商品信息均进行关键词信息抽取,得到与每一历史商品信息对应的商品关键词集合;
S102、通过Word2Vec模型获取每一商品关键词集合中各商品关键词对应的词向量;
S103、获取每一商品关键词集合中各商品关键词所对应词向量的平均值,以得到与每一商品关键词集合对应的统计向量;
S104、通过DBSCAN聚类模型对商品关键词集合对应的统计向量进行聚类,得到至少一个商品聚类簇。
在本实施例中,管理服务器中所提供的面向用户的UI界面中,用户可以选择多种商品中的一种或多种并进行购买。在管理服务器中是存储有历史商品信息集合,历史商品信息集合中每一历史商品信息包括由商品名称和商品属性,其中商品的属性包括商品的价格、标签、品牌和功能等。
当通过TF-IDF模型(即term frequency–inverse document frequency,表示词频-逆文本频率指数模型)对所述历史商品信息集合中每一历史商品信息均进行关键词信息抽取,可以将每一历史商品信息简化表述为对应的商品关键词集合。
词频-逆文本频率指数模型是一种用于信息检索与数据挖掘的常用加权技术。TF意思是词频(Term Frequency),IDF意思是逆文本频率指数(Inverse DocumentFrequency)。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。
例如,有一斯伯丁品牌XX型号YY元的篮球,其还有产地、尺寸等丰富的商品信息,但是经过TF-IDF模型进行关键词抽取后,最后得到的商品关键词集合为“篮球+斯伯丁+XX型号”。这样,将每一历史商品信息均简化为对应的商品关键词集合,能便于转化为词向量。
再将历史商品信息集合转化为与每一历史商品信息对应的商品关键词集合后,可通过Word2Vec模型(Word2Vec是从大量文本语料中以无监督的方式学习语义知识的一种模型)将商品关键词集合转化为与每一历史商品信息一一对应的词向量。
例如在语料库中,篮球、斯伯丁、XX型号各对应一个向量,向量中只有一个值为1,其余都为0,将上述信息对应的向量输入Word2Vec模型即可转化为低维度的连续值,也就是稠密向量,并且其中意思相近的词将被映射到向量空间中相近的位置。
在获取了商品关键词集合中各各商品关键词的词向量,再取各商品关键词的词向量平均值作为该商品的统计向量即可。此时即将历史商品信息集合中每一历史商品信息均转化为对应的统计向量,之后将通过DBSCAN聚类模型对商品关键词集合对应的统计向量进行聚类,可得到至少一个商品聚类簇。
DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是一个比较有代表性的基于密度的聚类算法。
DBSCAN需要二个参数:扫描半径(eps)和最小包含点数(minPts)。任选一个未被访问(unvisited)的点开始,找出与其距离在eps之内(包括eps)的所有附近点。
如果附近点的数量≥minPts,则当前点与其附近点形成一个簇,并且出发点被标记为已访问(visited)。然后递归,以相同的方法处理该簇内所有未被标记为已访问(visited)的点,从而对簇进行扩展。如果附近点的数量<minPts,则该点暂时被标记作为噪声点。如果簇充分地被扩展,即簇内的所有点被标记为已访问,然后用同样的算法去处理未被访问的点。
S120、若所述初始用户-评分矩阵中包括空白值,根据所述空白值所对应商品名称及该商品名称对应的商品聚类簇,得到空白值对应的商品加权评分。
在本实施例中,由于初始用户-评分矩阵中因部分用户没有对特定商品进行评分而保留空白值,因此这部分空白值将会基于商品内容进行预测用户评分以填补空白值。
在一实施例中,如图3所示,步骤S120包括:
S121、根据所述空白值对应的商品名称,以获取与商品名称相应的统计向量;
S122、获取与商品名称相应的统计向量所归属的商品聚类簇;
S123、根据与商品名称相应的统计向量所归属的商品聚类簇,获取与所述空白值对应的商品名称相应的相似商品名称,以作为相似商品结果;
S124、根据所述空白值对应的行向量,获取与所述相似商品结果中每一商品名称对应的评分;
S125、根据与所述相似商品结果中每一商品名称对应的评分进行加权平均,得到所述空白值对应的商品加权评分。
在本实施例中,由于确定了所述空白值在初始用户-评分矩阵中所归属的行向量后,即可知道是哪一用户针对哪一商品的商品评分是空白值,此时先获取所述空白值对应的商品名称即可知道该商品名称所对应的统计向量。然后判断该统计向量所归属的商品聚类簇,即可获取该商品聚类簇中其他商品的相似商品名称,以作为所述空白值对应的商品名称的相似商品结果。由于所述空白值在初始用户-评分矩阵中所归属的行向量中,可获知该用户针对相似商品结果中各相似商品名称的评分。最后根据该用户针对各相似商品名称的评分进行加权平均,得到所述空白值对应的商品加权评分。
在一实施例中,如图4所示,步骤S125包括:
S1251、将所述相似商品结果中每一商品名称对应的统计向量作为统计向量组,将所述空白值对应商品名称相应的统计向量作为待预测商品评分向量,获取所述统计向量组中每一统计向量与待预测商品评分向量之间的距离,以得到向量距离集合;
S1252、将所述相似商品结果中每一商品名称对应评分乘以向量距离集合中对应的向量距离并求和,得到商品加权总评分;
S1253、将商品加权总评分除以向量距离集合中各向量距离之和,得到所述空白值对应的商品加权评分。
在本实施例中,若将所述统计向量组中每一统计向量与待预测商品评分向量之间的距离记为dck,将所述空白值所在行向量对应的用户对所述相似商品结果中每一商品名称对应评分记为Sic,通过如下公式计算得到所述空白值对应的商品加权评分:
其中,Scorek表示所述空白值对应商品k的商品加权评分,m为所述相似商品结果中相似商品c的总个数。
例如,用户1针对商品2的评分为空白值,而得到商品2对应的相似商品结果为商品4和商品5,且用户1针对商品4和商品5的评分分别为3和4,商品4对应的统计向量与商品2对应的统计向量之间的距离为0.5,商品5对应的统计向量与商品2对应的统计向量之间的距离为1,则:
Score2=(0.5*3+1*4)/(0.5+1)=11/3;
此时,将上述计算得到的Score2作为所述空白值对应的商品加权评分。
通过对新用户所缺少的商品评分,通过基于内容的预测方法,能有效的补全用户-评分矩阵,避免了推荐过程中冷启动的问题。
S130、将所述空白值更新为对应的商品加权评分,得到调整后用户-评分矩阵。
在本实施例中,若将所述空白值更新为对应的商品加权评分,所述初始用户-评分矩阵中的空白值即可被补充为无空白值的调整后用户-评分矩阵,这样有效的解决了新用户缺少的商品评分的问题。而且空白值处所更新填充的商品加权分是依据近似商品的评分而得到,并非随机获取分值填充,该商品加权评分更具参考性。
S140、获取在所述调整后用户-评分矩阵选中的行向量对应的目标用户,根据目标用户对应的行向量与所述调整后用户-评分矩阵中其他行向量之间的皮尔逊相似度的排序结果,获取预设个数的行向量以作为相似用户聚类结果。
在本实施例中,若得到了无空白值的调整后用户-评分矩阵,即可以该调整后用户-评分矩阵作为相似用户分类的参考矩阵。例如,可先在调整后用户-评分矩阵中选定一个行向量作为目标用户,为了获取该目标用户的相似用户,可计算调整后用户-评分矩阵中其他行向量与目标用户的行向量之间的皮尔逊相似度。将多个计算结果进行降序排序后,可以与目标用户的行向量之间的皮尔逊相似度的大小选择排名位于预设排名阈值(预设排名阈值=预设个数+1)之前的行向量所对应用户作为相似用户,并由相似用户对应的行向量的集合作为相似用户聚类结果。通过计算与目标用户对应行向量的皮尔逊相似度,能快速筛选出相似用户并将相似用户所感兴趣的商品推送至目标用户。
计算任意两个行向量之间的皮尔逊相似度,可以通过以下公式进行计算:
其中,E表示数学期望;
ρX,Y的取值范围是(0,1),当ρX,Y越接近1表示两个行向量的相似程度越高,当ρX,Y越接近0表示两个行向量的相似程度越低。
S150、根据相似用户聚类结果中每一行向量和与每一行向量与对应的皮尔逊相似度,得到商品推荐行向量,由商品推荐行向量得到商品推荐列表,将所述商品推荐列表推送至目标用户对应的接收端。
在本实施例中,由于相似用户聚类结果中每一行向量对应的用户均对每一商品有对应的评分,从对各商品的评分高低可以看出对用户对各商品的推荐程度。相似用户聚类结果中若有行向量与目标用户的行向量的皮尔逊相似度越大,则表示该行向量对应的用户与目标用户对商品的喜好相同或近似,故该用户的对各商品的喜好程度更大程度上影响对目标用户的商品推荐结果。
当根据相似用户聚类结果中每一行向量和与每一行向量与对应的皮尔逊相似度,得到商品推荐行向量,在商品推荐行向量中对各商品的评分排位靠前的商品即可作为商品推荐列表的组成元素之一,这样通过商品推荐行向量得到的推荐商品由于充分考虑了近似用户的喜好,故能准确的反映目标用户的喜好。
在一实施例中,如图5所示,步骤S150包括:
S151、获取所述相似用户聚类结果中每一相似用户对应的行向量与目标用户的行向量之间皮尔逊相似度,以得到皮尔逊相似度集合;
S152、将皮尔逊相似度集合中每一皮尔逊相似乘以所述相似用户聚类结果中对应相似用户的行向量并求和,得到商品推荐行向量;
S153、获取商品推荐行向量中各评分降序排序后评分排名小于预设排名阈值的评分所对应的商品名称,以组成商品推荐列表。
在本实施例中,当获取的所述相似用户聚类结果中包括N个行向量,分别记为User1~UserN,各行向量与目标用户之间的行向量之间的皮尔逊相似度分别记为Pearson1~PearsonN在计算所得到的商品推荐行向量中,即可获知所述相似用户聚类结果中用户对各商品的综合评分,以该综合评分中评分排名位于前M位(M等于预设排名阈值减一,如设置M=10)的评分所对应商品即可作为商品推荐列表的推荐项。通过上述基于皮尔逊相似度的计算,能将相似用户的商品喜好作为对目标用户推荐商品时所考虑的主要因素,能更合理的进行商品推荐。
该方法避免了仅采用协同过滤的推荐算法对新用户进行商品推荐时,因新用户缺少历史评分数据而导致冷启动的问题,解决了难以对新用户进行商品推荐的问题。
本发明实施例还提供一种信息推送装置,该信息推送装置用于执行前述信息推送方法的任一实施例。具体地,请参阅图6,图6是本发明实施例提供的信息推送装置的示意性框图。该信息推送装置100可以配置于管理服务器中。
如图6所示,信息推送装置100包括初始矩阵获取单元110、补全值获取单元120、调整矩阵获取单元130、相似用户聚类单元140、和推荐列表获取单元150。
初始矩阵获取单元110,用于获取初始用户-评分矩阵。
在本实施例中,用户-评分矩阵表示用户对商品(项目可以理解为具体的商品)的评分,用户-评分矩阵的横轴为项目,纵轴为用户,当中的值是用户i对项目j的评分。例如用户-评分矩阵S为3×2的矩阵,如:
其中,用户-评分矩阵S中第一行的行向量表示用户1分别针对商品1和商品2的评分,第二行的行向量表示用户2分别针对商品1和商品2的评分,第三行的行向量表示用户3分别针对商品1和商品2的评分。
若用户1为新用户,其由于未购买商品2,故对其评分为空白值,但为了不影响后续对目标用户匹配相似用户时,需将空白值补全,得到所有值均非空白值的用户-评分矩阵。
在一实施例中,如图7所示,信息推送装置100还包括:
历史关键词集合获取单元101,用于获取历史商品信息集合,通过词频-逆文本频率指数模型对所述历史商品信息集合中每一历史商品信息均进行关键词信息抽取,得到与每一历史商品信息对应的商品关键词集合;
词向量转化单元102,用于通过Word2Vec模型获取每一商品关键词集合中各商品关键词对应的词向量;
统计向量获取单元103,用于获取每一商品关键词集合中各商品关键词所对应词向量的平均值,以得到与每一商品关键词集合对应的统计向量;
聚类单元104,用于通过DBSCAN聚类模型对商品关键词集合对应的统计向量进行聚类,得到至少一个商品聚类簇。
在本实施例中,管理服务器中所提供的面向用户的UI界面中,用户可以选择多种商品中的一种或多种并进行购买。在管理服务器中是存储有历史商品信息集合,历史商品信息集合中每一历史商品信息包括由商品名称和商品属性,其中商品的属性包括商品的价格、标签、品牌和功能等。
当通过TF-IDF模型(即term frequency–inverse document frequency,表示词频-逆文本频率指数模型)对所述历史商品信息集合中每一历史商品信息均进行关键词信息抽取,可以将每一历史商品信息简化表述为对应的商品关键词集合。
词频-逆文本频率指数模型是一种用于信息检索与数据挖掘的常用加权技术。TF意思是词频(Term Frequency),IDF意思是逆文本频率指数(Inverse DocumentFrequency)。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。
例如,有一斯伯丁品牌XX型号YY元的篮球,其还有产地、尺寸等丰富的商品信息,但是经过TF-IDF模型进行关键词抽取后,最后得到的商品关键词集合为“篮球+斯伯丁+XX型号”。这样,将每一历史商品信息均简化为对应的商品关键词集合,能便于转化为词向量。
再将历史商品信息集合转化为与每一历史商品信息对应的商品关键词集合后,可通过Word2Vec模型(Word2Vec是从大量文本语料中以无监督的方式学习语义知识的一种模型)将商品关键词集合转化为与每一历史商品信息一一对应的词向量。
例如在语料库中,篮球、斯伯丁、XX型号各对应一个向量,向量中只有一个值为1,其余都为0,将上述信息对应的向量输入Word2Vec模型即可转化为低维度的连续值,也就是稠密向量,并且其中意思相近的词将被映射到向量空间中相近的位置。
在获取了商品关键词集合中各各商品关键词的词向量,再取各商品关键词的词向量平均值作为该商品的统计向量即可。此时即将历史商品信息集合中每一历史商品信息均转化为对应的统计向量,之后将通过DBSCAN聚类模型对商品关键词集合对应的统计向量进行聚类,可得到至少一个商品聚类簇。
DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是一个比较有代表性的基于密度的聚类算法。
DBSCAN需要二个参数:扫描半径(eps)和最小包含点数(minPts)。任选一个未被访问(unvisited)的点开始,找出与其距离在eps之内(包括eps)的所有附近点。
如果附近点的数量≥minPts,则当前点与其附近点形成一个簇,并且出发点被标记为已访问(visited)。然后递归,以相同的方法处理该簇内所有未被标记为已访问(visited)的点,从而对簇进行扩展。如果附近点的数量<minPts,则该点暂时被标记作为噪声点。如果簇充分地被扩展,即簇内的所有点被标记为已访问,然后用同样的算法去处理未被访问的点。
补全值获取单元120,用于若所述初始用户-评分矩阵中包括空白值,根据所述空白值所对应商品名称及该商品名称对应的商品聚类簇,得到空白值对应的商品加权评分。
在本实施例中,由于初始用户-评分矩阵中因部分用户没有对特定商品进行评分而保留空白值,因此这部分空白值将会基于商品内容进行预测用户评分以填补空白值。
在一实施例中,如图8所示,补全值获取单元120包括:
待预测向量获取单元121,用于根据所述空白值对应的商品名称,以获取与商品名称相应的统计向量;
聚类簇归属判断单元122,用于获取与商品名称相应的统计向量所归属的商品聚类簇;
相似商品结果获取单元123,用于根据与商品名称相应的统计向量所归属的商品聚类簇,获取与所述空白值对应的商品名称相应的相似商品名称,以作为相似商品结果;
相似商品评分获取单元124,用于根据所述空白值对应的行向量,获取与所述相似商品结果中每一商品名称对应的评分;
商品加权评分获取单元125,用于根据与所述相似商品结果中每一商品名称对应的评分进行加权平均,得到所述空白值对应的商品加权评分。
在本实施例中,由于确定了所述空白值在初始用户-评分矩阵中所归属的行向量后,即可知道是哪一用户针对哪一商品的商品评分是空白值,此时先获取所述空白值对应的商品名称即可知道该商品名称所对应的统计向量。然后判断该统计向量所归属的商品聚类簇,即可获取该商品聚类簇中其他商品的相似商品名称,以作为所述空白值对应的商品名称的相似商品结果。由于所述空白值在初始用户-评分矩阵中所归属的行向量中,可获知该用户针对相似商品结果中各相似商品名称的评分。最后根据该用户针对各相似商品名称的评分进行加权平均,得到所述空白值对应的商品加权评分。
在一实施例中,如图9所示,商品加权评分获取单元125包括:
向量距离集合获取单元1251,用于将所述相似商品结果中每一商品名称对应的统计向量作为统计向量组,将所述空白值对应商品名称相应的统计向量作为待预测商品评分向量,获取所述统计向量组中每一统计向量与待预测商品评分向量之间的距离,以得到向量距离集合;
商品加权总评分获取单元1252,用于将所述相似商品结果中每一商品名称对应评分乘以向量距离集合中对应的向量距离并求和,得到商品加权总评分;
平均分获取单元1253,用于将商品加权总评分除以向量距离集合中各向量距离之和,得到所述空白值对应的商品加权评分。
在本实施例中,若将所述统计向量组中每一统计向量与待预测商品评分向量之间的距离记为dck,将所述空白值所在行向量对应的用户对所述相似商品结果中每一商品名称对应评分记为Sic,通过如下公式计算得到所述空白值对应的商品加权评分:
其中,Scorek表示所述空白值对应商品k的商品加权评分,m为所述相似商品结果中相似商品c的总个数。
例如,用户1针对商品2的评分为空白值,而得到商品2对应的相似商品结果为商品4和商品5,且用户1针对商品4和商品5的评分分别为3和4,商品4对应的统计向量与商品2对应的统计向量之间的距离为0.5,商品5对应的统计向量与商品2对应的统计向量之间的距离为1,则:
Score2=(0.5*3+1*4)/(0.5+1)=11/3;
此时,将上述计算得到的Score2作为所述空白值对应的商品加权评分。
通过对新用户所缺少的商品评分,通过基于内容的预测方法,能有效的补全用户-评分矩阵,避免了推荐过程中冷启动的问题。
调整矩阵获取单元130,用于将所述空白值更新为对应的商品加权评分,得到调整后用户-评分矩阵。
在本实施例中,若将所述空白值更新为对应的商品加权评分,所述初始用户-评分矩阵中的空白值即可被补充为无空白值的调整后用户-评分矩阵,这样有效的解决了新用户缺少的商品评分的问题。而且空白值处所更新填充的商品加权分是依据近似商品的评分而得到,并非随机获取分值填充,该商品加权评分更具参考性。
相似用户聚类单元140,用于获取在所述调整后用户-评分矩阵选中的行向量对应的目标用户,根据目标用户对应的行向量与所述调整后用户-评分矩阵中其他行向量之间的皮尔逊相似度的排序结果,获取预设个数的行向量以作为相似用户聚类结果。
在本实施例中,若得到了无空白值的调整后用户-评分矩阵,即可以该调整后用户-评分矩阵作为相似用户分类的参考矩阵。例如,可先在调整后用户-评分矩阵中选定一个行向量作为目标用户,为了获取该目标用户的相似用户,可计算调整后用户-评分矩阵中其他行向量与目标用户的行向量之间的皮尔逊相似度。将多个计算结果进行降序排序后,可以与目标用户的行向量之间的皮尔逊相似度的大小选择排名位于预设排名阈值(预设排名阈值=预设个数+1)之前的行向量所对应用户作为相似用户,并由相似用户对应的行向量的集合作为相似用户聚类结果。通过计算与目标用户对应行向量的皮尔逊相似度,能快速筛选出相似用户并将相似用户所感兴趣的商品推送至目标用户。
计算任意两个行向量之间的皮尔逊相似度,可以通过以下公式进行计算:
其中,E表示数学期望;
ρX,Y的取值范围是(0,1),当ρX,Y越接近1表示两个行向量的相似程度越高,当ρX,Y越接近0表示两个行向量的相似程度越低。
推荐列表获取单元150,用于根据相似用户聚类结果中每一行向量和与每一行向量与对应的皮尔逊相似度,得到商品推荐行向量,由商品推荐行向量得到商品推荐列表,将所述商品推荐列表推送至目标用户对应的接收端。
在本实施例中,由于相似用户聚类结果中每一行向量对应的用户均对每一商品有对应的评分,从对各商品的评分高低可以看出对用户对各商品的推荐程度。相似用户聚类结果中若有行向量与目标用户的行向量的皮尔逊相似度越大,则表示该行向量对应的用户与目标用户对商品的喜好相同或近似,故该用户的对各商品的喜好程度更大程度上影响对目标用户的商品推荐结果。
当根据相似用户聚类结果中每一行向量和与每一行向量与对应的皮尔逊相似度,得到商品推荐行向量,在商品推荐行向量中对各商品的评分排位靠前的商品即可作为商品推荐列表的组成元素之一,这样通过商品推荐行向量得到的推荐商品由于充分考虑了近似用户的喜好,故能准确的反映目标用户的喜好。
在一实施例中,如图10所示,推荐列表获取单元150包括:
皮尔逊相似度集合获取单元151,用于获取所述相似用户聚类结果中每一相似用户对应的行向量与目标用户的行向量之间皮尔逊相似度,以得到皮尔逊相似度集合;
商品推荐行向量获取单元152,用于将皮尔逊相似度集合中每一皮尔逊相似乘以所述相似用户聚类结果中对应相似用户的行向量并求和,得到商品推荐行向量;
列表排序获取153,用于获取商品推荐行向量中各评分降序排序后评分排名小于预设排名阈值的评分所对应的商品名称,以组成商品推荐列表。
在本实施例中,当获取的所述相似用户聚类结果中包括N个行向量,分别记为User1~UserN,各行向量与目标用户之间的行向量之间的皮尔逊相似度分别记为Pearson1~PearsonN在计算所得到的商品推荐行向量中,即可获知所述相似用户聚类结果中用户对各商品的综合评分,以该综合评分中评分排名位于前M位(M等于预设排名阈值减一,如设置M=10)的评分所对应商品即可作为商品推荐列表的推荐项。通过上述基于皮尔逊相似度的计算,能将相似用户的商品喜好作为对目标用户推荐商品时所考虑的主要因素,能更合理的进行商品推荐。
该装置避免了仅采用协同过滤的推荐算法对新用户进行商品推荐时,因新用户缺少历史评分数据而导致冷启动的问题,解决了难以对新用户进行商品推荐的问题。
上述信息推送装置可以实现为计算机程序的形式,该计算机程序可以在如图11所示的计算机设备上运行。
请参阅图11,图11是本发明实施例提供的计算机设备的示意性框图。
参阅图11,该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。
该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时,可使得处理器502执行信息推送方法。
该处理器502用于提供计算和控制能力,支撑整个计算机设备500的运行。
该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行信息推送方法。
该网络接口505用于进行网络通信,如提供数据信息的传输等。本领域技术人员可以理解,图11中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现如下功能:获取初始用户-评分矩阵;若所述初始用户-评分矩阵中包括空白值,根据所述空白值所对应商品名称及该商品名称对应的商品聚类簇,得到空白值对应的商品加权评分;将所述空白值更新为对应的商品加权评分,得到调整后用户-评分矩阵;获取在所述调整后用户-评分矩阵选中的行向量对应的目标用户,根据目标用户对应的行向量与所述调整后用户-评分矩阵中其他行向量之间的皮尔逊相似度的排序结果,获取预设个数的行向量以作为相似用户聚类结果;以及根据相似用户聚类结果中每一行向量和与每一行向量与对应的皮尔逊相似度,得到商品推荐行向量,由商品推荐行向量得到商品推荐列表,将所述商品推荐列表推送至目标用户对应的接收端。
在一实施例中,处理器502在执行所述获取初始用户-评分矩阵的步骤之前,还执行如下操作:获取历史商品信息集合,通过词频-逆文本频率指数模型对所述历史商品信息集合中每一历史商品信息均进行关键词信息抽取,得到与每一历史商品信息对应的商品关键词集合;通过Word2Vec模型获取每一商品关键词集合中各商品关键词对应的词向量;获取每一商品关键词集合中各商品关键词所对应词向量的平均值,以得到与每一商品关键词集合对应的统计向量;通过DBSCAN聚类模型对商品关键词集合对应的统计向量进行聚类,得到至少一个商品聚类簇。
在一实施例中,处理器502在所述对根据所述空白值所对应商品名称及该商品名称对应的商品聚类簇,得到空白值对应的商品加权评分的步骤时,执行如下操作:根据所述空白值对应的商品名称,以获取与商品名称相应的统计向量;获取与商品名称相应的统计向量所归属的商品聚类簇;根据与商品名称相应的统计向量所归属的商品聚类簇,获取与所述空白值对应的商品名称相应的相似商品名称,以作为相似商品结果;根据所述空白值对应的行向量,获取与所述相似商品结果中每一商品名称对应的评分;根据与所述相似商品结果中每一商品名称对应的评分进行加权平均,得到所述空白值对应的商品加权评分。
在一实施例中,处理器502在执行所述根据与所述相似商品结果中每一商品名称对应的评分进行加权平均,得到所述空白值对应的商品加权评分的步骤时,执行如下操作:将所述相似商品结果中每一商品名称对应的统计向量作为统计向量组,将所述空白值对应商品名称相应的统计向量作为待预测商品评分向量,获取所述统计向量组中每一统计向量与待预测商品评分向量之间的距离,以得到向量距离集合;将所述相似商品结果中每一商品名称对应评分乘以向量距离集合中对应的向量距离并求和,得到商品加权总评分;将商品加权总评分除以向量距离集合中各向量距离之和,得到所述空白值对应的商品加权评分。
在一实施例中,处理器502在执行所述根据相似用户聚类结果中每一行向量和与每一行向量与对应的皮尔逊相似度,得到商品推荐行向量,由商品推荐行向量得到商品推荐列表的步骤时,执行如下操作:获取所述相似用户聚类结果中每一相似用户对应的行向量与目标用户的行向量之间皮尔逊相似度,以得到皮尔逊相似度集合;将皮尔逊相似度集合中每一皮尔逊相似乘以所述相似用户聚类结果中对应相似用户的行向量并求和,得到商品推荐行向量;获取商品推荐行向量中各评分降序排序后评分排名小于预设排名阈值的评分所对应的商品名称,以组成商品推荐列表。
本领域技术人员可以理解,图11中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定,在其他实施例中,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。例如,在一些实施例中,计算机设备可以仅包括存储器及处理器,在这样的实施例中,存储器及处理器的结构及功能与图11所示实施例一致,在此不再赘述。
应当理解,在本发明实施例中,处理器502可以是中央处理单元(CentralProcessing Unit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在本发明的另一实施例中提供计算机可读存储介质。该计算机可读存储介质可以为非易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序,其中计算机程序被处理器执行时实现以下步骤:获取初始用户-评分矩阵;若所述初始用户-评分矩阵中包括空白值,根据所述空白值所对应商品名称及该商品名称对应的商品聚类簇,得到空白值对应的商品加权评分;将所述空白值更新为对应的商品加权评分,得到调整后用户-评分矩阵;获取在所述调整后用户-评分矩阵选中的行向量对应的目标用户,根据目标用户对应的行向量与所述调整后用户-评分矩阵中其他行向量之间的皮尔逊相似度的排序结果,获取预设个数的行向量以作为相似用户聚类结果;以及根据相似用户聚类结果中每一行向量和与每一行向量与对应的皮尔逊相似度,得到商品推荐行向量,由商品推荐行向量得到商品推荐列表,将所述商品推荐列表推送至目标用户对应的接收端。
在一实施例中,所述获取初始用户-评分矩阵之前,还包括:获取历史商品信息集合,通过词频-逆文本频率指数模型对所述历史商品信息集合中每一历史商品信息均进行关键词信息抽取,得到与每一历史商品信息对应的商品关键词集合;通过Word2Vec模型获取每一商品关键词集合中各商品关键词对应的词向量;获取每一商品关键词集合中各商品关键词所对应词向量的平均值,以得到与每一商品关键词集合对应的统计向量;通过DBSCAN聚类模型对商品关键词集合对应的统计向量进行聚类,得到至少一个商品聚类簇。
在一实施例中,所述对根据所述空白值所对应商品名称及该商品名称对应的商品聚类簇,得到空白值对应的商品加权评分,包括:根据所述空白值对应的商品名称,以获取与商品名称相应的统计向量;获取与商品名称相应的统计向量所归属的商品聚类簇;根据与商品名称相应的统计向量所归属的商品聚类簇,获取与所述空白值对应的商品名称相应的相似商品名称,以作为相似商品结果;根据所述空白值对应的行向量,获取与所述相似商品结果中每一商品名称对应的评分;根据与所述相似商品结果中每一商品名称对应的评分进行加权平均,得到所述空白值对应的商品加权评分。
在一实施例中,所述根据与所述相似商品结果中每一商品名称对应的评分进行加权平均,得到所述空白值对应的商品加权评分,包括:将所述相似商品结果中每一商品名称对应的统计向量作为统计向量组,将所述空白值对应商品名称相应的统计向量作为待预测商品评分向量,获取所述统计向量组中每一统计向量与待预测商品评分向量之间的距离,以得到向量距离集合;将所述相似商品结果中每一商品名称对应评分乘以向量距离集合中对应的向量距离并求和,得到商品加权总评分;将商品加权总评分除以向量距离集合中各向量距离之和,得到所述空白值对应的商品加权评分。
在一实施例中,所述根据相似用户聚类结果中每一行向量和与每一行向量与对应的皮尔逊相似度,得到商品推荐行向量,由商品推荐行向量得到商品推荐列表,包括:获取所述相似用户聚类结果中每一相似用户对应的行向量与目标用户的行向量之间皮尔逊相似度,以得到皮尔逊相似度集合;将皮尔逊相似度集合中每一皮尔逊相似乘以所述相似用户聚类结果中对应相似用户的行向量并求和,得到商品推荐行向量;获取商品推荐行向量中各评分降序排序后评分排名小于预设排名阈值的评分所对应的商品名称,以组成商品推荐列表。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的设备、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为逻辑功能划分,实际实现时可以有另外的划分方式,也可以将具有相同功能的单元集合成一个单元,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种信息推送方法,其特征在于,包括:
获取初始用户-评分矩阵;
若所述初始用户-评分矩阵中包括空白值,根据所述空白值所对应商品名称及该商品名称对应的商品聚类簇,得到空白值对应的商品加权评分;
将所述空白值更新为对应的商品加权评分,得到调整后用户-评分矩阵;
获取在所述调整后用户-评分矩阵选中的行向量对应的目标用户,根据目标用户对应的行向量与所述调整后用户-评分矩阵中其他行向量之间的皮尔逊相似度的排序结果,获取预设个数的行向量以作为相似用户聚类结果;以及
根据相似用户聚类结果中每一行向量和与每一行向量与对应的皮尔逊相似度,得到商品推荐行向量,由商品推荐行向量得到商品推荐列表,将所述商品推荐列表推送至目标用户对应的接收端。
2.根据权利要求1所述的信息推送方法,其特征在于,所述获取初始用户-评分矩阵之前,还包括:
获取历史商品信息集合,通过词频-逆文本频率指数模型对所述历史商品信息集合中每一历史商品信息均进行关键词信息抽取,得到与每一历史商品信息对应的商品关键词集合;
通过Word2Vec模型获取每一商品关键词集合中各商品关键词对应的词向量;
获取每一商品关键词集合中各商品关键词所对应词向量的平均值,以得到与每一商品关键词集合对应的统计向量;
通过DBSCAN聚类模型对商品关键词集合对应的统计向量进行聚类,得到至少一个商品聚类簇。
3.根据权利要求2所述的信息推送方法,其特征在于,所述对根据所述空白值所对应商品名称及该商品名称对应的商品聚类簇,得到空白值对应的商品加权评分,包括:
根据所述空白值对应的商品名称,以获取与商品名称相应的统计向量;
获取与商品名称相应的统计向量所归属的商品聚类簇;
根据与商品名称相应的统计向量所归属的商品聚类簇,获取与所述空白值对应的商品名称相应的相似商品名称,以作为相似商品结果;
根据所述空白值对应的行向量,获取与所述相似商品结果中每一商品名称对应的评分;
根据与所述相似商品结果中每一商品名称对应的评分进行加权平均,得到所述空白值对应的商品加权评分。
4.根据权利要求3所述的信息推送方法,其特征在于,所述根据与所述相似商品结果中每一商品名称对应的评分进行加权平均,得到所述空白值对应的商品加权评分,包括:
将所述相似商品结果中每一商品名称对应的统计向量作为统计向量组,将所述空白值对应商品名称相应的统计向量作为待预测商品评分向量,获取所述统计向量组中每一统计向量与待预测商品评分向量之间的距离,以得到向量距离集合;
将所述相似商品结果中每一商品名称对应评分乘以向量距离集合中对应的向量距离并求和,得到商品加权总评分;
将商品加权总评分除以向量距离集合中各向量距离之和,得到所述空白值对应的商品加权评分。
5.根据权利要求1所述的信息推送方法,其特征在于,所述根据相似用户聚类结果中每一行向量和与每一行向量与对应的皮尔逊相似度,得到商品推荐行向量,由商品推荐行向量得到商品推荐列表,包括:
获取所述相似用户聚类结果中每一相似用户对应的行向量与目标用户的行向量之间皮尔逊相似度,以得到皮尔逊相似度集合;
将皮尔逊相似度集合中每一皮尔逊相似乘以所述相似用户聚类结果中对应相似用户的行向量并求和,得到商品推荐行向量;
获取商品推荐行向量中各评分降序排序后评分排名小于预设排名阈值的评分所对应的商品名称,以组成商品推荐列表。
6.一种信息推送装置,其特征在于,包括:
初始矩阵获取单元,用于获取初始用户-评分矩阵;
补全值获取单元,用于若所述初始用户-评分矩阵中包括空白值,根据所述空白值所对应商品名称及该商品名称对应的商品聚类簇,得到空白值对应的商品加权评分;
调整矩阵获取单元,用于将所述空白值更新为对应的商品加权评分,得到调整后用户-评分矩阵;
相似用户聚类单元,用于获取在所述调整后用户-评分矩阵选中的行向量对应的目标用户,根据目标用户对应的行向量与所述调整后用户-评分矩阵中其他行向量之间的皮尔逊相似度的排序结果,获取预设个数的行向量以作为相似用户聚类结果;
推荐列表获取单元,用于根据相似用户聚类结果中每一行向量和与每一行向量与对应的皮尔逊相似度,得到商品推荐行向量,由商品推荐行向量得到商品推荐列表,将所述商品推荐列表推送至目标用户对应的接收端。
7.根据权利要求6所述的信息推送装置,其特征在于,还包括:
历史关键词集合获取单元,用于获取历史商品信息集合,通过词频-逆文本频率指数模型对所述历史商品信息集合中每一历史商品信息均进行关键词信息抽取,得到与每一历史商品信息对应的商品关键词集合;
词向量转化单元,用于通过Word2Vec模型获取每一商品关键词集合中各商品关键词对应的词向量;
统计向量获取单元,用于获取每一商品关键词集合中各商品关键词所对应词向量的平均值,以得到与每一商品关键词集合对应的统计向量;
聚类单元,用于通过DBSCAN聚类模型对商品关键词集合对应的统计向量进行聚类,得到至少一个商品聚类簇。
8.根据权利要求7所述的信息推送装置,其特征在于,所述补全值获取单元,包括:
待预测向量获取单元,用于根据所述空白值对应的商品名称,以获取与商品名称相应的统计向量;
聚类簇归属判断单元,用于获取与商品名称相应的统计向量所归属的商品聚类簇;
相似商品结果获取单元,用于根据与商品名称相应的统计向量所归属的商品聚类簇,获取与所述空白值对应的商品名称相应的相似商品名称,以作为相似商品结果;
相似商品评分获取单元,用于根据所述空白值对应的行向量,获取与所述相似商品结果中每一商品名称对应的评分;
商品加权评分获取单元,用于根据与所述相似商品结果中每一商品名称对应的评分进行加权平均,得到所述空白值对应的商品加权评分。
9.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5中任一项所述的信息推送方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如权利要求1至5任一项所述的信息推送方法。
CN201811190462.9A 2018-10-12 2018-10-12 信息推送方法、装置、计算机设备及存储介质 Active CN109360057B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811190462.9A CN109360057B (zh) 2018-10-12 2018-10-12 信息推送方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811190462.9A CN109360057B (zh) 2018-10-12 2018-10-12 信息推送方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN109360057A true CN109360057A (zh) 2019-02-19
CN109360057B CN109360057B (zh) 2023-07-25

Family

ID=65349200

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811190462.9A Active CN109360057B (zh) 2018-10-12 2018-10-12 信息推送方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN109360057B (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109977299A (zh) * 2019-02-21 2019-07-05 西北大学 一种融合项目热度和专家系数的推荐算法
CN110222249A (zh) * 2019-05-06 2019-09-10 平安科技(深圳)有限公司 数据存储方法、装置、计算机设备及存储介质
CN110910215A (zh) * 2019-11-20 2020-03-24 深圳前海微众银行股份有限公司 产品推荐方法、装置、设备及计算机可读存储介质
CN110930259A (zh) * 2019-11-15 2020-03-27 安徽海汇金融投资集团有限公司 一种基于混合策略的债权推荐方法及系统
CN111737561A (zh) * 2019-06-20 2020-10-02 北京京东尚科信息技术有限公司 信息推送方法和推送系统
CN111753206A (zh) * 2020-06-29 2020-10-09 支付宝(杭州)信息技术有限公司 信息推送的方法和系统
CN111815403A (zh) * 2020-06-19 2020-10-23 北京石油化工学院 商品推荐方法、装置及终端设备
CN112084408A (zh) * 2020-09-08 2020-12-15 中国平安财产保险股份有限公司 名单数据筛选方法、装置、计算机设备及存储介质
CN112395487A (zh) * 2019-08-14 2021-02-23 腾讯科技(深圳)有限公司 信息推荐方法、装置、计算机可读存储介质及电子设备
CN113763134A (zh) * 2021-09-22 2021-12-07 携程旅游信息技术(上海)有限公司 信息推荐方法、系统、设备及存储介质
WO2022116422A1 (zh) * 2020-12-01 2022-06-09 平安科技(深圳)有限公司 产品推荐方法、装置、电子设备及计算机可读存储介质
CN115131108A (zh) * 2022-07-18 2022-09-30 浪潮卓数大数据产业发展有限公司 一种电商商品筛选系统
CN111552883B (zh) * 2020-05-13 2023-12-12 咪咕文化科技有限公司 内容推荐方法及计算机可读存储介质
CN118096324A (zh) * 2024-04-23 2024-05-28 成都帆点创想科技有限公司 推荐模型训练方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130151383A1 (en) * 2011-12-13 2013-06-13 Opera Solutions, Llc Recommender engine for collections treatment selection
CN103412948A (zh) * 2013-08-27 2013-11-27 北京交通大学 基于聚类的协同过滤的商品推荐方法及系统
WO2015192667A1 (zh) * 2014-06-16 2015-12-23 华为技术有限公司 推荐广告的方法及广告推荐服务器
CN106471491A (zh) * 2015-05-29 2017-03-01 深圳市汇游智慧旅游网络有限公司 一种时变的协同过滤推荐方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130151383A1 (en) * 2011-12-13 2013-06-13 Opera Solutions, Llc Recommender engine for collections treatment selection
CN103412948A (zh) * 2013-08-27 2013-11-27 北京交通大学 基于聚类的协同过滤的商品推荐方法及系统
WO2015192667A1 (zh) * 2014-06-16 2015-12-23 华为技术有限公司 推荐广告的方法及广告推荐服务器
CN106471491A (zh) * 2015-05-29 2017-03-01 深圳市汇游智慧旅游网络有限公司 一种时变的协同过滤推荐方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
周军军;王明文;何世柱;石松;: "基于随机游走和聚类平滑的协同过滤推荐算法", 广西师范大学学报(自然科学版), no. 01, pages 178 - 183 *
胡朝举;孙克逆;: "基于用户模糊聚类的个性化推荐研究", 软件导刊, no. 02, pages 35 - 38 *

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109977299B (zh) * 2019-02-21 2022-12-27 西北大学 一种融合项目热度和专家系数的推荐算法
CN109977299A (zh) * 2019-02-21 2019-07-05 西北大学 一种融合项目热度和专家系数的推荐算法
CN110222249A (zh) * 2019-05-06 2019-09-10 平安科技(深圳)有限公司 数据存储方法、装置、计算机设备及存储介质
CN110222249B (zh) * 2019-05-06 2024-05-31 平安科技(深圳)有限公司 数据存储方法、装置、计算机设备及存储介质
CN111737561A (zh) * 2019-06-20 2020-10-02 北京京东尚科信息技术有限公司 信息推送方法和推送系统
CN112395487A (zh) * 2019-08-14 2021-02-23 腾讯科技(深圳)有限公司 信息推荐方法、装置、计算机可读存储介质及电子设备
CN112395487B (zh) * 2019-08-14 2024-04-26 腾讯科技(深圳)有限公司 信息推荐方法、装置、计算机可读存储介质及电子设备
CN110930259A (zh) * 2019-11-15 2020-03-27 安徽海汇金融投资集团有限公司 一种基于混合策略的债权推荐方法及系统
CN110910215B (zh) * 2019-11-20 2024-08-13 深圳前海微众银行股份有限公司 产品推荐方法、装置、设备及计算机可读存储介质
CN110910215A (zh) * 2019-11-20 2020-03-24 深圳前海微众银行股份有限公司 产品推荐方法、装置、设备及计算机可读存储介质
CN111552883B (zh) * 2020-05-13 2023-12-12 咪咕文化科技有限公司 内容推荐方法及计算机可读存储介质
CN111815403A (zh) * 2020-06-19 2020-10-23 北京石油化工学院 商品推荐方法、装置及终端设备
CN111815403B (zh) * 2020-06-19 2024-05-10 北京石油化工学院 商品推荐方法、装置及终端设备
CN111753206A (zh) * 2020-06-29 2020-10-09 支付宝(杭州)信息技术有限公司 信息推送的方法和系统
CN111753206B (zh) * 2020-06-29 2024-06-14 支付宝(杭州)信息技术有限公司 信息推送的方法和系统
CN112084408B (zh) * 2020-09-08 2023-11-21 中国平安财产保险股份有限公司 名单数据筛选方法、装置、计算机设备及存储介质
CN112084408A (zh) * 2020-09-08 2020-12-15 中国平安财产保险股份有限公司 名单数据筛选方法、装置、计算机设备及存储介质
WO2022116422A1 (zh) * 2020-12-01 2022-06-09 平安科技(深圳)有限公司 产品推荐方法、装置、电子设备及计算机可读存储介质
CN113763134A (zh) * 2021-09-22 2021-12-07 携程旅游信息技术(上海)有限公司 信息推荐方法、系统、设备及存储介质
CN115131108A (zh) * 2022-07-18 2022-09-30 浪潮卓数大数据产业发展有限公司 一种电商商品筛选系统
CN118096324A (zh) * 2024-04-23 2024-05-28 成都帆点创想科技有限公司 推荐模型训练方法及装置

Also Published As

Publication number Publication date
CN109360057B (zh) 2023-07-25

Similar Documents

Publication Publication Date Title
CN109360057A (zh) 信息推送方法、装置、计算机设备及存储介质
CN109166017A (zh) 基于重聚类的推送方法、装置、计算机设备及存储介质
CN107451894B (zh) 数据处理方法、装置和计算机可读存储介质
CN109087177A (zh) 向目标用户推荐商品的方法、装置及计算机可读存储介质
US8332775B2 (en) Adaptive user feedback window
CN103886001A (zh) 一种个性化商品推荐系统
KR102125119B1 (ko) 데이터 핸들링 방법 및 장치
CN107423308B (zh) 主题推荐方法以及装置
CN110119474A (zh) 推荐模型训练方法、基于推荐模型的预测方法及装置
CN109064293A (zh) 商品推荐方法、装置、计算机设备及存储介质
CN109102371A (zh) 商品推荐方法、装置、计算机设备及存储介质
CN104331411B (zh) 推荐项目的方法和装置
CN107274242A (zh) 一种基于关联分析算法的商品推荐方法
CN105718184A (zh) 一种数据处理方法和装置
WO2011034475A1 (en) Method and apparatus for executing a recommendation
CN102411591A (zh) 一种信息处理的方法及设备
CN105468628B (zh) 一种排序方法及装置
CN109165975A (zh) 标签推荐方法、装置、计算机设备及存储介质
CN106897911A (zh) 一种基于用户和物品的自适应个性化推荐方法
CN110322318B (zh) 一种客户分群方法、装置及计算机存储介质
CN105654307A (zh) 基于用户反馈的商品推荐方法和系统
CN103942193B (zh) 一种信息推送的方法及装置
CA3059929A1 (en) Text searching method, apparatus, and non-transitory computer-readable storage medium
CN110852818A (zh) 商品排序方法、装置和计算机可读存储介质
CN107402961B (zh) 一种推荐方法及装置,电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant