CN110503506A - 基于评分数据的物品推荐方法、装置及介质 - Google Patents

基于评分数据的物品推荐方法、装置及介质 Download PDF

Info

Publication number
CN110503506A
CN110503506A CN201910605021.9A CN201910605021A CN110503506A CN 110503506 A CN110503506 A CN 110503506A CN 201910605021 A CN201910605021 A CN 201910605021A CN 110503506 A CN110503506 A CN 110503506A
Authority
CN
China
Prior art keywords
node
article
matrix
user
correlation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910605021.9A
Other languages
English (en)
Other versions
CN110503506B (zh
Inventor
王健宗
贾雪丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910605021.9A priority Critical patent/CN110503506B/zh
Publication of CN110503506A publication Critical patent/CN110503506A/zh
Application granted granted Critical
Publication of CN110503506B publication Critical patent/CN110503506B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Business, Economics & Management (AREA)
  • Mathematical Optimization (AREA)
  • Accounting & Taxation (AREA)
  • Pure & Applied Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Algebra (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及数据分析,提供一种基于评分数据的物品推荐方法,包括:采集用户对物品的评分构建用户物品二分图;基于用户物品二分图的所有节点得到第一相关矩阵;根据每个节点的相邻节点构成每个节点的相邻集合,从第一相关矩阵中提取相邻集合中任意两个节点组合的相关值,构成子相关矩阵,将子相关矩阵中非对角线元素均值的倒数作为每个节点的桥接值,构成桥接矩阵;将桥接矩阵与第一相关矩阵进行组合获得各节点的推荐指数构成的推荐矩阵;按照推荐指数由大到小的顺序对推荐矩阵中表示物品的节点进行排序,按照预设条件选取节点对应的物品作为推荐物品。本发明还提供一种电子装置及存储介质。本发明向用户推荐不拘泥于用户兴趣的相似物品。

Description

基于评分数据的物品推荐方法、装置及介质
技术领域
本发明涉及数据分析技术领域,更为具体地,涉及一种基于评分数据的物品推荐方法、装置及介质。
背景技术
在商业网站中,推荐系统占据着重要的地位。推荐系统可以帮助用户过滤掉大量不相关的信息,专注于他们想要的东西,同时也可以帮助企业增加销量。大多数推荐系统的推荐算法专注于提高推荐物品与用户偏好的精确度,但是这么做会让用户的视野越来越窄。让用户了解更多有用的东西也是一个推荐系统所需要的重要特性。这样的系统会达到一个双赢的效果,用户可以找到更多他们感兴趣的东西,企业也可以增加产品销量和用户满意度。
发明内容
鉴于上述问题,本发明的目的是提供一种向用户推荐不拘泥于用户兴趣的相似物品的基于评分数据的物品推荐方法、电子装置及存储介质。
为了实现上述目的,本发明提供一种电子装置,所述电子装置包括存储器和处理器,所述存储器中包括基于评分数据的物品推荐程序,所述基于评分数据的物品推荐程序被所述处理器执行时实现如下步骤:
步骤S1,采集用户对不同物品的评分数据,构建用户物品二分图,根据评分确定用户和物品的连接线权重;
步骤S2,基于所述用户物品二分图的所有节点得到第一相关矩阵,第一相关矩阵中的元素表示任意两节点之间的相关值;
步骤S3,根据每个节点的相邻节点构成每个节点的相邻集合,从第一相关矩阵中提取每个节点的相邻集合中任意两个节点组合的相关值,构成每个节点的子相关矩阵,将所述子相关矩阵中非对角线元素均值的倒数作为每个节点的桥接值,构成桥接矩阵;
步骤S4,将桥接矩阵与第一相关矩阵进行组合获得各节点的推荐指数,构成推荐矩阵,所述推荐指数与所述桥接值和所述相关值均为正相关关系;
步骤S5,按照推荐指数对推荐矩阵中的节点进行排序,按照预设条件选取节点对应的物品作为推荐物品。
此外,为了实现上述目的,本发明还提供一种基于评分数据的物品推荐方法,包括:
步骤S1,采集用户对不同物品的评分数据,构建用户物品二分图,根据评分确定用户和物品的连接线权重;
步骤S2,基于所述用户物品二分图的所有节点得到第一相关矩阵,第一相关矩阵中的元素表示任意两节点之间的相关值;
步骤S3,根据每个节点的相邻节点构成每个节点的相邻集合,从第一相关矩阵中提取每个节点的相邻集合中任意两个节点组合的相关值,构成每个节点的子相关矩阵,将所述子相关矩阵中非对角线元素均值的倒数作为每个节点的桥接值,构成桥接矩阵;
步骤S4,将桥接矩阵与第一相关矩阵进行组合获得各节点的推荐指数,构成推荐矩阵,所述推荐指数与所述桥接值和所述相关值均为正相关关系;
步骤S5,按照推荐指数对推荐矩阵中的节点进行排序,按照预设条件选取节点对应的物品作为推荐物品。
优选地,步骤S4之后,所述方法还包括:
将被推荐用户的节点的桥接值与第一相关矩阵中所述节点的相关向量进行组合获得被推荐用户的节点与各节点的推荐指数构成的推荐向量;
按照推荐指数由大到小的顺序对推荐向量中表示物品的节点进行排序,根据推荐的需求数量,将排序前所述需求数量的物品作为推荐物品。
此外,优选地,步骤S2之后,所述方法还包括:
获得所述用户物品二分图的节点之间的第一相关矩阵和第二相关矩阵,其中,第二相关矩阵中的元素表示一个用户与一个物品之间的相关值;
获得表示用户的节点的桥接值构成的用户桥接矩阵;
将用户桥接矩阵与第二相关矩阵组合得到推荐矩阵。
此外,优选地,步骤S2之后,所述方法还包括:
获得所述用户物品二分图的节点之间的第一相关矩阵和第二相关矩阵,其中,第二相关矩阵中的元素表示一个用户与一个物品之间的相关值;
将被推荐用户的节点的桥接值与第二相关矩阵进行组合获得推荐矩阵。
此外,优选地,步骤S2之后,所述方法还包括:
获得所述用户物品二分图的节点之间的第一相关矩阵和第二相关矩阵,其中,第二相关矩阵中的元素表示一个用户与一个物品之间的相关值;
将被推荐用户的节点的桥接值与第二相关矩阵中所述节点的相关向量进行组合获得被推荐用户的节点与各节点的推荐指数构成的推荐向量;
按照推荐指数由大到小的顺序对推荐向量中表示物品的节点进行排序,按照预设条件选取被推荐用户的节点对应的物品作为推荐物品。
优选地,所述步骤S5包括:
对物品进行聚类,得到各物品所属物品组;
采用相似度度量方法分析各用户对各物品组的相似度,获得符合用户偏好的设定数量的物品组;
将按照预设条件选取的物品中不属于所述符合用户偏好的物品组的物品优先推荐给用户。
此外,优选地,所述步骤S5包括:
根据用户对商品的评分,采用聚类方法对用户进行分群;
每个用户群中各用户偏好的物品的集合构成所述用户群的物品集合;
将按照预设条件选取的物品中不属于所述用户群的物品集合的物品有限推荐给用户。
优选地,在步骤S2中,采用随机游走重启的方法获得各节点之间的相关值,包括:根据用户对物品的评分,确定各节点之间的相似度;以一个节点为出发节点,将所述一个节点与其他节点的相似度组成的向量作为重启向量,计算二分图上各个节点之间的迁移概率;将所述节点之间的迁移概率组成邻接矩阵;对邻接矩阵进行迭代处理,直到邻接矩阵收敛,所述收敛后的邻接矩阵矩阵中元素为所述一个节点与一个其他节点的两者之间的相关值。
此外,为了实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中包括基于评分数据的物品推荐程序,所述基于评分数据的物品推荐程序被处理器执行时,实现上述的基于评分数据的物品推荐方法的步骤。
本发明所述基于评分数据的物品推荐方法、电子装置及计算机可读存储介质通过平衡相关值和桥接值来向用户推荐一个和他之前所感兴趣的相关但是又与另外的领域相连的新物品,相关值体现了一个物品与用户连接的紧密度,桥接值反应的是在某一类中的某个物品与其他类的相关度,综合考虑了这两个值,可以推荐出不拘泥于用户兴趣的相似物品。
附图说明
图1是本发明基于评分数据的物品推荐方法较佳实施例的应用环境示意图;
图2是图1中基于评分数据的物品推荐程序较佳实施例的模块示意图;
图3是本发明基于评分数据的物品推荐方法较佳实施例的流程图;
图4是本发明用户-物品二分图的局部示意图。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
以下将结合附图对本发明的具体实施例进行详细描述。
本发明提供一种基于评分数据的物品推荐方法,应用于一种电子装置1。参照图1所示,为本发明基于评分数据的物品推荐方法较佳实施例的应用环境示意图。
在本实施例中,电子装置1可以是服务器、手机、平板电脑、便携计算机、桌上型计算机等具有运算功能的终端客户端。
存储器11包括至少一种类型的可读存储介质。所述至少一种类型的可读存储介质可为如闪存、硬盘、多媒体卡、卡型存储器等的非易失性存储介质。在一些实施例中,所述可读存储介质可以是所述电子装置1的内部存储单元,例如该电子装置1的硬盘。在另一些实施例中,所述可读存储介质也可以是所述电子装置1的外部存储器,例如所述电子装置1上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
在本实施例中,所述存储器11的可读存储介质通常用于存储安装于所述电子装置1的基于评分数据的物品推荐程序10等。所述存储器11还可以用于暂时地存储已经输出或者将要输出的数据。
处理器12在一些实施例中可以是一中央处理器(Central Processing Unit,CPU),微处理器或其他数据处理芯片,用于运行存储器11中存储的程序代码或处理数据,例如执行基于评分数据的物品推荐程序10等。
网络接口13可选地可以包括标准的有线接口、无线接口(如WI-FI接口),通常用于在该电子装置1与其他电子客户端之间建立通信连接。
通信总线14用于实现这些组件之间的连接通信。
图1仅示出了具有组件11-14的电子装置1,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
可选地,该电子装置1还可以包括用户接口,用户接口可以包括输入单元比如键盘(Keyboard)、语音输入装置比如麦克风(microphone)等具有语音识别功能的客户端、语音输出装置比如音响、耳机等,可选地用户接口还可以包括标准的有线接口、无线接口。
可选地,该电子装置1还可以包括显示器,显示器也可以称为显示屏或显示单元。
在一些实施例中可以是LED显示器、液晶显示器、触控式液晶显示器以及有机发光二极管(Organic Light-Emitting Diode,OLED)触摸器等。显示器用于显示在电子装置1中处理的信息以及用于显示可视化的用户界面。
可选地,该电子装置1还包括触摸传感器。所述触摸传感器所提供的供用户进行触摸操作的区域称为触控区域。此外,这里所述的触摸传感器可以为电阻式触摸传感器、电容式触摸传感器等。而且,所述触摸传感器不仅包括接触式的触摸传感器,也可包括接近式的触摸传感器等。此外,所述触摸传感器可以为单个传感器,也可以为例如阵列布置的多个传感器。
可选地,该电子装置1还可以包括逻辑门电路,传感器、音频电路等等,在此不再赘述。
在图1所示的装置实施例中,作为一种计算机存储介质的存储器11中可以包括操作系统以及基于评分数据的物品推荐程序10;处理器12执行存储器11中存储的基于评分数据的物品推荐程序10时实现如下步骤:
步骤S1,采集用户对不同物品的评分数据,构建用户物品二分图,根据评分确定用户和物品的连接线权重;
步骤S2,基于所述用户物品二分图的所有节点得到第一相关矩阵,第一相关矩阵中的元素表示任意两节点之间的相关值;
步骤S3,根据每个节点的相邻节点构成每个节点的相邻集合,从第一相关矩阵中提取每个节点的相邻集合中任意两个节点组合的相关值,构成每个节点的子相关矩阵,将所述子相关矩阵中非对角线元素均值的倒数作为每个节点的桥接值,构成桥接矩阵;
步骤S4,将桥接矩阵与第一相关矩阵进行组合获得各节点的推荐指数,构成推荐矩阵,所述推荐指数与所述桥接值和所述相关值均为正相关关系;
步骤S5,按照推荐指数对推荐矩阵中的节点进行排序,按照预设条件选取节点对应的物品作为推荐物品用户物品图。
在其他实施例中,所述基于评分数据的物品推荐程序10还可以被分割为一个或者多个模块,一个或者多个模块被存储于存储器11中,并由处理器12执行,以完成本发明。本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段。参照图2所示,为图1中基于评分数据的物品推荐程序10较佳实施例的功能模块图。所述基于评分数据的物品推荐程序10可以被分割为:
采集模块110,采集用户对物品的评分;
二分图构建模块120,构建用户-物品二分图,根据评分高低确定用户和物品连接线的权重,评分越高所述连接线的权重越大;
第一相关矩阵构建模块130,基于所述用户物品二分图的所有节点得到第一相关矩阵,第一相关矩阵中的元素表示任意两节点之间的相关值;
桥接矩阵构建模块140,从用户物品图中获得每个节点的相邻节点构成每个节点的相邻集合,从第一相关矩阵中提取每个节点的相邻集合中任意两个节点组合的相关值,构成每个节点的子相关矩阵,将每个子相关矩阵中非对角线元素均值的倒数作为每个节点的桥接值,构成桥接矩阵;
推荐矩阵构建模块150,将桥接矩阵与第一相关矩阵进行组合获得各节点的推荐指数构成的推荐矩阵,所述组合使得桥接值越大推荐指数越大,相关值越大推荐指数越大;
推荐模块160,按照推荐指数由大到小的顺序对推荐矩阵中表示物品的节点进行排序,按照预设条件选取节点对应的物品作为推荐物品。
上述电子装置通过平衡相关值和桥接值来向用户推荐一个和他之前所感兴趣的相关但是又与另外的领域相连的新物品,以此来让用户惊喜并且可能拓宽用户的兴趣。
此外,本发明还提供一种基于评分数据的物品推荐方法。参照图3所示,为本发明基于评分数据的物品推荐方法较佳实施例的流程图。该方法可以由一个装置执行,该装置可以由软件和/或硬件实现。
在本实施例中,基于评分数据的物品推荐方法包括:
步骤S1,采集用户对物品的评分,构建用户-物品二分图,根据评分高低确定用户和物品连接线的权重,评分越高所述连接线的权重越大,例如,用户和物品分别在一边,每一个用户和他打过分的物品相连接,连线边的权重与评分高低相关;
步骤S2,基于所述用户物品二分图的所有节点得到第一相关矩阵,第一相关矩阵中的元素表示任意两节点之间的相关值Q=[q1,q2,q3…qn]
W=[w1,w2,w3…wm]
其中,Q为用户矩阵,W为物品矩阵,n为用户总数,m为物品总数,R为第一相关矩阵,rm+n1为第m+n节点与第1节点之间的相关值,为第m+n节点与其他节点之间的相关值构成的相关向量;
步骤S3,从用户物品图中获得每个节点的相邻节点构成每个节点的相邻集合S,从第一相关矩阵R中提取每个节点的相邻集合S中任意两个节点组合的相关值,构成每个节点的子相关矩阵,将每个子相关矩阵中非对角线元素均值的倒数作为每个节点的桥接值,构成桥接矩阵,例如,如图4所示,用户1和用户3对物品2和物品4评分构成用户-物品二分图,得到第一相关矩阵
当用户1的相邻的节点为物品2和物品4时,物品2和物品4构成用户1的相邻集合,从相关矩阵R中提取相邻集合对应的子相关矩阵之后算出非对角线元素均值的倒数即为用户1(节点1)的桥接值;
步骤S4,将桥接矩阵与第一相关矩阵进行组合获得各节点的推荐指数构成的推荐矩阵,桥接值和相关值组合的方法有多种,比如线性组合,优选地,将桥接值和相关值相乘作为推荐指数,如上例中,各节点的桥接值组成的桥接矩阵B=[b1,b2,b3…bm+n],与第一相关矩阵的乘积得到推荐矩阵T=[t1,t2,t3…tm+n],其中,bm+n为第m+n节点的桥接值,tm+n为第m+n节点的推荐指数;
步骤S5,按照推荐指数由大到小的顺序对推荐矩阵中表示物品的节点进行排序,按照预设条件选取节点对应的物品作为推荐物品,例如,根据推荐的需求数量,将排序前所述需求数量的物品作为推荐物品。
上述基于评分数据的物品推荐方法首先通过数据收集获得用户在购买商品时对物品的打分,然后根据这些评分数据建立一个推荐模型,当用户有需要推荐的请求时,根据之前建立的推荐模型给不同物品和当前需要推荐的用户计算出一个推荐指数,最终推荐指数最高的物品将会被推荐给该用户。
上述基于评分数据的物品推荐方法使用了相关值与桥接值相结合的方法来建立推荐模型。该模型基于二分图模型,用户和物品分别在一边,同时也被分为很多类,每一个用户和他打过分的物品相连接,连线边的权重与评分高低相关。在这里,相关值体现了一个物品与用户连接的紧密度。桥接值反应的是在某一中的某个物品与其他类的相关度,比如一个A类物品与B类的用户相连,那么它的桥接值就会较高。上述基于评分数据的物品推荐方法,综合考虑了这两个值,这样可以推荐出不拘泥于用户兴趣的相似物品。
另外,上述基于评分数据的物品推荐方法不局限于被推荐用户对物品的偏好,是通过所有用户对所有物品的偏好得到的推荐物品,能够阔大用户视野,实现用户为评分物品的推荐,让用户了解更多的物品。
在一个可选实施例中,在步骤S4中,将被推荐用户的节点的桥接值与第一相关矩阵中所述节点的相关向量进行组合获得被推荐用户的节点与各节点的推荐指数构成的推荐向量。此时步骤S5,按照推荐指数由大到小的顺序对推荐向量中表示物品的节点进行排序,根据推荐的需求数量,将排序前所述需求数量的物品作为推荐物品,例如,被推荐用户在用户物品图中为第1节点,则推荐向量
在另一个可选实施例中,在步骤S2中,获得所述用户-物品二分图的节点之间的第一相关矩阵和第二相关矩阵,其中,第二相关矩阵中的元素表示一个用户与一个物品之间的相关值,例如
其中,rwnm为用户qn与物品wm之间的相关值,为用户qn与各物品之间的相关值构成的相关向量,R'为第二相关矩阵;
在步骤S3中,获得表示用户的节点的桥接值构成的用户桥接矩阵;
在步骤S4中,将用户桥接矩阵与第二相关矩阵组合(例如相乘)得到推荐矩阵;
在步骤S5中,按照推荐指数由大到小的顺序对推荐矩阵中元素进行排序,根据推荐的需求数量,将排序前所述需求数量的物品作为推荐物品。
在第三个可选实施例中,在步骤S2中,获得所述用户-物品二分图的节点之间的第一相关矩阵和第二相关矩阵,其中,第二相关矩阵中的元素表示一个用户与一个物品之间的相关值,例如
其中,rwnm为用户qn与物品wm之间的相关值,为用户qn与各物品之间的相关值构成的相关向量,R'为第二相关矩阵;
在步骤S4中,将被推荐用户的节点的桥接值与第二相关矩阵进行组合(例如,相乘)获得推荐矩阵;
在步骤S5中,按照推荐指数由大到小的顺序对推荐矩阵中元素进行排序,根据推荐的需求数量,将排序前所述需求数量的物品作为被推荐用户的推荐物品。
在第四可选实施例中,在步骤S2中,获得所述用户-物品二分图的节点之间的第一相关矩阵和第二相关矩阵,其中,第二相关矩阵中的元素表示一个用户与一个物品之间的相关值,例如
其中,rwnm为用户qn与物品wm之间的相关值,为用户qn与各物品之间的相关值构成的相关向量,R'为第二相关矩阵;
在步骤S4中,将被推荐用户的节点的桥接值与第二相关矩阵中所述节点的相关向量进行组合获得被推荐用户的节点与各节点的推荐指数构成的推荐向量,例如,被推荐用户在用户物品图中为第1节点,则推荐向量
在步骤S5,按照推荐指数由大到小的顺序对推荐向量中表示物品的节点进行排序,按照预设条件选取被推荐用户的节点对应的物品作为推荐物品,例如,根据推荐的需求数量,将排序前所述需求数量的物品作为推荐物品。
上述各实施例的步骤S2中,获得各节点之间相关值的的方法有很多,例如、余弦相似度、欧式距离、皮尔逊相关性、斯皮尔曼等级相关系数、平均平方差异(MSD)、Jaccard距离和Dice系数等。优选地,采用随机游走重启的方法获得各节点之间的相关值,随机游走模型(RWR,Random walk with restart)的算法是以一定的概率随机选择与该顶点相邻的边,沿这条边移动到下个顶点,或以一定的返回概率返回到出发点。对于一个非周期不可约的图,经过有限次随机游走过程,到达图中每一个顶点的概率值达到平稳分布,再次迭代也不会改变图中的概率分布值,此时,图中每个点的概率值可以看成该点与出发点的相关程度。
在一个可选实施例中,所述采用随机游走重启的方法获得各节点之间的相关值的方法包括:
当前需要被推荐的用户qi,作为初始起点,用户qi与各个物品之间的相关向量可以由公式(1)迭代算出:
其中,每次迭代时,都有概率c返回开始节点,1-c的概率移动到相邻节点。其中是标准化之后的邻接矩阵,经过多次迭代(例如邻接矩阵收敛)之后,会趋于稳定,这时的结果为用户qi的相关向量,为第i个元素为1,其他元素为0的向量;
从公式(1)中可以推导出:
在另一个可选实施例中,步骤S2中,采用随机游走重启的方法获得各节点之间的相关值,包括:
根据用户对物品的评分,确定各节点之间的相似度;
以一个节点(优选地,为被推荐用户对应的节点)为出发节点,将所述一个节点与其他节点的相似度组成的向量作为重启向量,计算二分图上各个节点之间的迁移概率;
将所述节点之间的迁移概率组成邻接矩阵;
对邻接矩阵进行迭代处理,直到邻接矩阵收敛,所述收敛后的邻接矩阵矩阵中元素为所述一个节点与一个其他节点的两者之间的相关值。
在本发明的一个实施例中,步骤S5包括:
对物品进行聚类,得到各物品所属物品组,例如采用PCA分析方法获得物品的特征向量,采用聚类方法(例如kmeans,层次聚类等)对物品进行聚类;又如,对物品采用多维特征向量进行描述,采用kmodes对为物品进行聚类;
分析各用户对各物品组的相似度,获得符合用户偏好的设定数量的物品组,例如,物品组的各物品的特征向量构成物品的特征矩阵,用户对物品的评分或用户节点对物品节点的相关值构成用户偏好矩阵,采用相似度度量方法确定用户对物品组的相似度,优选地,采用余弦相似度的方法得到所述相似度
其中,sm,n表示第m个用户与第n个物品组的相似度,(y1,y2,…,yb)为第n个物品组特征向量,(x1,x2,…,xb)为第m个用户对所述物品组中的物品的偏好向量,例如,一个物品组b包括第一个物品和第三个物品,物品组的特征向量为(w1,w3),对应的第a个用户的偏好向量(评分或相关组成的偏好向量)为
将按照预设条件选取的物品中不属于所述符合用户偏好的物品组的物品优先推荐给用户。
上述基于评分数据的物品推荐方法对物品进行了分组,通过桥接值和相关值,向用户推荐不拘泥用户兴趣偏好的物品,拓展用户的兴趣。
在本发明的另一个实施例中,步骤S5包括:
采用聚类方法对用户进行分群,例如可以根据用户对物品的评分构建用户对物品的偏好矩阵,采用k-means、层次聚类等聚类方法对用户进行分无奈,又如,采用通过二分图得到的用户与物品的相关值构建用户对物品的偏好矩阵,然后采用聚类方法对用户进行分群;
每个用户群中各用户偏好的物品的集合构成所述用户群的物品集合;
将按照预设条件选取的物品中不属于所述用户群的物品集合的物品有限推荐给用户。
上述对用户进行了分群,使得用户的偏好更加准确,且根据分群结果构建了符合用户兴趣偏好的物品集合,通过桥接值和相关值得到推荐指数,向用户推荐用户未接触可能感兴趣的物品,让用户惊喜,拓展用户兴趣。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质中包括基于评分数据的物品推荐程序,所述基于评分数据的物品推荐程序被处理器执行时实现如下步骤:
步骤S1,采集用户对不同物品的评分数据,构建用户物品二分图,根据评分确定用户和物品的连接线权重;
步骤S2,基于所述用户物品二分图的所有节点得到第一相关矩阵,第一相关矩阵中的元素表示任意两节点之间的相关值;
步骤S3,根据每个节点的相邻节点构成每个节点的相邻集合,从第一相关矩阵中提取每个节点的相邻集合中任意两个节点组合的相关值,构成每个节点的子相关矩阵,将所述子相关矩阵中非对角线元素均值的倒数作为每个节点的桥接值,构成桥接矩阵;
步骤S4,将桥接矩阵与第一相关矩阵进行组合获得各节点的推荐指数,构成推荐矩阵,所述推荐指数与所述桥接值和所述相关值均为正相关关系;
步骤S5,按照推荐指数对推荐矩阵中的节点进行排序,按照预设条件选取节点对应的物品作为推荐物品。
本发明之计算机可读存储介质的具体实施方式与上述基于评分数据的物品推荐方法、电子装置的具体实施方式大致相同,在此不再赘述。
上述基于评分数据的物品推荐方法、电子装置及计算机可读存储介质不仅考虑了推荐物品与用户偏好的相关值还考虑了用户对其他物品的相关度的桥接值,使得用户的视野越来越宽,让用户了解更多的东西,使得用户可以不经过搜索找到更多感兴趣的物品,所述物品相关的企业也可以增加物品的销量和用户满意度,达到双赢的效果。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端客户端(可以是手机,计算机,服务器,或者网络客户端等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种基于评分数据的物品推荐方法,其特征在于,包括:
步骤S1,采集用户对不同物品的评分数据,构建用户物品二分图,根据评分确定用户和物品的连接线权重;
步骤S2,基于所述用户物品二分图的所有节点得到第一相关矩阵,第一相关矩阵中的元素表示任意两节点之间的相关值;
步骤S3,根据每个节点的相邻节点构成每个节点的相邻集合,从第一相关矩阵中提取每个节点的相邻集合中任意两个节点组合的相关值,构成每个节点的子相关矩阵,将所述子相关矩阵中非对角线元素均值的倒数作为每个节点的桥接值,构成桥接矩阵;
步骤S4,将桥接矩阵与第一相关矩阵进行组合获得各节点的推荐指数,构成推荐矩阵,所述推荐指数与所述桥接值和所述相关值均为正相关关系;
步骤S5,按照推荐指数对推荐矩阵中的节点进行排序,按照预设条件选取节点对应的物品作为推荐物品。
2.根据权利要求1所述的基于评分数据的物品推荐方法,其特征在于,步骤S4之后,所述方法还包括:
将被推荐用户的节点的桥接值与第一相关矩阵中所述节点的相关向量进行组合获得被推荐用户的节点与各节点的推荐指数构成的推荐向量;
按照推荐指数由大到小的顺序对推荐向量中表示物品的节点进行排序,根据推荐的需求数量,将排序前所述需求数量的物品作为推荐物品。
3.根据权利要求1所述的基于评分数据的物品推荐方法,其特征在于,步骤S2之后,所述方法还包括:
获得所述用户物品二分图的节点之间的第一相关矩阵和第二相关矩阵,其中,第二相关矩阵中的元素表示一个用户与一个物品之间的相关值;
获得表示用户的节点的桥接值构成的用户桥接矩阵;
将用户桥接矩阵与第二相关矩阵组合得到推荐矩阵。
4.根据权利要求1所述的基于评分数据的物品推荐方法,其特征在于,步骤S2之后,所述方法还包括:
获得所述用户物品二分图的节点之间的第一相关矩阵和第二相关矩阵,其中,第二相关矩阵中的元素表示一个用户与一个物品之间的相关值;
将被推荐用户的节点的桥接值与第二相关矩阵进行组合获得推荐矩阵。
5.根据权利要求1所述的基于评分数据的物品推荐方法,其特征在于,步骤S2之后,所述方法还包括:
获得所述用户物品二分图的节点之间的第一相关矩阵和第二相关矩阵,其中,第二相关矩阵中的元素表示一个用户与一个物品之间的相关值;
将被推荐用户的节点的桥接值与第二相关矩阵中所述节点的相关向量进行组合获得被推荐用户的节点与各节点的推荐指数构成的推荐向量;
按照推荐指数由大到小的顺序对推荐向量中表示物品的节点进行排序,按照预设条件选取被推荐用户的节点对应的物品作为推荐物品。
6.根据权利要求1所述的基于评分数据的物品推荐方法,其特征在于,所述步骤S5包括:
对物品进行聚类,得到各物品所属物品组;
采用相似度度量方法分析各用户对各物品组的相似度,获得符合用户偏好的设定数量的物品组;
将按照预设条件选取的物品中不属于所述符合用户偏好的物品组的物品优先推荐给用户。
7.根据权利要求1所述的基于评分数据的物品推荐方法,其特征在于,所述步骤S5包括:
根据用户对商品的评分,采用聚类方法对用户进行分群;
每个用户群中各用户偏好的物品的集合构成所述用户群的物品集合;
将按照预设条件选取的物品中不属于所述用户群的物品集合的物品有限推荐给用户。
8.根据权利要求1所述的基于评分数据的物品推荐方法,其特征在于,在步骤S2中,采用随机游走重启的方法获得各节点之间的相关值,包括:
根据用户对物品的评分,确定各节点之间的相似度;
以一个节点为出发节点,将所述一个节点与其他节点的相似度组成的向量作为重启向量,计算二分图上各个节点之间的迁移概率;
将所述节点之间的迁移概率组成邻接矩阵;
对邻接矩阵进行迭代处理,直到邻接矩阵收敛,所述收敛后的邻接矩阵矩阵中元素为所述一个节点与一个其他节点的两者之间的相关值。
9.一种电子装置,其特征在于,包括存储器和处理器,所述存储器中存储有基于评分数据的物品推荐程序,所述基于评分数据的物品推荐程序被所述处理器执行时实现如下步骤:
步骤S1,采集用户对不同物品的评分数据,构建用户物品二分图,根据评分确定用户和物品的连接线权重;
步骤S2,基于所述用户物品二分图的所有节点得到第一相关矩阵,第一相关矩阵中的元素表示任意两节点之间的相关值;
步骤S3,根据每个节点的相邻节点构成每个节点的相邻集合,从第一相关矩阵中提取每个节点的相邻集合中任意两个节点组合的相关值,构成每个节点的子相关矩阵,将所述子相关矩阵中非对角线元素均值的倒数作为每个节点的桥接值,构成桥接矩阵;
步骤S4,将桥接矩阵与第一相关矩阵进行组合获得各节点的推荐指数,构成推荐矩阵,所述推荐指数与所述桥接值和所述相关值均为正相关关系;
步骤S5,按照推荐指数对推荐矩阵中的节点进行排序,按照预设条件选取节点对应的物品作为推荐物品。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中包括有基于评分数据的物品推荐程序,所述基于评分数据的物品推荐程序被处理器执行时,实现如权利要求1至8中任一项权利要求所述基于评分数据的物品推荐方法的步骤。
CN201910605021.9A 2019-07-05 2019-07-05 基于评分数据的物品推荐方法、装置及介质 Active CN110503506B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910605021.9A CN110503506B (zh) 2019-07-05 2019-07-05 基于评分数据的物品推荐方法、装置及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910605021.9A CN110503506B (zh) 2019-07-05 2019-07-05 基于评分数据的物品推荐方法、装置及介质

Publications (2)

Publication Number Publication Date
CN110503506A true CN110503506A (zh) 2019-11-26
CN110503506B CN110503506B (zh) 2022-07-08

Family

ID=68586081

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910605021.9A Active CN110503506B (zh) 2019-07-05 2019-07-05 基于评分数据的物品推荐方法、装置及介质

Country Status (1)

Country Link
CN (1) CN110503506B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111047410A (zh) * 2019-12-16 2020-04-21 腾讯科技(深圳)有限公司 推荐方法、装置、终端设备以及存储介质
CN111104606A (zh) * 2019-12-06 2020-05-05 成都理工大学 一种基于权重的条件游走图推荐方法
CN111144976A (zh) * 2019-12-10 2020-05-12 支付宝(杭州)信息技术有限公司 推荐模型的训练方法及装置
CN111291904A (zh) * 2020-02-06 2020-06-16 腾讯科技(深圳)有限公司 偏好预测方法、装置及计算机设备
CN111523048A (zh) * 2020-04-15 2020-08-11 达而观信息科技(上海)有限公司 社交网络中好友的推荐方法、装置、存储介质及终端
CN111859155A (zh) * 2020-08-04 2020-10-30 深圳前海微众银行股份有限公司 物品推荐方法、设备及计算机可读存储介质
WO2021208695A1 (zh) * 2020-11-19 2021-10-21 平安科技(深圳)有限公司 目标物推荐方法、装置、电子设备及计算机可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130018755A1 (en) * 2011-05-18 2013-01-17 Alibaba Group Holding Limited Method and System of Recommending Items
CN103778145A (zh) * 2012-10-22 2014-05-07 中国移动通信集团广东有限公司 一种信息推荐方法和系统
CN107317704A (zh) * 2017-06-22 2017-11-03 西京学院 一种基于紧密度和结构洞的复杂网络重要节点排序方法
WO2018079939A1 (ko) * 2016-10-31 2018-05-03 에스케이플래닛 주식회사 카테고리 추천을 이용한 비로그인 사용자 메인 상품 추천 서버 및 방법
CN108960966A (zh) * 2018-06-07 2018-12-07 重庆邮电大学 一种基于用户偏好的矩阵分解推荐方法
CN109166017A (zh) * 2018-10-12 2019-01-08 平安科技(深圳)有限公司 基于重聚类的推送方法、装置、计算机设备及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130018755A1 (en) * 2011-05-18 2013-01-17 Alibaba Group Holding Limited Method and System of Recommending Items
CN103778145A (zh) * 2012-10-22 2014-05-07 中国移动通信集团广东有限公司 一种信息推荐方法和系统
WO2018079939A1 (ko) * 2016-10-31 2018-05-03 에스케이플래닛 주식회사 카테고리 추천을 이용한 비로그인 사용자 메인 상품 추천 서버 및 방법
CN107317704A (zh) * 2017-06-22 2017-11-03 西京学院 一种基于紧密度和结构洞的复杂网络重要节点排序方法
CN108960966A (zh) * 2018-06-07 2018-12-07 重庆邮电大学 一种基于用户偏好的矩阵分解推荐方法
CN109166017A (zh) * 2018-10-12 2019-01-08 平安科技(深圳)有限公司 基于重聚类的推送方法、装置、计算机设备及存储介质

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111104606A (zh) * 2019-12-06 2020-05-05 成都理工大学 一种基于权重的条件游走图推荐方法
CN111104606B (zh) * 2019-12-06 2022-10-21 成都理工大学 一种基于权重的条件游走图推荐方法
CN111144976A (zh) * 2019-12-10 2020-05-12 支付宝(杭州)信息技术有限公司 推荐模型的训练方法及装置
CN111047410A (zh) * 2019-12-16 2020-04-21 腾讯科技(深圳)有限公司 推荐方法、装置、终端设备以及存储介质
CN111047410B (zh) * 2019-12-16 2024-02-20 腾讯科技(深圳)有限公司 推荐方法、装置、终端设备以及存储介质
CN111291904A (zh) * 2020-02-06 2020-06-16 腾讯科技(深圳)有限公司 偏好预测方法、装置及计算机设备
CN111291904B (zh) * 2020-02-06 2023-04-18 腾讯科技(深圳)有限公司 偏好预测方法、装置及计算机设备
CN111523048A (zh) * 2020-04-15 2020-08-11 达而观信息科技(上海)有限公司 社交网络中好友的推荐方法、装置、存储介质及终端
CN111523048B (zh) * 2020-04-15 2024-04-12 达观数据有限公司 社交网络中好友的推荐方法、装置、存储介质及终端
CN111859155A (zh) * 2020-08-04 2020-10-30 深圳前海微众银行股份有限公司 物品推荐方法、设备及计算机可读存储介质
WO2021208695A1 (zh) * 2020-11-19 2021-10-21 平安科技(深圳)有限公司 目标物推荐方法、装置、电子设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN110503506B (zh) 2022-07-08

Similar Documents

Publication Publication Date Title
CN110503506A (zh) 基于评分数据的物品推荐方法、装置及介质
Zhu et al. Heterogeneous hypergraph embedding for document recommendation
CN107209762B (zh) 视觉交互式搜索
CN108287864B (zh) 一种兴趣群组划分方法、装置、介质及计算设备
CN106776673B (zh) 多媒体文档概括
CN109190044A (zh) 个性化推荐方法、装置、服务器和介质
CN107704503A (zh) 用户关键词提取装置、方法及计算机可读存储介质
CN107784092A (zh) 一种推荐热词的方法、服务器及计算机可读介质
CN110275952A (zh) 基于用户短期兴趣的新闻推荐方法、装置及介质
CN107786943A (zh) 一种用户分群方法及计算设备
CN110827112B (zh) 深度学习的商品推荐方法、装置、计算机设备及存储介质
US9767417B1 (en) Category predictions for user behavior
CN109359247A (zh) 内容推送方法及存储介质、计算机设备
CN107911448A (zh) 一种内容推送方法及装置
CN110413888A (zh) 一种书籍推荐方法及装置
CN109977316A (zh) 一种并行式文章推荐方法、装置、设备及存储介质
CN107818492A (zh) 产品推荐装置、方法及计算机可读存储介质
CN105447005B (zh) 一种对象推送方法及装置
US10474670B1 (en) Category predictions with browse node probabilities
CN109410001A (zh) 一种商品推荐方法、系统、电子设备和存储介质
CN104008204B (zh) 一种动态的多维情境感知电影推荐系统及其实现方法
CN111047410A (zh) 推荐方法、装置、终端设备以及存储介质
CN109885834A (zh) 一种用户年龄性别的预测方法及装置
US20150127657A1 (en) Method and Computer for Indexing and Searching Structures
CN115423555A (zh) 一种商品推荐方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant