CN107341204A - 一种融合物品标签信息的协同过滤推荐方法及系统 - Google Patents

一种融合物品标签信息的协同过滤推荐方法及系统 Download PDF

Info

Publication number
CN107341204A
CN107341204A CN201710481708.7A CN201710481708A CN107341204A CN 107341204 A CN107341204 A CN 107341204A CN 201710481708 A CN201710481708 A CN 201710481708A CN 107341204 A CN107341204 A CN 107341204A
Authority
CN
China
Prior art keywords
article
mrow
msub
similarity
label information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710481708.7A
Other languages
English (en)
Other versions
CN107341204B (zh
Inventor
张可
王世晖
谢文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dongguan Insight Digital Technology Co Ltd
University of Electronic Science and Technology of China
Original Assignee
Dongguan Insight Digital Technology Co Ltd
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dongguan Insight Digital Technology Co Ltd, University of Electronic Science and Technology of China filed Critical Dongguan Insight Digital Technology Co Ltd
Priority to CN201710481708.7A priority Critical patent/CN107341204B/zh
Publication of CN107341204A publication Critical patent/CN107341204A/zh
Application granted granted Critical
Publication of CN107341204B publication Critical patent/CN107341204B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种融合物品标签信息的协同过滤推荐方法及系统,涉及融合物品标签信息的协同过滤推荐领域;包括:依据物品i与物品j的评分数据,以及物品i与物品j的标签信息、计算物品i与物品j的相似度、进行个性化推荐;一种融合物品标签信息的协同过滤推荐系统,包括:数据输入模块、相似度计算模块和个性化推荐模块;数据输入模块,输入物品i与物品j的评分数据,以及物品i与物品j的标签信息;相似度计算模块,计算物品i与物品j的相似度;个性化推荐模块,判定两个物品间的共同评分数是否大于人数门限值,选取合适的推荐策略。实现适合所有的推荐场景,当共同评分数据极少时,保证了根据相似度公式计算出来的相似近邻准确性和可靠性。

Description

一种融合物品标签信息的协同过滤推荐方法及系统
技术领域
本发明涉及融合物品标签信息的协同过滤推荐领域,尤其是一种融合物品标签信息的协同过滤推荐方法及系统。
背景技术
近年来,互联网和移动互联网发展的如火如荼,物联网时代也在悄然布局,数据和信息的增长速度呈爆炸之势,高速的信息膨胀使致使人们进入信息过载的时代。如今,知识的海洋如此广袤漫无边际,如何从中准确高效地获取我们想要的数据成为了重要难题。搜索引擎为解决信息过载带来的数据获取难题提供了行之有效的解决方法,用户可以通过搜索关键字准确获取自己想要的数据。但是搜索引擎的使用需要用户为要获取的数据做出准确的定义,在很多应用场景下,用户并不能提供准确的关键字,或者用户根本不知道自己的具体需求是什么,只是想获取自己感兴趣的信息,搜索引擎并不能满足用户日益增长的需求,因此推荐系统应运而生。
推荐系统持续发展,用户数与项目数飞速扩张,这种情况下会产生庞大的用户评分矩阵,计算机的存储压力和计算压力骤增,协同过滤作为推荐系统领域的主流算法,受到了数据稀疏性问题(Sparsity)、冷启动问题(Cold Start)和可扩展性问题(Scalability)的严重阻挠,这三个问题成为了推荐系统应用的主要瓶颈。
发明内容
本发明的目的在于克服现有技术的不足,提供一种融合物品标签信息的协同过滤推荐方法及系统,实现适合所有的推荐场景,当共同评分数据极少时,保证了根据相似度公式计算出来的相似近邻准确性和可靠性。
本发明的目的是通过以下技术方案来实现的:一种融合物品标签信息的协同过滤推荐方法,他具体包括如下步骤:
S001输入物品i与物品j的评价数据以及标签信息;
S002计算物品i与物品j的相似度:通过判定物品i与物品j的同时被评价次数选择计算物品相似度的方式;
S003进行个性化推荐:判定两个物品间的共同评分数是否大于人数门限值选择融合物品标签信息的方式。
进一步的,所述的S002计算物品i与物品j的相似度,具体为:
相似度计算方式选择:判定物品i与物品j的同时被评价次数是否超过阈值,若是使用传统的相似度计算方式进行计算,反之采用动态权重混合相似度计算方式进行计算。
进一步的,所述的传统的混合相似度计算方式,具体为:
sim(i,j)=αsimtag(i,j)+(1-α)simcf(i,j),其中simtag(i,j)表示的意义是物品i与物品j之间的标签相似度,simcf(i,j)表示的意义是物品i与物品j之间的协同过滤相似度,α是权重调节参数;
所述的Ii表示物品i的标签数量,Ij表示物品j的标签数量,标签相似度的含义就是两个物品标签的交集除以两个物品标签的并集。
进一步的,所述的α,在物品比较冷门适度加大α参数值,提高标签相似度的权重,反之如果物品比较热门,减小α参数值,从而提高协同过滤相似度的权重。
进一步的,所述的动态权重混合相似度计算方式,具体为:
Ui表示的意义是物品i受到用户评价的次数,Uj表示的意义是物品j受到用户评价的次数,物品i以及物品j的Jaccard相似度,相似度越大,即两个物品的共同评分人数越多,协同过滤相似度贡献的权重越大,标签相似度贡献的权重越小。
进一步的,所述的进行个性化推荐,是通过混合相似度衡量公式实现,具体为:
α=Jaccard(i,j)
Uij=Ui∩Uj
其中α表示的意义是权重调节参数,Uij的意义是物品i以及物品j同时被评价的次数,Threshold为共同评分人数门限值。
进一步的,所述的人数门限值,若两个物品间的共同评分数大于此门限值,则采用协同过滤相似度,否则采用混合相似度计算公式融合物品标签信息。
一种融合物品标签信息的协同过滤推荐系统,它包括:数据输入模块、相似度计算模块和个性化推荐模块;
所述的数据输入模块,输入物品的评价数据以及物品i与物品j的标签信息;
所述的相似度计算模块,计算物品i与物品j的相似度;
所述的个性化推荐模块,判定两个物品间的共同评分数是否大于人数门限值,进而自适应选择合适的推荐策略。
一种融合物品标签信息的协同过滤推荐系统,包括:
处理器,用于执行程序;
存储器,用于存储由处理器执行的程序,其中所述程序在执行时包括以下步骤:
S001输入物品的评价数据以及物品i与物品j的标签信息;
S002计算物品i与物品j的相似度:通过判定物品i与物品j的同时被评价次数选择计算物品相似度的方式;
S003进行个性化推荐:判定两个物品间的共同评分数是否大于人数门限值自适应选择合适的推荐策略。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,其中计算机程序在执行时包括以下步骤:
S001输入物品的评价数据以及物品i与物品j的标签信息;
S002计算物品i与物品j的相似度:通过判定物品i与物品j的同时被评价次数选择计算物品相似度的方式;
S003进行个性化推荐:判定两个物品间的共同评分数是否大于人数门限值自适应选择合适的推荐策略。
本发明的有益效果是:本发明实现适合所有的推荐场景,当共同评分数据极少时,保证了根据相似度公式计算出来的相似近邻准确性和可靠性。
附图说明
图1为一种融合物品标签信息的协同过滤推荐方法的一个实施例的流程图;
图2为一种融合物品标签信息的协同过滤推荐装置的一个实施例的结果框图。
具体实施方式
下面将详细描述本发明的具体实施例,应当注意,这里描述的实施例只用于举例说明,并不用于限制本发明。在以下描述中,为了提供对本发明的透彻理解,阐述了大量特定细节。然而,对于本领域普通技术人员显而易见的是:不必采用这些特定细节来实行本发明。在其他实例中,为了避免混淆本发明,未具体描述公知的电路,软件或方法。
在整个说明书中,对“一个实施例”、“实施例”、“一个示例”或“示例”的提及意味着:结合该实施例或示例描述的特定特征、结构或特性被包含在本发明至少一个实施例中。因此,在整个说明书的各个地方出现的短语“在一个实施例中”、“在实施例中”、“一个示例”或“示例”不一定都指同一实施例或示例。此外,可以以任何适当的组合和、或子组合将特定的特征、结构或特性组合在一个或多个实施例或示例中。此外,本领域普通技术人员应当理解,在此提供的示图都是为了说明的目的,并且示图不一定是按比例绘制的。
如图1所示,物品信息往往具有多标签性的特性,物品会被用户标注不同的多个标签信息。比如在个性化电影推荐场景中,每一部电影都会属于一个或多个标签,比如电影《星际穿越》会被打上“科幻片”、“悬疑片”“冒险片”的标签,而电影《金刚狼3:殊死一战》则会被打上“剧情片”、“动作片”、“科幻片”等标签。不同的物品会被打上不同的标签,而如果两个物品重合的标签个数越多,则认为这两个物品越相似。因此定义如下的标签相似度计算公式:
Ii表示物品i的标签数量,Ij表示物品j的标签数量,因此标签相似度的含义就是两个物品标签的交集除以两个物品标签的并集。由此可知,标签相似度不需要用户对物品的评分信息,只需要用到物品自身的信息即可计算得到,这是标签相似度作为基于内容推荐领域的一个优势。
推荐系统中往往存在冷启动问题,也就是系统中新添加的物品由于没有用户对其评分导致依靠评分数据计算相似度的协同过滤推荐算法失效。为了解决推荐系统中的冷启动问题,可以考虑在冷启动阶段使用标签相似度作为物品间相似程度的衡量标准,从而缓和了冷启动问题。
传统的混合相似度公式如下所示:
sim(i,j)=αsimtag(i,j)+(1-α)simcf(i,j)
simtag(i,j)表示的意义是物品i与物品j之间的标签相似度,simcf(i,j)表示的意义是物品i与物品j之间的协同过滤相似度,如Pearson相似度衡量公式等。α是权重调节参数,控制着两种相似度对最终混合相似度衡量标准的影响。如果物品比较冷门,可以适度加大α参数值,提高标签相似度的权重,同样如果物品比较热门,可以适度减小α参数值,从而提高协同过滤相似度的权重。
然而参数α需要根据评分项的多寡进行手动调节,然而手动调节实现起来比较麻烦并且不具备通用性,因此专利提出一种新型的可以动态调节权重的混合相似度衡量标准:
Ui表示的意义是物品i受到用户评价的次数,Uj表示的意义是物品j受到用户评价的次数,因此在新提出的混合相似度计算公式中,将标签相似度贡献的权重和物品i以及物品j的Jaccard相似度挂钩,物品i以及物品j的Jaccard相似度越大,表示两个物品的共同评分人数就越多,此时协同过滤相似度贡献的权重越大,标签相似度共现的权重越小,因此使用Jaccard系数可以起到自适应动态调节参数的效果,避免了手动调节参数的弊端。称此新提出的改进的动态权重混合相似度计算公式为DWHS(Dynamic Weighting HybridSimilarity)。
在DWHS计算公式基础上,提出一种新的混合推荐算法,融合了物品标签的信息,缓和了推荐系统中物品的冷启动问题。然而由于标签相似性比较粗糙,从而导致融合了标签相似度的混合相似度计算公式在物品共同评分数较多的情况下也相对粗糙,造成最终的推荐精度下降。混合相似度适用在物品间共同评分数较少的情况下,而如果两个物品的共同评分数足够,那么此时协同过滤的相似度远远比混合相似度可靠,因此需要引入一种机制,使推荐算法能够识别不同的场景,智能地使用最合适的相似度衡量标准,从而满足改善推荐效果的需求。
基于上述理论,提出一种新型的混合相似度衡量公式如下:
α=Jaccard(i,j)
Uij=Ui∩Uj
α表示的意义是权重调节参数,其值由物品i以及物品j的Jaccard系数决定,Uij的意义是物品i以及物品j同时被评价的次数,Threshold表示共同评分人数门限值,两个物品间的共同评分数大于此门限值,则采用协同过滤相似度,如Pearson相似度,否则采用改进的混合相似度计算公式,融合物品标签信息,修正由于共同评分数较少导致的协同过滤相似度失真的问题。
称使用了sim”(i,j)相似度公式的混合推荐算法为ICF-T(ItembasedCollaborativeFilteringwithTag)算法。
ICF-T算法不仅一定程度上缓解了物品冷启动问题,还解决了共同评分数较少导致的传统相似度计算公式不可靠的问题,相比传统的算法来说,提高了推荐结果的准确率。
如图2所示,一种融合物品标签信息的协同过滤推荐装置,它包括:数据输入模块、相似度计算模块和个性化推荐模块;
所述的数据输入模块,输入物品的评价数据以及物品i与物品j的标签信息;
所述的相似度计算模块,计算物品i与物品j的相似度;
所述的个性化推荐模块,判定两个物品间的共同评分数是否大于人数门限值,进而自适应选择合适的推荐策略。
所述的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例的方案目的。另外,在本发明各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。
所述的方法如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、制度存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。

Claims (10)

1.一种融合物品标签信息的协同过滤推荐方法,其特征在于,他具体包括如下步骤:
S001输入物品i与物品j的评价数据以及标签信息;
S002计算物品i与物品j的相似度:通过判定物品i与物品j的同时被评价次数选择计算物品相似度的方式;
S003进行个性化推荐:判定两个物品间的共同评分数是否大于人数门限值选择融合物品标签信息的方式。
2.根据权利要求1所述的一种融合物品标签信息的协同过滤推荐方法,其特征在于:所述的S002计算物品i与物品j的相似度,具体为:
相似度计算方式选择:判定物品i与物品j的同时被评价次数是否超过阈值,若是使用传统的相似度计算方式进行计算,反之采用动态权重混合相似度计算方式进行计算。
3.根据权利要求2所述的一种融合物品标签信息的协同过滤推荐方法,其特征在于,所述的传统的混合相似度计算方式,具体为:
sim(i,j)=αsimtag(i,j)+(1-α)simcf(i,j),其中simtag(i,j)表示的意义是物品i与物品j之间的标签相似度,simcf(i,j)表示的意义是物品i与物品j之间的协同过滤相似度,α是权重调节参数;
所述的Ii表示物品i的标签数量,Ij表示物品j的标签数量,标签相似度的含义就是两个物品标签的交集除以两个物品标签的并集。
4.根据权利要求3所述的一种融合物品标签信息的协同过滤推荐方法,其特征在于,所述的α,在物品比较冷门适度加大α参数值,提高标签相似度的权重,反之如果物品比较热门,减小α参数值,从而提高协同过滤相似度的权重。
5.根据权利要求2所述的一种融合物品标签信息的协同过滤推荐方法,其特征在于,所述的动态权重混合相似度计算方式,具体为:
<mrow> <mtable> <mtr> <mtd> <mrow> <msup> <mi>sim</mi> <mo>&amp;prime;</mo> </msup> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo> </mrow> <mo>=</mo> <mi>J</mi> <mi>a</mi> <mi>c</mi> <mi>c</mi> <mi>a</mi> <mi>r</mi> <mi>d</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo> </mrow> <mo>&amp;times;</mo> <msub> <mi>sim</mi> <mrow> <mi>c</mi> <mi>f</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo> </mrow> <mo>+</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>-</mo> <mi>J</mi> <mi>a</mi> <mi>c</mi> <mi>c</mi> <mi>a</mi> <mi>r</mi> <mi>d</mi> <mo>(</mo> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> <mo>)</mo> <mo>)</mo> </mrow> <mo>&amp;times;</mo> <msub> <mi>sim</mi> <mrow> <mi>t</mi> <mi>a</mi> <mi>g</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>=</mo> <mfrac> <mrow> <msub> <mi>U</mi> <mi>i</mi> </msub> <mo>&amp;cap;</mo> <msub> <mi>U</mi> <mi>j</mi> </msub> </mrow> <mrow> <msub> <mi>U</mi> <mi>i</mi> </msub> <mo>&amp;cup;</mo> <msub> <mi>U</mi> <mi>j</mi> </msub> </mrow> </mfrac> <mo>&amp;times;</mo> <msub> <mi>sim</mi> <mrow> <mi>c</mi> <mi>f</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo> </mrow> <mo>+</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>-</mo> <mfrac> <mrow> <msub> <mi>U</mi> <mi>i</mi> </msub> <mo>&amp;cap;</mo> <msub> <mi>U</mi> <mi>j</mi> </msub> </mrow> <mrow> <msub> <mi>U</mi> <mi>i</mi> </msub> <mo>&amp;cup;</mo> <msub> <mi>U</mi> <mi>j</mi> </msub> </mrow> </mfrac> <mo>)</mo> </mrow> <mo>&amp;times;</mo> <msub> <mi>sim</mi> <mrow> <mi>t</mi> <mi>a</mi> <mi>g</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> </mtable> <mo>,</mo> </mrow>
Ui表示的意义是物品i受到用户评价的次数,Uj表示的意义是物品j受到用户评价的次数,物品i以及物品j的Jaccard相似度,相似度越大,即两个物品的共同评分人数越多,协同过滤相似度贡献的权重越大,标签相似度贡献的权重越小。
6.根据权利要求1所述的一种融合物品标签信息的协同过滤推荐方法,其特征在于:所述的进行个性化推荐,是通过混合相似度衡量公式实现,具体为:
<mrow> <msup> <mi>sim</mi> <mrow> <mo>&amp;prime;</mo> <mo>&amp;prime;</mo> </mrow> </msup> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mi>&amp;alpha;</mi> <mo>&amp;times;</mo> <msub> <mi>sim</mi> <mrow> <mi>c</mi> <mi>f</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo> </mrow> <mo>+</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>-</mo> <mi>&amp;alpha;</mi> <mo>)</mo> </mrow> <mo>&amp;times;</mo> <msub> <mi>sim</mi> <mrow> <mi>t</mi> <mi>a</mi> <mi>g</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo> </mrow> </mrow> </mtd> <mtd> <mrow> <mi>i</mi> <mi>f</mi> <mi> </mi> <msub> <mi>U</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>&lt;</mo> <mi>T</mi> <mi>h</mi> <mi>r</mi> <mi>e</mi> <mi>s</mi> <mi>h</mi> <mi>o</mi> <mi>l</mi> <mi>d</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>sim</mi> <mrow> <mi>c</mi> <mi>f</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo> </mrow> </mrow> </mtd> <mtd> <mrow> <mi>i</mi> <mi>f</mi> <mi> </mi> <msub> <mi>U</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>&amp;GreaterEqual;</mo> <mi>T</mi> <mi>h</mi> <mi>r</mi> <mi>e</mi> <mi>s</mi> <mi>h</mi> <mi>o</mi> <mi>l</mi> <mi>d</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow>
α=Jaccard(i,j)
Uij=Ui∩Uj
其中α表示的意义是权重调节参数,Uij的意义是物品i以及物品j同时被评价的次数,Threshold为共同评分人数门限值。
7.根据权利要求6所述的一种融合物品标签信息的协同过滤推荐方法,其特征在于:所述的人数门限值,若两个物品间的共同评分数大于此门限值,则采用协同过滤相似度,否则采用混合相似度计算公式融合物品标签信息。
8.根据权利要求1-7任意一项所述的一种融合物品标签信息的协同过滤推荐系统,其特征在于,它包括:数据输入模块、相似度计算模块和个性化推荐模块;
所述的数据输入模块,输入物品的评价数据以及物品i与物品j的标签信息;
所述的相似度计算模块,计算物品i与物品j的相似度;
所述的个性化推荐模块,判定两个物品间的共同评分数是否大于人数门限值,进而自适应选择合适的推荐策略。
9.根据权利要求8所述的一种融合物品标签信息的协同过滤推荐系统,还包括:
处理器,用于执行程序;
存储器,用于存储由处理器执行的程序,其中所述程序在执行时包括以下步骤:
S001输入物品的评价数据以及物品i与物品j的标签信息;
S002计算物品i与物品j的相似度:通过判定物品i与物品j的同时被评价次数选择计算物品相似度的方式;
S003进行个性化推荐:判定两个物品间的共同评分数是否大于人数门限值自适应选择合适的推荐策略。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,其中计算机程序在执行时包括以下步骤:
S001输入物品的评价数据以及物品i与物品j的标签信息;
S002计算物品i与物品j的相似度:通过判定物品i与物品j的同时被评价次数选择计算物品相似度的方式;
S003进行个性化推荐:判定两个物品间的共同评分数是否大于人数门限值自适应选择合适的推荐策略。
CN201710481708.7A 2017-06-22 2017-06-22 一种融合物品标签信息的协同过滤推荐方法及系统 Active CN107341204B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710481708.7A CN107341204B (zh) 2017-06-22 2017-06-22 一种融合物品标签信息的协同过滤推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710481708.7A CN107341204B (zh) 2017-06-22 2017-06-22 一种融合物品标签信息的协同过滤推荐方法及系统

Publications (2)

Publication Number Publication Date
CN107341204A true CN107341204A (zh) 2017-11-10
CN107341204B CN107341204B (zh) 2023-04-07

Family

ID=60220899

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710481708.7A Active CN107341204B (zh) 2017-06-22 2017-06-22 一种融合物品标签信息的协同过滤推荐方法及系统

Country Status (1)

Country Link
CN (1) CN107341204B (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107944035A (zh) * 2017-12-13 2018-04-20 合肥工业大学 一种融合视觉特征和用户评分的图像推荐方法
CN108765051A (zh) * 2018-04-16 2018-11-06 达而观信息科技(上海)有限公司 物品推荐方法和装置
CN109033242A (zh) * 2018-07-05 2018-12-18 南京师范大学 一种结合评分和项目相关性的协同过滤推荐方法
CN109582864A (zh) * 2018-11-19 2019-04-05 华南师范大学 基于大数据科学和动态权重调整的课程推荐方法及系统
CN109656541A (zh) * 2018-11-20 2019-04-19 东软集团股份有限公司 开发资源的推荐方法、装置、存储介质和电子设备
CN109658206A (zh) * 2019-01-14 2019-04-19 京东方科技集团股份有限公司 信息推荐方法和装置
CN110287410A (zh) * 2019-06-05 2019-09-27 达疆网络科技(上海)有限公司 一种o2o电商场景下用户的多种推荐算法的融合方法
CN110688583A (zh) * 2019-09-04 2020-01-14 杭州电子科技大学 一种基于层次化物品协同过滤推荐方法
CN110727878A (zh) * 2019-09-19 2020-01-24 上海易点时空网络有限公司 用于协同过滤的距离计算方法以及装置、协同过滤推荐方法、装置
WO2020029401A1 (zh) * 2018-08-09 2020-02-13 平安科技(深圳)有限公司 商品推荐方法、装置、计算机设备及计算机可读存储介质
CN110807095A (zh) * 2018-08-01 2020-02-18 北京京东尚科信息技术有限公司 一种物品匹配方法和装置
CN111966900A (zh) * 2020-08-17 2020-11-20 中国银行股份有限公司 基于局部敏感哈希的用户冷启动产品推荐方法及系统
CN112163163A (zh) * 2020-10-14 2021-01-01 广州欢网科技有限责任公司 多算法融合的信息推荐方法、装置和设备
CN112287241A (zh) * 2020-10-16 2021-01-29 南京邮电大学 旅游推荐方法及系统
CN113221006A (zh) * 2021-05-24 2021-08-06 北京搜狐新媒体信息技术有限公司 物品推荐方法及装置、电子设备、计算机存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103092911A (zh) * 2012-11-20 2013-05-08 北京航空航天大学 一种融合社会标签相似度基于k近邻的协同过滤推荐系统
CN106484876A (zh) * 2016-10-13 2017-03-08 中山大学 一种基于典型度和信任网络的协同过滤推荐方法
WO2017101317A1 (zh) * 2015-12-14 2017-06-22 乐视控股(北京)有限公司 智能推荐的全端显示方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103092911A (zh) * 2012-11-20 2013-05-08 北京航空航天大学 一种融合社会标签相似度基于k近邻的协同过滤推荐系统
WO2017101317A1 (zh) * 2015-12-14 2017-06-22 乐视控股(北京)有限公司 智能推荐的全端显示方法及装置
CN106484876A (zh) * 2016-10-13 2017-03-08 中山大学 一种基于典型度和信任网络的协同过滤推荐方法

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107944035A (zh) * 2017-12-13 2018-04-20 合肥工业大学 一种融合视觉特征和用户评分的图像推荐方法
CN108765051A (zh) * 2018-04-16 2018-11-06 达而观信息科技(上海)有限公司 物品推荐方法和装置
CN108765051B (zh) * 2018-04-16 2022-03-22 达而观信息科技(上海)有限公司 物品推荐方法和装置
CN109033242A (zh) * 2018-07-05 2018-12-18 南京师范大学 一种结合评分和项目相关性的协同过滤推荐方法
CN110807095A (zh) * 2018-08-01 2020-02-18 北京京东尚科信息技术有限公司 一种物品匹配方法和装置
WO2020029401A1 (zh) * 2018-08-09 2020-02-13 平安科技(深圳)有限公司 商品推荐方法、装置、计算机设备及计算机可读存储介质
CN109582864A (zh) * 2018-11-19 2019-04-05 华南师范大学 基于大数据科学和动态权重调整的课程推荐方法及系统
CN109582864B (zh) * 2018-11-19 2020-11-10 华南师范大学 基于大数据科学和动态权重调整的课程推荐方法及系统
CN109656541A (zh) * 2018-11-20 2019-04-19 东软集团股份有限公司 开发资源的推荐方法、装置、存储介质和电子设备
CN109658206A (zh) * 2019-01-14 2019-04-19 京东方科技集团股份有限公司 信息推荐方法和装置
CN110287410A (zh) * 2019-06-05 2019-09-27 达疆网络科技(上海)有限公司 一种o2o电商场景下用户的多种推荐算法的融合方法
CN110688583A (zh) * 2019-09-04 2020-01-14 杭州电子科技大学 一种基于层次化物品协同过滤推荐方法
CN110688583B (zh) * 2019-09-04 2021-09-28 杭州电子科技大学 一种基于层次化物品协同过滤推荐方法
CN110727878A (zh) * 2019-09-19 2020-01-24 上海易点时空网络有限公司 用于协同过滤的距离计算方法以及装置、协同过滤推荐方法、装置
CN111966900A (zh) * 2020-08-17 2020-11-20 中国银行股份有限公司 基于局部敏感哈希的用户冷启动产品推荐方法及系统
CN112163163A (zh) * 2020-10-14 2021-01-01 广州欢网科技有限责任公司 多算法融合的信息推荐方法、装置和设备
CN112163163B (zh) * 2020-10-14 2024-03-19 广州欢网科技有限责任公司 多算法融合的信息推荐方法、装置和设备
CN112287241A (zh) * 2020-10-16 2021-01-29 南京邮电大学 旅游推荐方法及系统
CN112287241B (zh) * 2020-10-16 2022-10-14 南京邮电大学 旅游推荐方法及系统
CN113221006A (zh) * 2021-05-24 2021-08-06 北京搜狐新媒体信息技术有限公司 物品推荐方法及装置、电子设备、计算机存储介质
CN113221006B (zh) * 2021-05-24 2023-12-19 北京搜狐新媒体信息技术有限公司 物品推荐方法及装置、电子设备、计算机存储介质

Also Published As

Publication number Publication date
CN107341204B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN107341204A (zh) 一种融合物品标签信息的协同过滤推荐方法及系统
CN103246672B (zh) 对用户进行个性化推荐的方法和装置
CN105701191B (zh) 一种推送信息点击率估计方法和装置
CN107145536B (zh) 用户画像构建方法与装置及推荐方法与装置
CN108334592B (zh) 一种基于内容与协同过滤相结合的个性化推荐方法
CN103246687B (zh) 基于特征信息的Blog自动摘要方法
CN106959966A (zh) 一种信息推荐方法及系统
CN103164463A (zh) 推荐标签的方法和装置
CN109903138B (zh) 一种个性化商品推荐方法
CN109064285A (zh) 一种获得商品推荐序列及商品推荐方法
CN108287916B (zh) 一种资源推荐方法
CN103514239A (zh) 一种集成用户行为和物品内容的推荐方法及系统
CN103150667B (zh) 一种基于本体结构的个性化推荐方法
CN111400615B (zh) 一种资源推荐方法、装置、设备及存储介质
CN105718566B (zh) 一种智能音乐推荐系统
CN107277115A (zh) 一种内容推送方法及装置
CN111310038A (zh) 信息推荐方法、装置、电子设备及计算机可读存储介质
CN102289514A (zh) 社会标签自动标注的方法以及社会标签自动标注器
CN104657336A (zh) 一种基于半余弦函数的个性化推荐算法
CN104915440A (zh) 一种商品排重方法和系统
Xie et al. A probabilistic recommendation method inspired by latent Dirichlet allocation model
CN107977370B (zh) 一种歌手推荐方法及系统
Shin et al. Recommending Tumblr Blogs to Follow with Inductive Matrix Completion.
Yao et al. Online deception detection refueled by real world data collection
CN106991122A (zh) 一种基于粒子群算法的电影推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant