CN102541920A - 联合基于用户和项目的协同过滤提高准确度的方法及装置 - Google Patents

联合基于用户和项目的协同过滤提高准确度的方法及装置 Download PDF

Info

Publication number
CN102541920A
CN102541920A CN2010106138093A CN201010613809A CN102541920A CN 102541920 A CN102541920 A CN 102541920A CN 2010106138093 A CN2010106138093 A CN 2010106138093A CN 201010613809 A CN201010613809 A CN 201010613809A CN 102541920 A CN102541920 A CN 102541920A
Authority
CN
China
Prior art keywords
user
scoring
rating matrix
items rating
user items
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010106138093A
Other languages
English (en)
Inventor
林欣
吴琴
李庆玲
宋建
崔永利
贺樑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
East China Normal University
Original Assignee
East China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by East China Normal University filed Critical East China Normal University
Priority to CN2010106138093A priority Critical patent/CN102541920A/zh
Publication of CN102541920A publication Critical patent/CN102541920A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供联合基于用户和项目的协同过滤提高准确度的控制方法,包括步骤:a.构建第一用户项目评分矩阵;b.填充所述第一用户项目评分矩阵以生成第二用户项目评分矩阵;c.根据所述第二用户项目评分矩阵计算最终预测评分。还提供相应的控制装置。本发明利用混合基于用户和基于项目的两种基于记忆的协同过滤的方法填充用户项目矩阵,使得预测的准确的大大的提升。本方法利用了融合基于记忆的协调过滤技术的特点,只需要通过收集到的数据构建最初的用户项目评分矩阵。本方法是预先通过基值、基于用户和基于项目的方法对原始的用户项目评分矩阵中的空白评分进行填充,是一个很稳定的用户评分矩阵。

Description

联合基于用户和项目的协同过滤提高准确度的方法及装置
技术领域
本发明涉及联合基于用户和项目的协同过滤技术领域,具体地说是一种联合基于用户和项目的协同过滤提高预测准确度的控制方法及控制装置。
背景技术
电子商务的飞速发展将人类带入了网络经济时代,面对大量的商品信息,用户往往很难发现最需要或最合适的商品。电子商务系统会形成海量的交易数据,如果从中挖掘和发现有用的知识以使得交易更加高效成为一个有意义的研究课题,电子商务推荐系统正是针对以上问题和需求产生的,为了提供精确而又快速的推荐,研究者提出了多种推荐算法,其中协同过滤推荐算法是应用最为成功的一种。协同过滤分析用户兴趣,在用户群中找到指定用户的相似用户,综合这些相似用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度预测。目前主要有两种协同过滤推荐技术:联合基于用户和项目的协同过滤推荐技术和基于模型的协同过滤推荐技术。基于模型的协调过滤是先用历史资料建立一个模型,在用此模型进行预测。本发明主要涉及联合基于用户和项目的协同过滤技术领域。
联合基于用户和项目的协调过滤技术主要分为:基于用户的协调过滤推荐算法和基于项目的协调过滤推荐算法。基于用户的协同过滤推荐算法基于这样一个假设,即如果用户对一些项目的评分比较相似,则他们对其他项目的评分也比较相似。算法根据目标用户的最近邻居(最相似的若干用户)对某个项目的评分逼近目标用户对该项目的评分。基于项目的协同过滤推荐算法认为,用户对同项目的评分存在相似性,当需要估计用户对某个项目的评分时,可以用户对该项目的若干相似项目的评分进行估计。但是联合基于用户和项目的协调过滤有两大瓶颈:数据的稀疏性、数据的可扩展性已经预测的准确性。基于模型的协调过滤技术在可扩展性方面解决的很好。本发明主要是针对在数据比较稀疏的情况下,利用本发明达到一个很好的预测准确性。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种联合基于用户和项目的协同过滤提高准确度的控制方法以及相应的控制装置。
根据本发明的一个方面,提供联合基于用户和项目的协同过滤提高准确度的控制方法,包括步骤:a.构建第一用户项目评分矩阵;b.填充所述第一用户项目评分矩阵以生成第二用户项目评分矩阵;c.根据所述第二用户项目评分矩阵计算最终预测评分。
根据本发明的另一个方面,还提供联合基于用户和项目的协同过滤提高准确度的控制装置,包括装置:第一构建装置,其用于构建第一用户项目评分矩阵;第一填充装置,其用于填充所述第一用户项目评分矩阵以生成第二用户项目评分矩阵;第一计算装置,其用于根据所述第二用户项目评分矩阵计算最终预测评分。
本发明先对MovieLens(一个数据集,使用打分的方法获取用户对电影的偏好数据)网页数据进行提取,构造初始的用户项目评分矩阵,通过基值、基于用户的协同过滤算法和基于项目的协同过滤算法对用户评分矩阵中的空白评分进行填充,以及利用新得到的用户项目评分矩阵进行预测,并以此产生推荐,具体可以参见图4和图5,具体操作步骤:
第一步:通过对MovieLens网页数据进行提取,提取用户对个项目(电影)的评分;
第二步:根据提取的数据构建原始的用户项目评分矩阵;
第三步:根据基于用户的方法,利用调整的余弦相似度算法计算用户的相似用户群,并计算用户项目评分矩阵中的空白评分;
第四步:根据基于项目的方法,利用调整的余弦相似度计算项目的相似项目群,并计算用户项目评分矩阵中的空白评分;
第五步:利用方差、平均值计算每个用户项目评分矩阵中的空白评分的基值评分值;
第六步:利用参数联合第三、四、五步的计算结果,填充用户项目评分矩阵中的各个空白评分;
第七步:根据新的用户项目评分矩阵计算测试用户的相似用户集,并利用相似用户集,计算测试用户对测试项目的评分;
第八步:根据新的用户项目评分矩阵计算测试项目的相似项目集,并利用相似项目集,计算测试用户对测试项目的评分;
第九步:利用第七步和第八步的计算结果,计算最终的预测评分;
第十步:产生预测;
第十一步:结束。
本发明进一步特征在于第五步和第六步,使用融合的基于记忆的方法,将基值、基于用户和基于项目结合。
与背景技术相比,本发明有以下优点:
1、准确性:利用混合基于用户和基于项目的两种基于记忆的协同过滤的方法填充用户项目矩阵,使得预测的准确的大大的提升。因为首先通过基于用户和基于项目的方法对用户项目矩阵中的空白评分进行填充,并且加入了整个用户项目矩阵的方差等因素,然后再利用新建立的用户项目矩阵进行评分预测。这样,在实际应用过程中,可以很大程度的客服稀疏性,使得测试用户在数据极度稀疏的情况下,他的相似用户群也会有一个很好的保障,从而较好的预测结果。不想传统的协同过滤,在数据极度稀疏的情况下,预测的准确性根本不能保证。
2、易行性:本方法利用了融合基于记忆的协调过滤技术的特点,只需要通过收集到的数据构建最初的用户项目评分矩阵。同样,通过融合的基于记忆的协调过滤技术对原始的用户项目评分矩阵进行补充。而用基于记忆的协调过滤的两种算法:基于用户和基于项目的算法,联合计算预测评分,十分简单。不像传统的基于模型的协调过滤方法那样,需要花很长的时间建立用户模型,并且对模型的更新非常耗时而且时效性也不好。
3、稳定性:本方法是预先通过基值、基于用户和基于项目的方法对原始的用户项目评分矩阵中的空白评分进行填充,是一个很稳定的用户评分矩阵,在实际应用中,可以直接采用这个填充好的用户评分矩阵,只需要不定时的对这个用户评分矩阵进行更新即可,就可以利用它来计算预测评分,并且进行预测。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出根据本发明的第一实施例的,联合基于用户和项目的协同过滤提高准确度的控制方法的流程图;
图2示出根据本发明的第二实施例的,联合基于用户和项目的协同过滤提高准确度的控制方法的流程图;
图3示出根据本发明的第三实施例的,联合基于用户和项目的协同过滤提高准确度的控制装置的结构图;
图4示出根据本发明的一个具体实施方式的,联合基于用户和项目的协同过滤提高准确度的控制方法的示意图;以及
图5示出根据本发明的另一个具体实施例的,联合基于用户和项目的协同过滤提高准确度的控制方法的示意图。
具体实施方式
本发明公开了一种联合基于用户和项目的协同过滤提高预测准确度的方法,该方法需要对原始的用户项目评分矩阵进行补充实现,通过利用方差和均值的方法计算出基值,同时利用原始的用户项目评分矩阵,通过基于用户和基于用户的协同过滤算法计算初始的预测评分,并且融合基值、基于用户和基于项目的两个协调过滤算法填充空白的用户项目评分矩阵,从而建立新的用户项目评分矩阵,克服数据的稀疏性,最后利用新的用户项目评分矩阵产生最终的预测评分,并进行推荐。本发明不需要建立模型以及用户的其他信息,只对用户评分进行分析;分析过程简单,无需复杂算法;能够实时比较准确的评分预测;并达到很好的准确性,在实际的应用中,使得用户的体验感很好。
图1示出根据本发明的第一实施例的,联合基于用户和项目的协同过滤提高准确度的控制方法的流程图。具体地,在本实施例中,首先执行步骤S210,构建第一用户项目评分矩阵。然后执行步骤S211,填充所述第一用户项目评分矩阵以生成第二用户项目评分矩阵。然后执行步骤S212,根据所述第二用户项目评分矩阵计算最终预测评分。最后执行步骤S213,根据所述最终预测评分向用户推荐项目。
在本实施例的一个变化例中,所述步骤S213可以被省略。
图2示出根据本发明的第二实施例的,联合基于用户和项目的协同过滤提高准确度的控制方法的流程图。本领域技术人员可以将本实施例理解为图1所示实施例的一个具体实施方式。具体地,在本实施例中,首先执行步骤S220,获取用户对项目的评分。然后执行步骤S221,根据用户对项目的评分构建所述第一用户项目评分矩阵。接下来并行地执行步骤S2221、步骤S2222、以及步骤S2223。其中,通过执行所述步骤S2221,根据基于用户的协同过滤算法计算所述第一用户项目评分矩阵中的空白评分;然后接下来进入步骤S2231,用所述步骤S2221的计算结果填充所述第一用户项目评分矩阵的各个空白评分。通过执行所述步骤S2222,根据基于项目的协同过滤算法计算所述第一用户项目评分矩阵中的空白评分;然后接下来进入步骤S2232用步骤S2222的计算结果填充所述第一用户项目评分矩阵的各个空白评分。通过执行所述步骤S2223,通过基值计算所述第一用户项目评分矩阵中的空白评分;然后接下来进入步骤S2233,用步骤S2223的计算结果填充所述第一用户项目评分矩阵的各个空白评分。
通过所述步骤S2231、步骤S2232、以及步骤S2233对所述第一用户项目评分矩阵的各个空白评分进行填充后,接下来执行步骤S224,将填充后的所述第一用户项目评分矩阵作为所述第二用户项目评分矩阵。接下来并行地执行步骤S2251、以及步骤S2252。其中,通过执行所述步骤S2251,根据所述第二用户项目评分矩阵计算测试用户的相似用户集;然后接下来进入步骤S2261,根据所述相似用户集计算测试用户对测试项目的第一评分。通过执行所述步骤S2252,根据所述第二用户项目评分矩阵计算测试项目的相似项目集;然后接下来进入步骤S2262,根据所述相似项目集计算测试用户对测试项目的第二评分。通过所述步骤S2261、以及步骤S2262得到所述第一评分和第二评分后,接下来执行步骤S227,根据所述第一评分和第二评分计算所述最终预测评分。最后执行步骤S228,将所述最终预测评分较高的若干项目推荐给用户。
在本实施例的一个优选例中,所述步骤S220包括步骤“从网页数据中提取用户对项目的评分”。
在本实施例的另一个优选例中,所述步骤S2221包括步骤“利用调整的余弦相似度算法计算用户的相似用户群”。
在本实施例的又一个优选例中,所述步骤S2222包括步骤“利用调整的余弦相似度算法计算项目的相似项目群”。
在本实施例的又一个优选例中,所述步骤S2223包括步骤“利用方差、平均值计算每个所述用户项目评分矩阵中的空白评分的基值评分值”。
在本实施例的一个变化例中,所述步骤S228可以被省略。
本领域技术人员可以将所述步骤S220以及步骤S221理解为图1中所述步骤S210的一个具体实施方式。将所述步骤S2221、步骤S2231以及步骤S224理解为图1中所述步骤S211的一个具体实施方式。将所述步骤S2222、步骤S2232以及步骤S224理解为图1中所述步骤S211的一个具体实施方式。将所述步骤S2223、步骤S2233以及步骤S224理解为图1中所述步骤S211的一个具体实施方式。将所述步骤S2251、步骤S2261以及步骤S227理解为图1中所述步骤S212的一个具体实施方式。将所述步骤S2252、步骤S2262以及步骤S227理解为图1中所述步骤S212的一个具体实施方式。将所述步骤S228理解为图1中所述步骤S213的一个具体实施方式。
本领域技术人员理解,优选地,上述并行的几个步骤为可选择关系,例如可以选择所述步骤S2231、步骤S2232以及步骤S2233中的任一个予以执行,从而可以在后续步骤中执行所述步骤S224。本领域技术人员结合现有技术以及上述实施例可以理解这样的过程,在此不予赘述。
本领域技术人员理解,上述步骤S220可以通过用户输入的方式一次性或者分别获得多个用户对所述项目的评分,本领域技术人员结合现有技术以及上述实施例可以实现该步骤。而在一个变化例中,还可以通过第三方系统获得所述一个或多个用户对所述项目的评分,例如该第三方系统是专门用于获得所述评分的系统,而本发明提供的技术方案中的(例如图3所示的)控制装置则基于该第三方系统获得的评分来实现图2所示步骤,在此不予赘述。
进一步地,本领域技术人员理解,所述步骤S2221中涉及的基于用户的协同过滤算法可以通过如下方式实现:1)根据第一用户项目评分矩阵,利用调整的余弦相似度算法计算用户的相似用户群集;2)利用1)中计算所得的相似用户集,计算第一用户项目评分矩阵中的空白评分。
类似地,所述步骤S2222中涉及的基于项目的协同过滤算法可以通过如下方式实现:1)根据第一用户项目评分矩阵,利用调整的余弦相似度算法计算项目的相似项目集;2)利用1)中计算所得的相似项目集,计算第一用户项目评分矩阵中的空白评分。
类似地,所述步骤S2223中涉及的通过基值予以计算的步骤可以通过如下方式实现:根据第一用户项目评分矩阵,1)计算此评分矩阵的方差σ;2)计算此评分矩阵每一行的平均值ru;3)计算此评分矩阵每一列的平均值ri;4)最后,基值为σ+ru+ri
进一步地,本领域技术人员理解,优选地,在所述步骤S2251中可以通过如下方式计算所述相似用户集:根据第二用户项目评分矩阵,利用调整的余弦相似度算法计算用户的相似用户集。相应地,在所述步骤S2261中通过如下方式计算测试用户对测试项目的第一评分:利用在所述步骤S2251中计算出的测试用户的相似用户集,以及在第二用户项目评分矩阵中的相应的评分,计算出测试用户对测试项目的第一评分。
进一步地,本领域技术人员理解,优选地,在所述步骤S2252中可以通过如下方式计算所述相似项目集:根据第二用户项目评分矩阵,利用调整的余弦相似度算法计算项目的相似项目集。相应地,在所述步骤S2262中通过与上述步骤S2261所述类似的方式计算测试用户对测试项目的第二评分,在此不予赘述。
相应地,本领域技术人员理解,通过如下方式可以完成所述步骤S227:利用参数,联合在所述步骤S2261计算的第一评分和在所述步骤S2262中的第二评分,求的最终的预测评分。
图3示出根据本发明的第三实施例的,联合基于用户和项目的协同过滤提高准确度的控制装置的结构图。具体地,在本实施例中,所述控制装置4包括第一构建装置41,其用于构建第一用户项目评分矩阵;第一填充装置42,其用于填充所述第一用户项目评分矩阵以生成第二用户项目评分矩阵;第一计算装置43,其用于根据所述第二用户项目评分矩阵计算最终预测评分;第一推荐装置44,其用于根据所述最终预测评分向用户推荐项目。
优选地,所述第一构建装置41包括第一获取装置411,其用于获取用户对项目的评分;第二构建装置412,其用于根据用户对项目的评分构建所述第一用户项目评分矩阵。
优选地,所述第一填充装置42包括第二计算装置421,其用于根据基于用户的协同过滤算法计算所述第一用户项目评分矩阵中的空白评分;第二填充装置422,其用于用第二计算装置的计算结果填充所述第一用户项目评分矩阵的各个空白评分;。
优选地,所述第一填充装置42还可以包括第四计算装置423,其用于根据基于项目的协同过滤算法计算所述第一用户项目评分矩阵中的空白评分;第三填充装置424,其用于用第四计算装置的计算结果填充所述第一用户项目评分矩阵的各个空白评分。
优选地,所述第一填充装置42还可以包括第六计算装置425,其用于通过基值计算所述第一用户项目评分矩阵中的空白评分;第四填充装置426,其用于用第六计算装置的计算结果填充所述第一用户项目评分矩阵的各个空白评分。
优选地,所述第一填充装置42还包括第七计算装置427,其用于利用方差、平均值计算每个所述用户项目评分矩阵中的空白评分的基值评分值。
优选地,所述第一计算装置43包括第八计算装置431,其用于根据所述第二用户项目评分矩阵计算测试用户的相似用户集;第一测试装置432,其用于根据所述相似用户集计算测试用户对测试项目的第一评分。
优选地,所述第一计算装置43还包括第九计算装置433,其用于根据所述第二用户项目评分矩阵计算测试项目的相似项目集;第二测试装置434,其用于根据所述相似项目集计算测试用户对测试项目的第二评分。
优选地,所述第一计算装置43还包括第十计算装置435,其用于根据所述第一评分和第二评分计算所述最终预测评分。
优选地,所述第一推荐装置44包括第二推荐装置441,其用于将所述最终预测评分较高的若干项目推荐给用户。
在本实施例的一个优选例中,所述第一获取装置411包括第一提取装置,其用于从网页数据中提取用户对项目的评分。
在本实施例的一个优选例中,所述第二计算装置421包括第三计算装置,其用于利用调整的余弦相似度算法计算用户的相似用户群。
在本实施例的一个优选例中,所述第四计算装置423包括第五计算装置,其用于利用调整的余弦相似度算法计算项目的相似项目群。
在本实施例的一个优选例中,所述第六计算装置425包括第七计算装置,其用于利用方差、平均值计算每个所述用户项目评分矩阵中的空白评分的基值评分值。
在本实施例的一个变化例中,所述第一推荐装置44可以被省略。
进一步地,本领域技术人员理解,优选地,图3所示控制装置与上述图2所示步骤对应,即本领域技术人员可以参考图2所示实施例以及变化例实现图3所示控制装置,在此不予赘述。
进一步地,图4示出根据本发明的一个具体实施方式的,联合基于用户和项目的协同过滤提高准确度的控制方法的示意图。本领域技术人员理解,图4所示实施方式与图2所示流程图的原理比较接近。具体地,本发明所提供的控制装置或类似装置根据第一用户项目评分矩阵、通过基值估计(本领域技术人员可以参考图2所示步骤S2223实现此步骤)或基于用户的协同过滤算法(本领域技术人员可以参考图2所示步骤S2221实现此步骤)或基于项目的协同过滤算法(本领域技术人员可以参考图2所示步骤S2222实现此步骤)来计算空白评分,并相应地生成第二用户项目评分矩阵。
再进一步地,图5示出根据本发明的另一个具体实施方式的,联合基于用户和项目的协同过滤提高准确度的控制方法的示意图。具体地,在本实施方式中,首先提取MovieLens中的用户评分数据,然后再基于这些数据构建原始的用户项目评分矩阵。例如通过对MovieLens网页数据进行提取,从而提取用户对个项目(电影)的评分。类似地,图5所示实施方式与图2所示流程图的原理比较接近,本领域技术人员结合现有技术以及上述实施例可以实现本实施方式,在此不予赘述。
进一步地,本领域技术人员理解,上述图1至图5所示实施例可以通过如下例子予以进一步说明。
1)通过对MovieLens网页数据进行抓取,提取出用户对项目的评分,利提取出的数据,构造第一用户项目评分矩阵Table1,即如下图所示的第一用户项目评分矩阵:
Figure BSA00000403486200111
2)根据基于用户的协同过滤方法,利用调整的余弦相似度算法计算用户的相似用户集,并利用此相似用户集,计算第一用户项目评分矩阵中的每一个空白评分,如公式(1),其中xi,n表示用户i对项目n的评分,su(ui,ua)表示用户ui与ua通过余弦相似度算法计算出的相似值,su(ui)指用户ui的相似用户集,xa,n指在第一用户项目评分矩阵中的评分。
X i , n = Σ u a ∈ s u ( u i ) S u ( u i , u a ) * X a , n Σ u a ∈ s u ( u i ) S u ( u i , u a ) - - - ( 1 )
3)根据基于项目的协同过滤方法,利用调整的余弦相似度算法计算项目的相似用户集,并利用此相似项目集,计算第一用户项目评分矩阵中的每一个空白评分,如公式(2),其中xm,j表示用户m对项目j的评分,si(ib,ij)表示用户ib与ij通过余弦相似度算法计算出的相似值,si(ii)指用户ii的相似用户集,xn,b指在第一用户项目评分矩阵中的评分。
X m , j = Σ i b ∈ s i ( i j ) S i ( i b , i j ) * X n , b Σ i b ∈ s i ( i j ) S i ( i b , i j ) - - - ( 2 )
4)根据第一用户项目评分的方差σ以及每行平均值ru和每列的平均值ri,最后基值为b=σ+ru+ri
5)利用参数α联合第2)、3)、4)的计算结果如公式(3),并填充第一用户评分矩阵,以此构建第二用户评分矩阵Table2(即第二用户项目评分矩阵)。
X ^ i , j , = b i , j + α * X i , k + ( 1 - α ) * x k , j - - - ( 3 )
Figure BSA00000403486200121
6)根据第二评分矩阵,分别利用基于用户和基于项目的协调过滤方法计算预测评分,并把计算的预测评分利用参数联合起来,即可求出最后的预测评分。与之前的步骤2)、3)方法一致,在此不予赘述。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。

Claims (30)

1.一种联合基于用户和项目的协同过滤提高准确度的控制方法,其特征在于,包括如下步骤:
a.构建第一用户项目评分矩阵;
b.填充所述第一用户项目评分矩阵以生成第二用户项目评分矩阵;
c.根据所述第二用户项目评分矩阵计算最终预测评分。
2.根据权利要求1所述的控制方法,其特征在于,所述步骤a包括如下步骤:
a1.获取用户对项目的评分;
a2.根据用户对项目的评分构建所述第一用户项目评分矩阵。
3.根据权利要求2所述的控制方法,其特征在于,所述步骤a1包括如下步骤:
a11.从网页数据中提取用户对项目的评分。
4.根据权利要求1至3中任一项所述的控制方法,其特征在于,所述步骤b包括如下步骤:
b1.根据基于用户的协同过滤算法计算所述第一用户项目评分矩阵中的空白评分;
b2.用步骤b1的计算结果填充所述第一用户项目评分矩阵的各个空白评分。
5.根据权利要求4所述的控制方法,其特征在于,所述步骤b1包括如下步骤:
b11.利用调整的余弦相似度算法计算用户的相似用户群。
6.根据权利要求4或5所述的控制方法,其特征在于,所述步骤b包括如下步骤:
b1′.根据基于项目的协同过滤算法计算所述第一用户项目评分矩阵中的空白评分;
b2′.用步骤b1′的计算结果填充所述第一用户项目评分矩阵的各个空白评分。
7.根据权利要求6所述的控制方法,其特征在于,所述步骤b1′包括如下步骤:
b11′.利用调整的余弦相似度算法计算项目的相似项目群。
8.根据权利要求4至7中任一项所述的控制方法,其特征在于,所述步骤b包括如下步骤:
b1″.通过基值计算所述第一用户项目评分矩阵中的空白评分;
b2″.用步骤b1″的计算结果填充所述第一用户项目评分矩阵的各个空白评分。
9.根据权利要求8所述的控制方法,其特征在于,所述步骤b1″包括如下步骤:
b11″.利用方差、平均值计算每个所述用户项目评分矩阵中的空白评分的基值评分值。
10.根据权利要求1至9中任一项所述的控制方法,其特征在于,所述步骤b包括如下步骤:
b3.将填充后的所述第一用户项目评分矩阵作为所述第二用户项目评分矩阵。
11.根据权利要求1至10中任一项所述的控制方法,其特征在于,所述步骤c包括如下步骤:
c1.根据所述第二用户项目评分矩阵计算测试用户的相似用户集;
c2.根据所述相似用户集计算测试用户对测试项目的第一评分。
12.根据权利要求1至11中任一项所述的控制方法,其特征在于,所述步骤c包括如下步骤:
c1′.根据所述第二用户项目评分矩阵计算测试项目的相似项目集;
c2′.根据所述相似项目集计算测试用户对测试项目的第二评分。
13.根据权利要求11或12所述的控制方法,其特征在于,所述步骤c包括如下步骤:
c3.根据所述第一评分和第二评分计算所述最终预测评分。
14.根据权利要求1至13中任一项所述的控制方法,其特征在于,还包括如下步骤:
d.根据所述最终预测评分向用户推荐项目。
15.根据权利要求14所述的控制方法,其特征在于,所述步骤d包括如下步骤:
d1.将所述最终预测评分较高的若干项目推荐给用户。
16.一种联合基于用户和项目的协同过滤提高准确度的控制装置,其特征在于,包括如下装置:
第一构建装置,其用于构建第一用户项目评分矩阵;
第一填充装置,其用于填充所述第一用户项目评分矩阵以生成第二用户项目评分矩阵;
第一计算装置,其用于根据所述第二用户项目评分矩阵计算最终预测评分。
17.根据权利要求16所述的控制装置,其特征在于,所述第一构建装置包括如下装置:
第一获取装置,其用于获取用户对项目的评分;
第二构建装置,其用于根据用户对项目的评分构建所述第一用户项目评分矩阵。
18.根据权利要求17所述的控制装置,其特征在于,所述第一获取装置包括如下装置:
第一提取装置,其用于从网页数据中提取用户对项目的评分。
19.根据权利要求16至18中任一项所述的控制装置,其特征在于,所述第一填充装置包括如下装置:
第二计算装置,其用于根据基于用户的协同过滤算法计算所述第一用户项目评分矩阵中的空白评分;
第二填充装置,其用于用第二计算装置的计算结果填充所述第一用户项目评分矩阵的各个空白评分。
20.根据权利要求19所述的控制装置,其特征在于,所述第二计算装置包括如下装置:
第三计算装置,其用于利用调整的余弦相似度算法计算用户的相似用户群。
21.根据权利要求19或20所述的控制装置,其特征在于,所述第一填充装置包括如下装置:
第四计算装置,其用于根据基于项目的协同过滤算法计算所述第一用户项目评分矩阵中的空白评分;
第三填充装置,其用于用第四计算装置的计算结果填充所述第一用户项目评分矩阵的各个空白评分。
22.根据权利要求21所述的控制装置,其特征在于,所述第四计算装置包括如下装置:
第五计算装置,其用于利用调整的余弦相似度算法计算项目的相似项目群。
23.根据权利要求19至22中任一项所述的控制装置,其特征在于,所述第一填充装置包括如下装置:
第六计算装置,其用于通过基值计算所述第一用户项目评分矩阵中的空白评分;
第四填充装置,其用于用第六计算装置的计算结果填充所述第一用户项目评分矩阵的各个空白评分。
24.根据权利要求23所述的控制装置,其特征在于,所述第六计算装置包括如下装置:
第七计算装置,其用于利用方差、平均值计算每个所述用户项目评分矩阵中的空白评分的基值评分值。
25.根据权利要求16至24中任一项所述的控制装置,其特征在于,所述第一填充装置包括如下装置:
第一处理装置,其用于将填充后的所述第一用户项目评分矩阵作为所述第二用户项目评分矩阵。
26.根据权利要求16至25中任一项所述的控制装置,其特征在于,所述第一计算装置包括如下装置:
第八计算装置,其用于根据所述第二用户项目评分矩阵计算测试用户的相似用户集;
第一测试装置,其用于根据所述相似用户集计算测试用户对测试项目的第一评分。
27.根据权利要求16至26中任一项所述的控制装置,其特征在于,所述第一计算装置包括如下装置:
第九计算装置,其用于根据所述第二用户项目评分矩阵计算测试项目的相似项目集;
第二测试装置,其用于根据所述相似项目集计算测试用户对测试项目的第二评分。
28.根据权利要求26或27所述的控制装置,其特征在于,所述第一计算装置包括如下装置:
第十计算装置,其用于根据所述第一评分和第二评分计算所述最终预测评分。
29.根据权利要求16至28中任一项所述的控制装置,其特征在于,还包括如下装置:
第一推荐装置,其用于根据所述最终预测评分向用户推荐项目。
30.根据权利要求29所述的控制装置,其特征在于,所述第一推荐装置包括如下装置:
第二推荐装置,其用于将所述最终预测评分较高的若干项目推荐给用户。
CN2010106138093A 2010-12-24 2010-12-24 联合基于用户和项目的协同过滤提高准确度的方法及装置 Pending CN102541920A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010106138093A CN102541920A (zh) 2010-12-24 2010-12-24 联合基于用户和项目的协同过滤提高准确度的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010106138093A CN102541920A (zh) 2010-12-24 2010-12-24 联合基于用户和项目的协同过滤提高准确度的方法及装置

Publications (1)

Publication Number Publication Date
CN102541920A true CN102541920A (zh) 2012-07-04

Family

ID=46348836

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010106138093A Pending CN102541920A (zh) 2010-12-24 2010-12-24 联合基于用户和项目的协同过滤提高准确度的方法及装置

Country Status (1)

Country Link
CN (1) CN102541920A (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103995878A (zh) * 2014-05-23 2014-08-20 中国科学技术大学 一种分布式个性化推荐方法及系统
CN104715399A (zh) * 2015-04-09 2015-06-17 苏州大学 一种评分预测方法与系统
CN104854580A (zh) * 2013-09-10 2015-08-19 华为技术有限公司 一种推荐方法和设备
CN104881499A (zh) * 2015-06-19 2015-09-02 中国石油大学(华东) 一种基于属性评分缩放的协同过滤推荐方法
CN105095312A (zh) * 2014-05-22 2015-11-25 阿里巴巴集团控股有限公司 网页前端性能的评估方法和系统
CN105282616A (zh) * 2015-11-13 2016-01-27 云南大学 一种组合协同过滤iptv节目推荐方法
CN105868334A (zh) * 2016-03-28 2016-08-17 云南财经大学 一种基于特征递增型的电影个性化推荐方法及系统
CN105976229A (zh) * 2016-05-13 2016-09-28 云南大学 一种基于用户和项目混合的协同过滤算法
CN106471491A (zh) * 2015-05-29 2017-03-01 深圳市汇游智慧旅游网络有限公司 一种时变的协同过滤推荐方法
CN106844557A (zh) * 2016-12-30 2017-06-13 东软集团股份有限公司 信息推荐方法及装置
CN106910148A (zh) * 2017-01-19 2017-06-30 崔翛龙 基于协同过滤的指挥要素自适应推送方法
CN107506488A (zh) * 2017-09-21 2017-12-22 程丹秋 一种智能音乐推荐系统
CN107833070A (zh) * 2017-10-24 2018-03-23 重庆邮电大学 一种推荐系统中缓解数据稀疏性问题的交叉动态填充方法
CN108197209A (zh) * 2017-12-28 2018-06-22 重庆理工大学 一种基于加权协同过滤算法的电影推荐方法
CN108205682A (zh) * 2016-12-19 2018-06-26 同济大学 一种用于个性化推荐的融合内容和行为的协同过滤方法
CN108810640A (zh) * 2018-06-15 2018-11-13 重庆知遨科技有限公司 一种电视节目的推荐方法
CN109684552A (zh) * 2018-12-26 2019-04-26 云南宾飞科技有限公司 一种智能信息推荐系统
CN110334284A (zh) * 2019-04-03 2019-10-15 厦门大学 一种新型融合多因素决策的推荐方法
CN110968793A (zh) * 2019-11-11 2020-04-07 辽宁师范大学 基于协同过滤混合填充的用户冷启动推荐算法
CN111274493A (zh) * 2020-01-17 2020-06-12 电子科技大学 一种基于多源用户评论的评分预测方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101320461A (zh) * 2008-07-01 2008-12-10 浙江大学 基于电阻网络和稀疏数据预测的协同过滤方法
CN101329683A (zh) * 2008-07-25 2008-12-24 华为技术有限公司 推荐系统及方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101320461A (zh) * 2008-07-01 2008-12-10 浙江大学 基于电阻网络和稀疏数据预测的协同过滤方法
CN101329683A (zh) * 2008-07-25 2008-12-24 华为技术有限公司 推荐系统及方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HAO MA ETC.: "Effective Missing Data Prediction for Collaborative Filtering", 《PROCEEDINGS OF THE 30TH ANNUAL INTERNATIONAL ACM SIGIR CONFERENCE ON RESEARCH AND DEVELOPMENT IN INFORMATION RETRIEVAL》 *

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104854580A (zh) * 2013-09-10 2015-08-19 华为技术有限公司 一种推荐方法和设备
CN104854580B (zh) * 2013-09-10 2018-09-28 华为技术有限公司 一种推荐方法和设备
CN105095312B (zh) * 2014-05-22 2018-10-02 阿里巴巴集团控股有限公司 网页前端性能的评估方法和系统
CN105095312A (zh) * 2014-05-22 2015-11-25 阿里巴巴集团控股有限公司 网页前端性能的评估方法和系统
CN103995878B (zh) * 2014-05-23 2017-10-27 中国科学技术大学 一种分布式个性化推荐方法及系统
CN103995878A (zh) * 2014-05-23 2014-08-20 中国科学技术大学 一种分布式个性化推荐方法及系统
CN104715399A (zh) * 2015-04-09 2015-06-17 苏州大学 一种评分预测方法与系统
CN104715399B (zh) * 2015-04-09 2018-03-02 苏州大学 一种评分预测方法与系统
CN106471491A (zh) * 2015-05-29 2017-03-01 深圳市汇游智慧旅游网络有限公司 一种时变的协同过滤推荐方法
CN104881499A (zh) * 2015-06-19 2015-09-02 中国石油大学(华东) 一种基于属性评分缩放的协同过滤推荐方法
CN105282616A (zh) * 2015-11-13 2016-01-27 云南大学 一种组合协同过滤iptv节目推荐方法
CN105868334A (zh) * 2016-03-28 2016-08-17 云南财经大学 一种基于特征递增型的电影个性化推荐方法及系统
CN105976229A (zh) * 2016-05-13 2016-09-28 云南大学 一种基于用户和项目混合的协同过滤算法
CN108205682B (zh) * 2016-12-19 2021-10-08 同济大学 一种用于个性化推荐的融合内容和行为的协同过滤方法
CN108205682A (zh) * 2016-12-19 2018-06-26 同济大学 一种用于个性化推荐的融合内容和行为的协同过滤方法
CN106844557A (zh) * 2016-12-30 2017-06-13 东软集团股份有限公司 信息推荐方法及装置
CN106910148A (zh) * 2017-01-19 2017-06-30 崔翛龙 基于协同过滤的指挥要素自适应推送方法
CN106910148B (zh) * 2017-01-19 2020-11-17 崔翛龙 基于协同过滤的指挥要素自适应推送方法
CN107506488A (zh) * 2017-09-21 2017-12-22 程丹秋 一种智能音乐推荐系统
CN107833070A (zh) * 2017-10-24 2018-03-23 重庆邮电大学 一种推荐系统中缓解数据稀疏性问题的交叉动态填充方法
CN108197209B (zh) * 2017-12-28 2020-03-31 重庆理工大学 一种基于加权协同过滤算法的电影推荐方法
CN108197209A (zh) * 2017-12-28 2018-06-22 重庆理工大学 一种基于加权协同过滤算法的电影推荐方法
CN108810640A (zh) * 2018-06-15 2018-11-13 重庆知遨科技有限公司 一种电视节目的推荐方法
CN108810640B (zh) * 2018-06-15 2020-12-18 浙江广业软件科技有限公司 一种电视节目的推荐方法
CN109684552A (zh) * 2018-12-26 2019-04-26 云南宾飞科技有限公司 一种智能信息推荐系统
CN110334284A (zh) * 2019-04-03 2019-10-15 厦门大学 一种新型融合多因素决策的推荐方法
CN110334284B (zh) * 2019-04-03 2021-07-30 厦门大学 一种新型融合多因素决策的推荐方法
CN110968793A (zh) * 2019-11-11 2020-04-07 辽宁师范大学 基于协同过滤混合填充的用户冷启动推荐算法
CN111274493A (zh) * 2020-01-17 2020-06-12 电子科技大学 一种基于多源用户评论的评分预测方法

Similar Documents

Publication Publication Date Title
CN102541920A (zh) 联合基于用户和项目的协同过滤提高准确度的方法及装置
Sklenicka et al. The Farmland Rental Paradox: Extreme land ownership fragmentation as a new form of land degradation
CN103714139B (zh) 一种移动海量客户群识别的并行数据挖掘方法
Sadaei et al. Combining ARFIMA models and fuzzy time series for the forecast of long memory time series
CN102982107B (zh) 一种融合用户、项目和上下文属性信息的推荐系统优化方法
CN102866992B (zh) 一种在网页中显示产品信息的方法及装置
Cheong Methods for Ex ante economic evaluation of Free Trade Agreements
CN109933699A (zh) 一种学术画像模型的构建方法及装置
CN105931116A (zh) 基于深度学习机制的自动化信用评分系统及方法
CN105117460A (zh) 学习资源推荐方法和系统
CN105893609A (zh) 一种基于加权混合的移动app推荐方法
CN104166731A (zh) 一种社交网络重叠社区发现系统及其方法
CN104798043A (zh) 一种数据处理方法和计算机系统
CN104718547A (zh) 顾客数据解析系统
Foroni et al. Explaining the time-varying effects of oil market shocks on US stock returns
Galinato et al. The short-run and long-run effects of corruption control and political stability on forest cover
CN106776928A (zh) 基于内存计算框架、融合社交环境及时空数据的位置推荐方法
CN103365842B (zh) 一种页面浏览推荐方法及装置
Li et al. Knowledge transfer and adaptation for land-use simulation with a logistic cellular automaton
CN111882420A (zh) 响应率的生成方法、营销方法、模型训练方法及装置
CN105869017A (zh) 票价预测方法及系统
CN106209959A (zh) 基于用户需求的网络服务智能发现方法
Lien et al. A note on using ratio variables in regression analysis
CN104112366A (zh) 基于隐语义模型的交通信号优化方法
CN104484554B (zh) 一种获取课程关联度的方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C05 Deemed withdrawal (patent law before 1993)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120704