CN114048378A - 一种基于btm模型的个性化推荐方法 - Google Patents

一种基于btm模型的个性化推荐方法 Download PDF

Info

Publication number
CN114048378A
CN114048378A CN202111327741.7A CN202111327741A CN114048378A CN 114048378 A CN114048378 A CN 114048378A CN 202111327741 A CN202111327741 A CN 202111327741A CN 114048378 A CN114048378 A CN 114048378A
Authority
CN
China
Prior art keywords
user
scoring
users
item
recommendation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111327741.7A
Other languages
English (en)
Other versions
CN114048378B (zh
Inventor
范博全
余刚
马晓强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Fanhua Aviation Instrument and Electrical Co Ltd
Original Assignee
Sichuan Fanhua Aviation Instrument and Electrical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Fanhua Aviation Instrument and Electrical Co Ltd filed Critical Sichuan Fanhua Aviation Instrument and Electrical Co Ltd
Priority to CN202111327741.7A priority Critical patent/CN114048378B/zh
Publication of CN114048378A publication Critical patent/CN114048378A/zh
Application granted granted Critical
Publication of CN114048378B publication Critical patent/CN114048378B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Databases & Information Systems (AREA)
  • Development Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Tourism & Hospitality (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Educational Administration (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于BTM模型的个性化推荐方法,将每个用户对于各项目的特征项目及各特征项目的数据信息结合形成用户的偏好分布并训练得到BTM模型,然后使用用户的偏好分布通过JS散度计算各个用户之间的相似度、各个用户的评分可信度,接着将各个用户之间的相似度与用户的评分准确度结合得到推荐权重,通过和目标用户最相似的若干用户来预测目标用户对于目标项目的预测评分,并使用推荐权重对预测评分进行修正,最后采用TOP‑N原则实现项目的推荐,引入了用户的评分可信度,从评分时间和评分准确度两个层面对评分预测进行了修正,一定程度上缓解评分偏差带来的影响,提高了推荐的准确度,提升用户的体验。

Description

一种基于BTM模型的个性化推荐方法
技术领域
本发明涉及大数据分析领域,特别涉及一种基于BTM模型的个性化推荐方法。
背景技术
随着互联网的普及和蓬勃发展,人们开始接触各式各样的网络应用,在此期间,各种网络数据开始急速增长起来。人们也逐渐受到“信息过载”带来的影响,与此同时,越来越多的网络平台开始提供个性化推荐服务,该服务利用用户的历史行为信息对用户进行新的信息推荐,来提升用户的体验以及节省用户的时间。个性化推荐涉及的首要问题就是数据稀疏,数据的稀疏性会直接影响最终预测推荐结果的准确性。
现有的推荐方法中,基于协同过滤的推荐方法是当前应用最为广泛且成熟的个性化推荐方法,因为该方法具有自动化推荐、个性化程度高、避免内容过滤不足,以及能为用户发现新的兴趣等优点。该方法的流程首先根据用户-项目矩阵结合相似度计算公式得出用户之间的相似度,然后选取与目标用户相似度高的用户作为最近邻用户,接着将最近邻用户的历史评分项目作为推荐候选集,预测目标用户对该候选集中的项目评分,最后选取评分最高的几个项目推荐给目标用户。
对于现有的基于协同过滤的个性化推荐,存在以下缺点:
1、当前方法面临推荐准确度低问题,仅凭现有的用户评分信息为目标用户寻找近邻缺乏全面性;
2、当前方法存在冷启动问题,具体分为三类:可用用户信息较少的用户冷启动问题、可用项目信息较少的冷启动问题、新系统冷启动问题;
3、当前方法面临数据稀疏问题,用户查看的项目信息只是很少的一部分,这就导致了得到的用户和项目的关联信息较少。
发明内容
本发明的目的在于:提供了一种基于BTM模型的个性化推荐方法,引入了用户的评分可信度,从评分时间和评分准确度两个层面对评分预测进行了修正,一定程度上缓解评分偏差带来的影响,提高了推荐的准确度,提升用户的体验。
本发明采用的技术方案如下:
一种基于BTM模型的个性化推荐方法,将每个用户对于各项目的特征项目及各特征项目的数据信息结合形成用户的偏好分布并训练得到BTM模型,然后使用用户的偏好分布通过JS散度计算各个用户之间的相似度、各个用户的评分可信度,接着将各个用户之间的相似度与用户的评分准确度结合得到推荐权重,通过和目标用户最相似的若干用户来预测目标用户对于目标项目的预测评分,并使用推荐权重对预测评分进行修正,最后采用TOP-N原则实现项目的推荐。
具体包括以下步骤:
步骤S1数据预处理:获取用户u对项目的订购时间、评分时间、评分信息和评论内容这四个特征项目的数据信息得到用户的数据集,将数据集中的每个特征项目的数据信息进行切分,将每个特征项目中的数据信息分为训练集、验证集和测试集;
步骤S2获取项目特征分布:使用经过预处理后的训练集进行训练得到BTM主题模型,并选择BTM主题模型中参数的最佳值,使得到的BTM主题模型在验证集中达到最佳性能,最后再使用BTM主题模型对测试集进行模型性能测试,得到BTM主题模型在各个特征项目上的概率分布θ,项目i在n个特征项目上的概率分布θi表示为θi=(θ1,i,θ2,i,…,θn,i);
步骤S3获取用户的偏好分布:对用户u在项目的评分信息中的空白评分进行填充,再结合用户u对不同项目的评分信息的特征分布以及用户u对项目i的评分信息Ru,i,得到用户u的偏好分布Pu,偏好分布Pu表示为Pu=θi·Ru,i
步骤S4计算用户之间的相似度:用JS散度计算用户偏好分布之间的相似度,用户u和用户v之间的偏好相似度JS(Pu‖Pv)的计算方法为:
Figure BDA0003347541220000021
再利用JS散度改进得到用户u和用户v之间的相似度sim(u,v)为
Figure BDA0003347541220000022
步骤S5获取用户评分可信度:计算用户u的评分准确度ac(u)为
Figure BDA0003347541220000023
然后计算评分时间所占的权重time(u)为
Figure BDA0003347541220000024
最后计算得到用户u的评分可信度cret(u)为
Figure BDA0003347541220000025
其中,
Figure BDA0003347541220000026
是项目i的均值评分,RTu,i是用户u对项目i的评分时间,BTu,i是用户u对项目i的订购时间,参数n是项目的总个数,
Figure BDA0003347541220000027
是评分可信度平衡因子,
Figure BDA0003347541220000028
的取值范围为[0,1];
步骤S6计算优化的推荐权重:将步骤S4得到的用户相似度和步骤S5得到的评分可信度结合得到推荐权重recd(u,v)为recd(u,v)=cret(u)·sim(u,v);
步骤S7得到修正的评分预测:通过步骤S4获取的用户之间的相似度找到与目标用户u相似度最大的前K个用户,并通过这K个用户来预测目标用户u对于项目i的评分
Figure BDA0003347541220000031
预测方法为:
Figure BDA0003347541220000032
再将从步骤S6中获取的推荐权重recd(u,v)用于修正预测的评分
Figure BDA0003347541220000033
得到修正后的预测评分
Figure BDA0003347541220000034
Figure BDA0003347541220000035
其中Rv,i是用户v对项目i的评分信息;
步骤S8采用Top-N原则推荐:在求得目标用户u对项目i的预测评分后,根据Top-N原从目标用户u对项目的预测评分中找出预测评分排名前N的项目,组成目标用户u的项目推荐集合,将项目推荐集合内的项目推荐给目标用户u。
为了更好地实现本方案,进一步地,所述步骤S1中将每个特征项目中60%的数据信息作为训练集、20%的数据信息作为验证集、20%的数据信息作为测试集。
为了更好地实现本方案,进一步地,所述步骤S3中使用均值法对用户u在项目的评分信息中的空白评分进行填充。
本方案区别于现有的基于协同过滤的推荐方法,能够为用户提供个性化的项目推荐。首先使用用户对项目的特征项目的数据信息训练BTM模型,这里结合了用户对项目的特征项目的评分信息,优化了用户的偏好分布。另外,在计算用户之间的相似度时,采用JS散度对偏好相似度JS(Pu‖Pv)进行改进,得到了改进后的相似度sim(u,v),使得用户之间的相似程度计算的更加准确。而在获取用户评分可信度时,也是将用户原始的评分信息和评分信息的平均值的误差获取评分准确度,然后考虑到时间因素对评分准确度的影响,结合项目的评分时间进行改进。然后融入近邻用户的相似度,获取优化后的推荐权重,进而提高最终推荐结果的准确度。而在进行评分预测时,会使用到前面经过优化的推荐权重修正现有的评分预测公式,带来更准确的评分预测结果。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
1.本发明所述的一种基于BTM模型的个性化推荐方法,引入了用户的评分可信度,从评分时间和评分准确度两个层面对评分预测进行了修正,一定程度上缓解评分偏差带来的影响,提高了推荐的准确度,提升用户的体验;
2.本发明所述的一种基于BTM模型的个性化推荐方法,引入了用户的评分可信度,从评分时间和评分准确度两个层面对评分预测进行了修正,由于在某一领域内用户的评分可信度在一定时间范围内处于基本稳定的状态,因此本发明方法也适合离线运行;
3.本发明所述的一种基于BTM模型的个性化推荐方法,引入了用户的评分可信度,从评分时间和评分准确度两个层面对评分预测进行了修正,可以缓解用户的冷启动问题,通过均值法对空白的评分进行填充,为新用户赋予平均评分,便可为其推荐大众喜欢的项目,而且后期根据用户的一些操作,可以改进该用户的偏好分布,持续优化该用户的推荐结果;
4.本发明所述的一种基于BTM模型的个性化推荐方法,引入了用户的评分可信度,从评分时间和评分准确度两个层面对评分预测进行了修正,本方案使用了用户评论信息,利用该评论信息训练BTM模型获取项目特征分布,并结合用户的评分信息得到用户的偏好分布,因为评论信息可以更好的丰富用户的偏好信息,从而得到更准确的用户的偏好分布,不仅缓解了数据稀疏带来的问题,还能提升后期评分预测的准确度。
附图说明
为了更清楚地说明本技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图,其中:
图1是本发明的流程示意图;
图2是本发明的训练BTM模型的过程示意图。
具体实施方式
为了更清楚地说明本发明实施例的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,应当理解,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例,因此不应被看作是对保护范围的限定。基于本发明中的实施例,本领域普通技术工作人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“设置”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;也可以是直接相连,也可以是通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
下面结合图1至图2对本发明作详细说明。
实施例1:
一种基于BTM模型的个性化推荐方法,如图1,将每个用户对于各项目的特征项目及各特征项目的数据信息结合形成用户的偏好分布并训练得到BTM模型,然后使用用户的偏好分布通过JS散度计算各个用户之间的相似度、各个用户的评分可信度,接着将各个用户之间的相似度与用户的评分准确度结合得到推荐权重,通过和目标用户最相似的若干用户来预测目标用户对于目标项目的预测评分,并使用推荐权重对预测评分进行修正,最后采用TOP-N原则实现项目的推荐。
工作原理:本方案所述的一种基于BTM模型的个性化推荐方法,引入了用户的评分可信度,从评分时间和评分准确度两个层面对评分预测进行了修正,一定程度上缓解评分偏差带来的影响,提高了推荐的准确度,提升用户的体验。另外,由于在某一领域内用户的评分可信度在一定时间范围内处于基本稳定的状态,因此本方案也适合离线运行。本方案还对空白的评分进行填充,为新用户赋予平均评分,便可为新用户推荐大众喜欢的项目,而且后期根据用户的一些操作,可以改进该用户的偏好分布,持续优化该用户的推荐结果,可以缓解用户的冷启动问题;本方案使用了用户评论信息,利用该评论信息训练BTM模型获取项目特征分布,并结合用户的评分信息得到用户的偏好分布,因为评论信息可以更好的丰富用户的偏好信息,从而得到更准确的用户的偏好分布,不仅缓解了数据稀疏带来的问题,还能提升后期评分预测的准确度。
实施例2:
本方案在实施例1的基础上,具体包括以下步骤:
步骤S1数据预处理:获取用户u对项目的订购时间、评分时间、评分信息和评论内容这四个特征项目的数据信息得到用户的数据集,将数据集中的每个特征项目的数据信息进行切分,将每个特征项目中的数据信息分为训练集、验证集和测试集;
步骤S2获取项目特征分布:使用经过预处理后的训练集进行训练得到BTM主题模型,训练BTM模型的过程如图2,并选择BTM主题模型中参数的最佳值,使得到的BTM主题模型在验证集中达到最佳性能,最后再使用BTM主题模型对测试集进行模型性能测试,得到BTM主题模型在各个特征项目上的概率分布θ,项目i在n个特征项目上的概率分布θi表示为θi=(θ1,i,θ2,i,…,θn,i);
步骤S3获取用户的偏好分布:对用户u在项目的评分信息中的空白评分进行填充,再结合用户u对不同项目的评分信息的特征分布以及用户u对项目i的评分信息Ru,i,得到用户u的偏好分布Pu,偏好分布Pu表示为Pu=θi·Ru,i
步骤S4计算用户之间的相似度:用JS散度计算用户偏好分布之间的相似度,用户u和用户v之间的偏好相似度JS(Pu‖Pv)的计算方法为:
Figure BDA0003347541220000051
再利用JS散度改进得到用户u和用户v之间的相似度sim(u,v)为
Figure BDA0003347541220000061
步骤S5获取用户评分可信度:计算用户u的评分准确度ac(u)为
Figure BDA0003347541220000062
然后计算评分时间所占的权重time(u)为
Figure BDA0003347541220000063
最后计算得到用户u的评分可信度cret(u)为
Figure BDA0003347541220000064
其中,
Figure BDA0003347541220000065
是项目i的均值评分,RTu,i是用户u对项目i的评分时间,BTu,i是用户u对项目i的订购时间,参数n是项目的总个数,
Figure BDA0003347541220000066
是评分可信度平衡因子,
Figure BDA0003347541220000067
的取值范围为[0,1];
步骤S6计算优化的推荐权重:将步骤S4得到的用户相似度和步骤S5得到的评分可信度结合得到推荐权重recd(u,v)为recd(u,v)=cret(u)·sim(u,v);
步骤S7得到修正的评分预测:通过步骤S4获取的用户之间的相似度找到与目标用户u相似度最大的前K个用户,并通过这K个用户来预测目标用户u对于项目i的评分
Figure BDA0003347541220000068
预测方法为:
Figure BDA0003347541220000069
再将从步骤S6中获取的推荐权重recd(u,v)用于修正预测的评分
Figure BDA00033475412200000610
得到修正后的预测评分
Figure BDA00033475412200000611
Figure BDA00033475412200000612
其中Rv,i是用户v对项目i的评分信息;
步骤S8采用Top-N原则推荐:在求得目标用户u对项目i的预测评分后,根据Top-N原从目标用户u对项目的预测评分中找出预测评分排名前N的项目,组成目标用户u的项目推荐集合,将项目推荐集合内的项目推荐给目标用户u。
工作原理:本方案区别于现有的基于协同过滤的推荐方法,能够为用户提供个性化的项目推荐。首先使用用户对项目的特征项目的数据信息训练BTM模型,这里结合了用户对项目的特征项目的评分信息,优化了用户的偏好分布。另外,在计算用户之间的相似度时,采用JS散度对偏好相似度JS(Pu‖Pv)进行改进,得到了改进后的相似度sim(u,v),使得用户之间的相似程度计算的更加准确。而在获取用户评分可信度时,也是将用户原始的评分信息和评分信息的平均值的误差获取评分准确度,然后考虑到时间因素对评分准确度的影响,结合项目的订购时间和评分时间进行改进。然后融入近邻用户的相似度,获取优化后的推荐权重,进而提高最终推荐结果的准确度。而在进行评分预测时,会使用到前面经过优化的推荐权重修正现有的评分预测公式,带来更准确的评分预测结果。
本实施例的其他部分与上述实施例1相同,故不再赘述。
实施例3:
本实施例是实施例2的进一步补充说明,所述步骤S1中将每个特征项目中60%的数据信息作为训练集、20%的数据信息作为验证集、20%的数据信息作为测试集。
所述步骤S3中使用均值法对用户u在项目的评分信息中的空白评分进行填充。
本实施例的其他部分与上述实施例2相同,故不再赘述。
以上所述,仅是本发明的较佳实施例,并非对本发明做任何形式上的限制,凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化,均落入本发明的保护范围之内。

Claims (4)

1.一种基于BTM模型的个性化推荐方法,其特征在于:将每个用户对于各项目的特征项目及各特征项目的数据信息结合形成用户的偏好分布并训练得到BTM模型,然后使用用户的偏好分布通过JS散度计算各个用户之间的相似度、各个用户的评分可信度,接着将各个用户之间的相似度与用户的评分准确度结合得到推荐权重,通过和目标用户最相似的若干用户来预测目标用户对于目标项目的预测评分,并使用推荐权重对预测评分进行修正,最后采用TOP-N原则实现项目的推荐。
2.根据权利要求1所述的一种基于BTM模型的个性化推荐方法,其特征在于,具体包括以下步骤:
步骤S1数据预处理:获取用户u对项目的订购时间、评分时间、评分信息和评论内容这四个特征项目的数据信息得到用户的数据集,将数据集中的每个特征项目的数据信息进行切分,将每个特征项目中的数据信息分为训练集、验证集和测试集;
步骤S2获取项目特征分布:使用经过预处理后的训练集进行训练得到BTM主题模型,并选择BTM主题模型中参数的最佳值,使得到的BTM主题模型在验证集中达到最佳性能,最后再使用BTM主题模型对测试集进行模型性能测试,得到BTM主题模型在各个特征项目上的概率分布θ,项目i在n个特征项目上的概率分布θi表示为θi=(θ1,i,θ2,i,…,θn,i);
步骤S3获取用户的偏好分布:对用户u在项目的评分信息中的空白评分进行填充,再结合用户u对不同项目的评分信息的特征分布以及用户u对项目i的评分信息Ru,i,得到用户u的偏好分布Pu,偏好分布Pu表示为Pu=θi·Ru,i
步骤S4计算用户之间的相似度:用JS散度计算用户偏好分布之间的相似度,用户u和用户v之间的偏好相似度JS(Pu‖Pv)的计算方法为:
Figure FDA0003347541210000011
再利用JS散度改进得到用户u和用户v之间的相似度sim(u,v)为
Figure FDA0003347541210000012
步骤S5获取用户评分可信度:计算用户u的评分准确度ac(u)为
Figure FDA0003347541210000013
然后计算评分时间所占的权重time(u)为
Figure FDA0003347541210000014
最后计算得到用户u的评分可信度cret(u)为
Figure FDA0003347541210000021
其中,
Figure FDA0003347541210000022
是项目i的均值评分,RTu,i是用户u对项目i的评分时间,BTu,i是用户u对项目i的订购时间,参数n是项目的总个数,
Figure FDA0003347541210000023
是评分可信度平衡因子,
Figure FDA0003347541210000024
的取值范围为[0,1];
步骤S6计算优化的推荐权重:将步骤S4得到的用户相似度和步骤S5得到的评分可信度结合得到推荐权重recd(u,v)为recd(u,v)=cret(u)·sim(u,v);
步骤S7得到修正的评分预测:通过步骤S4获取的用户之间的相似度找到与目标用户u相似度最大的前K个用户,并通过这K个用户来预测目标用户u对于项目i的评分
Figure FDA0003347541210000025
预测方法为:
Figure FDA0003347541210000026
再将从步骤S6中获取的推荐权重recd(u,v)用于修正预测的评分
Figure FDA0003347541210000027
得到修正后的预测评分
Figure FDA0003347541210000028
Figure FDA0003347541210000029
其中Rv,i是用户v对项目i的评分信息;
步骤S8采用Top-N原则推荐:在求得目标用户u对项目i的预测评分后,根据Top-N原从目标用户u对项目的预测评分中找出预测评分排名前N的项目,组成目标用户u的项目推荐集合,将项目推荐集合内的项目推荐给目标用户u。
3.根据权利要求1所述的一种基于BTM模型的个性化推荐方法,其特征在于:所述步骤S1中将每个特征项目中60%的数据信息作为训练集、20%的数据信息作为验证集、20%的数据信息作为测试集。
4.根据权利要求1所述的一种基于BTM模型的个性化推荐方法,其特征在于:所述步骤S3中使用均值法对用户u在项目的评分信息中的空白评分进行填充。
CN202111327741.7A 2021-11-10 2021-11-10 一种基于btm模型的个性化推荐方法 Active CN114048378B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111327741.7A CN114048378B (zh) 2021-11-10 2021-11-10 一种基于btm模型的个性化推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111327741.7A CN114048378B (zh) 2021-11-10 2021-11-10 一种基于btm模型的个性化推荐方法

Publications (2)

Publication Number Publication Date
CN114048378A true CN114048378A (zh) 2022-02-15
CN114048378B CN114048378B (zh) 2024-05-14

Family

ID=80208130

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111327741.7A Active CN114048378B (zh) 2021-11-10 2021-11-10 一种基于btm模型的个性化推荐方法

Country Status (1)

Country Link
CN (1) CN114048378B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150120722A1 (en) * 2013-10-31 2015-04-30 Telefonica Digital Espana, S.L.U. Method and system for providing multimedia content recommendations
CN105740444A (zh) * 2016-02-02 2016-07-06 桂林电子科技大学 基于用户评分的项目推荐方法
CN110324362A (zh) * 2019-06-12 2019-10-11 南京优慧信安科技有限公司 一种基于交互行为的区块链用户可信度评价方法
CN110825965A (zh) * 2019-10-25 2020-02-21 天津大学 一种基于信任机制和时间加权的改进协同过滤推荐方法
US10909196B1 (en) * 2018-02-26 2021-02-02 A9.Com, Inc. Indexing and presentation of new digital content
CN112507248A (zh) * 2020-09-18 2021-03-16 西北大学 一种基于用户评论数据和信任关系的旅游景点推荐方法
CN113407863A (zh) * 2021-06-17 2021-09-17 天津大学 基于信任度与遗忘函数的个性化产品服务方案推荐方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150120722A1 (en) * 2013-10-31 2015-04-30 Telefonica Digital Espana, S.L.U. Method and system for providing multimedia content recommendations
CN105740444A (zh) * 2016-02-02 2016-07-06 桂林电子科技大学 基于用户评分的项目推荐方法
US10909196B1 (en) * 2018-02-26 2021-02-02 A9.Com, Inc. Indexing and presentation of new digital content
CN110324362A (zh) * 2019-06-12 2019-10-11 南京优慧信安科技有限公司 一种基于交互行为的区块链用户可信度评价方法
CN110825965A (zh) * 2019-10-25 2020-02-21 天津大学 一种基于信任机制和时间加权的改进协同过滤推荐方法
CN112507248A (zh) * 2020-09-18 2021-03-16 西北大学 一种基于用户评论数据和信任关系的旅游景点推荐方法
CN113407863A (zh) * 2021-06-17 2021-09-17 天津大学 基于信任度与遗忘函数的个性化产品服务方案推荐方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
余浩: "融合信任度和相似度的协同过滤推荐算法研究", 信息科技, 15 January 2020 (2020-01-15) *
曾安;高成思;徐小强;: "融合时间因素和用户评分特性的协同过滤算法", 计算机科学, no. 09, 15 September 2017 (2017-09-15) *
高宇: "基于用户兴趣的混合推荐算法研究", 信息科技, 15 June 2021 (2021-06-15) *

Also Published As

Publication number Publication date
CN114048378B (zh) 2024-05-14

Similar Documents

Publication Publication Date Title
EP4080889A1 (en) Anchor information pushing method and apparatus, computer device, and storage medium
CN112765486B (zh) 一种融合知识图谱的注意力机制的电影推荐方法
CN109241405B (zh) 一种基于知识关联的学习资源协同过滤推荐方法及系统
CN108804683B (zh) 结合矩阵分解和协同过滤算法的电影推荐方法
CN105069122B (zh) 一种基于用户行为的个性化推荐方法及其推荐装置
CN110427567A (zh) 一种基于用户偏好相似度加权的协同过滤推荐方法
CN111061962A (zh) 一种基于用户评分分析的推荐方法
CN109471982B (zh) 一种基于用户和服务聚类QoS感知的Web服务推荐方法
CN108615177B (zh) 基于加权提取兴趣度的电子终端个性化推荐方法
CN111324807A (zh) 基于信任度的协同过滤推荐方法
CN108874916A (zh) 一种层叠组合协同过滤推荐方法
CN103927339B (zh) 知识重组系统和知识重组方法
CN108876536A (zh) 基于最近邻信息的协同过滤推荐方法
CN109977299A (zh) 一种融合项目热度和专家系数的推荐算法
CN106886559A (zh) 同时融入好友特征和相似用户特征的协同过滤方法
CN111538846A (zh) 基于混合协同过滤的第三方库推荐方法
CN109801146B (zh) 一种基于需求偏好的资源服务推荐方法及系统
CN109857939A (zh) 面向智能制造服务的精准推送方法
CN116578726A (zh) 一种个性化图书推荐系统
CN106095941B (zh) 基于大数据知识库的解决方案推荐方法和系统
CN110059257B (zh) 基于评分修正的项目推荐方法
CN106991122B (zh) 一种基于粒子群算法的电影推荐方法
CN114048378A (zh) 一种基于btm模型的个性化推荐方法
KR20210052746A (ko) 제품화 대상 콘텐츠의 예상 판매량 추정 방법, 장치 및 컴퓨터프로그램
CN109344481A (zh) 一种基于Plackett-Luce模型的在线服务评价方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant