CN109345274A - 基于bp神经网络评分预测误差的近邻用户选择方法 - Google Patents

基于bp神经网络评分预测误差的近邻用户选择方法 Download PDF

Info

Publication number
CN109345274A
CN109345274A CN201810842917.4A CN201810842917A CN109345274A CN 109345274 A CN109345274 A CN 109345274A CN 201810842917 A CN201810842917 A CN 201810842917A CN 109345274 A CN109345274 A CN 109345274A
Authority
CN
China
Prior art keywords
user
neuron
layer
neural network
article
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810842917.4A
Other languages
English (en)
Other versions
CN109345274B (zh
Inventor
王歌
王一歌
温锦雄
韦岗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201810842917.4A priority Critical patent/CN109345274B/zh
Publication of CN109345274A publication Critical patent/CN109345274A/zh
Application granted granted Critical
Publication of CN109345274B publication Critical patent/CN109345274B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Marketing (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Evolutionary Biology (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于BP神经网络评分预测误差的近邻用户选择方法,具体步骤如下:确定需要引入的k种物品属性特征,初始化每个物品的属性特征向量;利用BP神经网络为每个用户构建关于物品属性特征向量的评分预测模型;为每个用户筛选近邻用户:利用每个候选近邻用户的评分预测模型对当前用户的历史评价物品进行评分预测,统计每个候选近邻用户对目标用户的历史评价物品的整体预测误差Eu,v,那么候选近邻用户v与当前用户u的相似度为sim(u,v)=1/(1+Eu,v),最后为当前用户u选择相似度最高的前k个用户。本发明缓解了在稀疏评分矩阵下用户共同评价项目较少无法较好地描述用户间兴趣偏好相似性的问题,从而提高评分预测准确性。

Description

基于BP神经网络评分预测误差的近邻用户选择方法
技术领域
本发明涉及软件技术以及推荐算法领域,具体涉及一种基于BP神经网络评分预测误差的近邻用户选择方法。
背景技术
随着移动互联网的发展,信息过载的现象不断加剧,如何从海量的数据中为合适的用户推荐合适的信息是一种重要的课题,而推荐算法通过对历史数据进行数学分析,预测用户对新物品的满意度,从而推荐用户满意度较高的物品,而满意度可以用评分值来表示,因此推荐算法可以看作是一种评分预测算法。假设有用户集合U={u1,u2,...,um},物品集合I={i1,i2,...,in},用户对物品的满意程度可以用一个评分值来表示,那么我们可以用一个大小为m×n的评分矩阵R 来表示每个用户对物品的评分信息,其中矩阵第i行为ID为i的用户对所有物品的评分向量,那么第i行第j列的值则表示ID为i的用户对ID为j的物品的评分值,i,j≥1,由于实际中每个用户只会对物品集合I中的一部分物品进行评价,因此该评分矩阵通常是一个高度稀疏的矩阵,其中评分矩阵的缺失值根据具体场景可以用0或者其它缺失值处理方式处理。推荐算法的目标是希望利用当前评分矩阵已有信息去预测评分矩阵中的缺失值,从而预测用户对未知物品的评分值,从而为用户做出适合的推荐策略。
在推荐算法的发展过程中,协同过滤算法是目前应用最广泛而推荐效果最为有效的推荐算法,其中基于邻域的协调过滤算法是协同过滤中最典型的算法,该算法的核心思想是为当前用户寻找兴趣偏好相似的近邻用户,利用近邻用户的历史评分行为来为当前用户预测评分提供参考,因此需要一种相似度计算模型来衡量用户之间的相似度,从而可以较准确地为当前用户选择合适的近邻用户集合。传统的常用的相似度计算模型有余弦相似度,修正的余弦相似度,它们把每个用户的评分向量作为用户的特征向量,通过计算两个用户特征向量的相似度来衡量两个用户之间的相似度,此外只考虑用户共同的评分项目数而不考虑评分值差异的杰拉德相似度,这些相似度在两个用户的共同评分项目数较少的情况下直接计算用户间的相似度无法较好地描述用户之间的兴趣偏好相似性,因此国内外的学者针对传统的相似度计算模型也提出一些改进方法,比如引入用户的背景信息,把评分相似度和用户背景相似度采用线性加权的方式结合起来,这些方法从用户背景特征出发,基于背景特征相似的用户较大概率具有相似的兴趣偏好,最直观的认识为年龄偏小的用户对动画少儿题材的物品更感兴趣,一定程度上改进了传统的相似度方法,但是实际上用户背景特征相似的群体中每个用户个体还是存在差异;因此需要一种从用户个体的兴趣偏好出发,在评分矩阵稀疏用户共同评分项目较少的情况下能够较好地描述用户兴趣偏好相似度的方法,从而为用户选择兴趣偏好相似的近邻用户集。
发明内容
为了克服现有技术中存在的上述缺陷,本发明提供一种基于BP神经网络评分预测误差的近邻用户选择方法,通过本发明可以在评分矩阵稀疏用户共同评分项目数较少的情况下较好地衡量用户之间的兴趣偏好相似度。
本发明通过引入物品的属性特征,其中物品的属性特征可以是物品的某种题材,品牌,风格等等,比如对于音乐来说抒情,校园,摇滚等风格可以作为不同音乐作品的属性特征,相同的属性特征可以出现在不同的物品中,这个可以理解为具有抒情风格特征的音乐作品并不只有一首,而且同样具有民谣风格音乐兴趣偏好的两个用户的共同评价项目也可能存在重合度较少的情况,这种情况不能认为两个用户的兴趣偏好相差较大,而是可以考虑将两个用户各自历史评分物品相互推荐;物品的属性特征往往能够反映用户的兴趣偏好,而且能够表征物品特性,因此即使用户的共同评分项目数较少,但是各自的历史评分物品往往具有较相似的物品属性特征,比如喜欢民谣风格的两个用户,虽然各自收藏的作品列表不同,但是各自的收藏列表中往往可以都可以发现同样是民谣风格的不同作品。
本发明首先利用BP神经网络对用户的评分与物品所具有的属性特征之间的关系进行分析,得出每个用户关于物品属性特征的评分预测模型后,利用该预测模型计算用户间的相似度,在为当前用户选择近邻用户的时候,使用候选近邻用户的评分预测模型对当前用户的历史评分物品集合进行预测,统计候选近邻用户给出的预测评分与当前用户实际评分的偏差值,如果候选近邻用户预测误差越小则认为该候选近邻用户与当前用户的兴趣偏好越相似。
本发明的目的采用如下技术方案之一实现。
一种基于BP神经网络评分预测误差的近邻用户选择方法,包括如下步骤:
S1将数据集按比例分为训练数据集和测试数据集,其中训练数据集用于作为已知信息用于评分预测模型的训练,一般来说训练集的训练比例越大,预测模型的准确性越高,可根据实验而定;
S2确定BP神经网络结构:BP神经网络结构分为输入层,隐含层以及输出层,数据从输入层的神经元输入,经过隐含层,最后由输出层输出,其中输入层的输入为某物品的属性特征向量,假设物品i的属性特征向量为 attri=[a1,...,as,...,ak],其中k为需要引入的物品属性特征个数,根据实际场景而定,当as为0的时候表示该物品不具有第s个属性特征,而当as等于1的时候表示该物品具有第s个属性特征;输入层神经元的个数与需要引入属性特征的个数一致,隐含层的个数为可调参数通过实验决定,而输出层的神经元输出为预测评分,个数为1即可;假设引入的物品属性特征个数为k,那么输入层的神经元个数也为k个,与物品属性特征个数保持一致;隐含层的神经元个数为p 个,p为可调参数由实验测试决定选择预测误差较少的p值;输出层的神经元个数为1;
S3确定BP神经网络各层神经元的激活函数:假设第i个输入层神经元的输入为xii,输出为xoi;第h个隐含层神经元的输入为hih,输出为hoh,而第o个输出层的输入为yio,输出为yoo,由于输出层神经元只有一个,因此输出层神经元的输入简写为yi,而输出层神经元输出简写为yo;假设第i个输入层神经元与第 h个隐含层神经元之间的连接权重为Wih,第h个隐含层神经元与输出层神经元之间的连接权重为Who;BP神经网络中每个神经元都有一个激活函数,而且每个神经元的输出是将该神经元的输入经过激活函数处理之后得到的,假设输入层的神经元的激活函数为fi,那么有xoi=fi(xii);假设隐含层的神经元的激活函数为fh,那么有hoh=fh(hih);假设输出层的激活函数为fo,那么有yo=fo(yi);BP神经网络中每一层的神经元的输入等于前一层神经元输出的加权和,那么隐含层第h个神经元的输入为输出层神经元的输入为输入层的神经元与输出层的神经元的激活函数选择线性函数f(x)=ax+b,其中a 和b的值根据具体应用场景决定,而隐含层神经元的激活函数采用sigmoid函数f(x)=1/(1+e-x)来处理用户评分与物品属性特征之间的非线性复杂关系;
S4开始为每个用户训练BP神经网络:假设当前用户为u,从训练数据集中找出属于用户u的历史评分记录集合Ratu,每条评分记录至少包含用户ID,物品ID以及评分值等信息,因此可以从集合Ratu得到用户u的历史评分物品集合Iu,其每个元素为用户的历史评分物品的ID;初始化最大迭代次数为m以及达到迭代终止条件的最小误差阈值min E,每次迭代的时候,从集合Iu中按随机顺序取出物品ID,输入该物品ID对应的属性特征向量,假设当前输入的物品为i,其对应的属性特征向量为attri=[a1,a2,...,ak],那么经过BP神经网络前向传播之后,输出层的神经元将输出当前用户u对该物品的预测评分yo,使用用户对该物品的实际评分d与预测评分yo对比进行误差计算得到这个也是BP神经网络在使用随机梯度下降法迭代更新网络参数所使用的目标函数,预测误差越小越好,每次迭代完成后,统计本次迭代过程的全局预测误差当Eu小于min E或者达到最大迭代次数的时候,用户u的BP神经网络参数迭代更新完成;
BP神经网络的迭代更新是在反向传播的过程,当计算完预测评分和实际评分的误差后,首先更新隐含层与输出层之间的连接权重参数,然后再更新输入层与隐含层之间的连接权重,利用随机梯度下降法可得:隐含层第h个神经元与输出层神经元之间的连接权重更新为其中α为梯度下降的步长,输入层第i个神经元与隐含层第h个神经元之间的连接权重更新为其中α为梯度下降的步长,
S5为每个用户筛选近邻用户集合:假设当前用户u,为该用户筛选k个相似用户作为近邻用户集合,那么需要计算用户u与每个候选近邻用户的相似度,选择相似度最高的前k个候选近邻用户作为用户u的近邻用户集;假设候选近邻用户为v,那么使用候选近邻用户v训练好的BP神经网络模型对当前用户u 的历史评分物品集合Iu进行评分预测,候选用户v对集合Iu中物品i的预测评分为bpv,i,而当前用户u对该物品的实际评分为ru,i,那么候选近邻用户v对当前用户u的历史评分记录的整体预测误差为当候选用户v对用户u的历史评分物品的预测评分与用户u实际评分偏差越小,表示候选用户v 与用户u对物品属性特征具有相似偏好,因此预测评分误差才会较小,那么认为候选用户v与用户u越相似,他们之间的相似度为因此按照该近邻用户选择方法可以为用户u筛选出相似度最高的前k个近邻用户作为近邻用户集。
与现有技术相比,本发明具有如下有益效果和优点:
(1)本发明通过引入物品属性特征,充分考虑了用户评分与物品属性特征的关系,更好地描述用户的兴趣偏好。
(2)本发明通过利用候选近邻用户训练好的关于物品属性特征的BP神经网络评分预测模型对当前用户的历史访问物品列表进行评分预测,计算候选用户的预测评分与当前用户的历史实际评分的整体误差大小来衡量用户间的兴趣偏好相似度,预测误差越小表示候选近邻用户与当前用户的兴趣偏好程度越相似,解决了传统相似度计算模型在用户间共同评分项目数较少时无法较好地描述用户间相似度的问题。
附图说明
图1是本发明的工作流程图;
图2是BP神经网络结构示意图。
具体实施方式
下面结合实施例及附图,对本发明作进一步地详细说明,但本发明的实施方式不限于此,需指出的是,以下若有未特别详细说明之过程或符号,均是本领域技术人员可参照现有实现或理解的。
实施例
如图1所示,一种基于BP神经网络评分预测误差的近邻用户选择方法,包括如下步骤:
步骤一将已知的用户评分数据集按比例随机分为训练集和测试集,一般来说训练集的训练比例越大,预测模型的准确性越高,可根据实验而定;
步骤二确定需要引入的物品属性特征种类以及个数k,根据具体的应用场景决定,为每个物品初始化属性特征向量,假设当前物品为i,那么其属性特征向量可以表示为attri=[a1,...,as,...,ak],其中1≤s≤k,当as=1时,表示该物品具有第s个属性特征,而当as=0时表示该物品不具有第s个属性特征;假设系统中存在m个用户和n个物品,那么有大小为m×n的稀疏评分矩阵以及大小为 n×k的物品属性特征矩阵;
步骤三从训练集中为每个用户选出该用户的历史评分记录,假设当前用户为u,那么其历史评分记录集合为ratu,该集合的每一条记录至少包含当前用户u的用户ID,用户u评价的物品的物品ID,以及对应的评分值,那么从集合ratu可以得到用户u的历史评分物品集合Iu,该集合的每个元素为用户u评分过的物品ID;
步骤四为每个用户训练BP神经网络评分预测模型,首先需要确定BP神经网络的结构,BP神经网络的结构如图2所示:BP神经网络结构分为输入层,隐含层以及输出层,数据从输入层的神经元输入,经过隐含层,最后由输出层输出,其中输入层的输入为某物品的属性特征向量,假设物品i的属性特征向量为 attri=[a1,...,as,...,ak],其中k为需要引入的物品属性特征个数,根据实际场景而定,当as为0的时候表示该物品不具有第s个属性特征,而当as等于1的时候表示该物品具有第s个属性特征;输入层神经元的个数与需要引入属性特征的个数一致,隐含层的个数为可调参数通过实验决定,而输出层的神经元输出为预测评分,个数为1即可;假设输入层的神经元个数为k个,与考虑的物品属性特征个数一致;隐含层的神经元个数为p个,p为可调参数由实验测试决定选择预测误差较少的p值;输出层的神经元个数为1;假设第i个输入层神经元的输入为xii,输出为xoi;第h个隐含层神经元的输入为hih,输出为hoh,而第o个输出层的输入为yio,输出为yoo,由于输出层神经元只有一个,因此输出层神经元的输入简写为yi,而输出层神经元输出简写为yo;假设第i个输入层神经元与第h个隐含层神经元之间的连接权重为Wih,第h个隐含层神经元与输出层神经元之间的连接权重为Who;BP神经网络中每个神经元都有一个激活函数,而且每个神经元的输出是将该神经元的输入经过激活函数处理之后得到的,假设输入层的神经元的激活函数为fi,那么有xoi=fi(xii);假设隐含层的神经元的激活函数为fh,那么有hoh=fh(hih);假设输出层的激活函数为fo,那么有yo=fo(yi);输入层的神经元与输出层的神经元的激活函数选择线性函数f(x)=ax+b,其中a 和b的值根据具体场景决定即可,而隐含层神经元的激活函数采用sigmoid函数f(x)=1/(1+e-x)来完成用户评分与物品属性特征的非线性复杂关系;
BP神经网络中每一层的神经元的输入等于前一层神经元输出的加权和,那么隐含层第h个神经元的输入为输出层神经元的输入为
确定BP神经网络结构后,开始训练每个用户的BP神经网络评分预测模型参数,具体步骤为:假设当前用户为u,其历史访问物品集合为Iu,首先为用户u初始化BP神经网络评分预测模型参数,确定最大迭代次数以及达到迭代终止条件的误差阈值min E,每次迭代过程按随机顺序输入集合Iu中物品对应的物品属性特征向量,BP神经网络评分预测模型将输出用户u对该物品对应的预测评分;假设当前迭代过程中第p个待预测评分物品为i,则输入物品i对应的物品属性特征向量attri=[a1,...,as,...,ak],经过BP神经网络前向传播之后,输出层的神经元将输出当前用户u对该物品的预测评分yo,使用用户对该物品的实际评分d与预测评分yo对比进行误差计算得到Eu,i=[yo-d]2/2,这个也是BP神经网络在使用随机梯度下降法迭代更新网络参数所使用的目标函数,首先更新隐含层与输出层之间的连接权重参数,然后再更新输入层与隐含层之间的连接权重,利用随机梯度下降法可得:隐含层第h个神经元与输出层神经元之间的连接权重更新为其中α为梯度下降的步长,输入层第i个神经元与隐含层第h个神经元之间的连接权重更新为其中α为梯度下降的步长,当完成本次迭代过程的时候,统计本次迭代过程的整体预测误差当本次迭代过程的整体预测误差E小于 min E或者已经达到最大迭代次数的时候,用户u的BP神经网络评分预测模型训练完成;
步骤五为每个用户选择兴趣偏好相似的近邻用户集合,假设当前用户为u,需要为用户u选择相似度最高的前k个用户作为近邻用户集合,假设当前用户u 与候选近邻用户v的相似度为simu,v,那么simu,v的计算步骤具体为:用户u的历史评分物品集合为Iu,利用候选近邻用户v的BP神经网络评分预测模型去预测集合Iu中的每个物品的评分,假设物品i属于集合Iu,候选近邻用户v对物品i 的预测评分为bpv,i,而用户u对物品i的实际评分为ratu,i,那么可以得到候选用户v对用户u的历史评分物品的整体预测误差为那么 simu,v=1/(1+Ev),通过这种方法选择与用户u相似度最高的前k个候选近邻用户作为用户u的近邻用户集合。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受所述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (5)

1.一种基于BP神经网络评分预测误差的近邻用户选择方法,其特征在于,包括如下步骤:
S1将数据集按比例分为训练数据集和测试数据集,其中训练数据集用于作为已知信息用于评分预测模型的训练;
S2确定BP神经网络结构,确定各层神经元的个数;
S3确定BP神经网络各层神经元的激活函数;
S4为每个用户训练BP神经网络;
S5为每个用户筛选近邻用户集合。
2.根据权利要求1所述的基于BP神经网络评分预测误差的近邻用户选择方法,其特征在于所述S2中的BP神经网络结构具体为:BP神经网络结构分为输入层,隐含层以及输出层,数据从输入层的神经元输入,经过隐含层,最后由输出层输出,其中输入层的输入为物品的属性特征向量,假设物品i的属性特征向量为attri=[a1,...,as,...,ak],s取值为1~k,其中k为需要引入的物品属性特征个数,根据实际场景而定,当as为0的时候表示该物品不具有第s个属性特征,而当as等于1的时候表示该物品具有第s个属性特征;输入层神经元的个数与需要引入属性特征的个数一致,隐含层的个数为可调参数通过实验决定,而输出层的神经元输出为预测评分,个数为1即可;假设输入层的神经元个数为k个,与考虑的物品属性特征个数一致;隐含层的神经元个数为p个,p为可调参数由实验测试决定选择预测误差较少的p值;输出层的神经元个数为1。
3.根据权利要求1所述的基于BP神经网络评分预测误差的近邻用户选择方法,其特征在于所述S3中的神经网络各层神经元的激活函数,具体为:输入层的神经元与输出层的神经元的激活函数选择线性函数f(x)=ax+b,其中a和b的值根据具体场景决定即可,而隐含层神经元的激活函数采用sigmoid函数f(x)=1/(1+e-x)来完成用户评分与物品属性特征的非线性复杂关系。
4.根据权利要求1所述的基于BP神经网络评分预测误差的近邻用户选择方法,其特征在于所述S4中为每个用户训练BP神经网络过程,具体为:假设第i个输入层神经元的输入为xii,输出为xoi;第h个隐含层神经元的输入为hih,输出为hoh,而第o个输出层的输入为yio,输出为yoo,由于输出层神经元只有一个,因此输出层神经元的输入简写为yi,而输出层神经元输出简写为yo;假设第i个输入层神经元与第h个隐含层神经元之间的连接权重为Wih,第h个隐含层神经元与输出层神经元之间的连接权重为Who;BP神经网络中每个神经元都有一个激活函数,而且每个神经元的输出是将该神经元的输入经过激活函数处理之后得到的,假设输入层的神经元的激活函数为fi,那么有xoi=fi(xii);假设隐含层的神经元的激活函数为fh,那么有hoh=fh(hih);假设输出层的激活函数为fo,那么有yo=fo(yi);BP神经网络中每一层的神经元的输入等于前一层神经元输出的加权和,那么隐含层第h个神经元的输入为输出层神经元的输入为假设当前用户为u,从训练数据集中找出属于用户u的历史评分记录集合Ratu,每条评分记录至少包含用户ID,物品ID以及评分值,从集合Ratu得到用户u的历史评分物品的集合Iu,其每个元素为物品的对应ID;初始化最大迭代次数为m,每次迭代的时候,从集合Iu中按随机顺序取出物品ID,输入该物品ID对应的属性特征向量,假设当前输入的物品为i,其对应的属性特征向量为attri=[a1,a2,...,ak],那么经过BP神经网络前向传播之后,输出层的神经元将输出当前用户u对该物品的预测评分yo,使用用户对该物品的实际评分d与预测评分yo对比进行误差计算得到即BP神经网络在使用随机梯度下降法迭代更新网络参数所使用的目标函数,预测误差越小越好,每次迭代完成后,统计本次迭代过程的全局预测误差当Eu小于某个阈值或者达到最大迭代次数的时候,用户u的BP神经网络参数迭代更新完成;BP神经网络的迭代更新是在反向传播的过程,当计算完预测评分和实际评分的误差后,首先更新隐含层与输出层之间的连接权重参数,然后再更新输入层与隐含层之间的连接权重,利用随机梯度下降法可得:隐含层第h个神经元与输出层神经元之间的连接权重更新为其中α为梯度下降的步长,输入层第i个神经元与隐含层第h个神经元之间的连接权重更新为其中α为梯度下降的步长,
5.根据权利要求1所述的基于BP神经网络评分预测误差的近邻用户选择方法,其特征在于所述S5中的为每个用户筛选近邻用户集合的过程,具体为:假设当前用户u,为该用户筛选k个相似用户作为近邻用户集合,那么需要计算用户u与每个候选近邻用户的相似度,选择相似度最高的前k个候选近邻用户作为用户u的近邻用户集;假设候选近邻用户为v,那么使用候选近邻用户v训练好的BP神经网络模型对当前用户u的历史评分物品集合Iu进行评分预测,假设集合Iu的物品个数为n,候选用户v对集合Iu中物品i的预测评分为bpv,i,而当前用户u对该物品的实际评分为ru,i,那么候选近邻用户v对当前用户u的历史评分记录的整体预测误差为当候选用户v对用户u的历史评分记录预测误差越小,表示候选用户v与用户u对物品属性特征都具有相似偏好,因此预测评分误差才会较小,则认为候选用户v与用户u越相似,相似度为因此按照该相似度计算模型能为用户u筛选出相似度最高的前k个近邻用户作为近邻用户集。
CN201810842917.4A 2018-07-27 2018-07-27 基于bp神经网络评分预测误差的近邻用户选择方法 Active CN109345274B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810842917.4A CN109345274B (zh) 2018-07-27 2018-07-27 基于bp神经网络评分预测误差的近邻用户选择方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810842917.4A CN109345274B (zh) 2018-07-27 2018-07-27 基于bp神经网络评分预测误差的近邻用户选择方法

Publications (2)

Publication Number Publication Date
CN109345274A true CN109345274A (zh) 2019-02-15
CN109345274B CN109345274B (zh) 2022-05-24

Family

ID=65296492

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810842917.4A Active CN109345274B (zh) 2018-07-27 2018-07-27 基于bp神经网络评分预测误差的近邻用户选择方法

Country Status (1)

Country Link
CN (1) CN109345274B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111930926A (zh) * 2020-08-05 2020-11-13 南宁师范大学 结合评论文本挖掘的个性化推荐算法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102376063A (zh) * 2011-11-29 2012-03-14 北京航空航天大学 一种基于社会化标签的个性化推荐系统优化方法
CN103678431A (zh) * 2013-03-26 2014-03-26 南京邮电大学 一种基于标准标签和项目评分的推荐方法
CN105005701A (zh) * 2015-07-24 2015-10-28 成都康赛信息技术有限公司 一种基于属性与评分的个性化推荐方法
CN106204153A (zh) * 2016-07-14 2016-12-07 扬州大学 一种基于属性比重相似性的两步预测Top‑N推荐算法
CN106777200A (zh) * 2016-12-23 2017-05-31 Tcl集团股份有限公司 项目推荐的方法及装置
CN107943948A (zh) * 2017-11-24 2018-04-20 中国科学院电子学研究所苏州研究院 一种改进的混合协同过滤推荐方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102376063A (zh) * 2011-11-29 2012-03-14 北京航空航天大学 一种基于社会化标签的个性化推荐系统优化方法
CN103678431A (zh) * 2013-03-26 2014-03-26 南京邮电大学 一种基于标准标签和项目评分的推荐方法
CN105005701A (zh) * 2015-07-24 2015-10-28 成都康赛信息技术有限公司 一种基于属性与评分的个性化推荐方法
CN106204153A (zh) * 2016-07-14 2016-12-07 扬州大学 一种基于属性比重相似性的两步预测Top‑N推荐算法
CN106777200A (zh) * 2016-12-23 2017-05-31 Tcl集团股份有限公司 项目推荐的方法及装置
CN107943948A (zh) * 2017-11-24 2018-04-20 中国科学院电子学研究所苏州研究院 一种改进的混合协同过滤推荐方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
杨文龙: ""基于BP神经网络的协同过滤推荐算法的研究与应用"", 《中国优秀硕士学位论文全文数据库(信息科技辑)》 *
王建群等: "《水资源系统分析理论与应用》", 31 May 2018, 河海大学出版社 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111930926A (zh) * 2020-08-05 2020-11-13 南宁师范大学 结合评论文本挖掘的个性化推荐算法
CN111930926B (zh) * 2020-08-05 2023-08-29 南宁师范大学 结合评论文本挖掘的个性化推荐算法

Also Published As

Publication number Publication date
CN109345274B (zh) 2022-05-24

Similar Documents

Publication Publication Date Title
CN111428147B (zh) 结合社交和兴趣信息的异源图卷积网络的社交推荐方法
Yang et al. Finding progression stages in time-evolving event sequences
CN111523047A (zh) 基于图神经网络的多关系协同过滤算法
CN103971161B (zh) 基于柯西分布量子粒子群的混合推荐方法
CN109034960B (zh) 一种基于用户节点嵌入的多属性推断的方法
CN107220365A (zh) 基于协同过滤与关联规则并行处理的精准推荐系统及方法
CN110503531A (zh) 时序感知的动态社交场景推荐方法
CN108665311B (zh) 一种基于深度神经网络的电商用户时变特征相似性计算推荐方法
CN108038629A (zh) 一种基于协同过滤的优化方法
CN111242310A (zh) 特征有效性评估方法、装置、电子设备及存储介质
CN109902235A (zh) 基于蝙蝠优化的用户偏好聚类协同过滤推荐算法
CN104239496A (zh) 一种结合模糊权重相似性度量和聚类协同过滤的方法
CN111723285A (zh) 一种基于评分的深度谱卷积协同过滤推荐方法
CN110222838B (zh) 文档排序方法、装置、电子设备及存储介质
CN113918834A (zh) 融合社交关系的图卷积协同过滤推荐方法
CN113536105A (zh) 推荐模型训练方法和装置
CN112256971A (zh) 一种序列推荐方法及计算机可读存储介质
CN115270007A (zh) 一种基于混合图神经网络的poi推荐方法及系统
CN110059251B (zh) 基于多关系隐式反馈置信度的协同过滤推荐方法
CN107291894A (zh) 一种融合相似性和共同评分项数量的概率矩阵分解模型
Czajkowski et al. Steering the interpretability of decision trees using lasso regression-an evolutionary perspective
Kumar et al. A novel fuzzy rough sets theory based cf recommendation system
CN109345274A (zh) 基于bp神经网络评分预测误差的近邻用户选择方法
CN116523597A (zh) 大数据云熵挖掘的电子商务定制化推荐方法
CN106528584B (zh) 一种基于组合学习的群组推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant