CN108038629A - 一种基于协同过滤的优化方法 - Google Patents

一种基于协同过滤的优化方法 Download PDF

Info

Publication number
CN108038629A
CN108038629A CN201711492287.4A CN201711492287A CN108038629A CN 108038629 A CN108038629 A CN 108038629A CN 201711492287 A CN201711492287 A CN 201711492287A CN 108038629 A CN108038629 A CN 108038629A
Authority
CN
China
Prior art keywords
mrow
mtd
msub
matrix
mfrac
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711492287.4A
Other languages
English (en)
Inventor
杨胜齐
黄樟钦
郑龙帅
吴寒
包宇津
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN201711492287.4A priority Critical patent/CN108038629A/zh
Publication of CN108038629A publication Critical patent/CN108038629A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/082Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • General Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Software Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于协同过滤的优化方法,该方法为一种基于奇异值分解和BP神经网络预测未评分项的改进方法;该方法通过奇异值分解用户‑项目评分矩阵,有效的降低了矩阵的稀疏性;同时在奇异值分解的基础上,进一步采用BP神经网络来对未评分的目标项目进行分值预测。在此基础上,进行相似性计算获取相似邻居列表,将商品进行推荐给目标用户。该方法的改进核心思想是将用户‑项目评分矩阵降维,有效的缓解数据稀疏性,使得推荐准确率更高。

Description

一种基于协同过滤的优化方法
技术领域
本发明属于数据处理和数据挖掘领域,具体涉及一种基于奇异值分解和BP神经网络预测未评分项的改进方法。
背景技术
进入移动互联网时代,各种平台上信息资源的体量越来越大,出现了比传统互联网时代更为严重的“信息过载”现象。面对如此巨大的信息量,用户经常感到无从下手,原因就是很难再通过简单的查找较快的获得自己喜欢的信息,同时也大大增加了人们查询信息的时间,这是“信息过载”现象在电子商务领域的表现。用户也可以通过阿里巴巴提供的搜索指数来选择商品,但是并不一定符合自己个性化需求。因此用户需要一种能根据自己的偏好特点来自动选择其感兴趣信息的技术,推荐算法在这种背景下得到了迅速发展。
推荐系统的研究重点在于如何快速的从海量信息中获取我们感兴趣的内容,省时省力,准确快捷是首要目标。现在是大数据时代,各种信息数据增长速度极快,推荐系统的效率已经成为学者十分重视的问题,各种框架的出现表明了对推荐系统的进一步研究已经迫在眉睫,同时也给各类电商平台带来了很大改变。
根据原理的不同,个性化推荐算法有几种不同的分类,通过不同的推荐策略来进行信息等资源的推荐,大致分为三种推荐方式:基于关联规则、基于内容和协同过滤推荐算法。基于关联规则算法的本质是获取数据与数据之间的关系,在获取到用户的行为之后,使用关联规则技术分析各个产品在用户之间购买的关系,找出各个产品之间的联系,由这些产品的联系推导出来跟其他产品之间的联系,不同规则的相似度不同,这个在每个关联规则中都可以通过两商品同时发生的概率来表示。基于内容的推荐算法是以平台上商品的分类属性来进行推荐的,首先要明确商品类别属性,根据商品本身所具有的属性特点来判断某一未评分产品是否符合用户的期望。协同过滤推荐算法是根据用户的兴趣进行分析的,在用户购买商品的过程中,用户之间和项目之间都会有相似性,通过这些相似性来进行产品的定向推荐,算法的核心是寻找用户和商品的最近邻居。
协同过滤是根据用户的兴趣进行分析的,在用户购买商品的过程中,用户之间和项目之间都会有相似性,通过这些相似性来进行产品的定向推荐,算法的核心是寻找用户和商品的最近邻居。该算法有两种重要的分类,基于用户的协同过滤算法和基于项目的协同过滤算法。最早使用到这两种方法是在信息的过滤时进行筛选的,后来延伸出来各种类型的算法。其实这两者的原理是相似的,都要使用到用户对商品的评分数据来进行分析,前者是整个算法的核心,通过矩阵行数据计算用户相似性,后者是通过列数据计算项目的相似性。
发明内容
本发明的目的是针对现有技术的不足,提出了一种基于奇异值分解和BP神经网络预测未评分项的改进方法。该方法通过奇异值分解用户-项目评分矩阵,有效的降低了矩阵的稀疏性;同时在奇异值分解的基础上,进一步采用BP神经网络来对未评分的目标项目进行分值预测,这样做的好处是避免了用平均分值代替而产生的效果单一性,从而使推荐的准确性有了较大提升。
将用户对商品的评分用m×n矩阵R表示,其中,m是用户数量,n是商品数量,矩阵中元素Rij是用户i对商品j的偏好,Rij为数值。用矩阵R进行表示。
若r是m×n矩阵R的秩,那么对矩阵R进行分解
(1)U是m×m阶酋矩阵,表示用户特征矩阵;S是半正定m×n阶对角矩阵,S还能够用∑r的对角阵来表示;VT是V的共轭转置矩阵,是n×n阶酋矩阵,表示商品的特征矩阵;
(2)RRT的特征值λ12,…λr也是RTR的特征值;
(3)存在1≤i≤r,m×n的矩阵S符合∑ii=σi,其中1≤i≤r,σi就是矩阵R的奇异值,这里存在的数量关系即可用来表示特征值的关系。
为达到上述目的,本发明采用的技术方案为:
奇异值分解能够用于解决矩阵降维的问题,在电商个性化推荐系统中将其应用到用户-项目评分矩阵上,进行矩阵变换,这一过程是获取矩阵数据的重要特征值来取代整个的稀疏矩阵。为此,通常需要以下步骤。
(1)首先对于用户项目评分矩阵R,采用奇异值分解公式进行分解。
(2)然后把矩阵S中对角线上r-k个最小奇异值置为0,得Sk
(3)最后计算Rk=USkVT作为R的重构矩阵。
奇异值分解过程是在进行奇异值分解之前首先对数据进行处理,将用户和商品区别开来,矩阵中的Rij即表示所有用户i对商品j的喜好分值,若没有用户评分,则该项设置为0。在结合协同过滤推荐算法中,奇异值分解可以方便快速的处理原始数据,在保证数据集基本不缺失重要数据的情况下,应对当前评分矩阵数据极度稀疏性这一问题。
在协同过滤推荐方法中,目标用户和商品之间的关系影响整个算法推荐流程,利用用户的相似邻居对某一商品的评分来对其他商品进行评估。在获得准确完整的用户评价数据之后即可利用奇异值来进行处理。
下面是利用奇异值分解的步骤:
步骤1)读取用户对项目的行为数据,将用户对项目的评分转变成矩阵格式,将数据直接读入矩阵;
步骤2)计算矩阵大小,选取大小适合的实验训练集;
步骤3)选取合适的测试集数据用来跟训练集数据做对比,并将测试数据集转换为矩阵格式;
步骤4)将训练数据集中对应的矩阵中用户对物品的评分值读入训练集矩阵中;
步骤5)获取用户评分矩阵,将用户所在的第j列和电影所在的第j+1列转换即可;
步骤6)对训练集矩阵进行分解获得结果。
BP神经三层网络结构中元素中,{p1,p2,p3,…,pn-2,pn-1,pn}是输入元素,代表选取商品的特征数据值,获取的特征向量维数即为神经元个数;{w1,w2,w3,w4,w5}为隐层,包含权值的很多分量;{q1,q2,q3,q4,q5}是输出元素,输出产品评分值。
BP神经网络的训练是不断进化迭代的。原始的BP神经网络是net(i),那么假定更新之后的网络是net(i+1)。由于最新的数据实时性最好,那么在进行进化时把最新的n个数据作为样本集进行训练的效果是最好的。
训练步骤如下。
步骤1)算法开始;
步骤2)设定初始的样本集,在原有样本训练集上进行更新得到新的样本集,用新的样本集进行训练;
步骤3)设定并初始化三层网络结构的数据,包括输入参数、学习精度和偏差等。
步骤4)将原始网络的权值和阈值设定更新之后网络的初始值,这样是在原始网络基础进行不断更新;
步骤5)在网络中进行迭代训练,训练次数初始值根据需要进行设定;
步骤6)对网络中的学习精度进行判断是否收敛到最小值,如果符合,进行步骤8),如果不符合,则进行步骤7);
步骤7)判定迭代步数是否超过规定的步数:如果符合,进行步骤8);如果不符合,则进行步骤5);
步骤8)结束算法。
BP神经网络从两个过程来理解,第一个就是工作信号正向传递,第二个是误差信号反向传递。
计算误差函数对输出层的各神经元的偏导数δo(k)。
其中输入层有n个单元,隐含层有p个神经元,输出层有q个神经元,x是输入向量,hi是隐含层输入向量,ho是隐含层输出向量,yi是输出层输入向量,yo是输出层输出向量,do是期望输出向量,wih是输出层与中间层的连接权值,who是隐含层与输出层的连接权值,bh是隐含层各神经元的阈值,bo是输出层各神经元的阈值,f(·)是激活函数,E是误差函数。
计算误差函数对隐含层的各神经单元的偏导数δh(k)。
建立预测的网络结构,对于这个网络参数进行设定,已经给出算法的训练步骤,从中算法流程中发现知道需要进行权值的和阈值初始化,这里三层结构权值初始值依次设定为W1,W2,W3。对网络中的学习精度也要进行设定,用来判断是否收敛于某一值,设定为φ。还有一个最小值学习率设定为μ,设定较小值以保证系统的稳定性。另外,学习偏差设为B。因为BP神经网络处理任意非线性关系,激活函数来加入非线性因素,它的一大特点是处处可求导函数,非常适用于BP神经网络。
涉及到中间层结点数的计算方法,并不需要严格的数学推导来进行计算,选用经验公式nm=sqrt(no+ni)+1来计算最小中间层结点数,在一定范围之内是获得近似结果的。其中,ni表示输入层的结点数,nm表示中间层的结点数,n0表示输出层的结点数,采用不断改变参量寻求目标值方法获得中间层的结点数,这其实是一种试错法,适合用在这个场景中。通过经验公式求得中间结点数目nm分布在区间[ni,2ni]上。
附图说明
图1是推荐系统示意图。
图2是基于协同过滤推荐流程示意图。
图3是推荐引擎框架示意图。
图4是用户建模过程示意图。
图5是推荐模型数据示意图。
图6是用于预测的BP神经网络示意图。
图7是改进算法流程示意图。
具体实施方式
基于奇异值分解和BP神经网络预测未评分项的协同过滤算法改进流程如下:
输入:用户-评分矩阵R、用户i的评分矩阵Ri、候选相邻邻居用户集T′(u)及元素个数δ、候选最近邻居用户集最小稀疏度η;
输出:目标用户u的Top-N推荐集;
算法流程:
步骤1)对用户-项目评分矩阵运用矩阵分解SVD算法,矩阵的稀疏度较小时降低矩阵维度,直到矩阵的稀疏度小于η,得到重构矩阵Rk,则Rk=Uk∑Vk,k是用户-项目评分矩阵的秩;
步骤2)在初次分组的基础上,利用向量相似性计算,得到精确的分组结果;
步骤3)对重构矩阵Rk用BP神经网络填充未评分项。提取项目的特征值来建立神经网络结构进行训练,预测未评分项目的分值,直到矩阵的稀疏度达到某一数值;
步骤4)按照相关相似性求Ri的最近k邻居,得到最近邻居集合T={T1,T2,…,Tk};
步骤5)采用预测公式对候选项目集合T′的所有候选项目评分预测,按照分值高低进行排序;
步骤6)选出前N项,形成Top-N推荐列表。
算法改进思想是通过选用SVD分解用户-项目评分矩阵,这样做可以缓解矩阵的稀疏度;同时在奇异值分解的基础上,进一步选用BP神经网络来对未评分的目标项目进行分值预测,这样做的好处是避免了用平均分值代替而产生的效果单一性,从而使准确性有了较大提高。采用相关相似性公式来计算用户之间的相似性,获取用户最近k邻居。算法的改进核心思想是将评分矩阵降维,有效的缓解数据稀疏性,使得推荐准确率更高。
选用SVD分解评分矩阵基于两个方面:一方面是奇异值分解在矩阵降维上有着较大的优势,在不失矩阵重要特征值的情况下降低矩阵的维度,能够简单快速的获取用户偏好的特征向量;另一方面用户-项目矩阵的维度降低使得电子商务推荐系统的计算减少,降低系统开销。
选用BP神经网络对未评分商品预测基于两个方面:一方面是BP神经网络可以通过训练得到稳定的网络结构,不断学习,不断进化;另一方面商品的数量不计其数,很多时候形成的用户评分矩阵中没有被评价的商品占据了绝大多数,这样在计算邻居的时候会存在很大误差,而BP神经网络能够对没有评分的商品进行预测用户偏好,很方便的解决了未知商品没有评分的问题。

Claims (3)

1.一种基于协同过滤的优化方法,该方法为一种基于奇异值分解和BP神经网络预测未评分项的改进方法;其特征在于:该方法通过奇异值分解用户-项目评分矩阵,有效的降低了矩阵的稀疏性;同时在奇异值分解的基础上,进一步采用BP神经网络来对未评分的目标项目进行分值预测,这样做的好处是避免了用平均分值代替而产生的效果单一性,从而使推荐的准确性有了较大提升;
将用户对商品的评分用m×n矩阵R表示,其中,m是用户数量,n是商品数量,矩阵中元素Rij是用户i对商品j的偏好,Rij为数值;用矩阵R进行表示;
<mrow> <mi>R</mi> <mo>=</mo> <mfenced open = "[" close = "]"> <mtable> <mtr> <mtd> <msub> <mi>R</mi> <mn>11</mn> </msub> </mtd> <mtd> <mn>...</mn> </mtd> <mtd> <msub> <mi>R</mi> <mrow> <mn>1</mn> <mi>j</mi> </mrow> </msub> </mtd> <mtd> <mn>...</mn> </mtd> <mtd> <msub> <mi>R</mi> <mrow> <mn>1</mn> <mi>n</mi> </mrow> </msub> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <msub> <mi>R</mi> <mrow> <mi>i</mi> <mn>1</mn> </mrow> </msub> </mtd> <mtd> <mn>...</mn> </mtd> <mtd> <msub> <mi>R</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> </mtd> <mtd> <mn>...</mn> </mtd> <mtd> <msub> <mi>R</mi> <mrow> <mi>i</mi> <mi>n</mi> </mrow> </msub> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <msub> <mi>R</mi> <mrow> <mi>m</mi> <mn>1</mn> </mrow> </msub> </mtd> <mtd> <mn>...</mn> </mtd> <mtd> <msub> <mi>R</mi> <mrow> <mi>m</mi> <mi>j</mi> </mrow> </msub> </mtd> <mtd> <mn>...</mn> </mtd> <mtd> <msub> <mi>R</mi> <mrow> <mi>m</mi> <mi>n</mi> </mrow> </msub> </mtd> </mtr> </mtable> </mfenced> </mrow>
若r是m×n矩阵R的秩,那么对矩阵R进行分解
<mrow> <mi>R</mi> <mo>=</mo> <mi>U</mi> <mo>*</mo> <mi>S</mi> <mo>*</mo> <msup> <mi>V</mi> <mi>T</mi> </msup> <mo>=</mo> <mi>U</mi> <mo>*</mo> <mfenced open = "[" close = "]"> <mtable> <mtr> <mtd> <msub> <mi>&amp;Sigma;</mi> <mi>r</mi> </msub> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> </mtable> </mfenced> <mo>*</mo> <msup> <mi>V</mi> <mi>T</mi> </msup> </mrow>
(1)U是m×m阶酋矩阵,表示用户特征矩阵;S是半正定m×n阶对角矩阵,S还能够用∑r的对角阵来表示;VT是V的共轭转置矩阵,是n×n阶酋矩阵,表示商品的特征矩阵;
(2)RRT的特征值λ12,…λr也是RTR的特征值;
(3)存在m×n的矩阵S符合∑ii=σi,其中1≤i≤r,σi就是矩阵R的奇异值,这里存在的数量关系即可用来表示特征值的关系;
奇异值分解能够用于解决矩阵降维的问题,在电商个性化推荐系统中将其应用到用户-项目评分矩阵上,进行矩阵变换,这一过程是获取矩阵数据的重要特征值来取代整个的稀疏矩阵;
(1)首先对于用户项目评分矩阵R,采用奇异值分解公式进行分解;
(2)然后把矩阵S中对角线上r-k个最小奇异值置为0,得Sk
(3)最后计算Rk=USkVT作为R的重构矩阵;
奇异值分解过程是在进行奇异值分解之前首先对数据进行处理,将用户和商品区别开来,矩阵中的Rij即表示所有用户i对商品j的喜好分值,若没有用户评分,则该项设置为0;在结合协同过滤推荐算法中,奇异值分解可以方便快速的处理原始数据,在保证数据集基本不缺失重要数据的情况下,对当前评分矩阵数据极度稀疏性这一问题;
在协同过滤推荐方法中,目标用户和商品之间的关系影响整个算法推荐流程,利用用户的相似邻居对某一商品的评分来对其他商品进行评估;在获得准确完整的用户评价数据之后即可利用奇异值来进行处理。
2.根据权利要求1所述的一种基于协同过滤的优化方法,其特征在于:利用奇异值分解的步骤:
步骤1)读取用户对项目的行为数据,将用户对项目的评分转变成矩阵格式,将数据直接读入矩阵;
步骤2)计算矩阵大小,选取大小适合的实验训练集;
步骤3)选取合适的测试集数据用来跟训练集数据做对比,并将测试数据集转换为矩阵格式;
步骤4)将训练数据集中对应的矩阵中用户对物品的评分值读入训练集矩阵中;
步骤5)获取用户评分矩阵,将用户所在的第j列和电影所在的第j+1列转换即可;
步骤6)对训练集矩阵进行分解获得结果;
BP神经三层网络结构中元素中,{p1,p2,p3,…,pn-2,pn-1,pn}是输入元素,代表选取商品的特征数据值,获取的特征向量维数即为神经元个数;{w1,w2,w3,w4,w5}为隐层,包含权值的很多分量;{q1,q2,q3,q4,q5}是输出元素,输出产品评分值;
BP神经网络的训练是不断进化迭代的;原始的BP神经网络是net(i),那么假定更新之后的网络是net(i+1);由于最新的数据实时性最好,那么在进行进化时把最新的n个数据作为样本集进行训练的效果是最好的。
3.根据权利要求2所述的一种基于协同过滤的优化方法,其特征在于:样本集进行训练步骤如下,
步骤1)算法开始;
步骤2)设定初始的样本集,在原有样本训练集上进行更新得到新的样本集,用新的样本集进行训练;
步骤3)设定并初始化三层网络结构的数据,包括输入参数、学习精度和偏差等;
步骤4)将原始网络的权值和阈值设定更新之后网络的初始值,这样是在原始网络基础进行不断更新;
步骤5)在网络中进行迭代训练,训练次数初始值根据需要进行设定;
步骤6)对网络中的学习精度进行判断是否收敛到最小值,如果符合,进行步骤8),如果不符合,则进行步骤7);
步骤7)判定迭代步数是否超过规定的步数:如果符合,进行步骤8);如果不符合,则进行步骤5);
步骤8)结束算法;
BP神经网络从两个过程来理解,第一个就是工作信号正向传递,第二个是误差信号反向传递;
计算误差函数对输出层的各神经元的偏导数δo(k);
<mrow> <mfrac> <mrow> <mo>&amp;part;</mo> <mi>E</mi> </mrow> <mrow> <mo>&amp;part;</mo> <msub> <mi>w</mi> <mrow> <mi>h</mi> <mi>o</mi> </mrow> </msub> </mrow> </mfrac> <mo>=</mo> <mfrac> <mrow> <mo>&amp;part;</mo> <mi>E</mi> </mrow> <mrow> <mo>&amp;part;</mo> <msub> <mi>yi</mi> <mi>o</mi> </msub> </mrow> </mfrac> <mfrac> <mrow> <mo>&amp;part;</mo> <msub> <mi>yi</mi> <mi>o</mi> </msub> </mrow> <mrow> <mo>&amp;part;</mo> <msub> <mi>w</mi> <mrow> <mi>h</mi> <mi>o</mi> </mrow> </msub> </mrow> </mfrac> </mrow>
<mrow> <mfrac> <mrow> <mo>&amp;part;</mo> <msub> <mi>yi</mi> <mi>o</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow> <mrow> <mo>&amp;part;</mo> <msub> <mi>w</mi> <mrow> <mi>h</mi> <mi>o</mi> </mrow> </msub> </mrow> </mfrac> <mo>=</mo> <mfrac> <mrow> <mo>&amp;part;</mo> <mrow> <mo>(</mo> <munderover> <mo>&amp;Sigma;</mo> <mi>h</mi> <mi>p</mi> </munderover> <msub> <mi>w</mi> <mrow> <mi>h</mi> <mi>o</mi> </mrow> </msub> <msub> <mi>ho</mi> <mi>h</mi> </msub> <mo>(</mo> <mi>k</mi> <mo>)</mo> <mo>-</mo> <msub> <mi>b</mi> <mi>o</mi> </msub> <mo>)</mo> </mrow> </mrow> <mrow> <mo>&amp;part;</mo> <msub> <mi>w</mi> <mrow> <mi>h</mi> <mi>o</mi> </mrow> </msub> </mrow> </mfrac> <mo>=</mo> <msub> <mi>ho</mi> <mi>h</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow>
<mrow> <mfrac> <mrow> <mo>&amp;part;</mo> <mi>E</mi> </mrow> <mrow> <mo>&amp;part;</mo> <msub> <mi>yi</mi> <mi>o</mi> </msub> </mrow> </mfrac> <mo>=</mo> <mo>-</mo> <mrow> <mo>(</mo> <msub> <mi>d</mi> <mi>o</mi> </msub> <mo>(</mo> <mi>k</mi> <mo>)</mo> <mo>-</mo> <msub> <mi>yo</mi> <mi>o</mi> </msub> <mo>(</mo> <mi>k</mi> <mo>)</mo> <mo>)</mo> </mrow> <msup> <mi>f</mi> <mo>&amp;prime;</mo> </msup> <mrow> <mo>(</mo> <msub> <mi>yi</mi> <mi>o</mi> </msub> <mo>(</mo> <mi>k</mi> <mo>)</mo> <mo>)</mo> </mrow> <mo>=</mo> <mo>-</mo> <msub> <mi>&amp;delta;</mi> <mi>o</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow>
其中输入层有n个单元,隐含层有p个神经元,输出层有q个神经元,x是输入向量,hi是隐含层输入向量,ho是隐含层输出向量,yi是输出层输入向量,yo是输出层输出向量,do是期望输出向量,wih是输出层与中间层的连接权值,who是隐含层与输出层的连接权值,bh是隐含层各神经元的阈值,bo是输出层各神经元的阈值,f(·)是激活函数,E是误差函数;
计算误差函数对隐含层的各神经单元的偏导数δh(k);
<mrow> <mfrac> <mrow> <mo>&amp;part;</mo> <mi>E</mi> </mrow> <mrow> <mo>&amp;part;</mo> <msub> <mi>w</mi> <mrow> <mi>h</mi> <mi>o</mi> </mrow> </msub> </mrow> </mfrac> <mo>=</mo> <mfrac> <mrow> <mo>&amp;part;</mo> <mi>E</mi> </mrow> <mrow> <mo>&amp;part;</mo> <msub> <mi>yi</mi> <mi>o</mi> </msub> </mrow> </mfrac> <mfrac> <mrow> <mo>&amp;part;</mo> <msub> <mi>yi</mi> <mi>o</mi> </msub> </mrow> <mrow> <mo>&amp;part;</mo> <msub> <mi>w</mi> <mrow> <mi>h</mi> <mi>o</mi> </mrow> </msub> </mrow> </mfrac> </mrow>
<mrow> <mfrac> <mrow> <mo>&amp;part;</mo> <mi>E</mi> </mrow> <mrow> <mo>&amp;part;</mo> <msub> <mi>w</mi> <mrow> <mi>i</mi> <mi>h</mi> </mrow> </msub> </mrow> </mfrac> <mo>=</mo> <mfrac> <mrow> <mo>&amp;part;</mo> <mi>E</mi> </mrow> <mrow> <mo>&amp;part;</mo> <msub> <mi>hi</mi> <mi>h</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <mfrac> <mrow> <mo>&amp;part;</mo> <msub> <mi>hi</mi> <mi>h</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow> <mrow> <mo>&amp;part;</mo> <msub> <mi>w</mi> <mrow> <mi>i</mi> <mi>h</mi> </mrow> </msub> </mrow> </mfrac> </mrow>
<mrow> <mfrac> <mrow> <mo>&amp;part;</mo> <msub> <mi>hi</mi> <mi>h</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow> <mrow> <mo>&amp;part;</mo> <msub> <mi>w</mi> <mrow> <mi>i</mi> <mi>h</mi> </mrow> </msub> </mrow> </mfrac> <mo>=</mo> <mfrac> <mrow> <mo>&amp;part;</mo> <mrow> <mo>(</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>w</mi> <mrow> <mi>i</mi> <mi>h</mi> </mrow> </msub> <msub> <mi>x</mi> <mi>h</mi> </msub> <mo>(</mo> <mi>k</mi> <mo>)</mo> <mo>-</mo> <msub> <mi>b</mi> <mi>h</mi> </msub> <mo>)</mo> </mrow> </mrow> <mrow> <mo>&amp;part;</mo> <msub> <mi>w</mi> <mrow> <mi>i</mi> <mi>h</mi> </mrow> </msub> </mrow> </mfrac> <mo>=</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow>
<mrow> <mfrac> <mrow> <mo>&amp;part;</mo> <mi>E</mi> </mrow> <mrow> <mo>&amp;part;</mo> <msub> <mi>hi</mi> <mi>h</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>=</mo> <mo>-</mo> <mrow> <mo>(</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>o</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>q</mi> </munderover> <msub> <mi>&amp;delta;</mi> <mi>o</mi> </msub> <mo>(</mo> <mi>k</mi> <mo>)</mo> <msub> <mi>w</mi> <mrow> <mi>h</mi> <mi>o</mi> </mrow> </msub> <mo>)</mo> </mrow> <msup> <mi>f</mi> <mo>&amp;prime;</mo> </msup> <mrow> <mo>(</mo> <msub> <mi>hi</mi> <mi>h</mi> </msub> <mo>(</mo> <mi>k</mi> <mo>)</mo> <mo>)</mo> </mrow> <mo>=</mo> <mo>-</mo> <msub> <mi>&amp;delta;</mi> <mi>h</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow>
建立预测的网络结构,对于这个网络参数进行设定,已经给出算法的训练步骤,从中算法流程中发现知道需要进行权值的和阈值初始化,这里三层结构权值初始值依次设定为W1,W2,W3;对网络中的学习精度也要进行设定,用来判断是否收敛于某一值,设定为φ;还有一个最小值学习率设定为μ,设定较小值以保证系统的稳定性;另外,学习偏差设为B;因为BP神经网络处理任意非线性关系,激活函数来加入非线性因素,它的一大特点是处处可求导函数,非常适用于BP神经网络。
CN201711492287.4A 2017-12-30 2017-12-30 一种基于协同过滤的优化方法 Pending CN108038629A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711492287.4A CN108038629A (zh) 2017-12-30 2017-12-30 一种基于协同过滤的优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711492287.4A CN108038629A (zh) 2017-12-30 2017-12-30 一种基于协同过滤的优化方法

Publications (1)

Publication Number Publication Date
CN108038629A true CN108038629A (zh) 2018-05-15

Family

ID=62099195

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711492287.4A Pending CN108038629A (zh) 2017-12-30 2017-12-30 一种基于协同过滤的优化方法

Country Status (1)

Country Link
CN (1) CN108038629A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108804683A (zh) * 2018-06-13 2018-11-13 重庆理工大学 结合矩阵分解和协同过滤算法的电影推荐方法
CN108829763A (zh) * 2018-05-28 2018-11-16 电子科技大学 一种基于深度神经网络的影评网站用户的属性预测方法
CN109241422A (zh) * 2018-08-29 2019-01-18 广东工业大学 一种改进的基于协同过滤算法的用户兴趣度预测方法
CN109740655A (zh) * 2018-12-26 2019-05-10 西安电子科技大学 基于矩阵分解及神经协同过滤的物品评分预测方法
CN109902201A (zh) * 2019-03-08 2019-06-18 天津理工大学 一种基于cnn和bp神经网络的推荐方法
CN110532471A (zh) * 2019-08-27 2019-12-03 华侨大学 基于门控循环单元神经网络的主动学习协同过滤方法
CN110968794A (zh) * 2019-11-14 2020-04-07 中山大学 一种基于二元信息网络的多视角注意力推荐算法
CN111931075A (zh) * 2020-10-19 2020-11-13 腾讯科技(深圳)有限公司 一种内容推荐方法、装置、计算机设备及存储介质
CN112395499A (zh) * 2020-11-03 2021-02-23 腾讯科技(深圳)有限公司 信息推荐方法及装置、电子设备、存储介质
CN112749345A (zh) * 2021-02-09 2021-05-04 上海海事大学 一种基于神经网络的k近邻矩阵分解推荐方法
CN113643781A (zh) * 2021-06-25 2021-11-12 合肥工业大学 基于时序预警信号的健康干预方案个性化推荐方法及系统
CN117936001A (zh) * 2024-03-25 2024-04-26 四川鸿霖科技有限公司 一种实验数据建模评测方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103093376A (zh) * 2013-01-16 2013-05-08 北京邮电大学 基于奇异值分解算法的聚类协同过滤推荐系统
CN105005701A (zh) * 2015-07-24 2015-10-28 成都康赛信息技术有限公司 一种基于属性与评分的个性化推荐方法
CN105354330A (zh) * 2015-11-27 2016-02-24 南京邮电大学 一种基于稀疏数据预处理的协同过滤推荐方法
US9691035B1 (en) * 2014-04-14 2017-06-27 Amazon Technologies, Inc. Real-time updates to item recommendation models based on matrix factorization

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103093376A (zh) * 2013-01-16 2013-05-08 北京邮电大学 基于奇异值分解算法的聚类协同过滤推荐系统
US9691035B1 (en) * 2014-04-14 2017-06-27 Amazon Technologies, Inc. Real-time updates to item recommendation models based on matrix factorization
CN105005701A (zh) * 2015-07-24 2015-10-28 成都康赛信息技术有限公司 一种基于属性与评分的个性化推荐方法
CN105354330A (zh) * 2015-11-27 2016-02-24 南京邮电大学 一种基于稀疏数据预处理的协同过滤推荐方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李亚欣: "基于协同过滤的电子商务个性化推荐算法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108829763A (zh) * 2018-05-28 2018-11-16 电子科技大学 一种基于深度神经网络的影评网站用户的属性预测方法
CN108804683B (zh) * 2018-06-13 2021-11-23 重庆理工大学 结合矩阵分解和协同过滤算法的电影推荐方法
CN108804683A (zh) * 2018-06-13 2018-11-13 重庆理工大学 结合矩阵分解和协同过滤算法的电影推荐方法
CN109241422A (zh) * 2018-08-29 2019-01-18 广东工业大学 一种改进的基于协同过滤算法的用户兴趣度预测方法
CN109740655A (zh) * 2018-12-26 2019-05-10 西安电子科技大学 基于矩阵分解及神经协同过滤的物品评分预测方法
CN109902201A (zh) * 2019-03-08 2019-06-18 天津理工大学 一种基于cnn和bp神经网络的推荐方法
CN110532471B (zh) * 2019-08-27 2022-07-01 华侨大学 基于门控循环单元神经网络的主动学习协同过滤方法
CN110532471A (zh) * 2019-08-27 2019-12-03 华侨大学 基于门控循环单元神经网络的主动学习协同过滤方法
CN110968794A (zh) * 2019-11-14 2020-04-07 中山大学 一种基于二元信息网络的多视角注意力推荐算法
CN110968794B (zh) * 2019-11-14 2023-12-12 中山大学 一种基于二元信息网络的多视角注意力推荐方法
CN111931075A (zh) * 2020-10-19 2020-11-13 腾讯科技(深圳)有限公司 一种内容推荐方法、装置、计算机设备及存储介质
CN112395499A (zh) * 2020-11-03 2021-02-23 腾讯科技(深圳)有限公司 信息推荐方法及装置、电子设备、存储介质
CN112395499B (zh) * 2020-11-03 2022-08-12 腾讯科技(深圳)有限公司 信息推荐方法及装置、电子设备、存储介质
CN112749345A (zh) * 2021-02-09 2021-05-04 上海海事大学 一种基于神经网络的k近邻矩阵分解推荐方法
CN112749345B (zh) * 2021-02-09 2023-11-14 上海海事大学 一种基于神经网络的k近邻矩阵分解推荐方法
CN113643781A (zh) * 2021-06-25 2021-11-12 合肥工业大学 基于时序预警信号的健康干预方案个性化推荐方法及系统
CN113643781B (zh) * 2021-06-25 2023-07-04 合肥工业大学 基于时序预警信号的健康干预方案个性化推荐方法及系统
CN117936001A (zh) * 2024-03-25 2024-04-26 四川鸿霖科技有限公司 一种实验数据建模评测方法及系统

Similar Documents

Publication Publication Date Title
CN108038629A (zh) 一种基于协同过滤的优化方法
CN111428147A (zh) 结合社交和兴趣信息的异源图卷积网络的社交推荐方法
CN105574025B (zh) 用于计算排序分及建立模型的方法、装置及商品推荐系统
Gao et al. Hybrid personalized recommended model based on genetic algorithm
CN109740924B (zh) 融合属性信息网络和矩阵分解的物品评分预测方法
CN112115377A (zh) 一种基于社交关系的图神经网络链路预测推荐方法
CN107833117A (zh) 一种考虑标签信息的贝叶斯个性化排序推荐方法
CN107194722A (zh) 一种共享经济下的基于数据挖掘的动态定价算法
CN107330727A (zh) 一种基于隐语义模型的个性化推荐方法
Navgaran et al. Evolutionary based matrix factorization method for collaborative filtering systems
CN111949887A (zh) 物品推荐方法、装置及计算机可读存储介质
CN105868422B (zh) 一种基于弹性维特征向量优化抽取的协同过滤推荐方法
CN115860880B (zh) 基于多层异质图卷积模型的个性化商品推荐方法及系统
CN111695024A (zh) 对象评估值的预测方法及系统、推荐方法及系统
CN115329215A (zh) 异构网络中基于自适应动态知识图谱的推荐方法及系统
CN114861050A (zh) 一种基于神经网络的特征融合推荐方法及系统
CN117635238A (zh) 一种商品推荐方法、装置、设备及存储介质
CN114840745A (zh) 一种基于图表征学习和深度语义匹配模型的个性化推荐方法及系统
CN112767085A (zh) 商品相似性分析及商品推荐方法、装置及计算机存储介质
CN112948696A (zh) 具有隐私保护功能的跨域医疗保健设备推荐方法及系统
CN108491477A (zh) 基于多维云和用户动态兴趣的神经网络推荐方法
CN106777123A (zh) 一种基于双向张量分解模型的群推荐方法
Li et al. Personalized learning paths Recommendation based on Learner Personas
CN109871953B (zh) fpRNA遗传算法的重油裂解过程小波神经网络建模方法
CN106844577A (zh) 协同过滤推荐系统中基于时序熵的用户相似度计算方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180515

RJ01 Rejection of invention patent application after publication