CN110110209A - 一种基于局部加权线性回归模型的交叉推荐方法及系统 - Google Patents
一种基于局部加权线性回归模型的交叉推荐方法及系统 Download PDFInfo
- Publication number
- CN110110209A CN110110209A CN201810058410.XA CN201810058410A CN110110209A CN 110110209 A CN110110209 A CN 110110209A CN 201810058410 A CN201810058410 A CN 201810058410A CN 110110209 A CN110110209 A CN 110110209A
- Authority
- CN
- China
- Prior art keywords
- scoring
- evaluated
- regression model
- lrm
- linear regression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012417 linear regression Methods 0.000 title claims abstract description 125
- 238000000034 method Methods 0.000 title claims abstract description 43
- 239000013598 vector Substances 0.000 claims abstract description 92
- 230000003416 augmentation Effects 0.000 claims abstract description 38
- 238000005457 optimization Methods 0.000 claims abstract description 32
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 16
- 230000015654 memory Effects 0.000 claims description 21
- 230000006870 function Effects 0.000 claims description 12
- 230000001052 transient effect Effects 0.000 claims description 11
- 230000017105 transposition Effects 0.000 claims description 4
- 238000004891 communication Methods 0.000 claims description 2
- 230000003542 behavioural effect Effects 0.000 abstract description 2
- 230000006399 behavior Effects 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000004590 computer program Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000002195 synergetic effect Effects 0.000 description 2
- JGZVUTYDEVUNMK-UHFFFAOYSA-N 5-carboxy-2',7'-dichlorofluorescein Chemical compound C12=CC(Cl)=C(O)C=C2OC2=CC(O)=C(Cl)C=C2C21OC(=O)C1=CC(C(=O)O)=CC=C21 JGZVUTYDEVUNMK-UHFFFAOYSA-N 0.000 description 1
- 241001269238 Data Species 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000001094 effect on targets Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Algebra (AREA)
- Operations Research (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Software Systems (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种基于局部加权线性回归模型的交叉推荐方法及系统,该交叉推荐方法包括:获取用户在目标对象中对至少一目标项目的评分记录及在与目标对象相关的辅助对象中对至少一辅助项目的辅助评分记录;根据评分记录及辅助评分记录建立待评目标项目的待评项目向量;将待评项目向量扩展为增广向量,并根据增广向量建立局部加权线性回归模型;利用随机梯度下降算法,对局部加权线性回归模型进行求解,得到优化解;根据优化解计算得出对目标对象中的待评目标项目的预测评分;将预测评分满足预设评分标准的待评目标项目推荐给用户。通过实施本发明,实现了用户的行为数据与评分数据的充分拟合,从而提高了交叉推荐系统的准确率及召回率。
Description
技术领域
本发明涉及信息处理技术领域,具体涉及一种基于局部加权线性回归模型的交叉推荐方法及系统。
背景技术
随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息过载(information overload)的时代。在这个时代,无论是信息消费者还是信息生产者都遇到了很大的挑战:对于信息消费者,从大量信息中找到自己感兴趣的信息是一件非常困难的事情;对于信息生产者,让自己生产的信息脱颖而出,受到广大用户的关注,也是一件非常困难的事情。推荐系统是解决这一矛盾的重要工具。推荐系统的任务就是联系用户和信息,一方面帮助用户发现对自己有价值的信息,另一方面让信息能够展现在对它感兴趣的用户面前,从而实现信息消费者和信息生产者的双赢。推荐算法近些年获得了日益广泛的研究,其应用也深入到人们生活的方方面面。然而目前推荐算法面临的一个重要困难是数据稀疏性问题,即用户评分的数据在总的评分矩阵中所占的比重非常小。
为此,近些年兴起了交叉域推荐算法的研究。交叉推荐算法利用包含用户额外偏好数据的辅助对象信息来提高目标对象上的推荐效果,能有效地缓解目标对象上的数据稀疏性问题。目前准确率及召回率较好的交叉推荐算法是基于二次回归模型的交叉推荐算法。该方法是通过建立二次回归模型来拟合用户行为数据和用户评分数据,交叉推荐系统利用二次回归模型对用户的兴趣进行预测,将预测结果信息推荐给用户。但是由于用户行为数据与用户评分数据之间的关系往往异常复杂,二次回归模型很难对其进行充分地拟合(即数据处于欠学习状态),最终影响了交叉推荐系统的准确率及召回率。建立更高次的(如三次、四次)回归模型虽可能对数据拟合的比较充分,但却容易引起过拟合,降低交叉推荐系统的准确率及召回率。
发明内容
本发明要解决的技术问题在于克服现有技术中基于二次回归模型的交叉推荐算法,由于用户行为数据与用户评分数据之间的关系往往异常复杂,二次回归模型很难对其进行充分地拟合(即数据处于欠学习状态),从而影响交叉推荐系统的准确率及召回率;而建立更高次的(如三次、四次)回归模型虽可能对数据拟合的比较充分,却容易造成过拟合,也会影响交叉推荐系准确率及召回率的问题。
根据第一方面,本发明实施例提供了一种基于局部加权线性回归模型的交叉推荐方法,包括:获取用户在目标对象中对至少一目标项目的评分记录及在与所述目标对象相关的辅助对象中对至少一辅助项目的辅助评分记录;根据所述评分记录及辅助评分记录建立待评目标项目的待评项目向量;将所述待评项目向量扩展为增广向量,并根据所述增广向量建立局部加权线性回归模型;利用随机梯度下降算法,对所述局部加权线性回归模型进行求解,得到优化解;根据所述优化解计算得出对所述目标对象中的待评目标项目的预测评分;将所述预测评分满足预设评分标准的待评目标项目推荐给所述用户。
结合第一方面,在第一方面第一实施方式中,所述将所述待评项目向量扩展为增广向量,包括:在所述待评项目向量中加入截距项,将所述待评项目向量扩展为增广向量,所述截距项的值为1。
结合第一方面,在第一方面第二实施方式中,按照以下公式建立局部加权线性回归模型:
其中,τ表示预设的宽度参数,k表示所有所述增广向量的下标集合,x(k)表示所述用户对第k个所述待评目标项目对应的所述增广向量,y(k)表示所述用户对第k个所述待评目标项目对应的评分,θ表示局部加权线性回归模型中所计算的直线的权向量,f(θ)表示局部加权线性回归模型(当参数为θ时)的误差函数。
结合第一方面,在第一方面第三实施方式中,所述利用随机梯度下降算法,对所述局部加权线性回归模型进行求解,得到优化解,包括:
步骤S41:建立所述用户的评分训练项目样本集,设定的θ初始值阈值λ及偏差值b的初始值为λ+1;
步骤S42:判断所述偏差值b是否大于所述阈值λ,当所述偏差值b大于所述阈值λ时执行步骤S43,当所述偏差值b不大于所述阈值λ时执行步骤S44;
步骤S43:根据所述θ值、所述f(θ)及所述评分训练项目样本集中各个训练项目,计算所述f(θ),根据所述f(θ)对θ进行更新,得到更新后的θ值;并根据所述更新后的θ值计算更新后的所述f(θ),将所述偏差值b更新为所述更新后的所述f(θ),返回步骤S42;
步骤S44:将所述更新后的θ值设为所述优化解。
结合第一方面,在第一方面的第四实施方式中,所述根据所述θ值、所述f(θ)及所述评分训练项目样本集中各个训练项目,计算所述f(θ),根据所述f(θ)对θ进行更新,得到更新后的θ值,包括:按照以下公式更新所述θ值:
其中,τ表示预设的宽度参数,i表示所有所述增广向量的下标集合,x(i)表示所述用户对第i个所述待评目标项目对应的所述增广向量,y(i)表示所述用户对第i个所述待评目标项目对应的评分,f(θ)表示表示局部加权线性回归模型(当参数为θ时)在所述评分训练项目样本集上的误差函数值。
结合第一方面,在第一方面的第五实施方式中,按照以下公式计算所述预测评分:
G=θTx
其中,θT为所述优化解的转置,x为所述待评目标项目的所述增广向量。
根据第二方面,本发明实施例提供了一种基于局部加权线性回归模型的交叉推荐系统,包括:评分记录获取模块,用于获取用户在目标对象中对至少一目标项目的评分记录及在与所述目标对象相关的辅助对象中对至少一辅助项目的辅助评分记录;待评目标向量构建模块,用于根据所述评分记录及辅助评分记录建立待评目标项目的待评项目向量;局部加权线性回归模型构建模块,用于将所述待评项目向量扩展为增广向量,并根据所述增广向量建立局部加权线性回归模型;优化解求解模块,用于利用随机梯度下降算法,对所述局部加权线性回归模型进行求解,得到优化解;预测评分计算模块,根据所述优化解计算得出对所述目标对象中的待评目标项目的预测评分;项目推荐模块,用于将所述预测评分满足预设评分标准的待评目标项目推荐给所述用户。
结合第二方面,在第二方面第一实施方式中,所述优化解求解模块用于执行以下步骤:
步骤S41:建立所述用户的评分训练项目样本集,设定的θ初始值、阈值λ及偏差值b的初始值为λ+1;
步骤S42:判断所述偏差值b是否大于所述阈值λ,当所述偏差值b大于所述阈值λ时执行步骤S43,当所述偏差值b不大于所述阈值λ时执行步骤S44;
步骤S43:根据所述θ值、所述f(θ)及所述评分训练项目样本集中各个训练项目,计算所述f(θ),根据所述f(θ)对θ进行更新,得到更新后的θ值;并根据所述更新后的θ值计算更新后的所述f(θ),将所述偏差值b更新为所述更新后的所述f(θ),返回步骤S42;
步骤S44:将所述更新后的θ值设为所述优化解。
根据第三方面,本发明实施例提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行第一方面或者第一方面的任意一种可选方式中所述的基于局部加权线性回归模型的交叉推荐方法。
根据第四方面,本发明实施例提供了一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行第一方面或者第一方面的任意一种可选方式中所述的基于局部加权线性回归模型的交叉推荐方法。
本发明技术方案,具有如下优点:
本发明实施例通过利用用户对目标对象及辅助对象所包含的评分记录建立待评目标项目的待评项目向量,再通过局部加权线性回归模型的构建及其求解,计算得出待评目标项目的预测评分,最终根据预测评分将待评目标项目推荐给用户。通过局部加权线性回归模型的构建实现了用户的行为数据与评分数据的充分拟合,从而提高了交叉推荐系统的准确率及召回率。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中基于局部加权线性回归模型的交叉推荐方法的流程图;
图2为本发明实施例中目标对象及辅助对象上用户与项目的评分矩阵的示意图;
图3为本发明实施例中对局部加权线性回归模型进行求解的流程图;
图4为本发明实施例中基于局部加权线性回归模型的交叉推荐系统的结构示意图;
图5为本发明实施例中电子设备的结构示意图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
实施例1
本发明实施例提供一种基于局部加权线性回归模型的交叉推荐方法,如图1所示,该基于局部加权线性回归模型的交叉推荐方法包括:
步骤S1:获取用户在目标对象中对至少一目标项目的评分记录及在与目标对象相关的辅助对象中对至少一辅助项目的辅助评分记录。
步骤S2:根据评分记录及辅助评分记录建立待评目标项目的待评项目向量。
步骤S3:将待评项目向量扩展为增广向量,并根据增广向量建立局部加权线性回归模型。
步骤S4:利用随机梯度下降算法,对局部加权线性回归模型进行求解,得到优化解。
步骤S5:根据优化解计算得出对目标对象中的待评目标项目的预测评分。
步骤S6:将预测评分满足预设评分标准的待评目标项目推荐给用户。
通过上述步骤S1至步骤S6,本发明实施例的基于局部加权线性回归模型的交叉推荐方法,实现了用户行为数据与用户评分数据之间的充分拟合,从而提高了交叉推荐系统的准确率及召回率。
以下结合具体示例对本发明实施例的基于局部加权线性回归模型的交叉推荐方法做进一步说明。
具体地,上述的步骤S1,获取用户在目标对象中对至少一目标项目的评分记录及在与目标对象相关的辅助对象中对至少一辅助项目的辅助评分记录。假设目标对象为多个电影,辅助对象为多个图书、多首歌曲等。则获取用户对多个电影中已经评价过的电影的评分及用户对不同电影类型或不同演员的评分。
具体地,上述的步骤S2,根据评分记录及辅助评分记录建立待评目标项目的待评项目向量。假设m个不同对象上的关于用户和项目的协同数据为{D1,…,Dm},其中这些对象上的项目的类型是不同的。尽管一个用户的评分信息在某一个对象上可能是极其稀疏的,他却可能在其他对象上有着相当丰富的协同数据。交差域协同过滤(CDCF)的目的就是将知识从不同的辅助对象上转移到目标对象上来提高目标对象上的评分准确率及召回率。
假设D1是目标对象,{D2,…,Dm}是辅助对象。设Uj和Ij分别表示在对象Dj上用户和项目的集合。按照公式(1)将目标对象上评分预测问题建模为一个目标函数:
y:U1*I1→R (1)
每一个用户与项目的交互(u,i)∈U1*I1可以通过二进制特征向量来表示,其中向量中的每一位二进制变量表示了哪一位用户对哪一项进行了评分。换句话说,如果用户u对项i进行了评分,特征向量x按照公式(2)表示为:
其中非零项元素代表用户u和项目i。特征向量x也可以按照公式(3)利用稀疏表示:
x(u,i)={(u,1),(i,1)} (3)
在目标对象给定特征向量x(u,i)后,可以通过来自于其他辅助对象上的与用户u相关的协同信息来扩展该向量。假设sj(u)表示对象Dj上用户u评分的所有项目。对于每一个辅助对象Dj,j=2,…,m,利用扩展向量Zj(u)来扩展x(u,i),Zj(u)的稀疏按照公式(4)表示如下:
其中是依赖于对象的实值函数。按照公式(5)定义如下:
其中,rj(u,l)表示用户u对项目l的评分(如用户u对项目l未评分,则将rj(u,l)赋值为0),|sj(u)|表示在对象Dj上用户u评分过的项目总数。表示用户u对项目l的评分基于用户u评分过的项目总数规范化后的结果。在实际应用中,当|sj(u)|=0时,则使
基于上述定义,待评项目向量X可以按照公式(6)采用稀疏形式进行表示:
具体地,在一实施例中,如图2所示,M1表示目标对象的评分矩阵,M2表示辅助对象的评分矩阵,u1和u2表示两个不同的用户,矩阵中的数字表示用户对各个目标项目及辅助项目的评分。在目标对象评分矩阵中,每一个用户与项目的交互(u,i)∈U1*I1可以通过二进制特征向量来表示,其中向量中的每一位二进制变量表示了哪一位用户对哪一项目进行了评分。所以评分5对应的特征向量可以按照公式(7)表示:
根据公式(4)及公式(5)可得目标对象中评分5对应的扩展向量为
因此目标对象上对应评分5的待评项目向量可以表示为同样方法,可以求出目标对象上其他评分数据对应的待评项目向量。
在一较佳实施例中,上述的步骤S3,将待评项目向量扩展为增广向量,包括:在待评项目向量中加入截距项,将待评项目向量扩展为增广向量,在一实施例中,该截距项的值可为1。对于任意一个(u,i)的扩展向量X,设其维数为n,即X=(x1,…xn)。首先将X扩展为增广向量即加入截距项x0=1,所以
在一较佳实施例中,上述的步骤S3,按照公式(8)建立局部加权线性回归模型:
其中,τ表示预设的宽度参数,k表示所有增广向量的下标集合,x(k)表示用户对第k个待评目标项目对应的增广向量,y(k)表示用户对第k个待评目标项目对应的评分,θ表示局部加权线性回归模型中所计算的直线的权向量,f(θ)表示局部加权线性回归模型(当参数为θ时)的误差函数。
在实际应用中,上述预设的宽度参数τ可取的值为10的整数次幂,例如:100,10,1,0.1,0.01,0.001等。
在一较佳实施例中,如图3所示,上述的步骤S4,利用随机梯度下降算法,对局部加权线性回归模型进行求解,得到优化解,包括:
步骤S41:建立用户的评分训练项目样本集,设定的θ初始值阈值λ及偏差值b的初始值为λ+1;
步骤S42:判断偏差值b是否大于阈值λ,当偏差值b大于阈值λ时执行步骤S43,当偏差值b不大于阈值λ时执行步骤S44;
步骤S43:根据θ值、f(θ)及评分训练项目样本集中各个训练项目,计算f(θ),根据f(θ)对θ进行更新,得到更新后的θ值;并根据更新后的θ值计算更新后的f(θ),将偏差值b更新为更新后的f(θ),返回步骤S42;
步骤S44:将更新后的θ值设为优化解。
在实际应用中,上述的可任意取值,例如的每一维均为0.1;为了保证迭代算法的精度,上述的阈值λ可设置为一个很小的数值,在本发明实施例中阈值λ取值为0.001。
在一较佳实施例中,上述的步骤S43,根据θ值、f(θ)及评分训练项目样本集中各个训练项目,计算f(θ),根据f(θ)对θ进行更新,得到更新后的θ值,包括:按照公式(9)更新θ值:
其中,τ表示预设的宽度参数,i表示所有增广向量的下标集合,x(i)表示用户对第i个待评目标项目对应的增广向量,y(i)表示用户对第i个待评目标项目对应的评分,f(θ)表示局部加权线性回归模型(当参数为θ时)在评分训练项目样本集上的误差函数值。
在一较佳实施例中,上述的步骤S5,按照公式(10)计算预测评分:
G=θTx (10)
其中,θT为优化解的转置,x为待评目标项目的增广向量。
在一较佳实施例中,上述的步骤S6,将预测评分满足预设评分标准的待评目标项目推荐给用户。假设预设评分标准为4,如果对目标对象中某一待评目标项目的预测评分为5,则将该目标项目推荐给客户。
通过上述步骤S1至步骤S6,本发明实施例的基于局部加权线性回归模型的交叉推荐方法,实现了用户行为数据与用户评分数据之间的充分拟合,从而提高了交叉推荐系统的准确率及召回率。
实施例2
本发明实施例提供一种基于局部加权线性回归模型的交叉推荐系统,如图4所示,该基于局部加权线性回归模型的交叉推荐系统包括:评分记录获取模块1,用于获取用户在目标对象中对至少一目标项目的评分记录及在与目标对象相关的辅助对象中对至少一辅助项目的辅助评分记录;待评目标向量构建模块2,用于根据评分记录及辅助评分记录建立待评目标项目的待评项目向量;局部加权线性回归模型构建模块3,用于将待评项目向量扩展为增广向量,并根据增广向量建立局部加权线性回归模型;优化解求解模块4,用于利用随机梯度下降算法,对局部加权线性回归模型进行求解,得到优化解;预测评分计算模块5,根据优化解计算得出对目标对象中的待评目标项目的预测评分;项目推荐模块6,用于将预测评分满足预设评分标准的待评目标项目推荐给用户。
通过上述各个组成部分之间的协同工作,本发明实施例的基于局部加权线性回归模型的交叉推荐系统,实现了用户行为数据与用户评分数据之间的充分拟合,从而提高了交叉推荐系统的准确率及召回率。
以下结合具体示例对本发明实施例的基于局部加权线性回归模型的交叉推荐方法做进一步说明。
具体地,上述的评分记录获取模块1,用于获取用户在目标对象中对至少一目标项目的评分记录及在与目标对象相关的辅助对象中对至少一辅助项目的辅助评分记录。假设目标对象为多个电影,辅助对象为多个图书、多首歌曲等。则获取用户对多个电影中已经评价过的电影的评分及用户对不同电影类型或不同演员的评分。
具体地,上述的待评目标向量构建模块2,用于根据评分记录及辅助评分记录建立待评目标项目的待评项目向量。上述待评项目向量的建立过程具体参见实施例1中步骤S2的相关描述,在此不再赘述。
具体地,上述的局部加权线性回归模型构建模块3,用于将待评项目向量扩展为增广向量,并根据增广向量建立局部加权线性回归模型。上述将待评项目向量扩展为增广向量,并建立局部加权线性回归模型的具体过程参见实施例1中步骤S3的相关描述,在此不再赘述。
在一较佳实施例中,上述的优化解求解模块4,用于执行以下步骤:
步骤S41:建立用户的评分训练项目样本集,设定的θ初始值阈值λ及偏差值b的初始值为λ+1;
步骤S42:判断偏差值b是否大于阈值λ,当偏差值b大于阈值λ时执行步骤S43,当偏差值b不大于阈值λ时执行步骤S44;
步骤S43:根据θ值、f(θ)及评分训练项目样本集中各个训练项目,计算f(θ),根据f(θ)对θ进行更新,得到更新后的θ值;并根据更新后的θ值计算更新后的f(θ),将偏差值b更新为更新后的f(θ),返回步骤S42;
步骤S44:将更新后的θ值设为优化解。
具体地,上述的步骤S43,根据θ值、f(θ)及评分训练项目样本集中各个训练项目,计算f(θ),根据f(θ)对θ进行更新,得到更新后的θ值,包括:按照实施例1中的公式(9)更新θ值:
其中,τ表示预设的宽度参数,i表示所有增广向量的下标集合,x(i)表示用户对第i个待评目标项目对应的增广向量,y(i)表示用户对第i个待评目标项目对应的评分,f(θ)表示局部加权线性回归模型(当参数为θ时)在评分训练项目样本集上的误差函数值。
具体地,上述的预测评分计算模块5,用于按照实施例1中的公式(10)计算预测评分:
G=θTx (10)
其中,θT为优化解的转置,x为待评目标项目的增广向量。
具体地,上述的项目推荐模块6,用于将预测评分满足预设评分标准的待评目标项目推荐给用户。假设预设评分标准为4,如果对目标对象中某一待评目标项目的预测评分为5,则将该目标项目推荐给客户。
通过上述各个组成部分之间的协同工作,本发明实施例的基于局部加权线性回归模型的交叉推荐系统,实现了用户行为数据与用户评分数据之间的充分拟合,从而提高了交叉推荐系统的准确率及召回率。
实施例3
本发明实施例提供一种非暂态计算机存储介质,该计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意实施例1中的基于局部加权线性回归模型的交叉推荐方法。其中,上述存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory,ROM)、随机存储记忆体(Random Access Memory,RAM)、快闪存储器(FlashMemory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;该存储介质还可以包括上述种类的存储器的组合。
本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成的,程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,的存储介质可为磁碟、光盘、只读存储记忆体(ROM)或随机存储记忆体(RAM)等。
实施例4
本发明实施例提供一种基于局部加权线性回归模型的交叉推荐方法的电子设备,其结构示意图如图5所示,该设备包括:一个或多个处理器410以及存储器420,图5中以一个处理器410为例。
执行基于局部加权线性回归模型的交叉推荐方法的电子设备还可以包括:输入装置430和输出装置440。
处理器410、存储器420、输入装置430和输出装置440可以通过总线或者其他方式连接,图5中以通过总线连接为例。
处理器410可以为中央处理器(Central Processing Unit,CPU)。处理器410还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器420作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本申请实施例中的基于局部加权线性回归模型的交叉推荐方法对应的程序指令/模块,处理器410通过运行存储在存储器420中的非暂态软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例的基于局部加权线性回归模型的交叉推荐方法。
存储器420可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据芯片追踪调试的处理装置的使用所创建的数据等。此外,存储器420可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器420可选包括相对于处理器410远程设置的存储器,这些远程存储器可以通过网络连接至基于局部加权线性回归模型的交叉推荐装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置430可接收输入的数字或字符信息,以及产生与基于局部加权线性回归模型的交叉推荐操作的处理装置有关的用户设置以及功能控制有关的键信号输入。输出装置440可包括显示屏等显示设备。
一个或者多个模块存储在存储器420中,当被一个或者多个处理器410执行时,执行如图1-图3所示的方法。
上述产品可执行本发明实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本发明实施例中详尽描述的技术细节,具体可参见如图1-图3所示的实施例中的相关描述。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
Claims (10)
1.一种基于局部加权线性回归模型的交叉推荐方法,其特征在于,包括:
获取用户在目标对象中对至少一目标项目的评分记录及在与所述目标对象相关的辅助对象中对至少一辅助项目的辅助评分记录;
根据所述评分记录及辅助评分记录建立待评目标项目的待评项目向量;
将所述待评项目向量扩展为增广向量,并根据所述增广向量建立局部加权线性回归模型;
利用随机梯度下降算法,对所述局部加权线性回归模型进行求解,得到优化解;
根据所述优化解计算得出对所述目标对象中的待评目标项目的预测评分;
将所述预测评分满足预设评分标准的待评目标项目推荐给所述用户。
2.根据权利要求1所述的基于局部加权线性回归模型的交叉推荐方法,其特征在于,所述将所述待评项目向量扩展为增广向量,包括:
在所述待评项目向量中加入截距项,将所述待评项目向量扩展为增广向量,所述截距项的值为1。
3.根据权利要求2所述的基于局部加权线性回归模型的交叉推荐方法,其特征在于,按照以下公式建立局部加权线性回归模型:
其中,τ表示预设的宽度参数,k表示所有所述增广向量的下标集合,x(k)表示所述用户对第k个所述待评目标项目对应的所述增广向量,y(k)表示所述用户对第k个所述待评目标项目对应的评分,θ表示局部加权线性回归模型中所计算的直线的权向量,f(θ)表示局部加权线性回归模型(当参数为θ时)的误差函数。
4.根据权利要求3所述的基于局部加权线性回归模型的交叉推荐方法,其特征在于,所述利用随机梯度下降算法,对所述局部加权线性回归模型进行求解,得到优化解,包括:
步骤S41:建立所述用户的评分训练项目样本集,设定的θ初始值阈值λ及偏差值b的初始值为λ+1;
步骤S42:判断所述偏差值b是否大于所述阈值λ,当所述偏差值b大于所述阈值λ时执行步骤S43,当所述偏差值b不大于所述阈值λ时执行步骤S44;
步骤S43:根据所述θ值、所述f(θ)及所述评分训练项目样本集中各个训练项目,计算所述f(θ),根据所述f(θ)对θ进行更新,得到更新后的θ值;并根据所述更新后的θ值计算更新后的所述f(θ),将所述偏差值b更新为所述更新后的所述f(θ),返回步骤S42;
步骤S44:将所述更新后的θ值设为所述优化解。
5.根据权利要求4所述的基于局部加权线性回归模型的交叉推荐方法,其特征在于,所述根据所述θ值、所述f(θ)及所述评分训练项目样本集中各个训练项目,计算所述f(θ),根据所述f(θ)对θ进行更新,得到更新后的θ值,包括:
按照以下公式更新所述θ值:
其中,τ表示预设的宽度参数,i表示所有所述增广向量的下标集合,x(i)表示所述用户对第i个所述待评目标项目对应的所述增广向量,y(i)表示所述用户对第i个所述待评目标项目对应的评分,f(θ)表示局部加权线性回归模型(当参数为θ时)在所述评分训练项目样本集上的误差函数值。
6.根据权利要求5所述的基于局部加权线性回归模型的交叉推荐方法,其特征在于,按照以下公式计算所述预测评分:
G=θTx
其中,θT为所述优化解的转置,x为所述待评目标项目的所述增广向量。
7.一种基于局部加权线性回归模型的交叉推荐系统,其特征在于,包括:
评分记录获取模块(1),用于获取用户在目标对象中对至少一目标项目的评分记录及在与所述目标对象相关的辅助对象中对至少一辅助项目的辅助评分记录;
待评目标向量构建模块(2),用于根据所述评分记录及辅助评分记录建立待评目标项目的待评项目向量;
局部加权线性回归模型构建模块(3),用于将所述待评项目向量扩展为增广向量,并根据所述增广向量建立局部加权线性回归模型;
优化解求解模块(4),用于利用随机梯度下降算法,对所述局部加权线性回归模型进行求解,得到优化解;
预测评分计算模块(5),根据所述优化解计算得出对所述目标对象中的待评目标项目的预测评分;
项目推荐模块(6),用于将所述预测评分满足预设评分标准的待评目标项目推荐给所述用户。
8.根据权利要求7所述的基于局部加权线性回归模型的交叉推荐系统,其特征在于,所述优化解求解模块(4)用于执行以下步骤:
步骤S41:建立所述用户的评分训练项目样本集,设定的θ初始值阈值λ及偏差值b的初始值为λ+1;
步骤S42:判断所述偏差值b是否大于所述阈值λ,当所述偏差值b大于所述阈值λ时执行步骤S43,当所述偏差值b不大于所述阈值λ时执行步骤S44;
步骤S43:根据所述θ值、所述f(θ)及所述评分训练项目样本集中各个训练项目,计算所述f(θ),根据所述f(θ)对θ进行更新,得到更新后的θ值;并根据所述更新后的θ值计算更新后的所述f(θ),将所述偏差值b更新为所述更新后的所述f(θ),返回步骤S42;
步骤S44:将所述更新后的θ值设为所述优化解。
9.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令被处理器执行时实现如权利要求1-6任一项所述的基于局部加权线性回归模型的交叉推荐方法。
10.一种电子设备,其特征在于,包括:至少一个处理器(410);以及与所述至少一个处理器(410)通信连接的存储器(420)其中,
所述存储器(420)存储有可被所述至少一个处理器(410)执行的指令,所述指令被所述至少一个处理器(410)执行,以使所述至少一个处理器(410)执行权利要求1-6中任一项所述的基于局部加权线性回归模型的交叉推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810058410.XA CN110110209A (zh) | 2018-01-22 | 2018-01-22 | 一种基于局部加权线性回归模型的交叉推荐方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810058410.XA CN110110209A (zh) | 2018-01-22 | 2018-01-22 | 一种基于局部加权线性回归模型的交叉推荐方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110110209A true CN110110209A (zh) | 2019-08-09 |
Family
ID=67483500
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810058410.XA Pending CN110110209A (zh) | 2018-01-22 | 2018-01-22 | 一种基于局部加权线性回归模型的交叉推荐方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110110209A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110675033A (zh) * | 2019-09-04 | 2020-01-10 | 深圳市为汉科技有限公司 | 焊接训练行为数据评分方法 |
CN111291020A (zh) * | 2019-11-11 | 2020-06-16 | 中国计量大学 | 基于局部加权线性动态系统的动态过程软测量建模方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050096963A1 (en) * | 2003-10-17 | 2005-05-05 | David Myr | System and method for profit maximization in retail industry |
EP2207348A2 (en) * | 2009-01-08 | 2010-07-14 | Axel Springer Digital TV Guide GmbH | Recommender method and system for cross-domain recommendation |
CN102385719A (zh) * | 2011-11-01 | 2012-03-21 | 中国科学院计算技术研究所 | 回归预测方法及装置 |
CN105447145A (zh) * | 2015-11-25 | 2016-03-30 | 天津大学 | 一种基于项目的迁移学习推荐方法及其推荐装置 |
CN106951547A (zh) * | 2017-03-27 | 2017-07-14 | 西安电子科技大学 | 一种基于交叉用户的跨域推荐方法 |
CN107392217A (zh) * | 2016-05-17 | 2017-11-24 | 上海点融信息科技有限责任公司 | 计算机实现的信息处理方法及装置 |
-
2018
- 2018-01-22 CN CN201810058410.XA patent/CN110110209A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050096963A1 (en) * | 2003-10-17 | 2005-05-05 | David Myr | System and method for profit maximization in retail industry |
EP2207348A2 (en) * | 2009-01-08 | 2010-07-14 | Axel Springer Digital TV Guide GmbH | Recommender method and system for cross-domain recommendation |
CN102385719A (zh) * | 2011-11-01 | 2012-03-21 | 中国科学院计算技术研究所 | 回归预测方法及装置 |
CN105447145A (zh) * | 2015-11-25 | 2016-03-30 | 天津大学 | 一种基于项目的迁移学习推荐方法及其推荐装置 |
CN107392217A (zh) * | 2016-05-17 | 2017-11-24 | 上海点融信息科技有限责任公司 | 计算机实现的信息处理方法及装置 |
CN106951547A (zh) * | 2017-03-27 | 2017-07-14 | 西安电子科技大学 | 一种基于交叉用户的跨域推荐方法 |
Non-Patent Citations (8)
Title |
---|
JURE LESKOVEC: "The Dynamics of Viral Marketing ∗", 《ACM》 * |
JURE LESKOVEC: "The Dynamics of Viral Marketing ∗", 《ACM》, 11 July 2006 (2006-07-11) * |
MARIO FRANCISCO-FERN?NDEZ等: "地震震级空间分布的非参数分析", 《世界地震译丛》 * |
MARIO FRANCISCO-FERN?NDEZ等: "地震震级空间分布的非参数分析", 《世界地震译丛》, no. 01, 15 February 2012 (2012-02-15) * |
XU YU等: "A User-Based Cross Domain Collaborative Filtering Algorithm Based on a Linear Decomposition Model", 《IEEE》 * |
XU YU等: "A User-Based Cross Domain Collaborative Filtering Algorithm Based on a Linear Decomposition Model", 《IEEE》, 16 November 2017 (2017-11-16) * |
刘军: "《基于scikit-learn的机器学习 算法与实践》", 东南大学出版社, pages: 3 * |
欧辉思等: "面向跨领域的推荐系统研究现状与趋势", 《小型微型计算机系统》, no. 07, 15 July 2016 (2016-07-15) * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110675033A (zh) * | 2019-09-04 | 2020-01-10 | 深圳市为汉科技有限公司 | 焊接训练行为数据评分方法 |
CN110675033B (zh) * | 2019-09-04 | 2023-06-30 | 深圳市为汉科技有限公司 | 焊接训练行为数据评分方法 |
CN111291020A (zh) * | 2019-11-11 | 2020-06-16 | 中国计量大学 | 基于局部加权线性动态系统的动态过程软测量建模方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | ALKEMIE: An intelligent computational platform for accelerating materials discovery and design | |
Aastveit et al. | Nowcasting GDP in real time: A density combination approach | |
JP6460095B2 (ja) | 学習モデル選択システム、学習モデル選択方法及びプログラム | |
JP4661250B2 (ja) | 予測方法、予測装置および予測プログラム | |
Geromont et al. | Complex assessments or simple management procedures for efficient fisheries management: a comparative study | |
Zhang et al. | Robust estimation and variable selection for semiparametric partially linear varying coefficient model based on modal regression | |
Dufour et al. | Factor-augmented VARMA models with macroeconomic applications | |
Cao et al. | Robust estimation for ordinary differential equation models | |
Chen et al. | MR-ELM: a MapReduce-based framework for large-scale ELM training in big data era | |
CN107993088A (zh) | 一种购买周期预测方法及装置,电子设备 | |
Patilea et al. | Testing second-order dynamics for autoregressive processes in presence of time-varying variance | |
Hambly et al. | A forward equation for barrier options under the Brunick & Shreve Markovian projection | |
US20130096967A1 (en) | Optimizer | |
Isaac et al. | Polynomial regression model of making cost prediction in mixed cost analysis | |
CN110110209A (zh) | 一种基于局部加权线性回归模型的交叉推荐方法及系统 | |
Chang et al. | Utilizing an adaptive grey model for short-term time series forecasting: a case study of wafer-level packaging | |
US20130093771A1 (en) | Modified flow graph depiction | |
Wang et al. | Distribution inference from early-stage stationary data streams by transfer learning | |
AU2018260885A1 (en) | Liquid workforce platform | |
JP2019160089A (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
Wang et al. | Non-parametric estimation for NHPP software reliability models | |
Stockhammar et al. | A simple heteroscedasticity removing filter | |
Andersson et al. | Population age structure and real exchange rates in the OECD | |
Li et al. | Structural change monitoring for random coefficient autoregressive time series | |
CN112015912B (zh) | 一种基于知识图谱的指标智能可视化方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |