CN104679866A - 基于图一致性模型的半监督学习的推荐方法 - Google Patents

基于图一致性模型的半监督学习的推荐方法 Download PDF

Info

Publication number
CN104679866A
CN104679866A CN201510095573.1A CN201510095573A CN104679866A CN 104679866 A CN104679866 A CN 104679866A CN 201510095573 A CN201510095573 A CN 201510095573A CN 104679866 A CN104679866 A CN 104679866A
Authority
CN
China
Prior art keywords
data
alpha
similarity
consistency model
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510095573.1A
Other languages
English (en)
Inventor
张宜浩
文俊浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Technology
Original Assignee
Chongqing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Technology filed Critical Chongqing University of Technology
Priority to CN201510095573.1A priority Critical patent/CN104679866A/zh
Publication of CN104679866A publication Critical patent/CN104679866A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于图一致性模型的半监督学习的推荐方法,包括如下步骤:S1,获取服务器数据集,对数据集构建图一致性模型,建立数据点和边;S2,通过映射函数来度量两个数据点之间的相似度,对数据点之间存在的边赋予权重值;S3,建立目标函数并求解,对目标函数的解进行排序;S4,将排序后的目标函数解进行收敛性证明,获得推荐列表,将推荐列表发送到用户终端。本发明能够对用户行为信息和物品内容信息实现个性化推荐。

Description

基于图一致性模型的半监督学习的推荐方法
技术领域
本发明涉及计算机数据挖掘领域,尤其涉及一种基于图一致性模型的半监督学习的推荐方法。
背景技术
传统的推荐方法在利用用户行为信息和物品内容信息实现个性化推荐时,常采用混合推荐的方法。具体策略就是利用基于协同过滤的推荐方法计算用户行为的相似度,利用基于内容的推荐方法对物品的内容信息进行建模,然后将这两个推荐结果按照一定的原则进行组合,进而产生最终的推荐列表。
在组合方式选择上主要包括:加权、变换、混合、特征组合、层叠、特征扩充、元级别,但组合策略的制定是一个棘手的问题。如:①利用加权的组合方式,要求将基于内容的推荐结果和基于协同过滤的推荐结果设置成不同的比重,然后累加得到最终的推荐结果,但比重的权衡因子如何确定没有一个确切的答案;②利用变换组合方式,推荐系统根据问题背景和实际情况变换不同的推荐策略,由于推荐系统中存在多种推荐技术,但每次只能根据具体的环境采取其中的一种策略,实际情况下推荐策略的选择没有确切的标准。同样,在利用其它组合方式时,也存着诸多问题。
发明内容
本发明旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种基于图一致性模型的半监督学习的推荐方法。
为了实现本发明的上述目的,本发明提供了一种基于图一致性模型的半监督学习的推荐方法,其关键在于,包括如下步骤:
S1,获取服务器数据集,对数据集构建图一致性模型,建立数据点和边;
S2,通过映射函数来度量两个数据点之间的相似度,对数据点之间存在的边赋予权重值;
S3,建立目标函数并求解,对目标函数的解进行排序;
S4,将排序后的目标函数解进行收敛性证明,获得推荐列表,将推荐列表发送到用户终端。
所述的基于图一致性模型的半监督学习的推荐方法,优选的,所述S1包括:
S1-1,数据集中的n个数据点X={x1,…,xl,xl+1,…,xn}∈Rn,n是正整数,R是实数,假定XL={x1,x2,…,xl,y1,y2,…,yl)}表示有标签数据集,请指出x是数据点、y的中文含义为数据点的类别标签,XU={xl+1,xl+2,…,xn}表示无标签数据集;
S1-2,建立图一致性模型G=(V,E,W),其中V是图一致性模型中顶点的集合,代表着所有数据点的集合;E是连接任意两个数据点之间的边;W是权重矩阵,用任意两个数据点的相似度来填充。
所述的基于图一致性模型的半监督学习的推荐方法,优选的,所述S1还包括:
S1-3,利用最近邻图的方法来构造权重矩阵,利用了kNN的方法和Sigmoid函数;
S1-4,Sigmoid函数为当z∈(0,+∞)时,定义映射函数其中||xi-xj||2是两个数据点xi和xj间的距离度量,映射函数的取值范围
所述的基于图一致性模型的半监督学习的推荐方法,优选的,所述构建近邻图的权重矩阵为:
A,xi是在k-最邻近的xj,或者xj是在k-最邻近的xi,和yi=yj(i,j≤L),
B,xi是在k-最邻近的xj,或者xj是在k-最邻近的xi,和yi≠yj(i,j≤L),
C,xi是在k-最邻近的xj,或者xj是在k-最邻近的xi,和{i>L,j>L},
D,其它,wij=0;
其中,k为图一致性模型中的数据点,代表着图一致性模型局部相似度,分别表示类内相似度和类间相似度,对于无标签数据集C中,权重就是局部相似度;而对于有标签数据,边的权重看作是局部相似度和类内、类间相似度的线性组合,当两个数据点之间的距离相等时,类内的相似度明显大于类间的相似度,其物理解释就是具有相同类别标签的数据比具有不同类别标签的数据有更大的相似度,
从物理意义上,由如两个数据点间距离||xi-xj||2越小,则的值就越大,具有相同类别标签的数据A或者无标签数据C的数据间具有更大的相似度,当时,达到最大值,当数据的类别标签不同时,两点间的距离越小,则相似度越小。
所述的基于图一致性模型的半监督学习的推荐方法,优选的,所述S3包括:
S2-1,n×c的非负矩阵F,用数据集中数据点xi的类别标签估计值进行填充,非负矩阵中Fij的值就是第i个数据样本属于第j个类别的概率,n×c为n行c列的矩阵;
S2-2,再定义n×c的非负矩阵Y∈F,在此矩阵中,如果数据点xi被标注为yi=j,则Yij=1;否则Yij=0;
S2-3,损失函数定义为: φ ( F ) = 1 2 [ Σ i , j = 1 n W ij ( D ii - 1 / 2 F i - D jj - 1 / 2 F j ) 2 + μ Σ i = 1 n ( F i - Y i ) 2 ] , 其中μ>0,表示正则化参数,目标函数F*表示为
在式 φ ( F ) = 1 2 [ Σ i , j = 1 n W ij ( D ii - 1 / 2 F i - D jj - 1 / 2 F j ) 2 + μ Σ i = 1 n ( F i - Y i ) 2 ] 损失函数中,第一项表达式表示拟合约束;第二项是平滑约束,参数μ是一个平衡因子,权衡函数中这两个表达项的权重;
S2-4,通过求解损失函数φ(F)的最小值,来估计目标函数F*的值,对φ(F)求偏导数得:
∂ φ ( F ) ∂ F | F = F * = F * - SF * + μ ( F * - Y ) ,
其中,Y为非负矩阵,S=D-1/2WD-1/2,S为计算得到的一个矩阵,其中D是一个对角矩阵,第(i,i)个元素等于矩阵W中第i行元素的和,令:
F*-SF*+μ(F*-Y)=0,因为0<μ<1,则1+μ≠0,参数μ是一个平衡因子,转化成:
F * - 1 1 + μ SF * - μ 1 + μ Y = 0 ,
再引入两个变量:
α = 1 1 + μ , β = μ 1 + μ , 由于α+β=1,
那么则有:(I-αS)F*=βY,
由于矩阵I-αS是可逆的,则可有:
F*=β(I-αS)-1Y;
S2-5,将目标函数F*的值从高到低进行排序。
所述的基于图一致性模型的半监督学习的推荐方法,优选的,所述S4包括:
S3-1,通过对方程式F(t+1)=αSF(t)+(1-α)Y的不断迭代,直至获得使表达式φ(F)取得最小值时F的值,即目标函数
根据方程式的递推公式得:
F ( t ) = ( αS ) t - 1 Y + ( 1 - α ) Σ i = 0 t - 1 ( αS ) i Y ;
由于0<α<1,特征值S∈[-1,1],因此得到:
lim t → ∞ ( αS ) t - 1 = 0 , lim t → ∞ Σ i = 0 t - 1 ( αS ) i = ( I - αS ) - 1 Y ;
S3-2,由式 F ( t ) = ( αS ) t - 1 Y + ( 1 - α ) Σ i = 0 t - 1 ( αS ) i Y , lim t → ∞ ( αS ) t - 1 = 0 , lim t → ω Σ i = 0 t - 1 ( αS ) i = ( I - αS ) - 1 Y 得到:
F * = lim t → ∞ F ( t ) = ( 1 - α ) ( I - αS ) - 1 Y ;
又由于β=1-α,则有:α、β为引用的两个权重系统的变量,
F * = lim t → ∞ F ( t ) = β ( I - αS ) - 1 Y ,
的结果刚好是F*=β(I-αS)-1Y所求解的结果,能够收敛到使 F * = arg min F φ ( F ) ;
S3-3,将排序后的目标函数F*的值经过证明以后,获取推荐列表,根据计算后图一致性模型数据点的权重值将推荐列表发送给用户终端。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
通过SELF等方法计算权衡因子。基本思想是:依据用户的行为信息构造基于最近邻图的权重矩阵,且利用Sigmoid映射函数来度量两个用户的兴趣度;在算法的损失函数中包括用户行为相似性约束和物品内容相似性约束,且这两部分的约束由一个平衡因子权衡,对用户行为信息和物品内容信息实现个性化推荐。
在图的构建方法上,即考虑了有标签数据和无标签数据的局部几何特征,也考虑了有标签数据的类别信息,从而保证了具有相同类别标签的数据是聚合的,最后使用了映射函数来度量两个数据点之间的相似度。
在模型假设的目标函数中,定义的损失函数包括了两个部分:平滑约束(smoothness constraint)和拟合约束(fitting constraint),并且这两个部分之间通过参数μ来权衡,这种策略保证了分类函数不会与初始的类别标签估计偏离太多,而近邻数据间也是平滑的。另外,在算法中使用了归一化拉普拉斯特征向量,这将确保了损失函数有一个封闭解,最后提供了对算法的收敛性证明。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是本发明基于图的学习方法的标签传播图;
图2是本发明用户物品二分图一致性模型图;
图3是本发明基于图一致性模型的半监督学习的推荐方法图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,需要理解的是,术语“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明的描述中,除非另有规定和限定,需要说明的是,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是机械连接或电连接,也可以是两个元件内部的连通,可以是直接相连,也可以通过中间媒介间接相连,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
如图1所示,描述了基于图的学习方法的标签传播,其中浅灰色和黑色结点分别表示不同类别的有标签数据,空心结点表示无标签数据。本发明基于图一致性的模型(graph-based model)是推荐系统中的重要内容,很多研究者也把基于领域的模型称为基于图的模型。常用的基于图一致性模型的推荐策略是将用户行为数据表示成图的形式。这些用户行为数据由一系列二元组组成,每个二元组(u,i)表示用户u对物品i产生过行为,这样数据集就很容易用一个二分图表示。
令G(V,E)表示用户物品的二分图,其中集合V=VU∪VI由用户顶点集合VU和物品顶点VI集合组成。对于数据集中的每一个二元组(u,i),图中都有一条对应的边e(vu,vi),其中vu∈VU是用户u对应的顶点,vi∈VI是物品i对应的顶点。图2描述了一个简单的用户物品二分图一致性模型,其中圆形节点代表用户,方形节点代表物品,它们之间的边代表用户对物品的行为。
图2用户物品二分图一致性模型
将用户行为表示成二分图一致性模型后,就可以实现在二分图上对用户进行个性化推荐。常用的个性化推荐策略是将给用户u推荐物品的任务转化为度量用户顶点vu和顶点vi在图上的相关性,相关性越高的物品在在推荐列表中的权重就越高。针对利用图一致性模型进行个性化推荐的策略,研究者们设计了很多顶点相关性的方法,这些方法大多是基于顶点的相似度计算,而本章设计了GSSLC算法来实现个性化推荐。与基于二分图一致性模型的推荐方法不同,GSSLC算法不是通过计算用户与物品之间的相关性来产生推荐,而是在模型的目标函数中同时考虑这两部分属性特征,并用一个平衡因子μ进行权衡,进而实现对目标函数的求解。
如图3所示,本发明包括如下步骤:
S1,获取服务器数据集,对数据集构建图一致性模型,建立数据点和边;
S2,通过映射函数来度量两个数据点之间的相似度,对数据点之间存在的边赋予权重值;
S3,建立目标函数并求解,对目标函数的解进行排序;
S4,将排序后的目标函数解进行收敛性证明,获得推荐列表,将推荐列表发送到用户终端。
GSSLC算法的描述
1图的构建
定义1:数据集中的n个数据点X={x1,…,xl,xl+1,…,xn}∈Rn,(R是实数)这里假定XL={x1,x2,…,xl,y1,y2,…,yl)}表示有标签数据集,XU={xl+1,xl+2,…,xn}表示无标签数据集。
定义2:权重图G=(V,E,W),其中V是图中顶点的集合,代表着所有数据点的集合;E是连接任意两个数据点之间的边;W是权重矩阵,它用任意两个数据点的相似度来填充。
利用最近邻图的方法来构造权重矩阵。不同于传统的最近邻图方法,如kNN方法利用每个点与它最邻近的k个点的距离度量;εNN方法利用半径ε范围内的点进行度量。制定的最近邻图权重矩阵利用了kNN的方法,并综合利用了Sigmoid函数。
定义3:Sigmoid函数为当z∈(0,+∞)时,我们定义映射函数其中||xi-xj||2是两个数据点xi和xj间的距离度量。因此,映射函数的取值范围近邻图的权重矩阵构建规则如下:
Case 1:xi is among k-nearest neighbors of xj
      or xj is among k-nearest neighbors of xi
      and yi=yj(i,j≤L)
Case 2:xi is among k-nearest neighbors of xj
      or xj is among k-nearest neighbors of xi
      and yi≠yj(i,j≤L)
Case 3:xi is among k-nearest neighbors of xj
      or xj is among k-nearest neighbors of xi
      and{i>L,j>L}
    Case 4:otherwise
      wij=0.
在以上规则(Case 1-Case 4)中,代表着局部相似度,分别表示类内(within-class)相似度和类间(without-class)相似度。对于无标签数据(Case 3),权重就是局部相似度;而对于有标签数据,边的权重可以被看作是局部相似度和类内(类间)相似度的线性组合。,当两个数据点之间的距离相等时,类内的相似度明显大于类间的相似度,其物理解释就是具有相同类别标签的数据比具有不同类别标签的数据有更大的相似度。
从物理意义上解释上述规则的合理性:1)由如两个数据点间距离(||xi-xj||2)的越小,则的值就越大,那就意味着具有相同类别标签的数据(如Case 1)或者无标签数据(如Case 3)数据间具有更大的相似度。当时,达到最大值,意味着当数据的类别标签不同时,如两点间的距离越小,则相似度越小(如Case 2)。
2算法推导及伪代码描述
基于图的半监督学习方法通常假设图上的类别标签是平滑的,大多数方法都可以看作是在图上对函数f的一个假设估计。通常函数f应该满足以下两个条件:①函数f的估计值应该接近有标签数据结点上的类别标签yL;②函数f在整个图的结构上应该是平滑的。上述条件通常用一个正则化框架进行表达,正则化框架函数则包括两个部分:第一部分是损失函数,第二部分则是衡量函数光滑程度的正则因子。
定义4:一个n×c的非负矩阵F,它用数据集X中每个样本xi的类别标签估计值进行填充。如非负矩阵中Fij的值就是第i个数据样本属于第j个类别的概率。一个n行c列的矩阵;
定义5:一个n×c的非负矩阵Y∈F。在此矩阵中,如果数据点xi被标注为yi=j,则Yij=1;否则Yij=0。
损失函数可以定义如式5所示:
φ ( F ) = 1 2 [ Σ i , j = 1 n W ij ( D ii - 1 / 2 F i - D jj - 1 / 2 F j ) 2 + μ Σ i = 1 n ( F i - Y i ) 2 ] - - - ( 5 )
在式5中μ>0,它表示正则化参数。目标函数F*可表示为求解式6
F * = arg min F φ ( F ) - - - ( 6 )
在式5的损失函数中,第一项表达式表示拟合约束,它保证了一个好的分类函数不会与初始的类别标签分配偏离太多;第二项是平滑约束,它保证了分类函数的预测结果不应该和近邻数据偏离太多。参数μ是一个平衡因子,权衡函数中这两个表达项的权重。
下一步的工作就是通过求解损失函数φ(F)的最小值,来估计目标函数F*的值。对φ(F)求偏导数得:
∂ φ ( F ) ∂ F | F = F * = F * - SF * + μ ( F * - Y ) - - - ( 7 )
在式7中,Y为非负矩阵,S=D-1/2WD-1/2。S就是计算得到的一个矩阵,其中D是一个对角矩阵,它的第(i,i)个元素等于矩阵W中第i行元素的和。令:
F*-SF*+μ(F*-Y)=0   (8)
因为0<μ<1,则1+μ≠0。式8可以转变成
F * - 1 1 + μ SF * - μ 1 + μ Y = 0 - - - ( 9 )
再引入两个变量:
α = 1 1 + μ ,
β = μ 1 + μ
由于α+β=1,那么则有:
(I-αS)F*=βY   (10)
由于矩阵I-αS是可逆的,则可有:
F*=β(I-αS)-1Y   (11)
式11的求解结果就是目标函数的封闭解表达式,下一步的工作就是设计一个算法对目标函数进行求解,使得F*=β(I-αS)-1Y。本章设计了一个基于图和数据一致性的算法(GSSLC算法)来求解目标函数的解表达式,其伪代码描述如表1所示:
在GSSLC算法中,权重矩阵W是规则化对称的,它是算法中迭代到收敛的必要条件。从算法的第3个步骤中看,迭代过程中非负矩阵F不仅依赖于其邻居(第一部分),也保留其初始信息(第二部分)。参数μ是一个平衡因子,它表示了上述两部分因素的权重。
表1  GSSLC算法的伪代码描述
算法收敛性证明
在GSSLC算法中,是通过对方程式F(t+1)=αSF(t)+(1-α)Y的不断迭代,直至获得使表达式φ(F)取得最小值时F的值,即目标函数
根据方程式的递推公式可得:
F ( t ) = ( αS ) t - 1 Y + ( 1 - α ) Σ i = 0 t - 1 ( αS ) i Y - - - ( 12 )
由于0<α<1,特征值S∈[-1,1],因此可得:
lim t → ∞ ( αS ) t - 1 = 0 - - - ( 13 )
lim t → ∞ Σ i = 0 t - 1 ( αS ) i = ( I - αS ) - 1 Y - - - ( 14 )
由式12,13,14可得:
F * = lim t → ∞ F ( t ) = ( 1 - α ) ( I - αS ) - 1 Y - - - ( 15 )
又由于β=1-α,则有:α、β为引用的两个权重系统的变量
F * = lim t → ∞ F ( t ) = β ( I - αS ) - 1 Y - - - ( 16 )
式16的结果刚好就是式11所求解(利用偏导数方法求解)的结果。这就证明了本节设计的算法可以收敛到使算法的收敛性得证。
本发明基于图一致性模型的推荐方法,不是基于计算用户与物品之间的相关性来产生推荐,而是在模型的目标函数中同时考虑这两部分的属性特征,并用一个平衡因子μ进行权衡。通过对目标函数的求解,进而利用分类模型的预测来产生推荐列表。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。

Claims (7)

1.一种基于图一致性模型的半监督学习的推荐方法,其特征在于,包括如下步骤:
S1,获取服务器数据集,对数据集构建图一致性模型,建立数据点和边;
S2,通过映射函数来度量两个数据点之间的相似度,对数据点之间存在的边赋予权重值;
S3,建立目标函数并求解,对目标函数的解进行排序;
S4,将排序后的目标函数解进行收敛性证明,获得推荐列表,将推荐列表发送到用户终端。
2.根据权利要求1所述的基于图一致性模型的半监督学习的推荐方法,其特征在于,所述S1包括:
S1-1,数据集中的n个数据点X={x1,…,xl,xl+1,…,xn}∈Rn,n是正整数,R是实数,假定XL={x1,x2,…,xl,y1,y2,…,yl)}表示有标签数据集,请指出x是数据点、y的中文含义为数据点的类别标签,XU={xl+1,xl+2,…,xn}表示无标签数据集;
S1-2,建立图一致性模型G=(V,E,W),其中V是图一致性模型中顶点的集合,代表着所有数据点的集合;E是连接任意两个数据点之间的边;W是权重矩阵,用任意两个数据点的相似度来填充。
3.根据权利要求2所述的基于图一致性模型的半监督学习的推荐方法,其特征在于,所述S1还包括:
S1-3,利用最近邻图的方法来构造权重矩阵,利用了kNN的方法和Sigmoid函数;
S1-4,Sigmoid函数为 g ( z ) = 1 1 + exp ( - z ) , 当z∈(0,+∞)时, g ( z ) ∈ ( 1 2 , 1 ) , 定义映射函数其中||xi-xj||2是两个数据点xi和xj间的距离度量,映射函数的取值范围
4.根据权利要求3所述的基于图一致性模型的半监督学习的推荐方法,其特征在于,所述构建近邻图的权重矩阵为:
A,xi是在k-最邻近的xj,或者xj是在k-最邻近的xi,和yi=yj(i,j≤L),
B,xi是在k-最邻近的xj,或者xj是在k-最邻近的xi,和yi≠yj(i,j≤L),
C,xi是在k-最邻近的xj,或者xj是在k-最邻近的xi,和{i>L,j>L},
D,其它,wij=0;
其中,k为图一致性模型中的数据点,代表着图一致性模型局部相似度,分别表示类内相似度和类间相似度,对于无标签数据集C中,权重就是局部相似度;而对于有标签数据,边的权重看作是局部相似度和类内、类间相似度的线性组合,当两个数据点之间的距离相等时,类内的相似度明显大于类间的相似度,其物理解释就是具有相同类别标签的数据比具有不同类别标签的数据有更大的相似度,
从物理意义上,由如两个数据点间距离||xi-xj||2越小,则的值就越大,具有相同类别标签的数据A或者无标签数据C的数据间具有更大的相似度,当时,达到最大值,当数据的类别标签不同时,两点间的距离越小,则相似度越小。
5.根据权利要求1所述的基于图一致性模型的半监督学习的推荐方法,其特征在于,所述S3包括:
S2-1,n×c的非负矩阵F,用数据集中数据点xi的类别标签估计值进行填充,非负矩阵中Fij的值就是第i个数据样本属于第j个类别的概率,n×c为n行c列的矩阵;
S2-2,再定义n×c的非负矩阵Y∈F,在此矩阵中,如果数据点xi被标注为yi=j,则Yij=1;否则Yij=0;
S2-3,损失函数定义为: φ ( F ) = 1 2 [ Σ i , j = 1 n W ij ( D ii - 1 / 2 F i - D jj - 1 / 2 F j ) 2 + μ Σ i = 1 n ( F i - Y i ) 2 ] , 其中μ>0,表示正则化参数,目标函数F*表示为
在式 φ ( F ) = 1 2 [ Σ i , j = 1 n W ij ( D ii - 1 / 2 F i - D jj - 1 / 2 F j ) 2 + μ Σ i = 1 n ( F i - Y i ) 2 ] , 损失函数中,第一项表达式表示拟合约束;第二项是平滑约束,参数μ是一个平衡因子,权衡函数中这两个表达项的权重。
6.根据权利要求5所述的基于图一致性模型的半监督学习的推荐方法,其特征在于,所述S3还包括:
S2-4,通过求解损失函数φ(F)的最小值,来估计目标函数F*的值,对φ(F)求偏导数得:
∂ φ ( F ) ∂ F | F = F * = F * - SF * + μ ( F * - Y ) ,
其中,Y为非负矩阵,S=D-1/2WD-1/2,S为计算得到的一个矩阵,其中D是一个对角矩阵,第(i,i)个元素等于矩阵W中第i行元素的和,令:
F*-SF*+μ(F*-Y)=0,因为0<μ<1,则1+μ≠0,参数μ是一个平衡因子,转化成:
F * - 1 1 + μ SF * - μ 1 + μ Y = 0 ,
再引入两个变量:
α = 1 1 + μ , β = μ 1 + μ , 由于α+β=1,
那么则有:(I-αS)F*=βY,
由于矩阵I-αS是可逆的,则可有:
F*=β(I-αS)-1Y;
S2-5,将目标函数F*的值从高到低进行排序。
7.根据权利要求1所述的基于图一致性模型的半监督学习的推荐方法,其特征在于,所述S4包括:
S3-1,通过对方程式F(t+1)=αSF(t)+(1-α)Y的不断迭代,直至获得使表达式φ(F)取得最小值时F的值,即目标函数
根据方程式的递推公式得:
F ( t ) = ( αS ) t - 1 Y + ( 1 - α ) Σ i = 0 t - 1 ( αS ) i Y ;
由于0<α<1,特征值S∈[-1,1],因此得到:
lim t → ∞ ( αS ) t - 1 = 0 , lim t → ∞ Σ i = 0 t - 1 ( αS ) i = ( I - αS ) - 1 Y ;
S3-2,由式 F ( t ) = ( αS ) t - 1 Y + ( 1 - α ) Σ i = 0 t - 1 ( αS ) i Y , lim t → ∞ ( αS ) t - 1 = 0 , lim t → ∞ Σ i = 0 t - 1 ( αS ) i = ( I - αS ) - 1 Y 得到:
F * = lim t → ∞ F ( t ) = ( 1 - α ) ( I - αS ) - 1 Y ;
又由于β=1-α,则有:α、β为引用的两个权重系统的变量,
F * = lim t → ∞ F ( t ) = β ( I - αS ) - 1 Y ,
的结果刚好是F*=β(I-αS)- 1Y所求解的结果,能够收敛到使 F * = arg min F φ ( F ) ;
S3-3,将排序后的目标函数F*的值经过证明以后,获取推荐列表,根据计算后图一致性模型数据点的权重值将推荐列表发送给用户终端。
CN201510095573.1A 2015-03-04 2015-03-04 基于图一致性模型的半监督学习的推荐方法 Pending CN104679866A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510095573.1A CN104679866A (zh) 2015-03-04 2015-03-04 基于图一致性模型的半监督学习的推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510095573.1A CN104679866A (zh) 2015-03-04 2015-03-04 基于图一致性模型的半监督学习的推荐方法

Publications (1)

Publication Number Publication Date
CN104679866A true CN104679866A (zh) 2015-06-03

Family

ID=53314908

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510095573.1A Pending CN104679866A (zh) 2015-03-04 2015-03-04 基于图一致性模型的半监督学习的推荐方法

Country Status (1)

Country Link
CN (1) CN104679866A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106204538A (zh) * 2016-06-28 2016-12-07 陕西师范大学 一种图像分割方法及系统
CN106682095A (zh) * 2016-12-01 2017-05-17 浙江大学 基于图的主题描述词预测及排序方法
CN107273337A (zh) * 2017-05-24 2017-10-20 南京师范大学 一种图构建与矩阵分解联合学习的推荐方法
CN107463572A (zh) * 2016-06-03 2017-12-12 阿里巴巴集团控股有限公司 一种数据处理系统、方法及装置
CN107909498A (zh) * 2017-10-26 2018-04-13 厦门理工学院 基于最大化接受者操作特征曲线下方面积的推荐方法
CN108898447A (zh) * 2018-07-23 2018-11-27 北京大前科技有限责任公司 获取扩展内容的方法及装置
CN109146825A (zh) * 2018-10-12 2019-01-04 深圳美图创新科技有限公司 摄影风格转换方法、装置及可读存储介质
CN109754274A (zh) * 2017-11-06 2019-05-14 北京京东尚科信息技术有限公司 一种确定目标对象的方法和装置
CN110399519A (zh) * 2019-07-29 2019-11-01 吉林大学 一种可扩展的多语义图像相关反馈方法
CN112256966A (zh) * 2020-10-23 2021-01-22 北京交通大学 基于半监督因子分解机的物品推荐方法
CN114978853A (zh) * 2022-05-16 2022-08-30 中国联合网络通信集团有限公司 一种管理信息库适配方法、装置、设备及存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
YIHAO ZHANG ET AL.: "Graph-based Semi-Supervised Learning with Data Consistency", 《APPLIED SOFT COMPUTING》 *
张宜浩: "基于半监督学习的个性化推荐研究", 《中国博士学位论文全文数据库 信息科技辑》 *
徐海玲 等: "互联网推荐系统比较研究", 《软件学报》 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107463572A (zh) * 2016-06-03 2017-12-12 阿里巴巴集团控股有限公司 一种数据处理系统、方法及装置
CN106204538A (zh) * 2016-06-28 2016-12-07 陕西师范大学 一种图像分割方法及系统
CN106682095A (zh) * 2016-12-01 2017-05-17 浙江大学 基于图的主题描述词预测及排序方法
CN106682095B (zh) * 2016-12-01 2019-11-08 浙江大学 基于图的主题描述词预测及排序方法
CN107273337A (zh) * 2017-05-24 2017-10-20 南京师范大学 一种图构建与矩阵分解联合学习的推荐方法
CN107909498A (zh) * 2017-10-26 2018-04-13 厦门理工学院 基于最大化接受者操作特征曲线下方面积的推荐方法
CN107909498B (zh) * 2017-10-26 2020-07-28 厦门理工学院 基于最大化接受者操作特征曲线下方面积的推荐方法
CN109754274A (zh) * 2017-11-06 2019-05-14 北京京东尚科信息技术有限公司 一种确定目标对象的方法和装置
CN108898447B (zh) * 2018-07-23 2021-09-28 北京大前科技有限责任公司 获取扩展内容的方法及装置
CN108898447A (zh) * 2018-07-23 2018-11-27 北京大前科技有限责任公司 获取扩展内容的方法及装置
CN109146825A (zh) * 2018-10-12 2019-01-04 深圳美图创新科技有限公司 摄影风格转换方法、装置及可读存储介质
CN110399519A (zh) * 2019-07-29 2019-11-01 吉林大学 一种可扩展的多语义图像相关反馈方法
CN110399519B (zh) * 2019-07-29 2021-06-18 吉林大学 一种可扩展的多语义图像相关反馈方法
CN112256966A (zh) * 2020-10-23 2021-01-22 北京交通大学 基于半监督因子分解机的物品推荐方法
CN112256966B (zh) * 2020-10-23 2023-09-12 北京交通大学 基于半监督因子分解机的物品推荐方法
CN114978853A (zh) * 2022-05-16 2022-08-30 中国联合网络通信集团有限公司 一种管理信息库适配方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN104679866A (zh) 基于图一致性模型的半监督学习的推荐方法
Deng Deng entropy
Wei Grey relational analysis method for 2-tuple linguistic multiple attribute group decision making with incomplete weight information
Zhu Functions of uncertain variables and uncertain programming
Li et al. Computing minimal hitting sets with genetic algorithm
Wei et al. Some hybrid aggregating operators in linguistic decision making with Dempster–Shafer belief structure
Yang et al. Novel algorithms of attribute reduction with variable precision rough set model
Burnecki FARIMA processes with application to biophysical data
Liu et al. An uncertainty-induced axiomatic foundation of the analytic hierarchy process and its implication
Zhang et al. A novel large group decision-making method via normalized alternative prediction selection
Bartolucci et al. Discrete latent variable models
Wilson et al. Allocation of tasks for reliability growth using multi-attribute utility
Zhang et al. Complex network graph embedding method based on shortest path and moea/d for community detection
Yu et al. A new fuzzy cognitive maps classifier based on capsule network
Rastogi et al. GA based clustering of mixed data type of attributes (numeric, categorical, ordinal, binary and ratio-scaled)
Rocha et al. Modified movement force vector in an electromagnetism-like mechanism for global optimization
Weimer-Jehle Cross-impact balances: applying pair interaction systems and multi-value Kauffman nets to multidisciplinary systems analysis
CN104217296A (zh) 一种上市公司绩效综合评价方法
Ruan et al. An ordered weighted averaging operator-based cumulative belief degree approach for energy policy evaluation
Dan et al. Application of machine learning in forecasting energy usage of building design
Huo et al. Learning cognitive embedding using signed knowledge interaction graph
Ruiz-Cárdenas et al. Evolutionary Markov chain Monte Carlo algorithms for optimal monitoring network designs
Sun et al. Consistency modification of judgment matrix based on genetic algorithm in analytic hierarchy process
Engle-Warnick Inferring strategies from observed actions: a nonparametric, binary tree classification approach
Sarhan et al. A hybrid rough-neuro model for diagnosing erythemato-squamous diseases

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20150603

RJ01 Rejection of invention patent application after publication