CN104809166B - 一种业务需求的确定方法及设备 - Google Patents
一种业务需求的确定方法及设备 Download PDFInfo
- Publication number
- CN104809166B CN104809166B CN201510154140.9A CN201510154140A CN104809166B CN 104809166 B CN104809166 B CN 104809166B CN 201510154140 A CN201510154140 A CN 201510154140A CN 104809166 B CN104809166 B CN 104809166B
- Authority
- CN
- China
- Prior art keywords
- business object
- user
- shared account
- characteristic vector
- business
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例提供了一种业务需求的确定方法及设备,包括:统计各共享账号对各业务对象进行评价的评价度量信息;基于评价度量信息对应的度量值采用梯度下降算法确定描述各业务对象的特征向量;根据共享同一预设共享账号的用户数及描述各业务对象的特征向量,将其用户使用的业务对象聚类,得到每个用户与其使用的业务对象的映射关系;针对共享该预设共享账号的所有用户使用过的业务对象,基于描述该业务对象的特征向量、预设共享账号对应于该业务对象的评价度量值,以及该业务对象与使用该业务对象的用户之间的映射关系,采用梯度下降算法,确定表征使用该业务对象的用户的业务需求的特征向量值。提高了效率。本发明涉及计算机数据挖掘技术领域。
Description
技术领域
本发明涉及计算机数据挖掘技术领域,尤其涉及一种业务需求的确定方法及设备。
背景技术
互联网规模的迅速增长带来了信息超载的问题,过量信息同时呈现使得用户无法很便捷快速的获取对自己有用的部分,信息使用效率反而降低。因而,在今天的互联网应用中,越来越多“聪明”的推荐系统开发出来并被广大用户信赖和使用。
在推荐系统使用的过程中,还存在很多问题,例如共享账号的问题。具体来说,共享账号就是多个用户共同使用的账号,该共享账号体现了多个用户的不同行为模式,而推荐系统面对同一共享账号对应的不同行为模式无法确定出针对每一个用户需要推荐的业务对象,也就是无法针对使用同一个共享账号的所有用户进行合理的推荐。以电视终端为例,假设每个家庭的多个家庭成员共享一个电视终端,每个电视终端具有一个账号,相当于该家庭的多个家庭成员共享一个电视终端的共享账号,这里业务对象可以为电视节目,那么,电视节目推荐系统能够获得该账号对应的多种行为模式对应的不同类型的电视节目,而无法根据该共享账号对应的不同类型的电视节目为该共享账号确定出推荐的电视节目。
因此,推荐系统无法根据不同用户的用户行为针对共享同一共享账号的不同用户,为不同用户确定合理的推荐业务对象,导致用户花费大量时间对自己需要的业务对象进行检索,效率低。
发明内容
本发明实施例提供了一种业务需求的确定方法及设备,用以解决现有技术中针对共享同一共享账号的用户无法确定出合理的推荐业务对象,导致用户对业务对象检索时效率低的问题。
基于上述问题,本发明实施例提供了一种业务需求的确定方法,包括:
统计各共享账号分别对各业务对象进行评价的评价度量信息;
基于统计的评价度量信息对应的度量值,采用梯度下降算法,确定描述各业务对象的特征向量;
根据共享同一预设共享账号的用户数,以及所述描述各业务对象的特征向量,将共享所述预设共享账号的所有用户使用过的业务对象进行聚类,得到共享所述预设共享账号的每个用户与该用户使用过的业务对象之间的映射关系;
针对共享所述预设共享账号的所有用户使用过的业务对象,基于描述该业务对象的特征向量,所述预设共享账号对应于该业务对象的评价度量值,以及该业务对象与使用该业务对象的用户之间的映射关系,采用梯度下降算法,确定表征使用该业务对象的用户的业务需求的特征向量值。
本发明实施例提供了一种业务需求的确定设备,包括:
统计模块,用于统计各共享账号分别对各业务对象进行评价的评价度量信息;
第一确定模块,用于基于统计的评价度量信息对应的度量值,采用梯度下降算法,确定描述各业务对象的特征向量;
聚类模块,用于根据共享同一预设共享账号的用户数,以及所述描述各业务对象的特征向量,将共享所述预设共享账号的所有用户使用过的业务对象进行聚类,得到共享所述预设共享账号的每个用户与该用户使用过的业务对象之间的映射关系;
第二确定模块,用于针对共享所述预设共享账号的所有用户使用过的业务对象,基于描述该业务对象的特征向量、所述预设共享账号对应于该业务对象的评价度量值,以及该业务对象与使用该业务对象的用户之间的映射关系,采用梯度下降算法,确定表征使用该业务对象的用户的业务需求的特征向量值。
本发明实施例的有益效果包括:
本发明实施例提供的一种业务需求的确定方法及设备,包括:统计各共享账号分别对各业务对象进行评价的评价度量信息;基于统计的评价度量信息对应的度量值,采用梯度下降算法,确定描述各业务对象的特征向量;根据共享同一预设共享账号的用户数,以及所述描述各业务对象的特征向量,将共享该预设共享账号的所有用户使用过的业务对象进行聚类,得到共享该预设共享账号的每个用户与该用户使用过的业务对象之间的映射关系;针对共享该预设共享账号的所有用户使用过的业务对象,基于描述该业务对象的特征向量、预设共享账号对应于该业务对象的评价度量值,以及该业务对象与使用该业务对象的用户之间的映射关系,采用梯度下降算法,确定表征使用该业务对象的用户的业务需求的特征向量值。针对任一种业务,确定出各共享账号与各业务对象分别对应的非空的评价度量信息,再确定出共享预设共享账号的每个用户与该用户使用过的业务对象之间的映射关系,最后采用梯度下降算法,基于描述各业务对象的特征向量、预设共享账号分别与各业务对象对应的评价度量值、以及各业务对象与使用该业务对象的用户之间的映射关系,确定出表征共享预设共享账号的用户的业务需求的特征向量,那么,当需要确定某业务对象是否为任一用户需要的业务对象时,根据表征该用户的业务需求的特征向量以及描述该业务对象的特征向量,可以得到该用户对该业务对象的评价度量值,从而,确定出为该用户推荐的业务对象,与现有技术相比,本发明实施例提供的一种业务需求的确定方法,能够为共享同一共享账号的每个用户确定出该用户的业务需求,用户不需要花费大量的时间进行检索,提高了效率。
附图说明
图1为本发明实施例提供的一种业务需求的确定方法的流程图;
图2为本发明实施例1提供的一种业务需求的确定方法的流程图;
图3为本发明实施例提供的采用聚类算法对训练集合进行聚类的示意图;
图4为本发明实施例提供的一种业务需求的确定设备的结构示意图。
具体实施方式
本发明实施例提供了一种业务需求的确定方法及设备,以下结合说明书附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。并且在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
本发明实施例提供一种业务需求的确定方法,如图1所示,包括:
S101、统计各共享账号分别对各业务对象进行评价的评价度量信息。
S102、基于统计的非空的评价度量信息对应的度量值,采用梯度下降算法,确定描述各业务对象的特征向量。
S103、根据共享同一预设共享账号的用户数,以及描述各业务对象的特征向量,将共享该预设共享账号的所有用户使用过的业务对象进行聚类,得到共享该预设共享账号的每个用户与该用户使用过的业务对象之间的映射关系。
S104、针对共享该预设共享账号的所有用户使用过的业务对象,基于描述该业务对象的特征向量、预设共享账号对应于该业务对象的评价度量值,以及该业务对象与使用该业务对象的用户之间的映射关系,采用梯度下降算法,确定表征使用该业务对象的用户的业务需求的特征向量值。
进一步地,本发明实施例提供的一种业务需求的确定方法,可以应用于以下场景中:多个用户共享同一个共享账号,根据各共享账号与各业务对象对应的评价度量信息,确定出共享该共享账号的不同用户的业务需求。例如:当业务为音视频业务时,业务对象可以为音视频文件,用户使用业务对象可以为用户播放该音视频;当业务为文档业务时,业务对象可以为文档,用户使用业务对象可以为用户点击阅读该文档;当业务为游戏业务时,业务对象可以为游戏文件,用户使用业务对象可以为用户下载游戏文件或点击使用游戏文件;当业务为产品业务时,业务对象可以为产品,用户使用业务对象可以为用户购买产品。
下面结合附图,用具体实施例对本发明提供的方法及相关设备进行详细描述。
实施例1:
本发明实施例1中,提供一种业务需求的确定方法,如图2所示,具体包括如下步骤:
S201、统计各共享账号分别对各业务对象进行评价的评价度量信息。
进一步地,提供业务方可以根据后台数据统计各共享账号分别对各业务对象的评价度量信息。以电视业务为例,可以通过电视业务提供方法统计各共享账号分别对各电视节目(也就是业务对象)进行评价的评价度量信息,如表1所示:
表1
m1 | m2 | … | mj | … | mL | |
H1 | * | * | … | * | … | * |
H2 | * | * | … | * | … | * |
… | … | … | … | … | … | … |
Hi | * | * | … | * | … | |
… | … | … | … | … | … | … |
HN | * | * | … | * | … | * |
如表1所示,mj表征电视节目(业务对象)mj,Hi表征共享账号Hi,存在L个电视节目和N个共享账号。表1中第i行第j列对应的值为共享账号Hi对电视节目(业务对象)mj的评价度量值,此处用*号表示。*号表示的度量值可以为空也可以非空,也就是说,使用共享账号播放电视节目的用户可以对电视节目评价,也可以不评价,如果不评价,则表1中对应位置的值为空白。
进一步地,评价度量信息可以为任何对评价进行度量的信息,例如:如果通过等级进行评价,那么评价度量信息可以通过评价等级来确定,如果通过分数进行评价,那么评价度量信息可以通过评价分数来确定。
S202、分别以各共享账号和各业务对象作为不同维度,建立表征各共享账号对各业务对象的评价度量信息的效用矩阵。
进一步地,效用矩阵中的各元素的值由统计的用户通过共享账号对业务对象进行评价的评价度量值决定,当某共享账号未对某业务对象进行评价时,该共享账号与该业务对象对应的评价度量值可以为0,或者设置为任意表征共享账号未对业务对象进行评价的预设值。
接续上例,可以基于表1的统计信息建立效用矩阵M:
此时,效用矩阵的行表征各电视节目(业务对象),列表征各共享账号,或者
此时,效用矩阵的行表征各共享账号,列表征各电视节目(业务对象)。
S203、将S202中建立的效用矩阵进行UV分解,得到各业务对象对应的分别描述各业务对象的特征向量,
其中,特征向量的值待定。
进一步地,可以按照式(1)对效用矩阵M进行UV分解:
式(1)
式(1)中,矩阵M中的元素值由统计的用户通过共享账号对业务对象进行评价的评价度量值决定,包括非空元素和空白元素,矩阵U和矩阵V中的各元素待定。
进一步地,矩阵U和矩阵V中d的值可以有经验值确定。矩阵U中的第i行元素构成的向量可以为表征用户i的业务需求的特征向量,矩阵V中的第j列元素构成的向量可以为描述业务对象j的特征向量,i∈[1,N],j∈[1,L]。
S204、基于S202中建立的效用矩阵中非空的评价度量信息对应的度量值、以及描述各业务对象的特征向量构成的业务对象矩阵,构造第一损失函数。
进一步地,本步骤中,构造的第一损失函数符合如下原则:U×V得到的任一元素的值与矩阵M中对应元素的值越接近,第一损失函数的函数值越小。可以按照式(2)构造第一损失函数Floss(W):
式(2)
式(2)中,W表示UV中所有未知元素的集合,W可以表示如下:W={u11,u12,...,uNd,v11,v12,...,vdL},即W共有参数个数为(N+L)d;Mij表征矩阵M中第i行第j列的元素;(UV)ij表征矩阵U的第i行元素与矩阵V的第j列元素相乘的值;l表征效用矩阵中非空元素个数。
式(2)所示的第一损失函数可以表征(UV)ij的值与矩阵M中对应元素Mij的值越接近,第一损失函数的函数值越小。
S205、采用梯度下降算法,对所述第一损失函数进行迭代,为空白评价度量信息确定对应的评价度量值,以及确定描述各业务对象的特征向量的值。
进一步地,本步骤中,可以采用梯度下降算法确定UV中的各元素。具体地,首先设置矩阵U和矩阵V中各元素的初始值,计算矩阵M中各非空元素与UV中对应元素的均方根误差(即损失函数),确定该损失函数的梯度,使用该梯度和初始值更新UV中各元素的取值。沿损失函数梯度的反向通过多次迭代更新UV中各元素的取值,最终收敛到效用矩阵中各个非空元素与等效矩阵UV中对应元素的均方根误差最小,即损失函数取值最小。
进一步地,可以采用式(3)进行迭代:
式(3)
式(3)中,Wt+1表征UV中各元素经本次迭代更新后的取值;Wt表征UV中各元素经上一次迭代更新后的取值或初始值;α表征迭代步长,其具体取值根据实际需要确定;表征本次迭代过程中计算的损失函数的梯度。经过预设次数的迭代,可以确定效用矩阵M中的空白元素的评价度量值,以及矩阵U和矩阵V中各元素的值。
进一步地,上述步骤中,通过对效用矩阵M进行UV分解确定出矩阵M中空白元素的过程中,获得了矩阵M中一部分未知的评价度量值,在进行UV分解的过程中获得的矩阵V的所有列向量描述了所有业务对象的特征向量。
S206、基于共享同一预设共享账号的用户使用过的业务对象建立训练集合。
进一步地,预设共享账号可以为需要确定共享该预设共享账号的用户的用户行为的共享账号,可以根据实际需要从所有共享账号中确定预设共享账号。
在以上步骤中,已经得到了描述各业务对象的特征向量以及各业务对象分别对应的评价度量值。后续步骤中,可以针对某一关心的共享账号,确定共享该共享账号的用户分别对应的表征该用户的需求信息的特征向量,从而根据该特征向量确定用户感兴趣的业务对象,并在推荐系统中针对共享该共享账号的用户的不同需求,为各用户推荐业务对象。
本步骤中,针对任一预设共享账号,将共享该预设共享账号H的用户使用过的业务对象构成的集合确定为训练集合其中,x(j)表征第j个业务对象,mH表征训练集合的大小,即业务对象的个数。
针对某预设共享账号对应的训练集合中的业务对象x(j),可以由描述业务对象的d维特征向量vj和用户对业务对象的评价度量值rj构成d+1维向量j∈MH,表征d+1维实数向量集合。
S207、根据共享该预设共享账号的用户的数量,以及描述各业务对象的特征向量,采用聚类算法将S206中建立的训练集合中的业务对象进行聚类,得到共享该预设共享账号的每个用户与该用户使用过的业务对象之间的映射关系。
进一步地,针对训练集合可以采用聚类算法进行聚类,例如:采用K-means聚类算法进行聚类,由于K-means算法为现有的聚类算法,本发明不再赘述。
假设共享某共享账号H的用户数量为n,且假设n=3,那么,采用K-means算法将训练集合X聚类成三簇,也就是说,共享该预设共享账号H的用户(user1,user2,user3)使用过的业务对象MH对应着分成三簇,即A1,A2和A3,那么,可以得到共享该预设共享账号的用户和该用户使用的业务对象之间的映射关系R:
R:MH(A1,A2,A3)→H(user1,user2,user3)
也就是说,user1使用过的业务对象为簇A1中包括的业务对象,user2使用过的业务对象为簇A2中包括的业务对象,user3使用过的业务对象为簇A3中包括的业务对象。
图3为本发明实施例提供的采用聚类算法对训练集合进行聚类的示意图,如图3所示,经过对训练集合进行聚类,得到user1与簇A1之间的映射关系,user2与簇A2之间的映射关系,user3与簇A3之间的映射关系,即训练集合中的业务对象集合MH与共享账号H之间的映射关系R。
S208、基于描述该业务对象的特征向量、该预设共享账号对应于该业务对象的评价度量值,以及该业务对象与使用该业务对象的用户之间的映射关系,构造第二损失函数。
进一步地,本步骤可以具体实施为:
步骤一、采用式(4)建立线性模型:
rj=<uR(j),vj>+εj j∈MH 式(4)
其中,<uR(j),vj>为描述的使用业务对象j的用户对业务对象j的评价度量;εj表征模型噪声,εj~N(0,σ2);vj表征描述业务对象j的特征向量;uR(j)表征使用业务对象j的用户的业务需求的特征向量;R(j)表征使用的业务对象j的用户的用户标识;rj表征该预设共享账号对应于业务对象j的评价度量值;<uR(j),vj>表征向量uR(j)和向量vj的内积。
进一步地,vj、uR(j)为d维特征向量;使用业务对象j的用户使用了簇R(j)中包括的业务对象。
进一步地,本步骤中,构造的第二损失函数符合如下原则:通过描述某业务对象的特征向量和表征与该特征向量具有映射关系的用户的业务需求的特征向量得到的对该业务对象的评价度量值,与效用矩阵中表征该用户对应的共享账号对应于该业务对象的评价度量值越接近,第二损失函数的函数值越小。那么,通过使<uR(j),vj>与rj尽量接近来求出向量uR(j)的值。
步骤二、基于步骤一中建立的线性模型构造似然函数。
进一步地,可以按照式(5)建立似然函数:
式(5)
式(5)中,令R(j)∈[1,2,3],则θ=[u1,u2,u3],j∈[1,...,mH]。
步骤三、将对步骤三中的似然函数进行变形后得到与所述似然函数等价的函数确定为第二损失函数。
本步骤中,为了便于后续的计算,对式(5)中等式两边取对数得到式(6):
式(6)
又因为最大化式(6)与最小化等价,
则,令
式(7)
将式(7)确定为第二损失函数。
S209、采用梯度下降算法,对S207中构造的第二损失函数进行迭代,确定表征共享该预设共享账号的用户的业务需求的特征向量。
本步骤中,可以采用式(8)进行迭代:
式(8)
式(8)中,等式左边的θ表征经本次迭代更新后的取值;等式右边的θ表征经上一次迭代更新后的取值或初始值;β表征迭代步长,其具体取值根据实际需要确定;表征本次迭代过程中计算的损失函数的梯度。经过预设次数的迭代,可以确定θ=[u1,u2,u3]中各特征向量uR(j)的值。
进一步地,本步骤中,确定出共享同一共享账号H的各用户的分别表征其业务需求的特征向量uR(j)之后,若已知描述某业务对象j的特征向量vj,则可以根据该uR(j)和vj确定出该表征的用户对业务对象j的评价度量值,从而根据得到的评价度量值确定业务对象j是否为用户需要的业务对象,那么,推荐系统可以根据本发明实施例提供的业务需求确定方法,确定出共享同一个共享账号的不同用户的业务需求,从而分别针对不同用户进行业务对象推荐,用户不需要花费大量时间进行检索,提高了效率。
基于同一发明构思,本发明实施例还提供了一种业务需求的确定设备由于这些设备所解决问题的原理与前述业务需求的确定方法相似,因此该设备的实施可以参见前述方法的实施,重复之处不再赘述。
本发明实施例提供的一种业务需求的确定设备,如图4所示,包括如下模块:
统计模块401,用于统计各共享账号分别对各业务对象进行评价的评价度量信息;
第一确定模块402,用于基于统计的评价度量信息对应的度量值,采用梯度下降算法,确定描述各业务对象的特征向量;
聚类模块403,用于根据共享同一预设共享账号的用户数,以及所述描述各业务对象的特征向量,将共享所述预设共享账号的所有用户使用过的业务对象进行聚类,得到共享所述预设共享账号的每个用户与该用户使用过的业务对象之间的映射关系;
第二确定模块404,用于针对共享所述预设共享账号的所有用户使用过的业务对象,基于描述该业务对象的特征向量、所述预设共享账号对应于该业务对象的评价度量值,以及该业务对象与使用该业务对象的用户之间的映射关系,采用梯度下降算法,确定表征使用该业务对象的用户的业务需求的特征向量值。
进一步地,所述第一确定模块402,具体用于分别以各共享账号和各业务对象作为不同维度,建立表征各共享账号对各业务对象的评价度量信息的效用矩阵;将所述效用矩阵进行UV分解,得到各业务对象对应的分别描述各业务对象的特征向量,其中,所述特征向量的值待定;并基于所述效用矩阵中非空的评价度量信息对应的度量值、以及描述各业务对象的特征向量构成的业务对象矩阵,构造第一损失函数;采用梯度下降算法,对所述第一损失函数进行迭代,为所述空白评价度量信息确定对应的评价度量值,以及确定描述各业务对象的特征向量的值。
进一步地,所述聚类模块403,具体用于基于共享同一预设共享账号的用户使用过的业务对象建立训练集合;根据共享所述预设共享账号的用户的数量,以及所述描述各业务对象的特征向量,采用聚类算法将所述训练集合中的业务对象进行聚类,得到共享该预设共享账号的每个用户与该用户使用过的业务对象之间的映射关系。
进一步地,所述第二确定模块404,具体用于基于描述该业务对象的特征向量、所述预设共享账号对应于该业务对象的评价度量值,以及该业务对象与使用该业务对象的用户之间的映射关系,构造第二损失函数;采用梯度下降算法,对所述第二损失函数进行迭代,确定表征共享该预设共享账号的用户的业务需求的特征向量。
进一步地,所述第二确定模块404,具体用于采用下式建立线性模型:rj=<uR(j),vj>+εj j∈MH其中,<uR(j),vj>为描述的使用业务对象j的用户对业务对象j的评价度量;εj表征模型噪声,εj~N(0,σ2);vj表征描述业务对象j的特征向量;uR(j)表征使用业务对象j的用户的业务需求的特征向量;R(j)表征使用的业务对象j的用户的用户标识;rj表征该预设共享账号对应于业务对象j的评价度量值;基于建立的所述线性模型构造似然函数;将对所述似然函数进行变形后得到与所述似然函数等价的函数确定为第二损失函数。
上述各单元的功能可对应于图1至图2所示流程中的相应处理步骤,在此不再赘述。
本发明实施例提供的一种业务需求的确定方法及设备,包括:统计各共享账号分别对各业务对象进行评价的评价度量信息;基于统计的评价度量信息对应的度量值,采用梯度下降算法,确定描述各业务对象的特征向量;根据共享同一预设共享账号的用户数,以及所述描述各业务对象的特征向量,将共享该预设共享账号的所有用户使用过的业务对象进行聚类,得到共享该预设共享账号的每个用户与该用户使用过的业务对象之间的映射关系;针对共享该预设共享账号的所有用户使用过的业务对象,基于描述该业务对象的特征向量、预设共享账号对应于该业务对象的评价度量值,以及该业务对象与使用该业务对象的用户之间的映射关系,采用梯度下降算法,确定表征使用该业务对象的用户的业务需求的特征向量值。针对任一种业务,确定出各共享账号与各业务对象分别对应的非空的评价度量信息,再确定出共享预设共享账号的每个用户与该用户使用过的业务对象之间的映射关系,最后采用梯度下降算法,基于描述各业务对象的特征向量、预设共享账号分别与各业务对象对应的评价度量值、以及各业务对象与使用该业务对象的用户之间的映射关系,确定出表征共享预设共享账号的用户的业务需求的特征向量,那么,当需要确定某业务对象是否为任一用户需要的业务对象时,根据表征该用户的业务需求的特征向量以及描述该业务对象的特征向量,可以得到该用户对该业务对象的评价度量值,从而,确定出为该用户推荐的业务对象,与现有技术相比,本发明实施例提供的一种业务需求的确定方法,能够为共享同一共享账号的每个用户确定出该用户的业务需求,用户不需要花费大量的时间进行检索,提高了效率。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明实施例可以通过硬件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,本发明实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
本领域技术人员可以理解附图只是一个优选实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
本领域技术人员可以理解实施例中的装置中的模块可以按照实施例描述进行分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种业务需求的确定方法,其特征在于,包括:
统计各共享账号分别对各业务对象进行评价的评价度量信息;
基于统计的评价度量信息对应的度量值,采用梯度下降算法,确定描述各业务对象的特征向量;
根据共享同一预设共享账号的用户数,以及所述描述各业务对象的特征向量,将共享所述预设共享账号的所有用户使用过的业务对象进行聚类,得到共享所述预设共享账号的每个用户与该用户使用过的业务对象之间的映射关系;
针对共享所述预设共享账号的所有用户使用过的业务对象,基于描述该业务对象的特征向量、所述预设共享账号对应于该业务对象的评价度量值,以及该业务对象与使用该业务对象的用户之间的映射关系,采用梯度下降算法,确定表征使用该业务对象的用户的业务需求的特征向量值。
2.如权利要求1所述的方法,其特征在于,基于统计的评价度量信息对应的度量值,采用梯度下降算法,确定描述各业务对象的特征向量,具体包括:
分别以各共享账号和各业务对象作为不同维度,建立表征各共享账号对各业务对象的评价度量信息的效用矩阵;
将所述效用矩阵进行UV分解,得到各业务对象对应的分别描述各业务对象的特征向量,其中,所述特征向量的值待定;并
基于所述效用矩阵中非空的评价度量信息对应的度量值、以及描述各业务对象的特征向量构成的业务对象矩阵,构造第一损失函数;
采用梯度下降算法,对所述第一损失函数进行迭代,为空白评价度量信息确定对应的评价度量值,以及确定描述各业务对象的特征向量的值。
3.如权利要求1所述的方法,其特征在于,根据共享同一预设共享账号的用户数,以及所述描述各业务对象的特征向量,将共享所述预设共享账号的所有用户使用过的业务对象进行聚类,得到共享所述预设共享账号的每个用户与该用户使用过的业务对象之间的映射关系,具体包括:
基于共享同一预设共享账号的用户使用过的业务对象建立训练集合;
根据共享所述预设共享账号的用户的数量,以及所述描述各业务对象的特征向量,采用聚类算法将所述训练集合中的业务对象进行聚类,得到共享该预设共享账号的每个用户与该用户使用过的业务对象之间的映射关系。
4.如权利要求1所述的方法,其特征在于,针对共享所述预设共享账号的所有用户使用过的业务对象,基于描述该业务对象的特征向量、所述预设共享账号对应于该业务对象的评价度量值,以及该业务对象与使用该业务对象的用户之间的映射关系,采用梯度下降算法,确定表征使用该业务对象的用户的业务需求的特征向量值,具体包括:
基于描述该业务对象的特征向量、所述预设共享账号对应于该业务对象的评价度量值,以及该业务对象与使用该业务对象的用户之间的映射关系,构造第二损失函数;
采用梯度下降算法,对所述第二损失函数进行迭代,确定表征共享该预设共享账号的用户的业务需求的特征向量。
5.如权利要求4所述的方法,其特征在于,基于描述该业务对象的特征向量、所述预设共享账号对应于该业务对象的评价度量值,以及该业务对象与使用该业务对象的用户之间的映射关系,构造第二损失函数,具体包括:
采用下式建立线性模型:
rj=<uR(j),vj>+εj,j∈MH;
其中,<uR(j),vj>为描述的使用业务对象j的用户对业务对象j的评价度量;εj表征模型噪声,εj~N(0,σ2);vj表征描述业务对象j的特征向量;uR(j)表征使用业务对象j的用户的业务需求的特征向量;R(j)表征使用的业务对象j的用户的用户标识;rj表征该预设共享账号对应于业务对象j的评价度量值;MH表征业务对象集合;
基于建立的所述线性模型构造似然函数;
将对所述似然函数进行变形后得到与所述似然函数等价的函数确定为第二损失函数。
6.一种业务需求的确定设备,其特征在于,包括:
统计模块,用于统计各共享账号分别对各业务对象进行评价的评价度量信息;
第一确定模块,用于基于统计的评价度量信息对应的度量值,采用梯度下降算法,确定描述各业务对象的特征向量;
聚类模块,用于根据共享同一预设共享账号的用户数,以及所述描述各业务对象的特征向量,将共享所述预设共享账号的所有用户使用过的业务对象进行聚类,得到共享所述预设共享账号的每个用户与该用户使用过的业务对象之间的映射关系;
第二确定模块,用于针对共享所述预设共享账号的所有用户使用过的业务对象,基于描述该业务对象的特征向量、所述预设共享账号对应于该业务对象的评价度量值,以及该业务对象与使用该业务对象的用户之间的映射关系,采用梯度下降算法,确定表征使用该业务对象的用户的业务需求的特征向量值。
7.如权利要求6所述的设备,其特征在于,所述第一确定模块,具体用于分别以各共享账号和各业务对象作为不同维度,建立表征各共享账号对各业务对象的评价度量信息的效用矩阵;将所述效用矩阵进行UV分解,得到各业务对象对应的分别描述各业务对象的特征向量,其中,所述特征向量的值待定;并基于所述效用矩阵中非空的评价度量信息对应的度量值、以及描述各业务对象的特征向量构成的业务对象矩阵,构造第一损失函数;采用梯度下降算法,对所述第一损失函数进行迭代,为空白评价度量信息确定对应的评价度量值,以及确定描述各业务对象的特征向量的值。
8.如权利要求6所述的设备,其特征在于,所述聚类模块,具体用于基于共享同一预设共享账号的用户使用过的业务对象建立训练集合;根据共享所述预设共享账号的用户的数量,以及所述描述各业务对象的特征向量,采用聚类算法将所述训练集合中的业务对象进行聚类,得到共享该预设共享账号的每个用户与该用户使用过的业务对象之间的映射关系。
9.如权利要求6所述的设备,其特征在于,所述第二确定模块,具体用于基于描述该业务对象的特征向量、所述预设共享账号对应于该业务对象的评价度量值,以及该业务对象与使用该业务对象的用户之间的映射关系,构造第二损失函数;采用梯度下降算法,对所述第二损失函数进行迭代,确定表征共享该预设共享账号的用户的业务需求的特征向量。
10.如权利要求9所述的设备,其特征在于,所述第二确定模块,具体用于采用下式建立线性模型:rj=<uR(j),vj>+εj,j∈MH;其中,<uR(j),vj>为描述的使用业务对象j的用户对业务对象j的评价度量;εj表征模型噪声,εj~N(0,σ2);vj表征描述业务对象j的特征向量;uR(j)表征使用业务对象j的用户的业务需求的特征向量;R(j)表征使用的业务对象j的用户的用户标识;rj表征该预设共享账号对应于业务对象j的评价度量值;MH表征业务对象集合;基于建立的所述线性模型构造似然函数;将对所述似然函数进行变形后得到与所述似然函数等价的函数确定为第二损失函数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510154140.9A CN104809166B (zh) | 2015-04-02 | 2015-04-02 | 一种业务需求的确定方法及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510154140.9A CN104809166B (zh) | 2015-04-02 | 2015-04-02 | 一种业务需求的确定方法及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104809166A CN104809166A (zh) | 2015-07-29 |
CN104809166B true CN104809166B (zh) | 2018-03-23 |
Family
ID=53693988
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510154140.9A Active CN104809166B (zh) | 2015-04-02 | 2015-04-02 | 一种业务需求的确定方法及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104809166B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111327704A (zh) * | 2020-02-28 | 2020-06-23 | 中国科学院计算机网络信息中心 | 一种基于IPv6用户的业务对象需求映射方法 |
CN111787371B (zh) * | 2020-09-04 | 2021-01-08 | 北京悠易网际科技发展有限公司 | 一种构建家庭画像的方法和装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102089782A (zh) * | 2008-07-11 | 2011-06-08 | 摩托罗拉移动公司 | 推荐器系统 |
CN102802050A (zh) * | 2012-08-24 | 2012-11-28 | 青岛海信电器股份有限公司 | 电视节目推荐方法及系统 |
CN103139616A (zh) * | 2013-02-27 | 2013-06-05 | 中山大学 | 基于多用户的数字电视节目的个性化云推荐方法及系统 |
CN103297853A (zh) * | 2013-06-07 | 2013-09-11 | 华东师范大学 | 一种基于多用户上下文识别的iptv节目推荐方法 |
CN104090932A (zh) * | 2014-06-24 | 2014-10-08 | 海信集团有限公司 | 一种内容推荐方法及装置 |
-
2015
- 2015-04-02 CN CN201510154140.9A patent/CN104809166B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102089782A (zh) * | 2008-07-11 | 2011-06-08 | 摩托罗拉移动公司 | 推荐器系统 |
CN102802050A (zh) * | 2012-08-24 | 2012-11-28 | 青岛海信电器股份有限公司 | 电视节目推荐方法及系统 |
CN103139616A (zh) * | 2013-02-27 | 2013-06-05 | 中山大学 | 基于多用户的数字电视节目的个性化云推荐方法及系统 |
CN103297853A (zh) * | 2013-06-07 | 2013-09-11 | 华东师范大学 | 一种基于多用户上下文识别的iptv节目推荐方法 |
CN104090932A (zh) * | 2014-06-24 | 2014-10-08 | 海信集团有限公司 | 一种内容推荐方法及装置 |
Non-Patent Citations (2)
Title |
---|
一种面向多用户的电视节目推荐生成方法;於志文;《计算机工程与应用》;20031231;全文 * |
基于显性用户特征的数字电视节目推荐系统;徐江山等;《清华大学学报》;20070131;第47卷(第1期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN104809166A (zh) | 2015-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106168980B (zh) | 多媒体资源推荐排序方法及装置 | |
CN108737856B (zh) | 社会关系感知的iptv用户行为建模与节目推荐方法 | |
CN106326391B (zh) | 多媒体资源推荐方法及装置 | |
CN110223186B (zh) | 用户相似度确定方法以及信息推荐方法 | |
CN107894998B (zh) | 视频推荐方法及装置 | |
CN107256241B (zh) | 基于网格与差异替换改进多目标遗传算法的电影推荐方法 | |
CN107016569A (zh) | 一种网络产品的目标用户账号获取方法及装置 | |
CN104765751A (zh) | 应用推荐方法及装置 | |
CN111626767B (zh) | 资源数据的发放方法、装置及设备 | |
CN106294794A (zh) | 一种内容推荐方法及装置 | |
CN111159563A (zh) | 用户兴趣点信息的确定方法、装置、设备及存储介质 | |
CN109977264B (zh) | 一种基于元路径相似度的用户推荐方法、系统、服务器及存储介质 | |
Altman et al. | Measuring audience retention in YouTube | |
CN106846029B (zh) | 基于遗传算法和新型相似度计算策略的协同过滤推荐算法 | |
CN110855487B (zh) | 网络用户相似度管理方法、装置及存储介质 | |
CN104809166B (zh) | 一种业务需求的确定方法及设备 | |
CN107133268B (zh) | 一种用于Web服务推荐的协同过滤方法 | |
CN106980666B (zh) | 一种推荐视频的方法和装置 | |
Ji et al. | Large-scale comb-k recommendation | |
Mur et al. | Symptoms of instability in models of spatial dependence | |
CN107291860B (zh) | 种子用户确定方法 | |
CN107665202A (zh) | 一种构建兴趣模型的方法、装置及电子设备 | |
CN108205551B (zh) | 一种歌曲推荐方法和歌曲推荐系统 | |
CN116151872B (zh) | 产品特性分析方法和装置 | |
CN108763515B (zh) | 一种基于概率矩阵分解的时间敏感个性化推荐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
EXSB | Decision made by sipo to initiate substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |