CN111931043A - 一种科技资源的推荐方法及系统 - Google Patents
一种科技资源的推荐方法及系统 Download PDFInfo
- Publication number
- CN111931043A CN111931043A CN202010717203.8A CN202010717203A CN111931043A CN 111931043 A CN111931043 A CN 111931043A CN 202010717203 A CN202010717203 A CN 202010717203A CN 111931043 A CN111931043 A CN 111931043A
- Authority
- CN
- China
- Prior art keywords
- scientific
- technological
- resources
- resource
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 239000011159 matrix material Substances 0.000 claims abstract description 143
- 238000010168 coupling process Methods 0.000 claims abstract description 45
- 238000005859 coupling reaction Methods 0.000 claims abstract description 45
- 230000008878 coupling Effects 0.000 claims abstract description 41
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 15
- 238000011478 gradient descent method Methods 0.000 claims abstract description 10
- 238000005457 optimization Methods 0.000 claims abstract description 7
- 238000012545 processing Methods 0.000 claims abstract description 4
- 239000013598 vector Substances 0.000 claims description 49
- 230000006870 function Effects 0.000 claims description 42
- 238000004364 calculation method Methods 0.000 claims description 14
- 238000005516 engineering process Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 8
- 238000012549 training Methods 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 5
- 238000011156 evaluation Methods 0.000 claims description 5
- 238000011524 similarity measure Methods 0.000 claims description 3
- 230000001808 coupling effect Effects 0.000 claims description 2
- 238000012163 sequencing technique Methods 0.000 claims description 2
- 238000000691 measurement method Methods 0.000 abstract description 3
- 238000007726 management method Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 238000006116 polymerization reaction Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及互联网技术领域,涉及一种科技资源的推荐方法及系统;所述方法包括利用用户‑科技资源评分矩阵计算出各个科技资源之间的耦合对象相似度;构建包含科技资源属性信息的正则化项;利用矩阵分解算法对该正则项进行处理,并构建出评分模型的损失函数;根据随机梯度下降方法优化损失函数分别求解出最优的目标用户隐特征矩阵和科技资源隐特征矩阵;利用评分模型计算出目标用户对不同科技资源的评分值;将评分值最高的前N个科技资源作为目标用户的推荐集合并输出。本发明使用耦合相似度度量方法,准确刻画科技资源之间存在的非线性关系,能够更为全面地捕获科技资源间的关联关系,采用整体结构和局部信息全面地提高评分模型的准确性。
Description
技术领域
本发明涉及互联网技术领域,尤其涉及一种科技资源的推荐方法及系统。
背景技术
在大数据驱动的智能科技服务平台中存在着大量有效但杂乱的科技资源信息,这种信息的管理方式往往会间接导致维护成本过高、管理资源不便等问题。而推荐算法可以从这些有效、杂乱的数据信息中分析出特定目标用户的需求,并为目标用户提供更为人性化、智能化的推荐服务,以达到合理部署、分配科技资源的目的。
推荐系统中最成功的技术之一采用协同过滤(Collaborative Filtering,简称CF)方法,它根据志趣相投的目标用户过去的评级记录向活跃目标用户推荐科技资源。协同过滤利用相似度度量方法,根据目标用户的评价分数计算目标用户或科技资源之间的相似度,对矩阵的空单元格进行预测。在大多数推荐系统中,通过增加条目的数量,每个目标用户都无法给出他们对所有可用条目的偏好,也无法对数以百万计的条目进行评级。因此,目标用户-科技资源评分矩阵的大多数单元格是空的。
在这种情况下,确定类似的目标用户或科技资源(邻域的形成)就成了一项挑战。当目标用户对科技资源的评价非常稀疏,由于没有足够的目标用户评级信息,而目标用户-科技资源评分矩阵中目标用户和科技资源数量又很庞大,所以无法一一计算出两个目标用户或科技资源之间的相似度,导致使用CF方法的推荐效果不佳,其推荐准确率非常低。
发明内容
为了解决上述协同过滤推荐算法中存在数据稀疏、冷启动等问题,本申请方案提出了一种科技资源的推荐方法及系统,利用奇异值分解的增量方法,每次重复计算原矩阵不变的奇异值分解,解决稀疏性问题和动态的目标用户兴趣。在矩阵分解框中集成科技资源属性信息,通过科技资源关系正则化项的约束,实现对两个具有相似属性信息的科技资源进行矩阵分解,其过程得到的科技资源的特征向量关联性强。根据目标用户的历史访问数据、注册信息规划等平台信息,然后为目标用户推荐合适的平台资源,为平台管理者提供能优质化的平台管理手段。
在本发明的第一方面,本发明提供了一种科技资源的推荐方法,所述方法包括:
采集智能科技服务平台中的科技资源信息以及目标用户信息,并构建出目标用户-科技资源评分矩阵;
基于科技资源的属性信息,利用所述用户-科技资源评分矩阵计算出各个科技资源之间的耦合对象相似度;
基于科技资源之间的耦合对象相似度,构建包含科技资源属性信息的正则化项;
利用矩阵分解算法对该正则项进行处理,并构建出评分模型的损失函数;根据随机梯度下降方法优化损失函数分别求得目标用户以及科技资源的隐向量,并对应求解出最优的目标用户隐特征矩阵和科技资源隐特征矩阵;
根据最优的目标用户隐特征矩阵和科技资源隐特征矩阵,利用评分模型计算出目标用户对不同科技资源的评分值;
将计算出的所有科技资源评分值进行排序,并将评分值最高的前N个科技资源作为目标用户的推荐集合,并向目标用户输出推荐资源列表结果。
进一步的,采用余弦相似度度量由类别型数据计算科技资源之间的相似度,根据以下公式计算各个科技资源之间的耦合对象相似度:
进一步的,包含科技资源属性信息的正则化项的构建方式包括:
其中,β是第零正则化控制参数,用于控制科技资源属性信息的影响程度;n表示科技资源的属性个数;Si,i′表示属性信息的科技资源i和科技资源i′之间的相似度;qi表示科技资源i隐藏特征向量因子;表示二范式;tr表示正则化标签;Q表示科技资源矩阵;为拉普拉斯矩阵,S表示由科技资源对之间的耦合对象相似度所构成科技资源相似度矩阵;D为对焦矩阵,对角元素Dii=∑i′=1Si,i′。利用科技资源属性信息构建资源关系正则化项,并假设如果科技资源资源i,i′的属性信息相似,那么它们隐特征向量qi和qi′尽可能相似,si,i′值越大,意味着qi和qi′之间的距离越小。
进一步的,求解出目标用户隐特征矩阵和科技资源隐特征矩阵的过程包括以下步骤:
利用矩阵分解算法对所述目标用户-科技资源评分矩阵进行分解,并在分解后的矩阵中分别加入科技资源属性信息的正则化项,并构建出评分模型的损失函数;
利用梯度下降算法进行迭代,根据损失函数的局部最小找到其最速下降方向,从而取得评分模型的用户隐藏特征向量因子和科技资源隐藏特征向量因子;
将这些隐藏特征向量因子根据梯度方向做相应调整,从而求解出目标用户隐藏特征P和科技资源隐藏特征矩阵Q。
进一步的,所述评分模型是利用目标用户隐特征矩阵和科技资源隐特征矩阵中的内积构建而得,表示为:
其中,rui表示用户u对科技资源i的预测评分;表示目标用户隐特征矩阵P和科技资源隐特征矩阵Q中的内积;qi表示科技资源隐特征矩阵中的科技资源i。可以理解的是,这里的用户u是属于m中的一个用户;这里的科技资源i是属于n中的一个属性。
在本发明的第二方面,本发明还提供了一种科技资源的推荐系统,所述推荐系统包括:
采集模块,用于智能科技服务平台中的科技资源信息以及目标用户信息;
矩阵构建模块,用于根据科技资源和目标用户的对应关系,计算出目标用户-科技资源评分矩阵;
相似度计算模块,用于计算各个科技资源间的耦合对象相似度;
正则项模块,用于构建出包含科技资源属性信息的正则化项;
矩阵分解模块,用于对目标用户-科技资源评分矩阵进行分解,并分解出两个低维度的目标用户矩阵和科技资源矩阵;
评分模型构建模块,用于构建出评分模型,并构建出其中的损失函数;
模型训练模块,对损失函数利用随机梯度下降方法进行优化训练,并计算出最优的目标用户隐特征矩阵和科技资源隐特征矩阵;
评价计算模块,将计算出的最优的目标用户隐特征矩阵和科技资源隐特征矩阵代入评分模型中,求取出目标用户对不同科技资源的评分值;
推荐模块,将评分值最高的前N个科技资源推送给目标用户。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:
1、本发明通过使用耦合相似度度量方法,准确地刻画科技资源之间存在的非线性关系,能够更为全面地捕获科技资源间的关联关系。
2、将高维的稀疏的评分矩阵映射为隐因子空间中低维度的目标用户-科技资源评分矩阵,然后通过对应目标用户特征向量和科技资源特征向量的内积来预测缺失的评分。
3、本发明采用整体结构和局部信息全面地提高预测模型的精确性。
附图说明
图1是本发明的一种科技资源的推荐方法流程示意图;
图2是本发明中目标用户和科技资源相似度融合流程图;
图3是本发明中求解目标用户隐特征矩阵和科技资源隐特征矩阵的流程图;
图4是本发明中的一种科技资源的推荐系统结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本说明书实施例提供的方法适用于服务器,在实际应用中也可以适用于终端设备,例如智能手机、平板电脑等等,本说明书实施例对此不作限定。
为了便于描述,下面以执行主体为服务器对本说明书实施例技术方案进行介绍。
图1为本申请一实施例提供的推荐方法的流程示意图。如图1所示,所述方法包括:
S1、采集智能科技服务平台中的科技资源信息以及目标用户信息,并构建出目标用户-科技资源评分矩阵;
这里的智能科技服务平台是由大数据所驱动的,平台中蕴含了丰富的科技资源信息,用户可以通过主动搜索的方式找寻科技资源信息,也可以由平台向目标用户推送相对应的科技资源信息,本实施例基于如何向目标用户精准推荐合适的科技资源,为平台管理者提供能优质化的平台管理手段。
这里的科技资源主要是指通过智能科技服务平台所提供的科技资源信息,包括但不限于可以利用的从事科技活动的人力、物力、财力以及组织、管理、信息等软、硬件要素的总称,或是强调其中某些要素的集合的总和。
具体地,可以指科技型企业数据、历年来的科技资源数据、科技人才数据、学科资源等科技多源数据。其中属性信息主要是指用户和多源科技资源之间的共现关系,揭示资源之间的隐藏连接关系,所有的属性向量都是从平台的资源的描述信息中抽取,并且属性值是类别类型。对于某一资源的属性,其可能有多个取值。例如,利用循环神经网络解决医学图像分析问题既是计算集科学中的深度学习又是医药类。
智能科技服务平台包含以上两种实体集合:m个用户集合和n个科技资源的集合。将用户的历史活动记录转换为用户-科技资源评分矩阵Em×n,Em×n中的每一项是用户u对科技资源i的评分。
如图2所示,本发明利用用户和用户对科技资源的评分构建用户评分矩阵E,科技资源的集合O,包括了不同的科技信息资源,即[o1,o2,o3,…,on]。
根据每位用户对科技资源所提供的信息,利用用户相似度和科技资源相似度的对多源科技资源进行衡量,建立不同资源间的联系,将这两种关系耦合在一起,作为附加信息,构建资源和属性的矩阵。
S2、基于科技资源的属性信息,利用所述用户-科技资源评分矩阵计算出各个科技资源之间的耦合对象相似度;
其中,本实施例采用余弦相似度度量由类别型数据计算科技资源之间的相似度,根据以下公式计算各个科技资源之间的耦合对象相似度:
耦合属性相似度是通过特征内耦合属性相似度和特征间耦合属性相似度的乘积计算而得,定义为:
其中,表示属性Aj的取值x与y之间的特征内耦合属性相似度;表示属性Aj的取值x与y之间的特征间耦合属性相似度;Aj表示相应科技资源的属性,属性Aj的取值x、y之间的特征耦合属性值相似度考虑了属性Aj内取值x、y之间的特征依赖聚合度。
特征内耦合属性相似度的计算公式表示为:
其中,gj(x)表示科技资源对象集合O中属性Aj上取值等于x的数据对象集合;gj(y)表示科技资源对象集合O中属性Aj上取值等于y的数据对象集合;|gj(x)|表示这个数据对象集合gj(x)中集合元素的个数;gj(x)和|gj(x)|与此类似;属性Aj的值x,y之间的特征依赖聚合度。
特征间耦合属性相似度的计算公式表示为:
其中,∩为属性Aj取值为x条件下属性Ak的所有取值集合,与属性Aj取值y条件下属性Ak的所有取值集合的交集;Pk|j({w}|x)表示属性Aj取值为x的条件下,属性Ak取值为w的条件概率,其定义为:
在上述实施例中,根据耦合对象相似度,构建出相似度矩阵,刻画两两科技资源对象之间的关系。当然,除了利用上述耦合对象相似度还可以采用其他可以来刻画科技资源矩阵的相似度关系,如采用皮尔逊相关系数来刻画科技资源(x,y)之间的相似度距离,表示为:
其中,Sx、Sy是x和y的样品标准偏差,当然,上述公式可以参照现有技术进行广义的理解,本发明对此不作具体的限定。
S3、基于科技资源之间的耦合对象相似度,构建包含科技资源属性信息的正则化项;
其中,β是第零正则化控制参数,用于控制科技资源属性信息的影响程度;n表示科技资源的属性个数;Si,i′表示属性信息的科技资源i和科技资源i′之间的相似度;qi表示科技资源i隐藏特征向量因子;表示二范式;tr表示正则化标签;Q表示科技资源矩阵;为拉普拉斯矩阵,S表示由科技资源对之间的耦合对象相似度所构成科技资源相似度矩阵;D为对焦矩阵,对角元素Dii=∑i′=1Si,i′。利用科技资源属性信息构建资源关系正则化项,并假设如果科技资源i,i′的属性信息相似,那么它们隐特征向量qi和qi′尽可能相似,Si,i′值越大,意味着qi和qi′之间的距离越小。
S4、利用矩阵分解算法对该正则项进行处理,并构建出评分模型的损失函数;根据随机梯度下降方法优化损失函数分别求得目标用户以及科技资源的隐向量,并对应求解出最优的目标用户隐特征矩阵和科技资源隐特征矩阵;
在一个实施例中,如图3所示,所述步骤S4包括:
S41、利用矩阵分解算法对所述目标用户-科技资源评分矩阵进行分解;
本实施例是将构建出的目标用户-科技资源评分矩阵进行矩阵分解,分解出两个低维度矩阵进行后续计算,矩阵分解的方法是将目标用户-科技资源评分矩阵R分解为两个低维的隐特征矩阵P和Q,即:
其中,列向量pu和qi分别表示用户u和科技资源i的隐藏特征向量因子,即隐特征向量,从而学习到低维的隐特征矩阵。
S42、在分解后的矩阵中分别加入科技资源属性信息的正则化项,并构建出评分模型的损失函数;
其中,损失函数的计算公式表示为:
其中,L(P,Q)表示用户与科技资源间的损失函数;R表示用户-科技资源的评分矩阵,(u,i)为用户u与科技资源i所构成的可观测项,Rui表示用户u对科技资源i的评分;Ω表示用户对科技资源的评分矩阵R中可观测项(u,i)的集合;表示二范式,即Frobenius范数,λ1为第一正则化控制参数,λ2为第二正则化控制参数,称为罚项;β是第零正则化控制参数,用于控制科技资源属性信息的影响程度;n为科技资源的属性个数;cos(i,i′)表示科技资源之间的耦合相似度;P,Q分别表示用户隐藏特征矩阵和科技资源隐藏特征矩阵,pu是矩阵P中的向量元素,表示用户u隐藏特征向量因子;qi是矩阵Q中的向量元素,表示科技资源i隐藏特征向量因子。本发明是在一般的损失函数的基础上加上科技资源关系正则化项,从而构成本发明所提出的用户与科技资源间的损失函数。
S43、利用梯度下降算法进行迭代,根据损失函数的局部最小找到其最速下降方向,从而取得评分模型的用户隐藏特征向量因子和科技资源隐藏特征向量因子;
通过随机梯度下降方法进行一次迭代,由损失函数的局部最小找到其最速下降方向,从而取得损失函数最小时所对应的评分模型参数Pu和qi,分别对模型参数pu和qi求偏导,计算式子如下:
其中,Iui表示用户u与科技资源i之间的指示函数,当其值等于1表示用户u评价过科技资源i,其值等于0时表示用户u没有评价过科技资源i;N表示科技资源数量;g(x)为logistic函数,使得预测分数控制在[0,1]之间,g′(x)=exp(x)/(1+exp(-x))2是g(x)的导数;α是在预测评分时隐因子q和其近邻之间的平衡因子,表示科技资源依赖其本身和近邻的程度;Wij表示科技资源i与科技资源j间的耦合对象相似度;p,q分别表示用户隐藏特征矩阵和科技资源隐藏特征矩阵;Pu是矩阵P中的向量元素,度量了用户对相应的科技资源属性感兴趣的程度;qi是矩阵Q中的向量元素,表示科技资源i隐藏特征向量因子;rui表示用户u对科技资源i的预测评分;N(i)是与科技资源i最相似的K个近邻资源集合;m表示用户总数;Wkj表示科技资源k与科技资源j间的耦合对象相似度;λp表示第三正则化控制参数,λq表示第四正则化控制参数。S44、将这些隐藏特征向量因子根据梯度方向做相应调整,从而求解出目标用户隐藏特征P和科技资源隐藏特征矩阵Q。
通过对这些隐藏特征向量因子进行学习迭代,得到最优的隐藏特征向量因子,迭代过程表示:
其中,表示第k+1次迭代时的用户隐藏特征向量因子;表示第k+1次迭代时的科技资源隐藏特征向量因子;表示第k次迭代时的用户隐藏特征向量因子;表示第k次迭代时的科技资源隐藏特征向量因子;η表示学习率;L表示损失函数,通过对应的隐因子适当地根据逆梯度方向做相应调整。
将这些隐藏特征向量因子形成最优的目标用户隐特征矩阵Q和科技资源隐特征矩阵P。矩阵P中Pu的元素度量了用户对相应的科技资源属性感兴趣的程度,例如用户u对政府相关数据的感兴趣程度;矩阵Q中Qi的元素度量了此科技资源的拥有这些属性的程度;m个用户和n个科技资源分别形成用户隐特征矩阵P∈Rk×m和科技资源隐特征矩阵Q∈Rk×n。
S5、根据最优的目标用户隐特征矩阵和科技资源隐特征矩阵,利用评分模型计算出目标用户对不同科技资源的评分值;
所述评分模型表示为:
现有技术中的科技资源推荐方法大多是构建出评分模型后,计算出真实评分与预测评分的残差值,通过对让残差值最小化从而得到最优的评分模型供推荐评分使用,与传统的科技推荐方法不同,本发明直接利用矩阵分解算法对正则项进行处理,并构建出评分模型的损失函数,利用随机梯度下降方法计算出最优的目标用户隐特征矩阵和科技资源隐特征矩阵,将这些隐特征矩阵代入评分模型中即可计算出科技资源的评分,本发明大量减少了模型训练过程所带来的运算复杂度,能够更为高效的向目标用户推荐对应的科技资源。
S6、将计算出的所有科技资源评分值进行排序,并将评分值最高的前N个科技资源作为目标用户的推荐集合,并向目标用户输出推荐资源列表结果。
在本发明的另一方面,本实施例所提供的一种科技资源的推荐系统,如图4所示,所述推荐系统包括:
采集模块,用于智能科技服务平台中的科技资源信息以及目标用户信息;
采集模块可以通过API接口或者科技资源信息以及目标用户信息,也可以直接从智能科技服务平台的后台数据库获取这些信息。
矩阵构建模块,用于根据科技资源和目标用户的对应关系,计算出目标用户-科技资源评分矩阵;
将采集模块采集到的智能科技服务平台中的科技资源信息以及目标用户信息进行整合,从而构建出目标用户-科技资源评分矩阵。
相似度计算模块,用于计算各个科技资源间的耦合对象相似度;
按照科技资源的属性信息,利用所述用户-科技资源评分矩阵计算出各个科技资源之间的耦合对象相似度。
正则项模块,用于构建出包含科技资源属性信息的正则化项;
矩阵分解模块,用于对目标用户-科技资源评分矩阵进行分解,并分解出两个低维度的目标用户矩阵和科技资源矩阵;
评分模型构建模块,用于构建出评分模型,并构建出其中的损失函数;
模型训练模块,对损失函数利用随机梯度下降方法进行优化训练,并计算出最优的目标用户隐特征矩阵和科技资源隐特征矩阵;
评价计算模块,将计算出的最优的目标用户隐特征矩阵和科技资源隐特征矩阵代入评分模型中,求取出目标用户对不同科技资源的评分值;
推荐模块,将评分值最高的前N个科技资源推送给目标用户。
可以理解的是,本发明中的一种科技资源的推荐方法及系统的部分特征可以相互引用,本发明不再一一例举,例如评分模型构建模块所构建出的评分模型即为推荐方法中的评分模型。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (10)
1.一种科技资源的推荐方法,其特征在于,所述方法包括:
采集智能科技服务平台中的科技资源信息以及目标用户信息,并构建出目标用户-科技资源评分矩阵;
基于科技资源的属性信息,利用所述用户-科技资源评分矩阵计算出各个科技资源之间的耦合对象相似度;
基于科技资源之间的耦合对象相似度,构建包含科技资源属性信息的正则化项;
利用矩阵分解算法对该正则项进行处理,并构建出评分模型的损失函数;根据随机梯度下降方法优化损失函数分别求得目标用户以及科技资源的隐向量,并对应求解出最优的目标用户隐特征矩阵和科技资源隐特征矩阵;
根据最优的目标用户隐特征矩阵和科技资源隐特征矩阵,利用评分模型计算出目标用户对不同科技资源的评分值;
将计算出的所有科技资源评分值进行排序,并将评分值最高的前N个科技资源作为目标用户的推荐集合,并向目标用户输出推荐资源列表结果。
3.根据权利要求2所述的一种科技资源的推荐方法,其特征在于,所述S1中,耦合属性相似度是通过特征内耦合属性相似度和特征间耦合属性相似度的乘积计算而得,定义为:
特征内耦合属性相似度的计算公式表示为:
其中,gj(x)表示科技资源对象集合O中属性Aj上取值等于x的数据对象集合;gj(y)表示科技资源对象集合O中属性Aj上取值等于y的数据对象集合;|gj(x)|表示这个数据对象集合gj(x)中集合元素的个数;|gj(y)|表示这个数据对象集合gj(y)中集合元素的个数;
特征间耦合属性相似度的计算公式表示为:
其中,∩为属性Aj取值为x条件下属性Ak的所有取值集合,与属性Aj取值y条件下属性Ak的所有取值集合的交集;Pk|j({w}|x)表示属性Aj取值为x的条件下,属性Ak取值为w的条件概率;Pk|j({w}|y)表示属性Aj取值为y的条件下,属性Ak取值为w的条件概率。
5.根据权利要求1所述的一种科技资源的推荐方法,其特征在于,求解出目标用户隐特征矩阵和科技资源隐特征矩阵的过程包括以下步骤:
利用矩阵分解算法对所述目标用户-科技资源评分矩阵进行分解,在分解后的矩阵中分别加入科技资源属性信息的正则化项,并构建出评分模型的损失函数;
利用梯度下降算法进行迭代,根据损失函数的局部最小找到其最速下降方向,从而取得评分模型的用户隐藏特征向量因子和科技资源隐藏特征向量因子;
将这些隐藏特征向量因子根据梯度方向做相应调整,从而求解出目标用户隐藏特征P和科技资源隐藏特征矩阵Q。
6.根据权利要求5所述的一种科技资源的推荐方法,其特征在于,所述损失函数的构建公式表示为:
其中,L(P,Q)表示用户与科技资源间的损失函数;R表示用户-科技资源的评分矩阵,(u,i)为用户u与科技资源i所构成的可观测项,Rui表示用户u对科技资源i的评分;Ω表示用户对科技资源的评分矩阵R中可观测项(u,i)的集合;表示二范式,即Frobenius范数,λ1为第一正则化控制参数,λ2为第二正则化控制参数,称为罚项;β是第零正则化控制参数,用于控制科技资源属性信息的影响程度;n为科技资源的属性个数;cos(i,i′)表示科技资源之间的耦合相似度;P,Q分别表示用户隐藏特征矩阵和科技资源隐藏特征矩阵,pu是矩阵P中的向量元素,表示用户u隐藏特征向量因子;qi是矩阵Q中的向量元素,表示科技资源i隐藏特征向量因子。
7.根据权利要求5所述的一种科技资源的推荐方法,其特征在于,所述损失函数的构建公式表示为:
通过随机梯度下降方法进行一次迭代,由损失函数的局部最小找到其最速下降方向,从而取得损失函数最小时所对应的评分模型参数Pu和qi,计算式子如下:
其中,Iui表示用户u与科技资源i之间的指示函数,当其值等于1表示用户u评价过科技资源i,其值等于0时表示用户u没有评价过科技资源i;N表示科技资源数量;g(x)为logistic函数,使得预测分数控制在[0,1]之间,g′(x)=exp(x)/(1+exp(-x))2是g(x)的导数;α是在预测评分时隐因子q和其近邻之间的平衡因子,表示科技资源依赖其本身和近邻的程度;Wij表示科技资源i与科技资源j间的耦合对象相似度;p,q分别表示用户隐藏特征矩阵和科技资源隐藏特征矩阵;Pu是矩阵P中的向量元素,度量了用户对相应的科技资源属性感兴趣的程度;qi是矩阵Q中的向量元素,表示科技资源i隐藏特征向量因子;rui表示用户u对科技资源i的预测评分;N(i)是与科技资源i最相似的K个近邻资源集合;m表示用户总数;Wkj表示科技资源k与科技资源j间的耦合对象相似度;λp表示第三正则化控制参数,λq表示第四正则化控制参数。
10.一种科技资源的推荐系统,其特征在于,所述推荐系统包括:
采集模块,用于智能科技服务平台中的科技资源信息以及目标用户信息;
矩阵构建模块,用于根据科技资源和目标用户的对应关系,计算出目标用户-科技资源评分矩阵;
相似度计算模块,用于计算各个科技资源间的耦合对象相似度;
正则项模块,用于构建出包含科技资源属性信息的正则化项;
矩阵分解模块,用于对目标用户-科技资源评分矩阵进行分解,并分解出两个低维度的目标用户矩阵P和科技资源矩阵Q;
评分模型构建模块,用于构建出评分模型,并构建出其中的损失函数;
模型训练模块,对损失函数利用随机梯度下降方法进行优化训练,并计算出最优的目标用户隐特征矩阵和科技资源隐特征矩阵;
评价计算模块,将计算出的最优的目标用户隐特征矩阵和科技资源隐特征矩阵代入评分模型中,求取出目标用户对不同科技资源的评分值;
推荐模块,将评分值最高的前N个科技资源推送给目标用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010717203.8A CN111931043B (zh) | 2020-07-23 | 2020-07-23 | 一种科技资源的推荐方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010717203.8A CN111931043B (zh) | 2020-07-23 | 2020-07-23 | 一种科技资源的推荐方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111931043A true CN111931043A (zh) | 2020-11-13 |
CN111931043B CN111931043B (zh) | 2023-09-29 |
Family
ID=73314478
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010717203.8A Active CN111931043B (zh) | 2020-07-23 | 2020-07-23 | 一种科技资源的推荐方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111931043B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113239179A (zh) * | 2021-07-12 | 2021-08-10 | 北京邮电大学 | 科研技术兴趣领域识别模型训练方法、科技资源查询方法及装置 |
CN113360776A (zh) * | 2021-07-19 | 2021-09-07 | 西南大学 | 基于跨表数据挖掘的科技资源推荐方法 |
CN115174997A (zh) * | 2022-06-29 | 2022-10-11 | Vidaa国际控股(荷兰)公司 | 显示设备和媒资推荐方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106294859A (zh) * | 2016-08-22 | 2017-01-04 | 南京邮电大学盐城大数据研究院有限公司 | 一种基于属性耦合矩阵分解的项目推荐方法 |
CN108520450A (zh) * | 2018-03-21 | 2018-09-11 | 电子科技大学 | 基于隐式反馈信息的局部低秩矩阵近似的推荐方法及系统 |
US10600004B1 (en) * | 2017-11-03 | 2020-03-24 | Am Mobileapps, Llc | Machine-learning based outcome optimization |
CN110929161A (zh) * | 2019-12-02 | 2020-03-27 | 南京莱斯网信技术研究院有限公司 | 一种面向大规模用户的个性化教学资源推荐方法 |
-
2020
- 2020-07-23 CN CN202010717203.8A patent/CN111931043B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106294859A (zh) * | 2016-08-22 | 2017-01-04 | 南京邮电大学盐城大数据研究院有限公司 | 一种基于属性耦合矩阵分解的项目推荐方法 |
US10600004B1 (en) * | 2017-11-03 | 2020-03-24 | Am Mobileapps, Llc | Machine-learning based outcome optimization |
CN108520450A (zh) * | 2018-03-21 | 2018-09-11 | 电子科技大学 | 基于隐式反馈信息的局部低秩矩阵近似的推荐方法及系统 |
CN110929161A (zh) * | 2019-12-02 | 2020-03-27 | 南京莱斯网信技术研究院有限公司 | 一种面向大规模用户的个性化教学资源推荐方法 |
Non-Patent Citations (2)
Title |
---|
R.BARATHY: "Applying Matrix Factorization In Collaborative Filtering Recommender Systems", 《2020 6TH INTERNATIONAL CONFERENCE ON ADVANCED COMPUTING AND COMMUNICATION SYSTEM》 * |
吴燎原: "一种改进List-wise的科技论文推荐方法研究", 《计算机应用研究》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113239179A (zh) * | 2021-07-12 | 2021-08-10 | 北京邮电大学 | 科研技术兴趣领域识别模型训练方法、科技资源查询方法及装置 |
CN113360776A (zh) * | 2021-07-19 | 2021-09-07 | 西南大学 | 基于跨表数据挖掘的科技资源推荐方法 |
CN113360776B (zh) * | 2021-07-19 | 2023-07-21 | 西南大学 | 基于跨表数据挖掘的科技资源推荐方法 |
CN115174997A (zh) * | 2022-06-29 | 2022-10-11 | Vidaa国际控股(荷兰)公司 | 显示设备和媒资推荐方法 |
CN115174997B (zh) * | 2022-06-29 | 2023-11-28 | Vidaa国际控股(荷兰)公司 | 显示设备和媒资推荐方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111931043B (zh) | 2023-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Rothe et al. | Deep expectation of real and apparent age from a single image without facial landmarks | |
CN108647996B (zh) | 一种基于Spark的个性化推荐方法及系统 | |
CN111931043B (zh) | 一种科技资源的推荐方法及系统 | |
Chen et al. | A novel distribution regression approach for data loss compensation in structural health monitoring | |
Liu et al. | Dynamic attention-based explainable recommendation with textual and visual fusion | |
CN110633421B (zh) | 特征提取、推荐以及预测方法、装置、介质和设备 | |
Nguyen et al. | Probabilistic modeling for crowdsourcing partially-subjective ratings | |
CN110634060A (zh) | 一种用户信用风险的评估方法、系统、装置及存储介质 | |
Frischknecht et al. | A simple method for estimating preference parameters for individuals | |
Zhang et al. | A novel hybrid correlation measure for probabilistic linguistic term sets and crisp numbers and its application in customer relationship management | |
Glauner | Artificial intelligence for the detection of electricity theft and irregular power usage in emerging markets | |
Liu et al. | An application of convolutional neural network for deterioration modeling of highway bridge components in the United States | |
Zhang et al. | CMG2Vec: A composite meta-graph based heterogeneous information network embedding approach | |
CN111177492A (zh) | 一种基于多视角对称非负矩阵分解的跨模态信息检索方法 | |
Kou et al. | Inaccurate label distribution learning | |
Quintana et al. | Recommendation techniques in forensic data analysis: a new approach | |
CN112836754A (zh) | 一种面向图像描述模型泛化能力评估方法 | |
CN112991025A (zh) | 一种保险智能推荐方法、系统、设备及计算机可读存储介质 | |
CN112559905A (zh) | 一种基于双模式注意力机制和社交相似度的会话推荐方法 | |
Ifada et al. | A New Weighted-learning Approach for Exploiting Data Sparsity in Tag-based Item Recommendation Systems. | |
Li et al. | Matrix factorization for video recommendation based on instantaneous user interest | |
Liu et al. | Modeling the effects of individual and group heterogeneity on multi-aspect rating behavior | |
Mutteppagol | A deep learning recommender system for anime | |
JIn et al. | Research on User Model Construction for Individualized Knowledge Recommendation | |
Ding et al. | Deep Feature Fusion over Multi-Field Categorical Data for Rating Prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |