CN111931043A - 一种科技资源的推荐方法及系统 - Google Patents

一种科技资源的推荐方法及系统 Download PDF

Info

Publication number
CN111931043A
CN111931043A CN202010717203.8A CN202010717203A CN111931043A CN 111931043 A CN111931043 A CN 111931043A CN 202010717203 A CN202010717203 A CN 202010717203A CN 111931043 A CN111931043 A CN 111931043A
Authority
CN
China
Prior art keywords
scientific
technological
resources
resource
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010717203.8A
Other languages
English (en)
Other versions
CN111931043B (zh
Inventor
马创
覃思诗
产拙
胡新庭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN202010717203.8A priority Critical patent/CN111931043B/zh
Publication of CN111931043A publication Critical patent/CN111931043A/zh
Application granted granted Critical
Publication of CN111931043B publication Critical patent/CN111931043B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及互联网技术领域,涉及一种科技资源的推荐方法及系统;所述方法包括利用用户‑科技资源评分矩阵计算出各个科技资源之间的耦合对象相似度;构建包含科技资源属性信息的正则化项;利用矩阵分解算法对该正则项进行处理,并构建出评分模型的损失函数;根据随机梯度下降方法优化损失函数分别求解出最优的目标用户隐特征矩阵和科技资源隐特征矩阵;利用评分模型计算出目标用户对不同科技资源的评分值;将评分值最高的前N个科技资源作为目标用户的推荐集合并输出。本发明使用耦合相似度度量方法,准确刻画科技资源之间存在的非线性关系,能够更为全面地捕获科技资源间的关联关系,采用整体结构和局部信息全面地提高评分模型的准确性。

Description

一种科技资源的推荐方法及系统
技术领域
本发明涉及互联网技术领域,尤其涉及一种科技资源的推荐方法及系统。
背景技术
在大数据驱动的智能科技服务平台中存在着大量有效但杂乱的科技资源信息,这种信息的管理方式往往会间接导致维护成本过高、管理资源不便等问题。而推荐算法可以从这些有效、杂乱的数据信息中分析出特定目标用户的需求,并为目标用户提供更为人性化、智能化的推荐服务,以达到合理部署、分配科技资源的目的。
推荐系统中最成功的技术之一采用协同过滤(Collaborative Filtering,简称CF)方法,它根据志趣相投的目标用户过去的评级记录向活跃目标用户推荐科技资源。协同过滤利用相似度度量方法,根据目标用户的评价分数计算目标用户或科技资源之间的相似度,对矩阵的空单元格进行预测。在大多数推荐系统中,通过增加条目的数量,每个目标用户都无法给出他们对所有可用条目的偏好,也无法对数以百万计的条目进行评级。因此,目标用户-科技资源评分矩阵的大多数单元格是空的。
在这种情况下,确定类似的目标用户或科技资源(邻域的形成)就成了一项挑战。当目标用户对科技资源的评价非常稀疏,由于没有足够的目标用户评级信息,而目标用户-科技资源评分矩阵中目标用户和科技资源数量又很庞大,所以无法一一计算出两个目标用户或科技资源之间的相似度,导致使用CF方法的推荐效果不佳,其推荐准确率非常低。
发明内容
为了解决上述协同过滤推荐算法中存在数据稀疏、冷启动等问题,本申请方案提出了一种科技资源的推荐方法及系统,利用奇异值分解的增量方法,每次重复计算原矩阵不变的奇异值分解,解决稀疏性问题和动态的目标用户兴趣。在矩阵分解框中集成科技资源属性信息,通过科技资源关系正则化项的约束,实现对两个具有相似属性信息的科技资源进行矩阵分解,其过程得到的科技资源的特征向量关联性强。根据目标用户的历史访问数据、注册信息规划等平台信息,然后为目标用户推荐合适的平台资源,为平台管理者提供能优质化的平台管理手段。
在本发明的第一方面,本发明提供了一种科技资源的推荐方法,所述方法包括:
采集智能科技服务平台中的科技资源信息以及目标用户信息,并构建出目标用户-科技资源评分矩阵;
基于科技资源的属性信息,利用所述用户-科技资源评分矩阵计算出各个科技资源之间的耦合对象相似度;
基于科技资源之间的耦合对象相似度,构建包含科技资源属性信息的正则化项;
利用矩阵分解算法对该正则项进行处理,并构建出评分模型的损失函数;根据随机梯度下降方法优化损失函数分别求得目标用户以及科技资源的隐向量,并对应求解出最优的目标用户隐特征矩阵和科技资源隐特征矩阵;
根据最优的目标用户隐特征矩阵和科技资源隐特征矩阵,利用评分模型计算出目标用户对不同科技资源的评分值;
将计算出的所有科技资源评分值进行排序,并将评分值最高的前N个科技资源作为目标用户的推荐集合,并向目标用户输出推荐资源列表结果。
进一步的,采用余弦相似度度量由类别型数据计算科技资源之间的相似度,根据以下公式计算各个科技资源之间的耦合对象相似度:
Figure BDA0002598652260000021
其中,
Figure BDA0002598652260000022
表示科技资源i1与科技资源i2之间的耦合对象相似度;n为科技资源的属性个数;
Figure BDA0002598652260000031
是科技资源对象
Figure BDA0002598652260000032
在属性Aj上的取值
Figure BDA0002598652260000033
与科技资源对象
Figure BDA0002598652260000034
在属性Aj上的取值
Figure BDA0002598652260000035
的耦合属性相似度。
进一步的,包含科技资源属性信息的正则化项的构建方式包括:
Figure BDA0002598652260000036
其中,β是第零正则化控制参数,用于控制科技资源属性信息的影响程度;n表示科技资源的属性个数;Si,i′表示属性信息的科技资源i和科技资源i′之间的相似度;qi表示科技资源i隐藏特征向量因子;
Figure BDA0002598652260000037
表示二范式;tr表示正则化标签;Q表示科技资源矩阵;
Figure BDA0002598652260000038
为拉普拉斯矩阵,S表示由科技资源对之间的耦合对象相似度所构成科技资源相似度矩阵;D为对焦矩阵,对角元素Dii=∑i′=1Si,i′。利用科技资源属性信息构建资源关系正则化项,并假设如果科技资源资源i,i′的属性信息相似,那么它们隐特征向量qi和qi′尽可能相似,si,i′值越大,意味着qi和qi′之间的距离越小。
进一步的,求解出目标用户隐特征矩阵和科技资源隐特征矩阵的过程包括以下步骤:
利用矩阵分解算法对所述目标用户-科技资源评分矩阵进行分解,并在分解后的矩阵中分别加入科技资源属性信息的正则化项,并构建出评分模型的损失函数;
利用梯度下降算法进行迭代,根据损失函数的局部最小找到其最速下降方向,从而取得评分模型的用户隐藏特征向量因子和科技资源隐藏特征向量因子;
将这些隐藏特征向量因子根据梯度方向做相应调整,从而求解出目标用户隐藏特征P和科技资源隐藏特征矩阵Q。
进一步的,所述评分模型是利用目标用户隐特征矩阵和科技资源隐特征矩阵中的内积构建而得,表示为:
Figure BDA0002598652260000039
其中,rui表示用户u对科技资源i的预测评分;
Figure BDA00025986522600000310
表示目标用户隐特征矩阵P和科技资源隐特征矩阵Q中的内积;qi表示科技资源隐特征矩阵中的科技资源i。可以理解的是,这里的用户u是属于m中的一个用户;这里的科技资源i是属于n中的一个属性。
在本发明的第二方面,本发明还提供了一种科技资源的推荐系统,所述推荐系统包括:
采集模块,用于智能科技服务平台中的科技资源信息以及目标用户信息;
矩阵构建模块,用于根据科技资源和目标用户的对应关系,计算出目标用户-科技资源评分矩阵;
相似度计算模块,用于计算各个科技资源间的耦合对象相似度;
正则项模块,用于构建出包含科技资源属性信息的正则化项;
矩阵分解模块,用于对目标用户-科技资源评分矩阵进行分解,并分解出两个低维度的目标用户矩阵和科技资源矩阵;
评分模型构建模块,用于构建出评分模型,并构建出其中的损失函数;
模型训练模块,对损失函数利用随机梯度下降方法进行优化训练,并计算出最优的目标用户隐特征矩阵和科技资源隐特征矩阵;
评价计算模块,将计算出的最优的目标用户隐特征矩阵和科技资源隐特征矩阵代入评分模型中,求取出目标用户对不同科技资源的评分值;
推荐模块,将评分值最高的前N个科技资源推送给目标用户。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:
1、本发明通过使用耦合相似度度量方法,准确地刻画科技资源之间存在的非线性关系,能够更为全面地捕获科技资源间的关联关系。
2、将高维的稀疏的评分矩阵映射为隐因子空间中低维度的目标用户-科技资源评分矩阵,然后通过对应目标用户特征向量和科技资源特征向量的内积来预测缺失的评分。
3、本发明采用整体结构和局部信息全面地提高预测模型的精确性。
附图说明
图1是本发明的一种科技资源的推荐方法流程示意图;
图2是本发明中目标用户和科技资源相似度融合流程图;
图3是本发明中求解目标用户隐特征矩阵和科技资源隐特征矩阵的流程图;
图4是本发明中的一种科技资源的推荐系统结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本说明书实施例提供的方法适用于服务器,在实际应用中也可以适用于终端设备,例如智能手机、平板电脑等等,本说明书实施例对此不作限定。
为了便于描述,下面以执行主体为服务器对本说明书实施例技术方案进行介绍。
图1为本申请一实施例提供的推荐方法的流程示意图。如图1所示,所述方法包括:
S1、采集智能科技服务平台中的科技资源信息以及目标用户信息,并构建出目标用户-科技资源评分矩阵;
这里的智能科技服务平台是由大数据所驱动的,平台中蕴含了丰富的科技资源信息,用户可以通过主动搜索的方式找寻科技资源信息,也可以由平台向目标用户推送相对应的科技资源信息,本实施例基于如何向目标用户精准推荐合适的科技资源,为平台管理者提供能优质化的平台管理手段。
这里的科技资源主要是指通过智能科技服务平台所提供的科技资源信息,包括但不限于可以利用的从事科技活动的人力、物力、财力以及组织、管理、信息等软、硬件要素的总称,或是强调其中某些要素的集合的总和。
具体地,可以指科技型企业数据、历年来的科技资源数据、科技人才数据、学科资源等科技多源数据。其中属性信息主要是指用户和多源科技资源之间的共现关系,揭示资源之间的隐藏连接关系,所有的属性向量都是从平台的资源的描述信息中抽取,并且属性值是类别类型。对于某一资源的属性,其可能有多个取值。例如,利用循环神经网络解决医学图像分析问题既是计算集科学中的深度学习又是医药类。
智能科技服务平台包含以上两种实体集合:m个用户集合和n个科技资源的集合。将用户的历史活动记录转换为用户-科技资源评分矩阵Em×n,Em×n中的每一项是用户u对科技资源i的评分。
如图2所示,本发明利用用户和用户对科技资源的评分构建用户评分矩阵E,科技资源的集合O,包括了不同的科技信息资源,即[o1,o2,o3,…,on]。
根据每位用户对科技资源所提供的信息,利用用户相似度和科技资源相似度的对多源科技资源进行衡量,建立不同资源间的联系,将这两种关系耦合在一起,作为附加信息,构建资源和属性的矩阵。
S2、基于科技资源的属性信息,利用所述用户-科技资源评分矩阵计算出各个科技资源之间的耦合对象相似度;
其中,本实施例采用余弦相似度度量由类别型数据计算科技资源之间的相似度,根据以下公式计算各个科技资源之间的耦合对象相似度:
Figure BDA0002598652260000061
其中,n为科技资源的属性个数;
Figure BDA0002598652260000062
是科技资源对象
Figure BDA0002598652260000063
在属性Aj上的取值
Figure BDA0002598652260000064
与科技资源对象
Figure BDA0002598652260000065
在属性Aj上的取值
Figure BDA0002598652260000066
的耦合属性相似度;对于科技资源i1、i2之间的耦合对象相似度则为它们在各个属性上的耦合相似度之和。
耦合属性相似度是通过特征内耦合属性相似度和特征间耦合属性相似度的乘积计算而得,定义为:
Figure BDA0002598652260000071
其中,
Figure BDA0002598652260000072
表示属性Aj的取值x与y之间的特征内耦合属性相似度;
Figure BDA0002598652260000073
表示属性Aj的取值x与y之间的特征间耦合属性相似度;Aj表示相应科技资源的属性,属性Aj的取值x、y之间的特征耦合属性值相似度考虑了属性Aj内取值x、y之间的特征依赖聚合度。
特征内耦合属性相似度的计算公式表示为:
Figure BDA0002598652260000074
其中,gj(x)表示科技资源对象集合O中属性Aj上取值等于x的数据对象集合;gj(y)表示科技资源对象集合O中属性Aj上取值等于y的数据对象集合;|gj(x)|表示这个数据对象集合gj(x)中集合元素的个数;gj(x)和|gj(x)|与此类似;属性Aj的值x,y之间的特征依赖聚合度。
特征间耦合属性相似度的计算公式表示为:
Figure BDA0002598652260000075
其中,αk是属性Aj的权重参数,
Figure BDA0002598652260000076
n表示科技资源对象集合O中属性个数;δj|k(x,y)是属性值x与y在特征Ak(k≠j)下的特征间耦合属性值相似度,定义为:
Figure BDA0002598652260000077
其中,∩为属性Aj取值为x条件下属性Ak的所有取值集合,与属性Aj取值y条件下属性Ak的所有取值集合的交集;Pk|j({w}|x)表示属性Aj取值为x的条件下,属性Ak取值为w的条件概率,其定义为:
Figure BDA0002598652260000078
在上述实施例中,根据耦合对象相似度,构建出相似度矩阵,刻画两两科技资源对象之间的关系。当然,除了利用上述耦合对象相似度还可以采用其他可以来刻画科技资源矩阵的相似度关系,如采用皮尔逊相关系数来刻画科技资源(x,y)之间的相似度距离,表示为:
Figure BDA0002598652260000081
其中,Sx、Sy是x和y的样品标准偏差,当然,上述公式可以参照现有技术进行广义的理解,本发明对此不作具体的限定。
S3、基于科技资源之间的耦合对象相似度,构建包含科技资源属性信息的正则化项;
利用科技资源对之间的相似度构成科技资源相似度矩阵S,计算拉普拉斯矩阵
Figure BDA0002598652260000082
如下式:
Figure BDA0002598652260000083
其中,β是第零正则化控制参数,用于控制科技资源属性信息的影响程度;n表示科技资源的属性个数;Si,i′表示属性信息的科技资源i和科技资源i′之间的相似度;qi表示科技资源i隐藏特征向量因子;
Figure BDA0002598652260000084
表示二范式;tr表示正则化标签;Q表示科技资源矩阵;
Figure BDA0002598652260000085
为拉普拉斯矩阵,S表示由科技资源对之间的耦合对象相似度所构成科技资源相似度矩阵;D为对焦矩阵,对角元素Dii=∑i′=1Si,i′。利用科技资源属性信息构建资源关系正则化项,并假设如果科技资源i,i′的属性信息相似,那么它们隐特征向量qi和qi′尽可能相似,Si,i′值越大,意味着qi和qi′之间的距离越小。
S4、利用矩阵分解算法对该正则项进行处理,并构建出评分模型的损失函数;根据随机梯度下降方法优化损失函数分别求得目标用户以及科技资源的隐向量,并对应求解出最优的目标用户隐特征矩阵和科技资源隐特征矩阵;
在一个实施例中,如图3所示,所述步骤S4包括:
S41、利用矩阵分解算法对所述目标用户-科技资源评分矩阵进行分解;
本实施例是将构建出的目标用户-科技资源评分矩阵进行矩阵分解,分解出两个低维度矩阵进行后续计算,矩阵分解的方法是将目标用户-科技资源评分矩阵R分解为两个低维的隐特征矩阵P和Q,即:
Figure BDA0002598652260000091
其中,列向量pu和qi分别表示用户u和科技资源i的隐藏特征向量因子,即隐特征向量,从而学习到低维的隐特征矩阵。
S42、在分解后的矩阵中分别加入科技资源属性信息的正则化项,并构建出评分模型的损失函数;
其中,损失函数的计算公式表示为:
Figure BDA0002598652260000092
其中,L(P,Q)表示用户与科技资源间的损失函数;R表示用户-科技资源的评分矩阵,(u,i)为用户u与科技资源i所构成的可观测项,Rui表示用户u对科技资源i的评分;Ω表示用户对科技资源的评分矩阵R中可观测项(u,i)的集合;
Figure BDA0002598652260000093
表示二范式,即Frobenius范数,λ1为第一正则化控制参数,λ2为第二正则化控制参数,
Figure BDA0002598652260000094
称为罚项;β是第零正则化控制参数,用于控制科技资源属性信息的影响程度;n为科技资源的属性个数;cos(i,i′)表示科技资源之间的耦合相似度;P,Q分别表示用户隐藏特征矩阵和科技资源隐藏特征矩阵,pu是矩阵P中的向量元素,表示用户u隐藏特征向量因子;qi是矩阵Q中的向量元素,表示科技资源i隐藏特征向量因子。本发明是在一般的损失函数的基础上加上科技资源关系正则化项,从而构成本发明所提出的用户与科技资源间的损失函数。
S43、利用梯度下降算法进行迭代,根据损失函数的局部最小找到其最速下降方向,从而取得评分模型的用户隐藏特征向量因子和科技资源隐藏特征向量因子;
通过随机梯度下降方法进行一次迭代,由损失函数的局部最小找到其最速下降方向,从而取得损失函数最小时所对应的评分模型参数Pu和qi,分别对模型参数pu和qi求偏导,计算式子如下:
Figure BDA0002598652260000101
Figure BDA0002598652260000102
其中,Iui表示用户u与科技资源i之间的指示函数,当其值等于1表示用户u评价过科技资源i,其值等于0时表示用户u没有评价过科技资源i;N表示科技资源数量;g(x)为logistic函数,使得预测分数控制在[0,1]之间,g′(x)=exp(x)/(1+exp(-x))2是g(x)的导数;α是在预测评分时隐因子q和其近邻之间的平衡因子,表示科技资源依赖其本身和近邻的程度;Wij表示科技资源i与科技资源j间的耦合对象相似度;p,q分别表示用户隐藏特征矩阵和科技资源隐藏特征矩阵;Pu是矩阵P中的向量元素,度量了用户对相应的科技资源属性感兴趣的程度;qi是矩阵Q中的向量元素,表示科技资源i隐藏特征向量因子;rui表示用户u对科技资源i的预测评分;N(i)是与科技资源i最相似的K个近邻资源集合;m表示用户总数;Wkj表示科技资源k与科技资源j间的耦合对象相似度;λp表示第三正则化控制参数,λq表示第四正则化控制参数。S44、将这些隐藏特征向量因子根据梯度方向做相应调整,从而求解出目标用户隐藏特征P和科技资源隐藏特征矩阵Q。
通过对这些隐藏特征向量因子进行学习迭代,得到最优的隐藏特征向量因子,迭代过程表示:
Figure BDA0002598652260000111
Figure BDA0002598652260000112
其中,
Figure BDA0002598652260000113
表示第k+1次迭代时的用户隐藏特征向量因子;
Figure BDA0002598652260000114
表示第k+1次迭代时的科技资源隐藏特征向量因子;
Figure BDA0002598652260000115
表示第k次迭代时的用户隐藏特征向量因子;
Figure BDA0002598652260000116
表示第k次迭代时的科技资源隐藏特征向量因子;η表示学习率;L表示损失函数,通过对应的隐因子适当地根据逆梯度方向做相应调整。
将这些隐藏特征向量因子形成最优的目标用户隐特征矩阵Q和科技资源隐特征矩阵P。矩阵P中Pu的元素度量了用户对相应的科技资源属性感兴趣的程度,例如用户u对政府相关数据的感兴趣程度;矩阵Q中Qi的元素度量了此科技资源的拥有这些属性的程度;m个用户和n个科技资源分别形成用户隐特征矩阵P∈Rk×m和科技资源隐特征矩阵Q∈Rk×n。
S5、根据最优的目标用户隐特征矩阵和科技资源隐特征矩阵,利用评分模型计算出目标用户对不同科技资源的评分值;
所述评分模型表示为:
Figure BDA0002598652260000117
其中,rui表示用户u对科技资源i的预测评分;
Figure BDA0002598652260000118
表示目标用户隐特征矩阵P和科技资源隐特征矩阵Q中的内积;qi表示科技资源隐特征矩阵中的科技资源i。
现有技术中的科技资源推荐方法大多是构建出评分模型后,计算出真实评分与预测评分的残差值,通过对让残差值最小化从而得到最优的评分模型供推荐评分使用,与传统的科技推荐方法不同,本发明直接利用矩阵分解算法对正则项进行处理,并构建出评分模型的损失函数,利用随机梯度下降方法计算出最优的目标用户隐特征矩阵和科技资源隐特征矩阵,将这些隐特征矩阵代入评分模型中即可计算出科技资源的评分,本发明大量减少了模型训练过程所带来的运算复杂度,能够更为高效的向目标用户推荐对应的科技资源。
S6、将计算出的所有科技资源评分值进行排序,并将评分值最高的前N个科技资源作为目标用户的推荐集合,并向目标用户输出推荐资源列表结果。
在本发明的另一方面,本实施例所提供的一种科技资源的推荐系统,如图4所示,所述推荐系统包括:
采集模块,用于智能科技服务平台中的科技资源信息以及目标用户信息;
采集模块可以通过API接口或者科技资源信息以及目标用户信息,也可以直接从智能科技服务平台的后台数据库获取这些信息。
矩阵构建模块,用于根据科技资源和目标用户的对应关系,计算出目标用户-科技资源评分矩阵;
将采集模块采集到的智能科技服务平台中的科技资源信息以及目标用户信息进行整合,从而构建出目标用户-科技资源评分矩阵。
相似度计算模块,用于计算各个科技资源间的耦合对象相似度;
按照科技资源的属性信息,利用所述用户-科技资源评分矩阵计算出各个科技资源之间的耦合对象相似度。
正则项模块,用于构建出包含科技资源属性信息的正则化项;
利用科技资源对之间的相似度构成科技资源相似度矩阵S,计算拉普拉斯矩阵
Figure BDA0002598652260000121
利用拉普拉斯矩阵
Figure BDA0002598652260000122
构建出正则化项。
矩阵分解模块,用于对目标用户-科技资源评分矩阵进行分解,并分解出两个低维度的目标用户矩阵和科技资源矩阵;
评分模型构建模块,用于构建出评分模型,并构建出其中的损失函数;
模型训练模块,对损失函数利用随机梯度下降方法进行优化训练,并计算出最优的目标用户隐特征矩阵和科技资源隐特征矩阵;
评价计算模块,将计算出的最优的目标用户隐特征矩阵和科技资源隐特征矩阵代入评分模型中,求取出目标用户对不同科技资源的评分值;
推荐模块,将评分值最高的前N个科技资源推送给目标用户。
可以理解的是,本发明中的一种科技资源的推荐方法及系统的部分特征可以相互引用,本发明不再一一例举,例如评分模型构建模块所构建出的评分模型即为推荐方法中的评分模型。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (10)

1.一种科技资源的推荐方法,其特征在于,所述方法包括:
采集智能科技服务平台中的科技资源信息以及目标用户信息,并构建出目标用户-科技资源评分矩阵;
基于科技资源的属性信息,利用所述用户-科技资源评分矩阵计算出各个科技资源之间的耦合对象相似度;
基于科技资源之间的耦合对象相似度,构建包含科技资源属性信息的正则化项;
利用矩阵分解算法对该正则项进行处理,并构建出评分模型的损失函数;根据随机梯度下降方法优化损失函数分别求得目标用户以及科技资源的隐向量,并对应求解出最优的目标用户隐特征矩阵和科技资源隐特征矩阵;
根据最优的目标用户隐特征矩阵和科技资源隐特征矩阵,利用评分模型计算出目标用户对不同科技资源的评分值;
将计算出的所有科技资源评分值进行排序,并将评分值最高的前N个科技资源作为目标用户的推荐集合,并向目标用户输出推荐资源列表结果。
2.根据权利要求1所述的一种科技资源的推荐方法,其特征在于,所述S1中,采用余弦相似度度量由类别型数据计算科技资源之间的相似度,根据以下公式计算各个科技资源之间的耦合对象相似度:
Figure FDA0002598652250000011
其中,
Figure FDA0002598652250000012
表示科技资源i1与科技资源i2之间的耦合对象相似度;n为科技资源的属性个数;
Figure FDA0002598652250000013
是科技资源对象
Figure FDA0002598652250000014
在属性Aj上的取值
Figure FDA0002598652250000015
与科技资源对象
Figure FDA0002598652250000016
在属性Aj上的取值
Figure FDA0002598652250000017
的耦合属性相似度。
3.根据权利要求2所述的一种科技资源的推荐方法,其特征在于,所述S1中,耦合属性相似度是通过特征内耦合属性相似度和特征间耦合属性相似度的乘积计算而得,定义为:
Figure FDA0002598652250000021
其中,
Figure FDA0002598652250000022
表示属性Aj的取值x与取值y之间的特征内耦合属性相似度;
Figure FDA0002598652250000023
表示属性Aj的取值x与取值y之间的特征间耦合属性相似度;
特征内耦合属性相似度的计算公式表示为:
Figure FDA0002598652250000024
其中,gj(x)表示科技资源对象集合O中属性Aj上取值等于x的数据对象集合;gj(y)表示科技资源对象集合O中属性Aj上取值等于y的数据对象集合;|gj(x)|表示这个数据对象集合gj(x)中集合元素的个数;|gj(y)|表示这个数据对象集合gj(y)中集合元素的个数;
特征间耦合属性相似度的计算公式表示为:
Figure FDA0002598652250000025
其中,αk是属性Aj的权重参数,
Figure FDA0002598652250000026
n表示科技资源对象集合O中属性个数;δj|k(x,y)是属性值x与y在属性Ak(k≠j)下的特征间耦合属性相似度,定义为:
Figure FDA0002598652250000027
其中,∩为属性Aj取值为x条件下属性Ak的所有取值集合,与属性Aj取值y条件下属性Ak的所有取值集合的交集;Pk|j({w}|x)表示属性Aj取值为x的条件下,属性Ak取值为w的条件概率;Pk|j({w}|y)表示属性Aj取值为y的条件下,属性Ak取值为w的条件概率。
4.根据权利要求1所述的一种科技资源的推荐方法,其特征在于,所述包含科技资源属性信息的正则化项的构建方式包括:
Figure FDA0002598652250000028
其中,β是第零正则化控制参数,用于控制科技资源属性信息的影响程度;n表示科技资源的属性个数;Si,i′表示属性信息的科技资源i和科技资源i′之间的相似度;qi表示科技资源i隐藏特征向量因子;
Figure FDA0002598652250000031
表示二范式;tr表示正则化标签;Q表示科技资源矩阵;
Figure FDA0002598652250000035
为拉普拉斯矩阵,S表示由科技资源对之间的耦合对象相似度所构成科技资源相似度矩阵;D为对焦矩阵,对角元素Dii=∑i′=1Si,i′
5.根据权利要求1所述的一种科技资源的推荐方法,其特征在于,求解出目标用户隐特征矩阵和科技资源隐特征矩阵的过程包括以下步骤:
利用矩阵分解算法对所述目标用户-科技资源评分矩阵进行分解,在分解后的矩阵中分别加入科技资源属性信息的正则化项,并构建出评分模型的损失函数;
利用梯度下降算法进行迭代,根据损失函数的局部最小找到其最速下降方向,从而取得评分模型的用户隐藏特征向量因子和科技资源隐藏特征向量因子;
将这些隐藏特征向量因子根据梯度方向做相应调整,从而求解出目标用户隐藏特征P和科技资源隐藏特征矩阵Q。
6.根据权利要求5所述的一种科技资源的推荐方法,其特征在于,所述损失函数的构建公式表示为:
Figure FDA0002598652250000032
其中,L(P,Q)表示用户与科技资源间的损失函数;R表示用户-科技资源的评分矩阵,(u,i)为用户u与科技资源i所构成的可观测项,Rui表示用户u对科技资源i的评分;Ω表示用户对科技资源的评分矩阵R中可观测项(u,i)的集合;
Figure FDA0002598652250000033
表示二范式,即Frobenius范数,λ1为第一正则化控制参数,λ2为第二正则化控制参数,
Figure FDA0002598652250000034
称为罚项;β是第零正则化控制参数,用于控制科技资源属性信息的影响程度;n为科技资源的属性个数;cos(i,i′)表示科技资源之间的耦合相似度;P,Q分别表示用户隐藏特征矩阵和科技资源隐藏特征矩阵,pu是矩阵P中的向量元素,表示用户u隐藏特征向量因子;qi是矩阵Q中的向量元素,表示科技资源i隐藏特征向量因子。
7.根据权利要求5所述的一种科技资源的推荐方法,其特征在于,所述损失函数的构建公式表示为:
通过随机梯度下降方法进行一次迭代,由损失函数的局部最小找到其最速下降方向,从而取得损失函数最小时所对应的评分模型参数Pu和qi,计算式子如下:
Figure FDA0002598652250000041
Figure FDA0002598652250000042
其中,Iui表示用户u与科技资源i之间的指示函数,当其值等于1表示用户u评价过科技资源i,其值等于0时表示用户u没有评价过科技资源i;N表示科技资源数量;g(x)为logistic函数,使得预测分数控制在[0,1]之间,g′(x)=exp(x)/(1+exp(-x))2是g(x)的导数;α是在预测评分时隐因子q和其近邻之间的平衡因子,表示科技资源依赖其本身和近邻的程度;Wij表示科技资源i与科技资源j间的耦合对象相似度;p,q分别表示用户隐藏特征矩阵和科技资源隐藏特征矩阵;Pu是矩阵P中的向量元素,度量了用户对相应的科技资源属性感兴趣的程度;qi是矩阵Q中的向量元素,表示科技资源i隐藏特征向量因子;rui表示用户u对科技资源i的预测评分;N(i)是与科技资源i最相似的K个近邻资源集合;m表示用户总数;Wkj表示科技资源k与科技资源j间的耦合对象相似度;λp表示第三正则化控制参数,λq表示第四正则化控制参数。
8.根据权利要求5所述的一种科技资源的推荐方法,其特征在于,隐藏特征向量因子的学习过程的公式如下所示:
Figure FDA0002598652250000051
Figure FDA0002598652250000052
其中,
Figure FDA0002598652250000053
表示第k+1次迭代时的用户隐藏特征向量因子;
Figure FDA0002598652250000054
表示第k+1次迭代时的科技资源隐藏特征向量因子;
Figure FDA0002598652250000055
表示第k次迭代时的用户隐藏特征向量因子;
Figure FDA0002598652250000056
表示第k次迭代时的科技资源隐藏特征向量因子;η表示学习率;L表示损失函数,通过对应的隐因子适当地根据逆梯度方向做相应调整。
9.根据权利要求1所述的一种科技资源的推荐方法,其特征在于,所述S4中,所述评分模型是利用目标用户隐特征矩阵和科技资源隐特征矩阵中的内积构建而得,表示为:
Figure FDA0002598652250000057
其中,rui表示用户u对科技资源i的预测评分;
Figure FDA0002598652250000058
表示目标用户隐特征矩阵P和科技资源隐特征矩阵Q中的内积;qi表示科技资源隐特征矩阵中的科技资源i。
10.一种科技资源的推荐系统,其特征在于,所述推荐系统包括:
采集模块,用于智能科技服务平台中的科技资源信息以及目标用户信息;
矩阵构建模块,用于根据科技资源和目标用户的对应关系,计算出目标用户-科技资源评分矩阵;
相似度计算模块,用于计算各个科技资源间的耦合对象相似度;
正则项模块,用于构建出包含科技资源属性信息的正则化项;
矩阵分解模块,用于对目标用户-科技资源评分矩阵进行分解,并分解出两个低维度的目标用户矩阵P和科技资源矩阵Q;
评分模型构建模块,用于构建出评分模型,并构建出其中的损失函数;
模型训练模块,对损失函数利用随机梯度下降方法进行优化训练,并计算出最优的目标用户隐特征矩阵和科技资源隐特征矩阵;
评价计算模块,将计算出的最优的目标用户隐特征矩阵和科技资源隐特征矩阵代入评分模型中,求取出目标用户对不同科技资源的评分值;
推荐模块,将评分值最高的前N个科技资源推送给目标用户。
CN202010717203.8A 2020-07-23 2020-07-23 一种科技资源的推荐方法及系统 Active CN111931043B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010717203.8A CN111931043B (zh) 2020-07-23 2020-07-23 一种科技资源的推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010717203.8A CN111931043B (zh) 2020-07-23 2020-07-23 一种科技资源的推荐方法及系统

Publications (2)

Publication Number Publication Date
CN111931043A true CN111931043A (zh) 2020-11-13
CN111931043B CN111931043B (zh) 2023-09-29

Family

ID=73314478

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010717203.8A Active CN111931043B (zh) 2020-07-23 2020-07-23 一种科技资源的推荐方法及系统

Country Status (1)

Country Link
CN (1) CN111931043B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113239179A (zh) * 2021-07-12 2021-08-10 北京邮电大学 科研技术兴趣领域识别模型训练方法、科技资源查询方法及装置
CN113360776A (zh) * 2021-07-19 2021-09-07 西南大学 基于跨表数据挖掘的科技资源推荐方法
CN115174997A (zh) * 2022-06-29 2022-10-11 Vidaa国际控股(荷兰)公司 显示设备和媒资推荐方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106294859A (zh) * 2016-08-22 2017-01-04 南京邮电大学盐城大数据研究院有限公司 一种基于属性耦合矩阵分解的项目推荐方法
CN108520450A (zh) * 2018-03-21 2018-09-11 电子科技大学 基于隐式反馈信息的局部低秩矩阵近似的推荐方法及系统
US10600004B1 (en) * 2017-11-03 2020-03-24 Am Mobileapps, Llc Machine-learning based outcome optimization
CN110929161A (zh) * 2019-12-02 2020-03-27 南京莱斯网信技术研究院有限公司 一种面向大规模用户的个性化教学资源推荐方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106294859A (zh) * 2016-08-22 2017-01-04 南京邮电大学盐城大数据研究院有限公司 一种基于属性耦合矩阵分解的项目推荐方法
US10600004B1 (en) * 2017-11-03 2020-03-24 Am Mobileapps, Llc Machine-learning based outcome optimization
CN108520450A (zh) * 2018-03-21 2018-09-11 电子科技大学 基于隐式反馈信息的局部低秩矩阵近似的推荐方法及系统
CN110929161A (zh) * 2019-12-02 2020-03-27 南京莱斯网信技术研究院有限公司 一种面向大规模用户的个性化教学资源推荐方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
R.BARATHY: "Applying Matrix Factorization In Collaborative Filtering Recommender Systems", 《2020 6TH INTERNATIONAL CONFERENCE ON ADVANCED COMPUTING AND COMMUNICATION SYSTEM》 *
吴燎原: "一种改进List-wise的科技论文推荐方法研究", 《计算机应用研究》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113239179A (zh) * 2021-07-12 2021-08-10 北京邮电大学 科研技术兴趣领域识别模型训练方法、科技资源查询方法及装置
CN113360776A (zh) * 2021-07-19 2021-09-07 西南大学 基于跨表数据挖掘的科技资源推荐方法
CN113360776B (zh) * 2021-07-19 2023-07-21 西南大学 基于跨表数据挖掘的科技资源推荐方法
CN115174997A (zh) * 2022-06-29 2022-10-11 Vidaa国际控股(荷兰)公司 显示设备和媒资推荐方法
CN115174997B (zh) * 2022-06-29 2023-11-28 Vidaa国际控股(荷兰)公司 显示设备和媒资推荐方法

Also Published As

Publication number Publication date
CN111931043B (zh) 2023-09-29

Similar Documents

Publication Publication Date Title
Rothe et al. Deep expectation of real and apparent age from a single image without facial landmarks
CN108647996B (zh) 一种基于Spark的个性化推荐方法及系统
CN111931043B (zh) 一种科技资源的推荐方法及系统
Chen et al. A novel distribution regression approach for data loss compensation in structural health monitoring
Liu et al. Dynamic attention-based explainable recommendation with textual and visual fusion
CN110633421B (zh) 特征提取、推荐以及预测方法、装置、介质和设备
Nguyen et al. Probabilistic modeling for crowdsourcing partially-subjective ratings
CN110634060A (zh) 一种用户信用风险的评估方法、系统、装置及存储介质
Frischknecht et al. A simple method for estimating preference parameters for individuals
Zhang et al. A novel hybrid correlation measure for probabilistic linguistic term sets and crisp numbers and its application in customer relationship management
Glauner Artificial intelligence for the detection of electricity theft and irregular power usage in emerging markets
Liu et al. An application of convolutional neural network for deterioration modeling of highway bridge components in the United States
Zhang et al. CMG2Vec: A composite meta-graph based heterogeneous information network embedding approach
CN111177492A (zh) 一种基于多视角对称非负矩阵分解的跨模态信息检索方法
Kou et al. Inaccurate label distribution learning
Quintana et al. Recommendation techniques in forensic data analysis: a new approach
CN112836754A (zh) 一种面向图像描述模型泛化能力评估方法
CN112991025A (zh) 一种保险智能推荐方法、系统、设备及计算机可读存储介质
CN112559905A (zh) 一种基于双模式注意力机制和社交相似度的会话推荐方法
Ifada et al. A New Weighted-learning Approach for Exploiting Data Sparsity in Tag-based Item Recommendation Systems.
Li et al. Matrix factorization for video recommendation based on instantaneous user interest
Liu et al. Modeling the effects of individual and group heterogeneity on multi-aspect rating behavior
Mutteppagol A deep learning recommender system for anime
JIn et al. Research on User Model Construction for Individualized Knowledge Recommendation
Ding et al. Deep Feature Fusion over Multi-Field Categorical Data for Rating Prediction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant