CN109308315A - 一种基于专家领域相似度与关联关系的协同推荐方法 - Google Patents

一种基于专家领域相似度与关联关系的协同推荐方法 Download PDF

Info

Publication number
CN109308315A
CN109308315A CN201811228086.8A CN201811228086A CN109308315A CN 109308315 A CN109308315 A CN 109308315A CN 201811228086 A CN201811228086 A CN 201811228086A CN 109308315 A CN109308315 A CN 109308315A
Authority
CN
China
Prior art keywords
expert
keyword
dist
association
degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811228086.8A
Other languages
English (en)
Other versions
CN109308315B (zh
Inventor
陈盛之
李千目
刘奕婧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Science and Technology
Original Assignee
Nanjing University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Science and Technology filed Critical Nanjing University of Science and Technology
Priority to CN201811228086.8A priority Critical patent/CN109308315B/zh
Publication of CN109308315A publication Critical patent/CN109308315A/zh
Application granted granted Critical
Publication of CN109308315B publication Critical patent/CN109308315B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于专家领域相似度与关联关系的协同推荐方法。该方法为:将论文文献数据作为训练集进行输入;对同一篇论文下的合作者建立关联关系,构造合作关系网络,利用Dijkstra算法计算作者之间的最短路径,作为专家关联度;利用word2vec算法训练专家论文中的关键词与摘要,构造专家词向量模型,利用向量间的夹角作为专家领域相似度;融合专家关联度与领域相似度,构造协同推荐模型,使用协同推荐模型进行专家推荐。本发明方法能够依据用户给定领域关键词与专家姓名,推荐与该专家关联度最紧密的指定领域专家,从而快速找到与自身存在潜在合作价值的期望领域的专家。

Description

一种基于专家领域相似度与关联关系的协同推荐方法
技术领域
本发明涉协同推荐技术领域,特别是一种基于专家领域相似度与关联关系的协同推荐方法。
背景技术
竞争与合作是二十一世纪的主题,科研领域中存在着许多跨领域的合作,合作往往以论文的形式体现。专家在寻找合作的过程中往往希望找到特定领域,且与自己关系密切的专家学者进行合作,这样既可以达到合作的目的,也更加的便捷。如何快速的找到与自身存在潜在合作价值的期望领域的专家,是进行良好合作的基础。因此,专家推荐得到了各领域专家的广泛关注。
目前关于专家推荐的研究主要分为两类,一类是基于内容的推荐,该方法主要借助向量空间模型、语言模型和主题模型等自然语言处理技术计算专家研究主题与当前需求的匹配度。另一类是基于链接关系的推荐方法,此方法主要利用学术网络的连接结构来推断专家的学术影响力。传统专家推荐方法虽然结合了研究内容相关性与专家影响力这两个方面,却没有考虑到专家之间存在的潜在的关联关系,因此难以快速、全面、准确地推荐与该专家紧密关联的指定领域专家。
发明内容
本发明的目的在于提供一种基于专家领域相似度与关联关系的协同推荐方法,能够依据用户给定领域关键词与专家姓名,推荐与该专家关联度最紧密的指定领域专家。
实现本发明目的的技术解决方案为:一种基于专家领域相似度与关联关系的协同推荐方法,包括以下步骤:
步骤1,将批量论文数据作为训练集进行输入;
步骤2,对论文数据进行预处理,包括提取专家合作信息、专家论文关键词、专家论文摘要;对同一篇论文下的合作者建立专家合作信息;
步骤3,将目标专家姓名、目标领域作为输入,获取领域词向量;
步骤4,利用专家合作信息构造合作关系网络,利用Dijkstra算法计算作者之间的最短路径,作为专家关联度COR;
步骤5,利用word2vec训练专家论文中的关键词和摘要,构建专家关键词向量模型;
步骤6,计算关联专家词向量与领域词向量的余弦相似度,作为专家领域相似度SIM;
步骤7,筛选专家领域相似度SIM与专家关联度COR,满足阈值的专家即为推荐专家。
进一步地,步骤4所述的利用专家合作信息构造合作关系网络,利用Dijkstra算法计算作者之间的最短路径,作为专家关联度COR,具体如下:
步骤4.1、根据论文作者列表信息,以作者作为节点,将共同撰写论文的作者用边连接起来,共同撰写论文数的倒数作为边的权重,构造专家合作信息无向加权图G=(V,E);
步骤4.2、利用Dijkstra算法计算作者之间的最短路径,作为专家关联度COR,具体步骤如下:
步骤4.2.1、输入专家合作信息无向加权图G=(V,E),输入目标专家姓名作为源点v0
步骤4.2.2、用邻接矩阵arcs表示无向加权图,arcs[m][n]表示边<vm,vn>的权值,若不存在边<vm,vn>,则arcs[m][n]=∞,其中m,n∈{m|vm∈V};
步骤4.2.3、设置集合S记录已求得最短路径的顶点,令集合S初始为{v0};
步骤4.2.4、设置数组dist[]记录从源点v0到其他各个顶点vi的当前最短路径长度,dist[i]初始值为arcs[0][i],其中i∈{i|vi∈V};
步骤4.2.5、从顶点集合V-S中选出vj,满足dist[j]=Min{dist[i]|vi∈V-S},vj就是当前求得的一条从v0出发的最短路径的终点;令集合S=S∪{vj};
步骤4.2.6、修改从源点v0到集合V-S中各个顶点vk的最短路径长度:如果dist[j]+arcs[j][k]<dist[k],则令dist[k]=dist[j]+arcs[j][k];
步骤4.2.7、重复步骤4.2.5和步骤4.2.6至集合V-S为空集;
步骤4.2.8、输出数组dist[],其中专家vi与目标专家v0的关联度COR(i)=dist[i]。
进一步地,步骤6所述的计算关联专家词向量与领域词向量的余弦相似度,作为专家领域相似度SIM,具体如下:
步骤6.1、输入由步骤5生成的专家关键词向量模型;
步骤6.2、输入专家关键词集x={x1,x2,...,xm},以及关键词权重集w={w1,w2,...,wm};
步骤6.3、利用专家关键词向量模型计算专家关键词向量集合
步骤6.4、计算专家向量
步骤6.5、输入目标领域关键词,计算目标领域词向量
步骤6.6、计算领域相似度
进一步地,步骤7所述的筛选专家领域相似度SIM与专家关联度COR,满足阈值的专家即为推荐专家,具体如下:
依据用户给定的专家关联度阈值c与领域相似度阈值s,输出满足SIM>s且COR<c的专家信息。
本发明与现有技术相比,其显著优点在于:(1)能够依据用户给定领域关键词与专家姓名,推荐与该专家关联度最紧密的指定领域专家;(2)考虑到专家之间存在的潜在的关联关系,从而快速、全面、准确地找到与自身存在潜在合作价值的期望领域的专家。
附图说明
图1是本发明基于专家领域相似度与关联关系的协同推荐方法的流程示意图。
具体实施方式
下面结合附图和具体实施方式对本发明做进一步的说明。
结合图1,本发明基于专家领域相似度与关联关系的协同推荐方法,包括以下步骤:
步骤1,将批量论文数据作为训练集进行输入;
步骤2,对论文数据进行预处理,包括提取专家合作信息、专家论文关键词、专家论文摘要;对同一篇论文下的合作者建立专家合作信息;
步骤3,将目标专家姓名、目标领域作为输入,获取领域词向量;
步骤4,利用专家合作信息构造合作关系网络,利用Diikstra算法计算作者之间的最短路径,作为专家关联度COR,具体如下:
步骤4.1、根据论文作者列表信息,以作者作为节点,将共同撰写论文的作者用边连接起来,共同撰写论文数的倒数作为边的权重,构造专家合作信息无向加权图G=(V,E);
步骤4.2、利用Diikstra算法计算作者之间的最短路径,作为专家关联度COR,具体步骤如下:
步骤4.2.1、输入专家合作信息无向加权图G=(V,E),输入目标专家姓名作为源点v0
步骤4.2.2、用邻接矩阵arcs表示无向加权图,arcs[m][n]表示边<vm,vn>的权值,若不存在边<vm,vn>,则arcs[m][n]=∞。其中m,n∈{m|vm∈V};
步骤4.2.3、设置集合S记录已求得最短路径的顶点,令集合S初始为{v0};
步骤4.2.4、设置数组dist[]记录从源点v0到其他各个顶点vi的当前最短路径长度,dist[i]初始值为arcs[0][i],其中i∈{i|vi∈V};
步骤4.2.5、从顶点集合V-S中选出vj,满足dist[j]=Min{dist[i]|vi∈V-S},vj就是当前求得的一条从v0出发的最短路径的终点。令集合S=S∪{vj};
步骤4.2.6、修改从源点v0到集合V-S中各个顶点vk的最短路径长度:如果dist[j]+arcs[j][k]<dist[k],则令dist[k]=dist[j]+arcs[j][k];
步骤4.2.7、重复步骤4.2.5和步骤4.2.6至集合V-S为空集;
步骤4.2.8、输出数组dist[],其中专家vi与目标专家v0的关联度COR(i)=dist[i]。
步骤5,利用word2vec训练专家论文中的关键词和摘要,构建专家关键词向量模型;
步骤6,计算关联专家词向量与领域词向量的余弦相似度,作为专家领域相似度SIM,具体如下:
步骤6.1、输入由步骤5生成的专家关键词向量模型;
步骤6.2、输入专家关键词集x={x1,x2,...,xm},以及关键词权重集w={w1,w2,...,wm};
步骤6.3、利用专家关键词向量模型计算专家关键词向量集合
步骤6.4、计算专家向量
步骤6.5、输入目标领域关键词,计算目标领域词向量
步骤6.6、计算领域相似度
步骤7,筛选专家领域相似度SIM与专家关联度COR,满足阈值的专家即为推荐专家,具体如下:
依据用户给定的专家关联度阈值c与领域相似度阈值s,输出满足SIM>s且COR<c的专家信息。
综上所述,本发明能够依据用户给定领域关键词与专家姓名,推荐与该专家关联度最紧密的指定领域专家,从而快速、全面、准确地找到与自身存在潜在合作价值的期望领域的专家。

Claims (4)

1.一种基于专家领域相似度与关联关系的协同推荐方法,其特征在于,包括以下步骤:
步骤1,将批量论文数据作为训练集进行输入;
步骤2,对论文数据进行预处理,包括提取专家合作信息、专家论文关键词、专家论文摘要;对同一篇论文下的合作者建立专家合作信息;
步骤3,将目标专家姓名、目标领域作为输入,获取领域词向量;
步骤4,利用专家合作信息构造合作关系网络,利用Dijkstra算法计算作者之间的最短路径,作为专家关联度COR;
步骤5,利用word2vec训练专家论文中的关键词和摘要,构建专家关键词向量模型;
步骤6,计算关联专家词向量与领域词向量的余弦相似度,作为专家领域相似度SIM;
步骤7,筛选专家领域相似度SIM与专家关联度COR,满足阈值的专家即为推荐专家。
2.根据权利要求1所述的基于专家领域相似度与关联关系的协同推荐方法,其特征在于,步骤4所述的利用专家合作信息构造合作关系网络,利用Dijkstra算法计算作者之间的最短路径,作为专家关联度COR,具体如下:
步骤4.1、根据论文作者列表信息,以作者作为节点,将共同撰写论文的作者用边连接起来,共同撰写论文数的倒数作为边的权重,构造专家合作信息无向加权图G=(V,E);
步骤4.2、利用Dijkstra算法计算作者之间的最短路径,作为专家关联度COR,具体步骤如下:
步骤4.2.1、输入专家合作信息无向加权图G=(V,E),输入目标专家姓名作为源点v0
步骤4.2.2、用邻接矩阵arcs表示无向加权图,arcs[m][n]表示边<vm,vn>的权值,若不存在边<vm,vn>,则arcs[m][n]=∞,其中m,n∈{m|vm∈V};
步骤4.2.3、设置集合S记录已求得最短路径的顶点,令集合S初始为{v0};
步骤4.2.4、设置数组dist[]记录从源点v0到其他各个顶点vi的当前最短路径长度,dist[i]初始值为arcs[0][i],其中i∈{i|vi∈V};
步骤4.2.5、从顶点集合V-S中选出vj,满足dist[j]=Min{dist[i]|vi∈V-S},vj就是当前求得的一条从v0出发的最短路径的终点;令集合S=S∪{vj};
步骤4.2.6、修改从源点v0到集合V-S中各个顶点vk的最短路径长度:如果dist[j]+arcs[j][k]<dist[k],则令dist[k]=dist[j]+arcs[j][k];
步骤4.2.7、重复步骤4.2.5和步骤4.2.6至集合V-S为空集;
步骤4.2.8、输出数组dist[],其中专家vi与目标专家v0的关联度COR(i)=dist[i]。
3.根据权利要求1所述的基于专家领域相似度与关联关系的协同推荐方法,其特征在于,步骤6所述的计算关联专家词向量与领域词向量的余弦相似度,作为专家领域相似度SIM,具体如下:
步骤6.1、输入由步骤5生成的专家关键词向量模型;
步骤6.2、输入专家关键词集X={x1,x2,…,xm},以及关键词权重集W={w1,w2,…,wm};
步骤6.3、利用专家关键词向量模型计算专家关键词向量集合
步骤6.4、计算专家向量
步骤6.5、输入目标领域关键词,计算目标领域词向量
步骤6.6、计算领域相似度
4.根据权利要求1所述的基于专家领域相似度与关联关系的协同推荐方法,其特征在于,步骤7所述的筛选专家领域相似度SIM与专家关联度COR,满足阈值的专家即为推荐专家,具体如下:
依据用户给定的专家关联度阈值c与领域相似度阈值s,输出满足SIM>s且COR<c的专家信息。
CN201811228086.8A 2018-10-19 2018-10-19 一种基于专家领域相似度与关联关系的协同推荐方法 Active CN109308315B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811228086.8A CN109308315B (zh) 2018-10-19 2018-10-19 一种基于专家领域相似度与关联关系的协同推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811228086.8A CN109308315B (zh) 2018-10-19 2018-10-19 一种基于专家领域相似度与关联关系的协同推荐方法

Publications (2)

Publication Number Publication Date
CN109308315A true CN109308315A (zh) 2019-02-05
CN109308315B CN109308315B (zh) 2022-09-16

Family

ID=65225337

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811228086.8A Active CN109308315B (zh) 2018-10-19 2018-10-19 一种基于专家领域相似度与关联关系的协同推荐方法

Country Status (1)

Country Link
CN (1) CN109308315B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110377815A (zh) * 2019-06-06 2019-10-25 创易汇(北京)科技有限公司 一种产学研用推荐系统及方法
CN110442618A (zh) * 2019-07-25 2019-11-12 昆明理工大学 融合专家信息关联关系的卷积神经网络评审专家推荐方法
CN112381381A (zh) * 2020-11-12 2021-02-19 深圳供电局有限公司 一种智能推荐专家的装置
CN113051410A (zh) * 2019-12-27 2021-06-29 南京理工大学 一种基于密度聚类的科研合作团体发现方法
CN113362015A (zh) * 2021-05-10 2021-09-07 北京大学 基于专利数据的合作机构推荐方法及系统
CN116910628A (zh) * 2023-09-12 2023-10-20 联通在线信息科技有限公司 创作者专业度画像评估方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100082356A1 (en) * 2008-09-30 2010-04-01 Yahoo! Inc. System and method for recommending personalized career paths
CN103631859A (zh) * 2013-10-24 2014-03-12 杭州电子科技大学 一种面向科技项目的评审专家智能推荐方法
CN107330727A (zh) * 2017-06-30 2017-11-07 重庆邮电大学 一种基于隐语义模型的个性化推荐方法
US20180020250A1 (en) * 2015-09-08 2018-01-18 Tencent Technology (Shenzhen) Company Limited Recommendation information pushing method, server, and storage medium

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100082356A1 (en) * 2008-09-30 2010-04-01 Yahoo! Inc. System and method for recommending personalized career paths
CN103631859A (zh) * 2013-10-24 2014-03-12 杭州电子科技大学 一种面向科技项目的评审专家智能推荐方法
US20180020250A1 (en) * 2015-09-08 2018-01-18 Tencent Technology (Shenzhen) Company Limited Recommendation information pushing method, server, and storage medium
CN107330727A (zh) * 2017-06-30 2017-11-07 重庆邮电大学 一种基于隐语义模型的个性化推荐方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LI PAN等: "An Algorithm Based on Two-Layer Graph Model for E-Commerce Recommendation", 《2016 INTERNATIONAL CONFERENCE ON IDENTIFICATION, INFORMATION AND KNOWLEDGE IN THE INTERNET OF THINGS (IIKI)》 *
赵海燕等: "结合时间权重与信任关系的协同过滤推荐算法", 《计算机应用研究》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110377815A (zh) * 2019-06-06 2019-10-25 创易汇(北京)科技有限公司 一种产学研用推荐系统及方法
CN110442618A (zh) * 2019-07-25 2019-11-12 昆明理工大学 融合专家信息关联关系的卷积神经网络评审专家推荐方法
CN110442618B (zh) * 2019-07-25 2023-04-18 昆明理工大学 融合专家信息关联关系的卷积神经网络评审专家推荐方法
CN113051410A (zh) * 2019-12-27 2021-06-29 南京理工大学 一种基于密度聚类的科研合作团体发现方法
CN112381381A (zh) * 2020-11-12 2021-02-19 深圳供电局有限公司 一种智能推荐专家的装置
CN112381381B (zh) * 2020-11-12 2023-11-17 深圳供电局有限公司 一种智能推荐专家的装置
CN113362015A (zh) * 2021-05-10 2021-09-07 北京大学 基于专利数据的合作机构推荐方法及系统
CN116910628A (zh) * 2023-09-12 2023-10-20 联通在线信息科技有限公司 创作者专业度画像评估方法及系统
CN116910628B (zh) * 2023-09-12 2024-02-06 联通在线信息科技有限公司 创作者专业度画像评估方法及系统

Also Published As

Publication number Publication date
CN109308315B (zh) 2022-09-16

Similar Documents

Publication Publication Date Title
CN109308315A (zh) 一种基于专家领域相似度与关联关系的协同推荐方法
CN110543574B (zh) 一种知识图谱的构建方法、装置、设备及介质
CN106776711B (zh) 一种基于深度学习的中文医学知识图谱构建方法
CN104915340B (zh) 自然语言问答方法及装置
CN110704743B (zh) 一种基于知识图谱的语义搜索方法及装置
CN104615767B (zh) 搜索排序模型的训练方法、搜索处理方法及装置
CN102929873B (zh) 一种基于情境搜索提取搜索价值词的方法及装置
WO2020143314A1 (zh) 一种基于搜索引擎的问答方法、装置、存储介质及计算机设备
CN105528437B (zh) 一种基于结构化文本知识提取的问答系统构建方法
US10437868B2 (en) Providing images for search queries
WO2016197767A2 (zh) 一种表情输入方法、装置、终端和计算机可读存储介质
CN104462327B (zh) 语句相似度的计算、搜索处理方法及装置
CN106372122B (zh) 一种基于维基语义匹配的文档分类方法及系统
CN106294418B (zh) 检索方法和检索系统
CN108710611A (zh) 一种基于词网络和词向量的短文本主题模型生成方法
CN109992766A (zh) 提取目标词的方法和装置
CN109492082A (zh) 下拉词推荐方法、装置、电子设备及存储介质
CN107943919A (zh) 一种面向会话式实体搜索的查询扩展方法
CN104714940A (zh) 智能交互系统中未登录词的识别方法和装置
CN103927342A (zh) 基于大数据的垂直搜索引擎系统
CN103064907A (zh) 基于无监督的实体关系抽取的主题元搜索系统及方法
CN105426382B (zh) 一种基于Personal Rank的情绪上下文感知的音乐推荐方法
CN105808688A (zh) 基于人工智能的补全检索方法及装置
Ronghui et al. Application of Improved Convolutional Neural Network in Text Classification.
CN112307200A (zh) 情感属性获取方法、装置、设备、及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Li Qianmu

Inventor after: Chen Shengzhi

Inventor after: Liu Yijing

Inventor before: Chen Shengzhi

Inventor before: Li Qianmu

Inventor before: Liu Yijing

CB03 Change of inventor or designer information
GR01 Patent grant
GR01 Patent grant