CN110874406B - 一种为预印本网络中拟投稿的论文推荐合适期刊及审稿人的方法 - Google Patents
一种为预印本网络中拟投稿的论文推荐合适期刊及审稿人的方法 Download PDFInfo
- Publication number
- CN110874406B CN110874406B CN201911130977.4A CN201911130977A CN110874406B CN 110874406 B CN110874406 B CN 110874406B CN 201911130977 A CN201911130977 A CN 201911130977A CN 110874406 B CN110874406 B CN 110874406B
- Authority
- CN
- China
- Prior art keywords
- node
- similarity
- nodes
- network
- arxiv
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 239000011159 matrix material Substances 0.000 claims abstract description 35
- 238000005295 random walk Methods 0.000 claims abstract description 23
- 230000008447 perception Effects 0.000 claims abstract description 20
- 239000013598 vector Substances 0.000 claims abstract description 17
- 230000005012 migration Effects 0.000 claims abstract description 11
- 238000013508 migration Methods 0.000 claims abstract description 11
- 230000008569 process Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000002123 temporal effect Effects 0.000 claims description 3
- 230000007704 transition Effects 0.000 claims description 3
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种为预印本网络中拟投稿的论文推荐合适期刊及审稿人的方法,先获取预印本网络arXiv和DBLP文献网络,将这两个网络中同名论文通过锚链接进行对齐,得到两个对齐的文献网络;采用面向文献网络的随机游走策略,得到随机游走下所有分属于DBLP和arXiv的节点对之间节点相似度,再采用锚节点下的节点相似度迁移策略,将DBLP中的信息迁移到arXiv中,最后在两个对齐的文献网络中,计算时间感知矩阵TM,根据TM来计算节点间带时间感知的相似度矩阵M,通过M得到arXiv中待审稿论文和各期刊间相似度向量V,得到为预印本网络中拟投稿的论文推荐的合适期刊及审稿人的列表。本发明考虑到了网络的拓扑结构信息、节点的语义信息,从而使得最后的推荐结果更为合理。
Description
技术领域
本发明涉及信息检索领域,特别是一种为预印本网络中拟投稿的论文推荐合适期刊及审稿人的方法。
背景技术
随着预印本网络在各个学科的普及,催生了用户在使用它们时的各种需求。比如,为预印本网络中尚未正式发表的预印本推荐合适的期刊及审稿人。文献网络中的推荐问题本质上是网络科学研究中的关系预测问题,也就是预测并不存在链接的节点之间将来是否存在出现链接关系的可能性。
预印本网络arXiv和经典文献网络DBLP并不是信息孤岛,部分对象往往同时存在于arXiv和DBLP之中,找到这些对象,关联arXiv和DBLP,这些对象间将通过锚链接标记为同一对象,而被关联的网络则称为对齐网络。
预印本网络arXiv的论文储量比经典的文献网络少很多,且缺少较完整的期刊信息,许多论文都是尚未正式发表的,文章质量难以直接判别,整体上信息不够完备,文献网络DBLP经典,通过两者之间共同的论文实现桥接,可以充分利用DBLP中完备的论文和期刊信息,从而提升为arXiv网络中未发表论文推荐合适期刊及审稿人的质量。
发明内容
有鉴于此,本发明的目的是提供一种为预印本网络中拟投稿的论文推荐合适期刊及审稿人的方法,该方法在网络的拓扑结构信息、节点的语义信息的基础上,考虑到了节点的时间属性不同会影响到关系预测结果,引入了时间因素,可提升为arXiv网络中未发表论文推荐合适期刊及审稿人的质量。
本发明采用以下方案实现:一种为预印本网络中拟投稿的论文推荐合适期刊及审稿人的方法,包括如下步骤:
步骤S1:获取预印本网络arXiv和DBLP文献网络,将这两个网络中同名论文通过锚链接进行对齐,得到两个对齐的文献网络;
步骤S2:结合所述两个对齐的文献网络及面向文献网络的随机游走策略,学习arXiv中的节点经由单向锚链接到达DBLP节点的转移概率,并得到随机游走下所有分属于arXiv和DBLP的节点对之间节点相似度;
步骤S3:在所述两个对齐的文献网络中,采用锚节点下的节点相似度迁移策略,将DBLP中的信息迁移到arXiv中;
步骤S4:在所述两个对齐的文献网络中,计算节点间相似度矩阵SM,并根据节点之间的时间感知权重来计算时间感知矩阵TM;
步骤S5:根据SM和TM来计算节点间带时间感知的相似度矩阵M,通过M得到arXiv中待审稿论文和各期刊及各审稿人间相似度向量Mi,从而得到为预印本网络中拟投稿的论文推荐的合适期刊及审稿人的列表。
进一步地,步骤S2中所述计算随机游走下所有分属于DBLP和arXiv的节点对之间节点相似度,具体包括以下步骤:
步骤SA:根据边的边介数和节点的邻居集,计算出文献网络中边类型权重及边权重;
步骤SB:根据步骤SA中边类型权重及边权重计算每一个游走点选择其邻居节点的概率;
步骤SC:根据步骤SB中概率计算随机游走下所有分属于DBLP和arXiv的节点对之间节点相似度。
进一步地,所述步骤SA具体包括以下内容:
步骤SA1:令类型为Rst的边集合为ξst,则Rst的边类型权重为:
进一步地,步骤SB中所述计算每一个游走点选择其邻居节点的概率的计算过程如下:
进一步地,所述步骤SC具体包括以下步骤:
表示从vi到vj游走t步内到达的概率,该概率从P推出,定义为:
步骤SC2:行走t步后,vi到vj之间的相似度定义为:
步骤SC3:叠加多个游走点得到的vi到vj之间的相似度定义为:
进一步地,所述步骤S3具体包括以下步骤:
进一步地,步骤S4中所述计算时间感知矩阵TM和节点间相似度矩阵SM的过程如下:
步骤S45:时间感知矩阵TM定义为:
步骤S46:在对齐文献网络中,当节点和属于同一网络时,它们之间的相似度为基于元结构相关程度的网络表示学习得到的低维向量的余弦相似度;当和属于不同网络,且节点间存在锚链接时,它们之间的相似度为1;当和属于不同网络,且节点间不存在锚链接,同时属于arXiv的节点不存在对齐的锚节点时,它们的相似度为通过基于随机游走得到的相似度值;当和属于不同网络,节点间不存在锚链接,但属于arXiv的节点存在对齐的锚节点时,它们的相似度引入基于锚节点的相似度迁移,为通过随机游走到达得到的相似度值。即节点间相似度矩阵SM可定义为:
进一步地,所述步骤S5具体包括以下步骤:
步骤S51:根据对齐网络的节点间相似度矩阵SM和TM,计算带时间感知的相似度矩阵M:
步骤S52:Mi即为相似度向量,其中各元素表示论文节点vi和各期刊及各审稿人间的相似度,从而得到为预印本网络中拟投稿的论文推荐的合适期刊及审稿人的列表。
与现有技术相比,本发明具有以下有益效果:
本发明考虑到了网络的拓扑结构信息、节点的语义信息,这种比在arXiv中为拟投稿论文推荐合适期刊及审稿人的方法更合理,并且考虑到了节点的时间属性不同会影响到关系预测结果,引入了时间因素,可提升为arXiv网络中未发表论文推荐合适期刊及审稿人的质量。
附图说明
图1为本发明实施例的流程图。
图2为本发明实施例的DBLP网络模式图。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
如图1、2所示,本实施例提供一种为预印本网络中拟投稿的论文推荐合适期刊及审稿人的方法,包括如下步骤:
步骤S1:获取预印本网络arXiv和DBLP文献网络,将这两个网络中同名论文通过锚链接进行对齐,得到两个对齐的文献网络;
步骤S2:结合所述两个对齐的文献网络及面向文献网络的随机游走策略,学习arXiv中的节点经由单向锚链接到达DBLP节点的转移概率,并得到随机游走下所有分属于arXiv和DBLP的节点对之间节点相似度;
步骤S3:在所述两个对齐的文献网络中,采用锚节点下的节点相似度迁移策略,将DBLP中的信息迁移到arXiv中;
步骤S4:在所述两个对齐的文献网络中,计算节点间相似度矩阵SM,并根据节点之间的时间感知权重来计算时间感知矩阵TM;
步骤S5:根据SM和TM来计算节点间带时间感知的相似度矩阵M,通过M得到arXiv中待审稿论文和各期刊及各审稿人间相似度向量Mi,从而得到为预印本网络中拟投稿的论文推荐的合适期刊及审稿人的列表。
在本实施例中,步骤S2中所述计算随机游走下所有分属于DBLP和arXiv的节点对之间节点相似度,具体包括以下步骤:
步骤SA:根据边的边介数和节点的邻居集,计算出文献网络中边类型权重及边权重;
步骤SB:根据步骤SA中边类型权重及边权重计算每一个游走点选择其邻居节点的概率,即先根据边类型权重选择要游走的边类型R,再根据边权重从R类型的邻接边集中选择一条边进行游走;
步骤SC:根据步骤SB中概率计算随机游走下所有分属于DBLP和arXiv的节点对之间节点相似度。
在本实施例中,所述步骤SA具体包括以下内容:
步骤SA1:令类型为Rst的边集合为ξst,则Rst的边类型权重为:
在本实施例中,步骤SB中所述计算每一个游走点选择其邻居节点的概率的计算过程如下:
在本实施例中,所述步骤SC具体包括以下步骤:
步骤SC2:行走t步后,vi到vj之间的相似度定义为:
步骤SC3:叠加多个游走点得到的vi到vj之间的相似度定义为:
在本实施例中,所述采用锚节点下的节点相似度迁移策略的具体内容为:对于arXiv中的节点当它在DBLP中存在对齐的锚节点时,若要预测与G2中节点形成关系的可能性时,由于与处于同一个网络中,从游走到的结果比之从游走到的结果更具参考性,将游走到的节点相似度作为与之间的相似度
所述步骤S3具体包括以下步骤:
在本实施例中,步骤S4中所述计算时间感知矩阵TM和节点间相似度矩阵SM的过程如下:
步骤S45:时间感知矩阵TM定义为:
步骤S46:在对齐文献网络中,当节点和属于同一网络时,它们之间的相似度为基于元结构相关程度的网络表示学习得到的低维向量的余弦相似度;当和属于不同网络,且节点间存在锚链接时,它们之间的相似度为1;当和属于不同网络,且节点间不存在锚链接,同时属于arXiv的节点不存在对齐的锚节点时,它们的相似度为通过基于随机游走得到的相似度值;当和属于不同网络,节点间不存在锚链接,但属于arXiv的节点存在对齐的锚节点时,它们的相似度引入基于锚节点的相似度迁移,为通过随机游走到达得到的相似度值。即节点间相似度矩阵SM可定义为:
在本实施例中,所述步骤S5具体包括以下步骤:
步骤S51:根据对齐网络的节点间相似度矩阵SM和TM,计算带时间感知的相似度矩阵M:
步骤S52:Mi即为相似度向量,其中各元素表示论文节点vi和各期刊及各审稿人间的相似度,从而得到为预印本网络中拟投稿的论文推荐的合适期刊及审稿人的列表。
较佳的,在本实施例中步骤S1的原理如下:
结合结构信息与属性信息对节点进行表示,在此基础上采用局部敏感哈希来进行锚链接预测,并通过边界约束、平衡约束、最大相似度优化函数来对冗余链接进行修剪,可将arXiv和DBLP文献网络通过单向锚链接对齐,得到两个对齐的文献网络。
以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。
Claims (7)
1.一种为预印本网络中拟投稿的论文推荐合适期刊及审稿人的方法,其特征在于:包括如下步骤:
步骤S1:获取预印本网络arXiv和DBLP文献网络,将这两个网络中同名论文通过锚链接进行对齐,得到两个对齐的文献网络;
步骤S2:结合所述两个对齐的文献网络及面向文献网络的随机游走策略,学习arXiv中的节点经由单向锚链接到达DBLP节点的转移概率,并得到随机游走下所有分属于arXiv和DBLP的节点对之间节点相似度;
步骤S3:在所述两个对齐的文献网络中,采用锚节点下的节点相似度迁移策略,将DBLP中的信息迁移到arXiv中;
步骤S4:在所述两个对齐的文献网络中,计算节点间相似度矩阵SM,并根据节点之间的时间感知权重来计算时间感知矩阵TM;
步骤S5:根据SM和TM来计算节点间带时间感知的相似度矩阵M,通过M得到arXiv中待审稿论文和各期刊及各审稿人间相似度向量Mi,从而得到为预印本网络中拟投稿的论文推荐的合适期刊及审稿人的列表;
步骤S4中所述计算时间感知矩阵TM和节点间相似度矩阵SM的过程如下:
步骤S45:时间感知矩阵TM定义为:
步骤S46:在对齐文献网络中,当节点和属于同一网络时,它们之间的相似度为基于元结构相关程度的网络表示学习得到的低维向量的余弦相似度;当和属于不同网络,且节点间存在锚链接时,它们之间的相似度为1;当和属于不同网络,且节点间不存在锚链接,同时属于arXiv的节点不存在对齐的锚节点时,它们的相似度为通过基于随机游走得到的相似度值;当和属于不同网络,节点间不存在锚链接,但属于arXiv的节点存在对齐的锚节点时,它们的相似度引入基于锚节点的相似度迁移,为通过随机游走到达得到的相似度值;即节点间相似度矩阵SM可定义为:
2.根据权利要求1所述的一种为预印本网络中拟投稿的论文推荐合适期刊及审稿人的方法,其特征在于:步骤S2中所述得到随机游走下所有分属于DBLP和arXiv的节点对之间节点相似度,具体包括以下步骤:
步骤SA:根据边的边介数和节点的邻居集,计算出文献网络中边类型权重及边权重;
步骤SB:根据步骤SA中边类型权重及边权重计算每一个游走点选择其邻居节点的概率;
步骤SC:根据步骤SB中概率计算随机游走下所有分属于DBLP和arXiv的节点对之间节点相似度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911130977.4A CN110874406B (zh) | 2019-11-18 | 2019-11-18 | 一种为预印本网络中拟投稿的论文推荐合适期刊及审稿人的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911130977.4A CN110874406B (zh) | 2019-11-18 | 2019-11-18 | 一种为预印本网络中拟投稿的论文推荐合适期刊及审稿人的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110874406A CN110874406A (zh) | 2020-03-10 |
CN110874406B true CN110874406B (zh) | 2022-06-14 |
Family
ID=69717125
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911130977.4A Expired - Fee Related CN110874406B (zh) | 2019-11-18 | 2019-11-18 | 一种为预印本网络中拟投稿的论文推荐合适期刊及审稿人的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110874406B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114154478B (zh) * | 2022-02-07 | 2022-07-05 | 杭州未名信科科技有限公司 | 一种论文审稿人确定方法和系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104133843A (zh) * | 2014-06-25 | 2014-11-05 | 福州大学 | 科技文献异构网络中节点的学术影响力协同排序方法 |
CN110069726A (zh) * | 2019-04-26 | 2019-07-30 | 福州大学 | 一种适用于DBLP与arXiv的文献网络间锚链接关系预测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9654378B2 (en) * | 2013-10-24 | 2017-05-16 | Sas Institute Inc. | Link addition to a network of linked nodes |
-
2019
- 2019-11-18 CN CN201911130977.4A patent/CN110874406B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104133843A (zh) * | 2014-06-25 | 2014-11-05 | 福州大学 | 科技文献异构网络中节点的学术影响力协同排序方法 |
CN110069726A (zh) * | 2019-04-26 | 2019-07-30 | 福州大学 | 一种适用于DBLP与arXiv的文献网络间锚链接关系预测方法 |
Non-Patent Citations (1)
Title |
---|
基于叠加随机游走的复杂网络节点重要度评估方法;宋琛,尹波,张贤坤;《信息工程大学学报》;20161215;第17卷(第6期);第730-759页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110874406A (zh) | 2020-03-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chunaev | Community detection in node-attributed social networks: a survey | |
Amini et al. | A boosting algorithm for learning bipartite ranking functions with partially labeled data | |
Madani et al. | Social collaborative filtering approach for recommending courses in an E-learning platform | |
CN108228728B (zh) | 一种参数化的论文网络节点表示学习方法 | |
CN110781319A (zh) | 跨媒体大数据的公共语义表示、搜索方法和装置 | |
CN107391542A (zh) | 一种基于文件知识图谱的开源软件社区专家推荐方法 | |
CN114265986B (zh) | 一种融合知识图谱结构与路径语义的信息推送方法和系统 | |
Bagavathi et al. | Multi-net: a scalable multiplex network embedding framework | |
CN102012911A (zh) | 基于约束优化的专家匹配方法及系统 | |
CN116431914A (zh) | 一种基于个性化偏好转移模型的跨域推荐方法及系统 | |
CN110874406B (zh) | 一种为预印本网络中拟投稿的论文推荐合适期刊及审稿人的方法 | |
Askari-Sichani et al. | Large-scale global optimization through consensus of opinions over complex networks | |
Wijayanto et al. | Implementation of multi-criteria collaborative filtering on cluster using Apache Spark | |
CN113228059A (zh) | 面向跨网络的表示学习算法 | |
CN111078859A (zh) | 一种基于引用次数的作者推荐方法 | |
Gaikwad et al. | Cohort intelligence and genetic algorithm along with modified analytical hierarchy process to recommend an ice cream to diabetic patient | |
Gaikwad et al. | Cohort Intelligence and Genetic Algorithm along with AHP to recommend an Ice Cream to a Diabetic Patient | |
Singh et al. | Friend Recommendation System in a Social Network based on Link Prediction Framework using Deep Neural Network | |
Di Puglia Pugliese et al. | Dynamic programming for spanning tree problems: application to the multi-objective case | |
Hao et al. | Enhancing cross domain recommendation with domain dependent tags | |
Thirunavukarasu et al. | People to people recommendation using coupled nonnegative boolean matrix factorization | |
CN112347369B (zh) | 基于网络表征的集成学习动态社会网络链路预测方法 | |
Li et al. | DTCMF: Dynamic trust-based context-aware matrix factorization for collaborative filtering | |
Pujahari et al. | A new grouping method based on social choice strategies for group recommender system | |
Walker et al. | Social‐trust‐aware variational recommendation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20220614 |