CN110874406B - 一种为预印本网络中拟投稿的论文推荐合适期刊及审稿人的方法 - Google Patents

一种为预印本网络中拟投稿的论文推荐合适期刊及审稿人的方法 Download PDF

Info

Publication number
CN110874406B
CN110874406B CN201911130977.4A CN201911130977A CN110874406B CN 110874406 B CN110874406 B CN 110874406B CN 201911130977 A CN201911130977 A CN 201911130977A CN 110874406 B CN110874406 B CN 110874406B
Authority
CN
China
Prior art keywords
node
similarity
nodes
network
arxiv
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201911130977.4A
Other languages
English (en)
Other versions
CN110874406A (zh
Inventor
余春艳
陈璐
兰婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuzhou University
Original Assignee
Fuzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuzhou University filed Critical Fuzhou University
Priority to CN201911130977.4A priority Critical patent/CN110874406B/zh
Publication of CN110874406A publication Critical patent/CN110874406A/zh
Application granted granted Critical
Publication of CN110874406B publication Critical patent/CN110874406B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种为预印本网络中拟投稿的论文推荐合适期刊及审稿人的方法,先获取预印本网络arXiv和DBLP文献网络,将这两个网络中同名论文通过锚链接进行对齐,得到两个对齐的文献网络;采用面向文献网络的随机游走策略,得到随机游走下所有分属于DBLP和arXiv的节点对之间节点相似度,再采用锚节点下的节点相似度迁移策略,将DBLP中的信息迁移到arXiv中,最后在两个对齐的文献网络中,计算时间感知矩阵TM,根据TM来计算节点间带时间感知的相似度矩阵M,通过M得到arXiv中待审稿论文和各期刊间相似度向量V,得到为预印本网络中拟投稿的论文推荐的合适期刊及审稿人的列表。本发明考虑到了网络的拓扑结构信息、节点的语义信息,从而使得最后的推荐结果更为合理。

Description

一种为预印本网络中拟投稿的论文推荐合适期刊及审稿人的 方法
技术领域
本发明涉及信息检索领域,特别是一种为预印本网络中拟投稿的论文推荐合适期刊及审稿人的方法。
背景技术
随着预印本网络在各个学科的普及,催生了用户在使用它们时的各种需求。比如,为预印本网络中尚未正式发表的预印本推荐合适的期刊及审稿人。文献网络中的推荐问题本质上是网络科学研究中的关系预测问题,也就是预测并不存在链接的节点之间将来是否存在出现链接关系的可能性。
预印本网络arXiv和经典文献网络DBLP并不是信息孤岛,部分对象往往同时存在于arXiv和DBLP之中,找到这些对象,关联arXiv和DBLP,这些对象间将通过锚链接标记为同一对象,而被关联的网络则称为对齐网络。
预印本网络arXiv的论文储量比经典的文献网络少很多,且缺少较完整的期刊信息,许多论文都是尚未正式发表的,文章质量难以直接判别,整体上信息不够完备,文献网络DBLP经典,通过两者之间共同的论文实现桥接,可以充分利用DBLP中完备的论文和期刊信息,从而提升为arXiv网络中未发表论文推荐合适期刊及审稿人的质量。
发明内容
有鉴于此,本发明的目的是提供一种为预印本网络中拟投稿的论文推荐合适期刊及审稿人的方法,该方法在网络的拓扑结构信息、节点的语义信息的基础上,考虑到了节点的时间属性不同会影响到关系预测结果,引入了时间因素,可提升为arXiv网络中未发表论文推荐合适期刊及审稿人的质量。
本发明采用以下方案实现:一种为预印本网络中拟投稿的论文推荐合适期刊及审稿人的方法,包括如下步骤:
步骤S1:获取预印本网络arXiv和DBLP文献网络,将这两个网络中同名论文通过锚链接进行对齐,得到两个对齐的文献网络;
步骤S2:结合所述两个对齐的文献网络及面向文献网络的随机游走策略,学习arXiv中的节点经由单向锚链接到达DBLP节点的转移概率,并得到随机游走下所有分属于arXiv和DBLP的节点对之间节点相似度;
步骤S3:在所述两个对齐的文献网络中,采用锚节点下的节点相似度迁移策略,将DBLP中的信息迁移到arXiv中;
步骤S4:在所述两个对齐的文献网络中,计算节点间相似度矩阵SM,并根据节点之间的时间感知权重来计算时间感知矩阵TM;
步骤S5:根据SM和TM来计算节点间带时间感知的相似度矩阵M,通过M得到arXiv中待审稿论文和各期刊及各审稿人间相似度向量Mi,从而得到为预印本网络中拟投稿的论文推荐的合适期刊及审稿人的列表。
进一步地,步骤S2中所述计算随机游走下所有分属于DBLP和arXiv的节点对之间节点相似度,具体包括以下步骤:
步骤SA:根据边的边介数和节点的邻居集,计算出文献网络中边类型权重及边权重;
步骤SB:根据步骤SA中边类型权重及边权重计算每一个游走点选择其邻居节点的概率;
步骤SC:根据步骤SB中概率计算随机游走下所有分属于DBLP和arXiv的节点对之间节点相似度。
进一步地,所述步骤SA具体包括以下内容:
步骤SA1:令类型为Rst的边集合为ξst,则Rst的边类型权重为:
Figure BDA0002277803240000031
其中
Figure BDA0002277803240000032
为边eij的边介数;对一个具体的Qs类型的节点vi而言,令从Qs到其所有类型的邻居节点的边类型集合为Γ,则从vi沿Rst类型边游走的边类型权重为:
Figure BDA0002277803240000033
步骤SA2:令
Figure BDA0002277803240000034
表示节点vi的Qt类型的邻居集,则从vi游走到
Figure BDA0002277803240000035
中每个节点的概率是相等的;因此,vi
Figure BDA0002277803240000036
中的任一节点vj的边权重为:
Figure BDA0002277803240000037
进一步地,步骤SB中所述计算每一个游走点选择其邻居节点的概率的计算过程如下:
Qs类型的节点vi选择Qt类型的邻居节点vj进行游走的概率
Figure BDA0002277803240000038
为:
Figure BDA0002277803240000039
其中,WRst表示Rst类型边的边类型权重;
Figure BDA00022778032400000310
表示vi和vj之间的边eij的边权重。
进一步地,所述步骤SC具体包括以下步骤:
步骤SC1:由
Figure BDA00022778032400000311
的矩阵公式得到节点间游走一步到达的概率矩阵P,令
Figure BDA00022778032400000312
表示从vi到vj游走t步内到达的概率,该概率从P推出,定义为:
Figure BDA00022778032400000313
其中PT是矩阵P的转置,
Figure BDA00022778032400000314
是一个n*1维的向量,第i个值为1;
步骤SC2:行走t步后,vi到vj之间的相似度定义为:
Figure BDA0002277803240000041
步骤SC3:叠加多个游走点得到的vi到vj之间的相似度定义为:
Figure BDA0002277803240000042
进一步地,所述步骤S3具体包括以下步骤:
步骤S31:给定arXiv中的节点
Figure BDA0002277803240000043
DBLP中的节点
Figure BDA0002277803240000044
若在DBLP中有对应锚节点
Figure BDA0002277803240000045
根据随机游走策略计算得到
Figure BDA0002277803240000046
的锚节点
Figure BDA0002277803240000047
Figure BDA0002277803240000048
间的节点相似度
Figure BDA0002277803240000049
步骤S32:将
Figure BDA00022778032400000410
游走到
Figure BDA00022778032400000411
的节点相似度
Figure BDA00022778032400000412
作为
Figure BDA00022778032400000413
Figure BDA00022778032400000414
之间的相似度
Figure BDA00022778032400000415
用以实现将DBLP中的信息迁移到arXiv中。
进一步地,步骤S4中所述计算时间感知矩阵TM和节点间相似度矩阵SM的过程如下:
步骤S41:若论文
Figure BDA00022778032400000416
在时间timelink发表在期刊/会议
Figure BDA00022778032400000417
Figure BDA00022778032400000418
节点与
Figure BDA00022778032400000419
节点之间的时间感知权重定义为:
Figure BDA00022778032400000420
其中
Figure BDA00022778032400000421
Figure BDA00022778032400000422
节点与
Figure BDA00022778032400000423
节点在时间timelink产生链接的关系,timecurrent表示当前时间,μ是预设的衰减参;
步骤S42:若论文
Figure BDA00022778032400000424
在时间timelink由作者
Figure BDA00022778032400000425
撰写,则
Figure BDA00022778032400000426
节点与
Figure BDA00022778032400000427
节点之间的时间感知权重定义为:
Figure BDA00022778032400000428
其中
Figure BDA00022778032400000429
Figure BDA00022778032400000430
节点与
Figure BDA00022778032400000431
节点在时间timelink产生链接的关系;
步骤S43:若发表于时间timelink的论文
Figure BDA00022778032400000432
中包括主题
Figure BDA00022778032400000433
Figure BDA00022778032400000434
节点与
Figure BDA00022778032400000435
节点之间的时间感知权重定义为:
Figure BDA00022778032400000436
其中
Figure BDA0002277803240000051
Figure BDA0002277803240000052
节点与
Figure BDA0002277803240000053
节点在时间timelink产生链接的关系;
步骤S44:若网络间的节点即论文节点
Figure BDA0002277803240000054
Figure BDA0002277803240000055
在时间timelink产生锚链接关系,则
Figure BDA0002277803240000056
节点与
Figure BDA0002277803240000057
节点之间的时间感知权重定义为:
Figure BDA0002277803240000058
其中
Figure BDA0002277803240000059
Figure BDA00022778032400000526
节点与
Figure BDA00022778032400000510
节点在时间timelink产生链接的关系;
步骤S45:时间感知矩阵TM定义为:
Figure BDA00022778032400000511
步骤S46:在对齐文献网络中,当节点
Figure BDA00022778032400000512
Figure BDA00022778032400000513
属于同一网络时,它们之间的相似度为基于元结构相关程度的网络表示学习得到的低维向量的余弦相似度;当
Figure BDA00022778032400000514
Figure BDA00022778032400000515
属于不同网络,且节点间存在锚链接时,它们之间的相似度为1;当
Figure BDA00022778032400000516
Figure BDA00022778032400000517
属于不同网络,且节点间不存在锚链接,同时属于arXiv的节点
Figure BDA00022778032400000518
不存在对齐的锚节点时,它们的相似度为
Figure BDA00022778032400000519
通过基于随机游走得到的相似度值;当
Figure BDA00022778032400000520
Figure BDA00022778032400000521
属于不同网络,节点间不存在锚链接,但属于arXiv的节点
Figure BDA00022778032400000522
存在对齐的锚节点
Figure BDA00022778032400000523
时,它们的相似度引入基于锚节点的相似度迁移,为
Figure BDA00022778032400000524
通过随机游走到达
Figure BDA00022778032400000525
得到的相似度值。即节点间相似度矩阵SM可定义为:
Figure BDA0002277803240000061
其中
Figure BDA0002277803240000062
表示节点
Figure BDA0002277803240000063
Figure BDA0002277803240000064
分别对应的向量
Figure BDA0002277803240000065
Figure BDA0002277803240000066
的余弦相似度。V1表示网络G1的节点集,V2表示网络G2的节点集,
Figure BDA0002277803240000067
表示网络G1和G2之间的锚链接集。
进一步地,所述步骤S5具体包括以下步骤:
步骤S51:根据对齐网络的节点间相似度矩阵SM和TM,计算带时间感知的相似度矩阵M:
Figure BDA0002277803240000068
其中,
Figure BDA0002277803240000069
表示TM与SM的元素间的哈达玛积。
步骤S52:Mi即为相似度向量,其中各元素表示论文节点vi和各期刊及各审稿人间的相似度,从而得到为预印本网络中拟投稿的论文推荐的合适期刊及审稿人的列表。
与现有技术相比,本发明具有以下有益效果:
本发明考虑到了网络的拓扑结构信息、节点的语义信息,这种比在arXiv中为拟投稿论文推荐合适期刊及审稿人的方法更合理,并且考虑到了节点的时间属性不同会影响到关系预测结果,引入了时间因素,可提升为arXiv网络中未发表论文推荐合适期刊及审稿人的质量。
附图说明
图1为本发明实施例的流程图。
图2为本发明实施例的DBLP网络模式图。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
如图1、2所示,本实施例提供一种为预印本网络中拟投稿的论文推荐合适期刊及审稿人的方法,包括如下步骤:
步骤S1:获取预印本网络arXiv和DBLP文献网络,将这两个网络中同名论文通过锚链接进行对齐,得到两个对齐的文献网络;
步骤S2:结合所述两个对齐的文献网络及面向文献网络的随机游走策略,学习arXiv中的节点经由单向锚链接到达DBLP节点的转移概率,并得到随机游走下所有分属于arXiv和DBLP的节点对之间节点相似度;
步骤S3:在所述两个对齐的文献网络中,采用锚节点下的节点相似度迁移策略,将DBLP中的信息迁移到arXiv中;
步骤S4:在所述两个对齐的文献网络中,计算节点间相似度矩阵SM,并根据节点之间的时间感知权重来计算时间感知矩阵TM;
步骤S5:根据SM和TM来计算节点间带时间感知的相似度矩阵M,通过M得到arXiv中待审稿论文和各期刊及各审稿人间相似度向量Mi,从而得到为预印本网络中拟投稿的论文推荐的合适期刊及审稿人的列表。
在本实施例中,步骤S2中所述计算随机游走下所有分属于DBLP和arXiv的节点对之间节点相似度,具体包括以下步骤:
步骤SA:根据边的边介数和节点的邻居集,计算出文献网络中边类型权重及边权重;
步骤SB:根据步骤SA中边类型权重及边权重计算每一个游走点选择其邻居节点的概率,即先根据边类型权重选择要游走的边类型R,再根据边权重从R类型的邻接边集中选择一条边进行游走;
步骤SC:根据步骤SB中概率计算随机游走下所有分属于DBLP和arXiv的节点对之间节点相似度。
在本实施例中,所述步骤SA具体包括以下内容:
步骤SA1:令类型为Rst的边集合为ξst,则Rst的边类型权重为:
Figure BDA0002277803240000081
其中
Figure BDA0002277803240000082
为边eij的边介数;对一个具体的Qs类型的节点vi而言,令从Qs到其所有类型的邻居节点的边类型集合为Γ,则从vi沿Rst类型边游走的边类型权重为:
Figure BDA0002277803240000083
步骤SA2:令
Figure BDA0002277803240000084
表示节点vi的Qt类型的邻居集,则从vi游走到
Figure BDA0002277803240000085
中每个节点的概率是相等的;因此,vi
Figure BDA0002277803240000086
中的任一节点vj的边权重为:
Figure BDA0002277803240000091
在本实施例中,步骤SB中所述计算每一个游走点选择其邻居节点的概率的计算过程如下:
Qs类型的节点vi选择Qt类型的邻居节点vj进行游走的概率
Figure BDA0002277803240000092
为:
Figure BDA0002277803240000093
其中,WRst表示Rst类型边的边类型权重;
Figure BDA0002277803240000094
表示vi和vj之间的边eij的边权重。
在本实施例中,所述步骤SC具体包括以下步骤:
步骤SC1:由
Figure BDA0002277803240000095
的矩阵公式得到节点间游走一步到达的概率矩阵P,令
Figure BDA0002277803240000096
表示从vi到vj游走t步内到达的概率,该概率从P推出,定义为:
Figure BDA0002277803240000097
其中PT是矩阵P的转置,
Figure BDA0002277803240000098
是一个n*1维的向量,第i个值为1;
步骤SC2:行走t步后,vi到vj之间的相似度定义为:
Figure BDA0002277803240000099
步骤SC3:叠加多个游走点得到的vi到vj之间的相似度定义为:
Figure BDA00022778032400000910
在本实施例中,所述采用锚节点下的节点相似度迁移策略的具体内容为:对于arXiv中的节点
Figure BDA00022778032400000911
当它在DBLP中存在对齐的锚节点
Figure BDA00022778032400000912
时,若要预测
Figure BDA00022778032400000913
与G2中节点
Figure BDA00022778032400000914
形成关系的可能性时,由于
Figure BDA00022778032400000915
Figure BDA00022778032400000916
处于同一个网络中,从
Figure BDA00022778032400000917
游走到
Figure BDA00022778032400000918
的结果比之从
Figure BDA00022778032400000919
游走到
Figure BDA00022778032400000920
的结果更具参考性,将
Figure BDA00022778032400000921
游走到
Figure BDA00022778032400000922
的节点相似度
Figure BDA00022778032400000923
作为
Figure BDA00022778032400000924
Figure BDA00022778032400000925
之间的相似度
Figure BDA00022778032400000926
所述步骤S3具体包括以下步骤:
步骤S31:给定arXiv中的节点
Figure BDA0002277803240000101
DBLP中的节点
Figure BDA0002277803240000102
若在DBLP中有对应锚节点
Figure BDA0002277803240000103
根据随机游走策略计算得到
Figure BDA0002277803240000104
的锚节点
Figure BDA0002277803240000105
Figure BDA0002277803240000106
间的节点相似度
Figure BDA0002277803240000107
步骤S32:将
Figure BDA0002277803240000108
游走到
Figure BDA0002277803240000109
的节点相似度
Figure BDA00022778032400001010
作为
Figure BDA00022778032400001011
Figure BDA00022778032400001012
之间的相似度
Figure BDA00022778032400001013
用以实现将DBLP中的信息迁移到arXiv中。
在本实施例中,步骤S4中所述计算时间感知矩阵TM和节点间相似度矩阵SM的过程如下:
步骤S41:若论文
Figure BDA00022778032400001014
在时间timelink发表在期刊/会议
Figure BDA00022778032400001015
Figure BDA00022778032400001016
节点与
Figure BDA00022778032400001017
节点之间的时间感知权重定义为:
Figure BDA00022778032400001018
其中
Figure BDA00022778032400001019
Figure BDA00022778032400001020
节点与
Figure BDA00022778032400001021
节点在时间timelink产生链接的关系,timecurrent表示当前时间,μ是预设的衰减参,下同;
步骤S42:若论文
Figure BDA00022778032400001022
在时间timelink由作者
Figure BDA00022778032400001023
撰写,则
Figure BDA00022778032400001024
节点与
Figure BDA00022778032400001025
节点之间的时间感知权重定义为:
Figure BDA00022778032400001026
其中
Figure BDA00022778032400001027
Figure BDA00022778032400001028
节点与
Figure BDA00022778032400001029
节点在时间timelink产生链接的关系;
步骤S43:若发表于时间timelink的论文
Figure BDA00022778032400001030
中包括主题
Figure BDA00022778032400001031
Figure BDA00022778032400001032
节点与
Figure BDA00022778032400001033
节点之间的时间感知权重定义为:
Figure BDA00022778032400001034
其中
Figure BDA00022778032400001035
Figure BDA00022778032400001036
节点与
Figure BDA00022778032400001037
节点在时间timelink产生链接的关系;
步骤S44:若网络间的节点即论文节点
Figure BDA00022778032400001038
Figure BDA00022778032400001039
在时间timelink产生锚链接关系,则
Figure BDA00022778032400001040
节点与
Figure BDA00022778032400001041
节点之间的时间感知权重定义为:
Figure BDA00022778032400001042
其中
Figure BDA0002277803240000111
Figure BDA0002277803240000112
节点与
Figure BDA0002277803240000113
节点在时间timelink产生链接的关系;
步骤S45:时间感知矩阵TM定义为:
Figure BDA0002277803240000114
步骤S46:在对齐文献网络中,当节点
Figure BDA0002277803240000115
Figure BDA0002277803240000116
属于同一网络时,它们之间的相似度为基于元结构相关程度的网络表示学习得到的低维向量的余弦相似度;当
Figure BDA0002277803240000117
Figure BDA0002277803240000118
属于不同网络,且节点间存在锚链接时,它们之间的相似度为1;当
Figure BDA0002277803240000119
Figure BDA00022778032400001110
属于不同网络,且节点间不存在锚链接,同时属于arXiv的节点
Figure BDA00022778032400001111
不存在对齐的锚节点时,它们的相似度为
Figure BDA00022778032400001112
通过基于随机游走得到的相似度值;当
Figure BDA00022778032400001113
Figure BDA00022778032400001114
属于不同网络,节点间不存在锚链接,但属于arXiv的节点
Figure BDA00022778032400001115
存在对齐的锚节点
Figure BDA00022778032400001116
时,它们的相似度引入基于锚节点的相似度迁移,为
Figure BDA00022778032400001117
通过随机游走到达
Figure BDA00022778032400001118
得到的相似度值。即节点间相似度矩阵SM可定义为:
Figure BDA00022778032400001119
其中
Figure BDA00022778032400001120
表示节点
Figure BDA00022778032400001121
Figure BDA00022778032400001122
分别对应的向量
Figure BDA00022778032400001123
Figure BDA00022778032400001124
的余弦相似度。V1表示网络G1的节点集,V2表示网络G2的节点集,
Figure BDA00022778032400001125
表示网络G1和G2之间的锚链接集。
在本实施例中,所述步骤S5具体包括以下步骤:
步骤S51:根据对齐网络的节点间相似度矩阵SM和TM,计算带时间感知的相似度矩阵M:
Figure BDA0002277803240000121
其中,
Figure BDA0002277803240000122
表示TM与SM的元素间的哈达玛积。
步骤S52:Mi即为相似度向量,其中各元素表示论文节点vi和各期刊及各审稿人间的相似度,从而得到为预印本网络中拟投稿的论文推荐的合适期刊及审稿人的列表。
较佳的,在本实施例中步骤S1的原理如下:
结合结构信息与属性信息对节点进行表示,在此基础上采用局部敏感哈希来进行锚链接预测,并通过边界约束、平衡约束、最大相似度优化函数来对冗余链接进行修剪,可将arXiv和DBLP文献网络通过单向锚链接对齐,得到两个对齐的文献网络。
以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。

Claims (7)

1.一种为预印本网络中拟投稿的论文推荐合适期刊及审稿人的方法,其特征在于:包括如下步骤:
步骤S1:获取预印本网络arXiv和DBLP文献网络,将这两个网络中同名论文通过锚链接进行对齐,得到两个对齐的文献网络;
步骤S2:结合所述两个对齐的文献网络及面向文献网络的随机游走策略,学习arXiv中的节点经由单向锚链接到达DBLP节点的转移概率,并得到随机游走下所有分属于arXiv和DBLP的节点对之间节点相似度;
步骤S3:在所述两个对齐的文献网络中,采用锚节点下的节点相似度迁移策略,将DBLP中的信息迁移到arXiv中;
步骤S4:在所述两个对齐的文献网络中,计算节点间相似度矩阵SM,并根据节点之间的时间感知权重来计算时间感知矩阵TM;
步骤S5:根据SM和TM来计算节点间带时间感知的相似度矩阵M,通过M得到arXiv中待审稿论文和各期刊及各审稿人间相似度向量Mi,从而得到为预印本网络中拟投稿的论文推荐的合适期刊及审稿人的列表;
步骤S4中所述计算时间感知矩阵TM和节点间相似度矩阵SM的过程如下:
步骤S41:若论文
Figure FDA0003595108260000011
在时间timelink发表在期刊/会议
Figure FDA0003595108260000012
Figure FDA0003595108260000013
节点与
Figure FDA0003595108260000014
节点之间的时间感知权重定义为:
Figure FDA0003595108260000015
其中
Figure FDA0003595108260000016
Figure FDA0003595108260000017
节点与
Figure FDA0003595108260000018
节点在时间timelink产生链接的关系,timecurrent表示当前时间,μ是预设的衰减参数;
步骤S42:若论文
Figure FDA0003595108260000019
在时间timelink由作者
Figure FDA00035951082600000110
撰写,则
Figure FDA00035951082600000111
节点与
Figure FDA00035951082600000112
节点之间的时间感知权重定义为:
Figure FDA0003595108260000021
其中
Figure FDA0003595108260000022
Figure FDA0003595108260000023
节点与
Figure FDA0003595108260000024
节点在时间timelink产生链接的关系;
步骤S43:若发表于时间timelink的论文
Figure FDA0003595108260000025
中包括主题
Figure FDA0003595108260000026
Figure FDA0003595108260000027
节点与
Figure FDA0003595108260000028
节点之间的时间感知权重定义为:
Figure FDA0003595108260000029
其中
Figure FDA00035951082600000210
Figure FDA00035951082600000211
节点与
Figure FDA00035951082600000212
节点在时间timelink产生链接的关系;
步骤S44:若网络间的节点即论文节点
Figure FDA00035951082600000213
Figure FDA00035951082600000214
在时间timelink产生锚链接关系,则
Figure FDA00035951082600000215
节点与
Figure FDA00035951082600000216
节点之间的时间感知权重定义为:
Figure FDA00035951082600000217
其中
Figure FDA00035951082600000218
Figure FDA00035951082600000219
节点与
Figure FDA00035951082600000220
节点在时间timelink产生链接的关系;
步骤S45:时间感知矩阵TM定义为:
Figure FDA00035951082600000221
步骤S46:在对齐文献网络中,当节点
Figure FDA00035951082600000222
Figure FDA00035951082600000223
属于同一网络时,它们之间的相似度为基于元结构相关程度的网络表示学习得到的低维向量的余弦相似度;当
Figure FDA00035951082600000224
Figure FDA00035951082600000225
属于不同网络,且节点间存在锚链接时,它们之间的相似度为1;当
Figure FDA00035951082600000226
Figure FDA00035951082600000227
属于不同网络,且节点间不存在锚链接,同时属于arXiv的节点
Figure FDA00035951082600000228
不存在对齐的锚节点时,它们的相似度为
Figure FDA00035951082600000229
通过基于随机游走得到的相似度值;当
Figure FDA00035951082600000230
Figure FDA00035951082600000231
属于不同网络,节点间不存在锚链接,但属于arXiv的节点
Figure FDA0003595108260000031
存在对齐的锚节点
Figure FDA0003595108260000032
时,它们的相似度引入基于锚节点的相似度迁移,为
Figure FDA0003595108260000033
通过随机游走到达
Figure FDA0003595108260000034
得到的相似度值;即节点间相似度矩阵SM可定义为:
Figure FDA0003595108260000035
其中
Figure FDA0003595108260000036
表示节点
Figure FDA0003595108260000037
Figure FDA0003595108260000038
分别对应的向量
Figure FDA0003595108260000039
Figure FDA00035951082600000310
的余弦相似度;V1表示网络G1的节点集,V2表示网络G2的节点集,
Figure FDA00035951082600000311
表示网络G1和G2之间的锚链接集。
2.根据权利要求1所述的一种为预印本网络中拟投稿的论文推荐合适期刊及审稿人的方法,其特征在于:步骤S2中所述得到随机游走下所有分属于DBLP和arXiv的节点对之间节点相似度,具体包括以下步骤:
步骤SA:根据边的边介数和节点的邻居集,计算出文献网络中边类型权重及边权重;
步骤SB:根据步骤SA中边类型权重及边权重计算每一个游走点选择其邻居节点的概率;
步骤SC:根据步骤SB中概率计算随机游走下所有分属于DBLP和arXiv的节点对之间节点相似度。
3.根据权利要求2所述的一种为预印本网络中拟投稿的论文推荐合适期刊及审稿人的方法,其特征在于:所述步骤SA具体包括以下内容:
步骤SA1:令类型为Rst的边集合为ξst,则Rst的边类型权重为:
Figure FDA0003595108260000041
其中
Figure FDA0003595108260000042
为边eij的边介数;对一个具体的Qs类型的节点vi而言,令从Qs到其所有类型的邻居节点的边类型集合为Γ,则从vi沿Rst类型边游走的边类型权重为:
Figure FDA0003595108260000043
步骤SA2:令
Figure FDA0003595108260000044
表示节点vi的Qt类型的邻居集,则从vi游走到
Figure FDA0003595108260000045
中每个节点的概率是相等的;因此,vi
Figure FDA0003595108260000046
中的任一节点vj的边权重为:
Figure FDA0003595108260000047
4.根据权利要求2所述的一种为预印本网络中拟投稿的论文推荐合适期刊及审稿人的方法,其特征在于:步骤SB中所述计算每一个游走点选择其邻居节点的概率的计算过程如下:
Qs类型的节点vi选择Qt类型的邻居节点vj进行游走的概率
Figure FDA0003595108260000048
为:
Figure FDA0003595108260000049
其中,WRst表示Rst类型边的边类型权重;
Figure FDA00035951082600000410
表示vi和vj之间的边eij的边权重。
5.根据权利要求2所述的一种为预印本网络中拟投稿的论文推荐合适期刊及审稿人的方法,其特征在于:所述步骤SC具体包括以下步骤:
步骤SC1:由
Figure FDA00035951082600000411
的矩阵公式得到节点间游走一步到达的概率矩阵P,令
Figure FDA00035951082600000412
表示从vi到vj游走t步内到达的概率,该概率从P推出,定义为:
Figure FDA00035951082600000413
其中PT是矩阵P的转置,
Figure FDA0003595108260000051
是一个n*1维的向量,第i个值为1;
步骤SC2:行走t步后,vi到vj之间的相似度定义为:
Figure FDA0003595108260000052
步骤SC3:叠加多个游走点得到的vi到vj之间的相似度定义为:
Figure FDA0003595108260000053
6.根据权利要求1所述的一种为预印本网络中拟投稿的论文推荐合适期刊及审稿人的方法,其特征在于:
所述步骤S3具体包括以下步骤:
步骤S31:给定arXiv中的节点
Figure FDA0003595108260000054
DBLP中的节点
Figure FDA0003595108260000055
若在DBLP中有对应锚节点
Figure FDA0003595108260000056
根据随机游走策略计算得到
Figure FDA0003595108260000057
的锚节点
Figure FDA0003595108260000058
Figure FDA0003595108260000059
间的节点相似度
Figure FDA00035951082600000510
步骤S32:将
Figure FDA00035951082600000511
游走到
Figure FDA00035951082600000512
的节点相似度
Figure FDA00035951082600000513
作为
Figure FDA00035951082600000514
Figure FDA00035951082600000515
之间的相似度
Figure FDA00035951082600000516
用以实现将DBLP中的信息迁移到arXiv中。
7.根据权利要求1所述的一种为预印本网络中拟投稿的论文推荐合适期刊及审稿人的方法,其特征在于:所述步骤S5具体包括以下步骤:
步骤S51:根据对齐网络的节点间相似度矩阵SM和TM,计算带时间感知的相似度矩阵M:
Figure FDA00035951082600000517
其中,
Figure FDA00035951082600000518
表示TM与SM的元素间的哈达玛积;
步骤S52:Mi即为相似度向量,其中各元素表示论文节点vi和各期刊及各审稿人间的相似度从M的第i行中抽取论文节点vi和各审稿人及各期刊的元素组成相似度向量V,从而得到为预印本网络中拟投稿的论文推荐的合适期刊及审稿人的列表。
CN201911130977.4A 2019-11-18 2019-11-18 一种为预印本网络中拟投稿的论文推荐合适期刊及审稿人的方法 Expired - Fee Related CN110874406B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911130977.4A CN110874406B (zh) 2019-11-18 2019-11-18 一种为预印本网络中拟投稿的论文推荐合适期刊及审稿人的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911130977.4A CN110874406B (zh) 2019-11-18 2019-11-18 一种为预印本网络中拟投稿的论文推荐合适期刊及审稿人的方法

Publications (2)

Publication Number Publication Date
CN110874406A CN110874406A (zh) 2020-03-10
CN110874406B true CN110874406B (zh) 2022-06-14

Family

ID=69717125

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911130977.4A Expired - Fee Related CN110874406B (zh) 2019-11-18 2019-11-18 一种为预印本网络中拟投稿的论文推荐合适期刊及审稿人的方法

Country Status (1)

Country Link
CN (1) CN110874406B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114154478B (zh) * 2022-02-07 2022-07-05 杭州未名信科科技有限公司 一种论文审稿人确定方法和系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104133843A (zh) * 2014-06-25 2014-11-05 福州大学 科技文献异构网络中节点的学术影响力协同排序方法
CN110069726A (zh) * 2019-04-26 2019-07-30 福州大学 一种适用于DBLP与arXiv的文献网络间锚链接关系预测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9654378B2 (en) * 2013-10-24 2017-05-16 Sas Institute Inc. Link addition to a network of linked nodes

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104133843A (zh) * 2014-06-25 2014-11-05 福州大学 科技文献异构网络中节点的学术影响力协同排序方法
CN110069726A (zh) * 2019-04-26 2019-07-30 福州大学 一种适用于DBLP与arXiv的文献网络间锚链接关系预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于叠加随机游走的复杂网络节点重要度评估方法;宋琛,尹波,张贤坤;《信息工程大学学报》;20161215;第17卷(第6期);第730-759页 *

Also Published As

Publication number Publication date
CN110874406A (zh) 2020-03-10

Similar Documents

Publication Publication Date Title
Chunaev Community detection in node-attributed social networks: a survey
Amini et al. A boosting algorithm for learning bipartite ranking functions with partially labeled data
Madani et al. Social collaborative filtering approach for recommending courses in an E-learning platform
CN108228728B (zh) 一种参数化的论文网络节点表示学习方法
CN110781319A (zh) 跨媒体大数据的公共语义表示、搜索方法和装置
CN107391542A (zh) 一种基于文件知识图谱的开源软件社区专家推荐方法
CN114265986B (zh) 一种融合知识图谱结构与路径语义的信息推送方法和系统
Bagavathi et al. Multi-net: a scalable multiplex network embedding framework
CN102012911A (zh) 基于约束优化的专家匹配方法及系统
CN116431914A (zh) 一种基于个性化偏好转移模型的跨域推荐方法及系统
CN110874406B (zh) 一种为预印本网络中拟投稿的论文推荐合适期刊及审稿人的方法
Askari-Sichani et al. Large-scale global optimization through consensus of opinions over complex networks
Wijayanto et al. Implementation of multi-criteria collaborative filtering on cluster using Apache Spark
CN113228059A (zh) 面向跨网络的表示学习算法
CN111078859A (zh) 一种基于引用次数的作者推荐方法
Gaikwad et al. Cohort intelligence and genetic algorithm along with modified analytical hierarchy process to recommend an ice cream to diabetic patient
Gaikwad et al. Cohort Intelligence and Genetic Algorithm along with AHP to recommend an Ice Cream to a Diabetic Patient
Singh et al. Friend Recommendation System in a Social Network based on Link Prediction Framework using Deep Neural Network
Di Puglia Pugliese et al. Dynamic programming for spanning tree problems: application to the multi-objective case
Hao et al. Enhancing cross domain recommendation with domain dependent tags
Thirunavukarasu et al. People to people recommendation using coupled nonnegative boolean matrix factorization
CN112347369B (zh) 基于网络表征的集成学习动态社会网络链路预测方法
Li et al. DTCMF: Dynamic trust-based context-aware matrix factorization for collaborative filtering
Pujahari et al. A new grouping method based on social choice strategies for group recommender system
Walker et al. Social‐trust‐aware variational recommendation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20220614