CN114691814B - 信息处理方法、装置、电子设备及存储介质 - Google Patents

信息处理方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN114691814B
CN114691814B CN202210398913.8A CN202210398913A CN114691814B CN 114691814 B CN114691814 B CN 114691814B CN 202210398913 A CN202210398913 A CN 202210398913A CN 114691814 B CN114691814 B CN 114691814B
Authority
CN
China
Prior art keywords
node
weight
link
path
weights
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210398913.8A
Other languages
English (en)
Other versions
CN114691814A (zh
Inventor
徐硕
王聪聪
翟东升
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Shiyuan Technology Co ltd
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN202210398913.8A priority Critical patent/CN114691814B/zh
Publication of CN114691814A publication Critical patent/CN114691814A/zh
Application granted granted Critical
Publication of CN114691814B publication Critical patent/CN114691814B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例提供一种信息处理方法、装置、电子设备及存储介质,涉及科技情报、数据挖掘、文献计量分析领域。该方法包括获取待处理网络;待处理网络包括多个第一元素和多个第二元素;确定各第一元素的初始权重和各第二元素的初始权重;将各第一元素的初始权重对应转换为各第二元素的转换权重;将每一第二元素的初始权重和每一第二元素的转换权重进行加权处理,得到每一第二元素的融合权重;基于各第二元素的融合权重,确定目标领域的演化路径。本申请实施例可以将节点权重和链接权重相互转换,基于节点或链接的融合权重,得到演化路径,弥补了现有技术的链接重要性或节点重要性的演化轨迹探测方法的不足,提高了演化路径的准确性。

Description

信息处理方法、装置、电子设备及存储介质
技术领域
本申请涉及领域发展脉络的技术领域,具体而言,本申请涉及一种信息处理方法、装置、电子设备及存储介质。
背景技术
演化路径体现了特定领域的发展脉络,凝聚着领域发展的重要信息,可以有效解读演化轨迹所隐含的主题及发展趋势,识别领域发展中的关键节点,可以深层次揭示领域中的重大科技事件,为国家科技发展规划和企业研发战略制定提供决策依据和参考。
然而,近年来,科技领域研究成果呈现爆炸式增长,研究成果之间的引文网络越来越复杂,现有的对引文网络的处理方法,容易出现遗漏一些重要节点或包括一些不重要的链接等问题,导致得到的演化路径准确度较低。
发明内容
本申请针对现有方式的缺点,提出一种信息处理方法、装置、电子设备及存储介质,用以解决现有技术存在的演化路径准确度较低的技术问题。
第一方面,本申请实施例提供一种信息处理方法,包括:
获取待处理网络;待处理网络是基于目标领域的引文网络所确定的,待处理网络包括多个第一元素和多个第二元素;
确定各第一元素的初始权重和各第二元素的初始权重;其中,第一元素为节点,第二元素为链接;或者,第一元素为链接,第二元素为节点,节点的初始权重表示该节点在目标领域的重要程度,链接的初始权重表示该链接连接的两个节点之间的引用关系在目标领域的重要程度;
将各第一元素的初始权重对应转换为各第二元素的转换权重;
将每一第二元素的初始权重和每一第二元素的转换权重进行加权处理,得到每一第二元素的融合权重;
基于各第二元素的融合权重,确定目标领域的演化路径。
在一个可能的实现方式中,获取待处理网络,包括:
基于目标领域的检索式,得到引文网络;
对引文网络进行预处理,并从预处理后的引文网络中提取最大弱连通子图;最大弱连通子图为有向无环网络,是预处理后的引文网络中第一元素最多和/或第二元素最多的网络;
在最大弱连通子图中增加源节点和目标节点,得到待处理网络;目标节点表示待处理网络的起点,源节点表示待处理网络的终点。
在一个可能的实现方式中,第一元素为节点,第二元素为链接;
将各第一元素的初始权重对应转换为各第二元素的转换权重,包括以下至少一项:
针对每一节点,确定与节点连接且方向是进入节点的链接,将所确定的链接的转换权重确定为节点的初始权重;
针对每一节点,确定与节点连接且方向是从节点出去的链接,将所确定的链接的转换权重确定为节点的初始权重;
针对每一链接,将与链接连接的两个节点的初始权重,基于一组第一预设比例系数进行加权处理,得到链接的转换权重。
在一个可能的实现方式中,第一元素为链接,第二元素为节点;
将各第一元素的初始权重对应转换为各第二元素的转换权重,包括以下至少一项:
针对每一节点,将所有方向是进入节点的链接的初始权重之和,作为节点的转换权重;
针对每一节点,将所有方向是从节点出去的链接的初始权重之和,作为节点的转换权重;
针对每一所述节点,将所有方向是进入所述节点的链接的初始权重之和与所有方向是从所述节点出去的链接的初始权重之和求平均,作为所述节点的转换权重。
在一个可能的实现方式中,将每一第二元素的初始权重和每一第二元素的转换权重进行加权处理,得到每一第二元素的融合权重,包括:
对每一第二元素的初始权重进行归一化处理,得到每一第二元素的归一化权重;
基于一组第二预设比例系数,将每一第二元素的归一化权重和每一第二元素的转换权重进行加权处理,得到每一第二元素的融合权重。
在一个可能的实现方式中,基于各第二元素的融合权重,确定目标领域的演化路径,包括:
基于预定的搜索方式,从待处理网络中确定至少一个候选路径;候选路径包括第一元素和第二元素;
将各候选路径中的第二元素的融合权重相加,得到至少一个路径权重;
从各路径权重中,确定最大的前预设数量的路径权重,并将所确定的路径权重对应的候选路径,作为目标路径;
基于目标路径,得到目标领域的演化路径。
在一个可能的实现方式中,基于目标路径,得到目标领域的演化路径,包括:
将待处理网络中的目标路径保留,其余第一元素和第二元素删除,形成演化路径并展示。
第二方面,本申请实施例提供一种信息处理装置,包括:
获取模块,用于获取待处理网络;待处理网络是基于目标领域的引文网络所确定的,待处理网络包括多个第一元素和多个第二元素;
第一处理模块,用于确定各第一元素的初始权重和各第二元素的初始权重;其中,第一元素为节点,第二元素为链接;或者,第一元素为链接,第二元素为节点,节点的初始权重表示该节点在目标领域的重要程度,链接的初始权重表示该链接连接的两个节点之间的引用关系在目标领域的重要程度;
第二处理模块,用于将各第一元素的初始权重对应转换为各第二元素的转换权重;
第三处理模块,用于将每一第二元素的初始权重和每一第二元素的转换权重进行加权处理,得到每一第二元素的融合权重;
第四处理模块,用于基于各第二元素的融合权重,确定目标领域的演化路径。
第三方面,本申请实施例提供一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,处理器执行计算机程序以实现第一方面中任一项方法的步骤。
第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现第一方面中任一项方法的步骤。
本申请实施例提供的技术方案带来的有益效果是:
本申请实施例的信息处理方法可以将各第一元素的初始权重对应转换为各第二元素的转换权重,再将每一第二元素的初始权重和每一第二元素的转换权重进行加权处理,得到每一第二元素的融合权重,这样就可以基于第二元素的融合权重,得到目标领域的演化路径。也就是,本申请实施例可以将节点的初始权重转换为链接的转换权重,再基于链接的初始权重和转换权重,得到链接的融合权重,基于各链接的融合权重,得到演化路径,同理也采用节点的初始权重和转换权重确定节点的融合权重,得到演化路径。因此,本申请实施例可以将节点权重和链接权重相互转换,基于节点或链接的融合权重,得到演化路径,是将节点权重和链接权重相结合,避免了单一采用节点或链接的重要程度直接确定演化路径,导致遗漏一些重要节点或包括一些不重要的链接的问题,弥补了现有技术的链接重要性或节点重要性的演化轨迹探测方法的不足,提高了演化路径的准确性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。
图1为本申请实施例提供的一种信息处理方法的流程图;
图2为本申请实施例提供的另一种信息处理方法的流程图;
图3a为本申请实施例确定的各节点的初始权重的示意图;
图3b至图3d为本申请实施例提供的三种节点的初始权重转换为链接的转换权重的示意图;
图4a为本申请实施例提供的采用中介性方法(intermediacy)得到的演化路径的示意图;
图4b为本申请实施例提供的采用转化方法SPNP-WoD得到演化路径的示意图;
图4c为本申请实施例提供的信息处理方法中的集成节点的重要性度量方法得到演化路径的示意图。
图5a为本申请实施例提供的采用搜索路径节点对法SPNP得到演化路径的示意图;
图5b为本申请实施例提供的采用转化方法intermediacy-in得到演化路径的示意图;
图5c为本申请实施例提供的信息处理方法中的采用的集成链接的重要性度量方法得到演化路径的示意图。
图6为本申请实施例提供的一种信息处理装置的结构示意图;
图7为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面结合本申请中的附图描述本申请的实施例。应理解,下面结合附图所阐述的实施方式,是用于解释本申请实施例的技术方案的示例性描述,对本申请实施例的技术方案不构成限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请实施例所使用的术语“包括”以及“包含”是指相应特征可以实现为所呈现的特征、信息、数据、步骤、操作、元件和/或组件,但不排除实现为本技术领域所支持其他特征、信息、数据、步骤、操作、元件、组件和/或它们的组合等。应该理解,当我们称一个元件被“连接”或“耦接”到另一元件时,该一个元件可以直接连接或耦接到另一元件,也可以指该一个元件和另一元件通过中间元件建立连接关系。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的术语“和/或”指示该术语所限定的项目中的至少一个,例如“A和/或B”指示实现为“A”,或者实现为“B”,或者实现为“A和B”。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
首先对本申请涉及的几个名词进行介绍和解释:
引文网络:由文献间引用和被引用的关系构成的集合,这些文献资料包括科技期刊、专利文献、会议论文集、科技报告和学位论文等多种形式,其较好地描述了科学领域的发展、学科间的关系。随着现代信息技术的发展,文献著作数量迅速增加,引文网络已经形成了一个超大规模的复杂网络系统,并吸引了越来越多的关注。由于引文网络包含了多个领域的研究成果,代表了学术研究中重要的知识宝库,其已经成为研究的重要介质。引文网络中的引用是单向的,即只能是后期的文献引用前期的文献,而前期的文献不能反过来引用后期的文献。
节点:可以对应文献,文献包括科技期刊、专利文献、会议论文集、科技报告和学位论文等多种形式的资料。
链接:连接在两个节点之间,代表节点之间的引用关系,带有方向。
路径:是指沿着链接的方向,从一个节点到另一个节点的路径。
有向无环网络:是指任意两个节点之间,沿着链接的方向均不形成环形结构。
经研究发现,近年来,科技领域研究成果呈现爆炸式增长,研究成果之的引用网络越来越复杂,这使得准确把握科技演化轨迹变得十分困难。
为了探测领域演化轨迹,通常需要首先构建一个蕴含领域发展的有向无环网络,然后度量这个网络中每个链接或节点的重要性,最后基于全局或局部搜索算法提取整个网络的骨架结构,使得所提取的骨架结构中链接或节点的权重之和最大。探测演化轨迹的经典方法是主路径分析法,它基于网络的连通性,将引文网络中获得高遍历权重的链接组成领域发展的主路径,用以描述科技演化脉络,揭示领域内的潜在发展规律。
目前常用的常规的演化路径的确认一般采用两种方法。第一种方法,主路径分析方法偏向于较长的演化轨迹,这不符合大家对演化轨迹的直觉认识,同时该方法得到的演变轨迹可能缺失一些对领域发展比较重要的节点。相应地,另一种方法是首先利用中介性方法(intermediacy)或中心性度量等方法计算节点的重要性,然后基于所计算的节点重要性提取骨架结构。实际上,这种方法所提取的演变轨迹经常包括一些不重要的链接。
但是,上述两种方法,不是遗漏一些重要节点就是包括一些不重要的链接,或者遗漏一些链接,均存在一定的弊端。因此,需要一种新的信息处理方法,能够克服上述方法的弊端,提高演化路径的准确性。
本申请提供的一种信息处理方法、装置、电子设备及存储介质,旨在解决现有技术的如上技术问题。
本申请实施例提供一种信息处理方法,参见图1所示,该信息处理方法包括:步骤S101至步骤S104。
S101、获取待处理网络;待处理网络是基于目标领域的引文网络所确定的,待处理网络包括多个第一元素和多个第二元素。
可选地,引文网络是文献间引用和被引用的关系形成的网络,第一元素和第二元素,分别为节点和链接中的一个。
在一些实施例中,获取待处理网络,可以包括:
基于目标领域的检索式,得到引文网络;
对引文网络进行预处理,并从预处理后的引文网络中提取最大弱连通子图;最大弱连通子图为有向无环网络,是预处理后的引文网络中第一元素最多和/或第二元素最多的网络;
在最大弱连通子图中增加源节点和目标节点,得到待处理网络;目标节点表示待处理网络的起点,源节点表示待处理网络的终点。
可选地,目标领域的检索式,用于检索目标领域相关科技文献,相关科技文献集合形成引文网络。
可选地,对引文网络进行预处理,可以包括:
删除引文网络的环状结构,使得引文网络形成有向无环网络。
可选地,删除引文网络的环状结构,包括以下至少一项:删除环状结构中的至少一个节点、删除环状结构中的至少一个链接。
可选地,目标节点连接的链接的方向均是从目标节点出去,源节点连接的链接的方向均是进入源节点。
可选地,本申请实施例也可以直接将最大弱连通子图作为待处理网络,进行些链接或节点重要性度量。
S102、确定各第一元素的初始权重和各第二元素的初始权重;其中,第一元素为节点,第二元素为链接;或者,第一元素为链接,第二元素为节点,节点的初始权重表示该节点在目标领域的重要程度,链接的初始权重表示该链接连接的两个节点之间的引用关系在目标领域的重要程度。
可选地,节点的初始权重的确定方法,可以采用现有的确定方法,包括但不限于中介性方法(intermediacy)、中介中心性(betweeness centrality)、度中心性(degreecentrality)和邻近中心性(closeness centrality)等。
可选地,链接的初始权重的确定方法,可以采用现有的确定方法,包括但不限于链接重要性计算方法包括但不限于搜索路径计数法(SearchPath Count,SPC)、搜索路径链接计数法(Search Path Link Count,SPLC)和搜索路径节点对法(Search Path Node Pair,SPNP)等。
可选地,本申请实施例中的节点的所有权重,都是表示确定出的该节点在目标领域的重要程度,链接的所有权重都是表示该链接连接的两个节点之间的引用关系在目标领域的重要程度。节点的所有权重包括节点的初始权重、转换权重和融合权重。链接的所有权重包括链接的初始权重、转换权重和融合权重。
S103、将各第一元素的初始权重对应转换为各第二元素的转换权重。
可选地,当第一元素为节点,第二元素为链接时,即将节点的权重转换为链接的权重。当第一元素为链接,第二元素为节点时,即将链接的权重转换为节点的权重。
在一些实施例中,第一元素为节点,第二元素为链接;将各第一元素的初始权重对应转换为各第二元素的转换权重,可以包括以下至少一项:
针对每一节点,确定与节点连接且方向是进入节点的链接,将所确定的链接的转换权重确定为节点的初始权重;
针对每一节点,确定与节点连接且方向是从节点出去的链接,将所确定的链接的转换权重确定为节点的初始权重;
针对每一链接,将与链接连接的两个节点的初始权重,基于一组第一预设比例系数进行加权处理,得到链接的转换权重。
可选地,一组第一预设比例系数包括两个常系数,两个常系数分别与节点的初始权重相乘后求和,得到融合权重。两个常系数可以为0.5和0.5,即对两个节点的初始权重求均值。两个常系数之和为1,其他合理的常系数也可以使用。
在一些实施例中,第一元素为链接,第二元素为节点。
将各第一元素的初始权重对应转换为各第二元素的转换权重,可以包括以下至少一项:
针对每一节点,将所有方向是进入节点的链接的初始权重之和,作为节点的转换权重;
针对每一节点,将所有方向是从节点出去的链接的初始权重之和,作为节点的转换权重;
针对每一所述节点,将所有方向是进入所述节点的链接的初始权重之和与所有方向是从所述节点出去的链接的初始权重之和求平均,作为所述节点的转换权重。
S104、将每一第二元素的初始权重和每一第二元素的转换权重进行加权处理,得到每一第二元素的融合权重。
在一些实施例中,将每一第二元素的初始权重和每一第二元素的转换权重进行加权处理,得到每一第二元素的融合权重,可以包括:
对每一第二元素的初始权重进行归一化处理,得到每一第二元素的归一化权重;
基于一组第二预设比例系数,将每一第二元素的归一化权重和每一第二元素的转换权重进行加权处理,得到每一第二元素的融合权重。
可选地,当第一元素为节点,第二元素为链接时,对每一第二元素的初始权重进行归一化处理,得到每一第二元素的归一化权重,即是对每一链接的初始权重进行归一化处理,得到每一链接的归一化权重,便于确定链接的融合权重。
可选地,当第一元素为链接,第二元素为节点时,对每一第二元素的初始权重进行归一化处理,得到每一第二元素的归一化权重,即是对每一节点的初始权重进行归一化处理,得到每一节点的归一化权重,便于确定节点的融合权重。
可选地,一组第二预设比例系数包括两个常系数,两个常系数分别与归一化权重和转换权重相乘后求和,得到融合权重。两个常系数之和为1,其他合理的常系数也可以使用。
可选地,节点的初始权重的归一化处理,和链接的初始权重的归一化处理的原理相同。
S105、基于各第二元素的融合权重,确定目标领域的演化路径。
在一些实施例中,基于各第二元素的融合权重,确定目标领域的演化路径,可以包括:
基于预定的搜索方式,从待处理网络中确定至少一个候选路径;候选路径包括第一元素和第二元素。
将各候选路径中的第二元素的融合权重相加,得到至少一个路径权重。
从各路径权重中,确定最大的前预设数量的路径权重,并将所确定的路径权重对应的候选路径,作为目标路径。
基于目标路径,得到目标领域的演化路径。
可选地,预定的搜索方式可以采用优先路径搜索方式,包括但不限于:从目标节点到源节点的正向搜索,从源节点到目标节点的反向搜索,以及基于关键路由(key-route)的双向搜索等,每种搜索方法又可分为全局最优搜索和局部最优搜索。
可选地,最大的前预设数量的路径权重为路径权重排名靠前的预设数量的路径权重,例如前5或20等。
在一些实施例中,基于目标路径,得到目标领域的演化路径,可以包括:
将待处理网络中的目标路径保留,其余的第一元素和第二元素删除,形成演化路径并展示。
可选地,对演化路径进行展示可以采用的可视化展示工具,可视化展示工具包括但不限于:Pajek,Ucinet,Gephi等。其中,Pajek是大型复杂网络分析工具,是用于研究目前所存在的各种复杂非线性网络的有力工具。Ucinet网络分析集成软件包括一维与二维数据分析以及三维展示分析软件,同时集成了Pajek用于大型网络分析的Free应用软件程序。Gephi是一款开源免费跨平台基于JVM(Java Virtual Machine,Java虚拟机)的复杂网络分析软件,其主要用于各种网络和复杂系统,动态和分层图的交互可视化与探测开源工具。
本申请实施例的信息处理方法可以将节点的初始权重转换为链接的转换权重,再基于链接的初始权重和转换权重,得到链接的融合权重,基于各链接的融合权重,得到演化路径,同理也采用节点的初始权重和转换权重确定节点的融合权重,得到演化路径。因此,本申请实施例可以将节点权重和链接权重相互转换,基于节点或链接的融合权重,得到演化路径,是将节点权重和链接权重相结合,避免了单一采用节点或链接的重要程度直接确定演化路径,导致遗漏一些重要节点或包括一些不重要的链接的问题,弥补了现有技术的链接重要性或节点重要性的演化轨迹探测方法的不足,提高了演化路径的准确定。
作为一种示例,参见图2所示,本申请实施例提供一种信息处理方法,包括:步骤S201至步骤S213。
S201、基于目标领域的检索式,得到引文网络。
可选地,目标领域的检索式,用于检索目标领域相关科技文献,相关科技文献集合形成引文网络。目标领域的检索式是基于目标领域的至少一个关键字生成的。
S202、对引文网络进行预处理,并从预处理后的引文网络中提取最大弱连通子图;最大弱连通子图为有向无环网络,是预处理后的引文网络中第一元素最多和/或第二元素最多的网络。
可选地,对引文网络进行预处理,可以包括:
删除引文网络的环状结构,使得引文网络形成有向无环网络。
可选地,删除引文网络的环状结构,包括以下至少一项:删除环状结构中的至少一个节点、删除环状结构中的至少一个链接。
S203、在最大弱连通子图中增加源节点和目标节点,得到待处理网络;目标节点表示待处理网络的起点,源节点表示待处理网络的终点,待处理网络包括多个第一元素和多个第二元素,第一元素为节点,第二元素为链接;或者,第一元素为链接,第二元素为节点。
基于步骤S203可以将最大弱连通子图,转变为标准形式,经过这种标准化处理得到一个新的有向无环网络,形成待处理网络。
可选地,将入度为零但出度不为零的节点(即连接的链接的方向都是从节点出去的)记为目标节点集合Vout,将出度为零但入度不为零的节点(即连接的链接的方向都是进入节点)记为源节点集合Vin。添加一个新的目标节点t和源节点s,在目标节点t和目标节点集合Vout中每个节点之间增加一条有向链接,对于源节点集合Vin中每个节点添加一条指向源节点s的链接。
可选地,本申请实施例也可以直接将最大弱连通子图作为待处理网络,进行些链接或节点重要性度量。
S204、确定各节点的初始权重,之后执行步骤S206和S207。
可选地,节点的初始权重的确定方法,可以采用现有的确定方法,包括但不限于中介性方法、中介中心性、和邻近中心性等。
可选地,参见图3a所示,示出了确定的各节点的初始权重的示意图,节点包括A-K个节点,节点上方对应的是节点的初始权重,示意图的待处理网络未示出源节点和目标节点。
S205、确定各链接的初始权重,之后执行步骤S210和S211。
可选地,链接的初始权重的确定方法,可以采用现有的确定方法,可以包括但不限于链接重要性计算方法包括但不限于搜索路径计数法、搜索路径链接计数法和搜索路径节点对法等。
可选地,参见图3b和3d所示,示出了三种节点的初始权重转换为链接的转换权重的示意图,链接的初始权重的示意图与图3b和3d类似,每一链接对应有一个初始权重。
S206、将各节点的初始权重对应转换为各链接的转换权重,之后执行步骤S208。
可选地,将各节点的初始权重对应转换为各链接的转换权重,可以包括:
针对每一节点,确定与节点连接且方向是进入节点的链接,将所确定的链接的转换权重确定为节点的初始权重。
可选地,参见图3b所示,示出了确定与节点连接且方向是进入节点的链接,将所确定的链接的转换权重确定为节点的初始权重的示意图。结合图3a和3b,以节点A和C之间的链接为例,该链接的方向是进入节点C,则将该链接的转换权重确定为节点C的初始权重,即为5。
可选地,将各节点的初始权重对应转换为各链接的转换权重,可以包括:
针对每一节点,确定与节点连接且方向是从节点出去的链接,将所确定的链接的转换权重确定为节点的初始权重。
可选地,参见图3c所示,示出了确定与节点连接且方向是从节点出去的链接,将所确定的链接的转换权重确定为节点的初始权重的示意图。结合图3a和3c,以节点A和C之间的链接为例,该链接的方向是从节点A出去,则将该链接的转换权重确定为节点A的初始权重,即为1。
可选地,将各节点的初始权重对应转换为各链接的转换权重,可以包括:
针对每一链接,将与链接连接的两个节点的初始权重,基于一组第一预设比例系数进行加权处理,得到链接的转换权重。
可选地,参见图3d所示,示出了将与链接连接的两个节点的初始权重,基于一组第一预设比例系数进行加权处理,得到链接的转换权重的示意图。结合图3a和3d,以节点A和C之间的链接为例,该链接的两个节点的初始权重分别为1和5,一组第一预设比例系数分别为0.5和0.5两个常系数,该链接的转换权重为1×0.5+5×0.5=3,即转换权重为3。
S207、对每一节点的初始权重进行归一化处理,得到每一节点的归一化权重,之后执行步骤S212。
可选地,将每一节点的初始权重进行归一化处理,可以包括:将每一节点的初始权重按照预定算法归一化到预定区间内。例如:预定区间[0,1]。
可选地,将每一节点的初始权重归一化到共同区间归一化方法包括但不限于最小值-最大值归一化(min-max)、均值-方差归一化(mean-variance)等。
S208、基于一组第二预设比例系数,将每一链接的归一化权重和每一链接的转换权重进行加权处理,得到每一链接的融合权重。
可选地,在实际应用中,也可根据实际需要确定部分链接的归一化权重和每一链接的转换权重进行加权处理。
S209、基于各链接的融合权重,确定目标领域的演化路径。
可选地,基于各链接的融合权重,确定目标领域的演化路径,可以包括:
基于预定的搜索方式,从待处理网络中确定至少一个候选路径;候选路径包括节点和链接。
将各候选路径中的链接的融合权重相加,得到至少一个路径权重。
从各路径权重中,确定最大的前预设数量的路径权重,并将所确定的路径权重对应的候选路径,作为目标路径。
基于目标路径,得到目标领域的演化路径。
可选地,预定的搜索方式可以采用优先路径搜索方式,包括但不限于:从目标节点到源节点的正向搜索,从源节点到目标节点的反向搜索,以及基于关键路由的双向搜索等,每种搜索方法又可分为全局最优搜索和局部最优搜索。
基于目标路径,得到目标领域的演化路径,可以包括:
将待处理网络中的目标路径保留,其余的节点和链接删除,形成演化路径并展示。
可选地,对演化路径进行展示可以采用的可视化展示工具,可视化展示工具包括但不限于:Pajek,Ucinet,Gephi等。
S210、将各链接的初始权重对应转换为各节点的转换权重,之后执行步骤S212。
可选地,将各链接的初始权重对应转换为各节点的转换权重,可以包括:针对每一节点,将所有方向是进入节点的链接的初始权重之和,作为节点的转换权重。
可选地,以图3b示出的链接的转换权重为例,假设图中的链接的转换权重为链接的初始权重,以节点C为例,所有方向是进入节点C的链接有两个,即A-C,B-C的链接,那么节点C的转换权重为5+5=10。
可选地,将各链接的初始权重对应转换为各节点的转换权重,可以包括:针对每一节点,将所有方向是从节点出去的链接的初始权重之和,作为节点的转换权重。
可选地,继续以图3b示出的链接的转换权重为例,假设图中的链接的转换权重为链接的初始权重,以节点C为例,所有方向是从节点C出去的链接有三个,即C-E,C-F,C-H的链接,那么节点C的转换权重为2+4+4=10。
可选地,将各链接的初始权重对应转换为各节点的转换权重,可以包括:针对每一节点,将所有方向是进入节点的链接的初始权重之和与所有方向是从节点出去的链接的初始权重之和求平均,作为节点的转换权重;
可选地,继续以图3b示出的链接的转换权重为例,假设图中的链接的转换权重为链接的初始权重,以节点C为例,所有方向是进入节点C的链接有两个,即A-C,B-C的链接,所有方向是从节点C出去的链接有三个,即C-E,C-F,C-H的链接,那么节点C的转换权重为(10+10)/2=10。
S211、对每一链接的初始权重进行归一化处理,得到每一链接的归一化权重,之后执行步骤S208。
可选地,将每一链接的初始权重进行归一化处理,可以包括:将每一链接的初始权重按照预定算法归一化到预定区间内。
可选地,例如将每一链接的初始权重归一化到共同区间归一化方法包括但不限于最小值-最大值归一化、均值-方差归一化等。
可选地,链接的初始权重的归一化处理和节点的归一化处理原理相同,链接和节点的初始权重可以归一化到相同的区间,也可以是不同的区间。
S212、基于一组第二预设比例系数,将每一节点的归一化权重和每一节点的转换权重进行加权处理,得到每一节点的融合权重。
S213、基于各节点的融合权重,确定目标领域的演化路径。
可选地,基于各节点的融合权重,确定目标领域的演化路径,可以包括:
基于预定的搜索方式,从待处理网络中确定至少一个候选路径;候选路径包括节点和链接。
将各候选路径中的节点的融合权重相加,得到至少一个路径权重。
从各路径权重中,确定最大的前预设数量的路径权重,并将所确定的路径权重对应的候选路径,作为目标路径。
基于目标路径,得到目标领域的演化路径。
可选地,步骤S201、S202、S203、S204、S205、S206、S211、S208、S209可以作为一个实施例,是集成链接的重要性度量方法得到的演化路径,步骤S201、S202、S203、S204、S205、S207、S210、S212、S213可以作为另一个实施例,是集成节点的重要性度量方法得到的演化路径,两个实施例分别基于链接的融合权重和节点的融合权重,确定目标领域的演化路径。
可选地,可以基于上述两个实施例中的任意一个得到演化路径,也可以基于上述两个实施例,分别得到两个演化路径。
本申请实施例在探测特定领域演化轨迹的过程中,通过有机融合链接重要性和节点重要性,充分利用了传统方法的优点并克服了其缺点。所探测的演化轨迹长度适中,能够呈现更加丰富的知识发展路径,更全面地聚集于对领域发展起到重要作用的节点。
而且,本申请实施例适用于科技情报、数据挖掘、文献计量分析领域,适用于从科技文献中刻画领域发展脉络,比如梳理领域发展的重要文献和研究脉络,了解科技文献中科学研究成果的发展趋势与演变历程等,有助于快速把握领域知识的演变关系,揭示研究热点并预测领域未来发展方向,具有重要研究意义。
作为一种示例,本申请实施例提供一种信息处理方法,进一步说明本申请实施例的信息处理过程,包括如下步骤:
第1步:确定弱信号领域的检索式,关键词:弱信号”、“水平扫描”、“环境扫描”、“变化种子”、“外卡”、“黑天鹅”、“预警信号”、“未来信号”、“新兴信号”、“对未来的预期”或“战略意外”(英文检索式:"weak sign*"OR"horizon scan*"OR"environmental scan*"OR"seed*of change"OR"wild card*"OR"black swan*"OR"early warning sign*"OR"futuresign*"OR"emerging sign*"OR"anticipation of the future"OR"strategicsurprise"),限制文献类型包括文章或审查程序文件等,限制研究领域包括计算机科学、社会科学、商业、管理与会计、经济学、计量经济学和金融决策科学。收集整体Scopus数据库(一种数据库)从1975至2020年共204篇弱信号领域相关科学文献信息及其引文信息。同时,基于收集的全部文献间的引用关系构建相应的引文网络。
第2步:在第1步的基础上,对引文网络进行预处理,包括移除引文网络的环状结构,之后提取最大弱连通子图。预处理完成后整理得到一个包含108个节点,408条链接的最大弱连通子图。
第3步:在第2步的基础上,将提取的最大弱连通子图转变为标准形式。确定入度为零但出度不为零的目标节点集合包括27个节点,出度为零但入度不为零的源节点集合包括46个节点。添加一个新的目标节点t和源节点s,在目标节点t和集合/>中每个节点之间增加一条有向链接,共添加27条有向链接,对于集合/>中每个节点和源节点s之间增加一条有向链接,共添加46条有向链接。标准化完成后整理得到包含110个节点,481条链接的有向无环网络。
第4步:在第3步的基础上,采用中介性方法计算所有节点的初始权重。中介性方法需要预先设置参数p,令参数p=n/2m,其中n和m分别表示有向无环网络中节点数和链接数。因此,本实施例设定p≈0.11。需要强调的是,在利用节点的中介值判断节点重要性时,所有节点中介值的绝对大小没有意义,相对大小才具有实际意义。因此,还需要对全部节点的中介值进行重新计算。本实施例采用了调和计数方法(Harmonic counting scheme),如公式(1)所示。
其中,n表示节点数量,rv(1≤v≤n)表示节点v中介值的排名顺序。
基于以上操作,可以获得有向无环网络中全部节点的重要性,共得到110个节点重要性的初始权重,记为interm(v)。
第5步:在第4步的基础上,本实施例采用了intermediacy-in转化方法,将每个节点的初始权重赋给其所有进入这个节点的链接,作为该链接的转换权重,共转化为481个链接的转换权重,记为interm(e)。
第6步:在第3步的基础上,采用搜索路径节点对法(SPNP)计算所有链接的重要性,共得到481个链接重要性的权重,记为traversal(e)。
第7步:在第6步的基础上,本实施例采用了SPNP-WoD转化方法(转化原理:针对每一节点,将所有方向是从节点出去的链接的初始权重之和,作为节点的转换权重),将得到的链接的初始权重转化为度量节点重要性的节点的转换权重,共转化得到110个节点重要性的权重,记为traversal(v)。
第8步:在第4步至第7步的基础上,对所有节点的初始权重interm(v),转换权重traversal(v)和所有链接的初始权重traversal(e)和转换权重interm(e),实施例采用了最小值-最大值归一化(min-max)方法,如公式(2)和(3)所示,归一化至共同区间[0.01,0.99]。
其中,interm′(.)为interm(.)的节点的归一化权重,maxinterm和mininterm分别为节点的初始权重的最大值和最小值,共同区间对应为[0.01,0.99],l为0.01,/>为0.09。同理,traversal′(·)为traversal(·)的链接的归一化权重,maxtraversal和mintraversal分别为链接的初始权重的最大值和最小值。
第9步,在第8步的基础上,本实施例采用了两种集成方案:节点集成模式或链接集成模式。其中需要集成的2种节点重要性度量方法记为集合需要集成的2种链接重要性度量方法记为集合在本实施例中,采用线性加权法将节点或链接重要性度量方法进行集成,如公式(4)和(5)所示。
weight(v)=α*interm′(v)+(1-α)*traversal′(v) (4)
weight(e)=β*interm′(e)+(1-β)*traversal′(e) (5)
其中,weight(v)表示集成后节点的融合权重,weight(e)表示集成后链接的融合权重,参数α和β表示一组第二预设比例系数,α∈[0,1],β∈[0,1]。需要说明的是,如果α=1,本实施例退化为中介性方法。如果β=0,则本实施例退化为主路径分析方法。
作为另一种示例,需要集成的M种节点重要性度量方法记为集合将需要集成的N种链接重要性度量方法记为集合集成后的节点或链接的融合权重包括但不限于如下的线性加权法,参见公式(6)和(7)。
其中,weight(v)表示节点的融合权重,weight(e)表示集成后链接的重要性权重,参数αm和βn表示比例系数,αm∈[0,1];/>βn∈[0,1]。需要说明的是,如果或N=1,则本申请实施例退化为了传统演化轨迹探测方法。
第10步:在第9步的基础上,本申请实施例采用了从目标节点到源节点的正向搜索作为优先路径搜索算法,遍历得到节点或链接的融合权重之和排名前T(5≤T≤20)的领域知识流路径,合并这些路径可以得到弱信号领域的演化脉络。值得注意的是,设定不同的比例系数α,β和不同的知识流路径数T可以得到不同的领域演化脉络。因此,本实施例中比例系数设步长为0.1,知识流路径数T设步长为1。通过对比分析多组比例系数α,β和知识流路径数T对应的领域演化脉络,对于集成节点的重要性度量方法,例如本申请实施例采用α=0.6,T=6,对于集成链接重要性度量方法,本申请实施例采用β=0.6,T=7。
第11步:本申请实施例选择Pajek工具对第10步计算得到的领域演化脉络进行可视化展示,进而对比了集成节点重要性度量方法、集成链接重要性度量方法、以及传统演化轨迹探测方法的效果。
参见图4a至图4c所示,分别示出了采样中介性方法得到的演化路径、采用转化方法SPNP-WoD得到演化路径以及本申请实施例采用集成节点的重要性度量方法得到演化路径的示意图。
参见图5a至图5c所示,分别示出了采用搜索路径节点对法(SPNP),采用转化方法intermediacy-in以及本申请实施例采用的集成链接的重要性度量方法得到演化路径的示意图。
基于上述附图,可以看出搜索路径节点对法(SPNP)呈现的发展脉络中包含的科学文献数量最多,而中介性方法包含的科学文献数量最少。换句话说,主路径分析方法偏向于较长的演化轨迹(最长的路径包括10个节点),中介性方法偏向于得到较短的演化轨迹(最长的路径包括8个节点),本申请实施例采用的两种集成模式能够巧妙平衡这两种方法。
需要强调的是,一方面,本申请实施例识别的弱信号领域演化脉络呈现明显地发散-收敛-发散模式,将弱信号领域研究大致分为三个阶段,这对有针对性的了解弱信号领域不同发展阶段的研究内容具有参考意义,如HiltunenE2008(文献)和ThorleuchterD2015(文献)是演化脉络中的两个关键节点,分别介绍了弱信号不同研究阶段的开创性重要观点。另一方面,还有一些相关技术中提出了弱信号的概念,对后续弱信号的研究具有里程碑意义。但这些相关技术中并未出现在主路径分析的演化脉络,而本申请实施例的集成方法将这篇重要文献纳入了演化轨迹中,进一步验证了本申请实施例的所提方法的有效性。
下面结合附图,示例性地进一步具体说明本申请实施例的采用集成节点的重要性度量方法得到演化路径和采用集成链接的重要性度量方法得到演化路径的优点。
参见图4a所示,一些相关技术中提出了节点AnsoffH1975(文献),以文献名称作为节点名称,而图4b的演化路径遗漏节点AnsoffH1975,图4b中包括节点ThomasP1980(文献)到节点MendoncaS2004(文献)的链接,在图4a所示的演化路径中遗漏,图4c采用本申请实施例采用集成节点的重要性度量方法得到演化路径,集合了中介性方法和转化方法SPNP-WoD的优点,包括节点AnsoffH1975和节点ThomasP1980到节点MendoncaS2004的链接。
同理,参见图5a所示,包括节点AnsoffH1975,而图5b的演化路径遗漏节点AnsoffH1975,图5b中包括节点ThomasP1980到节点MendoncaS2004的链接,在图5a所示的演化路径中遗漏,图5c采用本申请实施例采用集成链接的重要性度量方法得到演化路径,集合了搜索路径节点对法和转化方法intermediacy-in的优点,包括节点AnsoffH1975和节点ThomasP1980到节点MendoncaS2004的链接。
本申请实施例的信息处理方法,是融合链接重要性和节点重要性的演化轨迹探测方法,弥补了链接重要性或节点重要性的演化轨迹探测方法的不足,不仅可以得到演化轨迹长度适中的领域演化模式,而且能够呈现更加丰富的知识发展路径,更全面地聚集于对特定领域发展起到重要作用的节点。
本申请实施例提供一种信息处理装置,参见图6所示,该信息处理装置60包括:获取模块601、第一处理模块602、第二处理模块603、第三处理模块604和第四处理模块605。
获取模块601用于获取待处理网络;待处理网络是基于目标领域的引文网络所确定的,待处理网络包括多个第一元素和多个第二元素。
第一处理模块602用于确定各第一元素的初始权重和各第二元素的初始权重;其中,第一元素为节点,第二元素为链接;或者,第一元素为链接,第二元素为节点,节点的初始权重表示该节点在目标领域的重要程度,链接的初始权重表示该链接连接的两个节点之间的引用关系在目标领域的重要程度。
第二处理模块603用于将各第一元素的初始权重对应转换为各第二元素的转换权重。
第三处理模块604用于将每一第二元素的初始权重和每一第二元素的转换权重进行加权处理,得到每一第二元素的融合权重。
第四处理模块605用于基于各第二元素的融合权重,确定目标领域的演化路径。
可选地,获取模块601用于基于目标领域的检索式,得到引文网络;对引文网络进行预处理,并从预处理后的引文网络中提取最大弱连通子图;最大弱连通子图为有向无环网络,是预处理后的引文网络中第一元素最多和/或第二元素最多的网络;在最大弱连通子图中增加源节点和目标节点,得到待处理网络;目标节点表示待处理网络的起点,源节点表示待处理网络的终点。
第二处理模块603用于当第一元素为节点,第二元素为链接时,将各第一元素的初始权重对应转换为各第二元素的转换权重,包括以下至少一项:针对每一节点,确定与节点连接且方向是进入节点的链接,将所确定的链接的转换权重确定为节点的初始权重;针对每一节点,确定与节点连接且方向是从节点出去的链接,将所确定的链接的转换权重确定为节点的初始权重;针对每一链接,将与链接连接的两个节点的初始权重,基于一组第一预设比例系数进行加权处理,得到链接的转换权重。
第二处理模块603用于当第一元素为链接,第二元素为节点时,将各第一元素的初始权重对应转换为各第二元素的转换权重,包括以下至少一项:针对每一节点,将所有方向是进入节点的链接的初始权重之和,作为节点的转换权重;针对每一节点,将所有方向是从节点出去的链接的初始权重之和,作为节点的转换权重;针对每一节点,将所有方向是进入节点的链接的初始权重之和与所有方向是从节点出去的链接的初始权重之和求平均,作为节点的转换权重。
第三处理模块604用于对每一第二元素的初始权重进行归一化处理,得到每一第二元素的归一化权重;基于一组第二预设比例系数,将每一第二元素的归一化权重和每一第二元素的转换权重进行加权处理,得到每一第二元素的融合权重。
第四处理模块605用于基于预定的搜索方式,从待处理网络中确定至少一个候选路径;候选路径包括第一元素和第二元素;将各候选路径中的第二元素的融合权重相加,得到至少一个路径权重;从各路径权重中,确定最大的前预设数量的路径权重,并将所确定的路径权重对应的候选路径,作为目标路径;基于目标路径,得到目标领域的演化路径。
第四处理模块605用于将待处理网络中的目标路径保留,其余第一元素和第二元素删除,形成演化路径并展示。
本申请实施例的信息处理装置60用于执行本申请实施例的任一信息处理方法,信息处理装置60的各模块的功能与信息处理方法一致,再此不再赘述。
本申请实施例提供一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,处理器执行计算机程序以实现本申请任一项方法的步骤。
在一个可选实施例中提供了一种电子设备,如图7所示,图7所示的电子设备4000包括:处理器4001和存储器4003。其中,处理器4001和存储器4003相连,如通过总线4002相连。可选地,电子设备4000还可以包括收发器4004,收发器4004可以用于该电子设备与其他电子设备之间的数据交互,如数据的发送和/或数据的接收等。需要说明的是,实际应用中收发器4004不限于一个,该电子设备4000的结构并不构成对本申请实施例的限定。
处理器4001可以是CPU(Central Processing Unit,中央处理器),通用处理器,DSP(Digital Signal Processor,数据信号处理器),ASIC(Application SpecificIntegrated Circuit,专用集成电路),FPGA(FieldProgrammable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器4001也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线4002可包括一通路,在上述组件之间传送信息。总线4002可以是PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(ExtendedIndustry Standard Architecture,扩展工业标准结构)总线等。总线4002可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器4003可以是ROM(Read Only Memory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,RAM(Random AccessMemory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM(Electrically ErasableProgrammable Read OnlyMemory,电可擦可编程只读存储器)、CD-ROM(Compact Disc ReadOnlyMemory,只读光盘)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质、其他磁存储设备、或者能够用于携带或存储计算机程序并能够由计算机读取的任何其他介质,在此不做限定。
存储器4003用于存储执行本申请实施例的计算机程序,并由处理器4001来控制执行。处理器4001用于执行存储器4003中存储的计算机程序,以实现前述方法实施例所示的步骤。
本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现本申请任一项方法的步骤。
本申请的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
在本申请实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
应该理解的是,虽然本申请实施例的流程图中通过箭头指示各个操作步骤,但是这些步骤的实施顺序并不受限于箭头所指示的顺序。除非本文中有明确的说明,否则在本申请实施例的一些实施场景中,各流程图中的实施步骤可以按照需求以其他的顺序执行。此外,各流程图中的部分或全部步骤基于实际的实施场景,可以包括多个子步骤或者多个阶段。这些子步骤或者阶段中的部分或全部可以在同一时刻被执行,这些子步骤或者阶段中的每个子步骤或者阶段也可以分别在不同的时刻被执行。在执行时刻不同的场景下,这些子步骤或者阶段的执行顺序可以根据需求灵活配置,本申请实施例对此不限制。
以上所述仅是本申请部分实施场景的可选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请的方案技术构思的前提下,采用基于本申请技术思想的其他类似实施手段,同样属于本申请实施例的保护范畴。

Claims (7)

1.一种信息处理方法,其特征在于,包括:
获取待处理网络;所述待处理网络是基于目标领域的引文网络所确定的,所述待处理网络包括多个第一元素和多个第二元素;
确定各所述第一元素的初始权重和各所述第二元素的初始权重;其中,所述第一元素为节点,所述第二元素为链接;或者,所述第一元素为链接,所述第二元素为节点,所述节点的初始权重表示该节点在所述目标领域的重要程度,所述链接的初始权重表示该链接连接的两个节点之间的引用关系在所述目标领域的重要程度;
将各所述第一元素的初始权重对应转换为各第二元素的转换权重,包括:若所述第一元素为节点,所述第二元素为链接,则所述将各所述第一元素的初始权重对应转换为各第二元素的转换权重,包括以下至少一项:
针对每一所述节点,确定与所述节点连接且方向是进入所述节点的链接,将所确定的链接的转换权重确定为所述节点的初始权重;
针对每一所述节点,确定与所述节点连接且方向是从所述节点出去的链接,将所确定的链接的转换权重确定为所述节点的初始权重;
针对每一所述链接,将与所述链接连接的两个节点的初始权重,基于一组第一预设比例系数进行加权处理,得到所述链接的转换权重;
若所述第一元素为链接,所述第二元素为节点,则所述将各所述第一元素的初始权重对应转换为各第二元素的转换权重,包括以下至少一项:
针对每一所述节点,将所有方向是进入所述节点的链接的初始权重之和,作为所述节点的转换权重;
针对每一所述节点,将所有方向是从所述节点出去的链接的初始权重之和,作为所述节点的转换权重;
针对每一所述节点,将所有方向是进入所述节点的链接的初始权重之和与所有方向是从所述节点出去的链接的初始权重之和求平均,作为所述节点的转换权重;
将每一所述第二元素的初始权重和每一所述第二元素的转换权重进行加权处理,得到每一所述第二元素的融合权重;
基于各所述第二元素的融合权重,确定所述目标领域的演化路径,包括:基于预定的搜索方式,从所述待处理网络中确定至少一个候选路径;所述候选路径包括第一元素和第二元素;将各所述候选路径中的第二元素的融合权重相加,得到至少一个路径权重;从各所述路径权重中,确定最大的前预设数量的路径权重,并将所确定的路径权重对应的候选路径,作为目标路径;基于所述目标路径,得到所述目标领域的演化路径。
2.根据权利要求1所述的信息处理方法,其特征在于,所述获取待处理网络,包括:
基于所述目标领域的检索式,得到所述引文网络;
对所述引文网络进行预处理,并从预处理后的所述引文网络中提取最大弱连通子图;所述最大弱连通子图为有向无环网络,是预处理后的所述引文网络中第一元素最多和/或第二元素最多的网络;
在所述最大弱连通子图中增加源节点和目标节点,得到所述待处理网络;所述目标节点表示所述待处理网络的起点,所述源节点表示所述待处理网络的终点。
3.根据权利要求1所述的信息处理方法,其特征在于,所述将每一所述第二元素的初始权重和每一所述第二元素的转换权重进行加权处理,得到每一所述第二元素的融合权重,包括:
对每一所述第二元素的初始权重进行归一化处理,得到每一所述第二元素的归一化权重;
基于一组第二预设比例系数,将每一所述第二元素的归一化权重和每一所述第二元素的转换权重进行加权处理,得到每一所述第二元素的融合权重。
4.根据权利要求1所述的信息处理方法,其特征在于,所述基于所述目标路径,得到所述目标领域的演化路径,包括:
将所述待处理网络中的所述目标路径保留,其余的第一元素和第二元素删除,形成所述演化路径并展示。
5.一种信息处理装置,其特征在于,包括:
获取模块,用于获取待处理网络;所述待处理网络是基于目标领域的引文网络所确定的,所述待处理网络包括多个第一元素和多个第二元素;
第一处理模块,用于确定各所述第一元素的初始权重和各所述第二元素的初始权重;其中,所述第一元素为节点,所述第二元素为链接;或者,所述第一元素为链接,所述第二元素为节点,所述节点的初始权重表示该节点在所述目标领域的重要程度,所述链接的初始权重表示该链接连接的两个节点之间的引用关系在所述目标领域的重要程度;
第二处理模块,用于将各所述第一元素的初始权重对应转换为各第二元素的转换权重,包括:若所述第一元素为节点,所述第二元素为链接,则所述将各所述第一元素的初始权重对应转换为各第二元素的转换权重,包括以下至少一项:针对每一所述节点,确定与所述节点连接且方向是进入所述节点的链接,将所确定的链接的转换权重确定为所述节点的初始权重;针对每一所述节点,确定与所述节点连接且方向是从所述节点出去的链接,将所确定的链接的转换权重确定为所述节点的初始权重;针对每一所述链接,将与所述链接连接的两个节点的初始权重,基于一组第一预设比例系数进行加权处理,得到所述链接的转换权重;若所述第一元素为链接,所述第二元素为节点,则所述将各所述第一元素的初始权重对应转换为各第二元素的转换权重,包括以下至少一项:针对每一所述节点,将所有方向是进入所述节点的链接的初始权重之和,作为所述节点的转换权重;针对每一所述节点,将所有方向是从所述节点出去的链接的初始权重之和,作为所述节点的转换权重;针对每一所述节点,将所有方向是进入所述节点的链接的初始权重之和与所有方向是从所述节点出去的链接的初始权重之和求平均,作为所述节点的转换权重;
第三处理模块,用于将每一所述第二元素的初始权重和每一所述第二元素的转换权重进行加权处理,得到每一所述第二元素的融合权重;
第四处理模块,用于基于各所述第二元素的融合权重,确定所述目标领域的演化路径,包括:基于预定的搜索方式,从所述待处理网络中确定至少一个候选路径;所述候选路径包括第一元素和第二元素;将各所述候选路径中的第二元素的融合权重相加,得到至少一个路径权重;从各所述路径权重中,确定最大的前预设数量的路径权重,并将所确定的路径权重对应的候选路径,作为目标路径;基于所述目标路径,得到所述目标领域的演化路径。
6.一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,其特征在于,所述处理器执行所述计算机程序以实现权利要求1-4中任一项所述方法的步骤。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-4中任一项所述方法的步骤。
CN202210398913.8A 2022-04-15 2022-04-15 信息处理方法、装置、电子设备及存储介质 Active CN114691814B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210398913.8A CN114691814B (zh) 2022-04-15 2022-04-15 信息处理方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210398913.8A CN114691814B (zh) 2022-04-15 2022-04-15 信息处理方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN114691814A CN114691814A (zh) 2022-07-01
CN114691814B true CN114691814B (zh) 2023-11-10

Family

ID=82142080

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210398913.8A Active CN114691814B (zh) 2022-04-15 2022-04-15 信息处理方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN114691814B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101477536A (zh) * 2008-12-30 2009-07-08 华中科技大学 基于关联网络的科技文献实体综合排序方法
CN103729432A (zh) * 2013-12-27 2014-04-16 河海大学 一种引文数据库中主题文献学术影响力的分析与排序方法
WO2019060999A1 (en) * 2017-09-28 2019-04-04 Quantum Silicon Inc. INITIATION AND MONITORING THE EVOLUTION OF INDIVIDUAL ELECTRONS IN ATOM DEFINED STRUCTURES
WO2019227511A1 (en) * 2018-05-30 2019-12-05 Hong Kong Applied Science and Technology Research Institute Company Limited Method and apparatus for modifying a user data path in a wireless communication network
CN111666472A (zh) * 2020-06-12 2020-09-15 郑州轻工业大学 一种学术链节点的智能识别方法
CN113515589A (zh) * 2021-01-12 2021-10-19 腾讯科技(深圳)有限公司 数据推荐方法、装置、设备以及介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101477536A (zh) * 2008-12-30 2009-07-08 华中科技大学 基于关联网络的科技文献实体综合排序方法
CN103729432A (zh) * 2013-12-27 2014-04-16 河海大学 一种引文数据库中主题文献学术影响力的分析与排序方法
WO2019060999A1 (en) * 2017-09-28 2019-04-04 Quantum Silicon Inc. INITIATION AND MONITORING THE EVOLUTION OF INDIVIDUAL ELECTRONS IN ATOM DEFINED STRUCTURES
WO2019227511A1 (en) * 2018-05-30 2019-12-05 Hong Kong Applied Science and Technology Research Institute Company Limited Method and apparatus for modifying a user data path in a wireless communication network
CN111666472A (zh) * 2020-06-12 2020-09-15 郑州轻工业大学 一种学术链节点的智能识别方法
CN113515589A (zh) * 2021-01-12 2021-10-19 腾讯科技(深圳)有限公司 数据推荐方法、装置、设备以及介质

Also Published As

Publication number Publication date
CN114691814A (zh) 2022-07-01

Similar Documents

Publication Publication Date Title
Pontius Jr et al. Death to Kappa: birth of quantity disagreement and allocation disagreement for accuracy assessment
US20210224821A1 (en) Land usage property identification method, apparatus, electronic device and storage medium
Hou Exploration into the evolution and historical roots of citation analysis by referenced publication year spectroscopy
CN103020302B (zh) 基于复杂网络的学术核心作者挖掘及相关信息抽取方法和系统
Chen A novel PROMETHEE-based method using a Pythagorean fuzzy combinative distance-based precedence approach to multiple criteria decision making
CN106682172A (zh) 一种基于关键词的文献研究热点推荐方法
Chang A comment on the calculation of the total-factor energy efficiency (TFEE) index
CN106462620A (zh) 巨型网络上的距离查询
Jenab et al. A graph-based model for manufacturing complexity
Kaushik et al. Software cost optimization integrating fuzzy system and COA-Cuckoo optimization algorithm
Zhang et al. Research on technology prospect risk of high-tech projects based on patent analysis
Ferster et al. Assessing the quality of forest fuel loading data collected using public participation methods and smartphones
Tian et al. Finding skyline paths in road networks
Mukundan et al. Research performance of Khalifa University of science and technology, Abu Dhabi
Shou et al. Similarity analysis of spatial-temporal mobility patterns for travel mode prediction using twitter data
CN114691814B (zh) 信息处理方法、装置、电子设备及存储介质
Zhu et al. Multiple attribute decision-making based on a prospect theory-based TOPSIS method for venture capital selection with complex information
Andrés-Thió et al. Bifidelity surrogate modelling: showcasing the need for new test instances
Huynh et al. A linguistic screening evaluation model in new product development
JP4059970B2 (ja) 情報源推薦装置
Elahi et al. Evaluating software architectural styles based on quality features through hierarchical analysis and fuzzy integral (FAHP)
Nagappan et al. Agent based weighted page ranking algorithm for Web content information retrieval
Bröhl et al. A perturbation-based approach to identifying potentially superfluous network constituents
CN113849656A (zh) 基于聚类图谱的技术文本挖掘方法和系统
Chawathe Diagnostic classification using hepatitis C tests

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20240313

Address after: 100095, Building 6, No.1 Gaolizhang Road, Haidian District, Beijing, 104-35

Patentee after: Beijing Shiyuan Technology Co.,Ltd.

Country or region after: China

Address before: 100124 No. 100 Chaoyang District Ping Tian Park, Beijing

Patentee before: Beijing University of Technology

Country or region before: China

TR01 Transfer of patent right