CN111126465B - 节点分类方法、装置、终端设备及计算机可读存储介质 - Google Patents

节点分类方法、装置、终端设备及计算机可读存储介质 Download PDF

Info

Publication number
CN111126465B
CN111126465B CN201911287179.2A CN201911287179A CN111126465B CN 111126465 B CN111126465 B CN 111126465B CN 201911287179 A CN201911287179 A CN 201911287179A CN 111126465 B CN111126465 B CN 111126465B
Authority
CN
China
Prior art keywords
node
convolution
classified
information
state information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911287179.2A
Other languages
English (en)
Other versions
CN111126465A (zh
Inventor
吴红艳
纪超杰
李烨
蔡云鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Institute of Advanced Technology of CAS
Original Assignee
Shenzhen Institute of Advanced Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Institute of Advanced Technology of CAS filed Critical Shenzhen Institute of Advanced Technology of CAS
Priority to CN201911287179.2A priority Critical patent/CN111126465B/zh
Publication of CN111126465A publication Critical patent/CN111126465A/zh
Application granted granted Critical
Publication of CN111126465B publication Critical patent/CN111126465B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请适用于图网络数据技术领域,提供了一种节点分类方法、装置、终端设备及计算机可读存储介质,所述方法包括:对待分类节点的特征信息进行L次卷积计算,得到待分类节点的L个状态信息,根据每个状态信息和预先训练得到的饱和度计算参数,确定每个状态信息的信息饱和度,根据L个状态信息的信息饱和度,确定待分类节点的卷积截断步,根据L个状态信息中的前M个状态信息,生成待分类节点的最终状态信息,根据待分类节点的最终状态信息进行分类,确定待分类节点的节点类型,避免了根据固定的预设跳数范围确定待分类节点的节点类型,提高了对待分类节点进行分类的准确度。

Description

节点分类方法、装置、终端设备及计算机可读存储介质
技术领域
本申请属于图网络数据技术领域,尤其涉及一种节点分类方法、装置、终端设备及计算机可读存储介质。
背景技术
图网络数据是指包括多个点和边构成的数据模型,其中点表示实体,边表示两个实体间的关系。在对图网络数据进行深度挖掘的过程中,可以通过神经网络对图网络数据中的各个节点进行分类。
相关技术中,可以根据某个节点的邻居节点,预测得到该节点的节点类型,其中,与该节点之间的距离为一跳的距离的邻居节点为直接邻居节点,而与该节点之间的距离为多跳的距离的邻居节点为间接邻居节点。
相应的,可以获取任意一个节点的特征信息,再将预设跳数范围内的直接邻居节点和间接邻居节点均作为该节点的邻居节点,计算该节点与每个邻居节点之间的关联度,并根据各个关联度更新该节点的特征信息,最后根据该节点的更新后的特征信息进行分类,得到该节点的节点类型。
但是,在预设跳数范围内选取邻居节点,若直接邻居节点较多,则选取较多的间接邻居节点会影响分类的准确度,而直接邻居节点较少,则选取较少的间接邻居节点也会影响分类的准确度,从而会导致分类不准确的问题。
发明内容
本申请实施例提供了一种节点分类方法、装置、终端设备及计算机可读存储介质,可以解决分类结果不准确问题。
第一方面,本申请实施例提供了一种节点分类方法,包括:
对待分类节点的特征信息进行L次卷积计算,得到所述待分类节点的L个状态信息,其中,L为正整数,所述L次卷积计算中的第i次卷积计算的过程为:根据所述待分类节点的当前特征信息和对应的邻居节点的当前特征信息,计算得到所述待分类节点更新后的特征信息,并根据所述更新后的特征信息和所述待分类节点的当前状态信息进行计算,得到所述待分类节点的更新后的状态信息,所述当前特征信息为第i-1次卷积计算过程所更新的特征信息,所述当前状态信息为第i-1次卷积计算过程得到的状态信息;
根据每个所述状态信息和预先训练得到的饱和度计算参数,确定每个所述状态信息的信息饱和度;
根据所述L个状态信息的所述信息饱和度,确定所述待分类节点的卷积截断步;
根据所述L个状态信息中的前M个状态信息,生成所述待分类节点的最终状态信息,所述M表示所述卷积截断步的参数值,所述M为正整数、且小于或等于所述L;
根据所述待分类节点的最终状态信息进行分类,确定所述待分类节点的节点类型。
可选的,所述根据所述L个状态信息的所述信息饱和度,确定所述待分类节点的卷积截断步,包括:
从所述L个状态信息的所述信息饱和度中,选取不同数目的信息饱和度进行求和,得到多个饱和度和值;
从多个所述饱和度和值中选取目标饱和度和值,所述目标饱和度和值大于或等于和值阈值、且与所述和值阈值之间的差值最小;
将所述目标饱和度和值所对应的信息饱和度的数目,作为所述卷积截断步。
可选的,所述根据所述L个状态信息中的前M个状态信息,生成所述待分类节点的最终状态信息,包括:
从多个所述状态信息选取前M个目标状态信息;
对于每个所述目标状态信息,获取所述目标状态信息与所述目标状态信息的权重之间的乘积,每个所述目标状态信息的权重是根据所述目标状态信息的信息饱和度得到的;
对多个所述乘积进行累加,得到所述待分类节点的最终状态信息。
可选的,所述根据所述待分类节点的当前特征信息和对应的邻居节点的当前特征信息,计算得到所述待分类节点更新后的特征信息,包括:
对所述待分类节点的当前特征信息进行N次头卷积计算,得到所述待分类节点的N个卷积特征信息,其中N为正整数,所述N次头卷积计算中的第j次头卷积计算的过程为:根据所述待分类节点的当前特征信息、所述邻居节点的当前特征信息、以及第j次头卷积对应的关联度计算参数进行计算,得到所述待分类节点与所述邻居节点之间第j次头卷积对应的关联度,并根据所述第j次头卷积对应的关联度、所述邻居节点的当前特征信息和第j次头卷积对应的头卷积核进行计算,得到第j次头卷积对应的卷积特征信息;
根据多个所述卷积特征信息进行拼接,得到所述待分类节点的更新后的特征信息。
可选的,所述根据所述待分类节点的当前特征信息、所述邻居节点的当前特征信息、以及第j次头卷积对应的关联度计算参数进行计算,得到所述待分类节点与所述邻居节点之间第j次头卷积对应的关联度,包括:
将所述邻居节点与所述待分类节点之间的距离,嵌入所述邻居节点的当前特征信息中,得到距离特征信息;
根据所述待分类节点的当前特征信息和所述距离特征信息,结合所述第j次头卷积对应的关联度计算参数进行计算,得到所述待分类节点与所述邻居节点之间第j次头卷积对应的关联度。
可选的,所述根据所述第j次头卷积对应的关联度、所述邻居节点的当前特征信息和第j次头卷积对应的头卷积核进行计算,得到第j次头卷积对应的卷积特征信息,包括:
根据针对不同邻居节点的第j次头卷积对应的关联度进行归一化,得到多个第j次头卷积对应的归一化后的关联度;
根据多个所述第j次头卷积对应的归一化后的关联度、各个所述邻居节点的当前特征信息和所述第j次头卷积对应的头卷积核进行计算,得到所述第j次头卷积对应的卷积特征信息。
第二方面,本申请实施例提供了一种节点分类装置,所述装置包括:
卷积模块,用于对待分类节点的特征信息进行L次卷积计算,得到所述待分类节点的L个状态信息,其中,L为正整数,所述L次卷积计算中的第i次卷积计算的过程为:根据所述待分类节点的当前特征信息和对应的邻居节点的当前特征信息,计算得到所述待分类节点更新后的特征信息,并根据所述更新后的特征信息和所述待分类节点的当前状态信息进行计算,得到所述待分类节点的更新后的状态信息,所述当前特征信息为第i-1次卷积计算过程所更新的特征信息,所述当前状态信息为第i-1次卷积计算过程得到的状态信息;
饱和度计算模块,用于根据每个所述状态信息和预先训练得到的饱和度计算参数,确定每个所述状态信息的信息饱和度;
截断步确定模块,用于根据所述L个状态信息的所述信息饱和度,确定所述待分类节点的卷积截断步;
生成模块,用于根据所述L个状态信息中的前M个状态信息,生成所述待分类节点的最终状态信息,所述M表示所述卷积截断步的参数值,所述M为正整数、且小于或等于所述L;
分类模块,用于根据所述待分类节点的最终状态信息进行分类,确定所述待分类节点的节点类型。
可选的,所述截断步确定模块,还用于从所述L个状态信息的所述信息饱和度中,选取不同数目的信息饱和度进行求和,得到多个饱和度和值;从多个所述饱和度和值中选取目标饱和度和值,所述目标饱和度和值大于或等于和值阈值、且与所述和值阈值之间的差值最小;将所述目标饱和度和值所对应的信息饱和度的数目,作为所述卷积截断步。
可选的,所述生成模块,还用于从多个所述状态信息选取前M个目标状态信息;对于每个所述目标状态信息,获取所述目标状态信息与所述目标状态信息的权重之间的乘积,每个所述目标状态信息的权重是根据所述目标状态信息的信息饱和度得到的;对多个所述乘积进行累加,得到所述待分类节点的最终状态信息。
可选的,所述卷积模块,还用于对所述待分类节点的当前特征信息进行N次头卷积计算,得到所述待分类节点的N个卷积特征信息,其中N为正整数,所述N次头卷积计算中的第j次头卷积计算的过程为:根据所述待分类节点的当前特征信息、所述邻居节点的当前特征信息、以及第j次头卷积对应的关联度计算参数进行计算,得到所述待分类节点与所述邻居节点之间第j次头卷积对应的关联度,并根据所述第j次头卷积对应的关联度、所述邻居节点的当前特征信息和第j次头卷积对应的头卷积核进行计算,得到第j次头卷积对应的卷积特征信息;根据多个所述卷积特征信息进行拼接,得到所述待分类节点的更新后的特征信息。
可选的,所述卷积模块,还用于将所述邻居节点与所述待分类节点之间的距离,嵌入所述邻居节点的当前特征信息中,得到距离特征信息;根据所述待分类节点的当前特征信息和所述距离特征信息,结合所述第j次头卷积对应的关联度计算参数进行计算,得到所述待分类节点与所述邻居节点之间第j次头卷积对应的关联度。
可选的,所述卷积模块,还用于根据针对不同邻居节点的第j次头卷积对应的关联度进行归一化,得到多个第j次头卷积对应的归一化后的关联度;根据多个所述第j次头卷积对应的归一化后的关联度、各个所述邻居节点的当前特征信息和所述第j次头卷积对应的头卷积核进行计算,得到所述第j次头卷积对应的卷积特征信息。
第三方面,本申请实施例提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面中任一项所述的节点分类方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面中任一项所述的节点分类方法。
第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述第一方面中任一项所述的节点分类方法。
可以理解的是,上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
本申请实施例与现有技术相比存在的有益效果是:
本申请实施例通过对待分类节点的特征信息进行L次卷积计算,得到待分类节点的L个状态信息,并根据每个状态信息和预先训练得到的饱和度计算参数,确定每个状态信息的信息饱和度,再根据L个状态信息的信息饱和度,确定待分类节点的卷积截断步,之后根据L个状态信息中的前M个状态信息,生成待分类节点的最终状态信息,最后根据待分类节点的最终状态信息进行分类,确定待分类节点的节点类型。由于待分类节点的状态信息是由每次卷积的特征信息生成的,而每次卷积的特征信息是由不同距离的邻居节点的特征信息生成的,则可以根据各个状态信息,确定合适的卷积范围,也即是确定卷积截断步,最后根据该卷积范围内的各个邻居节点的特征信息,对待分类节点进行分类,得到待分类节点的节点类型,避免了根据固定的预设跳数范围确定待分类节点的节点类型,提高了对待分类节点进行分类的准确度。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种图数据网络的示意图;
图2是本申请实施例提供的一种终端设备的结构示意图;
图3是本申请实施例提供的一种节点分类方法的示意性流程图;
图4是本申请实施例提供的另一种节点分类方法的示意性流程图;
图5是本申请实施例提供的一种获取待分类节点的更新后的特征信息方法的示意性流程图;
图6是本申请实施例提供的一种节点分类装置的结构框图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
本申请实施例提供的节点分类方法可以应用于手机、平板电脑、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本、个人数字助理(personal digital assistant,PDA)等终端设备上,本申请实施例对终端设备的具体类型不作任何限制。
首先,对本申请中涉及的概念进行示例性的解释,图1是本申请提供的一种图数据网络的示意图,如图1所示,图数据网络可以包括多个节点,而每个节点对应一个类别,各个节点的类别可以相同,也可以不同。
其中,各个节点的类别可以是已知的,也可以是未知的,则在实际应用中,可以根据已知节点的类别,推断得到未知节点的类别。
例如,若图1为论文引用关系网络,且图1中的节点1对应的类别可以为生物信息学、节点2对应的类别可以为计算机科学、节点3和节点4对应的类别可以为生物学,而节点5至节点9则属于未知学科,则需要根据节点1至节点4的信息,推理得到节点5至节点9分别对应的学科。其中,各个节点的信息不但可以包括论文对应的类别,还可以包括论文的名称。
上述举例仅以引文网络的节点分类为例进行说明,而在实际应用中,针对图网络数据中各个节点的分类还可以应用在其他领域,如社交网络的节点分类和生物化学结构网络的节点分类,本申请实施例对图网络数据的节点分类的应用场景不做限定。
图2是本申请实施例提供的一种终端设备的结构示意图。如图2所示,该实施例的终端设备20包括:至少一个处理器201(图2中仅示出一个)处理器、存储器202以及存储在所述存储器202中并可在所述至少一个处理器201上运行的计算机程序203,所述处理器201执行所述计算机程序203时实现下述任意各个节点分类方法实施例中的步骤。
所述终端设备20可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。该终端设备可包括,但不仅限于,处理器201、存储器202。本领域技术人员可以理解,图2仅仅是终端设备20的举例,并不构成对终端设备20的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如还可以包括输入输出设备、网络接入设备等。
所称处理器201可以是中央处理单元(Central Processing Unit,CPU),该处理器201还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器202在一些实施例中可以是所述终端设备20的内部存储单元,例如终端设备20的硬盘或内存。所述存储器202在另一些实施例中也可以是所述终端设备20的外部存储设备,例如所述终端设备20上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器202还可以既包括所述终端设备20的内部存储单元也包括外部存储设备。所述存储器202用于存储操作系统、应用程序、引导装载程序(BootLoader)、数据以及其他程序等,例如所述计算机程序的程序代码等。所述存储器202还可以用于暂时地存储已经输出或者将要输出的数据。
图3是本申请实施例提供的一种节点分类方法的示意性流程图,作为示例而非限定,该方法可以应用于上述终端设备20中。参见图3,该方法包括:
S301、对待分类节点的特征信息进行L次卷积计算,得到待分类节点的L个状态信息。
其中,L为正整数。而且,待分类节点的特征信息是根据待分类节点信息提取得到的,可以用于表示待分类节点对应的实体的性质、特征和属性等信息,而待分类节点的状态信息是根据待分类节点和邻居节点的特征信息卷积得到的,可以用于表示待分类节点与邻居节点之间的相关程度等信息。
在对节点分类的过程中,可以根据待分类节点在每次卷积中得到的特征信息,生成与该次卷积相对应的状态信息,从而在经过多次卷积后,可以得到每次卷积相对应的状态信息,以便在后续步骤中,可以根据多个状态信息确定待分类节点的类型。
而在每次卷积的过程中,均可以采用类似的方式获取该次卷积所对应的状态信息。例如,L次卷积计算中的第i次卷积计算的过程可以为:
根据待分类节点的当前特征信息和对应的邻居节点的当前特征信息,计算得到待分类节点更新后的特征信息,并根据更新后的特征信息和待分类节点的当前状态信息进行计算,得到待分类节点的更新后的状态信息。
其中,当前特征信息为第i-1次卷积计算过程所更新的特征信息,当前状态信息为第i-1次卷积计算过程得到的状态信息。
在一种可能的实现方式中,可以根据待分类节点当前特征信息和邻居节点的当前特征信息,计算待分类节点与邻居节点之间的关联度,再根据计算得到的关联度和邻居节点的当前特征信息进行计算,得到待分类节点的更新后的特征信息。
相应的,可以获取待分类节点的当前状态信息,并结合更新后的特征信息进行计算,通过预先训练得到卷积函数对当前状态信息和更新后的特征信息进行卷积,得到待分类节点的更新后的状态信息。
在实际应用中,可以按照上述方式在L次卷积过程中,生成待分类节点的L个状态信息。
但是,在生成状态信息的过程中,需要对卷积次数进行记录,并根据记录的卷积次数进行判断,确定是否达到最大卷积次数L,从而确定是否需要继续更新待分类节点的特征信息,以便生成待分类节点的状态信息。
可选的,可以通过预先设置的卷积次数和编码向量之间的对应关系,向更新后的特征信息添加卷积次数所对应的编码向量,得到包括卷积次数的特征信息,再根据该包括卷积次数的特征信息和当前状态信息进行卷积,得到更新后的状态信息。
例如,可以通过预先训练的公式向更新后的特征信息添加卷积次数所对应的编码向量,该公式可以为
Figure BDA0002318336980000091
其中,
Figure BDA0002318336980000092
为节点i在第l次卷积时包括卷积次数的特征信息,
Figure BDA0002318336980000093
为更新后的特征信息,tel为卷积次数l对应的编码信息,体现了卷积次数和编码向量之间的对应关系,a2(tel)为通过a2()与
Figure BDA0002318336980000094
的维度相一致的tel的编码向量,a2()为用于维度对齐的全连接网络层。
相应的,在根据包括卷积次数的特征信息和当前状态信息进行卷积的过程中,可以先对包括卷积次数的特征信息进行提取,得到待分类节点的卷积次数,并将该卷积次数与最大卷积次数L进行比较,确定该卷积次数是否已经达到最大卷积次数,若已经达到最大卷积次数,则在本次生成状态信息后,无需再次对待分类节点的特征信息进行更新,也无需再次生成待分类节点的状态信息。
但是,若卷积次数并未达到最大卷积次数,则可以再次按照上述方式,再次对待分类节点的更新后的特征信息进行更新,从而再次生成待分类节点的状态信息,直至卷积次数达到最大卷积次数。
例如,也可以通过预先训练的公式,对当前状态信息和包括卷积次数的特征信息进行卷积,该公式可以为
Figure BDA0002318336980000101
其中,
Figure BDA0002318336980000102
为待分类节点i的更新后的状态信息,
Figure BDA0002318336980000103
为待分类节点i的当前状态信息,
Figure BDA0002318336980000104
为待分类节点i的包括卷积次数的特征信息。
但是,在卷积次数为1时,可以通过其他公式进行计算,得到更新后的状态信息,该公式可以为
Figure BDA0002318336980000105
其中,
Figure BDA0002318336980000106
为待分类节点i的更新后的状态信息,mean()为按向量维度求平均函数,
Figure BDA0002318336980000107
为待分类节点i的包括卷积次数的特征信息。而
Figure BDA0002318336980000108
其中,root(i)为待分类节点的直接邻居节点的集合,
Figure BDA0002318336980000109
为邻居节点u在第l次卷积时的特征信息,u为多个邻居节点中的任意一个邻居节点。
需要说明的是,在实际应用中,也可以在生成包括卷积次数的特征信息之后,判断是否达到最大卷积次数,若卷积次数超过最大卷积次数,则不再执行卷积获取更新后的状态信息的操作,而是执行S302,本申请实施例对确定卷积次数是否已经达到最大卷积次数的时机不做限定。
另外,在实际应用中,待分类节点在图网络数据中可以包括多个邻居节点,本申请实施例仅是以一个邻居节点为例进行说明,本申请实施例对邻居节点的数目不做限定。
S302、根据每个状态信息和预先训练得到的饱和度计算参数,确定每个状态信息的信息饱和度。
在计算得到待分类节点的多个状态信息后,可以根据训练得到的饱和度计算参数进行计算,得到每个状态信息的信息饱和度,以便在后续步骤中,可以根据各个信息饱和度确定待分类节点的卷积截断步。
在一种可能的实现方式中,对于每个状态信息,可以将该状态信息输入预先设置的公式中,并结合公式中的饱和度计算参数,计算得到该状态信息所对应的信息饱和度,从而计算得到每个状态信息对应的信息饱和度。
例如,计算信息饱和度的公式可以为:
Figure BDA00023183369800001010
其中,
Figure BDA00023183369800001011
为待分类节点i第l次卷积的状态信息所对应的信息饱和度,Whault和bhault均为预先训练的饱和度计算参数,
Figure BDA0002318336980000111
为待分类节点i第l次卷积的状态信息。
S303、根据L个状态信息的信息饱和度,确定待分类节点的卷积截断步。
由前述可知,每个状态信息是由待分类节点的特征信息生成的,而待分类节点的特征信息在不同的卷积轮数中,是由不同距离的邻居节点的特征信息所构成的,则每次卷积得到的状态信息也是由不同距离的邻居节点的特征信息所生成的。
相应的,根据不同状态信息的信息饱和度确定卷积截断步,则是在根据不同距离的邻居节点的特征信息,确定能够准确对待分类节点进行分类的邻居节点,从而得到待分类节点与邻居节点之间的最大距离,也即是该卷积截断步。
在一种可能的实现方式中,可以根据计算得到的多个信息饱和度,选取不同数目的信息饱和度进行求和,得到饱和度和值,并将计算得到的各个饱和度和值与预先设置的和值阈值进行比较,选取最接近和值阈值、且大于或等于该和值阈值的饱和度和值,从而可以将该饱和度和值对应的信息饱和度的数目作为卷积截断步。
需要说明的是,用于计算饱和度和值的各个信息饱和度是基于第一次卷积对应的信息饱和度与后续相邻的各个信息饱和度连续相加得到的。例如,饱和度和值可以为
Figure BDA0002318336980000112
其中,
Figure BDA0002318336980000113
为待分类节点i在第l次卷积的信息饱和度,l′为卷积截断步对应的卷积次数,饱和度和值在l为1的情况下开始进行累加。
S304、根据L个状态信息中的前M个状态信息,生成待分类节点的最终状态信息。
其中,M表示卷积截断步的参数值,M为正整数、且小于或等于L。
在确定卷积截断步之后,即可根据卷积截断步选取与卷积截断步的参数相一致的数目的状态信息,从而根据选取的多个状态信息进行求和,得到待分类节点的最终状态信息。
在一种可能的实现方式中,可以先确定卷积截断步对应的参数值M,并根据该参数值,从多个状态信息中,按照卷积次数从小到大的顺序,选取M个状态信息,也即是,选取状态信息中的前M个状态信息,并结合各个状态信息的权重,对各个状态信息进行求和,从而得到待分类节点的最终状态信息。
其中,每个状态信息的权重可以由该状态信息的信息饱和度生成。
S305、根据待分类节点的最终状态信息进行分类,确定待分类节点的节点类型。
在得到待分类节点的最终状态信息后,则可以根据预先训练的全连接层,对待分类节点进行分类,得到全连接层输出的待分类节点的节点类型。其中,全连接层是通过大量的样本数据训练得到的,该样本数据可以包括样本节点的特征标识和节点类型。
在一种可能的实现方式中,可以将计算得到的最终状态信息输入全连接层的输入层,通过全连接层的至少一个隐藏层对最终状态信息进行分析识别,最后通过全连接层的输出层输出待分类节点的节点类型,从而完成对待分类节点的分类。
需要说明的是,本申请实施例仅是以一个待分类节点为例进行说明,但是在实际应用中,可以对图网络数据中的多个节点按照上述方式进行分类,从而得到多个节点的节点类型,本申请实施例对待分类节点的数目不做限定。
综上所述,本申请实施例提供的节点分类方法,通过对待分类节点的特征信息进行L次卷积计算,得到待分类节点的L个状态信息,并根据每个状态信息和预先训练得到的饱和度计算参数,确定每个状态信息的信息饱和度,再根据L个状态信息的信息饱和度,确定待分类节点的卷积截断步,之后根据L个状态信息中的前M个状态信息,生成待分类节点的最终状态信息,最后根据待分类节点的最终状态信息进行分类,确定待分类节点的节点类型。由于待分类节点的状态信息是由每次卷积的特征信息生成的,而每次卷积的特征信息是由不同距离的邻居节点的特征信息生成的,则可以根据各个状态信息,确定合适的卷积范围,也即是确定卷积截断步,最后根据该卷积范围内的各个邻居节点的特征信息,对待分类节点进行分类,得到待分类节点的节点类型,避免了根据固定的预设跳数范围确定待分类节点的节点类型,提高了对待分类节点进行分类的准确度。
图4是本申请实施例提供的另一种节点分类方法的示意性流程图,作为示例而非限定,该方法可以应用于上述终端设备20中。参见图4,该方法包括:
S401、对待分类节点的特征信息进行L次卷积计算,得到待分类节点的L个状态信息。
其中,L为正整数。
而且,L次卷积计算中的第i次卷积计算的过程可以为:
根据待分类节点的当前特征信息和对应的邻居节点的当前特征信息,计算得到待分类节点更新后的特征信息,并根据更新后的特征信息和待分类节点的当前状态信息进行计算,得到待分类节点的更新后的状态信息。
其中,当前特征信息为第i-1次卷积计算过程所更新的特征信息,当前状态信息为第i-1次卷积计算过程得到的状态信息。
S402、根据每个状态信息和预先训练得到的饱和度计算参数,确定每个状态信息的信息饱和度。
S403、从L个状态信息的信息饱和度中,选取不同数目的信息饱和度进行求和,得到多个饱和度和值。
计算得到各个状态信息的信息饱和度之后,可以对不同数目的各个信息饱和度进行求和,从而得到多个饱和度和值,以便在后续步骤中,可以根据多个饱和度和值确定卷积截断步。
在一种可能的实现方式中,可以根据卷积次数的大小,按照各个状态信息对应的卷积次数从小到大的顺序,选取前X-1个信息饱和度进行求和,得到饱和度和值,并判断该饱和度和值是否满足预先设置的和值选取条件,若不满足该和值选取条件,则可以对信息饱和度的数目进行累加,再次选取前X个信息饱和度进行求和,直至选取的信息饱和度满足该和值选取条件。
其中,X为正整数,且小于或等于L。
需要说明的是,在实际应用中,可以按照上述方式获得多个饱和度和值,也可以依次累加信息饱和度的数目,从而得到多个饱和度和值,并执行S404以确定目标饱和度和值。
S404、从多个饱和度和值中选取目标饱和度和值。
其中,目标饱和度和值大于或等于和值阈值、且与和值阈值之间的差值最小。
在得到饱和度和值之后,可以将该饱和度和值与预先设置的和值阈值进行比较,根据比较结果确定该饱和度和值是否满足和值选取条件,从而可以确定该饱和度和值是否为目标饱和度和值。
在一种可能的实现方式中,可以将该饱和度和值与预先设置的和值阈值进行比较,判断该饱和度和值是否大于或等于和值阈值,若该饱和度和值小于和值阈值,则可以返回S403累加下一信息饱和度,再次得到饱和度和值,并再次判断该饱和度和值是否大于或等于该和值阈值,直至得到大于或等于该和值阈值的目标饱和度和值。
但是,若该饱和度和值大于或等于和值阈值,则可以将该饱和度和值作为目标饱和度和值。
S405、将目标饱和度和值所对应的信息饱和度的数目,作为卷积截断步。
在确定目标饱和度和值之后,则可以根据组成目标饱和度和值的各个信息饱和度,并统计各个信息饱和度的数目,从而将该数目作为用于生成待分类节点最终状态信息的卷积截断步。
例如,计算卷积截断步的公式可以为:
Figure BDA0002318336980000141
其中,N(i)为待分类节点i的卷积截断步,
Figure BDA0002318336980000142
为待分类节点i第l次卷积的状态信息所对应的信息饱和度,1-ε为预先设置的和值阈值,ε的参数值极小,例如ε的参数值可以为0.01。
S406、根据L个状态信息中的前M个状态信息,生成待分类节点的最终状态信息。
其中,M表示卷积截断步的参数值,M为正整数、且小于或等于L。
由于各个邻居节点与待分类节点之间的距离不同,则根据各个邻居节点的特征信息生成的状态信息在确定待分类节点的节点类型的过程中所起的作用也不同,则可以根据卷积截断步选取多个状态信息中的前M个状态信息,并根据前M个状态信息中每个状态信息的信息饱和度,计算得到各个状态信息的权重。
可选的,可以从多个状态信息选取前M个目标状态信息,对于每个目标状态信息,获取该目标状态信息与该目标状态信息的权重之间的乘积,对多个乘积进行累加,得到待分类节点的最终状态信息。
其中,每个目标状态信息的权重是根据目标状态信息的信息饱和度得到的。
在一种可能的实现方式中,可以先根据卷积截断步对应的参数值M,从待分类节点的多个状态中,选取前M个状态信息,也即是,从第1次卷积得到状态信息开始,选取前M次卷积得到的状态信息,再获取M个状态信息的信息饱和度,从而可以将各个信息饱和度作为相对应的状态信息的权重。
之后,可以根据每个状态信息和相对应的权重进行计算,得到状态信息和权重的乘积,再对多个乘积进行累加,得到待分类节点的最终状态信息。
例如,在计算最终状态信息的过程中,可以通过公式
Figure BDA0002318336980000151
进行计算,其中,si为待分类节点i的最终状态信息,
Figure BDA0002318336980000152
为待分类节点i在第l次卷积的状态信息,
Figure BDA0002318336980000153
为与
Figure BDA0002318336980000154
相对应的权重。
需要说明的是,在实际应用中,若卷积截断步对应的参数值为M,则可以对第M个状态信息对应的权重进行调整,从而得到更加准确的最终状态信息。例如,第M个状态信息对应的权重可以为:
Figure BDA0002318336980000155
其中,R(i)为该目标状态信息对应的权重,
Figure BDA0002318336980000156
为待分类节点i第l次卷积的状态信息所对应的信息饱和度,N(i)为待分类节点i的卷积截断步。
相对应的,前M-1个状态信息对应的权重均可以为:
Figure BDA0002318336980000157
其中,
Figure BDA0002318336980000158
为待分类节点i第l次卷积的状态信息所对应的权重,
Figure BDA0002318336980000159
为待分类节点i第l次卷积的状态信息所对应的信息饱和度。
S407、根据待分类节点的最终状态信息进行分类,确定待分类节点的节点类型。
综上所述,本申请实施例提供的节点分类方法,通过对待分类节点的特征信息进行L次卷积计算,得到待分类节点的L个状态信息,并根据每个状态信息和预先训练得到的饱和度计算参数,确定每个状态信息的信息饱和度,再根据L个状态信息的信息饱和度,确定待分类节点的卷积截断步,之后根据L个状态信息中的前M个状态信息,生成待分类节点的最终状态信息,最后根据待分类节点的最终状态信息进行分类,确定待分类节点的节点类型。由于待分类节点的状态信息是由每次卷积的特征信息生成的,而每次卷积的特征信息是由不同距离的邻居节点的特征信息生成的,则可以根据各个状态信息,确定合适的卷积范围,也即是确定卷积截断步,最后根据该卷积范围内的各个邻居节点的特征信息,对待分类节点进行分类,得到待分类节点的节点类型,避免了根据固定的预设跳数范围确定待分类节点的节点类型,提高了对待分类节点进行分类的准确度。
另外,在生成待分类节点的更新后的特征信息的过程中,可以根据邻居节点的当前特征信息进行计算,而邻居节点的当前特征信息又是由与邻居节点相邻的其他节点的历史特征信息生成的,使得待分类节点的更新后的特征信息包括:与邻居节点相邻的其他节点的历史特征信息,从而实现获取不同卷积范围的邻居节点的特征信息。
图5是本申请实施例提供的一种获取待分类节点的更新后的特征信息方法的示意性流程图,作为示例而非限定,该方法可以应用于上述终端设备20中。
参见图5,该方法包括:
S501、对待分类节点的当前特征信息进行N次头卷积计算,得到待分类节点的N个卷积特征信息。
其中N为正整数,是预先设置得到的,且每次头卷积分别对应不同的关联度计算参数,该关联度计算参数用于计算待分类节点与邻居节点之间的关联度。而且,每次头卷积计算对应不同的头卷积核,该头卷积核与卷积运算中的卷积运算类似,用于通过头卷积核学习不同的特征表示。例如,进行N次头卷积运算,则可以预设有N个头卷积核和N个关联度计算参数,每个头卷积核和每个关联度计算参数对应一次头卷积运算。
在对待分类节点的特征信息进行更新的过程中,可以根据预先设置的N个头卷积核,对特征信息分别进行N次头卷积,从而可以得到N个卷积特征信息,则在后续步骤中,可以根据N个卷积特征信息生成待分类节点的更新后的特征信息。
由于对待分类节点的特征信息进行N次头卷积的过程均为类似过程,则本申请仅以一次头卷积的过程为例进行说明,在N次头卷积计算中的第j次头卷积计算的过程可以为:
根据待分类节点的当前特征信息、邻居节点的当前特征信息、以及第j次头卷积对应的关联度计算参数进行计算,得到待分类节点与邻居节点之间第j次头卷积对应的关联度,并根据第j次头卷积对应的关联度、邻居节点的当前特征信息和第j次头卷积对应的头卷积核进行计算,得到第j次头卷积对应的卷积特征信息。
在一种可能的实现方式中,可以根据预先设置的第j次头卷积对应的关联度计算参数,计算得到关联度计算参数分别与待分类节点的当前特征信息和邻居节点的当前特征信息的乘积,再根据预先设置的关联度函数,结合计算得到的两个乘积进行计算,得到针对待分类节点与邻居节点之间第j次头卷积对应的关联度。
而且,若待分类节点有多个邻居节点,则针对每个邻居节点,均可以将该邻居节点的当前特征信息、该邻居节点与待分类节点之间第j次头卷积对应的关联度、以及与第j次头卷积相对应的关联度相乘,得到该邻居节点对应的乘积。
在对每个邻居节点按照上述方式计算后,可以得到每个邻居节点对应的乘积,再将各个乘积进行累加,并将累加结果输入预先设置的卷积公式,得到第j次头卷积对应的卷积特征信息。
另外,在得到第j次头卷积对应的卷积特征信息之后,可以根据头卷积次数j进行判断,确定头卷积次数j是否达到预设更新阈值N,若已经达到预设更新阈值N,则说明无需再次生成待分类节点的卷积特征信息。
但是,若头卷积次数并未达到预设更新阈值,则可以对头卷积次数j进行递加,并循环执行上述获取卷积特征信息的过程,直至递加后的头卷积次数达到预设更新阈值N,从而得到待分类节点的N个卷积特征信息。
需要说明的是,在实际应用中,待分类节点可以对应有多个邻居节点,而本申请实施例仅是以一个邻居节点为例进行说明,针对每个邻居节点,均可以采用上述方式获取待分类节点与各个邻居节点之间的各个关联度。
进一步地,在计算关联度的过程中,可以向邻居节点的当前特征信息,添加待分类节点和邻居节点之间的距离,以便将加待分类节点和邻居节点之间的距离也作为一项特征信息。
可选的,可以将邻居节点与待分类节点之间的距离,嵌入邻居节点的当前特征信息中,得到距离特征信息,并根据待分类节点的当前特征信息和该距离特征信息,结合第j次头卷积对应的关联度计算参数进行计算,得到待分类节点与邻居节点之间第j次头卷积对应的关联度。
具体地,可以分别获取待分类节点和邻居节点的当前特征信息,并将待分类节点和邻居节点之间的跳数,确定为待分类节点和邻居节点之间的距离,再根据预先设置的距离与距离向量之间的对应关系,确定该距离所对应的距离向量,再将该距离向量添加在邻居节点的当前特征信息中,从而得到距离特征信息。
之后,可以根据该距离特征信息和待分类节点的当前特征信息,结合预先设置的第j次头卷积对应的关联度计算参数,计算得到关联度计算参数分别与待分类节点的当前特征信息和距离特征信息的乘积,再根据预先设置的关联度函数,结合计算得到的两个乘积进行计算,得到针对待分类节点与邻居节点之间第j次头卷积对应的关联度。
例如,可以通过公式:
Figure BDA0002318336980000181
获取待分类节点和邻居节点之间的距离所对应的距离向量,其中,
Figure BDA0002318336980000182
为待分类节点i和邻居节点j之间的距离所对应的编码信息,
Figure BDA0002318336980000183
为与邻居节点的当前特征信息进行维度对齐后的距离向量,a1()为用于维度对齐的全连接层网络层。
而且,可以通过公式:
Figure BDA0002318336980000184
生成距离特征信息,其中,
Figure BDA0002318336980000185
为融入距离后的邻居节点j的距离特征信息,
Figure BDA0002318336980000186
为邻居节点j的当前特征信息,
Figure BDA0002318336980000187
为待分类节点i和邻居节点j之间的距离向量。
进一步地,可以通过公式:
Figure BDA0002318336980000188
计算得到待分类节点与邻居节点之间在第l次卷积中第m次头卷积的关联度,其中,
Figure BDA0002318336980000189
为待分类节点i和邻居节点j之间针对第l次卷积中第m次头卷积的关联度,Wl,m为第l次卷积中第m次头卷积对应的关联度计算参数,
Figure BDA00023183369800001810
为待分类节点i的当前特征信息,
Figure BDA00023183369800001811
为邻居节点j的距离特征信息,a()为用于计算关联度的关联度函数。
需要说明的是,为了便于比较各个节点之间的关联度,在计算得到卷积特征信息之前,可以先对各个关联度进行归一化,从而根据多个归一化后的关联度进行计算。
可选的,可以根据针对不同邻居节点的第j次头卷积对应的关联度进行归一化,得到多个第j次头卷积对应的归一化后的关联度,再根据多个第j次头卷积对应的归一化后的关联度、各个邻居节点的当前特征信息和第j次头卷积对应的头卷积核进行计算,得到第j次头卷积对应的卷积特征信息。
具体地,对于每个邻居节点,可以获取该邻居节点的关联度的指数函数,并获取各个关联度的指数函数的和值,再将该邻居节点的关联度的指数函数,与指数函数的和值进行求商计算,得到的二者的商值即为归一化后的关联度。
根据归一化后的关联度计算卷积特征信息的方式,与上述根据未归一化的关联度计算卷积特征信息的方式类似,在此不再赘述。
例如,可以通过公式:
Figure BDA00023183369800001812
计算得到归一化的关联度,其中,
Figure BDA00023183369800001813
为第l次卷积中第m次头卷积归一化后的关联度,
Figure BDA00023183369800001814
为待分类节点i和邻居节点j之间在第l次卷积中第m次头卷积的关联度的指数函数,
Figure BDA0002318336980000191
为待分类节点i和邻居节点u之间在第l次卷积中第m次头卷积的关联度的指数函数,N(i)为节点i的所有邻居节点的集合,u为N(i)中的任意一个邻居节点。
相对应的,可以通过公式:
Figure BDA0002318336980000192
计算得到待分类节点i在第l次卷积中第m次头卷积相对应的卷积特征信息,其中,
Figure BDA0002318336980000193
为待分类节点i在第l次卷积中第m次头卷积相对应的卷积特征信息,
Figure BDA0002318336980000194
为待分类节点i和邻居节点j之间在第l次卷积中第m次头卷积归一化后的关联度,Wl,m为与第l次卷积中第m次头卷积相对应的关联度计算参数,
Figure BDA0002318336980000195
为邻居节点j的当前特征信息。
S502、根据多个卷积特征信息进行拼接,得到待分类节点的更新后的特征信息。
在根据多次头卷积运算得到待分类节点的多个卷积特征信息之后,则可以对多个卷积特征信息进行拼接,从而得到待分类节点在当前卷积层的更新后的特征信息。例如,可以通过公式
Figure BDA0002318336980000196
拼接得到更新后的第l层卷积的更新后的特征信息,其中,
Figure BDA0002318336980000197
为待分类节点i在第l层卷积时相对应的更新后的特征信息,N为预设更新阈值,也即是头卷积次数,
Figure BDA0002318336980000198
为待分类节点i在第l层卷积第m次头卷积时相对应的卷积特征信息。
进一步地,若待分类节点对应有N个卷积特征信息,而每个卷积特征信息均为Y维向量,则更新后的特征信息可以为N*Y维的向量。
综上所述,本申请实施例提供的获取待分类节点的更新后的特征信息方法,通过对待分类节点的当前特征信息进行N次头卷积计算,得到待分类节点的N个卷积特征信息,再根据多个卷积特征信息进行拼接,得到待分类节点的更新后的特征信息。通过邻居节点的当前特征信息生成待分类节点的更新后的特征信息,而邻居节点的当前特征信息是根据与邻居节点相邻的其他节点的历史特征信息生成的,使得待分类节点的更新后的特征信息中包括:与邻居节点相邻的其他节点的特征信息,从而实现了通过变化卷积范围的方式生成特征信息,避免了根据固定的预设跳数范围生成特征信息,提高了对待分类节点进行分类的准确度。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
对应于上文实施例所述的节点分类方法,图6是本申请实施例提供的一种节点分类装置的结构框图,为了便于说明,仅示出了与本申请实施例相关的部分。
参照图6,该装置包括:
卷积模块601,用于对待分类节点的特征信息进行L次卷积计算,得到该待分类节点的L个状态信息,其中,L为正整数,该L次卷积计算中的第i次卷积计算的过程为:根据该待分类节点的当前特征信息和对应的邻居节点的当前特征信息,计算得到该待分类节点更新后的特征信息,并根据该更新后的特征信息和该待分类节点的当前状态信息进行计算,得到该待分类节点的更新后的状态信息,该当前特征信息为第i-1次卷积计算过程所更新的特征信息,该当前状态信息为第i-1次卷积计算过程得到的状态信息;
饱和度计算模块602,用于根据每个该状态信息和预先训练得到的饱和度计算参数,确定每个状态信息的信息饱和度;
截断步确定模块603,用于根据该L个状态信息的该信息饱和度,确定该待分类节点的卷积截断步;
生成模块604,用于根据该L个状态信息中的前M个状态信息,生成该待分类节点的最终状态信息,该M表示该卷积截断步的参数值,该M为正整数、且小于或等于该L;
分类模块605,用于根据该待分类节点的最终状态信息进行分类,确定该待分类节点的节点类型。
可选的,该截断步确定模块603,还用于从该L个状态信息的该信息饱和度中,选取不同数目的信息饱和度进行求和,得到多个饱和度和值;从多个该饱和度和值中选取目标饱和度和值,该目标饱和度和值大于或等于和值阈值、且与该和值阈值之间的差值最小;将该目标饱和度和值所对应的信息饱和度的数目,作为该卷积截断步。
可选的,该生成模块604,还用于从多个该状态信息选取前M个目标状态信息;对于每个该目标状态信息,获取该目标状态信息与该目标状态信息的权重之间的乘积,每个该目标状态信息的权重是根据该目标状态信息的信息饱和度得到的;对多个该乘积进行累加,得到该待分类节点的最终状态信息。
可选的,该卷积模块601,还用于对该待分类节点的当前特征信息进行N次头卷积计算,得到该待分类节点的N个卷积特征信息,其中N为正整数,该N次头卷积计算中的第j次头卷积计算的过程为:根据该待分类节点的当前特征信息、该邻居节点的当前特征信息、以及第j次头卷积对应的关联度计算参数进行计算,得到该待分类节点与该邻居节点之间第j次头卷积对应的关联度,并根据该第j次头卷积对应的关联度、该邻居节点的当前特征信息和第j次头卷积对应的头卷积核进行计算,得到第j次头卷积对应的卷积特征信息;根据多个该卷积特征信息进行拼接,得到该待分类节点的更新后的特征信息。
可选的,该卷积模块601,还用于将该邻居节点与该待分类节点之间的距离,嵌入该邻居节点的当前特征信息中,得到距离特征信息;根据该待分类节点的当前特征信息和该距离特征信息,结合该第j次头卷积对应的关联度计算参数进行计算,得到该待分类节点与该邻居节点之间第j次头卷积对应的关联度。
可选的,该卷积模块601,还用于根据针对不同邻居节点的第j次头卷积对应的关联度进行归一化,得到多个第j次头卷积对应的归一化后的关联度;根据多个该第j次头卷积对应的归一化后的关联度、各个该邻居节点的当前特征信息和该第j次头卷积对应的头卷积核进行计算,得到该第j次头卷积对应的卷积特征信息。
综上所述,本申请实施例提供的节点分类装置,通过对待分类节点的特征信息进行L次卷积计算,得到待分类节点的L个状态信息,并根据每个状态信息和预先训练得到的饱和度计算参数,确定每个状态信息的信息饱和度,再根据L个状态信息的信息饱和度,确定待分类节点的卷积截断步,之后根据L个状态信息中的前M个状态信息,生成待分类节点的最终状态信息,最后根据待分类节点的最终状态信息进行分类,确定待分类节点的节点类型。由于待分类节点的状态信息是由每次卷积的特征信息生成的,而每次卷积的特征信息是由不同距离的邻居节点的特征信息生成的,则可以根据各个状态信息,确定合适的卷积范围,也即是确定卷积截断步,最后根据该卷积范围内的各个邻居节点的特征信息,对待分类节点进行分类,得到待分类节点的节点类型,避免了根据固定的预设跳数范围确定待分类节点的节点类型,提高了对待分类节点进行分类的准确度。
需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请实施例还提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述各个方法实施例中的步骤。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述各个方法实施例中的步骤。
本申请实施例提供了一种计算机程序产品,当计算机程序产品在移动终端上运行时,使得移动终端执行时实现可实现上述各个方法实施例中的步骤。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/网络设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/网络设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (10)

1.一种节点分类方法,其特征在于,所述方法包括:
对待分类节点的特征信息进行L次卷积计算,得到所述待分类节点的L个状态信息,其中,L为正整数,所述L次卷积计算中的第i次卷积计算的过程为:根据所述待分类节点的当前特征信息和对应的邻居节点的当前特征信息,计算得到所述待分类节点更新后的特征信息,并根据所述更新后的特征信息和所述待分类节点的当前状态信息进行计算,得到所述待分类节点的更新后的状态信息,所述当前特征信息为第i-1次卷积计算过程所更新的特征信息,所述当前状态信息为第i-1次卷积计算过程得到的状态信息;
根据每个所述状态信息和预先训练得到的饱和度计算参数,确定每个所述状态信息的信息饱和度;
根据所述L个状态信息的所述信息饱和度,确定所述待分类节点的卷积截断步;
根据所述L个状态信息中的前M个状态信息,生成所述待分类节点的最终状态信息,所述M表示所述卷积截断步的参数值,所述M为正整数、且小于或等于所述L;
根据所述待分类节点的最终状态信息进行分类,确定所述待分类节点的节点类型。
2.如权利要求1所述的方法,其特征在于,所述根据所述L个状态信息的所述信息饱和度,确定所述待分类节点的卷积截断步,包括:
从所述L个状态信息的所述信息饱和度中,选取不同数目的信息饱和度进行求和,得到多个饱和度和值;
从多个所述饱和度和值中选取目标饱和度和值,所述目标饱和度和值大于或等于和值阈值、且与所述和值阈值之间的差值最小;
将所述目标饱和度和值所对应的信息饱和度的数目,作为所述卷积截断步。
3.如权利要求1所述的方法,其特征在于,所述根据所述L个状态信息中的前M个状态信息,生成所述待分类节点的最终状态信息,包括:
从多个所述状态信息选取前M个目标状态信息;
对于每个所述目标状态信息,获取所述目标状态信息与所述目标状态信息的权重之间的乘积,每个所述目标状态信息的权重是根据所述目标状态信息的信息饱和度得到的;
对多个所述乘积进行累加,得到所述待分类节点的最终状态信息。
4.如权利要求1所述的方法,其特征在于,所述根据所述待分类节点的当前特征信息和对应的邻居节点的当前特征信息,计算得到所述待分类节点更新后的特征信息,包括:
对所述待分类节点的当前特征信息进行N次头卷积计算,得到所述待分类节点的N个卷积特征信息,其中N为正整数,所述N次头卷积计算中的第j次头卷积计算的过程为:根据所述待分类节点的当前特征信息、所述邻居节点的当前特征信息、以及第j次头卷积对应的关联度计算参数进行计算,得到所述待分类节点与所述邻居节点之间第j次头卷积对应的关联度,并根据所述第j次头卷积对应的关联度、所述邻居节点的当前特征信息和第j次头卷积对应的头卷积核进行计算,得到第j次头卷积对应的卷积特征信息;
根据多个所述卷积特征信息进行拼接,得到所述待分类节点的更新后的特征信息。
5.如权利要求4所述的方法,其特征在于,所述根据所述待分类节点的当前特征信息、所述邻居节点的当前特征信息、以及第j次头卷积对应的关联度计算参数进行计算,得到所述待分类节点与所述邻居节点之间第j次头卷积对应的关联度,包括:
将所述邻居节点与所述待分类节点之间的距离,嵌入所述邻居节点的当前特征信息中,得到距离特征信息;
根据所述待分类节点的当前特征信息和所述距离特征信息,结合所述第j次头卷积对应的关联度计算参数进行计算,得到所述待分类节点与所述邻居节点之间第j次头卷积对应的关联度。
6.如权利要求4所述的方法,其特征在于,所述根据所述第j次头卷积对应的关联度、所述邻居节点的当前特征信息和第j次头卷积对应的头卷积核进行计算,得到第j次头卷积对应的卷积特征信息,包括:
根据针对不同邻居节点的第j次头卷积对应的关联度进行归一化,得到多个第j次头卷积对应的归一化后的关联度;
根据多个所述第j次头卷积对应的归一化后的关联度、各个所述邻居节点的当前特征信息和所述第j次头卷积对应的头卷积核进行计算,得到所述第j次头卷积对应的卷积特征信息。
7.一种节点分类装置,其特征在于,所述装置包括:
卷积模块,用于对待分类节点的特征信息进行L次卷积计算,得到所述待分类节点的L个状态信息,其中,L为正整数,所述L次卷积计算中的第i次卷积计算的过程为:根据所述待分类节点的当前特征信息和对应的邻居节点的当前特征信息,计算得到所述待分类节点更新后的特征信息,并根据所述更新后的特征信息和所述待分类节点的当前状态信息进行计算,得到所述待分类节点的更新后的状态信息,所述当前特征信息为第i-1次卷积计算过程所更新的特征信息,所述当前状态信息为第i-1次卷积计算过程得到的状态信息;
饱和度计算模块,用于根据每个所述状态信息和预先训练得到的饱和度计算参数,确定每个所述状态信息的信息饱和度;
截断步确定模块,用于根据所述L个状态信息的所述信息饱和度,确定所述待分类节点的卷积截断步;
生成模块,用于根据所述L个状态信息中的前M个状态信息,生成所述待分类节点的最终状态信息,所述M表示所述卷积截断步的参数值,所述M为正整数、且小于或等于所述L;
分类模块,用于根据所述待分类节点的最终状态信息进行分类,确定所述待分类节点的节点类型。
8.如权利要求7所述的装置,其特征在于,所述卷积模块,还用于对所述待分类节点的当前特征信息进行N次卷积计算,得到所述待分类节点的N个卷积特征信息,其中N为正整数,所述N次卷积计算中的第j次卷积计算的过程为:根据所述待分类节点的当前特征信息、所述邻居节点的当前特征信息、以及第j次卷积对应的关联度计算参数进行计算,得到所述待分类节点与所述邻居节点之间第j次卷积对应的关联度,并根据所述第j次卷积对应的关联度、所述邻居节点的当前特征信息和第j次卷积对应的卷积核进行计算,得到第j次卷积对应的卷积特征信息;根据多个所述卷积特征信息进行拼接,得到所述待分类节点的更新后的特征信息。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述的方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的方法。
CN201911287179.2A 2019-12-14 2019-12-14 节点分类方法、装置、终端设备及计算机可读存储介质 Active CN111126465B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911287179.2A CN111126465B (zh) 2019-12-14 2019-12-14 节点分类方法、装置、终端设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911287179.2A CN111126465B (zh) 2019-12-14 2019-12-14 节点分类方法、装置、终端设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN111126465A CN111126465A (zh) 2020-05-08
CN111126465B true CN111126465B (zh) 2023-01-24

Family

ID=70498841

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911287179.2A Active CN111126465B (zh) 2019-12-14 2019-12-14 节点分类方法、装置、终端设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111126465B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3425523A1 (en) * 2016-02-29 2019-01-09 Alibaba Group Holding Limited Application program classification method and apparatus
CN109816009A (zh) * 2019-01-18 2019-05-28 南京旷云科技有限公司 基于图卷积的多标签图像分类方法、装置及设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3425523A1 (en) * 2016-02-29 2019-01-09 Alibaba Group Holding Limited Application program classification method and apparatus
CN109816009A (zh) * 2019-01-18 2019-05-28 南京旷云科技有限公司 基于图卷积的多标签图像分类方法、装置及设备

Also Published As

Publication number Publication date
CN111126465A (zh) 2020-05-08

Similar Documents

Publication Publication Date Title
CN109522942B (zh) 一种图像分类方法、装置、终端设备和存储介质
CN111079780B (zh) 空间图卷积网络的训练方法、电子设备及存储介质
CN111798273A (zh) 产品的购买概率预测模型的训练方法及购买概率预测方法
CN108763277B (zh) 一种数据分析方法、计算机可读存储介质及终端设备
CN110995459B (zh) 异常对象识别方法、装置、介质及电子设备
CN109388674A (zh) 数据处理方法、装置、设备及可读存储介质
CN111028006B (zh) 一种业务投放辅助方法、业务投放方法及相关装置
CN111026544A (zh) 图网络模型的节点分类方法、装置及终端设备
CN113609345B (zh) 目标对象关联方法和装置、计算设备以及存储介质
WO2023000491A1 (zh) 一种应用推荐方法、装置、设备及计算机可读存储介质
CN111160783A (zh) 数字资产价值的评价方法、系统及电子设备
CN115082920A (zh) 深度学习模型的训练方法、图像处理方法和装置
CN114565196B (zh) 基于政务热线的多事件趋势预判方法、装置、设备及介质
CN111538909A (zh) 一种信息推荐方法及装置
CN113988638A (zh) 一种通用关联关系强度测算方法、装置、电子设备和介质
CN111126465B (zh) 节点分类方法、装置、终端设备及计算机可读存储介质
CN110262906B (zh) 接口标签推荐方法、装置、存储介质和电子设备
CN110968835A (zh) 一种近似分位数计算方法及装置
CN115952438A (zh) 社交平台用户属性预测方法、系统、移动设备及存储介质
CN110009056A (zh) 一种社交账号的分类方法及分类装置
CN115829722A (zh) 信用风险评分模型的训练方法及信用风险评分方法
CN110458707B (zh) 基于分类模型的行为评估方法、装置及终端设备
CN113850523A (zh) 基于数据补全的esg指数确定方法及相关产品
CN113393250A (zh) 一种信息处理方法及装置、存储介质
CN112559640A (zh) 图谱表征系统的训练方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant