CN113656651A - 图节点关系表征生成和图节点业务关系预测方法及装置 - Google Patents

图节点关系表征生成和图节点业务关系预测方法及装置 Download PDF

Info

Publication number
CN113656651A
CN113656651A CN202111003074.7A CN202111003074A CN113656651A CN 113656651 A CN113656651 A CN 113656651A CN 202111003074 A CN202111003074 A CN 202111003074A CN 113656651 A CN113656651 A CN 113656651A
Authority
CN
China
Prior art keywords
node
graph
representation
graph node
propagation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111003074.7A
Other languages
English (en)
Inventor
杨硕
张志强
周俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202111003074.7A priority Critical patent/CN113656651A/zh
Publication of CN113656651A publication Critical patent/CN113656651A/zh
Priority to PCT/CN2022/104328 priority patent/WO2023029744A1/zh
Priority to US18/398,447 priority patent/US20240144165A1/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/083Shipping
    • G06Q10/0835Relationships between shipper or supplier and carriers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书实施例提供图节点关系表征生成和图节点业务关系预测方法及装置。在生成图节点关系表征时,分别自第一和第二图节点开始执行节点表征传播和节点表征聚合,确定第二和第一图节点的节点表征;并且基于第一和第二图节点的节点表征,生成第一和第二图节点之间的节点关系表征。在节点表征传播时,将每个源图节点的上一节点传播表征传播给该源图节点的目标图节点集合的每个目标图节点;根据各个目标图节点接收的节点传播表征以及自身上一节点传播表征,生成各个目标图节点的当前节点传播表征。在节点表征聚合处理时,根据聚合图节点的上一节点表征以及邻居图节点的上一节点表征,生成聚合图节点的当前节点表征。

Description

图节点关系表征生成和图节点业务关系预测方法及装置
技术领域
本说明书实施例通常涉及图数据处理领域,尤其涉及用于生成图数据中的图节点之间的节点关系表征的图节点关系表征生成方法及装置,以及用于预测图数据中的图节点之间的业务关系的图节点业务关系预测方法及装置。
背景技术
在一些业务场景下,通常将业务数据处理成图数据。在图数据中,比如用户、企业和商户的业务主体被表示为图数据中的节点,以及业务主体之间的关系被表示为节点之间的边属性关系。在业务处理时,需要预测图数据中的两个给定节点(业务主体)之间是否存在业务关系。然后,根据业务关系预测结果进行后续业务决策处理。例如,在商品推荐场景下,可以基于用户购买商品的历史商品购买数据来生成图数据,使用图数据来预测用户与某个商品之间是否存在商品购买关系,即,该用户是否会购买该商品,并且基于商品购买关系预测结果来决定是否向该用户推荐该商品。在社交场景下,可以基于社交数据来生成图数据,使用图数据来预测两个用户之间是否是好友关系,并且基于好友关系预测结果来进行后续社交处理。在供应链挖掘场景下,可以基于企业供应关系历史数据生成图数据,使用图数据来预测两个企业是否构成供应链上下游关系,并且基于供应链上下游关系预测结果来进行供应链挖掘。
发明内容
鉴于上述,本说明书实施例提供图节点关系表征生成方法和图节点业务关系预测方法及装置。利用该图节点关系表征生成方法和图节点业务关系预测方法及装置,使得所得到的图节点之间的图节点关系表征可以准确地反映出图节点的节点属性信息以及图节点之间的交互结构信息,从而提升图节点之间的业务关系预测的准确性。
根据本说明书实施例的一个方面,提供一种用于生成图数据中的第一图节点和第二图节点之间的节点关系表征的方法,所述图数据基于业务数据生成,所述方法包括:分别自所述第一图节点和所述第二图节点开始执行节点表征传播和节点表征聚合,确定所述第二图节点和所述第一图节点的节点表征;以及基于所述第一图节点和所述第二图节点的节点表征,生成所述第一图节点和所述第二图节点之间的节点关系表征,其中,所述节点表征传播和所述节点表征聚合执行规定次数迭代过程,在所述节点表征传播时,将当前迭代过程的源图节点集合中的每个源图节点的上一迭代过程的节点传播表征传播给该源图节点的目标图节点集合中的每个目标图节点,所述目标图节点集合由该源图节点的邻居图节点组成;根据各个目标图节点所接收的节点传播表征以及上一迭代过程的自身节点传播表征,生成各个目标图节点的当前迭代过程的节点传播表征,在所述节点表征聚合时,根据聚合图节点的上一迭代过程的节点表征以及该聚合图节点的邻居图节点的上一迭代过程的节点表征,生成所述聚合图节点的当前迭代过程的节点表征,其中,所述聚合图节点包括所述第一图节点或所述第二图节点,图节点的初始节点表征基于该图节点的节点传播表征以及该图节点的原始特征生成。
可选地,在上述方面的一个示例中,基于所述第一图节点和所述第二图节点的节点表征,生成所述第一图节点和所述第二图节点之间的节点关系表征可以包括:对所述第一图节点和所述第二图节点的节点表征进行拼接,生成所述第一图节点和所述第二图节点之间的节点关系表征。
可选地,在上述方面的一个示例中,根据各个目标图节点所接收的节点传播表征以及上一迭代过程的自身节点传播表征,生成该目标图节点的当前迭代过程的节点传播表征可以包括:根据各个目标图节点从各个邻居图节点接收的节点传播表征、与各个邻居图节点之间的边关系特征以及上一迭代过程的自身节点传播表征,生成该目标图节点的当前迭代过程的节点传播表征。
可选地,在上述方面的一个示例中,图节点的初始节点表征基于该图节点的节点传播表征以及该图节点的原始特征生成可以包括:图节点的初始节点表征通过拼接该图节点的节点传播表征以及该图节点的原始特征生成。
可选地,在上述方面的一个示例中,所述方法基于图神经网络实现。
可选地,在上述方面的一个示例中,根据聚合图节点的上一迭代过程的节点表征以及该聚合图节点的邻居图节点的上一迭代过程的节点表征,生成所述聚合图节点的当前迭代过程的节点表征可以包括:使用聚集函数对聚合图节点的上一迭代过程的节点表征以及该聚合图节点的邻居图节点的上一迭代过程的节点表征进行聚集,生成所述聚合图节点的当前迭代过程的节点表征。
可选地,在上述方面的一个示例中,所述图神经网络包括具有Attention机制和LSTM聚合器的图神经网络。
可选地,在上述方面的一个示例中,根据各个目标图节点所接收的节点传播表征以及上一迭代过程的自身节点传播表征,生成各个目标图节点的当前迭代过程的节点传播表征可以包括:通过Attention操作聚合各个目标图节点所接收的节点传播表征,得到各个目标图节点的邻居节点传播表征;以及通过LSTM聚合器对各个目标图节点的邻居节点传播表征以及该目标图节点的上一迭代过程的节点传播表征进行LSTM聚合,生成各个目标图节点的当前迭代过程的节点传播表征。
可选地,在上述方面的一个示例中,所述业务数据包括下述业务数据中的一种:社交数据,金融交易数据,商品交易数据和企业供应关系数据。
根据本说明书的实施例的另一方面,提供一种用于预测图数据中的第一图节点和第二图节点之间的业务关系的方法,所述图数据基于业务数据生成,所述方法包括:分别自所述第一图节点和所述第二图节点开始执行节点表征传播和节点表征聚合,确定所述第二图节点和所述第一图节点的节点表征;基于所述第一图节点和所述第二图节点的节点表征,生成所述第一图节点和所述第二图节点之间的节点关系表征;以及根据所述第一图节点和所述第二图节点之间的节点关系表征,预测所述第一图节点和所述第二图节点之间的业务关系,其中,所述节点表征传播和所述节点表征聚合执行规定次数迭代过程,在所述节点表征传播时,将当前迭代过程的源图节点集合中的每个源图节点的上一迭代过程的节点传播表征传播给该源图节点的目标图节点集合中的每个目标图节点,所述目标图节点集合由该源图节点的邻居图节点组成;根据各个目标图节点所接收的节点传播表征以及上一迭代过程的自身节点传播表征,生成各个目标图节点的当前迭代过程的节点传播表征,在所述节点表征聚合时,根据聚合图节点的上一迭代过程的节点表征以及该聚合图节点的邻居图节点的上一迭代过程的节点表征,生成所述聚合图节点的当前迭代过程的节点表征,其中,所述聚合图节点包括所述第一图节点或所述第二图节点,图节点的初始节点表征基于该图节点的节点传播表征以及该图节点的原始特征生成。
根据本说明书的实施例的另一方面,提供一种用于生成图数据中的第一图节点和第二图节点之间的节点关系表征的装置,所述图数据基于业务数据生成,所述装置包括:节点表征确定单元,分别自所述第一图节点和所述第二图节点开始节点表征传播和节点表征聚合,确定所述第二图节点和所述第一图接地那的节点表征;以及节点关系表征生成单元,基于所述第一图节点和所述第二图节点的节点表征,生成所述第一图节点和所述第二图节点之间的节点关系表征,其中,所述节点表征确定单元包括:节点表征传播模块,将当前迭代过程的源图节点集合中的每个源图节点的上一迭代过程的节点传播表征传播给该源图节点的目标图节点集合中的每个目标图节点,所述目标图节点集合由该源图节点的邻居图节点组成,并且根据各个目标图节点所接收的节点传播表征以及上一迭代过程的自身节点传播表征,生成各个目标图节点的当前迭代过程的节点传播表征;节点表征聚合模块,根据聚合图节点的上一迭代过程的节点表征以及该聚合图节点的邻居图节点的上一迭代过程的节点表征,生成所述聚合图节点的当前迭代过程的节点表征,其中,所述聚合图节点包括所述第一图节点或所述第二图节点,图节点的初始节点表征基于该图节点的节点传播表征以及该图节点的原始特征生成,其中,所述节点表征传播模块和所述节点表征聚合模块执行规定次数迭代过程。
可选地,在上述方面的一个示例中,所述节点关系表征生成单元对所述第一图节点和所述第二图节点的节点表征进行拼接,生成所述第一图节点和所述第二图节点之间的节点关系表征。
可选地,在上述方面的一个示例中,所述节点表征传播模块根据各个目标图节点从各个邻居图节点接收的节点传播表征、与各个邻居图节点之间的边关系特征以及上一迭代过程的自身节点传播表征,生成该目标图节点的当前迭代过程的节点传播表征。
可选地,在上述方面的一个示例中,所述节点表征聚合模块通过拼接图节点的节点传播表征以及该图节点的原始特征生成该图节点的初始节点表征。
可选地,在上述方面的一个示例中,所述装置基于图神经网络实现,所述节点表征聚合模块使用聚集函数对聚合图节点的上一迭代过程的节点表征以及该聚合图节点的邻居图节点的上一迭代过程的节点表征进行聚集,生成该聚合图节点的当前迭代过程的节点表征。
根据本说明书的实施例的另一方面,提供一种用于预测图数据中的第一图节点和第二图节点之间的业务关系的装置,所述图数据基于业务数据生成,所述装置包括:节点表征确定单元,分别自所述第一图节点和所述第二图节点开始节点表征传播和节点表征聚合,确定所述第二图节点和所述第一图节点的节点表征;节点关系表征生成单元,基于所述第一图节点和所述第二图节点的节点表征,生成所述第一图节点和所述第二图节点之间的节点关系表征;以及节点间业务关系预测单元,根据所述第一图节点和所述第二图节点之间的节点关系表征,预测所述第一图节点和所述第二图节点之间的业务关系,其中,所述节点表征确定单元包括:节点表征传播模块,将当前迭代过程的源图节点集合中的每个源图节点的上一迭代过程的节点传播表征传播给该源图节点的目标图节点集合中的每个目标图节点,所述目标图节点集合由该源图节点的邻居图节点组成,并且根据各个目标图节点所接收的节点传播表征以及上一迭代过程的自身节点传播表征,生成各个目标图节点的当前迭代过程的节点传播表征;节点表征聚合模块,根据聚合图节点的上一迭代过程的节点表征以及该聚合图节点的邻居图节点的上一迭代过程的节点表征,生成所述聚合图节点的当前迭代过程的节点表征,其中,所述聚合图节点包括所述第一图节点或所述第二图节点,图节点的初始节点表征基于该图节点的节点传播表征以及该图节点的原始特征生成,其中,所述节点表征传播模块和所述节点表征聚合模块执行规定次数迭代过程。
根据本说明书的实施例,提供一种用于生成图数据中的第一图节点和第二图节点之间的节点关系表征的装置,所述图数据基于业务数据生成,所述装置包括:至少一个处理器,与所述至少一个处理器耦合的存储器,以及存储在所述存储器中的计算机程序,所述至少一个处理器执行所述计算机程序来实现如上所述的图节点关系表征生成方法。
根据本说明书的实施例,提供一种计算机可读存储介质,其存储有可执行指令,所述指令当被执行时使得处理器执行如上所述的图节点关系表征生成方法。
根据本说明书的实施例,提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行来实现如上所述的图节点关系表征生成方法。
根据本说明书的实施例,提供一种用于预测图数据中的第一图节点和第二图节点之间的关系的装置,所述图数据基于业务数据生成,所述装置包括:至少一个处理器,与所述至少一个处理器耦合的存储器,以及存储在所述存储器中的计算机程序,所述至少一个处理器执行所述计算机程序来实现如上所述的图节点间业务关系预测方法。
根据本说明书的实施例,提供一种计算机可读存储介质,其存储有可执行指令,所述指令当被执行时使得处理器执行如上所述的图节点间业务关系预测方法。
根据本说明书的实施例,提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行来实现如上所述的图节点间业务关系预测方法。
附图说明
通过参照下面的附图,可以实现对于本说明书内容的本质和优点的进一步理解。在附图中,类似组件或特征可以具有相同的附图标记。
图1示出了根据本说明书的实施例的图数据的示例结构示意图。
图2示出了根据本说明书的实施例的用于生成图数据中的第一图节点和第二图节点之间的节点关系表征的图节点关系表征生成方法的示例流程图。
图3示出了根据本说明书的实施例的图数据的节点传播过程的示例示意图。
图4示出了根据本说明书的实施例的节点表征传播处理过程的示例流程图。
图5示出了根据本说明书的实施例的基于图神经网络的节点传播表征生成过程的示例示意图。
图6示出了根据本说明书的实施例的节点表征传播处理的示例示意图。
图7示出了根据本说明书的实施例的节点表征聚合处理的示例示意图。
图8示出了根据本说明书的实施例的用于预测图数据中的第一图节点和第二图节点之间的业务关系的图节点业务关系预测方法的示例流程图。
图9示出了根据本说明书的实施例的图节点间业务关系预测过程的示例示意图。
图10示出了根据本说明书的实施例的用于生成图数据中的第一图节点和第二图节点之间的节点关系表征的图节点关系表征生成装置的示例方框图。
图11示出了根据本说明书的实施例的用于预测图数据中的第一图节点和第二图节点之间的业务关系的图节点业务关系预测装置的示例流程图。
图12示出了根据本说明书的实施例的基于计算机系统实现的用于生成图数据中的第一图节点和第二图节点之间的节点关系表征的图节点关系表征生成装置的示例示意图。
图13示出了根据本说明书的实施例的基于计算机系统实现的用于预测图数据中的第一图节点和第二图节点之间的业务关系的图节点业务关系预测装置的示例示意图。
具体实施方式
现在将参考示例实施方式讨论本文描述的主题。应该理解,讨论这些实施方式只是为了使得本领域技术人员能够更好地理解从而实现本文描述的主题,并非是对权利要求书中所阐述的保护范围、适用性或者示例的限制。可以在不脱离本说明书内容的保护范围的情况下,对所讨论的元素的功能和排列进行改变。各个示例可以根据需要,省略、替代或者添加各种过程或组件。例如,所描述的方法可以按照与所描述的顺序不同的顺序来执行,以及各个步骤可以被添加、省略或者组合。另外,相对一些示例所描述的特征在其它例子中也可以进行组合。
如本文中使用的,术语“包括”及其变型表示开放的术语,含义是“包括但不限于”。术语“基于”表示“至少部分地基于”。术语“一个实施例”和“一实施例”表示“至少一个实施例”。术语“另一个实施例”表示“至少一个其他实施例”。术语“第一”、“第二”等可以指代不同的或相同的对象。下面可以包括其他的定义,无论是明确的还是隐含的。除非上下文中明确地指明,否则一个术语的定义在整个说明书中是一致的。
在业务数据被处理成图数据的情况下,在业务处理时,需要对图数据中的两个给定图节点进行业务关系预测。业务关系预测方案例如可以包括基于图结构的业务关系预测方案、基于节点级别图神经网络的业务关系预测方案以及基于边级别图神经网络的业务关系预测方案。
在基于图结构的业务关系预测方案中,直接计算需要预测的两个图节点的特性,比如,共同邻居数量、Katz Index等,由此衡量该两个图节点的相似度,并且根据相似度来确定该两个图节点是否存在业务关系。在该业务关系预测方案中,需要存在一定的先验假设,即,认为满足某种特定条件的两个图节点之间存在业务关系。然而,这种业务关系预测方案无法根据预测任务不同而自适应调节,并且在进行节点表征时无法融入图节点属性。
在基于节点级别图神经网络的业务关系预测方案中,通过图神经网络模型分别对需要预测的两个图节点进行图节点表达,然后根据该两个图节点的图节点表达进行链路二分类预测。然而,这种业务关系预测方案对两个图节点的图节点表达学习独立进行,只能建模该两个图节点各自的邻居分布信息,无法直接对该两个图节点之间的交互结构(比如,路径)以及交互结构属性进行建模。
在基于边级别图神经网络的业务关系预测方案中,首先,针对图数据中的一条边或一条边关联的所有领域图节点抽取结构特征,比如,使用随机游走抽取一条边的连通性特征,使用节点表征表示一条边关联的各个领域图节点在该条边中的位置等。接着,使用节点级别图神经网络对图节点领域属性信息进行聚合,得到该条边的最终表达。然后,根据该条边的最终表达来预测该条边所连接的两个图节点之间是否存在业务关系。然而,这种业务关系预测方案在抽取两个图节点的结构特征时无法融入图节点属性信息,并且在结构特征选择上也存在先验假设。
鉴于上述,本说明书的实施例提供一种图节点间业务关系预测方案。在该图节点业务关系预测方案中,在进行图节点关系表征时,分别自一个图节点开始执行节点表征传播和节点表征聚合来确定对端图节点的节点表征。节点表征传播和节点表征聚合执行规定次数迭代过程。通过执行迭代过程的节点表征传播和节点表征聚合,可以将各个图节点的图节点属性信息和交互结构信息融入对端图节点的节点表征。在如上得到两个图节点的节点表征后,基于该两个图节点的节点表征生成该两个图节点之间的图节点关系表征,并且根据两个图节点之间的节点关系表征进行节点间业务关系预测。利用上述节点间业务关系预测,由于在图节点的节点表征中融入两个图节点的图节点属性信息和交互结构信息,从而使得所得到的图节点之间的图节点关系表征可以准确地反映出图节点的节点属性信息以及图节点之间的交互结构信息,由此提升图节点之间的业务关系预测的准确性。
下面将参照附图描述根据本说明书的实施例的用于生成图数据中的第一图节点和第二图节点之间的节点关系表征的图节点关系表征生成方法及装置以及用于预测图数据中的第一图节点和第二图节点之间的业务关系的图节点业务关系预测方法及装置。
图1示出了根据本说明书的实施例的图数据结构的示例示意图。
图1所示的图数据结构包括11个图节点,即,图节点u、v以及P0到P8,并且该11个图节点之间存在如图1所示的邻居关系。在本说明书中,术语“邻居关系”是指两个图节点之间存在边连接。例如,图节点P0、P1、P2和P3是图节点u的1步邻居图节点,以及图节点P4是图节点u的2步邻居图节点。另外,在本说明书中,除非特别说明,邻居图节点表示1步邻居图节点。
在本说明书中,图数据可以基于各种业务数据生成。所生成的图数据中的每个图节点具有节点属性信息。此外,可选地,两个图节点之间的边还可以具有边属性信息(边特征)。节点属性信息和边属性信息与业务数据的业务场景相关。业务数据的示例例如可包括但不限于:社交数据,金融交易数据,商品交易数据和企业供应关系数据。
社交数据包括在社交网络场景下获取的业务数据。在基于社交数据生成的图数据中,图节点包括社交用户(社交账户),例如,“张三”、“李四”等,以及图节点的节点属性信息例如可以包括年龄、学历、住址、职业等。图节点之间的边例如可以包括用户与用户之间的关系,比如,同学/同事等。所预测的业务关系例如可以包括社交用户之间是否存在好友关系。
金融交易数据包括在金融交易场景下获取的金融交易数据。在基于金融交易数据生成的图数据中,图节点包括金融主体,以及图节点的节点属性信息例如可以包括金融主体注册信息、法人信息、账户信息等。图节点之间的边例如可以包括金融主体之间的转账关系等,所预测的业务关系例如可以包括金融主体之间是否存在关联主体关系。
商品交易数据包括在商品交易场景下获取的商品交易数据。在基于商品交易数据生成的图数据中,图节点可以包括用户、商品和商家,以及图节点的节点属性信息例如可以包括用户年龄、用户学历、用户住址、用户职业、商品产地、商品材质、商品型号、商家名称、商家注册地等。图节点之间的边例如可以包括用户与商品之间的商品购买关系、商品与商家之间的所属关系等,所预测的业务关系例如可以包括用户是否会存在商品购买意向。
企业供应关系数据包括企业供应场景下获取的企业供应关系数据。在基于企业供应关系数据生成的图数据中,图节点可以包括企业,以及图节点的节点属性例如可以包括企业名称、企业注册地、企业所生产商品等。图节点之间的边例如可以包括企业之间所发生的商品供应行为。所预测的业务关系例如可以包括两个企业之间是否存在供应链上下游关系。
要说明的是,在本说明书中,图数据结构也可以称为图网络。此外,图网络的示例例如可以包括有向图网络、无向图网络等。
图2示出了根据本说明书的实施例的用于生成图数据中的第一图节点和第二图节点之间的节点关系表征的图节点关系表征生成方法200的示例流程图。要说明的是,第一图节点和第二图节点可以是图数据中的任意图节点。
如图2所示,在210,自第一图节点开始执行节点表征传播和节点表征聚合,确定第二图节点的节点表征。这里,节点表征传播和节点表征聚合执行规定次数迭代过程。在一个示例中,图节点关系表征生成方法可以基于图神经网络实现。在这种情况下,节点表征传播和节点表征聚合所执行的迭代过程的迭代次数可以为图神经网络的模型深度。术语“模型深度”是指每个图节点可以影响到的图节点的跳数。即,每个图节点的节点属性信息可以传播到的图节点的跳数。在一个示例中,假设图神经网络的模型深度为2,则各个图节点所影响的图节点的跳数为2。在这种情况下,针对图1中示出的图网络,第一图节点为图节点u,以及第二图节点为图节点v。图节点u的节点属性信息可以传播到的图节点包括图节点P0、P1、P2、P3、P4、P5和P6,其中,图节点P0、P1、P2和P3是图节点u的一跳目标图节点(1步邻居图节点),以及图节点P4、P5和P6是图节点u的两跳目标图节点(2步邻居图节点)。此外,图节点u的节点属性信息不能传播到2跳之外的图节点,例如,图节点v、P7和P8。在本说明书中,图神经网络的示例例如可以包括但不限于图卷积网络(GCN)、图注意力网络(GAT)等。
图3示出了根据本说明书的实施例的图数据的节点传播过程的示例示意图。
如图3所示,在自图节点u开始的节点表征传播的第一次迭代过程中,源图节点为图节点u,以及目标图节点为图节点P0、P1、P2和P3。在第一次迭代过程中,图节点u的节点传播特征被分别传播到图节点P0、P1、P2和P3。在第二次迭代过程中,源图节点为图节点P0、P1、P2和P3,以及目标图节点为图节点P4、P5和P6。在第二次迭代过程中,源图节点P2的节点传播特征被分别传播图节点P4和P5,以及源图节点P3的节点传播特征被分别传播图节点P5和P6。
图4示出了根据本说明书的实施例的节点表征传播过程400的示例流程图。
如图4所示,在410,将当前迭代过程的源图节点集合中的每个源图节点的上一迭代过程的节点传播表征传播给该源图节点的目标图节点集合中的每个目标图节点,所述目标图节点集合由该源图节点的1步邻居图节点组成。
在420,根据各个目标图节点从邻居图节点接收的节点传播表征以及上一迭代过程的自身节点传播表征,生成各个目标图节点的当前迭代过程的节点传播表征。
图5示出了根据本说明书的实施例的基于图神经网络的节点传播表征生成过程500的示例示意图。在图5的示例中,图神经网络包括具有注意力(Attention)机制和LSTM聚合器的图神经网络。
如图5所示,在510,通过Attention操作(ATT_OP)聚合各个目标图节点从邻居图节点接收的节点传播表征,得到各个目标图节点的邻居节点传播表征。
在一个示例中,ATT_OP的处理可以采用下述表达式来表示:
Figure BDA0003236243960000091
Figure BDA0003236243960000092
其中,
Figure BDA0003236243960000093
是图神经网络模型中的给定参数,
Figure BDA0003236243960000094
Figure BDA0003236243960000095
是图神经网络模型中的权重系数矩阵,
Figure BDA0003236243960000096
是从源图节点q传播到目标图节点p的attention值,
Figure BDA0003236243960000097
为源图节点q在k-1轮迭代时的节点传播表征,Xp为目标图节点p的原始特征,以及
Figure BDA0003236243960000098
表示从图节点u开始传播经过k轮迭代后目标图节点p的邻居节点传播表征。
此外,在一个示例中,在两个图节点q和p之间还包括边关系特征eq,p的情况下,
Figure BDA0003236243960000099
的计算公式可以修改为:
Figure BDA00032362439600000910
在520,通过LSTM聚合器对各个目标图节点的邻居节点传播表征以及该目标图节点的上一迭代过程的节点传播表征进行LSTM聚合(LSTM_OP),生成各个目标图节点的当前迭代过程的节点传播表征。
在一个示例中,LSTM_OP的处理可以采用下述表达式来表示:
Figure BDA00032362439600000911
Figure BDA00032362439600000912
Figure BDA00032362439600000913
Figure BDA00032362439600000914
Figure BDA00032362439600000915
其中,
Figure BDA00032362439600000916
为输入门,
Figure BDA00032362439600000917
为遗忘门,
Figure BDA00032362439600000918
为输出门,
Figure BDA00032362439600000919
为细胞状态,
Figure BDA00032362439600000920
Figure BDA00032362439600000921
为从图节点u开始传播,经过k-1轮和k轮迭代后目标图节点p的节点传播表征。
下面以图1中示出的图网络示例为例描述节点表征传播处理。图6示出了根据本说明书的实施例的节点表征传播处理的示例示意图。在图6示出的示例中,图神经网络的模型深度为k=2。
在第一次迭代过程(k=1)中,源图节点为图节点u,以及目标图节点为图节点P0、P1、P2和P3。相应地,将图节点u的节点传播表征分别传播到图节点P0、P1、P2和P3。这里,图节点u的节点传播特征相当于图节点u的原始特征信息Xu。在一个示例中,每个图节点的原始特征信息Xu可以通过对该图节点的节点属性信息进行嵌入(embedding)处理后得到。通过上述处理,每个图节点的原始特征信息可以被表示为规定维度的向量,并且每维的取值为[0,1]之间的实数值。例如,在规定维度为10维的情况下,图节点u的原始特征信息Xu例如可以表示为10维向量[0.12,0.43,0.35,0.33,0.28,0.59,0.77,0.94,0.66,0.84]。
在各个图节点P0、P1、P2和P3处,通过如上ATT_OP聚合各个图节点P0、P1、P2和P3从邻居图节点u接收的节点传播表征,得到各个图节点P0、P1、P2和P3的邻居节点传播表征
Figure BDA0003236243960000101
Figure BDA0003236243960000102
然后,在各个图节点P0、P1、P2和P3处,通过LSTM聚合器对各个图节点P0、P1、P2和P3的邻居节点传播表征
Figure BDA0003236243960000103
Figure BDA0003236243960000104
以及该图节点的上一迭代过程的节点传播表征
Figure BDA0003236243960000105
Figure BDA0003236243960000106
进行LSTM_OP,生成各个图节点P0、P1、P2和P3的第一次迭代过程的节点传播表征
Figure BDA0003236243960000107
Figure BDA0003236243960000108
在第一次迭代过程中,
Figure BDA0003236243960000109
Figure BDA00032362439600001010
的值为0。
在第二次迭代过程(k=2)中,源图节点为图节点P0、P1、P2和P3,以及目标图节点为图节点P4、P5和P6。相应地,将图节点P2的节点传播表征
Figure BDA00032362439600001011
传播到图节点P4和P5,以及将图节点P3的节点传播表征
Figure BDA00032362439600001012
传播到图节点P5和P6。由于图节点P0和P1没有邻居图节点,从而图节点P0和P1不进行进一步的节点传播处理。
在各个图节点P4和P5处,通过如上ATT_OP聚合各个图节点P4和P5从邻居图节点接收的节点传播表征,得到各个图节点P4和P5的邻居节点传播表征
Figure BDA00032362439600001013
Figure BDA00032362439600001014
具体地,在图节点P4处,通过如上ATT_OP聚合图节点P2的节点传播表征
Figure BDA00032362439600001015
得到图节点P4的邻居节点传播表征
Figure BDA00032362439600001016
在图节点P5处,通过如上ATT_OP聚合图节点P2和P3的节点传播表征
Figure BDA00032362439600001017
Figure BDA00032362439600001018
得到图节点P5的邻居节点传播表征
Figure BDA00032362439600001019
在图节点P6处,通过如上ATT_OP聚合图节点P3的节点传播表征
Figure BDA00032362439600001020
得到图节点P6的邻居节点传播表征
Figure BDA00032362439600001021
然后,在各个图节点P4、P5和P6处,通过LSTM聚合器对各个图节点P4、P5和P6的邻居节点传播表征
Figure BDA00032362439600001022
Figure BDA00032362439600001023
以及该图节点的上一迭代过程的节点传播表征
Figure BDA00032362439600001024
Figure BDA00032362439600001025
进行LSTM_OP,生成各个图节点P4、P5和P6的第二次迭代过程的节点传播表征
Figure BDA00032362439600001026
Figure BDA00032362439600001027
在图6的示例中,由于在第一次迭代过程中,不涉及图节点P4、P5和P6的节点表征传播处理,从而
Figure BDA00032362439600001028
Figure BDA00032362439600001029
的值为0。
在如上经过迭代处理得到各个图节点的节点传播表征后,执行节点表征聚合。同样,节点表征聚合需要执行规定次数迭代过程。
在节点表征聚合的每次迭代过程中,根据第二图节点的上一迭代过程的节点表征以及第二图节点的邻居图节点的上一迭代过程的节点表征,生成第二图节点的当前迭代过程的节点表征。这里,节点表征聚合所涉及的图节点的初始节点表征基于该图节点的节点传播表征以及该图节点的原始特征生成。
图7示出了根据本说明书的实施例的节点表征聚合过程的示例示意图。图7的示例中示出对图节点v进行节点表征聚合。
对于所有属于
Figure BDA0003236243960000111
的图节点(例如,H=2时的图1中的图节点P2到P8),存在两类不同的图节点,一类图节点为
Figure BDA0003236243960000112
(交集),以及另一类图节点为
Figure BDA0003236243960000113
(差集)。这里,
Figure BDA0003236243960000114
表示以图节点v为中心的H步邻居,以及
Figure BDA0003236243960000115
表示以图节点u为中心的H步邻居。在进行节点表征聚合时,首先确定各个图节点p的初始节点表征
Figure BDA0003236243960000116
在一个示例中,图节点的初始节点表征通过拼接该图节点的节点传播表征以及该图节点的原始特征生成。例如,图节点p的初始节点表征
Figure BDA0003236243960000117
可以采用下述公式表示:
Figure BDA0003236243960000118
在如上得到各个图节点的初始节点表征后,按照迭代过程确定图节点p在各次迭代过程中的节点表征。在一个示例中,假设第k次迭代过程,图节点p的
Figure BDA0003236243960000119
可以使用图神经网络中的聚集函数AGG(.)如下确定出:
Figure BDA00032362439600001110
其中,AGG(.)为图神经网络中的聚集函数,
Figure BDA00032362439600001111
为第k次迭代过程中的图节点p的节点表征,
Figure BDA00032362439600001112
为第k-1次迭代过程中的图节点p的节点表征,
Figure BDA00032362439600001113
表示以图节点v为中心的H步邻居节点之间的边,(i,p)表示从图节点i到图节点p的边,
Figure BDA00032362439600001114
为第k-1次迭代过程中的图节点i的节点表征。
按照上述方式迭代进行节点表征聚合,最终得到图节点v的H阶节点表征(H次迭代)
Figure BDA00032362439600001115
作为图节点v的最终节点表征。
回到图2,在220,自第二图节点开始执行节点表征传播和节点表征聚合,确定第一图节点的节点表征。步骤220的处理过程类似于步骤210的处理过程,不同之处仅在于自图节点v开始节点表征传播和节点表征聚合并最终计算图节点u的节点表征,在此不再描述。由此,得到图节点u的H阶节点表征(H次迭代)
Figure BDA00032362439600001116
作为图节点u的最终节点表征。要说明的是,在本说明书中,第一图节点或第二图节点可以称为聚合图节点。
在230,基于第一图节点和第二图节点的节点表征,生成第一图节点和第二图节点之间的节点关系表征。在一个示例中,可以通过对第一图节点和第二图节点的节点表征进行拼接,生成第一图节点和第二图节点之间的节点关系表征。例如,对于图节点u和v,可以通过拼接图节点u的节点表征
Figure BDA00032362439600001117
和图节点v的节点表征
Figure BDA00032362439600001118
得到图节点u和图节点v的节点关系表征
Figure BDA00032362439600001119
图8示出了根据本说明书的实施例的用于预测图数据中的第一图节点和第二图节点之间的业务关系的图节点业务关系预测方法800的示例流程图。在图8的示例中,810到830的操作与上面210到230的操作完全相同,在此不再描述。
在如上得到第一图节点和第二图节点之间的节点关系表征后,在840,基于第一图节点和第二图节点之间的节点关系表征进行图节点业务关系预测。基于节点关系表征的图节点业务关系预测过程可以采用本领域适用的任何预测方式实现。
例如,基于节点关系表征的图节点业务关系预测过程可以采用例如图神经网络的机器学习模型实现。在一个示例中,在机器学习模型训练时,可以使用下述函数作为模型训练的损失函数。
Figure BDA0003236243960000121
其中,
Figure BDA0003236243960000122
为模型预测结果,y=MLP(su,v),MLP(.)为多层感知机,y∈{0,1},当<u,v>之间存在业务关系时,y=1,否则y=0,
Figure BDA0003236243960000123
为训练样本数据集,
Figure BDA0003236243960000124
表示训练样本数据集的大小,即,训练样本数据的个数。
图9示出了根据本说明书的实施例的基于图神经网络的节点业务关系预测过程的示例示意图。图9的示例示出了图节点u和图节点v之间的节点业务关系预测过程。
如图9所示,首先,自图节点u开始执行规定迭代次数的节点表征传播和节点表征聚合,确定图节点v的节点表征
Figure BDA0003236243960000125
并且自图节点v开始执行规定迭代次数的节点表征传播和节点表征聚合,确定图节点u的节点表征
Figure BDA0003236243960000126
然后,对图节点v的节点表征
Figure BDA0003236243960000127
和图节点u的节点表征
Figure BDA0003236243960000128
进行拼接,得到图节点u和图节点v的节点关系表征su,v。这里,图节点u和v的节点表征
Figure BDA0003236243960000129
以及图节点u和图节点v的节点关系表征su,v可以被表征为表征向量。表征向量可以包括多个维度,每个维度的维度值可以采用正的实数值表示,例如,可以采用[0,1]之间的数值表示。节点关系表征su,v提供给图神经网络的全连接层(FC layer)进行业务关系预测。随后,根据业务关系预测值来预测图节点间是否存在业务关系。例如,所得到的业务关系预测值可以是概率值。在所得到的业务关系预测值不小于预定阈值时,认为图节点间存在业务关系。在所得到的业务关系预测值小于预定阈值时,认为图节点间不存在业务关系。
利用上述节点间业务关系预测,在图节点的节点表征确定过程中执行节点表征传播和节点表征聚合。按照这种方式得到的图节点表征融入两个图节点的图节点属性信息和交互结构信息,从而使得所得到的图节点之间的图节点关系表征可以准确地反映出图节点的节点属性信息以及图节点之间的交互结构信息,由此提升图节点之间的业务关系预测的准确性。
此外,利用上述节点间业务关系预测,通过在进行节点表征传播时还传播两个图节点之间的边关系特征数据,从而使得所得到的图节点之间的图节点关系表征还可以反映出图节点之间的边特征信息,由此进一步提升图节点之间的业务关系预测的准确性。
图10示出了根据本说明书的实施例的用于生成图数据中的第一图节点和第二图节点之间的节点关系表征的图节点关系表征生成装置1000的示例方框图。如图10所示,图节点关系表征生成装置1000包括节点表征确定单元1010和节点关系表征生成单元1020。
节点表征确定单元1010被配置为分别自第一图节点和第二图节点开始执行节点表征传播和节点表征聚合,确定第二图节点和第一图节点的节点表征。节点表征确定单元1010的操作可以参考上面参照图2的210和220描述的操作。
节点关系表征生成单元1020被配置为基于第一图节点和第二图节点的节点表征,生成第一图节点和第二图节点之间的节点关系表征。节点关系表征生成单元1020的操作可以参考上面参照图2的230描述的操作。
节点表征确定单元1010包括节点表征传播模块1011和节点表征聚合模块1013。节点表征传播模块1011和节点表征聚合模块1013被配置为执行规定次数迭代过程来分别确定第一图节点和第二图节点的节点表征。
具体地,在每次迭代过程中,节点表征传播模块1011将当前迭代过程的源图节点集合中的每个源图节点的上一迭代过程的节点传播表征传播给该源图节点的目标图节点集合中的每个目标图节点,所述目标图节点集合由该源图节点的邻居图节点组成,并且根据各个目标图节点所接收的节点传播表征以及上一迭代过程的自身节点传播表征,生成各个目标图节点的当前迭代过程的节点传播表征。
在每次迭代过程中,节点表征聚合模块1013被配置为根据聚合图节点的上一迭代过程的节点表征以及该聚合图节点的邻居图节点的上一迭代过程的节点表征,生成聚合图节点的当前迭代过程的节点表征,其中,聚合图节点包括第一图节点或第二图节点,并且图节点的初始节点表征基于该图节点的节点传播表征以及该图节点的原始特征生成。要说明的是,节点表征聚合模块1013的迭代过程在节点表征传播模块1011的迭代过程完成后执行。
此外,在一些实施例中,节点关系表征生成单元1020对第一图节点和第二图节点的节点表征进行拼接,生成第一图节点和第二图节点之间的节点关系表征。
此外,在一些实施例中,在图节点之间存在边关系特征的情况下,节点表征传播模块1011被配置为根据各个目标图节点从各个邻居图节点接收的节点传播表征、与各个邻居图节点之间的边关系特征以及上一迭代过程的自身节点传播表征,生成该目标图节点的当前迭代过程的节点传播表征。
此外,在一些实施例中,节点表征聚合模块1013通过拼接图节点的节点传播表征以及该图节点的原始特征生成该图节点的初始节点表征。
此外,在一些实施例中,在图节点关系表征生成装置1000基于图神经网络实现的情况下,节点表征聚合模块1013被配置为使用聚集函数对聚合图节点的上一迭代过程的节点表征以及该聚合图节点的邻居图节点的上一迭代过程的节点表征进行聚集,生成该聚合图节点的当前迭代过程的节点表征。
图11示出了根据本说明书的实施例的用于预测图数据中的第一图节点和第二图节点之间的业务关系的图节点业务关系预测装置1100的示例流程图。如图11所示,图节点业务关系预测装置1100包括节点表征确定单元1110、节点关系表征生成单元1120和节点间业务关系预测单元1130。节点表征确定单元1110和节点关系表征生成单元1120的操作和结构与上述节点表征确定单元1010和节点关系表征生成单元1020的操作和结构相同,在此不再赘述。
节点间业务关系预测单元1130被配置为根据第一图节点和第二图节点之间的节点关系表征,预测第一图节点和第二图节点之间的业务关系。节点间业务关系预测单元1130的操作可以参考上面参照图8的840描述的操作。
如上参照图1到图11,对根据本说明书实施例的图节点关系表征生成方法、图节点关系表征生成装置、图节点业务关系预测方法以及图节点业务关系预测装置进行了描述。上述图节点关系表征生成装置和图节点业务关系预测装置可以采用硬件实现,也可以采用软件或者硬件和软件的组合来实现。
图12示出了根据本说明书的实施例的基于计算机系统实现的用于生成图数据中的第一图节点和第二图节点之间的节点关系表征的图节点关系表征生成装置1200的示意图。如图12所示,图节点关系表征生成装置1200可以包括至少一个处理器1210、存储器(例如,非易失性存储器)1220、内存1230和通信接口1240,并且至少一个处理器1210、存储器1220、内存1230和通信接口1240经由总线1260连接在一起。至少一个处理器1210执行在存储器中存储或编码的至少一个计算机可读指令(即,上述以软件形式实现的元素)。
在一个实施例中,在存储器中存储计算机可执行指令,其当执行时使得至少一个处理器1210:分别自第一图节点和第二图节点开始执行节点表征传播和节点表征聚合,确定第二图节点和第一图节点的节点表征;以及基于第一图节点和第二图节点的节点表征,生成第一图节点和第二图节点之间的节点关系表征,其中,节点表征传播和节点表征聚合执行规定次数迭代过程,在节点表征传播时,将当前迭代过程的源图节点集合中的每个源图节点的上一迭代过程的节点传播表征传播给该源图节点的目标图节点集合中的每个目标图节点,所述目标图节点集合由该源图节点的邻居图节点组成;根据各个目标图节点所接收的节点传播表征以及上一迭代过程的自身节点传播表征,生成各个目标图节点的当前迭代过程的节点传播表征,在节点表征聚合时,根据聚合图节点的上一迭代过程的节点表征以及该聚合图节点的邻居图节点的上一迭代过程的节点表征,生成聚合图节点的当前迭代过程的节点表征,其中,聚合图节点包括第一图节点或第二图节点,图节点的初始节点表征基于该图节点的节点传播表征以及该图节点的原始特征生成。
应该理解,在存储器中存储的计算机可执行指令当执行时使得至少一个处理器1210进行本说明书的各个实施例中以上结合图1-图7以及图10描述的各种操作和功能。
图13示出了根据本说明书的实施例的基于计算机系统实现的用于预测图数据中的第一图节点和第二图节点之间的业务关系的图节点业务关系预测装置1300的示意图。如图13所示,图节点业务关系预测装置1300可以包括至少一个处理器1310、存储器(例如,非易失性存储器)1320、内存1330和通信接口1340,并且至少一个处理器1310、存储器1320、内存1330和通信接口1340经由总线1360连接在一起。至少一个处理器1310执行在存储器中存储或编码的至少一个计算机可读指令(即,上述以软件形式实现的元素)。
在一个实施例中,在存储器中存储计算机可执行指令,其当执行时使得至少一个处理器1310:分别自第一图节点和第二图节点开始执行节点表征传播和节点表征聚合,确定第二图节点和第一图节点的节点表征;基于第一图节点和第二图节点的节点表征,生成第一图节点和第二图节点之间的节点关系表征;以及根据第一图节点和第二图节点之间的节点关系表征,预测第一图节点和第二图节点之间的业务关系,其中,节点表征传播和节点表征聚合执行规定次数迭代过程,在节点表征传播时,将当前迭代过程的源图节点集合中的每个源图节点的上一迭代过程的节点传播表征传播给该源图节点的目标图节点集合中的每个目标图节点,所述目标图节点集合由该源图节点的邻居图节点组成;根据各个目标图节点所接收的节点传播表征以及上一迭代过程的自身节点传播表征,生成各个目标图节点的当前迭代过程的节点传播表征,在节点表征聚合时,根据聚合图节点的上一迭代过程的节点表征以及该聚合图节点的邻居图节点的上一迭代过程的节点表征,生成聚合图节点的当前迭代过程的节点表征,其中,聚合图节点包括第一图节点或第二图节点,图节点的初始节点表征基于该图节点的节点传播表征以及该图节点的原始特征生成。
应该理解,在存储器中存储的计算机可执行指令当执行时使得至少一个处理器1310执行本说明书的各个实施例中以上结合图8-图9以及图11描述的各种操作和功能。
根据一个实施例,提供了一种比如机器可读介质(例如,非暂时性机器可读介质)的程序产品。机器可读介质可以具有指令(即,上述以软件形式实现的元素),该指令当被机器执行时,使得机器执行本说明书的各个实施例中以上结合图1-图11描述的各种操作和功能。具体地,可以提供配有可读存储介质的系统或者装置,在该可读存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该系统或者装置的计算机或处理器读出并执行存储在该可读存储介质中的指令。
在这种情况下,从可读介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能,因此机器可读代码和存储机器可读代码的可读存储介质构成了本发明的一部分。
可读存储介质的实施例包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RAM、DVD-RW、DVD-RW)、磁带、非易失性存储卡和ROM。可选择地,可以由通信网络从服务器计算机上或云上下载程序代码。
根据一个实施例,提供一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序当被处理器执行时,使得处理器执行本说明书的各个实施例中以上结合图1-图11描述的各种操作和功能。
本领域技术人员应当理解,上面公开的各个实施例可以在不偏离发明实质的情况下做出各种变形和修改。因此,本发明的保护范围应当由所附的权利要求书来限定。
需要说明的是,上述各流程和各系统结构图中不是所有的步骤和单元都是必须的,可以根据实际的需要忽略某些步骤或单元。各步骤的执行顺序不是固定的,可以根据需要进行确定。上述各实施例中描述的装置结构可以是物理结构,也可以是逻辑结构,即,有些单元可能由同一物理实体实现,或者,有些单元可能分由多个物理实体实现,或者,可以由多个独立设备中的某些部件共同实现。
以上各实施例中,硬件单元或模块可以通过机械方式或电气方式实现。例如,一个硬件单元、模块或处理器可以包括永久性专用的电路或逻辑(如专门的处理器,FPGA或ASIC)来完成相应操作。硬件单元或处理器还可以包括可编程逻辑或电路(如通用处理器或其它可编程处理器),可以由软件进行临时的设置以完成相应操作。具体的实现方式(机械方式、或专用的永久性电路、或者临时设置的电路)可以基于成本和时间上的考虑来确定。
上面结合附图阐述的具体实施方式描述了示例性实施例,但并不表示可以实现的或者落入权利要求书的保护范围的所有实施例。在整个本说明书中使用的术语“示例性”意味着“用作示例、实例或例示”,并不意味着比其它实施例“优选”或“具有优势”。出于提供对所描述技术的理解的目的,具体实施方式包括具体细节。然而,可以在没有这些具体细节的情况下实施这些技术。在一些实例中,为了避免对所描述的实施例的概念造成难以理解,公知的结构和装置以框图形式示出。
本公开内容的上述描述被提供来使得本领域任何普通技术人员能够实现或者使用本公开内容。对于本领域普通技术人员来说,对本公开内容进行的各种修改是显而易见的,并且,也可以在不脱离本公开内容的保护范围的情况下,将本文所定义的一般性原理应用于其它变型。因此,本公开内容并不限于本文所描述的示例和设计,而是与符合本文公开的原理和新颖性特征的最广范围相一致。

Claims (20)

1.一种用于生成图数据中的第一图节点和第二图节点之间的节点关系表征的方法,所述图数据基于业务数据生成,所述方法包括:
分别自所述第一图节点和所述第二图节点开始执行节点表征传播和节点表征聚合,确定所述第二图节点和所述第一图节点的节点表征;以及
基于所述第一图节点和所述第二图节点的节点表征,生成所述第一图节点和所述第二图节点之间的节点关系表征,
其中,所述节点表征传播和所述节点表征聚合执行规定次数迭代过程,
在所述节点表征传播时,
将当前迭代过程的源图节点集合中的每个源图节点的上一迭代过程的节点传播表征传播给该源图节点的目标图节点集合中的每个目标图节点,所述目标图节点集合由该源图节点的邻居图节点组成;
根据各个目标图节点所接收的节点传播表征以及上一迭代过程的自身节点传播表征,生成各个目标图节点的当前迭代过程的节点传播表征,
在所述节点表征聚合时,根据聚合图节点的上一迭代过程的节点表征以及该聚合图节点的邻居图节点的上一迭代过程的节点表征,生成所述聚合图节点的当前迭代过程的节点表征,其中,所述聚合图节点包括所述第一图节点或所述第二图节点,图节点的初始节点表征基于该图节点的节点传播表征以及该图节点的原始特征生成。
2.如权利要求1所述的方法,其中,基于所述第一图节点和所述第二图节点的节点表征,生成所述第一图节点和所述第二图节点之间的节点关系表征包括:
对所述第一图节点和所述第二图节点的节点表征进行拼接,生成所述第一图节点和所述第二图节点之间的节点关系表征。
3.如权利要求1所述的方法,其中,根据各个目标图节点所接收的节点传播表征以及上一迭代过程的自身节点传播表征,生成该目标图节点的当前迭代过程的节点传播表征包括:
根据各个目标图节点从各个邻居图节点接收的节点传播表征、与各个邻居图节点之间的边关系特征以及上一迭代过程的自身节点传播表征,生成该目标图节点的当前迭代过程的节点传播表征。
4.如权利要求1所述的方法,其中,图节点的初始节点表征基于该图节点的节点传播表征以及该图节点的原始特征生成包括:
图节点的初始节点表征通过拼接该图节点的节点传播表征以及该图节点的原始特征生成。
5.如权利要求1所述的方法,其中,所述方法基于图神经网络实现。
6.如权利要求5所述的方法,其中,根据聚合图节点的上一迭代过程的节点表征以及该聚合图节点的邻居图节点的上一迭代过程的节点表征,生成所述聚合图节点的当前迭代过程的节点表征包括:
使用聚集函数对聚合图节点的上一迭代过程的节点表征以及该聚合图节点的邻居图节点的上一迭代过程的节点表征进行聚集,生成所述聚合图节点的当前迭代过程的节点表征。
7.如权利要求6所述的方法,其中,所述图神经网络包括具有Attention机制和LSTM聚合器的图神经网络。
8.如权利要求7所述的方法,其中,根据各个目标图节点所接收的节点传播表征以及上一迭代过程的自身节点传播表征,生成各个目标图节点的当前迭代过程的节点传播表征包括:
通过Attention操作聚合各个目标图节点所接收的节点传播表征,得到各个目标图节点的邻居节点传播表征;以及
通过LSTM聚合器对各个目标图节点的邻居节点传播表征以及该目标图节点的上一迭代过程的节点传播表征进行LSTM聚合,生成各个目标图节点的当前迭代过程的节点传播表征。
9.如权利要求1所述的方法,其中,所述业务数据包括下述业务数据中的一种:
社交数据;
金融交易数据;
商品交易数据;和
企业供应关系数据。
10.一种用于预测图数据中的第一图节点和第二图节点之间的业务关系的方法,所述图数据基于业务数据生成,所述方法包括:
分别自所述第一图节点和所述第二图节点开始执行节点表征传播和节点表征聚合,确定所述第二图节点和所述第一图节点的节点表征;
基于所述第一图节点和所述第二图节点的节点表征,生成所述第一图节点和所述第二图节点之间的节点关系表征;以及
根据所述第一图节点和所述第二图节点之间的节点关系表征,预测所述第一图节点和所述第二图节点之间的业务关系,
其中,所述节点表征传播和所述节点表征聚合执行规定次数迭代过程,
在所述节点表征传播时,
将当前迭代过程的源图节点集合中的每个源图节点的上一迭代过程的节点传播表征传播给该源图节点的目标图节点集合中的每个目标图节点,所述目标图节点集合由该源图节点的邻居图节点组成;
根据各个目标图节点所接收的节点传播表征以及上一迭代过程的自身节点传播表征,生成各个目标图节点的当前迭代过程的节点传播表征,
在所述节点表征聚合时,根据聚合图节点的上一迭代过程的节点表征以及该聚合图节点的邻居图节点的上一迭代过程的节点表征,生成所述聚合图节点的当前迭代过程的节点表征,其中,所述聚合图节点包括所述第一图节点或所述第二图节点,图节点的初始节点表征基于该图节点的节点传播表征以及该图节点的原始特征生成。
11.一种用于生成图数据中的第一图节点和第二图节点之间的节点关系表征的装置,所述图数据基于业务数据生成,所述装置包括:
节点表征确定单元,分别自所述第一图节点和所述第二图节点开始执行节点表征传播和节点表征聚合,确定所述第二图节点和所述第一图节点的节点表征;以及
节点关系表征生成单元,基于所述第一图节点和所述第二图节点的节点表征,生成所述第一图节点和所述第二图节点之间的节点关系表征,
其中,所述节点表征确定单元包括:
节点表征传播模块,将当前迭代过程的源图节点集合中的每个源图节点的上一迭代过程的节点传播表征传播给该源图节点的目标图节点集合中的每个目标图节点,所述目标图节点集合由该源图节点的邻居图节点组成,并且根据各个目标图节点所接收的节点传播表征以及上一迭代过程的自身节点传播表征,生成各个目标图节点的当前迭代过程的节点传播表征;
节点表征聚合模块,根据聚合图节点的上一迭代过程的节点表征以及该聚合图节点的邻居图节点的上一迭代过程的节点表征,生成所述聚合图节点的当前迭代过程的节点表征,其中,所述聚合图节点包括所述第一图节点或所述第二图节点,图节点的初始节点表征基于该图节点的节点传播表征以及该图节点的原始特征生成,
其中,所述节点表征传播模块和所述节点表征聚合模块执行规定次数迭代过程。
12.如权利要求11所述的装置,其中,所述节点关系表征生成单元对所述第一图节点和所述第二图节点的节点表征进行拼接,生成所述第一图节点和所述第二图节点之间的节点关系表征。
13.如权利要求11所述的装置,其中,所述节点表征传播模块根据各个目标图节点从各个邻居图节点接收的节点传播表征、与各个邻居图节点之间的边关系特征以及上一迭代过程的自身节点传播表征,生成该目标图节点的当前迭代过程的节点传播表征。
14.如权利要求11所述的装置,其中,所述节点表征聚合模块通过拼接图节点的节点传播表征以及该图节点的原始特征生成该图节点的初始节点表征。
15.如权利要求11所述的装置,其中,所述装置基于图神经网络实现,所述节点表征聚合模块使用聚集函数对聚合图节点的上一迭代过程的节点表征以及该聚合图节点的邻居图节点的上一迭代过程的节点表征进行聚集,生成该聚合图节点的当前迭代过程的节点表征。
16.一种用于预测图数据中的第一图节点和第二图节点之间的业务关系的装置,所述图数据基于业务数据生成,所述装置包括:
节点表征确定单元,分别自所述第一图节点和所述第二图节点开始执行节点表征传播和节点表征聚合,确定所述第二图节点和所述第一图节点的节点表征;
节点关系表征生成单元,基于所述第一图节点和所述第二图节点的节点表征,生成所述第一图节点和所述第二图节点之间的节点关系表征;以及
节点间业务关系预测单元,根据所述第一图节点和所述第二图节点之间的节点关系表征,预测所述第一图节点和所述第二图节点之间的业务关系,
其中,所述节点表征确定单元包括:
节点表征传播模块,将当前迭代过程的源图节点集合中的每个源图节点的上一迭代过程的节点传播表征传播给该源图节点的目标图节点集合中的每个目标图节点,所述目标图节点集合由该源图节点的邻居图节点组成,并且根据各个目标图节点所接收的节点传播表征以及上一迭代过程的自身节点传播表征,生成各个目标图节点的当前迭代过程的节点传播表征;
节点表征聚合模块,根据聚合图节点的上一迭代过程的节点表征以及该聚合图节点的邻居图节点的上一迭代过程的节点表征,生成所述聚合图节点的当前迭代过程的节点表征,其中,所述聚合图节点包括所述第一图节点或所述第二图节点,图节点的初始节点表征基于该图节点的节点传播表征以及该图节点的原始特征生成,
其中,所述节点表征传播模块和所述节点表征聚合模块执行规定次数迭代过程。
17.一种用于生成图数据中的第一图节点和第二图节点之间的节点关系表征的装置,所述图数据基于业务数据生成,所述装置包括:
至少一个处理器,
与所述至少一个处理器耦合的存储器,以及
存储在所述存储器中的计算机程序,所述至少一个处理器执行所述计算机程序来实现如权利要求1到9中任一所述的方法。
18.一种用于预测图数据中的第一图节点和第二图节点之间业务关系的装置,所述图数据基于业务数据生成,所述装置包括:
至少一个处理器,
与所述至少一个处理器耦合的存储器,以及
存储在所述存储器中的计算机程序,所述至少一个处理器执行所述计算机程序来实现如权利要求10所述的方法。
19.一种计算机可读存储介质,其存储有可执行指令,所述指令当被执行时使得处理器执行如权利要求1到10中任一所述的方法。
20.一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行来实现如权利要求1到10任一所述的方法。
CN202111003074.7A 2021-08-30 2021-08-30 图节点关系表征生成和图节点业务关系预测方法及装置 Pending CN113656651A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202111003074.7A CN113656651A (zh) 2021-08-30 2021-08-30 图节点关系表征生成和图节点业务关系预测方法及装置
PCT/CN2022/104328 WO2023029744A1 (zh) 2021-08-30 2022-07-07 图节点关系表征生成和图节点业务关系预测
US18/398,447 US20240144165A1 (en) 2021-08-30 2023-12-28 Graph node relationship representation generation and graph node service relationship prediction

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111003074.7A CN113656651A (zh) 2021-08-30 2021-08-30 图节点关系表征生成和图节点业务关系预测方法及装置

Publications (1)

Publication Number Publication Date
CN113656651A true CN113656651A (zh) 2021-11-16

Family

ID=78482395

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111003074.7A Pending CN113656651A (zh) 2021-08-30 2021-08-30 图节点关系表征生成和图节点业务关系预测方法及装置

Country Status (3)

Country Link
US (1) US20240144165A1 (zh)
CN (1) CN113656651A (zh)
WO (1) WO2023029744A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023029744A1 (zh) * 2021-08-30 2023-03-09 支付宝(杭州)信息技术有限公司 图节点关系表征生成和图节点业务关系预测
WO2023179386A1 (zh) * 2022-03-22 2023-09-28 阿里巴巴(中国)有限公司 数据处理方法、设备、存储介质及程序产品

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109918454B (zh) * 2019-02-22 2024-02-06 创新先进技术有限公司 对关系网络图进行节点嵌入的方法及装置
US11645524B2 (en) * 2019-05-10 2023-05-09 Royal Bank Of Canada System and method for machine learning architecture with privacy-preserving node embeddings
US11514265B2 (en) * 2019-09-26 2022-11-29 Microsoft Technology Licensing, Llc Inference via edge label propagation in networks
CN110866190B (zh) * 2019-11-18 2021-05-14 支付宝(杭州)信息技术有限公司 训练用于表征知识图谱的图神经网络模型的方法及装置
CN111985729A (zh) * 2020-09-07 2020-11-24 支付宝(杭州)信息技术有限公司 一种基于图神经网络进行预测的方法、系统和装置
CN112070216B (zh) * 2020-09-29 2023-06-02 支付宝(杭州)信息技术有限公司 一种基于图计算系统训练图神经网络模型的方法及系统
CN112035683A (zh) * 2020-09-30 2020-12-04 北京百度网讯科技有限公司 用户交互信息处理模型生成方法和用户交互信息处理方法
CN112328911B (zh) * 2020-10-30 2023-05-23 腾讯科技(深圳)有限公司 地点推荐方法、装置、设备及存储介质
CN113656651A (zh) * 2021-08-30 2021-11-16 支付宝(杭州)信息技术有限公司 图节点关系表征生成和图节点业务关系预测方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023029744A1 (zh) * 2021-08-30 2023-03-09 支付宝(杭州)信息技术有限公司 图节点关系表征生成和图节点业务关系预测
WO2023179386A1 (zh) * 2022-03-22 2023-09-28 阿里巴巴(中国)有限公司 数据处理方法、设备、存储介质及程序产品

Also Published As

Publication number Publication date
US20240144165A1 (en) 2024-05-02
WO2023029744A1 (zh) 2023-03-09

Similar Documents

Publication Publication Date Title
US11501304B2 (en) Systems and methods for classifying imbalanced data
WO2023029744A1 (zh) 图节点关系表征生成和图节点业务关系预测
Ghavipour et al. Trust propagation algorithm based on learning automata for inferring local trust in online social networks
TWI631518B (zh) 具有一或多個計算裝置的電腦伺服系統及訓練事件分類器模型的電腦實作方法
CA3080050A1 (en) Training tree-based machine-learning modeling algorithms for predicting outputs and generating explanatory data
US11997098B2 (en) Using one or more networks to assess one or more metrics about an entity
KR102133143B1 (ko) 당사자 간의 전략적 상호 작용에서의 전략 검색
CN112070216B (zh) 一种基于图计算系统训练图神经网络模型的方法及系统
CN112215500B (zh) 账号关系识别方法及装置
CN109635990B (zh) 一种训练方法、预测方法、装置、电子设备及存储介质
US20220245425A1 (en) Knowledge graph embedding using graph convolutional networks with relation-aware attention
Dickens et al. Learning stochastic models of information flow
US20230185996A1 (en) Framework for blockchain development
US11994395B2 (en) Method, machine readable medium, device, and vehicle for determining a route connecting a plurality of destinations in a road network, method, machine readable medium, and device for training a machine learning module
CN106651422A (zh) 一种数据处理方法及装置
Huang et al. Ill-ids: An incremental lifetime learning ids for vanets
US11095528B2 (en) Identity network onboarding based on confidence scores
CN116883151A (zh) 对用户风险的评估系统进行训练的方法及装置
CN111274907A (zh) 使用类别识别模型来确定用户的类别标签的方法和装置
CN115599990A (zh) 一种知识感知结合深度强化学习的跨域推荐方法及系统
WO2022104616A1 (en) Non-linear causal modeling based on encoded knowledge
US11849342B2 (en) Global and local measures of centrality for signed and unsigned networks
CN115080763A (zh) 一种知识图谱路径搜索方法和系统
Kong Research on Enterprise Digital Precision Marketing Strategy Based on Big Data
US20160063392A1 (en) Method and system for identifying dependent components

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination