CN111258469B - 处理交互序列数据的方法及装置 - Google Patents

处理交互序列数据的方法及装置 Download PDF

Info

Publication number
CN111258469B
CN111258469B CN202010022182.8A CN202010022182A CN111258469B CN 111258469 B CN111258469 B CN 111258469B CN 202010022182 A CN202010022182 A CN 202010022182A CN 111258469 B CN111258469 B CN 111258469B
Authority
CN
China
Prior art keywords
node
interaction
nodes
event
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010022182.8A
Other languages
English (en)
Other versions
CN111258469A (zh
Inventor
常晓夫
文剑烽
刘旭钦
宋乐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202010022182.8A priority Critical patent/CN111258469B/zh
Publication of CN111258469A publication Critical patent/CN111258469A/zh
Priority to PCT/CN2020/137922 priority patent/WO2021139513A1/zh
Application granted granted Critical
Publication of CN111258469B publication Critical patent/CN111258469B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0641Shopping interfaces

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书实施例提供一种处理交互数据的方法和装置。在该方法中,首先获取根据交互事件集构建的动态交互图,其中任意节点i通过连接边指向该节点i所代表的对象上次参与的N个关联事件所对应的M个关联节点,其中允许对象同时参与多个关联事件,允许节点连接到多于2个的关联节点。然后,在动态交互图中,确定与目标节点对应的目标子图,该目标子图包括从目标节点出发,经由连接边到达的预定范围内的节点;于是,基于该目标子图中包含的各个节点的节点特征,以及节点之间的连接边的指向关系,可以确定目标节点对应的特征向量,以进行业务处理。

Description

处理交互序列数据的方法及装置
技术领域
本说明书一个或多个实施例涉及机器学习领域,尤其涉及利用机器学习处理交互序列数据的方法和装置。
背景技术
在许多场景下,需要对用户交互事件进行分析和处理。交互事件是互联网事件的基本组成元素之一,例如,用户浏览页面时的点击行为,可以视为用户与页面内容区块之间的交互事件,电商中的购买行为可以视为用户与商品之间的交互事件,用户通过社交平台进行的沟通,以及账户间转账行为则是用户与用户之间的交互事件。用户的一系列交互事件中蕴含了用户的细粒度习惯偏好等特点,以及交互对象的特点,是机器学习模型的重要特征来源。因此,在许多场景下,希望根据交互事件对交互参与方进行特征表达和建模。
然而,交互事件涉及交互双方,并且各个参与方本身的状态可以是动态变化的,因此,综合考虑交互参与方的多方面特点对其进行准确的特征表达非常困难。由此,希望能有改进的方案,更为有效地对交互事件中的交互对象进行分析处理,以得到适于后续分析的特征向量。
发明内容
本说明书一个或多个实施例描述了处理交互数据的方法和装置,其中考虑交互对象参与的交互事件以及交互事件中其他对象的影响,将交互对象处理为特征向量,从而有利于后续对交互对象的分析和对交互事件的分析。
根据第一方面,提供了一种处理交互数据的方法,所述方法包括:
获取根据交互事件集构建的动态交互图,其中,所述交互事件集包括多个交互事件,每个交互事件至少包括,发生交互行为的两个对象和交互时间;所述动态交互图包括任意的第一节点,所述第一节点对应于发生在第一时间的交互事件中的第一对象,所述第一节点通过连接边指向N个关联事件所对应的M个关联节点,所述N个关联事件均发生于第二时间,且均包含所述第一对象作为交互对象之一,所述第二时间为,从所述第一时间向前回溯,所述第一对象发生交互行为的前一时间;所述动态交互图中包括至少一个关联节点数目大于2的多元节点;
在所述动态交互图中,确定与第一目标节点对应的第一目标子图,所述第一目标子图包括从所述第一目标节点出发,经由连接边到达的预定范围内的节点;
基于所述第一目标子图中包含的各个节点的节点特征,以及节点之间的连接边的指向关系,确定所述第一目标节点对应的第一特征向量;
至少利用所述第一特征向量,进行与所述第一目标节点相关的业务处理。
在一个实施例中,所述对象包括用户,所述交互事件包括以下中的至少一种:点击事件,社交事件,交易事件。
在一个实施例中,上述M个关联节点为2N个节点,分别对应于所述N个关联事件中各个关联事件所包括的两个对象。
根据该实施例,可以通过以下方式获取动态交互图:获取基于已有交互事件集构建的已有动态交互图;获取第一更新时间发生的P个新增交互事件;在所述已有动态交互图中添加2P个新增节点,所述2P个新增节点分别对应于所述P个新增交互事件中各个新增交互事件包括的两个对象;对于每个新增节点,若其存在关联节点,添加从该新增节点指向其关联节点的连接边。
在另一实施例中,上述M个关联节点为N+1个节点,分别对应于所述N个关联事件中与所述第一对象交互的N个其他对象,以及所述第一对象自身。
根据该实施例,可以通过以下方式获取动态交互图:获取基于已有交互事件集构建的已有动态交互图;获取第一更新时间发生的P个新增交互事件;确定所述P个新增交互事件所涉及的Q个不同对象;在所述已有动态交互图中添加Q个新增节点,所述Q个新增节点分别对应于所述Q个不同对象;对于每个新增节点,若其存在关联节点,添加从该新增节点指向其关联节点的连接边。
根据一种实施方式,上述第一目标节点是这样的节点:在所述动态交互图中,不存在指向该节点的连接边。
在一种实施方式中,所述预定范围内的节点包括:预设阶数K的连接边之内的节点;和/或,交互时间在预设时间范围内的节点。
根据一个实施例,每个交互事件还包括,交互事件的事件特征;在这样的情况下,各个节点的节点特征可以包括,各个节点所对应的对象的属性特征,以及各个节点所在的交互事件的事件特征。
根据一种实施方式,所进行的与第一目标节点相关的业务处理可以包括,根据所述第一特征向量,预测所述第一目标节点对应的对象的分类类别。
根据一个实施例,所述方法还包括,在所述动态交互图中,确定与第二目标节点对应的第二目标子图,所述第二目标子图包括从所述第二目标节点出发,经由连接边到达的所述预定范围内的节点;基于所述第二目标子图中包含的各个节点的节点特征,以及节点之间的连接边的指向关系,确定所述第二目标节点对应的第二特征向量。
基于以上实施例,所进行的与第一目标节点相关的业务处理还可以包括,根据所述第一特征向量和所述第二特征向量,预测所述第一目标节点和所述第二目标节点代表的对象是否会发生交互。
或者,在一个实施例中,第一目标节点和第二目标节点为第一交互事件对应的两个节点;此时,业务处理可以包括,根据所述第一特征向量和所述第二特征向量,预测所述第一交互事件的事件类别。
根据一种实施方式,可以通过以下方式确定第一目标节点对应的第一特征向量:将所述第一目标子图输入预先训练的神经网络模型,所述神经网络模型基于所述第一目标子图中包含的各个节点的节点特征,以及节点之间的连接边的指向关系,输出所述第一特征向量。
进一步的,在不同实施例中,所述神经网络模型包括以下之一:基于LSTM的神经网络模型,基于RNN的神经网络模型,基于Transformer的神经网络模型
根据第二方面,提供了一种处理交互数据的装置,所述装置包括:
交互图获取单元,配置为获取根据交互事件集构建的动态交互图,其中,所述交互事件集包括多个交互事件,每个交互事件至少包括,发生交互行为的两个对象和交互时间;所述动态交互图包括任意的第一节点,所述第一节点对应于发生在第一时间的交互事件中的第一对象,所述第一节点通过连接边指向N个关联事件所对应的M个关联节点,所述N个关联事件均发生于第二时间,且均包含所述第一对象作为交互对象之一,所述第二时间为,从所述第一时间向前回溯,所述第一对象发生交互行为的前一时间;所述动态交互图中包括至少一个关联节点数目大于2的多元节点;;
子图确定单元,配置为在所述动态交互图中,确定与第一目标节点对应的第一目标子图,所述第一目标子图包括从所述第一目标节点出发,经由连接边到达的预定范围内的节点;
子图处理单元,配置为基于所述第一目标子图中包含的各个节点的节点特征,以及节点之间的连接边的指向关系,确定所述第一目标节点对应的第一特征向量;
业务处理单元,配置为至少利用所述第一特征向量,进行与所述第一目标节点相关的业务处理。
根据第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面的方法。
根据第四方面,提供了一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面的方法。
根据本说明书实施例提供的方法和装置,基于交互事件集构建动态交互图,该动态交互图反映了各个交互事件的时序关系,以及交互对象之间通过各个交互事件传递的相互影响。并且,上述交互事件集中存在多个交互事件同时发生,相应的动态交互图中允许存在连接到多个关联节点的多元节点,以此丰富动态交互图中包含的关系信息。于是,基于该动态交互图中与待分析交互对象对应的节点相关的子图,可以提取得到该交互对象的特征向量。如此得到的特征向量中引入了各个交互事件中其他交互对象对其的影响,从而可以综合全面地表达该交互对象的深层特征,更好地进行业务处理。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1A示出在一个例子中的交互关系二部图;
图1B示出在另一例子中的交互关系网络图;
图2示出根据一个实施例的实施场景示意图;
图3示出根据一个实施例的处理交互数据的方法流程图;
图4示出根据一个实施例构建的动态交互图;
图5示出根据另一个实施例构建的动态交互图;
图6示出在一个实施例中目标子图的示例;
图7示出在另一个实施例中目标子图的示例;
图8示出在一个实施例中训练神经网络模型的流程图;
图9示出在另一实施例中训练神经网络模型的流程图;
图10示出根据一个实施例的处理交互数据的装置的示意性框图。
具体实施方式
下面结合附图,对本说明书提供的方案进行描述。
如前所述,希望能够基于交互事件序列,对交互事件的参与方,即交互对象进行特征表达和建模。
在一种方案中,基于历史交互事件构建静态的交互关系网络图,从而基于该交互关系网络图,分析各个交互对象。具体地,可以以各个历史事件的参与者作为节点,在存在交互关系的节点之间建立连接边,从而形成上述交互网络图。
图1A和图1B分别示出在具体例子中的交互关系网络图。更具体而言,图1A示出一个二部图,其中包含用户节点(U1-U4)和商品节点(V1-V3),如果某个用户购买过某件商品,则在该用户和该商品之间构建一条连接边。图1B示出一个用户转账关系图,其中每个节点代表一个用户,发生过转账记录的两个用户之间存在连接边。
然而,可以看到,图1A和图1B尽管示出了对象之间的交互关系,但是没有包含这些交互事件的时序信息。简单地基于这样的交互关系网络图进行图嵌入,获得的特征向量也没有表达出交互事件的时间信息对节点的影响。并且,这样的静态图可扩展性不够强,对于新增交互事件和新增节点的情况,难以灵活进行处理。
在另一方案中,对于各个待分析的交互对象,构建该对象的行为序列,基于该行为序列,提取该对象的特征表达。然而,这样的行为序列仅表征了待分析对象本身的行为,而交互事件是多方参与的事件,参与者之间会通过交互事件间接传递影响。因此,这样的方式没有表达出交互事件中的参与对象之间的影响。
综合考虑以上因素,根据本说明书的一个或多个实施例,将动态变化的交互事件集合构建成动态交互图,其中各个交互事件中涉及的各个交互对象对应于该动态交互图中的各个节点。任意节点连接到若干关联节点,其中关联节点为该任意节点所对应的对象上次参与的交互事件对应的节点。对于待分析的交互对象,从该动态交互图中得到对应节点相关的子图部分,基于该子图部分中包含的节点的节点特征和节点间连接关系,得到该交互对象的特征向量表达。
图2示出根据一个实施例的实施场景示意图。如图2所示,可以获取发生的多个交互事件所构成的交互事件集。更具体的,该交互事件集可以是将多个交互事件按时间顺序组织成的交互事件序列<E1,E2,…,EN>,其中每个元素Ei表示一个交互事件,可以表示为交互特征组的形式Ei=(ai,bi,ti),其中ai和bi是事件Ei的两个交互对象,ti是交互时间。由于时间测量的精度等因素,允许在同一时间发生多个交互事件。
根据本说明书的实施例,基于该交互事件集构建动态交互图200。在图200中,将各个交互事件中的各个交互对象ai,bi用节点表示,并在包含同一对象的事件之间建立连接边。由于允许同时发生多个交互事件,动态交互图200中包含至少一个多元节点,该多元节点可以连接到3个或更多的关联节点。动态交互图200的结构将在后续进行更具体的描述。
对于某个待分析的目标交互对象对应的目标节点,可以确定出其在动态交互图中对应的目标子图。一般地,目标子图包括从目标节点出发,经过一定范围的连接边可以达到的节点。该子图反映了,与目标交互对象直接或间接关联的交互事件中的其他对象对目标节点带来的影响。
然后,基于目标子图中各个节点的节点特征和节点连接关系,得到目标节点对应的特征向量。如此得到的特征向量,可以抽取出相关联的交互事件的时序信息和各交互事件中的交互对象之间的影响,从而更准确地表达目标节点代表的目标交互对象的深层特征。这样的特征向量可以在后续应用于各种机器学习模型和各种业务场景。例如,可以基于如此得到的特征向量进行强化学习,也可以基于该特征向量进行聚类分析,例如,将用户聚类为人群。还可以基于这样的特征向量进行分类预测,例如,预测两个对象之间是否会发生交互(比如某个用户是否会购买某个商品),预测某个对象的业务类型(比如某个用户的风险层级),还可以基于一个交互事件中两个对象的特征向量预测该交互事件的事件类别,等等。
下面描述以上构思的具体实现方式。
图3示出根据一个实施例的处理交互数据的方法流程图。可以理解,可以理解,该方法可以通过任何具有计算、处理能力的装置、设备、平台、设备集群来执行。下面结合具体实施例,对如图3所示的处理交互数据的方法中的各个步骤进行描述。
首先,在步骤31,获取根据交互事件集构建的动态交互图。
如前所述,可以获取多个交互事件构成的交互事件集,其中每个交互事件具有两个交互对象和交互时间。因此,任意交互事件Ei可以表示为一个交互特征组Ei=(ai,bi,ti),其中ai和bi是事件Ei的两个交互对象,例如称为第一对象和第二对象,ti是交互时间。
例如,在电商平台中,交互事件可以是用户的购买行为,其中的第一对象可以是某个用户,第二对象可以是某个商品。在另一例子中,交互事件可以是用户对页面区块的点击行为,其中的第一对象可以是某个用户,第二对象可以是某个页面区块。在又一例子中,交互事件可以是交易事件,例如一个用户向另一用户转账,或者一个用户向一个店铺或平台进行支付。在另外一个例子中,交互事件可以是用户通过社交平台发生的社交事件,例如聊天、通话、发红包等等。在其他业务场景中,交互事件还可以是其他在两个对象之间发生的交互行为。
在一个实施例中,根据交互事件的特点,发生交互的两个对象可以是不同类型的对象,例如称为第一类对象和第二类对象。例如,在交互事件为电商平台中的购买行为时,其中的第一类对象可以是某个用户,第二类对象可以是某个商品。在另一些实施例中,交互事件涉及的两个对象可以是同类对象。例如,在即时通讯场景中,交互事件可以是两个用户之间进行了一次即时通讯。此时,第一对象和第二对象均为用户,属于同类对象。在又一些实施例中,可以根据业务的需要,来设定是否区分两个交互对象的类型。例如,对于转账交互事件,在前述例子中,可以认为两个用户属于同类对象。在其他例子中,也可以根据业务需要,将金额转出方用户认为是第一类对象,将接收方用户认为是第二类对象。
进一步的,在一个实施例中,每个交互事件对应的交互特征组还可以包括事件特征或行为特征f,如此,每个交互特征组可以表示为Xi=(ai,bi,ti,f)。具体的,事件特征或行为特征f可以包括交互事件发生的背景和上下文信息,交互行为的一些属性特征,等等。
例如,在交互事件为用户点击事件的情况下,事件特征f可以包括,用户进行点击所使用的终端的类型,浏览器类型,app版本,等等;在交互事件为交易事件的情况下,事件特征f可以包括,例如,交易类型(商品购买交易、转账交易等),交易金额,交易渠道等等。
以上描述了交互事件以及事件中的交互对象ai,bi的举例。
对于交互时间ti,需要理解,实际操作中总是会以一个适当的时长为单位对时间进行测量和记录。例如,在一些服务平台,记录交互时间的单位时长可以是小时h,或者分钟m。于是,在该单位时长之内很可能会发生多个交互事件。即使是以较短的时长为单位,例如秒s甚至毫秒ms,对于一些交互非常频繁的服务平台,例如支付宝,仍然会不可避免地出现,单位时长内多个交互事件的情况。
此外,还存在一些批量交互的情况。例如,用户预先编辑了一条消息,并选中了一个好友群,然后进行批量群发的操作。这相当于同时发起与多个好友的交互事件。又例如,用户在购物车中添加了多件商品,然后选择了批量结算,这相当于同时发起与多个商品的交互事件。
至少出于以上两个方面的原因,往往会出现多个交互事件所记录的交互时间相同的情况。对于这样的情况,本文中有时简称为同时发生的多个交互事件,而不区分其精确的时刻和先后。
在一个具体例子中,假定获取到了一个交互事件集S,该交互事件集S中的交互事件按照时间顺序排列,并以交互特征组的形式表示,可以记录为如下:
Figure BDA0002361208690000101
其中,a,b,c,d,e,f,u,v为交互对象,交互事件E2和E3均发生于t2时间,交互事件E4,E5和E6均发生于t3时间,交互事件E7和E8均发生于t4时间。
对于以上所述的交互事件集,可以构建动态交互图,来刻画各个交互事件以及交互对象之间的关联关系。具体的,可以将各个时间发生的交互事件中包含的对象作为动态交互图的节点。如此,一个节点可以对应在一个时间下发生交互行为的一个对象,但是同一物理对象可能对应到多个节点。例如,物理对象v在t6时间与对象u进行交互,可以对应构建节点v(t6),在t5时间与对象c进行交互,可以对应构建节点v(t5)。因此可以认为,动态交互图中的节点对应于在一定交互时间下的交互对象,或者说,对应于该交互对象在一定交互时间下的状态。
对于动态交互图中的每个节点,按照以下方式构建连接边:对于任意节点i,简单起见将其称为第一节点;假定其对应于第一交互时间t下的第一对象,那么在交互事件序列中,从第一交互时间t向前回溯,也就是向早于第一交互时间t的方向回溯,确定出第一对象发生交互行为的上一时间为第二时间(t-),将第二时间中发生的、该第一对象参与的N个交互事件作为第一节点的N个关联事件,将N个关联事件对应的M个节点作为关联节点,建立从第一节点i指向M个关联节点的连接边。由于存在同一时间发生多个交互事件的可能,因此,N可能大于1。如此,动态交互图中可以包括多元节点,即,所连接的关联节点数目大于2的节点。
在一个实施例中,在构建动态交互图时,为每个交互事件的两个对象都分别建立对应节点。如此,前述的N个关联事件对应2N个节点,这2N个节点即作为前述M个关联节点。
图4示出根据一个实施例构建的动态交互图。具体的,图4左侧示出将前述交互事件集S按照时间顺序组织的交互序列示意图,右侧示出一个动态交互图。在该动态交互图中,将各个交互事件中的两个交互对象分别作为节点。下面以节点u(t6)和v(t6)为例,描述连接边的构建。
可以理解,该节点u(t6)表示时间t6下的对象u。于是,从时间t6出发向前回溯,可以确定出对象u上一次发生交互行为的时间为t4,在该时间t4中参与了2个关联事件E7和E8,即交互事件E7和E8均包含对象u作为交互对象之一。因此,关联事件E7和E8所对应的4个节点,即为节点u(t6)的关联节点。在图4中,为了区分事件E7和E8中的对象节点u,将其记为u1(t4)和u2(t4)。于是,建立从节点u(t6)指向其4个关联节点的连接边。
节点v(t6)表示时间t6下的对象v。于是,从时间t6出发向前回溯,可以确定出对象v上一次发生交互行为的时间为t5,在该时间t5中参与了1个关联事件E9。因此,关联事件E9所对应的2个节点v(t5)和c(t5),即为节点v(t6)的关联节点。于是,建立从节点v(t6)指向该2个关联节点的连接边。对于其他各个节点,均可以采用上述方式,确定出其关联事件和关联节点,从而建立指向关联节点的连接边。在图4所示的动态交互图中,节点u(t6),c(t5)都是多元节点。
在另一个实施例中,在构建动态交互图时,对于发生于同一时间的多个交互事件,确定出该多个交互事件所涉及的不同交互对象,为各个不同交互对象分别建立对应节点。也就是说,如果同一时间发生的多个交互事件中包含同样的对象,则仅为该同样的对象建立一个节点。如此,在建立连接边时,如果对应于第一对象的第一节点存在N个关联事件,那么这N个关联事件则对应N+1个关联节点,分别对应于第一对象自身,以及N个关联事件中与第一对象交互的N个其他对象。
图5示出根据另一个实施例构建的动态交互图。具体的,图5左侧示出前述交互事件集S,右侧示出一个动态交互图。在该动态交互图中,为同时发生的交互事件中不同的交互对象分别建立对应节点。图5的动态交互图与图4的相比,区别在于,将图4中发生于同一时间的多个交互事件中相同对象的节点合并为一个节点。例如,对于均发生于时间t4的两个交互事件E7,E8,其中涉及3个不同交互对象a,b,u,则为该时间下的交互事件建立3个节点a(t4),b(t4),u(t4)。这相当于将图4中的u1(t4)和u2(t4)合并为一个节点u(t4)。在这样的情况下,在一个示例中,可以通过节点之间的虚线双向箭头示出发生的交互关系,例如通过图5的虚线双向箭头可以示出,在t4时间,对象a与u存在交互行为,对象b与u存在交互行为,但是对象a和b之间没有交互行为。
下面仍以节点u(t6)和v(t6)为例,描述连接边的构建。
如前所述,节点u(t6)表示时间t6下的对象u。从时间t6出发向前回溯,可以确定出对象u上一次发生交互行为的时间为t4,在该时间t4中参与了2个关联事件E7和E8,即交互事件E7和E8均包含对象u作为交互对象之一。关联事件E7和E8对应的3个节点a(t4),b(t4),u(t4),为节点u(t6)的关联节点。于是,建立从节点u(t6)指向该3个关联节点的连接边。
从节点v(t6),可以建立指向关联事件E9所对应的2个节点v(t5)和c(t5)的连接边,该过程与结合图4的描述相同,不再赘述。对于图5中的其他各个节点,均可以采用上述方式,确定出其关联事件和关联节点,从而建立指向关联节点的连接边。在图5所示的动态交互图中,节点u(t6),c(t5)都是多元节点。
以上描述了基于交互事件集构建动态交互图的方式和过程。对于图3所示的处理交互数据的方法而言,构建动态交互图的过程可以预先进行也可以现场进行。相应地,在一个实施例中,在步骤31,根据交互事件集现场构建动态交互图。构建方式如以上所述。在另一实施例中,可以预先基于交互事件集构建形成动态交互图。在步骤31,读取或接收已形成的动态交互图。
可以理解,按照以上方式构建的动态交互图具有很强的可扩展性,可以非常容易地根据新增的交互事件进行动态更新。相应地,步骤31还可以包括更新动态交互图的过程。
具体地,可以获取基于已有交互事件集构建的已有动态交互图,然后随着时间的更新,不断检测更新时间中发生的新增交互事件,根据新增交互事件,更新已有动态交互图。
在一个实施例中,已有动态交互图采用图4的形式,每个交互事件对应两个节点。在这样的情况下,假定获取到第一更新时间发生的P个新增交互事件,那么,就在已有动态交互图中添加2P个新增节点,所述2P个新增节点分别对应于P个新增交互事件中各个新增交互事件包括的两个对象。然后,对于每个新增节点,按照前述方式,寻找其关联事件和关联节点。如果其存在关联节点,则添加从该新增节点指向其关联节点的连接边。
在另一实施例中,已有动态交互图采用图5的形式,同时发生的交互事件中不同对象对应不同节点。在这样的情况下,在获取到第一更新时间发生的P个新增交互事件后,首先确定该P个新增交互事件所涉及的Q个不同对象。如果P个新增交互事件中不存在相同的交互对象,那么Q=2P;如果P个新增交互事件中存在相同的交互对象,那么Q<2P。接着,在已有动态交互图中添加Q个新增节点,所述Q个新增节点分别对应于Q个不同对象。然后,对于每个新增节点,按照前述方式,寻找其关联事件和关联节点。如果其存在关联节点,则添加从该新增节点指向其关联节点的连接边。
综合以上,在步骤31,获取到基于交互事件集构建的动态交互图。
接着,在步骤32,在获取的动态交互图中,确定与第一目标节点对应的第一目标子图,其中第一目标子图包括,从第一目标节点出发,经由连接边到达的预定范围内的节点。
需要理解,第一目标节点可以是与待分析的某个目标交互对象对应的节点。然而如前所述,一个实体对象可以对应多个节点,表达该实体对象在不同时间下的状态。为了表达出待分析的目标交互对象的最新状态,在一个实施例中,选择这样的节点作为第一目标节点,即在动态交互图中,不存在指向该节点的连接边。也就是说,选择待分析对象最近发生交互行为的时间下对应的节点作为第一目标节点。例如,在图4和图5所示的动态交互图中,当想要分析交互对象u时,可以选择节点u(t6)作为目标节点。然而,这并不是必须的。在其他实施例中,例如为了训练的目的,也可以选择其他节点作为第一目标节点,例如,为了分析对象u,也可以选择节点u(t4)作为第一目标节点。
从第一目标节点出发,经由连接边到达的预定范围内的节点,构成第一目标节点对应的第一目标子图。在一个实施例中,上述预定范围内的节点可以是,至多经过预设阶数K的连接边可达的节点。这里阶数K为预设的超参数,可以根据业务情况选取。可以理解,该预设阶数K体现了,在表达目标节点的信息时,向前回溯的历史交互事件的步数。数目K越大,则考虑越多阶次的历史交互信息。
在另一实施例中,上述预定范围内的节点还可以是,交互时间在预定时间范围内的节点。例如,从目标节点的交互时间向前回溯T时长(例如一天),在该时长范围内、且可通过连接边达到的节点。
在又一实施例中,上述预定范围既考虑连接边的阶数,又考虑时间范围。换而言之,该预定范围内的节点是指,至多经过预设阶数K的连接边可达、且交互时间在预定时间范围内的节点。
简单起见,下面的例子中,以预设阶数K的连接边为例进行描述。
图6示出在一个实施例中目标子图的示例。在图6的例子中,假定图4中的u(t6)为第一目标节点,预设阶数K=2,那么从u(t6)出发,沿连接边的指向进行遍历,经由2级连接边可以达到的节点如图中灰色节点所示。这些灰色节点以及其间的连接关系即为第一目标节点u(t6)对应的第一目标子图。
图7示出在另一个实施例中目标子图的示例。在图7的例子中,假定图5中的u(t6)为第一目标节点,预设阶数K=2,那么从u(t6)出发,沿连接边的指向进行遍历,经由2级连接边可以达到的节点如图中灰色节点所示。这些灰色节点以及其间的连接关系即为第一目标节点u(t6)对应的第一目标子图。
接着,在步骤33,基于第一目标子图中包含的各个节点的节点特征,以及节点之间的连接边的指向关系,确定所述第一目标节点对应的第一特征向量。
具体地,节点特征可以包括节点代表的对象的属性特征。例如,在节点表示用户的情况下,节点特征可以包括用户的属性特征,例如年龄、职业、教育程度、所在地区,等等;在节点表示商品的情况下,节点特征可以包括商品的属性特征,例如商品类别、上架时间、销量等等。在节点表示其他交互对象的情况下,可以相应的获取到原始的节点特征。
在一个实施例中,如前所述,交互事件的特征组还包括事件特征f。在这样的情况下,也可以在节点特征中包含该节点所在事件的事件特征f。如果采用图5形式的动态交互图,一个节点可以对应于同一时间发生的多个交互事件,那么该节点的节点特征中可以包含该节点同时参与的多个事件的事件特征f的综合。
为了确定第一目标节点对应的第一特征向量,在一个实施例中,可以获取第一目标子图中各个节点的节点特征,然后,根据各个节点在子图中距离第一目标节点的距离为其分配相应权重,基于权重对各个节点的节点特征进行综合,以此得到第一目标节点对应的第一特征向量。某个节点距离第一目标节点的距离,可以基于从第一目标节点到该节点经历的连接边的数目确定,或者基于第一目标节点所在交互事件的交互时间T1和该某个节点对应的交互时间T2之间的时间差确定。当然,可以为第一目标节点自身预设一个比较高的权重。由此,基于第一目标子图中所包含的各个节点的节点特征,并考虑这些节点的连接关系,确定第一目标节点对应的第一特征向量。
在另一实施例中,可以采用图嵌入算法或图嵌入模型,对第一目标子图进行图嵌入,由此得到第一目标节点对应的第一特征向量。已经存在多种监督的或者非监督的图嵌入算法或图嵌入模型,可以基于实际业务的特点和需要,选择适当的算法或模型,从而得到第一特征向量。
根据一种实施方式,在步骤33,将第一目标子图输入预先训练的神经网络模型,由该神经网络模型基于该第一目标子图中包含的各个节点的节点特征,以及节点之间的连接边的指向关系,输出所述第一特征向量。
在一个实施例中,所述神经网络模型是基于RNN的神经网络模型。在这样的情况下,根据第一目标子图中节点之间的指向关系,形成节点序列,利用RNN神经网络模型依次对节点序列中的节点进行处理,得到第一目标节点的第一特征向量。
在另一实施例中,所述神经网络模型是基于LSTM的神经网络模型。LSTM神经网络模型是RNN神经网络模型的改进,同样基于节点之间的连接边所代表的节点时序关系对各个节点进行处理。更具体地,对于第一目标子图中的任意一个当前节点,LSTM神经网络模型进行以下处理:至少根据该当前节点的节点特征,当前节点所指向的若干关联节点各自的中间向量和隐含向量,确定当前节点的隐含向量和中间向量。如此,LSTM神经网络模型根据第一目标子图中各个节点之间的连接边的指向关系,依次迭代处理各个节点,从而得到第一目标节点的隐含向量,作为上述第一特征向量。
在又一实施例中,所述神经网络模型是基于Transformer的神经网络模型。在这样的情况下,首先根据第一目标子图中节点之间的指向关系,形成节点序列,并为节点序列中各个节点赋予位置编码,该位置编码反映该节点在第一目标子图中相对于第一目标节点的位置,例如距离几条连接边等等。然后将该节点序列以及位置编码输入Transfomer神经网络模型,使得Transformer神经网络模型基于节点序列中各个节点的节点特征和位置编码,计算得到第一目标节点的第一特征向量。
在其他实施例中,神经网络模型还可以是基于其他网络结构和算法的神经网络模型,在此不一一列举。
以上,通过各种方式,基于第一目标子图确定出第一目标节点对应的第一特征向量。由于第一目标子图中反映了与第一目标节点对应的交互对象有关的时序性交互历史(例如K次相关交互事件)的信息,因此,如此得到的第一特征向量,不仅表达出交互对象本身的特征,还可以表达出交互对象在历次交互事件中所受到的影响,从而全面表征交互对象的特点。
于是,在步骤34,至少利用上述第一特征向量,进行与第一目标节点相关的业务处理。
在一个实施例中,上述业务处理可以是,根据以上得到的第一特征向量,预测第一目标节点对应的对象的分类类别。
例如,在第一目标节点对应的对象为用户为情况下,可以基于该第一特征向量预测该用户的用户类别,例如所属的人群类别,风险等级类别,等等。在第一目标节点对应的对象为物品的情况下,可以基于该第一特征向量预测该物品的类别,例如所属业务类别,适合的人群类别,被购买的场景类别,等等。
在一种实施方案中,业务处理还可以包括,对与第一目标节点相关的交互事件进行分析和预测。由于交互事件一般涉及两个对象,因此还需要分析另一节点的特征向量。
具体地,可以采用与图3中的步骤32和33类似的方式对另一节点,称为第二目标节点进行分析。也就是说,在动态交互图中,确定与第二目标节点对应的第二目标子图,该第二目标子图包括从第二目标节点出发,经由连接边到达的所述预定范围内的节点;然后,基于第二目标子图中包含的各个节点的节点特征,以及节点之间的连接边的指向关系,确定第二目标节点对应的第二特征向量。具体执行过程与结合第一目标节点对步骤32和33的描述相类似,不再赘述。
在一个实施例中,上述第二目标节点为动态交互图中与第一目标节点代表的对象不同的任意一个节点,例如图4和图5中的v(t6)。如此,在分别确定出第一目标节点对应的第一特征向量和第二目标节点对应的第二特征向量之后,可以基于该第一特征向量和第二特征向量,预测第一目标节点和第二目标节点代表的对象是否会发生交互。
例如,在一个例子中,第一目标节点代表某个用户,第二目标节点代表某个商品,则可以根据第一特征向量和第二特征向量,预测该用户是否会购买该商品。在又一例子中,第一目标节点代表某个用户,第二目标节点代表某个页面区块,则可以根据第一特征向量和第二特征向量,预测该用户是否会点击该页面区块。
在另一个实施例中,第一目标节点和第二目标节点是已经发生的第一交互事件对应的两个节点。那么可以根据第一目标节点对应的第一特征向量和第二目标节点对应的第二特征向量,预测该第一交互事件的事件类别。
例如,在一个例子中,第一目标节点代表的用户已经确认购买第二目标节点代表的商品,由此产生第一交互事件。在用户请求支付时,可以根据第一特征向量和第二特征向量,预测该第一交互事件是否为涉嫌套现的欺诈性交易,从而确定是否允许本次支付。在又一例子中,第一目标节点代表的用户已经针对第二目标节点代表的物品(例如电影)进行评论操作,例如点赞或发布文字评论,由此产生第一交互事件。在这之后,可以根据第一特征向量和第二特征向量,预测该第一交互事件是否为真实操作,从而排除一些水军操作的虚假评论。
因此,在产生动态交互图的基础上,将其中的节点表达为特征向量,可以便于后续对节点代表的对象,或者对多个节点相关的事件,进行分析和预测。
如前所述,为了得到目标节点的特征向量,根据一个或多个实施例,采用神经网络模型对目标节点对应的目标子图进行分析和处理。可以理解,神经网络模型在确定目标节点特征向量的计算过程中,依赖于大量的参数,这些参数需要通过对该神经网络模型进行训练而确定。在不同实施例中,可以通过不同的任务,特别是可以结合步骤34中的业务处理任务,训练该神经网络模型。下面描述对该神经网络的训练过程。
在一个实施例中,通过预测交互行为来训练神经网络模型。图8示出在该实施例中训练神经网络模型的流程图。如图8所示,在步骤81,获取历史交互事件。在一个具体例子中,可以从前述交互事件集中获取历史交互事件。将该历史交互事件中包括的两个对象称为第一样本对象和第二样本对象。
在步骤82,在动态交互图中,分别确定与第一样本对象对应的第一样本子图,和与第二样本对象对应的第二样本子图。具体的,首先在动态交互图中分别确定出第一样本节点和第二样本节点,其中第一样本节点对应于该历史交互事件的历史时间下的第一样本对象,第二样本节点对应于该历史时间下的第二样本对象,。然后分别以第一样本节点和第二样本节点作为目标节点,按照图3的步骤32类似的方式,确定出对应的第一样本子图和第二样本子图。
然后,在步骤83,将上述第一样本子图和第二样本子图分别输入神经网络模型,分别得到第一样本对象对应的第一样本向量和第二样本对象对应的第二样本向量。神经网络模型基于子图中节点的指向关系确定出样本对象的样本向量的具体过程如前结合步骤33所述,不再赘述。
接着,在步骤84,根据第一样本对象的第一样本向量和第二样本对象的第二样本向量,预测第一样本对象和第二样本对象是否会发生交互,得到预测结果。通常,可以采用一个二分类的分类器,预测两个样本对象是否会发生交互,得到的预测结果通常表现为,这两个样本对象发生交互的概率。
于是,在步骤85,根据上述预测结果,确定预测损失。可以理解,上述第一样本对象和第二样本对象来自历史交互事件,因此实际上已经发生交互,这相当于已知这两个样本对象之间的关系标签。根据例如交叉熵计算方式等损失函数形式,可以基于上述预测结果确定出本次预测的损失。
然后,在步骤86,根据预测损失,更新神经网络模型。具体的,可以采用梯度下降、反向传播等方式,调整神经网络中的参数,以更新神经网络模型,直到神经网络模型的预测准确率达到一定要求。
以上采用历史交互事件中的两个样本对象来进行对象关系的预测,相当于利用了正样本进行训练。在一个实施例中,还可以在动态交互图中找到未发生交互关系的两个样本对象作为负样本进行进一步训练,从而达到更好的训练效果。
根据另一实施方式,通过预测交互对象的分类来训练神经网络模型。图9示出该实施例中训练神经网络模型的流程图。如图9所示,在步骤91,从交互事件集中选择样本对象,并获取该样本对象的分类标签。该样本对象可以是任意事件中的任意交互对象,针对该样本对象的分类标签可以是与业务场景相关的标签。例如,在样本对象是用户的情况下,分类标签可以是预先设定的人群分类的标签,或用户风险程度分类的标签;在样本对象是商品的情况下,分类标签可以是商品分类的标签。这样的标签可以由人工标注产生,或通过其他业务相关处理而产生。
在步骤92,在动态交互图中,确定与该样本对象对应的样本子图。具体的,可以在动态交互图中确定出与该样本对象对应的某个节点。由于一个实体对象可以对应于动态交互图中的多个节点,优选的,此处可以选择该样本对象在最近交互时间下对应的节点。以该节点作为目标节点,按照图3的步骤32类似的方式,确定出对应的样本子图。
然后,在步骤93,将上述样本子图输入神经网络模型,得到样本对象的样本向量。该过程如前结合步骤33所述,不再赘述。
接着,在步骤94,根据样本对象的样本向量,预测该样本对象的分类,得到预测结果。可以采用分类器,预测样本对象属于各个分类的各个概率,作为预测结果。
然后,在步骤95,根据预测结果和分类标签,确定预测损失。具体的,可以采用例如交叉熵计算方式,可以预测结果中的各个概率和分类标签,确定出本次预测的损失。
在步骤96,根据预测损失,更新神经网络模型。如此,通过预测样本对象分类的任务,训练神经网络模型。
综合以上,在本说明书一个实施例的方案中,基于交互事件集构建动态交互图,该动态交互图反映了各个交互事件的时序关系,以及交互对象之间通过各个交互事件传递的相互影响。并且,上述交互事件集中存在多个交互事件同时发生,相应的动态交互图中允许存在连接到多个关联节点的多元节点,以此丰富动态交互图中包含的关系信息。于是,基于该动态交互图中与待分析交互对象对应的节点相关的子图,可以提取得到该交互对象的特征向量。如此得到的特征向量中引入了各个交互事件中其他交互对象对其的影响,从而可以综合全面地表达该交互对象的深层特征,更好地进行业务处理。
根据另一方面的实施例,提供了一种处理交互数据的装置,该装置可以部署在任何具有计算、处理能力的设备、平台或设备集群中。图10示出根据一个实施例的处理交互数据的装置的示意性框图。如图10所示,该处理装置100包括:
交互图获取单元101,配置为获取根据交互事件集构建的动态交互图,其中,所述交互事件集包括多个交互事件,每个交互事件至少包括,发生交互行为的两个对象和交互时间;所述动态交互图包括任意的第一节点,所述第一节点对应于发生在第一时间的交互事件中的第一对象,所述第一节点通过连接边指向N个关联事件所对应的M个关联节点,所述N个关联事件均发生于第二时间,且均包含所述第一对象作为交互对象之一,所述第二时间为,从所述第一时间向前回溯,所述第一对象发生交互行为的前一时间;所述动态交互图中包括至少一个关联节点数目大于2的多元节点;;
子图确定单元102,配置为在所述动态交互图中,确定与第一目标节点对应的第一目标子图,所述第一目标子图包括从所述第一目标节点出发,经由连接边到达的预定范围内的节点;
子图处理单元103,配置为基于所述第一目标子图中包含的各个节点的节点特征,以及节点之间的连接边的指向关系,确定所述第一目标节点对应的第一特征向量;
业务处理单元104,配置为至少利用所述第一特征向量,进行与所述第一目标节点相关的业务处理。
在一个实施例中,所述对象包括用户,所述交互事件包括以下中的至少一种:点击事件,社交事件,交易事件。。
在一个实施例中,上述M个关联节点为2N个节点,分别对应于所述N个关联事件中各个关联事件所包括的两个对象。
在这样的情况下,所述交互图获取单元101具体配置为:获取基于已有交互事件集构建的已有动态交互图;获取第一更新时间发生的P个新增交互事件;在所述已有动态交互图中添加2P个新增节点,所述2P个新增节点分别对应于所述P个新增交互事件中各个新增交互事件包括的两个对象;对于每个新增节点,若其存在关联节点,添加从该新增节点指向其关联节点的连接边。
在另一实施例中,所述M个关联节点为N+1个节点,分别对应于所述N个关联事件中与所述第一对象交互的N个其他对象,以及所述第一对象自身。
在这样的情况下,所述交互图获取单元101具体配置为:获取基于已有交互事件集构建的已有动态交互图;获取第一更新时间发生的P个新增交互事件;确定所述P个新增交互事件所涉及的Q个不同对象;在所述已有动态交互图中添加Q个新增节点,所述Q个新增节点分别对应于所述Q个不同对象;对于每个新增节点,若其存在关联节点,添加从该新增节点指向其关联节点的连接边。
在一种可能的实施方式中,所述第一目标节点是这样的节点:在所述动态交互图中,不存在指向该节点的连接边。
根据一种实施方式,所述预定范围内的节点包括:预设阶数K的连接边之内的节点;和/或,交互时间在预设时间范围内的节点。
在一个实施例中,每个交互事件还可以包括交互事件的事件特征;在这样的情况下,各个节点的节点特征可以包括,各个节点所对应的对象的属性特征,以及各个节点所在的交互事件的事件特征。
根据一个实施例,所述业务处理单元104配置为,根据所述第一特征向量,预测所述第一目标节点对应的对象的分类类别。
根据一种实施方式,所述子图确定单元102还配置为,在所述动态交互图中,确定与第二目标节点对应的第二目标子图,所述第二目标子图包括从所述第二目标节点出发,经由连接边到达的所述预定范围内的节点;所述子图处理单元103还配置为,基于所述第二目标子图中包含的各个节点的节点特征,以及节点之间的连接边的指向关系,确定所述第二目标节点对应的第二特征向量。
基于该实施方式,所述业务处理单元104还可以配置为,根据所述第一特征向量和所述第二特征向量,预测所述第一目标节点和所述第二目标节点代表的对象是否会发生交互。
在一个实施例中,第一目标节点和第二目标节点为第一交互事件对应的两个节点;此时,所述业务处理单元104可以配置为,根据所述第一特征向量和所述第二特征向量,预测所述第一交互事件的事件类别。
根据一种实施方式,所述子图处理单元103配置为,将所述第一目标子图输入预先训练的神经网络模型,所述神经网络模型基于所述第一目标子图中包含的各个节点的节点特征,以及节点之间的连接边的指向关系,输出所述第一特征向量。
进一步的,在不同实施例中,所述神经网络模型可以包括以下之一:基于LSTM的神经网络模型,基于RNN的神经网络模型,基于Transformer的神经网络模型。
通过以上装置,基于动态交互图处理交互对象,得到适于后续分析的特征向量。
根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行结合图3所描述的方法。
根据再一方面的实施例,还提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现结合图3所述的方法。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。

Claims (24)

1.一种处理交互数据的方法,所述方法包括:
获取根据交互事件集构建的动态交互图,其中,所述交互事件集包括多个交互事件,每个交互事件至少包括发生交互行为的两个对象和交互时间;所述动态交互图包括第一节点,所述第一节点对应于发生在第一时间的交互事件中的第一对象,所述第一节点通过连接边指向N个关联事件所对应的M个关联节点,所述N个关联事件均发生于第二时间,且均包含所述第一对象作为交互对象之一,所述第二时间为从所述第一时间向前回溯,所述第一对象发生交互行为的前一时间;其中,N大于1,所述动态交互图中包括至少一个关联节点数目大于2的多元节点;
在所述动态交互图中,确定与第一目标节点对应的第一目标子图,所述第一目标子图包括从所述第一目标节点出发,经由连接边到达的预定范围内的节点;
基于所述第一目标子图中包含的各个节点的节点特征,以及节点之间的连接边的指向关系,确定所述第一目标节点对应的第一特征向量;
至少利用所述第一特征向量,进行与所述第一目标节点相关的业务处理;
其中,所述M个关联节点为2N个节点,分别对应于所述N个关联事件中各个关联事件所包括的两个对象;或者
所述M个关联节点为N+1个节点,分别对应于所述N个关联事件中与所述第一对象交互的N个其他对象,以及所述第一对象自身;
其中,所述每个交互事件还包括交互事件的事件特征;
所述各个节点的节点特征包括各个节点所对应的对象的属性特征,以及各个节点所在的交互事件的事件特征;
其中,确定所述第一目标节点对应的第一特征向量包括,将所述第一目标子图输入预先训练的神经网络模型,所述神经网络模型基于所述第一目标子图中包含的各个节点的节点特征,以及节点之间的连接边的指向关系,输出所述第一特征向量。
2.根据权利要求1所述的方法,其中,所述交互事件的对象包括用户,所述交互事件包括以下中的至少一种:点击事件,社交事件,交易事件。
3.根据权利要求1所述的方法,其中,若所述M个关联节点为2N个节点,分别对应于所述N个关联事件中各个关联事件所包括的两个对象,所述获取根据交互事件集构建的动态交互图包括:
获取基于已有交互事件集构建的已有动态交互图;
获取第一更新时间发生的P个新增交互事件;
在所述已有动态交互图中添加2P个新增节点,所述2P个新增节点分别对应于所述P个新增交互事件中各个新增交互事件包括的两个对象;
对于每个新增节点,若其存在关联节点,添加从该新增节点指向其关联节点的连接边。
4.根据权利要求1所述的方法,其中,若所述M个关联节点为N+1个节点,分别对应于所述N个关联事件中与所述第一对象交互的N个其他对象,以及所述第一对象自身,所述获取根据交互事件集构建的动态交互图包括:
获取基于已有交互事件集构建的已有动态交互图;
获取第一更新时间发生的P个新增交互事件;
确定所述P个新增交互事件所涉及的Q个不同对象;
在所述已有动态交互图中添加Q个新增节点,所述Q个新增节点分别对应于所述Q个不同对象;
对于每个新增节点,若其存在关联节点,添加从该新增节点指向其关联节点的连接边。
5.根据权利要求1所述的方法,其中,所述第一目标节点是这样的节点:在所述动态交互图中,不存在指向该节点的连接边。
6.根据权利要求1所述的方法,其中,所述预定范围内的节点包括:
预设阶数K的连接边之内的节点;和/或
交互时间在预设时间范围内的节点。
7.根据权利要求1所述的方法,其中,至少利用所述第一特征向量,进行与所述第一目标节点相关的业务处理包括:
根据所述第一特征向量,预测所述第一目标节点对应的对象的分类类别。
8.根据权利要求1所述的方法,还包括,
在所述动态交互图中,确定与第二目标节点对应的第二目标子图,所述第二目标子图包括从所述第二目标节点出发,经由连接边到达的所述预定范围内的节点;
基于所述第二目标子图中包含的各个节点的节点特征,以及节点之间的连接边的指向关系,确定所述第二目标节点对应的第二特征向量。
9.根据权利要求8所述的方法,其中,至少利用所述第一特征向量,进行与所述第一目标节点相关的业务处理包括,
根据所述第一特征向量和所述第二特征向量,预测所述第一目标节点和所述第二目标节点代表的对象是否会发生交互。
10.根据权利要求8所述的方法,其中,所述第一目标节点和所述第二目标节点为第一交互事件对应的两个节点;至少利用所述第一特征向量,进行与所述第一目标节点相关的业务处理包括:根据所述第一特征向量和所述第二特征向量,预测所述第一交互事件的事件类别。
11.根据权利要求1所述的方法,其中,所述神经网络模型包括以下之一:基于LSTM的神经网络模型,基于RNN的神经网络模型,基于Transformer的神经网络模型。
12.一种处理交互数据的装置,所述装置包括:
交互图获取单元,配置为获取根据交互事件集构建的动态交互图,其中,所述交互事件集包括多个交互事件,每个交互事件至少包括发生交互行为的两个对象和交互时间;所述动态交互图包括第一节点,所述第一节点对应于发生在第一时间的交互事件中的第一对象,所述第一节点通过连接边指向N个关联事件所对应的M个关联节点,所述N个关联事件均发生于第二时间,且均包含所述第一对象作为交互对象之一,所述第二时间为从所述第一时间向前回溯,所述第一对象发生交互行为的前一时间;其中,N大于1,所述动态交互图中包括至少一个关联节点数目大于2的多元节点;
子图确定单元,配置为在所述动态交互图中,确定与第一目标节点对应的第一目标子图,所述第一目标子图包括从所述第一目标节点出发,经由连接边到达的预定范围内的节点;
子图处理单元,配置为基于所述第一目标子图中包含的各个节点的节点特征,以及节点之间的连接边的指向关系,确定所述第一目标节点对应的第一特征向量;
业务处理单元,配置为至少利用所述第一特征向量,进行与所述第一目标节点相关的业务处理;
其中,所述M个关联节点为2N个节点,分别对应于所述N个关联事件中各个关联事件所包括的两个对象;或者
所述M个关联节点为N+1个节点,分别对应于所述N个关联事件中与所述第一对象交互的N个其他对象,以及所述第一对象自身;
其中,所述每个交互事件还包括交互事件的事件特征;
所述各个节点的节点特征包括各个节点所对应的对象的属性特征,以及各个节点所在的交互事件的事件特征;
其中,所述子图处理单元配置为:将所述第一目标子图输入预先训练的神经网络模型,所述神经网络模型基于所述第一目标子图中包含的各个节点的节点特征,以及节点之间的连接边的指向关系,输出所述第一特征向量。
13.根据权利要求12所述的装置,其中,所述交互事件的对象包括用户,所述交互事件包括以下中的至少一种:点击事件,社交事件,交易事件。
14.根据权利要求12所述的装置,其中,若所述M个关联节点为2N个节点,分别对应于所述N个关联事件中各个关联事件所包括的两个对象,所述交互图获取单元配置为:
获取基于已有交互事件集构建的已有动态交互图;
获取第一更新时间发生的P个新增交互事件;
在所述已有动态交互图中添加2P个新增节点,所述2P个新增节点分别对应于所述P个新增交互事件中各个新增交互事件包括的两个对象;
对于每个新增节点,若其存在关联节点,添加从该新增节点指向其关联节点的连接边。
15.根据权利要求12所述的装置,其中,若所述M个关联节点为N+1个节点,分别对应于所述N个关联事件中与所述第一对象交互的N个其他对象,以及所述第一对象自身,所述交互图获取单元配置为:
获取基于已有交互事件集构建的已有动态交互图;
获取第一更新时间发生的P个新增交互事件;
确定所述P个新增交互事件所涉及的Q个不同对象;
在所述已有动态交互图中添加Q个新增节点,所述Q个新增节点分别对应于所述Q个不同对象;
对于每个新增节点,若其存在关联节点,添加从该新增节点指向其关联节点的连接边。
16.根据权利要求12所述的装置,其中,所述第一目标节点是这样的节点:在所述动态交互图中,不存在指向该节点的连接边。
17.根据权利要求12所述的装置,其中,所述预定范围内的节点包括:
预设阶数K的连接边之内的节点;和/或
交互时间在预设时间范围内的节点。。
18.根据权利要求12所述的装置,其中,所述业务处理单元配置为:根据所述第一特征向量,预测所述第一目标节点对应的对象的分类类别。
19.根据权利要求12所述的装置,其中,
所述子图确定单元还配置为,在所述动态交互图中,确定与第二目标节点对应的第二目标子图,所述第二目标子图包括从所述第二目标节点出发,经由连接边到达的所述预定范围内的节点;
所述子图处理单元还配置为,基于所述第二目标子图中包含的各个节点的节点特征,以及节点之间的连接边的指向关系,确定所述第二目标节点对应的第二特征向量。
20.根据权利要求19所述的装置,其中所述业务处理单元配置为:根据所述第一特征向量和所述第二特征向量,预测所述第一目标节点和所述第二目标节点代表的对象是否会发生交互。
21.根据权利要求19所述的装置,其中,所述第一目标节点和所述第二目标节点为第一交互事件对应的两个节点;所述业务处理单元配置为:根据所述第一特征向量和所述第二特征向量,预测所述第一交互事件的事件类别。
22.根据权利要求12所述的装置,其中,所述神经网络模型包括以下之一:基于LSTM的神经网络模型,基于RNN的神经网络模型,基于Transformer的神经网络模型。
23.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-11中任一项所述的方法。
24.一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-11中任一项所述的方法。
CN202010022182.8A 2020-01-09 2020-01-09 处理交互序列数据的方法及装置 Active CN111258469B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010022182.8A CN111258469B (zh) 2020-01-09 2020-01-09 处理交互序列数据的方法及装置
PCT/CN2020/137922 WO2021139513A1 (zh) 2020-01-09 2020-12-21 处理交互序列数据的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010022182.8A CN111258469B (zh) 2020-01-09 2020-01-09 处理交互序列数据的方法及装置

Publications (2)

Publication Number Publication Date
CN111258469A CN111258469A (zh) 2020-06-09
CN111258469B true CN111258469B (zh) 2021-05-14

Family

ID=70946797

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010022182.8A Active CN111258469B (zh) 2020-01-09 2020-01-09 处理交互序列数据的方法及装置

Country Status (2)

Country Link
CN (1) CN111258469B (zh)
WO (1) WO2021139513A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111258469B (zh) * 2020-01-09 2021-05-14 支付宝(杭州)信息技术有限公司 处理交互序列数据的方法及装置
CN111210008B (zh) * 2020-01-09 2022-05-24 支付宝(杭州)信息技术有限公司 利用lstm神经网络模型处理交互数据的方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109284864A (zh) * 2018-09-04 2019-01-29 广州视源电子科技股份有限公司 行为序列获取方法及装置、用户转化率预测方法及装置
CN109522474A (zh) * 2018-10-19 2019-03-26 上海交通大学 基于交互序列数据挖掘深度用户相似性的推荐方法
CN109657890A (zh) * 2018-09-14 2019-04-19 阿里巴巴集团控股有限公司 一种转账欺诈的风险确定方法及装置
CN110543935A (zh) * 2019-08-15 2019-12-06 阿里巴巴集团控股有限公司 处理交互序列数据的方法及装置
CN110555469A (zh) * 2019-08-15 2019-12-10 阿里巴巴集团控股有限公司 处理交互序列数据的方法及装置
CN110598847A (zh) * 2019-08-15 2019-12-20 阿里巴巴集团控股有限公司 处理交互序列数据的方法及装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103744966B (zh) * 2014-01-07 2018-06-22 Tcl集团股份有限公司 一种物品推荐方法、装置
CN104331817B (zh) * 2014-10-29 2018-09-28 深圳先进技术研究院 电子商务推荐模型的用户特征提取方法及系统
CN108446374B (zh) * 2018-03-16 2019-09-20 北京三快在线科技有限公司 用户意图预测方法、装置、电子设备、存储介质
CN108734338A (zh) * 2018-04-24 2018-11-02 阿里巴巴集团控股有限公司 基于lstm模型的信用风险预测方法及装置
CN109544306B (zh) * 2018-11-30 2021-09-21 苏州大学 一种基于用户行为序列特征的跨领域推荐方法及装置
CN110415022B (zh) * 2019-07-05 2023-08-18 创新先进技术有限公司 处理用户行为序列的方法及装置
CN110474885B (zh) * 2019-07-24 2021-10-22 桂林电子科技大学 基于时间序列与ip地址的报警关联分析方法
CN111258469B (zh) * 2020-01-09 2021-05-14 支付宝(杭州)信息技术有限公司 处理交互序列数据的方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109284864A (zh) * 2018-09-04 2019-01-29 广州视源电子科技股份有限公司 行为序列获取方法及装置、用户转化率预测方法及装置
CN109657890A (zh) * 2018-09-14 2019-04-19 阿里巴巴集团控股有限公司 一种转账欺诈的风险确定方法及装置
CN109522474A (zh) * 2018-10-19 2019-03-26 上海交通大学 基于交互序列数据挖掘深度用户相似性的推荐方法
CN110543935A (zh) * 2019-08-15 2019-12-06 阿里巴巴集团控股有限公司 处理交互序列数据的方法及装置
CN110555469A (zh) * 2019-08-15 2019-12-10 阿里巴巴集团控股有限公司 处理交互序列数据的方法及装置
CN110598847A (zh) * 2019-08-15 2019-12-20 阿里巴巴集团控股有限公司 处理交互序列数据的方法及装置

Also Published As

Publication number Publication date
WO2021139513A1 (zh) 2021-07-15
CN111258469A (zh) 2020-06-09

Similar Documents

Publication Publication Date Title
CN110598847B (zh) 处理交互序列数据的方法及装置
CN111210008B (zh) 利用lstm神经网络模型处理交互数据的方法及装置
CN110555469B (zh) 处理交互序列数据的方法及装置
US11250088B2 (en) Method and apparatus for processing user interaction sequence data
US11188928B2 (en) Marketing method and apparatus based on deep reinforcement learning
WO2018040944A1 (zh) 恶意地址/恶意订单的识别系统、方法及装置
CN110543935B (zh) 处理交互序列数据的方法及装置
CN111737546B (zh) 确定实体业务属性的方法及装置
CN111507543B (zh) 用于预测实体间业务关系的模型训练方法及装置
CN112085293B (zh) 训练交互预测模型、预测交互对象的方法及装置
CN110490274B (zh) 评估交互事件的方法及装置
CN110689110B (zh) 处理交互事件的方法及装置
CN111738534A (zh) 多任务预测模型的训练、事件类型的预测方法及装置
CN111242283B (zh) 评估交互事件的自编码器的训练方法及装置
CN111258469B (zh) 处理交互序列数据的方法及装置
CN113628005A (zh) 基于电商会话大数据的推送更新方法及大数据ai系统
CN111476223B (zh) 评估交互事件的方法及装置
CN112580789B (zh) 训练图编码网络、预测交互事件的方法及装置
CN113034168A (zh) 内容项投放方法、装置、计算机设备及存储介质
CN114119123A (zh) 信息推送的方法和装置
CN113449176A (zh) 基于知识图谱的推荐方法及装置
CN112085279B (zh) 训练交互预测模型、预测交互事件的方法及装置
US20220067655A1 (en) Crowdsourced Insights About Merchant Shipping Methods
CN110059245B (zh) 一种预测用户评分及展示对象的方法和装置
CN116992292A (zh) 点击率预估模型训练方法和装置、点击率预估方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant