CN113239249A

CN113239249A - 一种对象关联识别方法、装置和存储介质

Info

Publication number: CN113239249A
Application number: CN202110625776.2A
Authority: CN
Inventors: 刘志煌
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2021-06-04
Filing date: 2021-06-04
Publication date: 2021-08-10

Abstract

本申请提供了一种对象关联识别方法、装置和存储介质，涉及人工智能领域，方法包括：获取待识别对象组的目标属性特征和目标操作序列数据；基于预设序列模式库，对目标操作序列数据进行序列模式匹配，得到待识别对象组的目标操作序列模式；利用预设关系识别模型的序列相关性挖掘网络，对目标操作序列数据对应的目标操作特征进行序列相关性处理，得到待识别对象组的目标序列相关性特征；利用预设关系识别模型的对象组分类网络，基于目标属性特征、目标操作特征、目标操作序列模式和目标序列相关性特征对待识别对象组进行关联关系识别，得到待识别对象组的关联关系类别。本申请可以有效提高对象关联识别的泛化能力和时效性。

Description

一种对象关联识别方法、装置和存储介质

技术领域

本申请涉及人工智能领域，尤其涉及一种对象关联识别方法、装置和存储介质。

背景技术

随着互联网技术的发展，关联关系识别技术成为对象关系链建设的必要环节，能够应用于关系亲密度识别和关系网络建设等多种场景。然而，目前的一些关联关系识别方法需要人工设定大量的关系规则，并且定期维护关系规则库，才能够确保关联关系识别的准确性和时效性，在数据变化灵活的各种工业应用场景中，无法实现自动化，也难以实现高效泛化，且易受先验知识和主观因素影响。

因此，需要提供一种改进的对象关联识别方案，以解决上述现有技术中存在的问题，提高对象关联识别的泛化能力和时效性。

发明内容

本申请提供了一种对象关联识别方法、装置和存储介质，可以有效提高对象关联识别的泛化能力和时效性。

一方面，本申请提供了一种对象关联识别方法，所述方法包括：

获取待识别对象组的目标属性特征和目标操作序列数据；所述目标操作序列数据为表征所述待识别对象组的对象交互操作的数据；

基于预设序列模式库，对所述目标操作序列数据进行序列模式匹配，得到所述待识别对象组的目标操作序列模式；

利用预设关系识别模型的序列相关性挖掘网络，对所述目标操作序列数据对应的目标操作特征进行序列相关性处理，得到所述待识别对象组的目标序列相关性特征；

利用所述预设关系识别模型的对象组分类网络，基于所述目标属性特征、所述目标操作特征、所述目标操作序列模式和所述目标序列相关性特征对所述待识别对象组进行关联关系识别，得到所述待识别对象组的关联关系类别。

另一方面提供了一种对象关联识别装置，所述装置包括：

特征获取模块：用于获取待识别对象组的目标属性特征和目标操作序列数据；所述目标操作序列数据为表征所述待识别对象组的对象交互操作的数据；

序列模式匹配模块：用于基于预设序列模式库，对所述目标操作序列数据进行序列模式匹配，得到所述待识别对象组的目标操作序列模式；

序列相关性挖掘模块：用于利用预设关系识别模型的序列相关性挖掘网络，对所述目标操作序列数据对应的目标操作特征进行序列相关性处理，得到所述待识别对象组的目标序列相关性特征；

对象关联识别模块：用于利用所述预设关系识别模型的对象组分类网络，基于所述目标属性特征、所述目标操作特征、所述目标操作序列模式和所述目标序列相关性特征对所述待识别对象组进行关联关系识别，得到所述待识别对象组的关联关系类别。

另一方面提供了一种对象关联识别设备，所述设备包括处理器和存储器，所述设备包括处理器和存储器，所述存储器中存储有至少一条指令或至少一段程序，所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现如上述的对象关联识别方法。

另一方面提供了一种计算机可读存储介质，所述存储介质中存储有至少一条指令或至少一段程序，所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如上述的对象关联识别方法。

另一方面提供了一种服务器，所述服务器包括处理器和存储器，所述设备包括处理器和存储器，所述存储器中存储有至少一条指令或至少一段程序，所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现如上述的对象关联识别方法。

本申请提供的对象关联识别方法、装置、设备、存储介质和服务器，具有如下技术效果：

本申请通过获取待识别对象组的目标属性特征和目标操作序列数据；基于预设序列模式库，对目标操作序列数据进行序列模式匹配，得到待识别对象组的目标操作序列模式；能够实现操作序列模式的自动挖掘，无需设定大量的人工规则，具有更好的泛化能力和时效性；然后利用预设关系识别模型的序列相关性挖掘网络，对目标操作序列数据对应的目标操作特征进行序列相关性处理，得到待识别对象组的目标序列相关性特征；并利用预设关系识别模型的对象组分类网络，基于目标属性特征、目标操作特征、目标操作序列模式和目标序列相关性特征对待识别对象组进行关联关系识别，进而得到待识别对象组的关联关系类别。能够综合各类不同的特征进行关联关系识别，从而提高关系识别结果的准确性。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案和优点，下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它附图。

图1是本申请实施例提供的一种应用环境的示意图；

图2是本申请实施例提供的一种对象关联识别方法的流程示意图；

图3是本申请实施例提供的一种目标操作序列数据的获取方法的流程示意图；

图4是本申请实施例提供的一种目标属性特征的获取方法的流程示意图；

图5是本申请实施例提供的一种关联关系识别方法的流程示意图；

图6是本实施例提供的一种预设关系识别模型的训练方法的流程示意图；

图7是本申请实施例提供的一个初始关系识别模型的模型结构示意图；

图8是本申请实施例提供的一种对象关联识别装置的结构示意图；

图9是本申请实施例提供的对象关联识别方法的服务器的硬件结构框图。

图10是本申请实施例提供的一个区块链系统的结构示意图。

具体实施方式

云计算(cloud computing)指IT基础设施的交付和使用模式，指通过网络以按需、易扩展的方式获得所需资源；广义云计算指服务的交付和使用模式，指通过网络以按需、易扩展的方式获得所需服务。这种服务可以是IT和软件、互联网相关，也可是其他服务。云计算是网格计算(Grid Computing)、分布式计算(Distributed Computing)、并行计算(Parallel Computing)、效用计算(Utility Computing)、网络存储(Network StorageTechnologies)、虚拟化(Virtualization)、负载均衡(Load Balance)等传统计算机和网络技术发展融合的产物。

本申请实施例的技术方案涉及云计算的大数据(Big data)技术领域。大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合，是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

随着云时代的来临，大数据也吸引了越来越多的关注，大数据需要特殊的技术，以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术，包括大规模并行处理数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的过程，准确的对象关联识别即相关的关联关系网络构建等可以为关联关系数据的数据挖掘提供有效的知识库。

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

对本申请实施例进行进一步详细说明之前，对本申请实施例中涉及的名词和术语进行说明，本申请实施例中涉及的名词和术语适用于如下的解释。

循环神经网络(Recurrent Neural Network,RNN)，是一类以序列(sequence)数据为输入，在序列的演进方向进行递归(recursion)且所有节点(循环单元)按链式连接的递归神经网络(recursive neural network)。

长短期记忆网络(Long Short-Term Memory networks,LSTM)，是一种时间循环神经网络，是为了解决一般的RNN(循环神经网络)存在的长期依赖问题而专门设计出来的，所有的RNN都具有一种重复神经网络模块的链式形式。

人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

近年来，随着人工智能技术研究和进步，人工智能技术在多个领域得到广泛应用，本申请实施例提供的方案涉及人工智能的机器学习/深度学习等技术，具体通过如下实施例进行说明。

请参阅图1，图1是本申请实施例提供的一种应用环境的示意图，如图1所示，该应用环境可以至少包括服务器01和终端02。在实际应用中，服务器01和终端02可以通过有线或无线通信方式进行直接或间接地连接，以实现终端02与服务器01间的交互，本申请在此不做限制。

本申请实施例中，服务器01可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network，内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。具体地，服务器可以包括实体设备，可以具体包括有网络通信单元、处理器和存储器等等，也可以包括运行于实体设备中的软体，可以具体包括有应用程序等。本申请实施例中，服务器01可以用于响应于终端02发送的对象关联识别请求，根据待识别对象组的目标操作序列数据和目标属性特征等提供关联关系识别服务。具体的，服务器01还可以用于基于样本训练集提供初始关系识别模型的训练服务。具体的，服务器01还可以用于提供存储服务，如存储预设序列模式库等。

本申请实施例中，终端02可以包括智能手机、台式电脑、平板电脑、笔记本电脑、数字助理、增强现实(augmented reality，AR)/虚拟现实(virtual reality，VR)设备、智能可穿戴设备、车载终端设备等类型的实体设备，也可以包括运行于实体设备中的软体，例如应用程序等。具体地，终端02可以用于发送对象关联识别请求，并将对象组的相关数据发送至服务器01，如将对象组中各对象的操作数据(如行为数据等)和对象属性数据(如属性数据)等发送至服务器01。

此外，需要说明的是，图1所示的仅仅是一种对象关联识别方法的应用环境，该应用环境可以包括更多或更少的节点，本申请在此不做限制。

本申请的一些实施例中，对象组内各对象间的关联关系可以为社交关系，社交关系是社交网络中人与人连接和交互的纽带，也是社交网络中信息传播的基础，随着在线社交应用和媒体的迅速发展，对象关联识别技术成为社交画像和关系链建设的必要环节，进而实现多场景下的应用，例如应用于用户间的关系亲密度识别、以及基于社交网络关系的推荐和精准营销等。

目前的社交关系识别的方法主要包括基于人工设定规则和图模型挖掘社交网络关系的方法，然而基于人工设定规则挖掘社交网络关系的方法需要基于先验知识制定大量的映射关系类型规则，并且定期维护关系规则库，才能确保挖掘关系的准确性和时效性，在数据变化灵活的各种工业应用场景中，无法实现完全的自动化；基于图模型挖掘关系网络的方法首先需要利用网络表示学习方法，将关系对象作为节点来构建网络模型，随着待挖掘关系对象量级的增多，网络复杂性也随之剧增，训练网络模型的时间较难满足实际应用需求。而基于本申请提供的对象关联识别方法，能够有效解决上述问题。

以下基于上述应用环境介绍本申请的一种对象关联识别方法，应用于服务器端。图2是本申请实施例提供的一种对象关联识别方法的流程示意图，本说明书提供了如实施例或流程图的方法操作步骤，但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式，不代表唯一的执行顺序。在实际中的系统或服务器产品执行时，可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。具体的如图2所示，方法可以包括：

S201：获取待识别对象组的目标属性特征和目标操作序列数据；目标操作序列数据为表征待识别对象组的对象交互操作的数据。

本申请实施例中，关联关系类别表征各对象间的关联关系，可以预先设定多种关联关系类别，相应的，当对象为用户账号时，如用户社交应用账号，预设关联关系类别可以具体为预设社交关系类别，可以包括但不限于情侣、父子、母子、同事、朋友和夫妻关系等。具体的，服务器可以响应于终端发送的对象关联识别请求，以执行关联关系的识别操作，或者也可以是基于预设的关联关系挖掘指令，在接收到对象组的相关数据后，直接进行关联关系的识别操作。

本申请实施例中，待识别对象组可以包括至少两个对象，目标属性特征为基于待识别对象组中各对象的对象画像特征生成的，目标属性特征可以表征待识别对象组的画像特征；目标操作序列数据可以为基于待识别对象组的预设时段内的对象交互操作数据生成的，其中，预设时段可以为任一设定的时间范围。举例来说，当对象为用户账号时，对象交互操作数据可以为待识别对象组中各用户账号对应的互动行为数据，相应的，目标操作序列数据为基于待识别对象组的预设时段内的互动行为操作数据生成的行为序列数据。具体的，不同预设关联关系类别对应的预设时段可以相同或不同，同一待识别对象组也可以对应多个不同预设时段的目标操作序列数据。例如，关联关系为情侣关系的对象组通常会在情人节(西洋情人节、白色情人节或七夕等)、双方生日和圣诞节等多个关键时间节点发生红包、转账或几乎同时发布朋友圈等对象交互操作，并产生相应的操作数据。则预设时段可以设定为上述关键时间点前后一段时间的时间范围，如情人节前后D天，即[情人节-D,情人节+D]。

本申请实施例中，还提供一种目标操作序列数据的获取方法，请参考图3，图3示出了本申请实施例提供的一种目标操作序列数据的获取方法的流程示意图，具体可以包括：

S301：获取待识别对象组的预设时段内的对象交互操作数据和对应的交互操作时间信息。

在实际应用中，各对象在进行交互操作时会产生很多操作数据，例如当对象为用户账号时，各用户账号的互联网活动中会产生很多行为数据，可以获取待识别对象组中各对象的一个或多个预设时段内的操作数据，并筛选得到对象组中各对象间的对象交互操作数据，同时获取对象交互操作数据对应的交互操作时间信息，如上述的发红包、转账、在关键时间节点附近先后或同时发布朋友圈，以及相互邀请关注主题公众号和分享主题链接等交互操作对应的对象交互操作数据，以及各交互操作的交互操作时间信息。

S303：根据交互操作时间信息对预设时段内的对象交互操作数据进行时间排序和数据拼接处理，得到目标操作序列数据。

在实际应用中，可以基于交互操作时间信息确定对象交互操作数据的时序，并基于该时序对各对象交互操作数据进行排序和数据拼接处理，以构建目标操作序列数据。例如，待识别对象组中包括用户账号A和用户账号B，在t₀时刻，用户账号B收到并接收了用户账号A转账的金额520元，用户账号A和用户账号B分别在t₁和t₂时刻发布了朋友圈，t₃时刻用户账号A给用户账号B的该条朋友圈点赞，t₄时刻用户账号A邀请用户账号B关注婚纱摄影公众号，且用户账号B在t₅时刻关注了该公众号，根据t₀-t₅时刻的时序可以对上述各对象交互操作数据进行排序。

在一些情况下，还需要构建对象交互操作数据的映射交互操作标签，以对各对象交互操作数据进行操作序列标注，例如，针对对象交互操作数据“用户账号B收到并接收了用户账号A转账的金额520元”，对于用户账号A，将映射交互操作标签标注为“A-转账520-B”，对于用户账号B，将映射交互操作标签标注为“B-接收转账520-A”，相应的交互操作是“转账520”；针对对象交互操作数据“t₄时刻用户账号A邀请用户账号B关注婚纱摄影公众号，且用户账号B在t₅时刻关注了该公众号”，对于用户账号A，将映射交互操作标签标注为“A-邀请关注婚纱摄影公众号-B”，对于用户账号B，将映射交互操作标签标注为“B-接受了邀请关注婚纱摄影公众号-B”，交互操作是“关注婚纱摄影公众号”。

在一些情况下，还可以对相类似的交互操作进行同类型标识处理，以进行统一标识符标识，例如转账520，转账5.20，转账52.0，转账99，转账1314，转账13.14，转账131.4和转账999等交互操作具有情感相似性，则可将该同类型的转账交互操作标识为统一标识符。

具体实施例中，还可以对同一交互操作进行操作标识，例如可以用一个或多个字符进行统一标识，如可以将转账520等相似的交互操作标识为m，将预设时段内发布朋友圈的交互操作标识为kp、将关注相同公众号的交互操作标识为u等。相应的，上述数据拼接处理可以具体为：将预设时段内的对象交互操作数据对应的交互操作进行交互操作标识，并以通过时间排序得到的时序为数据拼接顺序，对对象交互操作数据对应的交互操作标识进行拼接处理，以得到表征该目标操作序列数据的目标标识串。例如，待识别对象组的对象交互操作数据对应的时间节点和交互操作标识分别为“t₀时刻/b，t₅时刻/c，t₆时刻/a，t₁₀时刻/f，t₁₂时刻/g，t₁₅时刻/h”，则相应的目标操作序列数据表征为目标标识串bcafgh。

可以理解的，不同预设关联关系类别可以对应不同的对象交互操作数据、映射交互操作标签和交互操作标识等，各种预设关联关系类别对应的目标操作序列数据均可采用相类似的方法构建，本申请在此不做枚举。

在实际应用中，可以进一步对目标操作序列数据进行向量化处理，得到目标操作特征。具体的，可以对目标操作序列数据进行向量化编码处理，包括但不限于进行one-hot编码处理等，得到目标操作特征。

具体的，各交互操作可以具有各自对应的编码，如转发朋友圈操作对应的编码为[1,0,0,0,0,0]，朋友圈点赞操作对应的编码为[0,1,0,0,0,0]，转发电商购物链接操作对应的编码为[0,0,1,0,0,0]，点击购买操作对应的编码为[0,0,0,1,0,0]等。基于交互操作与编码的对应关系可以获得目标操作序列数据的目标操作特征。举例来说，若待识别对象组的目标操作序列数据为bca，a对应的编码为[1,0,0,...]，b对应的编码为[0,1,0...]，c对应的编码为[0,0,1,...]，则目标操作特征为[1,0,0,...,0,1,0...,0,0,1,...]。

本申请实施例中，还提供一种目标属性特征的获取方法，请参考图4，图4示出了本申请实施例提供的一种目标属性特征的获取方法的流程示意图，具体可以包括：

S401：获取待识别对象组中各对象的对象属性数据。

S403：基于对象属性数据生成各对象的基本对象信息。

S405：对各对象的基本对象信息进行向量化处理和特征拼接处理，得到待识别对象组的目标属性特征。

在实际应用中，目标属性特征为基于待识别对象组中各对象的对象画像特征生成的，对基本对象信息进行向量化处理可以得到对象画像特征。举例来说，当对象为用户账号时，对象画像特征可以包括但不限于用户的基础画像、财富、人生阶段、消费偏好等特征；基础画像特征可以例如为用户的年龄、性别、常住地和职业等特征，财富特征如资产评分、消费能力、风险承受能力等特征，人生阶段特征可以例如为用户是否已婚、是否有孩子和是否有房等特征，消费偏好特征可以例如为消费偏好商户、消费偏好金额和消费偏好时间等特征。在一些情况下，对象画像特征还可以包括对象的网络地址等。具体的，对象属性数据可以包括但不限于与上述特征相关的各种属性数据，该对象属性数据的具体类别和获取方式可同现有技术，本申请在此不做赘述。

具体实施例中，将向量化处理得到的各对象画像特征进行特征拼接，得到目标属性特征。在一些情况下，可以将目标操作特征和目标属性特征进行维度拼接，得到目标对象组特征。例如，待识别对象组中用户账号A的对象画像特征为[0.2,-0.4,0.09,0.54,-2.5]，用户账号B的对象画像特征为[0.7,-0.01,0.3,0.4,9]，目标属性特征为[0.2,-0.4,0.09,0.54,-2.5,0.7,-0.01,0.3,0.4,9]。若待识别对象组的目标操作特征为[1,0,0,0,0,0,0,1,0,0,0,0]，则通过维度拼接后得到的该目标对象组特征为：[0.2,-0.4,0.09,0.54,-2.5,0.7,-0.01,0.3,0.4,9,1,0,0,0,0,0,0,1,0,0,0,0]。

S203：基于预设序列模式库，对目标操作序列数据进行序列模式匹配，得到待识别对象组的目标操作序列模式。

在实际应用中，预设序列模式库中预存有各预设关联关系类别对应的参考序列模式，参考序列模式为对样本对象组的参考操作序列数据进行序列模式挖掘得到的。具体的，在预设关系识别模型的训练过程中，训练样本集中包括属于各种预设关联关系类别的样本对象组，以及各样本对象组的参考操作序列数据，对同一类别的样本对象组的参考操作序列数据进行序列模式挖掘，可以得到该预设关联关系类别对应的参考序列模式，进而得到各预设关联关系类别各自对应的参考序列模式。可以理解的，每种预设关联关系类别可以对应一个或多个参考序列模式，例如，关联关系类别1对应的参考序列模式可以包括“bca,ca,agh,cagh…”，其中英文字符为前述的交互操作标识，bca，ca，agh和cagh分别为一个参考序列模式。可以理解的，不同预设关联关系类别对应的参考序列模式可以完全相同、部分相同或完全不同。

举例来说，当对象为用户账号时，预设关联关系类别为预设社交关系类别，参考操作序列数据为基于样本对象组的预设时段内的参考互动行为数据生成的参考行为序列数据，参考序列模式为对样本对象组对应的参考行为序列数据进行序列模式挖掘得到的。

相应的，步骤S203可以包括：

S2031：将预设序列模式库中，为目标操作序列数据的子序列的参考序列模式确定为匹配的序列模式。

S2033：根据匹配的序列模式生成目标操作序列模式。

具体的，序列模式匹配的具体过程可以为：在预设序列模式库中的全部参考序列模式中查找目标操作序列数据的子序列，将查找到的是目标操作序列数据的子序列的参考序列模式确定为匹配的序列模式，进而生成目标操作序列模式。在一些实施例中，目标操作序列模式可以为匹配的序列模式的简单组合或加权组合。

在一些实施例中，预设序列模式库中还包括各参考序列模式对应的序列模式支持度，序列模式支持度表征在预设序列模式库中、某一参考序列模式在相应的预设关联关系类别中出现的频繁程度。在一个实施例中，序列模式支持度等于相应的预设关联关系类别对应的样本对象组中出现该参考序列模式的样本数与该预设关联关系类别对应的样本对象组的总样本数的比。

相应的，在步骤S2033之前还可以包括S2032：获取各匹配的序列模式各自对应的序列模式支持度。相应的，步骤S2033可以为：基于序列模式支持度确定各匹配的序列模式各自的权重系数，并基于权重系数对各匹配的序列模式进行加权运算，得到目标操作序列模式。

S205：利用预设关系识别模型的序列相关性挖掘网络，对目标操作序列数据对应的目标操作特征进行序列相关性处理，得到待识别对象组的目标序列相关性特征。

本申请实施例中，同一对象组的交互操作存在一定的关联和序列相关性，则相应的操作特征中也保留了该相关性，例如情侣关系对的用户账号A在关键时间节点转发了用户账号B的朋友圈、用户账号A给用户账号B的该朋友圈点赞、用户账号B给用户账号A转发了某个电商购物链接、用户账号A点击该电商购物链接并进行购买等，基于上述对象交互操作数据可以生成操作序列数据，进而生成保留了上述对象交互操作数据间的序列相关性的操作特征。

在实际应用中，该序列相关性挖掘网络可以为基于循环神经网络构建的网络层，例如基于LSTM等构建的网络层。将目标操作特征输入该序列相关性挖掘网络，以输出对应的目标序列相关性特征。

S207：利用预设关系识别模型的对象组分类网络，基于目标属性特征、目标操作特征、目标操作序列模式和目标序列相关性特征对待识别对象组进行关联关系识别，得到待识别对象组的关联关系类别。

本申请实施例中，预设关系识别模型为基于携带关联关系类别标签的多个样本对象组的参考属性特征和参考操作序列数据，对初始关系类别模型进行关联关系识别训练得到的模型。在一些实施例中，该初始关系识别模型为基于循环神经网络和margin损失函数构建的多分类模型，例如，可以为基于LSTM和margin softmax损失函数构建的多分类模型。

基于上述部分或全部实施方式，本申请实施例中，对象组分类网络包括特征编码层和相似度计算层，请参考图5，图5示出了本申请实施例提供的一种关联关系识别方法的流程示意图，相应的，步骤S207可以包括：

S2071：将目标属性特征、目标操作特征、目标序列相关性特征和目标操作序列模式对应的目标序列模式特征输入特征编码层，进行编码处理，得到待识别对象组的目标编码特征。

在实际应用中，该特征编码层用于对输入的特征进行特征提取，以得到目标编码特征。如前述的，预设关系识别模型为多分类模型，同一预设关联关系类别的对象组属于预设关系识别模型输出的同一分类。在一个实施例中，预设关系识别模型为基于Bi-LSTM和am-softmax损失函数构建和训练得到的多分类模型。相应的，特征编码层的表达式如下述公式(一)所示：

y＝Bi-LSTM(x)

其中，在关联关系识别的应用中，x表征基于目标属性特征、目标操作特征、目标序列相关性特征和目标序列模式特征等构成的输入特征，y表征输出的目标编码特征。 (一)

在一些实施例中，可以将目标属性特征、目标操作特征、目标序列相关性特征和目标序列模式特征等分别输入特征编码层；在另一些实施例中，也可以将目标属性特征、目标操作特征、目标序列相关性特征和目标序列模式特征进行特征拼接，如维度拼接，进而生成待识别对象组的对象组拼接特征，然后将对象组拼接特征输入特征编码层，进行编码处理。例如，在一个实施例中，待识别对象组的目标属性特征为[0.2,-0.4,0.09,0.54,-2.5,0.7,-0.01,0.3,0.4,9]，目标操作特征为[1,0,0,0,0,0,0,1,0,0,0,0]，目标序列相关性特征为[0.1,-0.35,0.578,0.982…]，目标序列模式特征为[0.215,0.47,1.55,-0.588…],则基于一种特征拼接方式得到的对象组拼接特征可以为[0.215,0.47,1.55,-0.588…,0.2,-0.4,0.09,0.54,-2.5,0.7,-0.01,0.3,0.4,9,0.1,-0.35,0.578,0.982…]。在一个实施例中，将对象组拼接特征作为x输入特征编码层后，所输出的目标编码特征y为[0.579,1.732,0.9232,-0.2577…]。

S2073：将目标编码特征输入相似度计算层，进行目标编码特征与预设编码特征集合中各类别编码特征的相似度计算，得到目标编码特征对应的各类别相似度。

在实际应用中，预设编码特征集合中包括各预设关联关系类别对应的类别编码特征，在一些情况下，预设关联关系类别与类别编码特征一一对应。在一些实施例中，基于各种预设关联关系类别对应的训练样本集对初始关系识别模型进行训练，得到预设关系识别模型后，预设关系识别模型的特征编码层输出与各预设关联关系类别各自对应的类别编码特征，进而得到预设编码特征集合。

S2075：分别将各类别相似度与相似度阈值进行比较，得到相似度比较结果。

在实际应用中，通过相似度计算对目标编码特征和预设编码特征集合中的各类别编码特征的相似性进行比对排序，得到相应的比对排序结果。可以理解的，相似度数值越大，表征待识别对象组为该类别编码特征对应的预设关联关系类别的可能性越高。在一个实施例中，可以根据相似度比较结果对各类别编码特征的相似性进行排序，将排序中相似度数值最大的类别编码特征对应的预设关联关系类别确定为待识别对象组的关联关系类别。具体的，可以采用余弦相似度等方法进行上述的相似度计算。

S2077：根据相似度比较结果确定待识别对象组的关联关系类别。

基于上述技术方案，本申请的对象关联识别方法将关联关系识别的分类问题转化为识别关系特征的相似度计算问题，用分类模型作为训练方案，使用对象组分类网络作为特征提取模型，实现对类别编码特征的比对排序。当基于margin-softmax损失函数构建和训练得到的多分类模型时，可以通过引入人脸识别模型的margin loss来完成相似度计算，更好地使分类模型的训练结果趋近于关联关系类别的类别相似度计算的排序结果，从而能够快速提升类别相似度计算的准确性，进而提高识别结果的准确性。

在一些实施例中，步骤S2077可以包括：

1)若一个或多个类别相似度大于等于相似度阈值，将各类别相似度中数值最大的类别相似度对应的类别编码特征确定为目标类别编码特征。

2)将目标类别编码特征对应的预设关联关系类别作为待识别对象组的关联关系类别。

具体实施例中，若一个类别编码特征与目标编码特征的类别相似度超过相似度阈值，将该类别编码特征对应的预设关联关系类别作为待识别对象组的关联关系类别。若多个类别编码特征与目标编码特征的类别相似度超过相似度阈值，将数值最大的类别相似度对应的预设关联关系类别作为待识别对象组的关联关系类别。

在一些实施例中，步骤S2077还可以包括：

3)若各类别相似度均小于相似度阈值，确定待识别对象组的关联关系类别为待更新关系类别。

4)基于待识别对象组的目标操作序列模式更新预设序列模式库，并基于待识别对象组的目标编码特征更新预设编码特征集合。

具体实施例中，若全部类别编码特征与目标编码特征的类别相似度均小于相似度阈值，则确定待识别对象组的关联关系类别不在已知的预设关联关系类别中，将其确定为待更新关系类别，并将其添加至预设关联关系类别中，以作为新的关联关系类别标签。此外，将该待更新关系类别的识别过程中得到的目标操作序列模式和目标编码特征，分别更新至预设序列模式库和预设编码特征集合中，以便于后续对该待更新关系类别的模式匹配和相似度计算，实现训练样本集和模型的更新。

具体实施例中，在得到新的关联关系类别标签并将其添加至训练样本集中后，在后续对象关联识别过程中，可以迭代挖掘新的操作序列模式和类别编码特征等关系类别特征，从而扩充训练样本集，实现模型的自动化更新和迭代，进而不断提高模型预测的召回性和准确性。

在一个实施例中，已知情侣关系类别对应的类别编码特征A为[0.579,1.732,0.9232,-0.2577…]，待识别对象组的目标编码特征B为[0.472,0.35,-0.58,0.9224…]，计算上述两个编码特征的余弦距离相似度sim(A,B)，若sim(A,B)超过相似度阈值Sim_rel，且该sim(A,B)在各类别相似度中的数值最大，则认为待识别对象组B的关联关系类别为情侣关系，若sim(A,B)不超过相似度阈值Sim_rel，则确定待识别对象组不是情侣关系。

基于上述部分或全部实施方式，本申请实施例中，请参考图6，本申请还提供一种预设关系识别模型的训练方法，图6示出了本实施例提供的一种预设关系识别模型的训练方法的流程示意图，方法可以包括：

S501：构建初始关系识别模型，初始关系识别模型包括序列相关性挖掘网络和对象组分类网络。

在实际应用中，序列相关性挖掘网络为基于循环神经网络构建的，利用循环神经网络能够更好的学习样本对象组的基于时序的交互操作间的关联，提高模型识别的准确性。

在一个实施例中，请参考图7，图7示出了本申请实施例提供的一个初始关系识别模型的模型结构示意图，该初始关系识别模型具体包括特征嵌入层、基于LSTM的序列相关性挖掘网络层和基于LSTM/am-softmax构建的对象组分类网络层。需要说明的是，图中的模型结构仅示出了一种初始关系识别模型的模型结构，初始关系识别模型还可以包括更多或更少的网络层，本申请在此不做限定。

S503：基于多个样本对象组的参考属性特征、参考操作序列数据和对应的关联关系类别标签构建训练样本集；参考操作序列数据为表征样本对象组的对象交互操作的数据。

在实际应用中，当对象为用户账号时，关联关系类别标签可以包括但不限于情侣关系标签、父子关系标签、母子关系标签、同事关系标签、朋友关系标签和夫妻关系标签等。在一些实施例中，训练样本集中可以包括关联关系类别标签标准数据库<关联关系，对象组>，具体的，针对每个关联关系类别标签，采集N个样本对象组作为训练样本，进而构建标准数据库<关联关系，对象组>。关联关系类别标签可以以类别id标记，如标记为：0、1、2...。每个关联关系类别标签对应的正样本为该关联关系类别的样本对象组，负样本为其他关联关系类别的样本对象组。<关联关系，对象组>标准数据库的结构可如下表一所示：

表一

关联关系类别id	对象组
		0	对象组1
0	对象组2
		0	对象组3
1	对象组4
		1	对象组5
1	对象组6
		2	对象组7
2	对象组8
		2	对象组9
3	对象组10
		…	…
M	对象组n

在实际应用中，可以针对每种关联关系类别，构建对应的参考属性特征。与前述目标属性特征相类似的，参考属性特征可以包括样本对象组中各样本对象的对象画像特征，样本对象的对象画像特征为对基本对象信息进行向量化处理得到的，相应的获取方式与前述内容相类似，在此不再赘述。

在实际应用中，每种关联关系类别对应多种对象画像特征，如年龄、性别、常住地和职业等，财富特征如资产评分、消费能力、风险承受能力等，可以预设每种对象画像特征对应的预设画像条件。在获取参考属性特征的过程中，针对每种关联关系类别，需要对样本对象组的对象画像特征进行预处理，具体过程可以为：统计每种关联关系类别中，各对象画像特征各自对应的、不满足对应预设画像条件的总特征数据缺失量；若任一对象画像特征的总特征数据缺失量小于对应的缺失值过滤阈值，则基于该对象画像特征的特征属性确定特征填充值；将不满足对应预设画像条件的对象画像特征替换为对应的特征填充值。若任一对象画像特征的总特征数据缺失量大于等于对应的缺失值过滤阈值，则舍弃该对象画像特征，即不将该对象划线特征作为生成参考属性特征的特征。

其中，对象画像特征的特征属性可以包括但不限于离散型和连续型等，相应的，在一个实施例中，若特征属性为离散型，可以利用预设常数值作为特征填充值，若特征属性为连续型，可以利用该对象画像特征对应的特征均值作为特征填充值。

其中，预设画像条件可以根据应用场景的需求设定，可以针对每种对象画像特征设定对应的预设画像条件，当某一样本对象的属性特征不满足对应的预设画像条件时，确定该样本对象的属性特征存在缺失，记为一个特征数据缺失数量。

具体的，缺失值过滤阈值可以为基于对象画像特征的总特征数据量和预设占比值确定的，预设占比值可以基于应用场景设定，不同对象画像特征对应的预设占比值可以相同或不同，相应的，缺失值过滤阈值的计算表达式可以为：缺失值过滤阈值＝总特征数据量X预设占比值。

举例来说，样本对象为样本用户账号，情侣关系类别对应的样本对象组数量为50，共有100个样本对象，对象画像特征为用户年龄，对应的预设占比值为0.4，预设画像条件为年龄小于等于60岁。相应的，该对象画像特征的总特征数据量为100，缺失值过滤阈值为40，若该100个样本对象中有30个样本对象的年龄大于60岁，其它样本对象的年龄小于等于60岁，则总特征数据缺失量为30，小于对应的缺失值过滤阈值40，则需要进行数据填充处理。用户年龄为离散型特征，因此可以基于对应的预设常数值替换该30个样本对象的用户年龄；若该100个样本对象中有50个样本对象的年龄大于60岁，其它样本对象的年龄小于等于60岁，则总特征数据缺失量为50，大于对应的缺失值过滤阈值40，则舍弃该用户年龄特征，删除相应的用户年龄单值特征。

进一步地，对象画像特征的预处理还可以包括特征异常值处理，在一些情况下，可以获取对象画像特征的特征分布，将特征分布中特征值太大的、位于前预设比例的样本对象的对象画像特征值确定为异常值，并将其滤除，以及利用相应的特征填充值进行特征值填充处理，特征填充值的确定方式可以与前述内容相类似，在此不再赘述。可以理解的，预设比例可以基于应用场景的需求设定，本申请在此不做限定。

进一步地，对象画像特征的预处理还可以包括特征衍生处理，在一些情况下，可以采用包括但不限于特征变换、特征平方、特征加减等方法对样本对象的对象画像特征进行特征组合和衍生，以得到该样本对象的衍生特征，并将该衍生特征添加到样本对象对应的对象画像特征中。

在一些情况下，对于连续性的对象画像特征，可以对其进行分箱离散化处理，对于离散型的画像特征，可以基于one-hot等方式对其进行编码处理，进而得到样本对象组的参考属性特征。

需要说明的是，参考操作序列数据的获取方式与前述的目标操作序列数据相类似，本申请在此不再赘述。

S505：对参考操作序列数据进行序列模式挖掘，得到多个样本对象组对应的参考序列模式。

本申请实施例中，分别针对每种预设关联关系类别对应的样本对象组的参考操作序列数据进行序列模式挖掘。具体的，可以基于频繁项集挖掘的关联算法进行上述的序列模式挖掘。在一个实施例中，可以基于prefixspan算法和多最小支持度策略，挖掘各预设关联关系类别的基于时序的参考序列模式。相应的，最小支持度的计算公式可以如下述公式(二)所示：

min_sup＝a×n

其中，n为同一预设关联关系类别对应的样本对象组的样本数量，a为最小支持度，最小支持度根据对应的样本对象组的样本数量设定，不同预设关联关系类别对应的最小支持度可以相同，也可以不同。(二)

举例来说，假设情侣关系类别对应的样本对象组的样本数量为2，包括样本对象组A和样本对象组B，表征样本对象组A的参考操作序列数据的标识为bcafgh，表征样本对象组B的参考操作序列数据标识为bcdaghf，情侣关系类别对应的最小支持度为0.5。相应的，满足该最小支持度的一项前缀及其对应的投影数据集如下表二所示：

表二

进一步的，基于上述表一中的结果可以确定满足该最小支持度的二项前缀及其对应的投影数据集如下表三所示：

表三

更进一步，可以确定满足该最小支持度的三项前缀、四项前缀和五项前缀，以及其各自对应的投影数据集，如下表四至表六所示：

表四

表五

表六

五项前缀	投影数据集
		bcagh	f

具体的，将得到的每个前缀作为该预设关联关系类别的一个参考序列模式，进而基于上述各前缀生成该预设关联关系类别(情侣关系类别)对应的参考序列模式。

进一步地，根据序列模式挖掘结果，还可以计算该预设关联关系类别对应的各参考序列模式各自的序列模式支持度，通过计算序列模式支持度可以得到该预设关联关系类别中出现对应的目标参考序列模式的频繁程度。具体的，序列模式支持度可以等于目标参考序列模式样本数与对应关联关系类别的总参考序列模式样本数的比值。其中，目标参考序列模式样本数为目标参考序列模式在所有的、该预设关联关系类别的样本对象组对应的参考序列模式中出现的次数。例如，对于样本对象组A和样本对象组B这两个样本，其各自对应的参考序列模式中都包含了bcagh，那么该参考序列模式的序列模式支持度为1。

通过对参考序列操作数据进行序列模式挖掘，以得到各预设关联关系类别的参考序列模式，无需人工制定规则，生成序列模式的泛化能力更强，并且能够通过多轮迭代挖掘扩充预设序列模式库，从而不断完善预设序列模式库，并提高序列模式覆盖的召回率，由于该过程为自动生成而不需要过多人工参与，本申请方法能够很好地满足线上迭代自动化需求。另外，当基于频繁项集进行序列模式挖掘时，所得到的序列挖掘结果更能表征该预设关联关系类别中具备的行为共性，进一步提高关联关系识别的准确性。

S507：将参考操作序列数据对应的参考操作特征输入序列相关性挖掘网络，进行序列相关性处理，得到对应的参考序列相关性特征。

在一些实施例中，可以对每种预设关联关系类别的参考操作序列数据进行向量化处理，例如对于同类别的每个样本对象组，将样本对象组的参考操作序列数据中的每个对象交互操作数据进行one-hot编码，然后将编码后的各对象交互操作数据进行拼接，得到该样本对象组的参考操作特征，进而得到该预设关联关系类别对应的参考操作特征。例如，样本对象组的操作序列数据为bcaf，将转发朋友圈操作b编码为[1,0,0,0,0,0]，朋友圈点赞操作c编码为[0,1,0,0,0,0]，转发电商购物链接操作a编码为[0,0,1,0,0,0],点击链接购买操作f编码为[0,0,0,1,0,0]，则该样本对象组的参考操作特征为[1,0,0,0,0,0,0,1,0,0,0,0,0,1,0,0,0,0,0,0,0,1,0,0]。

进一步地，将各样本对象组的参考操作特征输入到初始关系识别模型的序列相关性挖掘网络，得到对应的参考序列相关性特征。在一个实施例中，该序列相关性挖掘网络为基于LSTM构建的网络层。

S509：以参考属性特征、参考操作特征、参考序列模式和参考序列相关性特征作为对象组分类网络的输入，以关联关系类别标签作为初始关系识别模型的输出，对初始关系识别模型进行关联关系识别的约束训练，得到预设关系识别模型。

在一些实施例中，对象组分类网络包括特征编码层，该特征编码层是基于循环神经网络构建的，并且，基于margin-softmax损失函数计算预设关系识别模型训练过程中的模型损失，以对其进行关联关系识别的约束训练。

在一个实施例中，对象组分类网络包括基于Bi-LSTM构建的特征编码层，并基于am-softmax损失函数计算训练过程中的模型损失，相应的对象组分类网络的表达式可以如公式(一)和公式(三)所示：

y＝Bi-LSTM(x) (一)

p＝am-softmax(yW) (三)

其中，在训练过程中，x表征参考属性特征、参考操作特征、参考序列相关性特征和参考序列模式对应的参考序列模式特征等，y为BI-LSTM层输出的参考编码特征，即对x编码后的特征，W为预设关联关系类别集合，表达式为W＝(c₁,c₂,...,c_n)，c_n表征预设关联关系类别，即上述公式(三)可以变形为p＝am-softmax(＜y,c₁＞,＜y,c₂＞,...,＜y,c_n＞)。

进一步的，am-softmax损失函数的表达式如公式(四)所示：

其中，θ_i代表y与c_i的夹角，s和m为常数，其数值可以根据应用场景和样本对象组的数量等进行设定，在一个实施例中，s取30，m取0.35。

在模型训练过程中，通过最小化基于该am-softmax损失函数得到的模型损失来进行模型训练，最终得到预设关系识别模型。

在实际应用中，根据对象组的交互操作等行为具有序列相关性的特点，即某时刻的特征输出不仅跟该时刻的输入特征相关，也与上一时刻的输入特征或输出特征相关，因此利用RNN\LSTM构建的模型挖掘序列相关性特征，并利用margin softmax(如am-softmax)对模型进行训练，针对不同关联关系类别的对象组的属性特征、操作特征、序列模式特征和序列相关性特征进行类别相似度计算和类别识别，从而更好地对同一关联关系类别的对象组进行识别和区分，相较于已有方法能够更好地提高关联关系发掘的准确性。

举例来说，对于样本对象组A，若其参考操作特征为[1,0,0,0,0,0,0,1,0,0,0,0]，参考序列相关性特征为[0.1,-0.35,0.578,0.982…]，参考序列模式为bcagh，相应的参考序列模式特征为[0.215,0.47,1.55,-0.588…],参考属性特征为[0.2,-0.4,0.09,0.54,-2.5,0.7,-0.01,0.3,0.4,9]。相应的上述输入x为[0.215,0.47,1.55,-0.588…,0.2,-0.4,0.09,0.54,-2.5,0.7,-0.01,0.3,0.4,9,1,0,0,0,0,0,0,1,0,0,0,0,0.1,-0.35,0.578,0.982…]，所得到的y为[0.579,1.732,0.9232,-0.2577…]。需要说明的是，上述的输入x仅为一个示例中生成的结果，可以利用其它特征拼接和处理方式得到该x，例如可以为加权拼接等，本申请不以上述示例为限。

基于上述公式(三)可以得到y对应的各预设关联关系类别的p，并基于关联关系类别标签和am-softmax损失函数计算模型损失，进而调整模型参数，至模型收敛，以得到预设关系识别模型。

在一些实施例中，通过最小化训练过程中的模型损失值来确定模型是否收敛。在一些情况下，模型收敛条件可以为：当前迭代所得到的模型损失值与上一次迭代所得到的模型损失值的差值小于等于预设阈值；或者，当前迭代所得到的模型损失值为历次迭代得到的模型损失值对应的损失曲线的拐点。相应的，当模型损失值满足模型收敛条件时，确定模型收敛，将满足模型收敛条件的模型损失值对应的模型参数作为预设关系识别模型的模型参数。

本申请实施例还提供了一种对象关联识别装置600，如图8所示，图8示出了本申请实施例提供的一种对象关联识别装置的结构示意图，装置可以包括：

特征获取模块10：用于获取待识别对象组的目标属性特征和目标操作序列数据；目标操作序列数据表征待识别对象组的对象交互操作；

序列模式匹配模块20：用于基于预设序列模式库，对目标操作序列数据进行序列模式匹配，得到待识别对象组的目标操作序列模式；

序列相关性挖掘模块30：用于利用预设关系识别模型的序列相关性挖掘网络，对目标操作序列数据对应的目标操作特征进行序列相关性处理，得到待识别对象组的目标序列相关性特征；

对象关联识别模块40：用于利用预设关系识别模型的对象组分类网络，基于目标属性特征、目标操作特征、目标操作序列模式和目标序列相关性特征对待识别对象组进行关联关系识别，得到待识别对象组的关联关系类别。

在一些实施例中，对象组分类网络包括特征编码层和相似度计算层，对象关联识别模块40可以包括：

编码处理单元：用于将目标属性特征、目标操作特征、目标序列相关性特征和目标操作序列模式对应的目标序列模式特征输入特征编码层，进行编码处理，得到待识别对象组的目标编码特征；

相似度计算单元：用于将目标编码特征输入相似度计算层，进行目标编码特征与预设编码特征集合中各类别编码特征的相似度计算，得到目标编码特征对应的各类别相似度；

阈值比较单元：用于分别将各类别相似度与相似度阈值进行比较，得到相似度比较结果；

关联关系类别确定单元：用于根据相似度比较结果确定待识别对象组的关联关系类别。

在一些实施例中，预设编码特征集合中包括各预设关联关系类别对应的类别编码特征，关联关系类别确定单元可以包括：

类别编码特征确定子单元：用于若一个或多个类别相似度大于等于相似度阈值，将各类别相似度中数值最大的类别相似度对应的类别编码特征确定为目标类别编码特征；以及用于将目标类别编码特征对应的预设关联关系类别作为待识别对象组的关联关系类别。

在一些实施例中，关联关系类别确定单元还可以包括：

待更新关系类别确定子单元：用于若各类别相似度均小于相似度阈值，确定待识别对象组的关联关系类别为待更新关系类别；

数据更新子单元：用于基于待识别对象组的目标操作序列模式更新预设序列模式库，并基于待识别对象组的目标编码特征更新预设编码特征集合。

在一些实施例中，特征获取模块10可以用于获取目标操作特征，可以具体包括：

对象交互操作数据获取单元：用于获取待识别对象组的预设时段内的对象交互操作数据和对应的交互操作时间信息；

操作序列数据获取单元：用于根据交互操作时间信息对预设时段内的对象交互操作数据进行时间排序和数据拼接处理，得到目标操作序列数据。

在一些实施例中，目标对象组特征还包括待识别对象组的属性特征，相应的，特征获取模块10还可以包括：

对象属性数据获取单元：用于获取待识别对象组中各对象的对象属性数据；

用户属性特征生成单元：用于基于对象属性数据生成各对象的基本对象信息；

属性特征生成单元：用于对各对象的基本对象信息进行向量化处理和特征拼接处理，得到目标属性特征。

在一些实施例中，预设序列模式库中预存有各预设关联关系类别对应的参考序列模式，参考序列模式为对样本对象组的参考操作序列数据进行序列模式挖掘得到的；

相应的，所序列模式匹配模块20包括：

匹配序列模式确定单元：用于将预设序列模式库中，为目标操作序列数据的子序列的参考序列模式确定为匹配的序列模式；

操作序列模式生成单元：用于根据匹配的序列模式生成目标操作序列模式。

在一些实施例中，装置还可以包括：

识别模型构建模块：用于构建初始关系识别模型，初始关系识别模型包括序列相关性挖掘网络和对象组分类网络；

训练样本集构建模块：用于基于多个样本对象组的参考属性特征、参考操作序列数据和对应的关联关系类别标签构建训练样本集；参考操作序列数据为表征样本对象组的对象交互操作的数据；

序列模式挖掘模块：用于对参考操作序列数据进行序列模式挖掘，得到多个样本对象组对应的参考序列模式；

序列相关性特征挖掘模块：用于将参考操作序列数据对应的参考操作特征输入序列相关性挖掘网络，进行序列相关性处理，得到对应的参考序列相关性特征；

模型训练模块：用于以参考属性特征、参考操作特征、参考序列模式和参考序列相关性特征作为对象组分类网络的输入，以关联关系类别标签作为初始关系识别模型的输出，对初始关系识别模型进行关联关系识别的约束训练，得到预设关系识别模型。

本申请实施例提供了一种对象关联识别设备，该对象关联识别设备包括处理器和存储器，该存储器中存储有至少一条指令或至少一段程序，该至少一条指令或该至少一段程序由该处理器加载并执行以实现如上述方法实施例所提供的对象关联识别方法。

存储器可用于存储软件程序以及模块，处理器通过运行存储在存储器的软件程序以及模块，从而执行各种功能应用以及数据处理。存储器可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、功能所需的应用程序等；存储数据区可存储根据设备的使用所创建的数据等。此外，存储器可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器还可以包括存储器控制器，以提供处理器对存储器的访问。

本申请实施例所提供的方法实施例可以在移动终端、计算机终端、服务器或者类似的运算装置中执行。以运行在服务器上为例，图9是本申请实施例提供的一种对象关联识别方法的服务器的硬件结构框图。如图9所示，该服务器800可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理器(Central Processing Units，CPU)810(处理器810可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器830，一个或一个以上存储应用程序823或数据822的存储介质820(例如一个或一个以上海量存储设备)。其中，存储器830和存储介质820可以是短暂存储或持久存储。存储在存储介质820的程序可以包括一个或一个以上模块，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器810可以设置为与存储介质820通信，在服务器800上执行存储介质820中的一系列指令操作。服务器800还可以包括一个或一个以上电源860，一个或一个以上有线或无线网络接口850，一个或一个以上输入输出接口840，和/或，一个或一个以上操作系统821，例如Windows Server^TM，Mac OS X^TM，Unix^TM,LinuxTM，FreeBSDTM等等。

输入输出接口840可以用于经由一个网络接收或者发送数据。上述的网络具体实例可包括服务器800的通信供应商提供的无线网络。在一个实例中，输入输出接口840包括一个网络适配器(Network Interface Controller，NIC)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，输入输出接口840可以为射频(RadioFrequency，RF)模块，其用于通过无线方式与互联网进行通讯。

本领域普通技术人员可以理解，图9所示的结构仅为示意，其并不对上述电子装置的结构造成限定。例如，服务器800还可包括比图9中所示更多或者更少的组件，或者具有与图9所示不同的配置。

本申请的实施例还提供了一种计算机可读存储介质，存储介质可设置于服务器之中以保存用于实现方法实施例中一种对象关联识别方法相关的至少一条指令或至少一段程序，该至少一条指令或该至少一段程序由该处理器加载并执行以实现上述方法实施例提供的对象关联识别方法。

可选地，在本实施例中，上述存储介质可以位于计算机网络的多个网络服务器中的至少一个网络服务器。可选地，在本实施例中，上述存储介质可以包括但不限于：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

本申请实施例中，如本申请所公开的对象关联识别方法或装置可以运行在如图9所述的一个或多个服务器中，其中多个服务器可组成为一区块链，进而可以为对象关联识别方法或装置提供数据存储和等服务，如本申请的训练样本集、预设序列模式库、预设编码特征集合，以及待识别对象组的目标操作序列数据和对象属性数据等中的一种或几种可以存储与上述区块链中，而服务器为区块链上的节点。图10是本申请实施例提供的一个区块链系统的结构示意图。如图10所示，服务器可以为分布式系统910中的一个节点920，其中该分布式系统可以为区块链系统，该区块链系统可以是由多个节点通过网络通信的形式连接形成的分布式系统，节点之间可以组成点对点(P2P，Peer To Peer)网络，任意形式的计算机设备，比如服务器、客户端930等电子设备都可以通过加入该点对点网络而成为该区块链系统中的一个节点，其中区块链包括一系列按照产生的先后时间顺序相互接续的区块(Block)，新区块一旦加入到区块链中就不会再被移除，区块中记录了区块链系统中节点提交的记录数据。

其中区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新兴应用模式，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层。区块链底层平台可以包括用户管理、基础服务、智能合约以及运营监控等处理模块。其中，用户管理模块负责所有区块链参与者的身份信息管理，包括维护公私钥生成(账户管理)、密钥管理以及用户真实身份和区块链地址对应关系维护(权限管理)等，并且在授权的情况下，监管和审计某些真实身份的交易情况，提供风险控制的规则配置(风控审计)；基础服务模块部署在所有区块链节点设备上，用来验证业务请求的有效性，并对有效请求完成共识后记录到存储上，对于一个新的业务请求，基础服务先对接口适配解析和鉴权处理(接口适配)，然后通过共识算法将业务信息加密(共识管理)，在加密之后完整一致的传输至共享账本上(网络通信)，并进行记录存储；智能合约模块负责合约的注册发行以及合约触发和合约执行，开发人员可以通过某种编程语言定义合约逻辑，发布到区块链上(合约注册)，根据合约条款的逻辑，调用密钥或者其它的事件触发执行，完成合约逻辑，同时还提供对合约升级注销的功能；运营监控模块主要负责产品发布过程中的部署、配置的修改、合约设置、云适配以及产品运行中的实时状态的可视化输出，例如：告警、监控网络情况、监控节点设备健康状态等。平台产品服务层提供典型应用的基本能力和实现框架，开发人员可以基于这些基本能力，叠加业务的特性，完成业务逻辑的区块链实现。应用服务层提供基于区块链方案的应用服务给业务参与方进行使用。

根据本申请的一个方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述各种可选实现方式中提供的方法。

由上述本申请提供的对象关联识别方法、装置、设备、服务器或存储介质的实施例可见，本申请通过获取待识别对象组的目标属性特征和目标操作序列数据；基于预设序列模式库，对目标操作序列数据进行序列模式匹配，得到待识别对象组的目标操作序列模式；能够实现操作序列模式的自动挖掘，无需设定大量的人工规则，具有更好的泛化能力和时效性；然后利用预设关系识别模型的序列相关性挖掘网络，对目标操作序列数据对应的目标操作特征进行序列相关性处理，得到待识别对象组的目标序列相关性特征；并利用预设关系识别模型的对象组分类网络，基于目标属性特征、目标操作特征、目标操作序列模式和目标序列相关性特征对待识别对象组进行关联关系识别，进而得到待识别对象组的关联关系类别。能够综合各类不同的特征进行关联关系识别，从而提高关系识别结果的准确性。

需要说明的是：上述本申请实施例先后顺序仅仅为了描述，不代表实施例的优劣。且上述对本申请特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

本申请中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置、设备和存储介质实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指示相关的硬件完成，的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上仅为本申请的较佳实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种对象关联识别方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述对象组分类网络包括特征编码层和相似度计算层，相应的，所述利用所述预设关系识别模型的对象组分类网络，基于所述目标属性特征、所述目标操作特征、所述目标操作序列模式和所述目标序列相关性特征对所述待识别对象组进行关联关系识别，得到所述待识别对象组的关联关系类别包括：

将所述目标属性特征、所述目标操作特征、所述目标序列相关性特征和所述目标操作序列模式对应的目标序列模式特征输入所述特征编码层，进行编码处理，得到所述待识别对象组的目标编码特征；

将所述目标编码特征输入所述相似度计算层，进行所述目标编码特征与预设编码特征集合中各类别编码特征的相似度计算，得到所述目标编码特征对应的各类别相似度；

分别将所述各类别相似度与相似度阈值进行比较，得到相似度比较结果；

根据所述相似度比较结果确定所述待识别对象组的关联关系类别。

3.根据权利要求2所述的方法，其特征在于，所述预设编码特征集合中包括各预设关联关系类别对应的类别编码特征，所述根据所述相似度比较结果确定所述待识别对象组的关联关系类别包括：

若一个或多个类别相似度大于等于所述相似度阈值，将所述各类别相似度中数值最大的类别相似度对应的类别编码特征确定为目标类别编码特征；

将所述目标类别编码特征对应的预设关联关系类别作为所述待识别对象组的关联关系类别。

4.根据权利要求3所述的方法，其特征在于，所述方法还包括：

若所述各类别相似度均小于所述相似度阈值，确定所述待识别对象组的关联关系类别为待更新关系类别；

基于所述待识别对象组的目标操作序列模式更新所述预设序列模式库，并基于所述待识别对象组的目标编码特征更新所述预设编码特征集合。

5.根据权利要求1所述的方法，其特征在于，所述方法还包括：

获取所述待识别对象组的预设时段内的对象交互操作数据和对应的交互操作时间信息；

根据所述交互操作时间信息对所述预设时段内的对象交互操作数据进行时间排序和数据拼接处理，得到所述目标操作序列数据。

6.根据权利要求1所述的方法，其特征在于，所述方法还包括：

获取所述待识别对象组中各对象的对象属性数据；

基于所述对象属性数据生成所述各对象的基本对象信息；

对所述各对象的基本对象信息进行向量化处理和特征拼接处理，得到所述目标属性特征。

7.根据权利要求1所述的方法，其特征在于，所述预设序列模式库中预存有各预设关联关系类别对应的参考序列模式，所述参考序列模式为对样本对象组的参考操作序列数据进行序列模式挖掘得到的；

所述基于预设序列模式库，对所述目标操作序列数据进行序列模式匹配，得到所述待识别对象组的目标操作序列模式包括：

将所述预设序列模式库中，为所述目标操作序列数据的子序列的参考序列模式确定为匹配的序列模式；

根据所述匹配的序列模式生成所述目标操作序列模式。

8.根据权利要求1-7中任一项所述的方法，其特征在于，所述方法包括：

构建初始关系识别模型，所述初始关系识别模型包括序列相关性挖掘网络和对象组分类网络；

基于多个样本对象组的参考属性特征、参考操作序列数据和对应的关联关系类别标签构建训练样本集；参考操作序列数据为表征样本对象组的对象交互操作的数据；

对所述参考操作序列数据进行序列模式挖掘，得到所述多个样本对象组对应的参考序列模式；

将所述参考操作序列数据对应的参考操作特征输入所述序列相关性挖掘网络，进行序列相关性处理，得到对应的参考序列相关性特征；

以所述参考属性特征、所述参考操作特征、所述参考序列模式和所述参考序列相关性特征作为所述对象组分类网络的输入，以所述关联关系类别标签作为所述初始关系识别模型的输出，对所述初始关系识别模型进行关联关系识别的约束训练，得到所述预设关系识别模型。

9.一种对象关联识别装置，其特征在于，所述装置包括：

10.一种计算机可读存储介质，其特征在于，所述存储介质中存储有至少一条指令或至少一段程序，所述至少一条指令或所述至少一段程序由处理器加载并执行如权利要求1-8中任一项所述的对象关联识别方法。