CN112036762A

CN112036762A - 行为事件的识别方法和装置、电子设备和存储介质

Info

Publication number: CN112036762A
Application number: CN202010929350.1A
Authority: CN
Inventors: 刘雷; 李嘉晨; 郭凯; 刘思明
Original assignee: Beike Technology Co Ltd
Current assignee: Seashell Housing Beijing Technology Co Ltd
Priority date: 2020-09-07
Filing date: 2020-09-07
Publication date: 2020-12-04
Anticipated expiration: 2040-09-07
Also published as: CN112036762B

Abstract

本公开实施例公开了一种行为事件的识别方法和装置、电子设备和存储介质，其中，方法包括：基于异构关系网络获取目标现场行为事件相关的目标第一用户与目标第二用户之间的网络关系特征，异构关系网络中的节点包括表示第一方用户的节点和表示第二方用户的节点，两个节点之间的边表示两个节点之间的通信关系；获取目标第一用户在目标现场行为事件发生前后预设周期内的线上行为数据，得到用户行为特征；获取目标现场行为事件的数据，得到现场行为事件特征；利用判别模型，基于所述网络关系特征、所述用户行为特征和所述现场行为事件特征，识别目标现场行为事件为预定属性行为事件的概率值。本公开实施例可以有效识别现场行为事件的属性。

Description

行为事件的识别方法和装置、电子设备和存储介质

技术领域

本公开涉及计算机技术，具体涉及数据处理技术和人工智能技术，尤其是一种行为事件的识别方法和装置、电子设备和存储介质。

背景技术

在商品、产品、项目等交易对象的交易过程中，经常需要卖方工作人员或者卖方的代理人带领有交易意向的客户对交易对象进行实地考察，该过程可以称为现场行为事件。现场行为事件可以让卖方工作人员或者卖方的代理人更了解、明确客户的需求，是直接影响交易结果的一个重要环节。例如，在房产交易领域，带看即为一种现场行为事件，是房屋中介的经纪人带领有意向买房或租房的客户进行实地看房的过程。带看是经纪人、中介以及中介平台对客户深入了解的时机，是经纪人服务工作的重要一步，是直接影响到交易的重要环节。

然而，有一些卖方工作人员或者卖方的代理人为了完成任务或者提升业绩，在工作过程中存在着虚假现场行为事件。虚假现场行为事件即不以真实达成对象交易为目的的现场行为事件。例如，在房产交易领域，在一些经纪人的工作过程中存在着虚假带看，有的经纪人为了完成每月的指标或者提升业绩，会邀请亲戚朋友充当客户，进行带看。

虚假现场行为事件会降低从交易平台采集到的数据质量，影响对卖方工作人员或者卖方的代理人考核的公平性，过多的虚假数据还会影响交易策略的制定。对虚假现场行为事件的检测与识别，是对交易平台、卖方或者卖方对代理人作业过程进行监管、控制和绩效评价等的至关重要的环节。因此，如何有效识别虚假现场行为事件，是一项亟待解决的问题。

发明内容

本公开实施例提供一种行为事件的识别方法和装置、电子设备和存储介质，以有效识别现场行为事件的属性。

本公开实施例的一个方面，提供一种行为事件的识别方法，包括：

基于异构关系网络获取目标现场行为事件相关的目标第一用户与目标第二用户之间的网络关系特征；其中，所述异构关系网络基于第一方用户与第二方用户之间、以及第一方用户之间的通信关系建立，所述第一方用户包括至少一个第一用户，所述第二方用户包括至少一个第二用户；所述异构关系网络中的节点包括表示所述第一方用户的节点和表示所述第二方用户的节点，所述异构关系网络中两个节点之间的边表示所述两个节点之间的通信关系；

获取所述目标第一用户在所述目标现场行为事件发生前后预设周期内的线上行为数据，得到用户行为特征；

获取所述目标现场行为事件的数据，得到现场行为事件特征；

识别所述目标现场行为事件为预定属性行为事件的概率值，以便基于所述概率值确定所述目标现场行为事件是否预定属性行为事件。

可选地，在本公开上述任一方法实施例中，所述异构关系网络具体为无权异构关系网络；

所述异构关系网络中两个节点之间的边表示所述两个节点之间具有历史通信关系。

可选地，在本公开上述任一方法实施例中，所述网络关系特征包括：所述目标第一用户与所述目标第二用户之间各种长度的路径数目，所述目标第一用户的度，所述目标第二用户的度，所述目标第一用户与所述目标第二用户之间在所述目标现场行为事件发生前后基于时间聚合的通信次数。

可选地，在本公开上述任一方法实施例中，获取所述目标第一用户与所述目标第二用户之间各种长度的路径数目，包括：

获取所述异构关系网络的邻接矩阵，所述邻接矩阵中的元素包括：所述第一方用户之间的通信关系矩阵，所述第一方用户与所述第二方用户之间的通信关系矩阵，所述第二方用户与所述第一方用户的通信关系矩阵，用于元素补齐的零矩阵；

分别基于不同个数的邻接矩阵相乘的方式，获取不同个数的邻接矩阵的乘积；

从所述不同个数的邻接矩阵的乘积中，获取所述目标第一用户与所述目标第二用户之间各种长度的路径数目。

可选地，在本公开上述任一方法实施例中，获取所述目标第一用户的度，包括：

从所述异构关系网络中获取与表示所述目标第一用户的节点相关联的边的条数，作为所述目标第一用户的度；

和/或，

获取所述目标第二用户的度，包括：

从所述异构关系网络中获取与表示所述目标第二用户的节点相关联的边的条数，作为所述目标第二用户的度。

可选地，在本公开上述任一方法实施例中，所述获取所述目标第一用户在所述目标现场行为事件发生前后预设周期内的线上行为数据，得到用户行为特征，包括：

基于所述目标第一用户的基础行为数据，获取所述目标第一用户的基础行为特征；

基于所述目标第一用户的各类线上行为数据，获取所述目标第一用户在所述目标现场行为事件发生前后至少一个预设周期内的至少一类线上行为的次数，作为所述目标第一用户的线上行为特征；

其中，所述用户行为特征包括所述基础行为特征和所述线上行为特征。

可选地，在本公开上述任一方法实施例中，所述获取所述目标现场行为事件的数据，得到现场行为事件特征，包括：

获取所述目标现场行为事件的发生时间、所述目标现场行为事件的针对的目标对象的数量、所述目标现场行为事件所属区域与所述目标第一用户的工作地点之间的距离，作为所述现场行为事件特征。

可选地，在本公开上述任一方法实施例中，所述利用判别模型，基于所述网络关系特征、所述用户行为特征和所述现场行为事件特征，识别所述目标现场行为事件为预定属性行为事件的概率值，以便基于所述概率值确定所述目标现场行为事件是否预定属性行为事件，包括：

将所述网络关系特征、所述用户行为特征和所述现场行为事件特征进行融合，得到融合特征；

将所述融合特征输入所述判别模型，经所述判别模型输出所述目标现场行为事件为预定属性行为事件的概率值；

基于所述目标现场行为事件为预定属性行为事件的概率值，确定所述目标现场行为事件是否预定属性行为事件。

可选地，在本公开上述任一方法实施例中，所述判别模型的训练，包括：

获取至少一个预定属性行为事件中各预定属性行为事件的融合特征，所述融合特征包括网络关系特征、用户行为特征和现场行为事件特征的融合特征；

以所述至少一个预定属性行为事件的融合特征作为训练样本集中的真实正样本，利用生成对抗网络中的生成器基于所述真实正样本生成至少一个伪造正样本；

利用所述生成对抗网络中的判别器识别输入样本是否为真实正样本；所述生成对抗网络包括所述生成器和所述判别器；

采用生成对抗的方式对所述生成器和所述判别器进行交替迭代训练，直至满足预设训练完成条件，得到训练好的生成对抗网络，以所述训练好的生成对抗网络中的判别器作为所述判别模型。

可选地，在本公开上述任一方法实施例中，所述利用生成对抗网络中的生成器基于所述真实正样本生成至少一个伪造正样本，包括：

所述生成器根据所述训练样本集中的真实正样本的数据分布特点，利用噪声数据生成类似所述真实正样本的伪造正样本。

本公开实施例的另一个方面，提供一种行为事件的识别装置，包括：

第一获取模块，用于基于异构关系网络获取目标现场行为事件相关的目标第一用户与目标第二用户之间的网络关系特征；其中，所述异构关系网络基于第一方用户与第二方用户之间、以及第一方用户之间的通信关系建立，所述第一方用户包括至少一个第一用户，所述第二方用户包括至少一个第二用户；所述异构关系网络中的节点包括表示所述第一方用户的节点和表示所述第二方用户的节点，所述异构关系网络中两个节点之间的边表示所述两个节点之间的通信关系；

第二获取模块，用于获取所述目标第一用户在所述目标现场行为事件发生前后预设周期内的线上行为数据，得到用户行为特征；

第三获取模块，用于获取所述目标现场行为事件的数据，得到现场行为事件特征；

判别模块，用于基于所述网络关系特征、所述用户行为特征和所述现场行为事件特征，识别所述目标现场行为事件预定属性现场行为事件的概率值，以便基于所述概率值确定所述目标现场行为事件是否预定属性行为事件。

可选地，在本公开上述任一装置实施例中，所述异构关系网络具体为无权异构关系网络；

可选地，在本公开上述任一装置实施例中，所述网络关系特征包括：所述目标第一用户与所述目标第二用户之间各种长度的路径数目，所述目标第一用户的度，所述目标第二用户的度，所述目标第一用户与所述目标第二用户之间在所述目标现场行为事件发生前后基于时间聚合的通信次数。

可选地，在本公开上述任一装置实施例中，所述第一获取模块获取所述目标第一用户与所述目标第二用户之间各种长度的路径数目时，具体用于：

可选地，在本公开上述任一装置实施例中，所述第一获取模块获取所述目标第一用户的度时，具体用于：

和/或，

所述第一获取模块获取所述目标第二用户的度时，具体用于：

可选地，在本公开上述任一装置实施例中，所述第二获取模块，具体用于：

可选地，在本公开上述任一装置实施例中，所述第三获取模块，具体用于：

可选地，在本公开上述任一装置实施例中，还包括：

融合模块，用于将所述网络关系特征、所述用户行为特征和所述现场行为事件特征进行融合，得到融合特征；

所述判别模块，具体用于基于输入的所述融合特征，输出所述目标现场行为事件为预定属性行为事件的概率值；

确定模块，用于基于所述目标现场行为事件为预定属性行为事件的概率值，确定所述目标现场行为事件是否为预定属性行为事件。

可选地，在本公开上述任一装置实施例中，还包括：

第四获取模块，用于获取至少一个预定属性行为事件中各预定属性行为事件的融合特征，所述融合特征包括网络关系特征、用户行为特征和现场行为事件特征的融合特征；

训练模块，用于以所述至少一个预定属性行为事件的融合特征作为训练样本集中的真实正样本，利用生成对抗网络中的生成器基于所述真实正样本生成至少一个伪造正样本；利用所述生成对抗网络中的判别器识别输入样本是否为真实正样本；所述生成对抗网络包括所述生成器和所述判别器；采用生成对抗的方式对所述生成器和所述判别器进行交替迭代训练，直至满足预设训练完成条件，得到训练好的生成对抗网络，以所述训练好的生成对抗网络中的判别器作为所述判别模块。

可选地，在本公开上述任一装置实施例中，所述生成器，用于根据所述训练样本集中的真实正样本的数据分布特点，利用噪声数据生成类似所述真实正样本的伪造正样本。

本公开实施例的又一个方面，提供一种电子设备，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述存储器中存储的计算机程序，且所述计算机程序被执行时，实现本公开上述任一实施例所述的方法。

本公开实施例的再一个方面，提供一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时，实现本公开上述任一实施例所述的方法。

基于本公开上述实施例提供的行为事件的识别方法和装置、电子设备和存储介质，可以预先基于第一方用户与第二方用户之间、以及第一方用户之间的通信关系建立异构关系网络，该异构关系网络中的节点包括表示所述第一方用户的节点和表示所述第二方用户的节点，所述异构关系网络中两个节点之间的边表示所述两个节点之间的通信关系；识别目标现场行为事件是否虚假现场行为事件时，基于异构关系网络获取该目标现场行为事件相关的目标第一用户与目标第二用户之间的网络关系特征，同时，获取目标第一用户在目标现场行为事件发生前后预设周期内的线上行为数据得到用户行为特征，获取目标现场行为事件的数据得到现场行为事件特征，然后，利用判别模型，基于所述网络关系特征、所述用户行为特征和所述现场行为事件特征，识别目标现场行为事件为预定属性虚假现场行为事件的概率值，以便基于所述概率值确定所述目标现场行为事件是否预定属性行为事件(例如虚假现场行为事件)，从而能够准确、有效地识别现场行为事件的属性，判断该现场行为事件是否虚假现场行为事件。

另外，基于本公开实施例提供的技术方案，能够提取网络关系特征、用户行为特征和现场行为事件特征，利用判别模块识别目标现场行为事件是否预定属性行为事件，提高了预定属性行为事件识别的准确性和识别效率。

另外，上述预定属性行为事件为虚假现场行为事件时，基于本公开实施例提供的技术方案，识别出目标现场行为事件为虚假现场行为事件后，可以剔除虚假现场行为事件数据，从而提高从交易平台采集到的数据质量，实现对卖方工作人员或者卖方的代理人考核的公平性，提高交易策略制定的合理性，从而有效实现对交易平台、卖方或者卖方对代理人作业过程进行监管、控制和绩效评价。

下面通过附图和实施例，对本公开的技术方案做进一步的详细描述。

附图说明

构成说明书的一部分的附图描述了本公开的实施例，并且连同描述一起用于解释本公开的原理。

参照附图，根据下面的详细描述，可以更加清楚地理解本公开，其中：

图1为本公开行为事件的识别方法一个实施例的流程图。

图2为本公开实施例中异构关系网络的一个具体示例图。

图3为本公开实施例中对判别模型进行训练的一个实施例的流程图。

图4为本公开实施例中生成对抗网络的一个具体示例图。

图5为本公开行为事件的识别装置一个实施例的结构示意图。

图6为本公开行为事件的识别装置另一个实施例的结构示意图。

图7为本公开电子设备一个应用实施例的结构示意图。

具体实施方式

现在将参照附图来详细描述本公开的各种示例性实施例。应注意到：除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。

本领域技术人员可以理解，本公开实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等，既不代表任何特定技术含义，也不表示它们之间的必然逻辑顺序。

还应理解，在本公开实施例中，“多个”可以指两个或两个以上，“至少一个”可以指一个、两个或两个以上。

还应理解，对于本公开实施例中提及的任一部件、数据或结构，在没有明确限定或者在前后文给出相反启示的情况下，一般可以理解为一个或多个。

另外，本公开中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本公开中字符“/”，一般表示前后关联对象是一种“或”的关系。

还应理解，本公开对各个实施例的描述着重强调各个实施例之间的不同之处，其相同或相似之处可以相互参考，为了简洁，不再一一赘述。

同时，应当明白，为了便于描述，附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本公开及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为说明书的一部分。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步讨论。

本公开实施例可以应用于终端设备、计算机系统、服务器等电子设备，其可与众多其它通用或专用计算系统环境或配置一起操作。适于与终端设备、计算机系统、服务器等电子设备一起使用的众所周知的终端设备、计算系统、环境和/或配置的例子包括但不限于：个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统﹑大型计算机系统和包括上述任何系统的分布式云计算技术环境，等等。

终端设备、计算机系统、服务器等电子设备可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常，程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等，它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器可以在分布式云计算环境中实施，分布式云计算环境中，任务是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中，程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。

图1为本公开行为事件的识别方法一个实施例的流程图。如图1所示，该实施例行为事件的识别方法包括：

102，基于异构关系网络获取目标现场行为事件相关的目标第一用户与目标第二用户之间的网络关系特征。

其中的目标现场行为事件为需要识别其预定属性的现场行为事件。本公开实施例中的预定属性可以是用于表示现场行为事件的真实性或者虚假性的属性，然而，本公开实施例中的预定属性并不限于此，还可以是现场行为事件的其他属性，例如规范性等。

本公开实施例中的现场行为事件可以是任意需要第一方用户和第二方用户现场参与的行为事件，例如在房产交易领域的带看，然而，本公开实施例不限于此。

其中，所述异构关系网络基于第一方用户与第二方用户之间、以及第一方用户之间的通信关系建立，其中的第一方用户包括至少一个第一用户，第二方用户包括至少一个第二用户。

所述异构关系网络中的节点包括表示第一方用户的节点和表示第二方用户的节点，异构关系网络中两个节点之间的边表示两个节点之间的通信关系。其中的通信关系可以包括任意形式的通信联系，例如电话联系、短信联系、线上沟通等等。

本公开实施例中，第一方用户表示卖房或者提供服务的一方，具体可以为卖方工作人员或者卖方的代理人，例如房产交易领域的经纪人。第二方用户表示接受服务的用户，例如房产交易领域的买方或者卖房用户。本公开实施例可以应用于任意领域，因此，对第一方用户与第二方用户的具体表示对象不做限制，具体可以根据具体应用领域进行调整。

104，获取目标第一用户在目标现场行为事件发生前后预设周期内的线上行为数据，得到用户行为特征。

106，获取目标现场行为事件的数据，得到现场行为事件特征。

108，利用判别模型，基于所述网络关系特征、所述用户行为特征和所述现场行为事件特征，识别目标现场行为事件为预定属性行为事件的概率值，以便基于该概率值识别目标现场行为事件是否预定属性行为事件。

其中，上述操作102、104和106之间为三个不存在时序关系的操作，三者之间不存在执行顺序限制，可以以任意的先后顺序执行，也可以同时执行，本公开实施例不对不做限制。

基于本公开上述实施例提供的行为事件的识别方法，可以预先基于第一方用户与第二方用户之间、以及第一方用户之间的通信关系建立异构关系网络，该异构关系网络中的节点包括表示所述第一方用户的节点和表示所述第二方用户的节点，所述异构关系网络中两个节点之间的边表示所述两个节点之间的通信关系；识别目标现场行为事件是否虚假现场行为事件时，基于异构关系网络获取该目标现场行为事件相关的目标第一用户与目标第二用户之间的网络关系特征，同时，获取目标第一用户在目标现场行为事件发生前后预设周期内的线上行为数据得到用户行为特征，获取目标现场行为事件的数据得到现场行为事件特征，然后，利用判别模型，基于所述网络关系特征、所述用户行为特征和所述现场行为事件特征，识别目标现场行为事件为预定属性虚假现场行为事件的概率值，以便基于所述概率值确定所述目标现场行为事件是否预定属性行为事件(例如虚假现场行为事件)，从而能够准确、有效地识别现场行为事件的属性，判断该现场行为事件是否虚假现场行为事件。

本公开实施例尤其适用于预定属性行为事件为虚假现场行为事件的情况，即，用于识别目标现场行为事件为虚假现场行为事件，因此，可以结合预定属性行为事件为虚假现场行为事件的示例进行理解。

可选地，在本公开其中一些可能的实现方式中，所述异构关系网络也可以称为异构社交关系网络，所述异构关系网络具体为无权异构关系网络，即异构关系网络中的边没有权重大小之分，在第一方用户与第二方用户之间、以及第一方用户之间存在通信关系时，相应的两个节点之间通过一条边将这两个节点连接，即，异构关系网络中两个节点之间的边表示所述两个节点之间具有历史通信关系。

如图2所示，为本公开实施例中异构关系网络的一个具体示例图。如图2所示，该异构关系网络为一个第一方用户与第二方用户的无权异构关系网络，节点表示第一用户或第二用户(例如经纪人或买卖方用户)，边表示第一用户和第一用户、第一用户和第二用户之间的通信关系，即当且仅当第一用户和第一用户、第一用户和第二用户之间发生过通信关系(例如电话联系、线上沟通)时，在两个节点之间存在一条边将这两个节点连接。图2中，节点a1～a6表示第一方用户(例如经纪人)，节点u1～u3表示第二方用户(例如买卖方用户)。

可选地，在本公开其中一些可能的实现方式中，所述网络关系特征例如可以包括但不限于：目标第一用户与目标第二用户之间各种长度的路径数目，目标第一用户的度，目标第二用户的度，目标第一用户与目标第二用户之间在目标现场行为事件发生前后基于时间聚合(近1天、1周、2周、1个月内)的通信次数(例如电话联系次数、线上沟通次数)，等等。

如图2所示，在第一方用户与第二方用户的异构关系网络中，第一用户和第二用户之间存在两种类型的关系，一种是a5->u1的直接显式关系，一种是a5->a2->a4->u1的间接隐式关系，间接隐式关系中往往包含大量的信息。本公开实施例利用该信息，提取可能发生交易事件的节点之间(第一用户和第二用户之间)不同长度的路径数目，将节点之间的不同长度的路径数目作为特征，利用判别模型预测异构关系网络中可能出现的连接，以用于识别两个特定节点之间的现场行为事件的真实性或虚假性。

其中，在一个可选示例中，可以通过如下方式，获取目标第一用户与目标第二用户之间各种长度的路径数目：

获取所述异构关系网络的邻接矩阵，该邻接矩阵中的元素包括：第一方用户之间的通信关系矩阵，第一方用户与第二方用户之间的通信关系矩阵，第二方用户与第一方用户的通信关系矩阵，用于元素补齐的零矩阵；

从所述不同个数的邻接矩阵的乘积中，获取目标第一用户与目标第二用户之间各种长度的路径数目。

在具体实现中，可以用异构关系网络的邻接矩阵C来计算异构关系网络中任意两个节点之间不同长度的路径数目，长度为1的路径数目即为C；长度为2的路径数目为C的2次方；长度为k的路径数目为C的k次方，其中，k为大于1的整数。

假设异构关系网络的邻接矩阵C可以分为四个部分，记为：

其中A表示第一方用户之间的(经纪人关系矩阵)，P^T表示第一方用户与第二方用户之间(例如经纪人和用户之间)的关系矩阵，P表示第二方用户与第一方用户之间(例如用户和经纪人之间)的关系矩阵。节点之间不同长度的路径数目可以通过邻接矩阵相乘的方式得到，因此，第一用户节点和第二用户节点之间不同长度路径数目可以通过以下方式计算出：

长度为k的路径数目将k个邻接矩阵相乘，然后在得到的乘积中选择对应于第一方用户与第二方用户之间(例如经纪人和用户之间)的关系矩阵的元素，即为第一方用户与第二方用户之间各种长度的路径数目。例如：

长度为1的路径数据：P

长度为2的路径数据：AP^T

长度为3的路径数据：(A²+P^TP)P^T

长度为4的路径数据：(A³+P^TPA+AP^TP)P^T

……

在图论中，节点度(Node Degree)是指和该节点相关联的边的条数，又称关联度。特别地，对于有向图，节点的入度是指进入该节点的边的条数；节点的出度是指从该节点出发的边的条数。

其中，在一个可选示例中，可以通过如下方式，获取目标第一用户的度：从所述异构关系网络中获取与表示目标第一用户的节点相关联的边的条数，作为目标第一用户的度。

其中，在一个可选示例中，可以通过如下方式，获取目标第二用户的度：从所述异构关系网络中获取与表示目标第二用户的节点相关联的边的条数，作为目标第二用户的度。

可选地，在本公开其中一些可能的实现方式中，操作104中的用户行为特征可以包括两类特征：基础行为特征和线上行为特征。具体地，可以基于目标第一用户的基础行为数据(例如，在线沟通软件的下载渠道、在线沟通软件的第一次激活时间、在线沟通软件的第一次启动、在线沟通软件的最后一次启动时间、第一次登录在线沟通软件距目标现场行为事件的时间)，获取目标第一用户的基础行为特征；基于目标第一用户的各类线上行为数据，获取目标第一用户在目标现场行为事件发生前后至少一个预设周期内的至少一类线上行为的次数(例如近1天、1周、2周、1月的浏览次数、可能发生交易事件的次数、委托次数等)，作为目标第一用户的线上行为特征。

可选地，在本公开其中一些可能的实现方式中，操作106中，可以获取目标现场行为事件的发生时间、目标现场行为事件的针对的目标对象的数量、目标现场行为事件所属区域与目标第一用户的工作地点之间的距离，作为所述现场行为事件特征。例如，在房产交易领域，可以获取一次带看发生的时间、带看的房源数量，小区与经纪人工作的门店之间的距离等，作为带看本身的特征。

可选地，在本公开其中一些可能的实现方式中，操作108中，可以将所述网络关系特征、所述用户行为特征和所述现场行为事件特征进行融合，例如以拼接的方式融合，得到融合特征(可以是一个特征向量)，然后，将所述融合特征输入判别模型，经判别模型输出目标现场行为事件为预定属性行为事件的概率值，判别模型输出的目标现场行为事件为预定属性行为事件的概率值，可以仅包括目标现场行为事件是预定属性行为事件的概率值，也可以包括目标现场行为事件是预定属性行为事件的概率值和目标现场行为事件不是预定属性行为事件的概率值，进而，基于目标现场行为事件是预定属性行为事件的概率值，确定目标现场行为事件是否预定属性行为事件。

例如，可以比较目标现场行为事件是预定属性行为事件的概率值是否大于预设概率阈值，来确定目标现场行为事件是否预定属性行为事件。具体来说，可以在目标现场行为事件是预定属性行为事件的概率值大于预设概率阈值时，确定该目标现场行为事件是预定属性行为事件；否则，若目标现场行为事件是预定属性行为事件的概率值不大于预设概率阈值，确定该目标现场行为事件不是预定属性行为事件。

再如，在判别模型输出的目标现场行为事件为预定属性行为事件的概率值，同时包括目标现场行为事件是预定属性行为事件的概率值和目标现场行为事件不是预定属性行为事件的概率值时，可以比较目标现场行为事件是预定属性行为事件的概率值与目标现场行为事件不是预定属性行为事件的概率值之间的大小关系，来确定目标现场行为事件是否预定属性行为事件。具体来说，可以在目标现场行为事件是预定属性行为事件的概率值大于目标现场行为事件不是行为事件的概率值时，确定该目标现场行为事件是预定属性行为事件；否则，在目标现场行为事件是预定属性行为事件的概率值不大于目标现场行为事件不是预定属性行为事件的概率值时，确定该目标现场行为事件不是预定属性行为事件。

可选地，在本公开其中一些可能的实现方式中，可以将单位时间内，一对第一用户与第二用户之间发生是现场行为事件作为一次现场行为事件，将对应的网络关系特征、用户行为特征和现场行为事件特征进行融合，得到融合特征，用于识别该次次现场行为事件是否预定属性现场行为事件。

例如，在具体应用中，识别一个带看(带看行为事件，即目标现场行为事件)是否虚假带看(即虚假现场行为事件)时，可以将同一天内，一对经纪人与用户所带看的多个房源视为一次带看，将该次带看的网络关系特征、用户行为特征和现场行为事件特征进行融合，得到融合特征，用于识别该次带看是否虚假带看。

另外，可选地，在本公开上述实施例之前，还可以预先对判别模型进行训练。如图3所示，为本公开实施例中对判别模型进行训练的一个实施例的流程图，其包括：

302，获取至少一个预定属性行为事件中各预定属性行为事件的融合特征。

其中，所述融合特征包括网络关系特征、用户行为特征和现场行为事件特征的融合特征。

304，以所述至少一个预定属性行为事件的融合特征作为训练样本集中的真实正样本，利用生成对抗网络(GAN)中的生成器基于所述真实正样本生成至少一个伪造正样本。

可选地，在本公开其中一些可能的实现方式中，在操作304中，生成器可以根据训练样本集中的真实正样本的数据分布特点，利用噪声数据生成类似真实正样本的伪造正样本，在交替迭代训练的过程中，提升伪造正样本的能力，使判别器无法判断真伪。

306，利用生成对抗网络中的判别器识别输入样本是否为真实正样本。

其中，所述生成对抗网络包括所述生成器和所述判别器。

308，采用生成对抗的方式，对生成器和判别器进行交替迭代训练，直至满足预设训练完成条件，得到训练好的生成对抗网络，以训练好的生成对抗网络中的判别器作为所述判别模型。

在实现本公开的过程中，本发明人通过研究发现，针对预定属性行为事件为虚假带看行为事件的情况，通过机器学习、深度学习算法对现场行为事件(经纪人的带看)进行自动化检测可以提高识别虚假现场行为的速度，提高监管效率。然而，在实际应用的过程中，由于正负样本量过于不均衡、正样本(虚假现场行为事件)数量极少、用户线下行为少、缺少线上行为等原因，导致识别的准确率很低，增加了人工检测的成本。例如，在房产交易领域，对于发生虚假带看行为的用户，本身线上行为量很少，可能只有一次委托和一次带看，这样，判别模型能掌握的用户特征很少，因此很难区分虚假带看的用户与真实现场行为事件的线下用户，除了用户的线上行为外还需要更多的特征；虚假带看为正样本，真实带看为负样本，正样本来源是人工识别，耗时耗力，也只能识别出一部分的虚假带看，导致负样本中存在杂质；在判别模型的训练过程中，正样本(即虚假带看)数据量小，远小于负样本(真实带看)的数据量，正负样本严重不平衡，判别模型在正样本中学到的知识很少，需要一种方法在不增加人工成本的前提下，缓解正负样本不平衡的现象。

针对上述问题，本公开实施例使用生成对抗网络根据已有真实正样本，扩展出正样本(即伪造正样本)，解决正样本稀疏的问题。生成对抗网络中的生成器和判别器是独立的两个模型，在一个可选示例中，生成器和判别器可以分别由4层构成：一层输入层，一层输出层和两层隐含层，其中的每个隐含层可以包括一个以上网络层，然而，本公开实施例不限于此。

如图4所示，为本公开实施例中生成对抗网络的一个具体示例图。其中：

生成器根据训练样本集中的真实正样本的数据分布特点，利用噪声数据生成类似真实正样本的伪造正样本，在交替迭代训练的过程中，不断生成器提升伪造正样本的能力，使判别器无法判断真伪；然后不断提升判别器的判别能力，使生成器进一步提升伪造正样本的能力。通过交替迭代训练，使得生成器生成的伪造正样本在真实性上接近于真实正样本，判别器可以充分学习到各种正样本的特征、从而可以有效识别正样本。

生成器的输入层的输入数据(训练样本集中的真实正样本)来源于高斯分布模型，并随机产生n＝1000维的数据作为伪造正样本，激活函数采用修正线性单元(Rectifiedlinearunit，ReLu)函数；两层隐含层中，神经元的节点数分别为n＝150和n＝300，激活函数亦采用ReLu函数；输出层中神经元的节点数为n＝562，对应真实正样本或伪造正样本的特征向量的维度，输出层的激活函数采用双曲正切(Tanh)函数，输出伪造正样本G(m)。

判别器是一个分类器，用于判断输入样本是否是真实正样本，在交替迭代训练的过程中，可以尽量区分出真实正样本和伪造正样本。

判别器同样采用四层，包括一层输入层、一层隐含层和两层输出层。其中输入层的输入数据来源有二，一部分来源于真实正样本数据x，另一部分来源于生成器生成的伪造正样本数据G(m)，由于输入样本的特征向量的维度为562，因此一对输入样本(真实正样本及其对应的伪造正样本)的维度n＝1124；两层隐含层中神经元的节点数分别为n＝150和n＝300，判别器的所有层采用的激活函数都用泄露修正线性单元(Leaky Relu)函数，输入样本数据在经过激活函数运算之前，将前562维数据和后562维数据(对应于真实正样本数据和伪造正样本数据)拆分进行运算，分别输出真实正样本数据和伪造正样本数据的丢弃数据(dropout)，即以一定概率随机丢弃，以防止生成对抗网络出现过拟合。

交替迭代优化。在训练生成对抗网络的过程中，采用交替迭代的方式对生成器和判别器不断优化，用梯度下降的方式，降低对抗网络的损失函数，以使最后生成器和判别器达到最优。其中的损失函数可以表示判别器输出的关于输入样本是否真实正样本的判别结果和标注结果(即真实情况)之间的差异。

本公开实施例提供的任一种行为事件的识别方法可以由任意适当的具有数据处理能力的设备执行，包括但不限于：终端设备和服务器等。或者，本公开实施例提供的任一种行为事件的识别方法可以由处理器执行，如处理器通过调用存储器存储的相应指令来执行本公开实施例提及的任一种行为事件的识别方法。下文不再赘述。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

图5为本公开行为事件的识别装置一个实施例的结构示意图。该实施例的行为事件的识别装置可用于实现本公开上述各行为事件的识别方法实施例。如图5所示，该实施例的装置包括：第一获取模块，第二获取模块，第三获取模块和判别模块。其中：

第一获取模块，用于基于异构关系网络获取目标现场行为事件相关的目标第一用户与目标第二用户之间的网络关系特征；其中，所述异构关系网络基于第一方用户与第二方用户之间、以及第一方用户之间的通信关系建立，所述第一方用户包括至少一个第一用户，所述第二方用户包括至少一个第二用户；所述异构关系网络中的节点包括表示所述第一方用户的节点和表示所述第二方用户的节点，所述异构关系网络中两个节点之间的边表示所述两个节点之间的通信关系。

第二获取模块，用于获取所述目标第一用户在所述目标现场行为事件发生前后预设周期内的线上行为数据，得到用户行为特征。

第三获取模块，用于获取所述目标现场行为事件的数据，得到现场行为事件特征。

判别模块，用于基于所述网络关系特征、所述用户行为特征和所述现场行为事件特征，识别所述目标现场行为事件是否行为事件。

可选地，在本公开其中一些可能的实现方式中，所述判别模块具体可以通过一个判别模型实现。

基于本公开上述实施例提供的行为事件的识别装置，可以预先基于第一方用户与第二方用户之间、以及第一方用户之间的通信关系建立异构关系网络，该异构关系网络中的节点包括表示所述第一方用户的节点和表示所述第二方用户的节点，所述异构关系网络中两个节点之间的边表示所述两个节点之间的通信关系；识别目标现场行为事件是否虚假现场行为事件时，基于异构关系网络获取该目标现场行为事件相关的目标第一用户与目标第二用户之间的网络关系特征，同时，获取目标第一用户在目标现场行为事件发生前后预设周期内的线上行为数据得到用户行为特征，获取目标现场行为事件的数据得到现场行为事件特征，然后，利用判别模型，基于所述网络关系特征、所述用户行为特征和所述现场行为事件特征，识别目标现场行为事件为预定属性虚假现场行为事件的概率值，以便基于所述概率值确定所述目标现场行为事件是否预定属性行为事件(例如虚假现场行为事件)，从而能够准确、有效地识别现场行为事件的属性，判断该现场行为事件是否虚假现场行为事件。

可选地，在本公开其中一些可能的实现方式中，所述异构关系网络具体为无权异构关系网络；所述异构关系网络中两个节点之间的边表示所述两个节点之间具有历史通信关系。

可选地，在本公开其中一些可能的实现方式中，所述网络关系特征包括：所述目标第一用户与所述目标第二用户之间各种长度的路径数目，所述目标第一用户的度，所述目标第二用户的度，所述目标第一用户与所述目标第二用户之间在所述目标现场行为事件发生前后基于时间聚合的通信次数。

其中，在一个可选示例中，所述第一获取模块获取所述目标第一用户与所述目标第二用户之间各种长度的路径数目时，具体用于：获取所述异构关系网络的邻接矩阵，所述邻接矩阵中的元素包括：所述第一方用户之间的通信关系矩阵，所述第一方用户与所述第二方用户之间的通信关系矩阵，所述第二方用户与所述第一方用户的通信关系矩阵，用于元素补齐的零矩阵；分别基于不同个数的邻接矩阵相乘的方式，获取不同个数的邻接矩阵的乘积；从所述不同个数的邻接矩阵的乘积中，获取所述目标第一用户与所述目标第二用户之间各种长度的路径数目。

其中，在一个可选示例中，所述第一获取模块获取所述目标第一用户的度时，具体用于：从所述异构关系网络中获取与表示所述目标第一用户的节点相关联的边的条数，作为所述目标第一用户的度；和/或，获取所述目标第二用户的度，包括：从所述异构关系网络中获取与表示所述目标第二用户的节点相关联的边的条数，作为所述目标第二用户的度。

可选地，在本公开其中一些可能的实现方式中，所述第二获取模块，具体用于：基于所述目标第一用户的基础行为数据，获取所述目标第一用户的基础行为特征；基于所述目标第一用户的各类线上行为数据，获取所述目标第一用户在所述目标现场行为事件发生前后至少一个预设周期内的至少一类线上行为的次数，作为所述目标第一用户的线上行为特征；其中，所述用户行为特征包括所述基础行为特征和所述线上行为特征。

可选地，在本公开其中一些可能的实现方式中，所述第三获取模块，具体用于：获取所述目标现场行为事件的发生时间、所述目标现场行为事件的针对的目标对象的数量、所述目标现场行为事件所属区域与所述目标第一用户的工作地点之间的距离，作为所述现场行为事件特征。

图6为本公开行为事件的识别装置另一个实施例的结构示意图。如图6所示，在图5所示实施例的基础上，该实施例行为事件的识别装置还可以包括：融合模块和确定模块。其中，融合模块，用于将所述网络关系特征、所述用户行为特征和所述现场行为事件特征进行融合，得到融合特征。相应地，判别模块，具体用于基于输入的所述融合特征，输出所述目标现场行为事件为预定属性行为事件的概率值。确定模块，用于基于所述目标现场行为事件为预定属性行为事件的概率值，确定所述目标现场行为事件是否为预定属性行为事件。

进一步可选地，再参见图6，在又一实施例行为事件的识别装置中，还可以包括：第四获取模块和训练模块。其中，第四获取模块，用于获取至少一个预定属性行为事件中各预定属性行为事件的融合特征，所述融合特征包括网络关系特征、用户行为特征和现场行为事件特征的融合特征。训练模块，用于以所述至少一个预定属性行为事件的融合特征作为训练样本集中的真实正样本，利用生成对抗网络中的生成器基于所述真实正样本生成至少一个伪造正样本；利用所述生成对抗网络中的判别器识别输入样本是否为真实正样本；所述生成对抗网络包括生成器和所述判别器；采用生成对抗的方式对所述生成器和所述判别器进行交替迭代训练，直至满足预设训练完成条件，得到训练好的生成对抗网络，以所述训练好的生成对抗网络中的判别器作为所述判别模块。

可选地，在本公开其中一些可能的实现方式中，所述生成器，用于根据所述训练样本集中的真实正样本的数据分布特点，利用噪声数据生成类似所述真实正样本的伪造正样本。

另外，本公开实施例还提供了一种电子设备，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述存储器中存储的计算机程序，且所述计算机程序被执行时，实现本公开上述任一实施例所述的行为事件的识别方法。

图7为本公开电子设备一个应用实施例的结构示意图。下面，参考图7来描述根据本公开实施例的电子设备。该电子设备可以是第一设备和第二设备中的任一个或两者、或与它们独立的单机设备，该单机设备可以与第一设备和第二设备进行通信，以从它们接收所采集到的输入信号。

如图7所示，电子设备包括一个或多个处理器和存储器。

处理器可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元，并且可以控制电子设备中的其他组件以执行期望的功能。

存储器可以包括一个或多个计算机程序产品，所述计算机程序产品可以包括各种形式的计算机可读存储介质，例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令，处理器可以运行所述程序指令，以实现上文所述的本公开的各个实施例的行为事件的识别方法以及/或者其他期望的功能。

在一个示例中，电子设备还可以包括：输入装置和输出装置，这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。

此外，该输入设备还可以包括例如键盘、鼠标等等。

该输出装置可以向外部输出各种信息，包括确定出的距离信息、方向信息等。该输出设备可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。

当然，为了简化，图7中仅示出了该电子设备中与本公开有关的组件中的一些，省略了诸如总线、输入/输出接口等等的组件。除此之外，根据具体应用情况，电子设备还可以包括任何其他适当的组件。

除了上述方法和设备以外，本公开的实施例还可以是计算机程序产品，其包括计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述部分中描述的根据本公开各种实施例的行为事件的识别方法中的步骤。

所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码，所述程序设计语言包括面向对象的程序设计语言，诸如Java、C++等，还包括常规的过程式程序设计语言，诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。

此外，本公开的实施例还可以是计算机可读存储介质，其上存储有计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述部分中描述的根据本公开各种实施例的行为事件的识别方法中的步骤。

所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

以上结合具体实施例描述了本公开的基本原理，但是，需要指出的是，在本公开中提及的优点、优势、效果等仅是示例而非限制，不能认为这些优点、优势、效果等是本公开的各个实施例必须具备的。另外，上述公开的具体细节仅是为了示例的作用和便于理解的作用，而非限制，上述细节并不限制本公开为必须采用上述具体的细节来实现。

本说明书中各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其它实施例的不同之处，各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言，由于其与方法实施例基本对应，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本公开中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的，可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇，指“包括但不限于”，且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”，且可与其互换使用，除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”，且可与其互换使用。

可能以许多方式来实现本公开的方法和装置。例如，可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和装置。用于所述方法的步骤的上述顺序仅是为了进行说明，本公开的方法的步骤不限于以上具体描述的顺序，除非以其它方式特别说明。此外，在一些实施例中，还可将本公开实施为记录在记录介质中的程序，这些程序包括用于实现根据本公开的方法的机器可读指令。因而，本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。

还需要指出的是，在本公开的装置、设备和方法中，各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。

提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的，并且在此定义的一般原理可以应用于其他方面而不脱离本公开的范围。因此，本公开不意图被限制到在此示出的方面，而是按照与在此公开的原理和新颖的特征一致的最宽范围。

为了例示和描述的目的已经给出了以上描述。此外，此描述不意图将本公开的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例，但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims

1.一种行为事件的识别方法，其特征在于，包括：

利用判别模型，基于所述网络关系特征、所述用户行为特征和所述现场行为事件特征，识别所述目标现场行为事件为预定属性行为事件的概率值，以便基于所述概率值确定所述目标现场行为事件是否预定属性行为事件。

2.根据权利要求1所述的方法，其特征在于，所述异构关系网络具体为无权异构关系网络；

3.根据权利要求2所述的方法，其特征在于，所述网络关系特征包括：所述目标第一用户与所述目标第二用户之间各种长度的路径数目，所述目标第一用户的度，所述目标第二用户的度，所述目标第一用户与所述目标第二用户之间在所述目标现场行为事件发生前后基于时间聚合的通信次数。

4.根据权利要求3所述的方法，其特征在于，获取所述目标第一用户与所述目标第二用户之间各种长度的路径数目，包括：

5.根据权利要求3或4所述的方法，其特征在于，获取所述目标第一用户的度，包括：

和/或，

获取所述目标第二用户的度，包括：

6.根据权利要求1-5任一所述的方法，其特征在于，所述获取所述目标第一用户在所述目标现场行为事件发生前后预设周期内的线上行为数据，得到用户行为特征，包括：

7.根据权利要求1-6任一所述的方法，其特征在于，所述获取所述目标现场行为事件的数据，得到现场行为事件特征，包括：

8.一种行为事件的识别装置，其特征在于，包括：

9.一种电子设备，其特征在于，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述存储器中存储的计算机程序，且所述计算机程序被执行时，实现上述权利要求1-7任一所述的方法。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时，实现上述权利要求1-7任一所述的方法。