CN112036955B

CN112036955B - 用户识别方法和装置、计算机可读存储介质、电子设备

Info

Publication number: CN112036955B
Application number: CN202010929369.6A
Authority: CN
Inventors: 刘洋; 李嘉晨
Original assignee: Seashell Housing Beijing Technology Co Ltd
Current assignee: Seashell Housing Beijing Technology Co Ltd
Priority date: 2020-09-07
Filing date: 2020-09-07
Publication date: 2021-09-24
Anticipated expiration: 2040-09-07
Also published as: CN112036955A

Abstract

本公开实施例公开了一种用户识别方法和装置、计算机可读存储介质、电子设备，其中，方法包括：获取待识别用户的至少一种行为数据；根据所述至少一种行为数据确定所述待识别用户的行为特征向量；利用判别器对所述行为特征向量进行判别，确定所述待识别用户对应的预测概率；其中，所述判别器基于结合生成器的对抗训练获得；本实施例获得待识别用户的至少一种行为数据，提高了行为特征向量对待识别用户的特征表达的准确性，并且，利用训练好的判别器确定待识别用户的预测概率，不需要反复训练模型分类器，降低了复杂度，提高了识别效率。

Description

用户识别方法和装置、计算机可读存储介质、电子设备

技术领域

本公开涉及用户识别技术领域，尤其是一种用户识别方法和装置、计算机可读存储介质、电子设备。

背景技术

人力成本是企业经营成本的重要组成部分，随着人力成本的不断提升，如何提升人效，成为了各大企业面临的一大难题，如何对用户进行识别，将异常用户筛选出来，从而将更多精力集中在正常用户，提高人效是现有技术需要解决的问题。例如，在房产服务领域，经纪人角色的时间分配上，在传统的房产中介场景中，获客这一环节会占据绝大比例。在获客过程中，因为贝壳是强大的线上平台，线上客源的重要性不言而喻，但客源的质量参差不齐，部分异常客户，如推销、微商、同业经纪人等，通过建立大量链接，占用经纪人的大量资源。经纪人在前期无法识别客户是否异常，导致浪费大量人力成本。

发明内容

为了解决上述技术问题，提出了本公开。本公开的实施例提供了一种用户识别方法和装置、计算机可读存储介质、电子设备。

根据本公开实施例的一个方面，提供了一种用户识别方法，包括：

获取设定时间段内待识别用户的至少一种行为数据；

根据所述至少一种行为数据确定所述待识别用户的行为特征向量；

利用判别器对所述行为特征向量进行判别，确定所述待识别用户对应的行为指标的预测概率；其中，所述判别器基于结合生成器的对抗训练获得。

可选地，所述至少一种行为数据包括以下至少之一：线上行为数据、线下行为数据、交互行为数据。

可选地，所述利用判别器对所述行为特征向量进行判别，确定所述待识别用户对应的行为指标的预测概率之前，还包括：

基于所述生成器和所述判别器构成对抗网络，对所述对抗网络进行训练。

可选地，所述对所述对抗网络进行训练，包括：

获取第一正样本集和真负样本集；其中，所述第一正样本集中包括至少一个正样本，所述真负样本集中包括至少一个真负样本，每个所述真负样本的行为数据与所述正样本的行为数据之间的差异小于设定值；

将所述第一正样本集输入所述判别器，得到每个所述正样本对应的行为指标的第一预估异常概率；

将所述真负样本集中的每个真负样本输入到所述生成器，得到包括的至少一个第二样本的第二正样本集，并基于所述判别器确定每个所述第二样本对应的行为指标的第二预估异常概率；

基于所述第一预估异常概率和所述第二预估异常概率，确定所述对抗网络的损失；

基于所述损失对所述对抗网络进行训练，得到训练后的判别器。

可选地，在基于所述第一预估异常概率和所述第二预估异常概率，确定所述对抗网络的损失之前，还包括：

基于用户生命价值网络确定所述第一正样本集和所述第二正样本集中每个样本对应的正常预估概率；

所述基于所述第一预估异常概率和所述第二预估异常概率，确定所述对抗网络的损失，包括：

基于所述第一预估异常概率、所述第二预估异常概率和所述正常预估概率，确定所述对抗网络的损失。

可选地，所述获取第一正样本集和真负样本集，包括：

基于标注信息和/或至少一种预设规则获得至少一个正样本，构成所述第一正样本集；其中，所述预设规则包括至少一种行为数据符合设定条件；

基于标注信息获得至少一个真负样本，构成所述真负样本集。

可选地，所述基于至少一种预设规则获得至少一个正样本，包括：

基于多个训练用户在所述设定时间段内的至少一种行为数据，确定所述多个训练用户中每个训练用户对应的训练特征；

利用孤立森林算法对所述多个训练特征进行切分处理，得到每个所述训练特征对应的离散概率，基于所述离散概率确定每个所述训练特征对应的一维强特征；

响应于所述训练特征和所述一维强特征符合所述设定条件，确定所述训练用户是正样本；

响应于所述训练特征和所述一维强特征不符合所述设定条件，将所述训练样本作为待识别用户，得到待识别用户集。

可选地，还包括：基于所述待识别用户对应的预测概率，确定所述待识别用户是否正常用户。

可选地，所述基于所述待识别用户对应的行为指标的预测概率，确定所述待识别用户是否符合识别条件，包括：

判断所述待识别用户对应的行为指标的预测概率是否小于分类器阈值；如果是，确定所述待识别用户符合识别条件，否则，确定所述待识别用户不符合识别条件。

可选地，在判断所述待识别用户对应的预测概率是否小于分类器阈值之前，还包括：

合并所述第一正样本集和所述第二正样本集，得到第三正样本集；

将所述第三正样本集随机分割为第二预测集和第四正样本集；

基于所述第四正样本集对分类器进行训练，得到训练后的分类器；

基于所述训练后的分类器对所述第二预测集得到的多个分类概率值，确定所述分类器阈值。

根据本公开实施例的另一方面，提供了一种用户识别装置，包括：

行为数据获取模块，用于获取设定时间段内待识别用户的至少一种行为数据；

特征确定模块，用于根据所述至少一种行为数据确定所述待识别用户的行为特征向量；

概率预测模块，用于利用判别器对所述行为特征向量进行判别，确定所述待识别用户对应的行为指标的预测概率；其中，所述判别器基于结合生成器的对抗训练获得。

可选地，所述装置，还包括：

网络训练模块，用于基于所述生成器和所述判别器构成对抗网络，对所述对抗网络进行训练。

可选地，所述网络训练模块，包括：

样本获取单元，用于获取第一正样本集和真负样本集；其中，所述第一正样本集中包括至少一个正样本，所述真负样本集中包括至少一个真负样本，每个所述真负样本的行为数据与所述正样本的行为数据之间的差异小于设定值；

第一预估单元，用于将所述第一正样本集输入所述判别器，得到每个所述正样本对应的行为指标的第一预估异常概率；

第二预估单元，用于将所述真负样本集中的每个真负样本输入到所述生成器，得到包括的至少一个第二样本的第二正样本集，并基于所述判别器确定每个所述第二样本对应的行为指标的第二预估异常概率；

损失确定单元，用于基于所述第一预估异常概率和所述第二预估异常概率，确定所述对抗网络的损失；

训练单元，用于基于所述损失对所述对抗网络进行训练，得到训练后的判别器。

可选地，所述网络训练模块，还包括：

第三预估单元，用于基于用户生命价值网络确定所述第一正样本集和所述第二正样本集中每个样本对应的正常预估概率；

所述损失确定单元，具体用于基于所述第一预估异常概率、所述第二预估异常概率和所述正常预估概率，确定所述对抗网络的损失。

可选地，所述样本获取单元，具体用于基于标注信息和/或至少一种预设规则获得至少一个正样本，构成所述第一正样本集；其中，所述预设规则包括至少一种行为数据符合设定条件；基于标注信息获得至少一个真负样本，构成所述真负样本集。

可选地，所述样本获取单元在基于至少一种预设规则获得至少一个正样本时，用于基于多个训练用户在所述设定时间段内的至少一种行为数据，确定所述多个训练用户中每个训练用户对应的训练特征；利用孤立森林算法对所述多个训练特征进行切分处理，得到每个所述训练特征对应的离散概率，基于所述离散概率确定每个所述训练特征对应的一维强特征；响应于所述训练特征和所述一维强特征符合所述设定条件，确定所述训练用户是正样本；响应于所述训练特征和所述一维强特征不符合所述设定条件，将所述训练样本作为待识别用户，得到待识别用户集。

可选地，所述装置还包括：

用户识别模块，用于基于所述待识别用户对应的行为指标的预测概率，确定所述待识别用户是否符合识别条件。

可选地，所述用户识别模块，具体用于判断所述待识别用户对应的行为指标的预测概率是否小于分类器阈值；如果是，确定所述待识别用户符合识别条件，否则，确定所述待识别用户不符合识别条件。

可选地，所述用户识别模块在判断所述待识别用户对应的预测概率是否小于分类器阈值之前，还用于合并所述第一正样本集和所述第二正样本集，得到第三正样本集；将所述第三正样本集随机分割为第二预测集和第四正样本集；基于所述第四正样本集对分类器进行训练，得到训练后的分类器；基于所述训练后的分类器对所述第二预测集得到的多个分类概率值，确定所述分类器阈值。

根据本公开实施例的又一方面，提供了一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序用于执行上述任一实施例所述的用户识别方法。

根据本公开实施例的还一方面，提供了一种电子设备，所述电子设备包括：

处理器；

用于存储所述处理器可执行指令的存储器；

所述处理器，用于从所述存储器中读取所述可执行指令，并执行所述指令以实现上述任一实施例所述的用户识别方法。

基于本公开上述实施例提供的一种用户识别方法和装置、计算机可读存储介质、电子设备，获取待识别用户的至少一种行为数据；根据所述至少一种行为数据确定所述待识别用户的行为特征向量；利用判别器对所述行为特征向量进行判别，确定所述待识别用户对应的行为指标的预测概率；其中，所述判别器基于结合生成器的对抗训练获得；本实施例获得待识别用户的至少一种行为数据，提高了行为特征向量对待识别用户的特征表达的准确性，并且，利用训练好的判别器确定待识别用户的预测概率，不需要反复训练模型分类器，降低了复杂度，提高了识别效率。

下面通过附图和实施例，对本公开的技术方案做进一步的详细描述。

附图说明

通过结合附图对本公开实施例进行更详细的描述，本公开的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本公开实施例的进一步理解，并且构成说明书的一部分，与本公开实施例一起用于解释本公开，并不构成对本公开的限制。在附图中，相同的参考标号通常代表相同部件或步骤。

图1是本公开一示例性实施例提供的用户识别方法的流程示意图。

图2是本公开另一示例性实施例提供的用户识别方法的流程示意图。

图3是本公开图2所示的实施例中步骤205的一个流程示意图。

图4是本公开图2所示的实施例中步骤205的另一个流程示意图。

图5是本公开图3或4所示的实施例中步骤2051的一个流程示意图。

图6是本公开又一示例性实施例提供的用户识别方法的流程示意图。

图7是本公开图6所示的实施例中步骤608之前还包括的步骤示意图。

图8是本公开一示例性实施例提供的用户识别装置的结构示意图。

图9是本公开一示例性实施例提供的电子设备的结构图。

具体实施方式

下面，将参考附图详细地描述根据本公开的示例实施例。显然，所描述的实施例仅仅是本公开的一部分实施例，而不是本公开的全部实施例，应理解，本公开不受这里描述的示例实施例的限制。

应注意到：除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。

本领域技术人员可以理解，本公开实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等，既不代表任何特定技术含义，也不表示它们之间的必然逻辑顺序。

还应理解，在本公开实施例中，“多个”可以指两个或两个以上，“至少一个”可以指一个、两个或两个以上。

还应理解，对于本公开实施例中提及的任一部件、数据或结构，在没有明确限定或者在前后文给出相反启示的情况下，一般可以理解为一个或多个。

另外，本公开中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本公开中字符“/”，一般表示前后关联对象是一种“或”的关系。

还应理解，本公开对各个实施例的描述着重强调各个实施例之间的不同之处，其相同或相似之处可以相互参考，为了简洁，不再一一赘述。

同时，应当明白，为了便于描述，附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本公开及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为说明书的一部分。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步讨论。

本公开实施例可以应用于终端设备、计算机系统、服务器等电子设备，其可与众多其它通用或专用计算系统环境或配置一起操作。适于与终端设备、计算机系统、服务器等电子设备一起使用的众所周知的终端设备、计算系统、环境和/或配置的例子包括但不限于：个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统、大型计算机系统和包括上述任何系统的分布式云计算技术环境，等等。

终端设备、计算机系统、服务器等电子设备可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常，程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等，它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器可以在分布式云计算环境中实施，分布式云计算环境中，任务是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中，程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。

示例性方法

图1是本公开一示例性实施例提供的用户识别方法的流程示意图。本实施例可应用在电子设备上，如图1所示，包括如下步骤：

步骤102，获取设定时间段内待识别用户的至少一种行为数据。

其中，设定时间段可以预先设置，例如，设置设定时间段为7天或1天等；行为数据是根据待识别用户所处的业务场景确定的，例如，房产领域场景中，行为数据可以包括但不限于设定时间段内的以下至少一种数据：页面浏览量、浏览页面停留时长、线上或电话沟通次数、vr带看次数、线上委托次数、实际带看次数、线下委托次数、沟通经纪人数量等；在不同的业务场景下，待识别用户的行为数据可以相同或不同。

步骤104，根据至少一种行为数据确定待识别用户的行为特征向量。

本实施例中，通过行为数据实现对待识别用户的特征表达，可选地，以行为特征向量的方式表达一个用户的画像，例如，将至少一种行为数据对应的数值依次作为一维向量中的不同数值，每个数值对应一个行为维度，以此体现用户的特征，如，行为特征向量为[5，14，50]。

步骤106，利用判别器对行为特征向量进行判别，确定待识别用户对应的行为指标的预测概率。

其中，判别器基于结合生成器的对抗训练获得。

可选地，对判别器的训练，可以利用判别器与生成器连接构成对抗网络，对该对抗网络进行交替训练；以训练后的判别器对待识别用户的行为指标进行判别，提高了判别的效率；可选地，行为指标用于表示用户是否符合识别条件。

本公开上述实施例提供的一种用户识别方法，获取待识别用户的至少一种行为数据；根据所述至少一种行为数据确定所述待识别用户的行为特征向量；利用判别器对所述行为特征向量进行判别，确定所述待识别用户对应的预测概率；其中，所述判别器基于结合生成器的对抗训练获得；本实施例获得待识别用户的至少一种行为数据，提高了行为特征向量对待识别用户的特征表达的准确性，并且，利用训练好的判别器确定待识别用户的行为指标的预测概率，不需要反复训练模型分类器，降低了复杂度，提高了识别效率。

可选地，至少一种行为数据可以包括但不限于以下至少之一：线上行为数据、线下行为数据、交互行为数据。

在具有交互需求的场景下，用户的行为数据可以包括用户在线上(例如，用户在线上应用中的操作数据等)、线下行为数据(例如，现实生活中的操作数据等)、交互行为数据(例如，与交互方沟通或其他操作的数据等)；可选地，线上行为数据可以包括但不限于以下至少之一：页面(如详情页)浏览量数：浏览的详情页面数量(从列表页进入详情页记为一次流量详情页)，浏览页面停留的时长(表示在设定时间段内的所有时长之和)，线上沟通次数或电话沟通次数，vr带看次数(针对房产领域)，线上委托次数(针对房产领域，委托表示用户与经纪人建立线下关联)；线下行为数据可以包括但不限于以下至少之一：线下交互次数(例如，房产领域的带看次数)、交互终结次数(例如，房产领域的成交次数等)；交互行为数据是指用户与交互平台或交互平台确定的交互方直接的沟通数据，例如，可以包括但不限于以下至少之一：交互通讯中对话轮数(一问一答可认为是一轮)、线上沟通人数或电话沟通人数、带看经纪人数(针对房产领域，其中带看包括线上带看以及线下带看)。

本实施例中通过获取用户在业务场景中的至少一种行为数据，提高了用户特征与业务场景的相关性，进而提高了用户识别的准确率。

图2是本公开另一示例性实施例提供的用户识别方法的流程示意图。如图2所示，包括如下步骤：

步骤202，获取设定时间段内待识别用户的至少一种行为数据。

步骤204，根据至少一种行为数据确定待识别用户的行为特征向量。

步骤205，基于生成器和判别器构成对抗网络，对对抗网络进行训练。

步骤206，利用判别器对行为特征向量进行判别，确定待识别用户对应的行为指标的预测概率。

本实施例中，在利用判别器对待识别用户进行判别之前，通过基于生成器和判别器构成对抗网络，对该对抗网络进行交替训练，使得到的判别器的识别性能更好。

如图3所示，在上述图2所示实施例的基础上，步骤205可包括如下步骤：

步骤2051，获取第一正样本集和真负样本集。

其中，第一正样本集中包括至少一个正样本，真负样本集中包括至少一个真负样本，每个真负样本的行为数据与正样本的行为数据相似，例如，每个真负样本的行为数据与正样本的行为数据之间的差异小于设定值。

为了对对抗网络进行训练，首先需要获取训练样本，本实施例中，获取两种样本用户，一种是正样本，本实施例中将确定不符合识别条件的用户(如，异常用户)作为正样本；另一种是真负样本，真负样本对应的用户的行为数据与正样本的行为数据较为相似(行为数据之间的差异小于设定值)，但其实际上是负样本(符合识别条件的用户，如：正常用户)。

步骤2052，将第一正样本集输入判别器，得到每个正样本对应的行为指标的第一预估异常概率。

步骤2053，将真负样本集中的每个真负样本输入到生成器，得到包括的至少一个第二样本的第二正样本集，并基于判别器确定每个第二样本对应的行为指标的第二预估异常概率。

本实施例利用生成器生成第二正样本集，解决了正样本稀缺的问题，同时增加的正样本可以丰富样本集的多样性，在一定程度上避免了过拟合。

步骤2054，基于第一预估异常概率和第二预估异常概率，确定对抗网络的损失。

步骤2055，基于损失对对抗网络进行训练，得到训练后的判别器。

本实施例中，通过将真负样本集中的真负样本对对抗网络进行训练，由于真负样本的特征与正样本高度相似，但实际是负样本，因此，结合第一预估异常概率和第二预估异常概率确定对抗网络的损失，增加了对抗网络的训练难度，使对抗网络不易收敛，提升了训练后的对抗网络的泛化能力。

如图4所示，在上述图2所示实施例的基础上，步骤205还可包括如下步骤：

步骤2051，获取第一正样本集和真负样本集。

其中，第一正样本集中包括至少一个正样本，真负样本集中包括至少一个真负样本，每个真负样本的行为数据与正样本的行为数据相似。

步骤2056，基于用户生命价值网络确定第一正样本集和第二正样本集中每个样本对应的行为指标的正常预估概率。

本实施例中，增加一个用户生命价值网络(LTV)，以该网络判断每个样本是否是符合识别条件的用户(即负样本)，该网络输出的正常预估概率表示每个样本是符合识别条件的用户的概率；而对抗网络在识别每个样本是不是一个不符合识别条件的用户，如果一个样本是不符合识别条件的用户，那么对抗网络输出的异常概率为正值，而用户生命价值网络输出正常预估概率为负值，通过对异常概率(包括第一预估异常概率和第二预估异常概率)与正常预估概率进行加权叠加，以确定该用户对应的综合异常概率，例如，以公式(1)确定样本的综合异常概率：

综合异常概率＝P_GAN+a(1-P_LTV) 公式(1)

其中，a为用户生命价值网络对应的权重值，P_GAN表示对抗网络输出的异常概率，P_LTV表示用户生命价值网络输出的正常预估概率。

步骤2057，基于第一预估异常概率、第二预估异常概率和正常预估概率，确定对抗网络的损失。

步骤2058，基于损失对对抗网络进行训练，得到训练后的判别器。

可选地，基于第一预估异常概率、第二预估异常概率和正常预估概率，确定对抗网络的损失的具体过程可通过网络的损失函数获得，例如，网络的损失函数定义如公式(2)所示：

min_Gmax_D(E[logD(x)]+E[log(1-D(G(z)))])+a*E[log(1L(G(z)))] 公式(2)

损失函数的计算是在判别器输出处产生的，本实施例中用D(x)表示，而判别器的输出一般是两个结果，典型的二分类问题，所以损失函数采用二进制交叉熵函数。其中，判别器的训练目标是正确区分生成器生成的正样本(fake)和真实的正样本(true)，如果使用0和1来代替，那么对于第一项中E的输入采样来自真实数据，所以期望D(x)趋近于1，同样，第二项中E输入采样来自生成器G(x)的生成数据，所以期望D(G(z))趋近于0最好，综上，max(D)起到了优化判别器的作用。

第二部分，判别器D保持不变，训练生成器G网络，因为要尽量生成贴近于正样本的样例，所以将fake的标签(label)设置为1，期望D(G(z))输出越接近1越好，也就是公式中第二项越小越好，那么min(G)起到了优化生成器的作用。本实施例中的第一部分和第二部分结合相当公式(1)中的_GN。

第三部分，用户生命周期价值越大，表示用户越好，所以L(G(z))(相当公式(1)中的P_LTV)趋近于0，代表这个用户为正样本的概率越高，起到了优化网络的作用，其中a为加权系数。本实施例通过在损失函数中增加第三部分作为一个惩罚项，使对抗网络不容易收敛，增加了训练难度。

如图5所示，在上述图3或4所示实施例的基础上，步骤2051可以包括：

步骤501，基于标注信息和/或至少一种预设规则获得至少一个正样本，构成第一正样本集。

其中，预设规则包括至少一种行为数据符合设定条件。

步骤502，基于标注信息获得至少一个真负样本，构成真负样本集。

本实施例中，获得正样本可以通过预设规则获得，或根据已有的标注信息获得，可选地，预设规则可以包括但不限于以下至少之一：规则1：在设定时间段内，日均交互次数大于第一设定值(例如，20次)；规则2：在设定时间段内，总交互次数大于第二设定值(例如，50次)，而交互终结次数为0；规则3：在交互通信中出现敏感词(例如，推销等信息)。真负样本由于其特征与正样本较为相似，因此，需要通过预先标注确定用户是否为真负样本。

可选地，步骤501可以包括：基于多个训练用户在设定时间段内的至少一种行为数据，确定多个训练用户中每个训练用户对应的训练特征；

利用孤立森林算法对多个训练特征进行切分处理，得到每个训练特征对应的离散概率，基于离散概率确定每个训练特征对应的一维强特征；

响应于训练特征和一维强特征符合设定条件，确定训练用户是正样本；

响应于训练特征和一维强特征不符合设定条件，将训练样本作为待识别用户，得到待识别用户集。

本实施例中，利用孤立森林算法可确定多个训练特征中每个训练特征被切分的次数，将每个训练特征对应的被切分次数作为该训练特征到根节点的距离，以该距离确定该训练特征的离散概率(表示为一个0到1之间的数)，以该离散概率作为训练用户的一维强特征，结合训练特征和一维强特征确定训练用户是否是正样本，例如，将训练特征(可表示为向量)与一维强特征进行维度拼接，得到新的特征向量，当特征向量中的一个或多个值大于一个设定阈值时，可确定该训练用户是正样本；而当特征向量中的每个值都不大于设定阈值时，可将该训练样本作为待识别用户，输入到训练后的判别器中，确定该待识别用户是否正常。

图6是本公开又一示例性实施例提供的用户识别方法的流程示意图。如图6所示，包括如下步骤：

步骤602，获取设定时间段内待识别用户的至少一种行为数据。

步骤604，根据至少一种行为数据确定待识别用户的行为特征向量。

步骤606，利用判别器对行为特征向量进行判别，确定待识别用户对应的行为指标的预测概率。

步骤608，基于待识别用户对应的行为指标的预测概率，确定待识别用户是否符合识别条件。

本实施例中，判别器输出的预测概率表示的是待识别用户可能是不符合识别条件的用户的概率，但待识别用户是否是符合识别条件的用户(或不符合识别条件的用户)，需要进一步进行识别，可选地，判断待识别用户对应的预测概率是否小于分类器阈值；如果是，确定待识别用户为符合识别条件的用户，否则，确定待识别用户为不符合识别条件的用户。通过加入分类器阈值，实现对用户是否为符合识别条件的用户的监督，提高了识别结果的准确性。

如图7所示，在上述图6所示实施例的基础上，在执行步骤608之前，还可包括如下步骤：

步骤701，合并第一正样本集和第二正样本集，得到第三正样本集。

步骤702，将第三正样本集随机分割为第二预测集和第四正样本集。

步骤703，基于第四正样本集对分类器进行训练，得到训练后的分类器。

步骤704，基于训练后的分类器对第二预测集得到的多个分类概率值，确定分类器阈值。

本实施例将训练过程中获得的所有正样本构成第三正样本集，对第三正样本集随机采样，生成两个样本集，两个样本集可以为第二预测集和第四正样本集，可选地，第四正样本集中的样本数量较多，例如，随机采样第三正样本集中百分之80的样本构成第四正样本集，剩余的样本构成第二预测集；利用第四正样本集对分类器进行训练，以提高分类器对正样本分类的准确率，再以训练后的分类器对第二预测集中所有的样本进行预测，得到多个分类概率值(表示第二预测集中每个样本是正样本的概率)，以多个分类概率值确定分类器阈值，例如，以多个分类概率值的均值作为分类器阈值；本申请通过随机采样得到的两个正样本集合确定分类器阈值，提高了分类器阈值的准确性，进而提高了识别结果的准确率。

可选地，本公开实施例还可以提高审核辅助，对经过判别器判别确定的不符合识别条件的用户对应的特征以及行为数据进行统计，为对用户是否不符合识别条件的标注提供参考数据。

本公开实施例提供的任一种用户识别方法可以由任意适当的具有数据处理能力的设备执行，包括但不限于：终端设备和服务器等。或者，本公开实施例提供的任一种用户识别方法可以由处理器执行，如处理器通过调用存储器存储的相应指令来执行本公开实施例提及的任一种用户识别方法。下文不再赘述。

示例性装置

图8是本公开一示例性实施例提供的用户识别装置的结构示意图。本公开实施例提供的装置，包括：

行为数据获取模块81，用于获取设定时间段内待识别用户的至少一种行为数据。

特征确定模块82，用于根据至少一种行为数据确定待识别用户的行为特征向量。

概率预测模块83，用于利用判别器对行为特征向量进行判别，确定待识别用户对应的行为指标的预测概率。

其中，判别器基于结合生成器的对抗训练获得。

本公开上述实施例提供的一种用户识别装置，获取待识别用户的至少一种行为数据；根据所述至少一种行为数据确定所述待识别用户的行为特征向量；利用判别器对所述行为特征向量进行判别，确定所述待识别用户对应的行为指标的预测概率；其中，所述判别器基于结合生成器的对抗训练获得；本实施例获得待识别用户的至少一种行为数据，提高了行为特征向量对待识别用户的特征表达的准确性，并且，利用训练好的判别器确定待识别用户的预测概率，不需要反复训练模型分类器，降低了复杂度，提高了识别效率。

可选地，至少一种行为数据包括以下至少之一：线上行为数据、线下行为数据、交互行为数据。

在一些可选的实施例中，本公开实施例提供的装置，还包括：

网络训练模块，用于基于生成器和判别器构成对抗网络，对对抗网络进行训练。

可选地，网络训练模块，包括：

样本获取单元，用于获取第一正样本集和真负样本集；其中，第一正样本集中包括至少一个正样本，真负样本集中包括至少一个真负样本，每个真负样本的行为数据与正样本的行为数据之间的差异小于设定值；

第一预估单元，用于将第一正样本集输入判别器，得到每个正样本对应的行为指标的第一预估异常概率；

第二预估单元，用于将真负样本集中的每个真负样本输入到生成器，得到包括的至少一个第二样本的第二正样本集，并基于判别器确定每个第二样本对应的行为指标的第二预估异常概率；

损失确定单元，用于基于第一预估异常概率和第二预估异常概率，确定对抗网络的损失；

训练单元，用于基于损失对对抗网络进行训练，得到训练后的判别器。

可选地，网络训练模块，还包括：

第三预估单元，用于基于用户生命价值网络确定第一正样本集和第二正样本集中每个样本对应的正常预估概率；

损失确定单元，具体用于基于第一预估异常概率、第二预估异常概率和正常预估概率，确定对抗网络的损失。

可选地，样本获取单元，具体用于基于标注信息和/或至少一种预设规则获得至少一个正样本，构成第一正样本集；其中，预设规则包括至少一种行为数据符合设定条件；基于标注信息获得至少一个真负样本，构成真负样本集。

可选地，样本获取单元在基于至少一种预设规则获得至少一个正样本时，用于基于多个训练用户在设定时间段内的至少一种行为数据，确定多个训练用户中每个训练用户对应的训练特征；利用孤立森林算法对多个训练特征进行切分处理，得到每个训练特征对应的离散概率，基于离散概率确定每个训练特征对应的一维强特征；响应于训练特征和一维强特征符合设定条件，确定训练用户是正样本；响应于训练特征和一维强特征不符合设定条件，将训练样本作为待识别用户，得到待识别用户集。

在一些可选的实施例中，本公开实施例提供的装置还包括：

用户识别模块，用于基于待识别用户对应的行为指标的预测概率，确定待识别用户是否符合识别条件。

可选地，用户识别模块，具体用于判断待识别用户对应的行为指标的预测概率是否小于分类器阈值；如果是，确定待识别用户符合识别条件，否则，确定待识别用户不符合识别条件。

可选地，用户识别模块在判断待识别用户对应的预测概率是否小于分类器阈值之前，还用于合并第一正样本集和第二正样本集，得到第三正样本集；将第三正样本集随机分割为第二预测集和第四正样本集；基于第四正样本集对分类器进行训练，得到训练后的分类器；基于训练后的分类器对第二预测集得到的多个分类概率值，确定分类器阈值。

示例性电子设备

下面，参考图9来描述根据本公开实施例的电子设备。该电子设备可以是第一设备100和第二设备200中的任一个或两者、或与它们独立的单机设备，该单机设备可以与第一设备和第二设备进行通信，以从它们接收所采集到的输入信号。

图9图示了根据本公开实施例的电子设备的框图。

如图9所示，电子设备90包括一个或多个处理器91和存储器92。

处理器91可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元，并且可以控制电子设备90中的其他组件以执行期望的功能。

存储器92可以包括一个或多个计算机程序产品，所述计算机程序产品可以包括各种形式的计算机可读存储介质，例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令，处理器91可以运行所述程序指令，以实现上文所述的本公开的各个实施例的用户识别方法以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如输入信号、信号分量、噪声分量等各种内容。

在一个示例中，电子设备90还可以包括：输入装置93和输出装置94，这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。

例如，在该电子设备是第一设备100或第二设备200时，该输入装置93可以是上述的麦克风或麦克风阵列，用于捕捉声源的输入信号。在该电子设备是单机设备时，该输入装置93可以是通信网络连接器，用于从第一设备100和第二设备200接收所采集的输入信号。

此外，该输入设备93还可以包括例如键盘、鼠标等等。

该输出装置94可以向外部输出各种信息，包括确定出的距离信息、方向信息等。该输出设备94可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。

当然，为了简化，图9中仅示出了该电子设备90中与本公开有关的组件中的一些，省略了诸如总线、输入/输出接口等等的组件。除此之外，根据具体应用情况，电子设备90还可以包括任何其他适当的组件。

示例性计算机程序产品和计算机可读存储介质

除了上述方法和设备以外，本公开的实施例还可以是计算机程序产品，其包括计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的用户识别方法中的步骤。

所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码，所述程序设计语言包括面向对象的程序设计语言，诸如Java、C++等，还包括常规的过程式程序设计语言，诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。

此外，本公开的实施例还可以是计算机可读存储介质，其上存储有计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的用户识别方法中的步骤。

所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

以上结合具体实施例描述了本公开的基本原理，但是，需要指出的是，在本公开中提及的优点、优势、效果等仅是示例而非限制，不能认为这些优点、优势、效果等是本公开的各个实施例必须具备的。另外，上述公开的具体细节仅是为了示例的作用和便于理解的作用，而非限制，上述细节并不限制本公开为必须采用上述具体的细节来实现。

本说明书中各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其它实施例的不同之处，各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言，由于其与方法实施例基本对应，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本公开中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的，可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇，指“包括但不限于”，且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”，且可与其互换使用，除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”，且可与其互换使用。

可能以许多方式来实现本公开的方法和装置。例如，可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和装置。用于所述方法的步骤的上述顺序仅是为了进行说明，本公开的方法的步骤不限于以上具体描述的顺序，除非以其它方式特别说明。此外，在一些实施例中，还可将本公开实施为记录在记录介质中的程序，这些程序包括用于实现根据本公开的方法的机器可读指令。因而，本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。

还需要指出的是，在本公开的装置、设备和方法中，各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。

提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的，并且在此定义的一般原理可以应用于其他方面而不脱离本公开的范围。因此，本公开不意图被限制到在此示出的方面，而是按照与在此公开的原理和新颖的特征一致的最宽范围。

为了例示和描述的目的已经给出了以上描述。此外，此描述不意图将本公开的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例，但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims

1.一种用户识别方法，其特征在于，包括：

获取设定时间段内待识别用户的至少一种行为数据；

利用判别器对所述行为特征向量进行判别，确定所述待识别用户对应的行为指标的预测概率；其中，所述判别器基于结合生成器的对抗训练获得；

所述利用判别器对所述行为特征向量进行判别，确定所述待识别用户对应的行为指标的预测概率之前，还包括：

基于所述第一预估异常概率和所述第二预估异常概率，确定基于所述生成器和所述判别器构成的对抗网络的损失；

2.根据权利要求1所述的方法，其特征在于，所述至少一种行为数据包括以下至少之一：线上行为数据、线下行为数据、交互行为数据。

3.根据权利要求1所述的方法，其特征在于，在基于所述第一预估异常概率和所述第二预估异常概率，确定所述对抗网络的损失之前，还包括：

4.根据权利要求1所述的方法，其特征在于，所述获取第一正样本集和真负样本集，包括：

5.根据权利要求4所述的方法，其特征在于，所述基于至少一种预设规则获得至少一个正样本，包括：

6.根据权利要求1-5任一所述的方法，其特征在于，还包括：基于所述待识别用户对应的行为指标的预测概率，确定所述待识别用户是否符合识别条件。

7.根据权利要求6所述的方法，其特征在于，所述基于所述待识别用户的行为指标对应的预测概率，确定所述待识别用户是否符合识别条件，包括：

判断所述待识别用户对应的预测概率是否小于分类器阈值；如果是，确定所述待识别用户符合识别条件，否则，确定所述待识别用户不符合识别条件。

8.根据权利要求7所述的方法，其特征在于，在判断所述待识别用户对应的预测概率是否小于分类器阈值之前，还包括：

9.一种用户识别装置，其特征在于，包括：

概率预测模块，用于利用判别器对所述行为特征向量进行判别，确定所述待识别用户对应的行为指标的预测概率；其中，所述判别器基于结合生成器的对抗训练获得；

还包括：网络训练模块，用于基于所述生成器和所述判别器构成对抗网络，对所述对抗网络进行训练；

所述网络训练模块，包括：

10.根据权利要求9所述的装置，其特征在于，所述至少一种行为数据包括以下至少之一：线上行为数据、线下行为数据、交互行为数据。

11.根据权利要求9所述的装置，其特征在于，所述网络训练模块，还包括：

12.根据权利要求9所述的装置，其特征在于，所述样本获取单元，具体用于基于标注信息和/或至少一种预设规则获得至少一个正样本，构成所述第一正样本集；其中，所述预设规则包括至少一种行为数据符合设定条件；基于标注信息获得至少一个真负样本，构成所述真负样本集。

13.根据权利要求12所述的装置，其特征在于，所述样本获取单元在基于至少一种预设规则获得至少一个正样本时，用于基于多个训练用户在所述设定时间段内的至少一种行为数据，确定所述多个训练用户中每个训练用户对应的训练特征；利用孤立森林算法对所述多个训练特征进行切分处理，得到每个所述训练特征对应的离散概率，基于所述离散概率确定每个所述训练特征对应的一维强特征；响应于所述训练特征和所述一维强特征符合所述设定条件，确定所述训练用户是正样本；响应于所述训练特征和所述一维强特征不符合所述设定条件，将所述训练样本作为待识别用户，得到待识别用户集。

14.根据权利要求9-13任一所述的装置，其特征在于，所述装置还包括：

15.根据权利要求14所述的装置，其特征在于，所述用户识别模块，具体用于判断所述待识别用户对应的行为指标的预测概率是否小于分类器阈值；如果是，确定所述待识别用户符合识别条件，否则，确定所述待识别用户不符合识别条件。

16.根据权利要求15所述的装置，其特征在于，所述用户识别模块在判断所述待识别用户对应的预测概率是否小于分类器阈值之前，还用于合并所述第一正样本集和所述第二正样本集，得到第三正样本集；将所述第三正样本集随机分割为第二预测集和第四正样本集；基于所述第四正样本集对分类器进行训练，得到训练后的分类器；基于所述训练后的分类器对所述第二预测集得到的多个分类概率值，确定所述分类器阈值。

17.一种计算机可读存储介质，其特征在于，所述存储介质存储有计算机程序，所述计算机程序用于执行上述权利要求1-8任一所述的用户识别方法。

18.一种电子设备，其特征在于，所述电子设备包括：

处理器；

用于存储所述处理器可执行指令的存储器；

所述处理器，用于从所述存储器中读取所述可执行指令，并执行所述指令以实现上述权利要求1-8任一所述的用户识别方法。