CN111274907A

CN111274907A - 使用类别识别模型来确定用户的类别标签的方法和装置

Info

Publication number: CN111274907A
Application number: CN202010045891.8A
Authority: CN
Inventors: 管楚; 潘健民
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: AlipayCom Co ltd
Priority date: 2020-01-16
Filing date: 2020-01-16
Publication date: 2020-06-12
Anticipated expiration: 2040-01-16
Also published as: CN111274907B

Abstract

本说明书实施例提供用于使用类别识别模型来确定用户的类别标签的方法和装置。在该方法中，对用户的动态行为数据进行向量化处理，以得到所述用户的动态行为向量表示；将动态行为向量表示提供给逻辑分布抽取模型，以得到用户的行为逻辑向量表示，所述行为逻辑向量表示反映所述用户的行为逻辑分布；以及将行为逻辑向量表示提供给标签分类模型，确定用户的类别标签。

Description

使用类别识别模型来确定用户的类别标签的方法和装置

技术领域

本说明书的实施例通常涉及计算机领域，更具体地，涉及使用类别识别模型来确定用户的类别标签的方法及装置。

背景技术

在各种用户类别识别场景(比如，类罪/风险类别识别场景)中，通常会创建一个类别识别模型，在该类别识别模型中，使用具体特征描述(例如，类罪/风险类别描述)来预先定义模型特征，并且每个类别被定义为与一个模型特征集对应。在进行用户类别识别时，根据具体的特征描述进行相应的特征提取，然后将所提取的特征数据输入到类别识别模型中，以确定用户的类别标签，由此对用户进行类别识别，例如，识别用户是否是类罪/风险用户。

然而，类别的特征描述通常根据经验人为确定，每个类别(例如，类罪/风险类别)的特征描述不一定非常准确。例如，传销和非法集资的特征描述很可能会存在交集，所以很难给出类别之间的界限。按照上述用户类别识别方法，在多类别识别的情况下，非常可能会出现误判。此外，例如，在类罪/风险类别识别的场景下，恶意用户会不停变换其行为特征，以防止被类别识别模型检测到。在这种情况下，上述类别识别方法通常无法跟随恶意用户的行为特征的变化而变化，由此导致类别识别效率不高。

发明内容

鉴于上述问题，本说明书的实施例提供一种使用类别识别模型来确定用户的类别标签的方法及装置。在该方法中，基于用户的动态行为数据来得到用户的行为逻辑表示，并且基于用户的行为逻辑表示来进行类别识别。考虑到行为逻辑分布与行为目的之间形成对应关系，每种类别用户的行为目的通常是相同或者非常相似的，由此导致行为逻辑分布也会是相同或者非常近似(即使在用户的行为特征被恶意变换的情况下)，利用上述类别识别方法，由于基于用户的动态行为数据而导出的行为逻辑表示可以反映用户的行为逻辑分布，从而能够基于用户的行为目的来进行类别识别，由此可以提高用户类别识别的准确性。这种方法尤其适用于类罪识别的应用场景。

根据本说明书实施例的一个方面，提供一种用于使用类别识别模型来确定用户的类别标签的方法，所述类别识别模型包括逻辑分布抽取模型和标签分类模型，所述方法包括：对用户的动态行为数据进行向量化处理，以得到所述用户的动态行为向量表示；将所述动态行为向量表示提供给逻辑分布抽取模型，以得到所述用户的行为逻辑向量表示，所述行为逻辑向量表示反映所述用户的行为逻辑分布；以及将所述行为逻辑向量表示提供给标签分类模型，确定所述用户的类别标签。

可选地，在上述方面的一个示例中，所述动态行为数据可以包括指定时段内的行为序列数据。

可选地，在上述方面的一个示例中，所述行为序列数据可以包括交易行为序列数据。

可选地，在上述方面的一个示例中，对用户的动态行为数据进行向量化处理，以得到所述用户的动态行为向量表示可以包括：对用户的动态行为数据和静态行为数据进行向量化处理，以得到所述用户的动态行为向量表示和静态行为向量表示；将所述行为逻辑向量表示提供给标签分类模型，确定所述用户的类别标签可以包括：将所述行为逻辑向量表示和所述静态行为向量表示提供给标签分类模型，确定所述用户的类别标签。

可选地，在上述方面的一个示例中，将所述行为逻辑向量表示和所述静态行为向量表示提供给标签分类模型，确定所述用户的类别标签可以包括：将所述行为逻辑向量表示和所述静态行为向量表示级联后提供给标签分类模型，确定所述用户的类别标签。

可选地，在上述方面的一个示例中，所述静态行为数据可以包括历史类别标签数据、关系特征数据和用户属性数据中的至少一种。

可选地，在上述方面的一个示例中，所述类别标签可以包括类罪标签，所述用户属性数据还可以包括高频高危地点数据和/或高频行为发生时间数据。

可选地，在上述方面的一个示例中，所述逻辑分布抽取模型可以包括基于注意力机制的逻辑分布抽取模型。

可选地，在上述方面的一个示例中，所述逻辑分布抽取模型和所述用户分类模型作为整体模型一起训练。

可选地，在上述方面的一个示例中，用作所述逻辑分布抽取模型的训练样本数据的动态行为数据基于是否属于特定类别标签而被划分为第一行为序列数据和第二行为序列数据来进行模型训练，所述第一行为序列数据包括具有特定类别标签的动态行为数据，所述第二行为序列数据包括不具有特定类别标签的动态行为数据。

根据本说明书的实施例的另一方面，提高一种用于使用类别识别模型来确定用户的类别标签的装置，所述类别识别模型包括逻辑分布抽取模型和标签分类模型，所述装置包括：向量表示单元，对用户的动态行为数据进行向量化处理，以得到所述用户的动态行为向量表示；逻辑分布抽取单元，将所述动态行为向量表示提供给逻辑分布抽取模型，得到所述用户的行为逻辑向量表示，所述行为逻辑向量表示反映所述用户的行为逻辑分布；以及标签确定单元，将所述行为逻辑向量表示提供给标签分类模型，确定所述用户的类别标签。

可选地，在上述方面的一个示例中，所述向量表示单元对用户的动态行为数据和静态行为数据进行向量化处理，以得到所述用户的动态行为向量表示和静态行为向量表示；所述标签确定单元将所述行为逻辑向量表示和所述静态行为向量表示提供给标签分类模型，确定所述用户的类别标签。

可选地，在上述方面的一个示例中，所述装置还可以包括：级联单元，将所述行为逻辑向量表示和所述静态行为向量表示级联，所述标签确定单元将级联后的行为逻辑向量表示和静态行为向量表示提供给标签分类模型，确定所述用户的类别标签。

可选地，在上述方面的一个示例中，所述类别标签可以包括类罪标签，所述用户属性数据还可以包括高频高危地点数据和高频行为发生时间数据中的至少一种。

根据本说明书的实施例的另一方面，提供一种电子设备，包括：一个或多个处理器，以及与所述一个或多个处理器耦合的存储器，所述存储器存储指令，当所述指令被所述一个或多个处理器执行时，使得所述一个或多个处理器执行如上所述的用于使用类别识别模型来确定用户的类别标签的方法。

根据本说明书的实施例的另一方面，提供一种机器可读存储介质，其存储有可执行指令，所述指令当被执行时使得所述机器执行如上所述的用于使用类别识别模型来确定用户的类别标签的方法。

附图说明

通过参照下面的附图，可以实现对于本说明书的实施例内容的本质和优点的进一步理解。在附图中，类似组件或特征可以具有相同的附图标记。

图1示出了根据本说明书的第一实施例的用于使用类别识别模型来确定用户的类别标签的方法的流程图；

图2示出了根据本说明书的第一实施例的动态行为向量表示的确定过程的一个示例的示意图；

图3示出了根据本说明书的第一实施例的行为逻辑向量表示的确定过程的一个示例的示意图；

图4示出了根据本说明书的第一实施例的GRU模型的一个隐层结构的示例示意图；

图5示出了根据本说明书的第一实施例的基于注意力机制的GRU模型的一个隐层结构的示例示意图；

图6示出了根据本说明书的第一实施例的类别识别模型的训练过程的一个示例的流程图；

图7示出了根据本说明书的第一实施例的类别识别模型的训练过程的另一示例的流程图；

图8示出了根据本说明书的第二实施例的用于使用类别识别模型来确定用户的类别标签的方法的流程图；

图9示出了根据本说明书的第二实施例的类别识别模型的训练过程的一个示例的流程图；

图10示出了根据本说明书的第二实施例的用于使用类别识别模型来确定用户的类别标签的过程的示例示意图；

图11示出了根据本公开的第三实施例的用于使用类别识别模型来确定用户的类别标签的装置的方框图；

图12示出了根据本公开的第四实施例的用于使用类别识别模型来确定用户的类别标签的装置的方框图；和

图13示出了根据本说明书的第五实施例的用于使用类别识别模型来确定用户的类别标签的电子设备的方框图。

具体实施方式

现在将参考示例实施方式讨论本文描述的主题。应该理解，讨论这些实施方式只是为了使得本领域技术人员能够更好地理解从而实现本文描述的主题，并非是对权利要求书中所阐述的保护范围、适用性或者示例的限制。可以在不脱离本说明书的实施例内容的保护范围的情况下，对所讨论的元素的功能和排列进行改变。各个示例可以根据需要，省略、替代或者添加各种过程或组件。例如，所描述的方法可以按照与所描述的顺序不同的顺序来执行，以及各个步骤可以被添加、省略或者组合。另外，相对一些示例所描述的特征在其它例子中也可以进行组合。

如本文中使用的，术语“包括”及其变型表示开放的术语，含义是“包括但不限于”。术语“基于”表示“至少部分地基于”。术语“一个实施例”和“一实施例”表示“至少一个实施例”。术语“另一个实施例”表示“至少一个其他实施例”。术语“第一”、“第二”等可以指代不同的或相同的对象。下面可以包括其他的定义，无论是明确的还是隐含的。除非上下文中明确地指明，否则一个术语的定义在整个说明书中是一致的。

然而，类别的特征描述通常根据经验人为确定，从而导致每个类别(例如，类罪/风险类别)的特征描述不一定非常准确。例如，传销和非法集资的特征描述很可能会存在交集，所以很难给出类别之间的界限。按照上述用户类别识别方法，在多类别识别的情况下，非常可能会出现误判。此外，例如，在类罪/风险类别识别的场景下，恶意用户会不停变换其行为特征，以防止被类别识别模型检测到。在这种情况下，上述类别识别方法通常无法跟随恶意用户的行为特征的变化而变化，由此导致类别识别效率不高。

考虑到每种类别用户通常具有相同或近似的行为目的，每个行为目的都可以表示成特定行为逻辑分布，从而针对属于同一类别的用户，该用户的行为逻辑分布通常是相同或者非常近似的，例如，赌博用户的行为逻辑可能是80％的赚钱+20％的洗钱等，由此，本说明书的实施例提供一种用户类别识别方法，在该用户类别识别方法中，基于用户的动态行为数据得到用户的行为逻辑表示，并且基于用户的行为逻辑表示来进行类别识别。利用该用户类别识别方法，由于基于用户的动态行为数据导出的行为逻辑表示可以指示用户的行为逻辑分布，从而使得能够基于用户行为逻辑分布来进行类别识别，而不再关注类别的具体特征定义，由此提高用户类别识别的准确性。此外，由于用户的行为逻辑分布仅仅与该用户的所属类别相关，而与用户交易行为或交易模型无关，由此利用本说明书的实施例提供的用户类别识别方法，可以在用户变换其行为特征的情况下，确保用户类别识别的准确性。

在本说明书中，术语“动态行为数据”可以是指用户持续发生的行为数据，该行为数据能够反映出用户的行为逻辑分布。例如，在一个示例中，动态行为数据例如可以包括用户的频繁转入转出金额的行为数据，该行为数据可以反映出用户具有转账、返利和赚钱利润的行为逻辑分布。

在本说明书中，每种类别(类别标签)对应一种行为逻辑分布。例如，类别标签“赌博”的行为逻辑分布可以为“0.8权重的赚钱+0.2权重的洗钱”。由此，可以通过分析得到用户的行为逻辑分布，进而基于行为逻辑分布来确定出用户所述的类别标签。这里要说明的，上述类别标签“赌博”的行为逻辑分布仅仅是一个示例。在实际应用中，每种类别标签的行为逻辑分布可以具有更多的向量维度，并且表达形式可以更为复杂。

下面将参照附图来详细描述根据本说明书的实施例的用于使用类别识别模型来确定用户的类别的方法和装置。

图1示出了根据本说明书的第一实施例的用于使用类别识别模型来确定用户的类别标签的方法100的流程图。在本说明书中，类别识别模型包括逻辑分布抽取模型和标签分类模型。

如图1所示，在块110，对用户的动态行为数据进行向量化处理，以得到用户的动态行为向量表示。在本说明书的一个示例中，动态行为数据可以包括指定时段内的行为序列数据。该行为序列数据中的行为数据按照时间顺序排列。所述指定时段例如是若干个小时、若干天、若干月，或者更长或更短的时间段。指定时段的取值可以根据具体的应用场景来确定。在金融应用场景下，所述行为序列数据可以包括交易行为序列数据。例如，所述行为序列数据可以包括用户购买行为、用户转账行为、用户支付行为、红包行为等等。此外，所述行为序列数据还可以包括用户点击行为、用户搜索行为、用户问答行为等等其它合适的行为数据。

图2示出了根据本说明书的第一实施例的动态行为向量表示的确定过程的一个示例的示意图。

如图2所示，将所收集的各种离散的行为数据(例如，用户1的行为数据1、用户2的行为数据2到用户n的行为数据n)提供给向量化处理模块，比如，图2中的嵌入层(EmbeddingLayer)10。向量化处理处理模块可以将离散的行为数据映射为另一空间中的多维向量表示。例如，嵌入层10可以分别对行为数据1、行为数据2到行为数据n进行嵌入(embedding)处理，以得到动态行为数据的动态行为向量表示。如图2所示，针对用户1的行为数据1，得到动态行为向量表示{a₁,a₂,......,a_m}。此外，针对用户2到用户n，可以分别基于行为数据2到行为数据n得到对应的动态行为向量表示。这里要说明的是，所得到的动态行为向量表示的维度是预先定义的，例如，200维等。每个用户的动态向量表示具有相同的向量维度。

在本说明书中，嵌入处理可以通过例如但不限于one-hot编码来实现。但本说明书的实施例并不限于此。在本说明书的其它示例中，而是也可以使用其他向量表示方法或嵌入算法，例如，multi-hot编码、word2vec、item2vec等。

在如上得到动态行为向量表示后，在块120，将动态行为向量表示提供给逻辑分布抽取模型，以得到用户的行为逻辑向量表示。这里，行为逻辑向量表示可以反映用户的行为逻辑分布。

图3示出了根据本说明书的第一实施例的行为逻辑向量表示的确定过程的一个示例的示意图。如图3所示，在将动态行为向量表示{a₁,a₂,......,a_m}提供给逻辑分布抽取模型后，得到行为逻辑向量表示{b₁,b₂,......,b_k}。同样，行为逻辑向量表示的维度是预先定义的，例如，150维等。

接着，在块130，将用户的行为逻辑向量表示提供给标签分类模型，确定用户的类别标签。例如，在类罪识别的应用场景下，确定用户的类罪标签是“赌博”、“传销”、“非法集资”等。

在本说明书中，逻辑分布抽取模型可以使用任何适合的机器学习模型实现，例如，门控循环单元(Gated Recurrent Unit，GRU)模型、长短期记忆(Long Short Term Memory，LSTM)模型以及LSTM模型的各种变体。

逻辑分布抽取模型可以包括一个或多个隐层。图4示出了根据本说明书的第一实施例的GRU模型的隐层t的结构示意图。

如图4所示，隐层t包括更新门Z_t和重置门r_t。更新门Z_t用于控制前一时刻的状态信息被带入到当前状态中的程度。更新门的值Z_t越大，说明前一时刻的状态信息带入越多。重置门r_t控制前一状态有多少信息被写入到当前的候选集h～_t。重置门r_t越小，前一状态的信息被写入的越少。

GRU模型可以被使用来学习行为序列数据之间的依赖关系。GRU模型使用前向传播来进行GRU计算，即，每个隐层使用前一隐层的输出以及自己的输入来进行计算。GRU模型的前向传播如下述公式(1)-(5)所示：

r_t＝σ(W_r·x_t+Z_r·h_t-1+b_r) (1)

Z_t＝σ(W_Z·x_t+Z_Z·h_t-1+b_Z) (2)

y_t＝σ(W_o·h_t) (5)

其中，σ表示sigmoid激活函数，

为点乘，X_t为GRU的隐层t的输入(即，第t种类型的用户行为数据)，h_t表示第t个隐层。

此外，在本说明书中，在进行行为逻辑抽取处理时，还可以引入注意力机制。图5示出了根据本说明书的第一实施例的基于注意力机制的GRU模型(AUGRU模型)的一个示例的示意图。

如图5所示，相较于图4中示出的GRU模型，在AUGRU模型中，针对更新门进行了改进。具体地，对更新门的输出进行了完善，即，引入注意力机制得分a_t来对属于某种类别的行为数据进行加权，如图5所示，将更新门的输出Z_r与注意力机制得分a_t相乘作为改进后的更新门的输出，如以下公式(6)和(7)所示：

Z_t'＝a_t·Z_t (6)

其中，Z_t为原始的GRU更新门，Z_t’为修改后的更新门，h_t，h_t-1，

均为AUGRU的隐层，a_t为注意力机制得分，其为标量。a_t被使用来对隐层t进行加权，即，对属于某种类别的行为进行加权。

利用上述基于注意力机制的GRU(AUGRU)模型，针对非常可能属于某种类别(例如，第一类别)的动态行为向量表示(动态行为数据)，通过引入注意力机制得分来提高该动态行为向量表示属于第一类别的概率。例如，如果用户在一段时间内频繁购买了化学制品，然而用户经常出现的地点是学校，那么用户是化学老师的概率会很高，由此通过引入注意力机制得分来提高该用户被分类为化学老师的概率。而如果用户频繁购买化学制品后，同时出现在了西藏或境外，那么该用户是涉毒或制毒用户的概率会很高，由此通过引入注意力机制来提高该用户被分类为贩毒用户的概率。

在第一实施例中，逻辑分布抽取模型和标签分类模型可以预先使用动态行为数据的动态行为向量表示作为训练样本来进行训练。每个用户对应一个动态行为向量表示。在一个示例中，逻辑分布抽取模型和标签分类模型作为整体模型一起训练。

图6示出了根据本说明书的第一实施例的类别识别模型的训练过程的一个示例的流程图。

如图6所示，在块610，初始化逻辑分布抽取模型和标签分类模型。接着，循环执行块620到680的操作，直到满足循环结束条件。所述循环结束条件例如可以是循环次数达到预定次数。

具体地，在块620，获取用于本轮模型训练的动态行为数据(即，训练样本)。接着，在块630，对动态行为数据进行向量化处理，以得到动态行为向量表示。

在得到动态行为向量表示后，在块640，将动态行为向量表示提供给逻辑分布抽取模型，以得到行为逻辑向量表示。

在块650，将行为逻辑向量表示提供给标签分类模型，以得到预测标签值。

接着，在块660，基于所得到的预测标签值，确定损失函数Loss1。在逻辑分布抽取模型采用GRU模型实现的情况下，可以采用下述公式计算损失函数Loss1：

其中，D表示大小为N的训练样本集，x表示行为逻辑向量表示，y_i∈{0,1}表示用户是否属于类别i，P(x)表示用户属于类别i的概率。

公式(8)中采用的是最大似然估计的对数似然。但是，如本领域普通技术人员所知，在本说明书的其它实施例中，可以使用其它类型的损失函数，比如，其它形式的似然函数。这里，损失函数Loss1是使用完整的动态行为数据(对应的动态行为向量表示)X来确定的。

在块670，基于损失函数，调整逻辑分布抽取模型和标签分类模型的模型参数。例如，可以通过反向传输来调整逻辑分布抽取模型和标签分类模型的模型参数。

在块680，判断是否满足训练结束条件。例如，判断是否达到预定训练循环次数。如果达到预定训练循环次数，则流程结束。否则，返回到块620，继续执行下一循环过程。

图7示出了根据本说明书的第二实施例的类别识别模型的训练过程的另一示例的流程图。

如图7所示，在块710，初始化逻辑分布抽取模型和标签分类模型。接着，循环执行块720到790的操作，直到满足循环结束条件。所述循环结束条件例如可以是循环次数达到预定次数。

具体地，在块720，获取用于本轮模型训练的动态行为数据(即，训练样本)。在块730，基于动态行为数据的类别标签，将动态行为数据划分为第一行为序列数据和第二行为序列数据。第一行为序列数据可以包括属于某种特定类别的行为数据，例如，属于类罪的类罪行为数据。第二行为序列数据可以包括不属于某种特定类别的行为数据，例如，不属于类罪的非类罪行为数据。

例如，在一示例性应用场景中，白天可能主要涉及非犯罪行为，晚上可能主要涉及犯罪行为。在另一示例性应用场景中，例如，金额小于阈值的行为可能主要涉及非犯罪行为，而金额大于阈值的行为可能主要涉及犯罪行为。在又一示例性应用场景中，白天在第一地点的行为可能主要涉及非犯罪行为，而白天在第二地点的行为、以及晚上的行为可能主要涉及犯罪行为。以上仅为示例，而不对本说明书的公开内容构成任何解释或限定。

由此，可以基于是否涉及犯罪行为，将动态行为序列数据划分为第一行为序列数据和第二行为序列数据，进而得到行为序列对

其中，e_b ⁱ表示犯罪行为序列，

表示非犯罪行为序列。

回到图7，在块740，对动态行为数据进行向量化处理，以得到动态行为向量表示。

在得到动态行为向量表示后，在块750，将动态行为向量表示提供给逻辑分布抽取模型，以得到行为逻辑向量表示。

在块760，将行为逻辑向量表示提供给标签分类模型，以得到预测标签值。

接着，在块770，基于所得到的预测标签值，确定损失函数Loss1和附加损失函数Loss2，并且基于损失函数Loss1和附加损失函数loss2来确定总损失函数Loss。

具体地，在逻辑分布抽取模型采用GRU模型实现的情况下，可以采用上述公式(8)计算损失函数Loss1。此外，可以基于划分后得到的第一行为数据序列和第二行为数据序列(对应的动态行为向量表示)以及对应的预测结果来计算附加损失函数Loss2。例如，可以采用公式(9)来计算附加损失函数Loss2。

其中，

为sigmoid激活函数，h_t表示GRU的隐层t。

此外，可以采用公式(10)来确定总损失函数Loss：

Loss＝Loss1+αLoss2 (10)

其中，α是行为逻辑抽取和标签预测之间的可调节权衡参数。可调节权衡参数可以根据需要或性能等来调节以达到更好的效果。

在块780，基于总损失函数，调整逻辑分布抽取模型和标签分类模型的模型参数。例如，可以通过反向传输来调整逻辑分布抽取模型和标签分类模型的模型参数。

在块790，判断是否满足训练结束条件。例如，判断是否达到预定训练循环次数。如果达到预定训练循环次数，则流程结束。否则，返回到块720，继续执行下一循环过程。

利用图7中示出的模型训练方法，通过将动态行为序列数据划分为属于特定类别的第一行为序列数据和不属于该特定类别的第二行为序列数据，基于所得到的第一行为序列数据和第二行为序列数据以及对应的预测结果来计算出附加损失函数，并且将所计算出的附加损失函数Loss2与原本确定出的损失函数Loss1组合来调整逻辑分布抽取模型和标签确定模型，可以加强第一行为序列数据针对该特定类别标签的权重，同时降低第二行为序列数据针对该特定类别的权重，由此提高模型训练的准确性。

如上参照图1到图7，描述了根据本说明书的第一实施例的用于使用类别识别模型来确定用户的类别标签的方法。

在上述类别标签确定方法中，设置具有逻辑分布抽取模型和标签确定模型的类别识别模型，将用户的动态行为数据输入到逻辑分布抽取模型，得到用于反映用户的行为逻辑分布的行为逻辑表示，然后将用户的行为逻辑表示输入到标签确定模型来进行类别识别。按照这种方式，可以基于用户行为逻辑分布来进行类别识别，而不再关注类别的具体特征定义，由此提高用户类别识别的准确性。此外，由于用户的行为逻辑分布仅仅与该用户的所属类别相关，而与用户交易行为或交易模型无关，由此可以在用户变换其行为特征的情况下，确保用户类别识别的准确性。

本说明书的实施例提供的用于使用类别识别模型来确定用户的类别标签的方法，尤其适用于犯罪/风险逻辑的挖掘以及基于犯罪/风险逻辑的用户发现。利用该方法，不区分具体的类别特征(例如，类罪特征)，更关注类别用户背后的行为目的，例如，恐怖主义、洗钱、赚钱等。按照上述方式，只要类别用户的行为目的不变，其对应的行为逻辑分布也会不变，由此即使类别用户的交易模式发生变化，都可以发掘出类别用户背后的行为逻辑分布，从而准确地进行用户类别确定。

图8示出了根据本说明书的第二实施例的用于使用类别识别模型来确定用户的类别标签的方法的流程图。

如图8所示，在块810，获取用户的动态行为数据和静态行为数据。这里，静态行为数据可以是指非持续发生的行为数据。在本说明书中，静态行为数据可以包括历史类别标签数据、关系特征数据和用户属性数据中的至少一种。

历史类别标签数据可以包括用户是否曾经被判定为属于某种类别，比如，属于赌博、传销、涉毒等类罪类别等。关系特征数据可以表示用户是否与属于特定类别的用户之间具有同机关系或密切的资金往来。特定类别例如可以是赌博、传销、涉毒等类罪类别中的一种。在本说明书中，术语“同机关系”可以包括两个用户之间使用相同的设备或者使用相同的访问媒介(例如，相同的WiFi，)来进行动态行为(例如，交易行为)。用户属性数据可以包括性别、年龄等。

在块820，对所获取的动态行为数据和静态行为数据进行向量化处理，以得到用户的动态行为向量表示和静态行为向量表示。这里，静态行为向量表示可以采用与动态行为向量表示相同的方式来得到。

在块830，将动态行为向量表示提供给逻辑分布抽取模型，以得到用户的行为逻辑向量表示。

在块840，将所得到的行为逻辑向量表示和静态行为向量表示级联在一起。这里，级联处理可以按照预定的级联策略来执行。

在块850，将经过级联后的行为逻辑向量表示和静态行为向量表示提供给标签确定模型，确定用户的类别标签。

这里要说明的是，图8中示出的仅仅是本说明书的一个例示实施例。在本说明书的其它实施例中，可以针对图8中示出的实施例进行修改。例如，在本说明书的其它实施例中，可以不需要图8中的块810和/或840的操作。

此外，在本说明书的其它实施例中，在进行用户类别识别时，还可以考虑行为发生时的时间信息和/或地点信息，例如，夜晚在ATM机附近等因素预示犯罪的潜在可能。相应地，在本说明书的实施例中，用户属性数据还可以包括高频高危地点数据和/或高频行为发生时间数据。高频高危地点数据例如可以包括“用户经常出现的高危地点”。高频行为发生时间数据例如可以包括“用户频繁的交易时间”等。按照这种方式，在进行用户类别识别时，可以将时间信息和/或地点信息作为类别识别模型的考虑因素(即，输入参数)，由此可以提高类别识别的准确率。

在第二实施例中，逻辑分布抽取模型和标签分类模型可以预先使用动态行为向量表示和静态行为向量表示作为训练样本来进行训练。

图9示出了根据本说明书的第二实施例的类别识别模型的训练过程的一个示例的流程图。

如图9所示，在块910，初始化逻辑分布抽取模型和标签分类模型。接着，循环执行块920到980的操作，直到满足循环结束条件。所述循环结束条件例如可以是循环次数达到预定次数。

具体地，在块920，获取用于本轮模型训练的动态行为数据和静态行为数据(即，训练样本)。接着，在块930，对动态行为数据和静态行为数据进行向量化处理，以得到动态行为向量表示和静态行为向量表示。

在得到动态行为向量表示后，在块940，将动态行为向量表示提供给逻辑分布抽取模型，以得到行为逻辑向量表示。

在块950，将行为逻辑向量表示和静态行为向量表示提供给标签分类模型，以得到预测标签值。

接着，在块960，基于所得到的预测标签值，确定损失函数Loss1。在逻辑分布抽取模型采用GRU模型实现的情况下，可以采用上述公式(8)计算损失函数Loss1。

在块970，基于损失函数，调整逻辑分布抽取模型和标签分类模型的模型参数。例如，可以通过反向传输来调整逻辑分布抽取模型和标签分类模型的模型参数。

在块980，判断是否满足训练结束条件。例如，判断是否达到预定训练循环次数。如果达到预定训练循环次数，则流程结束。否则，返回到块920，继续执行下一循环过程。

图10示出了根据本说明书的第二实施例的用于使用类别识别模型来确定用户的类别标签的过程的示例示意图。

如图10所示，将用户行为序列数据、类罪标签数据、关系特征数据和用户属性数据提供给嵌入层1010。嵌入层1010将用户行为序列数据、类罪标签数据、关系特征数据和用户属性数据分别向量化为动态行为向量表示、类别标签向量表示、关系特征向量表示和用户属性向量表示。

所得到的动态行为向量表示输入到具有注意力机制(Attention)1020的GRU模型1030，得到行为逻辑向量表示。然后，将所得到的行为逻辑向量表示、类罪标签向量表示、关系特征向量表示和用户属性向量表示提供给级联处理模块来进行级联处理。

经过级联处理后的行为逻辑向量表示、类罪标签向量表示、关系特征向量表示和用户属性向量表示提供给标签分类模型来确定用户的类别标签。

利用第二实施例的类别标签确定方法，由于在模型训练时，基于动态行为数据和静态行为数据来预测标签值，使用所得到的标签值来确定出损失函数，并且利用损失函数来调整逻辑分布抽取模型，从而使得在进行逻辑分布抽取模型训练时考虑了静态行为数据，进而在进行用户类别确定时，使得逻辑分布抽取模型能够在综合考虑动态行为数据和静态行为数据的情况下得出用户的行为逻辑向量表示，由此可以提高类别识别模型的准确率。

图11示出了根据本公开的第三实施例的用于使用类别识别模型来确定用户的类别标签的装置(下文中称为“类别确定装置”)1100的方框图。如图11所示，类别确定装置1100包括向量表示单元1110、逻辑分布抽取单元1120和标签确定单元1130。

向量表示单元1110被配置为对用户的动态行为数据进行向量化处理，以得到用户的动态行为向量表示。向量表示单元1110的操作可以参考上面参照图1描述的块110的操作。

逻辑分布抽取单元1120被配置为将动态行为向量表示提供给逻辑分布抽取模型，得到用户的行为逻辑向量表示，所述行为逻辑向量表示反映所述用户的行为逻辑分布。逻辑分布抽取单元1120的操作可以参考上面参照图1描述的块120的操作。

标签确定单元1130被配置为将行为逻辑向量表示提供给标签分类模型，确定用户的类别标签。标签确定单元1130的操作可以参考上面参照图1描述的块130的操作。

图12示出了根据本公开的第四实施例的用于使用类别识别模型来确定用户的类别标签的装置(下文中简称为“类别确定装置”)1200的方框图。如图12所示，类别确定装置1200可以包括数据获取单元1210、向量表示单元1220、逻辑分布抽取单元1230、级联单元1240和标签确定单元1250。

数据获取单元1210被配置为获取用户的动态行为数据和静态行为数据。数据获取单元120的操作可以参考上面参照图8描述的块810的操作。

向量表示单元1220被配置为对所获取的动态行为数据和静态行为数据进行向量化处理，以得到用户的动态行为向量表示和静态行为向量表示。向量表示单元1220的操作可以参考上面参照图8描述的块820的操作。

逻辑分布抽取单元1230被配置为将动态行为向量表示提供给逻辑分布抽取模型，以得到用户的行为逻辑向量表示。逻辑分布抽取单元1230的操作可以参考上面参照图8描述的块830的操作。

级联单元1240被配置为将所得到的行为逻辑向量表示和静态行为向量表示级联在一起。级联单元1240的操作可以参考上面参照图8描述的块840的操作。

标签确定单元1250被配置为将经过级联后的行为逻辑向量表示和静态行为向量表示提供给标签确定模型，确定用户的类别标签。标签确定单元1250的操作可以参考上面参照图8描述的块850的操作。

如上参照图1到图12，对根据本说明书的实施例的类别确定方法及类别确定装置进行描述。上面的类别确定装置可以采用硬件实现，也可以采用软件或者硬件和软件的组合来实现。

图13示出了根据本说明书的实施例的用于使用类别识别模型来确定用户的类别标签的电子设备1300的结构框图。

如图13所示，电子设备1300可以包括至少一个处理器1310、存储器(例如，非易失性存储器)1320、内存1330、通信接口1340以及内部总线1360，并且至少一个处理器1310、存储器1320、内存1330和通信接口1340经由总线1360连接在一起。该至少一个处理器1310执行在计算机可读存储介质中存储或编码的至少一个计算机可读指令(即，上述以软件形式实现的元素)。

在一个实施例中，在存储器中存储有计算机可执行指令，其当执行时使得至少一个处理器1310：对用户的动态行为数据进行向量化处理，以得到所述用户的动态行为向量表示；将所述动态行为向量表示提供给逻辑分布抽取模型，以得到所述用户的行为逻辑向量表示，所述行为逻辑向量表示反映所述用户的行为逻辑分布；以及将所述行为逻辑向量表示提供给标签分类模型，确定所述用户的类别标签。

应该理解的是，在存储器中存储的计算机可执行指令当执行时使得至少一个处理器1310执行在本说明书的各个实施例中如上结合图1-12描述的各种操作和功能。

在本说明书的实施例中，电子设备1300可以包括但不限于：个人计算机、服务器计算机、工作站、桌面型计算机、膝上型计算机、笔记本计算机、移动计算设备、智能电话、平板计算机、蜂窝电话、个人数字助理(PDA)、手持装置、可佩戴计算设备、消费电子设备等等。

根据一个实施例，提供了一种例如非暂时性机器可读介质的程序产品。非暂时性机器可读介质可以具有指令(即，上述以软件形式实现的元素)，该指令当被机器执行时，使得机器执行本说明书的各个实施例中如上结合图1-12描述的各种操作和功能。

具体地，可以提供配有可读存储介质的系统或者装置，在该可读存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码，且使该系统或者装置的计算机或处理器读出并执行存储在该可读存储介质中的指令。

在这种情况下，从可读介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能，因此机器可读代码和存储机器可读代码的可读存储介质构成了本发明的一部分。

可读存储介质的实施例包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RAM、DVD-RW、DVD-RW)、磁带、非易失性存储卡和ROM。可选择地，可以由通信网络从服务器计算机上或云上下载程序代码。

本领域技术人员应当理解，上面公开的各个实施例可以在不偏离发明实质的情况下做出各种变形和修改。因此，本发明的保护范围应当由所附的权利要求书来限定。

需要说明的是，上述各流程和各系统结构图中不是所有的步骤和单元都是必须的，可以根据实际的需要忽略某些步骤或单元。各步骤的执行顺序不是固定的，可以根据需要进行确定。上述各实施例中描述的装置结构可以是物理结构，也可以是逻辑结构，即，有些单元可能由同一物理实体实现，或者，有些单元可能分由多个物理实体实现，或者，可以由多个独立设备中的某些部件共同实现。

以上各实施例中，硬件单元或模块可以通过机械方式或电气方式实现。例如，一个硬件单元、模块或处理器可以包括永久性专用的电路或逻辑(如专门的处理器，FPGA或ASIC)来完成相应操作。硬件单元或处理器还可以包括可编程逻辑或电路(如通用处理器或其它可编程处理器)，可以由软件进行临时的设置以完成相应操作。具体实现方式(机械方式、或专用的永久性电路、或者临时设置的电路)可以基于成本和时间上的考虑来确定。

上面结合附图阐述的具体实施方式描述了示例性实施例，但并不表示可以实现的或者落入权利要求书的保护范围的所有实施例。在整个本说明书中使用的术语“示例性”意味着“用作示例、实例或例示”，并不意味着比其它实施例“优选”或“具有优势”。出于提供对所描述技术的理解的目的，具体实施方式包括具体细节。然而，可以在没有这些具体细节的情况下实施这些技术。在一些实例中，为了避免对所描述的实施例的概念造成难以理解，公知的结构和装置以框图形式示出。

本公开内容的上述描述被提供来使得本领域任何普通技术人员能够实现或者使用本公开内容。对于本领域普通技术人员来说，对本公开内容进行的各种修改是显而易见的，并且，也可以在不脱离本公开内容的保护范围的情况下，将本文所定义的一般性原理应用于其它变型。因此，本公开内容并不限于本文所描述的示例和设计，而是与符合本文公开的原理和新颖性特征的最广范围相一致。

Claims

1.一种用于使用类别识别模型来确定用户的类别标签的方法，所述类别识别模型包括逻辑分布抽取模型和标签分类模型，所述方法包括：

对用户的动态行为数据进行向量化处理，以得到所述用户的动态行为向量表示；

将所述动态行为向量表示提供给逻辑分布抽取模型，以得到所述用户的行为逻辑向量表示，所述行为逻辑向量表示反映所述用户的行为逻辑分布；以及

将所述行为逻辑向量表示提供给标签分类模型，确定所述用户的类别标签。

2.如权利要求1所述的方法，其中，所述动态行为数据包括指定时段内的行为序列数据。

3.如权利要求2所述的方法，其中，所述行为序列数据包括交易行为序列数据。

4.如权利要求1所述的方法，其中，对用户的动态行为数据进行向量化处理，以得到所述用户的动态行为向量表示包括：

对用户的动态行为数据和静态行为数据进行向量化处理，以得到所述用户的动态行为向量表示和静态行为向量表示；

将所述行为逻辑向量表示提供给标签分类模型，确定所述用户的类别标签包括：

将所述行为逻辑向量表示和所述静态行为向量表示提供给标签分类模型，确定所述用户的类别标签。

5.如权利要求4所述的方法，其中，将所述行为逻辑向量表示和所述静态行为向量表示提供给标签分类模型，确定所述用户的类别标签包括：

将所述行为逻辑向量表示和所述静态行为向量表示级联后提供给标签分类模型，确定所述用户的类别标签。

6.如权利要求4或5所述的方法，其中，所述静态行为数据包括历史类别标签数据、关系特征数据和用户属性数据中的至少一种。

7.如权利要求6所述的方法，其中，所述类别标签包括类罪标签，所述用户属性数据还包括高频高危地点数据和/或高频行为发生时间数据。

8.如权利要求1所述的方法，其中，所述逻辑分布抽取模型包括基于注意力机制的逻辑分布抽取模型。

9.如权利要求1所述的方法，其中，所述逻辑分布抽取模型和所述用户分类模型作为整体模型一起训练。

10.如权利要求1所述的方法，其中，用作所述逻辑分布抽取模型的训练样本数据的动态行为数据基于是否属于特定类别标签而被划分为第一行为序列数据和第二行为序列数据，以用于模型训练，所述第一行为序列数据包括具有特定类别标签的动态行为数据，所述第二行为序列数据包括不具有特定类别标签的动态行为数据。

11.一种用于使用类别识别模型来确定用户的类别标签的装置，所述类别识别模型包括逻辑分布抽取模型和标签分类模型，所述装置包括：

向量表示单元，对用户的动态行为数据进行向量化处理，以得到所述用户的动态行为向量表示；

逻辑分布抽取单元，将所述动态行为向量表示提供给逻辑分布抽取模型，得到所述用户的行为逻辑向量表示，所述行为逻辑向量表示反映所述用户的行为逻辑分布；以及

标签确定单元，将所述行为逻辑向量表示提供给标签分类模型，确定所述用户的类别标签。

12.如权利要求11所述的装置，其中，所述向量表示单元对所述用户的动态行为数据和静态行为数据进行向量化处理，以得到所述用户的动态行为向量表示和静态行为向量表示；

所述标签确定单元将所述行为逻辑向量表示和所述静态行为向量表示提供给标签分类模型，确定所述用户的类别标签。

13.如权利要求12所述的装置，还包括：

级联单元，将所述行为逻辑向量表示和所述静态行为向量表示级联，

所述标签确定单元将级联后的行为逻辑向量表示和静态行为向量表示提供给标签分类模型，确定所述用户的类别标签。

14.如权利要求12或13所述的装置，其中，所述静态行为数据包括历史类别标签数据、关系特征数据和用户属性数据中的至少一种。

15.如权利要求14所述的装置，其中，所述类别标签包括类罪标签，所述用户属性数据还包括高频高危地点数据和高频行为发生时间数据中的至少一种。

16.一种电子设备，包括：

一个或多个处理器，以及

与所述一个或多个处理器耦合的存储器，所述存储器存储指令，当所述指令被所述一个或多个处理器执行时，使得所述一个或多个处理器执行如权利要求1到10中任一项所述的方法。

17.一种机器可读存储介质，其存储有可执行指令，所述指令当被执行时使得所述机器执行如权利要求1到10中任一项所述的方法。