WO2021093368A1

WO2021093368A1 - 用户聚类及特征学习方法、设备、计算机可读介质

Info

Publication number: WO2021093368A1
Application number: PCT/CN2020/104002
Authority: WO
Inventors: 李怀松; 潘健民
Original assignee: 支付宝(杭州)信息技术有限公司
Priority date: 2019-11-14
Filing date: 2020-07-24
Publication date: 2021-05-20
Also published as: CN111062416B; TW202119254A; CN111062416A; TWI752485B

Abstract

本申请提供了一种用户聚类及特征学习方案，结合了聚类算法和深度学习网络中的编码解码模型，可以先基于用户的交易行为数据确定用户的交易行为序列，而后基于深度学习网络的编码器，将各个用户的交易行为序列进行编码，生成深度特征；在根据所述深度特征对用户进行聚类获取聚类结果的同时，基于深度学习网络的解码器，对所述深度特征进行解码，获得还原的交易行为序列；而后根据聚类结果和解码结果确定学习目标，并根据学习目标对所述深度学习网络的编码器和解码器的参数进行迭代调整，由此在完成聚类的同时，能够优化深度学习网络，以获得更好的、用于实现聚类的深度特征。

Description

用户聚类及特征学习方法、设备、计算机可读介质

技术领域

本申请涉及信息技术领域，尤其涉及一种用户聚类及特征学习方法、设备、计算机可读介质。

背景技术

随着互联网技术以及电子商务的发展，涌现了大量的电商平台，给消费者带来了便利。而电商平台中接入的用户数量也越来越多，虽然其中正常用户的数量一般占绝大多数，但其中也会隐藏一些实施非法行为的用户，此类用户会给电商平台以及使用电商平台的消费者带来风险。

为了能够识别出此类用户，目前常用的方式是使用聚类算法对所有用户进行划分，根据聚类结果了解风险客户的分布。而目前常用的聚类算法，如k均值聚类算法(K_means)、基于密度的噪声应用空间聚类算法(DBscan)等，虽然在一定数据集上有较好的表现，但是使用的聚类特征大都依赖人工的经验形成的，在数据集发生变化后其性能会显著降低，需要再次通过人工的方式重新确定聚类特征。

发明内容

本申请的一个目的是提供一种用户聚类及特征学习的方案，用以解决现有方案中无法在聚类的同时快速获得用于聚类的特征的问题。

本申请实施例提供了一种用户聚类及特征学习方法，该方法包括：获取用户的交易行为数据，并根据所述交易行为数据确定各个用户的交易行为序列，所述交易行为序列中的序列元素用于表示所述用户在一个时间窗口内的交易行为数据；基于深度学习网络的编码器，将各个用户的交易行为序列进行编码，生成深度特征；基于深度学习网络的解码器，对所述深度特征进行解码，获得还原的交易行为序列，并根据所述深度特征对用户进行聚类，获取聚类结果；根据所述深度学习网络的损失函数和聚类的目标函数确定学习目标，所述深度学习网络的损失函数根据还原的交易行为序列与原始的交易行为序列之间的差异信息确定，所述聚类的目标函数根据所述聚类结果确定；根据所述学习目标对所述深度学习网络的编码器和解码器的参数进行迭代调整，以使所述学习目标符合预设条件。

本申请实施例还提供了一种用户聚类及特征学习设备，该设备包括：数据获取模块，用于获取用户的交易行为数据，并根据所述交易行为数据确定各个用户的交易行为序列，所述交易行为序列中的序列元素用于表示所述用户在一个时间窗口内的交易行为数据；深度学习模块，用于基于深度学习网络的编码器，将各个用户的交易行为序列进行编码，生成深度特征；以及基于深度学习网络的解码器，对所述深度特征进行解码，获得还原的交易行为序列；聚类模块，用于根据所述深度特征对用户进行聚类，获取聚类结果；

迭代处理模块，用于根据所述深度学习网络的损失函数和聚类的目标函数确定学习目标，所述深度学习网络的损失函数根据还原的交易行为序列与原始的交易行为序列之间的差异信息确定，所述聚类的目标函数根据所述聚类结果确定；以及根据所述学习目标对所述深度学习网络的编码器和解码器的参数进行迭代调整，以使所述学习目标符合预设条件。

此外，本申请的一些实施例还提供了一种计算设备，该设备包括用于存储计算机程序指令的存储器和用于执行计算机程序指令的处理器，其中，当该计算机程序指令被该处理器执行时，触发所述用户聚类及特征学习方法。

本申请的另一些实施例还提供了一种计算机可读介质，其上存储有计算机程序指令，所述计算机可读指令可被处理器执行以实现所述用户聚类及特征学习方法。

本申请实施例提供的用户聚类及特征学习方案结合了聚类算法和深度学习网络中的编码解码模型，可以先基于用户的交易行为数据确定用户的交易行为序列，而后基于深度学习网络的编码器，将各个用户的交易行为序列进行编码，生成深度特征；在根据所述深度特征对用户进行聚类获取聚类结果的同时，基于深度学习网络的解码器，对所述深度特征进行解码，获得还原的交易行为序列；而后根据聚类结果和解码结果确定学习目标，并根据学习目标对所述深度学习网络的编码器和解码器的参数进行迭代调整，由此在完成聚类的同时，能够优化深度学习网络以获得更好的、用于实现聚类的深度特征。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显：

图1为本申请实施例提供的一种用户聚类及特征学习方法的处理流程图；

图2为本申请的实施例中进行解码和编码过程的处理原理图；

图3为本申请实施例提供的一种用户聚类及特征学习设备的结构示意图；

图4为本申请实施例提供的一种用于实现用户聚类及特征学习的计算设备的结构示意图；

附图中相同或相似的附图标记代表相同或相似的部件。

具体实施方式

下面结合附图对本申请作进一步详细描述。

在本申请一个典型的配置中，终端、服务网络的设备均包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体，可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的装置或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。

本申请实施例提供了一种用户聚类及特征学习方法，该方法结合了聚类算法和深度学习网络中的编码解码模型，能够根据聚类结果和解码结果确定学习目标，并根据学习目标对所述深度学习网络的编码器和解码器的参数进行迭代调整，由此在完成聚类的同时，能够优化深度学习网络以获得更好的、用于实现聚类的深度特征，从而解决现有方案中无法在聚类的同时快速获得用于聚类的特征的问题。

在实际场景中，该方法的执行主体可以是用户设备、网络设备或者用户设备与网络设备通过网络相集成所构成的设备，此外也可以是运行于上述设备中的程序。所述用户设备包括但不限于计算机、手机、平板电脑等各类终端设备；所述网络设备包括但不限于如网络主机、单个网络服务器、多个网络服务器集或基于云计算的计算机集合等实现。在此，云由基于云计算(Cloud Computing)的大量主机或网络服务器构成，其中，云计算是分布式计算的一种，由一群松散耦合的计算机集组成的一个虚拟计算机。

图1示出了本申请实施例提供的一种用户聚类及特征学习方法，该方法包括以下处理步骤S101至S106。

步骤S101，获取用户的交易行为数据，并根据所述交易行为数据确定各个用户的交易行为序列。

其中，所述用户的交易行为数据可以是任意能够反映出用户在交易过程中所实施的相关行为的数据。在本申请的一些实施例中，所述交易行为数据可以是用户在多个时间窗口所对应的多项交易行为信息，例如可以是连续几天内的交易金额、交易笔数、交易对象的数量、交易集中发生的时间段、交易对象的主要地域等。由于相似的用户之间，交易行为也会存在一定的相似性，例如都倾向于在每天同一时间段内进行交易，每天的交易笔数相似，每天的交易金额相似等，因此基于用户的交易行为数据作为输入数据，实现用户的聚类处理。

所述交易行为序列是基于用户的交易行为数据进行数据处理后，按照预设形式所呈现的数据内容。所述交易行为序列中的序列元素用于表示所述用户在一个时间窗口内的交易行为数据，每个时间窗口内的交易行为数据可以采用向量的形式表示。

例如，对于一个用户A而言，以一周为统计周期，其交易行为序列可以包含7天内的交易行为数据，若每个时间窗口设定为1天，则该用户A的交易行为序列包含7个序列元素{S _A1,S _A2,S _A3,S _A4,S _A5,S _A6,S _A7}，每个序列元素即为1天中的交易行为数据组成的向量。若本实施例中所采用的交易行为数据包括了时间窗口内的交易金额、交易笔数、交易对象的数量和交易集中发生的时间段这4项交易行为信息，则每个序列元素对应的交易行为数据的向量为[时间窗口内的交易金额，交易笔数，交易对象的数量，交易集中发生的时间段]。此时，所述交易行为序列可以表示为如下的矩阵：

其中，矩阵中的每一个行表示一个序列元素对应的向量，每一个行中的向量元素依次分别为时间窗口内的交易金额，交易笔数，交易对象的数量，交易集中发生的时间段，例如，矩阵中的第一行[10000,20,8,17]即为第一天的交易行为数据，交易金额为10000，交易笔数为20，交易对象的数量为8，交易集中发生的时间段为第17个小时，即16:00:00-17:00:00。

在本申请的一些实施例中，也可以将每个序列元素(即一个时间窗口内的交易行为数据组成的向量)进行嵌入(embedding)处理，即，将每个序列元素视为自然语言处理中的单词，进行类似词嵌入的操作，具体的处理方式如下。

首先，对数据集中所有用户的每个时间窗口的交易行为数据进行编码，例如，本申请实施例中数据集中所有用户的各个时间窗口中交易行为数据有2000种不同的情况，即序列元素对应的向量一共有2000种，此时可以将这2000种不同的序列元素映射为2000个N维的向量。其中，N为embedding时的嵌入维度数，可以根据实际情况设定，例如可以设定512、256等。由此，所有的2000个序列元素可以如表1的形式所示：

序列元素序号	维度1	维度2	维度3	……	维度N-1	维度N
0	0.33645	0.823	0.9238	……	0.7257	0.8446
1	0.54	0.701	0.957	……	0.4029	0.923
2	0.844	0.854	0.17	……	0.54029	0.7317
……	……	……	……	……	……	……
1998	0.029	0.364	0.4029	……	0.446	0.257
1999	0.23	0.6731	0.29	……	0.755	0.8462

表1

然后，可以根据每个用户实际包含的序列元素，将交易行为序列中的每个序列元素采用上述N维向量进行表示。例如，对于前述的用户A，其交易行为序列{S _A1,S _A2,S _A3,S _A4,S _A5,S _A6,S _A7}中的序列元素的序号分别为1、7、3、2、11、6、100。由此，进行嵌入处理后的交易行为序列可以表示为表2的形式：

排序位置	序列元素	维度1	维度2	维度3	……	维度N-1	维度N
1	S[1]	0.54	0.701	0.957	……	0.4029	0.923
2	S[7]	0.113	0.657	0.732	……	0.1001	0.255
3	S[3]	0.456	0.811	0.71	……	0.565	0.875
4	S[2]	0.844	0.854	0.17	……	0.54029	0.7317
5	S[11]	0.2315	0.2343	0.786	……	0.1234	0.25
6	S[6]	0.213	0.752	0.875	……	0.741	0.441
7	S[100]	0.23	0.6731	0.29	……	0.755	0.8462

表2

由此，前述用户A的交易行为序列在进行embedding处理之后，可以表示为如下的矩阵Matrix_A：

步骤S102，基于深度学习网络的编码器(Encoder)，将各个用户的交易行为序列进行编码，生成深度特征。

步骤S103，基于深度学习网络的解码器(Decoder)，对所述深度特征进行解码，获得还原的交易行为序列。

在本申请的实施例中，是利用基于编码解码模型(Encoder-Decoder)的深度学习网络来实现深度特征的学习。编码解码模型的原理在于：可以通过迭代的方式调整编码器和解码器的参数，在解码还原的输入内容与原始的输入内容之间的差异小到足够的程度时，可以认为编码获得的深度特征具有足够的区分样本的能力，此时通过这些深度特征进行聚类，可以获得较好的聚类效果。

为了能够更好地获取各个交易行为序列内部各个向量之间的关系，从而提取聚类性能更好的深度特征，在编码和解码过程中，可以采用多头注意力机制(Multi-head attention)。

在采用多头注意力机制时，由于相同序列元素在处于交易行为序列的不同排序位置时，会体现出不同的信息，因此可以对输入的数据进行位置编码(Positional encoding)，使得采用多头注意力机制的编码器能够获得更好的深度特征。由此，本申请一些实施例中，在基于深度学习网络的编码器，将每个用户的交易行为序列进行编码，生成深度特征时，可以先对用户的交易行为序列进行位置编码，确定序列元素在交易行为序列中的相对位置信息，而后再将携带有相对位置信息的交易行为序列，输入采用多头注意力机制的深度学习网络的编码器，获得深度特征。

进行位置编码时，其目的在交易行为序列中插入位置编码信息，使得序列元素在交易行为序列中的相对位置信息能够被确定。在本申请的一些实施例中，可以根据序列元素在交易行为序列中的排序位置和元素序列的维度，确定序列元素在交易行为序列中的相对位置信息。以前述embedding处理后的用户A交易行为序列为例，所述排序位置对应于时间窗口顺序，例如第2天的交易行为数据对应的序列元素S[7]，其排序位置为即为2，可以记为pos＝2，元素序列的维度，即为embedding处理时所映射的向量的维度N，若本实施例中为512，则可以记为d_model＝512，由此，位置编码信息可以表示为函数f(pos，i)，其中，i∈[1，2，3，4，…，d_model]。

由此，用户A的交易行为序列的位置编码信息可以如下表3所示：

排序位置	维度1	维度2	维度3	……	维度N-1	维度N
1	f(1,1)	f(1,2)	f(1,3)	……	f(1,N-1)	f(1,N)
2	f(2,1)	f(2,2)	f(2,3)	……	f(2,N-1)	f(2,N)
3	f(3,1)	f(3,2)	f(3,3)	……	f(3,N-1)	f(3,N)
4	f(4,1)	f(4,2)	f(4,3)	……	f(4,N-1)	f(4,N)
5	f(5,1)	f(5,2)	f(5,3)	……	f(5,N-1)	f(5,N)
6	f(6,1)	f(6,2)	f(6,3)	……	f(6,N-1)	f(6,N)
7	f(7,1)	f(7,2)	f(7,3)	……	f(7,N-1)	f(7,N)

表3

在实际场景中，确定位置编码信息时可以采用的三角函数，例如当i偶数时采用sin()函数，当i为奇数时采用cos()函数，此时位置信息可以由以下方式确定：

为偶数

为奇数

在获取到位置编码信息的具体数值之后，可以获得关于位置编码信息的矩阵 Matrix_P，该矩阵Matrix_P的维度与用户交易行为序列矩阵Matrix_A的维度相同，将两个矩阵相加之后即可获得包含位置编码信息的新矩阵Matrix_N＝Matrix_A+Matrix_P。该新矩阵Matrix_N中携带有序列元素在交易行为序列中的相对位置信息，可以输入采用多头注意力机制的深度学习网络的编码器，获得深度特征。

本申请实施例中，在基于深度学习网络的解码器，对所述深度特征进行解码，获得还原的交易行为序列时，也可以采用多头注意力机制。在解码过程中，首先将深度特征输入采用多头注意力机制的深度学习网络的解码器，获得还原的交易行为序列中的首个序列元素，而后进行迭代处理，将深度特征输入和前一次解码获得的序列元素，输入采用多头注意力机制的深度学习网络的解码器，还原的交易行为序列中的后续序列元素，直至解码获得完整的交易行为序列。

例如，本申请实施例中，用户A的交易行为序列在进行编码之后所获得深度特征表示为C，将该深度特征信息输入采用多头注意力机制的深度学习网络的解码器进行解码时，首先获得还原的交易行为序列中的首个序列元素，即S _A1'，而后进行迭代处理，将C和S _A1'作为解码器的输入，获得第二个序列元素S _A2'，直至获得所有交易行为序列中的所有序列元素。在本实施例中，后续序列元素可以表示为：S _j'＝f1(C,S _j-1')，其中，S _j'表示还原的第j个序列元素，即将前一次的输入右移一位之后作为本次的输入，f1()表示解码处理，

图2示出了本申请的实施例中进行解码和编码过程的处理原理。编码器的输入210为原始的交易行为序列，在输入编码器之前，需要进行位置编码220。

编码器230包括了多头注意力机制(Multi-head attention)层231，残差连接标准化(Add&norm)层232，前向反馈(Feed Forward)层233。首先，由Multi-head attention层231对三个输入Query、Key、Value做h次不同的投影，在编码器中Query＝Key＝Value，每次投影可以采用不同的线性变换，而后根据Query和Key计算权重系数，而后根据权重系数对Value进行加权求和，由此获得h个自注意力的结果，将这些结果拼接在一起，经过一个线性映射即可输出多头注意力机制的处理结果。Feed Forward层233对输入进行线性变换，其输入和输出的矩阵的维度是相同的，用于进一步优化学习深度特征。Add&norm层232用于解决深度学习中的退化问题，避免梯度消失，实际场景中可以对前一层的输出进行随机失活(dropout)处理之后，与前一层的原始输入进行叠加，而后对结果作标准化处理。Multi-head attention层231和Add&norm层232的输出均经过Add&norm层232的处理。

解码器240也包括了多头注意力机制(Multi-head attention)层241，残差连接标准化(Add&norm)层242，前向反馈(Feed Forward)层243。与编码器230中的区别在于，所述解码器240中Multi-head attention层241的输入与编码器230中不同，其中两个输入Key、Value即为编码器的输出结果，即深度特征，而另一输入250Query为还原的交易行为序列右移一位之后的序列元素，即解码器前一次的输出，并且也会进行位置编码。编码器中的Add&norm层242和Feed Forward层243与解码器中类似，此处不再赘述。此外，编码器还包括一线性(linear)层244，可以采用一全连接层，用于将输入进行映射，使其恢复到原始的交易行为序列的维度和大小，由此完成解码。

步骤S104，根据所述深度特征对用户进行聚类，获取聚类结果。其中，所述聚类算法可以选择基于层次密度的噪声应用空间聚类算法(HDBSCAN)、k均值聚类算法(K_means)、基于密度的噪声应用空间聚类算法(DBscan)、谱聚类(Spectral Clustering)算法等。由于HDBSCAN算法能将相似性很强的目标聚集在一起，且有层次结果，因此本申请的一些实施例中，可以采用基于层次密度的噪声应用空间聚类算法，根据所述深度特征对用户进行聚类，获取聚类结果。

在此，本领域技术人员应当理解，上述聚类的具体算法仅为举例，现有或今后出现的基于类似原理的其它形式如果能够适用于本申请，也应该包含在本申请的保护范围内，并以引用的形式包含于此。

步骤S105，根据所述深度学习网络的损失函数和聚类的目标函数确定学习目标。所述深度学习网络的损失函数Loss(Decoder)可以根据还原的交易行为序列与原始的交易行为序列之间的差异信息确定，例如，本申请实施例中，可以是还原的交易行为序列与原始的交易行为序列的平方差，具体可以采用如下的计算公式：

其中，所述x _i表示原始的交易行为序列中的第i个特征，x _pi表示还原的交易行为序列中的第i个特征，M表示交易行为序列中的特征总数。

而所述聚类的目标函数Object(聚类)根据所述聚类结果确定，例如，本申请实施例中，可以是聚类结果中各个类别对应的深度特征的标准差之和，其公开表示如下：

其中，λ为调整值，可以由用户根据实际场景预设设定，m为聚类处理后获得的类数量，std(C _j)为第j个类中深度特征的标准差，k为每个类中的序列的特征维度，f _i表示每个类中的第i维深度特征，std(f _i)表示某个类中第i维深度特征的标准差。

在本申请的一些实施例中，学习目标Object(total)可以是前述损失函数与目标函数之和，即Object(total)＝Loss(Decoder)+Object(聚类)。

步骤S106，根据所述学习目标对所述深度学习网络的编码器和解码器的参数进行迭代调整，以使所述学习目标符合预设条件。其中，所述预设条件可以是学习目标小于预设值，也可以是学习目标达到最小值，例如min：loss(Decoder)+Object(聚类)。

在本申请的一些实施例中，可以将学习目标符合预设条件时所获得的聚类结果以及深度特征，作为最终的输出内容，由此在完成聚类的同时，自动学习获得到合适的特征，而依赖人工的方式根据经验来得到。

基于同一发明构思，本申请实施例中还提供了一种用户聚类及特征学习设备，所述设备对应的方法是前述实施例中用户聚类及特征学习方法，并且其解决问题的原理与该方法相似。

本申请实施例提供了一种用户聚类及特征学习设备，该设备结合了聚类算法和深度学习网络中的编码解码模型，能够根据聚类结果和解码结果确定学习目标，并根据学习目标对所述深度学习网络的编码器和解码器的参数进行迭代调整，由此在完成聚类的同时，能够优化深度学习网络以获得更好的、用于实现聚类的深度特征，从而解决现有方案中无法在聚类的同时快速获得用于聚类的特征的问题。

在实际场景中，该设备的具体实现可以是用户设备、网络设备或者用户设备与网络设备通过网络相集成所构成的设备，此外也可以是运行于上述设备中的程序。所述用户设备包括但不限于计算机、手机、平板电脑等各类终端设备；所述网络设备包括但不限于如网络主机、单个网络服务器、多个网络服务器集或基于云计算的计算机集合等实现。在此，云由基于云计算(Cloud Computing)的大量主机或网络服务器构成，其中，云计算是分布式计算的一种，由一群松散耦合的计算机集组成的一个虚拟计算机。

图3示出了本申请实施例提供的一种用户聚类及特征学习设备，该设备包括数据获取模块310、深度学习模块320、聚类模块330和迭代处理模块340。其中，所述数据获取模块310用于获取用户的交易行为数据，并根据所述交易行为数据确定各个用户的交易行为序列。深度学习模块320用于基于深度学习网络的编码器，将各个用户的交易行为序列进行编码，生成深度特征；以及基于深度学习网络的解码器，对所述深度特征进行解码，获得还原的交易行为序列。聚类模块330用于根据所述深度特征对用户进行聚类，获取聚类结果。迭代处理模块340用于根据所述深度学习网络的损失函数和聚类的目标函数确定学习目标，以及根据所述学习目标对所述深度学习网络的编码器和解码器的参数进行迭代调整，以使所述学习目标符合预设条件。

在本申请的一些实施例中，也可以将每个序列元素(即一个时间窗口内的交易行为数据组成的向量)进行嵌入(embedding)处理，即，将每个序列元素视为自然语言处理中的单词，进行类似词嵌入的操作，具体的处理方式如下：

首先，对数据集中所有用户的每个时间窗口的交易行为数据进行编码，例如，本申请实施例中数据集中所有用户的各个时间窗口中交易行为数据有2000种不同的情况，即序列元素对应的向量一共有2000种，此时可以将这2000种不同的序列元素映射为2000个N维的向量。其中，N为embedding时的嵌入维度数，可以根据实际情况设定，例如可以设定512、256等。由此，所有的2000个序列元素可以如表1的形式所示。

然后，可以根据每个用户实际包含的序列元素，将交易行为序列中的每个序列元素采用上述N维向量进行表示。例如，对于前述的用户A，其交易行为序列{S _A1,S _A2,S _A3,S _A4,S _A5,S _A6,S _A7}中的序列元素的序号分别为1、7、3、2、11、6、100。由此，进行嵌入处理后的交易行为序列可以表示为表2的形式。

在本申请的实施例中，深度学习模块320是利用基于编码解码模型(Encoder-Decoder)的深度学习网络来实现深度特征的学习。编码解码模型的原理在于：可以通过迭代的方式调整编码器和解码器的参数，在解码还原的输入内容与原始的输入内容之间的差异小到足够的程度时，可以认为编码获得的深度特征具有足够的区分样本的能力，此时通过这些深度特征进行聚类，可以获得较好的聚类效果。

为了能够更好地获取各个交易行为序列内部各个向量之间的关系，从而提取聚类性能更好的深度特征，在编码和解码过程中，深度学习模块可以采用多头注意力机制(Multi-head attention)。

在采用多头注意力机制时，由于相同序列元素在处于交易行为序列的不同排序位置时，会体现出不同的信息，因此可以对输入的数据进行位置编码(Positional encoding)，使得采用多头注意力机制的编码器能够获得更好的深度特征。由此，本申请一些实施例中，在基于深度学习网络的编码器，将每个用户的交易行为序列进行编码，生成深度特征时，深度学习模块可以先对用户的交易行为序列进行位置编码，确定序列元素在交易行为序列中的相对位置信息，而后再将携带有相对位置信息的交易行为序列，输入采用多头注意力机制的深度学习网络的编码器，获得深度特征。

由此，用户A的交易行为序列的位置编码信息可以如下表3所示。

为偶数

为奇数

在获取到位置编码信息的具体数值之后，可以获得关于位置编码信息的矩阵Matrix_P，该矩阵Matrix_P的维度与用户交易行为序列矩阵Matrix_A的维度相同，将两个矩阵相加之后即可获得包含位置编码信息的新矩阵Matrix_N＝Matrix_A+Matrix_P。该新矩阵Matrix_N中携带有序列元素在交易行为序列中的相对位置信息，可以输入采用多头注意力机制的深度学习网络的编码器，获得深度特征。

本申请实施例中，在基于深度学习网络的解码器，对所述深度特征进行解码，获得还原的交易行为序列时，深度学习模块也可以采用多头注意力机制。在解码过程中，首先将深度特征输入采用多头注意力机制的深度学习网络的解码器，获得还原的交易行为序列中的首个序列元素，而后进行迭代处理，将深度特征输入和前一次解码获得的序列元素，输入采用多头注意力机制的深度学习网络的解码器，还原的交易行为序列中的后续序列元素，直至解码获得完整的交易行为序列。

聚类模块330所采用的聚类算法可以选择基于层次密度的噪声应用空间聚类算法(HDBSCAN)、k均值聚类算法(K_means)、基于密度的噪声应用空间聚类算法(DBscan)、谱聚类(Spectral Clustering)算法等。由于HDBSCAN算法能将相似性很强的目标聚集在一起，且有层次结果，因此本申请的一些实施例中，可以采用基于层次密度的噪声应用空间聚类算法，根据所述深度特征对用户进行聚类，获取聚类结果。

所述深度学习网络的损失函数Loss(Decoder)可以根据还原的交易行为序列与原始的交易行为序列之间的差异信息确定，例如，本申请实施例中，可以是还原的交易行为序列与原始的交易行为序列的平方差，具体可以采用如下的计算公式：

迭代处理模块340所采用的预设条件可以是学习目标小于预设值，如Object(total)＜L，也可以是学习目标达到最小值，如min：loss(Decoder)+Object(聚类)。

在本申请的一些实施例中，所述用户聚类及特征学习设备可以将学习目标符合预设条件时所获得的聚类结果以及深度特征，作为最终的输出内容，由此在完成聚类的同时，自动学习获得到合适的特征，而依赖人工的方式根据经验来得到。

综上所述，本申请实施例提供的用户聚类及特征学习方案，结合了聚类算法和深度学习网络中的编码解码模型，可以先基于用户的交易行为数据确定用户的交易行为序列，而后基于深度学习网络的编码器，将各个用户的交易行为序列进行编码，生成深度特征；在根据所述深度特征对用户进行聚类获取聚类结果的同时，基于深度学习网络的解码器，对所述深度特征进行解码，获得还原的交易行为序列；而后根据聚类结果和解码结果确定学习目标，并根据学习目标对所述深度学习网络的编码器和解码器的参数进行迭代调整，由此在完成聚类的同时，能够优化深度学习网络，以获得更好的、用于实现聚类的深度特征。

另外，本申请的一部分可被应用为计算机程序产品，例如计算机程序指令，当其被计算机执行时，通过该计算机的操作，可以调用或提供根据本申请的方法和/或技术方案。而调用本申请的方法的程序指令，可能被存储在固定的或可移动的记录介质中，和/或通过广播或其他信号承载媒体中的数据流而被传输，和/或被存储在根据程序指令运行的计算机设备的工作存储器中。在此，根据本申请的一些实施例包括一个如图4所示的计算设备，该设备包括存储有计算机可读指令的一个或多个存储器410和用于执行计算机可读指令的处理器420，其中，当该计算机可读指令被该处理器执行时，使得所述设备执行基于前述本申请的多个实施例的方法和/或技术方案。

此外，本申请的一些实施例还提供了一种计算机可读介质，其上存储有计算机程序指令，所述计算机可读指令可被处理器执行以实现前述本申请的多个实施例的方法和/或技术方案。

需要注意的是，本申请可在软件和/或软件与硬件的组合体中被实施，例如，可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一些实施例中，本申请的软件程序可以通过处理器执行以实现上文步骤或功能。同样地，本申请的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中，例如，RAM存储器，磁或光驱动器或软磁盘及类似设备。另外，本申请的一些步骤或功能可采用硬件来实现，例如，作为与处理器配合从而执行各个步骤或功能的电路。

对于本领域技术人员而言，显然本申请不限于上述示范性实施例的细节，而且在不背离本申请的精神或基本特征的情况下，能够以其他的具体形式实现本申请。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本申请的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外，显然“包括”一词不排除其他单元或步骤，单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。

Claims

一种用户聚类及特征学习方法，其中，该方法包括：

获取用户的交易行为数据，并根据所述交易行为数据确定各个用户的交易行为序列，所述交易行为序列中的序列元素用于表示所述用户在一个时间窗口内的交易行为数据；

基于深度学习网络的编码器，将各个用户的交易行为序列进行编码，生成深度特征；

基于深度学习网络的解码器，对所述深度特征进行解码，获得还原的交易行为序列，并根据所述深度特征对用户进行聚类，获取聚类结果；

根据所述深度学习网络的损失函数和聚类的目标函数确定学习目标，所述深度学习网络的损失函数根据还原的交易行为序列与原始的交易行为序列之间的差异信息确定，所述聚类的目标函数根据所述聚类结果确定；

根据所述学习目标对所述深度学习网络的编码器和解码器的参数进行迭代调整，以使所述学习目标符合预设条件。
根据权利要求1所述的方法，其中，基于深度学习网络的编码器，将每个用户的交易行为序列进行编码，生成深度特征，包括：

对用户的交易行为序列进行位置编码，确定序列元素在交易行为序列中的相对位置信息；

将携带有相对位置信息的交易行为序列，输入采用多头注意力机制的深度学习网络的编码器，获得深度特征。
根据权利要求2所述的方法，其中，基于深度学习网络的解码器，对所述深度特征进行解码，获得还原的交易行为序列，包括：

将深度特征输入采用多头注意力机制的深度学习网络的解码器，获得还原的交易行为序列中的首个序列元素；

将深度特征输入和前一次解码获得的序列元素，输入采用多头注意力机制的深度学习网络的解码器，还原的交易行为序列中的后续序列元素。
根据权利要求2所述的方法，其中，对用户的交易行为序列进行位置编码，确定序列元素在交易行为序列中的相对位置信息，包括：

根据序列元素在交易行为序列中的排序位置和元素序列的维度，确定序列元素在交易行为序列中的相对位置信息。
根据权利要求1所述的方法，其中，所述交易行为数据包括在多个时间窗口所对应的多项交易行为信息。
根据权利要求1所述的方法，其中，所述深度学习网络的损失函数为还原的交易行为序列与原始的交易行为序列的平方差。
根据权利要求1所述的方法，其中，所述聚类的目标函数为聚类结果中各个类别对应的深度特征的标准差之和。
根据权利要求1所述的方法，其中，根据所述深度特征对用户进行聚类，获取聚类结果，包括：

采用基于层次密度的噪声应用空间聚类算法，根据所述深度特征对用户进行聚类，获取聚类结果。
一种用户聚类及特征学习设备，其中，该设备包括：

数据获取模块，用于获取用户的交易行为数据，并根据所述交易行为数据确定各个用户的交易行为序列，所述交易行为序列中的序列元素用于表示所述用户在一个时间窗口内的交易行为数据；

深度学习模块，用于基于深度学习网络的编码器，将各个用户的交易行为序列进行编码，生成深度特征；以及基于深度学习网络的解码器，对所述深度特征进行解码，获得还原的交易行为序列；

聚类模块，用于根据所述深度特征对用户进行聚类，获取聚类结果；

迭代处理模块，用于根据所述深度学习网络的损失函数和聚类的目标函数确定学习目标，所述深度学习网络的损失函数根据还原的交易行为序列与原始的交易行为序列之间的差异信息确定，所述聚类的目标函数根据所述聚类结果确定；以及根据所述学习目标对所述深度学习网络的编码器和解码器的参数进行迭代调整，以使所述学习目标符合预设条件。
根据权利要求9所述的设备，其中，所述深度学习模块，用于对用户的交易行为序列进行位置编码，确定序列元素在交易行为序列中的相对位置信息；将携带有相对位置信息的交易行为序列，输入采用多头注意力机制的深度学习网络的编码器，获得深度特征。
根据权利要求10所述的设备，其中，所述深度学习模块，用于将深度特征输入采用多头注意力机制的深度学习网络的解码器，获得还原的交易行为序列中的首个序列元素；将深度特征输入和前一次解码获得的序列元素，输入采用多头注意力机制的深度学习网络的解码器，还原的交易行为序列中的后续序列元素。
根据权利要求10所述的设备，其中，所述深度学习模块，用于根据序列元素在交易行为序列中的排序位置和元素序列的维度，确定序列元素在交易行为序列中的相对位置信息。
根据权利要求9所述的设备，其中，所述交易行为数据包括在多个时间窗口所对应的多项交易行为信息。
根据权利要求9所述的设备，其中，所述深度学习网络的损失函数为还原的交易行为序列与原始的交易行为序列的平方差。
根据权利要求9所述的设备，其中，所述聚类的目标函数为聚类结果中各个类别对应的深度特征的标准差之和。
根据权利要求1所述的设备，其中，所述聚类模块，用于采用基于层次密度的噪声应用空间聚类算法，根据所述深度特征对用户进行聚类，获取聚类结果。
一种计算设备，其中，该设备包括用于存储计算机程序指令的存储器和用于执行计算机程序指令的处理器，其中，当该计算机程序指令被该处理器执行时，触发所述设备执行权利要求1至8中任一项所述的方法。
一种计算机可读介质，其上存储有计算机程序指令，所述计算机可读指令可被处理器执行以实现如权利要求1至8中任一项所述的方法。