CN115510318A

CN115510318A - 用户表征模型的训练方法、用户表征方法及装置

Info

Publication number: CN115510318A
Application number: CN202211158675.XA
Authority: CN
Inventors: 陶学文; 李少帅; 王斌锋; 刘爽; 刘小雷; 马琼旭
Original assignee: Zhejiang eCommerce Bank Co Ltd
Current assignee: Zhejiang eCommerce Bank Co Ltd
Priority date: 2022-09-22
Filing date: 2022-09-22
Publication date: 2022-12-23

Abstract

本说明书实施例提供用户表征模型的训练方法、用户表征方法及装置，其中所述用户表征模型的训练方法包括：获取多个用户的样本行为序列，其中，任一用户的样本行为序列包括该用户在不同时间的行为描述信息；根据述用户的样本行为序列，利用预设机器学习网络，获得各所述用户在不同时间的用户表征，并计算同一用户在不同时间的用户表征间的第一相似度、以及不同用户的用户表征间的第二相似度；基于第一相似度和第二相似度，对预设机器学习网络进行训练，直至达到训练停止条件，获得用户表征模型。通过该种方式训练得到的用户表征模型效果更好，确定的用户表征能够更加准确合理地表征用户属性。

Description

用户表征模型的训练方法、用户表征方法及装置

技术领域

本说明书实施例涉及机器学习技术领域，特别涉及一种用户表征模型的训练方法、用户表征方法。

背景技术

随着信息技术的发展，越来越多的用户服务都通过互联网等各种网络平台提供给用户，而用户在各种网络平台产生的行为能够在一定程度上反映用户的习惯、偏好等个人属性，因此，为了给用户带来更好的服务体验，可以基于用户的行为序列建模得到用户表征模型，根据该用户表征模型确定用户表征，以基于该用户表征为用户提供各项服务。

但通过目前的行为序列建模方式得到的用户表征模型，其仅能学习到用户的行为表征，导致确定的用户表征仅能表征用户的行为，无法准确地表征用户属性。因此，亟需一种训练方法来训练用户表征模型，使得该模型输出的用户表征能够准确地表征用户属性。

发明内容

有鉴于此，本说明书实施例提供了一种用户表征模型的训练方法。本说明书一个或者多个实施例同时涉及一种用户表征方法，一种用户表征模型的训练装置，一种用户表征装置，一种计算设备，一种计算机可读存储介质以及一种计算机程序，以解决现有技术中存在的技术缺陷。

根据本说明书实施例的第一方面，提供了一种用户表征模型的训练方法，包括：

获取多个用户的样本行为序列，其中，任一用户的样本行为序列包括该用户在不同时间的行为描述信息；

根据各所述用户的样本行为序列，利用预设机器学习网络，获得各所述用户在不同时间的用户表征，并计算同一用户在不同时间的用户表征间的第一相似度、以及不同用户的用户表征间的第二相似度；

基于所述第一相似度和第二相似度，对所述预设机器学习网络进行训练，直至达到训练停止条件，获得用户表征模型。

根据本说明书实施例的第二方面，提供了一种用户表征方法，包括：

获取目标用户的行为描述信息；

将所述行为描述信息输入用户表征模型，获得所述目标用户的用户表征，其中，所述用户表征模型通过上述第一方面所述的方法训练得到。

根据本说明书实施例的第三方面，提供了一种用户表征模型的训练装置，包括：

第一获取模块，被配置为获取多个用户的样本行为序列，其中，任一用户的样本行为序列包括该用户在不同时间的行为描述信息；

计算模块，被配置为根据各所述用户的样本行为序列，利用预设机器学习网络，获得各所述用户在不同时间的用户表征，并计算同一用户在不同时间的用户表征间的第一相似度、以及不同用户的用户表征间的第二相似度；

训练模块，被配置为基于所述第一相似度和第二相似度，对所述预设机器学习网络进行训练，直至达到训练停止条件，获得用户表征模型。

根据本说明书实施例的第四方面，提供了一种用户表征装置，包括：

第二获取模块，被配置为获取目标用户的行为描述信息；

获得模块，被配置为将所述行为描述信息输入用户表征模型，获得所述目标用户的用户表征，其中，所述用户表征模型通过上述第一方面所述的方法训练得到。

根据本说明书实施例的第五方面，提供了一种计算设备，包括：

存储器和处理器；

所述存储器用于存储计算机可执行指令，所述处理器用于执行所述计算机可执行指令，该计算机可执行指令被处理器执行时实现上述用户表征模型的训练方法或用户表征方法的步骤。

根据本说明书实施例的第六方面，提供了一种计算机可读存储介质，其存储有计算机可执行指令，该指令被处理器执行时实现上述用户表征模型的训练方法或用户表征方法的步骤。

根据本说明书实施例的第七方面，提供了一种计算机程序，其中，当所述计算机程序在计算机中执行时，令计算机执行上述用户表征模型的训练方法或用户表征方法的步骤。

本说明书一个实施例获取多个用户的样本行为序列，其中，任一用户的样本行为序列包括该用户在不同时间的行为描述信息；根据各所述用户的样本行为序列，利用预设机器学习网络，获得各所述用户在不同时间的用户表征，并计算同一用户在不同时间的用户表征间的第一相似度、以及不同用户的用户表征间的第二相似度；基于所述第一相似度和第二相似度，对所述预设机器学习网络进行训练，直至达到训练停止条件，获得用户表征模型。即在训练用户表征模型的过程中，根据样本行为序列确定用户表征之后，通过计算相同的用户在不同时间的用户表征之间的相似度，以及不同用户的用户表征之间的相似度来对用户表征模型的参数进行调整，使得该用户表征模型能够达到确定的相同用户在不同时间的用户表征比较接近，确定的不同用户的用户表征差距比较大的效果，因此，基于该用户表征模型确定的用户表征能够更加准确合理地表征用户属性，即训练得到的用户表征模型效果更好。

附图说明

图1是根据本说明书一个实施例提供的一种用户表征系统架构下用户表征模型的训练方法、用户表征方法的流程示意图；

图2是根据本说明书一个实施例提供的一种用户表征模型的训练方法的流程图；

图3是根据本说明书一个实施例提供的一种用户表征模型的训练方法的数据流向图；

图4是根据本说明书一个实施例提供的一种用户表征模型的训练方法的处理过程流程图；

图5是根据本说明书一个实施例提供的另一种用户表征模型的训练方法的数据流向图；

图6是根据本说明书一个实施例提供的一种用户表征方法的流程图；

图7是根据本说明书一个实施例提供的一种用户表征模型的训练装置的结构示意图；

图8是根据本说明书一个实施例提供的一种用户表征装置的结构示意图；

图9是根据本说明书一个实施例提供的一种计算设备的结构框图。

具体实施方式

在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本说明书内涵的情况下做类似推广，因此本说明书不受下面公开的具体实施的限制。

在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本说明书一个或多个实施例范围的情况下，第一也可以被称为第二，类似地，第二也可以被称为第一。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

首先，对本说明书一个或多个实施例涉及的名词术语进行解释。

行为序列：用户在App(Application，应用程序)或者网页平台上的点击、分享、评论、浏览等行为组成的序列。

embedding：在深度学习网络模型中常见的一个层，主要是用来处理稀疏特征的向量表示。它不但可以解决one-hot(独热编码)向量的长度问题，还可以将特征之间的相似性表征出来。

自监督学习：一种无监督学习方式，利用辅助任务(pretext)从大规模的无监督数据中挖掘自身的监督信息，通过这种构造的监督信息对网络进行训练，从而可以学习到对下游任务有价值的表征。

双曲空间：拥有负常曲率(constant negative curvature)的流形空间。

自注意力机制：自注意力机制是注意力机制的变体，其减少了对外部信息的依赖，更擅长捕捉数据或特征的内部相关性。自注意力机制在文本中的应用，主要是通过计算单词间的互相影响，来解决长距离依赖问题。

行为描述信息：用于描述用户行为的信息，可以是文本信息。

行为序列建模在很多场景下都发挥着重要的作用，如广告投放等。但目前大部分建模方案都是针对特定任务进行的，如DIN(Deep Interest Network，深度兴趣网络)、DIEN(Deep Interest Evolution Network，深度兴趣进化网络)等。这样针对特定任务的模型在各自的场景下虽然都能发挥比较的作用，但缺乏一定的通用性，频繁地设计和训练模型对人力和计算资源都是巨大的浪费。除此以外，随着时间推移，积累的数据越来越多，很多数据缺少标注信息，在单独某个场景中，大部分无标注数据无法得到有效使用。

目前较多项目线日常和大促中会频繁上线不同的活动(例如，日常活动2～3周上线一次，大促活动1～2月上线一次)，当前采用的方案是对每一个要上线的活动进行单独建模，长期面临两个问题：(1)小样本问题。很多活动上线时间较短(大促尤为明显)，需要在线上积累的少量数据上建模以提高项目效果；而行为特征作为营销特征的重要组成部分，往往具有行为较多、长尾分布严重等特点，直接用于小样本建模难以学习到其有效表征。(2)训练消耗资源大，对于每一个活动模型都从0到1训练，平均每个模型需要6～12小时。

PeterRec(预训练+迁移学习)方法提出了一种通用表征迁移的算法框架，利用迁移学习的方式来进行用户信息的跨域传播。确定的预训练模型重点仍然是对行为的表征，即基于该预训练模型确定的用户表征准确性较低，并且，对于新任务需要重新训练预训练模型，这样的方式无法做到将确定的用户表征在下游任务快速复用，仍然需要下游任务消耗不少存储和计算资源。

基于bert改造的方案，此类方案主要受启发于NLP(Natural LanguageProcessing，自然语言处理)领域的预训练，使用MaskLM(Masked Language Modeling，预测被掩盖的字或词)和NSP(Next Sentence Prediction，预测下一句)两种loss(损失)计算方法来进行自监督训练，得到用户表征。该类方案的缺点是损失的设计主要是根据行为表征来确定，实际关注的依然是对行为的表征是否准确，而不是对用户属性的表征。

SUMN是一种自监督训练方案，该方案是利用用户点击过的所有项目的文本数据进行建模，基于行为一致性假设，使用一定时段的文本数据表征来预测下一时段的文本数据。该种方法的缺点是使用文本表征的方式来定义行为，很难适用于其他场景，比如网商域中某些行为会包含金额这种dense(稠密)类数据，很难表征，且该方案重点关注的依然是对行为本身的表征，而不是对用户属性的表征。

为此，本说明书实施例提供了一种用户表征模型的训练方法，可以解决上述技术问题，其具体实现可以参见下述各个实施例的相关描述。

在本说明书中，提供了一种用户表征模型的训练方法，本说明书同时涉及一种用户表征方法，一种用户表征模型的训练装置，一种用户表征装置，一种计算设备，以及一种计算机可读存储介质，在下面的实施例中逐一进行详细说明。

参见图1，图1示出了根据本说明书一个实施例提供的一种用户表征系统架构下用户表征模型的训练方法、用户表征方法的流程示意图。

该系统可以包括训练端101和应用端102，该训练端101用于执行用户表征模型的训练方法，该应用端102用于执行用户表征方法，且该训练端101和应用端102可以集成于同一个计算设备中，也可以在相互独立的不同计算设备中，本申请实施例对此不作限定。

上述计算设备可以是终端，也可以是服务器，该终端可以是任何一种可与用户进行人机交互的电子产品，该服务器可以是一台服务器，也可以是由多台服务器组成的服务器集群，或者是一个云计算服务中心，本申请实施例对此不做限定。

在本说明书一个或多个实施例中，以计算设备是服务器，且训练端101和应用端102集成在相同的服务器中为例，对用户表征模型的训练方法和用户表征方法进行说明。

训练端101获取服务器中存储的多个用户的样本行为序列，其中，任一用户的样本行为序列包括该用户在不同时间的行为描述信息，将各用户的样本行为序列输入预设机器学习网络，获得各用户在不同时间的用户表征，计算同一用户在不同时间的用户表征间的第一相似度、以及不同用户的用户表征间的第二相似度，根据第一相似度和第二相似度，对预设机器学习网络进行训练，直至达到训练停止条件，获得用户表征模型，再将用户表征模型发送至应用端102。

应用端102接收到用户表征模型后进行存储，在应用时，获取到服务器中存储的目标用户的行为描述信息后，将行为描述信息输入用户表征模型，便可获得该目标用户的用户表征。

需要说明的是，训练端还可以从已有的历史行为库中获取多个用户的样本行为序列，应用端还可以从终端中获取目标用户的行为描述信息，本申请实施例对此不做限定。

应用于本说明书实施例的方案，在训练用户表征模型的过程中，根据样本行为序列确定用户表征之后，通过计算相同的用户在不同时间的用户表征之间的相似度，以及不同用户的用户表征之间的相似度来对用户表征模型的参数进行调整，使得该用户表征模型能够达到确定的相同用户在不同时间的用户表征比较接近，确定的不同用户的用户表征差距比较大的效果，即训练得到的用户表征模型的表征效果更好，因此，基于该用户表征模型确定的目标用户的用户表征，能够得到更加准确合理地表征用户属性。

参见图2，图2示出了根据本说明书一个实施例提供的一种用户表征模型的训练方法的流程图，具体包括以下步骤。

步骤202：获取多个用户的样本行为序列，其中，任一用户的样本行为序列包括该用户在不同时间的行为描述信息。

在本说明书一些实施例中，任一用户的样本行为序列是该用户的行为描述信息的集合，且在该集合中行为描述信息按照其表征的行为发生的时间点进行排列的。并且，用户的行为描述信息可以是用户在任何APP的任何项目中执行的操作产生的信息。

需要说明的是，本说明书实施例所涉及的与用户相关的信息(包括但不限于用户的行为描述信息)和与用户相关的数据，均为经用户授权或者经过各方充分授权的信息和数据。

其中，行为描述信息是用于描述用户行为的信息，可以是文本信息(如一段文字)。并且，行为描述信息可以包括其描述的行为针对的对象、行为发生的时间点、行为产生的结果等。或者，行为描述信息中不包括行为发生的时间点，但行为描述信息可以携带时间标记。例如，行为描述信息可以是“用户在19：26购买了商品A”、“用户在项目A申购了数量为n的资源”等等。

在一些实施例中，行为描述信息表征的是用户在软件、应用程序、网页等为用户提供服务的平台中执行操作产生的行为，因此，行为描述信息可以从用户使用的这些平台的后台服务器中获取，也可以从承载这些平台的终端中获取，还可以从已有的历史行为库中获取，本申请实施例对此不做限定。

并且，在用户执行操作产生行为之后，将行为描述信息存储至后台服务器、终端和历史行为库的过程中，可以按照行为发生的时间点对行为描述信息进行排序，因此，在获取样本行为序列时不需要对行为描述信息进行排序，能够快速获取到样本行为序列。

在本说明书一个或多个实施例中，对用户表征模型进行训练之前，需要获取到训练样本(多个用户的样本行为序列)，以为模型训练提供数据支持。

步骤204：根据各用户的样本行为序列，利用预设机器学习网络，获得各用户在不同时间的用户表征，并计算同一用户在不同时间的用户表征间的第一相似度、以及不同用户的用户表征间的第二相似度。

在本说明书实施例中，获取到多个用户的样本行为序列后，基于该样本行为序列对预设机器学习网络进行训练，以得到用户表征模型，且在训练过程中需要调整模型参数，以使得该模型输出的用户表征对用户的表征效果更好。因此，可以将用户的样本行为序列输入预设机器学习网络，得到各用户在不同时间的用户表征，且对于同一个用户确定的用户表征应该是比较接近的，而不同的用户确定的用户表征应该是差距较大的，因此，还可以计算同一个用户在不同时间的用户表征间的第一相似度、以及不同用户的用户表征间的第二相似度。

在本说明书一个或多个实施例中，根据各用户的样本行为序列，利用预设机器学习网络，获得各用户在不同时间的用户表征的具体实现可以包括：

利用预设机器学习网络，基于第一用户的样本行为序列中的各行为描述信息，获得第一用户对应的行为表征序列，其中，第一用户是多个用户中的任一个；

根据行为表征序列，确定第一用户在不同时间的用户表征。

也就是说，对于多个用户中的任一用户，可以基于该用户的样本行为序列中的各行为描述信息，确定该用户对应的行为表征序列，且由于要根据用户在不同时间的用户表征对用户表征模型的性能进行验证，因此，可以根据行为表征序列确定该用户在不同时间的用户表征，基于此可以确定多个用户中各个用户在不同时间的用户表征。

作为一种示例，行为表征序列包括多个行为表征，一个行为表征与一个行为描述信息对应，多个行为表征在行为表征序列中按照其对应的行为描述信息在样本行为序列中的顺序排列。

在本说明书一种可能的实现方式中，针对第一用户的样本行为序列中的任一行为描述信息，可以对该行为描述信息中的多个字符进行编码或向量化处理，然后将多个字符的处理结果进行拼接或求和，得到该行为描述信息的行为表征，对该样本行为序列中的各个行为描述信息均采用上述编码方式之后，可以确定样本行为序列中各个行为描述信息的行为表征，按照多个行为描述信息在样本行为序列中的排序，将多个行为描述信息的行为表征进行拼接，得到该样本行为序列的行为表征序列，即该第一用户对应的行为表征序列。在该种方式中，直接将行为表征确定为用户表征，能够提高确定用户表征的效率。

需要说明的是，可以采用one-hot、word2vec等编码方式对行为描述信息中的字符进行编码处理，本申请实施例对此不做限定。

在本说明书另一种可能的实现方式中，可以从行为描述信息中提取关键词，然后对关键词进行编码或向量化处理，将处理结果进行拼接或求和，可以得到该行为描述信息的行为表征，将各行为描述信息的行为表征进行拼接，可以得到第一用户对应的行为表征序列。该种实现方式能够将对行为表征没有帮助或者可能影响行为表征准确性的无用词过滤掉，不仅降低了编码的工作量，提高了确定行为表征的效率，还提高了确定的行为表征的准确性。

作为一种示例，确定行为表征序列后，由于行为表征序列包括多个行为表征，一个行为表征对应一个行为描述信息，一个行为描述信息描述一个行为，一个行为定然对应一个该行为发生的时间，因此，行为表征序列可以理解为是用户在不同时间的行为表征，可以分别将第一用户在不同时间的行为表征确定为第一用户在不同时间的用户表征。例如，假设样本行为序列包括第一用户在9：00,12：00，18:30，20:00产生的行为的行为描述信息，则可以确定第一用户分别在9：00,12：00，18:30和20:00的用户表征。

在本说明书实施例中，根据样本行为序列中的各行为描述信息的关键词，确定各行为描述信息的行为表征，即可得到用户在不同时间的行为表征，然后将不同时间的行为表征序列确定为用户在不同时间的用户表征，能够快速准确地确定用户在不同时间的用户表征。

在本说明书另一种可能的实现方式中，预设机器学习网络可以包括特征提取层；在该种情况下，利用预设机器学习网络，基于第一用户的样本行为序列中的各行为描述信息，获得第一用户对应的行为表征序列的具体实现可以包括：

利用特征提取层，对第一用户的样本行为序列中的各行为描述信息进行特征提取，获得第一用户对应的初始行为表征序列，其中，初始行为表征序列中包括各行为描述信息对应的初始行为表征；

确定第一行为描述信息与第二行为描述信息间的时间间隔，获得时间间隔的时间表征，其中，第一行为描述信息是样本行为序列中的任一个，第二行为描述信息是样本行为序列中与第一行为描述信息时间相邻的一个；

对时间表征和第一行为描述信息对应的初始行为表征进行融合，获得第一行为描述信息对应的行为表征；

基于各行为描述信息对应的行为表征，获得第一用户对应的行为表征序列。

也就是说，对于多个用户中的第一用户，可以将第一用户的样本行为序列输入预设机器学习网络的特征提取层，利用特征提取层对样本行为序列中的各行为描述信息进行特征提取，得到各行为描述信息的初始行为表征。由于有些行为间隔比较短的时间被执行和间隔比较长的时间被执行，反映出来的用户属性可能差距较大甚至相反，因此，可以将时间间隔这一特征融合到初始行为表征中，得到各行为描述信息对应的行为表征，进而得到用户对应的行为表征序列。

在本说明书一些实施例中，特征提取层可以是机器学习网络中具备特征提取能力的任意网络层，用于将输入映射到向量空间得到输出。该特征提取层可以是embedding层、嵌入层、编码层等，本申请实施例对此不做限定。将样本行为序列输入特征提取层后，针对样本行为序列中的任一行为描述信息，可以先对该行为描述信息进行分词处理，得到多个字符，然后将多个字符中的无用词过滤掉，对过滤后剩余的字符进行编码或向量化处理，可以得到剩余各个字符的表征，将剩余各个字符的表征拼接或相加，可以得到该行为描述信息的初始行为表征。

但在实际应用中，示例性地，在电商广告场景中，行为之间的时间间隔往往可以忽略，因为用户对于此类平台的访问频率比较高，行为之间的时间间隔虽然不同，但差别不大，对用户属性的表征并没有很大影响。但是在金融场景，同样的两个行为，这两个行为间隔1天和间隔1个月，是有很大不同的，如项目A申购和项目A赎回这两个行为，用户a在1月1日在项目A申购了资源x，在1月2日在项目A赎回了资源x，用户b在1月1日在项目A申购了资源y，在2月1日在项目A赎回了资源y,如果不考虑时间间隔，机器学习网络可能会学习到用户A与用户B的属性相似，但实际上，间隔1天赎回资源和间隔1个月赎回资源是完全不同的两种习惯，即用户A与用户B的金融习惯可能是完全相反的，如此就会导致确定的用户表征可能不准确，因此，可以在确定行为表征时考虑到行为之间的时间间隔。

在本说明书一些实施例中，第二描述信息可以是与第一描述信息时间相邻的前一个行为描述信息，则第一描述信息不是样本行为序列中的第一个，第二描述信息也可以是与第一描述信息时间相邻的后一个，则第一描述信息可以是样本行为序列中的任一个。并且，行为描述信息中可以包括其描述的行为发生的时间点。因此，对于样本行为序列中的第一行为描述信息，可以先根据第一行为描述信息中的时间点和第二行为描述信息中的时间点，确定第一行为描述信息与第二行为描述信息之间的时间间隔，然后对时间间隔进行编码或向量化处理，得到时间间隔的时间表征，将该时间表征与第一行为描述信息对应的初始行为表征相加，得到第一行为描述信息对应的行为表征，通过上述方式可以确定各行为描述信息对应的行为表征，将各行为描述信息对应的行为表征进行拼接，可以得到第一用户对应的行为表征序列。

作为一种示例，可以预先设置基础时间编码(base embedding)，再获取时间间隔后，对时间间隔进行归一化处理，将归一化后的时间间隔与基础时间编码的乘积确定为该时间间隔的时间表征，然后将时间表征与第一行为描述信息的初始行为表征相加，得到第一行为描述信息的行为表征。

作为一种示例，由于维度不同的向量相加可能会出错，因此，将时间表征与第一行为描述信息的初始行为表征相加之前，可以将时间表征与该初始行为表征调整为维度相同的表征，然后将对应位置的特征值相加，得到行为表征。

示例性地，以基础时间编码是时间间隔1天对应的时间编码，且基础时间编码是10维向量，若时间间隔为5天，则用5乘以该基础时间编码，可以确定时间间隔为5天的时间表征(10维向量)，假设第一行为描述信息的初始行为表征是12维向量，则可以对初始行为表征进行采样处理，得到用10维向量表示的初始行为表征，将两个10维向量相加，可以得到第一行为描述信息的行为表征。

例如，假设第一行为描述信息是“用户在生鲜超市支出1k”，其上一行为描述信息即第二行为描述信息是“用户在银行卡存储10k”，且这两个行为间隔时间是10天，预设时间编码是base embedding，将间隔时间归一化后乘以该base embedding得到时间间隔10天的时间表征，将该时间表征与第一行为描述信息的初始行为表征相加，则可以得到“用户在生鲜超市支出1k”这一行为的行为表征。

在本说明书一个或多个实施例中，先通过特征提取层对行为描述信息进行特征提取，得到初始行为表征，然后将各个行为描述信息与相邻的行为描述信息之间的时间间隔融合至初始行为表征，得到各行为描述信息的行为表征，实现了在行为表征中有效表示时间间隔的效果，且结合行为之间的时间间隔来确定行为表征，则得到的行为表征能够表示用户在不同情况下的习惯或喜好，即得到的行为表征能够更加准确的表征用户属性，提高了确定行为表征的准确性。

在本说明书另一些实施例中，利用特征提取层，对第一用户的样本行为序列中的各行为描述信息进行特征提取，获得第一用户对应的初始行为表征序列的具体实现可以包括：

提取第一行为描述信息中的数字字符；

对数字字符进行离散化处理，得到数字字符的初始表征，并对非数字字符进行编码，得到非数字字符的初始表征；

基于数字字符和非数字字符的初始表征，确定第一行为描述信息对应的初始行为表征；

基于各行为描述信息对应的初始行为表征，获得第一用户对应的初始行为表征序列。

在本说明书一个或多个实施例中，由于数字字符是连续性的，无法直接进行编码或向量化处理，因此，可以对第一行为描述信息中的数字字符进行离散化处理，得到数字字符的初始表征，而对于非数字字符，可以直接编码得到初始表征，再将数字字符和非数字字符的初始表征拼接或相加，则可以得到第一行为描述信息的初始行为表征，再将各行为描述信息对应的初始行为表征按照行为描述信息在样本行为序列中的排列顺序进行拼接，可以得到第一用户对应的初始行为表征序列。

在一些实施例中，将第一用户的样本行为序列输入特征提取层之后，可以基于预设关键词库从行为描述信息中提取关键词，且对于行为描述信息中的数字，可以直接确定为关键词，然后对关键词中的数字字符进行离散化处理，对关键词中的非数字字符进行编码处理，得到行为描述信息的初始行为表征。其中，预设关键词库可以是预先设置的包括关键词的词库，其中的关键词是根据经验确定的。

作为一种示例，对数字字符进行离散化处理可以是先对数字字符进行对数运算，然后对对数运算的结果取整，再对取整后的结果进行向量化处理，得到数字字符的初始特征。例如，假设数字字符是12.34，离散化处理的结果是round(log12.34),round()表示对括号中的数字进行四舍五入取整得到结果，对该结果进行向量化处理，便可以得到数字字符的初始表征。对非数字字符进行编码处理，可以采用one-hot或word2vec的编码方式来实现。

示例性地，假设行为描述信息是“用户在项目A中申购了10k”，可以提取到关键词包括“项目A”、“申购”和“10k”，可以先简单编码为“项目A×申购×log round(12.34)”，然后将该三个关键词分别映射到向量空间，得到每个关键词的初始表征，将该三个关键词的初始表征进行拼接或求和，可以得到该行为描述信息的初始行为表征。

在本说明书一个或多个实施例中，由于有些领域包括一些独有的行为，这些独有的行为中会存在数字这种稠密数据，对于这种稠密数据，需要先进行离散化处理，然后对处理结果进行embedding映射，根据数据字符的embedding映射(初始表征)和非数字字符的embedding映射(初始表征)，可以确定行为描述信息的行为表征。因此，通过该种方式能够对各个场景或领域中的行为进行处理，基于此得到的模型能够适用于各个场景，降低了模型的局限性，使得模型应用更加广泛。例如，金融领域会包含金额这种dense类数据，通过本方案可以将这类数据映射为向量表征。

在上述实现中，根据样本行为序列确定行为表征序列后，将不同时间的行为序列确定为用户在不同时间的用户表征。但在实际应用中，为了使得确定的用户表征更加准确合理，可以根据用户一段时间的行为表征确定用户的用户表征。也即是，在根据行为表征序列，确定第一用户在不同时间的用户表征之后，还包括：对第一用户在预设时间段内对应的用户表征进行融合，得到第一用户在预设时间段的用户表征。

其中，预设时间段可以根据实际需求设置，也可以由计算设备默认设置，本申请实施例对此不做限定。例如，预设时间段是1个月、1天、10天等。

在本说明书一些实施例中，可以获取第一用户在多个历史时间段的样本行为序列，然后将第一用户在预设时间段内对应的用户表征相加或求和取平均，得到第一用户在预设时间段的用户表征。

示例性地，获取用户A多个月的样本行为序列，确定样本行为序列中各个行为描述信息的行为表征，以一个月为预设时间段，将同一个月内行为描述信息的行为表征进行融合，得到用户A基于该月的行为确定的用户表征。

在本说明书一个或多个实施例中，确定用户在不同时间的用户表征之后，可以将预设时间段内的用户表征融合，得到用户在预设时间段的用户表征，该用户表征融合了较多的行为表征，准确性更高，能够更好的表征用户。

在本说明书另一些实施例中，对第一用户在预设时间段内对应的用户表征进行融合，得到第一用户在预设时间段的用户表征的具体实现可以包括：对第一用户在预设时间段内对应的用户表征进行自注意力计算，得到第一用户在预设时间段的用户表征。

也就是说，可以通过自注意力机制对预设时间段内的各用户表征进行自注意力计算，将多个用户表征融合在一起用一个用户表征表示，则该用户表征就是第一用户在预设时间段的用户表征。

作为一种示例，用户表征模型还包括自注意力层，将第一用户在预设时间段内对应的用户表征输入自注意力层进行自注意力计算，可以得到各用户表征对应的输出，且各用户表征对应的输出不仅能够表征自身对应的行为还能够表征其他行为，可以从多个输出中随机确定一个作为预设时间段的用户表征，或者，可以将多个输出中排序最后一个的输出确定为预设时间段的用户表征，或者，可以对多个输出进行处理得到预设时间段的用户表征。其中，对多个输出进行处理可以包括求和或取平均。

示例性地，假设预设时间段是1月2日这一天，在预设时间段内包括10个行为，则预设时间段内对应有10个用户表征，将该10个用户表征输入自注意力层进行自注意力计算，得到10个新的表征，可以从10个新的表征中随机确定一个作为1月2日用户的用户表征，或者，可以将10个新的表征求和或取平均作为1月2日用户的用户表征，或者，将第10个新的表征作为1月2日用户的用户表征。

需要说明的是，各用户表征中的时间表征可以作为自注意力层中的positionembedding(位置特征)参与自注意力运算。

在本说明书一个或多个实施例中，通过自注意力计算的方式捕捉不同时间的用户表征之间的相关性，可以得到预设时间段内表征效果更好的用户表征。

在本说明书又一些实施例中，第一用户在预设时间段内对应的用户表征符合预设分布规律，在该种情况下，需要采用特殊的方式对用户表征进行处理。因此，对第一用户在预设时间段内对应的用户表征进行自注意力计算，得到第一用户在预设时间段的用户表征的具体实现可以包括：

将第一用户在预设时间段内对应的用户表征映射至预设分布规律对应的目标数据空间，得到第一用户在预设时间段内对应的各增强用户表征；对第一用户在预设时间段内对应的各增强用户表征进行自注意力计算，得到第一用户在预设时间段的用户表征。

其中，预设分布规律可以是幂律分布规律，目标数据空间可以是任何能够处理符合幂律分布规律的数据的空间，例如，目标数据空间可以是双曲空间。第一用户在预设时间段内对应的用户表征符合预设分布规律可以理解为第一用户在预设时间段内的行为符合预设分布规律。

也就是说，若第一用户在预设时间段内对应的用户表征符合预设分布规律，在对预设时间段内各用户表征进行自注意力计算之前，需要先将用户表征映射至预设分布规律对应的目标数据空间，得到增强用户表征，对该增强用户表征进行自注意力计算，得到第一用户在预设时间段的用户表征。

作为一种示例，可以将预设时间段内对应的用户表征映射至双曲空间，由于双曲空间相对于其他空间来说，能够更好地对符合幂律分布规律的数据进行表征，且双曲空间能够表征数据之间的层次信息，在本方案中，层次信息可以理解为行为的执行次数，即映射至双曲空间后得到的增强用户表征比映射之前的用户表征增加了在层次信息方面的表征，能够表征行为的执行次数，则能够更好地表征用户属性，再将各增强用户表征输入自注意力层进行自注意力计算，可以得到第一用户在预设时间段的用户表征，该用户表征能够更好地表征用户属性。

或者说，将多个用户的样本行为序列作为一个整体来看，用户的行为呈现幂律分布的规律，即有小部分的行为被大部分用户执行，有大部分的行为仅被小部分的用户执行。在该种情况下，本方案中确定行为描述信息的行为表征之后，可以将行为表征均映射至双曲空间，然后再进行自注意力计算，得到用户在预设时间段的用户表征。

在本说明书一个或多个实施例中，对于呈现幂律分布规律的用户表征先映射至双曲空间得到增强用户表征，再基于增强用户表征进行自注意力计算得到预设时间段的用户表征，由于双曲空间对呈现幂律分布规律的数据能够更好地表征，映射后的结果能够表征更多的信息，因此，映射至双曲空间后再确定预设时间段的用户表征，能够得到更加准确、鲁棒性更高用户表征。

在本说明书一个或多个实施例中，确定用户在不同时间或预设时间段的用户表征之后，可以计算相同的用户在不同时间或不同预设时间段的用户表征之间的第一相似度，以及不同用户之间的第二相似度，以便基于第一相似度和第二相似度对机器学习网络的参数进行调整。

在本步骤中，将样本行为序列输入预设机器学习网络，先经过特征提取层提取行为描述信息的行为表征，然后将预设时间段内的各行为表征映射至双曲空间，得到增强行为表征，通过自注意力层对各增强行为表征进行自注意力计算，得到用户在预设时间段的用户表征，则该用户表征准确性更高，能够更好地对用户属性进行表征，然后计算同一用户在不同时间的用户表征间的第一相似度、以及不同用户的用户表征间的第二相似度，通过学习用户之间的关系，使得预设机器学习网络最终能够达到，确定的相同用户的用户表征之间的相似度很高、以及确定的不同用户的用户表征之间的相似度很低，如此训练得到的用户表征模型在应用时得到的用户表征能够更好地表征用户属性。

步骤206：基于第一相似度和第二相似度，对预设机器学习网络进行训练，直至达到训练停止条件，获得用户表征模型。

在本说明书一些实施例中，可以根据第一相似度和第二相似度确定损失值，然后根据损失值对预设机器学习网络进行训练，直至达到训练停止条件。若第一相似度越大，第二相似度越小则损失值越小，那么训练停止条件可以是损失值小于预设损失阈值。或者，训练停止条件还可以是训练次数达到预设次数阈值。其中，预设损失阈值和预设次数阈值均可以是根据实际情况设置的，也可以是计算设备默认设置的，本申请实施例对此不做限定。

作为一种示例，针对第一用户，可以确定第一用户在两个不同时间的用户表征间的第一相似度，确定第一用户与其他用户的用户表征间的第二相似度，然后根据该第一相似度和多个第二相似度确定损失值，针对各个用户进行相同的操作后可以得到多个损失值，然后根据多个损失值之和对预设机器学习网络进行训练，直到达到训练停止条件。

示例性地，由于训练用户表征模型的目的是让用户表征模型对相同用户的表征表示地比较接近，因此，第二相似度可以是第一用户与其他用户在相同时间的用户表征间的相似度，也可以是在不同时间的用户表征间的相似度。

在本说明书一个或多个实施例中，计算同一用户在不同时间的用户表征间的第一相似度、以及不同用户的用户表征间的第二相似度，包括：

根据第一用户在任两个不同时间的用户表征，计算第一用户在时间维度的第一用户表征差信息，获得第一相似度，其中，第一用户为多个用户中的任一个；根据各用户的用户表征，计算第一用户与其他各用户在空间维度的第二用户表征差信息，获得第二相似度。

在该种情况下，基于第一相似度和第二相似度，对预设机器学习网络进行训练的具体实现可以包括：

基于第一相似度与第二相似度的比值，计算损失值；基于损失值对预设机器学习网络进行训练。

在一些实施例中，第一用户在时间维度的第一用户表征差信息可以是第一用户在两个不同时间的用户表征之间的相似度，也可以是平滑处理后的相似度。第一用户与其他各用户在空间维度的第二用户表征信息可以是第一用户与其他各用户在相同时间或不同时间的用户表征之间的相似度，也可以是平滑处理后的相似度。

在一些实施例中，损失值可以是第一相似度除以第二相似度的商，也可以是第二相似度除以第一相似度的商。

作为一种示例，以损失值是第一相似度除以第二相似度的商为例，可以通过如下公式(1)对损失值进行计算：

在公式(1)中，loss_i表示以第i个用户对应的损失值，z_i和z_i+分别表示第i个用户在两个不同时间的用户表征，S(a,b)表示a和b的相似度，z_j表示第j个用户的用户表征，k表示多个用户的数量，τ表示温度系数，是预先设置的超参数。

并且，温度系数τ能够控制模型对负样本的区分度，会影响用户表征模型的效果，温度系数设置的越大，用户表征的分布就会越平滑，那么模型就会对所有的负样本(本应该距离很远但通过模型确定的用户表征却很近的不同用户)一视同仁，导致模型学习没有重点，学习效果不好，温度系数设置的越小，模型就会越关注特困难的负样本，但其实那些负样本有可能是潜在的正样本，这样会导致模型很难收敛或者泛化能力差，因此对温度系数的设置不能过大也不能过小。

作为一种示例，分别以各个用户为第一用户，可以确定多个损失值，再将多个损失值进行加权求和或求平均，可以确定损失值。

需要说明的是，可以分批次输入样本行为序列对预设机器学习网络进行训练，基于同一批次多个用户的用户表征确定损失值，对预设机器学习网络的参数进行调整，进行多批次训练且达到训练停止条件后，可以得到用户表征模型。

参见图3，图3示出了根据本说明书一个实施例提供的一种用户表征模型的训练方法的数据流向图。将多个用户的样本行为序列输入用户表征模型，通过用户表征模型的特征提取层对各个用户的样本行为序列进行特征提取，得到各个用户的行为表征序列，将各个用户的行为表征序列输入双曲空间的自注意力层进行自注意力计算，得到各个用户的用户表征，然后计算相同用户在不同时间的用户表征间的第一相似度，计算不同用户的用户表征间的第二相似度，根据第一相似度和第二相似度确定损失值，基于损失值对用户表征模型的模型参数进行调整，直至达到训练停止条件，得到训练完成的用户表征模型。

本说明书一个或多个实施例中，通过对比学习的方式确定损失值，以确保用户表征模型能够达到，确定的相同用户的表征相似度很大，确定的不同用户的表征相似度很小，使得用户表征模型确定的用户表征能够更好地表征用户属性，在后续基于用户表征处理任务时能顾提高任务处理结果的准确性。

通过上述方法已经能够训练得到用户表征模型，该用户表征模型就是为了确定用户表征，而在处理某些下游任务时，需要根据用户表征来处理，那么在处理下游任务之前，也便需要根据用户表征来构建任务模型，对于不同的任务，需要建立的任务模型可能不同。

在本方案中，任何需要通过用户表征来构建的任务模型均可以基于该用户表征模型确定用户表征，且任何需要使用用户表征的下游任务可以基于该用户表征模型获取到用户表征。另外，在需要使用某个用户的用户表征时，若该用户没有产生新的行为，则可以直接从该用户表征模型中获取该用户的用户表征，若该用户产生了新行为，可以基于该用户的新行为通过用户表征模型确定该用户的用户表征。

应用于本说明书实施例，采用自监督学习的方式训练用户表征模型，并采用对比学习的方式确定损失值，即通过计算相同的用户在不同时间的用户表征之间的相似度，以及不同用户的用户表征之间的相似度确定损失值，基于该损失值对用户表征模型的参数进行调整，使得该用户表征模型能够达到确定的相同用户在不同时间的用户表征比较接近，确定的不同用户的用户表征差距比较大的效果，因此，基于该用户表征模型确定的用户表征能够更加准确合理地表征用户属性，即训练得到的用户表征模型效果更好。

下述结合附图4和附图5，以本说明书提供的用户表征模型的训练方法在金融领域的应用为例，对所述用户表征模型的训练方法进行进一步说明。其中，图4示出了本说明书一个实施例提供的一种用户表征模型的训练方法的处理过程流程图，图5示出了本说明书一个实施例提供的另一种用户表征模型的训练方法的数据流向图。

步骤402：获取用户A在第n个月的样本行为序列和第n+1个月的样本行为序列，获取用户B等多个用户在第n个月的样本行为序列。

步骤404：将获取到的样本行为序列均输入预设机器学习网络，利用特征提取层提取每个样本行为序列的初始行为表征序列。

步骤406：针对各个用户，确定样本行为序列中第一行为与上一个行为的时间间隔，确定时间间隔的时间表征，将时间表征与第一行为的初始行为表征相乘，得到第一行为的行为表征。

步骤408：将各个用户的样本行为序列的行为表征序列映射至双曲空间，得到增强行为表征序列。

步骤410：将用户A、用户B等多个用户在第n个月的增强行为表征序列分别输入自注意力层，分别得到用户A、用户B等多个用户在第n个月的用户表征，将用户A在第n+1个月的增强行为表征序列输入自注意力层，得到用户A在第n+1个月的用户表征。

参见图5，获取到用户A第n个月的行为序列(申购12.34元、间隔5天赎回6.23元、间隔1小时点击ad3......转化...)和第n+1个月的行为序列(转化ad5、间隔2天支付6.33元、间隔1小时点击ad3......申购...)，将获取到的行为序列通过双曲空间自注意力处理，得到用户A在第n个月的用户表征和用户A在第n+1个月的用户表征。

将初始行为表征序列映射至双曲空间进行自注意力计算，得到用户表征。

步骤412：根据用户A在第n个月的用户表征和用户A在第n+1个月的用户表征，确定第一相似度，根据用户A在第n+1个月的用户表征和用户B等多个用户在第n个月的用户表征，确定多个第二相似度。

步骤414：根据第一相似度和第二相似度确定损失值，基于损失值调整预设机器学习网络的参数，直至达到训练停止条件，得到用户表征模型。

参见图5，根据用户A在第n个月的用户表征(embedding)和用户A在第n+1个月的用户表征(embedding)、以及用户A在第n+1个月的用户表征(embedding)和用户B在第n个月的用户表征(embedding)、用户A在第n+1个月的用户表征(embedding)和用户C在第n个月的用户表征(embedding)、......、用户A在第n+1个月的用户表征(embedding)和用户N在第n个月的用户表征(embedding)，通过infonce loss的方式来确定损失值训练模型。

应用于本说明书实施例，在训练用户表征模型的过程中，根据样本行为序列确定用户表征之后，通过计算相同的用户在不同时间的用户表征之间的相似度，以及不同用户的用户表征之间的相似度来对用户表征模型的参数进行调整，使得该用户表征模型能够达到确定的相同用户在不同时间的用户表征比较接近，确定的不同用户的用户表征差距比较大的效果，因此，基于该用户表征模型确定的用户表征能够更加准确合理地表征用户属性，即训练得到的用户表征模型效果更好。

参见图6，图6示出了根据本说明书一个实施例提供的一种用户表征方法的流程图，具体包括以下步骤。

步骤602：获取目标用户的行为描述信息。

其中，行为描述信息可以是用于描述目标用户的行为的信息。

在一些实施例中，目标用户的行为描述信息可以是目标用户在某个时间段内产生的行为，可以是一个也可以是多个，若行为描述信息是多个，则该多个行为描述信息可以组成行为序列。

步骤604：将行为描述信息输入用户表征模型，获得目标用户的用户表征，其中，该用户表征模型通过上述用户表征模型的训练方法训练得到。

在本说明书一个或多个实施例中，预设机器学习网络可以包括特征提取层和自注意力层，在行为描述信息的数量是多个，且多个行为描述信息组成行为序列的情况下，将行为描述信息输入用户表征模型，获得目标用户的用户表征的具体实现可以包括：

基于目标用户的各行为描述信息，获得目标用户对应的行为表征序列；根据行为表征序列确定目标用户的用户表征。

在本说明书一个或多个实施例中，基于目标用户的各行为描述信息，获得目标用户对应的行为表征序列的具体实现可以包括：

利用特征提取层，对目标用户的行为序列中的各行为描述信息进行特征提取，获得目标用户对应的初始行为表征序列，其中，该初始行为表征序列中包括各行为描述信息对应的初始行为表征；确定第一行为描述信息与第二行为描述信息间的时间间隔，获得时间间隔的时间表征，其中，第一行为描述信息是行为序列中的任一个，第二行为描述信息是行为序列中与第一行为描述信息时间相邻的一个；对时间表征和第一行为描述信息对应的初始行为表征进行融合，获得第一行为描述信息对应的行为表征；基于各行为描述信息对应的行为表征，获得目标用户对应的行为表征序列。

在本说明书一个或多个实施例中，利用特征提取层，对目标用户的行为序列中的各行为描述信息进行特征提取，获得目标用户对应的初始行为表征序列的具体实现可以包括：

提取第一行为描述信息中的数字字符；对数字字符进行离散化处理，得到该数字字符的初始表征，并对非数字字符进行编码，得到非数字字符的初始表征；基于数字字符和非数字字符的初始表征，确定第一行为描述信息对应的初始行为表征；基于各行为描述信息对应的初始行为表征，获得目标用户对应的初始行为表征序列。

在本说明书一个或多个实施例中，根据行为表征序列确定目标用户的用户表征的具体实现可以包括：

对行为表征序列中各行为表征进行自注意力计算，得到目标用户的用户表征。

在本说明书一个或多个实施例中，若行为表征序列中的各行为表征符合预设分布规律，将行为表征序列中各行为表征进行自注意力计算，得到目标用户的用户表征的具体实现可以包括：

将目标用户的各行为表征映射至预设分布规律对应的目标数据空间，得到目标用户的各增强用户表征；对目标用户的各增强用户表征进行自注意力计算，得到目标用户的用户表征。

在本说明书一个或多个实施例中，获得目标用户的用户表征之后，还可以将目标用户的用户表征输入目标任务模型，得到针对目标用户的任务处理结果。

在一些实施例中，下游任务可以是用户维度的任务，如下游任务可以是预测用户的年龄、爱好、资产、为用户画像、挖掘潜在客户等。因此，在训练用户表征模型时，目的是使得该用户表征模型能够学习到用户的属性，学习到性别相同、年龄、爱好、资产等相仿的用户的用户表征之间的距离较近，性别不同、年龄、爱好、资产等差距较大的用户的用户表征之间的距离较远，使得该用户表征模型输出的用户表征能够更好地表征用户属性。

以目标任务是潜在客户挖掘，目标任务模型是分类模型为例，可以先获取目标用户的用户表征，将用户表征输入分类模型，则可以确定目标用户的类别，该类别包括是潜在客户和不是潜在客户。

需要说明的是，本实施例中未详细描述的部分可以参见上述用户表征模型的训练方法实施例中的相关描述，本实施例对此不做限定。

应用于本说明书的实施例，在训练用户表征模型的过程中，根据样本行为序列确定用户表征之后，通过计算相同的用户在不同时间的用户表征之间的相似度，以及不同用户的用户表征之间的相似度来对用户表征模型的参数进行调整，使得该用户表征模型能够达到确定的相同用户在不同时间的用户表征比较接近，确定的不同用户的用户表征差距比较大的效果，因此，基于该用户表征模型确定的用户表征能够更加准确合理地表征用户属性，在基于该用户表征通过目标任务模型处理任务时，能够得到更加准确的任务处理结果。

与上述用户表征模型的训练方法实施例相对应，本说明书还提供了用户表征模型的训练装置实施例，图7示出了本说明书一个实施例提供的一种用户表征模型的训练装置的结构示意图。如图7所示，该装置包括：

第一获取模块702，被配置为获取多个用户的样本行为序列，其中，任一用户的样本行为序列包括该用户在不同时间的行为描述信息；

计算模块704，被配置为根据各用户的样本行为序列，利用预设机器学习网络，获得各用户在不同时间的用户表征，并计算同一用户在不同时间的用户表征间的第一相似度、以及不同用户的用户表征间的第二相似度；

训练模块706，被配置为基于第一相似度和第二相似度，对预设机器学习网络进行训练，直至达到训练停止条件，获得用户表征模型。

在本说明书一个或多个实施例中，计算模块704，还被配置为：

根据行为表征序列，确定第一用户在不同时间的用户表征。

在本说明书一个或多个实施例中，计算模块704，进一步被配置为：

对第一用户在预设时间段内对应的用户表征进行融合，得到第一用户在预设时间段的用户表征。

在本说明书一个或多个实施例中，预设机器学习网络包括特征提取层；计算模块704，还被配置为：

提取第一行为描述信息中的数字字符；

对第一用户在预设时间段内对应的用户表征进行自注意力计算，得到第一用户在预设时间段的用户表征。

在本说明书一个或多个实施例中，第一用户在预设时间段内对应的用户表征符合预设分布规律；计算模块704，进一步被配置为：

将第一用户在预设时间段内对应的用户表征映射至预设分布规律对应的目标数据空间，得到第一用户在预设时间段内对应的各增强用户表征；

对第一用户在预设时间段内对应的各增强用户表征进行自注意力计算，得到第一用户在预设时间段的用户表征。

在本说明书一个或多个实施例中，计算模块704，被配置为：

根据第一用户在任两个不同时间的用户表征，计算第一用户在时间维度的第一用户表征差信息，获得第一相似度，其中，第一用户为多个用户中的任一个；

根据各用户的用户表征，计算第一用户与其他各用户在空间维度的第二用户表征差信息，获得第二相似度；

训练模块706，还被配置为：

基于第一相似度与第二相似度的比值，计算损失值；

基于损失值对预设机器学习网络进行训练。

应用于本说明书的实施例，获取多个用户的样本行为序列，其中，任一用户的样本行为序列包括该用户在不同时间的行为描述信息；根据各所述用户的样本行为序列，利用预设机器学习网络，获得各所述用户在不同时间的用户表征，并计算同一用户在不同时间的用户表征间的第一相似度、以及不同用户的用户表征间的第二相似度；基于所述第一相似度和第二相似度，对所述预设机器学习网络进行训练，直至达到训练停止条件，获得用户表征模型。即在训练用户表征模型的过程中，根据样本行为序列确定用户表征之后，通过计算相同的用户在不同时间的用户表征之间的相似度，以及不同用户的用户表征之间的相似度来对用户表征模型的参数进行调整，使得该用户表征模型能够达到确定的相同用户在不同时间的用户表征比较接近，确定的不同用户的用户表征差距比较大的效果，因此，基于该用户表征模型确定的用户表征能够更加准确合理地表征用户属性，即训练得到的用户表征模型效果更好。

上述为本实施例的一种用户表征模型的训练装置的示意性方案。需要说明的是，该用户表征模型的训练装置的技术方案与上述的用户表征模型的训练方法的技术方案属于同一构思，用户表征模型的训练装置的技术方案未详细描述的细节内容，均可以参见上述用户表征模型的训练方法的技术方案的描述。

与上述用户表征方法实施例相对应，本说明书还提供了用户表征装置实施例，图8示出了本说明书一个实施例提供的一种用户表征装置的结构示意图。如图8所示，该装置包括：

第二获取模块802，被配置为获取目标用户的行为描述信息；

获得模块804，被配置为将所述行为描述信息输入用户表征模型，获得所述目标用户的用户表征，其中，所述用户表征模型通过上述实施例所述的用户表征模型的训练方法训练得到。

在本说明书一个或多个实施例中，用户表征装置还包括任务处理模块，该任务处理模块被配置为：

将所述目标用户的用户表征输入目标任务模型，得到针对所述目标用户的任务处理结果。

在本说明书一个或多个实施例中，行为描述信息的数量是多个，且多个行为描述信息组成行为序列；任务处理模块，还被配置为：

基于目标用户的各行为描述信息，获得目标用户对应的行为表征；

根据行为表征序列确定目标用户的用户表征。

在本说明书一个或多个实施例中，任务处理模块，进一步被配置为：

利用特征提取层，对目标用户的行为序列中的各行为描述信息进行特征提取，获得目标用户对应的初始行为表征序列，其中，该初始行为表征序列中包括各行为描述信息对应的初始行为表征；

确定第一行为描述信息与第二行为描述信息间的时间间隔，获得时间间隔的时间表征，其中，第一行为描述信息是行为序列中的任一个，第二行为描述信息是行为序列中与第一行为描述信息时间相邻的一个；

基于各行为描述信息对应的行为表征，获得目标用户对应的行为表征序列。

在本说明书一个或多个实施例中，任务处理模块，还被配置为：

提取第一行为描述信息中的数字字符；

对数字字符进行离散化处理，得到该数字字符的初始表征，并对非数字字符进行编码，得到非数字字符的初始表征；

基于各行为描述信息对应的初始行为表征，获得目标用户对应的初始行为表征序列。

在本说明书一个或多个实施例中，目标用户在预设时间段内对应的用户表征符合预设分布规律；任务处理模块，进一步被配置为：

将目标用户的各行为表征映射至预设分布规律对应的目标数据空间，得到目标用户的各增强用户表征；

对目标用户的各增强用户表征进行自注意力计算，得到目标用户的用户表征。

应用于本说明书实施例，获取目标用户的行为描述信息，将行为描述信息输入用户表征模型，得到目标用户的用户表征，由于用户表征模型是通过计算相同的用户在不同时间的用户表征之间的相似度，以及不同用户的用户表征之间的相似度调整参数得到的，则该用户表征模型能够达到确定的相同用户在不同时间的用户表征比较接近，确定的不同用户的用户表征差距比较大的效果，因此，基于该用户表征模型确定的用户表征能够更加准确合理地表征用户属性，进而基于该用户表征模型处理下游任务，能够得到更加准确地处理结果。

图9示出了根据本说明书一个实施例提供的一种计算设备900的结构框图。该计算设备900的部件包括但不限于存储器910和处理器920。处理器920与存储器910通过总线930相连接，数据库950用于保存数据。

计算设备900还包括接入设备940，接入设备940使得计算设备900能够经由一个或多个网络960通信。这些网络的示例包括公用交换电话网(PSTN，Public switchedtelephone network)、局域网(LAN，local area network)、广域网(Wan)、个域网(PAN，Personal area network)或诸如因特网的通信网络的组合。接入设备940可以包括有线或无线的任何类型的网络接口(例如，网络接口卡(NIC，network interface card))中的一个或多个，诸如IEEE802.11无线局域网(WLAN，Wireless Local Area Network)无线接口、全球微波互联接入(Wi-MAX，Worldwide Interoperability for Microwave Access)接口、以太网接口、通用串行总线(USB，Universal Serial Bus)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC，Near Field Communication)接口，等等。

在本说明书的一个实施例中，计算设备900的上述部件以及图9中未示出的其他部件也可以彼此相连接，例如通过总线。应当理解，图9所示的计算设备结构框图仅仅是出于示例的目的，而不是对本说明书范围的限制。本领域技术人员可以根据需要，增添或替换其他部件。

计算设备900可以是任何类型的静止或移动计算设备，包括移动计算机或移动计算设备(例如，平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如，智能手机)、可佩戴的计算设备(例如，智能手表、智能眼镜等)或其他类型的移动设备，或者诸如台式计算机或PC的静止计算设备。计算设备900还可以是移动式或静止式的服务器。

其中，处理器920用于执行如下计算机可执行指令，该计算机可执行指令被处理器执行时实现上述用户表征模型的训练方法或用户表征方法的步骤。

上述为本实施例的一种计算设备的示意性方案。需要说明的是，该计算设备的技术方案与上述的用户表征模型的训练方法或用户表征方法的技术方案属于同一构思，计算设备的技术方案未详细描述的细节内容，均可以参见上述用户表征模型的训练方法或用户表征方法的技术方案的描述。

本说明书一实施例还提供一种计算机可读存储介质，其存储有计算机可执行指令，该计算机可执行指令被处理器执行时实现上述用户表征模型的训练方法或用户表征方法的步骤。

上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是，该存储介质的技术方案与上述的用户表征模型的训练方法或用户表征方法的技术方案属于同一构思，存储介质的技术方案未详细描述的细节内容，均可以参见上述用户表征模型的训练方法或用户表征方法的技术方案的描述。

本说明书一实施例还提供一种计算机程序，其中，当所述计算机程序在计算机中执行时，令计算机执行上述用户表征模型的训练方法或用户表征方法的步骤。

上述为本实施例的一种计算机程序的示意性方案。需要说明的是，该计算机程序的技术方案与上述的用户表征模型的训练方法或用户表征方法的技术方案属于同一构思，计算机程序的技术方案未详细描述的细节内容，均可以参见上述用户表征模型的训练方法或用户表征方法的技术方案的描述。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

所述计算机指令包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、电载波信号、电信信号以及软件分发介质等。

需要说明的是，对于前述的各方法实施例，为了简便描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本说明书实施例并不受所描述的动作顺序的限制，因为依据本说明书实施例，某些步骤可以采用其它顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定都是本说明书实施例所必须的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其它实施例的相关描述。

以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节，也不限制该发明仅为所述的具体实施方式。显然，根据本说明书实施例的内容，可作很多的修改和变化。本说明书选取并具体描述这些实施例，是为了更好地解释本说明书实施例的原理和实际应用，从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。

Claims

1.一种用户表征模型的训练方法，包括：

2.根据权利要求1所述的方法，所述根据各所述用户的样本行为序列，利用预设机器学习网络，获得各所述用户在不同时间的用户表征，包括：

利用预设机器学习网络，基于第一用户的样本行为序列中的各行为描述信息，获得所述第一用户对应的行为表征序列，其中，所述第一用户是所述多个用户中的任一个；

根据所述行为表征序列，确定所述第一用户在不同时间的用户表征。

3.根据权利要求2所述的方法，在所述根据所述行为表征序列，确定所述第一用户在不同时间的用户表征之后，还包括：

对所述第一用户在预设时间段内对应的用户表征进行融合，得到所述第一用户在所述预设时间段的用户表征。

4.根据权利要求2所述的方法，所述预设机器学习网络包括特征提取层；所述利用预设机器学习网络，基于第一用户的样本行为序列中的各行为描述信息，获得所述第一用户对应的行为表征序列，包括：

利用所述特征提取层，对第一用户的样本行为序列中的各行为描述信息进行特征提取，获得所述第一用户对应的初始行为表征序列，其中，所述初始行为表征序列中包括各行为描述信息对应的初始行为表征；

确定第一行为描述信息与第二行为描述信息间的时间间隔，获得所述时间间隔的时间表征，其中，所述第一行为描述信息是所述样本行为序列中的任一个，所述第二行为描述信息是所述样本行为序列中与所述第一行为描述信息时间相邻的一个；

对所述时间表征和所述第一行为描述信息对应的初始行为表征进行融合，获得所述第一行为描述信息对应的行为表征；

基于各行为描述信息对应的行为表征，获得所述第一用户对应的行为表征序列。

5.根据权利要求4所述的方法，所述利用所述特征提取层，对第一用户的样本行为序列中的各行为描述信息进行特征提取，获得所述第一用户对应的初始行为表征序列，包括：

提取所述第一行为描述信息中的数字字符；

对所述数字字符进行离散化处理，得到所述数字字符的初始表征，并对非数字字符进行编码，得到所述非数字字符的初始表征；

基于所述数字字符和非数字字符的初始表征，确定所述第一行为描述信息对应的初始行为表征；

基于各行为描述信息对应的初始行为表征，获得所述第一用户对应的初始行为表征序列。

6.根据权利要求3-5中任一项所述的方法，所述对所述第一用户在预设时间段内对应的用户表征进行融合，得到所述第一用户在所述预设时间段的用户表征，包括：

对所述第一用户在预设时间段内对应的用户表征进行自注意力计算，得到所述第一用户在所述预设时间段的用户表征。

7.根据权利要求6所述的方法，所述第一用户在预设时间段内对应的用户表征符合预设分布规律；所述对所述第一用户在预设时间段内对应的用户表征进行自注意力计算，得到所述第一用户在所述预设时间段的用户表征，包括：

将所述第一用户在预设时间段内对应的用户表征映射至所述预设分布规律对应的目标数据空间，得到所述第一用户在预设时间段内对应的各增强用户表征；

对所述第一用户在预设时间段内对应的各增强用户表征进行自注意力计算，得到所述第一用户在所述预设时间段的用户表征。

8.根据权利要求1-5中任一项所述的方法，所述计算同一用户在不同时间的用户表征间的第一相似度、以及不同用户的用户表征间的第二相似度，包括：

根据第一用户在任两个不同时间的用户表征，计算所述第一用户在时间维度的第一用户表征差信息，获得第一相似度，其中，所述第一用户为所述多个用户中的任一个；

根据各所述用户的用户表征，计算所述第一用户与其他各用户在空间维度的第二用户表征差信息，获得第二相似度；

所述基于所述第一相似度和第二相似度，对所述预设机器学习网络进行训练，包括：

基于所述第一相似度与所述第二相似度的比值，计算损失值；

基于所述损失值对所述预设机器学习网络进行训练。

9.一种用户表征方法，包括：

获取目标用户的行为描述信息；

将所述行为描述信息输入用户表征模型，获得所述目标用户的用户表征，其中，所述用户表征模型通过上述权利要求1-8任一项所述的方法训练得到。

10.根据权利要求9所述的方法，在所述将所述行为描述信息输入用户表征模型，获得所述目标用户的用户表征之后，还包括：

11.一种用户表征模型的训练装置，包括：

12.一种用户表征装置，包括：

第二获取模块，被配置为获取目标用户的行为描述信息；

获得模块，被配置为将所述行为描述信息输入用户表征模型，获得所述目标用户的用户表征，其中，所述用户表征模型通过上述权利要求1-8任一项所述的方法训练得到。

13.一种计算设备，包括：

存储器和处理器；

所述存储器用于存储计算机可执行指令，所述处理器用于执行所述计算机可执行指令，该计算机可执行指令被处理器执行时实现权利要求1-8任意一项所述用户表征模型的训练方法的步骤，或者，实现权利要求9-10任意一项所述用户表征方法的步骤。

14.一种计算机可读存储介质，其存储有计算机可执行指令，该计算机可执行指令被处理器执行时实现权利要求1-8任意一项所述用户表征模型的训练方法的步骤，或者，实现权利要求9-10任意一项所述用户表征方法的步骤。