CN111339443B

CN111339443B - 用户标签确定方法、装置、计算机设备及存储介质

Info

Publication number: CN111339443B
Application number: CN202010159122.0A
Authority: CN
Inventors: 刘巍
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2020-03-09
Filing date: 2020-03-09
Publication date: 2023-04-07
Anticipated expiration: 2040-03-09
Also published as: CN111339443A

Abstract

本申请实施例公开了一种用户标签确定方法、装置、计算机设备及存储介质，属于计算机技术领域。该方法包括：获取图网络，基于编码模型对图网络进行编码处理，获取目标用户节点的特征向量，基于多个分类模型分别对目标用户节点的特征向量进行处理，获取目标用户节点与每个分类模型对应的用户标签的关联度，根据获取的多个关联度，确定目标用户对应的目标用户标签。基于编码模型获取目标用户节点的特征向量，提高了特征向量的准确性，基于分类模型利用得到的目标用户的特征向量，为该目标用户确定目标用户标签。

Description

用户标签确定方法、装置、计算机设备及存储介质

技术领域

本申请实施例涉及计算机技术领域，特别涉及一种用户标签确定方法、装置、计算机设备及存储介质。

背景技术

随着互联网技术的快速发展，社交网络的应用越来越广泛，社交网络中产生的用户信息越来越多、越来越复杂。通常采用设置用户标签的方式，对社交网络中的用户进行管理。

相关技术中通常根据用户的用户信息，确定用户标签，以用户标签来表示用户的喜好。由于上述方法流程较为简单，导致确定的用户标签的准确性差。

发明内容

本申请实施例提供了一种用户标签确定方法、装置、计算机设备及存储介质，能够提高确定的目标用户标签的准确性。所述技术方案如下：

一方面，提供了一种用户标签确定方法，所述方法包括：

获取图网络，所述图网络中包括多个用户节点；

基于编码模型对所述图网络进行编码处理，获取目标用户节点的特征向量，所述目标用户节点为所述多个用户节点中的任一用户节点；

基于多个分类模型分别对所述目标用户节点的特征向量进行处理，获取所述目标用户节点与每个分类模型对应的用户标签的关联度；

根据获取的多个关联度，确定目标用户对应的目标用户标签。

另一方面，提供了一种用户标签确定装置，所述装置包括：

第一获取模块，用于获取图网络，所述图网络中包括多个用户节点；

第一编码处理模块，用于基于编码模型对所述图网络进行编码处理，获取目标用户节点的特征向量，所述目标用户节点为所述多个用户节点中的任一用户节点；

关联度获取模块，用于基于多个分类模型分别对所述目标用户节点的特征向量进行处理，获取所述目标用户节点与每个分类模型对应的用户标签的关联度；

用户标签确定模块，用于根据获取的多个关联度，确定目标用户对应的目标用户标签。

可选地，所述装置还包括：

信息推送模块，用于为所述目标用户推送与所述目标用户标签匹配的信息。

另一方面，提供了一种计算机设备，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条程序代码，所述至少一条程序代码由所述处理器加载并执行，以实现如上述方面所述的用户标签确定方法。

另一方面，提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一条程序代码，所述至少一条程序代码由处理器加载并执行，以实现如上述方面所述的用户标签确定方法。

本申请实施例提供的技术方案带来的有益效果至少包括：

本申请实施例提供的方法、装置、计算机设备及存储介质，获取图网络，基于编码模型对图网络进行编码处理，获取目标用户节点的特征向量，基于多个分类模型分别对目标用户节点的特征向量进行处理，获取目标用户节点与每个分类模型对应的用户标签的关联度，根据获取的多个关联度，确定目标用户对应的目标用户标签。基于编码模型获取目标用户节点的特征向量，提高了特征向量的准确性，基于分类模型利用得到的目标用户的特征向量，为该目标用户确定目标用户标签，从而提高了确定的目标用户标签的准确性。且通过多个分类模型确定目标用户与多个用户标签的关联度，根据目标用户与每个用户标签的关联度，可以准确的为目标用户确定目标用户标签，从而提高了确定的目标用户标签的准确性。且通过确定目标用户与多个用户标签的关联度，从多个用户标签的角度考虑，尽可能用多个用户标签来描述目标用户的特征信息，从而提高了目标用户的特征信息的完整性。

并且，通过为用户确定用户标签，以使后续能够为用户推荐与用户标签匹配的信息，使得推荐的信息更有针对性，提高了对用户的吸引力。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请实施例的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种用户标签确定方法的流程图；

图2是本申请实施例提供的一种社交网络的示意图；

图3是本申请实施例提供的一种图网络的示意图；

图4是本申请实施例提供的一种图网络的示意图；

图5是本申请实施例提供的一种获取目标用户节点的特征向量的示意图；

图6是本申请实施例提供的一种编码模型训练方法的流程图；

图7是本申请实施例提供的一种获取第二样本图网络的流程图；

图8是本申请实施例提供的一种分类模型训练方法的流程图；

图9是本申请实施例提供的一种用户特征信息的示意图；

图10是本申请实施例提供的一种用户标签确定方法的流程图；

图11是本申请实施例提供的一种用户标签确定装置的结构示意图；

图12是本申请实施例提供的一种用户标签确定装置的结构示意图；

图13是本申请实施例提供的一种终端的结构示意图；

图14是本申请实施例提供的一种服务器的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

本申请所使用的术语“第一”、“第二”、“第三”等可在本文中用于描述各种概念，但除非特别说明，这些概念不受这些术语限制。这些术语仅用于将一个概念与另一个概念区分。举例来说，在不脱离本申请的范围的情况下，可以将第一样本图网络称为第二样本图网络，且类似地，可将第二样本图网络称为第一样本图网络。

本申请所使用的术语“多个”、“每个”、“任一”，多个包括两个或两个以上，而每个是指对应的多个中的每一个，任一是指多个中的任意一个。举例来说，多个元素包括3个元素，而每个是指这3个元素中的每一个元素，任一是指这3个元素中的任意一个，可以是第一个，可以是第二个、也可以是第三个。

人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

机器学习(Machine Learning,ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。本申请实施例提供的方案，基于人工智能的机器学习技术，可以训练编码模型和分类模型，利用训练后的编码模型和分类模型，实现了为用户确定用户标签的方法。

深度学习：深度学习是机器学习中一种基于对数据进行表征学习的方法。学习样本可以使用多种方式来表示，如用向量标识，或者更抽象地表示成一系列边、特定形状的区域等。而使用某些特定的表示方法更容易从实例中学习任务(例如，人脸识别或面部表情识别)。深度学习的好处是用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征。

无监督学习：现实生活中常常会有这样的问题：缺乏足够的先验知识，因此难以人工标注类别或进行人工类别标注的成本太高。很自然地，我们希望计算机能代我们完成这些工作，或至少提供一些帮助。根据类别未知(没有被标记)的训练样本解决模式识别中的各种问题，称之为无监督学习。

社交网络：社交网络是一种供用户之间进行交流的网络服务，通过网络这一载体把人们连接起来，从而形成具有某一特点的团体。该社交网络中可以包括多个用户，在该社交网络中的多个用户之间可以进行信息沟通。

本申请实施例提供的用户标签确定方法，可以用于计算机设备中，该计算机设备包括终端或服务器，该终端可以为手机、计算机、平板电脑等多种类型的终端，该服务器可以为一台服务器，或者由若干台服务器组成的服务器集群，或者是一个云计算服务器中心。

本申请实施例提供的方法，可用于为用户确定用户标签的场景。

例如，信息推荐场景下：

计算机设备获取到图网络，计算机设备采用本申请实施例提供的用户标签确定方法，为目标用户确定对应的目标用户标签，后续通过目标用户标签，为该目标用户推荐与该目标用户标签匹配的信息，实现精准的信息推荐。

再例如，推荐策略制定的场景：

计算机设备获取到图网络后，计算机设备采用本申请实施例提供的用户标签确定方法，可以为多个用户确定对应的用户标签，后续可以根据多个用户的用户标签，分别为每个用户标签设置对应的推荐策略，以使后续可以根据推荐策略为用户进行推荐信息，使得推荐的信息更有针对性，提高了对用户的吸引力。

图1是本申请实施例提供的一种用户标签确定方法的流程图，应用于计算机设备中，如图1所示，该方法包括：

101、计算机设备获取多条关联记录。

其中，每条关联记录中包括两个用户标识，用于表示两个用户标识之间建立关联关系。该用户标识可以为用户账号、电话号码、用户昵称等。该关联关系可以为好友关系、交易关系等。例如，第一用户标识添加第二用户标识为好友，添加成功后，第一用户标识与第二用户标识建立好友关系。或者，第一用户标识向第二用户标识进行资源转移，第一用户标识与第二用户标识建立交易关系。

在一种可能实现方式中，不同的关联记录中包括的用户标识不完全相同。例如，获取的多条关联记录中，第一关联记录中包括用户标识1和用户标识2，第二关联记录中包括用户标识3和用户标识4，第三关联记录中包括用户标识1和用户标识5，第一关联记录与第二关联记录中包括的两个用户标识均不同，第一关联记录与第三关联记录中包括的一个用户标识不同，另一个用户标识相同。

另外，在每条关联记录中，还可以包括用户标识的用户信息，该用户信息可以为年龄、身高、喜好、居住地等。例如，一条关联记录中包括用户标识1、用户标识2、用户标识1的用户信息及用户标识2的用户信息。该用户标识1的用户信息中包括“女性、居住地XX、80后、在学车、常看电影、炒股”，用户标识2的用户信息中包括“男性、喜欢跑步、居住地XX、80后、常看电影、炒股”。

对于获取关联记录的方式，在一种可能实现方式中，该计算机设备为应用服务器，响应于第一用户标识与第二用户标识建立关联关系，该应用服务器生成关联记录，该关联记录中包括第一用户标识和第二用户标识。

例如，第一用户标识登录第一终端，第二用户标识登录第二终端，第一终端和第二终端分别与该应用服务器建立连接。第一终端向该应用服务器发送建立关系请求，该建立关系请求中携带第一用户标识和第二用户标识，应用服务器根据该第二用户标识，向第二终端发送该建立关系请求，响应于该应用服务器接收到第二终端发送的同意建立关系响应，该应用服务器生成关联记录，该关联记录中包括第一用户标识和第二用户标识。

如图2所示，社交网络中包括多个用户标识201，多个用户标识201中两两用户标识201连接，通过对获取到的社交网络中的网络数据进行处理，可以得到多个用户标识201之间的关联记录。

102、计算机设备根据多条关联记录中的多个用户标识，在图网络中创建多个用户节点，将属于同一条关联记录的用户节点连接，得到图网络。

其中，图网络是多个节点之间连接关系的表示形式。如图3所示，图网络中包括用户节点301，用户节点之间的连线302两个用户节点具有对应的关联记录。

由于不同的关联记录中可以包括不同的用户标识，也可以包括相同的用户标识，因此，在为每个用户标识创建用户节点时，对于相同的用户标识，只创建一个用户节点，从而得到多个不同的用户节点，根据多条关联记录，将属于一条关联记录的两个用户标识对应的用户节点进行连接，从而得到图网络。

例如，第一关联记录中包括用户标识1和用户标识2，第二关联记录中包括用户标识3和用户标识4，第三关联记录中包括用户标识1和用户标识5，第四关联记录中包括用户标识5和用户标识6，第五关联记录包括用户标识3和用户标识5，则通过该用户标识1、用户标识2、用户标识3、用户标识4、用户标识5及用户标识6，分别创建多个用户节点，将属于同一条关联记录的用户节点连接，得到的图网络，如图4所示。其中，用户标识1与用户节点401对应，用户标识2与用户节点402对应，用户标识3与用户节点403对应，用户标识4与用户节点404对应，用户标识5与用户节点405对应，用户标识6与用户节点406对应。

103、计算机设备基于编码模型对图网络进行编码处理，获取目标用户节点的特征向量。

其中，目标用户节点为多个用户节点中的任一用户节点。特征向量为用于表示用户特征信息的向量，该特征向量可以包括多个维度。

编码模型用于获取图网络中用户节点的特征向量，该编码模型可以是Graph SAGE(Graph Sample And Aggregate，图采样与聚合)模型或者其他模型等。当该编码模型为Graph SAGE时，该编码模型可以通过两个聚合层，对该目标用户节点的特征信息以及该目标用户节点相邻的用户节点的特征信息进行聚合，从而得到目标用户节点的特征向量。如图5所示，该图中每个圆圈表示一个用户节点，圆圈之间的连线表示该两个用户节点对应的用户标识之间建立关联关系。在获取目标用户节点501的特征向量时，确定与目标用户节点501相邻的多个用户节点502，及与每个用户节点502相邻的多个用户节点503，通过用户节点502的特征信息、用户节点503的特征信息及用户节点501的特征信息进行聚合处理，得到该目标用户节点501的特征向量，使得该目标用户节点501的特征向量融入了其他相邻的用户节点的特征，从而提高了获取到的目标用户节点501的特征向量的准确性。

在一种可能实现方式中，该步骤103可以包括：基于该编码模型对图网络进行编码处理，获取该图网络中每个用户节点的特征向量。

在本申请实施例中，通过将图网络输入至该编码模型，该编码模型对该图网络进行编码处理，编码模型可以输出图网络中每个用户节点的特征向量，将图网络中任一用户节点作为该目标用户节点，可以获取到目标用户节点的特征向量。

另外，在该步骤103之前需要对编码模型进行训练，以使在执行步骤103时可以根据训练后的编码模型对该图网络进行编码处理。在一种可能实现方式中，如图6所示，该编码模型的训练过程可以包括以下步骤1031-1034：

1031、获取第一样本图网络，第一样本图网络中包括多个样本用户节点。

该第一样本图网络与上述步骤102中的图网络类似，在此不再赘述。

1032、基于编码模型对第一样本图网络进行编码处理，获取每个样本用户节点的特征向量。

其中，该步骤与上述步骤103类似，在此不再赘述。

1033、基于解码模型对多个样本用户节点的特征向量进行解码处理，得到第二样本图网络。

其中，第二样本图网络中包括多个样本用户节点，该多个样本用户节点与第一样本图网络中包括的多个样本用户节点相同。

该解码模型用于将多个用户节点的特征向量转换成图网络。由于多个样本用户节点的特征向量是通过第一样本图网络得到的，则多个样本用户节点的特征向量中融入了各个样本用户节点之间的连接关系，则通过解码模型对多个样本用户节点进行解码处理，可以得到第二样本图网络，以表示多个样本用户节点的连接关系。如图7所示，将第一样本图网络输入至编码模型701中，编码模型701输出每个样本用户节点的特征向量，将该每个样本用户节点的特征向量输入至解码模型702中，得到第二样本图网络。

在本申请实施例中，由于编码模型的输入为图网络，该编码模型的输出是每个用户节点的特征向量，特征向量与图网络无法进行对比。因此，在对编码模型进行训练的过程中，需要基于解码模型对编码模型输出的多个用户节点的特征向量进行解码，将得到的多个用户节点的特征向量转化为图网络的形式，以使后续能够通过将输入的图网络与输出的图网络进行对比，根据两个图网络的差异实现对编码模型的训练。

对于解码处理的方式，在一种可能实现方式中，基于该解码模型，确定每个样本用户节点的特征向量H的转置特征向量H^T，将每个样本用户节点的特征向量H与对应的转置特征向量H^T的乘积，确定为每个样本用户节点对应的属性值R，将多个样本用户节点对应的属性值R进行连接，得到该第二样本图网络。该特征向量H、转置特征向量H^T、属性值R满足以下关系：

R＝σ(H·H^T)

其中，σ()为sigmoid(逻辑回归)函数，用于将一个实数映射到(0，1)的区间内。

1034、根据第一样本图网络及第二样本图网络之间的差异，对编码模型进行训练。

由于第二样本图网络是通过多个样本用户节点的特征向量进行解码处理得到的，在训练过程中的编码模型的准确性差，导致编码模型输出的样本用户节点的特征向量与真实的样本用户节点的特征向量有差异，因此得到的第一样本图网络与第二样本图网络之间也存在差异，根据该差异对编码模型进行训练，使得训练后的编码模型能够减小该差异，从而提高编码模型的准确性，得到训练后的编码模型。

在一种可能实现方式中，该步骤1034可以包括：采用预设损失函数，对第一样本图网络及第二样本图网络进行处理，得到损失值，响应于损失值大于预设阈值，根据损失值对编码模型进行训练。

其中，预设损失函数用于确定两个图网络之间的差异的函数，该预设损失函数可以是预先设置的任意函数。该损失值用于表示两个图网络之间的差异程度，损失值越大，两个图网络之间的差异越大，损失值越小，两个图网络之间的差异越小。预设阈值可以为任意设置的数值，用于表示对编码模型的期望的损失值。响应于损失值大于预设阈值，表示该编码模型的准确性还无法满足需求，需要继续对编码模型进行训练，响应于损失值不大于预设阈值，表示该编码模型的准确性满足需求，可以停止对编码模型的训练。

在本申请实施例中，可以通过多个第一样本图网络依次对编码模型进行迭代训练。在对编码模型进行训练时，以损失值为基准，通过当前的第一样本图网络得到当前的损失值，根据当前的损失值对编码模型进行调整，而后通过下一个第一样本图网络对调整后的编码模型进行训练，再次根据得到的损失值对编码模型进行调整，按照多个第一样本图网络的排列顺序，依次对编码模型进行训练，经过多轮的迭代训练后，响应于损失值不大于预设阈值时，停止对编码模型的训练，得到训练后的编码模型，后续可以基于该训练后的编码模型获取用户节点的特征向量。

另外，在对编码模型的训练过程中，采用SGD(Stochastic Gradient Descent，随机梯度下降)优化器，学习率为0.001，Epoch(迭代次数)为10，对该编码模型进行迭代训练。

另外，在对编码模型进行训练过程中，可以通过Cora(一种数据集)、CiteSeer(一种数据集)、Reddit(一种数据集)中的图网络对该编码模型进行训练。不同的数据集中包括的图网络不同，图网络中的节点数目、节点之间连接的边数目及每个节点的特征向量的维度数如表1所示。

表1

	节点数目	边数目	维度数
				Cora	2708	10556	1433
CiteSeer	3327	9104	3703
				Reddit	232965	1146158892	602

表2

	Cora	CiteSeer	Reddit
				SC	84.6±0.01	80.2±0.02	84.2±0.02
DW	83.1±0.01	80.5±0.02	84.4±0.001
				GAE	83.91±0.49	78.7±0.01	82.2±0.02
VGAE	84.28±0.15	78.9±0.03	82.7±0.02
				SAGEGAE	87.38±0.02	85.1±0.12	93.2±0.002

另外，本申请实施例中的编码模型可以为SC(Spectral Clustering，谱聚类模型)、DW(Deep Walk，一种图嵌入模型)、GAE(Graph Auto-Encoder，图自编码器)、VGAE(Variational Graph Auto-Encoders，变分自编码器)、SAGEGAE(Sample And AggregateGraph Auto-Encoder，采样与聚合图自动编码器)等模型。对编码模型的训练过程中，采用不同的模型在不同的数据集上训练得到的编码模型的准确率不同。各个模型在不同的数据集上可以训练得到的准确率如表2所示。

104、计算机设备基于多个分类模型分别对目标用户节点的特征向量进行处理，获取目标用户节点与每个分类模型对应的用户标签的关联度。

其中，用户标签用于表示用户的特征，如该用户标签为“高消费用户”、“低消费用户”、“爱旅游用户”等。每个分类模型对应一个用户标签，在该多个分类模型中，不同的分类模型对应的用户标签不同。该分类模型用于获取用户与该分类模型对应的用户标签的关联度，该分类模型可以为LR分类器(Logistic Regression Classifier，逻辑回归分类器)或者其他模型。关联度用于表示用户节点与用户标签的关联程度，关联度越大，表示该用户节点对应的用户标识越符合该用户标签，关联度越小，表示该用户节点对应的用户标识越不符合该用户标签。

计算机设备在获取到目标用户节点的特征向量后，分别将该目标用户节点的特征向量输入至每个分类模型，每个分类模型对目标用户节点的特征向量进行处理，输出该目标用户节点与对应的用户标签的关联度，从而得到该目标用户节点与多个用户标签的关联度。

另外，在该步骤104之前需要对分类模型进行训练，以使在执行步骤104时可以根据训练后的多个分类模型对目标用户节点的特征向量进行处理。在一种可能实现方式中，如图8所示，分类模型的训练过程可以包括以下步骤1041-1044：

1041、对于任一分类模型，获取已训练完成的编码模型及第三样本图网络，第三样本图网络中包括多个样本用户节点。

其中，已训练完成的编码模型可以通过上述步骤1031-1034训练得到的。该第三样本图网络与上述步骤102中的图网络类似，在此不再赘述。

1042、根据多个样本用户节点的用户标签，将属于分类模型对应的用户标签的用户节点确定为正样本节点，将不属于用户标签的用户节点确定为负样本节点。

其中，多个样本用户节点的用户标签可以是人工设置的，开发人员可以根据每个样本用户节点的特征信息，确定每个样本用户节点所属的用户标签，为每个样本用户节点设置所属的用户标签。

第三样本图网络中可以包括多个样本用户节点的用户标签，也可以不包括多个样本用户节点的用户标签。响应于第三样本图网络中包括多个样本用户节点的用户标签，则在获取第三样本图网络时，即获取到多个样本用户节点的用户标签；响应于第三样本图网络中不包括多个样本用户节点的用户标签，则在执行步骤1042之前，还需获取多个样本用户节点的用户标签。

在对任一分类模型进行训练时，可以根据分类模型与用户标签的对应关系，确定该分类模型对应的用户标签，根据该分类模型对应的用户标签和该多个样本用户节点的用户标签，对多个样本用户节点进行分类，从而得到多个正样本节点和多个负样本节点。

1043、基于编码模型对第三图网络进行编码处理，获取第三样本图网络中每个样本用户节点的特征向量。

该步骤与上述步骤103类似，在此不再赘述。

1044、根据正样本节点及负样本节点的特征向量，对分类模型进行训练。

在对分类模型进行训练的过程中，分别将正样本节点的特征向量、负样本节点的特征向量输入至分类模型中对该分类模型进行训练。

在一种可能实现方式中，该步骤1044可以包括：将正样本节点与该分类模型对应的用户标签的关联度确定为第一关联度，将负样本节点与该分类模型对应的用户标签的关联度确定为第二关联度，将正样本节点的特征向量作为该分类模型的输入，将第一关联度作为该分类模型的输出，对该分类模型进行训练，将负样本节点的特征向量作为该分类模型的输入，将第二关联度作为该分类模型的输出，对该分类模型进行训练。

其中，第一关联度大于第二关联度，第一关联度和第二关联度均可以为任意设置的数值。例如，第一关联度设置为1，第二关联度设置为0，

在一种可能实现方式中，对该分类模型进行训练时，基于该分类模型对正样本节点的特征向量进行处理，得到正样本节点与该分类模型对应的用户标签的关联度，采用预设损失函数，对正样本节点的关联度及正样本节点与该分类模型对应的用户标签的真实关联度进行处理，得到损失值，响应于损失值大于预设阈值，根据损失值对分类模型进行训练。基于该分类模型对负样本节点的特征向量进行处理，得到负样本节点与该分类模型对应的用户标签的关联度，采用预设损失函数，对负样本节点的关联度及负样本节点与该分类模型对应的用户标签的真实关联度进行处理，得到损失值，响应于损失值大于预设阈值，根据损失值对分类模型进行训练。

在另一种可能实现方式中，在步骤1044之后，该方法还包括：基于该分类模型对正样本节点的特征向量及负样本节点的特征向量进行处理，得到正样本节点与该分类模型对应的用户标签的关联度，及负样本节点与该分类模型对应的用户标签的关联度，根据得到的正样本节点与该分类模型对应的用户标签的关联度、得到的负样本节点与该分类模型对应的用户标签的关联度、正样本节点与该分类模型对应的用户标签的真实关联度、负样本节点与该分类模型对应的用户标签的真实关联度，确定该分类模型的正确率，响应于该分类模型的正确率小于预设阈值，根据该正样本节点及负样本节点的特征向量，继续对分类模型进行训练。其中，该预设阈值可以为任意设置的阈值。

例如，正样本节点有50个，负样本节点有50个，预设阈值为90％，分类模型输出的关联度准确的样本节点个数为40个，则该分类模型的正确率为40％，该正确率小于预设阈值，则继续对该分类模型进行训练。

105、计算机设备根据获取的多个关联度，确定目标用户对应的目标用户标签。

其中，目标用户为目标用户节点对应的用户。计算机设备根据目标用户节点与每个用户标签的关联度，从多个用户标签中为目标用户确定目标用户标签。

在本申请实施例中，每个用户可以具有一个或多个用户标签。

在一种可能实现方式中，该步骤105可以包括：将多个用户标签中关联度大于预设阈值的用户标签，确定为目标用户标签。

其中，预设阈值可以为预先设置的任意数值。在多个用户标签对应的关联度中，若关联度大于预设阈值，表示该用户符合该关联度对应的用户标签，则将该用户标签确定为目标用户标签。

另外，对于该预设阈值，可以是多个用户标签对应同一个预设阈值，则在确定目标用户标签时，根据多个关联度，从多个用户标签中选择关联度大于该预设阈值的用户标签，确定为目标用户标签。对于该预设阈值，也可以是不同的用户标签对应不同的预设阈值。则在确定目标用户标签时，将每个用户标签的关联度与对应的预设阈值进行对比，将关联度大于对应的预设阈值的用户标签，确定为目标用户标签。

在一种可能实现方式中，在该步骤105之后，该方法还包括：为目标用户推送与目标用户标签匹配的信息。

例如，目标用户标签为“篮球爱好者”，则为该目标用户推送篮球的相关信息，目标用户标签为“旅游爱好者”，则为该目标用户推送旅游的相关信息。

需要说明的是，本申请实施例是以通过对获取的多条关联记录进行处理，从而获取到目标用户对应的目标用户标签进行说明的，而在另一实施例中，无需执行步骤101-102，可以采用其他方式获取图网络。

随着社交网络的发展，一直在降低人们社交的时间和物质成本，或者说是降低管理和传递信息的成本。与此同时，网络社交一直在努力通过不断丰富的手段和工具，来替代传统社交来满足人们的交流需求。通过该社交网络，实现了用户之间的“非接触型”的社交，无需用户面对面，用户之间可以通过社交网络工具进行交流。随着社交网络的应用和普及，社交网络中的用户越来越多，社交网络中产生的信息越来越多，越来越复杂。如图9所示，用户901在社交网络中的特征信息可以包括：“女性、居住地、常去XX店、喜欢跑步、起居时间”等各种行为习惯。

为了实现对社交网络的有效管理，则可以采用本申请提供的确定用户标签的方法，来实现对社交网络中产生的信息进行有效管理和利用。

本申请实施例提供的方法，获取图网络，基于编码模型对图网络进行编码处理，获取目标用户节点的特征向量，基于多个分类模型分别对目标用户节点的特征向量进行处理，获取目标用户节点与每个分类模型对应的用户标签的关联度，根据获取的多个关联度，确定目标用户对应的目标用户标签。基于编码模型获取目标用户节点的特征向量，提高了特征向量的准确性，基于分类模型利用得到的目标用户的特征向量，为该目标用户确定目标用户标签，从而提高了确定的目标用户标签的准确性。且通过多个分类模型确定目标用户与多个用户标签的关联度，根据目标用户与每个用户标签的关联度，可以准确的为目标用户确定目标用户标签，从而提高了确定的目标用户标签的准确性。且通过确定目标用户与多个用户标签的关联度，从多个用户标签的角度考虑，尽可能用多个用户标签来描述目标用户的特征信息，从而提高了目标用户的特征信息的完整性。

如图10所示，本申请实施例提供的用户标签确定方法的流程图，该方法包括：

1、获取样本图网络，样本图网络中包括多个样本用户节点。

2、根据获取的样本图网络对初始的编码模型进行训练，得到训练后的编码模型。

3、根据样本图网络及训练后的编码模型，对初始的分类模型进行训练，得到训练后的分类模型。

4、基于训练后的编码模型和分类模型，对获取的图网络进行处理，为目标用户确定目标用户标签。

图11是本申请实施例提供的一种用户标签确定装置的结构示意图，如图11所示，该装置包括：

第一获取模块1101，用于获取图网络，图网络中包括多个用户节点；

第一编码处理模块1102，用于基于编码模型对图网络进行编码处理，获取目标用户节点的特征向量，目标用户节点为多个用户节点中的任一用户节点；

关联度获取模块1103，用于基于多个分类模型分别对目标用户节点的特征向量进行处理，获取目标用户节点与每个分类模型对应的用户标签的关联度；

用户标签确定模块1104，用于根据获取的多个关联度，确定目标用户对应的目标用户标签。

可选地，如图12所示，第一获取模块1101，包括：

关联记录获取单元11011，用于获取多条关联记录，每条关联记录中包括两个用户标识，用于表示两个用户标识之间建立关联关系；

节点连接单元11012，用于根据多条关联记录中的多个用户标识，在图网络中创建多个用户节点，将属于同一条关联记录的用户节点连接，得到图网络。

可选地，如图12所示，装置还包括：

第二获取模块1105，用于获取第一样本图网络，第一样本图网络中包括多个样本用户节点；

第二编码处理模块1106，用于基于编码模型对第一样本图网络进行编码处理，获取每个样本用户节点的特征向量；

解码处理模块1107，用于基于解码模型对多个样本用户节点的特征向量进行解码处理，得到第二样本图网络；

编码模型训练模块1108，用于根据第一样本图网络及第二样本图网络之间的差异，对编码模型进行训练。

可选地，如图12所示，编码模型训练模块1108，包括：

图网络处理单元1801，用于采用预设损失函数，对第一样本图网络及第二样本图网络进行处理，得到损失值；

编码模型训练单元1802，用于响应于损失值大于预设阈值，根据损失值对编码模型进行训练。

可选地，如图12所示，装置还包括：

第三获取模块1109，用于对于任一分类模型，获取已训练完成的编码模型及第三样本图网络，第三样本图网络中包括多个样本用户节点；

节点确定模块1110，用于根据多个样本用户节点的用户标签，将属于分类模型对应的用户标签的用户节点确定为正样本节点，将不属于用户标签的用户节点确定为负样本节点；

第三编码处理模块1111，用于基于编码模型对第三图网络进行编码处理，获取第三样本图网络中每个样本用户节点的特征向量；

分类模型训练模块1112，用于根据正样本节点及负样本节点的特征向量，对分类模型进行训练。

可选地，如图12所示，用户标签确定模块1104，包括：

用户标签确定单元1141，用于将多个用户标签中关联度大于预设阈值的用户标签，确定为目标用户标签。

可选地，如图12所示，装置还包括：

信息推送模块1113，用于为目标用户推送与目标用户标签匹配的信息。

图13是本申请实施例提供的一种终端的结构示意图，可以实现上述实施例中计算机设备执行的操作。该终端1300可以是便携式移动终端，比如：智能手机、平板电脑、MP3播放器(Moving Picture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、笔记本电脑、台式电脑、头戴式设备、智能电视、智能音箱、智能遥控器、智能话筒，或其他任意智能终端。终端1300还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。

通常，终端1300包括有：处理器1301和存储器1302。

处理器1301可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。存储器1302可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的，用于存储至少一个指令，该至少一个指令用于被处理器1301所具有以实现本申请中方法实施例提供的用户标签确定方法。

在一些实施例中，终端1300还可选包括有：外围设备接口1303和至少一个外围设备。处理器1301、存储器1302和外围设备接口1303之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1303相连。具体地，外围设备包括：射频电路1304、显示屏1305和音频电路1306中的至少一种。

射频电路1304用于接收和发射RF(Radio Frequency，射频)信号，也称电磁信号。射频电路1304通过电磁信号与通信网络及其他通信设备进行通信。

显示屏1305用于显示UI(UserInterface，用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。该显示屏1305可以是触摸显示屏，还可以用于提供虚拟按钮和/或虚拟键盘。

音频电路1306可以包括麦克风和扬声器。麦克风用于采集用户及环境的音频信号，并将音频信号转换为电信号输入至处理器1301进行处理，或者输入至射频电路1304以实现语音通信。出于立体声采集或降噪的目的，麦克风可以为多个，分别设置在终端1300的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1301或射频电路1304的电信号转换为音频信号。

本领域技术人员可以理解，图13中示出的结构并不构成对终端1300的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

图14是本申请实施例提供的一种服务器的结构示意图，该服务器1400可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器(Central ProcessingUnits，CPU)1401和一个或一个以上的存储器1402，其中，存储器1402中存储有至少一条指令，至少一条指令由处理器1401加载并执行以实现上述各个方法实施例提供的方法。当然，该服务器还可以具有有线或无线网络接口、键盘及输入输出接口等部件，以便进行输入输出，该服务器还可以包括其他用于实现设备功能的部件，在此不做赘述。

服务器1400可以用于执行上述用户标签确定方法。

本申请实施例还提供了一种计算机设备，该计算机设备包括处理器和存储器，存储器中存储有至少一条程序代码，该至少一条程序代码由处理器加载并执行，以实现上述实施例的用户标签确定方法。

本申请实施例还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有至少一条程序代码，该至少一条程序代码由处理器加载并执行，以实现上述实施例的用户标签确定方法。

本申请实施例还提供了一种计算机程序，该计算机程序中存储有至少一条程序代码，该至少一条程序代码由处理器加载并执行，以实现上述实施例的用户标签确定方法。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本申请实施例的可选实施例，并不用以限制本申请实施例，凡在本申请实施例的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种用户标签确定方法，其特征在于，所述方法包括：

获取第一样本图网络，所述第一样本图网络中包括多个样本用户节点；

基于编码模型对所述第一样本图网络进行编码处理，获取每个样本用户节点的特征向量；

基于解码模型对所述多个样本用户节点的特征向量进行解码处理，得到第二样本图网络；

根据所述第一样本图网络及所述第二样本图网络之间的差异，对所述编码模型进行训练；

获取图网络，所述图网络中包括多个用户节点；

基于所述编码模型对所述图网络进行编码处理，获取目标用户节点的特征向量，所述目标用户节点为所述多个用户节点中的任一用户节点；

2.根据权利要求1所述的方法，其特征在于，所述获取图网络，包括：

获取多条关联记录，每条关联记录中包括两个用户标识，用于表示所述两个用户标识之间建立关联关系；

根据所述多条关联记录中的多个用户标识，在所述图网络中创建多个用户节点，将属于同一条关联记录的用户节点连接，得到所述图网络。

3.根据权利要求1所述的方法，其特征在于，所述根据所述第一样本图网络及所述第二样本图网络之间的差异，对所述编码模型进行训练，包括：

采用预设损失函数，对所述第一样本图网络及所述第二样本图网络进行处理，得到损失值；

响应于所述损失值大于预设阈值，根据所述损失值对所述编码模型进行训练。

4.根据权利要求1所述的方法，其特征在于，所述根据所述第一样本图网络及所述第二样本图网络之间的差异，对所述编码模型进行训练之后，所述方法还包括：

对于任一分类模型，获取已训练完成的编码模型及第三样本图网络，所述第三样本图网络中包括多个样本用户节点；

根据所述多个样本用户节点的用户标签，将属于所述分类模型对应的用户标签的用户节点确定为正样本节点，将不属于所述用户标签的用户节点确定为负样本节点；

基于所述编码模型对所述第三样本图网络进行编码处理，获取所述第三样本图网络中每个样本用户节点的特征向量；

根据所述正样本节点及所述负样本节点的特征向量，对所述分类模型进行训练。

5.根据权利要求1所述的方法，其特征在于，所述根据获取的多个关联度，确定目标用户对应的目标用户标签，包括：

将所述多个用户标签中关联度大于预设阈值的用户标签，确定为所述目标用户标签。

6.根据权利要求1所述的方法，其特征在于，所述根据获取的多个关联度，确定目标用户对应的目标用户标签之后，所述方法还包括：

为所述目标用户推送与所述目标用户标签匹配的信息。

7.一种用户标签确定装置，其特征在于，所述装置包括：

第二获取模块，用于获取第一样本图网络，所述第一样本图网络中包括多个样本用户节点；

第二编码处理模块，用于基于编码模型对所述第一样本图网络进行编码处理，获取每个样本用户节点的特征向量；

解码处理模块，用于基于解码模型对所述多个样本用户节点的特征向量进行解码处理，得到第二样本图网络；

编码模型训练模块，用于根据所述第一样本图网络及所述第二样本图网络之间的差异，对所述编码模型进行训练；

第一编码处理模块，用于基于所述编码模型对所述图网络进行编码处理，获取目标用户节点的特征向量，所述目标用户节点为所述多个用户节点中的任一用户节点；

8.根据权利要求7所述的装置，其特征在于，所述第一获取模块，包括：

关联记录获取单元，用于获取多条关联记录，每条关联记录中包括两个用户标识，用于表示所述两个用户标识之间建立关联关系；

节点连接单元，用于根据所述多条关联记录中的多个用户标识，在所述图网络中创建多个用户节点，将属于同一条关联记录的用户节点连接，得到所述图网络。

9.根据权利要求7所述的装置，其特征在于，所述编码模型训练模块，包括：

图网络处理单元，用于采用预设损失函数，对所述第一样本图网络及所述第二样本图网络进行处理，得到损失值；

编码模型训练单元，用于响应于所述损失值大于预设阈值，根据所述损失值对所述编码模型进行训练。

10.根据权利要求7所述的装置，其特征在于，所述装置还包括：

第三获取模块，用于对于任一分类模型，获取已训练完成的编码模型及第三样本图网络，所述第三样本图网络中包括多个样本用户节点；

节点确定模块，用于根据所述多个样本用户节点的用户标签，将属于所述分类模型对应的用户标签的用户节点确定为正样本节点，将不属于所述用户标签的用户节点确定为负样本节点；

第三编码处理模块，用于基于所述编码模型对所述第三样本图网络进行编码处理，获取所述第三样本图网络中每个样本用户节点的特征向量；

分类模型训练模块，用于根据所述正样本节点及所述负样本节点的特征向量，对所述分类模型进行训练。

11.根据权利要求7所述的装置，其特征在于，所述用户标签确定模块，包括：

用户标签确定单元，用于将所述多个用户标签中关联度大于预设阈值的用户标签，确定为所述目标用户标签。

12.根据权利要求7所述的装置，其特征在于，所述装置还包括：

13.一种计算机设备，其特征在于，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条程序代码，所述至少一条程序代码由所述处理器加载并执行，以实现如权利要求1至6任一权利要求所述的用户标签确定方法。

14.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有至少一条程序代码，所述至少一条程序代码由处理器加载并执行，以实现如权利要求1至6任一权利要求所述的用户标签确定方法。