CN112328849B

CN112328849B - 用户画像的构建方法、基于用户画像的对话方法及装置

Info

Publication number: CN112328849B
Application number: CN202011203519.1A
Authority: CN
Inventors: 陆笛; 周霄; 周杰
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2020-11-02
Filing date: 2020-11-02
Publication date: 2024-05-07
Anticipated expiration: 2040-11-02
Also published as: CN112328849A

Abstract

本申请公开了一种用户画像的构建方法、基于用户画像的对话方法及装置，涉及机器人问答领域。该方法包括：获取用户帐号的历史对话数据；对历史对话数据进行特征提取，得到历史对话特征；对历史对话特征和所述用户帐号对应的用户信息进行分类处理，得到用户帐号对应的至少两个维度的用户标签，用户标签用于根据所述历史对话数据对所述用户帐号对应的用户行为数据进行分类；根据至少两个维度的用户标签构建用户画像。通过获取用户帐号对应的历史数据来生成至少两个维度的用户标签，基于正确的语义意图下能够获取到准确且全面的用户标签，从而构建准确且全面的用户画像。

Description

用户画像的构建方法、基于用户画像的对话方法及装置

技术领域

本申请涉及机器人问答领域，特别涉及一种用户画像的构建方法、基于用户画像的对话方法及装置。

背景技术

用户画像（Persona）是指一种用于勾画目标用户、联系用户诉求与设计方向的有效工具。用户画像是真实用户的虚拟代表，智能设备通过用户画像可针对性地与用户进行对话。

相关技术中，用户画像是通过用户帐号对应的基本信息进行构建的。比如，用户在第一次使用应用程序时，需要注册用户帐号，在注册用户帐号的过程中，用户会填写一些个人信息（如性别、星座、生日、兴趣等）。在一些情况下，用户在注册用户帐号时为了节约时间或避免隐私泄露，不会填写完整信息。

通过上述技术方案构建的用户画像，由于个人信息的缺失，易于造成构建的用户画像不够准确，或用户画像的维度无法涵盖各个方面，使得智能设备无法根据用户画像准确应答用户。

发明内容

本申请实施例提供了一种用户画像的构建方法、基于用户画像的对话方法及装置，通过获取用户帐号对应的历史数据来生成至少两个维度的用户标签，构建较为准确且全面的用户画像。所述技术方案如下：

根据本申请的一方面，提供了一种用户画像的构建方法，所述方法包括：

获取用户帐号的历史对话数据；

对所述历史对话数据进行特征提取，得到历史对话特征；

对所述历史对话特征和所述用户帐号对应的用户信息进行分类处理，得到所述用户帐号对应的至少两个维度的用户标签，所述用户标签用于根据所述历史对话数据对所述用户帐号对应的用户行为数据进行分类；

根据所述至少两个维度的用户标签构建所述用户画像。

根据本申请的另一方面，提供了一种基于用户画像的对话方法，所述方法包括：

获取正在进行对话的用户帐号；

获取所述用户帐号对应的用户画像，所述用户画像包括至少两个维度的用户标签，所述用户标签是根据历史对话特征和所述用户帐号对应的用户信息生成的，所述历史对话特征是从所述用户帐号的历史对话数据中提取的；

根据所述用户画像获取所述用户帐号对应的对话主题兴趣列表，所述对话主题兴趣列表包括至少一个对话主题；

根据所述对话主题兴趣列表输出应答语句。

根据本申请的另一方面，提供了一种用户画像的构建装置，所述装置包括：

第一获取模块，用于获取用户帐号的历史对话数据；

特征提取模块，用于对所述历史对话数据进行特征提取，得到历史对话特征；

分类模块，用于对所述历史对话特征和所述用户帐号对应的用户信息进行分类处理，得到所述用户帐号对应的至少两个维度的用户标签，所述用户标签用于根据所述历史对话数据对所述用户帐号对应的用户行为数据进行分类；

所述构建模块，用于根据所述至少两个维度的用户标签构建所述用户画像。

根据本申请的另一方面，提供了一种基于用户画像的对话装置，所述装置包括：

第二获取模块，用于获取正在进行对话的用户帐号；

所述第二获取模块，用于根据所述用户帐号获取所述用户帐号对应的用户画像，所述用户画像包括至少两个维度的用户标签，所述用户标签是对历史对话特征和所述用户帐号对应的用户信息进行分类处理后得到的，所述历史对话特征是从所述用户帐号的历史对话数据中提取的；

所述第二获取模块，用于获取所述用户帐号对应的对话主题兴趣列表，所述对话主题兴趣列表包括至少一个对话主题；

输出模块，用于根据所述对话主题兴趣列表输出应答语句。

根据本申请的另一方面，提供了一种计算机设备，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述方面所述的用户画像的构建方法和基于用户画像的对话方法。

根据本申请的另一方面，提供了一种计算机可读存储介质，所述可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上述方面所述的用户画像的构建方法和基于用户画像的对话方法。

根据本申请的另一方面，提供了一种计算机程序产品或计算机程序，所述计算机程序产品或计算机程序包括计算机指令，所述计算机指令存储在计算机可读存储介质中。计算机设备的处理器从所述计算机可读存储介质读取所述计算机指令，所述处理器执行所述计算机指令，使得所述计算机设备执行如上方面所述的用户画像的构建方法和基于用户画像的对话方法。

本申请实施例提供的技术方案带来的有益效果至少包括:

通过对获取到的用户帐号对应的历史数据进行分类处理，得到至少两个维度的用户标签，利用上下文关系准确地理解用户的语义意图，使得基于正确的语义意图下能够获取到准确且全面的用户标签，从而构建准确且全面的用户画像，使得终端能够根据用户画像与用户智能地进行对话。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一个示例性实施例提供的计算机系统的框架图；

图2是本申请一个示例性实施例提供的用户画像的构建方法的流程图；

图3是本申请另一个示例性实施例提供的用户画像的构建方法的流程图；

图4是本申请一个示例性实施例提供的用户画像的构建和使用流程的框架图；

图5是本申请一个示例性实施例提供的用户标签的体系框架图；

图6是本申请一个示例性实施例提供的GPT-2模型的结构框架示意图；

图7是本申请一个示例性实施例提供的用户标签分类的流程框架图；

图8是本申请一个示例性实施例提供的多维度标签分类器的训练方法的流程图；

图9是本申请一个示例性实施例提供的基于用户画像的对话方法的流程图；

图10是本申请一个示例性实施例提供的用户画像的构建装置的结构框图；

图11是本申请一个示例性实施例提供的基于用户画像的对话装置的结构框图；

图12是本申请一个示例性实施例提供的服务器的装置结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

首先，对本申请实施例涉及的名词进行介绍。

用户画像（Personas）：是指建立在一系列真实数据之上的目标用户模型，真实用户的虚拟代表。根据用户的目标、行为和观点等差异，将用户分为不同的类型，然后每种类型中抽取出典型的特征，赋予该类型名字、照片、一些人口统计学要素、场景等描述，形成一个人物原型。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、以及自然语言处理技术等几大方向。

随着人工智能技术研究和进步，人工智能技术在多个领域展开研究和应用，例如常见的智能家居、智能机器人、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、虚拟现实应用（Virtual Reality，VR）、智能客服等，相信随着技术的发展，人工智能技术将在更多的领域得到应用，并发挥越来越重要的价值。

需要说明的是，本申请所涉及的信息（包括但不限于用户设备信息、用户信息等）、数据（包括但不限于用于分析的数据、存储的数据、展示的数据等）以及信号，均为经用户授权或者经过各方充分授权的，且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。例如，本申请中涉及到的历史对话数据、用户信息、索引信息都是在充分授权的情况下获取的。

本申请实施例提供的基于用户画像对话方法可以应用于如下场景：

一、智能音箱

在该应用场景下，采用本申请实施例提供的用户画像的构建方法可应用于能够跟用户进行交互的智能音箱中。通过智能音箱对应的后台服务器获取用户帐号对应的历史对话数据，服务器提取历史对话特征，调用多维度标签分类器输出至少两个维度的用户标签，服务器基于用户标签构建用户画像。服务器将用户画像发送至智能音箱中，智能音箱根据用户画像和应答模板输出应答语句与用户进行对话，智能音箱还能根据用户画像发起用户感兴趣的话题。

二、智能终端中的虚拟助理

在该应用场景下，采用本申请实施例提供的用户画像的构建方法可应用于智能终端中。智能终端中设置有虚拟助理，智能终端根据用户帐号构建有对应的用户画像，当智能终端接收到用户发出的语音时，根据用户帐号确定对应的用户画像，控制虚拟助理基于用户画像与用户进行对话。在一些实施例中，智能终端能够识别用户的音色，针对不同的音色确定用户的身份，从而模仿用户的说话语气控制虚拟助理与用户进行对话。

上述仅以两种应用场景为例进行说明，本申请实施例提供的方法还可以应用于其他人机对话的场景（比如，智能收银设备等），本申请实施例并不对具体应用场景进行限定。

本申请实施例提供的用户画像的构建方法和基于用户画像的对话方法可以应用于具有较强的数据处理能力的计算机设备中。在一种可能的实施方式中，本申请实施例提供的用户画像的构建方法和基于用户画像的对话方法可以应用于个人计算机、工作站或服务器中，即可以通过个人计算机、工作站或服务器实现构建用户画像和基于用户画像与用户对话的功能。

而对于构建的用户画像，其可以实现成为应用程序的一部分，并构建在终端中，使终端在接收到用户帐号对应的历史对话数据时，构建用户画像；或者，用户画像构建在在应用程序的后台服务器中，以便安装有应用程序的终端借助后台服务器实现基于用户画像与用户对话的功能。

图1示出了本申请一个示例性实施例提供的计算机系统的示意图。该计算机系统100包括智能音箱110和服务器120，其中，智能音箱110与服务器120之间通过通信网络进行数据通信，可选地，通信网络可以是有线网络也可以是无线网络，且该通信网络可以是局域网、城域网以及广域网中的至少一种。

智能音箱110中构建有基于用户画像的对话系统，当智能音箱110接收到用户发出的语音时，智能音箱110根据用户的语音以及用户画像，具有针对性地与用户进行对话。

可选的，智能音箱110也可以是其他类型的终端，比如，智能手机、智能手表、平板电脑、膝上便携式笔记本电脑、智能机器人等移动终端，也可以是台式电脑、投影式电脑等终端，本申请实施例对终端的类型不做限定。

服务器120可以实现为一台服务器，也可以实现为一组服务器构成的服务器集群，其可以是物理服务器，也可以实现为云服务器。在一种可能的实施方式中，服务器120是智能音箱110的后台服务器。

如图1所示，在本实施例中，智能音箱110的后台服务器120构建有用户画像16，当用户与智能音箱110进行对话时，智能音箱110能够根据正在对话的用户对应的用户画像16进行应答。

示意性的，智能音箱110根据用户帐号获取历史对话数据11，并将历史对话数据11发送至服务器120中，服务器120根据历史对话数据11构建用户画像16。示意性的，智能音箱110将正在进行对话的用户对应的用户帐号发送至服务器120，服务器120根据该用户帐号获取历史对话数据11，根据该历史对话数据11构建用户画像16。

服务器120中构建有特征提取模型12和多维度标签分类器15，调用特征提取模型12对历史对话数据11进行特征提取，提取历史对话特征13，调用多维度标签分类器15对历史对话特征13和用户帐号对应的用户信息14进行处理，生成用户帐号对应的用户画像16。特征提取模型12用于分析历史对话数据中包括的一些实体特征、实体之间的依赖关系、语义意图等音素，多维度标签分类器15用于对历史对话特征和用户信息进行分析，得到至少两个维度的标签。其中，用户信息是用户已有的基础信息，比如，用户的姓名、昵称、性别、居住地、国籍、身份标识等。

服务器120将已构建的用户画像16发送至智能音箱110中，智能音箱110根据用户画像16以及接收到的语句进行应答。

可以理解的是，上述基于用户画像的对话方法仅以智能音箱为例进行说明，该基于用户画像的对话方法还可以应用于智能手机中，如智能手机中的虚拟助理。本申请实施例对应用场景不加以限定。

为了方便表述，下述各个实施例以用户画像的构建方法和基于用户画像的对话方法由服务器执行为例进行说明。

图2示出了本申请一个示例性实施例提供的用户画像的构建方法的流程图。本实施例以该方法用于如图1所示的计算机系统100中的服务器120为例进行说明，该方法包括如下步骤：

步骤201，获取用户帐号的历史对话数据。

历史对话数据是用户在与智能音箱110进行历史聊天会话过程中产生的数据。在一些实施例中，智能音箱110中安装有支持聊天对话的应用程序，该应用程序可以为即时通讯应用程序、社交类应用程序、购物类应用程序、点餐类应用程序、游戏类应用程序等，历史对话数据包括从应用程序中获取到的历史对话数据。示意性的，智能音箱110向服务器发送对话请求（Query），该对话请求包括用户帐号的历史对话数据，服务器120在接收到该请求时，对历史对话数据进行处理。

示意性的，用户帐号的历史对话数据存储在智能音箱110中，或者，用户帐号的历史对话数据存储在服务器120中。

示意性的，历史对话数据与用户帐号以键值对（Key-Value）的形式存储在服务器120中。用户在与智能音箱110对话时，智能音箱110获取用户帐号，并将用户帐号发送至服务器120中，服务器120根据用户帐号获取对应的历史对话数据。示意性的，历史对话数据存储在智能音箱110中，智能音箱110将历史对话数据发送至服务器120中。

在一些实施例中，智能音箱110中构建有音色识别模型，可对用户的音色进行识别，根据音色确定用户帐号，并将用户帐号发送至服务器120中，服务器120再根据用户帐号获取历史对话数据；在另一些实施例中，智能音箱110直接将识别到的音色发送至服务器120，服务器120存储有音色和历史对话数据之间的对应关系，从而根据用户的音色获取历史对话数据。

步骤202，对历史对话数据进行特征提取，得到历史对话特征。

示意性的，智能音箱110中构建有特征提取模型，智能音箱110将提取到的历史对话特征发送至服务器120中，或者，服务器120中构建有特征提取模型，调用特征提取模型对历史对话数据进行特征提取，得到历史对话特征。

在一些实施例中，特征提取模型包括语言模型，语言模型用于对历史对话数据进行分析，从历史对话数据中提取实体特征以及实体之间的依赖关系。语言模型根据实体特征和依赖关系确定用户输入的语句对应的语义意图，输出历史对话特征，即语言模型输出历史对话数据对应的语义向量表示。

示意性的，智能音箱110中还构建有声学模型，或者，服务器120中构建有声学模型。该声学模型用于将接收到的用户发出的语音转换成文本，将转换后的文本输入至语言模型中，从而确定历史对话特征。每个用户帐号对应的历史对话数据存储在存储介质中，当需要预测指定用户帐号对应的用户画像时，通过读取指定用户的历史对话数据以及用户帐号的信息对用户画像进行预测。

步骤203，对历史对话特征和用户帐号对应的用户信息进行分类处理，得到用户帐号对应的至少两个维度的用户标签，用户标签用于根据历史对话数据对用户帐号对应的用户行为数据进行分类。

用户帐号对应的用户信息是指用户固有的属性信息，用户信息包括用户的姓名、昵称、年龄、性别、居住地、国籍、星座、身份标识等。在一些实施例中，用户信息是用户在注册用户帐号时填写的信息，或者，用户信息是用户进行问卷调查时填写的信息，或者，用户信息是用户在进行授权操作时使用到的信息。

用户标签是指对用户的某项特征进行抽象和分类概括，本申请实施例中的用户标签用于根据历史对话数据对用户帐号对应的用户行为数据进行分类。用户行为数据是指用户在使用互联网产品时产生的行为数据，比如，用户在使用游戏应用程序时，对应有游戏行为数据（包括游戏帐号、昵称、等级、使用的虚拟角色的名称、使用的技能、游戏的胜率、对局的次数等）；用户在使用社交应用程序时，对应有社交行为数据（包括社交帐号、昵称、等级、在社交平台发布的动态、最近使用的表情等）。

每个用户标签对应有一个值，比如，用户标签为性别标签，男性的标签值为0，女性的标签值为1。在一些实施例中，同一维度下的用户标签对应有多个子标签，比如，用户标签为兴趣，兴趣标签对应有科技标签、娱乐标签、绘画标签、动漫标签、公益标签等多个子标签。可以理解的是，每个子标签下还可以划分为多个子标签，比如，在绘画标签这一子标签下，对应有素描标签、简笔画标签、水彩标签、速写标签等。

智能音箱110中构建有多维度标签分类器，或者，服务器120中构建有多维度标签分类器。示意性的，服务器120调用多维度标签分类器对历史对话特征和用户信息进行分类处理，输出用户帐号对应的至少两个维度的用户标签。多维度标签分类器是具有对多个维度的用户标签进行分类的能力的机器学习模型。

在一些实施例中，多维度标签分类器包括与n个维度的用户标签对应的n个标签分类器，n为正整数。将历史对话特征和用户帐号对应的用户信息输入至该多维度的标签分类器中，输出各个维度的用户标签。

示意性的，采用多个平行分类器，每个平行分类器分别对应一个维度的用户标签，多个平行分类器分别进行训练。示意性的，该平行分类器包括逻辑回归函数（Softmax）层。将历史对话特征和用户帐号对应的用户信息输入至该多个平行分类器中，通过各个平行分类器分别输出各个维度的用户标签，如平行分类器1输出兴趣维度的用户标签，平行分类器2输出个性维度的用户标签。

步骤204，根据至少两个维度的用户标签构建用户画像。

用户画像是指指建立在一系列真实数据之上的目标用户模型，真实用户的虚拟代表。可以理解的是，用户标签的维度越多，构建的用户画像越完整，能够更加准确地代表真实的用户；同一维度的用户标签下对应的子标签越多，则该维度的用户标签越完整，该维度的用户标签能够准确反映用户在这一维度下的特征。

由多维度标签分类器输出的至少两个维度的用户标签构建用户画像。

综上所述，本实施例提供的方法，通过对获取到的用户帐号对应的历史数据进行分类处理，得到至少两个维度的用户标签，利用上下文关系准确地理解用户的语义意图，使得基于正确的语义意图下能够获取到准确且全面的用户标签，从而构建准确且全面的用户画像，使得终端能够根据用户画像与用户智能地进行对话。

图3示出了本申请另一个示例性实施例提供的用户画像的构建方法的流程图。本实施例以该方法用于如图1所示的计算机系统100中的服务器120为例进行说明，该方法包括如下步骤：

步骤301，获取用户帐号的历史对话数据。

历史对话数据是用户在与智能音箱110进行历史聊天会话过程中产生的数据。在一个示例中，智能音箱110中安装有社交类应用程序，该社交类应用程序包括用户帐号对应的历史对话数据。智能音箱向历史对话数据发送对话请求，该对话请求携带有用户帐号的历史对话数据。

示意性的，用户帐号的历史对话数据存储在服务器120中。如图4所示，历史对话数据与用户帐号以键值对（Key-Value）的形式存储在数据库（Remote Dictionary Server，Redis）中，服务器120根据用户帐号（键值，Key）从数据库中查询对应的历史对话数据（值，Value）。

在一些实施例中，服务器120中构建有音色识别模型，可对用户的音色进行识别，根据音色确定用户帐号，从而获取用户帐号对应的历史对话数据；在另一些实施例中，智能音箱110中构建有音色识别模型，智能音箱110将识别到的音色数据发送至服务器120，服务器120存储有音色数据和历史对话数据之间的对应关系，从而根据用户的音色获取历史对话数据。

步骤302，调用预训练语言模型GPT-2对历史对话数据进行处理，输出历史对话数据对应的历史对话特征。

如图4所示，服务器120将历史对话数据转换为历史对话文本，服务器120中构建有语言模型41，调用语言模型41对历史对话数据和用户帐号对应的用户信息进行特征提取，得到历史对话特征。语言模型41用于对历史对话数据（历史对话文本）进行分析，从历史对话数据中提取实体特征以及实体之间的依赖关系。语言模型根据实体特征和依赖关系确定用户输入的语句对应的语义意图。

用户帐号对应的用户信息是服务器120根据用户帐号对应的用户行为数据实时获取的。通过用户帐号查询服务和用户基础数据查询服务获取用户基础信息，如用户的性别、年龄、用户帐号、身份认证标识、国籍、所在省市、好友数量、是否参与活动（如，娱乐活动）。以在音乐应用程序产生的用户行为数据为例，通过歌手推荐解结果查询服务和歌曲推荐结果查询服务获取用户音乐信息，如从候选歌手列表中获取用户喜爱的歌手，从候选歌曲列表中获取用户喜爱的歌曲。以用户基础信息和用户行为数据对应的信息构成用户帐号对应的用户信息。

示意性的，智能音箱110中还构建有声学模型，或者，服务器120中构建有声学模型，该声学模型用于将接收到的用户发出的语音转换成文本，将转换后的文本输入至语言模型中，从而确定历史对话特征。

在一些实施例中，语言模型41包括基于转换器模型的双向解码表示模型（Bidirectional Encoder Representations from Transformers，BERT模型），服务器120也可通过调用BERT模型从历史对话数据中提取历史对话特征。

在另一些实施例中，语言模型41包括预训练语言模型（Generative Pre-Training，GPT-2模型），本申请实施例以预训练语言模型为分类式模型为例。服务器120调用GPT-2模型对历史对话数据进行处理，输出历史对话数据对应的历史对话特征。GPT-2模型包括多层转换器模型（Transformer模型）中的解码器部分，如图6所示，在GPT-2模型中包括12层Transformer模型61，其中每层Transformer模型包括归一化层62、遮掩式多头注意力机制层63、前馈神经网络层64。前一个Transformer模型的输出向量是下一个Transformer模型的输入向量，其中第一个Transformer模型的输入向量是经过文本嵌入和位置嵌入后的向量。

相比于BERT模型，GPT-2模型没有使用双向的Transformer模型，采用单向的12层Transformer模型，GPT-2模型需要确定的参数量更大，此外，GPT-2模型通过无监督的方式以及较大的参数量，能够训练出一个类似百科全书的模型，无需带有标注的样本数据也能实现特征提取。

在一些实施例中，服务器也可通过调用基于转换器模型的双向解码表示模型（Bidirectional Encoder Representations from Transformers，BERT模型）从历史对话数据中提取历史对话特征，相比于GPT-2模型，BERT模型是基于Transformer模型的编码器部分进行构建的。

步骤303，将历史对话特征和用户帐号对应的用户信息数输入至n个标签分类器中，输出用户帐号在n个维度上的标签预测概率。

示意性的，如图7所示，多维度标签分类器43可输出n个维度上的用户标签，n为正整数。每个标签分类器对应输出一个维度上的用户标签。

如图5所示，根据历史对话数据和用户信息输出兴趣维度的用户标签、个性维度的用户标签、情绪维度的用户标签、反馈维度的用户标签、句式维度的用户标签、语言风格维度的用户标签等，本申请实施例仅以上述维度的标签作为举例，并不限定用户标签的维度。

示意性的，每个标签分类器包括不同的逻辑回归函数层（Softmax），用于输出不同维度的用户标签，如图7所示，标签分类器1输出兴趣维度的用户标签；标签分类器2输出个性维度的用户标签。

在一些实施例中，在将历史对话特征和用户帐号对应的用户信息输入至多维度标签分类器43之前，在预训练语言模型46输出历史对话特征后，将历史对话特征和用户信息输入至全连接层45中，输出中间向量，将该中间向量输入至多维度标签分类器43中，输出用户帐号在n个维度上的标签预测概率。其中，全连接层45用于学习描述输入的历史对话特征与用户标签之间的对应关系的参数。

步骤304，根据标签预测概率得到所述用户帐号在所述n个维度上的用户标签。

上述步骤304可替换为如下步骤：

步骤3041，将n个维度上的标签预测概率按照由大到小的规则进行排序。

示意性的，多维度标签分类器包括10个标签分类器，其中，每个标签分类器输出的标签预测概率分别为（按照标签分类器1、标签分类器2、……的顺序进行排列）：[0.2,0.1,0.05,0.1,0.2,0.02,0.08,0.01,0.01,0.23]。将10个标签预测概率按照由大到小的规则进行排序为：0.23、0.2、0.2、0.1、0.1、0.08、0.05、0.02、0.01、0.01。

步骤3042，根据排序结果从n个维度上的用户标签中选择前k个用户标签。

根据步骤3041中的排序结果，k值取3，从10个维度上的用户标签选择排序为前3的标签预测概率对应的用户标签，即选择标签预测概率为0.23、0.2、0.2对应的用户标签。

步骤3043，将前k个用户标签作为用户帐号在k个维度上的用户标签输出，k≤n，且k为正整数。

因此，将与步骤3042选择出的标签预测概率对应的标签分类器10、标签分类器1和标签分类器5输出用户标签，作为多维度标签分类器输出的三个维度上的用户标签。

示意性的，标签分类器1对应兴趣维度的用户标签，标签分类器2对应个性维度的用户标签，标签分类器10对应语言风格维度的用户标签，则将该三个维度对应的用户标签作为用户帐号对应的用户标签。

步骤305，根据至少两个维度的用户标签构建用户画像。

用户标签的维度越多，构建的用户画像越完整，能够更加准确地代表真实的用户；同一维度的用户标签下对应的子标签越多，则该维度的用户标签越完整，该维度的用户标签能够准确反映用户在这一维度下的特征。

如图5所示，兴趣标签下对应有多个子标签，如数码标签、财经标签、电影标签、音乐标签、汽车标签、摄影标签等。个性标签下对应有多个子标签，如性格标签、态度标签、精神标签、其他标签等，而子标签下还对应有子标签，如性格标签下对应有外向标签和内向标签。兴趣标签和个性标签是在通过多维度标签分类器获得的。

示意性的，服务器120通过如下方式构建用户画像：

1、通过用户帐号对应的浏览信息构建用户画像

服务器获取用户帐号提供的索引信息；根据索引信息获取用户帐号对应的浏览信息；根据浏览信息和至少两个维度的用户标签构建用户画像。

索引信息包括用户通过手动输入的方式输入的信息、用户通过语音输入方式的输入的信息和用户通过语音转文本方式输入的信息中的至少一种。

在一个示例中，用户对智能音箱110说出索引信息：搜索电视剧A，智能音箱110对应的服务器120根据该索引信息搜索电视剧A（用户想要浏览的浏览信息），服务器120确定用户对电视剧A感兴趣，或服务器120确定用户对电视剧A这类型的电视剧感兴趣，或服务器120确定用户对电视剧感兴趣，调用多维度标签分类器输出至少两个维度的用户标签，如电视剧标签或A型电视剧标签（即电视剧标签的子标签）、追剧标签、刷剧爱好者标签等，并根据至少两个维度的用户标签构建用户画像。

2、通过用户帐号对应的兴趣信息构建用户画像

服务器获取用户帐号对应的兴趣信息；根据兴趣信息和至少两个维度的用户标签构建用户画像。

示意性的，以兴趣信息是游戏信息。在一个示例中，用户是游戏爱好者，服务器120记录有用户参与游戏的游戏信息，比如，用户参与的游戏类型、游戏帐号、游戏昵称、游戏等级、使用的技能（或道具）、游戏好友、获胜率、参与游戏的频率及时间等。服务器120可基于游戏信息调用多维度标签分类器输出至少两个维度的用户标签，如游戏标签、上分标签、练级标签等，根据输出的至少两个维度的用户标签构建用户画像。

3、通过用户帐号对应的社交动态信息构建用户画像

服务器获取用户帐号对应的社交动态信息；根据社交动态信息和至少两个维度的用户标签构建用户画像。

在一个示例中，用户经常在社交应用程序上发布动态或浏览好友发布的社交动态，服务器120记录用户在社交应用程序上的社交动态信息，比如，用户发布的文字信息、视频信息、图片信息、用户的点赞信息、评论信息等。服务器120基于社交动态信息调用多维度标签分类器输出至少两个维度的用户标签，如社交达人标签、互动标签等，根据至少两个维度的用户标签构建用户画像。

服务器在构建用户画像后，将用户画像与用户帐号以键值对的形式存储在用户画像数据库44中，服务器120根据用户帐号从用户画像数据库44中确定用户画像。

示意性的，以表一表示用户与智能音箱的历史对话以及多维度标签分类器输出的用户标签。

表一

智能音箱根据与用户的历史对话生成三个维度（兴趣、个性和行为）的用户标签。其中每个维度的用户标签还对应有一个或多个子标签。

示意性的，以表二表示用户与智能音箱的历史对话以及多维度标签分类器输出的另一用户标签。

表二

智能音箱根据与用户的历史对话生成三个维度的用户标签（兴趣、个性和行为）。其中每个维度的用户标签还对应有一个或多个子标签。表二中的用户标签和表一中的用户标签对应同一个用户或不同的用户。

综上所述，本实施例的方法，通过对获取到的用户帐号对应的历史数据进行分类处理，得到至少两个维度的用户标签，利用上下文关系准确地理解用户的语义意图，使得基于正确的语义意图下能够获取到准确且全面的用户标签，从而构建准确且全面的用户画像，使得终端能够根据用户画像与用户智能地进行对话。

通过调用预训练语言模型对历史对话数据进行特征提取，使得提取到的历史对话特征能够准确代表用户，使得多维度标签分类器准确输出多个维度的用户标签。

通过多维度标签分类器中的n个标签分类器分别输出n个维度上的标签预测概率，根据n个维度的标签预测概率来确定n个维度的用户标签，由于n个标签分类器相互独立，使得输出的多维度的用户标签更加准确，用户画像基于多种维度进行准确构建。

通过将各个标签分类器输出的标签预测概率进行排序，通过输出标签预测概率较大的前k个用户标签，根据标签预测概率来确定用户帐号对应的多个维度的用户标签。

基于图3的可选实施例中，多维度标签分类器可通过如下方式进行训练，如图8所示：

步骤801，获取至少一个用户帐号对应的样本历史对话数据，样本历史对话数据对应有至少两个维度的真实用户标签。

示意性的，样本历史对话数据包括服务器根据每次用户与智能音箱对话时生成的用户标签，或者，样本历史对话数据是已有的数据集。在一个示例中，一组样本历史对话数据包括用户与智能音箱进行十轮对话对应的数据，一轮对话是以用户开始，以智能音箱的应答为结束，即一问一答形成一轮对话。一组样本历史对话数据对应有三个维度的用户标签，如兴趣标签、个性标签和情绪标签。

首先，确定用户标签的标签体系，如图5所示，结合用户与智能音箱进行对话时的对话数据建立用户标签的标签体系。标签体系包括用户标签的多个维度，如兴趣维度、个性维度、行为维度、情绪维度、反馈情况维度（用户在与智能音箱对话时用户的反馈情况，比如反馈信息是否及时）、句式维度、语言风格维度和主题话题维度等，针对不同的维度设置不同的标签值。需要说明的是，用户标签之间是不互斥的，即同一个维度的用户标签下允许多个用户标签存在，比如，当多维度标签分类器生成用户帐号A的用户标签为可爱标签和幽默标签，这两种标签均属于语言风格维度标签下的二级子标签，即一个用户帐号的用户标签可属于同一维度的用户标签。

结合上述标签体系获取用于训练多维度标签分类器的样本历史对话数据，其中样本历史对话数据是标注有真实用户标签的历史对话数据。

步骤802，从样本历史对话数据中提取样本历史对话特征。

示意性的，通过特征提取模型或语言模型从样本历史对话数据中提取样本历史对话特征，此处参见步骤302的实施方式，此处不再赘述。需要说明的是，当调用GPT-2模型对样本历史对话数据进行特征提取时，样本历史对话数据无需进行标注，GPT-2模型可基于无监督的学习方式进行训练，从而提取样本历史对话特征。

步骤803，将样本历史对话特征输入至多维度标签分类器中，输出样本用户帐号对应的至少两个维度的预测用户标签。

多维度标签分类器包括n个维度对应的n个标签分类器，n为正整数，每个标签分类器对应输出一个维度的用户标签，如，标签分类器1输出兴趣维度的预测用户标签，标签分类器2输出行为维度的预测用户标签，标签分类器3输出语言风格维度的预测用户标签。

步骤804，根据真实用户标签和预测用户标签对多维度标签分类器进行训练，得到训练后的多维度标签分类器。

利用误差函数计算真实用户标签和预测用户标签的误差结果，根据误差结果利用误差反向传播算法训练多维度标签分类器。本申请实施例对误差函数的类型不加以限定。

上述步骤804可替换为如下步骤:

步骤8041，根据用户帐号在第i个维度上的预测用户标签和第i个维度对应的真实用户标签，对第i个维度对应的第i个标签分类器进行训练，得到训练后的第i个标签分类器，i≤n，且i为正整数。

对多维度标签分类器中的各个标签分类器分别进行单独训练，以第i个标签分类器为例。

在训练第i个标签分类器时，根据第i个标签分类器输出的预测用户标签以及该第i个标签分类器对应的第i个维度的真实用户标签对第i个标签分类器进行训练。比如，第i个标签分类器对应的第i个维度为兴趣维度的用户标签，兴趣维度对应的真实用户标签为娱乐标签，第i个标签分类器输出的预测用户标签为追星标签，根据娱乐标签和追星标签之间的误差损失来训练第i个标签分类器。

步骤8042，重复上述训练所述第i个标签分类器的步骤，直到n个标签分类器被训练，得到训练后的多维度标签分类器。

按照步骤8041所述的方法，重复训练多维度标签分类器中的各个标签分类器，从而得到训练后的多维度标签分类器。

综上所述，本实施例提供的方法，通过获取用户帐号对应的样本历史对话数据来分别训练多维度标签分类器中的各个标签分类器，提高了训练后的多维度标签分类器对用户标签的预测准确率，使得后续服务器能够基于准确的用户标签构建准确的用户画像。

基于图3的可选实施例中，在构建用户画像后，服务器可不断根据新的用户对话获得新的用户标签，从而更新用户画像。该方法包括如下步骤：

步骤306，获取正在进行的对话。

智能音箱将最近一次与用户进行的对话发送至服务器中，同时服务器获取到该对话对应的用户帐号。

步骤307，响应于对话未匹配有所述用户标签，根据正在进行的对话得到第一用户标签。

服务器根据用户帐号从用户画像数据库中查询用户画像，结合该对话的内容确定是否具有符合的用户标签。响应于该对话未匹配有用户标签，则服务器根据上述实施例中的方式，调用语言模型对该对话进行特征提取，得到该对话的对话特征，调用多维度标签分类器对该对话特征进行处理，输出该对话对应的用户标签。该用户标签为第一用户标签。

步骤308，根据第一用户标签更新已有的用户标签，得到第二用户标签。

服务器将第一用户标签与用户帐号建立关联关系，服务器对该用户帐号对应的第一用户标签进行更新，得到更新后的用户标签（第二用户标签）。

步骤309，根据第二用户标签更新用户画像。

将该第二用户标签添加至该用户帐号对应的用户画像中，得到更新后的用户画像。服务器将更新后的用户画像存储在用户画像数据库中。

综上所述，本实施例提供的方法，通过根据新的用户对话不断更新用户标签，从而不断更新用户画像，使得生成的用户画像越来越全面。

基于图3的可选实施例中，若历史对话数据包括与人工智能对话设备相关的数据，则执行如下步骤：

步骤320，响应于历史对话数据包括终端的历史使用数据，从历史使用数据中提取使用参数。

上述实施例中提供的用户画像的构建方法可应用在AI对话设备中。AI对话设备是指利用人工智能技术实现的电子设备，AI对话设备能够以便捷的方式用户进行交互，如智能手机中的虚拟助理、智能音箱等智能设备。AI对话设备可与智能家居终端连接，从而控制智能家居终端。在一些实施例中，历史使用数据包括用户使用终端时设置的参数数据，比如，空调的温度、制冷或制热模式、风量大小等参数。

步骤340，根据使用参数配置终端。

示意性的，服务器可针对历史使用数据建立与智能家居终端有关的使用标签。将该使用标签与用户帐号建立关联关系，存储在用户画像数据库中。在一些实施例中，服务器根据使用标签构建“使用画像”，该“使用画像”独立于“用户画像”，用于记录智能家居终端的使用参数，或者，将使用标签添加作为新的用户标签更新用户画像。

综上所述，本实施例提供的方法，通过历史对话数据中的历史使用数据来控制终端，使得服务器可基于历史使用数据生成使用标签和使用画像，从而帮助用户更方便地使用其它终端。

下面对基于用户画像的对话方法进行说明。

图9示出了本申请一个示例性实施例提供的基于用户画像的对话方法的流程图，本实施例以该方法用于如图1所示的计算机系统100中为例进行说明，该方法包括如下步骤：

步骤901，获取正在进行对话的用户帐号。

用户与智能音箱进行对话。示意性的，智能音箱中运行有对话应用程序（或对话系统），应用程序登录有用户的用户帐号，智能音箱获取正在进行对话的用户帐号。

在一些实施例中，登录帐号的用户与正在与智能音箱进行对话的用户不是同一用户，智能音箱通过对接收到的音频进行识别，获取正在进行对话的用户的用户身份。

步骤902，获取用户帐号对应的用户画像，用户画像包括至少两个维度的用户标签，用户标签是对历史对话特征和用户帐号对应的用户信息进行分类处理后得到的，历史对话特征是从用户帐号的历史对话数据中提取的。

示意性的，智能音箱中存储有用户帐号对应的用户画像，则智能音箱根据用户帐号确定用户画像。示意性的，智能音箱向对话应用程序的服务器发送请求，该请求中携带有用户帐号，服务器根据用户帐号获取对应的用户画像。用户画像是根据上述实施例中提供的用户画像的构建方法得到的。

在一些实施例中，智能音箱根据接收到的音频识别用户身份，根据用户身份确定用户画像。在另一些实施例中，智能音箱将接收到的音频发送至对话应用程序的服务器中，服务器中构建有音色识别模型，服务器调用音色识别模型对接收到的音频进行识别，得到用户身份，服务器根据用户身份获取用户画像，或者，服务器将用户身份发送至智能音箱，智能音箱根据用户身份确定用户画像。

步骤903，根据用户画像获取用户帐号对应的对话主题兴趣列表，对话主题兴趣列表包括至少一个对话主题。

示意性的，服务器从用户画像数据库44中获取用户画像。服务器根据用户画像获取对话主题兴趣列表，从对话主题兴趣列表中选择目标对话主题。

示意性的，目标对话主题的选择方式包括如下步骤：

S1，获取对话主题兴趣列表中各个对话主题对应的用户标签。

服务器存储有多个对话主题列表：候选话题列表（如，社交应用中的热门话题形成的话题列表）、候选新闻列表、天气标签列表。在一个示例中，服务器根据用户画像获取的对话主题兴趣列表为候选新闻列表，候选新闻列表包括财经新闻对话主题、民生新闻对话主题、社会新闻对话主题和国际新闻对话主题。一个对话主题对应有一个或多个用户标签，示意性的，财经新闻对话主题对应有财经标签，民生新闻对话主题对应有民生标签，社会新闻对话主题对应有社会标签，国际新闻对话主题对应有国际标签。

S2，根据用户标签对应的权重计算各个对话主题的兴趣值。

示意性的，财经标签的权重为0.2，民生标签的权重为0.5，社会标签对应的权重为0.2，国际标签的权重为0.1。服务器根据用户标签对应的权重计算各个对话主题的兴趣值。

S3，根据兴趣值对各个对话主题进行排序。

示意性的，兴趣值按照降序规则进行排序的排序结果为民生新闻对话主题、财经新闻对话主题、社会新闻对话主题、国际新闻对话主题。

S4，将排序结果前N的对话主题确定为目标对话主题，N为正整数。

服务器选择排序结果的前两名对应的对话主题作为目标对话主题，即将民生新闻对话主题和财经新闻对话主题作为目标对话主题。

步骤904，根据对话主题兴趣列表输出应答语句。

根据目标对话主题输出应答语句。服务器将目标对话主题发送至智能音箱中，智能音箱根据目标对话主题和应答模板输出应答语句。示意性的，目标对话主题为民生新闻对话主题和财经新闻对话，智能音箱优先按照民生新闻对话主题和应答模板输出应答语句。

综上所述，本实施例提供的方法，通过与用户帐号获取对应的用户画像与用户进行对话，使得智能音箱能够发起用户感兴趣的话题，从而保证用户能够更便捷地使用智能音箱提供的服务。

基于图9的可选实施例中，智能设备还可基于对话主题控制终端，该方法包括如下步骤：

步骤905，响应于对话主题与终端匹配，获取终端的使用数据。

示意性的，服务器将对话主题发送至智能音箱中，对话主题是关于使用智能家居终端的话题，智能家居终端与智能音箱连接。智能音箱获取该智能家居终端的使用数据，使用数据包括用户使用终端时设置的参数数据，比如，空调的温度、制冷或制热模式、风量大小等参数。

步骤906，根据使用数据控制终端启动。

智能音箱根据使用参数控制智能家居终端启动，或控制智能终端改变设置参数。如，提高空调的送风温度。

综上所述，本实施例提供的方法，通过智能音箱获取终端的使用数据控制终端，使得用户能够更加便捷地通过智能音箱控制终端。

在一些实施例中，用户画像的构建方法应用于区块链系统的节点设备中，即执行用户画像的构建方法的服务器为区块链系统中的任一节点设备，在节点设备执行上述用户画像的构建方法之后，将本次构建的用户画像上传至区块链系统中，从而在区块链系统上实现用户画像的持久化存储；或当用户画像更新后，将更新后的用户画像上传至区块链系统中进行存储。

在一些实施例中，多维度标签分类器根据已有的用户标签输出本次用户的行为数据对应的用户标签，已有的用户标签包括多维度标签分类器根据本次用户的行为数据已输出的用户标签（此时，本次用户的行为数据对应的用户标签还未全部输出），已有的用户标签还包括多维度标签分类器根据用户的历史行为数据（一次或多次）输出的用户标签。

示意性的，多维度标签分类器根据历史行为数据输出本次行为数据对应的用户标签，其中，历史行为数据对应的用户标签存储在区块链系统中的第一区块，区块链系统的任一节点从第一区块中获取历史行为数据对应的用户标签，并向区块链系统中的其他节点发送区块生成请求，该区块生成请求携带有第一区块的第一区块地址和第一私钥。其他节点根据第一区块地址确定第一区块，且通过第一私钥对第一区块进行成功解密，进而从第一区块中获取基于历史行为数据得到的用户标签，多维度标签分类器综合基于历史行为数据得到的用户标签输出本次行为数据对应的用户标签，在其他节点达成共识后生成第二区块，将多维度标签分类器基于本次行为数据输出的用户标签存储在第二区块中。

图10示出了本申请一个示例性实施例提供的用户画像的构建装置的结构框图，该装置包括：

第一获取模块1010，用于获取用户帐号的历史对话数据；

特征提取模块1020，用于对历史对话数据进行特征提取，得到历史对话特征；

分类模块1030，用于对历史对话特征和用户帐号对应的用户信息进行分类处理，得到用户帐号对应的至少两个维度的用户标签，用户标签用于根据历史对话数据对用户帐号对应的用户行为数据进行分类；

构建模块1040，用于根据至少两个维度的用户标签构建用户画像。

在一个可选的实施例中，所述分类模块1030，用于调用多维度标签分类器对历史对话特征和用户帐号对应的用户信息进行分类处理，输出用户帐号对应的至少两个维度的用户标签。

在一个可选的实施例中，多维度标签分类器包括与n个维度的用户标签对应的n个标签分类器，n为正整数；

所述分类模块1030，用于将历史对话特征和用户帐号对应的用户信息数输入至n个标签分类器中，输出用户帐号在n个维度上的标签预测概率；根据标签预测概率得到用户帐号在n个维度上的用户标签。

在一个可选的实施例中，所述分类模块1030，用于将n个维度上的标签预测概率按照由大到小的规则进行排序；根据排序结果从n个维度上的用户标签中选择前k个用户标签；将前k个用户标签作为用户帐号在k个维度上的用户标签输出，k≤n，且k为正整数。

在一个可选的实施例中，所述特征提取模块1020，用于调用预训练语言模型GPT-2对历史对话数据进行处理，输出历史对话数据对应的历史对话特征。

在一个可选的实施例中，所述第一获取模块1010，用于获取用户帐号提供的索引信息；根据索引信息获取用户帐号对应的浏览信息；所述构建模块1040，用于根据浏览信息和至少两个维度的用户标签构建用户画像；或，第一获取模块1010，用于获取用户帐号对应的兴趣信息；所述构建模块1040，用于根据兴趣信息和至少两个维度的用户标签构建用户画像；或，所述第一获取模块1010，用于获取用户帐号对应的社交动态信息；所述构建模块1040，用于根据社交动态信息和至少两个维度的用户标签构建用户画像。

在一个可选的实施例中，该装置包括训练模块1050；

所述第一获取模块1010，用于获取至少一个用户帐号对应的样本历史对话数据，样本历史对话数据对应有至少两个维度的真实用户标签；

所述特征提取模块1020，用于从样本历史对话数据中提取样本历史对话特征；

所述分类模块1030，用于将样本历史对话特征和用户帐号对应的用户信息输入至多维度标签分类器中，输出用户帐号对应的至少两个维度的预测用户标签；

所述训练模块1050，用于根据真实用户标签和预测用户标签对多维度标签分类器进行训练，得到训练后的多维度标签分类器。

所述训练模块1050，用于根据用户帐号在第i个维度上的预测用户标签和第i个维度对应的真实用户标签，对第i个维度对应的第i个标签分类器进行训练，得到训练后的第i个标签分类器，i≤n，且i为正整数；重复上述训练第i个标签分类器的步骤，直到n个标签分类器被训练，得到训练后的多维度标签分类器。

在一个可选的实施例中，所述第一获取模块1010，用于获取正在进行的对话；所述构建模块1040，用于响应于对话未匹配有用户标签，根据正在进行的对话得到第一用户标签；根据第一用户标签更新已有的用户标签，得到第二用户标签；根据第二用户标签更新用户画像。

在一个可选的实施例中，所述特征提取模块1020，用于响应于历史对话数据包括终端智能设备的历史使用数据，从历史使用数据中提取使用参数；根据使用参数配置智能设备终端。

综上，本实施例提供的装置，通过对获取到的用户帐号对应的历史数据进行分类处理，得到至少两个维度的用户标签，利用上下文关系准确地理解用户的语义意图，使得基于正确的语义意图下能够获取到准确且全面的用户标签，从而构建准确且全面的用户画像，使得终端能够根据用户画像与用户智能地进行对话。

通过获取用户帐号对应的样本历史对话数据来分别训练多维度标签分类器中的各个标签分类器，提高了训练后的多维度标签分类器对用户标签的预测准确率，使得后续服务器能够基于准确的用户标签构建准确的用户画像。

通过根据新的用户对话不断更新用户标签，从而不断更新用户画像，使得生成的用户画像越来越全面。

通过历史对话数据中的历史使用数据来控制终端，使得服务器可基于历史使用数据生成使用标签和使用画像，从而帮助用户更方便地使用其它终端。

需要说明的是：上述实施例提供的用户画像的构建装置，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的用户画像的构建装置与用户画像的构建方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

图11示出了本申请一个示例性实施例提供的基于用户画像的对话装置的结构框图，该装置包括：

第二获取模块1110，用于获取正在进行对话的用户帐号；

所述第二获取模块1110，用于获取用户帐号对应的用户画像，用户画像包括至少两个维度的用户标签，用户标签是对历史对话特征和用户帐号对应的用户信息进行分类处理后得到的，历史对话特征是从用户帐号的历史对话数据中提取的；

所述第二获取模块1110，用于根据用户画像获取用户帐号对应的对话主题兴趣列表，对话主题兴趣列表包括至少一个对话主题；

输出模块1120，用于根据对话主题兴趣列表输出应答语句。

在一个可选的实施例中，所述输出模块1120，用于从对话主题兴趣列表中选择目标对话主题；根据目标对话主题输出应答语句。

在一个可选的实施例中，所述第二获取模块1110，用于获取对话主题兴趣列表中各个对话主题对应的用户标签；所述输出模块1120，用于根据用户标签对应的权重计算各个对话主题的兴趣值；根据兴趣值对各个对话主题进行排序；将排序结果前N的对话主题确定为目标对话主题，N为正整数。

在一个可选的实施例中，所述第二获取模块1110，用于响应于对话主题与终端匹配，获取终端的使用数据；根据使用数据控制终端启动。

综上所述，本实施例提供的装置，通过与用户帐号获取对应的用户画像与用户进行对话，使得智能音箱能够发起用户感兴趣的话题，从而保证用户能够更便捷地使用智能音箱提供的服务。

通过智能音箱获取终端的使用数据控制终端，使得用户能够更加便捷地通过智能音箱控制终端。

需要说明的是：上述实施例提供的基于用户画像的对话装置，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的基于用户画像的对话装置与基于用户画像的对话方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

图12示出了本申请一个示例性实施例提供的服务器的结构示意图。该服务器可以如图1所示的计算机系统100中的服务器120。

服务器1200包括中央处理单元（CPU，Central Processing Unit）1201、包括随机存取存储器（RAM，Random Access Memory）1202和只读存储器（ROM，Read Only Memory）1203的系统存储器1204，以及连接系统存储器1204和中央处理单元1201的系统总线1205。服务器1200还包括帮助计算机内的各个器件之间传输信息的基本输入/输出系统（I/O系统，Input Output System）1206，和用于存储操作系统1213、应用程序1214和其他程序模块1215的大容量存储设备1207。

基本输入/输出系统1206包括有用于显示信息的显示器1208和用于用户输入信息的诸如鼠标、键盘之类的输入设备1209。其中显示器1208和输入设备1209都通过连接到系统总线1205的输入输出控制器1212连接到中央处理单元1201。基本输入/输出系统1206还可以包括输入输出控制器1212以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地，输入输出控制器1212还提供输出到显示屏、打印机或其他类型的输出设备。

大容量存储设备1207通过连接到系统总线1205的大容量存储控制器（未示出）连接到中央处理单元1201。大容量存储设备1207及其相关联的计算机可读介质为服务器1200提供非易失性存储。也就是说，大容量存储设备1207可以包括诸如硬盘或者紧凑型光盘只读存储器（CD-ROM，Compact Disc Read Only Memory）驱动器之类的计算机可读介质（未示出）。

计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、可擦除可编程只读存储器（EPROM，Erasable Programmable Read Only Memory）、带电可擦可编程只读存储器（EEPROM，Electrically Erasable Programmable Read Only Memory）、闪存或其他固态存储其技术，CD-ROM、数字通用光盘（DVD，Digital Versatile Disc）或固态硬盘（SSD，Solid State Drives）、其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。其中，随机存取记忆体可以包括电阻式随机存取记忆体（ReRAM，Resistance RandomAccess Memory）和动态随机存取存储器（DRAM，Dynamic Random Access Memory）。当然，本领域技术人员可知计算机存储介质不局限于上述几种。上述的系统存储器1204和大容量存储设备1207可以统称为存储器。

根据本申请的各种实施例，服务器1200还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即服务器1200可以通过连接在系统总线1205上的网络接口单元1211连接到网络1212，或者说，也可以使用网络接口单元1211来连接到其他类型的网络或远程计算机系统（未示出）。

上述存储器还包括一个或者一个以上的程序，一个或者一个以上程序存储于存储器中，被配置由CPU执行。

在一个可选的实施例中，提供了一种计算机设备，该计算机设备包括处理器和存储器，存储器中存储有至少一条指令、至少一段程序、代码集或指令集，至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现如上所述的用户画像的构建方法和基于用户画像的对话方法。

在一个可选的实施例中，提供了一种计算机可读存储介质，该存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现如上所述的用户画像的构建方法和基于用户画像的对话方法。

可选地，该计算机可读存储介质可以包括：只读存储器（ROM，Read Only Memory）、随机存取记忆体（RAM，Random Access Memory）、固态硬盘（SSD，Solid State Drives）或光盘等。其中，随机存取记忆体可以包括电阻式随机存取记忆体（ReRAM，Resistance RandomAccess Memory）和动态随机存取存储器（DRAM，Dynamic Random Access Memory）。上述本申请实施例序号仅为了描述，不代表实施例的优劣。

本申请实施例还提供了一种计算机程序产品或计算机程序，所述计算机程序产品或计算机程序包括计算机指令，所述计算机指令存储在计算机可读存储介质中。计算机设备的处理器从所述计算机可读存储介质读取所述计算机指令，所述处理器执行所述计算机指令，使得所述计算机设备执行如上方面所述的用户画像的构建方法和基于用户画像的对话方法。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本申请的可选的实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种用户画像的构建方法，其特征在于，所述方法包括：

获取用户帐号的历史对话数据，所述历史对话数据与所述用户帐号以键值对的形式存储在服务器的数据库中，所述服务器根据所述用户帐号查询对应的所述历史对话数据；

调用预训练语言模型对所述历史对话数据进行处理，输出所述历史对话数据对应的历史对话特征，所述预训练语言模型中包括单向的Transformer模型，每层Transformer模型包括归一化层、遮掩式多头注意力机制层和前馈神经网络层，其中，前一个Transformer模型的输出向量是下一个Transformer模型的输入向量，第一个Transformer模型的输入向量是所述历史对话数据经过文本嵌入和位置嵌入后的向量；

将所述历史对话特征和所述用户帐号对应的用户信息输入至全连接层中，输出中间向量，所述全连接层用于学习描述输入的所述历史对话特征与用户标签之间的对应关系的参数；将所述中间向量输入至多维度标签分类器中的n个标签分类器中，输出所述用户帐号在n个维度上的标签预测概率，n为正整数；所述n个标签分类器中的每个标签分类器包括不同的逻辑回归函数层，用于输出不同维度的用户标签；

将所述n个维度上的标签预测概率按照由大到小的规则进行排序；

根据排序结果从所述n个维度上的用户标签中选择前k个用户标签；

将所述前k个用户标签作为所述用户帐号在k个维度上的用户标签输出，k≤n，且k为正整数；所述用户标签用于根据所述历史对话数据对所述用户帐号对应的用户行为数据进行分类；

获取所述用户帐号提供的索引信息；根据所述索引信息获取所述用户帐号对应的浏览信息；根据所述浏览信息和至少两个维度的用户标签构建所述用户画像；或，获取所述用户帐号对应的社交动态信息；根据所述社交动态信息和至少两个维度的用户标签构建所述用户画像。

2.根据权利要求1所述的方法，其特征在于，所述多维度标签分类器是通过如下方式训练得到的：

获取至少一个用户帐号对应的样本历史对话数据，所述样本历史对话数据对应有所述至少两个维度的真实用户标签；

从所述样本历史对话数据中提取样本历史对话特征；

将所述样本历史对话特征和所述用户帐号对应的用户信息输入至所述多维度标签分类器中，输出所述用户帐号对应的至少两个维度的预测用户标签；

根据所述真实用户标签和所述预测用户标签对所述多维度标签分类器进行训练，得到训练后的多维度标签分类器。

3.根据权利要求2所述的方法，其特征在于，所述多维度标签分类器包括与n个维度的用户标签对应的n个标签分类器，n为正整数；

所述根据所述真实用户标签和所述预测用户标签对所述多维度标签分类器进行训练，得到训练后的多维度标签分类器，包括：

根据所述用户帐号在第i个维度上的预测用户标签和所述第i个维度对应的真实用户标签，对所述第i个维度对应的第i个标签分类器进行训练，得到训练后的第i个标签分类器，i≤n，且i为正整数；

重复上述训练所述第i个标签分类器的步骤，直到所述n个标签分类器被训练，得到所述训练后的多维度标签分类器。

4.根据权利要求1所述的方法，其特征在于，所述方法还包括：

获取正在进行的对话；

响应于所述对话未匹配有所述用户标签，根据所述正在进行的对话得到第一用户标签；

根据所述第一用户标签更新已有的用户标签，得到第二用户标签；

根据所述第二用户标签更新所述用户画像。

5.根据权利要求1所述的方法，其特征在于，所述方法还包括：

响应于所述历史对话数据包括终端的历史使用数据，从所述历史使用数据中提取使用参数；

根据所述使用参数配置所述终端。

6.一种用户画像的构建装置，其特征在于，所述装置包括：

第一获取模块，用于获取用户帐号的历史对话数据，所述历史对话数据与所述用户帐号以键值对的形式存储在服务器的数据库中，所述服务器根据所述用户帐号查询对应的所述历史对话数据；

特征提取模块，用于调用预训练语言模型对所述历史对话数据进行处理，输出所述历史对话数据对应的历史对话特征，所述预训练语言模中包括单向的Transformer模型，每层Transformer模型包括归一化层、遮掩式多头注意力机制层和前馈神经网络层，其中，前一个Transformer模型的输出向量是下一个Transformer模型的输入向量，第一个Transformer模型的输入向量是所述历史对话数据经过文本嵌入和位置嵌入后的向量；

分类模块，用于将所述历史对话特征和所述用户帐号对应的用户信息输入至全连接层中，输出中间向量，所述全连接层用于学习描述输入的所述历史对话特征与用户标签之间的对应关系的参数；将所述中间向量输入至多维度标签分类器中的n个标签分类器中，输出所述用户帐号在n个维度上的标签预测概率，n为正整数；所述n个标签分类器中的每个标签分类器包括不同的逻辑回归函数层，用于输出不同维度的用户标签；

构建模块，用于获取所述用户帐号提供的索引信息；根据所述索引信息获取所述用户帐号对应的浏览信息；根据所述浏览信息和至少两个维度的用户标签构建所述用户画像；或，获取所述用户帐号对应的社交动态信息；根据所述社交动态信息和至少两个维度的用户标签构建所述用户画像。

7.一种计算机设备，其特征在于，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一段程序，所述至少一段程序由所述处理器加载并执行以实现如权利要求1至5任一所述的用户画像的构建方法。

8.一种计算机可读存储介质，其特征在于，所述可读存储介质中存储有至少一段程序，所述至少一段程序由处理器加载并执行以实现如权利要求1至5任一所述的用户画像的构建方法。