CN116795955A

CN116795955A - 数据处理方法、装置、计算机设备及存储介质

Info

Publication number: CN116795955A
Application number: CN202210265111.XA
Authority: CN
Inventors: 王月瑶; 洪楷; 刘伟; 任宪领; 张学亮; 刘雅骏
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2022-03-17
Filing date: 2022-03-17
Publication date: 2023-09-22

Abstract

本申请公开了一种数据处理方法、装置、计算机设备及存储介质，属于计算机技术领域。本申请通过基于目标对象的目标行为类型和目标交互行为，从目标行为类型对应的多个候选信息项中，筛选得到与目标交互行为符合相似条件的目标信息项，并在目标对象与对话机器人的会话中推荐这些目标信息项，使得针对不同的目标对象均能够进行信息项的个性化智能推荐，保证了推荐的信息项均能够与目标对象适配，提升了信息项的推荐准确率，从而提高了人机交互效率。

Description

数据处理方法、装置、计算机设备及存储介质

技术领域

本申请涉及计算机技术领域，特别涉及一种数据处理方法、装置、计算机设备及存储介质。

背景技术

随着智能助理、智能客服、智能问答助手等对话机器人的普及，对话机器人能够在多种具体领域中得到应用，比如，游戏开发领域中，一些办公应用提供有对话机器人，开发者或业务人员能够通过指令跟对话机器人实现智能交互，以完成对游戏业务的决策。

用户能够通过与对话机器人的会话窗口来实现人机交互，比如，在会话窗口中展示一些热门或高频问题，方便用户在打开会话窗口时，通过展示的问题查看相应的回答。上述对话机器人向用户推荐问题的过程，仅根据问题的频次来在会话窗口中进行展示，其问题推荐的准确率低，导致人机交互效率低。

发明内容

本申请实施例提供了一种数据处理方法、装置、计算机设备及存储介质，能够提升在人机交互中信息项的推荐准确率和人机交互效率。该技术方案如下：

一方面，提供了一种数据处理方法，所述方法包括：

获取目标对象的目标行为类型和所述目标行为类型下的目标交互行为，所述目标行为类型表征所述目标对象在与对话机器人的历史会话中所执行交互行为的特征；

基于所述目标交互行为，从所述目标行为类型对应的多个候选信息项中，确定与所述目标对象匹配的至少一个目标信息项，所述目标信息项与所述目标交互行为符合相似条件；

在所述目标对象与所述对话机器人的会话中，向所述目标对象推荐所述至少一个目标信息项。

一方面，提供了一种数据处理装置，所述装置包括：

第一获取模块，用于获取目标对象的目标行为类型和所述目标行为类型下的目标交互行为，所述目标行为类型表征所述目标对象在与对话机器人的历史会话中所执行交互行为的特征；

确定模块，用于基于所述目标交互行为，从所述目标行为类型对应的多个候选信息项中，确定与所述目标对象匹配的至少一个目标信息项，所述目标信息项与所述目标交互行为符合相似条件；

推荐模块，用于在所述目标对象与所述对话机器人的会话中，向所述目标对象推荐所述至少一个目标信息项。

在一种可能实施方式中，所述确定模块包括：

获取单元，用于获取所述目标交互行为的交互行为特征和所述多个候选信息项各自的信息项特征；

筛选单元，用于基于所述交互行为特征与所述信息项特征之间的特征相似度，从所述多个候选信息项中筛选得到所述至少一个目标信息项。

在一种可能实施方式中，所述获取单元用于：

对所述目标交互行为关联的交互文本进行分词，得到多个第一分词；

基于所述多个第一分词编码得到所述交互行为特征；

所述获取单元还用于：

对各个候选信息项的描述文本进行分词，得到多个第二分词；

基于所述多个第二分词编码得到所述信息项特征。

在一种可能实施方式中，所述筛选单元用于：

基于特征相似度从大到小的顺序，对所述多个候选信息项进行排序；

将排序位于前目标位的候选信息项确定为所述至少一个目标信息项。

在一种可能实施方式中，所述装置还包括：

第二获取模块，用于对任一目标信息项，获取所述目标信息项的冷却间隔时长，所述冷却间隔时长用于表征所述目标对象上一次对所述目标信息项执行交互行为的交互时刻与当前时刻之间的时间间隔；

第三获取模块，用于基于所述冷却间隔时长、所述目标对象对所述目标信息项执行交互行为的行为频次以及所述交互行为的行为权重，获取所述目标信息项的重排系数，所述重排系数与所述冷却间隔时长呈正相关；

控制模块，用于基于所述至少一个目标信息项各自的重排系数，控制所述至少一个目标信息项进行重排序。

在一种可能实施方式中，所述第三获取模块用于：

基于所述行为频次和所述行为权重，确定所述目标信息项的行为系数；

基于所述冷却间隔时长和预设的冷却系数，对所述行为系数加权得到所述重排系数。

在一种可能实施方式中，所述确定模块用于：

在所述多个候选信息项包含第一信息项的情况下，确定至少一个第一信息项；

对除了所述第一信息项之外的各个候选信息项，基于所述候选信息项的信息项特征与所述目标交互行为的交互行为特征之间的特征相似度，筛选得到至少一个第二信息项；

从所述至少一个第一信息项和所述至少一个第二信息项中，筛选得到所述至少一个目标信息项。

在一种可能实施方式中，所述第一获取模块包括：

第一确定单元，用于基于所述目标对象的对象属性信息，确定所述对象属性信息关联的多个行为类型；

映射单元，用于基于交互行为和行为类型的映射关系，将所述目标对象在所述历史会话中具有历史执行记录的多次交互行为分别映射至至少一个行为类型；

第二确定单元，用于从所述至少一个行为类型中确定所述目标行为类型。

在一种可能实施方式中，所述第二确定单元用于：

确定所述至少一个行为类型各自的类型频次和类型权重；

基于所述类型频次和类型权重，确定所述至少一个行为类型各自的行为类型系数，所述行为类型系数用于表征所述目标对象与对应行为类型的匹配程度；

将行为类型系数符合目标条件的行为类型确定为所述目标行为类型。

在一种可能实施方式中，所述候选信息项包括下述至少一项：在所述会话中的预设提问；在所述会话中的预设功能接口；在所述会话中的预设数据接口。

在一种可能实施方式中，所述目标对象对所述目标交互行为具有历史执行记录。

一方面，提供了一种计算机设备，该计算机设备包括一个或多个处理器和一个或多个存储器，该一个或多个存储器中存储有至少一条计算机程序，该至少一条计算机程序由该一个或多个处理器加载并执行以实现如上述数据处理方法。

一方面，提供了一种存储介质，该存储介质中存储有至少一条计算机程序，该至少一条计算机程序由处理器加载并执行以实现如上述数据处理方法。

一方面，提供一种计算机程序产品或计算机程序，所述计算机程序产品或所述计算机程序包括一条或多条程序代码，所述一条或多条程序代码存储在计算机可读存储介质中。计算机设备的一个或多个处理器能够从计算机可读存储介质中读取所述一条或多条程序代码，所述一个或多个处理器执行所述一条或多条程序代码，使得计算机设备能够执行上述数据处理方法。

本申请实施例提供的技术方案带来的有益效果至少包括：

通过基于目标对象的目标行为类型和目标交互行为，从目标行为类型对应的多个候选信息项中，筛选得到与目标交互行为符合相似条件的目标信息项，并在目标对象与对话机器人的会话中推荐这些目标信息项，使得针对不同的目标对象均能够进行信息项的个性化智能推荐，保证了推荐的信息项均能够与目标对象适配，提升了信息项的推荐准确率，从而提高了人机交互效率。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还能够根据这些附图获得其他的附图。

图1是本申请实施例提供的一种数据处理方法的实施环境示意图；

图2是本申请实施例提供的一种数据处理方法的流程图；

图3是本申请实施例提供的一种数据处理方法的流程图；

图4是本申请实施例提供的一种数据处理方法的原理性流程图；

图5是本申请实施例提供的一种数据处理方法的另一原理框架图；

图6是本申请实施例提供的一种会话窗口的界面示意图；

图7是本申请实施例提供的一种数据处理装置的结构示意图；

图8是本申请实施例提供的一种计算机设备的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

本申请中术语“第一”“第二”等字样用于对作用和功能基本相同的相同项或相似项进行区分，应理解，“第一”、“第二”、“第n”之间不具有逻辑或时序上的依赖关系，也不对数量和执行顺序进行限定。

本申请中术语“至少一个”是指一个或多个，“多个”的含义是指两个或两个以上，例如，多个第一位置是指两个或两个以上的第一位置。

本申请中术语“包括A或B中至少一项”涉及如下几种情况：仅包括A，仅包括B，以及包括A和B两者。

本申请中涉及到的用户相关的信息(包括但不限于用户的设备信息、个人信息、行为信息等)、数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)以及信号，当以本申请实施例的方法运用到具体产品或技术中时，均为经过用户许可、同意、授权或者经过各方充分授权的，且相关信息、数据以及信号的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。例如，本申请中涉及到的用户账号在人机对话中的历史执行记录都是在充分授权的情况下获取的。

以下，将对本申请实施例涉及的术语进行解释说明。

对话机器人：指能够与用户通过语音或文字等形式实现交互的计算机程序。对话机器人能够模拟人类对话，实现形式如聊天机器人、虚拟助手、智能助理、智能客服、智能问答助手等。对话机器人涉及到一种人机交互过程：用户给定一个输入(如文本、语音或指令)，机器对输入进行问题理解即意图识别并做出智能响应，通常是通过一问一答(即一轮交互)或多轮交互的方式完成对话。

交互设计：是定义、设计人造系统的行为的设计领域，它定义了两个或多个互动的个体之间交流的内容和结构，使之互相配合，共同达成某种目的。在本申请实施例涉及针对基于对话机器人的人机交互系统的交互设计。

游戏领域：针对游戏业务做出的各类决策，包括运营、运维、开发等角色对游戏的支持和维护，游戏领域是一种垂直领域。

侧边栏：针对一些集成对话机器人功能的应用程序，应用程序中提供有一类客服账号，用户在与客服账号的交互过程就是与对话机器人的交互过程，通常，客服账号自带有一个Web主页，比如主页位于会话窗口的侧边栏，在侧边栏中支持对话机器人自定义的URL(Uniform Resource Locator，统一资源定位符)，且用户能够对侧边栏中展示的URL进行点击和查看等交互行为，比如URL包括一些热门问题的URL或者常用功能的URL等。

用户角色：能够表征用户在业务中执行各类决策时扮演的形象，作为一种勾画目标用户、联系用户诉求与设计方向的有效工具，在各领域得到了广泛的应用。

行为类型：也称为行为标签、行为类别，用户账号的行为类型是构成用户角色的核心因素，是将用户在平台内所产生的行为数据(如与对话机器人在历史会话中的各个历史执行记录)，分析提炼后生成具有差异性特征的标签词。

基于内容的推荐算法(Content-Based Recommendations)：指基于待推荐的信息项、用户账号的相关信息(如行为类型、交互行为特征等)及用户对信息项的历史操作行为三部分来构建推荐算法模型，并为用户提供推荐服务。

时间衰减算法：又名牛顿冷却定律，是由英国物理学家艾萨克·牛顿爵士所提出的一个经验性的关系。牛顿冷却定律是指“温度”与“时间”之间的指数衰减函数，在AI算法中，可以根据牛顿冷却定律公式做关于“热度”和“时间”的衰减算法应用，例如，本申请实施例涉及到针对对话机器人在侧边栏展示的信息项，按照牛顿冷却定律，执行“热度”即排序和“时间”即冷却间隔时长的衰减算法，保证在其他排序的影响因素不变的情况下，信息项在侧边栏的排序会随着冷却间隔时长的提升而逐渐衰减。

智能推荐：指基于用户在历史会话的行为数据完成用户聚类分析，给出该类别下相似或相关内容，完成推荐，本申请实施例涉及基于用户在历史会话中具有历史执行记录的交互行为，给出对应行为类型下相似或相关的信息项，完成在对话机器人的侧边栏中的信息项的智能推荐过程。

图1是本申请实施例提供的一种数据处理方法的实施环境示意图。参见图1，在该实施环境中包括：终端110和服务器120，终端110和服务器120均为计算机设备的一种示例。

终端110用于显示被推荐的信息项即目标信息项，终端110上安装和运行有支持对话机器人的应用程序，该应用程序包括但不限于：办公应用、社交应用、企业应用、即时通讯应用、智能助手、智能助理、智能问答助手、支持智能客服的应用、支持聊天机器人的应用、浏览器应用等，本申请实施例不对应用程序的类型进行具体限定。

可选地，对话机器人的产品形态包括但不限于：应用程序中内置的人机交互的功能选项，如内嵌的智能客服、智能管家、服务助手、聊天机器人、对话机器人等功能选项；或者，应用程序中内置的机器人账号，如客服账号、助理账号、闲聊账号、问答账号等；或者，独立的用于支持人机对话的应用程序，比如终端上内置的智能助手、智能助理、智能问答助手等，本申请实施例不对对话机器人的产品形态进行具体限定。

可选地，终端110是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、车载终端、智能家电等，但并不局限于此。

终端110以及服务器120能够通过有线或无线通信方式进行直接或间接地连接，本申请在此不做限制。

服务器120用于为上述支持对话机器人的应用程序提供后台服务，例如，由于终端110在提供基于对话机器人的人机交互功能时，通常会基于对话机器人显示一些预设的信息项，使得用户无需自定义问句或者指令，直接点击显示的信息项就能够快捷提问或者一键进入某一功能，以提升用户的人机交互效率，本申请实施例则涉及到基于对话机器人显示的信息项的智能推荐方案。

示意性地，服务器120在经过用户的授权或者各方充分授权之后，基于用户在终端110上与对话机器人的历史会话的行为数据，从各个候选信息项中，确定出与用户匹配的目标信息项，然后将目标信息项推送到终端110，使得目标对象能够在与对话机器人的会话中查看这些被推荐的目标信息项，由于目标信息项是服务器120针对用户进行个性化推荐的，因此具有很高的匹配程度，使得用户能够方便的通过这些目标信息项进行人机交互，提高了人机交互效率。

可选地，服务器120包括一台服务器、多台服务器、云计算平台或者虚拟化中心中的至少一种。例如，服务器120承担主要计算工作，终端110承担次要计算工作；或者，服务器120承担次要计算工作，终端110承担主要计算工作；或者，终端110和服务器120两者之间采用分布式计算架构进行协同计算。

在一些实施例中，服务器是独立的物理服务器，或者是多个物理服务器构成的服务器集群或者分布式系统，或者是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network，内容分发网络)以及大数据和人工智能平台等基础云计算服务的云服务器。

本领域技术人员可以知晓，上述终端110的数量可以更多或更少。比如上述终端110可以仅为一个，或者上述终端110为几十个或几百个，或者更多数量。本申请实施例对终端110的数量和设备类型不加以限定。

示意性地，办公应用提供有对话机器人的机器人账号，用户打开与机器人账号的会话窗口，能够实现与对话机器人的人机交互。通常，机器人账号具有一个账号主页，比如这一账号主页以会话窗口的侧边栏的形式进行展示，在侧边栏中会面向用户呈现一些智能推荐的信息项，使得用户无需手动编辑任何指令或提问，只需要点击侧边栏中展示的信息项就能够完成交互。

例如，在侧边栏中会展示一些热门或高频问题，方便用户在会话窗口中打开侧边栏时，点击展示的热门或高频问题，以查看问题相应的回答。上述推荐热门或高频问题的过程，需要对机器人账号接收到的所有问题进行分析，统计出每条问题的提问频次，才能够筛选出热门或高频问题。

又例如，在侧边栏中还可以展示一些静态的自助工具，如配置WiFi、远程办公续期、加班报备、图灵测试、数据查询接口等，这些自助工具的展示则依赖于技术人员在服务器侧的预先配置。

能够看出，在侧边栏中推荐的问题是基于提问频次进行筛选，在侧边栏中推荐的自助工具则是技术人员预先配置的固定内容，这会导致不同用户在打开侧边栏时看到的内容是完全一致的，然而，这种内容推荐方式只能满足部分用户的交互需求，无法满足各个用户的个性化交互需求。比如在游戏开发等垂直领域中，当用户在游戏开发中扮演的角色(如职务)不同时，那么在侧边栏中想要查看的内容也是截然不同的，比如游戏运维人员倾向于使用一些客户端发布、测试服发布等功能，而游戏运营人员则倾向于使用一些在线查询、数据统计等功能，如果对运维人员和运营人员均推荐开发人员常用的自助工具或热门问题，那么将无法满足运维人员或运营人员的个性化交互需求，因此存在推荐准确率差、人机交互效率低的问题。

有鉴于此，本申请实施例提供一种数据处理方法，能够针对垂直领域中不同用户进行个性化的精准推荐，使得不同用户在展开对话机器人的侧边栏时能够查看到个性化推荐的信息项，并且还支持根据用户即时反馈的交互行为，对侧边栏中推荐的信息项进行重排序，还能够实现侧边栏与会话窗口的交互执行，能够提升对侧边栏中展示的信息项的推荐准确率，从而提升用户与对话机器人的人机交互效率。

图2是本申请实施例提供的一种数据处理方法的流程图。参见图2，该实施例由计算机设备执行，以计算机设备为服务器为例进行说明，该实施例包括下述步骤：

201、服务器获取目标对象的目标行为类型和该目标行为类型下的目标交互行为，该目标行为类型表征该目标对象在与对话机器人的历史会话中所执行交互行为的特征。

本申请实施例涉及的目标对象，是指能够与对话机器人执行交互行为的对象，通常，目标对象在支持对话机器人的应用程序中注册有对应的账号，使得目标对象能够以该账号为载体来与对话机器人实现交互。

本申请实施例涉及的对话机器人，是指能够与目标对象通过语音、文字、指令等形式实现交互的计算机程序。可选地，对话机器人的产品形态包括但不限于：应用程序中内置的人机交互的功能选项，如内嵌的智能客服、智能管家、服务助手、聊天机器人、对话机器人等功能选项；或者，应用程序中内置的机器人账号，如客服账号、助理账号、闲聊账号、问答账号等；或者，独立的用于支持人机对话的应用程序，比如终端上内置的智能助手、智能助理、智能问答助手等，本申请实施例不对对话机器人的产品形态进行具体限定。

本申请实施例涉及的交互行为，是指目标对象以实现交互为目标与对话机器人执行的互动行为。比如，目标对象向对话机器人输入一个问题，对话机器人向目标对象返回一个回答；又比如，目标对象点击对话机器人的交互界面(如主页、侧边栏、菜单栏、功能栏)中推荐的信息项，对话机器人向目标对象提供该信息项所对应的URL，在一个示例中，信息项为推荐的问题，那么URL指向该问题对应的回答，在另一个示例中，信息项为预置的工具，那么URL指向该工具所对应封装好的代码逻辑，比如URL指向某个功能接口、数据接口、网页地址、嵌入式小程序、第三方应用等。

在本申请实施例涉及的行为类型，是指将目标对象与对话机器人之间执行的各种交互行为，在经过分析提炼后生成的具有差异性特征的标签词，这一标签词能够代表交互行为的所属类别，这样使得每一种交互行为都能够映射到唯一的行为类型，相当于能够将多种多样的交互行为划分到给定的几类行为类型中，便于进行数据分析和信息推荐。例如，交互行为包括“游戏A客户端发布”、“游戏A测试服发布”、“游戏A在线查询”，在进行映射时，“游戏A客户端发布”和“游戏A测试服发布”这两种交互行为会被映射到同一个行为类型“任务执行”上，而“游戏A在线查询”这一交互行为则会被映射到行为类型“数据查询”上，换言之，在构建了交互行为和行为类型的映射关系之后，行为类型能够将具有同一种差异性特征的多种交互行为聚类到同一行为类型下。

本申请实施例涉及的目标对象与对话机器人的会话，是指目标对象在与对话机器人实现交互时，双方实现通信的临时的、交互式的信息交换，换一种表述，指目标对象所使用的终端与控制对话机器人问答逻辑的服务器之间的通信会话，在目标对象以账号为载体与对话机器人的机器人账号进行交互时，会话还用于指示目标对象的账号与机器人账号之间的消息传输。

在一些实施例中，在目标对象向服务器授予获取目标对象与对话机器人的历史会话的行为数据的权限的情况下，服务器获取目标对象与对话机器人的历史会话的行为数据，其中，该行为数据包括目标对象在历史会话中产生多次交互行为的历史执行记录。可选地，在取得目标对象及各方充分授权的情况下，服务器采集目标对象在所有历史会话中执行的所有交互行为的历史执行记录；或者，仅采集目标对象在预设时间段内参与的历史会话中执行的各次交互行为的历史执行记录，预设时间段由技术人员进行预先配置，例如预设时间段为最近一周、最近一个月、最近三个月等，本申请实施例对此不进行限定；或者，仅采集目标对象最近参与的至少一次历史会话中执行的各次交互行为的历史执行记录，例如，仅采集最近10次历史会话中对交互行为的历史执行记录，或者，仅采集最近5次历史会话中对交互行为的历史执行记录，本申请实施例不对此进行具体限定。

在一些实施例中，服务器获取目标对象与对话机器人的历史会话的行为数据之后，对该行为数据进行分析和处理，提取得到能够表征该行为数据的差异性特征的目标行为类型，换言之，目标行为类型能够表征其行为数据所涉及的各种交互行为的代表性特征，通常这一目标行为类型能够反映目标对象使用对话机器人所倾向于总是执行的交互行为的行为类型，即目标行为类型指示了目标对象在与对话机器人的交互过程的行为偏好。

在一些实施例中，在提取得到该目标行为类型之后，进一步获取在该目标行为类型下每种交互行为所对应的历史执行记录的数量，这样能够统计出目标对象执行目标行为类型下每种交互行为的行为频次，从而基于目标行为类型下各种交互行为各自的行为频次，能够筛选出目标交互行为。可选地，从行为频次大于或等于行为频次阈值的各个交互行为中，随机选取一个或多个交互行为作为目标交互行为，其中，行为频次阈值是任一大于0的数值；或者，在按照行为频次从高到低的排序中，选取排位位于前N(N≥1)位的交互行为作为目标交互行为，本申请实施例不对目标交互行为的筛选逻辑进行限定，也不对目标交互行为的数量进行具体限定。

202、服务器基于该目标交互行为，从该目标行为类型对应的多个候选信息项中，确定与该目标对象匹配的至少一个目标信息项，该目标信息项与该目标交互行为符合相似条件。

本申请实施例涉及的信息项，是指针对对话机器人封装好的代码逻辑的可视化交互接口，每种信息项用于提供某种指定的资源、功能或服务，目标对象针对信息项发起的一轮或多轮交互，视为是目标对象执行一次交互行为，同时会产生本次交互行为的历史执行记录(例如操作日志记录)。

可选地，信息项包括下述至少一项：查看预设提问所对应回答的选项；或者，预设文件的下载选项，该下载选项指向预设文件的下载地址如URL；或者，封装完毕的功能模块的入口，该入口指向一些预先配置完毕的数据查询接口、任务调起接口等。

示意性地，信息项是“游戏A测试服发布”这一功能模块的入口，目标对象点击“游戏A测试服发布”的入口，将会触发在对话机器人的会话窗口中弹出确认本次发布的相关参数的消息，目标对象可选择一键导入上一次的相关参数，或者手动填写新的相关参数，在目标对象触发对相关参数的确认操作之后，服务器将执行游戏A的测试服发布这一任务，上述两轮交互过程实现了“游戏A测试服发布”这一次交互行为，那么将产生该交互行为的历史执行记录，当然，如果目标对象在点击“游戏A测试服发布”的入口之后，又取消了本次游戏A的测试服发布的任务，那么将产生该交互行为的一次历史执行记录和一次执行取消记录。

上述步骤202涉及的候选信息项，是指在与目标行为类型相对应的各个候选的信息项，比如，目标行为类型为“任务执行”，则在“任务执行”下对应有如下候选信息项：“游戏A客户端发布”的入口、“游戏A测试服发布”的入口、“游戏A客户端数据发布”的入口等。

上述步骤202涉及的目标信息项，是指从候选信息项中筛选出来的与目标对象匹配的信息项，即，针对每个目标对象，都能够个性化地从候选信息项中筛选出与目标对象匹配的目标信息项，这些目标信息项是服务器预测的目标对象可能感兴趣的信息项，换一种表述，目标信息项是服务器预测的目标对象有较大概率产生交互行为的信息项。

在一些实施例中，服务器确定目标行为类型对应的各个信息项为候选信息项，或者，服务器确定目标行为类型对应的部分信息项为候选信息项，部分信息项可以是最近一个月内被任一对象点击过的信息项，本申请实施例对此不进行具体限定。

在一些实施例中，服务器从目标行为类型对应的多个候选信息项中，确定每个候选信息项与目标交互行为之间的相似度，例如使用候选信息项的信息项特征与目标交互行为的交互行为特征之间的特征相似度作为上述相似度的度量，将相似度符合相似条件的候选信息项确定为本次筛选得到的至少一个目标信息项。

203、服务器在该目标对象与该对话机器人的会话中，向该目标对象推荐该至少一个目标信息项。

在一些实施例中，服务器响应于目标对象所使用的终端的信息推荐请求，执行上述步骤201-202，筛选得到至少一个目标信息项之后，向该终端返回携带该至少一个目标信息项的信息推荐响应。

可选地，该信息推荐请求是目标对象在启动支持对话机器人的应用程序之后触发的，或者，该信息推荐请求是目标对象的打开与对话机器人的会话窗口时触发的，或者，该信息推荐请求是目标对象在会话窗口中打开用于展示信息项的功能界面(例如侧边栏、弹窗、小窗等显示方式)时触发的，本申请实施例对此不进行具体限定。

在一些实施例中，目标对象在终端上登录支持对话机器人的应用程序之后，服务器直接向该终端推送该至少一个目标信息项，这样无需终端主动请求对应的目标信息项，而是由服务器主动下发，本申请实施例对此不进行具体限定。

在一些实施例中，服务器在该会话中推送该至少一个目标信息项时，发送该至少一个目标信息项的多媒体资源，使得终端能够基于每个目标信息项的多媒体资源来显示对应的目标信息项。可选地，服务器在下发每个目标信息项时，还携带每个目标信息项的次序信息，该次序信息用于指示终端在显示各个目标信息项时的排序先后，以使得终端在显示该至少一个目标信息项时，按照每个目标信息项的次序信息来进行功能界面中推荐内容的布局。

上述所有可选技术方案，能够采用任意结合形成本公开的可选实施例，在此不再一一赘述。

本申请实施例提供的方法，通过基于目标对象的目标行为类型和目标交互行为，从目标行为类型对应的多个候选信息项中，筛选得到与目标交互行为符合相似条件的目标信息项，并在目标对象与对话机器人的会话中推荐这些目标信息项，使得针对不同的目标对象均能够进行信息项的个性化智能推荐，保证了推荐的信息项均能够与目标对象适配，提升了信息项的推荐准确率，从而提高了人机交互效率。

在上述实施例中，简单介绍了本申请实施例涉及的数据处理流程，并对一些术语进行了定义说明，而在本申请实施例中，将针对每一步骤进行细化说明，图3是本申请实施例提供的一种数据处理方法的流程图，参见图3，该实施例由计算机设备执行，以计算机设备为服务器为例进行说明。

需要说明的是，本申请实施例提供的是对单个目标对象实现个性化推荐的过程，针对对话机器人提供服务的每个目标对象都能够执行本申请实施例的数据处理方法以实现个性化推荐，该实施例包括下述步骤：

301、服务器基于目标对象的对象属性信息，确定该对象属性信息关联的多个行为类型。

在一些实施例中，服务器取得目标对象对获取该目标对象的对象属性信息的授权之后，从目标对象的账号资料数据中查询该对象属性信息，示意性地，在支持对话机器人的应用程序为办公应用或企业应用时，该对象属性信息是指目标对象的职务信息，由于目标对象在控制账号加入自身关联的组织实体时，需要录入自身的职务信息，并提交至组织实体的管理账号进行审核，才能够加入到该组织实体中，因此服务器在经过目标对象的充分授权和单独同意之后，访问目标对象的账号资料数据，能够查询到该目标对象的职务信息。可选地，该组织实体为企业、事业单位、非法人组织等，本申请实施例对此不进行具体限定。

在一些实施例中，服务器在获取到目标对象的对象属性信息之后，确定该对象属性信息所属的业务属性类型，可选地，以对象属性信息为职务信息为例，那么业务属性类型则是指职务类型，此时，如果该职务信息本身就是职务类型，则无需执行额外的确定步骤，或者，如果该职务信息本身是职务类型下进一步划分的工种，那么确定该职务信息对应的职务类型。接着，基于预设的业务属性类型与行为类型的关联关系，确定与该业务属性类型具有关联关系的多个行为类型，其中，该关联关系可由技术人员或专家进行人工标注。

在上述过程中，通过获取对象属性信息，并确定对应的多个行为类型，能够预先排除掉一些与目标对象的对象属性信息关联不紧密的行为类型，比如，当目标对象的对象属性信息是游戏运营人员时，那么能够排除掉与游戏领域无关的行为类型，同时还能够排除掉一些与游戏运营无关的行为类型(如只有游戏开发人员或游戏运维人员才会执行的交互行为对应的行为类型)，从而加速从多个行为类型中确定目标行为类型的获取效率。

需要说明的是，在对象属性信息是职务信息的情况下，由于职务信息代表了目标对象在业务决策中扮演的角色，因此职务信息也称为目标对象的岗位信息、角色信息，因此由技术人员或专家对目标对象所可能扮演的各种角色都建立不同的行为类型，这些行为类型可以是由专家根据不同交互行为的历史执行记录进行人工标注的分类标签，可选地，除了职务信息之外，对象属性信息还包括如性别、年龄、所负责产品或者业务等经过目标对象充分授权的属性信息，本申请实施例对此不进行具体限定。

在一些实施例中，服务器无需执行上述步骤301，而是直接获取技术人员或者专家标注后的各个行为类型(即所有行为类型构成的全集)，这样也能够简化获取该多个行为类型的流程。

302、服务器基于交互行为和行为类型的映射关系，将该目标对象在与对话机器人的历史会话中具有历史执行记录的多次交互行为分别映射至至少一个行为类型。

在一些实施例中，由于技术人员或专家在标注各个行为类型时，是根据不同交互行为的历史执行记录来进行人工分类的，这代表随着行为类型的确定，自然能够获取到交互行为和行为类型的映射关系，换言之，服务器获取由技术人员或专家预先定义的交互行为和行为类型的映射关系。

在一些实施例中，服务器基于与上述实施例中步骤201中类似的方式，获取到目标对象与对话机器人的历史会话的行为数据，该行为数据包括目标对象在历史会话中执行多次交互行为的多条历史执行记录。可选地，对行为数据中的所有历史执行记录都参与到步骤302的映射过程，或者，统计历史执行记录所对应每种交互行为的行为频次，即统计每种交互行为所具有的历史执行记录的数量，代表了目标对象在历史会话中共计执行了每种交互行为的次数，接着筛选得到行为频次符合高频条件的高频交互行为，仅使用各个高频交互行为对应的历史执行记录来参与到步骤302的映射过程，可选地，该高频条件包括行为频次高于行为频次阈值，或者行为频次在从大到小的排序中位于topN，其中行为频次阈值为任一大于0的数值，本申请实施例对此不进行具体限定。

在一些实施例中，在获取到该映射关系并确定参与映射的各条历史执行记录的情况下，对每条历史执行记录，能够基于该映射关系，将该历史执行记录所对应的交互行为映射到唯一对应的行为类型，重复执行上述操作，在遍历所有的历史执行记录之后，能够得到这些历史执行记录所映射至的至少一个行为类型。

在一些实施例中，由于交互行为和行为类型的映射关系是已经预定义好的，因此在生成每一条历史执行记录时，还可以直接在历史执行记录如日志记录的目标字段中添加映射得到的行为类型，即，映射过程是由终端在生成历史执行记录时执行的，服务器只需要访问每条历史执行记录的目标字段，就能够获取到该历史执行记录对应的行为类型，因此遍历每条历史执行记录的目标字段，能够得到这些历史执行记录所映射至的至少一个行为类型。其中，目标字段是历史执行记录的任一字段，比如，历史执行记录包括日志序列号字段、交互行为字段、时间戳字段、行为类型字段，其中，行为类型字段就是用于记录行为类型的目标字段。

示意性地，目标对象U₁的对象属性信息是游戏运维，目标对象U₁的高频交互行为包括：“游戏A客户端发布(执行5次)”、“游戏A手游测试服发布(执行1次，取消1次)”和“游戏A在线查询(执行2次)”，其中，“游戏A客户端发布(执行5次)”和“游戏A手游测试服发布(执行1次，取消1次)”都映射到行为类型“任务执行(执行6次，取消1次)”，而“游戏A在线查询(执行2次)”则映射到了行为类型“数据查询(执行2次)”。

示意性地，目标对象U₂的对象属性信息是游戏运营，目标对象U₂的高频交互行为包括：“游戏A测试服发布(执行1次)”、“游戏A在线查询(执行2次，取消1次)”和“游戏A评价查询(执行1次)”，其中，“游戏A测试服发布(执行1次)”映射到行为类型“任务执行(执行1次)”，而“游戏A在线查询(执行2次，取消1次)”和“游戏A评价查询(执行1次)”都映射到了行为类型“数据查询(执行3次，取消1次)”。

303、服务器从该至少一个行为类型中确定该目标对象的目标行为类型，该目标行为类型表征该目标对象在与对话机器人的历史会话中所执行交互行为的特征。

在一些实施例中，利用目标对象的对象属性信息和上述步骤302确定的至少一个行为类型，能够从该至少一个行为类型中筛选得到能够表征目标对象所执行的交互行为的差异性特征的目标行为类型。

在一些实施例中，服务器确定该至少一个行为类型各自的类型频次和类型权重，换言之，服务器对每个行为类型，将能够映射至该行为类型的历史行为记录的数量确定为该行为类型的类型频次，类型频次代表了目标对象执行与该行为类型具有映射关系的交互行为的总次数，此外，技术人员或专家可预先为每个行为类型配置对应的类型权重，服务器获取每个行为类型对应的类型权重，可选地，如果技术人员或专家没有为每个行为类型配置对应的类型权重，可默认所有行为类型的类型权重均为1，即这些行为类型的类型权重相等。

在获取到每个行为类型的类型频次和类型权重之后，基于该类型频次和类型权重，确定该至少一个行为类型各自的行为类型系数，该行为类型系数用于表征该目标对象与对应行为类型的匹配程度，可选地，该行为类型系数与匹配程度呈正相关，即行为类型系数取值越大时匹配程度越高，行为类型系数取值越小时匹配程度越低，或者，该行为类型系数与匹配程度呈负相关，即行为类型系数取值越大时匹配程度越低，行为类型系数取值越小时匹配程度越高，本申请实施例对此不进行具体限定。

在一些实施例中，在获取每个行为类型的行为类型系数时，基于该行为类型的类型权重，对该行为类型的类型频次进行加权，可选地，将该行为类型的类型权重和该行为类型的类型频次相乘，得到该行为类型的行为类型系数，或者，将该行为类型的类型权重和该行为类型的类型频次输入到目标函数中执行运算，输出该行为类型的行为类型系数，本申请实施例对此不进行具体限定。

在一些实施例中，在获取到各个行为类型的行为类型系数之后，将行为类型系数符合目标条件的行为类型确定为该目标行为类型。可选地，在行为类型系数与匹配程度呈正相关的情况下，该目标条件包括行为类型系数大于类型系数阈值或者行为类型系数在从大到小的排序中位于topK(K≥1)，可选地，在行为类型系数与匹配程度呈负相关的情况下，该目标条件包括行为类型系数小于类型系数阈值或者行为类型系数在从小到大的排序中位于topK(K≥1)，其中类型系数阈值为大于或等于0的数值。

在上述过程中，目标对象的目标行为类型和对象属性信息能够表征出在业务决策中目标对象偏好执行的交互行为与其他对象的区别，即，对象属性信息和目标行为类型，是影响目标对象在与对话机器人的会话中做出交互行为的主要影响因素，因此目标行为类型和对象属性信息能够表征出目标对象的行为偏好。

示意性地，针对上述步骤302给出的目标对象U₁和U₂的示例，假设行为类型“任务执行”和“数据查询”的类型权重均为1，如表1所示，目标对象U₁的目标行为类型为“任务执行”，目标对象U₂的目标行为类型为“数据查询”：

表1

在上述步骤301-303中，示出了服务器获取目标对象的目标行为类型的一种可能实施方式，在一些实施例中，服务器在首次对目标对象分析得到目标行为类型之后，将目标对象的对象标识与目标行为类型的类型标识进行关联存储，比如构建键值对Key-Value结构，以目标对象的账号ID(Identification，标识)为Key即键名，以目标行为类型的类型ID为Value即键值，这样后续只需要访问预先存储的Key-Value结构，并以目标对象的账号ID作为索引，就能够查询得到对应存储的类型ID所指示的目标行为类型，进一步的，当目标对象在与机器人的会话中产生了新的历史执行记录时，只需要增量计算目标行为类型是否改变，并在目标行为类型发生改变时，及时在Key-Value结构中对目标行为类型进行更新即可。

304、服务器获取该目标对象在该目标行为类型下的目标交互行为。

其中，该目标对象对该目标交互行为具有历史执行记录。

在一些实施例中，服务器在通过上述步骤303提取得到该目标行为类型之后，获取在该目标行为类型下每种交互行为所对应的历史执行记录的数量，这样能够统计出目标对象执行目标行为类型下每种交互行为的行为频次，从而基于目标行为类型下各种交互行为各自的行为频次，能够筛选出目标交互行为。

可选地，从行为频次大于或等于行为频次阈值的各个交互行为中，随机选取一个或多个交互行为作为目标交互行为，其中，行为频次阈值是任一大于0的数值；或者，在按照行为频次从高到低的排序中，选取排位位于前N(N≥1)位的交互行为作为目标交互行为，本申请实施例不对目标交互行为的筛选逻辑进行限定，也不对目标交互行为的数量进行具体限定。

示意性地，针对上述示例中的目标对象U₁，目标对象U₁的目标行为类型是“任务执行”，在目标行为类型“任务执行”下，总共包括4种交互行为：“游戏A客户端发布(执行5次)”、“游戏A手游测试服发布(执行1次，取消1次)”、“游戏A客户端数据发布(未执行过)”和“游戏A正式发布(未执行过)”，假设仅筛选1个目标交互行为，那么将行为频次最高的“游戏A客户端发布(执行5次)”作为目标对象U₁的目标交互行为。

305、服务器获取该目标交互行为的交互行为特征和该目标行为类型对应的多个候选信息项各自的信息项特征。

在一些实施例中，该候选信息项包括下述至少一项：在该会话中的预设提问，例如，该预设提问在会话窗口中被提供为查看该预设提问所对应回答的选项；在该会话中的预设功能接口，例如，该预设功能接口在会话窗口中被提供为封装完毕的功能模块的入口，该入口指向一些预先配置完毕的代码逻辑；在该会话中的预设数据接口，例如，该预设数据接口在会话窗口中被提供为某一文件的下载地址如URL，本申请实施例对候选信息项的类型不进行具体限定。

通常，技术人员会针对每个行为类型预先配置一些信息项，服务器在确定了目标行为类型之后，获取目标行为类型对应的信息项作为候选信息项。

在一些实施例中，服务器提取目标交互行为的交互行为特征，示意性地，由于目标交互行为是目标对象具有历史执行记录的交互行为，代表了目标对象一定通过某种信息项或者某个指令触发了目标交互行为，而信息项和指令都具有交互文本，因此，服务器获取目标交互行为关联的交互文本，例如，目标对象U₁的目标交互行为为“游戏A客户端发布”，那么交互文本就是句子1“游戏A客户端发布”。接着，服务器对该交互文本进行分词，得到该交互文本包含的多个第一分词，例如，将交互文本“游戏A客户端发布”切词得到3个第一分词：{游戏A，客户端，发布}。

在一些实施例中，服务器基于上述交互文本的多个第一分词编码得到该目标交互行为的交互行为特征。可选地，编码方式为独热编码，那么服务器将该多个第一分词的独热编码(One-Hot)向量作为该交互行为特征，或者，编码方式为Embedding(词嵌入)编码，那么服务器将该多个第一分词的Embedding向量的平均向量作为该交互行为特征，或者，服务器将该多个第一分词的Embedding向量拼接得到该交互行为特征，本申请实施例不对交互行为特征的获取方式进行具体限定。

在一些实施例中，服务器提取该多个候选信息项各自的信息项特征，示意性地，由于每个候选信息项要么关联于某个预设提问，要么关联于某个预设的功能接口或数据接口，而预设提问、功能接口和数据接口都具有描述文本，因此，服务器获取各个候选信息项的描述文本，例如，目标对象U₁的目标行为类型“任务执行”下，包含有2个候选信息项：“游戏A客户端数据发布”和“游戏A正式发布”，那么这2个候选信息项各自的描述文本就是句子2“游戏A客户端数据发布”和句子3“游戏A正式发布”。接着，服务器对每个候选信息项的描述文本进行分词，得到该描述文本包含的多个第二分词，例如，将第1个候选信息项的描述文本即句子2“游戏A客户端数据发布”切词得到4个第二分词：{游戏A，客户端，数据，发布}，将第2个候选信息项的描述文本即句子3“游戏A正式发布”切词得到3个第二分词：{游戏A、正式、发布}。

在一些实施例中，对每个候选信息项的描述文本切词得到的多个第二分词，服务器基于该多个第二分词编码得到该候选信息项的信息项特征。可选地，编码方式为独热编码，那么服务器将该多个第二分词的One-Hot向量作为该信息项特征，或者，编码方式为Embedding编码，那么服务器将该多个第二分词的Embedding向量的平均向量作为该信息项特征，或者，服务器将该多个第二分词的Embedding向量拼接得到该信息项特征，本申请实施例不对信息项特征的获取方式进行具体限定。

示意性地，以目标对象U₁为例说明，其目标交互行为的交互文本切词得到了3个第一分词{游戏A，客户端，发布}，其目标行为类型下第1个候选信息项的描述文本切词得到了4个第二分词{游戏A，客户端，数据，发布}，第2个候选信息项的描述文本切词得到了3个第二分词{游戏A、正式、发布}，服务器将第一分词和第二分词进行去重合并，能够得到所有分词构成的词库{游戏A，客户端，发布，数据，正式}，基于该词库能够构建交互文本的One-Hot向量[1,1,1,0,0]作为交互行为特征，构建第1个候选信息项的描述文本的One-Hot向量[1,1,1,1,0]作为第1个候选信息项的信息项特征，构建第2个候选信息项的描述文本的One-Hot向量[1,0,1,0,1]作为第2个候选信息项的信息项特征。

306、服务器基于该交互行为特征与该信息项特征之间的特征相似度，从该多个候选信息项中筛选得到与该目标对象匹配的至少一个目标信息项，该目标信息项与该目标交互行为符合相似条件。

在一些实施例中，服务器对每个候选信息项，均计算该候选信息项的信息项特征与交互行为特征之间的特征相似度。

可选地，相似条件为特征相似度位于topM，则服务器基于特征相似度从大到小的顺序，对该多个候选信息项进行排序，将排序位于前目标位的候选信息项确定为该至少一个目标信息项，其中，前目标位是指前M位，M≥1。

可选地，相似条件为特征相似度最大，则服务器将特征相似度最大的候选信息项确定为目标信息项。

可选地，相似条件为特征相似度大于相似阈值，则服务器将特征相似度特征相似阈值的各个候选信息项确定为目标信息项，其中相似阈值的任一大于或等于0的数值，本申请实施例不对相似条件进行具体限定。

在一些实施例中，基于信息项特征和交互行为特征之间的余弦相似度或者欧式距离，来确定该信息项特征和交互行为特征之间的特征相似度，其中，特征相似度与余弦相似度呈正相关、与欧氏距离呈负相关，即，特征相似度越大时，余弦相似度越大、欧式距离越小；特征相似度越小时，余弦相似度越小、欧式距离越大。

在一些实施例中，还可以将信息项特征和交互行为特征分别输入到一些NLP(Natural Language Processing，自然语言处理)模型中，通过NLP模型来分别提取各个特征的深层语义表征即语义特征，最终计算两个语义特征之间的特征相似度，从而能够利用深度学习框架对比特征之间是否具有相似的语义，例如NLP模型包括但不限于：Transformer模型、BERT(Bidirectional Encoder Representation from Transformers，基于Transformer的双向编码表征)模型、LSTM(Long Short-Term Memory，长短期记忆)模型等，本申请实施例对此不进行具体限定。

在一些实施例中，以特征相似度就是余弦相似度为例进行说明，对于交互行为特征A和信息项特征B，可通过如下公式来计算特征相似度：

其中，θ代表交互行为特征A和信息项特征B之间的特征夹角，cos(θ)代表特征夹角的余弦值，||A||代表交互行为特征A的模长，||B||代表信息项特征B的模长。

其中，i代表特征中的第i个元素，n代表了特征的元素数量，例如当交互行为特征A和信息项特征B都是One-Hot向量时，两个特征的One-Hot向量包含的元素数量相同，均等于词库中包含的分词个数，A_i代表交互行为特征A的One-Hot向量中第i个元素，B_i代表信息项特征B的One-Hot向量中第i个元素。

示意性地，以目标对象U₁为例说明，其目标交互行为的交互行为特征为[1,1,1,0,0]，第1个候选信息项的信息项特征为[1,1,1,1,0]，第2个候选信息项的信息项特征为[1,0,1,0,1]。

那么交互行为特征[1,1,1,0,0]和第1个候选信息项的信息项特征[1,1,1,1,0]之间的特征相似度为：

交互行为特征[1,1,1,0,0]和第2个候选信息项的信息项特征[1,0,1,0,1]之间的特征相似度为：

由于第1个候选信息项的特征相似度0.86大于第2个候选信息项的特征相似度0.67，因此选取第1个候选信息项作为与目标对象U₁匹配的目标信息项，从而服务器向目标对象U₁推荐目标信息项“游戏A客户端数据发布”。

进一步的，由于目标交互行为本身必定是由目标行为类型下的某个候选信息项所触发的，因此目标交互行为对应的候选信息项“游戏A客户端发布”与自身的特征相似度必定是1即100％，因此目标交互行为对应的候选信息项也必定是目标信息项，即，最终服务器向目标对象U₁推荐的目标信息项包括“游戏A客户端发布”和“游戏A客户端数据发布”。

在上述步骤305-306中，提供了服务器基于该目标交互行为，从该目标行为类型对应的多个候选信息项中，确定与该目标对象匹配的至少一个目标信息项的一种可能实施方式，即，通过对目标交互行为建模交互行为特征，对每个候选信息项建模信息项特征，通过计算交互行为特征和信息项特征之间的特征相似度，从而能够基于特征相似度是否满足相似条件来判断候选信息项是否与目标对象相匹配，从而在候选信息项与目标对象相匹配的情况下，将该候选信息项确定为一个目标信息项。

在一些实施例中，服务器还可以在计算特征相似度之前，先判断该多个候选信息项中是否包含第一信息项，该第一信息项是指目标对象在历史会话中具有历史执行记录的候选信息项，换言之，该目标对象在历史会话中对该第一信息项具有历史执行记录，在该多个候选信息项包含第一信息项的情况下，确定至少一个第一信息项，从而能够筛选出目标对象在历史会话中曾经触发过的各个第一信息项。

在一些实施例中，对除了该第一信息项之外的各个候选信息项，服务器执行上述步骤306，即基于该候选信息项的信息项特征与该目标交互行为的交互行为特征之间的特征相似度，筛选得到至少一个第二信息项。

在一些实施例中，服务器从该至少一个第一信息项和该至少一个第二信息项中，筛选得到与目标对象相匹配的至少一个目标信息项。可选地，服务器将各个第一信息项和各个第二信息项的并集确定为该至少一个目标信息项，或者，服务器从各个第一信息项和各个第二信息项中随机选取至少一个目标信息项，本申请实施例对此不进行具体限定。

在上述过程中，相当于根据是否具有历史执行记录，能够直接确定第一信息项，而无需计算第一信息项的信息项特征与交互行为特征之间的特征相似度，能够节约服务器的计算资源，接着，对于没有历史执行记录的候选信息项，则通过计算特征相似度来判断是否满足相似条件，从而筛选得到至少一个第二信息项，进而在第一信息项和第二信息项中进一步筛选得到目标信息项，能够保证目标信息项中既包含目标对象曾经触发过的第一信息项，也包含与目标对象相匹配的第二信息项。

示意性地，以目标对象U₁为例说明，在目标行为类型“任务执行”下，具有历史执行记录的第一信息项包括“游戏A客户端发布(执行5次)”和“游戏A手游测试服发布(执行1次，取消1次)”，此外通过上述步骤306，基于特征相似度筛选得到了第二信息项“游戏A客户端数据发布(未执行过)”，因此最终服务器向目标对象U₁推荐的目标信息项包括：“游戏A客户端发布(执行5次)”、“游戏A手游测试服发布(执行1次，取消1次)”和“游戏A客户端数据发布(未执行过)”，上述3个目标信息项相当于构成了目标对象U₁的推荐候选列表。

在上述过程中，一方面，对每个候选信息项即Item均抽取出了一个信息项特征来表征此Item，另一方面，对每个目标对象则利用过去执行过的目标交互行为来表征出目标对象的行为偏好Profile，最终比较Item特征和目标对象的Profile特征，能够对每个目标对象均挑选出一组特征相似度符合相似条件的目标信息项，这些目标信息项构成了对应目标对象的推荐候选列表，这一能够针对不同目标对象学习到不同的行为偏好Profile，从而向目标对象完成与行为偏好Profile相关度较高即符合相似条件的内容推荐。

在一些实施例中，服务器在上述步骤306中获取到目标信息项之后，跳过步骤307-309，直接执行下述步骤310中的推荐操作，即直接向目标对象执行目标信息项的推荐，或者，服务器执行步骤307-309，来实现对各个目标信息项的重排序，从而向目标对象推荐经过重排序的目标信息项。

示意性地，在目标对象与对话机器人创建会话之后，首次推荐时无需执行步骤307-309的重排序，但在会话过程中，随着目标对象向服务器上报了对本次推荐的任一目标信息项的历史执行记录，那么服务器将基于这一最新反馈的历史执行记录，对原本推荐的各个目标信息项执行重排序。

示意性地，在目标对象与对话机器人创建会话之后，在首次推荐时，根据最近一次的历史会话的历史执行记录，对各个目标信息项执行重排序，此后基于目标对象针对本次推荐的目标信息项反馈的历史执行记录，实时对各个目标信息项执行重排序，本申请实施例不对是否每次推荐都需要进行重排序进行限定，也不对重排序的触发时机进行限定。

307、对任一目标信息项，服务器获取该目标信息项的冷却间隔时长，该冷却间隔时长用于表征该目标对象上一次对该目标信息项执行交互行为的交互时刻与当前时刻之间的时间间隔。

在一些实施例中，服务器对上述步骤306中确定的每个目标信息项，确定目标对象上一次对该目标信息项执行交互行为的交互时刻，比如，服务器从对该目标信息项执行交互行为的各个历史执行记录的时间戳中，将最大的时间戳确定为该交互时刻，接着，将该交互时刻与当前时刻之间的时间间隔确定为该目标信息项的冷却间隔时长。可选地，该冷却间隔时长可以精确到小时、分钟或者秒，本申请实施例不对冷却间隔时长的精度进行具体限定。

308、服务器基于该冷却间隔时长、该目标对象对该目标信息项执行交互行为的行为频次以及该交互行为的行为权重，获取该目标信息项的重排系数，该重排系数与该冷却间隔时长呈正相关。

在一些实施例中，对每个目标信息项，除了确定冷却间隔时长之外，还确定目标对象对该目标信息项执行交互行为的行为频次以及该交互行为的行为权重，可选地，由于在上述步骤304中筛选目标交互行为时，本身会统计每种交互行为(唯一对应于一个信息项)的行为频次，如果在执行上述步骤304时缓存每种交互行为的行为频次，那么此时只需要在确定目标信息项之后，访问目标信息项所对应交互行为的行为频次即可，当然如果服务器没有缓存行为频次，只需要再次统计每个目标信息项所对应交互行为的行为频次即可，此外，每种交互行为的行为权重是技术人员或专家预先设置的。

在一些实施例中，在获取到上述冷却间隔时长、行为频次和行为权重之后，服务器基于该行为频次和该行为权重，确定该目标信息项的行为系数，比如，基于该行为频次对该行为权重进行加权，比如将该行为频次和行为权重相乘得到对应的行为系数，或者，将行为频次和行为权重输入到一个映射函数中执行运算，输出对应的行为系数，本申请实施例对此不进行具体限定。

在一些实施例中，服务器基于该冷却间隔时长和预设的冷却系数，对该行为系数加权得到该重排系数。其中，在行为频次和行为权重相同的情况下，冷却间隔时长越大，重排系数越大，即排序越靠后，冷却间隔时长越小，重排系数越小，即排序越靠前。

示意性地，服务器基于时间衰减算法即牛顿冷却定律，构建如下重排系数的计算公式：

score_t＝score_t-1·e^{(-冷却系数×冷却间隔时长)}

score_t-1＝行为频次×行为权重

其中，score_t代表了第t次重排序(即本次重排序)的重排系数，score_t-1代表了第t-1次重排序(即上一期得分)，冷却系数是一个预设的调整因子，通常取值为经验值0.25，也可根据需求进行设定。

在上述过程中，通过利用冷却间隔时长，来确定各个目标信息项的重排系数，由于重排系数和冷却间隔时长呈正相关，使得冷却间隔时长越长的目标信息项在重排序后越靠后，冷却间隔时长越短的目标信息项在重排序后越靠前，相当于优先展示最新交互过的目标信息项，能够极大方便目标对象查看到近期交互过的目标信息项，提升了目标对象使用目标信息项进行交互的交互效率。

309、服务器基于该至少一个目标信息项各自的重排系数，控制该至少一个目标信息项进行重排序。

在一些实施例中，服务器基于各个目标信息项的重排系数，控制这些目标信息项进行重排序，比如，服务器直接向目标对象使用的终端下发每个目标信息项的在重排后的显示次序，使得终端根据各个目标信息项的显示次序来实现重排序，或者，服务器向终端下发目标信息项的次序变化信息，比如上升1位、下降2位等，本申请实施例不对如何控制目标信息项重排序进行具体限定。

示意性地，目标对象U₁与对话机器人创建会话，服务器首次推荐时并不触发重排序，在会话过程中，目标对象U₁点击了推荐的目标信息项“游戏A客户端数据发布(未执行过)”，并且确认执行即没有取消，此时目标对象U₁使用的终端向服务器上报“游戏A客户端数据发布”的历史执行记录，此时行为频次会随之改变，即变成了“游戏A客户端数据发布(执行1次)”，代表了服务器上次推荐的这一目标信息项恰好是目标对象U₁所需要的，那么根据时间衰减算法，原本的候选推荐列表[“游戏A客户端发布(执行5次)”，“游戏A手游测试服发布(执行1次，取消1次)”，“游戏A客户端数据发布(未执行过)”]，在经过冷却间隔时长的重排序之后，将变成[“游戏A客户端发布(执行5次，间隔10小时)”，“游戏A客户端数据发布(执行1次，间隔0小时)”，“游戏A手游测试服发布(执行1次，取消1次，间隔12小时)”]，即在经过重排序之后，“游戏A客户端数据发布”将从第3位上升到第2位。

随着目标对象向服务器上报了对本次推荐的任一目标信息项的历史执行记录，那么服务器将基于这一最新反馈的历史执行记录，对原本推荐的各个目标信息项执行重排序，使得服务器向目标对象推荐的目标信息的排序会不断动态变化，并且越来越贴近目标对象的使用需求。

310、服务器在该目标对象与该对话机器人的会话中，向该目标对象推荐重排序完毕的至少一个目标信息项。

在一些实施例中，如果首次推荐时采用了重排序，那么在确定了目标信息项和对应的重排系数之后，服务器向目标对象使用的终端发送每个目标信息项和对应的重排系数，使得终端能够在目标对象与对话机器人的会话窗口中，直接按照重排系数来确定每个目标信息项的是显示顺序，比如，如果首次推荐时没有采用重排序，那么重排序可基于目标对象对已推荐的目标信息项的交互行为来触发，即，如果目标对象没有点击任何已推荐的目标信息项，将不会触发重排序，如果目标对象点击了任一已推荐的目标信息项，则终端向服务器上报对该目标信息项的交互行为的历史执行记录，从而触发服务器进入重排序流程，此时服务器在首次推荐时向终端下发各个目标信息项，而重排序时则无需重复下发信息项，只需要下发每个目标信息项的重排系数即可控制实现重排序，本申请实施例对此不进行具体限定。

在上述实施例中，详细介绍了本申请实施例的数据处理流程，即，服务器通过目标对象在历史会话的历史执行记录，优化对话机器人的目标信息项的智能推荐效果，使得目标对象能够在目标信息项中很容易的找到自己需要交互的指令、提问或者功能接口，从而提升目标对象与对话机器人的交互体验，并且由于针对目标信息项的推荐是以目标对象为单位实现的，能够实现千人千面的个性化推荐效果。在考虑重排序流程的情况下，上述实施例的数据处理流程可以如图4所示，图4是本申请实施例提供的一种数据处理方法的原理性流程图，可以看出，该数据处理流程包括：步骤401，采集目标对象在历史会话中的行为数据，行为数据包括各种交互行为的历史知悉记录；步骤402，计算分析目标对象的目标行为类型和目标交互行为；步骤403，在会话窗口的侧边栏智能动态推荐目标信息项；步骤404，目标对象点击推荐的目标信息项，实现会话窗口内交互或者跳转至浏览器应用进行交互；步骤405、根据点击交互的目标信息项，实现侧边栏中推荐内容的重排序。需要说明的是，本申请实施例仅以游戏开发这一垂直领域为例，介绍如何进行信息项的推荐，但是本申请实施例的数据处理方法，能够适用于各种垂直领域的功能性对话机器人的信息项推荐，能够对目标对象进行精准内容推荐，不仅满足了各种智能问答的个性化推荐需求，还囊括了静态的自助工具的个性化推荐需求，能够为对话机器人的意图识别提供良好的基础，能够增加人机交互过程中的协作效率。

在上述流程的基础上，图5是本申请实施例提供的一种数据处理方法的另一原理框架图，以在支持对话机器人的应用程序中，针对会话窗口的侧边栏进行目标信息项的个性化推荐为例进行说明，但不应构成对目标信息项的显示位置的具体限定，目标信息项可以显示在会话窗口除了侧边栏之外的位置，或者与会话窗口关联显示，或者在目标对象点击某个菜单选项时才会展开目标信息项，本申请实施例对此不进行具体限定。如500所示，基于侧边栏的智能推荐，涉及到侧边栏的处理和应用程序的处理，在侧边栏的处理中，涉及到针对目标对象在历史会话的行为数据分析，以及根据目标对象的交互反馈进行动态重排序，两者结合实现智能推荐，在应用程序的处理中，涉及到目标对象在应用程序内的侧边栏执行交互点击，以及可能还会执行多轮交互，目标对象在点击侧边栏中的目标信息项时，通常会在会话窗口中显示与对话机器人之间收发消息的可视化反馈，同时也能够辅助对话机器人实现意图识别，在经过多轮交互之后能够形成一个完整会话，同时也能够根据交互反馈来灵活修改目标信息项的显示次序(即动态重排序)。

图6是本申请实施例提供的一种会话窗口的界面示意图，如图6所示，在目标对象与对话机器人的会话窗口600中，包含消息区域610和侧边栏620，在侧边栏620中展示了服务器向目标对象推荐的3个目标信息项：“机器人后台测试发布(执行1次，间隔12小时)”、“机器人后台正式发布(执行1次，间隔7天)”和“机器人后台发布重启(执行1次，间隔7天)”。假设目标对象点击了“机器人后台测试发布(执行1次，间隔12小时)”，将会触发对话机器人在消息区域610中弹出一条消息611，该消息611包含提示“您将执行任务：机器人后台测试发布，缺少1个执行参数，请依次输入，有效时间2分钟：【分支名】：”，同时提供导入历史参数的选项和取消填参的选项，接着目标对象输入本次缺少的执行参数即分支名“master”，此时对话机器人在消息区域610中弹出另一条消息612，该消息612包含提示“请确认操作信息：【任务名称】：任务名_测试_fast；【分支名】：master”，同时提供对分支名的修改选项，对测试发布任务的立即执行选项、定时执行选项和取消执行选项，目标对象在点击立即执行选项时，将会触发对话机器人在消息区域610中弹出另一条消息613，该消息613包含提示“正在发起任务，请稍候……”，在本次测试发布任务成功执行后，对话机器人在消息区域610中弹出另一条消息614，该消息614包含提示“当前有1个机器人任务：XX任务【任务名_测试_fast】启动成功！”，同时还提供有步骤状态的查看选项、任务链接的入口以及取消关注选项。

针对本申请实施例提供的技术方案，在某一应用程序上的对话机器人进行了AB测试(AB Test)，即，为应用程序的Web界面或APP界面制作两个(A/B)或多个(A/B/…/N)版本，本申请实施例涉及2个版本，版本A是传统基于频次的推荐方案即对照组，版本B是本申请实施例的个性化推荐方案即实验组，在同一时间维度上，在经过目标对象的单独同意和充分授权参与AB测试并提供反馈数据的前提下，分别让组成成分相同或相似的访客群组(目标对象构成的群组)随机的访问A版本或B版本，收集各个访客群组的目标对象的行为数据、体验数据或业务数据，最后分析以评估出最好的版本，在正式发布中采用。在针对个性化推荐发起的AB测试中，样本容量选取50个目标对象参与到AB测试中，并向50个目标对象分别发放满意度调查问卷，其中服务器向25个目标对象投放了版本B，向另外25个目标对象投放了版本A，即实验组和对照组均为25个目标对象，最终根据调查问卷分析确定在实验组的25个目标对象中，有20个目标对象非常满意，在对照组的25个目标对象中，仅有15个目标对象比较满意，因此能够发现，本申请实施例的技术方案，能够大幅提升与对话机器人的交互体验，改善针对目标信息项的智能推荐效果。

图7是本申请实施例提供的一种数据处理装置的结构示意图，请参考图7，该装置包括：

第一获取模块701，用于获取目标对象的目标行为类型和该目标行为类型下的目标交互行为，该目标行为类型表征该目标对象在与对话机器人的历史会话中所执行交互行为的特征；

确定模块702，用于基于该目标交互行为，从该目标行为类型对应的多个候选信息项中，确定与该目标对象匹配的至少一个目标信息项，该目标信息项与该目标交互行为符合相似条件；

推荐模块703，用于在该目标对象与该对话机器人的会话中，向该目标对象推荐该至少一个目标信息项。

本申请实施例提供的装置，通过基于目标对象的目标行为类型和目标交互行为，从目标行为类型对应的多个候选信息项中，筛选得到与目标交互行为符合相似条件的目标信息项，并在目标对象与对话机器人的会话中推荐这些目标信息项，使得针对不同的目标对象均能够进行信息项的个性化智能推荐，保证了推荐的信息项均能够与目标对象适配，提升了信息项的推荐准确率，从而提高了人机交互效率。

在一种可能实施方式中，基于图7的装置组成，该确定模块702包括：

获取单元，用于获取该目标交互行为的交互行为特征和该多个候选信息项各自的信息项特征；

筛选单元，用于基于该交互行为特征与该信息项特征之间的特征相似度，从该多个候选信息项中筛选得到该至少一个目标信息项。

在一种可能实施方式中，该获取单元用于：

对该目标交互行为关联的交互文本进行分词，得到多个第一分词；

基于该多个第一分词编码得到该交互行为特征；

该获取单元还用于：

基于该多个第二分词编码得到该信息项特征。

在一种可能实施方式中，该筛选单元用于：

基于特征相似度从大到小的顺序，对该多个候选信息项进行排序；

将排序位于前目标位的候选信息项确定为该至少一个目标信息项。

在一种可能实施方式中，基于图7的装置组成，该装置还包括：

第二获取模块，用于对任一目标信息项，获取该目标信息项的冷却间隔时长，该冷却间隔时长用于表征该目标对象上一次对该目标信息项执行交互行为的交互时刻与当前时刻之间的时间间隔；

第三获取模块，用于基于该冷却间隔时长、该目标对象对该目标信息项执行交互行为的行为频次以及该交互行为的行为权重，获取该目标信息项的重排系数，该重排系数与该冷却间隔时长呈正相关；

控制模块，用于基于该至少一个目标信息项各自的重排系数，控制该至少一个目标信息项进行重排序。

在一种可能实施方式中，该第三获取模块用于：

基于该行为频次和该行为权重，确定该目标信息项的行为系数；

基于该冷却间隔时长和预设的冷却系数，对该行为系数加权得到该重排系数。

在一种可能实施方式中，该确定模块702用于：

在该多个候选信息项包含第一信息项的情况下，确定至少一个第一信息项；

对除了该第一信息项之外的各个候选信息项，基于该候选信息项的信息项特征与该目标交互行为的交互行为特征之间的特征相似度，筛选得到至少一个第二信息项；

从该至少一个第一信息项和该至少一个第二信息项中，筛选得到该至少一个目标信息项。

在一种可能实施方式中，基于图7的装置组成，该第一获取模块701包括：

第一确定单元，用于基于该目标对象的对象属性信息，确定该对象属性信息关联的多个行为类型；

映射单元，用于基于交互行为和行为类型的映射关系，将该目标对象在该历史会话中具有历史执行记录的多次交互行为分别映射至至少一个行为类型；

第二确定单元，用于从该至少一个行为类型中确定该目标行为类型。

在一种可能实施方式中，该第二确定单元用于：

确定该至少一个行为类型各自的类型频次和类型权重；

基于该类型频次和类型权重，确定该至少一个行为类型各自的行为类型系数，该行为类型系数用于表征该目标对象与对应行为类型的匹配程度；

将行为类型系数符合目标条件的行为类型确定为该目标行为类型。

在一种可能实施方式中，该候选信息项包括下述至少一项：在该会话中的预设提问；在该会话中的预设功能接口；在该会话中的预设数据接口。

在一种可能实施方式中，该目标对象对该目标交互行为具有历史执行记录。

需要说明的是：上述实施例提供的数据处理装置在推荐信息项时，仅以上述各功能模块的划分进行举例说明，实际应用中，能够根据需要而将上述功能分配由不同的功能模块完成，即将计算机设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的数据处理装置与数据处理方法实施例属于同一构思，其具体实现过程详见数据处理方法实施例，这里不再赘述。

图8是本申请实施例提供的一种计算机设备的结构示意图，该计算机设备800可因配置或性能不同而产生比较大的差异，该计算机设备800包括一个或一个以上处理器(Central Processing Units，CPU)801和一个或一个以上的存储器802，其中，该存储器802中存储有至少一条计算机程序，该至少一条计算机程序由该一个或一个以上处理器801加载并执行以实现上述各个实施例提供的数据处理方法。可选地，该计算机设备800还具有有线或无线网络接口、键盘以及输入输出接口等部件，以便进行输入输出，该计算机设备800还包括其他用于实现设备功能的部件，在此不做赘述。

在示例性实施例中，还提供了一种计算机可读存储介质，例如包括至少一条计算机程序的存储器，上述至少一条计算机程序可由终端中的处理器执行以完成上述各个实施例中的数据处理方法。例如，该计算机可读存储介质包括ROM(Read-Only Memory，只读存储器)、RAM(Random-Access Memory，随机存取存储器)、CD-ROM(Compact Disc Read-OnlyMemory，只读光盘)、磁带、软盘和光数据存储设备等。

在示例性实施例中，还提供了一种计算机程序产品或计算机程序，包括一条或多条程序代码，该一条或多条程序代码存储在计算机可读存储介质中。计算机设备的一个或多个处理器能够从计算机可读存储介质中读取该一条或多条程序代码，该一个或多个处理器执行该一条或多条程序代码，使得计算机设备能够执行以完成上述实施例中的数据处理方法。

本领域普通技术人员能够理解实现上述实施例的全部或部分步骤能够通过硬件来完成，也能够通过程序来指令相关的硬件完成，可选地，该程序存储于一种计算机可读存储介质中，可选地，上述提到的存储介质是只读存储器、磁盘或光盘等。

以上所述仅为本申请的可选实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种数据处理方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述基于所述目标交互行为，从所述目标行为类型对应的多个候选信息项中，确定与所述目标对象匹配的至少一个目标信息项包括：

获取所述目标交互行为的交互行为特征和所述多个候选信息项各自的信息项特征；

基于所述交互行为特征与所述信息项特征之间的特征相似度，从所述多个候选信息项中筛选得到所述至少一个目标信息项。

3.根据权利要求2所述的方法，其特征在于，所述获取所述目标交互行为的交互行为特征包括：

基于所述多个第一分词编码得到所述交互行为特征；

所述获取所述多个候选信息项各自的信息项特征包括：

基于所述多个第二分词编码得到所述信息项特征。

4.根据权利要求3所述的方法，其特征在于，所述基于所述交互行为特征与所述信息项特征之间的特征相似度，从所述多个候选信息项中筛选得到所述至少一个目标信息项包括：

5.根据权利要求1所述的方法，其特征在于，所述确定与所述目标对象匹配的至少一个目标信息项之后，所述方法还包括：

对任一目标信息项，获取所述目标信息项的冷却间隔时长，所述冷却间隔时长用于表征所述目标对象上一次对所述目标信息项执行交互行为的交互时刻与当前时刻之间的时间间隔；

基于所述冷却间隔时长、所述目标对象对所述目标信息项执行交互行为的行为频次以及所述交互行为的行为权重，获取所述目标信息项的重排系数，所述重排系数与所述冷却间隔时长呈正相关；

基于所述至少一个目标信息项各自的重排系数，控制所述至少一个目标信息项进行重排序。

6.根据权利要求5所述的方法，其特征在于，所述基于所述冷却间隔时长、所述目标对象对所述目标信息项执行交互行为的行为频次以及所述交互行为的行为权重，获取所述目标信息项的重排系数包括：

7.根据权利要求1所述的方法，其特征在于，所述基于所述目标交互行为，从所述目标行为类型对应的多个候选信息项中，确定与所述目标对象匹配的至少一个目标信息项包括：

8.根据权利要求1所述的方法，其特征在于，所述获取目标对象的目标行为类型包括：

基于所述目标对象的对象属性信息，确定所述对象属性信息关联的多个行为类型；

基于交互行为和行为类型的映射关系，将所述目标对象在所述历史会话中具有历史执行记录的多次交互行为分别映射至至少一个行为类型；

从所述至少一个行为类型中确定所述目标行为类型。

9.根据权利要求8所述的方法，其特征在于，所述从所述至少一个行为类型中确定所述目标行为类型包括：

确定所述至少一个行为类型各自的类型频次和类型权重；

10.根据权利要求1至9中任一项所述的方法，其特征在于，所述候选信息项包括下述至少一项：在所述会话中的预设提问；在所述会话中的预设功能接口；在所述会话中的预设数据接口。

11.根据权利要求1至9中任一项所述的方法，其特征在于，所述目标对象对所述目标交互行为具有历史执行记录。

12.一种数据处理装置，其特征在于，所述装置包括：

13.一种计算机设备，其特征在于，所述计算机设备包括一个或多个处理器和一个或多个存储器，所述一个或多个存储器中存储有至少一条计算机程序，所述至少一条计算机程序由所述一个或多个处理器加载并执行以实现如权利要求1至权利要求11任一项所述的数据处理方法。

14.一种存储介质，其特征在于，所述存储介质中存储有至少一条计算机程序，所述至少一条计算机程序由处理器加载并执行以实现如权利要求1至权利要求11任一项所述的数据处理方法。

15.一种计算机程序产品，其特征在于，所述计算机程序产品包括至少一条计算机程序，所述至少一条计算机程序由处理器加载并执行以实现如权利要求1至权利要求11任一项所述的数据处理方法。