CN111274501A

CN111274501A - 推送信息的方法、系统和非暂时性存储介质

Info

Publication number: CN111274501A
Application number: CN202010117833.1A
Authority: CN
Inventors: 傅驰林; 张晓露
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2020-02-25
Filing date: 2020-02-25
Publication date: 2020-06-12
Anticipated expiration: 2040-02-25
Also published as: CN111274501B

Abstract

本说明书提供的推送信息的方法、系统和非暂时性存储介质，基于目标终端的当前需求，将所述目标终端的多个历史特征行为以及多个历史特征行为中的每个历史特征行为发生的时间距离当前时刻的时间差进行结合，构造出包含用户历史特征行为时序信息的特征向量，将所述特征向量输入预测模型中得到预测结果，基于所述预测结果向所述目标终端推送与当前需求相关的信息。

Description

推送信息的方法、系统和非暂时性存储介质

技术领域

本说明书涉及计算机技术领域，尤其涉及一种推送信息的方法、系统和非暂时性存储介质。

背景技术

随着互联网技术的进步，人们日常生活中越来越多的信息以及操作都可以通过网络平台进行，例如网络购物，网络预约，网络查询，甚至是网络学习等等。为了提升用户体验，很多应用程序(Application，简称APP)中通常都设置有智能客服的功能。智能客服系统是在大规模知识处理基础上发展起来的一项面向行业应用的技术，为企业与海量用户之间的沟通建立了一种基于自然语言的快捷有效的技术手段。在很多应用程序的智能客服体系中，问题识别在很多场景中扮演着重要的作用。比如，“猜你问题”是智能客服面对用户的第一道关卡。当用户进入应用程序中“我的客服”页面，应用程序会提供一个问题推荐列表，这就是“猜你问题”。问题识别模型在“猜你问题”场景中，发挥重大作用。问题识别本质是基于用户的历史行为来预测用户可能碰到的问题，达到“未问先答”，帮助用户解决问题，提高用户的满意度，并且节省人工客服的人力成本。

为了更准确地预测用户可能遇到的问题，需要提供一种能准确的推送信息的方法、系统和非暂时性存储介质。

发明内容

本说明书提供一种能准确的推送信息的方法、系统和非暂时性存储介质。

本说明书提供一种推送信息的方法、执行此方法的系统和存储有用来执行此方法指令的非暂时性存储介质。所述方法和系统可以将用户多个历史特征行为以及多个历史特征行为发生的时间距离当前时刻的时间差进行结合，构造出包含用户历史特征行为时序信息的行为特征向量，将用户的行为特征向量与用户的属性特征向量组合构造出包含用户历史特征行为时序信息的组合特征向量，进而根据包含用户历史特征行为时序信息的组合特征向量向用户推送与当前需求相关的信息。

本说明书一方面提供一种推送信息的方法，包括：服务器接收目标终端的目标行为，所述目标行为与所述目标终端使用用户的当前需求相关；所述服务器获取所述目标终端的特征数据，所述特征数据包括所述目标终端在预设时间窗口中的多个历史特征行为以及所述多个历史特征行为中的每个历史特征行为的发生时间；所述服务器针对所述目标终端的当前需求，基于所述多个历史特征行为以及所述每个历史特征行为的发生时间距离当前时刻的时间差，生成所述目标终端的特征向量；所述服务器将所述特征向量输入到预测模型中，得到针对所述目标终端当前需求的预测结果；以及所述服务器基于所述预测结果向所述目标终端推送目标信息。

在一些实施例中，所述特征数据还包括所述目标终端的多个属性特征数据，所述多个属性特征数据包括所述目标终端的多个身份特征数据和多个状态特征数据。

在一些实施例中，所述基于所述多个历史特征行为以及所述每个历史特征行为的发生时间距离当前时刻的时间差，生成所述目标终端的特征向量包括：将所述多个历史特征行为以及所述每个历史特征行为的发生时间距离当前时刻的时间差输入序列编码器，生成所述目标终端的行为特征向量；将所述多个属性特征数据输入属性特征编码器，生成所述目标终端的属性特征向量；基于所述行为特征向量和所述属性特征向量，生成所述目标终端的特征向量。

在一些实施例中，所述序列编码器包括行为特征编码器和循环神经网络模型，所述将所述多个历史特征行为以及所述每个历史特征行为的发生时间距离当前时刻的时间差输入所述序列编码器，生成所述目标终端的行为特征向量包括：将所述多个历史特征行为以及所述每个历史特征行为发生的时间距离当前时刻的时间差输入所述行为特征编码器，生成多个向量组，所述每个向量组包括：对所述多个历史特征行为中的一个历史特征行为进行编码生成的行为向量；和对与所述历史特征行为相对应的时间差进行编码生成的时间差向量，其中，所述行为向量和所述时间差向量相对应；将所述多个向量组按照所述历史特征行为发生的顺序输入所述循环神经网络模型中，得到所述行为特征向量。

在一些实施例中，其中，所述循环神经网络模型包括：嵌入层和门控循环单元GRU层，所述嵌入层用于融合相对应的所述行为向量和所述时间差向量；所述门控循环单元GRU层同所述嵌入层串联。

在一些实施例中，所述将所述多个向量组按照所述历史特征行为发生的顺序输入所述循环神经网络模型中，得到所述行为特征向量包括：将所述多个相对应的行为向量和时间差向量按照所述历史特征行为发生的顺序输入到所述循环神经网络模型中，通过所述循环神经网络模型得到最后一个输入的行为向量和时间差向量对应的输出向量为所述行为特征向量，其中，在每次循环中依次将对应的行为向量和时间差向量以及上一次循环的输出输入所述嵌入层，将所述嵌入层的输出和上一次循环的输出输入到所述门控循环单元GRU层。

在一些实施例中，所述将所述多个属性特征数据输入属性特征编码器，生成所述目标终端的属性特征向量包括：对所述多个属性特征数据进行编码，得到多个属性特征数据向量；对所述多个属性特征数据向量进行求和取平均值得到所述属性特征向量。

在一些实施例中，所述基于所述行为特征向量和所述属性特征向量，生成所述目标终端的特征向量包括：将所述行为特征向量和所述属性特征向量进行拼接得到基础特征向量；对所述基础特征向量进行有限阶数的线性组合，生成所述目标终端的所述特征向量。

在一些实施例中，所述预测模型是基于以往的特征数据与所述特征数据对应的标签训练得到的。

本说明书第二方面提供一种推送信息的系统，包括：至少一个存储器和至少一个处理器，所述至少一个存储器包括至少一组指令来推送信息；所述至少一个处理器同所述至少一个存储器进行通讯，其中，当所述至少一个处理器执行所述至少一组指令时，实施本说明书所述的推送信息的方法。

本说明书第三方面一种非暂时性存储介质，存储有至少一组用来推送信息的可执行指令，当所述可执行指令被处理器执行时，所述可执行指令指导所述处理器实施本说明书所述的推送信息的方法。

由以上技术方案可知，本说明书提供的推送信息的方法、系统和存储介质，可以将用户多个历史特征行为以及多个历史特征行为发生的时间距离当前时刻的时间差进行结合，构造出包含用户历史特征行为时序信息的行为特征向量，将用户的行为特征向量与用户的属性特征向量组合构造出包含用户历史特征行为时序信息的组合特征向量，根据包含用户行为时序信息的组合特征向量向用户推送与当前需求相关的信息。

本说明书提供的推送信息的方法、系统和存储介质的其他功能将在以下说明中部分列出。根据描述，以下数字和示例介绍的内容将对那些本领域的普通技术人员显而易见。本说明书提供的推送信息的方法、系统和存储介质的创造性方面可以通过实践或使用下面详细示例中所述的方法、装置和组合得到充分解释。

附图说明

为了更清楚地说明本说明书实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了一种推送信息的系统示意图；

图2示出了一种推送信息的服务器示意图；

图3示出了一种推送信息的方法流程图；

图4示出了根据本说明书实施例提供的实现步骤S500的流程图；

图5示出了根据本说明书实施例提供的实现步骤S510的流程图；

图6示出了根据本说明书实施例提供的一种循环神经网络模型的示意图；

图7示出了根据本说明书实施例提供的一种循环神经网络模型的链结构图；

图8示出了根据本说明书实施例提供的实现步骤S530的流程图；以及

图9示出了根据本说明书实施例提供的实现步骤S550的流程图。

具体实施方式

以下描述提供了本说明书的特定应用场景和要求，目的是使本领域技术人员能够制造和使用本说明书中的内容。对于本领域技术人员来说，对所公开的实施例的各种局部修改是显而易见的，并且在不脱离本说明书的精神和范围的情况下，可以将这里定义的一般原理应用于其他实施例和应用。因此，本说明书不限于所示的实施例，而是与权利要求一致的最宽范围。

这里使用的术语仅用于描述特定示例实施例的目的，而不是限制性的。比如，除非上下文另有明确说明，这里所使用的，单数形式“一”，“一个”和“该” 也可以包括复数形式。当在本说明书中使用时，术语“包括”、“包含”和/或“含有” 意思是指所关联的整数，步骤、操作、元素和/或组件存在，但不排除一个或多个其他特征、整数、步骤、操作、元素、组件和/或组的存在或在该系统/方法中可以添加其他特征、整数、步骤、操作、元素、组件和/或组。

考虑到以下描述，本说明书的这些特征和其他特征、以及结构的相关元件的操作和功能、以及部件的组合和制造的经济性可以得到明显提高。参考附图，所有这些形成本说明书的一部分。然而，应该清楚地理解，附图仅用于说明和描述的目的，并不旨在限制本说明书的范围。还应理解，附图未按比例绘制。

本说明书中使用的流程图示出了根据本说明书中的一些实施例的系统实现的操作。应该清楚地理解，流程图的操作可以不按顺序实现。相反，操作可以以反转顺序或同时实现。此外，可以向流程图添加一个或多个其他操作。可以从流程图中移除一个或多个操作。

本说明书提供一种推送信息的系统、方法和非暂时性存储介质。所述推送信息是指根据用户当前需求和历史特征行为，对用户行为进行推测，并根据推测结果向用户推送可能感兴趣的信息。如果推送信息采用的技术是仅仅将用户行为轨迹中的用户行为单独与因子组合进而构造组合特征，则这种组合特征的构造方法只能得到用户单一行为与因子的组合。这样构造出的组合特征缺少了对用户行为轨迹中时序信息的利用。然而用户行为发生的先后顺序以及发生的时间，对识别用户当前的需求是很重要的。由于上述方法无法构造出带有用户行为时序信息的组合特征，因此不能对用户当前的行为需求进行准确预测。这将导致一些问题，例如，信息推荐列表中推荐的信息不符合用户的需求，导致问题解决效率低，影响用户体验。因此，本说明书提供一种更准确地推送信息的系统、方法和非暂时性存储介质。

图1示出了一种推送信息的系统100的示意图。推送信息的系统100(以下简称系统100)可以根据用户110的当前需求以及历史特征行为向用户110推送可能感兴趣的信息。系统100可以包括服务器200、目标终端130、网络120以及数据库150。

服务器200可以存储有执行本说明书描述的推送信息的方法的数据或指令。服务器200可以执行或用于执行本说明书中描述的推送信息的方法的数据和/或指令。

目标终端130可以包括载有目标应用(目标APP)的智能终端设备。在一些实施例中，目标终端130可以包括移动设备130-1、平板电脑130-2、笔记本电脑130-3、机动车辆130-4的内置设备或类似内容，或其任意组合。在一些实施例中，移动设备130-1可包括智能家居设备、智能移动设备、虚拟现实设备、增强现实设备或类似设备，或其任意组合。在一些实施例中，所述智能家居装置可包括智能电视、台式电脑等，或任意组合。在一些实施例中，所述智能移动设备可包括智能手机、个人数字辅助、游戏设备、导航设备等，或其任意组合。在一些实施例中，所述虚拟现实设备和/或增强现实设备可能包括虚拟现实头盔、虚拟现实眼镜、虚拟现实补丁、增强现实头盔、增强现实眼镜、增强现实补丁或类似内容，或其中的任何组合。例如，所述虚拟现实设备和/或所述增强现实设备可能包括谷歌眼镜、头戴式显示器、齿轮VR等。在一些实施例中，机动车130-4中的内置装置可包括车载计算机、车载电视等。在一些实施例中，目标终端130可以是具有定位技术的设备，用于定位目标终端130的位置。

用户110是目标终端130的使用者。用户110可以是一个人，也可以是多个人。在一些实施例中，目标终端130可以安装有1个或多个应用。所述应用能够为用户110提供通过网络120同外界交互的能力以及界面。所述目标应用可以是任何运行在目标终端130上的应用程序。所述目标应用可以是聊天类应用程序、购物类应用程序、视频类应用程序、理财类应用程序等等，例如支付宝^TM、淘宝^TM、京东^TM和/或银行等金融服务机构、理财产品等应用程序。

网络120可以促进信息和/或数据的交换。如图1所示，目标终端130、服务器200、数据库150可以同网络120连接，并且通过网络120互相传输信息和 /或数据。例如，服务器200可以通过网络120从目标终端130获取服务请求。在一些实施例中，网络120可以是任何类型的有线或无线网络，也可以是其组合。比如，网络120可以包括电缆网络，有线网络、光纤网络、电信通信网络、内联网、互联网、局域网(LAN)、广域网(WAN)、无线局域网(WLAN)、大都市市区网(MAN)、广域网(WAN)、公用电话交换网(PSTN)、蓝牙网络、 ZigBee网络、近场通信(NFC)网络或类似网络。在一些实施例中，网络120 可以包括一个或多个网络接入点。例如，网络120可以包括有线或无线网络接入点，如基站和/或互联网交换点120-1、120-2，...，通过该接入点，目标终端 130、服务器200、数据库150的一个或多个组件可以连接到网络120以交换数据和/或信息。

数据库150可以存储数据和/或指令。在一些实施例中，数据库150可以存储从目标终端130获得的数据。在一些实施例中，数据库150可以存储服务器 200可以执行或用于执行本说明书中描述的推送信息的方法的数据和/或指令。在一些实施例中，数据库150可以存储所有可能向用户110推送的信息。服务器200和目标终端130可能具有访问数据库150的权限，服务器200和目标终端130可以通过网络120访问存储在数据库150中的数据或指令。在一些实施例中，数据库150可以直接连接到服务器200和目标终端130。在一些实施例中，数据库150可以是服务器200的一部分。在一些实施例中，数据库150可以包括大容量存储、可移动存储、易失性读写存储器、只读存储器(ROM)或类似内容，或其任意组合。示例性大容量存储可能包括磁盘、光盘、固态驱动器等非暂时性存储介质(non-transitorystorage medium)。示例可移动存储可能包括闪存驱动器、软盘、光盘、存储卡、zip磁盘、磁带等。典型的易失性读写内存可能包括随机存取存储器(RAM)。示例RAM可能包括动态RAM(DRAM)、双日期速率同步动态RAM(DDR SDRAM)、静态RAM(SRAM)、晶闸管RAM (T-RAM)和零电容RAM(Z-RAM)等。示例性ROM可包括掩码ROM(MROM)、可编程ROM(PROM)、可虚拟可编程ROM(PEROM)、电子可编程ROM (EEPROM)、光盘(CD-ROM)和数字多功能磁盘ROM等。在一些实施例中，数据库150可以在云平台上实现。仅举例，云平台可能包括私有云、公共云、混合云、社区云、分布式云、云间云或类似，或其任意组合。

如图1所示，用户110在目标终端130上进行一系列操作，所述一系列操作被定义为用户110的历史特征行为。所述用户110的历史特征行为通过网络 120存储在数据库150中。当用户110在目标终端130上进行某特定行为时，例如用户110在目标终端130上进入了某金融服务机构应用的智能客服页面，则用户110进入智能客服页面的行为会通过网络120传输给服务器200；服务器 200将通过网络120调取用户110存储在数据库150中的所述历史特征行为；服务器200执行存储在服务器200和/或数据库150中的推送信息的方法的指令；服务器200通过网络120从数据库150中调取与计算结果相匹配的推送信息，并通过网络120将所述推送信息发送给目标终端130。

本说明书提供的推送信息的系统100的服务器200可以应用在多种场景中。例如，信息查询场景，服务器200可以根据用户历史浏览行为及操作向用户推送可能感兴趣的信息，例如广告信息、购物信息、理财信息、视频信息、通知信息、警示信息等等。又比如，服务器200可以应用在问题识别场景，在智能客服系统，服务器200可以根据用户历史浏览行为及操作行为推测用户可能遇到的问题，并向用户推送可能遇到的问题列表，也就是智能客服系统“猜你问题”。根据用户历史行为的不同，每个用户看到的“猜你问题”列表也各不相同。“猜你问题”会根据用户的历史行为轨迹、喜好和状态信息为用户推送“可能”需要的问题。问题识别的应用十分广泛，例如，在客服机器人自动对话中，通过问题识别也可以更加精准的识别用户的需求。纯粹为了描述方便和展示的需要，本说明书下面的描述以问题识别为例进行说明。

图2示出了一种推送信息的服务器200的示意图。服务器200可以执行本说明书描述的推送信息的方法。所述推送信息的方法在本说明书中的其他部分介绍。比如，在图3至图9的描述中介绍了所述推送信息的方法。

如图2所示，服务器200包括至少一个存储器230和至少一个处理器220。在一些实施例中，服务器200还可以包括通信端口250和内部通信总线210。同时，服务器200还可以包括I/O组件260。

内部通信总线210可以连接不同的系统组件，包括存储器230和处理器220。

I/O组件260支持服务器200和其他组件(例如，目标终端130)之间的输入/输出。

存储器230可以包括数据存储装置。所述数据存储装置可以是非暂时性存储介质，也可以是暂时性存储介质。比如，所述数据存储装置可以包括磁盘232、只读存储器(ROM)234或随机存取存储器(RAM)236中的一种或多种。存储器230还包括存储在所述数据存储装置中的至少一组指令。所述指令是计算机程序代码，所述计算机程序代码可以包括执行本说明书提供的推送信息的方法的程序、例程、对象、组件、数据结构、过程、模块等等。

通信端口250用于服务器200同外界的数据通讯。比如，服务器200可以通过通信端口250连接网络120，进而接收用户110在某金融服务机构的APP 上的行为，进而通过通信端口250向所述金融服务机构的APP推送信息。

至少一个处理器220同至少一个存储器230通过内部通信总线210进行通讯。至少一个处理器220用以执行上述至少一组指令，当至少一个处理器220 执行上述至少一组指令时，服务器200实施本说明书提供的推送信息的方法。处理器220可以执行推送信息的方法包含的所有步骤。处理器220可以是一个或多个处理器的形式，在一些实施例中，处理器220可以包括一个或多个硬件处理器，例如微控制器，微处理器，精简指令集计算机(RISC)，专用集成电路 (ASIC)，特定于应用的指令集处理器(ASIP)，中央处理单元(CPU)，图形处理单元(GPU)，物理处理单元(PPU)，微控制器单元，数字信号处理器(DSP)，现场可编程门阵列(FPGA)，高级RISC机器(ARM)，可编程逻辑器件(PLD)，能够执行一个或多个功能的任何电路或处理器等，或其任何组合。仅仅为了说明问题，在本说明书中服务器200中仅描述了一个处理器220。然而，应当注意，本说明书中服务器200还可以包括多个处理器，因此，本说明书中披露的操作和/或方法步骤可以如本说明书所述的由一个处理器执行，也可以由多个处理器联合执行。例如，如果在本说明书中服务器200的处理器220执行步骤A和步骤B，则应该理解，步骤A和步骤B也可以由两个不同处理器220联合或分开执行(例如，第一处理器执行步骤A，第二处理器执行步骤B，或者第一和第二处理器共同执行步骤A和B)。

图3示出了一种推送信息的方法流程图。如前所述，服务器200可以执行本说明书提供的推送信息的方法。具体地，服务器200中的处理器220可以执行本说明书提供的推送信息的方法。所述方法包括：

S200：服务器200接收目标终端130的目标行为，所述目标行为与所述目标终端130使用用户的当前需求相关。

所述目标终端130的目标行为，是指用户110在目标终端130上的目标应用中所进行的特定的操作行为。所述目标应用可以是安装在目标终端130上的聊天类应用，购物类应用，理财类应用，视频类应用等等。所述特定的操作行为可以反映出目标终端130的当前需求。因为是用户110操作目标终端130，所以目标终端130的当前需求可以代表用户110的当前需求。例如，在问题识别场景下，所述目标行为可以是用户110在目标终端130上的所述目标应用中进入智能客服页面，或者是用户110通过所述目标应用进入客服电话的拨打页面。此时上述行为可以代表着用户110遇到了问题，想到客服页面或客服电话的拨打页面寻求问题的帮助，此时目标终端130当前的需求(即用户110的当前需求)是提问问题。又比如，在信息查询场景下，所述目标行为可以是用户110 在目标终端130上进入了所述目标应用中的信息查询页面，此时目标终端130 当前的需求(即用户110的当前需求)是信息查询。由此可见，用户110通过目标终端130所进行的目标行为与目标终端130的当前需求(即用户110的当前需求)有关。为了展示需要，下面的描述中均以问题识别为例进行描述。当用户110在目标终端130上进行所述目标行为的操作时，目标终端130可以通过网络120将所述目标行为传输至服务器200。

S400：服务器200获取目标终端130的特征数据。

其中，目标终端130的所述特征数据可以包括目标终端130的多个行为特征数据和多个属性特征数据。

所述多个属性特征数据包括用户110在使用目标终端130的所述目标应用过程中的多个身份特征数据和多个状态特征数据。所述身份特征数据可以是与目标终端130关联的用户110的年龄、职业、性别、兴趣爱好等等标志个人身份信息的数据。所述状态数据特征可以是表示目前同用户110的需求相关的并且能够代表当前状态的数据。比如说，如果用户110当前需求是在购物网站上咨询问题，则相应的用户110的状态数据可以是“最近一笔交易是否成功”、“最近一笔交易付款方式”，或者用户110最近一次登陆所述目标应用时所在的位置，等等。所述属性特征数据是预测用户110和目标终端130的行为的重要信息。用户110的每一种属性特征数据都对应一个特定的属性(Property，简称PRO) ID。不同的属性特征数据对应不同的PRO ID。举例来说，与目标终端130的所述目标应用绑定的用户110的属性数据如表1所示：

属性	特征	PRO ID
			性别	女	PRO 1
年龄	28	PRO 2
			最近一次交易	成功	PRO 3
……	……	……

服务器200获取的所述特征数据还可以包括多个所述行为特征数据。所述多个行为特征数据可以包括目标终端130在预设时间窗口中的多个历史特征行为以及所述多个历史特征行为中的每个历史特征行为对应的发生时间。

所述预设时间窗口是在当前时刻之前的时间段。所述当前时刻可以是服务器200接收到目标终端130的目标行为的时刻。比如，所述预设时间窗口可以是所述目标行为发生前的12小时，也可以是所述目标行为发生前的24小时，甚至可以是更长或者更短的时间。所述预设时间窗口可以是一个预设时间窗口也可以是多个预设时间窗口。

所述多个历史特征行为可以是用户110在目标终端130上的历史操作行为。这些历史操作行为有助于服务器200对用户110做一些特定的分析。比如说，这些历史操作行为可以帮助服务器200理解用户110的需求和将要提问什么问题。所述历史特征行为可以包括用户110在所述目标应用程序中的操作行为和用户110在网页上登陆所述目标应用所进行的操作行为。具体地，所述历史特征行为可以包括但不限于，用户110在操作所述目标应用的过程中发生搜索、浏览、打分、点评、加入购物筐、取出购物筐、加入期待列表、购买、使用减价券和退货等行为，甚至可以包括用户在第三方网站/APP上的相关行为，如比价、看相关评测、参与讨论、社交媒体上的交流、与好友互动等行为。其中，上述第三方网站/APP与目标应用相关联，例如，用户110能够通过目标应用中的链接跳转到上述第三方网站/APP；上述第三方网站/APP在内容上也可以与所述目标应用存在关联，比如，当目标应用为淘宝^TM，第三方网站/APP可以为闲鱼^TM等APP。

所述多个历史特征行为中的每个历史特征行为的发生时间是指每个历史特征行为发生时的绝对时间。例如，在2019年12月10日12：00：02，用户110 在目标终端130上的所述目标应用的中收藏了某个产品。那么，2019年12月 10日12：00：02就是收藏所述产品的行为发生时的绝对时间。

所述多个历史特征行为按照发生时间的先后顺序形成了目标终端130的历史特征行为轨迹，比如，在预定时间窗口内，用户110通过目标终端130分别执行了至少一次的操作行为A、B、D和E，其发生次序为A->B->D->A->E。所述历史特征行为轨迹，主要包含目标终端130在所述目标应用上的访问页面名称以及访问时间。比如用户在某个周日上午10点访问了淘宝^TMAPP并搜索了运动鞋。用户110在目标终端130上操作所述目标应用时，所述目标应用与服务器200之间的远程过程调用(Remote Procedure Call，RPC调用)、用户访问的网页的统一资源定位符(Uniform Resource Locator，URL)等，均与目标终端130的历史特征行为相对应。上述的RPC远程过程调用协议，是一种通过网络从远程计算机程序上请求服务。由于RPC交互信息为本领域技术人员所熟知，在此不再赘述。

举例来说，目标终端130的历史特征行为轨迹A->B->D->A->E中，每一种历史特征行为A、B、D、E都对应一个特定的RPC ID或URL ID(ID是Identity 的缩写)。不同的历史特征行为对应不同的RPC ID或URL ID。举例来说，用户 110在预设时间窗口内在目标终端130上的所述目标应用中的历史特征行为轨迹所包含的信息以及对应的RPC ID如表2所示：

访问时间	访问页面	RPC ID
			2019.12.10 12：00：00	产品1(网址1)	RPC1
2019.12.10 12：05：00	产品2(网址2)	RPC2
			2019.12.10 12：10：00	产品3(网址3)	RPC3
2019.12.10 12：20：00	产品1(网址1)	RPC1
			2019.12.10 12：30：00	产品4(网址4)	RPC4
……	……	……

用户110在决策(如产生购买行为)前的历史特征行为信息，可以深度地反映出用户110的决策心理和意向。通过对用户110的历史特征行为进行分析，能对用户110的决策行为进行预判。例如在智能客服场景中，服务器200通过用户110在产品页面中的历史特征行为轨迹可以预判出用户110遇到了某类服务问题。在用户110拨打客服电话前或者在用户110在所述目标应用中输入问题前，服务器200能及时向用户110推送相应的问题列表，大大提升使用体验。

因此，服务器200获取目标终端130的特征数据，是指服务器200通过网络120获取预设时间窗口内的多个历史特征行为对应的RPC ID或URL ID，每个历史特征行为对应的发生时间，和多个属性特征数据对应的属性ID。

服务器200在接收到目标终端130的所述目标行为后，可以通过网络120 从数据库150中获取目标终端130的所述特征数据。服务器200也可以通过网络120直接从目标终端130中获取所述特征数据。

在获取到目标终端130的需求以及所述特征数据之后，服务器200便可以处理所述特征数据并且根据所述需求向目标终端130推送信息了。

S500：服务器200针对目标终端130的当前需求，基于所述多个历史特征行为以及所述每个历史特征行为的发生时间距离当前时刻的时间差，生成目标终端130的特征向量A。所述特征向量A可以被看作是基于用户110在目标终端 130上发生的历史特征行为而对用户110行为方式的数学描述，也即是服务器 200对目标终端130行为特点的理解。其结果是，通过目标终端130的特征向量 A，所述服务器200便可以对目标终端130的未来行为进行理解和预测。这里，由于在生成目标终端130的特征向量A的过程中考虑到了所述每个历史特征行为发生的时间信息，因此目标终端130的特征向量A也反映了所述历史特征行为发生的时间距离当前时刻的长短对用户110当前状态的影响。

S600：服务器200将所述特征向量A输入到预测模型中，得到针对目标终端 130当前需求的预测结果。

S800：服务器200基于所述预测结果向目标终端130推送目标信息。

在一些实施例中，所述特征向量e与服务器200要推送的信息相关联。比如，当目标终端130的当前需求是提问问题时，则服务器200可以通过生成的特征向量e来决定从问题数据库中选择哪些问题来推送给目标终端130。当目标终端 130的当前需求是信息查询时，则服务器200可以通过生成的特征向量e来决定从信息数据库中选择哪些信息来推送给目标终端130。为此，服务器200将根据所述特征向量e通过所述预测模型来决定下一步将为目标终端130推送哪些内容。

目标终端130的所述特征向量e是基于所述多个历史特征行为以及所述每个历史特征行为的发生时间距离当前时刻的时间差生成的。对目标终端130的当前需求所作的推测，除了要考虑各历史特征行为发生的先后顺序，还需要考虑到每个历史特征行为发生的具体时间。距离当前时刻越久的历史特征行为对目标终端130的当前需求的影响可能越小。因此在生成所述特征向量e的时候需要考虑每个历史特征行为的发生时间距离当前时刻的时间差的影响。

在一些实施例中，目标终端130的所述特征向量e还要结合所述多个属性特征数据，服务器200根据所述行为特征数据和所述属性特征数据的组合特征计算向目标终端130推送的信息。比如，目标终端130的身份、最近一次交易状态、或者登陆时的位置等等，都可能对目标终端130的当前需求造成影响。因此，将历史行为特征与属性特征进行组合，可以生成出更高阶的特征向量e，便于更精准的识别出目标终端130当前遇到的问题以及求助需求。

图4示出了根据本说明书实施例提供的实现步骤S500的流程图。在一些实施中，为了实现步骤S500，即基于所述多个历史特征行为以及所述每个历史特征行为的发生时间距离当前时刻的时间差，生成目标终端130的特征向量e，服务器200被用于执行图4示出的步骤，包括：

S510：将所述多个历史特征行为以及所述每个历史特征行为的发生时间距离当前时刻的时间差输入序列编码器，生成目标终端130的行为特征向量e_be；

S530：将所述多个属性特征数据输入属性特征编码器，生成目标终端130 的属性特征向量e_fa；

S550：基于所述行为特征向量e_be和所述属性特征向量e_fa，生成目标终端 130的特征向量A。所述特征向量A表征了所述行为特征向量e_be和所述属性特征向量e_fa的关联关系，比如，所述特征向量A量化地表达了用户110的属性对其行为的影响。

在步骤S510中，所述每个历史特征行为的发生时间距离当前时刻都形成一个时间差，所述多个历史特征行为的发生时间距离当前时刻形成多个时间差。每个历史特征行为对应一个时间差。所述多个历史特征行为与所述多个时间差一一对应。所述多个历史特征行为对应多个RPC ID或URL ID。基于多个历史特征行为和每个历史特征行为的发生时间距离当前时刻的时间差进行编码，编码后进行数据合成处理，得到行为特征向量e_be。所述行为特征向量e_be不仅包括了多个历史特征行为会对当前时刻行为预测产生的影响，而且还结合了多个历史特征行为发生的时间距离当前时刻的时间差会对当前时刻行为预测产生的影响。

所述序列编码器包括行为特征编码器和循环神经网络模型280。所述行为特征编码器用于对多个历史特征行为以及所述每个历史特征行为的发生时间距离当前时刻的时间差进行编码，以得到固定维度的向量。循环神经网络模型280 用于捕捉序列信息。图5示出了根据本说明书实施例提供的实现步骤S510的流程图。在一些实施中，为了实现步骤S510，即将所述多个历史特征行为以及所述每个历史特征行为的发生时间距离当前时刻的时间差输入所述序列编码器，生成所述目标终端130的行为特征向量e_be，服务器200被用于执行图5示出的步骤，包括：

S511：将所述多个历史特征行为以及所述每个历史特征行为的发生时间距离当前时刻的时间差输入所述行为特征编码器，生成多个向量组a；

S513：将所述多个向量组a按照所述历史特征行为发生的顺序输入循环神经网络模型280中，得到所述行为特征向量e_be。

在步骤S511中，所述每个向量组a_t包括两个向量，分别是行为向量b_t和时间差向量d_t。其中，所述行为向量b_t和所述时间差向量d_t相对应。如前所述，所述多个历史特征行为按照发生时间的先后顺序进行排列形成历史特征行为轨迹。发生时间在前的历史特征行为排在发生时间在后的历史特征行为之前。下角标t 代表历史特征行为轨迹中第t个历史特征行为。假设服务器200获取的所有历史特征行为的数量为n，则最后一个历史特征行为所对应的行为向量为b_n，与b_n对应的时间差向量为d_n。

行为向量b_t为对所述多个历史特征行为中的第t个历史特征行为进行编码生成的向量。生成行为向量b_t的编码过程为：

首先，对第t个历史特征行为对应的RPC ID或URL ID进行one-hot编码，生成向量b_rpc，t。所述one-hot编码可以将每个RPC ID或URL ID转换为一个只有1位元素为1，其余元素为0的二进制向量。不同的RPC ID或URL ID对应的二进制向量不同。

然后，对向量b_rpc，t进行embedding编码，生成行为向量b_t，可由公式(1) 表示：

b_t＝W_rpcb_rpc，t (1)

embedding编码可以将一个高维度的向量转化为低维度的向量。通过embedding编码可将向量b_rpc，t转化为固定维度的向量b_t。其中，W_rpc为历史特征行为权重矩阵。W_rpc是基于以往用户的历史特征行为轨迹和以往用户要提问的问题通过机器学习训练得到的。举例来说，在问题识别场景下，以往的用户在所述目标应用上进入智能客服系统页面之前的历史特征行为轨迹形成以往用户的历史特征行为轨迹数据库，以往的用户在所述目标应用上进入智能客服系统页面后所提问的问题形成一个以往用户的问题数据库，其中，每个问题对应一个历史特征行为轨迹。基于所述问题数据库与所述历史特征行为轨迹数据库的对应关系，通过机器学习训练得到矩阵W_rpc，矩阵W_rpc间接反映了历史行为特征与可能提问的问题之间的关联关系。举例来说，用户110在目标终端130上的历史特征行为信息如表3所示：

访问时间	访问页面	RPC ID
			2019.12.10 12:00:00	运动衣	RPC1
2019.12.10 12:20:00	运动裤	RPC2
			2019.12.10 12:40:00	棒球帽	RPC3
2019.12.10 13:00:00	蚂蚁森林	RPC4
			2019.12.10 13:30:00	运动鞋	RPC5
……	……	……

用户110在2019年12月10日13:00:00访问“蚂蚁森林”页面，在此之前和之后，用户110浏览的页面主要与“运动产品”相关，“蚂蚁森林”和“运动产品”之间的关联度较低，因此，用户110在2019年12月10日13:00:00 访问“蚂蚁森林”页面的历史特征行为与当前时刻可能要提问的问题的关联度较其他行为可能更低。

时间差向量d_t为对与所述第t个历史特征行为相对应的时间差进行编码生成的向量。生成时间差向量d_t的编码过程为：

首先，对第t个历史特征行为对应的时间差Δd_t(单位：秒)进行one-hot 编码，生成向量x_Δ，t。

然后，对向量x_Δ，t进行embedding编码，生成时间差向量d_t，可由公式(2) 表示：

d_t＝W_Δx_Δ，t (2)

其中，矩阵W_Δ为对所述时间差进行所述编码中使用的权重矩阵，所述权重矩阵W_Δ同所述时间差Δd_t的长度负相关。所述时间差Δd_t的长度越长，所对应的权重矩阵W_Δ中对应的元素值越小。W_Δ是基于以往用户的历史特征行为发生的时间距离当前时刻的时间差和以往用户要提问的问题通过机器学习训练得到的。 W_Δ间接反映了所述历史特征行为发生时间距离当前时刻的时间差与可能要提问的问题之间的关联关系。举例来说，一个历史特征行为发生的时间距离当前想要提问问题的时刻越久，这个历史特征行为对当前时刻遇到的问题所产生的影响可能越小。

图6示出了根据本说明书实施例提供的一种循环神经网络模型280的示意图。在本说明书的实施中，循环神经网络模型是基于门控循环单元GRU完成的。在步骤S513中，循环神经网络模型280可以包括嵌入层281和门控循环单元 GRU层283。

嵌入层281用于融合相对应的所述行为向量b_t和所述时间差向量d_t。嵌入层 281用于将历史特征行为以及历史特征行为对应的时间差对当前时刻行为推测的影响结合起来。门控循环单元(Gated Recurrent Units)GRU层283同嵌入层281串联。GRU网络特别适合通过深度学习处理基于时域的数据集。GRU网络是循环神经网络(RNN：Recurrent NeuralNetwork)的一种变体，即在传统循环神经网络RNN上，增加门的机制来追踪时间序列中时间步隐藏状态向量的变化。 GRU使用了更新门(update gate)与重置门(reset gate)。基本上，这两个门控向量决定了哪些信息最终能作为门控循环单元的输出。这两个门控机制的特殊之处在于，它们能够保存长期序列中的信息，且不会随时间而清除或因为与预测不相关而移除。

如图6所示，循环神经网络模型280在每次循环中依次将对应的行为向量b_t和时间差向量d_t以及上一次循环的输出h_t-1输入嵌入层281。将嵌入层281的输出o_t和上一次循环的输出h_t-1输入到门控循环单元GRU层283，得到输出h_t。为了便于理解，下面将结合具体的公式对循环神经网络模型280进行进一步说明。具体地，嵌入层281在t时刻的计算公式如下：

t_t＝σ(W_t[h_t-1，b_t，d_t]) (3)

o_t＝t_t*b_t (4)

根据第t-1时刻的隐状态向量h_t-1、结合t时刻行为向量b_t以及时间差向量d_t来得到t时刻的时间门向量t_t。其中，W_r为时间门参数矩阵，是基于以往用户的历史特征行为以及要提问的问题通过机器学习训练得到的。σ为sigmoid激活函数(函数值在0-1之间)。o_t为嵌入层281的输出。*为对多维度变量进行逐元素相乘(点乘)的运算符。点乘运算决定行为向量b_t中多少信息可以通过传送。当t_t中的部分元素输入为0或接近0时，表示行为向量b_t中相对应的内容不传送；当t_t中的部分元素输入为1或接近1时，表示行为向量b_t中相对应的内容全部传送，而当t_t中的部分元素输入在0和1之间时，表示行为向量b_t中相对应的内容部分传送。嵌入层281的主要作用是让循环神经网络模型280对历史特征行为以及对应的时间差进行过滤，自动学习决定输入的哪些内容是对行为预测有用的从而需要保留，哪些内容是对行为预测没用的，是不需要保留的。

具体地，GRU层283计算t时刻的隐状态向量h_t的计算公式如下：

r_t＝σ(W_r·[h_t-1，o_t]) (5)

z_t＝σ(W_z·[h_t-1，o_t]) (6)

其中，h_t为t时刻的隐状态向量，r_t为重置门的输出向量，W_r为重置门参数矩阵。重置门r_t是决定上一时刻t-1时刻的隐状态向量h_t-1有多少信息是需要被遗忘的。当r_t中的部分元素输入为0或接近0时，则r_t*h_t-1代表隐状态向量h_t-1中与之相对应的部分被遗忘。当r_t中的部分元素输入为1或接近1时，则r_t*h_t-1代表隐状态向量h_t-1中与之相对应的部分被保留。

z_t为更新门的输出向量，W_z为更新门参数矩阵。更新门z_t时决定上衣时刻t-1 时刻的隐状态向量h_t-1中有多少信息是要传递到t时刻的隐状态向量h_t中的。当 z_t中的部分元素输入为0或接近0时，则1-z_t中与之对应的部分元素为1或接近1，则(1-z_t)*h_t-1代表隐状态向量h_t-1中与之相对应的部分被保留在t时刻的隐状态向量h_t中。当z_t中的部分元素输入为1或接近1时，则1-z_t中与之对应的部分元素为0或接近0，则(1-z_t)*h_t-1代表隐状态向量h_t-1中与之相对应的部分被遗忘。

为t时刻的候选隐藏状态向量，

为候选参数矩阵。

结合t-1时刻的隐状态向量h_t-1中遗留下来的信息(即r_t*h_t-1)和t时刻新输入的信息o_t，

结合更新门z_t和候选隐藏状态向量

从而决定哪些信息会成为候选项被记录在t 时刻的隐状态向量h_t中。

其中，W_r、W_z、

可以基于以往用户的历史特征行为以及要提问的问题通过机器学习训练得到。

可以看出，循环神经网络模型280是一个递归的定义，时刻t下的隐状态向量h_t的计算涉及到了时刻t-1下的隐状态向量h_t-1，因此能够用于捕捉序列信息。

在步骤S513中，所述将所述多个向量组按照所述历史特征行为发生的顺序输入循环神经网络模型中，得到所述行为特征向量包括：将所述多个相对应的行为向量b_t和时间差向量d_t按照所述历史特征行为发生的顺序输入到循环神经网络模型280中，通过循环神经网络模型280进行计算，得到最后一个输入的行为向量b_n和时间差向量d_n对应的输出向量h_n为所述行为特征向量e_be。图7示出了根据本说明书实施例提供的一种循环神经网络模型280的链结构图。图7 示出了步骤S513的工作流程。

如前所述，循环神经网络模型280能够用于捕捉序列信息。时刻t下的隐状态向量h_t的计算涉及到了时刻t-1下的隐状态向量h_t-1。即上一时刻发生的历史特征行为会对下一时刻的历史特征行为产生一定的影响。因此，在基于循环神经网络模型280进行计算时，所述多个历史特征行为在输入循环神经网络模型 280时需要按照发生的先后顺序进行输入，以充分展多个历史特征行为发生的时序信息对预测结果产生的影响。取最后一时刻的隐状态向量h_n为行为特征向量 e_be。具体工作流程如图7所示。其中，h₀取0。

通过循环神经网络模型280控制不同时刻的信息输入，可以避免固定截取某一段时间的历史特征行为造成的信息损失，并且可以降低可能与当前需求无关的冗余噪声信息。

在实际应用场景中，例如在问题识别场景中，不同的历史特征行为以及同一种历史特征行为发生的时间不同对当前时刻可能遇到的问题产生的影响程度都是不同的。且历史特征行为发生的先后顺序不同对当前时刻可能遇到的问题产生的影响程度也是不同的。在循环神经网络模型280的每一次循环中，基于嵌入层281和GRU层283的重置和更新机制，以保证循环神经网络模型280能够捕捉对当前时刻可能遇到的问题影响程度较高的信息。

本领域技术人员应当理解，本说明书实施例中的门控循环单元GRU层283 也可以由其他循环神经网络代替完成预测，例如RNN网络或者LSTM网络(长短期记忆模型Long-short Term Memory)。

在步骤S530中，所述多个属性数据对应多个PRO ID。所述属性特征向量e_fa结合了多个属性特征数据对当前时刻行为预测产生的影响。

图8示出了根据本说明书实施例提供的实现步骤S530的流程图。在一些实施例中，为了实现步骤S530，即将所述多个属性特征数据输入属性特征编码器，生成所述目标终端130的属性特征向量e_fa，服务器200被用于执行图8示出的步骤，包括：

S531：对所述多个属性特征数据进行编码，得到多个属性特征数据向量e_fa，i；

S533：对所述多个属性特征数据向量e_fa，i进行求和取平均值得到所述属性特征向量e_fa。

在步骤S531中，生成属性特征数据向量e_fa，i的编码过程为：

首先，对多个属性特征数据进行one-hot编码，生成向量x_fa，i，其中，下角标i代表第i个属性数据特征(i为正整数)。

然后，对向量x_fa，i进行embedding编码，生成时间差向量属性特征数据向量 e_fa，i，可由公式(9)表示：

e_fa，i＝W_fax_fa，i (9)

其中，矩阵W_fa为对所述属性特征数据进行编码中使用的属性权重矩阵。所述属性权重矩阵W_fa是基于以往用户的属性特征数据和以往用户要提问的问题通过机器学习训练得到的。W_Δ间接反映了所述属性特征数据与可能要提问的问题之间的关联关系。

在步骤S533中，所述属性特征向量e_fa等于多个属性特征数据向量e_fa，i进行逐点求和取平均值得到，e_fa可由以下公式表示：

在步骤S550中，为了得到最终的特征向量A，需要将行为特征向量e_be和属性特征向量e_fa进行数据合成处理，以将行为特征数据和属性特征数据进行结合。行为特征数据和属性特征数据对预测目标终端130的行为的影响并不是完全独立的，而是存在一定的依赖关系或关联关系。比如，用户属性特征数据中如果包括了有吸烟习惯这个数据，则会导致在行为特征数据中出现买烟这个行为。因此，需将行为特征数据和属性特征数据进行组合计算，拟合出特征向量A，使特征向量A中的元素既包含行为特征信息又包含属性特征信息的，更全面地考虑行为特征和属性特征之间的关联关系，得到更有利于刻画行为特点的特征向量A，以便更精准地向目标终端130进行信息推送。

图9示出了根据本说明书实施例提供的实现步骤S550的流程图。在一些实施例中，为了实现步骤S550，即基于所述行为特征向量e_be和所述属性特征向量 e_fa，生成所述目标终端130的特征向量A，服务器200将行为特征向量e_be和属性特征向量e_fa进行交叉相乘和有限阶数的线性组合运算来表征行为特征向量 e_be和属性特征向量e_fa之间的关联关系。具体地，步骤S550包括：

S551：将所述行为特征向量e_be和所述属性特征向量e_fa进行拼接后得到基础特征向量e₀。步骤S551可表示为公式(11)：

具体地，例如行为特征向量e_be为n维的向量，属性特征向量e_fa为m维的向量，则拼接后得到的基础特征向量e₀为n+m维的向量。

S553：对所述基础特征向量e₀进行有限阶数的线性组合，生成特征向量A。

表达上，特征向量A是对用户110通过目标终端130的行为轨迹的数学表达，是因变量；基础特征向量e₀是当前时刻用户110通过目标终端130的行为的数学度量，是自变量。类似于使用多项式的表达方式f＝a₁x+a₂x²+a₃x³+…+b 可以用有限阶数的线性组合来表达一个非线性的函数f，所述基于所述基础特征向量e₀对特征向量A进行有限阶数的线性组合运算可以表述为：

其中，A₀＝e₀，b_l为常量，l≥0。以l+1＝2为例进行说明，即进行三阶线性组合运算，

其中，W_l为特征向量计算权重矩阵。b_l为偏置参数。W_l和b_l都可以基于历史数据通过机器学习训练得到。

可以看作是所述行为特征向量e_be与所述属性特征向量e_fa的一阶组合运算，类似于上述多项式中的a₁x项。从表达式(15)来看，A₀将所述行为特征向量e_be与所述属性特征向量e_fa独立地进行了描述。

是所述行为特征向量e_be与所述属性特征向量e_fa的二阶组合运算，类似于上述多项式中的a₂x²项。从表达式(15)来看，

包括了所述行为特征向量e_be与所述属性特征向量e_fa交叉相乘之后的加权组合，表达了所述行为特征向量e_be与所述属性特征向量e_fa之间的直接交互关系。比如用户110的属性特征在多大程度上直接影响了用户110的行为特征。举例来说，用户110近视这个属性特征可能直接导致了用户110网上购买了某款眼镜的行为。

是所述行为特征向量e_be与所述属性特征向量e_fa的三阶组合运算，类似于上述多项式中的a₃x³项。从表达式(15)来看，

包括了所述行为特征向量e_be与所述属性特征向量e_fa更高一阶交叉之后的加权组合，表达了所述行为特征向量e_be与所述属性特征向量e_fa之间比直接交互更深一层的交互关系。比如用户110的属性特征同用户110的行为特征之间是如何间接相互影响的。举例来说，因为用户110近视这个属性特征，直接导致了用户 110网上购买了某款眼镜，进而影响了用户110在着装上选择了某个风格。

表达式(12)是一个迭代表达式。从表达式(13)-(15)的迭代来看，每进行一次迭代，都将行为特征向量e_be和属性特征向量e_fa中的元素与上一次迭代构造出的组合运算结果进行交叉相乘，从而构造出高一阶的组合运算结果。通过多次迭代，可以使行为特征向量e_be和属性特征向量e_fa中的元素进行多次交叉相乘。将多次交叉相乘的结果求和，从而拟合出行为特征向量e_be和属性特征向量e_fa的关联关系，构造出能更准确地刻画目标终端130的行为的有限阶数线性组合特征向量A_l+1，从而更精准地向目标终端130推送信息。其中，有限阶数的线性组合运算表达式(12)的阶数可以基于历史数据通过机器学习得到。

通过行为特征向量e_be和属性特征向量e_fa的交叉相乘和有限阶数的线性组合运算，可以构建行为特征向量e_be与属性特征向量e_fa的有限高阶组合，同时可以通过元素参数共享减少模型中W_l和b_l的参数，实现高效的特征组合计算。

在生成所述特征向量A之后，服务器200便可以基于所述特征向量A，在接收到目标终端130的下一个特征行为之前向目标终端130推送目标信息了。

如前所述，所述特征向量A与服务器200要推送的信息相关联。具体地，在步骤S600中，服务器200在用户110在目标终端130的目标应用中进行下一个特征行为操作之前，就向目标终端130推送可能相关的信息，以提升用户的使用体验。例如，当目标终端130的当前需求是提问问题时，服务器200在用户 110进入目标应用的智能客服页面或进入拨打智能客服电话页面之后，开始执行 S400、S500、S600的指令，服务器200要在用户110向目标终端130的目标应用上输入要提问的问题之前，向目标终端130输出一个推荐的问题列表。所述推荐的问题列表就是基于所述特征向量A计算生成的所述目标信息。

具体地，在步骤S600中，将所述特征向量A输入到预测模型中，得到针对所述目标终端130当前需求的预测结果。所述预测模型可以是基于以往的历史特征数据与所述特征数据对应的信息标签通过训练得到的。所述以往的历史特征数据是基于大量用户在历史时刻在所述目标应用中的行为特征数据和属性特征数据得到的。将所述特征向量A输入到所述预测模型中，可以得到针对目标终端130当前需求的预测结果。所述预测结果为一个向量，即预测结果向量，所述预测结果向量可以映射到信息数据库中。所述信息数据库中储存有服务器200 可能推送的所有信息。所述预测结果向量中的每个元素代表与之对应的信息与当前需求相关的概率。举例来说，在问题识别场景下，所述信息数据库中储存的是所有的问题。所述预测结果向量中的每个元素都对应所述信息数据库中的一个问题，且每个元素代表与之对应的问题与目标终端130的当前需求相关的概率。所述信息数据库可以储存在数据库150中，也可以储存在服务器200中。

在步骤S800中，服务器200基于所述预测结果向目标终端130推送目标信息是指，根据所述预测结果向量，从所述信息数据库中提取概率最高的有限数量的信息作为所述目标信息向目标终端130推送。举例来说，在问题识别场景下，服务器200从所述信息数据库中提取出概率最高的10个问题形成问题推荐列表向目标终端130推送。至此，针对目标终端130的当前需求推送信息的过程已全部完成。

综上所述，本说明书提供的推送信息的方法和服务器200，提出了一种将带有时间信息和顺序信息的用户行为特征与用户属性特征相组合，从而向用户推送信息的方式。所述方法提出了可以兼顾历史特征行为轨迹中的顺序信息以及时间信息的序列编码方式。服务器200通过所述序列编码方式将历史特征行为轨迹编码为行为特征向量e_be，再令其与属性特征向量e_fa进行交叉相乘和有限阶数的线性组合(公式12)构造出带有时序信息的高阶组合特征向量A。根据所述特征向量A向用户推送与当前需求相关的信息。

本说明书另外提供一种非暂时性存储介质，存储有至少一组用来推送信息的可执行指令，当所述可执行指令被处理器执行时，所述可执行指令指导所述处理器实施本说明书提供的推送信息的方法的步骤。在一些可能的实施方式中，本说明书的各个方面还可以实现为一种程序产品的形式，其包括程序代码。当所述程序产品在目标终端130上运行时，所述程序代码用于使目标终端130执行本说明书描述的推送信息的步骤。用于实现上述方法的程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码，并可以在目标终端130，例如个人电脑上运行。然而，本说明书的程序产品不限于此，在本说明书中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统(例如处理器220)使用或者与其结合使用。所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输，包括但不限于无线、有线、光缆、RF等等，或者上述的任意合适的组合。可以以一种或多种程序设计语言的任意组合来编写用于执行本说明书操作的程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言 —诸如“C”语言或类似的程序设计语言。程序代码可以完全地在目标终端130 上执行、部分地在目标终端130上执行、作为一个独立的软件包执行、部分在目标终端130上部分在远程计算设备上执行、或者完全在远程计算设备或服务器(服务器200)上执行。在涉及远程计算设备的情形中，远程计算设备可以通过网络120连接到目标终端130，或者，可以连接到外部计算设备。

上述对本说明书特定实施例进行了描述。其他实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者是可能有利的。

综上所述，在阅读本详细公开内容之后，本领域技术人员可以明白，前述详细公开内容可以仅以示例的方式呈现，并且可以不是限制性的。尽管这里没有明确说明，本领域技术人员可以理解本说明书需求囊括对实施例的各种合理改变，改进和修改。这些改变，改进和修改旨在由本说明书提出，并且在本说明书的示例性实施例的精神和范围内。

此外，本说明书中的某些术语已被用于描述本说明书的实施例。例如，“一个实施例”，“实施例”和/或“一些实施例”意味着结合该实施例描述的特定特征，结构或特性可以包括在本说明书的至少一个实施例中。因此，可以强调并且应当理解，在本说明书的各个部分中对“实施例”或“一个实施例”或“替代实施例” 的两个或更多个引用不一定都指代相同的实施例。此外，特定特征，结构或特性可以在本说明书的一个或多个实施例中适当地组合。

应当理解，在本说明书的实施例的前述描述中，为了帮助理解一个特征，出于简化本说明书的目的，本说明书将各种特征组合在单个实施例、附图或其描述中。然而，这并不是说这些特征的组合是必须的，本领域技术人员在阅读本说明书的时候完全有可能将其中一部分特征提取出来作为单独的实施例来理解。也就是说，本说明书中的实施例也可以理解为多个次级实施例的整合。而每个次级实施例的内容在于少于单个前述公开实施例的所有特征的时候也是成立的。

本说明书引用的每个专利，专利申请，专利申请的出版物和其他材料，例如文章，书籍，说明书，出版物，文件，物品等，可以通过引用结合于此。用于所有目的的全部内容，除了与其相关的任何起诉文件历史，可能与本说明书不一致或相冲突的任何相同的，或者任何可能对权利要求的最宽范围具有限制性影响的任何相同的起诉文件历史。现在或以后与本说明书相关联。举例来说，如果在与任何所包含的材料相关联的术语的描述、定义和/或使用与本说明书相关的术语、描述、定义和/或之间存在任何不一致或冲突时，使用本说明书中的术语为准。

最后，应理解，本说明书公开的申请的实施方案是对本说明书的实施方案的原理的说明。其他修改后的实施例也在本说明书的范围内。因此，本说明书披露的实施例仅仅作为示例而非限制。本领域技术人员可以根据本说明书中的实施例采取替代配置来实现本说明书中的申请。因此，本说明书的实施例不限于申请中被精确地描述过的实施例。

Claims

1.一种推送信息的方法，包括：

服务器接收目标终端的目标行为，所述目标行为与所述目标终端使用用户的当前需求相关；

所述服务器获取所述目标终端的特征数据，所述特征数据包括所述目标终端在预设时间窗口中的多个历史特征行为以及所述多个历史特征行为中的每个历史特征行为的发生时间；

所述服务器针对所述目标终端的当前需求，基于所述多个历史特征行为以及所述每个历史特征行为的发生时间距离当前时刻的时间差，生成所述目标终端的特征向量；

所述服务器将所述特征向量输入到预测模型中，得到针对所述目标终端当前需求的预测结果；以及

所述服务器基于所述预测结果向所述目标终端推送目标信息。

2.如权利要求1所述的推送信息的方法，其中，所述特征数据还包括所述目标终端的多个属性特征数据，

所述多个属性特征数据包括所述目标终端的多个身份特征数据和多个状态特征数据。

3.如权利要求2所述的推送信息的方法，其中，所述基于所述多个历史特征行为以及所述每个历史特征行为的发生时间距离当前时刻的时间差，生成所述目标终端的特征向量包括：

将所述多个历史特征行为以及所述每个历史特征行为的发生时间距离当前时刻的时间差输入序列编码器，生成所述目标终端的行为特征向量；

将所述多个属性特征数据输入属性特征编码器，生成所述目标终端的属性特征向量；

基于所述行为特征向量和所述属性特征向量，生成所述目标终端的特征向量。

4.如权利要求3所述的推送信息的方法，其中，所述序列编码器包括行为特征编码器和循环神经网络模型，所述将所述多个历史特征行为以及所述每个历史特征行为的发生时间距离当前时刻的时间差输入所述序列编码器，生成所述目标终端的行为特征向量包括：

将所述多个历史特征行为以及所述每个历史特征行为发生的时间距离当前时刻的时间差输入所述行为特征编码器，生成多个向量组，所述每个向量组包括：

对所述多个历史特征行为中的一个历史特征行为进行编码生成的行为向量；和

对与所述历史特征行为相对应的时间差进行编码生成的时间差向量，

其中，所述行为向量和所述时间差向量相对应；

将所述多个向量组按照所述历史特征行为发生的顺序输入所述循环神经网络模型中，得到所述行为特征向量。

5.如权利要求4所述的推送信息的方法，其中，所述循环神经网络模型包括：

嵌入层，用于融合相对应的所述行为向量和所述时间差向量；和

门控循环单元GRU层，同所述嵌入层串联。

6.如权利要求5所述的推送信息的方法，其中，所述将所述多个向量组按照所述历史特征行为发生的顺序输入所述循环神经网络模型中，得到所述行为特征向量包括：

将所述多个相对应的行为向量和时间差向量按照所述历史特征行为发生的顺序输入到所述循环神经网络模型中，通过所述循环神经网络模型得到最后一个输入的行为向量和时间差向量对应的输出向量为所述行为特征向量，

其中，在每次循环中依次将对应的行为向量和时间差向量以及上一次循环的输出输入所述嵌入层，将所述嵌入层的输出和上一次循环的输出输入到所述门控循环单元GRU层。

7.如权利要求3所述的推送信息的方法，其中，所述将所述多个属性特征数据输入属性特征编码器，生成所述目标终端的属性特征向量包括：

对所述多个属性特征数据进行编码，得到多个属性特征数据向量；

对所述多个属性特征数据向量进行求和取平均值得到所述属性特征向量。

8.如权利要求3所述的推送信息的方法，其中，所述基于所述行为特征向量和所述属性特征向量，生成所述目标终端的特征向量包括：

将所述行为特征向量和所述属性特征向量进行拼接得到基础特征向量；

对所述基础特征向量进行有限阶数的线性组合，生成所述目标终端的所述特征向量。

9.如权利要求1所述的推送信息的方法，其中，所述预测模型是基于以往的特征数据与所述特征数据对应的标签训练得到的。

10.一种推送信息的系统，包括：

至少一个存储器，所述至少一个存储器包括至少一组指令来推送信息；

至少一个处理器，同所述至少一个存储器进行通讯，

其中，当所述至少一个处理器执行所述至少一组指令时，实施权利要求1-9中任一项所述的推送信息的方法。

11.一种非暂时性存储介质，存储有至少一组用来推送信息的可执行指令，当所述可执行指令被处理器执行时，所述可执行指令指导所述处理器实施权利要求1-9中任一项所述的推送信息的方法。