CN111274501A - 推送信息的方法、系统和非暂时性存储介质 - Google Patents

推送信息的方法、系统和非暂时性存储介质 Download PDF

Info

Publication number
CN111274501A
CN111274501A CN202010117833.1A CN202010117833A CN111274501A CN 111274501 A CN111274501 A CN 111274501A CN 202010117833 A CN202010117833 A CN 202010117833A CN 111274501 A CN111274501 A CN 111274501A
Authority
CN
China
Prior art keywords
vector
behavior
feature
target terminal
historical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010117833.1A
Other languages
English (en)
Other versions
CN111274501B (zh
Inventor
傅驰林
张晓露
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202010117833.1A priority Critical patent/CN111274501B/zh
Publication of CN111274501A publication Critical patent/CN111274501A/zh
Application granted granted Critical
Publication of CN111274501B publication Critical patent/CN111274501B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Abstract

本说明书提供的推送信息的方法、系统和非暂时性存储介质,基于目标终端的当前需求,将所述目标终端的多个历史特征行为以及多个历史特征行为中的每个历史特征行为发生的时间距离当前时刻的时间差进行结合,构造出包含用户历史特征行为时序信息的特征向量,将所述特征向量输入预测模型中得到预测结果,基于所述预测结果向所述目标终端推送与当前需求相关的信息。

Description

推送信息的方法、系统和非暂时性存储介质
技术领域
本说明书涉及计算机技术领域,尤其涉及一种推送信息的方法、系统和非 暂时性存储介质。
背景技术
随着互联网技术的进步,人们日常生活中越来越多的信息以及操作都可以 通过网络平台进行,例如网络购物,网络预约,网络查询,甚至是网络学习等 等。为了提升用户体验,很多应用程序(Application,简称APP)中通常都设置 有智能客服的功能。智能客服系统是在大规模知识处理基础上发展起来的一项 面向行业应用的技术,为企业与海量用户之间的沟通建立了一种基于自然语言 的快捷有效的技术手段。在很多应用程序的智能客服体系中,问题识别在很多 场景中扮演着重要的作用。比如,“猜你问题”是智能客服面对用户的第一道关卡。 当用户进入应用程序中“我的客服”页面,应用程序会提供一个问题推荐列表,这 就是“猜你问题”。问题识别模型在“猜你问题”场景中,发挥重大作用。问题识别 本质是基于用户的历史行为来预测用户可能碰到的问题,达到“未问先答”,帮助 用户解决问题,提高用户的满意度,并且节省人工客服的人力成本。
为了更准确地预测用户可能遇到的问题,需要提供一种能准确的推送信息 的方法、系统和非暂时性存储介质。
发明内容
本说明书提供一种能准确的推送信息的方法、系统和非暂时性存储介质。
本说明书提供一种推送信息的方法、执行此方法的系统和存储有用来执行 此方法指令的非暂时性存储介质。所述方法和系统可以将用户多个历史特征行 为以及多个历史特征行为发生的时间距离当前时刻的时间差进行结合,构造出 包含用户历史特征行为时序信息的行为特征向量,将用户的行为特征向量与用 户的属性特征向量组合构造出包含用户历史特征行为时序信息的组合特征向量, 进而根据包含用户历史特征行为时序信息的组合特征向量向用户推送与当前需 求相关的信息。
本说明书一方面提供一种推送信息的方法,包括:服务器接收目标终端的 目标行为,所述目标行为与所述目标终端使用用户的当前需求相关;所述服务 器获取所述目标终端的特征数据,所述特征数据包括所述目标终端在预设时间 窗口中的多个历史特征行为以及所述多个历史特征行为中的每个历史特征行为 的发生时间;所述服务器针对所述目标终端的当前需求,基于所述多个历史特 征行为以及所述每个历史特征行为的发生时间距离当前时刻的时间差,生成所 述目标终端的特征向量;所述服务器将所述特征向量输入到预测模型中,得到 针对所述目标终端当前需求的预测结果;以及所述服务器基于所述预测结果向 所述目标终端推送目标信息。
在一些实施例中,所述特征数据还包括所述目标终端的多个属性特征数据, 所述多个属性特征数据包括所述目标终端的多个身份特征数据和多个状态特征 数据。
在一些实施例中,所述基于所述多个历史特征行为以及所述每个历史特征 行为的发生时间距离当前时刻的时间差,生成所述目标终端的特征向量包括: 将所述多个历史特征行为以及所述每个历史特征行为的发生时间距离当前时刻 的时间差输入序列编码器,生成所述目标终端的行为特征向量;将所述多个属 性特征数据输入属性特征编码器,生成所述目标终端的属性特征向量;基于所 述行为特征向量和所述属性特征向量,生成所述目标终端的特征向量。
在一些实施例中,所述序列编码器包括行为特征编码器和循环神经网络模 型,所述将所述多个历史特征行为以及所述每个历史特征行为的发生时间距离 当前时刻的时间差输入所述序列编码器,生成所述目标终端的行为特征向量包 括:将所述多个历史特征行为以及所述每个历史特征行为发生的时间距离当前 时刻的时间差输入所述行为特征编码器,生成多个向量组,所述每个向量组包 括:对所述多个历史特征行为中的一个历史特征行为进行编码生成的行为向量; 和对与所述历史特征行为相对应的时间差进行编码生成的时间差向量,其中, 所述行为向量和所述时间差向量相对应;将所述多个向量组按照所述历史特征 行为发生的顺序输入所述循环神经网络模型中,得到所述行为特征向量。
在一些实施例中,其中,所述循环神经网络模型包括:嵌入层和门控循环 单元GRU层,所述嵌入层用于融合相对应的所述行为向量和所述时间差向量; 所述门控循环单元GRU层同所述嵌入层串联。
在一些实施例中,所述将所述多个向量组按照所述历史特征行为发生的顺 序输入所述循环神经网络模型中,得到所述行为特征向量包括:将所述多个相 对应的行为向量和时间差向量按照所述历史特征行为发生的顺序输入到所述循 环神经网络模型中,通过所述循环神经网络模型得到最后一个输入的行为向量 和时间差向量对应的输出向量为所述行为特征向量,其中,在每次循环中依次 将对应的行为向量和时间差向量以及上一次循环的输出输入所述嵌入层,将所 述嵌入层的输出和上一次循环的输出输入到所述门控循环单元GRU层。
在一些实施例中,所述将所述多个属性特征数据输入属性特征编码器,生 成所述目标终端的属性特征向量包括:对所述多个属性特征数据进行编码,得 到多个属性特征数据向量;对所述多个属性特征数据向量进行求和取平均值得 到所述属性特征向量。
在一些实施例中,所述基于所述行为特征向量和所述属性特征向量,生成 所述目标终端的特征向量包括:将所述行为特征向量和所述属性特征向量进行 拼接得到基础特征向量;对所述基础特征向量进行有限阶数的线性组合,生成 所述目标终端的所述特征向量。
在一些实施例中,所述预测模型是基于以往的特征数据与所述特征数据对 应的标签训练得到的。
本说明书第二方面提供一种推送信息的系统,包括:至少一个存储器和至 少一个处理器,所述至少一个存储器包括至少一组指令来推送信息;所述至少 一个处理器同所述至少一个存储器进行通讯,其中,当所述至少一个处理器执 行所述至少一组指令时,实施本说明书所述的推送信息的方法。
本说明书第三方面一种非暂时性存储介质,存储有至少一组用来推送信息 的可执行指令,当所述可执行指令被处理器执行时,所述可执行指令指导所述 处理器实施本说明书所述的推送信息的方法。
由以上技术方案可知,本说明书提供的推送信息的方法、系统和存储介质, 可以将用户多个历史特征行为以及多个历史特征行为发生的时间距离当前时刻 的时间差进行结合,构造出包含用户历史特征行为时序信息的行为特征向量, 将用户的行为特征向量与用户的属性特征向量组合构造出包含用户历史特征行 为时序信息的组合特征向量,根据包含用户行为时序信息的组合特征向量向用 户推送与当前需求相关的信息。
本说明书提供的推送信息的方法、系统和存储介质的其他功能将在以下说 明中部分列出。根据描述,以下数字和示例介绍的内容将对那些本领域的普通 技术人员显而易见。本说明书提供的推送信息的方法、系统和存储介质的创造 性方面可以通过实践或使用下面详细示例中所述的方法、装置和组合得到充分 解释。
附图说明
为了更清楚地说明本说明书实施例中的技术方案,下面将对实施例描述中 所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说 明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前 提下,还可以根据这些附图获得其他的附图。
图1示出了一种推送信息的系统示意图;
图2示出了一种推送信息的服务器示意图;
图3示出了一种推送信息的方法流程图;
图4示出了根据本说明书实施例提供的实现步骤S500的流程图;
图5示出了根据本说明书实施例提供的实现步骤S510的流程图;
图6示出了根据本说明书实施例提供的一种循环神经网络模型的示意图;
图7示出了根据本说明书实施例提供的一种循环神经网络模型的链结构图;
图8示出了根据本说明书实施例提供的实现步骤S530的流程图;以及
图9示出了根据本说明书实施例提供的实现步骤S550的流程图。
具体实施方式
以下描述提供了本说明书的特定应用场景和要求,目的是使本领域技术人 员能够制造和使用本说明书中的内容。对于本领域技术人员来说,对所公开的 实施例的各种局部修改是显而易见的,并且在不脱离本说明书的精神和范围的 情况下,可以将这里定义的一般原理应用于其他实施例和应用。因此,本说明 书不限于所示的实施例,而是与权利要求一致的最宽范围。
这里使用的术语仅用于描述特定示例实施例的目的,而不是限制性的。比 如,除非上下文另有明确说明,这里所使用的,单数形式“一”,“一个”和“该” 也可以包括复数形式。当在本说明书中使用时,术语“包括”、“包含”和/或“含有” 意思是指所关联的整数,步骤、操作、元素和/或组件存在,但不排除一个或多 个其他特征、整数、步骤、操作、元素、组件和/或组的存在或在该系统/方法中 可以添加其他特征、整数、步骤、操作、元素、组件和/或组。
考虑到以下描述,本说明书的这些特征和其他特征、以及结构的相关元件 的操作和功能、以及部件的组合和制造的经济性可以得到明显提高。参考附图, 所有这些形成本说明书的一部分。然而,应该清楚地理解,附图仅用于说明和 描述的目的,并不旨在限制本说明书的范围。还应理解,附图未按比例绘制。
本说明书中使用的流程图示出了根据本说明书中的一些实施例的系统实现 的操作。应该清楚地理解,流程图的操作可以不按顺序实现。相反,操作可以 以反转顺序或同时实现。此外,可以向流程图添加一个或多个其他操作。可以 从流程图中移除一个或多个操作。
本说明书提供一种推送信息的系统、方法和非暂时性存储介质。所述推送 信息是指根据用户当前需求和历史特征行为,对用户行为进行推测,并根据推 测结果向用户推送可能感兴趣的信息。如果推送信息采用的技术是仅仅将用户 行为轨迹中的用户行为单独与因子组合进而构造组合特征,则这种组合特征的 构造方法只能得到用户单一行为与因子的组合。这样构造出的组合特征缺少了 对用户行为轨迹中时序信息的利用。然而用户行为发生的先后顺序以及发生的 时间,对识别用户当前的需求是很重要的。由于上述方法无法构造出带有用户 行为时序信息的组合特征,因此不能对用户当前的行为需求进行准确预测。这 将导致一些问题,例如,信息推荐列表中推荐的信息不符合用户的需求,导致 问题解决效率低,影响用户体验。因此,本说明书提供一种更准确地推送信息 的系统、方法和非暂时性存储介质。
图1示出了一种推送信息的系统100的示意图。推送信息的系统100(以下 简称系统100)可以根据用户110的当前需求以及历史特征行为向用户110推送 可能感兴趣的信息。系统100可以包括服务器200、目标终端130、网络120以 及数据库150。
服务器200可以存储有执行本说明书描述的推送信息的方法的数据或指令。 服务器200可以执行或用于执行本说明书中描述的推送信息的方法的数据和/或 指令。
目标终端130可以包括载有目标应用(目标APP)的智能终端设备。在一 些实施例中,目标终端130可以包括移动设备130-1、平板电脑130-2、笔记本 电脑130-3、机动车辆130-4的内置设备或类似内容,或其任意组合。在一些实 施例中,移动设备130-1可包括智能家居设备、智能移动设备、虚拟现实设备、 增强现实设备或类似设备,或其任意组合。在一些实施例中,所述智能家居装 置可包括智能电视、台式电脑等,或任意组合。在一些实施例中,所述智能移 动设备可包括智能手机、个人数字辅助、游戏设备、导航设备等,或其任意组 合。在一些实施例中,所述虚拟现实设备和/或增强现实设备可能包括虚拟现实 头盔、虚拟现实眼镜、虚拟现实补丁、增强现实头盔、增强现实眼镜、增强现 实补丁或类似内容,或其中的任何组合。例如,所述虚拟现实设备和/或所述增 强现实设备可能包括谷歌眼镜、头戴式显示器、齿轮VR等。在一些实施例中, 机动车130-4中的内置装置可包括车载计算机、车载电视等。在一些实施例中, 目标终端130可以是具有定位技术的设备,用于定位目标终端130的位置。
用户110是目标终端130的使用者。用户110可以是一个人,也可以是多 个人。在一些实施例中,目标终端130可以安装有1个或多个应用。所述应用 能够为用户110提供通过网络120同外界交互的能力以及界面。所述目标应用 可以是任何运行在目标终端130上的应用程序。所述目标应用可以是聊天类应 用程序、购物类应用程序、视频类应用程序、理财类应用程序等等,例如支付 宝TM、淘宝TM、京东TM和/或银行等金融服务机构、理财产品等应用程序。
网络120可以促进信息和/或数据的交换。如图1所示,目标终端130、服 务器200、数据库150可以同网络120连接,并且通过网络120互相传输信息和 /或数据。例如,服务器200可以通过网络120从目标终端130获取服务请求。 在一些实施例中,网络120可以是任何类型的有线或无线网络,也可以是其组 合。比如,网络120可以包括电缆网络,有线网络、光纤网络、电信通信网络、 内联网、互联网、局域网(LAN)、广域网(WAN)、无线局域网(WLAN)、大 都市市区网(MAN)、广域网(WAN)、公用电话交换网(PSTN)、蓝牙网络、 ZigBee网络、近场通信(NFC)网络或类似网络。在一些实施例中,网络120 可以包括一个或多个网络接入点。例如,网络120可以包括有线或无线网络接 入点,如基站和/或互联网交换点120-1、120-2,...,通过该接入点,目标终端 130、服务器200、数据库150的一个或多个组件可以连接到网络120以交换数 据和/或信息。
数据库150可以存储数据和/或指令。在一些实施例中,数据库150可以存 储从目标终端130获得的数据。在一些实施例中,数据库150可以存储服务器 200可以执行或用于执行本说明书中描述的推送信息的方法的数据和/或指令。 在一些实施例中,数据库150可以存储所有可能向用户110推送的信息。服务 器200和目标终端130可能具有访问数据库150的权限,服务器200和目标终 端130可以通过网络120访问存储在数据库150中的数据或指令。在一些实施 例中,数据库150可以直接连接到服务器200和目标终端130。在一些实施例中, 数据库150可以是服务器200的一部分。在一些实施例中,数据库150可以包括 大容量存储、可移动存储、易失性读写存储器、只读存储器(ROM)或类似内 容,或其任意组合。示例性大容量存储可能包括磁盘、光盘、固态驱动器等非 暂时性存储介质(non-transitorystorage medium)。示例可移动存储可能包括闪存 驱动器、软盘、光盘、存储卡、zip磁盘、磁带等。典型的易失性读写内存可能 包括随机存取存储器(RAM)。示例RAM可能包括动态RAM(DRAM)、双日 期速率同步动态RAM(DDR SDRAM)、静态RAM(SRAM)、晶闸管RAM (T-RAM)和零电容RAM(Z-RAM)等。示例性ROM可包括掩码ROM(MROM)、 可编程ROM(PROM)、可虚拟可编程ROM(PEROM)、电子可编程ROM (EEPROM)、光盘(CD-ROM)和数字多功能磁盘ROM等。在一些实施例中, 数据库150可以在云平台上实现。仅举例,云平台可能包括私有云、公共云、 混合云、社区云、分布式云、云间云或类似,或其任意组合。
如图1所示,用户110在目标终端130上进行一系列操作,所述一系列操 作被定义为用户110的历史特征行为。所述用户110的历史特征行为通过网络 120存储在数据库150中。当用户110在目标终端130上进行某特定行为时,例 如用户110在目标终端130上进入了某金融服务机构应用的智能客服页面,则 用户110进入智能客服页面的行为会通过网络120传输给服务器200;服务器 200将通过网络120调取用户110存储在数据库150中的所述历史特征行为;服 务器200执行存储在服务器200和/或数据库150中的推送信息的方法的指令; 服务器200通过网络120从数据库150中调取与计算结果相匹配的推送信息, 并通过网络120将所述推送信息发送给目标终端130。
本说明书提供的推送信息的系统100的服务器200可以应用在多种场景中。 例如,信息查询场景,服务器200可以根据用户历史浏览行为及操作向用户推 送可能感兴趣的信息,例如广告信息、购物信息、理财信息、视频信息、通知 信息、警示信息等等。又比如,服务器200可以应用在问题识别场景,在智能 客服系统,服务器200可以根据用户历史浏览行为及操作行为推测用户可能遇 到的问题,并向用户推送可能遇到的问题列表,也就是智能客服系统“猜你问题”。 根据用户历史行为的不同,每个用户看到的“猜你问题”列表也各不相同。“猜你 问题”会根据用户的历史行为轨迹、喜好和状态信息为用户推送“可能”需要的问题。问题识别的应用十分广泛,例如,在客服机器人自动对话中,通过问题识 别也可以更加精准的识别用户的需求。纯粹为了描述方便和展示的需要,本说 明书下面的描述以问题识别为例进行说明。
图2示出了一种推送信息的服务器200的示意图。服务器200可以执行本 说明书描述的推送信息的方法。所述推送信息的方法在本说明书中的其他部分 介绍。比如,在图3至图9的描述中介绍了所述推送信息的方法。
如图2所示,服务器200包括至少一个存储器230和至少一个处理器220。 在一些实施例中,服务器200还可以包括通信端口250和内部通信总线210。同 时,服务器200还可以包括I/O组件260。
内部通信总线210可以连接不同的系统组件,包括存储器230和处理器220。
I/O组件260支持服务器200和其他组件(例如,目标终端130)之间的输 入/输出。
存储器230可以包括数据存储装置。所述数据存储装置可以是非暂时性存 储介质,也可以是暂时性存储介质。比如,所述数据存储装置可以包括磁盘232、 只读存储器(ROM)234或随机存取存储器(RAM)236中的一种或多种。存 储器230还包括存储在所述数据存储装置中的至少一组指令。所述指令是计算 机程序代码,所述计算机程序代码可以包括执行本说明书提供的推送信息的方 法的程序、例程、对象、组件、数据结构、过程、模块等等。
通信端口250用于服务器200同外界的数据通讯。比如,服务器200可以 通过通信端口250连接网络120,进而接收用户110在某金融服务机构的APP 上的行为,进而通过通信端口250向所述金融服务机构的APP推送信息。
至少一个处理器220同至少一个存储器230通过内部通信总线210进行通 讯。至少一个处理器220用以执行上述至少一组指令,当至少一个处理器220 执行上述至少一组指令时,服务器200实施本说明书提供的推送信息的方法。 处理器220可以执行推送信息的方法包含的所有步骤。处理器220可以是一个 或多个处理器的形式,在一些实施例中,处理器220可以包括一个或多个硬件 处理器,例如微控制器,微处理器,精简指令集计算机(RISC),专用集成电路 (ASIC),特定于应用的指令集处理器(ASIP),中央处理单元(CPU),图形处 理单元(GPU),物理处理单元(PPU),微控制器单元,数字信号处理器(DSP), 现场可编程门阵列(FPGA),高级RISC机器(ARM),可编程逻辑器件(PLD), 能够执行一个或多个功能的任何电路或处理器等,或其任何组合。仅仅为了说 明问题,在本说明书中服务器200中仅描述了一个处理器220。然而,应当注意, 本说明书中服务器200还可以包括多个处理器,因此,本说明书中披露的操作 和/或方法步骤可以如本说明书所述的由一个处理器执行,也可以由多个处理器 联合执行。例如,如果在本说明书中服务器200的处理器220执行步骤A和步 骤B,则应该理解,步骤A和步骤B也可以由两个不同处理器220联合或分开 执行(例如,第一处理器执行步骤A,第二处理器执行步骤B,或者第一和第二 处理器共同执行步骤A和B)。
图3示出了一种推送信息的方法流程图。如前所述,服务器200可以执行 本说明书提供的推送信息的方法。具体地,服务器200中的处理器220可以执 行本说明书提供的推送信息的方法。所述方法包括:
S200:服务器200接收目标终端130的目标行为,所述目标行为与所述目 标终端130使用用户的当前需求相关。
所述目标终端130的目标行为,是指用户110在目标终端130上的目标应 用中所进行的特定的操作行为。所述目标应用可以是安装在目标终端130上的 聊天类应用,购物类应用,理财类应用,视频类应用等等。所述特定的操作行 为可以反映出目标终端130的当前需求。因为是用户110操作目标终端130,所 以目标终端130的当前需求可以代表用户110的当前需求。例如,在问题识别 场景下,所述目标行为可以是用户110在目标终端130上的所述目标应用中进 入智能客服页面,或者是用户110通过所述目标应用进入客服电话的拨打页面。 此时上述行为可以代表着用户110遇到了问题,想到客服页面或客服电话的拨 打页面寻求问题的帮助,此时目标终端130当前的需求(即用户110的当前需 求)是提问问题。又比如,在信息查询场景下,所述目标行为可以是用户110 在目标终端130上进入了所述目标应用中的信息查询页面,此时目标终端130 当前的需求(即用户110的当前需求)是信息查询。由此可见,用户110通过 目标终端130所进行的目标行为与目标终端130的当前需求(即用户110的当 前需求)有关。为了展示需要,下面的描述中均以问题识别为例进行描述。当用户110在目标终端130上进行所述目标行为的操作时,目标终端130可以通 过网络120将所述目标行为传输至服务器200。
S400:服务器200获取目标终端130的特征数据。
其中,目标终端130的所述特征数据可以包括目标终端130的多个行为特 征数据和多个属性特征数据。
所述多个属性特征数据包括用户110在使用目标终端130的所述目标应用 过程中的多个身份特征数据和多个状态特征数据。所述身份特征数据可以是与 目标终端130关联的用户110的年龄、职业、性别、兴趣爱好等等标志个人身 份信息的数据。所述状态数据特征可以是表示目前同用户110的需求相关的并 且能够代表当前状态的数据。比如说,如果用户110当前需求是在购物网站上 咨询问题,则相应的用户110的状态数据可以是“最近一笔交易是否成功”、“最 近一笔交易付款方式”,或者用户110最近一次登陆所述目标应用时所在的位置, 等等。所述属性特征数据是预测用户110和目标终端130的行为的重要信息。用户110的每一种属性特征数据都对应一个特定的属性(Property,简称PRO) ID。不同的属性特征数据对应不同的PRO ID。举例来说,与目标终端130的所 述目标应用绑定的用户110的属性数据如表1所示:
属性 特征 PRO ID
性别 PRO 1
年龄 28 PRO 2
最近一次交易 成功 PRO 3
…… …… ……
服务器200获取的所述特征数据还可以包括多个所述行为特征数据。所述 多个行为特征数据可以包括目标终端130在预设时间窗口中的多个历史特征行 为以及所述多个历史特征行为中的每个历史特征行为对应的发生时间。
所述预设时间窗口是在当前时刻之前的时间段。所述当前时刻可以是服务 器200接收到目标终端130的目标行为的时刻。比如,所述预设时间窗口可以 是所述目标行为发生前的12小时,也可以是所述目标行为发生前的24小时, 甚至可以是更长或者更短的时间。所述预设时间窗口可以是一个预设时间窗口 也可以是多个预设时间窗口。
所述多个历史特征行为可以是用户110在目标终端130上的历史操作行为。 这些历史操作行为有助于服务器200对用户110做一些特定的分析。比如说, 这些历史操作行为可以帮助服务器200理解用户110的需求和将要提问什么问 题。所述历史特征行为可以包括用户110在所述目标应用程序中的操作行为和 用户110在网页上登陆所述目标应用所进行的操作行为。具体地,所述历史特 征行为可以包括但不限于,用户110在操作所述目标应用的过程中发生搜索、 浏览、打分、点评、加入购物筐、取出购物筐、加入期待列表、购买、使用减 价券和退货等行为,甚至可以包括用户在第三方网站/APP上的相关行为,如比 价、看相关评测、参与讨论、社交媒体上的交流、与好友互动等行为。其中, 上述第三方网站/APP与目标应用相关联,例如,用户110能够通过目标应用中 的链接跳转到上述第三方网站/APP;上述第三方网站/APP在内容上也可以与所 述目标应用存在关联,比如,当目标应用为淘宝TM,第三方网站/APP可以为闲 鱼TM等APP。
所述多个历史特征行为中的每个历史特征行为的发生时间是指每个历史特 征行为发生时的绝对时间。例如,在2019年12月10日12:00:02,用户110 在目标终端130上的所述目标应用的中收藏了某个产品。那么,2019年12月 10日12:00:02就是收藏所述产品的行为发生时的绝对时间。
所述多个历史特征行为按照发生时间的先后顺序形成了目标终端130的历 史特征行为轨迹,比如,在预定时间窗口内,用户110通过目标终端130分别 执行了至少一次的操作行为A、B、D和E,其发生次序为A->B->D->A->E。所 述历史特征行为轨迹,主要包含目标终端130在所述目标应用上的访问页面名 称以及访问时间。比如用户在某个周日上午10点访问了淘宝TMAPP并搜索了运 动鞋。用户110在目标终端130上操作所述目标应用时,所述目标应用与服务 器200之间的远程过程调用(Remote Procedure Call,RPC调用)、用户访问的网 页的统一资源定位符(Uniform Resource Locator,URL)等,均与目标终端130的 历史特征行为相对应。上述的RPC远程过程调用协议,是一种通过网络从远程 计算机程序上请求服务。由于RPC交互信息为本领域技术人员所熟知,在此不 再赘述。
举例来说,目标终端130的历史特征行为轨迹A->B->D->A->E中,每一种 历史特征行为A、B、D、E都对应一个特定的RPC ID或URL ID(ID是Identity 的缩写)。不同的历史特征行为对应不同的RPC ID或URL ID。举例来说,用户 110在预设时间窗口内在目标终端130上的所述目标应用中的历史特征行为轨迹 所包含的信息以及对应的RPC ID如表2所示:
访问时间 访问页面 RPC ID
2019.12.10 12:00:00 产品1(网址1) RPC1
2019.12.10 12:05:00 产品2(网址2) RPC2
2019.12.10 12:10:00 产品3(网址3) RPC3
2019.12.10 12:20:00 产品1(网址1) RPC1
2019.12.10 12:30:00 产品4(网址4) RPC4
…… …… ……
用户110在决策(如产生购买行为)前的历史特征行为信息,可以深度地反映 出用户110的决策心理和意向。通过对用户110的历史特征行为进行分析,能 对用户110的决策行为进行预判。例如在智能客服场景中,服务器200通过用 户110在产品页面中的历史特征行为轨迹可以预判出用户110遇到了某类服务 问题。在用户110拨打客服电话前或者在用户110在所述目标应用中输入问题 前,服务器200能及时向用户110推送相应的问题列表,大大提升使用体验。
因此,服务器200获取目标终端130的特征数据,是指服务器200通过网 络120获取预设时间窗口内的多个历史特征行为对应的RPC ID或URL ID,每 个历史特征行为对应的发生时间,和多个属性特征数据对应的属性ID。
服务器200在接收到目标终端130的所述目标行为后,可以通过网络120 从数据库150中获取目标终端130的所述特征数据。服务器200也可以通过网 络120直接从目标终端130中获取所述特征数据。
在获取到目标终端130的需求以及所述特征数据之后,服务器200便可以 处理所述特征数据并且根据所述需求向目标终端130推送信息了。
S500:服务器200针对目标终端130的当前需求,基于所述多个历史特征 行为以及所述每个历史特征行为的发生时间距离当前时刻的时间差,生成目标 终端130的特征向量A。所述特征向量A可以被看作是基于用户110在目标终端 130上发生的历史特征行为而对用户110行为方式的数学描述,也即是服务器 200对目标终端130行为特点的理解。其结果是,通过目标终端130的特征向量 A,所述服务器200便可以对目标终端130的未来行为进行理解和预测。这里, 由于在生成目标终端130的特征向量A的过程中考虑到了所述每个历史特征行为 发生的时间信息,因此目标终端130的特征向量A也反映了所述历史特征行为发生的时间距离当前时刻的长短对用户110当前状态的影响。
S600:服务器200将所述特征向量A输入到预测模型中,得到针对目标终端 130当前需求的预测结果。
S800:服务器200基于所述预测结果向目标终端130推送目标信息。
在一些实施例中,所述特征向量e与服务器200要推送的信息相关联。比如, 当目标终端130的当前需求是提问问题时,则服务器200可以通过生成的特征 向量e来决定从问题数据库中选择哪些问题来推送给目标终端130。当目标终端 130的当前需求是信息查询时,则服务器200可以通过生成的特征向量e来决定 从信息数据库中选择哪些信息来推送给目标终端130。为此,服务器200将根据 所述特征向量e通过所述预测模型来决定下一步将为目标终端130推送哪些内容。
目标终端130的所述特征向量e是基于所述多个历史特征行为以及所述每个 历史特征行为的发生时间距离当前时刻的时间差生成的。对目标终端130的当 前需求所作的推测,除了要考虑各历史特征行为发生的先后顺序,还需要考虑 到每个历史特征行为发生的具体时间。距离当前时刻越久的历史特征行为对目 标终端130的当前需求的影响可能越小。因此在生成所述特征向量e的时候需要 考虑每个历史特征行为的发生时间距离当前时刻的时间差的影响。
在一些实施例中,目标终端130的所述特征向量e还要结合所述多个属性特 征数据,服务器200根据所述行为特征数据和所述属性特征数据的组合特征计 算向目标终端130推送的信息。比如,目标终端130的身份、最近一次交易状 态、或者登陆时的位置等等,都可能对目标终端130的当前需求造成影响。因 此,将历史行为特征与属性特征进行组合,可以生成出更高阶的特征向量e,便 于更精准的识别出目标终端130当前遇到的问题以及求助需求。
图4示出了根据本说明书实施例提供的实现步骤S500的流程图。在一些实 施中,为了实现步骤S500,即基于所述多个历史特征行为以及所述每个历史特 征行为的发生时间距离当前时刻的时间差,生成目标终端130的特征向量e,服 务器200被用于执行图4示出的步骤,包括:
S510:将所述多个历史特征行为以及所述每个历史特征行为的发生时间距 离当前时刻的时间差输入序列编码器,生成目标终端130的行为特征向量ebe
S530:将所述多个属性特征数据输入属性特征编码器,生成目标终端130 的属性特征向量efa
S550:基于所述行为特征向量ebe和所述属性特征向量efa,生成目标终端 130的特征向量A。所述特征向量A表征了所述行为特征向量ebe和所述属性特征 向量efa的关联关系,比如,所述特征向量A量化地表达了用户110的属性对其 行为的影响。
在步骤S510中,所述每个历史特征行为的发生时间距离当前时刻都形成一 个时间差,所述多个历史特征行为的发生时间距离当前时刻形成多个时间差。 每个历史特征行为对应一个时间差。所述多个历史特征行为与所述多个时间差 一一对应。所述多个历史特征行为对应多个RPC ID或URL ID。基于多个历史 特征行为和每个历史特征行为的发生时间距离当前时刻的时间差进行编码,编 码后进行数据合成处理,得到行为特征向量ebe。所述行为特征向量ebe不仅包括 了多个历史特征行为会对当前时刻行为预测产生的影响,而且还结合了多个历 史特征行为发生的时间距离当前时刻的时间差会对当前时刻行为预测产生的影 响。
所述序列编码器包括行为特征编码器和循环神经网络模型280。所述行为特 征编码器用于对多个历史特征行为以及所述每个历史特征行为的发生时间距离 当前时刻的时间差进行编码,以得到固定维度的向量。循环神经网络模型280 用于捕捉序列信息。图5示出了根据本说明书实施例提供的实现步骤S510的流 程图。在一些实施中,为了实现步骤S510,即将所述多个历史特征行为以及所 述每个历史特征行为的发生时间距离当前时刻的时间差输入所述序列编码器, 生成所述目标终端130的行为特征向量ebe,服务器200被用于执行图5示出的 步骤,包括:
S511:将所述多个历史特征行为以及所述每个历史特征行为的发生时间距 离当前时刻的时间差输入所述行为特征编码器,生成多个向量组a;
S513:将所述多个向量组a按照所述历史特征行为发生的顺序输入循环神经 网络模型280中,得到所述行为特征向量ebe
在步骤S511中,所述每个向量组at包括两个向量,分别是行为向量bt和时 间差向量dt。其中,所述行为向量bt和所述时间差向量dt相对应。如前所述,所 述多个历史特征行为按照发生时间的先后顺序进行排列形成历史特征行为轨迹。 发生时间在前的历史特征行为排在发生时间在后的历史特征行为之前。下角标t 代表历史特征行为轨迹中第t个历史特征行为。假设服务器200获取的所有历史 特征行为的数量为n,则最后一个历史特征行为所对应的行为向量为bn,与bn对 应的时间差向量为dn
行为向量bt为对所述多个历史特征行为中的第t个历史特征行为进行编码生 成的向量。生成行为向量bt的编码过程为:
首先,对第t个历史特征行为对应的RPC ID或URL ID进行one-hot编码, 生成向量brpc,t。所述one-hot编码可以将每个RPC ID或URL ID转换为一个只 有1位元素为1,其余元素为0的二进制向量。不同的RPC ID或URL ID对应 的二进制向量不同。
然后,对向量brpc,t进行embedding编码,生成行为向量bt,可由公式(1) 表示:
bt=Wrpcbrpc,t (1)
embedding编码可以将一个高维度的向量转化为低维度的向量。通过embedding编码可将向量brpc,t转化为固定维度的向量bt。其中,Wrpc为历史特征 行为权重矩阵。Wrpc是基于以往用户的历史特征行为轨迹和以往用户要提问的 问题通过机器学习训练得到的。举例来说,在问题识别场景下,以往的用户在 所述目标应用上进入智能客服系统页面之前的历史特征行为轨迹形成以往用户 的历史特征行为轨迹数据库,以往的用户在所述目标应用上进入智能客服系统 页面后所提问的问题形成一个以往用户的问题数据库,其中,每个问题对应一 个历史特征行为轨迹。基于所述问题数据库与所述历史特征行为轨迹数据库的 对应关系,通过机器学习训练得到矩阵Wrpc,矩阵Wrpc间接反映了历史行为特 征与可能提问的问题之间的关联关系。举例来说,用户110在目标终端130上 的历史特征行为信息如表3所示:
访问时间 访问页面 RPC ID
2019.12.10 12:00:00 运动衣 RPC1
2019.12.10 12:20:00 运动裤 RPC2
2019.12.10 12:40:00 棒球帽 RPC3
2019.12.10 13:00:00 蚂蚁森林 RPC4
2019.12.10 13:30:00 运动鞋 RPC5
…… …… ……
用户110在2019年12月10日13:00:00访问“蚂蚁森林”页面,在此之前 和之后,用户110浏览的页面主要与“运动产品”相关,“蚂蚁森林”和“运动 产品”之间的关联度较低,因此,用户110在2019年12月10日13:00:00 访问“蚂蚁森林”页面的历史特征行为与当前时刻可能要提问的问题的关联度较 其他行为可能更低。
时间差向量dt为对与所述第t个历史特征行为相对应的时间差进行编码生 成的向量。生成时间差向量dt的编码过程为:
首先,对第t个历史特征行为对应的时间差Δdt(单位:秒)进行one-hot 编码,生成向量xΔ,t
然后,对向量xΔ,t进行embedding编码,生成时间差向量dt,可由公式(2) 表示:
dt=WΔxΔ,t (2)
其中,矩阵WΔ为对所述时间差进行所述编码中使用的权重矩阵,所述权重 矩阵WΔ同所述时间差Δdt的长度负相关。所述时间差Δdt的长度越长,所对应的 权重矩阵WΔ中对应的元素值越小。WΔ是基于以往用户的历史特征行为发生的时 间距离当前时刻的时间差和以往用户要提问的问题通过机器学习训练得到的。 WΔ间接反映了所述历史特征行为发生时间距离当前时刻的时间差与可能要提问 的问题之间的关联关系。举例来说,一个历史特征行为发生的时间距离当前想 要提问问题的时刻越久,这个历史特征行为对当前时刻遇到的问题所产生的影 响可能越小。
图6示出了根据本说明书实施例提供的一种循环神经网络模型280的示意 图。在本说明书的实施中,循环神经网络模型是基于门控循环单元GRU完成的。 在步骤S513中,循环神经网络模型280可以包括嵌入层281和门控循环单元 GRU层283。
嵌入层281用于融合相对应的所述行为向量bt和所述时间差向量dt。嵌入层 281用于将历史特征行为以及历史特征行为对应的时间差对当前时刻行为推测 的影响结合起来。门控循环单元(Gated Recurrent Units)GRU层283同嵌入层281串联。GRU网络特别适合通过深度学习处理基于时域的数据集。GRU网络 是循环神经网络(RNN:Recurrent NeuralNetwork)的一种变体,即在传统循环神 经网络RNN上,增加门的机制来追踪时间序列中时间步隐藏状态向量的变化。 GRU使用了更新门(update gate)与重置门(reset gate)。基本上,这两个门控向量 决定了哪些信息最终能作为门控循环单元的输出。这两个门控机制的特殊之处 在于,它们能够保存长期序列中的信息,且不会随时间而清除或因为与预测不相关而移除。
如图6所示,循环神经网络模型280在每次循环中依次将对应的行为向量bt和时间差向量dt以及上一次循环的输出ht-1输入嵌入层281。将嵌入层281的输 出ot和上一次循环的输出ht-1输入到门控循环单元GRU层283,得到输出ht。 为了便于理解,下面将结合具体的公式对循环神经网络模型280进行进一步说 明。具体地,嵌入层281在t时刻的计算公式如下:
tt=σ(Wt[ht-1,bt,dt]) (3)
ot=tt*bt (4)
根据第t-1时刻的隐状态向量ht-1、结合t时刻行为向量bt以及时间差向量dt来得到t时刻的时间门向量tt。其中,Wr为时间门参数矩阵,是基于以往用户的 历史特征行为以及要提问的问题通过机器学习训练得到的。σ为sigmoid激活函 数(函数值在0-1之间)。ot为嵌入层281的输出。*为对多维度变量进行逐元素 相乘(点乘)的运算符。点乘运算决定行为向量bt中多少信息可以通过传送。当tt中 的部分元素输入为0或接近0时,表示行为向量bt中相对应的内容不传送;当tt中 的部分元素输入为1或接近1时,表示行为向量bt中相对应的内容全部传送,而 当tt中的部分元素输入在0和1之间时,表示行为向量bt中相对应的内容部分传 送。嵌入层281的主要作用是让循环神经网络模型280对历史特征行为以及对 应的时间差进行过滤,自动学习决定输入的哪些内容是对行为预测有用的从而 需要保留,哪些内容是对行为预测没用的,是不需要保留的。
具体地,GRU层283计算t时刻的隐状态向量ht的计算公式如下:
rt=σ(Wr·[ht-1,ot]) (5)
zt=σ(Wz·[ht-1,ot]) (6)
Figure BDA0002392040550000241
Figure BDA0002392040550000242
其中,ht为t时刻的隐状态向量,rt为重置门的输出向量,Wr为重置门参数 矩阵。重置门rt是决定上一时刻t-1时刻的隐状态向量ht-1有多少信息是需要被 遗忘的。当rt中的部分元素输入为0或接近0时,则rt*ht-1代表隐状态向量ht-1中与之相对应的部分被遗忘。当rt中的部分元素输入为1或接近1时,则rt*ht-1代表隐状态向量ht-1中与之相对应的部分被保留。
zt为更新门的输出向量,Wz为更新门参数矩阵。更新门zt时决定上衣时刻t-1 时刻的隐状态向量ht-1中有多少信息是要传递到t时刻的隐状态向量ht中的。当 zt中的部分元素输入为0或接近0时,则1-zt中与之对应的部分元素为1或接 近1,则(1-zt)*ht-1代表隐状态向量ht-1中与之相对应的部分被保留在t时刻 的隐状态向量ht中。当zt中的部分元素输入为1或接近1时,则1-zt中与之对 应的部分元素为0或接近0,则(1-zt)*ht-1代表隐状态向量ht-1中与之相对应 的部分被遗忘。
Figure BDA0002392040550000243
为t时刻的候选隐藏状态向量,
Figure BDA0002392040550000244
为候选参数矩阵。
Figure BDA0002392040550000245
结合t-1时刻的隐 状态向量ht-1中遗留下来的信息(即rt*ht-1)和t时刻新输入的信息ot
Figure BDA0002392040550000246
结 合更新门zt和候选隐藏状态向量
Figure BDA0002392040550000251
从而决定哪些信息会成为候选项被记录在t 时刻的隐状态向量ht中。
其中,Wr、Wz
Figure BDA0002392040550000252
可以基于以往用户的历史特征行为以及要提问的问题通 过机器学习训练得到。
可以看出,循环神经网络模型280是一个递归的定义,时刻t下的隐状态向 量ht的计算涉及到了时刻t-1下的隐状态向量ht-1,因此能够用于捕捉序列信息。
在步骤S513中,所述将所述多个向量组按照所述历史特征行为发生的顺序 输入循环神经网络模型中,得到所述行为特征向量包括:将所述多个相对应的 行为向量bt和时间差向量dt按照所述历史特征行为发生的顺序输入到循环神经 网络模型280中,通过循环神经网络模型280进行计算,得到最后一个输入的 行为向量bn和时间差向量dn对应的输出向量hn为所述行为特征向量ebe。图7示 出了根据本说明书实施例提供的一种循环神经网络模型280的链结构图。图7 示出了步骤S513的工作流程。
如前所述,循环神经网络模型280能够用于捕捉序列信息。时刻t下的隐状 态向量ht的计算涉及到了时刻t-1下的隐状态向量ht-1。即上一时刻发生的历史 特征行为会对下一时刻的历史特征行为产生一定的影响。因此,在基于循环神 经网络模型280进行计算时,所述多个历史特征行为在输入循环神经网络模型 280时需要按照发生的先后顺序进行输入,以充分展多个历史特征行为发生的时 序信息对预测结果产生的影响。取最后一时刻的隐状态向量hn为行为特征向量 ebe。具体工作流程如图7所示。其中,h0取0。
通过循环神经网络模型280控制不同时刻的信息输入,可以避免固定截取 某一段时间的历史特征行为造成的信息损失,并且可以降低可能与当前需求无 关的冗余噪声信息。
在实际应用场景中,例如在问题识别场景中,不同的历史特征行为以及同 一种历史特征行为发生的时间不同对当前时刻可能遇到的问题产生的影响程度 都是不同的。且历史特征行为发生的先后顺序不同对当前时刻可能遇到的问题 产生的影响程度也是不同的。在循环神经网络模型280的每一次循环中,基于 嵌入层281和GRU层283的重置和更新机制,以保证循环神经网络模型280能 够捕捉对当前时刻可能遇到的问题影响程度较高的信息。
本领域技术人员应当理解,本说明书实施例中的门控循环单元GRU层283 也可以由其他循环神经网络代替完成预测,例如RNN网络或者LSTM网络(长 短期记忆模型Long-short Term Memory)。
在步骤S530中,所述多个属性数据对应多个PRO ID。所述属性特征向量efa结合了多个属性特征数据对当前时刻行为预测产生的影响。
图8示出了根据本说明书实施例提供的实现步骤S530的流程图。在一些实 施例中,为了实现步骤S530,即将所述多个属性特征数据输入属性特征编码器, 生成所述目标终端130的属性特征向量efa,服务器200被用于执行图8示出的 步骤,包括:
S531:对所述多个属性特征数据进行编码,得到多个属性特征数据向量efa,i
S533:对所述多个属性特征数据向量efa,i进行求和取平均值得到所述属性特 征向量efa
在步骤S531中,生成属性特征数据向量efa,i的编码过程为:
首先,对多个属性特征数据进行one-hot编码,生成向量xfa,i,其中,下角 标i代表第i个属性数据特征(i为正整数)。
然后,对向量xfa,i进行embedding编码,生成时间差向量属性特征数据向量 efa,i,可由公式(9)表示:
efa,i=Wfaxfa,i (9)
其中,矩阵Wfa为对所述属性特征数据进行编码中使用的属性权重矩阵。所 述属性权重矩阵Wfa是基于以往用户的属性特征数据和以往用户要提问的问题 通过机器学习训练得到的。WΔ间接反映了所述属性特征数据与可能要提问的问 题之间的关联关系。
在步骤S533中,所述属性特征向量efa等于多个属性特征数据向量efa,i进行 逐点求和取平均值得到,efa可由以下公式表示:
Figure BDA0002392040550000271
在步骤S550中,为了得到最终的特征向量A,需要将行为特征向量ebe和属 性特征向量efa进行数据合成处理,以将行为特征数据和属性特征数据进行结合。 行为特征数据和属性特征数据对预测目标终端130的行为的影响并不是完全独 立的,而是存在一定的依赖关系或关联关系。比如,用户属性特征数据中如果 包括了有吸烟习惯这个数据,则会导致在行为特征数据中出现买烟这个行为。 因此,需将行为特征数据和属性特征数据进行组合计算,拟合出特征向量A,使 特征向量A中的元素既包含行为特征信息又包含属性特征信息的,更全面地考虑 行为特征和属性特征之间的关联关系,得到更有利于刻画行为特点的特征向量A, 以便更精准地向目标终端130进行信息推送。
图9示出了根据本说明书实施例提供的实现步骤S550的流程图。在一些实 施例中,为了实现步骤S550,即基于所述行为特征向量ebe和所述属性特征向量 efa,生成所述目标终端130的特征向量A,服务器200将行为特征向量ebe和属 性特征向量efa进行交叉相乘和有限阶数的线性组合运算来表征行为特征向量 ebe和属性特征向量efa之间的关联关系。具体地,步骤S550包括:
S551:将所述行为特征向量ebe和所述属性特征向量efa进行拼接后得到基础 特征向量e0。步骤S551可表示为公式(11):
Figure BDA0002392040550000281
具体地,例如行为特征向量ebe为n维的向量,属性特征向量efa为m维的 向量,则拼接后得到的基础特征向量e0为n+m维的向量。
S553:对所述基础特征向量e0进行有限阶数的线性组合,生成特征向量A。
表达上,特征向量A是对用户110通过目标终端130的行为轨迹的数学表达, 是因变量;基础特征向量e0是当前时刻用户110通过目标终端130的行为的数学 度量,是自变量。类似于使用多项式的表达方式f=a1x+a2x2+a3x3+…+b 可以用有限阶数的线性组合来表达一个非线性的函数f,所述基于所述基础特征 向量e0对特征向量A进行有限阶数的线性组合运算可以表述为:
Figure BDA0002392040550000282
其中,A0=e0,bl为常量,l≥0。以l+1=2为例进行说明,即进行三阶 线性组合运算,
Figure BDA0002392040550000283
Figure BDA0002392040550000284
Figure BDA0002392040550000285
Figure BDA0002392040550000291
其中,Wl为特征向量计算权重矩阵。bl为偏置参数。Wl和bl都可以基于历 史数据通过机器学习训练得到。
Figure BDA0002392040550000292
可以看作是所述行为特征向量ebe与所述属性特征向量efa的 一阶组合运算,类似于上述多项式中的a1x项。从表达式(15)来看,A0将所述 行为特征向量ebe与所述属性特征向量efa独立地进行了描述。
Figure BDA0002392040550000293
是所述行为特征向量ebe与所述属性特征向量efa的二阶组合运算, 类似于上述多项式中的a2x2项。从表达式(15)来看,
Figure BDA0002392040550000294
包括了所述行 为特征向量ebe与所述属性特征向量efa交叉相乘之后的加权组合,表达了所述行 为特征向量ebe与所述属性特征向量efa之间的直接交互关系。比如用户110的属 性特征在多大程度上直接影响了用户110的行为特征。举例来说,用户110近 视这个属性特征可能直接导致了用户110网上购买了某款眼镜的行为。
Figure BDA0002392040550000295
是所述行为特征向量ebe与所述属性特征向量efa的三阶组 合运算,类似于上述多项式中的a3x3项。从表达式(15)来看,
Figure BDA0002392040550000296
包 括了所述行为特征向量ebe与所述属性特征向量efa更高一阶交叉之后的加权组 合,表达了所述行为特征向量ebe与所述属性特征向量efa之间比直接交互更深一 层的交互关系。比如用户110的属性特征同用户110的行为特征之间是如何间 接相互影响的。举例来说,因为用户110近视这个属性特征,直接导致了用户 110网上购买了某款眼镜,进而影响了用户110在着装上选择了某个风格。
表达式(12)是一个迭代表达式。从表达式(13)-(15)的迭代来看,每 进行一次迭代,都将行为特征向量ebe和属性特征向量efa中的元素与上一次迭代 构造出的组合运算结果进行交叉相乘,从而构造出高一阶的组合运算结果。通 过多次迭代,可以使行为特征向量ebe和属性特征向量efa中的元素进行多次交叉 相乘。将多次交叉相乘的结果求和,从而拟合出行为特征向量ebe和属性特征向 量efa的关联关系,构造出能更准确地刻画目标终端130的行为的有限阶数线性 组合特征向量Al+1,从而更精准地向目标终端130推送信息。其中,有限阶数的 线性组合运算表达式(12)的阶数可以基于历史数据通过机器学习得到。
通过行为特征向量ebe和属性特征向量efa的交叉相乘和有限阶数的线性组 合运算,可以构建行为特征向量ebe与属性特征向量efa的有限高阶组合,同时可 以通过元素参数共享减少模型中Wl和bl的参数,实现高效的特征组合计算。
在生成所述特征向量A之后,服务器200便可以基于所述特征向量A,在接 收到目标终端130的下一个特征行为之前向目标终端130推送目标信息了。
如前所述,所述特征向量A与服务器200要推送的信息相关联。具体地,在 步骤S600中,服务器200在用户110在目标终端130的目标应用中进行下一个 特征行为操作之前,就向目标终端130推送可能相关的信息,以提升用户的使 用体验。例如,当目标终端130的当前需求是提问问题时,服务器200在用户 110进入目标应用的智能客服页面或进入拨打智能客服电话页面之后,开始执行 S400、S500、S600的指令,服务器200要在用户110向目标终端130的目标应 用上输入要提问的问题之前,向目标终端130输出一个推荐的问题列表。所述 推荐的问题列表就是基于所述特征向量A计算生成的所述目标信息。
具体地,在步骤S600中,将所述特征向量A输入到预测模型中,得到针对 所述目标终端130当前需求的预测结果。所述预测模型可以是基于以往的历史 特征数据与所述特征数据对应的信息标签通过训练得到的。所述以往的历史特 征数据是基于大量用户在历史时刻在所述目标应用中的行为特征数据和属性特 征数据得到的。将所述特征向量A输入到所述预测模型中,可以得到针对目标终 端130当前需求的预测结果。所述预测结果为一个向量,即预测结果向量,所 述预测结果向量可以映射到信息数据库中。所述信息数据库中储存有服务器200 可能推送的所有信息。所述预测结果向量中的每个元素代表与之对应的信息与 当前需求相关的概率。举例来说,在问题识别场景下,所述信息数据库中储存 的是所有的问题。所述预测结果向量中的每个元素都对应所述信息数据库中的 一个问题,且每个元素代表与之对应的问题与目标终端130的当前需求相关的 概率。所述信息数据库可以储存在数据库150中,也可以储存在服务器200中。
在步骤S800中,服务器200基于所述预测结果向目标终端130推送目标信 息是指,根据所述预测结果向量,从所述信息数据库中提取概率最高的有限数 量的信息作为所述目标信息向目标终端130推送。举例来说,在问题识别场景 下,服务器200从所述信息数据库中提取出概率最高的10个问题形成问题推荐 列表向目标终端130推送。至此,针对目标终端130的当前需求推送信息的过 程已全部完成。
综上所述,本说明书提供的推送信息的方法和服务器200,提出了一种将带 有时间信息和顺序信息的用户行为特征与用户属性特征相组合,从而向用户推 送信息的方式。所述方法提出了可以兼顾历史特征行为轨迹中的顺序信息以及 时间信息的序列编码方式。服务器200通过所述序列编码方式将历史特征行为 轨迹编码为行为特征向量ebe,再令其与属性特征向量efa进行交叉相乘和有限阶 数的线性组合(公式12)构造出带有时序信息的高阶组合特征向量A。根据所述 特征向量A向用户推送与当前需求相关的信息。
本说明书另外提供一种非暂时性存储介质,存储有至少一组用来推送信息 的可执行指令,当所述可执行指令被处理器执行时,所述可执行指令指导所述 处理器实施本说明书提供的推送信息的方法的步骤。在一些可能的实施方式中, 本说明书的各个方面还可以实现为一种程序产品的形式,其包括程序代码。当 所述程序产品在目标终端130上运行时,所述程序代码用于使目标终端130执 行本说明书描述的推送信息的步骤。用于实现上述方法的程序产品可以采用便 携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在目标终端130,例 如个人电脑上运行。然而,本说明书的程序产品不限于此,在本说明书中,可 读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系 统(例如处理器220)使用或者与其结合使用。所述程序产品可以采用一个或多 个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可 读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、 装置或器件,或者任意以上的组合。可读存储介质的更具体的例子包括:具有 一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存 储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘 只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。 所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信 号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括 但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是 可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于 由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质 上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光 缆、RF等等,或者上述的任意合适的组合。可以以一种或多种程序设计语言的 任意组合来编写用于执行本说明书操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言 —诸如“C”语言或类似的程序设计语言。程序代码可以完全地在目标终端130 上执行、部分地在目标终端130上执行、作为一个独立的软件包执行、部分在 目标终端130上部分在远程计算设备上执行、或者完全在远程计算设备或服务 器(服务器200)上执行。在涉及远程计算设备的情形中,远程计算设备可以通 过网络120连接到目标终端130,或者,可以连接到外部计算设备。
上述对本说明书特定实施例进行了描述。其他实施例在所附权利要求书的 范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实 施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过 程不一定要求示出特定顺序或者连续顺序才能实现期望的结果。在某些实施方 式中,多任务处理和并行处理也是可以的或者是可能有利的。
综上所述,在阅读本详细公开内容之后,本领域技术人员可以明白,前述 详细公开内容可以仅以示例的方式呈现,并且可以不是限制性的。尽管这里没 有明确说明,本领域技术人员可以理解本说明书需求囊括对实施例的各种合理 改变,改进和修改。这些改变,改进和修改旨在由本说明书提出,并且在本说 明书的示例性实施例的精神和范围内。
此外,本说明书中的某些术语已被用于描述本说明书的实施例。例如,“一 个实施例”,“实施例”和/或“一些实施例”意味着结合该实施例描述的特定特征, 结构或特性可以包括在本说明书的至少一个实施例中。因此,可以强调并且应 当理解,在本说明书的各个部分中对“实施例”或“一个实施例”或“替代实施例” 的两个或更多个引用不一定都指代相同的实施例。此外,特定特征,结构或特 性可以在本说明书的一个或多个实施例中适当地组合。
应当理解,在本说明书的实施例的前述描述中,为了帮助理解一个特征, 出于简化本说明书的目的,本说明书将各种特征组合在单个实施例、附图或其 描述中。然而,这并不是说这些特征的组合是必须的,本领域技术人员在阅读 本说明书的时候完全有可能将其中一部分特征提取出来作为单独的实施例来理 解。也就是说,本说明书中的实施例也可以理解为多个次级实施例的整合。而 每个次级实施例的内容在于少于单个前述公开实施例的所有特征的时候也是成 立的。
本说明书引用的每个专利,专利申请,专利申请的出版物和其他材料,例 如文章,书籍,说明书,出版物,文件,物品等,可以通过引用结合于此。用 于所有目的的全部内容,除了与其相关的任何起诉文件历史,可能与本说明书 不一致或相冲突的任何相同的,或者任何可能对权利要求的最宽范围具有限制 性影响的任何相同的起诉文件历史。现在或以后与本说明书相关联。举例来说, 如果在与任何所包含的材料相关联的术语的描述、定义和/或使用与本说明书相 关的术语、描述、定义和/或之间存在任何不一致或冲突时,使用本说明书中的 术语为准。
最后,应理解,本说明书公开的申请的实施方案是对本说明书的实施方案 的原理的说明。其他修改后的实施例也在本说明书的范围内。因此,本说明书 披露的实施例仅仅作为示例而非限制。本领域技术人员可以根据本说明书中的 实施例采取替代配置来实现本说明书中的申请。因此,本说明书的实施例不限 于申请中被精确地描述过的实施例。

Claims (11)

1.一种推送信息的方法,包括:
服务器接收目标终端的目标行为,所述目标行为与所述目标终端使用用户的当前需求相关;
所述服务器获取所述目标终端的特征数据,所述特征数据包括所述目标终端在预设时间窗口中的多个历史特征行为以及所述多个历史特征行为中的每个历史特征行为的发生时间;
所述服务器针对所述目标终端的当前需求,基于所述多个历史特征行为以及所述每个历史特征行为的发生时间距离当前时刻的时间差,生成所述目标终端的特征向量;
所述服务器将所述特征向量输入到预测模型中,得到针对所述目标终端当前需求的预测结果;以及
所述服务器基于所述预测结果向所述目标终端推送目标信息。
2.如权利要求1所述的推送信息的方法,其中,所述特征数据还包括所述目标终端的多个属性特征数据,
所述多个属性特征数据包括所述目标终端的多个身份特征数据和多个状态特征数据。
3.如权利要求2所述的推送信息的方法,其中,所述基于所述多个历史特征行为以及所述每个历史特征行为的发生时间距离当前时刻的时间差,生成所述目标终端的特征向量包括:
将所述多个历史特征行为以及所述每个历史特征行为的发生时间距离当前时刻的时间差输入序列编码器,生成所述目标终端的行为特征向量;
将所述多个属性特征数据输入属性特征编码器,生成所述目标终端的属性特征向量;
基于所述行为特征向量和所述属性特征向量,生成所述目标终端的特征向量。
4.如权利要求3所述的推送信息的方法,其中,所述序列编码器包括行为特征编码器和循环神经网络模型,所述将所述多个历史特征行为以及所述每个历史特征行为的发生时间距离当前时刻的时间差输入所述序列编码器,生成所述目标终端的行为特征向量包括:
将所述多个历史特征行为以及所述每个历史特征行为发生的时间距离当前时刻的时间差输入所述行为特征编码器,生成多个向量组,所述每个向量组包括:
对所述多个历史特征行为中的一个历史特征行为进行编码生成的行为向量;和
对与所述历史特征行为相对应的时间差进行编码生成的时间差向量,
其中,所述行为向量和所述时间差向量相对应;
将所述多个向量组按照所述历史特征行为发生的顺序输入所述循环神经网络模型中,得到所述行为特征向量。
5.如权利要求4所述的推送信息的方法,其中,所述循环神经网络模型包括:
嵌入层,用于融合相对应的所述行为向量和所述时间差向量;和
门控循环单元GRU层,同所述嵌入层串联。
6.如权利要求5所述的推送信息的方法,其中,所述将所述多个向量组按照所述历史特征行为发生的顺序输入所述循环神经网络模型中,得到所述行为特征向量包括:
将所述多个相对应的行为向量和时间差向量按照所述历史特征行为发生的顺序输入到所述循环神经网络模型中,通过所述循环神经网络模型得到最后一个输入的行为向量和时间差向量对应的输出向量为所述行为特征向量,
其中,在每次循环中依次将对应的行为向量和时间差向量以及上一次循环的输出输入所述嵌入层,将所述嵌入层的输出和上一次循环的输出输入到所述门控循环单元GRU层。
7.如权利要求3所述的推送信息的方法,其中,所述将所述多个属性特征数据输入属性特征编码器,生成所述目标终端的属性特征向量包括:
对所述多个属性特征数据进行编码,得到多个属性特征数据向量;
对所述多个属性特征数据向量进行求和取平均值得到所述属性特征向量。
8.如权利要求3所述的推送信息的方法,其中,所述基于所述行为特征向量和所述属性特征向量,生成所述目标终端的特征向量包括:
将所述行为特征向量和所述属性特征向量进行拼接得到基础特征向量;
对所述基础特征向量进行有限阶数的线性组合,生成所述目标终端的所述特征向量。
9.如权利要求1所述的推送信息的方法,其中,所述预测模型是基于以往的特征数据与所述特征数据对应的标签训练得到的。
10.一种推送信息的系统,包括:
至少一个存储器,所述至少一个存储器包括至少一组指令来推送信息;
至少一个处理器,同所述至少一个存储器进行通讯,
其中,当所述至少一个处理器执行所述至少一组指令时,实施权利要求1-9中任一项所述的推送信息的方法。
11.一种非暂时性存储介质,存储有至少一组用来推送信息的可执行指令,当所述可执行指令被处理器执行时,所述可执行指令指导所述处理器实施权利要求1-9中任一项所述的推送信息的方法。
CN202010117833.1A 2020-02-25 2020-02-25 推送信息的方法、系统和非暂时性存储介质 Active CN111274501B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010117833.1A CN111274501B (zh) 2020-02-25 2020-02-25 推送信息的方法、系统和非暂时性存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010117833.1A CN111274501B (zh) 2020-02-25 2020-02-25 推送信息的方法、系统和非暂时性存储介质

Publications (2)

Publication Number Publication Date
CN111274501A true CN111274501A (zh) 2020-06-12
CN111274501B CN111274501B (zh) 2023-04-18

Family

ID=71000382

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010117833.1A Active CN111274501B (zh) 2020-02-25 2020-02-25 推送信息的方法、系统和非暂时性存储介质

Country Status (1)

Country Link
CN (1) CN111274501B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111753206A (zh) * 2020-06-29 2020-10-09 支付宝(杭州)信息技术有限公司 信息推送的方法和系统
CN111930524A (zh) * 2020-10-10 2020-11-13 上海兴容信息技术有限公司 一种计算资源分配的方法和系统
CN112883257A (zh) * 2021-01-11 2021-06-01 北京达佳互联信息技术有限公司 行为序列数据处理方法、装置、电子设备及存储介质
CN113128597A (zh) * 2021-04-21 2021-07-16 浙江大学 一种用户行为特征的提取和分类预测的方法及装置
CN113722605A (zh) * 2021-11-03 2021-11-30 北京奇岱松科技有限公司 实时兴趣信息的计算方法及系统
CN115757900A (zh) * 2022-12-20 2023-03-07 邢台达喆网络科技有限公司 应用人工智能模型的用户需求分析方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6430539B1 (en) * 1999-05-06 2002-08-06 Hnc Software Predictive modeling of consumer financial behavior
CN109345260A (zh) * 2018-10-09 2019-02-15 北京芯盾时代科技有限公司 一种欺诈检测模型训练方法和装置及欺诈检测方法和装置
CN110827138A (zh) * 2019-10-31 2020-02-21 北京芯盾时代科技有限公司 一种推送信息确定方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6430539B1 (en) * 1999-05-06 2002-08-06 Hnc Software Predictive modeling of consumer financial behavior
US6839682B1 (en) * 1999-05-06 2005-01-04 Fair Isaac Corporation Predictive modeling of consumer financial behavior using supervised segmentation and nearest-neighbor matching
CN109345260A (zh) * 2018-10-09 2019-02-15 北京芯盾时代科技有限公司 一种欺诈检测模型训练方法和装置及欺诈检测方法和装置
CN110827138A (zh) * 2019-10-31 2020-02-21 北京芯盾时代科技有限公司 一种推送信息确定方法及装置

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111753206A (zh) * 2020-06-29 2020-10-09 支付宝(杭州)信息技术有限公司 信息推送的方法和系统
CN111930524A (zh) * 2020-10-10 2020-11-13 上海兴容信息技术有限公司 一种计算资源分配的方法和系统
CN111930524B (zh) * 2020-10-10 2021-02-12 上海兴容信息技术有限公司 一种计算资源分配的方法和系统
CN112883257A (zh) * 2021-01-11 2021-06-01 北京达佳互联信息技术有限公司 行为序列数据处理方法、装置、电子设备及存储介质
WO2022148186A1 (zh) * 2021-01-11 2022-07-14 北京达佳互联信息技术有限公司 行为序列数据处理方法及装置
CN112883257B (zh) * 2021-01-11 2024-01-05 北京达佳互联信息技术有限公司 行为序列数据处理方法、装置、电子设备及存储介质
CN113128597A (zh) * 2021-04-21 2021-07-16 浙江大学 一种用户行为特征的提取和分类预测的方法及装置
CN113722605A (zh) * 2021-11-03 2021-11-30 北京奇岱松科技有限公司 实时兴趣信息的计算方法及系统
CN115757900A (zh) * 2022-12-20 2023-03-07 邢台达喆网络科技有限公司 应用人工智能模型的用户需求分析方法及系统
CN115757900B (zh) * 2022-12-20 2023-08-01 创贸科技(深圳)集团有限公司 应用人工智能模型的用户需求分析方法及系统

Also Published As

Publication number Publication date
CN111274501B (zh) 2023-04-18

Similar Documents

Publication Publication Date Title
CN111274501B (zh) 推送信息的方法、系统和非暂时性存储介质
US11093992B2 (en) Smart matching for real estate transactions
US10558852B2 (en) Predictive analysis of target behaviors utilizing RNN-based user embeddings
CN111784455A (zh) 一种物品推荐方法及推荐设备
CN110008397B (zh) 一种推荐模型训练方法及装置
US20230153857A1 (en) Recommendation model training method, recommendation method, apparatus, and computer-readable medium
WO2018014771A1 (zh) 一种数据对象推送的方法、装置及系统
CN112288042B (zh) 行为预测系统的更新方法及装置、存储介质和计算设备
CN111008335B (zh) 一种信息处理方法、装置、设备及存储介质
CN107368499B (zh) 一种客户标签建模及推荐方法及装置
Ji et al. Jointly modeling content, social network and ratings for explainable and cold-start recommendation
CN112765482A (zh) 产品投放方法、装置、设备及计算机可读介质
CN112380449A (zh) 信息推荐方法、模型训练方法及相关装置
CN111680213B (zh) 信息推荐方法、数据处理方法及装置
CN113836390B (zh) 资源推荐方法、装置、计算机设备及存储介质
CN111475744A (zh) 一种基于集成学习的个性化位置推荐方法
CN115631008B (zh) 商品推荐方法、装置、设备及介质
CN116308640A (zh) 一种推荐方法及相关装置
CN112561554B (zh) 确定待展示的多媒体资源方法、装置、服务器及存储介质
CN116703498B (zh) 商品推荐方法、装置、电子设备及存储介质
CN116821475B (zh) 基于客户数据的视频推荐方法、装置及计算机设备
WO2022262561A1 (zh) 多媒体资源的处理方法、装置、设备及存储介质
CN117745382A (zh) 对象推荐方法和装置
CN116861079A (zh) 一种基于用户长期偏好的排序推荐方法及其相关设备
CN114119078A (zh) 目标资源确定方法、装置、电子设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant