CN110245980A

CN110245980A - 基于神经网络模型确定目标用户激励形式的方法和设备

Info

Publication number: CN110245980A
Application number: CN201910458354.3A
Authority: CN
Inventors: 盛冲冲
Original assignee: Alibaba Group Holding Ltd
Current assignee: Advanced New Technologies Co Ltd; Advantageous New Technologies Co Ltd
Priority date: 2019-05-29
Filing date: 2019-05-29
Publication date: 2019-09-17
Anticipated expiration: 2039-05-29
Also published as: CN110245980B

Abstract

本申请公开了一种基于神经网络模型确定目标用户激励形式的方法和设备，该方法包括：获取目标用户的特征属性、嵌入向量，所述嵌入向量用于表征所述目标用户与其他用户之间的网络关系；将所述特征属性、嵌入向量输入训练好的神经网络模型，以得到针对所述目标用户的激励形式；其中，所述训练好的神经网络模型的训练样本数据包括：用户的特征属性、用户对应的嵌入向量、所述用户的激励形式以及表征所述用户是否核销激励的使用记录。

Description

基于神经网络模型确定目标用户激励形式的方法和设备

技术领域

本申请涉及互联网技术领域，尤其涉及基于神经网络模型确定目标用户激励形式的方法和设备。

背景技术

模拟人类实际神经网络的数学方法问世以来，人们已慢慢习惯了把这种人工神经网络直接称为神经网络。神经网络在系统辨识、模式识别、智能控制等领域有着广泛而吸引人的前景。

现今，互联网运营主要目标有四点：拉新、促活、留存、营收。其中，拉新、促活往往采用通过激励的方式来做，如发红包，给予优惠券等激励方式。而活动一般是需要企业投入预算，所以如何在一定的预算内，得到最好的拉新促活效果，使得整个数据都变得漂亮起来，就是企业所关心的。

在促活拉新的活动中，针对每位用户的激励(如何激励，激励成本)一般是用模型算法来决定。现有的模型算法的具体是通过获取用户的特征属性，根据用户的特征属性来判断激励形式(激励方式和激励成本)。例如，特征属性包括年龄、性别、城市、学历等数据，根据用户的年龄段、用户的性别、用户所处的城市、用户的年龄段所处的区间来确定一个激励的方式和激励成本。

在实际应用过程中，用户与用户之间会存在一个网络关系，网络关系是指邀请关系或分享关系等，如用户a邀请了用户b，则用户b为用户a的邻居，并且用户a与用户b之间存在着邀请关系。

使用上述的预制的模型算法，模型算法中仅考虑用户自身的因素对用户的影响，导致神经网络模型的准确性低。

发明内容

本申请实施例提供一种基于神经网络模型确定目标用户激励形式的方法和设备，以解决神经网络模型的准确性低的问题。

为解决上述技术问题，本申请实施例是这样实现的：

第一方面，提供了一种神经网络模型训练的方法，包括：

获取目标用户的特征属性、嵌入向量，所述嵌入向量用于表征所述目标用户与其他用户之间的网络关系；

将所述特征属性、嵌入向量输入训练好的神经网络模型，以得到针对所述目标用户的激励形式；

其中，所述训练好的神经网络模型的训练样本数据包括：用户的特征属性、用户对应的嵌入向量、所述用户的激励形式以及表征所述用户是否核销激励的使用记录。

第二方面，提供了一种基于神经网络模型确定目标用户激励形式的装置，包括：

数据获取模块，获取目标用户的特征属性、嵌入向量，所述嵌入向量用于表征所述目标用户与其他用户之间的网络关系；

激励形式获取模块，将所述特征属性、嵌入向量输入训练好的神经网络模型，以得到针对所述目标用户的激励形式；

第三方面，提供了一种电子设备，包括：

处理器；以及

被安排成存储计算机可执行指令的存储器，所述可执行指令在被执行时使用所述处理器执行以下操作：

第四方面，提供了一种计算机可读介质，所述计算机可读介质存储一个或多个程序，所述一个或多个程序当被包括多个应用程序的电子设备执行时，使得所述电子设备执行以下操作：

本申请实施例采用的上述至少一个技术方案能够达到以下有益效果：考虑了用户自身特征属性对激励形式的影响的同时，还考虑了表征用户网络关系的嵌入向量对激励形式的影响，提高了神经网络模型的准确性。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1为本申请的一个实施例的基于神经网络模型确定目标用户激励形式的方法的示意性流程图。

图2为根据本申请的一个实施例的基于神经网络模型确定目标用户激励形式的方法的示意图。

图3为本申请的一个实施例的电子设备的结构示意图。

图4为本申请的一个实施例的基于神经网络模型确定目标用户激励形式的装置的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

以下结合附图，详细说明本申请各实施例提供的技术方案。

图1是根据本申请的一个实施例的基于神经网络模型确定目标用户激励形式的方法。图1所述的方法可以由基于神经网络模型确定目标用户激励形式的装置执行。如图1所示，方法包括：

S102、获取目标用户的特征属性、嵌入向量，所述嵌入向量用于表征所述目标用户与其他用户之间的网络关系。

S104、将所述特征属性、嵌入向量输入训练好的神经网络模型，以得到针对所述目标用户的激励形式；

可以理解的是，嵌入向量表征目标用户与其他用户之间的网络关系。获取与目标用户对应的激励形式的过程中，首先获取目标用户的特征属性和嵌入向量，将特征属性和嵌入向量输入到训练好的神经网络模型中，获得与目标用户对应的激励形式。本实施例通过使用预先训练好的神经网络模型，来获取激励形式，在考虑了用户自身特征属性对激励形式的影响的同时，还考虑了表征用户网络关系的嵌入向量对激励形式的影响，提升了神经网络模型的准确性。另外，本实施例的训练神经网络模型的业务逻辑与获取与目标用户对应的激励形式的业务逻辑分开执行，减小处理器的业务处理量。

所述训练好的神经网络模型基于训练样本数据生成，具体来说，首先获取目标用户的训练样本数据和嵌入向量，训练样本数据包括特征属性、激励形式以及使用记录。特征属性为用户的特征，如：性别、年龄、所处城市、学历、所开通的平台服务等。激励形式为平台所使用的激励，如：红包、优惠券等。使用记录为用户是否使用了激励，将用户使用了激励定义为正样本，用户未使用激励定义为负样本。之后利用训练样本数据和嵌入向量来训练神经网络模型。通过特征属性、激励形式、使用记录和嵌入向量之间的对应关系，生成训练好的神经网络模型，训练好的神经网络模型通过特征属性、嵌入向量来确定激励形式。

举例来说，在使用神经网络模型的过程中，采集的目标用户的性别为男性、年龄为23、所处城市为北京、嵌入向量为a1。训练好的神经网络模型根据目标用户的性别、所处的年龄段、所处的城市为北京或其他相似城市、嵌入向量a1的相似向量a2来确定一个激励形式。在判断嵌入向量的相似性的过程中，以三维向量为例，在三维中x，y，z三个坐标代表一个嵌入向量，根据两个嵌入向量之间夹角的大小是否小于预设值来确定两个嵌入向量之间是否相似。

可选地，在一些实施例中，所述嵌入向量基于关系网络生成，所述关系网络基于所述目标用户的关系数据构建，其中，所述关系网络中的节点用于表征所述目标用户，所述关系网络中的边用于表征所述目标用户与其他用户之间的网络关系。

具体来说，首先获取目标用户的关系数据，之后根据关系数据构建关系网络，关系网络包括节点和边，边用来连接节点，一个节点可以对应多条边，从而用关系网络表征了用户之间的网络关系。需要说明的是，获取关系数据、构建关系网络、生成嵌入向量的过程与获取目标用户的激励形式的过程分开执行，获取关系数据、构建关系网络、生成嵌入向量的过程与训练神经网络模型的过程是分开执行的，生成嵌入向量和训练神经网络模型的过程分开执行，降低处理器处理的业务逻辑产生混乱的概率。

可选地，获取关系数据、构建关系网络、生成嵌入向量的过程是离线式周期性的执行。举例来说，以一天为一个周期，在服务器数据处理压力小的时间段内执行生成嵌入向量的过程，生成离线式的嵌入向量。训练神经网络模型的过程可以是离线的，在训练神经网络模型的过程中，获取离线生成的嵌入向量，将嵌入向量作为一个普通向量来训练，降低了服务器业务处理的压力。

可选地，在一些实施例中，所述嵌入向量包括所述关系网络中与所述目标用户对应的节点的特征、与所述目标用户连接的边的特征、与所述目标用户对应的节点相连的节点的特征。

具体来说，在构建关系网络后，生成整合特征，整合特征包括目标用户本身的特征、与目标用户连接的边的特征、目标用户的邻居的特征，之后再将整合特征简化后生成嵌入向量并存储。

本实施例中，将用户自身的特征、用户的邻居的特征、用户与用户的邻居的特征组合在一起，考虑了用户与用户的邻居对用户的综合影响，提升了神经网络模型的准确性。

举例来说，用户自身的特征可以包括用户邀请了几个人、使用平台的频率等；与用户连接的边的特征为邀请关系或分享关系等，如当用户a邀请用户b使用平台，则a与b之间存在邀请关系，当用户c将优惠券分享给了d，则c和d之间存在分享关系；用户的邻居为与用户通过一条边连接的用户，邻居的特征可以包括邻居邀请了几个人、使用平台的频率等。将用户自身的特征、与用户连接的边的特征以及用户的邻居的特征组合之后形成整合特征，之后将整合特征简化后，形成了嵌入向量并存储。

以三维空间内的向量为例，一个整合特征中可能包括用户m自身的特征如邀请其他用户成功的概率、与代表用户m的节点具有网络关系的边的数量以及用户m的邻居的邀请用户成功率等信息。在形成嵌入向量后，用三维的嵌入向量(m1，m2，m3)来代表整合特征中包含的所有特征，从而简化整合特征，降低业务逻辑处理的数据大小。在神经网络模型上线后，神经网络模型在判断给予用户n的激励形式的过程中，首先获取离线计算并存储的嵌入向量(n1，n2，n3)，之后查询(n1，n2，n3)的相似向量来确定用户的相似性，并根据特征向量与嵌入向量两者与激励形式的对应关系来确定激励形式。

可选地，在确定用户n的相似用户过程中，可以根据(n1，n2，n3)和样本数据中用户的嵌入向量的夹角的差值是否小于预设值来确定用户n的相似用户。

可选地，在一些实施例中，所述训练样本数据包括训练神经网络模型的训练数据和测试神经网络模型的测试数据。

可以理解的是，训练神经网络模型的过程中，首先按照预设比例，将训练样本数据进行分组，一组为训练数据，另一组为测试数据，通过训练数据来训练神经网络模型，在神经网络模型训练之后，通过测试数据来确定神经网络模型的准确性并输出。预设比例为预先设置的数据，根据需求由工作人员定义。训练数据与测试数据从训练样本数据中随机筛选产生。举例来说，在获取的样本数据为一周七天的数据时，训练数据和测试数据的比例可以采取5/1、6/1、10/1等比例。

需要说明的是，确定神经网络模型的准确性后，输出神经网络模型的准确性的输出数据可以是准确概率。如利用神经网络模型确定与用户对应的激励形式准确率为80％，之后工作人员根据准确率进行下一步操作。如在准确率未达到标准准确率的情况下，可以对特征属性进行增加或对特征属性进一步限定；如原来的特征属性包括性别、年龄、所在城市，在准确率低的情况下，在特征属性中增加学历或对年龄所处的年龄段进行细分，进一步的提升神经网络模型的准确性。

可选地，在一些实施例中，所述特征属性包括所述目标用户的基础属性和所述目标用户的行为属性中的至少一种。

可以理解的是，目标用户的基础属性为目标用户的个人基本信息，如年龄、性别、民族等信息，目标用户的行为属性为目标用户的个人行为记录，如用户的活跃度、消费频次、已开通的平台服务等。

下面将结合图2详细介绍本申请一个具体实施例的基于神经网络模型确定目标用户激励形式的方法。图2所示的方法可以由基于神经网络模型确定目标用户激励形式的装置执行。如图2所示基于神经网络模型确定目标用户激励形式的方法包括生成嵌入向量的过程和训练神经网络模型的过程，其中：

生成嵌入向量的过程：首先是关系数据的采集，之后将采集到的关系数据构建成为关系网络，基于关系网络定义图算子，图算子的作用主要是在建模时将邻居的特征聚合传递到自身，本实施例采用的算法为structure2vec，常用的图算子是平均聚合函数。定义图算子之后确定训练图模型，采用structure2vec算法采集关系网络中的代表所述用户的节点、与代表所述用户的节点连接的边的特征、与代表所述用户的节点连接的节点的特征后生成图模型。之后为每一个用户产生一个离线Embedding向量并将离线Embedding向量存储，离线Embedding向量是通过structure2vec算法采集到的特征降维简化后生成的嵌入向量。

训练神经网络模型的过程：样本数据采集，之后对样本数据进行定义，如：使用了激励的用户样本数据定义为正样本，将未使用激励的样本数据定义为负样本。之后将样本数据分为训练集和测试集，根据训练集中的样本数据和离线Embedding向量来训练神经网络模型，之后根据测试集中的样本数据来测试神经网络模型的准确性。在神经网络模型的准确性符合标准后，将训练好的神经网络模型上线应用。

需要说明的是，情况1中，离线Embedding向量可以是离线生成的，训练神经网络模型的步骤可以是离线执行的。情况2中，离线Embedding向量的生成过程与训练神经网络模型的过程是分开执行的，在训练神经网络模型的过程中，只需要获取预先生成的离线Embedding向量，将离线Embedding向量作为一个特征来应用。

下面将结合图3详细描述根据本申请一个实施例的电子设备。参考图3，在硬件层面，电子设备包括处理器，可选地，包括内部总线、网络接口、存储器。其中，存储器可能包含内存，例如高速随机存取存储器(Random-Access Memory，RAM)，也可能还包括非易失性存储器(non-volatile memory)，例如至少1个磁盘存储器等。当然，该电子设备还可能包括其他业务所需要的硬件。

处理器、网络接口和存储器可以通过内部总线相互连接，该内部总线可以是工业标准体系结构(Industry Standard Architecture，ISA)总线、外设部件互连标准(Peripheral Component Interconnect，PCI)总线或扩展工业标准结构(ExtendedIndustry Standard Architecture，EISA)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图3中仅用一个双向箭头表示，但并不表示仅有一根总线或一种类型的总线。

存储器，用于存放程序。具体地，程序可以包括程序代码，所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器，并向处理器提供指令和数据。

处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，在逻辑层面上形成基于神经网络模型确定目标用户激励形式的装置。处理器，执行存储器所存放的程序，并具体用于执行以下操作：

上述如本申请图1所示实施例揭示的方法可以应用于处理器中，或者由处理器实现。处理器可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(NetworkProcessor，NP)等；还可以是数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field－Programmable GateArray，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。

当然，除了软件实现方式之外，本申请的电子设备并不排除其他实现方式，比如逻辑器件抑或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个逻辑单元，也可以是硬件或逻辑器件。

本申请实施例还提出了一种计算机可读存储介质，该计算机可读存储介质存储一个或多个程序，该一个或多个程序包括指令，该指令当被包括多个应用程序的电子设备执行时，能够使该电子设备执行图1所示实施例的方法，并具体用于执行以下方法：

图4是本申请的一个实施例的基于神经网络模型确定目标用户激励形式的装置的结构示意图。请参考图4，在一种软件实施方式中，基于神经网络模型确定目标用户激励形式的装置500可包括：数据获取模块502和激励形式获取模块504，其中，

数据获取模块502，获取目标用户的特征属性、嵌入向量，所述嵌入向量用于表征所述目标用户与其他用户之间的网络关系；

激励形式获取模块504，将所述特征属性、嵌入向量输入训练好的神经网络模型，以得到针对所述目标用户的激励形式；

可选地，作为一个实施例，所述嵌入向量基于关系网络生成，所述关系网络基于所述目标用户的关系数据构建，其中，所述关系网络中的节点用于表征所述目标用户，所述关系网络中的边用于表征所述目标用户与其他用户之间的网络关系。

可选地，作为一个实施例，所述嵌入向量包括所述关系网络中与所述目标用户对应的节点的特征、与所述目标用户连接的边的特征、与所述目标用户对应的节点相连的节点的特征。

可选地，作为一个实施例，所述训练样本数据包括训练神经网络模型的训练数据和测试神经网络模型的测试数据。

可选地，作为一个实施例，所述特征属性包括所述用户的基础属性和所述用户的行为属性中的至少一种。

需要说明的是，实施例1所提供方法的各步骤的执行主体均可以是同一设备，或者，该方法也由不同设备作为执行主体。比如，步骤21和步骤22的执行主体可以为设备1，步骤23的执行主体可以为设备2；又比如，步骤21的执行主体可以为设备1，步骤22和步骤23的执行主体可以为设备2；等等。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flashRAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitorymedia)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本申请的实施例可提供为方法、系统或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

以上所述仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

1.一种基于神经网络模型确定目标用户激励形式的方法，包括：

2.根据权利要求1所述的方法，所述嵌入向量基于关系网络生成，所述关系网络基于所述目标用户的关系数据构建，其中，所述关系网络中的节点用于表征所述目标用户，所述关系网络中的边用于表征所述目标用户与其他用户之间的网络关系。

3.根据权利要求2所述的方法，所述嵌入向量包括所述关系网络中与所述目标用户对应的节点的特征、与所述目标用户连接的边的特征、与所述目标用户对应的节点相连的节点的特征。

4.根据权利要求1-3任一权利要求所述的方法，所述训练样本数据包括训练神经网络模型的训练数据和测试神经网络模型的测试数据。

5.根据权利要求1所述的方法，所述特征属性包括所述目标用户的基础属性和所述目标用户的行为属性中的至少一种。

6.一种基于神经网络模型确定目标用户激励形式的装置，包括：

所述训练好的神经网络模型的训练样本数据包括：用户的特征属性、用户对应的嵌入向量、所述用户的激励形式以及表征所述用户是否核销激励的使用记录。

7.一种电子设备，包括：

处理器；以及

8.一种计算机可读介质，所述计算机可读介质存储一个或多个程序，所述一个或多个程序当被包括多个应用程序的电子设备执行时，使得所述电子设备执行以下操作：