WO2018149337A1

WO2018149337A1 - 一种信息投放方法、装置及服务器

Info

Publication number: WO2018149337A1
Application number: PCT/CN2018/075521
Authority: WO
Inventors: 肖映鹏; 朱张斌
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2017-02-15
Filing date: 2018-02-07
Publication date: 2018-08-23
Also published as: CN108427690B; CN108427690A

Abstract

一种信息投放方法及装置，根据初始种子人群及第k-1轮投放人群的反馈数据，生成第k轮扩散训练集（301）；使用上述第k轮扩散训练集中的个体样本的特征向量进行第k轮迭代训练，得到第k轮扩散模型（302）；使用上述第k轮扩散模型从整体人群中筛选出第k轮投放人群（303），用于第k轮信息投放（304）。基于前一轮投放人群的反馈数据对第k轮扩散训练集做调整，使投放人群与信息的匹配度越来越高，提高了投放人群的精准度。

Description

一种信息投放方法、装置及服务器

本申请要求于2017年2月15日提交中国专利局、申请号为2017100818432、发明名称为“信息投放方法及装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明涉及计算机技术领域，具体涉及一种信息投放方法、装置及服务器。

背景技术

目前很多领域都需要进行信息投放。例如，微信朋友圈的广告推送，或者，论文搜索网站的论文推荐等。

现有的信息投放方式可基于种子人群进行人群扩散，得到投放人群，再对投放人群进行信息投放。所谓的种子人群是指在特定应用场景下，对产品或服务具有相同需求和兴趣的人群。投放人群理论上应与种子人群具有相同需求和兴趣，但数量是种子人群的几倍、几十倍乃至上百上千倍。

由种子人群扩散出的投放人群的精准性，决定了信息投放的准确性，因此，如何精准扩散出投放人群，是目前研发的热门。

发明内容

有鉴于此，本发明实施例提供信息投放方法及装置，以提高扩散投放人群的准确度，进而提高信息投放的准确性。

为实现上述目的，本发明实施例提供如下技术方案：

第一方面，本发明实施例提供一种信息投放方法，所述方法应用于信息投放服务器，包括：

根据初始种子人群及第k-1轮投放人群的反馈数据，生成第k轮扩散训练集；所述k为整数；所述第k轮扩散训练集中的每一个体具有特征向量，所述特征向量包括对应的个体的多个属性及相应的属性值；

使用所述第k轮扩散训练集中的个体的特征向量进行第k轮迭代训练，得到第k轮扩散模型；

使用所述第k轮扩散模型从整体人群中筛选出第k轮投放人群；所述第k轮投放人群用于第k轮信息投放。

第二方面，本发明实施例还提供一种信息投放装置，存储器和处理器，所述存储器用于存储指令，所述处理器用于执行所述指令，以执行下述步骤，包括：

根据初始种子人群及第k-1轮投放人群的反馈数据，生成第k轮扩散训练集；所述k为整数；所述扩散训练集中的每一个体具有特征向量，所述特征向量包括对应的个体的多个属性及相应的属性值；

使用所述第k轮扩散模型从整体人群中筛选出第k轮投放人群；所述第k轮投放人群用于进行第k轮信息投放。

第三方面，本发明实施例还提供一种存储介质，该存储介质用于存储程序代码，所述程序代码用于执行上述第一方面提供的信息投放方法。

第四方面，本发明实施例还提供一种包括指令的计算机程序产品，当其在计算机上运行时，使得所述计算机执行上述第一方面提供的信息投放方法。

在本发明实施例中，是基于前一轮(k-1)的投放人群的反馈数据对第k轮扩散训练集做调整，这样即使初始种子人群的质量差，也可通过反馈数据及多次迭代训练来调整样本，从而使得投放人群与信息的匹配度越来越高，进而提高了扩散出的投放人群的精准度。

同时，在进行迭代训练时，引入了第k轮扩散训练集中所有个体的特征向量进行模型训练，并根据训练出的模型筛选出第k轮投放人群，这样，可保证训练出的模型可以精确区分与正样本子集相似的人群，这样也提高了扩散出的投放人群的精准度。

附图说明

图1所示为根据本发明实施例的应用场景示意图；

图2所示为根据本发明实施例的信息投放平台或服务器的计算机架构示例图；

图3-5所示为根据本发明实施例的信息投放方法示例性流程图；

图6所示为根据本发明实施例的信息投放装置的示例性结构图。

具体实施方式

本发明提供了信息投放方法及装置，上述信息投放方法及装置可应用于各种需要进行人群扩散的应用领域，例如，可应用于微信朋友圈的人群扩散及广告投放领域。

图1示出了上述信息投放装置的一种应用场景，在该应用场景中可包括：信息投放平台101和数据库102。

信息投放平台101的功能可由一台或多台信息投放服务器实现。

在本发明中，信息投放平台101主要负责基于初始种子人群进行扩散得到投放人群，及向投放人群的客户端进行信息投放。

上述信息投放装置可以软件的形式应用于上述信息投放服务器中，或以硬件(例如具体可为信息投放服务器的控制器/处理器)的形式作为信息投放服务器的组成部分。

当以软件形式存在时，上述信息投放装置具体可为一应用程序，例如终端应用程序等，也可作为某应用程序或操作系统的组件或插件。

上述数据库102可用于存储信息投放平台下所有用户的用户唯一标识(ID)、基础信息，以及每一用户的各种属性及属性值。

其中，基础信息可包括手机号、邮箱等，属性示例性的可包括：所在区域、性别、年龄、身高等的一种或多种。在一些应用场景下，属性还可包括：兴趣标签(兴趣标签是用于反映用户兴趣的信息)、购买次数等等，在此不作一一赘述。数据库102的功能可由一台或多台数据库节点实现。

在实际中，信息投放平台101和数据库102的功能也可由同一台服务器实现。

此外，在某些应用场景下，数据库102也可用于提供初始种子人群。当然，初始种子人群也可由诸如广告主等信息发布者来提供。

由于数据库102所提供信息的不同，数据库102可进一步由一个或多个服务器构成。例如，数据库102可包括基础信息服务器、用户画像引擎(可查询兴趣标签)等。

图2示出了上述信息投放平台、服务器或装置的一种通用计算机系统结构。

上述计算机系统可包括总线、处理器1、存储器2、通信接口3、输入设备4和输出设备5。处理器1、存储器2、通信接口3、输入设备4和输出设备5通过总线相互连接。其中：

总线可包括一通路，在计算机系统各个挂件之间传送信息。

处理器1可以是通用处理器，例如通用中央处理器(CPU)、网络处理器(Network Processor，简称NP)、微处理器等，也可以是特定应用集成电路(application-specific integrated circuit，ASIC)，或一个或多个用于控制本发明方案程序执行的集成电路，还可以是数字信号处理器(DSP)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

存储器2中保存有执行本发明技术方案的程序，还可以保存有操作系统和其他关键业务。具体地，程序可以包括程序代码，程序代码包括计算机操作指令。更具体的，存储器2可以包括只读存储器(read-only memory，ROM)、可存储静态信息和指令的其他类型的静态存储设备、随机存取存储器(random access memory，RAM)、可存储信息和指令的其他类型的动态存储设备、磁盘存储器、flash等等。

输入设备4可包括接收用户输入的数据和信息的装置，例如键盘、鼠标、摄像头、扫描仪、光笔、语音输入装置、触摸屏、计步器或重力感应器等。

输出设备5可包括允许输出信息给用户的装置，例如显示屏、打印机、扬声器等。

通信接口3可包括使用任何收发器一类的装置，以便与其他设备或通信网络通信，如以太网，无线接入网(RAN)，无线局域网(WLAN)等。

处理器1执行存储器2中所存放的程序，以及调用其他设备，可用于实现本发明实施例所提供的信息投放方法中的各个步骤。

下面将基于上述本发明涉及的共性方面，对本发明实施例进一步详细说明。

图3示出了上述信息投放方法的一种示例性流程。图3所示的方法应用于图1提及的领域或应用场景中，由图2所示的信息投放平台(或服务器)的处理器1与其他设备交互完成。

上述示例性流程包括：

在301部分：信息投放平台(或服务器)的处理器1根据初始种子人群及第k-1轮投放人群的反馈数据，生成第k轮扩散训练集。

其中，k为从0开始逐一递增的整数。

上述初始种子人群是指在特定应用场景下(例如微信朋友圈)，对产品或服务具有相同需求和兴趣的人群。

在广告投放场景，初始种子人群可由广告主提供。广告主可上传初始种子人群包以实现初始种子人群的提供。初始种子人群包的内容可包括电话号码、账号、邮箱、用户唯一身份标识(ID)等的至少一种。对于电话号码、账号、邮箱，可通过与用户ID的关联关系，转化为用户ID。

在其他应用场景，初始种子人群也可从某一数据库或某些数据库中获取，或从交易平台中获取。

上述第k轮扩散训练集及第k-1轮投放人群中的每一个体对应平台上的一个用户，以用户ID标识。进一步的，每一个体均具有特征向量(特征向量可从数据库102中获取)，上述特征向量包括该个体的多个属性及相应的属性值。

举例来讲，第k轮扩散训练集中包括100个用户ID，每一用户ID均对应多个属性及属性值。

属性示例性的可包括：所在区域、性别、年龄、身高、月收入等的一种或多种。在一些应用场景下，属性还可包括：兴趣标签(兴趣标签是用于反映用户兴趣的信息)、购买次数等等。

属性值是某一属性对应的具体取值。例如身高1.8m，身高是属性，1.8m是身高的属性值。当然，属性值也可以是一个区间。

上述反馈数据可包括第k-1轮投放人群的反馈统计数据，以及第k-1轮投放人群中每一个体的行为数据。

而反馈统计数据是根据第k-1轮投放人群所有个体的行为数据计算得到的。

在一个示例中，反馈统计数据可包括点击率，相应的，各用户的行为数据可包括表征是否点击的数据。

点击率的计算方式是点击量/曝光量。举例来讲，假定第k-1轮投放人群共100人，这100人在k-1时间段内共打开微信客户端1000次，对某一广告位共点击10次。则点击率为10/1000＝1％。

在另一个示例中，反馈统计数据可包括转化率。转化率可包括点赞率(点赞人数/投放人数)、点不喜欢率(点不喜欢人数/投放人数)、点评率(填写评论人数/投放人数)等。

相应的，各用户的行为数据可包括APP下载信息、朋友圈点赞信息、朋友圈评论信息，乃至点“不感兴趣”的信息，点“不喜欢”的信息等。

在302部分：信息投放平台(或服务器)的处理器1使用上述第k轮扩散训练集中的个体的特征向量进行第k轮迭代训练，得到第k轮扩散模型。

需要说明的是，本实施例不会无休止得进行迭代训练及广告投放。会在满足停止条件时停止迭代训练和后续的广告投放。

在一个示例中，停止条件可包括迭代次数达到上限。在另一示例中，停止条件可包括投放人群的人数达到广告主要求的人数等。

上述第k轮扩散训练集包括第一正样本子集和第一负样本子集。需要说明的是，本发明中的第一、第二用于区分，并不用于表示前后顺序。

第一正样本子集中的个体为正样本，而第一负样本子集中的个体为负样本。

相应的，训练得到的第k轮扩散模型可包括：用于区分正负样本的第一区分特征向量(或称为第一特征值权重值向量)。

上述第一区分特征向量可包括：与区分正负样本这一训练目标强关联的属性及相应的属性值。

前述提及了各个个体的特征向量包括多个属性，在迭代训练中，会计算各个属性相对于训练目标的权重，权重越大，表明与训练目标的关联越强。其中，训练目标可为区分正负样本这一目标。

由于有第一负样本子集，则权重也可能为负。

举例来讲，假定共有属性1-4，其相对于训练目标的权重分别为2、0.67、0.625和-0.125，若取3个属性，则属性1-3为与区分正负样本强关联的属性。

需要说明的是，第一区分特征向量中属性的属性值，可能为取值区间或平均值。

举例来讲，假定第一区分特征向量包括年龄这一属性及属性值，而在第一正样本子集中共有4个个体，年龄分别是20、25、15、20，则第一区分特征向量中年龄这一属性的属性值可为[15,25]，也可为(20+25+15+20)/4＝20。

在303部分：使用第k轮扩散模型从整体人群中筛选出第k轮投放人群。

在不同的应用场景下，整体人群指的是平台的所有用户。例如，在微信平台下，整体人群指的是所有的微信用户。

在一个示例中，可使用第k轮扩散模型对整体人群中的每一个体(即用户)进行评分，根据得分由高到低对用户进行排序，选取top N用户作为投放人群。

得分(或称为分值)表征了个体的特征向量与前述第一区分特征向量的相似度。得分越高，表征相应的个体的特征向量与第一区分特征向量的相似度越高。

N的取值由广告主选择的投放规模决定，例如，投放规模为10万，则N＝10万。

或者，可将得分大于某一阈值的用户作为投放人群。

在304部分：信息投放平台(或服务器)的处理器1通过通信接口3对上述第k轮投放人群进行第k轮信息投放。

或者，也可由信息投放平台(或服务器)的处理器1通过通信接口3输出第k轮投放人群，由其他平台对第k轮投放人群进行信息投放。

在进入信息投放后，会判断是否还进行下一轮的信息投放，若判断为是，则生成下一轮扩散训练集，并执行后续操作。

需要说明的是，人群扩散的传统方法如下：

一、将种子人群包作为正样本子集，随机从整体人群中选出负样本子集，组成训练集；

二、使用训练集训练一个线性逻辑回归(LR)模型；

三、使用训练出的LR模型对整体人群做预测，取出TOP N用户作为投放人群。

其缺点是：

质量差的种子人群扩散出质量差的投放人群，而向质量差的投放人群投放广告会造成投放效果差，损害用户的利益；

随机抽取的负样本子集由于没有携带特征信息，因此训练出来的模型没法精准区分正负样本，导致模型精准性差。

而在本发明实施例中，是基于前一轮(k-1)的投放人群的反馈数据对第k轮扩散训练集做调整，这样即使初始种子人群的质量差，也可通过反馈数据及多次迭代训练来调整样本，从而使得投放人群与信息的匹配度越来越高，进而提高了扩散出的投放人群的精准度。

下面将以广告投放场景为例，对本发明的技术方案进行进一步的介绍。

图4示出了上述信息投放方法的另一种示例性流程。图4所示的方法可应用图1所示应用场景中，由图2所示的信息投放平台/服务器中的处理器1与其他部件交互完成。

由于有多次迭代过程，本实施例以第0次迭代训练和广告投放，以及第m(m不等于0)次迭代和广告投放为例进行讲述。m等同于k≠0的任意取值。

该示例性流程包括：

在400部分：信息投放服务器获取初始种子人群作为第0轮扩散训练集的正样本子集(第一正样本子集)。

初始种子人群相关介绍可参见前述实施例的301部分，在此不作赘述。

在401部分：信息投放服务器从整体人群中随机选取与初始种子人群等量的人群，作为第0轮扩散训练集的负样本子集(第一负样本子集)。

举例来讲，若初始种子人群中的用户数量为5万，则信息投放服务器从整体人群中随机选取5万用户作为第一负样本子集。

整体人群相关介绍可参见前述实施例的303部分，在此不作赘述。

在402部分：信息投放服务器获取第一正样本子集和第一负样本子集的特征向量。

特征向量的相关介绍可参见前述实施例的301部分，在此不作赘述。

这样，第0轮扩散训练集中的每一样本均具有特征向量。

在403部分：信息投放服务器将第一正样本子集和第一负样本子集中每一个体的特征向量导入第一预设模型进行训练学习，得到第0轮扩散模型。

更具体的，第一预设模型可为逻辑回归模型(LR)，LR还可进一步细化包括Spark ADMMLR模型等模型。由于样本数量大，可选择Spark ADMMLR模型进行训练学习。

当然，在本发明其他实施例中也可选择其他逻辑的模型，如决策树、支持向量机等。

其中，上述第0轮扩散模型包括：第一区分特征向量。第一区分特征向量的相关介绍可参见前述的301部分，在此不作赘述。

403部分与前述的302部分相类似，相关细节不再赘述。

在404部分：信息投放服务器使用第0轮扩散模型从整体人群中筛选出第0轮投放人群。

404部分与前述的303部分相类似，相关细节不再赘述。

在405部分：信息投放服务器对上述第0轮投放人群进行第0轮信息投放，并得到第0轮投放人群的反馈数据。

更具体的，在第0轮信息投放后，可等待预定时长再获取第0轮投放人群的反馈数据。例如，可等待10分钟、一小时、一天等。

反馈数据的相关介绍可参见前述实施例的301部分，在此不作赘述。

在406部分：信息投放服务器根据第m-1轮投放人群的反馈数据，生成第m轮投放训练集。

在广告投放场景中，第m-1轮投放人群的反馈数据反映了广告投放效果。

第m轮投放训练集包括第二正样本子集和第二负样本子集。第二正样本子集中的个体作为正样本，第二负样本子集中的个体作为负样本。与第0轮投放训练集相类似，第m轮投放训练集中的每一个体均具有特征向量。

前已述及，第k-1轮的反馈数据可包括第k-1轮投放人群的反馈统计数据(点击率或转化率)，以及第k-1轮投放人群中每一个体的行为数据。

相应的，上述第二正样本子集中个体的行为数据，与上述反馈统计数据之间具有正向关联关系；上述第二负样本子集中个体的行为数据与上述反馈统计数据具有反向关联关系。

需要说明的是，所谓的正向关联关系，是指当总数一定的情况下，反馈统计数据随具有该行为数据的个体的个数的增加而增加。

以反馈统计数据为点击率为例，在总数一定的情况下，具有点击行为的个体(可称为点击人群)的个数越多，点击率越高。

再例如，以反馈统计数据为转化率为例，在总数一定的情况下，具有APP下载、点赞、评论等行为的个体(可称为转化人群)的个数越多，转化率越高。

进一步的，若以点击率为投放目标，则第m轮投放训练集的第二正样本子集的获取方式可具体包括：将点击人群作为第二正样本子集。

若以转化率为投放目标，则第m轮投放训练集的第二正样本子集的获取方式可具体包括：将转化人群作为第二正样本子集。

而所谓的反向关联关系，是指当总数一定的情况下，反馈统计数据随着具有该行为数据的个体的个数的增加而减少。

无论是以点击率还是以转化率为投放目标，第m轮投放训练集的第二负样本子集的获取方式可具体包括：

将第m-1轮投放人群中剔除了第m轮投放训练集的第二正样本子集后的其他个体放入第m轮投放训练集的第二负样本子集；或者，将第m-1轮投放人群作为第m轮投放训练集的第二负样本子集。

当然，如追求第二正样本子集的样本数与第二负样本子集的样本数相同，则还可进行抽样，得到第m轮投放训练集的第二负样本子集。

在本实施中，是基于前一轮(m-1)的投放人群的反馈统计数据(点击率或转化率)和个体的行为数据，得到第m轮投放训练集。这样可使得第m轮投放训练集中的第二正样本子集与提高点击率或转化率强关联，而第m轮投放训练集中的第二负样本子集与降低点击率或转化率强关联。

而点击率或转化率表征了广告投放效果，也即第m轮投放训练集(中的正样本子集)与广告投放效果之间正向强关联。这样，基于第m轮投放训练集得到的第m轮投放模型，可精确扩散出与正样本子集相似、有利于提高广告投放效果的投放人群。因此，在本实施例中，即使种子人群质量较差，也可逐渐扩散出精准的投放人群。

在407部分：信息投放服务器将第m轮投放训练集中所有个体的特征向量导入第二预设模型进行训练学习，得到第m轮投放模型。

第二预设模型与前述第一预设模型相类似，在此不作赘述。

第m轮投放模型可包括：用于区分正样本和负样本的第二区分特征向量；所述第二区分特征向量包括：与区分正负样本这一目标强关联的属性及相应的属性值。

第二区分特征向量与第一区分特征向量相类似，相关介绍请参见前述的302部分，在此不作赘述。

需要说明的是，由于训练集不同，所以第二区分特征向量与第一区分特征向量所包括的具体内容也会随之不同。

在本实施例中，由于负样本和正样本均携带特征向量，因此训练出来的投放模型相较于现有方式可精准得区分正负样本，从而后续可通过投放模型筛选出精准的扩散训练集。这样，即使种子人群质量较差，也可逐渐扩散出精准的投放人群。

在408部分：信息投放服务器使用上述第m轮投放模型，从上述第m轮投放训练集和上述初始种子人群中筛选出第m轮扩散训练集。

更具体的，第m轮扩散训练集中的第一正样本子集可通过如下方式得到：

使用第m轮投放模型对初始种子人群中的每一个体打分，得到集合SeedScore＝{(u,score(u))|u∈seedUser}；其中，SeedScore表示种子人群的得分集合(可称为第一得分集合)，u表示初始种子人群中的某一用户，score(u)表示种子人群中某一用户对应的得分。

过滤掉上述初始种子人群中得分小于第一阈值θ1的个体，得到过滤后的种子人群，当然，也可称其为第一子集P1，P ₁＝{u|score(u)＞θ1,(u,score(u))∈SeedScore}。

使用第m轮投放模型对第m轮投放训练集的第二正样本子集中的每一个体打分，得到集合positiveAD Score＝{(u,score(u))|u∈{第m轮投放训练集的第二正样本子集}；其中，positiveAD Score表示第m轮投放训练集中第二正样本子集对应的得分集合(可称为第二得分集合)。

过滤掉第m轮投放训练集的第二正样本子集中得分小于第二阈值θ2的个体，得到过滤后的第二正样本子集，当然，也可称其为第二子集P2，P ₂{u|score(u)＞θ2,(u,score(u))∈PositiveAD Score}。θ1，θ2可相等或不等。

将过滤后的种子人群和过滤后的第二正样本子集取并集，作为上述第m轮扩散训练集的第一正样本子集P，也即P＝P ₁∪P ₂。

在其他实施例中，也可从第m轮投放训练集的第二正样本子集与初始种子群的并集中随机抽取一定数量的用户，得到第m轮扩散训练集中的第一正样本子集。

在本实施例中，每一轮都从种子人群中选出正样本，这样可保证初始种子人群与筛选出的第k轮投放人群的相似度，从而可在保证投放人群与种子人群的相似度的基础上进行人群扩散。

第m轮扩散训练集中的第一负样本子集可通过如下方式得到：

(1)使用第m轮投放模型对第m轮投放训练集的第二负样本子集中的个体打分，得到集合NegativeAD score＝{i,score(i)}|i∈{第m轮投放训练集中的负样本子集}。NegativeAD score表示第m轮投放训练集中第二负样本子集对应的得分集合(可称为第三得分集合)，i表示第m轮投放训练集中第二负样本子集中的某一用户，score(i)表示第m轮投放训练集中第二负样本子集中某一用户对应的得分。

(2)使用伯努利分布对第m轮投放训练集中的第二负样本子集进行抽样，其抽样公式为：

其中，p(i)表示第m轮投放训练集的第二负样本子集中的第i个个体作为负样本的概率，num _neg表示第m轮投放训练集的第二负样本子集的样本数，num _p表示第m轮投放训练集的样本总数，score(i)∈NegativeAD score，

表示对第m轮投放训练集中第二负样本子集中的所有个体的分数求和。

(3)随机计算一个纯小数，若p(i)小于等于该随机计算的纯小数，则将第i个个体放入第m轮扩散训练集中的第一负样本子集中。

对第m轮投放训练集中的每一负样本进行步骤(1)-(3)的操作，最终得到第m轮扩散训练集中的第一负样本子集。

当然，在本发明其他实施例中，也可以使用高斯分布等其他概率分布进行抽样，在此不作赘述。

在409部分：信息投放服务器将上述第m轮扩散训练集中每一个体的特征向量导入第一预设模型进行训练学习，得到第m轮扩散模型。

409部分与403部分相类似，在此不作赘述。

在本实施例中，由于第m轮扩散训练集中的负样本和正样本均携带特征向量，因此训练出来的第m轮扩散模型相较于现有方式可精准得区分正负样本，从而后续可筛选出精准的投放人群。

在410部分：信息投放服务器使用第m轮扩散模型从整体人群中筛选出第m轮投放人群。

410部分与404部分相类似，在此不作赘述。

在411部分：信息投放服务器对上述第m轮投放人群进行信息投放，并得到第m轮投放人群的反馈数据。

411部分与405部分相类似，在此不作赘述。

请参见图5，其示出了图4所示实施例的迭代示意图。

综上，本发明实施例，对第0次迭代训练和其他次的迭代训练进行了详细介绍，即使种子人群质量较差，基于反馈数据和特征向量，也可扩散出有利于提高广告投放效果的投放人群。

图6示出了上述实施例中所涉及的信息投放装置的一种可能的结构示意图，包括：

扩散训练集生成单元601，用于根据初始种子人群及第k-1轮投放人群的反馈数据，生成第k轮扩散训练集；

所述k为整数；所述扩散训练集中的每一个体具有特征向量，所述特征向量包括对应的个体的多个属性及相应的属性值；

训练单元602，用于使用所述第k轮扩散训练集中的个体的特征向量进行第k轮迭代训练，得到第k轮扩散模型；

筛选单元603，用于使用所述第k轮扩散模型从整体人群中筛选出第k轮投放人群；所述第k轮投放人群用于进行第k轮信息投放。

具体细节请参见本文前述记载，在此不作赘述。

在本发明其他实施例中，仍请参见图6，上述信息投放装置还可包括：

广告投放单元604，用于对上述第k轮投放人群进行第k轮信息投放。

其中，扩散训练集生成单元601可用于执行图3所示实施例的301部分；此外，还可执行图4所示实施例的400-402部分。

训练单元602可用于执行图3所示实施例的302部分；此外，还可执行图4所示实施例的403、406-409部分。

筛选单元603可用于执行图3所示实施例的303部分；此外，还可执行图4所示实施例的404、410部分。

广告投放604可用于执行图3所示实施例的304部分；此外，还可执行图4所示实施例的405、411部分。

本申请实施例还提供了一种信息投放服务器，该信息投放服务器可以包括上述所述的任一种信息投放装置。该信息投放服务器的组成结构可以参见图1所示，在本申请实施例中的信息投放服务器中，该存储器中所存储的程序代码，所述处理器根据所述程序代码中的指令，以执行下述步骤：

可选的，所述第k轮扩散训练集包括第一正样本子集和第一负样本子集；所述第一正样本子集中的个体作为正样本，所述第一负样本子集中的个体作为负样本；

当k＝0时，在生成第k轮扩散训练集的方面，所述处理器用于执行所述指令，以执行下述步骤，包括：获取初始种子人群作为第一正样本子集；

从整体人群中随机选取与所述初始种子人群等量的人群，作为第一负样本子集；

获取所述第一正样本子集和所述第一负样本子集中的个体的特征向量作为第k轮扩散训练集中每一个体的特征向量。

可选的，所述处理器根据所述程序代码中的指令，以执行下述步骤，包括：

当k≠0时，根据第k-1轮投放人群的反馈数据，生成第k轮投放训练集；所述第k轮投放训练集中的每一个体具有特征向量；

将所述第k轮投放训练集中的个体的特征向量导入第二预设模型进行训练学习，得到第k轮投放模型；

使用所述第k轮投放模型，从所述第k轮投放训练集和所述初始种子人群中筛选出第k轮扩散训练集。

可选的，所述第k轮投放训练集包括第二正样本子集和第二负样本子集；所述第二正样本子集中的个体作为正样本，所述第二负样本子集中的个体作为负样本；

在所述根据第k-1轮投放人群的反馈数据，生成第k轮投放训练集方面，所述处理器用于执行所述指令，以执行下述步骤，包括：

获取第k-1轮投放人群的反馈数据，所述反馈数据包括所述第k-1轮投放人群的反馈统计数据，以及所述第k-1轮投放人群中每一个体的行为数据；所述反馈统计数据是根据所述第k-1轮投放人群中个体的行为数据计算得到的；

从所述第k-1轮投放人群中筛选出所述第二正样本子集；所述第二正样本子集包括行为数据与所述反馈统计数据之间具有正向关系的个体，并且，所述第二正样本子集中的每一个体均具相对应的有特征向量；

从所述第k-1轮投放人群中筛选出所述第二负样本子集；所述第二负样本子集中的每一个体均具有特征向量。

可选的，在使用所述第k轮投放模型，从所述第k轮投放训练集和所述初始种子人群中筛选出所述第k轮扩散训练集方面，所述处理器用于执行所述指令，以执行下述步骤，包括：

使用所述第k轮投放模型对所述初始种子人群中的每一个体进行评分，并过滤掉所述初始种子人群中得分小于第一阈值的个体，得到过滤后的种子人群；

使用所述第k轮投放模型对所述第二正样本子集中的每一个体进行评分，并过滤掉所述第二正样本子集中得分小于第二阈值的个体，得到过滤后的第二正样本子集；

将过滤后的种子人群和过滤后的第二正样本子集的并集，作为所述第k轮扩散训练集的正样本子集。

可选的，在所述使用所述第k轮投放模型，从所述第k轮投放训练集和所述初始种子人群中筛选出所述第k轮扩散训练集方面，所述处理器用于执行所述指令，以执行下述步骤，包括：

使用所述第k轮投放模型对所述第二负样本子集中的第i个个体进行评分；

基于所述第i个个体的得分，计算所述第i个个体作为负样本的概率；

针对所述第i个个体随机生成纯小数；

若所述小于等于所述纯小数，将所述第i个个体放入所述第k轮扩散训练集的第一负样本子集中。

此外，本发明实施例还提供了一种存储介质，该存储介质用于存储程序代码，所述程序代码用于执行任意一项上述的信息投放方法。

另一方面，本发明实施例还提供了一种包括指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述的信息投放方法。

结合本发明公开内容所描述的方法或者算法的步骤可以硬件的方式来实现，也可以是由处理器执行软件指令的方式来实现。软件指令可以由相应的软件模块组成，软件模块可以被存放于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、移动硬盘、CD-ROM或者本领域熟知的任何其它形式的存储介质中。一种示例性的存储介质耦合至处理器，从而使处理器能够从该存储介质读取信息，且可向该存储介质写入信息。当然，存储介质也可以是处理器的组成部分。处理器和存储介质可以位于ASIC中。另外，该ASIC可以位于用户设备中。当然，处理器和存储介质也可以作为分立组件存在于用户设备中。

本领域技术人员应该可以意识到，在上述一个或多个示例中，本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时，可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质，其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。

以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的技术方案的基础之上，所做的任何修改、等同替换、改进等，均应包括在本发明的保护范围之内。

Claims

一种信息投放方法，所述方法应用于信息投放服务器，包括：

根据初始种子人群及第k-1轮投放人群的反馈数据，生成第k轮扩散训练集；所述k为整数；所述第k轮扩散训练集中的每一个体具有特征向量，所述特征向量包括对应的个体的多个属性及相应的属性值；

使用所述第k轮扩散训练集中的个体的特征向量进行第k轮迭代训练，得到第k轮扩散模型；

使用所述第k轮扩散模型从整体人群中筛选出第k轮投放人群；所述第k轮投放人群用于第k轮信息投放。
如权利要求1所述的方法，

所述第k轮扩散训练集包括第一正样本子集和第一负样本子集；所述第一正样本子集中的个体作为正样本，所述第一负样本子集中的个体作为负样本；

所述使用所述第k轮扩散训练集中的个体的特征向量进行第k轮迭代训练，得到第k轮扩散模型，包括：

将所述第一正样本子集和第一负样本子集中的个体的特征向量导入第一预设模型进行训练学习，得到第k轮扩散模型。
如权利要求1或2所述的方法，当k＝0时，所述方法还包括：

获取初始种子人群作为第一正样本子集；

从整体人群中随机选取与所述初始种子人群等量的人群，作为第一负样本子集；

获取所述第一正样本子集和所述第一负样本子集中的个体的特征向量作为第k轮扩散训练集中的个体的特征向量。
如权利要求1或2所述的方法，当k≠0时，所述根据初始种子人群及第k-1轮投放人群的反馈数据，生成第k轮扩散训练集，包括：

根据第k-1轮投放人群的反馈数据，生成第k轮投放训练集；所述第k轮投放训练集中的每一个体具有特征向量；

将所述第k轮投放训练集中的个体的特征向量导入第二预设模型进行训练学习，得到第k轮投放模型；

使用所述第k轮投放模型，从所述第k轮投放训练集和所述初始种子人群中筛选出第k轮扩散训练集。
如权利要求4所述的方法，

所述第k轮投放训练集包括第二正样本子集和第二负样本子集；所述第二正样本子集中的个体作为正样本，所述第二负样本子集中的个体作为负样本；

所述根据第k-1轮投放人群的反馈数据，生成第k轮投放训练集，包括：

获取第k-1轮投放人群的反馈数据；所述反馈数据包括所述第k-1轮投放人群的反馈统计数据，以及所述第k-1轮投放人群中每一个体的行为数据；所述反馈统计数据是根据所述第k-1轮投放人群中个体的行为数据计算得到的；

从所述第k-1轮投放人群中筛选出所述第二正样本子集；所述第二正样本子集中个体的行为数据与所述反馈统计数据之间具有正向关联关系，并且，所述第二正样本子集中的每一个体均具有特征向量；

从所述第k-1轮投放人群中筛选出所述第二负样本子集；所述第二负样本子集中的每一个体均具有特征向量。
如权利要求5所述的方法，所述第二负样本子集包括所述第k-1轮投放人群中剔除了所述第二正样本子集后的其他个体；或者，

所述第二负样本子集包含所述第k-1轮投放人群。
如权利要求6所述的方法，所述使用所述第k轮投放模型，从所述第k轮投放训练集和所述初始种子人群中筛选出第k轮扩散训练集，包括：

使用所述第k轮投放模型对所述初始种子人群中的每一个体进行评分，并过滤掉所述初始种子人群中得分小于第一阈值的个体，得到过滤后的种子人群；

使用所述第k轮投放模型对所述第二正样本子集中的每一个体进行评分，并过滤掉所述第二正样本子集中得分小于第二阈值的个体，得到过滤后的第二正样本子集；

将过滤后的种子人群和过滤后的第二正样本子集的并集，作为所述第k轮扩散训练集的第一正样本子集。
如权利要求7所述的方法，所述使用所述第k轮投放模型，从所述第k轮投放训练集和所述初始种子人群中筛选出所述第k轮扩散训练集，还包括：

使用所述第k轮投放模型对所述第二负样本子集中的第i个个体进行评分；

基于所述第i个个体的得分，计算所述第i个个体作为负样本的概率p(i)；

针对所述第i个个体随机生成纯小数；

若所述p(i)小于等于所述纯小数，将所述第i个个体放入所述第k轮扩散训练集的第一负样本子集中。
一种信息投放装置，包括存储器和处理器，所述存储器用于存储指令，所述处理器用于执行所述指令，以执行下述步骤：

根据初始种子人群及第k-1轮投放人群的反馈数据，生成第k轮扩散训练集；所述k为整数；所述扩散训练集中的每一个体具有特征向量，所述特征向量包括对应的个体的多个属性及相应的属性值；

使用所述第k轮扩散训练集中的个体的特征向量进行第k轮迭代训练，得到第k轮扩散模型；

使用所述第k轮扩散模型从整体人群中筛选出第k轮投放人群；所述第k轮投放人群用于进行第k轮信息投放。
如权利要求9所述的装置，所述第k轮扩散训练集包括第一正样本子集和第一负样本子集；所述第一正样本子集中的个体作为正样本，所述第一负样本子集中的个体作为负样本；

当k＝0时，在生成第k轮扩散训练集的方面，所述处理器用于执行所述指令，以执行下述步骤，包括：获取初始种子人群作为第一正样本子集；

从整体人群中随机选取与所述初始种子人群等量的人群，作为第一负样本子集；

获取所述第一正样本子集和所述第一负样本子集中的个体的特征向量作为第k轮扩散训练集中每一个体的特征向量。
如权利要求10所述的装置，所述处理器用于执行所述指令，以执行下述步骤，包括：

当k≠0时，根据第k-1轮投放人群的反馈数据，生成第k轮投放训练集；所述第k轮投放训练集中的每一个体具有特征向量；

将所述第k轮投放训练集中的个体的特征向量导入第二预设模型进行训练学习，得到第k轮投放模型；

使用所述第k轮投放模型，从所述第k轮投放训练集和所述初始种子人群中筛选出第k轮扩散训练集。
如权利要求11所述的装置，所述第k轮投放训练集包括第二正样本子集和第二负样本子集；所述第二正样本子集中的个体作为正样本，所述第二负样本子集中的个体作为负样本；

在所述根据第k-1轮投放人群的反馈数据，生成第k轮投放训练集方面，所述处理器用于执行所述指令，以执行下述步骤，包括：

获取第k-1轮投放人群的反馈数据，所述反馈数据包括所述第k-1轮投放人群的反馈统计数据，以及所述第k-1轮投放人群中每一个体的行为数据；所述反馈统计数据是根据所述第k-1轮投放人群中个体的行为数据计算得到的；

从所述第k-1轮投放人群中筛选出所述第二正样本子集；所述第二正样本子集包括行为数据与所述反馈统计数据之间具有正向关系的个体，并且，所述第二正样本子集中的每一个体均具相对应的有特征向量；

从所述第k-1轮投放人群中筛选出所述第二负样本子集；所述第二负样本子集中的每一个体均具有特征向量。
如权利要求12所述的装置，在使用所述第k轮投放模型，从所述第k轮投放训练集和所述初始种子人群中筛选出所述第k轮扩散训练集方面，所述处理器用于执行所述指令，以执行下述步骤，包括：

使用所述第k轮投放模型对所述初始种子人群中的每一个体进行评分，并过滤掉所述初始种子人群中得分小于第一阈值的个体，得到过滤后的种子人群；

使用所述第k轮投放模型对所述第二正样本子集中的每一个体进行评分，并过滤掉所述第二正样本子集中得分小于第二阈值的个体，得到过滤后的第二正样本子集；

将过滤后的种子人群和过滤后的第二正样本子集的并集，作为所述第k轮扩散训练集的正样本子集。
如权利要求13所述的装置，在所述使用所述第k轮投放模型，从所述第k轮投放训练集和所述初始种子人群中筛选出所述第k轮扩散训练集方面，所述处理器用于执行所述指令，以执行下述步骤，包括：

使用所述第k轮投放模型对所述第二负样本子集中的第i个个体进行评分；

基于所述第i个个体的得分，计算所述第i个个体作为负样本的概率p(i)；

针对所述第i个个体随机生成纯小数；

若所述p(i)小于等于所述纯小数，将所述第i个个体放入所述第k轮扩散训练集的第一负样本子集中。
一种存储介质，所述存储介质用于存储程序代码，所述程序代码用于执行权利要求1-8任意一项所述的信息投放方法。
一种包括指令的计算机程序产品，当其在计算机上运行时，使得所述计算机执行权利要求1-8任意一项所述的信息投放方法。