CN114385700A

CN114385700A - 种子对象的确定方法、装置、设备及存储介质

Info

Publication number: CN114385700A
Application number: CN202210019509.5A
Authority: CN
Inventors: 徐亚东; 陈宣屹; 林以凡
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2022-01-10
Filing date: 2022-01-10
Publication date: 2022-04-22

Abstract

本申请涉及计算机领域，特别涉及人工智能领域，提供了一种种子对象的确定方法、装置、设备及存储介质，以解决种子对象的筛选准确率低的问题。该方法包括：通过分析各个原始对象各自的对象数据，自动识别目标应用程序内的重定向对象，再通过预测各个重定向对象的回流预测概率，选取回流预测概率较高的种子对象。本申请实施例所采集的对象数据均源自产品内部记载的数据，因此，每条对象数据上详细记录了每个原始对象或者重定向对象的产品使用行为，在分析数据的过程中，由于考虑到了各种可能影响对象回流行为的因素，得以筛选出高价值的种子对象，有效提高了种子对象的筛选准确率。

Description

种子对象的确定方法、装置、设备及存储介质

技术领域

本申请涉及计算机领域，特别涉及人工智能领域，提供了一种种子对象的确定方法、装置、设备及存储介质。

背景技术

随着互联网技术的不断发展，互联网多媒体信息以其快速、便捷、灵活性强的优势迅速取代了传统多媒体信息。为了精准触达多媒体信息的期望对象，在投放多媒体信息之前，多媒体信息提供方需要提供一批种子对象。

具体的，针对待投放多媒体信息的推广产品(如，应用程序等)，多媒体信息提供方会基于产品自身特性、运营经验、产品发布的新功能等因素，筛选出一批种子对象，然而，随着对象数量的逐渐增多，已有的筛选标准已经不能涵盖拥有大量对象的产品需求，相应的，种子对象的筛选准确度也在逐步下降。

为解决上述问题，相关技术下，多媒体信息提供方还会利用多媒体信息投放平台开发的软件开发工具包(Software Development Kit，SDK)，采集使用推广产品的各个使用对象的对象数据，再基于各个对象数据，从多个使用对象中筛选出符合多媒体信息投放平台的筛选条件的种子对象。

由于SDK只考虑到部分字段的对象数据，对使用对象重新使用推广产品的影响因素，而忽略其他字段的对象数据，对使用对象重新使用推广产品的影响性，因数据采集的片面性，反而降低了种子对象的筛选准确率。

例如，SDK只能采集游戏玩家的注册、付费、应用程序登录时间、应用程序登出时间等字段的游戏数据，却不会采集游戏段位、游戏装备等也会影响玩家是否会重新玩这款游戏的重要字段的游戏数据。

发明内容

本申请实施例提供了一种种子对象的确定方法、装置、设备及存储介质，以解决种子对象的筛选准确率低的问题。

第一方面，本申请实施例提供了一种种子对象的确定方法，包括：

基于各个原始对象各自的对象数据，确定多个重定向对象；其中，所述原始对象为：在历史阶段，曾使用目标应用程序的对象，所述重定向对象为：在当前阶段，所述各个原始对象中不再使用所述目标应用程序的对象，所述目标应用程序为：待投放多媒体信息所推广的应用程序；

基于所述多个重定向对象各自的对象数据，获得所述多个重定向对象各自的回流预测概率；

将回流预测概率满足第一设定阈值要求的重定向对象，作为在未来阶段会重新使用所述目标应用程序的种子对象。

第二方面，本申请实施例还提供了一种种子对象的确定装置，包括：

数据处理单元，用于基于各个原始对象各自的对象数据，确定多个重定向对象；其中，所述原始对象为：在历史阶段，曾使用目标应用程序的对象，所述重定向对象为：在当前阶段，所述各个原始对象中不再使用所述目标应用程序的对象，所述目标应用程序为：待投放多媒体信息所推广的应用程序；

回流预测单元，用于基于所述多个重定向对象各自的对象数据，获得所述多个重定向对象各自的回流预测概率；

种子对象确定单元，用于将回流预测概率满足第一设定阈值要求的重定向对象，作为在未来阶段会重新使用所述目标应用程序的种子对象。

可选的，在获得所述多个重定向对象各自的回流预测概率的同时，所述种子对象确定单元还用于：

将满足预设种子对象筛选规则的重定向对象，作为相应的第一候选对象；

基于多个第一候选对象和所述多个重定向对象各自的回流预测概率，确定相应的种子对象。

可选的，所述种子对象确定单元包括以下任意一种方式：

将回流预测概率满足第二设定阈值要求的重定向对象，作为相应的第二候选对象，并将多个第一候选对象与多个第二候选对象之间共有的重定向对象，作为相应的种子对象；

将回流预测概率满足第三设定阈值要求的重定向对象，作为相应的第三候选对象，并从所述多个第一候选对象中剔除与多个第三候选对象之间共有的重定向对象，将剔除后的第一候选对象作为相应的种子对象；其中，所述第三候选对象的回流预测概率低于所述第二候选对象的回流预测概率。

第三方面，本申请实施例还提供了一种计算机设备，包括处理器和存储器，其中，所述存储器存储有程序代码，当所述程序代码被所述处理器执行时，使得所述处理器执行上述任意一种种子对象的确定方法的步骤。

第四方面，本申请实施例还提供了一种计算机可读存储介质，其包括程序代码，当所述程序代码在计算机设备上运行时，所述程序代码用于使所述计算机设备执行上述任意一种种子对象的确定方法的步骤。

第五方面，本申请实施例还提供了一种计算机程序产品，包括计算机指令，所述计算机指令被处理器执行时实现上述任意一种种子对象的确定方法的步骤。

本申请有益效果如下：

本申请实施例提供了一种种子对象的确定方法、装置、设备及存储介质，该方法包括：基于各个原始对象各自的对象数据，确定多个重定向对象；再基于多个重定向对象各自的对象数据，获得多个重定向对象各自的回流预测概率，将回流预测概率满足第一设定阈值要求的重定向对象，作为在未来阶段会重新使用目标应用程序的种子对象。

本申请实施例所采集的对象数据均源自产品内部记载的数据，因此，每条对象数据上详细记录了每个原始对象或者重定向对象的产品使用行为，在分析数据的过程中，由于考虑到了各种可能影响对象回流行为的因素，得以筛选出高价值的种子对象，有效提高了种子对象的筛选准确率。

而且，种子对象的筛选准确率与多媒体信息的投放效果成正相关，也有效提高了目标应用程序的回流率，和重新使用目标应用程序后的留存、活跃、付费等行为。

另外，相较于传统的人工筛选方式和基于SDK的机器筛选方式来说，本申请实施例使用机器学习的方式，分析产品内部的对象数据，筛选出一批种子对象，也有效降低了数据分析成本。

本申请的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1为本申请实施例中一种应用场景的一个可选的示意图；

图2a为本申请实施例中第一种种子对象筛选系统的结构示意图；

图2b为本申请实施例中使用第一种种子对象筛选系统，确定种子对象的流程示意图；

图2c为本申请实施例提供的基于各个原始对象各自的对象数据，确定多个重定向对象的流程示意图；

图2d为本申请实施例中分类回归树1的结构示意图；

图2e为本申请实施例中分类回归树2的结构示意图；

图2f为本申请实施例中回流预测模型的一轮迭代训练的流程示意图；

图2g为本申请实施例中样本对象与各棵分类回归树之间的映射关系的逻辑示意图；

图3a为本申请实施例中第二种种子对象筛选系统的结构示意图；

图3b为本申请实施例提供的自定义规则筛选模块结合模型筛选模块的逻辑示意图；

图3c为本申请实施例提供的自定义选项页面的第一页面示意图；

图3d为本申请实施例提供的自定义选项页面的第二页面示意图；

图3e为本申请实施例提供的模型筛选条件设置页面示意图；

图3f为本申请实施例中使用第二种种子对象筛选系统，确定种子对象的流程示意图；

图3g为本申请实施例提供的确定网络游戏的种子对象的工作逻辑示意图；

图4为本申请实施例提供的一种服务平台的访问装置的结构示意图；

图5为本申请实施例中提供的一种计算机设备的组成结构示意图；

图6为本申请实施例中的一个计算装置的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请技术方案的一部分实施例，而不是全部的实施例。基于本申请文件中记载的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请技术方案保护的范围。

以下对本申请实施例中的部分用语进行解释说明，以便于本领域技术人员理解。

1、人工智能：

人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术；人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

随着人工智能技术研究和进步，人工智能在多个领域展开研究和应用，例如常见的智能家居、智能客服、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、机器人、智能医疗等，相信随着技术的发展，人工智能将在更多的领域得到应用，并发挥越来越重要的价值。

2、机器学习：

机器学习是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。

机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍布人工智能的各个领域，包括深度学习、强化学习、迁移学习、归纳学习、式教学习等技术。

3、XGBoost：

XGBoost是一种经典的集成式提升算法框架，具有训练效率高、预测效果好、可控参数多、使用方便等特性，是大数据分析领域的一柄利器。在实际业务中，XGBoost经常被运用于对象行为预判、对象标签预测、对象信用评分等项目中。

其中，训练XGBoost的核心思想是，通过特征分裂的方式，不断地添加分类回归树，每添加一棵分类回归树，去学习一个用于拟合上次残差的新函数，直到训练结束，获得k棵树。

在使用训练好的XGBoost预测样本数据的预测值时，样本数据的特征会落到每棵树中对应的一个叶子节点上，通过对多个叶子节点的分数进行加权平均处理，可获得这份样本数据所对应的预测值。

4、多媒体信息提供方指的是为了推广目标应用程序，向多媒体信息投放平台提供待投放多媒体信息的对象，而多媒体信息投放平台则是用于投放该多媒体信息的平台。

例如，为了在海外推广某款手游应用程序，广告主在海外视频网站上投放这款手游应用程序的广告。

5、重定向对象：

在社会化媒体营销中，重定向属于投入回报率最高的营销方式之一，主要是通过分析使用对象的在线行为，定位出在当前阶段，不再使用推广产品的对象，用更具体的广告进行二次营销。

例如，用户在电商网站上浏览了一些商品，在他访问视频网站时，还会在视频网站上展示对方曾在电商网站上浏览过的商品合集广告。

6、种子对象：

种子对象是指除自己反复消费外，还可以凭借自身影响力，为企业带来更多新使用对象的对象。因此，种子对象是一款产品的一部分核心对象，也是最有价值的对象群体。

种子对象往往具有以下的特征：频繁使用产品、产品忠诚度高、勇于发表产品意见、有向他人推荐产品的意愿。

7、历史多媒体信息投放对象指的是，曾在多媒体投放平台上，被投放了推广产品的多媒体信息的对象。

下面对本申请实施例的设计思想进行简要介绍：

有鉴于此，本申请实施例提出了一种种子对象的确定方法。该方法包括：

基于各个原始对象各自的对象数据，确定多个重定向对象；再基于多个重定向对象各自的对象数据，获得多个重定向对象各自的回流预测概率，将回流预测概率满足第一设定阈值要求的重定向对象，作为在未来阶段会重新使用目标应用程序的种子对象。

另外，相较于传统的人工筛选方式和基于SDK的机器筛选方式来说，本申请实施例使用机器学习分析产品内部的对象数据，筛选出一批种子对象，也有效降低了数据分析成本。

以下结合说明书附图对本申请的优选实施例进行说明，应当理解，此处所描述的优选实施例仅用于说明和解释本申请，并不用于限定本申请，并且在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

本申请实施例可应用于各种场景，包括但不限于云技术、人工智能、智慧交通、辅助驾驶等。图1示出了其中一种应用场景的示意图，该应用场景下包括原始对象使用的物理终端设备110、多媒体信息投放人员使用的物理终端设备130和一台服务器150，服务器150分别与两台物理终端设备之间使用有线网络或无线网络进行通信连接。

在本申请实施例中，无论是物理终端设备110，还是物理终端设备130均包括但不限于个人计算机、手机、平板电脑、笔记本电脑、智能语音交互设备、智能家电、车载终端等。

在本申请实施例中，服务器150可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content DeliveryNetwork，CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器，本申请在此不做限制。

当物理终端设备110上的应用程序被触发运行时，原始对象可通过应用程序使用界面120发布动态、操作游戏等，同时，应用程序后台会一一记录下原始对象的产品使用行为，并生成相应的对象数据存储在本地或者应用程序的云端服务器中。

当应用程序被选为待推广的目标应用程序时，服务器150会获取物理终端设备110或者相应的应用程序云端服务器中存储的各个原始对象的对象数据，再基于各个原始对象的对象数据和部署在服务器150上的种子对象筛选系统，经过两轮筛选，获得在未来阶段会重新使用目标应用程序的种子对象。

同时，多媒体信息投放人员还可以通过物理终端设备130的访问界面140，查看服务器150返回的种子对象，多媒体信息投放人员在确认筛选结果无误之后，可通过物理终端设备130指示服务器150将所挑选的种子对象发送到多媒体信息投放平台中，执行后续的多媒体信息投放操作。

种子对象筛选系统用于从多个原始对象中，筛选出在未来阶段会重新使用目标应用程序的种子对象。参阅图2a示出的结构示意图，第一种种子对象筛选系统包括数据处理模块、模型筛选模块、模型监测模块和数据发送模块。

具体地，数据处理模块用于对各个原始对象的对象数据进行数据预处理，从多个原始对象中确定出在当前阶段，不再使用目标应用程序的重定向对象。

模型筛选模块通过内部的回流预测模型，分析每个重定向对象的对象数据，从多个重定向对象中，选取出相应的种子对象。

模型监测模块用于基于预设的监测条件，监测设定时间段内种子对象群的特征分布，当出现异常特征数据时，自动触发报警策略。例如，一般回流概率高的玩家的游戏等级比回流概率低的玩家的游戏等级高，或者，前者与好友组队的次数也高于后者，若今日选取的种子玩家群中的最高游戏等级仍低于所有重定向玩家的游戏等级平均值，模块监测模块判定此时处于异常情况，会向工作人员发送告警信息。

模型监测模块还用于监测历史多媒体信息投放对象的回流效果，历史多媒体信息投放对象为：曾在多媒体信息投放平台投放目标应用程序的多媒体信息的对象。如果回流效果不符合预期回流目标的话，说明应调整回流预测模型的模型参数和重定向对象的对象数据的数据维度，如，通过加入更多有用的行为特征的方式，提升模型性能。

数据发送模块用于向多媒体信息投放平台发送所挑选的种子对象，以便多媒体信息投放平台基于获得的种子对象，执行后续的多媒体信息投放操作。

接下来，参阅图2b示出的流程示意图，介绍使用种子对象筛选系统，确定种子对象的过程。

S201：基于各个原始对象各自的对象数据，确定多个重定向对象；其中，原始对象为：在历史阶段，曾使用目标应用程序的对象，重定向对象为：在当前阶段，各个原始对象中不再使用目标应用程序的对象，目标应用程序为：待投放多媒体信息所推广的应用程序。

在本申请实施例中，原始对象指的是过去曾使用过目标应用程序的对象，既包括过去曾使用过目标应用程序，但目前不再使用的对象，还包括一直在使用目标应用程序的对象。

例如，a曾每日登录手游应用程序打游戏，但三个月前已卸载这款手游应用程序，那么，可以将a看作这款手游应用程序的原始对象；

又例如，用户b自今年三月起下载手游应用程序起，一直在使用这款手游应用程序，那么，也可以将用户b看作这款手游应用程序的原始对象。

重定向对象表征的是曾经使用过目标应用程序，但最近一段时间才流失的对象，相较于已卸载目标应用程序、长时间未登陆目标应用程序的沉睡对象而言，重定向对象重新使用目标应用程序的可能性更高，因此，从重定向对象中筛选获得种子对象，其多媒体信息投放效果更好，也有效提高了目标应用程序的回流率，和重新使用目标应用程序后的留存、活跃、付费等行为。

例如，用户c曾使用过手游应用程序，但最近七日内没有再登录过这款手游应用程序，那么，可以将用户c看作这款手游应用程序的重定向对象。

参阅图2c示出的流程示意图，介绍基于各个原始对象各自的对象数据，确定多个重定向对象的过程。

S2011：获取各个原始对象各自的对象数据；每个对象数据包括：相应的原始对象的行为数据，以及相应的原始对象用于运行目标应用程序的客户端设备数据。

其中，原始对象的行为数据包括但不限于：原始对象在目标应用程序的留存行为、活跃行为、社交行为、付费行为；客户端设备数据记录了客户端设备的硬件信息，包括但不限于：客户端设备的存储空间、客户端设备的屏幕尺寸、客户端设备的系统信息。

留存行为指的是，原始对象在一段时间内使用目标应用程序的行为；

活跃行为指的是，原始对象频繁使用目标应用程序的行为，包括但不限于：设定时间段内的登录次数总和、在线总时长、平均在线时长、设定时间段内的成功对局次数总和；

社交行为指的是，原始对象在目标应用程序中添加好友、与好友互动的行为，包括但不限于：设定时间段内发起好友请求的数量总和、所添加的好友数量总和、设定时间段内与好友组队游戏的次数总和；

付费行为指的是，原始对象为了体验目标应用程序的某项功能，支付一定金额的行为，包括但不限于：付费项目的名称、付费项目的金额、设定时间段内的付费次数总和。

S2012：对获得的各行为数据和各客户端设备数据进行数据预处理，分别获得各个原始对象各自的行为标签、行为特征和客户端设备特征。

数据处理模块采用常见的数据处理方法，对获得的各行为数据和各客户端设备数据进行数据预处理，分别获得各个原始对象各自的行为标签、行为特征和客户端设备特征。

其中，行为标签包括但不限于：高留存标签、高活跃标签、付费标签、社交达人标签；

行为特征既包括原始对象自身的属性特征(如原始对象的账号标识、原始对象在目标应用程序中的等级信息、原始对象的年龄、性别等基本信息)，还包括原始对象在目标应用程序的留存行为、活跃行为、社交行为、付费行为；

客户端设备特征是通过分析客户端设备数据获得的，包括但不限于：客户端设备的存储空间、客户端设备的屏幕尺寸、客户端设备的系统信息。

S2013：基于获得的各行为标签、各行为特征和各客户端设备特征，筛选出在当前阶段，各个原始对象中不再使用目标应用程序的对象，作为多个重定向对象。

基于获得的各行为标签、各行为特征和各客户端设备特征，剔除多个原始对象中早已不再使用目标应用程序的沉睡对象，和一直在使用目标应用程序的活跃对象，筛选获得曾经使用过目标应用程序，但最近一段时间不再使用的重定向对象。

S202：基于多个重定向对象各自的对象数据，获得多个重定向对象各自的回流预测概率。

在执行步骤202时，分别将多个重定向对象各自的对象数据输入到回流预测模型中，获得各自的回流预测概率。其中，回流预测模型可使用XGBoost、深度学习神经网络模型，或者其他基于机器学习思想搭建的模型。

那么，以回流预测模型是XGBoost为例，依次讲述回流预测模型的搭建、训练和使用过程。

(1)搭建回流预测模型：

XGBoost是一个加法模型，通过特征分裂的方式，不断地添加分类回归树，每添加一棵分类回归树，训练一次回流预测模型，学习到一个用于拟合上次残差的新函数。其中，每棵分类回归树是基于行为标签、行为特征和客户端设备特征中至少一个的子集构建的。

例如，当子集1为(平均在线时长，设定时间段内的成功对局次数总和，设定时间段内与好友组队游戏的次数总和，付费标签)时，构建得到如图2d所示的分类回归树1；

又例如，在回流预测模型已构建了分类回归树1的基础上，当子集2为(设定时间段内的登录次数总和，设定时间段内与好友组队游戏的次数总和，付费标签，客户端设备的屏幕尺寸)，又构建得到如图2e所示的分类回归树2。

(2)训练回流预测模型：

采用循环迭代的方式训练回流预测模型，直至回流预测模型满足迭代停止条件，输出训练完毕的回流预测模型，其中，针对回流预测模型的一轮迭代训练过程如图2f所示：

S2021：通过回流预测模型读取一个样本对象p的对象数据，样本对象p的对象数据包括：样本对象p的样本行为标签、样本行为特征和样本客户端设备特征。

S2022：基于样本对象p的对象数据，分别获取样本对象与内部各棵分类回归树之间的映射关系，并基于获得的各个映射关系，确定样本对象p的回流预测结果。

如图2g所示，基于样本对象p的对象数据，样本对象p会落到每棵树中对应的一个叶子节点上，再将多个叶子节点的分数进行加权平均处理，可获得样本对象p的回流预测概率为0.9，因此，回流预测模型认为样本对象p对目标应用程序产生回流行为的可能性很高。

S2023：判断是否读取了样本对象集合中的所有样本对象，若是，执行步骤2024；否则，返回步骤2021。

S2024：基于样本对象集合中各个样本对象的回流预测结果与相应的实际回流结果，调整回流预测模型的模型参数。

基于各个样本对象的回流预测结果与相应的实际回流结果，去优化如公式1所示的目标函数，使其达到最小值。

其中，公式1中的Obj^(t)表征训练中第t棵树要优化的目标函数，n表征样本对象总数，y_i表征第i个样本对象的实际回流结果，即该样本对象是否存在回流行为，

表征第i个样本对象在前(t-1)棵树上的回流预测结果，f_t(x_i)表征第i个样本对象在第t棵树上的回流预测结果，

表征当前模型结构下，第i个样本对象的损失函数，Ω(f_t)为第t棵树的结构复杂度，constant是常数，表征前(t-1)棵树的结构复杂度。

(3)使用回流预测模型：

具体地，针对多个重定向对象，分别执行以下操作：

根据一个重定向对象q的行为标签、行为特征和客户端设备特征，分别获取重定向对象q与预设回流预测模型中各棵分类回归树之间的映射关系；再基于获得的各个映射关系，确定重定向对象q的回流预测概率。

S203：将回流预测概率满足第一设定阈值要求的重定向对象，作为在未来阶段会重新使用目标应用程序的种子对象。

种子对象筛选系统按照回流预测概率的大小从高到低排列各个重定向对象，并将排列在前n％的重定向对象确定为种子对象，其中，n％是多媒体信息投放人员根据产品需求，从5％～100％的阈值区间内选择的第一设定阈值。

但是，在当天筛选出的一组种子对象中，可能出现一部分种子对象已在前一天或者更早之前被选为种子对象，上传到多媒体信息投放平台的情况，为了避免重复上传，节省投放成本，应当剔除掉这部分种子对象。

多媒体信息投放平台为了减轻自身平台的数据承载压力，限制了单次最大数据传输量，所以，种子对象筛选系统的数据发送模块在发送种子对象时，应当采取少量多次的策略，分批次上传种子对象。

种子对象筛选系统在结束当天的种子对象筛选任务之后，重新获取各个原始对象各自的最新的对象数据，再将各最新的原始对象的对象数据作为训练样本，更新回流预测模型的模型参数。

由于基于各最新的原始对象的对象数据，更新回流预测模型的模型参数的步骤，与上述步骤2021～2024的过程相似，在此便不再赘述了。

但是，针对复杂的多媒体信息投放环境，种子对象筛选系统有时难以捕捉到合适的对象数据，此时，多媒体信息投放人员的经验，对于确定复杂的多媒体信息投放环境下的种子对象也至关重要。因此，本申请实施例还提出了一种自定义种子对象筛选规则与回流预测模型相结合的种子对象筛选系统。

参阅图3a示出的结构示意图，种子对象筛选系统包括数据处理模块、自定义规则筛选模块、模型筛选模块、模型监测模块、后期处理模块和数据发送模块。

其中，自定义规则筛选模块通过多媒体信息投放人员设置的种子对象筛选规则，分析每个重定向对象的对象数据，从多个重定向对象中，选取出相应的第一候选对象；

后期处理模块基于自定义规则筛选模块和模型筛选模块的筛选结果，确定相应的种子对象。由于前文已经介绍过数据处理模块、模型筛选模块、模型监测模块和数据发送模块，在此便不再赘述。

在自定义种子对象筛选规则与回流预测模型相结合的种子对象筛选系统中，可以单独使用自定义规则筛选模块或模型筛选模块，确定相应的种子对象，也可以使用回流预测模型辅助多媒体信息投放人员，筛选出回流预测概率高的重定向对象，或者剔除回流预测概率低的重定向对象，有助于提高种子对象的筛选准确率。具体操作如下：

如图3b所示，多媒体信息投放人员根据实际的产品投放需求，确定是否设置自定义的种子对象筛选规则。

若是，则多媒体信息投放人员点击种子对象构造(audience builder)页面上的自定义选项按钮，并根据自身经验结合所推广应用程序的产品需求，在如图3c～3d所示的自定义选项页面上，通过修改自定义选项页面中的SQL语句(SQL Statement)，设置不同的种子对象筛选规则。

例如，多媒体信息投放人员定义7日之内不活跃的对象为重定向对象，定义3日之内不活跃，但7日(含前述3日)内活跃的对象为重定向对象，定义30日内不活跃的对象为沉睡对象，以及多媒体信息投放人员根据目标应用程序的版本发布时间，来定义重定向对象的流失时间区间。

若多媒体信息投放人员未点击种子对象构造页面上的模型筛选按钮，设置相应的模型筛选条件，则单独使用自定义规则筛选模块，确定相应的种子对象。

若多媒体信息投放人员点击模型筛选按钮，并根据产品需求，从图3e所示的模型筛选条件设置页面展示的5％～100％的阈值区间内选择设定阈值，则基于多个第一候选对象与回流预测概率高的第二候选对象，确定相应的种子对象，或基于多个第一候选对象与回流预测概率低的第三候选对象，确定相应的种子对象。

若多媒体信息投放人员未设置自定义的种子对象筛选规则，则根据产品需求，从图3e所示的模型筛选条件设置页面展示的5％～100％的阈值区间内选择设定阈值，以筛选出回流预测概率较高的种子对象。

图3f示出了采用自定义种子对象筛选规则与回流预测模型相结合的种子对象筛选系统，确定种子对象的过程：

S301：基于各个原始对象各自的对象数据，确定多个重定向对象。

S302：将多个重定向对象各自的对象数据输入回流预测模型中，获得多个重定向对象各自的回流预测概率，以及将满足预设种子对象筛选规则的重定向对象，作为相应的第一候选对象。

S303：基于多个第一候选对象和多个重定向对象各自的回流预测概率，确定相应的种子对象。

在结合自定义规则筛选模块和模型筛选模块的筛选结果，确定相应的种子对象的过程中，可采取以下任意一种方式：

(1)基于多个第一候选对象与回流预测概率高的第二候选对象，确定相应的种子对象。

具体地，将回流预测概率满足第二设定阈值要求的重定向对象，作为相应的第二候选对象，并将多个第一候选对象与多个第二候选对象之间共有的重定向对象，作为相应的种子对象。

(2)基于多个第一候选对象与回流预测概率低的第三候选对象，确定相应的种子对象。

将回流预测概率满足第三设定阈值要求的重定向对象，作为相应的第三候选对象，并从多个第一候选对象中剔除与多个第三候选对象之间共有的重定向对象，将剔除后的第一候选对象作为相应的种子对象；其中，第三候选对象的回流预测概率低于第二候选对象的回流预测概率。

在获得相应的种子对象之后，数据发送模块对筛选出的一组种子对象进行去重处理，并将去重后的种子对象，分批次上传到多媒体信息投放平台中。

例如，使用第二种种子对象筛选系统，为网络游戏选择相应的种子对象的流程如图3g所示：

获取曾玩过这款网络游戏的多个原始玩家各自的玩家数据，通过对各玩家数据进行数据预处理，从多个原始玩家中，筛选出最近一段时间不再上线的重定向玩家；

若广告投放人员设置独自使用自定义规则筛选模块或模型筛选模型，则将多个重定向玩家各自的玩家数据发送到相应模块中，经过模块内部处理后，选取出一组种子玩家，再将去重后的种子玩家，分批次上传到海外视频平台中；

若广告投放人员同时使用上述两个模块，则对自定义规则筛选模块输出的第一候选玩家，与回流预测模型输出的回流预测概率高的第二候选玩家进行交叉处理，将共有的重定向玩家作为相应的种子对象，再将去重后的种子玩家，分批次上传到海外视频平台中；或者，

对自定义规则筛选模块输出的第一候选玩家，与回流预测模型输出的回流预测概率低的第三候选玩家进行交叉处理，从多个第一候选对象中剔除与多个第三候选对象之间共有的重定向对象，将剔除后的第一候选对象作为相应的种子对象，再将去重后的种子玩家，分批次上传到海外视频平台中。

与上述方法实施例基于同一发明构思，本申请实施例还提供了一种种子对象的确定装置。参阅图4示出的结构示意图，种子对象的确定装置400可以包括：

数据处理单元401，用于基于各个原始对象各自的对象数据，确定多个重定向对象；其中，原始对象为：在历史阶段，曾使用目标应用程序的对象，重定向对象为：在当前阶段，各个原始对象中不再使用目标应用程序的对象，目标应用程序为：待投放多媒体信息所推广的应用程序；

回流预测单元402，用于基于多个重定向对象各自的对象数据，获得多个重定向对象各自的回流预测概率；

种子对象确定单元403，用于将回流预测概率满足第一设定阈值要求的重定向对象，作为在未来阶段会重新使用目标应用程序的种子对象。

可选的，数据处理单元401用于：

获取各个原始对象各自的对象数据；每个对象数据包括：相应的原始对象的行为数据，以及相应的原始对象用于运行目标应用程序的客户端设备数据；

对获得的各行为数据和各客户端设备数据进行数据预处理，分别获得各个原始对象各自的行为标签、行为特征和客户端设备特征；

基于获得的各行为标签、各行为特征和各客户端设备特征，筛选出在当前阶段中，各个原始对象中不再使用目标应用程序的对象，作为多个重定向对象。

可选的，回流预测单元402用于：

针对多个重定向对象，分别执行以下操作：

根据一个重定向对象的行为标签、行为特征和客户端设备特征，分别获取一个重定向对象与预设回流预测模型中各棵分类回归树之间的映射关系；

基于获得的各个映射关系，确定一个重定向对象的回流预测概率，其中，每棵分类回归树是基于行为标签、行为特征和客户端设备特征中至少一个的子集构建的。

可选的，种子对象的确定装置400还包括模型训练单元404，模型训练单元404通过执行以下操作，训练回流预测模型：

采用循环迭代的方式训练回流预测模型，直至回流预测模型满足迭代停止条件，输出训练完毕的回流预测模型，其中，针对回流预测模型的一轮迭代训练过程如下：

通过回流预测模型每读取样本对象集合中一个样本对象的对象数据，基于一个样本对象的对象数据，分别获取一个样本对象与内部各棵分类回归树之间的映射关系，并基于获得的各个映射关系，确定一个样本对象的回流预测结果；

基于样本对象集合中各个样本对象的回流预测结果与相应的实际回流结果，调整回流预测模型的模型参数。

可选的，在结束当天的种子对象筛选任务之后，模型训练单元404还用于：

重新获取所述各个原始对象各自的最新的对象数据；

将各最新的原始对象的对象数据作为训练样本，更新所述回流预测模型的模型参数。

可选的，在获得多个重定向对象各自的回流预测概率的同时，种子对象确定单元403还用于：

基于多个第一候选对象和多个重定向对象各自的回流预测概率，确定相应的种子对象。

可选的，种子对象确定单元403包括以下任意一种方式：

为了描述的方便，以上各部分按照功能划分为各模块(或单元)分别描述。当然，在实施本申请时可以把各模块(或单元)的功能在同一个或多个软件或硬件中实现。

在介绍了本申请示例性实施方式的种子对象的确定方法和装置之后，接下来，介绍根据本申请的另一示例性实施方式的计算机设备。

所属技术领域的技术人员能够理解，本申请的各个方面可以实现为系统、方法或程序产品。因此，本申请的各个方面可以具体实现为以下形式，即：完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等)，或硬件和软件方面结合的实施方式，这里可以统称为“电路”、“模块”或“系统”。

与上述方法实施例基于同一发明构思，本申请实施例中还提供了一种计算机设备，参阅图5所示，计算机设备500可以至少包括处理器501、以及存储器502。其中，存储器502存储有程序代码，当程序代码被处理器501执行时，使得处理器501执行上述任意一种种子对象的确定方法的步骤。

在一些可能的实施方式中，根据本申请的计算装置可以至少包括至少一个处理器、以及至少一个存储器。其中，存储器存储有程序代码，当程序代码被处理器执行时，使得处理器执行本说明书上述描述的根据本申请各种示例性实施方式的种子对象的确定方法中的步骤。例如，处理器可以执行如图2b中所示的步骤。

下面参照图6来描述根据本申请的这种实施方式的计算装置600。图6的计算装置600仅仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

如图6所示，计算装置600以通用计算装置的形式表现。计算装置600的组件可以包括但不限于：上述至少一个处理单元601、上述至少一个存储单元602、连接不同系统组件(包括存储单元602和处理单元601)的总线603。

总线603表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器、外围总线、处理器或者使用多种总线结构中的任意总线结构的局域总线。

存储单元602可以包括易失性存储器形式的可读介质，例如随机存取存储器(RAM)6021和/或高速缓存存储单元6022，还可以进一步包括只读存储器(ROM)6023。

存储单元602还可以包括具有一组(至少一个)程序模块6024的程序/实用工具6025，这样的程序模块6024包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

计算装置600也可以与一个或多个外部设备604(例如键盘、指向设备等)通信，还可与一个或者多个使得用户能与计算装置600交互的设备通信，和/或与使得该计算装置600能与一个或多个其它计算装置进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口605进行。并且，计算装置600还可以通过网络适配器606与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器606通过总线603与用于计算装置600的其它模块通信。应当理解，尽管图中未示出，可以结合计算装置600使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

与上述方法实施例基于同一发明构思，本申请提供的种子对象的确定方法的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当程序代码在计算机设备上运行时，程序代码用于使计算机设备执行本说明书上述描述的根据本申请各种示例性实施方式的种子对象的确定方法中的步骤，例如，电子设备可以执行如图2b中所示的步骤。

程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

尽管已描述了本申请的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。

显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

Claims

1.一种种子对象的确定方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，所述基于各个原始对象各自的对象数据，确定多个重定向对象，包括：

获取所述各个原始对象各自的对象数据；每个对象数据包括：相应的原始对象的行为数据，以及所述相应的原始对象用于运行所述目标应用程序的客户端设备数据；

对获得的各行为数据和各客户端设备数据进行数据预处理，分别获得所述各个原始对象各自的行为标签、行为特征和客户端设备特征；

基于获得的各行为标签、各行为特征和各客户端设备特征，筛选出在当前阶段中，所述各个原始对象中不再使用所述目标应用程序的对象，作为所述多个重定向对象。

3.如权利要求1所述的方法，其特征在于，所述基于所述多个重定向对象各自的对象数据，获得所述多个重定向对象各自的回流预测概率，包括：

针对所述多个重定向对象，分别执行以下操作：

根据一个重定向对象的行为标签、行为特征和客户端设备特征，分别获取所述一个重定向对象与预设回流预测模型中各棵分类回归树之间的映射关系；

基于获得的各个映射关系，确定所述一个重定向对象的回流预测概率，其中，每棵分类回归树是基于行为标签、行为特征和客户端设备特征中至少一个的子集构建的。

4.如权利要求3所述的方法，其特征在于，通过执行以下操作，训练所述回流预测模型：

采用循环迭代的方式训练所述回流预测模型，直至所述回流预测模型满足迭代停止条件，输出训练完毕的回流预测模型，其中，针对所述回流预测模型的一轮迭代训练过程如下：

通过所述回流预测模型每读取样本对象集合中一个样本对象的对象数据，基于所述一个样本对象的对象数据，分别获取所述一个样本对象与内部各棵分类回归树之间的映射关系，并基于获得的各个映射关系，确定所述一个样本对象的回流预测结果；

基于所述样本对象集合中各个样本对象的回流预测结果与相应的实际回流结果，调整所述回流预测模型的模型参数。

5.如权利要求3所述的方法，其特征在于，在结束当天的种子对象筛选任务之后，还包括：

重新获取所述各个原始对象各自的最新的对象数据；

6.如权利要求1～5任一项所述的方法，其特征在于，在获得所述多个重定向对象各自的回流预测概率的同时，还包括：

7.如权利要求6所述的方法，其特征在于，所述基于多个第一候选对象和所述多个重定向对象各自的回流预测概率，确定相应的种子对象，包括以下任意一种方式：

8.一种种子对象的确定装置，其特征在于，包括：

9.如权利要求8所述的装置，其特征在于，所述数据处理单元用于：

10.如权利要求8所述的装置，其特征在于，所述回流预测单元用于：

针对所述多个重定向对象，分别执行以下操作：

11.如权利要求10所述的装置，其特征在于，所述种子对象的确定装置还包括模型训练单元，所述模型训练单元通过执行以下操作，训练所述回流预测模型：

12.如权利要求10所述的装置，其特征在于，在结束当天的种子对象筛选任务之后，所述模型训练单元还用于：

重新获取所述各个原始对象各自的最新的对象数据；

13.一种计算机设备，其特征在于，其包括处理器和存储器，其中，所述存储器存储有程序代码，当所述程序代码被所述处理器执行时，使得所述处理器执行权利要求1～7中任一项所述方法的步骤。

14.一种计算机可读存储介质，其特征在于，其包括程序代码，当所述程序代码在计算机设备上运行时，所述程序代码用于使所述计算机设备执行权利要求1～7中任一项所述方法的步骤。

15.一种计算机程序产品，其特征在于，包括计算机指令，所述计算机指令被处理器执行时实现权利要求1～7中任一项所述方法的步骤。