CN111242239A

CN111242239A - 一种训练样本选取方法、装置、以及计算机存储介质

Info

Publication number: CN111242239A
Application number: CN202010071181.2A
Authority: CN
Inventors: 袁小燕; 张纪红
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2020-01-21
Filing date: 2020-01-21
Publication date: 2020-06-05
Anticipated expiration: 2040-01-21
Also published as: CN111242239B

Abstract

本申请实施例公开了一种训练样本选取方法、装置、以及计算机存储介质，所述方法涉及人工智能领域中的机器学习方向，所述方法包括：从样本用户集合中确定多个待选取样本用户，根据参考行为特征信息，从多个待选取样本用户中，选取出多个初始样本用户，根据初始样本用户对应的用户行为特征信息，确定第一行为特征信息、第二行为特征信息、以及第三行为特征信息，并从初始样本用户中选取出多个目标样本用户，基于多个目标样本用户、以及目标样本用户对应的用户行为特征信息，构建训练样本，并输出训练样本。利用本方案选取出来的训练样本进行内容推广，可以提高内容推广的精准性。

Description

一种训练样本选取方法、装置、以及计算机存储介质

技术领域

本申请涉及计算机技术领域，具体涉及一种训练样本选取方法、装置、以及计算机存储介质。

背景技术

随着人工智能技术研究和进步，人工智能技术在多个领域展开研究和应用，例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等，相信随着技术的发展，人工智能技术将在更多的领域得到应用，并发挥越来越重要的价值。

随着机器学习和大数据的广泛应用，在各种数据挖掘和推荐领域，都离不开对于训练样本的使用，而训练样本的质量会直接影响到网络模型的训练、以及预测的效果，因此，高质量的训练样本可以提升网络模型预测的精准性。然而，现有技术仅通过用户的行为频次进行训练样本的筛选，利用这种方法获取到的训练样本进行内容推广的精准性不高。

发明内容

本申请实施例提供一种训练样本选取方法、装置、以及计算机存储介质，利用本方案选取出来的训练样本进行内容推广，可以提高内容推广的精准性。

本申请实施例提供一种训练样本选取方法，包括：

从样本用户集合中确定多个待选取样本用户，并获取每个待选取样本用户对应的用户行为特征信息；

根据参考行为特征信息，从所述多个待选取样本用户中，选取出多个初始样本用户，其中，所述初始样本用户对应的用户行为特征信息、与所述参考行为特征信息相匹配；

从所述初始样本用户对应的用户行为特征信息中，确定所述初始样本用户针对目标推广内容的第一行为特征信息，其中，所述目标推广内容为推广内容集合中需要进行推广的推广内容；

获取所述样本用户集合中所有样本用户针对所述目标推广内容的第二行为特征信息、以及所述初始样本用户针对所述推广内容集合中所有推广内容的第三行为特征信息；

基于所述第一行为特征信息、所述第二行为特征信息、以及所述第三行为特征信息，从所述初始样本用户中选取出多个目标样本用户；

基于所述多个目标样本用户、以及所述目标样本用户对应的用户行为特征信息，构建训练样本，并输出所述训练样本。

相应的，本申请实施例还提供一种训练样本选取装置，包括：

获取模块，用于从样本用户集合中确定多个待选取样本用户，并获取每个待选取样本用户对应的用户行为特征信息；

第一选取模块，用于根据参考行为特征信息，从所述多个待选取样本用户中，选取出多个初始样本用户，其中，所述初始样本用户对应的用户行为特征信息与所述参考行为特征信息相匹配；

确定模块，用于从所述初始样本用户对应的用户行为特征信息中，确定所述初始样本用户针对目标推广内容的第一行为特征信息，其中，所述目标推广内容为推广内容集合中需要进行推广的推广内容；

信息获取模块，用于获取所述样本用户集合中所有样本用户针对所述目标推广内容的第二行为特征信息、以及所述初始样本用户针对所述推广内容集合中所有推广内容的第三行为特征信息；

第二选取模块，用于基于所述第一行为特征信息、所述第二行为特征信息、以及所述第三行为特征信息，从所述初始样本用户中选取出多个目标样本用户；

输出模块，用于基于所述多个目标样本用户、以及所述目标样本用户对应的用户行为特征信息，构建训练样本，并输出所述训练样本。

可选的，在一些实施例中，所述第一选取模块可以包括第一确定子模块、提取子模块和第一选取子模块，如下：

第一确定子模块，用于确定需要进行推广的目标推广内容所对应的参考特征文本；

提取子模块，用于从所述参考特征文本中，提取出多个参考行为特征信息；

第一选取子模块，用于根据所述多个参考行为特征信息，从所述多个待选取样本用户中，选取出所述初始样本用户。

可选的，在一些实施例中，所述第一选取模块可以包括第二选取子模块、第二确定子模块和第三选取子模块，如下：

第二选取子模块，用于基于所述用户行为特征信息与所述参考行为特征信息之间的匹配关系，从所述多个待选取样本用户中，选取出多个参考信息匹配样本用户；

第二确定子模块，用于基于每个参考信息匹配样本用户对应的用户行为特征信息，确定每个参考信息匹配样本用户对应的用户兴趣程度信息；

第三选取子模块，用于基于所述用户兴趣程度信息，从所述多个参考信息匹配样本用户中，选取出所述初始样本用户。

可选的，在一些实施例中，所述第二选取子模块可以包括第三确定子模块、第四选取子模块和第四确定子模块，如下：

第三确定子模块，用于基于每个待选取样本用户对应的用户行为特征信息，确定每个用户行为场景对应的多个待选取样本用户；

第四选取子模块，用于基于所述用户行为特征信息与所述参考行为特征信息之间的匹配关系，从所述每个用户行为场景对应的多个待选取样本用户中，选取出所述每个用户行为场景对应的参考信息匹配样本用户；

第四确定子模块，用于基于所述每个用户行为场景对应的参考信息匹配样本用户，确定多个参考信息匹配样本用户。

则此时，所述第四选取子模块，具体可以用于基于所述用户行为特征信息与所述正向参考特征信息之间的匹配关系，从所述每个用户行为场景对应的多个待选取样本用户中，选取出所述每个用户行为场景对应的正向匹配样本用户，基于所述用户行为特征信息与所述负向参考特征信息之间的匹配关系，从所述每个用户行为场景对应的正向匹配样本用户中，选取出所述每个用户行为场景对应的参考信息匹配样本用户。

可选的，在一些实施例中，所述第二选取模块可以包括第五确定子模块、第六确定子模块和第五选取子模块，如下：

第五确定子模块，用于基于所述第一行为特征信息、以及所述第二行为特征信息，确定所述初始样本用户针对所述目标推广内容的绝对关注程度信息；

第六确定子模块，用于基于所述第一行为特征信息、以及所述第三行为特征信息，确定所述初始样本用户针对所述目标推广内容的相对关注程度信息；

第五选取子模块，用于基于所述绝对关注程度信息、以及所述相对关注程度信息，从所述初始样本用户中选取出多个目标样本用户。

则此时，所述第五选取子模块，具体可以用于从所述初始样本用户中，确定所述绝对关注程度信息满足绝对关注程度条件的绝对关注样本用户，基于所述相对关注程度信息，从所述绝对关注样本用户中选取出所述目标样本用户。

则此时，所述输出模块，具体可以用于基于所述多个目标样本用户、以及所述目标样本用户对应的用户行为特征信息，构建正训练样本，基于所述多个目标样本用户、以及所述样本用户集合，构建负训练样本，基于所述正训练样本、以及所述负训练样本，构建训练样本，输出所述训练样本。

此外，本申请实施例还提供一种计算机存储介质，所述计算机存储介质存储有多条指令，所述指令适于处理器进行加载，以执行本申请实施例提供的任一种训练样本选取方法中的步骤。

本申请实施例可以从样本用户集合中确定多个待选取样本用户，并获取每个待选取样本用户对应的用户行为特征信息，根据参考行为特征信息，从多个待选取样本用户中，选取出多个初始样本用户，其中，初始样本用户对应的用户行为特征信息、与参考行为特征信息相匹配，从初始样本用户对应的用户行为特征信息中，确定初始样本用户针对目标推广内容的第一行为特征信息，其中，目标推广内容为推广内容集合中需要进行推广的推广内容，获取样本用户集合中所有样本用户针对目标推广内容的第二行为特征信息、以及初始样本用户针对推广内容集合中所有推广内容的第三行为特征信息，基于第一行为特征信息、第二行为特征信息、以及第三行为特征信息，从初始样本用户中选取出多个目标样本用户，基于多个目标样本用户、以及目标样本用户对应的用户行为特征信息，构建训练样本，并输出训练样本。利用本方案选取出来的训练样本进行内容推广，可以提高内容推广的精准性。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的训练样本选取系统的场景示意图；

图2是本申请实施例提供的训练样本选取方法的第一流程图；

图3是本申请实施例提供的训练样本选取方法的第二流程图；

图4是本申请实施例提供的训练样本选取的方法结构示意图；

图5是本申请实施例提供的训练样本多次筛选示意图；

图6是本申请实施例提供的训练样本选取装置的结构示意图；

图7是本申请实施例提供的电子设备的结构示意图。

具体实施方式

请参照图式，其中相同的组件符号代表相同的组件，本申请的原理是以实施在一适当的运算环境中来举例说明。以下的说明是基于所例示的本申请具体实施例，其不应被视为限制本申请未在此详述的其它具体实施例。

在以下的说明中，本申请的具体实施例将参考由一部或多部计算机所执行的步骤及符号来说明，除非另有述明。因此，这些步骤及操作将有数次提到由计算机执行，本文所指的计算机执行包括了由代表了以一结构化型式中的数据的电子信号的计算机处理单元的操作。此操作转换该数据或将其维持在该计算机的内存系统中的位置处，其可重新配置或另外以本领域测试人员所熟知的方式来改变该计算机的运作。该数据所维持的数据结构为该内存的实体位置，其具有由该数据格式所定义的特定特性。但是，本申请原理以上述文字来说明，其并不代表为一种限制，本领域测试人员将可了解到以下所述的多种步骤及操作亦可实施在硬件当中。

本文所使用的术语“模块”可看作为在该运算系统上执行的软件对象。本文所述的不同组件、模块、引擎及服务可看作为在该运算系统上的实施对象。而本文所述的装置及方法可以以软件的方式进行实施，当然也可在硬件上进行实施，均在本申请保护范围之内。

本申请中的术语“第一”、“第二”和“第三”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或模块的过程、方法、系统、产品或设备没有限定于已列出的步骤或模块，而是某些实施例还包括没有列出的步骤或模块，或某些实施例还包括对于这些过程、方法、产品或设备固有的其它步骤或模块。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

本申请实施例提供一种训练样本选取方法、装置、以及计算机存储介质。具体地，本申请实施例提供适用于电子设备的训练样本选取方法。其中，电子设备可以为终端等设备，该终端可以为手机、平板电脑、笔记本电脑、个人计算机、智能电视、盒子等设备；其中，该电子设备还可以为服务器等设备，该服务器可以是单台服务器，也可以是由多个服务器组成的服务器集群。

比如，训练样本选取装置可以集成在终端或服务器中。

在本申请实施例中，训练样本选取方法可以由终端或者服务器单独执行，也可以由终端和服务器共同执行完成。

参考图1，比如，电子设备可以用于从样本用户集合中确定多个待选取样本用户，并获取每个待选取样本用户对应的用户行为特征信息，根据参考行为特征信息，从多个待选取样本用户中，选取出多个初始样本用户，其中，初始样本用户对应的用户行为特征信息、与参考行为特征信息相匹配，从初始样本用户对应的用户行为特征信息中，确定初始样本用户针对目标推广内容的第一行为特征信息，其中，目标推广内容为推广内容集合中需要进行推广的推广内容，获取样本用户集合中所有样本用户针对目标推广内容的第二行为特征信息、以及初始样本用户针对推广内容集合中所有推广内容的第三行为特征信息，基于第一行为特征信息、第二行为特征信息、以及第三行为特征信息，从多个初始样本用户中选取出多个目标样本用户，基于多个目标样本用户、以及目标样本用户对应的用户行为特征信息，构建训练样本，并输出训练样本。

其中，另一个实施例中，还可以由终端触发服务器获取样本用户集合，可选的，当终端检测到针对样本用户集合的集合获取操作时，向服务器发送针对样本用户集合的集合获取请求。

服务器，可以针对来自终端的集合获取请求，从样本用户集合中确定多个待选取样本用户，并获取每个待选取样本用户对应的用户行为特征信息，根据参考行为特征信息，从多个待选取样本用户中，选取出多个初始样本用户，其中，初始样本用户对应的用户行为特征信息、与参考行为特征信息相匹配，从初始样本用户对应的用户行为特征信息中，确定初始样本用户针对目标推广内容的第一行为特征信息，其中，目标推广内容为推广内容集合中需要进行推广的推广内容，获取样本用户集合中所有样本用户针对目标推广内容的第二行为特征信息、以及初始样本用户针对推广内容集合中所有推广内容的第三行为特征信息，基于第一行为特征信息、第二行为特征信息、以及第三行为特征信息，从多个初始样本用户中选取出多个目标样本用户，基于多个目标样本用户、以及目标样本用户对应的用户行为特征信息，构建训练样本，并输出训练样本。

终端可以用于在接收到训练样本时，存储该训练样本。

可以理解的是，在另一个实施例中，训练样本选取方法中的步骤还可以由终端执行，训练样本选取装置可以以客户端的形式集成在终端中，该客户端可以进行样本选取的操作。

本申请实施例提供的训练样本选取方法涉及人工智能领域中的机器学习方向。本申请实施例可以通过不断地对训练样本集合进行筛选，从而获取到能够应用于机器学习的训练样本。

其中，人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。其中，人工智能软件技术主要包括计算机视觉技术、机器学习/深度学习等方向。

其中，机器学习(Machine Learning,ML)是一门涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科的多领域交叉学科。专门研究计算机怎样模拟人类的学习行为、或者实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。

以下分别进行详细说明。需说明的是，以下实施例的描述顺序不作为对实施例优选顺序的限定。

本申请实施例将从训练样本选取装置的角度进行描述，该训练样本选取装置具体可以集成在终端，也可以集成在服务器中。

本申请实施例提供的一种训练样本选取方法，该方法可以由服务器的处理器执行，如图2所示，该训练样本选取方法的具体流程可以如下：

201、从样本用户集合中确定多个待选取样本用户，并获取每个待选取样本用户对应的用户行为特征信息。

其中，样本用户集合可以为包括多个样本用户的集合，该样本用户集合中的多个样本用户，可以为已经收集到用户行为的多个可以作为样本的用户。

其中，待选取样本用户可以为需要从中选取出目标样本用户的用户集合，该待选取样本用户可以来自样本用户集合，并且经过多次筛选，能够得到较为准确的目标样本用户。

其中，用户行为特征信息可以为具体的样本用户在历史进行过的行为所对应的特征信息，每个样本用户都可以对应多个用户行为特征信息，这些用户行为特征信息可以来自多个用户行为场景、以及多个数据源头，比如，可以对样本用户A在社交场景、资讯场景、搜索场景、电商场景、应用程序场景、广告场景等多个用户行为场景下的多个历史行为进行采集，并根据这些采集到的行为所对应的特征信息，构建样本用户A对应的用户行为特征信息，并且，每个用户行为场景都可以对应着若干数据源头。

在实际应用中，比如，如图5所示，可以从样本用户集合里的多个样本用户中，选取出若干样本用户作为待选取样本用户，并且，从社交场景、资讯场景、搜索场景、电商场景、应用程序场景、广告场景等多个用户行为场景下，获取每个待选取样本用户对应的用户行为特征信息，然后，针对每个待选取样本用户进行分数据源分行为地建模。

202、根据参考行为特征信息，从多个待选取样本用户中，选取出多个初始样本用户。

其中，参考行为特征信息可以为能够作为参考的特征信息，该参考行为特征信息可以表示为关键词的形式，比如，当需要推广某奶粉广告时，需要将具有购买过奶粉或者很可能购买奶粉的特点的多个用户确定为训练样本，此时，该参考行为特征信息可以为“奶粉”、“宝宝”等与该奶粉广告相关的词语，根据这些参考行为特征信息，能够找到具有相应特点的多个样本用户。

在实际应用中，比如，当需要推广某品牌的奶粉广告时，可以确定此时需要获取到的样本用户，应当具备购买过奶粉或者很可能购买奶粉的特点，因此，参考行为特征信息可以确定为“奶粉”、“宝宝”等相关词语。然后，可以根据多个参考行为特征信息，从待选取样本用户中，选取出多个初始样本用户，其中，这些初始样本用户的用户行为特征信息需要与参考行为特征信息相匹配，如在电商场景下，购买过奶粉的行为可以认为是与“奶粉”、“宝宝”等词语相匹配的行为，又如应用软件场景下，下载过母婴相关APP的行为也可以认为是与“奶粉”、“宝宝”等词语相匹配的行为，等等。

在一实施例中，还可以从事先确定好的语义表达中，提取出相应的参考行为特征信息。具体地，步骤“根据参考行为特征信息，从所述多个待选取样本用户中，选取出多个初始样本用户”，可以包括：

确定需要进行推广的目标推广内容所对应的参考特征文本；

从所述参考特征文本中，提取出多个参考行为特征信息；

根据所述多个参考行为特征信息，从所述多个待选取样本用户中，选取出多个初始样本用户。

在实际应用中，比如，当需要推广某品牌的奶粉广告时，可以将该品牌的奶粉广告确定为目标推广内容，并获取该目标推广内容对应的参考特征文本，该参考特征文本可以为与该品牌的奶粉广告相关的文本，如广告内容文本、与该奶粉广告相关的文章，等等。获取到参考特征文本后，可以对该参考特征文本进行关键词提取，提取出多个关键词作为参考行为特征信息。然后，从多个待选取样本用户中，选取出行为和参考行为特征信息相匹配的多个初始样本用户。

在一实施例中，对参考特征文本进行关键词提取的方法可以有多种，比如，可以利用TF-IDF(term frequency–inverse document frequency)算法、TextRank算法、主题模型算法等方法，获取多个参考行为特征信息。

在一实施例中，可以通过丰富参考行为特征信息，以提升训练样本获取的准确性，其中，获取参考行为特征信息的方法不仅限于从参考特征文本中提取，还可以根据实际情况的具体需求，确定出多个满足条件的关键词。如，当目标推广内容为奶粉广告时，仅从奶粉广告中提取关键词未必准确，还可以相应地添加“妈妈”、“母婴APP”等关键词。

在一实施例中，获取到多个关键词形式的参考行为特征信息之后，还可以对参考行为特征信息进行扩展，也即获取与参考行为特征信息含义相同或者相关的关键词，以便丰富参考行为特征信息，比如，获取到多个关键词形式的参考行为特征信息之后，还可以利用同义词、相关词、缩略词等对参考行为特征信息进行丰富。

在一实施例中，可以首先利用参考行为特征信息，从多个待选取样本用户中，选取出多个参考信息匹配样本用户，再利用样本用户对应的用户兴趣程度信息，从多个参考信息匹配样本用户中，选取出多个初始样本用户，实现对待选取样本用户的多次筛选，以提升训练样本的质量。具体地，步骤“根据参考行为特征信息，从所述多个待选取样本用户中，选取出多个初始样本用户”，可以包括：

基于所述用户行为特征信息与所述参考行为特征信息之间的匹配关系，从所述多个待选取样本用户中，选取出多个参考信息匹配样本用户；

基于每个参考信息匹配样本用户对应的用户行为特征信息，确定每个参考信息匹配样本用户对应的用户兴趣程度信息；

基于所述用户兴趣程度信息，从所述多个参考信息匹配样本用户中，选取出多个初始样本用户。

在实际应用中，比如，如图5所示，从多个待选取样本用户中，选取出用户行为特征信息与参考行为特征信息相匹配的参考信息匹配样本用户后，可以根据每个参考信息匹配样本用户对应的多个用户行为特征信息，确定出每个参考信息匹配样本用户对应的用户兴趣程度信息，如，可以通过参考信息匹配样本用户在各个用户行为场景下的行为频次、行为时长、以及对不同用户行为场景分配的权重，计算得到每个参考信息匹配样本用户对应的用户兴趣度分值，该用户兴趣度分值可以确定为用户兴趣程度信息。然后，可以根据用户兴趣度分值，从多个参考信息匹配样本用户中，选取top N个样本用户，作为初始样本用户。

在一实施例中，根据每个参考信息匹配样本用户对应的多个用户行为特征信息，确定每个参考信息匹配样本用户对应的用户兴趣程度信息的方法可以有多种，比如，可以从每个参考信息匹配样本用户对应的多个用户行为特征信息中，选取不同类型的特征信息参与运算，如可以获取在各个用户行为场景下的行为频次、行为时长、以及对不同用户行为场景分配的权重等一项或多项信息，并根据获取到的信息，确定出每个参考信息匹配样本用户对应的用户兴趣程度信息。

在一实施例中，由于用户行为特征信息针对多个用户行为场景，因此，可以针对各个用户行为场景，挖掘合适的样本用户。具体地，步骤“基于所述用户行为特征信息与所述参考行为特征信息之间的匹配关系，从所述多个待选取样本用户中，选取出多个参考信息匹配样本用户”，可以包括：

基于每个待选取样本用户对应的用户行为特征信息，确定每个用户行为场景对应的多个待选取样本用户；

基于所述用户行为特征信息与所述参考行为特征信息之间的匹配关系，从每个用户行为场景对应的多个待选取样本用户中，选取出每个用户行为场景对应的参考信息匹配样本用户；

基于每个用户行为场景对应的参考信息匹配样本用户，确定多个参考信息匹配样本用户。

在实际应用中，比如，每个待选取样本用户都对应多个用户行为特征信息，这些用户行为特征信息来自3个不同的用户行为场景：场景1、场景2、以及场景3，此时，可以根据多个待选取样本用户对应的多个用户行为特征信息，构建出针对不同用户行为场景的数据结构，也即，确定出场景1对应的多个待选取样本用户、场景2对应的多个待选取样本用户、以及场景3对应的多个待选取样本用户，其中，不同场景下对应的样本用户群体不同。

然后，可以根据用户行为特征信息，在每个用户行为场景下挖掘与参考行为特征信息匹配的样本用户，并获取到每个用户行为场景对应的参考信息匹配样本用户。此时，每个用户行为场景下都对应着多个参考信息匹配样本用户，并且，不同场景下对应的样本用户群体不同。那么，可以将每个用户行为场景下对应选取出的样本用户，都确定为参考信息匹配样本用户，也即，只要在一个用户行为场景下被选取出来的用户，就会被确定为参考信息匹配样本用户，而不论该样本用户是否在其他用户行为场景下被选取出来。

在一实施例中，参考行为特征信息可以包括正向参考特征信息、以及负向参考特征信息，正向参考特征信息可以用来筛选符合条件的样本用户，而负向参考特征信息可以用来删除噪声样本用户。具体地，步骤“基于所述用户行为特征信息与所述参考行为特征信息之间的匹配关系，从每个用户行为场景对应的多个待选取样本用户中，选取出每个用户行为场景对应的参考信息匹配样本用户”，可以包括：

基于所述用户行为特征信息与所述正向参考特征信息之间的匹配关系，从每个用户行为场景对应的多个待选取样本用户中，选取出每个用户行为场景对应的正向匹配样本用户；

基于所述用户行为特征信息与所述负向参考特征信息之间的匹配关系，从每个用户行为场景对应的正向匹配样本用户中，选取出每个用户行为场景对应的参考信息匹配样本用户。

其中，正向参考特征信息可以为能够表征目标推广内容的特征信息，比如，目标推广内容为某品牌奶粉广告时，正向参考特征信息可以为“奶粉”、“宝宝”，等等。

其中，负向参考特征信息可以为能够混淆目标推广内容的特征信息，比如，目标推广内容为某品牌奶粉广告时，正向参考特征信息可以为“宝宝”，负向参考特征信息可以为“海绵宝宝”，也即该负向参考特征信息也与目标推广内容相关，但是利用该负向参考特征信息不能够获取到实际需要的训练样本。

在实际应用中，可以确定出多个正向参考特征信息、以及多个负向参考特征信息，然后在每个用户行为场景下，挖掘与正向参考特征信息相匹配的行为所对应的样本用户，得到多个正向匹配样本用户。然后通过反复抽样统计分析，从多个正向匹配样本用户中，剔除与负向参考特征信息相匹配的行为所对应的样本用户，得到每个用户行为场景对应的参考信息匹配样本用户。此时，负向参考特征信息的作用在于降噪，可以保证参考信息匹配样本用户是真实需要获取到的样本用户，而不是由于歧义或者多义获取到的噪声样本用户。

其中，通过获取每个待选取样本用户针对多个用户行为场景的用户行为特征信息，并根据用户行为特征信息进行训练样本的挖掘，有效地解决了传统方法中由于依赖人工标注而导致的样本量小的问题。同时，针对多个用户行为场景进行用户行为特征信息的获取，可以解决样本有偏的问题，也即，由于有限或者单一的用户行为，只能代表其在特定场景下的兴趣，比如，某用户多次浏览关于某方面的信息，未必代表该用户对这方面的信息真的感兴趣，而有可能是由于特定时间下，该用户需要了解这方面的内容，因此会导致样本有偏，然而综合考虑多个场景、以及相应场景下用户所进行的行为，可以有效地解决样本有偏的问题。

203、从初始样本用户对应的用户行为特征信息中，确定初始样本用户针对目标推广内容的第一行为特征信息。

在实际应用中，比如，可以从推广内容集合中确定需要进行推广的奶粉广告，并将该奶粉广告确定为目标推广内容，然后，从每个初始样本用户对应的用户行为特征信息中，获取用户对该奶粉广告的标记行为，该标记行为可以为用户点击该奶粉广告页面的行为、用户通过电商购买该品牌奶粉的行为，等等。并根据该标记行为，确定出每个初始样本用户针对目标推广内容的第一行为特征信息。

比如，可以利用X_i表示初始样本用户，利用j表示目标推广内容，并根据初始样本用户对应的用户行为特征信息，确定出初始样本用户X_i在广告j上的点击率

其中，该点击率

可以确定为初始样本用户X_i针对目标推广内容j的第一行为特征信息。

其中，CTR(Click-Through-Rate，点击通过率)，指的是网络广告(图片广告、文字广告、关键词广告、排名广告、视频广告)等的点击到达率，可以表示为对广告的实际点击次数与广告展现量之间的比值。

204、获取样本用户集合中所有样本用户针对目标推广内容的第二行为特征信息、以及初始样本用户针对推广内容集合中所有推广内容的第三行为特征信息。

在实际应用中，比如，样本用户集合中包括N个样本用户，可以获取样本用户集合中所有样本用户在广告j上的点击率

其中，点击率

可以确定为样本用户集合中所有样本用户针对目标推广内容j的第二行为特征信息。还可以获取初始样本用户X_i在推广内容集合中所有推广内容上的点击率

其中，点击率

可以确定为初始样本用户针对推广内容集合中所有推广内容的第三行为特征信息。

205、基于第一行为特征信息、第二行为特征信息、以及第三行为特征信息，从多个初始样本用户中选取出多个目标样本用户。

在实际应用中，由于仅利用用户兴趣程度信息进行训练样本的选取，可能会将泛兴趣用户或者进行偶然行为的用户考虑在内，比如，某些用户可能对多种类型的推广内容都有较高的兴趣，此时，如果仅根据用户兴趣程度信息进行筛选的话，无法排除这部分泛兴趣用户。因此，为了保证训练样本的纯净度，可以分别衡量出样本用户对应的绝对关注程度信息、以及相对关注程度信息。

比如，如图5所示，可以根据第一行为特征信息、以及第二行为特征信息，获取到每个初始样本用户对应的绝对关注程度信息，该绝对关注程度信息可以表示每个初始样本用户对目标推广内容的关注程度、相对于样本用户集合中所有样本用户对目标推广内容的关注程度的显著程度。还可以根据第一行为特征信息、以及第三行为特征信息，获取到每个初始样本用户对应的相对关注程度信息，该相对关注程度信息可以表示每个初始样本用户对目标推广内容的关注程度、相对于该初始样本用户对推广内容集合中所有推广内容的关注程度的显著程度。并根据绝对关注程度信息、以及相对关注程度信息，从多个初始样本用户中选取出多个目标样本用户。

在一实施例中，具体地，步骤“基于所述第一行为特征信息、所述第二行为特征信息、以及所述第三行为特征信息，从多个初始样本用户中选取出多个目标样本用户”，可以包括：

基于所述第一行为特征信息、以及所述第二行为特征信息，确定所述初始样本用户针对所述目标推广内容的绝对关注程度信息；

基于所述第一行为特征信息、以及所述第三行为特征信息，确定所述初始样本用户针对所述目标推广内容的相对关注程度信息；

基于所述绝对关注程度信息、以及所述相对关注程度信息，从多个初始样本用户中选取出多个目标样本用户。

在实际应用中，比如，获取到初始样本用户X_i针对目标推广内容j的第一行为特征信息

以及样本用户集合中所有样本用户针对目标推广内容j的第二行为特征信息

之后，可以基于第一行为特征信息、以及第二行为特征信息，确定初始样本用户X_i针对目标推广内容j的绝对关注程度信息，其中，绝对关注程度信息的计算公式可以为：

该绝对关注程度信息衡量的是初始样本用户X_i与样本用户集合中所有样本用户相比，在目标推广内容j上效果的优劣，绝对关注程度信息对应的数值越大，表示初始样本用户X_i针对该目标推广内容j的效果，比样本用户集合中所有样本用户针对该目标推广内容j的效果要好。其中，当绝对关注程度信息的数值大于1时，可以表示初始样本用户X_i在目标推广内容j上的效果，优于样本用户集合中的样本用户。

获取到初始样本用户X_i针对目标推广内容j的第一行为特征信息

以及初始样本用户针对推广内容集合中所有推广内容的第三行为特征信息

之后，可以基于第一行为特征信息、以及第三行为特征信息，确定初始样本用户针对目标推广内容j的相对关注程度信息，其中，相对关注程度信息的计算公式可以为：

该相对关注程度信息衡量的是对初始样本用户X_i而言，针对目标推广内容j的效果相比与针对推广内容集合中所有推广内容的效果的优劣，相对关注程度信息的数值越大，代表初始样本用户X_i在目标推广内容j上的效果比其他推广内容的效果要好。其中，相对关注程度信息的数值大于1时，可以表示初始样本用户X_i针对目标推广内容j的效果，优于初始样本用户X_i针对推广内容集合的效果。

获取到绝对关注程度信息、以及相对关注程度信息之后，可以根据绝对关注程度信息、以及相对关注程度信息，从多个初始样本用户中选取出多个目标样本用户。

在一实施例中，由于绝对关注程度信息表达的是初始样本用户相对于整体样本用户的效果，因此，可以定义针对绝对关注程度信息的绝对关注程度条件，从而保证选取出的样本用户针对目标推广内容的效果优于整体用户。具体地，步骤“基于所述绝对关注程度信息、以及所述相对关注程度信息，从多个初始样本用户中选取出多个目标样本用户”，可以包括：

从多个初始样本用户中，确定所述绝对关注程度信息满足绝对关注程度条件的绝对关注样本用户；

基于所述相对关注程度信息，从多个绝对关注样本用户中选取出多个目标样本用户。

在实际应用中，比如，由于绝对关注程度信息表达的是初始样本用户相对于整体样本用户的效果，因此，可以定义绝对关注程度条件为绝对关注程度信息大于1，也即，当绝对关注程度信息大于1时，满足绝对关注程度条件；当绝对关注程度信息不大于1时，不满足绝对关注程度条件。获取到初始样本用户对应的绝对关注程度信息后，可以将满足绝对关注程度条件的用户，确定为绝对关注样本用户。并确定每个绝对关注样本用户对应的相对关注程度信息，相对关注程度信息的数值越大，表明该样本用户在目标推荐内容上的显著程度越高，也即能够作为训练样本的概率越大，因此，可以根据相对关注程度信息的数值，对多个绝对关注样本用户进行排序，并从中选取出多个目标样本用户。

在一实施例中，根据绝对关注程度条件选取出多个绝对关注样本用户后，还可以计算每个绝对关注样本用户对应的联合分布数值，该联合分布函数的公式可以为：

并根据计算得到的联合分布数值，对多个绝对关注样本用户进行排序，从中选取出多个目标样本用户。

在一实施例中，由于针对广告而言，用户存在着点击行为和转化行为，其中，点击行为可以为用户浏览过该广告，而转化行为可以为用户通过点击广告进入推广网站。由于二者所达到的效果不同，因此也可以分开进行考虑。比如，可以针对初始样本用户的点击行为，确定点击行为对应的点击率，并针对初始样本用户的转化行为，确定转化行为对应的转化率，然后根据点击率、转化率、以及各自对应的权重，计算初始样本用户针对目标推广内容j的第一行为特征信息，这样得到的第一行为特征信息更准确。并且，第二行为特征信息、以及第三行为特征信息也可以按照上述方法进行表示。

其中，本申请的训练样本选取方法利用了联合建模，也即利用绝对关注程度信息、以及相对关注程度信息，从多个初始样本用户中选取出多个目标样本用户。通过这种联合建模的方法，可以从纵向和横向两个维度上，对具体的样本用户作为训练样本的优劣程度进行衡量。利用本申请的训练样本选取方法进行训练样本的选取，一方面可以解决由于人工标注和有限行为所带来的训练样本量级有限的问题，另一方面，还可以利用绝对关注程度信息、以及相对关注程度信息，有效地对训练样本的纯净度进行衡量。

206、基于多个目标样本用户、以及目标样本用户对应的用户行为特征信息，构建训练样本，并输出训练样本。

在实际应用中，比如，获取到多个目标样本用户后，可以利用目标样本用户对应的用户行为特征信息，对目标样本用户进行标注，并根据标注后的用户信息，构建训练样本。然后，可以将训练样本输出，用于网络模型的训练。

在一实施例中，为了提升训练样本的质量，还可以获取一部分样本用户作为负训练样本。具体地，步骤“基于所述多个目标样本用户、以及所述目标样本用户对应的用户行为特征信息，构建训练样本，并输出所述训练样本”，可以包括：

基于所述多个目标样本用户、以及所述目标样本用户对应的用户行为特征信息，构建正训练样本；

基于所述多个目标样本用户、以及所述样本用户集合，构建负训练样本；

基于所述正训练样本、以及所述负训练样本，构建训练样本；

输出所述训练样本。

在实际应用中，比如，获取到多个目标样本用户后，由于这些样本用户对应的用户行为特征信息，都与参考行为特征信息相匹配，因此，选取出的多个目标样本用户可以作为正样本，并基于多个目标样本用户，构建正训练样本。然后可以在样本用户集合中排除目标样本用户，得到排除后样本用户集合，并在该排除后样本用户集合中，选取一定规模的样本用户作为负样本，并基于多个负样本，构建负训练样本。然后可以根据正训练样本和负训练样本构建得到训练样本，利用该训练样本进行后续的内容推广步骤，可以使得内容推广的精准度更高。

由上可知，本申请实施例可以从样本用户集合中确定多个待选取样本用户，并获取每个待选取样本用户对应的用户行为特征信息，根据参考行为特征信息，从多个待选取样本用户中，选取出多个初始样本用户，其中，初始样本用户对应的用户行为特征信息、与参考行为特征信息相匹配，从初始样本用户对应的用户行为特征信息中，确定初始样本用户针对目标推广内容的第一行为特征信息，其中，目标推广内容为推广内容集合中需要进行推广的推广内容，获取样本用户集合中所有样本用户针对目标推广内容的第二行为特征信息、以及初始样本用户针对推广内容集合中所有推广内容的第三行为特征信息，基于第一行为特征信息、第二行为特征信息、以及第三行为特征信息，从多个初始样本用户中选取出多个目标样本用户，基于多个目标样本用户、以及目标样本用户对应的用户行为特征信息，构建训练样本，并输出训练样本。该方案可以通过多源行为挖掘，获取到用户在多个用户行为场景下的用户行为特征信息，以解决样本有偏的问题。同时，利用正向参考特征信息、以及负向参考特征信息，一方面保证了训练样本的准确性，另一方面保证去除了噪声样本。并且，利用联合建模，分别获取样本用户对应的绝对关注程度信息、以及相对关注程度信息，从多个维度上衡量样本用户作为训练样本的优劣程度。利用本方案选取出来的训练样本进行内容推广，不仅解决了训练样本量级有限的问题，并且可以提升训练样本的纯净度，利用这样的训练样本进行后续步骤，可以有效地提高内容推广的精准性。

根据前面实施例所描述的方法，以下将以该训练样本选取装置具体集成在电子设备举例作进一步详细说明。

参考图3，本申请实施例的训练样本选取方法的具体流程可以如下：

301、电子设备获取多个待选取样本用户对应的用户行为特征信息。

在实际应用中，比如，如图4所示，电子设备可以根据待选取样本用户在多个数据源头、多个用户行为场景下的行为数据，构建每个待选取样本用户对应的用户行为特征信息。其中，多个用户行为场景可以包括社交场景、资讯场景、搜索场景、电商场景、应用软件场景、广告场景，等等。以实现对每个待选取样本用户分数据源、分行为地进行建模。

302、电子设备确定表征训练样本的正向语义词、以及负向过滤词。

在实际应用中，比如，电子设备可以确定针对需要获取到的训练样本的语义表达，然后对该语义表达进行提取，提取出能够表征训练样本的正向语义词、以及为了剔除噪声样本的负向过滤词，其中，负向过滤词可以用于降噪，以便保证挖掘出的训练样本，不是由于歧义或者多义而带来的噪声样本。

303、电子设备根据正向语义词、以及负向过滤词，对待选取样本用户分源进行挖掘匹配，得到多个参考信息匹配样本用户。

在实际应用中，比如，电子设备可以根据多个待选取样本用户对应的用户行为特征信息，构建每个用户行为场景对应的待选取样本用户，并从每个用户行为场景对应的待选取样本用户中，挖掘出用户行为特征信息与正向语义词匹配的正向匹配样本用户。并且通过反复抽样统计分析，从正向匹配样本用户中剔除与负向过滤词匹配的样本用户，得到多个参考信息匹配样本用户。

304、电子设备根据用户行为特征信息，获取每个参考信息匹配样本用户对应的用户兴趣度分值。

在实际应用中，比如，电子设备可以利用每个参考信息匹配样本用户，在各个用户行为场景下的行为频次、行为时间、以及不同用户行为场景对应的行为权重，对每个参考信息匹配样本用户进行综合建模，得到每个参考信息匹配样本用户对应的用户兴趣度分值。

305、电子设备根据用户兴趣度分值，从参考信息匹配样本用户中选取多个初始样本用户。

在实际应用中，比如，电子设备获取到每个参考信息匹配样本用户对应的用户兴趣度分值之后，可以根据用户兴趣度分值的大小，选取出用户兴趣度分值最大的N个样本用户，作为初始样本用户。

306、电子设备获取初始样本用户针对目标广告的绝对显著性数值。

在实际应用中，比如，电子设备可以获取每个初始样本用户在目标广告j上的点击率

以及样本用户集合中所有样本用户在目标广告j上的点击率

并根据这两种点击率的比值，获取初始样本用户针对目标广告的绝对显著性数值

该绝对显著性数值表示初始样本用户和样本集合中所有样本用户相比，在目标广告j上效果的优劣程度。当绝对显著性数值大于1时，可以表示初始样本用户在目标广告j上的效果优于样本集合中的所有样本用户。其中，绝对显著性数值越高，表明初始样本用户在目标广告j上的效果和样本集合中的所有样本用户相比越好。

307、电子设备获取初始样本用户针对目标广告的相对显著性数值。

以及每个初始样本用户针对广告集合中所有广告的点击率

并根据这两种点击率的比值，获取初始样本用户针对目标广告j的相对显著性数值

该相对显著性数值表示针对初始样本用户而言，在目标广告j上的效果、与其他广告上的效果的对比结果，当相对显著性数值大于1时，表明初始样本用户在目标广告j上的效果优于在其他广告上的效果。其中，相对显著性数值越高，代表初始样本用户在目标广告j上的效果表现越显著。

308、电子设备根据绝对显著性数值、以及相对显著性数值，从多个初始样本用户中选取出多个目标样本用户。

在实际应用中，比如，如图4所示，电子设备可以将绝对显著性数值大于1定义为绝对关注程度条件，并且从初始样本用户中选取满足绝对关注条件的绝对关注样本用户。并且根据相对显著性数值的大小，从多个绝对关注样本用户中选取出多个目标样本用户。又比如，电子设备获取到多个绝对关注样本用户之后，还可以利用联合分布函数，计算得到每个绝对关注样本用户对应的联合分布数值，并根据联合分布数值的大小，从多个绝对关注样本用户中选取出多个目标样本用户。其中，联合分布函数的公式可以为：

309、电子设备基于多个目标样本用户、以及目标样本用户对应的用户行为特征信息，构建训练样本，并输出训练样本。

在实际应用中，比如，电子设备可以将选取得到的多个目标样本用户确定为正训练样本，并且在样本用户集合中，排除正训练样本后，随机选择一定规模的样本用户，作为负训练样本，并根据正训练样本和负训练样本构建训练样本，并输出训练样本。

由上可知，本申请实施例可以通过电子设备获取多个待选取样本用户对应的用户行为特征信息，确定表征训练样本的正向语义词、以及负向过滤词，根据正向语义词、以及负向过滤词，对待选取样本用户分源进行挖掘匹配，得到多个参考信息匹配样本用户，根据用户行为特征信息，获取每个参考信息匹配样本用户对应的用户兴趣度分值，根据用户兴趣度分值，从参考信息匹配样本用户中选取多个初始样本用户，获取初始样本用户针对目标广告的绝对显著性数值，获取初始样本用户针对目标广告的相对显著性数值，根据绝对显著性数值、以及相对显著性数值，从多个初始样本用户中选取出多个目标样本用户，基于多个目标样本用户、以及目标样本用户对应的用户行为特征信息，构建训练样本，并输出训练样本。该方案可以通过多源行为挖掘，获取到用户在多个用户行为场景下的用户行为特征信息，以解决样本有偏的问题。同时，利用正向参考特征信息、以及负向参考特征信息，一方面保证了训练样本的准确性，另一方面保证去除了噪声样本。并且，利用联合建模，分别获取样本用户对应的绝对关注程度信息、以及相对关注程度信息，从多个维度上衡量样本用户作为训练样本的优劣程度。利用本方案选取出来的训练样本进行内容推广，不仅解决了训练样本量级有限的问题，并且可以提升训练样本的纯净度，利用这样的训练样本进行后续步骤，可以有效地提高内容推广的精准性。

为了更好地实施以上方法，本申请实施例还可以提供一种训练样本选取装置，该训练样本选取装置具体可以集成在电子设备中，该电子设备可以包括服务器、终端等，其中，终端可以包括：手机、平板电脑、笔记本电脑或个人计算机(PC，PersoTal Computer)等。

例如，如图6所示，该训练样本选取装置可以包括获取模块61、第一选取模块62、确定模块63、信息获取模块64、第二选取模块65和输出模块66，如下：

获取模块61，用于从样本用户集合中确定多个待选取样本用户，并获取每个待选取样本用户对应的用户行为特征信息；

第一选取模块62，用于根据参考行为特征信息，从所述多个待选取样本用户中，选取出多个初始样本用户，其中，所述初始样本用户对应的用户行为特征信息与所述参考行为特征信息相匹配；

确定模块63，用于从所述初始样本用户对应的用户行为特征信息中，确定所述初始样本用户针对目标推广内容的第一行为特征信息，其中，所述目标推广内容为推广内容集合中需要进行推广的推广内容；

信息获取模块64，用于获取所述样本用户集合中所有样本用户针对所述目标推广内容的第二行为特征信息、以及所述初始样本用户针对所述推广内容集合中所有推广内容的第三行为特征信息；

第二选取模块65，用于基于所述第一行为特征信息、所述第二行为特征信息、以及所述第三行为特征信息，从所述初始样本用户中选取出多个目标样本用户；

输出模块66，用于基于所述多个目标样本用户、以及所述目标样本用户对应的用户行为特征信息，构建训练样本，并输出所述训练样本。

在一实施例中，所述第一选取模块62可以包括第一确定子模块621、提取子模块622和第一选取子模块623，如下：

第一确定子模块621，用于确定需要进行推广的目标推广内容所对应的参考特征文本；

提取子模块622，用于从所述参考特征文本中，提取出多个参考行为特征信息；

第一选取子模块623，用于根据所述多个参考行为特征信息，从所述多个待选取样本用户中，选取出所述初始样本用户。

在一实施例中，所述第一选取模块62可以包括第二选取子模块624、第二确定子模块625和第三选取子模块626，如下：

第二选取子模块624，用于基于所述用户行为特征信息与所述参考行为特征信息之间的匹配关系，从所述多个待选取样本用户中，选取出多个参考信息匹配样本用户；

第二确定子模块625，用于基于每个参考信息匹配样本用户对应的用户行为特征信息，确定每个参考信息匹配样本用户对应的用户兴趣程度信息；

第三选取子模块626，用于基于所述用户兴趣程度信息，从所述多个参考信息匹配样本用户中，选取出所述初始样本用户。

在一实施例中，所述第二选取子模块624可以包括第三确定子模块6241、第四选取子模块6242和第四确定子模块6243，如下：

第三确定子模块6241，用于基于每个待选取样本用户对应的用户行为特征信息，确定每个用户行为场景对应的多个待选取样本用户；

第四选取子模块6242，用于基于所述用户行为特征信息与所述参考行为特征信息之间的匹配关系，从所述每个用户行为场景对应的多个待选取样本用户中，选取出所述每个用户行为场景对应的参考信息匹配样本用户；

第四确定子模块6243，用于基于所述每个用户行为场景对应的参考信息匹配样本用户，确定多个参考信息匹配样本用户。

在一实施例中，所述第四选取子模块6242可以具体用于：

基于所述用户行为特征信息与所述正向参考特征信息之间的匹配关系，从所述每个用户行为场景对应的多个待选取样本用户中，选取出所述每个用户行为场景对应的正向匹配样本用户；

基于所述用户行为特征信息与所述负向参考特征信息之间的匹配关系，从所述每个用户行为场景对应的正向匹配样本用户中，选取出所述每个用户行为场景对应的参考信息匹配样本用户。

在一实施例中，所述第二选取模块65可以包括第五确定子模块651、第六确定子模块652和第五选取子模块653，如下：

第五确定子模块651，用于基于所述第一行为特征信息、以及所述第二行为特征信息，确定所述初始样本用户针对所述目标推广内容的绝对关注程度信息；

第六确定子模块652，用于基于所述第一行为特征信息、以及所述第三行为特征信息，确定所述初始样本用户针对所述目标推广内容的相对关注程度信息；

第五选取子模块653，用于基于所述绝对关注程度信息、以及所述相对关注程度信息，从所述初始样本用户中选取出多个目标样本用户。

在一实施例中，所述第五选取子模块653可以具体用于：

从所述初始样本用户中，确定所述绝对关注程度信息满足绝对关注程度条件的绝对关注样本用户；

基于所述相对关注程度信息，从所述多个绝对关注样本用户中选取出所述目标样本用户。

在一实施例中，所述输出模块66可以具体用于：

输出所述训练样本。

具体实施时，以上各个单元可以作为独立的实体来实现，也可以进行任意组合，作为同一或若干个实体来实现，以上各个单元的具体实施可参见前面的方法实施例，在此不再赘述。

由上可知，本申请实施例可以通过获取模块61从样本用户集合中确定多个待选取样本用户，并获取每个待选取样本用户对应的用户行为特征信息，通过第一选取模块62根据参考行为特征信息，从多个待选取样本用户中，选取出多个初始样本用户，其中，初始样本用户对应的用户行为特征信息、与参考行为特征信息相匹配，通过确定模块63从初始样本用户对应的用户行为特征信息中，确定初始样本用户针对目标推广内容的第一行为特征信息，其中，目标推广内容为推广内容集合中需要进行推广的推广内容，通过信息获取模块64获取样本用户集合中所有样本用户针对目标推广内容的第二行为特征信息、以及初始样本用户针对推广内容集合中所有推广内容的第三行为特征信息，通过第二选取模块65基于第一行为特征信息、第二行为特征信息、以及第三行为特征信息，从多个初始样本用户中选取出多个目标样本用户，通过输出模块66基于多个目标样本用户、以及目标样本用户对应的用户行为特征信息，构建训练样本，并输出训练样本。该方案可以通过多源行为挖掘，获取到用户在多个用户行为场景下的用户行为特征信息，以解决样本有偏的问题。同时，利用正向参考特征信息、以及负向参考特征信息，一方面保证了训练样本的准确性，另一方面保证去除了噪声样本。并且，利用联合建模，分别获取样本用户对应的绝对关注程度信息、以及相对关注程度信息，从多个维度上衡量样本用户作为训练样本的优劣程度。利用本方案选取出来的训练样本进行内容推广，不仅解决了训练样本量级有限的问题，并且可以提升训练样本的纯净度，利用这样的训练样本进行后续步骤，可以有效地提高内容推广的精准性。

本申请实施例还提供一种电子设备，该电子设备可以集成本申请实施例所提供的任一种训练样本选取装置。

例如，如图7所示，其示出了本申请实施例所涉及的电子设备的结构示意图，具体来讲：

该电子设备可以包括一个或者一个以上处理核心的处理器71、一个或一个以上计算机可读存储介质的存储器72、电源73和输入单元74等部件。本领域技术人员可以理解，图7中示出的电子设备结构并不构成对电子设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。其中：

处理器71是该电子设备的控制中心，利用各种接口和线路连接整个电子设备的各个部分，通过运行或执行存储在存储器72内的软件程序和/或模块，以及调用存储在存储器72内的数据，执行电子设备的各种功能和处理数据，从而对电子设备进行整体监控。可选的，处理器71可包括一个或多个处理核心；优选的，处理器71可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器71中。

存储器72可用于存储软件程序以及模块，处理器71通过运行存储在存储器72的软件程序以及模块，从而执行各种功能应用以及数据处理。存储器72可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据电子设备的使用所创建的数据等。此外，存储器72可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器72还可以包括存储器控制器，以提供处理器71对存储器72的访问。

电子设备还包括给各个部件供电的电源73，优选的，电源73可以通过电源管理系统与处理器71逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源73还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

该电子设备还可包括输入单元74，该输入单元74可用于接收输入的数字或字符信息，以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。

尽管未示出，电子设备还可以包括显示单元等，在此不再赘述。具体在本实施例中，电子设备中的处理器71会按照如下的指令，将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器72中，并由处理器71来运行存储在存储器72中的应用程序，从而实现各种功能，如下：

从样本用户集合中确定多个待选取样本用户，并获取每个待选取样本用户对应的用户行为特征信息，根据参考行为特征信息，从多个待选取样本用户中，选取出多个初始样本用户，其中，初始样本用户对应的用户行为特征信息、与参考行为特征信息相匹配，从初始样本用户对应的用户行为特征信息中，确定初始样本用户针对目标推广内容的第一行为特征信息，其中，目标推广内容为推广内容集合中需要进行推广的推广内容，获取样本用户集合中所有样本用户针对目标推广内容的第二行为特征信息、以及初始样本用户针对推广内容集合中所有推广内容的第三行为特征信息，基于第一行为特征信息、第二行为特征信息、以及第三行为特征信息，从多个初始样本用户中选取出多个目标样本用户，基于多个目标样本用户、以及目标样本用户对应的用户行为特征信息，构建训练样本，并输出训练样本。

以上各个操作的具体实施可参见前面的实施例，在此不再赘述。

本领域普通技术人员可以理解，上述实施例的各种方法中的全部或部分步骤可以通过指令来完成，或通过指令控制相关的硬件来完成，该指令可以存储于一计算机可读存储介质中，并由处理器进行加载和执行。

为此，本申请实施例提供一种电子设备，其中存储有多条指令，该指令能够被处理器进行加载，以执行本申请实施例所提供的任一种训练样本选取方法中的步骤。例如，该指令可以执行如下步骤：

其中，该存储介质可以包括：只读存储器(ROM，Read OTly Memory)、随机存取记忆体(RAM，RaTdom Access Memory)、磁盘或光盘等。

由于该存储介质中所存储的指令，可以执行本申请实施例所提供的任一种训练样本选取方法中的步骤，因此，可以实现本申请实施例所提供的任一种训练样本选取方法所能实现的有益效果，详见前面的实施例，在此不再赘述。

以上对本申请实施例所提供的一种训练样本选取方法、装置、以及计算机存储介质进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种训练样本选取方法，其特征在于，包括：

2.根据权利要求1所述的训练样本选取方法，其特征在于，根据参考行为特征信息，从所述多个待选取样本用户中，选取出多个初始样本用户，包括：

确定需要进行推广的目标推广内容所对应的参考特征文本；

从所述参考特征文本中，提取出多个参考行为特征信息；

根据所述多个参考行为特征信息，从所述多个待选取样本用户中，选取出所述初始样本用户。

3.根据权利要求1或2所述的训练样本选取方法，其特征在于，根据参考行为特征信息，从所述多个待选取样本用户中，选取出多个初始样本用户，包括：

基于所述用户兴趣程度信息，从所述多个参考信息匹配样本用户中，选取出所述初始样本用户。

4.根据权利要求3所述的训练样本选取方法，其特征在于，所述待选取样本用户对应的用户行为特征信息针对多个用户行为场景；

基于所述用户行为特征信息与所述参考行为特征信息之间的匹配关系，从所述多个待选取样本用户中，选取出多个参考信息匹配样本用户，包括：

基于所述用户行为特征信息与所述参考行为特征信息之间的匹配关系，从所述每个用户行为场景对应的多个待选取样本用户中，选取出所述每个用户行为场景对应的参考信息匹配样本用户；

基于所述每个用户行为场景对应的参考信息匹配样本用户，确定多个参考信息匹配样本用户。

5.根据权利要求4所述的训练样本选取方法，其特征在于，所述参考行为特征信息包括正向参考特征信息、以及负向参考特征信息；

基于所述用户行为特征信息与所述参考行为特征信息之间的匹配关系，从所述每个用户行为场景对应的多个待选取样本用户中，选取出所述每个用户行为场景对应的参考信息匹配样本用户，包括：

6.根据权利要求1所述的训练样本选取方法，其特征在于，基于所述第一行为特征信息、所述第二行为特征信息、以及所述第三行为特征信息，从所述初始样本用户中选取出多个目标样本用户，包括：

基于所述绝对关注程度信息、以及所述相对关注程度信息，从所述初始样本用户中选取出多个目标样本用户。

7.根据权利要求6所述的训练样本选取方法，其特征在于，基于所述绝对关注程度信息、以及所述相对关注程度信息，从所述初始样本用户中选取出多个目标样本用户，包括：

基于所述相对关注程度信息，从所述绝对关注样本用户中选取出所述目标样本用户。

8.根据权利要求1所述的训练样本选取方法，其特征在于，基于所述多个目标样本用户、以及所述目标样本用户对应的用户行为特征信息，构建训练样本，并输出所述训练样本，包括：

输出所述训练样本。

9.一种训练样本选取装置，其特征在于，包括：

10.一种计算机存储介质，其上存储有计算机程序，其特征在于，当所述计算机程序在计算机上运行时，使得所述计算机执行如权利要求1-8任一项所述的训练样本选取方法。