CN110674397A

CN110674397A - 年龄点预测模型的训练方法及装置、设备与可读介质

Info

Publication number: CN110674397A
Application number: CN201910813682.0A
Authority: CN
Inventors: 康建峰; 杨旭虹; 闻波
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2019-08-30
Filing date: 2019-08-30
Publication date: 2020-01-10
Anticipated expiration: 2039-08-30
Also published as: CN110674397B

Abstract

本发明提供一种年龄点预测模型的训练方法及装置、设备与可读介质。方法包括采集预设年龄段中各年龄点的数条真实样本数据；各真实样本数据中包括对应的年龄点以及其他特征信息；以各真实样本数据为基础，扩充与对应的年龄点的差值在预设的年龄差阈值范围内的各年龄点对应的样本数据，作为扩充样本数据，共得到数条扩充样本数据；为各真实样本数据和各扩充样本数据配置权重；根据各真实样本数据和各扩充样本数据以及各自对应的权重，并采用加权交叉熵作为损失函数，训练年龄点预测模型。本发明的技术方案，能够有效地提升年龄点预测模型在年龄差阈值范围内预测的准确率，优化年龄点预测模型的性能，进而对年龄点进行更加准确地挖掘。

Description

年龄点预测模型的训练方法及装置、设备与可读介质

【技术领域】

本发明涉及计算机应用技术领域，尤其涉及一种年龄点预测模型的训练方法及装置、设备与可读介质。

【背景技术】

随着大数据及互联网技术发展，用户画像在用户分析、精准营销、个性推荐等场景发挥越来越大的作用。一般来说，用户画像的建设包括人口社会属性、长期兴趣爱好、短期意图、app及设备属性、地理位置属性等，其中人口社会属性作为用户画像的重要组成部分，是用户画像建设的重点。且人口社会属性中，用户的年龄点标签是一项非常重要的标签，在基于用户的年龄点进行的推荐中显得尤为重要。

在实际应用中，通常用户的年龄点较多，提高准确率较为困难。例如，在已有精确样本前提下，一般互联网公司会对用户年龄点13-80岁范围进行建模，并且预测得出用户年龄点，年龄范围较大，绝对准确率一般较低。在年龄点建模中，显而易见的，错误预测为相邻类的占比很大，占错误主导作用，同时，在业务使用中，一般不要求年龄点绝对准确，很多业务方更关注一个很小的年龄差阈值范围内的误差，如两岁以内的误差，所以建立年龄差阈值范围内的误差的年龄点预测模型，以优化年龄差阈值范围以内误差准确率为优化目标。

但是，现有的年龄点预测模型，均未对很小的年龄差阈值范围如2岁内的年龄点预测的准确率进行有效提升，因此亟需提供一种更加高效的年龄点预测模型，以提升年龄差阈值范围内的年龄点的预测的准确率。

【发明内容】

本发明提供了一种年龄点预测模型的训练方法及装置、设备与可读介质，用于提供一种更加高效的年龄点预测模型，以提升年龄差阈值范围内的年龄点的预测的准确率。

本发明提供一种年龄点预测模型的训练方法，所述方法包括：

采集预设年龄段中各年龄点的数条真实样本数据；各所述真实样本数据中包括对应的年龄点以及其他特征信息；

以各所述真实样本数据为基础，扩充与对应的所述年龄点的差值在预设的年龄差阈值范围内的各年龄点对应的样本数据，作为扩充样本数据，共得到数条所述扩充样本数据；

为各所述真实样本数据和各所述扩充样本数据配置权重；

根据各所述真实样本数据和各所述扩充样本数据以及各自对应的所述权重，并采用加权交叉熵作为损失函数，训练所述年龄点预测模型。

进一步可选地，如上所述的方法中，以各所述真实样本数据为基础，扩充与对应的所述年龄点的差值在年龄差阈值范围内的各年龄点对应的样本数据，作为扩充样本数据，包括：

对于各所述真实样本数据，将其中包括的所述年龄点，分别修改为与所述年龄点的差值在所述年龄差阈值范围内的其他各年龄点，作为所述扩充样本数据。

进一步可选地，如上所述的方法中，为各所述真实样本数据和各所述扩充样本数据配置权重，包括：

为各所述真实样本数据配置权重为1；

为各所述扩充样本数据配置小于1的权重。

进一步可选地，如上所述的方法中，为各所述扩充样本数据配置小于1的权重，包括：

根据各所述扩充样本数据中包括的所述年龄点与对应的所述真实样本中包括的所述年龄点的差值，为各所述扩充样本数据配置权重，使得所述差值越小的所述扩充样本数据的权重越大。

进一步可选地，如上所述的方法中，根据各所述真实样本数据和各所述扩充样本数据以及各自对应的所述权重，并采用所述加权交叉熵作为损失函数，训练所述年龄点预测模型，包括：

从数条所述真实样本数据和数条所述扩充样本数据中选择样本数据，输入至所述年龄点预测模型中；

获取所述年龄点预测模型的预测的结果；

基于所述年龄点预测模型的预测的结果、输入的所述样本数据中的年龄点以及对应的权重，获取对应的所述加权交叉熵，作为所述年龄点预测模型的损失函数；

判断所述损失函数的值是否收敛；

若不收敛，重复上述步骤，直至所述损失函数收敛，确定所述年龄点预测模型的参数，进而确定所述年龄点预测模型。

本发明还提供一种用户年龄点的挖掘方法，所述方法包括：

获取用户的特征信息；

根据所述用户的特征信息和预先训练的年龄点预测模型，挖掘所述用户的年龄点，所述年龄点挖掘模型是以数条真实样本数据为基础，在预设的年龄差阈值范围内扩充样本数据，并配置相应的权重；利用所有样本数据采用加权交叉熵作为损失函数训练而成。

本发明提供一种年龄点预测模型的训练装置，所述装置包括：

采集模块，用于采集预设年龄段中各年龄点的数条真实样本数据；各所述真实样本数据中包括对应的年龄点以及其他特征信息；

扩充模块，用于以各所述真实样本数据为基础，扩充与对应的所述年龄点的差值在预设的年龄差阈值范围内的各年龄点对应的样本数据，作为扩充样本数据，共得到数条所述扩充样本数据；

配置模块，用于为各所述真实样本数据和各所述扩充样本数据配置权重；

训练模块，用于根据各所述真实样本数据和各所述扩充样本数据以及各自对应的所述权重，并采用加权交叉熵作为损失函数，训练所述年龄点预测模型。

本发明还提供一种用户年龄点的挖掘装置，所述装置包括：

获取模块，用于获取用户的特征信息；

挖掘模块，用于根据所述用户的特征信息和预先训练的年龄点预测模型，挖掘所述用户的年龄点，所述年龄点挖掘模型是以数条真实样本数据为基础，在预设的年龄差阈值范围内扩充样本数据，并配置相应的权重；利用所有样本数据采用加权交叉熵作为损失函数训练而成。

本发明还提供一种计算机设备，所述设备包括：

一个或多个处理器；

存储器，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如上所述的年龄点预测模型的训练方法或者用户年龄点的挖掘方法。

本发明还提供一种计算机可读介质，其上存储有计算机程序，该程序被处理器执行时实现如上所述的年龄点预测模型的训练方法或者用户年龄点的挖掘方法。

本发明的年龄点预测模型的训练方法及装置、设备与可读介质，，通过基于每条真实样本数据，扩充年龄点在年龄差阈值范围内的扩充样本数据，配置相应的权重，并采用边界加权交叉熵作为损失函数，来训练年龄点预测模型，能够有效地提升年龄点预测模型在年龄差阈值范围内预测的准确率，优化年龄点预测模型的性能，进而对年龄点进行更加准确地挖掘。

【附图说明】

图1为本发明的年龄点预测模型的训练方法实施例的流程图。

图2为本实施例的年龄点预测模型的预测效果示意图。

图3为本发明的用户年龄点的挖掘方法实施例的流程图。

图4为本发明的年龄点预测模型的训练装置实施例的结构图。

图5为本发明的用户年龄点的挖掘装置实施例的结构图。

图6为本发明的计算机设备实施例的结构图。

图7为本发明提供的一种计算机设备的示例图。

【具体实施方式】

为了使本发明的目的、技术方案和优点更加清楚，下面结合附图和具体实施例对本发明进行详细描述。

图1为本发明的年龄点预测模型的训练方法实施例的流程图。如图1所示，本实施例的年龄点预测模型的训练方法，具体可以包括如下步骤：

S100、采集预设年龄段中各年龄点的数条真实样本数据；各真实样本数据中包括对应的年龄点以及其他特征信息；

S101、以各真实样本数据为基础，扩充与对应的年龄点的差值在预设的年龄差阈值范围内的各年龄点对应的样本数据，作为扩充样本数据，共得到数条扩充样本数据；

S102、为各真实样本数据和各扩充样本数据配置权重；

S103、根据各真实样本数据和各扩充样本数据以及各自对应的所述权重，并采用加权交叉熵作为损失函数，训练年龄点预测模型。

本实施例的年龄点预测模型的训练方法的执行主体为年龄点预测模型的训练装置，该年龄点预测模型的训练装置可以为一个实体的电子设备如服务器，或者也可以为采用软件集成的应用，用于训练一个高效的年龄点预测模型，能够提升年龄差阈值范围如2岁内的年龄点的预测的准确率。

结合实际应用场景，本实施例的预设年龄段可以选取13-80岁的年龄段。具体地，可以从互联网中采集预设年龄段中各年龄点的用户的样本数据，作为真实样本数据。例如，可以贴吧、搜索、地图、金融、美食、外卖等等各种相关的应用中采集各个年龄点的用户的样本数据。对于18岁以上的用户的样本数据获取较为容易，而对于18岁以下的，可以从贴吧中过滤出，以补充18岁以下样本数据的匮乏。本实施例中，采集到的各年龄点的真实样本数据中包括对应的真实年龄点以及用户的其他特征信息。其中该其他特征信息可以包括学历、籍贯、专业、爱好等等各种信息。

与现有技术不同的是，本实施例中，为了提高训练的年龄点预测模型在年龄差阈值范围内的准确率，还需要以各真实样本数据为基础，扩充与对应的真实年龄点的差值在年龄差阈值范围内的各扩充年龄点对应的样本数据，作为扩充样本数据。对于各真实样本数据，具体扩充样本数据时，将其中包括年龄点，分别修改为与该年龄点的差值在年龄差阈值范围内的其他各年龄点，作为扩充样本数据。例如，以年龄差阈值是2岁为例，对于一条真实年龄点为A的真实样本数据，需要以该真实样本数据为基础，扩充2*2条扩充样本数据，即扩充年龄点分别为A-1、A+1、A-2和A+2的4条扩充样本数据。对于年龄差阈值是3岁为例，对于一条真实年龄点为A的真实样本数据，需要以该真实样本数据为基础，扩充2*3条扩充样本数据，即扩充年龄点分别为A-1、A+1、A-2、A+2、A-3和A+3的6条扩充样本数据。由此可知，扩充样本数据与对应的真实样本数据相比，其中包括用户的其他特征信息不变，仅将年龄点调整为与真实年龄点的差值在年龄差阈值范围内的其他年龄点即可。

在实际的业务使用中，一般不要求年龄点绝对准确，很多业务方更关注两岁以内误差，所以，本实施例中，年龄差阈值优选为2岁，建立2岁误差的年龄点优化模型，以优化2岁以内误差最小为优化目标。

本实施例中，扩充完样本数据后，还需要为各真实样本数据和各扩充样本数据配置合适的权重。由于真实样本数据就是真实存在的，其权重理应最大，本实施例中可以设置为1。而对于扩充的样本数据，由于其包括的年龄点与对应的真实样本数据中的年龄点的年龄的差值在年龄差阈值范围内，在实际预测中，可能被预测到的年龄点是真实样本数据对应的年龄点；但是，这种情况与真实样本数据被预测到年龄点的情况相比，概率会更小，所以对应的扩充样本数据的权重也相对较小，要小于1。但是扩充样本数据中的年龄点与其对应的真实样本数据中的年龄点的年龄差越小，相应配置的权重越大；反之亦然。例如，对于年龄差阈值为2岁时，可以将扩充后的年龄点分别为A-1和A+1扩充样本数据的权重配置为0.5，可以将将扩充后的年龄点分别为A-2、A+2扩充样本数据的权重配置为0.25。当然实际应用中还可以按照上述权重配置的策略，配置其他数值的权重。即本实施例中，是根据各扩充样本数据中包括的年龄点与对应的真实样本数据中的包括的年龄点的差值，为各扩充样本数据配置权重，使得差值越小的扩充样本数据的权重越大，反之，差值越大的扩充样本数据的权重越小。

最后，根据各真实样本数据和各扩充样本数据以及各自对应的所述权重，并采用加权交叉熵作为损失函数，训练年龄点预测模型。例如，具体可以包括如下步骤：

(a)从数条真实样本数据和数条扩充样本数据中选择样本数据输入至年龄点预测模型中；

(b)获取年龄点预测模型的预测的结果；

(d)基于年龄点预测模型的预测的结果以及输入的样本数据中的年龄点以及对应的权重，获取对应的加权交叉熵，作为年龄点预测模型的损失函数；

(e)判断损失函数的值是否收敛；若不收敛，返回步骤(a)选择下一条样本数据继续训练，否则，若收敛时，确定收敛时对应的年龄点预测模型的参数，进而确定年龄点预测模型。

训练之前，可以先对年龄点预测模型的参数进行随机初始化。然后开始训练。每次训练时，可以随机从数条真实样本数据和数条扩充样本数据中随机选择一条样本数据，此时选择的样本数据可能是真实样本数据，也可能是扩充样本数据，然后输入至年龄点预测模型中，对应的年龄点预测模型可以预测一个结果，即年龄点预测模型基于现有的参数，预测的年龄点。然后基于年龄点预测模型的预测的结果、输入的样本数据中的年龄点以及对应的权重，获取对应的加权交叉熵，作为年龄点预测模型的损失函数；若是首次训练，直接返回继续选择下一条样本数据继续训练。若非首次训练，可以先判断计算的损失函数的值是否收敛；若不收敛，调整年龄点预测模型的参数，并返回继续选择下一条样本数据继续训练，以此类推，直到损失函数的值收敛。本实施例中，可以认为损失函数的值在连续预设轮数如80、100或者其他次数的训练中不再继续缩小，此时可以认为损失函数的值收敛。此时取损失函数收敛时，年龄点预测模型的参数最为训练后的参数，此时对应的年龄点预测模型为训练好的年龄点预测模型。

本实施例中，一条样本数据一条样本数据来训练，训练效率较低，所以在训练时，可以随机从数条真实样本数据和数条扩充样本数据中随机取一组样本数据，作为输入进行训练，后续的调整模型参数的实现方式与上述一条一条样本数据的训练原理相同，详细可以参考上述实施例的记载，在此不再赘述。

例如，本实施例中，以训练时输入一组样本数据为例时，对应的加权损失函数可以表示如下形式：

其中Loss为损失函数的值，N为每次训练时输入的一组样本数据中样本数据的数量，y_i为该组样本数据中的第i个样本数据中对应的真实年龄值，

为每组样本数据中的第i个样本数据经模型预测得到的预测年龄值；f_i()表示处理对应的第i个样本数据的噪音函数，w_i为该组样本数据中的第i个样本数据的权重。另外，现有的回归模型来预测年龄点时，由于年龄点连续、较多，且回归模型会对误差较大的预测有更大的惩罚，能够降低预测偏离较大的比例，在很多年龄点建模预测场景，使用回归模型建模，损失函数一般使用MSE或Huber。其中采用MSE的损失函数可以表示为如下：

其中N为样本个数，y为样本数据中的真实年龄值，

是经过模型预测的预测年龄值。

采用Huber的损失函数可以表示为如下：

其中y为样本数据中的真实年龄值，

是经过模型预测的预测年龄值，δ为超参数。

另外，现有技术还可以采用分类模型来预测年龄点时，由于年龄点是个有限枚举值，可以建立68分类模型(13-80)，使用如下的交叉熵作为损失函数：

其中N为样本个数，y_i为第i个样本数据中对应的真实年龄值，

为第i个样本数据经模型预测得到的预测年龄值；f_i()表示处理对应的第i个样本数据的噪音函数。

本实施例的加权交叉熵与传统的分类模型的交叉熵相比，增加了每条数据的权重。例如，从整体的工程实现角度来看，本实施例的加权交叉熵的损失函数可以表示为如下：

此时对应的N可以为总的样本个数，k为每条样本数据扩充的样本数据的数量，其他参数解释参考上述实施例的相关解释，在此不再赘述。

经过上述对比，可以发现，本实施例通过对样本数据在预设年龄差阈值范围内进行扩充，可以相当于设置了年龄差阈值的边界，从工程实现角度来看，该加权交叉熵函数，可以理解为一个带有边界的加权交叉熵函数，基于该边界加权交叉熵函数，采用多条真实的样本数据和扩充的多条扩充样本数据对该模型训练，可以有效地提高边界范围内即年龄差阈值范围内的年龄阈值的准确性。

例如图2为本实施例的年龄点预测模型的预测效果示意图。其中最上面的线条为本实施例的基于边界加权交叉熵的损失函数训练的年龄点预测模型的准确率；中间的线条为基于Huber的损失函数训练的年龄点预测模型的准确率；最下面的线条为基于MSE的损失函数训练的年龄点预测模型的准确率。如图2所示，将本实施例的年龄点预测模型的预测准确率，分别与现有的Huber函数和MSE函数作为交叉熵函数训练的年龄点预测模型的准确率相比，可以发现采用本实施例的方案训练的年龄点预测模型的准确率最高。

经试验证明，基于Huber和MSE的损失函数训练的年龄点预测模型在0-6岁内准确率下降，7-10岁准确率上升，可以说明使用回归的方法能够有效惩罚预测误差较大的点，而对误差较小的点没有有效提升。而本实施例提出的边界加权交叉熵的损失函数训练的年龄点预测模型能够有效提升1岁和2岁误差的准确率。经研究表明，本实施例训练的年龄点预测模型，能够将2岁内年龄点预测的准确率绝对提升约10％。

本实施例的年龄点预测模型的训练方法，通过采用上述实施例，基于每条真实样本数据，扩充年龄点在年龄差阈值范围内的扩充样本数据，配置相应的权重，并采用加权交叉熵作为损失函数，来训练年龄点预测模型，能够有效地提升年龄点预测模型在年龄差阈值范围内预测的准确率，优化年龄点预测模型的性能，进而对年龄点进行更加准确地挖掘。

图3为本发明的用户年龄点的挖掘方法实施例的流程图。如图3所示，本实施例的用户年龄点的挖掘方法，具体可以包括如下步骤：

200、获取用户的特征信息；

201、根据用户的特征信息和预先训练的年龄点预测模型，挖掘用户的年龄点，其中年龄点挖掘模型是以数条真实样本数据为基础，在预设的年龄差阈值范围内扩充样本数据，并配置相应的权重；利用所有样本数据采用边界加权交叉熵作为损失函数训练而成。

本实施例的用户年龄点的挖掘方法为用户年龄点的挖掘装置，该用户年龄点的挖掘装置可以为一电子实体，或者也可以为采用软件集成的应用。

本实施例的用户年龄点的挖掘方法，为上述图1所示实施例训练得到的年龄点挖掘模型的一种应用。具体使用时，向该年龄点预测模型输入用户的特征信息，该年龄点预测模型便可以挖掘出该用户的年龄。且如上述图1实施例所示，该年龄点预测模型是以数条真实样本数据为基础，在预设的年龄差阈值范围内扩充样本数据，并配置相应的权重；利用所有样本数据采用加权交叉熵作为损失函数训练而成，能够有效提升在年龄差阈值范围内预测的年龄点的准确率。

本实施例的用户年龄点的挖掘方法，由于采用上述以数条真实样本数据为基础，在预设的年龄差阈值范围内扩充样本数据，并配置相应的权重；利用所有样本数据采用加权交叉熵作为损失函数训练而成的年龄点挖掘模型，能够有效地提升在年龄差阈值范围内预测的年龄的准确率。例如，经研究证明，本实施例的用户年龄点的挖掘方法，能够有效提升1岁和2岁误差的准确率。例如，可以对年龄点预测模型准确率在2岁误差范围内的预测准确率提升约10％。

图4为本发明的年龄点预测模型的训练装置实施例的结构图。如图4所示，本实施例的年龄点预测模型的训练装置，具体可以包括：

采集模块10用于采集预设年龄段中各年龄点的数条真实样本数据；各真实样本数据中包括对应的年龄点以及其他特征信息；

扩充模块11用于以采集模块10采集的各真实样本数据为基础，扩充与对应的年龄点的差值在预设的年龄差阈值范围内的各年龄点对应的样本数据，作为扩充样本数据，共得到数条扩充样本数据；

配置模块12用于为采集模块10采集的各真实样本数据和扩充模块11得到的各扩充样本数据配置权重；

训练模块13用于根据采集模块10采集的各真实样本数据和扩充模块11得到的各扩充样本数据以及配置模块12配置的各自对应的所述权重，并采用加权交叉熵作为损失函数，训练年龄点预测模型。

进一步可选地，扩充模块11用于：

对于各真实样本数据，将其中包括的年龄点，分别修改为与年龄点的差值在年龄差阈值范围内的其他各年龄点，作为扩充样本数据。

进一步可选地，配置模块12用于：

为各真实样本数据配置权重为1；

为各扩充样本数据配置小于1的权重。

进一步可选地，配置模块12用于：

根据各扩充样本数据中包括的年龄点与对应的真实样本中包括的年龄点的差值，为各扩充样本数据配置权重，使得差值越小的扩充样本数据的权重越大。

进一步可选地，训练模块13用于：

从数条真实样本数据和数条扩充样本数据中选择样本数据，输入至年龄点预测模型中；

获取年龄点预测模型的预测的结果；

基于年龄点预测模型的预测的结果、输入的样本数据中的年龄点以及对应的权重，获取对应的加权交叉熵，作为年龄点预测模型的损失函数；

判断损失函数的值是否收敛；

若不收敛，重复上述步骤，直至损失函数收敛，确定年龄点预测模型的参数，进而确定年龄点预测模型。

本实施例的年龄点预测模型的训练装置，通过采用上述模块实现年龄点预测模型的训练的实现原理及技术效果，与上述相关方法实施例相同，详细可以参考上述相关方法实施例的记载，在此不再赘述。

图5为本发明的用户年龄点的挖掘装置实施例的结构图。如图5所示，本实施例的用户年龄点的挖掘装置，具体可以包括：

获取模块20用于获取用户的特征信息；

挖掘模块21用于根据获取模块20获取的用户的特征信息和预先训练的年龄点预测模型，挖掘用户的年龄点，年龄点挖掘模型是以数条真实样本数据为基础，在预设的年龄差阈值范围内扩充样本数据，并配置相应的权重；利用所有样本数据采用加权交叉熵作为损失函数训练而成。

本实施例的用户年龄点的挖掘装置，通过采用上述模块实现用户年龄点的挖掘的实现原理及技术效果，与上述相关方法实施例相同，详细可以参考上述相关方法实施例的记载，在此不再赘述。

图6为本发明的计算机设备实施例的结构图。如图6所示，本实施例的计算机设备，包括：一个或多个处理器30，以及存储器40，存储器40用于存储一个或多个程序，当存储器40中存储的一个或多个程序被一个或多个处理器30执行，使得一个或多个处理器30实现如上图1所示实施例的年龄点预测模型的训练方法，或者实现如上图3所示实施例的用户年龄点的挖掘方法。图6所示实施例中以包括多个处理器30为例。

例如，图7为本发明提供的一种计算机设备的示例图。图7示出了适于用来实现本发明实施方式的示例性计算机设备12a的框图。图7显示的计算机设备12a仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图7所示，计算机设备12a以通用计算设备的形式表现。计算机设备12a的组件可以包括但不限于：一个或者多个处理器16a，系统存储器28a，连接不同系统组件(包括系统存储器28a和处理器16a)的总线18a。

总线18a表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器，外围总线，图形加速端口，处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说，这些体系结构包括但不限于工业标准体系结构(ISA)总线，微通道体系结构(MAC)总线，增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。

计算机设备12a典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12a访问的可用介质，包括易失性和非易失性介质，可移动的和不可移动的介质。

系统存储器28a可以包括易失性存储器形式的计算机系统可读介质，例如随机存取存储器(RAM)30a和/或高速缓存存储器32a。计算机设备12a可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例，存储系统34a可以用于读写不可移动的、非易失性磁介质(图7未显示，通常称为“硬盘驱动器”)。尽管图7中未示出，可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器，以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下，每个驱动器可以通过一个或者多个数据介质接口与总线18a相连。系统存储器28a可以包括至少一个程序产品，该程序产品具有一组(例如至少一个)程序模块，这些程序模块被配置以执行本发明上述图1-图5各实施例的功能。

具有一组(至少一个)程序模块42a的程序/实用工具40a，可以存储在例如系统存储器28a中，这样的程序模块42a包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42a通常执行本发明所描述的上述图1-图4各实施例中的功能和/或方法。

计算机设备12a也可以与一个或多个外部设备14a(例如键盘、指向设备、显示器24a等)通信，还可与一个或者多个使得用户能与该计算机设备12a交互的设备通信，和/或与使得该计算机设备12a能与一个或多个其它计算设备进行通信的任何设备(例如网卡，调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22a进行。并且，计算机设备12a还可以通过网络适配器20a与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器20a通过总线18a与计算机设备12a的其它模块通信。应当明白，尽管图中未示出，可以结合计算机设备12a使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

处理器16a通过运行存储在系统存储器28a中的程序，从而执行各种功能应用以及数据处理，例如实现上述实施例所示的年龄点预测模型的训练方法，或者用户年龄点的挖掘方法。

本发明还提供一种计算机可读介质，其上存储有计算机程序，该程序被处理器执行时实现如上述实施例所示的年龄点预测模型的训练信息处理方法，或者用户年龄点的挖掘方法。

本实施例的计算机可读介质可以包括上述图7所示实施例中的系统存储器28a中的RAM30a、和/或高速缓存存储器32a、和/或存储系统34a。

随着科技的发展，计算机程序的传播途径不再受限于有形介质，还可以直接从网络下载，或者采用其他方式获取。因此，本实施例中的计算机可读介质不仅可以包括有形的介质，还可以包括无形的介质。

本实施例的计算机可读介质可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括——但不限于——无线、电线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

在本发明所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明保护的范围之内。

Claims

1.一种年龄点预测模型的训练方法，其特征在于，所述方法包括：

为各所述真实样本数据和各所述扩充样本数据配置权重；

2.根据权利要求1所述的方法，其特征在于，以各所述真实样本数据为基础，扩充与对应的所述年龄点的差值在年龄差阈值范围内的各年龄点对应的样本数据，作为扩充样本数据，包括：

3.根据权利要求1所述的方法，其特征在于，为各所述真实样本数据和各所述扩充样本数据配置权重，包括：

为各所述真实样本数据配置权重为1；

为各所述扩充样本数据配置小于1的权重。

4.根据权利要求3所述的方法，其特征在于，为各所述扩充样本数据配置小于1的权重，包括：

5.根据权利要求1所述的方法，其特征在于，根据各所述真实样本数据和各所述扩充样本数据以及各自对应的所述权重，并采用所述加权交叉熵作为损失函数，训练所述年龄点预测模型，包括：

获取所述年龄点预测模型的预测的结果；

判断所述损失函数的值是否收敛；

6.一种用户年龄点的挖掘方法，其特征在于，所述方法包括：

获取用户的特征信息；

7.一种年龄点预测模型的训练装置，其特征在于，所述装置还包括：

8.根据权利要求7所述的装置，其特征在于，所述扩充模块，用于：

9.根据权利要求7所述的装置，其特征在于，所述配置模块，用于：

为各所述真实样本数据配置权重为1；

为各所述扩充样本数据配置小于1的权重。

10.根据权利要求9所述的装置，其特征在于，所述配置模块，用于：

11.根据权利要求7所述的装置，其特征在于，所述训练模块，用于：

获取所述年龄点预测模型的预测的结果；

判断所述损失函数的值是否收敛；

12.一种用户年龄点的挖掘装置，其特征在于，所述装置包括：

获取模块，用于获取用户的特征信息；

13.一种计算机设备，其特征在于，所述设备包括：

一个或多个处理器；

存储器，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-5中任一所述的方法，或者实现如权利要求6中所述的方法。

14.一种计算机可读介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-5中任一所述的方法，或者实现如权利要求6中所述的方法。