CN107862339B

CN107862339B - 用于输出信息的方法和装置

Info

Publication number: CN107862339B
Application number: CN201711131690.4A
Authority: CN
Inventors: 戴明洋; 韩雷; 卞传鑫; 杨胜文
Original assignee: Baidu Online Network Technology Beijing Co Ltd
Current assignee: Baidu Online Network Technology Beijing Co Ltd
Priority date: 2017-11-15
Filing date: 2017-11-15
Publication date: 2022-04-29
Anticipated expiration: 2037-11-15
Also published as: US20190147539A1; CN107862339A

Abstract

本申请实施例公开了用于输出信息的方法和装置。该方法的一具体实施方式包括：获取目标用户的至少一种人属性特征和车辆属性特征；对于至少一种人属性特征中的每种人属性特征，将该种人属性特征导入预先训练的打分模型，得到与该种人属性特征对应的分数，其中，打分模型用于表征人属性特征与分数之间的对应关系；将拼接至少一种人属性特征中的每种人属性特征对应的分数和车辆属性特征后所得到的特征向量确定为预测用特征向量；将预测用特征向量导入预先训练的三种计算模型中的至少一种，得到与所导入至的至少一种计算模型中每种计算模型对应的预测值；输出所得到的至少一种预测值。该实施方式提高了信息输出的内容丰富性。

Description

用于输出信息的方法和装置

技术领域

本申请实施例涉及计算机技术领域，具体涉及互联网技术领域，尤其涉及用于输出信息的方法和装置。

背景技术

随着互联网以及数据挖掘技术的发展，目前存在对用户的互联网相关数据进行数据挖掘所得到的各种用户特征信息。

发明内容

本申请实施例提出了用于输出信息的方法和装置。

第一方面，本申请实施例提供了一种用于输出信息的方法，该方法包括：获取目标用户的至少一种人属性特征和车辆属性特征；对于至少一种人属性特征中的每种人属性特征，将该种人属性特征导入预先训练的打分模型，得到与该种人属性特征对应的分数，其中，打分模型用于表征人属性特征与分数之间的对应关系；将拼接至少一种人属性特征中的每种人属性特征对应的分数和车辆属性特征后所得到的特征向量确定为预测用特征向量；将预测用特征向量导入预先训练的三种计算模型中的至少一种，得到与所导入至的至少一种计算模型中每种计算模型对应的预测值，其中，三种计算模型包括：车辆事故发生频率计算模型、平均车辆事故损失值计算模型以及预设时长内车辆事故损失值计算模型，车辆事故发生频率计算模型用于表征特征向量与车辆事故发生频率之间的对应关系，平均车辆事故损失值计算模型用于表征特征向量与平均车辆事故损失值之间的对应关系，预设时长内车辆事故损失值计算模型用于表征特征向量与预设时长内车辆事故损失值之间的对应关系；输出所得到的至少一种预测值。

在一些实施例中，至少一种人属性特征包括以下至少一项：自然人属性特征和网络行为特征，网络行为特征包括以下至少一项：电子地图导航特征、兴趣画像特征、地址特征、常用应用特征、信用评分特征和网络搜索主题特征。

在一些实施例中，车辆事故发生频率计算模型为泊松分布，平均车辆事故损失值计算模型为伽玛分布，预设时长内车辆事故损失值计算模型为Tweedie类分布。

在一些实施例中，车辆事故发生频率计算模型是采用如下第一训练步骤得到的：获取泊松分布的参数初始值和预先确定的第一样本数据集合，其中，第一样本数据集合中每个样本数据包括用户的特征向量以及该用户的历史车辆事故发生频率，其中，用户的特征向量是拼接该用户的至少一种人属性特征中的每种人属性特征对应的分数和车辆属性特征后所得到的特征向量；以第一样本数据集合中的每个样本数据中的用户的特征向量作为输入数据，以该样本数据中的用户的历史车辆事故发生频率作为相应的输出数据，训练泊松分布的参数；将训练后的泊松分布确定为预先训练的车辆事故发生频率计算模型。

在一些实施例中，平均车辆事故损失值计算模型是采用如下第二训练步骤得到的：获取咖玛分布的参数初始值和预先确定的第二样本数据集合，其中，第二样本数据集合中每个样本数据包括用户的特征向量以及该用户的历史平均车辆事故损失值，其中，用户的特征向量是拼接该用户的至少一种人属性特征中的每种人属性特征对应的分数和车辆属性特征后所得到的特征向量；以第二样本数据集合中的每个样本数据中的用户的特征向量作为输入数据，以该样本数据中的用户的历史平均车辆事故损失值作为相应的输出数据，训练咖玛分布的参数；将训练后的咖玛分布确定为预先训练的平均车辆事故损失值计算模型。

在一些实施例中，预设时长内车辆事故损失值计算模型是采用如下第三训练步骤得到的：获取Tweedie类分布的参数初始值和预先确定的第三样本数据集合，其中，第三样本数据集合中每个样本数据包括用户的特征向量以及该用户的历史预设时长内车辆事故损失值，其中，用户的特征向量是拼接该用户的至少一种人属性特征中的每种人属性特征对应的分数和车辆属性特征后所得到的特征向量；以第三样本数据集合中的每个样本数据中的用户的特征向量作为输入数据，以该样本数据中的用户的历史预设时长内车辆事故损失值作为相应的输出数据，训练Tweedie类分布的参数；将训练后的Tweedie类分布确定为预先训练的预设时长内车辆事故损失值计算模型。

在一些实施例中，车辆属性特征包括以下至少一项：车辆型号、车厢数、车排量和历史车辆事故相关信息。

第二方面，本申请实施例提供了一种用于输出信息的装置，该装置包括：获取单元，配置用于获取目标用户的至少一种人属性特征和车辆属性特征；打分单元，配置用于对于至少一种人属性特征中的每种人属性特征，将该种人属性特征导入预先训练的打分模型，得到与该种人属性特征对应的分数，其中，打分模型用于表征人属性特征与分数之间的对应关系；拼接单元，配置用于将拼接至少一种人属性特征中的每种人属性特征对应的分数和车辆属性特征后所得到的特征向量确定为预测用特征向量；预测单元，配置用于将预测用特征向量导入预先训练的三种计算模型中的至少一种，得到与所导入至的至少一种计算模型中每种计算模型对应的预测值，其中，三种计算模型包括：车辆事故发生频率计算模型、平均车辆事故损失值计算模型以及预设时长内车辆事故损失值计算模型，车辆事故发生频率计算模型用于表征特征向量与车辆事故发生频率之间的对应关系，平均车辆事故损失值计算模型用于表征特征向量与平均车辆事故损失值之间的对应关系，预设时长内车辆事故损失值计算模型用于表征特征向量与预设时长内车辆事故损失值之间的对应关系；输出单元，配置用于输出所得到的至少一种预测值。

第三方面，本申请实施例提供了一种电子设备，该设备包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当上述一个或多个程序被上述一个或多个处理器执行时，使得上述一个或多个处理器实现如第一方面中任一实现方式描述的方法。

第四方面，本申请实施例提供了一种计算机可读存储介质，其上存储有计算机程序，其中，该计算机程序被处理器执行时实现如第一方面中任一实现方式描述的方法。

本申请实施例提供的用于输出信息的方法和装置，通过对目标用户的至少一种人属性特征中每种人属性特征采用打分的方法进行降维，实现将特征维数高且稀疏的人属性特征压缩为一维分数，再将至少一种人属性特征中的每种人属性特征对应的分数和特征维数低且稠密的车辆属性特征进行拼接，从而拼接后所得到的特征向量为特征维数低且稠密的特征向量，继而，将拼接后所得到的特征向量确定为预测用特征向量，再将预测用特征向量导入预先训练的三种计算模型中的至少一种，得到与所导入至的至少一种计算模型中每种计算模型对应的预测值，并输出所得到的至少一种预测值。从而，有效利用了特征维数高且稀疏的人属性特征，并结合车辆属性特征得到三种预测值中的至少一种，从而提高了信息输出的内容丰富性。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显：

图1是本申请可以应用于其中的示例性系统架构图；

图2是根据本申请的用于输出信息的方法的一个实施例的流程图；

图3是根据本申请的用于输出信息的方法的一个应用场景的示意图；

图4是根据本申请的用于输出信息的装置的一个实施例的结构示意图；

图5是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

图1示出了可以应用本申请的用于输出信息的方法或用于输出信息的装置的实施例的示例性系统架构100。

如图1所示，系统架构100可以包括终端设备101、102、103，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互，以接收或发送消息等。终端设备101、102、103上可以安装有各种客户端应用，例如车险定价类应用、网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。

终端设备101、102、103可以是具有显示屏的各种电子设备，包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。

服务器105可以是提供各种服务的服务器，例如对终端设备101、102、103上显示的车险定价类应用提供支持的后台服务器。后台服务器可以对接收到的数据获取请求等数据进行分析等处理，并将处理结果(例如人属性相关特征和车辆属性特征)反馈给终端设备。

需要说明的是，本申请实施例所提供的用于输出信息的方法一般由终端设备101、102、103执行，相应地，用于输出信息的装置一般设置于终端设备101、102、103中。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

继续参考图2，其示出了根据本申请的用于输出信息的方法的一个实施例的流程200。该用于输出信息的方法，包括以下步骤：

步骤201，获取目标用户的至少一种人属性特征和车辆属性特征。

在本实施例中，用于输出信息的方法运行于其上的电子设备(例如图1所示的终端设备)可以本地或者远程地从与上述电子设备网络连接的其他电子设备(例如图1所示的服务器)获取目标用户的至少一种人属性特征和车辆属性特征。在上述电子设备本地或者与上述电子设备网络连接的其他电子设备中可以存储有目标用户的至少一种人属性特征和车辆属性特征。

在本实施例中，目标用户可以是预设用户集合中的任何一个指定的用户，且可以获取到该指定用户的人属性特征和车辆属性特征。例如，目标用户可以既是车辆保险公司的车险用户又是预设用户集合中的用户，且可以通过预设规则确定车险用户与预设用户集合中的用户为同一实体用户，比如，预设规则可以是车险用户在车辆保险公司投保的保单中所预留的以下三项信息中的至少一项与预设用户集合中的用户相应信息相同，上述三项信息可以包括手机号码、身份证号码和姓名。

在本实施例中，目标用户的人属性特征是对目标用户作为人的各种属性的属性值进行特征提取后所得到的特征。例如，人的属性可以是姓名、性别、出生日期、手机号码、职业、收入、兴趣爱好、所在城市、驾驶习惯等等。作为示例，人属性特征可以是通过预先对大数据进行采集、存储、处理、分析、监控、预警等处理后所挖掘出的用户底层特征。

在本实施例中，目标用户的车属性特征是对目标用户所拥有的车辆的各种属性的属性值进行特征提取后所得的特征。例如，车辆的属性可以是车主姓名、车主性别、车主出生日期、车主手机号码、车型号、车厢数、车排量等等。作为示例，可以从车辆保险公司获取目标用户的车属性特征。

在本实施例的一些可选的实现方式中，车辆属性特征可以包括以下至少一项：车辆型号、车厢数、车排量和历史车辆事故相关信息，其中，历史车辆事故相关信息可以包括车辆保险对应的NCD系数、车辆历史年出险次数、车辆历史案均赔付额、车辆历史年化赔付额。

在本实施例的一些可选的实现方式中，上述至少一种人属性特征可以包括以下至少一项：自然人属性特征和网络行为特征。其中，自然人属性特征可以是对自然人的自然属性的属性值进行特征提取后所得到的特征。例如，自然属性可以是出生日期、性别、身体状况等人自身的生物特性相关联的属性。网络行为特征可以是对用户在网络上的行为数据进行特征提取后所得到的特征。例如，用户使用电子地图导航的数据，用户在网站中所浏览的网页和所输入的关键词，用户使用电子购物类应用的购物数据和评价数据，用户使用支付类应用的支付数据，用户在汽车相关网站中的输入信息等等。这里，网络行为特征可以包括以下至少一项：电子地图导航特征、兴趣画像特征、地址特征、常用应用特征、信用评分特征和网络搜索主题特征。可选地，其中，电子地图导航特征可以包括但不限于以下至少一项：里程数、驾车时是否疲劳、急加速频次、急减速频次、急转弯频次、城市画像、天气、逆光驾驶、道路类型、电子眼、高驾桥和路口类型。其中，里程数可以是用户在预设时间段内使用电子地图进行导航的每次导航的目的地和出发地之间的距离之和。驾车时是否疲劳可以通过用户使用电子地图进行导航的时间以及频次等进行判断后得出。急加速频次，急减速频次，急转弯频次也可以通过用户在使用电子地图进行导航的过程中用户终端的定位信息进行统计分析后得出。类似的，可以通过用户在使用电子地图进行导航的过程中的导航信息以及用户终端的定位信息得出其他电子地图导航特征。

步骤202，对于至少一种人属性特征中的每种人属性特征，将该种人属性特征导入预先训练的打分模型，得到与该种人属性特征对应的分数。

在本实施例中，基于步骤201中得到的至少一种人属性特征，上述电子设备可以对于至少一种人属性特征中的每种人属性特征，将该种人属性特征导入预先训练的打分模型，得到与该种人属性特征对应的分数。其中，上述打分模型用于表征人属性特征与分数之间的对应关系。

由于人属性特征是对人的属性的属性值进行特征提取后所得到的特征，该特征的特征维数高(例如，经常人属性特征的特征维数可能达到几十万维)且稀疏(不是所有的人属性特征都可以取到值)，为了降低人属性特征的特征维数，可以将每种人属性特征导入打分模型从而得到人属性特征对应的分数，实现了将高维数的人属性特征压缩到一维的分数。

在本实施例的一些可选的实现方式中，可以对于每种人属性特征预先训练同一个打分模型，这样，就可以将每种人属性特征都导入到上述同一个打分模型中。

在本实施例的一些可选的实现方式中，也可以对于每种人属性特征预先训练不同的打分模型，这样，就可以将每种人属性特征导入到与该人属性特征对应的打分模型中，得到与该种人属性特征对应的分数。

作为示例，打分模型可以是通过如下第一打分模型训练步骤得到的：

首先，可以获取初始打分模型和预先确定的第四样本数据集合，其中，第四样本数据集合中每个样本数据包括用户的一种人属性特征以及该用户的车辆事故发生频率残差，其中，用户的车辆事故发生频率残差是用户的历史车辆事故发生频率(例如，车辆出险频率)与用户的预测车辆事故发生频率的差值。

然后，可以利用机器学习方法，以第四样本数据集合中的每个样本数据中的人属性特征作为输入数据，以该用户的车辆事故发生频率残差作为相应的输出数据，训练上述初始打分模型。

最后，可以将训练后的上述初始打分模型确定为预先训练的打分模型。

作为示例，打分模型也可以是通过如下第二打分模型训练步骤得到的：

首先，可以获取初始打分模型和预先确定的第五样本数据集合，其中，第五样本数据集合中每个样本数据包括用户的一种人属性特征以及该用户的历史车辆事故发生频率(例如，历史车辆出险频率)。

然后，可以利用机器学习方法，以第五样本数据集合中的每个样本数据中的人属性特征作为输入数据，以该用户的历史车辆事故发生频率作为相应的输出数据，训练上述初始打分模型。

作为示例，打分模型也可以是通过如下第三打分模型训练步骤得到的：

首先，可以获取初始打分模型和预先确定的第六样本数据集合，其中，第六样本数据集合中每个样本数据包括用户的一种人属性特征以及该用户的历史车辆事故赔付率(例如，历史车险赔付率)。

然后，可以利用机器学习方法，以第六样本数据集合中的每个样本数据中的人属性特征作为输入数据，以该用户的历史车辆事故赔付率作为相应的输出数据，训练上述初始打分模型。

作为示例，打分模型还可以是通过如下第四打分模型训练步骤得到的：

首先，可以获取初始打分模型和预先确定的第七样本数据集合，其中，第七样本数据集合中每个样本数据包括用户的一种人属性特征以及该用户的历史预设时长内车辆事故损失值(例如，历史车险年化赔付额)。

然后，可以利用机器学习方法，以第七样本数据集合中的每个样本数据中的人属性特征作为输入数据，以该用户的历史预设时长内车辆事故损失值作为相应的输出数据，训练上述初始打分模型。

作为示例，打分模型还可以是通过如下第五打分模型训练步骤得到的：

首先，可以获取初始打分模型和预先确定的第八样本数据集合，其中，第八样本数据集合中每个样本数据包括用户的一种人属性特征以及该用户的历史车辆事故标准赔付率(例如，历史车险标准赔付率)。

然后，可以利用机器学习方法，以第八样本数据集合中的每个样本数据中的人属性特征作为输入数据，以该用户的历史车辆事故标准赔付率作为相应的输出数据，训练上述初始打分模型。

其中，上述初始打分模型可以是各种机器学习模型，例如，可以是二分类(BinaryClassification)模型、Tweedie回归(Tweedie Regression)模型等等。

步骤203，将拼接至少一种人属性特征中的每种人属性特征对应的分数和车辆属性特征后所得到的特征向量确定为预测用特征向量。

在本实施例中，用于输出信息的方法运行于其上的电子设备上可以将至少一种人属性特征中的每种人属性特征对应的分数和车辆属性特征进行拼接，并将拼接所得到的特征向量确定为预测用特征向量。

步骤204，将预测用特征向量导入预先训练的三种计算模型中的至少一种，得到与所导入至的至少一种计算模型中每种计算模型对应的预测值。

在本实施例中，上述电子设备可以将步骤203中所确定的预测用特征向量导入预先训练的三种计算模型中的至少一种，得到与所导入至的至少一种计算模型中每种计算模型对应的预测值。其中，上述三种计算模型可以包括：车辆事故发生频率计算模型、平均车辆事故损失值计算模型以及预设时长内车辆事故损失值计算模型。上述车辆事故发生频率计算模型用于表征特征向量与车辆事故发生频率之间的对应关系，上述平均车辆事故损失值计算模型用于表征特征向量与平均车辆事故损失值之间的对应关系，上述预设时长内车辆事故损失值计算模型用于表征特征向量与预设时长内车辆事故损失值之间的对应关系。

作为示例，车辆事故发生频率计算模型可以是技术人员基于对大量的特征向量和车辆事故发生频率(例如，车辆出险频率)的统计而预先制定的、存储有多个特征向量与车辆事故发生频率的对应关系的对应关系表；也可以是技术人员基于对大量数据的统计而预先设置并存储至上述电子设备中的、对特征向量中的一个或多个数值进行数值计算以得到用于表征车辆事故发生频率的计算公式。

在本实施例的一些可选的实现方式中，车辆事故发生频率计算模型可以为泊松分布。

基于上述可选实现方式，在本实施例的一些可选的实现方式中，车辆事故发生频率计算模型可以是采用如下第一训练步骤得到的：

首先，可以获取泊松分布的参数初始值和预先确定的第一样本数据集合，其中，第一样本数据集合中每个样本数据包括用户的特征向量以及该用户的历史车辆事故发生频率(例如，历史车辆出险频率)，其中，用户的特征向量是拼接该用户的至少一种人属性特征中的每种人属性特征对应的分数和车辆属性特征后所得到的特征向量。

其次，以第一样本数据集合中的每个样本数据中的用户的特征向量作为输入数据，以该样本数据中的用户的历史车辆事故发生频率作为相应的输出数据，训练泊松分布的参数。

最后，将训练后的泊松分布确定为预先训练的车辆事故发生频率计算模型。

作为示例，平均车辆事故损失值计算模型也可以是技术人员基于对大量的特征向量和平均车辆事故损失值(例如，车险案均赔付额)的统计而预先制定的、存储有多个特征向量与平均车辆事故损失值的对应关系的对应关系表；也可以是技术人员基于对大量数据的统计而预先设置并存储至上述电子设备中的、对特征向量中的一个或多个数值进行数值计算以得到用于表征平均车辆事故损失值的计算公式。

在本实施例的一些可选的实现方式中，平均车辆事故损失值计算模型可以为咖玛分布(Gamma Distribution)。

基于上述可选实现方式，在本实施例的一些可选的实现方式中，平均车辆事故损失值计算模型可以是采用如下第二训练步骤得到的：

首先，可以获取咖玛分布的参数初始值和预先确定的第二样本数据集合，其中，第二样本数据集合中每个样本数据包括用户的特征向量以及该用户的历史平均车辆事故损失值(例如，历史车险案均赔付额)，其中，用户的特征向量是拼接该用户的至少一种人属性特征中的每种人属性特征对应的分数和车辆属性特征后所得到的特征向量。

然后，可以以第二样本数据集合中的每个样本数据中的用户的特征向量作为输入数据，以该样本数据中的用户的历史平均车辆事故损失值作为相应的输出数据，训练咖玛分布的参数。

最后，将训练后的咖玛分布确定为预先训练的平均车辆事故损失值计算模型。

作为示例，预设时长内车辆事故损失值计算模型也可以是技术人员基于对大量的特征向量和预设时长内车辆事故损失值(例如，车险年化赔付额)的统计而预先制定的、存储有多个特征向量与预设时长内车辆事故损失值的对应关系的对应关系表；也可以是技术人员基于对大量数据的统计而预先设置并存储至上述电子设备中的、对特征向量中的一个或多个数值进行数值计算以得到用于表征预设时长内车辆事故损失值的计算公式。

在本实施例的一些可选的实现方式中，预设时长内车辆事故损失值计算模型可以为Tweedie类分布(Tweedie Distribution)。

基于上述可选实现方式，在本实施例的一些可选的实现方式中，预设时长内车辆事故损失值计算模型可以是采用如下第三训练步骤得到的：

首先，可以获取Tweedie类分布的参数初始值和预先确定的第三样本数据集合，其中，第三样本数据集合中每个样本数据包括用户的特征向量以及该用户的历史预设时长内车辆事故损失值(例如，历史车险年化赔付额)，其中，用户的特征向量是拼接该用户的至少一种人属性特征中的每种人属性特征对应的分数和车辆属性特征后所得到的特征向量。

然后，可以以第三样本数据集合中的每个样本数据中的用户的特征向量作为输入数据，以该样本数据中的用户的历史预设时长内车辆事故损失值作为相应的输出数据，训练Tweedie类分布的参数。

最后，将训练后的Tweedie类分布确定为预先训练的预设时长内车辆事故损失值计算模型。

步骤205，输出所得到的至少一种预测值。

在本实施例中，上述电子设备可以将步骤204中所得到的至少一种预测值进行输出。

在本实施例的一些可选的实现方式中，可以在上述电子设备中(例如，上述电子设备的显示屏幕中)呈现至少一种预测值。

在本实施例的一些可选的实现方式中，上述电子设备也可以将上述至少一种预测值发送给与上述电子设备网络连接的其他电子设备中，以供上述其他电子设备接收并呈现上述至少一种预测值。

继续参见图3，图3是根据本实施例的用于输出信息的方法的应用场景的一个示意图。在图3的应用场景中，首先，电子设备301从大数据服务器302获取目标用户的至少一种人属性特征303，以及从车辆保险公司服务器304获取目标用户的车辆属性特征305。然后，电子设备301对于至少一种人属性特征303中的每种人属性特征，将该种人属性特征导入预先训练的打分模型306，得到与该种人属性特征对应的分数307。接着，电子设备301拼接至少一种人属性特征中的每种人属性特征对应的分数307和车辆属性特征305得到预测用特征向量308。而后，电子设备301将预测用特征向量308导入预先训练的三种计算模型309中的至少一种，得到与所导入至的至少一种计算模型中每种计算模型对应的预测值310。最后，输出所得到的至少一种预测值310。

本申请的上述实施例提供的方法通过对目标用户的至少一种人属性特征中每种人属性特征采用打分的方法进行降维，实现将特征维数高且稀疏的人属性特征压缩为一维分数，再将至少一种人属性特征中的每种人属性特征对应的分数和特征维数低且稠密的车辆属性特征进行拼接，从而拼接后所得到的特征向量为特征维数低且稠密的特征向量，继而，将拼接后所得到的特征向量确定为预测用特征向量，再将预测用特征向量导入预先训练的三种计算模型中的至少一种，得到与所导入至的至少一种计算模型中每种计算模型对应的预测值，并输出所得到的至少一种预测值。从而，有效利用了特征维数高且稀疏的人属性特征，并结合车辆属性特征得到三种预测值中的至少一种，从而提高了信息输出的内容丰富性。

进一步参考图4，作为对上述各图所示方法的实现，本申请提供了一种用于输出信息的装置的一个实施例，该装置实施例与图2所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。

如图4所示，本实施例的用于输出信息的装置400包括：获取单元401、打分单元402、拼接单元403、预测单元404和输出单元405。其中，获取单元401，配置用于获取目标用户的至少一种人属性特征和车辆属性特征；打分单元402，配置用于对于上述至少一种人属性特征中的每种人属性特征，将该种人属性特征导入预先训练的打分模型，得到与该种人属性特征对应的分数，其中，上述打分模型用于表征人属性特征与分数之间的对应关系；拼接单元403，配置用于将拼接上述至少一种人属性特征中的每种人属性特征对应的分数和上述车辆属性特征后所得到的特征向量确定为预测用特征向量；预测单元404，配置用于将上述预测用特征向量导入预先训练的三种计算模型中的至少一种，得到与所导入至的至少一种计算模型中每种计算模型对应的预测值，其中，上述三种计算模型包括：车辆事故发生频率计算模型、平均车辆事故损失值计算模型以及预设时长内车辆事故损失值计算模型，上述车辆事故发生频率计算模型用于表征特征向量与车辆事故发生频率之间的对应关系，上述平均车辆事故损失值计算模型用于表征特征向量与平均车辆事故损失值之间的对应关系，上述预设时长内车辆事故损失值计算模型用于表征特征向量与预设时长内车辆事故损失值之间的对应关系；而输出单元405，配置用于输出所得到的至少一种预测值。

在本实施例中，用于输出信息的装置400的获取单元401、打分单元402、拼接单元403、预测单元404和输出单元405的具体处理及其所带来的技术效果可分别参考图2对应实施例中步骤201、步骤202、步骤203、步骤204和步骤205的相关说明，在此不再赘述。

在本实施例的一些可选的实现方式中，上述至少一种人属性特征可以包括以下至少一项：自然人属性特征和网络行为特征，上述网络行为特征可以包括以下至少一项：电子地图导航特征、兴趣画像特征、地址特征、常用应用特征、信用评分特征和网络搜索主题特征。

在本实施例的一些可选的实现方式中，上述车辆事故发生频率计算模型可以为泊松分布，上述平均车辆事故损失值计算模型可以为伽玛分布，上述预设时长内车辆事故损失值计算模型可以为Tweedie类分布。

在本实施例的一些可选的实现方式中，上述车辆事故发生频率计算模型可以是采用如下第一训练步骤得到的：获取泊松分布的参数初始值和预先确定的第一样本数据集合，其中，上述第一样本数据集合中每个样本数据包括用户的特征向量以及该用户的历史车辆事故发生频率，其中，用户的特征向量是拼接该用户的至少一种人属性特征中的每种人属性特征对应的分数和车辆属性特征后所得到的特征向量；以上述第一样本数据集合中的每个样本数据中的用户的特征向量作为输入数据，以该样本数据中的用户的历史车辆事故发生频率作为相应的输出数据，训练上述泊松分布的参数；将训练后的上述泊松分布确定为上述预先训练的车辆事故发生频率计算模型。

在本实施例的一些可选的实现方式中，上述平均车辆事故损失值计算模型可以是采用如下第二训练步骤得到的：获取咖玛分布的参数初始值和预先确定的第二样本数据集合，其中，上述第二样本数据集合中每个样本数据包括用户的特征向量以及该用户的历史平均车辆事故损失值，其中，用户的特征向量是拼接该用户的至少一种人属性特征中的每种人属性特征对应的分数和车辆属性特征后所得到的特征向量；以上述第二样本数据集合中的每个样本数据中的用户的特征向量作为输入数据，以该样本数据中的用户的历史平均车辆事故损失值作为相应的输出数据，训练上述咖玛分布的参数；将训练后的上述咖玛分布确定为上述预先训练的平均车辆事故损失值计算模型。

在本实施例的一些可选的实现方式中，上述预设时长内车辆事故损失值计算模型可以是采用如下第三训练步骤得到的：获取Tweedie类分布的参数初始值和预先确定的第三样本数据集合，其中，上述第三样本数据集合中每个样本数据包括用户的特征向量以及该用户的历史预设时长内车辆事故损失值，其中，用户的特征向量是拼接该用户的至少一种人属性特征中的每种人属性特征对应的分数和车辆属性特征后所得到的特征向量；以上述第三样本数据集合中的每个样本数据中的用户的特征向量作为输入数据，以该样本数据中的用户的历史预设时长内车辆事故损失值作为相应的输出数据，训练上述Tweedie类分布的参数；将训练后的上述Tweedie类分布确定为上述预先训练的预设时长内车辆事故损失值计算模型。

在本实施例的一些可选的实现方式中，上述车辆属性特征可以包括以下至少一项：车辆型号、车厢数、车排量和历史车辆事故相关信息。

下面参考图5，其示出了适于用来实现本申请实施例的电子设备的计算机系统500的结构示意图。图5示出的电子设备仅仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

如图5所示，计算机系统500包括中央处理单元(CPU，Central Processing Unit)501，其可以根据存储在只读存储器(ROM，Read Only Memory)502中的程序或者从存储部分508加载到随机访问存储器(RAM，Random Access Memory)503中的程序而执行各种适当的动作和处理。在RAM 503中，还存储有系统500操作所需的各种程序和数据。CPU 501、ROM502以及RAM 503通过总线504彼此相连。输入/输出(I/O，Input/Output)接口505也连接至总线504。

以下部件连接至I/O接口505：包括键盘、鼠标等的输入部分506；包括诸如阴极射线管(CRT，Cathode Ray Tube)、液晶显示器(LCD，Liquid Crystal Display)等以及扬声器等的输出部分507；包括硬盘等的存储部分508；以及包括诸如LAN(局域网，Local AreaNetwork)卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器510上，以便于从其上读出的计算机程序根据需要被安装入存储部分508。

特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分509从网络上被下载和安装，和/或从可拆卸介质511被安装。在该计算机程序被中央处理单元(CPU)501执行时，执行本申请的方法中限定的上述功能。需要说明的是，本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、RF等等，或者上述的任意合适的组合。

附图中的流程图和框图，图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本申请实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中，例如，可以描述为：一种处理器包括获取单元、打分单元、拼接单元、预测单元和输出单元。其中，这些单元的名称在某种情况下并不构成对该单元本身的限定，例如，输出单元还可以被描述为“输出预测值的单元”。

作为另一方面，本申请还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的装置中所包含的；也可以是单独存在，而未装配入该装置中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该装置执行时，使得该装置：获取目标用户的至少一种人属性特征和车辆属性特征；对于至少一种人属性特征中的每种人属性特征，将该种人属性特征导入预先训练的打分模型，得到与该种人属性特征对应的分数，其中，打分模型用于表征人属性特征与分数之间的对应关系；将拼接至少一种人属性特征中的每种人属性特征对应的分数和车辆属性特征后所得到的特征向量确定为预测用特征向量；将预测用特征向量导入预先训练的三种计算模型中的至少一种，得到与所导入至的至少一种计算模型中每种计算模型对应的预测值，其中，三种计算模型包括：车辆事故发生频率计算模型、平均车辆事故损失值计算模型以及预设时长内车辆事故损失值计算模型，车辆事故发生频率计算模型用于表征特征向量与车辆事故发生频率之间的对应关系，平均车辆事故损失值计算模型用于表征特征向量与平均车辆事故损失值之间的对应关系，预设时长内车辆事故损失值计算模型用于表征特征向量与预设时长内车辆事故损失值之间的对应关系；输出所得到的至少一种预测值。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本申请中所涉及的发明范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述发明构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims

1.一种用于输出信息的方法，包括：

获取目标用户的至少一种人属性特征和车辆属性特征；

对于所述至少一种人属性特征中的每种人属性特征，将该种人属性特征导入至预先训练的对应的打分模型，得到与该种人属性特征对应的分数，其中，所述打分模型用于表征人属性特征与分数之间的对应关系，且对于不同人属性特征所使用的打分模型不同，所述打分模型分别以用户的一种人属性特征作为输入，对应用户的车辆事故发生频率残差、历史车辆事故发生频率、历史车辆事故赔付率、历史预设时长内车辆事故损失值中至少一种作为输出训练得到；

将拼接所述至少一种人属性特征中的每种人属性特征对应的分数和所述车辆属性特征后所得到的特征向量确定为预测用特征向量；

将所述预测用特征向量导入预先训练的三种计算模型中的至少一种，得到与所导入至的至少一种计算模型中每种计算模型对应的预测值，其中，所述三种计算模型包括：车辆事故发生频率计算模型、平均车辆事故损失值计算模型以及预设时长内车辆事故损失值计算模型，所述车辆事故发生频率计算模型用于表征特征向量与车辆事故发生频率之间的对应关系，所述平均车辆事故损失值计算模型用于表征特征向量与平均车辆事故损失值之间的对应关系，所述预设时长内车辆事故损失值计算模型用于表征特征向量与预设时长内车辆事故损失值之间的对应关系；

输出所得到的至少一种预测值。

2.根据权利要求1所述的方法，其中，所述至少一种人属性特征包括以下至少一项：自然人属性特征和网络行为特征，所述网络行为特征包括以下至少一项：电子地图导航特征、兴趣画像特征、地址特征、常用应用特征、信用评分特征和网络搜索主题特征。

3.根据权利要求2所述的方法，其中，所述车辆事故发生频率计算模型为泊松分布，所述平均车辆事故损失值计算模型为伽玛分布，所述预设时长内车辆事故损失值计算模型为Tweedie类分布。

4.根据权利要求3所述的方法，其中，所述车辆事故发生频率计算模型是采用如下第一训练步骤得到的：

获取泊松分布的参数初始值和预先确定的第一样本数据集合，其中，所述第一样本数据集合中每个样本数据包括用户的特征向量以及该用户的历史车辆事故发生频率，其中，用户的特征向量是拼接该用户的至少一种人属性特征中的每种人属性特征对应的分数和车辆属性特征后所得到的特征向量；

以所述第一样本数据集合中的每个样本数据中的用户的特征向量作为输入数据，以该样本数据中的用户的历史车辆事故发生频率作为相应的输出数据，训练所述泊松分布的参数；

将训练后的所述泊松分布确定为所述预先训练的车辆事故发生频率计算模型。

5.根据权利要求4所述的方法，其中，所述平均车辆事故损失值计算模型是采用如下第二训练步骤得到的：

获取咖玛分布的参数初始值和预先确定的第二样本数据集合，其中，所述第二样本数据集合中每个样本数据包括用户的特征向量以及该用户的历史平均车辆事故损失值，其中，用户的特征向量是拼接该用户的至少一种人属性特征中的每种人属性特征对应的分数和车辆属性特征后所得到的特征向量；

以所述第二样本数据集合中的每个样本数据中的用户的特征向量作为输入数据，以该样本数据中的用户的历史平均车辆事故损失值作为相应的输出数据，训练所述咖玛分布的参数；

将训练后的所述咖玛分布确定为所述预先训练的平均车辆事故损失值计算模型。

6.根据权利要求5所述的方法，其中，所述预设时长内车辆事故损失值计算模型是采用如下第三训练步骤得到的：

获取Tweedie类分布的参数初始值和预先确定的第三样本数据集合，其中，所述第三样本数据集合中每个样本数据包括用户的特征向量以及该用户的历史预设时长内车辆事故损失值，其中，用户的特征向量是拼接该用户的至少一种人属性特征中的每种人属性特征对应的分数和车辆属性特征后所得到的特征向量；

以所述第三样本数据集合中的每个样本数据中的用户的特征向量作为输入数据，以该样本数据中的用户的历史预设时长内车辆事故损失值作为相应的输出数据，训练所述Tweedie类分布的参数；

将训练后的所述Tweedie类分布确定为所述预先训练的预设时长内车辆事故损失值计算模型。

7.根据权利要求6所述的方法，其中，所述车辆属性特征包括以下至少一项：车辆型号、车厢数、车排量和历史车辆事故相关信息。

8.一种用于输出信息的装置，包括：

获取单元，配置用于获取目标用户的至少一种人属性特征和车辆属性特征；

打分单元，配置用于对于所述至少一种人属性特征中的每种人属性特征，将该种人属性特征导入至预先训练的对应的打分模型，得到与该种人属性特征对应的分数，其中，所述打分模型用于表征人属性特征与分数之间的对应关系，且对于不同人属性特征所使用的打分模型不同，所述打分模型分别以用户的一种人属性特征作为输入，对应用户的车辆事故发生频率残差、历史车辆事故发生频率、历史车辆事故赔付率、历史预设时长内车辆事故损失值中至少一种作为输出训练得到；

拼接单元，配置用于将拼接所述至少一种人属性特征中的每种人属性特征对应的分数和所述车辆属性特征后所得到的特征向量确定为预测用特征向量；

预测单元，配置用于将所述预测用特征向量导入预先训练的三种计算模型中的至少一种，得到与所导入至的至少一种计算模型中每种计算模型对应的预测值，其中，所述三种计算模型包括：车辆事故发生频率计算模型、平均车辆事故损失值计算模型以及预设时长内车辆事故损失值计算模型，所述车辆事故发生频率计算模型用于表征特征向量与车辆事故发生频率之间的对应关系，所述平均车辆事故损失值计算模型用于表征特征向量与平均车辆事故损失值之间的对应关系，所述预设时长内车辆事故损失值计算模型用于表征特征向量与预设时长内车辆事故损失值之间的对应关系；

输出单元，配置用于输出所得到的至少一种预测值。

9.一种电子设备，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。

10.一种计算机可读存储介质，其上存储有计算机程序，其中，所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。