CN107566358B

CN107566358B - 一种风险预警提示方法、装置、介质及设备

Info

Publication number: CN107566358B
Application number: CN201710741402.0A
Authority: CN
Inventors: 鲁梦平; 戴云峰; 关盛裕; 罗锦坚; 詹勋昌
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2017-08-25
Filing date: 2017-08-25
Publication date: 2020-10-30
Anticipated expiration: 2037-08-25
Also published as: CN107566358A

Abstract

本申请提供一种风险预警提示方法、装置、介质及设备，该方法包括：获取在预设时间段内产生的针对用户的风险事件数据以及所述用户的属性信息，其中，风险事件数据包括各个风险事件在所述预设时间段内发生的次数和/或指定风险事件在预设时间段内发生的时长；根据所述风险事件数据以及用户的属性信息，生成所述用户的特征向量；将所述用户的特征向量输入预先训练得到的至少一个受损预测模型，得到所述用户在相应受损预测模型下的受损概率；根据第一概率阈值以及所述用户在各个受损预测模型下的受损概率，向所述用户对应的用户终端发送风险预警提示信息。本申请能够提高风险预警提示的准确率，节省资源。

Description

一种风险预警提示方法、装置、介质及设备

技术领域

本申请涉及信息安全技术领域，尤其涉及一种风险预警提示方法、装置、介质及设备。

背景技术

电信诈骗日益猖獗，给很多用户带来了财产损失。目前，很多用户选择在其对应的用户终端(比如手机、平板电脑等)中安装安全软件，利用安全软件实时检测针对该用户的各种风险事件，安全软件在用户使用户终端进行支付时，可根据检测到的风险事件向用户对应的用户终端反馈风险预警提示信息，以提醒用户其当前的支付行为是否可能会导致财产损失。其中，风险事件包括用户终端中感染的病毒、用户终端收到的诈骗电话和诈骗短信、用户终端连接过的风险WiFi、伪基站以及恶意网址等。现阶段，利用户终端中安装的安全软件对用户进行风险预警提示的方式为：

监听到用户发送的支付请求时，判断在接收到该支付请求之前的一定时长内是否检测到针对该用户的风险事件；如果是，则向该用户所对应的用户终端返回风险预警提示信息。

发明人发现，在实际应用中，单一的风险事件并不一定会导致用户财产损失，而现阶段的这种风险预警提示方式，只要检测到针对该用户的任一风险事件，即向用户返回风险预警提示信息，不仅会出现风险预警提示的准确率较低的问题，还会由于频繁向用户终端发送风险预警提示信息带来资源浪费的问题。

发明内容

本申请提供一种风险预警提示方法、装置、介质及设备，用于解决现有技术中存在的风险预警提示的准确率较低以及资源浪费的问题。

第一方面，本申请实施例提供一种风险预警提示方法，包括：

获取在预设时间段内产生的针对用户的风险事件数据以及所述用户的属性信息，其中，所述风险事件数据包括各个风险事件在所述预设时间段内发生的次数和/或指定风险事件在预设时间段内发生的时长；

根据所述风险事件数据以及用户的属性信息，生成所述用户的特征向量；

将所述用户的特征向量输入预先训练得到的至少一个受损预测模型，得到所述用户在相应受损预测模型下的受损概率；

根据第一概率阈值以及所述用户在各个受损预测模型下的受损概率，向所述用户对应的用户终端发送风险预警提示信息。

第二方面，本申请实施例提供一种风险预警提示装置，包括：

获取模块，用于获取在预设时间段内产生的针对用户的风险事件数据以及所述用户的属性信息，其中，所述风险事件数据包括各个风险事件在所述预设时间段内发生的次数和/或指定风险事件在预设时间段内发生的时长；

生成模块，用于根据所述风险事件数据以及用户的属性信息，生成所述用户的特征向量；

概率计算模块，用于将所述用户的特征向量输入预先训练得到的至少一个受损预测模型，得到所述用户在相应受损预测模型下的受损概率；

反馈模块，用于根据第一概率阈值以及所述用户在各个受损预测模型下的受损概率，向所述用户对应的用户终端发送风险预警提示信息。

第三方面，本申请实施例提供一种非易失性计算机存储介质，所述计算机存储介质存储有可执行程序，该可执行程序被处理器执行实现上述风险预警提示方法的步骤。

第四方面，本申请实施例提供一种计算设备，包括存储器、处理器及存储在存储器上的计算机程序，所述处理器执行所述程序时实现上述风险预警提示方法的步骤。

利用本申请实施例提供的风险预警提示方法、装置、介质及设备，具有以下有益效果：

获取在预设时间段内产生的针对用户的风险事件数据以及用户的属性信息，利用预先训练的受损预测模型确定用户的受损概率，从而根据该受损概率与第一概率阈值，向该用户的用户终端发送风险预警提示信息，即，通过综合分析用户在一定时间段内的所有的风险事件以及用户的属性信息，向用户反馈风险预警提示，相比于现有技术中检测到任一风险事件即向用户反馈风险预警提示的方式，本申请实施例的能够提高风险预警提示的准确率，且不会频繁的向用户终端发送风险预警提示信息，从而避免了由于频繁向用户终端发送风险预警提示信息所带来的资源浪费的问题。

附图说明

通过参考附图阅读下文的详细描述，本申请示例性实施例的上述以及其他目的、特征和优点将变得易于理解。在附图中，以示例性而非限制性的方式示出了本申请的若干实施方式，其中：

图1为本申请实施例的应用场景示意图；

图2为本申请实施例一提供的风险预警提示方法的流程示意图；

图3为本申请实施例一提供的向用户终端发送风险预警提示信息的一方法流程示意图；

图4为本申请实施例一提供的确定用户的最终受损概率的方法流程示意图；

图5为本申请实施例一提供的向用户终端发送风险预警提示信息的另一方法流程示意图；

图6为本申请实施例一提供的确定训练样本集的方法流程示意图；

图7为本申请实施例一提供的确定样本用户的特征向量的方法流程示意图；

图8为本申请实施例一提供的从白样本集中筛选出可靠白样本集的方法流程示意图；

图9为本申请实施例一提供的设置第二概率阈值的方法流程示意图；

图10为本申请实施例一提供的根据黑样本集以及筛选出的可靠白样本集确定训练样本集的方法流程示意图；

图11为本申请实施例一提供的根据抽取的第二数目个样本确定训练样本集的方法流程示意图；

图12为本申请实施例一提供的风险预警提示方法的一示例性实施过程的流程示意图；

图13为本申请实施例一提供的风险预警提示方法的另一示例性实施过程的流程示意图；

图14为本申请实施例一提供的风险预警提示方法的又一示例性实施过程的流程示意图；

图15为本申请实施例一提供的训练得到受损预测模型的示例性实施过程的流程示意图；

图16为本申请实施例二提供的风险预警提示装置的结构示意图；

图17为本申请实施例二提供的计算设备的硬件结构示意图。

具体实施方式

首先参考图1，如图1所示，为本申请实施例提供的风险预警提示方案的应用场景示意图，包括用户终端101和服务器102，其中，用户终端101中安装有安全软件(比如腾讯管家等)，安全软件用于收集针对用户10的风险事件数据以及用户10的属性信息，并将收集到的针对用户10的风险事件数据以及用户10的属性信息发送至服务器102进行存储。服务器102响应于用户10通过用户终端101发送的网络访问请求或者支付请求，获取在预设时间段内产生的针对用户10的风险事件数据以及用户10的属性信息，其中，所述风险事件数据包括各个风险事件在所述预设时间段内发生的次数和/或指定风险事件在预设时间段内发生的时长；根据所述风险事件数据以及用户10的属性信息，生成用户10的特征向量；将用户10的特征向量输入预先训练得到的至少一个受损预测模型，得到用户10在相应受损预测模型下的受损概率；根据第一概率阈值以及用户10在各个受损预测模型下的受损概率，向用户10对应的用户终端101发送风险预警提示信息。进一步地，向用户终端101中的安全软件发送风险预警提示信息，用户终端101通过安全软件显示服务器102发送的风险预警提示信息。其中，用户终端101和服务器102通过可以通过局域网、广域网或移动互联网等通信网络进行通信；用户终端101可以为便携设备(例如：手机、平板、笔记本电脑等)，也可以为个人电脑(PC，Personal Computer)等。

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请可能的实施方式作进一步描述。

实施例一

下面结合图1的应用场景，对本申请示例性实施方式的风险预警提示方法进行说明。需要注意的是，上述应用场景仅是为了便于理解本申请的精神和原理而示出，本申请的实施方式在此方面不受任何限制。相反，本申请的实施方式可以应用于适用的任何场景。

如图2所示，为本申请实施例提供一种风险预警提示方法的流程示意图，包括：

步骤201，获取在预设时间段内产生的针对用户的风险事件数据以及所述用户的属性信息。

具体实施时，可以在监听到风险预警触发事件时，开始执行步骤201，风险预警触发事件可以为用户发送的支付请求、到达预设的风险预警周期或者用户发送的获取风险预警的请求等，这里不做限定。用户的属性信息可以为该用户在预设时间段的结束时间点的属性信息，也可以为该用户在预设时间段内的任一时间点的属性信息，这里不做限定。

可选地，预设时间段的结束时间点为当前时间点，预设时间段对应的时长可以为7天、2天或其它数值。

具体实施时，获取在预设时间段内产生的针对用户的所有风险事件；对获取的风险事件进行分类；统计并保存每类风险事件发生的次数和/或获取的风险事件中指定风险事件在预设时间段内发生的时长。

需要说明的是，本申请实施例所涉及的风险事件数据包括各个风险事件在预设时间段内发生的次数和/或指定风险事件在预设时间段内发生的时长。其中，指定风险事件为可统计发生时长的风险事件，比如拨打诈骗电话的时长、接听诈骗电话的时长、访问恶意网址的时长等。

针对用户的风险事件数据可以包括以下一项或多项：

用户中病毒次数、用户中系统漏洞病毒次数、用户中账号病毒次数、用户中支付病毒的次数、用户中黄色播放器病毒的次数、用户收到诈骗短信次数、用户收到伪基站短信次数、用户访问恶意网址次数、用户接听诈骗电话次数、用户拨打诈骗电话次数、用户拨打诈骗电话时长、用户接听诈骗电话时长、用户连接虚假WIFI次数等。

其中，伪基站(Pseudo Base-Station)：即假基站，伪基站一般由主机和笔记本电脑组成，通过短信群发器、短信发信机等相关设备搜索以该伪基站为中心的一定半径范围内的手机卡信息，通过伪装成运营商的基站，冒用他人手机号码强行向其搜索到的手机发送诈骗、广告推销等短信。

病毒(Mobile Phone Virus)：指在用户不知情或未授权的情况下，在用户对应的用户终端系统中安装、运行的具有违反国家相关法律法规行为或者为了达到不正当目的的代码模块、代码片段或可执行软件。

诈骗短信(Suspicious Short Messages)：是指通过虚假内容骗取用户金钱或财务的短信。

诈骗电话(Suspicious Call)：是指通过虚假内容骗取用户金钱或财务的电话。

风险WiFi(Risky WiFi)：黑客或不法分子通过搭建热点、或攻击热点，来对连在热点中的用户终端进行信息、文件窃取，该热点可以称为风险WiFi。

恶意网址(Malicious Url)：是指恶意种植木马、病毒等恶意程序在网站内，通过“伪装的网站服务内容”诱导用户访问该网站，一旦进入这些网站，便会触发网站内种植下的木马、病毒等程序，导致用户终端被感染，面临丢失帐号或者隐私信息等危险。

需要说明的是，本申请实施例所涉及的用户的属性信息包括用户的年龄、性别、职业、学历以及地理位置等信息。

实际应用中，针对不同用户群体可能会由于不同的风险事件而受损，本申请实施例可根据用户的属性信息确定用户所属的群体，从而更加准确的确定是否发送风险预警提示。

本申请实施例，将用户的属性信息作为用户的一部分特征，通过将用户的属性信息输入受损预测模型，确定出该用户的受损概率，具体实施方式将在下文中进行介绍。

步骤202，根据所述风险事件数据以及用户的属性信息，生成所述用户的特征向量。

具体实施时，用户的特征向量的生成方式与下文将提到的样本用户的特征向量的生成方式相同，这里以用户的特征向量的生成方式为例进行说明：

预先设置特征向量模板，该特征向量模板中个元素的初始值为0；针对用户的风险事件数据，将特征向量模板中用于标识相应风险事件数据的元素的值更新为相应风险事件数据对应的值；针对用户的属性信息，将特征向量模板中用于标识相应属性信息的元素的值更新为对应值，得到该用户的初始特征向量；对该用户的初始特征向量进行归一化处理，得到该用户的特征向量。

举例说明，假设在预设时间段内产生的针对用户的风险事件数据包括用户收到伪基站短信次数、用户访问恶意网址次数、用户拨打诈骗电话时长以及用户接听诈骗电话时长，用户的属性信息包括年龄、性别、职业，其中，不同年龄段对应不同的取值，不同性别对应不同取值，不同职业对应不同取值。进一步假设，用户收到伪基站短信次数为10、用户访问恶意网址次数为2、用户拨打诈骗电话时长为30秒以及用户接听诈骗电话时长为60秒，年龄为50岁(假设50所属年龄段为第一年龄段)、性别为女、职业为工人。设置特征向量模板[0,0,0,0,0,0,0,0,0,0]，该特征向量模板中从左到右依次表示用户收到伪基站短信次数、用户访问恶意网站次数、用户拨打诈骗电话时长、用户接听诈骗电话时长、第一年龄段、第二年龄段、男、女、工人、律师，在特征向量中以布尔值的形式表示用户的属性信息，则得到用户的初始特征向量[10,2,30,60,1,0,0,1,1,0]，即，将用户的属性信息在向量中对应的元素的值置为1；对初始特征向量[10,2,30,60,1,0,0,1,1,0]进行归一化处理得到用户的特征向量。

步骤203，将所述用户的特征向量输入预先训练得到的至少一个受损预测模型，得到所述用户在相应受损预测模型下的受损概率。

具体实施时，预先根据样本用户的特征向量以及样本用户所属的类别，训练得到至少一个受损预测模型，其中，可根据不同的二分类算法训练得到不同的二分类模型，将各个二分类模型作为受损预测模型，具体的受损预测模型的训练方式将在下文中进行详细介绍。

本步骤中，针对每个受损预测模型，将用户的特征向量输入该受损预测模型后，得到该受损预测模型的输出，该受损预测模型的输出即为用户在该受损预测模型下的受损概率。

步骤204，根据第一概率阈值以及所述用户在各个受损预测模型下的受损概率，向所述用户对应的用户终端发送风险预警提示信息。

具体实施时，第一概率阈值的大小需要根据实际应用场景或者技术人员的经验设定，这里不做限定。本步骤中，综合考虑用户在各个受损预测模型下的受损概率与第一概率阈值，向用户对应的用户终端发送风险预警提示信息。其中，用户对应的用户终端为用户登录并使用的终端。

本申请实施例，获取在预设时间段内产生的针对用户的风险事件数据以及用户的属性信息，利用预先训练的受损预测模型确定用户的受损概率，从而根据该受损概率与第一概率阈值，向该用户的用户终端发送风险预警提示信息，即，通过综合分析用户在一定时间段内的所有的风险事件以及用户的属性信息，向用户反馈风险预警提示，相比于现有技术中检测到任一风险事件即向用户反馈风险预警提示的方式，本申请实施例的能够提高风险预警提示的准确率，且不会频繁的向用户终端发送风险预警提示信息，从而避免了由于频繁向用户终端发送风险预警提示信息所带来的资源浪费的问题。

可选地，按照图3提供的内容，根据第一概率阈值以及所述用户在各个受损预测模型下的受损概率，向所述用户对应的用户终端发送受损风险预警提示信息：

步骤301，根据所述用户在各个受损预测模型下的受损概率，确定所述用户的最终受损概率。

步骤302，判断所述用户的最终受损概率是否超过所述第一概率阈值，若是，执行步骤303，否则，执行步骤304。

步骤303，向所述用户对应的用户终端发送风险预警提示信息。

具体实施时，若所述用户的最终受损概率超过所述第一概率阈值，则向所述用户的用户终端发送风险预警提示信息。

步骤304，不向所述用户对应的用户终端发送风险预警提示信息。

具体实施时，若用户的最终受损概率超过第一概率阈值，则向所述用户对应的用户终端发送风险预警提示信息。若用户的最终受损概率未超过第一概率阈值，则不向用户对应的用户终端发送风险预警提示信息，可选地，若用户的最终受损概率未超过第一概率阈值，可向用户对应的用户终端发送当前网络环境相对安全提示信息。

可选地，在仅包括一个受损预测模型的情况下，将所述用户在该受损模型下的受损概率作为所述用户的最终受损概率。

具体实施时，在仅包括一个受损预测模型的情况下，将该用户在该受损模型下的受损概率作为该用户的最终受损概率。

可选地，在包括多个受损预测模型的情况下，按照图4提供的内容，确定所述用户的最终受损概率：

步骤401，计算所述用户在各个受损预测模型下的受损概率的加权求和结果。

具体实施时，针对每个受损预测模型，预先设置该受损预测模型对应的权值；计算用户在该受损预测模型下的受损概率与该受损预测模型对应的权值的乘积，得到该受损预测模型对应的乘积；计算各个受损预测模型对应的乘积的和值，得到用户在各个受损预测模型下的受损概率的加权求和结果。可选地，各个受损预测模型对应的权值之和等于1。

举例说明，假设包括第一受损预测模型、第二受损预测模型以及第三受损预测模型，第一受损预测模型对应的权值为a、第二受损预测模型对应的权值为b、第三受损预测模型对应的权值为c，用户在第一受损预测模型下的受损概率为P1、在第二受损预测模型下的受损概率为P2、在第三受损预测模型下的受损概率为P3，则用户在各个受损预测模型下的受损概率的加权求和结果H的计算公式为：

H＝a×P1+b×P 2+c×P3

步骤402，将所述加权求和结果作为所述用户的最终受损概率。

图4提供的内容中，将加权求和结果作为用户的最终受损概率，仅是在包括多个受损预测模型的情况下，确定用户的最终受损概率的一种可选地实施方式，还可以计算用户在各个受损预测模型下的受损概率的均值或者均方差，将该均值作为用户的最终受损概率。

可选地，在包括多个受损预测模型的情况下，按照图5提供的内容，根据第一概率阈值以及所述用户在各个受损预测模型下的受损概率，向所述用户对应的用户终端发送风险预警提示信息：

步骤501，统计所述用户在各个受损预测模型下的受损概率中，超过所述第一概率阈值的受损概率的个数以及未超过所述第一概率阈值的受损概率的个数。

步骤502，判断超过所述第一概率阈值的受损概率的个数是否小于未超过所述第一概率阈值的受损概率的个数，若是，执行步骤504，否则，执行步骤503。

步骤503，向所述用户对应的用户终端发送风险预警提示信息。

若超过所述第一概率阈值的受损概率的个数大于或等于未超过所述第一概率阈值的受损概率的个数，则向所述用户对应的用户终端发送风险预警提示信息。

步骤504，不向所述用户对应的用户终端发送风险预警提示信息。

可选地，若超过所述第一概率阈值的受损概率的个数小于未超过所述第一概率阈值的受损概率的个数，则可向用户对应的用户终端发送当前网络环境相对安全提示信息。

可选地，可预先按照以下方式训练得到任一受损预测模型：

基于确定的训练样本集中各个样本用户的特征向量以及相应样本用户所属的类别，利用预设二分类算法训练得到所述任一受损预测模型，其中，所述样本用户的特征向量预先根据针对样本用户的风险事件数据以及样本用户的属性信息确定，样本用户所属的类别为受损类别或未受损类别。

具体实施时，利用确定的训练样本集中各个特征向量以及相应特征向量对应的样本用户用所属的类别，对预设二分类算法对应的数学模型中的未知参数进行训练，以确定未知参数的具体取值，将未知参数确定后的预设分类算法对应的数学模型确定为训练得到的受损预测模型。其中，训练得到的受损预测模型为二分类模型。

其中，预设二分类算法可以为逻辑斯蒂回归算法、随机森林算法、决策树算法、贝叶斯算法等，根据不同的二分类算法训练得到的相应受损预测模型的具体过程为现有技术，这里不做详述。样本用户对应的风险事件数据参考上文中涉及的用户对应的风险事件数据，这里不做详述。

利用本申请实施例，可训练得到多个二分类模型，可选地，根据不同的二分类算法，训练得到不同的受损预测模型。

可选地，确定向用户对应的用户终端发送风险预警提示信息的同时将该用户所属的类别确定为受损类别，确定不向用户对应的用户终端发送风险预警提示信息的同时将该用户所属的类别确定为未受损类别。

具体实施时，若到达训练得到的受损预测模型的更新时间点，获取在该更新时间点与上一更新时间点之间保存的所属的类别为受损类别的用户以及所属的类别为未受损类别的用户；针对在该更新时间点与上一更新时间点之间保存的所属的类别为未受损类别的每个用户，若该用户出现在该更新时间点与上一更新时间点之间保存的所属的类别为受损类别的用户中，则将该用户所属的类别更改为受损类别；将所属的类别更改后的用户的特征向量以及更改后所属的类别作为样本用户存入确定的训练样本集，得到新训练样本集，利用新训练样本集对训练得到的受损预测模型进行再次训练，以达到定期更新受损预测模型的目的。

可选地，按照图6提供的内容，确定所述训练样本集：

步骤601，将所属的类别为受损类别的各个样本用户的特征向量以及受损类别对应存入黑样本集。

步骤602，将所属的类别为未受损类别的各个样本用户的特征向量以及未受损类别对应存入白样本集；其中，一个样本包括特征向量以及该特征向量对应的样本用户所属的类别。

具体实施时，黑样本集中存储了样本用户的特征向量以及样本用户所属的受损类别，白样本集中存储了样本用户的特征向量以及样本用户所属的未受损类别。其中，任意一个样本包括特征向量以及该特征向量对应的样本用户所属的类别，具体的，黑样本集中的任意一个样本包括特征向量以及该特征向量对应的样本用户所属的受损类别，白样本集中的任意一个样本包括特征向量以及该特征向量对应的样本用户所属的受损类别。

步骤603，利用所述黑样本集，从所述白样本集中筛选出可靠白样本集。

具体实施时，将未向网络侧的服务器上传受损信息的用户所属的类别确定为未受损类别，然而，这其中可能会包括实际已经受损，但并未上传受损信息的用户，即，白样本集中一些特征向量对应的样本用户实际所属的类别为受损类别。而黑样本集中的样本用户均为已上传受损信息的用户，因此认为黑样本集中的特征向量实际所属的类别均为受损类别，即黑样本集中的样本比较可靠。

本步骤中，根据可靠的黑样本集，从白样本集中筛选出可靠的白样本集，可靠的白样本集中的特征向量实际所属的类别均为未受损类别。

步骤604，根据所述黑样本集以及筛选出的可靠白样本集，确定所述训练样本集。

具体实施时，可将黑样本集以及筛选出的可靠白样本集组成的一个样本集，作为训练样本集，或者，随机从黑样本集以及筛选出的白样本集中抽取一定数量的样本，作为训练样本集，也可按照其它方式确定训练样本集，这里不做限定。

本申请实施例，根据可靠的黑样本集，从白样本集中筛选出可靠白样本集，进而根据可靠的黑样本集和可靠的白样本集，确定训练样本集，从而使得到的训练样本集中的样本更加准确，进而使得训练得到的受损预测模型更加稳定可靠。

可选地，按照图7提供的内容，确定样本用户的特征向量：

步骤701，针对保存的所属的类别为受损类别的每个样本用户，根据该样本用户在受损时间点的属性信息以及在受损时间点之前的预设时长内产生的针对该样本用户的风险事件数据，生成该样本用户的特征向量。

步骤702，针对保存的所属的类别为未受损类别的每个样本用户，根据该样本用户在所述受损时间点的属性信息以及在所述受损时间点之前的预设时长内产生的针对该样本用户的风险事件数据，生成该样本用户的特征向量，其中，所述预设时间段的开始时间点晚于所述受损时间点。

实际应用中，一些用户在受到财产损失时，会向网络侧的服务器上传其受损信息，同时，网络侧实时获取并保存用户对应的风险事件数据以及用户的属性信息，其中，受损信息可以包括受损时间点以及受损金额等。

本申请实施例涉及两种类别的样本用户，其中，针对所属的类别为受损类别的样本用户，根据该样本用户在受损时间点的属性信息以及在受损时间点之前的预设时长内产生的针对该样本用户的风险事件数据，生成该样本用户的特征向量，从而得到所属的类别为受损类别的各个样本用户的特征向量；针对所属的类别为受损类别的样本用户的每个受损时间点，获取所属的类别为未受损类别的每个样本用户在该受损时间点的属性信息以及在该受损时间点之前的预设时长内产生的针对该样本用户的风险事件数据，生成该样本用户的特征向量，从而得到所属的类别为未受损类别的各个样本用户的特征向量。样本用户的特征向量的生成方式详见上文，这里不做赘述。可选地，受损时间点之前的预设时长对应的时间段中的开始时间点可以为该受损时间点，预设时长的大小可根据实际应用场景设定，这里不做限定。其中，也可先执行步骤702，后执行步骤701，或者步骤701和步骤702可同时执行，这里不对二者执行顺序进行限定。

可选地，按照图8提供的内容，利用所述黑样本集，从所述白样本集中筛选出可靠白样本集：

步骤801，从所述黑样本集中抽取第一数目个样本，并将所述黑样本集中剩余的样本存入新黑样本集。

具体实施时，以无放回采样方式，从黑样本集中随机抽取第一数目个样本，同时将黑样本集中剩余的样本存入新黑样本集。其中，第一数目小于黑样本集中的样本总个数，具体的第一数目的大小可根据实际应用场景设定。

步骤802，将所述第一数目个样本存入所述白样本集，得到新白样本集。

具体实施时，将第一数目个样本中各个特征向量对应的样本用户所属的类别由受损类别更新为未受损类别，将所属的类别更新后的第一数目个样本存入白样本集，得到新白样本集。

步骤803，根据所述新黑样本集以及所述新白样本集，利用预设二分类算法，训练得到样本筛选模型。

具体实施时，训练得到样本筛选模型的具体实施过程可参考训练得到任一受损预测模型的具体实施过程，这里不做赘述。样本筛选模型用于计算各个样本用户的受损概率，即将样本用户的特征向量作为样本筛选模型的输入，得到样本筛选模型的输出，该输出为该样本用户的受损概率。

步骤804，针对所述白样本集中的每个特征向量，利用所述样本筛选模型确定该特征向量对应的样本用户的受损概率。

具体实施时，针对未存入第一数目个样本的白样本集中的每个特征向量，利用样本筛选模型确定该特征向量对应的样本用户的受损概率。

步骤805，判断该特征向量对应的样本用户的受损概率是否超过设置的第二概率阈值，若是，执行步骤807，否则，执行步骤806。

具体实施时，若该特征向量对应的样本用户的受损概率未超过设置的第二概率阈值，则说明该特征向量对应的样本用户实际所属的类别为未受损类别，并执行步骤806，若该特征向量对应的样本用户的受损概率超过设置的第二概率阈值，则说明该特征向量对应的样本用户实际所属的类别为受损类别，并执行步骤807。

步骤806，将该特征向量对应的样本存入所述可靠白样本集。

步骤807，确定该特征向量对应的样本为不可靠白样本，并丢弃该不可靠白样本。

本申请实施例，将可靠的黑样本集中的第一数目个样本作为白样本存入白样本集，得到新白样本集，同时将黑样本集中剩余的黑样本存入新黑样本集，并根据新黑样本集和新白样本集训练得到样本筛选模型，利用样本筛选模型对白样本集中的样本进行筛选，从而得到可靠的白样本集。

可选地，按照图9提供的内容，设置第二概率阈值：

步骤901，利用所述样本筛选模型，确定所述第一数目个样本中的每个特征向量对应的样本用户的受损概率。

具体实施时，利用样本筛选模型，确定出第一数目个样本中的每个特征向量对应的样本用户的受损概率，即确定出第一数目个所属的类别为受损类别的样本用户的受损概率，由于第一数目个样本中各个样本实际所属的类别为受损类别，此时，可根据得到的第一数目个受损概率确定用于确定可靠白样本集的第二概率阈值。

步骤902，将所述第一数目个特征向量对应的各个样本用户的受损概率的均值作为第二概率阈值。

具体实施时，计算第一数目个特征向量对应的各个样本用户的受损概率的均值，作为第二概率阈值。

图9提供的内容仅为一种确定第二概率阈值的可选实施方式，也可将第一数目个特征向量对应的各个样本用户的受损概率中的最小值作为第二概率阈值，或者，从第一数目个特征向量对应的各个样本用户的受损概率中随机抽取一个受损概率作为第二概率阈值，还可根据实际应用场景或经验，设定第二阈值的大小。

可选地，按照图10提供的内容，根据所述黑样本集以及筛选出的可靠白样本集，确定所述训练样本集：

步骤1001，按照有放回采样的方式，从所述黑样本集以及所述可靠白样本集中抽取第二数目个样本。

具体实施时，按照有放回采样的方式抽取样本，可保证用于训练不同受损预测模型的训练样本集的独立性，使得训练出的受损预测模型更加可靠。将黑样本集以及可靠白样本集组成一个样本集，并从该样本集中抽取第二数目个样本。第二数目小于该样本集中的总样本数，具体的第二数目的大小可根据实际应用场景设定。

步骤1002，根据抽取的第二数目个样本，确定所述训练样本集。

具体实施时，可将抽取的第二数目个样本组成的集合，作为训练样本集，也可从第二数目个样本中随机抽取一定数量的样本，并将抽取的样本组成的集合作为训练样本集。

可选地，按照图11提供的内容，根据抽取的第二数目个样本，确定所述训练样本集：

步骤1101，从第二数目个样本中，所属的类别为未受损类别的样本中抽取第三数目个样本，作为未受损训练样本集，其中，第二数目不小于第三数目。

具体实施时，确定第二数目个样本中所属的类别为未受损类别的样本，并以无放回采样方式从确定该所属的类别为未受损类别的样本中随机抽取第三数目个样本。

步骤1102，从第二数目个样本中，所属的类别为受损类别的样本中抽取第三数目个样本，作为受损训练样本集。

具体实施时，确定第二数目个样本中所属的类别为受损类别的样本，并以无放回采样方式从确定该所属的类别为受损类别的样本中随机抽取第三数目个样本。

步骤1103，将所述未受损训练样本和所述受损训练样本组成所述训练样本集。

具体实施时，将抽取的第三数目个未受损样本以及抽取的第三数目个受损样本组成一个集合，并将该集合确定为训练样本集。本步骤中，得到的训练样本集中的受损样本和未受损样本数目相同。

其中，不对步骤1101和步骤1102执行顺序进行限定，也可先执行步骤1102再执行步骤1101，或者，步骤1101和步骤1102同时执行。

本申请实施例，可使得到的训练样本集中所属的类别为受损类别的样本的个数与所属的类别为未受损类别的样本的个数相同，从而使得训练样本集为类平衡样本集，进而使得训练得到的受损预测模型更加稳定可靠。

图11提供的内容仅为一种可选实施方式，也可从第二数目个样本中，所属的类别为未受损类别的样本中抽取第三数目个样本，从第二数目个样本中，所属的类别为受损类别的样本中抽取第四数目个样本，将抽取第三数目个样本和第四数目个样本组成的集合作为训练样本集。进一步地，第三数目与第四数目差值的绝对值不大于指定数值，指定数值的大小可根据实际应用场景设定，比如指定数据为10、15或者20。

下面根据图12提供的内容，介绍本申请实施例提供的风险预警提示方法的一示例性实施过程：

步骤1201，获取在预设时间段内产生的针对用户的风险事件数据以及所述用户的属性信息，其中，所述风险事件数据包括各个风险事件在所述预设时间段内发生的次数和/或指定风险事件在预设时间段内发生的时长。

步骤1202，根据所述风险事件数据以及用户的属性信息，生成所述用户的特征向量。

步骤1203，将所述用户的特征向量输入预先训练得到的一个受损预测模型，得到所述用户在该受损预测模型下的受损概率。

步骤1204，判断所述用户在该受损模型下的受损概率是否超过第一概率阈值，若是，执行步骤1205，否则，执行步骤1206。

步骤1205，向所述用户对应的用户终端发送风险预警提示信息。

步骤1206，不向所述用户对应的用户终端发送风险预警提示信息。

下面根据图13提供的内容，介绍本申请实施例提供的风险预警提示方法的另一示例性实施过程：

步骤1301，获取在预设时间段内产生的针对用户的风险事件数据以及所述用户的属性信息，其中，所述风险事件数据包括各个风险事件在所述预设时间段内发生的次数和/或指定风险事件在预设时间段内发生的时长。

步骤1302，根据所述风险事件数据以及用户的属性信息，生成所述用户的特征向量。

步骤1303，将所述用户的特征向量输入预先训练得到的多个受损预测模型，得到所述用户在相应受损预测模型下的受损概率。

步骤1304，计算所述用户在各个受损预测模型下的受损概率的加权求和结果。

步骤1305，将所述加权求和结果作为所述用户的最终受损概率。

步骤1306，判断所述用户的最终受损概率是否超过第一概率阈值，若是，执行步骤1307，否则，执行步骤1308。

步骤1307，向所述用户对应的用户终端发送风险预警提示信息。

步骤1308，不向所述用户对应的用户终端发送风险预警提示信息。

下面根据图14提供的内容，介绍本申请实施例提供的风险预警提示方法的又一示例性实施过程：

步骤1401，获取在预设时间段内产生的针对用户的风险事件数据以及所述用户的属性信息，其中，所述风险事件数据包括各个风险事件在所述预设时间段内发生的次数和/或指定风险事件在预设时间段内发生的时长。

步骤1402，根据所述风险事件数据以及用户的属性信息，生成所述用户的特征向量。

步骤1403，将所述用户的特征向量输入预先训练得到的多个受损预测模型，得到所述用户在相应受损预测模型下的受损概率。

步骤1404，统计所述用户在各个受损预测模型下的受损概率中，超过第一概率阈值的受损概率的个数以及未超过所述第一概率阈值的受损概率的个数。

步骤1405，判断超过第一概率阈值的受损概率的个数是否小于未超过第一概率阈值的受损概率的个数，若是，执行步骤1406，否则，执行步骤1407。

步骤1406，不向所述用户对应的用户终端发送风险预警提示信息。

步骤1407，向所述用户对应的用户终端发送风险预警提示信息。

下面根据图15提供的内容，介绍本申请实施例中训练得到受损预测模型的示例性实施过程：

步骤1501，针对保存的所属的类别为受损类别的每个样本用户，根据该样本用户在受损时间点的属性信息以及在受损时间点之前的预设时长内产生的针对该样本用户的风险事件数据，生成该样本用户的特征向量。

步骤1502，针对保存的所属的类别为未受损类别的每个样本用户，根据该样本用户在所述受损时间点的属性信息以及在所述受损时间点之前的预设时长内产生的针对该样本用户的风险事件数据，生成该样本用户的特征向量，其中，所述预设时间段的开始时间点晚于所述受损时间点。

步骤1503，将所属的类别为受损类别的各个样本用户的特征向量以及受损类别对应存入黑样本集。

步骤1504，将所属的类别为未受损类别的各个样本用户的特征向量以及未受损类别对应存入白样本集；其中，一个样本包括特征向量以及该特征向量对应的样本用户所属的类别。

步骤1505，从所述黑样本集中抽取第一数目个样本，并将所述黑样本集中剩余的样本存入新黑样本集。

步骤1506，将所述第一数目个样本存入所述白样本集，得到新白样本集。

步骤1507，根据所述新黑样本集以及所述新白样本集，利用预设二分类算法，训练得到样本筛选模型。

步骤1508，利用所述样本筛选模型，确定所述第一数目个样本中的每个特征向量对应的样本用户的受损概率。

步骤1509，将所述第一数目个特征向量对应的各个样本用户的受损概率的均值作为第二概率阈值。

步骤1510，针对所述白样本集中的每个特征向量，利用所述样本筛选模型确定该特征向量对应的样本用户的受损概率。

具体实施时，也可以先确定样本用户的受损概率后确定第二概率阈值，或者样本用户的受损概率和第二概率阈值同时确定，这里不做限定。

步骤1511，判断该特征向量对应的样本用户的受损概率是否超过设置的第二概率阈值，若是，执行步骤1512，否则，执行步骤1513。

步骤1512，确定该特征向量对应的样本为不可靠白样本，并丢弃该不可靠白样本。

步骤1513，将该特征向量对应的样本存入所述可靠白样本集。

步骤1514，按照有放回采样的方式，从所述黑样本集以及所述可靠白样本集中抽取第二数目个样本。

步骤1515，从第二数目个样本中，所属的类别为未受损类别的样本中抽取第三数目个样本，作为未受损训练样本，其中，第二数目不小于第三数目。

步骤1516，从第二数目个样本中，所属的类别为受损类别的样本中抽取第三数目个样本，作为受损训练样本。

步骤1517，将所述未受损训练样本和所述受损训练样本组成所述训练样本集。

步骤1518，基于确定的训练样本集中各个样本用户的特征向量以及相应样本用户所属的类别，利用预设二分类算法训练得到相应的受损预测模型。

实施例二

本申请实施例提供一种风险预警提示装置，如图16所示，包括：

获取模块1601，用于获取在预设时间段内产生的针对用户的风险事件数据以及所述用户的属性信息，其中，所述风险事件数据包括各个风险事件在所述预设时间段内发生的次数和/或指定风险事件在预设时间段内发生的时长；

生成模块1602，用于根据所述风险事件数据以及用户的属性信息，生成所述用户的特征向量；

概率计算模块1603，用于将所述用户的特征向量输入预先训练得到的至少一个受损预测模型，得到所述用户在相应受损预测模型下的受损概率；

反馈模块1604，用于根据第一概率阈值以及所述用户在各个受损预测模型下的受损概率，向所述用户对应的用户终端发送风险预警提示信息。

可选地，所述反馈模块1604具体用于：

根据所述用户在各个受损预测模型下的受损概率，确定所述用户的最终受损概率；

若所述用户的最终受损概率超过所述第一概率阈值，则向所述用户对应的用户终端发送风险预警提示信息。

可选地，所述反馈模块1604具体用于：

在仅包括一个受损预测模型的情况下，将所述用户在该受损模型下的受损概率作为所述用户的最终受损概率；

在包括多个受损预测模型的情况下，计算所述用户在各个受损预测模型下的受损概率的加权求和结果；

将所述加权求和结果作为所述用户的最终受损概率。

可选地，在包括多个受损预测模型的情况下，所述反馈模型1604具体用于：

统计所述用户在各个受损预测模型下的受损概率中，超过所述第一概率阈值的受损概率的个数以及未超过所述第一概率阈值的受损概率的个数；

可选地，本申请实施例提供的风险预警提示装置，还包括：

模型训练模块1605，用于预先按照以下方式训练得到任一受损预测模型：

可选地，所述模型训练模块1005用于采用以下方式确定所述训练样本集：

将所属的类别为受损类别的各个样本用户的特征向量以及受损类别对应存入黑样本集；

将所属的类别为未受损类别的各个样本用户的特征向量以及未受损类别对应存入白样本集；其中，一个样本包括特征向量以及该特征向量对应的样本用户所属的类别；

利用所述黑样本集，从所述白样本集中筛选出可靠白样本集；

根据所述黑样本集以及筛选出的可靠白样本集，确定所述训练样本集。

可选地，所述模型训练模块1605，具体用于采用如下方式确定样本用户的特征向量：

针对保存的所属的类别为受损类别的每个样本用户，根据该样本用户在受损时间点的属性信息以及在受损时间点之前的预设时长内产生的针对该样本用户的风险事件数据，生成该样本用户的特征向量；针对保存的所属的类别为未受损类别的每个样本用户，根据该样本用户在所述受损时间点的属性信息以及在所述受损时间点之前的预设时长内产生的针对该样本用户的风险事件数据，生成该样本用户的特征向量，其中，所述预设时间段的开始时间点晚于所述受损时间点。

可选地，所述模型训练模块1605具体用于：

从所述黑样本集中抽取第一数目个样本，并将所述黑样本集中剩余的样本存入新黑样本集；

将所述第一数目个样本存入所述白样本集，得到新白样本集；

根据所述新黑样本集以及所述新白样本集，利用预设二分类算法，训练得到样本筛选模型；

针对所述白样本集中的每个特征向量，利用所述样本筛选模型确定该特征向量对应的样本用户的受损概率；

若该特征向量对应的样本用户的受损概率未超过设置的第二概率阈值，将该特征向量对应的样本存入所述可靠白样本集。

可选地，所述模型训练模块1605具体用于按照以下方式设置第二概率阈值：

利用所述样本筛选模型，确定所述第一数目个样本中的每个特征向量对应的样本用户的受损概率；

将所述第一数目个特征向量对应的各个样本用户的受损概率的均值作为第二概率阈值。

可选地，所述模型训练模块1605具体用于：

按照有放回采样的方式，从所述黑样本集以及所述可靠白样本集中抽取第二数目个样本；

根据抽取的第二数目个样本，确定所述训练样本集。

可选地，所述模型训练模块1605具体用于：

从第二数目个样本中，所属的类别为未受损类别的样本中抽取第三数目个样本，作为未受损训练样本，其中，第二数目不小于第三数目；以及

从第二数目个样本中，所属的类别为受损类别的样本中抽取第三数目个样本，作为受损训练样本；

将所述未受损训练样本和所述受损训练样本组成所述训练样本集。

在介绍了本申请示例性实施方式的方法和装置之后，接下来，对本申请实施方式的用于风险预警提示的非易失性计算机存储介质进行介绍。本申请实施例提供一种非易失性计算机存储介质，该计算机存储介质存储有可执行程序，该可执行程序被处理器执行实现实施例一提供的任一风险预警提示方法的步骤，比如实现如图2中所示的步骤201，获取在预设时间段内产生的针对用户的风险事件数据以及所述用户的属性信息，步骤202，根据所述风险事件数据以及用户的属性信息，生成所述用户的特征向量，步骤203，将所述用户的特征向量输入预先训练得到的至少一个受损预测模型，得到所述用户在相应受损预测模型下的受损概率，步骤204，根据第一概率阈值以及所述用户在各个受损预测模型下的受损概率，向所述用户对应的用户终端发送风险预警提示信息。

在介绍了本申请示例性实施方式的方法、装置和存储介质之后，接下来，对本申请实施方式的用于风险预警提示的计算设备进行介绍。本申请实施例提供一种计算设备，包括存储器、处理器及存储在存储器上的计算机程序，所述处理器执行所述程序时实现上述实施例一中的任一风险预警提示方法的步骤，比如实现如图2中所示的步骤201，获取在预设时间段内产生的针对用户的风险事件数据以及所述用户的属性信息，步骤202，根据所述风险事件数据以及用户的属性信息，生成所述用户的特征向量，步骤203，将所述用户的特征向量输入预先训练得到的至少一个受损预测模型，得到所述用户在相应受损预测模型下的受损概率，步骤204，根据第一概率阈值以及所述用户在各个受损预测模型下的受损概率，向所述用户对应的用户终端发送风险预警提示信息。

本申请实施例提供一种计算设备，用于执行实施例一中的风险预警提示方法，如图17所示，为本申请实施中所述的计算设备的硬件结构示意图，该计算设备具体可以为台式计算机、便携式计算机、智能手机、平板电脑等。具体地，该计算设备可以包括存储器1701、处理器1702及存储在存储器上的计算机程序，所述处理器执行所述程序时实现实施例一的任一风险预警提示方法的步骤。其中，存储器1701可以包括只读存储器(ROM)和随机存取存储器(RAM)，并向处理器1702提供存储器1701中存储的程序指令和数据。

进一步地，本申请实施例中所述的计算设备还可以包括输入装置1703以及输出装置1704等。输入装置1703可以包括键盘、鼠标、触摸屏等；输出装置1704可以包括显示设备，如液晶显示器(Liquid Crystal Display，LCD)、阴极射线管(Cathode Ray Tube，CRT)，触摸屏等。存储器1101，处理器1102、输入装置1703和输出装置1704可以通过总线或者其他方式连接，图17中以通过总线连接为例。

处理器1702调用存储器1701存储的程序指令并按照获得的程序指令执行实施例一提供的风险预警提示方法。

应当注意，尽管在上文详细描述中提及了风险预警提示装置的若干模块，但是这种划分仅仅是示例性的并非强制性的。实际上，根据本申请的实施方式，上文描述的两个或更多模块的特征和功能可以在一个模块中具体化。反之，上文描述的一个模块的特征和功能可以进一步划分为由多个模块来具体化。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。

显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

Claims

1.一种风险预警提示方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，根据第一概率阈值以及所述用户在各个受损预测模型下的受损概率，向所述用户对应的用户终端发送风险预警提示信息，包括：

3.根据权利要求2所述的方法，其特征在于，确定所述用户的最终受损概率，包括：

在仅包括一个受损预测模型的情况下，将所述用户在该受损预测模型下的受损概率作为所述用户的最终受损概率；

将所述加权求和结果作为所述用户的最终受损概率。

4.根据权利要求1所述的方法，其特征在于，在包括多个受损预测模型的情况下，根据第一概率阈值以及所述用户在各个受损预测模型下的受损概率，向所述用户对应的用户终端发送风险预警提示信息，包括：

5.根据权利要求1所述的方法，其特征在于，预先按照以下方式训练得到任一受损预测模型：

6.根据权利要求5所述的方法，其特征在于，采用以下方式确定所述训练样本集：

7.根据权利要求6所述的方法，其特征在于，采用如下方式确定样本用户的特征向量：

针对保存的所属的类别为受损类别的每个样本用户，根据该样本用户在受损时间点的属性信息以及在受损时间点之前的预设时长内产生的针对该样本用户风险事件数据，生成该样本用户的特征向量；

针对保存的所属的类别为未受损类别的每个样本用户，根据该样本用户在所述受损时间点的属性信息以及在所述受损时间点之前的预设时长内产生的针对该样本用户的风险事件数据，生成该样本用户的特征向量，其中，所述预设时间段的开始时间点晚于所述受损时间点。

8.根据权利要求6所述的方法，其特征在于，利用所述黑样本集，从所述白样本集中筛选出可靠白样本集，包括：

9.根据权利要求8所述的方法，其特征在于，按照以下方式设置第二概率阈值：

10.根据权利要求6-9任一所述的方法，其特征在于，根据所述黑样本集以及筛选出的可靠白样本集，确定所述训练样本集，包括：

根据抽取的第二数目个样本，确定所述训练样本集。

11.根据权利要求10所述的方法，其特征在于，根据抽取的第二数目个样本，确定所述训练样本集，包括：

12.一种风险预警提示装置，其特征在于，包括：

13.一种非易失性计算机存储介质，其特征在于，所述计算机存储介质存储有可执行程序，该可执行程序被处理器执行实现权利要求1-11任一所述方法的步骤。

14.一种计算设备，其特征在于，包括存储器、处理器及存储在存储器上的计算机程序，所述处理器执行所述程序时实现权利要求1-11任一所述方法的步骤。