CN113706040A

CN113706040A - 风险识别方法、装置、设备及存储介质

Info

Publication number: CN113706040A
Application number: CN202111021915.7A
Authority: CN
Inventors: 要卓; 陈婷; 吴三平; 庄伟亮
Original assignee: WeBank Co Ltd
Current assignee: WeBank Co Ltd
Priority date: 2021-09-01
Filing date: 2021-09-01
Publication date: 2021-11-26
Anticipated expiration: 2041-09-01
Also published as: CN113706040B

Abstract

本申请公开了一种风险识别方法、装置、设备及存储介质，所述风险识别方法包括：统计待预测用户在预期观察时间内使用各所述交互对手方对应的使用时长，以计算各所述交互对手方对应的相对使用指标，基于各所述交互对手方对应的相对使用指标，通过目标向量模型对各所述交互对手方进行向量化处理，获得各所述交互对手方对应的交互数据向量，其中，所述目标向量模型是基于预设统计各所述交互对手方对应的训练使用时长和训练相对使用指标进行迭代训练优化得到的，基于各所述交互对手方对应的交互数据向量，通过预设风险预测模型对所述待预测用户进行风险预测，获得风险识别结果。本申请解决了模型风险预测的准确性低的技术问题。

Description

风险识别方法、装置、设备及存储介质

技术领域

本申请涉及金融科技(Fintech)的机器学习技术领域，尤其涉及一种风险识别方法、装置、设备及存储介质。

背景技术

随着金融科技，尤其是互联网科技金融的不断发展，越来越多的技术(如分布式、人工智能等)应用在金融领域，但金融业也对技术提出了更高的要求，如对金融业对应待办事项的分发也有更高的要求。

随着计算机技术的发展，联邦学习的应用越来越广泛。当前，基于交互行为的风险识别方法，主要是将交互对手方进行分类，统计各个类别的使用时长，对于风险较高的类别，一般使用时长较高的用户对应的风险也高，将不同类别的使用时长作为变量输入模型中，从而识别用户的信用风险，然而，交互对手方的类别划分往往需要人工标注，且受分类影响较大，若分类存在错误对模型的预测效果影响较高，进而导致模型风险预测的准确度较低。

发明内容

本申请的主要目的在于提供一种风险识别方法、装置、设备及存储介质，旨在解决现有技术中的模型风险预测的准确度低的技术问题。

为实现上述目的，本申请提供一种风险识别方法，所述风险识别方法包括：

统计待预测用户在预期观察时间内使用各所述交互对手方对应的使用时长，以计算各所述交互对手方对应的相对使用指标；

基于各所述交互对手方对应的相对使用指标，通过目标向量模型对各所述交互对手方进行向量化处理，获得各所述交互对手方对应的交互数据向量，其中，所述目标向量模型是基于预设统计各所述交互对手方对应的训练使用时长和训练相对使用指标进行迭代训练优化得到的；

基于各所述交互对手方对应的交互数据向量，通过预设风险预测模型对所述待预测用户进行风险预测，获得风险识别结果。

本申请还提供一种风险识别装置，所述风险识别装置为虚拟装置，所述风险识别装置包括：

统计模块，用于统计待预测用户在预期观察时间内使用各所述交互对手方对应的使用时长，以计算各所述交互对手方对应的相对使用指标；

向量化处理模块，用于基于各所述交互对手方对应的相对使用指标，通过目标向量模型对各所述交互对手方进行向量化处理，获得各所述交互对手方对应的交互数据向量，其中，所述目标向量模型是基于预设统计各所述交互对手方对应的训练使用时长和训练相对使用指标进行迭代训练优化得到的；

风险预测模块，用于基于各所述交互对手方对应的交互数据向量，通过预设风险预测模型对所述待预测用户进行风险预测，获得风险识别结果。

本申请还提供一种风险识别设备，所述风险识别设备为实体设备，所述风险识别设备包括：存储器、处理器以及存储在所述存储器上的风险识别设程序，所述风险识别设程序被所述处理器执行时可实现如上述的风险识别方法的步骤。

本申请还提供一种存储介质，所述存储介质为计算机可读存储介质，所述计算机可读存储介质上存储有风险识别设程序，所述风险识别设程序被处理器执行时实现如上述的风险识别方法的步骤。

本申请还提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述的风险识别方法的步骤或者实现如上述的数据预测方法的步骤。

本申请提供了一种风险识别方法、装置、设备及存储介质，相比于现有技术采用的根据人工标注对交互对手方进行分类以根据用户对不同类别的交互对手方的使用时长进行模型风险预测的技术手段，本申请首先统计待预测用户在预期观察时间内使用各所述交互对手方对应的使用时长，以计算各所述交互对手方对应的相对使用指标，进而基于各所述交互对手方对应的相对使用指标，通过目标向量模型对各所述交互对手方进行向量化处理，获得各所述交互对手方对应的交互数据向量，其中，所述目标向量模型是基于预设统计各所述交互对手方对应的训练使用时长和训练相对使用指标进行迭代训练优化得到的，实现了对各所述交互对手方进行向量化处理，向量的每个维度即为划分的类别，无需人工标注进行划分各所述交互对手方的类别，进一步地，基于各所述交互对手方对应的交互数据向量，通过预设风险预测模型对所述待预测用户进行风险预测，获得风险识别结果，即可实现通过所述预设风险预测模型自动学习到每个交互对手方在向量各个维度的权重，降低因分类错误所带来的模型偏差，提升了所述预设风险预测模型对用户风险预测的精准度，克服了现有技术中通过人工手动标注进行划分交互对手方的类别，若分类存在错误时，模型的风险预测效果会存在较高的误差，进而导致模型风险预测的准确度较低的技术缺陷，从而提高了模型预测的准确性。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本申请的实施例，并与说明书一起用于解释本申请的原理。

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请风险识别方法第一实施例的流程示意图；

图2为本申请风险识别方法第二实施例的流程示意图；

图3为本申请风险识别方法第三实施例的流程示意图；

图4为本申请实施例中风险识别方法涉及的硬件运行环境的设备结构示意图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅用以解释本申请，并不用于限定本申请。

本申请实施例提供一种风险识别方法，在本申请风险识别方法的第一实施例中，参照图1，所述风险识别方法包括：

步骤S10，统计待预测用户在预期观察时间内使用各所述交互对手方对应的使用时长，以计算各所述交互对手方对应的相对使用指标；

在本实施例中，需要说明的是，所述交互对手方为所述待预测用户进行交互行为的对方，例如，点击APP(软件应用程序)的按钮，访问的网页，阅读的文章等，所述相对使用指标为所述待预测用户使用所述交互对手方的时长与该交互对手方的平均使用时长之间的时长占比，所述预期观察时间为预先设置的时间。

统计待预测用户在预期观察时间内使用各所述交互对手方对应的使用时长，以计算各所述交互对手方对应的相对使用指标，具体地，在预期观察时间内，统计所述待预测用户使用各所述交互对手方分别对应的使用时长，并计算各所述交互对手方对应的平均使用时长，进而分别计算所述待预测用户使用各所述交互对手方分别对应的使用时长与所述平均使用时长之间的时长占比，获得各所述交互对手方对应的相对使用指标，例如，各所述交互对手方为社交软件、金融借贷软件和新闻软件，且所述社交软件对应的平均使用时长为1小时，所述金融借贷软件对应的平均使用时长为3小时，所述新闻软件对应的平均使用时长为2小时，也即，所述待预测用户在使用社交软件、金融软件和新闻软件对应的使用时长分别为0.5,6,2，进而分别各所述使用时长其对应的平均使用时长的占用的时长比例，也即，0.5/1＝0.5,6/3＝2,2/2＝1，进而获得所述待预测用户使用各个软件对应的相对使用指标。

其中，所述统计待预测用户在预期观察时间内使用各所述交互对手方对应的使用时长，以计算各所述交互对手方对应的相对使用指标的步骤包括：

步骤S11，统计所述待预测用户在预期观察时间内使用各所述交互对手方对应的使用时长，并计算各所述交互对手方在预期观察时间内对应的平均使用时长；

在本实施例中，统计所述待预测用户在预期观察时间内使用各所述交互对手方对应的使用时长，并计算各所述交互对手方在预期观察时间内对应的平均使用时长，具体地，对于每一所述交互对手方均执行以下步骤：

在预期观察时间内，统计所述待预测用户使用所述交互对手方的使用时长，进而计算所述交互对手方在全部用户中分别对应的平均使用时长，例如，所述交互对手方为社交软件，使用所述交互对手方的用户包括A用户，B用户，C用户，A用户使用时长为3小时，B用户的使用时长为8小时，C用户使用社交软件的使用时长为16小时，进而根据A用户，B用户，C用户分别对应的使用时长计算所述社交软件的平均使用时长为(3+8+16)/3＝9小时。

步骤S12，分别计算所述待预测用户使用各所述交互对手方分别对应的使用时长与所述平均使用时长的时长占比，获得各所述交互对手方对应的相对使用指标。

在本实施例中，分别计算所述待预测用户使用各所述交互对手方分别对应的使用时长与所述平均使用时长的时长占比，获得各所述交互对手方对应的相对使用指标，具体地，对每一所述交互对手方均执行以下步骤：

在预设观察时间内，在获得计算所述待预测用户使用所述交互对手方的使用时长以及所述交互对手方对应的平均使用时长后，计算所述待预测用户使用所述交互对手方的使用时长与所述交互对手方对应的平均使用时长之间的时长占比，获得所述待预测用户使用所述交互对手方的相对使用指标，进一步地，计算其他所述交互对手方分别对应的相对使用指标，进而获得所述待预测用户使用各所述交互对手方分别对应的相对使用指标。

步骤S20，基于各所述交互对手方对应的相对使用指标，通过目标向量模型对各所述交互对手方进行向量化处理，获得各所述交互对手方对应的交互数据向量，其中，所述目标向量模型是基于预设统计各所述交互对手方对应的训练使用时长和训练相对使用指标进行迭代训练优化得到的；

在本实施例中，需要说明的是，所述向量化处理为将离散变量转化为连续向量的处理方式，所述目标向量模型为将所述时长序列转化为向量的模型，包括word2vec模型和其他向量化处理的文本模型等。

基于各所述交互对手方对应的相对使用指标，通过目标向量模型对各所述交互对手方进行向量化处理，获得各所述交互对手方对应的交互数据向量，其中，所述目标向量模型是基于预设统计各所述交互对手方对应的训练使用时长和训练相对使用指标进行迭代训练优化得到的，具体地，在所述预设观察时间内，基于所述待预测使用各所述交互对手方对应的时间顺序，将各所述交互对手方进行排序，获得交互语料信息，其中，所述交互语料信息为多个交互词信息组成的信息，所述交互词信息为进行排序后的各交互对手方，进而将所述交互语料信息输入所述目标向量模型，输出所述待预测用户使用各所述交互对手方对应对应的交互数据向量，从而实现了对各所述对交互对手方进行向量化处理，向量的每个维度即为划分的类别，进而无需人工标注进行划分各所述交互对手方的类别。

其中，所述基于各所述交互对手方对应的相对使用指标，通过目标向量模型对各所述交互对手方进行向量化处理，获得各所述交互对手方对应的交互数据向量的步骤包括：

步骤S21，基于所述待预测用户在预设观察时间内使用各所述交互对手方对应的时间顺序，将各所述交互对手方进行排序，获得交互语料信息；

在本实施例中，基于所述待预测用户在预设观察时间内使用各所述交互对手方对应的时间顺序，将各所述交互对手方进行排序，获得交互语料信息，具体地，在预设观察时间内，将各所述交互对手方按照所述待预测用户使用各所述交互对手方的时间顺序进行排序，进而获得所述待预测用户对应的交互语料信息。

步骤S22，基于各所述交互对手方对应的相对使用指标，通过所述目标向量模型对所述交互语料信息进行向量化处理，获得各所述交互对手方对应的交互数据向量。

在本实施例中，基于各所述交互对手方对应的相对使用指标，通过所述目标向量模型对所述交互语料信息进行向量化处理，获得各所述交互对手方对应的交互数据向量，具体地，基于各所述交互对手方对应的相对使用指标，对所述交互语料信息中的各交互对方进行加权，获得加权交互语料信息，进而将所述加权交互语料信息输入所述目标向量模型中，输出所述交互数据向量，例如，利用通过自然语言处理中常用的word2vec模型，将所述加权交互语料信息进行embedding学习，得到所述交互数据向量，其中，所述embedding学习为将离散变量转为连续向量表示的处理方式。

步骤S30，基于各所述交互对手方对应的交互数据向量，通过预设风险预测模型对所述待预测用户进行风险预测，获得风险识别结果。

在本实施例中，需要说明的是，所述交互数据向量为各所述的向量，所述风险识别结果为用于判断用户是好用户还是坏用户的标签。

基于各所述交互对手方对应的交互数据向量，通过预设风险预测模型对所述待预测用户进行风险预测，获得风险识别结果，具体地，将各所述交互对手方对应的交互数据向量进行求和，获得风险向量，将所述风险向量输入所述预设风险预测模型，输出所述风险识别结果，从而对所述待预测用户进行评估，也即判断所述待预测用户的好坏信用风险，例如，当所述待预测用户使用金融借贷软件的对应的维度向量较高时，则在所述风险识别结果中判定所述待预测用户的风险较高，进而将所述待预测用户对应的标签设置为坏标签。

其中，所述基于各所述交互对手方对应的交互数据向量，通过预设风险预测模型对所述待预测用户进行风险预测，获得风险识别结果的步骤包括：

步骤S31，将各所述交互数据向量进行求和，获得所述待预测用户的风险向量；

在本实施例中，将各所述交互数据向量进行求和，获得所述待预测用户的风险向量，具体地，基于各所述交互对手方对应的交互数据向量，将各所述交互数据向量进行求和处理，获得所述风险向量，以对所述待预测用户进行风险预测。

步骤S32，将将所述风险向量输入所述预设风险预测模型，输出所述待预测用户的风险识别结果。

在本实施例中，将所述风险向量输入所述预设风险预测模型，输出所述待预测用户的风险识别结果，具体地，通过所述预设风险预测模型对风险向量进行风险预测，获得所述风险识别结果，以根据所述风险识别结果对所述待预测用户进行评估，也即判断所述待预测用户的好坏信用风险。

本申请实施例提供了一种风险识别方法，相比于现有技术采用的根据人工标注对交互对手方进行分类以根据用户对不同类别的交互对手方的使用时长进行模型风险预测的技术手段，本申请实施例首先首先统计待预测用户在预期观察时间内使用各所述交互对手方对应的使用时长，以计算各所述交互对手方对应的相对使用指标，进而基于各所述交互对手方对应的相对使用指标，通过目标向量模型对各所述交互对手方进行向量化处理，获得各所述交互对手方对应的交互数据向量，其中，所述目标向量模型是基于预设统计各所述交互对手方对应的训练使用时长和训练相对使用指标进行迭代训练优化得到的，实现了对各所述交互对手方进行向量化处理，向量的每个维度即为划分的类别，无需人工标注进行划分各所述交互对手方的类别，进一步地，基于各所述交互对手方对应的交互数据向量，通过预设风险预测模型对所述待预测用户进行风险预测，获得风险识别结果，即可实现通过所述预设风险预测模型自动学习到每个交互对手方在向量各个维度的权重，降低因分类错误所带来的模型偏差，提升了所述预设风险预测模型对用户风险预测的精准度，克服了现有技术中通过人工手动标注进行划分交互对手方的类别，若分类存在错误时，模型的风险预测效果会存在较高的误差，进而导致模型风险预测的准确度较低的技术缺陷，从而提高了模型预测的准确性。

进一步地，参照图2，基于本申请中第一实施例，在本申请的另一实施例中，在所述基于所述相对使用指标，通过目标向量模型对所述使用时长进行向量化处理，获得交互数据向量，其中，所述目标向量模型是基于预设统计各所述交互对手方对应的训练使用时长和训练相对使用指标进行迭代训练优化得到的步骤之前，所述风险识别方法还包括：

步骤A10，获取待训练文本模型；

在本实施例中，需要说明的是，所述待训练文本模型包括包括word2vec模型和其他对各所述交互对手方的使用时长进行向量化处理的模型等。

步骤A20，统计各所述样本用户使用各所述交互对手方的训练使用时长，以基于所述训练使用时长，计算各所述交互对手方对应的训练相对使用指标；

在本实施例中，统计各所述样本用户使用各所述交互对手方的训练使用时长，以基于所述训练使用时长，计算各所述交互对手方对应的训练相对使用指标，具体地，对于每一所述样本用户均执行以下步骤：

统计所述样本用户使用各所述交互对手方的训练使用时长，进而计算各所述交互对手方在所有样本用户对应的平均使用时长，进一步地，计算各所述交互对手方的训练使用时长以及所述平均使用时长之间的时长占比，获得各所述交互对手方对应的训练相对使用指标，进而获得各所述样本用户使用每一所述交互对手方对应的训练相对使用指标。

步骤A30，基于各所述样本用户在预设观察时间内使用各所述交互对手方对应的时间顺序，分别将各所述样本用户对应的各所述交互对手方进行排序，获得各所述样本用户对应的待训练语料信息；

在本实施例中，所述待训练语料信息为各所述交互对手方所组成的信息，用于自然语言处理中的算法模型进行训练。

基于各所述样本用户在预设观察时间内使用各所述交互对手方对应的时间顺序，分别将各所述样本用户对应的各所述交互对手方进行排序，获得各所述样本用户对应的待训练语料信息，具体地，对于每一所述样本用户均执行以下步骤：

对于在预设观察时间内，根据所述样本使用使用各所述交互对手方对应的时间顺序，将各所述交互对手方进行排序，从而组成所述样本用户对应的待训练语料信息。

步骤A40，基于各所述样本用户对应的待训练语料信息和各所述交互对手方对应的训练相对使用指标，对所述待训练文本模型进行迭代训练优化，获得所述目标向量模型，并输出各所述样本用户对应的训练交互数据向量。

在本实施例中，基于各所述样本用户对应的待训练语料信息和各所述交互对手方对应的训练相对使用指标，对所述待训练文本模型进行迭代训练优化，获得所述目标向量模型，并输出各所述样本用户对应的训练交互数据向量，具体地，对于每一所述样本用户的待训练语料信息均执行以下步骤：

基于各所述交互对手方对应的训练相对使用指标，对所述待训练语料信息中各所述交互对手方进行加权，也即，设置所述待训练语料信息中各所述交互对手方对应的权重为所述训练相对使用指标，获得加权语料信息，进而基于所述加权语料信息，对所述待训练文本模型进行迭代训练优化，并判断优化后的待训练文本模型是否满足预设训练结束条件，其中，所述预设训练结束条件包括损失函数收敛和达到最大迭代次数阈值等条件，若满足，获得所述目标向量模型，若不满足，则返回执行步骤：统计各所述样本用户使用各所述交互对手方的训练使用时长，以基于所述训练使用时长，计算各所述交互对手方对应的训练相对使用指标。

其中，所述基于各所述样本用户对应的待训练语料信息和各所述交互对手方对应的训练相对使用指标，对所述待训练文本模型进行迭代训练优化，获得所述目标向量模型的步骤包括：

步骤A41，基于各所述交互对手方对应的训练相对使用指标，对各所述样本用户对应的待训练语料信息中的词信息进行加权，获得各所述样本用户对应的加权语料信息；

在本实施例中，需要说明的是，所述待训练语料信息为各个词信息所组成的信息，所述词信息表示各所述交互对手方。

基于各所述交互对手方对应的训练相对使用指标，对各所述样本用户对应的待训练语料信息中的词信息进行加权，获得各所述样本用户对应的加权语料信息，具体地，基于每一所述样本用户使用各所述交互对手方对应的训练相对使用指标，分别对各所述待训练语料信息中各词信息进行加权，也即对各所述交互对手方进行加权，进而获得各所述样本用户对应的加权语料信息。

步骤A42，基于各所述加权语料信息，通过所述待训练文本模型对各所述加权语料信息中的各词信息进行预测，获得各所述词信息对应的预测结果；

在本实施例中，需要说明的是，为了避免要计算所有词信息的softmax概率，word2vec通畅采用二叉霍夫曼树来代替从隐藏层到输出softmax层的映射，传统的文本模型由于信息有限，仅知道文本语料信息中下一个词具体是什么，无法知道其下一个词出现的权重值。而在本申请中可根据下一个出现词信息的概率进行加权，原HierarchicalSoftmax的损失函数可以变为一个线性回归问题，使得使用时间长的交互对手有更大的概率预测准确，也即，使得下面公式p的取值尽可能大：

其中，p(w|Context(w))表示根据上文j-1对下文词信息j进行预测对应的结果，α为训练参数，tj为其中为下一个词信息为j对应的权重，所述权重为所述训练相对使用指标。

基于各所述加权语料信息，通过所述待训练文本模型对各所述加权语料信息中的各词信息进行预测，获得各所述词信息对应的预测结果,具体地，将各所述加权语料信息输入所述待训练文本模型中，获得所述各所述词信息对应的预测结果。

步骤A43，基于所述预测结果和各所述词信息对应的真实标签之间的差异度，通过预设损失函数计算模型损失；

在本实施例中，基于所述预测结果和各所述词信息对应的真实标签之间的差异度，通过预设损失函数计算模型损失，具体地，基于所述预测结果和各所述词信息对应的真实标签之间的差异度，通过预设损失函数计算所述模型参数。

步骤A44，基于所述模型损失计算的梯度，对所述待训练文本模型进行迭代训练优化，获得所述目标向量模型。

在本实施例中，基于所述模型损失计算的梯度，对所述待训练文本模型进行迭代训练优化，获得所述目标向量模型，具体地，基于所述模型损失计算的梯度，对所述待训练文本模型进行迭代训练，以对所述待训练文本模型中的待训练参数进行优化，直至优化后的待训练文本模型满足预设训练结束条件，所述目标向量模型。

本申请实施例提供了一种风险识别方法，也即，获取待训练文本模型，进而统计各所述样本用户使用各所述交互对手方的训练使用时长，以基于所述训练使用时长，计算各所述交互对手方对应的训练相对使用指标，进而基于各所述样本用户在预设观察时间内使用各所述交互对手方对应的时间顺序，分别将各所述样本用户对应的各所述交互对手方进行排序，获得各所述样本用户对应的待训练语料信息，进一步地，基于各所述样本用户对应的待训练语料信息和各所述交互对手方对应的训练相对使用指标，对所述待训练文本模型进行迭代训练优化，获得所述目标向量模型，并输出各所述样本用户对应的训练交互数据向量,实现了基于所述目标向量模型，将各所述交互对手方进行向量化处理，从而根据向量化处理获得的向量对应的每个维度确定各所述交互对手方的类型，无需人工对各所述交互对手方进行划分分类，为克服现有技术中通过人工手动标注进行划分交互对手方的类别，若分类存在错误时，模型的风险预测效果会存在较高的误差，进而导致模型风险预测的准确度较低的技术缺陷奠定了基础。

进一步地，参照图3，基于本申请中第一实施例，在本申请的另一实施例中，所述预设风险预测模型包括全连接神经网络模型，

在所述根据所述缺失数据集和所述特征信息结果，对所述全连接神经网络模型进行迭代训练优化，获得所述数据预测模型的步骤之前，所述风险识别方法还包括：

步骤B10，获取待训练全连接神经网络模型；

步骤B20，分别将各所述样本用户对应的训练交互数据向量进行求和，获得各所述样本用户对应的训练风险向量；

在本实施例中，分别将各所述样本用户对应的训练交互数据向量进行求和，获得各所述样本用户对应的训练风险向量，具体地，基于所述各所述样本用户对应的训练交互数据向量，将各所述训练交互数据向量进行求和处理，获得各所述样本用户对应的训练风险向量。

步骤B30，基于各所述样本用户对应的训练风险向量，对所述待训练全连接神经网络模型进行迭代训练优化，获得所述全连接神经网络模型。

在本实施例中，基于各所述样本用户对应的训练风险向量，对所述待训练全连接神经网络模型进行迭代训练优化，获得所述全连接神经网络模型，具体地，将所述训练风险向量输入所述待训练全连接神经网络模型中，以对所述待训练全连接神经网络模型进行迭代训练优化，并判断优化后的待训练全连接神经网络模型是否满足预设训练结束条件，其中，所述预设训练结束条件包括损失函数收敛和达到最大迭代次数阈值等条件，若满足，则获得所述全连接神经网络模型，也即，获得所述预设风险预测模型，若不满足，则返回执行步骤：统计各所述样本用户使用各所述交互对手方的训练使用时长，以基于所述训练使用时长，计算各所述交互对手方对应的训练相对使用指标。

本申请实施例提供了一种风险识别方法，也即，获取待训练全连接神经网络模型，进而分别将各所述样本用户对应的训练交互数据向量进行求和，获得各所述样本用户对应的训练风险向量，进一步地，基于各所述样本用户对应的训练风险向量，对所述待训练全连接神经网络模型进行迭代训练优化，获得所述全连接神经网络模型，实现了通过所述待训练全连接神经网络模型自动学习到每个交互对手方在向量各个维度的权重，提升了所述全连接神经网络模型对用户风险预测的精准度，为克服现有技术中通过人工手动标注进行划分交互对手方的类别，若分类存在错误时，模型的风险预测效果会存在较高的误差，进而导致模型风险预测的准确度较低的技术缺陷奠定了基础。

参照图4，图4是本申请实施例方案涉及的硬件运行环境的设备结构示意图。

如图4所示，该风险识别设备可以包括：处理器1001，例如CPU，存储器1005，通信总线1002。其中，通信总线1002用于实现处理器1001和存储器1005之间的连接通信。存储器1005可以是高速RAM存储器，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储设备。

可选地，该风险识别设备还可以包括矩形用户接口、网络接口、摄像头、RF(RadioFrequency，射频)电路，传感器、音频电路、WiFi模块等等。矩形用户接口可以包括显示屏(Display)、输入子模块比如键盘(Keyboard)，可选矩形用户接口还可以包括标准的有线接口、无线接口。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。

本领域技术人员可以理解，图4中示出的风险识别设备结构并不构成对风险识别设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图4所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块以及风险识别设程序。操作系统是管理和控制风险识别设备硬件和软件资源的程序，支持风险识别设程序以及其它软件和/或程序的运行。网络通信模块用于实现存储器1005内部各组件之间的通信，以及与风险识别方法系统中其它硬件和软件之间通信。

在图4所示的风险识别设备中，处理器1001用于执行存储器1005中存储的风险识别设程序，实现上述任一项所述的风险识别方法的步骤。

本申请风险识别设备具体实施方式与上述风险识别方法各实施例基本相同，在此不再赘述。

本申请还提供一种风险识别装置，所述风险识别装置包括：

可选地，所述统计模块还用于：

统计所述待预测用户在预期观察时间内使用各所述交互对手方对应的使用时长，并计算各所述交互对手方在预期观察时间内对应的平均使用时长；

分别计算所述待预测用户使用各所述交互对手方分别对应的使用时长与所述平均使用时长的时长占比，获得各所述交互对手方对应的相对使用指标。

可选地，所述向量化处理模块还用于：

基于所述待预测用户在预设观察时间内使用各所述交互对手方对应的时间顺序，将各所述交互对手方进行排序，获得交互语料信息；

基于各所述交互对手方对应的相对使用指标，通过所述目标向量模型对所述交互语料信息进行向量化处理，获得各所述交互对手方对应的交互数据向量。

可选地，所述风险预测模块还用于：

将各所述交互数据向量进行求和，获得所述待预测用户的风险向量；

将所述风险向量输入所述预设风险预测模型，输出所述待预测用户的风险识别结果。

可选地，所述风险识别装置还用于：

获取待训练文本模型；

统计各所述样本用户使用各所述交互对手方的训练使用时长，以基于所述训练使用时长，计算各所述交互对手方对应的训练相对使用指标；

基于各所述样本用户在预设观察时间内使用各所述交互对手方对应的时间顺序，分别将各所述样本用户对应的各所述交互对手方进行排序，获得各所述样本用户对应的待训练语料信息；

基于各所述样本用户对应的待训练语料信息和各所述交互对手方对应的训练相对使用指标，对所述待训练文本模型进行迭代训练优化，获得所述目标向量模型，并输出各所述样本用户对应的训练交互数据向量。

可选地，所述风险识别装置还用于：

基于各所述交互对手方对应的训练相对使用指标，对各所述样本用户对应的待训练语料信息中的词信息进行加权，获得各所述样本用户对应的加权语料信息；

基于各所述加权语料信息，通过所述待训练文本模型对各所述加权语料信息中的各词信息进行预测，获得各所述词信息对应的预测结果；

基于所述预测结果和各所述词信息对应的真实标签之间的差异度，通过预设损失函数计算模型损失；

基于所述模型损失计算的梯度，对所述待训练文本模型进行迭代训练优化，获得所述目标向量模型。

可选地，所述风险识别装置还用于：

获取待训练全连接神经网络模型；

分别将各所述样本用户对应的训练交互数据向量进行求和，获得各所述样本用户对应的训练风险向量，

基于各所述样本用户对应的训练风险向量，对所述待训练全连接神经网络模型进行迭代训练优化，获得所述全连接神经网络模型。

本申请风险识别装置的具体实施方式与上述风险识别方法各实施例基本相同，在此不再赘述。

本申请实施例提供了一种存储介质，所述存储介质为计算机可读存储介质，且所述计算机可读存储介质存储有一个或者一个以上程序，所述一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于实现上述任一项所述的风险识别方法的步骤。

本申请可读存储介质具体实施方式与上述风险识别方法各实施例基本相同，在此不再赘述。

本申请实施例提供了一种计算机程序产品，且所述计算机程序产品包括有一个或者一个以上计算机程序，所述一个或者一个以上计算机程序还可被一个或者一个以上的处理器执行以用于实现上述任一项所述的风险识别方法的步骤。

本申请计算机程序产品具体实施方式与上述风险识别方法各实施例基本相同，在此不再赘述。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利处理范围内。

Claims

1.一种风险识别方法，其特征在于，所述风险识别方法包括：

2.如权利要求1所述风险识别方法，其特征在于，所述统计待预测用户在预期观察时间内使用各所述交互对手方对应的使用时长，以计算各所述交互对手方对应的相对使用指标的步骤包括：

3.如权利要求1所述风险识别方法，其特征在于，所述基于各所述交互对手方对应的相对使用指标，通过目标向量模型对各所述交互对手方进行向量化处理，获得各所述交互对手方对应的交互数据向量的步骤包括：

4.如权利要求1所述风险识别方法，其特征在于，所述基于各所述交互对手方对应的交互数据向量，通过预设风险预测模型对所述待预测用户进行风险预测，获得风险识别结果的步骤包括：

5.如权利要求1所述风险识别方法，其特征在于，在所述基于各所述交互对手方对应的相对使用指标，通过目标向量模型对各所述交互对手方进行向量化处理，获得各所述交互对手方对应的交互数据向量，其中，所述目标向量模型是基于预设统计各所述交互对手方对应的训练使用时长和训练相对使用指标进行迭代训练优化得到的步骤之前，所述风险识别方法还包括：

获取待训练文本模型；

6.如权利要求5所述风险识别方法，其特征在于，所述基于各所述样本用户对应的待训练语料信息和各所述交互对手方对应的训练相对使用指标，对所述待训练文本模型进行迭代训练优化，获得所述目标向量模型的步骤包括：

7.如权利要求5所述风险识别方法，其特征在于，所述预设风险预测模型包括全连接神经网络模型，

在所述将所述待训练语料信息输入所述待训练文本模型，以对所述待训练文本模型进行迭代训练优化，获得所述目标向量模型，并输出各所述样本用户对应的训练交互数据向量的步骤之后，所述风险识别方法还包括：

获取待训练全连接神经网络模型；

8.一种风险识别装置，其特征在于，所述风险识别装置包括：

9.一种风险识别设备，其特征在于，所述风险识别设备包括：存储器、处理器以及存储在存储器上的风险识别设程序，

所述风险识别设程序被所述处理器执行实现如权利要求1至7中任一项所述风险识别方法的步骤。

10.一种存储介质，所述存储介质为计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有风险识别设程序，所述风险识别设程序被处理器执行以实现如权利要求1至7中任一项所述风险识别方法的步骤。