CN116188023A

CN116188023A - 一种风险识别模型训练的方法、装置、存储介质及设备

Info

Publication number: CN116188023A
Application number: CN202310202513.XA
Authority: CN
Inventors: 李怀松; 宋博文; 张天翼; 靳如一; 侯辉超; 成鹏
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2023-02-23
Filing date: 2023-02-23
Publication date: 2023-05-30

Abstract

在本说明书提供的风险识别模型训练的方法中，获取多模态数据的训练样本，确定所述训练样本的标注，通过风险识别模型的编码子网，将所述训练样本中各模态的数据分别转化为矩阵，得到各第一特征矩阵，根据各第一特征矩阵确定多通道的第二特征矩阵，将所述第二特征矩阵输入到该模型的三维卷积子网中进行特征融合，根据融合后得到特征融合矩阵，确定预测结果，并根据所述预测结果和所述训练样本的标注对该模型进行训练。上述方法可以看出，将不同模态的数据转化为矩阵后再进行融合，方便了多种模态数据的特征融合，融合后得到的特征融合矩阵并不单纯依赖其中任何一种模态的数据，而是一次性充分融合了各模态的数据，提高了数据融合的效果和效率。

Description

一种风险识别模型训练的方法、装置、存储介质及设备

技术领域

本申请涉及计算机领域，特别涉及一种风险识别模型训练的方法、装置、存储介质及设备。

背景技术

随着互联网技术的发展，对于隐私数据的保护越来越关注。并且，利用多模态数据融合技术，将不同模态的数据进行融合，以汲取不同模态数据的优点，实现数据之间的互补，已经广泛应用于各个领域。

现有技术在进行数据融合时，通常采用注意力机制对多模态的数据进行融合，但是这种方式只能对不同模态的数据进行两两融合，不能一次性融合全部模态的数据，导致多模态数据融合的效率低。并且在基于注意力机制进行数据融合时，是根据两种模态的数据之间的相似度，对其中一个模态数据的特征进行加权。并没有充分利用到另一种模态的数据，可见，通过这种方法融合多种模态数据的效果不是很好。

为此，本申请提出了一种通过训练模型实现多模态数据一次性充分融合的方法。

发明内容

本说明书提供一种风险识别模型训练的方法、装置、存储介质及电子设备，以至少部分的解决上述问题。

本说明书采用下述技术方案：

本说明书提供了一种风险识别模型训练的方法，所述方法包括：

获取历史风险业务的不同模态的历史数据作为训练样本，确定所述历史风险业务的执行结果，作为所述训练样本的标注；

针对每个模态，将该模态的历史数据作为输入，输入到风险识别模型中对应该模态的编码子网中，进行二维卷积得到该模态的第一特征矩阵；

根据不同模态的第一特征矩阵，确定多通道的第二特征矩阵，将所述第二特征矩阵输入到所述风险识别模型的三维卷积子网中，对所述第二特征矩阵进行三维卷积，得到特征融合矩阵；

将所述特征融合矩阵输入到所述风险识别模型的预测子网中，获得预测结果，根据所述预测结果和所述训练样本对应的标注，对所述风险识别模型进行训练，训练完成的风险识别模型用于根据待执行业务的不同模态的数据，识别所述待执行业务是否存在风险。

可选地，针对每个模态，将该模态的历史数据作为输入，输入到风险识别模型中对应该模态的编码子网中，进行二维卷积得到该模态的第一特征矩阵，具体包括：

针对所述训练样本中的文本数据，根据所述文本数据中每个字符以及每个字符在所述文本数据中的位置，确定每个字符对应的输入数据；

将确定出的输入数据，输入到所述风险识别模型中对应于文本模态的编码子网中，以根据所述字符和所述位置对所述文本数据进行二维卷积；

将二维卷积后得到的矩阵，作为所述训练样本中所述文本数据的第一特征矩阵。

针对所述训练样本中的结构化数据，根据所述结构化数据中的每组键值对的值，以及每组键值对在所述结构化数据中的位置，确定每组键值对对应的输入数据；

将确定出的输入数据，输入到所述风险识别模型中对应于结构化数据的编码子网中，以根据所述键值对的值和所述位置对所述结构化数据进行二维卷积；

将二维卷积后得到的矩阵，作为所述训练样本中所述结构化数据的第一特征矩阵。

针对所述训练样本中的图像数据，根据所述图像数据中各像素点的位置，将所述图像数据输入到所述风险识别模型中对应于图像模态的编码子网中，将所述图像数据转换为矩阵，作为所述训练样本中所述图像数据的第一特征矩阵。

可选地，根据不同模态的第一特征矩阵，确定多通道的第二特征矩阵，具体包括：

针对每个模态，将该模态的第一特征矩阵作为输入，输入所述风险识别模型中对应该模态的二维卷积子网中，进行二维卷积得到该模态的第三特征矩阵，各模态的第三特征矩阵的尺寸一致；

将得到的不同模态的第三特征矩阵作为不同通道的数据，对各第三特征矩阵进行叠加，得到多通道的第二特征矩阵。

可选地，所述风险识别模型中各模态的二维卷积子网中的卷积矩阵的尺寸，与输入到所述各模态的二维卷积子网中的对应模态的第一特征矩阵的尺寸呈正相关。

可选地，训练完成的风险识别模型用于根据待执行业务的不同模态的数据，识别所述待执行业务是否存在风险，具体包括：

响应于待执行业务，确定用户输入的图像以及文字，其中，接收到的所述用户输入的文字数量不超过预设数量；

根据所述用户的用户标识，获取执行所述待执行业务所需的结构化数据；

根据用户输入的图像、用户输入的文本以及所述结构化数据，通过所述风险识别模型确定风险识别结果；

根据所述风险识别结果执行风控业务。

可选地，所述风险识别模型的三维卷积子网的卷积矩阵的通道数量与所述多通道的第二特征矩阵的通道数量相等。

本说明书提供了一种风险识别模型训练的装置，所述装置包括：

获取模块，用于获取历史风险业务的不同模态的历史数据作为训练样本，确定所述历史风险业务的执行结果，作为所述训练样本的标注；

二维卷积模块，用于针对每个模态，将该模态的历史数据作为输入，输入到风险识别模型中对应该模态的编码子网中，进行二维卷积得到该模态的第一特征矩阵；

三维卷积模块，用于根据不同模态的第一特征矩阵，确定多通道的第二特征矩阵，将所述第二特征矩阵输入到所述风险识别模型的三维卷积子网中，对所述第二特征矩阵进行三维卷积，得到特征融合矩阵

预测模块，用于将所述特征融合矩阵输入到所述风险识别模型的预测子网中，获得预测结果，根据所述预测结果和所述训练样本对应的标注，对所述风险识别模型进行训练，训练完成的风险识别模型用于根据待执行业务的不同模态的数据，识别所述待执行业务是否存在风险。

本说明书提供了一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述风险识别模型训练的方法。

本说明书提供了一种电子设备，包括储存器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述风险识别模型训练的方法。

本说明书采用的上述至少一个技术方案能够达到以下有益效果：

在本说明书提供的风险识别模型训练的方法中，获取多模态数据的训练样本，确定所述训练样本的标注，通过风险识别模型的编码子网，将所述训练样本中各模态的数据分别转化为矩阵，得到各第一特征矩阵，根据各第一特征矩阵确定多通道的第二特征矩阵，将所述第二特征矩阵输入到该模型的三维卷积子网中进行特征融合，根据融合后得到特征融合矩阵，确定预测结果，并根据所述预测结果和所述训练样本的标注对该模型进行训练。

上述方法可以看出，将不同模态的数据转化为矩阵后再进行融合，方便了多种模态数据的特征融合，融合后得到的特征融合矩阵并不单纯依赖其中任何一种模态的数据，而是一次性充分融合了各模态的数据，提高了数据融合的效果和效率。

附图说明

此处所说明的附图用来提供对本说明书的进一步理解，构成本说明书的一部分，本说明书的示意性实施例及其说明用于解释本说明书，并不构成对本说明书的不当限定。在附图中：

图1为本说明书中一种风险识别模型训练的流程示意图；

图2为本说明书中提供的一种编码子网的示意图；

图3为本说明书提供的一种二维卷积子网的示意图；

图4为本说明书中提供的一种三维卷积子网的示意图；

图5为本说明书中提供的一种文本数据编码过程的示意图；

图6为本说明书中提供的一种结构化数据编码过程的示意图；

图7为本说明书提供的一种风险识别模型融合数据的全过程的示意图；

图8为本说明书提供的一种风险识别模型训练装置的示意图；

图9为本说明书提供的对应于图1的电子设备示意图。

具体实施方式

为使本说明书的目的、技术方案和优点更加清楚，下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本说明书一部分实施例，而不是全部的实施例。基于本说明书中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

以下结合附图，详细说明本说明书各实施例提供的技术方案。

图1为本说明书提供的一种风险识别模型训练的方法的流程示意图，具体包括以下步骤：

S100：获取历史风险业务的不同模态的历史数据作为训练样本，确定所述历史风险业务的执行结果，作为所述训练样本的标注。

本说明书提供的模型训练的执行主体可以是服务器，也可以是诸如个人计算机(Personal Computer，PC)等电子设备，为了便于描述，下面仅以服务器为执行主体，对本说明书提供的模型训练的方法进行说明。

在本说明书实施例中，该训练完成的风险识别模型用于根据输入的待执行业务的不同模态的数据，确定该待执行业务的风险识别结果，使得可以根据风险识别结果，对该待执行业务执行风险控制的业务。因此在训练该风险识别模型时，需要先确定历史上进行过风险控制的业务的历史风险业务，并获取该历史风险业务的不同模态的历史数据作为训练样本，将历史上对该历史风险业务进行风险控制的执行结果作为该训练样本的标注。通过将训练样本输入到所述风险识别模型中，得到该模型的输出结果，根据输出结果与该训练样本的标注，确定损失函数，并以损失最小化为目标训练该风险识别模型。

其中，不同模态的历史数据可以包括图像数据，文本数据，结构化数据等等，该风险识别模型的模型结构为编码器-解码器结构，通过该风险识别模型可先对不同模态的数据可进行特征融合，并基于融合后的特征确定风险识别结果。当然，在本说明书实施例中并不对输入的数据的模态数量进行限制，可以根据需要设置，并在建立该风险识别模型时确定对应的模型结构。

在本说明书实施例中，该待执行业务为需要进行风险识别，以确定是否需要执行风控业务的业务。例如，用户之间执行交易业务需要进行风险识别，则该交易业务为待执行业务，或者，用户的账户疑似存在风险，则需要对该用户账户进行风险识别，服务器可自动发起针对该用户账户的风险识别业务，该风险识别业务为待执行业务。或者，当用户的账户因满足风控规则被冻结，或者用户发起的业务因满足风控规则被拒绝执行，用户可以提出对冻结账户的申诉或者对被拒接执行的业务的申诉时，此时用户发起的申诉为待执行业务。同理，历史风险业务为历史上基于不同原因执行过风控业务的历史业务。

在本说明书实施例中，以历史风险业务是用户之间的交易业务为例进行说明，该服务器获取用户提供用于证明交易不存在风险的截图，作为该历史风险业务的图像数据；获取用户输入的证明该次交易不存在风险的理由，作为该历史风险业务的文本数据；根据用户的标识，获取服务器中存储的该交易业务的结构化数据，作为该历史风险业务的结构化数据，其中，结构化数据有哪些一般是预先设置。常见的结构化数据可包括如，用户的等级类信息、用户的身份类信息、物品的品类信息等。

在本说明书实施例中，历史风险业务的执行结果是根据风险业务的不同模态的历史数据，基于人工经验确定的，服务器可以根据确定出的历史风险业务的执行结果，执行相应的业务，当该历史风险业务的执行结果为存在风险时，则服务器可以继续对用户的账户进行限制；当该历史风险业务的执行结果为不存在风险时，服务器可以解除对该用户账户的限制。以该风险业务的执行结果作为训练样本的标注，能够更好的训练该风险识别模型，训练完成的风险识别模型可以代替人工对风险业务的结果进行预测，大大提高了风险识别的效率。

S101：针对每个模态，将该模态的历史数据作为输入，输入到风险识别模型中对应该模态的编码子网中，进行二维卷积得到该模态的第一特征矩阵。

在本说明书实施例中，该风险识别模型针对每个模态的数据对应设置有该模态的编码子网，通过每个模态的编码子网对该模态的第一特征矩阵进行二维卷积，实现对该模态的数据的特征提取，由于该模态的编码子网是用于对该模态的数据进行特征提取的，而不需要与其他模态的数据进行融合，因此只需进行二维卷积即可。当然，为了方便后续融合各模态的特征，每个模态的编码子网输出特征矩阵形式的结果，即，通过该模态的编码子网可以确定该模态的第一特征矩阵。当然由于不同模态数据的数据量不相同，因此得到的各模态的第一特征矩阵的尺寸一般是不完全相同的，在本说明书中不对各模态的第一特征矩阵的尺寸进行限制，通过配置编码子网以及对输入数据的尺寸进行限制，可设置各模态的第一特征矩阵的尺寸。

具体的，为了方便描述，后续以各模态包括：图像数据，文本数据，结构化数据为例进行说明。

以所述训练样本包含文本数据，图像数据以及结构化数据为例，对本说明书提供的模型训练的方法进行说明。如图2所示，在获取到训练样本之后，将所述训练样本中各模态的历史数据分别输入到该模型中对应模态的编码子网中。例如，将该训练样本中的文本数据输入到该模型中对应文本模态的编码子网中，该编码子网可以将该文本数据转化为矩阵，同样地，该模型中对应于其他模态的编码子网，也能将该训练样本中对应模态的历史数据转化为矩阵。通过该模型中对应于各模态的编码子网，将不同模态的历史数据，转化为特征矩阵的形式，以便于实现不同模态数据之间的融合。

S102：根据不同模态的第一特征矩阵，确定多通道的第二特征矩阵，将所述第二特征矩阵输入到所述风险识别模型的三维卷积子网中，对所述第二特征矩阵进行三维卷积，得到特征融合矩阵。

在本说明书实施例中，在确定出各模态的第一特征矩阵之后，还可将不同模态的第一特征矩阵作为不同通道的数据进行叠加，确定多通道的第二特征矩阵，以便对多通道的第二特征矩阵通过三维卷积子网进行三维卷积，对不同模态的特种进行融合，得到特征融合矩阵。

当然，由于各第一特征矩阵是根据不同模态的历史数据转化而来的，所以，该各第一特征矩阵的尺寸可能不同。因此，该服务器在将各不同尺寸且不同模态的第一特征矩阵叠加得到第二特征矩阵后，可以确定第二特征矩阵的二维尺寸，例如，确定第二特征矩阵的最大长度和最大宽度，然后对该第二特征矩阵每个通道的特征进行填充。例如，假设第二特征矩阵的二维尺寸为100×100，作为某个通道的第一特征矩阵的尺寸为50×50，对该通道的第一特征矩阵进行数值填充，得到100×100的特征矩阵，作为该第二特征矩阵中该通道的特征。

则得到的该第二特征矩阵的每个通道的尺寸统一，再通过三维卷积子网进行三维卷积。

但是，通过填充指定数值，虽然可以使该第二特征矩阵的每个通道的特征矩阵的尺寸统一，但是填充的指定数值不能表征任何特征，导致第二特征矩阵的特征变得稀疏，并且在进行三维卷积时，也难以保证各模态的特征能够平均的进行融合。

于是，为了进行三维卷积时能够得到更准确的融合特征矩阵，该服务器还可以通过该模型中对应于各模态的二维卷积子网，将不同尺寸的各第一特征矩阵转化为相同的尺寸的各第三特征矩阵，所以该模型的二维卷积子网的卷积矩阵与第一特征矩阵进行卷积时，卷积的模式采用的是可以使卷积前后矩阵尺寸发生变化的卷积模式，具体为哪种卷积模式在本说明书中不作限制。

具体的，在对应于各模态的编码子网输出各矩阵后，将所述各矩阵作为各模态的历史数据的第一特征矩阵，将各第一特征矩阵分别输入到该模型中对应模态的二维卷积子网，如图3所示，图3中虚线框包围的部分为通过该二维卷积子网得到的各第三特征矩阵。例如，将图像模态的第一特征矩阵输入到该模型中对应图像模态的二维卷积子网中，通过该二维卷积子网中的卷积矩阵与该第一特征矩阵进行卷积，得到图像模态的第三特征矩阵。

同样地，该模型中对应于其他模态的二维卷积子网，也能将其他模态的各第一特征矩阵转化为各第三特征矩阵。每个模态的卷积矩阵的尺寸是不同的，由于不同模态的第一特征矩阵的尺寸，可根据输入数据确定的，例如根据字符长度上限，图片最大分辨率，结构化信息中键值对的数量。而第三特征矩阵的尺寸可以预先确定，所以对于每个模态，可以根据该模态的第一特征矩阵的尺寸，还有预设的第三特征矩阵的尺寸，确定该模态的卷积矩阵的大小。其中，该卷积矩阵的尺寸与该第一特征矩阵的尺寸正相关，所述各第三特征矩阵的尺寸相同。

在本说明书实施例中，再得到尺寸相同的各模态的第三特征矩阵后，就可以将各第三特征矩阵融合为特征融合矩阵，该特征融合矩阵包含输入到该风险识别模型中的各模态的历史数据的特征。

如图4所示，因为要将各模态的第三特征矩阵进行融合，并且各第三特征矩阵的尺寸相同，所以该服务器可以将各模态的第三特征矩阵作为不同通道的数据进行叠加，得到第二特征矩阵，将该第二特征矩阵输入到该模型的三维卷积子网中进行三维卷积，得到特征融合矩阵，该特征融合矩阵既包括该三维卷积子网对相同模态的数据的融合，也包括该三维卷积子网对不同模态的数据的融合。

当然，本说明书实施例是以三个模态的数据为例说明的，因此三维卷积子网的卷积矩阵为三通道的，当输入数据对应的模态数量增加时，该三维卷积子网的卷积矩阵的通道数可以对应设置。也就是说，该三维卷积子网的卷积矩阵的通道数量与所述多通道的第二特征矩阵的通道数量相等。

S103：将所述特征融合矩阵输入到所述风险识别模型的预测子网中，获得预测结果，根据所述预测结果和所述训练样本对应的标注，对所述风险识别模型进行训练，训练完成的风险识别模型用于根据待执行业务的不同模态的数据，识别所述待执行业务是否存在风险。

在本说明书实施例中，该服务器在得到特征融合矩阵后，可将该特征融合矩阵输入到该风险识别模型的预测子网中，该预测子网可以根据该特征融合矩阵输出预测结果，预测该历史风险业务是否存在风险，将预测结果与所述训练样本的标注作对比，确定二者之间的差异，也就是确定损失函数，并以损失函数最小化为目标训练所述风险识别模型。

训练完成的所述风险识别模型可以用于判断待执行业务是否存在风险。当服务器响应于用户执行的待执行业务时，例如，当服务器认定用户账户执行的交易存在风险，对用户账户的后续交易活动进行了限制时，用户可通过终端向服务器提出申诉请求，以请求解除对用户账户限制，则该服务器可向用户的终端发送申诉界面，用户可以在该申诉界面上填写申诉信息，该申诉信息包括不同模态的数据。例如：文本数据，即，用户申诉的理由；图像数据，即，用户提供的截图等等，再根据该用户的用户标识或者该类待执行业务的业务标识，获取执行该待执行业务所需的结构化数据。将获取的该结构化数据以及所述申诉信息作为输入，输入到训练完成的该风险识别模型中，根据该风险识别模型输出的预测结果，判断该用户账户是否存在风险，若存在风险，继续对用户账户后续的交易活动进行限制；若不存在风险，则取消对用户账户的限制。

基于图1所示的风险识别模型训练方法，在本说明书实施例中，通过利用历史上风险识别业务的不同模态的历史数据，训练风险识别模型，该风险识别模型首先将所述不同模态的历史数据转化为统一形式的矩阵，再对各矩阵进行卷积以统一各矩阵的尺寸，再将得到的尺寸相同的不同模态的矩阵进行融合，对融合后得到的特征融合矩阵进行预测，最后根据预测结果以及标注之间的损失，不断调整该风险识别模型的参数，训练完成的该风险识别模型可以准确判断待执行的风险识别业务是否存在风险，该风险识别模型实现了一次性充分融合不同模态的数据，提高了数据融合的效果和效率。

在步骤S101中，将该训练样本中的文本数据输入到该模型中对应文本模态的编码子网中。具体地，可以根据该文本数据中每个字符、每个字符在该文本数据中的位置以及该文本数据的数据类型标识，确定每个字符对应的输入数据，按照每个字符在该文本数据中的顺序，对确定出的各输入数据进行拼接，得到输入序列，将该输入序列输入到该风险识别模型中对应于文本模态的编码子网中，以根据该各字符和该各字符的位置对所述文本数据进行编码，将编码后得到的矩阵，作为该训练样本中的文本数据的第一特征矩阵。

例如，如图5所示文本数据为“交易方为新客户”，文本数据的数据类型标识为“1”，总共七个字符，该文本数据的“交”字的标识为f11，该字符在该文本数据中的位置为1，该文本数据的“易”字的标识为f12，该字符在该文本数据中的位置为2，该文本数据的“方”字的标识为f13，该字符在该文本数据中的位置为3，依此类推，确定出该文本数据中的每个字符的字符标识以及位置标识，将每个字符的字符标识、位置标识以及数据类型标识作为输入数据，按照每个字符在该文本数据中的顺序，对确定出的各输入数据进行拼接，得到输入序列[(f11，1，1)，(f12，1，2)，(f13，1，3)，(f14，1，4)，(f15，1，5)，(f16，1，6)，(f17，1，7)]。

同样地，将该训练样本中的结构化数据输入到该模型中对应结构化数据的编码子网中，具体地，可以根据该结构化数据中的每组键值对的值、每组键值对在该结构化数据中的位置以及该结构化数据的数据类型标识，确定每组键值对对应的输入数据，将确定出的输入数据，输入到该风险识别模型中对应于结构化数据的编码子网中，以根据该键值对的值和该位置对该结构化数据进行编码，将编码后得到的矩阵，作为该训练样本中的结构化数据的第一特征矩阵。

在本说明书实施例中，服务器获取的结构化数据可以是与用户标识对应的结构化数据，也可以是与业务标识对应的结构化数据，下面以获取与用户标识对应的结构化数据为例进行说明。在服务器存储与用户标识对应的结构化数据中，确定与该历史风险识别业务的用户的用户标识相对应的结构化数据，比如，执行该历史风险识别业务的用户为用户2，如图6所示，则该服务器获取用户2的结构化数据，结构化数据的数据类型标识为“0”，根据该结构化数据中的每组键值对的值、每组键值对在该结构化数据中的位置以及该结构化数据的数据类型标识，确定每组键值对对应的输入数据。

同样地，将所述训练样本中的图像数据输入到该模型中对应图像模态的编码子网中，具体地，可以根据该图像数据中各像素点的位置，将该图像数据输入到所述风险识别模型中对应于图像模态的编码子网中，将该图像数据转换为矩阵，作为所述训练样本中所述图像数据的第一特征矩阵。

在本说明书实施例中，针对每个模态，为了避免不同业务对应该模态的数据大小不同，导致难以将不同模态的第一特征矩阵转化为统一尺寸的第三特征矩阵，因此需要限制每个模态数据的最大尺寸。例如，图像数据限制分辨率为256×256，文本数据限制为400字。当然，由于结构化数据包含的键值对都是预先设置的，因此在设置结构化数据包含的键值对时，相当于已经限制了结构化数据的大小。

另外，由于应用过程中用户提供的各模态的数据可能与限制的各模态数据的最大尺寸并不匹配，因此可以将获得的待执行的风险识别业务的数据在输入到该风险识别模型之前进行裁剪、抽取或者填充。例如，图像数据限制分辨率为256×256，而用户提供的截图的分辨率为200×200，此时，需要对该截图进行填充，使该截图的分辨率为256×256，填充截图的方式多种多样，在本说明书中不作具体限制。但是，数据在输入到该风险识别模型之前进行裁剪、抽取或者填充，可能会出现数据中的关键信息被裁剪掉或者并未将数据中的关键信息抽取出来的情况，因此，为保证数据的完整性，进而达到更好的数据融合效果，可以在申诉界面中就限制用户填写的申诉信息的尺寸，例如，申诉界面中用户可以输入的文字字数不超过200字，申诉界面中用户提供的截图分辨率为256×256等等。

传统的利用注意力机制对数据进行融合的方法，仅是对输入的其中一种模态的数据进行加权，其中，权重是根据输入的各模态的数据之间的关联性确定的，实际上还是对其中一种模态的数据的变换，并未充分利用各模态的数据进行特征融合，而本说明书提供的方法，如图7所示，是将各模态的数据分别转化为尺寸相同的矩阵，再将各矩阵看作不同通道的数据进行融合，可以充分融合各模态数据，并且不受传统方法中只能两两融合不同模态的数据的限制，提高了数据融合的效率。

以上为本说明书的一个或多个实施例提供的风险识别模型训练的方法，基于同样的思路，本说明书还提供了相应的风险识别模型训练装置，如图8所示。

图8为本说明书提供的一种风险识别模型训练装置示意图，具体包括：

可选地，所述二维卷积模块802具体用于，针对所述训练样本中的文本数据，根据所述文本数据中每个字符以及每个字符在所述文本数据中的位置，确定每个字符对应的输入数据；将确定出的输入数据，输入到所述风险识别模型中对应于文本模态的编码子网中，以根据所述字符和所述位置对所述文本数据进行二维卷积；将二维卷积后得到的矩阵，作为所述训练样本中所述文本数据的第一特征矩阵。

可选地，所述二维卷积模块802具体用于，针对所述训练样本中的结构化数据，根据所述结构化数据中的每组键值对的值，以及每组键值对在所述结构化数据中的位置，确定每组键值对对应的输入数据；将确定出的输入数据，输入到所述风险识别模型中对应于结构化数据的编码子网中，以根据所述键值对的值和所述位置对所述结构化数据进行二维卷积；将二维卷积后得到的矩阵，作为所述训练样本中所述结构化数据的第一特征矩阵。

可选地，所述二维卷积模块802具体用于，针对所述训练样本中的图像数据，根据所述图像数据中各像素点的位置，将所述图像数据输入到所述风险识别模型中对应于图像模态的编码子网中，将所述图像数据转换为矩阵，作为所述训练样本中所述图像数据的第一特征矩阵。

可选地，所述三维卷积模块803具体用于，针对每个模态，将该模态的第一特征矩阵作为输入，输入所述风险识别模型中对应该模态的二维卷积子网中，进行二维卷积得到该模态的第三特征矩阵，各模态的第三特征矩阵的尺寸一致；将得到的不同模态的第三特征矩阵作为不同通道的数据，对各第三特征矩阵进行叠加，得到多通道的第二特征矩阵第三特征矩阵第二特征矩阵。

可选地，所述预测模块804具体用于，响应于待执行业务，确定用户输入的图像以及文字，其中，接收到的所述用户输入的文字数量不超过预设数量；根据所述用户的用户标识，获取执行所述待执行业务所需的结构化数据；根据用户输入的图像、用户输入的文本以及所述结构化数据，通过所述风险识别模型确定风险识别结果；根据所述风险识别结果执行风控业务。

本说明书还提供了一种计算机可读存储介质，该存储介质存储有计算机程序，计算机程序可用于执行上述图1提供的风险识别模型训练方法。

本说明书还提供了图9所示的电子设备的结构示意图。如图9所述，在硬件层面，该接口匹配设备包括处理器、内部总线、网络接口、内存以及非易失性存储器，当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，以实现上述图1所述的风险识别模型训练方法。当然，除了软件实现方式之外，本说明书并不排除其他实现方式，比如逻辑器件抑或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个逻辑单元，也可以是硬件或逻辑器件。

在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进(例如，对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray，FPGA))就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言(Hardware Description Language，HDL)，而HDL也并非仅有一种，而是有许多种，如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等，目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现，例如，控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程逻辑控制器和嵌入微控制器的形式，控制器的例子包括但不限于以下微控制器：ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320，存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本说明书的实施例可提供为方法、系统或计算机程序产品。因此，本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本说明书的实施例而已，并不用于限制本说明书。对于本领域技术人员来说，本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围。

Claims

1.一种风险识别模型训练的方法，所述方法包括：

2.如权利要求1所述的方法，针对每个模态，将该模态的历史数据作为输入，输入到风险识别模型中对应该模态的编码子网中，进行二维卷积得到该模态的第一特征矩阵，具体包括：

3.如权利要求1所述的方法，针对每个模态，将该模态的历史数据作为输入，输入到风险识别模型中对应该模态的编码子网中，进行二维卷积得到该模态的第一特征矩阵，具体包括：

4.如权利要求1所述的方法，针对每个模态，将该模态的历史数据作为输入，输入到风险识别模型中对应该模态的编码子网中，进行二维卷积得到该模态的第一特征矩阵，具体包括：

5.如权利要求1所述的方法，根据不同模态的第一特征矩阵，确定多通道的第二特征矩阵，具体包括：

6.如权利要求5所述的方法，所述风险识别模型中各模态的二维卷积子网中的卷积矩阵的尺寸，与输入到所述各模态的二维卷积子网中的对应模态的第一特征矩阵的尺寸呈正相关。

7.如权利要求2所述的方法，训练完成的风险识别模型用于根据待执行业务的不同模态的数据，识别所述待执行业务是否存在风险，具体包括：

根据所述风险识别结果执行风控业务。

8.如权利要求1所述的方法，所述风险识别模型的三维卷积子网的卷积矩阵的通道数量与所述多通道的第二特征矩阵的通道数量相等。

9.一种风险识别模型训练的装置，所述装置包括：

10.一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述权利要求1～8中任一项所述的方法。

11.一种电子设备，包括储存器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述权利要求1～8中任一项所述的方法。