CN117237095A

CN117237095A - 基于大数据分析的小微金融行业风险预警与监测平台

Info

Publication number: CN117237095A
Application number: CN202311270581.6A
Authority: CN
Inventors: 郭雪; 章郅铮; 吴佳佳; 黄媛媛
Original assignee: Hangyin Consumer Finance Co ltd
Current assignee: Hangyin Consumer Finance Co ltd
Priority date: 2023-09-28
Filing date: 2023-09-28
Publication date: 2023-12-15

Abstract

公开了一种基于大数据分析的小微金融行业风险预警与监测平台。其首先获取与被分析用户相关的人行征信数据、个人收入数据、行业舆情数据和客户经理操作风险数据，接着，将所述个人收入数据输入收入预测模型以得到个人收入预测编码特征向量，然后，对所述人行征信数据、所述个人收入数据、所述行业舆情数据、所述客户经理操作风险数据以及所述个人收入预测编码特征向量进行风险语义特征提取以得到风险相关项语义关联特征向量，最后，基于所述风险相关项语义关联特征向量，确定所述被分析用户的违约风险等级。这样，可以实现风险的动态监测和及时预警，为金融机构和监管部门提供决策依据。

Description

基于大数据分析的小微金融行业风险预警与监测平台

技术领域

本公开涉及大数据分析领域，且更为具体地，涉及一种基于大数据分析的小微金融行业风险预警与监测平台。

背景技术

小微金融行业是指服务于小微企业和个体工商户的金融机构和服务平台。由于小微企业的规模较小，监管滞后和风险集中等问题导致其面临较高的违约风险。为了提前发现和监测这些风险，并采取相应的措施，需要对用户进行信息采集和风险分析。

一般风险预警采集信息以人行征信、个人收入等数据为主，缺乏行业及个人变化类数据，无法对行业及用户全生命周期形成动态监测。因此，期待一种优化的小微金融行业风险预警与监测方案。

发明内容

有鉴于此，本公开提出了一种基于大数据分析的小微金融行业风险预警与监测平台，其可以基于深度学习的人工智能技术，建立风险监测模型，判断和评估小微金融客户的违约风险等级，并及时发出预警信号，从而实现风险的动态监测和及时预警，为金融机构和监管部门提供决策依据。

根据本公开的一方面，提供了一种基于大数据分析的小微金融行业风险预警与监测平台，其包括：

数据获取模块，用于获取与被分析用户相关的人行征信数据、个人收入数据、行业舆情数据和客户经理操作风险数据；

收入预测模块，用于将所述个人收入数据输入收入预测模型以得到个人收入预测编码特征向量；

风险语义特征提取模块，用于对所述人行征信数据、所述个人收入数据、所述行业舆情数据、所述客户经理操作风险数据以及所述个人收入预测编码特征向量进行风险语义特征提取以得到风险相关项语义关联特征向量；以及

违约风险等级分析模块，用于基于所述风险相关项语义关联特征向量，确定所述被分析用户的违约风险等级。

根据本公开的实施例，其首先获取与被分析用户相关的人行征信数据、个人收入数据、行业舆情数据和客户经理操作风险数据，接着，将所述个人收入数据输入收入预测模型以得到个人收入预测编码特征向量，然后，对所述人行征信数据、所述个人收入数据、所述行业舆情数据、所述客户经理操作风险数据以及所述个人收入预测编码特征向量进行风险语义特征提取以得到风险相关项语义关联特征向量，最后，基于所述风险相关项语义关联特征向量，确定所述被分析用户的违约风险等级。这样，可以实现风险的动态监测和及时预警，为金融机构和监管部门提供决策依据。

根据下面参考附图对示例性实施例的详细说明，本公开的其它特征及方面将变得清楚。

附图说明

包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本公开的示例性实施例、特征和方面，并且用于解释本公开的原理。

图1示出根据本公开的实施例的基于大数据分析的小微金融行业风险预警与监测平台的框图。

图2示出根据本公开的实施例的基于大数据分析的小微金融行业风险预警与监测平台中所述风险语义特征提取模块的框图。

图3示出根据本公开的实施例的基于大数据分析的小微金融行业风险预警与监测平台中所述上下文编码单元的框图。

图4示出根据本公开的实施例的基于大数据分析的小微金融行业风险预警与监测方法的流程图。

图5示出根据本公开的实施例的基于大数据分析的小微金融行业风险预警与监测方法的架构示意图。

图6示出根据本公开的实施例的基于大数据分析的小微金融行业风险预警与监测平台的应用场景图。

具体实施方式

下面将结合附图对本公开实施例中的技术方案进行清楚、完整地描述，显而易见地，所描述的实施例仅仅是本公开的部分实施例，而不是全部的实施例。基于本公开实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，也属于本公开保护的范围。

如本公开和权利要求书中所示，除非上下文明确提示例外情形，“一”、“一个”、“一种”和/或“该”等词并非特指单数，也可包括复数。一般说来，术语“包括”与“包含”仅提示包括已明确标识的步骤和元素，而这些步骤和元素不构成一个排它性的罗列，方法或者设备也可能包含其他的步骤或元素。

以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面，但是除非特别指出，不必按比例绘制附图。

另外，为了更好的说明本公开，在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解，没有某些具体细节，本公开同样可以实施。在一些实例中，对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述，以便于凸显本公开的主旨。

针对上述技术问题，本公开的技术构思是在人行征信和个人收入数据的基础上引入行业舆情和客户经理操作风险，形成全流程数据涵盖，并采用基于深度学习的人工智能技术，建立风险监测模型，判断和评估小微金融客户的违约风险等级，并及时发出预警信号，从而实现风险的动态监测和及时预警，为金融机构和监管部门提供决策依据。

基于此，图1示出根据本公开的实施例的基于大数据分析的小微金融行业风险预警与监测平台的框图示意图。如图1所示，根据本公开实施例的基于大数据分析的小微金融行业风险预警与监测平台100，包括：数据获取模块110，用于获取与被分析用户相关的人行征信数据、个人收入数据、行业舆情数据和客户经理操作风险数据；收入预测模块120，用于将所述个人收入数据输入收入预测模型以得到个人收入预测编码特征向量；风险语义特征提取模块130，用于对所述人行征信数据、所述个人收入数据、所述行业舆情数据、所述客户经理操作风险数据以及所述个人收入预测编码特征向量进行风险语义特征提取以得到风险相关项语义关联特征向量；以及，违约风险等级分析模块140，用于基于所述风险相关项语义关联特征向量，确定所述被分析用户的违约风险等级。

应可以理解，数据获取模块110用于获取与被分析用户相关的数据，包括人行征信数据、个人收入数据、行业舆情数据和客户经理操作风险数据。这些数据是进行风险预警和监测的基础。收入预测模块120将个人收入数据输入收入预测模型，以得到个人收入预测编码特征向量，这个模块的目的是预测被分析用户的未来收入情况，为后续风险分析提供数据支持。风险语义特征提取模块130对人行征信数据、个人收入数据、行业舆情数据、客户经理操作风险数据以及个人收入预测编码特征向量进行风险语义特征提取，得到风险相关项语义关联特征向量，这个模块的目的是从各类数据中提取风险相关的特征信息，为后续的风险分析提供数据基础。违约风险等级分析模块140基于风险相关项语义关联特征向量，确定被分析用户的违约风险等级，这个模块通过分析风险特征向量，评估被分析用户的违约风险水平，并给出相应的风险等级。综合来说，这个平台的各个模块分别用于获取数据、预测个人收入、提取风险特征和分析违约风险等级，以实现小微金融行业的风险预警和监测功能。

具体地，在本公开的技术方案中，首先，获取与被分析用户相关的人行征信数据、个人收入数据、行业舆情数据和客户经理操作风险数据。然后，将所述个人收入数据输入收入预测模型以得到个人收入预测编码特征向量。这里，利用历史的个人收入数据来估计个人未来收入水平，动态地监测被分析用户的收入变化，可以评估被分析用户的还款能力。

特别地，这里，所述收入预测模型包括收入预测编码器与收入预测解码器。应可以理解，在收入预测模型中，收入预测编码器和收入预测解码器是两个关键组件，它们一起构成了一个编码-解码结构的模型。收入预测编码器(Income Prediction Encoder)是负责将输入数据编码为潜在表示(latent representation)的部分。它可以是一个神经网络模型，如卷积神经网络(Convolutional Neural Network，CNN)、循环神经网络(RecurrentNeural Network，RNN)或变分自编码器(Variational Autoencoder，VAE)。收入预测编码器通过学习数据中的模式和特征，将输入数据转化为低维的潜在表示，捕捉数据中的重要信息。收入预测解码器(Income Prediction Decoder)是负责从潜在表示中重构预测收入的部分。它与收入预测编码器相对应，可以是一个神经网络模型，如逆卷积神经网络(Deconvolutional Neural Network，DeconvNet)、递归神经网络(Recursive NeuralNetwork，RecNN)或生成对抗网络(Generative Adversarial Network，GAN)。收入预测解码器接收收入预测编码器生成的潜在表示，并通过学习将其解码为预测的收入数据。通过收入预测编码器和收入预测解码器的结合，收入预测模型可以将输入数据编码为潜在表示，并从潜在表示中重构预测的收入数据。这种编码-解码结构的模型可以学习到数据的潜在分布和特征，从而实现对未来收入的预测。具体的模型结构和算法选择取决于具体的应用场景和数据特点。

然后，对所述人行征信数据、所述个人收入数据、所述行业舆情数据、所述客户经理操作风险数据以及所述个人收入预测编码特征向量进行风险语义特征提取以得到风险相关项语义关联特征向量。也就是，利用所述人行征信数据、所述个人收入数据、所述行业舆情数据、所述客户经理操作风险数据，并融合所述个人收入预测编码特征向量所表达的被分析用户的还款能力信息，来综合评估所述被分析用户的风险程度。

在本公开的一个具体示例中，对所述人行征信数据、所述个人收入数据、所述行业舆情数据、所述客户经理操作风险数据以及所述个人收入预测编码特征向量进行风险语义特征提取以得到风险相关项语义关联特征向量的编码过程，包括：先分别对所述人行征信数据、所述个人收入数据、所述行业舆情数据和所述客户经理操作风险数据进行编码以得到人行征信数据编码向量、个人收入编码向量、行业舆情编码向量和客户经理操作风险编码向量；再将所述个人收入预测编码特征向量、所述人行征信数据编码向量、所述个人收入编码向量、所述行业舆情编码向量和所述客户经理操作风险编码向量通过基于转换器的上下文编码器以得到风险相关项语义关联特征向量。

相应地，如图2所示，所述风险语义特征提取模块130，包括：向量化单元131，用于分别对所述人行征信数据、所述个人收入数据、所述行业舆情数据和所述客户经理操作风险数据进行编码以得到人行征信数据编码向量、个人收入编码向量、行业舆情编码向量和客户经理操作风险编码向量；以及，上下文编码单元132，用于将所述个人收入预测编码特征向量、所述人行征信数据编码向量、所述个人收入编码向量、所述行业舆情编码向量和所述客户经理操作风险编码向量通过基于转换器的上下文编码器以得到所述风险相关项语义关联特征向量。应可以理解，向量化单元131用于对不同类型的数据进行编码，以得到相应的编码向量，具体包括以下编码向量：人行征信数据编码向量：对人行征信数据进行编码，将其转化为数值向量表示；个人收入编码向量：对个人收入数据进行编码，将其转化为数值向量表示；行业舆情编码向量：对行业舆情数据进行编码，将其转化为数值向量表示；客户经理操作风险编码向量：对客户经理操作风险数据进行编码，将其转化为数值向量表示。这些编码向量将作为后续分析的输入，用于提取风险相关的语义特征。上下文编码单元132使用基于转换器的上下文编码器，将个人收入预测编码特征向量、人行征信数据编码向量、个人收入编码向量、行业舆情编码向量和客户经理操作风险编码向量进行上下文编码，以得到风险相关项的语义关联特征向量。上下文编码器可以通过将不同编码向量进行组合和转换，捕捉它们之间的关联和语义信息。这样得到的风险相关项语义关联特征向量将用于后续的风险分析和违约风险等级的确定。综合来说，向量化单元用于将不同类型的数据编码为数值向量，而上下文编码单元通过上下文编码器将这些编码向量结合起来，得到风险相关项的语义关联特征向量。这些特征向量将为后续的风险分析提供数据基础。

值得一提的是，在上下文编码单元132中提到的转换器是指一种模型或算法，用于将输入的编码向量进行转换和组合，以生成最终的语义关联特征向量。转换器可以是各种神经网络模型，如多层感知器(MLP)、卷积神经网络(CNN)或循环神经网络(RNN)。这些神经网络模型可以通过学习参数来对输入进行非线性变换，从而提取更高层次的特征。在上下文编码单元中，转换器的作用是将个人收入预测编码特征向量、人行征信数据编码向量、个人收入编码向量、行业舆情编码向量和客户经理操作风险编码向量进行组合和转换，以捕捉它们之间的关联和语义信息。这样生成的风险相关项的语义关联特征向量将包含更丰富的信息，用于后续的风险分析和违约风险等级的确定。换言之，转换器是一种用于将输入编码向量进行转换和组合的模型或算法，用于提取更高层次的特征和捕捉它们之间的关联信息。

更具体地，如图3所示，所述上下文编码单元132，包括：编码子单元1321，用于将所述个人收入预测编码特征向量、所述人行征信数据编码向量、所述个人收入编码向量、所述行业舆情编码向量和所述客户经理操作风险编码向量输入所述基于转换器的上下文编码器以得到多个风险相关项语义特征向量；以及，级联子单元1322，用于将所述多个风险相关项语义特征向量进行级联以得到所述风险相关项语义关联特征向量。应可以理解，上下文编码单元132包括编码子单元1321和级联子单元1322两个子单元，这两个子单元在基于转换器的上下文编码器中扮演不同的角色，用于处理输入数据并生成风险相关项的语义特征向量。编码子单元1321的作用是将多个输入向量(包括个人收入预测编码特征向量、人行征信数据编码向量、个人收入编码向量、行业舆情编码向量和客户经理操作风险编码向量)输入基于转换器的上下文编码器，以获得多个风险相关项的语义特征向量。这些输入向量可能来自不同的数据源或经过不同的特征提取方法得到。编码子单元将这些向量传递给上下文编码器，通过编码过程将其转化为低维的语义特征向量，以捕捉数据之间的语义关联和风险特征。级联子单元1322的作用是将多个风险相关项的语义特征向量进行级联，以得到风险相关项的语义关联特征向量。在编码子单元中，每个输入向量都被编码成相应的语义特征向量。级联子单元将这些特征向量连接在一起，形成一个更高维度的向量表示，该向量表示包含了多个风险相关项之间的语义关联信息。通过级联操作，可以综合考虑不同风险相关项的特征，提供更全面的风险分析和预测。编码子单元和级联子单元的组合在上下文编码单元中起到协同作用，将输入数据转化为风险相关项的语义特征向量，并捕捉数据之间的语义关联。这些特征向量可以用于后续的风险分析、预测和决策制定。具体的实现方式和算法选择可能会根据具体的应用场景和数据特点而有所不同。

进一步地，"级联"指的是将多个向量或特征进行连接或串联的操作。级联操作可以将多个特征向量按顺序连接在一起，形成一个更长的向量或特征表示。在所述级联子单元1322中，它的作用是将多个风险相关项的语义特征向量进行级联操作，以生成风险相关项语义关联特征向量。具体而言，级联子单元将多个语义特征向量按照一定的顺序连接在一起，形成一个更长的向量，该向量包含了多个风险相关项的信息。这样做的目的是为了获得更全面和综合的风险相关特征表示，以支持后续的风险分析和决策过程。需要注意的是，级联操作并不改变特征的维度，只是将多个特征按顺序连接在一起，以形成更丰富的特征表示。

继而，将所述风险相关项语义关联特征向量通过分类器以得到分类结果，所述分类结果用于表示被分析用户的违约风险等级标签。相应地，所述违约风险等级分析模块140，用于：将所述风险相关项语义关联特征向量通过分类器以得到分类结果，所述分类结果用于表示所述被分析用户的违约风险等级标签。

更具体地，所述违约风险等级分析模块140，进一步用于：使用所述分类器的全连接层对所述风险相关项语义关联特征向量进行全连接编码以得到编码分类特征向量；以及，将所述编码分类特征向量输入所述分类器的Softmax分类函数以得到所述分类结果。

应可以理解，分类器的作用是利用给定的类别、已知的训练数据来学习分类规则和分类器，然后对未知数据进行分类(或预测)。逻辑回归(logistics)、SVM等常用于解决二分类问题，对于多分类问题(multi-class classification)，同样也可以用逻辑回归或SVM，只是需要多个二分类来组成多分类，但这样容易出错且效率不高，常用的多分类方法有Softmax分类函数。

值得一提的是，在违约风险等级分析模块140中，使用全连接层对风险相关项语义关联特征向量进行全连接编码。全连接编码是指将输入的特征向量与权重矩阵进行矩阵乘法运算，并通过激活函数对结果进行非线性变换得到编码特征向量。在全连接层中，每个输入特征向量的元素都与权重矩阵中的对应元素相乘，然后将所有乘积结果进行求和。这个求和操作可以看作是对输入特征向量进行线性变换。接着，通过激活函数(如ReLU、Sigmoid等)对线性变换的结果进行非线性映射，以引入非线性关系和提取更高级别的特征。全连接编码的目的是通过权重矩阵的学习，将输入的语义关联特征向量转换为更具代表性和区分性的编码分类特征向量。这些编码分类特征向量可以更好地表征风险相关项的特征，并作为输入传递给分类器的Softmax分类函数。Softmax分类函数将编码分类特征向量作为输入，并将其映射到多个类别的概率分布上。这样可以得到分类结果，即每个类别的概率值，用于确定违约风险的等级。换言之，全连接编码是指在全连接层中对风险相关项语义关联特征向量进行线性变换和非线性映射，以获得更具代表性和区分性的编码分类特征向量。

进一步地，在本公开的技术方案中，所述的基于大数据分析的小微金融行业风险预警与监测平台，其还包括用于对所述收入预测模型、所述基于转换器的上下文编码器和所述分类器进行训练的训练模块。应可以理解，训练模块在基于大数据分析的小微金融行业风险预警与监测平台中具有重要的作用，它用于对收入预测模型、基于转换器的上下文编码器和分类器进行训练，以使它们能够适应特定的任务和数据集。训练模块的主要功能包括以下几个方面：1.收入预测模型训练：训练模块使用历史的收入数据和相关的特征数据，通过机器学习算法或深度学习模型对收入预测模型进行训练。这样，收入预测模型可以学习到数据中的模式和规律，从而能够对未来的收入进行预测。2.上下文编码器训练：上下文编码器是用于对不同类型的数据进行编码和提取风险相关项的语义关联特征向量的模块。训练模块使用标注的数据集或无监督学习方法，对上下文编码器进行训练，以使其能够准确地捕捉数据之间的语义关联和风险特征。3.分类器训练：分类器是用于将风险相关项的编码分类特征向量映射到风险等级的模块。训练模块使用标注的数据集和监督学习算法，对分类器进行训练，使其能够根据编码分类特征向量准确地分类风险等级。通过训练模块对这些模型和模块进行训练，可以使它们具备更好的预测和分类能力，提高风险预警与监测平台的准确性和效果。训练模块的训练过程通常需要大量的数据和计算资源，并通过优化算法来调整模型参数，以最大程度地提升模型的性能。

更具体地，所述训练模块，包括：训练数据获取单元，用于获取训练数据，所述训练数据包括与被分析用户相关的训练人行征信数据、训练个人收入数据、训练行业舆情数据和训练客户经理操作风险数据，以及，所述被分析用户的违约风险等级标签的真实值；训练收入预测单元，用于将所述训练个人收入数据输入所述收入预测模型以得到训练个人收入预测编码特征向量；训练编码单元，用于分别对所述训练人行征信数据、所述训练个人收入数据、所述训练行业舆情数据和所述训练客户经理操作风险数据进行编码以得到训练人行征信数据编码向量、训练个人收入编码向量、训练行业舆情编码向量和训练客户经理操作风险编码向量；训练上下文编码单元，用于将所述训练个人收入预测编码特征向量、所述训练人行征信数据编码向量、所述训练个人收入编码向量、所述训练行业舆情编码向量和所述训练客户经理操作风险编码向量通过所述基于转换器的上下文编码器以得到训练风险相关项语义关联特征向量；训练分类单元，用于将所述训练风险相关项语义关联特征向量通过分类器以得到分类损失函数值；以及，训练损失优化单元，用于以所述分类损失函数值来对所述收入预测模型、所述基于转换器的上下文编码器和所述分类器进行训练，其中，在所述训练的每一轮迭代中，对所述训练风险相关项语义关联特征向量进行权重空间迭代递归的定向提议化优化迭代。

在本公开的技术方案中，将所述训练个人收入预测编码特征向量、所述训练人行征信数据编码向量、所述训练个人收入编码向量、所述训练行业舆情编码向量和所述训练客户经理操作风险编码向量通过基于转换器的上下文编码器后，尽管基于所述训练人行征信数据、所述训练个人收入数据、所述训练行业舆情数据和所述训练客户经理操作风险数据的语义上下文关联对其进行了文本语义特征编码，但所获得的所述训练风险相关项语义关联特征向量仍然会具有对应于各个原文本数据的源语义分布差异的特征分布差异，使得所述训练风险相关项语义关联特征向量在通过分类器进行分类时，所述分类器的权重矩阵相对于归属于预定样本语义特征分布的类标签的收敛困难，影响分类器的训练效果。

因此，本公开的申请人在将所述训练风险相关项语义关联特征向量通过分类器进行分类时，在每个迭代时，对所述训练风险相关项语义关联特征向量进行权重空间迭代递归的定向提议化优化。

相应地，在一个示例中，在所述训练的每一轮迭代中，以如下优化公式对所述训练风险相关项语义关联特征向量进行权重空间迭代递归的定向提议化优化迭代以得到优化训练风险相关项语义关联特征向量；其中，所述优化公式为：

其中，M₁和M₂分别是上次和本次迭代的权重矩阵，其中在首次迭代时，采用不同的初始化策略设置M₁和M₂，(例如，M₁设置为单位矩阵而M₂设置为待分类特征向量的均值对角矩阵)，是矩阵乘法，/>是向量加法，⊙是按位置点乘，exp(·)是向量的指数运算，对向量进行指数运算表示以向量中各个位置的特征值为幂的自然指数函数值，V_c是所述训练风险相关项语义关联特征向量，/>是所述优化训练风险相关项语义关联特征向量。

这里，所述权重空间迭代递归的定向提议化优化可以通过将初始的待分类的所述训练风险相关项语义关联特征向量V_c作为锚点，来在权重空间内基于权重矩阵迭代的对应于所述训练风险相关项语义关联特征向量V_c的不同样本语义特征分布方向获得不同样本语义特征分布维度下的锚点足迹(anchor footprint)，以作为在权重空间迭代递归的定向提议(oriented proposal)，从而基于预测提议地提升权重矩阵收敛的类置信度和局部精确性，以提升所述训练风险相关项语义关联特征向量通过分类器的训练效果。

综上，基于本公开实施例的基于大数据分析的小微金融行业风险预警与监测平台100被阐明，其可以实现风险的动态监测和及时预警，为金融机构和监管部门提供决策依据。

如上所述，根据本公开实施例的所述基于大数据分析的小微金融行业风险预警与监测平台100可以实现在各种终端设备中，例如具有基于大数据分析的小微金融行业风险预警与监测算法的服务器等。在一个示例中，基于大数据分析的小微金融行业风险预警与监测平台100可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如，该基于大数据分析的小微金融行业风险预警与监测平台100可以是该终端设备的操作系统中的一个软件模块，或者可以是针对于该终端设备所开发的一个应用程序；当然，该基于大数据分析的小微金融行业风险预警与监测平台100同样可以是该终端设备的众多硬件模块之一。

替换地，在另一示例中，该基于大数据分析的小微金融行业风险预警与监测平台100与该终端设备也可以是分立的设备，并且该基于大数据分析的小微金融行业风险预警与监测平台100可以通过有线和/或无线网络连接到该终端设备，并且按照约定的数据格式来传输交互信息。

图4示出根据本公开的实施例的基于大数据分析的小微金融行业风险预警与监测方法的流程图。图5示出根据本公开的实施例的基于大数据分析的小微金融行业风险预警与监测方法的系统架构的示意图。如图4和图5所示，根据本公开实施例的基于大数据分析的小微金融行业风险预警与监测方法，其包括：S110，获取与被分析用户相关的人行征信数据、个人收入数据、行业舆情数据和客户经理操作风险数据；S120，将所述个人收入数据输入收入预测模型以得到个人收入预测编码特征向量；S130，对所述人行征信数据、所述个人收入数据、所述行业舆情数据、所述客户经理操作风险数据以及所述个人收入预测编码特征向量进行风险语义特征提取以得到风险相关项语义关联特征向量；以及，S140，基于所述风险相关项语义关联特征向量，确定所述被分析用户的违约风险等级。

在一种可能的实现方式中，所述收入预测模型包括收入预测编码器与收入预测解码器。

这里，本领域技术人员可以理解，上述基于大数据分析的小微金融行业风险预警与监测方法中的各个步骤的具体操作已经在上面参考图1到图3的基于大数据分析的小微金融行业风险预警与监测平台的描述中得到了详细介绍，并因此，将省略其重复描述。

图6示出根据本公开的实施例的基于大数据分析的小微金融行业风险预警与监测平台的应用场景图。如图6所示，在该应用场景中，首先，获取与被分析用户相关的人行征信数据(例如，图6中所示意的D1)、个人收入数据(例如，图6中所示意的D2)、行业舆情数据(例如，图6中所示意的D3)和客户经理操作风险数据(例如，图6中所示意的D4)，然后，将所述人行征信数据、所述个人收入数据、所述行业舆情数据、所述客户经理操作风险数据输入至部署有基于大数据分析的小微金融行业风险预警与监测算法的服务器(例如，图6中所示意的S)中，其中，所述服务器能够使用所述基于大数据分析的小微金融行业风险预警与监测算法对所述人行征信数据、所述个人收入数据、所述行业舆情数据、所述客户经理操作风险数据进行处理以得到用于表示所述被分析用户的违约风险等级标签的分类结果。

附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分，所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

以上已经描述了本公开的各实施例，上述说明是示例性的，并非穷尽性的，并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择，旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进，或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims

1.一种基于大数据分析的小微金融行业风险预警与监测平台，其特征在于，包括：

2.根据权利要求1所述的基于大数据分析的小微金融行业风险预警与监测平台，其特征在于，所述收入预测模型包括收入预测编码器与收入预测解码器。

3.根据权利要求2所述的基于大数据分析的小微金融行业风险预警与监测平台，其特征在于，所述风险语义特征提取模块，包括：

向量化单元，用于分别对所述人行征信数据、所述个人收入数据、所述行业舆情数据和所述客户经理操作风险数据进行编码以得到人行征信数据编码向量、个人收入编码向量、行业舆情编码向量和客户经理操作风险编码向量；以及

上下文编码单元，用于将所述个人收入预测编码特征向量、所述人行征信数据编码向量、所述个人收入编码向量、所述行业舆情编码向量和所述客户经理操作风险编码向量通过基于转换器的上下文编码器以得到所述风险相关项语义关联特征向量。

4.根据权利要求3所述的基于大数据分析的小微金融行业风险预警与监测平台，其特征在于，所述上下文编码单元，包括：

编码子单元，用于将所述个人收入预测编码特征向量、所述人行征信数据编码向量、所述个人收入编码向量、所述行业舆情编码向量和所述客户经理操作风险编码向量输入所述基于转换器的上下文编码器以得到多个风险相关项语义特征向量；以及

级联子单元，用于将所述多个风险相关项语义特征向量进行级联以得到所述风险相关项语义关联特征向量。

5.根据权利要求4所述的基于大数据分析的小微金融行业风险预警与监测平台，其特征在于，所述违约风险等级分析模块，用于：

将所述风险相关项语义关联特征向量通过分类器以得到分类结果，所述分类结果用于表示所述被分析用户的违约风险等级标签。

6.根据权利要求5所述的基于大数据分析的小微金融行业风险预警与监测平台，其特征在于，还包括用于对所述收入预测模型、所述基于转换器的上下文编码器和所述分类器进行训练的训练模块。

7.根据权利要求6所述的基于大数据分析的小微金融行业风险预警与监测平台，其特征在于，所述训练模块，包括：

训练数据获取单元，用于获取训练数据，所述训练数据包括与被分析用户相关的训练人行征信数据、训练个人收入数据、训练行业舆情数据和训练客户经理操作风险数据，以及，所述被分析用户的违约风险等级标签的真实值；

训练收入预测单元，用于将所述训练个人收入数据输入所述收入预测模型以得到训练个人收入预测编码特征向量；

训练编码单元，用于分别对所述训练人行征信数据、所述训练个人收入数据、所述训练行业舆情数据和所述训练客户经理操作风险数据进行编码以得到训练人行征信数据编码向量、训练个人收入编码向量、训练行业舆情编码向量和训练客户经理操作风险编码向量；

训练上下文编码单元，用于将所述训练个人收入预测编码特征向量、所述训练人行征信数据编码向量、所述训练个人收入编码向量、所述训练行业舆情编码向量和所述训练客户经理操作风险编码向量通过所述基于转换器的上下文编码器以得到训练风险相关项语义关联特征向量；

训练分类单元，用于将所述训练风险相关项语义关联特征向量通过分类器以得到分类损失函数值；以及

训练损失优化单元，用于以所述分类损失函数值来对所述收入预测模型、所述基于转换器的上下文编码器和所述分类器进行训练，其中，在所述训练的每一轮迭代中，对所述训练风险相关项语义关联特征向量进行权重空间迭代递归的定向提议化优化迭代。