CN112270547A - 基于特征构造的金融风险评估方法、装置和电子设备 - Google Patents

基于特征构造的金融风险评估方法、装置和电子设备 Download PDF

Info

Publication number
CN112270547A
CN112270547A CN202011168300.2A CN202011168300A CN112270547A CN 112270547 A CN112270547 A CN 112270547A CN 202011168300 A CN202011168300 A CN 202011168300A CN 112270547 A CN112270547 A CN 112270547A
Authority
CN
China
Prior art keywords
feature
data
data set
features
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011168300.2A
Other languages
English (en)
Inventor
李恒奎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Qifu Information Technology Co ltd
Original Assignee
Shanghai Qifu Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Qifu Information Technology Co ltd filed Critical Shanghai Qifu Information Technology Co ltd
Priority to CN202011168300.2A priority Critical patent/CN112270547A/zh
Publication of CN112270547A publication Critical patent/CN112270547A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4016Transaction verification involving fraud or risk level assessment in transaction processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Accounting & Taxation (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Security & Cryptography (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明提供了一种基于特征构造的金融风险评估方法、装置和电子设备。该方法包括:获取历史样本数据集,建立初始训练数据集,历史样本数据集包括历史用户的用户属性数据和用户行为数据;采用LightGBM模型,使用初始训练数据集进行训练,以得到建模特征信息;从所述建模特征信息中筛选建模特征数据,该建模特征数据包括含有交叉特征数据的高维稀疏特征数据;对所筛选的特征数据进行加权组合处理;将加权组合处理后的特征数据增加到初始训练数据集,得到新训练数据集,使用该新训练数据集训练评估模型,评估用户的金融风险。本发明能够更准确地综合评估用户资质,更精确地预测用户风险情况,还提高了模型效果。

Description

基于特征构造的金融风险评估方法、装置和电子设备
技术领域
本发明涉及计算机信息处理领域,具体而言,涉及一种基于特征构造的金融风险评估方法、装置和电子设备。
背景技术
风险控制(简称为风控)是指风险管理者采取各种措施和方法,消灭或减少风险事件发生的各种可能性,或风险控制者减少风险事件发生时造成的损失。风险控制一般应用于金融行业,如对公司的交易、商家的交易或个人交易等进行风险控制。
在现有技术中,金融风险评估主要的目的是如何区分出好客户和坏客户,评估用户的风险情况,以降低信用风险实现利润最大化。目前,主要采用Logistic回归统计方法计算风险评分,例如logistics回归方法选取10-20个特征作为引子,在处理高维数据时效果不佳。此外,随着机器学习技术的发展,特别是树模型中的XGBoost模型在金融风险评估领域得到了广泛应用,但是该模型涉及参数较多,训练到一定程度后,很难再提升预测效果。
然而,在风控领域中,特征对模型的效果影响尤为突出,好的特征不仅需要能够提高模型效果,而且要有一定的可解释性。在现有建模过程中。通常利用一些外部数据以及内部衍生的变量直接进行建模,而由于特征维度比较高,造成特征之间交互的多项式组合往往考虑较少,因此会造成特征信息挖掘不充分。另外,随着树的棵数增加产生的特征维度越高,形成高维稀疏特征,从而导致模型的训练效果较差。
因此,有必要提供一种精度更高的金融风险评估方法。
发明内容
为了进一步研究在资源申请流程建模中的特征构造,优化风险评估方法,本发明提供了一种基于特征构造的金融风险评估方法,包括:获取历史样本数据集,建立初始训练数据集,所述历史样本数据集包括历史用户的用户属性数据和用户行为数据;采用LightGBM模型,使用所述初始训练数据集进行训练,以得到建模特征信息;根据特征筛选规则,从所述建模特征信息中筛选建模特征数据,该建模特征数据包括含有交叉特征数据的高维稀疏特征数据;对所筛选的特征数据进行加权组合处理;将加权组合处理后的特征数据增加到初始训练数据集,得到新训练数据集,使用该新训练数据集训练评估模型,评估用户的金融风险。
优选地,所述得到建模特征信息包括:在训练LightGBM模型的过程中,生成多棵树,每个树均包括多个叶子节点,将每个叶子节点作为一个交叉特征,以生成第一交叉特征信息;将至少两颗树的所有叶子节点进行拼接,以生成包含不同交叉信息的第二交叉特征信息;随着树的棵数增加,生成相应维度的稀疏特征。
优选地,还包括:设定特征筛选规则,所述特征筛选规则包括设定树的数量阈值、稀疏特征的维数阈值和相关度阈值;根据所述树的数量阈值、所述稀疏特征的维数阈值,筛选特定维度的稀疏特征,所述稀疏特征包含叶子节点的交叉信息;根据相关度阈值,筛选第一交叉特征和第二交叉特征。
优选地,对所筛选的特征数据进行加权组合处理包括:利用注意力机制,计算每个特征的权重参数,计算公式如下:
Figure BDA0002746466420000021
其中,Wrij为权重参数;Xr为原始特征;Xi为交叉特征或特定维度的稀疏特征;h为深度;b为偏置参数。
优选地,还包括:根据所计算的权重参数,将原始特征与交叉特征或特定维度的稀疏特征进行拼接组合,生成衍生特征,以用于建立新训练数据集;所述原始特征为用户特征数据、交易数据和动支数据。
优选地,还包括:通过CNN算法获取局部特征信息,在使用MLPs算法对所获取的局部特征信息进行拼接组合,以生成组合特征。
优选地,还包括:使用Embedding层对所筛选的交叉特征数据进行降维处理,以生成低纬密集向量,并计算各交叉特征之间的相关度;根据所计算的相关度和所述相关度阈值,进一步进行筛选建模特征数据。
优选地,还包括:根据所确定的各特征的权重参数,进行重采样,以重新建立初始训练数据集。
优选地,还包括:采用LightGBM模型,构建金融风险预测模型,使用所述新训练数据集训练所述金融风险预测模型,以计算目标用户的风险评估值;所述风险评估值包括违约概率和/或逾期概率。
优选地,还包括:获取用户资源请求的申请数据,使用特定时间段内的用户申请数据、交易数据、动支数据,建立测试数据集,所述特定时间段包括一个月、两个月或三个月;使用所述测试数据,对所述金融风险预测模型进行模型精度优化,以得到优化后的金融风险预测模型。
此外,本发明还提供了一种基于特征构造的金融风险评估装置,包括:数据获取模块,用于获取历史样本数据集,建立初始训练数据集,所述历史样本数据集包括历史用户的用户属性数据和用户行为数据;第一处理模块,用于采用LightGBM模型,使用所述初始训练数据集进行训练,以得到建模特征信息;筛选模块,根据特征筛选规则,从所述建模特征信息中筛选建模特征数据,该建模特征数据包括含有交叉特征数据的高维稀疏特征数据;第二处理模块,用于对所筛选的特征数据进行加权组合处理;建立模块,用于将加权组合处理后的特征数据增加到初始训练数据集,得到新训练数据集,使用该新训练数据集训练评估模型,评估用户的金融风险。
优选地,还包括:在训练LightGBM模型的过程中,生成多棵树,每个树均包括多个叶子节点,将每个叶子节点作为一个交叉特征,以生成第一交叉特征信息;将至少两颗树的所有叶子节点进行拼接,以生成包含不同交叉信息的第二交叉特征信息;随着树的棵数增加,生成相应维度的稀疏特征。
优选地,还包括设定模块,所述设定模块用于设定特征筛选规则,所述特征筛选规则包括设定树的数量阈值、稀疏特征的维数阈值和相关度阈值;根据所述树的数量阈值、所述稀疏特征的维数阈值,筛选特定维度的稀疏特征,所述稀疏特征包含叶子节点的交叉信息;根据相关度阈值,筛选第一交叉特征和第二交叉特征。
优选地,还包括计算模块,所述计算模块利用注意力机制,计算每个特征的权重参数,计算公式如下:
Figure BDA0002746466420000041
其中,Wrij为权重参数;Xr为原始特征;Xi为交叉特征或特定维度的稀疏特征;h为深度;b为偏置参数。
优选地,还包括:根据所计算的权重参数,将原始特征与交叉特征或特定维度的稀疏特征进行拼接组合,生成衍生特征,以用于建立新训练数据集;所述原始特征为用户特征数据、交易数据和动支数据。
优选地,还包括:通过CNN算法获取局部特征信息,在使用MLPs算法对所获取的局部特征信息进行拼接组合,以生成组合特征。
优选地,还包括:使用Embedding层对所筛选的交叉特征数据进行降维处理,以生成低纬密集向量,并计算各交叉特征之间的相关度;根据所计算的相关度和所述相关度阈值,进一步进行筛选建模特征数据。
优选地,还包括:根据所确定的各特征的权重参数,进行重采样,以重新建立初始训练数据集。
优选地,所述建立模块还包括:采用LightGBM模型,构建金融风险预测模型,使用所述新训练数据集训练所述金融风险预测模型,以计算目标用户的风险评估值;所述风险评估值包括违约概率和/或逾期概率。
优选地,所述数据获取模块还包括:获取用户资源请求的申请数据,使用特定时间段内的用户申请数据、交易数据、动支数据,建立测试数据集,所述特定时间段包括一个月、两个月或三个月;使用所述测试数据,对所述金融风险预测模型进行模型精度优化,以得到优化后的金融风险预测模型。
此外,本发明还提供了一种电子设备,其中,该电子设备包括:处理器;以及,存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行本发明所述的基于特征构造的金融风险评估方法。
此外,本发明还提供了一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现本发明所述的基于特征构造的金融风险评估方法。
有益效果
与现有技术相比,本发明的基于特征构造的金融风险评估方法利用LightGBM模型构造一些高维可解释的特征来丰富原有特征信息,并利用神经网络中的Embedding层来将这些高维稀疏特征转化为低维密集向量,再配合使用注意力机制加强原始特征与这些高维稀疏特征之间的交互,以从大量信息中快速筛选出高价值信息(即含有交叉特征信息的高维稀疏特征数据),还能够充分利用用户的特征信息,构造更多的含交叉信息的高维特征来丰富特征维度。由此,能够更准确地综合评估用户资质,更精确地预测用户风险情况;提高了模型效果,优化了评估方法。
附图说明
为了使本发明所解决的技术问题、采用的技术手段及取得的技术效果更加清楚,下面将参照附图详细描述本发明的具体实施例。但需声明的是,下面描述的附图仅仅是本发明本发明示例性实施例的附图,对于本领域的技术人员来讲,在不付出创造性劳动的前提下,可以根据这些附图获得其他实施例的附图。
图1是本发明的实施例1的基于特征构造的金融风险评估方法的一示例的流程图。
图2是本发明的实施例1的基于特征构造的金融风险评估方法的另一示例的流程图。
图3是本发明的实施例1的基于特征构造的金融风险评估方法的又一示例的流程图。
图4是本发明的实施例2的基于特征构造的金融风险评估装置的一示例的示意图。
图5是本发明的实施例2的基于特征构造的金融风险评估装置的另一示例的示意图。
图6是本发明的实施例2的基于特征构造的金融风险评估装置的又一示例的示意图。
图7是根据本发明的一种电子设备的示例性实施例的结构框图。
图8是根据本发明的计算机可读介质的示例性实施例的结构框图。
具体实施方式
现在将参考附图更全面地描述本发明的示例性实施例。然而,示例性实施例能够以多种形式实施,且不应被理解为本发明仅限于在此阐述的实施例。相反,提供这些示例性实施例能够使得本发明更加全面和完整,更加便于将发明构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的元件、组件或部分,因而将省略对它们的重复描述。
在符合本发明的技术构思的前提下,在某个特定的实施例中描述的特征、结构、特性或其他细节不排除可以以合适的方式结合在一个或更多其他的实施例中。
在对于具体实施例的描述中,本发明描述的特征、结构、特性或其他细节是为了使本领域的技术人员对实施例进行充分理解。但是,并不排除本领域技术人员可以实践本发明的技术方案而没有特定特征、结构、特性或其他细节的一个或更多。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
应理解,虽然本文中可能使用第一、第二、第三等表示编号的定语来描述各种器件、元件、组件或部分,但这不应受这些定语限制。这些定语乃是用以区分一者与另一者。例如,第一器件亦可称为第二器件而不偏离本发明实质的技术方案。
术语“和/或”或者“及/或”包括相关联的列出项目中的任一个及一或多者的所有组合。
鉴于上述问题,本发明提供了一种基于特征构造的金融风险评估方法。该方法利用LightGBM模型构造一些高维可解释的特征来丰富原有特征信息,并利用神经网络中的Embedding层来将这些高维稀疏特征转化为低维密集向量,从而提高模型效果。再配合使用神经网络中的Attention机制加强原始特征与这些高维稀疏特征之间的交互,以从大量信息中快速筛选出高价值信息(即含有交叉特征信息的高维稀疏特征数据)。由此,能够更准确地综合评估用户资质,更精确地预测用户风险情况,还提高了模型效果,优化了评估方法。以下将以本发明方法在金融风险评估模型的应用为示例,将详细描述说明本发明的方法流程。
实施例1
下面,将参照图1至图3描述本发明的基于特征构造的金融风险评估方法的实施例。
图1为本发明的基于特征构造的金融风险评估方法的流程图。如图1所示,一种金融风险评估方法,该方法包括如下步骤。
步骤S101,获取历史样本数据集,建立初始训练数据集,所述历史样本数据集包括历史用户的用户属性数据和用户行为数据。
步骤S102,采用LightGBM模型,使用所述初始训练数据集进行训练,以得到建模特征信息。
步骤S103,根据特征筛选规则,从所述建模特征信息中筛选建模特征数据,该建模特征数据包括含有交叉特征数据的高维稀疏特征数据。
步骤S104,对所筛选的特征数据进行加权组合处理。
步骤S105,将加权组合处理后的特征数据增加到初始训练数据集,得到新训练数据集,使用该新训练数据集训练评估模型,评估用户的金融风险。
在本示例中,本发明的方法用于金融风险评估或预测。
首先,在步骤S101中,获取历史样本数据集,建立初始训练数据集,所述历史样本数据集包括历史用户的用户属性数据和用户行为数据。
在本示例中,用户属性数据包括用户特征数据。例如用户年龄、性别、职业、月收入/年收入等。
具体地,用户行为数据包括社交行为数据、交易数据、动支数据、违约或逾期数据等。
优选地,对所获取的历史用户数据集中的数据进行数据清洗,主要包括缺失值填充、时间字段处理、类别变量编码等。
需要说明的是,上述仅作为示例进行说明,不能理解成对本发明的限制。
接下来,在步骤S102中,采用LightGBM模型,使用所述初始训练数据集进行训练,以得到建模特征信息。
在本示例中,使用所述初始训练数据集训练LightGBM模型。换言之,利用LightGBM构造一些高维可解释的特征来丰富原有特征信息,从而提高模型效果。
具体地,在训练LightGBM模型的过程中,生成多棵树,每个树均包括多个叶子节点,将每个叶子节点作为一个交叉特征,以生成第一交叉特征信息。
优选地,将至少两颗树的所有叶子节点进行拼接,以生成包含不同交叉信息的第二交叉特征信息。
进一步地,随着树的棵数增加,生成相应维度的稀疏特征,例如形成一个高维稀疏的one-hot编码。
由此,得到建模特征信息,并能够充分利用用户的特征信息,构造更多的含交叉信息的高维特征来丰富特征维度。
需要说明的是,上述仅作为优选的示例进行说明,不能理解成对本发明的限制。
接下来,在步骤S103中,根据特征筛选规则,从所述建模特征信息中筛选建模特征数据,该建模特征数据包括含有交叉特征数据的高维稀疏特征数据。
如图2所示,还包括设定特征筛选规则的步骤S201。
在步骤S201中,设定特征筛选规则,以用于从所述建模特征信息中筛选建模特征数据。
具体地,所述特征筛选规则包括设定树的数量阈值、稀疏特征的维数阈值和相关度阈值。
优选地,根据所述树的数量阈值、所述稀疏特征的维数阈值,筛选特定维度的稀疏特征,所述稀疏特征包含叶子节点的交叉信息。
进一步地,根据相关度阈值,筛选第一交叉特征和第二交叉特征。
优选地,使用神经网络中的Embedding层对所筛选的交叉特征数据或者含有交叉特征数的高维稀疏特征进行降维处理,以生成低纬密集向量,并计算各交叉特征之间的相关度。
需要说明的是,使用Embedding层有两个优势:1)由于one-hot编码在神经网络训练中梯度不稳定且不易收敛,所以需要通过Embedding层将稀疏向量转化为低维密集向量;2)可以获取特征与特征之间的关联性,比如那些经常共同出现、意义相近的特征的Embedding向量会有较高的相似性。
具体地,根据所计算的相关度和所述相关度阈值,进一步进行筛选建模特征数据。
接下来,在步骤S104中,对所筛选的特征数据进行加权组合处理。
在本示例中,使用神经网络中的注意力(Attention)机制加强原始特征与这些高维稀疏特征之间的交互,以从大量信息中快速筛选出高价值信息(即含有交叉特征信息的高维稀疏特征数据)。
需要说明的是,Attention机制可以通过给不同特征赋予不同的“关注”权重达到增强模型效果的作用,从而提升模型效果。
具体地,对所筛选的特征数据进行加权组合处理,所述加权组合处理包括为特征数据给定权重系数、将不同特征数据进行组合等处理。
如图3所示,还包括计算每一个特征的权重参数的步骤S301。
在步骤S301中,计算每一个特征的权重参数。具体地,利用注意力机制,计算每个特征的权重参数,计算公式如下:
Figure BDA0002746466420000091
其中,Wrij为权重参数;Xr为原始特征;Xi为交叉特征或特定维度的稀疏特征;h为深度;b为偏置参数。
由此,通过上述公式进行计算,以得到每个特征的权重参数。
接下来,在步骤S105中,将加权组合处理后的特征数据增加到初始训练数据集,得到新训练数据集,使用该新训练数据集训练评估模型,评估用户的金融风险。
在本示例中,根据所计算的权重参数,将原始特征与交叉特征或特定维度的稀疏特征进行拼接组合,生成衍生特征,以用于建立新训练数据集。
具体地,所述原始特征为用户特征数据、交易数据和动支数据。
在另一示例中,通过CNN算法获取局部特征信息,在使用MLPs算法对所获取的局部特征信息进行拼接组合,以生成组合特征。
优选地,根据所确定的各特征的权重参数,进行重采样,以重新建立初始训练数据集。
在本示例中,采用LightGBM模型,构建金融风险预测模型,使用所述新训练数据集训练所述金融风险预测模型,以计算目标用户的风险评估值。
具体地,所述风险评估值包括违约概率和/或逾期概率。
优选地,获取用户资源请求的申请数据,使用特定时间段内的用户申请数据、交易数据、动支数据,建立测试数据集,所述特定时间段包括一个月、两个月或三个月。
进一步地,使用所述测试数据,对所述金融风险预测模型进行模型精度优化,以得到优化后的金融风险预测模型。
为了验证本发明的效果,获取某金融服务产品的资源申请(贷前)数据,以进行测试,例如选取在2019年10月至2020年1月的时间段内当月申请且当月交易的用户数据作为建模样本数据,并构建测试数据集。
具体地,在训练LightGBM模型过程中,选定最优参数包括最大深度度、最小权重系数等参数,将所有树的叶子节点编码后共有642维特征,然后,经过有100个神经元节点的Embedding层形成100维特征向量,再经过Attention层最终形成200维向量,最终加入原始特征以用于建模。
为了对比效果,使用具有Embedding层和Attention层的本发明方法、仅具有Embedding层的方法、仅具有Attention层的方法、没有Embedding层和Attention层的方法,筛选建模特征,并将所筛选的建模特征加入到原始特征,以构建训练数据集,并使用同一组试验数据进行验证。
结果表明,与其他方法相比,本发明的方法所计算的AUC值和KS值均有显著的提升。
由此,本发明能够更准确地综合评估用户资质,更精确地预测用户风险情况,还提高了模型效果,优化了评估方法。
需要说明的是,上述仅为优选的示例,不能理解成对本发明的限制。
本领域技术人员可以理解,实现上述实施例的全部或部分步骤被实现为由计算机数据处理设备执行的程序(计算机程序)。在该计算机程序被执行时,可以实现本发明提供的上述方法。而且,所述的计算机程序可以存储于计算机可读存储介质中,该存储介质可以是磁盘、光盘、ROM、RAM等可读存储介质,也可以是多个存储介质组成的存储阵列,例如磁盘或磁带存储阵列。所述的存储介质不限于集中式存储,其也可以是分布式存储,例如基于云计算的云存储。
与现有技术相比,本发明的基于特征构造的金融风险评估方法利用LightGBM模型构造一些高维可解释的特征来丰富原有特征信息,并利用神经网络中的Embedding层来将这些高维稀疏特征转化为低维密集向量,再配合使用注意力机制加强原始特征与这些高维稀疏特征之间的交互,以从大量信息中快速筛选出高价值信息(即含有交叉特征信息的高维稀疏特征数据)。由此,能够更准确地综合评估用户资质,更精确地预测用户风险情况,还提高了模型效果,优化了评估方法。
实施例2
下面描述本发明的装置实施例,该装置可以用于执行本发明的方法实施例。对于本发明装置实施例中描述的细节,应视为对于上述方法实施例的补充;对于在本发明装置实施例中未披露的细节,可以参照上述方法实施例来实现。
参照图4、图5和图6,本发明还提供了一种基于特征构造的金融风险评估装置400,该金融风险评估装置400包括:数据获取模块401,用于获取历史样本数据集,建立初始训练数据集,所述历史样本数据集包括历史用户的用户属性数据和用户行为数据;第一处理模块402,用于采用LightGBM模型,使用所述初始训练数据集进行训练,以得到建模特征信息;筛选模块403,根据特征筛选规则,从所述建模特征信息中筛选建模特征数据,该建模特征数据包括含有交叉特征数据的高维稀疏特征数据;第二处理模块404,用于对所筛选的特征数据进行加权组合处理;建立模块405,用于将加权组合处理后的特征数据增加到初始训练数据集,得到新训练数据集,使用该新训练数据集训练评估模型,评估用户的金融风险。
优选地,还包括:在训练LightGBM模型的过程中,生成多棵树,每个树均包括多个叶子节点,将每个叶子节点作为一个交叉特征,以生成第一交叉特征信息;将至少两颗树的所有叶子节点进行拼接,以生成包含不同交叉信息的第二交叉特征信息;随着树的棵数增加,生成相应维度的稀疏特征。
如图5所示,还包括设定模块501,所述设定模块501用于设定特征筛选规则,所述特征筛选规则包括设定树的数量阈值、稀疏特征的维数阈值和相关度阈值。
具体地,根据所述树的数量阈值、所述稀疏特征的维数阈值,筛选特定维度的稀疏特征,所述稀疏特征包含叶子节点的交叉信息;根据相关度阈值,筛选第一交叉特征和第二交叉特征。
如图6所示,还包括计算模块601,所述计算模块601利用注意力机制,计算每个特征的权重参数,计算公式如下:
Figure BDA0002746466420000121
其中,Wrij为权重参数;Xr为原始特征;Xi为交叉特征或特定维度的稀疏特征;h为深度;b为偏置参数。
优选地,还包括:根据所计算的权重参数,将原始特征与交叉特征或特定维度的稀疏特征进行拼接组合,生成衍生特征,以用于建立新训练数据集;所述原始特征为用户特征数据、交易数据和动支数据。
优选地,还包括:通过CNN算法获取局部特征信息,在使用MLPs算法对所获取的局部特征信息进行拼接组合,以生成组合特征。
优选地,还包括:使用Embedding层对所筛选的交叉特征数据进行降维处理,以生成低纬密集向量,并计算各交叉特征之间的相关度;根据所计算的相关度和所述相关度阈值,进一步进行筛选建模特征数据。
优选地,还包括:根据所确定的各特征的权重参数,进行重采样,以重新建立初始训练数据集。
优选地,所述建立模块405还包括:采用LightGBM模型,构建金融风险预测模型,使用所述新训练数据集训练所述金融风险预测模型,以计算目标用户的风险评估值;所述风险评估值包括违约概率和/或逾期概率。
优选地,所述数据获取模块401还包括:获取用户资源请求的申请数据,使用特定时间段内的用户申请数据、交易数据、动支数据,建立测试数据集,所述特定时间段包括一个月、两个月或三个月;使用所述测试数据,对所述金融风险预测模型进行模型精度优化,以得到优化后的金融风险预测模型。
需要说明的是,在实施例2中,省略了与实施例1相同的部分的说明。
本领域技术人员可以理解,上述装置实施例中的各模块可以按照描述分布于装置中,也可以进行相应变化,分布于不同于上述实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
与现有技术相比,本发明的基于特征构造的金融风险评估装置利用LightGBM模型构造一些高维可解释的特征来丰富原有特征信息,并利用神经网络中的Embedding层来将这些高维稀疏特征转化为低维密集向量,再配合使用注意力机制加强原始特征与这些高维稀疏特征之间的交互,以从大量信息中快速筛选出高价值信息(即含有交叉特征信息的高维稀疏特征数据)。由此,能够更准确地综合评估用户资质,更精确地预测用户风险情况,还提高了模型效果。
实施例3
下面描述本发明的电子设备实施例,该电子设备可以视为对于上述本发明的方法和装置实施例的具体实体实施方式。对于本发明电子设备实施例中描述的细节,应视为对于上述方法或装置实施例的补充;对于在本发明电子设备实施例中未披露的细节,可以参照上述方法或装置实施例来实现。
图7是根据本发明的一种电子设备的示例性实施例的结构框图。下面参照图7来描述根据本发明该实施例的的电子设备200。图7显示的电子设备200仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图7所示,电子设备200以通用计算设备的形式表现。电子设备200的组件可以包括但不限于:至少一个处理单元210、至少一个存储单元220、连接不同系统组件(包括存储单元220和处理单元210)的总线230、显示单元240等。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元210执行,使得所述处理单元210执行本说明书上述电子设备的处理方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元210可以执行如图1所示的步骤。
所述存储单元220可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)2201和/或高速缓存存储单元2202,还可以进一步包括只读存储单元(ROM)2203。
所述存储单元220还可以包括具有一组(至少一个)程序模块2205的程序/实用工具2204,这样的程序模块2205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线230可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备200也可以与一个或多个外部设备300(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备200交互的设备通信,和/或与使得该电子设备200能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口250进行。并且,电子设备200还可以通过网络适配器260与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器260可以通过总线230与电子设备200的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备200使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,本发明描述的示例性实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个计算机可读的存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、或者网络设备等)执行根据本发明的上述方法。当所述计算机程序被一个数据处理设备执行时,使得该计算机可读介质能够实现本发明的上述方法。
如图8所示,所述计算机程序可以存储于一个或多个计算机可读介质上。计算机可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
综上所述,本发明可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)等通用数据处理设备来实现根据本发明实施例中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,应理解的是,本发明不与任何特定计算机、虚拟装置或者电子设备固有相关,各种通用装置也可以实现本发明。以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于特征构造的金融风险评估方法,其特征在于,包括:
获取历史样本数据集,建立初始训练数据集,所述历史样本数据集包括历史用户的用户属性数据和用户行为数据;
采用LightGBM模型,使用所述初始训练数据集进行训练,以得到建模特征信息;
根据特征筛选规则,从所述建模特征信息中筛选建模特征数据,该建模特征数据包括含有交叉特征数据的高维稀疏特征数据;
对所筛选的特征数据进行加权组合处理;
将加权组合处理后的特征数据增加到初始训练数据集,得到新训练数据集,使用该新训练数据集训练评估模型,评估用户的金融风险。
2.根据权利要求1所述的金融风险评估方法,其特征在于,所述得到建模特征信息包括:
在训练LightGBM模型的过程中,生成多棵树,每个树均包括多个叶子节点,将每个叶子节点作为一个交叉特征,以生成第一交叉特征信息;
将至少两颗树的所有叶子节点进行拼接,以生成包含不同交叉信息的第二交叉特征信息;
随着树的棵数增加,生成相应维度的稀疏特征。
3.根据权利要求1-2中任一所述的金融风险评估方法,其特征在于,还包括:
设定特征筛选规则,所述特征筛选规则包括设定树的数量阈值、稀疏特征的维数阈值和相关度阈值;
根据所述树的数量阈值、所述稀疏特征的维数阈值,筛选特定维度的稀疏特征,所述稀疏特征包含叶子节点的交叉信息;
根据相关度阈值,筛选第一交叉特征和第二交叉特征。
4.根据权利要求1-3中任一所述的金融风险评估方法,其特征在于,对所筛选的特征数据进行加权组合处理包括:
利用注意力机制,计算每个特征的权重参数,计算公式如下:
Figure FDA0002746466410000021
其中,Wrij为权重参数;Xr为原始特征;Xi为交叉特征或特定维度的稀疏特征;h为深度;b为偏置参数。
5.根据权利要求1-4中任一所述的金融风险评估方法,其特征在于,还包括:
根据所计算的权重参数,将原始特征与交叉特征或特定维度的稀疏特征进行拼接组合,生成衍生特征,以用于建立新训练数据集;
所述原始特征为用户特征数据、交易数据和动支数据。
6.根据权利要求1-5中任一所述的金融风险评估方法,其特征在于,还包括:
通过CNN算法获取局部特征信息,在使用MLPs算法对所获取的局部特征信息进行拼接组合,以生成组合特征。
7.根据权利要求1-6中任一所述的金融风险评估方法,其特征在于,还包括:
使用Embedding层对所筛选的交叉特征数据进行降维处理,以生成低纬密集向量,并计算各交叉特征之间的相关度;
根据所计算的相关度和所述相关度阈值,进一步进行筛选建模特征数据。
8.一种基于特征构造的金融风险评估装置,其特征在于,包括:
数据获取模块,用于获取历史样本数据集,建立初始训练数据集,所述历史样本数据集包括历史用户的用户属性数据和用户行为数据;
第一处理模块,用于采用LightGBM模型,使用所述初始训练数据集进行训练,以得到建模特征信息;
筛选模块,根据特征筛选规则,从所述建模特征信息中筛选建模特征数据,该建模特征数据包括含有交叉特征数据的高维稀疏特征数据;
第二处理模块,用于对所筛选的特征数据进行加权组合处理;
建立模块,用于将加权组合处理后的特征数据增加到初始训练数据集,得到新训练数据集,使用该新训练数据集训练评估模型,评估用户的金融风险。
9.一种电子设备,其中,该电子设备包括:
处理器;以及,
存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行根据权利要求1-7中任一项所述的基于特征构造的金融风险评估方法。
10.一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现权利要求1-7中任一项所述的基于特征构造的金融风险评估方法。
CN202011168300.2A 2020-10-27 2020-10-27 基于特征构造的金融风险评估方法、装置和电子设备 Pending CN112270547A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011168300.2A CN112270547A (zh) 2020-10-27 2020-10-27 基于特征构造的金融风险评估方法、装置和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011168300.2A CN112270547A (zh) 2020-10-27 2020-10-27 基于特征构造的金融风险评估方法、装置和电子设备

Publications (1)

Publication Number Publication Date
CN112270547A true CN112270547A (zh) 2021-01-26

Family

ID=74344305

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011168300.2A Pending CN112270547A (zh) 2020-10-27 2020-10-27 基于特征构造的金融风险评估方法、装置和电子设备

Country Status (1)

Country Link
CN (1) CN112270547A (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112465657A (zh) * 2021-02-02 2021-03-09 北京淇瑀信息科技有限公司 一种基于树模型特征衍生的风险评估方法、装置和电子设备
CN112508723A (zh) * 2021-02-05 2021-03-16 北京淇瑀信息科技有限公司 基于自动择优建模的金融风险预测方法、装置和电子设备
CN112950383A (zh) * 2021-04-15 2021-06-11 平安直通咨询有限公司上海分公司 基于人工智能的金融风险监控方法及相关设备
CN112991077A (zh) * 2021-02-18 2021-06-18 深圳无域科技技术有限公司 金融风险控制系统及方法
CN113159101A (zh) * 2021-02-23 2021-07-23 北京三快在线科技有限公司 模型获取方法、用户处理方法、装置及电子设备
CN113177700A (zh) * 2021-04-15 2021-07-27 国任财产保险股份有限公司 一种风险评估方法、系统、电子设备及存储介质
CN113507419A (zh) * 2021-07-07 2021-10-15 工银科技有限公司 流量分发模型的训练方法、流量分发方法及装置
CN113537297A (zh) * 2021-06-22 2021-10-22 同盾科技有限公司 一种行为数据预测方法及装置
CN113610324A (zh) * 2021-08-27 2021-11-05 中国银行股份有限公司 一种基于LightGBM的开户审核方法及相关设备
CN113743735A (zh) * 2021-08-10 2021-12-03 南京星云数字技术有限公司 风险评分的生成方法及装置
CN114757581A (zh) * 2022-05-18 2022-07-15 华南理工大学 一种金融交易风险评估方法、装置、电子设备及计算机可读介质
CN115438101A (zh) * 2022-10-13 2022-12-06 中国兵器工业计算机应用技术研究所 一种基于特征形态和数据关系的数据特征构建系统和方法
CN115641201A (zh) * 2022-09-27 2023-01-24 厦门国际银行股份有限公司 数据异常检测方法、系统、终端设备及存储介质
CN116258579A (zh) * 2023-04-28 2023-06-13 成都新希望金融信息有限公司 用户信用评分模型的训练方法及用户信用评分方法
CN117972379A (zh) * 2023-12-11 2024-05-03 南通先进通信技术研究院有限公司 基于机器学习的微波天线波束调控方法及系统

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101493913A (zh) * 2008-01-23 2009-07-29 阿里巴巴集团控股有限公司 一种评估网上用户信用的方法及系统
CN107301577A (zh) * 2016-04-15 2017-10-27 阿里巴巴集团控股有限公司 信用评估模型的训练方法、信用评估方法以及装置
US20190197429A1 (en) * 2016-12-12 2019-06-27 Tencent Technology (Shenzhen) Company Limited Method and apparatus for training classification model, and method and apparatus for classifying data
CN110348721A (zh) * 2019-06-29 2019-10-18 北京淇瑀信息科技有限公司 基于gbst的金融违约风险预测方法、装置和电子设备
CN111192131A (zh) * 2019-12-12 2020-05-22 上海淇玥信息技术有限公司 金融风险预测方法、装置和电子设备
CN111199469A (zh) * 2019-12-12 2020-05-26 北京淇瑀信息科技有限公司 用户还款模型生成方法、装置及电子设备
CN111310462A (zh) * 2020-02-07 2020-06-19 北京三快在线科技有限公司 用户属性的确定方法、装置、设备及存储介质
CN111311401A (zh) * 2020-03-30 2020-06-19 百维金科(上海)信息科技有限公司 一种基于LightGBM的金融违约概率预测模型
CN111583014A (zh) * 2020-04-09 2020-08-25 上海淇毓信息科技有限公司 一种基于gbst的金融风险管理方法、装置和电子设备
CN111652710A (zh) * 2020-06-03 2020-09-11 北京化工大学 一种基于集成树特征提取和Logistic回归的个人信用风险评估方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101493913A (zh) * 2008-01-23 2009-07-29 阿里巴巴集团控股有限公司 一种评估网上用户信用的方法及系统
CN107301577A (zh) * 2016-04-15 2017-10-27 阿里巴巴集团控股有限公司 信用评估模型的训练方法、信用评估方法以及装置
US20190197429A1 (en) * 2016-12-12 2019-06-27 Tencent Technology (Shenzhen) Company Limited Method and apparatus for training classification model, and method and apparatus for classifying data
CN110348721A (zh) * 2019-06-29 2019-10-18 北京淇瑀信息科技有限公司 基于gbst的金融违约风险预测方法、装置和电子设备
CN111192131A (zh) * 2019-12-12 2020-05-22 上海淇玥信息技术有限公司 金融风险预测方法、装置和电子设备
CN111199469A (zh) * 2019-12-12 2020-05-26 北京淇瑀信息科技有限公司 用户还款模型生成方法、装置及电子设备
CN111310462A (zh) * 2020-02-07 2020-06-19 北京三快在线科技有限公司 用户属性的确定方法、装置、设备及存储介质
CN111311401A (zh) * 2020-03-30 2020-06-19 百维金科(上海)信息科技有限公司 一种基于LightGBM的金融违约概率预测模型
CN111583014A (zh) * 2020-04-09 2020-08-25 上海淇毓信息科技有限公司 一种基于gbst的金融风险管理方法、装置和电子设备
CN111652710A (zh) * 2020-06-03 2020-09-11 北京化工大学 一种基于集成树特征提取和Logistic回归的个人信用风险评估方法

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112465657A (zh) * 2021-02-02 2021-03-09 北京淇瑀信息科技有限公司 一种基于树模型特征衍生的风险评估方法、装置和电子设备
CN112508723A (zh) * 2021-02-05 2021-03-16 北京淇瑀信息科技有限公司 基于自动择优建模的金融风险预测方法、装置和电子设备
CN112508723B (zh) * 2021-02-05 2024-02-02 北京淇瑀信息科技有限公司 基于自动择优建模的金融风险预测方法、装置和电子设备
CN112991077A (zh) * 2021-02-18 2021-06-18 深圳无域科技技术有限公司 金融风险控制系统及方法
CN112991077B (zh) * 2021-02-18 2024-03-19 深圳无域科技技术有限公司 金融风险控制系统及方法
CN113159101A (zh) * 2021-02-23 2021-07-23 北京三快在线科技有限公司 模型获取方法、用户处理方法、装置及电子设备
CN112950383B (zh) * 2021-04-15 2023-09-26 平安直通咨询有限公司上海分公司 基于人工智能的金融风险监控方法及相关设备
CN112950383A (zh) * 2021-04-15 2021-06-11 平安直通咨询有限公司上海分公司 基于人工智能的金融风险监控方法及相关设备
CN113177700A (zh) * 2021-04-15 2021-07-27 国任财产保险股份有限公司 一种风险评估方法、系统、电子设备及存储介质
CN113537297A (zh) * 2021-06-22 2021-10-22 同盾科技有限公司 一种行为数据预测方法及装置
CN113507419A (zh) * 2021-07-07 2021-10-15 工银科技有限公司 流量分发模型的训练方法、流量分发方法及装置
CN113743735A (zh) * 2021-08-10 2021-12-03 南京星云数字技术有限公司 风险评分的生成方法及装置
CN113610324A (zh) * 2021-08-27 2021-11-05 中国银行股份有限公司 一种基于LightGBM的开户审核方法及相关设备
CN114757581A (zh) * 2022-05-18 2022-07-15 华南理工大学 一种金融交易风险评估方法、装置、电子设备及计算机可读介质
CN115641201A (zh) * 2022-09-27 2023-01-24 厦门国际银行股份有限公司 数据异常检测方法、系统、终端设备及存储介质
CN115641201B (zh) * 2022-09-27 2023-11-07 厦门国际银行股份有限公司 数据异常检测方法、系统、终端设备及存储介质
CN115438101A (zh) * 2022-10-13 2022-12-06 中国兵器工业计算机应用技术研究所 一种基于特征形态和数据关系的数据特征构建系统和方法
CN116258579A (zh) * 2023-04-28 2023-06-13 成都新希望金融信息有限公司 用户信用评分模型的训练方法及用户信用评分方法
CN117972379A (zh) * 2023-12-11 2024-05-03 南通先进通信技术研究院有限公司 基于机器学习的微波天线波束调控方法及系统

Similar Documents

Publication Publication Date Title
CN112270547A (zh) 基于特征构造的金融风险评估方法、装置和电子设备
US10817779B2 (en) Bayesian network based hybrid machine learning
CN110390408B (zh) 交易对象预测方法和装置
US20210303970A1 (en) Processing data using multiple neural networks
CN112507628B (zh) 基于深度双向语言模型的风险预测方法、装置和电子设备
US11586919B2 (en) Task-oriented machine learning and a configurable tool thereof on a computing environment
CN112270546A (zh) 基于stacking算法的风险预测方法、装置和电子设备
CN112348660A (zh) 生成风险警示信息的方法、装置及电子设备
JP2022033695A (ja) モデルを生成するための方法、装置、電子機器、記憶媒体、及びコンピュータプログラム製品
CN113177700B (zh) 一种风险评估方法、系统、电子设备及存储介质
WO2021138271A1 (en) Creating predictor variables for prediction models from unstructured data using natural language processing
CN111179051A (zh) 金融目标客户确定方法、装置及电子设备
CN111199469A (zh) 用户还款模型生成方法、装置及电子设备
CN111221881B (zh) 用户特征数据合成方法、装置及电子设备
CN111210332A (zh) 贷后管理策略生成方法、装置及电子设备
CN114519376A (zh) 利用神经网络的数据分割
CN114330837A (zh) 对象处理方法、装置、计算机设备和存储介质
CN113610625A (zh) 逾期风险警示方法、装置及电子设备
CN112508692A (zh) 基于卷积神经网络的资源回收风险预测方法、装置和电子设备
CN112989182A (zh) 信息处理方法、装置、信息处理设备及存储介质
KR102519878B1 (ko) 금융기관 신용공여 사업에서의 인공지능 기반 리스크 관리 솔루션을 제공하기 위한 장치, 방법 및 명령을 기록한 기록 매체
CN114742645B (zh) 基于多阶段时序多任务的用户安全等级识别方法及装置
CN113568739B (zh) 用户资源额度分配方法、装置及电子设备
US11809375B2 (en) Multi-dimensional data labeling
CN113570207B (zh) 用户策略分配方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 201500 room a3-5588, 58 Fumin Branch Road, Hengsha Township, Chongming District, Shanghai (Shanghai Hengtai Economic Development Zone)

Applicant after: Qifu Shuke (Shanghai) Technology Co.,Ltd.

Address before: 201500 room a3-5588, 58 Fumin Branch Road, Hengsha Township, Chongming District, Shanghai (Shanghai Hengtai Economic Development Zone)

Applicant before: Shanghai Qifu Information Technology Co.,Ltd.

CB02 Change of applicant information
CB02 Change of applicant information

Country or region after: Zhong Guo

Address after: 200062 room 1027, floor 10, No. 89, Yunling East Road, Putuo District, Shanghai

Applicant after: Qifu Shuke (Shanghai) Technology Co.,Ltd.

Address before: 201500 room a3-5588, 58 Fumin Branch Road, Hengsha Township, Chongming District, Shanghai (Shanghai Hengtai Economic Development Zone)

Applicant before: Qifu Shuke (Shanghai) Technology Co.,Ltd.

Country or region before: Zhong Guo