CN111815425A - 一种基于实体嵌入的用户信用风险等级判定方法及系统 - Google Patents

一种基于实体嵌入的用户信用风险等级判定方法及系统 Download PDF

Info

Publication number
CN111815425A
CN111815425A CN202010731651.3A CN202010731651A CN111815425A CN 111815425 A CN111815425 A CN 111815425A CN 202010731651 A CN202010731651 A CN 202010731651A CN 111815425 A CN111815425 A CN 111815425A
Authority
CN
China
Prior art keywords
user
data
discrete
credit risk
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010731651.3A
Other languages
English (en)
Inventor
殷钱安
梁淑云
刘胜
马影
陶景龙
王启凡
魏国富
徐�明
余贤喆
周晓勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Information and Data Security Solutions Co Ltd
Original Assignee
Information and Data Security Solutions Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Information and Data Security Solutions Co Ltd filed Critical Information and Data Security Solutions Co Ltd
Priority to CN202010731651.3A priority Critical patent/CN111815425A/zh
Publication of CN111815425A publication Critical patent/CN111815425A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities

Abstract

本发明提供一种基于实体嵌入的用户信用风险等级判定方法,包括数据提取,对数据集中需要进行离散化的连续型变量进行分箱,形成对应的离散型变量特征;以每个用户为对象,利用神经网络对离散型特征进行向量训练,将离散特征向量化,构建成实体向量;然后以用户为对象,将每个离散型特征对应的实体向量、连续型变量进行拼接,得到用户维度的数据特征向量数据集data3;利用textCNN算法构建用户信用风险等级判定模型;用户信用风险等级预测,选取预测集用户ID,经实体嵌入后输入分类模型,从而对预测集用户的风险等级进行预测。

Description

一种基于实体嵌入的用户信用风险等级判定方法及系统
技术领域
本发明涉及计算机数据安全技术领域,具体来说是一种基于实体嵌入的用户信用风险等级判定方法及系统。
背景技术
伴随着市场经济的发展,信用风险仍是金融行业长期以来面临的主要风险之一。随着互联网技术及应用快速发展,互联网金融应运而生。大量的金融消费等行为方式从线下转到线上,在转移的过程中会出现不同的问题和挑战,比如风险,金融公司会面临各种各样的信用风险和欺诈风险。在互联网金融迅猛发展的背景下,风险控制问题已然成为行业焦点,基于大数据的风控模型正在成为互联网金融领域的热门战场。
如申请号为201910583894.4公开的一种面向客服在线质检的文本分类方法,该方法通过将语音在转换成文本,然后对文本数据进行标注,然后构建不同的分类模型,通过分类模型对文本数据进行分类,分类时充分考虑实体顺序,从而改善分类效果。但是,该方法针对非结构数据进行处理,不适用结构性数据。另外,信用评分方面,常用的数据出来方法为分箱,分箱后再通过独热编码处理,然而具有许多类别的独热编码变量会导致非常稀疏的向量,这在计算上是无效的,并且难以优化。虽然标签编码解决了这一问题,但只能用于基于树的模型。
基于上述问题,针对金融行业的结构性数据特性,及信用风险涉及到用户的基本信息,用户社会信息,用户行为能力等诸多业务特征,使得深度学习无法有效的在用户风险评分上进行应用。
发明内容
本发明所要解决的技术问题在于针对金融行业的信用风险评分判定,提供一种适合结构性数据分类的方法。
本发明通过以下技术手段实现解决上述技术问题的:
一种基于实体嵌入的用户信用风险等级判定方法,包括以下步骤:
S01.数据提取,获取所有用户数据,已标注风险等级的用户数据作为训练集数据,未标注风险等级的用户记录作为预测数据集,两部分数据集按行合并成数据集data1;
S02.数据特征处理,对数据集data1中需要进行离散化的连续型变量进行分箱,形成对应的离散型变量特征;以用户为对象将data1中原有离散型变量、未离散化的连续变量以及新构造的离散特征进行合并,得到数据集data2;
S03.特征向量化,根据数据集data2,以每个用户为对象,利用神经网络对离散型特征进行向量训练,将离散特征向量化,构建成实体向量;然后以用户为对象,将每个离散型特征对应的实体向量、连续型变量进行拼接,得到用户维度的数据特征向量数据集data3;
S04.构建用户信用风险等级判定模型,将数据集data3输入textCNN算法进行训练,得到用户信用风险等级判定的分类模型;
S05.用户信用风险等级预测,选取步骤S01中的预测集用户ID,采用步骤S03的方法得到对应的预测集数据特征向量集,然后将预测集数据特征向量集输入步骤S04获得的分类模型,从而对预测集用户的风险等级进行预测。
进一步的,所述步骤S02中,采用卡方分箱法对数据集data1中需要进行离散化的连续型变量进行分箱。
进一步的,所述步骤S03中,采用word2vec方法进行离散特征向量化处理。
本发明还提供一种基于实体嵌入的用户信用风险等级判定系统,包括:
数据提取模块,获取所有用户数据,已标注风险等级的用户数据作为训练集数据,未标注风险等级的用户记录作为预测数据集,两部分数据集按行合并成数据集data1;
数据特征处理模块,对数据集data1中需要进行离散化的连续型变量进行分箱,形成对应的离散型变量特征;以用户为对象将data1中原有离散型变量、未离散化的连续变量以及新构造的离散特征进行合并,得到数据集data2;
特征向量化模块,根据数据集data2,以每个用户为对象,利用神经网络对离散型特征进行向量训练,将离散特征向量化,构建成实体向量;然后以用户为对象,将每个离散型特征对应的实体向量、连续型变量进行拼接,得到用户维度的数据特征向量数据集data3;
构建用户信用风险等级判定模型模块,将数据集data3输入textCNN算法进行训练,得到用户信用风险等级判定的分类模型;
用户信用风险等级预测模块,选取数据提取模块中的预测集用户ID,采用特征向量化模块的方法得到对应的预测集数据特征向量集,然后将预测集数据特征向量集输入构建用户信用风险等级判定模型模块获得的分类模型,从而对预测集用户的风险等级进行预测。
进一步的,所述数据特征处理模块中,采用卡方分箱法对数据集data1中需要进行离散化的连续型变量进行分箱。
进一步的,所述特征向量化模块中,采用word2vec方法进行离散特征向量化处理。
本发明还提供一种存储介质,其中存储多条指令,所述指令适用于处理器加载并执行,所述多条指令为:
数据提取,获取所有用户数据,已标注风险等级的用户数据作为训练集数据,未标注风险等级的用户记录作为预测数据集,两部分数据集按行合并成数据集data1;
数据特征处理,对数据集data1中需要进行离散化的连续型变量进行分箱,形成对应的离散型变量特征;以用户为对象将data1中原有离散型变量、未离散化的连续变量以及新构造的离散特征进行合并,得到数据集data2;
特征向量化,根据数据集data2,以每个用户为对象,利用神经网络对离散型特征进行向量训练,将离散特征向量化,构建成实体向量;然后以用户为对象,将每个离散型特征对应的实体向量、连续型变量进行拼接,得到用户维度的数据特征向量数据集data3;
构建用户信用风险等级判定模型模块,将数据集data3输入textCNN算法进行训练,得到用户信用风险等级判定的分类模型;
用户信用风险等级预测,选取数据提取模块中的预测集用户ID,采用特征向量化模块的方法得到对应的预测集数据特征向量集,然后将预测集数据特征向量集输入构建用户信用风险等级判定模型模块获得的分类模型,从而对预测集用户的风险等级进行预测。
本发明的优点在于:
本实施例实体嵌入后利用神经网络进行训练的同时,也要训练分配给每个类别的向量。因此,在训练过程结束时,我们最终会得到一个代表每个类别的向量。而且训练得到的实体嵌入可以进行可视化,可以有效地为每个类别提供可视化,解决深度学习无法输出特征重要性问题。
训练好的实体嵌入可以保存,既可以用于非深度学习模型,也可以用于深度学习模型。信用风险涉及到用户基本信息、用户社会信息、用户行为能力等诸多业务特征,使得深度学习无法有效地在用户信用风险评分上进行应用,有效地解决了深度学习模型在复杂实际场景上的应用。
附图说明
图1为本发明实施例中基于实体嵌入的用户信用风险等级判定方法的处理过程流程图;
图2为本发明实施例中基于实体嵌入的用户信用风险等级判定方法的流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1、图2所示,一种基于实体嵌入的用户信用风险等级判定方法,包括以下步骤:
步骤1.数据提取,获取所有用户数据,包括用户信息、用户行为等属性,已标注风险等级的用户数据作为训练集数据,未标注风险等级的用户记录作为预测数据集,两部分数据集按行合并成数据集data1;
步骤2.数据特征处理,对数据集data1中需要进行离散化的连续型变量进行分箱,形成对应的离散型变量特征;以用户为对象将data1中原有离散型变量、未离散化的连续变量以及新构造的离散特征进行合并,得到数据集data2;
本实施例中,根据各变量业务特征,对特征变量进行划分,筛选出连续型变量、离散型变量两大类;然后根据数据集每个变量的业务内容和特征值分布,从连续型变量中筛选出需离散化的特征变量。
本实施了利用卡方分箱法对需离散化的连续型变量进行分箱,例如用户1,用户2,……,用户10的年龄特征字段对应的数组(18,25,32,40,55,52,47,36,22,60),若以10为组距进行分箱,则可得到(1,2,3,4,5,5,4,3,2,6)分类数组,并与相应的特征名进行组合得到对应分类标识(age1,age2,age3,age4,age5,age5,age4,age3,age2,age6)。
卡方分箱法是一种有监督的特征分箱方法。卡方分箱是典型的基于合并机制的自底向上离散化方法。其基于如下假设:如果两个相邻的区间具有非常类似的类分布,则这两个区间可以合并;否则,它们应当保持分开。此处衡量分布相似性的指标就是卡方值。卡方值越低,类分布的相似度越高。
步骤3.特征向量化,根据数据集data2,以每个用户为对象,利用神经网络对离散型特征进行向量训练,将离散特征向量化,构建成实体向量;然后以用户为对象,将每个离散型特征对应的实体向量、连续型变量进行拼接,得到用户维度的数据特征向量数据集data3;本实施例采用word2vec方法,进行离散特征向量化处理;
步骤4.构建用户信用风险等级判定模型,将数据集data3输入textCNN算法进行训练,得到用户信用风险等级判定的分类模型;
步骤5.用户信用风险等级预测,选取步骤1中的预测集用户ID,采用步骤3的方法得到对应的预测集数据特征向量集,然后将预测集数据特征向量集输入步骤4获得的分类模型,从而对预测集用户的风险等级进行预测。
本实施例实体嵌入后利用神经网络进行训练的同时,也要训练分配给每个类别的向量。因此,在训练过程结束时,我们最终会得到一个代表每个类别的向量。而且训练得到的实体嵌入可以进行可视化,可以有效地为每个类别提供可视化,解决深度学习无法输出特征重要性问题。
训练好的实体嵌入可以保存,既可以用于非深度学习模型,也可以用于深度学习模型。信用风险涉及到用户基本信息、用户社会信息、用户行为能力等诸多业务特征,使得深度学习无法有效地在用户信用风险评分上进行应用,有效地解决了深度学习模型在复杂实际场景上的应用。
本实施例还提供一种基于实体嵌入的用户信用风险等级判定系统,包括
数据提取模块,获取所有用户数据,包括用户信息、用户行为等属性,已标注风险等级的用户数据作为训练集数据,未标注风险等级的用户记录作为预测数据集,两部分数据集按行合并成数据集data1;
数据特征处理模块,对数据集data1中需要进行离散化的连续型变量进行分箱,形成对应的离散型变量特征;以用户为对象将data1中原有离散型变量、未离散化的连续变量以及新构造的离散特征进行合并,得到数据集data2;
本实施例中,根据各变量业务特征,对特征变量进行划分,筛选出连续型变量、离散型变量两大类;然后根据数据集每个变量的业务内容和特征值分布,从连续型变量中筛选出需离散化的特征变量。
本实施了利用卡方分箱法对需离散化的连续型变量进行分箱,例如用户1,用户2,……,用户10的年龄特征字段对应的数组(18,25,32,40,55,52,47,36,22,60),若以10为组距进行分箱,则可得到(1,2,3,4,5,5,4,3,2,6)分类数组,并与相应的特征名进行组合得到对应分类标识(age1,age2,age3,age4,age5,age5,age4,age3,age2,age6)。
卡方分箱法是一种有监督的特征分箱方法。方分箱是典型的基于合并机制的自底向上离散化方法。其基于如下假设:如果两个相邻的区间具有非常类似的类分布,则这两个区间可以合并;否则,它们应当保持分开。此处衡量分布相似性的指标就是卡方值。卡方值越低,类分布的相似度越高。
特征向量化模块,根据数据集data2,以每个用户为对象,利用神经网络对离散型特征进行向量训练,将离散特征向量化,构建成实体向量;然后以用户为对象,将每个离散型特征对应的实体向量、连续型变量进行拼接,得到用户维度的数据特征向量数据集data3;本实施例采用word2vec方法,进行离散特征向量化处理;
构建用户信用风险等级判定模型模块,将数据集data3输入textCNN算法进行训练,得到用户信用风险等级判定的分类模型;
用户信用风险等级预测模块,选取步骤1中的预测集用户ID,采用步骤3的方法得到对应的预测集数据特征向量集,然后将预测集数据特征向量集输入步骤4获得的分类模型,从而对预测集用户的风险等级进行预测。
本实施例还提供一种存储介质,其中存储多条指令,指令适用于处理器加载并执行,所述多条指令为:
数据提取,获取所有用户数据,已标注风险等级的用户数据作为训练集数据,未标注风险等级的用户记录作为预测数据集,两部分数据集按行合并成数据集data1;
数据特征处理,对数据集data1中需要进行离散化的连续型变量进行分箱,形成对应的离散型变量特征;以用户为对象将data1中原有离散型变量、未离散化的连续变量以及新构造的离散特征进行合并,得到数据集data2;
特征向量化,根据数据集data2,以每个用户为对象,利用神经网络对离散型特征进行向量训练,将离散特征向量化,构建成实体向量;然后以用户为对象,将每个离散型特征对应的实体向量、连续型变量进行拼接,得到用户维度的数据特征向量数据集data3;
构建用户信用风险等级判定模型模块,将数据集data3输入textCNN算法进行训练,得到用户信用风险等级判定的分类模型;
用户信用风险等级预测,选取数据提取模块中的预测集用户ID,采用特征向量化模块的方法得到对应的预测集数据特征向量集,然后将预测集数据特征向量集输入构建用户信用风险等级判定模型模块获得的分类模型,从而对预测集用户的风险等级进行预测。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (7)

1.一种基于实体嵌入的用户信用风险等级判定方法,其特征在于:包括以下步骤:
S01.数据提取,获取所有用户数据,已标注风险等级的用户数据作为训练集数据,未标注风险等级的用户记录作为预测数据集,两部分数据集按行合并成数据集data1;
S02.数据特征处理,对数据集data1中需要进行离散化的连续型变量进行分箱,形成对应的离散型变量特征;以用户为对象将data1中原有离散型变量、未离散化的连续变量以及新构造的离散特征进行合并,得到数据集data2;
S03.特征向量化,根据数据集data2,以每个用户为对象,利用神经网络对离散型特征进行向量训练,将离散特征向量化,构建成实体向量;然后以用户为对象,将每个离散型特征对应的实体向量、连续型变量进行拼接,得到用户维度的数据特征向量数据集data3;
S04.构建用户信用风险等级判定模型,将数据集data3输入textCNN算法进行训练,得到用户信用风险等级判定的分类模型;
S05.用户信用风险等级预测,选取步骤S01中的预测集用户ID,采用步骤S03的方法得到对应的预测集数据特征向量集,然后将预测集数据特征向量集输入步骤S04获得的分类模型,从而对预测集用户的风险等级进行预测。
2.根据权利要求1所述的一种基于实体嵌入的用户信用风险等级判定方法,其特征在于:所述步骤S02中,采用卡方分箱法对数据集data1中需要进行离散化的连续型变量进行分箱。
3.根据权利要求1所述的一种基于实体嵌入的用户信用风险等级判定方法,其特征在于:所述步骤S03中,采用word2vec方法进行离散特征向量化处理。
4.一种基于实体嵌入的用户信用风险等级判定系统,其特征在于:包括:
数据提取模块,获取所有用户数据,已标注风险等级的用户数据作为训练集数据,未标注风险等级的用户记录作为预测数据集,两部分数据集按行合并成数据集data1;
数据特征处理模块,对数据集data1中需要进行离散化的连续型变量进行分箱,形成对应的离散型变量特征;以用户为对象将data1中原有离散型变量、未离散化的连续变量以及新构造的离散特征进行合并,得到数据集data2;
特征向量化模块,根据数据集data2,以每个用户为对象,利用神经网络对离散型特征进行向量训练,将离散特征向量化,构建成实体向量;然后以用户为对象,将每个离散型特征对应的实体向量、连续型变量进行拼接,得到用户维度的数据特征向量数据集data3;
构建用户信用风险等级判定模型模块,将数据集data3输入textCNN算法进行训练,得到用户信用风险等级判定的分类模型;
用户信用风险等级预测模块,选取数据提取模块中的预测集用户ID,采用特征向量化模块的方法得到对应的预测集数据特征向量集,然后将预测集数据特征向量集输入构建用户信用风险等级判定模型模块获得的分类模型,从而对预测集用户的风险等级进行预测。
5.根据权利要求4所述的一种基于实体嵌入的用户信用风险等级判定系统,其特征在于:所述数据特征处理模块中,采用卡方分箱法对数据集data1中需要进行离散化的连续型变量进行分箱。
6.根据权利要求4所述的一种基于实体嵌入的用户信用风险等级判定方法,其特征在于:所述特征向量化模块中,采用word2vec方法进行离散特征向量化处理。
7.一种存储介质,其中存储多条指令,所述指令适用于处理器加载并执行,其特征在于:所述多条指令为:
数据提取,获取所有用户数据,已标注风险等级的用户数据作为训练集数据,未标注风险等级的用户记录作为预测数据集,两部分数据集按行合并成数据集data1;
数据特征处理,对数据集data1中需要进行离散化的连续型变量进行分箱,形成对应的离散型变量特征;以用户为对象将data1中原有离散型变量、未离散化的连续变量以及新构造的离散特征进行合并,得到数据集data2;
特征向量化,根据数据集data2,以每个用户为对象,利用神经网络对离散型特征进行向量训练,将离散特征向量化,构建成实体向量;然后以用户为对象,将每个离散型特征对应的实体向量、连续型变量进行拼接,得到用户维度的数据特征向量数据集data3;
构建用户信用风险等级判定模型模块,将数据集data3输入textCNN算法进行训练,得到用户信用风险等级判定的分类模型;
用户信用风险等级预测,选取数据提取模块中的预测集用户ID,采用特征向量化模块的方法得到对应的预测集数据特征向量集,然后将预测集数据特征向量集输入构建用户信用风险等级判定模型模块获得的分类模型,从而对预测集用户的风险等级进行预测。
CN202010731651.3A 2020-07-27 2020-07-27 一种基于实体嵌入的用户信用风险等级判定方法及系统 Pending CN111815425A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010731651.3A CN111815425A (zh) 2020-07-27 2020-07-27 一种基于实体嵌入的用户信用风险等级判定方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010731651.3A CN111815425A (zh) 2020-07-27 2020-07-27 一种基于实体嵌入的用户信用风险等级判定方法及系统

Publications (1)

Publication Number Publication Date
CN111815425A true CN111815425A (zh) 2020-10-23

Family

ID=72861426

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010731651.3A Pending CN111815425A (zh) 2020-07-27 2020-07-27 一种基于实体嵌入的用户信用风险等级判定方法及系统

Country Status (1)

Country Link
CN (1) CN111815425A (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104237158A (zh) * 2014-09-04 2014-12-24 浙江科技学院 一种具有普适性的近红外光谱定性分析方法
AU2018102040A4 (en) * 2018-12-10 2019-01-17 Chen, Shixuan Mr The method of an efficient and accurate credit rating system through the gradient boost decision tree
CN109920501A (zh) * 2019-01-24 2019-06-21 西安交通大学 基于卷积神经网络和主动学习的电子病历分类方法及系统
CN110472041A (zh) * 2019-07-01 2019-11-19 浙江工业大学 一种面向客服在线质检的文本分类方法
CN110751287A (zh) * 2018-07-23 2020-02-04 第四范式(北京)技术有限公司 神经网络模型的训练方法及系统以及预测方法及系统
CN111104552A (zh) * 2019-12-24 2020-05-05 浙江大学 一种基于电影结构化信息和简介预测电影评分类别的方法
WO2020088007A1 (zh) * 2018-10-30 2020-05-07 阿里巴巴集团控股有限公司 确定用户金融违约风险的方法及装置
CN111125530A (zh) * 2019-12-24 2020-05-08 中山大学 一种基于多类型特征深度学习的信息流推荐方法
CN111143840A (zh) * 2019-12-31 2020-05-12 上海观安信息技术股份有限公司 一种主机操作指令异常识别的方法及系统
CN111291932A (zh) * 2020-02-12 2020-06-16 徐佳慧 面向投融资关系网络链路预测的方法、装置和设备
CN111310462A (zh) * 2020-02-07 2020-06-19 北京三快在线科技有限公司 用户属性的确定方法、装置、设备及存储介质
CN111382930A (zh) * 2020-02-27 2020-07-07 西安交通大学 一种面向时序数据的风险预测方法及系统

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104237158A (zh) * 2014-09-04 2014-12-24 浙江科技学院 一种具有普适性的近红外光谱定性分析方法
CN110751287A (zh) * 2018-07-23 2020-02-04 第四范式(北京)技术有限公司 神经网络模型的训练方法及系统以及预测方法及系统
WO2020088007A1 (zh) * 2018-10-30 2020-05-07 阿里巴巴集团控股有限公司 确定用户金融违约风险的方法及装置
AU2018102040A4 (en) * 2018-12-10 2019-01-17 Chen, Shixuan Mr The method of an efficient and accurate credit rating system through the gradient boost decision tree
CN109920501A (zh) * 2019-01-24 2019-06-21 西安交通大学 基于卷积神经网络和主动学习的电子病历分类方法及系统
CN110472041A (zh) * 2019-07-01 2019-11-19 浙江工业大学 一种面向客服在线质检的文本分类方法
CN111104552A (zh) * 2019-12-24 2020-05-05 浙江大学 一种基于电影结构化信息和简介预测电影评分类别的方法
CN111125530A (zh) * 2019-12-24 2020-05-08 中山大学 一种基于多类型特征深度学习的信息流推荐方法
CN111143840A (zh) * 2019-12-31 2020-05-12 上海观安信息技术股份有限公司 一种主机操作指令异常识别的方法及系统
CN111310462A (zh) * 2020-02-07 2020-06-19 北京三快在线科技有限公司 用户属性的确定方法、装置、设备及存储介质
CN111291932A (zh) * 2020-02-12 2020-06-16 徐佳慧 面向投融资关系网络链路预测的方法、装置和设备
CN111382930A (zh) * 2020-02-27 2020-07-07 西安交通大学 一种面向时序数据的风险预测方法及系统

Non-Patent Citations (9)

* Cited by examiner, † Cited by third party
Title
PRABATH PERERA: "Decision Tree Approach for Predicting the Credit Risk of Leasing Customers in Sri Lanka", 《ICBIM 2019》 *
PRABATH PERERA: "Decision Tree Approach for Predicting the Credit Risk of Leasing Customers in Sri Lanka", 《ICBIM 2019》, 12 September 2019 (2019-09-12), pages 65 - 68, XP058447300, DOI: 10.1145/3361785.3361797 *
TE-CHENG HSU等: "ENHANCED RECURRENT NEURAL NETWORK FOR COMBINING STATIC AND", 《ICASSP 2019》, 17 April 2019 (2019-04-17), pages 1572 - 1576 *
彭路等: "基于深度神经网络的电力客户诉求预判", 《计算机与现代化》 *
彭路等: "基于深度神经网络的电力客户诉求预判", 《计算机与现代化》, no. 05, 15 May 2020 (2020-05-15), pages 22 - 28 *
李勇等: "《人工智能与机器人先进技术丛书 智能摘要与深度学习》", 北京理工大学出版社, pages: 101 - 104 *
蔡皎洁等: "基于数据挖掘银行客户信用风险评级体系研究", 《情报杂志》 *
蔡皎洁等: "基于数据挖掘银行客户信用风险评级体系研究", 《情报杂志》, no. 02, 18 February 2010 (2010-02-18), pages 47 - 50 *
陈珂等: "基于多通道卷积神经网络的中文微博情感分析", 《计算机研究与发展》, no. 05, pages 185 - 190 *

Similar Documents

Publication Publication Date Title
CN109255506B (zh) 一种基于大数据的互联网金融用户贷款逾期预测方法
CN112070138A (zh) 多标签混合分类模型的构建方法、新闻分类方法及系统
KR102168198B1 (ko) 기업 부도 예측 시스템 및 이의 동작 방법
CN111339260A (zh) 一种基于bert和qa思想的细粒度情感分析方法
CN115310425A (zh) 基于政策文本分类和关键信息识别的政策文本分析方法
CN111612519B (zh) 一种识别金融产品潜在客户的方法、装置及存储介质
CN112308148A (zh) 缺陷类别识别、孪生神经网络训练方法、装置及存储介质
CN111709225A (zh) 一种事件因果关系判别方法、装置和计算机可读存储介质
Haryono et al. Aspect-based sentiment analysis of financial headlines and microblogs using semantic similarity and bidirectional long short-term memory
CN112508684B (zh) 一种基于联合卷积神经网络的催收风险评级方法及系统
CN110704803A (zh) 目标对象的评估值计算方法及装置、存储介质、电子设备
CN116821759A (zh) 类别标签的识别预测方法、装置和处理器及电子设备
Hatua et al. Information diffusion on twitter: pattern recognition and prediction of volume, sentiment, and influence
CN110765872A (zh) 一种基于视觉特征的在线数学教育资源分类方法
CN111815425A (zh) 一种基于实体嵌入的用户信用风险等级判定方法及系统
CN115345248A (zh) 一种面向深度学习的数据去偏方法及装置
CN113052512A (zh) 风险预测方法、装置和电子设备
CN116304058B (zh) 企业负面信息的识别方法、装置、电子设备及存储介质
CN117009883B (zh) 对象分类模型构建方法、对象分类方法、装置和设备
Melendez Credit Risk analysis applying machine learning classification models
CN113704409B (zh) 一种基于级联森林的虚假招聘信息检测方法
Zontul Customer Credit Rating Estimation Using Machine Learning Methods
CN118036602A (zh) 一种虚假评论识别方法及装置
Luštrek Enhancing Loan Default Prediction with Text Mining
Agustina et al. Enhancing Sentiment Analysis Accuracy in Borobudur Temple Visitor Reviews through Semi-Supervised Learning and SMOTE Upsampling

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination