CN108711100A - 一种基于神经网络的p2p平台运营风险评估的系统 - Google Patents
一种基于神经网络的p2p平台运营风险评估的系统 Download PDFInfo
- Publication number
- CN108711100A CN108711100A CN201810484817.9A CN201810484817A CN108711100A CN 108711100 A CN108711100 A CN 108711100A CN 201810484817 A CN201810484817 A CN 201810484817A CN 108711100 A CN108711100 A CN 108711100A
- Authority
- CN
- China
- Prior art keywords
- data
- neural network
- feature
- model
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Development Economics (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Technology Law (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明涉及一种基于神经网络的P2P平台运营风险评估的系统,本发明通过对大量P2P平台数据进行分析归纳出备选特征表,然后将备选特征表内的特征分为数据数值特性和数据存在特性,通过对这两个特性与平台的风险指数进行相关性分析,从而选取出主要特征对模型进行训练,确保模型的准确率和提高工作效率,并且建立基于神经网络的风险评估模型,神经网络算法分类的效果好,可以分布处理,对噪声神经有较强的鲁棒性和容错能力,能充分逼近复杂的非线性关系,通过更新公式方法训练模型,使得模型更加精准。
Description
技术领域
本发明涉及一种风险评估的系统,具体涉及一种基于神经网络的P2P平台运营风险评估的系统。
背景技术
P2P是英文person-to-person的缩写,意即个人对个人,又称点对点网络借款,是一种将小额资金聚集起来借贷给有资金需求人群的一种民间小额借贷模式,属于互联网金融产品的一种,属于民间小额借贷,借助互联网、移动互联网技术的网络信贷平台及相关理财行为、金融服务。
目前国内的P2P网络借贷平台多达几千家,对P2P平台的分析不仅仅要针对借款人的信用风险的分析,而且要对平台本身的运营风险进行分析,需要通过一些数据判断某一个平台是好是坏,即是否存在跑路风险,然而不同的风险评估模型得到的结果与准确率是不同的。
发明内容
本发明其目的在于公开一种基于神经网络的P2P平台运营风险评估的系统,提供一种基于神经网络的风险评估模型建立方法,并且通过推算方法将风险评估模型训练得更加准确。
实现本发明所述基于神经网络的P2P平台运营风险评估的系统的技术方案是:
一种基于神经网络的P2P平台运营风险评估的系统,包括以下步骤:
1)第一次数据采集:获取多个P2P网络借贷平台的运营数据;
2)备选特征表建立:对第一次数据采集获得的运营数据进行筛选和提取,提取出特征和与特征相对应的数据,与特征相对应的数据定义为特征数据,依据特征数据的模式特征将特征分类建立备选特征表;
3)相关程度分析和特征选取:对特征采用皮尔森相关系数、斯皮尔曼相关系数、肯德尔相关系数和p值进行相关性分析,通过上述四种分析方法,每个特征均获得4个分析值,选取相关性分析绝对值0.4以上,同时P值0.005以下的特征,将这部分特征定义为主要特征;
4)模型训练集构建:取第一次数据采集中第一预设量的正常平台和第一预设量的逃跑平台的数据,提取出这些平台的主要特征数据作为训练集,将训练集整理成{(X(1),Y(1)),(X(2),Y(2))...(X(m),Y(m))},X(m)是主要特征数据的向量,Y(m)是平台的现有状态,逃跑为1,正常为0;
5)风险评估模型建立:神经网络是由多个神经元组合而成的,神经元的基本结构如下:其中xt是X的第t个输入,Wt是xt的权重,b是所有输入的偏置,而f()则是激活函数,激活函数采用sigmoid函数:取的神经网络模型的第一层为输入层,共t个神经元,第二层为隐含层,共k个神经元,最后一层为输出层,一共1个神经元;神经网络的代价函数采用二次代价函数,即欧式距离的和:其中y(x)是模型的输出值,而a(x)是真实值;模型的优化方法通过反向传播算法和梯度下降算法调整神经网络中参数的取值,反向传播算法给出了一个高效的方式在所有参数上使用梯度下降算法,从而使神经网络模型在训练数据上的损失函数尽可能小,梯度下降算法用于优化单个参数的取值;反向传播算法是训练神经网络的核心算法,它可以根据定义好的损失函数优化神经网络中参数的取值,从而使神经网络模型在训练数据集上的损失函数达到一个较小值,用θ表示神经网络中的参数,J(θ)表示在给定的参数取值下,训练数据集上损失函数的大小,那么整个优化过程可以抽象为寻找一个参数θ,使得J(θ)最小,得到最小J(θ)后,模型参数的更新公式为如下:采用梯度下降法,其中η为学习率,为参数的梯度,将第一层第j个神经元中产生的错误,即实际值与预测值之间的误差,定义为:首先,计算最后一层神经网络产生的错误:δL=▽aC⊙f'(zL),由后往前,计算每一层神经网络产生的错误:δl=((wl+1)Tδl+1)⊙f'(zl),推导公式如下:
对于权重W的梯度计算,有如下公式:推导公式如下:对于偏置的梯度计算,有如下公式:推导公式如下:随着θ的更新,C逐渐逼近最小值,停止更新,从而求出了模型的参数,从而确定最终模型。
6)二次数据采集:获取需要评估的P2P网络借贷平台的运营数据;
7)数据预处理:在二次数据采集获取的运营数据中提取出主要特征与主要特征数据;
8)风险输出:将数据预处理后的主要特征与主要特征数据放入到训练好后的风险预测模型中,获取风险值,将风险值输入到判断器中,从而输出风险程度。
进一步地,在第一次数据采集与第二次数据采集过程中,通过网络爬取或者P2P网络借贷平台提供方式获取P2P网络借贷平台的运营数据。
进一步地,所述模式特征包括数值型、文字型和判断型三种。
进一步地,第一预设量为100~150家,第二预设量为75~100家。
进一步地,第二预设量至少为第一预设量的一半。
本发明的有益效果为:本发明通过对大量P2P平台数据进行分析归纳出备选特征表,然后将备选特征表内的特征分为数据数值特性和数据存在特性,通过对这两个特性与平台的风险指数进行相关性分析,从而选取出主要特征对模型进行训练,确保模型的准确率和提高工作效率,并且建立基于神经网络的风险评估模型,神经网络算法分类的效果好,可以分布处理,对噪声神经有较强的鲁棒性和容错能力,能充分逼近复杂的非线性关系,通过更新公式方法训练模型,使得模型更加精准。
具体实施方式
下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例:一种基于神经网络的P2P平台运营风险评估的系统,包括以下步骤:
1)第一次数据采集:获取多个P2P网络借贷平台的运营数据;
2)备选特征表建立:对第一次数据采集获得的运营数据进行筛选和提取,提取出特征和与特征相对应的数据,与特征相对应的数据定义为特征数据,依据特征数据的模式特征将特征分类建立备选特征表;
3)相关程度分析和特征选取:对特征采用皮尔森相关系数、斯皮尔曼相关系数、肯德尔相关系数和p值进行相关性分析,通过上述四种分析方法,每个特征均获得4个分析值,选取相关性分析绝对值0.4以上,同时P值0.005以下的特征,将这部分特征定义为主要特征,p值的定义决定了相关性的准确性,根据定义,p=0.05时候样本中变量关联有5%的可能是由于偶然性造成的,p=0.005时候样本中变量关联有0.5%的可能是由于偶然性造成的,P值的选用决定了主要特征的多少,经过多次模拟,我们认为采用P=0.005时候最合理;
4)模型训练集构建:取第一次数据采集中第一预设量的正常平台和第一预设量的逃跑平台的数据,提取出这些平台的主要特征数据作为训练集,将训练集整理成{(X(1),Y(1)),(X(2),Y(2))...(X(m),Y(m))},X(m)是主要特征数据的向量,Y(m)是平台的现有状态,逃跑为1,正常为0;
5)风险评估模型建立:神经网络是由多个神经元组合而成的,神经元的基本结构如下:其中xt是X的第t个输入,Wt是xt的权重,b是所有输入的偏置,而f()则是激活函数,激活函数采用sigmoid函数:取的神经网络模型的第一层为输入层,共t个神经元,第二层为隐含层,共k个神经元,最后一层为输出层,一共1个神经元;神经网络的代价函数采用二次代价函数,即欧式距离的和:其中y(x)是模型的输出值,而a(x)是真实值;模型的优化方法通过反向传播算法和梯度下降算法调整神经网络中参数的取值,反向传播算法给出了一个高效的方式在所有参数上使用梯度下降算法,从而使神经网络模型在训练数据上的损失函数尽可能小,梯度下降算法用于优化单个参数的取值;反向传播算法是训练神经网络的核心算法,它可以根据定义好的损失函数优化神经网络中参数的取值,从而使神经网络模型在训练数据集上的损失函数达到一个较小值,用θ表示神经网络中的参数,J(θ)表示在给定的参数取值下,训练数据集上损失函数的大小,那么整个优化过程可以抽象为寻找一个参数θ,使得J(θ)最小,得到最小J(θ)后,模型参数的更新公式为如下:采用梯度下降法,其中η为学习率,为参数的梯度,将第一层第j个神经元中产生的错误,即实际值与预测值之间的误差,定义为:首先,计算最后一层神经网络产生的错误:δL=▽aC⊙f'(zL),由后往前,计算每一层神经网络产生的错误:δl=((wl+1)Tδl+1)⊙f'(zl),推导公式如下:
对于权重W的梯度计算,有如下公式:推导公式如下:对于偏置的梯度计算,有如下公式:推导公式如下:随着θ的更新,C逐渐逼近最小值,停止更新,从而求出了模型的参数,从而确定最终模型。
6)二次数据采集:获取需要评估的P2P网络借贷平台的运营数据;
7)数据预处理:在二次数据采集获取的运营数据中提取出主要特征与主要特征数据;
8)风险输出:将数据预处理后的主要特征与主要特征数据放入到训练好后的风险预测模型中,获取风险值,将风险值输入到判断器中,从而输出风险程度。
在第一次数据采集与第二次数据采集过程中,通过网络爬取或者P2P网络借贷平台提供方式获取P2P网络借贷平台的运营数据。
所述模式特征包括数值型、文字型和判断型三种。
第一预设量为100~150家,第二预设量为75~100家。
第二预设量至少为第一预设量的一半。
本实施例的工作原理:首先通过网络爬取或者P2P网络借贷平台提供方式获取多个P2P网络借贷平台的运营数据,将P2P网络借贷平台分为正常运营平台与跑路平台,提取出每个平台的特征与特征数据存档,接下来会用到模型训练以及测试中,将各个平台的特征放入到特征备选表中,构成一张备选特征表,对备选特征表中的每个特征都进行相关性分析,提取出主要特征,,搭建基于神经网络的风险预测模型,使用采集到的多个P2P网络借贷平台的主要特征和主要特征数据对风险预测模型进行训练与测试,确定好模型后,通过网络爬取或者P2P网络借贷平台提供方式获取需要评估的P2P网络借贷平台的运营数据,然后对平台的运营数据进行预处理,通过数据预处理精准提取出主要特征和主要特征数据放入到险预测模型中,获取风险值,将风险值输入到判断器中,从而输出风险程度。
本发明的有益效果为:本发明通过对大量P2P平台数据进行分析归纳出备选特征表,然后将备选特征表内的特征分为数据数值特性和数据存在特性,通过对这两个特性与平台的风险指数进行相关性分析,从而选取出主要特征对模型进行训练,确保模型的准确率和提高工作效率,并且建立基于神经网络的风险评估模型,神经网络算法分类的效果好,可以分布处理,对噪声神经有较强的鲁棒性和容错能力,能充分逼近复杂的非线性关系,通过更新公式方法训练模型,使得模型更加精准。
显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
Claims (5)
1.一种基于神经网络的P2P平台运营风险评估的系统,其特征在于,包括以下步骤:
1)第一次数据采集:获取多个P2P网络借贷平台的运营数据;
2)备选特征表建立:对第一次数据采集获得的运营数据进行筛选和提取,提取出特征和与特征相对应的数据,与特征相对应的数据定义为特征数据,依据特征数据的模式特征将特征分类建立备选特征表;
3)相关程度分析和特征选取:对特征采用皮尔森相关系数、斯皮尔曼相关系数、肯德尔相关系数和p值进行相关性分析,通过上述四种分析方法,每个特征均获得4个分析值,选取相关性分析绝对值0.4以上,同时P值0.005以下的特征,将这部分特征定义为主要特征;
4)模型训练集构建:取第一次数据采集中第一预设量的正常平台和第一预设量的逃跑平台的数据,提取出这些平台的主要特征数据作为训练集,将训练集整理成{(X(1),Y(1)),(X(2),Y(2))...(X(m),Y(m))},X(m)是主要特征数据的向量,Y(m)是平台的现有状态,逃跑为1,正常为0;
5)风险评估模型建立:神经网络是由多个神经元组合而成的,神经元的基本结构如下:其中xt是X的第t个输入,Wt是xt的权重,b是所有输入的偏置,而f()则是激活函数,激活函数采用sigmoid函数:取的神经网络模型的第一层为输入层,共t个神经元,第二层为隐含层,共k个神经元,最后一层为输出层,一共1个神经元;神经网络的代价函数采用二次代价函数,即欧式距离的和:其中y(x)是模型的输出值,而a(x)是真实值;模型的优化方法通过反向传播算法和梯度下降算法调整神经网络中参数的取值,反向传播算法给出了一个高效的方式在所有参数上使用梯度下降算法,从而使神经网络模型在训练数据上的损失函数尽可能小,梯度下降算法用于优化单个参数的取值;反向传播算法是训练神经网络的核心算法,它可以根据定义好的损失函数优化神经网络中参数的取值,从而使神经网络模型在训练数据集上的损失函数达到一个较小值,用θ表示神经网络中的参数,J(θ)表示在给定的参数取值下,训练数据集上损失函数的大小,那么整个优化过程可以抽象为寻找一个参数θ,使得J(θ)最小,得到最小J(θ)后,模型参数的更新公式为如下:采用梯度下降法,其中η为学习率,为参数的梯度,将第一层第j个神经元中产生的错误,即实际值与预测值之间的误差,定义为:首先,计算最后一层神经网络产生的错误:由后往前,计算每一层神经网络产生的错误:δl=((wl+1)Tδl+1)⊙f'(zl),推导公式如下:
对于权重W的梯度计算,有如下公式:推导公式如下:对于偏置的梯度计算,有如下公式:推导公式如下:随着θ的更新,C逐渐逼近最小值,停止更新,从而求出了模型的参数,从而确定最终模型。
6)二次数据采集:获取需要评估的P2P网络借贷平台的运营数据;
7)数据预处理:在二次数据采集获取的运营数据中提取出主要特征与主要特征数据;
8)风险输出:将数据预处理后的主要特征与主要特征数据放入到训练好后的风险预测模型中,获取风险值,将风险值输入到判断器中,从而输出风险程度。
2.根据权利要求1所述基于神经网络的P2P平台运营风险评估的系统,其特征在于,在第一次数据采集与第二次数据采集过程中,通过网络爬取或者P2P网络借贷平台提供方式获取P2P网络借贷平台的运营数据。
3.根据权利要求1所述基于神经网络的P2P平台运营风险评估的系统,其特征在于,所述模式特征包括数值型、文字型和判断型三种。
4.根据权利要求1所述基于神经网络的P2P平台运营风险评估的系统,其特征在于,第一预设量为100~150家,第二预设量为75~100家。
5.根据权利要求1所述基于神经网络的P2P平台运营风险评估的系统,其特征在于,第二预设量至少为第一预设量的一半。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810484817.9A CN108711100A (zh) | 2018-05-20 | 2018-05-20 | 一种基于神经网络的p2p平台运营风险评估的系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810484817.9A CN108711100A (zh) | 2018-05-20 | 2018-05-20 | 一种基于神经网络的p2p平台运营风险评估的系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108711100A true CN108711100A (zh) | 2018-10-26 |
Family
ID=63869289
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810484817.9A Pending CN108711100A (zh) | 2018-05-20 | 2018-05-20 | 一种基于神经网络的p2p平台运营风险评估的系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108711100A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110503198A (zh) * | 2019-07-23 | 2019-11-26 | 平安科技(深圳)有限公司 | 获取神经网络测试报告的方法、装置、设备和存储介质 |
CN112116912A (zh) * | 2020-09-23 | 2020-12-22 | 平安国际智慧城市科技股份有限公司 | 基于人工智能的数据处理方法、装置、设备及介质 |
CN113723838A (zh) * | 2021-09-02 | 2021-11-30 | 西南石油大学 | 基于卷积神经网络的随钻安全风险智能识别方法 |
-
2018
- 2018-05-20 CN CN201810484817.9A patent/CN108711100A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110503198A (zh) * | 2019-07-23 | 2019-11-26 | 平安科技(深圳)有限公司 | 获取神经网络测试报告的方法、装置、设备和存储介质 |
CN112116912A (zh) * | 2020-09-23 | 2020-12-22 | 平安国际智慧城市科技股份有限公司 | 基于人工智能的数据处理方法、装置、设备及介质 |
CN113723838A (zh) * | 2021-09-02 | 2021-11-30 | 西南石油大学 | 基于卷积神经网络的随钻安全风险智能识别方法 |
CN113723838B (zh) * | 2021-09-02 | 2023-04-18 | 西南石油大学 | 基于卷积神经网络的随钻安全风险智能识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Huang et al. | Enterprise credit risk evaluation based on neural network algorithm | |
Li et al. | Risk prediction in financial management of listed companies based on optimized BP neural network under digital economy | |
CN112037012A (zh) | 一种基于pso-bp神经网络的互联网金融信用评价方法 | |
CN106779755A (zh) | 一种网络电商借贷风险评估方法及模型 | |
CN106897918A (zh) | 一种混合式机器学习信用评分模型构建方法 | |
CN109035003A (zh) | 基于机器学习的反欺诈模型建模方法和反欺诈监控方法 | |
CN107194803A (zh) | 一种p2p网贷借款人信用风险评估的装置 | |
CN104732303A (zh) | 一种基于动态径向基函数神经网络的油田产量预测方法 | |
CN104318482A (zh) | 一套智能配电网综合评估体系和方法 | |
CN109389795A (zh) | 动态火灾风险评估方法、装置、服务器及存储介质 | |
CN108711100A (zh) | 一种基于神经网络的p2p平台运营风险评估的系统 | |
CN108898476A (zh) | 一种贷款客户信用评分方法和装置 | |
CN111260462A (zh) | 一种基于异质关系网络注意力机制的交易欺诈检测方法 | |
CN108492049A (zh) | 一种基于逻辑回归的p2p平台运营风险评估的系统 | |
CN109190943A (zh) | 基于机器学习的动态火灾风险评估方法、装置及服务器 | |
CN106777402A (zh) | 一种基于稀疏神经网络的图像检索文本方法 | |
CN112529685A (zh) | 一种基于bas-fnn的贷款用户信用评级方法及系统 | |
CN107481135A (zh) | 一种基于bp神经网络的个人信用评价方法及系统 | |
CN110689427A (zh) | 一种基于生存分析的消费分期违约概率模型 | |
CN110415106A (zh) | 一种经营主体的经营分析预测评估系统 | |
Chen | Risk assessment of government debt based on machine learning algorithm | |
CN111798303A (zh) | 一种法院被执行人履行能力评估的方法 | |
CN110310199B (zh) | 借贷风险预测模型的构建方法、系统及借贷风险预测方法 | |
CN108492169A (zh) | 基于信用卡审批场景的风险建模方法及系统实现 | |
CN108492050A (zh) | 一种p2p网络借贷平台运营风险评估系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20181026 |
|
WD01 | Invention patent application deemed withdrawn after publication |