CN108711100A

CN108711100A - 一种基于神经网络的p2p平台运营风险评估的系统

Info

Publication number: CN108711100A
Application number: CN201810484817.9A
Authority: CN
Inventors: 冯世程
Original assignee: Individual
Current assignee: Individual
Priority date: 2018-05-20
Filing date: 2018-05-20
Publication date: 2018-10-26

Abstract

本发明涉及一种基于神经网络的P2P平台运营风险评估的系统，本发明通过对大量P2P平台数据进行分析归纳出备选特征表，然后将备选特征表内的特征分为数据数值特性和数据存在特性，通过对这两个特性与平台的风险指数进行相关性分析，从而选取出主要特征对模型进行训练，确保模型的准确率和提高工作效率，并且建立基于神经网络的风险评估模型，神经网络算法分类的效果好,可以分布处理,对噪声神经有较强的鲁棒性和容错能力，能充分逼近复杂的非线性关系，通过更新公式方法训练模型，使得模型更加精准。

Description

一种基于神经网络的P2P平台运营风险评估的系统

技术领域

本发明涉及一种风险评估的系统，具体涉及一种基于神经网络的P2P平台运营风险评估的系统。

背景技术

P2P是英文person-to-person的缩写，意即个人对个人,又称点对点网络借款，是一种将小额资金聚集起来借贷给有资金需求人群的一种民间小额借贷模式,属于互联网金融产品的一种,属于民间小额借贷，借助互联网、移动互联网技术的网络信贷平台及相关理财行为、金融服务。

目前国内的P2P网络借贷平台多达几千家，对P2P平台的分析不仅仅要针对借款人的信用风险的分析，而且要对平台本身的运营风险进行分析，需要通过一些数据判断某一个平台是好是坏，即是否存在跑路风险，然而不同的风险评估模型得到的结果与准确率是不同的。

发明内容

本发明其目的在于公开一种基于神经网络的P2P平台运营风险评估的系统，提供一种基于神经网络的风险评估模型建立方法，并且通过推算方法将风险评估模型训练得更加准确。

实现本发明所述基于神经网络的P2P平台运营风险评估的系统的技术方案是：

一种基于神经网络的P2P平台运营风险评估的系统，包括以下步骤：

1)第一次数据采集：获取多个P2P网络借贷平台的运营数据；

2)备选特征表建立：对第一次数据采集获得的运营数据进行筛选和提取，提取出特征和与特征相对应的数据，与特征相对应的数据定义为特征数据，依据特征数据的模式特征将特征分类建立备选特征表；

3)相关程度分析和特征选取：对特征采用皮尔森相关系数、斯皮尔曼相关系数、肯德尔相关系数和p值进行相关性分析，通过上述四种分析方法，每个特征均获得4个分析值，选取相关性分析绝对值0.4以上，同时P值0.005以下的特征，将这部分特征定义为主要特征；

4)模型训练集构建：取第一次数据采集中第一预设量的正常平台和第一预设量的逃跑平台的数据，提取出这些平台的主要特征数据作为训练集，将训练集整理成{(X⁽¹⁾,Y⁽¹⁾),(X⁽²⁾,Y⁽²⁾)...(X^(m),Y^(m))}，X^(m)是主要特征数据的向量，Y^(m)是平台的现有状态，逃跑为1，正常为0；

5)风险评估模型建立：神经网络是由多个神经元组合而成的，神经元的基本结构如下：其中x_t是X的第t个输入，W_t是x_t的权重，b是所有输入的偏置,而f()则是激活函数,激活函数采用sigmoid函数：取的神经网络模型的第一层为输入层，共t个神经元，第二层为隐含层，共k个神经元，最后一层为输出层，一共1个神经元；神经网络的代价函数采用二次代价函数，即欧式距离的和：其中y(x)是模型的输出值，而a(x)是真实值；模型的优化方法通过反向传播算法和梯度下降算法调整神经网络中参数的取值，反向传播算法给出了一个高效的方式在所有参数上使用梯度下降算法，从而使神经网络模型在训练数据上的损失函数尽可能小，梯度下降算法用于优化单个参数的取值；反向传播算法是训练神经网络的核心算法，它可以根据定义好的损失函数优化神经网络中参数的取值，从而使神经网络模型在训练数据集上的损失函数达到一个较小值,用θ表示神经网络中的参数，J(θ)表示在给定的参数取值下，训练数据集上损失函数的大小，那么整个优化过程可以抽象为寻找一个参数θ，使得J(θ)最小，得到最小J(θ)后，模型参数的更新公式为如下：采用梯度下降法，其中η为学习率，为参数的梯度，将第一层第j个神经元中产生的错误，即实际值与预测值之间的误差，定义为：首先，计算最后一层神经网络产生的错误：δ^L＝▽_aC⊙f'(z^L)，由后往前，计算每一层神经网络产生的错误：δ^l＝((w^l+1)^Tδ^l+1)⊙f'(z^l)，推导公式如下：

对于权重W的梯度计算，有如下公式：推导公式如下：对于偏置的梯度计算，有如下公式：推导公式如下：随着θ的更新，C逐渐逼近最小值，停止更新，从而求出了模型的参数，从而确定最终模型。

6)二次数据采集：获取需要评估的P2P网络借贷平台的运营数据；

7)数据预处理：在二次数据采集获取的运营数据中提取出主要特征与主要特征数据；

8)风险输出：将数据预处理后的主要特征与主要特征数据放入到训练好后的风险预测模型中，获取风险值，将风险值输入到判断器中，从而输出风险程度。

进一步地，在第一次数据采集与第二次数据采集过程中，通过网络爬取或者P2P网络借贷平台提供方式获取P2P网络借贷平台的运营数据。

进一步地，所述模式特征包括数值型、文字型和判断型三种。

进一步地，第一预设量为100～150家，第二预设量为75～100家。

进一步地，第二预设量至少为第一预设量的一半。

本发明的有益效果为：本发明通过对大量P2P平台数据进行分析归纳出备选特征表，然后将备选特征表内的特征分为数据数值特性和数据存在特性，通过对这两个特性与平台的风险指数进行相关性分析，从而选取出主要特征对模型进行训练，确保模型的准确率和提高工作效率，并且建立基于神经网络的风险评估模型，神经网络算法分类的效果好,可以分布处理,对噪声神经有较强的鲁棒性和容错能力，能充分逼近复杂的非线性关系，通过更新公式方法训练模型，使得模型更加精准。

具体实施方式

下面将结合本发明实施例，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例：一种基于神经网络的P2P平台运营风险评估的系统，包括以下步骤：

1)第一次数据采集：获取多个P2P网络借贷平台的运营数据；

3)相关程度分析和特征选取：对特征采用皮尔森相关系数、斯皮尔曼相关系数、肯德尔相关系数和p值进行相关性分析，通过上述四种分析方法，每个特征均获得4个分析值，选取相关性分析绝对值0.4以上，同时P值0.005以下的特征，将这部分特征定义为主要特征，p值的定义决定了相关性的准确性，根据定义，p＝0.05时候样本中变量关联有5％的可能是由于偶然性造成的，p＝0.005时候样本中变量关联有0.5％的可能是由于偶然性造成的，P值的选用决定了主要特征的多少，经过多次模拟，我们认为采用P＝0.005时候最合理；

在第一次数据采集与第二次数据采集过程中，通过网络爬取或者P2P网络借贷平台提供方式获取P2P网络借贷平台的运营数据。

所述模式特征包括数值型、文字型和判断型三种。

第一预设量为100～150家，第二预设量为75～100家。

第二预设量至少为第一预设量的一半。

本实施例的工作原理：首先通过网络爬取或者P2P网络借贷平台提供方式获取多个P2P网络借贷平台的运营数据，将P2P网络借贷平台分为正常运营平台与跑路平台，提取出每个平台的特征与特征数据存档，接下来会用到模型训练以及测试中，将各个平台的特征放入到特征备选表中，构成一张备选特征表，对备选特征表中的每个特征都进行相关性分析，提取出主要特征，，搭建基于神经网络的风险预测模型，使用采集到的多个P2P网络借贷平台的主要特征和主要特征数据对风险预测模型进行训练与测试，确定好模型后，通过网络爬取或者P2P网络借贷平台提供方式获取需要评估的P2P网络借贷平台的运营数据，然后对平台的运营数据进行预处理，通过数据预处理精准提取出主要特征和主要特征数据放入到险预测模型中，获取风险值，将风险值输入到判断器中，从而输出风险程度。

显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

Claims

1.一种基于神经网络的P2P平台运营风险评估的系统，其特征在于，包括以下步骤：

1)第一次数据采集：获取多个P2P网络借贷平台的运营数据；

5)风险评估模型建立：神经网络是由多个神经元组合而成的，神经元的基本结构如下：其中x_t是X的第t个输入，W_t是x_t的权重，b是所有输入的偏置,而f()则是激活函数,激活函数采用sigmoid函数：取的神经网络模型的第一层为输入层，共t个神经元，第二层为隐含层，共k个神经元，最后一层为输出层，一共1个神经元；神经网络的代价函数采用二次代价函数，即欧式距离的和：其中y(x)是模型的输出值，而a(x)是真实值；模型的优化方法通过反向传播算法和梯度下降算法调整神经网络中参数的取值，反向传播算法给出了一个高效的方式在所有参数上使用梯度下降算法，从而使神经网络模型在训练数据上的损失函数尽可能小，梯度下降算法用于优化单个参数的取值；反向传播算法是训练神经网络的核心算法，它可以根据定义好的损失函数优化神经网络中参数的取值，从而使神经网络模型在训练数据集上的损失函数达到一个较小值,用θ表示神经网络中的参数，J(θ)表示在给定的参数取值下，训练数据集上损失函数的大小，那么整个优化过程可以抽象为寻找一个参数θ，使得J(θ)最小，得到最小J(θ)后，模型参数的更新公式为如下：采用梯度下降法，其中η为学习率，为参数的梯度，将第一层第j个神经元中产生的错误，即实际值与预测值之间的误差，定义为：首先，计算最后一层神经网络产生的错误：由后往前，计算每一层神经网络产生的错误：δ^l＝((w^l+1)^Tδ^l+1)⊙f'(z^l)，推导公式如下：

2.根据权利要求1所述基于神经网络的P2P平台运营风险评估的系统，其特征在于，在第一次数据采集与第二次数据采集过程中，通过网络爬取或者P2P网络借贷平台提供方式获取P2P网络借贷平台的运营数据。

3.根据权利要求1所述基于神经网络的P2P平台运营风险评估的系统，其特征在于，所述模式特征包括数值型、文字型和判断型三种。

4.根据权利要求1所述基于神经网络的P2P平台运营风险评估的系统，其特征在于，第一预设量为100～150家，第二预设量为75～100家。

5.根据权利要求1所述基于神经网络的P2P平台运营风险评估的系统，其特征在于，第二预设量至少为第一预设量的一半。