CN108492050A - 一种p2p网络借贷平台运营风险评估系统 - Google Patents
一种p2p网络借贷平台运营风险评估系统 Download PDFInfo
- Publication number
- CN108492050A CN108492050A CN201810302056.0A CN201810302056A CN108492050A CN 108492050 A CN108492050 A CN 108492050A CN 201810302056 A CN201810302056 A CN 201810302056A CN 108492050 A CN108492050 A CN 108492050A
- Authority
- CN
- China
- Prior art keywords
- data
- feature
- model
- platform
- risk
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Accounting & Taxation (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Educational Administration (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Technology Law (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明涉及一种P2P网络借贷平台运营风险评估系统,其目的在于公开一种P2P网络借贷平台运营风险评估系统,该方法通过收集大量的平台数据,从而总结备选征表,然后对备选特征表内的特征进行相关性分析,提取出主要特征,根据主要特征确定数据提取的指标,数据提取的指标包括关键词、关键词的模式特征以及不同模式特征对应的提取规则,通过数据提取的指标对需要测试的平台数据进行精准提取,保证评估结果的准确性。
Description
技术领域
本发明涉及一种风险评估系统,具体涉及一种P2P网络借贷平台运营风险评估系统。
背景技术
P2P是英文person-to-person的缩写,意即个人对个人,又称点对点网络借款,是一种将小额资金聚集起来借贷给有资金需求人群的一种民间小额借贷模式,属于互联网金融产品的一种,属于民间小额借贷,借助互联网、移动互联网技术的网络信贷平台及相关理财行为、金融服务。
目前国内的P2P网络借贷平台多达几千家,对P2P平台的分析不仅仅要针对借款人的信用风险的分析,而且要对平台本身的运营风险进行分析,需要通过一些数据判断某一个平台是好是坏,即是否存在跑路风险,然而不同的平台数据类型不同,如果无法准确从平台数据中提取出我们需要的核心数据,将会影响测试的准确性。
发明内容
本发明其目的在于公开一种P2P网络借贷平台运营风险评估系统,该方法通过收集大量的平台数据,从而总结备选征表,然后对备选特征表内的特征进行相关性分析,提取出主要特征,根据主要特征确定数据提取的指标,数据提取的指标包括关键词、关键词的模式特征以及不同模式特征对应的提取规则,通过数据提取的指标对需要测试的平台数据进行精准提取,保证评估结果的准确性。
实现本发明所述P2P网络借贷平台运营风险评估系统的技术方案是:
一种P2P网络借贷平台运营风险评估系统,包括以下步骤:
1)第一次数据采集:获取多个P2P网络借贷平台的运营数据;
2)备选特征表建立:对第一次数据采集获得的运营数据进行筛选和提取,提取出特征和与特征相对应的数据,与特征相对应的数据定义为特征数据,依据特征数据的模式特征将特征分类建立备选特征表;
3)相关程度分析和特征选取:对特征采用皮尔森相关系数、斯皮尔曼相关系数、肯德尔相关系数和p值进行相关性分析,通过上述四种分析方法,每个特征均获得4个分析值,选取相关性分析绝对值0.4以上,同时P值0.005以下的特征,将这部分特征定义为主要特征;
4)风险评估模型构建:建立一个用于计算出平台的运营风险值的风险评估模型;
5)模型训练:取第一次数据采集中第一预设量的正常平台和第一预设量的逃跑平台的数据,提取出这些平台的主要特征与主要特征数据对风险评估模型进行训练;
6)确定风险评估模型:通过模型训练后,取第一次数据采集中第二预设量的正常平台和第二预设量的逃跑平台的数据,提取出这些平台的主要特征与主要特征数据对风险评估模型进行测试,测试用的平台数据与训练用的平台数据不能重叠,通过测试结果对风险评估模型进行调整,重复测试与调整,直到测试结果能够准确反应平台的运营风险值;
7)二次数据采集:获取需要评估的P2P网络借贷平台的运营数据;
8)数据预处理:根据主要特征确定数据提取的指标,数据提取的指标包括关键词、关键词的模式特征以及不同模式特征对应的提取规则,根据提取的指标,使用模式匹配、数值范围和逻辑判断方法对二次数据采集获得的运营数据进行筛选和提取出主要特征与主要特征数据,然后将主要特征与主要特征数据按模式特征进行汇总统计;
9)风险输出:将数据预处理后的主要特征与主要特征数据放入到训练好后的风险评估模型中,获取风险值,将风险值输入到判断器中,从而输出风险程度。
进一步地,在第一次数据采集与第二次数据采集过程中,通过网络爬取或者P2P网络借贷平台提供方式获取P2P网络借贷平台的运营数据。
进一步地,在步骤4)中可采用逻辑回归模型、神经网络模型、朴素贝叶斯模型、随机森林模型、梯度提升树模型中的一种模型建立风险评估模型。
进一步地,所述模式特征包括数值型、文字型和判断型三种。
进一步地,第一预设量为100~150家,第二预设量为75~100家,数据越多,模型的准确性越高,但是工作量也越大,选取合适的训练集能将工作产出效益最大化。
进一步地,第二预设量至少为第一预设量的一半。
本发明的有益效果为:本发明通过对大量P2P平台数据进行分析归纳出备选特征表,然后将备选特征表内的特征分为数据数值特性和数据存在特性,通过对这两个特性与平台的风险指数进行相关性分析,从而选取出主要特征对模型进行训练,确保模型的准确率和提高工作效率,并且根据主要特征确定数据提取的指标,数据提取的指标包括关键词、关键词的模式特征以及不同模式特征对应的提取规则,通过数据提取的指标对需要测试的平台数据进行精准提取,保证评估结果的准确性。
具体实施方式
下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例:一种P2P网络借贷平台运营风险评估系统,包括以下步骤:
1)第一次数据采集:获取多个P2P网络借贷平台的运营数据;
2)备选特征表建立:对第一次数据采集获得的运营数据进行提取,提取出特征和与特征相对应的数据,与特征相对应的数据定义为特征数据,依据特征数据的模式特征将特征分类建立备选特征表,备选特征表内特征有发标密度、逾期标数、单位时间逾期标数比、平均的标额度、完成标数比、平均的标借贷时间、平均的标回报率、平台的标质押比、先息后本的标比、一次性本息的标比、等额本息的标比、未婚的标比、已婚的标比、男性的标比、女性的标比、平台平均学历值、离异的标比、平台借款人有房比例、平台借款人有车比例等;
3)相关程度分析和特征选取:对特征采用皮尔森相关系数、斯皮尔曼相关系数、肯德尔相关系数和p值进行相关性分析,通过上述四种分析方法,每个特征均获得4个分析值,选取相关性分析绝对值0.4以上,同时P值0.005以下的特征,将这部分特征定义为主要特征,p值的定义决定了相关性的准确性,根据定义,p=0.05时候样本中变量关联有5%的可能是由于偶然性造成的,p=0.005时候样本中变量关联有0.5%的可能是由于偶然性造成的,P值的选用决定了主要特征的多少,经过多次模拟,我们认为采用P=0.005时候最合理;
4)风险评估模型构建:建立一个用于计算出平台的运营风险值的风险评估模型;
5)模型训练:取第一次数据采集中第一预设量的正常平台和第一预设量的逃跑平台的数据,提取出这些平台的主要特征与主要特征数据对风险评估模型进行训练;
6)确定风险评估模型:通过模型训练后,取第一次数据采集中第二预设量的正常平台和第二预设量的逃跑平台的数据,提取出这些平台的主要特征与主要特征数据对风险评估模型进行测试,测试用的平台数据与训练用的平台数据不能重叠,通过测试结果对风险评估模型进行调整,重复测试与调整,直到测试结果能够准确反应平台的运营风险值;
7)二次数据采集:获取需要评估的P2P网络借贷平台的运营数据;
8)数据预处理:根据主要特征确定数据提取的指标,数据提取的指标包括关键词、关键词的模式特征以及不同模式特征对应的提取规则,根据提取的指标,使用模式匹配、数值范围和逻辑判断方法对二次数据采集获得的运营数据进行筛选和提取出主要特征与主要特征数据,然后将主要特征与主要特征数据按模式特征进行汇总统计;
9)风险输出:将数据预处理后的主要特征与主要特征数据放入到训练好后的风险评估模型中,获取风险值,将风险值输入到判断器中,从而输出风险程度,判断器是对风险值的一个区间划分,落在不同区间的风险值会得出不同的风险程度,风险程度以逃跑的概率显示。
在第一次数据采集与第二次数据采集过程中,通过网络爬取或者P2P网络借贷平台提供方式获取P2P网络借贷平台的运营数据。
在步骤5)中可采用逻辑回归模型、神经网络模型、朴素贝叶斯模型、随机森林模型、梯度提升树模型中的一种模型建立风险评估模型。
所述模式特征包括数值型、文字型和判断型三种。
第一预设量为100~150家,第二预设量为75~100家,第二预设量至少为第一预设量的一半。
本实施例的工作原理:首先通过网络爬取或者P2P网络借贷平台提供方式获取多个P2P网络借贷平台的运营数据,将P2P网络借贷平台分为正常运营平台与跑路平台,提取出每个平台的特征与特征数据存档,接下来会用到模型训练以及测试中,将各个平台的特征放入到特征备选表中,构成一张备选特征表,对备选特征表中的每个特征都进行相关性分析,提取出主要特征,建立一个风险评估模型,使用采集到的多个P2P网络借贷平台的主要特征和主要特征数据对风险评估模型进行训练与测试,确定好模型后,通过网络爬取或者P2P网络借贷平台提供方式获取需要评估的P2P网络借贷平台的运营数据,然后对平台的运营数据进行预处理,通过数据预处理精准提取出主要特征和主要特征数据放入到险预测模型中,获取风险值,将风险值输入到判断器中,从而输出风险程度。
本发明的有益效果为:本发明通过对大量P2P平台数据进行分析归纳出备选特征表,然后将备选特征表内的特征分为数据数值特性和数据存在特性,通过对这两个特性与平台的风险指数进行相关性分析,从而选取出主要特征对模型进行训练,确保模型的准确率和提高工作效率,并且根据主要特征确定数据提取的指标,数据提取的指标包括关键词、关键词的模式特征以及不同模式特征对应的提取规则,通过数据提取的指标对需要测试的平台数据进行精准提取,保证评估结果的准确性。
显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
Claims (6)
1.一种P2P网络借贷平台运营风险评估系统,其特征在于,包括以下步骤:
1)第一次数据采集:获取多个P2P网络借贷平台的运营数据;
2)备选特征表建立:对第一次数据采集获得的运营数据进行筛选和提取,提取出特征和与特征相对应的数据,与特征相对应的数据定义为特征数据,依据特征数据的模式特征将特征分类建立备选特征表;
3)相关程度分析和特征选取:对特征采用皮尔森相关系数、斯皮尔曼相关系数、肯德尔相关系数和p值进行相关性分析,通过上述四种分析方法,每个特征均获得4个分析值,选取相关性分析绝对值0.4以上,同时P值0.005以下的特征,将这部分特征定义为主要特征;
4)风险评估模型构建:建立一个用于计算出平台的运营风险值的风险评估模型;
5)模型训练:取第一次数据采集中第一预设量的正常平台和第一预设量的逃跑平台的数据,提取出这些平台的主要特征与主要特征数据对风险评估模型进行训练;
6)确定风险评估模型:通过模型训练后,取第一次数据采集中第二预设量的正常平台和第二预设量的逃跑平台的数据,提取出这些平台的主要特征与主要特征数据对风险评估模型进行测试,测试用的平台数据与训练用的平台数据不能重叠,通过测试结果对风险评估模型进行调整,重复测试与调整,直到测试结果能够准确反应平台的运营风险值;
7)二次数据采集:获取需要评估的P2P网络借贷平台的运营数据;
8)数据预处理:根据主要特征确定数据提取的指标,数据提取的指标包括关键词、关键词的模式特征以及不同模式特征对应的提取规则,根据提取的指标,使用模式匹配、数值范围和逻辑判断方法对二次数据采集获得的运营数据进行筛选和提取出主要特征与主要特征数据,然后将主要特征与主要特征数据按模式特征进行汇总统计;
9)风险输出:将数据预处理后的主要特征与主要特征数据放入到训练好后的风险评估模型中,获取风险值,将风险值输入到判断器中,从而输出风险程度。
2.根据权利要求1所述P2P网络借贷平台运营风险评估系统,其特征在于,在第一次数据采集与第二次数据采集过程中,通过网络爬取或者P2P网络借贷平台提供方式获取P2P网络借贷平台的运营数据。
3.根据权利要求1所述P2P网络借贷平台运营风险评估系统,其特征在于,在步骤4)中可采用逻辑回归模型、神经网络模型、朴素贝叶斯模型、随机森林模型、梯度提升树模型中的一种模型建立风险评估模型。
4.根据权利要求1所述P2P网络借贷平台运营风险评估系统,其特征在于,所述模式特征包括数值型、文字型和判断型三种。
5.根据权利要求1所述P2P网络借贷平台运营风险评估系统,其特征在于,第一预设量为100~150家,第二预设量为75~100家。
6.根据权利要求1所述P2P网络借贷平台运营风险评估系统,其特征在于,第二预设量至少为第一预设量的一半。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810302056.0A CN108492050A (zh) | 2018-04-04 | 2018-04-04 | 一种p2p网络借贷平台运营风险评估系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810302056.0A CN108492050A (zh) | 2018-04-04 | 2018-04-04 | 一种p2p网络借贷平台运营风险评估系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108492050A true CN108492050A (zh) | 2018-09-04 |
Family
ID=63314620
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810302056.0A Pending CN108492050A (zh) | 2018-04-04 | 2018-04-04 | 一种p2p网络借贷平台运营风险评估系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108492050A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109118119A (zh) * | 2018-09-06 | 2019-01-01 | 多点生活(成都)科技有限公司 | 风控模型生成方法及装置 |
CN109919414A (zh) * | 2019-01-16 | 2019-06-21 | 国家计算机网络与信息安全管理中心 | P2p网络借贷平台风险分析方法、装置及存储介质 |
CN112330475A (zh) * | 2020-11-26 | 2021-02-05 | 重庆趣嗨租科技有限公司 | 一种ai风险识别系统 |
-
2018
- 2018-04-04 CN CN201810302056.0A patent/CN108492050A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109118119A (zh) * | 2018-09-06 | 2019-01-01 | 多点生活(成都)科技有限公司 | 风控模型生成方法及装置 |
CN109919414A (zh) * | 2019-01-16 | 2019-06-21 | 国家计算机网络与信息安全管理中心 | P2p网络借贷平台风险分析方法、装置及存储介质 |
CN112330475A (zh) * | 2020-11-26 | 2021-02-05 | 重庆趣嗨租科技有限公司 | 一种ai风险识别系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103154991B (zh) | 信用风险采集 | |
CN108492050A (zh) | 一种p2p网络借贷平台运营风险评估系统 | |
CN109191191B (zh) | 基于代价敏感卷积神经网络的广告点击欺诈检测方法 | |
CN105354210A (zh) | 移动游戏支付账户行为数据处理方法和装置 | |
CN112700325A (zh) | 一种基于Stacking集成学习的网贷回头客预测的方法 | |
CN105404947A (zh) | 用户质量侦测方法及装置 | |
CN108337656A (zh) | 一种移动群智感知激励方法 | |
CN104616198A (zh) | 一种基于文本分析的p2p网络借贷风险预测系统 | |
CN108009911A (zh) | 一种识别p2p网络借贷借款人违约风险的方法 | |
CN108492049A (zh) | 一种基于逻辑回归的p2p平台运营风险评估的系统 | |
CN102725772A (zh) | 专利评分和分类 | |
CN108665339A (zh) | 一种基于主观情感测度的电商产品可靠性指标及其实现方法 | |
CN108492001A (zh) | 一种用于担保贷款网络风险管理的方法 | |
CN114048436A (zh) | 一种预测企业财务数据模型构建方法及构建装置 | |
CN103310235B (zh) | 一种基于参数识别与估计的隐写分析方法 | |
CN111967802A (zh) | 一种企业金融风险定量分析和预警方法、装置及设备 | |
KR101999765B1 (ko) | 데이터마이닝 기술을 이용한 금융 사기 대출 패턴화 분석 시스템 및 방법 | |
CN101377739A (zh) | 基础软件平台的质量评估方法 | |
CN109102396A (zh) | 一种用户信用评级方法、计算机设备及可读介质 | |
Li et al. | Linkage between passenger demand and surrounding land-use patterns at urban rail transit stations: A canonical correlation analysis method and case study in Chongqing | |
CN105321113A (zh) | 一种基于宏观因子的压力测试客户端 | |
CN112182331B (zh) | 一种基于svm-rfe的客户风险特征筛选方法及其应用 | |
CN110246024A (zh) | 违约指数评估方法 | |
CN102968741A (zh) | 一种基于宏观因子的压力测试系统及方法 | |
CN108492176A (zh) | 一种p2p借贷平台运营风险评估系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20180904 |
|
WD01 | Invention patent application deemed withdrawn after publication |