CN110363390A - 基于大数据的风险预测方法、系统、设备及存储介质 - Google Patents
基于大数据的风险预测方法、系统、设备及存储介质 Download PDFInfo
- Publication number
- CN110363390A CN110363390A CN201910524512.0A CN201910524512A CN110363390A CN 110363390 A CN110363390 A CN 110363390A CN 201910524512 A CN201910524512 A CN 201910524512A CN 110363390 A CN110363390 A CN 110363390A
- Authority
- CN
- China
- Prior art keywords
- information
- target
- target user
- indication information
- risk
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Accounting & Taxation (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Educational Administration (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Technology Law (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明实施例提供了一种基于大数据的风险预测方法,包括:获取目标用户的目标用户信息,所述目标用户信息包括目标画像指标信息、目标行为数据指标信息、目标保险信息指标信息和/或目标位置服务类指标信息;获取所述目标用户信息与风险事件对应的权重系数;根据所述目标用户信息的权重系数计算所述目标用户信息与风险事件的相关性系数;根据所述目标用户信息的相关性系数分析所述目标用户的风险系数。本发明实施例还提供了基于大数据的风险预测系统、计算机设备和计算机可存储介质。本发明实施例可以全方位的对目标用户的逾期风险的风险系数进行分析,提高了逾期风险评估的准确性。
Description
技术领域
本发明实施例涉及金融科技领域,尤其涉及一种基于大数据的风险预测方法、系统、设备及存储介质。
技术背景
随着计算机网络的快速发展,电子商务在人们的日常生活中得到了广泛的发展。随着日趋激烈的市场竞争,企业以赊销方式销售产品的交易方式已成为世界范围内诸多领域中的主要销售形式,而随之而来的是企业的信用风险,其中,信用风险是指借款人、证券发行人或交易对方因种种原因,不愿或无力履行合同条件而构成违约,致使银行、投资者或交易对方遭受损失的可能性。
目前,现有的风险评估手段为:通过用户的账户上的资金流入流出频率及金额数量,以及历史信用记录进行风险评估。然而,上述风险评估手段的数据维度单一、可用数据稀少,且可能有大量欺诈数据,从而导致风险评估准确率低下。
发明内容
有鉴于此,本发明实施例的目的是提供一种基于大数据的风险预测方法、系统、设备及存储介质,可以全方位的对目标用户的逾期风险的风险系数进行分析,提高了风险评估的准确性。
为实现上述目的,本发明实施例提供了一种基于大数据的风险预测方法,包括:
根据目标用户的目标标识,从指定数据库中查询所述目标用户的目标用户信息,所述目标用户信息包括多个指标信息,所述多个指标信息包括目标画像指标信息、目标行为数据指标信息、目标保险信息指标信息和/或目标位置服务类指标信息;
接收所述指定数据库反馈的所述目标用户信息;
从预先配置的映射表中获取各个指标信息对应于风险事件的权重系数,所述映射表为根据海量样本用户数据分析得到的各个指标信息对应于风险事件的权重系数;
根据所述目标用户信息中的各个指标信息对应的权重系数,计算所述目标用户信息与所述风险事件的相关性系数;
根据所述相关性系数预测所述目标用户的风险系数;及
基于所述风险系数向所述终端发送指示信息,以根据所述指示信息控制终端页面的页面显示。
进一步地,所述目标画像指标信息包括多个第一特征信息,所述目标行为数据指标信息包括多个第二特征信息,所述目标保险信息指标信息包括多个第三特征信息,所述目标位置服务类指标信息包括多个第四特征信息;
根据所述目标用户信息中的各个指标信息对应的权重系数,计算所述目标用户信息与所述风险事件的相关性系数的步骤,包括:
获取所述多个第一特征信息对应的第一权重系数,根据多个第一特征信息对应的第一权重系数计算所述第一IV值;
获取所述多个第二特征信息对应的第二权重系数,根据多个第二特征信息对应的第二权重系数计算所述第二IV值;
获取所述多个第三特征信息对应的第三权重系数,根据多个第三特征信息对应的第三权重系数计算所述第三IV值;
获取所述多个第四特征信息对应的第四权重系数,根据多个第四特征信息对应的第四权重系数计算所述第四IV值。
进一步地,所述各个指标信息的相关性系数的计算公式如下:
(Py-Pn)*WOE=IV值;
Py表示逾期的人数占比,Pn表示未逾期的人数占比,WOE表示相应的权重系数,IV值表示所述目标用户的其中一个特征信息的相关性系数。
进一步地,根据所述目标用户信息的权重系数计算所述目标用户信息相关性系数的步骤,包括:
将每个所述第一IV值相加得到所述目标行为数据指标信息的第一总IV值,即所述目标画像指标信息的相关性系数;
将每个所述第二IV值相加得到所述目标行为数据指标信息的第二总IV值,即所述目标行为数据指标信息的相关性系数;
将每个所述第三IV值相加得到所述目标行为数据指标信息的第三总IV值,即所述目标保险信息指标信息的相关性系数;
将每个所述第四IV值相加得到所述目标行为数据指标信息的第四总IV值,即所述目标位置服务类指标信息的相关性系数。
进一步地,根据所述目标用户信息的相关性系数分析所述目标用户的风险系数的步骤,包括:
将所述多个指标信息包括的目标画像指标信息、目标行为数据指标信息、目标保险信息指标信息和/或目标位置服务类指标信息的相关性系数相加得到所述目标用户的风险系数。
为实现上述目的,本发明实施例还提供了一种基于大数据的风险预测系统,包括:
第一获取模块,用于根据目标用户的目标标识,从指定数据库中查询所述目标用户的目标用户信息,所述目标用户信息包括多个指标信息,所述多个指标信息包括目标画像指标信息、目标行为数据指标信息、目标保险信息指标信息和/或目标位置服务类指标信息;
接收模块,用于接收所述指定数据库反馈的所述目标用户信息;
第二获取模块,用于从预先配置的映射表中获取各个指标信息对应于风险事件的权重系数,所述映射表为根据海量样本用户数据分析得到的各个指标信息对应于风险事件的权重系数;
计算模块,用于根据所述目标用户信息中的各个指标信息对应的权重系数,计算所述目标用户信息与所述风险事件的相关性系数;
预测模块,用于根据所述相关性系数预测所述目标用户的风险系数;
指示模块,用于基于所述风险系数向所述终端发送指示信息,以根据所述指示信息控制终端页面的页面显示。
进一步地,所述目标画像指标信息包括多个第一特征信息,所述目标行为数据指标信息包括多个第二特征信息,所述目标保险信息指标信息包括多个第三特征信息,所述目标位置服务类指标信息包括多个第四特征信息;
第二获取模块还用于:
获取所述多个第一特征信息对应的第一权重系数,根据多个第一特征信息对应的第一权重系数计算所述第一IV值,每个第一IV值相加得到所述目标画像指标信息的相关性系数;
获取所述多个第二特征信息对应的第二权重系数,根据多个第二特征信息对应的第二权重系数计算所述第二IV值,每个第二IV值相加得到所述目标行为数据指标信息的相关性系数;
获取所述多个第三特征信息对应的第三权重系数,根据多个第三特征信息对应的第三权重系数计算所述第三IV值,每个第三IV值相加得到所述目标保险信息指标信息的相关性系数;
获取所述多个第四特征信息对应的第四权重系数,根据多个第四特征信息对应的第四权重系数计算所述第四IV值,每个第四IV值相加得到所述目标位置服务类指标信息的相关性系数。
进一步地,所述分析模块还用于:
将所述多个指标信息包括的目标画像指标信息、目标行为数据指标信息、目标保险信息指标信息和/或目标位置服务类指标信息的相关性系数相加得到所述目标用户的风险系数。
为实现上述目的,本发明实施例还提供了一种计算机设备,所述计算机设备包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的基于大数据的风险预测系统,所述基于大数据的风险预测系统被所述处理器执行时实现如上所述的基于大数据的风险预测方法的步骤。
为实现上述目的,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序可被至少一个处理器所执行,以使所述至少一个处理器执行如上所述的基于大数据的风险预测方法的步骤。
本发明实施例提供的基于大数据的风险预测方法、系统、设备及存储介质,对目标用户的目标画像指标信息、目标行为数据指标信息、目标保险信息指标信息和/或目标位置服务类指标信息的权重系数及相关性系数计算得到目标用户的风险系数,全方位的进行分析得到该目标用户的逾期风险,提高了逾期风险评估的准确性。
附图说明
图1为本发明实施例基于大数据的风险预测方法实施例一的流程图。
图2为本发明实施例图1中步骤S106的流程图。
图3为本发明实施例图1中步骤S108的流程图。
图4为本发明实施例基于大数据的风险预测系统实施例二的程序模块示意图。
图5为本发明实施例计算机设备实施例三的硬件结构示意图。
具体实施方式
为了使本发明实施例的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明实施例进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明实施例,并不用于限定本发明实施例。基于本发明实施例中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明实施例保护的范围。
实施例一
参阅图1,示出了本发明实施例一之基于大数据的风险预测方法的步骤流程图。可以理解,本方法实施例中的流程图不用于对执行步骤的顺序进行限定。下面以计算机设备2为执行主体进行示例性描述。具体如下。
步骤S100,根据目标用户的目标标识,从指定数据库中查询所述目标用户的目标用户信息,所述目标用户信息包括多个指标信息,所述多个指标信息包括目标画像指标信息、目标行为数据指标信息、目标保险信息指标信息和/或目标位置服务类指标信息。
具体的,所述目标用户需要办理银联的用户,目标用户在申请时目标用户信息提供给银行,系统获取时将目标用户信息进行脱敏以保护目标用户的隐私,再统计脱敏后的目标用户信息的多个指标信息。脱敏处理的目标用户信息的多个指标信息可以为目标用户的姓名、手机号、身份证号、银行卡号等敏感信息。所述目标画像指标信息包括目标用户的性别、年龄、预估收入、婚姻状况、是否有车及是否有房等第一特征信息;所述目标行为数据指标信息包括用户在近6个月交易金额、平均每月每日交易金额、放款金额与还款失败次数等金额第二特征信息;所述目标保险信息指标信息包括用户是否购买寿险、健康险、意外险等第三特征信息;所述目标位置服务类指标信息(LBS,Geographic Information System)为根据地理位置获取目标用户的交易情况,包括同城交易次数与异地交易次数等第四特征信息。
步骤S102,接收所述指定数据库反馈的所述目标用户信息。
具体的,所述指定数据库可以为第三方平台的数据库,在通过第三方平台从数据库中查询所述目标用户的目标用户信息时,先登录第三方平台的网络系统,获得授权后并经网络系统登录验证服务器验证后,才能通过第三方平台进入数据库。当查询到指定数据库中与目标用户的目标标识相匹配的标识时,将目标用户信息反馈给服务器。
步骤S104,从预先配置的映射表中获取各个指标信息对应于风险事件的权重系数,所述映射表为根据海量样本用户数据分析得到的各个指标信息对应于风险事件的权重系数。
具体的,所述风险事件可以为逾期事件。首先建立样本库:获取样本用户的用户信息,所述用户信息包括画像指标、行为数据指标、保险信息指标和/或位置服务类指标;对所述样本用户的画像指标、行为数据指标、保险信息指标及位置服务类指标进行计算,以得到所述画像指标、行为数据指标、保险信息指标及位置服务类指标与逾期风险的权重系数及相关性系数。根据样本库计算得到的数据,从中获取所述目标用户信息与风险事件对应的权重系数。进行分箱、整体人数、人数占比的统计时,识别样本用户的用户信息可以得到,形成记录表格;逾期率、相对逾期率、权重系数WOE、IV值与总IV值的统计时,在记录表格中设置计算公式进行计算得到。
以女性为例,逾期率表示在女性所占比例当中逾期人数所占比例;
相对逾期率,用于表示样本用户信息其中一个特征信息(例如女性)的逾期人数在总人数中所占比例;
权重系数WOE,用于表示在样本用户信息中一个特征信息(例如女性)逾期用户与未逾期用户的比值、全部用户中逾期用户与未逾期用户的比值,两者的比值的对数,即A=(女性逾期用户/女性未逾期用户)/(全部逾期用户/全部未逾期用户),WOE=InA,权重系数WOE取值为全体实数,且在大于0部分,WOE越大表示分组中存在逾期可能性越大(正向作用),小于0部分,WOE越小则越表示了一种反向作用;
IV值,用于表示样本用户信息中其中一个特征信息(例如女性)的逾期的预测系数,即相当于权重系数WOE的加权,(女性逾期用户/女性未逾期用户-全部逾期用户/全部未逾期用户)*权重系数WOE;
总IV值,用于表示样本用户信息(例如性别)逾期的预测系数,即逾期风险系数,相当于权重系数WOE的加权求和,如某一项特征值(性别)的计算为:女性IV值+男性IV值。
例如,画像指标的根据计算得到的表格如下:
表格中性别栏的分箱为0表示男性,为1表示女性,是否项中0表示无,1表示有。样本用户的整体逾期率为20%,目标用户的逾期率为目标用户信息的平均值。
步骤S106,根据所述目标用户信息中的各个指标信息对应的权重系数,计算所述目标用户信息与所述风险事件的相关性系数。
示例性的,所述目标画像指标信息包括多个第一特征信息,所述目标行为数据指标信息包括多个第二特征信息,所述目标保险信息指标信息包括多个第三特征信息,所述目标位置服务类指标信息包括多个第四特征信息。
示例性的,如图2所示,步骤S104进一步包括:
步骤S106A,获取所述多个第一特征信息对应的第一权重系数,根据多个第一特征信息对应的第一权重系数计算所述第一IV值。
步骤S106B,获取所述多个第二特征信息对应的第二权重系数,根据多个第二特征信息对应的第二权重系数计算所述第二IV值。
步骤S106C,获取所述多个第三特征信息对应的第三权重系数,根据多个第三特征信息对应的第三权重系数计算所述第三IV值。
步骤S106D,获取所述多个第四特征信息对应的第四权重系数,根据多个第四特征信息对应的第四权重系数计算所述第四IV值。
示例性的,所述各个指标信息的相关性系数的计算公式如下:
(Py-Pn)*WOE=IV值;
Py表示逾期的人数占比,Pn表示未逾期的人数占比,WOE表示相应的权重系数,IV值表示所述目标用户的其中一个特征信息的相关性系数。
具体的,IV值为单个信息的相关性系数,如:在性别中的IV值可以看出,男性与逾期的相关性系数大于女性;年龄中的IV值可以看出,19岁到32岁之间的人相关性系数较大;是否有房的IV值可以看出,有房的相关性系数较大;是否有车IV值可以看出,无车的相关性系数较大;是否有小孩IV值可以看出,有小孩的相关性系数较大。总IV值表示某一指标从信息的相关性系数,例如,性别的总IV值为0.415;年龄的总IV值为3.210;是否有房的总为3.212;是否有车的总IV值为0.308;是否有小孩的IV值为0.025;则目标画像指标信息的IV值为7.17。
步骤S108,根据所述相关性系数预测所述目标用户的风险系数。
示例性的,如图3所示,步骤S108进一步包括:
步骤S108A,将每个所述第一IV值相加得到所述目标行为数据指标信息的第一总IV值,即所述目标画像指标信息的相关性系数。
步骤S108B,将每个所述第二IV值相加得到所述目标行为数据指标信息的第二总IV值,即所述目标行为数据指标信息的相关性系数。
步骤S108C,将每个所述第三IV值相加得到所述目标行为数据指标信息的第三总IV值,即所述目标保险信息指标信息的相关性系数。
步骤S108D,将每个所述第四IV值相加得到所述目标行为数据指标信息的第四总IV值,即所述目标位置服务类指标信息的相关性系数。
示例性的,根据所述相关性系数预测所述目标用户的风险系数的步骤,包括:
将所述目标用户信息包括目标画像指标信息、目标行为数据指标信息、目标保险信息指标信息和/或目标位置服务类指标信息的相关性系数相加得到所述目标用户的风险系数。
具体的,以目标用户的性别为男30岁已婚有房有车有小孩为例,其目标画像指标信息的第一总IV值为:0.373+0.272+2.677+0.280+0.025=3.627,即该目标用户的风险系数为3.627。
得到所述目标用户的风险系数之后,对风险系数低于某一数值的目标用户,再进一步分析是否同意该目标用户的银联的申请。
步骤S110,基于所述风险系数向所述终端发送指示信息,以根据所述指示信息控制终端页面的页面显示。
具体的,根据所述风险系数设置风险系数等级,所述风险系数等级用于选择相应的所述指示信息,再控制所述终端页面的页面进行相应的等级页面显示。例如:风险系数为(0,3)时,风险系数等级为一级,相应的指示信息为控制终端页面的页面显示为低等级对应的页面,便于查询对应用户的风险等级。
实施例二
请继续参阅图4,示出了本发明实施例基于大数据的风险预测系统实施例二的程序模块示意图。在本实施例中,基于大数据的风险预测系统20可以包括或被分割成一个或多个程序模块,一个或者多个程序模块被存储于存储介质中,并由一个或多个处理器所执行,以完成本发明实施例,并可实现上述基于大数据的风险预测方法。本发明实施例所称的程序模块是指能够完成特定功能的一系列计算机程序指令段,比程序本身更适合于描述基于大数据的风险预测系统20在存储介质中的执行过程。以下描述将具体介绍本实施例各程序模块的功能:
第一获取模块200,用于根据目标用户的目标标识,从指定数据库中查询所述目标用户的目标用户信息,所述目标用户信息包括多个指标信息,所述多个指标信息包括目标画像指标信息、目标行为数据指标信息、目标保险信息指标信息和/或目标位置服务类指标信息。
具体的,所述目标用户需要办理银联的用户,目标用户在申请时目标用户信息提供给银行,系统获取时将目标用户信息进行脱敏以保护目标用户的隐私,再统计脱敏后的目标用户信息。脱敏处理的目标用户信息可以为目标用户的姓名、手机号、身份证号、银行卡号等敏感信息。所述目标画像指标信息包括目标用户的性别、年龄、预估收入、婚姻状况、是否有车及是否有房等第一特征信息;所述目标行为数据指标信息包括用户在近6个月交易金额、平均每月每日交易金额、放款金额与还款失败次数等金额第二特征信息;所述目标保险信息指标信息包括用户是否购买寿险、健康险、意外险等第三特征信息;所述目标位置服务类指标信息(LBS,Geographic Information System)为根据地理位置获取目标用户的交易情况,包括同城交易次数与异地交易次数等第四特征信息。
接收模块201,用于接收所述指定数据库反馈的所述目标用户信息。
具体的,所述指定数据库可以为第三方平台的数据库,在通过第三方平台从数据库中查询所述目标用户的目标用户信息时,先登录第三方平台的网络系统,获得授权后并经网络系统登录验证服务器验证后,才能通过第三方平台进入数据库。当查询到指定数据库中与目标用户的目标标识相匹配的标识时,将目标用户信息反馈给服务器。
第二获取模块202,用于获取所述目标用户信息与风险事件对应的权重系数。
示例性的,所述目标画像指标信息包括多个第一特征信息,所述目标行为数据指标信息包括多个第二特征信息,所述目标保险信息指标信息包括多个第三特征信息,所述目标位置服务类指标信息包括多个第四特征信息。
示例性的,第二获取模块201还用于:
获取所述多个第一特征信息对应的第一权重系数,根据多个第一特征信息对应的第一权重系数计算所述第一IV值,每个第一IV值相加得到所述目标画像指标信息的相关性系数;
获取所述多个第二特征信息对应的第二权重系数,根据多个第二特征信息对应的第二权重系数计算所述第二IV值,每个第二IV值相加得到所述目标行为数据指标信息的相关性系数;
获取所述多个第三特征信息对应的第三权重系数,根据多个第三特征信息对应的第三权重系数计算所述第三IV值,每个第三IV值相加得到所述目标保险信息指标信息的相关性系数;
获取所述多个第四特征信息对应的第四权重系数,根据多个第四特征信息对应的第四权重系数计算所述第四IV值,每个第四IV值相加得到所述目标位置服务类指标信息的相关性系数。
具体的,各个指标信息的相关性系数的计算公式如下:
(Py-Pn)*WOE=IV值;
Py表示逾期的人数占比,Pn表示未逾期的人数占比,WOE表示相应的权重系数,IV值表示所述目标用户的其中一个特征信息的相关性系数。
计算模块203,用于从预先配置的映射表中获取各个指标信息对应于风险事件的权重系数,所述映射表为根据海量样本用户数据分析得到的各个指标信息对应于风险事件的权重系数。
具体的,所述目标用户根据已有的模型计算得出逾期率。
首先建立样本模型:获取样本用户的用户信息,所述用户信息包括画像指标、行为数据指标、保险信息指标和/或位置服务类指标;对所述样本用户的画像指标、行为数据指标、保险信息指标及位置服务类指标进行计算,以得到所述画像指标、行为数据指标、保险信息指标及位置服务类指标与逾期风险的权重系数及相关性系数。进行分箱、整体人数、人数占比的统计时,识别样本用户的用户信息可以得到,形成记录表格;逾期率、相对逾期率、权重系数WOE、IV值与总IV值的统计时,在记录表格中设置计算公式进行计算得到。
预测模块204,用于根据所述相关性系数预测所述目标用户的风险系数。
示例性的,所述分析模块204还用于:
将所述目标用户信息包括目标画像指标信息、目标行为数据指标信息、目标保险信息指标信息和/或目标位置服务类指标信息的相关性系数相加得到所述目标用户的风险系数。
指示模块205,用于基于所述风险系数向所述终端发送指示信息,以根据所述指示信息控制终端页面的页面显示。
具体的,根据所述风险系数设置风险系数等级,所述风险系数等级用于选择相应的所述指示信息,再控制所述终端页面的页面进行相应的等级页面显示。例如:风险系数为(0,3)时,风险系数等级为一级,相应的指示信息为控制终端页面的页面显示为低等级对应的页面,便于查询对应用户的风险等级。
实施例三
参阅图5,是本发明实施例三之计算机设备的硬件架构示意图。本实施例中,所述计算机设备2是一种能够按照事先设定或者存储的指令,自动进行数值计算和/或信息处理的设备。该计算机设备2可以是机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)等。如图5所示,所述计算机设备2至少包括,但不限于,可通过系统总线相互通信连接存储器21、处理器22、网络接口23以及基于大数据的风险预测系统20。其中:
本实施例中,存储器21至少包括一种类型的计算机可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器21可以是计算机设备2的内部存储单元,例如该计算机设备2的硬盘或内存。在另一些实施例中,存储器21也可以是计算机设备2的外部存储设备,例如该计算机设备20上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,存储器21还可以既包括计算机设备2的内部存储单元也包括其外部存储设备。本实施例中,存储器21通常用于存储安装于计算机设备2的操作系统和各类应用软件,例如实施例二的基于大数据的风险预测系统20的程序代码等。此外,存储器21还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器22在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器22通常用于控制计算机设备2的总体操作。本实施例中,处理器22用于运行存储器21中存储的程序代码或者处理数据,例如运行基于大数据的风险预测系统20,以实现实施例一的基于大数据的风险预测方法。
所述网络接口23可包括无线网络接口或有线网络接口,该网络接口23通常用于在所述服务器2与其他电子装置之间建立通信连接。例如,所述网络接口23用于通过网络将所述服务器2与外部终端相连,在所述服务器2与外部终端之间的建立数据传输通道和通信连接等。所述网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(Global System of Mobile communication,GSM)、宽带码分多址(Wideband CodeDivision Multiple Access,WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有线网络。需要指出的是,图5仅示出了具有部件20-23的计算机设备2,但是应理解的是,并不要求实施所有示出的部件,可以替代的实施更多或者更少的部件。
在本实施例中,存储于存储器21中的所述基于大数据的风险预测系统20还可以被分割为一个或者多个程序模块,所述一个或者多个程序模块被存储于存储器21中,并由一个或多个处理器(本实施例为处理器22)所执行,以完成本发明实施例。
例如,图4示出了所述实现基于大数据的风险预测系统20实施例二的程序模块示意图,该实施例中,所述基于大数据的风险预测系统20可以被划分为第一获取模块200、接收模块201、第二获取模块202、计算模块203、预测模块204与指示模块205。其中,本发明实施例所称的程序模块是指能够完成特定功能的一系列计算机程序指令段,比程序更适合于描述所述基于大数据的风险预测系统20在所述计算机设备2中的执行过程。所述程序模块200-205的具体功能在实施例二中已有详细描述,在此不再赘述。
实施例四
本实施例还提供一种计算机可读存储介质,如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等,其上存储有计算机程序,程序被处理器执行时实现相应功能。本实施例的计算机可读存储介质用于存储基于大数据的风险预测系统20,被处理器执行时实现实施例一的基于大数据的风险预测方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。
以上仅为本发明实施例的优选实施例,并非因此限制本发明实施例的专利范围,凡是利用本发明实施例说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明实施例的专利保护范围内。
Claims (10)
1.一种基于大数据的风险预测方法,其特征在于,包括:
根据目标用户的目标标识,从指定数据库中查询所述目标用户的目标用户信息,所述目标用户信息包括多个指标信息,所述多个指标信息包括目标画像指标信息、目标行为数据指标信息、目标保险信息指标信息和/或目标位置服务类指标信息;
接收所述指定数据库反馈的所述目标用户信息;
从预先配置的映射表中获取各个指标信息对应于风险事件的权重系数,所述映射表为根据海量样本用户数据分析得到的各个指标信息对应于风险事件的权重系数;
根据所述目标用户信息中的各个指标信息对应的权重系数,计算所述目标用户信息与所述风险事件的相关性系数;
根据所述相关性系数预测所述目标用户的风险系数;及
基于所述风险系数向所述终端发送指示信息,以根据所述指示信息控制终端页面的页面显示。
2.根据权利要求1所述的基于大数据的风险预测方法,其特征在于,所述目标画像指标信息包括多个第一特征信息,所述目标行为数据指标信息包括多个第二特征信息,所述目标保险信息指标信息包括多个第三特征信息,所述目标位置服务类指标信息包括多个第四特征信息;
根据所述目标用户信息中的各个指标信息对应的权重系数,计算所述目标用户信息与所述风险事件的相关性系数的步骤,包括:
获取所述多个第一特征信息对应的第一权重系数,根据多个第一特征信息对应的第一权重系数计算所述第一IV值;
获取所述多个第二特征信息对应的第二权重系数,根据多个第二特征信息对应的第二权重系数计算所述第二IV值;
获取所述多个第三特征信息对应的第三权重系数,根据多个第三特征信息对应的第三权重系数计算所述第三IV值;
获取所述多个第四特征信息对应的第四权重系数,根据多个第四特征信息对应的第四权重系数计算所述第四IV值。
3.根据权利要求2所述的基于大数据的风险预测方法,其特征在于,所述各个指标信息的相关性系数的计算公式如下:
(Py-Pn)*WOE=IV值;
Py表示逾期的人数占比,Pn表示未逾期的人数占比,WOE表示相应的权重系数,IV值表示所述目标用户的其中一个特征信息的相关性系数。
4.根据权利要求1所述的基于大数据的风险预测方法,其特征在于,根据所述目标用户信息的权重系数计算所述目标用户信息相关性系数的步骤,包括:
将每个所述第一IV值相加得到所述目标行为数据指标信息的第一总IV值,即所述目标画像指标信息的相关性系数;
将每个所述第二IV值相加得到所述目标行为数据指标信息的第二总IV值,即所述目标行为数据指标信息的相关性系数;
将每个所述第三IV值相加得到所述目标行为数据指标信息的第三总IV值,即所述目标保险信息指标信息的相关性系数;
将每个所述第四IV值相加得到所述目标行为数据指标信息的第四总IV值,即所述目标位置服务类指标信息的相关性系数。
5.根据权利要求1所述的基于大数据的风险预测方法,其特征在于,根据所述相关性系数所述目标用户的风险系数的步骤,包括:
将所述多个指标信息包括的目标画像指标信息、目标行为数据指标信息、目标保险信息指标信息和/或目标位置服务类指标信息的相关性系数相加得到所述目标用户的风险系数。
6.一种基于大数据的风险预测系统,其特征在于,包括:
第一获取模块,用于根据目标用户的目标标识,从指定数据库中查询所述目标用户的目标用户信息,所述目标用户信息包括多个指标信息,所述多个指标信息包括目标画像指标信息、目标行为数据指标信息、目标保险信息指标信息和/或目标位置服务类指标信息;
接收模块,用于接收所述指定数据库反馈的所述目标用户信息;
第二获取模块,用于从预先配置的映射表中获取各个指标信息对应于风险事件的权重系数,所述映射表为根据海量样本用户数据分析得到的各个指标信息对应于风险事件的权重系数;
计算模块,用于根据所述目标用户信息中的各个指标信息对应的权重系数,计算所述目标用户信息与所述风险事件的相关性系数;
预测模块,用于根据所述相关性系数预测所述目标用户的风险系数;
指示模块,用于基于所述风险系数向所述终端发送指示信息,以根据所述指示信息控制终端页面的页面显示。
7.根据权利要求6所述的基于大数据的风险预测系统,其特征在于,所述目标画像指标信息包括多个第一特征信息,所述目标行为数据指标信息包括多个第二特征信息,所述目标保险信息指标信息包括多个第三特征信息,所述目标位置服务类指标信息包括多个第四特征信息;
第二获取模块还用于:
获取所述多个第一特征信息对应的第一权重系数,根据多个第一特征信息对应的第一权重系数计算所述第一IV值,每个第一IV值相加得到所述目标画像指标信息的相关性系数;
获取所述多个第二特征信息对应的第二权重系数,根据多个第二特征信息对应的第二权重系数计算所述第二IV值,每个第二IV值相加得到所述目标行为数据指标信息的相关性系数;
获取所述多个第三特征信息对应的第三权重系数,根据多个第三特征信息对应的第三权重系数计算所述第三IV值,每个第三IV值相加得到所述目标保险信息指标信息的相关性系数;
获取所述多个第四特征信息对应的第四权重系数,根据多个第四特征信息对应的第四权重系数计算所述第四IV值,每个第四IV值相加得到所述目标位置服务类指标信息的相关性系数。
8.根据权利要求6所述的基于大数据的风险预测系统,其特征在于,所述分析模块还用于:
将所述多个指标信息包括的目标画像指标信息、目标行为数据指标信息、目标保险信息指标信息和/或目标位置服务类指标信息的相关性系数相加得到所述目标用户的风险系数。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的基于大数据的风险预测系统,所述基于大数据的风险预测系统被所述处理器执行时实现如权利要求1-5中任一项所述的基于大数据的风险预测方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序可被至少一个处理器所执行,以使所述至少一个处理器执行如权利要求1-5中任一项所述的基于大数据的风险预测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910524512.0A CN110363390A (zh) | 2019-06-18 | 2019-06-18 | 基于大数据的风险预测方法、系统、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910524512.0A CN110363390A (zh) | 2019-06-18 | 2019-06-18 | 基于大数据的风险预测方法、系统、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110363390A true CN110363390A (zh) | 2019-10-22 |
Family
ID=68216291
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910524512.0A Pending CN110363390A (zh) | 2019-06-18 | 2019-06-18 | 基于大数据的风险预测方法、系统、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110363390A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111091354A (zh) * | 2019-12-31 | 2020-05-01 | 成都传晟信息技术有限公司 | 基于大数据的不动产信息处理系统 |
CN111539617A (zh) * | 2020-04-21 | 2020-08-14 | 中国联合网络通信集团有限公司 | 数据处理方法和装置、电子设备、交互系统和存储介质 |
CN112016769A (zh) * | 2020-10-19 | 2020-12-01 | 北京梦天门科技股份有限公司 | 管理相对人风险预测以及信息推荐方法及装置 |
CN112732981A (zh) * | 2021-01-08 | 2021-04-30 | 深圳力维智联技术有限公司 | 数据的处理方法、装置、系统及计算机可读存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106570753A (zh) * | 2015-10-08 | 2017-04-19 | 平安科技(深圳)有限公司 | 对违约风险进行控制的方法及服务器 |
CN109165840A (zh) * | 2018-08-20 | 2019-01-08 | 平安科技(深圳)有限公司 | 风险预测处理方法、装置、计算机设备和介质 |
CN109345374A (zh) * | 2018-09-17 | 2019-02-15 | 平安科技(深圳)有限公司 | 风险控制方法、装置、计算机设备和存储介质 |
-
2019
- 2019-06-18 CN CN201910524512.0A patent/CN110363390A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106570753A (zh) * | 2015-10-08 | 2017-04-19 | 平安科技(深圳)有限公司 | 对违约风险进行控制的方法及服务器 |
CN109165840A (zh) * | 2018-08-20 | 2019-01-08 | 平安科技(深圳)有限公司 | 风险预测处理方法、装置、计算机设备和介质 |
CN109345374A (zh) * | 2018-09-17 | 2019-02-15 | 平安科技(深圳)有限公司 | 风险控制方法、装置、计算机设备和存储介质 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111091354A (zh) * | 2019-12-31 | 2020-05-01 | 成都传晟信息技术有限公司 | 基于大数据的不动产信息处理系统 |
CN111539617A (zh) * | 2020-04-21 | 2020-08-14 | 中国联合网络通信集团有限公司 | 数据处理方法和装置、电子设备、交互系统和存储介质 |
CN111539617B (zh) * | 2020-04-21 | 2022-04-12 | 中国联合网络通信集团有限公司 | 数据处理方法和装置、电子设备、交互系统和存储介质 |
CN112016769A (zh) * | 2020-10-19 | 2020-12-01 | 北京梦天门科技股份有限公司 | 管理相对人风险预测以及信息推荐方法及装置 |
CN112732981A (zh) * | 2021-01-08 | 2021-04-30 | 深圳力维智联技术有限公司 | 数据的处理方法、装置、系统及计算机可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110363390A (zh) | 基于大数据的风险预测方法、系统、设备及存储介质 | |
CA2821095C (en) | System and method for detecting fraudulent account access and transfers | |
US8296205B2 (en) | Connecting decisions through customer transaction profiles | |
US8566127B1 (en) | Insurance on demand transaction management system | |
CN110349038A (zh) | 风险评估模型训练方法和风险评估方法 | |
EP3465594A1 (en) | Electronic mortgage brokering and monitoring | |
CN110349003A (zh) | 基于社交数据的关联风险评估方法、装置及电子设备 | |
US8335710B2 (en) | Unidirectionally protected, fully automated asset allocation and asset monitoring apparatuses, and a corresponding method | |
KR102024377B1 (ko) | 블록체인 기반 그룹에 부여된 신용평가를 이용한 여신 서비스 제공 방법 | |
CN110503564B (zh) | 基于大数据的保全案件处理方法、系统、设备及存储介质 | |
CN101770669A (zh) | 银行自动报警系统及方法 | |
CN110533522A (zh) | 资源分配审核方法、电子装置及计算机可读存储介质 | |
CN109360082A (zh) | 一种贷款系统的业务处理方法、装置、计算机设备及存储介质 | |
CN109345371A (zh) | 个人征信报告回溯方法及系统 | |
CN111562930A (zh) | web应用安全的升级方法与系统 | |
CN111369345A (zh) | 云计算区块链的大数据信贷用户信用评估方法及系统 | |
CN110191097A (zh) | 登录页面安全性的检测方法、系统、设备及存储介质 | |
CN112101691A (zh) | 风险等级动态调整方法、装置及服务器 | |
CN110503563A (zh) | 风险控制方法及系统 | |
KR100850374B1 (ko) | 금리변동을 이용한 가변형 대출 시스템 | |
CN112702410A (zh) | 一种基于区块链网络的评估系统、方法及相关设备 | |
CN114862560A (zh) | 一种汽车反欺诈风险识别方法及其相关设备 | |
CN116934131A (zh) | 一种企业经营状况评估方法、装置及设备 | |
CN112288559B (zh) | 基于股权的财务数据核算方法、装置、设备及存储介质 | |
CN104363111A (zh) | 一种第三方系统接入的控制方法及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |