CN109063921A - 客户风险预警的优化处理方法、装置、计算机设备和介质 - Google Patents

客户风险预警的优化处理方法、装置、计算机设备和介质 Download PDF

Info

Publication number
CN109063921A
CN109063921A CN201810949533.2A CN201810949533A CN109063921A CN 109063921 A CN109063921 A CN 109063921A CN 201810949533 A CN201810949533 A CN 201810949533A CN 109063921 A CN109063921 A CN 109063921A
Authority
CN
China
Prior art keywords
risk
model
data
hidden layer
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810949533.2A
Other languages
English (en)
Other versions
CN109063921B (zh
Inventor
陈凯帆
叶素兰
李国才
王芊
宋哲
吴雨甜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201810949533.2A priority Critical patent/CN109063921B/zh
Publication of CN109063921A publication Critical patent/CN109063921A/zh
Application granted granted Critical
Publication of CN109063921B publication Critical patent/CN109063921B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Abstract

本申请涉及一种基于大数据分析的客户风险预警的优化处理方法、装置、计算机设备和存储介质。所述方法包括:获取目标客户在多个时间节点的风险数据;提取所述风险数据的风险指标;通过第一模型将多个所述时间节点及每个时间节点对应的风险指标进行转换,得到稠密特征矩阵;基于所述稠密特征矩阵进行风险测算,得到对应的风险评分;基于所述风险评分进行客户风险预警。采用本方法能够提高风险预警效率及准确率。

Description

客户风险预警的优化处理方法、装置、计算机设备和介质
技术领域
本申请涉及计算机技术领域,特别是涉及一种客户风险预警的优化处理方法、装置、计算机设备和介质。
背景技术
为了规避风险,涉及贷款业务的金融机构需要在贷后对客户进行客户风险预警。客户风险预警是指通过现场检查或非现场检查等贷后检查,运用定量和定性分析相结合的方法尽早发现贷款风险,并及时进行早期预警,以便业务人员按规定的权限和程序对问题贷款采取针对性的处理措施。
金融机构为了提高风险预警及时性,常借助计算机进行风险预警。但目前计算机仅机械的对风险控制人员在对客户进行风险跟踪过程了解到的多个客户风险因素进行简单叠加,对于多种客户风险因素的潜在特征信息则常常忽略,从而对于客户风险预警方式尚需优化。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高风险预警效率及准确率的客户风险预警的优化处理方法、装置、计算机设备和介质。
一种客户风险预警的优化处理方法,所述方法包括:获取目标客户在多个时间节点的风险数据;提取所述风险数据的风险指标;通过第一模型将多个所述时间节点及每个时间节点对应的风险指标进行转换,得到稠密特征矩阵;基于所述稠密特征矩阵进行风险测算,得到对应的风险评分;基于所述风险评分进行客户风险预警。
在其中一个实施例中,所述通过第一模型将多个所述时间节点及每个时间节点对应的风险指标进行转换之前,还包括:获取多个样本客户分别在多个历史时间节点的样本风险数据;基于插值算法对所述样本风险数据进行预处理,得到多种样本风险指标;基于因子分解算法对多种样本风险指标进行组合,得到多个指标集合;根据不同指标集合,分别生成对应的稀疏特征矩阵;利用所述稀疏特征矩阵对原始的第一模型进行训练,得到训练后的第一模型。
在其中一个实施例中,所述基于所述稠密特征矩阵进行风险测算,包括:计算所述稠密特征矩阵的数据缺失率;比较所述数据缺失率是否达到阈值;若是,通过第二模型基于所述稠密特征矩阵进行风险测算;否则,通过第三模型基于所述稠密特征矩阵进行风险测算。
在其中一个实施例中,所述第二模型采用循环神经网络模型训练得到;所述通过第二模型基于所述稠密特征矩阵进行风险测算,包括:根据所述稠密特征矩阵得到输入层节点序列;对所述输入层节点序列进行投影,得到第一隐层对应的隐层节点序列,将所述第一隐层作为当前处理隐层;获取所述当前处理隐层对应各个神经元节点的权重和上一时刻当前处理隐层的输出;根据所述当前处理隐层对应的各个神经元节点的权重和上一时刻当前处理隐层的输出,采用非线性映射得到下一隐层的隐层节点序列;将下一隐层作为当前处理隐层进行迭代,直至输出层;获取所述输出层输出的所述目标客户对应的风险评分。
在其中一个实施例中,所述第三模型采用深度神经网络模型训练得到;所述通过第三模型基于所述稠密特征矩阵进行风险测算,包括:根据所述稠密特征矩阵得到输入层节点序列;对所述输入层节点序列进行投影,得到第一隐层对应的隐层节点序列,将所述第一隐层作为当前处理隐层;获取所述当前处理隐层对应各个神经元节点的权重和偏差;根据所述当前处理隐层对应的各个神经元节点的权重和偏差,采用非线性映射得到下一隐层的隐层节点序列;将下一隐层作为当前处理隐层进行迭代,直至输出层;获取所述输出层输出的所述目标客户对应的风险评分。
在其中一个实施例中,所述方法还包括:获取评估指标集合;所述评估指标集合包括多个评估指标;基于多个所述评估指标对包含所述第一模型、第二模型或第三模型的风险预测模型分别进行评估,得到每个评估指标对应的指标值;根据多个评估指标的指标值,生成对所述风险预测模型的优化提示。
一种客户风险预警的优化处理装置,所述装置包括:数据采集模块,用于获取目标客户在多个时间节点的风险数据;提取所述风险数据的风险指标;特征提取模块,用于通过第一模型将多个所述时间节点及每个时间节点对应的风险指标进行转换,得到稠密特征矩阵;风险预警模块,用于基于所述稠密特征矩阵进行风险测算,得到对应的风险评分;基于所述风险评分进行客户风险预警。
在其中一个实施例中,所述装置还包括模型构建模块,用于获取多个样本客户分别在多个历史时间节点的样本风险数据;基于插值算法对所述样本风险数据进行预处理,得到多种样本风险指标;基于因子分解算法对多种样本风险指标进行组合,得到多个指标集合;根据不同指标集合,分别生成对应的稀疏特征矩阵;利用所述稀疏特征矩阵对原始的第一模型进行训练,得到训练后的第一模型。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现本申请任意一个实施例中提供的客户风险预警的优化处理方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本申请任意一个实施例中提供的客户风险预警的优化处理方法的步骤。
上述客户风险预警的优化处理方法、装置、计算机设备和存储介质,根据目标客户的风险数据,可以获取目标客户在多个时间节点的风险指标;通过第一模型对多个所述时间节点及每个时间节点对应的风险指标进行转换处理,可以得到风险数据对应的稠密特征矩阵;基于所述稠密特征矩阵,可以进行风险测算,得到目标客户对应的风险评分;基于所述风险评分,可以进行客户风险预警。由于自动采集并处理风险数据,可以提高风险预测效率;基于第一模型对风险数据隐藏的潜在价值信息进行挖掘,可以综合考虑多种风险因素,并从而能够风险预警效率及准确率。
附图说明
图1为一个实施例中客户风险预警的优化处理方法的应用场景图;
图2为一个实施例中客户风险预警的优化处理方法的流程示意图;
图3为一个实施例中风险指标扩展步骤的流程示意图;
图4为一个实施例中客户风险预警的优化处理装置的结构框图;
图5为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的客户风险预警的优化处理方法,可以应用于如图1所示的应用环境中。其中,终端102与服务器104通过网络进行通信。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。当需要对目标客户进行风险预测时,用户可以通过终端102向服务器104发送风险预测请求。服务器104响应风险预测请求或者按照预设时间频率获取目标客户在多个时间节点的风险数据,并提取风险数据的风险指标。服务器104中预先存储了风险预测模型。风险预测模型包括第一模型、第二模型和第三模型。服务器104通过第一模型将多个时间节点及每个时间节点对应的风险指标进行转换,得到稠密特征矩阵。服务器104计算稠密特征矩阵的数据缺失率,并比较数据缺失率是否达到阈值。若是,服务器104通过第二模型基于稠密特征矩阵进行风险测算,得到对应的风险评分。否则,服务器104通过第三模型基于稠密特征矩阵进行风险测算,得到对应的风险评分。服务器104基于风险评分进行客户风险预警。上述客户风险预警的优化处理过程,自动采集并处理风险数据,可以提高风险预测效率;基于第一模型对风险数据隐藏的潜在价值信息进行挖掘,基于第一模型、第二模型或第三模型对风险数据隐藏的潜在价值信息进行挖掘,可以综合考虑多种风险因素,并从而能够风险预警效率及准确率。
在一个实施例中,如图2所示,提供了一种客户风险预警的优化处理方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤202,获取目标客户在多个时间节点的风险数据。
目标客户财务指标的恶化、负面舆情的显著增加、欠税被处罚等,往往反映了其内部较为严重的问题,如管理上的欠缺、经营能力的不足等,在风险不断积聚之后,会导致其走向违约,因此需要对其多个时间节点的风险数据及时监控。目标客户可以是企业,也可以是个人;可以是已有客户,也可以是潜在客户。时间节点即为时间周期,如1个月,服务器可以获取目标客户连续12个月的风险数据。风险数据是指能够表征目标客户发生违约行为可能性的数据,如信用记录、财务数据等。风险数据的数据类型包括但不限于图像、音频、文本和数字。
风险数据包括基础风险数据,如客户标识、信用数据、财务数据及银监数据等。基础风险数据属于行内数据,可以从指定的数据库直接拉取。例如,信用数据可以从中国人名银行征信中心对应的数据库中拉取;财务数据可以在财经网站对应的数据库中拉取;银监数据可以从银监会监管数据库中拉取。
除了基础风险数据,服务器还对目标客户的关联风险数据深入挖掘,如法律数据、工商数据、房地产数据、行业区域数据、海关数据等。具体的,服务器从目标客户在金融机构留存的身份信息中提取基础标识字段。基础标识字段可以是目标客户,以及目标客户的亲属或朋友(以下称“关联对象”)的身份识别字段。身份识别字段包括姓名、身份证号、手机号、邮箱账号、金融交易账号等。
不同互联网服务器上运行了不同互联网平台。目标客户在使用各类设备访问机构内外的互联网平台时,将在相应互联网服务器中留下访问数据。访问数据可以以日志或文件等的形式存储。互联网服务器可以是通讯运营商、互联网理财服务商(如银行)、资本市场行情提供商(如Wind,金融数据和分析工具服务商)、房产服务器提供商、海关服务提供商、法律服务提供商、工商服务提供商等用于业务处理的服务器。服务器根据目标客户的基础标识字段,生成数据提取请求,将数据提取请求发送至互联网服务器。
互联网服务器查找包含基础标识字段的访问文件,将查找到的访问文件返回至服务器。访问文件记录了目标客户的关联访问数据。服务器对访问文件进行解析,得到关联访问数据。关联访问数据是指目标客户基于移动终端、汽车、智能机器人、智能穿戴设备等发生的互联网访问行为(如注册行为、登录行为等)的行为数据。关联访问数据包括静态访问数据和动态访问数据。其中,静态访问数据是指发生互联网访问行为时录入或用到的数据,如手机号、Mac地址、IP地址、设备指纹、身份信息、交易账号、登录信息、检索信息等。动态访问数据是指发生互联网访问行为时产生的数据,如资产管理理财记录、证券投资记录、资本市场行情交易记录、房产投资记录、海关运输记录、法律诉讼记录等。从不同渠道获取的风险数据具有不同的数据源类别,如财务数据对应的数据源类别可以是“财务”,法律数据对应的数据源类别可以是“法律”等。
步骤204,提取风险数据的风险指标。
服务器对风险数据预处理,得到多个风险指标。不同数据类型的风险数据预处理方式不同。其中,数字类型的风险数据,如目标客户的财务数据,作为评定目标客户风险状况的主要数据来源,可以在经过简单拆分,即可直接到对应的风险指标,如资产增长率同步下降、毛利率同比下降等。但图像、音频、文本等数据类型的风险数据,则需要经过清洗、提炼、量化或标准化处理等,得到分别对应的风险指标,如目标客户近一年已结清不良贷款借据金额等。风险指标可以是指数指标、也可以是分数指标,还可以是衍生指标。其中,衍生指标可以是通过已知风险指标的逻辑运算得到,如与违约客户相似度,与违约客户距离等。
步骤206,通过第一模型将多个时间节点及每个时间节点对应的风险指标进行转换,得到稠密特征矩阵。
第一模型包括卷积层、池化层和全连接层。服务器将多个时间节点及每个时间节点对应的风险指标输入卷积层,得到第一特征矩阵。第一特征矩阵包括多个向量。服务器将第一特征矩阵输入池化层,池化层用于将第一特征矩阵中每个向量中最大的权重进行投影得到第二特征矩阵。服务器将第二特征矩阵输入全连接层,得到稠密特征矩阵。稠密特征矩阵为包括多个风险指标对应向量值的多维向量矩阵。
步骤208,基于稠密特征矩阵进行风险测算,得到对应的风险评分。
在一个实施例中,基于稠密特征矩阵进行风险测算,包括:计算稠密特征矩阵的数据缺失率;比较数据缺失率是否达到阈值;若是,通过第二模型基于稠密特征矩阵进行风险测算;否则,通过第三模型基于稠密特征矩阵进行风险测算。
稠密特征矩阵包括多个风险指标。服务器统计稠密特征矩阵中具有对应风险指标值的风险指标的数量,记作样本数量。服务器统计风险指标的数量,记作总体数量。服务器获取预设公式,将样本数量和总体数量输入预设公式计算得到稠密特征矩阵的数据缺失率。预设公式可以是:数据缺失率=(总体数量-样本数量)/总体数量。
不同模型对数据完整度要求不同,本实施例根据数据缺失率从第二模型和第三模型动态选择一种模型进行风险预测,可以提高风险预测精度。
在一个实施例中,第二模型采用循环神经网络模型训练得到;第二模型包括输入层、输出层以及连接在输入层和输出层之间的多个隐层;每一层包括多个神经元节点。在通过第二模型基于稠密特征矩阵进行风险测算,包括:根据稠密特征矩阵得到输入层节点序列;对输入层节点序列进行投影,得到第一隐层对应的隐层节点序列,将第一隐层作为当前处理隐层;获取当前处理隐层对应各个神经元节点的权重和上一时刻当前处理隐层的输出;根据当前处理隐层对应的各个神经元节点的权重和上一时刻当前处理隐层的输出,采用非线性映射得到下一隐层的隐层节点序列;将下一隐层作为当前处理隐层进行迭代,直至输出层;获取输出层输出的目标客户对应的风险评分。
在一个实施例中,第三模型采用深度神经网络模型训练得到;第三模型包括输入层、输出层以及连接在输入层和输出层之间的多个隐层;每一层包括多个神经元节点。通过第三模型基于稠密特征矩阵进行风险测算,包括:根据稠密特征矩阵得到输入层节点序列;对输入层节点序列进行投影,得到第一隐层对应的隐层节点序列,将第一隐层作为当前处理隐层;获取当前处理隐层对应各个神经元节点的权重和偏差;根据当前处理隐层对应的各个神经元节点的权重和偏差,采用非线性映射得到下一隐层的隐层节点序列;将下一隐层作为当前处理隐层进行迭代,直至输出层;获取输出层输出的目标客户对应的风险评分。
步骤210,基于风险评分进行客户风险预警。
第二模型或第三模型输出目标客户在未来指定时段内发生违约行为的概率值,并将概率值转换为风险评分。其中,概率值到风险评分的转化方式可以有多种,如预置多种概率值区间和风险评分的对应关系,或预置概率值到风险评分的转换因子等,对此不作限制。服务器比较风险评分是否超过告警阈值,若是,则生成风险预警,并将风险预警发送至相应业务终端。
本实施例中,根据目标客户的风险数据,可以获取目标客户在多个时间节点的风险指标;通过第一模型对多个时间节点及每个时间节点对应的风险指标进行转换处理,可以得到风险数据对应的稠密特征矩阵;根据稠密特征矩阵的数据缺失率,可以从第二模型或第三模型中选择一种基于稠密特征矩阵进行风险测算,得到目标客户对应的风险评分;基于风险评分,可以进行客户风险预警。由于自动采集并处理风险数据,可以提高风险预测效率;基于第一模型、第二模型或第三模型对风险数据隐藏的潜在价值信息进行挖掘,可以综合考虑多种风险因素,并从而能够风险预警效率及准确率。
在一个实施例中,如图3所示,该方法还包括风险指标扩展的步骤,具体包括:
步骤302,获取与目标客户存在关联关系的关联对象的标识字段。
步骤304,根据标识字段,获取关联对象的风险数据。
步骤306,基于关联对象的风险数据以及预设的风险预测模型,计算关联对象的风险评分。
步骤308,计算每个关联对象与目标客户的亲密度。
步骤310,根据关联对象的风险评分和亲密度,确定目标客户受到关联对象影响的风险迁移率,将风险迁移率作为一个风险指标。
服务器计算目标客户的风险迁移率,并将风险迁移率作为一个风险指标,以拓展风险预测维度。具体的,服务器利用关联对象的风险数据,按照上述方式计算关联对象的风险评分。基础风险数据包括客户标识。服务器根据客户标识获取对应的社交网络图。社交网络图包括客户标识对应的目标客户节点和多个关联客户节点。社交网络图是根据客户的社交关系数据生成的。社交关系数据可以是从预先指定的社交网站中爬取得到的。当目标客户为个人时,社交网站中的社交关系可以是好友关系、相互关注等彼此之间互相关联的关系。社交关系还包括客户动作相关联的数据,比如,客户发布或者分享信息影响到好友进行评论、点赞、转发等。当目标客户为企业时,社交关系可以是企业之间的从属关系。社交网络图包括目标客户节点,多个关联对象节点以及用于连接节点的边线。
服务器利用预设计算公式计算每个关联客户节点与目标客户节点的亲密度。亲密度计算公式可以是:
其中,Q(v,w)为关联客户节点w与目标客户节点v之间的亲密度;N(v)表示目标客户节点v的邻接节点集合;目标客户节点v和关联客户节点w的共同邻接节点数为|N(v)∩N(w)|;目标客户节点v和关联客户节点均不邻接的节点数为|N(v)∪N(w)|。
服务器根据每个关联对象的风险评分及其与目标客户的亲密度,计算该关联对象对目标客户造成风险迁移的概率(以下称“风险迁移率”)。服务器将多个关联对象分别对应的风险迁移率中值最高的风险迁移率作为一个风险指标。容易理解,服务器也可以将多个关联对象分别对应的风险迁移率对应的平均值作为一个风险指标,对此不作限制。
本实施例中,计算目标客户的风险迁移率,并将风险迁移率作为风险指标纳入风险测算考虑范围,可以拓展风险预测维度,进而可以提高风险预警准确性。
在一个实施例中,该方法还包括:监测网络平台发布的舆情数据,将舆情数据拆分为多个短文本;在短文本中提取行业标识,将行业标识与相应短文本关联;利用预设的舆情分析模型计算每个短文本对应的情感指数;确定多个短文本分别对应的影响力权重;根据相关联的短文本的情感指数和影响力权重,计算每种行业标识对应的舆情指数,将目标客户对应行业标识的舆情指数作为一个风险指标。
服务器计算目标客户对应行业的舆情指数,并将舆情指数作为一个关联风险指标,以拓展风险预测维度。具体的,服务器在指定网络平台爬取舆情数据。舆情数据。可以是文本、语音、视频或图片等。若舆情数据为语音、视频或图片,则将其先转换为文本。转换后的舆情数据为包括多个拆分标识符的长文本。服务器将每个拆分标识符所在位置确定为拆分位置,在长文本的每个拆分位置进行拆分,得到多个短文本。拆分标识符可以语句结束符,如句号、感叹号等。服务器对短文本进行分词、同义替换和命名实体替换处理。根据预先存储的多种影响对象类型分别对应的舆情因子,服务器将替换后的一个或多个分词确定为中间关键词。舆情因子是指该类舆情数据中可能影响客户情感态度的因素。
服务器预先存储了舆情分析模型。舆情分析模型可以对机器学习分类模型训练得到的。服务器基于word2vec模型将多个中间关键词分别转化为对应的词向量,将词向量输入相应影响对象类型对应的舆情分析模型,计算得到舆情数据对应的情感指数。
每个舆情数据具有对应的简介信息,如发布时间、发布媒体、发布作者等。服务器基于舆情数据的简介信息,计算每个舆情数据的影响力权重。例如,影响力权重可以是时间权重、媒体权重与作者权重等的累加和。容易理解,同一舆情数据拆分得到的多个短文本对应的影响力权重相同。
服务器通过字典树(trie)算法在短文本中提取行业标识。行业标识是指能够表征行业属性的关键词,如金融、保险等。换言之,服务器在某些短文本中提取到的中间关键词包括行业标识。服务器在不同短文本中可以提取到相同或不同的行业标识。服务器将行业标识与相应短文本进行关联。容易理解,同一行业标识可能与来自多个舆情数据的多个短文本关联。服务器根据行业标识对应的短文本的情感指数以及对应影响力权重,计算相应行业对应的、舆情指数。例如,每个行业标识对应的舆情指数可以是与该行业标识关联的全部短文本的情感指数的加权和。
本实施例中,结合舆情数据的影响力权重计算不同舆情数据对不同行业影响,即舆情指数,可以提高舆情分析准确性;计算目标客户对应行业的舆情指数,并将舆情指数作为风险指标纳入风险测算考虑范围,可以拓展风险预测维度,进而可以提高风险预警准确性。
在一个实施例中,通过第一模型将多个时间节点及每个时间节点对应的风险指标进行转换之前,还包括:获取多个样本客户分别在多个历史时间节点的样本风险数据;基于插值算法对样本风险数据进行预处理,得到多种样本风险指标;基于因子分解算法对多种样本风险指标进行组合,得到多个指标集合;根据不同指标集合,分别生成对应的稀疏特征矩阵;利用稀疏特征矩阵对原始的第一模型进行训练,得到训练后的第一模型。
服务器按照上述方式获取多个样本客户在多个历史事件节点的样本风险数据,按照预设的多个风险指标,在样本风险数据中提取对应的风险指标值。由于不同数据源的风险数据更新频率不同等原因使得部分风险指标值缺失。服务器基于插值算法对样本风险数据进行填充,并基于因子分解算法对多种样本风险指标进行组合,以充分利用拥有的稀疏数据,并通过组合尽可能的发现稀疏数据隐藏的稠密特征,得到多种指标组合以及每种指标组合对应的稀疏特征矩阵。插值算法可以是邻差值或双线性差值等算法。因子分解算法可以是FM(Factorization Machine,因子分解机)等。服务器基于多个稀疏特征矩阵对原始的第一模型进行训练。原始的第一模型可以是自编码器(autoencoder)。自编码器通过神经网络结构对稀疏特征矩阵进行降维操作,相对传统的降维算法,自编码器能够学习到曲面空间上的维度特征,具有强大的表示能力。
本实施例中,基于插值算法及因子分解算法对样本风险数据预处理后对原始的第一模型进行训练,利于第一模型适用于不同稀疏程度的数据;借助第一模型可以将不同稀疏程度的风险数据转换为风险预测第二模型或第三模型需要的风险数据,将风险预测数据完整度门槛。
在一个实施例中,该方法还包括:获取评估指标集合,评估指标集合包括多个评估指标;基于多个评估指标对包含第一模型、第二模型或第三模型的风险预测模型分别进行评估,得到每个评估指标对应的指标值;根据多个评估指标的指标值,生成对风险预测模型的优化提示。
在创建风险预测模型后,服务器采用评估指标对风险预测模型的性能,即准确度进行评估,以保证得到的预测结果的准确性。评估指标集合包括用于评估风险预测模型的多种评估指标,如ROC曲线(receiver operating characteristic curve,受试者工作特征曲线)AUC(Area Under Curve,ROC曲线下的面积)值、混淆矩阵、精准度(Accuracy)、f分数(F-score)、召回率(Rcall)或准确率(Precision)等。服务器计算风险预测模型对应的每种评估指标对应的指标值。服务器将每个指标值转化为风险预测模型的性能子项评分,并计算多个性能子项评分的平均值,基于该平均值判断是否需要对风险预测模型进一步优化。若是,则生成优化提示,将优化提示发送至相应终端。
本实施例中,基于多种评估指标对风险预测模型进行全方位评估,以保证风险预测准确性。
应该理解的是,虽然图2和图3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2和图3中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图4所示,提供了一种客户风险预警的优化处理装置,包括:数据采集模块402、特征提取模块404和风险预警模块406,其中:
数据采集模块402,用于获取目标客户在多个时间节点的风险数据;提取风险数据的风险指标。
特征提取模块404,用于通过第一模型将多个时间节点及每个时间节点对应的风险指标进行转换,得到稠密特征矩阵。
风险预警模块406,用于基于稠密特征矩阵进行风险测算,得到对应的风险评分;基于风险评分进行客户风险预警。
在一个实施例中,该装置还包括模型构建模块408,用于获取多个样本客户分别在多个历史时间节点的样本风险数据;基于插值算法对样本风险数据进行预处理,得到多种样本风险指标;基于因子分解算法对多种样本风险指标进行组合,得到多个指标集合;根据不同指标集合,分别生成对应的稀疏特征矩阵;利用稀疏特征矩阵对原始的第一模型进行训练,得到训练后的第一模型。
在一个实施例中,风险预警模块406包括模型选择模块4062,用于计算稠密特征矩阵的数据缺失率;比较数据缺失率是否达到阈值;若是,通过第二模型基于稠密特征矩阵进行风险测算;否则,通过第三模型基于稠密特征矩阵进行风险测算。
在一个实施例中,第二模型采用循环神经网络模型训练得到;风险预警模块406包括第一预警模块4064,用于根据稠密特征矩阵得到输入层节点序列;对输入层节点序列进行投影,得到第一隐层对应的隐层节点序列,将第一隐层作为当前处理隐层;获取当前处理隐层对应各个神经元节点的权重和上一时刻当前处理隐层的输出;根据当前处理隐层对应的各个神经元节点的权重和上一时刻当前处理隐层的输出,采用非线性映射得到下一隐层的隐层节点序列;将下一隐层作为当前处理隐层进行迭代,直至输出层;获取输出层输出的目标客户对应的风险评分。
在一个实施例中,第三模型采用深度神经网络模型训练得到;风险预警模块406包括第二预警模块4066,用于根据稠密特征矩阵得到输入层节点序列;对输入层节点序列进行投影,得到第一隐层对应的隐层节点序列,将第一隐层作为当前处理隐层;获取当前处理隐层对应各个神经元节点的权重和偏差;根据当前处理隐层对应的各个神经元节点的权重和偏差,采用非线性映射得到下一隐层的隐层节点序列;将下一隐层作为当前处理隐层进行迭代,直至输出层;获取输出层输出的目标客户对应的风险评分。
在一个实施例中,该装置还包括模型评估模块410,用于获取评估指标集合;评估指标集合包括多个评估指标;基于多个评估指标对包含第一模型、第二模型或第三模型的风险预测模型分别进行评估,得到每个评估指标对应的指标值;根据多个评估指标的指标值,生成对风险预测模型的优化提示。
关于客户风险预警的优化处理装置的具体限定可以参见上文中对于客户风险预警的优化处理方法的限定,在此不再赘述。上述客户风险预警的优化处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储风险数据等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种客户风险预警的优化处理方法。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现本申请任意一个实施例中提供的客户风险预警的优化处理方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种客户风险预警的优化处理方法,所述方法包括:
获取目标客户在多个时间节点的风险数据;
提取所述风险数据的风险指标;
通过第一模型将多个所述时间节点及每个时间节点对应的风险指标进行转换,得到稠密特征矩阵;
基于所述稠密特征矩阵进行风险测算,得到对应的风险评分;
基于所述风险评分进行客户风险预警。
2.根据权利要求1所述的方法,其特征在于,所述通过第一模型将多个所述时间节点及每个时间节点对应的风险指标进行转换之前,还包括:
获取多个样本客户分别在多个历史时间节点的样本风险数据;
基于插值算法对所述样本风险数据进行预处理,得到多种样本风险指标;
基于因子分解算法对多种样本风险指标进行组合,得到多个指标集合;
根据不同指标集合,分别生成对应的稀疏特征矩阵;
利用所述稀疏特征矩阵对原始的第一模型进行训练,得到训练后的第一模型。
3.根据权利要求1所述的方法,其特征在于,所述基于所述稠密特征矩阵进行风险测算,包括:
计算所述稠密特征矩阵的数据缺失率;
比较所述数据缺失率是否达到阈值;
若是,通过第二模型基于所述稠密特征矩阵进行风险测算;
否则,通过第三模型基于所述稠密特征矩阵进行风险测算。
4.根据权利要求3所述的方法,其特征在于,所述第二模型采用循环神经网络模型训练得到;所述通过第二模型基于所述稠密特征矩阵进行风险测算,包括:根据所述稠密特征矩阵得到输入层节点序列;
对所述输入层节点序列进行投影,得到第一隐层对应的隐层节点序列,将所述第一隐层作为当前处理隐层;
获取所述当前处理隐层对应各个神经元节点的权重和上一时刻当前处理隐层的输出;根据所述当前处理隐层对应的各个神经元节点的权重和上一时刻当前处理隐层的输出,采用非线性映射得到下一隐层的隐层节点序列;
将下一隐层作为当前处理隐层进行迭代,直至输出层;获取所述输出层输出的所述目标客户对应的风险评分。
5.根据权利要求3所述的方法,其特征在于,所述第三模型采用深度神经网络模型训练得到;所述通过第三模型基于所述稠密特征矩阵进行风险测算,包括:根据所述稠密特征矩阵得到输入层节点序列;
对所述输入层节点序列进行投影,得到第一隐层对应的隐层节点序列,将所述第一隐层作为当前处理隐层;
获取所述当前处理隐层对应各个神经元节点的权重和偏差;根据所述当前处理隐层对应的各个神经元节点的权重和偏差,采用非线性映射得到下一隐层的隐层节点序列;
将下一隐层作为当前处理隐层进行迭代,直至输出层;获取所述输出层输出的所述目标客户对应的风险评分。
6.根据权利要求3所述的方法,其特征在于,所述方法还包括:
获取评估指标集合;所述评估指标集合包括多个评估指标;
基于多个所述评估指标对包含所述第一模型、第二模型或第三模型的风险预测模型分别进行评估,得到每个评估指标对应的指标值;
根据多个评估指标的指标值,生成对所述风险预测模型的优化提示。
7.一种客户风险预警的优化处理装置,其特征在于,所述装置包括:
数据采集模块,用于获取目标客户在多个时间节点的风险数据;提取所述风险数据的风险指标;
特征提取模块,用于通过第一模型将多个所述时间节点及每个时间节点对应的风险指标进行转换,得到稠密特征矩阵;
风险预警模块,用于基于所述稠密特征矩阵进行风险测算,得到对应的风险评分;基于所述风险评分进行客户风险预警。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括模型构建模块,用于获取多个样本客户分别在多个历史时间节点的样本风险数据;基于插值算法对所述样本风险数据进行预处理,得到多种样本风险指标;基于因子分解算法对多种样本风险指标进行组合,得到多个指标集合;根据不同指标集合,分别生成对应的稀疏特征矩阵;利用所述稀疏特征矩阵对原始的第一模型进行训练,得到训练后的第一模型。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN201810949533.2A 2018-08-20 2018-08-20 客户风险预警的优化处理方法、装置、计算机设备和介质 Active CN109063921B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810949533.2A CN109063921B (zh) 2018-08-20 2018-08-20 客户风险预警的优化处理方法、装置、计算机设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810949533.2A CN109063921B (zh) 2018-08-20 2018-08-20 客户风险预警的优化处理方法、装置、计算机设备和介质

Publications (2)

Publication Number Publication Date
CN109063921A true CN109063921A (zh) 2018-12-21
CN109063921B CN109063921B (zh) 2022-07-08

Family

ID=64686601

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810949533.2A Active CN109063921B (zh) 2018-08-20 2018-08-20 客户风险预警的优化处理方法、装置、计算机设备和介质

Country Status (1)

Country Link
CN (1) CN109063921B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109543925A (zh) * 2019-01-07 2019-03-29 平安科技(深圳)有限公司 基于机器学习的风险预测方法、装置、计算机设备和存储介质
CN110119976A (zh) * 2019-03-27 2019-08-13 民生科技有限责任公司 一种基于交易风险特征库的风险检测方法
CN110335138A (zh) * 2019-06-21 2019-10-15 上海淇馥信息技术有限公司 一种预测客群资质变化的风险预警方法、装置和电子设备
CN110443458A (zh) * 2019-07-05 2019-11-12 深圳壹账通智能科技有限公司 风险评估方法、装置、计算机设备和存储介质
CN111062800A (zh) * 2019-11-27 2020-04-24 同盾控股有限公司 数据处理方法、装置、电子设备及计算机可读介质
CN113837517A (zh) * 2020-12-01 2021-12-24 北京沃东天骏信息技术有限公司 事件的触发方法及装置、介质及电子设备
CN116468540A (zh) * 2023-04-13 2023-07-21 苏银凯基消费金融有限公司 基于大数据的消费金融客群风险识别系统及其方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080249851A1 (en) * 2007-04-03 2008-10-09 Robert Lee Angell Method and apparatus for providing customized digital media marketing content directly to a customer
CN108280762A (zh) * 2018-01-19 2018-07-13 平安科技(深圳)有限公司 客户风险评级方法、服务器及计算机可读存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080249851A1 (en) * 2007-04-03 2008-10-09 Robert Lee Angell Method and apparatus for providing customized digital media marketing content directly to a customer
CN108280762A (zh) * 2018-01-19 2018-07-13 平安科技(深圳)有限公司 客户风险评级方法、服务器及计算机可读存储介质

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109543925A (zh) * 2019-01-07 2019-03-29 平安科技(深圳)有限公司 基于机器学习的风险预测方法、装置、计算机设备和存储介质
CN109543925B (zh) * 2019-01-07 2023-01-24 平安科技(深圳)有限公司 基于机器学习的风险预测方法、装置、计算机设备和存储介质
CN110119976A (zh) * 2019-03-27 2019-08-13 民生科技有限责任公司 一种基于交易风险特征库的风险检测方法
CN110335138A (zh) * 2019-06-21 2019-10-15 上海淇馥信息技术有限公司 一种预测客群资质变化的风险预警方法、装置和电子设备
CN110443458A (zh) * 2019-07-05 2019-11-12 深圳壹账通智能科技有限公司 风险评估方法、装置、计算机设备和存储介质
CN111062800A (zh) * 2019-11-27 2020-04-24 同盾控股有限公司 数据处理方法、装置、电子设备及计算机可读介质
CN111062800B (zh) * 2019-11-27 2023-09-08 同盾控股有限公司 数据处理方法、装置、电子设备及计算机可读介质
CN113837517A (zh) * 2020-12-01 2021-12-24 北京沃东天骏信息技术有限公司 事件的触发方法及装置、介质及电子设备
CN116468540A (zh) * 2023-04-13 2023-07-21 苏银凯基消费金融有限公司 基于大数据的消费金融客群风险识别系统及其方法

Also Published As

Publication number Publication date
CN109063921B (zh) 2022-07-08

Similar Documents

Publication Publication Date Title
WO2020253358A1 (zh) 业务数据的风控分析处理方法、装置和计算机设备
CN109165840A (zh) 风险预测处理方法、装置、计算机设备和介质
CN109272396B (zh) 客户风险预警方法、装置、计算机设备和介质
CN109063921A (zh) 客户风险预警的优化处理方法、装置、计算机设备和介质
CN108876600B (zh) 预警信息推送方法、装置、计算机设备和介质
TWI712981B (zh) 風險辨識模型訓練方法、裝置及伺服器
CN107025509B (zh) 基于业务模型的决策系统和方法
CN110796470B (zh) 一种面向市场主体监管和服务的数据分析系统
CN109657917B (zh) 评估对象的风险预警方法、装置、计算机设备和存储介质
CN110489561A (zh) 知识图谱构建方法、装置、计算机设备和存储介质
CN110781308B (zh) 一种基于大数据构建知识图谱的反欺诈系统
US11562372B2 (en) Probabilistic feature engineering technique for anomaly detection
WO2020073727A1 (zh) 风险预测方法、装置、计算机设备和存储介质
CN109543925A (zh) 基于机器学习的风险预测方法、装置、计算机设备和存储介质
CN108710998A (zh) 企业数据处理方法、装置、计算机设备和存储介质
CN110442713A (zh) 文章管理方法、装置、计算机设备和存储介质
Munir et al. Big data: big challenges to privacy and data protection
CN114255121A (zh) 信贷风险预测模型的训练方法和信贷风险预测方法
TWM583089U (zh) 智慧型信用風險評估系統
CN113407734B (zh) 基于实时大数据的知识图谱系统的构建方法
US20210073247A1 (en) System and method for machine learning architecture for interdependence detection
CN115099988A (zh) 模型训练方法、数据处理方法、设备及计算机介质
Wang et al. Innovative risk early warning model based on internet of things under big data technology
CN114529399A (zh) 用户数据处理方法、装置、计算机设备和存储介质
Zang Construction of Mobile Internet Financial Risk Cautioning Framework Based on BP Neural Network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant