CN112785155A

CN112785155A - 一种客户网络特征的标签传播算法的风险识别方法及系统

Info

Publication number: CN112785155A
Application number: CN202110090499.XA
Authority: CN
Inventors: 安文娟; 马宁; 臧进进; 吕志斌; 祝国浩; 孟鑫蕊
Original assignee: China Citic Bank Corp Ltd
Current assignee: China Citic Bank Corp Ltd
Priority date: 2021-01-22
Filing date: 2021-01-22
Publication date: 2021-05-11
Anticipated expiration: 2041-01-22
Also published as: CN112785155B

Abstract

本发明公开了一种客户网络特征的标签传播算法的风险识别方法及系统，所述方法包括：获得历史客户数据信息并进行预处理；根据所述预处理后的所述历史客户数据信息，获得账户级资金交易表和客户级资金交易表；根据所述账户级资金交易表和所述客户级资金交易表，获得第一点文件和第一关系文件；根据所述第一点文件和所述第一关系文件，构建网络模型；根据所述网络模型，获得第一客户的网络特征信息；根据所述第一客户的网络特征信息，获得所述第一客户的风险传导系数；根据所述第一客户的风险传导系数，对所述第一客户的风险进行分析。解决了现有技术中存在风险识别中对存在风险的客户识别率低，且运用方法具有明显不足和局限性的技术问题。

Description

一种客户网络特征的标签传播算法的风险识别方法及系统

技术领域

本发明涉及金融行业风险客户识别领域，尤其涉及一种客户网络特征的标签传播算法的风险识别方法及系统。

背景技术

随着金融科技的发展，金融行业中不断涌现出各种各样新的形态，各类金融风险案件呈现频发、高发态势，为银行业的正常运营带来巨大挑战。但是，目前传统的案件识别方式在使用过程中弊端日益凸显，在严峻的金融风险形势背景下，如何对金融风险案件进行有效识别、防控，成为银行业一个亟需解决的问题。

但本申请发明人在实现本申请实施例中发明技术方案的过程中，发现上述技术至少存在如下技术问题：

现有技术中存在风险识别中对存在风险的客户识别率低，且运用方法具有明显不足和局限性的技术问题。

发明内容

本申请实施例通过提供一种客户网络特征的标签传播算法的风险识别方法及系统，解决了现有技术中存在风险识别中对存在风险的客户识别率低，且运用方法具有明显不足和局限性的技术问题，达到了充分结合客户的网络特征并完全适用于大数据体量，实现科学、有效、准确的风险识别方法的技术效果。

鉴于上述问题，提出了本申请实施例提供一种客户网络特征的标签传播算法的风险识别方法及系统。

第一方面，本申请实施例提供了一种客户网络特征的标签传播算法的风险识别方法，所述方法包括：获得历史客户数据信息；对所述历史客户数据信息进行预处理；根据所述预处理后的所述历史客户数据信息，获得账户级资金交易表和客户级资金交易表；根据所述账户级资金交易表和所述客户级资金交易表，获得第一点文件和第一关系文件；根据所述第一点文件和所述第一关系文件，构建网络模型；根据所述网络模型，获得第一客户的网络特征信息；根据所述第一客户的网络特征信息，获得所述第一客户的风险传导系数；根据所述第一客户的风险传导系数，对所述第一客户的风险进行分析。

另一方面，本申请还提供了一种客户网络特征的标签传播算法的风险识别系统，所述系统包括：第一获得单元，所述第一获得单元用于获得历史客户数据信息；第一处理单元，所述第一处理单元用于对所述历史客户数据信息进行预处理；第二获得单元，所述第二获得单元用于根据所述预处理后的所述历史客户数据信息，获得账户级资金交易表和客户级资金交易表；第三获得单元，所述第三获得单元用于根据所述账户级资金交易表和所述客户级资金交易表，获得第一点文件和第一关系文件；第一操作单元，所述第一操作单元用于根据所述第一点文件和所述第一关系文件，构建网络模型；第四获得单元，所述第四获得单元用于根据所述网络模型，获得第一客户的网络特征信息；第五获得单元，所述第五获得单元用于根据所述第一客户的网络特征信息，获得所述第一客户的风险传导系数；第一分析单元，所述第一分析单元用于根据所述第一客户的风险传导系数，对所述第一客户的风险进行分析。

第三方面，本发明提供了一种客户网络特征的标签传播算法的风险识别系统，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，所述处理器执行所述程序时实现第一方面所述方法的步骤。

本申请实施例中提供的一个或多个技术方案，至少具有如下技术效果或优点：

由于采用了通过获得历史客户数据信息并对这些数据进行预处理，再根据所述预处理后的所述历史客户数据信息，获得账户级资金交易表和客户级资金交易表，从而获得第一点文件和第一关系文件，以此构建网络模型，进行数据训练以获得第一客户的网络特征信息，从而得到所述风险传导系数，利用所述风险传导系数改进标签传播算法，再对所述第一客户的风险进行分析的方式，达到了充分结合客户的网络特征并完全适用于大数据体量，实现科学、有效、准确的风险识别方法的技术效果。

上述说明仅是本申请技术方案的概述，为了能够更清楚了解本申请的技术手段，而可依照说明书的内容予以实施，并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂，以下特举本申请的具体实施方式。

附图说明

图1为本申请实施例一种客户网络特征的标签传播算法的风险识别方法的流程示意图；

图2为本申请实施例一种客户网络特征的标签传播算法的风险识别系统的结构示意图；

图3为本申请实施例示例性电子设备的结构示意图。

附图标记说明：第一获得单元11，第一处理单元12，第二获得单元13，第三获得单元14，第一操作单元15，第四获得单元16，第五获得单元17，第一分析单元18，总线300，接收器301，处理器302，发送器303，存储器304，总线接口306。

具体实施方式

本申请实施例通过提供一种客户网络特征的标签传播算法的风险识别方法及系统，解决了现有技术中存在风险识别中对存在风险的客户识别率低，且运用方法具有明显不足和局限性的技术问题，达到了充分结合客户的网络特征并完全适用于大数据体量，实现科学、有效、准确的风险识别方法的技术效果。下面，将参考附图详细的描述根据本申请的示例实施例。显然，所描述的实施例仅是本申请的一部分实施例，而不是本申请的全部实施例，应理解，本申请不受这里描述的示例实施例的限制。

申请概述

随着金融科技的发展，金融行业中不断涌现出各种各样新的形态，各类金融风险案件呈现频发、高发态势，为银行业的正常运营带来巨大挑战。但是，目前传统的案件识别方式在使用过程中弊端日益凸显，在严峻的金融风险形势背景下，如何对金融风险案件进行有效识别、防控，成为银行业一个亟需解决的问题，但现有技术中存在风险识别中对存在风险的客户识别率低，且运用方法具有明显不足和局限性的技术问题。

针对上述技术问题，本申请提供的技术方案总体思路如下：

本申请实施例提供了一种客户网络特征的标签传播算法的风险识别方法，所述方法包括：获得历史客户数据信息；对所述历史客户数据信息进行预处理；根据所述预处理后的所述历史客户数据信息，获得账户级资金交易表和客户级资金交易表；根据所述账户级资金交易表和所述客户级资金交易表，获得第一点文件和第一关系文件；根据所述第一点文件和所述第一关系文件，构建网络模型；根据所述网络模型，获得第一客户的网络特征信息；根据所述第一客户的网络特征信息，获得所述第一客户的风险传导系数；根据所述第一客户的风险传导系数，对所述第一客户的风险进行分析。

在介绍了本申请基本原理后，下面将结合说明书附图来具体介绍本申请的各种非限制性的实施方式。

实施例一

如图1所示，本申请实施例提供了一种客户网络特征的标签传播算法的风险识别方法，其中，所述方法包括：

步骤S100：获得历史客户数据信息；

具体而言，所述历史客户数据信息是指数据仓库中近几年公司客户的活期交易明细数据和行内近几年沉淀的黑名单公司客户数据。进一步而言，活期交易明细数据具体包括主体客户账号、主体客户名称、对手客户账号、对手客户名称、交易类型、交易借贷标志、交易金额、交易时间、交易机构等字段信息。

步骤S200：对所述历史客户数据信息进行预处理；

具体而言，对所述历史客户数据信息进行预处理是指对提取到的所述历史客户数据信息进行分类或分组前作出的审核、筛选、标识等必要的处理，有利于提高计算机的运算速度，提高了本系统进行数据挖掘模式的质量。

步骤S300：根据所述预处理后的所述历史客户数据信息，获得账户级资金交易表和客户级资金交易表；

具体而言，所述账户级资金交易表是由主体客户账号、主体客户名称、主体客户标识、对手客户账号、对手客户名称、对手客户标识、交易借贷标志、累计交易笔数、累计交易金额这九个部分构成。所述客户级资金交易表是在账户级资金交易表的基础上，根据交易信贷标志调整主体客户与对手客户位置按照借方与贷方进行汇总，具体是由借方客户名称、借方客户标识、贷方客户名称、贷方客户标识、累计交易笔数、累计交易金额这六个部分构成，其中，生成所述账户级资金交易表和客户级资金交易表，是对所述预处理过的数据分别以账户、客户为粒度进行的汇总，因此表格的获取具有较大整合性。

步骤S400：根据所述账户级资金交易表和所述客户级资金交易表，获得第一点文件和第一关系文件；

具体而言，所述第一点文件是指生成由借方客户和贷方客户构成的点文件，具体包括客户名称和客户标识信息，所述第一关系文件是指将客户级资金交易表作为关系文件。

步骤S500：根据所述第一点文件和所述第一关系文件，构建网络模型；

步骤S600：根据所述网络模型，获得第一客户的网络特征信息；

具体而言，所述网络特征信息是指客户的身份信息，所述网络模型是指根据所述第一点文件和所述第一关系文件构建的网络拓扑结构模型，通过构建所述网络模型，能够准确获得所述第一客户的所述网络特征信息，进而为之后的风险等级识别提供信息基础，达到了充分结合客户的网络特征的科学、有效的风险识别。

步骤S700：根据所述第一客户的网络特征信息，获得所述第一客户的风险传导系数；

步骤S800：根据所述第一客户的风险传导系数，对所述第一客户的风险进行分析。

具体而言，在现实网络中各个节点的影响力大小和风险传播能力并不相同，风险性大的节点通常更容易影响到与其联系比较紧密的节点，因此，计算所述第一客户的风险传导系数所采用的公式为：

其中，cust_ident(i)为所述网络模型中节点i的客户身份；cust_ident(j)为所述网络模型中节点j的客户身份；P(i→j)表示为所述第一客户的风险传导系数。由于所述第一客户的身份对不同节点间的传播能力也不同，经上述公式的计算，获得所述第一客户对应的风险传导系数，基于各个节点影响程度的大小进行计算，并且结合了客户身份对不同节点间传播能力不同的方式，采取加入所述风险传导系数的标签传播算法的改进方式，再通过改进后的标签传播算法对所述第一客户的风险进行分析，达到了具有针对性和准确性的分析方式，并实现科学、有效、准确的风险识别方法的技术效果。

进一步而言，其中，所述对所述历史客户数据信息进行预处理，本申请实施例步骤S200还包括：

步骤S210：根据所述历史客户数据信息，获得主体客户名称和对手客户名称；

步骤S220：判断所述主体客户名称和对手客户名称是否存在空值和/或异常信息；

步骤S230：如果所述主体客户名称和对手客户名称存在空值和/或异常信息，判断所述主体客户名称和对手客户名称存在空值和/或异常信息是否可修复；

步骤S240：如果所述主体客户名称和对手客户名称存在空值和/或异常信息不可修复，获得第一删除指令；

步骤S250：根据所述第一删除指令，对所述主体客户名称和对手客户名称进行删除；

步骤S260：如果所述主体客户名称和对手客户名称存在空值和/或异常信息可修复，获得第一指令；

步骤S270：根据所述第一指令，对所述主体客户名称和对手客户名称进行处理。

具体而言，所述第一指令是指对所述主体客户名称和对手客户名称进行空格和/或全半角转化处理，其中，对所述历史客户数据信息进行预处理，将某些不符合要求的数据或有明显错误的数据予以剔除。进一步而言，针对主体客户名称和对手客户名称是否存在空值或明显地异常进行判断，若存在空值或者异常且无法修复的则做剔除处理，若异常且可修复，则做去空格、全半角转化等处理方法。

进一步而言，所述对所述历史客户数据信息进行预处理，本申请实施例步骤S200还包括：

步骤S280：获得预定客户类别；

步骤S290：根据所述预定客户类别，剔除所述历史客户数据中的预定客户类别的数据信息。

具体而言，所述预定客户类别是指预先设定的不进行客户风险识别的客户类别，包括政府类、学校类、金融类等。根据所述预定客户类别，剔除主体或对手的所述预定客户类别的客户，其中还需要剔除对手为个人的客户。总的来说，本部分的预处理过程是将符合某种特定条件的数据筛选出来，对不符合特定条件的数据予以剔除的实现过程，实现了获得有效、准确、针对性强的数据。

进一步而言，所述根据所述网络模型，获得第一客户的网络特征信息，本申请实施例步骤S600还包括：

步骤S610：获得第一标识信息；

步骤S620：根据所述第一标识信息，获得所述第一标识信息的多个上游关联标识信息，其中，所述多个上游关联标识信息与所述第一标识信息的关联度逐级递减；

步骤S630：根据所述第一标识信息，获得所述第一标识信息的多个下游关联标识信息，其中，所述多个下游关联标识信息与所述第一标识信息的关联度逐级递减；

步骤S640：判断所述第一客户是否具有所述第一标识信息、多个上游关联标识信息以及多个下游关联标识信息；

步骤S650：如果所述第一客户不具有所述第一标识信息、多个上游关联标识信息以及多个下游关联标识信息，确定所述第一客户在所述网络模型中无网络特征信息；

步骤S660：如果所述第一客户具有所述第一标识信息、多个上游关联标识信息以及多个下游关联标识信息中的一个或多个，采取基数度量法为每种标识赋予风险影响值，获得所述第一客户的网络特征信息。

具体而言，所述上游关联标识信息是指标识其他客户与黑名单客户之间相关联系程度的上游标识信息；所述下游关联标识信息是指标识其他客户与黑名单客户之间相关联系程度的下游标识信息。考虑黑名单客户的高风险性并结合连接黑名单客户与其它客户之间最短路径值越大、相互关联性越弱的特点，重点判断是否具有上、下游的交易行为的标识信息，进而获得客户的身份信息。由于客户之间错综复杂的交易使得网络中的客户可能无身份即无网络特征信息，也可能持有多个身份，因此，对于客户在网络中可能持有多个身份的情况还需要采取基数度量法为每种标识赋予风险影响值，对所述第一客户的身份信息做出风险评估。达到了充分结合客户的网络特征并完全适用于大数据体量，实现科学、有效、准确的风险识别方法的技术效果。

进一步而言，其中，所述根据所述第一客户的风险传导系数，对所述第一客户的风险进行分析，本申请实施例步骤S800还包括：

步骤S810：获得第一标签传播算法；

步骤S820：将所述风险传导系数加入所述第一标签传播算法获得第二标签标签传播算法；

步骤S830：根据所述第二标签传播算法，对所述网络模型进行划分，获得多个子网络模型；

步骤S840：分别对每个所述子网络模型进行分析，判断所述子网络模型中是否包含具有所述第一标识信息的客户；

步骤S850：如果所述子网络模型中不包含具有所述第一标识信息的客户，确定所述子网络模型为无风险网络模型。

具体而言，所述第一标签传播算法是一种半监督学习方法，用已标记的节点的信息预测未标记节点的标签信息，所述第二标签传播算法是指将所述风险传导系数加入所述第一标签传播算法后获得的改进算法，相比于所述第一标签传播算法引入不同传播能力的风险传导系数，增加了风险识别的特征性和准确性，再根据所述第二标签传播算法将整个节点网络划分成的多个子网络。其中，所述第一标识信息是指标识具有黑名单客户的信息，再判断所述子网络模型中是否包含黑名单客户，如果所述子网络模型中不包含黑名单客户，从而确定所述子网络模型为无风险网络模型。

进一步而言，其中，所述判断所述子网络模型中是否包含具有所述第一标识信息的客户之后，本申请实施例步骤S840还包括：

步骤S841：如果所述子网络模型中包含具有所述第一标识信息的客户，获得预定数量阈值；

步骤S842：判断所述子网络模型的客户数量与所述预定数量阈值的大小关系；

步骤S843：如果所述子网络模型的客户数量小于等于所述预定数量阈值，判断所述子网络模型中具有所述第一标识信息的客户数量是否超出第二数量阈值；

步骤S844：如果所述子网络模型中具有所述第一标识信息的客户数量超出第二数量阈值，确定所述子网络模型为高风险网络模型；

步骤S845：如果所述子网络模型中具有所述第一标识信息的客户数量未超出第二数量阈值，确定所述子网络模型为低风险网络模型；

步骤S846：如果所述子网络模型的客户数量大于所述预定数量阈值，根据所述第二标签传播算法，对所述子网络模型进行划分。

具体而言，所述预定数量阈值是指提前设定的所述客户总数的数量阈值；所述第二数量阈值是指客户总数中提前设定的黑名单客户数量阈值。其中，判断所述子网络模型中是否包含具有所述第一标识信息的客户之后，若社团网络中包含黑名单客户时，则根据该子社团网络中的黑名单客户数量和总客户数做进一步分析，若总客户数小于等于事先设定的客户总数，且黑名单客户数量超出提前设定的黑名单数量阈值，则识别结果为高风险；若黑名单客户数量未超出提前设定的黑名单数量阈值，则识别结果为低风险。

综上所述，本申请实施例所提供的一种客户网络特征的标签传播算法的风险识别方法及系统具有如下技术效果：

1、由于采用了通过获得历史客户数据信息并对这些数据进行预处理，再根据所述预处理后的所述历史客户数据信息，获得账户级资金交易表和客户级资金交易表，从而获得第一点文件和第一关系文件，以此构建网络模型，进行数据训练以获得第一客户的网络特征信息，从而得到所述风险传导系数，利用所述风险传导系数改进标签传播算法，再对所述第一客户的风险进行分析的方式，达到了充分结合客户的网络特征并完全适用于大数据体量，实现科学、有效、准确的风险识别方法的技术效果。

2、由于采用了综合考虑黑名单客户的高风险性并结合连接黑名单客户与其它客户之间最短路径值越大、相互关联性越弱的特点，找到一种既能充分结合客户的网络特征又完全适用于大数据体量的风险识别方法。并且考虑客户交易的网络特征，并定义了标签传播能力，并且对传统的标签传播算法进行了改进，识别高风险客户。在当前金融安全问题多变、异常交易隐蔽、数据体量庞大的复杂金融环境下，很好地弥补了目前运用方法的不足与局限性，达到了科学、有效、准确的风险识别方法的技术效果。

实施例二

基于与前述实施例中一种客户网络特征的标签传播算法的风险识别方法同样发明构思，本发明还提供了一种客户网络特征的标签传播算法的风险识别系统，如图2所示，所述系统包括：

第一获得单元11，所述第一获得单元11用于获得历史客户数据信息；

第一处理单元12，所述第一处理单元12用于对所述历史客户数据信息进行预处理；

第二获得单元13，所述第二获得单元13用于根据所述预处理后的所述历史客户数据信息，获得账户级资金交易表和客户级资金交易表；

第三获得单元14，所述第三获得单元14用于根据所述账户级资金交易表和所述客户级资金交易表，获得第一点文件和第一关系文件；

第一操作单元15，所述第一操作单元15用于根据所述第一点文件和所述第一关系文件，构建网络模型；

第四获得单元16，所述第四获得单元16用于根据所述网络模型，获得第一客户的网络特征信息；

第五获得单元17，所述第五获得单元17用于根据所述第一客户的网络特征信息，获得所述第一客户的风险传导系数；

第一分析单元18，所述第一分析单元18用于根据所述第一客户的风险传导系数，对所述第一客户的风险进行分析。

进一步的，所述系统还包括：

第六获得单元，所述第六获得单元用于根据所述历史客户数据信息，获得主体客户名称和对手客户名称；

第一判断单元，所述第一判断单元用于判断所述主体客户名称和对手客户名称是否存在空值和/或异常信息；

第二判断单元，所述第二判断单元用于如果所述主体客户名称和对手客户名称存在空值和/或异常信息，判断所述主体客户名称和对手客户名称存在空值和/或异常信息是否可修复；

第七获得单元，所述第七获得单元用于如果所述主体客户名称和对手客户名称存在空值和/或异常信息不可修复，获得第一删除指令；

第一删除单元，所述第一删除单元用于根据所述第一删除指令，对所述主体客户名称和对手客户名称进行删除；

第八获得单元，所述第八获得单元用于如果所述主体客户名称和对手客户名称存在空值和/或异常信息可修复，获得第一指令；

第二处理单元，所述第二处理单元用于根据所述第一指令，对所述主体客户名称和对手客户名称进行处理。

进一步的，所述系统还包括：

第九获得单元，所述第九获得单元用于获得预定客户类别；

第二删除单元，所述第二删除单元用于根据所述预定客户类别，剔除所述历史客户数据中的预定客户类别的数据信息。

进一步的，所述系统还包括：

第十获得单元，所述第十获得单元用于获得第一标识信息；

第十一获得单元，所述第十一获得单元用于根据所述第一标识信息，获得所述第一标识信息的多个上游关联标识信息，其中，所述多个上游关联标识信息与所述第一标识信息的关联度逐级递减；

第十二获得单元，所述第十二获得单元用于根据所述第一标识信息，获得所述第一标识信息的多个下游关联标识信息，其中，所述多个下游关联标识信息与所述第一标识信息的关联度逐级递减；

第三判断单元，所述第三判断单元用于判断所述第一客户是否具有所述第一标识信息、多个上游关联标识信息以及多个下游关联标识信息；

第十三获得单元，所述第十三获得单元用于如果所述第一客户不具有所述第一标识信息、多个上游关联标识信息以及多个下游关联标识信息，确定所述第一客户在所述网络模型中无网络特征信息；

第十四获得单元，所述第十四获得单元用于如果所述第一客户具有所述第一标识信息、多个上游关联标识信息以及多个下游关联标识信息中的一个或多个，采取基数度量法为每种标识赋予风险影响值，获得所述第一客户的网络特征信息。

进一步的，所述系统还包括：

第十五获得单元，所述第十五获得单元用于获得第一标签传播算法；

第三处理单元，所述第三处理单元用于将所述风险传导系数加入所述第一标签传播算法获得第二标签标签传播算法；

第十六获得单元，所述第十六获得单元用于根据所述第二标签传播算法，对所述网络模型进行划分，获得多个子网络模型；

第四判断单元，所述第四判断单元用于分别对每个所述子网络模型进行分析，判断所述子网络模型中是否包含具有所述第一标识信息的客户；

第十七获得单元，所述第十七获得单元用于如果所述子网络模型中不包含具有所述第一标识信息的客户，确定所述子网络模型为无风险网络模型。

进一步的，所述系统还包括：

第十八获得单元，所述第十八获得单元用于如果所述子网络模型中包含具有所述第一标识信息的客户，获得预定数量阈值；

第五判断单元，所述第五判断单元用于判断所述子网络模型的客户数量与所述预定数量阈值的大小关系；

第六判断单元，所述第六判断单元用于如果所述子网络模型的客户数量小于等于所述预定数量阈值，判断所述子网络模型中具有所述第一标识信息的客户数量是否超出第二数量阈值；

第十九获得单元，所述第十九获得单元用于如果所述子网络模型中具有所述第一标识信息的客户数量超出第二数量阈值，确定所述子网络模型为高风险网络模型；

第二十获得单元，所述第二十获得单元用于如果所述子网络模型中具有所述第一标识信息的客户数量未超出第二数量阈值，确定所述子网络模型为低风险网络模型；

第一划分单元，所述第一划分单元用于如果所述子网络模型的客户数量大于所述预定数量阈值，根据所述第二标签传播算法，对所述子网络模型进行划分。

前述图1实施例一中的一种客户网络特征的标签传播算法的风险识别方法的各种变化方式和具体实例同样适用于本实施例的一种客户网络特征的标签传播算法的风险识别系统，通过前述对一种客户网络特征的标签传播算法的风险识别方法的详细描述，本领域技术人员可以清楚的知道本实施例中一种客户网络特征的标签传播算法的风险识别系统的实施方法，所以为了说明书的简洁，在此不再详述。

示例性电子设备

下面参考图3来描述本申请实施例的电子设备。

图3图示了根据本申请实施例的电子设备的结构示意图。

基于与前述实施例中一种客户网络特征的标签传播算法的风险识别方法的发明构思，本发明还提供一种客户网络特征的标签传播算法的风险识别系统，其上存储有计算机程序，该程序被处理器执行时实现前文所述一种客户网络特征的标签传播算法的风险识别方法的任一方法的步骤。

其中，在图3中，总线架构(用总线300来代表)，总线300可以包括任意数量的互联的总线和桥，总线300将包括由处理器302代表的一个或多个处理器和存储器304代表的存储器的各种电路链接在一起。总线300还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起，这些都是本领域所公知的，因此，本文不再对其进行进一步描述。总线接口306在总线300和接收器301和发送器303之间提供接口。接收器301和发送器303可以是同一个元件，即收发机，提供用于在传输介质上与各种其他系统通信的单元。

处理器302负责管理总线300和通常的处理，而存储器304可以被用于存储处理器302在执行操作时所使用的数据。

本发明实施例提供的一种客户网络特征的标签传播算法的风险识别方法，所述方法包括：获得历史客户数据信息；对所述历史客户数据信息进行预处理；根据所述预处理后的所述历史客户数据信息，获得账户级资金交易表和客户级资金交易表；根据所述账户级资金交易表和所述客户级资金交易表，获得第一点文件和第一关系文件；根据所述第一点文件和所述第一关系文件，构建网络模型；根据所述网络模型，获得第一客户的网络特征信息；根据所述第一客户的网络特征信息，获得所述第一客户的风险传导系数；根据所述第一客户的风险传导系数，对所述第一客户的风险进行分析。解决了现有技术中存在风险识别中对存在风险的客户识别率低，且运用方法具有明显不足和局限性的技术问题，达到了充分结合客户的网络特征并完全适用于大数据体量，实现科学、有效、准确的风险识别方法的技术效果。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的系统。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令系统的制造品，该指令系统实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种客户网络特征的标签传播算法的风险识别方法，其中，所述方法包括：

获得历史客户数据信息；

对所述历史客户数据信息进行预处理；

根据所述预处理后的所述历史客户数据信息，获得账户级资金交易表和客户级资金交易表；

根据所述账户级资金交易表和所述客户级资金交易表，获得第一点文件和第一关系文件；

根据所述第一点文件和所述第一关系文件，构建网络模型；

根据所述网络模型，获得第一客户的网络特征信息；

根据所述第一客户的网络特征信息，获得所述第一客户的风险传导系数；

根据所述第一客户的风险传导系数，对所述第一客户的风险进行分析。

2.如权利要求1所述的方法，其中，所述对所述历史客户数据信息进行预处理，包括：

根据所述历史客户数据信息，获得主体客户名称和对手客户名称；

判断所述主体客户名称和对手客户名称是否存在空值和/或异常信息；

如果所述主体客户名称和对手客户名称存在空值和/或异常信息，判断所述主体客户名称和对手客户名称存在空值和/或异常信息是否可修复；

如果所述主体客户名称和对手客户名称存在空值和/或异常信息不可修复，获得第一删除指令；

根据所述第一删除指令，对所述主体客户名称和对手客户名称进行删除；

如果所述主体客户名称和对手客户名称存在空值和/或异常信息可修复，获得第一指令；

根据所述第一指令，对所述主体客户名称和对手客户名称进行处理。

3.如权利要求1所述的方法，其中，所述对所述历史客户数据信息进行预处理，包括：

获得预定客户类别；

根据所述预定客户类别，剔除所述历史客户数据中的预定客户类别的数据信息。

4.如权利要求1所述的方法，其中，所述根据所述网络模型，获得第一客户的网络特征信息，包括：

获得第一标识信息；

根据所述第一标识信息，获得所述第一标识信息的多个上游关联标识信息，其中，所述多个上游关联标识信息与所述第一标识信息的关联度逐级递减；

根据所述第一标识信息，获得所述第一标识信息的多个下游关联标识信息，其中，所述多个下游关联标识信息与所述第一标识信息的关联度逐级递减；

判断所述第一客户是否具有所述第一标识信息、多个上游关联标识信息以及多个下游关联标识信息；

如果所述第一客户不具有所述第一标识信息、多个上游关联标识信息以及多个下游关联标识信息，确定所述第一客户在所述网络模型中无网络特征信息；

如果所述第一客户具有所述第一标识信息、多个上游关联标识信息以及多个下游关联标识信息中的一个或多个，采取基数度量法为每种标识赋予风险影响值，获得所述第一客户的网络特征信息。

5.如权利要求1所述的方法，其中，所述根据所述第一客户的网络特征信息，获得所述第一客户的风险传导系数，包括：

其中，cust_ident(i)为所述网络模型中节点i的客户身份；

cust_ident(j)为所述网络模型中节点j的客户身份；

P(i→j)表示为所述第一客户的风险传导系数。

6.如权利要求4所述的方法，其中，所述根据所述第一客户的风险传导系数，对所述第一客户的风险进行分析，包括：

获得第一标签传播算法；

将所述风险传导系数加入所述第一标签传播算法获得第二标签传播算法；

根据所述第二标签传播算法，对所述网络模型进行划分，获得多个子网络模型；

分别对每个所述子网络模型进行分析，判断所述子网络模型中是否包含具有所述第一标识信息的客户；

如果所述子网络模型中不包含具有所述第一标识信息的客户，确定所述子网络模型为无风险网络模型。

7.如权利要求6所述的方法，其中，所述判断所述子网络模型中是否包含具有所述第一标识信息的客户之后，包括：

如果所述子网络模型中包含具有所述第一标识信息的客户，获得预定数量阈值；

判断所述子网络模型的客户数量与所述预定数量阈值的大小关系；

如果所述子网络模型的客户数量小于等于所述预定数量阈值，判断所述子网络模型中具有所述第一标识信息的客户数量是否超出第二数量阈值；

如果所述子网络模型中具有所述第一标识信息的客户数量超出第二数量阈值，确定所述子网络模型为高风险网络模型；

如果所述子网络模型中具有所述第一标识信息的客户数量未超出第二数量阈值，确定所述子网络模型为低风险网络模型；

如果所述子网络模型的客户数量大于所述预定数量阈值，根据所述第二标签传播算法，对所述子网络模型进行划分。

8.一种客户网络特征的标签传播算法的风险识别系统，其中，所述系统包括：

第一获得单元，所述第一获得单元用于获得历史客户数据信息；

第一处理单元，所述第一处理单元用于对所述历史客户数据信息进行预处理；

第二获得单元，所述第二获得单元用于根据所述预处理后的所述历史客户数据信息，获得账户级资金交易表和客户级资金交易表；

第三获得单元，所述第三获得单元用于根据所述账户级资金交易表和所述客户级资金交易表，获得第一点文件和第一关系文件；

第一操作单元，所述第一操作单元用于根据所述第一点文件和所述第一关系文件，构建网络模型；

第四获得单元，所述第四获得单元用于根据所述网络模型，获得第一客户的网络特征信息；

第五获得单元，所述第五获得单元用于根据所述第一客户的网络特征信息，获得所述第一客户的风险传导系数；

第一分析单元，所述第一分析单元用于根据所述第一客户的风险传导系数，对所述第一客户的风险进行分析。

9.一种客户网络特征的标签传播算法的风险识别系统，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，所述处理器执行所述程序时实现权利要求1-7任一项所述方法的步骤。