CN117132383A - 一种信贷数据处理方法、装置、设备及可读存储介质 - Google Patents

一种信贷数据处理方法、装置、设备及可读存储介质 Download PDF

Info

Publication number
CN117132383A
CN117132383A CN202310906802.8A CN202310906802A CN117132383A CN 117132383 A CN117132383 A CN 117132383A CN 202310906802 A CN202310906802 A CN 202310906802A CN 117132383 A CN117132383 A CN 117132383A
Authority
CN
China
Prior art keywords
credit
data
model
standard
evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310906802.8A
Other languages
English (en)
Inventor
陈思
赵彦晖
耿心伟
曾源
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Weizhong Credit Technology Co ltd
Original Assignee
Shenzhen Weizhong Credit Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Weizhong Credit Technology Co ltd filed Critical Shenzhen Weizhong Credit Technology Co ltd
Priority to CN202310906802.8A priority Critical patent/CN117132383A/zh
Publication of CN117132383A publication Critical patent/CN117132383A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N10/00Quantum computing, i.e. information processing based on quantum-mechanical phenomena
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Business, Economics & Management (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Accounting & Taxation (AREA)
  • Mathematical Analysis (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Finance (AREA)
  • Mathematical Optimization (AREA)
  • Fuzzy Systems (AREA)
  • Computational Mathematics (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Condensed Matter Physics & Semiconductors (AREA)
  • Quality & Reliability (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Algebra (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本申请公开了一种信贷数据处理方法、装置、设备及可读存储介质,该方法包括接收授信请求,并获取请求方的原始信贷数据;对原始信贷数据进行标准化处理,得到标准数据;利用信用综合评估模型,对标准数据进行评估,得到信用评估数据;在审批规则库中查询信用评估数据,得到信贷数据处理结果。在本申请中,基于信用评估模型和审批规则库中的审批规则,能够自动进行信贷决策和审批,可提高审批效率和一致性。此外,输入信用综合评估模型的数据为标准数据,可以使得模型更容易对信贷数据进行特征提取,可以提高模型的预测能力和效果,使得最终的信贷数据处理结果更为可靠。

Description

一种信贷数据处理方法、装置、设备及可读存储介质
技术领域
本申请涉及安全技术领域,特别是涉及一种信贷数据处理方法、装置、设备及可读存储介质。
背景技术
随着互联网和大数据技术的不断发展,企业信贷行业面临着越来越多的挑战和机遇。信贷(credit)是指以偿还和付息为条件的价值运动形式。
传统的,人工信贷审批方法在面对大量的信贷数据和复杂的风险情况时存在效率低下、准确性不高的问题。具体的,传统信贷额度以及信贷利率的确定依赖于人工审核,用户提交贷款申请后,一方面银行等出借方要耗费大量的人力物力进行资料审查、背调走访等,同时针对用户贷款额度的修正也往往凭借相关行业经验进行,难以根据用户的信用资质实现自动化、个性化、合理化的风险定价,另一方面个人用户/法人用户等借贷方从提交信贷申请到获得审批结果往往要耗费数周,体验极差。
目前,智能风控技术可以全面衡量用户的信贷风险控制,从而替代人工审核,但是光改进审核这一环节,仍然无法彻底改进信贷审批流程的缺陷问题。
因此,如何实现自动化信贷审批等问题,是本领域技术人员急需解决的技术问题。
发明内容
本申请的目的是提供一种信贷数据处理方法、装置、设备及可读存储介质,能够实现高效且可靠的自动化信贷审批。
为解决上述技术问题,本申请提供如下技术方案:
一种信贷数据处理方法,包括:
接收授信请求,并获取请求方的原始信贷数据;
对所述原始信贷数据进行标准化处理,得到标准数据;
利用信用综合评估模型,对所述标准数据进行评估,得到信用评估数据;
在审批规则库中查询所述信用评估数据,得到信贷数据处理结果。
优选地,利用信用综合评估模型,对所述标准数据进行评估,得到信用评估数据,包括:
对所述标准数据进行反欺诈验证;
若验证通过,则利用所述信用综合评估模型,对所述标准数据进行评估,得到所述信用评估数据;
若验证未通过,则确定所述信贷数据处理结果为拒绝授信。
优选地,对所述标准数据进行反欺诈验证,包括:
判断所述标准数据是否命中欺诈规则库中的欺诈规则;
如果是,则确定验证未通过;
如果否,则利用反欺诈模型对所述标准数据进行评分,若输出反欺诈评分低于反欺诈阈值,则确定通过验证,若所述反欺诈评分高于或等于所述反欺诈阈值,则确定验证未通过。
优选地,利用信用评估模型,对所述标准数据进行评估,得到信用评估数据,包括:
将所述标准数据输入至集成有信用评分卡模型、信用等级模型和风险分类模型的信用综合评估模型,对所述标准数据进行评估,得到包括信用评分数据、信用等级数据和风险分类数据的信用评估数据。
优选地,对所述原始信贷数据进行标准化处理,得到标准数据,包括:
去除所述原始信贷数据去除异常值、重复值、无效值,并填补缺失数据,清洗数据;
对所述清洗数据进行去噪、修复和降维处理,得到所述标准数据。
优选地,获取请求方的原始信贷数据,包括:
获取所述请求方的文本信贷数据和/或图像信贷数据;
利用自然语言处理算法,从所述文本信贷数据中提取所述标准数据;
利用计算机视觉处理算法,从所述图像信贷数据中提取所述标准数据。
优选地,在审批规则库中查询所述信用评估数据,得到信贷数据处理结果之后,还包括:
获取所述信贷数据处理结果对应的反馈数据;
将所述反馈数据作为所述标准数据的标签,得到修正样本;
利用所述修正样本对所述信用综合评估模型和/或所述审批规则库进行更新。
一种信贷数据处理装置,包括:
数据收集与整理模块,用于接收授信请求,并获取请求方的原始信贷数据;对所述原始信贷数据进行标准化处理,得到标准数据;
信用评估模块,用于利用信用综合评估模型,对所述标准数据进行评估,得到信用评估数据;
自动化决策与审批模块,用于在审批规则库中查询所述信用评估数据,得到信贷数据处理结果。
一种电子设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现上述信贷数据处理方法的步骤。
一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述信贷数据处理方法的步骤。
应用本申请实施例所提供的方法,接收授信请求,并获取请求方的原始信贷数据;对原始信贷数据进行标准化处理,得到标准数据;利用信用综合评估模型,对标准数据进行评估,得到信用评估数据;在审批规则库中查询信用评估数据,得到信贷数据处理结果。
在本申请中,当接收到授信请求之后,获取到请求方的原始信贷数据。然后,对该原始信贷数据进行标准化处理,从而得到便于模型识别处理的标准数据。利用信用综合评估模型对标准数据进行评估,从而得到信用评估数据。然后,在审批规则库中查询该信用评估数据,即可获得信贷数据处理结果。也就是说,在本申请中,基于信用评估模型和审批规则库中的审批规则,能够自动进行信贷决策和审批,可提高审批效率和一致性。此外,输入信用综合评估模型的数据为标准数据,可以使得模型更容易对信贷数据进行特征提取,可以提高模型的预测能力和效果,使得最终的信贷数据处理结果更为可靠。
相应地,本申请实施例还提供了与上述信贷数据处理方法相对应的信贷数据处理装置、设备和可读存储介质,具有上述技术效果,在此不再赘述。
附图说明
为了更清楚地说明本申请实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例中一种信贷数据处理方法的实施流程图;
图2为本申请实施例中一种信贷数据处理装置的结构示意图;
图3为本申请实施例中一种电子设备的结构示意图;
图4为本申请实施例中一种电子设备的具体结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面结合附图和具体实施方式对本申请作进一步的详细说明。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参考图1,图1为本申请实施例中一种信贷数据处理方法的流程图,该方法可应用于风控系统(例如企业信贷智能风控系统)中,该方法包括以下步骤:
S101、接收授信请求,并获取请求方的原始信贷数据。
其中,原始信贷数据可以具体为图像格式与信贷相关数据,也可以为文本格式与信贷相关数据,也可以为视频格式与信贷相关数据,当然,还可以为其他常见的数据格式,如网页数据等。在本申请实施例中,对原始信贷数据的数据格式本身不做限定。
请求方即被评客户,可以具体为个人,也可以为公司/企业等。
原始信贷数据的数据内容即为与信贷相关的数据,例如,消费分期平台提供的被评客户的个人基本信息,包括年龄、性别、手机号等信息,此部分信息为可以为待评客户主动提供信息;第三方企业信用评级机构通过自身的专业技术进行网络数据爬虫,获取该公司的一些其他相关信息;根据被评客户签订授权同意书,从银行获取被评客户个人征信报告;将以上通过各种渠道获取的信息作为该被评客户的原始数据信息。
在本申请中的一种具体实施方式中,获取请求方的原始信贷数据,包括:
获取请求方的文本信贷数据和/或图像信贷数据;
利用自然语言处理算法,从文本信贷数据中提取标准数据;
利用计算机视觉处理算法,从图像信贷数据中提取标准数据。
为便于描述,下面将上述三个步骤结合起来进行说明。
在本申请实施例中,可以获取请求方的文本信贷数据和图像信贷数据中的至少一种。
当获取有文本信贷数据,则基于自然语言处理技术/算法,从文本信贷数据中提取标准数据;
当获取有图像信贷数据,则基于计算机视觉处理技术/算法,从图像信贷数据中提取出标准数据。在本申请实施例中,对于自然语言处理技术和计算机视觉处理技术本身并不做限定。
S102、对原始信贷数据进行标准化处理,得到标准数据。
在本申请实施例中,标准化处理可以理解为归一化处理,即将原始信贷数据进行归一化,从而得到便于模型提取特征进行预测处理的标准数据。
标准化处理可以具体为,将数据统一为特定格式,将无参考价值的数据进行剔除,对噪声等存在干扰作用的数据进行剔除,对数据进行查漏补缺等。
在本申请中的一种具体实施方式中,对原始信贷数据进行标准化处理,得到标准数据,包括:
去除原始信贷数据去除异常值、重复值、无效值,并填补缺失数据,清洗数据;
对清洗数据进行去噪、修复和降维处理,得到标准数据。
为便于描述,下面将上述两个步骤结合起来进行说明。
即,首先去除异常值、重复值、无效值,以及填补缺失数据、处理数据不一致以获得清洗数据。其中,异常值可以具体为超出常规范围的值;重复值即重复数据,无效值即无参考价值或本身即无效的值。数据不一致,即对相同事务的表述不统一。
对清洗数据进行去噪、修复和降维处理,以获得标准数据。
其中,降维处理,可以使用主成分分析法:主成分分析法是一种数学变换的方法,它把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差,称为第一主成分,第二变量的方差次大,并且和第一变量不相关,称为第二主成分。依次类推,I个变量就有I个主成分。进行主成分分析后,还可以根据需要进一步利用K-L变换(霍特林变换)对原数据进行投影变换,达到降维的目的。
S103、利用信用综合评估模型,对标准数据进行评估,得到信用评估数据。
在本申请实施例中,可以预先训练出信用综合评估模型,该信用综合评估模型可以具体为能够对标准数据进行特征提取,并基于特征数据进行信用评估的模型。具体的,该信用评估数据可以具体包括但不限于信用评分、信用等级、风险类型等。
在本申请中的一种具体实施方式中,利用信用综合评估模型,对标准数据进行评估,得到信用评估数据,包括:
对标准数据进行反欺诈验证;
若验证通过,则利用信用综合评估模型,对标准数据进行评估,得到信用评估数据;
若验证未通过,则确定信贷数据处理结果为拒绝授信。
其中,对标准数据进行反欺诈验证,包括:
判断标准数据是否命中欺诈规则库中的欺诈规则;
如果是,则确定验证未通过;
如果否,则利用反欺诈模型对标准数据进行评分,若输出反欺诈评分低于反欺诈阈值,则确定通过验证,若反欺诈评分高于或等于反欺诈阈值,则确定验证未通过。
为便于描述,下面将上述步骤结合起来进行说明。
也就是说,在本申请实施例中,在将标准数据输入到信用综合评估模型进行信用评估之前,还可以对标准数据进行反欺诈校验,从而筛掉欺诈数据。
具体的,可通过数据分析和模型识别潜在的欺诈行为,提供欺诈风险评估/检测和反欺诈措施。例如,可以使用机器学习和深度学习算法对欺诈行为进行自动识别和分类;运用图网络和关联分析技术发现欺诈行为的关联模式;结合自然语言处理技术分析欺诈风险相关的文本数据,如虚假申请材料和欺诈性报告。
运行反欺诈模型进行反欺诈验证,以输出反欺诈评分。在反欺诈验证中,根据事先设定的相应阈值θ进行判定。若经反欺诈模型处理之后的标准数据高于阈值θ,则将其标记为拒绝,并根据拒绝信息反馈直接输出可视化报告,拒绝该被评用户的授信。若经反欺诈模型处理之后的标准数据低于阈值θ,则将其标记为通过。
反欺诈验证方法可以包括:
判断标准数据是否与欺诈规则库中的预定欺诈规则一致;
若不一致,则对标准数据运行反欺诈模型以输出反欺诈评分,判断反欺诈评分是否低于阈值;
若反欺诈评分低于阈值,则将标准数据标记为通过;
标准数据与规则库中的预定规则一致,则将标准数据标记为拒绝,即确定未通过反欺诈验证;
若反欺诈评分高于阈值,则将标准数据标记为拒绝,即确定未通过反欺诈验证。
更具体地,反欺诈模型可以包括评分特征项和对应权重部分,由特征维度包含个人违规信息等多种验证项,分别赋予不同权重。权重的设定,采用自适应AHP层次分析模型输出。总反欺诈评分由各评分项与权重的乘积所得子分数项加总得来。
在本申请中的一种具体实施方式中,利用信用评估模型,对标准数据进行评估,得到信用评估数据,包括:将标准数据输入至集成有信用评分卡模型、信用等级模型和风险分类模型的信用综合评估模型,对标准数据进行评估,得到包括信用评分数据、信用等级数据和风险分类数据的信用评估数据。
即,信用综合评估模型包括信用评分卡模型、信用等级模型和风险分类模型。信用综合评估模型作为客户初始信用分确定、客户群体划分、风险预测的参照,对客户形成一个较为完整的信用评价,即获得包括信用评分数据、信用等级数据和风险分类数据的信用评估数据。
其中,信用评分卡模型包括评分特征项和对应权重部分;评分特征项中,个人数据维度包括基础信息、职业信息、资产及流水信息、信用和借贷信息、模型外调整信息;企业数据维度包括7部分,其中法人信息由5部分,企业信息由非财务评价与财务评价组成,权重的设定,采用自适应AHP层次分析模型输出,总信用分由各评分项与权重的乘积所得子分数项加总得来。
信用等级模型根据借贷历史数据集,包括贷前数据与贷后数据集,数据集中包含信用分特征,做聚类分析;从算法库中选取不少于3个聚类算法模型对数据建模,对建立的模型用留出法进行模型泛化性能检验,再对比不同模型间性能,确定最终使用的模型,并输出该模型返回结果,以每一聚类簇中信用分均值作为信用等级划分边界。
风险分类模型指对待评价对象进行还款情况预测,根据借贷历史数据集,将通过审批并还款的客户分为两类,逾期客户和正常还款客户分别标记为0、1,代表高风险与低风险客户;从算法库中选取不少于3个分类算法模型对数据建模,对建立的模型进行模型性能检验,对比不同模型间精确率、召回率,确定最终使用的模型;将训练好的模型保存在系统中;同时对于风险分类标记为1的高风险客户,回调其信用等级,下调一级;
对数据进行分类预测建模,调用封装好的随机森林算法包,从原始训练集中使用Bootstraping方法,即随机有放回采样选出m个样本,共进行n次采样,生成n个训练集;如果每个样本的特征维度为M,指定一个常数m<<M,随机地从M个特征中选取m个特征子集,每次树进行分裂时,从这m个特征中根据信息增益或信息增益比或基尼指数选择最好的特征进行分裂;
每棵树都尽最大程度的生长,在决策树的分裂过程中不需要剪枝;
将生成的多棵决策树组成随机森林;由于此次模型是分类问题,按多棵树分类器投票决定最终分类结果,此处为:相对多数投票法;
预测得票最多的标记,若同时有数个标记同票最高,随机选择一个;模型训练完毕并保存,将多个算法训练的模型进行性能对比,对比精确率、召回率、ROC以及AUC指标;确定一个最优模型,保存模型文件;
自适应AHP层次分析模型,由专家打分系统,形成矩阵传输至自适应AHP模型,模型对AHP矩阵进行第一次检查,对没有通过一致性检验的矩阵进行调整,计算偏差矩阵,对其中影响最大的矩阵元素进行微调,再返回一个新的判断矩阵,验证其是否满足一致性检验,循环以上程序直至通过,并最终输出所有评分项对应权重。
S104、在审批规则库中查询信用评估数据,得到信贷数据处理结果。
在本申请实施例中,可以预先在审批规则库中设置审批规则,得到信用评估数据之后,便可通过在审批规则库查询该信用评估数据所对应的审批规则,从而得到信贷数据处理结果。
其中,信贷数据处理结果,即对请求发的授信请求进行审批的结论。例如,自动批准、拒绝或进一步审批贷款申请。
在本申请中的一种具体实施方式中,在审批规则库中查询信用评估数据,得到信贷数据处理结果之后,还可以执行以下步骤:
获取信贷数据处理结果对应的反馈数据;
将反馈数据作为标准数据的标签,得到修正样本;
利用修正样本对信用综合评估模型和/或审批规则库进行更新。
也就是说,还可以基于当前对信贷数据的处理,以及相应的反馈数据,得到修正样本,从而基于修正样本对信用综合评估模型、审批规则库中的至少一个对象进行更新,从而使得信贷数据处理更加高效且可靠。
其中,信用综合评估模型能够实现自我迭代更新,具体包括监控新增数据是否达到定值;通过该监控,一旦新增数据达到了定值,则对该信用评价模型进行重新训练;用重新训练后的信用综合评估模型更新现有的信用综合评估模型。
信用等级模型是根据借贷历史数据集,包含贷前数据与贷后数据集,数据集中包含信用分特征,做聚类分析;从算法库中选取不少于3个聚类算法模型对数据建模,对建立的模型用留出法进行模型泛化性能检验,再对比不同模型间性能,确定最终使用的模型,并输出该模型返回结果,以每一聚类簇中信用分均值作为信用等级划分边界;
风险分类模型是指对待评价对象进行还款情况预测,根据借贷历史数据集,将通过审批并还款的客户分为两类,逾期客户和正常还款客户分别标记为0、1,代表高风险与低风险客户;从算法库中选取不少于3个分类算法模型对数据建模,对建立的模型进行模型性能检验,对比不同模型间精确率、召回率,确定最终使用的模型;将训练好的模型保存在系统中;同时对于风险分类标记为1的高风险客户,回调其信用等级,下调一级;
对数据进行分类预测建模,调用封装好的随机森林算法包,从原始训练集中使用Bootstraping方法,即随机有放回采样选出m个样本,共进行n次采样,生成n个训练集;
如果每个样本的特征维度为M,指定一个常数m<<M,随机地从M个特征中选取m个特征子集,每次树进行分裂时,从这m个特征中根据信息增益或信息增益比或基尼指数选择最好的特征进行分裂;
每棵树都尽最大程度的生长,在决策树的分裂过程中不需要剪枝;
将生成的多棵决策树组成随机森林;由于此次模型是分类问题,按多棵树分类器投票决定最终分类结果,此处为相对多数投票法;
预测为得票最多的标记,若同时有数个标记同票最高,随机选择一个;模型训练完毕并保存,将多个算法训练的模型进行性能对比,对比精确率、召回率、ROC以及AUC指标;确定一个最优模型,保存模型文件;
自适应AHP层次分析模型,由专家打分系统,形成矩阵传输至自适应AHP模型,模型对AHP矩阵进行第一次检查,对没有通过一致性检验的矩阵进行调整,计算偏差矩阵,对其中影响最大的矩阵元素进行微调,再返回一个新的判断矩阵,验证其是否满足一致性检验,循环以上程序直至通过,并最终输出所有评分项对应权重。
此外,还可监督风控系统的性能,包括模型的监控、参数的更新、规则和策略的调整,以持续优化系统的准确性和适应性。
应用本申请实施例所提供的方法,接收授信请求,并获取请求方的原始信贷数据;对原始信贷数据进行标准化处理,得到标准数据;利用信用综合评估模型,对标准数据进行评估,得到信用评估数据;在审批规则库中查询信用评估数据,得到信贷数据处理结果。
在本申请中,当接收到授信请求之后,获取到请求方的原始信贷数据。然后,对该原始信贷数据进行标准化处理,从而得到便于模型识别处理的标准数据。利用信用综合评估模型对标准数据进行评估,从而得到信用评估数据。然后,在审批规则库中查询该信用评估数据,即可获得信贷数据处理结果。也就是说,在本申请中,基于信用评估模型和审批规则库中的审批规则,能够自动进行信贷决策和审批,可提高审批效率和一致性。此外,输入信用综合评估模型的数据为标准数据,可以使得模型更容易对信贷数据进行特征提取,可以提高模型的预测能力和效果,使得最终的信贷数据处理结果更为可靠。
为便于本领域技术人员更好地理解本申请实施例所提供的信贷数据处理方法,下面在基于人工智能的企业信贷智能风控系统中实现信贷数据处理方法为例,对信贷数据处理方法进行详细说明。
从上文实施例可知,本申请旨在解决传统人工信贷审批方法效率低下、准确性不高的问题。
本申请的核心内容包括以下方面:
数据收集与整理:通过自动化技术,系统能够收集和整理大量的企业信贷数据,包括财务信息、经营状况、行业趋势等,确保数据的质量和准确性。
特征工程与选择:系统利用人工智能技术对收集到的数据进行特征提取、构建和选择,以提高模型的预测能力和效果。
模型建立与训练:系统基于深度学习和模型训练技术,建立信用评估模型,选择适当的机器学习或深度学习算法,通过对大量数据的学习和训练,提高信贷风险预测的准确性。
实时监测与预警:系统能够实时监测企业的财务状况和市场变化,检测异常情况和潜在风险,并及时发出预警通知,帮助金融机构及时应对风险。
监督与优化:系统能够监督信贷智能风控系统的性能,包括模型的监控、参数的更新、规则和策略的调整,持续优化系统的准确性和适应性。
通过上述发明内容,可在人工智能的企业信贷智能风控系统实现了信贷决策的自动化、智能化,提高了风险评估的准确性和效率,为金融机构提供了可靠的信贷决策工具,助力金融行业的发展和风险管理。
将评价对象的相关数据流程化,通过多种渠道获取被评级对象相关性数据,并不局限于被评级对象主动提供的信息;数据清洗采用多种方式进行,避免单一清洗方法造成的局限;数据建模可采用多种模型结合,选取最适合被评级对象数据特征的模型,增加评级效果的科学性;将被评级对象的分析结果进行输出,结合其他基本信息完成报表制作,最后呈现一份对被评级对象的科学合理的评级报告,该人工智能金融风控授信系统评定方法具体包括以下步骤:
根据授信请求获取被评客户的原始数据。
在本发明实施例中,根据有授信需求的平台获取被评客户,资源平台整体运作监测被评客户的原始数据信息,其来源方面可以包括:消费分期平台提供的该被评客户的个人基本信息,包括年龄、性别、手机号等信息,此部分信息为待评客户主动提供信息;第三方企业信用评级机构通过自身的专业技术进行网络数据爬虫,获取该公司的一些其他相关信息;根据被评客户签订授权同意书,从银行获取被评客户个人征信报告;将以上通过各种渠道获取的信息作为该被评客户的原始数据信息。
对原始数据执行清洗操作,清洗操作用于从所原始数据中筛选出标准数据。
在本发明实施例中,对根据授信请求而获取的被评客户的原始数据进行数据清洗,整理出该原始数据中的脏数据,以得到可直接分析的标准数据存储到数据存储数据库中。数据清洗主要针对网络数据爬虫获得的信息以及网站后台导出的数据信息,因为网络爬虫得到的信息格式多样。数据清洗操作可以包括:
剔除原始数据中的异常值、重复值、无效值、缺失值以获得过滤数据。
异常值指样本中的个别值,其数值明显偏离它(或他们)所属样本的其余观测值,也称异常数据,离群值。缺失值是指现有数据集中某个或某些属性的值是不完全的。重复值是指数据行中完全一样的数据。
对过滤数据进行去噪、修复和降维处理,以获得标准数据。
经过数据处理之后的获得可应用的标准数据,命中规则库任一预定规则,则标记为拒绝,并根据拒绝信息反馈直接输出可视化报告,拒绝该被评用户的授信。未命中规则库中的任一预定规则,则继续对通过的标准数据进行信用评价,信用评价经信用评价模型,输出针对标准数据的信用评分、信用等级。
信用评价是授信建议的核心部分,其主要目的是反馈申贷客户的风险情况。其中,信用评价模型可以包括信用评分卡模型、信用等级模型、风险分类模型等。一般的过程是:在对数据进行清洗和降维/拓展之后,所有的数据转换为表格形式,将这些表格数据灌入机器学习模型,用X表示数据,y表示标签。
如风险分类模型中,客户的年龄性别学历等一系列特征为X,是否逾期的结果为Y,其中逾期标记为0,正常还款标记为1。
把数据分成训练集和测验集两个部分,用训练集进行模型训练,测验集用来检测正确率等指标,选定算法之后,进行算法参数调整,得到最终模型。
更具体地说,例如,信用评分卡模型可以包括评分特征项和对应权重部分,在评分特征项中,个人数据维度由基础信息、职业信息、资产信息及流水信息、信用和借贷信息、模型外调整信息等5个部分组成;企业数据维度则可以包括基础信息、职业信息、资产信息及流水信息、信用和借贷信息、模型外调整信息、非财务评价以及财务评价等7个部分组成。权重的设定,采用自适应AHP层次分析模型输出。总信用分由各评分项与权重的乘积所得子分数项加总得来。
根据信用评分与信用等级,计算标准数据的额度预测信息、利率预测信息以及收益率预测信息。
在此步骤中,额度预测信息可以依据借贷历史数据集,筛选无违约按期还贷的客户数据,划分训练集与测试集,在原特征中加入信用分与信用等级两个维度,以历史授信额度作为Y值,进行授信额度预测,模型建立及选择方法同风险分类,将训练好的模型保存在系统中。
利率建议,依据上述信用分与信用等级的输出结果,映射至真实大样本违约率,得出该客户的预测违约率,将预测违约率代入核心利率计算公式,输出该客户建议授信利率。
收益率预测依据借贷历史数据集,包含全量贷前特征与贷后数据,以最终收益的IRR值作为Y值,以LR等回归算法预测新增客户将为平台带来的IRR,模型建立及选择方法类同风险分类,将训练好的模型保存在系统中。
根据额度信息、利率信息以及收益率预测信息生成被评客户的可视化评级报告。
可视化评级报告,用于最后输出对象的总体评价和授信建议并以可视化报告方式展示。
相应于上面的方法实施例,本申请实施例还提供了一种信贷数据处理装置,下文描述的信贷数据处理装置与上文描述的信贷数据处理方法可相互对应参照。
参见图2所示,该装置包括以下模块:
数据收集与整理模块101,用于接收授信请求,并获取请求方的原始信贷数据;对原始信贷数据进行标准化处理,得到标准数据;
信用评估模块102,用于利用信用综合评估模型,对标准数据进行评估,得到信用评估数据;
自动化决策与审批模块103,用于在审批规则库中查询信用评估数据,得到信贷数据处理结果。
应用本申请实施例所提供的装置,接收授信请求,并获取请求方的原始信贷数据;对原始信贷数据进行标准化处理,得到标准数据;利用信用综合评估模型,对标准数据进行评估,得到信用评估数据;在审批规则库中查询信用评估数据,得到信贷数据处理结果。
在本申请中,当接收到授信请求之后,获取到请求方的原始信贷数据。然后,对该原始信贷数据进行标准化处理,从而得到便于模型识别处理的标准数据。利用信用综合评估模型对标准数据进行评估,从而得到信用评估数据。然后,在审批规则库中查询该信用评估数据,即可获得信贷数据处理结果。也就是说,在本申请中,基于信用评估模型和审批规则库中的审批规则,能够自动进行信贷决策和审批,可提高审批效率和一致性。此外,输入信用综合评估模型的数据为标准数据,可以使得模型更容易对信贷数据进行特征提取,可以提高模型的预测能力和效果,使得最终的信贷数据处理结果更为可靠。
在本申请的一种具体实施方式中,信用评估模块102,具体用于对标准数据进行反欺诈验证;
若验证通过,则利用信用综合评估模型,对标准数据进行评估,得到信用评估数据;
若验证未通过,则确定信贷数据处理结果为拒绝授信。
在本申请的一种具体实施方式中,反欺诈验证模块,用于判断标准数据是否命中欺诈规则库中的欺诈规则;
如果是,则确定验证未通过;
如果否,则利用反欺诈模型对标准数据进行评分,若输出反欺诈评分低于反欺诈阈值,则确定通过验证,若反欺诈评分高于或等于反欺诈阈值,则确定验证未通过。
在本申请的一种具体实施方式中,信用评估模块102,具体用于将标准数据输入至集成有信用评分卡模型、信用等级模型和风险分类模型的信用综合评估模型,对标准数据进行评估,得到包括信用评分数据、信用等级数据和风险分类数据的信用评估数据。
在本申请的一种具体实施方式中,数据收集与整理模块101,具体用于去除原始信贷数据去除异常值、重复值、无效值,并填补缺失数据,清洗数据;
对清洗数据进行去噪、修复和降维处理,得到标准数据。
在本申请的一种具体实施方式中,数据收集与整理模块101,具体用于获取请求方的文本信贷数据和/或图像信贷数据;
利用自然语言处理算法,从文本信贷数据中提取标准数据;
利用计算机视觉处理算法,从图像信贷数据中提取标准数据。
在本申请的一种具体实施方式中,还包括更新模块,用于在审批规则库中查询信用评估数据,得到信贷数据处理结果之后,获取信贷数据处理结果对应的反馈数据;
将反馈数据作为标准数据的标签,得到修正样本;
利用修正样本对信用综合评估模型和/或审批规则库进行更新。
相应于上面的方法实施例,本申请实施例还提供了一种电子设备,下文描述的一种电子设备与上文描述的一种信贷数据处理方法可相互对应参照。
参见图3所示,该电子设备包括:
存储器332,用于存储计算机程序;
处理器322,用于执行计算机程序时实现上述方法实施例的信贷数据处理方法的步骤。
具体的,请参考图4,图4为本实施例提供的一种电子设备的具体结构示意图,该电子设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)322(例如,一个或一个以上处理器)和存储器332,存储器332存储有一个或一个以上的计算机程序342或数据344。其中,存储器332可以是短暂存储或持久存储。存储在存储器332的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对数据处理设备中的一系列指令操作。更进一步地,处理器322可以设置为与存储器332通信,在电子设备301上执行存储器332中的一系列指令操作。
电子设备301还可以包括一个或一个以上电源326,一个或一个以上有线或无线网络接口350,一个或一个以上输入输出接口358,和/或,一个或一个以上操作系统341。
上文所描述的信贷数据处理方法中的步骤可以由电子设备的结构实现。
相应于上面的方法实施例,本申请实施例还提供了一种可读存储介质,下文描述的一种可读存储介质与上文描述的一种信贷数据处理方法可相互对应参照。
一种可读存储介质,可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述方法实施例的信贷数据处理方法的步骤。
该可读存储介质具体可以为U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可存储程序代码的可读存储介质。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本领域技术人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件的方式来执行,取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应该认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系属于仅仅用来将一个实体或者操作与另一个实体或者操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语包括、包含或者其他任何变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种信贷数据处理方法,其特征在于,包括:
接收授信请求,并获取请求方的原始信贷数据;
对所述原始信贷数据进行标准化处理,得到标准数据;
利用信用综合评估模型,对所述标准数据进行评估,得到信用评估数据;
在审批规则库中查询所述信用评估数据,得到信贷数据处理结果。
2.根据权利要求1所述的信贷数据处理方法,其特征在于,利用信用综合评估模型,对所述标准数据进行评估,得到信用评估数据,包括:
对所述标准数据进行反欺诈验证;
若验证通过,则利用所述信用综合评估模型,对所述标准数据进行评估,得到所述信用评估数据;
若验证未通过,则确定所述信贷数据处理结果为拒绝授信。
3.根据权利要求2所述的信贷数据处理方法,其特征在于,对所述标准数据进行反欺诈验证,包括:
判断所述标准数据是否命中欺诈规则库中的欺诈规则;
如果是,则确定验证未通过;
如果否,则利用反欺诈模型对所述标准数据进行评分,若输出反欺诈评分低于反欺诈阈值,则确定通过验证,若所述反欺诈评分高于或等于所述反欺诈阈值,则确定验证未通过。
4.根据权利要求1所述的信贷数据处理方法,其特征在于,利用信用评估模型,对所述标准数据进行评估,得到信用评估数据,包括:
将所述标准数据输入至集成有信用评分卡模型、信用等级模型和风险分类模型的信用综合评估模型,对所述标准数据进行评估,得到包括信用评分数据、信用等级数据和风险分类数据的信用评估数据。
5.根据权利要求1所述的信贷数据处理方法,其特征在于,对所述原始信贷数据进行标准化处理,得到标准数据,包括:
去除所述原始信贷数据去除异常值、重复值、无效值,并填补缺失数据,清洗数据;
对所述清洗数据进行去噪、修复和降维处理,得到所述标准数据。
6.根据权利要求1所述的信贷数据处理方法,其特征在于,获取请求方的原始信贷数据,包括:
获取所述请求方的文本信贷数据和/或图像信贷数据;
利用自然语言处理算法,从所述文本信贷数据中提取所述标准数据;
利用计算机视觉处理算法,从所述图像信贷数据中提取所述标准数据。
7.根据权利要求1至6任一项所述的信贷数据处理方法,其特征在于,在审批规则库中查询所述信用评估数据,得到信贷数据处理结果之后,还包括:
获取所述信贷数据处理结果对应的反馈数据;
将所述反馈数据作为所述标准数据的标签,得到修正样本;
利用所述修正样本对所述信用综合评估模型和/或所述审批规则库进行更新。
8.一种信贷数据处理装置,其特征在于,包括:
数据收集与整理模块,用于接收授信请求,并获取请求方的原始信贷数据;对所述原始信贷数据进行标准化处理,得到标准数据;
信用评估模块,用于利用信用综合评估模型,对所述标准数据进行评估,得到信用评估数据;
自动化决策与审批模块,用于在审批规则库中查询所述信用评估数据,得到信贷数据处理结果。
9.一种电子设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述信贷数据处理方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述信贷数据处理方法的步骤。
CN202310906802.8A 2023-07-24 2023-07-24 一种信贷数据处理方法、装置、设备及可读存储介质 Pending CN117132383A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310906802.8A CN117132383A (zh) 2023-07-24 2023-07-24 一种信贷数据处理方法、装置、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310906802.8A CN117132383A (zh) 2023-07-24 2023-07-24 一种信贷数据处理方法、装置、设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN117132383A true CN117132383A (zh) 2023-11-28

Family

ID=88857388

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310906802.8A Pending CN117132383A (zh) 2023-07-24 2023-07-24 一种信贷数据处理方法、装置、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN117132383A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117876104A (zh) * 2024-03-13 2024-04-12 湖南三湘银行股份有限公司 一种基于ai语言模型的智能信贷管控方法及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117876104A (zh) * 2024-03-13 2024-04-12 湖南三湘银行股份有限公司 一种基于ai语言模型的智能信贷管控方法及系统

Similar Documents

Publication Publication Date Title
CN108564286B (zh) 一种基于大数据征信的人工智能金融风控授信评定方法和系统
CN108648074B (zh) 基于支持向量机的贷款评估方法、装置及设备
Verbraken et al. Development and application of consumer credit scoring models using profit-based classification measures
CN112132233A (zh) 一种基于有效影响因子的服刑人员危险行为预测方法及系统
US11481707B2 (en) Risk prediction system and operation method thereof
CN114048436A (zh) 一种预测企业财务数据模型构建方法及构建装置
CN111160745A (zh) 用户账户数据的处理方法及装置
CN110866832A (zh) 一种风险控制方法、系统、存储介质及计算设备
CN111275338A (zh) 一种企业欺诈行为的判定方法、装置、设备及存储介质
CN113822488A (zh) 融资租赁的风险预测方法、装置、计算机设备及存储介质
CN117132383A (zh) 一种信贷数据处理方法、装置、设备及可读存储介质
CN116911994B (zh) 对外贸易风险预警系统
CN116468273A (zh) 客户风险识别方法及装置
KR102499182B1 (ko) 인공지능을 이용한 가계대출 사기/부실 상시감사지원시스템
Liu et al. Early warning control model and simulation study of engineering safety risk based on a convolutional neural network
CN114626940A (zh) 数据分析方法、装置及电子设备
CN114387089A (zh) 客户信用风险评估方法、装置、设备及存储介质
CN114565457A (zh) 风险数据识别方法、装置、存储介质及电子设备
CN113159634A (zh) 一种金融产品管理方法、装置及电子设备
CN110956471A (zh) 装修行业征信数据的分析方法
Lee et al. Application of machine learning in credit risk scorecard
KR102499183B1 (ko) 인공지능을 이용한 기업대출 사기/사기의심 상시감사지원시스템
Mozafari et al. A method for clustering Bank customers using RFM model and three parameter Grey numbers
CN114239981A (zh) 资产水平预测方法、装置、设备与存储介质
Arisudhana et al. Data Mining in Auditing: Challenges and Opportunities

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination