CN113793214A - 一种解决小微企业信贷授信风险控制和管理方法及装置 - Google Patents

一种解决小微企业信贷授信风险控制和管理方法及装置 Download PDF

Info

Publication number
CN113793214A
CN113793214A CN202111132730.3A CN202111132730A CN113793214A CN 113793214 A CN113793214 A CN 113793214A CN 202111132730 A CN202111132730 A CN 202111132730A CN 113793214 A CN113793214 A CN 113793214A
Authority
CN
China
Prior art keywords
data
credit
hive
small
enterprise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111132730.3A
Other languages
English (en)
Other versions
CN113793214B (zh
Inventor
田羽
兰翔
陈刚
刘甜甜
汪大磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Zhongbang Bank Co Ltd
Original Assignee
Wuhan Zhongbang Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Zhongbang Bank Co Ltd filed Critical Wuhan Zhongbang Bank Co Ltd
Priority to CN202111132730.3A priority Critical patent/CN113793214B/zh
Publication of CN113793214A publication Critical patent/CN113793214A/zh
Application granted granted Critical
Publication of CN113793214B publication Critical patent/CN113793214B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Educational Administration (AREA)
  • Accounting & Taxation (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Technology Law (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明涉及信息技术领域,提供了一种解决小微企业信贷授信风险控制和管理方法及装置。主旨在于以解决金融机构小微企业信贷业务中面临的数据稀缺、不全面、历史信息沉淀不足等问题,获取小微企业信贷申请请求,形成信贷申请数据集Hive;请求征信机构数据,与信贷申请数据集进行交叉验证,并依据核验信息将客户分类,得到分类客户数据;抽取分类客户数据,提取客户申请特征信息后生成训练集和测试集的Hive;利用主动学习技术对训练集Hive进行信用评级,得到信用评级;得到信用评级后,通过不对称偏差分析方法对训练集Hive进行校验;校验通过的小微企业信贷信用评级结果进行授信额度的发放。

Description

一种解决小微企业信贷授信风险控制和管理方法及装置
技术领域
本发明涉及信息技术领域,提供了一种解决小微企业信贷授信风险控制和管理方法及装置。
背景技术
近年来,国家层面关于金融支持小微企业发展提出了众多政策和扶持方案,但在以银行为主导的金融体系中,抵押通常是贷款的前提条件,小微企业一般没有像样的抵押品,这类客户财务管理一般不规范或者没有相关资料,且目前小微企业数量庞大、贷款期限短、周转频率快,导致银行对此顾虑较多,因此难以贷到款。
随着业务的快速迭代,合作平台不断的引入,针对小微企业信贷风险控制的传统模式凸显其弊端,以至于授信流程人工介入率较高。因此,一种能支撑互联网银行和小微企业信贷业务模式的风险控制技术亟待出现。
发明内容
本发明的目的在:针对现有技术的缺陷和不足,提供一种基于主动学习不对称偏差分析的小微企业授信校验方法、装置、设备及存储介质,解决金融机构小微企业信贷业务中面临的数据稀缺、不全面、历史信息沉淀不足等问题,提升小微企业信贷风控模型效果,从而改善金融机构服务实体经济水平。
为了解决上述技术问题,本发明采用以下技术手段:
一种解决小微企业信贷授信风险控制和管理方法,包括以下步骤:
步骤1、获取小微企业信贷申请请求,形成信贷申请数据集Hive;
步骤2、请求征信机构数据,与信贷申请数据集进行交叉验证,并依据核验信息将客户分类,得到分类客户数据;
步骤3、抽取分类客户数据,提取客户申请特征信息后生成训练集和测试集的Hive;
步骤4、利用主动学习技术对步骤3所述训练集Hive进行评级训练,得到信用评级;
步骤5、得到步骤4所述信用评级后,通过不对称偏差分析方法对训练集Hive进行校验(可根据校验结果选择增量主动学习或重新主动学习步骤4);
步骤6、综合步骤5中校验通过的小微企业信贷信用评级结果进行授信额度的发放。
可选的,所涉及步骤1中小微企业信贷申请数据集包括四部分。第一部分是实名认证数据;第二部分是个人资料数据;第三部分是额度任务数据,包含企业基础资料、企业财税信息及其他证明材料数据;第四部分是申请人在信贷申请各阶段中操作所记录的埋点数据。
可选的,所涉及步骤2中第三方机构提供的征信数据包括个人类及企业类,个人类如有人行征信、黑灰产等数据,企业类包括企业基本信息、信贷信息、公共信息和声明信息等。将信贷申请数据集与第三方机构提供的征信数据进行交叉验证,根据核验信息将客户分为三类,标记黑、白、灰户;
可选的,执行步骤3,提取分类客户信贷申请中特征信息前,需要对申请数据集包含的数据进行需要对数据集含的数据进行结构化与非结构化数据处理,具体操作内容包括:
步骤3.1、使用SQL查询语句获取所需的全部数据,并使用Python进行数据的加载;
步骤3.2、对数据进行EDA探索,包含变量的统计值分析,结合变量的业务特征对变量进行缺失值填充,删除重复数据;
步骤3.3、按灰白户3:7的比例提取数据并构造模型所需特征,包括对分类变量的数值化处理,和连续变量的离散化处理,以及通过变量交叉、合成衍生新的符合业务逻辑的变量;
步骤3.4、对数据进行无量纲化处理,可选方法包括有实际意义的量纲处理和数理化的量纲处理,处理完成后按8:2的比例划分为训练集和测试集的Hive。
可选的,执行步骤4,提取训练集的Hive数据,利用主动学习技术进行训练,具体操作内容包括:
步骤4.1、提取步骤3.4处理完成后的训练集的Hive数据;
步骤4.2、采用批查询策略,挑选出需标注样本,并更改列特征标注样本状态(训练、测试、未打标、待标注),通过前端展示给专家进行标注;
步骤4.3、通过人工标注的专家经验或者业务经验的提炼获得候选集的标注数据,然后将标注结果回传至训练集的Hive中;
步骤4.4、利用评分卡模型来训练步骤4.3所述训练集的Hive,得到小微企业信贷信用评级。
可选的,执行步骤5,得到步骤4.4所述信用评级后,通过不对称偏差分析方法进行验证,依据验证结果并持续提升改进模型效果,具体操作内容包括:
步骤5.1、提取步骤4所述完成训练的Hive信用评级数据;
步骤5.2、通过不对称偏差分析方法对步骤4.3所述训练集Hive进行校验判别,与步骤5.1信用评级数据相互印证、相互补充、为信用评价结果提供充分和必要的依据;
步骤5.3、根据验证结果,若误差大于设置阈值,可选择进行增量学习或者重新学习的方式更新模型,从而将迭代数据融入主动学习模型中,达到提升模型效果。
本发明还提供了一种解决小微企业信贷授信风险控制和管理装置,包括:
数据获取模块、获取小微企业信贷申请请求,形成信贷申请数据集Hive;
分类模块、请求征信机构数据,与信贷申请数据集进行交叉验证,并依据核验信息将客户分类,得到分类客户数据;
训练集和测试集模块、抽取分类客户数据,提取客户申请特征信息后生成训练集和测试集的Hive;
评级模块、利用主动学习技术对步骤3所述训练集Hive进行信用评级,得到信用评级;
校验模块、得到步骤4所述信用评级后,通过不对称偏差分析方法对训练集Hive进行校验;
授信模块、综合步骤5中校验通过的小微企业信贷信用评级结果进行授信额度的发放。
上述技术方案中,包括以下步骤:所涉及步骤1中小微企业信贷申请数据集包括四部分:
第一部分是实名认证数据;
第二部分是个人资料数据;
第三部分是额度任务数据,包含企业基础资料、企业财税信息及其他证明材料数据;
第四部分是申请人在信贷申请各阶段中操作所记录的埋点数据;
所涉及步骤2中第三方机构提供的征信数据包括个人类及企业类,个人类如有人行征信、黑产、灰产数据,企业类包括企业基本信息、信贷信息、公共信息和声明信息,将信贷申请数据集与第三方机构提供的征信数据进行交叉验证,根据核验信息将客户分为三类,标记黑户、白户、灰户;
上述技术方案中,提取分类客户信贷申请中特征信息前,需要对申请数据集包含的数据进行需要对数据集含的数据进行结构化与非结构化数据处理,具体操作内容包括:
步骤3.1、使用SQL查询语句获取所需的全部数据,并使用Python进行数据的加载;
步骤3.2、对数据进行EDA探索,包含变量的统计值分析,结合变量的业务特征对变量进行缺失值填充,删除重复数据;
步骤3.3、按灰户与白户3:7的比例提取数据并构造模型所需特征,包括对分类变量的数值化处理,和连续变量的离散化处理,以及通过变量交叉、合成衍生新的符合业务逻辑的变量;
步骤3.4、对数据进行无量纲化处理,可选方法包括有实际意义的量纲处理和数理化的量纲处理,处理完成后按8:2的比例划分为训练集和测试集得到Hive数据。
上述技术方案中,提取训练集的Hive数据,利用主动学习技术进行训练,具体操作内容包括:
步骤4.1、提取步骤3.4处理完成后的训练集的Hive数据;
步骤4.2、采用批查询策略,挑选出需标注样本,并更改列特征标注样本状态,样本状态包括训练、测试、未打标、待标注,通过前端展示给专家进行标注;
步骤4.3、通过人工标注的专家经验或者业务经验的提炼获得候选集的标注数据,然后将标注结果回传至训练集的Hive数据中;
步骤4.4、利用评分卡模型来训练步骤4.3所述训练集的Hive数据,得到小微企业信贷信用评级。
上述技术方案中,包括以下步骤:可选的,执行步骤5,得到步骤4.4所述信用评级后,通过不对称偏差分析方法进行验证,依据验证结果并持续提升改进模型效果,具体操作内容包括:
步骤5.1、提取步骤4所述完成训练的小微企业信贷信用评级数据;
步骤5.2、通过不对称偏差分析方法对步骤4.3所述训练集Hive进行校验判别,与步骤5.1信用评级数据相互印证、相互补充、为信用评价结果提供充分和必要的依据;
步骤5.3、根据验证结果,若误差大于设置阈值,可选择进行增量学习或者重新学习的方式更新模型,从而将迭代数据融入主动学习模型中,达到提升模型效果。
因为本发明采用上述技术方案,因此具备以下有益效果:
1、本发明在授信的流程上,本发明利用了大数据、人工智能等新兴技术的应用,针对小微企业的信贷申请,利用主动学习技术及不对称偏差分析方法对信贷信用评级进行校验,能够有效减少人工授信审核介入频次,更符合互联网银行的实际业务需求。
2、在模型的扩展性上,利用了主动学习方法,再进行增量学习或者重新学习的方式持续优化模型,使得授信模型更加丰富。扩展的授信模型可以与传统授信决策结果进行交叉验证,通过多决策结果进行综合授信,以提高金融机构风险控制与管理能力。
附图说明
图1为本发明小微企业信贷授信风险控制和管理方法实施例的流程示意图;
图2为本发明小微企业信贷授信风险控制和管理方法中信贷申请的流程示意图;
图3为本发明小微企业信贷授信风险控制和管理方法主动学习模型示意图;
图4为本发明小微企业信贷授信风险控制和管理装置实例的功能模块示意图。
具体实施方式
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参照图1为本发明实施例方案涉及的小微企业信贷授信风险控制和管理方法的流程示意图。
步骤1、信贷申请,由小微企业在线上各渠道(包括但不限于APP端、Web端、小程序等)进行信贷的申请;
步骤2、金融机构获取信贷申请请求,向第三方机构获取征信数据进行交叉验证;
步骤3、根据步骤2核验信息评分将客户分为黑白灰三类,白灰类客户进入到步骤3.1由大数据风控中心的授信系统进行自动审核,若未通过相关授信决策则进入人工审核,黑类客户进入步骤3.2由信贷审核专员进行人工审核;
步骤4、通过系统或人工授信审核后进入到步骤4.1/4.2,小微企业可在各申请渠道前台界面查看授信额度,然后可以进行用信等操作。
参照图2为本发明实施例方案涉及的小微企业信贷授信风险控制和管理方法中信贷申请的具体流程示意图。
步骤1、客户在信贷申请前需同意相关协议,以保证客户相关隐私权益,通过授权协议后金融机构可向第三方机构获取征信数据;
步骤2、通过身份信息验证、活体检测及银行卡绑定等流程对申请人进行实名信息的校验;
步骤3、客户需完善申请人的相关信息,包括但不限于学历、家庭住址、社保、公积金、多头数据、联系人及电话等;
步骤4、提交申请企业的相关信息,包括但不限于企业工商、司法、税务、发票数据及其他证明材料。
参照图3为本发明实施例方案涉及的小微企业信贷授信风险控制和管理方法主动学习模型的流程示意图。
步骤1、将所有样本存储到一张Hive表里,通过列特征标注样本,划分为训练、测试、未打标、待标注等状态。Labeled Set表示标注样本,划分为训练集和测试集;UnlabeledSet表示新增未标注样本进入该Set池;
步骤2:主动学习模型Pipeline打成可执行程序包。然后运行模型相关配置参数,部署在相应机器上,周期地进行调度;
步骤3:Query Set是采用批查询策略,挑选出需标注样本,并更改Hive中样本状态,通过前端展示给专家。然后由进行专家对展示在前端的样本进行标注,完成标注后更改样本状态,并将标注结果定期写入Hive表。

Claims (10)

1.一种解决小微企业信贷授信风险控制和管理方法,该其特征在于,包括以下步骤:
步骤1、获取小微企业信贷申请请求,形成信贷申请数据集Hive;
步骤2、请求征信机构数据,与信贷申请数据集进行交叉验证,并依据核验信息将客户分类,得到分类客户数据;
步骤3、抽取分类客户数据,提取客户申请特征信息后生成训练集和测试集的Hive;
步骤4、利用主动学习技术对步骤3所述训练集Hive进行信用评级,得到信用评级;
步骤5、得到步骤4所述信用评级后,通过不对称偏差分析方法对训练集Hive进行校验;
步骤6、综合步骤5中校验通过的小微企业信贷信用评级结果进行授信额度的发放。
2.根据权利要求1所述的一种解决小微企业信贷授信风险控制和管理方法,其特征在于,包括以下步骤:所涉及步骤1中小微企业信贷申请数据集包括四部分:
第一部分是实名认证数据;
第二部分是个人资料数据;
第三部分是额度任务数据,包含企业基础资料、企业财税信息及其他证明材料数据;
第四部分是申请人在信贷申请各阶段中操作所记录的埋点数据;
所涉及步骤2中第三方机构提供的征信数据包括个人类及企业类,个人类如有人行征信、黑产、灰产数据,企业类包括企业基本信息、信贷信息、公共信息和声明信息,将信贷申请数据集与第三方机构提供的征信数据进行交叉验证,根据核验信息将客户分为三类,标记黑户、白户、灰户。
3.根据权利要求2所述的一种解决小微企业信贷授信风险控制和管理方法,其特征在于,包括以下步骤:可选的,执行步骤3,提取分类客户信贷申请中特征信息前,需要对申请数据集包含的数据进行需要对数据集含的数据进行结构化与非结构化数据处理,具体操作内容包括:
步骤3.1、使用SQL查询语句获取所需的全部数据,并使用Python进行数据的加载;
步骤3.2、对数据进行EDA探索,包含变量的统计值分析,结合变量的业务特征对变量进行缺失值填充,删除重复数据;
步骤3.3、按灰户与白户3:7的比例提取数据并构造模型所需特征,包括对分类变量的数值化处理,和连续变量的离散化处理,以及通过变量交叉、合成衍生新的符合业务逻辑的变量;
步骤3.4、对数据进行无量纲化处理,可选方法包括有实际意义的量纲处理和数理化的量纲处理,处理完成后按8:2的比例划分为训练集和测试集得到Hive数据。
4.根据权利要求3所述的一种解决小微企业信贷授信风险控制和管理方法,其特征在于,包括以下步骤:执行步骤4,提取训练集的Hive数据,利用主动学习技术进行训练,具体操作内容包括:
步骤4.1、提取步骤3.4处理完成后的训练集的Hive数据;
步骤4.2、采用批查询策略,挑选出需标注样本,并更改列特征标注样本状态,样本状态包括训练、测试、未打标、待标注,通过前端展示给专家进行标注;
步骤4.3、通过人工标注的专家经验或者业务经验的提炼获得候选集的标注数据,然后将标注结果回传至训练集的Hive数据中;
步骤4.4、利用评分卡模型来训练步骤4.3所述训练集的Hive数据,得到小微企业信贷信用评级。
5.根据权利要求4所述的一种解决小微企业信贷授信风险控制和管理方法,其特征在于,包括以下步骤:可选的,执行步骤5,得到步骤4.4所述信用评级后,通过不对称偏差分析方法进行验证,依据验证结果并持续提升改进模型效果,具体操作内容包括:
步骤5.1、提取步骤4所述完成训练的小微企业信贷信用评级数据;
步骤5.2、通过不对称偏差分析方法对步骤4.3所述训练集Hive进行校验判别,与步骤5.1信用评级数据相互印证、相互补充、为信用评价结果提供充分和必要的依据;
步骤5.3、根据验证结果,若误差大于设置阈值,可选择进行增量学习或者重新学习的方式更新模型,从而将迭代数据融入主动学习模型中,达到提升模型效果。
6.一种解决小微企业信贷授信风险控制和管理装置,该其特征在于,包括:
数据获取模块、获取小微企业信贷申请请求,形成信贷申请数据集Hive;
分类模块、请求征信机构数据,与信贷申请数据集进行交叉验证,并依据核验信息将客户分类,得到分类客户数据;
训练集和测试集模块、抽取分类客户数据,提取客户申请特征信息后生成训练集和测试集的Hive;
评级模块、利用主动学习技术对步骤3所述训练集Hive进行信用评级,得到信用评级;
校验模块、得到所述信用评级后,通过不对称偏差分析方法对训练集Hive进行校验;
授信模块、综合校验通过的小微企业信贷信用评级结果进行授信额度的发放。
7.根据权利要求6所述的一种解决小微企业信贷授信风险控制和管理装置,其特征在于,包括以下步骤:所涉及步骤1中小微企业信贷申请数据集包括四部分:
第一部分是实名认证数据;
第二部分是个人资料数据;
第三部分是额度任务数据,包含企业基础资料、企业财税信息及其他证明材料数据;
第四部分是申请人在信贷申请各阶段中操作所记录的埋点数据;
第三方机构提供的征信数据包括个人类及企业类,个人类如有人行征信、黑产、灰产数据,企业类包括企业基本信息、信贷信息、公共信息和声明信息,将信贷申请数据集与第三方机构提供的征信数据进行交叉验证,根据核验信息将客户分为三类,标记黑户、白户、灰户;
8.根据权利要求7所述的一种解决小微企业信贷授信风险控制和管理装置,其特征在于,提取分类客户信贷申请中特征信息前,需要对申请数据集包含的数据进行需要对数据集含的数据进行结构化与非结构化数据处理,具体操作内容包括:
步骤3.1、使用SQL查询语句获取所需的全部数据,并使用Python进行数据的加载;
步骤3.2、对数据进行EDA探索,包含变量的统计值分析,结合变量的业务特征对变量进行缺失值填充,删除重复数据;
步骤3.3、按灰户与白户3:7的比例提取数据并构造模型所需特征,包括对分类变量的数值化处理,和连续变量的离散化处理,以及通过变量交叉、合成衍生新的符合业务逻辑的变量;
步骤3.4、对数据进行无量纲化处理,可选方法包括有实际意义的量纲处理和数理化的量纲处理,处理完成后按8:2的比例划分为训练集和测试集得到Hive数据。
9.根据权利要求8所述的一种解决小微企业信贷授信风险控制和管理装置,其特征在于,提取训练集的Hive数据,利用主动学习技术进行训练,具体操作内容包括:
步骤4.1、提取步骤3.4处理完成后的训练集的Hive数据;
步骤4.2、采用批查询策略,挑选出需标注样本,并更改列特征标注样本状态,样本状态包括训练、测试、未打标、待标注,通过前端展示给专家进行标注;
步骤4.3、通过人工标注的专家经验或者业务经验的提炼获得候选集的标注数据,然后将标注结果回传至训练集的Hive数据中;
步骤4.4、利用评分卡模型来训练步骤4.3所述训练集的Hive数据,得到小微企业信贷信用评级。
10.根据权利要求9所述的一种解决小微企业信贷授信风险控制和管理装置,其特征在于,通过不对称偏差分析方法进行验证,依据验证结果并持续提升改进模型效果,具体操作内容包括:
步骤5.1、提取完成训练的小微企业信贷信用评级数据;
步骤5.2、通过不对称偏差分析方法对步骤4.3所述训练集Hive进行校验判别,与步骤5.1信用评级数据相互印证、相互补充、为信用评价结果提供充分和必要的依据;
步骤5.3、根据验证结果,若误差大于设置阈值,可选择进行增量学习或者重新学习的方式更新模型,从而将迭代数据融入主动学习模型中,达到提升模型效果。
CN202111132730.3A 2021-09-27 2021-09-27 一种解决小微企业信贷授信风险控制和管理方法及装置 Active CN113793214B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111132730.3A CN113793214B (zh) 2021-09-27 2021-09-27 一种解决小微企业信贷授信风险控制和管理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111132730.3A CN113793214B (zh) 2021-09-27 2021-09-27 一种解决小微企业信贷授信风险控制和管理方法及装置

Publications (2)

Publication Number Publication Date
CN113793214A true CN113793214A (zh) 2021-12-14
CN113793214B CN113793214B (zh) 2023-07-11

Family

ID=78877254

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111132730.3A Active CN113793214B (zh) 2021-09-27 2021-09-27 一种解决小微企业信贷授信风险控制和管理方法及装置

Country Status (1)

Country Link
CN (1) CN113793214B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114971883A (zh) * 2022-06-27 2022-08-30 贵州省农村信用社联合社 一种基于大数据的小微企业信贷风险评估分析系统
CN116629456A (zh) * 2023-07-20 2023-08-22 杭银消费金融股份有限公司 业务逾期风险预测方法、系统与存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002007703A (ja) * 2000-06-19 2002-01-11 Sumisho Lease Co Ltd インターネットによる金融取引システム
JP2005134938A (ja) * 2002-10-15 2005-05-26 Kagoshima Bank Ltd 企業信用格付システム及び企業信用格付プログラム
US20060287947A1 (en) * 2005-06-16 2006-12-21 Toms Alvin D Non-payment risk assessment
US20110173037A1 (en) * 2010-01-06 2011-07-14 Attenberg Joshua M Methods, systems, and media for providing direct and hybrid data acquisition approaches
CN103198139A (zh) * 2013-04-17 2013-07-10 国电南瑞科技股份有限公司 用户电力数据的用能分析方法
US20160217500A1 (en) * 2015-01-23 2016-07-28 Conversica, Llc Systems and methods for management of automated dynamic messaging
CN109492026A (zh) * 2018-11-02 2019-03-19 国家计算机网络与信息安全管理中心 一种基于改进的主动学习技术的电信欺诈分类检测方法
CN110569982A (zh) * 2019-08-07 2019-12-13 南京智谷人工智能研究院有限公司 一种基于元学习的主动采样方法
CN112529683A (zh) * 2020-11-27 2021-03-19 百维金科(上海)信息科技有限公司 一种基于cs-pnn的客户信贷风险的评估方法及系统
CN112598500A (zh) * 2020-12-21 2021-04-02 中国建设银行股份有限公司 一种无额度客户的授信处理方法及系统

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002007703A (ja) * 2000-06-19 2002-01-11 Sumisho Lease Co Ltd インターネットによる金融取引システム
JP2005134938A (ja) * 2002-10-15 2005-05-26 Kagoshima Bank Ltd 企業信用格付システム及び企業信用格付プログラム
US20060287947A1 (en) * 2005-06-16 2006-12-21 Toms Alvin D Non-payment risk assessment
US20110173037A1 (en) * 2010-01-06 2011-07-14 Attenberg Joshua M Methods, systems, and media for providing direct and hybrid data acquisition approaches
CN103198139A (zh) * 2013-04-17 2013-07-10 国电南瑞科技股份有限公司 用户电力数据的用能分析方法
US20160217500A1 (en) * 2015-01-23 2016-07-28 Conversica, Llc Systems and methods for management of automated dynamic messaging
CN109492026A (zh) * 2018-11-02 2019-03-19 国家计算机网络与信息安全管理中心 一种基于改进的主动学习技术的电信欺诈分类检测方法
CN110569982A (zh) * 2019-08-07 2019-12-13 南京智谷人工智能研究院有限公司 一种基于元学习的主动采样方法
CN112529683A (zh) * 2020-11-27 2021-03-19 百维金科(上海)信息科技有限公司 一种基于cs-pnn的客户信贷风险的评估方法及系统
CN112598500A (zh) * 2020-12-21 2021-04-02 中国建设银行股份有限公司 一种无额度客户的授信处理方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
吴梅;: "互联网金融背景下邮储银行小微信贷分析", 科技经济导刊, no. 26, pages 13 - 20 *
魏秉全;袁卫东;秦思佳;: "基于数据挖掘的普惠信贷客户智能营销模型", 金融科技时代, no. 04, pages 226 - 227 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114971883A (zh) * 2022-06-27 2022-08-30 贵州省农村信用社联合社 一种基于大数据的小微企业信贷风险评估分析系统
CN116629456A (zh) * 2023-07-20 2023-08-22 杭银消费金融股份有限公司 业务逾期风险预测方法、系统与存储介质
CN116629456B (zh) * 2023-07-20 2023-10-13 杭银消费金融股份有限公司 业务逾期风险预测方法、系统与存储介质

Also Published As

Publication number Publication date
CN113793214B (zh) 2023-07-11

Similar Documents

Publication Publication Date Title
CN113793214A (zh) 一种解决小微企业信贷授信风险控制和管理方法及装置
Golić Finance and artificial intelligence: The fifth industrial revolution and its impact on the financial sector
CN110930038A (zh) 一种贷款需求识别方法、装置、终端及存储介质
CN111949643A (zh) 基于业务建模的数据处理方法及系统
CN112598294A (zh) 在线建立评分卡模型的方法、装置、机器可读介质及设备
Yavuz et al. Remittances, ethnic diversity, and entrepreneurship in developing countries
Tang et al. Impact of artificial intelligence on vietnam commercial bank operations
CN109102396A (zh) 一种用户信用评级方法、计算机设备及可读介质
CN111951093A (zh) 一种个人信用分评分方法
CN114066622A (zh) 一种小微企业信用评级的方法、装置
Ways and Machine Learning
CN111951050B (zh) 理财产品推荐方法及装置
CN113159796A (zh) 一种贸易合同验证方法及装置
CN112734566A (zh) 授信额度获取方法、装置及计算机设备
Hui et al. The model and empirical research of application scoring based on data mining methods
Agarwal et al. Innovations in Financial Intelligence Applications using Artificial Intelligence
Yang et al. Reform and competitive selection in China: An analysis of firm exits
KR20200054533A (ko) 재무성향진단을 포함하는 맞춤상품추천 시스템
CN115564591A (zh) 一种融资产品的确定方法及相关设备
CN114154682A (zh) 一种客户贷款收益率等级预测方法及系统
CN114331105A (zh) 电子汇票的处理系统、方法、电子设备和存储介质
Seligson et al. The promise of digital accounting and auditing: Brave new world or dystopia?
CN114330962A (zh) 一种基于人工智能的金融数据分析平台
CN111489134A (zh) 数据模型的构建方法、装置、设备及计算机可读存储介质
Dash et al. An empirical study for customer relationship management in banking sector using machine learning techniques

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant