CN112634028A - 一种识别人行征信报告代偿回购行为的方法 - Google Patents

一种识别人行征信报告代偿回购行为的方法 Download PDF

Info

Publication number
CN112634028A
CN112634028A CN202011603911.5A CN202011603911A CN112634028A CN 112634028 A CN112634028 A CN 112634028A CN 202011603911 A CN202011603911 A CN 202011603911A CN 112634028 A CN112634028 A CN 112634028A
Authority
CN
China
Prior art keywords
buyback
behavior
identifying
compensation
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011603911.5A
Other languages
English (en)
Inventor
徐志华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan XW Bank Co Ltd
Original Assignee
Sichuan XW Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan XW Bank Co Ltd filed Critical Sichuan XW Bank Co Ltd
Priority to CN202011603911.5A priority Critical patent/CN112634028A/zh
Publication of CN112634028A publication Critical patent/CN112634028A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Economics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Finance (AREA)
  • General Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Technology Law (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开了一种识别人行征信报告代偿回购行为的方法,属于计算机技术领域,以解决现有技术中人为加工特征变量不仅费时费力,成本非常高,不适合工业化,并且人为加工较难设计出高分度变量,丢失一些信息的问题。本发明提供一种识别人行征信报告代偿回购行为的方法,具体步骤包括:步骤A:利用循环神经网络自动提取人行代偿回购的特征;步骤B:利用注意力机制增强网络效果,提高识别人行代偿回购的特征的效果;步骤C:在实际应用场景中基于用户的借据级别进行建立模型,当用户有一笔贷款出现代偿回购行为时,判定该用户为代偿回购用户。本发明用于识别人行征信报告代偿回购行为。

Description

一种识别人行征信报告代偿回购行为的方法
技术领域
本发明属于计算机技术领域,具体涉及一种识别人行征信报告代偿回购行为的方法。
背景技术
人行征信报告代偿回购是指当下的金融机构为了维护自身平台的活跃度,在客户有逾期的行为后平台主动替客户还款或结清的行为,由于存在这种行为,造成了客户在人行征信报告上的逾期信息被消除或被减弱。破坏了失信约束制度,危害了社会信用体系建设,甚至造成其他金融机构在错误的信息指导下发生了经济损失。因此识别人行征信报告代偿回购是非常重要且有重大意义的工作。
现有技术中,识别人行征信报告代偿回购的方法主要是根据行业经验人为地加工特征变量,然后利用特征变量建立信用模型,从而识别客户代偿与否。
现有技术中存在的问题:人为加工特征变量不仅费时费力,成本非常高,不适合工业化,并且人为加工较难设计出高分度变量,容易造成一些信息丢失。
发明内容
针对现有技术中人为加工特征变量不仅费时费力,成本非常高,不适合工业化,并且人为加工较难设计出高分度变量,丢失一些信息的问题,本发明提供一种识别人行征信报告代偿回购行为的方法,其目的在于:利用深度学习自动提取特征,通过算法来寻找特征,可以更好的区分代偿回购人群。
为了达到上述目的,本发明采用如下技术方案:
一种识别人行征信报告代偿回购行为的方法,包括:
步骤A:利用循环神经网络自动提取人行征信报告代偿回购的特征;
步骤B:利用注意力机制增强网络效果,提高识别人行征信报告代偿回购的特征的效果;
步骤C:在实际应用场景中基于用户的借据级别进行建立模型,当用户有一笔贷款出现代偿回购行为时,判定该用户为代偿回购用户。本发明利用循环神经网络提取人行征信报告中的贷款信息并加工成特征变量,然后利用注意力机制加强对人行征信报告中代偿回购的识别,基于用户的借据级别建立模型,当用户有一笔贷款出现代偿回购行为时,判定该用户为代偿回购用户。
进一步的,所述步骤A中,通过循环神经网络不断学习,得到并提取人行代偿回购的特征。本发明中人为加工特征可能会出现特征只加工有效特征,漏掉无效特征,导致特征不全,通过循环网络加工特征能够对所有特征进行加工,避免人为遗漏。
进一步的,所述步骤B中,对提取的特征计算注意力分布,利用注意力分布计算特征的加权平均。本发明中利用注意力机制精细化地提取高区分度的变量从而提高识别效果。
进一步的,所述步骤C中,所述建立模型包括:输入层、embedding层、LSTM层、Attentiong层和输出层。
进一步的,所述embedding层获取输入的特征的信息并对单词序列做预处理,将单词序列转化为向量形式,本发明中,所述单词序列为还款序列,然后利用LSTM神经网络对于时序性数据的学习能力提取相关数据特征;所述Attentiong层引入Attentiong机制,在数据特征中聚焦关键信息点。本发明充分利用时间序列数据,大幅度提高识别人行征信报告代偿回购行为的准确率和效率。
综上所述,由于采用了上述技术方案,本发明的有益效果是:本发明利用循环神经网络提取人行征信报告中的贷款信息并加工成特征变量,然后利用注意力机制加强对人行征信报告中代偿回购的识别,基于用户的借据级别建立模型。本发明中人为加工特征可能会出现特征只加工有效特征,漏掉无效特征,导致特征不全,通过循环网络加工特征能够对所有特征进行加工,避免人为疏漏。本发明中利用注意力机制精细化地提取高区分度的变量从而提高识别效果。
附图说明
图1为本发明的流程示意图。
具体实施方式
本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。
下面将结合附图及具体实施方式对本发明作进一步的描述。
名词解释:
LSTM是指长短期记忆网络,是循环神经网络(RNN)的变体。传统的循环神经网络在训练过程中会出现梯度消失或梯度爆炸问题,同时还存在长期依赖问题。LSTM通过在其记忆模块中设置逻辑门(遗忘门、输入门、输出门)和记忆模块状态更新,有效解决了传统循环神经网络存在的问题,提高了神经网络的学习能力和分类精度。
Attention机制是指注意力机制,源自对人脑的注意力机制模拟。Attention的核心思想是将有限的注意力资源集中于大量信息中的关键信息点上,从而避免了平均用力导致的大量计算和较低效率。Attention通过相似度计算函数依次对查询数据和输入数据进行相似度计算,得出相似度分数。然后将查询数据与对应相似度分数进行加权求和,得出最终的关键信息点。
1.一种识别人行征信报告代偿回购行为的方法,其特征在于:包括:
步骤A:利用循环神经网络自动提取人行征信报告代偿回购的特征;
所述步骤A中,通过循环神经网络不断学习,得到并提取人行征信报告代偿回购的特征。
步骤B:利用注意力机制增强网络效果,提高识别人行代偿回购的特征的效果;
所述步骤B中,对提取的特征计算注意力分布,利用注意力分布计算特征的加权平均。
步骤C:在实际应用场景中基于用户的借据级别进行建立模型,当用户有一笔贷款出现代偿回购行为时,判定该用户为代偿回购用户。
步骤C中,所述建立模型包括:输入层、embedding层、LSTM层、Attentiong层和输出层。
所述embedding层获取输入的特征的信息并对还款序列做预处理,将还款序列转化为向量形式,然后利用LSTM神经网络对于时序性数据的学习能力提取相关数据特征;所述Attentiong层引入Attentiong机制,在数据特征中聚焦关键信息点。
本发明利用循环神经网络提取人行征信报告中的贷款信息并加工成特征变量,然后利用注意力机制加强对人行征信报告中代偿回购的识别,基于用户的借据级别建立模型,当用户有一笔贷款出现代偿回购行为时,判定该用户为代偿回购用户。实现之前没法实现的一些功能大大降低人为加工特征的工作量,普遍的人为加工人行征信报告包括收入金额,近期是否存在逾期,当前社保缴费单位等等,工作量大并且细致工作无法加工,遍历不全细致的特征,本发明克服了一种特征工程的过程,解决了人为不能解决的问题。现有的人行征信报告表面上表现的是正常的,但是实际上客户已经有逾期行为,人为加工的特征非常难区别,只有通过机器加工的细致特征中体现出来的的差别才能区分出来,从而识别客户是否有还款能力。
以上仅是本发明众多具体应用范围中的代表性实施例,对本发明的保护范围不构成任何限制。凡采用变换或是等效替换而形成的技术方案,均落在本发明权利保护范围之内。

Claims (5)

1.一种识别人行征信报告代偿回购行为的方法,其特征在于,包括:
步骤A:利用循环神经网络自动提取人行征信报告代偿回购的特征;
步骤B:利用注意力机制增强网络效果,提高识别人行征信报告代偿回购的特征的效果;
步骤C:在实际应用场景中基于用户的借据级别进行建立模型,当用户有一笔贷款出现代偿回购行为时,判定该用户为代偿回购用户。
2.根据权利要求1所述的一种识别人行征信报告代偿回购行为的方法,其特征在于:所述步骤A中,通过循环神经网络不断学习,得到并提取人行代偿回购的特征。
3.根据权利要求2所述的一种识别人行征信报告代偿回购行为的方法,其特征在于:所述步骤B中,对提取的特征计算注意力分布,利用注意力分布计算特征的加权平均。
4.根据权利要求1所述的一种识别人行征信报告代偿回购行为的方法,其特征在于:所述步骤C中,所述建立模型包括:输入层、embedding层、LSTM层、Attentiong层和输出层。
5.根据权利要求4所述的一种识别人行征信报告代偿回购行为的方法,其特征在于:所述embedding层获取输入的特征的信息并对还款序列做预处理,将还款序列转化为向量形式,然后利用LSTM神经网络对于时序性数据的学习能力提取相关数据特征;所述Attentiong层引入Attentiong机制,在数据特征中聚焦关键信息点。
CN202011603911.5A 2020-12-30 2020-12-30 一种识别人行征信报告代偿回购行为的方法 Pending CN112634028A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011603911.5A CN112634028A (zh) 2020-12-30 2020-12-30 一种识别人行征信报告代偿回购行为的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011603911.5A CN112634028A (zh) 2020-12-30 2020-12-30 一种识别人行征信报告代偿回购行为的方法

Publications (1)

Publication Number Publication Date
CN112634028A true CN112634028A (zh) 2021-04-09

Family

ID=75287270

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011603911.5A Pending CN112634028A (zh) 2020-12-30 2020-12-30 一种识别人行征信报告代偿回购行为的方法

Country Status (1)

Country Link
CN (1) CN112634028A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230368208A1 (en) * 2021-08-09 2023-11-16 Kevin Wayne Marcum System and method for generating a contention scheme

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107203937A (zh) * 2017-05-19 2017-09-26 四川新网银行股份有限公司 一种基于开放平台的银行与小贷平台直贷联合放贷的方法
CN108734338A (zh) * 2018-04-24 2018-11-02 阿里巴巴集团控股有限公司 基于lstm模型的信用风险预测方法及装置
CN110363644A (zh) * 2019-06-17 2019-10-22 深圳壹账通智能科技有限公司 异常信息识别方法、装置、计算机设备及存储介质
CN111709754A (zh) * 2020-06-12 2020-09-25 中国建设银行股份有限公司 一种用户行为特征提取方法、装置、设备及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107203937A (zh) * 2017-05-19 2017-09-26 四川新网银行股份有限公司 一种基于开放平台的银行与小贷平台直贷联合放贷的方法
CN108734338A (zh) * 2018-04-24 2018-11-02 阿里巴巴集团控股有限公司 基于lstm模型的信用风险预测方法及装置
CN110363644A (zh) * 2019-06-17 2019-10-22 深圳壹账通智能科技有限公司 异常信息识别方法、装置、计算机设备及存储介质
CN111709754A (zh) * 2020-06-12 2020-09-25 中国建设银行股份有限公司 一种用户行为特征提取方法、装置、设备及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230368208A1 (en) * 2021-08-09 2023-11-16 Kevin Wayne Marcum System and method for generating a contention scheme

Similar Documents

Publication Publication Date Title
CN107316198B (zh) 账户风险识别方法及装置
CN110717816A (zh) 一种基于人工智能技术的全域金融风险知识图谱构建方法
CN112600810B (zh) 一种基于图分类的以太坊网络钓鱼诈骗检测方法及装置
CN110084610A (zh) 一种基于孪生神经网络的网络交易欺诈检测系统
CN111444873A (zh) 视频中人物真伪的检测方法、装置、电子设备及存储介质
Lou et al. Ponzi contracts detection based on improved convolutional neural network
CN110321436B (zh) 一种基于社交注意力机制表示学习的冷启动欺诈评论检测方法
CN111914553B (zh) 一种基于机器学习的金融信息负面主体判定的方法
CN108229170A (zh) 利用大数据和神经网络的软件分析方法和装置
CN111221960A (zh) 文本检测方法、相似度计算方法、模型训练方法及装置
Zhao et al. Fingerprint pre-processing and feature engineering to enhance agricultural products categorization
CN116582309A (zh) 一种基于GAN-CNN-BiLSTM的网络入侵检测方法
CN112634028A (zh) 一种识别人行征信报告代偿回购行为的方法
CN115188031A (zh) 指纹识别方法、计算机程序产品、存储介质及电子设备
CN112819175B (zh) 非法所得合法化账户识别方法、装置、设备及存储介质
CN114240633A (zh) 信贷风险评估方法、系统、终端设备及存储介质
CN117197755A (zh) 社区人员身份监控识别方法及装置
CN116776193A (zh) 基于注意力机制的跨社交网络虚拟身份关联方法及装置
CN113159778B (zh) 一种金融欺诈的检测方法及装置
CN115310606A (zh) 基于数据集敏感属性重构的深度学习模型去偏方法及装置
CN114862588A (zh) 一种面向区块链交易行为的异常检测方法
Feng Application analysis of artificial intelligence algorithms in image processing
CN116266412A (zh) 人脸真伪检测方法、装置、设备及计算机可读存储介质
CN114066075A (zh) 一种基于深度学习的客户流失预测方法
CN113706290A (zh) 在区块链上采用神经架构搜索的信用评估模型构建方法、系统、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210409