CN111882431A - 一种基于nlp深度学习智能消息推送方法 - Google Patents
一种基于nlp深度学习智能消息推送方法 Download PDFInfo
- Publication number
- CN111882431A CN111882431A CN202010772740.2A CN202010772740A CN111882431A CN 111882431 A CN111882431 A CN 111882431A CN 202010772740 A CN202010772740 A CN 202010772740A CN 111882431 A CN111882431 A CN 111882431A
- Authority
- CN
- China
- Prior art keywords
- information
- data
- collection
- overdue
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000013135 deep learning Methods 0.000 title claims abstract description 17
- 238000012545 processing Methods 0.000 claims abstract description 22
- 238000005516 engineering process Methods 0.000 claims abstract description 18
- 238000002372 labelling Methods 0.000 claims abstract description 6
- 238000013480 data collection Methods 0.000 claims abstract description 4
- 238000010801 machine learning Methods 0.000 claims abstract description 4
- 230000008569 process Effects 0.000 claims description 20
- 230000006870 function Effects 0.000 claims description 12
- 238000011161 development Methods 0.000 claims description 7
- 230000018109 developmental process Effects 0.000 claims description 7
- 230000006399 behavior Effects 0.000 claims description 6
- 238000013139 quantization Methods 0.000 claims description 6
- 238000011156 evaluation Methods 0.000 claims description 5
- 230000006854 communication Effects 0.000 claims description 4
- 238000007477 logistic regression Methods 0.000 claims description 4
- 238000003058 natural language processing Methods 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 3
- 238000004891 communication Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 claims description 3
- 238000005096 rolling process Methods 0.000 claims description 3
- 230000002159 abnormal effect Effects 0.000 claims description 2
- 230000008859 change Effects 0.000 claims description 2
- 238000004140 cleaning Methods 0.000 claims description 2
- 238000011985 exploratory data analysis Methods 0.000 claims description 2
- 238000007781 pre-processing Methods 0.000 claims description 2
- 238000013077 scoring method Methods 0.000 claims description 2
- 238000012216 screening Methods 0.000 claims description 2
- 230000011218 segmentation Effects 0.000 claims description 2
- 238000010187 selection method Methods 0.000 claims description 2
- 238000007619 statistical method Methods 0.000 claims description 2
- 230000009466 transformation Effects 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 3
- 230000009471 action Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 101000969581 Homo sapiens MOB kinase activator 1A Proteins 0.000 description 1
- 101001115732 Homo sapiens MOB kinase activator 2 Proteins 0.000 description 1
- 102100021437 MOB kinase activator 1A Human genes 0.000 description 1
- 102100025000 MOB kinase activator 2 Human genes 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012946 outsourcing Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000007474 system interaction Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/38—Payment protocols; Details thereof
- G06Q20/40—Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
- G06Q20/401—Transaction verification
- G06Q20/4016—Transaction verification involving fraud or risk level assessment in transaction processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/51—Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
- H04M3/5166—Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing in combination with interactive voice response systems or voice portals, e.g. as front-ends
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/03—Data mining
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Finance (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Development Economics (AREA)
- Computer Security & Cryptography (AREA)
- Economics (AREA)
- Technology Law (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明涉及信息技术领域,提供了一种基于NLP深度学习智能消息推送方法,根据客户评分精准的对客户进行智能催收的方法。目的在于解决当前催收行业催收技术成本高、催收效果差、客户信息恶意泄露、催收不当造成客诉的问题。主要方案包括,步骤1、数据收集:收集催收的对象,将有用信息插入信息库中,根据信息库信息处理数据,变为量化指标。2、智能分案:根据量化指标对催收对象进行不同的策略分组。3、智能催收:根据分组策略,对客户进行催收,并通过ASR技术识别语音,NLP技术自然语言处理,通过TTS技术合成语音,使催收方式更高效,催收结果更结构化,方便机器学习。4:智能标注:根据用户结果,对催收结果进行分类统计,使下次催收更准确、更高效。
Description
技术领域
本发明涉及信息技术领域,提供了一种基于NLP深度学习技术,根据客户评分精准的对客户进行智能催收信息推送的方法。
背景技术
随着我国经济的快速发展,居民持卡消费意识和消费能力的显著增强,我国的消费信贷已步入了规模化发展的阶段。在初步实现了发展的目标之后,国内消费信贷已经越来月正规化、越来越规模化。未来,消费信贷将在市场占据总要的一席之地,不仅能够帮助个人资金需求、还能帮助中小微企业满足资金需求。为了在激烈的市场竞争中取胜,我行消费信贷在快速增长的同时,以效益最大化为目标,在贷后资源投入较小的情况下,力争不良率得到有效控制。当前消费信贷逾期催收还款的方式主要是通过人工加系统自动处理的方式交互完成催收作业。在整个催收流程中,有短信催收、电话催收、信函催收、司法催收、委外催收等多个手段,系统自动催收只是辅助催收的手段之一,导致在整个催收流程,人工干预过多,耗费了大量的人力且催收效率低的问题,还存在信息泄露、恐吓威胁等情况。
为了解决现有催收技术成本高、效果差、信息泄露严重的问题,本发明提供一种基于NLP深度学习的智能催收信息推送方法。
如下提供了之一种基于NLP深度学习的催收信息推送方法。
如图1.首先根据集催收的对象,将有用信息插入信息库中,根据信息库信息处理数据,变为量化指标。
发明内容
本发明内容的目的在于解决现有催收技术成本高、效果差、信息泄露严重的问题,本发明提供一种基于NLP深度学习的智能催收方法。
本发明为解决上述技术问题,采用以下技术方案:
一种基于NLP深度学习智能消息推送方法,包括以下步骤:
步骤1、数据收集:流收集催收的对象,将对象的信息插入信息库中,根据信息库信息处理数据,变为量化指标。
步骤2、智能分案:根据量化指标对催收对象进行不同的策略分组。
步骤3、智能消息推送:根据分组策略,对客户进行催收信息推送,并通过ASR技术识别语音, NLP技术自然语言处理,使催收方式更高效,催收结果更结构化;
步骤4、智能标注:对结构化后的催收结果进行分类统计,并进行标注。
上述步骤1具体包括以下步骤:
步骤1.1:在数据平台中定义数据接口,并在任务调度平台中定义job 任务;
步骤1.2:根据收集到的催收对象信息,定义不同的job任务,并根据不同对象的处理方式定义不同的Step事务,Step事务包括:逾期贷款信息同步、客户信息同步、联系人信息同步、贷款期供信息同步、贷款还款信息同步;
每一Step事务,通过ItemReader、ItemProcessor、ItemWriter对数据进行处理;
ItemReader:ItemReader是一个读数据的抽象,它的功能是为每一个Step提供数据输入;
ItemWriter:ItemWriter是一个写数据的抽象,它是为每一个step提供数据写出的功能;
ItemProcessor:ItemProcessor对项目的业务逻辑处理的一个抽象, 当ItemReader读取到一条记录之后,ItemWriter还未写出这条记录之前,通过temProcessor提供一个处理业务逻辑的功能,并对ItemReader读取到的数据根据需求进行相应操作,然后通过ItemWriter写出;
步骤1.3:将ItemWriter写出数据进行收集并插入信息库,并根据step事务,对数据进行处理,将信息转化为量化指标。
量化指标包括:
客户基本信息:性别,年龄,学历,注册激活记录;
银行信息:信用卡额度,余额,消费记录;
通讯信息:账单,短信,运营商,设备;
借款还款行为信息:借款信息,还款金额,还款时间,逾期天数;
客户信息变动,借款行为信息,客户偏好。
上述步骤2中:
步骤2.1:对信息库中的数据,采用SpringBatch海量数据功能,根据催收评分卡评分以及策略配置,将逾期案件数据分布在不同的策略组中;
其中策略配置包括风险等级,风险登记分类如下:
第一类:轻度,还款意愿和还款能力良好,客户因特殊原因逾期;
第二类:中轻度,还款意愿良好,还款能力出现问题;
第三类:中度,无还款意愿或还款意愿恶化,有还款能力;
第四类:重度,无还款意愿,还款能力弱化或完全没有还款能力;
模型评分采用催收评分卡,由三个模型构成:还款率预测模型
预测经过催收后,最终催收回的欠款比例,模型常用指标:逾期天数、历史还款率信息、个人信息、负债比、联系人关系;
账龄滚动模型
预测逾期人群从轻度逾期变为重度逾期的概率,模型常用指标:逾期天数、历史还款率信息、个人信息、负债比;
失联预测模型
在逾期阶段,对于尚能联系到的人群预测其未来失联的概率,模型常用指标:逾期天数、逾期金额占比、个人信息、联系人关系、运营商信息。
步骤3具体包括以下步骤:
步骤3.1:根据不同的策略进行外呼,在外呼的过程中,通过自然语言处理算法,抽取关键词、或者通过人工配置的关键词,快速实现一个语义理解模型,利用pyttern的匹配方法,匹配出完整的语义理解;
步骤3.2:根据语义理解,匹配对话流程中的节点,根据步骤2智能分案的结果,选择不同的外呼策略、流程、话术,调用催收机器人进行自动外呼;
步骤3.3:通过ASR技术进行语义识别和NLP技术进行语义理解建立客户语义标签库,通过获得与客户交流过程的内容,自主学习,将相应的还款能力类标签、还款意愿类标签存入对应的知识库中;
步骤4具体包括以下步骤:
步骤4.1:根据结构化的催收结果行分类统计,进行新的信用风险评分以及结果分类,并进行标注;
步骤4.2:通过报表的形式将数据展示在前端的管理模块中。
自动外呼包括以下步骤:
s1、获取外呼人员的话术语音,机器人根据所述话术语音进行外呼;
s2、记录机器人外呼记录,并判断是否进行人工介入,如果是,执行s4,否则执行s3;
s3、机器人继续外呼;
s4、所述外呼人员介入外呼;
s5、判断是否结束外呼,如果是,执行s6,否则执行s3;
s6、结束外呼。
步骤4.1中信用风险评分包括:
(1) 数据获取:包括获取存量客户及三方风险数据;
(2) 数据预处理:包括数据清洗、缺失值处理、异常值处理,将获取的原始数据转化为可用作模型开发的格式化数据;
(3) 探索性数据分析:获取样本总体的大概情况,描述样本总体情况的指标主要有直方图、箱形图;
(4) 变量选择:通过统计学的方法,筛选出对违约状态影响最显著的指标,通过单变量特征选择方法和基于机器学习模型的方法实现;
(5) 模型开发:包括变量分段、变量的WOE变换和逻辑回归估算三部分;
(6) 模型评估:评估模型的区分能力、预测能力、稳定性,并形成模型评估报告,得出模型是否可以使用的结论;
(7) 信用评分:根据逻辑回归的系数和WOE等确定信用评分的方法。将Logistic模型转换为标准评分的形式;
(8) 建立评分系统,根据信用评分方法,建立自动信用评分系统。因为本发明采用上述技术方案,因此具备以下有益效果:
(1)解决了手工导入数据的繁琐方式、通过系统交互方式,使数据交互更简单,更集中。
(2)将数据量化指标、根据策略分组,使催收更精细化。
(3)通过机器催收、更加安全,避免因业务情绪激动等原因造成客诉。
(4)分析催收结果,重新分配策略,是催收更精准话。
附图说明
图1为本发明的简单流程图。
图2为外呼流程。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明,即所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,术语“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
一种基于NLP深度学习智能消息推送方法,包括以下步骤:
步骤1、数据收集:流收集催收的对象,将对象的信息插入信息库中,根据信息库信息处理数据,变为量化指标。
步骤2、智能分案:根据量化指标对催收对象进行不同的策略分组。
步骤3、智能消息推送:根据分组策略,对客户进行催收信息推送,并通过ASR技术识别语音, NLP技术自然语言处理,使催收方式更高效,催收结果更结构化,方便机器学习。
步骤4、智能标注:通过机器的学习,对催收结果进行分类统计,使下次催收更准确、更高效。
上述步骤1具体包括以下步骤:
步骤1.1:在数据平台中定义数据接口,并在任务调度平台中定义job 任务;
步骤1.2:根据收集到的催收对象信息,定义不同的job任务,并根据不同对象的处理方式定义不同的Step事务,Step事务包括:逾期贷款信息同步、客户信息同步、联系人信息同步、贷款期供信息同步、贷款还款信息同步;
每一Step事务,通过ItemReader、ItemProcessor、ItemWriter对数据进行处理;
ItemReader:ItemReader是一个读数据的抽象,它的功能是为每一个Step提供数据输入(如:CSV、TXT、数据库等)。
ItemWriter:ItemWriter是一个写数据的抽象,它是为每一个step提供数据写出的功能(如:CSV、TXT、数据库等)。
ItemProcessor:ItemProcessor对项目的业务逻辑处理的一个抽象, 当ItemReader读取到一条记录之后,ItemWriter还未写入这条记录之前,我们可以借助temProcessor提供一个处理业务逻辑的功能,并对数据进行逾期指标计算处理。
逾期指标计算:
(1)逾期天数 DPD :自应还日次日起到实还日期间的日天数;
DPDN+表示逾期天数>=N天,如DPD30+表逾期天数>=30天的合同
(2)逾期期数:自应还日次日起到实还日期间的日期数
正常资产用C表示,Mn表示逾期N期:M1逾期一期,M2逾期二期,M3逾期三期,M4逾期四期,M5逾期五期,M6逾期六期,Mn+表示逾期N期(含)以上,M7+表示逾期期数>=M7
(3)贷款余额 ENR:至某时点借款人尚未偿还的本金,即:全部剩余本金作为贷款余额
(4)月均贷款余额 ANR:月均贷款余额 = (月初贷款余额 + 月末贷款余额)/2,月初贷款余额即上月月底贷款余额
(5)C,M1,M2,M3…的贷款余额:根据逾期期数(C,M1,M2,M3…),计算每条借款的当时的贷款余额
贷款余额 = 放款时合同额–已还本金
已还本金 = (放款日次日 ~ T-1)的还款本金总额
(6)核销金额:贷款逾期M7后经审核进行销帐,核销金额即在核销日期当天的贷款余额
(7)回收金额 Recover:来自历史所有已核销合同的全部实收金额
(8)净坏账 NCL:当月新增核销金额–当月回收金额
(9)在账月份 MOB:放款后的月份
MOB0,放款日至当月月底
MOB1,放款后第二个完整月份
MOB2,放款后第三个完整月份
(10)(C->M1、M1->M2、M2->M3、M3->M4、M4->M5、M5->M6)滚动率 Flow rate
C-M1=当月进入M1的贷款余额/上月末C的贷款余额
M2-M3=当月进入M3的贷款余额/上月末M2的贷款余额
(11)逾期率Coin©%、Coin(M1)%、Coin(M2)%、Coin(M3)%、Coin(M4)%、Coin(M5)%、Coin(M6)%:当月不同逾期期数的贷款余额/当月底总贷款余额
Coin©%=当月C贷款余额/当月底贷款余额(C-M6)
Coin(M1)%=当月M1贷款余额/当月底贷款余额(C-M6)
Coin(M1+)%=当月M1−M6贷款余额/当月底贷款余额(C-M6)
(12)逾期率Lagged(M1)%、Lagged(M2)%、Lagged(M3)%、Lagged(M4)%、Lagged(M5)%、Lagged(M6)%
当月不同逾期期数的贷款余额/往前推N个月的总贷款余额
Lagged(M1)%=当月M1的贷款余额/上个月底的贷款余额(C~M6)
Lagged(M4)%=当月M4的贷款余额/往前推四期的总贷款余额
Lagged(M4+)%=当月M4的贷款余额/往前推四期的总贷款余额
+ 当月M5的贷款余额/往前推五期的总贷款+ 当月M6的贷款余额/往前推六期的总贷款余额
(13)账龄分析Vintage
步骤1.3:将收集到的信息插入信息库,并根据step事务,对数据进行处理,将信息转化为量化指标。
逾期客服画像与应用,通过统计建模深度挖掘客户标签,实现逾期客服分群、智能催收策略设计,针对不同阶段客户,采用不同模型和策略,采用模型融合方式。
量化指标:
n 客户基本信息(性别,年龄,学历,注册激活记录...)
n 银行信息(信用卡额度,余额,消费记录...)
n 通讯信息(账单,短信,运营商,设备...)
n 借款还款行为信息(借款信息,还款金额,还款时间,逾期天数...)
n 客户信息变动,借款行为信息,客户偏好等。
上述步骤2中:
步骤2.1:对信息库中的数据,采用SpringBatch海量数据功能,根据模型评分、以及策略配置,将数据分布在不同的策略组中;
逾期有时候罚息对于公司来说也是一种收益,所以我们需要对逾期客户进行分类,不同客户类别采取的催收手段都是不一样的:
其中风险等级(第四类>第三类>第二类>第一类)
第一类:轻度,还款意愿和还款能力良好,客户因特殊原因(如生意出差在外地未赶回、忘了、特殊情况没时间等出现数天逾期);
第二类:中轻度,还款意愿良好,还款能力出现问题;
第三类:中度,无还款意愿或还款意愿恶化,有还款能力;
第四类:重度,无还款意愿,还款能力弱化或完全没有还款能力;
针对
催收评分卡,由三个模型构成:(不同的模型功能目的不一样,其中失联预测模型是比较重要的)
还款率预测模型:
预测经过催收后,最终催收回的欠款比例,模型常用指标:逾期天数(DPD)、历史还款率信息、个人信息(性别、年龄、收入、工作等等)、负债比(DBR)、联系人关系(是否是夫妻、子女、同事、朋友)。
账龄滚动模型:
预测逾期人群从轻度逾期变为重度逾期的概率,模型常用指标:逾期天数(DPD)、历史还款率信息、个人信息(性别、年龄、收入、工作等等)、负债比(DBR)。
失联预测模型:
在逾期阶段,对于尚能联系到的人群预测其未来失联的概率,模型常用指标:逾期天数(daypast due,DPD)、逾期金额占比(outstanding/limit)、个人信息(性别、年龄、收入、工作等等)、联系人关系(是否是夫妻、子女、同事、朋友)、运营商信息(在网时长、高频联系人)。
步骤3具体包括以下步骤:
步骤3.1:根据不同的策略进行外呼,在外呼的过程中,通过自然语言处理算法,抽取关键词、或者通过人工配置的关键词,快速实现一个语义理解模型,利用pyttern的匹配方法,匹配出完整的语义;
步骤3.2:根据语义理解,匹配对话流程中的节点,根据步骤2智能分案的结果,选择不同的外呼策略、流程、话术,调用催收机器人(应用NLP深度学习、结合IVR技术(ASR语音识别/TTS语音合成)集成语音呼叫中心进行自动外呼;
步骤3.3:建立解析客户语义标库标,通过获得通过和客户交流过程,自主学习,将相应的标签(还款能力类标签、还款意愿类标签)存入对应的知识库中;
上述技术方案中,步骤4具体包括以下步骤:
步骤4.1:根据结果,进行新的评分以及结果分类。
步骤4.2:通过报表的形式将数据展示在前端的管理模块中。
步骤3.2中,自动外呼包括以下步骤:
s1、获取外呼人员的话术语音,机器人根据所述话术语音进行外呼;
s2、记录机器人外呼记录,并判断是否进行人工介入,如果是,执行s4,否则执行s3;
s3、机器人继续外呼;
s4、所述外呼人员介入外呼;
s5、判断是否结束外呼,如果是,执行s6,否则执行s3;
s6、结束外呼。
Claims (7)
1.一种基于NLP深度学习智能消息推送方法,其特征在于,包括以下步骤:
步骤1、数据收集:流收集催收的对象,将对象的信息插入信息库中,根据信息库信息处理数据,变为量化指标;
步骤2、智能分案:根据量化指标对催收对象进行不同的策略分组;
步骤3、智能消息推送:根据分组策略,对客户进行催收信息推送,并通过ASR技术识别语音, NLP技术自然语言处理,使催收方式更高效,催收结果更结构化;
步骤4、智能标注:对结构化后的催收结果进行分类统计。
2.根据权利要求1所述的一种基于NLP深度学习智能消息推送方法,其特征在于:上述步骤1具体包括以下步骤:
步骤1.1:在数据平台中定义数据接口,并在任务调度平台中定义job 任务;
步骤1.2:根据收集到的催收对象信息,定义不同的job任务,并根据不同对象的处理方式定义不同的Step事务,Step事务包括:逾期贷款信息同步、客户信息同步、联系人信息同步、贷款期供信息同步、贷款还款信息同步;
每一Step事务,通过ItemReader、ItemProcessor、ItemWriter对数据进行处理;
ItemReader:ItemReader是一个读数据的抽象,它的功能是为每一个Step提供数据输入;
ItemWriter:ItemWriter是一个写数据的抽象,它是为每一个step提供数据写出的功能;
ItemProcessor:ItemProcessor对项目的业务逻辑处理的一个抽象, 当ItemReader读取到一条记录之后,ItemWriter还未写出这条记录之前,通过temProcessor提供一个处理业务逻辑的功能,并对ItemReader读取到的数据根据需求进行相应操作,然后通过ItemWriter写出;
步骤1.3:将ItemWriter写出数据进行收集并插入信息库,并根据step事务,对数据进行处理,将信息转化为量化指标;
量化指标包括:
客户基本信息:性别,年龄,学历,注册激活记录;
银行信息:信用卡额度,余额,消费记录;
通讯信息:账单,短信,运营商,设备;
借款还款行为信息:借款信息,还款金额,还款时间,逾期天数;
客户信息变动,借款行为信息,客户偏好。
3.根据权利要求1所述的一种基于NLP深度学习智能消息推送方法,其特征在于:上述步骤2中:
步骤2.1:对信息库中的数据,采用SpringBatch海量数据功能,根据催收评分卡评分以及策略配置,将逾期案件数据分布在不同的策略组中;
其中策略配置包括风险等级,风险登记分类如下:
第一类:轻度,还款意愿和还款能力良好,客户因特殊原因逾期;
第二类:中轻度,还款意愿良好,还款能力出现问题;
第三类:中度,无还款意愿或还款意愿恶化,有还款能力;
第四类:重度,无还款意愿,还款能力弱化或完全没有还款能力;
模型评分采用催收评分卡,由三个模型构成:还款率预测模型
预测经过催收后,最终催收回的欠款比例,模型常用指标:逾期天数、历史还款率信息、个人信息、负债比、联系人关系;
账龄滚动模型
预测逾期人群从轻度逾期变为重度逾期的概率,模型常用指标:逾期天数、历史还款率信息、个人信息、负债比;
失联预测模型
在逾期阶段,对于尚能联系到的人群预测其未来失联的概率,模型常用指标:逾期天数、逾期金额占比、个人信息、联系人关系、运营商信息。
4.根据权利要求1所述的一种基于NLP深度学习智能消息推送方法,其特征在于:步骤3具体包括以下步骤:
步骤3.1:根据不同的策略进行外呼,在外呼的过程中,通过自然语言处理算法,抽取关键词、或者通过人工配置的关键词,快速实现一个语义理解模型,利用pyttern的匹配方法,匹配出完整的语义理解;
步骤3.2:根据语义理解,匹配对话流程中的节点,根据步骤2智能分案的结果,选择不同的外呼策略、流程、话术,调用催收机器人进行自动外呼;
步骤3.3:通过ASR技术进行语义识别和NLP技术进行语义理解建立客户语义标签库,通过获得与客户交流过程的内容,自主学习,将相应的还款能力类标签、还款意愿类标签存入对应的知识库中。
5.根据权利要求1所述的一种基于NLP深度学习智能消息推送方法,其特征在于:步骤4具体包括以下步骤:
步骤4.1:根据结构化的催收结果行分类统计,进行新的信用风险评分以及结果分类;
步骤4.2:通过报表的形式将数据展示在前端的管理模块中。
6.根据权利要求3所述的一种基于NLP深度学习智能消息推送方法,其特征在于,行自动外呼包括以下步骤:
s1、获取外呼人员的话术语音,机器人根据所述话术语音进行外呼;
s2、记录机器人外呼记录,并判断是否进行人工介入,如果是,执行s4,否则执行s3;
s3、机器人继续外呼;
s4、所述外呼人员介入外呼;
s5、判断是否结束外呼,如果是,执行s6,否则执行s3;
s6、结束外呼。
7.根据权利要求5所述的一种基于NLP深度学习智能消息推送方法,其特征在于:步骤4.1中信用风险评分包括:
(1) 数据获取:包括获取存量客户及三方风险数据;
(2) 数据预处理:包括数据清洗、缺失值处理、异常值处理,将获取的原始数据转化为可用作模型开发的格式化数据;
(3) 探索性数据分析:获取样本总体的大概情况,描述样本总体情况的指标主要有直方图、箱形图;
(4) 变量选择:通过统计学的方法,筛选出对违约状态影响最显著的指标,通过单变量特征选择方法和基于机器学习模型的方法实现;
(5) 模型开发:包括变量分段、变量的WOE变换和逻辑回归估算三部分;
(6) 模型评估:评估模型的区分能力、预测能力、稳定性,并形成模型评估报告,得出模型是否可以使用的结论;
(7) 信用评分:根据逻辑回归的系数和WOE确定信用评分的方法;
将Logistic模型转换为标准评分的形式;
(8) 建立评分系统,根据信用评分方法,建立自动信用评分系统。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010772740.2A CN111882431A (zh) | 2020-08-04 | 2020-08-04 | 一种基于nlp深度学习智能消息推送方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010772740.2A CN111882431A (zh) | 2020-08-04 | 2020-08-04 | 一种基于nlp深度学习智能消息推送方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111882431A true CN111882431A (zh) | 2020-11-03 |
Family
ID=73211550
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010772740.2A Pending CN111882431A (zh) | 2020-08-04 | 2020-08-04 | 一种基于nlp深度学习智能消息推送方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111882431A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112381643A (zh) * | 2020-12-02 | 2021-02-19 | 浙江百应科技有限公司 | 一种基于可智能分案的催收方法、系统、终端及存储介质 |
CN112927719A (zh) * | 2021-01-22 | 2021-06-08 | 中信银行股份有限公司 | 风险信息评估方法、装置、设备及存储介质 |
CN113450207A (zh) * | 2021-06-29 | 2021-09-28 | 重庆农村商业银行股份有限公司 | 一种智能催收方法、装置、设备及存储介质 |
CN114330370A (zh) * | 2022-03-17 | 2022-04-12 | 天津思睿信息技术有限公司 | 一种基于人工智能的自然语言处理系统及处理方法 |
CN115297212A (zh) * | 2022-06-25 | 2022-11-04 | 上海浦东发展银行股份有限公司 | 基于机器学习的语音机器人催收方法、系统、设备及介质 |
CN116862668A (zh) * | 2023-09-05 | 2023-10-10 | 杭州度言软件有限公司 | 一种提升催收效率的智能催收方法 |
CN117350696A (zh) * | 2023-12-05 | 2024-01-05 | 深圳市光速时代科技有限公司 | 一种智能手表对逾期任务数据的消除方法及系统 |
CN117350696B (zh) * | 2023-12-05 | 2024-05-31 | 深圳市光速时代科技有限公司 | 一种智能手表对逾期任务数据的消除方法及系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106952155A (zh) * | 2017-03-08 | 2017-07-14 | 深圳前海纵腾金融科技服务有限公司 | 一种基于信用评分的催收方法及装置 |
CN107229466A (zh) * | 2017-05-04 | 2017-10-03 | 中国建设银行股份有限公司 | 用于企业分支机构进行业务开发的方法、系统和存储介质 |
CN109377333A (zh) * | 2018-09-03 | 2019-02-22 | 平安科技(深圳)有限公司 | 电子装置、基于分类模型的催收员确定方法及存储介质 |
CN109949805A (zh) * | 2019-02-21 | 2019-06-28 | 江苏苏宁银行股份有限公司 | 基于意图识别及有限状态自动机的智能催收机器人及催收方法 |
CN110288460A (zh) * | 2019-04-24 | 2019-09-27 | 武汉众邦银行股份有限公司 | 基于前向传播的催收预测方法、装置、设备及存储介质 |
CN110782335A (zh) * | 2019-09-19 | 2020-02-11 | 平安科技(深圳)有限公司 | 基于人工智能处理信贷数据的方法、装置及存储介质 |
CN111192136A (zh) * | 2019-12-24 | 2020-05-22 | 中信百信银行股份有限公司 | 一种信贷业务的催收方法、装置、电子设备及存储介质 |
-
2020
- 2020-08-04 CN CN202010772740.2A patent/CN111882431A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106952155A (zh) * | 2017-03-08 | 2017-07-14 | 深圳前海纵腾金融科技服务有限公司 | 一种基于信用评分的催收方法及装置 |
CN107229466A (zh) * | 2017-05-04 | 2017-10-03 | 中国建设银行股份有限公司 | 用于企业分支机构进行业务开发的方法、系统和存储介质 |
CN109377333A (zh) * | 2018-09-03 | 2019-02-22 | 平安科技(深圳)有限公司 | 电子装置、基于分类模型的催收员确定方法及存储介质 |
CN109949805A (zh) * | 2019-02-21 | 2019-06-28 | 江苏苏宁银行股份有限公司 | 基于意图识别及有限状态自动机的智能催收机器人及催收方法 |
CN110288460A (zh) * | 2019-04-24 | 2019-09-27 | 武汉众邦银行股份有限公司 | 基于前向传播的催收预测方法、装置、设备及存储介质 |
CN110782335A (zh) * | 2019-09-19 | 2020-02-11 | 平安科技(深圳)有限公司 | 基于人工智能处理信贷数据的方法、装置及存储介质 |
CN111192136A (zh) * | 2019-12-24 | 2020-05-22 | 中信百信银行股份有限公司 | 一种信贷业务的催收方法、装置、电子设备及存储介质 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112381643A (zh) * | 2020-12-02 | 2021-02-19 | 浙江百应科技有限公司 | 一种基于可智能分案的催收方法、系统、终端及存储介质 |
CN112927719A (zh) * | 2021-01-22 | 2021-06-08 | 中信银行股份有限公司 | 风险信息评估方法、装置、设备及存储介质 |
CN113450207A (zh) * | 2021-06-29 | 2021-09-28 | 重庆农村商业银行股份有限公司 | 一种智能催收方法、装置、设备及存储介质 |
CN114330370A (zh) * | 2022-03-17 | 2022-04-12 | 天津思睿信息技术有限公司 | 一种基于人工智能的自然语言处理系统及处理方法 |
CN114330370B (zh) * | 2022-03-17 | 2022-05-20 | 天津思睿信息技术有限公司 | 一种基于人工智能的自然语言处理系统及处理方法 |
CN115297212A (zh) * | 2022-06-25 | 2022-11-04 | 上海浦东发展银行股份有限公司 | 基于机器学习的语音机器人催收方法、系统、设备及介质 |
CN116862668A (zh) * | 2023-09-05 | 2023-10-10 | 杭州度言软件有限公司 | 一种提升催收效率的智能催收方法 |
CN116862668B (zh) * | 2023-09-05 | 2023-11-24 | 杭州度言软件有限公司 | 一种提升催收效率的智能催收方法 |
CN117350696A (zh) * | 2023-12-05 | 2024-01-05 | 深圳市光速时代科技有限公司 | 一种智能手表对逾期任务数据的消除方法及系统 |
CN117350696B (zh) * | 2023-12-05 | 2024-05-31 | 深圳市光速时代科技有限公司 | 一种智能手表对逾期任务数据的消除方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111882431A (zh) | 一种基于nlp深度学习智能消息推送方法 | |
CN110837931B (zh) | 客户流失预测方法、装置及存储介质 | |
Finlay | Predictive analytics, data mining and big data: Myths, misconceptions and methods | |
US7328218B2 (en) | Constrained tree structure method and system | |
US8838491B2 (en) | Method and system for an integrated approach to collections cycle optimization | |
CN109300039A (zh) | 基于人工智能和大数据进行智能产品推荐的方法及系统 | |
CN105931068A (zh) | 一种持卡人消费画像的生成方法及装置 | |
CN111626766A (zh) | 一种融合多个机器学习模型的手机银行营销客户筛选方法 | |
CN112541817A (zh) | 一种个人消费贷款潜在客户的营销响应处理方法及系统 | |
CN113989019A (zh) | 识别风险的方法、装置、设备及存储介质 | |
CN115456745A (zh) | 小微企业画像构建方法及装置 | |
CN115545886A (zh) | 逾期风险识别方法、装置、设备及存储介质 | |
CN115082203A (zh) | 生息方案推送方法、装置、电子设备及存储介质 | |
Hu | Predicting and improving invoice-to-cash collection through machine learning | |
JP2018160258A (ja) | 情報処理装置、情報処理方法及びプログラム | |
Hsieh et al. | Enhancing consumer behavior analysis by data mining techniques | |
US20230100685A1 (en) | Financial product information collecting platform system, financial product information collecting method, and computer program for the same | |
Pandey et al. | Customer churn analysis in telecom organization | |
Choudhury et al. | Managing reverse exchange in the service supply chain using role activity diagram: a case study of credit card complaint management | |
Wu et al. | User portraits and investment planning based on accounting data | |
JP7231967B1 (ja) | 信用リスク判定システム及び信用リスク判定プログラム | |
Halsey et al. | Analyzing the Role of Digital Communication Channels in Debt Collection | |
CN116010509A (zh) | 一种基于信用卡系统描绘用户画像产生标签的方法 | |
Koyuncugil et al. | Financial profiling for detecting operational risk by data mining | |
Mvogo et al. | The determinants of the adoption of mobile money by small enterprises (SEs) in Douala, Cameroon |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |