CN113436010A - 一种实时识别公积金代缴贷款诈骗的系统、方法 - Google Patents

一种实时识别公积金代缴贷款诈骗的系统、方法 Download PDF

Info

Publication number
CN113436010A
CN113436010A CN202110910959.9A CN202110910959A CN113436010A CN 113436010 A CN113436010 A CN 113436010A CN 202110910959 A CN202110910959 A CN 202110910959A CN 113436010 A CN113436010 A CN 113436010A
Authority
CN
China
Prior art keywords
portrait
payment
module
client
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110910959.9A
Other languages
English (en)
Inventor
王萍
贾坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan XW Bank Co Ltd
Original Assignee
Sichuan XW Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan XW Bank Co Ltd filed Critical Sichuan XW Bank Co Ltd
Priority to CN202110910959.9A priority Critical patent/CN113436010A/zh
Publication of CN113436010A publication Critical patent/CN113436010A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Technology Law (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开了一种实时识别公积金代缴贷款诈骗的系统、方法,属于人工智能技术领域技术领域,主要基于住房公积金缴纳记录、企业工商信息和代缴公司名单库,构建客户画像、企业画像及交叉验证画像的模型特征,并融合集成学习算法AdaBoost和逻辑回归模型构建公积金代缴贷款诈骗识别模型,实时识别并拦截疑似公积金代缴贷款诈骗的客户,帮忙金融机构降低外部欺诈风险及不良风险。

Description

一种实时识别公积金代缴贷款诈骗的系统、方法
技术领域
本发明属于人工智能技术领域技术领域,具体涉及一种实时识别公积金代缴贷款诈骗的系统、方法。
背景技术
随着大数据、人工智能、云计算、区块链等技术的进步,社会征信体系的逐步完善,大数据风控逐步兴起,各金融机构均纷纷布局个人线上信贷业务,“线上”有望成为消费信贷重要的增长点。这类贷款,一般只需要通过搜集到的借款人信息,多维度给借款人画像,借助APP等线上渠道申请,几分钟就能给借款人提供数万元到数十万元额度不等的贷款。这样便捷贷款品种的出现,也给一些别有用心的人可乘之机。
不法分子建起以某黑客、金融从业者、管理者、操作手、洗钱团伙、出资方、猎头中介、一般贷款人在内的8级渠道,以垫缴公积金伪造征信记录后骗取银行贷款
现目前已经造成了银行大量个人贷款逾期,或将造成信贷资金重大损失,影响恶劣。目前已有部分银行暂停省内个人线上信贷产品,对于此类情况,现目前还暂时没有特定的针对手段。
为此,本文提出了一种实时识别公积金代缴贷款诈骗的系统、方法,主要基于住房公积金缴纳记录、企业工商信息和代缴公司名单库,构建客户画像、企业画像及交叉验证画像的模型特征,并融合集成学习算法AdaBoost和逻辑回归模型构建公积金代缴贷款诈骗识别模型,实时识别并拦截疑似公积金代缴贷款诈骗的客户,帮忙金融机构降低外部欺诈风险及不良风险。
发明内容
为了解决上述现有技术存在的缺陷,本发明的目的在于提供一种实时识别公积金代缴贷款诈骗的系统、方法,实现了公积金代缴贷款诈骗的闭环化自动实时识别,为公积金代缴贷款诈骗这种新型金融欺诈提供了新方法、新思路。
本发明采用的技术方案如下:
一种实时识别公积金代缴贷款诈骗的系统,包括:客户端信息收集模块、数据查询系统模块、特征计算模块、模型系统模块、风控系统模块、决策系统模块和案调系统模块,以上模块组合形成一个闭环化的系统,其中:
客户端信息收集模块,用于采集用户填写信息及设备等信息;
数据查询系统模块,基于客户端信息收集模块收集的客户主键信息进行三方数据源的查询汇总;
特征计算模块,基于数据查询系统查询的数据信息构建公积金代缴贷款诈骗的客户画像、企业画像,以及交叉验证画像,记样本特征集为
Figure 114242DEST_PATH_IMAGE001
Figure 752378DEST_PATH_IMAGE002
表示构建的特征个数,并将数据流传输至模型系统模块;
模型系统模块,进行公积金贷款诈骗模型的实时运算,并将模型结果传输至风控系统;
风控系统模块,进行公积金代缴诈骗的策略运算和风险判断;
决策系统模块,进行用户请求的通过拒绝的实时决策,如果客户被标记为高风险客户,系统自动将该风险客户传输至案调系统模块进行案调调查和风险核实;
案调系统模块,接受到公积金代缴贷款诈骗的高风险客户后,系统自动出发给审批同学进行案件排查,核实风险之后,由系统将公积金代缴公司加入“公积金代缴公司黑名单”中。
进一步的,所述决策系统模块包括实时决策子模块和准实时对接案调系统子模块。
一种实时识别公积金代缴贷款诈骗的方法,包括如下步骤:
步骤1:为保证公积金代缴贷款诈骗识别的准确率,用户在客户端进行授信申请时,客户端信息收集模块采集用户的工作单位、工作地址信息,在用户完成整个授信流程点击“提交”时,自动实时将客户的该笔授信请求传输至金融机构;
步骤2:数据查询系统模块收到客户端信息收集模块发起的一笔授信申请请求,自动解析其中的客户主键信息,并通过API接口的方式跟内外部数据系统进行查询交互,其中内部的数据源系统包括代缴公司黑名单库,外部的数据源系统包括人行系统的公积金缴纳记录和企业信用查询系统的工商企业信息;
步骤3:特征计算系统模块基于数据查询系统模块查询的数据信息,构建公积金代缴贷款诈骗的客户画像、企业画像,以及交叉验证画像,并记样本特征集为
Figure 717929DEST_PATH_IMAGE003
Figure 178866DEST_PATH_IMAGE002
表示构建的特征个数;
步骤4:模型系统模块基于Adaboost和逻辑回归模型,构建公积金代缴诈骗识别模型,假设训练样本数据集
Figure 888065DEST_PATH_IMAGE004
中包含
Figure 386567DEST_PATH_IMAGE002
个元素,记作
Figure 523019DEST_PATH_IMAGE005
,其中
Figure 736832DEST_PATH_IMAGE006
表示第
Figure 715633DEST_PATH_IMAGE007
个样本的特征集,
Figure 331291DEST_PATH_IMAGE008
表示第
Figure 373066DEST_PATH_IMAGE007
个样本对应的目标变量,
Figure 811525DEST_PATH_IMAGE008
取值为0或1,
Figure 862526DEST_PATH_IMAGE009
,样本目标变量集为
Figure 332691DEST_PATH_IMAGE010
步骤5:风控系统模块接收到模型系统模块将输出的模型结果
Figure 545366DEST_PATH_IMAGE011
,并部署模型策略规则,给贷款申请的客户打标,并输出公积金代缴诈骗风险等级
Figure 488699DEST_PATH_IMAGE012
和风险备注
Figure 343392DEST_PATH_IMAGE013
,设置公积金代缴贷款诈骗识别策略:当
Figure 933642DEST_PATH_IMAGE014
时,
Figure 585728DEST_PATH_IMAGE015
Figure 995849DEST_PATH_IMAGE016
;当
Figure 654233DEST_PATH_IMAGE017
时,
Figure 830481DEST_PATH_IMAGE018
Figure 650538DEST_PATH_IMAGE019
步骤6:决策系统模块接到收风控系统模块输出的公积金代缴诈骗风险等级
Figure 547956DEST_PATH_IMAGE012
和风险备注
Figure 747380DEST_PATH_IMAGE013
,对客户的该笔授信请求进行实时判断决策,输出授信决策结果
Figure 781064DEST_PATH_IMAGE020
,并将该结果准实时同步至案调系统;
步骤7:案调系统接受到公积金代缴贷款诈骗的高风险客户信息后,系统自动出发给审批部门进行案件排查,核实风险之后,由系统将公积金代缴公司加入“公积金代缴公司黑名单”中。
进一步的,所述步骤2具体为:以用户填写的公司名称以及人行公积金缴费单位为主键,查询用户填写的工作单位和人行公积金缴费单位是否在代缴公司黑名单库中、查询工作单位和人行公积金缴费单位的人行系统的公积金缴纳记录和企业信用查询系统的工商企业信息:
进一步的,所述步骤3具体包括:
步骤3.1:构建公积金代缴贷款诈骗客户画像,所述客户画像包括5个维度的内容:个人基础属性画像、个人行为属性画像、个人关联属性画像、个人公积金缴存画像和个人地域属性画像;
步骤3.2:构建公积金代缴贷款诈骗企业画像,所述企业画像包括企业资质画像、企业类型画像和企业状态画像;
步骤3.3:构建交叉验证画像,基于客户画像和企业画像,客户填写的信息和人行系统查询的公积金信息之间的信息比对构建交叉验证画像,所述交叉验证画像包括交叉验证时间画像和交叉验证地域画像。
进一步的,所述步骤4具体包括:
步骤4.1:初始化训练样本数据集
Figure 37602DEST_PATH_IMAGE004
的权值分布,权重集合记作
Figure 153807DEST_PATH_IMAGE021
Figure 888414DEST_PATH_IMAGE022
,其中
Figure 776604DEST_PATH_IMAGE023
表示训练迭代次数,
Figure 472552DEST_PATH_IMAGE024
Figure 78983DEST_PATH_IMAGE007
表示样本个数,
Figure 617280DEST_PATH_IMAGE025
Figure 625557DEST_PATH_IMAGE026
表示第
Figure 220967DEST_PATH_IMAGE023
次迭代过程中对应于第
Figure 314694DEST_PATH_IMAGE007
个样本特征集
Figure 656683DEST_PATH_IMAGE006
的权重,取值为[0,1]区间的任意实数,且满足
Figure 522395DEST_PATH_IMAGE027
,则初始化的权重集为
Figure 872660DEST_PATH_IMAGE029
Figure 585768DEST_PATH_IMAGE030
,设定初始权重为
Figure 568636DEST_PATH_IMAGE031
,即
Figure 243200DEST_PATH_IMAGE032
,其中
Figure 314449DEST_PATH_IMAGE033
步骤4.2:进行模型训练,通过逐步的改变样本权重,将分类效果较差的弱分类器逐步的强化成一个分类效果较好的强分类器,其中样本权重的高低,代表其在分类器训练过程中的重要程度。对于迭代次数
Figure 998240DEST_PATH_IMAGE023
Figure 835615DEST_PATH_IMAGE034
,按照以下步骤不断迭代优化模型效果;
步骤4.3:构建融合模型,基本分类器
Figure 681080DEST_PATH_IMAGE035
和系数
Figure 233765DEST_PATH_IMAGE036
构建训练样本集的最终融合模型预测集
Figure 455668DEST_PATH_IMAGE037
进一步的,所述步骤4.2具体包括:
步骤4.2.1:对于具有权重分布的权重集
Figure 413129DEST_PATH_IMAGE021
对应的训练数据集
Figure 698004DEST_PATH_IMAGE004
进行学习,采用逻辑回归模型作为基本分类器,得到模型对于样本的预测集
Figure 475336DEST_PATH_IMAGE038
,其中
Figure 500930DEST_PATH_IMAGE039
取值为0或1,
Figure 309967DEST_PATH_IMAGE040
步骤4.2.2:计算模型预测集
Figure 762814DEST_PATH_IMAGE035
在训练数据集
Figure 27442DEST_PATH_IMAGE004
上的分类误差率
Figure 594077DEST_PATH_IMAGE041
Figure 260551DEST_PATH_IMAGE042
,其中
Figure 884299DEST_PATH_IMAGE043
由此可知
Figure 367714DEST_PATH_IMAGE035
在训练数据集
Figure 735111DEST_PATH_IMAGE004
上的分类误差率
Figure 990511DEST_PATH_IMAGE044
就是被
Figure 50740DEST_PATH_IMAGE035
误分类样本的权重之和;
步骤4.2.3:计算模型预测集
Figure 27311DEST_PATH_IMAGE035
的系数
Figure 198398DEST_PATH_IMAGE036
,
Figure 573885DEST_PATH_IMAGE045
表示
Figure 559943DEST_PATH_IMAGE035
在最终分类器中的重要 程度,其中
Figure 20881DEST_PATH_IMAGE046
步骤4.2.4:更新训练数据集
Figure 730079DEST_PATH_IMAGE004
的权重分布
Figure 228581DEST_PATH_IMAGE047
.假设
Figure 365034DEST_PATH_IMAGE048
,则
Figure 578846DEST_PATH_IMAGE049
其中
Figure 557648DEST_PATH_IMAGE050
;由此可知,被基本分类器的样本的预测集
Figure 907726DEST_PATH_IMAGE035
误分类样本的权重变大,而被正确分类的样本缩小,这样通过不断扩大误分类样本的权重,使得最终样本的分类准确率得到提高。
进一步的,所述步骤6具体包括:
步骤6.1:实时决策子模块,授信决策结果
Figure 480659DEST_PATH_IMAGE020
包括“通过”和“拒绝”2种结果,“通过”表示该笔授信请求的客户为无风险客户,金融机构同意该笔授信请求;“拒绝”表示该笔授信请求的客户为高风险客户,金融机构拒绝该笔授信请求,当
Figure 916189DEST_PATH_IMAGE051
时,
Figure 970120DEST_PATH_IMAGE052
;当
Figure 440284DEST_PATH_IMAGE053
时,
Figure 918539DEST_PATH_IMAGE054
;随后,决策系统直接将授信决策结果
Figure 572856DEST_PATH_IMAGE020
返回至客户前端进行决策结果的同步和提示。
步骤6.2:准实时对接案调系统子模块,当决策系统完成授信决策结果
Figure 427548DEST_PATH_IMAGE020
的计算后,决策系统自动将
Figure 752219DEST_PATH_IMAGE055
的请求记录通过API接口的方式推送至案调系统
综上所述,由于采用了上述技术方案,本发明的有益效果是:
1、实现公积金代缴贷款诈骗的闭环化自动实时识别,为公积金代缴贷款诈骗这种新型金融欺诈提供了新方法、新思路。基于客户端信息收集模块、数据查询系统模块、特征计算模块、模型系统模块、风控系统模块、决策系统模块和案调系统模块组成的公积金代缴贷款诈骗系统 ,通过系统界面配置实现从信息过滤采集到特征模型计算、策略决策的全过程自动化。
2、基于集成方法Adaboost和逻辑回归模型构建的公积金代缴贷款诈骗融合模型,同时保留了2类算法的优点,不仅具有很高的精度,同时也具有很强的稳定性。
3、本文巧妙的构建公积金代缴贷款诈骗的客户画像、企业画像、以及交叉验证画像,多重画像的综合应用,大大提升了模型识别的准确率和有效性。
4、系统设计可用性高、可扩展性强,7个界面化的模块,支持各种自定义的需求,系统工具化程度高。
附图说明
本发明将通过例子并参照附图的方式说明,其中:
图1是本发明中一种实时识别公积金代缴贷款诈骗的系统设计方案;
图2是本发明中基于Adaboost的公积金代缴贷款诈骗模型训练过程流程图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
在本申请实施例的描述中,需要说明的是,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
下面结合图1~图2对本发明作详细说明。
在一次授信请求过程中,当用户在客户端线上完成授信申请、填写工作单位名称和工作单位地址,并点击“提交”操作后,客户端将该笔授信申请请求实时发送至金融机构进行风险决策。为识别该笔授信申请的客户是否为公积金代缴诈骗客户,本发明提出了一种实时识别公积金代缴贷款诈骗的系统方法。首先通过数据查询系统模块对接金融机构内外部数据系统,该模块将查询回来的数据信息汇总传到特征计算系统实时计算,并在模型系统进行公积金代缴贷款诈骗识别模型的运算,随后将模型结果传送至风控系统进行公积金代缴贷款诈骗风险识别,最后在决策系统进行实时授信拦截,并将授信结果反馈至客户端。与此同时,决策系统将疑似公积金代缴贷款诈骗高风险客户输出至案调系统进行真实标签的标记构建代缴公司名单库。一种实时识别公积金代缴贷款诈骗的系统设计方案见图1。
本发明提供了一种实时识别公积金代缴贷款诈骗的方法、系统,具体如下:
一种实时识别公积金代缴贷款诈骗的系统,包括:客户端信息收集模块、数据查询系统模块、特征计算模块、模型系统模块、风控系统模块、决策系统模块和案调系统模块,以上模块组合形成一个闭环化的系统,其中:
客户端信息收集模块,用于采集用户填写信息及设备等信息;
数据查询系统模块,基于客户端信息收集模块收集的客户主键信息进行三方数据源的查询汇总;
特征计算模块,基于数据查询系统查询的数据信息构建公积金代缴贷款诈骗的客户画像、企业画像,以及交叉验证画像,记样本特征集为
Figure 404305DEST_PATH_IMAGE056
Figure 814426DEST_PATH_IMAGE002
表示构建的特征个数,并将数据流传输至模型系统模块;
模型系统模块,进行公积金贷款诈骗模型的实时运算,并将模型结果传输至风控系统;
风控系统模块,进行公积金代缴诈骗的策略运算和风险判断;
决策系统模块,进行用户请求的通过拒绝的实时决策,如果客户被标记为高风险客户,系统自动将该风险客户传输至案调系统模块进行案调调查和风险核实;
案调系统模块,接受到公积金代缴贷款诈骗的高风险客户后,系统自动出发给审批同学进行案件排查,核实风险之后,由系统将公积金代缴公司加入“公积金代缴公司黑名单”中。
一种基于上述模块实时识别公积金代缴贷款诈骗的方法,
步骤1:为保证公积金代缴贷款诈骗识别的准确率,用户在客户端进行授信申请时,需要采集用户的工作单位、工作地址信息。在用户完成整个授信流程点击“提交”时,客户端自动实时将客户的该笔授信请求传输至金融机构;
步骤2:数据查询系统模块收到客户端发起的一笔授信申请请求,自动解析其中的客户主键信息,并通过API接口的方式跟内外部数据系统进行查询交互。内部的数据源包括代缴公司名单库,外部的数据源包括人行系统的公积金缴纳记录和企业信用查询系统的工商企业信息;
步骤2.1:代缴公司黑名单库。以用户填写的公司名称以及人行公积金缴费单位为主键,查询用户填写的工作单位是否在代缴公司黑名单库中、人行公积金缴费单位是否在代缴公司黑名单库中。
步骤2.2:人行系统的公积金缴纳记录。针对于公积金代缴贷款诈骗风险,其中一个关键维度是公积金缴纳记录,因此人行系统的公积金缴纳记录必不可少,核心信息需要包括:缴费单位、参缴地、参缴日期、参缴状态、月缴存额、单位缴存比例、个人缴存比例、初缴月份、缴至月份等9个字段。
步骤2.3:企业信用查询系统的工商企业信息。为精准刻画公积金代缴企业的企业画像,需要收集企业的工商信息,核心信息需包括:企业名称、登记状态、法定代表人、注册资本、成立日期、核准日期、所属省份、所属城市、所属区县、参保人数、企业类型、所属行业、企业地址、经营范围等14个字段。
步骤3:基于数据查询系统模块查询的数据信息构建公积金代缴贷款诈骗的客户画像、企业画像,以及交叉验证画像。记样本特征集为
Figure 207230DEST_PATH_IMAGE057
Figure 117899DEST_PATH_IMAGE002
表示构建的特征个数。构建公积金代缴贷款诈骗的客户画像、企业画像、以及交叉验证画像,多重画像的综合应用,大大提升了模型识别的准确率和有效性。
步骤3.1:构建公积金代缴贷款诈骗客户画像。客户画像包括5个维度的内容:个人基础属性画像、个人行为属性画像、个人关联属性画像、个人公积金缴存画像和个人地域属性画像。个人基础属性画像包括:性别、年领、生肖、属相、婚姻状态、学历、职业等;个人行为属性画像:贷款时点分布、贷款星期分析、是否深夜贷款、是否工作日贷款等;个人关联属性画像:手机号状态、手机号在网时长、联系人关系、关联网络等;个人公积金缴存画像:参缴状态、月缴存额、单位缴存比例、个人缴存比例、初缴月份、缴至月份等;个人地域属性画像:身份证归属地、IP地址、GPS地址、工作单位地址、家庭地址、公积金参缴地等。
步骤3.2:构建公积金代缴贷款诈骗企业画像。企业画像包括企业资质画像、企业类型画像和企业状态画像。企业资质画像包括注册资本、实缴资本、企业参保人数等。企业类型画像包括企业机构类型,如是否为有限责任公司(自然人独资)企业等;企业行业类型,如批发、零售、服务等行业。企业状态画像包括企业状态,如正常、迁出、吊销、存续、注销等;企业变更次数等。
步骤3.3:构建交叉验证画像。基于客户画像和企业画像,客户填写的信息和人行系统查询的公积金信息之间的信息比对构建交叉验证画像,包括交叉验证时间画像和交叉验证地域画像。交叉验证时间画像包括:企业注册时间距离企业核准时间的时间间隔、企业注册时间距离企业公积金缴纳时间的时间间隔、客户授信日期距离公积金参缴日期的时间间隔。交叉验证地域画像包括:用户填写的公司名称和公积金参缴公司是否一致,公积金参缴地是否和企业注册地址一致、用户填写的工作单位地址是否和企业注册地址一致等。
步骤4:基于Adaboost和逻辑回归模型,构建公积金代缴诈骗识别模型。假设训练样本数据集
Figure 203535DEST_PATH_IMAGE004
中包含
Figure 100953DEST_PATH_IMAGE002
个元素,记作
Figure 31869DEST_PATH_IMAGE058
,其中
Figure 334062DEST_PATH_IMAGE006
表示第
Figure 325020DEST_PATH_IMAGE007
个样本的特征集,
Figure 709734DEST_PATH_IMAGE008
表示第
Figure 464849DEST_PATH_IMAGE007
个样本对应的目标变量,
Figure 353039DEST_PATH_IMAGE008
取值为0或1,
Figure 46058DEST_PATH_IMAGE059
。样本目标变量集为
Figure 655418DEST_PATH_IMAGE060
。基于Adaboost的公积金代缴贷款诈骗模型训练过程流程图详见图2。基于集成方法Adaboost和逻辑回归模型构建的公积金代缴贷款诈骗融合模型,同时保留了2类算法的优点,不仅具有很高的精度,同时也具有很强的稳定性。
步骤4.1:初始化训练样本数据集
Figure 193716DEST_PATH_IMAGE004
的权值分布。权重集合记作
Figure 201992DEST_PATH_IMAGE021
Figure 797403DEST_PATH_IMAGE061
,其中
Figure 625550DEST_PATH_IMAGE023
表示训练迭代次数,
Figure 967539DEST_PATH_IMAGE062
Figure 830321DEST_PATH_IMAGE007
表示样本个数,
Figure 602493DEST_PATH_IMAGE063
Figure 183516DEST_PATH_IMAGE026
表示第
Figure 63616DEST_PATH_IMAGE023
次迭代过程中对应于第
Figure 777975DEST_PATH_IMAGE007
个样本特征集
Figure 983698DEST_PATH_IMAGE006
的权重,取值为[0,1]区间的任意实数,且满足
Figure 52017DEST_PATH_IMAGE064
。则初始化的权重集为
Figure 576112DEST_PATH_IMAGE029
Figure 421577DEST_PATH_IMAGE065
。设定初始权重为
Figure 974263DEST_PATH_IMAGE031
,即
Figure 196166DEST_PATH_IMAGE066
,其中
Figure 419205DEST_PATH_IMAGE067
步骤4.2:模型训练。通过逐步的改变样本权重,将分类效果较差的弱分类器逐步的强化成一个分类效果较好的强分类器,其中样本权重的高低,代表其在分类器训练过程中的重要程度。对于迭代次数
Figure 172922DEST_PATH_IMAGE023
Figure 215833DEST_PATH_IMAGE068
,按照以下步骤不断迭代优化模型效果。
步骤4.2.1:对于具有权重分布的权重集
Figure 241427DEST_PATH_IMAGE021
对应的训练数据集
Figure 808323DEST_PATH_IMAGE004
进行学习,采用逻辑回归模型作为基本分类器,得到模型对于样本的预测集
Figure 526749DEST_PATH_IMAGE069
,其中
Figure 791377DEST_PATH_IMAGE039
取值为0或1,
Figure 889171DEST_PATH_IMAGE070
步骤4.2.2:计算模型预测集
Figure 555644DEST_PATH_IMAGE035
在训练数据集
Figure 179392DEST_PATH_IMAGE004
上的分类误差率
Figure 931317DEST_PATH_IMAGE041
Figure 295783DEST_PATH_IMAGE071
,其中
Figure 816763DEST_PATH_IMAGE072
由此可知
Figure 611413DEST_PATH_IMAGE035
在训练数据集
Figure 587984DEST_PATH_IMAGE004
上的分类误差率
Figure 493492DEST_PATH_IMAGE044
就是被
Figure 134557DEST_PATH_IMAGE035
误分类样本的权重之和。
步骤4.2.3:计算模型预测集
Figure 97179DEST_PATH_IMAGE035
的系数
Figure 823695DEST_PATH_IMAGE036
,
Figure 532894DEST_PATH_IMAGE045
表示
Figure 765817DEST_PATH_IMAGE035
在最终分类器中的重要 程度,其中
Figure 902269DEST_PATH_IMAGE073
步骤4.2.4:更新训练数据集
Figure 850502DEST_PATH_IMAGE004
的权重分布
Figure 363392DEST_PATH_IMAGE047
.假设
Figure 444962DEST_PATH_IMAGE074
,则
Figure 752315DEST_PATH_IMAGE075
其中
Figure 719003DEST_PATH_IMAGE076
。由此可知,被基本分类器的样本的预测集
Figure 507355DEST_PATH_IMAGE035
误分类样本的权重变大,而被正确分类的样本缩小,这样通过不断扩大误分类样本的权重,使得最终样本的分类准确率得到提高。
步骤4.3:构建融合模型。基本分类器
Figure 711940DEST_PATH_IMAGE035
和系数
Figure 455774DEST_PATH_IMAGE036
构建训练样本集的最终融合模型预测集
Figure 399108DEST_PATH_IMAGE077
步骤5:模型系统模块将输出的模型结果
Figure 784958DEST_PATH_IMAGE011
传送至风控系统模块,并部署模型策略规则,给贷款申请的客户打标,并输出公积金代缴诈骗风险等级
Figure 844050DEST_PATH_IMAGE012
和风险备注
Figure 761715DEST_PATH_IMAGE013
。设置公积金代缴贷款诈骗识别策略:当
Figure 437416DEST_PATH_IMAGE078
时,
Figure 95799DEST_PATH_IMAGE079
Figure 6468DEST_PATH_IMAGE080
;当
Figure 92104DEST_PATH_IMAGE081
时,
Figure 723943DEST_PATH_IMAGE082
Figure 188947DEST_PATH_IMAGE083
步骤6:风控系统将公积金代缴诈骗风险等级
Figure 222631DEST_PATH_IMAGE012
和风险备注
Figure 744748DEST_PATH_IMAGE013
传输至决策系统,决策系统对客户的该笔授信请求进行实时判断决策,输出授信决策结果
Figure 126532DEST_PATH_IMAGE020
,并将该结果准实时同步至案调系统。该模块包括实时决策子模块和准实时对接案调系统子模块。
步骤6.1:授信决策结果
Figure 861139DEST_PATH_IMAGE020
包括“通过”和“拒绝”2种结果,“通过”表示该笔授信请求的客户为无风险客户,金融机构同意该笔授信请求;“拒绝”表示该笔授信请求的客户为高风险客户,金融机构拒绝该笔授信请求。当
Figure 14908DEST_PATH_IMAGE084
时,
Figure 176768DEST_PATH_IMAGE085
;当
Figure 317287DEST_PATH_IMAGE086
时,
Figure 590005DEST_PATH_IMAGE087
。随后,决策系统直接将授信决策结果
Figure 863861DEST_PATH_IMAGE020
返回至客户前端进行决策结果的同步和提示。
步骤6.2:准实时对接案调系统子模块。当决策系统完成授信决策结果
Figure 193692DEST_PATH_IMAGE020
的计算后,决策系统自动将
Figure 287419DEST_PATH_IMAGE088
的请求记录通过API接口的方式推送至案调系统。
步骤7:案调系统模块接受到公积金代缴贷款诈骗的高风险客户后,系统自动出发给审批同学进行案件排查,核实风险之后,由系统将公积金代缴公司加入“公积金代缴公司黑名单”中。
至此,以上模块组合形成一个闭环化的系统实时识别公积金代缴诈骗,系统设计可用性高、可扩展性强。7个界面化的模块,支持各种自定义的需求,系统工具化程度高。实现公积金代缴贷款诈骗的闭环化自动实时识别,为公积金代缴贷款诈骗这种新型金融欺诈提供了新方法、新思路。基于客户端信息收集模块、数据查询系统模块、特征计算模块、模型系统模块、风控系统模块、决策系统模块和案调系统模块组成的公积金代缴贷款诈骗系统,通过系统界面配置实现从信息过滤采集到特征模型计算、策略决策的全过程自动化。
以上所述实施例仅表达了本申请的具体实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请保护范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请技术方案构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。

Claims (8)

1.一种实时识别公积金代缴贷款诈骗的系统,其特征在于,包括:客户端信息收集模块、数据查询系统模块、特征计算模块、模型系统模块、风控系统模块、决策系统模块和案调系统模块,以上模块组合形成一个闭环化的系统,其中:
客户端信息收集模块,用于采集用户填写信息及设备信息;
数据查询系统模块,基于客户端信息收集模块收集的客户主键信息进行三方数据源的查询汇总;
特征计算模块,基于数据查询系统查询的数据信息构建公积金代缴贷款诈骗的客户画像、企业画像,以及交叉验证画像,记样本特征集为
Figure 55825DEST_PATH_IMAGE001
,N表示构建的特征个数,并将数据流传输至模型系统模块;
模型系统模块,进行公积金贷款诈骗模型的实时运算,并将模型结果传输至风控系统;
风控系统模块,进行公积金代缴诈骗的策略运算和风险判断;
决策系统模块,进行用户请求的通过拒绝的实时决策,如果客户被标记为高风险客户,系统自动将该风险客户传输至案调系统模块进行案调调查和风险核实;
案调系统模块,接受到公积金代缴贷款诈骗的高风险客户后,系统自动出发给审批同学进行案件排查,核实风险之后,由系统将公积金代缴公司加入“公积金代缴公司黑名单”中。
2.根据权利要求1所述的一种实时识别公积金代缴贷款诈骗的系统,其特征在于,所述决策系统模块包括实时决策子模块和准实时对接案调系统子模块。
3.一种实时识别公积金代缴贷款诈骗的方法,其特征在于,包括如下步骤:
步骤1:为保证公积金代缴贷款诈骗识别的准确率,用户在客户端进行授信申请时,客户端信息收集模块采集用户的工作单位、工作地址信息,在用户完成整个授信流程点击“提交”时,自动实时将客户的笔授信申请传输至金融机构;
步骤2:数据查询系统模块收到客户端信息收集模块发起的一笔授信申请请求,自动解析其中的客户主键信息,并通过API接口的方式跟内外部数据系统进行查询交互,其中内部的数据源系统包括代缴公司黑名单库,外部的数据源系统包括人行系统的公积金缴纳记录和企业信用查询系统的工商企业信息;
步骤3:特征计算系统模块基于数据查询系统模块查询的数据信息,构建公积金代缴贷款诈骗的客户画像、企业画像,以及交叉验证画像,并记样本特征集为
Figure 966143DEST_PATH_IMAGE002
Figure 366948DEST_PATH_IMAGE003
表示构建的特征个数;
步骤4:模型系统模块基于Adaboost和逻辑回归模型,构建公积金代缴诈骗识别模型,假设训练样本数据集
Figure 337309DEST_PATH_IMAGE004
中包含
Figure 68636DEST_PATH_IMAGE003
个元素,记作
Figure 514136DEST_PATH_IMAGE005
,其中
Figure 483360DEST_PATH_IMAGE006
表示第
Figure 624623DEST_PATH_IMAGE007
个样本的特征集,
Figure 574737DEST_PATH_IMAGE008
表示第
Figure 92437DEST_PATH_IMAGE007
个样本对应的目标变量,
Figure 712905DEST_PATH_IMAGE008
取值为0或1,
Figure 22139DEST_PATH_IMAGE009
,样本目标变量集为
Figure 462479DEST_PATH_IMAGE010
步骤5:风控系统模块接收到模型系统模块将输出的模型结果
Figure 252712DEST_PATH_IMAGE011
,并部署模型策略规则,给贷款申请的客户打标,并输出公积金代缴诈骗风险等级
Figure 993266DEST_PATH_IMAGE012
和风险备注
Figure 473401DEST_PATH_IMAGE013
,设置公积金代缴贷款诈骗识别策略:当
Figure 401037DEST_PATH_IMAGE014
时,
Figure 994960DEST_PATH_IMAGE015
Figure 321512DEST_PATH_IMAGE016
;当
Figure 975478DEST_PATH_IMAGE017
时,
Figure 390410DEST_PATH_IMAGE018
Figure 50674DEST_PATH_IMAGE019
步骤6:决策系统模块接到收风控系统模块输出的公积金代缴诈骗风险等级
Figure 234662DEST_PATH_IMAGE012
和风险备注
Figure 59530DEST_PATH_IMAGE013
,对客户的笔授信申请求进行实时判断决策,输出授信决策结果
Figure 693249DEST_PATH_IMAGE020
,并将该结果准实时同步至案调系统;
步骤7:案调系统接受到公积金笔授信申请代缴贷款诈骗的高风险客户信息后,系统自动出发给审批部门进行案件排查,核实风险之后,由系统将公积金代缴公司加入“公积金代缴公司黑名单”中。
4.根据权利要求3所述的一种实时识别公积金代缴贷款诈骗的方法,其特征在于,所述步骤2具体为:以用户填写的公司名称以及人行公积金缴费单位为主键,查询用户填写的工作单位和人行公积金缴费单位是否在代缴公司黑名单库中、查询工作单位和人行公积金缴费单位的人行系统的公积金缴纳记录和企业信用查询系统的工商企业信息。
5.根据权利要求4所述的一种实时识别公积金代缴贷款诈骗的方法,其特征在于,所述步骤3具体包括:
步骤3.1:构建公积金代缴贷款诈骗客户画像,所述客户画像包括5个维度的内容:个人基础属性画像、个人行为属性画像、个人关联属性画像、个人公积金缴存画像和个人地域属性画像;
步骤3.2:构建公积金代缴贷款诈骗企业画像,所述企业画像包括企业资质画像、企业类型画像和企业状态画像;
步骤3.3:构建交叉验证画像,基于客户画像和企业画像,客户填写的信息和人行系统查询的公积金信息之间的信息比对构建交叉验证画像,所述交叉验证画像包括交叉验证时间画像和交叉验证地域画像。
6.根据权利要求5所述的一种实时识别公积金代缴贷款诈骗的方法,其特征在于,所述步骤4具体包括:
步骤4.1:初始化训练样本数据集
Figure 160133DEST_PATH_IMAGE004
的权值分布,权重集合记作
Figure 198628DEST_PATH_IMAGE021
Figure 194397DEST_PATH_IMAGE022
,其中
Figure 416929DEST_PATH_IMAGE023
表示训练迭代次数,
Figure 156346DEST_PATH_IMAGE024
Figure 49346DEST_PATH_IMAGE007
表示样本个数,
Figure 478666DEST_PATH_IMAGE025
Figure 89907DEST_PATH_IMAGE026
表示第
Figure 633015DEST_PATH_IMAGE023
次迭代过程中对应于第
Figure 643172DEST_PATH_IMAGE007
个样本特征集
Figure 246323DEST_PATH_IMAGE006
的权重,取值为[0,1]区间的任意实数,且满足
Figure 79281DEST_PATH_IMAGE027
,则初始化的权重集为
Figure 556322DEST_PATH_IMAGE029
Figure 64795DEST_PATH_IMAGE030
,设定初始权重为
Figure 650628DEST_PATH_IMAGE031
,即
Figure 798188DEST_PATH_IMAGE032
,其中
Figure 520288DEST_PATH_IMAGE033
步骤4.2:进行模型训练,通过逐步的改变样本权重,将分类效果较差的弱分类器逐步的强化成一个分类效果较好的强分类器,其中样本权重的高低,代表其在分类器训练过程中的重要程度;
对于迭代次数
Figure 465241DEST_PATH_IMAGE023
Figure 269862DEST_PATH_IMAGE034
,按照以下步骤不断迭代优化模型效果;
步骤4.3:构建融合模型,基本分类器
Figure 958463DEST_PATH_IMAGE035
和系数
Figure 800648DEST_PATH_IMAGE036
构建训练样本集的最终融合模型预测集
Figure 647994DEST_PATH_IMAGE037
7.根据权利要求6所述的一种实时识别公积金代缴贷款诈骗的方法,其特征在于,所述步骤4.2具体包括:
步骤4.2.1:对于具有权重分布的权重集
Figure 473999DEST_PATH_IMAGE021
对应的训练数据集
Figure 700712DEST_PATH_IMAGE004
进行学习,采用逻辑回归模型作为基本分类器,得到模型对于样本的预测集
Figure 397403DEST_PATH_IMAGE038
,其中
Figure 681230DEST_PATH_IMAGE039
取值为0或1,
Figure 463372DEST_PATH_IMAGE040
步骤4.2.2:计算模型预测集
Figure 493776DEST_PATH_IMAGE035
在训练数据集
Figure 65482DEST_PATH_IMAGE004
上的分类误差率
Figure 788719DEST_PATH_IMAGE041
Figure 58157DEST_PATH_IMAGE042
,其中
Figure 623743DEST_PATH_IMAGE043
由此可知
Figure 295027DEST_PATH_IMAGE035
在训练数据集
Figure 189165DEST_PATH_IMAGE004
上的分类误差率
Figure 411811DEST_PATH_IMAGE044
就是被
Figure 49597DEST_PATH_IMAGE035
误分类样本的权重之和;
步骤4.2.3:计算模型预测集
Figure 575387DEST_PATH_IMAGE035
的系数
Figure 109268DEST_PATH_IMAGE036
,
Figure 615948DEST_PATH_IMAGE045
表示
Figure 526267DEST_PATH_IMAGE035
在最终分类器中的重要 程度,其中
Figure 906563DEST_PATH_IMAGE046
步骤4.2.4:更新训练数据集
Figure 139574DEST_PATH_IMAGE004
的权重分布
Figure 339742DEST_PATH_IMAGE047
.假设
Figure 53752DEST_PATH_IMAGE048
,则
Figure 551205DEST_PATH_IMAGE049
其中
Figure 692467DEST_PATH_IMAGE050
;由此可知,被基本分类器的样本的预测集
Figure 645511DEST_PATH_IMAGE035
误分类样本的权重变大,而被正确分类的样本缩小,这样通过不断扩大误分类样本的权重,使得最终样本的分类准确率得到提高。
8.根据权利要求7所述的一种实时识别公积金代缴贷款诈骗的方法,其特征在于,所述步骤6具体包括:
步骤6.1:实时决策子模块,授信决策结果
Figure 894702DEST_PATH_IMAGE020
包括“通过”和“拒绝”2种结果,“通过”表示笔授信申请的客户为无风险客户,金融机构同意笔授信申请;“拒绝”表示笔授信申请的客户为高风险客户,金融机构拒绝笔授信申请,当
Figure 984012DEST_PATH_IMAGE051
时,
Figure 561755DEST_PATH_IMAGE052
;当
Figure 999165DEST_PATH_IMAGE053
时,
Figure 54977DEST_PATH_IMAGE054
;随后,决策系统直接将授信决策结果
Figure 529952DEST_PATH_IMAGE020
返回至客户前端进行决策结果的同步和提示;
步骤6.2:准实时对接案调系统子模块,当决策系统完成授信决策结果
Figure 13017DEST_PATH_IMAGE020
的计算后,决策系统自动将
Figure 961160DEST_PATH_IMAGE055
的请求记录通过API接口的方式推送至案调系统。
CN202110910959.9A 2021-08-10 2021-08-10 一种实时识别公积金代缴贷款诈骗的系统、方法 Pending CN113436010A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110910959.9A CN113436010A (zh) 2021-08-10 2021-08-10 一种实时识别公积金代缴贷款诈骗的系统、方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110910959.9A CN113436010A (zh) 2021-08-10 2021-08-10 一种实时识别公积金代缴贷款诈骗的系统、方法

Publications (1)

Publication Number Publication Date
CN113436010A true CN113436010A (zh) 2021-09-24

Family

ID=77763089

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110910959.9A Pending CN113436010A (zh) 2021-08-10 2021-08-10 一种实时识别公积金代缴贷款诈骗的系统、方法

Country Status (1)

Country Link
CN (1) CN113436010A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107993146A (zh) * 2018-01-25 2018-05-04 深圳市前海吉顺信科技发展有限公司 金融大数据的风控方法及系统
CN109191281A (zh) * 2018-08-21 2019-01-11 重庆富民银行股份有限公司 一种基于知识图谱的团体欺诈识别系统
CN110717816A (zh) * 2019-07-15 2020-01-21 上海氪信信息技术有限公司 一种基于人工智能技术的全域金融风险知识图谱构建方法
CN111401907A (zh) * 2020-03-11 2020-07-10 杭州首新网络科技有限公司 一种数据维度化金融大数据的智能风控方法
CN112581265A (zh) * 2020-12-23 2021-03-30 百维金科(上海)信息科技有限公司 一种基于AdaBoost的互联网金融客户申请欺诈检测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107993146A (zh) * 2018-01-25 2018-05-04 深圳市前海吉顺信科技发展有限公司 金融大数据的风控方法及系统
CN109191281A (zh) * 2018-08-21 2019-01-11 重庆富民银行股份有限公司 一种基于知识图谱的团体欺诈识别系统
CN110717816A (zh) * 2019-07-15 2020-01-21 上海氪信信息技术有限公司 一种基于人工智能技术的全域金融风险知识图谱构建方法
CN111401907A (zh) * 2020-03-11 2020-07-10 杭州首新网络科技有限公司 一种数据维度化金融大数据的智能风控方法
CN112581265A (zh) * 2020-12-23 2021-03-30 百维金科(上海)信息科技有限公司 一种基于AdaBoost的互联网金融客户申请欺诈检测方法

Similar Documents

Publication Publication Date Title
US20210224902A1 (en) Systems and methods for electronic account certification and enhanced credit reporting
Jagtiani et al. Fintech lending: Financial inclusion, risk pricing, and alternative information
Haron et al. Factors influencing small medium enterprises (SMES) in obtaining loan
CN110458693A (zh) 一种企业贷款自动审批方法、装置、存储介质及电子设备
US20100076873A1 (en) Fee refund management
JP2022520824A (ja) インテリジェント警告システム
CN112598500A (zh) 一种无额度客户的授信处理方法及系统
US20140244479A1 (en) Process for Utilizing Web Data In Making Lending Decisions
WO2014121125A2 (en) Methods and systems for processing debt portfolios
CN110796539A (zh) 一种征信评估方法及装置
CN110728568A (zh) 一种面向征信空白客户的授信额度方法以及系统
Victor Foreign aid for capacity building to address climate change
Xu et al. On education level and terms in obtaining P2P funding: New evidence from China
Muhammad et al. The determinants of potential failure of islamic peer-to-peer lending: perceptions of stakeholders in Indonesia
Paseková et al. Towards financial sustainability of companies: issues related to reporting errors
Sadok et al. The contribution of AI-Based analysis and rating models to financial inclusion: the Lenddo case for women-led SMEs in developing countries
Rodríguez et al. Management of Customer Collections and Delinquencies at Banco Azteca in Jaen–2020
CN112634016A (zh) 一种基于社区物业数据进行授信的系统及方法
US20220398583A1 (en) Transaction reconciliation and deduplication
CN113436010A (zh) 一种实时识别公积金代缴贷款诈骗的系统、方法
CN115423601A (zh) 一种线上贷产品设计方法及装置
CN114565450A (zh) 一种基于逾期共债的催收策略确定方法及相关设备
Romero The effects of usury ceilings on consumers welfare: Evidence from the microcredit market in colombia
CN113706258A (zh) 基于组合模型的产品推荐方法、装置、设备及存储介质
KR102021477B1 (ko) 다매체 빅데이터 매칭 패턴 분석을 활용한 신용평가 기반의 선지급 예약 후상환 자동결제 서비스 제공 시스템

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210924