CN111582757B - 欺诈风险的分析方法、装置、设备及计算机可读存储介质 - Google Patents
欺诈风险的分析方法、装置、设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN111582757B CN111582757B CN202010434274.7A CN202010434274A CN111582757B CN 111582757 B CN111582757 B CN 111582757B CN 202010434274 A CN202010434274 A CN 202010434274A CN 111582757 B CN111582757 B CN 111582757B
- Authority
- CN
- China
- Prior art keywords
- risk
- fraud
- data
- fraud risk
- analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 66
- 238000012502 risk assessment Methods 0.000 claims abstract description 90
- 238000004458 analytical method Methods 0.000 claims abstract description 32
- 238000009795 derivation Methods 0.000 claims abstract description 20
- 238000012544 monitoring process Methods 0.000 claims abstract description 19
- 238000011156 evaluation Methods 0.000 claims description 47
- 230000008569 process Effects 0.000 claims description 19
- 238000011002 quantification Methods 0.000 claims description 14
- 238000007619 statistical method Methods 0.000 claims description 8
- 238000011158 quantitative evaluation Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 4
- 238000005516 engineering process Methods 0.000 abstract description 6
- 230000004044 response Effects 0.000 abstract description 4
- 230000002776 aggregation Effects 0.000 description 6
- 238000004220 aggregation Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 230000006399 behavior Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000006978 adaptation Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 208000001613 Gambling Diseases 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000001680 brushing effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000001212 derivatisation Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 235000003642 hunger Nutrition 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000012954 risk control Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/018—Certifying business or products
- G06Q30/0185—Product, service or business identity fraud
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/06—Asset management; Financial planning or analysis
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Finance (AREA)
- General Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Marketing (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Educational Administration (AREA)
- Technology Law (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明涉及金融科技技术领域,公开了一种欺诈风险的分析方法、装置、设备及计算机可读存储介质。该欺诈风险的分析方法包括:从预设数据源获取风险画像数据,其中,所述预设数据源包括外部数据源和内部数据源;然后,对所述风险画像数据进行分类存储以形成风险数据集,并针对所述风险数据集进行数据基础衍生得到欺诈变量;最后根据所述欺诈变量生成预设主题对应的欺诈风险标签。实现了从数据采集、衍生到风险分析全流程和多维度进行风险的监控和分析,不仅确保了风险分析结果的全面性和准确性,更能提高业务欺诈风险分析的响应速度,综合提升了对业务欺诈风险的分析效率。
Description
技术领域
本发明涉及金融科技(Fintech)技术领域,尤其涉及一种欺诈风险的分析方法、装置、设备及计算机可读存储介质。
背景技术
随着计算机技术的发展,越来越多的技术应用在金融领域,传统金融业正在逐步向金融科技(Fintech)转变,但由于金融行业的安全性、实时性要求,也对技术提出了更高的要求。
关于金融业务欺诈风险的分析主要是关注于针对大数据的深入解析与挖掘。目前所常采用的方式多从算法模型和用户画像两个角度对客户群体进行分析,在单个主题、单个维度或者单个金融业务场景下,已经取得了较好的应用效果。然而,伴随着金融业务的快速发展,业务类型以及场景的变化不断衍生,如此,传统仅针对单个主题、维度或者业务场景进行欺诈风险分析的方式,难以快速响应并得出全面综合性的风险分析结果用于风险控制,无法满足金融业务的发展需求。
发明内容
本发明的主要目的在于提供一种欺诈风险的分析方法、装置、设备及计算机可读存储介质,旨在解决现有的关于金融业务欺诈风险的分析方式,难以快速响应并得出全面综合性的风险分析结果的问题。
为实现上述目的,本发明提供一种欺诈风险的分析方法,所述欺诈风险的分析方法包括:
从预设数据源获取风险画像数据,其中,所述预设数据源包括外部数据源和内部数据源;
对所述风险画像数据进行分类存储以形成风险数据集,并针对所述风险数据集进行数据基础衍生得到欺诈变量;
根据所述欺诈变量生成预设主题对应的欺诈风险标签。
可选地,在所述根据所述欺诈变量生成预设主题对应的欺诈风险标签的步骤之后,还包括:
对所述欺诈风险标签进行风险量化评估得到评估结果,并根据所述评估结果提取目标欺诈变量和目标欺诈风险标签进行迭代监控。
可选地,所述对所述欺诈风险标签进行风险量化评估得到评估结果的步骤,包括:
计算所述欺诈风险标签的规则表现数据,其中,所述规则表现数据包括:影响面、准确率、贡献度和提升度;
根据影响面、准确率、贡献度和提升度对所述欺诈风险标签进行风险量化评估得到评估结果,其中,所述评估结果用于标识所述欺诈风险标签是否适用于业务的欺诈风险分析。
可选地,所述预设主题包括业务主题,所述根据所述欺诈变量生成预设主题对应的欺诈风险标签的步骤,包括:
获取所述业务主题对应的业务流程,以及所述业务流程对应的各通用标签;
将所述欺诈变量分别与各所述通用标签进行适配以得到目标通用标签,并将所述目标通用标签作为所述欺诈风险标签。
可选地,所述预设主题还包括策略主题,所述根据所述欺诈变量生成预设主题对应的欺诈风险标签的步骤,还包括:
从所述欺诈变量中提取所述策略主题指向的业务关键信息,其中,所述业务关键信息包括业务的节点信息或者风控对象信息;
根据所述节点信息或者所述风控对象信息生成所述欺诈风险标签。
可选地,所述从预设数据源获取风险画像数据的步骤包括:
构建预设风险画像,并获取所述风险画像对应的主键信息;
按照所述键信息分别从所述外部数据源和内部数据源中采集数据作为风险画像数据。
可选地,在所述从预设数据源获取风险画像数据的步骤之后,还包括:
交叉比对所述风险画像数据,以进行欺诈风险的关联和聚集分析。
可选地,所述针对所述风险数据集进行数据基础衍生得到欺诈变量的步骤,包括:
按照所述风险数据集的数据类型,分别提取所述风险数据集中的变量数据;
基于统计分析对所述变量数据进行基础衍生得到欺诈变量。
此外,为实现上述目的,本发明还提供一种欺诈风险的分析装置,所述欺诈风险的分析装置包括:
数据获取模块,用于从预设数据源获取风险画像数据,其中,所述预设数据源包括外部数据源和内部数据源;
数据处理模块,用于对所述风险画像数据进行分类存储以形成风险数据集,并针对所述风险数据集进行数据基础衍生得到欺诈变量;
风险分析模块,用于根据所述欺诈变量生成预设主题对应的欺诈风险标签。
此外,为实现上述目的,本发明还提供一种欺诈风险的分析设备,所述欺诈风险的分析设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的欺诈风险的分析程序,所述欺诈风险的分析程序被所述处理器执行时实现如上所述的欺诈风险的分析方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有欺诈风险的分析程序,所述欺诈风险的分析程序被处理器执行时实现如上所述的欺诈风险的分析方法的步骤。
本发明提供一种欺诈风险的分析方法、装置、设备及计算机可读存储介质,从预设数据源获取风险画像数据,其中,所述预设数据源包括外部数据源和内部数据源;然后,对所述风险画像数据进行分类存储以形成风险数据集,并针对所述风险数据集进行数据基础衍生得到欺诈变量;最后根据所述欺诈变量生成预设主题对应的欺诈风险标签。
本发明针对金融业务进行欺诈风险的分析,通过从金融业务发布机构的内部数据源以及外部数据源中获取用户的风险画像数据以构建风险数据集,提升了用于风险分析的基础数据的完整性,此外,基于用户的风险画像数据衍生得到欺诈变量,并结合该欺诈变量分析生成不同预设主题下多维度的欺诈风险标签,实现了从数据采集、衍生到风险分析全流程和多维度进行风险的监控和分析,不仅确保了风险分析结果的全面性和准确性,更能提高业务欺诈风险分析的响应速度,因此,本发明可综合提升针对业务欺诈风险的分析效率,满足金融业务的发展需求。
附图说明
图1为本发明实施例方案涉及的硬件运行环境的设备结构示意图;
图2为本发明欺诈风险的分析方法第一实施例的流程示意图;
图3为本发明欺诈风险的分析装置第一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的设备结构示意图。
本发明实施例欺诈风险的分析设备可以是智能手机,也可以是PC(PersonalComputer,个人计算机)、平板电脑、便携计算机等终端设备。
如图1所示,该欺诈风险的分析设备可以包括:处理器1001,例如CPU,通信总线1002,用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如Wi-Fi接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的欺诈风险的分析设备结构并不构成对欺诈风险的分析设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及欺诈风险的分析程序。
在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端,与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的欺诈风险的分析程序,并执行以下操作:
从预设数据源获取风险画像数据,其中,所述预设数据源包括外部数据源和内部数据源;
对所述风险画像数据进行分类存储以形成风险数据集,并针对所述风险数据集进行数据基础衍生得到欺诈变量;
根据所述欺诈变量生成预设主题对应的欺诈风险标签。
进一步地,处理器1001可以调用存储器1005中存储的欺诈风险的分析程序,在执行根据所述欺诈变量生成预设主题对应的欺诈风险标签之后,还执行以下操作:
对所述欺诈风险标签进行风险量化评估得到评估结果,并根据所述评估结果提取目标欺诈变量和目标欺诈风险标签进行迭代监控。
进一步地,处理器1001可以调用存储器1005中存储的欺诈风险的分析程序,还执行以下操作:
计算所述欺诈风险标签的规则表现数据,其中,所述规则表现数据包括:影响面、准确率、贡献度和提升度;
根据影响面、准确率、贡献度和提升度对所述欺诈风险标签进行风险量化评估得到评估结果,其中,所述评估结果用于标识所述欺诈风险标签是否适用于业务的欺诈风险分析。
进一步地,所述预设主题包括业务主题,处理器1001可以调用存储器1005中存储的欺诈风险的分析程序,还执行以下操作:
获取所述业务主题对应的业务流程,以及所述业务流程对应的各通用标签;
将所述欺诈变量分别与各所述通用标签进行适配以得到目标通用标签,并将所述目标通用标签作为所述欺诈风险标签。
进一步地,所述预设主题还包括策略主题,处理器1001可以调用存储器1005中存储的欺诈风险的分析程序,还执行以下操作:
从所述欺诈变量中提取所述策略主题指向的业务关键信息,其中,所述业务关键信息包括业务的节点信息或者风控对象信息;
根据所述节点信息或者所述风控对象信息生成所述欺诈风险标签。
进一步地,处理器1001可以调用存储器1005中存储的欺诈风险的分析程序,还执行以下操作:
构建预设风险画像,并获取所述风险画像对应的主键信息;
按照所述键信息分别从所述外部数据源和内部数据源中采集数据作为风险画像数据。
进一步地,处理器1001可以调用存储器1005中存储的欺诈风险的分析程序,在执行从预设数据源获取风险画像数据之后,还执行以下操作:
交叉比对所述风险画像数据,以进行欺诈风险的关联和聚集分析。
进一步地,处理器1001可以调用存储器1005中存储的欺诈风险的分析程序,还执行以下操作:
按照所述风险数据集的数据类型,分别提取所述风险数据集中的变量数据;
基于统计分析对所述变量数据进行基础衍生得到欺诈变量。
基于上述硬件结构,提出本发明欺诈风险的分析方法的各实施例。
本发明提供一种欺诈风险的分析方法。
参照图2,图2为本发明欺诈风险的分析方法第一实施例的流程示意图。
在本实施例中,该欺诈风险的分析方法包括:
步骤S10,从预设数据源获取风险画像数据,其中,所述预设数据源包括外部数据源和内部数据源;
本实施例的欺诈风险的分析方法是由欺诈风险的分析设备实现的,该设备以多个用户主键信息为对应主题,分别从所处金融业务发布机构的内部数据源以及外部数据源中,获取与该各用户主键信息为对应主题下的风险画像数据。
需要说明是,在本实施例中,用户主键信息包括但不限于用户的身份证号码、社交账号以及手机号码等等;内部数据源具体可以是该欺诈风险的分析设备当前所处金融发布业务行内存储用户基础数据的数据源,外部数据源具体可以是该欺诈风险的分析设备当前所处机构所采购,以从外部采集用户基础数据的数据源。
进一步地,在一种实施例中,步骤S10,可以包括:
步骤S101,构建预设风险画像,并获取所述风险画像对应的主键信息;
欺诈风险的分析设备以主键信息为主题预先构建用户对应的风险画像(例如,以人为主题的风险画像,以社交账号为主题的风险画像,以手机为主题的风险画像以及以居住地址、设备与环境为主题的风险画像等),然后提取各风险画像各自所对应的主键信息(即用户的身份证号码、社交账号以及手机号码等等)。
步骤S102,按照所述键信息分别从所述外部数据源和内部数据源中采集数据作为风险画像数据。
欺诈风险的分析设备按照提取得到的用户的身份证号码、社交账号以及手机号码等主键信息,分别从所处金融发布业务行内存储用户基础数据的内部数据源,以及所处机构所采购用户基础数据的外部数据源中,获取用户基础数据以进行对预先构建的风险画像的收集。
在本实施例中,在内部数据源中针对用户某一类型潜在风险(例如“资金饥渴”)的基础数据较少时,即可从外部数据源中采集与该类型潜在风险所相关联的基础数据,(例如,从外部数据源中采集用户的社交账号的数据,以供后续结合该社交账号的数据来获知该用户所存在的风险行为),确保了进行欺诈风险分析的基础数据的完整性。
进一步地,在一种实施例中,在步骤S10之后,还包括:
步骤S40,交叉比对所述风险画像数据,以进行欺诈风险的关联和聚集分析。
欺诈风险的分析设备针对分别从内部数据源以及外部数据源中获取得到的风险画像数据之后,基于该风险画像数据进行横向以及总线的交叉比对,从而进行用户针对金融业务所存储欺诈风险的关联和聚集分析。
具体地,例如,欺诈风险的分析设备在以用户主键信息当中的手机号码,分别从内部数据源以及外部数据源中,收集到各风险画像数据之后,对该各风险画像数据进行横向的比对,发现同一手机号码存在两个不存在其他关联的用户针对同一金融业务的申请注册,则欺诈风险的分析设备将该两个用户的风险画像数据进行统计聚集,或者,欺诈风险的分析设备针对各风险画像数据进行纵向的比对,并发现同一用户存在分别针对多个不同金融业务的申请行为,从而欺诈风险的分析设备将该用户的风险画像数据进行统计聚集
在本实施例中,通过针对采集到的风险画像数据进行横向和总线的交叉比对,从而进行用户针对金融业务所存储欺诈风险的关联和聚集分析,进而基于用户的风险画像数据衍生得到新的风险信息,提升了欺诈风险分析的全面性和准确性。
步骤S20,对所述风险画像数据进行分类存储以形成风险数据集,并针对所述风险数据集进行数据基础衍生得到欺诈变量;
欺诈风险的分析设备针对分别从内部数据源以及外部数据源中获取得到的风险画像数据,按照各自所对应主题进行分类存储,从而形成用户的风险数据集(具体地,例如,欺诈风险的分析设备在以用户的身份证号码、社交账号以及手机号码等主键信息,分别从内部数据源以及外部数据源中,收集到用户的风险画像数据之后,分别以各主键信息为主题分表将该风险画像数据作为风险数据集存储至后端数据库当中),然后,欺诈风险的分析设备利用现有的统计分析方法,针对用户的风险数据集进行数据的基础衍生,从而得到用户针对金融业务所存在的与欺诈相关的欺诈变量。
进一步地,在一种实施例中,步骤S20中,“针对所述风险数据集进行数据基础衍生得到欺诈变量”的步骤,可以包括:
步骤S201,按照所述风险数据集的数据类型,分别提取所述风险数据集中的变量数据;
欺诈风险的分析设备在将采集到的用户的风险画像数据分类进行存储至后端数据库形成风险数据集之后,按照所存储时用户的风险画像数据的不同数据类型,分别提取该风险画像数据集中用户基础的变量数据。
步骤S202,基于统计分析对所述变量数据进行基础衍生得到欺诈变量。
欺诈风险的分析设备针对从不同数据类型的风险画像数据集中提取出的变量(结构化数据或者非结构化数据),利用数据查询、中文模糊匹配、实时计算以及语义分析等现有成熟的数据统计分析方法,对该呈结构化或者非结构化的变量进行基础衍生,从而对应输出“身份真实性”、“社交账号安全等级”、“居住稳定性”、“高风险地区”和“申请行为异常”等用户针对金融业务所存在的与欺诈相关的欺诈变量。具体地,例如,欺诈风险的分析设备利用实时计算的数据统计分析方法,按照设定的“WeSee指标”,通过内部数据源和外部数据源关于用户的身份证号码、社交账号以及手机号码等主键信息的关联,形成跨金融业务产品、多维度的批量数据计算——当客户申请贷款业务产品时,实时计算出该客户在多个时间切片下的申请次数、跨产品申请次数、刷脸次数等多类指标,然后将该多类指标均作为客户申请行为异常的监控维度之一。
步骤S30,根据所述欺诈变量生成预设主题对应的欺诈风险标签。
欺诈风险的分析设备在得到用户针对金融业务所存在的与欺诈相关的欺诈变量后,结合该欺诈变量和预先设定的业务和策略两个预设主题,生成与该预设主题下所建立标签信息所对应的欺诈风险标签,并将该欺诈风险标签与用户进行关联输出。
需要说明的是,在本实施例中,预设主题包括:业务主题和策略主题,欺诈风险的分析设备分别从该业务主题和策略主题建立监控指标。在业务主题下,欺诈风险的分析设备按照业务的“审批”和“还款”建立了能够支持多项金融业务产品的通用指标,该通用指标包括但不限于:审批阶段的“规则命中率”、“审批通过率”、“成交转化率”,以及还款(贷后)阶段的“短表现期坏样本”和长表现期坏样本;此外,在策略主题下,分别针对金融业务的核心环节和具体风控对象设定多个维度的标签信息,该标签信息包括但不限于:“身份存疑”、“资金饥渴”、“信用较差”、“负债较多”、“时间异常”、“涉黑、涉赌”以及“信贷中介”等等。
进一步地,在一种实施例中,上述步骤S30,可以包括:
步骤S301,获取所述业务主题对应的业务流程,以及所述业务流程对应的各通用标签;
步骤S302,将所述欺诈变量分别与各所述通用标签进行适配以得到目标通用标签,并将所述目标通用标签作为所述欺诈风险标签。
欺诈风险的分析设备获取预先在业务主题下设定金融业务产品的通用指标时所依据的业务流程——“审批”和“还款”,然后进一步分别获取在该“审批”流程下设定的各个通用标签——““规则命中率”、“审批通过率”和“成交转化率”以及在该“还款”流程下设定的各个通用标签——“短表现期坏样本”和“长表现期坏样本”,然后,欺诈风险的分析设备将针对用户的风险数据集进行基础衍生从而得到的欺诈变量,逐一分别与设定的“审批”流程的各个通用标签——“规则命中率”、“审批通过率”和“成交转化率”,以及“还款”的各个通用标签——“短表现期坏样本”和“长表现期坏样本”进行适用规则的匹配,从而得出适配度最高的目标通用标签,并将该目标通用标签作为用户针对金融业务所存在欺诈风险的欺诈风险标签,最后该欺诈风险的分析设备将该欺诈风险标签与该用户建立关联并作为分析结果进行输出。
在本实施例中,针对业务主题建立多个通用的监控指标,提升了欺诈风险分析对于金融业务本身的关注度,并确保了针对金融业务进行欺诈风险分析整体策略在金融业务决策方面的延伸应用,可提高金融业务决策的响应速度,满足了金融业务的发展需求。
进一步地,在一种实施例中,上述步骤S30,还可以包括:
步骤S303,从所述欺诈变量中提取所述策略主题指向的业务关键信息,其中,所述业务关键信息包括业务的节点信息或者风控对象信息;
步骤S304,根据所述节点信息或者所述风控对象信息生成所述欺诈风险标签。
欺诈风险的分析设备预先设定策略主题下各标签信息时所依据金融业务的核心环节和具体风控对象,依次从将针对用户的风险数据集进行基础衍生从而得到的欺诈变量中,通过策略引擎提炼出与该核心环节和具体风控对象相关联的变量信息——欺诈变量所属金融业务的节点信息或者风控对象信息,然后对应将该节点信息或者风控对象信息进行总结从而生成用户针对该金融业务所存在欺诈风险的欺诈风险标签,最后该欺诈风险的分析设备将该欺诈风险标签与该用户建立关联并作为分析结果进行输出。
本发明实施例提供一种欺诈风险的分析方法,从预设数据源获取风险画像数据,其中,所述预设数据源包括外部数据源和内部数据源;然后,对所述风险画像数据进行分类存储以形成风险数据集,并针对所述风险数据集进行数据基础衍生得到欺诈变量;最后根据所述欺诈变量生成预设主题对应的欺诈风险标签。本发明实施例针对金融业务进行欺诈风险的分析,通过从金融业务发布机构的内部数据源以及外部数据源中获取用户的风险画像数据以构建风险数据集,提升了用于风险分析的基础数据的完整性,此外,基于用户的风险画像数据衍生得到欺诈变量,并结合该欺诈变量分析生成不同预设主题下多维度的欺诈风险标签,实现了从数据采集、衍生到风险分析全流程和多维度进行风险的监控和分析,不仅确保了风险分析结果的全面性和准确性,更能提高业务欺诈风险分析的响应速度,因此,本发明实施例可综合提升针对业务欺诈风险的分析效率,满足金融业务的发展需求。
进一步的,基于上述第一实施例,提出本发明欺诈风险的分析方法的第二实施例。
在本实施例中,在上述步骤S30,根据所述欺诈变量生成预设主题对应的欺诈风险标签之后,本发明欺诈风险的分析方法还可以包括:
步骤S50,对所述欺诈风险标签进行风险量化评估得到评估结果,并根据所述评估结果提取目标欺诈变量和目标欺诈风险标签进行迭代监控。
欺诈风险的分析设备在得出用户对于金融业务所存在欺诈风险的欺诈风险标签之后,进一步针对该欺诈风险标签进行风险量化评估得到评估结果,然后将该评估结果所关联符合预设条件的目标欺诈变量和目标欺诈风险标签重新进行监控以用于后续针对用户对于金融业务进行进一步欺诈风险分析的指标。
进一步地,在一种实施例中,步骤S50中,“对所述欺诈风险标签进行风险量化评估得到评估结果”的步骤,包括:
步骤S501,计算所述欺诈风险标签的规则表现数据,其中,所述规则表现数据包括:影响面、准确率、贡献度和提升度;
欺诈风险的分析设备在得出用户对于金融业务所存在欺诈风险的欺诈风险标签之后,针对该欺诈风险标签所对应策略规则分别计算影响面、准确率、贡献度和提升度四类指标的规则表现数据。
需要说明的是,在本实施例中,策略规则的影响面是指在策略规则的应用过程中,该策略规则对全部客户群体的影响情况,其计算逻辑为命中规则策略的样本占比所有样本的比例;策略规则的准确率是指:策略规则对客户群体中坏样本的识别精准度,其计算逻辑为命中规则策略的坏样本占所有命中策略规则样本的比例;策略规则贡献度是指:策略规则对坏样本的覆盖度,其计算逻辑为命中策略规则的坏样本占所有坏样本的比例;策略规则提升度是指:命中策略规则的坏样本浓度相较全体坏样本浓度的提升倍数,可用于判断策略规则的有效性,其计算逻辑为策略规则准确率除以全体坏样本率。
步骤S502,根据影响面、准确率、贡献度和提升度对所述欺诈风险标签进行风险量化评估得到评估结果,其中,所述评估结果用于标识所述欺诈风险标签是否适用于业务的欺诈风险分析。
需要说明的是,在本实施中,策略规则所对应欺诈风险标签是否适用于业务的欺诈风险分析,是判定该欺诈风险标签是否进行迭代监控的预设条件之一。在确定策略规则所对应欺诈风险标签是否满足进行迭代监控的预设条件(即继续适用于后续针对用户对于金融业务进行进一步欺诈风险分析)时,该策略规则的影响面需要尽可能小、且准确率、贡献度以及提升度需要尽可能大。
欺诈风险的分析设备按照计算得出的各欺诈风险标签所对应策略规则的影响面、准确率、贡献度和提升度之后,按照准确率由大至小逆序(或者按照影响面由小至大升序等)对各策略规则进行排序,从而筛选得出该准确率指标下可继续适用于进一步欺诈风险分析的策略规则,并将该策略规则封装作为评估结果输出,然后欺诈风险的分析设备将该评估结果中的策略规则所对应的目标欺诈风险标签以及该目标欺诈风险标签在用户的风险数据集中管理目标欺诈变量,重新放回至数据池当中以进行持续的迭代监控。
在本实施例中,通过针对分析得到的欺诈风险标签进行风险量化评估得到评估结果,然后将该评估结果所关联符合迭代监控条件的目标欺诈变量和目标欺诈风险标签重新进行监控,不仅实现了对分析策略针对金融业务的影响进行量化评估,还可获得数据层面对欺诈风险进行分析的策略规则的多维度监控与迭代,形成了面对金融业务进行欺诈风险分析与监控体系的闭环,从而能够与金融业务相结合的全流程的风险分析和监控,极大程度上提升了风险分析以及监控的效率。
本发明还提供一种欺诈风险的分析装置。
参照图3,图3为本发明欺诈风险的分析装置第一实施例的功能模块示意图。
如图3所示,所述欺诈风险的分析装置包括:
数据获取模块10,用于从预设数据源获取风险画像数据,其中,所述预设数据源包括外部数据源和内部数据源;
数据处理模块20,用于对所述风险画像数据进行分类存储以形成风险数据集,并针对所述风险数据集进行数据基础衍生得到欺诈变量;
风险分析模块30,用于根据所述欺诈变量生成预设主题对应的欺诈风险标签。
进一步地,所述欺诈风险的分析装置还包括:
量化评估模块,用于对所述欺诈风险标签进行风险量化评估得到评估结果,并根据所述评估结果提取目标欺诈变量和目标欺诈风险标签进行迭代监控。
进一步地,所述量化评估模块包括:
计算单元,用于计算所述欺诈风险标签的规则表现数据,其中,所述规则表现数据包括:影响面、准确率、贡献度和提升度;
评估单元,用于根据影响面、准确率、贡献度和提升度对所述欺诈风险标签进行风险量化评估得到评估结果,其中,所述评估结果用于标识所述欺诈风险标签是否适用于业务的欺诈风险分析。
进一步地,所述预设主题包括业务主题,所述风险分析模块30包括:
获取单元,用于获取所述业务主题对应的业务流程,以及所述业务流程对应的各通用标签;
适配单元,用于将所述欺诈变量分别与各所述通用标签进行适配以得到目标通用标签,并将所述目标通用标签作为所述欺诈风险标签。
进一步地,所述预设主题还包括策略主题,所述风险分析模块30还包括:
第一提取单元,用于从所述欺诈变量中提取所述策略主题指向的业务关键信息,其中,所述业务关键信息包括业务的节点信息或者风控对象信息;
生成单元,用于根据所述节点信息或者所述风控对象信息生成所述欺诈风险标签。
进一步地,所述数据获取模块10包括:
构建单元,用于构建预设风险画像,并获取所述风险画像对应的主键信息;
采集单元,用于按照所述键信息分别从所述外部数据源和内部数据源中采集数据作为风险画像数据。
进一步地,所述欺诈风险的分析装置还包括:
交叉比对模块,用于交叉比对所述风险画像数据,以进行欺诈风险的关联和聚集分析。
进一步地,数据处理模块20包括:
第二提取单元,用于按照所述风险数据集的数据类型,分别提取所述风险数据集中的变量数据;
数据衍生单元,用于基于统计分析对所述变量数据进行基础衍生得到欺诈变量。
其中,上述欺诈风险的分析装置中各个模块的功能实现与上述欺诈风险的分析方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质上存储有欺诈风险的分析程序,所述欺诈风险的分析程序被处理器执行时实现如以上任一项实施例所述的欺诈风险的分析方法的步骤。
本发明计算机可读存储介质的具体实施例与上述欺诈风险的分析方法各实施例基本相同,在此不作赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (9)
1.一种欺诈风险的分析方法,其特征在于,所述欺诈风险的分析方法包括:
从预设数据源获取风险画像数据,其中,所述预设数据源包括外部数据源和内部数据源;
对所述风险画像数据进行分类存储以形成风险数据集,并针对所述风险数据集进行数据基础衍生得到欺诈变量;
根据所述欺诈变量生成预设主题对应的欺诈风险标签,其中所述预设主题包括业务主题和策略主题;
在所述根据所述欺诈变量生成预设主题对应的欺诈风险标签的步骤之后,还包括:
对所述欺诈风险标签进行风险量化评估得到评估结果,并根据所述评估结果提取目标欺诈变量和目标欺诈风险标签进行迭代监控;
所述对所述欺诈风险标签进行风险量化评估得到评估结果的步骤,包括:
计算所述欺诈风险标签的规则表现数据,其中,所述规则表现数据包括:影响面、准确率、贡献度和提升度;
根据影响面、准确率、贡献度和提升度对所述欺诈风险标签进行风险量化评估得到评估结果,其中,所述评估结果用于标识所述欺诈风险标签是否适用于业务的欺诈风险分析。
2.如权利要求1所述的欺诈风险的分析方法,其特征在于,所述预设主题包括业务主题,所述根据所述欺诈变量生成预设主题对应的欺诈风险标签的步骤,包括:
获取所述业务主题对应的业务流程,以及所述业务流程对应的各通用标签;
将所述欺诈变量分别与各所述通用标签进行适配以得到目标通用标签,并将所述目标通用标签作为所述欺诈风险标签。
3.如权利要求1所述的欺诈风险的分析方法,其特征在于,所述预设主题还包括策略主题,所述根据所述欺诈变量生成预设主题对应的欺诈风险标签的步骤,还包括:
从所述欺诈变量中提取所述策略主题指向的业务关键信息,其中,所述业务关键信息包括业务的节点信息或者风控对象信息;
根据所述节点信息或者所述风控对象信息生成所述欺诈风险标签。
4.如权利要求1所述的欺诈风险的分析方法,其特征在于,所述从预设数据源获取风险画像数据的步骤包括:
构建预设风险画像,并获取所述风险画像对应的主键信息;
按照所述键信息分别从所述外部数据源和内部数据源中采集数据作为风险画像数据。
5.如权利要求1所述的欺诈风险的分析方法,其特征在于,在所述从预设数据源获取风险画像数据的步骤之后,还包括:
交叉比对所述风险画像数据,以进行欺诈风险的关联和聚集分析。
6.如权利要求1所述的欺诈风险的分析方法,其特征在于,所述针对所述风险数据集进行数据基础衍生得到欺诈变量的步骤,包括:
按照所述风险数据集的数据类型,分别提取所述风险数据集中的变量数据;
基于统计分析对所述变量数据进行基础衍生得到欺诈变量。
7.一种欺诈风险的分析装置,其特征在于,所述欺诈风险的分析装置包括:
数据获取模块,用于从预设数据源获取风险画像数据,其中,所述预设数据源包括外部数据源和内部数据源;
数据处理模块,用于对所述风险画像数据进行分类存储以形成风险数据集,并针对所述风险数据集进行数据基础衍生得到欺诈变量;
风险分析模块,用于根据所述欺诈变量生成预设主题对应的欺诈风险标签,其中所述预设主题包括业务主题和策略主题;
所述欺诈风险的分析装置还包括:
量化评估模块,用于对所述欺诈风险标签进行风险量化评估得到评估结果,并根据所述评估结果提取目标欺诈变量和目标欺诈风险标签进行迭代监控;
所述量化评估模块包括:
计算单元,用于计算所述欺诈风险标签的规则表现数据,其中,所述规则表现数据包括:影响面、准确率、贡献度和提升度;
评估单元,用于根据影响面、准确率、贡献度和提升度对所述欺诈风险标签进行风险量化评估得到评估结果,其中,所述评估结果用于标识所述欺诈风险标签是否适用于业务的欺诈风险分析。
8.一种欺诈风险的分析设备,其特征在于,所述欺诈风险的分析设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的欺诈风险的分析程序,所述欺诈风险的分析程序被所述处理器执行时实现如权利要求1至6中任一项所述的欺诈风险的分析方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有欺诈风险的分析程序,所述欺诈风险的分析程序被处理器执行时实现如权利要求1至6中任一项所述的欺诈风险的分析方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010434274.7A CN111582757B (zh) | 2020-05-20 | 2020-05-20 | 欺诈风险的分析方法、装置、设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010434274.7A CN111582757B (zh) | 2020-05-20 | 2020-05-20 | 欺诈风险的分析方法、装置、设备及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111582757A CN111582757A (zh) | 2020-08-25 |
CN111582757B true CN111582757B (zh) | 2024-04-30 |
Family
ID=72126764
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010434274.7A Active CN111582757B (zh) | 2020-05-20 | 2020-05-20 | 欺诈风险的分析方法、装置、设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111582757B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112884573A (zh) * | 2021-03-12 | 2021-06-01 | 中国工商银行股份有限公司 | 在线尽调处理方法和装置 |
CN113822679A (zh) * | 2021-11-24 | 2021-12-21 | 四川新网银行股份有限公司 | 一种自动决策的智能反欺诈贷中管理系统及方法 |
CN114511402A (zh) * | 2022-02-16 | 2022-05-17 | 中银金融科技有限公司 | 风险模型特征数据的管理方法及相关应用设备 |
CN115174231B (zh) * | 2022-07-08 | 2024-01-02 | 北京基智科技有限公司 | 一种基于AI Knowledge Base的网络欺诈分析方法及服务器 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107993142A (zh) * | 2017-11-23 | 2018-05-04 | 搜易贷(北京)金融信息服务有限公司 | 一种金融反欺诈风险控制系统 |
CN108734591A (zh) * | 2018-04-09 | 2018-11-02 | 中国平安人寿保险股份有限公司 | 欺诈案件的评估方法、装置、存储介质及终端 |
CN109509093A (zh) * | 2018-10-18 | 2019-03-22 | 中信网络科技股份有限公司 | 一种基于主体画像的交易安全控制方法及系统 |
CN109658222A (zh) * | 2018-10-16 | 2019-04-19 | 深圳壹账通智能科技有限公司 | 风险分析方法、装置、设备及计算机可读存储介质 |
CN110245875A (zh) * | 2019-06-21 | 2019-09-17 | 深圳前海微众银行股份有限公司 | 欺诈风险评估方法、装置、设备及存储介质 |
WO2019223139A1 (zh) * | 2018-05-22 | 2019-11-28 | 深圳壹账通智能科技有限公司 | 一种风险预测方法、装置、存储介质和服务器 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180253737A1 (en) * | 2017-03-06 | 2018-09-06 | International Business Machines Corporation | Dynamicall Evaluating Fraud Risk |
-
2020
- 2020-05-20 CN CN202010434274.7A patent/CN111582757B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107993142A (zh) * | 2017-11-23 | 2018-05-04 | 搜易贷(北京)金融信息服务有限公司 | 一种金融反欺诈风险控制系统 |
CN108734591A (zh) * | 2018-04-09 | 2018-11-02 | 中国平安人寿保险股份有限公司 | 欺诈案件的评估方法、装置、存储介质及终端 |
WO2019223139A1 (zh) * | 2018-05-22 | 2019-11-28 | 深圳壹账通智能科技有限公司 | 一种风险预测方法、装置、存储介质和服务器 |
CN109658222A (zh) * | 2018-10-16 | 2019-04-19 | 深圳壹账通智能科技有限公司 | 风险分析方法、装置、设备及计算机可读存储介质 |
CN109509093A (zh) * | 2018-10-18 | 2019-03-22 | 中信网络科技股份有限公司 | 一种基于主体画像的交易安全控制方法及系统 |
CN110245875A (zh) * | 2019-06-21 | 2019-09-17 | 深圳前海微众银行股份有限公司 | 欺诈风险评估方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111582757A (zh) | 2020-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111582757B (zh) | 欺诈风险的分析方法、装置、设备及计算机可读存储介质 | |
WO2020037942A1 (zh) | 风险预测处理方法、装置、计算机设备和介质 | |
US9990356B2 (en) | Device and method for analyzing reputation for objects by data mining | |
US9300672B2 (en) | Managing user access to query results | |
CN110781308B (zh) | 一种基于大数据构建知识图谱的反欺诈系统 | |
CN111210335B (zh) | 用户风险识别方法、装置及电子设备 | |
CN110751286A (zh) | 神经网络模型的训练方法和训练系统 | |
CN112995414B (zh) | 基于语音通话的行为质检方法、装置、设备及存储介质 | |
CN111476653A (zh) | 一种风险信息识别、确定、模型训练方法及装置 | |
CN112258254B (zh) | 基于大数据架构的互联网广告风险监测方法及系统 | |
CN111754241A (zh) | 一种用户行为感知方法、装置、设备及介质 | |
Shao et al. | How does facial recognition as an urban safety technology affect firm performance? The moderating role of the home country’s government subsidies | |
CN107809370B (zh) | 用户推荐方法及装置 | |
CN111177367A (zh) | 案件分类方法、分类模型训练方法及相关产品 | |
CN112330328A (zh) | 一种基于特征提取的信用卡欺诈检测方法 | |
CN115577172A (zh) | 物品推荐方法、装置、设备及介质 | |
CN113887214B (zh) | 基于人工智能的意愿推测方法、及其相关设备 | |
CN114817346A (zh) | 一种业务处理方法、装置、电子设备及计算机可读介质 | |
CN112950359A (zh) | 一种用户识别方法和装置 | |
CN116862659A (zh) | 面审题组的生成方法、装置、设备及介质 | |
CN116318974A (zh) | 站点风险识别方法、装置、计算机可读介质及电子设备 | |
CN113706207B (zh) | 基于语义解析的订单成交率分析方法、装置、设备及介质 | |
CN115880077A (zh) | 基于客户标签的推荐方法及其装置、电子设备及存储介质 | |
Dua et al. | I-flash: Interpretable fake news detector using lime and shap | |
CN114880663A (zh) | 一种基于异常检测的黑产作弊识别方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |