CN114462742A - 风险提示方法、装置、设备及计算机存储介质 - Google Patents

风险提示方法、装置、设备及计算机存储介质 Download PDF

Info

Publication number
CN114462742A
CN114462742A CN202011247241.8A CN202011247241A CN114462742A CN 114462742 A CN114462742 A CN 114462742A CN 202011247241 A CN202011247241 A CN 202011247241A CN 114462742 A CN114462742 A CN 114462742A
Authority
CN
China
Prior art keywords
target
attribute information
type
risk
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011247241.8A
Other languages
English (en)
Inventor
吴杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202011247241.8A priority Critical patent/CN114462742A/zh
Publication of CN114462742A publication Critical patent/CN114462742A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Marketing (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Technology Law (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本申请实施例提供一种风险提示方法、装置、设备及计算机存储介质,涉及人工智能技术领域。方法包括:对目标对象的特征信息中的属性信息和金融数据进行特征提取,得到对应于所述属性信息和所述金融数据的融合特征向量;对所述融合特征向量进行风险评估,得到所述目标对象的评估标签向量;根据所述评估标签向量,确定所述目标对象的目标涉罪类型和与所述目标涉罪类型对应的至少一个可疑特征;将所述目标涉罪类型和所述可疑特征中的至少一个作为风险提示信息发送给客户端,以实现对所述目标对象的风险提示。通过本申请实施例,能够帮助审核人员快速精确的定位客户可能的风险,大幅提高了审理效率和精准性,同时也降低了对审核人员经验的要求。

Description

风险提示方法、装置、设备及计算机存储介质
技术领域
本申请实施例涉及互联网技术领域,涉及但不限于一种风险提示方法、装置、设备及计算机存储介质。
背景技术
目前,金融机构的反洗钱审理系统一般只提供客户的基础属性和交易汇总等信息,不会主动提示客户的风险类型,也不会个性化的提示与客户风险类型相匹配的风险特征,基本上只能通过人工自己积累的经验进行分析审理和风险上报。显然,这种人工审理的方式存在审理效率低、精准度差、对人工经验要求高等缺点。
发明内容
本申请实施例提供一种风险提示方法、装置、设备及计算机存储介质,涉及人工智能技术领域。根据目标对象的属性信息和金融数据,对目标对象进行风险评估,以得到目标对象的目标涉罪类型和至少一个可疑特征,并将目标涉罪类型和可疑特征提示给审核人员,能够实现对风险的自动评估,从而帮助审核人员快速精确的定位客户可能的风险,大幅提高了审理效率和精准性。
本申请实施例的技术方案是这样实现的:
本申请实施例提供一种风险提示方法,包括:
获取目标对象的特征信息,所述特征信息至少包括所述目标对象的属性信息和与所述目标对象的金融业务对应的金融数据;
对所述属性信息和所述金融数据进行特征提取,得到对应于所述属性信息和所述金融数据的融合特征向量;
对所述融合特征向量进行风险评估,得到所述目标对象的评估标签向量;
根据所述评估标签向量,确定所述目标对象的目标涉罪类型和与所述目标涉罪类型对应的至少一个可疑特征;
将所述目标涉罪类型和所述可疑特征中的至少一个作为风险提示信息发送给客户端,以实现对所述目标对象的风险提示。
本申请实施例提供一种风险提示装置,包括:
获取模块,用于获取目标对象的特征信息,所述特征信息至少包括所述目标对象的属性信息和与所述目标对象的金融业务对应的金融数据;
特征提取模块,用于对所述属性信息和所述金融数据进行特征提取,得到对应于所述属性信息和所述金融数据的融合特征向量;
风险评估模块,用于对所述融合特征向量进行风险评估,得到所述目标对象的评估标签向量;
确定模块,用于根据所述评估标签向量,确定所述目标对象的目标涉罪类型和与所述目标涉罪类型对应的至少一个可疑特征;
发送模块,用于将所述目标涉罪类型和所述可疑特征中的至少一个作为风险提示信息发送给客户端,以实现对所述目标对象的风险提示。
本申请实施例提供一种计算机程序产品或计算机程序,所述计算机程序产品或计算机程序包括计算机指令,所述计算机指令存储在计算机可读存储介质中;其中,计算机设备的处理器从所述计算机可读存储介质中读取所述计算机指令,所述处理器用于执行所述计算机指令,实现上述的风险提示方法。
本申请实施例提供一种风险提示设备,包括:
存储器,用于存储可执行指令;处理器,用于执行所述存储器中存储的可执行指令时,实现上述的风险提示方法。
本申请实施例提供一种计算机可读存储介质,存储有可执行指令,用于引起处理器执行所述可执行指令时,实现上述的风险提示方法。
本申请实施例具有以下有益效果:对目标对象的属性信息和金融数据进行特征提取得到融合特征向量,并根据融合特征向量对目标对象进行风险评估,以得到目标对象的目标涉罪类型和至少一个可疑特征,并将目标涉罪类型和可疑特征作为风险提示信息发送给客户端,以实现对所述目标对象的风险提示,如此,能够实现对风险的自动评估,以准确的确定出目标对象的目标涉罪类型和可疑特征,从而能够帮助审核人员快速精确的定位客户可能的风险,大幅提高了审理效率和精准性,同时也降低了对审核人员经验的要求。
附图说明
图1是本申请实施例提供的风险提示系统的一个可选的架构示意图;
图2是本申请实施例提供的服务器的结构示意图;
图3是本申请实施例提供的风险提示方法的一个可选的流程示意图;
图4是本申请实施例提供的风险提示方法的一个可选的流程示意图;
图5是本申请实施例提供的风险提示方法的一个可选的流程示意图;
图6是本申请实施例提供的风险提示方法的一个可选的流程示意图;
图7是本申请实施例提供的风险评估模型的训练方法的一个可选的流程示意图;
图8是相关技术中洗钱风险分析的上报界面图;
图9是本申请实施例中洗钱风险分析的上报界面图;
图10是本申请实施例提供的人工选择涉罪类型的界面图;
图11是本申请实施例提供的洗钱风险审理流程示意图;
图12是本申请实施例提供的深度神经网络的结构示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。除非另有定义,本申请实施例所使用的所有的技术和科学术语与属于本申请实施例的技术领域的技术人员通常理解的含义相同。本申请实施例所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
在解释本申请实施例的方案之前,首先对本申请实施例找所涉及到的名词和专用术语进行解释:
1)反洗钱:指金融机构通过一定的流程、规则等方式控制系统内的洗钱风险。
2)审理:在洗钱风险防控中,经过规则稽核的可疑客户需要进行人工的调查确认是否真实可疑,以确定后续是否需要再进行上报或者不上报处理。
3)可疑特征:某一个主体的某一方面属性,比如“身高”、“年龄”、“近7天交易金额”等,当客户的某些特征或特征组合跟正常人有区别时,则称之为可疑特征。
4)涉罪类型:在人工审理确认后会判断客户对应的洗钱涉罪类型,例如,洗钱涉罪类型包括赌博、贩毒和传销等。
本申请实施例提出一种风险提示方法,通过机器自动的智能推荐目标对象的涉罪类型和可疑特征,可以帮助审核人员快速精确的定位客户可能的风险,大幅提高了审理效率和精准性,同时也降低了对审核人员经验的要求。
本申请实施例提供的风险提示方法,首先,获取目标对象的特征信息,其中,特征信息至少包括目标对象的属性信息和与目标对象的金融业务对应的金融数据;然后,对属性信息和金融数据进行特征提取,得到对应于属性信息和金融数据的融合特征向量;对融合特征向量进行风险评估,得到目标对象的评估标签向量;根据评估标签向量,确定目标对象的目标涉罪类型和与目标涉罪类型对应的至少一个可疑特征;最后,将目标涉罪类型和可疑特征中的至少一个作为风险提示信息发送给客户端,以实现对目标对象的风险提示。如此,能够实现对风险的自动化评估,以准确的确定出目标对象的目标涉罪类型和可疑特征,从而能够帮助审核人员快速精确的定位客户可能的风险,大幅提高了审理效率和精准性,同时也降低了对审核人员经验的要求。
下面说明本申请实施例的风险提示设备的示例性应用,在一种实现方式中,本申请实施例提供的风险提示设备可以实施为笔记本电脑,平板电脑,台式计算机,移动设备(例如,移动电话,便携式音乐播放器,个人数字助理,专用消息设备,便携式游戏设备)、智能机器人等任意的能够展示客户的涉罪类型和可疑特征的电子设备,在另一种实现方式中,本申请实施例提供的风险提示设备还可以实施为服务器。下面,将说明风险提示设备实施为服务器时的示例性应用,可以通过服务器与终端的客户端之间的交互来实现风险提示。
参见图1,图1是本申请实施例提供的风险提示系统10的一个可选的架构示意图。为实现对自动对目标对象的风险提示,本申请实施例提供的风险提示系统10中包括终端100、网络200和服务器300,其中,终端100上运行有审理系统应用(例如可以是反洗钱审理系统的应用),审核人员可以在审理系统应用的客户端上实现对目标对象进行风险审理,在进行风险审理时,服务器可以采用本申请实施例的方法,自动确定出目标对象的目标涉罪类型和可疑特征,对审核人员进行提示,以辅助审核人员进行快速的风险审理。在进行风险提示时,服务器300通过网络200获取终端100发送的目标对象的特征信息,其中特征信息至少包括目标对象的属性信息和与目标对象的金融业务对应的金融数据;然后,服务器对属性信息和金融数据进行特征提取,得到对应于属性信息和金融数据的融合特征向量;对融合特征向量进行风险评估,得到目标对象的评估标签向量;并根据评估标签向量,确定目标对象的目标涉罪类型和与目标涉罪类型对应的至少一个可疑特征;同时,通过网络200将目标涉罪类型和可疑特征中的至少一个作为风险提示信息发送给终端100上客户端,以实现对目标对象的风险提示。当终端100接收到风险提示信息之后,可以在当前界面100-1上直接显示接收到的风险提示信息。
本申请实施例提供的风险提示方法还涉及人工智能技术领域,至少可以通过人工智能技术中的自然语言处理和机器学习技术来实现。其中,自然语言处理(NLP,NatureLanguage processing)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。机器学习(ML,Machine L earning)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。本申请实施例中,通过机器学习技术实现对网络结构搜索请求的响应,以自动搜索到目标网络结构,以及,实现对控制器和分值模型的训练和模型优化。
图2是本申请实施例提供的服务器300的结构示意图,图2所示的服务器300包括:至少一个处理器310、存储器350、至少一个网络接口320和用户接口330。服务器300中的各个组件通过总线系统340耦合在一起。可理解,总线系统340用于实现这些组件之间的连接通信。总线系统340除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图2中将各种总线都标为总线系统340。
处理器310可以是一种集成电路芯片,具有信号的处理能力,例如通用处理器、数字信号处理器(DSP,Digital Signal Processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其中,通用处理器可以是微处理器或者任何常规的处理器等。
用户接口330包括使得能够呈现媒体内容的一个或多个输出装置331,包括一个或多个扬声器和/或一个或多个视觉显示屏。用户接口330还包括一个或多个输入装置332,包括有助于用户输入的用户接口部件,比如键盘、鼠标、麦克风、触屏显示屏、摄像头、其他输入按钮和控件。
存储器350可以是可移除的,不可移除的或其组合。示例性的硬件设备包括固态存储器,硬盘驱动器,光盘驱动器等。存储器350可选地包括在物理位置上远离处理器310的一个或多个存储设备。存储器350包括易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(ROM,Read Only Memory),易失性存储器可以是随机存取存储器(RAM,Random Access Memory)。本申请实施例描述的存储器350旨在包括任意适合类型的存储器。在一些实施例中,存储器350能够存储数据以支持各种操作,这些数据的示例包括程序、模块和数据结构或者其子集或超集,下面示例性说明。
操作系统351,包括用于处理各种基本系统服务和执行硬件相关任务的系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务;
网络通信模块352,用于经由一个或多个(有线或无线)网络接口320到达其他计算设备,示例性的网络接口320包括:蓝牙、无线相容性认证(WiFi)、和通用串行总线(USB,Universal Serial Bus)等;
输入处理模块353,用于对一个或多个来自一个或多个输入装置332之一的一个或多个用户输入或互动进行检测以及翻译所检测的输入或互动。
在一些实施例中,本申请实施例提供的装置可以采用软件方式实现,图2示出了存储在存储器350中的一种风险提示装置354,该风险提示装置354可以是服务器300中的风险提示装置,其可以是程序和插件等形式的软件,包括以下软件模块:获取模块3541、特征提取模块3542、风险评估模块3543、确定模块3544和发送模块3545,这些模块是逻辑上的,因此根据所实现的功能可以进行任意的组合或进一步拆分。将在下文中说明各个模块的功能。
在另一些实施例中,本申请实施例提供的装置可以采用硬件方式实现,作为示例,本申请实施例提供的装置可以是采用硬件译码处理器形式的处理器,其被编程以执行本申请实施例提供的风险提示方法,例如,硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(ASIC,Application Specif ic Integrated Circuit)、DSP、可编程逻辑器件(PLD,Programmable Logic De vice)、复杂可编程逻辑器件(CPLD,ComplexProgrammable Logic Device)、现场可编程门阵列(FPGA,Field-Programmable GateArray)或其他电子元件。
下面将结合本申请实施例提供的服务器300的示例性应用和实施,说明本申请实施例提供的风险提示方法。参见图3,图3是本申请实施例提供的风险提示方法的一个可选的流程示意图,将结合图3示出的步骤进行说明。
步骤S301,获取目标对象的特征信息,特征信息至少包括目标对象的属性信息和与目标对象的金融业务对应的金融数据。
这里,可以获取目标对象通过终端输入的特征信息,或者,对目标对象输入的基础信息进行识别和解析,得到特征信息,或者,从数据库中获取对应于该目标对象的特征信息。本申请实施例中,目标用户可以是任一个人或者任一商户或者任一集团。
特征信息至少包括目标对象的属性信息和与目标对象的金融业务对应的金融数据,其中,目标对象的属性信息可以包括目标对象的身份信息,例如,可以是目标对象的社会属性信息(例如职位、工作性质、工作单元等)、自然属性信息(例如性别、年龄等)、账户属性信息(例如银行卡号、网银、支付宝账号等)和其他能够体现目标对象属性信息且能够对目标对象是否涉罪有影响的其他信息,这里的其他信息例如可以是物流相关信息、设备信息、投诉信息等。与目标对象的金融业务对应的金融数据可以包括但不限于:交易汇总数据、交易金额、账户余额、账单变化信息等。
步骤S302,对属性信息和金融数据进行特征提取,得到对应于属性信息和金融数据的融合特征向量。
本申请实施例中,可以采用预先训练的风险评估模型来实现风险评估,以最终确定出目标涉罪类型。风险评估模型可以是任意一种深度神经网络,风险评估模型至少具有输入层、特征提取层、风险评估层和输出层。特征提取层用于对输入的属性信息和金融数据进行特征提取,得到对应于属性信息和金融数据的融合特征向量,以实现将融合特征向量输入至风险评估层中进行进一步的向量变换处理,得到最终的输出向量。
步骤S303,对融合特征向量进行风险评估,得到目标对象的评估标签向量。
评估标签向量是用于确定目标对象的目标设置类型的标签向量。评估标签向量具有至少两个维度,每一维度对应一种涉罪类型。
步骤S304,根据评估标签向量,确定目标对象的目标涉罪类型和与目标涉罪类型对应的至少一个可疑特征。
这里的风险评估是指根据所获取的目标对象的属性信息和金融数据,确定目标对象是否涉罪,以及如果涉罪的话,目标对象的涉罪类型,且在确定出目标对象的涉罪类型之后,在属性信息和金融数据中选择出与该涉罪类型相关的可疑特征。
本申请实施例中,涉罪类型包括但不限于以下任意一种:诈骗、赌博、非法经营、高利贷和传销等任意一种犯罪类型。本申请实施例中,根据所确定的涉罪类型来确定目标用户的可疑特征,其中,可疑特征是上述属性信息和金融数据中的特征,即在确定出目标涉罪类型之后,从多条属性信息和多条金融数据中选择出至少一条信息和数据作为可疑特征。
步骤S305,将目标涉罪类型和可疑特征中的至少一个作为风险提示信息发送给客户端,以实现对目标对象的风险提示。
这里,当确定出目标涉罪类型和可疑特征之后,将目标涉罪类型和可疑特征作为风险提示信息展示给审核人员,使得审核人员在对目标对象进行审核时,能够以所显示的目标涉罪类型和可疑特征为依据和参考,对目标对象进行更加准确的审核。
本申请实施例中,可以仅在客户端的界面上显示目标对象的目标涉罪类型,还可以仅在客户端的界面上显示目标对象的可疑特征,还可以同时显示目标涉罪类型和可疑特征。
本申请实施例提供的风险评估方法,对目标对象的属性信息和金融数据进行特征提取得到融合特征向量,并根据融合特征向量对目标对象进行风险评估,以得到目标对象的目标涉罪类型和至少一个可疑特征,并将目标涉罪类型和可疑特征作为风险提示信息发送给客户端,以实现对所述目标对象的风险提示,如此,能够实现对风险的自动评估,以准确的确定出目标对象的目标涉罪类型和可疑特征,从而能够帮助审核人员快速精确的定位客户可能的风险,大幅提高了审理效率和精准性,同时也降低了对审核人员经验的要求。
下面结合本申请实施例的风险评估系统来对本申请实施例的风险评估方法的应用场景进行说明:
在一种应用场景下,风险评估系统中包括终端和服务器,终端上运行有审理系统应用,审核人员可以使用该审理系统应用进行审理和风险评估。图4是本申请实施例提供的风险提示方法的一个可选的流程示意图,如图4所示,方法包括以下步骤:
步骤S401,终端获取目标对象的特征信息,特征信息至少包括目标对象的属性信息和与目标对象的金融业务对应的金融数据。
这里,目标对象是审核人员需要进行风险评估的客户,可以是对客户上传的信息进行识别,得到该客户的特征信息,或者,是对存储在系统中的该客户在历史时间段内的信息进行汇总,得到该客户的特征信息。
步骤S402,终端将目标对象的特征信息发送给服务器。
步骤S403,服务器将属性信息和金融数据输入至预先训练的风险评估模型中,通过风险评估模型的特征提取层对属性信息和金融数据进行特征提取,得到对应于属性信息和金融数据的融合特征向量。
本申请实施例中,可以采用预先训练的风险评估模型来实现风险评估,以最终确定出目标涉罪类型。风险评估模型可以是任意一种深度神经网络,风险评估模型至少具有输入层、特征提取层、风险评估层和输出层。特征提取层用于对输入的属性信息和金融数据进行特征提取,得到对应于属性信息和金融数据的融合特征向量。
步骤S404,服务器通过风险评估模型的风险评估层对融合特征向量进行风险评估,得到目标对象的评估标签向量。
这里,评估标签向量是用于确定目标对象的目标设置类型的标签向量。评估标签向量具有至少两个维度,每一维度对应一种涉罪类型。
步骤S405,服务器根据评估标签向量确定目标对象的目标涉罪类型。
这里,可以根据评估标签向量中每一维度的分量的值,来确定目标对象的目标涉罪类型,例如,可以将评估标签向量中具有最大值的维度对应的涉罪类型确定为目标涉罪类型。
步骤S406,服务器根据目标涉罪类型,在特征信息中确定出至少一个属性信息和至少一个金融数据为可疑特征。
这里,在确定出目标涉罪类型之后,将特征信息中与目标涉罪类型强相关或最相关的至少一个特征信息确定为可疑特征,其中,可疑特征中不仅包括属性信息,还包括金融数据。
步骤S407,服务器将目标涉罪类型和可疑特征中的至少一个作为风险提示信息发送给终端上的客户端,以实现对目标对象的风险提示。
步骤S408,审核人员以该风险提示信息作为辅助信息,对目标对象的风险性进行审理。
在另一种应用场景下,风险评估系统中包括终端和服务器,终端上运行有风险评估应用,用户可以通过该风险评估应用来查询金融系统对自己的风险评估,则此时服务器则可以是风险评估应用的客户端服务器,用户在终端上输入自己的特征信息,该特征信息至少包括用户的属性信息和与用户的金融业务对应的金融数据。
终端在获取到该用户的特征信息之后,将特征信息发送给服务器,服务器采用预先训练的风险评估模型对该用户进行风险评估。在实现的过程中,服务器将该用户的特征信息中的属性信息和金融数据输入至风险评估模型中,通过风险评估模型的特征提取层对属性信息和金融数据进行特征提取,得到对应于属性信息和金融数据的融合特征向量;然后通过风险评估模型的风险评估层对融合特征向量进行风险评估,得到用户的评估标签向量;再然后根据评估标签向量确定用户的目标涉罪类型;根据目标涉罪类型,在特征信息中确定出至少一个属性信息和至少一个金融数据为可疑特征。在服务器获取到用户的目标涉罪类型和金融数据之后,将目标涉罪类型和金融数据作为风险提示信息发送给终端上的客户端,以实现为用户提供风险评估结果的查询。
在又一种应用场景下,风险评估系统中包括终端和服务器,终端上运行有风险评估应用,该风险评估应用可以是政务系统对商家或个人进行风险评估的应用,政务系统的政府人员在对商家或个人办理相关业务时,需要首先对该商家或个人进行风险评估和查询,因此,可以通过该风险评估应用来查询金融系统对该商家或个人的风险评估,则此时服务器则可以是风险评估应用的客户端服务器,政府人员在终端上输入该商家或个人的特征信息,该特征信息至少包括用户的属性信息和与用户的金融业务对应的金融数据。
终端在获取到该商家或个人的特征信息之后,将特征信息发送给服务器,服务器采用预先训练的风险评估模型对该商家或个人进行风险评估。在实现的过程中,服务器将该商家或个人的特征信息中的属性信息和金融数据输入至风险评估模型中,通过风险评估模型的特征提取层对属性信息和金融数据进行特征提取,得到对应于属性信息和金融数据的融合特征向量;然后通过风险评估模型的风险评估层对融合特征向量进行风险评估,得到商家或个人的评估标签向量;再然后根据评估标签向量确定商家或个人的目标涉罪类型;根据目标涉罪类型,在特征信息中确定出至少一个属性信息和至少一个金融数据为可疑特征。在服务器获取到商家或个人的目标涉罪类型和金融数据之后,将目标涉罪类型和金融数据作为风险提示信息发送给终端上的客户端,以实现为政府人员提供对该商家或个人的风险评估结果的查询。
下面以图4的应用场景为例,继续对本申请实施例的风险提示方法进行说明。基于图4,图5是本申请实施例提供的风险提示方法的一个可选的流程示意图,如图5所示,在一些实施例中,步骤S403可以通过以下步骤实现:
步骤S501,对属性信息和金融数据分别进行分箱离散化处理或者等频分箱离散化处理,得到属性信息的离散向量和金融数据的离散向量。
这里,分箱是一种基于指定的箱个数的自顶向下的分裂技术,分箱可以用作数据归约和概念分层产生的离散化方法。例如,通过使用等宽或等频分箱,然后用箱均值或中位数替换箱中的每个值,可以将属性值离散化,就像用箱的均值或箱的中位数光滑一样。本申请实施例中,通过分箱离散化或者等频分箱离散化,对属性信息和金融数据进行处理,得到属性信息的离散向量和金融数据的离散向量。
步骤S502,对属性信息的离散向量和金融数据的离散向量进行拼接,形成拼接向量。
这里,可以依次将多个低维度属性信息的离散向量和多个低维度金融数据的离散向量进行拼接,形成具有更高维度的拼接向量。其中,拼接向量的维度等于属性信息的离散向量的维度和金融数据的离散向量的维度之和。
步骤S503,将拼接向量确定为对应于属性信息和金融数据的融合特征向量。
请继续参照图5,在一些实施例中,步骤S405可以通过以下步骤实现:
步骤S504,确定评估标签向量的每一分量所在维度对应的涉罪类型。
步骤S505,将评估标签向量中的最大分量所在的维度,确定为目标维度。
步骤S506,将目标维度所对应的涉罪类型,确定为目标对象的目标涉罪类型。
基于图4,图6是本申请实施例提供的风险提示方法的一个可选的流程示意图,如图6所示,在一些实施例中,步骤S406可以通过以下任意一种方式实现:
步骤S601,分别确定每一属性信息和每一金融数据与目标涉罪类型之间的影响程度值。
这里,预设的历史审理库中存储有:至少一个涉罪类型、每一涉罪类型对应的至少一个特征信息、和每一所述特征信息与所述涉罪类型之间的IV值。
步骤S601可以通过以下步骤实现:
步骤S6011,从历史审理库中,分别查询每一属性信息和每一金融数据与目标涉罪类型之间的信息价值(IV,Information Value)。
这里,在历史审理过程中,还会计算每一属性信息与涉罪类型之间IV值、每一金融数据与涉罪类型之间的IV值,并将计算得到IV值存储至历史审理库中。这样,在后续的预测过程中,在确定出目标涉罪类型之后,可以从历史审理库中直接查询到与目标涉罪类型对应的每一属性信息和每一金融数据的IV值。
步骤S6012,将每一属性信息和每一金融数据与目标涉罪类型之间的IV值,确定为对应属性信息和对应金融数据与目标涉罪类型之间的影响程度值。
这里,IV值越高,则对应的属性信息或对应的金融数据与目标涉罪类型之间的影响程度值越高,表明该属性信息或该金融数据与该目标涉罪类型之间的相关度越高,通过该属性信息或该金融数据能够更容易得出该目标涉罪类型。
在一些实施例中,在方式一中,还包括以下步骤:
步骤S602,按照影响程度值由大到小的顺序,对属性信息和金融数据进行排序,形成包含有属性信息和金融数据的信息序列。
需要说明的是,本申请实施例中,是对特征信息对应的全部属性信息和金融数据进行排序,所形成的信息序列中不仅包括属性信息还包括金融数据。
步骤S603,在信息序列中选择前预设数量的属性信息和金融数据。
这里,按照信息序列中属性信息和金融数据的排列顺序,选择信息序列中的前N个信息,这N个信息中不仅可以包括属性信息,还可以包括金融数据。
步骤S604,将所选择的属性信息和金融数据确定为可疑特征。
在一些实施例中,在方式二中,还包括以下步骤:
步骤S605,将影响程度值大于预设阈值的属性信息和金融数据,确定为可疑特征。这里,预设阈值可以是预先设置的值,当影响程度值大于预设阈值时,表明属性信息和金融数据与目标涉罪类型之间相关度较高,或者表明属性信息和金融数据对于觉得目标涉罪类型的重要度较高,因此,可以将影响程度值大于预设阈值的属性信息和金融数据,确定为与目标涉罪类型对应的可疑特征。
本申请实施例提供一种风险评估模型的训练方法,图7是本申请实施例提供的风险评估模型的训练方法的一个可选的流程示意图,如图7所示,训练方法包括以下步骤:
步骤S701,将样本对象的样本数据输入至风险评估模型中。
本申请实施例中,样本数据库中存储有至少一个样本对象的样本数据,样本数据是在历史风险评估过程中进行过风险评估和审理的数据,样本数据对应有预设标签,该预设标签用于表明该样本对象的涉罪类型。
在一些实施例中,审核人员会在审理过程中持续更新样本数据库中的样本数据,以及样本数据对应的预设标签,该预设标签可以是审核人员审理后人工设定的标签,该标签为样本对象的真实标签。
本申请实施例中,在确定出目标对象的目标涉罪类型和与目标涉罪类型对应的至少一个可疑特征之后,获取审核人员的审核操作,其中,审核操作包括针对于目标涉罪类型和可疑特征的评价操作,这里的评价操作是指审核人员在终端上对风险评估模型确定出的目标涉罪类型和可疑特征的准确性进行评价。例如,终端上可以提供评价操作按钮,评价操作按钮可以至少包括评价准确和评价不准确两个选项。当审核人员选择评价准确选项时,则系统将风险评估模型确定出的目标涉罪类型作为该目标对象的真实标签,与可疑特征一起存储至样本数据库中;当审核人员选择评价不准确选项时,则弹出可编辑的修改框或修改选项,审核人员可以手动对风险评估结果进行修改,在审核人员完成修改之后,将修改后的目标涉罪类型作为该目标对象的真实标签,与修改后的可疑特征一起存储至样本数据库中。
在一些实施例中,在风险评估模型确定出目标对象的目标涉罪类型和可疑特征之后,还会同时输出目标涉罪类型和可疑特征的预测准确率,此时,如果目标涉罪类型和可疑特征的预测准确率大于准确率阈值时,则将目标对象的特征信息作为样本数据更新至样本数据库中,并将目标涉罪类型确定为样本数据对应的预设标签。本申请实施例的方法,能够实现对风险评估模型预测结果的准确性进行自动评价,提高了样本数据更新的效率。
在另一些实施例中,还可以在风险评估模型确定出目标对象的目标涉罪类型和可疑特征之后,审核人员手动选择或输入目标涉罪类型和可疑特征的预测准确率,即获取审核人员的审核操作,其中,审核操作包括针对于目标涉罪类型和可疑特征的评价操作,这里的评价操作用于表明目标涉罪类型和可疑特征的预测准确率。如果审核人员的评价操作输入或手动选择的预测准确率大于准确率阈值时,则将目标对象的特征信息作为样本数据更新至样本数据库中,并将目标涉罪类型确定为样本数据对应的预设标签。本申请实施例的方法,通过审核人员对风险评估结果进行评价操作,能够得到风险评估结果的准确评价,从而提高了样本数据更新的准确性,进而使得后续对风险评估模型进行训练时,能够采用更加准确的样本数据进行训练,得到能够准确进行风险评估的风险评估模型。
步骤S702,通过风险评估模型的特征提取层对样本数据进行特征提取,得到样本特征向量。
步骤S703,通过风险评估模型的风险评估层对样本特征向量进行风险评估,得到样本对象的样本评估标签向量。
步骤S704,将样本评估标签向量输入至预设损失模型中,得到损失结果。
预设损失模型中包括损失函数,可以通过损失函数计算损失结果。
在一些实施例中,步骤S704可以通过以下步骤实现:
步骤S7041,获取样本数据对应的预设标签。步骤S7042,采用独热编码规则,对预设标签进行编码,得到编码标签向量。步骤S7043,采用预设损失模型中的损失函数,计算样本评估标签向量与编码标签向量之间的距离。步骤S7044,根据距离确定损失结果。
这里,预设标签是预先设置的真实标签。通过损失函数计算样本评估标签向量与编码标签向量之间的距离,当样本评估标签向量与编码标签向量之间的距离越大时,表明风险评估模型的预测结果不准确,需要对风险评估模型进行进一步优化,对风险评估模型中的参数进行更新和修正;当样本评估标签向量与编码标签向量之间的距离越小时,表明风险评估模型的预测结果越准确,则可以不对风险评估模型进行进一步优化。
步骤S705,根据损失结果,采用随机梯度下降法对风险评估模型中的参数进行更新,直至更新后的风险评估模型输出的样本评估标签向量满足预设条件时,停止对风险评估模型的训练。
本申请实施例中,预设条件包括但不限于以下任意一种:所训练的风险评估模型已经收敛、训练次数达到所允许的最大迭代次数、训练时间达到最大的模型训练时间等。
本申请实施例提供的风险评估模型的训练方法,由于样本对象的样本数据输入至风险评估模型中,依次通过特征提取层和风险评估层对样本数据进行特征提取和风险评估,然后样本评估标签向量输入至预设损失模型中,得到损失结果。如此,能够根据损失结果对特征提取层和风险评估层中的参数进行修正,所得到的风险评估模型能够准确的确定出目标对象的评估标签向量,从而准确的对目标对象进行风险评估,提高风险审理的效率和准确性。
下面,将说明本申请实施例在一个实际的应用场景中的示例性应用。
本申请实施例提供一种风险提示方法,可以帮助审核人员快速精确的定位客户可能的风险,大幅提高了审理效率和精准性,同时也降低了对审核人员经验的要求。
相关技术中的产品在洗钱风险分析阶段一般无提示,只能通过审核人员在笔记本或者excel台账上记录相关风险信息,然后在上报页面的空白报文处逐步撰写报文、选择风险特征等信息,如图8所示,是相关技术中洗钱风险分析的上报界面图,在上报界面中,审核人员需要手动选择审核结果、可疑特征、交易特征、处理情况、有效分层和处理依据等多个选项,审核过程繁琐,审核效率低,同时需要审核人员有一定的审核经验。
本申请实施例提供一种风险提示方法,能够辅助审核人员进行洗钱风险审理。经过本申请实施例方案的改造后,在开发审理任务的分析阶段,就会直接提示客户的洗钱风险类型和相关风险特征,从而极大的降低审核人员审核的难度和复杂度,提高审核效率。图9是本申请实施例中洗钱风险分析的上报界面图,在审核人员进行风险上报时,系统会自动提示客户的涉罪类型901和可疑特征902,基于提示的涉罪类型和可疑特征,审核人员可以快速对客户的风险定性和上报。
在一些实施例中,用户通过分析,发现推荐的涉罪类型不准确,也可以人工选择对应的涉罪类型,下面的可疑特征也会根据涉罪类型以及客户的风险属性做相应变化,满足该客户上报的规范要求。图10是本申请实施例提供的人工选择涉罪类型的界面图,如图10所示,在涉罪类型选项中,可以提供下拉选项1001,审核人员可以点击下拉选项1001选择准确的涉罪类型,实现对预测结果的修正。
图11是本申请实施例提供的洗钱风险审理流程示意图,如图11所示,审理流程包括以下三个步骤:
步骤一是数据采集。将模型算法需要的用户社会属性、自然属性、账户属性,以及用户交易汇总数据、物流相关数据、设备数据、投诉数据等进行采集汇总,得到数据源1101,将数据源1101存储到特征的数据库中备用。本申请实施例中,数据源1101至少包括:TDW数据、关系型数据库管理系统(MYSQL)数据和各系统数据。
步骤二是模型计算,利用数据和算法计算推荐值1102,基于历史审理任务对应客户的特征信息,以及人工审理完结以后选定的涉罪类型和可疑特征信息,针对新的任务数据进行模型计算,推荐出最有可能的若干个涉罪类型,以及相关度最高的若干个可疑特征。将推荐的涉罪类型和特征推送给审理系统1103备用。
步骤三是审理系统展示。当审核人员打开审理任务时,系统自动展示模型推荐的涉罪类型和可疑特征,即自动进行涉罪类型提示1104和风险特征提示1105,辅助审核人员快速判断客户风险类型、可疑特征,并撰写对应的报文。
下面对基于历史审理结论的自动学习算法进行介绍:
这里使用深度神经网络来解决多分类的犯罪类型的预测问题。里面包括了以下几步:
第一步,数据预处理:
这里包括黑白样本标签的收集和特征的收集,以及特征的预处理。审核人员会在审理过程中持续更新标签库(包括客户的犯罪类型或者客户有无可疑行为)以及特征库(勾选该客户的哪些特征对判断最终的犯罪类型是有价值的)。有了客户的特征库后,需要对每个特征做处理,即对特征做分箱处理。可以将一个特征离散成多个特征,每个特征是一个0或1的二维变量。例如,对于客户最近30天流入金额,可以分为小于等于1万元、大于1万元且小于等于10万元、大于10万元且小于等于100万元、大于100万元以上且小于等于1000万元、大于1000万元这五个数据段,每个客户一定会被分配到某一个数据段里。这样该客户在该数据段的值是1,而且其他数据段的值是0。如果客户的金额为50万元,那么该客户在这个特征上对应的值为(0,0,1,0,0)。以上分箱的方法还可以采用等频分箱的方法来实现,等频分箱是对特征数据进行排序,按分位点的方式选取用户指定的N个分位点作为分箱边界,若相邻分位点相同则将两个分箱合并,因此分箱结果中有可能少于用户指定的分箱个数。例如,统计出来客户的笔数特征对应的4个分位点(20%、40%、60%、80%)分别为10笔、20笔、50笔、100笔,那么就按这4个点分成5段。特征分箱的意义在于减少异常点的干扰,以及将有特征相似的客户聚在一起,以及保证每个分段特征具有统计意义,减少模型的过拟合。
对于类罪标签(将犯罪类型标签或涉罪类型的标签)的处理,会采取独热编码(one-hot)的方式进行向量化编码处理。例如,总共有3种类型的标签(地下钱庄,传销,不可疑),每个客户只会对应到其中一种,那么对应的那一种类型就为1,其他为0,这就是one-hot向量。例如,某个客户是地下钱庄标签,那么该客户的类罪标签为(1,0,0),如果是不可疑,那么类罪标签为(0,0,1)。
第二步,多分类模型的训练:
有了上面的特征处理和标签处理过程,这里就会通过深度神经网络(DNN,DeepNeural Networks)模型来进行训练。模型的训练集是审核人员已经标注好的数据,每条记录都是一个客户的信息,包括按照上一步介绍的预处理好的特征和类罪标签。然后就可以使用深度学习网络建立多分类预测模型了。
图12是本申请实施例提供的深度神经网络的结构示意图,深度神经网络(即风险评估模型)的第一层是特征输入层121,最后一层是输出层122,中间层123为隐层,用于对输入层121输出的向量进行不同的变换处理,输出层122的输出向量表示每个类型的概率大小。本申请实施例中,可以通过前向传播的方法建立基于交叉熵的损失函数,然后通过随机梯度下降法来逐步更新迭代深度神经网络里的每个权重值,在经过多轮迭代后,最终达到最优值。这样就完成了一次模型建立。
第三步,通过训练好的风险评估模型来进行预测:
这里,有了训练好的风险评估模型,对于任意一个客户,只要输入这个客户的所有特征信息,都可以输出一个标签向量,然后取标签向量中数值最大的那一维,作为这个客户的类别标签,以确定出该客户的目标涉罪类型。
第四步,基于特征分析方法的重要特征推荐。
在经过上述的涉罪类型预测之后,可以推荐和这个涉罪类型最相关的特征,即将与这个涉罪类型最相关的一个或多个特征确定为可疑特征。这里需要从历史审理库里去计算和统计每个涉罪类型与对应的特征之间的重要度。例如,可以采用计算每个特征与涉罪类型之间的的IV值,来决定特征对犯罪类型的区分度的大小,计算完IV值后,按IV值大小对不同特征进行排序,取IV值最大的前N个特征为待推荐的特征进行展示。
本申请实施例提供的方法,经过涉罪类型评估,在模型完全命中涉罪类型和可疑特征的情况下,人工经过简单复核后即可进行上报,审核时间可以从8min/任务缩减至2分钟/任务左右,提效600%。若模型命中的涉罪类型和可疑特征有偏差,平均审核时间约4min/任务左右,提效100%。这样,针对一个40人的运营团队,按10万/人/年的成本算,一年可产生效益400万以上。
需要说明的是,在风险评估模型计算和推荐了涉罪类型和可疑特征后,可以直接转化成报文语句展示在报文框中辅助撰写报文,也可以仅展示符合要求的所有可疑特征,由人工点击插入到报文中。在推荐和展示可疑特征方面,可以展示所有客户相关的可疑特征对应的描述,也可以仅展示与所选涉罪类型相符合的可疑特征,隐藏与所选涉罪不相关的可疑特征。另外,未必需要同时推荐涉罪类型和可疑特征,如果有需要,也可以只推荐涉罪类型或者只推荐可疑特征。并且,风险评估模型的算法并不是唯一的,不同的算法都可以实现该类推荐效果,相似的算法都是本申请的保护范围之内。
下面继续说明本申请实施例提供的风险提示装置354实施为软件模块的示例性结构,在一些实施例中,如图2所示,存储在存储器350的风险提示装置354中的软件模块可以是服务器300中的风险提示装置,包括:
获取模块3541,用于获取目标对象的特征信息,所述特征信息至少包括所述目标对象的属性信息和与所述目标对象的金融业务对应的金融数据;
特征提取模块3542,用于对所述属性信息和所述金融数据进行特征提取,得到对应于所述属性信息和所述金融数据的融合特征向量;
风险评估模块3543,用于对所述融合特征向量进行风险评估,得到所述目标对象的评估标签向量;
确定模块3544,用于根据所述评估标签向量,确定所述目标对象的目标涉罪类型和与所述目标涉罪类型对应的至少一个可疑特征;
发送模块3545,用于将所述目标涉罪类型和所述可疑特征中的至少一个作为风险提示信息发送给客户端,以实现对所述目标对象的风险提示。
在一些实施例中,所述装置还包括:控制模块,用于采用预先训练的风险评估模型,确定所述目标对象的目标涉罪类型和与所述目标涉罪类型对应的至少一个可疑特征;对应地,所述特征提取模块还用于:通过所述风险评估模型的特征提取层对所述属性信息和所述金融数据进行特征提取,得到对应于所述属性信息和所述金融数据的融合特征向量;所述风险评估模块还用于:通过所述风险评估模型的风险评估层对所述融合特征向量进行风险评估,得到所述目标对象的评估标签向量
在一些实施例中,所述风险评估模块还用于:根据所述评估标签向量确定所述目标对象的所述目标涉罪类型;根据所述目标涉罪类型,在所述特征信息中确定出至少一个属性信息和至少一个金融数据为所述可疑特征。
在一些实施例中,所述风险评估模块还用于:对所述属性信息和所述金融数据分别进行分箱离散化处理或者等频分箱离散化处理,得到所述属性信息的离散向量和所述金融数据的离散向量;对所述属性信息的离散向量和所述金融数据的离散向量进行拼接,形成拼接向量;将所述拼接向量确定为对应于所述属性信息和所述金融数据的融合特征向量。
在一些实施例中,所述风险评估模块还用于:确定所述评估标签向量的每一分量所在维度对应的涉罪类型;将所述评估标签向量中的最大分量所在的维度,确定为目标维度;将所述目标维度所对应的涉罪类型,确定为所述目标对象的所述目标涉罪类型。
在一些实施例中,所述风险评估模块还用于:分别确定每一所述属性信息和每一所述金融数据与所述目标涉罪类型之间的影响程度值;按照所述影响程度值由大到小的顺序,对所述属性信息和所述金融数据进行排序,形成包含有所述属性信息和所述金融数据的信息序列;在所述信息序列中选择前预设数量的属性信息和金融数据;将所选择的属性信息和金融数据确定为所述可疑特征。
在一些实施例中,所述风险评估模块还用于:分别确定每一所述属性信息和每一所述金融数据与所述目标涉罪类型之间的影响程度值;将所述影响程度值大于预设阈值的属性信息和金融数据,确定为所述可疑特征。
在一些实施例中,预设的历史审理库中存储有:至少一个涉罪类型、每一涉罪类型对应的至少一个特征信息、和每一所述特征信息与所述涉罪类型之间的IV值;所述风险评估模块还用于:从所述历史审理库中,分别查询每一所述属性信息和每一所述金融数据与所述目标涉罪类型之间的IV值;将每一所述属性信息和每一所述金融数据与所述目标涉罪类型之间的IV值,确定为对应属性信息和对应金融数据与所述目标涉罪类型之间的所述影响程度值。
在一些实施例中,所述风险评估模型通过以下步骤进行训练:将样本对象的样本数据输入至所述风险评估模型中;通过所述风险评估模型的特征提取层对所述样本数据进行特征提取,得到样本特征向量;通过所述风险评估模型的风险评估层对所述样本特征向量进行风险评估,得到所述样本对象的样本评估标签向量;将所述样本评估标签向量输入至预设损失模型中,得到损失结果;根据所述损失结果,采用随机梯度下降法对所述风险评估模型中的参数进行更新,直至更新后的风险评估模型输出的所述样本评估标签向量满足预设条件时,停止对所述风险评估模型的训练。
在一些实施例中,所述风险评估模型通过以下步骤进行训练:获取所述样本数据对应的预设标签;采用独热编码规则,对所述预设标签进行编码,得到编码标签向量;采用所述预设损失模型中的损失函数,计算所述样本评估标签向量与所述编码标签向量之间的距离;根据所述距离确定所述损失结果。
在一些实施例中,所述装置还包括:审核操作获取模块,用于在确定出所述目标对象的目标涉罪类型和与所述目标涉罪类型对应的至少一个可疑特征之后,获取审核人员的审核操作,其中,所述审核操作包括针对于所述目标涉罪类型和所述可疑特征的评价操作;更新模块,用于当所述评价操作表明所述目标涉罪类型和所述可疑特征的预测准确率大于准确率阈值时,将所述目标对象的特征信息作为所述样本数据更新至样本数据库中,并将所述目标涉罪类型确定为所述样本数据对应的预设标签。
需要说明的是,本申请实施例装置的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果,因此不做赘述。对于本装置实施例中未披露的技术细节,请参照本申请方法实施例的描述而理解。
本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行本申请实施例上述的方法。
本申请实施例提供一种存储有可执行指令的存储介质,其中存储有可执行指令,当可执行指令被处理器执行时,将引起处理器执行本申请实施例提供的方法,例如,如图3示出的方法。
在一些实施例中,存储介质可以是计算机可读存储介质,例如,铁电存储器(FRAM,Ferromagnetic Random Access Memory)、只读存储器(ROM,R ead Only Memory)、可编程只读存储器(PROM,Programmable Read Only Memory)、可擦除可编程只读存储器(EPROM,Erasable Programmable Read Only Memory)、带电可擦可编程只读存储器(EEPROM,Electrically Erasable Programmable Read Only Memory)、闪存、磁表面存储器、光盘、或光盘只读存储器(CD-ROM,Compact Disk-Read Only Memory)等存储器;也可以是包括上述存储器之一或任意组合的各种设备。
在一些实施例中,可执行指令可以采用程序、软件、软件模块、脚本或代码的形式,按任意形式的编程语言(包括编译或解释语言,或者声明性或过程性语言)来编写,并且其可按任意形式部署,包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。
作为示例,可执行指令可以但不一定对应于文件系统中的文件,可以可被存储在保存其它程序或数据的文件的一部分,例如,存储在超文本标记语言(HTML,Hyper TextMarkup Language)文档中的一个或多个脚本中,存储在专用于所讨论的程序的单个文件中,或者,存储在多个协同文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。作为示例,可执行指令可被部署为在一个计算设备上执行,或者在位于一个地点的多个计算设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算设备上执行。
以上所述,仅为本申请的实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和范围之内所作的任何修改、等同替换和改进等,均包含在本申请的保护范围之内。

Claims (14)

1.一种风险提示方法,其特征在于,包括:
获取目标对象的特征信息,所述特征信息至少包括所述目标对象的属性信息和与所述目标对象的金融业务对应的金融数据;
对所述属性信息和所述金融数据进行特征提取,得到对应于所述属性信息和所述金融数据的融合特征向量;
对所述融合特征向量进行风险评估,得到所述目标对象的评估标签向量;
根据所述评估标签向量,确定所述目标对象的目标涉罪类型和与所述目标涉罪类型对应的至少一个可疑特征;
将所述目标涉罪类型和所述可疑特征中的至少一个作为风险提示信息发送给客户端,以实现对所述目标对象的风险提示。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
采用预先训练的风险评估模型,确定所述目标对象的目标涉罪类型和与所述目标涉罪类型对应的至少一个可疑特征;
所述对所述属性信息和所述金融数据进行特征提取,得到对应于所述属性信息和所述金融数据的融合特征向量,包括:
通过所述风险评估模型的特征提取层对所述属性信息和所述金融数据进行特征提取,得到对应于所述属性信息和所述金融数据的融合特征向量;
所述对所述融合特征向量进行风险评估,得到所述目标对象的评估标签向量,包括:
通过所述风险评估模型的风险评估层对所述融合特征向量进行风险评估,得到所述目标对象的评估标签向量。
3.根据权利要求1所述的方法,其特征在于,所述根据所述评估标签向量,确定所述目标对象的目标涉罪类型和与所述目标涉罪类型对应的至少一个可疑特征,包括:
根据所述评估标签向量确定所述目标对象的所述目标涉罪类型;
根据所述目标涉罪类型,在所述特征信息中确定出至少一个属性信息和至少一个金融数据为所述可疑特征。
4.根据权利要求2所述的方法,其特征在于,所述通过所述风险评估模型的特征提取层对所述属性信息和所述金融数据进行特征提取,得到对应于所述属性信息和所述金融数据的融合特征向量,包括:
对所述属性信息和所述金融数据分别进行分箱离散化处理或者等频分箱离散化处理,得到所述属性信息的离散向量和所述金融数据的离散向量;
对所述属性信息的离散向量和所述金融数据的离散向量进行拼接,形成拼接向量;
将所述拼接向量确定为对应于所述属性信息和所述金融数据的融合特征向量。
5.根据权利要求3所述的方法,其特征在于,所述根据所述评估标签向量确定所述目标对象的所述目标涉罪类型,包括:
确定所述评估标签向量的每一分量所在维度对应的涉罪类型;
将所述评估标签向量中的最大分量所在的维度,确定为目标维度;
将所述目标维度所对应的涉罪类型,确定为所述目标对象的所述目标涉罪类型。
6.根据权利要求3所述的方法,其特征在于,所述根据所述目标涉罪类型,在所述特征信息中确定出至少一个属性信息和至少一个金融数据为所述可疑特征,包括:
分别确定每一所述属性信息和每一所述金融数据与所述目标涉罪类型之间的影响程度值;
按照所述影响程度值由大到小的顺序,对所述属性信息和所述金融数据进行排序,形成包含有所述属性信息和所述金融数据的信息序列;
在所述信息序列中选择前预设数量的属性信息和金融数据;
将所选择的属性信息和金融数据确定为所述可疑特征。
7.根据权利要求3所述的方法,其特征在于,所述根据所述目标涉罪类型,在所述特征信息中确定出至少一个属性信息和至少一个金融数据为所述可疑特征,包括:
分别确定每一所述属性信息和每一所述金融数据与所述目标涉罪类型之间的影响程度值;
将所述影响程度值大于预设阈值的属性信息和金融数据,确定为所述可疑特征。
8.根据权利要求6或7所述的方法,其特征在于,预设的历史审理库中存储有:至少一个涉罪类型、每一涉罪类型对应的至少一个特征信息、和每一所述特征信息与所述涉罪类型之间的IV值;
所述分别确定每一所述属性信息和每一所述金融数据与所述目标涉罪类型之间的影响程度值,包括:
从所述历史审理库中,分别查询每一所述属性信息和每一所述金融数据与所述目标涉罪类型之间的IV值;
将每一所述属性信息和每一所述金融数据与所述目标涉罪类型之间的IV值,确定为对应属性信息和对应金融数据与所述目标涉罪类型之间的所述影响程度值。
9.根据权利要求2所述的方法,其特征在于,所述风险评估模型通过以下步骤进行训练:
将样本对象的样本数据输入至所述风险评估模型中;
通过所述风险评估模型的特征提取层对所述样本数据进行特征提取,得到样本特征向量;
通过所述风险评估模型的风险评估层对所述样本特征向量进行风险评估,得到所述样本对象的样本评估标签向量;
将所述样本评估标签向量输入至预设损失模型中,得到损失结果;
根据所述损失结果,采用随机梯度下降法对所述风险评估模型中的参数进行更新,直至更新后的风险评估模型输出的所述样本评估标签向量满足预设条件时,停止对所述风险评估模型的训练。
10.根据权利要求9所述的方法,其特征在于,所述将所述样本评估标签向量输入至预设损失模型中,得到损失结果,包括:
获取所述样本数据对应的预设标签;
采用独热编码规则,对所述预设标签进行编码,得到编码标签向量;
采用所述预设损失模型中的损失函数,计算所述样本评估标签向量与所述编码标签向量之间的距离;
根据所述距离确定所述损失结果。
11.根据权利要求9所述的方法,其特征在于,所述方法还包括:
在确定出所述目标对象的目标涉罪类型和与所述目标涉罪类型对应的至少一个可疑特征之后,获取审核人员的审核操作,其中,所述审核操作包括针对于所述目标涉罪类型和所述可疑特征的评价操作;
当所述评价操作表明所述目标涉罪类型和所述可疑特征的预测准确率大于准确率阈值时,将所述目标对象的特征信息作为所述样本数据更新至样本数据库中,并
将所述目标涉罪类型确定为所述样本数据对应的预设标签。
12.一种风险提示装置,其特征在于,包括:
获取模块,用于获取目标对象的特征信息,所述特征信息至少包括所述目标对象的属性信息和与所述目标对象的金融业务对应的金融数据;
特征提取模块,用于对所述属性信息和所述金融数据进行特征提取,得到对应于所述属性信息和所述金融数据的融合特征向量;
风险评估模块,用于对所述融合特征向量进行风险评估,得到所述目标对象的评估标签向量;
确定模块,用于根据所述评估标签向量,确定所述目标对象的目标涉罪类型和与所述目标涉罪类型对应的至少一个可疑特征;
发送模块,用于将所述目标涉罪类型和所述可疑特征中的至少一个作为风险提示信息发送给客户端,以实现对所述目标对象的风险提示。
13.一种风险提示设备,其特征在于,包括:
存储器,用于存储可执行指令;处理器,用于执行所述存储器中存储的可执行指令时,实现权利要求1至11任一项所述的风险提示方法。
14.一种计算机可读存储介质,其特征在于,存储有可执行指令,用于引起处理器执行所述可执行指令时,实现权利要求1至11任一项所述的风险提示方法。
CN202011247241.8A 2020-11-10 2020-11-10 风险提示方法、装置、设备及计算机存储介质 Pending CN114462742A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011247241.8A CN114462742A (zh) 2020-11-10 2020-11-10 风险提示方法、装置、设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011247241.8A CN114462742A (zh) 2020-11-10 2020-11-10 风险提示方法、装置、设备及计算机存储介质

Publications (1)

Publication Number Publication Date
CN114462742A true CN114462742A (zh) 2022-05-10

Family

ID=81404777

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011247241.8A Pending CN114462742A (zh) 2020-11-10 2020-11-10 风险提示方法、装置、设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN114462742A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115345727A (zh) * 2022-08-19 2022-11-15 中电金信软件有限公司 一种识别欺诈贷款申请的方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115345727A (zh) * 2022-08-19 2022-11-15 中电金信软件有限公司 一种识别欺诈贷款申请的方法及装置

Similar Documents

Publication Publication Date Title
EP3985578A1 (en) Method and system for automatically training machine learning model
CN110070391B (zh) 数据处理方法、装置、计算机可读介质及电子设备
Bravo et al. Granting and managing loans for micro-entrepreneurs: New developments and practical experiences
US11250513B2 (en) Computer implemented system for generating assurance related planning process and documents for an entity and method thereof
CN110163723A (zh) 基于产品特征的推荐方法、装置、计算机设备及存储介质
US20220188651A1 (en) Systems and methods for extracting specific data from documents using machine learning
CN109582798A (zh) 自动问答方法、系统及设备
Shetu et al. Predicting satisfaction of online banking system in Bangladesh by machine learning
US20140365403A1 (en) Guided event prediction
EP4012621A1 (en) A latent-space misalignment measure of responsible ai for machine learning models
CN111882420A (zh) 响应率的生成方法、营销方法、模型训练方法及装置
CN111738331A (zh) 用户分类方法及装置、计算机可读存储介质、电子设备
CN112328869A (zh) 一种用户贷款意愿的预测方法、装置及计算机系统
CN115063035A (zh) 基于神经网络的客户评估方法、系统、设备及存储介质
Daniati et al. Decision Making Framework Based On Sentiment Analysis in Twitter Using SAW and Machine Learning Approach
CN113392920B (zh) 生成作弊预测模型的方法、装置、设备、介质及程序产品
Ginting et al. The development of bank application for debtors selection by using Naïve Bayes Classifier technique
CN111178656A (zh) 信用模型训练方法、信用评分方法、装置及电子设备
Gupta Applied analytics through case studies using Sas and R: implementing predictive models and machine learning techniques
CN113704637A (zh) 基于人工智能的对象推荐方法、装置、存储介质
CN114462742A (zh) 风险提示方法、装置、设备及计算机存储介质
Yussupova et al. A decision support approach based on sentiment analysis combined with data mining for customer satisfaction research
Sharma et al. Predicting Student Performance Using Educational Data Mining and Learning Analytics Technique
CN110472680B (zh) 目标分类方法、装置和计算机可读存储介质
CN113870998A (zh) 问诊方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination