CN114386981A - 风险识别方法、装置、计算机设备及存储介质 - Google Patents

风险识别方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN114386981A
CN114386981A CN202210040403.3A CN202210040403A CN114386981A CN 114386981 A CN114386981 A CN 114386981A CN 202210040403 A CN202210040403 A CN 202210040403A CN 114386981 A CN114386981 A CN 114386981A
Authority
CN
China
Prior art keywords
risk score
risk
network model
feature vector
trained
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210040403.3A
Other languages
English (en)
Inventor
徐巍越
王丁
王增艺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202210040403.3A priority Critical patent/CN114386981A/zh
Publication of CN114386981A publication Critical patent/CN114386981A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4016Transaction verification involving fraud or risk level assessment in transaction processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Accounting & Taxation (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Security & Cryptography (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例公开了一种风险识别方法、装置、计算机设备及存储介质。方法包括:获取待识别案件的特征向量;将特征向量输入预设的训练后的无监督网络模型,得到第一风险分数;根据第一风险分数以及特征向量对预设的有监督网络模型进行训练,得到训练后的有监督网络模型;将特征向量输入训练后的有监督网络模型,得到第二风险分数;根据第一风险分数以及第二风险分数确定目标风险分数;根据目标风险分数对待识别案件进行风险识别。本方案可以根据无监督网络模型对有监督网络模型进行构造,无需人工对样本进行标记,并且,结合有监督网络模型以及无监督网络模型对风险进行识别,可以识别出处于各个阶段的风险,提高了风险识别的准确率。

Description

风险识别方法、装置、计算机设备及存储介质
技术领域
本申请涉及人工智能技术领域,尤其涉及一种风险识别方法、装置、计算机设备及存储介质。
背景技术
随着电子商务快速发展,使用移动支付进行吃饭、打车、购物、看电影、充值、发红包等已成为了人们的日常行为,与此同时,一些不法分子也瞄准这一新生事物,利用移动支付实施诈骗行为,且作案手段不断翻新,令打击难上加难。
为了进行风险防控,第三方公司往往通过分析大量的已发生的风险事件来训练有监督网络模型,进而对风险进行识别,但是该方法需要人工花费大量的时间进行样本标记,并且对于萌芽阶段的风险的识别防控有明显的滞后性,不能及时识别新的风险,风险识别的准确率还有待提高。
发明内容
本申请实施例提供了一种风险识别方法、装置、计算机设备及存储介质,可以提高风险识别的准确率。
第一方面,本申请实施例提供了一种风险识别方法,其包括:
获取待识别案件的特征向量;
将所述特征向量输入预设的训练后的无监督网络模型,得到第一风险分数;
根据所述第一风险分数以及所述特征向量对预设的有监督网络模型进行训练,得到训练后的有监督网络模型;
将所述特征向量输入训练后的有监督网络模型,得到第二风险分数;
根据所述第一风险分数以及所述第二风险分数确定目标风险分数;
根据所述目标风险分数对所述待识别案件进行风险识别。
第二方面,本申请实施例还提供了一种风险识别装置,其包括:
获取单元,用于获取待识别案件的特征向量;
第一输入单元,用于将所述特征向量输入预设的训练后的无监督网络模型,得到第一风险分数;
训练单元,用于根据所述第一风险分数以及所述特征向量对预设的有监督网络模型进行训练,得到训练后的有监督网络模型;
第二输入单元,用于将所述特征向量输入训练后的有监督网络模型,得到第二风险分数;
第一确定单元,用于根据所述第一风险分数以及所述第二风险分数确定目标风险分数;
识别单元,用于根据所述目标风险分数对所述待识别案件进行风险识别。
第三方面,本申请实施例还提供了一种计算机设备,其包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法。
第四方面,本申请实施例还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时可实现上述方法。
本申请实施例提供了一种风险识别方法、装置、计算机设备及存储介质。其中,所述方法包括:获取待识别案件的特征向量;将所述特征向量输入预设的训练后的无监督网络模型,得到第一风险分数;根据所述第一风险分数以及所述特征向量对预设的有监督网络模型进行训练,得到训练后的有监督网络模型;将所述特征向量输入训练后的有监督网络模型,得到第二风险分数;根据所述第一风险分数以及所述第二风险分数确定目标风险分数;根据所述目标风险分数对所述待识别案件进行风险识别。本方案可以根据无监督网络模型对有监督网络模型进行构造,无需人工对样本进行标记,并且,结合有监督网络模型以及无监督网络模型对风险进行识别,可以识别出处于各个阶段的风险,提高了风险识别的准确率。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的风险识别方法的应用场景示意图;
图2为本申请实施例提供的风险识别方法的流程示意图;
图3为本申请实施例提供的风险识别方法的子流程示意图;
图4为本申请实施例提供的风险识别装置的示意性框图;
图5为本申请另一实施例提供的风险识别装置的示意性框图;
图6为本申请实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
本申请实施例提供了一种风险识别方法、装置、计算机设备及存储介质。
该风险识别方法的执行主体可以是本申请实施例提供的风险识别装置,或者集成了该风险识别装置的计算机设备,其中,该风险识别装置可以采用硬件或者软件的方式实现,该计算机设备可以为终端或服务器,该终端可以是智能手机、平板电脑、掌上电脑、或者笔记本电脑等。
请参阅图1,图1为本申请实施例提供的风险识别方法的应用场景示意图。该风险识别方法应用于图1中的计算机设备10中,该计算机设备10中设置有无监督网络模型以及有监督网络模型,具体方法包括:获取待识别案件的特征向量;将所述特征向量输入预设的训练后的无监督网络模型,得到第一风险分数;根据所述第一风险分数以及所述特征向量对预设的有监督网络模型进行训练,得到训练后的有监督网络模型;将所述特征向量输入训练后的有监督网络模型,得到第二风险分数;根据所述第一风险分数以及所述第二风险分数确定目标风险分数;根据所述目标风险分数对所述待识别案件进行风险识别。
图2是本申请实施例提供的风险识别方法的流程示意图。如图2所示,该方法包括以下步骤S110-160。
S110、获取待识别案件的特征向量。
请参阅图3,在一些实施例中,具体地,步骤S110包括:
S111、获取所述待识别案件的交易信息。
例如,当该待识别案件为用户进行交易操作时,此时,用户的交易信息包括账户注册时间、交易时间、交易场景、绑卡时间、修改登录密码时间、IP地址、交易金额、最后一次登录时间以及最后一次交易时间等。
S112、将所述交易信息进行特征工程处理,得到所述特征向量。
为了使数据更好地被算法和模型使用,获取到交易信息之后,还需要对交易信息进行特征工程处理,得到上述交易信息的特性向量。
S120、将所述特征向量输入预设的训练后的无监督网络模型,得到第一风险分数。
其中,本申请中的无监督网络模型可以为过AutoEncoder(自编码器)网络模型。
在一些实施例中,在步骤S120之前,需要预先对该无监督网络模型进行训练,具体训练过程包括:获取多个非风险案件的特征向量样本;通过所述特征向量样本对预设的无监督网络模型进行训练,得到所述训练后的无监督网络模型。
无监督网络模型利用大量的正常交易,或大量的正常交易和极少量的异常交易(风险交易)对无监督网络模型进行训练,得到训练后的无监督网络模型,此时,训练后的模型对正常交易的重建误差较小,对异常交易的重建误差较大,也就是说模型学习到了正常交易的模式,此时若输入的是一笔异常交易,那么经过训练后的无监督网络模型后,计算得到的均方根误差就会比正常的交易要高。
在一些实施例中,如果得分大于设定的高风险阈值则直接生成风险案件,即,如果得到第一风险分数大于高风险阈值,此时可以直接将待识别案件确定为风险案件。
在一些实施例中,具体地,步骤S120包括:通过所述训练后的无监督网络模型中的编码器对所述特征向量进行编码,得到编码后向量;通过所述训练后的无监督网络模型中的解码器对所述特征向量进行解码,得到解码后向量;计算所述编码后向量与所述特征向量的均方根误差;根据所述均方根误差确定所述第一风险分数。
即,将特征向量通过训练后的无监督网络模型进行编解码。训练后的无监督网络模型分为两个部分,编码部分对输入向量进行信息抽取编码,得到输入向量最为本质的表达,解码部分对得到的编码向量进行重建,恢复其输入时的向量。通过编码前和解码后的向量的均方根误差,来判断该笔交易的异常得分,均方根越大异常得分越高。
S130、根据所述第一风险分数以及所述特征向量对预设的有监督网络模型进行训练,得到训练后的有监督网络模型。
其中,本实施例中的有监督网络模型可以为卷积神经网络模型。
在一些实施例中,具体地,步骤S130包括:若所述第一风险分数大于预设的第一阈值,则将所述特征向量作为风险样本对所述有监督网络模型进行训练,得到所述训练后的有监督网络模型;若所述第一风险分数小于预设的第二阈值,则将所述特征向量作为非风险样本对所述有监督网络模型进行训练,得到所述训练后的有监督网络模型,所述第二阈值小于所述第一阈值,其中,该第一阈值可以为0.9,该第二阈值可以为0.1,具体数值可以视使用情况进行调整,具体此处不做限定。
可见,本实施例可以将无监督网络模型识别到的风险案件通过有监督学习的方式进行有监督网络模型的建模,无需人工分析风险样本以及对样本进行标记,节省人力。
此外,有监督网络模型可以根据无监督网络模型识别到的风险案件进行不断的训练,在新风险的萌芽期,可以通过无监督网络模型识别新风险,当新风险不断累积,有监督网络模型也不断地针对新风险进行训练,所以到了风险的发展期以及稳定期,有监督网络模型通过风险评分进一步识别风险案件,提高风险识别的准确率。
需要说明的是,在下一次进行风险交易识别的时候,将给训练后的有监督网络模型作为该预设的有监督网络模型,再根据所述第一风险分数以及所述特征向量对预设的有监督网络模型进行训练。
S140、将所述特征向量输入训练后的有监督网络模型,得到第二风险分数。
即本实施例中,需要将待识别案件的特征向量分别输入训练后的无监督网络模型以及训练后的有监督网络模型,通过训练后的无监督网络模型得到第一风险分数,以及通过训练后的有监督网络模型得到第二风险分数。
S150、根据所述第一风险分数以及所述第二风险分数确定目标风险分数。
在一些实施例中,具体地,步骤S150包括:根据所述第一风险分数以及所述第二风险分数的分数比例确定所述第一风险分数的第一权重以及所述第二风险分数的第二权重;根据所述第一权重、所述第一风险分数、所述第二权重以及所述第二风险分数确定所述目标风险分数。
例如,第一风险分数为0.8,第二风险分数为0.3,此时第一权重为:0.8÷(0.8+0.3)=8/11,第二权重为:0.3*(0.8+0.3)=3/11,此时目标风险分数为:8/11*0.8+3/11*0.3=0.664。
需要说明的是,在风险的萌芽期,使用无监督网络模型对风险进行识别的准确率比较高,而当风险进入稳定期成为常见风险时,此时,使用有监督网络模型对风险进行识别的准确率比较高,由于对风险案件进行识别时,不知道风险处于哪个阶段,所以本申请结合有监督网络模型以及无监督网络模型对风险进行识别,覆盖风险的全阶段,提高风险识别的准确率。
S160、根据所述目标风险分数对所述待识别案件进行风险识别。
在一些实施例中,具体地,步骤S160包括:判断所述目标风险分数是否小于预设的风险阈值;若所述目标风险分数大于或等于所述风险阈值,则确定所述待识别案件为风险案件;若所述目标风险分数小于所述风险阈值,则确定所述待识别案件为非风险案件。
本实施例中,如果目标风险分数大于风险阈值,则将该待识别案件确定为诶风险案件,否则,将该待识别案件确定为非风险案件,其中,该风险阈值可以为0.5,具体数值可以根据具体使用场景进行调整,具体此处不做限定。
例如,如果目标风险分数为0.664,于0.664大于0.5,此时确定待识别风险为风险案件。
在一些实施例中,所述特征向量包括多个子特征向量,当确定所述待识别案件为风险案件之后,方法还包括:针对多个所述子特征向量中每个子特征向量,将所述子特征向量作为目标子特征向量并调整所述目标子特征向量的权值,得到调整后的特征向量;将所述调整后的特征向量输入所述训练后的无监督网络模型,得到第三风险分数;将所述调整后的特征向量输入所述训练后的有监督网络模型,得到第四风险分数;若所述第三风险分数与所述第一风险分数的分数差大于预设的第一分数差阈值,且所述第四风险分数与所述第二风险分数的分数差小于预设的第二分出差阈值,则确定所述目标子特征向量为变异特征向量,所述第一分数差阈值大于所述第二分数差阈值。
即,当有风险发生变异时,本实施例还可以通过对特征向量中的各特征子向量进行加权,再将加权后的特征子向量输入训练后的有监督网络模型以及训练后的无监督网络模型,通过调整权值捕捉特征向量中的变异部分以及未变异部分,其中,调整某子向量的权值后有监督网络模型输出的分数无明显变化而无监督网络模型输出的分数产生了明显变化,则此时确定该子向量属于变异部分,否则确定该子向量属于未变异部分。
所以本申请还可以捕捉风险的变异部分和未变异部分,即能保留风险交易的可解释性也可以捕捉到新风险的手法。
在一些实施例中,步骤S160之后,还包括:基于所述训练后的有监督网络模型对所述特征向量进行风险特征分析,从所述特征向量中提取关键特征向量。
具体地,根据该有监督网络模型根据EDA(特征描述性分析)对特征向量进行风险特征分析,从风险案件中提取关键影响因子,给业务人员提供可解释性。规避了常用的通过聚类方式发现风险模式存在的一些缺点,比如聚类效果不佳,聚类后模式抽取困难,以及风险模型变化导致抽取的规则频繁修改等。
综上所述,本实施例获取待识别案件的特征向量;将所述特征向量输入预设的训练后的无监督网络模型,得到第一风险分数;根据所述第一风险分数以及所述特征向量对预设的有监督网络模型进行训练,得到训练后的有监督网络模型;将所述特征向量输入训练后的有监督网络模型,得到第二风险分数;根据所述第一风险分数以及所述第二风险分数确定目标风险分数;根据所述目标风险分数对所述待识别案件进行风险识别。本方案可以根据无监督网络模型对有监督网络模型进行构造,无需人工对样本进行标记,并且,结合有监督网络模型以及无监督网络模型对风险进行识别,可以识别出处于各个阶段的风险,提高了风险识别的准确率。
其中,本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
图4是本申请实施例提供的一种风险识别装置的示意性框图。如图4所示,对应于以上风险识别方法,本申请还提供一种风险识别装置。该风险识别装置包括用于执行上述风险识别方法的单元,该装置可以被配置于台式电脑、平板电脑、手提电脑、等终端中。具体地,请参阅图4,该风险识别装置包括获取单元401、第一输入单元402、训练单元403、第二输入单元404、第一确定单元405以及识别单元406。
获取单元401,用于获取待识别案件的特征向量;
第一输入单元402,用于将所述特征向量输入预设的训练后的无监督网络模型,得到第一风险分数;
训练单元403,用于根据所述第一风险分数以及所述特征向量对预设的有监督网络模型进行训练,得到训练后的有监督网络模型;
第二输入单元404,用于将所述特征向量输入训练后的有监督网络模型,得到第二风险分数;
第一确定单元405,用于根据所述第一风险分数以及所述第二风险分数确定目标风险分数;
识别单元406,用于根据所述目标风险分数对所述待识别案件进行风险识别。
在一些实施例中,所述训练单元403具体用于:
若所述第一风险分数大于预设的第一阈值,则将所述特征向量作为风险样本对所述有监督网络模型进行训练,得到所述训练后的有监督网络模型;
若所述第一风险分数小于预设的第二阈值,则将所述特征向量作为非风险样本对所述有监督网络模型进行训练,得到所述训练后的有监督网络模型,所述第二阈值小于所述第一阈值。
在一些实施例中,所述第一输入单元402具体用于:
通过所述训练后的无监督网络模型中的编码器对所述特征向量进行编码,得到编码后向量;
通过所述训练后的无监督网络模型中的解码器对所述特征向量进行解码,得到解码后向量;
计算所述编码后向量与所述特征向量的均方根误差;
根据所述均方根误差确定所述第一风险分数。
在一些实施例中,所述第一确定单元405具体用于:
根据所述第一风险分数以及所述第二风险分数的分数比例确定所述第一风险分数的第一权重以及所述第二风险分数的第二权重;
根据所述第一权重、所述第一风险分数、所述第二权重以及所述第二风险分数确定所述目标风险分数。
在一些实施例中,所述获取单元401具体用于:
获取所述待识别案件的交易信息;
将所述交易信息进行特征工程处理,得到所述特征向量。
在一些实施例中,所述识别单元406具体用于:
判断所述目标风险分数是否小于预设的风险阈值;
若所述目标风险分数大于或等于所述风险阈值,则确定所述待识别案件为风险案件;
若所述目标风险分数小于所述风险阈值,则确定所述待识别案件为非风险案件。
图5是本申请另一实施例提供的一种风险识别装置的示意性框图。所述特征向量包括多个子特征向量,如图5所示,本实施例的风险识别装置是上述实施例的基础上增加了调整单元407、第三输入单元408、第四输入单元409以及第二确定单元410。
调整单元407,用于针对多个所述子特征向量中每个子特征向量,将所述子特征向量作为目标子特征向量并调整所述目标子特征向量的权值,得到调整后的特征向量;
第三输入单元408,用于将所述调整后的特征向量输入所述训练后的无监督网络模型,得到第三风险分数;
第四输入单元409,用于将所述调整后的特征向量输入所述训练后的有监督网络模型,得到第四风险分数;
第二确定单元410,用于当所述第三风险分数与所述第一风险分数的分数差大于预设的第一分数差阈值,且所述第四风险分数与所述第二风险分数的分数差小于预设的第二分出差阈值时,确定所述目标子特征向量为变异特征向量,所述第一分数差阈值大于所述第二分数差阈值。
需要说明的是,所属领域的技术人员可以清楚地了解到,上述风险识别装置和各单元的具体实现过程,可以参考前述方法实施例中的相应描述,为了描述的方便和简洁,在此不再赘述。
上述风险识别装置可以实现为一种计算机程序的形式,该计算机程序可以在如图6所示的计算机设备上运行。
请参阅图6,图6是本申请实施例提供的一种计算机设备的示意性框图。该计算机设备600可以是终端,也可以是服务器,其中,终端可以是智能手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等具有通信功能的电子设备。服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。
参阅图6,该计算机设备600包括通过系统总线601连接的处理器602、存储器和网络接口605,其中,存储器可以包括非易失性存储介质603和内存储器604。
该非易失性存储介质603可存储操作系统6031和计算机程序6032。该计算机程序6032包括程序指令,该程序指令被执行时,可使得处理器602执行一种风险识别方法。
该处理器602用于提供计算和控制能力,以支撑整个计算机设备600的运行。
该内存储器604为非易失性存储介质603中的计算机程序6032的运行提供环境,该计算机程序6032被处理器602执行时,可使得处理器602执行一种风险识别方法。
该网络接口605用于与其它设备进行网络通信。本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备600的限定,具体的计算机设备600可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器602用于运行存储在存储器中的计算机程序6032,以实现如下步骤:
获取待识别案件的特征向量;
将所述特征向量输入预设的训练后的无监督网络模型,得到第一风险分数;
根据所述第一风险分数以及所述特征向量对预设的有监督网络模型进行训练,得到训练后的有监督网络模型;
将所述特征向量输入训练后的有监督网络模型,得到第二风险分数;
根据所述第一风险分数以及所述第二风险分数确定目标风险分数;
根据所述目标风险分数对所述待识别案件进行风险识别。
在一些实施例中,处理器602在实现所述根据所述第一风险分数以及所述特征向量对预设的有监督网络模型进行训练,得到训练后的有监督网络模型步骤时,具体实现如下步骤:
若所述第一风险分数大于预设的第一阈值,则将所述特征向量作为风险样本对所述有监督网络模型进行训练,得到所述训练后的有监督网络模型;
若所述第一风险分数小于预设的第二阈值,则将所述特征向量作为非风险样本对所述有监督网络模型进行训练,得到所述训练后的有监督网络模型,所述第二阈值小于所述第一阈值。
在一些实施例中,处理器602在实现所述将所述特征向量输入预设的训练后的无监督网络模型,得到第一风险分数步骤时,具体实现如下步骤:
通过所述训练后的无监督网络模型中的编码器对所述特征向量进行编码,得到编码后向量;
通过所述训练后的无监督网络模型中的解码器对所述特征向量进行解码,得到解码后向量;
计算所述编码后向量与所述特征向量的均方根误差;
根据所述均方根误差确定所述第一风险分数。
在一些实施例中,处理器602在实现所述根据所述第一风险分数以及所述第二风险分数确定目标风险分数步骤时,具体实现如下步骤:
根据所述第一风险分数以及所述第二风险分数的分数比例确定所述第一风险分数的第一权重以及所述第二风险分数的第二权重;
根据所述第一权重、所述第一风险分数、所述第二权重以及所述第二风险分数确定所述目标风险分数。
在一些实施例中,处理器602在实现所述获取待识别案件的特征向量步骤时,具体实现如下步骤:
获取所述待识别案件的交易信息;
将所述交易信息进行特征工程处理,得到所述特征向量。
在一些实施例中,处理器602在实现所述根据所述目标风险分数对所述待识别案件进行风险识别步骤时,具体实现如下步骤:
判断所述目标风险分数是否小于预设的风险阈值;
若所述目标风险分数大于或等于所述风险阈值,则确定所述待识别案件为风险案件;
若所述目标风险分数小于所述风险阈值,则确定所述待识别案件为非风险案件。
在一些实施例中,所述特征向量包括多个子特征向量,处理器602在实现所述确定所述待识别案件为风险案件步骤之后,还实现如下步骤:
针对多个所述子特征向量中每个子特征向量,将所述子特征向量作为目标子特征向量并调整所述目标子特征向量的权值,得到调整后的特征向量;
将所述调整后的特征向量输入所述训练后的无监督网络模型,得到第三风险分数;
将所述调整后的特征向量输入所述训练后的有监督网络模型,得到第四风险分数;
若所述第三风险分数与所述第一风险分数的分数差大于预设的第一分数差阈值,且所述第四风险分数与所述第二风险分数的分数差小于预设的第二分出差阈值,则确定所述目标子特征向量为变异特征向量,所述第一分数差阈值大于所述第二分数差阈值。
应当理解,在本申请实施例中,处理器602可以是中央处理单元(CentralProcessing Unit,CPU),该处理器602还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成。该计算机程序包括程序指令,计算机程序可存储于一存储介质中,该存储介质为计算机可读存储介质。该程序指令被该计算机系统中的至少一个处理器执行,以实现上述方法的实施例的流程步骤。
因此,本申请还提供一种存储介质。该存储介质可以为计算机可读存储介质。该存储介质存储有计算机程序,其中计算机程序包括程序指令。该程序指令被处理器执行时使处理器执行如下步骤:
获取待识别案件的特征向量;
将所述特征向量输入预设的训练后的无监督网络模型,得到第一风险分数;
根据所述第一风险分数以及所述特征向量对预设的有监督网络模型进行训练,得到训练后的有监督网络模型;
将所述特征向量输入训练后的有监督网络模型,得到第二风险分数;
根据所述第一风险分数以及所述第二风险分数确定目标风险分数;
根据所述目标风险分数对所述待识别案件进行风险识别。
在一些实施例中,所述处理器在执行所述程序指令而实现所述根据所述第一风险分数以及所述特征向量对预设的有监督网络模型进行训练,得到训练后的有监督网络模型步骤时,具体实现如下步骤:
若所述第一风险分数大于预设的第一阈值,则将所述特征向量作为风险样本对所述有监督网络模型进行训练,得到所述训练后的有监督网络模型;
若所述第一风险分数小于预设的第二阈值,则将所述特征向量作为非风险样本对所述有监督网络模型进行训练,得到所述训练后的有监督网络模型,所述第二阈值小于所述第一阈值。
在一些实施例中,所述处理器在执行所述程序指令而实现所述将所述特征向量输入预设的训练后的无监督网络模型,得到第一风险分数步骤时,具体实现如下步骤:
通过所述训练后的无监督网络模型中的编码器对所述特征向量进行编码,得到编码后向量;
通过所述训练后的无监督网络模型中的解码器对所述特征向量进行解码,得到解码后向量;
计算所述编码后向量与所述特征向量的均方根误差;
根据所述均方根误差确定所述第一风险分数。
在一些实施例中,所述处理器在执行所述程序指令而实现所述根据所述第一风险分数以及所述第二风险分数确定目标风险分数步骤时,具体实现如下步骤:根据所述第一风险分数以及所述第二风险分数的分数比例确定所述第一风险分数的第一权重以及所述第二风险分数的第二权重;
根据所述第一权重、所述第一风险分数、所述第二权重以及所述第二风险分数确定所述目标风险分数。
在一些实施例中,所述处理器在执行所述程序指令而实现所述获取待识别案件的特征向量步骤时,具体实现如下步骤:
获取所述待识别案件的交易信息;
将所述交易信息进行特征工程处理,得到所述特征向量。
在一些实施例中,所述处理器在执行所述程序指令而实现所述根据所述目标风险分数对所述待识别案件进行风险识别步骤时,具体实现如下步骤:
判断所述目标风险分数是否小于预设的风险阈值;
若所述目标风险分数大于或等于所述风险阈值,则确定所述待识别案件为风险案件;
若所述目标风险分数小于所述风险阈值,则确定所述待识别案件为非风险案件。
在一些实施例中,所述特征向量包括多个子特征向量,所述处理器在执行所述程序指令而实现所述确定所述待识别案件为风险案件步骤之后,还实现如下步骤:
针对多个所述子特征向量中每个子特征向量,将所述子特征向量作为目标子特征向量并调整所述目标子特征向量的权值,得到调整后的特征向量;
将所述调整后的特征向量输入所述训练后的无监督网络模型,得到第三风险分数;
将所述调整后的特征向量输入所述训练后的有监督网络模型,得到第四风险分数;
若所述第三风险分数与所述第一风险分数的分数差大于预设的第一分数差阈值,且所述第四风险分数与所述第二风险分数的分数差小于预设的第二分出差阈值,则确定所述目标子特征向量为变异特征向量,所述第一分数差阈值大于所述第二分数差阈值。
所述存储介质可以是U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的计算机可读存储介质。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的。例如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
本申请实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本申请实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。
该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种风险识别方法,其特征在于,包括:
获取待识别案件的特征向量;
将所述特征向量输入预设的训练后的无监督网络模型,得到第一风险分数;
根据所述第一风险分数以及所述特征向量对预设的有监督网络模型进行训练,得到训练后的有监督网络模型;
将所述特征向量输入训练后的有监督网络模型,得到第二风险分数;
根据所述第一风险分数以及所述第二风险分数确定目标风险分数;
根据所述目标风险分数对所述待识别案件进行风险识别。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一风险分数以及所述特征向量对预设的有监督网络模型进行训练,得到训练后的有监督网络模型,包括:
若所述第一风险分数大于预设的第一阈值,则将所述特征向量作为风险样本对所述有监督网络模型进行训练,得到所述训练后的有监督网络模型;
若所述第一风险分数小于预设的第二阈值,则将所述特征向量作为非风险样本对所述有监督网络模型进行训练,得到所述训练后的有监督网络模型,所述第二阈值小于所述第一阈值。
3.根据权利要求1所述的方法,其特征在于,所述将所述特征向量输入预设的训练后的无监督网络模型,得到第一风险分数,包括:
通过所述训练后的无监督网络模型中的编码器对所述特征向量进行编码,得到编码后向量;
通过所述训练后的无监督网络模型中的解码器对所述特征向量进行解码,得到解码后向量;
计算所述编码后向量与所述特征向量的均方根误差;
根据所述均方根误差确定所述第一风险分数。
4.根据权利要求1所述的方法,其特征在于,所述根据所述第一风险分数以及所述第二风险分数确定目标风险分数,包括:
根据所述第一风险分数以及所述第二风险分数的分数比例确定所述第一风险分数的第一权重以及所述第二风险分数的第二权重;
根据所述第一权重、所述第一风险分数、所述第二权重以及所述第二风险分数确定所述目标风险分数。
5.根据权利要求1所述的方法,其特征在于,所述获取待识别案件的特征向量,包括:
获取所述待识别案件的交易信息;
将所述交易信息进行特征工程处理,得到所述特征向量。
6.根据权利要求1至5中任一项所述的方法,其特征在于,所述根据所述目标风险分数对所述待识别案件进行风险识别,包括:
判断所述目标风险分数是否小于预设的风险阈值;
若所述目标风险分数大于或等于所述风险阈值,则确定所述待识别案件为风险案件;
若所述目标风险分数小于所述风险阈值,则确定所述待识别案件为非风险案件。
7.根据权利要求6所述的方法,其特征在于,所述特征向量包括多个子特征向量,所述确定所述待识别案件为风险案件之后,所述方法还包括:
针对多个所述子特征向量中每个子特征向量,将所述子特征向量作为目标子特征向量并调整所述目标子特征向量的权值,得到调整后的特征向量;
将所述调整后的特征向量输入所述训练后的无监督网络模型,得到第三风险分数;
将所述调整后的特征向量输入所述训练后的有监督网络模型,得到第四风险分数;
若所述第三风险分数与所述第一风险分数的分数差大于预设的第一分数差阈值,且所述第四风险分数与所述第二风险分数的分数差小于预设的第二分出差阈值,则确定所述目标子特征向量为变异特征向量,所述第一分数差阈值大于所述第二分数差阈值。
8.一种风险识别装置,其特征在于,包括:
获取单元,用于获取待识别案件的特征向量;
第一输入单元,用于将所述特征向量输入预设的训练后的无监督网络模型,得到第一风险分数;
训练单元,用于根据所述第一风险分数以及所述特征向量对预设的有监督网络模型进行训练,得到训练后的有监督网络模型;
第二输入单元,用于将所述特征向量输入训练后的有监督网络模型,得到第二风险分数;
第一确定单元,用于根据所述第一风险分数以及所述第二风险分数确定目标风险分数;
识别单元,用于根据所述目标风险分数对所述待识别案件进行风险识别。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时可实现如权利要求1-7中任一项所述的方法。
CN202210040403.3A 2022-01-14 2022-01-14 风险识别方法、装置、计算机设备及存储介质 Pending CN114386981A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210040403.3A CN114386981A (zh) 2022-01-14 2022-01-14 风险识别方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210040403.3A CN114386981A (zh) 2022-01-14 2022-01-14 风险识别方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN114386981A true CN114386981A (zh) 2022-04-22

Family

ID=81201636

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210040403.3A Pending CN114386981A (zh) 2022-01-14 2022-01-14 风险识别方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN114386981A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115018656A (zh) * 2022-08-08 2022-09-06 太平金融科技服务(上海)有限公司深圳分公司 风险识别方法、风险识别模型的训练方法、装置和设备
CN115910217A (zh) * 2022-12-23 2023-04-04 郑州思昆生物工程有限公司 一种碱基确定方法、装置、计算机设备及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115018656A (zh) * 2022-08-08 2022-09-06 太平金融科技服务(上海)有限公司深圳分公司 风险识别方法、风险识别模型的训练方法、装置和设备
CN115910217A (zh) * 2022-12-23 2023-04-04 郑州思昆生物工程有限公司 一种碱基确定方法、装置、计算机设备及存储介质
CN115910217B (zh) * 2022-12-23 2023-09-22 郑州思昆生物工程有限公司 一种碱基确定方法、装置、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
CN107169454B (zh) 一种人脸图像年龄估算方法、装置及其终端设备
CN107066616B (zh) 用于账号处理的方法、装置及电子设备
CN107958230B (zh) 人脸表情识别方法及装置
CN114386981A (zh) 风险识别方法、装置、计算机设备及存储介质
CN110909807A (zh) 基于深度学习的网络验证码识别方法、装置及计算机设备
CN110291542B (zh) 主要原因估计装置、主要原因估计系统以及主要原因估计方法
Kelly et al. Automatic prediction of health status using smartphone-derived behavior profiles
CN113946218A (zh) 设备上的活动识别
CN111506798A (zh) 用户筛选方法、装置、设备及存储介质
CN112634017A (zh) 远程开卡激活方法、装置、电子设备及计算机存储介质
CN115082041A (zh) 用户信息管理方法、装置、设备及存储介质
CN108875549A (zh) 图像识别方法、装置、系统及计算机存储介质
CN114118526A (zh) 一种企业风险预测方法、装置、设备及存储介质
CN110555007B (zh) 盗号行为判别方法、装置、计算设备及存储介质
CN116894242A (zh) 轨迹验证码的识别方法、装置、电子设备及存储介质
CN115204322B (zh) 行为链路异常识别方法和装置
Lim et al. More powerful selective kernel tests for feature selection
CN115954019A (zh) 一种融合自注意力和卷积操作的环境噪声识别方法及系统
CN116152551A (zh) 分类模型训练方法、分类方法、装置、设备及介质
CN115713806A (zh) 基于视频分类的跌倒行为识别方法及电子设备
Ninness et al. Neural network and multivariate analyses: Pattern recognition in academic and social research
CN110059180B (zh) 文章作者身份识别及评估模型训练方法、装置及存储介质
KR102072894B1 (ko) 인트론과 엑손 구분에 기반한 이상 서열 식별 방법
Slabchenko et al. Development of models for imputation of data from social networks on the basis of an extended matrix of attributes
CN111382712A (zh) 一种手掌图像识别方法、系统及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination