CN110020663B - 风险标签处理方法及装置和电子设备 - Google Patents

风险标签处理方法及装置和电子设备 Download PDF

Info

Publication number
CN110020663B
CN110020663B CN201910095194.0A CN201910095194A CN110020663B CN 110020663 B CN110020663 B CN 110020663B CN 201910095194 A CN201910095194 A CN 201910095194A CN 110020663 B CN110020663 B CN 110020663B
Authority
CN
China
Prior art keywords
risk
aesthetic
tag
tags
labels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910095194.0A
Other languages
English (en)
Other versions
CN110020663A (zh
Inventor
张慧南
沈磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Advanced New Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Advanced New Technologies Co Ltd filed Critical Advanced New Technologies Co Ltd
Priority to CN201910095194.0A priority Critical patent/CN110020663B/zh
Publication of CN110020663A publication Critical patent/CN110020663A/zh
Application granted granted Critical
Publication of CN110020663B publication Critical patent/CN110020663B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本说明书实施例提供一种风险标签处理方法及装置和电子设备,所述方法包括:将目标信息发送给多个客户端,并收集所述多个客户端针对该目标信息标注的风险标签;其中,所述风险标签表示客户端对目标信息进行风险识别得出的风险结果;计算所收集到的风险标签中相同风险标签的数量,并将达到阈值的风险标签确定为共识风险标签;将所述具有共识风险标签的信息作为已确定标签样本输入到目标业务模型中,并训练目标业务模型。

Description

风险标签处理方法及装置和电子设备
技术领域
本说明书实施例涉及互联网技术领域,尤其涉及一种风险标签处理方法及装置和电子设备。
背景技术
随着机器学习技术的不断发展,越来越多业务场景采用机器学习技术训练得到的模型进行业务处理。例如通过风险识别模型,可以识别业务的目标信息是否存在风险。
通常,风控模型最重要的指标是风险识别的准确率,只有在模型准确率达到预设要求的情况下,该模型才可以上线使用;并且准确率越高,目标模型对业务处理的结果越好,被投诉的几率越低。
现有技术中,风控模型的准确率主要与训练样本的质量呈正相关。这里训练样本的质量一般是指样本的风险标签。只有在大量高质量标签的训练样本支持下,才可以训练出准确率高的业务模型。然而,现有样本的风险标签质量良莠不济,无法提供大量高质量标签的训练样本,以供模型训练。
发明内容
本说明书实施例提供的一种风险标签处理方法及装置和电子设备:
根据本说明书实施例的第一方面,提供一种风险标签处理方法,所述方法包括:
将目标信息发送给多个客户端,并收集所述多个客户端针对该目标信息标注的风险标签;其中,所述风险标签表示客户端对目标信息进行风险识别得出的风险结果;
计算所收集到的风险标签中相同风险标签的数量,并将达到阈值的风险标签确定为共识风险标签;
将所述具有共识风险标签的信息作为已确定标签样本输入到目标业务模型中,并训练目标业务模型。
可选的,计算所述风险标签中相同风险标签的数量,具体包括:
基于设定的算法,计算所述风险标签之间的相似度;
将相似度达到阈值的风险标签确定为相同风险标签,并统计相同风险标签的数量。
可选的,所述设定的算法,包括:
模糊匹配算法、语义近似匹配算法。
可选的,所述方法还包括:
将所述共识风险标签推送给所述多个客户端。
根据本说明书实施例的第二方面,提供一种反洗钱审理标签处理方法,所述方法包括:
将被审理的账户信息发送给多个审理客户端,并收集所述多个审理客户端针对该被审理的账户信息标注的审理标签;其中,所述审理标签表示审理客户端对被审理的账户信息进行反洗钱审理得出的审理结果;
计算所收集到的审理标签中相同审理标签的数量,并将达到阈值的审理标签确定为共识审理标签;
将所述具有共识审理标签的账户信息作为已确定标签样本输入到反洗钱审理模型中,并训练反洗钱审理模型。
可选的,计算所述审理标签中相同审理标签的数量,具体包括:
基于设定的算法,计算所述审理标签之间的相似度;
将相似度达到阈值的审理标签确定为相同审理标签,并统计相同审理标签的数量。
可选的,所述方法还包括:
将所述共识审理标签推送给所述多个审理客户端。
根据本说明书实施例的第三方面,提供一种风险标签处理装置,所述装置包括:
收集单元,将目标信息发送给多个客户端,并收集所述多个客户端针对该目标信息标注的风险标签;其中,所述风险标签表示客户端对目标信息进行风险识别得出的风险结果;
计算单元,计算所收集到的风险标签中相同风险标签的数量,并将达到阈值的风险标签确定为共识风险标签;
训练单元,将所述具有共识风险标签的信息作为已确定标签样本输入到目标业务模型中,并训练目标业务模型。
根据本说明书实施例的第四方面,提供一种反洗钱审理标签处理装置,所述装置包括:
收集单元,将被审理的账户信息发送给多个审理客户端,并收集所述多个审理客户端针对该被审理的账户信息标注的审理标签;其中,所述审理标签表示审理客户端对被审理的账户信息进行反洗钱审理得出的审理结果;
计算单元,计算所收集到的审理标签中相同审理标签的数量,并将达到阈值的审理标签确定为共识审理标签;
训练单元,将所述具有共识审理标签的账户信息作为已确定标签样本输入到反洗钱审理模型中,并训练反洗钱审理模型。
根据本说明书实施例的第五方面,提供一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为上述任一项风险标签处理方法。
根据本说明书实施例的第六方面,提供一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为上述任一项反洗钱审理标签处理方法。
本说明书实施例,提供了一种风险标签处理方案,利用合作打标的方式,提升风险标签的质量,进而为目标业务模型训练提供大量具有高质量风险标签的训练样本。具体地,通过收集多个客户端针对该目标信息标注的风险标签,并计算这里风险标签中的共识风险标签,将共识风险标签作为高质量的风险标签提供给目标业务模型。
附图说明
图1是本说明书一实施例提供的风险标签处理方法的流程图;
图2是本说明书一实施例提供的反洗钱审理标签处理方法的流程图;
图3是本说明书一实施例提供的风险标签处理装置的硬件结构图;
图4是本说明书一实施例提供的风险标签处理装置的模块示意图;
图5是本说明书一实施例提供的反洗钱审理标签处理装置的硬件结构图;
图6是本说明书一实施例提供的反洗钱审理标签处理装置的模块示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书的一些方面相一致的装置和方法的例子。
在本说明书使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书。在本说明书和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
如前所述,随着机器学习技术的不断发展,越来越多业务场景采用机器学习技术训练得到的模型进行业务处理。例如通过风险识别模型,可以识别业务的目标信息是否存在风险。
通常,风控模型最重要的指标是风险识别的准确率,只有在模型准确率达到预设要求的情况下,该模型才可以上线使用;并且准确率越高,目标模型对业务处理的结果越好,被投诉的几率越低。
现有技术中,风控模型的准确率主要与训练样本的质量呈正相关。这里训练样本的质量一般是指样本的风险标签。只有在大量高质量标签的训练样本支持下,才可以训练出准确率高的业务模型。然而,现有样本的风险标签质量良莠不济,无法提供大量高质量标签的训练样本,以供模型训练。
为此本说明书提供了一种风险标签处理方案,利用合作打标的方式,提升风险标签的质量,进而为目标业务模型训练提供大量具有高质量风险标签的训练样本。本方案提供给客户端足够的灵活度和自由度,可以不对打标的内容进行限制,客户端可以根据自身习惯标注风险标签。
具体地,本说明书提供了一种风险标签处理方法,以下可以参考图1所示的例子介绍,该方法可以应用于服务端,所述方法可以包括以下步骤:
步骤110:将目标信息发送给多个客户端,并收集所述多个客户端针对该目标信息标注的风险标签;其中,所述风险标签表示客户端对目标信息进行风险识别得出的风险结果;
步骤120:计算所收集到的风险标签中相同风险标签的数量,并将达到阈值的风险标签确定为共识风险标签;
步骤130:将所述具有共识风险标签的信息作为已确定标签样本输入到目标业务模型中,并训练目标业务模型。
在该实施例中,所述服务端可以是指风险标签处理的服务器、服务器集群或者由服务器集群构建的云平台。
所述风险标签可以是字符、数字、图形等任意形式的标签。
以下以风险标签收集、共识风险标签计算以及共识风险标签应用三个方面对本说明书实施例进行详细介绍。
以下介绍风险标签收集:
服务端可以将同一个目标信息发送给多个客户端。由这些多个客户端对目标信息进行风险识别,并由客户端为目标信息标注风险标签。之后,服务端可以收集这些客户端打标的风险标签,以便进行风险标签汇总。
其中,所述收集可以是由客户端主动上传的,也可以是由服务端主动向客户端获取的。
其中,目标信息与风险标签之间可以建立有对应关系。如此,服务端才可以从收集到的风险标签中,识别出不同客户端标注的同一目标信息的风险标签,并汇总为目标信息的风险标签集合;该风险标签集合中包含了每个客户端标注的同一目标信息的风险标签。
值得一提的是,客户端可以对目标信息标注多个风险标签。
在一种实现方式中,所述风险识别可以是由使用客户端的工作人员完成的,也就是说风险结果可以是由人工判定的。
在另一种实现方式中,所述风险识别也可以是由计算机程序自动识别的,例如基于预设模型、算法、规则或策略等实现的自动风险识别。
在一实施例中,每个客户端都可以异步方式对目标信息进行风险识别。如此,虽然这些客户端是针对相同的目标信息进行风险识别,但识别过程无需协调,也不会受其他识别结果的影响,确保每个客户端标注的风险标签的独立性。
以下介绍共识风险标签计算(以下简称为共识计算):
服务端在汇总了关于目标信息的风险标签集合之后,所述服务端还可以对风险标签集合中的风险标签进行共识计算,以得到共识风险标签。所述共识风险标签可以是指,具有相同或相似含义的风险标签。这样的风险标签说明多数客户端针对目标信息的识别结果相同。
所述共识计算的目的是为了在最小化透露风险标签集合的情况下,让每个客户端可以感知自己标注的风险标签中,有哪些与其他客户端达成了共识。
其中,当客户端添加、删除或编辑风险标签的时候,服务端中共识计算就会被触发。
所述共识计算,具体包括:
计算所收集到的风险标签中相同风险标签的数量,并将达到阈值的风险标签确定为共识风险标签。所述达到可以是指大于或等于。
所述阈值可以是人为预先设置的一个经验值,通常可以是根据客户端数量确定的,并且一般阈值大小与客户端数量之间成正比。
举例说明:
假设客户端A、B、C对目标信息X进行风险识别,阈值为2。
客户端A为X标记的风险标签为{“a”,“b”,“d”}。
客户端B为X标记的风险标签为{“a”,“e”}。
客户端C为X标记的风险标签为{“a”,“c”,“d”}。
服务端汇总后得到的X的风险标签集合为{“a”,“b”,“d”,“a”,“e”,“a”,“c”,“d”};
然而,进行共识计算,统计相同风险标签的数量:
风险标签“a”的数量:3;
风险标签“b”的数量:1;
风险标签“c”的数量:1;
风险标签“d”的数量:2;
风险标签“e”的数量:1;
其中,只有风险标签“a”和“d”的数量达到阈值2,因此,服务端计算的共识风险标签为“a”和“d”。
在实际应用中,不同客户端标注的风险标签可能存在较小的差异,但实际想要表达的含义是相同的,例如以文字表示的风险标识中经常出现近义词,如果按照文字完全相同的标准计算共识风险标签,那么近义词虽然含义相同,但并不会作为相同的风险标签。举例说明:{夜间交易}和{晚上交易},文字上并不相同,但所表达的含义是相同的。
为了解决上述问题,在一实施例中,计算所述风险标签中相同风险标签的数量,具体包括:
基于设定的算法,计算所述风险标签之间的相似度;
将相似度达到阈值的风险标签确定为相同风险标签,并统计相同风险标签的数量。
通过模糊匹配算法、语义近似匹配算法等算法辅助进行共识计算,以形成更为高质量的共识风险标签。
以下介绍共识风险标签应用:
服务端在计算出目标信息的共识风险标签之后,还可以将所述具有共识风险标签的信息作为已确定标签样本输入到目标业务模型中,并训练目标业务模型。
在一实施例中,所述方法还包括:
将所述共识风险标签推送给所述多个客户端。
在共识计算完成后,服务端还可以将目标信息的共识风险标签发送给每个对该目标信息进行打标的客户端。在客户端侧,可以随时查看目标信息的打标情况,包括自身标注的风险标签以及收到的共识风险标签。
为了便于区别,可以将共识风险标签与非共识风险标签差异化显示。
例如,自身标注的风险标签为a,b,c;共识风险标签为a,d。
则,展示时,可以将共识风险标签为a,d高亮显示。
本实施例,利用合作打标的方式,提升风险标签的质量,进而为目标业务模型训练提供大量具有高质量风险标签的训练样本。具体地,通过收集多个客户端针对该目标信息标注的风险标签,并计算这里风险标签中的共识风险标签,将共识风险标签作为高质量的风险标签提供给目标业务模型。
上述风险标签处理可以应用于风险识别业务中,以下具体以反洗钱审理业务为例进一步进行说明。需要说明的是,上述反洗钱审理仅是风险识别业务中的一种,上述风险标签处理还可以应用于例如欺诈识别、团伙案件识别、信用识别等各种风险识别业务中,并且具体处理方式可以参照上述风险标签处理方案。
众所周知,洗钱是一种违法犯罪行为,为了应对洗钱,各结算机构(例如银行、第三方支付机构等)提出了反洗钱审理;通过反洗钱审理可以判断账户信息是否符合洗钱特征,从而做出相应处理。为了提高审理效率,可以部署反洗钱审理模型。同样地,反洗钱审理模型的准确率也与训练样本(例如关于账户信息的训练样本)的质量正相关。因此,需要提供更多高质量审理标签的训练样本。
为此本说明书提供了一种反洗钱审理标签处理方案,利用合作打标的方式,提升审理标签的质量,进而为反洗钱审理模型训练提供大量高质量审理标签的训练样本。本方案提供给客户端最够的灵活的和自由度,可以不对打标的内容进行限制,客户端可以根据自身习惯标注审理标签。
具体地,本说明书提供了一种反洗钱审理标签处理方法,以下可以参考图2所示的例子介绍,该方法可以应用于服务端,所述方法可以包括以下步骤:
步骤210:将被审理的账户信息发送给多个审理客户端,并收集所述多个审理客户端针对该被审理的账户信息标注的审理标签;其中,所述审理标签表示审理客户端对被审理的账户信息进行反洗钱审理得出的审理结果;
步骤220:计算所收集到的审理标签中相同审理标签的数量,并将达到阈值的审理标签确定为共识审理标签;
步骤230:将所述具有共识审理标签的账户信息作为已确定标签样本输入到反洗钱审理模型中,并训练反洗钱审理模型
在该实施例中,所述服务端可以是指反洗钱审理标签处理的服务器、服务器集群或者由服务器集群构建的云平台。
所述审理标签可以是字符、数字、图形等任意形式的标签。
以下以审理标签收集、共识审理标签计算以及共识审理标签应用三个方面对本说明书实施例进行详细介绍。
以下介绍审理标签收集:
服务端可以将同一个账户信息发送给多个审理客户端。由这些多个审理客户端对账户信息进行反洗钱审理,并由审理客户端为账户信息标注审理标签。之后,服务端可以收集这些审理客户端打标的审理标签,以便进行审理标签汇总。
其中,所述收集可以是由客户端主动上传的,也可以是由服务端主动向客户端获取的。
其中,账户信息与审理标签之间可以建立有对应关系。如此,服务端才可以从收集到的审理标签中,识别出不同审理客户端标注的同一账户信息的审理标签,并汇总为账户信息的审理标签集合;该审理标签集合中包含了每个审理客户端标注的同一账户信息的审理标签。
值得一提的是,审理客户端可以对账户信息标注多个审理标签。
在一种实现方式中,所述反洗钱审理可以是由使用审理客户端的工作人员完成的,也就是说审理结果可以是由人工判定的。
在另一种实现方式中,所述反洗钱审理也可以是由计算机程序自动识别的,例如基于预设模型、算法、规则或策略等实现的自动审理。
在一实施例中,每个审理客户端都可以异步方式对账户信息进行反洗钱审理。如此,虽然这些审理客户端是针对相同的账户信息进行反洗钱审理,但审理过程无需协调,也不会受其他审理结果的影响,确保每个审理客户端标注的审理标签的独立性。
以下介绍共识审理标签计算(以下简称为共识计算):
服务端在汇总了关于账户信息的审理标签集合之后,所述服务端还可以对审理标签集合中的审理标签进行共识计算,以得到共识审理标签。所述共识审理标签可以是指,具有相同或相似含义的审理标签。这样的审理标签说明多数客户端针对账户信息的审理结果相同。
所述共识计算的目的是为了在最小化透露审理标签集合的情况下,让每个审理客户端可以感知自己标注的审理标签中,有哪些与其他审理客户端达成了共识。
其中,当审理客户端添加、删除或编辑审理标签的时候,服务端中共识计算就会被触发。
所述共识计算,具体包括:
计算所收集到的审理标签中相同审理标签的数量,并将达到阈值的审理标签确定为共识审理标签。所述达到可以是指大于或等于。
所述阈值可以是人为预先设置的一个经验值,通常可以是根据审理客户端数量确定的,并且一般阈值大小与审理客户端数量之间成正比。
举例说明:
假设审理客户端A、B、C对账户信息X进行反洗钱审理,阈值为2。
审理客户端A为X标记的审理标签为{“a”,“b”,“d”}。
审理客户端B为X标记的审理标签为{“a”,“e”}。
审理客户端C为X标记的审理标签为{“a”,“c”,“d”}。
服务端汇总后得到的X的审理标签集合为{“a”,“b”,“d”,“a”,“e”,“a”,“c”,“d”};
然而,进行共识计算,统计相同审理标签的数量:
审理标签“a”的数量:3;
审理标签“b”的数量:1;
审理标签“c”的数量:1;
审理标签“d”的数量:2;
审理标签“e”的数量:1;
其中,只有审理标签“a”和“d”的数量达到阈值2,因此,服务端计算的共识审理标签为“a”和“d”。
在实际应用中,不同审理客户端标注的审理标签可能存在较小的差异,但实际想要表达的含义是相同的,例如以文字表示的审理标识中经常出现近义词,如果按照文字完全相同的标准计算共识审理标签,那么近义词虽然含义相同,但并不会作为相同的审理标签。举例说明:{夜间交易}和{晚上交易},文字上并不相同,但所表达的含义是相同的。
为了解决上述问题,在一实施例中,计算所述审理标签中相同审理标签的数量,具体包括:
基于设定的算法,计算所述审理标签之间的相似度;
将相似度达到阈值的审理标签确定为相同审理标签,并统计相同审理标签的数量。
通过模糊匹配算法、语义近似匹配算法等算法辅助进行共识计算,以形成更为高质量的共识审理标签。
以下介绍共识审理标签应用:
服务端在计算出账户信息的共识审理标签之后,还可以将所述具有共识审理标签的信息作为已确定标签样本输入到反洗钱审理模型中,并训练反洗钱审理模型。
在一实施例中,所述方法还包括:
将所述共识审理标签推送给所述多个审理客户端。
在共识计算完成后,服务端还可以将账户信息的共识审理标签发送给每个对该账户信息进行打标的审理客户端。在审理客户端侧,可以随时查看账户信息的打标情况,包括自身标注的审理标签以及收到的共识审理标签。
为了便于区别,可以将共识审理标签与非共识审理标签差异化显示。
例如,自身标注的审理标签为a,b,c;共识审理标签为a,d。
则,展示时,可以将共识审理标签为a,d高亮显示。
本实施例,利用合作打标的方式,提升审理标签的质量,进而为反洗钱审理模型训练提供大量具有高质量审理标签的训练样本。具体地,通过收集多个审理客户端针对该账户信息标注的审理标签,并计算这里审理标签中的共识审理标签,将共识审理标签作为高质量的风险标签提供给反洗钱审理模型。
与前述风险标签处理方法实施例相对应,本说明书还提供了风险标签处理装置的实施例。所述装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在设备的处理器将非易失性存储器中对应的计算机业务程序指令读取到内存中运行形成的。从硬件层面而言,如图3所示,为本说明书风险标签处理装置所在设备的一种硬件结构图,除了图3所示的处理器、网络接口、内存以及非易失性存储器之外,实施例中装置所在的设备通常根据风险标签处理实际功能,还可以包括其他硬件,对此不再赘述。
请参见图4,为本说明书一实施例提供的风险标签处理装置的模块图,所述装置对应了图1所示实施例,所述装置包括:
收集单元310,将目标信息发送给多个客户端,并收集所述多个客户端针对该目标信息标注的风险标签;其中,所述风险标签表示客户端对目标信息进行风险识别得出的风险结果;
计算单元320,计算所收集到的风险标签中相同风险标签的数量,并将达到阈值的风险标签确定为共识风险标签;
训练单元330,将所述具有共识风险标签的信息作为已确定标签样本输入到目标业务模型中,并训练目标业务模型。
可选的,计算单元320中计算所述风险标签中相同风险标签的数量,具体包括:
基于设定的算法,计算所述风险标签之间的相似度;
将相似度达到阈值的风险标签确定为相同风险标签,并统计相同风险标签的数量。
可选的,所述设定的算法,包括:
模糊匹配算法、语义近似匹配算法。
可选的,所述装置还包括:
推送单元,将所述共识风险标签推送给所述多个客户端。
与前述反洗钱审理标签处理方法实施例相对应,本说明书还提供了反洗钱审理标签处理装置的实施例。所述装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在设备的处理器将非易失性存储器中对应的计算机业务程序指令读取到内存中运行形成的。从硬件层面而言,如图5所示,为本说明书反洗钱审理标签处理装置所在设备的一种硬件结构图,除了图5所示的处理器、网络接口、内存以及非易失性存储器之外,实施例中装置所在的设备通常根据反洗钱审理标签处理实际功能,还可以包括其他硬件,对此不再赘述。
请参见图6,为本说明书一实施例提供的反洗钱审理标签处理装置的模块图,所述装置对应了图2所示实施例,所述装置包括:
收集单元410,将被审理的账户信息发送给多个审理客户端,并收集所述多个审理客户端针对该被审理的账户信息标注的审理标签;其中,所述审理标签表示审理客户端对被审理的账户信息进行反洗钱审理得出的审理结果;
计算单元420,计算所收集到的审理标签中相同审理标签的数量,并将达到阈值的审理标签确定为共识审理标签;
训练单元430,将所述具有共识审理标签的账户信息作为已确定标签样本输入到反洗钱审理模型中,并训练反洗钱审理模型。
可选的,计算单元420中计算所述审理标签中相同审理标签的数量,具体包括:
基于设定的算法,计算所述审理标签之间的相似度;
将相似度达到阈值的审理标签确定为相同审理标签,并统计相同审理标签的数量。
可选的,所述设定的算法,包括:
将所述共识审理标签推送给所述多个审理客户端。
可选的,所述装置还包括:
推送单元,将所述共识审理标签推送给所述多个审理客户端。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本说明书方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上图4描述了风险标签处理装置的内部功能模块和结构示意,其实质上的执行主体可以为一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
将目标信息发送给多个客户端,并收集所述多个客户端针对该目标信息标注的风险标签;其中,所述风险标签表示客户端对目标信息进行风险识别得出的风险结果;
计算所收集到的风险标签中相同风险标签的数量,并将达到阈值的风险标签确定为共识风险标签;
将所述具有共识风险标签的信息作为已确定标签样本输入到目标业务模型中,并训练目标业务模型。
以上图6描述了风险标签处理装置的内部功能模块和结构示意,其实质上的执行主体可以为一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
将被审理的账户信息发送给多个审理客户端,并收集所述多个审理客户端针对该被审理的账户信息标注的审理标签;其中,所述审理标签表示审理客户端对被审理的账户信息进行反洗钱审理得出的审理结果;
计算所收集到的审理标签中相同审理标签的数量,并将达到阈值的审理标签确定为共识审理标签;
将所述具有共识审理标签的账户信息作为已确定标签样本输入到反洗钱审理模型中,并训练反洗钱审理模型。
在上述电子设备的实施例中,应理解,该处理器可以是中央处理单元(英文:Central Process ing Uni t,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application SpecificIntegrated Circui t,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,而前述的存储器可以是只读存储器(英文:read-only memory,缩写:ROM)、随机存取存储器(英文:random access memory,简称:RAM)、快闪存储器、硬盘或者固态硬盘。结合本发明实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于电子设备实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本说明书的其它实施方案。本说明书旨在涵盖本说明书的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本说明书的一般性原理并包括本说明书未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本说明书的真正范围和精神由下面的权利要求指出。
应当理解的是,本说明书并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本说明书的范围仅由所附的权利要求来限制。

Claims (10)

1.一种风险标签处理方法,所述方法包括:
将目标信息发送给多个客户端,并收集所述多个客户端针对该目标信息标注的风险标签;其中,所述风险标签表示客户端对目标信息进行风险识别得出的风险结果;
计算所收集到的风险标签中相同风险标签的数量,并将达到阈值的风险标签确定为共识风险标签;
将所述具有共识风险标签的信息作为已确定标签样本输入到目标业务模型中,并训练目标业务模型。
2.根据权利要求1所述的方法,计算所述风险标签中相同风险标签的数量,具体包括:
基于设定的算法,计算所述风险标签之间的相似度;
将相似度达到阈值的风险标签确定为相同风险标签,并统计相同风险标签的数量。
3.根据权利要求2所述的方法,所述设定的算法,包括:
模糊匹配算法、语义近似匹配算法。
4.根据权利要求1所述的方法,所述方法还包括:
将所述共识风险标签推送给所述多个客户端。
5.一种反洗钱审理标签处理方法,所述方法包括:
将被审理的账户信息发送给多个审理客户端,并收集所述多个审理客户端针对该被审理的账户信息标注的审理标签;其中,所述审理标签表示审理客户端对被审理的账户信息进行反洗钱审理得出的审理结果;
计算所收集到的审理标签中相同审理标签的数量,并将达到阈值的审理标签确定为共识审理标签;
将所述具有共识审理标签的账户信息作为已确定标签样本输入到反洗钱审理模型中,并训练反洗钱审理模型。
6.根据权利要求5所述的方法,计算所述审理标签中相同审理标签的数量,具体包括:
基于设定的算法,计算所述审理标签之间的相似度;
将相似度达到阈值的审理标签确定为相同审理标签,并统计相同审理标签的数量。
7.根据权利要求5所述的方法,所述方法还包括:
将所述共识审理标签推送给所述多个审理客户端。
8.一种风险标签处理装置,所述装置包括:
收集单元,将目标信息发送给多个客户端,并收集所述多个客户端针对该目标信息标注的风险标签;其中,所述风险标签表示客户端对目标信息进行风险识别得出的风险结果;
计算单元,计算所收集到的风险标签中相同风险标签的数量,并将达到阈值的风险标签确定为共识风险标签;
训练单元,将所述具有共识风险标签的信息作为已确定标签样本输入到目标业务模型中,并训练目标业务模型。
9.一种反洗钱审理标签处理装置,所述装置包括:
收集单元,将被审理的账户信息发送给多个审理客户端,并收集所述多个审理客户端针对该被审理的账户信息标注的审理标签;其中,所述审理标签表示审理客户端对被审理的账户信息进行反洗钱审理得出的审理结果;
计算单元,计算所收集到的审理标签中相同审理标签的数量,并将达到阈值的审理标签确定为共识审理标签;
训练单元,将所述具有共识审理标签的账户信息作为已确定标签样本输入到反洗钱审理模型中,并训练反洗钱审理模型。
10.一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为上述权利要求1-7中任一项所述的方法。
CN201910095194.0A 2019-01-31 2019-01-31 风险标签处理方法及装置和电子设备 Active CN110020663B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910095194.0A CN110020663B (zh) 2019-01-31 2019-01-31 风险标签处理方法及装置和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910095194.0A CN110020663B (zh) 2019-01-31 2019-01-31 风险标签处理方法及装置和电子设备

Publications (2)

Publication Number Publication Date
CN110020663A CN110020663A (zh) 2019-07-16
CN110020663B true CN110020663B (zh) 2023-11-03

Family

ID=67188960

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910095194.0A Active CN110020663B (zh) 2019-01-31 2019-01-31 风险标签处理方法及装置和电子设备

Country Status (1)

Country Link
CN (1) CN110020663B (zh)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9230101B2 (en) * 2013-03-15 2016-01-05 Pinkerton Consulting And Investigations, Inc. Providing alerts based on unstructured information methods and apparatus
CN107256465A (zh) * 2017-06-28 2017-10-17 阿里巴巴集团控股有限公司 风险账户的识别方法及装置
CN109063920B (zh) * 2018-08-20 2022-05-27 创新先进技术有限公司 一种交易风险识别方法、装置、及计算机设备

Also Published As

Publication number Publication date
CN110020663A (zh) 2019-07-16

Similar Documents

Publication Publication Date Title
US11610394B2 (en) Neural network model training method and apparatus, living body detecting method and apparatus, device and storage medium
CN108616491B (zh) 一种恶意用户的识别方法和系统
CN112231484B (zh) 一种新闻评论审核方法、系统、装置和存储介质
WO2017106600A1 (en) Analysis of transaction information using graphs
CN110263157B (zh) 一种数据风险预测方法、装置及设备
CN110795584B (zh) 一种用户标识生成方法、装置及终端设备
WO2020257991A1 (zh) 用户识别方法及相关产品
CN112990294B (zh) 行为判别模型的训练方法、装置、电子设备及存储介质
CN112541443B (zh) 发票信息抽取方法、装置、计算机设备及存储介质
CN113903363B (zh) 基于人工智能的违规行为检测方法、装置、设备及介质
US20230410222A1 (en) Information processing apparatus, control method, and program
CN111798047A (zh) 风控预测方法、装置、电子设备及存储介质
CN112750038B (zh) 交易风险的确定方法、装置和服务器
CN110020663B (zh) 风险标签处理方法及装置和电子设备
CN113032524A (zh) 商标侵权识别方法、终端设备及存储介质
CN115687790B (zh) 基于大数据的广告推送方法、系统及云平台
WO2023077963A1 (zh) 图像文本识别方法、装置、计算机可读介质及电子设备
CN111104844B (zh) 多发票信息录入方法、装置、电子设备及存储介质
CN113282837B (zh) 事件分析方法、装置、计算机设备及存储介质
CN115660817A (zh) 一种分类模型训练方法及装置
CN112132693A (zh) 交易验证方法、装置、计算机设备与计算机可读存储介质
CN110570301B (zh) 风险识别方法、装置、设备及介质
CN113298182A (zh) 基于凭证影像的预警方法、装置及设备
CN113487320A (zh) 欺诈交易检测方法、装置、计算机设备和存储介质
CN111753598A (zh) 人脸检测方法及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200924

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20200924

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant