CN113837635A - 风险检测处理方法、装置及设备 - Google Patents
风险检测处理方法、装置及设备 Download PDFInfo
- Publication number
- CN113837635A CN113837635A CN202111150419.1A CN202111150419A CN113837635A CN 113837635 A CN113837635 A CN 113837635A CN 202111150419 A CN202111150419 A CN 202111150419A CN 113837635 A CN113837635 A CN 113837635A
- Authority
- CN
- China
- Prior art keywords
- event
- training
- information
- risk detection
- knowledge
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 408
- 238000003672 processing method Methods 0.000 title claims abstract description 30
- 238000012549 training Methods 0.000 claims abstract description 288
- 238000012545 processing Methods 0.000 claims abstract description 139
- 238000000034 method Methods 0.000 claims abstract description 75
- 230000008569 process Effects 0.000 claims description 36
- 239000011159 matrix material Substances 0.000 claims description 35
- 238000003860 storage Methods 0.000 claims description 30
- 230000006870 function Effects 0.000 claims description 17
- 238000012360 testing method Methods 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 9
- 239000003795 chemical substances by application Substances 0.000 description 51
- 238000010586 diagram Methods 0.000 description 15
- 238000010801 machine learning Methods 0.000 description 14
- 230000006872 improvement Effects 0.000 description 9
- 238000004590 computer program Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 239000013598 vector Substances 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 229920001296 polysiloxane Polymers 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Educational Administration (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Tourism & Hospitality (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Development Economics (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本说明书实施例提供了一种风险检测处理方法、装置及设备,其中方法包括:根据获取的多个目标事件的事件信息,生成多个目标事件的第一知识超图;其中,事件信息包括相应目标事件的至少一个事件要素;第一知识超图的每个超边对应一个目标事件,超边中的每个节点对应至少一个目标事件的一个事件要素;根据第一知识超图,确定目标事件中待检测项目的检测信息;采用预先通过两个代理任务基于多个历史事件的第二知识超图进行交替预训练所得的预训练模型生成检测信息的第一特征数据;采用预先训练的风险检测模型,基于第一特征数据对待检测项目进行风险检测处理,得到风险检测结果信息。
Description
技术领域
本文件涉及数据处理技术领域,尤其涉及一种风险检测处理方法、装置及设备。
背景技术
知识超图是知识图谱的一种扩展,在知识超图中,可以在两个以上的实体之间建立关系。
在风险检测过程中,风控决策通常是由事件驱动,而事件通常涉及多个主体,如主动方、被动方、设备等。因此,通过知识超图来刻画事件,从而进行风险检测,有利于提升风险检测的准确性。但是,知识超图作为一种较为复杂的数据表达方式,无法直接使用到机器学习当中,因此,如何将知识超图应用于风险检测,是急需解决的技术问题。
发明内容
本说明书一个或多个实施例提供了一种风险检测处理方法。该方法包括根据获取的多个目标事件的事件信息,生成所述多个目标事件的第一知识超图。其中,所述事件信息包括相应目标事件的至少一个事件要素。所述第一知识超图的每个超边对应一个所述目标事件。所述超边中的每个节点对应至少一个所述目标事件的所述事件要素。根据所述第一知识超图,确定所述目标事件中待检测项目的检测信息。采用预先训练的预训练模型生成所述检测信息的第一特征数据。其中,所述预训练模型通过两个代理任务基于多个历史事件的第二知识超图进行交替预训练所得。采用预先训练的风险检测模型,基于所述第一特征数据对所述待检测项目进行风险检测处理,得到风险检测结果信息。
本说明书一个或多个实施例提供了一种风险检测处理方法。该方法包括根据获取的多个目标事件的事件信息,生成所述多个目标事件的第一知识超图。其中,所述事件信息包括相应目标事件的至少一个事件要素。所述第一知识超图的每个超边对应一个所述目标事件,所述超边中的每个节点对应至少一个所述目标事件的所述事件要素。根据所述第一知识超图,确定所述目标事件中待检测项目的检测信息。基于区块链系统中部署的智能合约和预先训练的预训练模型,生成所述检测信息的第一特征数据.其中,所述预训练模型预先通过两个代理任务基于多个历史事件的第二知识超图进行交替预训练所得。基于所述智能合约和预先训练的风险检测模型,根据所述第一特征数据对所述待检测项目进行风险检测处理,得到风险检测结果信息。将根据所述风险检测结果信息生成的风险检测记录保存至所述区块链系统中。
本说明书一个或多个实施例提供了一种风险检测处理装置。该装置包括第一生成模块,根据获取的多个目标事件的事件信息,生成所述多个目标事件的第一知识超图。其中,所述事件信息包括相应目标事件的至少一个事件要素。所述第一知识超图的每个超边对应一个所述目标事件。所述超边中的每个节点对应至少一个所述目标事件的所述事件要素。该装置还包括确定模块,根据所述第一知识超图,确定所述目标事件中待检测项目的检测信息。该装置还包括第二生成模块,采用预先训练的预训练模型生成所述检测信息的第一特征数据。其中,所述预训练模型通过两个代理任务基于多个历史事件的第二知识超图进行交替预训练所得。该装置还包括检测模块,采用预先训练的风险检测模型,基于所述第一特征数据对所述待检测项目进行风险检测处理,得到风险检测结果信息。
本说明书一个或多个实施例提供了一种风险检测处理装置。该装置包括第一生成模块,根据获取的多个目标事件的事件信息,生成所述多个目标事件的第一知识超图。其中,所述事件信息包括相应目标事件的至少一个事件要素。所述第一知识超图的每个超边对应一个所述目标事件。所述超边中的每个节点对应至少一个所述目标事件的所述事件要素。该装置还包括确定模块,根据所述第一知识超图,确定所述目标事件中待检测项目的检测信息。该装置还包括第二生成模块,基于区块链系统中部署的智能合约和预先训练的预训练模型,生成所述检测信息的第一特征数据。其中,所述预训练模型通过两个代理任务基于多个历史事件的第二知识超图进行交替预训练所得。该装置还包括检测模块,基于所述智能合约和预先训练的风险检测模型,根据所述第一特征数据对所述待检测项目进行风险检测处理,得到风险检测结果信息。该装置还包括保存模块,将根据所述风险检测结果信息生成的风险检测记录保存至所述区块链系统中。
本说明书一个或多个实施例提供了一种风险检测处理设备。该设备包括处理器。该设备还包括被安排成存储计算机可执行指令的存储器。所述计算机可执行指令在被执行时使所述处理器根据获取的多个目标事件的事件信息,生成所述多个目标事件的第一知识超图。其中,所述事件信息包括相应目标事件的至少一个事件要素。所述第一知识超图的每个超边对应一个所述目标事件。所述超边中的每个节点对应至少一个所述目标事件的所述事件要素。根据所述第一知识超图,确定所述目标事件中待检测项目的检测信息。采用预先训练的预训练模型生成所述检测信息的第一特征数据。其中,所述预训练模型通过两个代理任务基于多个历史事件的第二知识超图进行交替预训练所得。采用预先训练的风险检测模型,基于所述第一特征数据对所述待检测项目进行风险检测处理,得到风险检测结果信息。
本说明书一个或多个实施例提供了一种风险检测处理设备。该设备包括处理器。该设备还包括被安排成存储计算机可执行指令的存储器。所述计算机可执行指令在被执行时使所述处理器根据获取的多个目标事件的事件信息,生成所述多个目标事件的第一知识超图。其中,所述事件信息包括相应目标事件的至少一个事件要素。所述第一知识超图的每个超边对应一个所述目标事件,所述超边中的每个节点对应至少一个所述目标事件的所述事件要素。根据所述第一知识超图,确定所述目标事件中待检测项目的检测信息。基于区块链系统中部署的智能合约和预先训练的预训练模型,生成所述检测信息的第一特征数据。其中,所述预训练模型预先通过两个代理任务基于多个历史事件的第二知识超图进行交替预训练所得。基于所述智能合约和预先训练的风险检测模型,根据所述第一特征数据对所述待检测项目进行风险检测处理,得到风险检测结果信息。将根据所述风险检测结果信息生成的风险检测记录保存至所述区块链系统中。
本说明书一个或多个实施例提供了一种存储介质。该存储介质用于存储计算机可执行指令。所述计算机可执行指令在被处理器执行时根据获取的多个目标事件的事件信息,生成所述多个目标事件的第一知识超图。其中,所述事件信息包括相应目标事件的至少一个事件要素。所述第一知识超图的每个超边对应一个所述目标事件。所述超边中的每个节点对应至少一个所述目标事件的所述事件要素。根据所述第一知识超图,确定所述目标事件中待检测项目的检测信息。采用预先训练的预训练模型生成所述检测信息的第一特征数据。其中,所述预训练模型通过两个代理任务基于多个历史事件的第二知识超图进行交替预训练所得。采用预先训练的风险检测模型,基于所述第一特征数据对所述待检测项目进行风险检测处理,得到风险检测结果信息。
本说明书一个或多个实施例提供了一种存储介质。该存储介质用于存储计算机可执行指令。所述计算机可执行指令在被处理器执行时根据获取的多个目标事件的事件信息,生成所述多个目标事件的第一知识超图。其中,所述事件信息包括相应目标事件的至少一个事件要素。所述第一知识超图的每个超边对应一个所述目标事件,所述超边中的每个节点对应至少一个所述目标事件的所述事件要素。根据所述第一知识超图,确定所述目标事件中待检测项目的检测信息。基于区块链系统中部署的智能合约和预先训练的预训练模型,生成所述检测信息的第一特征数据。其中,所述预训练模型预先通过两个代理任务基于多个历史事件的第二知识超图进行交替预训练所得。基于所述智能合约和预先训练的风险检测模型,根据所述第一特征数据对所述待检测项目进行风险检测处理,得到风险检测结果信息。将根据所述风险检测结果信息生成的风险检测记录保存至所述区块链系统中。
附图说明
为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书一个或多个实施例提供的一种传统图谱的示意图;
图2为本说明书一个或多个实施例提供的一种知识超图的示意图;
图3为本说明书一个或多个实施例提供的一种风险检测处理方法的第一种流程示意图;
图4为本说明书一个或多个实施例提供的一种风险检测处理方法的第二种流程示意图;
图5为本说明书一个或多个实施例提供的一种风险检测处理方法的第三种流程示意图;
图6为本说明书一个或多个实施例提供的一种风险检测处理方法的第四种流程示意图;
图7为本说明书一个或多个实施例提供的一种风险检测处理方法的第五种流程示意图;
图8为本说明书一个或多个实施例提供的一种风险检测处理方法的第六种流程示意图;
图9为本说明书一个或多个实施例提供的一种风险检测处理装置的第一种模块组成示意图;
图10为本说明书一个或多个实施例提供的一种风险检测处理装置的第二种模块组成示意图;
图11为本说明书一个或多个实施例提供的一种风险检测处理设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书一个或多个实施例中的技术方案,下面将结合本说明书一个或多个实施例中的附图,对本说明书一个或多个实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书的一部分实施例,而不是全部的实施例。基于本说明书一个或多个实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本文件的保护范围。
在传统的图谱结构中,如图1所示,每条边只能连接两个点,例如边d1连接了v1和v4两个点,边d5连接了v3和v6两个点等。而在知识超图中,提出了“超边”和“节点”的概念,每条超边可以同时连接大于等于2个的节点,如图2所示的知识超图,其包括超边e1、e2和e3,其中,超边e1包括节点v1、节点v2和节点v3,超边e2包括节点v1、节点v3和节点v4,超边e3包括节点v5、节点v6和节点v7。知识超图作为一种较为复杂的数据表达方式,无法直接使用到机器学习模型中。为此通常需要对知识超图的节点和超边进行学习和表征,即将他们转化为向量表示。目前,人们提出了基于超边补全的知识超图表征方案,即将知识超图中已知的超边作为正样本,并随机采集知识超图中不存在的超边作为负样本来建立模型,以通过已知超边去预测未知超边的存在。然而,在风控场景中,由于风险来自非常少见的非正常事件,其对应的标签是很稀疏的,因此,进行有监督的表征学习是很困难的,造成模型基于这些已知数据无法很好的表达。并且,该基于超边补全的知识超图表征的方案中,所有的表征是直推式(transductive)的,即所有实体及超边的表征向量均作为参数进行学习,而非由参数化模型推导的,因此,无法进行未知实体间的超边预测。再者,该基于超边补全的知识超图表征的方案中,其主要目的是为了进行知识超图补全,对于其他的下游任务并没有很好的考虑进去,所以其表征的适用性是不够全面的。基于此,本说明书提供了一种风险检测处理方法、装置及设备,以解决基于超边补全的知识超图表征的方案所存在的上述问题。
图3为本说明书一个或多个实施例提供的一种风险检测处理方法的流程示意图,图3中的方法能够由风险检测处理装置执行,该风险检测处理装置可以设置于终端设备中,也可以设置于服务端。其中,终端设备例如手机、平板电脑、台式计算机、便携式笔记本等;服务端如独立的服务器,或者由多个服务器组成的服务器集群等。如图3所示,该方法包括以下步骤:
步骤S102,根据获取的多个目标事件的事件信息,生成该多个目标事件的第一知识超图;其中,事件信息包括相应目标事件的至少一个事件要素;第一知识超图的每个超边对应一个目标事件,超边中的每个节点对应至少一个目标事件的事件要素;
可选的,各客户端基于用户操作,将获取到的目标事件的事件信息发送给风险检测处理装置;相应的,风险检测处理装置接收各客户端发送的事件信息。或者,各客户端基于用户操作,将获取到的目标事件的事件信息发送给相应的事件处理服务端,当风险检测处理装置与事件处理服务端分离而独立存在时,事件处理服务端将接收到的各事件信息发送给风险检测处理装置;相应的,风险检测处理装置接收事件处理服务端发送的各事件信息;当风险检测处理装置设置于事件处理服务端时,获取事件处理服务端接收到的各事件信息。对于风险检测处理装置获取多个目标事件的事件信息的过程,本说明书中不做具体限定,可以在实际应用中根据需要自行设定。其中,目标事件可以是一笔交易,例如转账交易、支付交易等;相应的,事件要素可以包括支付方、收款方、支付账户、收款账户、交易时间、交易地点、交易使用的设备等。目标事件还可以是一笔业务,例如开户业务、借贷业务等;相应的,事件要素可以包括业务的请求方、请求时间、请求地点、请求所使用的设备、请求所使用的wifi等。以目标事件是一笔支付交易为例进行说明,由于用户可以在不同的支付交易中,使用同一个支付账户、同一个设备等,因此,不同的目标事件可能有相同的事件要素,即超边中的每个节点对应至少一个目标事件的一个事件要素,也即不同的超边可以有相同的节点。
步骤S104,根据第一知识超图,确定目标事件中待检测项目的检测信息;
具体的,根据预设方式确定每个目标事件的待检测项目;根据第一知识超图,确定待检测项目的检测信息。可选地,事件信息中包括待检测项目的项目信息(如表征转出账户的信息、表征目标事件的信息等),相应的,根据预设方式确定每个目标事件的待检测项目可以包括:根据每个事件信息中的项目信息确定相应目标事件的待检测项目。或者,在风险检测处理装置中预设待检测项目的项目信息,相应的,根据预设方式确定每个目标事件的待检测项目包括:将预设的项目信息所对应的项目确定为待检测项目。或者,事件信息中还包括目标事件的事件类型(如交易类型、业务类型等),相应的,根据预设方式确定每个目标事件的待检测项目包括:根据事件信息中的事件类型,从预设的事件类型与待检测项目的项目信息的关联关系中,获取关联的项目信息;将获取的项目信息所对应的项目确定为待检测项目。待检测项目的项目信息可以是某个事件要素,也可以是某个目标事件。
步骤S106,采用预先训练的预训练模型生成检测信息的第一特征数据;其中,预训练模型通过两个代理任务基于多个历史事件的第二知识超图进行交替预训练所得;
其中,预训练模型用于生成基于知识超图所确定的检测信息的第一特征数据。由于在风控场景中,风险来自非常少见的非正常事件,其对应的标签是很稀疏的,进行有监督的学习是很困难的,无法产出比较好的结果。基于此,本说明书实施例中,预先通过两个代理任务基于多个历史事件的第二知识超图进行预训练模型的训练处理,得到预训练模型,从而基于该预训练模型生成待检测项目的检测信息的第一特征数据。由于在预训练模型中,可脱离对于标签的依赖而学习数据内部的表达,因此能够较好的对知识超图进行表征学习,解决了基于标签的有监督的学习无法产出较好结果的问题。此外,两个代理任务通过参数化方法学习模型,不仅可以推导未知节点和超边的表征,而且相较于直推式的表征而言,无需所有节点和所有超边均输入,因此提升了表征学习的效率。
步骤S108,采用预先训练的风险检测模型,基于第一特征数据对待检测项目进行风险检测处理,得到风险检测结果信息。
其中,风险检测模型用于基于第一特征数据进行风险检测处理,并在确定待检测项目存在指定风险时,生成表征存在风险的风险检测结果信息;在确定待检测项目不存在指定风险时,生成表征不存在风险的风险检测结果信息。
本说明书一个或多个实施例中,预先训练预训练模型和风险检测模,并在获取到多个目标事件的事件信息时,生成该多个目标事件的第一知识超图;基于第一知识超图,确定目标事件中待检测项目的检测信息,并采用预训练模型生成该检测信息的第一特征数据,采用风险检测模型基于第一特征数据进行风险检测处理。由此,通过训练预训练模型,解决了因标签稀疏而无法对知识超图进行较好表征学习的问题,实现了知识超图在机器学习以及在风控领域的有效应用。并且基于预训练模型生成的第一特征数据,可以供风险检测模型等下游任务使用,因此有利于提升知识超图的适用范围,使知识超图服务于更多的场景。
为了更好的刻画目标事件,从而对待检测项目进行风险检测处理,本说明书一个或多个实施例中,基于获取的多个目标事件的事件信息,生成该多个目标事件的第一知识超图。
具体的,如图4所示,步骤S102可以包括以下步骤S102-2和步骤S102-4:
步骤S102-2,对获取的多个目标事件的事件信息所包括的各事件要素进行去重处理,得到目标事件要素;
考虑到不同的目标事件可能具有相同的事件要素,为了避免重复,对获取的多个目标事件的事件信息所包括的各事件要素进行去重处理,得到目标事件要素。
步骤S102-4,将每个目标事件要素确定为一个节点,分别根据每个事件信息包括的事件要素,基于相应的节点生成相应目标事件所对应的超边,得到第一知识超图。
例如,将账户1确定为一个节点,将账户2确定为一个节点,将账户3确定为一个节点,将设备1确定为一个节点,将设备2确定为一个节点,将地点1确定为一个节点。目标事件1的事件信息包括的事件要素为账户1、账户3、设备1、地点1,则基于对应账户1、账户3、设备1、地点1对应的各节点生成目标事件1所对应的超边。按照相同的方式,依次生成每个目标事件所对应的超边,得到第一知识超图。
在得到第一知识超图之后,即可基于第一知识超图确定待检测项目的项目信息,具体的,如图5所示,步骤S104可以包括以下步骤S104-2至步骤S104-6:
步骤S104-2,确定目标事件的待检测项目的类型信息,若类型信息表征待检测项目为目标事件,则执行步骤S104-4;若类型信息表征待检测项目为事件要素,则执行步骤S104-6;
可选地,每个目标事件的事件信息还包括目标事件的待检测项目的类型信息,相应的,风险检测处理装置从各事件信息中获取类型信息,并在确定类型信息表征待检测项目为目标事件时,执行步骤S104-4;以及在确定类型信息表征待检测项目为事件要素时,执行步骤S104-6。或者,在确定待检测项目之后,根据待检测项目的项目信息,从项目信息与类型信息的关联关系中,获取关联的类型信息;并在确定类型信息表征待检测项目为目标事件时,执行步骤S104-4;以及在确定类型信息表征待检测项目为事件要素时,执行步骤S104-6。对于目标事件的待检测项目的类型信息的确定过程,本说明书中不做具体限定,可以在实际应用中根据需要自行设定。
步骤S104-4,将第一知识超图中与待检测的目标事件相对应的超边的相关信息确定为检测信息,执行步骤S106;
其中,超边的相关信息可以包括超边中各节点的信息(如节点对应的事件要素等)、超边对应的目标事件的信息(如事件类型等)等。
步骤S104-6,根据第一知识超图,确定与待检测的事件要素相对应的第一节点具有关联关系的第二节点,将第一节点和第二节点的相关信息确定为检测信息,执行步骤S106。
其中,不同的第二节点与第一节点可以是同一超边中的节点,也可以是不同超边中的节点。第一节点和第二节点的相关信息,可以是第一节点和第二节点对应的事件要素的属性信息,例如对应的事件要素是账户,属性信息可以是账户类型(如储蓄账户、信用账户等)、账户所在地等;又如,事件要素是设备,属性信息可以是设备的序列号、设备的归属人、设备的所在地等。
由此,通过生成多个目标事件的第一知识超图,并基于第一知识超图确定待检测项目的检测信息,从而可通过预训练模型生成该检测信息的第一特征信息,并基于第一特征信息进行风险检测处理。实现了知识超图在风险检测领域中的应用,不仅能够通过知识超图全面的刻画各目标事件,以及各事件要素之间的关系,而且实现了知识超图这种复杂的数据表达方式在机器学习中的应用。
为了能够对知识超图中的超边以及节点进行表征,本说明书一个或多个实施例中,预先基于多个历史事件的事件信息进行训练处理,以得到预训练模型。具体的,如图6所示,步骤S102之前还可以包括以下步骤S1002和步骤S1004:
步骤S1002,根据获取的多个历史事件的事件信息,生成多个历史事件的第二知识超图;
其中,生成第二知识超图的过程,与前述生成第一知识超图的过程相同,可参见前述相关描述,重复之处这里不再赘述。
步骤S1004,交替采用第一代理任务和第二代理任务,基于第二知识超图进预训练模型的训练处理,得到预训练模型;其中,第一代理任务的训练处理得到第一模型参数;第一代理任务在第二代理任务对第一模型参数对应的待训练的预训练模型进行训练处理得到第二模型参数之后,对第二模型参数对应的待训练的预训练模型进行训练处理。
具体的,如图7所示,步骤S1004可以包括以下步骤S1004-2至步骤S1004-6:
步骤S1004-2,根据第二知识超图,构建预训练集和测试集;
具体的,将第二知识超图中的每个超边确定为一个样本,得到样本集合;根据预设的第一划分规则,将样本集合划分为预训练集和测试集;根据预设的第二划分规则,将预训练集划分为多个预训练子集。
其中,根据预设的第一划分规则,将样本集合划分为预训练集和测试集可以包括:根据预设比例将样本集合划分为训练集和测试集;或者,随机将样本集合划分为训练集和测试集。根据预设的第二划分规则,将预训练集划分为多个预训练子集,可以包括,根据预设的预训练子集的数量,随机将训练集划分为多个预训练子集;或者,根据预设的每个预训练子集包括的样本数量,随机将训练集划分为多个预训练子集。
步骤S1004-4,交替采用第一代理任务和第二代理任务基于预训练集进行训练处理,并在满足预设的训练停止条件时,得到待测试的预训练模型;
可以理解的是,将各预训练子集分别记为预训练子集1、预训练子集2、预训练子集3、预训练子集4…预训练子集w,第一代理任务基于预训练子集1、预训练子集3、预训练子集5等序号为基数的预训练子集进行训练处理,第二代理任务基于预训练子集2、预训练子集4、预训练子集6等序号为偶数的预训练子集进行训练处理,w为正整数。
其中,采用第一代理任务基于对应的预训练子集进行训练处理,可以包括:针对第一代理任务对应的预训练子集中的每个超边,随机从超边的节点中选择一个种子节点,并将超边的节点中除种子节点外的节点确定为种子节点的上下文节点;根据种子节点和上下文节点,构建正样本;从第一代理任务对应的预训练子集所包括的节点中,获取与种子节点对应的要素类型相同、且与种子节点不在同一个超边的辅助节点;根据每个辅助节点和上下文节点,构建负样本;对各正样本与各负样本中的节点进行两两相连,得到全连接图;基于全连接图和预设的第一交叉熵损失函数进行训练处理。
可以理解的是,第一代理任务是节点级别的代理任务;上下文节点是一个节点集合,例如,某个超边包括节点v1、v2、v3、v4,种子节点是v2,上下文节点是v1、v3、v4。将上下文节点记为Cs,将种子节点记为vs,将辅助节点记为vn,则正样本可以表示为(vs,Cs),负样本可以表示为(vn,Cs),负样本即第二知识超图中不存在的超边。将得到的全连接图输入至预设的训练网络后,可以得到vs,Cs,vn的向量表征(Gθ(vs),(Gθ(Cs),(Gθ(vn),当第一交叉熵损失函数基于(Gθ(vs),(Gθ(Cs),(Gθ(vn)收敛时,得到对应的第一模型参数。
在一种实施方式中,预设的训练网络可以是CNN(Convolutional NeuralNetwork,卷积神经网络)、GAT(Graph Attention Network,图注意力网络)、GIN(GraphIsomorphism Network,图同构网络)中的任意一个,第一交叉熵损失函数可以为L=log[1-σ((Gθ(vs))TGθ(Cs))]+log[σ((Gθ(vn))TGθ(Cs))],其中,L为目标,σ为预设的系数,((Gθ(vs))T为(Gθ(vs)的转置矩阵,((Gθ(vn))T为(Gθ(vn)的转置矩阵。需要指出的是,对于训练网络和第一交叉熵损失函数的具体形式,均可以在实际应用中根据需要自行设定,对此本说明书中均不做具体限定。
进一步的,采用第二代理任务基于对应的预训练子集进行训练处理,可以包括:根据第二代理任务对应的预训练子集中的各超边,构建关联矩阵;关联矩阵的元素用于表征相应节点与相应超边的从属关系;根据预设方式,基于关联矩阵生成邻接矩阵;邻接矩阵的元素用于表征预训练子集中相应两个超边之间重叠节点的数量;对邻接矩阵进行聚类处理,得到预训练子集中每个超边的类别标签;基于带有类别标签的超边和预设的第二交叉熵损失函数,对第一模型参数所对应的待训练的预训练模型进行训练处理。
可以理解的是,第二代理任务是超边级别的代理任务;将第二代理任务对应的预训练子集中超边的总数量记为n,并将每一列对应一个超边,将第二代理任务对应的预训练子集中节点的总数量记为m,并将每一行对应一个节点,将关联矩阵记为M,则M是m*n维度,即m行n列,元素M(i,j)表征节点vi是否属于超边ej;可选的,当元素M(i,j)=0时,表征节点vi不属于超边ej,当元素M(i,j)=1时,表征节点vi属于超边ej,其中,1≤i≤m,1≤j≤n。将邻接矩阵记为A,则A=MjM,其中,Mj为M的转置矩阵,A是n*n维度,即每一行和每一列均对应一个超边,元素A(h,t)表征超边eh与超边et重叠的节点的数量,1≤h≤n,1≤t≤n。聚类处理的具体方式可以在实际应用中根据需要自行设定,对此本说明书中不做具体限定。
进一步的,预设的训练停止条件可以是训练次数到达预设次数,还可以是模型的收敛度到达预设收敛度等。
由此,通过第一代理任务和第二代理任务交替进行训练处理,并且在训练过程中是采用参数化方法学习模型,因此,能够快速的推导未知节点和超边的表征;再者,第一代理任务和第二代理任务的训练过程中,均关注了节点和超边,即均关注了局部和全局模式,因此,得到的预训练模型可以更好的为下游任务提供服务,扩充了知识超图的应用范围,提升了预训练模型的表征能力和适配能力。此外,第二代理任务的训练过程中,是基于输入数据进行聚类处理,得到类别标签,而不是预先进行类别标签的标注处理后输入类别标签,因此整个训练过程中没有外部输入的标签数据,不仅实现了预训练模型的有效训练,而且实现了知识超图在机器学习中的应用。
进一步的,考虑到在实际应用中,不同的事件要素在风险检测处理过程中的重要程度不同,例如事件要素账户通常比事件要素wifi更要程度要弱,基于此,为了更好的在后续进行风险检测处理,本说明书一个或多个实施例中,还可以根据预设的每个事件要素的权重,对邻接矩阵A进行优化处理。具体的,前述根据预设方式,基于关联矩阵生成邻接矩阵之后,还可以包括:
根据每个重叠节点对应的事件要素,确定每个重叠节点对应的权重;根据预设的计算方式,对邻接矩阵的每个元素所对应的各重叠节点的权重进行计算处理,得到计算结果;根据计算结果对邻接矩阵进行更新处理,得到新的邻接矩阵。具体的,根据每个重叠节点对应的事件要素,从预设的事件要素与权重的关联关系中获取关联的权重,并将获取的权重确定为相应重叠节点对应的权重。对邻接矩阵的每个元素所对应的各重叠节点的权重进行加和处理或计算平均值处理,得到计算结果信息,并将对应的元素的值更新为该计算结果,得到新的邻接矩阵。例如,邻接矩阵的某个元素的值为3,即相应的两个超边之间有3个重叠的节点,获取的该3个重叠的节点对应的权重分别为0.2、0.5、0.6,则进行加和处理得到0.2+0.5+0.6=1.3,则将该元素的值3更新为1.3。
与之对应的,前述对邻接矩阵进行聚类处理,得到预训练子集中每个超边的类别标签,包括:对新的邻接矩阵进行聚类处理,得到相应的预训练子集中每个超边的类别标签。
步骤S1004-6,基于测试集对待测试的预训练模型进行测试处理,若确定测试结果符合预设条件,则将待测试的预训练模型确定为最终的预训练模型。
进一步的,若测试结果不符合预设条件,则按照前述训练方式重新进行训练处理,直至得到最终的预训练模型。
由此,通过第一代理任务和第二代理任务交替基于第二知识超图进行训练处理,得到预训练模型,不仅实现了知识超图在机器学习中应用,而且实现了知识超图在风控领域等的应用。
进一步的,为了实现基于知识超图的风险检测,本说明书一个或多个实施例中,步骤S102之前还可以包括:
采用预训练模型生成目标知识超图中每个节点的第二特征数据和每个超边的第三特征数据;根据预设的训练方式,基于第二特征数据和第三特征数据进行训练处理,得到风险检测模型。
具体的,确定目标超图中每个节点的相关信息和每个超边的相关信息,将确定的各相关信息输入至预训练模型,得到每个节点的第二特征数据和每个超边的第三特征数据;根据预设的训练方式,基于第二特征数据和第三特征数据进行训练处理,得到风险检测模型。其中,目标知识超图可以是前述第二知识超图,也可以是基于不同的历史事件的事件信息所生成的知识超图。风险检测模型的训练方式可以参考现有的训练方式,对此本说明书中不做具体限定。
由此,通过训练风险检测模型,并将风险检测模型与预训练模型相结合进行风险检测处理,不仅实现了知识超图在风控领域的应用,而且实现了预训练模型与下游任务,即风险检测模型的适配,能够为风险检测模型提供有效的输入数据,从而实现风险检测的目的。
本说明书一个或多个实施例中,预先训练预训练模型和风险检测模,并在获取到多个目标事件的事件信息时,生成该多个目标事件的第一知识超图;基于第一知识超图,确定目标事件中待检测项目的检测信息,并采用预训练模型生成该检测信息的第一特征数据,采用风险检测模型基于第一特征数据进行风险检测处理。由此,通过训练预训练模型,解决了因标签稀疏而无法对知识超图进行较好表征学习的问题,实现了知识超图在机器学习以及在风控领域的有效应用。并且基于预训练模型生成的第一特征数据,可以供风险检测模型等下游任务使用,因此有利于提升知识超图的适用范围,使知识超图服务于更多的场景。
对应上述描述的风险检测处理方法,基于相同的技术构思,本说明书一个或多个实施例还提供了另一种风险检测处理方法,图8为本说明书一个或多个实施例提供的另一种风险检测处理方法的流程示意图,图8中的方法能够由区块链系统执行;如图8所示,该方法包括以下步骤:
步骤S202,根据获取的多个目标事件的事件信息,生成多个目标事件的第一知识超图;其中,事件信息包括相应目标事件的至少一个事件要素;第一知识超图的每个超边对应一个目标事件,超边中的每个节点对应至少一个目标事件的事件要素;
步骤S204,根据第一知识超图,确定目标事件中待检测项目的检测信息;
步骤S206,基于区块链系统中部署的智能合约和预先训练的预训练模型,生成检测信息的第一特征数据;其中,预训练模型预先通过两个代理任务基于多个历史事件的第二知识超图进行交替预训练所得;
步骤S208,基于智能合约和预先训练的风险检测模型,根据第一特征数据对待检测项目进行风险检测处理,得到风险检测结果信息;
步骤S210,将根据风险检测结果信息生成的风险检测记录保存至区块链系统中。
其中,步骤S202和步骤S204的实现过程可参见前述相关描述,重复之处这里不再赘述。进一步的,为了提升检测信息的确定速率,本说明书一个或多个实施例中,步骤S202和步骤S204还可以基于智能合约实现,即步骤S202可以包括基于区块链系统中的智能合约,根据获取的多个目标事件的事件信息,生成多个目标事件的第一知识超图;步骤S204可以包括基于该智能合约,根据第一知识超图,确定目标事件中待检测项目的检测信息。
需要指出的是,步骤S202和步骤S204中的智能合约,与步骤S206和步骤S208中的智能合约可以是相同的智能合约,也可以是不同的智能合约。步骤S206与步骤S208中的智能合约可以是相同的智能合约,也可以是不同的智能合约。当各智能合约均为不同的智能合约时,为了便于区分,可以将步骤S202和步骤S204中的智能合约称为第一智能合约,将步骤S206中的智能合约称为第二智能合约,将步骤S208中的智能合约称为第三智能合约。
进一步的,步骤S210可以包括:
确定风险检测结果信息的查询信息;根据查询信息和风险检测结果信息,生成风险检测记录;将风险检测记录保存至区块链系统中。其中,确定风险检测结果信息的查询信息可以包括:将事件信息包括的目标事件的标识信息确定为相应风险检测结果信息的查询信息;或者,按照预设的查询信息的分配方式,对风险检测结果信息分配查询信息。在将风险检测记录保存至区块链系统中之后,为了便于风险检测结果的查询,还可以将查询信息发送给目标事件对应的客户端或事件处理服务端;
与之对应的,方法还可以包括:
接收查询方发送的查询请求,根据查询请求中的查询信息从区块链系统中查询对应的风险检测记录信息;将查询到的风险检测记录信息中的风险检测结果信息发送给查询方。其中,查询方可以是前述客户端,也可以是前述事件处理服务端,还可以是用于对目标事件进行监管的第三方权威机构等。
本说明书一个或多个实施例中,预先训练预训练模型和风险检测模,并在获取到多个目标事件的事件信息时,生成该多个目标事件的第一知识超图;基于第一知识超图,确定目标事件中待检测项目的检测信息;以及基于智能合约和预训练模型生成该检测信息的第一特征数据,基于智能合约和风险检测模型基于第一特征数据进行风险检测处理。由此,通过训练预训练模型,解决了因标签稀疏而无法对知识超图进行较好表征学习的问题,实现了知识超图在机器学习以及在风控领域的有效应用。并且基于预训练模型生成的第一特征数据,可以供风险检测模型等下游任务使用,因此有利于提升知识超图的适用范围,使知识超图服务于更多的场景。再者,基于智能合约和预训练模型生成该检测信息的第一特征数据,以及基于智能合约和风险检测模型基于第一特征数据进行风险检测处理,能够基于智能合约的自动执行和人为无法干预等特性,确保风险检测处理的有效性。通过将检测风险检测记录保存至区块链系统中,能够基于区块链的无法篡改等特性,保障风险检测结果的真实性和有效性,从而为后续的查询等处理过程提供有效的数据依据。
对应上述图3至图7描述的风险检测处理方法,基于相同的技术构思,本说明书一个或多个实施例还提供一种风险检测处理装置。图9为本说明书一个或多个实施例提供的一种风险检测处理装置的模块组成示意图,如图9所示,该装置包括:
第一生成模块301,根据获取的多个目标事件的事件信息,生成所述多个目标事件的第一知识超图;其中,所述事件信息包括相应目标事件的至少一个事件要素;所述第一知识超图的每个超边对应一个所述目标事件,所述超边中的每个节点对应至少一个所述目标事件的所述事件要素;
确定模块302,根据所述第一知识超图,确定所述目标事件中待检测项目的检测信息;
第二生成模块303,采用预先训练的预训练模型生成所述检测信息的第一特征数据;其中,所述预训练模型通过两个代理任务基于多个历史事件的第二知识超图进行交替预训练所得;
检测模块304,采用预先训练的风险检测模型,基于所述第一特征数据对所述待检测项目进行风险检测处理,得到风险检测结果信息。
可选地,所述第一生成模块301,对所述事件信息包括的各事件要素进行去重处理,得到目标事件要素;以及,
将每个所述目标事件要素确定为一个节点,分别根据每个所述事件信息包括的事件要素,基于相应的节点生成相应目标事件所对应的超边,得到第一知识超图。
可选地,所述确定模块302,确定所述目标事件的待检测项目的类型信息;以及,
若所述类型信息表征所述待检测项目为所述目标事件,则将所述第一知识超图中与待检测的目标事件相对应的超边的相关信息确定为所述检测信息;
若所述类型信息表征所述待检测项目为所述事件要素,则根据所述第一知识超图,确定与待检测的事件要素相对应的第一节点具有关联关系的第二节点,将所述第一节点和所述第二节点的相关信息确定为所述检测信息。
可选地,所述装置还包括:第一训练模块;
所述第一训练模块,根据获取的多个历史事件的事件信息,生成所述多个历史事件的第二知识超图;以及,
交替采用第一代理任务和第二代理任务,基于所述第二知识超图进行所述预训练模型的训练处理,得到所述预训练模型;其中,所述第一代理任务的训练处理得到第一模型参数;所述第一代理任务在所述第二代理任务对所述第一模型参数对应的待训练的预训练模型进行训练处理得到第二模型参数之后,对所述第二模型参数对应的待训练的预训练模型进行训练处理。
可选地,所述装置还包括:第二训练模块;
所述第二训练模块,采用所述预训练模型生成目标知识超图中每个节点的第二特征数据和每个超边的第三特征数据;以及,
根据预设的训练方式,基于所述第二特征数据和所述第三特征数据进行训练处理,得到所述风险检测模型。
本说明书一个或多个实施例提供的风险检测处理装置,预先训练预训练模型和风险检测模,并在获取到多个目标事件的事件信息时,生成该多个目标事件的第一知识超图;基于第一知识超图,确定目标事件中待检测项目的检测信息,并采用预训练模型生成该检测信息的第一特征数据,采用风险检测模型基于第一特征数据进行风险检测处理。由此,通过训练预训练模型,解决了因标签稀疏而无法对知识超图进行较好表征学习的问题,实现了知识超图在机器学习以及在风控领域的有效应用。并且基于预训练模型生成的第一特征数据,可以供风险检测模型等下游任务使用,因此有利于提升知识超图的适用范围,使知识超图服务于更多的场景。
需要说明的是,本说明书中关于风险检测处理装置的实施例与本说明书中关于风险检测处理方法的实施例基于同一发明构思,因此该实施例的具体实施可以参见前述对应的风险检测处理方法的实施,重复之处不再赘述。
进一步的,对应上述图8描述的风险检测处理方法,基于相同的技术构思,本说明书一个或多个实施例还提供了另一种风险检测处理装置。图10为本说明书一个或多个实施例提供的另一种风险检测处理装置的模块组成示意图,如图10所示,该装置包括:
第一生成模块401,根据获取的多个目标事件的事件信息,生成所述多个目标事件的第一知识超图;其中,所述事件信息包括相应目标事件的至少一个事件要素;所述第一知识超图的每个超边对应一个所述目标事件,所述超边中的每个节点对应至少一个所述目标事件的所述事件要素;
确定模块402,根据所述第一知识超图,确定所述目标事件中待检测项目的检测信息;
第二生成模块403,基于区块链系统中部署的智能合约和预先训练的预训练模型,生成所述检测信息的第一特征数据;其中,所述预训练模型预先通过两个代理任务基于多个历史事件的第二知识超图进行交替预训练所得;
检测模块404,基于所述智能合约和预先训练的风险检测模型,基于所述第一特征数据对所述待检测项目进行风险检测处理,得到风险检测结果信息;
保存模块405,将根据所述风险检测结果信息生成的风险检测记录保存至所述区块链系统中。
可选地,所述装置还包括:查询模块;
所述保存模块405,确定所述风险检测结果信息的查询信息;根据所述查询信息和所述风险检测结果信息,生成风险检测记录;将所述风险检测记录保存至所述区块链系统中;
所述查询模块,接收查询方发送的查询请求,根据所述查询请求中的所述查询信息从所述区块链系统中查询对应的所述风险检测记录信息;以及,
将查询到的所述风险检测记录信息中的风险检测结果信息发送给所述查询方。
本说明书一个或多个实施例提供的风险检测处理装置,预先训练预训练模型和风险检测模,并在获取到多个目标事件的事件信息时,生成该多个目标事件的第一知识超图;基于第一知识超图,确定目标事件中待检测项目的检测信息;以及基于智能合约和预训练模型生成该检测信息的第一特征数据,基于智能合约和风险检测模型基于第一特征数据进行风险检测处理。由此,通过训练预训练模型,解决了因标签稀疏而无法对知识超图进行较好表征学习的问题,实现了知识超图在机器学习以及在风控领域的有效应用。并且基于预训练模型生成的第一特征数据,可以供风险检测模型等下游任务使用,因此有利于提升知识超图的适用范围,使知识超图服务于更多的场景。再者,基于智能合约和预训练模型生成该检测信息的第一特征数据,以及基于智能合约和风险检测模型基于第一特征数据进行风险检测处理,能够基于智能合约的自动执行和人为无法干预等特性,确保风险检测处理的有效性。通过将检测风险检测记录保存至区块链系统中,能够基于区块链的无法篡改等特性,保障风险检测结果的真实性和有效性,从而为后续的查询等处理过程提供有效的数据依据。
需要说明的是,本说明书中关于风险检测处理装置的实施例与本说明书中关于风险检测处理方法的实施例基于同一发明构思,因此该实施例的具体实施可以参见前述对应的风险检测处理方法的实施,重复之处不再赘述。
进一步地,对应上述描述的风险检测处理方法,基于相同的技术构思,本说明书一个或多个实施例还提供了一种风险检测处理设备,该设备用于执行上述的风险检测处理方法,图11为本说明书一个或多个实施例提供的一种风险检测处理设备的结构示意图。
如图11所示,风险检测处理设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器501和存储器502,存储器502中可以存储有一个或一个以上存储应用程序或数据。其中,存储器502可以是短暂存储或持久存储。存储在存储器502的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括风险检测处理设备中的一系列计算机可执行指令。更进一步地,处理器501可以设置为与存储器502通信,在风险检测处理设备上执行存储器502中的一系列计算机可执行指令。风险检测处理设备还可以包括一个或一个以上电源503,一个或一个以上有线或无线网络接口504,一个或一个以上输入输出接口505,一个或一个以上键盘506等。
在一个具体的实施例中,风险检测处理设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对风险检测处理设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
根据获取的多个目标事件的事件信息,生成所述多个目标事件的第一知识超图;其中,所述事件信息包括相应目标事件的至少一个事件要素;所述第一知识超图的每个超边对应一个所述目标事件,所述超边中的每个节点对应至少一个所述目标事件的所述事件要素;
根据所述第一知识超图,确定所述目标事件中待检测项目的检测信息;
采用预先训练的预训练模型生成所述检测信息的第一特征数据;其中,所述预训练模型通过两个代理任务基于多个历史事件的第二知识超图进行交替预训练所得;
采用预先训练的风险检测模型,基于所述第一特征数据对所述待检测项目进行风险检测处理,得到风险检测结果信息。
可选地,计算机可执行指令在被执行时,所述根据获取的多个目标事件的事件信息,生成所述多个目标事件的第一知识超图,包括:
对所述事件信息包括的各事件要素进行去重处理,得到目标事件要素;
将每个所述目标事件要素确定为一个节点,分别根据每个所述事件信息包括的事件要素,基于相应的节点生成相应目标事件所对应的超边,得到第一知识超图。
可选地,计算机可执行指令在被执行时,所述根据所述第一知识超图,确定所述目标事件中待检测项目的检测信息,包括:
确定所述目标事件的待检测项目的类型信息;
若所述类型信息表征所述待检测项目为所述目标事件,则将所述第一知识超图中与待检测的目标事件相对应的超边的相关信息确定为所述检测信息;
若所述类型信息表征所述待检测项目为所述事件要素,则根据所述第一知识超图,确定与待检测的事件要素相对应的第一节点具有关联关系的第二节点,将所述第一节点和所述第二节点的相关信息确定为所述检测信息。
可选地,计算机可执行指令在被执行时,所述根据获取的多个目标事件的事件信息,生成所述多个目标事件的第一知识超图之前,还包括:
根据获取的多个历史事件的事件信息,生成所述多个历史事件的第二知识超图;
交替采用第一代理任务和第二代理任务,基于所述第二知识超图进行所述预训练模型的训练处理,得到所述预训练模型;其中,所述第一代理任务的训练处理得到第一模型参数;所述第一代理任务在所述第二代理任务对所述第一模型参数对应的待训练的预训练模型进行训练处理得到第二模型参数之后,对所述第二模型参数对应的待训练的预训练模型进行训练处理。
可选地,计算机可执行指令在被执行时,所述根据获取的多个目标事件的事件信息,生成所述多个目标事件的第一知识超图之前,还包括:
采用所述预训练模型生成目标知识超图中每个节点的第二特征数据和每个超边的第三特征数据;
根据预设的训练方式,基于所述第二特征数据和所述第三特征数据进行训练处理,得到所述风险检测模型。
本说明书一个或多个实施例提供的风险检测处理设备,预先训练预训练模型和风险检测模,并在获取到多个目标事件的事件信息时,生成该多个目标事件的第一知识超图;基于第一知识超图,确定目标事件中待检测项目的检测信息,并采用预训练模型生成该检测信息的第一特征数据,采用风险检测模型基于第一特征数据进行风险检测处理。由此,通过训练预训练模型,解决了因标签稀疏而无法对知识超图进行较好表征学习的问题,实现了知识超图在机器学习以及在风控领域的有效应用。并且基于预训练模型生成的第一特征数据,可以供风险检测模型等下游任务使用,因此有利于提升知识超图的适用范围,使知识超图服务于更多的场景。
在另一个具体的实施例中,风险检测处理设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对风险检测处理设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
根据获取的多个目标事件的事件信息,生成所述多个目标事件的第一知识超图;其中,所述事件信息包括相应目标事件的至少一个事件要素;所述第一知识超图的每个超边对应一个所述目标事件,所述超边中的每个节点对应至少一个所述目标事件的所述事件要素;
根据所述第一知识超图,确定所述目标事件中待检测项目的检测信息;
基于区块链系统中部署的智能合约和预先训练的预训练模型,生成所述检测信息的第一特征数据;其中,所述预训练模型预先通过两个代理任务基于多个历史事件的第二知识超图进行交替预训练所得;
基于所述智能合约和预先训练的风险检测模型,基于所述第一特征数据对所述待检测项目进行风险检测处理,得到风险检测结果信息;
将根据所述风险检测结果信息生成的风险检测记录保存至所述区块链系统中。
可选地,计算机可执行指令在被执行时,所述将根据所述风险检测结果信息生成的风险检测记录保存至所述区块链系统中,包括:
确定所述风险检测结果信息的查询信息;
根据所述查询信息和所述风险检测结果信息,生成风险检测记录;
将所述风险检测记录保存至所述区块链系统中;
所述方法还包括:
接收查询方发送的查询请求,根据所述查询请求中的所述查询信息从所述区块链系统中查询对应的所述风险检测记录信息;
将查询到的所述风险检测记录信息中的风险检测结果信息发送给所述查询方。
本说明书一个或多个实施例提供的风险检测处理设备,预先训练预训练模型和风险检测模,并在获取到多个目标事件的事件信息时,生成该多个目标事件的第一知识超图;基于第一知识超图,确定目标事件中待检测项目的检测信息;以及基于智能合约和预训练模型生成该检测信息的第一特征数据,基于智能合约和风险检测模型基于第一特征数据进行风险检测处理。由此,通过训练预训练模型,解决了因标签稀疏而无法对知识超图进行较好表征学习的问题,实现了知识超图在机器学习以及在风控领域的有效应用。并且基于预训练模型生成的第一特征数据,可以供风险检测模型等下游任务使用,因此有利于提升知识超图的适用范围,使知识超图服务于更多的场景。再者,基于智能合约和预训练模型生成该检测信息的第一特征数据,以及基于智能合约和风险检测模型基于第一特征数据进行风险检测处理,能够基于智能合约的自动执行和人为无法干预等特性,确保风险检测处理的有效性。通过将检测风险检测记录保存至区块链系统中,能够基于区块链的无法篡改等特性,保障风险检测结果的真实性和有效性,从而为后续的查询等处理过程提供有效的数据依据。
需要说明的是,本说明书中关于风险检测处理设备的实施例与本说明书中关于风险检测处理方法的实施例基于同一发明构思,因此该实施例的具体实施可以参见前述对应的风险检测处理方法的实施,重复之处不再赘述。
进一步地,对应上述描述的风险检测处理方法,基于相同的技术构思,本说明书一个或多个实施例还提供了一种存储介质,用于存储计算机可执行指令,一个具体的实施例中,该存储介质可以为U盘、光盘、硬盘等,该存储介质存储的计算机可执行指令在被处理器执行时,能实现以下流程:
根据获取的多个目标事件的事件信息,生成所述多个目标事件的第一知识超图;其中,所述事件信息包括相应目标事件的至少一个事件要素;所述第一知识超图的每个超边对应一个所述目标事件,所述超边中的每个节点对应至少一个所述目标事件的所述事件要素;
根据所述第一知识超图,确定所述目标事件中待检测项目的检测信息;
采用预先训练的预训练模型生成所述检测信息的第一特征数据;其中,所述预训练模型通过两个代理任务基于多个历史事件的第二知识超图进行交替预训练所得;
采用预先训练的风险检测模型,基于所述第一特征数据对所述待检测项目进行风险检测处理,得到风险检测结果信息。
可选地,该存储介质存储的计算机可执行指令在被处理器执行时,所述根据获取的多个目标事件的事件信息,生成所述多个目标事件的第一知识超图,包括:
对所述事件信息包括的各事件要素进行去重处理,得到目标事件要素;
将每个所述目标事件要素确定为一个节点,分别根据每个所述事件信息包括的事件要素,基于相应的节点生成相应目标事件所对应的超边,得到第一知识超图。
可选地,该存储介质存储的计算机可执行指令在被处理器执行时,所述根据所述第一知识超图,确定所述目标事件中待检测项目的检测信息,包括:
确定所述目标事件的待检测项目的类型信息;
若所述类型信息表征所述待检测项目为所述目标事件,则将所述第一知识超图中与待检测的目标事件相对应的超边的相关信息确定为所述检测信息;
若所述类型信息表征所述待检测项目为所述事件要素,则根据所述第一知识超图,确定与待检测的事件要素相对应的第一节点具有关联关系的第二节点,将所述第一节点和所述第二节点的相关信息确定为所述检测信息。
可选地,该存储介质存储的计算机可执行指令在被处理器执行时,所述根据获取的多个目标事件的事件信息,生成所述多个目标事件的第一知识超图之前,还包括:
根据获取的多个历史事件的事件信息,生成所述多个历史事件的第二知识超图;
交替采用第一代理任务和第二代理任务,基于所述第二知识超图进行所述预训练模型的训练处理,得到所述预训练模型;其中,所述第一代理任务的训练处理得到第一模型参数;所述第一代理任务在所述第二代理任务对所述第一模型参数对应的待训练的预训练模型进行训练处理得到第二模型参数之后,对所述第二模型参数对应的待训练的预训练模型进行训练处理。
可选地,该存储介质存储的计算机可执行指令在被处理器执行时,所述根据获取的多个目标事件的事件信息,生成所述多个目标事件的第一知识超图之前,还包括:
采用所述预训练模型生成目标知识超图中每个节点的第二特征数据和每个超边的第三特征数据;
根据预设的训练方式,基于所述第二特征数据和所述第三特征数据进行训练处理,得到所述风险检测模型。
本说明书一个或多个实施例提供的存储介质存储的计算机可执行指令在被处理器执行时,预先训练预训练模型和风险检测模,并在获取到多个目标事件的事件信息时,生成该多个目标事件的第一知识超图;基于第一知识超图,确定目标事件中待检测项目的检测信息,并采用预训练模型生成该检测信息的第一特征数据,采用风险检测模型基于第一特征数据进行风险检测处理。由此,通过训练预训练模型,解决了因标签稀疏而无法对知识超图进行较好表征学习的问题,实现了知识超图在机器学习以及在风控领域的有效应用。并且基于预训练模型生成的第一特征数据,可以供风险检测模型等下游任务使用,因此有利于提升知识超图的适用范围,使知识超图服务于更多的场景。
在一个具体的实施例中,该存储介质可以为U盘、光盘、硬盘等,该存储介质存储的计算机可执行指令在被处理器执行时,能实现以下流程:
根据获取的多个目标事件的事件信息,生成所述多个目标事件的第一知识超图;其中,所述事件信息包括相应目标事件的至少一个事件要素;所述第一知识超图的每个超边对应一个所述目标事件,所述超边中的每个节点对应至少一个所述目标事件的所述事件要素;
根据所述第一知识超图,确定所述目标事件中待检测项目的检测信息;
基于区块链系统中部署的智能合约和预先训练的预训练模型,生成所述检测信息的第一特征数据;其中,所述预训练模型预先通过两个代理任务基于多个历史事件的第二知识超图进行交替预训练所得;
基于所述智能合约和预先训练的风险检测模型,基于所述第一特征数据对所述待检测项目进行风险检测处理,得到风险检测结果信息;
将根据所述风险检测结果信息生成的风险检测记录保存至所述区块链系统中。
可选地,该存储介质存储的计算机可执行指令在被处理器执行时,所述将根据所述风险检测结果信息生成的风险检测记录保存至所述区块链系统中,包括:
确定所述风险检测结果信息的查询信息;
根据所述查询信息和所述风险检测结果信息,生成风险检测记录;
将所述风险检测记录保存至所述区块链系统中;
所述方法还包括:
接收查询方发送的查询请求,根据所述查询请求中的所述查询信息从所述区块链系统中查询对应的所述风险检测记录信息;
将查询到的所述风险检测记录信息中的风险检测结果信息发送给所述查询方。
本说明书一个或多个实施例提供的存储介质存储的计算机可执行指令在被处理器执行时,预先训练预训练模型和风险检测模,并在获取到多个目标事件的事件信息时,生成该多个目标事件的第一知识超图;基于第一知识超图,确定目标事件中待检测项目的检测信息;以及基于智能合约和预训练模型生成该检测信息的第一特征数据,基于智能合约和风险检测模型基于第一特征数据进行风险检测处理。由此,通过训练预训练模型,解决了因标签稀疏而无法对知识超图进行较好表征学习的问题,实现了知识超图在机器学习以及在风控领域的有效应用。并且基于预训练模型生成的第一特征数据,可以供风险检测模型等下游任务使用,因此有利于提升知识超图的适用范围,使知识超图服务于更多的场景。再者,基于智能合约和预训练模型生成该检测信息的第一特征数据,以及基于智能合约和风险检测模型基于第一特征数据进行风险检测处理,能够基于智能合约的自动执行和人为无法干预等特性,确保风险检测处理的有效性。通过将检测风险检测记录保存至区块链系统中,能够基于区块链的无法篡改等特性,保障风险检测结果的真实性和有效性,从而为后续的查询等处理过程提供有效的数据依据。
需要说明的是,本说明书中关于存储介质的实施例与本说明书中关于风险检测处理方法的实施例基于同一发明构思,因此该实施例的具体实施可以参见前述对应的风险检测处理方法的实施,重复之处不再赘述。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书一个或多个实施例可提供为方法、系统或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书的一个或多个实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本文件的实施例而已,并不用于限制本文件。对于本领域技术人员来说,本文件可以有各种更改和变化。凡在本文件的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本文件的权利要求范围之内。
Claims (18)
1.一种风险检测处理方法,包括:
根据获取的多个目标事件的事件信息,生成所述多个目标事件的第一知识超图;其中,所述事件信息包括相应目标事件的至少一个事件要素;所述第一知识超图的每个超边对应一个所述目标事件,所述超边中的每个节点对应至少一个所述目标事件的所述事件要素;
根据所述第一知识超图,确定所述目标事件中待检测项目的检测信息;
采用预先训练的预训练模型生成所述检测信息的第一特征数据;其中,所述预训练模型通过两个代理任务基于多个历史事件的第二知识超图进行交替预训练所得;
采用预先训练的风险检测模型,基于所述第一特征数据对所述待检测项目进行风险检测处理,得到风险检测结果信息。
2.根据权利要求1所述的方法,所述根据获取的多个目标事件的事件信息,生成所述多个目标事件的第一知识超图,包括:
对所述事件信息包括的各事件要素进行去重处理,得到目标事件要素;
将每个所述目标事件要素确定为一个节点,分别根据每个所述事件信息包括的事件要素,基于相应的节点生成相应目标事件所对应的超边,得到第一知识超图。
3.根据权利要求1所述的方法,所述根据所述第一知识超图,确定所述目标事件中待检测项目的检测信息,包括:
确定所述目标事件的待检测项目的类型信息;
若所述类型信息表征所述待检测项目为所述目标事件,则将所述第一知识超图中与待检测的目标事件相对应的超边的相关信息确定为所述检测信息;
若所述类型信息表征所述待检测项目为所述事件要素,则根据所述第一知识超图,确定与待检测的事件要素相对应的第一节点具有关联关系的第二节点,将所述第一节点和所述第二节点的相关信息确定为所述检测信息。
4.根据权利要求1所述的方法,所述根据获取的多个目标事件的事件信息,生成所述多个目标事件的第一知识超图之前,还包括:
根据获取的多个历史事件的事件信息,生成所述多个历史事件的第二知识超图;
交替采用第一代理任务和第二代理任务,基于所述第二知识超图进行所述预训练模型的训练处理,得到所述预训练模型;其中,所述第一代理任务的训练处理得到第一模型参数;所述第一代理任务在所述第二代理任务对所述第一模型参数对应的待训练的预训练模型进行训练处理得到第二模型参数之后,对所述第二模型参数对应的待训练的预训练模型进行训练处理。
5.根据权利要求4所述的方法,所述交替采用第一代理任务和第二代理任务,基于所述第二知识超图进行所述预训练模型的训练处理,得到所述预训练模型,包括:
根据所述第二知识超图,构建预训练集和测试集;
交替采用所述第一代理任务和所述第二代理任务基于所述预训练集进行训练处理,并在满足预设的训练停止条件时,得到待测试的预训练模型;
基于所述测试集对所述待测试的预训练模型进行测试处理,若确定测试结果符合预设条件,则将所述待测试的预训练模型确定为最终的预训练模型。
6.根据权利要求5所述的方法,所述根据所述第二知识超图,构建预训练集和测试集,包括:
将所述第二知识超图中的每个超边确定为一个样本,得到样本集合;
根据预设的第一划分规则,将所述样本集合划分为预训练集和测试集;
根据预设的第二划分规则,将所述预训练集划分为多个预训练子集;
所述交替采用所述第一代理任务和第二代理任务基于所述预训练集进行训练处理,包括:
交替采用所述第一代理任务和第二代理任务基于对应的所述预训练子集进行训练处理。
7.根据权利要求6所述的方法,采用所述第一代理任务基于对应的所述预训练子集进行训练处理,包括:
针对所述第一代理任务对应的预训练子集中的每个超边,随机从所述超边的节点中选择一个种子节点,并将所述超边的节点中除所述种子节点外的节点确定为所述种子节点的上下文节点;
根据所述种子节点和所述上下文节点,构建正样本;
从所述第一代理任务对应的预训练子集所包括的节点中,获取与所述种子节点对应的要素类型相同、且与所述种子节点不在同一个超边的辅助节点;
根据每个所述辅助节点和所述上下文节点,构建负样本;
对各所述正样本与各所述负样本中的节点进行两两相连,得到全连接图;
基于所述全连接图和预设的第一交叉熵损失函数进行训练处理。
8.根据权利要求6所述的方法,采用所述第二代理任务基于对应的所述预训练子集进行训练处理,包括:
根据所述第二代理任务对应的预训练子集中的各超边,构建关联矩阵;所述关联矩阵的元素用于表征相应节点与相应超边的从属关系;
根据预设方式,基于所述关联矩阵生成邻接矩阵;所述邻接矩阵的元素用于表征所述预训练子集中相应两个超边之间重叠节点的数量;
对所述邻接矩阵进行聚类处理,得到所述预训练子集中每个超边的类别标签;
基于带有所述类别标签的所述超边和预设的第二交叉熵损失函数,对所述第一模型参数所对应的待训练的预训练模型进行训练处理。
9.根据权利要求8所述的方法,所述根据预设方式,基于所述关联矩阵生成邻接矩阵之后,还包括:
根据每个所述重叠节点对应的事件要素,确定每个所述重叠节点对应的权重;
根据预设的计算方式,对所述邻接矩阵的每个元素所对应的各所述重叠节点的所述权重进行计算处理,得到计算结果;
根据所述计算结果对所述邻接矩阵进行更新处理,得到新的邻接矩阵;
所述对所述邻接矩阵进行聚类处理,得到所述预训练子集中每个超边的类别标签,包括:
对所述新的邻接矩阵进行聚类处理,得到所述预训练子集中每个超边的类别标签。
10.根据权利要求1所述的方法,所述根据获取的多个目标事件的事件信息,生成所述多个目标事件的第一知识超图之前,还包括:
采用所述预训练模型生成目标知识超图中每个节点的第二特征数据和每个超边的第三特征数据;
根据预设的训练方式,基于所述第二特征数据和所述第三特征数据进行训练处理,得到所述风险检测模型。
11.一种风险检测处理方法,包括:
根据获取的多个目标事件的事件信息,生成所述多个目标事件的第一知识超图;其中,所述事件信息包括相应目标事件的至少一个事件要素;所述第一知识超图的每个超边对应一个所述目标事件,所述超边中的每个节点对应至少一个所述目标事件的所述事件要素;
根据所述第一知识超图,确定所述目标事件中待检测项目的检测信息;
基于区块链系统中部署的智能合约和预先训练的预训练模型,生成所述检测信息的第一特征数据;其中,所述预训练模型预先通过两个代理任务基于多个历史事件的第二知识超图进行交替预训练所得;
基于所述智能合约和预先训练的风险检测模型,根据所述第一特征数据对所述待检测项目进行风险检测处理,得到风险检测结果信息;
将根据所述风险检测结果信息生成的风险检测记录保存至所述区块链系统中。
12.根据权利要求11所述的方法,所述将根据所述风险检测结果信息生成的风险检测记录保存至所述区块链系统中,包括:
确定所述风险检测结果信息的查询信息;
根据所述查询信息和所述风险检测结果信息,生成风险检测记录;
将所述风险检测记录保存至所述区块链系统中;
所述方法还包括:
接收查询方发送的查询请求,根据所述查询请求中的所述查询信息从所述区块链系统中查询对应的所述风险检测记录信息;
将查询到的所述风险检测记录信息中的风险检测结果信息发送给所述查询方。
13.一种风险检测处理装置,包括:
第一生成模块,根据获取的多个目标事件的事件信息,生成所述多个目标事件的第一知识超图;其中,所述事件信息包括相应目标事件的至少一个事件要素;所述第一知识超图的每个超边对应一个所述目标事件,所述超边中的每个节点对应至少一个所述目标事件的所述事件要素;
确定模块,根据所述第一知识超图,确定所述目标事件中待检测项目的检测信息;
第二生成模块,采用预先训练的预训练模型生成所述检测信息的第一特征数据;其中,所述预训练模型通过两个代理任务基于多个历史事件的第二知识超图进行交替预训练所得;
检测模块,采用预先训练的风险检测模型,基于所述第一特征数据对所述待检测项目进行风险检测处理,得到风险检测结果信息。
14.一种风险检测处理装置,包括:
第一生成模块,根据获取的多个目标事件的事件信息,生成所述多个目标事件的第一知识超图;其中,所述事件信息包括相应目标事件的至少一个事件要素;所述第一知识超图的每个超边对应一个所述目标事件,所述超边中的每个节点对应至少一个所述目标事件的所述事件要素;
确定模块,根据所述第一知识超图,确定所述目标事件中待检测项目的检测信息;
第二生成模块,基于区块链系统中部署的智能合约和预先训练的预训练模型,生成所述检测信息的第一特征数据;其中,所述预训练模型预先通过两个代理任务基于多个历史事件的第二知识超图进行交替预训练所得;
检测模块,基于所述智能合约和预先训练的风险检测模型,根据所述第一特征数据对所述待检测项目进行风险检测处理,得到风险检测结果信息;
保存模块,将根据所述风险检测结果信息生成的风险检测记录保存至所述区块链系统中。
15.一种风险检测处理设备,包括:
处理器;以及,
被安排成存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器:
根据获取的多个目标事件的事件信息,生成所述多个目标事件的第一知识超图;其中,所述事件信息包括相应目标事件的至少一个事件要素;所述第一知识超图的每个超边对应一个所述目标事件,所述超边中的每个节点对应至少一个所述目标事件的所述事件要素;
根据所述第一知识超图,确定所述目标事件中待检测项目的检测信息;
采用预先训练的预训练模型生成所述检测信息的第一特征数据;其中,所述预训练模型通过两个代理任务基于多个历史事件的第二知识超图进行交替预训练所得;
采用预先训练的风险检测模型,基于所述第一特征数据对所述待检测项目进行风险检测处理,得到风险检测结果信息。
16.一种风险检测处理设备,包括:
处理器;以及,
被安排成存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器:
根据获取的多个目标事件的事件信息,生成所述多个目标事件的第一知识超图;其中,所述事件信息包括相应目标事件的至少一个事件要素;所述第一知识超图的每个超边对应一个所述目标事件,所述超边中的每个节点对应至少一个所述目标事件的所述事件要素;
根据所述第一知识超图,确定所述目标事件中待检测项目的检测信息;
基于区块链系统中部署的智能合约和预先训练的预训练模型,生成所述检测信息的第一特征数据;其中,所述预训练模型预先通过两个代理任务基于多个历史事件的第二知识超图进行交替预训练所得;
基于所述智能合约和预先训练的风险检测模型,根据所述第一特征数据对所述待检测项目进行风险检测处理,得到风险检测结果信息;
将根据所述风险检测结果信息生成的风险检测记录保存至所述区块链系统中。
17.一种存储介质,用于存储计算机可执行指令,所述计算机可执行指令在被处理器执行时实现以下流程:
根据获取的多个目标事件的事件信息,生成所述多个目标事件的第一知识超图;其中,所述事件信息包括相应目标事件的至少一个事件要素;所述第一知识超图的每个超边对应一个所述目标事件,所述超边中的每个节点对应至少一个所述目标事件的所述事件要素;
根据所述第一知识超图,确定所述目标事件中待检测项目的检测信息;
采用预先训练的预训练模型生成所述检测信息的第一特征数据;其中,所述预训练模型通过两个代理任务基于多个历史事件的第二知识超图进行交替预训练所得;
采用预先训练的风险检测模型,基于所述第一特征数据对所述待检测项目进行风险检测处理,得到风险检测结果信息。
18.一种存储介质,用于存储计算机可执行指令,所述计算机可执行指令在被处理器执行时实现以下流程:
根据获取的多个目标事件的事件信息,生成所述多个目标事件的第一知识超图;其中,所述事件信息包括相应目标事件的至少一个事件要素;所述第一知识超图的每个超边对应一个所述目标事件,所述超边中的每个节点对应至少一个所述目标事件的所述事件要素;
根据所述第一知识超图,确定所述目标事件中待检测项目的检测信息;
基于区块链系统中部署的智能合约和预先训练的预训练模型,生成所述检测信息的第一特征数据;其中,所述预训练模型预先通过两个代理任务基于多个历史事件的第二知识超图进行交替预训练所得;
基于所述智能合约和预先训练的风险检测模型,根据所述第一特征数据对所述待检测项目进行风险检测处理,得到风险检测结果信息;
将根据所述风险检测结果信息生成的风险检测记录保存至所述区块链系统中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111150419.1A CN113837635B (zh) | 2021-09-29 | 2021-09-29 | 风险检测处理方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111150419.1A CN113837635B (zh) | 2021-09-29 | 2021-09-29 | 风险检测处理方法、装置及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113837635A true CN113837635A (zh) | 2021-12-24 |
CN113837635B CN113837635B (zh) | 2024-06-14 |
Family
ID=78967656
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111150419.1A Active CN113837635B (zh) | 2021-09-29 | 2021-09-29 | 风险检测处理方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113837635B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114327583A (zh) * | 2021-12-27 | 2022-04-12 | 星环众志信息科技(南京)有限公司 | 一种超图构建方法、装置、设备及存储介质 |
CN115033712A (zh) * | 2022-06-30 | 2022-09-09 | 支付宝(杭州)信息技术有限公司 | 一种用于数据确权的标记方法、探查方法及其系统 |
CN116070916A (zh) * | 2023-03-06 | 2023-05-05 | 支付宝(杭州)信息技术有限公司 | 数据处理方法、装置及设备 |
CN117808597A (zh) * | 2024-02-26 | 2024-04-02 | 支付宝(杭州)信息技术有限公司 | 一种生成风险规则的方法及装置 |
CN117973784A (zh) * | 2024-02-01 | 2024-05-03 | 江苏省水利科学研究院 | 一种基于任务协同的水利检测数据管理系统及方法 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109657837A (zh) * | 2018-11-19 | 2019-04-19 | 平安科技(深圳)有限公司 | 违约概率预测方法、装置、计算机设备和存储介质 |
WO2019184119A1 (zh) * | 2018-03-26 | 2019-10-03 | 平安科技(深圳)有限公司 | 风险模型训练方法、风险识别方法、装置、设备及介质 |
CN111062928A (zh) * | 2019-12-19 | 2020-04-24 | 安徽威奥曼机器人有限公司 | 一种医学ct图像中病变的识别方法 |
CN111125358A (zh) * | 2019-12-17 | 2020-05-08 | 北京工商大学 | 一种基于超图的文本分类方法 |
US20200160418A1 (en) * | 2018-11-19 | 2020-05-21 | International Business Machines Corporation | Hypergraph structure and truncation method that reduces computer processor execution time in predicting product returns based on large scale data |
CN111738628A (zh) * | 2020-08-14 | 2020-10-02 | 支付宝(杭州)信息技术有限公司 | 一种风险群组识别方法及装置 |
CN112070277A (zh) * | 2020-08-17 | 2020-12-11 | 杭州电子科技大学 | 基于超图神经网络的药物-标靶相互作用预测方法 |
US20210090182A1 (en) * | 2019-09-23 | 2021-03-25 | International Business Machines Corporation | Tensor-based predictions from analysis of time-varying graphs |
CN112598489A (zh) * | 2020-12-14 | 2021-04-02 | 深圳市快付通金融网络科技服务有限公司 | 基于金融应用的风险监测方法及系统 |
CN113066526A (zh) * | 2021-04-08 | 2021-07-02 | 北京大学 | 一种基于超图的药物-靶标-疾病相互作用预测方法 |
CN113420190A (zh) * | 2021-08-23 | 2021-09-21 | 连连(杭州)信息技术有限公司 | 一种商户风险识别方法、装置、设备及存储介质 |
-
2021
- 2021-09-29 CN CN202111150419.1A patent/CN113837635B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019184119A1 (zh) * | 2018-03-26 | 2019-10-03 | 平安科技(深圳)有限公司 | 风险模型训练方法、风险识别方法、装置、设备及介质 |
CN109657837A (zh) * | 2018-11-19 | 2019-04-19 | 平安科技(深圳)有限公司 | 违约概率预测方法、装置、计算机设备和存储介质 |
US20200160418A1 (en) * | 2018-11-19 | 2020-05-21 | International Business Machines Corporation | Hypergraph structure and truncation method that reduces computer processor execution time in predicting product returns based on large scale data |
US20210090182A1 (en) * | 2019-09-23 | 2021-03-25 | International Business Machines Corporation | Tensor-based predictions from analysis of time-varying graphs |
CN111125358A (zh) * | 2019-12-17 | 2020-05-08 | 北京工商大学 | 一种基于超图的文本分类方法 |
CN111062928A (zh) * | 2019-12-19 | 2020-04-24 | 安徽威奥曼机器人有限公司 | 一种医学ct图像中病变的识别方法 |
CN111738628A (zh) * | 2020-08-14 | 2020-10-02 | 支付宝(杭州)信息技术有限公司 | 一种风险群组识别方法及装置 |
CN112070277A (zh) * | 2020-08-17 | 2020-12-11 | 杭州电子科技大学 | 基于超图神经网络的药物-标靶相互作用预测方法 |
CN112598489A (zh) * | 2020-12-14 | 2021-04-02 | 深圳市快付通金融网络科技服务有限公司 | 基于金融应用的风险监测方法及系统 |
CN113066526A (zh) * | 2021-04-08 | 2021-07-02 | 北京大学 | 一种基于超图的药物-靶标-疾病相互作用预测方法 |
CN113420190A (zh) * | 2021-08-23 | 2021-09-21 | 连连(杭州)信息技术有限公司 | 一种商户风险识别方法、装置、设备及存储介质 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114327583A (zh) * | 2021-12-27 | 2022-04-12 | 星环众志信息科技(南京)有限公司 | 一种超图构建方法、装置、设备及存储介质 |
CN115033712A (zh) * | 2022-06-30 | 2022-09-09 | 支付宝(杭州)信息技术有限公司 | 一种用于数据确权的标记方法、探查方法及其系统 |
CN116070916A (zh) * | 2023-03-06 | 2023-05-05 | 支付宝(杭州)信息技术有限公司 | 数据处理方法、装置及设备 |
CN116070916B (zh) * | 2023-03-06 | 2023-06-16 | 支付宝(杭州)信息技术有限公司 | 数据处理方法、装置及设备 |
CN117973784A (zh) * | 2024-02-01 | 2024-05-03 | 江苏省水利科学研究院 | 一种基于任务协同的水利检测数据管理系统及方法 |
CN117808597A (zh) * | 2024-02-26 | 2024-04-02 | 支付宝(杭州)信息技术有限公司 | 一种生成风险规则的方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113837635B (zh) | 2024-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113837635A (zh) | 风险检测处理方法、装置及设备 | |
CN111080304B (zh) | 一种可信关系识别方法、装置及设备 | |
CN109948641B (zh) | 异常群体识别方法及装置 | |
WO2019114344A1 (zh) | 一种基于图结构模型的异常账号防控方法、装置以及设备 | |
CN109816032B (zh) | 基于生成式对抗网络的无偏映射零样本分类方法和装置 | |
CN108399564B (zh) | 信用评分方法及装置 | |
CN107358247B (zh) | 一种确定流失用户的方法及装置 | |
CN105446988B (zh) | 预测类别的方法和装置 | |
CN110335115A (zh) | 一种业务订单处理方法及装置 | |
CN110674188A (zh) | 一种特征提取方法、装置及设备 | |
CN110020427B (zh) | 策略确定方法和装置 | |
US20170262773A1 (en) | Method and system for generating a training model for fabricating synthetic data and for fabricating synthetic data | |
US20190095400A1 (en) | Analytic system to incrementally update a support vector data description for outlier identification | |
CN109003091A (zh) | 一种风险防控处理方法、装置及设备 | |
US20220122000A1 (en) | Ensemble machine learning model | |
CN111143578A (zh) | 基于神经网络抽取事件关系的方法、装置和处理器 | |
CN111369258A (zh) | 实体对象类型的预测方法、装置及设备 | |
CN110309313B (zh) | 生成事件转移图谱的方法及装置 | |
CN111159397B (zh) | 文本分类方法和装置、服务器 | |
JP2022111020A (ja) | 文書類似度学習に基づくディープラーニングモデルの転移学習方法およびコンピュータ装置 | |
Almuammar et al. | Learning patterns from imbalanced evolving data streams | |
He et al. | Parallel decision tree with application to water quality data analysis | |
CN113220801B (zh) | 一种结构化数据分类方法、装置、设备及介质 | |
CN114723269A (zh) | 一种事件的风险防控方法、装置及设备 | |
CN116701587A (zh) | 基于机器学习的问答方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |