CN112598311A - 一种风险操作识别模型构建方法、风险操作识别方法 - Google Patents
一种风险操作识别模型构建方法、风险操作识别方法 Download PDFInfo
- Publication number
- CN112598311A CN112598311A CN202011598680.3A CN202011598680A CN112598311A CN 112598311 A CN112598311 A CN 112598311A CN 202011598680 A CN202011598680 A CN 202011598680A CN 112598311 A CN112598311 A CN 112598311A
- Authority
- CN
- China
- Prior art keywords
- training data
- risk operation
- ith
- encrypted
- operation identification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/067—Enterprise or organisation modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Educational Administration (AREA)
- Finance (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Accounting & Taxation (AREA)
- Computer Hardware Design (AREA)
- Technology Law (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computer Security & Cryptography (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Bioethics (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本申请公开了一种风险操作预测模型构建方法、风险操作预测方法,该风险操作预测模型构建方法包括:在获取到N个金融机构提供的N个加密训练数据集之后,根据该N个加密训练数据集构建风险操作识别模型。其中,因N个加密训练数据集来自于N个金融机构,使得该N个加密训练数据集中存在充足风险操作对应的训练数据,从而使得基于该N个加密训练数据集构建的风险操作识别模型的识别性能更好,如此有利于提高风险操作识别准确性。
Description
技术领域
本申请涉及数据处理技术领域,尤其涉及一种风险操作预测模型构建方法、风险操作预测方法。
背景技术
随着人工智能技术的发展,可以利用人工智能技术从用户交易数据中识别该用户是否存在风险操作(例如,违约、洗钱、欺诈等)。
然而,对于任一金融机构来说,因存在风险操作的用户的数据量很小,使得风险操作对应的训练数据很少,从而使得无法利用人工智能技术从该金融结构的用户交易数据中准确地学习到风险操作的识别规律,如此导致风险操作识别准确性较低。
发明内容
为了解决现有技术中存在的以上技术问题,本申请提供一种风险操作预测模型构建方法、风险操作预测方法,能够准确地学习到风险操作的识别规律,从而有利于提高风险操作识别准确性。
为了实现上述目的,本申请实施例提供的技术方案如下:
本申请实施例提供一种风险操作识别模型构建方法,所述方法包括:
获取N个加密训练数据集;其中,第i个加密训练数据集是根据第i个金融机构的加密数据生成的;i为正整数,i≤N;
根据所述N个加密训练数据集,构建风险操作识别模型。
在一种可能的实施方式中,当所述第i个加密训练数据集包括第i个金融机构的Ni个加密数据时,所述第i个加密训练数据集的生成过程,包括:
获取所述第i个金融机构的Ni个训练数据;
对所述第i个金融机构的第j个训练数据进行加密,得到所述第i个金融机构的第j个加密数据;其中,j为正整数,j≤Ni;Ni为正整数;
根据所述第i个金融机构的第1个加密数据至所述第i个金融机构的第Ni个加密数据,生成所述第i个加密训练数据集。
在一种可能的实施方式中,所述对所述第i个金融机构的第j个训练数据进行加密,得到所述第i个金融机构的第j个加密数据,包括:
对所述第i个金融机构的第j个训练数据依次进行全同态加密以及国密加密,得到所述第i个金融机构的第j个加密数据。
在一种可能的实施方式中,所述根据所述N个加密训练数据集,构建风险操作识别模型,包括:
对所述N个加密训练数据集进行国密解密,得到N个待使用训练数据集;
利用所述N个待使用训练数据集,构建风险操作识别模型。
在一种可能的实施方式中,所述方法还包括:
获取所述N个加密训练数据集的贡献权重;其中,所述第i个加密训练数据集的贡献权重用于表征所述第i个加密训练数据集对风险操作识别模型的影响程度;
所述根据所述N个加密训练数据集,构建风险操作识别模型,包括:
根据所述N个加密训练数据集和所述N个加密训练数据集的贡献权重,构建风险操作识别模型。
在一种可能的实施方式中,所述第i个加密训练数据集的贡献权重的生成过程,包括:
获取第i个金融机构的权重参考数据;其中,所述权重参考数据包括信用度、数据量、数据质量、数据词频逆文本频率指数和置信度中的至少一个;
根据所述第i个金融机构的权重参考数据,确定所述第i个加密训练数据集的贡献权重。
本申请实施例还提供了一种风险操作识别方法,所述方法包括:
获取待识别交易数据;其中,所述待识别交易数据是根据目标用户在至少一个金融机构下的金融交易数据生成的;
将所述待识别交易数据输入预先构建的风险操作识别模型,得到所述风险操作识别模型输出的所述待识别交易数据对应的风险操作识别结果;其中,所述风险操作识别模型是利用本申请实施例提供的风险操作识别方法的任一实施方式进行构建的。
本申请实施例还提供了一种风险操作识别模型构建装置,所述装置包括:
第一获取单元,用于获取N个加密训练数据集;其中,第i个加密训练数据集是根据第i个金融机构的加密数据生成的;i为正整数,i≤N;
模型构建单元,用于根据所述N个加密训练数据集,构建风险操作识别模型。
本申请实施例还提供了一种风险操作识别装置,所述装置包括:
第二获取单元,用于获取待识别交易数据;其中,所述待识别交易数据是根据目标用户在至少一个金融机构下的金融交易数据生成的;
风险识别单元,用于将所述待识别交易数据输入预先构建的风险操作识别模型,得到所述风险操作识别模型输出的所述待识别交易数据对应的风险操作识别结果;其中,所述风险操作识别模型是利用本申请实施例提供的风险操作识别方法的任一实施方式进行构建的。
本申请实施例还提供了一种设备,所述设备包括处理器以及存储器:
所述存储器用于存储计算机程序;
所述处理器用于根据所述计算机程序执行本申请实施例提供的风险操作识别模型构建方法的任一实施方式,或者执行本申请实施例提供的风险操作识别方法的任一实施方式。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行本申请实施例提供的风险操作识别模型构建方法的任一实施方式,或者执行本申请实施例提供的风险操作识别方法的任一实施方式。
与现有技术相比,本申请实施例至少具有以下优点:
本申请实施例提供的风险操作识别模型构建方法中,在获取到N个金融机构提供的N个加密训练数据集之后,根据该N个加密训练数据集构建风险操作识别模型。其中,因N个加密训练数据集来自于N个金融机构,使得该N个加密训练数据集中存在充足风险操作对应的训练数据,从而使得基于该N个加密训练数据集构建的风险操作识别模型的识别性能更好,如此有利于提高风险操作识别准确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本申请实施例提供的一种风险操作识别模型构建方法的流程图;
图2为本申请实施例提供的一种风险操作识别方法的流程图;
图3为本申请实施例提供的一种风险操作识别模型构建装置的结构示意图;
图4为本申请实施例提供的一种风险操作识别装置的结构示意图;
图5为本申请实施例提供的一种设备的结构示意图;
图6为本申请实施例提供的另一种设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
方法实施例一
参见图1,该图为本申请实施例提供的一种风险操作识别模型构建方法的流程图。
本申请实施例提供的风险操作识别模型构建方法,包括S101-S102:
S101:获取N个加密训练数据集。
第i个加密训练数据集是根据第i个金融机构的加密数据生成的;而且该第i个金融机构是指构建风险操作识别模型的第i个参与方。其中,i为正整数,i≤N。
另外,本申请实施例不限定各个加密训练数据集的生成方式,而且各个加密训练数据集的生成方式类似,故为了便于理解,下面以第i个加密训练数据集的生成过程为例进行说明。
作为示例,当第i个加密训练数据集包括第i个金融机构的Ni个加密数据时,所述第i个加密训练数据集的生成过程,具体可以包括步骤11-步骤13:
步骤11:获取所述第i个金融机构的Ni个训练数据。其中,Ni为正整数。
第i个金融机构的第j个训练数据是根据第i个金融机构下的金融交易数据生成的。其中,j为正整数,j≤Ni。
另外,本申请实施例不限定第i个金融机构的第j个训练数据,例如,第i个金融机构的第j个训练数据可以包括第i个金融机构下第k个账户的金融交易数据和该第k个账户对应的风险操作实际识别结果。其中,第k个账户对应的风险操作实际识别结果用于表征第i个金融机构下第k个账户在实际生活中是否真实存在风险操作。k为正整数,k≤Mi,Mi是指第i个金融机构下的账户个数。
需要说明的是,本申请实施例不限定金融交易数据,例如,金融交易数据可以包括购买第一物品的交易记录、售卖第二物品的交易记录、转账记录、收账记录等等。另外,本申请实施例不限定风险操作,例如,风险操作可以包括违约操作、洗钱操作、欺诈操作等等。
步骤12:对所述第i个金融机构的第j个训练数据进行加密,得到所述第i个金融机构的第j个加密数据。
其中,第i个金融机构的第j个加密数据是指对述第i个金融机构的第j个训练数据进行加密后得到的。
另外,本申请实施例不限定加密过程,例如,在一种可能的实施方式中,步骤12具体可以为:对所述第i个金融机构的第j个训练数据依次进行全同态加密以及国密加密,得到所述第i个金融机构的第j个加密数据。
可见,本申请实施例中,在获取到第i个金融机构的第j个训练数据之后,可以先对该第i个金融机构的第j个训练数据进行全同态加密,得到该第j个训练数据的一重加密数据;再对该第j个训练数据的一重加密数据进行国密加密,得到该第j个训练数据的二重加密数据,并将该第j个训练数据的二重加密数据,确定为第i个金融机构的第j个加密数据。如此能够有效地提高第i个金融机构的第j个训练数据的安全性。
需要说明的是,本申请实施例不限定全同态加密的实施方式,例如,在一种可能的实施方式中,可以利用具有全同态加密功能的硬件设备对第i个金融机构的第j个训练数据进行全同态加密。另外,本申请实施例也不限定国密加密的实施方式,例如,在一种可能的实施方式中,可以利用具有国密加密功能的硬件设备对第j个训练数据的一重加密数据进行国密加密。
还需要说明的是,为了提高准确性,可以不定期地更换第i个金融机构对应的国密加密过程所需使用的密钥,以便后续能够利用更新后的密钥进行第i个金融机构下的国密加密过程以及国密解密过程。
步骤13:根据所述第i个金融机构的第1个加密数据至所述第i个金融机构的第Ni个加密数据,生成所述第i个加密训练数据集。
本申请实施例中,在获取到第i个金融机构的第1个加密数据至所述第i个金融机构的第Ni个加密数据之后,可以将第i个金融机构的第1个加密数据至所述第i个金融机构的第Ni个加密数据的集合,确定为第i个加密训练数据集,以使该第i个加密训练数据集用于记录第i个金融机构提供的训练数据。
基于上述步骤11至步骤13的相关内容可知,在确定第i个金融机构参与风险操作识别模型的构建过程之后,可以先根据第i个金融机构下各个账户对应的金融交易数据以及各个账户对应的风险操作实际识别结果,构建第i个金融机构的各个训练数据;再对第i个金融机构的各个训练数据分别进行加密(例如,全同态加密和国密加密的双重加密过程),得到第i个金融机构的各个加密数据;最后,将第i个金融机构的所有加密数据的集合,确定为第i个加密训练数据集,以使该第i个加密训练数据集用于记录第i个金融机构提供的训练数据。
S102:根据所述N个加密训练数据集,构建风险操作识别模型。
其中,风险操作识别模型具有风险操作的识别功能,而且本申请实施例不限定风险操作识别模型的模型结构,可以采用现有的或者未来出现的任一种机器学习模型的模型结构进行实施。
另外,本申请实施例不限定风险操作识别模型的构建过程,例如,在一种可能的实施方式下,S102具体可以包括S1021-S1022:
S1021:对所述N个加密训练数据集进行国密解密,得到N个待使用训练数据集。
其中,国密解密与上文国密加密相对应,而且国密解密过程所使用的解密密钥与上文国密加密过程所使用的加密密钥相同。
第i个待使用训练数据集是根据第i个金融机构下一重加密数据得到的;而且本申请实施例不限定第i个待使用训练数据集,例如,第i个待使用训练数据集可以包括第i个金融机构下Ni个一重加密数据。其中,第i个金融机构下第j个一重加密数据是指对第i个金融机构的第j个训练数据进行全同态加密得到的。其中,j为正整数,j≤Ni;Ni为正整数。
需要说明的是,本申请实施例不限定国密解密的实施方式,例如,可以利用具有国密解密功能的硬件设备对第i个加密训练数据集进行解密。又如,若本申请实施例提供的风险操作识别模型构建方法是由风险操作识别模型构建设备执行的,则可以在该风险操作识别模型构建设备的内存中对第i个加密训练数据集进行国密解密。
S1022:利用所述N个待使用训练数据集,构建风险操作识别模型。
本申请实施例中,在获取到N个金融机构对应的N个待使用训练数据集之后,可以利用该N个待使用训练数据集对风险操作识别模型进行训练,以使训练好的风险操作识别模型能够准确地从交易数据中识别出风险操作;而且该训练过程具体可以为:根据N个待使用训练数据集对风险操作识别模型进行联邦学习,得到学习好的风险操作识别模型。
在一些情况下,不同金融机构提供的加密数据在风险操作识别模型的构建过程中所产生的影响不同。基于此,本申请实施例还提供了构建风险操作识别模型(也就是S1022)的一种可能的实施方式,在该实施方式中,S1022具体可以包括S10221-S10222:
S10221:获取所述N个加密训练数据集的贡献权重。
其中,第i个加密训练数据集的贡献权重用于表征该第i个加密训练数据集对风险操作识别模型的影响程度。
另外,本申请实施例不限定N个加密训练数据集的贡献权重的生成方式,例如,可以预先设定N个加密训练数据集的贡献权重。
在一些情况下,为了提高贡献权重的准确性,本申请实施例还提供了计算贡献权重的一种可能的实施方式;而且,因各个加密训练数据集的贡献权重的计算方式类似,故为了便于理解,下面结合第i个加密训练数据集的贡献权重的计算过程为例进行说明。
作为示例,第i个加密训练数据集的贡献权重的计算过程具体可以包括步骤21-步骤22:
步骤21:获取第i个金融机构的权重参考数据。
其中,第i个金融机构的权重参考数据是指计算第i个加密训练数据集的贡献权重时的参考数据。另外,本申请实施例不限定权重参考数据,例如,权重参考数据包括信用度、数据量、数据质量、数据词频逆文本频率指数和置信度中的至少一个。
其中,信用度是指金融结构的信用度。数据量是指金融机构提供的加密数据的个数。数据质量是指金融机构提供的加密数据的质量。
数据词频逆文本频率指数是根据一个金融机构提供的加密数据的个数和上述N个金融机构提供的加密数据总数确定的;而且该数据词频逆文本频率指数可以利用公式(1)计算。
式中,tfidfi为第i个金融机构的数据词频逆文本频率指数;Ni为第i个金融机构提供的加密数据的个数;Nall为N个金融机构提供的加密数据的总数;i为正整数,i≤N。
置信度是指金融结构提供的加密数据的可靠程度;而且本申请实施例不限定置信度的计算方式,例如,可以利用公式(2)进行计算。
步骤22:根据所述第i个金融机构的权重参考数据,确定所述第i个加密训练数据集的贡献权重。
本申请实施例中,在获取到第i个金融机构的权重参考数据之后,可以将该权重参考数据中的各个参考数据进行加权求和,得到该第i个加密训练数据集的贡献权重,以使该第i个加密训练数据集的贡献权重能够准确地表示出第i个加密训练数据集对风险操作识别模型的影响程度。需要说明的是,本申请实施例不限定上述“加权求和”过程中各个参考数据对应的权重,例如,可以预先设定各个参考数据对应的权重。
基于上述步骤21至步骤22的相关内容可知,可以利用第i个金融机构的权重参考数据(例如,第i个金融机构的信用度、数据量、数据质量、数据词频逆文本频率指数和置信度中的至少一个),计算第i个加密训练数据集的贡献权重,以使该第i个加密训练数据集的贡献权重能够准确地表示出第i个加密训练数据集对风险操作识别模型的影响程度。
S10222:根据所述N个加密训练数据集和所述N个加密训练数据集的贡献权重,构建风险操作识别模型。
本申请实施例中,在获取到N个加密训练数据集及其贡献权重时,可以根据该N个加密训练数据集及其贡献权重对风险操作识别模型进行联邦学习,得到学习好的风险操作识别模型。
需要说明的是,本申请实施例不限定N个加密训练数据集的贡献权重在风险操作识别模型中的使用方式,例如,可以在风险操作识别模型的模型损失的计算过程中,利用各个加密训练数据集的贡献权重分别对各个加密训练数据集对应的识别损失进行加权。其中,第i个加密训练数据集的识别损失用于表征第i个加密训练数据集的实际识别结果与该第i个加密训练数据集的模型识别结果之间的差距;i为正整数,i≤N。又如,可以先利用第i个加密训练数据集的贡献权重分别对第i个加密训练数据集进行加权,得到第i个模型训练数据;再利用第1个模型训练数据至第N个模型训练数据对风险操作识别模型进行联邦学习,得到学习好的风险操作识别模型。其中,i为正整数,i≤N。
基于上述S10221至S10222的相关内容可知,可以利用各个金融机构提供的加密数据以及各个金融机构对应的贡献权重,对风险操作识别模型进行构建,以使构建好的风险操作识别模型具有较好地识别性能。
基于上述S101至S102的相关内容可知,在本申请实施例提供的风险操作识别模型构建方法中,在获取到N个金融机构提供的N个加密训练数据集之后,根据该N个加密训练数据集构建风险操作识别模型。其中,因N个加密训练数据集来自于N个金融机构,使得该N个加密训练数据集中存在充足风险操作对应的训练数据,从而使得基于该N个加密训练数据集构建的风险操作识别模型的识别性能更好,如此有利于提高风险操作识别准确性。
另外,在构建好风险操作识别模型之后,可以利用该风险操作识别模型对上文N个金融机构中至少一个金融机构提供的金融交易数据进行风险操作识别。基于此,本申请实施例提供了一种风险操作识别方法。下面结合附图进行说明。
方法实施例二
参见图2,图2为本申请实施例提供的一种风险操作识别方法的流程图。
本申请实施例提供的风险操作识别方法,包括S201-S202:
S201:获取待识别交易数据。
其中,待识别交易数据是根据目标用户在至少一个金融机构下的金融交易数据生成的;而且本申请实施例不限定待识别交易数据的生成过程。
例如,待识别交易数据的生成过程具体可以为:若目标用户在H个金融机构中建立过账户,则根据该H个金融机构中该目标用户对应账户的交易数据,确定该目标用户对应的待识别交易数据。
又如,待识别交易数据的生成过程具体可以为:若目标用户在H个金融机构中建立过账户,则利用N个加密训练数据集的贡献权重对该H个金融机构中该目标用户对应账户的交易数据进行加权求和,得到该目标用户对应的待识别交易数据。
S202:将所述待识别交易数据输入预先构建的风险操作识别模型,得到所述风险操作识别模型输出的所述待识别交易数据对应的风险操作识别结果。
其中,风险操作识别模型用于对所述待识别交易数据进行风险操作识别;而且该所述风险操作识别模型可以利用本申请实施例提供的风险操作识别模型构建方法的任一实施方式进行构建。
所述待识别交易数据对应的风险操作识别结果用于表征目标用户是否存在风险操作。
基于上述S201至S202的相关内容可知,在本申请实施例提供的风险操作识别方法中,可以先根据目标用户在各个金融机构下的交易数据,生成该目标用户对应的待识别交易数据;再将该待识别交易数据输入预先构建的风险操作识别模型,以使该风险操作识别模型能够根据待识别交易数据进行风险操作识别,得到并输出该待识别交易数据对应的风险操作识别结果,以使该待识别交易数据对应的风险操作识别结果能够准确地表示出该目标用户是否存在风险操作。
其中,因风险操作识别模型是根据N个金融机构提供的N个加密训练数据集进行构建的,使得该风险操作识别模型能够准确地从目标用户对应的交易数据中识别出该目标用户是否存在风险操作,从而使得该风险操作识别模型输出的风险操作识别结果能够准确地表示出该目标用户是否存在风险操作,如此有利于提高风险操作的预测准确性。
基于上述方法实施例提供的风险操作识别模型构建方法,本申请实施例还提供了一种风险操作识别模型构建装置,下面结合附图进行解释和说明。
装置实施例一
装置实施例一提供的风险操作识别模型构建装置的技术详情,请参照上述方法实施例。
参见图3,该图为本申请实施例提供的一种风险操作识别模型构建装置的结构示意图。
本申请实施例提供的风险操作识别模型构建装置300,包括:
第一获取单元301,用于获取N个加密训练数据集;其中,第i个加密训练数据集是根据第i个金融机构的加密数据生成的;i为正整数,i≤N;
模型构建单元302,用于根据所述N个加密训练数据集,构建风险操作识别模型。
在一种可能的实施方式中,当所述第i个加密训练数据集包括第i个金融机构的Ni个加密数据时,所述第i个加密训练数据集的生成过程,包括:
获取所述第i个金融机构的Ni个训练数据;
对所述第i个金融机构的第j个训练数据进行加密,得到所述第i个金融机构的第j个加密数据;其中,j为正整数,j≤Ni;Ni为正整数;
根据所述第i个金融机构的第1个加密数据至所述第i个金融机构的第Ni个加密数据,生成所述第i个加密训练数据集。
在一种可能的实施方式中,所述对所述第i个金融机构的第j个训练数据进行加密,得到所述第i个金融机构的第j个加密数据,包括:
对所述第i个金融机构的第j个训练数据依次进行全同态加密以及国密加密,得到所述第i个金融机构的第j个加密数据。
在一种可能的实施方式中,所述模型构建单元302,具体用于:
对所述N个加密训练数据集进行国密解密,得到N个待使用训练数据集;
利用所述N个待使用训练数据集,构建风险操作识别模型。
在一种可能的实施方式中,所述风险操作识别模型构建装置300还包括:
第三获取单元,用于获取所述N个加密训练数据集的贡献权重;其中,所述第i个加密训练数据集的贡献权重用于表征所述第i个加密训练数据集对风险操作识别模型的影响程度;
所述模型构建单元302,具体用于:
根据所述N个加密训练数据集和所述N个加密训练数据集的贡献权重,构建风险操作识别模型。
在一种可能的实施方式中,所述第i个加密训练数据集的贡献权重的生成过程,包括:
获取第i个金融机构的权重参考数据;其中,所述权重参考数据包括信用度、数据量、数据质量、数据词频逆文本频率指数和置信度中的至少一个;
根据所述第i个金融机构的权重参考数据,确定所述第i个加密训练数据集的贡献权重。
基于上述风险操作识别模型构建装置300的相关内容可知,对于风险操作识别模型构建装置300来说,在获取到N个金融机构提供的N个加密训练数据集之后,根据该N个加密训练数据集构建风险操作识别模型。其中,因N个加密训练数据集来自于N个金融机构,使得该N个加密训练数据集中存在充足风险操作对应的训练数据,从而使得基于该N个加密训练数据集构建的风险操作识别模型的识别性能更好,如此有利于提高风险操作识别准确性。
基于上述方法实施例提供的风险操作识别方法,本申请实施例还提供了一种风险操作识别装置,下面结合附图进行解释和说明。
装置实施例二
装置实施例二提供的风险操作识别装置的技术详情,请参照上述方法实施例。
参见图4,该图为本申请实施例提供的一种风险操作识别装置的结构示意图。
本申请实施例提供的风险操作识别装置400,包括:
第二获取单元401,用于获取待识别交易数据;其中,所述待识别交易数据是根据目标用户在至少一个金融机构下的金融交易数据生成的;
风险识别单元402,用于将所述待识别交易数据输入预先构建的风险操作识别模型,得到所述风险操作识别模型输出的所述待识别交易数据对应的风险操作识别结果;其中,所述风险操作识别模型是利用本申请实施例提供的风险操作识别模型构建方法的任一实施方式进行构建的。
基于上述风险操作识别装置400的相关内容可知,对于风险操作识别装置400来说,可以先根据目标用户在各个金融机构下的交易数据,生成该目标用户对应的待识别交易数据;再将该待识别交易数据输入预先构建的风险操作识别模型,以使该风险操作识别模型能够根据待识别交易数据进行风险操作识别,得到并输出该待识别交易数据对应的风险操作识别结果,以使该待识别交易数据对应的风险操作识别结果能够准确地表示出该目标用户是否存在风险操作。
其中,因风险操作识别模型是根据N个金融机构提供的N个加密训练数据集进行构建的,使得该风险操作识别模型能够准确地从目标用户对应的交易数据中识别出该目标用户是否存在风险操作,从而使得该风险操作识别模型输出的风险操作识别结果能够准确地表示出该目标用户是否存在风险操作,如此有利于提高风险操作的预测准确性。
基于上述方法实施例提供的风险操作识别模型构建方法,本申请实施例还提供了一种设备,下面结合附图进行解释和说明。
设备实施例一
设备实施例一提供的设备技术详情,请参照上述方法实施例。
参见图5,该图为本申请实施例提供的一种设备的结构示意图。
本申请实施例提供的设备500,包括:处理器501以及存储器502;
所述存储器502用于存储计算机程序;
所述处理器501用于根据所述计算机程序执行上述方法实施例提供的风险操作识别模型构建方法的任一实施方式。也就是说,处理器501用于执行以下步骤:
获取N个加密训练数据集;其中,第i个加密训练数据集是根据第i个金融机构的加密数据生成的;i为正整数,i≤N;
根据所述N个加密训练数据集,构建风险操作识别模型。
在一种可能的实施方式下,当所述第i个加密训练数据集包括第i个金融机构的Ni个加密数据时,所述第i个加密训练数据集的生成过程,包括:
获取所述第i个金融机构的Ni个训练数据;
对所述第i个金融机构的第j个训练数据进行加密,得到所述第i个金融机构的第j个加密数据;其中,j为正整数,j≤Ni;Ni为正整数;
根据所述第i个金融机构的第1个加密数据至所述第i个金融机构的第Ni个加密数据,生成所述第i个加密训练数据集。
在一种可能的实施方式下,所述对所述第i个金融机构的第j个训练数据进行加密,得到所述第i个金融机构的第j个加密数据,包括:
对所述第i个金融机构的第j个训练数据依次进行全同态加密以及国密加密,得到所述第i个金融机构的第j个加密数据。
在一种可能的实施方式下,所述根据所述N个加密训练数据集,构建风险操作识别模型,包括:
对所述N个加密训练数据集进行国密解密,得到N个待使用训练数据集;
利用所述N个待使用训练数据集,构建风险操作识别模型。
在一种可能的实施方式下,还包括:
获取所述N个加密训练数据集的贡献权重;其中,所述第i个加密训练数据集的贡献权重用于表征所述第i个加密训练数据集对风险操作识别模型的影响程度;
所述根据所述N个加密训练数据集,构建风险操作识别模型,包括:
根据所述N个加密训练数据集和所述N个加密训练数据集的贡献权重,构建风险操作识别模型。
在一种可能的实施方式下,所述第i个加密训练数据集的贡献权重的生成过程,包括:
获取第i个金融机构的权重参考数据;其中,所述权重参考数据包括信用度、数据量、数据质量、数据词频逆文本频率指数和置信度中的至少一个;
根据所述第i个金融机构的权重参考数据,确定所述第i个加密训练数据集的贡献权重。
以上为本申请实施例提供的设备500的相关内容。
基于上述方法实施例提供的风险操作识别方法,本申请实施例还提供了一种设备,下面结合附图进行解释和说明。
设备实施例二
设备实施例二提供的设备技术详情,请参照上述方法实施例。
参见图6,该图为本申请实施例提供的另一种设备的结构示意图。
本申请实施例提供的设备600,包括:处理器601以及存储器602;
所述存储器602用于存储计算机程序;
所述处理器601用于根据所述计算机程序执行上述方法实施例提供的风险操作识别方法的任一实施方式。也就是说,处理器601用于执行以下步骤:
获取待识别交易数据;其中,所述待识别交易数据是根据目标用户在至少一个金融机构下的金融交易数据生成的;
将所述待识别交易数据输入预先构建的风险操作识别模型,得到所述风险操作识别模型输出的所述待识别交易数据对应的风险操作识别结果;其中,所述风险操作识别模型是利用本申请实施例提供的风险操作识别模型构建方法的任一实施方式进行构建的。
以上为本申请实施例提供的设备600的相关内容。
基于上述方法实施例提供的风险操作识别模型构建方法,本申请实施例还提供了一种计算机可读存储介质。
介质实施例一
介质实施例一提供的计算机可读存储介质的技术详情,请参照方法实施例。
本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行上述方法实施例提供的风险操作识别模型构建方法的任一实施方式。也就是说,该计算机程序用于执行以下步骤:
获取N个加密训练数据集;其中,第i个加密训练数据集是根据第i个金融机构的加密数据生成的;i为正整数,i≤N;
根据所述N个加密训练数据集,构建风险操作识别模型。
在一种可能的实施方式下,当所述第i个加密训练数据集包括第i个金融机构的Ni个加密数据时,所述第i个加密训练数据集的生成过程,包括:
获取所述第i个金融机构的Ni个训练数据;
对所述第i个金融机构的第j个训练数据进行加密,得到所述第i个金融机构的第j个加密数据;其中,j为正整数,j≤Ni;Ni为正整数;
根据所述第i个金融机构的第1个加密数据至所述第i个金融机构的第Ni个加密数据,生成所述第i个加密训练数据集。
在一种可能的实施方式下,所述对所述第i个金融机构的第j个训练数据进行加密,得到所述第i个金融机构的第j个加密数据,包括:
对所述第i个金融机构的第j个训练数据依次进行全同态加密以及国密加密,得到所述第i个金融机构的第j个加密数据。
在一种可能的实施方式下,所述根据所述N个加密训练数据集,构建风险操作识别模型,包括:
对所述N个加密训练数据集进行国密解密,得到N个待使用训练数据集;
利用所述N个待使用训练数据集,构建风险操作识别模型。
在一种可能的实施方式下,还包括:
获取所述N个加密训练数据集的贡献权重;其中,所述第i个加密训练数据集的贡献权重用于表征所述第i个加密训练数据集对风险操作识别模型的影响程度;
所述根据所述N个加密训练数据集,构建风险操作识别模型,包括:
根据所述N个加密训练数据集和所述N个加密训练数据集的贡献权重,构建风险操作识别模型。
在一种可能的实施方式下,所述第i个加密训练数据集的贡献权重的生成过程,包括:
获取第i个金融机构的权重参考数据;其中,所述权重参考数据包括信用度、数据量、数据质量、数据词频逆文本频率指数和置信度中的至少一个;
根据所述第i个金融机构的权重参考数据,确定所述第i个加密训练数据集的贡献权重。
以上为本申请实施例提供的计算机可读存储介质的相关内容。
基于上述方法实施例提供的风险操作识别方法,本申请实施例还提供了一种计算机可读存储介质。
介质实施例二
介质实施例二提供的计算机可读存储介质的技术详情,请参照方法实施例。
本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行上述方法实施例提供的风险操作识别方法的任一实施方式。也就是说,该计算机程序用于执行以下步骤:
获取待识别交易数据;其中,所述待识别交易数据是根据目标用户在至少一个金融机构下的金融交易数据生成的;
将所述待识别交易数据输入预先构建的风险操作识别模型,得到所述风险操作识别模型输出的所述待识别交易数据对应的风险操作识别结果;其中,所述风险操作识别模型是利用本申请实施例提供的风险操作识别模型构建方法的任一实施方式进行构建的。
以上为本申请实施例提供的计算机可读存储介质的相关内容。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制。虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明。任何熟悉本领域的技术人员,在不脱离本发明技术方案范围情况下,都可利用上述揭示的方法和技术内容对本发明技术方案做出许多可能的变动和修饰,或修改为等同变化的等效实施例。因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何简单修改、等同变化及修饰,均仍属于本发明技术方案保护的范围内。
Claims (11)
1.一种风险操作识别模型构建方法,其特征在于,所述方法包括:
获取N个加密训练数据集;其中,第i个加密训练数据集是根据第i个金融机构的加密数据生成的;i为正整数,i≤N;
根据所述N个加密训练数据集,构建风险操作识别模型。
2.根据权利要求1所述的方法,其特征在于,当所述第i个加密训练数据集包括第i个金融机构的Ni个加密数据时,所述第i个加密训练数据集的生成过程,包括:
获取所述第i个金融机构的Ni个训练数据;
对所述第i个金融机构的第j个训练数据进行加密,得到所述第i个金融机构的第j个加密数据;其中,j为正整数,j≤Ni;Ni为正整数;
根据所述第i个金融机构的第1个加密数据至所述第i个金融机构的第Ni个加密数据,生成所述第i个加密训练数据集。
3.根据权利要求2所述的方法,其特征在于,所述对所述第i个金融机构的第j个训练数据进行加密,得到所述第i个金融机构的第j个加密数据,包括:
对所述第i个金融机构的第j个训练数据依次进行全同态加密以及国密加密,得到所述第i个金融机构的第j个加密数据。
4.根据权利要求3所述的方法,其特征在于,所述根据所述N个加密训练数据集,构建风险操作识别模型,包括:
对所述N个加密训练数据集进行国密解密,得到N个待使用训练数据集;
利用所述N个待使用训练数据集,构建风险操作识别模型。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述N个加密训练数据集的贡献权重;其中,所述第i个加密训练数据集的贡献权重用于表征所述第i个加密训练数据集对风险操作识别模型的影响程度;
所述根据所述N个加密训练数据集,构建风险操作识别模型,包括:
根据所述N个加密训练数据集和所述N个加密训练数据集的贡献权重,构建风险操作识别模型。
6.根据权利要求5所述的方法,其特征在于,所述第i个加密训练数据集的贡献权重的生成过程,包括:
获取第i个金融机构的权重参考数据;其中,所述权重参考数据包括信用度、数据量、数据质量、数据词频逆文本频率指数和置信度中的至少一个;
根据所述第i个金融机构的权重参考数据,确定所述第i个加密训练数据集的贡献权重。
7.一种风险操作识别方法,其特征在于,所述方法包括:
获取待识别交易数据;其中,所述待识别交易数据是根据目标用户在至少一个金融机构下的金融交易数据生成的;
将所述待识别交易数据输入预先构建的风险操作识别模型,得到所述风险操作识别模型输出的所述待识别交易数据对应的风险操作识别结果;其中,所述风险操作识别模型是利用权利要求1-6任一项所述的风险操作识别模型构建方法进行构建的。
8.一种风险操作识别模型构建装置,其特征在于,所述装置包括:
第一获取单元,用于获取N个加密训练数据集;其中,第i个加密训练数据集是根据第i个金融机构的加密数据生成的;i为正整数,i≤N;
模型构建单元,用于根据所述N个加密训练数据集,构建风险操作识别模型。
9.一种风险操作识别装置,其特征在于,所述装置包括:
第二获取单元,用于获取待识别交易数据;其中,所述待识别交易数据是根据目标用户在至少一个金融机构下的金融交易数据生成的;
风险识别单元,用于将所述待识别交易数据输入预先构建的风险操作识别模型,得到所述风险操作识别模型输出的所述待识别交易数据对应的风险操作识别结果;其中,所述风险操作识别模型是利用权利要求1-6任一项所述的风险操作识别模型构建方法进行构建的。
10.一种设备,其特征在于,所述设备包括处理器以及存储器:
所述存储器用于存储计算机程序;
所述处理器用于根据所述计算机程序执行权利要求1-6中任一项所述的风险操作识别模型构建方法,或者执行权利要求7所述的风险操作识别方法。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行权利要求1-6中任一项所述的风险操作识别模型构建方法,或者执行权利要求7所述的风险操作识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011598680.3A CN112598311A (zh) | 2020-12-29 | 2020-12-29 | 一种风险操作识别模型构建方法、风险操作识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011598680.3A CN112598311A (zh) | 2020-12-29 | 2020-12-29 | 一种风险操作识别模型构建方法、风险操作识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112598311A true CN112598311A (zh) | 2021-04-02 |
Family
ID=75203496
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011598680.3A Pending CN112598311A (zh) | 2020-12-29 | 2020-12-29 | 一种风险操作识别模型构建方法、风险操作识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112598311A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113191893A (zh) * | 2021-05-27 | 2021-07-30 | 中国工商银行股份有限公司 | 数据风险预测方法、装置、电子设备、介质及程序产品 |
WO2023047542A1 (ja) * | 2021-09-24 | 2023-03-30 | 日本電気株式会社 | 学習装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110795768A (zh) * | 2020-01-06 | 2020-02-14 | 支付宝(杭州)信息技术有限公司 | 基于私有数据保护的模型学习方法、装置及系统 |
CN111291897A (zh) * | 2020-02-10 | 2020-06-16 | 深圳前海微众银行股份有限公司 | 基于半监督的横向联邦学习优化方法、设备及存储介质 |
CN111310208A (zh) * | 2020-02-14 | 2020-06-19 | 云从科技集团股份有限公司 | 数据处理方法、系统、平台、设备及机器可读介质 |
US20200311300A1 (en) * | 2019-03-26 | 2020-10-01 | The Regents Of The University Of California | Distributed privacy-preserving computing on protected data |
CN111932367A (zh) * | 2020-08-13 | 2020-11-13 | 中国银行股份有限公司 | 贷前信用评估方法及装置 |
-
2020
- 2020-12-29 CN CN202011598680.3A patent/CN112598311A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200311300A1 (en) * | 2019-03-26 | 2020-10-01 | The Regents Of The University Of California | Distributed privacy-preserving computing on protected data |
CN110795768A (zh) * | 2020-01-06 | 2020-02-14 | 支付宝(杭州)信息技术有限公司 | 基于私有数据保护的模型学习方法、装置及系统 |
CN111291897A (zh) * | 2020-02-10 | 2020-06-16 | 深圳前海微众银行股份有限公司 | 基于半监督的横向联邦学习优化方法、设备及存储介质 |
CN111310208A (zh) * | 2020-02-14 | 2020-06-19 | 云从科技集团股份有限公司 | 数据处理方法、系统、平台、设备及机器可读介质 |
CN111932367A (zh) * | 2020-08-13 | 2020-11-13 | 中国银行股份有限公司 | 贷前信用评估方法及装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113191893A (zh) * | 2021-05-27 | 2021-07-30 | 中国工商银行股份有限公司 | 数据风险预测方法、装置、电子设备、介质及程序产品 |
WO2023047542A1 (ja) * | 2021-09-24 | 2023-03-30 | 日本電気株式会社 | 学習装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230078061A1 (en) | Model training method and apparatus for federated learning, device, and storage medium | |
Franco | Understanding Bitcoin: Cryptography, engineering and economics | |
US11321717B2 (en) | System and method for analyzing transaction nodes using visual analytics | |
EP3627759A1 (en) | Method and apparatus for encrypting data, method and apparatus for training machine learning model, and electronic device | |
CN107808289B (zh) | 电子支付平台、控制方法及装置 | |
US11893493B2 (en) | Clustering techniques for machine learning models | |
Sarbabidya et al. | Role of chatbot in customer service: A study from the perspectives of the banking industry of Bangladesh | |
CN113407987B (zh) | 保护隐私的确定业务数据特征有效值的方法及装置 | |
CN109426861A (zh) | 数据加密、机器学习模型训练方法、装置及电子设备 | |
CN111340614A (zh) | 基于联邦学习的样本采样方法、设备及可读存储介质 | |
CN112598311A (zh) | 一种风险操作识别模型构建方法、风险操作识别方法 | |
WO2021075057A1 (en) | Digital currency operation system and operation method using fully homological encryption scheme | |
EP4085332A1 (en) | Creating predictor variables for prediction models from unstructured data using natural language processing | |
WO2023060150A1 (en) | Data compression techniques for machine learning models | |
EP4075363A1 (en) | Self learning machine learning scores adjustment via normalization thereof | |
CN117670364A (zh) | 一种异常交易识别方法、装置、设备及存储介质 | |
Degiannakis et al. | Superkurtosis | |
CN117094773A (zh) | 基于区块链隐私计算的在线迁移学习方法及系统 | |
CN110298156A (zh) | 基于活体检测的资源获取方法、装置、设备及存储介质 | |
CN111368337B (zh) | 保护隐私的样本生成模型构建、仿真样本生成方法及装置 | |
CN110362981B (zh) | 基于可信设备指纹判断异常行为的方法及系统 | |
Kaur | Development of Business Intelligence Outlier and financial crime analytics system for predicting and managing fraud in financial payment services | |
Motora et al. | Detecting Fraudulent Bank Transactions Using Deep Learning Enhanced with Genetic Programming | |
Wu et al. | The total return swap pricing model under fuzzy random environments | |
US12039612B1 (en) | Apparatus and method for automated risk assessment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |