CN115525922A - 基于隐私计算的金融隐私数据安全决策方法、装置及设备 - Google Patents

基于隐私计算的金融隐私数据安全决策方法、装置及设备 Download PDF

Info

Publication number
CN115525922A
CN115525922A CN202211108597.2A CN202211108597A CN115525922A CN 115525922 A CN115525922 A CN 115525922A CN 202211108597 A CN202211108597 A CN 202211108597A CN 115525922 A CN115525922 A CN 115525922A
Authority
CN
China
Prior art keywords
data
segmentation
privacy
determining
client
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211108597.2A
Other languages
English (en)
Inventor
郭兰停
王爽
李帜
郑灏
王帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Weiwei Information Technology Co ltd
Original Assignee
Hangzhou Weiwei Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Weiwei Information Technology Co ltd filed Critical Hangzhou Weiwei Information Technology Co ltd
Priority to CN202211108597.2A priority Critical patent/CN115525922A/zh
Publication of CN115525922A publication Critical patent/CN115525922A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Business, Economics & Management (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Accounting & Taxation (AREA)
  • Technology Law (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Mathematical Physics (AREA)
  • General Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了基于隐私计算的金融隐私数据安全决策方法、装置及设备,通过服务器确定多个客户端的共有数据,并获取共有数据的标签数据;下发标签数据给客户端,以使客户端按照标签数据确定分割特征和分割值;获取各个客户端上传的分割特征和分割值,并在可信执行环境中,确定最佳分割特征和最佳分割值,形成分类树;依据分类树,确定决策树;其中联邦学习方法,则是基于训练好的决策树,对待分析的目标对象进行分析,确定目标对象的综合分析结果,并反馈。本方法可以对参与方的隐私数据进行保护,提升数据安全性,并且服务器在可信执行环境中对隐私数据相关的数据进行隐私计算,进一步减小了数据泄露的风险。

Description

基于隐私计算的金融隐私数据安全决策方法、装置及设备
技术领域
本发明涉及信息安全和数据隐私保护技术领域,尤其是涉及基于隐私计算的金融隐私数据安全决策方法、装置及设备。
背景技术
隐私计算是指在保护数据本身不对外泄露的前提下实现数据分析计算的技术集合,达到对数据“可用、不可见”的目的;在充分保护数据和隐私安全的前提下,实现数据价值的转化和释放;是面向隐私信息全生命周期保护的计算理论和方法,是隐私信息的所有权、管理权和使用权分离时隐私度量、隐私泄漏代价、隐私保护与隐私分析复杂性的可计算模型与公理化系统。
决策树是一个预测模型;代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象(或称特征,如年龄),而每个分叉路径则代表的某个可能的属性值(或称特征值,如30岁)。
目前的决策树的训练过程是将多个参与方的数据汇总到服务器,通过服务器来依据多个参与方的数据进行决策树的训练。
但是采用上述的训练方式来训练决策树,各个参与方的数据均上传到服务器,容易产生数据的泄露,数据安全性差。
发明内容
为解决现有技术的不足,提升决策数据训练过程中数据的安全性,本发明采用如下的技术方案:
基于隐私计算的隐私数据安全决策方法,应用于服务端,所述方法包括:
确定多个客户端的共有数据,并获取共有数据的标签数据;
下发标签数据给客户端,以使客户端按照标签数据确定分割特征和分割值;
获取各个客户端上传的分割特征和分割值,并在可信执行环境中,确定最佳分割特征和最佳分割值,形成分类树;
依据分类树,确定决策树。
通过共有数据的标签数据,确定分割特征和分割值,从而在提高训练效率的同时,保证了生成的决策树的准确性和完整性,保证了中间数据在传输过程中泄露的风险,同时,相较于采用同态加密方法,能够更节省加解密的过程,以及对密文的计算、分析所消耗的时间和计算资源。
进一步地,所述方法还包括:
为用户端提供页面,页面中包含分割点设置控件;
基于在页面对分割点设置控件的触发,获取输入的分割特征和分割特征的分割集中值;
下发分割特征和分割特征的分割集中值给计算节点,以使计算节点确定分割特征和特征值;
接收分割特征和分割值。
分割点设置控件,用于预设决策树的分割值的区间,和/或设置分割值的候选数值。从而可以手动设置分割点,在确定分割值时,能够根据预设值进行分割,加快模型的训练速度。
进一步地,所述共有数据的确定包括:
下发求交集指令给各个客户端,以使得客户端对客户端本地数据的第一序号进行混淆,形成第二序号,并确定第二序号与第一序号之间的映射关系,依据第二序号和客户端的本地数据的唯一标识确定第一数据,以采用各个计算节点的本地密钥,对第一数据进行多次加密得到的第二数据,以依据第二数据进行求交集;
获取各客户端的第二数据;
依据第二数据,确定各目标对象的共有数据;
记录共有数据的第二序号,以在训练决策树的过程中,下发共有数据的标签数据与第二序号之间的对应关系给客户端,以使得客户端依据第二序号与第一序号的映射关系,完成决策树的训练。
利用混淆序号的方式进行数据的传输,即便序号泄露也不会泄露原始数据,提升数据安全性。
其中,第一数据可以通过本地数据的唯一标识进行哈希后的哈希值确定,并按照哈希值进行排序后划分为多组,以便服务端分别对每组数据进行匹配。(无需一次性匹配,服务端可以在计算完一组数据之后,再计算下一组,从而降低处理压力),此外,对于哈希值冲突的情况,可以采取对哈希值进行二次哈希的方式来避免冲突的哈希值。
进一步地,所述依据分类树,确定决策树,包括:
在分类树的数量超过第一阈值时,随机删除至少一个分类树,从而更快速的进行模型训练。
进一步地,所述随机删除至少一个分类树,包括从与人工设定的分割集中值无关的分类树中删除至少一个分类树,从而防止决策树过于拟合。
基于隐私计算的隐私数据安全决策方法,应用于客户端,所述方法包括:
将标签数据发送给服务端,以使服务端确定多个客户端的共有数据及共有数据的标签数据;
获取服务端下发的共有数据的标签数据,根据共有数据的标签数据,确定分割特征和分割值;
将分割特征和分割值发送给服务端,以使服务端在可信执行环境中,确定最佳分割特征和最佳分割值,形成分类树,并依据分类树,确定决策树。
基于隐私计算的隐私数据安全决策方法,包括:
获取待分析的目标对象的对象信息;
确定对象信息相关的计算节点,并将对象信息和决策树下发给计算节点,以使所述计算节点依据对象信息获取目标对象的待分析数据,并根据决策树确定节点分析结果;其中,所述决策树由分类树组成,所述分类树的最佳分割特征和最佳分割值通过多个计算节点上传的分割特征和分割值确定,计算节点上传的分割特征和分割值依据下发给计算节点的共有数据的标签数据确定;
获取计算节点上传的节点分析结果;
依据各计算节点上传的节点分析结果,确定目标对象的综合分析结果,并反馈。
基于隐私计算的金融隐私数据安全决策方法,包括:
获取待分析的用户的用户信息;用户通过交互页面,输入姓名、身份证号等用户信息;
确定用户信息相关的金融机构,并将用户信息和决策树下发给金融机构,以使所述金融机构依据用户信息获取用户的待分析数据,并根据决策树确定用户分析结果;服务端通过用户提供的姓名、身份证号等用户信息,确定相关的银行、社保中心等机构,并对相关的金融机构下发用户信息和决策树;其中,所述决策树由分类树组成,所述分类树的最佳分割特征和最佳分割值通过多个金融机构上传的分割特征和分割值确定,金融机构上传的分割特征和分割值依据下发给金融机构的用户共有数据的标签数据确定;所述用户分析结果包括用户信用评价结果、和/或用户还贷能力评估、和/或贷款总额分析结果;
获取金融机构上传的用户分析结果;
依据各金融机构上传的用户分析结果,确定用户的综合分析结果,并反馈。服务端接收银行、社保中心等机构反馈的用户分析结果,并综合分析得到最终结果,例如用户的综合购买能力、综合投资能力等,用于评估或推荐用户购买住房、投资金融产品等。
基于隐私计算的隐私数据安全的决策装置,包括共有数据确定模块、共有标签数据下发模块、分类树构建模块和决策树确定模块;
所述共有数据确定模块,用于确定多个客户端的共有数据,并获取共有数据的标签数据;
所述共有标签数据下发模块,用于下发共有数据的标签数据给客户端,以使客户端按照标签数据确定分割特征和分割值;
所述分类树构建模块,用于获取各个客户端上传的分割特征和分割值,并在可信执行环境中,确定最佳分割特征和最佳分割值,形成分类树;
所述决策树确定模块,依据分类树,确定决策树。
基于隐私计算的隐私数据安全决策电子设备,包括存储器和一个或多个处理器,所述存储器中存储有可执行代码,所述一个或多个处理器执行所述可执行代码时,用于实现所述的基于数据安全的决策树的联邦学习隐私保护训练方法。
本发明的优势和有益效果在于:
本发明通过联邦学习的方式,支持拥有不同数据的客户端协作训练一个轻型梯度提升机(Light Gradient Boosting Machine,LightGBM)模型并使用该模型进行预测任务,训练和推理过程不会泄露客户端中的数据信息;使用可信执行环境(Trusted ExecutionEnvironment,TEE),即因特尔的SGX架构来,对各本地节点的中间参数进行保护,防止因参数泄露而导致原始数据泄露的问题。
附图说明
图1A是本发明中基于隐私计算的隐私数据安全决策方法的训练流程图。
图1B是本发明中基于隐私计算的隐私数据安全决策方法的交互示意图。
图2是本发明的实施例中基于隐私计算的隐私数据安全决策方法的训练流程图。
图3是本发明中基于隐私计算的隐私数据安全决策方法的流程图。
图4是本发明实施例中基于隐私计算的金融隐私数据安全决策方法的流程图。
图5是本发明中基于隐私计算的隐私数据安全决策装置的结构示意图。
图6是本发明中基于隐私计算的隐私数据安全决策电子设备的结构示意图。
具体实施方式
以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。
如图1A所示,基于隐私计算的隐私数据安全决策方法;
应用于服务端,所述方法包括:
步骤102、确定多个客户端的共有数据,并获取共有数据的标签数据;
步骤104、下发标签数据给客户端,以使客户端按照标签数据确定分割特征和分割值;
步骤106、获取各个客户端上传的分割特征和分割值,并在可信执行环境中,确定最佳分割特征和最佳分割值,形成分类树;
步骤108、依据分类树,确定决策树。
共有数据是指某个目标对象在多个客户端均保存有相应的数据(在每个客户端的数据可以相同也可以不同),共有数据的标签数据可以理解为可以通过对数据进行分析得到的结果,例如,可以通过年龄、学历、存款情况、资金流水情况等信息来确定用户最终的还款能力(如每月还款多少钱、或能否负担某一个还款额的标签)。
如图1B所示,服务端可以与多个客户端进行交互,客户端可以理解为包含各项数据的一侧,各个客户端包含的数据的数据属性可以相同也不可以不同,具体可以依据需求进行配置。服务端可以确定多个客户端的共有数据,并获取共有数据的标签数据,并将标签数据发送给客户端,客户端确定本地与其他客户端共有的数据与标签之间的对应关系,进而进行分析,确定共有数据的分割特征和分割值,分割特征可以理解为目标对象的某一属性(如年龄),分割值可以理解为决策树分类的属性值(如30岁),小于属性值(如三十岁)的向决策树的左侧进行分割,大于属性值(如三十岁)的数据想决策树的右侧进行分割。客户端确定分割特征和分割值之后,可以将分割特征和分割值上传给服务端,服务端在可信执行环境中,分析多个客户端上传的分割特征和分割值,进而确定最佳分割特征和最佳分割值,形成分类树;服务端与客户端迭代多次之后,形成多颗分类树,进而形成决策树。
在部分现有的方案中,服务端可以确定多个客户端的共有数据,并获取标签,服务端还可以获取各个客户端的共有数据的数据信息(如表现共有数据分布情况的直方图),并在服务端判断最佳分割特征和最佳分割值的分析方是哪一个客户端,进而通过该客户端来完成最佳分割特征和最佳分割值的分析。但是采用上述方式,服务端可以获取多个客户端的数据的数据信息,在数据传输过程和数据分析过程容易导致数据泄露。而本申请实施例的方案可以在各个客户端的本地进行分割特征和分割值的分析,并通过客户端上传分割特征和分割值,客户端无需上传数据的数据信息给服务端,并且服务端可以在可信性执行环境中对多个客户端的分割特征和分割值进行分析,减小了客户端数据信息在传输和分析过程中的泄露风险。提升了数据的安全性。
进一步地,所述方法还包括:
为用户端提供页面,页面中包含分割点设置控件;
基于在页面对分割点设置控件的触发,获取输入的分割特征和分割特征的分割集中值;
下发分割特征和分割特征的分割集中值给计算节点,以使计算节点确定分割特征和特征值;
接收分割特征和分割值。
分割点设置控件,用于预设决策树的分割值的区间,和/或设置分割值的候选数值。从而可以手动设置分割点,在确定分割值时,能够根据预设值进行分割,加快模型的训练速度。
为了更加快速的进行决策树的训练,本方案可以向用户提供页面,页面包含有分割点设置控件,用户可以对分割点设置控件进行触发,以设定当前分类树的分割特征和分割集中值,通过设置分割集中值,决策树在训练过程中,可以对分割特征优先采用分割集中值相关的分割值进行分析,从而可以更加快速的确定分割特征和分割值,提升分类树的训练效率。
进一步地,所述共有数据的确定包括:
下发求交集指令给各个客户端,以使得客户端对客户端本地数据的第一序号进行混淆,形成第二序号,并确定第二序号与第一序号之间的映射关系,依据第二序号和客户端的本地数据的唯一标识确定第一数据,以采用各个计算节点的本地密钥,对第一数据进行多次加密得到的第二数据,以依据第二数据进行求交集;
获取各客户端的第二数据;
依据第二数据,确定各目标对象的共有数据;
记录共有数据的第二序号,以在训练决策树的过程中,下发共有数据的标签数据与第二序号之间的对应关系给客户端,以使得客户端依据第二序号与第一序号的映射关系,完成决策树的训练。
利用混淆序号的方式进行数据的传输,即便序号泄露也不会泄露原始数据,提升数据安全性。并且每个客户端的数据均(采用多个客户端的密钥)进行多次加密,进而通过可以校验多次加密后的数据是否一致来确定共有数据。
其中,第一数据可以通过本地数据的唯一标识进行哈希后的哈希值确定,并按照哈希值进行排序后划分为多组,以便服务端分别对每组数据进行匹配。(无需一次性匹配,服务端可以在计算完一组数据之后,再计算下一组,从而降低处理压力),此外,对于哈希值冲突的情况,可以采取对哈希值进行二次哈希的方式来避免冲突的哈希值。
本发明的实施例中,用求交集的方式确定多个Local节点的共有数据,其中,各个Local节点可以对Local节点的本地数据进行混淆,得到混淆后的序号与原始序号之间的序号对应关系,并存储在本地。然后服务端可以利用求交集的方式确定共有数据,并记录各方的同一数据的序号(例如:序号从节点1至节点3为:10、15、30),形成共有数据序号表。然后服务端可以获取序号(混淆后的序号)和对应的标签,进而确定最佳分割点。其中,服务端对多方求交集的方式可以是各个Local节点均含有一个本地密钥,Local节点对本地的数据(混淆后序号和唯一标识)进行加密(对唯一标识进行加密),并传输给其他Local节点,各个Local节点均用本地密钥加密之后,形成多次加密的加密结果。进而进行求交集(通过判断多次加密的结果是否一致),得到共有数据。例如:3个Local节点,都使用本地的密钥a、b、c对数据加密,3个Local节点均包含共有数据G,则第一个Local节点的数据G多次加密后得到a*G*b*c,第二个Local节点的数据G多次加密后得到b*G*a*c,第三个Local节点的数据G多次加密后得到c*G*a*b,无需解密,只需比较3个Local节点中加密后的结果是否一致,便可判断3个数据是否相同(即共有数据)。
进一步地,所述依据分类树,确定决策树,包括:
在分类树的数量超过第一阈值时,随机删除至少一个分类树,从而更快速的进行模型训练。
进一步地,所述随机删除至少一个分类树,包括从与人工设定的分割集中值无关的分类树中删除至少一个分类树。
部分决策树在训练过程中,由于训练数据的分散度不够,会产生模型过拟合的情况,为了防止决策树过拟合,本方案可以设置第一阈值,在分类树的数量超过第一阈值时,从分类树中随机删除至少一个分类树,本方案可以通过随机删除某一分类树的方案,减小模型过拟合的概率。并且,本方案可以从人工设置的分类树以外的分类树中随机删除一个分类树,可以减小误删除重要性高的树。
本发明实施例中,隐私保护方法的服务端包括一个拥有软件保护扩展(SoftwareGuard eXtensions,SGX)架构的Global节点和对应的基于SGX的安全计算单元,每个客户端为一个拥有数据的Local节点,K个Local节点中有一个或多个拥有标签数据,其余节点拥有不同的特征数据。一个GBDT模型是由多棵决策树来共同组成的,因此GBDT模型的训练过程可以分为两步:1)Training,即单棵策略树的训练部分;2)Boosting,即多棵策略树的集成部分。策略树的训练过程主要是在众多的特征和特征分割阈值之间,选择一个最佳的特征和阈值来做为树的节点,选择的过程完全取决于样本的一阶导数g和二阶导数h,一个样本包括一个人的年龄、学历、地区、收入等信息。如图2所示,具体地训练过程包括如下步骤:
步骤S1:拥有标签的Local节点将标签发送给Global节点;
步骤S2:Global节点通过GBDT模型的输出和真实标签计算每个样本的一阶导数g和二阶导数h:
Figure 992123DEST_PATH_IMAGE002
Figure 706001DEST_PATH_IMAGE004
具体地,将样本数据(年龄:23岁,学历:本科,居住地:北京,月收入:10000元)输入到GBDT模型中,得到输出的分析结果(还贷能力23),将分析结果与真实的标签(还贷能力33)计算该样本的一阶导数g和二阶导数h;
步骤S3:Global节点将每个样本的一阶导数g和二阶导数h发送给所有的Local节点;
步骤S4:Local节点通过一阶导数g和二阶导数h,计算每个特征不同分割值的损失
Figure 79213DEST_PATH_IMAGE006
Figure 208843DEST_PATH_IMAGE008
步骤S5:每个Local节点将自己计算得到的损失
Figure 616691DEST_PATH_IMAGE010
传输到服务端;
步骤S6:服务端比较所有本地节点反馈的损失
Figure 907995DEST_PATH_IMAGE010
,选择最佳的
Figure 768504DEST_PATH_IMAGE010
作为当前节点 的分割特征和分割阈值;服务器在训练过程中,根据真实标签,通过分割值
Figure 436245DEST_PATH_IMAGE010
得到分割特 征和分割阈值;例如:第一个Local节点的年龄分割值是32岁,第二个Local节点的年龄分割 值是35岁,在Local节点计算完之后,可以传给服务端,服务端最终确认最佳的分割值是32 岁,将分割值32岁作为GBDT模型参数,构建决策树,决策树按该分割值进行分割;
步骤S7:重复上述步骤,直到达到构建树的终止条件(例如树深度达到最大值或者
Figure 901862DEST_PATH_IMAGE010
已经不足够分割当前样本空间)。
本发明实施例给出的方案主要是应用在纵向决策树的训练场景,即各Local节点的数据互补(同一用户的不同数据),另一个实施例中,采用横向决策树的训练场景,在各Local节点的数据为不同用户的数据,在服务器设置可信执行环境,对GBDT模型参数进行保护。
在一个可选的实施例中,如图1A所示,本申请还提供基于隐私计算的隐私数据安全策略方法,可应用于客户端,所述方法包括:
获取服务端下发的共有数据的标签数据,所述标签数据为所述服务端从至少一个保存有标签数据的客户端获取得到的;
根据共有数据的标签数据,确定分割特征和分割值;
将分割特征和分割值发送给服务端,以使服务端在可信执行环境中,确定最佳分割特征和最佳分割值,形成分类树,并依据分类树,确定决策树。
可以有多个客户端与服务端进行交互,向服务端提供客户端本地包含的各项数据,各个客户端之间本地数据的数据属性可以相同也不可以不同,具体可以依据需求进行配置。客户端从服务端获取服务端下发的各客户端共有数据的标签数据,并确定当前客户端本地与其他客户端共有的数据与标签之间的对应关系,进而对共有数据的分割特征和分割值进行分析,确定分割特征和分割值,然后,客户端可以将分割特征和分割值上传给服务端,由服务端在可信执行环境中,分析多个客户端上传的分割特征和分割值,进而确定最佳分割特征和最佳分割值,形成分类树;服务端与客户端迭代多次之后,形成多颗分类树,进而形成决策树。
本方法的具体实施方式,与上述实施例的实施方式类似,此处不再赘述。
在一个可选的实施例中,如图3所示,基于隐私计算的隐私数据安全决策方法,包括:
获取待分析的目标对象的对象信息;
确定对象信息相关的计算节点,并将对象信息和决策树下发给计算节点,以使所述计算节点依据对象信息获取目标对象的待分析数据,并根据决策树确定节点分析结果;其中,所述决策树由分类树组成,所述分类树的最佳分割特征和最佳分割值通过多个计算节点上传的分割特征和分割值确定,计算节点上传的分割特征和分割值依据下发给计算节点的共有数据的标签数据确定;
获取计算节点上传的节点分析结果;
依据各计算节点上传的节点分析结果,确定目标对象的综合分析结果,并反馈。
本实施例中,目标对象可以是用户,对象信息可以是用户的属性信息,如用户为是自然人时,其属性为姓名、年龄、学历等,用户为法人或者相关机构时,其属性为该法人或者机构的统一社会征信号、注册资本、营业额、应纳税所得额等;计算节点可以是对用户的属性信息进行分析的终端,服务端通过获取用户提供的属性,确定其对应的终端,并对相关的终端下发用户属性信息和决策树;各个终端依据决策树进行分析,确定对用户属性分析的结果,并上传给服务端,服务端接收终端反馈的用户属性分析结果,并综合分析得到最终结果,例如自然人的成长指数,法人或机构的市场发展潜力等,用于评估个人的职业倾向,再就业方向,或企业或单位的发展方向等。
本方法的具体实施方式,与上述实施例的实施方式类似,此处不再赘述。
在一个可选的实施例中,如图4所示,基于隐私计算的金融隐私数据安全决策方法,包括:
获取待分析的用户的用户信息;
确定用户信息相关的金融机构,并将用户信息和决策树下发给金融机构,以使所述金融机构依据用户信息获取用户的待分析数据,并根据决策树确定用户分析结果;其中,所述决策树由分类树组成,所述分类树的最佳分割特征和最佳分割值通过多个金融机构上传的分割特征和分割值确定,金融机构上传的分割特征和分割值依据下发给金融机构的用户共有数据的标签数据确定;所述用户分析结果包括用户信用评价结果、和/或用户还贷能力评估、和/或贷款总额分析结果;
获取金融机构上传的用户分析结果;
依据各金融机构上传的用户分析结果,确定用户的综合分析结果,并反馈。
本申请实施例中,用户可以通过交互页面,输入姓名、身份证号等用户信息;服务端通过用户提供的姓名、身份证号等用户信息,确定相关的银行、社保中心等机构,并对相关的金融机构下发用户信息和决策树;各个金融机构依据决策树进行分析,确定用户分析结果,并上传给服务端,服务端接收银行、社保中心等机构反馈的用户分析结果,并综合分析得到最终结果,例如用户的综合购买能力、综合投资能力等,用于评估或推荐用户购买住房、投资金融产品等。
本方法的具体实施方式,与上述实施例的实施方式类似,此处不再赘述。
在一个可选的实施例中,如图5所示,基于隐私计算的隐私数据安全决策装置,包括共有数据确定模块、共有标签数据下发模块、分类树构建模块和决策树确定模块;
所述共有数据确定模块,用于确定多个客户端的共有数据,并获取共有数据的标签数据;
所述共有标签数据下发模块,用于下发共有数据的标签数据给客户端,以使客户端按照标签数据确定分割特征和分割值;
所述分类树构建模块,用于获取各个客户端上传的分割特征和分割值,并在可信执行环境中,确定最佳分割特征和最佳分割值,形成分类树;
所述决策树确定模块,依据分类树,确定决策树。
本方法的具体实施方式,与上述实施例的实施方式类似,此处不再赘述。
在一个可选的实施例中,基于隐私计算的隐私数据安全决策装置,应用于客户端,包括共有数据标签获取模块、分割信息确定模块、分割信息发送模块;
共有数据标签获取模块,用于获取服务端下发的共有数据的标签数据,所述标签数据为所述服务端从至少一个保存有标签数据的客户端获取得到的;
分割信息确定模块,根据共有数据的标签数据,确定分割特征和分割值;
分割信息发送模块,将分割特征和分割值发送给服务端,以使服务端在可信执行环境中,确定最佳分割特征和最佳分割值,形成分类树,并依据分类树,确定决策树。
本方法的具体实施方式,与上述实施例的实施方式类似,此处不再赘述。
在一个可选的实施例中,基于隐私计算的隐私数据安全决策装置,包括对象信息获取模块、对象信息下发模块、节点分析结果获取模块、综合分析结果确定模块;
对象信息获取模块,用于获取待分析的目标对象的对象信息;
对象信息下发模块,用于确定对象信息相关的计算节点,并将对象信息和决策树下发给计算节点,以使所述计算节点依据对象信息获取目标对象的待分析数据,并根据决策树确定节点分析结果;其中,所述决策树由分类树组成,所述分类树的最佳分割特征和最佳分割值通过多个计算节点上传的分割特征和分割值确定,计算节点上传的分割特征和分割值依据下发给计算节点的共有数据的标签数据确定;
节点分析结果获取模块,用于获取计算节点上传的节点分析结果;
综合分析结果确定模块,依据各计算节点上传的节点分析结果,确定目标对象的综合分析结果,并反馈。
本方法的具体实施方式,与上述实施例的实施方式类似,此处不再赘述。
在一个可选的实施例中,基于隐私计算的金融隐私数据安全决策方法,包括用户信息获取模块、用户信息及决策树下发模块、用户分析结果获取模块、用户综合分析结果获取模块;
用户信息获取模块,用于获取待分析的用户的用户信息;
用户信息及决策树下发模块,用于确定用户信息相关的金融机构,并将用户信息和决策树下发给金融机构,以使所述金融机构依据用户信息获取用户的待分析数据,并根据决策树确定用户分析结果;其中,所述决策树由分类树组成,所述分类树的最佳分割特征和最佳分割值通过多个金融机构上传的分割特征和分割值确定,金融机构上传的分割特征和分割值依据下发给金融机构的用户共有数据的标签数据确定;所述用户分析结果包括用户信用评价结果、和/或用户还贷能力评估、和/或贷款总额分析结果;
用户分析结果获取模块,用于获取金融机构上传的用户分析结果;
用户综合分析结果获取模块,依据各金融机构上传的用户分析结果,确定用户的综合分析结果,并反馈。
本方法的具体实施方式,与上述实施例的实施方式类似,此处不再赘述。
在一个可选的实施例中,如图6所示,基于隐私计算的隐私数据安全决策电子设备,包括存储器和一个或多个处理器,所述存储器中存储有可执行代码,所述一个或多个处理器执行所述可执行代码时,用于实现所述的一种隐私数据安全决策方法。本方法的具体实施方式,与上述实施例的实施方式类似,此处不再赘述。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的范围。

Claims (10)

1.基于隐私计算的隐私数据安全决策方法,应用于服务端,其特征在于,所述方法包括:
确定多个客户端的共有数据,并获取共有数据的标签数据;
下发标签数据给客户端,以使客户端按照标签数据确定分割特征和分割值;
获取各个客户端上传的分割特征和分割值,并在可信执行环境中,确定最佳分割特征和最佳分割值,形成分类树;
依据分类树,确定决策树。
2.根据权利要求1所述的基于隐私计算的隐私数据安全决策方法,其特征在于,所述方法还包括:
为用户端提供页面,页面中包含分割点设置控件;
基于在页面对分割点设置控件的触发,获取输入的分割特征和分割特征的分割集中值;
下发分割特征和分割特征的分割集中值给计算节点,以使计算节点确定分割特征和特征值;
接收分割特征和分割值。
3.根据权利要求1所述的基于隐私计算的隐私数据安全决策方法,其特征在于,所述共有数据的确定包括:
下发求交集指令给各个客户端,以使得客户端对客户端本地数据的第一序号进行混淆,形成第二序号,并确定第二序号与第一序号之间的映射关系,依据第二序号和客户端的本地数据的唯一标识确定第一数据,以采用各个计算节点的本地密钥,对第一数据进行多次加密得到的第二数据,以依据第二数据进行求交集;
获取各客户端的第二数据;
依据第二数据,确定各目标对象的共有数据;
记录共有数据的第二序号,以在训练决策树的过程中,下发共有数据的标签数据与第二序号之间的对应关系给客户端,以使得客户端依据第二序号与第一序号的映射关系,完成决策树的训练。
4.根据权利要求2所述的基于隐私计算的隐私数据安全决策方法,其特征在于,所述依据分类树,确定决策树,包括:
在分类树的数量超过第一阈值时,随机删除至少一个分类树。
5.根据权利要求4所述的基于隐私计算的隐私数据安全决策方法,其特征在于,所述随机删除至少一个分类树,包括从与人工设定的分割集中值无关的分类树中删除至少一个分类树。
6.基于隐私计算的隐私数据安全决策方法,应用于客户端,其特征在于,所述方法包括:
获取服务端下发的共有数据的标签数据,所述标签数据为所述服务端从至少一个保存有标签数据的客户端获取得到的;
根据共有数据的标签数据,确定分割特征和分割值;
将分割特征和分割值发送给服务端,以使服务端在可信执行环境中,确定最佳分割特征和最佳分割值,形成分类树,并依据分类树,确定决策树。
7.基于隐私计算的隐私数据安全决策方法,其特征在于,包括:
获取待分析的目标对象的对象信息;
确定对象信息相关的计算节点,并将对象信息和决策树下发给计算节点,以使所述计算节点依据对象信息获取目标对象的待分析数据,并根据决策树确定节点分析结果;其中,所述决策树由分类树组成,所述分类树的最佳分割特征和最佳分割值通过多个计算节点上传的分割特征和分割值确定,计算节点上传的分割特征和分割值依据下发给计算节点的共有数据的标签数据确定;
获取计算节点上传的节点分析结果;
依据各计算节点上传的节点分析结果,确定目标对象的综合分析结果,并反馈。
8.基于隐私计算的金融隐私数据安全决策方法,其特征在于,包括:
获取待分析的用户的用户信息;
确定用户信息相关的金融机构,并将用户信息和决策树下发给金融机构,以使所述金融机构依据用户信息获取用户的待分析数据,并根据决策树确定用户分析结果;其中,所述决策树由分类树组成,所述分类树的最佳分割特征和最佳分割值通过多个金融机构上传的分割特征和分割值确定,金融机构上传的分割特征和分割值依据下发给金融机构的用户共有数据的标签数据确定;所述用户分析结果包括用户信用评价结果、和/或用户还贷能力评估、和/或贷款总额分析结果;
获取金融机构上传的用户分析结果;
依据各金融机构上传的用户分析结果,确定用户的综合分析结果,并反馈。
9.基于隐私计算的隐私数据安全决策装置,包括共有数据确定模块、共有标签数据下发模块、分类树构建模块和决策树确定模块,其特征在于:
所述共有数据确定模块,用于确定多个客户端的共有数据,并获取共有数据的标签数据;
所述共有标签数据下发模块,用于下发共有数据的标签数据给客户端,以使客户端按照标签数据确定分割特征和分割值;
所述分类树构建模块,用于获取各个客户端上传的分割特征和分割值,并在可信执行环境中,确定最佳分割特征和最佳分割值,形成分类树;
所述决策树确定模块,依据分类树,确定决策树。
10.基于隐私计算的隐私数据安全决策电子设备,其特征在于,包括存储器和一个或多个处理器,所述存储器中存储有可执行代码,所述一个或多个处理器执行所述可执行代码时,用于实现权利要求1-7中任一项所述的一种隐私数据安全决策方法。
CN202211108597.2A 2022-09-13 2022-09-13 基于隐私计算的金融隐私数据安全决策方法、装置及设备 Pending CN115525922A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211108597.2A CN115525922A (zh) 2022-09-13 2022-09-13 基于隐私计算的金融隐私数据安全决策方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211108597.2A CN115525922A (zh) 2022-09-13 2022-09-13 基于隐私计算的金融隐私数据安全决策方法、装置及设备

Publications (1)

Publication Number Publication Date
CN115525922A true CN115525922A (zh) 2022-12-27

Family

ID=84698053

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211108597.2A Pending CN115525922A (zh) 2022-09-13 2022-09-13 基于隐私计算的金融隐私数据安全决策方法、装置及设备

Country Status (1)

Country Link
CN (1) CN115525922A (zh)

Similar Documents

Publication Publication Date Title
CN110990871B (zh) 基于人工智能的机器学习模型训练方法、预测方法及装置
CN110084377B (zh) 用于构建决策树的方法和装置
US11455587B2 (en) Continuous and anonymous risk evaluation
CN110729028A (zh) 一种健康数据处理方法、装置、电子设备及存储介质
CN113361962A (zh) 基于区块链网络识别企业风险性的方法及装置
CN117314424B (zh) 面向金融大数据的区块链交易系统及方法
CN113034145A (zh) 用户异常加密数字资产交易类别判断方法、装置
CN114186275A (zh) 隐私保护方法、装置、计算机设备及存储介质
CN111861716B (zh) 一种基于软件系统的贷中监控预警等级生成方法
CN115186973A (zh) 一种基于多平台联合建模的授信额度评定方法及级联系统
CN114971841A (zh) 风险管理方法、风险模型训练方法、装置、设备和介质
CN112702410B (zh) 一种基于区块链网络的评估系统、方法及相关设备
CN109785145A (zh) 基于区块链的定点药店融资方法、存储介质及计算机设备
CN112801780A (zh) 基于联邦学习的境内外风险客户识别方法、装置及系统
CN111583005A (zh) 一种基于区块链的涉税信用管理方法
CN113269179B (zh) 数据处理方法、装置、设备及存储介质
CN115525922A (zh) 基于隐私计算的金融隐私数据安全决策方法、装置及设备
CN115600226A (zh) 一种仓单质押数据加密方法
Misra et al. Artificial intelligence for cyber security: methods, issues and possible horizons or opportunities
Vistro et al. Fraud prevention in taxation system of Pakistan using blockchain technology
CN113657611A (zh) 联合更新模型的方法及装置
Dangi Secured multi-party data release on cloud for big data privacy-preserving using fusion learning
KR102437715B1 (ko) 데이터 분산처리 장치 및 이의 동작방법
US20230245139A1 (en) Graph-based techniques for detecting synthetic online identities
CN117788175A (zh) 一种优化的提升保险智能核保效率的方法、系统和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination