CN112597542B - 目标资产数据的聚合方法及装置、存储介质、电子装置 - Google Patents

目标资产数据的聚合方法及装置、存储介质、电子装置 Download PDF

Info

Publication number
CN112597542B
CN112597542B CN202011407574.2A CN202011407574A CN112597542B CN 112597542 B CN112597542 B CN 112597542B CN 202011407574 A CN202011407574 A CN 202011407574A CN 112597542 B CN112597542 B CN 112597542B
Authority
CN
China
Prior art keywords
data
target
asset
target objects
encrypted data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011407574.2A
Other languages
English (en)
Other versions
CN112597542A (zh
Inventor
李钰
王鹏
凌立
田江
向小佳
丁永建
李璠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Everbright Technology Co ltd
Original Assignee
Everbright Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Everbright Technology Co ltd filed Critical Everbright Technology Co ltd
Priority to CN202011407574.2A priority Critical patent/CN112597542B/zh
Publication of CN112597542A publication Critical patent/CN112597542A/zh
Application granted granted Critical
Publication of CN112597542B publication Critical patent/CN112597542B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/64Protecting data integrity, e.g. using checksums, certificates or signatures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Security & Cryptography (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioethics (AREA)
  • Computer Hardware Design (AREA)
  • Medical Informatics (AREA)
  • Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Accounting & Taxation (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Storage Device Security (AREA)

Abstract

本发明提供了一种目标资产数据的聚合方法及装置、存储介质、电子装置,其中,上述方法包括:根据获取的加密参数对多个第一目标对象的目标资产数据进行加密,以得到多个第一目标对象对应的多组加密数据,多个第一目标对象分别保存有第二目标对象的资产数据;通过联邦学习模型对多组加密数据执行目标运算,以得到多组加密数据的多个数据碎片;根据多个数据碎片聚合出多个第一目标对象的资产总和,并将资产总和作为第二目标对象的总资产数据,即过联邦学习模型将加密后的资产数据进行运算,转换为数据碎片进行共享和聚合,采用上述技术方案,解决了相关技术中,目标对象的资产数据存在泄露的风险,以及上传的资产数据不符合监管要求等问题。

Description

目标资产数据的聚合方法及装置、存储介质、电子装置
技术领域
本发明涉及通信领域,具体而言,涉及一种目标资产数据的聚合方法及装置、存储介质、电子装置。
背景技术
大型金融控股集团的用户资产数据通常分布于不同业务场景中,例如一个用户在金控集团的银行、证券、保险、信托等业务中有不同的资产值。如何将用户数据聚合是一个重要的问题,对用户的资产聚合,可以有效为用户提供个性化服务,进行整体营销。但是在聚合数据过程中,如果攻击者获得用户数据,可以推断用户的生活习惯、家庭状况等隐私信息,危害用户人身财产安全。同时,国家逐步出台相关政策法规,加强对金融领域监管,加大对个人金融数据隐私的保护力度。
相关技术中,对于用户的资产聚合问题是基于第三方可信设计的,但是由于可信第三方不仅能获得解密后的聚合数据而且可以得到各子公司的加密数据,当第三方产生恶意变得不可信时,存在隐私泄露风险,并且建立安全信道进行参数分发可能带来额外开销,当有较大用户数据量时,引入可信第三方有较多不变,此外,将子公司直接将数据传输到数据中心的方式不符合监管要求。
针对相关技术中,目标对象的资产数据存在泄露的风险,以及上传的资产数据不符合监管要求等问题,尚未提出有效的技术方案。
发明内容
本发明实施例提供了一种目标资产数据的聚合方法及装置、存储介质、电子装置,以至少解决相关技术中,目标对象的资产数据存在泄露的风险,以及上传的资产数据不符合监管要求等问题。
根据本发明的一个实施例,提供了一种目标资产数据的聚合方法,包括:根据获取的加密参数对多个第一目标对象的目标资产数据进行加密,以得到所述多个第一目标对象对应的多组加密数据,所述多个第一目标对象分别保存有第二目标对象的资产数据;通过联邦学习模型对所述多组加密数据执行目标运算,以得到所述多组加密数据的多个数据碎片;根据所述多个数据碎片聚合出多个第一目标对象的资产总和,并将所述资产总和作为所述第二目标对象的总资产数据。
可选地,根据获取的加密参数对多个第一目标对象的目标资产数据进行加密,以得到所述多个第一目标对象对应的多组加密数据,包括:获取所述第二目标对象发送联邦学习模型的所述加密参数,其中,所述加密参数通过目标条件以及预设条件生成,所述目标条件用于指示所述加密参数需要满足的规则,所述预设条件用于指示根据所述规则生成的目标函数;根据获取的加密参数对多个第一目标对象的目标资产数据进行加密,以得到所述多个第一目标对象对应的多组加密数据。
可选地,通过联邦学习模型对所述多组加密数据执行目标运算,以得到所述多组加密数据的多个数据碎片,包括:将所述多组加密数据输入到所述联邦学习模型中;通过所述联邦学习模型中的目标运算对所述多组加密数据进行转换,其中,所述目标运算包括:门限秘密共享方式;在转换成功的情况下,得到多个所述第一目标对象的多组加密数据所对应的多个数据碎片。
可选地,在转换成功的情况下,得到多个所述第一目标对象的多组加密数据所对应的多个数据碎片之后,所述方法还包括:将多个数据碎片中的部分数据碎片发送至第三目标对象进行数据共享,以指示第三目标对象在在所述部分数据碎片满足预设阈值的情况下,对接收到的所述部分数据碎片进行重构,其中,所述预设阈值用于确定部分数据碎片的数量是否支持重构。
可选地,根据所述多个数据碎片聚合出多个第一目标对象的资产总和,并将所述资产总和作为所述第二目标对象的总资产数据,包括:通过拉格朗日插值公式对所述多组加密数据的多个数据碎片进行重构,得到重构结果;根据所述重构结果聚合所述多个第一目标对象的资产总和。
可选地,根据所述重构结果聚合所述多个第一目标对象的资产总和,包括:通过所述拉格朗日插值公式对所述多个数据碎片进行处理,得到多个结果,其中,所述重构结果包括:所述多个结果;将所述多个结果进行加权求和,将加权求和的结果作为所述多个第一目标对象的资产总和。
根据本发明的一个实施例,提供了一种目标资产数据的聚合装置,包括:加密模块,用于根据获取的加密参数对多个第一目标对象的目标资产数据进行加密,以得到所述多个第一目标对象对应的多组加密数据,所述多个第一目标对象分别保存有第二目标对象的资产数据;运算模块,用于通过联邦学习模型对所述多组加密数据执行目标运算,以得到所述多组加密数据的多个数据碎片;聚合模块,用于根据所述多个数据碎片聚合出多个第一目标对象的资产总和,并将所述资产总和作为所述第二目标对象的总资产数据。
可选地,上述加密模块,还用于获取所述第二目标对象发送联邦学习模型的所述加密参数,其中,所述加密参数通过目标条件以及预设条件生成,所述目标条件用于指示所述加密参数需要满足的规则,所述预设条件用于指示根据所述规则生成的目标函数;根据获取的加密参数对多个第一目标对象的目标资产数据进行加密,以得到所述多个第一目标对象对应的多组加密数据。
可选地,上述运算模块,还用于将所述多组加密数据输入到所述联邦学习模型中;通过所述联邦学习模型中的目标运算对所述多组加密数据进行转换,其中,所述目标运算包括:门限秘密共享方式;在转换成功的情况下,得到多个所述第一目标对象的多组加密数据所对应的多个数据碎片。
可选地,上述装置还包括:共享模块,用于将多个数据碎片中的部分数据碎片发送至第三目标对象进行数据共享,以指示第三目标对象在在所述部分数据碎片满足预设阈值的情况下,对接收到的所述部分数据碎片进行重构,其中,所述预设阈值用于确定部分数据碎片的数量是否支持重构。
可选地,上述聚合模块,还用于通过拉格朗日插值公式对所述多组加密数据的多个数据碎片进行重构,得到重构结果;根据所述重构结果聚合所述多个第一目标对象的资产总和。
可选地,上述聚合模块,还用于通过所述拉格朗日插值公式对所述多个数据碎片进行处理,得到多个结果,其中,所述重构结果包括:所述多个结果;将所述多个结果进行加权求和,将加权求和的结果作为所述多个第一目标对象的资产总和。
根据本发明的另一个实施例,还提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
根据本发明的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
通过本发明,根据获取的加密参数对多个第一目标对象的目标资产数据进行加密,以得到所述多个第一目标对象对应的多组加密数据,所述多个第一目标对象分别保存有第二目标对象的资产数据;通过联邦学习模型对所述多组加密数据执行目标运算,以得到所述多组加密数据的多个数据碎片;根据所述多个数据碎片聚合出多个第一目标对象的资产总和,并将所述资产总和作为所述第二目标对象的总资产数据,即过联邦学习模型将加密后的资产数据进行运算,转换为数据碎片进行共享和聚合,采用上述技术方案,解决了相关技术中,目标对象的资产数据存在泄露的风险,以及上传的资产数据不符合监管要求,通过联邦学习模型以及加密参数的处理,进而使得目标对象的资产数据减少了暴露的风险,保证了上传数据的完整性,防止了使用虚假加密参数的不诚实目标对象的参与,并进一步的确保了数据中心对于总资产数据的获取。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明实施例的一种目标资产数据的聚合方法的计算机终端的硬件结构框图;
图2是根据本发明实施例的目标资产数据的聚合方法的流程图;
图3是根据本发明可选实施例的基于联邦学习技术的多方隐私数据安全求和方法的流程图;
图4是根据本发明可选实施例的子公司间参数分享的示意图(一);
图5是根据本发明可选实施例的子公司间参数分享的示意图(二);
图6是根据本发明可选实施例的Guest方数据收集的示意图;
图7是根据本发明可选实施例的Fate联邦学习模型框架的架构示意图;
图8是根据本发明可选实施例的三个机构间利用可验证秘密共享进行资产值求和的信息交互示意图;
图9是根据本发明可选实施例的在FATE平台上Guest方的任务阶段的流程示意图;
图10是根据本发明实施例的目标资产数据的聚合装置的结构框图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
本申请实施例所提供的方法实施例可以在计算机终端或者类似的运算装置中执行。以运行在计算机终端上为例,图1是本发明实施例的一种目标资产数据的聚合方法的计算机终端的硬件结构框图。如图1所示,计算机终端10可以包括一个或多个(图中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输装置106。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的目标资产数据的聚合方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
本发明实施例提供了一种目标资产数据的聚合方法,应用于上述计算机终端中,图2是根据本发明实施例的目标资产数据的聚合方法的流程图,如图2所示,该流程包括如下步骤:
步骤S202,根据获取的加密参数对多个第一目标对象的目标资产数据进行加密,以得到所述多个第一目标对象对应的多组加密数据,所述多个第一目标对象分别保存有第二目标对象的资产数据;
步骤S204,通过联邦学习模型对所述多组加密数据执行目标运算,以得到所述多组加密数据的多个数据碎片;
步骤S206,根据所述多个数据碎片聚合出多个第一目标对象的资产总和,并将所述资产总和作为所述第二目标对象的总资产数据。
通过上述步骤,根据获取的加密参数对多个第一目标对象的目标资产数据进行加密,以得到所述多个第一目标对象对应的多组加密数据,所述多个第一目标对象分别保存有第二目标对象的资产数据;通过联邦学习模型对所述多组加密数据执行目标运算,以得到所述多组加密数据的多个数据碎片;根据所述多个数据碎片聚合出多个第一目标对象的资产总和,并将所述资产总和作为所述第二目标对象的总资产数据,即过联邦学习模型将加密后的资产数据进行运算,转换为数据碎片进行共享和聚合,采用上述技术方案,解决了相关技术中,目标对象的资产数据存在泄露的风险,以及上传的资产数据不符合监管要求,通过联邦学习模型以及加密参数的处理,进而使得目标对象的资产数据减少了暴露的风险,保证了上传数据的完整性,防止了使用虚假加密参数的不诚实目标对象的参与,并进一步的确保了数据中心对于总资产数据的获取。
步骤S202中的对于结构化数据的处理有多种实现方式,可选地,获取所述第二目标对象发送联邦学习模型的所述加密参数,其中,所述加密参数通过目标条件以及预设条件生成,所述目标条件用于指示所述加密参数需要满足的规则,所述预设条件用于指示根据所述规则生成的目标函数;根据获取的加密参数对多个第一目标对象的目标资产数据进行加密,以得到所述多个第一目标对象对应的多组加密数据。
例如,一个总的集团公司(相当于本发明实施例中的第二目标对象)下属多家子公司(相当于本发明实施例中的第一目标对象),资产数据保存在同一联邦学习模型下,在进行资产数据加密时,可以通过集团下发的联邦学习模型对应的加密参数对子公司中的目标资产数据进行加密,也可以在不引入可信的第三方的情况下,各子公司自行协商在联邦学习模型下的加密参数,进而使目标资产数据不被暴露。并且为了保证加密参数的安全性,在经过协商确定加密参数时,需要在参数满足目标条件和预设条件的情况下才会被确定为加密参数,目标条件用于表示加密参数需要满足的安全参数的规则,而预设条件是在确定加密参数的安全参数的规则后确的加参数对应的目标资产数据的安全处理函数,进而在根据获取的加密参数对多个第一目标对象的目标资产数据进行加密,以得到多个第一目标对象对应的多组加密数据。
可选地,通过联邦学习模型对所述多组加密数据执行目标运算,以得到所述多组加密数据的多个数据碎片,包括:将所述多组加密数据输入到所述联邦学习模型中;通过所述联邦学习模型中的目标运算对所述多组加密数据进行转换,其中,所述目标运算包括:门限秘密共享方式;在转换成功的情况下,得到多个所述第一目标对象的多组加密数据所对应的多个数据碎片。
简而言之,为了确保加密后的多组加密数据的可以被加密共享,通过联邦学习模型中的目标运算对多组加密数据进行转换得到多个第一目标对象的多组加密数据所对应的多个数据碎片。
可选地,在转换成功的情况下,得到多个所述第一目标对象的多组加密数据所对应的多个数据碎片之后,所述方法还包括:将多个数据碎片中的部分数据碎片发送至第三目标对象进行数据共享,以指示第三目标对象在在所述部分数据碎片满足预设阈值的情况下,对接收到的所述部分数据碎片进行重构,其中,所述预设阈值用于确定部分数据碎片的数量是否支持重构。
例如,当加密数据共享任务发起后,任一子公司Sk采用Shamir算法的(n,n)门限秘密共享方案将用户个人金融数据(相当于本发明实施例中的第一目标对象的目标资产数据)dk分享给其他子公司(相当于本发明中的第三目标对象)(i≠k),具体流程如下:Sk在安全处理函数Zq中随机选择n-1个多项式pk(x)的系数,满足pk(0)=dk;Sk将dk随机生成n个经过密钥处理用户个人金融数据的子秘密值,通过联邦学习模型中负责通信的rollsite模块发送给其他子公司,其中第i个值表示为mi,每个子公司获得其中一个随机子秘密值。Sk为自己保存mk;Sk将生成的随机子秘密值mki依次发送给/>(i≠k);当Sk收到来自其他子公司的(n-1)个子秘密值/>将其保留的mk与接收到的数据碎片/>求和,得到/>因为Shamir的秘密共享方案具有同态特性,在满足预设阈值/>的情况下,可以重构多项式/>
可选地,根据所述多个数据碎片聚合出多个第一目标对象的资产总和,并将所述资产总和作为所述第二目标对象的总资产数据,包括:通过拉格朗日插值公式对所述多组加密数据的多个数据碎片进行重构,得到重构结果;根据所述重构结果聚合所述多个第一目标对象的资产总和。
可选地,根据所述重构结果聚合所述多个第一目标对象的资产总和,包括:通过所述拉格朗日插值公式对所述多个数据碎片进行处理,得到多个结果,其中,所述重构结果包括:所述多个结果;将所述多个结果进行加权求和,将加权求和的结果作为所述多个第一目标对象的资产总和。
简而言之,在确定第二目标对象的总资产数据时,通过拉格朗日插值公式对多组加密数据的多个数据碎片进行重构,根据重构结果对多个第一目标对象的目标资产数据进行聚合得到多个第一目标对象的资产总和,进一步的将多个结果进行加权求和,得出多个第一目标对象的资产总和即第二目标对象的总资产数据。
需要说明的是,上述目标资产数据为用户或者公司的部分资金情况,第一目标对象是金融机构、公司、房产等保存了用户或公司部分资产的机构,第二目标对象可以是用户或者公司,进而可以在通过加密参数加密后再保证资产信息安全的情况下,实现用户或者公司的资产数据统计,以上均是为了便于理解本发明实施例做出的示例,本发明实施例对此不做过多限定。
为了更好的理解上述目标资产数据的聚合流程,以下结合可选实施例进行说明,但不用于限定本发明实施例的技术方案。
本发明提出一种基于联邦学习技术的多方隐私数据安全求和方法。在不引入可信第三方的情况下,各子公司自行协商计算参数,不暴露用户个人金融数据,继而保护用户个人金融数据隐私,在整个协议过程中,由于数据已进行加密,使得半诚实参与者无法推算出其他子公司提供的用户个人金融数据,保证上报数据的完整性,而数据中心可进行相关计算后获得完整的用户资产总和。具体流程分为三个阶段,如图3所示,具体如下:
步骤S302,系统初始化,一个总的集团公司(相当于本发明实施例中的第二目标对象)下属多家子公司(相当于本发明实施例中的第一目标对象),各个子公司作为联邦学习模型的数据提供者方Host参与隐私数据聚合任务,Si将用户个人金融数据(相当于本发明实施例中的第一目标对象的目标资产数据)加载到联邦学习模型框架下的本地数据存储中记为Xi,集团公司作为联邦学习模型的数据应用方guest,可以作为任务发布者和数消费者来发起聚合任务,Guest给定安全参数O,Guest生成一个素数P及其生成元g,令G表示阶为p的循环群,P和g之间的关系满足gn mod P,n=1,2,3,…,P-1的取值恰好组成1,2,3,…,P-1,进而得到两个大素数P,Q,满足|P|=O且Q|(P-1),结合Guest选择3个安全Hash函数H0:{0,1}*→Zq,H1,H2:Zp→G,Guest一方经发布系统参数(相当于本发明实施例中的加密参数)Param=(G,g,H0,H1,H2)。
步骤S304,秘密分享,当任务发起后任一子公司Sk采用Shamir的(n,n)门限秘密共享方案将用户个人金融数据dk分享给其他子公司(i≠k),具体流程如下:
步骤一、Sk在Zq中随机选择n-1个多项式pk(x)的系数,满足pk(0)=dk
步骤二、Sk将dk随机生成n个经过密钥处理用户个人金融数据的子秘密值,通过联邦学习rollsite模块发送给其他子公司,其中第i个值表示为mi,每个子公司获得其中一个随机子秘密值;
步骤三、Sk为自己保存mk
步骤四、Sk将生成的随机子秘密值mki依次发送给(i≠k),如图4、5所示,为子公司间参数分享示意图;
步骤五、当Sk收到来自其他子公司的(n-1)个随机子秘密值将其保留的mk与接收到的/>求和,得到/>因为Shamir的秘密共享方案具有同态特性,因此可以利用/>重建多项式/>
步骤S304,数据聚合,Guest方通过联邦学习模型的负责通信的rollsite模块收集各个host的和C(Sk),如图6所示,为Guest方数据收集示意图,进一步的,通过拉格朗日插值公式重构进而求得各个子公司提供的用户资产之和,记为/>
需要说明的是,本发明可选实施例选择Fate联邦学习模型框架,通过架构如图7所示的联邦学习模型实现作业同步,数据存储,加密数据传输等任务。
例如,在实际场景应用中以三个机构间利用可验证秘密共享进行资产值求和为例,三个机构中想要得到资产和的一方为数据的应用方(Guest),其余提供目标对象在本机构内资产值的一方作为数据的提供方(Host),期间的信息交互如图8所示:
首先,Guest生成一个素数P及其生成元g,P和g之间的关系满足gn mod P,n=1,2,3,…,P-1的取值恰好组成1,2,3,…,P-1,广播P,g。三方中每一方根据参与方个数n生成一个n-1次多项式,其中a0,b0,c0是各方的资产值,a1,…,an-1,b1,…,bn-1,c1…,cn-1则是随机数;
f1(x)=a0+a1x+a2x2+…+an-1xn-1
f2(x)=b0+b1x+b2x2+…+bn-1xn-1
f3(x)=c0+c1x+c2x2+…+cn-1xn-1
其次,各方均计算子秘密:
以及验证信息/>
然后,每一方广播验证信息,并将第j个子秘密分享给第j个参与方,分享的分片形式为(x,f(x)mod P),为防止发送错误的子秘密值,接收方j利用生成元g对收到的子秘密进行验证,正常情况下接收方可以验证成立,满足加法同态。验证通过后对收到的所有子秘密求和,如:第1个参与方收到各方x=1上的子秘密(1,f1(1)mod P),(1,f2(1)mod P),(1,f3(1)mod P),将子秘密求和得到(1,f1(1)+f2(1)+f3(1)modP)。每个参与方只能得到其他参与方一个子秘密,无法还原出其他方真实数据。
最后,Guest汇总所有子秘密和(x,Sum(x)),Sum(x)=(a0+b0+c0)+(a1+b1+c1)x+(a2+b2+c2)x2;由于多项式具有加法同态,这些子秘密和就代表了Sum(x)上的点,利用拉格朗日插值定理就可以还原出唯一的Sum(x),其中参数a0+b0+c0就是想要得到的目标对象资产总和并且Guest仅得到了Sum(x)上的n个点,而没有得到足够的任意其他参与方生成的多项式上的点,因此无法还原出其他参与方的多项式,进而保证Guest无法得知其他参与方确切的目标对象资产值,这就意味着在没有暴露目标对象在任意机构资产值的前提下,通过联邦统计的模式到正确目标对象资产总和,满足了隐私求和的需要。
在FATE平台上具体的实现流程如图9所示,分为初始化、秘密分发、秘密求和、秘密恢复四个阶段。Guest作为发起方,不仅承担普通参与方的职责,还负责执行初始化和秘密恢复两个阶段的任务。
此外,采用其他联邦学习框架例如谷歌Federated Learning框架也可完成上述任务,本发明对此不做过多限定。
通过本发明可选实施例,大型金控集团中利用联邦学习技术,各子公司作为数据提供者host通过密钥分享的思想,在不上传本地数据的前提下,将隐私数据拆解为多个部分,通过联邦学习在子公司之间分享数据计算过程中的参数,最终在联邦学习任务发布者和数据消费者guest一端聚合数据,实现多方隐私数据安全加和,进而保护用户个人金融数据隐私。
此外,由于子公司的用户数据保留在本地,不上传用户个人金融数据只上传数据计算过程中的参数,金控集团在不访问子公司用户个人金融数据的前提下,得到用户资产总和,且无法通过数据公式推断出,任一子公司数据;并由于无需可信第三方,排除第三方作恶导致用户数据隐私泄露的风险,还排除了半诚实模型下子公司通过合谋的方式推断出第三方数据的可能。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例的方法。
在本实施例中还提供了一种目标资产数据的聚合装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图10是根据本发明实施例的目标资产数据的聚合装置的结构框图,如图10所示,该装置包括:
加密模块82,用于根据获取的加密参数对多个第一目标对象的目标资产数据进行加密,以得到所述多个第一目标对象对应的多组加密数据,所述多个第一目标对象分别保存有第二目标对象的资产数据;
运算模块84,用于通过联邦学习模型对所述多组加密数据执行目标运算,以得到所述多组加密数据的多个数据碎片;
聚合模块86,用于根据所述多个数据碎片聚合出多个第一目标对象的资产总和,并将所述资产总和作为所述第二目标对象的总资产数据。
通过上述装置,根据获取的加密参数对多个第一目标对象的目标资产数据进行加密,以得到所述多个第一目标对象对应的多组加密数据,所述多个第一目标对象分别保存有第二目标对象的资产数据;通过联邦学习模型对所述多组加密数据执行目标运算,以得到所述多组加密数据的多个数据碎片;根据所述多个数据碎片聚合出多个第一目标对象的资产总和,并将所述资产总和作为所述第二目标对象的总资产数据,即过联邦学习模型将加密后的资产数据进行运算,转换为数据碎片进行共享和聚合,采用上述技术方案,解决了相关技术中,目标对象的资产数据存在泄露的风险,以及上传的资产数据不符合监管要求,通过联邦学习模型以及加密参数的处理,进而使得目标对象的资产数据减少了暴露的风险,保证了上传数据的完整性,防止了使用虚假加密参数的不诚实目标对象的参与,并进一步的确保了数据中心对于总资产数据的获取。
可选地,上述加密模块,还用于获取所述第二目标对象发送联邦学习模型的所述加密参数,其中,所述加密参数通过目标条件以及预设条件生成,所述目标条件用于指示所述加密参数需要满足的规则,所述预设条件用于指示根据所述规则生成的目标函数;根据获取的加密参数对多个第一目标对象的目标资产数据进行加密,以得到所述多个第一目标对象对应的多组加密数据。
例如,一个总的集团公司(相当于本发明实施例中的第二目标对象)下属多家子公司(相当于本发明实施例中的第一目标对象),资产数据保存在同一联邦学习模型下,在进行资产数据加密时,可以通过集团下发的联邦学习模型对应的加密参数对子公司中的目标资产数据进行加密,也可以在不引入可信的第三方的情况下,各子公司自行协商在联邦学习模型下的加密参数,进而使目标资产数据不被暴露。并且为了保证加密参数的安全性,在经过协商确定加密参数时,需要在参数满足目标条件和预设条件的情况下才会被确定为加密参数,目标条件用于表示加密参数需要满足的安全参数的规则,而预设条件是在确定加密参数的安全参数的规则后确的加参数对应的目标资产数据的安全处理函数,进而在根据获取的加密参数对多个第一目标对象的目标资产数据进行加密,以得到多个第一目标对象对应的多组加密数据。
可选地,上述运算模块,还用于将所述多组加密数据输入到所述联邦学习模型中;通过所述联邦学习模型中的目标运算对所述多组加密数据进行转换,其中,所述目标运算包括:门限秘密共享方式;在转换成功的情况下,得到多个所述第一目标对象的多组加密数据所对应的多个数据碎片。
简而言之,为了确保加密后的多组加密数据的可以被加密共享,通过联邦学习模型中的目标运算对多组加密数据进行转换得到多个第一目标对象的多组加密数据所对应的多个数据碎片。
可选地,上述装置还包括:共享模块,用于将多个数据碎片中的部分数据碎片发送至第三目标对象进行数据共享,以指示第三目标对象在在所述部分数据碎片满足预设阈值的情况下,对接收到的所述部分数据碎片进行重构,其中,所述预设阈值用于确定部分数据碎片的数量是否支持重构。
例如,当加密数据共享任务发起后,任一子公司Sk采用Shamir算法的(n,n)门限秘密共享方案将用户个人金融数据(相当于本发明实施例中的第一目标对象的目标资产数据)dk分享给其他子公司(相当于本发明中的第三目标对象)(i≠k),具体流程如下:Sk在安全处理函数Zq中随机选择n-1个多项式pk(x)的系数,满足pk(0)=dk;Sk将dk随机生成n个值通过联邦学习模型中负责通信的rollsite模块发送给其他子公司,其中第i个值表示为mi,每个子公司获得其中一个随机值。Sk为自己保存mk;Sk将生成的随机值mki依次发送给(i≠k);当Sk收到来自其他子公司的(n-1)个随机数/>将其保留的mk与接收到的数据碎片/>求和,得到/>因为Shamir的秘密共享方案具有同态特性,在满足预设阈值/>的情况下,可以重构多项式/>
可选地,上述聚合模块,还用于通过拉格朗日插值公式对所述多组加密数据的多个数据碎片进行重构,得到重构结果;根据所述重构结果聚合所述多个第一目标对象的资产总和。
可选地,上述聚合模块,还用于通过所述拉格朗日插值公式对所述多个数据碎片进行处理,得到多个结果,其中,所述重构结果包括:所述多个结果;将所述多个结果进行加权求和,将加权求和的结果作为所述多个第一目标对象的资产总和。
简而言之,在确定第二目标对象的总资产数据时,通过拉格朗日插值公式对多组加密数据的多个数据碎片进行重构,根据重构结果对多个第一目标对象的目标资产数据进行聚合得到多个第一目标对象的资产总和,进一步的将多个结果进行加权求和,得出多个第一目标对象的资产总和即第二目标对象的总资产数据。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
本发明的实施例还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
在一个示例性实施例中,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1、根据获取的加密参数对多个第一目标对象的目标资产数据进行加密,以得到所述多个第一目标对象对应的多组加密数据,所述多个第一目标对象分别保存有第二目标对象的资产数据;
S2、通过联邦学习模型对所述多组加密数据执行目标运算,以得到所述多组加密数据的多个数据碎片;
S3、根据所述多个数据碎片聚合出多个第一目标对象的资产总和,并将所述资产总和作为所述第二目标对象的总资产数据。
本发明的实施例还提供了一种存储介质,该存储介质包括存储的程序,其中,上述程序运行时执行上述任一项的方法。
本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1、根据获取的加密参数对多个第一目标对象的目标资产数据进行加密,以得到所述多个第一目标对象对应的多组加密数据,所述多个第一目标对象分别保存有第二目标对象的资产数据;
S2、通过联邦学习模型对所述多组加密数据执行目标运算,以得到所述多组加密数据的多个数据碎片;
S3、根据所述多个数据碎片聚合出多个第一目标对象的资产总和,并将所述资产总和作为所述第二目标对象的总资产数据。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的源则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种目标资产数据的聚合方法,其特征在于,包括:
根据获取的加密参数对多个第一目标对象的目标资产数据进行加密,以得到所述多个第一目标对象对应的多组加密数据,所述多个第一目标对象分别保存有第二目标对象的资产数据;
通过联邦学习模型对所述多组加密数据执行目标运算,以得到所述多组加密数据的多个数据碎片;
根据所述多个数据碎片聚合出多个第一目标对象的资产总和,并将所述资产总和作为所述第二目标对象的总资产数据;
其中,所述通过联邦学习模型对所述多组加密数据执行目标运算,以得到所述多组加密数据的多个数据碎片,包括:
将所述多组加密数据输入到所述联邦学习模型中;
通过所述联邦学习模型中的目标运算对所述多组加密数据进行转换,其中,所述目标运算包括:门限秘密共享方式;
在转换成功的情况下,得到多个所述第一目标对象的多组加密数据所对应的多个数据碎片;
其中,所述根据所述多个数据碎片聚合出多个第一目标对象的资产总和,并将所述资产总和作为所述第二目标对象的总资产数据,包括:
通过拉格朗日插值公式对所述多组加密数据的多个数据碎片进行重构,得到重构结果;
根据所述重构结果聚合所述多个第一目标对象的资产总和。
2.根据权利要求1所述的方法,其特征在于,根据获取的加密参数对多个第一目标对象的目标资产数据进行加密,以得到所述多个第一目标对象对应的多组加密数据,包括:
获取所述第二目标对象发送联邦学习模型的所述加密参数,其中,所述加密参数通过目标条件以及预设条件生成,所述目标条件用于指示所述加密参数需要满足的规则,所述预设条件用于指示根据所述规则生成的目标函数;
根据获取的加密参数对多个第一目标对象的目标资产数据进行加密,以得到所述多个第一目标对象对应的多组加密数据。
3.根据权利要求1所述的方法,其特征在于,在转换成功的情况下,得到多个所述第一目标对象的多组加密数据所对应的多个数据碎片之后,所述方法还包括:
将多个数据碎片中的部分数据碎片发送至第三目标对象进行数据共享,以指示第三目标对象在在所述部分数据碎片满足预设阈值的情况下,对接收到的所述部分数据碎片进行重构,其中,所述预设阈值用于确定部分数据碎片的数量是否支持重构。
4.根据权利要求1所述的方法,其特征在于,根据所述重构结果聚合所述多个第一目标对象的资产总和,包括:
通过所述拉格朗日插值公式对所述多个数据碎片进行处理,得到多个结果,其中,所述重构结果包括:所述多个结果;
将所述多个结果进行加权求和,将加权求和的结果作为所述多个第一目标对象的资产总和。
5.一种目标资产数据的聚合装置,其特征在于,包括:
加密模块,用于根据获取的加密参数对多个第一目标对象的目标资产数据进行加密,以得到所述多个第一目标对象对应的多组加密数据,所述多个第一目标对象分别保存有第二目标对象的资产数据;
运算模块,用于通过联邦学习模型对所述多组加密数据执行目标运算,以得到所述多组加密数据的多个数据碎片;
聚合模块,用于根据所述多个数据碎片聚合出多个第一目标对象的资产总和,并将所述资产总和作为所述第二目标对象的总资产数据;
所述运算模块,还用于将所述多组加密数据输入到所述联邦学习模型中;通过所述联邦学习模型中的目标运算对所述多组加密数据进行转换,其中,所述目标运算包括:门限秘密共享方式;在转换成功的情况下,得到多个所述第一目标对象的多组加密数据所对应的多个数据碎片;
所述聚合模块,还用于通过拉格朗日插值公式对所述多组加密数据的多个数据碎片进行重构,得到重构结果;根据所述重构结果聚合所述多个第一目标对象的资产总和。
6.根据权利要求5所述的装置,其特征在于,所述加密模块,还用于获取所述第二目标对象发送联邦学习模型的所述加密参数,其中,所述加密参数通过目标条件以及预设条件生成,所述目标条件用于指示所述加密参数需要满足的规则,所述预设条件用于指示根据所述规则生成的目标函数;根据获取的加密参数对多个第一目标对象的目标资产数据进行加密,以得到所述多个第一目标对象对应的多组加密数据。
7.一种计算机可读的存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至4任一项中所述的方法。
8.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述权利要求1至4任一项中所述的方法。
CN202011407574.2A 2020-12-04 2020-12-04 目标资产数据的聚合方法及装置、存储介质、电子装置 Active CN112597542B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011407574.2A CN112597542B (zh) 2020-12-04 2020-12-04 目标资产数据的聚合方法及装置、存储介质、电子装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011407574.2A CN112597542B (zh) 2020-12-04 2020-12-04 目标资产数据的聚合方法及装置、存储介质、电子装置

Publications (2)

Publication Number Publication Date
CN112597542A CN112597542A (zh) 2021-04-02
CN112597542B true CN112597542B (zh) 2023-10-24

Family

ID=75188318

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011407574.2A Active CN112597542B (zh) 2020-12-04 2020-12-04 目标资产数据的聚合方法及装置、存储介质、电子装置

Country Status (1)

Country Link
CN (1) CN112597542B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230118380A (ko) * 2022-02-04 2023-08-11 숭실대학교산학협력단 그룹 서명 기반 연합학습 방법 및 시스템, 이를 수행하기 위한 기록 매체
CN114465734B (zh) * 2022-04-11 2022-08-02 成方金融科技有限公司 投资者认证方法及存储介质
CN115994161B (zh) * 2023-03-21 2023-06-06 杭州金智塔科技有限公司 基于多方安全计算的数据聚合系统及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109416791A (zh) * 2016-06-28 2019-03-01 维萨国际服务协会 数字资产账户管理
WO2020114135A1 (zh) * 2018-12-06 2020-06-11 西安光启未来技术研究院 特征识别的方法及装置
CN111539774A (zh) * 2020-04-30 2020-08-14 深圳前海微众银行股份有限公司 无形资产的价值评估方法、系统、终端设备及存储介质
CN111666460A (zh) * 2020-05-27 2020-09-15 中国平安财产保险股份有限公司 基于隐私保护的用户画像生成方法、装置及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109416791A (zh) * 2016-06-28 2019-03-01 维萨国际服务协会 数字资产账户管理
WO2020114135A1 (zh) * 2018-12-06 2020-06-11 西安光启未来技术研究院 特征识别的方法及装置
CN111539774A (zh) * 2020-04-30 2020-08-14 深圳前海微众银行股份有限公司 无形资产的价值评估方法、系统、终端设备及存储介质
CN111666460A (zh) * 2020-05-27 2020-09-15 中国平安财产保险股份有限公司 基于隐私保护的用户画像生成方法、装置及存储介质

Also Published As

Publication number Publication date
CN112597542A (zh) 2021-04-02

Similar Documents

Publication Publication Date Title
CN112597542B (zh) 目标资产数据的聚合方法及装置、存储介质、电子装置
CN104811450B (zh) 云计算中一种基于身份的数据存储方法及完整性验证方法
CN114338045B (zh) 基于区块链和联邦学习的情报数据安全共享方法及系统
CN107147720B (zh) 一种云存储数据共享中可追踪的有效公开审计方法和系统
CN112232527A (zh) 安全的分布式联邦深度学习方法
CN110138802B (zh) 用户特征信息获取方法、装置,区块链节点、网络,及存储介质
CN106254374A (zh) 一种具备去重功能的云数据公开审计方法
CN116561789B (zh) 隐私数据的处理方法、装置、电子设备及可读存储介质
CN111986755A (zh) 一种基于区块链和属性基加密的数据共享系统
CN104754570B (zh) 一种基于移动互联网络的密钥分发和重构方法与装置
CN110912897B (zh) 基于密文属性认证和门限函数的图书资源访问控制方法
CN110086626A (zh) 基于非对称密钥池对的量子保密通信联盟链交易方法和系统
CN107248909A (zh) 一种基于sm2算法的无证书安全签名方法
CN115037477A (zh) 一种基于区块链的联邦学习隐私保护方法
US20220374544A1 (en) Secure aggregation of information using federated learning
Mohassel et al. Efficient server-aided 2pc for mobile phones
CN101908961B (zh) 一种短密钥环境下多方秘密握手方法
CN112231769A (zh) 基于区块链的数值验证方法、装置、计算机设备和介质
Lyu et al. Towards fair and decentralized privacy-preserving deep learning with blockchain
CN110505067A (zh) 区块链的处理方法、装置、设备及可读存储介质
CN115795518A (zh) 一种基于区块链的联邦学习隐私保护方法
CN115688185A (zh) 多方隐私求和方法、装置、电子设备和存储介质
CN114760023A (zh) 基于联邦学习的模型训练方法、装置及存储介质
Catherine et al. Multi authority ciphertext-policy attribute-based encryption for security enhancement in cloud storage unit
CN110890961B (zh) 一种新型安全高效的多授权属性基密钥协商协议

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant