CN111143674A - 一种数据处理方法及装置 - Google Patents

一种数据处理方法及装置 Download PDF

Info

Publication number
CN111143674A
CN111143674A CN201911329861.3A CN201911329861A CN111143674A CN 111143674 A CN111143674 A CN 111143674A CN 201911329861 A CN201911329861 A CN 201911329861A CN 111143674 A CN111143674 A CN 111143674A
Authority
CN
China
Prior art keywords
privacy
data
processing
conversion
resource
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911329861.3A
Other languages
English (en)
Inventor
傅培森
郑文琛
杨强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WeBank Co Ltd
Original Assignee
WeBank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WeBank Co Ltd filed Critical WeBank Co Ltd
Priority to CN201911329861.3A priority Critical patent/CN111143674A/zh
Publication of CN111143674A publication Critical patent/CN111143674A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • Medical Informatics (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种数据处理方法及装置,其中方法为:获取待处理资源的点击数据;根据所述点击数据查询所述资源的转化数据并输出隐私等级设置界面;接收通过所述隐私等级设置界面设置的隐私等级,并查询与所述隐私等级对应的隐私保护机制;利用查询的隐私保护机制对所述转化数据进行隐私处理,并将隐私处理后的转化数据发送给资源推荐平台进行分析模型建立。上述方法应用于金融科技(Fintech)时,由于可以接收通过所述隐私等级设置界面设置的隐私等级,利用查询的隐私保护机制对所述转化数据进行隐私处理,能够灵活地对用户数据进行转化处理,能够在隐私保护与分析模型的预估效果之间的寻求平衡。

Description

一种数据处理方法及装置
技术领域
本发明涉及金融科技(Fintech)领域和计算机软件领域,尤其涉及一种数据处理方法及装置。
背景技术
随着计算机技术的发展,越来越多的技术(大数据、分布式、区块链(Blockchain)、人工智能等)应用在金融领域,传统金融业正在逐步向金融科技(Fintech)转变。目前,金融科技领域中的信息推荐尤其重要,是拓展金融产品客户的主要渠道。资源提供端如果希望提高信息推荐的用户转化为消费用户的效果,信息推荐源就需要把用户数据传输给资源推荐平台,由资源推荐平台通过用户数据建立分析模型来预估用户的转化行为。在实际应用中,为了避免用户隐私泄露,需要对转化数据进行隐私处理后传输给资源推荐平台。
目前,通常采用固定的隐私保护机制对转化数据进行处理。然而,若采用上述方式对转化数据进行处理,可能会造成转化数据的隐私处理过于严格或者过于宽松,若对转化数据进行了过于严格的隐私处理,会造成信息极度失真,导致分析模型的预估准确性较低,若对转化数据进行了过于宽松的隐私处理,会造成转化数据的隐私保护力度较小,造成转化数据的安全性较低。
发明内容
本申请提供一种数据处理方法及装置,解决了现有技术中不能在隐私保护与分析模型的预估效果之间的寻求平衡的问题。
第一方面,本申请提供一种数据处理方法:获取待处理资源的点击数据;根据所述点击数据查询所述资源的转化数据并输出隐私等级设置界面;接收通过所述隐私等级设置界面设置的隐私等级,并查询与所述隐私等级对应的隐私保护机制,其中,不同隐私等级对应不同的隐私保护机制;利用查询的隐私保护机制对所述转化数据进行隐私处理,并将隐私处理后的转化数据发送给资源推荐平台进行分析模型建立。
可选地,所述利用查询的隐私保护机制对所述转化数据进行隐私处理,包括:确定查询的隐私保护机制所对应的噪声方差;通过在所述转化数据中添加与所述噪声方差对应的噪声,对所述转化数据进行加噪处理;按照预设公钥和预设同态加密算法对加噪处理后的转化数据进行加密处理,以完成对所述转化数据的隐私处理。
可选地,所述利用查询的隐私保护机制对所述转化数据进行隐私处理,包括:确定查询的隐私保护机制所对应的噪声方差;按照预设公钥和预设同态加密算法所述转化数据进行加密处理;通过在加密后的转化数据中添加与所述噪声方差对应的噪声,对所述加密后的转化数据进行加噪处理,以完成对所述转化数据的隐私处理。
可选地,所述利用查询的隐私保护机制对所述转化数据进行隐私处理,并将隐私处理后的转化数据发送给资源推荐平台进行分析模型建立,之前,所述方法还包括:按照预设混合算法将所述点击数据与所述转化数据进行混合处理,得到混合数据;所述利用查询的隐私保护机制对所述转化数据进行隐私处理,并将隐私处理后的转化数据发送给资源推荐平台进行分析模型建立,包括:利用查询的隐私保护机制对所述混合数据进行隐私处理,并将隐私处理后的混合数据发送给资源推荐平台进行分析模型建立。
可选地,所述获取待处理资源的点击数据之前,所述方法还包括:获取不同的隐私保护机制;按照不同隐私等级对所述不同的隐私保护机制进行划分;建立并保存所述不同的隐私保护机制与所述不同的隐私保护机制之间的映射关系。
可选地,所述将隐私处理后的转化数据发送给资源推荐平台进行分析模型建立之后,所述方法还包括:接收所述资源推荐平台发送的隐私模型参数;利用预设去隐私保护机制,对所述隐私模型参数进行去隐私处理,得到去隐私模型参数;基于所述去隐私模型参数对所述资源进行点击转化分析,得到所述资源的点击转化率。
可选地,所述利用预设去隐私保护机制,对所述隐私模型参数进行去隐私处理,得到去隐私模型参数,包括:若所述转化数据是通过加噪和预设同态加密算法加密的方式进行隐私处理,则获取与所述预设同态加密算法对应的预设私钥;利用所述预设私钥对所述隐私模型参数进行解密,完成对所述隐私模型参数去隐私处理,得到去隐私模型参数。
可选地,所述获取待处理资源的点击数据,包括:向所述资源推荐平台发送点击数据下载请求,所述点击数据下载请求携带有所述资源的特征信息;接收所述资源推荐平台根据所述特征信息查询的所述点击数据。
第二方面,本申请提供一种数据处理装置,包括:获取模块,用于获取待处理资源的点击数据;查询模块,用于根据所述点击数据查询所述资源的转化数据并输出隐私等级设置界面;接收通过所述隐私等级设置界面设置的隐私等级,并查询与所述隐私等级对应的隐私保护机制,其中,不同隐私等级对应不同的隐私保护机制;处理模块,用于利用查询的隐私保护机制对所述转化数据进行隐私处理,并将隐私处理后的转化数据发送给资源推荐平台进行分析模型建立。
可选地,所述处理模块具体用于:确定查询的隐私保护机制所对应的噪声方差;通过在所述转化数据中添加与所述噪声方差对应的噪声,对所述转化数据进行加噪处理;按照预设公钥和预设同态加密算法对加噪处理后的转化数据进行加密处理,以完成对所述转化数据的隐私处理。
可选地,所述处理模块具体用于:确定查询的隐私保护机制所对应的噪声方差;按照预设公钥和预设同态加密算法所述转化数据进行加密处理;通过在加密后的转化数据中添加与所述噪声方差对应的噪声,对所述加密后的转化数据进行加噪处理,以完成对所述转化数据的隐私处理。
可选地,所述处理模块还用于:按照预设混合算法将所述点击数据与所述转化数据进行混合处理,得到混合数据;利用查询的隐私保护机制对所述混合数据进行隐私处理,并将隐私处理后的混合数据发送给资源推荐平台进行分析模型建立。
可选地,所述获取模块还用于:获取不同的隐私保护机制;按照不同隐私等级对所述不同的隐私保护机制进行划分;建立并保存所述不同的隐私保护机制与所述不同的隐私保护机制之间的映射关系。
可选地,所述获取模块还用于:接收所述资源推荐平台发送的隐私模型参数;所述处理模块还用于:利用预设去隐私保护机制,对所述隐私模型参数进行去隐私处理,得到去隐私模型参数;基于所述去隐私模型参数对所述资源进行点击转化分析,得到所述资源的点击转化率。
可选地,所述处理模块具体用于:若所述转化数据是通过加噪和预设同态加密算法加密的方式进行隐私处理,则获取与所述预设同态加密算法对应的预设私钥;利用所述预设私钥对所述隐私模型参数进行解密,完成对所述隐私模型参数去隐私处理,得到去隐私模型参数。
可选地,所述获取模块具体用于:向所述资源推荐平台发送点击数据下载请求,所述点击数据下载请求携带有所述资源的特征信息;接收所述资源推荐平台根据所述特征信息查询的所述点击数据。
第三方面,本申请提供一种计算机设备,包括程序或指令,当所述程序或指令被执行时,用以执行上述第一方面及第一方面各个实施方式的方法。
第四方面,本申请提供一种存储介质,包括程序或指令,当所述程序或指令被执行时,用以执行上述第一方面及第一方面各个实施方式的方法。
本申请提供的数据处理方法及装置,与现有技术采用固定的隐私保护机制对转化数据进行处理相比,本申请能够根据待处理资源的点击数据查询所述资源的转化数据,并可以输出一个能够根据具体需求灵活地设置隐私等级的设置界面,并查询该隐私等级对应的隐私保护机制,由于不同隐私等级对应不同的隐私保护机制,因此能够利用不同的隐私保护机制对所述转化数据进行不同隐私等级的隐私处理,并将隐私处理后的转化数据发送给资源推荐平台进行分析模型建立,即能够灵活地选择隐私保护机制对转化数据进行处理,能够在隐私保护与分析模型的预估效果之间的寻求平衡,即能够保证在保护用户隐私的同时,提升分析模型的预估准确性。
附图说明
图1为本申请实施例提供的一种数据处理方法的步骤流程示意图;
图2为本申请实施例提供的一种数据处理方法可应用的架构示意图;
图3为本申请实施例提供的一种数据处理方法相应的界面示意图;
图4为本申请实施例提供的一种数据处理装置的结构示意图。
具体实施方式
为了更好的理解上述技术方案,下面将结合说明书附图及具体的实施方式对上述技术方案进行详细的说明,应当理解本申请实施例以及实施例中的具体特征是对本申请技术方案的详细的说明,而不是对本申请技术方案的限定,在不冲突的情况下,本申请实施例以及实施例中的技术特征可以相互结合。
在金融机构(银行机构、保险机构或证券机构)在进行业务(如银行的贷款业务、存款业务等)运转过程中,金融科技领域中的信息推荐尤其重要,是拓展金融产品客户的主要渠道。资源提供端如果希望提高信息推荐的用户转化为转化用户的效果,信息推荐源就需要把用户转化数据传输资源推荐平台,由资源推荐平台对用户转化数据进行分析。但是,目前的方式中通常采用固定的隐私保护机制对用户转化数据进行处理,这种方式可能会造成用户转化数据的隐私处理过于严格或者过于宽松。一方面,若对用户转化数据的隐私处理过于严格,则原有的用户转化数据变严重失真,导致分析模型的预估准确性较低;另一方面,若对用户转化数据的隐私处理过于宽松,虽然有较高的分析模型准确性,但会暴露较多的用户转化数据变严重失真,造成用户转化数据的安全性较低。显然,现有技术不能在隐私保护与分析模型的预估效果之间的寻求平衡。这种情况不符合银行等金融机构的需求,无法保证金融机构各项业务的高效运转。
为此,如图1所示,本申请实施例提供一种数据处理方法,包括以下步骤:
步骤101:获取待处理资源的点击数据。
步骤102:根据所述点击数据查询所述资源的转化数据并输出隐私等级设置界面。
步骤103:接收通过所述隐私等级设置界面设置的隐私等级,并查询与所述隐私等级对应的隐私保护机制。
其中,不同隐私等级对应不同的隐私保护机制。
步骤104:利用查询的隐私保护机制对所述转化数据进行隐私处理,并将隐私处理后的转化数据发送给资源推荐平台进行分析模型建立。
需要说明的是,步骤101~步骤104中,用户按照时间顺序可分为三类:曝光用户、点击用户和转化用户。曝光用户为资源推荐平台推荐了资源的用户;点击用户为点击了资源推荐平台推荐的资源的用户,显然,点击用户必然为曝光用户;转化用户为点击了资源推荐平台推荐的资源后在资源提供端发送转化行为(如注册行为购买行为)的用户,显然,转化用户必为点击用户。曝光数据至少包括特征信息和曝光标签值(如曝光标签值用0表示)。点击数据至少包括特征信息和点击标签值(如点击标签值用1表示)。转化数据至少包括特征信息和转化标签值(如转化标签值用2表示),需要说明的是,在以下描述中,若无特别说明,转化数据为没有经过隐私处理的原始转化数据,转化数据也可以称为原始转化数据。其中,特征信息可以包括多种类型的特征,如用户特征、资源特征和场景特征。用户特征指用户的基础属性,如年龄、性别等。资源特征指推荐资源的基础属性,如推荐资源的格式、布局。场景特征指将推荐资源推荐给用户的场景,如推荐的地点、触发推荐的用户操作。
步骤101~步骤104中的执行主体可以为资源提供端,资源提供端会委托资源推荐平台进行资源推荐。由于用户的转化行为发生在资源提供端,资源提供端会存有大量的用户转化数据,由于推荐给用户的处理资源是资源推荐平台执行的,而用户点击处理资源时资源推荐平台也会有响应,因此资源推荐平台会存有大量的用户曝光数据和用户点击数据。
步骤101之前的一种可选实施方式中,
获取不同的隐私保护机制;按照不同隐私等级对所述不同的隐私保护机制进行划分;建立并保存所述不同的隐私保护机制与所述不同的隐私保护机制之间的映射关系。
需要说明的是,隐私保护机制的具体手段不做限定,只要达到对转化数据的隐私保护效果即可。举例来说,根据一定规则对转化数据更改,如随机改变转化数据的标签值,再如根据一定规则对转化数据进行数据掩盖,如通过对称加密算法对转化数据加密。每一种隐私保护机制都可以对应一个数据改变程度,数据改变程度即改变后的转化数据相对于原始转化数据的差异程度。至于隐私等级与隐私保护机制的映射关系,既可以设置与隐私保护机制的数据改变程度呈正相关,也可以设置为负相关,在此不做限定。也可以不通过隐私保护机制的数据改变程度来设置。举例来说,直接将隐私等级一与隐私保护机制一建立映射关系,将隐私等级二与隐私保护机制二建立映射关系等等等。
步骤101的一种可选实施方式中,具体方式可以为:
向所述资源推荐平台发送点击数据下载请求,所述点击数据下载请求携带有所述资源的特征信息;接收所述资源推荐平台根据所述特征信息查询的所述点击数据。
资源推荐平台在将处理资源推荐给用户时,可以记录给哪些用户推荐哪些资源,并记录资源的特征信息。那么资源提供端可以根据资源的特征信息,查询哪些点击数据投放了相应特征信息的资源,从而查询到相应的点击数据。
举例来说,下载请求为q,q包括所述资源的特征信息t,而资源平台中投放了t特征信息资源的点击数据包括a1,a2,…,a10等10条,那么便接收a1,a2,…,a10等10条点击数据。
步骤102的一种实施方式中,确定查询的隐私保护机制所对应的噪声方差;通过在所述转化数据中添加与所述噪声方差对应的噪声,对所述转化数据进行加噪处理;按照预设公钥和预设同态加密算法对加噪处理后的转化数据进行加密处理,以完成对所述转化数据的隐私处理。
其中,具体的噪声类型不做限定。举例来说,噪声为拉普拉斯噪声。由于噪声方差表征了由于噪声方差表征了噪声的波动程度,因此可以向所述转化数据加入噪声方差对应的不同波动程度的噪声。显然,噪声方差越大,加入噪声的不确定性就越强,加噪后的转化数据相对原始的转化数据转变就越大。因此,噪声起到了作为一个混淆信息的作用。可以通过噪声方差灵活控制转化数据加噪后的转变程度,即控制隐私程度。再者,可以继续按照预设公钥和预设同态加密算法对加噪处理后的转化数据进行加密处理,进一步对加噪处理后的转化数据掩盖,从而提供了一种先按照噪声的波动程度更改转化数据并掩盖的方式。
在另一种实施方式中,还可以先对转化数据进行加密,再对转化数据加噪,具体为:
确定查询的隐私保护机制所对应的噪声方差;按照预设公钥和预设同态加密算法所述转化数据进行加密处理;通过在加密后的转化数据中添加与所述噪声方差对应的噪声,对所述加密后的转化数据进行加噪处理,以完成对所述转化数据的隐私处理。
这种实施方式中,是先对转化数据进行掩盖,再对加密后的转化数据进行信息混淆,也能通过噪声方差灵活控制转化数据加噪后的转变程度。
需要说明的是,原始转化数据同态加密算法加密后可以通过相应的同态解密算法解密还原为原始转化数据,因为加密是同态的,所以同态加密后不会对分析模型的预估效果造成影响;而加入噪声的转化数据就是对转化数据进行了转变,这种转变是会对分析模型的预估效果造成影响的。
在一种可选实施方式中,步骤101之前,按照预设混合算法将所述点击数据与所述转化数据进行混合处理,得到混合数据;步骤104中,利用查询的隐私保护机制对所述混合数据进行隐私处理,并将隐私处理后的混合数据发送给资源推荐平台进行分析模型建立。在这种实施方式中,将点击数据与转化数据混合一起的混合数据都进行隐私处理,从而对点击数据也进行了隐私处理,对混合数据也能寻求隐私保护与模型预估效果之间的平衡。
步骤104之后的一种可选实施方式中,接收所述资源推荐平台发送的隐私模型参数;利用预设去隐私保护机制,对所述隐私模型参数进行去隐私处理,得到去隐私模型参数;基于所述去隐私模型参数对所述资源进行点击转化分析,得到所述资源的点击转化率。
由于步骤104中是将隐私处理后的转化数据发送给资源推荐平台进行分析模型建立,那么资源推荐平台得到的分析模型参数也是加了隐私保护的隐私模型参数;隐私模型参数直接使用会降低分析模型的效果,因此可以用预设的去隐私保护机制,对所述隐私模型参数进行去隐私处理,得到去隐私模型参数;基于所述去隐私模型参数对所述资源进行点击转化分析,得到更为准确的所述资源的点击转化率。
在上述可选实施方式中,利用预设去隐私保护机制,对所述隐私模型参数进行去隐私处理,得到去隐私模型参数的方式具体可以为:
若所述转化数据是通过加噪和预设同态加密算法加密的方式进行隐私处理,则获取与所述预设同态加密算法对应的预设私钥;利用所述预设私钥对所述隐私模型参数进行解密,完成对所述隐私模型参数去隐私处理,得到去隐私模型参数。
由于加噪是对所述转化数据进行改变的,这部分改变会在分析模型训练时体现出来。而采用的加密算法是预设同态加密算法,所以加密后的数据做训练能够得到和加密前数据一样的效果,只需要对预设同态加密算法对应的预设私钥对隐私模型参数进行解密,完成对所述隐私模型参数去隐私处理,得到去隐私模型参数,因此这种方式既可以对转化数据进行隐私保护,也能得到更加准确的隐私模型参数。
下面结合图2和图3,详细介绍图1示出的数据处理方法。
图1示出的数据处理方法可提供工具让资源提供端可以进行隐私等级的设置,核心在于资源提供端可以自助平衡隐私等级和模型预估效果。举例来说,隐私等级和隐私保护机制是呈正相关的,即隐私等级越高,对转化数据的更改程度就越大,对转化数据的加密程度就越高。当资源提供端将隐私等级设置成最低,则资源提供端更侧重追求信息推荐的效果;当资源提供端将隐私等级设置成最高,则资源提供端更侧重追求用户的隐私保护。当隐私等级设置为最低于最高之间,则可以自由控制隐私保护程度,并且获得不同的效果。具体流程如下:
第一步:资源提供端从资源推荐平台端获得点击数据。
第二步:资源提供端混合用户点击数据和转化数据。
第三步:资源提供端运用工具来设置不同的隐私等级(例如:隐私等级越高,数据转换程度越高)相当于在数据中加入了噪声。如图3所示,这一步操作对于资源提供端来说是可视化且可衡量等级的。
对转化数据加入噪声的方式具体可以包括:
第一种:将转化数据的标签值随机转换为0,或随机转换为1。资源提供端以一定的概率反转用户转化数据的标签值0,1;反转的概率越高,则隐私保护程度越强,但预估效果越差。
第二种:资源提供端添加一个符合拉普拉斯分布的噪声,例如在0和1基础添加符合L(0,0.1)的拉普拉斯噪声。该噪声的方差越大,则隐私保护越强。
需要说明的是,隐私保护程度和预估效果是需要平衡的。具体可以使用机器学习的方法,根据历史投放的不同的隐私保护程度已经投放效果来预估后续不同隐私保护的效果。总体上说,机器学习模型的这类隐私泄露与该模型的效果是矛盾的。因此,可以根据模型的效果、模型的类似施加相应量级的隐私保护。具体的说,对于一个准确率极高或对每个个体预估值极敏感的模型,施加较大的噪声以提供一定量级的隐私保护。另一方面,对于准确率较低或对每个个体预估不敏感的模型,可以施加一个较小的噪声来提供一定量级的隐私保护。另外,除了机器学习模型的效果和个人敏感度以外,资源提供端希望对其用户提供的保护等级也影响了施加的噪声程度。具体的说,在机器学习模型固定的情况下,更大的噪声添加一般代表更严格的隐私保护。
第四步:资源提供端将转化数据进行加密。
具体加密方式可以为同态加密方式,该方法主要是为了保护数据传输过程中的安全。
第五步:资源提供端将用户加密数据传输给资源推荐平台端。资源推荐平台端根据隐私处理后的转化数据建立转化预估模型。用于预估点击转化率。
第六步:资源提供端下载隐私模型参数,解密获得去隐私模型参数。
如图4所示,本申请提供一种数据处理装置,包括:获取模块401,用于获取待处理资源的点击数据;查询模块402,用于根据所述点击数据查询所述资源的转化数据并输出隐私等级设置界面;接收通过所述隐私等级设置界面设置的隐私等级,并查询与所述隐私等级对应的隐私保护机制,其中,不同隐私等级对应不同的隐私保护机制;处理模块403,用于利用查询的隐私保护机制对所述转化数据进行隐私处理,并将隐私处理后的转化数据发送给资源推荐平台进行分析模型建立。
一种可选实施方式中,所述处理模块403具体用于:确定查询的隐私保护机制所对应的噪声方差;通过在所述转化数据中添加与所述噪声方差对应的噪声,对所述转化数据进行加噪处理;按照预设公钥和预设同态加密算法对加噪处理后的转化数据进行加密处理,以完成对所述转化数据的隐私处理。
一种可选实施方式中,所述处理模块403具体用于:确定查询的隐私保护机制所对应的噪声方差;按照预设公钥和预设同态加密算法所述转化数据进行加密处理;通过在加密后的转化数据中添加与所述噪声方差对应的噪声,对所述加密后的转化数据进行加噪处理,以完成对所述转化数据的隐私处理。
一种可选实施方式中,所述处理模块403还用于:按照预设混合算法将所述点击数据与所述转化数据进行混合处理,得到混合数据;利用查询的隐私保护机制对所述混合数据进行隐私处理,并将隐私处理后的混合数据发送给资源推荐平台进行分析模型建立。
一种可选实施方式中,所述获取模块401还用于:获取不同的隐私保护机制;按照不同隐私等级对所述不同的隐私保护机制进行划分;建立并保存所述不同的隐私保护机制与所述不同的隐私保护机制之间的映射关系。
一种可选实施方式中,所述获取模块401还用于:接收所述资源推荐平台发送的隐私模型参数;所述处理模块403还用于:利用预设去隐私保护机制,对所述隐私模型参数进行去隐私处理,得到去隐私模型参数;基于所述去隐私模型参数对所述资源进行点击转化分析,得到所述资源的点击转化率。
一种可选实施方式中,所述处理模块403具体用于:若所述转化数据是通过加噪和预设同态加密算法加密的方式进行隐私处理,则获取与所述预设同态加密算法对应的预设私钥;利用所述预设私钥对所述隐私模型参数进行解密,完成对所述隐私模型参数去隐私处理,得到去隐私模型参数。
一种可选实施方式中,所述获取模块401具体用于:向所述资源推荐平台发送点击数据下载请求,所述点击数据下载请求携带有所述资源的特征信息;接收所述资源推荐平台根据所述特征信息查询的所述点击数据。
本申请实施例提供一种计算机设备,包括程序或指令,当所述程序或指令被执行时,用以执行本申请实施例提供的一种数据处理方法及任一可选方法。
本申请实施例提供一种存储介质,包括程序或指令,当所述程序或指令被执行时,用以执行本申请实施例提供的一种数据处理方法及任一可选方法。
最后应说明的是:本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (10)

1.一种数据处理方法,其特征在于,包括:
获取待处理资源的点击数据;
根据所述点击数据查询所述资源的转化数据并输出隐私等级设置界面;
接收通过所述隐私等级设置界面设置的隐私等级,并查询与所述隐私等级对应的隐私保护机制,其中,不同隐私等级对应不同的隐私保护机制;
利用查询的隐私保护机制对所述转化数据进行隐私处理,并将隐私处理后的转化数据发送给资源推荐平台进行分析模型建立。
2.如权利要求1所述的方法,其特征在于,所述利用查询的隐私保护机制对所述转化数据进行隐私处理,包括:
确定查询的隐私保护机制所对应的噪声方差;
通过在所述转化数据中添加与所述噪声方差对应的噪声,对所述转化数据进行加噪处理;
按照预设公钥和预设同态加密算法对加噪处理后的转化数据进行加密处理,以完成对所述转化数据的隐私处理。
3.如权利要求1所述的方法,其特征在于,所述利用查询的隐私保护机制对所述转化数据进行隐私处理,包括:
确定查询的隐私保护机制所对应的噪声方差;
按照预设公钥和预设同态加密算法所述转化数据进行加密处理;
通过在加密后的转化数据中添加与所述噪声方差对应的噪声,对所述加密后的转化数据进行加噪处理,以完成对所述转化数据的隐私处理。
4.如权利要求1所述的方法,其特征在于,所述利用查询的隐私保护机制对所述转化数据进行隐私处理,并将隐私处理后的转化数据发送给资源推荐平台进行分析模型建立,之前,所述方法还包括:
按照预设混合算法将所述点击数据与所述转化数据进行混合处理,得到混合数据;
所述利用查询的隐私保护机制对所述转化数据进行隐私处理,并将隐私处理后的转化数据发送给资源推荐平台进行分析模型建立,包括:
利用查询的隐私保护机制对所述混合数据进行隐私处理,并将隐私处理后的混合数据发送给资源推荐平台进行分析模型建立。
5.如权利要求1-3任一项所述的方法,其特征在于,所述获取待处理资源的点击数据之前,所述方法还包括:
获取不同的隐私保护机制;
按照不同隐私等级对所述不同的隐私保护机制进行划分;
建立并保存所述不同的隐私保护机制与所述不同的隐私保护机制之间的映射关系。
6.如权利要求1-3任一项所述的方法,其特征在于,所述将隐私处理后的转化数据发送给资源推荐平台进行分析模型建立之后,所述方法还包括:
接收所述资源推荐平台发送的隐私模型参数;
利用预设去隐私保护机制,对所述隐私模型参数进行去隐私处理,得到去隐私模型参数;
基于所述去隐私模型参数对所述资源进行点击转化分析,得到所述资源的点击转化率。
7.如权利要求6所述的方法,其特征在于,所述利用预设去隐私保护机制,对所述隐私模型参数进行去隐私处理,得到去隐私模型参数,包括:
若所述转化数据是通过加噪和预设同态加密算法加密的方式进行隐私处理,则获取与所述预设同态加密算法对应的预设私钥;
利用所述预设私钥对所述隐私模型参数进行解密,完成对所述隐私模型参数去隐私处理,得到去隐私模型参数。
8.一种数据处理装置,其特征在于,包括:
获取模块,用于获取待处理资源的点击数据;
查询模块,用于根据所述点击数据查询所述资源的转化数据并输出隐私等级设置界面;接收通过所述隐私等级设置界面设置的隐私等级,并查询与所述隐私等级对应的隐私保护机制,其中,不同隐私等级对应不同的隐私保护机制;
处理模块,用于利用查询的隐私保护机制对所述转化数据进行隐私处理,并将隐私处理后的转化数据发送给资源推荐平台进行分析模型建立。
9.一种计算机设备,其特征在于,包括程序或指令,当所述程序或指令被执行时,如权利要求1至7中任意一项所述的方法被执行。
10.一种存储介质,其特征在于,包括程序或指令,当所述程序或指令被执行时,如权利要求1至7中任意一项所述的方法被执行。
CN201911329861.3A 2019-12-20 2019-12-20 一种数据处理方法及装置 Pending CN111143674A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911329861.3A CN111143674A (zh) 2019-12-20 2019-12-20 一种数据处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911329861.3A CN111143674A (zh) 2019-12-20 2019-12-20 一种数据处理方法及装置

Publications (1)

Publication Number Publication Date
CN111143674A true CN111143674A (zh) 2020-05-12

Family

ID=70519153

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911329861.3A Pending CN111143674A (zh) 2019-12-20 2019-12-20 一种数据处理方法及装置

Country Status (1)

Country Link
CN (1) CN111143674A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112989425A (zh) * 2021-04-26 2021-06-18 南京审计大学 基于差分隐私的信用数据隐私保护方法及其系统
CN113051587A (zh) * 2021-03-10 2021-06-29 中国人民大学 一种隐私保护智能交易推荐方法、系统和可读介质
WO2022151555A1 (zh) * 2021-01-13 2022-07-21 海南大学 面向本质计算的dikw隐私资源的处理方法和组件

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103577521A (zh) * 2012-07-31 2014-02-12 索尼公司 信息处理装置、信息处理方法和信息处理系统
CN104462285A (zh) * 2014-11-28 2015-03-25 广东工业大学 一种移动服务查询系统的隐私保护方法
CN105608388A (zh) * 2015-09-24 2016-05-25 武汉大学 一种基于相关性去除的差分隐私数据发布方法及系统
CN107704930A (zh) * 2017-09-25 2018-02-16 阿里巴巴集团控股有限公司 基于共享数据的建模方法、装置、系统及电子设备
CN107742084A (zh) * 2017-11-03 2018-02-27 北京翰宁智能科技有限责任公司 一种在生成优惠券时保护消费者隐私的方法
CN109726758A (zh) * 2018-12-28 2019-05-07 辽宁工业大学 一种基于差分隐私的数据融合发布算法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103577521A (zh) * 2012-07-31 2014-02-12 索尼公司 信息处理装置、信息处理方法和信息处理系统
CN104462285A (zh) * 2014-11-28 2015-03-25 广东工业大学 一种移动服务查询系统的隐私保护方法
CN105608388A (zh) * 2015-09-24 2016-05-25 武汉大学 一种基于相关性去除的差分隐私数据发布方法及系统
CN107704930A (zh) * 2017-09-25 2018-02-16 阿里巴巴集团控股有限公司 基于共享数据的建模方法、装置、系统及电子设备
CN107742084A (zh) * 2017-11-03 2018-02-27 北京翰宁智能科技有限责任公司 一种在生成优惠券时保护消费者隐私的方法
CN109726758A (zh) * 2018-12-28 2019-05-07 辽宁工业大学 一种基于差分隐私的数据融合发布算法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022151555A1 (zh) * 2021-01-13 2022-07-21 海南大学 面向本质计算的dikw隐私资源的处理方法和组件
CN113051587A (zh) * 2021-03-10 2021-06-29 中国人民大学 一种隐私保护智能交易推荐方法、系统和可读介质
CN113051587B (zh) * 2021-03-10 2024-02-02 中国人民大学 一种隐私保护智能交易推荐方法、系统和可读介质
CN112989425A (zh) * 2021-04-26 2021-06-18 南京审计大学 基于差分隐私的信用数据隐私保护方法及其系统

Similar Documents

Publication Publication Date Title
US11902413B2 (en) Secure machine learning analytics using homomorphic encryption
CN110245510B (zh) 用于预测信息的方法和装置
JP6926429B2 (ja) データ処理装置、データ処理方法、およびプログラム
US20190258927A1 (en) Data exchange method, data exchange device and computing device
CN111143674A (zh) 一种数据处理方法及装置
CN111428887B (zh) 一种基于多个计算节点的模型训练控制方法、装置及系统
US11277257B2 (en) Method and apparatus for performing operation using encrypted data
CN111027870A (zh) 用户风险评估方法及装置、电子设备、存储介质
CN111027981B (zh) 多方联合训练针对IoT机具的风险评估模型的方法及装置
CN109389412B (zh) 一种训练模型的方法、装置、服务设备以及用户设备
CN111753324B (zh) 私有数据的处理方法、计算方法及所适用的设备
US20200382273A1 (en) Privacy preserving oracle
CN109462475B (zh) 数据加密方法、解密方法及相关装置
CN113711247A (zh) 一种机器学习模型的数据处理方法、装置及系统
CN116167868A (zh) 基于隐私计算的风险识别方法、装置、设备以及存储介质
JP2023014431A (ja) 安全な照会処理のための方法、コンピュータプログラム、およびコンピュータシステム(グラフストアにおける安全な照会処理)
CN110874481B (zh) 一种基于gbdt模型的预测方法和装置
CN110838069A (zh) 数据处理方法、装置以及系统
CN112800467B (zh) 基于数据隐私保护的在线模型训练方法、装置以及设备
US20240007287A1 (en) Machine learning device, machine learning system, and machine learning method
CN114036567A (zh) 一种信息安全分享的权限认证方法及系统
CN115461761A (zh) 基于判定树的同态加密数据推理
CN111292722B (zh) 异步联合架构的模型训练方法、终端、服务器及存储装置
CN117313119A (zh) 一种应用代码加密验证方法、装置以及计算机设备
Carminati et al. Secure web service composition with untrusted broker

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination