CN113806760B - 获取特征间相关系数方法、装置、电子设备及存储介质 - Google Patents

获取特征间相关系数方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113806760B
CN113806760B CN202110382358.5A CN202110382358A CN113806760B CN 113806760 B CN113806760 B CN 113806760B CN 202110382358 A CN202110382358 A CN 202110382358A CN 113806760 B CN113806760 B CN 113806760B
Authority
CN
China
Prior art keywords
feature
encrypted
affine
correlation coefficient
service node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110382358.5A
Other languages
English (en)
Other versions
CN113806760A (zh
Inventor
韩雨锦
王虎
李怡欣
黄志翔
彭南博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jingdong Technology Holding Co Ltd
Original Assignee
Jingdong Technology Holding Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jingdong Technology Holding Co Ltd filed Critical Jingdong Technology Holding Co Ltd
Priority to CN202110382358.5A priority Critical patent/CN113806760B/zh
Publication of CN113806760A publication Critical patent/CN113806760A/zh
Application granted granted Critical
Publication of CN113806760B publication Critical patent/CN113806760B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提出了一种获取特征间相关系数的方法,包括:对所述业务节点自身的第一特征进行仿射变换,生成仿射特征;获取所述仿射特征的第一期望,并分别对所述仿射特征和所述第一期望进行加密,将加密仿射特征和加密第一期望发送给参与节点;接收所述参与节点发送加密的用于获取特征间相关系数的中间参数,其中,所述中间参数由所述参与节点根据所述加密仿射特征、所述加密第一期望以及自身的第二特征确定;对所述加密的中间参数进行解密得到所述中间参数,并基于所述中间参数,获取所述第一特征和所述第二特征之间的相关系数。本申请中,使用仿射变换及同态加密,且确保业务节点为相关系数的唯一知晓方,实现了高安全性特征间相关系数的获取。

Description

获取特征间相关系数方法、装置、电子设备及存储介质
技术领域
本申请涉及数据统计分析领域,尤其涉及一种获取特征间相关系数方法、装置、电子设备及存储介质。
背景技术
皮尔逊相关系数,可以用来度量两个对象之间的线性相关性,实现中,皮尔逊相关系数可以应用于表征不同用户之间的偏好相似程度,也可以应用于表征特征数据之间相关程度等等,故而,皮尔逊相关系数的计算在实际应用中是有价值的。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本申请第一方面提出一种获取特征间相关系数的方法。
本申请第二方面还提出一种获取特征间相关系数的方法。
本申请第三方面提出一种获取特征间相关系数的装置。
本申请第四方面还提出一种获取特征间相关系数的装置。
本申请第五方面提出一种电子设备。
本申请第六方面提出一种计算机可读存储介质。
本申请第七方面提出一种计算机程序产品。
本申请第一方面提出一种获取特征间相关系数的方法,该方法适用于业务节点,包括:对所述业务节点自身的第一特征进行仿射变换,生成仿射特征;获取所述仿射特征的第一期望,并分别对所述仿射特征和所述第一期望进行加密,将加密仿射特征和加密第一期望发送给参与节点;接收所述参与节点发送加密的用于获取特征间相关系数的中间参数,其中,所述中间参数由所述参与节点根据所述加密仿射特征、所述加密第一期望以及自身的第二特征确定;对所述加密的中间参数进行解密得到所述中间参数,并基于所述中间参数,获取所述第一特征和所述第二特征之间的相关系数。
另外,本申请第一方面提出的获取特征间相关系数的方法,还可以具有如下附加的技术特征:
根据本申请的一个实施例,所述基于所述中间参数,获取所述第一特征和所述第二特征之间的相关系数,包括:获取所述第一特征的第一方差;根据所述中间参数和所述第一方差,确定所述第一特征和所述第二特征之间的相关系数。
根据本申请的一个实施例,所述对所述业务节点自身的第一特征进行仿射变换,生成仿射特征,包括:随机生成第一随机数和第二随机数;基于所述第一随机数和所述第二随机数,对所述第一特征进行线性变换,生成所述仿射特征。
根据本申请的一个实施例,所述对所述业务节点自身的第一特征进行仿射变换之前,还包括:基于样本的标识信息,与所述参与节点进行样本对齐,并基于所述对齐后的样本生成所述业务节点的第一特征。
根据本申请的一个实施例,所述分别对所述仿射变换和所述第一期望进行加密之前,还包括:生成加密密钥,所述加密密钥包括公钥和私钥,并将所述公钥发送给所述参与节点。
根据本申请的一个实施例,所述获取所述第一特征和所述第二特征之间的相关系数之后,还包括:从多个所述第二特征所属的第二对象中,根据所述相关系数,获取所述第一特征所属的第一对象的相关第二对象;获取所述相关第二对象的推荐信息,并将所述相关对象的推荐信息作为所述第一对象的推荐信息。
根据本申请的一个实施例,所述获取所述第一特征和所述第二特征之间的相关系数之后,还包括:针对任意一个第一特征,从多个所述第二特征中,根据所述相关系数,获取所述任意一个第一特征对应的相关第二特征;对所述任意一个第一特征以及其对应的所述相关第二特征进行特征去相关处理。
本申请第二方面还提出一种获取特征间相关系数的方法,该方法适用于参与节点,包括:接收业务节点发送的加密仿射特征和所述加密仿射特征对应的加密第一期望,其中,所述加密仿射特征为所述业务节点基于自身的第一特征进行仿射变换生成;根据所述加密仿射特征、所述加密第一期望,以及所述参与节点自身的第二特征,生成用于获取特征间相关系数的中间参数;对所述中间参数进行加密,得到加密的中间参数发送给所述业务节点。
本申请第二方面提出的获取特征间相关系数的方法还可以具有如下附加的技术特征:
根据本申请的一个实施例,所述根据所述加密仿射特征、所述加密第一期望,以及所述参与节点自身的第二特征,生成用于获取特征间相关系数的中间参数,包括:获取所述第二特征的第二期望和所述第二特征的方差;基于所述加密仿射特征、所述加密第一期望以及所述第二期望和所述方差,生成所述中间参数。
根据本申请的一个实施例,所述接收业务节点发送的加密仿射特征和所述加密仿射特征对应的加密第一期望之前,还包括:基于样本的标识信息,与所述业务节点进行样本对齐,并基于所述对齐后的样本生成所述参与节点的第二特征。
根据本申请的一个实施例,所述获取特征间相关系数的方法,还包括:接收所述业务节点发送给的公钥。
本申请第三方面提出一种获取特征间相关系数的装置,包括:仿射变换模块,用于对所述业务节点自身的第一特征进行仿射变换,生成仿射特征;加密发送模块,用于获取所述仿射特征的第一期望,并分别对所述仿射变换和所述第一期望进行加密,将加密仿射特征和加密第一期望发送给参与节点;接收模块,用于接收所述参与节点发送加密的用于获取特征间相关系数的中间参数,其中,所述中间参数由所述参与节点根据所述加密仿射特征、所述加密第一期望以及自身的第二特征确定;获取模块,用于对所述加密的中间参数进行解密得到所述中间参数,并基于所述中间参数,获取所述第一特征和所述第二特征之间的相关系数。
本申请第三方面提出的获取特征间相关系数的装置还可以具有如下附加的技术特征:
根据本申请的一个实施例,所述获取模块,进一步用于:获取所述第一特征的第一方差;根据所述中间参数和所述第一方差,确定所述第一特征和所述第二特征之间的相关系数。
根据本申请的一个实施例,所述仿射变换模块,还包括:随机数生成单元,用于随机生成第一随机数和第二随机数;仿射变换单元,用于基于所述第一随机数和所述第二随机数,对所述第一特征进行线性变换,生成所述仿射特征。
根据本申请的一个实施例,所述获取特征间相关系数的装置,还包括:样本对齐模块,用于基于样本的标识信息,与所述参与节点进行样本对齐,并基于所述对齐后的样本生成所述业务节点的第一特征。
根据本申请的一个实施例,所述加密发送模块,进一步用于:生成加密密钥,所述加密密钥包括公钥和私钥,并将所述公钥发送给所述参与节点。
根据本申请的一个实施例,所述获取特征间相关系数的装置,还包括:对象获取模块,用于从多个所述第二特征所属的第二对象中,根据所述相关系数,获取所述第一特征所属的第一对象的相关第二对象;推送确定模块,用于获取所述相关第二对象的推荐信息,并将所述相关对象的推荐信息作为所述第一对象的推荐信息。
根据本申请的一个实施例,所述获取特征间相关系数的装置,还包括:特征获取模块,用于针对任意一个第一特征,从多个所述第二特征中,根据所述相关系数,获取所述任意一个第一特征对应的相关第二特征;处理模块,用于对所述任意一个第一特征以及其对应的所述相关第二特征进行特征去相关处理。
本申请第四方面还提出一种获取特征间相关系数的装置,包括:接收模块,用于接收业务节点发送的加密仿射特征和所述加密仿射特征对应的加密第一期望,其中,所述加密仿射特征为所述业务节点基于自身的第一特征进行仿射变换生成;参数生成模块,用于根据所述加密仿射特征、所述加密第一期望,以及所述参与节点自身的第二特征,生成用于获取特征间相关系数的中间参数;加密发送模块,用于对所述中间参数进行加密,得到加密的中间参数发送给所述业务节点。
本申请第四方面提出的获取特征间相关系数的装置还可以具有如下附加的技术特征:
根据本申请的一个实施例,所述生成模块,进一步用于:获取所述第二特征的第二期望和所述第二特征的方差;基于所述加密仿射特征、所述加密第一期望以及所述第二期望和所述方差,生成所述中间参数。
根据本申请的一个实施例,所述接收模块,进一步用于:基于样本的标识信息,与所述业务节点进行样本对齐,并基于所述对齐后的样本生成所述参与节点的第二特征。
根据本申请的一个实施例,所述接收模块,还用于:接收所述业务节点发送给的公钥。
本申请第五方面提出了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述第一方面和第二方面任一项提出的获取特征间相关系数的方法。
本申请第六方面提出了一种计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行第一方面和第二方面任一项提出的获取特征间相关系数的方法。
本申请第七方面提出了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据上述第一方面和第二方面任一项提出的获取特征间相关系数的方法。
本申请提出的获取特征间相关系数的方法及装置,业务节点基于第一特征生成仿射特征,生成仿射特征的第一期望,将仿射特征和第一期望加密后发送至参与节点,进一步地,接收参与节点回传的加密的用于获取特征间相关系数的中间参数。获取到加密的中间参数后,进行解密获取中间参数,进而基于该中间参数获取第一特征和第二特征之间的相关系数。本申请中,业务节点使用仿射变换实现了对第一特征的数据保护,进一步地,将仿射变换生成的对应的仿射特征以及仿射特征对应的第一期望进行同态加密后传输至参与节点,进一步避免了第一特征的数据泄露。同时,参与节点仅进行中间参数的计算,最终的相关系数由业务节点计算生成,且不会发送至参与节点,确保了业务节点为特征间相关系数的唯一知晓方,避免了参与节点基于最终的特征间相关系数推算获取业务节点的第一特征,进一步保证了业务节点的第一特征的安全,进而实现了高安全性的特征间相关系数的获取。
应当理解,本申请所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请一实施例的获取特征间相关系数的方法的流程示意图;
图2为本申请另一实施例的获取特征间相关系数的方法的流程示意图;
图3为本申请另一实施例的获取特征间相关系数的方法的流程示意图;
图4为本申请另一实施例的获取特征间相关系数的方法的流程示意图;
图5为本申请另一实施例的获取特征间相关系数的方法的流程示意图;
图6为本申请另一实施例的获取特征间相关系数的方法的流程示意图;
图7为本申请另一实施例的获取特征间相关系数的方法的流程示意图;
图8为本申请另一实施例的获取特征间相关系数的方法的流程示意图;
图9为本申请一实施例的获取特征间相关系数的装置的结构示意图;
图10为本申请另一实施例的获取特征间相关系数的装置的结构示意图;
图11为本申请另一实施例的获取特征间相关系数的装置的结构示意图;
图12为本申请另一实施例的获取特征间相关系数的装置的结构示意图;
图13为本申请一实施例的电子设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
下面参照附图描述本申请实施例的获取特征间相关系数的方法、装置、电子设备和存储介质。
图1为本申请一实施例的获取特征间相关系数的方法的流程示意图,该方法适用于业务节点,如图1所示,该方法包括:
S101,对业务节点自身的第一特征进行仿射变换,生成仿射特征。
在统计学中,皮尔逊相关系数(Pearson correlation coefficient),是用于度量两个变量X和Y之间的线性相关,其值介于-1与1之间。当皮尔逊相关系数为1时,两个变量X和Y呈现正相关,当皮尔逊相关系数为-1时,两个变量X和Y呈现负相关,当皮尔逊相关系数为0时,两个变量X和Y无线性相关关系。
实现中,特征间相关系数可以为皮尔逊相关系数,进一步地,基于安全多方计算协议(SPDZ协议)可以完成特征间相关系数的计算,在该协议框架下,特征间相关系数的计算方案存在信息数据泄露的可能性,比如特征数据的泄露,或者特征空间关系的泄露所导致的重要信息的泄露,故而,需要进行高安全性的特征间的相关系数的获取。
仿射变换,又称为仿射映射,可以将一个向量空间进行一次线性变换并接上一个平移,进而变换为另一个向量空间。
特征间的相关系数,可以用来评估业务节点所持有样本的特征与数据提供方参与节点持有的样本的特征之间的相关度。其中,业务节点(Guest)持有的样本为有标签样本,参与节点(Host)持有的样本为无标签样本,
其中,属于业务节点的样本为第一样本,基于第一样本的标识信息生成的特征为第一特征,属于参与节点的样本为第二样本,基于第二样本的标识信息生成的特征为第二特征。
需要说明的是,第一特征与第二特征是基于同一对象生成的不同维度的样本标识信息生成的特征。比如,设定样本A具有内部构造和外观信息两个维度的样本生成的特征数据,业务节点可以持有的是基于其材料、工艺等内部构造信息的样本生成的特征数据,为第一特征;参与节点可以持有的是基于其颜色、形状等外观信息的样本生成的特征数据,为第二特征。
本申请实施例中,基于仿射变换的定义,可以将业务节点所持有的第一特征进行仿射变换,生成相应的仿射特征。设定业务节点的第一特征为X1,基于仿射变换,可以生成的仿射特征为X′1
其中,第一特征X1与仿射特征X′1之间为线性关系。
S102,获取仿射特征的第一期望,并分别对仿射特征和第一期望进行加密,将加密仿射特征和加密第一期望发送给参与节点。
为了保障业务节点与参与节点之间交互数据的保密性和安全性,需要对二者之间交互的数据进行加密。可选地,业务节点可以生成一对公钥和私钥,其中,公钥用于数据加密,私钥用于数据解密,可以将其中用于加密的公钥发送至参与节点,参与节点基于加密公钥进行密文计算。
可以将公钥和私钥记为{p,p'},其中,p为公钥,p'为私钥。
本申请实施例中,第一期望为第一特征所生成的仿射特征的均值。业务节点获取到仿射特征对应的第一期望后,使用公钥对仿射特征和第一期望进行加密,并将加密后的仿射特征和第一期望发送至参与节点。
设定,业务节点的第一特征为X1,基于仿射变换生成的仿射特征为X′1,第一期望为则仿射特征X′1对应的第一期望/>可以通过如下公式获取:
其中,a和b是业务节点为了获取第一特征的仿射特征而生成的两个随机数。
使用公钥p对获取到的第一期望进行加密,生成加密后的第一期望/>使用公钥p对仿射特征X′1进行加密,获取到加密后的仿射特征<X′1>,进一步地,将二者进行组合,发送至参与节点。
S103,接收参与节点发送加密的用于获取特征间相关系数的中间参数,其中,中间参数由参与节点根据加密仿射特征、加密第一期望以及自身的第二特征确定。
本申请实施例中,属于参与节点所持有的样本的标识信息所生成的特征,为第二特征。基于参与节点的第二特征可以获取到第二特征对应的期望,进一步地,可以获取到第二特征与其对应的期望之间的方差,其中,方差为第二特征与其对应的期望之间偏离程度的度量值。
参与节点获取到加密仿射特征和加密第一期望后,基于其自身的第二特征所生成的对应的期望以及第二特征与对应的期望之间的方差,可以生成用于获取特征间相关系数的中间参数。参与节点可以采用同态加密算法对数据进行加密,对密文继续进行同态加密运算。
可选地,参与节点在获取到中间参数后,为了保证该中间参数的安全性,可以利用公钥p对中间参数进行密文计算,进而获取到加密的中间参数,并将该加密的中间参数发送至业务节点。相应地,业务节点可以接收参与节点发送的加密的中间参数。
S104,对加密的中间参数进行解密得到中间参数,并基于中间参数,获取第一特征和第二特征之间的相关系数。
本申请实施例中,业务节点获取到参与节点发送的加密中间参数后,使用私钥进行解密,进而获取到参与节点计算生成的中间参数。进一步地,业务节点基于该中间参数可以获取到第一特征和第二特征之间的相关系数。
比如,特征间的相关系数可以为皮尔逊相关系数,业务节点基于第一特征的仿射特征和第一期望之间的方差,以及获取到的参与节点发送的解密后的中间参数,计算生成皮尔逊相关系数。
本申请提出的获取特征间相关系数的方法,业务节点基于第一特征生成仿射特征,进而生成仿射特征的第一期望,将仿射特征和第一期望加密后发送至参与节点,进一步地,接收参与节点回传的加密的中间参数,其中,中间参数由参与节点计算生成。获取到加密的中间参数后,进行解密获取中间参数,并基于公式计算获取第一特征和第二特征之间的相关系数。本申请中,业务节点使用仿射变换实现了对第一特征的数据保护,进一步地,将仿射变换生成的对应的仿射特征以及仿射特征对应的第一期望进行同态加密后传输至参与节点,进一步避免了第一特征的数据泄露。同时,参与节点仅进行中间参数的计算,最终的相关系数由业务节点计算生成,且不会发送至参与节点,确保了业务节点为特征间相关系数的唯一知晓方,避免了参与节点基于最终的特征间相关系数推算获取业务节点的第一特征,进一步保证了业务节点的第一特征的安全,进而实现了高安全性的特征间相关系数的获取。
进一步地,上述实施例所提出的第一特征和第二特征之间的相关系数的获取过程,可结合图2理解,如图2所示,该方法适用于业务节点,图2为本申请另一实施例的获取特征间相关系数的方法的流程示意图,包括:
S201,获取第一特征的第一方差。
方差,是衡量源数据和期望相差的度量值,可以实现变量和其对应的期望之间的偏离程度的度量。
本申请实施例中,利用仿射变换生成第一特征的仿射特征,进而可以生成仿射特征对应的第一期望,获取到第一期望后,进而计算生成仿射特征和第一期望之间的方差。
其中,第一方差可以基于第一特征中各维度特征对应的特征值确定。
设定,第一特征X1仿射变换后生成的仿射特征X′1的第一期望为进一步获取到的第一特征的方差为σx1,该方差即为第一特征的第一方差。
需要说明的是,第一特征的第一方差由业务节点计算生成,且不发送至参与节点。
S202,根据中间参数和第一方差,确定第一特征和第二特征之间的相关系数。
本申请实施例中,业务节点获取到参与节点发送的加密的中间参数后,进行解密,获取到参与节点利用公钥进行密文计算生成的中间参数,并将中间参数和第一方差进行计算进而生成第一特征和第二特征之间的相关系数。
设定,将获取到的参与节点发送的加密中间参数<k>解密,获取到解密后的中间参数k,结合第一特征的方差为σx1,根据如下公式计算获取第一特征与第二特征之间的相关系数,公式如下:
其中,ρx1x2代表第一特征与第二特征的中间系数,a为业务节点随机生成的随机数。
需要说明的是,业务节点在计算生成的特征间的相关系数后,不会将该数据发送至参与节点,确保了业务节点为第一特征与第二特征之间相关系数的唯一知晓方。
本申请提出的获取特征间相关系数的方法,获取第一特征的第一方差,解密接收到的参与节点发送的加密的中间参数,基于获取的第一方差和解密后的中间参数,计算生成第一特征与第二特征之间的相关系数。本申请中,第一特征与第二特征之间的相关系数的获取由业务节点负责,且不会发送至参与节点,确保了业务节点为第一特征与第二特征之间相关系数的唯一知晓方,进而实现了高安全性的特征间相关系数的获取。
进一步地,为更好的理解上述实施例中所提出的仿射特征的生成过程,可结合图3,如图3所示,该方法适用于业务节点,图3为本申请另一实施例的获取特征间相关系数的方法的流程示意图,包括:
S301,基于样本的标识信息,与参与节点进行样本对齐,并基于对齐后的样本生成业务节点的第一特征。
为多维度地刻画同一个对象,该同一对象在业务节点和参与节点上的相关数据可以作为该同一对象的样本,即业务节点上存储有该同一对象的部分样本,参与节点上可以存储有该同一对象的另一部分样本。每个样本都有一个标识信息,该标识信息可以为同一对象的标识信息,比如,可以为身份证标识号、账号、唯一编码、专属号码等。业务节点和参与节点上存储的对象可能有差别,需要通过样本对应的标识信息进行样本对齐,得到多个数据源中的共同对象。
本申请实施例中,基于样本的标识信息,将业务节点与参与节点进行样本对齐,进一步地,确定属于业务节点和参与节点的标识信息。比如,属于同一个动物的样本,如“狗”,样本分别存储于业务节点和参与节点,其中,业务节点可能存储该动物的部分特征,比如年龄、体重、身高等。而参与节点上可能存储有该动物的另一部分特征,比如年龄、体重、身高等。业务节点可以基于存储的该动物的品种、颜色等信息生成该动物的第一特征。相应地,参与节点可以基于存储的该动物的品种、颜色等信息生成该动物的第二特征。
的第一样本和属于参与节点的第二样本。其中,第一样本和第二样本是基于同一对象的不同维度的样本数据。
基于对齐后的第一样本的标识信息生成对应的第一特征。
S302,随机生成第一随机数和第二随机数。
为了实现对第一特征的仿射变换,同时,保证业务节点的第一特征的数据安全,业务节点需要生成两个随机数,并基于随机数生成第一特征的仿射特征。
设定,业务节点生成的两个随机数可以为a和b。可选地,业务节点可以基于随机数生成器,生成两个随机数。
其中,数值a和b是随机生成的,故而,第一特征的仿射特征的生成也具有了随机性,进一步地实现了对业务节点第一特征数据的保密。
S303,基于第一随机数和第二随机数,对第一特征进行线性变换,生成仿射特征。
业务节点基于两个随机数,可以实现对第一特征的线性变换,进而生成第一特征的仿射特征。
设定,业务节点生成两个随机数,分别为a和b,第一特征为X1,则基于随机数a和b对第一特征X1进行线性变换,公式如下:
X′1=aX1+b
其中,X′1代表基于仿射变换生成的第一特征X1的仿射特征。
本申请提出的获取特征间相关系数的方法,示出了第一特征的仿射特征的生成过程,基于生成的两个随机数,对第一特征进行仿射变换,进而生成仿射特征。本申请中,由于两个数值是随机生成的,进而使得生成的仿射特征具有了随机性,避免了参与节点基于仿射特征推算获取业务节点的第一特征,避免了特征的泄露,进一步实现了高安全性的特征间相关系数的获取。
为了保障数据传输的安全性,本申请所提出的获取特征间相关系数的方法中,需要对交互的数据进行加密处理。
作为一种可能实现的方式,业务节点可以采生成加密密钥,加密密钥包括公钥和私钥,并将公钥发送给参与节点。
本申请实施例中,业务节点使用同态加密的算法,生成加密密钥,密钥包含公钥和私钥,其中,公钥用于数据加密,私钥用于数据解密。生成密钥后,将用于加密的公钥发送至参与节点。
设定,业务节点生成的包含公钥和私钥的密钥,记为{p,p'}。进一步地,可以随机选择两个大的质数p与q,其中,p不等于q。设定令N=p×q,r=(p-1)×(q-1)。选择一个小于r的整数e,并求得e关于r的模反元素d,进一步地,可以确定公钥为(N,e),私钥为(N,d)。
本申请提出的获取特征间相关系数的方法,业务节点生成加密密钥,并将公钥发送至参与节点,参与节点仅持有公钥,保证了业务节点的数据的保密性。
实现中,通过上述实施例所提出的方法进而获取到的特征间相关系数,存在多个应用场景。
可选地,如图4所示,该方法适用于业务节点,图4为本申请另一实施例的获取特征间相关系数的方法的流程示意图,包括:
S401,从多个第二特征所属的第二对象中,根据相关系数,获取第一特征所属的第一对象的相关第二对象。
实现中,特征间相关系数可以用于刻画两个对象之间的线性相似性,相关度越高,则相似度越高,反之,相关度越低,相似性越低。在实际场景应用中,基于协同过滤的用户最近邻推荐方案,可以使用特征间相关系数来刻画不同用户之间的偏好相似程度,进而基于该相似程度进行后续活动或者广告等信息推送。
本申请实施例中,属于参与节点的,可以提取出第二特征的样本,确定为第二样本,第二样本所属的对象为第二对象。相应地,属于业务节点的,可以提取出第一特征的样本,确定为第一样本,第一样本所属的对象为第一对象。
针对某一个第一特征,其所属的第一对象可以有多个,针对第一特征所属的任一第一对象,基于业务节点获取的第一特征与第二特征之间的相关系数,可以筛选出与第一特征高度相关的对应的第二特征,进而获取到第一特征的高相关的第二特征所属的第二对象,并将其确定为第一特征所属的第一对象的相关第二对象。
比如,特征间相关系数可以为皮尔逊相关系数,皮尔逊相关系数的取值范围为-1~1,其中,当皮尔逊相关系数为1时,第一特征和第二特征呈现正相关,当皮尔逊相关系数为-1时,第一特征和第二特征呈现负相关,当皮尔逊相关系数为0时,第一特征和第二特征无线性相关关系。
针对某一个第一特征,业务节点获取到第一特征与第二特征之间的皮尔逊相关系数后,从大到小对获取到的多个皮尔逊相关系数进行排序,选取其中最接近于1的皮尔逊相关系数,该相关系数所对应的第二特征即为第一特征所对应的高相关度的第二特征,进一步地,该第二特征所属的第二对象可以确定为第一特征所属的第一对象的相关第二对象。
其中,第一特征的高相关度的第二特征所属的第二对象可以是一个,也可以是多个。
S402,获取相关第二对象的推荐信息,并将相关对象的推荐信息作为第一对象的推荐信息。
本申请实施例中,第一对象与其相关第二对象,对应的第一特征与第二特征高度相关,可以理解为,第一对象与其相关的第二对象所对应的特征之间的相似度较高,基于相关第二对象可以获取到其对应的推荐信息。
进一步地,针对第一对象,相关第二对象的推荐信息可用性较高,可以将相关对象的推荐信息作为第一对象的推荐信息。
实现中,基于协同过滤的用户最近邻推荐方案,第一对象和其相关第二对象的偏好相似程度较高,可以将相关第二对象的推荐信息推送给第一对象。
本申请提出的获取特征间相关系数的方法,基于协同过滤的用户最近邻推荐方法,获取第一对象的相关第二对象的推荐信息,并推荐给第一对象,提高了推荐的准确性以及时效性,示出了特征间相关系数在实际应用场景中的重要性。
可选的,如图5所示,该方法适用于业务节点,图5为本申请另一实施例的获取特征间相关系数的方法的流程示意图,包括:
在模型训练中,需要对参与训练的数据进行预处理,基于特征间的相关系数,对冗余或者不重要的特征进行筛选以及删除,使得预处理后的特征更具有可用性,进而有效提高模型训练的效率。同时,使用特征间相关系数,对高相关的特征进行筛选,避免了高相关的特征数据对于模型训练产生的负面影响,比如通用性较差等,进而保证模型训练的准确性,优化模型训练的效果。
S501,针对任意一个第一特征,从多个第二特征中,根据相关系数,获取任意一个第一特征对应的相关第二特征。
本申请实施中,第一特征与第二特征之间的相关系数,可以表征第一特征与第二特征之间的线性相似性,相关系数越大,则相关度越高。针对某一个第一特征,可以将业务节点计算生成的特征间相关系数从大到小进行排序,进一步地,最大的相关系数所对应的第二特征,可以确定为该第一特征对应的相关第二特征。
S502,对任意一个第一特征以及其对应的相关第二特征进行特征去相关处理。
为了保障部分实际应用场景中,不会因为特征的高度相关影响最终的输出结果,需要对高相关度的特征进行去相关处理。比如,在风控场景下,当特征间存在高度相关性时,会导致估计系数的有偏以及估计系数的显著性有误,进而影响模型的效果,故而,需要对该场景下的特征进行去相关处理,进而保证模型的准确性和效果。
本申请实施例中,针对某一个第一特征的高相关度的相关第二特征,可以进行删除处理,在高相关度的第一特征和其相关第二特征中,仅保留第一特征,完成去相关处理。可选地,也可以在高相关度的第一特征和其相关第二特征中,仅保留第二特征,完成去相关处理。
本申请提出的获取特征间系数的方法,基于实际场景中的高相关特征可能造成的对输出结果的负面影响,提出了特征间去相关处理的方法,示出了特征间相关系数在实际应用场景中的重要性。
为实现上述实施例提出的,适用于业务节点的获取特征间相关系数的方法,本申请还提出一种获取特征间相关系数的方法,该方法适用于参与节点,如图6所示,图6为本申请另一实施例的获取特征间相关系数的方法的流程示意图,包括:
S601,接收业务节点发送的加密仿射特征和加密仿射特征对应的加密第一期望,其中,加密仿射特征为业务节点基于自身的第一特征进行仿射变换生成。
本申请实施例中,业务节点基于其持有的第一特征,通过仿射变换生成对应的仿射特征。进一步地,基于获取到的仿射特征可以生成仿射特征的第一期望。业务节点采用同态加密算法,将仿射特征和第一期望加密后,发送至参与节点。参与节点可以实现与业务节点的信息交互,接收业务节点发送的加密的仿射特征和其对应的加密第一期望。
S602,根据加密仿射特征、加密第一期望,以及参与节点自身的第二特征,生成用于获取特征间相关系数的中间参数。
本申请实施例中,参与节点自身所持有的样本的标识信息所生成的特征为第二特征,基于参与节点的第二特征和其对应的期望,可以获取到二者之间的方差。
参与节点可以基于加密仿射特征、加密第一期望以及参与节点自身的第二特征所生成的对应的期望以及第二特征与对应的期望之间的方差,生成用于获取特征间相关系数的中间参数。
S603,对中间参数进行加密,得到加密的中间参数发送给业务节点。
本申请实施例中,参与节点可以采用同态加密的算法对数据进行加密,并对密文进行同态加密运算。参与节点计算生成中间参数后,可以利用公钥对中间参数进行加密,并将加密中间参数发送至业务节点。
本申请提出的获取特征间相关系数的方法,参与节点生成第二特征的第二期望,进而获取第二特征与第二期望之间的方差,基于获取到的业务节点发送的第一特征对应的加密仿射特征以及加密第一期望,结合其计算生成的第二特征与对应的方差,完成中间参数的计算。本申请中,业务节点将同态加密后的数据发送至参与节点,保障了数据的安全,同时,参与节点仅进行中间参数的计算,确保了业务节点为最终特征间相关系数的唯一知晓方,进一步避免了第一特征的数据泄露,进而实现了高安全性的特征间相关系数的获取。
上述实施例中,所提出的中间参数的获取过程,可结合图7进一步地理解,如图7所示,该方法适用于参与节点,图7为本申请另一实施例的获取特征间相关系数的方法的流程示意图,包括:
S701,基于样本的标识信息,与业务节点进行样本对齐,并基于对齐后的样本生成参与节点的第二特征。
本申请实施例中,基于样本的标识信息,将业务节点与参与节点进行样本对齐,进一步地,确定属于参与节点的第二样本。
基于对齐后的第二样本的标识信息生成对应的第二特征。
S702,接收业务节点发送的加密仿射特征和加密仿射特征对应的加密第一期望。
步骤S702可以参见上述相关详细内容,此处不再赘述。
S703,获取第二特征的第二期望和第二特征的方差。
本申请实施例中,第二特征对应的期望可以确定为第二期望,参与节点基于第二特征与第二期望,可以获取到二者之间的方差,其中,该方差可以实现对第二特征与第二期望之间的误差的度量。
其中,第二方差可以基于第二特征中各维度特征对应的特征值确定。
设定,第二特征为X2,第二特征X2的第二期望为μx2,则第二特征与第二期望μx2之间的方差为σx2
S704,基于加密仿射特征、加密第一期望以及第二期望和方差,生成中间参数。
本申请实施例中,参与节点基于生成的第二期望和其对应的方差,以及获取的业务节点发送的加密仿射特征以及加密第一期望,可以计算生成中间参数。
设定,加密仿射特征为<X′1>,加密第一期望为第二特征为X2,第二特征X2的第二期望为μx2,第二特征与第二期望μx2之间的方差为σx2,参与节点结合如下公式计算,进而获取到中间参数<k>,公式如下:/>
需要说明的是,参与节点是利用公钥p完成的密文计算,进一步保证了业务节点的数据安全。
本申请提出的获取特征间相关系数的方法,根据第二特征生成第二期望,进而获取第二特征与第二期望之间的方差,结合获取的业务节点发送的加密仿射特征以及加密第一期望,完成中间参数的计算。本申请中,业务节点将同态加密后的数据发送至参与节点,保障了数据的安全,同时,参与节点仅进行中间参数的计算,确保了业务节点为最终特征间相关系数的唯一知晓方,进一步避免了第一特征的数据泄露,进而实现了高安全性的特征间相关系数的获取。
为了保障数据传输的安全性,本申请所提出的获取特征间相关系数的方法中需要对传输的数据进行加密处理。
作为一种可能实现的方式,业务节点可以采生成加密密钥,加密密钥包括公钥和私钥,并将公钥发送给参与节点,参与节点接收业务节点发送的公钥。
本申请实施例中,业务节点利用同态机密算法进行数据加密,生成包含公钥和私钥的密钥后,将用于加密的公钥发送至参与节点,参与节点接收,并利用获取的公钥进行密文计算。
本申请提出的获取特征间相关系数的方法,参与节点基于获取的业务节点生成并发送的公钥,进行密文计算进而生成中间参数,本申请中,参与节点仅持有公钥,保证了业务节点的数据的保密性。
为更好的理解上述实施例,可结合图8,图8为本申请另一实施例的获取特征间相关系数的方法的流程示意图,如图8所示,该方法包括:
S801,业务节点与参与节点进行样本对其,并基于样本生成业务节点的第一特征和参与节点的第二特征。
S802,业务节点基于同态加密算法,生成密钥,其中包括公钥和私钥。
S803,业务节点发送公钥至参与节点。
S804,参与节点接收公钥。
S805,业务节点对第一特征进行仿射变换,生成仿射特征。进一步地,基于仿射特征,生成第一期望,并获取仿射特征与第一期望之间的方差。
S806,业务节点利用公钥对仿射特征以及第一期望进行加密,获取到加密仿射特征与加密第一期望。
S807,业务节点发送加密仿射特征与加密第一期望至参与节点。
S808,参与节点获取业务节点发送的加密仿射特征与加密第一期望。
S809,参与节点获取第二特征的第二期望,并获取第二特征与第二期望之间的方差。
S810,参与节点基于第二期望,以及获取的业务节点发送的加密仿射特征和加密第一期望,计算生成中间参数。
S811,参与节点使用公钥对中间参数进行加密。
S812,参与节点发送加密后的中间参数至业务节点。
S813,业务节点接收参与节点发送的加密后的中间参数,并使用私钥进行解密,获取到参与节点计算生成的中间参数。
S814,业务节点基于第一特征的仿射特征与第一期望的方差、中间参数计算生成第一特征与第二特征之间的相关系数。
本申请提出的获取特征间相关系数的方法,确定业务节点的第一特征和参与节点的第二特征。业务节点对第一特征进行仿射变换,生成仿射特征,进而生成第一期望,并获取仿射特征与第一期望之间的方差。业务节点基于同态加密算法,生成密钥,其中包括公钥和私钥,并将公钥发送至参与节点。进一步地,业务节点利用公钥对仿射特征以及第一期望进行加密,获取到加密仿射特征与加密第一期望,并发送至参与节点。参与节点获取第二特征的第二期望,并获取第二特征与第二期望之间的方差,结合获取到的业务节点发送的加密仿射特征与加密第一期望,计算生成中间参数,进一步地,利用接收到的业务节点发送的用于加密的公钥对中间参数进行加密,生成加密后的中间参数并发送至业务节点。业务节点接收参与节点发送的加密后的中间参数,使用私钥进行解密,获取到参与节点计算生成的中间参数,进一步地,基于第一特征的仿射特征与第一期望的方差、中间参数计算生成第一特征与第二特征之间的相关系数。本申请中,业务节点使用仿射变换实现了对第一特征的数据保护,进一步地,将仿射变换生成的对应的仿射特征以及仿射特征对应的第一期望进行同态加密后传输至参与节点,进一步避免了第一特征的数据泄露。同时,参与节点仅进行中间参数的计算,最终的相关系数由业务节点计算生成,且不会发送至参与节点,确保了业务节点为特征间相关系数的唯一知晓方,避免了参与节点基于最终的特征间相关系数推算获取业务节点的第一特征,进一步保证了业务节点的第一特征的安全,进而实现了高安全性的特征间相关系数的获取。
与上述几种实施例提出的获取特征间相关系数的方法相对应,本申请的一个实施例还提出了一种获取特征间相关系数的装置,由于本申请实施例提出的获取特征间相关系数的装置与上述几种实施例提出的获取特征间相关系数的方法相对应,因此上述获取特征间相关系数的方法的实施方式也适用于本申请实施例提出的获取特征间相关系数的装置,在下述实施例中不再详细描述。
为了实现上述实施例提出的,适用于业务节点的获取特征间相关系数的方法,本申请提出了一种获取特征间相关系数的装置。图9为本申请一实施例的获取特征间相关系数的装置的结构示意图,如图9所示,获取特征间相关系数的装置100,包括仿射变换模块11、加密发送模块12、接收模块13、获取模块14,其中:
仿射变换模块11,用于对业务节点自身的第一特征进行仿射变换,生成仿射特征;
加密发送模块12,用于获取仿射特征的第一期望,并分别对仿射变换和第一期望进行加密,将加密仿射特征和加密第一期望发送给参与节点;
接收模块13,用于接收参与节点发送加密的用于获取特征间相关系数的中间参数,其中,中间参数由参与节点根据加密仿射特征、加密第一期望以及自身的第二特征确定;
获取模块14,用于对加密的中间参数进行解密得到中间参数,并基于中间参数,获取第一特征和第二特征之间的相关系数。
图10为本申请一实施例的获取特征间相关系数的装置的结构示意图,如图10所示,获取特征间相关系数的装置200,包括仿射变换模块21、加密发送模块22、接收模块23、获取模块24、样本对齐模块25、对象获取模块26、推送确定模块27、特征获取模块28、处理模块29,其中:
需要说明的是,仿射变换模块11、加密发送模块12、接收模块13、获取模块14与仿射变换模块21、加密发送模块22、接收模块23、获取模块24,具备相同的结构和功能。
本申请实施例中,获取模块24,进一步用于:获取第一特征的第一方差;根据中间参数和第一方差,确定第一特征和第二特征之间的相关系数。
本申请实施例中,仿射变换模块21,还包括:
随机数生成单元211,用于随机生成第一随机数和第二随机数;
仿射变换单元212,用于基于第一随机数和第二随机数,对第一特征进行线性变换,生成仿射特征。
本申请实施例中,获取特征间相关系数的装置200,还包括样本对齐模块25,其中:
样本对齐模块25,用于基于样本的标识信息,与参与节点进行样本对齐,并基于对齐后的样本生成业务节点的第一特征。
本申请实施例中,加密发送模块22,进一步用于:生成加密密钥,加密密钥包括公钥和私钥,并将公钥发送给参与节点。
本申请实施例中,获取特征间相关系数的装置200,还包括对象获取模块26、推送确定模块27,其中:
对象获取模块26,用于从多个第二特征所属的第二对象中,根据相关系数,获取第一特征所属的第一对象的相关第二对象;
推送确定模块27,用于获取相关第二对象的推荐信息,并将相关对象的推荐信息作为第一对象的推荐信息。
本申请实施例中,获取特征间相关系数的装置200,还包括特征获取模块28、处理模块29,其中:
特征获取模块28,用于针对任意一个第一特征,从多个第二特征中,根据相关系数,获取任意一个第一特征对应的相关第二特征;
处理模块29,用于对任意一个第一特征以及其对应的相关第二特征进行特征去相关处理。
本申请提出的获取特征间相关系数的装置,业务节点使用仿射变换实现了对第一特征的数据保护,进一步地,将仿射变换生成的对应的仿射特征以及仿射特征对应的第一期望进行同态加密后传输至参与节点,进一步避免了第一特征的数据泄露。同时,参与节点仅进行中间参数的计算,最终的相关系数由业务节点计算生成,且不会发送至参与节点,确保了业务节点为特征间相关系数的唯一知晓方,避免了参与节点基于最终的特征间相关系数推算获取业务节点的第一特征,进一步保证了业务节点的第一特征的安全,进而实现了高安全性的特征间相关系数的获取。
为了实现上述实施例提出的,适用于参与节点的获取特征间相关系数的方法,本申请提出了一种获取特征间相关系数的装置。图11为本申请一实施例的获取特征间相关系数的装置的结构示意图,如图11所示,获取特征间相关系数的装置300,包括接收模块31、参数生成模块32、加密发送模块33,其中:
接收模块31,用于接收业务节点发送的加密仿射特征和加密仿射特征对应的加密第一期望,其中,加密仿射特征为业务节点基于自身的第一特征进行仿射变换生成;
参数生成模块32,用于根据加密仿射特征、加密第一期望,以及参与节点自身的第二特征,生成用于获取特征间相关系数的中间参数;
加密发送模块33,用于对中间参数进行加密,得到加密的中间参数发送给业务节点。
图12为本申请一实施例的获取特征间相关系数的装置的结构示意图,如图12所示,获取特征间相关系数的装置400,包括接收模块41、参数生成模块42、加密发送模块43,其中:
需要说明的是,接收模块31、参数生成模块32、加密发送模块33与接收模块41、参数生成模块42、加密发送模块43,具备相同的结构和功能。
本申请实施例中,参数生成模块42,进一步用于:获取第二特征的第二期望和第二特征的方差;基于加密仿射特征、加密第一期望以及第二期望和方差,生成中间参数。
本申请实施例中,接收模块41,进一步用于:基于样本的标识信息,与业务节点进行样本对齐,并基于对齐后的样本生成参与节点的第二特征。
本申请实施例中,接收模块41,还用于:接收业务节点发送给的公钥。
本申请提出的获取特征间相关系数的装置,业务节点将同态加密后的数据发送至参与节点,保障了数据的安全,同时,参与节点仅进行中间参数的计算,确保了业务节点为最终特征间相关系数的唯一知晓方,进一步避免了第一特征的数据泄露,进而实现了高安全性的特征间相关系数的获取。
为达到上述实施例,本申请还提出了一种电子设备、一种计算机可读存储介质和一种计算机程序产品。
图13示出了可以用来实施本申请的实施例的示例电子设备1300的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图13所示,设备1300包括存储器131、处理器132及存储在存储131上并可在处理器132上运行的计算机程序,处理器132执行程序指令时,实现上述实施例提出的获取特征间相关系数的方法。
本申请实施例提出的电子设备,通过处理器132执行存储在存储器131上的计算机程序,确定业务节点的第一特征和参与节点的第二特征。业务节点对第一特征进行仿射变换,生成仿射特征,进而生成第一期望,并获取仿射特征与第一期望之间的方差。业务节点基于同态加密算法,生成密钥,其中包括公钥和私钥,并将公钥发送至参与节点。进一步地,业务节点利用公钥对仿射特征以及第一期望进行加密,获取到加密仿射特征与加密第一期望,并发送至参与节点。参与节点获取第二特征的第二期望,并获取第二特征与第二期望之间的方差,结合获取到的业务节点发送的加密仿射特征与加密第一期望,计算生成中间参数,进一步地,利用接收到的业务节点发送的用于加密的公钥对中间参数进行加密,生成加密后的中间参数并发送至业务节点。业务节点接收参与节点发送的加密后的中间参数,使用私钥进行解密,获取到参与节点计算生成的中间参数,进一步地,基于第一特征的仿射特征与第一期望的方差、中间参数计算生成第一特征与第二特征之间的相关系数。本申请中,业务节点使用仿射变换实现了对第一特征的数据保护,进一步地,将仿射变换生成的对应的仿射特征以及仿射特征对应的第一期望进行同态加密后传输至参与节点,进一步避免了第一特征的数据泄露。同时,参与节点仅进行中间参数的计算,最终的相关系数由业务节点计算生成,且不会发送至参与节点,确保了业务节点为特征间相关系数的唯一知晓方,避免了参与节点基于最终的特征间相关系数推算获取业务节点的第一特征,进一步保证了业务节点的第一特征的安全,进而实现了高安全性的特征间相关系数的获取。
本申请实施例提出的一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器132执行时,实现上述实施例提出的获取特征间相关系数的方法。
本申请实施例的计算机可读存储介质,通过存储计算机程序并被处理器执行,通过处理器132执行存储在存储器131上的计算机程序,确定业务节点的第一特征和参与节点的第二特征。业务节点对第一特征进行仿射变换,生成仿射特征,进而生成第一期望,并获取仿射特征与第一期望之间的方差。业务节点基于同态加密算法,生成密钥,其中包括公钥和私钥,并将公钥发送至参与节点。进一步地,业务节点利用公钥对仿射特征以及第一期望进行加密,获取到加密仿射特征与加密第一期望,并发送至参与节点。参与节点获取第二特征的第二期望,并获取第二特征与第二期望之间的方差,结合获取到的业务节点发送的加密仿射特征与加密第一期望,计算生成中间参数,进一步地,利用接收到的业务节点发送的用于加密的公钥对中间参数进行加密,生成加密后的中间参数并发送至业务节点。业务节点接收参与节点发送的加密后的中间参数,使用私钥进行解密,获取到参与节点计算生成的中间参数,进一步地,基于第一特征的仿射特征与第一期望的方差、中间参数计算生成第一特征与第二特征之间的相关系数。本申请中,业务节点使用仿射变换实现了对第一特征的数据保护,进一步地,将仿射变换生成的对应的仿射特征以及仿射特征对应的第一期望进行同态加密后传输至参与节点,进一步避免了第一特征的数据泄露。同时,参与节点仅进行中间参数的计算,最终的相关系数由业务节点计算生成,且不会发送至参与节点,确保了业务节点为特征间相关系数的唯一知晓方,避免了参与节点基于最终的特征间相关系数推算获取业务节点的第一特征,进一步保证了业务节点的第一特征的安全,进而实现了高安全性的特征间相关系数的获取。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本身的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本申请的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、互联网和区块链网络。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端服务器关系的计算机程序来产生客户端和服务器的关系。服务端可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务(“VirtualPrivate Server”,或简称“VPS”)中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合区块链的服务器。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (23)

1.一种获取特征间相关系数的方法,其特征在于,适用于业务节点,所述方法包括:
对所述业务节点自身的第一特征进行仿射变换,生成仿射特征;
获取所述仿射特征的第一期望,并分别对所述仿射特征和所述第一期望进行加密,将加密仿射特征和加密第一期望发送给参与节点;
接收所述参与节点发送加密的用于获取特征间相关系数的中间参数,其中,所述中间参数由所述参与节点根据所述加密仿射特征、所述加密第一期望以及自身的第二特征确定;
对所述加密的中间参数进行解密得到所述中间参数,并基于所述中间参数,获取所述第一特征和所述第二特征之间的相关系数;
所述基于所述中间参数,获取所述第一特征和所述第二特征之间的相关系数,包括:
获取所述第一特征的第一方差;
根据所述中间参数和所述第一方差,确定所述第一特征和所述第二特征之间的相关系数。
2.根据权利要求1所述的方法,其特征在于,所述对所述业务节点自身的第一特征进行仿射变换,生成仿射特征,包括:
随机生成第一随机数和第二随机数;
基于所述第一随机数和所述第二随机数,对所述第一特征进行线性变换,生成所述仿射特征。
3.根据权利要求2所述的方法,其特征在于,所述对所述业务节点自身的第一特征进行仿射变换之前,还包括:
基于样本的标识信息,与所述参与节点进行样本对齐,并基于所述对齐后的样本生成所述业务节点的第一特征。
4.根据权利要求2所述的方法,其特征在于,所述分别对所述仿射变换和所述第一期望进行加密之前,还包括:
生成加密密钥,所述加密密钥包括公钥和私钥,并将所述公钥发送给所述参与节点。
5.根据权利要求1所述的方法,其特征在于,所述获取所述第一特征和所述第二特征之间的相关系数之后,还包括:
从多个所述第二特征所属的第二对象中,根据所述相关系数,获取所述第一特征所属的第一对象的相关第二对象;
获取所述相关第二对象的推荐信息,并将所述相关对象的推荐信息作为所述第一对象的推荐信息。
6.根据权利要求1所述的方法,其特征在于,所述获取所述第一特征和所述第二特征之间的相关系数之后,还包括:
针对任意一个第一特征,从多个所述第二特征中,根据所述相关系数,获取所述任意一个第一特征对应的相关第二特征;
对所述任意一个第一特征以及其对应的所述相关第二特征进行特征去相关处理。
7.一种获取特征间相关系数的方法,其特征在于,适用于参与节点,所述方法包括:
接收业务节点发送的加密仿射特征和所述加密仿射特征对应的加密第一期望,其中,所述加密仿射特征为所述业务节点基于自身的第一特征进行仿射变换生成;
根据所述加密仿射特征、所述加密第一期望,以及所述参与节点自身的第二特征,生成用于获取特征间相关系数的中间参数;
对所述中间参数进行加密,得到加密的中间参数发送给所述业务节点。
8.根据权利要求7所述的方法,其特征在于,所述根据所述加密仿射特征、所述加密第一期望,以及所述参与节点自身的第二特征,生成用于获取特征间相关系数的中间参数,包括:
获取所述第二特征的第二期望和所述第二特征的方差;
基于所述加密仿射特征、所述加密第一期望以及所述第二期望和所述方差,生成所述中间参数。
9.根据权利要求7或8所述的方法,其特征在于,所述接收业务节点发送的加密仿射特征和所述加密仿射特征对应的加密第一期望之前,还包括:
基于样本的标识信息,与所述业务节点进行样本对齐,并基于所述对齐后的样本生成所述参与节点的第二特征。
10.根据权利要求7所述的方法,其特征在于,还包括:
接收所述业务节点发送给的公钥。
11.一种获取特征间相关系数的装置,其特征在于,适用于业务节点,包括:
仿射变换模块,用于对所述业务节点自身的第一特征进行仿射变换,生成仿射特征;
加密发送模块,用于获取所述仿射特征的第一期望,并分别对所述仿射变换和所述第一期望进行加密,将加密仿射特征和加密第一期望发送给参与节点;
接收模块,用于接收所述参与节点发送加密的用于获取特征间相关系数的中间参数,其中,所述中间参数由所述参与节点根据所述加密仿射特征、所述加密第一期望以及自身的第二特征确定;
获取模块,用于对所述加密的中间参数进行解密得到所述中间参数,并基于所述中间参数,获取所述第一特征和所述第二特征之间的相关系数;
所述基于所述中间参数,获取所述第一特征和所述第二特征之间的相关系数,包括:
获取所述第一特征的第一方差;
根据所述中间参数和所述第一方差,确定所述第一特征和所述第二特征之间的相关系数。
12.根据权利要求11所述的装置,其特征在于,所述仿射变换模块,还包括:
随机数生成单元,用于随机生成第一随机数和第二随机数;
仿射变换单元,用于基于所述第一随机数和所述第二随机数,对所述第一特征进行线性变换,生成所述仿射特征。
13.根据权利要求12所述的装置,其特征在于,还包括:
样本对齐模块,用于基于样本的标识信息,与所述参与节点进行样本对齐,并基于所述对齐后的样本生成所述业务节点的第一特征。
14.根据权利要求12所述的装置,其特征在于,所述加密发送模块,进一步用于:
生成加密密钥,所述加密密钥包括公钥和私钥,并将所述公钥发送给所述参与节点。
15.根据权利要求11所述的装置,其特征在于,还包括:
对象获取模块,用于从多个所述第二特征所属的第二对象中,根据所述相关系数,获取所述第一特征所属的第一对象的相关第二对象;
推送确定模块,用于获取所述相关第二对象的推荐信息,并将所述相关对象的推荐信息作为所述第一对象的推荐信息。
16.根据权利要求11所述的装置,其特征在于,还包括:
特征获取模块,用于针对任意一个第一特征,从多个所述第二特征中,根据所述相关系数,获取所述任意一个第一特征对应的相关第二特征;
处理模块,用于对所述任意一个第一特征以及其对应的所述相关第二特征进行特征去相关处理。
17.一种获取特征间相关系数的装置,其特征在于,适用于参与节点,包括:
接收模块,用于接收业务节点发送的加密仿射特征和所述加密仿射特征对应的加密第一期望,其中,所述加密仿射特征为所述业务节点基于自身的第一特征进行仿射变换生成;
参数生成模块,用于根据所述加密仿射特征、所述加密第一期望,以及所述参与节点自身的第二特征,生成用于获取特征间相关系数的中间参数;
加密发送模块,用于对所述中间参数进行加密,得到加密的中间参数发送给所述业务节点。
18.根据权利要求17所述的装置,其特征在于,所述参数生成模块,进一步用于:
获取所述第二特征的第二期望和所述第二特征的方差;
基于所述加密仿射特征、所述加密第一期望以及所述第二期望和所述方差,生成所述中间参数。
19.根据权利要求17或18所述的装置,其特征在于,所述接收模块,进一步用于:
基于样本的标识信息,与所述业务节点进行样本对齐,并基于所述对齐后的样本生成所述参与节点的第二特征。
20.根据权利要求17所述的装置,其特征在于,所述接收模块,还用于:
接收所述业务节点发送给的公钥。
21.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-6和权利要求7-10中任一项所述的方法。
22.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-6和权利要求7-10中任一项所述的方法。
23.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-6和权利要求7-10中任一项所述的方法。
CN202110382358.5A 2021-04-09 2021-04-09 获取特征间相关系数方法、装置、电子设备及存储介质 Active CN113806760B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110382358.5A CN113806760B (zh) 2021-04-09 2021-04-09 获取特征间相关系数方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110382358.5A CN113806760B (zh) 2021-04-09 2021-04-09 获取特征间相关系数方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN113806760A CN113806760A (zh) 2021-12-17
CN113806760B true CN113806760B (zh) 2024-05-17

Family

ID=78892988

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110382358.5A Active CN113806760B (zh) 2021-04-09 2021-04-09 获取特征间相关系数方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113806760B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114444106B (zh) * 2022-02-07 2023-03-17 百度在线网络技术(北京)有限公司 相关系数获取方法、装置、电子设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104272096A (zh) * 2012-03-08 2015-01-07 阿普菲弗有限责任公司 基于高空间分辨率测量材料应变的系统及方法
CN104299228A (zh) * 2014-09-23 2015-01-21 中国人民解放军信息工程大学 一种基于精确点位预测模型的遥感影像密集匹配方法
CN108768630A (zh) * 2018-05-25 2018-11-06 全链通有限公司 区块链节点的加密通信方法和系统
CN111404943A (zh) * 2020-03-18 2020-07-10 腾讯科技(深圳)有限公司 数据的处理方法、装置、电子设备及计算机可读存储介质
CN111429254A (zh) * 2020-03-19 2020-07-17 腾讯科技(深圳)有限公司 一种业务数据处理方法、设备以及可读存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8831293B2 (en) * 2008-04-21 2014-09-09 Mts Investments Inc. System and method for statistical mapping between genetic information and facial image data
JP5404358B2 (ja) * 2009-12-08 2014-01-29 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
GB201905638D0 (en) * 2019-03-19 2019-06-05 Cirrus Logic Int Semiconductor Ltd Biometric processes, apparatus and machine-readable mediums

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104272096A (zh) * 2012-03-08 2015-01-07 阿普菲弗有限责任公司 基于高空间分辨率测量材料应变的系统及方法
CN104299228A (zh) * 2014-09-23 2015-01-21 中国人民解放军信息工程大学 一种基于精确点位预测模型的遥感影像密集匹配方法
CN108768630A (zh) * 2018-05-25 2018-11-06 全链通有限公司 区块链节点的加密通信方法和系统
CN111404943A (zh) * 2020-03-18 2020-07-10 腾讯科技(深圳)有限公司 数据的处理方法、装置、电子设备及计算机可读存储介质
CN111429254A (zh) * 2020-03-19 2020-07-17 腾讯科技(深圳)有限公司 一种业务数据处理方法、设备以及可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
抗主密钥泄露和连续泄露的双态仿射函数加密;张明武;杨波;TAKAGI Tsuyoshi;;计算机学报(09);全文 *

Also Published As

Publication number Publication date
CN113806760A (zh) 2021-12-17

Similar Documents

Publication Publication Date Title
Zheng et al. Learning the truth privately and confidently: Encrypted confidence-aware truth discovery in mobile crowdsensing
CN112906044B (zh) 多方安全计算方法、装置、设备及存储介质
US9158925B2 (en) Server-aided private set intersection (PSI) with data transfer
WO2022247576A1 (zh) 一种数据处理方法、装置、设备及计算机可读存储介质
CN110704860A (zh) 提升安全性的纵向联邦学习方法、设备、系统及存储介质
US20160156595A1 (en) Secure computer evaluation of decision trees
WO2015155896A1 (ja) サポートベクトルマシン学習システムおよびサポートベクトルマシン学習方法
EP3264671A1 (en) Key replacement direction control system, and key replacement direction control method
KR20220041707A (ko) 모델 연합 트레이닝 방법, 장치, 기기 및 저장 매체
US20180302220A1 (en) User attribute matching method and terminal
CN113434888B (zh) 数据共享方法、装置、设备及系统
EP4376350A2 (en) Computer implemented system and method for distributing shares of digitally signed data
JP6556955B2 (ja) 通信端末、サーバ装置、プログラム
CN112926073A (zh) 联邦学习建模优化方法、设备、介质及计算机程序产品
CN111586142B (zh) 一种安全多方计算方法及系统
US20240163084A1 (en) Method of data transmission, and electronic devic
JP2023512725A (ja) パターンの安全な照合および識別
US20240048360A1 (en) Method for processing multi-source data
CN113300999B (zh) 信息处理方法、电子设备和可读存储介质
CN113612597A (zh) 数据计算方法、装置、系统及电子设备
CN111555880A (zh) 数据碰撞方法、装置、存储介质及电子设备
CN113806760B (zh) 获取特征间相关系数方法、装置、电子设备及存储介质
Patil et al. Pixel co-ordinate-based secret image sharing scheme with constant size shadow images
CN113722739A (zh) 梯度提升树模型的生成方法、装置、电子设备和存储介质
CN113645294A (zh) 消息获取方法、装置、计算机设备和消息传输系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant