CN114638274A - 特征选择方法、设备、可读存储介质及计算机程序产品 - Google Patents

特征选择方法、设备、可读存储介质及计算机程序产品 Download PDF

Info

Publication number
CN114638274A
CN114638274A CN202011475156.7A CN202011475156A CN114638274A CN 114638274 A CN114638274 A CN 114638274A CN 202011475156 A CN202011475156 A CN 202011475156A CN 114638274 A CN114638274 A CN 114638274A
Authority
CN
China
Prior art keywords
feature
correlation
parameter
data
sharing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011475156.7A
Other languages
English (en)
Inventor
陈振南
陈瑞钦
黄启军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WeBank Co Ltd
Original Assignee
WeBank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WeBank Co Ltd filed Critical WeBank Co Ltd
Priority to CN202011475156.7A priority Critical patent/CN114638274A/zh
Publication of CN114638274A publication Critical patent/CN114638274A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • G06F18/2113Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medical Informatics (AREA)
  • Business, Economics & Management (AREA)
  • Evolutionary Biology (AREA)
  • Computer Security & Cryptography (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Complex Calculations (AREA)

Abstract

本申请公开了一种特征选择方法、设备、可读存储介质及计算机程序产品,所述特征选择方法包括:获取待选择特征数据,并对所述待选择特征数据进行归一化处理,以构建所述待选择特征数据对应的相关性辅助计算参数数据,进而基于所述相关性辅助计算参数数据,通过与第二设备进行秘密共享交互,计算特征相关性数据,进而基于所述特征相关性数据,对所述待选择特征数据进行特征选择,获得特征选择结果。本申请解决了进行特征选择的效率低的技术问题。

Description

特征选择方法、设备、可读存储介质及计算机程序产品
技术领域
本申请涉及金融科技(Fintech)的机器学习技术领域,尤其涉及一种特征选择方法、设备、可读存储介质及计算机程序产品。
背景技术
随着金融科技,尤其是互联网科技金融的不断发展,越来越多的技术(如分布式、人工智能等)应用在金融领域,但金融业也对技术提出了更高的要求,如对金融业对应待办事项的分发也有更高的要求。
随着计算机技术的不断发展,机器学习的应用也越来越广泛,特征工程是机器学习中必不可少的一部分,例如特征选择和特征交叉等,其中,在联邦学习场景中,通常需要进行特征选择,目前,在进行特征选择时,通常由联邦学习的各参与方以同态加密的方式将数据发送至可信第三方,并由可信第三方在同态加密状态下确定相关性系数,并反馈至各参与方以进行特征选择,但是,由于数据在进行同态加密后,密文的数据量远大于原始数据,将导致在加密状态下进行相关性系数的确定复杂度较高,进而导致特征选择的效率较低。
发明内容
本申请的主要目的在于提供一种特征选择方法、设备、可读存储介质及计算机程序产品,旨在解决现有技术中特征选择的效率低的技术问题。
为实现上述目的,本申请提供一种特征选择方法,所述特征选择方法应用于第一设备,所述特征选择方法包括:
获取待选择特征数据,并对所述待选择特征数据进行归一化处理,以构建所述待选择特征数据对应的相关性辅助计算参数数据;
基于所述相关性辅助计算参数数据,通过与第二设备进行秘密共享交互,计算特征相关性数据;
基于所述特征相关性数据,对所述待选择特征数据进行特征选择,获得特征选择结果。
本申请还提供一种特征选择装置,所述特征选择装置为虚拟装置,且所述特征选择装置应用于第一设备,所述特征选择装置包括:
归一化处理模块,用于获取待选择特征数据,并对所述待选择特征数据进行归一化处理,以构建所述待选择特征数据对应的相关性辅助计算参数数据;
秘密共享模块,用于基于所述相关性辅助计算参数数据,通过与第二设备进行秘密共享交互,计算特征相关性数据;
特征选择模块,用于基于所述特征相关性数据,对所述待选择特征数据进行特征选择,获得特征选择结果。
本申请还提供一种特征选择设备,所述特征选择设备为实体设备,所述特征选择设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的所述特征选择方法的程序,所述特征选择方法的程序被处理器执行时可实现如上述的特征选择方法的步骤。
本申请还提供一种可读存储介质,所述可读存储介质上存储有实现特征选择方法的程序,所述特征选择方法的程序被处理器执行时实现如上述的特征选择方法的步骤。
本申请还提供一计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述的特征选择方法的步骤。
本申请提供了一种特征选择方法、设备、可读存储介质及计算机程序产品,相比于现有技术采用的由联邦学习的各参与方以同态加密的方式将数据发送至可信第三方,并由可信第三方在同态加密状态下确定相关性系数,并反馈至各参与方以进行特征选择的技术手段,本申请在获取待选择特征数据之后,对所述待选择特征数据进行归一化处理,以构建所述待选择特征数据对应的相关性辅助计算参数数据,进而基于所述相关性辅助计算参数数据,通过与第二设备进行秘密共享交互,计算特征相关性数据,也即,通过秘密共享的方式,与第二设备共同计算特征相关性系数数据,其中,需要说明的是,在秘密共享过程中,无需将数据加密为密文,进而实现了在不加密原始数据的情况下,计算相关性系数的目的,进而基于所述特征相关性数据,对所述待选择特征数据进行特征选择,即可获得特征选择结果,克服了由于数据在进行同态加密后,密文的数据量远大于原始数据,将导致在加密状态下进行相关性系数的计算复杂度较高,进而导致进行特征选择的效率较低的技术缺陷,所以,提高了特征选择的效率。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请特征选择方法第一实施例的流程示意图;
图2为本申请特征选择方法第二实施例的流程示意图;
图3为本申请实施例方案涉及的硬件运行环境的设备结构示意图;
图4为本申请实施例方案涉及的硬件架构示意图。
本申请目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
本申请实施例提供一种特征选择方法,在本申请特征选择方法的第一实施例中,参照图1,所述特征选择方法应用于第一设备,所述特征选择方法包括:
步骤S10,获取待选择特征数据,并对所述待选择特征数据进行归一化处理,以构建所述待选择特征数据对应的相关性辅助计算参数数据;
在本实施例中,需要说明的是,特征选择可基于特征之间的相关性系数进行,其中,所述相关性系数包括皮尔逊相关性系数,其中,所述皮尔逊相关性系数的计算公式如下:
Figure BDA0002837158170000041
其中,
Figure BDA0002837158170000042
为X1与X2之间的皮尔逊相关性系数,
Figure BDA0002837158170000043
为X1与X2之间的协方差,σ1为X1的标准差,σ2为X2的标准差。
另外地,需要说明的是,所述第一设备为发起进行特征选择请求的联邦学习的参与方,且存在第二设备同样为联邦学习的参与方,其中,第一设备中存在第一方特征,第二设备中存在第二方特征,第一设备和第二设备均需要通过计算第一方特征与第二方特征的相关性系数,以进行特征选择,另外地,所述待选特征数据至少包括一待选择特征对应的待选择特征向量,其中,所述待选择特征向量为由所述待选择特征对应的各待选择特征值组成的向量,所述待选择特征向量至少包括一待选择特征值。
获取待选择特征数据,并对所述待选择特征数据进行归一化处理,以构建所述待选择特征数据对应的相关性辅助计算参数数据,具体地,获取待选择特征数据,并在所述待选择特征数据中选取一待选择特征向量,进而计算所述待选择特征向量中各待选择特征值的统计特征数据,其中,所述统计特征数据包括平均值、标准差以及方差等,进而基于所述统计特征数据,分别对所述待选择特征值进行归一化处理,生成各所述待选择特征值对应的相关性辅助计算参数,获得相关性辅助计算参数数据,其中,所述相关性辅助计算参数数据至少包括一待选择特征值对应的相关性辅助计算参数,其中,所述相关性辅助计算参数为辅助计算相关性系数的参数,用于通过秘密共享的方式,联合第二设备计算所述相关性辅助计算参数与第二设备中的第二方相关性辅助计算参数之间的秘密共享内积,以计算所述待选择特征值与所述第二方相关性辅助计算参数对应的第二方待选择特征值之间的相关性系数值,其中,所述第二设备生成所述第二方相关性辅助计算参数与所述第一设备生成相关性辅助计算参数的方式相同。
其中,所述待选择特征数据至少包括一待选择特征向量,
所述对所述待选择特征数据进行归一化处理,以构建所述待选择特征数据对应的相关性辅助计算参数数据的步骤包括:
步骤S11,计算所述待选择特征向量中各待选择特征值对应的特征平均值与对应的特征标准差;
在本实施例中,需要说明的是,所述待选择特征向量为所述待选择特征对应的各特征值组成的向量,例如,假设存在年龄特征对应样本A、样本B和样本C,若样本A的年龄为10岁,样本B的年龄为15岁,样本C的年龄为20岁,则年龄特征对应的特征向量为(10,15,20)。
计算所述待选择特征向量中各待选择特征值对应的特征平均值与对应的特征标准差,具体地,计算所述待选择特征向量中各待选择特征值的平均值,获得特征平均值,进而依据所述特征平均值,计算各所述待选择特征值对应的标准差,获得特征标准差。
步骤S12,基于所述特征平均值和所述特征标准差,生成各所述待选择特征值对应的初始辅助参数;
在本实施例中,基于所述特征平均值和所述特征标准差,生成各所述待选择特征值对应的初始辅助参数,具体地,对于每一所述待选择特征值均执行以下步骤:
将所述特征平均值、所述特征标准差和所述待选择特征值输入预设归一化处理公式,计算所述初始辅助参数,其中,所述预设归一化处理公式如下所示:
Figure BDA0002837158170000051
其中,yi为所述初始辅助参数,xi为所述待选择特征值,mean(x)为所述特征平均值,σ为所述特征标准差。
步骤S13,分别对各所述初始辅助参数进行浮点数编码,以将各所述初始辅助参数转换为十进制数,获得所述相关性辅助计算参数数据。
在本实施例中,需要说明的是,所述相关性辅助计算参数数据至少包括一所述初始辅助参数对应的相关性辅助计算参数。
分别对各所述初始辅助参数进行浮点数编码,以将各所述初始辅助参数转换为十进制数,获得所述相关性辅助计算参数数据,具体地,对每一所述初始辅助参数均进行以下步骤:
通过将所述初始辅助参数输入预设浮点数编码公式,对所述初始辅助参数进行浮点数编码,以将所述初始辅助参数转换为十进制数,获得相关性辅助计算参数,其中,所述预设浮点数编码公式如下所示:
encode(x)=(x*basefrac)%field
其中,encode(x)为所述相关性辅助计算参数,x为所述初始辅助参数,base为进制转换底数,frac为指数位,field为域长,其中,需要说明的是,将原始数据转换十进制数据进行计算,可避免进行小数之间的计算,进而降低了计算复杂度,提高了计算效率。
其中,所述获取待选择特征数据的步骤包括:
步骤A10,与第二设备进行样本对齐,获得样本ID序列,以供所述第二设备获取样本ID序列,并基于所述样本ID序列,生成第二待选择特征数据;
在本实施例中,需要说明的是,所述特征选择方法应用于纵向联邦学习场景。
与第二设备进行样本对齐,获得样本ID序列,以供所述第二设备获取样本ID序列,并基于所述样本ID序列,生成第二待选择特征数据,具体地,与所述第二设备进行样本对齐,获得具备样本ID排列顺序的样本ID序列,其中,所述第二设备获得与所述第一设备相同的样本ID序列。
步骤A20,提取所述样本ID序列对应的样本数据,并基于所述样本ID序列的排列顺序,生成所述待选择特征数据。
在本实施例中,需要说明的是,所述样本数据至少包括一样本对应的样本表示向量,所述样本ID序列至少包括一样本ID,其中,所述样本表示向量为由样本对应的各待选择特征的特征值组成的向量,例如,假设用户A对应存在特征X的特征值为a,对应存在特征Y的特征值为b,对应存在特征Z的特征值为c,则所述样本特征向量为(a,b,c)。
提取所述样本ID序列对应的样本数据,并基于所述样本ID序列的排列顺序,生成所述待选择特征数据,具体地,提取各所述样本ID对应的样本表示向量,并基于各所述样本ID在所述样本ID序列中的排列顺序,将各所述样本表示向量组合为样本表示矩阵,以将所述样本表示矩阵与第二设备生成的第二样本表示矩阵进行对齐,其中,所述样本表示矩阵的每一行对应一样本,每一列对应一待选择特征,且所述第二设备生成的第二样本表示矩阵,且所述第二样本表示矩阵的每一行对应一样本,每一列对一第二待选择特征,第二样本表示矩阵与所述第一样本表示矩阵的生成方式相同。
其中,需要说明的是,由于所述样本表示矩阵与第二设备生成的第二样本表示矩阵是对齐的,进而所述样本表示矩阵与所述第二样本表示矩阵的各行的排列顺序相同,也即所述样本表示矩阵与所述第二样表示矩阵在相同位置的行对应的同一样本ID,进而在进行特征相关性时,在样本表示矩阵中提取一列作为待选择特征向量,在所述第二样本表示矩阵中提取一列作为第二待选择特征向量,则所述待选择特征向量与所述第二待选择特征向量的相同比特位位置的特征值对应同一样本ID,也即待选择特征向量与第二待选择特征向量是对齐的,进而在计算待选择特征与第二待选择特征之间的特征相关性时,对于待选择特征向量中的每一特征值,可只计算该特征值与第二待选择特征向量中相同比特位位置的特征之间的相关性系数值即可,无需计算待选择特征向量中各特征值与第二待选择特征向量中各特征值两两之间的相关性系数值,进而减少了计算相关性系数值时的无用计算过程,降低了计算复杂度,提高了计算效率,进而提高了特征选择时的效率,例如,在计算长度为3的待选择特征向量A与长度为3的第二待选择特征向量B之间的特征相关性时,通常需要进行9次相关性系数值的计算,进而生成3*3的相关性系数矩阵,而若A与B的每一特征值是对齐的,则只需进行3次相关性系数值的计算,生成1*3的相关性系数向量。
步骤S20,基于所述相关性辅助计算参数数据,通过与第二设备进行秘密共享交互,计算特征相关性数据;
在本实施例中,需要说明的是,所述第二设备同样将计算第二方待选择特征向量对应的第二方相关性辅助计算参数数据,其中,所述第二设备计算第二方相关性辅助计算参数数据与第一设备计算所述相关性辅助计算参数数据的计算方式相同,其中,所述第二方相关性辅助计算参数数据至少包括一第二方相关性辅助计算参数。
基于所述相关性辅助计算参数数据,通过与第二设备进行秘密共享交互,计算特征相关性数据,具体地,对于每一所述相关性辅助计算参数与每一所述第二方相关性辅助计算参数均执行以下步骤:
基于秘密共享乘法,所述第一设备与所述第二设备共同计算所述相关性辅助计算参数与所述第二方相关性辅助计算参数之间的秘密共享内积,进而通过所述第一设备与所述第二设备进行解密交互,对秘密共享内积进行解密,获得特征相关性系数值,其中,需要说明的是,每一所述相关性辅助计算参数与每一所述第二方相关性辅助计算参数之间均存在一特征相关性系数值,进而将各特征相关性系数值组合为待选择特征向量与所述第二方待选择特征向量之间的特征相关性矩阵,并将所述特征相关性矩阵作为所述特征相关性数据。
另外地,需要说明的是,现有技术采用的由联邦学习的各参与方以同态加密的方式将数据发送至可信第三方,并由可信第三方在同态加密状态下确定相关性系数时,由于同态加密数据的数量量远大于原始数据(未加密数据),进而将导致设备之间的数据传输耗时长且延时高,而本申请实施例中由于进行秘密共享时,无需对数据进行加密,设备之间传输的数据量较小,进而数据传输的耗时少且延时低,且由于第一设备与第二设备在进行计算时,由于秘密共享的数据的数量小,进而第一设备与第二设备中的计算量小且计算复杂度低,所以,实现了通过对计算机内部性能进行改进,使得第一设备与第二设备更加适用于进行特征选择的目的,进而提高了特征选择的效率。
步骤S30,基于所述特征相关性数据,对所述待选择特征数据进行特征选择,获得特征选择结果。
在本实施例中,需要说明的是,所述特征相关性数据包括特征相关性矩阵,所述特征相关性矩阵在第一设备中对应一待选择特征,在第二设备中对应一第二方待选择特征。
基于所述特征相关性数据,对所述待选择特征数据进行特征选择,获得特征选择结果,具体地,将所述特征相关性矩阵输入预设共线性特征判别模型,以基于所述特征相关性矩阵,判段所述待选择特征与所述第二方待选择特征是否为共线性特征,若是,则在所述特征相关性数据中剔除所述共线性特征对应的特征数据,获得剔除后特征数据,并将所述剔除后特征数据作为所述特征选择结果,若否,则不剔除,所述共线性特征为与第二方待选择特征的相关程度大于预设第一相关程度阈值的待选择特征。
其中,所述待选择特征数据至少对应一待选择特征,一所述待选择特征对应一特征相关性数据,
所述基于所述特征相关性数据,对所述待选择特征数据进行特征选择,获得特征选择结果的步骤包括:
步骤S31,基于各所述特征相关性数据,在各所述待选择特征中筛选共线性特征;
在本实施例中,基于各所述特征相关性数据,在各所述待选择特征中筛选共线性特征,具体地,将各所述特征相关性数据输入预设分类模型,对各所述特征相关性数据进行分类,获得各分类标签,进而基于各所述分类标签,在各所述待选择特征中筛选共线性特征。
步骤S32,对所述待选择特征数据进行特征选择,以在所述待选择特征数据中剔除所述共线性特征对应的特征数据,获得所述特征选择结果。
在本实施例中,对所述待选择特征数据进行特征选择,以在所述待选择特征数据中剔除所述共线性特征对应的特征数据,获得所述特征选择结果,具体地,将在所述待选择特征数据中剔除共线性特征对应的特征数据后的数据作为特征选择结果,其中,需要说明的是,两个存在共线性的特征对模型训练的效果存在重复性,进而在两个存在共线性的特征中剔除一个特征进行模型训练,可减少模型训练时对模型训练贡献度低的计算过程,进而可提高模型训练时的计算效率。
本申请实施例提供了一种特征选择方法,相比于现有技术采用的由联邦学习的各参与方以同态加密的方式将数据发送至可信第三方,并由可信第三方在同态加密状态下确定相关性系数,并反馈至各参与方以进行特征选择的技术手段,本申请实施例在获取待选择特征数据之后,对所述待选择特征数据进行归一化处理,以构建所述待选择特征数据对应的相关性辅助计算参数数据,进而基于所述相关性辅助计算参数数据,通过与第二设备进行秘密共享交互,计算特征相关性数据,也即,通过秘密共享的方式,与第二设备共同计算特征相关性系数数据,其中,需要说明的是,在秘密共享过程中,无需将数据加密为密文,进而实现了在不加密原始数据的情况下,计算相关性系数的目的,进而基于所述特征相关性数据,对所述待选择特征数据进行特征选择,即可获得特征选择结果,克服了由于数据在进行同态加密后,密文的数据量远大于原始数据,将导致在加密状态下进行相关性系数的计算复杂度较高,进而导致进行特征选择的效率较低的技术缺陷,所以,提高了进行特征选择的效率。
进一步地,参照图2,基于本申请中第一实施例,在本申请的另一实施例中,所述相关性辅助计算参数数据至少包括一相关性辅助计算参数,所述特征相关性数据至少包括一特征相关性值,
所述基于所述相关性辅助计算参数数据,通过与第二设备进行秘密共享交互,计算特征相关性数据的步骤包括:
步骤S21,基于所述相关性辅助计算参数,与第二设备进行秘密共享,获得秘密共享相关性辅助计算参数;
在本实施例中,所述秘密共享相关性辅助计算参数包括第一共享第一方辅助计算参数和第二共享第二方辅助计算参数,所述第二设备中存在第二方相关性辅助计算参数。
基于所述相关性辅助计算参数,与第二设备进行秘密共享,获得秘密共享相关性辅助计算参数,具体地,所述第一设备将所述相关性辅助计算参数拆分分享至第二设备,进而所述第一设备将拆分分享获得所述相关性辅助计算参数的一部分作为第一共享第一方辅助计算参数,第二设备将拆分分享获得所述相关性辅助计算参数的另一部分作为第二共享第一方辅助计算参数,所述第二设备将所述第二方相关性辅助计算参数拆分分享至第一设备,进而第二设备将拆分分享获得的第二方相关性辅助计算参数的一部分作为第一共享第二方辅助计算参数,所述第一设备将拆分分享获得的第二方相关性辅助计算参数的另一部分作为第二共享第二方辅助计算参数。
其中,所述秘密共享相关性辅助计算参数包括第一共享第一方辅助计算参数和第二共享第二方辅助计算参数,
所述基于所述相关性辅助计算参数,与第二设备进行秘密共享,获得秘密共享相关性辅助计算参数的步骤包括:
步骤S211,将所述相关性辅助计算参数拆分分享至第二设备,获得所述第一共享第一方辅助计算参数,以供所述第二设备获得第二共享第一方辅助计算参数;
在本实施例中,需要说明的是,所述第一共享第一方辅助计算参数为所述相关性辅助计算参数的第一拆分部分,所述第二共享第二方辅助计算参数为所述第二方相关性辅助计算参数的第二拆分部分。
将所述相关性辅助计算参数拆分分享至第二设备,获得所述第一共享第一方辅助计算参数,以供所述第二设备获得第二共享第一方辅助计算参数,具体地,对所述相关性辅助计算参数进行拆分,获得所述相关性辅助计算参数的第一拆分部分和所述相关性辅助计算参数的第二拆分部分,进而将所述相关性辅助计算参数的第一拆分部分作为第一共享第一方辅助计算参数,并将所述相关性辅助计算参数的第二拆分部分发送至第二设备,以供所述第二设备将所述相关性辅助计算参数的第二拆分部分作为第二共享第一方辅助计算参数。
步骤S212,接收所述第二设备发送的所述第二共享第二方辅助计算参数,其中,所述第二设备用于将获取的第二方相关性辅助计算参数拆分分享至第一设备,获得第一共享第二方辅助计算参数,以供所述第一设备获得所述第二共享第二方辅助计算参数。
在本实施例中,接收所述第二设备发送的所述第二共享第二方辅助计算参数,其中,所述第二设备用于将获取的第二方相关性辅助计算参数拆分分享至第一设备,获得第一共享第二方辅助计算参数,以供所述第一设备获得所述第二共享第二方辅助计算参数,具体地,第二设备对所述第二方相关性辅助计算参数进行拆分,获得所述第二方相关性辅助计算参数的第一拆分部分和所述第二方相关性辅助计算参数的第二拆分部分,进而将所述第二方相关性辅助计算参数的第一拆分部分作为第一共享第二方辅助计算参数,并将所述第二方相关性辅助计算参数的第二拆分部分发送至第二设备,进而所述第一设备接收所述第二方相关性辅助计算参数的第二拆分部分,并将所述第二方相关性辅助计算参数的第二拆分部分作为第二共享第二方辅助计算参数。
步骤S22,基于所述秘密共享相关性辅助计算参数,通过预设秘密共享乘法,与所述第二设备进行秘密共享交互计算,获得秘密共享特征相关性值;
在本实施例中,需要说明的是,所述第一设备与所述第二设备需秘密共享一乘法三元组,其中,所述乘法三元组为三个具有乘积关系的参数组成的数组,例如,假设乘法三元组为(a,b,c),则具有乘积关系c=a*b。
基于所述秘密共享相关性辅助计算参数,通过预设秘密共享乘法,与所述第二设备进行秘密共享交互计算,获得秘密共享特征相关性值,具体地,第一设备获取乘法三元组的第一拆分部分作为第一共享乘法三元组,并基于所述第一共享乘法三元组、第一共享第一方辅助计算参数和第二共享第二方辅助计算参数,计算第一方共享盲化参数,进而第二设备获取乘法三元组的第二拆分部分作为第二共享乘法三元组,并基于所述第二共享乘法三元组、第二共享第一方辅助计算参数和第一共享第二方辅助计算参数,计算第二方共享盲化参数,进而第一设备与第二设备进行解密交互,生成第一方共享盲化参数和所述第二方共享盲化参数共同对应的盲化参数,进而第一设备基于所述盲化参数和所述第一共享乘法三元组,生成秘密共享特征相关性值,所述第二设备基于所述盲化参数和所述第二共享乘法三元组,生成第二方秘密共享特征相关性值。
其中,所述基于所述秘密共享相关性辅助计算参数,通过预设秘密共享乘法,与所述第二设备进行秘密共享交互计算,获得秘密共享特征相关性值的步骤包括:
步骤S221,生成乘法三元组,并将所述乘法三元组秘密共享至所述第二设备,获得第一共享乘法三元组,以供所述第二设备获得第二共享乘法三元组;
在本实施例中,生成乘法三元组,并将所述乘法三元组秘密共享至所述第二设备,获得第一共享乘法三元组,以供所述第二设备获得第二共享乘法三元组,具体地,第三方设备生成乘法三元组,并将所述乘法三元组每一乘法三元组参数进行拆分为两部分,获得乘法三元组的第一拆分部分和乘法三元组的第二拆分部分,进而将所述乘法三元组的第一拆分部分发送至第一设备作为所述第一共享乘法三元组,并将所述乘法三元组的第二拆分部分发送至第二设备作为第二共享乘法三元组,例如,假设所述乘法三元组为(a,b,c),则所述第一共享乘法三元组为([[a]]A,[[b]]A,[[c]]A),所述第二共享乘法三元组为([[a]]B,[[b]]B,[[c]]B),其中,[[a]]A+[[a]]B=a,[[b]]A+[[b]]B=b,[[c]]A+[[c]]B=c,c=a*b。
步骤S222,基于所述第一共享乘法三元组和所述秘密共享相关性辅助计算参数,生成第一方共享盲化参数;
在本实施例中,需要说明的是,所述第一方共享盲化参数包括第一共享盲化参数和第二共享盲化参数。
基于所述第一共享乘法三元组和所述秘密共享相关性辅助计算参数,生成第一方共享盲化参数,具体地,计算所述第一共享第一方辅助计算参数和所述第一共享乘法三元组中第一共享乘法三元组参数的差值,获得第一共享盲化参数,并计算所述第二共享第二方辅助计算参数和所述第一共享乘法三元组中第二共享乘法三元组参数的差值,获得第二共享盲化参数,其中,所述第一共享盲化参数与所述第二共享盲化参数的计算过程如下:
[[e]]A=[[x]]A-[[a]]A
[[f]]A=[[y]]A-[[b]]A
其中,[[e]]A为所述第一共享盲化参数,[[f]]A为所述第二共享盲化参数,第一共享乘法三元组为([[a]]A,[[b]]A,[[c]]A),[[x]]A为所述第一共享第一方辅助计算参数,[[a]]A为所述第一共享乘法三元组中第一共享乘法三元组参数,[[y]]A为所述第二共享第二方辅助计算参数,[[b]]A为所述第一共享乘法三元组中第二共享乘法三元组参数,[[]]A表示数据属于第一设备。
步骤S223,基于所述第一方共享盲化参数,与所述第二设备进行秘密共享解密交互,以联合所述第二设备生成的第二方共享盲化参数,生成盲化参数;
在本实施例中,需要说明的是,所述盲化参数包括第一盲化参数和第二盲化参数,所述第二设备计算第二方共享盲化参数中的第三共享盲化参数和第四共享盲化参数的计算过程如下:
[[e]]B=[[x]]B-[[a]]B
[[f]]B=[[y]]B-[[b]]B
其中,[[e]]B为所述第三共享盲化参数,[[f]]B为所述第四共享盲化参数,第二共享乘法三元组为([[a]]B,[[b]]B,[[c]]B),[[x]]B为所述第二共享第一方辅助计算参数,[[y]]B为所述第一共享第二方辅助计算参数,[[]]B表示数据属于第二设备。
基于所述第一方共享盲化参数,与所述第二设备进行秘密共享解密交互,以联合所述第二设备生成的第二方共享盲化参数,生成盲化参数,具体地,接收第二设备发送的第三共享盲化参数与发送的第四共享盲化参数,进而计算所述第三共享盲化参数与所述第一共享盲化参数之和获得第一盲化参数,并计算所述第四共享盲化参数与所述第二共享盲化参数之和,获得第二盲化参数,相同地,第一设备将所述第一共享盲化参数与所述第二共享盲化参数发送至第二设备,以供第二设备计算第一盲化参数和所述第二盲化参数,其中,所述第一盲化参数与所述第二盲化参数的计算过程如下:
e=[[e]]A+[[e]]B=[[x]]A-[[a]]A+[[x]]B-[[a]]B=x-a
f=[[f]]A+[[f]]B=[[y]]B-[[b]]B+[[y]]B-[[b]]B=y-b
其中,e为所述第一盲化参数,f为所述第二盲化参数,乘法三元组为(a,b,c),[[x]]A为所述第一共享第一方辅助计算参数,[[y]]A为所述第二共享第二方辅助计算参数,[[x]]B为所述第二共享第一方辅助计算参数,[[y]]B为所述第一共享第二方辅助计算参数,[[]]A表示数据属于第一设备,[[]]B表示数据属于第二设备。
步骤S224,基于所述盲化参数和所述第一共享乘法三元组,计算所述秘密共享特征相关性值。
在本实施例中,基于所述盲化参数和所述第一共享乘法三元组,计算所述秘密共享特征相关性值,具体地,将所述第一盲化参数、第二盲化参数与所述第一共享乘法三元组中各参数代入预设秘密共享特征相关性值计算公式,计算所述秘密共享特征相关性值,其中,所述预设秘密共享特征相关性值计算公式如下所示:
[[x*y]]A=f*[[a]]A+e*[[b]]A+[[c]]A
其中,所述第一共享乘法三元组为([[a]]A,[[b]]A,[[c]]A),[[x*y]]A为所述秘密共享特征相关性值,e为所述第一盲化参数,f为所述第二盲化参数。
另外地,所述第二设备计算第二方秘密共享特征相关性值的计算公式如下:
[[x*y]]B=e*f+f*[[a]]B+e*[[b]]B+[[c]]B
其中,所述第二共享乘法三元组为([[a]]B,[[b]]B,[[c]]B),[[x*y]]B为所述第二方秘密共享特征相关性值,e为所述第一盲化参数,f为所述第二盲化参数。
步骤S23,基于所述秘密共享特征相关性值,与所述第二设备进行解密交互,获得所述特征相关性值。
在本实施例中,基于所述秘密共享特征相关性值,与所述第二设备进行解密交互,获得所述特征相关性值,具体地,接收第二设备发送的第二方秘密共享特征相关性值,并计算所述秘密共享特征相关性值与所述第二方秘密共享特征相关性值的和,获得所述特征相关性值,相同地,将所述秘密共享特征相关性值发送至第二设备,以供所述第二设备计算所述特征相关性值,其中,所述特征相关性值的计算过程如下:
[[x*y]]A+[[x*y]]B=e*f+f*a+e*b+c
进而将e=x-a和f=y-b代入上述计算表达式,即可获得[[x*y]]A+[[x*y]]B=x*y。
其中,所述基于所述秘密共享特征相关性值,与所述第二设备进行解密交互,获得所述特征相关性值的步骤包括:
步骤S231,接收所述第二设备发送的第二方秘密共享特征相关性值,并将所述秘密共享特征相关性值发送至所述第二设备,以供所述第二设备计算所述特征相关性值;
在本实施例中,接收所述第二设备发送的第二方秘密共享特征相关性值,并将所述秘密共享特征相关性值发送至所述第二设备,以供所述第二设备计算所述特征相关性值,具体地,接收所述第二设备发送的第二方秘密共享特征相关性值,并将所述秘密共享特征相关性值发送至所述第二设备,进而所述第二设备计算所述秘密共享特征相关性值与所述第二方秘密共享特征相关性值的和,获得解码结果,并将所述解码结果转换为浮点数,获得所述特征相关性值。
步骤S232,基于所述秘密共享特征相关性值与所述第二方秘密共享特征相关性值,生成解码结果;
在本实施例中,需要说明的是,所述解码结果为所述秘密共享特征相关性值与所述第二方秘密共享特征相关性值之和。
步骤S233,将所述解码结果转换为浮点数,获得所述特征相关性值。
在本实施例中,将所述解码结果转换为浮点数,获得所述特征相关性值,具体地,基于预设浮点数转换公式,将所述解码结果转换为浮点数,获得所述特征相关性值,其中,所述预设浮点数转换公式如下所示:
Figure BDA0002837158170000151
其中,decode(x)为所述特征相关性值,H为所述解码结果,base为进制转换底数,frac为指数位。
另外地,需要说明的是,在第一设备和第二设备通过秘密共享交互进行计算时,由于第一设备与第二设备均只拥有另一方隐私数据的一部分,第一设备和第二设备均未拥有另一方的完整隐私数据,且在计算时,仍然基于一部分的数据进行秘密共享计算,直至最后通过交换最终的秘密共享计算结果,获得特征相关性数据,而特征相关性数据只与隐私数据的统计特征值相关,例如平均值、方差和协方差等,第一设备与第二设备均无法通过特征相关性数据反推出另一方的隐私数据,进而实现了在特征选择时的隐私保护。
本申请实施例提供了一种基于秘密共享计算特征相关性数据的方法,并具体公开了基于所述相关性辅助计算参数,与第二设备进行秘密共享,获得秘密共享相关性辅助计算参数,进而基于所述秘密共享相关性辅助计算参数,通过预设秘密共享乘法,与所述第二设备进行秘密共享交互计算,获得秘密共享特征相关性值,进而基于所述秘密共享特征相关性值,与所述第二设备进行解密交互,获得所述特征相关性值。其中,需要说明的是,在秘密共享过程中,无需将数据加密为密文,进而实现了在不加密原始数据的情况下,计算相关性系数的目的,进而基于所述特征相关性数据,对所述待选择特征数据进行特征选择,即可获得特征选择结果,为克服由于数据在进行同态加密后,密文的数据量远大于原始数据,将导致在加密状态下进行相关性系数的计算复杂度较高,进而导致进行特征选择的效率较低的技术缺陷奠定了基础。
参照图3,图3是本申请实施例方案涉及的硬件运行环境的设备结构示意图。
如图3所示,该特征选择设备可以包括:处理器1001,例如CPU,存储器1005,通信总线1002。其中,通信总线1002用于实现处理器1001和存储器1005之间的连接通信。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储设备。
可选地,该特征选择设备还可以包括矩形用户接口、网络接口、摄像头、RF(RadioFrequency,射频)电路,传感器、音频电路、WiFi模块等等。矩形用户接口可以包括显示屏(Display)、输入子模块比如键盘(Keyboard),可选矩形用户接口还可以包括标准的有线接口、无线接口。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。
本领域技术人员可以理解,图3中示出的特征选择设备结构并不构成对特征选择设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图3所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块以及特征选择程序。操作系统是管理和控制特征选择设备硬件和软件资源的程序,支持特征选择程序以及其它软件和/或程序的运行。网络通信模块用于实现存储器1005内部各组件之间的通信,以及与特征选择系统中其它硬件和软件之间通信。
在图3所示的特征选择设备中,处理器1001用于执行存储器1005中存储的特征选择程序,实现上述任一项所述的特征选择方法的步骤。
本申请特征选择设备具体实施方式与上述特征选择方法各实施例基本相同,在此不再赘述。
本申请实施例还提供一种特征选择装置,所述特征选择装置应用于第一设备,所述特征选择装置包括:
归一化处理模块,用于获取待选择特征数据,并对所述待选择特征数据进行归一化处理,以构建所述待选择特征数据对应的相关性辅助计算参数数据;
秘密共享模块,用于基于所述相关性辅助计算参数数据,通过与第二设备进行秘密共享交互,计算特征相关性数据;
特征选择模块,用于基于所述特征相关性数据,对所述待选择特征数据进行特征选择,获得特征选择结果。
可选地,所述特征选择模块还用于:
基于各所述特征相关性数据,在各所述待选择特征中筛选共线性特征;
对所述待选择特征数据进行特征选择,以在所述待选择特征数据中剔除所述共线性特征对应的特征数据,获得所述特征选择结果。
可选地,所述归一化处理模块还用于:
基于各所述特征相关性数据,在各所述待选择特征中筛选共线性特征;
对所述待选择特征数据进行特征选择,以在所述待选择特征数据中剔除所述共线性特征对应的特征数据,获得所述特征选择结果。
可选地,所述归一化处理模块还用于:
计算所述待选择特征向量中各待选择特征值对应的特征平均值与对应的特征标准差;
基于所述特征平均值和所述特征标准差,生成各所述待选择特征值对应的初始辅助参数;
分别对各所述初始辅助参数进行浮点数编码,以将各所述初始辅助参数转换为十进制数,获得所述相关性辅助计算参数数据。
可选地,所述秘密共享模块还用于:
基于所述相关性辅助计算参数,与第二设备进行秘密共享,获得秘密共享相关性辅助计算参数;
基于所述秘密共享相关性辅助计算参数,通过预设秘密共享乘法,与所述第二设备进行秘密共享交互计算,获得秘密共享特征相关性值;
基于所述秘密共享特征相关性值,与所述第二设备进行解密交互,获得所述特征相关性值。
可选地,所述秘密共享模块还用于:
将所述相关性辅助计算参数拆分分享至第二设备,获得所述第一共享第一方辅助计算参数,以供所述第二设备获得第二共享第一方辅助计算参数;
接收所述第二设备发送的所述第二共享第二方辅助计算参数,其中,所述第二设备用于将获取的第二方相关性辅助计算参数拆分分享至第一设备,获得第一共享第二方辅助计算参数,以供所述第一设备获得所述第二共享第二方辅助计算参数。
可选地,所述秘密共享模块还用于:
生成乘法三元组,并将所述乘法三元组秘密共享至所述第二设备,获得第一共享乘法三元组,以供所述第二设备获得第二共享乘法三元组;
基于所述第一共享乘法三元组和所述秘密共享相关性辅助计算参数,生成第一方共享盲化参数;
基于所述第一方共享盲化参数,与所述第二设备进行秘密共享解密交互,以联合所述第二设备生成的第二方共享盲化参数,生成盲化参数;
基于所述盲化参数和所述第一共享乘法三元组,计算所述秘密共享特征相关性值。
可选地,所述秘密共享模块还用于:
接收所述第二设备发送的第二方秘密共享特征相关性值,并将所述秘密共享特征相关性值发送至所述第二设备,以供所述第二设备计算所述特征相关性值;
基于所述秘密共享特征相关性值与所述第二方秘密共享特征相关性值,生成解码结果;
将所述解码结果转换为浮点数,获得所述特征相关性值。
本申请特征选择装置的具体实施方式与上述特征选择方法各实施例基本相同,在此不再赘述。
本申请实施例提供了一种可读存储介质,且所述可读存储介质存储有一个或者一个以上程序,所述一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于实现上述任一项所述的特征选择方法的步骤。
本申请可读存储介质具体实施方式与上述特征选择方法各实施例基本相同,在此不再赘述。
本申请实施例提供了一种计算机程序产品,且所述计算机程序产品包括有一个或者一个以上计算机程序,所述一个或者一个以上计算机程序还可被一个或者一个以上的处理器执行以用于实现上述任一项所述的特征选择方法的步骤。
本申请计算机程序产品具体实施方式与上述特征选择方法各实施例基本相同,在此不再赘述。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利处理范围内。

Claims (11)

1.一种特征选择方法,其特征在于,所述特征选择方法应用于第一设备,所述特征选择方法包括:
获取待选择特征数据,并对所述待选择特征数据进行归一化处理,以构建所述待选择特征数据对应的相关性辅助计算参数数据;
基于所述相关性辅助计算参数数据,通过与第二设备进行秘密共享交互,计算特征相关性数据;
基于所述特征相关性数据,对所述待选择特征数据进行特征选择,获得特征选择结果。
2.如权利要求1所述特征选择方法,其特征在于,所述待选择特征数据至少对应一待选择特征,一所述待选择特征对应一特征相关性数据,
所述基于所述特征相关性数据,对所述待选择特征数据进行特征选择,获得特征选择结果的步骤包括:
基于各所述特征相关性数据,在各所述待选择特征中筛选共线性特征;
对所述待选择特征数据进行特征选择,以在所述待选择特征数据中剔除所述共线性特征对应的特征数据,获得所述特征选择结果。
3.如权利要求1所述特征选择方法,其特征在于,所述获取待选择特征数据的步骤包括:
与第二设备进行样本对齐,获得样本ID序列,以供所述第二设备获取样本ID序列,并基于所述样本ID序列,生成第二待选择特征数据;
提取所述样本ID序列对应的样本数据,并基于所述样本ID序列的排列顺序,生成所述待选择特征数据。
4.如权利要求1所述特征选择方法,其特征在于,所述相关性辅助计算参数数据至少包括一相关性辅助计算参数,所述特征相关性数据至少包括一特征相关性值,
所述基于所述相关性辅助计算参数数据,通过与第二设备进行秘密共享交互,计算特征相关性数据的步骤包括:
基于所述相关性辅助计算参数,与第二设备进行秘密共享,获得秘密共享相关性辅助计算参数;
基于所述秘密共享相关性辅助计算参数,通过预设秘密共享乘法,与所述第二设备进行秘密共享交互计算,获得秘密共享特征相关性值;
基于所述秘密共享特征相关性值,与所述第二设备进行解密交互,获得所述特征相关性值。
5.如权利要求4所述特征选择方法,其特征在于,所述秘密共享相关性辅助计算参数包括第一共享第一方辅助计算参数和第二共享第二方辅助计算参数,
所述基于所述相关性辅助计算参数,与第二设备进行秘密共享,获得秘密共享相关性辅助计算参数的步骤包括:
将所述相关性辅助计算参数拆分分享至第二设备,获得所述第一共享第一方辅助计算参数,以供所述第二设备获得第二共享第一方辅助计算参数;
接收所述第二设备发送的所述第二共享第二方辅助计算参数,其中,所述第二设备用于将获取的第二方相关性辅助计算参数拆分分享至第一设备,获得第一共享第二方辅助计算参数,以供所述第一设备获得所述第二共享第二方辅助计算参数。
6.如权利要求4所述特征选择方法,其特征在于,所述基于所述秘密共享相关性辅助计算参数,通过预设秘密共享乘法,与所述第二设备进行秘密共享交互计算,获得秘密共享特征相关性值的步骤包括:
生成乘法三元组,并将所述乘法三元组秘密共享至所述第二设备,获得第一共享乘法三元组,以供所述第二设备获得第二共享乘法三元组;
基于所述第一共享乘法三元组和所述秘密共享相关性辅助计算参数,生成第一方共享盲化参数;
基于所述第一方共享盲化参数,与所述第二设备进行秘密共享解密交互,以联合所述第二设备生成的第二方共享盲化参数,生成盲化参数;
基于所述盲化参数和所述第一共享乘法三元组,计算所述秘密共享特征相关性值。
7.如权利要求4所述特征选择方法,其特征在于,所述基于所述秘密共享特征相关性值,与所述第二设备进行解密交互,获得所述特征相关性值的步骤包括:
接收所述第二设备发送的第二方秘密共享特征相关性值,并将所述秘密共享特征相关性值发送至所述第二设备,以供所述第二设备计算所述特征相关性值;
基于所述秘密共享特征相关性值与所述第二方秘密共享特征相关性值,生成解码结果;
将所述解码结果转换为浮点数,获得所述特征相关性值。
8.如权利要求1所述特征选择方法,其特征在于,所述待选择特征数据至少包括一待选择特征向量,
所述对所述待选择特征数据进行归一化处理,以构建所述待选择特征数据对应的相关性辅助计算参数数据的步骤包括:
计算所述待选择特征向量中各待选择特征值对应的特征平均值与对应的特征标准差;
基于所述特征平均值和所述特征标准差,生成各所述待选择特征值对应的初始辅助参数;
分别对各所述初始辅助参数进行浮点数编码,以将各所述初始辅助参数转换为十进制数,获得所述相关性辅助计算参数数据。
9.一种特征选择设备,其特征在于,所述特征选择设备包括:存储器、处理器以及存储在存储器上的用于实现所述特征选择方法的程序,
所述存储器用于存储实现特征选择方法的程序;
所述处理器用于执行实现所述特征选择方法的程序,以实现如权利要求1至8中任一项所述特征选择方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储有实现特征选择方法的程序,所述实现特征选择方法的程序被处理器执行以实现如权利要求1至8中任一项所述特征选择方法的步骤。
11.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至8中任一项所述特征选择方法的步骤。
CN202011475156.7A 2020-12-15 2020-12-15 特征选择方法、设备、可读存储介质及计算机程序产品 Pending CN114638274A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011475156.7A CN114638274A (zh) 2020-12-15 2020-12-15 特征选择方法、设备、可读存储介质及计算机程序产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011475156.7A CN114638274A (zh) 2020-12-15 2020-12-15 特征选择方法、设备、可读存储介质及计算机程序产品

Publications (1)

Publication Number Publication Date
CN114638274A true CN114638274A (zh) 2022-06-17

Family

ID=81944697

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011475156.7A Pending CN114638274A (zh) 2020-12-15 2020-12-15 特征选择方法、设备、可读存储介质及计算机程序产品

Country Status (1)

Country Link
CN (1) CN114638274A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115545216A (zh) * 2022-10-19 2022-12-30 上海零数众合信息科技有限公司 一种业务指标预测方法、装置、设备和存储介质
CN115640509A (zh) * 2022-12-26 2023-01-24 北京融数联智科技有限公司 一种联邦隐私计算中的数据相关性计算方法及系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115545216A (zh) * 2022-10-19 2022-12-30 上海零数众合信息科技有限公司 一种业务指标预测方法、装置、设备和存储介质
CN115545216B (zh) * 2022-10-19 2023-06-30 上海零数众合信息科技有限公司 一种业务指标预测方法、装置、设备和存储介质
CN115640509A (zh) * 2022-12-26 2023-01-24 北京融数联智科技有限公司 一种联邦隐私计算中的数据相关性计算方法及系统

Similar Documents

Publication Publication Date Title
CN109002861B (zh) 联邦建模方法、设备及存储介质
Qu et al. A novel quantum image steganography algorithm based on exploiting modification direction
WO2021190424A1 (zh) 针对隐私数据进行多方联合降维处理的方法和装置
CN112182649A (zh) 一种基于安全两方计算线性回归算法的数据隐私保护系统
Chen et al. Compression-unimpaired batch-image encryption combining vector quantization and index compression
CN110851869A (zh) 敏感信息处理方法、设备及可读存储介质
CN112822005A (zh) 基于同态加密的安全迁移学习系统
CN114638274A (zh) 特征选择方法、设备、可读存储介质及计算机程序产品
CN110807528A (zh) 特征相关性计算方法、设备及计算机可读存储介质
CN110750520A (zh) 特征数据处理方法、装置、设备及可读存储介质
WO2024060666A1 (zh) 人脸图像的加密/解密方法、装置、电子设备及存储介质
CN113435406A (zh) 实现隐私保护的人脸识别方法及装置
CN114417364A (zh) 一种数据加密方法、联邦建模方法、装置及计算机设备
Liu et al. Privacy preserving pca for multiparty modeling
Yang et al. Image feature extraction in encrypted domain with privacy-preserving Hahn moments
CN110851472A (zh) 样本匹配方法、设备及可读存储介质
Wang et al. Image encryption algorithm based on lattice hash function and privacy protection
CN110838069A (zh) 数据处理方法、装置以及系统
CN112001452B (zh) 特征选择方法、装置、设备及可读存储介质
CN111523674A (zh) 模型训练方法、装置及系统
CN111859440B (zh) 基于混合协议的分布式隐私保护逻辑回归模型的样本分类方法
CN112150339A (zh) 一种矢量地理数据水印加密解密方法及系统
CN116743376A (zh) 基于高效密文混淆技术的多方秘密分享数据隐私比较方法
CN111368314A (zh) 基于交叉特征的建模、预测方法、装置、设备及存储介质
CN113761570B (zh) 一种面向隐私求交的数据交互方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination