CN112182598A - 公有样本id识别方法、装置、服务器及可读存储介质 - Google Patents

公有样本id识别方法、装置、服务器及可读存储介质 Download PDF

Info

Publication number
CN112182598A
CN112182598A CN202010965690.XA CN202010965690A CN112182598A CN 112182598 A CN112182598 A CN 112182598A CN 202010965690 A CN202010965690 A CN 202010965690A CN 112182598 A CN112182598 A CN 112182598A
Authority
CN
China
Prior art keywords
sample
ciphertext
key
server
public
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010965690.XA
Other languages
English (en)
Inventor
许文彬
吴焕明
叶承
谭芳慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianmian Information Technology Shenzhen Co ltd
Original Assignee
Tianmian Information Technology Shenzhen Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianmian Information Technology Shenzhen Co ltd filed Critical Tianmian Information Technology Shenzhen Co ltd
Priority to CN202010965690.XA priority Critical patent/CN112182598A/zh
Publication of CN112182598A publication Critical patent/CN112182598A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/64Protecting data integrity, e.g. using checksums, certificates or signatures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/06Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols the encryption apparatus using shift registers or memories for block-wise or stream coding, e.g. DES systems or RC4; Hash functions; Pseudorandom sequence generators
    • H04L9/0643Hash functions, e.g. MD5, SHA, HMAC or f9 MAC
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/08Key distribution or management, e.g. generation, sharing or updating, of cryptographic keys or passwords
    • H04L9/0861Generation of secret information including derivation or calculation of cryptographic keys or passwords
    • H04L9/0869Generation of secret information including derivation or calculation of cryptographic keys or passwords involving random numbers or seeds
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/14Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols using a plurality of keys or algorithms

Abstract

本发明涉及数据处理,揭露一种公有样本ID识别方法,包括:计算第一数据库中各个第一样本ID的第一哈希值,基于第一、第二预设数及第一随机数生成第一密钥,采用第一密钥加密第一哈希值得到第一密文,建立第一样本ID与第一密文的第一映射关系表;从第二数据库获取第二密文,第二密文是由第二服务器采用第二密钥加密第二样本ID的第二哈希值得到的,第二密钥是第二服务器基于第二随机数生成的;计算第一密文与第二密文的第一交集,得到公有样本ID密文,基于第一映射关系表确定公有样本ID密文对应的明文数据。本发明还提供一种公有样本ID识别装置、服务器及可读存储介质。本发明实现了在保证数据安全性的前提下,提高了公有样本ID的识别效率。

Description

公有样本ID识别方法、装置、服务器及可读存储介质
技术领域
本发明涉及数据处理领域,尤其涉及一种公有样本ID识别方法、装置、服务器及可读存储介质。
背景技术
随着人工智能的发展,联邦学习以其消除了数据孤岛的障碍而被广泛应用于联合建模中,联邦学习过程中,各个参与方不需共享数据,分别使用本地数据训练模型,通过交换加密的模型参数来更新联合模型参数,从而获得一个公有模型。
联邦学习时需要在加密状态下找出各个参与方的公有用户ID(公有用户的ID相同,用户特征数据不同),以根据公有用户的数据建立初始模型,当前通常采用RSA非对称加密算法对各个参与方的数据进行加密,为保证数据的安全性,RSA密钥的长度通常较长,从而造成加密、解密的速度过慢,使得公有用户ID的识别效率低下。因此,亟需一种公有样本ID识别方法,以实现在保证数据安全性的前提下,提高公有样本ID的识别效率。
发明内容
鉴于以上内容,有必要提供一种公有样本ID识别方法,旨在实现在保证数据安全性的前提下,提高公有样本ID的识别效率。
本发明提供的公有样本ID识别方法,包括:
解析用户基于客户端发出的公有样本ID识别请求,获取所述请求携带的参与公有样本ID识别的第二服务器的标识;
计算第一数据库中各个第一样本ID的第一哈希值,基于第一、第二预设数及第一随机数生成第一密钥,采用所述第一密钥加密所述第一哈希值得到第一密文,建立第一样本ID与第一密文的第一映射关系表;
基于所述第二服务器的标识从第二数据库获取第二密文,所述第二密文是由所述第二服务器采用第二密钥加密第二样本ID的第二哈希值得到的,所述第二密钥是所述第二服务器基于第二随机数生成的;
计算所述第一密文与所述第二密文的第一交集,得到公有样本ID密文,并基于所述第一映射关系表确定所述公有样本ID密文对应的明文数据。
可选的,所述基于第一、第二预设数及第一随机数生成第一密钥包括:
生成第一、第二预设数及第一随机数,基于所述第一、第二预设数及第一随机数生成第三密钥,将所述第一、第二预设数和所述第三密钥发送给所述第二服务器;
获取所述第二服务器基于所述第一、第二预设数及所述第二随机数生成的第四密钥,基于所述第一预设数及所述第四密钥生成所述第一密钥。
可选的,所述第三密钥的计算公式为:
K1=qamodp
所述第四密钥的计算公式为:
K2=qbmodp
所述第一密钥的计算公式为:
K3=K2 amodp
其中,p为第一预设数,q为第二预设数,a为第一随机数,b为第二随机数,K1为第三密钥,K2为第四密钥,K3为第一密钥。
可选的,所述第二密钥的计算公式为:
K4=K1 bmodp
其中,p为第一预设数,K1为第三密钥,b为第二随机数,K4为第二密钥。
可选的,在得到公有样本ID密文之后,所述方法还包括:
构建预设字符与所述公有样本ID密文的第二映射关系表;
在基于所述第一映射关系表确定所述公有样本ID密文对应的明文数据之后,所述方法还包括:
基于所述第二映射关系表及所述公有样本ID密文对应的明文数据用所述预设标识符替换所述第一数据库中各个公有样本ID;
将所述第二映射关系表及所述公有样本ID密文发送给所述第二服务器,以供所述第二服务器将所述第二数据库中的各个公有样本ID转换为所述预设字符。
可选的,所述方法还包括:
若参与公有样本ID识别的第二服务器有多个,则分别获取各个第二服务器对应的各个第三样本ID的第三哈希值对应的第三密文,分别计算所述第一密文与各个第三密文的第二交集,再计算各个第二交集的交集,得到目标公有样本ID密文,基于所述第一映射关系表确定所述目标公有样本ID密文对应的明文数据。
为了解决上述问题,本发明还提供一种公有样本ID识别装置,所述装置包括:
解析模块,用于解析用户基于客户端发出的公有样本ID识别请求,获取所述请求携带的参与公有样本ID识别的第二服务器的标识;
加密模块,用于计算第一数据库中各个第一样本ID的第一哈希值,基于第一、第二预设数及第一随机数生成第一密钥,采用所述第一密钥加密所述第一哈希值得到第一密文,建立第一样本ID与第一密文的第一映射关系表;
获取模块,用于基于所述第二服务器的标识从第二数据库获取第二密文,所述第二密文是由所述第二服务器采用第二密钥加密第二样本ID的第二哈希值得到的,所述第二密钥是所述第二服务器基于第二随机数生成的;
确定模块,用于计算所述第一密文与所述第二密文的第一交集,得到公有样本ID密文,并基于所述第一映射关系表确定所述公有样本ID密文对应的明文数据。
可选的,所述基于第一、第二预设数及第一随机数生成第一密钥包括:
生成第一、第二预设数及第一随机数,基于所述第一、第二预设数及第一随机数生成第三密钥,将所述第一、第二预设数和所述第三密钥发送给所述第二服务器;
获取所述第二服务器基于所述第一、第二预设数及所述第二随机数生成的第四密钥,基于所述第一预设数及所述第四密钥生成所述第一密钥。
为了解决上述问题,本发明还提供一种服务器,所述服务器包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的公有样本ID识别程序,所述公有样本ID识别程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述公有样本ID识别方法。
为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有公有样本ID识别程序,所述公有样本ID识别程序可被一个或者多个处理器执行,以实现上述公有样本ID识别方法。
相较现有技术,本发明首先计算第一数据库中各个第一样本ID的第一哈希值,基于第一、第二预设数及第一随机数生成第一密钥,采用第一密钥加密第一哈希值得到第一密文,建立第一样本ID与第一密文的第一映射关系表;接着,从第二数据库获取第二密文,第二密文是由第二服务器采用第二密钥加密第二样本ID的第二哈希值得到的,第二密钥是第二服务器基于第二随机数生成的,本发明通过对各个第一、第二样本ID进行哈希运算得到第一、第二哈希值,实现了对第一、第二样本ID的重新编码,增加了第一、第二样本ID的安全性,同时第一服务器基于第一随机数生成第一密钥,第二服务器基于第二随机数生成第二密钥,使得采用第一、第二密钥加密得到的第一、第二密文的安全性更高;最后,计算第一密文与第二密文的第一交集,得到公有样本ID密文,基于第一映射关系表确定公有样本ID密文对应的明文数据,本步骤仅根据第一映射关系表即可确定公有样本ID密文对应的明文数据,而不需要任何解密操作,使得公有样本ID的识别效率更高。因此,本发明实现了在保证数据安全性的前提下,提高了公有样本ID的识别效率。
附图说明
图1为本发明一实施例提供的公有样本ID识别方法的流程示意图;
图2为本发明一实施例提供的公有样本ID识别装置的模块示意图;
图3为本发明一实施例提供的实现公有样本ID识别方法的服务器的结构示意图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
本发明提供一种公有样本ID识别方法。参照图1所示,为本发明一实施例提供的公有样本ID识别方法的流程示意图。
本实施例中,公有样本ID识别方法应用于第一服务器,所述公有样本ID识别方法包括:
S1、解析用户基于客户端发出的公有样本ID识别请求,获取所述请求携带的参与公有样本ID识别的第二服务器的标识。
本实施例中,公有样本ID为用户ID,所述ID可以是用户的身份证号码,也可以是用户的手机号码。假设第一服务器隶属于银行A,存储有用户在银行A的开户信息、收入支出信息,第二服务器隶属于电商B,存储有用户在电商B的购物平台上的购物信息,找出双方公有用户ID,根据公有用户不同维度的特征数据可实现银行A和电商B的联合建模。
所述第二服务器的标识可以是第二服务器的IP地址,也可以是第二服务器的MAC地址。
S2、计算第一数据库中各个第一样本ID的第一哈希值,基于第一、第二预设数及第一随机数生成第一密钥,采用所述第一密钥加密所述第一哈希值得到第一密文,建立第一样本ID与第一密文的第一映射关系表。
所述第一数据库为第一服务器中的数据库,第一服务器仅对本地数据进行处理,对第一数据库中各个第一样本ID进行哈希运算,实现了对各个第一样本ID的重新编码,增加了第一样本ID的安全性。
所述哈希函数的计算公式为:
yi=axi+b
其中,xi为第一数据库中第i个第一样本ID的key值,a、b为常数,yi为第一数据库中第i个第一样本ID的第一哈希值。
本实施例中,所述基于第一、第二预设数及第一随机数生成第一密钥包括:
A1、生成第一、第二预设数及第一随机数,基于所述第一、第二预设数及第一随机数生成第三密钥,将所述第一、第二预设数和所述第三密钥发送给所述第二服务器;
所述第三密钥的计算公式为:
K1=qamodp
其中,p为第一预设数,q为第二预设数,a为第一随机数,K1为第三密钥。
本实施例中,p为质数,q、a为整数,p、q、a都是第一服务器随机生成的,p、q为公开数据,可发送给其他服务器,a全程由第一服务器保管,不会发送给其他服务器,相当于第一服务器的私钥。
A2、获取所述第二服务器基于所述第一、第二预设数及所述第二随机数生成的第四密钥,基于所述第一预设数及所述第四密钥生成所述第一密钥。
所述第四密钥的计算公式为:
K2=qbmodp
其中,p为第一预设数,q为第二预设数,b为第二随机数,K2为第四密钥。
本实施例中,b为第二服务器随机生成的整数,全程由第二服务器保管,相当于第二服务器的私钥。
所述第一密钥的计算公式为:
K3=K2 amodp
其中,p为第一预设数,K2为第四密钥,a为第一随机数,K3为第一密钥。
S3、基于所述第二服务器的标识从第二数据库获取第二密文,所述第二密文是由所述第二服务器采用第二密钥加密第二样本ID的第二哈希值得到的,所述第二密钥是所述第二服务器基于第二随机数生成的。
所述第二数据库为第二服务器的本地数据库,第二数据库中各个第二样本ID的第二哈希值的计算方法与第一哈希值的计算方法相同。
所述第二密钥是基于所述第一预设数、第二随机数及第三密钥生成的,所述第二密钥的计算公式为:
K4=K1 bmodp
其中,p为第一预设数,K1为第三密钥,b为第二随机数,K4为第二密钥。
由取模运算规则可得出:
K4=K1 bmodp=(qamodp)bmodp=(qa)bmodp
K3=K2 amodp=(qbmodp)amodp=(qb)amodp
由此可知,K3=K4,即本发明在第一服务器不暴露私钥a、第二服务器不暴露私钥b的前提下,实现了第一服务器生成的第一密钥与第二服务器生成的第二密钥相同,从而采用第一密钥加密得到的第一密文与采用第二密钥加密得到的第二密文具有可比性。
S4、计算所述第一密文与所述第二密文的第一交集,得到公有样本ID密文,并基于所述第一映射关系表确定所述公有样本ID密文对应的明文数据。
本实施例中,根据第一映射关系表即可确定公有样本ID密文对应的明文数据,不需要进行任何解密操作,使得公有样本ID的识别效果更高。
本实施例中,在得到公有样本ID密文之后,所述方法还包括:
构建预设字符与所述公有样本ID密文的第二映射关系表;
在基于所述第一映射关系表确定所述公有样本ID密文对应的明文数据之后,所述方法还包括:
B1、基于所述第二映射关系表及所述公有样本ID密文对应的明文数据用所述预设标识符替换所述第一数据库中各个公有样本ID;
B2、将所述第二映射关系表及所述公有样本ID密文发送给所述第二服务器,以供所述第二服务器将所述第二数据库中的各个公有样本ID转换为所述预设字符。
本实施例中,所述预设字符可以是数字,也可以是字母,例如,第二映射关系表中数字1对应第一个公有样本ID,数字2对应第二个公有样本ID,则将第一数据中各个公有样本ID替换为对应的数字。第一服务器将第二映射关系表与公有样本ID密文发送给第二服务器之后,第二服务器同样不需要解密即可根据第二样本ID与第二密文的映射关系表确定公有样本ID密文对应的明文数据,再根据第二映射关系表可将第二数据库中各个公有样本ID替换为对应的预设字符,从而实现了在不交换数据的情况下将第一服务器与第二服务器本地数据库中的公有用户ID替换为相同的预设字符,进一步保障了公有用户ID的安全性。
在本发明的另一个实施例中,所述方法还包括:
若参与公有样本ID识别的第二服务器有多个,则分别获取各个第二服务器对应的各个第三样本ID的第三哈希值对应的第三密文,分别计算所述第一密文与各个第三密文的第二交集,再计算各个第二交集的交集,得到目标公有样本ID密文,基于所述第一映射关系表确定所述目标公有样本ID密文对应的明文数据。
例如,求银行A、电商B、保险公司C和航空公司D的公有用户ID的过程为:
计算银行A和电商B的公有用户ID得到DA∩B
计算银行A和保险公司C的公有用户ID得到DA∩C
计算银行A和航空公司D的公有用户ID得到DA∩D
则银行A、电商B、保险公司C和航空公司D的公有用户ID为DA∩B∩DA∩C∩DA∩D
由上述实施例可知,本发明提出的公有样本ID识别方法,首先,第一服务器计算第一数据库中各个第一样本ID的第一哈希值,基于第一、第二预设数及第一随机数生成第一密钥,采用第一密钥加密第一哈希值得到第一密文,建立第一样本ID与第一密文的第一映射关系表;接着,从第二数据库获取第二密文,第二密文是由第二服务器采用第二密钥加密第二样本ID的第二哈希值得到的,第二密钥是第二服务器基于第二随机数生成的,本发明通过对各个第一、第二样本ID进行哈希运算得到第一、第二哈希值,实现了对第一、第二样本ID的重新编码,增加了第一、第二样本ID的安全性,同时第一服务器基于第一随机数生成第一密钥,第二服务器基于第二随机数生成第二密钥,使得采用第一、第二密钥加密得到的第一、第二密文的安全性更高;最后,计算第一密文与第二密文的第一交集,得到公有样本ID密文,基于第一映射关系表确定公有样本ID密文对应的明文数据,本步骤仅根据第一映射关系表即可确定公有样本ID密文对应的明文数据,而不需要任何解密操作,使得公有样本ID的识别效率更高。因此,本发明实现了在保证数据安全性的前提下,提高了公有样本ID的识别效率。
如图2所示,为本发明一实施例提供的公有样本ID识别装置的模块示意图。
本发明所述公有样本ID识别装置100安装于第一服务器中。根据实现的功能,所述公有样本ID识别装置100可以包括解析模块110、加密模块120、获取模块130及确定模块140。本发明所述模块也可以称之为单元,是指一种能够被第一服务器处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在第一服务器的存储器中。
在本实施例中,关于各模块/单元的功能如下:
解析模块110,用于解析用户基于客户端发出的公有样本ID识别请求,获取所述请求携带的参与公有样本ID识别的第二服务器的标识。
本实施例中,公有样本ID为用户ID,所述ID可以是用户的身份证号码,也可以是用户的手机号码。假设第一服务器隶属于银行A,存储有用户在银行A的开户信息、收入支出信息,第二服务器隶属于电商B,存储有用户在电商B的购物平台上的购物信息,找出双方公有用户ID,根据公有用户不同维度的特征数据可实现银行A和电商B的联合建模。
所述第二服务器的标识可以是第二服务器的IP地址,也可以是第二服务器的MAC地址。
加密模块120,用于计算第一数据库中各个第一样本ID的第一哈希值,基于第一、第二预设数及第一随机数生成第一密钥,采用所述第一密钥加密所述第一哈希值得到第一密文,建立第一样本ID与第一密文的第一映射关系表。
所述第一数据库为第一服务器中的数据库,第一服务器仅对本地数据进行处理,对第一数据库中各个第一样本ID进行哈希运算,实现了对各个第一样本ID的重新编码,增加了第一样本ID的安全性。
所述哈希函数的计算公式为:
yi=axi+b
其中,xi为第一数据库中第i个第一样本ID的key值,a、b为常数,yi为第一数据库中第i个第一样本ID的第一哈希值。
本实施例中,所述基于第一、第二预设数及第一随机数生成第一密钥包括:
A1、生成第一、第二预设数及第一随机数,基于所述第一、第二预设数及第一随机数生成第三密钥,将所述第一、第二预设数和所述第三密钥发送给所述第二服务器;
所述第三密钥的计算公式为:
K1=qamodp
其中,p为第一预设数,q为第二预设数,a为第一随机数,K1为第三密钥。
本实施例中,p为质数,q、a为整数,p、q、a都是第一服务器随机生成的,p、q为公开数据,可发送给其他服务器,a全程由第一服务器保管,不会发送给其他服务器,相当于第一服务器的私钥。
A2、获取所述第二服务器基于所述第一、第二预设数及所述第二随机数生成的第四密钥,基于所述第一预设数及所述第四密钥生成所述第一密钥。
所述第四密钥的计算公式为:
K2=qbmodp
其中,p为第一预设数,q为第二预设数,b为第二随机数,K2为第四密钥。
本实施例中,b为第二服务器随机生成的整数,全程由第二服务器保管,相当于第二服务器的私钥。
所述第一密钥的计算公式为:
K3=K2 amodp
其中,p为第一预设数,K2为第四密钥,a为第一随机数,K3为第一密钥。
获取模块130,用于基于所述第二服务器的标识从第二数据库获取第二密文,所述第二密文是由所述第二服务器采用第二密钥加密第二样本ID的第二哈希值得到的,所述第二密钥是所述第二服务器基于第二随机数生成的。
所述第二数据库为第二服务器的本地数据库,第二数据库中各个第二样本ID的第二哈希值的计算方法与第一哈希值的计算方法相同。
所述第二密钥是基于所述第一预设数、第二随机数及第三密钥生成的,所述第二密钥的计算公式为:
K4=K1 bmodp
其中,p为第一预设数,K1为第三密钥,b为第二随机数,K4为第二密钥。
由取模运算规则可得出:
K4=K1 bmodp=(qamodp)bmodp=(qa)bmodp
K3=K2 amodp=(qbmodp)amodp=(qb)amodp
由此可知,K3=K4,即本发明在第一服务器不暴露私钥a、第二服务器不暴露私钥b的前提下,实现了第一服务器生成的第一密钥与第二服务器生成的第二密钥相同,从而采用第一密钥加密得到的第一密文与采用第二密钥加密得到的第二密文具有可比性。
确定模块140,用于计算所述第一密文与所述第二密文的第一交集,得到公有样本ID密文,并基于所述第一映射关系表确定所述公有样本ID密文对应的明文数据。
本实施例中,根据第一映射关系表即可确定公有样本ID密文对应的明文数据,不需要进行任何解密操作,使得公有样本ID的识别效果更高。
本实施例中,在得到公有样本ID密文之后,所述确定模块140还用于:
构建预设字符与所述公有样本ID密文的第二映射关系表;
在基于所述第一映射关系表确定所述公有样本ID密文对应的明文数据之后,所述确定模块140还用于:
B1、基于所述第二映射关系表及所述公有样本ID密文对应的明文数据用所述预设标识符替换所述第一数据库中各个公有样本ID;
B2、将所述第二映射关系表及所述公有样本ID密文发送给所述第二服务器,以供所述第二服务器将所述第二数据库中的各个公有样本ID转换为所述预设字符。
本实施例中,所述预设字符可以是数字,也可以是字母,例如,第二映射关系表中数字1对应第一个公有样本ID,数字2对应第二个公有样本ID,则将第一数据中各个公有样本ID替换为对应的数字。第一服务器将第二映射关系表与公有样本ID密文发送给第二服务器之后,第二服务器同样不需要解密即可根据第二样本ID与第二密文的映射关系表确定公有样本ID密文对应的明文数据,再根据第二映射关系表可将第二数据库中各个公有样本ID替换为对应的预设字符,从而实现了在不交换数据的情况下将第一服务器与第二服务器本地数据库中的公有用户ID替换为相同的预设字符,进一步保障了公有用户ID的安全性。
在本发明的另一个实施例中,所述确定模块140还用于:
若参与公有样本ID识别的第二服务器有多个,则分别获取各个第二服务器对应的各个第三样本ID的第三哈希值对应的第三密文,分别计算所述第一密文与各个第三密文的第二交集,再计算各个第二交集的交集,得到目标公有样本ID密文,基于所述第一映射关系表确定所述目标公有样本ID密文对应的明文数据。
例如,求银行A、电商B、保险公司C和航空公司D的公有用户ID的过程为:
计算银行A和电商B的公有用户ID得到DA∩B
计算银行A和保险公司C的公有用户ID得到DA∩C
计算银行A和航空公司D的公有用户ID得到DA∩D
则银行A、电商B、保险公司C和航空公司D的公有用户ID为DA∩B∩DA∩C∩DA∩D
如图3所示,为本发明一实施例提供的实现公有样本ID识别方法的服务器的结构示意图。本实施例中,实现公有样本ID识别方法的服务器是如图3所示的第一服务器1,所述第一服务器1与第二服务器通信连接。
所述第一服务器1是一种能够按照事先设定或者存储的指令,自动进行数值计算和/或信息处理的设备。所述第一服务器1可以是计算机、也可以是单个网络服务器、多个网络服务器组成的服务器组或者基于云计算的由大量主机或者网络服务器构成的云,其中云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。
在本实施例中,第一服务器1包括,但不仅限于,可通过系统总线相互通信连接的存储器11、处理器12、网络接口13,该存储器11中存储有公有样本ID识别程序10,所述公有样本ID识别程序10可被所述处理器12执行。图3仅示出了具有组件11-13以及公有样本ID识别程序10的第一服务器1,本领域技术人员可以理解的是,图3示出的结构并不构成对第一服务器1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
其中,存储器11包括内存及至少一种类型的可读存储介质。内存为第一服务器1的运行提供缓存;可读存储介质可为如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等的非易失性存储介质。在一些实施例中,可读存储介质可以是第一服务器1的内部存储单元,例如该第一服务器1的硬盘;在另一些实施例中,该非易失性存储介质也可以是第一服务器1的外部存储设备,例如第一服务器1上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。本实施例中,存储器11的可读存储介质通常用于存储安装于第一服务器1的操作系统和各类应用软件,例如存储本发明一实施例中的公有样本ID识别程序10的代码等。此外,存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器12在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器12通常用于控制所述第一服务器1的总体操作,例如执行与其他设备进行数据交互或者通信相关的控制和处理等。本实施例中,所述处理器12用于运行所述存储器11中存储的程序代码或者处理数据,例如运行公有样本ID识别程序10等。
网络接口13可包括无线网络接口或有线网络接口,该网络接口13用于在所述第一服务器1与第二服务器(图中未画出)或与客户端(图中未画出)之间建立通信连接。
可选的,所述第一服务器1还可以包括用户接口,用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。可选的,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在第一服务器1中处理的信息以及用于显示可视化的用户界面。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
所述第一服务器1中的所述存储器11存储的公有样本ID识别程序10是多个指令的组合,在所述处理器12中运行时,可以实现:
解析用户基于客户端发出的公有样本ID识别请求,获取所述请求携带的参与公有样本ID识别的第二服务器的标识;
计算第一数据库中各个第一样本ID的第一哈希值,基于第一、第二预设数及第一随机数生成第一密钥,采用所述第一密钥加密所述第一哈希值得到第一密文,建立第一样本ID与第一密文的第一映射关系表;
基于所述第二服务器的标识从第二数据库获取第二密文,所述第二密文是由所述第二服务器采用第二密钥加密第二样本ID的第二哈希值得到的,所述第二密钥是所述第二服务器基于第二随机数生成的;
计算所述第一密文与所述第二密文的第一交集,得到公有样本ID密文,并基于所述第一映射关系表确定所述公有样本ID密文对应的明文数据。
具体地,所述处理器12对上述公有样本ID识别程序10的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。需要强调的是,为进一步保证上述第一、第二样本ID的私密和安全性,上述第一、第二样本ID还可以存储于一区块链的节点中。
进一步地,所述第一服务器1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。所述计算机可读介质可以是非易失性的,也可以是非易失性的。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
所述计算机可读存储介质上存储有公有样本ID识别程序10,所述公有样本ID识别程序10可被一个或者多个处理器执行,本发明计算机可读存储介质具体实施方式与上述公有样本ID识别方法各实施例基本相同,在此不作赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (10)

1.一种公有样本ID识别方法,应用于第一服务器,其特征在于,所述方法包括:
解析用户基于客户端发出的公有样本ID识别请求,获取所述请求携带的参与公有样本ID识别的第二服务器的标识;
计算第一数据库中各个第一样本ID的第一哈希值,基于第一、第二预设数及第一随机数生成第一密钥,采用所述第一密钥加密所述第一哈希值得到第一密文,建立第一样本ID与第一密文的第一映射关系表;
基于所述第二服务器的标识从第二数据库获取第二密文,所述第二密文是由所述第二服务器采用第二密钥加密第二样本ID的第二哈希值得到的,所述第二密钥是所述第二服务器基于第二随机数生成的;
计算所述第一密文与所述第二密文的第一交集,得到公有样本ID密文,并基于所述第一映射关系表确定所述公有样本ID密文对应的明文数据。
2.如权利要求1所述的公有样本ID识别方法,其特征在于,所述基于第一、第二预设数及第一随机数生成第一密钥包括:
生成第一、第二预设数及第一随机数,基于所述第一、第二预设数及第一随机数生成第三密钥,将所述第一、第二预设数和所述第三密钥发送给所述第二服务器;
获取所述第二服务器基于所述第一、第二预设数及所述第二随机数生成的第四密钥,基于所述第一预设数及所述第四密钥生成所述第一密钥。
3.如权利要求2所述的公有样本ID识别方法,其特征在于,所述第三密钥的计算公式为:
K1=qamodp
所述第四密钥的计算公式为:
K2=qbmodp
所述第一密钥的计算公式为:
K3=K2 amodp
其中,p为第一预设数,q为第二预设数,a为第一随机数,b为第二随机数,K1为第三密钥,K2为第四密钥,K3为第一密钥。
4.如权利要求3所述的公有样本ID识别方法,其特征在于,所述第二密钥的计算公式为:
K4=K1 bmodp
其中,p为第一预设数,K1为第三密钥,b为第二随机数,K4为第二密钥。
5.如权利要求1所述的公有样本ID识别方法,其特征在于,在得到公有样本ID密文之后,所述方法还包括:
构建预设字符与所述公有样本ID密文的第二映射关系表;
在基于所述第一映射关系表确定所述公有样本ID密文对应的明文数据之后,所述方法还包括:
基于所述第二映射关系表及所述公有样本ID密文对应的明文数据用所述预设标识符替换所述第一数据库中各个公有样本ID;
将所述第二映射关系表及所述公有样本ID密文发送给所述第二服务器,以供所述第二服务器将所述第二数据库中的各个公有样本ID转换为所述预设字符。
6.如权利要求1所述的公有样本ID识别方法,其特征在于,所述方法还包括:
若参与公有样本ID识别的第二服务器有多个,则分别获取各个第二服务器对应的各个第三样本ID的第三哈希值对应的第三密文,分别计算所述第一密文与各个第三密文的第二交集,再计算各个第二交集的交集,得到目标公有样本ID密文,基于所述第一映射关系表确定所述目标公有样本ID密文对应的明文数据。
7.一种公有样本ID识别装置,其特征在于,所述装置包括:
解析模块,用于解析用户基于客户端发出的公有样本ID识别请求,获取所述请求携带的参与公有样本ID识别的第二服务器的标识;
加密模块,用于计算第一数据库中各个第一样本ID的第一哈希值,基于第一、第二预设数及第一随机数生成第一密钥,采用所述第一密钥加密所述第一哈希值得到第一密文,建立第一样本ID与第一密文的第一映射关系表;
获取模块,用于基于所述第二服务器的标识从第二数据库获取第二密文,所述第二密文是由所述第二服务器采用第二密钥加密第二样本ID的第二哈希值得到的,所述第二密钥是所述第二服务器基于第二随机数生成的;
确定模块,用于计算所述第一密文与所述第二密文的第一交集,得到公有样本ID密文,并基于所述第一映射关系表确定所述公有样本ID密文对应的明文数据。
8.如权利要求7所述的公有样本ID识别装置,其特征在于,所述基于第一、第二预设数及第一随机数生成第一密钥包括:
生成第一、第二预设数及第一随机数,基于所述第一、第二预设数及第一随机数生成第三密钥,将所述第一、第二预设数和所述第三密钥发送给所述第二服务器;
获取所述第二服务器基于所述第一、第二预设数及所述第二随机数生成的第四密钥,基于所述第一预设数及所述第四密钥生成所述第一密钥。
9.一种服务器,其特征在于,所述服务器包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的公有样本ID识别程序,所述公有样本ID识别程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至6中任一项所述的公有样本ID识别方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有公有样本ID识别程序,所述公有样本ID识别程序可被一个或者多个处理器执行,以实现如权利要求1至6任一项所述的公有样本ID识别方法。
CN202010965690.XA 2020-09-14 2020-09-14 公有样本id识别方法、装置、服务器及可读存储介质 Pending CN112182598A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010965690.XA CN112182598A (zh) 2020-09-14 2020-09-14 公有样本id识别方法、装置、服务器及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010965690.XA CN112182598A (zh) 2020-09-14 2020-09-14 公有样本id识别方法、装置、服务器及可读存储介质

Publications (1)

Publication Number Publication Date
CN112182598A true CN112182598A (zh) 2021-01-05

Family

ID=73921026

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010965690.XA Pending CN112182598A (zh) 2020-09-14 2020-09-14 公有样本id识别方法、装置、服务器及可读存储介质

Country Status (1)

Country Link
CN (1) CN112182598A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115208677A (zh) * 2022-07-19 2022-10-18 光大科技有限公司 一种恶意网址识别方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170019255A1 (en) * 2015-07-13 2017-01-19 Fujitsu Limited Relational encryption for password verification
CN109347620A (zh) * 2018-08-10 2019-02-15 深圳前海微众银行股份有限公司 样本对齐方法、系统及计算机可读存储介质
CN111291084A (zh) * 2020-02-12 2020-06-16 深圳前海微众银行股份有限公司 样本id对齐方法、装置、设备及存储介质
CN111402095A (zh) * 2020-03-23 2020-07-10 温州医科大学 一种基于同态加密联邦学习来检测学生行为与心理的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170019255A1 (en) * 2015-07-13 2017-01-19 Fujitsu Limited Relational encryption for password verification
CN109347620A (zh) * 2018-08-10 2019-02-15 深圳前海微众银行股份有限公司 样本对齐方法、系统及计算机可读存储介质
CN111291084A (zh) * 2020-02-12 2020-06-16 深圳前海微众银行股份有限公司 样本id对齐方法、装置、设备及存储介质
CN111402095A (zh) * 2020-03-23 2020-07-10 温州医科大学 一种基于同态加密联邦学习来检测学生行为与心理的方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115208677A (zh) * 2022-07-19 2022-10-18 光大科技有限公司 一种恶意网址识别方法及装置
CN115208677B (zh) * 2022-07-19 2024-01-30 光大科技有限公司 一种恶意网址识别方法及装置

Similar Documents

Publication Publication Date Title
CN112751852B (zh) 数据传输方法及相关设备
CN106575427A (zh) 基于零知识环境的社交网络引擎
CN112948851A (zh) 用户认证方法、装置、服务器及存储介质
CN110830242A (zh) 一种密钥生成、管理方法和服务器
CN113112252B (zh) 基于区块链的资源转移方法、装置、电子设备及存储介质
CN112860737B (zh) 数据查询方法、装置、电子设备及可读存储介质
CN112492048B (zh) 消息同步方法、装置、电子设备及可读存储介质
CN111695097A (zh) 登录检验方法、装置及计算机可读存储介质
CN112184444A (zh) 基于信息的特征进行信息处理的方法、装置、设备及介质
CN111291122B (zh) 基于区块链的竞标方法及装置
CN113704357A (zh) 一种基于区块链的智慧城市数据共享方法及系统
CN111859431A (zh) 电子文件签章方法、装置、电子设备及存储介质
CN113420049A (zh) 数据流通方法、装置、电子设备及存储介质
CN114417374A (zh) 基于区块链的智能合约名片方法、装置、设备及存储介质
CN112217639B (zh) 数据的加密共享方法、装置、电子设备及计算机存储介质
WO2022012162A1 (zh) 基于矩阵运算的数据加密方法、装置、电子设备及存储介质
CN112182598A (zh) 公有样本id识别方法、装置、服务器及可读存储介质
US11362806B2 (en) System and methods for recording codes in a distributed environment
CN112286703B (zh) 用户分类方法、装置、客户端设备及可读存储介质
CN114298321A (zh) 联合建模方法、装置、电子设备及存储介质
CN112950154B (zh) 流程信息匹配方法、装置、设备及存储介质
CN114422105A (zh) 联合建模方法、装置、电子设备及存储介质
CN114629663A (zh) 基于区块链的数字商品交易方法及装置
CN115643090A (zh) 基于隐私检索的纵向联邦分析方法、装置、设备及介质
CN115965458A (zh) 生成标记化的信誉分数

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination