CN115021908A - 三重复合函数的去隐私方法、装置、计算机设备及介质 - Google Patents

三重复合函数的去隐私方法、装置、计算机设备及介质 Download PDF

Info

Publication number
CN115021908A
CN115021908A CN202210601029.XA CN202210601029A CN115021908A CN 115021908 A CN115021908 A CN 115021908A CN 202210601029 A CN202210601029 A CN 202210601029A CN 115021908 A CN115021908 A CN 115021908A
Authority
CN
China
Prior art keywords
data
privacy
encrypted
needing
field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210601029.XA
Other languages
English (en)
Inventor
张兴
郑文
江茜
高磊
聂二保
杨芬
王影
陈谦
翟志佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cec Cyberspace Great Wall Co ltd
Original Assignee
Cec Cyberspace Great Wall Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cec Cyberspace Great Wall Co ltd filed Critical Cec Cyberspace Great Wall Co ltd
Priority to CN202210601029.XA priority Critical patent/CN115021908A/zh
Publication of CN115021908A publication Critical patent/CN115021908A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/08Key distribution or management, e.g. generation, sharing or updating, of cryptographic keys or passwords
    • H04L9/0861Generation of secret information including derivation or calculation of cryptographic keys or passwords
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/008Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols involving homomorphic encryption

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Storage Device Security (AREA)

Abstract

本发明提供一种三重复合函数的去隐私方法、装置、计算机设备和计算机可读存储介质。所述三重复合函数的去隐私方法,包括:识别原始数据中的隐私数据;在所述隐私数据中识别出需要加密的数据,对所述需要加密的数据进行加密;根据所述需要加密的数据,以及不需要加密的数据,确定需要加密的运算逻辑,其中,所述运算逻辑为对所述需要加密的数据与不需要加密的数据进行运算的规则;对所述需要加密的运算逻辑进行加密,得到去隐私后的数据。

Description

三重复合函数的去隐私方法、装置、计算机设备及介质
技术领域
本发明涉及通信领域,尤其涉及一种三重复合函数的去隐私方法、装置、计算机设备和计算机可读存储介质。
背景技术
随着互联网技术,特别是移动互联网的飞速发展,无论是企业还是个人,都会在互联网留存大量的信息,即产生基于互联网的大数据,这些数据生产和利用的过程,极大方便了企业运营、个人生活的同时,给商业机密信息和个人隐私信息的泄露也提供了便利,甚至催生了专门盗取、售卖、攻击此类需要保护信息的产业链和产业网络,给企业和个人造成损害,增加了社会管理成本。
因此,如何对这些受保护信息做到安全的传播和使用,成为重要的课题。通用的办法,是通过各种加密技术,包括硬件加密、软件加密等手段,尽量做到对这些信息的脱敏、去标签化、匿名化等。但是,这些技术手段在实际使用中,往往存在一些局限性。例如,半同态加密、乘法同态加密、加法同态加密等同态加密算法虽然已经得到了商业应用,但在解密过程中需要消耗过多运算资源,成本较高,并不经济。
发明内容
本发明提供一种三重复合函数的去隐私方法、装置、计算机设备和计算机可读存储介质。
第一方面,本发明提供了一种三重复合函数的去隐私方法,包括:
识别原始数据中的隐私数据;
在所述隐私数据中识别出需要加密的数据,对所述需要加密的数据进行加密;
根据所述需要加密的数据与不需要加密的数据,确认需要加密的运算逻辑,其中,所述运算逻辑为对所述需要加密的数据与不需要加密的数据进行运算的规则;
对所述需要加密的运算逻辑进行加密,得到去隐私后的数据。
在一些实施例中,所述识别原始数据中的隐私数据包括:
将所述原始数据分解为字段名与字段值;
根据所述原始数据中的字段名,识别出隐私字段;
将包括所述隐私字段的原始数据,判定为隐私数据。
在一些实施例中,所述根据所述原始数据中的字段名,识别出隐私字段包括:
将所述原始数据中所有的字段名与预定的敏感词库进行匹配;
将匹配成功的字段名判定为隐私字段;
将未匹配成功的字段名判定为非隐私字段。
在一些实施例中,所述识别原始数据中的隐私数据还包括:
将所述原始数据中所有的字段值与预定的敏感数据类型判定库进行匹配;
将字段值匹配成功的原始数据判定为隐私数据。
在一些实施例中,所述三重复合函数的去隐私方法还包括:
根据所述隐私数据对应的原始数据的字段值,确定所述字段值的数据属性;
根据所述数据属性,将所述隐私数据区分为需要加密的数据与不需要加密的数据。
在一些实施例中,所述根据所述需要加密的数据,以及不需要加密的数据,确定需要加密的运算逻辑包括:
针对所述需要加密的数据与所述不需要加密的数据,根据预定的运算逻辑判断规则,确定需要执行加密操作的运算逻辑。
可选地,在所述对所述需要加密的数据进行加密之前,还包括:
设置加密算法库;
采用可配置的方式调取加密算法对所述需要加密的数据进行加密。
可选地,采用以下加密算法中的至少一种对所述需要加密的数据进行加密:对称加密、非对称加密。
可选地,采用以下加密算法中的至少一种对所述运算逻辑进行加密:全同态加密、乘法同态、加法同态。
第二方面,本发明提供了一种计算机设备,所述计算机设备包括:
一个或多个处理器;
存储器,其上存储有一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现根据第一方面中任意一项所述的三重复合函数的去隐私方法;
一个或多个I/O接口,连接在所述处理器与存储器之间,配置为实现所述处理器与存储器的信息交互。
第三方面,本发明提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现根据第一方面中任意一项所述的三重复合函数的去隐私方法。
第四方面,本发明提供了一种三重复合函数的去隐私装置,包括:
隐私数据识别单元,用于识别原始数据中的隐私数据;
隐私数据安全处理单元,用于在所述隐私数据中识别出需要加密的数据,对所述需要加密的数据进行加密;
隐私逻辑安全处理单元,用于根据所述需要加密的数据,以及不需要加密的数据,确定需要加密的运算逻辑,并对所述需要加密的运算逻辑进行加密,得到去隐私后的数据;其中,所述运算逻辑为对所述需要加密的数据与所述不需要加密的数据进行运算的规则。
本发明提出的三重复合函数的去隐私方法,从隐私数据识别、隐私数据保护、隐私逻辑保护三个层面,依据“是否隐私信息”、“是否需要保护”进行有效的隐私信息识别和去隐私化处理,做到“有的放矢”,不但能够解决现有技术对何为隐私信息识别较为笼统,不能准确判断的问题,而且通过在不同场景下识别并保护隐私信息的三层复合架构,依据“是否有必要”来决定是否进行去隐私处理,降低处理量,解决相关技术进行加密处理时占用资源过多的问题。
附图说明
图1是本发明实施例提供的一种三重复合函数的去隐私方法的流程图。
图2是本发明实施例提供的三重复合函数的去隐私方法整体框架示意图。
图3是本发明实施例提供的隐私数据识别流程示意图。
图4是本发明实施例提供的隐私数据保护流程示意图。
图5是本发明实施例提供的隐私逻辑保护流程示意图。
图6是本发明实施例提供的一种三重复合函数的去隐私装置的示意图。
图7是本发明实施例提供的一种计算机设备的示意图。
图8是本发明实施例提供的一种计算机可读存储介质的示意图。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身没有特有的意义。因此,“模块”、“部件”或“单元”可以混合地使用。
在现有法律框架中,隐私信息一般指的是针对个人的诸如姓名、身份证号码、手机号码、银行卡号码等,本发明的发明人认为,针对企业也存在商业机密信息的保护问题,这些信息如同个人隐私信息一样,也可以纳入隐私保护的范畴,因此,本发明所指向的隐私信息,并不特指个人隐私保护的对象,而泛指在合乎法律框架的前提下,任一主体希望保护的信息载体,其上承载的可能是数据,也可能是过程等,简言之,主体在合规框架下希望保护的所有信息均可成为隐私信息。
本发明的发明人研究发现,现有的现骨干技术中,存在如下几方面的缺陷:
1)现有隐私保护没有统一的方法框架,将隐私保护与共识机制、密码技术、加密算法等混淆在一起,但这些技术,从其根本来说,并没有能力区分何为隐私信息;同时,这些技术,如何能有效地组合在一起保护隐私信息同时,尽量做到系统资源的优化使用,也没有一个整体性方法指导框架。
2)现有技术并没有真正的针对“隐私信息”的专有化技术,无论是加密技术还是联邦学习、多方安全技术等技术,并不是针对“隐私信息”的专门算法,并不区分隐私信息和非隐私信息,从“算料”层面讲,并没有专门性规定。
3)在实际中,隐私信息的范畴是“动态”的,一些信息在某些场景下需要保护,但在另一些场景下可能不需要作为隐私进行保护,甚至向使用者开放这些信息成为必要。举例来说,一般情况下个人的姓名和身份证号码需要作为隐私信息保护,但在办理诸如银行柜台转账等业务时,可能必须提供真实信息,此时不适用隐私保护措施。如果不分场景,对所有隐私信息,甚至全面信息都进行保护,会对计算机系统造成不必要压力,增加无意义的算力开销。
针对现有技术的上述问题,发明人提出了一种统一的去隐私的方法框架,从隐私数据识别、隐私数据保护、隐私逻辑保护三个层面进行有效的隐私信息识别和处理,做到“有的放矢”,在不同场景下识别并保护隐私信息的基本框架,依据“是否有必要”来决定是否进行去隐私处理,降低处理量,解决相关技术进行加密处理时占用资源过多的问题。
第一方面,本发明实施例提供一种三重复合函数的去隐私方法,如图1所示,所述三重复合函数的去隐私方法包括如下步骤:
在步骤S100中,识别原始数据中的隐私数据;
在步骤S200中,在所述隐私数据中识别出需要加密的数据,对所述需要加密的数据进行加密;
在步骤S300中,根据所述需要加密的数据,以及不需要加密的数据,确定需要加密的运算逻辑,其中,所述运算逻辑为对所述需要加密的数据与不需要加密的数据进行运算的规则;
在步骤S400中,对所述需要加密的运算逻辑进行加密,得到去隐私后的数据。
需要说明的是,本发明所指的原始数据,指的是作为三重复合函数的去隐私方法要进行处理的数据,该数据可能来自于不同的设备,如智能手机、个人PC、企业OA系统等;可能是图片、多媒体、声音等种类,同一种类的数据,也可能是多种不同的格式,基本呈现多源异构的特征。为了表述的简便起见,原始数据以D表示。
如图2所示,在本发明的技术方案中,将原始数据作为输入,通过隐私数据识别函数F1、隐私数据保护函数F2、隐私逻辑保护函数F3三重函数处理,从隐私数据识别、隐私数据保护、隐私逻辑保护三个层面进行有效的隐私信息识别和去隐私,最后输出去隐私后的数据,实现去隐私目的。如果以F作为本发明最后的输出结果,则三重函数关系如公式1:
F=F3(F2(F1)) (1)
原始数据D经F1函数处理,由一个整体的数据集,分成不同的两个部分,分别为非隐私数据Dn和隐私数据Dy两个子集。
隐私数据Dy经F2函数处理,由一个整体的数据集,分成为不需加密的数据Du和需要加密的数据Dm。
在隐私保护的构成中,可能造成隐私泄露的不仅是需要加密的隐私数据的值本身,有些数据单独看来并不是需要加密的数据,但是经过运算逻辑的加工却可能确定出隐私。例如,个人手机号码本身可能是公开的,但由于手机号码绑定了身份信息、支付软件、快递信息、行程信息等,会将相互有联系的众多数据关联起来,经过运算加工,仍可能导致个人隐私的泄露。因此,需要将Du和Dm均作为“算料”数据进行处理。对“算料”数据进行处理时,会用到的各种数学运算规则,这些运算规则中的一部分,往往也是需要保护的隐私信息,也需要经过去隐私化,因此,本发明中引入F3函数。F3函数是针对数据运算逻辑的去隐私过程。
通过预定的运算逻辑判断规则,确认出需要和不需要执行加密操作的运算逻辑,即隐私逻辑和非隐私逻辑,对于隐私逻辑可以进行逻辑运算或算术运算。通过F3函数调用去隐私的算法(如同态加密、信息混淆、差分隐私),或加密方法(如全同态加密、乘法同态、加法同态)等输出加密结果。加密结果可以是梯度函数、权重、或直接的模型结果,也可调用F2函数进行加密。
经过F1、F2、F3从隐私数据识别、隐私数据保护、隐私逻辑保护三个层面进行的三重函数处理,依据“是否隐私信息”、“是否需要保护”进行有效的隐私信息识别和去隐私化处理,做到“有的放矢”,不但能够解决现有技术对何为隐私信息识别较为笼统,不能准确判断的问题,而且通过在不同场景下识别并保护隐私信息的三层复合架构,依据“是否有必要”来决定是否进行去隐私处理,降低处理量,解决相关技术进行加密处理时占用资源过多的问题。
在一些实施例中,所述识别原始数据中的隐私数据包括:
将所述原始数据分解为字段名与字段值;
根据所述原始数据中的字段名,识别出隐私字段;
将包括所述隐私字段的原始数据,判定为隐私数据。
原始数据D一般以字段名和字段值的形式存在,可将D表示为D(k,v),k代表字段名(键),即key,v代表字段值(值),即value。
如图3所示,原始数据D经F1函数处理,由一个整体的数据集,分成不同的两个部分,分别为非隐私数据Dn和隐私数据Dy两个子集。F1函数为隐私数据识别函数,该函数由fk和fv两个函数构成,其关系由公式2确定:
F1=fv(fk) (2)
其中,fk为键识别函数,fv为值识别函数。
在一些实施例中,所述根据所述原始数据中的字段名,识别出隐私字段包括:
将所述原始数据中所有的字段名与预定的敏感词库进行匹配;
将匹配成功的字段名判定为隐私字段;
将未匹配成功的字段名判定为非隐私字段。
公式2中fk函数的处理流程如下:
fk函数启动,对D中的k值进行识别,目的是识别k中是否包含隐私字段。该过程的实现依赖于一个敏感字段的词库,识别过程为将D中所有k值与该敏感词库进行碰撞,给出是否命中的结果,命中的k值均判别为隐私字段,否则为非隐私字段。需要注意的是,该词库是可维护的,可包括诸如“姓名、身份证号码、手机号码、银行账号”等,用户可根据不同场景进行灵活配置,可将词库中的字段取出,或增加新的字段。
在一些实施例中,所述识别原始数据中的隐私数据还包括:
将所述原始数据中所有的字段值与预定的敏感数据类型判定库进行匹配;
将字段值匹配成功的原始数据判定为隐私数据。
公式2中fv函数的处理流程如下:
fv函数启动,考虑到D(k,v)中的字段值与字段名不一定对齐,存在错位情况,如“姓名”下对应的是为手机号码,且开头均为“130、150、155”等打头,或对应的是身份证号码,第7位开始,用6个数字表示一个人的出生日期。如存在错配情况,则当姓名在某种场景下不作为隐私信息保护时,其下对应的手机号码或身份证号码可能会被移出隐私信息的范围而得不到保护,导致去隐私方法“失灵”。
因此,本发明的fv函数是针对字段值进行识别,主要是针对value进行的判定,与字段名识别不同的是,该函数不是与敏感词库进行碰撞,而是通过手机号码编码方法、身份证号码编码方法等特征出发,预设的数据类型判定库,该数据类型判定库也是可维护的,用户可根据场景的需要,自行进行配置,是一个可插拔的数据类型判定库集合。
在一些实施例中,如图4所示,将fk函数与fv函数的判断相结合,F1函数处理过程和输出结果可用公式3进行表达,如下:
Dy=F1(fv(fk(D(k,v))) (3)
在一些实施例中,所述三重复合函数的去隐私方法还包括:
根据所述隐私数据对应的原始数据的字段值,确定所述字段值的数据属性;
根据所述数据属性,将所述隐私数据区分为需要加密的数据与不需要加密的数据。
隐私数据Dy经F2函数处理,由一个整体的数据集,分成不同的两个部分,分别为不需加密的数据Du和需要加密的数据Dm。F2函数为数据安全处理函数,该函数由fc和fq两个函数构成,其关系由公式4确定:
F2=fq(fc) (4)
其中,fc为数据属性识别函数,fq为加密函数。公式4所示的流程如下:
fc函数启动,对Dy中的值进行识别(识别的是value,不是key),识别的目的是将其中的数据区分为质性数据和量化数据,主要方法是判别v值是数值型数据还是字符类数据,如果是字符类数据,则将其转换为数值类数据,转换的方法和度量是可配置的,如将“优、良、中、差”转换为“1、2、3、4”,此过程往往需要用户根据自身需要进行设定,无论是正序设定或逆序设定,均要记录好设定逻辑,且一旦确定后,在连续分析过程中不随意更改逻辑,以防出现数据逻辑的混乱。
fq函数启动,该函数是加密函数,可选择的方法从加密算法包中调取即可,也是可配置的插拔方式,如采用对称加密、非对称加密、密码替代等方法,以实现对数值的加密。F2函数处理过程和输出结果可用公式5进行表达,如下:
Dm=F2(fq(fc(Dy(v))) (5)
在一些实施例中,所述根据所述需要加密的数据与不需要加密的数据,确定需要加密的运算逻辑包括:
针对所述需要加密的数据与所述不需要加密的数据,根据预定的运算逻辑判断规则,确定需要执行加密操作的运算逻辑。
在隐私保护的构成中,可能造成隐私泄露的不仅是需要加密的隐私数据的值本身,有些数据单独看来并不是需要加密的数据,但是经过运算逻辑的加工却可能确定出隐私。因此,需要将Du和Dm均作为“算料”数据进行处理。对“算料”数据进行处理时,会用到的各种数学运算规则,这些运算规则中的一部分,往往也是需要保护的隐私信息,也需要经过去隐私化,因此,本发明中引入F3函数。F3函数是针对数据运算逻辑的去隐私过程。
如图5所示,算料数据Du+Dm可以根据预先设定的运算逻辑判断规则,也可以经用户主观判断,将算料数据Du+Dm区分为不同的运算部分,不需要加密的运算逻辑Cu部分,以及需要加密的运算逻辑Cm部分,该过程可用公式6进行表达,如下:
Cm=用户主观判断(Du+Dm)(6)
与F2函数类似,F3函数代表的是一个算法包,去隐私的算法加密方法从算法加密包中调取即可,也是可配置的插拔方式,如全同态加密、乘法同态、加法同态等。F3函数处理过程和输出结果可用公式7进行表达,如下:
Lm=F3(Cm) (7)
可选地,在所述对所述需要加密的数据进行加密之前,还包括:
设置加密算法库;
采用可配置的方式调取加密算法对所述所述需要加密的数据进行加密。
可选地,采用以下加密算法中的至少一种对所述需要加密的数据进行加密:对称加密、非对称加密。
可选地,采用以下加密算法中的至少一种对所述运算逻辑进行加密:全同态加密、乘法同态、加法同态。如前文所述,在执行F2函数时,fq函数是加密函数,可选择的方法从加密算法包中调取即可,也是可配置的插拔方式,如采用对称加密、非对称加密、密码替代等方法,以实现对数值的加密。与F2函数类似,F3函数代表的是一个算法包,去隐私的算法加密方法从算法加密包中调取即可,也是可配置的插拔方式,如全同态加密、乘法同态、加法同态等。可以简历一个加密算法库,并且配置为插拔方式。在处理过程中,实现可定制的选择加密算法或算法组合,提高加密算法选用的灵活性。
第二方面,本发明实施例提供一种计算机设备,如图7所示,其包括:
一个或多个处理器501;
存储器502,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如上述第一方面任意一项的三重复合函数的去隐私方法;
一个或多个I/O接口503,连接在处理器与存储器之间,配置为实现处理器与存储器的信息交互。
其中,处理器501为具有数据处理能力的器件,其包括但不限于中央处理器(CPU)等;存储器502为具有数据存储能力的器件,其包括但不限于随机存取存储器(RAM,更具体如SDRAM、DDR等)、只读存储器(ROM)、带电可擦可编程只读存储器(EEPROM)、闪存(FLASH);I/O接口(读写接口)503连接在处理器501与存储器502间,能实现处理器501与存储器502的信息交互,其包括但不限于数据总线(Bus)等。
在一些实施例中,处理器501、存储器502和I/O接口503通过总线504相互连接,进而与计算设备的其它组件连接。
第三方面,本发明实施例提供一种计算机可读存储介质,如图8所示,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述第一方面任意一项的三重复合函数的去隐私方法。
第四方面,本发明提供了一种三重复合函数的去隐私装置,如图6所示,包括:
隐私数据识别模块601,用于识别原始数据中的隐私数据;
隐私数据安全处理模块602,用于在所述隐私数据中识别出需要加密的数据,对所述需要加密的数据进行加密;
隐私逻辑安全处理模块603,用于根据所述需要加密的数据,以及不需要加密的数据,确定需要加密的运算逻辑,并对所述需要加密的运算逻辑进行加密,得到去隐私后的数据;其中,所述运算逻辑为对所述需要加密的数据与所述不需要加密的数据进行运算的规则。
在一些实施例中,所述隐私数据识别模块601包括:
原始数据管理单元,用于将所述原始数据分解为字段名与字段值;
隐私字段识别单元,用于根据所述原始数据中的字段名,识别出隐私字段;并将包括所述隐私字段的原始数据,判定为隐私数据。
在一些实施例中,所述隐私字段识别单元包括:
敏感词库匹配子单元,用于将所述原始数据中所有的字段名与预定的敏感词库进行匹配;将匹配成功的字段名判定为所述隐私字段;将未匹配成功的字段名判定为非隐私字段。
在一些实施例中,所述隐私数据识别模块601还包括:
敏感数据类型匹配单元,用于将所述原始数据中所有的字段值与预定的敏感数据类型判定库进行匹配;将字段值匹配成功的原始数据判定为隐私数据。
在一些实施例中,所述装置还包括:
数据属性确定模块,用于根据所述隐私数据对应的原始数据的字段值,确定所述字段值的数据属性;
数据加密确定模块,根据所述数据属性,将所述隐私数据区分为需要加密的数据与不需要加密的数据。
可选地,所述装置还包括:
数据加密模块,用于设置加密算法库,采用可配置的方式调取加密算法对所述需要加密的数据进行加密。
可选地,所述装置采用以下加密算法中的至少一种对所述需要加密的数据进行加密:对称加密、非对称加密。
可选地,所述装置采用以下加密算法中的至少一种对所述运算逻辑进行加密:全同态加密、乘法同态、加法同态。
本发明提出的去隐私的方法,从隐私数据识别、隐私数据保护、隐私逻辑保护三个层面,依据“是否隐私信息”、“是否需要保护”进行有效的隐私信息识别和去隐私化处理,做到“有的放矢”,不但能够解决现有技术对何为隐私信息识别较为笼统,不能准确判断的问题,而且通过在不同场景下识别并保护隐私信息的三层复合架构,依据“是否有必要”来决定是否进行去隐私处理,降低处理量,解决相关技术进行加密处理时占用资源过多的问题。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、设备中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。
在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
以上参照附图说明了本发明的优选实施例,并非因此局限本发明的权利范围。本领域技术人员不脱离本发明的范围和实质内所作的任何修改、等同替换和改进,均应在本发明的权利范围之内。

Claims (10)

1.一种三重复合函数的去隐私方法,包括:
识别原始数据中的隐私数据;
在所述隐私数据中识别出需要加密的数据,对所述需要加密的数据进行加密;
根据所述需要加密的数据,以及不需要加密的数据,确定需要加密的运算逻辑,其中,所述运算逻辑为对所述需要加密的数据与所述不需要加密的数据进行运算的规则;
对所述需要加密的运算逻辑进行加密,得到去隐私后的数据。
2.根据权利要求1中所述的三重复合函数的去隐私方法,其中,所述识别原始数据中的隐私数据包括:
将所述原始数据分解为字段名与字段值;
根据所述原始数据中的字段名,识别出隐私字段;
将包括所述隐私字段的原始数据,判定为隐私数据。
3.根据权利要求2中所述的三重复合函数的去隐私方法,其中,所述根据所述原始数据中的字段名,识别出隐私字段包括:
将所述原始数据中所有的字段名与预定的敏感词库进行匹配;
将匹配成功的字段名判定为所述隐私字段;
将未匹配成功的字段名判定为非隐私字段。
4.根据权利要求2中所述的三重复合函数的去隐私方法,其中,所述识别原始数据中的隐私数据还包括:
将所述原始数据中所有的字段值与预定的敏感数据类型判定库进行匹配;
将字段值匹配成功的原始数据判定为隐私数据。
5.根据权利要求2中所述的三重复合函数的去隐私方法,其中,所述方法还包括:
根据所述隐私数据对应的原始数据的字段值,确定所述字段值的数据属性;
根据所述数据属性,将所述隐私数据区分为需要加密的数据与不需要加密的数据。
6.根据权利要求1至5中任意一项所述的三重复合函数的去隐私方法,其中,在所述对所述需要加密的数据进行加密之前,还包括:
设置加密算法库;
采用可配置的方式调取加密算法对所述需要加密的数据进行加密。
7.根据权利要求1至5中任意一项所述的三重复合函数的去隐私方法,其中,采用以下加密算法中的至少一种对所述需要加密的数据进行加密:对称加密、非对称加密。
8.根据权利要求1至5中任意一项所述的三重复合函数的去隐私方法,其中,采用以下加密算法中的至少一种对所述运算逻辑进行加密:全同态加密、乘法同态、加法同态。
9.一种计算机设备,包括:
一个或多个处理器;
存储器,其上存储有一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现根据权利要求1至8中任意一项所述的三重复合函数的去隐私方法;
一个或多个I/O接口,连接在所述处理器与存储器之间,配置为实现所述处理器与存储器的信息交互。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现根据权利要求1至8中任意一项所述的三重复合函数的去隐私方法。
CN202210601029.XA 2022-05-30 2022-05-30 三重复合函数的去隐私方法、装置、计算机设备及介质 Pending CN115021908A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210601029.XA CN115021908A (zh) 2022-05-30 2022-05-30 三重复合函数的去隐私方法、装置、计算机设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210601029.XA CN115021908A (zh) 2022-05-30 2022-05-30 三重复合函数的去隐私方法、装置、计算机设备及介质

Publications (1)

Publication Number Publication Date
CN115021908A true CN115021908A (zh) 2022-09-06

Family

ID=83070797

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210601029.XA Pending CN115021908A (zh) 2022-05-30 2022-05-30 三重复合函数的去隐私方法、装置、计算机设备及介质

Country Status (1)

Country Link
CN (1) CN115021908A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117313158A (zh) * 2023-10-23 2023-12-29 国网青海省电力公司信息通信公司 数据处理方法和装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117313158A (zh) * 2023-10-23 2023-12-29 国网青海省电力公司信息通信公司 数据处理方法和装置

Similar Documents

Publication Publication Date Title
CN108681966B (zh) 一种基于区块链的信息监管方法及装置
US8296564B2 (en) Communication channel access based on channel identifier and use policy
CN110457945B (zh) 名单查询的方法、查询方设备、服务方设备及存储介质
CN108681676B (zh) 数据管理方法和装置、系统、电子设备、程序和存储介质
US20120096257A1 (en) Apparatus and Method for Protecting Storage Data of a Computing Apparatus in an Enterprise Network System
WO2020164211A1 (zh) 一种数据传输方法、装置、终端设备及介质
CN107612683A (zh) 一种加解密方法、装置、系统、设备和存储介质
CN111914279B (zh) 一种高效准确的隐私求交系统、方法及装置
EP4092984A1 (en) Data processing method and apparatus, device and medium
CN115021908A (zh) 三重复合函数的去隐私方法、装置、计算机设备及介质
CN117390657A (zh) 数据加密方法、装置、计算机设备和存储介质
CN113343309B (zh) 自然人数据库隐私安全保护方法、装置和终端设备
CN113055153B (zh) 一种基于全同态加密算法的数据加密方法、系统和介质
CN113285945B (zh) 通信安全监控方法、装置、设备及存储介质
CA3054213A1 (en) Information management method and device
CN109299611A (zh) 文件加密方法、装置、设备/终端/服务器及计算机可读存储介质
US20210034778A1 (en) Anonymous ranking service
Tun et al. Verifiable limited disclosure: reporting and handling digital evidence in police investigations
CN110059081A (zh) 基于数据展示的数据输出方法、装置及计算机设备
CN115834566A (zh) 一种文件传输系统和文件传输方法
JP2022102062A (ja) データプライバシー管理のための方法、装置及びシステム
CN104023019A (zh) 一种基于用户使用特征而自动选择安全通道的方法和系统
US20230161907A1 (en) Method and system for unifying de-identified data from mulitple sources
TWI539323B (zh) Personal data inventory system and method
CN117499159B (zh) 一种基于区块链的数据交易方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination