CN114925390A - 敏感信息的流转脱敏方法、装置、电子设备和存储介质 - Google Patents
敏感信息的流转脱敏方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN114925390A CN114925390A CN202210476480.3A CN202210476480A CN114925390A CN 114925390 A CN114925390 A CN 114925390A CN 202210476480 A CN202210476480 A CN 202210476480A CN 114925390 A CN114925390 A CN 114925390A
- Authority
- CN
- China
- Prior art keywords
- desensitization
- information
- algorithm
- determining
- control set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 173
- 238000003860 storage Methods 0.000 title claims abstract description 71
- 238000000586 desensitisation Methods 0.000 claims abstract description 1644
- 230000000694 effects Effects 0.000 claims abstract description 74
- 230000005540 biological transmission Effects 0.000 claims abstract description 22
- 238000011156 evaluation Methods 0.000 claims description 311
- 230000006870 function Effects 0.000 claims description 71
- 230000008859 change Effects 0.000 claims description 38
- 238000007405 data analysis Methods 0.000 claims description 27
- 238000004590 computer program Methods 0.000 claims description 16
- 230000004044 response Effects 0.000 claims description 5
- 230000004424 eye movement Effects 0.000 claims description 2
- 230000008569 process Effects 0.000 description 78
- 238000005516 engineering process Methods 0.000 description 10
- 230000035945 sensitivity Effects 0.000 description 10
- 230000003595 spectral effect Effects 0.000 description 9
- 238000012546 transfer Methods 0.000 description 9
- 238000003825 pressing Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 210000001508 eye Anatomy 0.000 description 6
- 238000005065 mining Methods 0.000 description 6
- 238000010801 machine learning Methods 0.000 description 5
- 238000013507 mapping Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000007480 spreading Effects 0.000 description 5
- 238000003892 spreading Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000012937 correction Methods 0.000 description 4
- 230000005611 electricity Effects 0.000 description 4
- 230000000644 propagated effect Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 238000013503 de-identification Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000009432 framing Methods 0.000 description 2
- 230000002496 gastric effect Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000000873 masking effect Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 210000001525 retina Anatomy 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 101150053844 APP1 gene Proteins 0.000 description 1
- 101100055496 Arabidopsis thaliana APP2 gene Proteins 0.000 description 1
- 101100264195 Caenorhabditis elegans app-1 gene Proteins 0.000 description 1
- 101100189105 Homo sapiens PABPC4 gene Proteins 0.000 description 1
- 102100039424 Polyadenylate-binding protein 4 Human genes 0.000 description 1
- 101100016250 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) GYL1 gene Proteins 0.000 description 1
- 102100038359 Xaa-Pro aminopeptidase 3 Human genes 0.000 description 1
- 101710081949 Xaa-Pro aminopeptidase 3 Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 210000005252 bulbus oculi Anatomy 0.000 description 1
- 238000009960 carding Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000007373 indentation Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
- G06F21/6263—Protecting personal data, e.g. for financial or medical purposes during internet communication, e.g. revealing personal data from cookies
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种敏感信息的流转脱敏方法、装置、电子设备和存储介质,其中方法包括:基于所述第一脱敏控制集合,确定脱敏算法集合,基于所述脱敏算法集合,对所述第一信息进行脱敏,得到第三信息;基于所述第一脱敏控制集合,或,基于所述第一脱敏控制集合,以及所述第一信息、所述第三信息和所述脱敏算法集合中的至少一种,生成第二脱敏控制集合。本发明提供的方法、装置、电子设备和存储介质,指导信息传输全生命周期中各个主体的信息脱敏,有效实现单次/多次转发的脱敏控制,避免因短板效应导致的隐私数据泄露,实现多次转发时的全流程迭代脱敏控制,可以适应信息所属主体和每一个信息接收主体脱敏保护能力差异化的跨系统、生态圈分享等场景。
Description
技术领域
本发明涉及信息技术、计算机技术、网络技术、互联网技术领域,尤其涉及一种敏感信息的流转脱敏方法、装置、电子设备和存储介质。
背景技术
大规模互联互通成为未来网络发展趋势。信息在系统内部、不同系统之间、不同生态圈之间广泛流动。为了保护流动传输的信息中的隐私内容,各种脱敏算法,例如匿名技术、差分隐私技术等应运而生。
目前的信息脱敏多局限于局部环节,仅关注脱敏算法本身,信息所属主体一旦向外分享信息,即无法再对已经分享的信息进行脱敏控制。而在泛在网络环境下,跨生态圈的信息传播全生命周期中,信息在采集、分享、交换等过程中,在不同阶段面向的脱敏需求可能发生变化,仅在信息所属主体处进行脱敏的方式显然缺乏对于信息传播全生命周期内的合理控制和迭代脱敏,存在隐私泄露风险。
发明内容
本发明提供一种敏感信息的流转脱敏方法、装置、电子设备和存储介质,用以解决现有技术中仅在信息传播之前进行脱敏,缺乏对于信息传播全生命周期的合理控制和迭代脱敏的缺陷。
本发明提供一种敏感信息的流转脱敏方法,包括:
获取第一信息,获取第一脱敏控制集合,所述第一脱敏控制集合基于脱敏意图确定;
基于所述第一脱敏控制集合,确定脱敏算法集合,基于所述脱敏算法集合,对所述第一信息进行脱敏,得到第三信息;
基于所述第一脱敏控制集合,或,基于所述第一脱敏控制集合,以及所述第一信息、所述第三信息和所述脱敏算法集合中的至少一种,确定第二脱敏控制集合。
本发明还提供一种敏感信息的流转脱敏装置,包括:
获取单元,用于获取第一信息,获取第一脱敏控制集合,所述第一脱敏控制集合基于脱敏意图确定;
脱敏单元,用于基于所述第一脱敏控制集合,确定脱敏算法集合,基于所述脱敏算法集合,对所述第一信息进行脱敏,得到第三信息;
更新单元,用于基于所述第一脱敏控制集合,或,基于所述第一脱敏控制集合,以及所述第一信息、所述第三信息、所述脱敏算法集合中的至少一种,确定第二脱敏控制集合。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述敏感信息的流转脱敏方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述敏感信息的流转脱敏方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述敏感信息的流转脱敏方法。
本发明提供的敏感信息的流转脱敏方法、装置、电子设备和存储介质,通过能够表征脱敏意图的第一脱敏控制集合,对第一信息进行脱敏,并基于第一脱敏控制集合,更新得到第二脱敏控制集合,脱敏控制集合在信息传输过程中不断更新,从而指导信息传输全生命周期中各个主体的信息脱敏,有效实现单次/多次转发的脱敏控制,避免因短板效应导致的隐私数据泄露,实现多次转发时的全流程迭代脱敏控制,可以适应信息所属主体和每一个信息接收主体脱敏保护能力差异化的跨系统、生态圈分享等场景。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的敏感信息的流转脱敏方法的流程示意图之一;
图2是本发明提供的信息传播示例之一;
图3是本发明提供的信息传播示例之二;
图4是本发明提供的信息传播示例之三;
图5是本发明提供的敏感信息的流转脱敏方法的流程示意图之二;
图6是本发明提供的敏感信息的流转脱敏方法的流程示意图之三;
图7是本发明提供的敏感信息的流转脱敏装置的结构示意图;
图8是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前的信息脱敏多局限于局部环节,仅关注脱敏算法本身,而不关注脱敏过程中的控制问题,更未关注信息首次和迭代分享时脱敏意图的不断变化;全生命周期隐私保护机制不够完善,即使使用了一些脱敏算法,但受限于现有脱敏算法大都为“一锤定音”和“各扫门前雪”的模式,一旦脱敏完成,便无法从信息全生命周期的角度将信息的隐私保护贯穿始终;信息所属主体一旦向外分享了信息之后,就不能再控制信息进行脱敏,缺乏一种泛在互联环境下、跨生态圈信息共享传播的多次脱敏控制机制,缺乏一种既尊重用户脱敏意图、又抗隐私挖掘的普适性脱敏控制方案。
对此,本发明实施例提供一种敏感信息的流转脱敏方法,该方法可应用到信息传播全生命周期中的每个主体。包括信息采集和发送的主体,以及后续接收信息的主体。图1是本发明提供的敏感信息的流转脱敏方法的流程示意图之一,如图1所示,该方法包括:
步骤110,获取第一信息,获取第一脱敏控制集合,所述第一脱敏控制集合基于脱敏意图确定。
此处,第一信息即当前主体采集或者接收到的信息,第一信息是携带有敏感信息,需要进行脱敏处理的信息。
脱敏意图即用户针对第一信息获取的脱敏需求,脱敏意图可以涵盖信息采集、信息获取、信息处理、保护内容、脱敏递减方式、使用权限、脱敏测评等信息传播全生命周期中的各个方面中的一种或者多种。
基于脱敏意图,即可确定第一脱敏控制集合,此处第一脱敏控制集合可以反映在用户获取的脱敏意图下,针对第一信息进行脱敏的相关信息,具体可用于但不限于描述由第一信息携带的对第一信息的描述和传播、脱敏控制,其中,携带方式包括但不限于:写入信息拓展域、为信息打上标签、写入信息特定位置字段中。
第一脱敏控制集合可以包括第一信息中需要进行脱敏的内容、具体对应的脱敏要求、可能应用的脱敏算法,也可以包括获取到第一信息的过程中的相关信息,以及第一信息在传输到当前主体之前经过的脱敏流程和相关信息,例如第一信息在历史上的脱敏评测结果,第一信息在历史上进行脱敏所使用的算法,第一信息在历史上进行脱敏前后的变化情况的记录,第一信息在历史上脱敏之前的原始信息等,本发明实施例对此不作具体限定。
此处,第一脱敏控制集合由当前主体获取得到,需要说明的是,此处所指的获取,可以包括接收、生成、创建,在已有信息的基础上提取,以及在已有规则的基础上设置中的至少一种。以第一脱敏控制集合的获取为例,第一脱敏控制集合的获取可以接收其他主体发送的脱敏控制集合,也可以是将预先设定好的脱敏控制集合导入当前主体,还可以是根据用户在预先设定好的脱敏意图的基础上进行的设置,生成脱敏控制集合,本发明实施例对此不作具体限定。此外,在通过接收其他主体发送的脱敏控制集合进而得到第一脱敏控制集合的情况下,第一脱敏控制集合具体可以是向当前主体发送第一信息的发送端生成之后同第一信息一并发送到当前主体,或者与第一信息分别发送到当前主体,本发明实施例对此不作具体限定。
需要说明的是,当前主体针对第一信息的脱敏操作,是第一信息的首次脱敏的情况下,第一脱敏控制集合可以是当前主体通过生成、创建,在已有信息的基础上提取,以及在已有规则的基础上设置中的至少一种方式得到的;而当前主体针对第一信息的脱敏操作,是第一信息的迭代脱敏(非首次脱敏)的情况下,第一脱敏控制集合可以是当前主体接收到上次对第一信息进行脱敏的主体发送的脱敏控制集合,或者,根据当前的应用场景,第一脱敏控制集合还可以是当前主体接收到上次对第一信息进行脱敏的主体发送的脱敏控制集合的子集,或者,根据当前的应用场景,第一脱敏控制集合还可以是当前主体接收到上次对第一信息进行脱敏的主体发送的脱敏控制集合的基础上添加新的控制要求。本发明实施例对此不作具体限定。
步骤120,基于所述第一脱敏控制集合,确定脱敏算法集合,基于所述脱敏算法集合,对所述第一信息进行脱敏,得到第三信息。
具体地,在得到第一脱敏控制集合之后,即可基于第一脱敏控制集合中包含的信息,定位第一信息中需要进行脱敏的信息,并据此确定进行脱敏需要应用的脱敏算法,从而构建脱敏算法集合。此处的脱敏算法集合中,可以包括一个或者多个脱敏算法,其中的每个脱敏算法分别对应第一信息中不同位置需要进行脱敏的信息,或者多个脱敏算法对应第一信息中一个或多个位置需要进行脱敏的信息,本发明实施例对此不作具体限定。
在确定脱敏算法集合之后,即可基于脱敏算法集合,对第一信息中需要进行脱敏的信息进行脱敏,从而得到完成脱敏之后的第一信息,此处记为第三信息。
步骤130,基于所述第一脱敏控制集合,或,基于所述第一脱敏控制集合,以及所述第一信息、所述第三信息和所述脱敏算法集合中的至少一种,确定第二脱敏控制集合。
具体地,在完成针对第一信息的脱敏,得到第三信息之后,即可结合第一脱敏控制集合,确定与第三信息相对应的第二脱敏控制集合。
进一步地,第二脱敏控制集合的确定,可以仅依赖于第一脱敏控制集合实现,也可以在参考了第一脱敏控制集合的同时,也参考第一信息、第三信息、脱敏算法集合中的至少一种实现。
第二脱敏控制集合记录从第一信息脱敏得到第三信息的过程中发生的信息变更;脱敏算法集合的应用,使得第二脱敏控制集合得以记录历史上进行脱敏所应用的算法从而为后续传输主体进行脱敏时应用的算法提供参考;第一脱敏控制集合的应用,使得第二脱敏控制集合可以集成之前进行脱敏的历史信息,使得脱敏意图以及相关信息得以在各个主体的脱敏过程中得以保留并传播。
在得到第二脱敏控制集合之后,可以将第二脱敏控制集合保存在本地,也可以将第二脱敏控制集合随第三信息一并由当前主体发送到下一主体,或者,在第二脱敏控制集合本身即涵盖了第三信息的前提下,也可以仅将第二脱敏控制集合由当前主体发送到下一主体,从而实现信息传输,并在此过程中,脱敏意图以及历史脱敏信息均得以传播。相应地,接收到第二脱敏控制集合的主体,或接收到第二脱敏控制集合和第三信息的主体,可以将第三信息视为第一信息,将第二脱敏控制集合视为第一脱敏控制集合,据此执行敏感信息的流转脱敏方法。
本发明实施例提供的方法,通过能够表征脱敏意图的第一脱敏控制集合,对第一信息进行脱敏,并基于第一脱敏控制集合,更新得到第二脱敏控制集合,脱敏控制集合在信息传输过程中不断更新,从而指导信息传输全生命周期中各个主体的信息脱敏,有效实现单次/多次转发的脱敏控制,避免因短板效应导致的隐私数据泄露,实现多次转发时的全流程迭代脱敏控制,可以适应信息所属主体和每一个信息接收主体脱敏保护能力差异化的跨系统、生态圈分享等场景。
基于上述实施例,步骤110中,获取第一脱敏控制集合,包括:
接收用户输入;
响应于所述用户输入,确定所述用户输入对应的脱敏意图;
基于所述脱敏意图对应的脱敏要求,确定所述第一脱敏控制集合。
具体地,第一脱敏控制集合可以是接收自第一信息的发送端,也可以是当前主体自行通过生成、创建,在已有信息的基础上提取,以及在已有规则的基础上设置中的至少一种方式确定得到的。
针对当前主体自行确定第一脱敏控制集合的情况,第一脱敏控制集合需要基于脱敏意图确定,进一步地:
用户可以通过与当前主体的交互,实现脱敏意图的输入,即用户可以通过按钮、圈出、勾选、标记、按键、滑轮、菜单、语音、视频、眼神、手势、文字、生物电信号、虚拟环境等形式中的一种或者多种方式,进行针对脱敏意图的输入。此处,用户输入可以反映为基于物理开关的输入,例如上下拨动键、左右拨动键,也可以反映为脱离物理开关的输入,例如屏幕手势(左到右、右到左、上到下、下到上等)、弹出界面填写(例如表单录入)、文件(例如XML、JSON格式)导入、语音录入等等。
例如,用户可以通过手机终端、PC客户端以及信息收集者系统等获取脱敏意图。进一步地,可以通过配置文件输入、语音输入、弹框/菜单选择、手机上通过手势上下左右滑动触摸屏将开关按钮/级别按钮移动到相应位置、在屏幕上显示虚拟键盘输入、硬件开关等方式的用户输入,获取脱敏意图。
由此,在当前主体可以检测接收到用户输入。当前主体响应于接收到的用户输入,即可确定用户输入对应的脱敏意图。此处,用户输入与脱敏意图之间的对应关系,可以是系统预先获取好的,也可以是系统自适应确定的,在当前主体接收到用户输入之后,即可基于用户输入确定到其对应的脱敏意图,至此,脱敏意图的获取完成。
需要说明的是,用户输入的动作,即脱敏意图获取的时机可以包括下述内容的一种或多种的任意组合:在信息采集之前进行预获取、在采集进行开始前针对本次采集获取、在信息采集之后获取、在向外发送/对外交换之前获取、在向外发送/对外交换之后获取。
需要说明的是,此处所指的获取,可以包括接收、生成、创建,在已有信息的基础上提取,以及在已有规则的基础上设置中的至少一种。
此外,在不同的传输阶段,针对不同的主体,用户输入的脱敏意图可以是不同的,例如用户针对信息生成后的首次脱敏,以及信息传输流程中的迭代脱敏,其脱敏意图可以是不同的,例如首次脱敏通常关注去标识化,例如:去掉身份证号、姓名、电话号码等;迭代脱敏主要针对信息内容,例如:银行流水单上的物品名称、金额等。
脱敏意图包括但不限于:脱敏意图标识、获取与调整脱敏意图方式、脱敏意图获取时间、脱敏意图获取地点、脱敏意图获取主体、脱敏黑名单、需脱敏保护的信息内容、本次脱敏约束条件、使用约束条件、脱敏传递约束条件、传播约束、测评约束条件、脱敏级别。
在确定脱敏意图之后,当前主体即可基于脱敏意图,确定与之对应的脱敏要求,进而基于脱敏要求,确定第一脱敏控制集合。此处,用户获取的脱敏意图,在面向不同的场景,针对传输信息中不同的信息类型时,呈现的脱敏要求也可以是不同的。例如针对不同类型的信息,身份证、电话号码、银行账号等信息是否应该部分遮盖,照片是否应该模糊、位置信息是否应该混淆等;而在基于脱敏意图确定对应的脱敏要求时,可以针对不同的信息设定相应的脱敏选项,可以是开关选项,也可以是级别选项;也可将脱敏级别设定为高、中、低、不脱敏等级别,由系统自适应和/或预定义的根据级别设定信息内容的脱敏方式,以便于用户可能通过快速便捷的操作方式,实现丰富的脱敏意图获取。
为了便于当前主体理解脱敏意图以确定脱敏要求,脱敏意图可以表示为XML描述语言、正则表达式或者其他适合的描述语言。
例如,脱敏意图中,脱敏级别分为高、中、低、不脱敏4个级别,用户在对某个设备或者app进行初始化时(即,尚未采集用户的任何信息前),由用户来选择自己的脱敏级别,在后续使用设备或者app的过程中,涉及到采集用户隐私信息时,由系统或者app自适应和/或预定义的根据级别设定信息内容的脱敏方式。
本发明实施例提供的方法,通过将脱敏意图与其他多种集合,确定脱敏要求和/或第一脱敏控制集合,与信息绑定进行同步传播,实现信息在采集、交换的过程中,有效传达所有信息接触者的脱敏意图和/或脱敏要求。
基于上述任一实施例,步骤110中,所述基于所述脱敏意图对应的脱敏要求,确定所述第一脱敏控制集合,包括:
步骤111,基于所述第一信息、所述脱敏意图和预建脱敏知识图谱库中的至少一种,确定所述脱敏要求;
考虑到目前的各种法律/法规/标准/制度均是以条文的形式存在,以大篇幅的文本进行描述,为了便于梳理统计,本发明实施例中通过实体识别、关键词提取等方式,从文本中提取与脱敏规则相关的内容,形成一个或者一组规则,由此来构建预建脱敏知识图谱库。
此处,预建脱敏知识图谱库即预先构建的脱敏领域的知识图谱,预建脱敏知识图谱库中包括了从法律/法规/标准/制度等层面对于特定信息脱敏的要求和指导,预建脱敏知识图谱库包括但不限于:脱敏意图、脱敏标准、脱敏算法、信息分量、信息分量特征、脱敏级别、脱敏信息分量、脱敏规则,例如预建脱敏知识图谱库可以指示标准中要求去标识化的信息、制度中要求给身份证信息脱敏的信息等。其中,信息分量包括但不限于:唯一个人标识符、信息类型、信息创建时间、信息获取时间、操作记录;脱敏规则包括但不限于:脱敏递减规则、使用权限规则、脱敏测评规则。
针对于脱敏要求的确定,可以直接基于第一信息,确定脱敏要求,例如第一信息的类型为图像,则脱敏要求是掩盖图像中的人脸,第一信息的类型为文本,则脱敏要求是消除文本中的人名;也可以直接根据脱敏意图的指示,确定脱敏意图所对应的脱敏要求,以构建脱敏要求;也可以根据预建脱敏知识图谱库中包括的各种规则,选取应用当前场景的规则所指示的脱敏要求,以构建脱敏要求;还可以结合脱敏意图和预建脱敏知识图谱库,一方面从用户获取的意图确定脱敏要求入手,另一方面从当前场景在预建脱敏知识图谱库中指示的脱敏要求入手,结合两方面构建脱敏要求。
可选地,在基于脱敏意图和/或预建脱敏知识图谱库确定脱敏要求的情况下,还可以将此两者与第一信息相结合,以确定脱敏要求,即基于第一信息,以及脱敏意图和/或预建脱敏知识图谱库,确定脱敏要求;
此外,在当前主体接收用户输入的同时,也接收到脱敏控制集合的情况下,还可以将接收到的脱敏控制集合,与脱敏意图、预建脱敏知识图谱库和第一信息中的至少一种结合起来以确定脱敏要求。
作为优选,为了保证脱敏要求易于计算机程序处理,脱敏要求可以通过XML描述语言、正则表达式或者其他适合的描述语言予以描述。
步骤112,基于所述脱敏意图、所述预建脱敏知识图谱库、所述脱敏要求以及接收到的脱敏控制集合中的至少一种,对所述第一信息进行敏感信息识别,得到所述第一信息的敏感信息识别结果;
步骤113,基于所述脱敏要求和所述敏感信息识别结果,或,基于所述第一信息、所述脱敏要求和所述敏感信息识别结果,确定所述第一脱敏控制集合。
具体地,可以根据脱敏意图、预建脱敏知识图谱库、脱敏要求以及接收到的脱敏控制集合中的一个或多个任意组合,确定敏感信息识别函数,进而调用敏感信息识别函数对第一信息进行敏感信息识别,从而定位到第一信息中包含的敏感信息,据此确定敏感信息识别结果。所述敏感信息识别结果包括但不限于:敏感信息、敏感度级别、敏感要素分类、敏感要素分级、属性特征、属性关联、场景特征。其中,所述敏感度级别包括但不限于:绝对敏感、非常敏感、敏感、普通,敏感度级别的表示方法也可以使用数字量化表示,本发明实施例对此不作具体限定。需要说明的是,在进行敏感信息识别时,可以基于脱敏意图中的脱敏级别,从第一信息中各敏感度级别的信息中,选取与脱敏级别相对应的敏感度级别的信息,并据此确定敏感信息识别结果,也就是说,敏感信息识别结果中包含敏感信息的敏感度级别与脱敏意图中的脱敏级别相对应。
可选地,在仅得到用户输入,并未接收到脱敏控制集合的情况下,可以基于脱敏意图、预建脱敏知识图谱库、脱敏要求中的一个或者多个任意组合,确定敏感信息识别函数,进而实现敏感信息识别定位。
在此基础上,即可结合步骤111和步骤112分别得到的脱敏要求和敏感信息识别结果,确定第一脱敏控制集合。
可选地,在确定第一脱敏控制集合的过程中,还可以结合第一信息,即应用第一信息,以及脱敏要求,以生成或者更新第一脱敏控制集合。由此得到的第一脱敏控制集合至少包括脱敏要求,在此基础上,进一步地,第一脱敏控制集合还可以包括第一信息在历史上的脱敏测评结果、脱敏算法集合、信息变化记录集合、原始信息和敏感信息识别结果。
基于上述任一实施例,脱敏意图包括脱敏意图标识、获取与调整脱敏意图方式、脱敏意图获取时间、脱敏意图获取地点、脱敏意图获取主体、脱敏黑名单、需脱敏保护的信息内容、本次脱敏约束条件、使用约束条件、脱敏传递约束条件、传播约束、测评约束条件、脱敏级别中的至少一种。
脱敏要求包括脱敏要求标识、脱敏意图获取时间、脱敏意图获取地点、脱敏意图获取主体、脱敏黑名单、需脱敏保护的信息内容、本次脱敏约束条件、使用约束条件、脱敏传递约束条件、传播约束、测评约束条件、脱敏级别中的至少一种。
脱敏意图中,所述获取与调整脱敏意图方式包括但不限于以下一种或多种的任意组合:按钮、圈出、勾选、标记、按键、开关、滑轮、菜单、语音、音频、视频、眼神、手势、文字、生物电信号、虚拟环境;需要说明的是,随着科技发展,获取与调整脱敏意图方式还可能会出现新的方式,本发明实施例对此不作具体限定;
例如,实体/虚拟按钮可用于但不限于按动按钮后获取脱敏意图;虚拟/实体按键可用于但不限于通过按压力度、按压次数、按压频率、按压位置等一种或多种方式获取脱敏意图;虚拟/实体滑轮可用于但不限于通过滑动速率快慢、滑动到特定位置、按一定规律滑动等一种或多种方式获取脱敏意图;菜单可用于但不限于通过选出、标记、填写、点击等一种或多种方式获取脱敏意图;音频/视频可用于但不限于通过音频或视频等一种或多种方式利用音频/视频识别技术等方式获取脱敏意图;眼神可用于但不限于通过目光追随、虹膜识别、眼球转动等一种或多种方式获取脱敏意图;手势可用于但不限于通过向左、向右、向前、向后、向上、向下、向某角度等一种或多种方式获取脱敏意图;生物电信号可用于但不限于通过采集心电、脑电、肌电、胃电、视网膜电等一种或多种电信号获取脱敏意图;虚拟环境可用于但不限于通过增强现实技术(AR)、虚拟现实技术(VR)、混合现实技术(MR)、扩展现实技术(XR)等一种或多种方式获取脱敏意图;
脱敏意图和/或脱敏要求中,所述脱敏意图获取时间用于标记脱敏意图的获取或者修改时间;是以下一个或多个的任意组合:年月日、时分秒、周内/周末;
脱敏意图和/或脱敏要求中,所述脱敏意图获取地点用于标记脱敏意图的获取或者修改地点,包括但不限于:网络地址、物理地址;其中,所述物理地址包括但不限于:绝对位置、相对位置;
例如,网络地址对于文本而言就是首次存储和/或发布至网络中的MAC地址、IP地址和/或所在生态圈/系统,物理地址对于照片而言就是拍摄地点的经纬度和/或PoI表示的位置,如:某某餐厅;
其中,所述绝对位置包括但不限于:精确定位的经纬度、邮政编码、区号、邮编地址(包含但不限于省、市、区、街道、路、门牌号等信息);相对地址可以是地点所处场所的类型,例如餐厅类、酒店类、医疗机构类等。脱敏意图和/或脱敏要求中,所述脱敏意图获取主体是指用于标记脱敏意图的获取或者修改的执行主体。
脱敏意图和/或脱敏要求中,所述脱敏黑名单包括但不限于以下一种或多种的任意组合:脱敏黑名单标识、主体黑名单、信息分量黑名单、脱敏黑名单的用途说明;
例如,主体黑名单可用于但不限于描述:不论脱敏意图和/或脱敏要求中是否涉及,当信息接收主体在主体黑名单中时,无论信息是否脱敏都不能发给主体黑名单;信息分量黑名单可用于但不限于描述:不论信息接收主体是谁,不论脱敏意图和/或脱敏要求中是否涉及一些意图或者要求,当信息分量在信息分量黑名单之内时,无论信息分量是否脱敏都不能发给信息分量黑名单中信息接收主体;脱敏黑名单的用途说明可用于但不限于描述:从此以后不能用、若干次之后不能用、不能给别人转发。
脱敏意图和/或脱敏要求中,所述需脱敏保护的信息内容,可以是整个文档,或者对象,或者文档的某个片段,所述需脱敏保护的信息内容通常是一个集合。如果集合为空时,脱敏意图对所有信息适用;当集合不为空时,脱敏意图只对集合中的信息适用,包括但不限于以下一种或多种的任意组合:文本脱敏保护项、音频脱敏保护项、视频脱敏保护项、图像脱敏保护项、位置/轨迹脱敏保护项、网页脱敏保护项;
其中,所述文本脱敏保护项包括但不限于PDF、OFD、Word、TXT等类型的文本,具体可以是对象内容、版式、版面、字体、字号、注释、签名等,也可以是元数据、式样、书签、超链接、对象、页、节、段落、句子等;
其中,所述音频脱敏保护项包括但不限于:音频内容、数据格式、时长、采样频率、采样位数、通道数、比特率、波特率、带宽、信噪比、分贝比;
其中,所述视频脱敏保护项包括但不限于:视频内容、数据格式、时长、帧宽度、帧高度、数据速率、总比特率、帧速率、分辨率、码率、关键帧;
其中,所述图像脱敏保护项包括但不限于:图像内容、分辨率、大小、位深、色调、饱和度、亮度、色彩通道、图像层次;
其中,所述位置/轨迹脱敏保护项包括但不限于:经度、纬度、高度、时间;
其中,所述网页脱敏保护项是下述内容一种或多种的任意组合:背景、文字、链接、跟踪图像/视频、编码方式;
其中,所述背景包括但不限于:颜色、亮度、背景图像;
其中,所述文字包括但不限于:文字内容、字体、颜色、对齐方式、大小、相对分布位置、缩进;
其中,所述链接包括但不限于:颜色、路径;
其中,其中所述路径包括但不限于:绝对路径、根目录相对路径、文档目录相对路径;
其中,所述跟踪图像/视频包括但不限于:跟踪图像/视频内容、高、宽、源文件地址、名称;
其中,所述编码方式包括但不限于:ASCII、UTF-8、UTF-8-BOM、UCS-2Big Endian、UCS-2Little Endian、GB2312、Big5。
脱敏意图和/或脱敏要求中,所述本次脱敏约束条件包括但不限于以下一种或多种的任意组合:本次脱敏约束条件标识、脱敏粒度、脱敏等级、先脱敏后保存、先脱敏后使用、使用一次后就脱敏、按传递过来的脱敏控制脱敏、脱敏算法及其参数;
脱敏意图和/或脱敏要求中,所述使用约束条件包括但不限于以下一种或多种的任意组合:使用约束条件标识、先脱敏后保存、先脱敏后使用、本地使用不脱敏、传递或发布需脱敏、本地受限使用、本地共享使用;
脱敏意图和/或脱敏要求中,所述脱敏传递约束条件包括但不限于以下一种或多种的任意组合:脱敏传递约束条件标识、不再脱敏传递、按延伸控制更新脱敏控制要求、自主更新脱敏控制要求、根据接收方保护能力更新脱敏控制要求;
脱敏意图和/或脱敏要求中,
所述传播约束包括不限于:传播途经约束、传播方式约束、传播跳数约束;
其中,所述传播途经约束包括但不限于:信息传播类型、信息传播App/系统、信息传播生态圈;所述信息传播类型包括但不限于:公告、群消息、一对一消息、阅后即焚消息;所述传播方式约束包括但不限于:个人设备间传播、横向传播、级联传播;
此处,所述个人设备包括不限于:手机、个人电脑PC、平板、穿戴设备类、车机、智慧屏和音频设备类;所述穿戴设备类包括不限于:眼镜、手表、手环;所述音频设备类包括不限于:音箱、耳机。
例如,图2是本发明提供的信息传播示例之一,如图2所示,在信息传播过程中,可能发生个人设备间传播,即可以利用个人名下的手机、平板、电脑等多种平台查看并操作信息,其中A表示某生态圈/关联企业内部,u表示此时掌握信息的用户,Di(1≤i≤n)表示该用户的不同设备。
在信息传播过程中,还可能发生横向传播,即个人将信息发送到群组中、在同一部门/集团/生态圈内部传输;例如,①在某生态圈内部进行传递,比如从app1接收到了信息,又用app2发出,发送到app3,总之是在该生态圈的不同APP之间传递;②个人发送信息到某个群组,如图3所示,其中,A表示某生态圈/关联企业内部,ui(1≤i≤n)表示该生态圈/关联企业内部不同的app;或者,A表示团队内部,ui(1≤i≤n)表示该团队内不同的个人。
另外在信息传播过程中,还可能发生级联传播,级联传播包括但不限于:信息主体之间依次传播、不同群组之间依次传播、不同部门/集团/生态圈之间依次传播;其中,所述传播跳数约束集合包括不限于:传播信息主体总数、信息传播链总层数;例如,①从不同生态圈间/关联企业间进行传递,如从生态圈1的app1传播到了生态圈2的app2,再传播到生态圈3的app3;②信息由用户1发送给用户2,用户2又发送给用户3,依次传递;③信息从群组1传递到群组2,从群组2又传到群组3,如图4所示,A、B、X可以表示为不同的app,也可以表示为不同用户,还可以表示为不同的群组。
脱敏意图和/或脱敏要求中,所述测评约束条件包括但不限于以下一种或多种的任意组合:测评约束条件标识、合规评估内容、合规评估粒度、合规评估频次、脱敏效果测评内容、脱敏效果测评粒度、脱敏效果测评频次。
基于上述任一实施例,步骤110中,响应于所述用户输入,确定所述用户输入对应的脱敏意图,具体可以通过如下方式实现:
基于各种形式中的至少一种进行用户输入,此处所指的各种形式可以包括:实体/虚拟按钮、虚拟/实体按键、虚拟/实体滑轮、菜单、音频/视频、眼神、手势、生物电信号、虚拟环境。
其中,作为用户输入的形式,可用于但不限于获取想要进行脱敏的信息分量、对后续信息接收主体的脱敏约束和效果约束的脱敏意图。并且,可以在用户通过上述形式进行输入之后,即确定脱敏意图。
进一步地,在用户通过虚拟/实体按键进行输入时,可以通过按压力度、按压次数、按压频率、按压位置等一种或多种方式确定脱敏意图;在用户通过虚拟/实体滑轮进行输入时,可以通过滑动速率快慢、滑动到特定位置、按一定规律滑动等一种或多种方式确定脱敏意图;在用户通过菜单进行输入时,可以通过选出、标记、填写、点击等一种或多种方式确定脱敏意图;在用户通过音频/视频进行输入时,可以通过音频/视频识别方式确定脱敏意图;在用户通过眼神进行输入时,可以通过目标追随确定脱敏意图;在用户通过手势进行输入时,可以通过识别手势的向左、向右、向前、向后、向上、向下、向某角度等一种或多种方式确定脱敏意图;在用户通过生物电信号进行输入时,可以通过采集心电、脑电、肌电、胃电、视网膜电等一种或多种电信号确定脱敏意图;在用户通过虚拟环境进行输入时,可以通过增强现实技术(AR)、虚拟现实技术(VR)等一种或多种方式确定脱敏意图。
此处,脱敏约束包括但不限于:脱敏黑名单、需脱敏保护的信息内容、本次脱敏约束条件、使用约束条件、脱敏传递约束条件、传播约束。
此处,效果约束包括但不限于:测评约束条件、脱敏级别。
此外,可执行用户输入的用户,即可获取脱敏意图的用户包括但不限于:信息的所属主体、或者拥有信息的主体(比如存储、管理);不同类型的用户在获取脱敏意图时,侧重点可能会有所差异;相同的用户在不同类型的信息在不同场景下获取脱敏意图时,侧重点亦可能会有所差异,不同的脱敏意图的获取可以对具体的一条信息进行获取,也可以对某一类信息进行获取。
通过获取脱敏意图,能够对表达脱敏意图获取者对信息的全生命周期中敏感性的一种基本的定义,让后续接触到信息的主体能够得到脱敏意图,并能够基于此脱敏意图来支撑后续对信息的脱敏操作与保护。
基于上述任一实施例,步骤120包括:
步骤121,基于所述第一脱敏控制集合,确定第一脱敏算法集合。
具体地,基于第一脱敏控制集合中包含的信息,可以定位第一信息中需要进行脱敏的信息,结合需要进行脱敏的信息和/或第一脱敏控制集合中指示的脱敏要求,即可确定进行脱敏需要应用的脱敏算法,并由此形成第一脱敏算法集合。
第一脱敏算法集合中包括一个或多个用于对第一信息进行脱敏的候选算法,第一脱敏算法集合的确定可以通过查表、映射表或者机器学习等方式实现。其中,映射表即考虑时间因素、地点因素、应用类型因素、信息所属主体、信息管理主体等因素对脱敏的影响所构建的,据此能够实现不同情况下的脱敏算法动态选择;机器学习方式则可以通过历史数据(包括主体自身的历史数据、其他用户的历史数据、关联应用的历史数据中的至少一种)学习规律,从而针对具体情况动态选择脱敏算法。
步骤122,基于所述第一脱敏算法集合,对所述第一信息进行脱敏,得到第二信息。
步骤123,基于所述第二信息,确定所述第三信息,并基于所述第一脱敏算法集合确定所述脱敏算法集合。
具体地,在应用第一脱敏算法集合对第一信息进行脱敏之后,即可得到脱敏后的第一信息,此处记为第二信息。考虑到基于第一脱敏算法集合进行脱敏的效果不一定完全符合脱敏意图,因此可以对脱敏效果进行测评,最终将通过测评,即效果符合脱敏意图的第二信息,确定为脱敏得到的最终结果,即第三信息。并且,在此过程中,还可以基于得到第三信息所应用的脱敏算法,即来自第一脱敏算法集合中的脱敏算法,构建脱敏算法集合,以记录对第一信息进行脱敏以获取得到第三信息所应用的脱敏算法。
基于上述任一实施例,步骤121包括:
基于所述第一脱敏控制集合,或,基于所述第一脱敏控制集合,以及脱敏效果期望和/或脱敏算法脱敏代价,调用脱敏算法匹配函数,得到第一脱敏算法集合。
具体地,脱敏效果期望用于反映此处脱敏期望达到的效果。脱敏效果期望包括但不限于:应用场景、隐私分量、隐私分量对应的保护要求、隐私分量的历史脱敏效果期望值。
所述第一脱敏算法集合包括但不限于以下至少一种:脱敏算法类别、脱敏算法、脱敏算法参数集合。其中,所选脱敏算法类别包括但不限于:匿名类、加噪类、混淆类、置换类、哈希类、置乱类和遮蔽类;例如,匿名类的k-匿名、l-多样性、t-邻近性等算法;加噪类的差分隐私等算法;置换类的假名置换、混合区mixzone置换等算法;遮蔽类的覆盖、涂黑等算法。
具体在调用脱敏算法匹配算法时,可以将第一脱敏控制集合作为算法输入,或者在将第一脱敏控制集合作为算法输入的同时,还另外将脱敏效果期望和/或脱敏算法脱敏代价也作为算法输入。
调用脱敏算法匹配算法进行匹配过程,主要实现输入要求与可用的各个脱敏算法的脱敏算法代价、算法脱敏效果的最佳匹配;例如对数值型数据可以采用差分、泛化等算法类别;对于文本信息,可以采用替换、遮盖等算法类别;对于图像信息,可以采用马赛克、图像变换等算法类别。
基于上述任一实施例,步骤121包括:
获取第一信息所对应的应用场景,或,
基于所述第一信息和/或所述第一脱敏控制集合中的敏感信息识别结果,确定所述第一信息所对应的应用场景;
获取历史的脱敏测评结果;
基于第一信息、第一信息所对应的应用场景、历史的脱敏测评结果中的至少一种,确定脱敏效果期望;
基于所述脱敏要求和所述敏感信息识别结果,确定所述待脱敏信息的期望属性;
基于所述脱敏效果期望和期望属性,确定所述第一脱敏算法集合。
具体地,第一信息所对应的应用场景,可以是直接接收到的,也可以是根据第一信息和/或敏感信息识别结果确定得到的。例如,在第一信息对应中能直接获取应用场景的,比如,第一信息是快递收件人信息,那么就可以确定应用场景为快递场景。比如,第一信息是地图的实时位置信息,敏感信息识别结果中包含场景特征是打车客户的位置,就可以结合两者确定应用场景为网约车场景。
在此基础上,基于第一信息、第一信息所对应的应用场景、历史的脱敏测评结果中的至少一种,即可确定脱敏效果期望。其中,可以仅应用第一信息确定脱敏效果期望,例如,当第一信息为公民的身份信息时,脱敏效果期望应可以确定为对用户身份去标识化,证件号码置空关键的几位。还可以结合第一信息和应用场景确定脱敏效果期望,例如,第一信息为用户的在街上的取景图片信息,第一信息所对应的应用场景为社交网络,脱敏效果期望应可以确定为对其他非授权的头像信息应该进行马赛克处理。此外,还可以基于历史的脱敏测评结果确定脱敏效果期望,例如,可以对照着与第一信息的同类信息的历史的脱敏测评结果来采取同样的脱敏效果期望。
此外,结合脱敏要求和敏感信息识别结果,还可以得到期望属性,此处的期望属性由期望属性分量组成,用于量化信息分量及分量组合的希望想要脱敏保护到的程度。
在此基础上,可以基于上述步骤得到的脱敏效果期望和期望属性,对已有的脱敏算法及其参数进行遍历,从而获取与第一脱敏控制集合相对应的第一脱敏算法集合。例如,可以根据脱敏效果期望和期望属性,遍历脱敏算法及其参数,得到各脱敏算法的候选算法脱敏效果,再根据脱敏效果期望和候选算法脱敏效果,通过映射表和/或机器学习,得到候选脱敏算法,以构建第一脱敏算法集合。
本发明实施例提供的方法,通过应用场景确定脱敏期望效果,并据此确定第一脱敏算法集合,可以实现按照应用场景和脱敏控制要求做差异化的自适应脱敏。
基于上述任一实施例,步骤123包括:
基于所述第一信息、第一同类历史信息、第一跨类历史信息、所述第二信息、第二同类历史信息、第二跨类历史信息、信息所属主体、所述第一脱敏控制集合、所述第一脱敏算法集合中的至少一种,确定脱敏测评结果;
若所述脱敏测评结果满足所述第一脱敏控制集合中的脱敏要求,则基于所述第二信息确定所述第三信息,将所述第一脱敏算法集合确定为所述脱敏算法集合;
否则,基于所述脱敏测评结果,更新所述第一脱敏算法集合,并基于更新后的第一脱敏算法集合对所述第一信息进行脱敏,直至所述脱敏测评结果满足所述脱敏要求;
所述第一同类历史信息包括与所述第一信息属于同一主体同一类型的第一历史信息,所述第一跨类历史信息包括与所述第一信息属于不同主体和/或不同类型的第一历史信息;
所述第二同类历史信息包括与所述第二信息属于同一主体同一类型的第二历史信息,所述第二跨类历史信息包括与所述第二信息属于不同主体和/或不同类型的第二历史信息。
具体地,在应用第一脱敏算法集合对第一信息进行脱敏之后,即可得到脱敏后的第一信息,此处记为第二信息。在此基础上,可以结合基于所述第一信息、第一同类历史信息、第一跨类历史信息、所述第二信息、第二同类历史信息、第二跨类历史信息、信息所属主体、所述第一脱敏控制集合、所述第一脱敏算法集合中的一种或者多种的任意组合,确定脱敏测评函数,进而基于脱敏测评函数对第一脱敏算法集合进行脱敏的效果进行测评,从而得到脱敏测评结果。
在得到脱敏测评结果之后,即可通过第一脱敏控制集合中的脱敏要求,判断脱敏测评结果是否满足脱敏要求,即当前的第一脱敏算法集合是否能够满足实际脱敏需求。
如果满足的话,则可以将步骤122得到的第二信息确定为第三信息,将第一脱敏算法集合确定为脱敏算法集合,此时当前主体的信息脱敏结束;
如果不满足的话,则需要返回到步骤122,结合脱敏测评结果,以及所述第一脱敏控制集合、脱敏效果期望、脱敏算法脱敏代价中的至少一种,更新第一脱敏算法集合,并基于更新后的第一脱敏算法集合对第一信息进行脱敏,从而得到更新后的第二信息,再进入步骤123,据此确定新的脱敏测评结果,以判断更新后的脱敏测评结果是否满足脱敏要求。
需要说明的是,在进行第一脱敏算法集合的更新修正时,也可以仅仅更新脱敏算法的算法参数。
本发明实施例提供的方法,在进行脱敏的过程中,通过脱敏测评对脱敏效果进行衡量,进而确定出能够满足脱敏要求的脱敏算法集合,以及据此脱敏得到的第三信息,从而保证信息脱敏能够符合预期,避免隐私信息泄露。
基于上述任一实施例,所述脱敏测评结果包括信息脱敏测评结果、集合脱敏测评结果和抗大数据分析脱敏测评结果中的至少一种;
步骤123中,在需要获取信息脱敏测评结果时,可以基于如下步骤实现:
基于所述第一信息和所述第二信息,或,基于所述第一信息和所述第二信息,以及历史的信息脱敏测评结果、所述信息所属主体、所述第一脱敏控制集合、所述第一脱敏算法集合中的至少一种,进行信息脱敏测评,得到信息脱敏测评结果。
此处,信息脱敏测评结果是针对此次对第一信息进行脱敏得到第二信息,这一脱敏过程进行测评,即进行信息脱敏测评所得的结果。
在信息脱敏测评时,可以基于第一信息和第二信息,判断脱敏的效果,也可以在第一信息和第二信息的基础上,进一步结合历史的信息脱敏测评结果、所述信息所属主体、所述第一脱敏控制集合、所述第一脱敏算法集合中的至少一种,判断脱敏的效果。
其中,历史的信息脱敏测评结果可以是此前对第一信息进行脱敏后进行信息脱敏测评的结果的集合。
所述信息所属主体与第一信息的关系包括但不限于:①信息由信息所属主体自身产生,②信息由他人分配用来标记信息所属主体;③信息从信息所属主体处采集;④信息通过已公开信息衍生挖掘而得。
所述信息所属主体可用来但不限于描述可对信息进行操作的、对信息拥有所有权的信息主体;所述信息由信息所属主体自身产生:信息所属主体撰写的材料、信息所属主体拍摄的照片、指纹等自身生物特征信息等;所述信息由他人分配用来标记信息所属主体:身份证号、车牌号、他人拍摄的包含信息所属主体的照片等;所述信息从信息所属主体处采集:如由传感器产生、智能手环/手表采集而来等;所述信息通过已公开信息衍生挖掘而得:如AI技术根据现有数据对信息所属主体情况的推断产生的信息;
其中,所述信息主体包括但不限于:信息所属主体、信息接收主体;所述信息接收主体包括但不限于:用户、应用(如,手机APP)、系统、服务器设备。
操作包括但不限于:对信息进行查看、下载、复制、粘贴、剪切、修改、删除、转发。
步骤123中,在需要获取集合脱敏测评结果时,可以基于如下步骤实现:
基于所述第一同类历史信息和所述第二同类历史信息,或,基于所述第一同类历史信息和所述第二同类历史信息,以及所述第一信息、所述第二信息、历史的信息脱敏测评结果、所述信息脱敏测评结果、历史的集合脱敏测评结果、所述信息所属主体、所述第一脱敏控制集合、所述第一脱敏算法集合中的至少一种,进行集合脱敏测评,得到集合脱敏测评结果。
此处,第一同类历史信息包括与所述第一信息属于同一主体同一类型的第一历史信息,具体可以理解为与第一信息属于同一主体、同一类型的在某个节点的某个时间内的所有第一信息的集合。例如,第一信息是某个人的照片,第一同类历史信息则可能是某个人的所有照片。
第二同类历史信息包括与所述第二信息属于同一主体同一类型的第二历史信息,具体可以理解为与第二信息属于同一主体、同一类型的在某个节点的某个时间内的所有第二信息的集合。
基于此执行得到的集合脱敏测评结果是针对于第一信息和第二信息的脱敏情况进行测评得到的结果。集合脱敏测评结果反映的并不是单纯意义上对第一信息进行脱敏得到第二信息的单次脱敏的效果,而是与第一信息、第二信息属于同一主体、同一类型的信息的普适性的脱敏效果。
考虑到第一信息和第二信息均可能存在于第一同类历史信息和第二同类历史信息中,在进行集合脱敏测评时,可以仅应用第一同类历史信息和第二同类历史信息,也可以在参考第一同类历史信息和第二同类历史信息的基础上,进一步结合所述第一信息、所述第二信息、历史的信息脱敏测评结果、所述信息脱敏测评结果、历史的集合脱敏测评结果、所述信息所属主体、所述第一脱敏控制集合、所述第一脱敏算法集合中的至少一种。
可以理解的是,集合脱敏测评与信息脱敏测评仅是测评对象,即输入脱敏测评函数中的输入参数存在区别,具体执行步骤相同,此处不作赘述。
步骤123中,在需要获取抗大数据脱敏测评结果时,可以基于如下步骤实现:
基于所述第一跨类历史信息、所述第二信息和所述第二跨类历史信息,或,基于所述第一跨类历史信息、所述第二信息和所述第二跨类历史信息,以及所述第一信息、历史的信息脱敏测评结果、所述信息脱敏测评结果、历史的集合脱敏测评结果、所述集合脱敏测评结果、历史的抗大数据分析脱敏测评结果、所述信息所属主体、所述第一脱敏控制集合、所述第一脱敏算法集合中的至少一种,进行抗大数据分析脱敏测评,得到抗大数据分析脱敏测评结果。
此处,第一跨类历史信息包括与所述第一信息属于不同主体和/或不同类型的第一历史信息,即,第一跨类历史信息可以包括与所述第一信息属于不同主体但是相同类型的第一历史信息,也可以包括与所述第一信息属于相同主体但是不同类型的第一历史信息,还可以包括与所述第一信息属于不同主体且不同类型的第一历史信息。需要说明的是,无论是上述何种第一历史信息,均是与第一信息相关的信息。
相似地,第二跨类历史信息包括与所述第二信息属于不同主体和/或不同类型的第二历史信息,即,第二跨类历史信息可以包括与所述第二信息属于不同主体但是相同类型的第二历史信息,也可以包括与所述第二信息属于相同主体但是不同类型的第二历史信息,还可以包括与所述第二信息属于不同主体且不同类型的第二历史信息。需要说明的是,无论是上述何种第二历史信息,均是与第二信息相关的信息。
据此执行得到的抗大数据脱敏测评结果是针对于第一跨类历史信息和第二跨类历史信息的脱敏情况进行测评得到的结果。抗大数据脱敏测评结果反映的并不是单纯意义上对第一信息进行脱敏得到第二信息的单次脱敏的效果,而是与第一信息、第二信息所相关的信息的普适性的脱敏效果。
在进行抗大数据脱敏时,可以仅应用第一跨类历史信息、第二信息和第二跨类历史信息,也可以在参考第一跨类历史信息、第二信息和第二跨类历史信息的基础上,将进一步结合所述第一信息、历史的信息脱敏测评结果、所述信息脱敏测评结果、历史的集合脱敏测评结果、所述集合脱敏测评结果、历史的抗大数据分析脱敏测评结果、所述信息所属主体、所述第一脱敏控制集合、所述第一脱敏算法集合中的至少一种。
可以理解的是,抗大数据脱敏测评与集合脱敏测评、信息脱敏测评仅是测评对象,即输入脱敏测评函数中的输入参数存在区别,具体执行步骤相同,此处不作赘述。
需要说明的是,上述信息脱敏测评、集合脱敏测评和抗大数据脱敏测评均可以通过脱敏测评函数实现,而针对不同类型的脱敏测评,可以应用同一个脱敏测评函数,对应不同的脱敏测评输入参数,也可以应用各自对应的脱敏测评函数,对应各自类型下的脱敏测评输入参数。
此处的脱敏测评函数包括但不限于:合规评估函数、脱敏效果测评函数,由此得到的脱敏评测结果包括但不限于:合规评估结果、脱敏效果测评结果;其实现方式包括但不限于:数据挖掘、机器学习、相关性分析、贝叶斯推断、聚类、频繁项挖掘;
其中,所述合规评估函数用于包括但不限于以下方面的检查:脱敏算法实现正确性评估、脱敏控制合规评估、脱敏控制传递正确性评估、脱敏工具合规测评、拆分脱敏方法合规测评、脱敏效果强度合规评估;
针对信息脱敏测评,脱敏测评函数的输入包括第一信息、第二信息,此外,还可以包括:历史的信息脱敏测评结果、所述信息所属主体、所述第一脱敏控制集合、所述第一脱敏算法集合中的至少一种;
针对集合脱敏测评,脱敏测评函数的输入包括第一同类历史信息和第二同类历史信息,此外,还可以包括所述第一信息、所述第二信息、历史的信息脱敏测评结果、所述信息脱敏测评结果、历史的集合脱敏测评结果、所述信息所属主体、所述第一脱敏控制集合、所述第一脱敏算法集合中的至少一种;
针对抗大数据脱敏测评,脱敏测评函数的输入包括第一跨类历史信息、第二信息和第二跨类历史信息,还可以包括述第一信息、历史的信息脱敏测评结果、所述信息脱敏测评结果、历史的集合脱敏测评结果、所述集合脱敏测评结果、历史的抗大数据分析脱敏测评结果、所述信息所属主体、所述第一脱敏控制集合、所述第一脱敏算法集合中的至少一种。
基于上述任一实施例,步骤123中,所述若所述脱敏测评结果满足所述第一脱敏控制集合中的脱敏要求,则基于所述第二信息确定所述第三信息,将所述第一脱敏算法集合确定为所述脱敏算法集合,包括:
确定当前脱敏测评结果,所述当前脱敏测评结果是当前完成脱敏测评得到的脱敏测评结果,所述当前脱敏测评结果包括所述信息脱敏测评结果、所述集合脱敏测评结果和所述抗大数据分析脱敏测评结果中的至少一种;
若所述当前脱敏测评结果满足所述第一脱敏控制集合中的脱敏要求,则基于所述第二信息确定所述第三信息,将所述第一脱敏算法集合确定为所述脱敏算法集合。
具体地,当前脱敏测评结果是基于步骤123中实际执行并完成的脱敏测评所得到的结果。此处,实际执行并完成的脱敏测评可以包括信息脱敏测评、集合脱敏测评和抗大数据脱敏测评中的一种或者多种,相应地,此处得到的当前脱敏测评结果包括信息脱敏测评结果、集合脱敏测评结果和抗大数据脱敏测评结果中的一种或者多种。
需要说明的是,当实际执行并完成多种脱敏测评时,多种脱敏测评可以是逐个执行的,也可以是并行的;在多种脱敏测评逐个执行的情况下,只要当前执行完成并得到的脱敏测评结果不满足脱敏要求,便需要重新调整第一脱敏算法集合;在多种脱敏测评并行执行的情况下,只要得到的多个脱敏测评结果中有任意一个脱敏测评结果不满足脱敏要求,便需要重新调整第一脱敏算法集合。
需要说明的是,在进行第一脱敏算法集合的更新修正时,也可以仅仅更新脱敏算法的算法参数。
相应地,仅在所有的当前脱敏测评结果均能够满足脱敏要求的情况下,方可以将此时脱敏得到的第二信息确定为第三信息,将第一脱敏算法集合确定为脱敏算法集合。
另外,本发明实施例中的抗大数据分析脱敏测评,可以在第三信息发布之前进行,也可以在第三信息发布、交换之后进行。(1)如果在第三信息发布之前进行,在进行抗大数据挖掘分析的脱敏效果评估通过之后,再对外发布;不符合时,进行脱敏修正,比如进行脱敏算法和/或算法参数的重新选择。(2)如果在第三信息发布、交换之后进行评估(包含长时间的系统运行或者流转),解决信息流转出去之后,如何发现脱敏层面的风险,来再次进行脱敏,从而最终实现抗大数据分析的脱敏效果。
基于上述任一实施例,步骤123中,所述基于所述第二信息确定所述第三信息,包括:
基于所述第二信息,以及发布时间和/或当前主体,确定所述第三信息。
具体地,在脱敏测评结果满足第一脱敏控制集合中的脱敏要求的情况下,即可基于第二信息,确定第三信息,具体可以是直接将第二信息作为第三信息,也可以是在第二信息的基础上,增加在当前执行敏感信息的流转脱敏的主体,即发布主体的发布时间,和/或增加在当前执行敏感信息的流转脱敏的主体的主体标识、主体名称等信息,从而得到第三信息。
例如,第三信息可以表示为第二信息+发布主体标识+发布主体名称+发布时间+第二脱敏控制集合+使用的脱敏算法标识+使用的脱敏算法及其参数。也可以将脱敏测评结果包含在第三信息里面。
基于上述任一实施例,步骤130包括:
基于信息所属主体、所述第一信息和所述第三信息,确定信息变化记录集合;
基于所述第一脱敏控制集合,以及所述脱敏测评结果、所述脱敏算法集合和所述信息变化记录集合中的至少一种,确定第二脱敏控制集合。
具体地,所述第二脱敏控制集合至少包括脱敏要求;此外,第二脱敏控制集合还可以包括第二信息在历史上的脱敏测评结果、所述第三信息的脱敏测评结果、脱敏算法集合、信息变化记录集合、原始信息和敏感信息识别结果中的至少一种。
基于上述任一实施例,步骤130中,所述确定第二脱敏控制集合,之后还包括:
发送所述第三信息和/或所述第二脱敏控制集合。
基于上述任一实施例,该方法还包括:
确定在完成所述脱敏意图、所述第一信息、所述脱敏要求、所述敏感信息识别结果、所述第一脱敏控制集合、所述第一脱敏算法集合、所述脱敏算法集合、所述第二信息、所述第三信息、所述第二脱敏控制集合、信息变化记录集合和脱敏测评结果中的至少一种过程中的存证集合。
具体地,针对上述各实施例中脱敏过程形成的各个集合,均可以进行存证,从而得到对应存证集合,以便于支持后续的删除、监管工作。
其中,针对脱敏意图,可以根据以下一种或多种的任意组合确定脱敏意图存证集合:脱敏意图获取过程所在的环境、脱敏意图获取的内容、脱敏意图获取的操作者、脱敏意图获取的所依托的设备或系统信息、脱敏意图获取的时间、脱敏意图获取的地址、脱敏意图获取的过程记录、脱敏意图被使用的过程记录。
在确定脱敏意图存证集合之后,即可将脱敏意图存证集合发送给存证单元进行存证。
针对第一信息,可以根据以下一种或多种的任意组合确定第一信息存证集合:第一信息本身、第一信息的发送者、第一信息的发送时间、第一信息的接收者、第一信息的接收时间、第一信息的获取过程记录。在确定第一信息存证集合之后,即可将第一信息存证集合发送给存证单元进行存证。
针对脱敏要求,可以根据以下一种或多种的任意组合确定脱敏要求存证集合:脱敏要求、脱敏意愿、脱敏要求的确定者、脱敏要求的确定时间、脱敏要求的确定过程记录、确定过程中的每一步所产生的中间变量。在确定脱敏要求存证集合之后,即可将脱敏要求存证集合发送给存证单元进行存证。
针对敏感信息识别结果,可以根据以下一种或多种的任意组合确定敏感信息识别结果存证集合:敏感信息识别结果、敏感信息识别函数、敏感信息识别函数运行过程记录、敏感信息识别结果的确定过程记录、确定过程中的每一步所产生的中间变量。在确定敏感信息识别结果存证集合之后,即可将敏感信息识别结果存证集合发送给存证单元进行存证。
针对第一脱敏控制集合,可以根据以下一种或多种的任意组合确定第一脱敏控制存证集合:第一脱敏控制集合、脱敏要求、第一脱敏控制集合的确定者、第一脱敏控制集合的确定时间、第一脱敏控制集合的确定过程记录、第一脱敏控制集合的使用者、第一脱敏控制集合的使用时间、确定过程中的每一步所产生的中间变量。在确定第一脱敏控制存证集合之后,即可将第一脱敏控制存证集合发送给存证单元进行存证。
针对第一脱敏算法集合,可以根据以下一种或多种的任意组合确定脱敏算法存证集合:第一脱敏算法集合、第一脱敏控制集合、脱敏算法匹配函数、脱敏算法匹配函数调用者、脱敏算法匹配函数输入、脱敏算法集合、脱敏算法集合运行过程记录、第一信息、第二信息。在确定第一脱敏算法存证集合之后,即可将脱敏算法存证集合发送给存证单元进行存证。
针对脱敏算法集合,可以根据以下一种或多种的任意组合确定脱敏算法存证集合:脱敏算法集合、第一脱敏控制集合、脱敏算法匹配函数、脱敏算法匹配函数调用者、脱敏算法匹配函数输入、脱敏算法集合、脱敏算法集合运行过程记录、第一信息、第二信息。在确定脱敏算法存证集合之后,即可将脱敏算法存证集合发送给存证单元进行存证。
针对第二信息,可以根据以下一种或多种的任意组合确定第二信息存证集合:第二信息本身、第二信息生成者、第二信息生成时间、第二信息对应的脱敏算法及参数、第二信息的确定过程记录。在确定第二信息存证集合之后,即可将第二信息存证集合发送给存证单元进行存证。
针对第三信息,可以根据以下一种或多种的任意组合确定第三信息存证集合:第三信息本身、第三信息生成者、第三信息生成时间、第三信息对应的脱敏算法及参数、第二脱敏控制集合、第三信息的确定过程记录。在确定第二信息存证集合之后,即可将第二信息存证集合发送给存证单元进行存证。
针对第二脱敏控制集合,可以根据以下一种或多种的任意组合确定第一脱敏控制存证集合:第二脱敏控制集合、第一脱敏控制集合、脱敏要求、第二脱敏控制集合的确定者、第二脱敏控制集合的确定时间、第二脱敏控制集合的确定过程记录、第二脱敏控制集合的使用者、第二脱敏控制集合的使用时间、确定过程中的每一步所产生的中间变量。在确定第二脱敏控制存证集合之后,即可将第一脱敏控制存证集合发送给存证单元进行存证。
针对信息变化记录集合,可以根据以下一种或多种的任意组合确定信息变化记录存证集合:信息变化记录集合、信息所属主体、第一信息、第三信息、由第一信息变为第三信息的过程记录。在确定信息变化记录存证集合之后,即可将信息变化记录存证集合发送给存证单元进行存证。
针对脱敏测评结果,可以根据以下一种或多种的任意组合确定脱敏测评结果存证集合:脱敏测评结果、第一信息、第二信息、第二信息的确定过程记录、脱敏测评函数、脱敏测评函数的调用者、脱敏测评函数的输入、脱敏测评函数运行过程记录、脱敏测评结果的确定过程记录;在确定脱敏测评结果存证集合之后,即可发送到存证单元进行存证。
需要说明的是,针对存在多个类型的脱敏测评的情况,可以针对各个类型的脱敏测评结果分别生成对应的脱敏测评结果存证集合,也可以将所有类型的脱敏评测结果的存证包含在一个脱敏测评结果存证集合之中,本发明实施例对此不作具体限定。
所述第三信息、信息变化记录集合和第二脱敏控制集合中的至少一种,可以根据以下一种或多种的任意组合确定第三信息存证集合、信息变化记录存证集合和第二脱敏控制存证集合中的至少一种:第三信息、脱敏算法集合、信息变化记录集合、信息变化记录集合的确定过程记录、第二脱敏控制集合、第二脱敏控制集合的确定过程记录、第三信息和/或第二脱敏控制集合发送过程记录、第三信息和/或第二脱敏控制集合接收者、第三信息和/或第二脱敏控制集合保存过程。在确定第三信息存证集合、信息变化记录存证集合和第二脱敏控制存证集合中的至少一种之后,即可发送给存证单元进行存证。
基于上述任一实施例,所述第一脱敏控制集合包括所述第一信息的脱敏要求,或包括所述第一信息的脱敏要求,以及所述第一信息在历史上的脱敏测评结果、脱敏算法集合、信息变化记录集合、原始信息和敏感信息识别结果中的至少一种;
所述第二脱敏控制集合包括所述第三信息的脱敏要求,或包括所述第三信息的脱敏要求,以及所述第二信息在历史上的脱敏测评结果、所述第三信息的脱敏测评结果、脱敏算法集合、信息变化记录集合、原始信息和敏感信息识别结果中的至少一种。
基于上述任一实施例,图5是本发明提供的敏感信息的流转脱敏方法的流程示意图之二,如图5所示,针对首次脱敏的情况,敏感信息的流转脱敏方法包括如下步骤:
步骤501、获取脱敏意图;
所述脱敏意图的获取方式包括但不限于:按钮、圈出、勾选、标记、按键、滑轮、菜单、语音、音频、视频、眼神、手势、文字、生物电信号、虚拟环境中的任意一种或多种的组合。
通过获取脱敏意图,能够对表达脱敏意图获取者对信息的全生命周期中敏感性的一种基本的定义,让后续接触到信息的人能够得到脱敏意图,并能够基于此脱敏意图来支撑后续对信息的脱敏操作与保护。
步骤501’、根据以下一种或多种的任意组合生成脱敏意图存证集合:脱敏意图获取过程所在的环境、脱敏意图获取的内容、脱敏意图获取的操作者、脱敏意图获取的所依托的设备或系统信息、脱敏意图获取的时间、脱敏意图获取的地址、脱敏意图获取的过程记录、脱敏意图被使用的过程记录;
步骤502、根据所述脱敏意图和/或预建脱敏知识图谱库,或,基于所述第一信息,以及所述脱敏意图和/或预建脱敏知识图谱库,确定所述脱敏要求;
根据脱敏意图、预建脱敏知识图谱库、脱敏要求三者中的一个或多个任意组合,对第一信息调用敏感信息识别函数,得到敏感信息识别结果;
根据脱敏要求和敏感信息识别结果,或,根据所述第一信息、脱敏要求和敏感信息识别结果,确定所述第一脱敏控制集合;
本发明实施例通过将脱敏意图与其他多种集合,确定脱敏要求和/或第一脱敏控制集合,与信息绑定进行同步传播,实现信息在采集、交换等过程中,有效传达所有信息接触者的脱敏意图和/或脱敏要求;
步骤502’、根据以下一种或多种的任意组合分别生成脱敏要求存证集合、敏感信息识别结果存证集合、第一脱敏控制存证集合:脱敏要求、脱敏意愿、脱敏要求的确定者、脱敏要求的确定时间、脱敏要求的确定过程记录、敏感信息识别结果、敏感信息识别函数、敏感信息识别函数运行过程记录、敏感信息识别结果的确定过程记录、第一脱敏控制集合、第一脱敏控制集合的确定者、第一脱敏控制集合的确定时间、第一脱敏控制集合的确定过程记录、第一脱敏控制集合的使用者、第一脱敏控制集合的使用时间、确定过程中的每一步所产生的中间变量;
步骤503、根据第一脱敏控制集合,调用脱敏算法匹配函数,确定第一脱敏算法集合;
包括但不限于以下步骤确定第一脱敏算法集合:
具体地,第一信息所对应的应用场景,可以是直接接收到的,也可以是根据第一信息和/或敏感信息识别结果确定得到的。例如,在第一信息对应中能直接获取应用场景的,比如,第一信息是快递收件人信息,那么就可以确定应用场景为快递场景。比如,第一信息是地图的实时位置信息,敏感信息识别结果中包含场景特征是打车客户的位置,就可以结合两者确定应用场景为网约车场景。
在此基础上,基于第一信息、第一信息所对应的应用场景、历史的脱敏测评结果中的至少一种,即可确定脱敏效果期望。其中,可以仅应用第一信息确定脱敏效果期望,例如,当第一信息为公民的身份信息时,脱敏效果期望应可以确定为对用户身份去标识化,证件号码置空关键的几位。还可以结合第一信息和应用场景确定脱敏效果期望,例如,第一信息为用户的在街上的取景图片信息,第一信息所对应的应用场景为社交网络,脱敏效果期望应可以确定为对其他非授权的头像信息应该进行马赛克处理。此外,还可以基于历史的脱敏测评结果确定脱敏效果期望,例如,可以对照着与第一信息的同类信息的历史的脱敏测评结果来采取同样的脱敏效果期望。
此外,结合脱敏要求和敏感信息识别结果,还可以得到期望属性,此处的期望属性由期望属性分量组成,用于量化信息分量及分量组合的希望想要脱敏保护到的程度。
在此基础上,可以基于上述步骤得到的脱敏效果期望和期望属性,对已有的脱敏算法及其参数进行遍历,从而获取与第一脱敏控制集合相对应的第一脱敏算法集合。例如,可以根据脱敏效果期望和期望属性,遍历脱敏算法及其参数,得到各脱敏算法的候选算法脱敏效果,再根据脱敏效果期望和候选算法脱敏效果,通过映射表和/或机器学习,得到候选脱敏算法,以构建第一脱敏算法集合。
本发明实施例提供的方法,通过应用场景确定脱敏期望效果,并据此确定第一脱敏算法集合,可以实现按照应用场景和脱敏控制要求做差异化的自适应脱敏。
步骤503’、根据以下一种或多种的任意组合生成第一脱敏算法集合存证集合:第一脱敏算法集合、第一脱敏控制集合、脱敏算法匹配函数、脱敏算法匹配函数调用者、脱敏算法匹配函数输入、脱敏算法集合、脱敏算法集合运行过程记录、第一信息、第二信息;
步骤504、对第一信息使用第一脱敏算法集合进行脱敏,得到第二信息;
优选地,根据所述第一信息、第一同类历史信息、第一跨类历史信息、所述第二信息、第二同类历史信息、第二跨类历史信息、信息所属主体、所述第一脱敏控制集合、所述第一脱敏算法集合中的至少一种,调用脱敏测评函数,确定脱敏测评结果;如果脱敏测评结果显示不满足脱敏要求,转入步骤503;如果满足脱敏要求,转入步骤505;
优选的部分,可以根据不同的输入确定不同类型的脱敏测评结果的输出,比如:基于所述第一信息和所述第二信息,或,基于所述第一信息和所述第二信息,以及历史的信息脱敏测评结果、所述信息所属主体、所述第一脱敏控制集合、所述第一脱敏算法集合中的至少一种,进行信息脱敏测评,得到信息脱敏测评结果;
基于所述第一同类历史信息和所述第二同类历史信息,或,基于所述第一同类历史信息和所述第二同类历史信息,以及所述第一信息、所述第二信息、历史的信息脱敏测评结果、所述信息脱敏测评结果、历史的集合脱敏测评结果、所述信息所属主体、所述第一脱敏控制集合、所述第一脱敏算法集合中的至少一种,进行集合脱敏测评,得到集合脱敏测评结果;
基于所述第一跨类历史信息、所述第二信息和所述第二跨类历史信息,或,基于所述第一跨类历史信息、所述第二信息和所述第二跨类历史信息,以及所述第一信息、历史的信息脱敏测评结果、所述信息脱敏测评结果、历史的集合脱敏测评结果、所述集合脱敏测评结果、历史的抗大数据分析脱敏测评结果、所述信息所属主体、所述第一脱敏控制集合、所述第一脱敏算法集合中的至少一种,进行抗大数据分析脱敏测评,得到抗大数据分析脱敏测评结果。
本发明实施例通过在脱敏后的信息发布前,利用不同的信息之间的组合来进行脱敏测评,根据脱敏测评结果来决定是否进行脱敏修正,能够提升脱敏的准确性;但是优选的部分不是一定要执行,也可以直接得到第二信息后,直接转入步骤505,本发明实施例对此不作具体限定。
步骤504’、根据以下一种或多种的任意组合生成脱敏测评结果存证集合:脱敏测评结果、第一信息、第二信息、第二信息的生成过程、脱敏测评函数、脱敏测评函数的输入、脱敏测评结果的确定过程记录;
步骤505、将第二信息输出为第三信息,将第一脱敏算法集合输出为脱敏算法集合;根据第一脱敏控制集合,以及脱敏测评结果、脱敏算法集合和信息变化记录集合中的至少一种,确定第二脱敏控制集合,并将第三信息和/或第二脱敏控制集合进行发送和/或保存;
步骤505’、根据以下一种或多种的任一组合分别生成第三信息存证集合、脱敏算法存证集合、信息变化记录存证集合和第二脱敏控制存证集合:第一信息、第二信息、第三信息、第三信息生成者、第三信息生成时间、第三信息对应的脱敏算法及参数、第三信息的确定过程记录、脱敏要求、第一脱敏控制集合、第二脱敏控制集合、第二脱敏控制集合的确定者、第二脱敏控制集合的确定时间、第二脱敏控制集合的确定过程记录、第二脱敏控制集合的使用者、第二脱敏控制集合的使用时间、脱敏算法匹配函数、脱敏算法匹配函数调用者、脱敏算法匹配函数输入、脱敏算法集合、脱敏算法集合运行过程记录、信息所属主体、信息变化记录集合、由第一信息变为第三信息的过程记录、确定过程中的每一步所产生的中间变量;
以上从步骤501到步骤505的所有步骤,可以由任意一种或多种进行组合,且不限定执行顺序;
以上从步骤501’到步骤505’的所有步骤,可以由任意一种或多种组合进行发送和/或保存;
本发明实施例中所有脱敏步骤均可以生成存证信息,实现站在全生命周期保护角度进行脱敏存证,用于后续发现脱敏不到位的环节。
基于上述任一实施例,图6是本发明提供的敏感信息的流转脱敏方法的流程示意图之三,如图6所示,针对首次脱敏之后,在前一次脱敏的基础之上进行迭代脱敏的情况,敏感信息的流转脱敏方法包括如下步骤:
步骤601、获取脱敏意图;
在之前还包括:
接收第一信息和/或第一脱敏控制集合;
需要说明的是,此处针对当前主体而言,接收到的第一信息和/或第一脱敏控制集合,即上一主体通过脱敏处理得到的第三信息和/或第二脱敏控制集合。
步骤601’、根据以下一种或多种的任意组合生成脱敏意图存证集合:脱敏意图获取过程所在的环境、脱敏意图获取的内容、脱敏意图获取的操作者、脱敏意图获取的所依托的设备或系统信息、脱敏意图获取的时间、脱敏意图获取的地址、脱敏意图获取的过程记录、脱敏意图被使用的过程记录;
步骤602、根据脱敏意图和/或预建脱敏知识图谱库,确定脱敏要求;
根据脱敏意图、预建脱敏知识图谱库、脱敏要求、接收到的第一脱敏控制集合四者中的一个或多个任意组合,对第一信息调用敏感信息识别函数,确定敏感信息识别结果;
还可以根据接收到的第一脱敏控制集合,以及所述脱敏意图、所述预建脱敏知识图谱库和所述第一信息中的至少一种,确定脱敏要求;
即,相较于首次脱敏,迭代脱敏在确定脱敏要求和敏感信息识别结果时,还可以应用接收到的第一脱敏控制集合进行。
步骤602’、根据以下一种或多种的任意组合分别生成脱敏要求存证集合、敏感信息识别结果存证集合:脱敏要求、脱敏意愿、脱敏要求的确定者、脱敏要求的确定时间、脱敏要求的确定过程记录、确定过程中的每一步所产生的中间变量、敏感信息识别结果、敏感信息识别函数、敏感信息识别函数运行过程记录、敏感信息识别结果的确定过程记录;
步骤603、根据第一脱敏控制集合,调用脱敏算法匹配函数,得到第一脱敏算法集合;
需要说明的是,此处的第一脱敏控制集合,区别于步骤601中直接接收到的第一脱敏控制集合,是在步骤602确定的脱敏要求的基础构建得到的,或者是在步骤601接收到的第一脱敏控制集合的基础上,应用步骤602中确定的脱敏要求和敏感信息识别结果更新确定的。此处的第一脱敏控制集合可以和步骤602中确定的第一脱敏控制集合中的内容一模一样,也可以比602中确定的第一脱敏控制集合中的内容多,也可以比602中确定的第一脱敏控制集合中的内容少,本发明实施例对此不作具体限定。
步骤603’、根据以下一种或多种的任意组合生成第一脱敏算法存证集合:第一脱敏算法集合、第一脱敏控制集合、脱敏算法匹配函数、脱敏算法匹配函数调用者、脱敏算法匹配函数输入、脱敏算法集合、脱敏算法集合运行过程记录、第一信息、第二信息;
步骤604、对第一信息使用第一脱敏算法集合进行脱敏,得到第二信息;
优选地,根据所述第一信息、第一同类历史信息、第一跨类历史信息、所述第二信息、第二同类历史信息、第二跨类历史信息、信息所属主体、所述第一脱敏控制集合、所述第一脱敏算法集合中的至少一种,调用脱敏测评函数,确定脱敏测评结果;如果脱敏测评结果显示不满足脱敏要求,转入步骤603;如果满足脱敏要求,转入步骤605;
优选的部分,可以根据不同的输入确定不同类型的脱敏测评结果的输出,比如:基于所述第一信息和所述第二信息,或,基于所述第一信息和所述第二信息,以及历史的信息脱敏测评结果、所述信息所属主体、所述第一脱敏控制集合、所述第一脱敏算法集合中的至少一种,进行信息脱敏测评,得到信息脱敏测评结果;
基于所述第一同类历史信息和所述第二同类历史信息,或,基于所述第一同类历史信息和所述第二同类历史信息,以及所述第一信息、所述第二信息、历史的信息脱敏测评结果、所述信息脱敏测评结果、历史的集合脱敏测评结果、所述信息所属主体、所述第一脱敏控制集合、所述第一脱敏算法集合中的至少一种,进行集合脱敏测评,得到集合脱敏测评结果;
基于所述第一跨类历史信息、所述第二信息和所述第二跨类历史信息,或,基于所述第一跨类历史信息、所述第二信息和所述第二跨类历史信息,以及所述第一信息、历史的信息脱敏测评结果、所述信息脱敏测评结果、历史的集合脱敏测评结果、所述集合脱敏测评结果、历史的抗大数据分析脱敏测评结果、所述信息所属主体、所述第一脱敏控制集合、所述第一脱敏算法集合中的至少一种,进行抗大数据分析脱敏测评,得到抗大数据分析脱敏测评结果。
需要说明的是,此处在调用脱敏测评函数进行脱敏测评时,不仅侧重于对当前第一信息及其相关信息的大数据分析,还结合了第一脱敏控制集合所包含的之前信息主体的脱敏意图、所选择的脱敏算法集合,即迭代脱敏时自身信息及其历史信息、相关关联信息的自身信息及历史信息。但是优选的部分不是一定要执行,也可以直接得到第二信息后,直接转入步骤605,本发明实施例对此不作具体限定。
步骤604’、根据以下一种或多种的任意组合生成脱敏测评结果存证集合:脱敏测评结果、第一信息、第二信息、第二信息的确定过程记录、脱敏测评函数、脱敏测评函数的调用者、脱敏测评函数的输入、脱敏测评函数运行过程记录、脱敏测评结果的确定过程记录;
步骤605、将第二信息输出为第三信息,将第一脱敏算法集合输出为脱敏算法集合;根据第一脱敏控制集合,以及脱敏测评结果、脱敏算法集合和信息变化记录集合中的至少一种,确定第二脱敏控制集合,并将第三信息和/或第二脱敏控制集合进行发送和/或保存;
例如,根据本次迭代脱敏中新确定的脱敏测评结果、脱敏算法集合、信息变化记录集合和第一脱敏控制集合中已有的各项,通过追加、取并/交集等方式,生成/更新第二脱敏控制集合。此时,第二脱敏控制集合包含了从信息所属主体首次分享开始,到当前信息接收主体为止,经历过中间多个信息接收主体后,首次脱敏与多轮迭代脱敏之间所有信息主体的脱敏依据、约束、方法和结果等。
其中,所述更新方式包括但不限于:按集合更新、按信息主体更新;
例如,按集合更新:是将其中子集合分别将每一个信息主体的对应集合进行更新,如脱敏测评结果集合={脱敏测评结果集合信息所属主体,脱敏测评结果集合第一个信息接收主体,脱敏测评结果集合第二个信息接收主体,……};
例如,按信息主体更新:是将每一个信息主体的脱敏控制集合整体进行更新,如脱敏控制集合={脱敏控制集合信息所属主体,脱敏控制集合第一个信息接收主体,脱敏控制集合第二个信息接收主体,……},其中,脱敏控制集合第X个信息接收主体={脱敏测评结果集合第X个信息接收主体,脱敏算法集合第X个信息接收主体,信息变化记录集合第X个信息接收主体,……};
步骤605’、根据以下一种或多种的任一组合生成第二信息存证集合、脱敏算法存证集合、信息变化记录存证集合和第二脱敏控制存证集合:第一信息、第二信息、第三信息、第三信息生成者、第三信息生成时间、第三信息对应的脱敏算法及参数、第三信息的确定过程记录、脱敏要求、第一脱敏控制集合、第二脱敏控制集合、第二脱敏控制集合的确定者、第二脱敏控制集合的确定时间、第二脱敏控制集合的确定过程记录、第二脱敏控制集合的使用者、第二脱敏控制集合的使用时间、脱敏算法匹配函数、脱敏算法匹配函数调用者、脱敏算法匹配函数输入、脱敏算法集合、脱敏算法集合运行过程记录、信息所属主体、信息变化记录集合、由第一信息变为第三信息的过程记录、确定过程中的每一步所产生的中间变量;
以上从步骤601到步骤605的所有步骤,可以由任意一种或多种进行组合,且不限定执行顺序;
以上从步骤601’到步骤605’的所有步骤,可以由任意一种或多种组合进行发送和/或保存;
需要说明的是,脱敏可以进行N轮(N≥2,当N=1的时候,属于首次脱敏,不存在迭代),第N轮可以使用第N-1轮里的脱敏控制集合中的任意要素、第N-1信息,也可以使用前N-1轮里的全部、或者其中任意几轮的脱敏控制集合的任意要素、第X信息。
本发明实施例提供的方法,通过获取脱敏意图,得到信息主体的脱敏意图和所获取的脱敏控制集合,同时根据预建脱敏知识图谱库和/或脱敏控制集合,确定最终要脱敏保护的信息分量和脱敏约束;
此外,通过脱敏控制集合与信息的同步流转,使得传播链上的所有信息主体的传播和脱敏意图得到传达;
根据脱敏控制集合中的脱敏要求,能够获得场景和要求,依据应用场景和脱敏控制要求,以及隐私信息的模态、属性等因素来决定脱敏算法,实现按照场景和要求做差异化的自适应脱敏;
将每次脱敏过程中确定的脱敏要求、脱敏测评结果、脱敏算法集合等更新进脱敏控制集合中,使得后续每一位信息接收主体都能通过接收到的脱敏控制集合知晓之前所有信息主体所进行的脱敏操作,同时配合脱敏匹配函数和脱敏测评函数的结合,实现从大数据分析、隐私挖掘的角度,修改调整脱敏方法;
根据脱敏测评函数完成脱敏效果的测评,同时有效保障了根据历史数据和当前测评数据对测评函数的修改调整的进行;
根据每一步的脱敏控制生成结果和/或生成过程,生成对应的存证集合;所有步骤生成的对应的存证集合,可以由任意一种或多种进行组合进行发送和/或保存。
在本发明实施例提供的方法中,通过各种方式获取脱敏意图,包含了信息主体的脱敏意图和获取的脱敏触发条件;
通过第一/第三信息和/或第一/第二脱敏控制集合进行发送和/或保存,使得信息主体传播意图和脱敏意图得以在信息采集、分享、交换等过程中得到传达;
通过脱敏控制集合中的脱敏要求,即可得到场景和要求的不同,同时配合脱敏算法匹配函数,自适应地匹配出满足场景和要求差异的脱敏算法集合;
通过执行信息脱敏测评、集合脱敏测评和抗大数据脱敏评测中的至少一种,从信息本身层面、与信息属于同一主体同一类型的集合层面,以及与信息属于不同主体和/或不同类型的大数据分析层面中的至少一种,进行脱敏测评,进而能够基于脱敏测评结果对第一脱敏算法集合中的脱敏算法和/或脱敏算法的算法参数进行更新修正,从而保障脱敏执行的合规性和脱敏效果。
可以实现分别对首次脱敏和迭代脱敏所有步骤的生成结果及其过程的存证;
所有存证集合和脱敏控制集合的更新方式包括但不限于:按集合更新、按信息主体更新。
基于上述实施例实现的信息脱敏,在信息泛在共享的过程中,具有以下优点:
1.脱敏控制综合考虑信息主体脱敏意图和预建脱敏知识图谱库、脱敏控制集合、信息变化记录集合的约束,使得脱敏控制集合中的脱敏要求既是将脱敏意图归一化处理后的,又是按照适用法律/法规/标准/制度等合规处理后的;既能够让信息所属主体和所有信息接收主体想保护的信息分量都得到脱敏,还能够让数据传播符合法律法规等各级规则要求,又能够抵抗隐私挖掘,防止隐私信息因“短板效应”而泄露;
2.利用脱敏算法匹配函数和脱敏测评函数,利用脱敏算法匹配规则和脱敏控制集合中脱敏算法集合,形成脱敏需求与脱敏算法的映射,筛选并确定脱敏算法集及其种类、算法ID和参数;使得所选脱敏算法能够在脱敏开销与脱敏后的信息可用性之间达成平衡,让信息在传递过程中受控传播和脱敏;
3.完整的脱敏过程存证,为后续完备删除和主被动监管等信息全生命周期、全流程的保护提供良好的存证基础。
下面对本发明提供的敏感信息的流转脱敏装置进行描述,下文描述的敏感信息的流转脱敏装置与上文描述的敏感信息的流转脱敏方法可相互对应参照。
图7是本发明提供的敏感信息的流转脱敏装置的结构示意图,如图7所示,该装置包括:
获取单元710,用于获取第一信息,获取第一脱敏控制集合,所述第一脱敏控制集合基于脱敏意图确定;
脱敏单元720,用于基于所述第一脱敏控制集合,确定脱敏算法集合,基于所述脱敏算法集合,对所述第一信息进行脱敏,得到第三信息;
更新单元730,用于基于所述第一脱敏控制集合,或,基于所述第一脱敏控制集合,以及所述第一信息、所述第三信息和所述脱敏算法集合中的至少一种,确定第二脱敏控制集合。
本发明实施例提供的装置,通过能够表征脱敏意图的第一脱敏控制集合,对第一信息进行脱敏,并基于第一脱敏控制集合,更新得到第二脱敏控制集合,脱敏控制集合在信息传输过程中不断更新,从而指导信息传输全生命周期中各个主体的信息脱敏,有效实现单次/多次转发的脱敏控制,避免因短板效应导致的隐私数据泄露,实现多次转发时的全流程迭代脱敏控制,可以适应信息所属主体和每一个信息接收主体脱敏保护能力差异化的跨系统、生态圈分享等场景。
基于上述任一实施例,获取单元用于:
接收用户输入;
响应于所述用户输入,确定所述用户输入对应的脱敏意图;
基于所述脱敏意图确定对应的脱敏要求,并基于所述脱敏要求确定所述第一脱敏控制集合。
基于上述任一实施例,所述获取单元具体用于:
基于所述第一信息、所述脱敏意图和预建脱敏知识图谱库中的至少一种,确定所述脱敏要求;
基于所述脱敏意图、所述预建脱敏知识图谱库、所述脱敏要求以及接收到的脱敏控制集合中的至少一种,对所述第一信息进行敏感信息识别,得到所述第一信息的敏感信息识别结果;
基于所述脱敏要求和所述敏感信息识别结果,或,基于所述第一信息、所述脱敏要求和所述敏感信息识别结果,确定所述第一脱敏控制集合。
基于上述任一实施例,所述获取单元具体用于:
基于所述脱敏意图和/或预建脱敏知识图谱库,或,基于所述第一信息,以及所述脱敏意图和/或预建脱敏知识图谱库,确定所述脱敏要求;
或者,基于接收到的脱敏控制集合,以及所述脱敏意图、所述预建脱敏知识图谱库和所述第一信息中的至少一种,确定所述脱敏要求。
基于上述任一实施例,所述脱敏要求包括脱敏要求标识、脱敏意图获取时间、脱敏意图获取地点、脱敏意图获取主体、脱敏黑名单、需脱敏保护的信息内容、本次脱敏约束条件、使用约束条件、脱敏传递约束条件、传播约束、测评约束条件、脱敏级别中的至少一种。
基于上述任一实施例,所述用户输入的形式包括按钮、圈出、勾选、标记、按键、滑轮、菜单、语音、视频、眼神、手势、文字、生物电信号、虚拟环境中的至少一种。
基于上述任一实施例,所述脱敏单元用于:
基于所述第一脱敏控制集合,确定第一脱敏算法集合;
基于所述第一脱敏算法集合,对所述第一信息进行脱敏,得到第二信息;
基于所述第二信息,确定所述第三信息,并基于所述第一脱敏算法集合确定所述脱敏算法集合。
基于上述任一实施例,所述脱敏单元具体用于:
基于所述第一脱敏控制集合,或,基于所述第一脱敏控制集合,以及脱敏效果期望和/或脱敏算法脱敏代价,调用脱敏算法匹配函数,得到第一脱敏算法集合。
基于上述任一实施例,所述脱敏单元具体用于:
获取第一信息所对应的应用场景,或,
基于所述第一信息和/或所述第一脱敏控制集合中的敏感信息识别结果,确定所述第一信息所对应的应用场景;
获取历史的脱敏测评结果;
基于第一信息、第一信息所对应的应用场景、历史的脱敏测评结果中的至少一种,确定脱敏效果期望;
基于所述脱敏要求和所述敏感信息识别结果,确定所述待脱敏信息的期望属性;
基于所述脱敏效果期望和期望属性,确定所述第一脱敏算法集合。
基于上述任一实施例,所述脱敏单元具体用于:
基于所述第一信息、第一同类历史信息、第一跨类历史信息、所述第二信息、第二同类历史信息、第二跨类历史信息、信息所属主体、所述第一脱敏控制集合、所述第一脱敏算法集合中的至少一种,确定脱敏测评结果;
若所述脱敏测评结果满足所述第一脱敏控制集合中的脱敏要求,则基于所述第二信息确定所述第三信息,将所述第一脱敏算法集合确定为所述脱敏算法集合;
否则,基于所述脱敏测评结果,更新所述第一脱敏算法集合,并基于更新后的第一脱敏算法集合对所述第一信息进行脱敏,直至所述脱敏测评结果满足所述脱敏要求;
所述第一同类历史信息包括与所述第一信息属于同一主体同一类型的第一历史信息,所述第一跨类历史信息包括与所述第一信息属于不同主体和/或不同类型的第一历史信息;
所述第二同类历史信息包括与所述第二信息属于同一主体同一类型的第二历史信息,所述第二跨类历史信息包括与所述第二信息属于不同主体和/或不同类型的第二历史信息。
基于上述任一实施例,所述脱敏测评结果包括信息脱敏测评结果、集合脱敏测评结果和抗大数据分析脱敏测评结果中的至少一种;
所述脱敏单元具体用于:
基于所述第一信息和所述第二信息,或,基于所述第一信息和所述第二信息,以及历史的信息脱敏测评结果、所述信息所属主体、所述第一脱敏控制集合、所述第一脱敏算法集合中的至少一种,进行信息脱敏测评,得到信息脱敏测评结果;
基于所述第一同类历史信息和所述第二同类历史信息,或,基于所述第一同类历史信息和所述第二同类历史信息,以及所述第一信息、所述第二信息、历史的信息脱敏测评结果、所述信息脱敏测评结果、历史的集合脱敏测评结果、所述信息所属主体、所述第一脱敏控制集合、所述第一脱敏算法集合中的至少一种,进行集合脱敏测评,得到集合脱敏测评结果;
基于所述第一跨类历史信息、所述第二信息和所述第二跨类历史信息,或,基于所述第一跨类历史信息、所述第二信息和所述第二跨类历史信息,以及所述第一信息、历史的信息脱敏测评结果、所述信息脱敏测评结果、历史的集合脱敏测评结果、所述集合脱敏测评结果、历史的抗大数据分析脱敏测评结果、所述信息所属主体、所述第一脱敏控制集合、所述第一脱敏算法集合中的至少一种,进行抗大数据分析脱敏测评,得到抗大数据分析脱敏测评结果。
基于上述任一实施例,所述脱敏单元具体用于:
确定当前脱敏测评结果,所述当前脱敏测评结果是当前完成脱敏测评得到的脱敏测评结果,所述当前脱敏测评结果包括所述信息脱敏测评结果、所述集合脱敏测评结果和所述抗大数据分析脱敏测评结果中的至少一种;
若所述当前脱敏测评结果满足所述第一脱敏控制集合中的脱敏要求,则基于所述第二信息确定所述第三信息,将所述第一脱敏算法集合确定为所述脱敏算法集合。
基于上述任一实施例,所述脱敏单元具体用于:
基于所述第二信息,以及发布时间和/或当前主体,确定所述第三信息。
基于上述任一实施例,所述更新单元具体用于:
基于信息所属主体、所述第一信息和所述第三信息,确定信息变化记录集合;
基于所述第一脱敏控制集合,以及所述脱敏测评结果、所述脱敏算法集合和所述信息变化记录集合中的至少一种,确定第二脱敏控制集合。
基于上述任一实施例,所述更新单元还用于:
发送所述第三信息和/或所述第二脱敏控制集合。
基于上述任一实施例,还包括存证单元,用于:
确定在完成所述脱敏意图、所述第一信息、所述第一脱敏控制集合、所述第一脱敏算法集合、所述脱敏算法集合、第二信息、所述第三信息、所述第二脱敏控制集合和脱敏测评结果中的至少一种过程中的存证集合。
基于上述任一实施例,所述第一脱敏控制集合包括所述第一信息的脱敏要求,或包括所述第一信息的脱敏要求,以及所述第一信息在历史上的脱敏测评结果、脱敏算法集合、信息变化记录集合、原始信息和敏感信息识别结果中的至少一种;
所述第二脱敏控制集合包括所述第三信息的脱敏要求,或包括所述第三信息的脱敏要求,以及所述第二信息在历史上的脱敏测评结果、所述第三信息的脱敏测评结果、脱敏算法集合、信息变化记录集合、原始信息和敏感信息识别结果中的至少一种。
图8示例了一种电子设备的实体结构示意图,如图8所示,该电子设备可以包括:处理器(processor)810、通信接口(Communications Interface)820、存储器(memory)830和通信总线840,其中,处理器810,通信接口820,存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的逻辑指令,以执行敏感信息的流转脱敏方法,该方法包括:获取第一信息,获取第一脱敏控制集合,所述第一脱敏控制集合基于脱敏意图确定;
基于所述第一脱敏控制集合,确定脱敏算法集合,基于所述脱敏算法集合,对所述第一信息进行脱敏,得到第三信息;
基于所述第一脱敏控制集合,或,基于所述第一脱敏控制集合,以及所述第一信息、所述第三信息和所述脱敏算法集合中的至少一种,确定第二脱敏控制集合。
此外,上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的敏感信息的流转脱敏方法,该方法包括:获取第一信息,获取第一脱敏控制集合,所述第一脱敏控制集合基于脱敏意图确定;
基于所述第一脱敏控制集合,确定脱敏算法集合,基于所述脱敏算法集合,对所述第一信息进行脱敏,得到第三信息;
基于所述第一脱敏控制集合,或,基于所述第一脱敏控制集合,以及所述第一信息、所述第三信息和所述脱敏算法集合中的至少一种,确定第二脱敏控制集合。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的敏感信息的流转脱敏方法,该方法包括:获取第一信息,获取第一脱敏控制集合,所述第一脱敏控制集合基于脱敏意图确定;
基于所述第一脱敏控制集合,确定脱敏算法集合,基于所述脱敏算法集合,对所述第一信息进行脱敏,得到第三信息;
基于所述第一脱敏控制集合,或,基于所述第一脱敏控制集合,以及所述第一信息、所述第三信息和所述脱敏算法集合中的至少一种,确定第二脱敏控制集合。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (21)
1.一种敏感信息的流转脱敏方法,其特征在于,包括:
获取第一信息,获取第一脱敏控制集合,所述第一脱敏控制集合基于脱敏意图确定;
基于所述第一脱敏控制集合,确定脱敏算法集合,基于所述脱敏算法集合,对所述第一信息进行脱敏,得到第三信息;
基于所述第一脱敏控制集合,或,基于所述第一脱敏控制集合,以及所述第一信息、所述第三信息和所述脱敏算法集合中的至少一种,确定第二脱敏控制集合。
2.根据权利要求1所述的敏感信息的流转脱敏方法,其特征在于,所述获取第一脱敏控制集合,包括:
接收用户输入;
响应于所述用户输入,确定所述用户输入对应的脱敏意图;
基于所述脱敏意图确定对应的脱敏要求,并基于所述脱敏要求确定所述第一脱敏控制集合。
3.根据权利要求2所述的敏感信息的流转脱敏方法,其特征在于,所述基于所述脱敏意图确定对应的脱敏要求,并基于所述脱敏要求确定所述第一脱敏控制集合,包括:
基于所述第一信息、所述脱敏意图和预建脱敏知识图谱库中的至少一种,确定所述脱敏要求;
基于所述脱敏意图、所述预建脱敏知识图谱库、所述脱敏要求以及接收到的脱敏控制集合中的至少一种,对所述第一信息进行敏感信息识别,得到所述第一信息的敏感信息识别结果;
基于所述脱敏要求和所述敏感信息识别结果,或,基于所述第一信息、所述脱敏要求和所述敏感信息识别结果,确定所述第一脱敏控制集合。
4.根据权利要求3所述的敏感信息的流转脱敏方法,其特征在于,所述基于所述第一信息、所述脱敏意图和预建脱敏知识图谱库中的至少一种,确定所述脱敏要求,包括:
基于所述脱敏意图和/或预建脱敏知识图谱库,或,基于所述第一信息,以及所述脱敏意图和/或预建脱敏知识图谱库,确定所述脱敏要求;
或者,基于接收到的脱敏控制集合,以及所述脱敏意图、所述预建脱敏知识图谱库和所述第一信息中的至少一种,确定所述脱敏要求。
5.根据权利要求2所述的敏感信息的流转脱敏方法,其特征在于,所述脱敏要求包括脱敏要求标识、脱敏意图获取时间、脱敏意图获取地点、脱敏意图获取主体、脱敏黑名单、需脱敏保护的信息内容、本次脱敏约束条件、使用约束条件、脱敏传递约束条件、传播约束、测评约束条件、脱敏级别中的至少一种。
6.根据权利要求2所述的敏感信息的流转脱敏方法,其特征在于,所述用户输入的形式包括按钮、圈出、勾选、标记、按键、滑轮、菜单、语音、视频、眼神、手势、文字、生物电信号、虚拟环境中的至少一种。
7.根据权利要求1所述的敏感信息的流转脱敏方法,其特征在于,所述基于所述第一脱敏控制集合,确定脱敏算法集合,基于所述脱敏算法集合,对所述第一信息进行脱敏,得到第三信息,包括:
基于所述第一脱敏控制集合,确定第一脱敏算法集合;
基于所述第一脱敏算法集合,对所述第一信息进行脱敏,得到第二信息;
基于所述第二信息,确定所述第三信息,并基于所述第一脱敏算法集合确定所述脱敏算法集合。
8.根据权利要求7所述的敏感信息的流转脱敏方法,其特征在于,所述基于所述第一脱敏控制集合,确定第一脱敏算法集合,包括:
基于所述第一脱敏控制集合,或,基于所述第一脱敏控制集合,以及脱敏效果期望和/或脱敏算法脱敏代价,调用脱敏算法匹配函数,得到第一脱敏算法集合。
9.根据权利要求8所述的敏感信息的流转脱敏方法,其特征在于,所述基于所述第一脱敏控制集合,或,基于所述第一脱敏控制集合,以及脱敏效果期望和/或脱敏算法脱敏代价,调用脱敏算法匹配函数,得到第一脱敏算法集合,包括:
获取第一信息所对应的应用场景,或,
基于所述第一信息和/或所述第一脱敏控制集合中的敏感信息识别结果,确定所述第一信息所对应的应用场景;
获取历史的脱敏测评结果;
基于第一信息、第一信息所对应的应用场景、历史的脱敏测评结果中的至少一种,确定脱敏效果期望;
基于脱敏要求和所述敏感信息识别结果,确定待脱敏信息的期望属性;
基于所述脱敏效果期望和期望属性,确定所述第一脱敏算法集合。
10.根据权利要求7所述的敏感信息的流转脱敏方法,其特征在于,所述基于所述第二信息,确定所述第三信息,并基于所述第一脱敏算法集合确定所述脱敏算法集合,包括:
基于所述第一信息、第一同类历史信息、第一跨类历史信息、所述第二信息、第二同类历史信息、第二跨类历史信息、信息所属主体、所述第一脱敏控制集合、所述第一脱敏算法集合中的至少一种,确定脱敏测评结果;
若所述脱敏测评结果满足所述第一脱敏控制集合中的脱敏要求,则基于所述第二信息确定所述第三信息,将所述第一脱敏算法集合确定为所述脱敏算法集合;
否则,基于所述脱敏测评结果,更新所述第一脱敏算法集合,并基于更新后的第一脱敏算法集合对所述第一信息进行脱敏,直至所述脱敏测评结果满足所述脱敏要求;
所述第一同类历史信息包括与所述第一信息属于同一主体同一类型的第一历史信息,所述第一跨类历史信息包括与所述第一信息属于不同主体和/或不同类型的第一历史信息;
所述第二同类历史信息包括与所述第二信息属于同一主体同一类型的第二历史信息,所述第二跨类历史信息包括与所述第二信息属于不同主体和/或不同类型的第二历史信息。
11.根据权利要求10所述的敏感信息的流转脱敏方法,其特征在于,所述脱敏测评结果包括信息脱敏测评结果、集合脱敏测评结果和抗大数据分析脱敏测评结果中的至少一种;
所述基于所述第一信息、第一同类历史信息、第一跨类历史信息、所述第二信息、第二同类历史信息、第二跨类历史信息、信息所属主体、所述第一脱敏控制集合、所述第一脱敏算法集合中的至少一种,确定脱敏测评结果,包括以下步骤中的至少一种:
基于所述第一信息和所述第二信息,或,基于所述第一信息和所述第二信息,以及历史的信息脱敏测评结果、所述信息所属主体、所述第一脱敏控制集合、所述第一脱敏算法集合中的至少一种,进行信息脱敏测评,得到信息脱敏测评结果;
基于所述第一同类历史信息和所述第二同类历史信息,或,基于所述第一同类历史信息和所述第二同类历史信息,以及所述第一信息、所述第二信息、历史的信息脱敏测评结果、所述信息脱敏测评结果、历史的集合脱敏测评结果、所述信息所属主体、所述第一脱敏控制集合、所述第一脱敏算法集合中的至少一种,进行集合脱敏测评,得到集合脱敏测评结果;
基于所述第一跨类历史信息、所述第二信息和所述第二跨类历史信息,或,基于所述第一跨类历史信息、所述第二信息和所述第二跨类历史信息,以及所述第一信息、历史的信息脱敏测评结果、所述信息脱敏测评结果、历史的集合脱敏测评结果、所述集合脱敏测评结果、历史的抗大数据分析脱敏测评结果、所述信息所属主体、所述第一脱敏控制集合、所述第一脱敏算法集合中的至少一种,进行抗大数据分析脱敏测评,得到抗大数据分析脱敏测评结果。
12.根据权利要求11所述的敏感信息的流转脱敏方法,其特征在于,所述若所述脱敏测评结果满足所述第一脱敏控制集合中的脱敏要求,则基于所述第二信息确定所述第三信息,将所述第一脱敏算法集合确定为所述脱敏算法集合,包括:
确定当前脱敏测评结果,所述当前脱敏测评结果是当前完成脱敏测评得到的脱敏测评结果,所述当前脱敏测评结果包括所述信息脱敏测评结果、所述集合脱敏测评结果和所述抗大数据分析脱敏测评结果中的至少一种;
若所述当前脱敏测评结果满足所述第一脱敏控制集合中的脱敏要求,则基于所述第二信息确定所述第三信息,将所述第一脱敏算法集合确定为所述脱敏算法集合。
13.根据权利要求7所述的敏感信息的流转脱敏方法,其特征在于,所述基于所述第二信息确定所述第三信息,包括:
基于所述第二信息,以及发布时间和/或当前主体,确定所述第三信息。
14.根据权利要求1所述的敏感信息的流转脱敏方法,其特征在于,所述基于所述第一脱敏控制集合,或,基于所述第一脱敏控制集合,以及所述第一信息、所述第三信息和所述脱敏算法集合中的至少一种,确定第二脱敏控制集合,包括:
基于信息所属主体、所述第一信息和所述第三信息,确定信息变化记录集合;
基于所述第一脱敏控制集合,以及脱敏测评结果、所述脱敏算法集合和所述信息变化记录集合中的至少一种,确定第二脱敏控制集合。
15.根据权利要求1至14中任一项所述的敏感信息的流转脱敏方法,其特征在于,所述确定第二脱敏控制集合,之后还包括:
发送所述第三信息和/或所述第二脱敏控制集合。
16.根据权利要求1至14中任一项所述的敏感信息的流转脱敏方法,其特征在于,还包括:
确定在完成所述脱敏意图、所述第一信息、所述第一脱敏控制集合、第一脱敏算法集合、所述脱敏算法集合、第二信息、所述第三信息、所述第二脱敏控制集合和脱敏测评结果中的至少一种过程中的存证集合。
17.根据权利要求1至14中任一项所述的敏感信息的流转脱敏方法,其特征在于,所述第一脱敏控制集合包括所述第一信息的脱敏要求,或包括所述第一信息的脱敏要求,以及所述第一信息在历史上的脱敏测评结果、脱敏算法集合、信息变化记录集合、原始信息和敏感信息识别结果中的至少一种;
所述第二脱敏控制集合包括所述第三信息的脱敏要求,或包括所述第三信息的脱敏要求,以及第二信息在历史上的脱敏测评结果、所述第三信息的脱敏测评结果、脱敏算法集合、信息变化记录集合、原始信息和敏感信息识别结果中的至少一种。
18.一种敏感信息的流转脱敏装置,其特征在于,包括:
获取单元,用于获取第一信息,获取第一脱敏控制集合,所述第一脱敏控制集合基于脱敏意图确定;
脱敏单元,用于基于所述第一脱敏控制集合,确定脱敏算法集合,基于所述脱敏算法集合,对所述第一信息进行脱敏,得到第三信息;
更新单元,用于基于所述第一脱敏控制集合,或,基于所述第一脱敏控制集合,以及所述第一信息、所述第三信息、所述脱敏算法集合中的至少一种,确定第二脱敏控制集合。
19.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至17任一项所述敏感信息的流转脱敏方法。
20.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至17任一项所述敏感信息的流转脱敏方法。
21.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至17任一项所述敏感信息的流转脱敏方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210476480.3A CN114925390B (zh) | 2022-04-29 | 2022-04-29 | 敏感信息的流转脱敏方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210476480.3A CN114925390B (zh) | 2022-04-29 | 2022-04-29 | 敏感信息的流转脱敏方法、装置、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114925390A true CN114925390A (zh) | 2022-08-19 |
CN114925390B CN114925390B (zh) | 2024-10-18 |
Family
ID=82806845
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210476480.3A Active CN114925390B (zh) | 2022-04-29 | 2022-04-29 | 敏感信息的流转脱敏方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114925390B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118536164A (zh) * | 2024-07-25 | 2024-08-23 | 大数据安全工程研究中心(贵州)有限公司 | 一种隐私安全保护的数据血缘追踪方法、系统及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107766741A (zh) * | 2017-10-23 | 2018-03-06 | 中恒华瑞(北京)信息技术有限公司 | 数据脱敏系统和方法 |
WO2019114766A1 (zh) * | 2017-12-14 | 2019-06-20 | 中兴通讯股份有限公司 | 一种数据脱敏方法、服务器、终端及计算机可读存储介质 |
CN113268768A (zh) * | 2021-05-24 | 2021-08-17 | 平安普惠企业管理有限公司 | 一种敏感数据的脱敏方法、装置、设备及介质 |
CN113569289A (zh) * | 2021-07-29 | 2021-10-29 | 中国工商银行股份有限公司 | 数据脱敏方法及装置 |
CN114386087A (zh) * | 2021-12-02 | 2022-04-22 | 闪捷信息科技有限公司 | 数据查询处理方法、装置、电子设备和存储介质 |
-
2022
- 2022-04-29 CN CN202210476480.3A patent/CN114925390B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107766741A (zh) * | 2017-10-23 | 2018-03-06 | 中恒华瑞(北京)信息技术有限公司 | 数据脱敏系统和方法 |
WO2019114766A1 (zh) * | 2017-12-14 | 2019-06-20 | 中兴通讯股份有限公司 | 一种数据脱敏方法、服务器、终端及计算机可读存储介质 |
CN113268768A (zh) * | 2021-05-24 | 2021-08-17 | 平安普惠企业管理有限公司 | 一种敏感数据的脱敏方法、装置、设备及介质 |
CN113569289A (zh) * | 2021-07-29 | 2021-10-29 | 中国工商银行股份有限公司 | 数据脱敏方法及装置 |
CN114386087A (zh) * | 2021-12-02 | 2022-04-22 | 闪捷信息科技有限公司 | 数据查询处理方法、装置、电子设备和存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118536164A (zh) * | 2024-07-25 | 2024-08-23 | 大数据安全工程研究中心(贵州)有限公司 | 一种隐私安全保护的数据血缘追踪方法、系统及装置 |
CN118536164B (zh) * | 2024-07-25 | 2024-10-11 | 大数据安全工程研究中心(贵州)有限公司 | 一种隐私安全保护的数据血缘追踪方法、系统及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN114925390B (zh) | 2024-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lastdrager | Achieving a consensual definition of phishing based on a systematic review of the literature | |
CN105447204B (zh) | 网址识别方法和装置 | |
JP2022532677A (ja) | 身元検証及び管理システム | |
RU2674313C2 (ru) | Заполнение записей контактов пользователя | |
KR102633230B1 (ko) | 사건-근접 데이터의 비식별화를 위한 익명화 오버레이 네트워크 | |
CN108306814A (zh) | 基于即时通讯的信息推送方法、装置、终端及存储介质 | |
CN112106049B (zh) | 生成隐私数据隔离和报告的系统和方法 | |
CN109509010B (zh) | 一种多媒体信息处理方法、终端及存储介质 | |
US20180365552A1 (en) | Cognitive communication assistant services | |
CN113010255B (zh) | 基于捆绑会话组的交互方法、装置和计算机设备 | |
CN110837653A (zh) | 标签预测方法、装置以及计算机可读存储介质 | |
JP4622514B2 (ja) | 文書匿名化装置、文書管理装置、文書匿名化方法及び文書匿名化プログラム | |
CN114925390A (zh) | 敏感信息的流转脱敏方法、装置、电子设备和存储介质 | |
CN114529209A (zh) | 用户分配方法、装置、设备及存储介质 | |
US20220327373A1 (en) | Generating navigational target recommendations using parallel neural networks | |
CN110232267B (zh) | 名片显示方法、装置、电子设备及存储介质 | |
WO2023115974A1 (zh) | 多媒体资源推荐、对象表征网络的生成方法及装置 | |
CN111325629A (zh) | 企业投资价值评估方法、装置、服务器及可读存储介质 | |
CN112100534B (zh) | 页面分享中的信息处理方法、装置、介质及电子设备 | |
Khanwalkar | Crime intelligence 2.0: reinforcing crowdsourcing using artificial intelligence and mobile computing | |
CN111158838B (zh) | 一种信息处理方法及装置 | |
CN116483945A (zh) | 内容类型检测方法、装置、设备及存储介质 | |
CN115376504A (zh) | 智能产品的语音交互方法、装置及可读存储介质 | |
CN110019316A (zh) | 信息交互方法和服务器 | |
CN114020195B (zh) | 话术信息的处理方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |