CN113032821A - 数据脱敏方法、装置、电子设备及可读存储介质 - Google Patents

数据脱敏方法、装置、电子设备及可读存储介质 Download PDF

Info

Publication number
CN113032821A
CN113032821A CN201911360005.4A CN201911360005A CN113032821A CN 113032821 A CN113032821 A CN 113032821A CN 201911360005 A CN201911360005 A CN 201911360005A CN 113032821 A CN113032821 A CN 113032821A
Authority
CN
China
Prior art keywords
desensitization
data
text
target object
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911360005.4A
Other languages
English (en)
Inventor
闵洪
李能博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aerospace Network Security Technology Shenzhen Co ltd
Original Assignee
Aerospace Network Security Technology Shenzhen Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aerospace Network Security Technology Shenzhen Co ltd filed Critical Aerospace Network Security Technology Shenzhen Co ltd
Priority to CN201911360005.4A priority Critical patent/CN113032821A/zh
Publication of CN113032821A publication Critical patent/CN113032821A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • G06F21/6254Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification

Abstract

本申请提供了一种数据脱敏方法、装置、电子设备及可读存储介质,涉及数据安全技术领域。其中,该方法包括:识别确定待脱敏目标文本的至少一个脱敏目标对象,确定各个所述脱敏目标对象的类型,基于各个所述脱敏目标对象的类型确定各个所述脱敏目标对象的脱敏规则,基于各个所述脱敏目标对象的脱敏规则对各个所述脱敏对象进行脱敏处理,得到脱敏目标文本。从而实现了待脱敏目标文本的自动脱敏处理,提升了敏感信息脱敏的效率,此外,避免了敏感信息的泄露。

Description

数据脱敏方法、装置、电子设备及可读存储介质
技术领域
本申请涉及数据安全技术领域,具体而言,涉及一种数据脱敏方法、装置、电子设备及可读存储介质。
背景技术
政府、企事业单位累积的数据中包括大量的敏感数据,比如裁判文书中姓名、身份证好、年龄、婚姻、家庭地址以及其他一些隐私信息。这些敏感数据一旦发生泄漏,将会给政府、企事业单元及广大群众带来巨大的损失。因此,在对数据进行共享或公开之前(如裁判文书上网),必须对数据中包括的敏感数据进行脱敏处理,而如何实现敏感数据的脱敏成为了一个问题。
发明内容
基于上述现有技术存在的打车效率低的问题,本申请实施例提供一种数据脱敏方法、装置、设备及存储介质,可以提升打车的效率。
第一方面,本申请实施例提供一种数据脱敏方法,该方法包括:
识别确定待脱敏目标文本的至少一个脱敏目标对象;
确定各个脱敏目标对象的类型;
基于各个脱敏目标对象的类型确定各个脱敏目标对象的脱敏规则;
基于各个脱敏目标对象的脱敏规则对各个脱敏对象进行脱敏处理,得到脱敏目标文本。
可选地,待脱敏文本为司法相关文本。
可选地,所述脱敏目标对象的类型包括:数字型数据、字母型数据、文字型数据。
可选地,所述脱敏规则包括以下至少一项:数据替换、数据无效化、数据随机化、数据重排序。
第二方面,本申请实施例提供一种数据脱敏装置,该装置包括:
识别模块,用于识别确定待脱敏目标文本的至少一个脱敏目标对象;
第一确定模块,用于确定各个所述脱敏目标对象的类型;
第二确定模块,用于基于各个所述脱敏目标对象的类型确定各个所述脱敏目标对象的脱敏规则;
处理模块,用于基于各个所述脱敏目标对象的脱敏规则对各个所述脱敏对象进行脱敏处理,得到脱敏目标文本。
可选地,所述待脱敏文本为司法相关文本。
可选地,所述脱敏目标对象的类型包括:数字型数据、字母型数据、文字型数据。
可选地,所述脱敏规则包括以下至少一项:数据替换、数据无效化、数据随机化、数据重排序。
第三方面,本申请实施例提供一种电子设备,包括:处理器、存储介质和总线,存储介质存储有处理器可执行的机器可读指令,当该设备运行时,处理器与存储介质之间通过总线通信,处理器执行机器可读指令,以执行时执行如第一方面所示的数据脱敏方法的步骤。
第四方面,本申请实施例提供一种存储介质,存储介质上存储有计算机程序,计算机程序被处理器运行时执行如第一方面所示的数据脱敏方法的步骤。
本申请提供了一种数据脱敏方法、装置、电子设备及可读存储介质,本申请通过识别确定待脱敏目标文本的至少一个脱敏目标对象,确定各个所述脱敏目标对象的类型,基于各个所述脱敏目标对象的类型确定各个所述脱敏目标对象的脱敏规则,基于各个所述脱敏目标对象的脱敏规则对各个所述脱敏对象进行脱敏处理,得到脱敏目标文本。从而实现了待脱敏目标文本的自动脱敏处理,提升了敏感信息脱敏的效率,此外,避免了敏感信息的泄露
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例提供的数据脱敏方法的流程示意图;
图2示出了本申请实施例提供的一种数据脱敏装置的结构示意图;
图3示出了本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解,本申请中附图仅起到说明和描述的目的,并不用于限定本申请的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应该理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。
另外,本申请所描述的实施例仅仅是本申请的一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,本申请实施例中将会用到术语“包括”,用于指出其后所声明的特征的存在,但并不排除增加其它的特征。还应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。在本申请的描述中,还需要说明的是,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
图1示出了本申请实施例提供的数据脱敏方法的流程示意图。
如图1所示,该数据脱敏方法可以包括:
步骤S101,识别确定待脱敏目标文本的至少一个脱敏目标对象;
步骤S102,确定各个所述脱敏目标对象的类型;
步骤S103,基于各个所述脱敏目标对象的类型确定各个所述脱敏目标对象的脱敏规则;
步骤S104,基于各个所述脱敏目标对象的脱敏规则对各个所述脱敏对象进行脱敏处理,得到脱敏目标文本。
具体地,可以通过关键字识别或自然语言理解技术,识别确定待脱敏目标文本的至少一个脱敏目标对象。其中,所述待脱敏文本为司法相关文本,其中,脱敏目标对象可以是身份证信息、年龄、性别、地址、姓名以及案件事实信息(如刑事案件中涉及隐私的案件事实信息)。
具体地,可以确定各个所述脱敏目标对象的类型,然后基于各种类型分别对应的脱敏规则进行脱敏处理。其中,所述脱敏目标对象的类型包括但不限于:数字型数据(如身份证号、电话、护照号)、字母型数据(如英文名字等)、文字型数据(如地址、姓名等)。其中,所述脱敏规则包括但不限于以下至少一项:数据替换、数据无效化、数据随机化、数据重排序。其中,可以基于密级的不同,分别选择适应的脱敏规则进行脱敏处理。
本申请提供了一种数据脱敏方法,本申请实施例通过识别确定待脱敏目标文本的至少一个脱敏目标对象,确定各个所述脱敏目标对象的类型,基于各个所述脱敏目标对象的类型确定各个所述脱敏目标对象的脱敏规则,基于各个所述脱敏目标对象的脱敏规则对各个所述脱敏对象进行脱敏处理,得到脱敏目标文本。从而实现了待脱敏目标文本的自动脱敏处理,提升了敏感信息脱敏的效率,此外,避免了敏感信息的泄露。
基于前述方法实施例中所述的数据脱敏方法,对应的,本申请实施例还提供一种数据脱敏装置,图2示出了本申请实施例提供的数据脱敏装置的结构示意图。
如图2所示,该数据脱敏装置可以包括:
识别模块201,用于识别确定待脱敏目标文本的至少一个脱敏目标对象;
第一确定模块202,用于确定各个所述脱敏目标对象的类型;
第二确定模块203,用于基于各个所述脱敏目标对象的类型确定各个所述脱敏目标对象的脱敏规则;
处理模块204,用于基于各个所述脱敏目标对象的脱敏规则对各个所述脱敏对象进行脱敏处理,得到脱敏目标文本。
其中,所述待脱敏文本为司法相关文本。其中,所述脱敏目标对象的类型包括:数字型数据、字母型数据、文字型数据。其中,所述脱敏规则包括但不限于以下至少一项:数据替换、数据无效化、数据随机化、数据重排序。
本申请提供了一种数据脱敏装置,本申请实施例通过识别确定待脱敏目标文本的至少一个脱敏目标对象,确定各个所述脱敏目标对象的类型,基于各个所述脱敏目标对象的类型确定各个所述脱敏目标对象的脱敏规则,基于各个所述脱敏目标对象的脱敏规则对各个所述脱敏对象进行脱敏处理,得到脱敏目标文本。从而实现了待脱敏目标文本的自动脱敏处理,提升了敏感信息脱敏的效率,此外,避免了敏感信息的泄露。
上述装置可以集成于服务器等设备,本申请在此不作限制。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,该数据脱敏装置的具体工作过程,可以参考前述方法实施例中所述的数据脱敏方法的对应过程,本申请中不再赘述。
应该理解,以上所描述的装置实施例仅仅是示意性的,本申请实施例所揭露的装置和方法,也可以通过其它的方式实现。例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。也即,本领域内的技术人员应明白,本申请实施例可以采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式中的任一种实现。
基于此,本申请实施例还提供一种程序产品,该程序产品可以是U盘、移动硬盘、ROM、RAM、磁碟或者光盘等存储介质,存储介质上可以存储有计算机程序,计算机程序被处理器运行时执行如前述方法实施例中所述的数据脱敏方法的步骤。具体实现方式和技术效果类似,在此不再赘述。
另外,本申请实施例还提供一种电子设备,该电子设备可以是上述个人计算机、服务器、或者网络设备等具有数据处理能力的设备,图3示出了本申请实施例提供的电子设备的结构示意图。
如图3所示,该电子设备可以包括:处理器31、存储介质32和总线33,存储介质32存储有处理器31可执行的机器可读指令,当电子设备运行时,处理器31与存储介质32之间通过总线33通信,处理器31执行机器可读指令,以执行时执行如前述方法实施例中的数据脱敏方法的步骤。具体实现方式和技术效果类似,在此同样不再赘述。
为了便于说明,在上述电子设备中仅描述了一个处理器。然而,应当注意,一些实施例中,本申请中的电子设备还可以包括多个处理器,因此本申请中描述的一个处理器执行的步骤也可以由多个处理器联合执行或单独执行。
以上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种数据脱敏方法,其特征在于,包括:
识别确定待脱敏目标文本的至少一个脱敏目标对象;
确定各个所述脱敏目标对象的类型;
基于各个所述脱敏目标对象的类型确定各个所述脱敏目标对象的脱敏规则;
基于各个所述脱敏目标对象的脱敏规则对各个所述脱敏对象进行脱敏处理,得到脱敏目标文本。
2.根据权利要求1所述的方法,其特征在于,所述待脱敏文本为司法相关文本。
3.根据权利要求1所述的方法,其特征在于,所述脱敏目标对象的类型包括:数字型数据、字母型数据、文字型数据。
4.根据权利要求1所述的方法,其特征在于,所述脱敏规则包括以下至少一项:数据替换、数据无效化、数据随机化、数据重排序。
5.一种数据脱敏装置,其特征在于,该装置包括:
识别模块,用于识别确定待脱敏目标文本的至少一个脱敏目标对象;
第一确定模块,用于确定各个所述脱敏目标对象的类型;
第二确定模块,用于基于各个所述脱敏目标对象的类型确定各个所述脱敏目标对象的脱敏规则;
处理模块,用于基于各个所述脱敏目标对象的脱敏规则对各个所述脱敏对象进行脱敏处理,得到脱敏目标文本。
6.根据权利要求5所述的装置,其特征在于,所述待脱敏文本为司法相关文本。
7.根据权利要求5所述的装置,其特征在于,所述脱敏目标对象的类型包括:数字型数据、字母型数据、文字型数据。
8.根据权利要求5-7任一项所述的装置,其特征在于,所述脱敏规则包括以下至少一项:数据替换、数据无效化、数据随机化、数据重排序。
9.一种电子设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当所述电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行时执行如权利要求1至4任一项所述的数据脱敏方法的步骤。
10.一种可读存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至4任一项所述的数据脱敏方法的步骤。
CN201911360005.4A 2019-12-25 2019-12-25 数据脱敏方法、装置、电子设备及可读存储介质 Pending CN113032821A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911360005.4A CN113032821A (zh) 2019-12-25 2019-12-25 数据脱敏方法、装置、电子设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911360005.4A CN113032821A (zh) 2019-12-25 2019-12-25 数据脱敏方法、装置、电子设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN113032821A true CN113032821A (zh) 2021-06-25

Family

ID=76458872

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911360005.4A Pending CN113032821A (zh) 2019-12-25 2019-12-25 数据脱敏方法、装置、电子设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN113032821A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113742763A (zh) * 2021-11-08 2021-12-03 中关村科技软件股份有限公司 一种基于政务敏感数据混淆加密方法及系统
CN115050390A (zh) * 2022-08-12 2022-09-13 杭州海康威视数字技术股份有限公司 一种语音隐私保护方法、装置、电子设备及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113742763A (zh) * 2021-11-08 2021-12-03 中关村科技软件股份有限公司 一种基于政务敏感数据混淆加密方法及系统
CN115050390A (zh) * 2022-08-12 2022-09-13 杭州海康威视数字技术股份有限公司 一种语音隐私保护方法、装置、电子设备及存储介质
CN115050390B (zh) * 2022-08-12 2022-12-06 杭州海康威视数字技术股份有限公司 一种语音隐私保护方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN108334533B (zh) 关键词提取方法和装置、存储介质及电子装置
CN109388965B (zh) 一种混合数据的脱敏方法及系统
CN110826006B (zh) 基于隐私数据保护的异常采集行为识别方法和装置
CN106713579B (zh) 一种电话号码识别方法及装置
CN108092963B (zh) 网页识别方法、装置、计算机设备及存储介质
WO2019062081A1 (zh) 业务员画像形成方法、电子装置及计算机可读存储介质
CN109345417B (zh) 基于身份认证的业务人员的在线考核方法及终端设备
CN107809371B (zh) 共享资源显示方法及装置
CN110929125A (zh) 搜索召回方法、装置、设备及其存储介质
CN110765760B (zh) 一种法律案件分配方法、装置、存储介质和服务器
CN113032821A (zh) 数据脱敏方法、装置、电子设备及可读存储介质
CN116366338A (zh) 一种风险网站识别方法、装置、计算机设备及存储介质
KR20140066686A (ko) 주소록에 추가하고자 하는 명함이 존재하는지 여부를 판단하는 방법
CN110175318B (zh) 一种保险理赔附件生成方法及装置
CN113051601A (zh) 敏感数据识别方法、装置、设备和介质
CN110728585A (zh) 核保方法、装置、设备及存储介质
CN110555589A (zh) 风险订单识别方法及装置
CN113987206A (zh) 异常用户的识别方法、装置、设备及存储介质
CN107066623A (zh) 一种文章合并方法及装置
CN113221786A (zh) 数据分类方法及装置、电子设备和存储介质
CN113779198A (zh) 基于人工智能的电子名片生成方法、装置、设备及介质
CN110009386B (zh) 用户分类方法、装置、计算机设备及存储介质
CN112800460A (zh) 合同文件敏感数据的脱敏方法及系统
US9171232B2 (en) Method and system for a selection of a solution technique for a task
CN108924126B (zh) 骗保用户终端的鉴别方法、装置、设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210625