CN110889136A - 一种地址信息的数据脱敏方法、装置和电子设备 - Google Patents

一种地址信息的数据脱敏方法、装置和电子设备 Download PDF

Info

Publication number
CN110889136A
CN110889136A CN201911130832.4A CN201911130832A CN110889136A CN 110889136 A CN110889136 A CN 110889136A CN 201911130832 A CN201911130832 A CN 201911130832A CN 110889136 A CN110889136 A CN 110889136A
Authority
CN
China
Prior art keywords
address information
desensitization
code
desensitized
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911130832.4A
Other languages
English (en)
Other versions
CN110889136B (zh
Inventor
吴东洋
范渊
黄进
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dbappsecurity Technology Co Ltd
Original Assignee
Hangzhou Dbappsecurity Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dbappsecurity Technology Co Ltd filed Critical Hangzhou Dbappsecurity Technology Co Ltd
Priority to CN201911130832.4A priority Critical patent/CN110889136B/zh
Publication of CN110889136A publication Critical patent/CN110889136A/zh
Application granted granted Critical
Publication of CN110889136B publication Critical patent/CN110889136B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • G06F21/6254Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Remote Sensing (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供了一种地址信息的数据脱敏方法、装置和电子设备,涉及数据处理的技术领域,包括:获取待脱敏的地址信息,并将地址信息转换为代码地址信息,其中,代码地址信息包括:地址信息所对应的行政区划代码和地址信息中的详细地址信息,然后基于预设脱敏规则对代码地址信息进行脱敏,得到脱敏后的代码地址信息,并根据脱敏后的代码地址信息确定脱敏后地址信息。本发明方法能够在不改变地址格式的同时,对待脱敏地址信息进行有效脱敏,保护了待脱敏地址信息的安全,从而缓解了现有技术中的的地址信息脱敏方法存在的安全性差的技术问题。

Description

一种地址信息的数据脱敏方法、装置和电子设备
技术领域
本发明涉及数据处理的技术领域,尤其是涉及一种地址信息的数据脱敏方法、装置和电子设备。
背景技术
在互联网高速发展的时代,个人、企业等的大量数据存在于各个系统之中,其中更是涉及到很多的隐私信息,地址信息在日常生活中是暴露最多的隐私信息,最常见的就是快递单、外卖单上的收货地址,如果处理不当,很容易造成信息安全隐患,因此,如何合理的处理敏感数据,就显得更加关键。现有技术中,在对地址信息进行展示时,大多是仅省略部分字符的简单处理,这样的数据虽然可读性高,但是很容易被人利用、反脱敏得到真实数据。
综上所述,现有技术中的地址信息脱敏方法存在安全性差的技术问题。
发明内容
本发明的目的在于提供一种地址信息的数据脱敏方法、装置和电子设备,以缓解了现有技术中的地址信息脱敏方法存在的安全性差的技术问题。
第一方面,实施例提供一种地址信息的数据脱敏方法,应用于客户端设备,包括:获取待脱敏的地址信息;将所述地址信息转换为代码地址信息,其中,所述代码地址信息包括:所述地址信息所对应的行政区划代码和所述地址信息中的详细地址信息;基于预设脱敏规则对所述代码地址信息进行脱敏,得到脱敏后的代码地址信息,并根据所述脱敏后的代码地址信息确定脱敏后地址信息。
在可选的实施方式中,将所述地址信息转换为代码地址信息,包括:将所述地址信息进行拆分,得到省信息、市信息、县信息和详细地址信息;将所述省信息、所述市信息和所述县信息转换为对应的行政区划代码,得到所述地址信息所对应的行政区划代码;根据所述地址信息所对应的行政区划代码和所述详细地址信息确定所述代码地址信息。
在可选的实施方式中,基于预设脱敏规则对所述代码地址信息进行脱敏,得到脱敏后的代码地址信息,包括:获取预设脱敏等级,其中,所述预设脱敏等级包括以下任一种:省级脱敏、市级脱敏、县级脱敏;基于所述预设脱敏等级在预设行政区划代码库中随机选择目标代码作为脱敏后的行政区划代码;将所述详细地址信息中处于目标位置的连续n个字符均替换为预设数量个特殊字符,得到脱敏后的详细地址信息;根据所述脱敏后的行政区划代码和所述脱敏后的详细地址信息确定所述脱敏后的代码地址信息。
在可选的实施方式中,基于预设脱敏规则对所述代码地址信息进行脱敏,得到脱敏后的代码地址信息,包括:在预设代码替换库中查询与所述地址信息所对应的行政区划代码相匹配的目标区划代码,并将所述目标区划代码作为脱敏后的行政区划代码;将所述详细地址信息中处于目标位置的连续m个字符均替换为预设数量个特殊字符,得到脱敏后的详细地址信息;根据所述脱敏后的行政区划代码和所述脱敏后的详细地址信息确定所述脱敏后的代码地址信息。
在可选的实施方式中,所述方法还包括:响应用户的脱敏规则新增操作,根据所述脱敏规则新增操作将新增脱敏规则添加到预设脱敏规则库中;和/或响应用户的脱敏规则修改操作,根据所述脱敏规则修改操作将修改后的脱敏规则更新至所述预设脱敏规则库中。
第二方面,实施例提供一种地址信息的数据脱敏装置,包括:获取模块,用于获取待脱敏的地址信息;转换模块,用于将所述地址信息转换为代码地址信息,其中,所述代码地址信息包括:所述地址信息所对应的行政区划代码和所述地址信息中的详细地址信息;脱敏模块,用于基于预设脱敏规则对所述代码地址信息进行脱敏,得到脱敏后的代码地址信息;确定模块,用于根据所述脱敏后的代码地址信息确定脱敏后地址信息。
在可选的实施方式中,所述转换模块包括:拆分单元,用于将所述地址信息进行拆分,得到省信息、市信息、县信息和详细地址信息;转换单元,用于将所述省信息、所述市信息和所述县信息转换为对应的行政区划代码,得到所述地址信息所对应的行政区划代码;第一确定单元,用于根据所述地址信息所对应的行政区划代码和所述详细地址信息确定所述代码地址信息。
在可选的实施方式中,所述脱敏模块包括:获取单元,用于获取预设脱敏等级,其中,所述预设脱敏等级包括以下任一种:省级脱敏、市级脱敏、县级脱敏;选择单元,用于基于所述预设脱敏等级在预设行政区划代码库中随机选择目标代码作为脱敏后的行政区划代码;第一替换单元,用于将所述详细地址信息中处于目标位置的连续n个字符均替换为预设数量个特殊字符,得到脱敏后的详细地址信息;第二确定单元,用于根据所述脱敏后的行政区划代码和所述脱敏后的详细地址信息确定所述脱敏后的代码地址信息。
第三方面,实施例提供一种电子设备,包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述前述实施方式中任一项所述的方法的步骤。
第四方面,实施例提供一种具有处理器可执行的非易失的程序代码的计算机可读介质,所述程序代码使所述处理器执行前述实施方式中任一项所述的方法。
现有技术中,在对地址信息进行展示时,大多是仅省略部分字符的简单处理,这样的数据虽然可读性高,但是很容易被人利用、反脱敏得到真实数据。与现有技术相比,本发明提供了一种地址信息的数据脱敏方法,首先获取待脱敏的地址信息,并将地址信息转换为代码地址信息,其中,代码地址信息包括:地址信息所对应的行政区划代码和地址信息中的详细地址信息,然后基于预设脱敏规则对代码地址信息进行脱敏,得到脱敏后的代码地址信息,并根据脱敏后的代码地址信息确定脱敏后地址信息。本发明方法能够在不改变地址格式的同时,对待脱敏地址信息进行有效脱敏,保护了待脱敏地址信息的安全,从而缓解了现有技术中的地址信息脱敏方法存在的安全性差的技术问题。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种地址信息的数据脱敏方法的流程图;
图2为本发明实施例提供的一种将地址信息转换为代码地址信息的流程图;
图3为本发明实施例提供的一种基于预设脱敏规则对代码地址信息进行脱敏,得到脱敏后的代码地址信息的流程图;
图4为本发明实施例提供的另一种基于预设脱敏规则对代码地址信息进行脱敏,得到脱敏后的代码地址信息的流程图;
图5为本发明实施例提供的一种地址信息的数据脱敏装置的功能模块图;
图6为本发明实施例提供的一种电子设备的示意图。
图标:100-获取模块;200-转换模块;300-脱敏模块;400-确定模块;60-处理器;61-存储器;62-总线;63-通信接口。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合附图,对本发明的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
数据脱敏,具体指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。地址信息,在日常生活中,处处都可能暴露,最常见的就是快递单、外卖单上面赤裸裸的收货地址,还有一些公众网站,也暴露着个人的地址信息,如果处理不当,或者被有心人利用,就容易对个人造成一定的安全隐患。
假设待脱敏的地址信息为:广东省深圳市南山区科技园100号某大楼1001室,现有技术中的一些脱敏技术对上述地址信息进行脱敏后,得到的可以为:广东省深圳市南山区科技园***号***大楼***室、广东省**南山区***大楼***等等,这样的脱敏后的数据,在可读性高的同时,数据容易被反推,但是若仅仅展示广东省***,可读性又大大降低了。因此,合理处理敏感数据,在这互联网时代显得更加关键,选择合适的地址数据脱敏技术至关重要。有鉴于此,本发明实施例提供了一种地址信息的数据脱敏方法。
实施例一
本发明实施例提供了一种地址信息的数据脱敏方法,应用于客户端设备,如图1所示,该方法具体包括如下步骤:
步骤S11,获取待脱敏的地址信息。
步骤S12,将地址信息转换为代码地址信息。
具体的,本发明实施例提供的地址信息的数据脱敏方法应用于客户端设备,要对地址信息进行脱敏,用户可以通过上述客户端设备的交互界面输入待脱敏的地址信息,进而使得客户端设备获取待脱敏的地址信息,其他终端设备也可以通过调用客户端设备的方式给客户端设备提供待脱敏的地址信息,本发明实施例不对客户端设备获取待脱敏的地址信息的方式进行具体限制。客户端设备在获取到待脱敏的地址信息后,将上述地址信息转换为对应的代码地址信息,其中,待脱敏的地址信息一般结构是省/市/区(县)/详细地址,代码地址信息包括:地址信息所对应的行政区划代码和地址信息中的详细地址信息。
其中,行政区划代码是指用六位阿拉伯数字分层次代表我国的省(自治区、直辖市)、市(地区、州、盟)、县(区、市、旗)的名称,第一、二位表示省(自治区、直辖市、特别行政区),第三、四位表示市(地区、自治州、盟及国家直辖市所属市辖区和县的汇总码),第五、六位表示县(市辖区、县级市、旗);详细地址信息就是指上述地址信息中除了省(自治区、直辖市)、市(地区、州、盟)、县(区、市、旗)的信息之外的剩余信息。
例如,若待脱敏地址信息为:“广东省深圳市南山区科技园100号某大楼1001室”,那么地址信息所对应的行政区划代码就是指“广东省深圳市南山区”对应的行政区划代码“440305”,且该地址信息对应的详细地址信息为“科技园100号某大楼1001室”。也就是说,代码地址信息为440305科技园100号某大楼1001室。
需要说明的是,地址信息所对应的行政区划代码可以为“440305”的表现形式,也可以为“440000/440300/440305”的表现形式,其中,“440000”代表广东省,“440300”代表广东省深圳市,“440305”代表“广东省深圳市南山区”,鉴于“440305”能够清楚完整的表示地址信息中除详细地址信息之外的部分信息,所以本发明实施例中仅以“440305”的表现形式进行说明,用户可以根据实际的开发逻辑以及数据库的设置进行适应性修改。
步骤S13,基于预设脱敏规则对代码地址信息进行脱敏,得到脱敏后的代码地址信息,并根据脱敏后的代码地址信息确定脱敏后地址信息。
进一步的,在获取到代码地址信息后,利用预设脱敏规则对上述代码地址信息进行脱敏,进而得到脱敏后的代码地址信息,然后再将脱敏后的代码地址信息转换为脱敏后地址信息,进而完成了整个地址信息的脱敏过程。
现有技术中,在对地址信息进行展示时,大多是仅省略部分字符的简单处理,这样的数据虽然可读性高,但是很容易被人利用、反脱敏得到真实数据。与现有技术相比,本发明提供了一种地址信息的数据脱敏方法,首先获取待脱敏的地址信息,并将地址信息转换为代码地址信息,其中,代码地址信息包括:地址信息所对应的行政区划代码和地址信息中的详细地址信息,然后基于预设脱敏规则对代码地址信息进行脱敏,得到脱敏后的代码地址信息,并根据脱敏后的代码地址信息确定脱敏后地址信息。本发明方法能够在不改变地址格式的同时,对待脱敏地址信息进行有效脱敏,保护了待脱敏地址信息的安全,从而缓解了现有技术中的地址信息脱敏方法存在的安全性差的技术问题。
上文中对地址信息的数据脱敏方法进行了简要的描述,下面对如何确定代码地址信息的过程进行详细的介绍。
在一个可选的实施方式中,如图2所示,上述步骤S12,将地址信息转换为代码地址信息,具体包括如下步骤:
步骤S121,将地址信息进行拆分,得到省信息、市信息、县信息和详细地址信息。
步骤S122,将省信息、市信息和县信息转换为对应的行政区划代码,得到地址信息所对应的行政区划代码。
步骤S123,根据地址信息所对应的行政区划代码和详细地址信息确定代码地址信息。
具体的,客户端设备在获取到地址信息后,要将地址信息转换为代码地址信息,首先需要将地址信息进行解析并拆分,得到对应的省信息、市信息、县信息和详细地址信息,在一些实施例中,可采用字符匹配的手段得到上述信息,进一步的,再将省信息、市信息和县信息转换为对应的行政区划代码,该行政区划代码为国家统一设置,客户端设备可以设计预设行政区划代码库将全国行政区划代码进行存储,在拆分得到省信息、市信息和县信息后通过在预设行政区划代码库中匹配,即可得到对应的行政区划代码,例如:“广东省深圳市南山区”对应的行政区划代码为“440305”,“江苏省南京市玄武区”对应的行政区划代码为“320101”。
在得到地址信息所对应的行政区划代码后,将其与详细地址信息进行组合,即可确定代码地址信息。
上文中已经对如何确定代码地址信息的过程进行了详细的描述,下面对基于预设脱敏规则对代码地址信息进行脱敏,得到脱敏后的代码地址信息的过程进行具体介绍。
在一个可选的实施方式中,如图3所示,上述步骤S13中基于预设脱敏规则对代码地址信息进行脱敏,得到脱敏后的代码地址信息,具体包括如下步骤:
步骤S21,获取预设脱敏等级。
具体的,在对代码地址信息进行脱敏时,首先获取预设脱敏等级,其中,预设脱敏等级包括以下任一种:省级脱敏、市级脱敏、县级脱敏。省级脱敏是指脱敏后的地址信息中的省信息、市信息以及县信息均与待脱敏的地址信息不同;市级脱敏是指脱敏后的地址信息中的省信息与待脱敏的地址信息中的省信息相同,但市信息以及县信息均与待脱敏的地址信息不同;县级脱敏是指脱敏后的地址信息中的省信息、市信息与待脱敏的地址信息中的省信息、市信息相同,但县信息与待脱敏的地址信息不同。
步骤S22,基于预设脱敏等级在预设行政区划代码库中随机选择目标代码作为脱敏后的行政区划代码。
进一步的,在确定了预设脱敏等级后,即可在预设行政区划代码库中随机选择目标代码(符合预设脱敏等级条件的行政区划代码)作为脱敏后的行政区划代码。为了便于理解,下面举例说明:
若代码地址信息中的行政区划代码为“440305”,且预设脱敏等级为省级脱敏,那么在预设行政区划代码库中选择目标代码时,除了以“44”开头的六位行政区划代码(44XXXX)不满足条件,剩余的其他行政区划代码都具有相同的概率被选为目标代码;若预设脱敏等级为市级脱敏,那么在预设行政区划代码库中选择目标代码时,就需要在“44”开头的六位行政区划代码(44XXXX)中选择除“4403XX”之外的其他行政区划代码;若预设脱敏等级为县级脱敏,那么在预设行政区划代码库中选择目标代码时,就需要在“4403”开头的六位行政区划代码(4403XX)中选择除“440305”之外的其他行政区划代码。
步骤S23,将详细地址信息中处于目标位置的连续n个字符均替换为预设数量个特殊字符,得到脱敏后的详细地址信息。
在得到脱敏后的行政区划代码后,本发明施例选择将详细地址信息中处于目标位置的连续n个字符均替换为预设数量个特殊字符,其中,目标位置可以选择详细地址信息的开头,中间或结尾,本发明实施不对其进行具体限制,优选的,选择中间作为目标位置,n的取值可以根据实际情况进行设置,若要脱敏后的地址信息更简短,可以将详细地址信息中的首尾各留出2-3个字符,将其余的中间信息均替换为预设数量个特殊字符,优选的,替换为3个*或者3个#;n还可以设置为取详细地址信息字符的1/3并取整,例如,若详细地址信息为16个字符,则n取值为5,即可将详细地址信息中的第6-10个字符或者7-11个字符替换为3个*或者3个#。
步骤S24,根据脱敏后的行政区划代码和脱敏后的详细地址信息确定脱敏后的代码地址信息。
进一步的,将得到的脱敏后的行政区划代码和脱敏后的详细地址信息进行组合,即可得到脱敏后的代码地址信息,例如,代码地址信息为“440305/科技园100号某大楼1001室”,且脱敏等级为市级脱敏,则一种可选的脱敏后的代码地址信息为“440103/科技园***1室”。
进一步的,将脱敏后的代码地址信息转换为脱敏后地址信息,行政区划代码“440103”对应“广东省广州市荔湾区”,即脱敏后地址信息为“广东省广州市荔湾区科技园***1室”。
为了能够支持脱敏后的地址信息执行反脱敏,还原待脱敏的地址信息中的行政区划代码,选择目标代码时,用户可以设置预设的替换规则,以支持反脱敏,本发明实施例不对替换规则进行具体限制,若用户无需进行反脱敏的步骤,即可随机选择目标代码。
上文中介绍了一种基于预设脱敏规则对代码地址信息进行脱敏的实施方式,下面介绍另一种基于预设脱敏规则对代码地址信息进行脱敏,得到脱敏后的代码地址信息的方法,如图4所示,具体包括如下步骤:
步骤S31,在预设代码替换库中查询与地址信息所对应的行政区划代码相匹配的目标区划代码,并将目标区划代码作为脱敏后的行政区划代码。
本发明实施例中,设置了预设代码替换库,该预设代码替换库中为每个行政区划代码均设置了对应的脱敏后的行政区划代码,也就是说,脱敏关系是固定的,例如“440305”在进行脱敏时将被固定替换为“440106”,“330723”在进行脱敏时将被固定替换为“440304”,所以在确定了代码地址信息后,可在预设代码替换库中查询与之相匹配的目标区划代码,并将目标区划代码作为脱敏后的行政区划代码。
步骤S32,将详细地址信息中处于目标位置的连续m个字符均替换为预设数量个特殊字符,得到脱敏后的详细地址信息。
步骤S33,根据脱敏后的行政区划代码和脱敏后的详细地址信息确定脱敏后的代码地址信息。
详细地址信息的处理方式与前述脱敏规则适用相同的方法,此处不再赘述,m的取值也是可以根据实际需求进行适应性设置的。本实施方式中设置了预设代码替换库,能够支持行政区划代码的反脱敏。
例如,代码地址信息为“440305/科技园100号某大楼1001室”,且“440305”在进行脱敏时将被固定替换为“440106”,则脱敏后的代码地址信息为“440106/科技园***1室”,其中,详细地址信息部分可根据实际情况进行调整,也即,脱敏后地址信息为“广东省广州市天河区科技园***1室”。
另外,在得到代码地址信息后,用户也可以选择使用现有的脱敏算法对其进行脱敏,可选择的有Hiding算法、Hashing算法、Permutation算法、Shift算法、Enumeration算法、Truncation算法、Prefix-preserving算法、Mask算法或Floor算法,本发明实施例不再对现有脱敏算法的实施方式进行赘述。
在一个可选的实施方式中,本发明方法还包括以下内容:
响应用户的脱敏规则新增操作,根据脱敏规则新增操作将新增脱敏规则添加到预设脱敏规则库中;和/或响应用户的脱敏规则修改操作,根据脱敏规则修改操作将修改后的脱敏规则更新至预设脱敏规则库中。
具体的,本发明实施例的客户端设备支持预设脱敏规则的新增与修改,用户可以通过交互界面进行新增操作和/或修改操作,客户端设备能够响应上述用户操作,并对预设脱敏规则库进行新增和/或修改,可以实时的动态改变脱敏规则、切换脱敏规则,让地址信息的脱敏更加灵活多变。
综上所述,本发明实施例提供的地址信息的数据脱敏方法能够对待脱敏的地址信息进行高效的随机或固定脱敏,在不改变地址信息格式的同时,对待脱敏地址信息进行有效脱敏,针对反脱敏,脱敏后的地址信息能很好保护源地址信息的安全,从而缓解了现有技术中的地址信息脱敏方法存在的安全性差的技术问题。
实施例二
本发明实施例还提供了一种地址信息的数据脱敏装置,该地址信息的数据脱敏装置主要用于执行上述实施例一所提供的地址信息的数据脱敏方法,以下对本发明实施例提供的地址信息的数据脱敏装置做具体介绍。
图5是本发明实施例提供的一种地址信息的数据脱敏装置的功能模块图,如图5所示,该装置主要包括:获取模块100,转换模块200;脱敏模块300,确定模块400,其中:
获取模块100,用于获取待脱敏的地址信息。
转换模块200,用于将地址信息转换为代码地址信息,其中,代码地址信息包括:地址信息所对应的行政区划代码和地址信息中的详细地址信息。
脱敏模块300,用于基于预设脱敏规则对代码地址信息进行脱敏,得到脱敏后的代码地址信息。
确定模块400,用于根据脱敏后的代码地址信息确定脱敏后地址信息。
现有技术中,在对地址信息进行展示时,大多是仅省略部分字符的简单处理,这样的数据虽然可读性高,但是很容易被人利用、反脱敏得到真实数据。与现有技术相比,本发明提供了一种地址信息的数据脱敏装置,首先获取待脱敏的地址信息,并将地址信息转换为代码地址信息,其中,代码地址信息包括:地址信息所对应的行政区划代码和地址信息中的详细地址信息,然后基于预设脱敏规则对代码地址信息进行脱敏,得到脱敏后的代码地址信息,并根据脱敏后的代码地址信息确定脱敏后地址信息。本发明装置能够在不改变地址格式的同时,对待脱敏地址信息进行有效脱敏,保护了待脱敏地址信息的安全,从而缓解了现有技术中的地址信息脱敏方法存在的安全性差的技术问题。
可选的,转换模块200包括:
拆分单元,用于将地址信息进行拆分,得到省信息、市信息、县信息和详细地址信息。
转换单元,用于将省信息、市信息和县信息转换为对应的行政区划代码,得到地址信息所对应的行政区划代码。
第一确定单元,用于根据地址信息所对应的行政区划代码和详细地址信息确定代码地址信息。
可选的,脱敏模块300包括:
获取单元,用于获取预设脱敏等级,其中,预设脱敏等级包括以下任一种:省级脱敏、市级脱敏、县级脱敏。
选择单元,用于基于预设脱敏等级在预设行政区划代码库中随机选择目标代码作为脱敏后的行政区划代码。
第一替换单元,用于将详细地址信息中处于目标位置的连续n个字符均替换为预设数量个特殊字符,得到脱敏后的详细地址信息。
第二确定单元,用于根据脱敏后的行政区划代码和脱敏后的详细地址信息确定脱敏后的代码地址信息。
可选的,脱敏模块300包括:
查询单元,用于在预设代码替换库中查询与地址信息所对应的行政区划代码相匹配的目标区划代码,并将目标区划代码作为脱敏后的行政区划代码。
第二替换单元,用于将详细地址信息中处于目标位置的连续m个字符均替换为预设数量个特殊字符,得到脱敏后的详细地址信息。
第三确定单元,根据脱敏后的行政区划代码和脱敏后的详细地址信息确定脱敏后的代码地址信息。
可选的,该装置还用于:
响应用户的脱敏规则新增操作,根据脱敏规则新增操作将新增脱敏规则添加到预设脱敏规则库中;和/或响应用户的脱敏规则修改操作,根据脱敏规则修改操作将修改后的脱敏规则更新至预设脱敏规则库中。
实施例三
参见图6,本发明实施例提供了一种电子设备,该电子设备包括:处理器60,存储器61,总线62和通信接口63,所述处理器60、通信接口63和存储器61通过总线62连接;处理器60用于执行存储器61中存储的可执行模块,例如计算机程序。
其中,存储器61可能包含高速随机存取存储器(RAM,RandomAccessMemory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口63(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。
总线62可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器61用于存储程序,所述处理器60在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流过程定义的装置所执行的方法可以应用于处理器60中,或者由处理器60实现。
处理器60可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器60中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器60可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital SignalProcessing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器61,处理器60读取存储器61中的信息,结合其硬件完成上述方法的步骤。
本发明实施例所提供的一种地址信息的数据脱敏方法、装置和电子设备的计算机程序产品,包括存储了处理器可执行的非易失的程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该发明产品使用时惯常摆放的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
此外,术语“水平”、“竖直”、“悬垂”等术语并不表示要求部件绝对水平或悬垂,而是可以稍微倾斜。如“水平”仅仅是指其方向相对“竖直”而言更加水平,并不是表示该结构一定要完全水平,而是可以稍微倾斜。
在本发明的描述中,还需要说明的是,除非另有明确的规定和限定,术语“设置”、“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种地址信息的数据脱敏方法,其特征在于,应用于客户端设备,包括:
获取待脱敏的地址信息;
将所述地址信息转换为代码地址信息,其中,所述代码地址信息包括:所述地址信息所对应的行政区划代码和所述地址信息中的详细地址信息;
基于预设脱敏规则对所述代码地址信息进行脱敏,得到脱敏后的代码地址信息,并根据所述脱敏后的代码地址信息确定脱敏后地址信息。
2.根据权利要求1所述的方法,其特征在于,将所述地址信息转换为代码地址信息,包括:
将所述地址信息进行拆分,得到省信息、市信息、县信息和详细地址信息;
将所述省信息、所述市信息和所述县信息转换为对应的行政区划代码,得到所述地址信息所对应的行政区划代码;
根据所述地址信息所对应的行政区划代码和所述详细地址信息确定所述代码地址信息。
3.根据权利要求1所述的方法,其特征在于,基于预设脱敏规则对所述代码地址信息进行脱敏,得到脱敏后的代码地址信息,包括:
获取预设脱敏等级,其中,所述预设脱敏等级包括以下任一种:省级脱敏、市级脱敏、县级脱敏;
基于所述预设脱敏等级在预设行政区划代码库中随机选择目标代码作为脱敏后的行政区划代码;
将所述详细地址信息中处于目标位置的连续n个字符均替换为预设数量个特殊字符,得到脱敏后的详细地址信息;
根据所述脱敏后的行政区划代码和所述脱敏后的详细地址信息确定所述脱敏后的代码地址信息。
4.根据权利要求1所述的方法,其特征在于,基于预设脱敏规则对所述代码地址信息进行脱敏,得到脱敏后的代码地址信息,包括:
在预设代码替换库中查询与所述地址信息所对应的行政区划代码相匹配的目标区划代码,并将所述目标区划代码作为脱敏后的行政区划代码;
将所述详细地址信息中处于目标位置的连续m个字符均替换为预设数量个特殊字符,得到脱敏后的详细地址信息;
根据所述脱敏后的行政区划代码和所述脱敏后的详细地址信息确定所述脱敏后的代码地址信息。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
响应用户的脱敏规则新增操作,根据所述脱敏规则新增操作将新增脱敏规则添加到预设脱敏规则库中;和/或
响应用户的脱敏规则修改操作,根据所述脱敏规则修改操作将修改后的脱敏规则更新至所述预设脱敏规则库中。
6.一种地址信息的数据脱敏装置,其特征在于,包括:
获取模块,用于获取待脱敏的地址信息;
转换模块,用于将所述地址信息转换为代码地址信息,其中,所述代码地址信息包括:所述地址信息所对应的行政区划代码和所述地址信息中的详细地址信息;
脱敏模块,用于基于预设脱敏规则对所述代码地址信息进行脱敏,得到脱敏后的代码地址信息;
确定模块,用于根据所述脱敏后的代码地址信息确定脱敏后地址信息。
7.根据权利要求6所述的装置,其特征在于,所述转换模块包括:
拆分单元,用于将所述地址信息进行拆分,得到省信息、市信息、县信息和详细地址信息;
转换单元,用于将所述省信息、所述市信息和所述县信息转换为对应的行政区划代码,得到所述地址信息所对应的行政区划代码;
第一确定单元,用于根据所述地址信息所对应的行政区划代码和所述详细地址信息确定所述代码地址信息。
8.根据权利要求6所述的装置,其特征在于,所述脱敏模块包括:
获取单元,用于获取预设脱敏等级,其中,所述预设脱敏等级包括以下任一种:省级脱敏、市级脱敏、县级脱敏;
选择单元,用于基于所述预设脱敏等级在预设行政区划代码库中随机选择目标代码作为脱敏后的行政区划代码;
第一替换单元,用于将所述详细地址信息中处于目标位置的连续n个字符均替换为预设数量个特殊字符,得到脱敏后的详细地址信息;
第二确定单元,用于根据所述脱敏后的行政区划代码和所述脱敏后的详细地址信息确定所述脱敏后的代码地址信息。
9.一种电子设备,包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至5中任一项所述的方法的步骤。
10.一种具有处理器可执行的非易失的程序代码的计算机可读介质,其特征在于,所述程序代码使所述处理器执行权利要求1至5中任一项所述的方法。
CN201911130832.4A 2019-11-18 2019-11-18 一种地址信息的数据脱敏方法、装置和电子设备 Active CN110889136B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911130832.4A CN110889136B (zh) 2019-11-18 2019-11-18 一种地址信息的数据脱敏方法、装置和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911130832.4A CN110889136B (zh) 2019-11-18 2019-11-18 一种地址信息的数据脱敏方法、装置和电子设备

Publications (2)

Publication Number Publication Date
CN110889136A true CN110889136A (zh) 2020-03-17
CN110889136B CN110889136B (zh) 2022-03-11

Family

ID=69747871

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911130832.4A Active CN110889136B (zh) 2019-11-18 2019-11-18 一种地址信息的数据脱敏方法、装置和电子设备

Country Status (1)

Country Link
CN (1) CN110889136B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112182654A (zh) * 2020-09-29 2021-01-05 浙江鸿程计算机系统有限公司 一种保留统计级特征属性的身份证号脱敏方法
CN114301840A (zh) * 2021-12-16 2022-04-08 山石网科通信技术股份有限公司 地理信息库的加载方法、装置及电子设备
WO2022267177A1 (zh) * 2021-06-22 2022-12-29 深圳壹账通智能科技有限公司 地址脱敏方法、装置、电子设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105426351A (zh) * 2015-11-11 2016-03-23 中国建设银行股份有限公司 一种客户地址信息的分词处理方法和系统
CN106649532A (zh) * 2016-10-31 2017-05-10 电子科技大学 一种针对地址信息的数据脱敏方法
CN107704770A (zh) * 2017-09-28 2018-02-16 平安普惠企业管理有限公司 敏感信息脱敏方法、系统、设备及可读存储介质
CN108154044A (zh) * 2016-12-05 2018-06-12 广东精点数据科技股份有限公司 一种基于随机和置换相结合的身份证号码脱敏方法及装置
CN108268800A (zh) * 2017-12-29 2018-07-10 上海上讯信息技术股份有限公司 一种可配置区域范围和信息格式的地址脱敏方法
WO2019114766A1 (zh) * 2017-12-14 2019-06-20 中兴通讯股份有限公司 一种数据脱敏方法、服务器、终端及计算机可读存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105426351A (zh) * 2015-11-11 2016-03-23 中国建设银行股份有限公司 一种客户地址信息的分词处理方法和系统
CN106649532A (zh) * 2016-10-31 2017-05-10 电子科技大学 一种针对地址信息的数据脱敏方法
CN108154044A (zh) * 2016-12-05 2018-06-12 广东精点数据科技股份有限公司 一种基于随机和置换相结合的身份证号码脱敏方法及装置
CN107704770A (zh) * 2017-09-28 2018-02-16 平安普惠企业管理有限公司 敏感信息脱敏方法、系统、设备及可读存储介质
WO2019114766A1 (zh) * 2017-12-14 2019-06-20 中兴通讯股份有限公司 一种数据脱敏方法、服务器、终端及计算机可读存储介质
CN108268800A (zh) * 2017-12-29 2018-07-10 上海上讯信息技术股份有限公司 一种可配置区域范围和信息格式的地址脱敏方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112182654A (zh) * 2020-09-29 2021-01-05 浙江鸿程计算机系统有限公司 一种保留统计级特征属性的身份证号脱敏方法
CN112182654B (zh) * 2020-09-29 2024-03-05 浙江鸿程计算机系统有限公司 一种保留统计级特征属性的身份证号脱敏方法
WO2022267177A1 (zh) * 2021-06-22 2022-12-29 深圳壹账通智能科技有限公司 地址脱敏方法、装置、电子设备及存储介质
CN114301840A (zh) * 2021-12-16 2022-04-08 山石网科通信技术股份有限公司 地理信息库的加载方法、装置及电子设备
CN114301840B (zh) * 2021-12-16 2024-02-13 山石网科通信技术股份有限公司 地理信息库的加载方法、装置及电子设备

Also Published As

Publication number Publication date
CN110889136B (zh) 2022-03-11

Similar Documents

Publication Publication Date Title
CN110889136B (zh) 一种地址信息的数据脱敏方法、装置和电子设备
CN108388598B (zh) 电子装置、数据存储方法及存储介质
CN108712519B (zh) Ip地址的定位方法、装置及存储介质
CN110084034B (zh) 一种基于弱口令检测的密码设置方法、存储介质及电子设备
WO2015070788A1 (zh) 一种识别ip地址的区域归属地信息的方法和装置
CN113704243A (zh) 数据分析方法、装置、计算机装置及存储介质
CN110557466A (zh) 一种数据处理方法、装置、电子设备及存储介质
CN111275599B (zh) 一种基于大数据集成算法的群租房预警方法、装置、存储介质及终端
US9465859B2 (en) Computer-implemented method of arranging text items in a predefined order
CN106484827A (zh) 检索方法以及装置、终端
CN111984293B (zh) 一种信息处理方法、装置和存储介质
CN110189171B (zh) 特征数据的生成方法、装置及设备
CN106843884B (zh) 一种查询数据处理方法及其设备
CN105653713B (zh) 一种确定设备识别码存在的方法及装置
CN104881308A (zh) 一种应用程序的处理方法及装置
CN110287147B (zh) 一种字符串排序方法及装置
JPH09288634A (ja) コンピュータ通信におけるアドレス管理方法
CN111831876B (zh) 查询方法、设备和存储介质
CN106407444A (zh) 检索方法以及装置、终端
CN106055610B (zh) 语音信息的检索方法及移动终端
CN110674159A (zh) 一种业务查询方法及相关装置
CN113037756B (zh) 数据唯一标识的生成方法、装置、设备及可读存储介质
CN106844396B (zh) 一种信息处理方法及电子设备
CN110572310A (zh) 基于通讯录的驾考路线分享方法及终端、存储介质
CN102821183A (zh) 一种联系人的查找方法、装置及移动终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant