CN112380211A - 一种身份证号码识别方法、装置和电子设备 - Google Patents

一种身份证号码识别方法、装置和电子设备 Download PDF

Info

Publication number
CN112380211A
CN112380211A CN202011223975.2A CN202011223975A CN112380211A CN 112380211 A CN112380211 A CN 112380211A CN 202011223975 A CN202011223975 A CN 202011223975A CN 112380211 A CN112380211 A CN 112380211A
Authority
CN
China
Prior art keywords
identification
card number
code
matching
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011223975.2A
Other languages
English (en)
Inventor
李立新
唐培洪
臧滔
杨金伟
祁铭超
林楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Life Insurance Co Ltd China
Original Assignee
China Life Insurance Co Ltd China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Life Insurance Co Ltd China filed Critical China Life Insurance Co Ltd China
Priority to CN202011223975.2A priority Critical patent/CN112380211A/zh
Publication of CN112380211A publication Critical patent/CN112380211A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24553Query execution of query operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书一个或多个实施例提供一种身份证号码识别方法、装置和电子设备;所述方法包括:由于身份证号码的本质是表字段,不同字段又具备了各项不同特征,因此在储存身份证号码的数据库中,按照身份证号码的特征组合码,建立特征值集合;依据所述的特征组合码,设置识别匹配算法,针对各项特征值集合,分组进行匹配并识别;进一步设置该数据库的各项识别连接信息,以达到数据库能够对导入的身份证号码自动调出识别匹配算法进行识别;最后对通过识别的有效身份证号码进行漂白处理,并回写至数据库的存储介质中。本方法实现了身份证号码的自动识别,降低了人工成本,提高梳理效率,由于机器代替人工操作,对于敏感信息的保护,也起到了显著作用。

Description

一种身份证号码识别方法、装置和电子设备
技术领域
本说明书一个或多个实施例涉及敏感信息识别的技术领域,尤其涉及一种身份证号码识别方法、装置和电子设备。
背景技术
身份证号字段的识别在软件测试应用方面,如测试数据提取、测试数据漂白等方面均有重要的应用。目前的现有方案,对于身份证号等敏感信息的提取工作主要依靠数据库表结构和业务逻辑的专业人员进行人工梳理筛选,不仅人工成本高昂,在准确率和问题响应时间上也均存在落后的问题,并且由于人工处理,对于敏感信息的泄露,存在一定风险。
基于此,需要一种能够实现身份证号码快速自动识别的方案。
发明内容
有鉴于此,本说明书一个或多个实施例的目的在于提出一种身份证号码识别方法、装置和电子设备,以解决人工低效梳理此类敏感信息数据的问题。
基于上述目的,本说明书一个或多个实施例提供了身份证号码识别方法,包括:根据身份证号码的本质为表字段的组合码,将其中的字段按照不同特征划分,并针对各项特征,建立特征值集合;利用分组识别匹配算法,针对身份证号码的特征值集合,分组进行匹配并识别;进一步通过对数据库的参数设置,实现对导入的身份证号码进行自动识别,并将通过识别的有效身份证号码加入敏感数据队列集合;最后对敏感数据队列集合中的数据进行漂白并回写至数据库中。
基于同一发明构思,本说明书一个或多个实施例还提供了一种身份证号码识别装置,包括:由于身份证号码的本质是表字段,不同字段又具备了各项不同特征,因此在储存身份证号码的数据库中,按照身份证号码的特征组合码,建立特征值集合;依据所述的特征组合码,设置分组识别匹配算法,针对各项特征值集合,分组进行匹配并识别;进一步设置该数据库的各项识别连接信息,以达到数据库能够对导入的身份证号码自动调出分组识别匹配算法进行识别;最后对通过识别的有效身份证号码进行漂白处理,并回写至数据库的存储介质中。
基于同一发明构思,本说明书一个或多个实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上任意一项所述的方法。
基于同一发明构思,本说明书一个或多个实施例还提供了一种非暂态计算机可读存储介质,其中,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行如上述身份证号码识别的方法。
从上面所述可以看出,本说明书一个或多个实施例提供的身份证号码识别方法、装置和电子设备,基于数据库表结构和分组识别匹配算法技术,综合考虑了人工成本,响应速度等方面,实现了身份证号码的自动识别,不仅大大降低了人工成本,提高梳理效率,由于机器代替人工操作,对于敏感信息的保护,也起到了显著作用。
附图说明
为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书一个或多个实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书一个或多个实施例身份证号码识别方法示意图;
图2为本说明书一个或多个实施例身份证号码识别装置示意图;
图3为本说明书一个或多个实施例的18位身份证号码表记录A示意图;
图4为本说明书一个或多个实施例的15位身份证号码表记录B示意图;
图5为本说明书一个或多个实施例的电子设备结构示意图。
具体实施方式
为使本公开的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本公开进一步详细说明。
需要说明的是,除非另外定义,本说明书一个或多个实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。
如背景技术部分所述,现有的身份证号码识别方法还难以满足生产中梳理敏感信息的需要。申请人在实现本公开的过程中发现,现有的身份证号码识别方法存在的主要问题在于:使用人工处理身份证号码等敏感信息时,对相关的操作人员要求比较严格,需要清楚了解业务系统的数据库表结构和业务逻辑;加之人工效率和准确率不足,尤其在任务紧迫时,更加凸显人工梳理信息的方案响应速度缓慢的问题;并且依赖人工导致例如身份证号码等此类敏感信息增加泄露的风险。
有鉴于此,本说明书一个或多个实施例提供了一种身份证号码识别方法,具体的,由于身份证号码的本质是表字段,不同字段又具备了各项不同特征,因此在储存身份证号码的数据库中,按照身份证号码的特征组合码,建立特征值集合;依据所述的特征组合码,设置分组识别匹配算法,针对各项特征值集合,分组进行匹配并识别;进一步设置该数据库的各项识别连接信息,以达到数据库能够对导入的身份证号码自动调出分组识别匹配算法进行识别;最后对通过识别的有效身份证号码进行漂白处理,并回写至数据库的存储介质中。完成所有步骤后,依靠相应的实施装置,可以达到自动梳理有效身份证号码的操作,用以代替人工方案。
以下,通过具体的实施例来详细说明本说明书一个或多个实施例的技术方法。
结合具体的18位和15位身份证,参考图1,本说明书一个实施例的身份证号码识别方法,包括以下步骤:
步骤S101、根据所述身份证号码的特征组合码,建立特征值集合。
在本步骤中,首先,将18位和15位身份证号码均以字段的形式,分别形成18位字段的表记录和15位字段的表记录,在本实施例中,即图3所示出的表记录A和图4所示出的表记录B。按照图3所示,在表记录A中包括的数据有:身份证号码A,为432831196411150810;和身份证号码B,为123456789012345678,将18位身份证号码A和B的18位字段,从左至右依次划分为不同的特征组合码,其中包括:6位地址码、8位出生日期码、3位顺序码、和1位校验码。对于图4示出的表记录B中,包括的数据有:15位身份证号码123456789012345,将其15位字段,,从左至右依次划分为不同的特征组合码,其中包括:6位地址码、6位出生日期码、3位顺序码。
进一步的,根据划分出的不同特征码,建立特征值集合,其中,所述特征值集合包括:长度集合为{15,18};地址集合为{432831,123456,123456};出生日期集合为模式匹配集合{yyyy-mm-dd,yy-mm-dd},表达年份-月份-日期;以及校验码集合为{0,1,2,3,4,5,6,7,8,9,X}。如图4所示,15位的身份证号码无校验码,因此在所述校验码集合中,不包含15位身份证的字段数据。
步骤S102、根据所述特征值集合,设置分组识别匹配算法,用以对所述身份证号码执行识别操作。
根据上一步骤S101中建立的特征值集合,进一步的,在所使用的数据库中设置如下的分组识别匹配算法,用以分组匹配的方式进行身份证号码的识别:
select 18位字符串from表记录A;
select 15位字符串from表记录B;
create or replace function分组识别匹配算法(15位字符串/18位字符串varchar)return number
as
val number;
begin
if(字符串长度=15)then
判断前6位是否属于地址码集合;
判断第7位至12位是否为出生日期格式;
如果字符串符合校验规则,则val=1;
如果字符串不符合校验规则,则val=0;
else
判断前6位是否属于地址码集合;
判断第7位至14位是否为出生日期格式;
判断最后1位是否属于校验码集合;
如果字符串符合校验规则,则val=1;
如果字符串不符合校验规则,则val=0;
end if;
return val;
end;
由上述分组识别匹配算法可知,先由数据库中提取出表记录A的18位身份证号码A和B,以及表记录B的15位身份证号码;再按照特征值集合进行判断:首先判断字符长度是否落入长度集合,若不落入,则返回0,表示识别未通过;若落入长度集合,并符合15位长度,则继续判断地址码是否落入地址集合,若不落入,则返回0,表示识别未通过;若落入地址集合,则继续判断出生日期码是否符合出生日期集合模式匹配规则,若不符合,则返回领表示识别未通过;若符合生日期集合模式匹配规则,则继续判断是否符合校验规则,若不符合,则返回0,表示识别未通过;若符合,则返回1,表示通过识别,也即可以在数据库中标记为身份证数据。若字符长度落入长度集合,并符合18位长度,则继续判断地址码是否落入地址集合,若不落入,则返回0,表示识别未通过;若落入地址集合,则继续判断出生日期码是否符合出生日期集合模式匹配规则,若不符合,则返回领表示识别未通过;若符合生日期集合模式匹配规则,则继续判断校验码是否落入校验码集合,若不落入,则返回0,表示识别未通过;若落入校验码集合,则继续判断是否符合校验规则,若不符合,则返回0,表示识别未通过;若符合,则返回1,表示通过识别,也即可以在数据库中标记为有效身份证数据。在本实施例中,对其中的校验规则不做具体限定,例如可以根据具体需要,设定校验出生日期码中的月份部分是否为1月至12月;年份部分是否落入1921年至2020年;地址码部分是否落入中国省份代码等。
由此可知,在本实施例的实际操作中,由于15位身份证号码不符合校验规则,返回0,也即识别未通过,不是有效身份证号码;18位身份证号码A最终返回1,也即通过识别,并在数据库中标记为有效身份证号码数据;18位身份证号码B由于不符合校验规则,返回0,也即识别未通过,不是有效身份证号码。
步骤S103、配置待识别数据库的连接信息,利用所述分组识别匹配算法自动从导入的表记录中识别身份证号码。
在本步骤中,将对储存了身份证号码表记录的数据库,配置待识别数据库连接信息,其中包括:数据库的地址,端口号,实例名,数据库用户账户,数据库用户密码等。在实际操作中,可根据具体需要,设置上述的相关参数。设定相关参数后,数据库将会自动对导入的测试数据,启动上述识别模块S202中的分组识别匹配算法。
步骤S104、将所有识别出的所述身份证号码,依次加入至敏感数据队列集合。
作为一个可选的实施例,在本步骤中,将通过判断的18位身份证号码A,作为有效身份证号码,使用如下脚本,加入至数据库中的敏感队列集合:insert into sensitive_array(敏感队列集合)(table_name(身份证号码的表名),list_name(身份证号码字段名),id_num(身份证号码的值))values(value1,value2,value3);
因此,所得到的敏感队列集合表达为:{表名1:字段名1:身份证号码1,表名2:字段名2:身份证号码2,……}。
步骤S105、根据漂白规则,对所述敏感数据队列集合中的所述身份证号码进行漂白处理,并回写至所述表记录。
作为一个可选的实施例,在准确识别身份证号码后,由于其为敏感信息,为了避免身份证号码泄露的风险,对其进行漂白处理,也即进行加密处理。在所述漂白处理的操作中,对本实施例的18位身份证号码的操作为:将其3位顺序码做修改,并将随机修改后的数字,按照ISO 7064:1983.MOD 11-2的计算标准进行计算,得出最后一位校验码。在本实施例中,将身份证号码A的顺序码修改为361,经过ISO 7064:1983.MOD 11-2的标准进行计算,得出校验码为0。对本实施例中15位身份证号码的漂白操作为:在最后的三位顺序码上,使用随机生成的三位顺序码,用以替换原有顺序码。
进一步的,将通过识别的有效身份证号码,利用如下语句回写至上述的表记录中:
update table_name(身份证号的表名)set list_name(身份证号的字段名)=new_value(漂白后身份证号的值)where list_name(身份证号的字段名)=old_value(漂白前身份证号的值);
最后,在本实施例中,在数据库的表记录A中将储存漂白后的身份证号码A为:432831196411153610。
可见,本说明书一个或多个实施例的身份证号码识别方法,基于数据库表结构和分组识别匹配算法技术,综合考虑了人工成本,响应速度等方面,实现了身份证号码的自动识别,不仅大大降低了人工成本,提高梳理效率,由于机器代替人工操作,对于敏感信息的保护,也起到了显著作用。
需要说明的是,本说明书一个或多个实施例的方法可以由单个设备执行,例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下,由多台设备相互配合来完成。在这种分布式场景的情况下,这多台设备中的一台设备可以只执行本说明书一个或多个实施例的方法中的某一个或多个步骤,这多台设备相互之间会进行交互以完成所述的方法。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
基于同一发明构思,与上述任意实施例方法相对应的,本说明书一个或多个实施例还提供了一种身份证号码识别的装置。
结合具体的18位与15位身份证,参考图2,所述身份证号码识别的装置,包括:
特征值模块S201,被配置为根据所述身份证号码的特征组合码,建立特征值集合;
匹配模块S202,被配置为根据所述特征值集合,设置分组识别匹配算法,用以对所述身份证号码执行识别操作;
自动模块S203,被配置为设置待识别数据库的连接信息,利用所述分组识别匹配算法自动从导入的表记录中识别身份证号码;
敏感队列模块S204,被配置为将所有识别出的所述身份证号码,依次加入至敏感数据队列集合;
漂白回写模块S205,被配置为根据漂白规则,对所述敏感数据队列集合中的所述身份证号码进行漂白处理,并回写至所述表记录。
作为一个可选的实施例,所述特征值模块S201,具体被配置为,首先,将18位和15位身份证号码均以字段的形式,分别形成18位字段的表记录和15位字段的表记录,在本实施例中,即图3所示出的表记录A和图4所示出的表记录B。按照图3所示,在表记录A中包括的数据有:身份证号码A,为432831196411150810;和身份证号码B,为123456789012345678,将18位身份证号码A和B的18位字段,从左至右依次划分为不同的特征组合码,其中包括:6位地址码、8位出生日期码、3位顺序码、和1位校验码。对于图4示出的表记录B中,包括的数据有:15位身份证号码123456789012345,将其15位字段,,从左至右依次划分为不同的特征组合码,其中包括:6位地址码、6位出生日期码、3位顺序码。
进一步的,根据划分出的不同特征码,建立特征值集合,其中,所述特征值集合包括:长度集合为{15,18};地址集合为{432831,123456,123456};出生日期集合为模式匹配集合{yyyy-mm-dd,yy-mm-dd},表达年份-月份-日期;以及校验码集合为{0,1,2,3,4,5,6,7,8,9,X}。如图4所示,15位的身份证号码无校验码,因此所述校验码集合中,不包含15位身份证的字段数据。
作为一个可选的实施例,所述识别模块S202,具体被配置为根据建立的特征值集合,在所使用的数据库中设置如下的分组识别匹配算法,用以分组匹配的方式进行身份证号码的识别:
select 18位字符串from表记录A;
select 15位字符串from表记录B;
create or replace function分组识别匹配算法(15位字符串/18位字符串varchar)return number
as
val number;
begin
if(字符串长度=15)then
判断前6位是否属于地址码集合;
判断第7位至12位是否为出生日期格式;
如果字符串符合校验规则,则val=1;
如果字符串不符合校验规则,则val=0;
else
判断前6位是否属于地址码集合;
判断第7位至14位是否为出生日期格式;
判断最后1位是否属于校验码集合;
如果字符串符合校验规则,则val=1;
如果字符串不符合校验规则,则val=0;
end if;
return val;
end;
由上述分组识别匹配算法可知,先由数据库中提取出表记录A的18位身份证号码A和B,以及表记录B的15位身份证号码;再按照特征值集合进行判断:首先判断字符长度是否落入长度集合,若不落入,则返回0,表示识别未通过;若落入长度集合,并符合15位长度,则继续判断地址码是否落入地址集合,若不落入,则返回0,表示识别未通过;若落入地址集合,则继续判断出生日期码是否符合出生日期集合模式匹配规则,若不符合,则返回领表示识别未通过;若符合生日期集合模式匹配规则,则继续判断是否符合校验规则,若不符合,则返回0,表示识别未通过;若符合,则返回1,表示通过识别,也即可以在数据库中标记为身份证数据。若字符长度落入长度集合,并符合18位长度,则继续判断地址码是否落入地址集合,若不落入,则返回0,表示识别未通过;若落入地址集合,则继续判断出生日期码是否符合出生日期集合模式匹配规则,若不符合,则返回领表示识别未通过;若符合生日期集合模式匹配规则,则继续判断校验码是否落入校验码集合,若不落入,则返回0,表示识别未通过;若落入校验码集合,则继续判断是否符合校验规则,若不符合,则返回0,表示识别未通过;若符合,则返回1,表示通过识别,也即可以在数据库中标记为有效身份证数据。在本实施例中,对其中的校验规则不做具体限定,例如可以根据具体需要,设定校验出生日期码中的月份部分是否为1月至12月;年份部分是否落入1921年至2020年;地址码部分是否落入中国省份代码等。
由此可知,在本实施例的实际操作中,由于15位身份证号码不符合校验规则,返回0,也即识别未通过,不是有效身份证号码;18位身份证号码A最终返回1,也即通过识别,并在数据库中标记为有效身份证号码数据;18位身份证号码B由于不符合校验规则,返回0,也即识别未通过,不是有效身份证号码。
作为一个可选的实施例,所述自动模块S203,具体被配置为对储存了身份证号码表记录的数据库,配置待识别数据库连接信息,其中包括:数据库的地址,端口号,实例名,数据库用户账户,数据库用户密码等。在实际操作中,可根据具体需要,设置上述的相关参数。设定相关参数后,数据库将会自动对之后导入的测试数据,启动上述识别模块S202中的分组识别匹配算法。
作为一个可选的实施例,所述敏感队列模块S204,具体被配置为将通过判断的18位身份证号码A,作为有效身份证号码,使用如下脚本,加入至数据库中的敏感队列集合:
insert into sensitive_array(敏感队列集合)(table_name(身份证号码的表名),list_name(身份证号码字段名),id_num(身份证号码的值))values(value1,value2,value3);
因此,所得到的敏感队列集合表达为:{表名1:字段名1:身份证号码1,表名2:字段名2:身份证号码2,……}。
作为一个可选的实施例,所述漂白回写模块S205,具体被配置为在准确识别身份证号码后,由于其为敏感信息,为了避免身份证号码泄露的风险,对其进行漂白处理,也即进行加密处理。在所述漂白处理的操作中,对本实施例的18位身份证号码的操作为:将其3位顺序码做修改,并将随机修改后的数字,按照ISO 7064:1983.MOD 11-2的计算标准进行计算,得出最后一位校验码。在本实施例中,将身份证号码A的顺序码修改为361,经过ISO7064:1983.MOD 11-2的标准进行计算,得出校验码为0。对本实施例中15位身份证号码的漂白操作为:在最后的三位顺序码上,使用随机生成的三位顺序码,用以替换原有顺序码。
进一步的,将通过识别的有效身份证号码,利用如下语句回写至上述的表记录中:
update table_name(身份证号的表名)set list_name(身份证号的字段名)=new_value(漂白后身份证号的值)where list_name(身份证号的字段名)=old_value(漂白前身份证号的值);
最后,在本实施例中,在数据库的表记录A中将储存漂白后的身份证号码A为:432831196411153610。
为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书一个或多个实施例时可以把各模块的功能在同一个或多个软件和/或硬件中实现。
上述实施例的装置用于实现前述任一实施例中相应的身份证号码识别方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
基于同一发明构思,与上述任意实施例方法相对应的,本说明书一个或多个实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上任意一实施例所述的身份证号码识别法。
图5示出了本实施例所提供的一种更为具体的电子设备硬件结构示意图,该设备可以包括:处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
处理器1010可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。
存储器1020可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。
输入/输出接口1030用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。
需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
上述实施例的装置用于实现前述任一实施例中相应的身份证号码识别方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
基于同一发明构思,与上述任意实施例方法相对应的,本说明书一个或多个实施例还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行如上任一实施例所述的身份证号码识别方法。
本实施例的计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
上述实施例的存储介质存储的计算机指令用于使所述计算机执行如上任一实施例所述的身份证号码识别方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本公开的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本说明书一个或多个实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。
另外,为简化说明和讨论,并且为了不会使本说明书一个或多个实施例难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本说明书一个或多个实施例难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本说明书一个或多个实施例的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本公开的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本说明书一个或多个实施例。因此,这些描述应被认为是说明性的而不是限制性的。
尽管已经结合了本公开的具体实施例对本公开进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
本说明书一个或多个实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本说明书一个或多个实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本公开的保护范围之内。

Claims (10)

1.一种身份证号码的识别方法,其特征在于,包括:
根据所述身份证号码的特征组合码,建立特征值集合;
根据所述特征值集合,设置分组识别匹配算法,用以对所述身份证号码执行识别操作;
配置待识别数据库的连接信息,利用所述分组识别匹配算法自动从导入的表记录中识别身份证号码;
将所有识别出的所述身份证号码,依次加入至敏感数据队列集合;
根据漂白规则,对所述敏感数据队列集合中的所述身份证号码进行漂白处理,并回写至所述表记录。
2.根据权利要求1所述的方法,其特征在于,所述身份证号码为表字段形式;所述表记录中罗列了不少于一个所述身份证号码的表字段。
3.根据权利要求1所述的方法,其特征在于,所述特征组合码包括:地址码、出生日期码、顺序码和校验码;所述特征值集合包括:长度集合、地址集合、出生日期集合、和校验码集合。
4.根据权利要求1所述的方法,其特征在于,所述敏感数据队列集合,其内容包括:表名、字段名、和身份证号码。
5.根据权利要求1所述的方法,其特征在于,所述待识别数据库连接信息包括:数据库地址、端口号、实例名、数据库用户账户和数据库用户密码。
6.根据权利要求1所述的方法,其特征在于,所述分组识别匹配算法为分组匹配的方式,分组包括依次执行:长度集合的匹配、地址集合的匹配、出生日期的匹配、以及校验码集合的匹配;
在所述长度集合的匹配中,判断字符长度是否落入长度集合,若符合则继续进行下一集合的匹配;
在所述地址集合的匹配中,判断地址码是否落入地址集合,若符合则继续进行下一集合的匹配;
在所述出生日期的匹配中,判断出生日期码是否符合出生日期集合模式匹配规则,若符合则继续进行下一集合的匹配;
以及在校验码集合的匹配中,判断校验码是否落入校验码集合,若符合则为通过分组识别匹配。
7.根据权利要求1所述的方法,其特征在于,所述漂白规则为修改所述特征组合码中的顺序码和校验码中至少一项。
8.一种身份证号码识别装置,其特征在于,包括:
特征值模块,被配置为根据所述身份证号码的特征组合码,建立特征值集合;
匹配模块,被配置为根据所述特征值集合,设置分组识别匹配算法,用以对所述身份证号码执行识别操作;
自动模块,被配置为设置待识别数据库的连接信息,利用所述分组识别匹配算法自动从导入的表记录中识别身份证号码;
敏感队列模块,被配置为将所有识别出的所述身份证号码,依次加入至敏感数据队列集合;
漂白回写模块,被配置为根据漂白规则,对所述敏感数据队列集合中的所述身份证号码进行漂白处理,并回写至所述表记录。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任意一项所述的方法。
10.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行权利要求1至7任一所述方法。
CN202011223975.2A 2020-11-05 2020-11-05 一种身份证号码识别方法、装置和电子设备 Pending CN112380211A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011223975.2A CN112380211A (zh) 2020-11-05 2020-11-05 一种身份证号码识别方法、装置和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011223975.2A CN112380211A (zh) 2020-11-05 2020-11-05 一种身份证号码识别方法、装置和电子设备

Publications (1)

Publication Number Publication Date
CN112380211A true CN112380211A (zh) 2021-02-19

Family

ID=74578423

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011223975.2A Pending CN112380211A (zh) 2020-11-05 2020-11-05 一种身份证号码识别方法、装置和电子设备

Country Status (1)

Country Link
CN (1) CN112380211A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106302454A (zh) * 2016-08-15 2017-01-04 北京奇虎科技有限公司 敏感数据识别方法及装置
CN107122412A (zh) * 2017-03-31 2017-09-01 合肥天馈互联网技术有限公司 一种海量电话号码快速匹配检索方法
CN107168979A (zh) * 2016-03-08 2017-09-15 中国移动通信集团安徽有限公司 目标号码的匹配方法及装置
CN108154044A (zh) * 2016-12-05 2018-06-12 广东精点数据科技股份有限公司 一种基于随机和置换相结合的身份证号码脱敏方法及装置
CN108563961A (zh) * 2018-04-13 2018-09-21 中国民航信息网络股份有限公司 数据脱敏平台敏感数据识别方法、装置、设备及介质
CN109543551A (zh) * 2018-10-26 2019-03-29 平安科技(深圳)有限公司 身份证鉴别处理方法、装置、计算机设备及存储介质
CN110489985A (zh) * 2019-08-21 2019-11-22 泰康保险集团股份有限公司 数据处理方法、装置、计算机可读存储介质及电子设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107168979A (zh) * 2016-03-08 2017-09-15 中国移动通信集团安徽有限公司 目标号码的匹配方法及装置
CN106302454A (zh) * 2016-08-15 2017-01-04 北京奇虎科技有限公司 敏感数据识别方法及装置
CN108154044A (zh) * 2016-12-05 2018-06-12 广东精点数据科技股份有限公司 一种基于随机和置换相结合的身份证号码脱敏方法及装置
CN107122412A (zh) * 2017-03-31 2017-09-01 合肥天馈互联网技术有限公司 一种海量电话号码快速匹配检索方法
CN108563961A (zh) * 2018-04-13 2018-09-21 中国民航信息网络股份有限公司 数据脱敏平台敏感数据识别方法、装置、设备及介质
CN109543551A (zh) * 2018-10-26 2019-03-29 平安科技(深圳)有限公司 身份证鉴别处理方法、装置、计算机设备及存储介质
CN110489985A (zh) * 2019-08-21 2019-11-22 泰康保险集团股份有限公司 数据处理方法、装置、计算机可读存储介质及电子设备

Similar Documents

Publication Publication Date Title
CN102006163B (zh) 用户验证方法、装置及服务器
US7917770B2 (en) Configurable data masking for software testing
CN110489466B (zh) 邀请码的生成方法、装置、终端设备及存储介质
CN106599629A (zh) 一种安卓应用程序加固方法及装置
CN111352935A (zh) 一种块链式账本中的索引创建方法、装置及设备
CN111259364B (zh) 一种使用国密加密卡的方法、装置、设备及存储介质
US8923030B2 (en) On-die programmable fuses
CN112784112A (zh) 报文校验方法及装置
US9298949B2 (en) Method for programming a mobile end device chip
CN108924185A (zh) 接口生成方法及装置
CN110209582A (zh) 代码覆盖率的统计方法及装置、电子设备、存储介质
CN113220568A (zh) Usim卡文件系统的测试方法、装置及介质
CN113032202A (zh) 芯片验证方法、系统、装置、计算机设备及存储介质
CN112380211A (zh) 一种身份证号码识别方法、装置和电子设备
CN111523875A (zh) 跨境支付方法、装置、设备及系统
CN110968885A (zh) 模型训练数据存储方法及装置、电子设备、存储介质
CN110968500A (zh) 一种测试用例的执行方法及装置
CN109683813B (zh) 一种nvme ssd自动格式化方法、装置、终端及存储介质
CN113033221A (zh) 智能卡发卡方法、计算机装置及计算机可读存储介质
CN107025392A (zh) 基于使用的认证系统
US9472302B2 (en) Redundant fuse coding
CN112114870A (zh) 一种打包代码的方法、装置、终端设备和存储介质
CN111191917A (zh) 一种授权有效性验证方法、系统、电子设备与存储介质
CN111444215A (zh) 一种块链式账本中的成块方法、装置及设备
CN111625458A (zh) 业务系统测试方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination