CN105069056A - 基于字符串匹配的身份证住址信息解析方法及系统 - Google Patents

基于字符串匹配的身份证住址信息解析方法及系统 Download PDF

Info

Publication number
CN105069056A
CN105069056A CN201510445546.2A CN201510445546A CN105069056A CN 105069056 A CN105069056 A CN 105069056A CN 201510445546 A CN201510445546 A CN 201510445546A CN 105069056 A CN105069056 A CN 105069056A
Authority
CN
China
Prior art keywords
address
cities
counties
code
district
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510445546.2A
Other languages
English (en)
Other versions
CN105069056B (zh
Inventor
吴钊
胡春阳
谷琼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hubei University of Arts and Science
Original Assignee
Hubei University of Arts and Science
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hubei University of Arts and Science filed Critical Hubei University of Arts and Science
Priority to CN201510445546.2A priority Critical patent/CN105069056B/zh
Publication of CN105069056A publication Critical patent/CN105069056A/zh
Application granted granted Critical
Publication of CN105069056B publication Critical patent/CN105069056B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于字符串匹配的身份证住址信息解析方法及系统,首先获得全国省市县区及其对应代码,将所有规整化的地址代码条目读入存储介质中,对每个地址代码条目同时用两种映射方式存储,一种是取地址代码条目中最低级别的字段与代码的字典映射,另一种是代码到省市县全称的映射;读入一条身份证住址信息的字符串进行处理,只保留区、县和市相应关键字得到关键信息串,将关键信息串从低级到高级依次进行匹配截取,根据两种映射得到相应代码及相应规范的省市县全称。本发明能够非常有效可靠地自动获取详细的省市县信息,节约大量人力劳动,解决了身份证住址信息不规整的问题,防止数字化个人信息出现误差,保证后续应用准确性。<b />

Description

基于字符串匹配的身份证住址信息解析方法及系统
技术领域
本发明涉及到计算机工程技术应用领域,更具体地,是基于字符串匹配的身份证住址信息解析技术方案。
背景技术
二十一世纪是信息化的时代,为了使人们的生活越来越智能化、互联化,个人信息数字化网络化是必要的一步。居民身份证作为居民最主要的身份象征,对于人员活动标识具有重要意义,基于此的用户信息分析对于用户体验及居民安全更具有重大意义。而通过身份证获取居民住址信息则是数字化个人信息的一个重要应用。
身份证住址信息解析系统首先读入用户身份证信息,然后根据身份证信息获取用户所在的省、市、县以及详细住址等信息。现有的身份证住址解析系统可以分为两大类,一类是简单式的,一类是复杂式的。
简单式的身份证住址解析系统就是读取身份证号码,然后根据身份证号码的前六位进行解析:其中前两位为省份代码,后四位为市县代码。根据目前已有身份证代码大全表,可以获得任何身份证所包含的省市直至县区信息。这种方式最大的优点就是实现简单,主要问题是身份证号码所包含的住址信息对应出生所在地,而不是当前实际住址,因此并不是很准确。
复杂式的身份住址解析系统就是通过直接解析身份证里面的住址信息获取省市县信息,从而得到当前户口所在地信息。这种方式可以准确定位到当前户口所在地,但由于住址信息字段的不规则性,地址解析复杂度高,现有系统无法可靠高效地解析身份证住址信息。
因此现在实际用户信息分析工作中,常常需要依赖人工一一查证处理,尤其是在涉及海量人口信息数据时,缺乏有效地技术手段。
发明内容
本发明解决的技术问题在于:正确处理不规整身份证住址信息,快速准确的解析出身份证住址信息中的省市县信息,从而得到其对应的代号和规范化地址。
本发明进一步解决的问题在于:在保证数据可靠的基础上,大幅度提高数据同步的效率。
本发明进一步解决的问题在于:大幅度提高在复杂情况及大数据量下的身份证地址解析的准确率及效率。
本发明的技术方案提供一种基于字符串匹配的身份证住址信息解析方法,包括以下步骤,
步骤1,首先获得全国省市县区及其对应代码,作为初始的地址条目进行规整化处理,包括将省市县及区进行分离,规整后的地址代码条目持久存入数据库中;
步骤2,初始化,包括将数据库中所有规整化的地址代码条目读入存储介质中,对每个地址代码条目同时用两种映射方式存储,一种是设从高级到低级依次为省、市、县、区,取地址代码条目中最低级别的字段与代码的字典映射,记为映射A;另一种是代码到省市县全称的映射,记为映射B;
步骤3,读入一条身份证住址信息的字符串;
步骤4,对当前读入的这条身份证住址信息的字符串进行处理,只保留区、县和市相应关键字,得到关键信息串;
步骤5,设从低级到高级依次为区、县、市,将步骤4所得关键信息串从低级到高级依次进行匹配截取,包括以下子步骤,
步骤5.1,从关键信息串中,提取最低级的子串;
步骤5.2,将当前所取子串与存储介质中的规整化地址代码条目进行查询匹配,
如果匹配成功则根据映射A返回对应的代码,结束对当前读入的这条身份证住址信息匹配结果,根据映射B由代码检索到相应规范的省市县全称,结束本步骤进入步骤6;
否则进入步骤5.3;
步骤5.3,舍弃当前的子串,从关键信息串中,按照区、县、市的顺序,提取高一级的子串,
如果提取失败,匹配失败,结束本步骤进入步骤6;
如果提取成功则返回执行步骤5.2,直到匹配成功或匹配失败;
步骤6,如果还需继续进行身份证地址解析,返回步骤3读入下一条身份证住址信息的字符串进行处理,否则结束流程。
本发明还相应提供一种基于字符串匹配的身份证住址信息解析系统,包括以下模块,
代码存储模块,用于首先获得全国省市县区及其对应代码,作为初始的地址条目进行规整化处理,包括将省市县及区进行分离,规整后的地址代码条目持久存入数据库中;
初始化模块,用于将数据库中所有规整化的地址代码条目读入存储介质中,对每个地址代码条目同时用两种映射方式存储,一种是设从高级到低级依次为省、市、县、区,取地址代码条目中最低级别的字段与代码的字典映射,记为映射A;另一种是代码到省市县全称的映射,记为映射B;
信息输入模块,用于读入一条身份证住址信息的字符串;
关键信息提取模块,用于对当前读入的这条身份证住址信息的字符串进行处理,只保留区、县和市相应关键字,得到关键信息串;
分级匹配模块,设从低级到高级依次为区、县、市,将关键信息提取模块所得关键信息串从低级到高级依次进行匹配截取,包括以下子模块,
初始子串提取子模块,用于从关键信息串中,提取最低级的子串;
查询匹配子模块,用于将当前所取子串与存储介质中的规整化地址代码条目进行查询匹配,
如果匹配成功则根据映射A返回对应的代码,结束对当前读入的这条身份证住址信息匹配结果,根据映射B由代码检索到相应规范的省市县全称,结束分级匹配模块工作,命令迭代判断模块工作;
否则命令子串更新子模块工作;
子串更新子模块,用于舍弃当前的子串,从关键信息串中,按照区、县、市的顺序,提取高一级的子串,
如果提取失败,匹配失败,结束分级匹配模块工作,命令迭代判断模块工作;
如果提取成功则命令查询匹配子模块工作,直到匹配成功或匹配失败;
迭代判断模块,用于判断如果还需继续进行身份证地址解析,命令信息输入模块读入下一条身份证住址信息的字符串进行处理,否则结束系统工作。
本发明是通过提取身份证的住址信息,与已有数据匹配,从而实现身份证住址信息解析。本发明的优点在于:
(1)本发明利用了现有的省市县代码数据,能够非常有效可靠地自动获取详细的省市县信息,节约大量人力劳动;
(2)本发明使用字符串关键信息提取方法,解决了身份证住址信息不规整的问题,防止数字化个人信息出现误差,影响后续应用;
(3)本发明实现简单,所需的计算处理资源少,同时能保证正确获取居民身份证住址规整信息,是低成本高效率的技术方案。
附图说明
图1是本发明实施例的基本流程图。
具体实施方式
本发明解决了身份证住址信息的不规整性问题,确保能身份证住址信息解析的可靠性,提高了复杂式省市县信息自动获取的准确率及效率。为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施案例,并参照附图,对本发明进一步详细说明。
本发明实施例采用的技术方案中,可以预先将市县信息及对应代码整体存入数据库,将获取的身份证住址信息进行市县提取然后与数据库中数据进行对比,从而达到身份证住址信息解析的目的,实现过程主要包含如下步骤:
(1)将全国各省市县信息及其对应的代码进行处理后存入数据库,做持久保存;
(2)将数据库的省市县和代码信息加载到存储介质,建议采用高速存储介质,包括但不局限于计算机内存、处理器的片上静态存储器、处理器的缓存等,以提高匹配速度;
(3)读入一条包含身份证住址信息的字符串;
(4)将身份证住址信息进行解析,获取市县信息;
(5)将获取到的市县信息与高速存储介质中的省市县信息进行匹配,如果匹配某一条目,则返回该条目的代码和对应的省市县信息;
(6)连续进行步骤(3)到步骤(5)对下一条包含身份证住址信息的字符串进行处理,从而解析所有输入身份证的住址信息。
考虑到身份证住址信息解析的典型案例存在以下几种情况:
1.标准型:XX省XX市(XXX县/区/地区/州/市区)XXX,如“福建省长乐市金峰镇六林村判院272号”;“陕西省商南县试马镇试马街村六组”。
2.不带“省”字型:XX(省名)XX市(XXX县/区/地区/州/市区)XXX,如“新疆英吉沙县城镇英巴格居委会1组94号”;“新疆阿克陶县木吉乡布拉克村一组097号”。
3.直接到“市”型:XX市(XXX县/区/地区/州/市区)XXX,如“重庆市云阳县后叶乡清顺村10组18号”。
4.“直辖市”“区“型:XX市XX区XXX,如“上海市闵行区东川路800号”。
本发明进一步提出,步骤(5)的实现方式为,按顺序依次提取区,县,市,省信息,依次与高速存储介质中的省市县区映射信息进行匹配,一旦匹配即为所求,停止匹配。
具体实施时可采用计算机软件技术实现自动运行流程。本发明实施例基于字符串匹配身份证住址信息解析方法的流程如图1所示,其步骤如下:
(1)首先获得全国省市县区及其对应代码,其格式为“省市县区字符串-对应的数字代码”,做为初始的地址条目,如“北京市海淀区-110108”;对所有的地址条目进行如下规整化处理:将省市县及区进行分离,如“河北省唐山市路南区-130202”分解成“河北省唐山市路南区-河北-唐山市-路南区-130202”;“新疆维吾尔自治区昌吉市-652321”分解成“新疆维吾尔自治区昌吉市-新疆-昌吉市-652321”,规整后的条目持久存入数据库中;具体实施时可以利用已有的全国省市县区及其对应代码相关数据大全。
(2)初始化,将数据库中所有规整化的地址代码条目读入高速存储介质中,生成映射:读入每个条目同时用两种映射方式存储,一种是省、市、县、区中的最低级别字段(设从高级到低级依次为省、市、县、区)与代码的字典映射,记为映射A;另一种是代码到省市县全称映射,记为映射B。例如读入“河北省唐山市路南区-130202”,生成最低字段到代码的映射“路南区-652321”,以及代码到字段全称的映射如“652321:新疆维吾尔自治区昌吉市”。
(3)读入一条身份证住址信息的字符串。
(4)对当前读入的这条身份证住址信息的字符串进行处理,只保留区、县和市相应关键字,从而提取关键信息串:先将字符串中的“省”字匹配删除,将32个省名,5个自治区匹配删除,例如将河北省唐山市路南区变为唐山市路南区,新疆维吾尔自治区乌鲁木齐水磨沟区六道湾路改为乌鲁木齐市水磨沟区六道湾路,
(5)将(4)所得关键信息串按照区、县、市(从低级到高级)依次进行匹配截取,直至截取成功,例如,河北省唐山市路南区经(4)提取关键信息得到“唐山市路南区”,从中可先截取到最低级的关键字“路南区”,得到最低级的子串,如果需要继续截取,将截取到高一级的子串“唐山市”。
具体实现方式如下:
(5.1)从关键信息串中,按照区、县、市的顺序,提取最低级的子串;
(5.2)将当前所取子串与存储介质中的规整化地址代码条目进行查询匹配,如果匹配成功则可根据映射A返回对应的地址代码,完成对当前读入的这条身份证住址信息的匹配,可根据映射B由地址代码自动检索到相应规范的省市县全称,结束本步骤进入步骤(6);否则进入(5.3);
(5.3)舍弃当前的子串,从关键信息串中,按照区、县、市的顺序,提取高一级的子串,
如果提取失败(字符串剩余为空,没有未取的子串),匹配失败,结束本步骤进入步骤(6);
如果提取成功则返回执行操作(5.2),直到匹配成功或匹配失败。
(6)如果还需继续进行身份证地址解析,则返回(3)读入下一条身份证住址信息的字符串进行处理,继续循环执行步骤(3)到步骤(5),对下一人员身份进行解析,否则结束运行。
以下为从步骤(3)开始读入一条身份证住址信息的字符串进行处理的具体实施样例,这里{}表示待匹配的地址字符串:
Address:{新疆阿克陶县木吉乡布拉克村一组097号}:
addr1={新疆阿克陶县木吉乡布拉克村一组097号}(操作:读入地址字符串);
addr2={阿克陶县木吉乡布拉克村一组097号}(操作:删除“新疆”);
addr3={阿克陶县}(操作:“县”匹配,舍弃“县”之后的子字符串);
将addr3与高速存储介质中的规整化地址条目进行匹配,得到规整化地址为“新疆维吾尔自治区阿克陶县”,对应地址代码:“653022”。
Address:{四川省武胜县龙女镇幸福村1组15号}:
addr1={四川武胜县龙女镇幸福村1组15号}(操作:读入地址字符串);
addr2={武胜县龙女镇幸福村1组15号}(操作:匹配删除“四川”);
addr3={武胜县}(操作:匹配“县”,并舍弃“县”之后的子字符串);
将addr3与高速存储介质的规整化地址条目进行匹配,得到其规整化地址为“四川省武胜县”,相应的地址代码为“511622”
Address:{广州市越秀区北京路303号4楼}
addr1={广州市越秀区北京路303号4楼}(操作:读入地址字符串);
addr2={广州市越秀区北京路303号4楼}(操作:字符串不包含“省”或“直辖市”,字符串保持不变);
addr3={广州市越秀区}(操作:匹配“区”,舍弃“区”后的子字符串);
将addr3与高速存储介质中规整化地址映射条目进行匹配,得到其规整化地址为“广东省广州市越秀区”,相应的地址代码为“440104”。
Address:{新疆喀什市下坝路东湖小区34号楼1单元103号}
addr1={新疆喀什市下坝路东湖34号楼1单元103号}(操作:读入地址字符串);
addr2={喀什市下坝路东湖34号楼1单元103号}(操作:匹配并删除“新疆”);
addr3={喀什市}(操作:匹配“市”,删除“市”之后的子字符串);
将addr3与高速存储介质中规整化的地址条目进行匹配,得到规整化的地址为“新疆维吾尔自治区喀什地区喀什市”,相应的地址代码为“653101”。
Address:{新疆疏勒县草湖镇41团3连1区1栋9号}
addr1={新疆疏勒县草湖镇41团3连1栋9号}(操作:读入地址字符串);
addr2={新疆疏勒县草湖镇41团3连1栋9号}(操作:字符串不包括“省”或“直辖市”,无匹配,字符串保持不变);
addr3={新疆疏勒县}(操作:匹配“县”,舍弃“县”之后的子字符串);
将addr3与高速存储介质中的规整化地址条目进行匹配,得到其地址为“新疆维吾尔自治区疏勒县”,相应的地址代码为“653122”。
Address:{乌鲁木齐市水磨沟区六道湾路13号十区平133栋2号}
addr1={乌鲁木齐市水磨沟区六道湾路13号十区平133栋2号}(操作:读入地址字符串);
addr2={乌鲁木齐市水磨沟区六道湾路13号十区平133栋2号}(操作:字符串不包括“省”、“自治区”,无匹配,字符串保持不变);
addr3={乌鲁木齐市水磨沟区六道湾路13号十区}(操作:匹配最后一个“区”,舍弃“区”后的子字符串);
将addr3与高速存储介质中的规整化地址条目进行匹配,无法获取其地址,去掉其末尾字符,继续进行下面的操作:
Address:{乌鲁木齐市水磨沟区六道湾路13号十}
addr1={乌鲁木齐市水磨沟区六道湾路13号十}(操作:读入地址字符串);
addr2={乌鲁木齐市水磨沟区六道湾路13号十}(操作:字符串不包括“省”、“自治区”,无匹配,字符串保持不变);
addr3={乌鲁木齐市水磨沟区}(操作:匹配“区”,舍弃“区”后的子字符串);
将addr3与高速存储介质中的规整化地址条目进行匹配,得到其规整化地址为“新疆维吾尔自治区乌鲁木齐市水磨沟区”,相应的地址代码为“650105”。
Address:{河南省汗市宜阳县董王庄乡南岭村}(不存在的地址)
addr1={河南汗市宜阳县董王庄乡南岭村}(操作:读入地址字符串);
addr2={汗市宜阳县董王庄乡南岭村}(操作:匹配并删除“河南”);
addr3={汗市宜阳县}(操作:匹配“县”,舍弃“县”的子字符串);
将addr3与高速存储介质中的规整化地址条目进行匹配,无法获取其地址,将该地址字符串做末端截取:addr3={汗市};
将addr3与高速存储介质中的规整化地址条目再次进行匹配,仍无法获取其地址,继续将改地址字符串做末端截取,addr3={};
关键字为空,返回无法解析。
可见,本发明可采用现有的省市县区代码大全数据,基于此的字符串截取匹配完成身份证住址信息解析。
具体实施时,还可以采用模块化方式提供相应系统。本发明实施例提供一种基于字符串匹配的身份证住址信息解析系统,包括以下模块:
代码存储模块,用于首先获得全国省市县区及其对应代码,作为初始的地址条目进行规整化处理,包括将省市县及区进行分离,规整后的地址代码条目持久存入数据库中;
初始化模块,用于将数据库中所有规整化的地址代码条目读入存储介质中,对每个地址代码条目同时用两种映射方式存储,一种是设从高级到低级依次为省、市、县、区,取地址代码条目中最低级别的字段与代码的字典映射,记为映射A;另一种是代码到省市县全称的映射,记为映射B;
信息输入模块,用于读入一条身份证住址信息的字符串;
关键信息提取模块,用于对当前读入的这条身份证住址信息的字符串进行处理,只保留区、县和市相应关键字,得到关键信息串;
分级匹配模块,设从低级到高级依次为区、县、市,将关键信息提取模块所得关键信息串从低级到高级依次进行匹配截取,包括以下子模块,
初始子串提取子模块,用于从关键信息串中,提取最低级的子串;
查询匹配子模块,用于将当前所取子串与存储介质中的规整化地址代码条目进行查询匹配,
如果匹配成功则根据映射A返回对应的代码,结束对当前读入的这条身份证住址信息匹配结果,根据映射B由代码检索到相应规范的省市县全称,结束分级匹配模块工作,命令迭代判断模块工作;
否则命令子串更新子模块工作;
子串更新子模块,用于舍弃当前的子串,从关键信息串中,按照区、县、市的顺序,提取高一级的子串,
如果提取失败,匹配失败,结束分级匹配模块工作,命令迭代判断模块工作;
如果提取成功则命令查询匹配子模块工作,直到匹配成功或匹配失败;
迭代判断模块,用于判断如果还需继续进行身份证地址解析,命令信息输入模块读入下一条身份证住址信息的字符串进行处理,否则结束系统工作。
各模块实现可参见相应步骤,本发明不予赘述。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围内。

Claims (2)

1.一种基于字符串匹配的身份证住址信息解析方法,其特征在于:包括以下步骤,
步骤1,首先获得全国省市县区及其对应代码,作为初始的地址条目进行规整化处理,包括将省市县及区进行分离,规整后的地址代码条目持久存入数据库中;
步骤2,初始化,包括将数据库中所有规整化的地址代码条目读入存储介质中,对每个地址代码条目同时用两种映射方式存储,一种是设从高级到低级依次为省、市、县、区,取地址代码条目中最低级别的字段与代码的字典映射,记为映射A;另一种是代码到省市县全称的映射,记为映射B;
步骤3,读入一条身份证住址信息的字符串;
步骤4,对当前读入的这条身份证住址信息的字符串进行处理,只保留区、县和市相应关键字,得到关键信息串;
步骤5,设从低级到高级依次为区、县、市,将步骤4所得关键信息串从低级到高级依次进行匹配截取,包括以下子步骤,
步骤5.1,从关键信息串中,提取最低级的子串;
步骤5.2,将当前所取子串与存储介质中的规整化地址代码条目进行查询匹配,
如果匹配成功则根据映射A返回对应的代码,结束对当前读入的这条身份证住址信息匹配结果,根据映射B由代码检索到相应规范的省市县全称,结束本步骤进入步骤6;
否则进入步骤5.3;
步骤5.3,舍弃当前的子串,从关键信息串中,按照区、县、市的顺序,提取高一级的子串,
如果提取失败,匹配失败,结束本步骤进入步骤6;
如果提取成功则返回执行步骤5.2,直到匹配成功或匹配失败;
步骤6,如果还需继续进行身份证地址解析,返回步骤3读入下一条身份证住址信息的字符串进行处理,否则结束流程。
2.一种基于字符串匹配的身份证住址信息解析系统,其特征在于:包括以下模块,
代码存储模块,用于首先获得全国省市县区及其对应代码,作为初始的地址条目进行规整化处理,包括将省市县及区进行分离,规整后的地址代码条目持久存入数据库中;
初始化模块,用于将数据库中所有规整化的地址代码条目读入存储介质中,对每个地址代码条目同时用两种映射方式存储,一种是设从高级到低级依次为省、市、县、区,取地址代码条目中最低级别的字段与代码的字典映射,记为映射A;另一种是代码到省市县全称的映射,记为映射B;
信息输入模块,用于读入一条身份证住址信息的字符串;
关键信息提取模块,用于对当前读入的这条身份证住址信息的字符串进行处理,只保留区、县和市相应关键字,得到关键信息串;
分级匹配模块,设从低级到高级依次为区、县、市,将关键信息提取模块所得关键信息串从低级到高级依次进行匹配截取,包括以下子模块,
初始子串提取子模块,用于从关键信息串中,提取最低级的子串;
查询匹配子模块,用于将当前所取子串与存储介质中的规整化地址代码条目进行查询匹配,
如果匹配成功则根据映射A返回对应的代码,结束对当前读入的这条身份证住址信息匹配结果,根据映射B由代码检索到相应规范的省市县全称,结束分级匹配模块工作,命令迭代判断模块工作;
否则命令子串更新子模块工作;
子串更新子模块,用于舍弃当前的子串,从关键信息串中,按照区、县、市的顺序,提取高一级的子串,
如果提取失败,匹配失败,结束分级匹配模块工作,命令迭代判断模块工作;
如果提取成功则命令查询匹配子模块工作,直到匹配成功或匹配失败;
迭代判断模块,用于判断如果还需继续进行身份证地址解析,命令信息输入模块读入下一条身份证住址信息的字符串进行处理,否则结束系统工作。
CN201510445546.2A 2015-07-24 2015-07-24 基于字符串匹配的身份证住址信息解析方法及系统 Active CN105069056B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510445546.2A CN105069056B (zh) 2015-07-24 2015-07-24 基于字符串匹配的身份证住址信息解析方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510445546.2A CN105069056B (zh) 2015-07-24 2015-07-24 基于字符串匹配的身份证住址信息解析方法及系统

Publications (2)

Publication Number Publication Date
CN105069056A true CN105069056A (zh) 2015-11-18
CN105069056B CN105069056B (zh) 2018-02-06

Family

ID=54498426

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510445546.2A Active CN105069056B (zh) 2015-07-24 2015-07-24 基于字符串匹配的身份证住址信息解析方法及系统

Country Status (1)

Country Link
CN (1) CN105069056B (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106485225A (zh) * 2016-10-13 2017-03-08 杭州维慕德科技有限公司 基于生物特性识别的身份证核验方法及系统
CN106959961A (zh) * 2016-01-11 2017-07-18 阿里巴巴集团控股有限公司 一种地址识别方法及装置
CN107025232A (zh) * 2016-01-29 2017-08-08 阿里巴巴集团控股有限公司 物流系统中地址信息的处理方法及装置
WO2018018215A1 (zh) * 2016-07-24 2018-02-01 严映军 身份证与频道匹配技术的数据采集方法以及节目播放系统
WO2018018216A1 (zh) * 2016-07-24 2018-02-01 严映军 个性化配置开机频道时的信息推送方法以及节目播放系统
CN109145073A (zh) * 2018-08-28 2019-01-04 成都市映潮科技股份有限公司 一种基于分词算法的地址解析方法及装置
CN109145095A (zh) * 2017-06-16 2019-01-04 贵州小爱机器人科技有限公司 地名信息匹配方法、信息匹配方法、装置及计算机设备
CN109635807A (zh) * 2018-10-16 2019-04-16 深圳壹账通智能科技有限公司 信息录入方法、装置、设备及计算机可读存储介质
CN110019797A (zh) * 2017-11-15 2019-07-16 公安部户政管理研究中心 数据分类方法及装置
CN110020640A (zh) * 2019-04-19 2019-07-16 厦门商集网络科技有限责任公司 一种纠正身份证信息的方法及终端
CN111026830A (zh) * 2019-12-17 2020-04-17 深圳前海环融联易信息科技服务有限公司 基于地址的地区识别方法、装置、计算机设备及存储介质
CN111639493A (zh) * 2020-05-22 2020-09-08 上海微盟企业发展有限公司 一种地址信息标准化方法、装置、设备及可读存储介质
CN113076554A (zh) * 2021-03-12 2021-07-06 广西东信易联科技有限公司 一种基于区块链的体检数据安全存储方法
CN113157762A (zh) * 2020-12-31 2021-07-23 南威软件股份有限公司 基于模糊层级地理位置的规范化方法、系统及数处理终端
CN115775607A (zh) * 2023-02-10 2023-03-10 四川省肿瘤医院 肿瘤患者来源地信息处理系统及其信息处理方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101393544A (zh) * 2008-10-07 2009-03-25 南京师范大学 面向地址编码的中文地址语义解析方法
JP2009205647A (ja) * 2008-02-29 2009-09-10 Softbank Mobile Corp 住所コード出力装置、及びプログラム
CN101882163A (zh) * 2010-06-30 2010-11-10 中国科学院地理科学与资源研究所 一种基于匹配规则的模糊中文地址地理赋值方法
CN103440312A (zh) * 2013-08-27 2013-12-11 深圳市华傲数据技术有限公司 一种通信地址查询邮政编码的系统及终端
WO2015037739A1 (ja) * 2013-09-13 2015-03-19 DigitAddress株式会社 住所コード管理装置及び住所コード管理システム
CN104750852A (zh) * 2015-04-14 2015-07-01 海量云图(北京)数据技术有限公司 中文地址数据的发现与分类方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009205647A (ja) * 2008-02-29 2009-09-10 Softbank Mobile Corp 住所コード出力装置、及びプログラム
CN101393544A (zh) * 2008-10-07 2009-03-25 南京师范大学 面向地址编码的中文地址语义解析方法
CN101882163A (zh) * 2010-06-30 2010-11-10 中国科学院地理科学与资源研究所 一种基于匹配规则的模糊中文地址地理赋值方法
CN103440312A (zh) * 2013-08-27 2013-12-11 深圳市华傲数据技术有限公司 一种通信地址查询邮政编码的系统及终端
WO2015037739A1 (ja) * 2013-09-13 2015-03-19 DigitAddress株式会社 住所コード管理装置及び住所コード管理システム
CN104750852A (zh) * 2015-04-14 2015-07-01 海量云图(北京)数据技术有限公司 中文地址数据的发现与分类方法

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106959961A (zh) * 2016-01-11 2017-07-18 阿里巴巴集团控股有限公司 一种地址识别方法及装置
CN107025232A (zh) * 2016-01-29 2017-08-08 阿里巴巴集团控股有限公司 物流系统中地址信息的处理方法及装置
WO2018018215A1 (zh) * 2016-07-24 2018-02-01 严映军 身份证与频道匹配技术的数据采集方法以及节目播放系统
WO2018018216A1 (zh) * 2016-07-24 2018-02-01 严映军 个性化配置开机频道时的信息推送方法以及节目播放系统
CN106485225A (zh) * 2016-10-13 2017-03-08 杭州维慕德科技有限公司 基于生物特性识别的身份证核验方法及系统
CN109145095B (zh) * 2017-06-16 2024-03-29 贵州小爱机器人科技有限公司 地名信息匹配方法、信息匹配方法、装置及计算机设备
CN109145095A (zh) * 2017-06-16 2019-01-04 贵州小爱机器人科技有限公司 地名信息匹配方法、信息匹配方法、装置及计算机设备
CN110019797A (zh) * 2017-11-15 2019-07-16 公安部户政管理研究中心 数据分类方法及装置
CN109145073A (zh) * 2018-08-28 2019-01-04 成都市映潮科技股份有限公司 一种基于分词算法的地址解析方法及装置
CN109635807A (zh) * 2018-10-16 2019-04-16 深圳壹账通智能科技有限公司 信息录入方法、装置、设备及计算机可读存储介质
CN110020640A (zh) * 2019-04-19 2019-07-16 厦门商集网络科技有限责任公司 一种纠正身份证信息的方法及终端
CN110020640B (zh) * 2019-04-19 2021-08-24 厦门商集网络科技有限责任公司 一种纠正身份证信息的方法及终端
CN111026830A (zh) * 2019-12-17 2020-04-17 深圳前海环融联易信息科技服务有限公司 基于地址的地区识别方法、装置、计算机设备及存储介质
CN111026830B (zh) * 2019-12-17 2023-03-03 深圳前海环融联易信息科技服务有限公司 基于地址的地区识别方法、装置、计算机设备及存储介质
CN111639493A (zh) * 2020-05-22 2020-09-08 上海微盟企业发展有限公司 一种地址信息标准化方法、装置、设备及可读存储介质
CN113157762A (zh) * 2020-12-31 2021-07-23 南威软件股份有限公司 基于模糊层级地理位置的规范化方法、系统及数处理终端
CN113076554A (zh) * 2021-03-12 2021-07-06 广西东信易联科技有限公司 一种基于区块链的体检数据安全存储方法
CN115775607A (zh) * 2023-02-10 2023-03-10 四川省肿瘤医院 肿瘤患者来源地信息处理系统及其信息处理方法
CN115775607B (zh) * 2023-02-10 2023-12-01 四川省肿瘤医院 肿瘤患者来源地信息处理系统

Also Published As

Publication number Publication date
CN105069056B (zh) 2018-02-06

Similar Documents

Publication Publication Date Title
CN105069056A (zh) 基于字符串匹配的身份证住址信息解析方法及系统
CN106777644B (zh) 电厂标识系统编码的自动生成方法及装置
CN105630765A (zh) 地名地址识别方法
CN105528372A (zh) 一种地址搜索方法和设备
CN104624509A (zh) 一种快递自动分拣系统及自动分拣方法
CN110532347B (zh) 一种日志数据处理方法、装置、设备和存储介质
CN110990520B (zh) 一种地址编码方法、装置、电子设备和存储介质
CN105373588A (zh) 快递分拣装置及方法
CN111159974A (zh) 地址信息的标准化方法、装置、存储介质及电子设备
WO2022100154A1 (zh) 基于人工智能的地址标准化方法、装置、设备和存储介质
CN113033198A (zh) 相似文本推送方法、装置、电子设备及计算机存储介质
CN111724110A (zh) 地址信息处理方法、装置、计算机设备和存储介质
CN104252446A (zh) 计算装置、文件内容一致性验证系统及方法
CN105205173A (zh) 基于关键词数据库检索的快递分拣装置及方法
CN116414824A (zh) 行政区划信息识别和标准化处理的方法、装置及存储介质
CN113761137A (zh) 一种提取地址信息的方法及装置
CN111190937A (zh) 籍贯信息的查询方法、装置、电子设备及存储介质
CN112487122B (zh) 地址归一化处理方法及装置
CN113221558B (zh) 一种快递地址纠错方法、装置、存储介质及电子设备
CN105740374A (zh) 基于分布式内存的三维平台数据模糊查询方法
CN108572948B (zh) 门牌信息的处理方法及装置
CN111401051B (zh) 快递信息解析方法及系统
CN113434413A (zh) 基于数据差异的数据测试方法、装置、设备及存储介质
CN116431625A (zh) 一种地理实体的定位分析方法、装置及计算机设备
CN109785099B (zh) 一种自动对业务数据信息进行处理的方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant