CN114819987A - 证件地址一致性核查方法、装置、设备及存储介质 - Google Patents
证件地址一致性核查方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN114819987A CN114819987A CN202210427130.8A CN202210427130A CN114819987A CN 114819987 A CN114819987 A CN 114819987A CN 202210427130 A CN202210427130 A CN 202210427130A CN 114819987 A CN114819987 A CN 114819987A
- Authority
- CN
- China
- Prior art keywords
- address information
- address
- segmentation
- division
- consistent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000003860 storage Methods 0.000 title claims abstract description 27
- 230000011218 segmentation Effects 0.000 claims abstract description 206
- 238000012795 verification Methods 0.000 claims description 21
- 230000006870 function Effects 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 14
- 238000012216 screening Methods 0.000 claims description 12
- 238000004422 calculation algorithm Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 5
- 238000012015 optical character recognition Methods 0.000 claims description 4
- 238000005516 engineering process Methods 0.000 abstract description 2
- 238000007726 management method Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 238000013500 data storage Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 244000144730 Amygdalus persica Species 0.000 description 2
- 235000006040 Prunus persica var persica Nutrition 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/018—Certifying business or products
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/194—Calculation of difference between files
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Accounting & Taxation (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Entrepreneurship & Innovation (AREA)
- Health & Medical Sciences (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Finance (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明涉及大数据技术领域,公开了一种证件地址一致性核查方法、装置、设备及存储介质,用于提高企业经营证件地址一致性的核查效率。所述证件地址一致性核查方法包括:对两个企业经营证件原始地址信息进行字符分割,得到第一分割地址信息和第二分割地址信息;比较第一分割地址信息对应的单位名称与第二分割地址信息对应的单位名称是否一致;若单位名称一致,则判断第一分割地址信息对应的门牌号与第二分割地址信息对应的门牌号是否一致;若门牌号一致,则确定两个企业经营证件原始地址信息相同。此外,本发明还涉及区块链技术,两个企业经营证件原始地址信息可存储于区块链节点中。
Description
技术领域
本发明涉及大数据的知识关系分析技术领域,尤其涉及一种证件地址一致性核查方法、装置、设备及存储介质。
背景技术
一址多证是指将同一经营场所地址作为二个及以上企业的住所登记注册,形成一个地址核发多个企业经营许可证。而部分企业经营许可证的地址从字面上是不相同的,但实际上代表了同一地址。
现有业内产品一般根据地址字符进行证件地址匹配计算,无法按照实际逻辑查找所有的相同地址,存在企业经营证件地址一致性核查效率低,以及重复地址识别准确率低的问题。
发明内容
本发明提供了一种证件地址一致性核查方法、装置、设备及存储介质,用于提高企业经营证件地址一致性的核查效率,以及提高重复地址的识别准确率。
为实现上述目的,本发明第一方面提供了一种证件地址一致性核查方法,包括:获取两个企业经营证件原始地址信息,并对所述两个企业经营证件原始地址信息进行字符分割,得到第一分割地址信息和第二分割地址信息,所述第一分割地址信息和所述第二分割地址信息均包括对应的单位名称和门牌号;比较所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称是否一致;若所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称一致,则判断所述第一分割地址信息对应的门牌号与所述第二分割地址信息对应的门牌号是否一致;若所述第一分割地址信息对应的门牌号与所述第二分割地址信息对应的门牌号一致,则确定所述两个企业经营证件原始地址信息属于相同地址。
可选的,在本发明第一方面的第一种实现方式中,所述获取两个企业经营证件原始地址信息,并对所述两个企业经营证件原始地址信息进行字符分割,得到第一分割地址信息和第二分割地址信息,包括:获取两个企业经营证件图像数据;通过预设光学字符识别算法对所述两个企业经营证件图像数据进行识别,得到两个企业经营证件原始地址信息;按照预设地址维度对所述两个企业经营证件原始地址信息进行字符分割,得到第一分割地址信息和第二分割地址信息。
可选的,在本发明第一方面的第二种实现方式中,所述比较所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称是否一致,包括:当所述第一分割地址信息和/或所述第二分割地址信息均未包含社区地址要素,且所述第一分割地址信息和所述第二分割地址信息之间存在五位地址要素关键词一致时,确定所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称一致;当所述第一分割地址信息和所述第二分割地址信息均包含社区地址要素和村地址要素,且所述第一分割地址信息和所述第二分割地址信息之间存在八位地址要素关键词一致时,确定所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称一致;当所述第一分割地址信息和所述第二分割地址信息均包含社区地址要素,且所述第一分割地址信息和所述第二分割地址信息之间存在七位地址要素关键词一致时,确定所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称一致。
可选的,在本发明第一方面的第三种实现方式中,所述比较所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称是否一致,包括:从所述第一分割地址信息和所述第二分割地址信息中获取第一末位地址和第二末位地址,所述第一末位地址和所述第二末位地址为非中文字符或号地址要素;按照预设相似度算法对所述第一末位地址和所述第二末位地址进行相似度计算,得到末位地址相似度;当所述末位地址相似度大于预设地址相似度阈值时,根据所述第一末位地址和所述第二末位地址判断所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称是否一致。
可选的,在本发明第一方面的第四种实现方式中,所述当所述末位地址相似度大于预设地址相似度阈值时,根据所述第一末位地址和所述第二末位地址判断所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称是否一致,包括:当所述末位地址相似度大于预设地址相似度阈值时,判断所述第一末位地址和所述第二末位地址是否均包含号地址要素;若所述第一末位地址和所述第二末位地址是否均包含号地址要素,则判断所述第一分割地址信息和所述第二分割地址信息是否均不包含社区地址要素;若所述第一分割地址信息和所述第二分割地址信息均不包含社区地址要素,且所述第一分割地址信息和所述第二分割地址信息之间存在至少四位其他地址要素关键词一致,则确定所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称一致;若所述第一分割地址信息和所述第二分割地址信息均包含社区地址要素,且所述第一分割地址信息和所述第二分割地址信息之间存在至少五位其他地址要素关键词一致,则确定所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称一致;若所述第一末位地址和所述第二末位地址均不包含号地址要素,且所述第一分割地址信息和所述第二分割地址信息之间存在至少两位其他地址要素关键词一致,则确定所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称一致。
可选的,在本发明第一方面的第五种实现方式中,所述若所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称一致,则判断所述第一分割地址信息对应的门牌号与所述第二分割地址信息对应的门牌号是否一致,包括:若所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称一致,则根据预设正则表达式从所述第一分割地址信息和所述第二分割地址信息中筛选门牌号,得到第一门牌号和第二门牌号;根据预设字符串比较函数比较所述第一门牌号和所述第二门牌号是否相同;若所述第一门牌号和所述第二门牌号相同,则确定所述第一分割地址信息对应的门牌号与所述第二分割地址信息对应的门牌号一致。
可选的,在本发明第一方面的第六种实现方式中,在所述若所述第一分割地址信息对应的门牌号与所述第二分割地址信息对应的门牌号一致,则确定所述两个企业经营证件原始地址信息属于相同地址之后,所述证件地址一致性核查方法还包括:对所述两个企业经营证件原始地址信息设置地址一致标签,并将所述两个企业经营证件原始地址信息存储至预设地址核验数据表中;基于所述预设地址核验数据表中的各企业经营证件原始地址信息构建企业经营证件知识图谱。
本发明第二方面提供了一种证件地址一致性核查装置,包括:分割模块,用于获取两个企业经营证件原始地址信息,并对所述两个企业经营证件原始地址信息进行字符分割,得到第一分割地址信息和第二分割地址信息,所述第一分割地址信息和所述第二分割地址信息均包括对应的单位名称和门牌号;比较模块,用于比较所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称是否一致;判断模块,用于若所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称一致,则判断所述第一分割地址信息对应的门牌号与所述第二分割地址信息对应的门牌号是否一致;确定模块,用于若所述第一分割地址信息对应的门牌号与所述第二分割地址信息对应的门牌号一致,则确定所述两个企业经营证件原始地址信息属于相同地址。
可选的,在本发明第二方面的第一种实现方式中,所述分割模块具体用于:获取两个企业经营证件图像数据;通过预设光学字符识别算法对所述两个企业经营证件图像数据进行识别,得到两个企业经营证件原始地址信息;按照预设地址维度对所述两个企业经营证件原始地址信息进行字符分割,得到第一分割地址信息和第二分割地址信息。
可选的,在本发明第二方面的第二种实现方式中,所述比较模块具体用于:第一确定单元,用于当所述第一分割地址信息和/或所述第二分割地址信息均未包含社区地址要素,且所述第一分割地址信息和所述第二分割地址信息之间存在五位地址要素关键词一致时,确定所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称一致;第二确定单元,用于当所述第一分割地址信息和所述第二分割地址信息均包含社区地址要素和村地址要素,且所述第一分割地址信息和所述第二分割地址信息之间存在八位地址要素关键词一致时,确定所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称一致;第三确定单元,用于当所述第一分割地址信息和所述第二分割地址信息均包含社区地址要素,且所述第一分割地址信息和所述第二分割地址信息之间存在七位地址要素关键词一致时,确定所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称一致。
可选的,在本发明第二方面的第三种实现方式中,所述比较模块具体用于:获取单元,用于从所述第一分割地址信息和所述第二分割地址信息中获取第一末位地址和第二末位地址,所述第一末位地址和所述第二末位地址为非中文字符或号地址要素;计算单元,用于按照预设相似度算法对所述第一末位地址和所述第二末位地址进行相似度计算,得到末位地址相似度;第四确定单元,用于当所述末位地址相似度大于预设地址相似度阈值时,根据所述第一末位地址和所述第二末位地址判断所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称是否一致。
可选的,在本发明第二方面的第四种实现方式中,所述第四确定单元具体用于:当所述末位地址相似度大于预设地址相似度阈值时,判断所述第一末位地址和所述第二末位地址是否均包含号地址要素;若所述第一末位地址和所述第二末位地址是否均包含号地址要素,则判断所述第一分割地址信息和所述第二分割地址信息是否均不包含社区地址要素;若所述第一分割地址信息和所述第二分割地址信息均不包含社区地址要素,且所述第一分割地址信息和所述第二分割地址信息之间存在至少四位其他地址要素关键词一致,则确定所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称一致;若所述第一分割地址信息和所述第二分割地址信息均包含社区地址要素,且所述第一分割地址信息和所述第二分割地址信息之间存在至少五位其他地址要素关键词一致,则确定所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称一致;若所述第一末位地址和所述第二末位地址均不包含号地址要素,且所述第一分割地址信息和所述第二分割地址信息之间存在至少两位其他地址要素关键词一致,则确定所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称一致。
可选的,在本发明第二方面的第五种实现方式中,所述判断模块具体用于:若所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称一致,则根据预设正则表达式从所述第一分割地址信息和所述第二分割地址信息中筛选门牌号,得到第一门牌号和第二门牌号;根据预设字符串比较函数比较所述第一门牌号和所述第二门牌号是否相同;若所述第一门牌号和所述第二门牌号相同,则确定所述第一分割地址信息对应的门牌号与所述第二分割地址信息对应的门牌号一致。
可选的,在本发明第二方面的第六种实现方式中,所述证件地址一致性核查装置还包括:设置模块,用于对所述两个企业经营证件原始地址信息设置地址一致标签,并将所述两个企业经营证件原始地址信息存储至预设地址核验数据表中;构建模块,用于基于所述预设地址核验数据表中的各企业经营证件原始地址信息构建企业经营证件知识图谱。
本发明第三方面提供了一种证件地址一致性核查设备,包括:存储器和至少一个处理器,所述存储器中存储有计算机程序;所述至少一个处理器调用所述存储器中的所述计算机程序,以使得所述证件地址一致性核查设备执行上述的证件地址一致性核查方法。
本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,当其在计算机上运行时,使得计算机执行上述的证件地址一致性核查方法。
本发明提供的技术方案中,获取两个企业经营证件原始地址信息,并对所述两个企业经营证件原始地址信息进行字符分割,得到第一分割地址信息和第二分割地址信息,所述第一分割地址信息和所述第二分割地址信息均包括对应的单位名称和门牌号;比较所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称是否一致;若所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称一致,则判断所述第一分割地址信息对应的门牌号与所述第二分割地址信息对应的门牌号是否一致;若所述第一分割地址信息对应的门牌号与所述第二分割地址信息对应的门牌号一致,则确定所述两个企业经营证件原始地址信息属于相同地址。本发明实施例中,通过两个企业经营证件原始地址信息获取第一分割地址信息和第二分割地址信息,并依次对第一分割地址信息与第二分割地址信息进行单位名称和门牌号比对,若单位名称和门牌号均一致,则确定两个企业经营证件原始地址信息相同,提高了企业经营证件地址一致性的核查效率,并能够有效识别企业经营证件的重复地址,提高了识别准确率。
附图说明
图1为本发明实施例中证件地址一致性核查方法的一个实施例示意图;
图2为本发明实施例中证件地址一致性核查方法的另一个实施例示意图;
图3为本发明实施例中证件地址一致性核查装置的一个实施例示意图;
图4为本发明实施例中证件地址一致性核查装置的另一个实施例示意图;
图5为本发明实施例中证件地址一致性核查设备的一个实施例示意图。
具体实施方式
本发明实施例提供了一种证件地址一致性核查方法、装置、设备及存储介质,用于提高企业经营证件地址一致性的核查效率,以及提高重复地址的识别准确率。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中证件地址一致性核查方法的一个实施例包括:
101、获取两个企业经营证件原始地址信息,并对两个企业经营证件原始地址信息进行字符分割,得到第一分割地址信息和第二分割地址信息,第一分割地址信息和第二分割地址信息均包括对应的单位名称和门牌号。
具体的,服务器接收证件地址一致性核查请求;服务器解析证件地址一致性核查请求,得到解析数据;服务器对解析数据进行地址校验,得到校验结果;当校验结果为校验通过时,服务器从解析数据中提取两个企业经营证件原始地址信息;服务器按照预设地址维度分别对两个企业经营证件原始地址信息进行字符分割,得到第一分割地址信息和第二分割地址信息,预设地址维度包括市、省、区、街道、社区、大道、县、镇、路、交汇处、交叉口、交界、巷、号、村、坊、侧、段、老街、小区等。也就是,服务器按照预设地址维度对两个企业经营证件原始地址信息进行字符串切分。例如,企业经营证件原始地址信息A为深圳市南山区西丽街道新围社区官龙路官龙村西区22号101,被分割为如下形式:深圳市、南山区、西丽街道、新围社区、官龙路、官龙村、西区、22号、101,得到第一分割地址信息a。进一步地,服务器将“深圳市南山区西丽街道新围社区官龙路官龙村西区22号”作为该第一分割地址信息a对应的单位名称,服务器将“101”作为该第一分割地址信息a对应的门牌号。另一个企业经营证件原始地址信息分地址分割方式,以及第二分割地址信息对应的单位名称和门牌号设置方式分别与企业经营证件原始地址信息A和第一分割地址信息a相同,具体此处不再赘述。
需要说明的是,两个企业经营证件原始地址信息来源于两个企业经营证件,两个企业经营证件原始地址信息的写法存在差异,服务器需要对两个企业经营证件原始地址信息进行地址一致性核查。本发明也可以适用于三个以及三个以上企业经营证件原始地址信息地址比对。
可以理解的是,本发明的执行主体可以为证件地址一致性核查装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。
102、比较第一分割地址信息对应的单位名称与第二分割地址信息对应的单位名称是否一致。
需要说明的是,服务器可以预设地址维度对第一分割地址信息和第二分割地址信息进行一一比对,以确定第一分割地址信息对应的单位名称与第二分割地址信息对应的单位名称的一致性。为了提高地址一致性核查效率,服务器还可以通过预设基础比对流程函数和预设末位地址比对流程函数对第一分割地址信息对应的单位名称与第二分割地址信息对应的单位名称进行一致性判定。
具体的,服务器执行预设基础比对流程函数,也就是,服务器筛查第一分割地址信息和第二分割地址信息是否包含目标地址要素,当第一分割地址信息和第二分割地址信息均包含目标地址要素时,服务器继续判断第一分割地址信息与第二分割地址信息之间是否存在预设位数地址要素关键词相同,若第一分割地址信息与第二分割地址信息之间存在预设位数地址要素关键词相同,则服务器确定第一分割地址信息对应的单位名称与第二分割地址信息对应的单位名称一致。其中,目标地址要素和预设位数地址要素关键词均属于第一分割地址信息对应的单位名称与第二分割地址信息对应的单位名称。例如,目标地址要素为社区地址要素和村地址要素,预设位数地址要素关键词为8个维度上的地址要素关键词(也就是八位地址要素关键词)例如,深圳市、南山区、西丽街道、新围社区、官龙路、官龙村、西区、22号,即为同时含有社区地址要素和村地址要素的分割地址信息,第一分割地址信息与第二分割地址信息之间存在以上八位地址要素关键词一致时,服务器确定第一分割地址信息对应的单位名称与第二分割地址信息对应的单位名称一致。可以理解的是,目标地址要素和预设位数地址要素关键词存在一一对应关系,并且目标地址要素和预设位数地址要素关键词预先存储于预设基础映射关系表中,服务器在执行预设基础比对流程函数过程中,可以从预设映射关系表中获取目标地址要素和预设位数地址要素关键词。
进一步地,服务器执行预设末位地址比对流程函数,需要说明的是,末位地址为第一分割地址信息对应的单位名称和第二分割地址信息对应的单位名称各自对应的最小单位地址。当第一分割地址信息与第二分割地址信息均符合预设末位地址要素筛查条件,且其他地址要素关键词满足预设位地址要素相同条件时,服务器确定第一分割地址信息对应的单位名称与第二分割地址信息对应的单位名称一致。例如,预设末位地址要素筛查条件为第一分割地址信息对应的末位地址与第二分割地址信息对应的末位地址均包含号地址要素,且第一分割地址信息与第二分割地址信息中均不包含社区地址要素,预设位地址要素相同条件为其他地址要素关键词保持四位以上一致;预设末位地址要素筛查条件为第一分割地址信息对应的末位地址与第二分割地址信息对应的末位地址均包含号地址要素,且第一分割地址信息与第二分割地址信息中均包含社区地址要素,预设位地址要素相同条件为其他地址要素关键词保持五位以上一致;预设末位地址要素筛查条件为第一分割地址信息对应的末位地址与第二分割地址信息对应的末位地址均未包含号地址要素,预设位地址要素相同条件为其他地址要素关键词保持至少两位以上一致。可以理解的是,预设末位地址要素筛查条件和预设位地址要素相同条件存在一一对应关系,并且预设末位地址要素筛查条件和预设位地址要素相同条件预先存储于预设末位地址映射关系表中,服务器在执行预设末位地址比对流程函数过程中,可以从预设末位地址映射关系表中获取预设末位地址要素筛查条件和预设位地址要素相同条件。
需要说明的是,目标地址要素和预设位数地址要素关键词,以及预设末位地址要素筛查条件和预设位地址要素相同条件并不局限于本实施例中举例说明部分,可以根据实际业务进行动态配置和调整。
103、若第一分割地址信息对应的单位名称与第二分割地址信息对应的单位名称一致,则判断第一分割地址信息对应的门牌号与第二分割地址信息对应的门牌号是否一致。
其中,第一分割地址信息对应的门牌号和第二分割地址信息对应的门牌号均可以包括数字、字母和其他字符组合而成,例如,第一分割地址信息对应的门牌号为1-3b,而第二分割地址信息对应的门牌号为1-3B。具体的,若第一分割地址信息对应的单位名称与第二分割地址信息对应的单位名称一致,则服务器判断第一分割地址信息对应的门牌号与第二分割地址信息对应的门牌号之间的数据格式是否一致;若第一分割地址信息对应的门牌号与第二分割地址信息对应的门牌号之间的数据格式一致,则服务器通过预设字符串比较函数比较第一分割地址信息对应的门牌号与第二分割地址信息对应的门牌号是否相同,其中,预设字符串比较函数忽略门牌号中字母的大小写;若第一分割地址信息对应的门牌号与第二分割地址信息对应的门牌号相同,则服务器确定第一分割地址信息对应的门牌号与第二分割地址信息对应的门牌号一致;若第一分割地址信息对应的门牌号与第二分割地址信息对应的门牌号之间的数据格式不一致,则服务器统一第一分割地址信息对应的门牌号和第二分割地址信息对应的门牌号各自对应的数据格式,并比较第一分割地址信息对应的门牌号与第二分割地址信息对应的门牌号是否相同,若第一分割地址信息对应的门牌号与第二分割地址信息对应的门牌号相同,则服务器确定第一分割地址信息对应的门牌号与第二分割地址信息对应的门牌号一致。例如,第一分割地址信息对应的门牌号为1-3b,而第二分割地址信息对应的门牌号为1_3B,服务器将第二分割地址信息对应的门牌号转换为1-3B,服务器确定1-3b与1-3B是一致的。
104、若第一分割地址信息对应的门牌号与第二分割地址信息对应的门牌号一致,则确定两个企业经营证件原始地址信息属于相同地址。
也就是,属于相同地址的两个企业经营证件原始地址信息对应不同的地址写法,但实质为同一经营场所地址。进一步地,服务器对相同地址的两个企业经营证件原始地址信息进行抽检处理,具体的,服务器按照两个企业经营证件原始地址信息生成地址核查一致性审核请求,并向目标审核人员发送地址核查一致性审核请求,得到审核结果和审核反馈信息;当审核结果为审核不通过时,服务器按照审核反馈信息重新比对两个企业经营证件原始地址信息,以确保地址核查一致性的稳定性和准确性。进一步地,服务器将两个企业经营证件原始地址信息存储于区块链数据库中,具体此处不做限定。
本发明实施例中,通过两个企业经营证件原始地址信息获取第一分割地址信息和第二分割地址信息,并依次对第一分割地址信息与第二分割地址信息进行单位名称和门牌号比对,若单位名称和门牌号均一致,则确定两个企业经营证件原始地址信息相同,提高了企业经营证件地址一致性的核查效率,并能够有效识别企业经营证件的重复地址,提高了识别准确率。
请参阅图2,本发明实施例中证件地址一致性核查方法的另一个实施例包括:
201、获取两个企业经营证件原始地址信息,并对两个企业经营证件原始地址信息进行字符分割,得到第一分割地址信息和第二分割地址信息,第一分割地址信息和第二分割地址信息均包括对应的单位名称和门牌号。
其中,第一分割地址信息和第二分割地址信息用于指示按照预设地址维度切分后的字符串。可选的,服务器获取两个企业经营证件图像数据;服务器通过预设光学字符识别算法对两个企业经营证件图像数据进行识别,得到两个企业经营证件原始地址信息,进一步地,服务器对两个企业经营证件图像数据进行图像预处理,得到两个预处理后的企业经营证件图像数据,服务器通过预设图像分割模型分别对两个企业经营证件图像数据进行图像裁剪,得到各企业经营证件图像数据各自对应的原始地址区域,服务器通过预设光学字符识别算法识别各企业经营证件图像数据各自对应的原始地址区域,得到第一分割地址信息和第二分割地址信息;服务器按照预设地址维度对两个企业经营证件原始地址信息进行字符分割,得到第一分割地址信息和第二分割地址信息。其中,预设地址维度包括市、省、区、街道、社区、大道、县、镇、路、交汇处、交叉口、交界、巷、号、村、坊、侧、段、老街、小区等。例如,一个企业经营证件原始地址信息为深圳市南山区前海自贸大厦A33,服务器获取企业经营证件原始地址信息对应的分割地址信息(第一分割地址信息或第二分割地址信息)为深圳市、南山区、前海自贸大厦、A33。
202、比较第一分割地址信息对应的单位名称与第二分割地址信息对应的单位名称是否一致。
可选的,当第一分割地址信息和/或第二分割地址信息均未包含社区地址要素,且第一分割地址信息和第二分割地址信息之间存在五位地址要素关键词一致时,服务器确定第一分割地址信息对应的单位名称与第二分割地址信息对应的单位名称一致;当第一分割地址信息和第二分割地址信息均包含社区地址要素和村地址要素,且第一分割地址信息和第二分割地址信息之间存在八位地址要素关键词一致时,服务器确定第一分割地址信息对应的单位名称与第二分割地址信息对应的单位名称一致;当第一分割地址信息和第二分割地址信息均包含社区地址要素,且第一分割地址信息和第二分割地址信息之间存在七位地址要素关键词一致时,服务器确定第一分割地址信息对应的单位名称与第二分割地址信息对应的单位名称一致。例如,第一分割地址信息A和第二分割地址信息B均包含社区地址要素为阳光社区,当第一分割地址信息A和第二分割地址信息B中均包含深圳市、南山区、西丽街道、阳光社区、阳光一路、新健工业区、8栋,也就是第一分割地址信息A和第二分割地址信息B之间存在七位地址要素关键词一致时,服务器确定第一分割地址信息A对应的单位名称与第二分割地址信息B对应的单位名称一致。
进一步地,服务器从第一分割地址信息和第二分割地址信息中获取第一末位地址和第二末位地址,第一末位地址和第二末位地址为非中文字符或号地址要素,例如,第一末位地址为A33,则不包含中文字符,第一末位地址为22号,则为号地址要素,号地址要素为包含中文字符;服务器按照预设相似度算法对第一末位地址和第二末位地址进行相似度计算,得到末位地址相似度;当末位地址相似度大于预设地址相似度阈值时,服务器根据第一末位地址和第二末位地址判断第一分割地址信息对应的单位名称与第二分割地址信息对应的单位名称是否一致。可选的,当末位地址相似度大于预设地址相似度阈值时,服务器判断第一末位地址和第二末位地址是否均包含号地址要素;若第一末位地址和第二末位地址是否均包含号地址要素,则服务器判断第一分割地址信息和第二分割地址信息是否均不包含社区地址要素;若第一分割地址信息和第二分割地址信息均不包含社区地址要素,且第一分割地址信息和第二分割地址信息之间存在至少四位其他地址要素关键词一致,则服务器确定第一分割地址信息对应的单位名称与第二分割地址信息对应的单位名称一致;若第一分割地址信息和第二分割地址信息均包含社区地址要素,且第一分割地址信息和第二分割地址信息之间存在至少五位其他地址要素关键词一致,则服务器确定第一分割地址信息对应的单位名称与第二分割地址信息对应的单位名称一致;若第一末位地址和第二末位地址均不包含号地址要素,且第一分割地址信息和第二分割地址信息之间存在至少两位其他地址要素关键词一致,则服务器确定第一分割地址信息对应的单位名称与第二分割地址信息对应的单位名称一致。例如,第一分割地址信息对应的单位名称为深圳市南山区前海自贸大厦,第二分割地址信息为深圳市南山区粤海街道前海自贸大厦,则第一末位地址和第二末位地址均为前海自贸大厦,也就是第一末位地址和第二末位地址均不包含号地址要素,当深圳市和南山区这两位地址要素关键词一致时,服务器确定第一分割地址信息对应的单位名称与第二分割地址信息对应的单位名称一致。
需要说明的是,当服务器执行按照预设相似度算法对第一末位地址和第二末位地址进行相似度计算,得到末位地址相似度步骤时,服务器判断第一末位地址和第二末位地址是否均为号地址要素(也就是,末位地址含有中文字符则),若第一末位地址和第二末位地址均为号地址要素,则服务器直接执行该步骤;若第一末位地址和/或第二末位地址均为号地址要素均为非中文字符,则服务器分别提取与第一末位地址和第二末位地址相邻的前置地址,并按照预设相似度算法对与第一末位地址和第二末位地址相邻的前置地址进行相似度计算,得到末位地址相似度。例如,与第一末位地址和第二末位地址相邻的前置地址分别为桃源村和桃源新村。或者,第一分割地址信息为深圳市、南山区、前海自贸大厦、A33,以及第二分割地址信息为深圳市、南山区、粤海街道、前海合作区自贸大厦、A-33,A33和A-33分别为第一末位地址和第二末位地址,但是均不包含中文字符,服务器需要对比前海自贸大厦和前海合作区自贸大厦之间的相似度。
203、若第一分割地址信息对应的单位名称与第二分割地址信息对应的单位名称一致,则判断第一分割地址信息对应的门牌号与第二分割地址信息对应的门牌号是否一致。
其中,第一分割地址信息对应的门牌号与第二分割地址信息对应的门牌号用于指示两个企业经营证件原始地址信息的住址编号。可选的,若第一分割地址信息对应的单位名称与第二分割地址信息对应的单位名称一致,则服务器根据预设正则表达式从第一分割地址信息和第二分割地址信息中筛选门牌号,得到第一门牌号和第二门牌号;服务器根据预设字符串比较函数比较第一门牌号和第二门牌号是否相同,预设字符串比较函数不区分大小写字母;若第一门牌号和第二门牌号相同,则服务器确定第一分割地址信息对应的门牌号与第二分割地址信息对应的门牌号一致。
204、若第一分割地址信息对应的门牌号与第二分割地址信息对应的门牌号一致,则确定两个企业经营证件原始地址信息属于相同地址。
该步骤204的具体执行过程与步骤104的具体执行过程相似,具体此处不再赘述。
205、对两个企业经营证件原始地址信息设置地址一致标签,并将两个企业经营证件原始地址信息存储至预设地址核验数据表中。
具体的,服务器接收标签设置请求,并根据标签设置请求获取标签设置规则;服务器按照标签设置规则对两个企业经营证件原始地址信息设置地址一致标签;服务器将两个企业经营证件原始地址信息转换为数据存储语句;服务器执行数据存储语句,以将两个企业经营证件原始地址信息更新至预设地址核验数据表中。其中,预设地址核验数据表用于存储多个企业经营证件原始地址信息以及各企业经营证件对应的基本信息。
206、基于预设地址核验数据表中的各企业经营证件原始地址信息构建企业经营证件知识图谱。
具体的,服务器接收企业经营证件知识图谱生成请求;服务器按照企业经营证件知识图谱生成请求从预设地址核验数据表中读取多个企业经营证件原始地址信息和各企业经营证件对应的基本信息;服务器对多个企业经营证件原始地址信息和各企业经营证件对应的基本信息进行数据清洗、文本切分以及实体分析处理,得到企业经营证件实体关系,并基于企业经营证件实体关系生成企业经营证件知识图谱,企业经营证件知识图谱存储于预设图数据库中。
本发明实施例中,通过两个企业经营证件原始地址信息获取第一分割地址信息和第二分割地址信息,并依次对第一分割地址信息与第二分割地址信息进行单位名称和门牌号比对,若单位名称和门牌号均一致,则确定两个企业经营证件原始地址信息相同,提高了企业经营证件地址一致性的核查效率,并能够有效识别企业经营证件的重复地址,提高了识别准确率。
上面对本发明实施例中证件地址一致性核查方法进行了描述,下面对本发明实施例中证件地址一致性核查装置进行描述,请参阅图3,本发明实施例中证件地址一致性核查装置的一个实施例包括:
分割模块301,用于获取两个企业经营证件原始地址信息,并对所述两个企业经营证件原始地址信息进行字符分割,得到第一分割地址信息和第二分割地址信息,所述第一分割地址信息和所述第二分割地址信息均包括对应的单位名称和门牌号;
比较模块302,用于比较所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称是否一致;
判断模块303,用于若所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称一致,则判断所述第一分割地址信息对应的门牌号与所述第二分割地址信息对应的门牌号是否一致;
确定模块304,用于若所述第一分割地址信息对应的门牌号与所述第二分割地址信息对应的门牌号一致,则确定所述两个企业经营证件原始地址信息属于相同地址。
进一步地,将两个企业经营证件原始地址信息存储于区块链数据库中,具体此处不做限定。
本发明实施例中,通过两个企业经营证件原始地址信息获取第一分割地址信息和第二分割地址信息,并依次对第一分割地址信息与第二分割地址信息进行单位名称和门牌号比对,若单位名称和门牌号均一致,则确定两个企业经营证件原始地址信息相同,提高了企业经营证件地址一致性的核查效率,并能够有效识别企业经营证件的重复地址,提高了识别准确率。
请参阅图4,本发明实施例中证件地址一致性核查装置的另一个实施例包括:
分割模块301,用于获取两个企业经营证件原始地址信息,并对所述两个企业经营证件原始地址信息进行字符分割,得到第一分割地址信息和第二分割地址信息,所述第一分割地址信息和所述第二分割地址信息均包括对应的单位名称和门牌号;
比较模块302,用于比较所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称是否一致;
判断模块303,用于若所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称一致,则判断所述第一分割地址信息对应的门牌号与所述第二分割地址信息对应的门牌号是否一致;
确定模块304,用于若所述第一分割地址信息对应的门牌号与所述第二分割地址信息对应的门牌号一致,则确定所述两个企业经营证件原始地址信息属于相同地址。
可选的,分割模块301还可以具体用于:
获取两个企业经营证件图像数据;
通过预设光学字符识别算法对所述两个企业经营证件图像数据进行识别,得到两个企业经营证件原始地址信息;
按照预设地址维度对所述两个企业经营证件原始地址信息进行字符分割,得到第一分割地址信息和第二分割地址信息。
可选的,比较模块302还可以包括:
第一确定单元3021,用于当所述第一分割地址信息和/或所述第二分割地址信息均未包含社区地址要素,且所述第一分割地址信息和所述第二分割地址信息之间存在五位地址要素关键词一致时,确定所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称一致;
第二确定单元3022,用于当所述第一分割地址信息和所述第二分割地址信息均包含社区地址要素和村地址要素,且所述第一分割地址信息和所述第二分割地址信息之间存在八位地址要素关键词一致时,确定所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称一致;
第三确定单元3023,用于当所述第一分割地址信息和所述第二分割地址信息均包含社区地址要素,且所述第一分割地址信息和所述第二分割地址信息之间存在七位地址要素关键词一致时,确定所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称一致。
可选的,比较模块302还可以包括:
获取单元3024,用于从所述第一分割地址信息和所述第二分割地址信息中获取第一末位地址和第二末位地址,所述第一末位地址和所述第二末位地址为非中文字符或号地址要素;
计算单元3025,用于按照预设相似度算法对所述第一末位地址和所述第二末位地址进行相似度计算,得到末位地址相似度;
第四确定单元3026,用于当所述末位地址相似度大于预设地址相似度阈值时,根据所述第一末位地址和所述第二末位地址判断所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称是否一致。
可选的,第四确定单元3026还可以具体用于:
当所述末位地址相似度大于预设地址相似度阈值时,判断所述第一末位地址和所述第二末位地址是否均包含号地址要素;
若所述第一末位地址和所述第二末位地址是否均包含号地址要素,则判断所述第一分割地址信息和所述第二分割地址信息是否均不包含社区地址要素;
若所述第一分割地址信息和所述第二分割地址信息均不包含社区地址要素,且所述第一分割地址信息和所述第二分割地址信息之间存在至少四位其他地址要素关键词一致,则确定所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称一致;
若所述第一分割地址信息和所述第二分割地址信息均包含社区地址要素,且所述第一分割地址信息和所述第二分割地址信息之间存在至少五位其他地址要素关键词一致,则确定所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称一致;
若所述第一末位地址和所述第二末位地址均不包含号地址要素,且所述第一分割地址信息和所述第二分割地址信息之间存在至少两位其他地址要素关键词一致,则确定所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称一致。
可选的,判断模块303还可以具体用于:
若所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称一致,则根据预设正则表达式从所述第一分割地址信息和所述第二分割地址信息中筛选门牌号,得到第一门牌号和第二门牌号;
根据预设字符串比较函数比较所述第一门牌号和所述第二门牌号是否相同;
若所述第一门牌号和所述第二门牌号相同,则确定所述第一分割地址信息对应的门牌号与所述第二分割地址信息对应的门牌号一致。
可选的,证件地址一致性核查装置还包括:
设置模块305,用于对所述两个企业经营证件原始地址信息设置地址一致标签,并将所述两个企业经营证件原始地址信息存储至预设地址核验数据表中;
构建模块306,用于基于所述预设地址核验数据表中的各企业经营证件原始地址信息构建企业经营证件知识图谱。
本发明实施例中,通过两个企业经营证件原始地址信息获取第一分割地址信息和第二分割地址信息,并依次对第一分割地址信息与第二分割地址信息进行单位名称和门牌号比对,若单位名称和门牌号均一致,则确定两个企业经营证件原始地址信息相同,提高了企业经营证件地址一致性的核查效率,并能够有效识别企业经营证件的重复地址,提高了识别准确率。
上面图3和图4从模块化的角度对本发明实施例中的证件地址一致性核查装置进行详细描述,下面从硬件处理的角度对本发明实施例中证件地址一致性核查设备进行详细描述。
图5是本发明实施例提供的一种证件地址一致性核查设备的结构示意图,该证件地址一致性核查设备500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)510(例如,一个或一个以上处理器)和存储器520,一个或一个以上存储应用程序533或数据532的存储介质530(例如一个或一个以上海量存储设备)。其中,存储器520和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对证件地址一致性核查设备500中的一系列计算机程序操作。更进一步地,处理器510可以设置为与存储介质530通信,在证件地址一致性核查设备500上执行存储介质530中的一系列计算机程序操作。
证件地址一致性核查设备500还可以包括一个或一个以上电源540,一个或一个以上有线或无线网络接口550,一个或一个以上输入输出接口560,和/或,一个或一个以上操作系统531,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图5示出的证件地址一致性核查设备结构并不构成对证件地址一致性核查设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,当所述计算机程序在计算机上运行时,使得计算机执行所述证件地址一致性核查方法的步骤。
本发明还提供一种证件地址一致性核查设备,所述证件地址一致性核查设备包括存储器和处理器,存储器中存储有计算机程序,所述计算机程序被处理器执行时,使得处理器执行上述各实施例中的所述证件地址一致性核查方法的步骤。
进一步地,所述计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干计算机程序用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-onlymemory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种证件地址一致性核查方法,其特征在于,所述证件地址一致性核查方法包括:
获取两个企业经营证件原始地址信息,并对所述两个企业经营证件原始地址信息进行字符分割,得到第一分割地址信息和第二分割地址信息,所述第一分割地址信息和所述第二分割地址信息均包括对应的单位名称和门牌号;
比较所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称是否一致;
若所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称一致,则判断所述第一分割地址信息对应的门牌号与所述第二分割地址信息对应的门牌号是否一致;
若所述第一分割地址信息对应的门牌号与所述第二分割地址信息对应的门牌号一致,则确定所述两个企业经营证件原始地址信息属于相同地址。
2.根据权利要求1所述的证件地址一致性核查方法,其特征在于,所述获取两个企业经营证件原始地址信息,并对所述两个企业经营证件原始地址信息进行字符分割,得到第一分割地址信息和第二分割地址信息,包括:
获取两个企业经营证件图像数据;
通过预设光学字符识别算法对所述两个企业经营证件图像数据进行识别,得到两个企业经营证件原始地址信息;
按照预设地址维度对所述两个企业经营证件原始地址信息进行字符分割,得到第一分割地址信息和第二分割地址信息。
3.根据权利要求1所述的证件地址一致性核查方法,其特征在于,所述比较所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称是否一致,包括:
当所述第一分割地址信息和/或所述第二分割地址信息均未包含社区地址要素,且所述第一分割地址信息和所述第二分割地址信息之间存在五位地址要素关键词一致时,确定所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称一致;
当所述第一分割地址信息和所述第二分割地址信息均包含社区地址要素和村地址要素,且所述第一分割地址信息和所述第二分割地址信息之间存在八位地址要素关键词一致时,确定所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称一致;
当所述第一分割地址信息和所述第二分割地址信息均包含社区地址要素,且所述第一分割地址信息和所述第二分割地址信息之间存在七位地址要素关键词一致时,确定所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称一致。
4.根据权利要求1所述的证件地址一致性核查方法,其特征在于,所述比较所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称是否一致,包括:
从所述第一分割地址信息和所述第二分割地址信息中获取第一末位地址和第二末位地址,所述第一末位地址和所述第二末位地址为非中文字符或号地址要素;
按照预设相似度算法对所述第一末位地址和所述第二末位地址进行相似度计算,得到末位地址相似度;
当所述末位地址相似度大于预设地址相似度阈值时,根据所述第一末位地址和所述第二末位地址判断所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称是否一致。
5.根据权利要求4所述的证件地址一致性核查方法,其特征在于,所述当所述末位地址相似度大于预设地址相似度阈值时,根据所述第一末位地址和所述第二末位地址判断所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称是否一致,包括:
当所述末位地址相似度大于预设地址相似度阈值时,判断所述第一末位地址和所述第二末位地址是否均包含号地址要素;
若所述第一末位地址和所述第二末位地址是否均包含号地址要素,则判断所述第一分割地址信息和所述第二分割地址信息是否均不包含社区地址要素;
若所述第一分割地址信息和所述第二分割地址信息均不包含社区地址要素,且所述第一分割地址信息和所述第二分割地址信息之间存在至少四位其他地址要素关键词一致,则确定所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称一致;
若所述第一分割地址信息和所述第二分割地址信息均包含社区地址要素,且所述第一分割地址信息和所述第二分割地址信息之间存在至少五位其他地址要素关键词一致,则确定所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称一致;
若所述第一末位地址和所述第二末位地址均不包含号地址要素,且所述第一分割地址信息和所述第二分割地址信息之间存在至少两位其他地址要素关键词一致,则确定所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称一致。
6.根据权利要求1所述的证件地址一致性核查方法,其特征在于,所述若所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称一致,则判断所述第一分割地址信息对应的门牌号与所述第二分割地址信息对应的门牌号是否一致,包括:
若所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称一致,则根据预设正则表达式从所述第一分割地址信息和所述第二分割地址信息中筛选门牌号,得到第一门牌号和第二门牌号;
根据预设字符串比较函数比较所述第一门牌号和所述第二门牌号是否相同;
若所述第一门牌号和所述第二门牌号相同,则确定所述第一分割地址信息对应的门牌号与所述第二分割地址信息对应的门牌号一致。
7.根据权利要求1-6中任意一项所述的证件地址一致性核查方法,其特征在于,在所述若所述第一分割地址信息对应的门牌号与所述第二分割地址信息对应的门牌号一致,则确定所述两个企业经营证件原始地址信息属于相同地址之后,所述证件地址一致性核查方法还包括:
对所述两个企业经营证件原始地址信息设置地址一致标签,并将所述两个企业经营证件原始地址信息存储至预设地址核验数据表中;
基于所述预设地址核验数据表中的各企业经营证件原始地址信息构建企业经营证件知识图谱。
8.一种证件地址一致性核查装置,其特征在于,所述证件地址一致性核查装置包括:
分割模块,用于获取两个企业经营证件原始地址信息,并对所述两个企业经营证件原始地址信息进行字符分割,得到第一分割地址信息和第二分割地址信息,所述第一分割地址信息和所述第二分割地址信息均包括对应的单位名称和门牌号;
比较模块,用于比较所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称是否一致;
判断模块,用于若所述第一分割地址信息对应的单位名称与所述第二分割地址信息对应的单位名称一致,则判断所述第一分割地址信息对应的门牌号与所述第二分割地址信息对应的门牌号是否一致;
确定模块,用于若所述第一分割地址信息对应的门牌号与所述第二分割地址信息对应的门牌号一致,则确定所述两个企业经营证件原始地址信息属于相同地址。
9.一种证件地址一致性核查设备,其特征在于,所述证件地址一致性核查设备包括:存储器和至少一个处理器,所述存储器中存储有计算机程序;
所述至少一个处理器调用所述存储器中的所述计算机程序,以使得所述证件地址一致性核查设备执行如权利要求1-7中任意一项所述的证件地址一致性核查方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任意一项所述的证件地址一致性核查方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210427130.8A CN114819987A (zh) | 2022-04-22 | 2022-04-22 | 证件地址一致性核查方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210427130.8A CN114819987A (zh) | 2022-04-22 | 2022-04-22 | 证件地址一致性核查方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114819987A true CN114819987A (zh) | 2022-07-29 |
Family
ID=82506303
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210427130.8A Pending CN114819987A (zh) | 2022-04-22 | 2022-04-22 | 证件地址一致性核查方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114819987A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110163204A (zh) * | 2019-04-15 | 2019-08-23 | 平安国际智慧城市科技股份有限公司 | 基于图像识别的商家监管方法、装置及存储介质 |
CN110378340A (zh) * | 2019-07-23 | 2019-10-25 | 上海秒针网络科技有限公司 | 地址合规识别方法、装置、存储介质及电子装置 |
CN110399829A (zh) * | 2019-07-23 | 2019-11-01 | 上海秒针网络科技有限公司 | 证件信息比对方法、装置、存储介质及电子装置 |
WO2021051554A1 (zh) * | 2019-09-19 | 2021-03-25 | 平安科技(深圳)有限公司 | 证件真伪验证方法、系统、计算机设备及可读存储介质 |
-
2022
- 2022-04-22 CN CN202210427130.8A patent/CN114819987A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110163204A (zh) * | 2019-04-15 | 2019-08-23 | 平安国际智慧城市科技股份有限公司 | 基于图像识别的商家监管方法、装置及存储介质 |
CN110378340A (zh) * | 2019-07-23 | 2019-10-25 | 上海秒针网络科技有限公司 | 地址合规识别方法、装置、存储介质及电子装置 |
CN110399829A (zh) * | 2019-07-23 | 2019-11-01 | 上海秒针网络科技有限公司 | 证件信息比对方法、装置、存储介质及电子装置 |
WO2021051554A1 (zh) * | 2019-09-19 | 2021-03-25 | 平安科技(深圳)有限公司 | 证件真伪验证方法、系统、计算机设备及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2016165538A1 (zh) | 一种地址数据的管理方法和装置 | |
JP5917719B2 (ja) | 画像データベースにおける画像管理のための方法、装置、および、コンピュータで読取り可能な記録媒体 | |
CN110597816A (zh) | 数据处理方法、装置、计算机设备和计算机可读存储介质 | |
WO2022048363A1 (zh) | 网站分类方法、装置、计算机设备及存储介质 | |
CN112069276A (zh) | 地址编码方法、装置、计算机设备及计算机可读存储介质 | |
CN110929125A (zh) | 搜索召回方法、装置、设备及其存储介质 | |
WO2022100154A1 (zh) | 基于人工智能的地址标准化方法、装置、设备和存储介质 | |
CN110990520A (zh) | 一种地址编码方法、装置、电子设备和存储介质 | |
CN112632278A (zh) | 一种基于多标签分类的标注方法、装置、设备及存储介质 | |
CN109783589B (zh) | 电子地图解析地址的方法、装置及存储介质 | |
CN111859984B (zh) | 意图挖掘方法、装置、设备及存储介质 | |
CN112650858A (zh) | 应急协助信息的获取方法、装置、计算机设备及介质 | |
CN113868351A (zh) | 一种地址聚类方法、装置、电子设备及存储介质 | |
CN111914557A (zh) | 地址解析方法、装置、设备及计算机可读存储介质 | |
CN113591459B (zh) | 地址标准化处理方法、装置、电子设备及可读存储介质 | |
CN110825817A (zh) | 一种企业疑似关联关系判定方法及系统 | |
CN111737315B (zh) | 地址模糊匹配方法及装置 | |
JP6470249B2 (ja) | データクレンジングシステム、データクレンジング方法及びデータクレンジングプログラム | |
CN114819987A (zh) | 证件地址一致性核查方法、装置、设备及存储介质 | |
CN112434506A (zh) | 电子协议签订处理方法、装置、计算机设备及介质 | |
CN112989820B (zh) | 法律文书定位方法、装置、设备及存储介质 | |
CN113204613B (zh) | 地址生成方法、装置、设备和存储介质 | |
CN112417812B (zh) | 地址标准化方法、系统及电子设备 | |
US20220327403A1 (en) | Method, apparatus, and computer-readable medium for postal address indentification | |
CN113191707A (zh) | 快递编码生成方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |