CN112651232B - 一种地址纠错方法、装置、设备及存储介质 - Google Patents
一种地址纠错方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN112651232B CN112651232B CN202011596478.7A CN202011596478A CN112651232B CN 112651232 B CN112651232 B CN 112651232B CN 202011596478 A CN202011596478 A CN 202011596478A CN 112651232 B CN112651232 B CN 112651232B
- Authority
- CN
- China
- Prior art keywords
- address
- address information
- information
- path
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/232—Orthographic correction, e.g. spell checking or vowelisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/083—Shipping
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Remote Sensing (AREA)
- Human Resources & Organizations (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- General Health & Medical Sciences (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Detection And Correction Of Errors (AREA)
Abstract
本发明实施例涉及人工智能领域,公开了一种地址纠错方法、装置、设备及存储介质,该方法包括:获取待处理的地址信息,并从预设的行政区划表中确定出与待处理的地址细信息匹配的一个或多个关联地址信息;确定与每一个关联地址信息对应的一条或多条路径信息;对每条路径信息进行评分处理,得到每条路径信息的分数,并根据每条路径信息的分数确定出分数最高的最大路径;获取分数最高的最大路径中行政区划最小的地址信息,并根据最大路径中行政区划最小的地址信息对最大路径进行纠错处理。这种方式可以实现自动对错误地址进行纠错处理,提高了对错误地址进行纠错的准确率。本发明涉及区块链技术,如可将地址信息写入区块链中,以用于数据取证等场景。
Description
技术领域
本发明涉及人工智能领域,尤其涉及一种地址纠错方法、装置、设备及存储介质。
背景技术
随着互联网电商的普及以及相关技术的发展,人们生活中越来越多场景需要用到地址信息,比如光学字符识别(Optical Character Recognition,ocr)识别身份证地址,电商使用用户填写的地址进行邮寄服务等。在这些地址中或多或少地存在各种各样的错误,比如在ocr识别中存在字符相似错误,把广东省识别成厂东省等;用户输入的地址中存在归属地错误的问题,比如深圳市龙华区清湖街道,错误写成深圳市宝安区清湖街道。这些错误地址不仅会对下游业务环节产生影响,同时也极大影响客户服务体验。因此,如何进行地址纠错成为地址正确性的一个重要保证。
发明内容
本发明实施例提供了一种地址纠错方法、装置、设备及存储介质,可以实现自动对错误地址进行纠错处理,提高了对错误地址进行纠错的准确率。
第一方面,本发明实施例提供了一种地址纠错方法,所述方法包括:
获取待处理的地址信息,并根据所述待处理的地址信息从预设的行政区划表中确定出与所述待处理的地址细信息匹配的一个或多个关联地址信息,其中,所述预设的行政区划表中包括行政编码与地址的映射关系;
根据所述一个或多个关联地址信息确定与所述一个或多个关联地址信息中的每一个关联地址信息对应的一条或多条路径信息;
根据所述一条或多条路径信息对所述一条或多条路径信息中的每条路径信息进行评分处理,得到所述每条路径信息的分数,并根据所述每条路径信息的分数确定出分数最高的最大路径;
获取所述分数最高的最大路径中行政区划最小的地址信息,并根据最大路径中行政区划最小的地址信息对所述最大路径进行纠错处理。
进一步地,所述根据所述待处理的地址信息从预设的行政区划表中确定出与所述待处理的地址细信息匹配的一个或多个关联地址信息,包括:
从所述待处理的地址信息中提取多个地址后缀;
根据预设的后缀与优先级的对应关系确定与所述多个地址后缀中的每个地址后缀对应的优先级级别;
根据所述每个地址后缀对应的优先级级别,利用多模匹配算法从预设的行政区划表中确定出与所述待处理的地址细信息匹配的一个或多个关联地址信息。
进一步地,所述根据所述每个地址后缀对应的优先级级别,利用多模匹配算法从预设的行政区划表中确定出与所述待处理的地址细信息匹配的一个或多个关联地址信息,包括:
根据所述每个地址后缀对应的优先级级别对所述每个地址后缀进行排序;
按照所述每个地址后缀排列的先后顺序从所述待处理的地址信息中确定与所述每个地址后缀对应的文本词;
利用所述每个地址后缀对应的文本词从所述预设的行政区划表中确定与所述每个地址后缀对应的文本词对应的一个或多个地址信息;
根据所述每个地址后缀对应的文本词对应的一个或多个地址信息确定与所述待处理的地址细信息匹配的一个或多个关联地址信息,所述关联地址信息包括地址和行政编码。
进一步地,所述根据所述一个或多个关联地址信息确定与所述一个或多个关联地址信息中的每一个关联地址信息对应的一条或多条路径信息,包括:
获取所述一个或多个关联地址信息中包括的地址和行政编码;
根据所述一个或多个关联地址信息中包括的行政编码确定属于所述一个或多个关联地址信息中包括的行政编码范围内的一个或多个地址;
根据所述一个或多个关联地址信息中包括的地址以及属于所述一个或多个关联地址信息中包括的行政编码范围内的一个或多个地址,确定一条或多条路径信息。
进一步地,所述根据所述一条或多条路径信息对所述一条或多条路径信息中的每条路径信息进行评分处理,得到所述每条路径信息的分数,包括:
获取所述所述一条或多条路径信息中的每条路径信息中各地址的地址后缀对应的优先级级别;
根据预设的优先级级别与分数的对应关系确定与所述每条路径信息中各地址的地址后缀的优先级级别对应的分数;
根据确定的与所述每条路径信息中各地址的地址后缀的优先级级别对应的分数,确定所述每条路径信息的分数。
进一步地,所述获取所述分数最高的最大路径中行政区划最小的地址信息,并根据最大路径中行政区划最小的地址信息对所述最大路径进行纠错处理,包括:
获取所述最大路径中优先级最小的地址信息,并检测所述预设的行政区划表中是否存在所述最大路径中优先级最小的地址信息;
当检测结果为是时,确定所述最大路径中优先级最小的地址信息为所述最大路径中行政区划最小的地址信息;
根据所述最大路径中优先级最小的地址信息从预设的行政区划表中确定与所述优先级最小的地址信息匹配的,且优先级大于最小优先级的地址信息;
根据所述与所述优先级最小的地址信息匹配的,且优先级大于最小优先级的地址信息对所述最大路径进行纠错处理。
进一步地,所述根据所述与所述优先级最小的地址信息匹配的,且优先级大于最小优先级的地址信息对所述最大路径进行纠错处理,包括:
检测所述优先级最小的地址信息匹配的,且优先级大于最小优先级的地址信息是否与所述预设的行政区划表中的地址信息相匹配;
当检测结果为否时,从所述优先级最小的地址信息匹配的,且优先级大于最小优先级的地址信息中获取与所述预设的行政区划表中的地址信息不匹配的纠错地址信息,并根据所述预设的行政区划表中的地址信息调整所述纠错地址信息。
第二方面,本发明实施例提供了一种地址纠错装置,包括:
获取单元,用于获取待处理的地址信息,并根据所述待处理的地址信息从预设的行政区划表中确定出与所述待处理的地址细信息匹配的一个或多个关联地址信息,其中,所述预设的行政区划表中包括行政编码与地址的映射关系;
确定单元,用于根据所述一个或多个关联地址信息确定与所述一个或多个关联地址信息中的每一个关联地址信息对应的一条或多条路径信息;
评分处理单元,用于根据所述一条或多条路径信息对所述一条或多条路径信息中的每条路径信息进行评分处理,得到所述每条路径信息的分数,并根据所述每条路径信息的分数确定出分数最高的最大路径;
纠错处理单元,用于获取所述分数最高的最大路径中行政区划最小的地址信息,并根据最大路径中行政区划最小的地址信息对所述最大路径进行纠错处理。
第三方面,本发明实施例提供了一种计算机设备,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储支持地址纠错装置执行上述方法的计算机程序,所述计算机程序包括程序,所述处理器被配置用于调用所述程序,执行上述第一方面的方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序被处理器执行以实现上述第一方面的方法。
本发明实施例可以获取待处理的地址信息,并根据所述待处理的地址信息从预设的行政区划表中确定出与所述待处理的地址细信息匹配的一个或多个关联地址信息;根据所述一个或多个关联地址信息确定与所述一个或多个关联地址信息中的每一个关联地址信息对应的一条或多条路径信息;根据所述一条或多条路径信息对所述一条或多条路径信息中的每条路径信息进行评分处理,得到所述每条路径信息的分数,并根据所述每条路径信息的分数确定出分数最高的最大路径;获取所述分数最高的最大路径中行政区划最小的地址信息,并根据最大路径中行政区划最小的地址信息对所述最大路径进行纠错处理。通过这种实施方式,可以实现自动对错误地址进行纠错处理,提高了对错误地址进行纠错的准确率。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种地址纠错方法的示意流程图;
图2是本发明实施例提供的一种地址纠错装置的示意框图;
图3是本发明实施例提供的一种计算机设备的示意框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的地址纠错方法可以应用于一种地址纠错装置,在某些实施例中,所述地址纠错装置设置于计算机设备中。在某些实施例中,所述计算机设备包括但不限于智能手机、平板电脑、膝上型电脑等中的一种或者多种。
下面结合附图1对本发明实施例提供的地址纠错方法进行示意性说明。
请参见图1,图1是本发明实施例提供的一种地址纠错方法的示意流程图,如图1所示,该方法可以由地址纠错装置执行,所述地址纠错装置设置于计算机设备中。具体地,本发明实施例的所述方法包括如下步骤。
S101:获取待处理的地址信息,并根据所述待处理的地址信息从预设的行政区划表中确定出与所述待处理的地址细信息匹配的一个或多个关联地址信息。
本发明实施例中,地址纠错装置可以获取待处理的地址信息,并根据所述待处理的地址信息从预设的行政区划表中确定出与所述待处理的地址细信息匹配的一个或多个关联地址信息,其中,所述预设的行政区划表中包括行政编码与地址的映射关系,比如,440300000000->深圳市。
在一个实施例中所述行政编码的意义如下表1所示。
表1
第一、二位 | 表示省(自治区、直辖市) |
第三、四位 | 表示市(地区、自治州) |
第五、六位 | 表示县(市辖区、县级市) |
第七至九位 | 表示乡、镇(街道办事处) |
在一个实施例中,地址纠错装置在根据所述待处理的地址信息从预设的行政区划表中确定出与所述待处理的地址细信息匹配的一个或多个关联地址信息时,可以从所述待处理的地址信息中提取多个地址后缀;根据预设的后缀与优先级的对应关系确定与所述多个地址后缀中的每个地址后缀对应的优先级级别;根据所述每个地址后缀对应的优先级级别,利用多模匹配算法从预设的行政区划表中确定出与所述待处理的地址细信息匹配的一个或多个关联地址信息。
在一个实施例中,地址纠错装置在根据所述每个地址后缀对应的优先级级别,利用多模匹配算法从预设的行政区划表中确定出与所述待处理的地址细信息匹配的一个或多个关联地址信息时,可以根据所述每个地址后缀对应的优先级级别对所述每个地址后缀进行排序;按照所述每个地址后缀排列的先后顺序从所述待处理的地址信息中确定与所述每个地址后缀对应的文本词;利用所述每个地址后缀对应的文本词从所述预设的行政区划表中确定与所述每个地址后缀对应的文本词对应的一个或多个地址信息;根据所述每个地址后缀对应的文本词对应的一个或多个地址信息确定与所述待处理的地址细信息匹配的一个或多个关联地址信息,所述关联地址信息包括地址和行政编码。
例如,假设所述待处理的地址信息为“厂东省甚江市披头区官渡镇”,其中,厂东省可以利用省这个后缀知道它可能是省这一级,省这一级没有优先级更高的上一级,因此取出“厂东省”这一文本词来做倒排,利用“东”字可以从所述预设的行政区划表中确定山东省、广东省;再识别出市这个后缀,然后再利用“市”和“省”之前的“甚江市”来做倒排,利用江和市字可以从所述预设的行政区划表中确定湛江市、廉江市等。
在一个实施例中,可以按照字符和行政级别(省,地级市,县/区,镇等)建立倒排字典,比如:江这个字,按省建立倒排字典为:浙江省,江苏省,江西省等;按地级市建立倒排字典为:江门市,湛江市,九江市,镇江市等;按县/区建立倒排字典:滨江区,江北区,江宁区等;同事我们搜集每一个新政级别下的常用后缀,比如省有省,市等后缀,县/区有县、区、市、开发区等后缀。
在一个示例中,假设所述待处理的地址信息为“厂东省甚江市披头区官渡镇”,如果正确的地址信息为:广东省湛江市坡头区官渡镇,其中,省,地级市和区均有错误;因此可以先利用多模匹配算法(常用工具是ac自动机)从预设的行政区划表中确定出完全匹配的地址,比如匹配到了行政编码为410122102的官渡镇,440804104的官渡镇等。
S102:根据所述一个或多个关联地址信息确定与所述一个或多个关联地址信息中的每一个关联地址信息对应的一条或多条路径信息。
本发明实施例中,地址纠错装置可以根据所述一个或多个关联地址信息确定与所述一个或多个关联地址信息中的每一个关联地址信息对应的一条或多条路径信息。
在一个实施例中,地址纠错装置在根据所述一个或多个关联地址信息确定与所述一个或多个关联地址信息中的每一个关联地址信息对应的一条或多条路径信息时,可以获取所述一个或多个关联地址信息中包括的地址和行政编码;根据所述一个或多个关联地址信息中包括的行政编码确定属于所述一个或多个关联地址信息中包括的行政编码范围内的一个或多个地址;根据所述一个或多个关联地址信息中包括的地址以及属于所述一个或多个关联地址信息中包括的行政编码范围内的一个或多个地址,确定一条或多条路径信息。
在一个实施例中,地址纠错装置可以获取所述一个或多个关联地址信息中包括的地址和行政编码,并可以根据行政编码的一致性来规划各种可能的一条或多条路径信息。
例如,行政编码为440804104的官渡镇,其镇的编码是104,上一级县/区编码为440804,那么只有行政编码为440804的坡头区可以和它链接,接着再找到4408的湛江市,最后是44开头的广东省。这样子就可以找到行政编码为440804104官渡镇的一条路径:①广东省(44)->湛江市(4408)->坡头区(440804)->官渡镇(4408-4104);当然还可以找到很多其他路径,比如②山东省(37);③广东省(44)->廉江市(440881);④镇江市(32110)等等多条路径。
S103:根据所述一条或多条路径信息对所述一条或多条路径信息中的每条路径信息进行评分处理,得到所述每条路径信息的分数,并根据所述每条路径信息的分数确定出分数最高的最大路径。
本发明实施例中,地址纠错装置可以根据所述一条或多条路径信息对所述一条或多条路径信息中的每条路径信息进行评分处理,得到所述每条路径信息的分数,并根据所述每条路径信息的分数确定出分数最高的最大路径。
在一个实施例中,地址纠错装置在根据所述一条或多条路径信息对所述一条或多条路径信息中的每条路径信息进行评分处理,得到所述每条路径信息的分数时,可以获取所述所述一条或多条路径信息中的每条路径信息中各地址的地址后缀对应的优先级级别;根据预设的优先级级别与分数的对应关系确定与所述每条路径信息中各地址的地址后缀的优先级级别对应的分数;根据确定的与所述每条路径信息中各地址的地址后缀的优先级级别对应的分数,确定所述每条路径信息的分数。
在一个实施例中,在对所述一条或多条路径信息中的每条路径信息进行评分处理时,因为行政级别(即为优先级级别)越高重复可能性越小,比如省和地级市是没有重复名称,那么可以预先规定行政级别与分数的对应关系,其中行政级别越高得分越高。例如,假设省完全匹配到了就得到5分,地级市4分,以此类推到村就只有1分;如果有编辑距离差距就扣分,相差1个字扣1分。如果第①号路径的得分(5-1)+(4-1)+(3-1)+2=12分;②号路径有4分,③号路径有6分,④号路径有3分等等,最后根据得分从高到低排序,最后可以得到①号路径为最大路径。
S104:获取所述分数最高的最大路径中行政区划最小的地址信息,并根据最大路径中行政区划最小的地址信息对所述最大路径进行纠错处理。
本发明实施例中,地址纠错装置可以获取所述分数最高的最大路径中行政区划最小的地址信息,并根据最大路径中行政区划最小的地址信息对所述最大路径进行纠错处理。
在一个实施例中,地址纠错装置在获取所述分数最高的最大路径中行政区划最小的地址信息,并根据最大路径中行政区划最小的地址信息对所述最大路径进行纠错处理时,可以获取所述最大路径中优先级最小的地址信息,并检测所述预设的行政区划表中是否存在所述最大路径中优先级最小的地址信息;当检测结果为是时,确定所述最大路径中优先级最小的地址信息为所述最大路径中行政区划最小的地址信息;根据所述最大路径中优先级最小的地址信息从预设的行政区划表中确定与所述优先级最小的地址信息匹配的,且优先级大于最小优先级的地址信息;根据所述与所述优先级最小的地址信息匹配的,且优先级大于最小优先级的地址信息对所述最大路径进行纠错处理。
在一个实施例中,地址纠错装置在根据所述与所述优先级最小的地址信息匹配的,且优先级大于最小优先级的地址信息对所述最大路径进行纠错处理时,可以检测所述优先级最小的地址信息匹配的,且优先级大于最小优先级的地址信息是否与所述预设的行政区划表中的地址信息相匹配;当检测结果为否时,从所述优先级最小的地址信息匹配的,且优先级大于最小优先级的地址信息中获取与所述预设的行政区划表中的地址信息不匹配的纠错地址信息,并根据所述预设的行政区划表中的地址信息调整所述纠错地址信息。
在一个实施例中,地址纠错装置可以根据最大路径中行政区划最小的那个地址,例如在本例中就是440804104的官渡镇,根据该地址反推出它的上级地址为:44广东省,4408湛江市,440804坡头区,然后再用这些标准的地址去纠正相应的错误,比如厂东省要纠成广东省。
在一个实施例中,如果后缀也出现错误,比如“厂东省甚江巾披头区官渡镇”,可以利用跨级后缀,在本例中就是利用“省”和“区”之间的字符“甚江巾披头区”来遍历倒排,比如从左到右分别取出3个字做到排,比如取“甚江巾”利用江字可以倒排回来湛江市,廉江市等,然后再扫描“江巾披”、“巾披头”、“披头区”等。
本发明实施例中,地址纠错装置可以获取待处理的地址信息,并根据所述待处理的地址信息从预设的行政区划表中确定出与所述待处理的地址细信息匹配的一个或多个关联地址信息;根据所述一个或多个关联地址信息确定与所述一个或多个关联地址信息中的每一个关联地址信息对应的一条或多条路径信息;根据所述一条或多条路径信息对所述一条或多条路径信息中的每条路径信息进行评分处理,得到所述每条路径信息的分数,并根据所述每条路径信息的分数确定出分数最高的最大路径;获取所述分数最高的最大路径中行政区划最小的地址信息,并根据最大路径中行政区划最小的地址信息对所述最大路径进行纠错处理。通过充分利用错误地址中的各个位置的信息,同时考虑到了优先级级别越高的地址重复度越低的特点,分配给高行优先级级别的地址越高的权重,重复考虑各条可能的路径,通过分数加权的方式来选择一条最有可能的最大路径,然后再根据该最大路径去纠正相应的错误,从而可以实现自动对错误地址进行纠错处理,提高了对错误地址进行纠错的准确率。
本发明实施例还提供了一种地址纠错装置,该地址纠错装置用于执行前述任一项所述的方法的单元。具体地,参见图2,图2是本发明实施例提供的一种地址纠错装置的示意框图。本实施例的地址纠错装置包括:获取单元201、确定单元202、评分处理单元203以及纠错处理单元204。
获取单元201,用于获取待处理的地址信息,并根据所述待处理的地址信息从预设的行政区划表中确定出与所述待处理的地址细信息匹配的一个或多个关联地址信息,其中,所述预设的行政区划表中包括行政编码与地址的映射关系;
确定单元202,用于根据所述一个或多个关联地址信息确定与所述一个或多个关联地址信息中的每一个关联地址信息对应的一条或多条路径信息;
评分处理单元203,用于根据所述一条或多条路径信息对所述一条或多条路径信息中的每条路径信息进行评分处理,得到所述每条路径信息的分数,并根据所述每条路径信息的分数确定出分数最高的最大路径;
纠错处理单元204,用于获取所述分数最高的最大路径中行政区划最小的地址信息,并根据最大路径中行政区划最小的地址信息对所述最大路径进行纠错处理。
进一步地,所述获取单元201根据所述待处理的地址信息从预设的行政区划表中确定出与所述待处理的地址细信息匹配的一个或多个关联地址信息时,具体用于:
从所述待处理的地址信息中提取多个地址后缀;
根据预设的后缀与优先级的对应关系确定与所述多个地址后缀中的每个地址后缀对应的优先级级别;
根据所述每个地址后缀对应的优先级级别,利用多模匹配算法从预设的行政区划表中确定出与所述待处理的地址细信息匹配的一个或多个关联地址信息。
进一步地,所述获取单元201根据所述每个地址后缀对应的优先级级别,利用多模匹配算法从预设的行政区划表中确定出与所述待处理的地址细信息匹配的一个或多个关联地址信息时,具体用于:
根据所述每个地址后缀对应的优先级级别对所述每个地址后缀进行排序;
按照所述每个地址后缀排列的先后顺序从所述待处理的地址信息中确定与所述每个地址后缀对应的文本词;
利用所述每个地址后缀对应的文本词从所述预设的行政区划表中确定与所述每个地址后缀对应的文本词对应的一个或多个地址信息;
根据所述每个地址后缀对应的文本词对应的一个或多个地址信息确定与所述待处理的地址细信息匹配的一个或多个关联地址信息,所述关联地址信息包括地址和行政编码。
进一步地,所述确定单元202根据所述一个或多个关联地址信息确定与所述一个或多个关联地址信息中的每一个关联地址信息对应的一条或多条路径信息时,具体用于:
获取所述一个或多个关联地址信息中包括的地址和行政编码;
根据所述一个或多个关联地址信息中包括的行政编码确定属于所述一个或多个关联地址信息中包括的行政编码范围内的一个或多个地址;
根据所述一个或多个关联地址信息中包括的地址以及属于所述一个或多个关联地址信息中包括的行政编码范围内的一个或多个地址,确定一条或多条路径信息。
进一步地,所述评分处理单元203根据所述一条或多条路径信息对所述一条或多条路径信息中的每条路径信息进行评分处理,得到所述每条路径信息的分数时,具体用于:
获取所述所述一条或多条路径信息中的每条路径信息中各地址的地址后缀对应的优先级级别;
根据预设的优先级级别与分数的对应关系确定与所述每条路径信息中各地址的地址后缀的优先级级别对应的分数;
根据确定的与所述每条路径信息中各地址的地址后缀的优先级级别对应的分数,确定所述每条路径信息的分数。
进一步地,所述纠错处理单元204获取所述分数最高的最大路径中行政区划最小的地址信息,并根据最大路径中行政区划最小的地址信息对所述最大路径进行纠错处理时,具体用于:
获取所述最大路径中优先级最小的地址信息,并检测所述预设的行政区划表中是否存在所述最大路径中优先级最小的地址信息;
当检测结果为是时,确定所述最大路径中优先级最小的地址信息为所述最大路径中行政区划最小的地址信息;
根据所述最大路径中优先级最小的地址信息从预设的行政区划表中确定与所述优先级最小的地址信息匹配的,且优先级大于最小优先级的地址信息;
根据所述与所述优先级最小的地址信息匹配的,且优先级大于最小优先级的地址信息对所述最大路径进行纠错处理。
进一步地,所述纠错处理单元204根据所述与所述优先级最小的地址信息匹配的,且优先级大于最小优先级的地址信息对所述最大路径进行纠错处理时,具体用于:
检测所述优先级最小的地址信息匹配的,且优先级大于最小优先级的地址信息是否与所述预设的行政区划表中的地址信息相匹配;
当检测结果为否时,从所述优先级最小的地址信息匹配的,且优先级大于最小优先级的地址信息中获取与所述预设的行政区划表中的地址信息不匹配的纠错地址信息,并根据所述预设的行政区划表中的地址信息调整所述纠错地址信息。
本发明实施例中,地址纠错装置可以获取待处理的地址信息,并根据所述待处理的地址信息从预设的行政区划表中确定出与所述待处理的地址细信息匹配的一个或多个关联地址信息;根据所述一个或多个关联地址信息确定与所述一个或多个关联地址信息中的每一个关联地址信息对应的一条或多条路径信息;根据所述一条或多条路径信息对所述一条或多条路径信息中的每条路径信息进行评分处理,得到所述每条路径信息的分数,并根据所述每条路径信息的分数确定出分数最高的最大路径;获取所述分数最高的最大路径中行政区划最小的地址信息,并根据最大路径中行政区划最小的地址信息对所述最大路径进行纠错处理。通过充分利用错误地址中的各个位置的信息,同时考虑到了优先级级别越高的地址重复度越低的特点,分配给高行优先级级别的地址越高的权重,重复考虑各条可能的路径,通过分数加权的方式来选择一条最有可能的最大路径,然后再根据该最大路径去纠正相应的错误,从而可以实现自动对错误地址进行纠错处理,提高了对错误地址进行纠错的准确率。
参见图3,图3是本发明实施例提供的一种计算机设备的示意框图。如图所示的本实施例中的设备可以包括:一个或多个处理器301;一个或多个输入设备302,一个或多个输出设备303和存储器304。上述处理器301、输入设备302、输出设备303和存储器304通过总线305连接。存储器304用于存储计算机程序,所述计算机程序包括程序,处理器301用于执行存储器304存储的程序。
其中,处理器301被配置用于调用所述程序执行:
获取待处理的地址信息,并根据所述待处理的地址信息从预设的行政区划表中确定出与所述待处理的地址细信息匹配的一个或多个关联地址信息,其中,所述预设的行政区划表中包括行政编码与地址的映射关系;
根据所述一个或多个关联地址信息确定与所述一个或多个关联地址信息中的每一个关联地址信息对应的一条或多条路径信息;
根据所述一条或多条路径信息对所述一条或多条路径信息中的每条路径信息进行评分处理,得到所述每条路径信息的分数,并根据所述每条路径信息的分数确定出分数最高的最大路径;
获取所述分数最高的最大路径中行政区划最小的地址信息,并根据最大路径中行政区划最小的地址信息对所述最大路径进行纠错处理。
进一步地,所述处理器301根据所述待处理的地址信息从预设的行政区划表中确定出与所述待处理的地址细信息匹配的一个或多个关联地址信息时,具体用于:
从所述待处理的地址信息中提取多个地址后缀;
根据预设的后缀与优先级的对应关系确定与所述多个地址后缀中的每个地址后缀对应的优先级级别;
根据所述每个地址后缀对应的优先级级别,利用多模匹配算法从预设的行政区划表中确定出与所述待处理的地址细信息匹配的一个或多个关联地址信息。
进一步地,所述处理器301根据所述每个地址后缀对应的优先级级别,利用多模匹配算法从预设的行政区划表中确定出与所述待处理的地址细信息匹配的一个或多个关联地址信息时,具体用于:
根据所述每个地址后缀对应的优先级级别对所述每个地址后缀进行排序;
按照所述每个地址后缀排列的先后顺序从所述待处理的地址信息中确定与所述每个地址后缀对应的文本词;
利用所述每个地址后缀对应的文本词从所述预设的行政区划表中确定与所述每个地址后缀对应的文本词对应的一个或多个地址信息;
根据所述每个地址后缀对应的文本词对应的一个或多个地址信息确定与所述待处理的地址细信息匹配的一个或多个关联地址信息,所述关联地址信息包括地址和行政编码。
进一步地,所述处理器301根据所述一个或多个关联地址信息确定与所述一个或多个关联地址信息中的每一个关联地址信息对应的一条或多条路径信息时,具体用于:
获取所述一个或多个关联地址信息中包括的地址和行政编码;
根据所述一个或多个关联地址信息中包括的行政编码确定属于所述一个或多个关联地址信息中包括的行政编码范围内的一个或多个地址;
根据所述一个或多个关联地址信息中包括的地址以及属于所述一个或多个关联地址信息中包括的行政编码范围内的一个或多个地址,确定一条或多条路径信息。
进一步地,所述处理器301根据所述一条或多条路径信息对所述一条或多条路径信息中的每条路径信息进行评分处理,得到所述每条路径信息的分数时,具体用于:
获取所述所述一条或多条路径信息中的每条路径信息中各地址的地址后缀对应的优先级级别;
根据预设的优先级级别与分数的对应关系确定与所述每条路径信息中各地址的地址后缀的优先级级别对应的分数;
根据确定的与所述每条路径信息中各地址的地址后缀的优先级级别对应的分数,确定所述每条路径信息的分数。
进一步地,所述处理器301获取所述分数最高的最大路径中行政区划最小的地址信息,并根据最大路径中行政区划最小的地址信息对所述最大路径进行纠错处理时,具体用于:
获取所述最大路径中优先级最小的地址信息,并检测所述预设的行政区划表中是否存在所述最大路径中优先级最小的地址信息;
当检测结果为是时,确定所述最大路径中优先级最小的地址信息为所述最大路径中行政区划最小的地址信息;
根据所述最大路径中优先级最小的地址信息从预设的行政区划表中确定与所述优先级最小的地址信息匹配的,且优先级大于最小优先级的地址信息;
根据所述与所述优先级最小的地址信息匹配的,且优先级大于最小优先级的地址信息对所述最大路径进行纠错处理。
进一步地,所述处理器301根据所述与所述优先级最小的地址信息匹配的,且优先级大于最小优先级的地址信息对所述最大路径进行纠错处理时,具体用于:
检测所述优先级最小的地址信息匹配的,且优先级大于最小优先级的地址信息是否与所述预设的行政区划表中的地址信息相匹配;
当检测结果为否时,从所述优先级最小的地址信息匹配的,且优先级大于最小优先级的地址信息中获取与所述预设的行政区划表中的地址信息不匹配的纠错地址信息,并根据所述预设的行政区划表中的地址信息调整所述纠错地址信息。
本发明实施例中,计算机设备可以获取待处理的地址信息,并根据所述待处理的地址信息从预设的行政区划表中确定出与所述待处理的地址细信息匹配的一个或多个关联地址信息;根据所述一个或多个关联地址信息确定与所述一个或多个关联地址信息中的每一个关联地址信息对应的一条或多条路径信息;根据所述一条或多条路径信息对所述一条或多条路径信息中的每条路径信息进行评分处理,得到所述每条路径信息的分数,并根据所述每条路径信息的分数确定出分数最高的最大路径;获取所述分数最高的最大路径中行政区划最小的地址信息,并根据最大路径中行政区划最小的地址信息对所述最大路径进行纠错处理。通过充分利用错误地址中的各个位置的信息,同时考虑到了优先级级别越高的地址重复度越低的特点,分配给高行优先级级别的地址越高的权重,重复考虑各条可能的路径,通过分数加权的方式来选择一条最有可能的最大路径,然后再根据该最大路径去纠正相应的错误,从而可以实现自动对错误地址进行纠错处理,提高了对错误地址进行纠错的准确率。
应当理解,在本发明实施例中,所称处理器301可以是中央处理单元(CenSralProcessing UniS,CPU),该处理器还可以是其他通用处理器、数字信号处理器(DigiSalSignal Processor,DSP)、专用集成电路(ApplicaSion Specific InSegraSed CircuiS,ASIC)、现成可编程门阵列(Field-Programmable GaSe Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
输入设备302可以包括触控板、麦克风等,输出设备303可以包括显示器(LCD等)、扬声器等。
该存储器304可以包括只读存储器和随机存取存储器,并向处理器301提供指令和数据。存储器304的一部分还可以包括非易失性随机存取存储器。例如,存储器304还可以存储设备类型的信息。
具体实现中,本发明实施例中所描述的处理器301、输入设备302、输出设备303可执行本发明实施例提供的图1所述的方法实施例中所描述的实现方式,也可执行本发明实施例图2所描述的地址纠错装置的实现方式,在此不再赘述。
本发明实施例中还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现图1所对应实施例中描述的地址纠错方法,也可实现本发明图2所对应实施例的地址纠错装置,在此不再赘述。
所述计算机可读存储介质可以是前述任一实施例所述的地址纠错装置的内部存储单元,例如地址纠错装置的硬盘或内存。所述计算机可读存储介质也可以是所述地址纠错装置的外部存储装置,例如所述地址纠错装置上配备的插接式硬盘,智能存储卡(SmarSMedia Card,SMC),安全数字(Secure DigiSal,SD)卡,闪存卡(Flash Card)等。进一步地,所述计算机可读存储介质还可以既包括所述地址纠错装置的内部存储单元也包括外部存储装置。所述计算机可读存储介质用于存储所述计算机程序以及所述地址纠错装置所需的其他程序和数据。所述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个计算机可读存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的计算机可读存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。所述的计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
需要强调的是,为进一步保证上述数据的私密和安全性,上述数据还可以存储于一区块链的节点中。其中,本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
以上所述,仅为本发明的部分实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。
Claims (8)
1.一种地址纠错方法,其特征在于,所述方法包括:
获取待处理的地址信息,并根据所述待处理的地址信息从预设的行政区划表中确定出与所述待处理的地址细信息匹配的一个或多个关联地址信息,其中,所述预设的行政区划表中包括行政编码与地址的映射关系;
所述根据所述待处理的地址信息从预设的行政区划表中确定出与所述待处理的地址细信息匹配的一个或多个关联地址信息,包括:
从所述待处理的地址信息中提取多个地址后缀;
根据预设的后缀与优先级的对应关系确定与所述多个地址后缀中的每个地址后缀对应的优先级级别;
根据所述每个地址后缀对应的优先级级别,利用多模匹配算法从预设的行政区划表中确定出与所述待处理的地址细信息匹配的一个或多个关联地址信息;
所述根据所述每个地址后缀对应的优先级级别,利用多模匹配算法从预设的行政区划表中确定出与所述待处理的地址细信息匹配的一个或多个关联地址信息,包括:
根据所述每个地址后缀对应的优先级级别对所述每个地址后缀进行排序;
按照所述每个地址后缀排列的先后顺序从所述待处理的地址信息中确定与所述每个地址后缀对应的文本词;
利用所述每个地址后缀对应的文本词从所述预设的行政区划表中确定与所述每个地址后缀对应的文本词对应的一个或多个地址信息;
根据所述每个地址后缀对应的文本词对应的一个或多个地址信息确定与所述待处理的地址细信息匹配的一个或多个关联地址信息,所述关联地址信息包括地址和行政编码;
根据所述一个或多个关联地址信息确定与所述一个或多个关联地址信息中的每一个关联地址信息对应的一条或多条路径信息;
根据所述一条或多条路径信息对所述一条或多条路径信息中的每条路径信息进行评分处理,得到所述每条路径信息的分数,并根据所述每条路径信息的分数确定出分数最高的最大路径;
获取所述分数最高的最大路径中行政区划最小的地址信息,并根据最大路径中行政区划最小的地址信息对所述最大路径进行纠错处理。
2.根据权利要求1所述的方法,其特征在于,所述根据所述一个或多个关联地址信息确定与所述一个或多个关联地址信息中的每一个关联地址信息对应的一条或多条路径信息,包括:
获取所述一个或多个关联地址信息中包括的地址和行政编码;
根据所述一个或多个关联地址信息中包括的行政编码确定属于所述一个或多个关联地址信息中包括的行政编码范围内的一个或多个地址;
根据所述一个或多个关联地址信息中包括的地址以及属于所述一个或多个关联地址信息中包括的行政编码范围内的一个或多个地址,确定一条或多条路径信息。
3.根据权利要求2所述的方法,其特征在于,所述根据所述一条或多条路径信息对所述一条或多条路径信息中的每条路径信息进行评分处理,得到所述每条路径信息的分数,包括:
获取所述所述一条或多条路径信息中的每条路径信息中各地址的地址后缀对应的优先级级别;
根据预设的优先级级别与分数的对应关系确定与所述每条路径信息中各地址的地址后缀的优先级级别对应的分数;
根据确定的与所述每条路径信息中各地址的地址后缀的优先级级别对应的分数,确定所述每条路径信息的分数。
4.根据权利要求1所述的方法,其特征在于,所述获取所述分数最高的最大路径中行政区划最小的地址信息,并根据最大路径中行政区划最小的地址信息对所述最大路径进行纠错处理,包括:
获取所述最大路径中优先级最小的地址信息,并检测所述预设的行政区划表中是否存在所述最大路径中优先级最小的地址信息;
当检测结果为是时,确定所述最大路径中优先级最小的地址信息为所述最大路径中行政区划最小的地址信息;
根据所述最大路径中优先级最小的地址信息从预设的行政区划表中确定与所述优先级最小的地址信息匹配的,且优先级大于最小优先级的地址信息;
根据所述与所述优先级最小的地址信息匹配的,且优先级大于最小优先级的地址信息对所述最大路径进行纠错处理。
5.根据权利要求4所述的方法,其特征在于,所述根据所述与所述优先级最小的地址信息匹配的,且优先级大于最小优先级的地址信息对所述最大路径进行纠错处理,包括:
检测所述优先级最小的地址信息匹配的,且优先级大于最小优先级的地址信息是否与所述预设的行政区划表中的地址信息相匹配;
当检测结果为否时,从所述优先级最小的地址信息匹配的,且优先级大于最小优先级的地址信息中获取与所述预设的行政区划表中的地址信息不匹配的纠错地址信息,并根据所述预设的行政区划表中的地址信息调整所述纠错地址信息。
6.一种地址纠错装置,其特征在于,包括:
获取单元,用于获取待处理的地址信息,并根据所述待处理的地址信息从预设的行政区划表中确定出与所述待处理的地址细信息匹配的一个或多个关联地址信息,其中,所述预设的行政区划表中包括行政编码与地址的映射关系;
所述获取单元根据所述待处理的地址信息从预设的行政区划表中确定出与所述待处理的地址细信息匹配的一个或多个关联地址信息时,具体用于:
从所述待处理的地址信息中提取多个地址后缀;
根据预设的后缀与优先级的对应关系确定与所述多个地址后缀中的每个地址后缀对应的优先级级别;
根据所述每个地址后缀对应的优先级级别,利用多模匹配算法从预设的行政区划表中确定出与所述待处理的地址细信息匹配的一个或多个关联地址信息;
所述获取单元根据所述每个地址后缀对应的优先级级别,利用多模匹配算法从预设的行政区划表中确定出与所述待处理的地址细信息匹配的一个或多个关联地址信息时,具体用于:
根据所述每个地址后缀对应的优先级级别对所述每个地址后缀进行排序;
按照所述每个地址后缀排列的先后顺序从所述待处理的地址信息中确定与所述每个地址后缀对应的文本词;
利用所述每个地址后缀对应的文本词从所述预设的行政区划表中确定与所述每个地址后缀对应的文本词对应的一个或多个地址信息;
根据所述每个地址后缀对应的文本词对应的一个或多个地址信息确定与所述待处理的地址细信息匹配的一个或多个关联地址信息,所述关联地址信息包括地址和行政编码;
确定单元,用于根据所述一个或多个关联地址信息确定与所述一个或多个关联地址信息中的每一个关联地址信息对应的一条或多条路径信息;
评分处理单元,用于根据所述一条或多条路径信息对所述一条或多条路径信息中的每条路径信息进行评分处理,得到所述每条路径信息的分数,并根据所述每条路径信息的分数确定出分数最高的最大路径;
纠错处理单元,用于获取所述分数最高的最大路径中行政区划最小的地址信息,并根据最大路径中行政区划最小的地址信息对所述最大路径进行纠错处理。
7.一种计算机设备,其特征在于,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序,所述处理器被配置用于调用所述程序,执行如权利要求1-5任一项所述的方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现权利要求1-5任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011596478.7A CN112651232B (zh) | 2020-12-29 | 2020-12-29 | 一种地址纠错方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011596478.7A CN112651232B (zh) | 2020-12-29 | 2020-12-29 | 一种地址纠错方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112651232A CN112651232A (zh) | 2021-04-13 |
CN112651232B true CN112651232B (zh) | 2023-07-25 |
Family
ID=75363834
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011596478.7A Active CN112651232B (zh) | 2020-12-29 | 2020-12-29 | 一种地址纠错方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112651232B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8397107B1 (en) * | 2009-12-11 | 2013-03-12 | Western Digital Technologies, Inc. | Data storage device employing data path protection using both LBA and PBA |
CN103678708A (zh) * | 2013-12-30 | 2014-03-26 | 小米科技有限责任公司 | 一种识别预设地址的方法及装置 |
CN106919569A (zh) * | 2015-12-24 | 2017-07-04 | 北京四维图新科技股份有限公司 | 一种获取兴趣点poi的行政区划信息的方法及装置 |
CN110765773A (zh) * | 2019-10-31 | 2020-02-07 | 北京金堤科技有限公司 | 地址数据获取方法以及装置 |
WO2020168750A1 (zh) * | 2019-02-18 | 2020-08-27 | 平安科技(深圳)有限公司 | 一种地址信息标准化方法、装置、计算机设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10846175B2 (en) * | 2018-04-10 | 2020-11-24 | Micron Technology, Inc. | High throughput bit correction of data inside a word buffer for a product code decoder |
-
2020
- 2020-12-29 CN CN202011596478.7A patent/CN112651232B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8397107B1 (en) * | 2009-12-11 | 2013-03-12 | Western Digital Technologies, Inc. | Data storage device employing data path protection using both LBA and PBA |
CN103678708A (zh) * | 2013-12-30 | 2014-03-26 | 小米科技有限责任公司 | 一种识别预设地址的方法及装置 |
CN106919569A (zh) * | 2015-12-24 | 2017-07-04 | 北京四维图新科技股份有限公司 | 一种获取兴趣点poi的行政区划信息的方法及装置 |
WO2020168750A1 (zh) * | 2019-02-18 | 2020-08-27 | 平安科技(深圳)有限公司 | 一种地址信息标准化方法、装置、计算机设备及存储介质 |
CN110765773A (zh) * | 2019-10-31 | 2020-02-07 | 北京金堤科技有限公司 | 地址数据获取方法以及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112651232A (zh) | 2021-04-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9189746B2 (en) | Machine-learning based classification of user accounts based on email addresses and other account information | |
CN109739997B (zh) | 地址对比方法、装置及系统 | |
WO2016165538A1 (zh) | 一种地址数据的管理方法和装置 | |
CN112016304A (zh) | 文本纠错方法、装置、电子设备及存储介质 | |
WO2021189977A1 (zh) | 地址编码方法、装置、计算机设备及计算机可读存储介质 | |
CN103678708B (zh) | 一种识别预设地址的方法及装置 | |
JPH11505052A (ja) | 語彙辞書の検索範囲を削減するシステム及び方法 | |
CN109948122A (zh) | 输入文本的纠错方法、装置及电子设备 | |
CN103984703A (zh) | 邮件分类方法和装置 | |
CN113935710A (zh) | 一种合同审核的方法、装置、电子设备及存储介质 | |
CN111782892B (zh) | 基于前缀树的相似字符识别方法、设备、装置和存储介质 | |
CN110704719A (zh) | 企业搜索文本分词方法和装置 | |
CN116189215A (zh) | 自动审核方法、装置、电子设备及存储介质 | |
CN102567406B (zh) | 拼音搜索方法 | |
CN108664501B (zh) | 广告审核方法、装置及服务器 | |
CN103309851B (zh) | 短文本的垃圾识别方法及系统 | |
CN112396048B (zh) | 图片信息提取方法、装置、计算机设备及存储介质 | |
CN112651232B (zh) | 一种地址纠错方法、装置、设备及存储介质 | |
CN113850081A (zh) | 基于人工智能的文本处理方法、装置、设备及介质 | |
CN110688995B (zh) | 地图查询的处理方法,计算机可读存储介质和移动终端 | |
CN112069824A (zh) | 基于上下文概率和引证的地域识别方法、装置及介质 | |
CN113761137A (zh) | 一种提取地址信息的方法及装置 | |
CN105095826A (zh) | 一种文字识别方法及装置 | |
CN103064967A (zh) | 一种用于建立用户二元关系库的方法与设备 | |
WO2021239114A1 (zh) | 一种对文本进行同义修改、确定文本创作者的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |