CN112835899A - 地址库索引方法、地址匹配方法以及相关设备 - Google Patents
地址库索引方法、地址匹配方法以及相关设备 Download PDFInfo
- Publication number
- CN112835899A CN112835899A CN202110134495.7A CN202110134495A CN112835899A CN 112835899 A CN112835899 A CN 112835899A CN 202110134495 A CN202110134495 A CN 202110134495A CN 112835899 A CN112835899 A CN 112835899A
- Authority
- CN
- China
- Prior art keywords
- address
- address information
- index
- matching
- field
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 75
- 230000011218 segmentation Effects 0.000 claims abstract description 105
- 239000012634 fragment Substances 0.000 claims abstract description 28
- 230000015654 memory Effects 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 10
- 238000012545 processing Methods 0.000 description 7
- 238000013467 fragmentation Methods 0.000 description 5
- 238000006062 fragmentation reaction Methods 0.000 description 5
- 238000002372 labelling Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24575—Query processing with adaptation to user needs using context
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/083—Shipping
- G06Q10/0838—Historical data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Economics (AREA)
- Computational Linguistics (AREA)
- Marketing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Tourism & Hospitality (AREA)
- Operations Research (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Entrepreneurship & Innovation (AREA)
- Remote Sensing (AREA)
- Development Economics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种地址库索引方法、地址匹配方法以及相关设备,地址库索引方法,包括:将所述地址库按所述地址库中各地址信息的至少部分区域信息划分为多个查询分片;对所述地址库中的每一地址信息执行地址索引生成步骤,所述地址索引生成步骤包括:对该地址信息进行分词,获得多个分词结果;合并该地址信息的多个分词结果,以获得第一字段;将所述第一字段作为该地址信息的地址索引,以供根据所述地址索引搜索获得该地址信息。本发明在海量标准地址的地址库中,在保证准确性的情况下,能够尽可能少的时间找到最优匹配的地址。
Description
技术领域
本发明涉及计算机应用领域,尤其涉及一种地址库索引方法、地址匹配方法以及相关设备。
背景技术
目前,在各类物流场景中,在用户给定收货地址后,需要快速得到该地址对应的经纬度。而这个过程需要从地址数量达到亿级的标准地址库中,寻找最优匹配的地址,进而得到对应的经纬度。
无论是物流平台的服务器还是电商平台的服务器,在海量订单的场景下,上述地址匹配的过程不仅需要效果优异、准确率较高,同时要求较高的匹配效率,否则,将可能出现订单数据堆积、队列堵塞等情况,影响物流订单的正常进行。
由此,如何在海量标准地址的地址库中,在保证准确性的情况下,以尽可能少的时间找到最优匹配的地址,是本领域亟待解决的技术问题。
发明内容
本发明为了克服上述相关技术存在的缺陷,提供一种地址库索引方法、地址匹配方法以及相关设备,进而在海量标准地址的地址库中,在保证准确性的情况下,能够尽可能少的时间找到最优匹配的地址。
根据本发明的一个方面,提供一种地址库索引方法,包括:
将所述地址库按所述地址库中各地址信息的至少部分区域信息划分为多个查询分片;
对所述地址库中的每一地址信息执行地址索引生成步骤,所述地址索引生成步骤包括:
对该地址信息进行分词,获得多个分词结果;
合并该地址信息的多个分词结果,以获得第一字段;
将所述第一字段作为该地址信息的地址索引,以供根据所述地址索引搜索获得该地址信息。
在本发明的一些实施例中,所述合并该地址信息的多个分词结果,以获得第一字段包括:
根据上下文无关文法,合并该地址信息的多个分词结果,以获得第一字段。
在本发明的一些实施例中,所述对该地址信息进行分词,获得多个分词结果包括:
采用地址词库对该地址信息按多个分词算法分别进行分词,获得多个分词结果。
在本发明的一些实施例中,所述分词算法包括:最大匹配分词算法、最小匹配分词算法、索引分词算法或者它们之间的任意组合。
在本发明的一些实施例中,所述地址索引生成步骤还包括:
对该地址信息进行解析以获得至少一个第一预定字段;
将所述第一预定字段作为该地址信息的辅助索引字段。
在本发明的一些实施例中,所述对该地址信息进行解析以获得至少一个第一预定字段包括:
采用一个序列标注算法或者采用多个序列标注算法的组合,对该地址信息进行解析以获得至少一个第一预定字段。
在本发明的一些实施例中,所述第一预定字段包括乡、镇、村、社区、兴趣点、路名、路号、楼栋号中的一项或多项。
在本发明的一些实施例中,所述地址库索引方法基于分布式搜索服务器实现。
根据本发明的又一方面,还提供一种地址匹配方法,采用如上所述的地址库索引方法构建的地址索引对待匹配地址信息进行地址匹配,包括:
基于所述待匹配地址信息的至少部分区域信息,自所述地址库中确定查询分片;
对所述待匹配地址信息执行地址查询索引生成步骤,所述地址查询索引生成步骤包括:
对所述待匹配地址信息进行分词,获得多个分词结果;
合并所述待匹配地址信息的多个分词结果,以获得第二字段;
将所述第二字段作为所述待匹配地址信息的地址查询索引;
根据所述待匹配地址信息的地址查询索引与所述查询分片的各地址信息的地址索引的匹配,提供所匹配地址信息。
在本发明的一些实施例中,所述地址查询索引生成步骤还包括:
对所述待匹配地址信息进行解析以获得至少一个第二预定字段;
将所述第二预定字段作为该地址信息的辅助索引查询字段,所述辅助索引查询字段用于与所述地址库中的地址信息的辅助索引字段进行匹配。
在本发明的一些实施例中,所述地址查询索引包括多个第二字段,各所述第二字段具有不同的权重,所述第二字段的权重越高所述地址查询索引中的第二字段的匹配优先级越高。
在本发明的一些实施例中,所述第二字段的权重基于TF-IDF算法计算获得。
在本发明的一些实施例中,所述地址库中各地址信息关联有地理坐标,所述根据所述待匹配地址信息的地址查询索引与所述查询分片的各地址信息的地址索引的匹配,提供所匹配地址信息还包括:
提供所匹配地址信息关联的地理坐标。
根据本发明的又一方面,还提供一种地址库索引装置,包括:
划分模块,配置成将所述地址库按所述地址库中各地址信息的至少部分区域信息划分为多个查询分片;
第一生成模块,配置成对所述地址库中的每一地址信息执行地址索引生成步骤,所述地址索引生成步骤包括:
对该地址信息进行分词,获得多个分词结果;
合并该地址信息的多个分词结果,以获得第一字段;
将所述第一字段作为该地址信息的地址索引,以供根据所述地址索引搜索获得该地址信息。
根据本发明的又一方面,还提供一种地址匹配装置,采用如上所述的地址库索引方法构建的地址索引对待匹配地址信息进行地址匹配,包括:
确定模块,配置成基于所述待匹配地址信息的至少部分区域信息,自所述地址库中确定查询分片;
第二生成模块,配置成对所述待匹配地址信息执行地址查询索引生成步骤,所述地址查询索引生成步骤包括:
对所述待匹配地址信息进行分词,获得多个分词结果;
合并所述待匹配地址信息的多个分词结果,以获得第二字段;
将所述第二字段作为所述待匹配地址信息的地址查询索引;
匹配模块,配置成根据所述待匹配地址信息的地址查询索引与所述查询分片的各地址信息的地址索引的匹配,提供所匹配地址信息。
根据本发明的又一方面,还提供一种电子设备,所述电子设备包括:处理器;存储介质,其上存储有计算机程序,所述计算机程序被所述处理器运行时执行如上所述的步骤。
根据本发明的又一方面,还提供一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如上所述的步骤。
相比现有技术,本发明的优势在于:
一方面,通过首先按地址信息的至少部分区域信息将地址库划分为多个查询分片,以实现初步的地址库的划分,以便于匹配时,可仅基于其中一个查询分片进行,大大减小所要求匹配的数据量,提高地址匹配效率;另一方面,通过对地址库中的每个地址信息进行分词,合并分词结果,以提供地址信息的索引,以便于通过合并的分词结果提高地址匹配的准确率,同时,通过索引的方式,提高地址匹配的效率。由此,本发明可以在海量标准地址的地址库中,在保证准确性的情况下,能够尽可能少的时间找到最优匹配的地址。
附图说明
通过参照附图详细描述其示例实施方式,本发明的上述和其它特征及优点将变得更加明显。
图1示出了根据本发明实施例的地址库索引方法的流程图。
图2示出了根据本发明实施例的生成辅助索引字段的流程图。
图3示出了根据本发明实施例的地址匹配方法的流程图。
图4示出了根据本发明实施例的生成辅助索引查询字段的流程图。
图5示出了根据本发明实施例的地址库索引装置的模块图。
图6示出了根据本发明实施例的地址匹配装置的模块图。
图7示意性示出本发明示例性实施例中一种计算机可读存储介质示意图。
图8示意性示出本发明示例性实施例中一种电子设备示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本发明将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。
此外,附图仅为本发明的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的步骤。例如,有的步骤还可以分解,而有的步骤可以合并或部分合并,因此,实际执行的顺序有可能根据实际情况改变。
在本发明的各个实施例中,本发明提供的地址库索引方法和地址匹配方法可以应用于物流平台、电商平台或任何第三方需要使用地址信息的平台,但本发明的应用场景并非以此为限制,在此不予赘述。
图1示出了根据本发明实施例的地址库索引方法的流程图。地址库索引方法包括如下步骤:
步骤S110:将所述地址库按所述地址库中各地址信息的至少部分区域信息划分为多个查询分片。
具体而言,步骤S110可以通过地理级别更高(地区范围更大)的地址字段进行查询分片的划分。例如,可以按省级地址级别、市级地址级别、区级地址级别等,对地址库进行查询分片。在一些优选例地址库的省级地址级别、市级地址级别、区级地址级别还可以实现逐级分片,换言之,省级地址查询分片可以查询属于该省的市级地址字段;市级地址查询分片可以查询属于该市的区级地址字段;区级地址查询分片可以查询属于该区的各详细地址。本发明可以实现更多不同的分片方式,在此不予赘述。步骤S110的查询分片可以用于在进行地址匹配时进行初步筛选,从而可以大大减少所要匹配的地址信息的数据量,提高地址匹配效率。同时,省级地址级别、市级地址级别、区级地址级别等地理级别更高的地址字段通常不会有别名,从而,利用该些地址字段进行查询分片,对匹配准确率没有影响。
步骤S120:对所述地址库中的每一地址信息执行地址索引生成步骤,所述地址索引生成步骤包括如下步骤:
步骤S121:对该地址信息进行分词,获得多个分词结果。
具体而言,采用地址词库对该地址信息按多个分词算法分别进行分词,获得多个分词结果。地址词库可以是由地图供应商或者其它第三方提供专用于地址信息的词库,采用地址词库进行分词,可以大大提高分词的准确率,避免分词产生错误。同时,可以采用多个分词算法进行分词以获得多个分词结果,从而采用多个分词结果进行后续步骤,从而可以提高索引的匹配准确率。
进一步地,所述分词算法可以包括最大匹配分词算法、最小匹配分词算法、索引分词算法或者它们之间的任意组合。本发明所采用的分词算法并非以此为限制,其它类型的分词算法也在本案的保护范围之内。具体而言,最大匹配分词算法、最小匹配分词算法、索引分词算法由于算法的设置会获得不同字段数量、不同字段长度的分词结果,由此,可以从多个不同的维度,来表示同一地址信息。
步骤S122:合并该地址信息的多个分词结果,以获得第一字段。
具体而言,步骤S122可以直接合并地址信息的多个分词结果。例如,可以将不同分词算法获得的分词结果直接进行拼接。在本发明的另一些实施例中,步骤S122可以由如下步骤实现:根据上下文无关文法,合并该地址信息的多个分词结果,以获得第一字段。具体而言,上下文无关文法给出了精确的,易于理解的文法说明,同时,可以自动产生高效的分析器,可以给语言定义出层次结构,此外,还可以以文法为基础的语言实现便于语言的修改。由此,使用上下文无关文本,合并该地址信息的多个分词结果,以获得的第一字段可以具有较为准确的层次结构,同时,合并效率高。
步骤S123:将所述第一字段作为该地址信息的地址索引,以供根据所述地址索引搜索获得该地址信息。
在本发明各个实施例中,所述地址库索引方法基于分布式搜索服务器实现。分布式搜索服务器例如可以是ElasticSearch,本发明并非以此为限制。
在本发明提供的地址库索引方法中,一方面,通过首先按地址信息的至少部分区域信息将地址库划分为多个查询分片,以实现初步的地址库的划分,以便于匹配时,可仅基于其中一个查询分片进行,大大减小所要求匹配的数据量,提高地址匹配效率;另一方面,通过对地址库中的每个地址信息进行分词,合并分词结果,以提供地址信息的索引,以便于通过合并的分词结果提高地址匹配的准确率,同时,通过索引的方式,提高地址匹配的效率。由此,本发明可以在海量标准地址的地址库中,在保证准确性的情况下,能够尽可能少的时间找到最优匹配的地址。
下面参见图2,图2示出了根据本发明实施例的地址索引生成步骤中的生成辅助索引字段的流程图。图2共示出如下步骤:
步骤S124:对该地址信息进行解析以获得至少一个第一预定字段。
具体而言,步骤S124可以采用一个序列标注算法或者采用多个序列标注算法的组合,对该地址信息进行解析以获得至少一个第一预定字段。序列标注算法包括但不限于隐马尔可夫、最大熵马尔可夫、条件随机场、长短期记忆网络、双向长短时记忆网络等。在本发明的一些实施例中,可以仅采用上述序列标注算法中搞得一个算法实现地址信息的解析。在本发明的另一些实施例中,可以采用上述序列标注算法中的多个算法来实现地址信息的解析。在本发明的一个优选例中,可以采用双向长短时记忆网络和条件随机场(BiLSTM+CRF)来实现地址信息的解析,以提取地址字段的实体关系,从而提取至少一个第一预定字段。具体而言,所述第一预定字段包括乡、镇、村、社区、兴趣点、路名、路号、楼栋号中的一项或多项,本发明并非以此为限制。
步骤S125:将所述第一预定字段作为该地址信息的辅助索引字段。
由此,可以将上述乡、镇、村、社区、兴趣点、路名、路号、楼栋号中的一项或多项作为辅助索引字段,从而实现辅助索引。具体而言,在一些实施例中,辅助索引可以在进行地址索引时,与地址索引一并进行索引,由此,提高地址信息的匹配准确率。在另一些实施例中,也可以当通过根据地址索引获得多个地址信息时,采用辅助索引字段进行辅助索引,减少索引的数据量,以提高地址信息匹配效率的同时,提高地址信息匹配的准确率。
图3示出了根据本发明实施例的地址匹配方法的流程图。地址匹配方法采用如上所述的地址库索引方法构建的地址索引对待匹配地址信息进行地址匹配。地址匹配方法包括如下步骤:
步骤S210:基于所述待匹配地址信息的至少部分区域信息,自所述地址库中确定查询分片。
具体而言,步骤S210中的至少部分区域信息和步骤S110中的至少部分区域信息对应一致。换言之,当步骤S110中,利用省级地址字段进行分片时,步骤S210采用省级地址字段进行查询分片的确定,依次类推,在此不予赘述。
步骤S220:对所述待匹配地址信息执行地址查询索引生成步骤,所述地址查询索引生成步骤包括:
步骤S221:对所述待匹配地址信息进行分词,获得多个分词结果。
具体而言,步骤S221中采用的分词方式与步骤S121中采用的分词方式一致,从而保证地址库的地址信息的分词结果和待匹配地址信息的分词结果具有相同的数量和形式。换言之,当步骤S121中采用多个分词算法时,步骤S221中也采用相同的多个分词算法进行分词。
步骤S222:合并所述待匹配地址信息的多个分词结果,以获得第二字段。
具体而言,步骤S222和步骤S122对应,以采用相同的方式进行分词结果的合并。当步骤S122中直接对分词结果进行合并时,步骤S222也可以直接对分词结果进行合并。当步骤S122中采用上下文无关文法进行分词结果的合并时,步骤S222也可以采用上下文无关文法进行分词结果的合并。
步骤S223:将所述第二字段作为所述待匹配地址信息的地址查询索引。
由此,通过步骤S221和步骤S121对应;步骤S222和步骤S122对应,从而待匹配地址信息的地址查询索引和地址库中地址信息的地址索引具有相同的形式,可以用来进行索引匹配。
步骤S230:根据所述待匹配地址信息的地址查询索引与所述查询分片的各地址信息的地址索引的匹配,提供所匹配地址信息。
在本发明提供的地址匹配方法中,一方面,通过首先按地址信息的至少部分区域信息将地址库划分为多个查询分片,以实现初步的地址库的划分,以便于匹配时,可仅基于其中一个查询分片进行,大大减小所要求匹配的数据量,提高地址匹配效率;另一方面,通过对地址库中的每个地址信息进行分词,合并分词结果,以提供地址信息的索引,以便于通过合并的分词结果提高地址匹配的准确率,同时,通过索引的方式,提高地址匹配的效率。由此,本发明可以在海量标准地址的地址库中,在保证准确性的情况下,能够尽可能少的时间找到最优匹配的地址。
下面参见图4,图4示出了根据本发明实施例的地址查询索引生成步骤中生成辅助索引查询字段的流程图。图4共示出如下步骤:
步骤S224:对所述待匹配地址信息进行解析以获得至少一个第二预定字段。
具体而言,步骤S224和步骤S124对应一致,从而可以采用相同的一个序列标注算法或者采用多个序列标注算法的组合,对待匹配地址信息进行解析以获得至少一个第二预定字段。所述第二预定字段与所述第一预定字段具有相同的含义,例如,可以包括乡、镇、村、社区、兴趣点、路名、路号、楼栋号中的一项或多项,本发明并非以此为限制。
步骤S225:将所述第二预定字段作为该地址信息的辅助索引查询字段,所述辅助索引查询字段用于与所述地址库中的地址信息的辅助索引字段进行匹配。
由此,在一些实施例中,辅助索引查询字段可以在进行地址索引时,与地址索引一并进行索引,由此,提高地址信息的匹配准确率。在另一些实施例中,也可以当通过根据地址索引获得多个地址信息时,采用辅助索引查询字段与地址库中的地址信息的辅助索引字段的匹配,进行辅助索引,减少索引的数据量,以提高地址信息匹配效率的同时,提高地址信息匹配的准确率。
在本发明的一些具体实施例中,所述地址查询索引包括多个第二字段,各所述第二字段具有不同的权重,所述第二字段的权重越高所述地址查询索引中的第二字段的匹配优先级越高。具体而言,当地址查询索引包括多个第二字段时,可以优选对权重最高的第二字段进行其与地址索引的匹配,然后,获取权重次高的第二字段,在首次匹配获得的地址信息的结果中进行进一步的匹配,以此类推,直到匹配结果仅为一条地址信息为止。当地址查询索引的多个第二字段皆匹配完成时,可以采用前述的辅助索引查询字段进行辅助匹配。
在上述实施例中,所述第二字段的权重基于TF-IDF算法计算获得。TF是词频(TermFrequency),IDF是逆文本频率指数(Inverse Document Frequency)。具体而言,第二字段的权重可以基于地址词库计算,也可以基于地址库计算,本发明可以实现更多的变化方式,在此不予赘述。由此,通过与地址信息相关的数据库来计算第二字段的权重,以便于能够体现第二字段的重要程度,从而决定第二子弹的匹配优先级。
在本发明的一些实施例中,所述地址库中各地址信息关联有地理坐标,所述根据所述待匹配地址信息的地址查询索引与所述查询分片的各地址信息的地址索引的匹配,提供所匹配地址信息还包括:提供所匹配地址信息关联的地理坐标。由此,在地址匹配方法的实际应用中,在用户给定收货地址后,物流平台和/或电商平台可以快速得到该地址对应的经纬度。即使在海量订单的场景下,上述地址匹配方法的匹配效果优异、准确率较高,同时匹配效率较高,从而避免订单数据堆积、队列堵塞等影响物流订单的正常进行的情况发生。
以上仅仅是本发明的地址库索引方法和地址匹配方法的多个具体实现方式,各实现方式可以独立或组合来实现,本发明并非以此为限制。进一步地,本发明的流程图仅仅是示意性地,各步骤之间的执行顺序并非以此为限制,步骤的拆分、合并、顺序交换、其它同步或异步执行的方式皆在本发明的保护范围之内。
下面参见图5,图5示出了根据本发明实施例的地址库索引装置的模块图。地址库索引装置310包括划分模块311以及第一生成模块312。
划分模块311配置成将所述地址库按所述地址库中各地址信息的至少部分区域信息划分为多个查询分片。
第一生成模块312配置成对所述地址库中的每一地址信息执行地址索引生成步骤,所述地址索引生成步骤包括:
对该地址信息进行分词,获得多个分词结果;
合并该地址信息的多个分词结果,以获得第一字段;
将所述第一字段作为该地址信息的地址索引,以供根据所述地址索引搜索获得该地址信息。
下面参见图6,图6示出了根据本发明实施例的地址匹配装置的模块图。地址匹配装置采用如上所述的地址库索引方法构建的地址索引对待匹配地址信息进行地址匹配。地址匹配装置320包括确定模块321、第二生成模块322以及匹配模块323。
确定模块321配置成基于所述待匹配地址信息的至少部分区域信息,自所述地址库中确定查询分片。
第二生成模块322配置成对所述待匹配地址信息执行地址查询索引生成步骤,所述地址查询索引生成步骤包括:
对所述待匹配地址信息进行分词,获得多个分词结果;
合并所述待匹配地址信息的多个分词结果,以获得第二字段;
将所述第二字段作为所述待匹配地址信息的地址查询索引。
匹配模块323配置成根据所述待匹配地址信息的地址查询索引与所述查询分片的各地址信息的地址索引的匹配,提供所匹配地址信息。
在本发明的示例性实施方式的地址库索引装置和地址匹配装置中,一方面,通过首先按地址信息的至少部分区域信息将地址库划分为多个查询分片,以实现初步的地址库的划分,以便于匹配时,可仅基于其中一个查询分片进行,大大减小所要求匹配的数据量,提高地址匹配效率;另一方面,通过对地址库中的每个地址信息进行分词,合并分词结果,以提供地址信息的索引,以便于通过合并的分词结果提高地址匹配的准确率,同时,通过索引的方式,提高地址匹配的效率。由此,本发明可以在海量标准地址的地址库中,在保证准确性的情况下,能够尽可能少的时间找到最优匹配的地址。
图5和图6仅仅是示意性的分别示出本发明提供的地址库索引装置310和地址匹配装置320,在不违背本发明构思的前提下,模块的拆分、合并、增加都在本发明的保护范围之内。本发明提供的地址库索引装置310和地址匹配装置320可以由软件、硬件、固件、插件及他们之间的任意组合来实现,本发明并非以此为限。
在本发明的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被例如处理器执行时可以实现上述任意一个实施例中所述地址库索引方法和/或地址匹配方法的步骤。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述所述地址库索引方法和/或地址匹配方法部分中描述的根据本发明各种示例性实施方式的步骤。
参考图7所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品700,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在租户计算设备上执行、部分地在租户设备上执行、作为一个独立的软件包执行、部分在租户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到租户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
在本发明的示例性实施例中,还提供一种电子设备,该电子设备可以包括处理器,以及用于存储所述处理器的可执行指令的存储器。其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一个实施例中所述地址库索引方法和/或地址匹配方法的步骤。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
下面参照图8来描述根据本发明的这种实施方式的电子设备500。图8显示的电子设备500仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图8所示,电子设备500以通用计算设备的形式表现。电子设备500的组件可以包括但不限于:至少一个处理单元510、至少一个存储单元520、连接不同系统组件(包括存储单元520和处理单元510)的总线530、显示单元540等。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元510执行,使得所述处理单元510执行本说明书上述所述地址库索引方法和/或地址匹配方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元510可以执行如图1至图2任一幅或多幅附图所示的步骤。
所述存储单元520可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)5201和/或高速缓存存储单元5202,还可以进一步包括只读存储单元(ROM)5203。
所述存储单元520还可以包括具有一组(至少一个)程序模块5205的程序/实用工具5204,这样的程序模块5205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线530可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备500也可以与一个或多个外部设备600(例如键盘、指向设备、蓝牙设备等)通讯,还可与一个或者多个使得租户能与该电子设备500交互的设备通讯,和/或与使得该电子设备500能与一个或多个其它计算设备进行通讯的任何设备(例如路由器、调制解调器等等)通讯。这种通讯可以通过输入/输出(I/O)接口550进行。并且,电子设备500还可以通过网络适配器560与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通讯。网络适配器560可以通过总线530与电子设备500的其它模块通讯。应当明白,尽管图中未示出,可以结合电子设备500使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、或者网络设备等)执行根据本发明实施方式的上述所述地址库索引方法和/或地址匹配方法。
相比现有技术,本发明的优势在于:
一方面,通过首先按地址信息的至少部分区域信息将地址库划分为多个查询分片,以实现初步的地址库的划分,以便于匹配时,可仅基于其中一个查询分片进行,大大减小所要求匹配的数据量,提高地址匹配效率;另一方面,通过对地址库中的每个地址信息进行分词,合并分词结果,以提供地址信息的索引,以便于通过合并的分词结果提高地址匹配的准确率,同时,通过索引的方式,提高地址匹配的效率。由此,本发明可以在海量标准地址的地址库中,在保证准确性的情况下,能够尽可能少的时间找到最优匹配的地址。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由所附的权利要求指出。
Claims (17)
1.一种地址库索引方法,其特征在于,包括:
将所述地址库按所述地址库中各地址信息的至少部分区域信息划分为多个查询分片;
对所述地址库中的每一地址信息执行地址索引生成步骤,所述地址索引生成步骤包括:
对该地址信息进行分词,获得多个分词结果;
合并该地址信息的多个分词结果,以获得第一字段;
将所述第一字段作为该地址信息的地址索引,以供根据所述地址索引搜索获得该地址信息。
2.如权利要求1所述的地址库索引方法,其特征在于,所述合并该地址信息的多个分词结果,以获得第一字段包括:
根据上下文无关文法,合并该地址信息的多个分词结果,以获得第一字段。
3.如权利要求1所述的地址库索引方法,其特征在于,所述对该地址信息进行分词,获得多个分词结果包括:
采用地址词库对该地址信息按多个分词算法分别进行分词,获得多个分词结果。
4.如权利要求3所述的地址库索引方法,其特征在于,所述分词算法包括:最大匹配分词算法、最小匹配分词算法、索引分词算法或者它们之间的任意组合。
5.如权利要求1所述的地址库索引方法,其特征在于,所述地址索引生成步骤还包括:
对该地址信息进行解析以获得至少一个第一预定字段;
将所述第一预定字段作为该地址信息的辅助索引字段。
6.如权利要求5所述的地址库索引方法,其特征在于,所述对该地址信息进行解析以获得至少一个第一预定字段包括:
采用一个序列标注算法或者采用多个序列标注算法的组合,对该地址信息进行解析以获得至少一个第一预定字段。
7.如权利要求5所述的地址库索引方法,其特征在于,所述第一预定字段包括乡、镇、村、社区、兴趣点、路名、路号、楼栋号中的一项或多项。
8.如权利要求1至7任一项所述的地址库索引方法,其特征在于,所述地址库索引方法基于分布式搜索服务器实现。
9.一种地址匹配方法,其特征在于,采用如权利要求1至8任一项所述的地址库索引方法构建的地址索引对待匹配地址信息进行地址匹配,包括:
基于所述待匹配地址信息的至少部分区域信息,自所述地址库中确定查询分片;
对所述待匹配地址信息执行地址查询索引生成步骤,所述地址查询索引生成步骤包括:
对所述待匹配地址信息进行分词,获得多个分词结果;
合并所述待匹配地址信息的多个分词结果,以获得第二字段;
将所述第二字段作为所述待匹配地址信息的地址查询索引;
根据所述待匹配地址信息的地址查询索引与所述查询分片的各地址信息的地址索引的匹配,提供所匹配地址信息。
10.如权利要求9所述的地址匹配方法,其特征在于,所述地址查询索引生成步骤还包括:
对所述待匹配地址信息进行解析以获得至少一个第二预定字段;
将所述第二预定字段作为该地址信息的辅助索引查询字段,所述辅助索引查询字段用于与所述地址库中的地址信息的辅助索引字段进行匹配。
11.如权利要求9所述的地址匹配方法,其特征在于,所述地址查询索引包括多个第二字段,各所述第二字段具有不同的权重,所述第二字段的权重越高所述地址查询索引中的第二字段的匹配优先级越高。
12.如权利要求11所述的地址匹配方法,其特征在于,所述第二字段的权重基于TF-IDF算法计算获得。
13.如权利要求9至12任一项所述的地址匹配方法,其特征在于,所述地址库中各地址信息关联有地理坐标,所述根据所述待匹配地址信息的地址查询索引与所述查询分片的各地址信息的地址索引的匹配,提供所匹配地址信息还包括:
提供所匹配地址信息关联的地理坐标。
14.一种地址库索引装置,其特征在于,包括:
划分模块,配置成将所述地址库按所述地址库中各地址信息的至少部分区域信息划分为多个查询分片;
第一生成模块,配置成对所述地址库中的每一地址信息执行地址索引生成步骤,所述地址索引生成步骤包括:
对该地址信息进行分词,获得多个分词结果;
合并该地址信息的多个分词结果,以获得第一字段;
将所述第一字段作为该地址信息的地址索引,以供根据所述地址索引搜索获得该地址信息。
15.一种地址匹配装置,其特征在于,采用如权利要求1至8任一项所述的地址库索引方法构建的地址索引对待匹配地址信息进行地址匹配,包括:
确定模块,配置成基于所述待匹配地址信息的至少部分区域信息,自所述地址库中确定查询分片;
第二生成模块,配置成对所述待匹配地址信息执行地址查询索引生成步骤,所述地址查询索引生成步骤包括:
对所述待匹配地址信息进行分词,获得多个分词结果;
合并所述待匹配地址信息的多个分词结果,以获得第二字段;
将所述第二字段作为所述待匹配地址信息的地址查询索引;
匹配模块,配置成根据所述待匹配地址信息的地址查询索引与所述查询分片的各地址信息的地址索引的匹配,提供所匹配地址信息。
16.一种电子设备,其特征在于,所述电子设备包括:
处理器;
存储器,其上存储有计算机程序,所述计算机程序被所述处理器运行时执行:
如权利要求1至8任一项所述的地址库索引方法;和/或
如权利要求9至13任一项所述的地址匹配方法。
17.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行:
如权利要求1至8任一项所述的地址库索引方法;和/或
如权利要求9至13任一项所述的地址匹配方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110134495.7A CN112835899B (zh) | 2021-01-29 | 2021-01-29 | 地址库索引方法、地址匹配方法以及相关设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110134495.7A CN112835899B (zh) | 2021-01-29 | 2021-01-29 | 地址库索引方法、地址匹配方法以及相关设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112835899A true CN112835899A (zh) | 2021-05-25 |
CN112835899B CN112835899B (zh) | 2024-07-02 |
Family
ID=75932708
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110134495.7A Active CN112835899B (zh) | 2021-01-29 | 2021-01-29 | 地址库索引方法、地址匹配方法以及相关设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112835899B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113536781A (zh) * | 2021-06-30 | 2021-10-22 | 上海晶赞融宣科技有限公司 | 地址识别方法及装置、可读存储介质、终端 |
CN114780146A (zh) * | 2022-06-17 | 2022-07-22 | 深流微智能科技(深圳)有限公司 | 资源地址查询方法、装置、系统 |
CN114785742A (zh) * | 2022-06-21 | 2022-07-22 | 闪捷信息科技有限公司 | 访问地址信息加载方法、流量处理方法和电子设备 |
Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101980208A (zh) * | 2010-11-10 | 2011-02-23 | 百度在线网络技术(北京)有限公司 | 地址查询方法及系统 |
CN102033954A (zh) * | 2010-12-24 | 2011-04-27 | 东北大学 | 关系数据库中可扩展标记语言文档全文检索查询索引方法 |
CN102314645A (zh) * | 2011-09-26 | 2012-01-11 | 深圳市络道科技有限公司 | 一种地址匹配方法及匹配系统 |
CN105512121A (zh) * | 2014-09-23 | 2016-04-20 | 北京汇通天下物联科技有限公司 | 基于关键词的地址查询方法 |
CN106651247A (zh) * | 2016-11-16 | 2017-05-10 | 成都地图慧科技有限公司 | 基于gis拓扑分析的地址匹配区域块方法和系统 |
CN108446365A (zh) * | 2018-03-14 | 2018-08-24 | 北京思特奇信息技术股份有限公司 | 一种地址信息查询方法、系统、设备和存储介质 |
CN109145169A (zh) * | 2018-07-26 | 2019-01-04 | 浙江省测绘科学技术研究院 | 一种基于统计分词的地址匹配方法 |
CN110442603A (zh) * | 2019-07-03 | 2019-11-12 | 平安科技(深圳)有限公司 | 地址匹配方法、装置、计算机设备及存储介质 |
CN110866127A (zh) * | 2018-08-27 | 2020-03-06 | 华为技术有限公司 | 建立索引的方法以及相关装置 |
CN111460054A (zh) * | 2019-01-21 | 2020-07-28 | 阿里巴巴集团控股有限公司 | 地址数据处理方法及装置、设备和存储介质 |
CN111538796A (zh) * | 2020-03-26 | 2020-08-14 | 中国平安人寿保险股份有限公司 | 地址规范化处理方法、装置、设备及存储介质 |
WO2020168750A1 (zh) * | 2019-02-18 | 2020-08-27 | 平安科技(深圳)有限公司 | 一种地址信息标准化方法、装置、计算机设备及存储介质 |
CN111611290A (zh) * | 2020-05-14 | 2020-09-01 | 深圳中科慧据科技有限公司 | 地址快速定位方法、装置、计算机设备及存储介质 |
CN111625732A (zh) * | 2020-05-25 | 2020-09-04 | 鼎富智能科技有限公司 | 地址匹配方法及装置 |
CN111753515A (zh) * | 2020-06-24 | 2020-10-09 | 广东科杰通信息科技有限公司 | 一种实现实体定位的地址信息提取及匹配方法 |
CN111784239A (zh) * | 2020-06-17 | 2020-10-16 | 上海乾臻信息科技有限公司 | 派送网点的确定方法、装置、电子设备及存储介质 |
CN111859956A (zh) * | 2020-07-09 | 2020-10-30 | 睿智合创(北京)科技有限公司 | 一种用于金融行业的地址分词方法 |
CN112115144A (zh) * | 2020-09-15 | 2020-12-22 | 中电科华云信息技术有限公司 | 一种基于标准地址矩阵加权映射比对地址匹配的方法 |
-
2021
- 2021-01-29 CN CN202110134495.7A patent/CN112835899B/zh active Active
Patent Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101980208A (zh) * | 2010-11-10 | 2011-02-23 | 百度在线网络技术(北京)有限公司 | 地址查询方法及系统 |
CN102033954A (zh) * | 2010-12-24 | 2011-04-27 | 东北大学 | 关系数据库中可扩展标记语言文档全文检索查询索引方法 |
CN102314645A (zh) * | 2011-09-26 | 2012-01-11 | 深圳市络道科技有限公司 | 一种地址匹配方法及匹配系统 |
CN105512121A (zh) * | 2014-09-23 | 2016-04-20 | 北京汇通天下物联科技有限公司 | 基于关键词的地址查询方法 |
CN106651247A (zh) * | 2016-11-16 | 2017-05-10 | 成都地图慧科技有限公司 | 基于gis拓扑分析的地址匹配区域块方法和系统 |
CN108446365A (zh) * | 2018-03-14 | 2018-08-24 | 北京思特奇信息技术股份有限公司 | 一种地址信息查询方法、系统、设备和存储介质 |
CN109145169A (zh) * | 2018-07-26 | 2019-01-04 | 浙江省测绘科学技术研究院 | 一种基于统计分词的地址匹配方法 |
CN110866127A (zh) * | 2018-08-27 | 2020-03-06 | 华为技术有限公司 | 建立索引的方法以及相关装置 |
CN111460054A (zh) * | 2019-01-21 | 2020-07-28 | 阿里巴巴集团控股有限公司 | 地址数据处理方法及装置、设备和存储介质 |
WO2020168750A1 (zh) * | 2019-02-18 | 2020-08-27 | 平安科技(深圳)有限公司 | 一种地址信息标准化方法、装置、计算机设备及存储介质 |
CN110442603A (zh) * | 2019-07-03 | 2019-11-12 | 平安科技(深圳)有限公司 | 地址匹配方法、装置、计算机设备及存储介质 |
CN111538796A (zh) * | 2020-03-26 | 2020-08-14 | 中国平安人寿保险股份有限公司 | 地址规范化处理方法、装置、设备及存储介质 |
CN111611290A (zh) * | 2020-05-14 | 2020-09-01 | 深圳中科慧据科技有限公司 | 地址快速定位方法、装置、计算机设备及存储介质 |
CN111625732A (zh) * | 2020-05-25 | 2020-09-04 | 鼎富智能科技有限公司 | 地址匹配方法及装置 |
CN111784239A (zh) * | 2020-06-17 | 2020-10-16 | 上海乾臻信息科技有限公司 | 派送网点的确定方法、装置、电子设备及存储介质 |
CN111753515A (zh) * | 2020-06-24 | 2020-10-09 | 广东科杰通信息科技有限公司 | 一种实现实体定位的地址信息提取及匹配方法 |
CN111859956A (zh) * | 2020-07-09 | 2020-10-30 | 睿智合创(北京)科技有限公司 | 一种用于金融行业的地址分词方法 |
CN112115144A (zh) * | 2020-09-15 | 2020-12-22 | 中电科华云信息技术有限公司 | 一种基于标准地址矩阵加权映射比对地址匹配的方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113536781A (zh) * | 2021-06-30 | 2021-10-22 | 上海晶赞融宣科技有限公司 | 地址识别方法及装置、可读存储介质、终端 |
CN114780146A (zh) * | 2022-06-17 | 2022-07-22 | 深流微智能科技(深圳)有限公司 | 资源地址查询方法、装置、系统 |
CN114780146B (zh) * | 2022-06-17 | 2022-08-26 | 深流微智能科技(深圳)有限公司 | 资源地址查询方法、装置、系统 |
CN114785742A (zh) * | 2022-06-21 | 2022-07-22 | 闪捷信息科技有限公司 | 访问地址信息加载方法、流量处理方法和电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN112835899B (zh) | 2024-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112835899B (zh) | 地址库索引方法、地址匹配方法以及相关设备 | |
CN101707873B (zh) | 机器翻译中的大语言模型 | |
CN109783490B (zh) | 数据融合方法、装置、计算机设备及存储介质 | |
CN107203526B (zh) | 一种查询串语义需求分析方法及装置 | |
EP3591338A2 (en) | Navigation method, navigation device, device and medium | |
CN110990520B (zh) | 一种地址编码方法、装置、电子设备和存储介质 | |
CN109710951B (zh) | 基于翻译历史的辅助翻译方法、装置、设备及存储介质 | |
CN111143556B (zh) | 软件功能点自动计数方法、装置、介质及电子设备 | |
CN112818685A (zh) | 地址匹配方法、装置、电子设备及存储介质 | |
CN111259262A (zh) | 一种信息检索方法、装置、设备及介质 | |
US8874428B2 (en) | Method and apparatus for fast translation memory search | |
CN111597800A (zh) | 同义句的获取方法及装置、设备及存储介质 | |
CN109710952B (zh) | 基于人工智能的翻译历史检索方法、装置、设备和介质 | |
CN111062208A (zh) | 一种文件审核的方法、装置、设备及存储介质 | |
CN112818666B (zh) | 地址识别方法、装置、电子设备和存储介质 | |
CN113887253A (zh) | 用于机器翻译的方法、设备和介质 | |
CN111930891B (zh) | 基于知识图谱的检索文本扩展方法及相关装置 | |
CN112818665A (zh) | 结构化地址信息的方法、装置、电子设备及存储介质 | |
CN110287338B (zh) | 行业热点确定方法、装置、设备和介质 | |
CN114036921A (zh) | 一种政策信息匹配方法和装置 | |
CN111796833A (zh) | 代码语言转换方法、系统、设备及存储介质 | |
CN111538796A (zh) | 地址规范化处理方法、装置、设备及存储介质 | |
CN111339448B (zh) | 查询改写方法、系统、设备及存储介质 | |
CN114020774A (zh) | 多轮问答语句的处理方法、装置、设备及存储介质 | |
CN112650839A (zh) | 检索信息优化方法以及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |