CN112070429B - 一种地址合并方法及系统 - Google Patents

一种地址合并方法及系统 Download PDF

Info

Publication number
CN112070429B
CN112070429B CN202010756947.0A CN202010756947A CN112070429B CN 112070429 B CN112070429 B CN 112070429B CN 202010756947 A CN202010756947 A CN 202010756947A CN 112070429 B CN112070429 B CN 112070429B
Authority
CN
China
Prior art keywords
address
address block
character string
level
merging
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010756947.0A
Other languages
English (en)
Other versions
CN112070429A (zh
Inventor
陈婷
赵兴
林灿
寇宇
陈才宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Leap New Technology Co ltd
Original Assignee
Shenzhen Leap New Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Leap New Technology Co ltd filed Critical Shenzhen Leap New Technology Co ltd
Priority to CN202010756947.0A priority Critical patent/CN112070429B/zh
Publication of CN112070429A publication Critical patent/CN112070429A/zh
Application granted granted Critical
Publication of CN112070429B publication Critical patent/CN112070429B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/083Shipping
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Educational Administration (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Character Discrimination (AREA)

Abstract

本发明公开了一种地址合并方法和系统,其中方法包括:将获取到的两个订单地址按地址关键词库分别逐级进行切分,得到第一地址块字符串和第二地址块字符串;匹配第一地址块字符串和第二地址块字符串,进行初合并计算,判断是否可合并,若是,则两个订单地址合并,若初合并计算无法判断,则将第一地址块字符串和第二地址块字符串输入至地址相似度合并模型中进行打分,得到权重值正值和权重值负值;当权重值正值不小于第一预设阈值,且权重值负值不大于第二预设阈值时,则两个订单地址合并。本发明通过对切分后的地址进行初合并计算和相似度合并模型打分,以判定两订单地址是否可以合并,其判断结果更为准确,且初合并计算提升了地址合并的效率。

Description

一种地址合并方法及系统
技术领域
本发明涉及物流运输技术领域,尤其涉及一种地址合并方法及系统。
背景技术
物流行业当中在取/派件过程中计算绩效的方式往往是通过取/派件数量与派件重量来计算绩效的。一般来说,取/派送每件快递都会产生一个基本绩效提成费用;如果货物超过一定重量,绩效费用会相应增加,用以补偿快递员在送货当中所遇到和面临的困难。
在计算绩效时,如果取/派送的多单,其取/派送地址是同一个,则会将这几单进行合并,视为一单,以进行计算绩效。而实际当中,由于中文表述的复杂性以及不同个体对同一地理位置的表述不同,导致一个地址从文本角度可能出现多种表达,而地址相似度计算能解决这一问题。地址相似度计算是指两个地址在其地理含义中的近似程度。随着对不同表述地址的不断积累,这种地理位置相同但表述相近或不同的地址信息大量冗余,并且同时也伴随着大量不规范的地址信息表述的存在。因此地址相似度的计算起着至关重要的作用。
现有的技术中,地址相似度计算通过调用地图接口,获取两条地址的位置经纬度,根据计算两地址经纬度之间的距离得出其相似度。但由于地址表述的复杂性以及不规范性,采用地图获取地址定位相对困难,从而得出的导航距离不准;另外,由于完全依赖于地图数据,成本过高,并且会受到各种因素与条件的制约,从而影响地址相似度的准确率。
发明内容
本申请提供了一种地址合并方法及系统,以解决现有地址相似度计算方式精度较低的问题。
为了解决上述问题,本申请提供了一种地址合并方法,包括:S1、对应预先构建的地址关键词库的多级地址关键词,将获取到的两个订单地址分别逐级进行切分,得到第一地址块字符串和第二地址块字符串;订单地址来自同一个取/派网点;S2、匹配第一地址块字符串和第二地址块字符串,进行初合并计算,判断是否可合并,若是,则两个订单地址合并;若初合并计算无法判断,则执行步骤S3;S3、将第一地址块字符串和第二地址块字符串输入至预先训练好的地址相似度合并模型中进行打分;若两地址块字符串中同一级的地址块字符可合并,则累加该级对应的权重值正值,反之,则累加该级对应的权重值负值;当所得权重值正值不小于第一预设阈值,且权重值负值不大于第二预设阈值时,则两个订单地址合并;地址相似度合并模型按照分值从小到大为地址关键词库逐级设置权重值。
作为本申请的进一步改进,地址关键词库中1-3级依次为包含“省、市、区、县、镇”关键词的行政区划级、包含“街道”或类似关键词的街道级、包含“社区”或类似关键词的社区级;地址关键词库中4-5级依次为包含“路”或类似关键词的路级、包含“号”或类似关键词的号级;地址关键词库中在5级之后,最末1级之间存在包含“工业园”或类似关键词的工业园级,以及包含“栋”或类似关键词的栋级;初合并计算包括先比较地址字符串前三级相似度,次比较地址字符串第4-5级相似度,最后比较地址字符串工业园级和栋级相似度。
作为本申请的进一步改进,比较地址字符串前三级相似度,包括:A1、判断第一地址块字符串和第二地址块字符串是否均同时只包含地址关键词库中1-2级对应的地址块字符或1-3级对应的地址块字符;A2、若是,且同一级的地址块字符相同,则第一地址块字符串和第二地址块字符串可合并。
作为本申请的进一步改进,比较地址字符串第4-5级相似度,包括:B1、判断第一地址块字符串和第二地址块字符串是否均包含地址关键词库中4级和5级对应的地址块字符;B2、若是,且同一级的地址块字符相同,则第一地址块字符串和第二地址块字符串可合并。
作为本申请的进一步改进,比较工业园级和栋级相似度,包括:C1、判断第一地址块字符串和第二地址块字符串是否均包含工业园级对应的地址块字符;C2、若是,判断工业园级对应的地址块字符是否均包含相同特征字段,若包含则跳转C3,若不包含则跳转C4;C3、若第一地址块字符串和第二地址块字符串中在特征字段之前的地址块字符中至少存在一个相同的,则判断工业园级对应的地址块字符之后是否存在地址块字符,若不存在,则第一地址块字符串和第二地址块字符串可合并,若存在,则跳转C5;C4、若工业园级对应的地址块字符之前的所有地址块字符均相同,则判断工业园级对应的地址块字符之后是否存在地址块字符,若不存在,则第一地址块字符串和第二地址块字符串可合并,若存在,则跳转C5;C5、判断工业园地址块之后是否包括栋级对应地址块字符,若不包括,且工业园级对应的地址块字符至栋级对应的地址块字符之间至少存在一个相同地址块字符,则第一地址块字符串和第二地址块字符串可合并;若包括栋级地址块,且栋级地址块对应的地址块字符所含数字或字母间的差值小于预设数值,则第一地址块字符串和第二地址块字符串可合并。
为了解决上述问题,本申请还提供了一种地址合并系统,包括:切分模块,用于对应预先构建的地址关键词库的多级地址关键词,将获取到的两个订单地址分别逐级进行切分,得到第一地址块字符串和第二地址块字符串;订单地址来自同一个取/派网点;第一合并模块,用于匹配第一地址块字符串和第二地址块字符串,进行初合并计算,判断是否可合并,若是,则两个订单地址合并;打分模块,用于当第一合并模块执行初合并计算无法判断时,将第一地址块字符串和第二地址块字符串输入至预先训练好的地址相似度合并模型中进行打分;第二合并模块,用于若两地址块字符串中同一级的地址块字符可合并,则累加该级对应的权重值正值,反之,则累加该级对应的权重值负值;当所得权重值正值不小于第一预设阈值,且权重值负值不大于第二预设阈值时,则两个订单地址合并;地址相似度合并模型按照分值从小到大为地址关键词库逐级设置权重值。
作为本申请的进一步改进,地址关键词库中1-3级依次为包含“省、市、区、县、镇”关键词的行政区划级、包含“街道”或类似关键词的街道级、包含“社区”或类似关键词的社区级;地址关键词库中4-5级依次为包含“路”或类似关键词的路级、包含“号”或类似关键词的号级;地址关键词库中在5级之后,最末1级之间存在包含“工业园”或类似关键词的工业园级,以及包含“栋”或类似关键词的栋级;第一合并模块进行初合并计算包括:先比较地址字符串前三级相似度,次比较地址字符串第4-5级相似度,最后比较地址字符串工业园级和栋级相似度。
作为本申请的进一步改进,第一合并模块比较地址字符串前三级相似度,包括:A1、判断第一地址块字符串和第二地址块字符串是否均同时只包含地址关键词库中1-2级对应的地址块字符或1-3级对应的地址块字符;A2、若是,且同一级的地址块字符相同,则第一地址块字符串和第二地址块字符串可合并。
作为本申请的进一步改进,第一合并模块比较地址字符串第4-5级相似度,包括:B1、判断第一地址块字符串和第二地址块字符串是否均包含地址关键词库中4级和5级对应的地址块字符;B2、若是,且同一级的地址块字符相同,则第一地址块字符串和第二地址块字符串可合并。
作为本申请的进一步改进,第一合并模块比较工业园级和栋级相似度,包括:C1、判断第一地址块字符串和第二地址块字符串是否均包含工业园级对应的地址块字符;C2、若是,判断工业园级对应的地址块字符是否均包含相同特征字段,若包含则跳转C3,若不包含则跳转C4;C3、若第一地址块字符串和第二地址块字符串中在特征字段之前的地址块字符中至少存在一个相同的,则判断工业园级对应的地址块字符之后是否存在地址块字符,若不存在,则第一地址块字符串和第二地址块字符串可合并,若存在,则跳转C5;C4、若工业园级对应的地址块字符之前的所有地址块字符均相同,则判断工业园级对应的地址块字符之后是否存在地址块字符,若不存在,则第一地址块字符串和第二地址块字符串可合并,若存在,则跳转C5;C5、判断工业园地址块之后是否包括栋级对应地址块字符,若不包括,且工业园级对应的地址块字符至栋级对应的地址块字符之间至少存在一个相同地址块字符,则第一地址块字符串和第二地址块字符串可合并;若包括栋级地址块,且栋级地址块对应的地址块字符所含数字或字母间的差值小于预设数值,则第一地址块字符串和第二地址块字符串可合并。
相比于现有技术,本发明的地址合并方法通过按地址关键词库将两个订单地址分别进行切分,得到第一地址块字符串和第二地址块字符串,再对第一地址块字符串和第二地址块字符串进行初合并计算,当初合并计算判定两者可以合并时,则进行合并,不需要再进行后续判断处理,降低了对计算资源的占用,同时也提升了地址合并的效率,而当初合并计算判定两者不可以合并时,再根据地址相似度合并模型进行打分评估,从而确认两者是否可以合并,其利用预先设定的地址关键词库对地址进行精确切分,使得后续地址相似度计算准确率得到较大提高,在物流运输领域中,精准的地址合并使得合单准确率大幅度提升,避免同一地址的多个订单被分为多单进行提成计算,有效降低了公司的人力资源成本。
附图说明
图1为本发明地址合并方法一个实施例的流程示意图;
图2为本发明地址合并系统一个实施例的功能模块示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用来限定本发明。
图1展示了本发明地址合并方法一个实施例的流程示意图。如图1所示,该地址合并方法包括:
步骤S1:对应预先构建的地址关键词库的多级地址关键词,将获取到的两个订单地址分别逐级进行切分,得到第一地址块字符串和第二地址块字符串。
需要说明的是,订单地址来自同一个取/派网点。不同于业界常见的对地址按照三级或四级行政区划进行划分,本技术方案在预先构建地址关键词库时,将行政区划关键词划分为同一层级,如关键词“省”、“市”、“区”等划分为同一层级;然后,根据实际业务需要,将重要性相似、易混淆的关键词划分为到同一层级,如“路”和“大道”划分为同一层级,“工业园”和“产业园”划分为同一层级。
以下举例具体进行说明,通过对地址关键词进行提取和分类,可形成不同层级的地址关键词库,在本实施例中,地址关键词库优选构建为13级地址关键词库,该13级地址关键词库的关键词请参阅下表1:
表1地址层级和地址关键词
地址层级 地址关键字
1 省、市、区、县、镇
2 街道、街道办
3 社区、居委会、村
4 路、大道、巷
5 号、弄
6 广场、大厦、中心
7 工业园、物流园、产业园
8 小区、酒店、公寓
9 公司、机场、火车站
10 仓库、厂房、馆
11 栋、幢、座
12 层、楼
13 单元、号、室
需要说明的是,上述表中的每一层级中的地址关键词仅是地址关键词库中的部分关键词,不仅限于上述表中的范围。另外,依照上述原则,地址关键词库建立后,根据实际业务情况,还可以对每一层级的关键词进行增减,或者对部分层级顺序调整。
具体的,在进行地址切分时,首先,对应该地址关键词库,使用正则表达式匹配识别地址中的关键词进行地址初步切分,以逗号作为分隔标志,具体地,以一个例子进行说明,例如:对地址“广东省佛山市三水区南丰路19号西南工业区3栋2楼电梯旁边”进行初步切分,按照地址关键词库中的多级地址关键词得到如下表达形式:[“广东省”,“佛山市”,“三水区”,“南丰路”,“19号”,“西南工业区”,“3栋”,“2楼”,“电梯旁边”]。
然后,根据地址关键词库提取每个地址层级对应的地址块字符串,得到第一地址块字符串和第二地址块字符串。具体地,先将初步切分后的订单地址中的每一个地址元素与地址关键词库进行匹配,匹配成功的地址层级从地址元素中提取出除地址关键词以外的字符作为该地址层级的地址块字符,例如“广东省”,提取得到的地址块字符为“广东”,“省”为地址关键词。需要说明的是,若初步切分后的订单地址中不包括某一地址层级的地址元素,则将该地址层级的地址块字符用空列表表示,而当初步切分后的订单地址中存在13级地址关键词库之外的地址元素时,将该额外的地址元素作为第14级地址层级的地址块字符。此外,针对于存在于多个地址层级的关键词,需要进行特殊判断,例如,提取到地址关键词“区”时,需要判断“区”前面是否存在地址关键词“省”或“市”,若存在,则认为该地址关键词“区”为第1地址层级中的地址关键词,同样的,提取到地址关键词“号”时,需要判断“号”前面的是否存在与“路”同级的地址关键词。
具体地,以上述地址示例为例,对初步切分后的订单地址提取得到的地址块字符串如下:{“1”:[“广东”,“佛山”,“三水”],“2”:[],“3”:[],“4”:[“南丰”],“5”:[“19”],“6”:[],“7”:[“西南”],“8”:[],“9”:[],“10”:[],“11”:[“3”],“12”:[“2”],“13”:[],“14”:[“电梯旁边”]},其中,第2、3、6、8、9、10、13级地址关键词对应的地址块均为空列表。
进一步的,本实施例中,在对两订单地址进行切分之前,还需要进行地址预处理,以去除地址噪声信息,统一地址格式,提高后续地址合并准确率,地址预处理具体包括:
(1)对地址进行特殊符号处理,这里的特殊符号是指除中文、数字、字母以外的字符,将特殊符号去除或者统一格式;
(2)对地址进行繁简体切换,通过建立繁简体语料库,将繁体统一转换成简体中文;
(3)对地址进行英文大小写切换,统一转换成大写字母;
(4)对地址进行特殊数字字符转换,建立映射表,将特殊数字字符统一转换成阿拉伯数字;
(5)对地址进行数字大小写切换,统一转换成阿拉伯数字。
步骤S2:匹配第一地址块字符串和第二地址块字符串,进行初合并计算,判断是否可合并。若是,则所述两个订单地址合并;若初合并计算无法判断,则执行步骤S3。
在步骤S2中,为了避免不必要的计算,本实施例中,在得到第一地址块字符串和第二地址块字符串后,将两者进行匹配以进行初合并计算,从而初步确认两者是否可以合并。
需要说明的是,通过上述步骤可知,地址关键词库中1-3级依次为包含“省、市、区、县、镇”关键词的行政区划级、包含“街道”或类似关键词的街道级、包含“社区”或类似关键词的社区级;地址关键词库中4-5级依次为包含“路”或类似关键词的路级、包含“号”或类似关键词的号级;地址关键词库中在5级之后,最末1级之间存在包含“工业园”或类似关键词的工业园级,以及包含“栋”或类似关键词的栋级。因此,本实施例中,初合并计算包括先比较地址字符串前三级相似度,次比较地址字符串第4-5级相似度,最后比较地址字符串工业园级和栋级相似度。通过初合并计算,若确认两订单地址可以合并则执行两订单地址合并,若不可以合并,再进行后续合并计算,从而将根据初合并计算即可确认合并的订单地址进行合并,提高了地址合并的效率。
进一步的,由于地址块字符串中前3级地址块对应的地址范围过大,并且地址相似度合并模型中设定的地址库关键词前三级的权重值较小,因此,当地址只有前三级信息时,不适合采用地址相似度合并模型进行计算。关于地址相似度合并模型以及地址库各级关键词的权重值设定,见下文说明。
在初合并计算中,首先比较地址字符串前三级相似度的步骤,具体包括:
A1、判断第一地址块字符串和第二地址块字符串是否均同时只包含地址关键词库中1-2级对应的地址块字符或1-3级对应的地址块字符。若是,且同一级的地址块字符相同,则跳转A2。
A2、第一地址块字符串和第二地址块字符串可合并。
当第一地址块字符串和第二地址块字符串均同时只包含地址关键词库中1-2级对应的地址块字符或1-3级对应的地址块字符时,将第一地址块字符串和第二地址块字符串的同一级地址块字符依次进行比较,当二者对应的同一级地址块字符均相同,则第一地址块字符串和第二地址块字符串可合并;当第一地址块字符串和第二地址块字符串对应的同一级地址块字符中若有一个层级的地址块字符不同,则说明第一地址块字符串和第二地址块字符串不可合并。在该步骤进行初合并计算中出现此两种情况时均为最终合并计算结果,不再进行后续步骤。
需要说明的是,第一地址块字符串和第二地址块字符串可合并,即两个订单地址可合并。
进一步的,在比较地址字符串前三级相似度后,若两地址字符串中至少一条地址字符串的层级超过三级,则对两地址字符串进行“路”级和“号”级对应地址块字符的相似度比较,即比较地址字符串第4-5级相似度,根据“路”级、“号”级对应的地址块字符信息,对地址字符串进行快速、直接的合并判断。
地址字符串第4-5级相似度,具体包括:
B1、判断第一地址块字符串和第二地址块字符串是否均包含地址关键词库中4级和5级对应的地址块字符;
B2、若是,且同一级的地址块字符相同,第一地址块字符串和第二地址块字符串可合并。
进行地址字符串第4-5级相似度比较时,直接对4级和5级对应的地址块字符进行比较,无需对“路”级前面的地址字符进行比较。比较时,当第一地址块字符串和第二地址块字符串均包含地址关键词库中4级和5级对应的地址块字符,且同一级的地址块字符相同,则第一地址块字符串和第二地址块字符串可合并。4级和5级地址块字符记录了地址中的“路”和“号”,即详细地址,可直接用于判定第一地址块字符串和第二地址块字符串是否可以合并,相较于通过地址相似度合并模型进行计算,其效率更高。
进一步的,在比较地址字符串4-5级相似度后,若两地址字符串中至少一条地址字符串不存在“路”、“号”级对应的地址块信息,进一步根据“工业园”级、“栋”级对应的地址块字符信息比较判断,即比较工业园级和栋级相似度,对地址字符串进行快速、直接的合并判断。因此,在比较地址字符串第4-5级相似度后,进行比较工业园级和栋级相似度,具体包括:
C1、判断第一地址块字符串和第二地址块字符串是否均包含工业园级对应的地址块字符。若是,则跳转C2。
C2、判断工业园级对应的地址块字符是否均包含相同特征字段。若包含,则跳转C3;若不包含,则跳转C4。
需要说明的是,该相同特征字段预先设定,例如“第一”、“第二”、“第三”......等类似于“第”+“数字”的字段。
C3、若第一地址块字符串和第二地址块字符串中在特征字段之前的地址块字符中至少存在一个相同的,则判断工业园级对应的地址块字符之后是否存在地址块字符。若不存在,则第一地址块字符串和第二地址块字符串可合并;若存在,则跳转C5。
具体的,举例说明,现有两个订单地址,其中,第一订单地址为“广东省佛山市三水区广东省佛山市三水区西南街道第一工业园”,第二订单地址为“广东省佛山市三水区第一工业园”,经过按照预先构建的地址关键库的多级地址关键词进行切分后,得到第一地址块字符串和第二地址字符串,如下
第一地址字符串:{"1":["广东","佛山","三水"],"2":["西南"],"3":[],"4":[],"5":[],"6":[],"7":["第一"],"8":[],"9":[],"10":[],"11":[],"12":[],"13":[],};
第二地址字符串:{"1":["广东","佛山","三水"],"2":[],"3":[],"4":[],"5":[],"6":[],"7":["第一"],"8":[],"9":[],"10":[],"11":[],"12":[],"13":[]};
其中,第一地址块字符串和第二地址字符串中工业园级对应的地址块字符,即第7级,均包括相同的特征字段“第一”,并且特征字段“第一”之前的第1级对应的地址块字符,即“广东、佛山、三水”相同,并且工业园级对应的地址块字符之后不存在地址块字符,即判断第一地址字符串和第二地址字符串可合并。
C4、若工业园级对应的地址块字符之前的所有地址块字符均相同,则判断工业园级对应的地址块字符之后是否存在地址块字符。若不存在,则第一地址块字符串和第二地址块字符串可合并;若存在,则跳转C5。
C5、判断工业园地址块之后是否包括栋级对应地址块字符,若不包括,且工业园级对应的地址块字符至栋级对应的地址块字符之间至少存在一个相同地址块字符,则第一地址块字符串和第二地址块字符串可合并;若包括栋级地址块,且栋级地址块对应的地址块字符所含数字或字母间的差值小于预设数值,则第一地址块字符串和第二地址块字符串可合并。
具体地,根据步骤S1中的表1可知工业园为第7级地址层级,栋为第11级地址层级,当工业园地址块之后不包括栋级对应地址块字符,则需要判断第一地址块字符串和第二地址块字符串的第8、9、10级地址层级对应的地址块字符是否存在至少一个相同的地址块字符,若是,则第一地址块字符串和第二地址块字符串可合并。
例如,现有两个地址订单,其中,第一订单地址为“广东省佛山市三水区广东省佛山市三水区西南街道第一工业园华南仓库”,第二订单地址为“广东省佛山市三水区第一工业园华南仓库”,经过按照预先构建的地址关键库的多级地址关键词进行切分后,得到第一地址块字符串和第二地址字符串,如下:
第一地址字符串:{"1":["广东","佛山","三水"],"2":["西南"],"3":[],"4":[],"5":[],"6":[],"7":["第一"],"8":[],"9":[],"10":["华南"],"11":[],"12":[],"13":[],};
第二地址字符串:{"1":["广东","佛山","三水"],"2":[],"3":[],"4":[],"5":[],"6":[],"7":["第一"],"8":[],"9":[],"10":["华南"],"11":[],"12":[],"13":[]};
其中,第一地址块字符串和第二地址字符串中工业园级对应的地址块字符,即第7级,均包括相同的特征字段“第一”,并且特征字段“第一”之前的第1级对应的地址块字符,即“广东、佛山、三水”相同,另外,工业园级对应的地址块至栋级对应的地址块字符之间存在“仓库”级地址块字符,即步骤S1中表1的第10级地址关键词对应的地址块字符,并且该地址块字符相同,则第一地址块字符串和第二地址块字符串可合并。
进一步地,若包括栋级地址块,且栋级地址块对应的地址块字符所含数字或字母间的差值小于预设数值,则第一地址块字符串和第二地址块字符串可合并,其中,预设数值预先设置,例如设置为6,当第一地址块字符串和第二地址块字符串的工业园地址块之后均包括栋级对应地址块字符时,若第一地址块字符串和第二地址块字符串的栋级地址块对应的地址块字符所含数字或字母间的差值小于6,则第一地址块字符串和第二地址块字符串可合并。
例如,现有两个地址订单,其中,第一订单地址为“广东省佛山市三水区广东省佛山市三水区西南街道第一工业园2栋”,第二订单地址为“广东省佛山市三水区第一工业园5栋”,经过按照预先构建的地址关键库的多级地址关键词进行切分后,得到第一地址块字符串和第二地址字符串,如下:
第一地址字符串:{"1":["广东","佛山","三水"],"2":["西南"],"3":[],"4":[],"5":[],"6":[],"7":["第一"],"8":[],"9":[],"10":[],"11":["2"],"12":[],"13":[],};
第二地址字符串:{"1":["广东","佛山","三水"],"2":[],"3":[],"4":[],"5":[],"6":[],"7":["第一"],"8":[],"9":[],"10":[],"11":["5"],"12":[],"13":[]};
其中,第一地址块字符串和第二地址字符串中工业园级对应的地址块字符,即第7级,均包括相同的特征字段“第一”,并且特征字段“第一”之前的第1级对应的地址块字符,即“广东、佛山、三水”相同,另外,“栋”级地址块对应的地址块字符所含数字差值小于预设数值“6”,则第一地址块字符串和第二地址块字符串可合并。
经过初合并计算,将存在特殊情况的订单地址进行了快速合并计算,即只包含前三级地址信息、地址中存在路、号信息,以及工业园信息。对于无法经过初合并计算进行判断的订单地址信息,则将其切分后得到的地址字符串输入至训练好的地址相似度合并模型中进行计算,需要说明的是,此处的无法经过初合并计算具体含义为:经过初合并计算判断的两地址订单可合并结果与不可合并结果不在此判断之列。
步骤S3:将第一地址块字符串和第二地址块字符串输入至预先训练好的地址相似度合并模型中进行打分;若两地址块字符串中同一级的地址块字符可合并,则累加该级对应的权重值正值,反之,则累加该级对应的权重值负值;当所得权重值正值不小于第一预设阈值,且权重值负值不大于第二预设阈值时,则两个订单地址合并。
需要说明的是,地址相似度合并模型按照分值从小到大为地址关键词库逐级设置权重值,优选地,该地址相似度合并模型的权重值正值、权重值负值、第一预设阈值和第二预设阈值均是利用预先准备好的样本数据进行训练时,通过训练数据的规律得到的。需要理解的是,地址块字符为空的地址层级不参与计算。
进一步的,在利用地址相似度合并模型比较地址块字符时,主要分为中文字符比较和数字或者英文字符比较,对于中文字符串,由于有的地址存在漏写关键词,导致切分时切入多余地址信息,例如地址“广东深圳市南山区”,其漏写了“省”关键词,切分得到的“市”级地址块为“广东深圳”,其中的“广东”针对于“市”级地址块即为多余的地址信息,本实施例中采用字符串尾部匹配以确认是否相同,具体是通过判断中文字符串是否以指定后缀结尾,例如“湖南长沙”和“长沙”都是“市”级地址块,两者均是以“长沙”作为后缀结尾,因此,可以判定两者相同。对于数字或英文字符,则可进行全匹配比较。
具体地,以一个例子说明地址相似度合并模型打分的过程,假设:
第一订单地址:[“广东省东莞市莞城街道广东省东莞市莞城街道莞城区东城南路东升大厦706”];
第二订单地址:[“广东省东莞市东城街道东莞市东城区东城南路方中东升大厦4楼”];
经过按照预先构建的地址关键库的多级地址关键词进行切分后,得到第一地址块字符串和第二地址字符串,如下::
第一地址块字符串:{"1":["广东","东莞"],"2":["莞城"],"3":[],"4":["东城南"],"5":[],"6":["东升"],"7":[],"8":[],"9":[],"10":[],"11":[],"12":[],"13":[],"14":["706"]};
第二地址块字符串:{"1":["广东","东莞"],"2":["东城"],"3":[],"4":["东城南"],"5":[],"6":["方中东升"],"7":[],"8":[],"9":[],"10":[],"11":[],"12":["4"],"13":[],"14":["东城区"]}。
在使用地址相似度合并模型进行打分时,两地址块字符串的第1、4、6级地址关键词对应的地址块字符相同,累加第1、4、6级地址关键词对应的权重值正值:0+0.5+2=2.5(其中,第1、4、6级地址层级对应的权重值正值0、0.5、2预先训练得到),第2、14级地址关键词对应的地址块字符不相同,累加第2、14级地址关键词对应的权重值负值:0.5+0=0.5(第2、14级地址层级对应的权重值正值0.5、0预先训练得到);进行阈值判断,权重值正值为2.5,大于第一预设阈值2(第一预设阈值2预先训练得到),权重值负值为0.5,小于第二预设阈值1(第二预设阈值1预先训练得到),则第一地址字符串和第二地址字符串可以合并。
地址相似度模型通过预先训练得到,训练过程为,
(1)将样本订单地址对应地址关键词库的多级地址关键词,将获取到的两个订单地址分别逐级进行切分,得到样本地址字符串数据;
(2)将样本地址字符串数据和人工校验的合单标记输入到地址相似度合并模型中进行训练,并设置各级地址关键词的权重值参数、地址字符串合并阈值参数,以及损失函数;
(3)计算损失函数,不断降低损失函数值直至权重值参数、地址字符串合并阈值参数达到最优,训练完成。
本实施例的地址合并方法通过按地址关键词库将两个订单地址分别进行切分,得到第一地址块字符串和第二地址块字符串,再对第一地址块字符串和第二地址块字符串进行初合并计算,当初合并计算判定两者可以合并时,则进行合并,不需要再进行后续判断处理,降低了对计算资源的占用,同时也提升了地址合并的效率,而当初合并计算判定两者不可以合并时,再根据地址相似度合并模型进行打分评估,从而确认两者是否可以合并,其利用预先设定的地址关键词库对地址进行精确切分,使得后续地址相似度计算准确率得到较大提高,在物流运输领域中,精准的地址合并使得合单准确率大幅度提升,避免同一地址的多个订单被分为多单进行提成计算,有效降低了公司的人力资源成本。
图2展示为了本发明地址合并系统一个实施例的功能模块示意图。如图2所示,该地址合并系统包括:切分模块11、第一合并模块12、打分模块13和第二合并模块14。
其中,切分模块11,用于对应预先构建的地址关键词库的多级地址关键词,将获取到的两个订单地址分别逐级进行切分,得到第一地址块字符串和第二地址块字符串;订单地址来自同一个取/派网点;第一合并模块12,用于匹配第一地址块字符串和第二地址块字符串,进行初合并计算,判断是否可合并,若是,则两个订单地址合并;打分模块13,用于当第一合并模块12执行初合并计算无法判断时,将第一地址块字符串和第二地址块字符串输入至预先训练好的地址相似度合并模型中进行打分;第二合并模块14,用于若两地址块字符串中同一级的地址块字符可合并,则累加该级对应的权重值正值,反之,则累加该级对应的权重值负值;当所得权重值正值不小于第一预设阈值,且权重值负值不大于第二预设阈值时,则两个订单地址合并;地址相似度合并模型按照分值从小到大为地址关键词库逐级设置权重值。
优选地,地址关键词库中1-3级依次为包含“省、市、区、县、镇”关键词的行政区划级、包含“街道”或类似关键词的街道级、包含“社区”或类似关键词的社区级;地址关键词库中4-5级依次为包含“路”或类似关键词的路级、包含“号”或类似关键词的号级;地址关键词库中在5级之后,最末1级之间存在包含“工业园”或类似关键词的工业园级,以及包含“栋”或类似关键词的栋级;第一合并模块12进行初合并计算包括:先比较地址字符串前三级相似度,次比较地址字符串第4-5级相似度,最后比较地址字符串工业园级和栋级相似度。
优选地,第一合并模块12比较地址字符串前三级相似度,包括:A1、判断第一地址块字符串和第二地址块字符串是否均同时只包含地址关键词库中1-2级对应的地址块字符或1-3级对应的地址块字符;A2、若是,且同一级的地址块字符相同,则第一地址块字符串和第二地址块字符串可合并。
优选地,第一合并模块12比较地址字符串第4-5级相似度,包括:B1、判断第一地址块字符串和第二地址块字符串是否均包含地址关键词库中4级和5级对应的地址块字符;B2、若是,且同一级的地址块字符相同,则第一地址块字符串和第二地址块字符串可合并。
优选地,第一合并模块比较工业园级和栋级相似度,包括:C1、判断第一地址块字符串和第二地址块字符串是否均包含工业园级对应的地址块字符;C2、若是,判断工业园级对应的地址块字符是否均包含相同特征字段,若包含则跳转C3,若不包含则跳转C4;C3、若第一地址块字符串和第二地址块字符串中在特征字段之前的地址块字符中至少存在一个相同的,则判断工业园级对应的地址块字符之后是否存在地址块字符,若不存在,则第一地址块字符串和第二地址块字符串可合并,若存在,则跳转C5;C4、若工业园级对应的地址块字符之前的所有地址块字符均相同,则判断工业园级对应的地址块字符之后是否存在地址块字符,若不存在,则第一地址块字符串和第二地址块字符串可合并,若存在,则跳转C5;C5、判断工业园地址块之后是否包括栋级对应地址块字符,若不包括,且工业园级对应的地址块字符至栋级对应的地址块字符之间至少存在一个相同地址块字符,则第一地址块字符串和第二地址块字符串可合并;若包括栋级地址块,且栋级地址块对应的地址块字符所含数字或字母间的差值小于预设数值,则第一地址块字符串和第二地址块字符串可合并。
关于上述实施例地址合并系统中各模块实现技术方案的其他细节,可参见上述实施例中的地址合并方法中的描述,此处不再赘述。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于系统类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上对发明的具体实施方式进行了详细说明,但其只作为范例,本发明并不限制于以上描述的具体实施方式。对于本领域的技术人员而言,任何对该发明进行的等同修改或替代也都在本发明的范畴之中,因此,在不脱离本发明的精神和原则范围下所作的均等变换和修改、改进等,都应涵盖在本发明的范围内。

Claims (10)

1.一种地址合并方法,其特征在于,包括:
S1、对应预先构建的地址关键词库的多级地址关键词,将获取到的两个订单地址分别逐级进行切分,得到第一地址块字符串和第二地址块字符串;所述订单地址来自同一个取/派网点;
S2、匹配第一地址块字符串和第二地址块字符串,进行初合并计算,判断是否可合并,若是,则所述两个订单地址合并,若否,则所述两个订单地址不合并;若初合并计算无法判断,则执行步骤S3;
S3、将第一地址块字符串和第二地址块字符串输入至预先训练好的地址相似度合并模型中进行打分;
若两地址块字符串中同一级的地址块字符可合并,则累加该级对应的权重值正值,反之,则累加该级对应的权重值负值;当所得权重值正值不小于第一预设阈值,且权重值负值不大于第二预设阈值时,则所述两个订单地址合并;
利用地址相似度合并模型比较地址块字符时,对于中文字符串采用字符串尾部匹配;对于数字或英文字符进行全匹配比较;
所述地址相似度合并模型按照分值从小到大为地址关键词库逐级设置权重值。
2.根据权利要求1所述的地址合并方法,其特征在于,
所述地址关键词库中1-3级依次为包含“省、市、区、县、镇”关键词的行政区划级、包含“街道”或类似关键词的街道级、包含“社区”或类似关键词的社区级;
所述地址关键词库中4-5级依次为包含“路”或类似关键词的路级、包含“号”或类似关键词的号级;
所述地址关键词库中在5级之后,最末1级之间存在包含“工业园”或类似关键词的工业园级,以及包含“栋”或类似关键词的栋级;
所述初合并计算包括先比较地址字符串前三级相似度,次比较地址字符串第4-5级相似度,最后比较地址字符串工业园级和栋级相似度。
3.根据权利要求2所述的地址合并方法,其特征在于,所述比较地址字符串前三级相似度,包括:
A1、判断第一地址块字符串和第二地址块字符串是否均同时只包含地址关键词库中1-2级对应的地址块字符或1-3级对应的地址块字符;
A2、若是,且同一级的地址块字符相同,则第一地址块字符串和第二地址块字符串可合并。
4.根据权利要求3所述的地址合并方法,其特征在于,所述比较地址字符串第4-5级相似度,包括:
B1、判断第一地址块字符串和第二地址块字符串是否均包含地址关键词库中4级和5级对应的地址块字符;
B2、若是,且同一级的地址块字符相同,则第一地址块字符串和第二地址块字符串可合并。
5.根据权利要求4所述的地址合并方法,其特征在于,所述比较工业园级和栋级相似度,包括:
C1、判断第一地址块字符串和第二地址块字符串是否均包含工业园级对应的地址块字符;
C2、若是,判断所述工业园级对应的地址块字符是否均包含相同特征字段,若包含则跳转C3,若不包含则跳转C4;
C3、若第一地址块字符串和第二地址块字符串中在所述特征字段之前的地址块字符中至少存在一个相同的,则判断所述工业园级对应的地址块字符之后是否存在地址块字符,若不存在,则第一地址块字符串和第二地址块字符串可合并,若存在,则跳转C5;
C4、若所述工业园级对应的地址块字符之前的所有地址块字符均相同,则判断所述工业园级对应的地址块字符之后是否存在地址块字符,若不存在,则第一地址块字符串和第二地址块字符串可合并,若存在,则跳转C5;
C5、判断所述工业园地址块之后是否包括所述栋级对应地址块字符,若不包括,且所述工业园级对应的地址块字符至栋级对应的地址块字符之间至少存在一个相同地址块字符,则第一地址块字符串和第二地址块字符串可合并;若包括栋级地址块,且栋级地址块对应的地址块字符所含数字或字母间的差值小于预设数值,则第一地址块字符串和第二地址块字符串可合并。
6.一种地址合并系统,其特征在于,包括:
切分模块,用于对应预先构建的地址关键词库的多级地址关键词,将获取到的两个订单地址分别逐级进行切分,得到第一地址块字符串和第二地址块字符串;所述订单地址来自同一个取/派网点;
第一合并模块,用于匹配第一地址块字符串和第二地址块字符串,进行初合并计算,判断是否可合并,若是,则所述两个订单地址合并,若否,则所述两个订单地址不合并;
打分模块,用于当第一合并模块执行初合并计算无法判断时,将第一地址块字符串和第二地址块字符串输入至预先训练好的地址相似度合并模型中进行打分;
第二合并模块,用于若两地址块字符串中同一级的地址块字符可合并,则累加该级对应的权重值正值,反之,则累加该级对应的权重值负值;当所得权重值正值不小于第一预设阈值,且权重值负值不大于第二预设阈值时,则所述两个订单地址合并;
利用地址相似度合并模型比较地址块字符时,对于中文字符串采用字符串尾部匹配;对于数字或英文字符进行全匹配比较;
所述地址相似度合并模型按照分值从小到大为地址关键词库逐级设置权重值。
7.根据权利要求6所述的地址合并系统,其特征在于,
所述地址关键词库中1-3级依次为包含“省、市、区、县、镇”关键词的行政区划级、包含“街道”或类似关键词的街道级、包含“社区”或类似关键词的社区级;
所述地址关键词库中4-5级依次为包含“路”或类似关键词的路级、包含“号”或类似关键词的号级;
所述地址关键词库中在5级之后,最末1级之间存在包含“工业园”或类似关键词的工业园级,以及包含“栋”或类似关键词的栋级;
所述第一合并模块进行初合并计算包括:先比较地址字符串前三级相似度,次比较地址字符串第4-5级相似度,最后比较地址字符串工业园级和栋级相似度。
8.根据权利要求7所述的地址合并系统,其特征在于,所述第一合并模块比较地址字符串前三级相似度,包括:
A1、判断第一地址块字符串和第二地址块字符串是否均同时只包含地址关键词库中1-2级对应的地址块字符或1-3级对应的地址块字符;
A2、若是,且同一级的地址块字符相同,则第一地址块字符串和第二地址块字符串可合并。
9.根据权利要求8所述的地址合并系统,其特征在于,所述第一合并模块比较地址字符串第4-5级相似度,包括:
B1、判断第一地址块字符串和第二地址块字符串是否均包含地址关键词库中4级和5级对应的地址块字符;
B2、若是,且同一级的地址块字符相同,则第一地址块字符串和第二地址块字符串可合并。
10.根据权利要求9所述的地址合并系统,其特征在于,所述第一合并模块比较工业园级和栋级相似度,包括:
C1、判断第一地址块字符串和第二地址块字符串是否均包含工业园级对应的地址块字符;
C2、若是,判断所述工业园级对应的地址块字符是否均包含相同特征字段,若包含则跳转C3,若不包含则跳转C4;
C3、若第一地址块字符串和第二地址块字符串中在所述特征字段之前的地址块字符中至少存在一个相同的,则判断所述工业园级对应的地址块字符之后是否存在地址块字符,若不存在,则第一地址块字符串和第二地址块字符串可合并,若存在,则跳转C5;
C4、若所述工业园级对应的地址块字符之前的所有地址块字符均相同,则判断所述工业园级对应的地址块字符之后是否存在地址块字符,若不存在,则第一地址块字符串和第二地址块字符串可合并,若存在,则跳转C5;
C5、判断所述工业园地址块之后是否包括所述栋级对应地址块字符,若不包括,且所述工业园级对应的地址块字符至栋级对应的地址块字符之间至少存在一个相同地址块字符,则第一地址块字符串和第二地址块字符串可合并;若包括栋级地址块,且栋级地址块对应的地址块字符所含数字或字母间的差值小于预设数值,则第一地址块字符串和第二地址块字符串可合并。
CN202010756947.0A 2020-07-31 2020-07-31 一种地址合并方法及系统 Active CN112070429B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010756947.0A CN112070429B (zh) 2020-07-31 2020-07-31 一种地址合并方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010756947.0A CN112070429B (zh) 2020-07-31 2020-07-31 一种地址合并方法及系统

Publications (2)

Publication Number Publication Date
CN112070429A CN112070429A (zh) 2020-12-11
CN112070429B true CN112070429B (zh) 2024-03-15

Family

ID=73657323

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010756947.0A Active CN112070429B (zh) 2020-07-31 2020-07-31 一种地址合并方法及系统

Country Status (1)

Country Link
CN (1) CN112070429B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112978031A (zh) * 2021-04-25 2021-06-18 湖南工学院 一种基于智能系统的多功能外卖盒

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106407221A (zh) * 2015-07-31 2017-02-15 阿里巴巴集团控股有限公司 地址数据检索方法及装置
CN108804398A (zh) * 2017-05-03 2018-11-13 阿里巴巴集团控股有限公司 地址文本的相似度计算方法及装置
CN110427365A (zh) * 2019-06-25 2019-11-08 深圳市跨越新科技有限公司 提高合单准确性的地址合并方法及系统
CN111274811A (zh) * 2018-11-19 2020-06-12 阿里巴巴集团控股有限公司 地址文本相似度确定方法以及地址搜索方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106407221A (zh) * 2015-07-31 2017-02-15 阿里巴巴集团控股有限公司 地址数据检索方法及装置
CN108804398A (zh) * 2017-05-03 2018-11-13 阿里巴巴集团控股有限公司 地址文本的相似度计算方法及装置
CN111274811A (zh) * 2018-11-19 2020-06-12 阿里巴巴集团控股有限公司 地址文本相似度确定方法以及地址搜索方法
CN110427365A (zh) * 2019-06-25 2019-11-08 深圳市跨越新科技有限公司 提高合单准确性的地址合并方法及系统

Also Published As

Publication number Publication date
CN112070429A (zh) 2020-12-11

Similar Documents

Publication Publication Date Title
CN107145577A (zh) 地址标准化方法、装置、存储介质及计算机
CN112765358A (zh) 一种基于噪声标签学习的纳税人行业分类方法
CN108628811B (zh) 地址文本的匹配方法和装置
CN109325116B (zh) 一种基于深度学习的城市事件自动分类派发方法及装置
CN105243128B (zh) 一种基于签到数据的用户行为轨迹聚类方法
WO2021232585A1 (zh) 基于人工智能的定位数据处理方法及相关设备
CN111625732B (zh) 地址匹配方法及装置
CN109344263B (zh) 一种地址匹配方法
CN111524353B (zh) 一种交通文本数据用于速度预测及行程规划方法
CN106874384B (zh) 一种异构地址标准转换及匹配方法
CN114446051A (zh) 一种城市路网交通韧性薄弱识别方法
CN112070429B (zh) 一种地址合并方法及系统
CN112765300A (zh) 基于ArcGIS空间数据的水利对象关系图谱构建方法
CN115630648A (zh) 面向人机对话的地址要素解析方法、系统与计算机可读介质
CN114936627A (zh) 一种改进的分节推断地址匹配方法
CN116414823A (zh) 一种基于分词模型的地址定位方法和装置
CN113240265B (zh) 一种基于多模式交通数据的城市空间划分方法
CN109522335B (zh) 一种信息获取方法、装置及计算机可读存储介质
CN114612666A (zh) 一种基于多模态对比学习的rgb-d语义分割方法
CN116414824A (zh) 行政区划信息识别和标准化处理的方法、装置及存储介质
CN116561327B (zh) 基于聚类算法的政务数据管理方法
CN110609936A (zh) 一种模糊地址数据智能分类的方法
CN115565376B (zh) 融合graph2vec、双层LSTM的车辆行程时间预测方法及系统
CN107918675A (zh) 一种搜索方法及搜索系统
CN116414808A (zh) 详细地址规范化的方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 518000 floor 4, building a, Lufthansa aviation Park, hourui community, Hangcheng street, Bao'an District, Shenzhen City, Guangdong Province

Applicant after: Shenzhen Leap New Technology Co.,Ltd.

Address before: 518000 Room 201, building A, No. 1, Qian Wan Road, Qianhai Shenzhen Hong Kong cooperation zone, Shenzhen, Guangdong (Shenzhen Qianhai business secretary Co., Ltd.)

Applicant before: Shenzhen Leap New Technology Co.,Ltd.

GR01 Patent grant
GR01 Patent grant