CN116303854A - 一种基于地址知识图谱的定位方法及装置 - Google Patents

一种基于地址知识图谱的定位方法及装置 Download PDF

Info

Publication number
CN116303854A
CN116303854A CN202310188127.XA CN202310188127A CN116303854A CN 116303854 A CN116303854 A CN 116303854A CN 202310188127 A CN202310188127 A CN 202310188127A CN 116303854 A CN116303854 A CN 116303854A
Authority
CN
China
Prior art keywords
address
target
elements
knowledge graph
matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310188127.XA
Other languages
English (en)
Inventor
杨康
刘泉
陶闯
裘靖宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Weizhi Zhuoxin Information Technology Co ltd
Original Assignee
Shanghai Weizhi Zhuoxin Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Weizhi Zhuoxin Information Technology Co ltd filed Critical Shanghai Weizhi Zhuoxin Information Technology Co ltd
Priority to CN202310188127.XA priority Critical patent/CN116303854A/zh
Publication of CN116303854A publication Critical patent/CN116303854A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Remote Sensing (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种基于地址知识图谱的定位方法及装置,该方法包括:获取目标地址文本和地址知识图谱,所述地址知识图谱是根据多个地址元素分别对应的地址属性信息和多个所述地址元素之间的层级关系建立的,所述地址属性信息包括位置信息和地址实体;提取所述目标地址文本中的至少两个目标地址实体;根据至少两个所述目标地址实体和所述地址知识图谱,确定所述目标地址文本对应的目标位置信息。可见,实施本发明能够使得地址定位的准确度得以进一步提高。

Description

一种基于地址知识图谱的定位方法及装置
技术领域
本发明涉及地址定位技术领域,尤其涉及一种基于地址知识图谱的定位方法及装置。
背景技术
地址定位服务是指根据用户输入的地址文本,返回该地址文本对应的位置信息,例如范围该地址文本的经纬度信息。地址定位服务在物流运输、订单派送、火警救援、位置查询等方面有着广泛的应用。
现有地址定位服务采用自然语言处理的技术,通过深度学习方法,建模输入文本的语义信息,将输入文本信息与地址库中地址文本进行文本匹配,查找出地址库中与之匹配的点位经纬度信息作为输出。
然而,经实践发现,地址定位偶尔会出现错误的情况。因此,地址定位的准确性有待进一步提高。
发明内容
本发明所要解决的技术问题在于,地址定位偶尔会出现错误。因此,本发明提供一种基于地址知识图谱的定位方法及装置,能够提高地址定位的准确性。
为了解决上述技术问题,本发明第一方面公开了一种基于地址知识图谱的定位方法,所述方法包括:
获取目标地址文本和地址知识图谱,所述地址知识图谱是根据多个地址元素分别对应的地址属性信息和多个所述地址元素之间的层级关系建立的,所述地址属性信息包括位置信息和地址实体;
提取所述目标地址文本中的至少两个目标地址实体;
根据至少两个所述目标地址实体和所述地址知识图谱,确定所述目标地址文本对应的目标位置信息。
作为一种可选的实施方式,在本发明第一方面中,所述地址知识图谱用于指示地址元素之间的连接关系以及各地址元素对应的地址属性信息,连接的两个地址元素之间具有N级层级关系,N为1以上的自然数;
所述根据至少两个所述目标地址实体和所述地址知识图谱,确定所述目标地址文本对应的目标位置信息,包括:
根据所述地址属性信息从所述地址知识图谱中查找各所述目标地址实体相匹配的匹配地址元素;
从匹配地址元素中筛选出具有连接关系的匹配地址元素;
确定具备连接关系的匹配地址元素中的最后一级匹配地址元素;
将所述最后一级匹配地址元素对应的位置信息作为所述目标位置信息。
作为一种可选的实施方式,在本发明第一方面中,所述地址属性信息包括至少两个所述地址实体;
所述从所述地址知识图谱中查找各所述目标地址实体相匹配的匹配地址元素,包括:
将对应的至少两个地址实体中的其中一个地址实体与所述目标地址实体一致的地址元素,作为所述匹配地址元素。
作为一种可选的实施方式,在本发明第一方面中,所述提取所述目标地址文本中的至少两个目标地址实体,包括:
通过定位应用程序的API接口提取所述目标地址文本中的至少两个目标地址实体;和/或,
通过预先训练完成的实体提取模型提取所述目标地址文本中的至少两个目标地址实体,所述实体提取模型是通过地址文本与地址文本对应的地址元素标签训练得到的。
作为一种可选的实施方式,在本发明第一方面中,所述地址知识图谱的建立方式,包括:
获取地址文本数据;
从所述地址文本数据中提取多个地址元素以及多个地址元素分别对应的地址属性信息;
接收输入的多个所述地址元素之间的层级关系;
将所述地址元素、多个所述所述地址实体分别对应的地址属性信息和多个所述地址元素之间的层级关系通过多元组的形式,构建多元组信息;
将所述多元组信息录入至知识图谱数据库中,得到所述地址知识图谱。
作为一种可选的实施方式,在本发明第一方面中,所述地址文本数据的来源为至少两个;
在所述从所述地址文本数据中提取多个地址元素以及多个地址元素分别对应的地址属性信息之前,所述方法还包括:
对所述地址文本数据进行清洗处理,得到清洗处理后的所述地址文本数据,所述清洗处理包括繁简转换处理、英文字母的大小写转换处理、标点符号去除处理和数据去重处理中的至少一种;
所述从所述地址文本数据中提取多个地址元素以及多个地址元素分别对应的地址属性信息,包括:
从清洗处理后的所述地址文本数据中提取多个地址元素以及多个地址元素分别对应的地址属性信息。
作为一种可选的实施方式,在本发明第一方面中,所述根据至少两个所述目标地址实体和所述地址知识图谱,确定所述目标地址文本对应的目标位置信息,包括:
根据至少两个所述目标地址实体构建SQL语句;
基于所述SQL语句从所述知识图谱数据库查找各所述目标地址实体相匹配的匹配地址元素;
从匹配地址元素中筛选出具有连接关系的匹配地址元素;
确定具备连接关系的匹配地址元素中的最后一级匹配地址元素;
将所述最后一级匹配地址元素对应的位置信息作为所述目标位置信息。
本发明第二方面公开了一种基于地址知识图谱的定位装置,所述装置包括:
获取模块,用于获取目标地址文本和地址知识图谱,所述地址知识图谱是根据多个地址元素分别对应的位置信息和多个所述地址元素之间的父子级关系建立的;
提取模块,用于提取所述目标地址文本中的目标地址实体;
定位模块,用于根据所述目标地址实体和所述地址知识图谱,确定所述目标地址文本对应的目标位置信息。
作为一种可选的实施方式,在本发明第二方面中,所述地址知识图谱用于指示地址元素之间的连接关系以及各地址元素对应的地址属性信息,连接的两个地址元素之间具有N级层级关系,N为1以上的自然数;定位模块用于根据所述地址属性信息从所述地址知识图谱中查找各所述目标地址实体相匹配的匹配地址元素;从匹配地址元素中筛选出具有连接关系的匹配地址元素;确定具备连接关系的匹配地址元素中的最后一级匹配地址元素;将所述最后一级匹配地址元素对应的位置信息作为所述目标位置信息。
作为一种可选的实施方式,在本发明第二方面中,地址属性信息包括至少两个所述地址实体;定位模块用于将对应的至少两个地址实体中的其中一个地址实体与所述目标地址实体一致的地址元素,作为所述匹配地址元素。
作为一种可选的实施方式,在本发明第二方面中,提取模块用于通过定位应用程序的API接口提取所述目标地址文本中的至少两个目标地址实体;和/或,
通过预先训练完成的实体提取模型提取所述目标地址文本中的至少两个目标地址实体,所述实体提取模型是通过地址文本与地址文本对应的地址元素标签训练得到的。
作为一种可选的实施方式,在本发明第二方面中,该装置还包括:
构建模块,用于获取地址文本数据;从所述地址文本数据中提取多个地址元素以及多个地址元素分别对应的地址属性信息;接收输入的多个所述地址元素之间的层级关系;将所述地址元素、多个所述所述地址实体分别对应的地址属性信息和多个所述地址元素之间的层级关系通过多元组的形式,构建多元组信息;将所述多元组信息录入至知识图谱数据库中,得到所述地址知识图谱。
作为一种可选的实施方式,在本发明第二方面中,所述地址文本数据的来源为至少两个;
该装置还包括:
清洗处理模块,用于对所述地址文本数据进行清洗处理,得到清洗处理后的所述地址文本数据,所述清洗处理包括繁简转换处理、英文字母的大小写转换处理、标点符号去除处理和数据去重处理中的至少一种;
该构建模块用于从清洗处理后的所述地址文本数据中提取多个地址元素以及多个地址元素分别对应的地址属性信息。
作为一种可选的实施方式,在本发明第二方面中,定位模块用于根据至少两个所述目标地址实体构建SQL语句;基于所述SQL语句从所述知识图谱数据库查找各所述目标地址实体相匹配的匹配地址元素;从匹配地址元素中筛选出具有连接关系的匹配地址元素;确定具备连接关系的匹配地址元素中的最后一级匹配地址元素;将所述最后一级匹配地址元素对应的位置信息作为所述目标位置信息。
本发明第三方面公开了另一种基于地址知识图谱的定位装置,所述装置包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行本发明第一方面公开的基于地址知识图谱的定位方法。
本发明第四方面公开了一种计算机可存储介质,所述计算机存储介质存储有计算机指令,所述计算机指令被调用时,用于执行本发明第一方面公开的基于地址知识图谱的定位方法。
与现有技术相比,本发明实施例具有以下有益效果:
本发明实施例中,通过获取目标地址文本和地址知识图谱,所述地址知识图谱是根据多个地址元素分别对应的地址属性信息和多个所述地址元素之间的层级关系建立的,所述地址属性信息包括位置信息和地址实体;提取所述目标地址文本中的至少两个目标地址实体;根据至少两个所述目标地址实体和所述地址知识图谱,确定所述目标地址文本对应的目标位置信息,由于地址知识图谱是根据多个地址元素分别对应的地址属性信息和多个所述地址元素之间的层级关系建立的,因此根据至少两个所述目标地址实体和所述地址知识图谱,确定所述目标地址文本对应的目标位置信息,相当于利用了多个所述地址元素之间的层级关系来进行地址定位,也就是说,本实施例有效利用地址层级或者地址实体关联先验信息,解决了现有技术未能有效利用地址层级或者地址实体关联先验信息,使得地址定位到错误的经纬度,能够使得地址定位的准确度得以进一步提高。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种基于地址知识图谱的定位方法的流程示意图;
图2是本发明实施例公开的一种地址指示图谱的结构示意图;
图3是本发明实施例公开的一种基于地址知识图谱的定位装置的结构示意图;
图4是本发明实施例公开的又一种基于地址知识图谱的定位装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或端没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或端固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本发明公开了一种基于地址知识图谱的定位方法及装置,能够提高地址定位的准确性。以下分别进行详细说明。
需要说明的是,本实施例的基于地址知识图谱的定位方法及装置可以但不限于应用于物流运输、订单派送、火警救援和位置查询等方面中。
实施例一
请参阅图1,图1是本发明实施例公开的一种基于地址知识图谱的定位方法的流程示意图。其中,图1所描述的基于地址知识图谱的定位方法可以应用于基于地址知识图谱的定位装置中。本实施例的基于地址知识图谱的定位装置可以是终端、服务器或具备数据处理能力的处理器等。可选的,终端包括但不限于手机和计算机设备等。服务器可以是单个服务器或者是服务器集群等。处理器可以是芯片等,本发明实施例不做限定。如图1所示,该基于地址知识图谱的定位方法可以包括:
110、获取目标地址文本和地址知识图谱,所述地址知识图谱是根据多个地址元素分别对应的地址属性信息和多个所述地址元素之间的层级关系建立的,所述地址属性信息包括位置信息和地址实体。
其中,目标地址文本指的是待查询定位的地址文本。在本实施例中,目标地址文本可以是用户直接输入的,也可以是根据用户输入的语音解析得到的,在此不做限定。其中,地址知识图谱是一种基于图的数据结构,由节点(Point)和边(Edge)组成。其中节点即实体,由一个全局唯一的ID标示,关系(也称属性))用于连接两个节点。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。在本实施例中,地址知识图谱指的是一种用于确定位置信息的一种基于图的数据结构。其中,地址元素可以用于指示地址的身份,例如指示地址的行政身份等。可选的,行政身份包括但不限于国家、省份、城市、区、街道、县、镇、村和具体地点等等,在此不做限定。其中,地址实体指的是具体的地址名称。示例性的,地址实体包括但不限于上海市、浦东新区、涨江镇和炬创芯研发大厦等,在此不做限定。其中,位置信息指的是表征地址元素的位置的信息。可选的,位置信息可以是经纬度信息,在此不做限定。
120、提取所述目标地址文本中的至少两个目标地址实体。
在本实施例中,示例性的,若目标地址文本为浦东新区炬创芯研发大厦,则至少两个目标地址实体包括浦东新区和创芯研发大厦。
130、根据至少两个所述目标地址实体和所述地址知识图谱,确定所述目标地址文本对应的目标位置信息。
具体的,在现有技术中,现有地址定位服务采用自然语言处理的技术,通过深度学习方法,建模输入文本的语义信息,将输入文本信息与地址库中地址文本进行文本匹配。然而,现有地址定位服务功能一般采用直接将文本序列式输入的方法,并没有将地址文本中的地址元素(例如省、市、区、街镇、小区、道路、门牌号等)进行层级划分或者关联建模,从而导致在地址要素解析和地址文本匹配时未能有效利用地址层级或者地址实体关联先验信息,使得地址定位到错误的经纬度。
本实施例的技术方案,通过获取目标地址文本和地址知识图谱,所述地址知识图谱是根据多个地址元素分别对应的地址属性信息和多个所述地址元素之间的层级关系建立的,所述地址属性信息包括位置信息和地址实体;提取所述目标地址文本中的至少两个目标地址实体;根据至少两个所述目标地址实体和所述地址知识图谱,确定所述目标地址文本对应的目标位置信息,由于地址知识图谱是根据多个地址元素分别对应的地址属性信息和多个所述地址元素之间的层级关系建立的,因此根据至少两个所述目标地址实体和所述地址知识图谱,确定所述目标地址文本对应的目标位置信息,相当于利用了多个所述地址元素之间的层级关系来进行地址定位,也就是说,本实施例有效利用地址层级或者地址实体关联先验信息,能够使得地址定位的准确度得以进一步提高。
在一种可能的实现中,所述地址知识图谱用于指示地址元素之间的连接关系以及各地址元素对应的地址属性信息,连接的两个地址元素之间具有N级层级关系,N为1以上的自然数。
在本实施例中,地址元素之间的连接关系是根据地址元素对应的地址实体确定的。示例性的,假设地址元素包括省份、城市、区、街道和具体地点等,则省份与城市之间具有1级层级关系,省份与区之间具有2级层级关系,城市与区之间具有1级层级关系,城市与具体地点之间具有3级层级关系。又示例性的,上海市和广州市是城市,浦东新区和番禺区是区,涨江镇和南村镇是镇,炬创芯研发大厦和粤海广场写字楼是具体地点,则对应上海市的地址元素与对应浦东新区的地址元素之间具有连接关系,对应上海市的地址元素与对应涨江镇的地址元素之间具有连接关系,对应上海市的地址元素与对应炬创芯研发大厦的地址元素之间具有连接关系,对应浦东新区的地址元素于对应涨江镇的地址元素之间具有连接关系,对应浦东新区的地址元素与对应炬创芯研发大厦的地址元素之间具有连接关系,对应涨江镇的地址元素与对应炬创芯研发大厦的地址元素之间具有连接关系。
同理,对应广州市的地址元素与对应番禺区的地址元素之间具有连接关系,对应广州市的地址元素与对应南村镇的地址元素之间具有连接关系,对应广州市的地址元素与对应粤海广场写字楼的地址元素之间具有连接关系,对应番禺区的地址元素于对应南村镇的地址元素之间具有连接关系,对应番禺区的地址元素与对应粤海广场写字楼的地址元素之间具有连接关系,对应南村镇的地址元素与对应粤海广场写字楼的地址元素之间具有连接关系。
请参阅图2,图2是本发明实施例公开的一种地址指示图谱的结构示意图。如图2所示,地址知识图谱中,连接的两个地址元素之间具有N级层级关系。
可以理解的是,本实施例的地址知识图谱用于指示地址元素之间的连接关系以及各地址元素对应的地址属性信息,连接的两个地址元素之间具有N级层级关系,因此,不管输入的目标地址文本是何种形式,都能够准确地确定出目标位置信息,可以提高定位的兼容性。
示例性的,不管是输入上海市浦东新区涨江镇炬创芯研发大厦,还是输入浦东新区创芯研发大厦,由于地址知识图谱用于指示地址元素之间的连接关系以及各地址元素对应的地址属性信息,连接的两个地址元素之间具有N级层级关系,因此都能准确地定位到炬创芯研发大厦。
在一种可能的实现中,根据至少两个所述目标地址实体和所述地址知识图谱,确定所述目标地址文本对应的目标位置信息,包括:
根据所述地址属性信息从所述地址知识图谱中查找各所述目标地址实体相匹配的匹配地址元素;
从匹配地址元素中筛选出具有连接关系的匹配地址元素;
确定具备连接关系的匹配地址元素中的最后一级匹配地址元素;
将所述最后一级匹配地址元素对应的位置信息作为所述目标位置信息。
在本实施例中,由于地址属性信息包括地址实体,可以根据地址属性信息中的地址实体从地址知识图谱中查找各目标地址实体相匹配的匹配地址元素。示例性的,若目标地址实体为上海市,则将对应的地址实体为上海市的地址元素,作为该目标地址实体相匹配的匹配地址元素。在本实施例中,由于不同的地址元素可能有相同的地址元素,因此,需要从匹配地址元素中筛选出具有连接关系的匹配地址元素。示例性的,朝阳即是辽宁省下属的地级市,也是北京和长春的同名市辖区,因此,当目标地址文本为朝阳时,可能会匹配到多个匹配地址元素,但是如果另一个目标地址文本为北京,则此时对应辽宁省内的朝阳的匹配地址元素,以及对应长春内的朝阳的匹配地址元素没有相连接的匹配地址元素,因此可以排除掉对应辽宁省内的朝阳的匹配地址元素和对应长春内的朝阳的匹配地址元素,从而保留对应北京内的朝阳的匹配地址元素。具体的,最后一级匹配地址元素对应的位置信息即为需要确定的目标地址文本对应的目标位置信息。
可选的,本实施例中,可以从第一级匹配地址元素开始,按照连接的匹配地址元素搜寻到最后一级匹配地址元素,从而输出最后一级匹配地址元素对应的位置信息,最后一级匹配地址元素对应的位置信息作为目标地址文本对应的目标位置信息。
本实施例的技术方案,通过根据所述地址属性信息从所述地址知识图谱中查找各所述目标地址实体相匹配的匹配地址元素;从匹配地址元素中筛选出具有连接关系的匹配地址元素;确定具备连接关系的匹配地址元素中的最后一级匹配地址元素;将所述最后一级匹配地址元素对应的位置信息作为所述目标位置信息,由于提前排除掉了不可能的匹配地址元素,因此可以进一步提高地址定位的准确度。
在一种可能的实现中,若最后一级匹配地址元素为两个以上,则将所述最后一级匹配地址元素对应的位置信息作为所述目标位置信息,包括:
获取辅助匹配信息,所述辅助匹配信息包括当前位置与各匹配地址元素之间的目标距离和/或各匹配地址元素对应的定位热度;
根据所述辅助匹配信息从两个以上最后一级匹配地址元素中选择其中一个最后一级匹配地址元素。
其中,当前位置可以是输入目标地址文本的用户的所在位置。具体的,当辅助匹配信息包括当前位置与各匹配地址元素之间的目标距离时,可以是与当前位置之间的目标距离最近的最后一级匹配地址元素作为最终确定的最后一级匹配地址元素。此外,还可以是确定目标距离与预设距离之间的距离差值,将距离差值最小对应的最后一级匹配地址元素作为最终确定的最后一级匹配地址元素。其中,预设距离可以是通过用户的历史当前位置与历史目标位置信息之间的距离得到的,例如预设距离可以是用户的历史当前位置与历史目标位置信息之间的距离的平均值。当辅助匹配信息包括各匹配地址元素对应的定位热度时,可以将定位热度最大的最后一级匹配地址元素作为最终确定的最后一级匹配地址元素。
本实施例的技术方案,通过在最后一级匹配地址元素为两个以上,获取辅助匹配信息,并根据辅助匹配信息从两个以上最后一级匹配地址元素中选择其中一个最后一级匹配地址元素,可以进一步提高地址定位的准确性。
需要说明的是,地址属性信息包括一个地址实体,也可以包括至少两个地址实体,在此不做限定。
在一些情形中,不同用户输入的目标地址文本的习惯不同。例如,对于上海市来说,有的用户习惯叫上海,有的用户习惯叫泸,也有的用户习惯叫魔都。又例如,对于静安区来说,有的用户习惯叫静安区,有的用户习惯叫闸北区。因此,若地址属性信息包括一个地址实体,则容易发生匹配地址元素漏匹配的情况。例如,某一地址元素对应静安区,但此时用户输入的是闸北区,则此时该地址元素会被识别为与目标地址文本不匹配,导致匹配地址元素的匹配成功率和准确度不够高。因此,需要进一步提高匹配地址元素的匹配成功率和准确度。
在一种可能的实现中,地址属性信息包括至少两个所述地址实体;
所述从所述地址知识图谱中查找各所述目标地址实体相匹配的匹配地址元素,包括:
将对应的至少两个地址实体中的其中一个地址实体与所述目标地址实体一致的地址元素,作为所述匹配地址元素。
其中,至少两个所述地址实体包括但不限于是别名、类型和拼音等。在本实施例中,同一地址元素对应的至少两个地址实体所表征的是同一行政身份,仅是叫法不同。示例性的,同一地址元素对应的至少两个地址实体包括上海、泸和魔都等。具体的,若地址元素对应的至少两个地址实体的其中一个地址实体与目标地址实体一致,则将该地址元素作为目标地址实体匹配的匹配地址元素。
本实施例的技术方案,通过将地址元素对应的地址实体配置为至少两个,同一地址元素对应的至少两个表征同一行政身份,由于考虑到了用户对于同一地区的不同叫法,因此能够进一步提高匹配地址元素的匹配成功率和准确度。此外,本实施例中,通过将地址元素对应的地址实体配置为至少两个,但将地址元素对应的地址实体配置为至少两个时,匹配地址元素的数量也会相应上升,也就是说,地址定位的准确度会下降,但通过从匹配地址元素中筛选出具有连接关系的匹配地址元素;确定具备连接关系的匹配地址元素中的最后一级匹配地址元素;将所述最后一级匹配地址元素对应的位置信息作为所述目标位置信息,又能够提高地址定位的准确度,在保证匹配地址元素的匹配成功率和准确度的前提下还能够保证地址定位的准确性。
在一种可能的实现中,提取所述目标地址文本中的至少两个目标地址实体,包括:
通过定位应用程序的API接口(应用程序编程接口,Application ProgrammingInterface)提取所述目标地址文本中的至少两个目标地址实体;和/或,
通过预先训练完成的实体提取模型提取所述目标地址文本中的至少两个目标地址实体,所述实体提取模型是通过地址文本与地址文本对应的地址元素标签训练得到的。
其中,定位应用程序例如可以是高德地图、百度地图和腾讯地图等定位应用程序的API接口。其中,实体提取模型可以是通过BERT(BidirectionalEncoderRepresentations from Transformer)+BILSTM(Bi-directional Long Short-TermMemory)+CRF(条件随机场)建立的。
可选的,当提取所述目标地址文本中的至少两个目标地址实体,包括:
通过定位应用程序的API接口(应用程序编程接口,Application ProgrammingInterface)提取所述目标地址文本中的至少两个目标地址实体;
通过预先训练完成的实体提取模型提取所述目标地址文本中的至少两个目标地址实体,所述实体提取模型是通过地址文本与地址文本对应的地址元素标签训练得到的。
在本实施例中,可以先通过定位应用程序的API接口提取所述目标地址文本中的至少两个目标地址实体,若通过API接口提取目标地址实体成功,则直接输出通过API接口提取目标地址;若通过API接口提取目标地址实体失败,则可以通过预先训练完成的实体提取模型提取所述目标地址文本中的至少两个目标地址实体。
本实施例的技术方案,通过定位应用程序的API接口和实体提取模型等多重方式来提取目标地址实体,可以提高目标地址实体的提取成功率。此外,先通过定位应用程序的API接口提取所述目标地址文本中的至少两个目标地址实体,若通过API接口提取目标地址实体成功,则直接输出通过API接口提取目标地址;若通过API接口提取目标地址实体失败,则可以通过预先训练完成的实体提取模型提取所述目标地址文本中的至少两个目标地址实体,由于通过API接口提取所述目标地址文本中的至少两个目标地址实体所需要的算力,是低于通过预先训练完成的实体提取模型提取所述目标地址文本中的至少两个目标地址实体所需要的算力,并且通过通过API接口提取所述目标地址文本中的至少两个目标地址实体所需要的时间,是少于通过预先训练完成的实体提取模型提取所述目标地址文本中的至少两个目标地址实体所需要的时间,因此,本实施例能够在保证目标地址实体能够准确识别的前提下降低算力以及缩短提取时间。
以下实施例在上述任一实施例的基础上,对于如何建立地址知识图谱进行说明。
在一种可能的实现中,所述地址知识图谱的建立方式,包括:
获取地址文本数据;
从所述地址文本数据中提取多个地址元素以及多个地址元素分别对应的地址属性信息;
接收输入的多个所述地址元素之间的层级关系;
将所述地址元素、多个所述所述地址实体分别对应的地址属性信息和多个所述地址元素之间的层级关系通过多元组的形式,构建多元组信息;
将所述多元组信息录入至知识图谱数据库中,得到所述地址知识图谱。
其中,地址文本数据是基于历史项目积累的大体量地址文本,地址文本数据的构成包括“地址名称”、“地址描述”、“地址类型”、“更新时间”、“变更时间”。其中,通过地址名称可以确定地址实体,通过地址描述可以确定位置信息、距离信息等。通过地址类型可以确定地址元素。其中,多个所述地址元素之间的层级关系可以是人工输入的。例如“上海市”(地址元素,“city”)-“包含”(关系,“is-a”)-“浦东新区”(地址元素,“district”),“上海市”(地址元素,“city”)-“包含”(关系,“is-a”)-“张江镇”(地址元素,“township”),“浦东新区”(地址元素,“district”)–“包含”(关系,“is-a”)-“张江镇”(地址元素,“township”)等。
在本实施例中,地址知识图谱的建立方式可以大致分为信息抽取、知识表示、知识加工和图谱构建。信息抽取:从非结构化的地址文本数据中抽取地址实体,变成结构化的地址要素。将地址要素按照人工设定的关系进行关联,同时对地址元素的属性定义,例如别名、类型、拼音等。
(1)地址要素解析:从地址文本中提取地址要素实体,并预测实体类型,例如输入“上海市浦东新区张江镇炬创芯研发大厦”,输出“上海市”:“city”,“浦东新区”:“district”,“张江镇”:“township”,“炬创芯研发大厦”:“poi”。实现地址要素解析功能,可以采用高德提供的api接口,或者自行搭建BERT+BILSTM+CRF的命名实体模型结构进行预测。
(2)地址关系定义:通过地址要素解析功能,从输入地址文本中提取出了对应类型的地址元素,通过人工设定关系的方法,将地址元素间进行层级关联。例如“上海市”(地址元素,“city”)-“包含”(关系,“is-a”)-“浦东新区”(地址元素,“district”),“上海市”(地址元素,“city”)-“包含”(关系,“is-a”)-“张江镇”(地址元素,“township”),“浦东新区”(地址元素,“district”)–“包含”(关系,“is-a”)-“张江镇”(地址元素,“township”)等。
(3)地址属性定义:根据每一种地址实体类型,设计对应的实体属性,属性包括实体名称、实体类型、实体别名等,例如地址元素“上海市”:(“name”:“上海市”,“实体类型”:“city”,“实体别名”:[“沪”,“魔都”,“上海”]);地址元素“静安区”:(“name”:“静安区”,“实体类型”:“district”,“实体别名”:[“静安”,“闸北区,“闸北”]).
知识表述:是指将地址要素、地址关系、地址属性通过三元组的形式,形成统一结构化数据,其中SPO:S指subject,主体,P指prediction,谓语,O指object,宾语。在地址知识图谱中,S,O均指地址元素,P指地址元素之间定义的关系,属性值打在地址元素实体上。
知识加工:指对地理要素实体、关系、属性的整合和治理。包含本体构建、实体链接和知识合并等。本体构建:对地址元素类型、属性、关系的地址知识图谱梳理。
请参阅图2。图2展示了省、市、区、街镇,poi之间的地址知识图谱结构,其中图中圆圈表示地址要素实体,边表示地址要素实体间的关系,方框内为实体的属性值信息。
实体链接:主要是解决地址实体、关系和属性中冗余和错误的信息。例如有三元组“上海市”-“is-a”-“浦东新区”和三元组“上海”-“is-a”-“浦东”,那么根据表示的意思,两个合并为1条三元组,同时对于“全家便利店”,在西城路与城基路都有,那么通过增加地址后缀名进行区分,表示为“全家便利店(西城路店)”和“全家便利店(城基路店)”两个地址实体。
知识合并:经过本体构建和实体链接后,将处理后的三元组,进行整体的去重合并,最终得到一份质量较高的三元组数据,用于地址图谱的构建。
图谱构建:采用Neo4j图数据库,将处理好的三元组信息,录入到图数据库中,构建地址知识图谱。
可以理解的是,地址指示图谱的构建主要目的是为了提供地址定位服务,当用户输入一段地址文本后,首先经过地址要素解析功能,提取出相应的地址实体与类型并根据本体schema结构,组织成图搜索层级路径,例如“上海市”(city)->“浦东新区”(district)->“张江镇”(township)->“炬创芯研发大厦”(poi),将该搜索路径在地址图谱中通过sql的语句进行查找,找到最后一级,则返回最后地址实体的经纬度属性值,否则未定位到该点位。
在一种可能的实现中,所述地址文本数据的来源为至少两个;
在所述从所述地址文本数据中提取多个地址元素以及多个地址元素分别对应的地址属性信息之前,所述方法还包括:
对所述地址文本数据进行清洗处理,得到清洗处理后的所述地址文本数据,所述清洗处理包括繁简转换处理、英文字母的大小写转换处理、标点符号去除处理和数据去重处理中的至少一种;
所述从所述地址文本数据中提取多个地址元素以及多个地址元素分别对应的地址属性信息,包括:
从清洗处理后的所述地址文本数据中提取多个地址元素以及多个地址元素分别对应的地址属性信息。
其中,地址文本数据的来源可以包括但不限于是现有地址库、采买和外部数据三种来源方式。现有地址库是基于历史项目积累的大体量地址文本,构成包括“地址名称”、“地址描述”、“地址类型”、“更新时间”、“变更时间”等。采买数据是通过购买市面上的数据资产的方式,扩充数据,采买方包括极光、高德等。外部数据是指通过爬虫或业务方提供的数据扩充数据库。外部数据来源包括“企查查”、“百度百科”等。针对海量的多源异构数据,对其进行数据清洗工作,数据清洗工作主要包括文本的繁简转换、英文字母的大小写转换、标点符号去除、数据去重等,最终获得统一结构,数据质量较高的地址文本数据,并将清洗后的地址数据,通过数据库的方式进行存储。
本实施例的技术方案,通过对所述地址文本数据进行清洗处理,得到清洗处理后的所述地址文本数据,所述清洗处理包括繁简转换处理、英文字母的大小写转换处理、标点符号去除处理和数据去重处理中的至少一种,从清洗处理后的所述地址文本数据中提取多个地址元素以及多个地址元素分别对应的地址属性信息,可以提高地址知识图谱构建的准确性,进而提高地址定位的准确性。
在一种可能的实现中,所述根据至少两个所述目标地址实体和所述地址知识图谱,确定所述目标地址文本对应的目标位置信息,包括:
根据至少两个所述目标地址实体构建SQL语句(结构化查询语言,StructuredQuery Language);
基于所述SQL语句从所述知识图谱数据库查找各所述目标地址实体相匹配的匹配地址元素;
从匹配地址元素中筛选出具有连接关系的匹配地址元素;
确定具备连接关系的匹配地址元素中的最后一级匹配地址元素;
将所述最后一级匹配地址元素对应的位置信息作为所述目标位置信息。
本实施例的技术方案,通过根据至少两个所述目标地址实体构建SQL语句(结构化查询语言,Structured Query Language);基于所述SQL语句从所述知识图谱数据库查找各所述目标地址实体相匹配的匹配地址元素,也就是说,用户只需要正常输入目标地址文本即可,就能够根据至少两个所述目标地址实体自动构建SQL语句,从而通过SQL语句从知识图谱数据库中查找各所述目标地址实体相匹配的匹配地址元素,用户不需要自己构建SQL语句,从而提高了地址定位的便利性。此外,通过根据所述地址属性信息从所述地址知识图谱中查找各所述目标地址实体相匹配的匹配地址元素;从匹配地址元素中筛选出具有连接关系的匹配地址元素;确定具备连接关系的匹配地址元素中的最后一级匹配地址元素;将所述最后一级匹配地址元素对应的位置信息作为所述目标位置信息,由于提前排除掉了不可能的匹配地址元素,因此可以进一步提高地址定位的准确度。
实施例二
请参阅图3,图3是本发明实施例公开的一种基于地址知识图谱的定位装置的结构示意图。如图3所示,该基于地址知识图谱的定位装置包括获取模块310、提取模块320和定位模块330。其中:
获取模块310,用于获取目标地址文本和地址知识图谱,所述地址知识图谱是根据多个地址元素分别对应的位置信息和多个所述地址元素之间的父子级关系建立的;
提取模块320,用于提取所述目标地址文本中的目标地址实体;
定位模块330,用于根据所述目标地址实体和所述地址知识图谱,确定所述目标地址文本对应的目标位置信息。
在一种可能的实现中,所述地址知识图谱用于指示地址元素之间的连接关系以及各地址元素对应的地址属性信息,连接的两个地址元素之间具有N级层级关系,N为1以上的自然数;定位模块330用于根据所述地址属性信息从所述地址知识图谱中查找各所述目标地址实体相匹配的匹配地址元素;从匹配地址元素中筛选出具有连接关系的匹配地址元素;确定具备连接关系的匹配地址元素中的最后一级匹配地址元素;将所述最后一级匹配地址元素对应的位置信息作为所述目标位置信息。
在一种可能的实现中,地址属性信息包括至少两个所述地址实体;定位模块330用于将对应的至少两个地址实体中的其中一个地址实体与所述目标地址实体一致的地址元素,作为所述匹配地址元素。
在一种可能的实现中,提取模块320用于通过定位应用程序的API接口提取所述目标地址文本中的至少两个目标地址实体;和/或,
通过预先训练完成的实体提取模型提取所述目标地址文本中的至少两个目标地址实体,所述实体提取模型是通过地址文本与地址文本对应的地址元素标签训练得到的。
在一种可能的实现中,该装置还包括:
构建模块,用于获取地址文本数据;从所述地址文本数据中提取多个地址元素以及多个地址元素分别对应的地址属性信息;接收输入的多个所述地址元素之间的层级关系;将所述地址元素、多个所述所述地址实体分别对应的地址属性信息和多个所述地址元素之间的层级关系通过多元组的形式,构建多元组信息;将所述多元组信息录入至知识图谱数据库中,得到所述地址知识图谱。
在一种可能的实现中,所述地址文本数据的来源为至少两个;
该装置还包括:
清洗处理模块,用于对所述地址文本数据进行清洗处理,得到清洗处理后的所述地址文本数据,所述清洗处理包括繁简转换处理、英文字母的大小写转换处理、标点符号去除处理和数据去重处理中的至少一种;
该构建模块用于从清洗处理后的所述地址文本数据中提取多个地址元素以及多个地址元素分别对应的地址属性信息。
在一种可能的实现中,定位模块330用于根据至少两个所述目标地址实体构建SQL语句;基于所述SQL语句从所述知识图谱数据库查找各所述目标地址实体相匹配的匹配地址元素;从匹配地址元素中筛选出具有连接关系的匹配地址元素;确定具备连接关系的匹配地址元素中的最后一级匹配地址元素;将所述最后一级匹配地址元素对应的位置信息作为所述目标位置信息。
可以理解的是,本实施例的装置的功能可以参考上述任一实施例的描述,在此不做限定。
实施例三
请参阅图4,图4是本发明实施例公开的又一种基于地址知识图谱的定位装置的结构示意图。如图4所示,该基于地址知识图谱的定位装置可以包括:
存储有可执行程序代码的存储器401;
与存储器401耦合的处理器402;
处理器402调用存储器401中存储的可执行程序代码,执行本发明实施例一所描述的基于地址知识图谱的定位方法中的步骤。
实施例四
本发明实施例公开了一种计算机可存储介质,该计算机存储介质存储有计算机指令,该计算机指令被调用时,用于执行本发明实施例一所描述的基于地址知识图谱的定位方法中的步骤。
实施例五
本发明实施例公开了一种计算机程序产品,该计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,且该计算机程序可操作来使计算机执行实施例一所描述的基于地址知识图谱的定位方法中的步骤。
以上所描述的装置实施例仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施例的具体描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(ErasableProgrammable Read Only Memory,EPROM)、一次可编程只读存储器(One-timeProgrammable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
最后应说明的是:本发明实施例公开的一种基于地址知识图谱的定位方法及装置所揭露的仅为本发明较佳实施例而已,仅用于说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述各项实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或替换,并不使相应的技术方案的本质脱离本发明各项实施例技术方案的精神和范围。

Claims (10)

1.一种基于地址知识图谱的定位方法,其特征在于,所述方法包括:
获取目标地址文本和地址知识图谱,所述地址知识图谱是根据多个地址元素分别对应的地址属性信息和多个所述地址元素之间的层级关系建立的,所述地址属性信息包括位置信息和地址实体;
提取所述目标地址文本中的至少两个目标地址实体;
根据至少两个所述目标地址实体和所述地址知识图谱,确定所述目标地址文本对应的目标位置信息。
2.根据权利要求1所述的方法,其特征在于,所述地址知识图谱用于指示地址元素之间的连接关系以及各地址元素对应的地址属性信息,连接的两个地址元素之间具有N级层级关系,N为1以上的自然数;
所述根据至少两个所述目标地址实体和所述地址知识图谱,确定所述目标地址文本对应的目标位置信息,包括:
根据所述地址属性信息从所述地址知识图谱中查找各所述目标地址实体相匹配的匹配地址元素;
从匹配地址元素中筛选出具有连接关系的匹配地址元素;
确定具备连接关系的匹配地址元素中的最后一级匹配地址元素;
将所述最后一级匹配地址元素对应的位置信息作为所述目标位置信息。
3.根据权利要求2所述的方法,其特征在于,所述地址属性信息包括至少两个所述地址实体;
所述从所述地址知识图谱中查找各所述目标地址实体相匹配的匹配地址元素,包括:
将对应的至少两个地址实体中的其中一个地址实体与所述目标地址实体一致的地址元素,作为所述匹配地址元素。
4.根据权利要求1所述的方法,其特征在于,所述提取所述目标地址文本中的至少两个目标地址实体,包括:
通过定位应用程序的API接口提取所述目标地址文本中的至少两个目标地址实体;和/或,
通过预先训练完成的实体提取模型提取所述目标地址文本中的至少两个目标地址实体,所述实体提取模型是通过地址文本与地址文本对应的地址元素标签训练得到的。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述地址知识图谱的建立方式,包括:
获取地址文本数据;
从所述地址文本数据中提取多个地址元素以及多个地址元素分别对应的地址属性信息;
接收输入的多个所述地址元素之间的层级关系;
将所述地址元素、多个所述所述地址实体分别对应的地址属性信息和多个所述地址元素之间的层级关系通过多元组的形式,构建多元组信息;
将所述多元组信息录入至知识图谱数据库中,得到所述地址知识图谱。
6.根据权利要求5所述的方法,其特征在于,所述地址文本数据的来源为至少两个;
在所述从所述地址文本数据中提取多个地址元素以及多个地址元素分别对应的地址属性信息之前,所述方法还包括:
对所述地址文本数据进行清洗处理,得到清洗处理后的所述地址文本数据,所述清洗处理包括繁简转换处理、英文字母的大小写转换处理、标点符号去除处理和数据去重处理中的至少一种;
所述从所述地址文本数据中提取多个地址元素以及多个地址元素分别对应的地址属性信息,包括:
从清洗处理后的所述地址文本数据中提取多个地址元素以及多个地址元素分别对应的地址属性信息。
7.根据权利要求5所述的方法,其特征在于,所述根据至少两个所述目标地址实体和所述地址知识图谱,确定所述目标地址文本对应的目标位置信息,包括:
根据至少两个所述目标地址实体构建SQL语句;
基于所述SQL语句从所述知识图谱数据库查找各所述目标地址实体相匹配的匹配地址元素;
从匹配地址元素中筛选出具有连接关系的匹配地址元素;
确定具备连接关系的匹配地址元素中的最后一级匹配地址元素;
将所述最后一级匹配地址元素对应的位置信息作为所述目标位置信息。
8.一种基于地址知识图谱的定位装置,其特征在于,所述装置包括:
获取模块,用于获取目标地址文本和地址知识图谱,所述地址知识图谱是根据多个地址元素分别对应的位置信息和多个所述地址元素之间的父子级关系建立的;
提取模块,用于提取所述目标地址文本中的目标地址实体;
定位模块,用于根据所述目标地址实体和所述地址知识图谱,确定所述目标地址文本对应的目标位置信息。
9.一种基于地址知识图谱的定位装置,其特征在于,所述装置包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行如权利要求1-7任一项所述的基于地址知识图谱的定位方法。
10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机指令,所述计算机指令被调用时,用于执行如权利要求1-7任一项所述的基于地址知识图谱的定位方法。
CN202310188127.XA 2023-03-01 2023-03-01 一种基于地址知识图谱的定位方法及装置 Pending CN116303854A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310188127.XA CN116303854A (zh) 2023-03-01 2023-03-01 一种基于地址知识图谱的定位方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310188127.XA CN116303854A (zh) 2023-03-01 2023-03-01 一种基于地址知识图谱的定位方法及装置

Publications (1)

Publication Number Publication Date
CN116303854A true CN116303854A (zh) 2023-06-23

Family

ID=86791845

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310188127.XA Pending CN116303854A (zh) 2023-03-01 2023-03-01 一种基于地址知识图谱的定位方法及装置

Country Status (1)

Country Link
CN (1) CN116303854A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116910386A (zh) * 2023-09-14 2023-10-20 深圳市智慧城市科技发展集团有限公司 地址补全方法、终端设备及计算机可读存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116910386A (zh) * 2023-09-14 2023-10-20 深圳市智慧城市科技发展集团有限公司 地址补全方法、终端设备及计算机可读存储介质
CN116910386B (zh) * 2023-09-14 2024-02-02 深圳市智慧城市科技发展集团有限公司 地址补全方法、终端设备及计算机可读存储介质

Similar Documents

Publication Publication Date Title
Punjani et al. Template-based question answering over linked geospatial data
CN110609902B (zh) 一种基于融合知识图谱的文本处理方法及装置
CN108959244B (zh) 地址分词的方法和装置
Scheider et al. Geo-analytical question-answering with GIS
CN108388559B (zh) 地理空间应用下的命名实体识别方法及系统、计算机程序
CN109657074B (zh) 基于地址树的新闻知识图谱构建方法
Poorthuis et al. Making big data small: strategies to expand urban and geographical research using social media
WO2016196004A1 (en) Joining semantically-related data using big table corpora
Younis et al. Hybrid geo-spatial query methods on the Semantic Web with a spatially-enhanced index of DBpedia
CN112256817A (zh) 一种地理编码方法、系统、终端以及存储介质
CN112650858B (zh) 应急协助信息的获取方法、装置、计算机设备及介质
CN112528174A (zh) 基于知识图谱和多重匹配的地址修整补全方法及应用
Christen et al. A probabilistic geocoding system based on a national address file
CN108733810A (zh) 一种地址数据匹配方法及装置
CN116303854A (zh) 一种基于地址知识图谱的定位方法及装置
CN116414823A (zh) 一种基于分词模型的地址定位方法和装置
CN112328910A (zh) 一种涵盖aoi和poi标准地址匹配引擎的方法及系统
Cheng et al. Quickly locating POIs in large datasets from descriptions based on improved address matching and compact qualitative representations
CN108345662A (zh) 一种考虑用户分布区域差异的签到微博数据加权统计方法
Ballatore et al. Grounding linked open data in WordNet: The case of the OSM semantic network
US20190065528A1 (en) Data import and reconciliation
Christen et al. A probabilistic deduplication, record linkage and geocoding system
CN115185986A (zh) 省市区地址信息匹配方法、装置、计算机设备及存储介质
CN116431625A (zh) 一种地理实体的定位分析方法、装置及计算机设备
CN116414808A (zh) 详细地址规范化的方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination