CN103699623A - 地理编码实现方法和装置 - Google Patents

地理编码实现方法和装置 Download PDF

Info

Publication number
CN103699623A
CN103699623A CN201310706024.4A CN201310706024A CN103699623A CN 103699623 A CN103699623 A CN 103699623A CN 201310706024 A CN201310706024 A CN 201310706024A CN 103699623 A CN103699623 A CN 103699623A
Authority
CN
China
Prior art keywords
information
subaddressing
information point
point data
phrase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310706024.4A
Other languages
English (en)
Other versions
CN103699623B (zh
Inventor
余晓龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201310706024.4A priority Critical patent/CN103699623B/zh
Publication of CN103699623A publication Critical patent/CN103699623A/zh
Application granted granted Critical
Publication of CN103699623B publication Critical patent/CN103699623B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Remote Sensing (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供一种地理编码实现方法和装置。该地理编码实现方法包括:对地址信息进行拆分和语义解析,以获取至少两个子地址对应的信息点数据;根据获取的至少两个信息点数据,对所述地址信息对应的地理目标进行地理编码。本发明实施例的技术方案,通过将地址信息拆分获得至少两个子地址,能够实现对复杂地址信息的拆分和解析,进而实现对复杂地址信息描述地理目标的精确定位,优化了地理编码的准确性。

Description

地理编码实现方法和装置
技术领域
本发明实施例涉及计算机数据处理技术,尤其涉及一种地理编码实现方法和装置。
背景技术
地理编码(Geocoding),又称地址匹配(address-matching),是建立地理位置坐标与给定地址信息之间关联的过程,也是指在地图上找到并标明每条地址信息所对应的位置坐标,而位置坐标一般会以点、线、面形式的坐标矢量表达一个地理目标。地理编码是理信息系统(GeographicInformationSystem,简称GIS)中比较重要的功能。如何将地址信息准确地与位置坐标进行匹配,是地理编码技术的重要关注点之一。
现有的地理编码技术通常是首先对用户提供的地址信息进行语义解析,而后将地址信息对应的语义信息与数据库中已存储的位置坐标的描述信息进行匹配,从而识别该地址信息所对应的地理目标。当无法精确定位时,则确定与该地址信息匹配的一定范围的地理目标。
但是,现有技术仅限于对简单的规范化地址信息进行含义解析,而对于用户多角度表述的复杂地址信息则无法进行语义解析,更无法借此提高定位地理目标的精度。
发明内容
本发明实施例提供一种地理编码实现方法和装置,以提高基于复杂地址信息进行地理编码的定位精度。
第一方面,本发明实施例提供了一种地理编码实现方法,包括:
对地址信息进行拆分和语义解析,以获取至少两个子地址对应的信息点数据;
根据获取的至少两个信息点数据,对所述地址信息对应的地理目标进行地理编码。
第二方面,本发明实施例还提供了一种地理编码实现装置,包括:
地址信息处理模块,用于对地址信息进行拆分和语义解析,以获取至少两个子地址对应的信息点数据;
地理编码模块,用于根据获取的至少两个信息点数据,对所述地址信息对应的地理目标进行地理编码。
本发明实施例的技术方案,通过将地址信息拆分获得至少两个子地址,能够实现对复杂地址信息的拆分和解析,进而实现对复杂地址信息描述地理目标的精确定位,优化了地理编码的准确性。
附图说明
图1为本发明实施例一提供的一种地理编码实现方法的流程图;
图2为本发明实施例二提供的一种地理编码实现方法的流程图;
图3为本发明实施例三提供的一种地理编码实现方法的流程图;
图4为本发明实施例四提供的地理编码实现装置的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种地理编码实现方法的流程图,本实施例可适用于对诸如用户输入的地址信息进行语义解析,从而建立地址信息与地理位置坐标之间关联的地理编码过程。该方法可以由地理编码实现装置来执行,该装置可以采用硬件和/或软件的方式实现。本实施例提供的地理编码实现方法具体包括如下:
110、对地址信息进行拆分和语义解析,以获取至少两个子地址对应的信息点数据;
120、根据获取的至少两个信息点数据,对所述地址信息对应的地理目标进行地理编码。
本实施例中,地址信息即用于描述某个地理位置信息,通常是用户检索地理位置时采用的描述语言。用户的描述语言既可以是规范的地理位置表达,例如“北京市海淀区上地信息路甲9号奎科大厦”,也可以是语义模糊的复杂地址信息,例如“北京市奎科大厦,上地5街与信息路交叉口北50米,方正大厦旁”。本发明实施例尤为适用于对复杂地址信息进行解析,从中拆分获取对同一地理位置坐标进行描述的至少两个子地址,进而根据多个子地址结合对该地址信息的地理目标进行定位,即实现该地址信息的地理编码。
采用本实施例的技术方案,能够实现对复杂地址信息的拆分和解析,进而实现对复杂地址信息描述地理目标的精确定位,优化了地理编码的准确性。
在上述方案的基础上,对地址信息进行拆分和语义解析,以获取至少两个子地址对应的信息点数据的操作优选为根据设定关键词将地址信息进行拆分和信息点识别,以获得至少两个子地址对应的信息点数据。
上述操作,基于信息点(Point of Interest,简称POI)对地址信息进行语义解析和子地址拆分。POI是地理编码技术中记录地理目标的手段,通常可以描述地理目标的名称、属性和矢量坐标等。通常建立有存储一定地理范围内POI的POI数据库,例如某个城市内的所有POI。数据库中的POI也在随着地理目标的实际变化而不断的更新、增加和删除。
实施例二
图2为本发明实施例二提供的地理编码实现方法中进行地址信息拆分和解析的流程图。本实施例以上述实施例为基础,进一步详细介绍如何基于POI对子地址进行拆分和语义解析。
具体的,上述实施例中,根据设定关键词将地址信息进行拆分和信息点识别,以获得至少两个子地址对应的信息点数据的操作可以包括:
210、对所述地址信息进行语义解析,以获得具有独立地址语义的短语;
独立地址语义的短语是能够独立表达某一地址的词语,一般可根据地址短语数据库或地址信息表达规则来确定。进行短语拆分可方便进行后续的POI识别。
上述获得短语的操作优选具体为:基于分词数据库将地址信息进行分词处理,获得具有独立语义的词语;将词语进行合并处理,获得具有独立地址语义的短语。
220、基于信息点数据库中的地理编码规范关键词和关联区域关键词,对短语进行信息点识别,与信息点匹配的短语作为基础单元,与信息点不匹配的短语作为附加单元;
对于复杂地址信息,其中的描述语言通常不是规范表达地理目标的短语,例如“上地5街与信息路交叉口北50米”等,其中含有不能精确匹配信息点的内容,如“北50米”,将这部分内容作为附加单元。
230、将基础单元,或所述基础单元和后续的附加单元,合并为一个子地址信息;
一个或多个附加单元与其前面跟随的一个基础单元合并为一个子地址信息。或者,如果基础单元后面跟随的是另一个基础单元,在前面的基础单元本身可以作为一个子地址信息。
240、采用偏移量关键词对所述子地址信息的附加单元进行识别,以确定所述子地址信息为精确子地址、模糊子地址或偏移子地址的信息点数据。
已有的规范表达的地址信息中,一般仅能识别到精确子地址,而本实施例中,通过各子地址信息的附加单元所包含的不同内容,将地址进一步区分为精确子地址、模糊子地址或偏移子地址,既实现了复杂地址信息的识别,又实现了结合不同类别的子地址对地理目标进行精确定位。
在上述实施例的方案中,采用偏移量关键词对所述子地址信息的附加单元进行识别,以确定所述子地址信息为精确子地址、模糊子地址或偏移子地址的信息点数据的操作优选包括:
241、采用偏移量关键词对所述子地址信息的附加单元进行识别;
242、如果所述子地址信息不包括附加单元,则确定所述子地址信息对应于精确子地址的信息点数据;
243、如果所述子地址信息包括附加单元,且所述附加单元中包括偏移量,则根据所述子地址信息的基础单元,以及所述附加单元中识别到的偏移量关键词和偏移量,确定所述子地址信息为偏移子地址的信息点数据;
244、如果所述子地址信息包括附加单元,且所述附加单元中不包括偏移量,则根据所述子地址信息的基础单元,以及所述附加单元中识别到的偏移量关键词,确定所述子地址信息为模糊子地址的信息点数据。
上述方案中,区分了子地址信息是否包括附加单元,以及附加单元中是否包括偏移量的三种情况,分别可用于确定精确子地址、模糊子地址和偏移子地址。模糊子地址中一般仅以附加单元表达出地址的相对参考位置,例如“方正大厦旁”,而包括偏移量的偏移子地址,则以附加单元表达出地址的精确偏移量,例如“方正大厦北50米”。上述模糊子地址和偏移子地址均可用于对精确子地址的辅助定位。
另一方面,在精确子地址中,又可以进行分类。例如分为指向独立地理目标的独立实体信息点,以及指向多个地理目标关联区域的信息点。并且,关联区域信息点的识别优选是基于至少两个独立实体信息点进行定位的,则基于信息点数据库中的地理编码规范关键词和关联区域关键词,对短语进行信息点识别的操作优选包括:
221、如果识别到与信息点数据库中的关联区域关键词匹配的短语时,根据所述关联区域关键词,基于信息点数据库中的地理编码规范关键词对当前短语的前序短语进行识别,以获取至少两个关联信息点;
222、根据至少两个关联信息点和关联区域关键词获取关联区域信息点。
在地址信息的各短语中识别到匹配的关联区域关键词时,例如“交叉口”,可以按照预设规则查找“交叉口”的前序短语,从中识别至少两个信息点,例如“上地5街与信息路交叉口”中,“上地5街”和“信息路”均为信息点,基于这两个信息点的地理坐标确定其相交位置的地理坐标,作为“上地5街与信息路交叉口”这个关联区域信息点的地理坐标。
本实施例的技术方案给出了基于不同关键词识别精确子地址、模糊子地址和偏移子地址的具体方式,实现了对复杂地址信息的语义解析和准确识别。
实施例三
图3为本发明实施例三提供的地理编码实现方法的流程图,本实施例以上述实施例为基础,提供了一个优选实例,具体如下:
301、获取地址信息;
例如为“北京市海淀区上地信息路甲9号奎科大厦(上地5街与信息路交叉口北50米,方正大厦旁)”;
302、对该地址信息进行分词处理,获得分词结果。
上述分词可以基于分词数据库来实现,将语句拆分为具有独立语义的词语。以分隔符“|”相间隔,分词结果为“北京市|海淀区|上地|信息路|甲|9|号|奎科大厦|(|上地5街|与|信息路|交叉口|北|50|米|,|方正大厦|旁|)”。
303、将词语进行合并处理,获得具有独立地址语义的短语。
各词语未必能表达地址信息,例如“9”、“50”等,所以将词语进一步合并为具有独立地址语义的短语。则短语合并结果为“[北京市][海淀区][上地][信息路|甲9号][奎科大厦]([上地5街与信息路交叉口|北50米],[方正大厦|旁]”。
304、采用关联区域关键词对各短语逐一进行信息点识别,如果当前短语与关联区域关键词匹配,则执行操作305,否则重复执行操作304,直至所有短语匹配完后,执行操作306;
305、采用地理编码规范关键词对当前短语的前序短语进行识别,以获取至少两个信息点,将前序短语和当前短语标注为关联区域信息点,而后执行操作307;
关联区域关键词例如为“交叉口”、“中间”、“十字路口”等表达区域间关联的设定词汇。据此,可在上述实例中识别到“交叉口”这一短语,进而在“交叉口”的前序短语采用地理编码规范关键词进行识别。地理编码规范关键词例如是规范性行政地址词汇,如“市”、“区”、“路”、“大厦”、“门牌号”等,据此,可在“交叉口”前识别到“上地5街”与“信息路”两个信息点,这些短语标注为一个关联区域信息点“上地5街与信息路交叉口”。该关联区域信息点可以是在信息点数据库已存储有位置坐标,也可以是根据“上地5街”与“信息路”的位置坐标按照预设规则计算而得。
306、对除去关联区域信息点之外的地址信息采用地理编码规范关键词进行逐一识别,以确定各匹配的信息点。
则上述实例的信息点标注结果为“[北京(市)][海淀区(区)][上地(区域)][信息路(道路)|甲9号][奎科大厦(POI)]([上地5街与信息路交叉口(POI)|北50米],[方正大厦(POI)|旁]”。
307、将与信息点匹配的短语作为基础单元,与信息点不匹配的短语作为附加单元;
则基础单元为“[北京(市)][海淀区(区)][上地(区域)][信息路(道路)|甲9号][奎科大厦(POI)]”、“上地5街与信息路交叉口(POI)”、“方正大厦(POI)”。附加单元为“北50米”、“旁”,分别跟随一个基础单元。
308、将基础单元,或所述基础单元和后续的附加单元,合并为一个子地址信息;
则本实例中获得三个子地址信息,“[北京(市)][海淀区(区)][上地(区域)][信息路(道路)|甲9号][奎科大厦(POI)]”、“([上地5街与信息路交叉口(POI)|北50米]”、“[方正大厦(POI)|旁]”。
309、识别每个子地址信息是否包括附加单元,若否,则执行操作310,若是,执行操作311;
310、如果所述子地址信息不包括附加单元,则确定所述子地址信息对应于精确子地址的信息点数据,执行操作314;
即“[北京(市)][海淀区(区)][上地(区域)][信息路(道路)|甲9号][奎科大厦(POI)]”为精确子地址的信息点数据;
311、判断所述子地址信息的附加单元是否包括偏移量,若是,则执行操作312,若否,执行操作313;
312、采用偏移量关键词对所述子地址信息的附加单元进行识别,根据所述子地址信息的基础单元,以及所述附加单元中识别到的偏移量关键词和偏移量,确定所述子地址信息为偏移子地址的信息点数据,执行操作314;
即“([上地5街与信息路交叉口(POI)|北50米]”为偏移子地址的信息点数据,其中“50米”为偏移量,“北”为偏移量关键词。
313、采用偏移量关键词对所述子地址信息的附加单元进行识别,根据所述子地址信息的基础单元,以及所述附加单元中识别到的偏移量关键词,确定所述子地址信息为模糊子地址的信息点数据。
即“[方正大厦(POI)|旁]”为模糊子地址的信息点数据,其中,“旁”为偏移量关键词。
314、根据获取的至少两个信息点数据,对所述地址信息对应的地理目标进行地理编码。
上述操作314的实际执行方式可以有多种,例如执行下述的一种或多种:
将精确子地址、模糊子地址和/或偏移子地址的信息点数据按照预设层级存储为地址树;该方式实现了对地理目标的地址信息的多方面表述。预设层级可以按照行政区划来设置,例如按照省、市、区、路、号等层级来存储各子地址的信息。
根据精确子地址的信息点数据进行地理编码,且根据所述模糊子地址和/或偏移子地址的信息点数据对地理编码进行修正或校验。
如果根据精确子地址的信息点数据在数据库中匹配至少两个信息点时,根据所述模糊子地址和/或偏移子地址的信息点数据在所述至少两个信息点中进行选择。
本发明实施例的技术方案,能有效提高复杂地址信息地理编码的准确率。
实施例四
图4为本发明实施例四提供的地理编码实现装置的结构示意图,该装置包括:地址信息处理模块410和地理编码模块420。其中,地址信息处理模块410用于对地址信息进行拆分和语义解析,以获取至少两个子地址对应的信息点数据;地理编码模块420用于根据获取的至少两个信息点数据,对所述地址信息对应的地理目标进行地理编码。
进一步地,该地址信息处理模块410具体可用于:根据设定关键词将地址信息进行拆分和信息点识别,以获得至少两个子地址对应的信息点数据。
优选地,地址信息处理模块410包括:短语获取单元411、短语匹配单元412、子地址合并单元413和子地址识别单元414。其中,短语获取单元411,用于对所述地址信息进行语义解析,以获得具有独立地址语义的短语;短语匹配单元412,用于基于信息点数据库中的地理编码规范关键词和关联区域关键词,对短语进行信息点识别,与信息点匹配的短语作为基础单元,与信息点不匹配的短语作为附加单元;子地址合并单元413,用于将基础单元,或所述基础单元和后续的附加单元,合并为一个子地址信息;子地址识别单元414,用于采用偏移量关键词对所述子地址信息的附加单元进行识别,以确定所述子地址信息为精确子地址、模糊子地址或偏移子地址的信息点数据。
其中,短语获取单元411的一种优选实现方式,是具体用于基于分词数据库将地址信息进行分词处理,获得具有独立语义的词语;将词语进行合并处理,获得具有独立地址语义的短语。
上述方案中,子地址识别单元414具体可用于:
采用偏移量关键词对所述子地址信息的附加单元进行识别;
如果所述子地址信息不包括附加单元,则确定所述子地址信息对应于精确子地址的信息点数据;
如果所述子地址信息包括附加单元,且所述附加单元中包括偏移量,则根据所述子地址信息的基础单元,以及所述附加单元中识别到的偏移量关键词和偏移量,确定所述子地址信息为偏移子地址的信息点数据;
如果所述子地址信息包括附加单元,且所述附加单元中不包括偏移量,则根据所述子地址信息的基础单元,以及所述附加单元中识别到的偏移量关键词,确定所述子地址信息为模糊子地址的信息点数据。
短语匹配单元412具体可用于:
如果识别到与信息点数据库中的关联区域关键词匹配的短语时,根据所述关联区域关键词,基于信息点数据库中的地理编码规范关键词对当前短语的前序短语进行识别,以获取至少两个关联信息点;
根据至少两个关联信息点和关联区域关键词获取关联区域信息点。
基于上述功能模块识别的子地址,进一步的,地理编码模块420包括:地址树存储单元421、地址修正校验单元422和/或地址选择单元423。
地址树存储单元421,用于将精确子地址、模糊子地址和/或偏移子地址的信息点数据按照预设层级存储为地址树;
地址修正校验单元422,用于根据精确子地址的信息点数据进行地理编码,且根据所述模糊子地址和/或偏移子地址的信息点数据对地理编码进行修正或校验;
地址选择单元423,用于如果根据精确子地址的信息点数据在数据库中匹配至少两个信息点时,根据所述模糊子地址和/或偏移子地址的信息点数据在所述至少两个信息点中进行选择。
上述地理编码实现装置可执行本发明任意实施例所提供的地理编码实现方法,具备执行方法相应的功能模块和有益效果。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (14)

1.一种地理编码实现方法,其特征在于,包括:
对地址信息进行拆分和语义解析,以获取至少两个子地址对应的信息点数据;
根据获取的至少两个信息点数据,对所述地址信息对应的地理目标进行地理编码。
2.根据权利要求1所述的方法,其特征在于,对地址信息进行拆分和语义解析,以获取至少两个子地址对应的信息点数据包括:
根据设定关键词将地址信息进行拆分和信息点识别,以获得至少两个子地址对应的信息点数据。
3.根据权利要求2所述的方法,其特征在于,根据设定关键词将地址信息进行拆分和信息点识别,以获得至少两个子地址对应的信息点数据包括:
对所述地址信息进行语义解析,以获得具有独立地址语义的短语;
基于信息点数据库中的地理编码规范关键词和关联区域关键词,对短语进行信息点识别,与信息点匹配的短语作为基础单元,与信息点不匹配的短语作为附加单元;
将基础单元,或所述基础单元和后续的附加单元,合并为一个子地址信息;
采用偏移量关键词对所述子地址信息的附加单元进行识别,以确定所述子地址信息为精确子地址、模糊子地址或偏移子地址的信息点数据。
4.根据权利要求3所述的方法,其特征在于,对所述地址信息进行语义解析,以获得具有独立地址语义的短语包括:
基于分词数据库将地址信息进行分词处理,获得具有独立语义的词语;
将词语进行合并处理,获得具有独立地址语义的短语。
5.根据权利要求3所述的方法,其特征在于,采用偏移量关键词对所述子地址信息的附加单元进行识别,以确定所述子地址信息为精确子地址、模糊子地址或偏移子地址的信息点数据包括:
采用偏移量关键词对所述子地址信息的附加单元进行识别;
如果所述子地址信息不包括附加单元,则确定所述子地址信息对应于精确子地址的信息点数据;
如果所述子地址信息包括附加单元,且所述附加单元中包括偏移量,则根据所述子地址信息的基础单元,以及所述附加单元中识别到的偏移量关键词和偏移量,确定所述子地址信息为偏移子地址的信息点数据;
如果所述子地址信息包括附加单元,且所述附加单元中不包括偏移量,则根据所述子地址信息的基础单元,以及所述附加单元中识别到的偏移量关键词,确定所述子地址信息为模糊子地址的信息点数据。
6.根据权利要求3所述的方法,其特征在于,基于信息点数据库中的地理编码规范关键词和关联区域关键词,对短语进行信息点识别包括:
如果识别到与信息点数据库中的关联区域关键词匹配的短语时,根据所述关联区域关键词,基于信息点数据库中的地理编码规范关键词对当前短语的前序短语进行识别,以获取至少两个关联信息点;
根据至少两个关联信息点和关联区域关键词获取关联区域信息点。
7.根据权利要求3所述的方法,其特征在于,根据获取的至少两个信息点数据,对所述地址信息对应的地理目标进行地理编码包括:
将精确子地址、模糊子地址和/或偏移子地址的信息点数据按照预设层级存储为地址树;和/或
根据精确子地址的信息点数据进行地理编码,且根据所述模糊子地址和/或偏移子地址的信息点数据对地理编码进行修正或校验;和/或
如果根据精确子地址的信息点数据在数据库中匹配至少两个信息点时,根据所述模糊子地址和/或偏移子地址的信息点数据在所述至少两个信息点中进行选择。
8.一种地理编码实现装置,其特征在于,包括:
地址信息处理模块,用于对地址信息进行拆分和语义解析,以获取至少两个子地址对应的信息点数据;
地理编码模块,用于根据获取的至少两个信息点数据,对所述地址信息对应的地理目标进行地理编码。
9.根据权利要求8所述的装置,其特征在于,地址信息处理模块具体用于:
根据设定关键词将地址信息进行拆分和信息点识别,以获得至少两个子地址对应的信息点数据。
10.根据权利要求9所述的装置,其特征在于,地址信息处理模块包括:
短语获取单元,用于对所述地址信息进行语义解析,以获得具有独立地址语义的短语;
短语匹配单元,用于基于信息点数据库中的地理编码规范关键词和关联区域关键词,对短语进行信息点识别,与信息点匹配的短语作为基础单元,与信息点不匹配的短语作为附加单元;
子地址合并单元,用于将基础单元,或所述基础单元和后续的附加单元,合并为一个子地址信息;
子地址识别单元,用于采用偏移量关键词对所述子地址信息的附加单元进行识别,以确定所述子地址信息为精确子地址、模糊子地址或偏移子地址的信息点数据。
11.根据权利要求10所述的装置,其特征在于,短语获取单元具体用于:
基于分词数据库将地址信息进行分词处理,获得具有独立语义的词语;
将词语进行合并处理,获得具有独立地址语义的短语。
12.根据权利要求10所述的装置,其特征在于,子地址识别单元具体用于:
采用偏移量关键词对所述子地址信息的附加单元进行识别;
如果所述子地址信息不包括附加单元,则确定所述子地址信息对应于精确子地址的信息点数据;
如果所述子地址信息包括附加单元,且所述附加单元中包括偏移量,则根据所述子地址信息的基础单元,以及所述附加单元中识别到的偏移量关键词和偏移量,确定所述子地址信息为偏移子地址的信息点数据;
如果所述子地址信息包括附加单元,且所述附加单元中不包括偏移量,则根据所述子地址信息的基础单元,以及所述附加单元中识别到的偏移量关键词,确定所述子地址信息为模糊子地址的信息点数据。
13.根据权利要求10所述的装置,其特征在于,短语匹配单元具体用于:
如果识别到与信息点数据库中的关联区域关键词匹配的短语时,根据所述关联区域关键词,基于信息点数据库中的地理编码规范关键词对当前短语的前序短语进行识别,以获取至少两个关联信息点;
根据至少两个关联信息点和关联区域关键词获取关联区域信息点。
14.根据权利要求10所述的装置,其特征在于,地理编码模块包括:
地址树存储单元,用于将精确子地址、模糊子地址和/或偏移子地址的信息点数据按照预设层级存储为地址树;和/或
地址修正校验单元,用于根据精确子地址的信息点数据进行地理编码,且根据所述模糊子地址和/或偏移子地址的信息点数据对地理编码进行修正或校验;和/或
地址选择单元,用于如果根据精确子地址的信息点数据在数据库中匹配至少两个信息点时,根据所述模糊子地址和/或偏移子地址的信息点数据在所述至少两个信息点中进行选择。
CN201310706024.4A 2013-12-19 2013-12-19 地理编码实现方法和装置 Active CN103699623B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310706024.4A CN103699623B (zh) 2013-12-19 2013-12-19 地理编码实现方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310706024.4A CN103699623B (zh) 2013-12-19 2013-12-19 地理编码实现方法和装置

Publications (2)

Publication Number Publication Date
CN103699623A true CN103699623A (zh) 2014-04-02
CN103699623B CN103699623B (zh) 2017-07-04

Family

ID=50361151

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310706024.4A Active CN103699623B (zh) 2013-12-19 2013-12-19 地理编码实现方法和装置

Country Status (1)

Country Link
CN (1) CN103699623B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104615677A (zh) * 2015-01-20 2015-05-13 同济大学 一种图数据存取方法及系统
CN104899296A (zh) * 2015-06-08 2015-09-09 深圳市华傲数据技术有限公司 复杂地址中多条路径的分析方法
CN105227618A (zh) * 2014-07-04 2016-01-06 中国移动通信集团广东有限公司 一种通信站点位置信息处理方法及系统
CN105320657A (zh) * 2014-05-30 2016-02-10 中国电信股份有限公司 兴趣点数据融合方法和系统
CN105786922A (zh) * 2014-12-25 2016-07-20 高德软件有限公司 一种缺失电子地图数据的确定方法和设备
CN106709065A (zh) * 2017-01-19 2017-05-24 国家电网公司 一种地址信息标准化处理方法及装置
CN106934536A (zh) * 2017-03-01 2017-07-07 广东中建普联科技股份有限公司 建设行业工程量计价清单数据自动编码与识别方法及系统
WO2021189977A1 (zh) * 2020-08-31 2021-09-30 平安科技(深圳)有限公司 地址编码方法、装置、计算机设备及计算机可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100106801A1 (en) * 2008-10-22 2010-04-29 Google, Inc. Geocoding Personal Information
CN101794307A (zh) * 2010-03-02 2010-08-04 光庭导航数据(武汉)有限公司 基于互联网分词思想的车载导航poi搜索引擎
US20120066410A1 (en) * 2009-04-24 2012-03-15 Technische Universiteit Delft Data structure, method and system for address lookup
CN102737060A (zh) * 2011-04-14 2012-10-17 商业对象软件有限公司 地理编码应用中的模糊搜索
CN102867004A (zh) * 2011-07-06 2013-01-09 高德软件有限公司 一种地址匹配的方法及设备
CN102982723A (zh) * 2011-09-06 2013-03-20 上海博路信息技术有限公司 一种基于地理编码的定位方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100106801A1 (en) * 2008-10-22 2010-04-29 Google, Inc. Geocoding Personal Information
US20120066410A1 (en) * 2009-04-24 2012-03-15 Technische Universiteit Delft Data structure, method and system for address lookup
CN101794307A (zh) * 2010-03-02 2010-08-04 光庭导航数据(武汉)有限公司 基于互联网分词思想的车载导航poi搜索引擎
CN102737060A (zh) * 2011-04-14 2012-10-17 商业对象软件有限公司 地理编码应用中的模糊搜索
CN102867004A (zh) * 2011-07-06 2013-01-09 高德软件有限公司 一种地址匹配的方法及设备
CN102982723A (zh) * 2011-09-06 2013-03-20 上海博路信息技术有限公司 一种基于地理编码的定位方法

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105320657A (zh) * 2014-05-30 2016-02-10 中国电信股份有限公司 兴趣点数据融合方法和系统
CN105227618A (zh) * 2014-07-04 2016-01-06 中国移动通信集团广东有限公司 一种通信站点位置信息处理方法及系统
CN105227618B (zh) * 2014-07-04 2018-12-04 中国移动通信集团广东有限公司 一种通信站点位置信息处理方法及系统
CN105786922B (zh) * 2014-12-25 2020-02-14 高德软件有限公司 一种缺失电子地图数据的确定方法和设备
CN105786922A (zh) * 2014-12-25 2016-07-20 高德软件有限公司 一种缺失电子地图数据的确定方法和设备
CN104615677B (zh) * 2015-01-20 2018-02-09 同济大学 一种图数据存取方法及系统
CN104615677A (zh) * 2015-01-20 2015-05-13 同济大学 一种图数据存取方法及系统
CN104899296B (zh) * 2015-06-08 2018-05-29 深圳市华傲数据技术有限公司 复杂地址中多条路径的分析方法
WO2016197533A1 (zh) * 2015-06-08 2016-12-15 深圳市华傲数据技术有限公司 复杂地址中多条路径的分析方法
CN104899296A (zh) * 2015-06-08 2015-09-09 深圳市华傲数据技术有限公司 复杂地址中多条路径的分析方法
CN106709065A (zh) * 2017-01-19 2017-05-24 国家电网公司 一种地址信息标准化处理方法及装置
CN106709065B (zh) * 2017-01-19 2020-08-04 国家电网公司 一种地址信息标准化处理方法及装置
CN106934536A (zh) * 2017-03-01 2017-07-07 广东中建普联科技股份有限公司 建设行业工程量计价清单数据自动编码与识别方法及系统
CN106934536B (zh) * 2017-03-01 2020-08-25 广东中建普联科技股份有限公司 建设行业工程量计价清单数据自动编码与识别方法及系统
WO2021189977A1 (zh) * 2020-08-31 2021-09-30 平安科技(深圳)有限公司 地址编码方法、装置、计算机设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN103699623B (zh) 2017-07-04

Similar Documents

Publication Publication Date Title
CN103699623A (zh) 地理编码实现方法和装置
US7574428B2 (en) Geometry-based search engine for navigation systems
CN107203526B (zh) 一种查询串语义需求分析方法及装置
CN107656913B (zh) 地图兴趣点地址提取方法、装置、服务器和存储介质
CN108363698B (zh) 兴趣点关系识别方法及装置
US8682646B2 (en) Semantic relationship-based location description parsing
CN107590123B (zh) 车载中地点上下文指代消解方法及装置
CN102831121A (zh) 一种网页信息抽取的方法和系统
US9727595B2 (en) Location searching with category indices
TW201107713A (en) Apparatus and method for position determination
CN104615715A (zh) 基于地理位置的社交网络事件分析方法及系统
CN107256230A (zh) 一种基于多元化地理信息点的融合方法
CN110926486A (zh) 一种路线确定方法、装置、设备和计算机存储介质
AU2014228754A1 (en) Non-deterministic disambiguation and matching of business locale data
CN113360789A (zh) 兴趣点数据处理方法、装置、电子设备及存储介质
CN106155998B (zh) 一种数据处理方法及装置
CN103914455A (zh) 一种兴趣点检索方法和装置
CN103714081A (zh) 一种专有地名的识别方法和装置
CN116662583B (zh) 一种文本生成方法、地点检索方法及相关装置
WO2016112054A1 (en) Geocoding multi-entity queries
Liu et al. M: N Object matching on multiscale datasets based on MBR combinatorial optimization algorithm and spatial district
Graser Towards landmark-based instructions for pedestrian navigation systems using OpenStreetMap
CN104462531A (zh) 一种确定查询词是否调用地图接口的方法与系统
JP2008090334A (ja) 所在地解析装置、所在地解析方法及びそのプログラム並びに記録媒体
Xi et al. Improved dynamic time warping algorithm for bus route trajectory curve fitting

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant