CN112836146B - 一种基于网络消息的地理空间坐标信息获取方法及装置 - Google Patents
一种基于网络消息的地理空间坐标信息获取方法及装置 Download PDFInfo
- Publication number
- CN112836146B CN112836146B CN202110255689.2A CN202110255689A CN112836146B CN 112836146 B CN112836146 B CN 112836146B CN 202110255689 A CN202110255689 A CN 202110255689A CN 112836146 B CN112836146 B CN 112836146B
- Authority
- CN
- China
- Prior art keywords
- place name
- coordinate information
- address information
- geographic
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 230000011218 segmentation Effects 0.000 claims abstract description 42
- 238000012545 processing Methods 0.000 claims abstract description 26
- 230000009193 crawling Effects 0.000 claims abstract description 13
- 238000012549 training Methods 0.000 claims description 16
- 230000000694 effects Effects 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 8
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000000611 regression analysis Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 241000588771 Morganella <proteobacterium> Species 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000004080 punching Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Remote Sensing (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种基于网络消息的地理空间坐标信息获取方法及装置。包括:通过网络爬取方式,获取网络消息文本;采用文本分词处理技术,对网络消息文本进行实体词分词处理,并将分词处理后得到的实体词输入至地名分类匹配模型,以通过地名分类匹配模型的分类匹配运算,得到地名地址信息;根据地名地址信息,通过地理编码方式,将地名地址信息转换为地理空间坐标信息。实现了对因不包含地理标记而无法直接得到地理空间坐标信息等网络数据的地理空间坐标信息的获取,解决了现有的基于网络消息的地理空间坐标信息获取成功率低的技术问题。
Description
技术领域
本申请涉及网络信息处理技术领域,尤其涉及一种基于网络消息的地理空间坐标信息获取方法及装置。
背景技术
近几年,随着科技的不断发展,越来越多的地理信息产业渗透到经济社会和人民日常生活的各个领域。尤其是互联网领域,由于互联网有着海量数据,其中大多数采用文本描述。同时,文本描述的事件大多与空间位置信息相关。如2019年疫情背景下,社交媒体公布的病人轨迹信息。目前对网络上的地理空间坐标信息提取方式通常为通过爬虫技术获取网络消息中的地理标记,以根据地理标记解析并提取地理空间坐标信息,但对于不包含地理标记的网络消息则无法提取地理空间坐标信息,导致了现有的基于网络消息的地理空间坐标信息获取成功率低的技术问题。
发明内容
本申请提供了一种基于网络消息的地理空间坐标信息获取方法及装置,用于解决现有的基于网络消息的地理空间坐标信息获取成功率低的技术问题。
本申请第一方面提供了一种基于网络消息的地理空间坐标信息获取方法,包括:
通过网络爬取方式,获取网络消息文本;
通过文本分词处理方式,对所述网络消息文本进行实体词分词处理,并将分词处理后得到的实体词输入至地名分类匹配模型,以通过所述地名分类匹配模型的分类匹配运算,得到地名地址信息,其中,所述地名分类匹配模型为通过预设的地名词典训练集,结合隐马尔可夫模型、Viterbi算法以及AC算法训练得到的;
根据所述地名地址信息,通过地理编码方式,将所述地名地址信息转换为地理空间坐标信息。
优选地,所述将分词处理后得到的实体词输入至地名分类匹配模型之前还包括:
将分词处理后得到的实体词与预设的地名词典信息进行信息匹配,若匹配成功,则输出匹配到的地名地址信息,以通过地理编码方式,将所述地名地址信息转换为地理空间坐标信息,若匹配不成功,则将所述实体词输入至地名分类匹配模型。
优选地,所述根据所述地名地址信息,通过地理编码方式,将所述地名地址信息转换为地理空间坐标信息之后还包括:
若上述步骤未获取到地理空间坐标信息,则根据所述地名地址信息,结合文本来源用户的兴趣点,通过地理加权回归分析方式,计算所述地名地址信息与各个所述兴趣点的莫兰指数,其中,所述文本来源用户为发布所述网络消息文本的用户,所述兴趣点的获取方式为:根据所述文本来源用户的历史地址记录,确定所述文本来源用户的历史活动区域,并以所述历史活动区域内的地名地址信息确定所述兴趣点;
根据莫兰指数计算结果,确定与所述地名地址信息相关度最高的目标兴趣点,以根据所述目标兴趣点的地名地址信息,通过地理编码方式转换为地理空间坐标信息。
优选地,还包括:
获取地图服务,并在所述地图服务中加载所述地理空间坐标信息。
优选地,所述地图服务具体为三维地图服务。
本申请第二方面提供了一种基于网络消息的地理空间坐标信息获取装置,包括:
消息文本爬取单元,用于通过网络爬取方式,获取网络消息文本;
地名信息分类匹配单元,用于通过文本分词处理方式,对所述网络消息文本进行实体词分词处理,并将分词处理后得到的实体词输入至地名分类匹配模型,以通过所述地名分类匹配模型的分类匹配运算,得到地名地址信息,其中,所述地名分类匹配模型为通过预设的地名词典训练集,结合隐马尔可夫模型、Viterbi算法以及AC算法训练得到的;
空间坐标转换单元,用于根据所述地名地址信息,通过地理编码方式,将所述地名地址信息转换为地理空间坐标信息。
优选地,所述将分词处理后得到的实体词输入至地名分类匹配模型之前还包括:
地名匹配单元,用于将分词处理后得到的实体词与预设的地名词典信息进行信息匹配,若匹配成功,则输出匹配到的地名地址信息,以通过地理编码方式,将所述地名地址信息转换为地理空间坐标信息,若匹配不成功,则将所述实体词输入至地名分类匹配模型。
优选地,还包括:地理相关性匹配单元,用于:
若上述步骤未获取到地理空间坐标信息,则根据所述地名地址信息,结合文本来源用户的兴趣点,通过地理加权回归分析方式,计算所述地名地址信息与各个所述兴趣点的莫兰指数,其中,所述文本来源用户为发布所述网络消息文本的用户,所述兴趣点的获取方式为:根据所述文本来源用户的历史地址记录,确定所述文本来源用户的历史活动区域,并以所述历史活动区域内的地名地址信息确定所述兴趣点;
根据莫兰指数计算结果,确定与所述地名地址信息相关度最高的目标兴趣点,以根据所述目标兴趣点的地名地址信息,通过地理编码方式转换为地理空间坐标信息。
优选地,还包括:
地图加载单元,用于获取地图服务,并在所述地图服务中加载所述地理空间坐标信息。
优选地,所述地图服务具体为三维地图服务。
从以上技术方案可以看出,本申请具有以下优点:
本申请提供了一种基于网络消息的地理空间坐标信息获取方法,包括:通过网络爬取方式,获取网络消息文本;通过文本分词处理方式,对所述网络消息文本进行实体词分词处理,并将分词处理后得到的实体词输入至地名分类匹配模型,以通过所述地名分类匹配模型的分类匹配运算,得到地名地址信息,其中,所述地名分类匹配模型为通过预设的地名词典训练集,结合隐马尔可夫模型、Viterbi算法以及AC算法训练得到的;根据所述地名地址信息,通过地理编码方式,将所述地名地址信息转换为地理空间坐标信息。
本申请基于爬虫技术获得的网络数据,通过对网络数据消息文本进行分词处理,再通过所述地名分类匹配模型对实体词的分类匹配运算,进而获得地名地址信息,并将地名地址信息转换成地理空间坐标信息,实现了对因不包含地理标记而无法直接得到地理空间坐标信息等网络数据的地理空间坐标信息的获取,解决了现有的基于网络消息的地理空间坐标信息获取成功率低的技术问题。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本申请提供的一种基于网络消息的地理空间坐标信息获取方法的第一个实施例的流程示意图;
图2为本申请提供的一种基于网络消息的地理空间坐标信息获取方法的第二个实施例的流程示意图;
图3为本申请提供的一种基于网络消息的地理空间坐标信息获取装置的第一个实施例的结构示意图。
具体实施方式
本申请实施例提供了一种基于网络消息的地理空间坐标信息获取方法及装置,用于解决现有的基于网络消息的地理空间坐标信息获取成功率低的技术问题。
为使得本申请的发明目的、特征、优点能够更加的明显和易懂,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本申请一部分实施例,而非全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
请参阅图1,本申请第一个实施例提供了一种基于网络消息的地理空间坐标信息获取方法,包括:
步骤101、通过网络爬取方式,获取网络消息文本。
需要说明的是,本申请实施例首先通过爬虫技术获取感兴趣的信息并存放在本地数据库,对社交文本非结构化信息进行数据解析。该步骤主要是通过对目标社交网站数据进行爬取,针对特定主题获取到感兴趣的信息,并整理成符合要求的数据格式,完成数据的获取、存储、清洗,从而得到待提取地理空间坐标信息的网络消息文本。
步骤102、通过文本分词处理方式,对网络消息文本进行实体词分词处理,并将分词处理后得到的实体词输入至地名分类匹配模型,以通过地名分类匹配模型的分类匹配运算,得到地名地址信息,其中,地名分类匹配模型为通过预设的地名词典训练集,结合隐马尔可夫模型、Viterbi算法以及AC算法训练得到的。
需要说明的是,对于不包含地理标记网络消息文本数据,本实施例通过对文本数据进行分词。对文本中包含的省、市、区/县等数据,与地名词典数据库进行匹配。对于没有在地名词典数据库的词,采用隐马尔可夫模型(Hidden Markov Model,HMM)和Viterbi算法得到粗分词结果。在此基础上,使用AC算法(Aho-Corasick Algorithm)进行匹配,再次采用隐马尔可夫模型得到地名地址信息。
步骤103、根据地名地址信息,通过地理编码方式,将地名地址信息转换为地理空间坐标信息。
最后基于获得的地名地址信息,通过开源的地理编码技术,把地名地址信息转化为地理空间坐标信息,如经纬度坐标。
以上为本申请提供的一种基于网络消息的地理空间坐标信息获取方法的第一个实施例的详细说明,下面为本申请提供的一种基于网络消息的地理空间坐标信息获取方法的第二个实施例的详细说明。
请参阅图2,在上述第一个实施例的基础上,本申请第二个实施例提供了一种基于网络消息的地理空间坐标信息获取方法。
步骤201、通过网络爬取方式,获取网络消息文本。
步骤202、通过文本分词处理方式,对网络消息文本进行实体词分词处理,将分词处理后得到的实体词与预设的地名词典信息进行信息匹配。若匹配成功,则执行步骤203,若匹配不成功,则执行步骤204。
步骤203、输出匹配到的地名地址信息,以通过地理编码方式,将地名地址信息转换为地理空间坐标信息。
本实施例在将实体词输入给地名分类匹配模型进行分类匹配处理之前,还可以先将实体词与预设的地名词典信息进行信息匹配,若能成功匹配出地名地址信息,则可执行步骤根据该地名地址信息,通过地理编码方式,将地名地址信息转换为地理空间坐标信息,若未能匹配成功,则继续执行步骤204。
步骤204、将分词处理后得到的实体词输入至地名分类匹配模型,以通过地名分类匹配模型的分类匹配运算,得到地名地址信息,其中,地名分类匹配模型为通过预设的地名词典训练集,结合隐马尔可夫模型、Viterbi算法以及AC算法训练得到的。
本实施例步骤204与第一个实施例的步骤102对应,在此不再对本步骤赘述。
步骤205、根据地名地址信息,通过地理编码方式,将地名地址信息转换为地理空间坐标信息。
步骤206、若上述步骤未获取到地理空间坐标信息,则根据地名地址信息,结合文本来源用户的兴趣点,通过地理加权回归分析方式,计算地名地址信息与各个兴趣点的莫兰指数,其中,文本来源用户为发布网络消息文本的用户,兴趣点的获取方式为:根据文本来源用户的历史地址记录,确定文本来源用户的历史活动区域,并以历史活动区域内的地名地址信息确定兴趣点;
步骤207、根据莫兰指数计算结果,确定与地名地址信息相关度最高的目标兴趣点,以根据目标兴趣点的地名地址信息,通过地理编码方式转换为地理空间坐标信息。
如果通过步骤204和205,仍未获取到有效的地址地名信息。则基于分词得到的实体此,进行兴趣点(如:机构名称、地标等)POI搜索。具体为通过文本提供者的注册地、社交文本历史记录涉及的地理标记、实体地名、兴趣点等进行地理相关性排名,选择相关性最高的记录。其中,地理相关性排名是基于地理学第一定律,从地理学角度分析数据与指标的紧密程度,考虑目标与搜索结果的相关性。用户的活动具备一定区域性,存在较大概率活动在注册地、或者多次提到的历史记录地址附近。其多次打卡的实体地名,也是可靠的活动范围。针对选定的上述内容为指标,通过地理加权回归分析,根据莫兰指数衡量相关性。同样是通过开源的地理编码技术,把地名地址信息转化为空间坐标信息。
如果经过步骤207之后,仍未获取到空间坐标信息,则标记为未知,把有实际意义的实体存放在待确认地名数据库,下次出现同名实体,则有望可以匹配。
步骤208、获取地图服务,并在地图服务中加载地理空间坐标信息。
基于地理空间坐标信息,本实施例还可以进一步将该地理空间坐标信息加载进二维地图或三维地图中,并根据地形做贴地处理,实现基于模拟地貌的渲染,并展示文本详情信息。
以上为本申请提供的一种基于网络消息的地理空间坐标信息获取方法的第二个实施例的详细说明,下面为本申请提供的一种基于网络消息的地理空间坐标信息获取装置的一个实施例的详细说明。
请参阅图3,本申请第二方面提供了一种基于网络消息的地理空间坐标信息获取装置,包括:
消息文本爬取单元301,用于通过网络爬取方式,获取网络消息文本;
地名信息分类匹配单元302,用于通过文本分词处理方式,对网络消息文本进行实体词分词处理,并将分词处理后得到的实体词输入至地名分类匹配模型,以通过地名分类匹配模型的分类匹配运算,得到地名地址信息,其中,地名分类匹配模型为通过预设的地名词典训练集,结合隐马尔可夫模型、Viterbi算法以及AC算法训练得到的;
空间坐标转换单元303,用于根据地名地址信息,通过地理编码方式,将地名地址信息转换为地理空间坐标信息。
进一步地,将分词处理后得到的实体词输入至地名分类匹配模型之前还包括:
地名匹配单元300,用于将分词处理后得到的实体词与预设的地名词典信息进行信息匹配,若匹配成功,则输出匹配到的地名地址信息,以通过地理编码方式,将地名地址信息转换为地理空间坐标信息,若匹配不成功,则将实体词输入至地名分类匹配模型。
进一步地,还包括:地理相关性匹配单元304,用于:
若上述步骤未获取到地理空间坐标信息,则根据地名地址信息,结合文本来源用户的兴趣点,通过地理加权回归分析方式,计算地名地址信息与各个兴趣点的莫兰指数,其中,文本来源用户为发布网络消息文本的用户,兴趣点的获取方式为:根据文本来源用户的历史地址记录,确定文本来源用户的历史活动区域,并以历史活动区域内的地名地址信息确定兴趣点;
根据莫兰指数计算结果,确定与地名地址信息相关度最高的目标兴趣点,以根据目标兴趣点的地名地址信息,通过地理编码方式转换为地理空间坐标信息。
进一步地,还包括:
地图加载单元305,用于获取地图服务,并在地图服务中加载地理空间坐标信息。
进一步地,地图服务具体为三维地图服务。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
本申请的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例,例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (8)
1.一种基于网络消息的地理空间坐标信息获取方法,其特征在于,包括:
通过网络爬取方式,获取网络消息文本;
通过文本分词处理方式,对所述网络消息文本进行实体词分词处理,并将分词处理后得到的实体词输入至地名分类匹配模型,以通过所述地名分类匹配模型的分类匹配运算,得到地名地址信息,其中,所述地名分类匹配模型为通过预设的地名词典训练集,结合隐马尔可夫模型、Viterbi算法以及AC算法训练得到的;
根据所述地名地址信息,通过地理编码方式,将所述地名地址信息转换为地理空间坐标信息;
若上述步骤未获取到地理空间坐标信息,则根据所述地名地址信息,结合文本来源用户的兴趣点,通过地理加权回归分析方式,计算所述地名地址信息与各个所述兴趣点的莫兰指数,其中,所述文本来源用户为发布所述网络消息文本的用户,所述兴趣点的获取方式为:根据所述文本来源用户的历史地址记录,确定所述文本来源用户的历史活动区域,并以所述历史活动区域内的地名地址信息确定所述兴趣点;
根据莫兰指数计算结果,确定与所述地名地址信息相关度最高的目标兴趣点,以根据所述目标兴趣点的地名地址信息,通过地理编码方式转换为地理空间坐标信息。
2.根据权利要求1所述的一种基于网络消息的地理空间坐标信息获取方法,其特征在于,所述将分词处理后得到的实体词输入至地名分类匹配模型之前还包括:
将分词处理后得到的实体词与预设的地名词典信息进行信息匹配,若匹配成功,则输出匹配到的地名地址信息,以通过地理编码方式,将所述地名地址信息转换为地理空间坐标信息,若匹配不成功,则将所述实体词输入至地名分类匹配模型。
3.根据权利要求1至2任意一项所述的一种基于网络消息的地理空间坐标信息获取方法,其特征在于,还包括:
获取地图服务,并在所述地图服务中加载所述地理空间坐标信息。
4.根据权利要求3所述的一种基于网络消息的地理空间坐标信息获取方法,其特征在于,所述地图服务具体为三维地图服务。
5.一种基于网络消息的地理空间坐标信息获取装置,其特征在于,包括:
消息文本爬取单元,用于通过网络爬取方式,获取网络消息文本;
地名信息分类匹配单元,用于通过文本分词处理方式,对所述网络消息文本进行实体词分词处理,并将分词处理后得到的实体词输入至地名分类匹配模型,以通过所述地名分类匹配模型的分类匹配运算,得到地名地址信息,其中,所述地名分类匹配模型为通过预设的地名词典训练集,结合隐马尔可夫模型、Viterbi算法以及AC算法训练得到的;
空间坐标转换单元,用于根据所述地名地址信息,通过地理编码方式,将所述地名地址信息转换为地理空间坐标信息;
还包括:地理相关性匹配单元,用于:
若上述步骤未获取到地理空间坐标信息,则根据所述地名地址信息,结合文本来源用户的兴趣点,通过地理加权回归分析方式,计算所述地名地址信息与各个所述兴趣点的莫兰指数,其中,所述文本来源用户为发布所述网络消息文本的用户,所述兴趣点的获取方式为:根据所述文本来源用户的历史地址记录,确定所述文本来源用户的历史活动区域,并以所述历史活动区域内的地名地址信息确定所述兴趣点;
根据莫兰指数的计算结果,确定与所述地名地址信息相关度最高的目标兴趣点,以根据所述目标兴趣点的地名地址信息,通过地理编码方式转换为地理空间坐标信息。
6.根据权利要求5所述的一种基于网络消息的地理空间坐标信息获取装置,其特征在于,所述将分词处理后得到的实体词输入至地名分类匹配模型之前还包括:
地名匹配单元,用于将分词处理后得到的实体词与预设的地名词典信息进行信息匹配,若匹配成功,则输出匹配到的地名地址信息,以通过地理编码方式,将所述地名地址信息转换为地理空间坐标信息,若匹配不成功,则将所述实体词输入至地名分类匹配模型。
7.根据权利要求5至6任意一项所述的一种基于网络消息的地理空间坐标信息获取装置,其特征在于,还包括:
地图加载单元,用于获取地图服务,并在所述地图服务中加载所述地理空间坐标信息。
8.根据权利要求7所述的一种基于网络消息的地理空间坐标信息获取装置,其特征在于,所述地图服务具体为三维地图服务。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110255689.2A CN112836146B (zh) | 2021-03-09 | 2021-03-09 | 一种基于网络消息的地理空间坐标信息获取方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110255689.2A CN112836146B (zh) | 2021-03-09 | 2021-03-09 | 一种基于网络消息的地理空间坐标信息获取方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112836146A CN112836146A (zh) | 2021-05-25 |
CN112836146B true CN112836146B (zh) | 2024-05-14 |
Family
ID=75929906
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110255689.2A Active CN112836146B (zh) | 2021-03-09 | 2021-03-09 | 一种基于网络消息的地理空间坐标信息获取方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112836146B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113673240B (zh) * | 2021-07-30 | 2023-07-04 | 中国地质大学(武汉) | 综合空间实体关系推断文本地理位置的方法和存储介质 |
CN114201579A (zh) * | 2021-11-17 | 2022-03-18 | 佛山市宏图数据有限公司 | 一种基于人工智能的报警定位方法 |
CN116258141B (zh) * | 2023-05-16 | 2023-09-26 | 青岛海信网络科技股份有限公司 | 一种文本数据的处理方法、服务器及装置 |
Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101110080A (zh) * | 2007-08-21 | 2008-01-23 | 北京大学 | 一种网络地图服务中未登录地名的定位方法 |
CN102253972A (zh) * | 2011-06-14 | 2011-11-23 | 南京师范大学 | 基于网络爬虫的地名数据库维护方法 |
CN104794151A (zh) * | 2015-01-30 | 2015-07-22 | 北京东方泰坦科技股份有限公司 | 一种基于协同标绘技术的空间知识服务系统建设方法 |
CN105160192A (zh) * | 2015-09-17 | 2015-12-16 | 浙江大学 | 基于M5-Local的TRMM卫星降雨数据降尺度方法 |
CN105404686A (zh) * | 2015-12-10 | 2016-03-16 | 湖南科技大学 | 一种基于地理特征层次分词的新闻事件地名地址匹配方法 |
CN105848253A (zh) * | 2016-04-28 | 2016-08-10 | 努比亚技术有限公司 | 一种智能搜网方法、装置和移动终端 |
CN107145577A (zh) * | 2017-05-08 | 2017-09-08 | 上海东方网络金融服务有限公司 | 地址标准化方法、装置、存储介质及计算机 |
CN109117439A (zh) * | 2018-07-13 | 2019-01-01 | 中南大学 | 顾及案发时间不确定性的公安事件时空同现模式挖掘方法 |
CN109145169A (zh) * | 2018-07-26 | 2019-01-04 | 浙江省测绘科学技术研究院 | 一种基于统计分词的地址匹配方法 |
CN110377686A (zh) * | 2019-07-04 | 2019-10-25 | 浙江大学 | 一种基于深度神经网络模型的地址信息特征抽取方法 |
CN111026787A (zh) * | 2019-11-22 | 2020-04-17 | 中国银行股份有限公司 | 网点检索方法、装置及系统 |
CN111460003A (zh) * | 2020-04-04 | 2020-07-28 | 南京国准数据有限责任公司 | 基于城市群尺度探测土地利用与地表温度耦合关系的方法 |
CN111767476A (zh) * | 2020-05-25 | 2020-10-13 | 江苏省测绘工程院 | 一种基于hmm模型的智慧城市时空大数据空间化引擎构建方法 |
CN111783454A (zh) * | 2020-06-30 | 2020-10-16 | 北京百度网讯科技有限公司 | 地理信息的识别与录入方法及设备、电子设备和介质 |
WO2020228706A1 (zh) * | 2019-05-15 | 2020-11-19 | 腾讯科技(深圳)有限公司 | 基于围栏地址的坐标数据处理方法、装置和计算机设备 |
CN111985421A (zh) * | 2020-08-25 | 2020-11-24 | 兰州交通大学 | 基于地理加权回归模型的耕地田坎系数估算方法及装置 |
CN112288247A (zh) * | 2020-10-20 | 2021-01-29 | 浙江大学 | 一种基于空间交互关系的土壤重金属风险识别方法 |
CN112365391A (zh) * | 2020-11-12 | 2021-02-12 | 河北工程大学 | 一种基于“国土调查”数据的用地多样性计量方法 |
-
2021
- 2021-03-09 CN CN202110255689.2A patent/CN112836146B/zh active Active
Patent Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101110080A (zh) * | 2007-08-21 | 2008-01-23 | 北京大学 | 一种网络地图服务中未登录地名的定位方法 |
CN102253972A (zh) * | 2011-06-14 | 2011-11-23 | 南京师范大学 | 基于网络爬虫的地名数据库维护方法 |
CN104794151A (zh) * | 2015-01-30 | 2015-07-22 | 北京东方泰坦科技股份有限公司 | 一种基于协同标绘技术的空间知识服务系统建设方法 |
CN105160192A (zh) * | 2015-09-17 | 2015-12-16 | 浙江大学 | 基于M5-Local的TRMM卫星降雨数据降尺度方法 |
CN105404686A (zh) * | 2015-12-10 | 2016-03-16 | 湖南科技大学 | 一种基于地理特征层次分词的新闻事件地名地址匹配方法 |
CN105848253A (zh) * | 2016-04-28 | 2016-08-10 | 努比亚技术有限公司 | 一种智能搜网方法、装置和移动终端 |
CN107145577A (zh) * | 2017-05-08 | 2017-09-08 | 上海东方网络金融服务有限公司 | 地址标准化方法、装置、存储介质及计算机 |
CN109117439A (zh) * | 2018-07-13 | 2019-01-01 | 中南大学 | 顾及案发时间不确定性的公安事件时空同现模式挖掘方法 |
CN109145169A (zh) * | 2018-07-26 | 2019-01-04 | 浙江省测绘科学技术研究院 | 一种基于统计分词的地址匹配方法 |
WO2020228706A1 (zh) * | 2019-05-15 | 2020-11-19 | 腾讯科技(深圳)有限公司 | 基于围栏地址的坐标数据处理方法、装置和计算机设备 |
CN110377686A (zh) * | 2019-07-04 | 2019-10-25 | 浙江大学 | 一种基于深度神经网络模型的地址信息特征抽取方法 |
CN111026787A (zh) * | 2019-11-22 | 2020-04-17 | 中国银行股份有限公司 | 网点检索方法、装置及系统 |
CN111460003A (zh) * | 2020-04-04 | 2020-07-28 | 南京国准数据有限责任公司 | 基于城市群尺度探测土地利用与地表温度耦合关系的方法 |
CN111767476A (zh) * | 2020-05-25 | 2020-10-13 | 江苏省测绘工程院 | 一种基于hmm模型的智慧城市时空大数据空间化引擎构建方法 |
CN111783454A (zh) * | 2020-06-30 | 2020-10-16 | 北京百度网讯科技有限公司 | 地理信息的识别与录入方法及设备、电子设备和介质 |
CN111985421A (zh) * | 2020-08-25 | 2020-11-24 | 兰州交通大学 | 基于地理加权回归模型的耕地田坎系数估算方法及装置 |
CN112288247A (zh) * | 2020-10-20 | 2021-01-29 | 浙江大学 | 一种基于空间交互关系的土壤重金属风险识别方法 |
CN112365391A (zh) * | 2020-11-12 | 2021-02-12 | 河北工程大学 | 一种基于“国土调查”数据的用地多样性计量方法 |
Non-Patent Citations (1)
Title |
---|
规则匹配和深度学习结合的文本空间信息识别及定位;何小波等;地理信息世界;第27卷(第5期);121-128 * |
Also Published As
Publication number | Publication date |
---|---|
CN112836146A (zh) | 2021-05-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112836146B (zh) | 一种基于网络消息的地理空间坐标信息获取方法及装置 | |
Fan et al. | A polygon-based approach for matching OpenStreetMap road networks with regional transit authority data | |
Vu et al. | Travel diaries analysis by sequential rule mining | |
Zhang et al. | The Traj2Vec model to quantify residents’ spatial trajectories and estimate the proportions of urban land-use types | |
Elwood | Geographic information science: Emerging research on the societal implications of the geospatial web | |
Lin et al. | Uncertainty analysis of crowd-sourced and professionally collected field data used in species distribution models of Taiwanese moths | |
US20110208425A1 (en) | Mining Correlation Between Locations Using Location History | |
CN102591867A (zh) | 一种基于移动设备位置的搜索服务方法 | |
Xu et al. | Tourism geography through the lens of time use: A computational framework using fine-grained mobile phone data | |
WO2023178971A1 (zh) | 就医的互联网挂号方法、装置、设备及存储介质 | |
CN110309432B (zh) | 基于兴趣点的同义词确定方法、地图兴趣点处理方法 | |
Sun et al. | Aligning geographic entities from historical maps for building knowledge graphs | |
Camacho et al. | Sentiment mapping: point pattern analysis of sentiment classified Twitter data | |
CN111460327A (zh) | 兴趣地搜索方法及装置、存储介质、计算机设备 | |
Shah et al. | Geocoding for public health research: Empirical comparison of two geocoding services applied to Canadian cities | |
CN102930048A (zh) | 使用参考和视觉数据的语义自动发现的数据丰富 | |
Twaroch et al. | Investigating behavioural and computational approaches for defining imprecise regions | |
Choe et al. | Identifying tourist spatial and temporal patterns using GPS and sequence alignment method | |
Amanda et al. | Analysis of tourists preferences on smart tourism in Yogyakarta (Case: Vredeburg Fort Museum) | |
Lansley et al. | Challenges to representing the population from new forms of consumer data | |
Dorman et al. | How does socio-economic and demographic dissimilarity determine physical and virtual segregation? | |
Rashidian et al. | EaserGeocoder: integrative geocoding with machine learning (demo paper) | |
Huck et al. | Fuzzy Bayesian inference for mapping vague and place-based regions: a case study of sectarian territory | |
CN113704373A (zh) | 基于移动轨迹数据的用户识别方法、装置及存储介质 | |
Hamzei et al. | Templates of generic geographic information for answering where-questions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |