CN104077322A - 基于问题的地理信息挖掘方法及系统 - Google Patents

基于问题的地理信息挖掘方法及系统 Download PDF

Info

Publication number
CN104077322A
CN104077322A CN201310108951.6A CN201310108951A CN104077322A CN 104077322 A CN104077322 A CN 104077322A CN 201310108951 A CN201310108951 A CN 201310108951A CN 104077322 A CN104077322 A CN 104077322A
Authority
CN
China
Prior art keywords
information
title
address
map
city
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310108951.6A
Other languages
English (en)
Inventor
谢双宾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201310108951.6A priority Critical patent/CN104077322A/zh
Publication of CN104077322A publication Critical patent/CN104077322A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Remote Sensing (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于问题的地理信息挖掘方法,该方法包括以下步骤:初始化兴趣点词典、城市名称词典和IP地址与城市名称的映射词典信息;接收用户提交的问题并获取用户的IP地址信息;从所述问题或/和IP地址信息中挖掘所述问题对应的词典项信息;基于所述对应的词典项信息访问地图的位置接口,并获得该接口所返回的地图数据列表;根据所获得的地图数据列表,请求地图地址解析接口进行解析,获取上层地理信息;返回所述上层地理信息。相应地,还提供了一种基于问题的地理信息挖掘系统。本发明提供的方法和系统可以有效地挖掘问题中的地理信息。

Description

基于问题的地理信息挖掘方法及系统
技术领域
本发明涉及互联网应用技术,尤其涉及一种基于问题的地理信息挖掘的方法及系统。
背景技术
现有的地理信息挖掘大多是基于GPS定位、IP地址解析等技术进行,
而通过网络互动平台挖掘地理信息却一直是地理信息挖掘领域的空白。事实上,在现有的网络互动问答平台上流动着大量的地理信息,如用户经常利用百度知道、搜搜问问、新浪爱问等平台提问一些与地理信息有关的问题:“索尼a型号的照相机在北京中关村的售价是多少”、“王府井附近的就餐消费平均在什么水平”等。在这些问题中,存在“北京中关村”、“王府井”等地理信息,而这些地理信息并没有在网络互动问答平台得到较好的应用。
另外,在网络互动平台的问题推送平台上,一直存在如下问题:对于系统推送的问题,由于地理位置的原因,导致接收问题的用户无法解答。例如,某用户虽然对电子产品很感兴趣,但是系统给用户推送的问题及相关解答信息包括“IPad3在长沙的售价是多少?”、“目前在长沙的售价是2599元”,事实上,由于该用户居住在北京,所推送的问题及解答信息对于该用户来说不具有实用价值,如此,降低了用户的互动体验。
因此,希望可以提出一种用于解决上述缺陷的基于问题的地理信息挖掘方法及系统。
发明内容
本发明的目的是提供一种基于问题的地理信息挖掘方法及系统,可以有效挖掘出问题中的地理信息。
根据本发明的一个方面,提供了一种基于问题的地理信息挖掘方法,该方法包括以下步骤:
初始化兴趣点词典、城市名称词典和IP(网际协议,Internet Protocol)地址与城市名称的映射词典信息;
接收用户提交的问题并获取用户的IP地址信息;
从所述问题或IP地址信息中挖掘所述问题对应的词典项信息;
基于所述对应的词典项信息访问地图的位置接口,并获得该接口所返回的地图数据列表;
根据所获得的地图数据列表,请求地图地址解析接口进行解析,获取上层地理信息;
返回所述上层地理信息。
根据本发明的另一个方面,还提供了一种基于问题的地理信息挖掘系统,包括:
初始化模块,用于初始化兴趣点词典、城市名称词典和IP地址与城市名称的映射词典信息;
信息接收模块,用于接收用户提交的问题并获取用户的IP地址信息;
词典信息挖掘模块,用于从所述问题或IP地址信息中挖掘所述问题对应的词典项信息;
第一接口访问模块,基于所述对应的词典项信息访问地图位置接口,并获取该接口所返回的地图数据列表;
第二接口访问模块,基于所获取的地图数据列表,请求地图地址解析接口进行解析,并获取上层地理信息;
信息返回模块,用于返回所述上层地理信息;
其中,所述地图位置接口,用于获取地图数据列表;
其中,所述地图地址解析接口,用于解析地图数据列表中的信息。
与现有技术相比,本发明具有以下优点:不仅可以基于海量的问题挖掘出相应的地理信息,还可以将所挖掘的地理信息推送给适合的用户,提升了用户获取适当问题的体验。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为根据本发明的基于问题的地理信息挖掘的方法流程图;
图2是根据本发明的一个优选实施例的挖掘词典项信息的示意图;
图3是根据本发明一个实施例的基于地图的地址解析接口获取的地理信息示意图;
图4为根据本发明的基于问题的地理信息挖掘系统的示意性框图。
具体实施方式
下面结合附图对本发明作进一步详细描述。
根据本发明的一个方面,提供了一种基于问题的地理信息挖掘的方法。
请参考图1,图1为根据本发明的基于问题的地理信息挖掘的方法流程图。
如图1所示,本发明所提供的方法包括以下步骤:
步骤S101,初始化兴趣点词典、城市名称词典以及IP地址与城市名称的映射词典信息。
具体地,兴趣点(Point of interest,简写POI)是应用于导航电子地图中的常用术语,用以标注电子地图上对应实体的各类生活信息,包括银行、餐饮、住宿、交通等。例如,在大中型城市的主要商业街上常有一些购物广场,而购物广场具有许多可以标注的兴趣点,如A购物中心的二楼有法式咖餐厅,B购物中心的五楼有万达电影院、招商银行等。这些兴趣点在不同的地图上以不同的形式予以展示,常见的二维电子地图以点的形式标注兴趣点。
其中,兴趣点词典,即所有兴趣点信息的集合。而兴趣点词典的初始化,即通过从电子地图获取并加载兴趣点信息,例如,基于电子导航地图获取电子导航地图中兴趣点的名称、兴趣点位于地图上的位置以及兴趣点的周边详细信息。
其中,城市名称词典是各城市名称的集合,包括省级、地级以及县级城市的名称,常见的如上海、北京、香港。由此,对城市名称词典的初始化即加载所有的城市名称。
其中,IP地址与城市名称的映射词典是指IP地址与城市名称的映射关系的集合,如IP地址段A-B与城市M相对应,IP地址段F-H与城市N相对应。与上述同理,IP地址与城市名称映射词典的初始化即加载现有IP地址与城市之间的映射关系。
进一步地,IP地址与城市名称之间的映射词典可以基于以下步骤予以建立:首先,从IP地址信息库中查询IP地址所对应的物理所在地信息;其次,根据物理所在地信息查询所对应的城市名称;最后,加载IP地址与对应城市名称的映射数据,并集合成IP地址与城市名称之间的映射词典。
步骤S102,接收用户提交的问题并获取用户的IP地址信息。
具体地,用户可以提交各种各样的问题,这些问题可以包含地理信息,也可以不包含地理信息,例如“请问立水桥附近有大型商场吗?”、“请问杜鹃花有哪些品种”。一般地,所有问题包括问题标题、内容、回答等项目。例如,A问题包括问题标题“天通苑地铁站在几号线”、问题内容“天通苑地铁站在几号线,有人知道吗”、回答“在五号线上”。进一步地,提交问题的用户在问题提交前,可以注册信息,也可以跳过该步骤。如果用户注册信息,则其中的信息通常可以包含诸如户籍、工作地、居住地等属性信息,而这些属性信息经过分析可以用于后续对IP地址信息的调整。
在接收用户提交的各种问题时,基于用户的网络信息获取其IP地址信息,在该获取过程中通常涉及域名解析、地址匹配等技术,并且,在用户的IP地址动态变化的情况下,对所获取的IP地址信息进行实时更新。
步骤S103,从所述问题或IP地址信息中挖掘所述问题对应的词典项信息。
具体地,所述词典项信息是指兴趣点词典、城市名称词典以及IP地址与城市名称的映射词典中各项具体信息,包括兴趣点名称(又称兴趣词)、城市名称、IP地址与城市的映射关系,如招商银行、北京、IP地址123.112.65.0与北京之间的映射关系。
从所述问题或IP地址信息中挖掘所述问题对应的词典项信息,还可以参照图2,图2是根据本发明的一个优选实施例的挖掘词典项信息的示意图,如图所示,具体包括:
步骤S201,判断所接收问题的标题是否包含城市名称信息,如果是,则直接从问题的标题中挖掘该名称信息,并进入步骤S203;如果否,则进入步骤S202,基于上述已获取的IP地址信息以及已初始化完毕的IP地址与城市名称的映射词典,从该映射词典中挖掘相匹配的城市名称。例如,判断所接收的问题标题“请问北京的消费有多高”中包含了“北京”,则直接从该标题中挖掘城市名称“北京”;又如,所接收的问题标题为“请问肯德基最近有什么优惠活动”,因该问题标题不包含城市名称信息,则基于上述步骤所获知的IP地址以及已初始化的IP地址与映射词典,挖掘与之相匹配的城市名称。
优选地,通过词表匹配的方式从问题标题中挖掘城市名称信息,具体可以包括以下步骤:1)建立城市名称词表库,并将词表库中的词按照一定分类标准划分为多个词表,所述分类标准可以为行政区划标准;2)提取问题标题中的词,调用词表库中与所提取的词相对应的词表;3)将所提取的词与对应的词表进行检索匹配,返回所匹配的结果。
步骤S203,挖掘地理词和兴趣点信息。挖掘前,对所述问题的标题进行分词和词性标注。其中,分词的作用是将获取的问题标题切分成有意义的字词,以便后续处理。具体分词的方法包括:正向匹配分词、反向匹配分词、正向反向匹配分词、基于全切分词图的分词、最大熵马尔科夫模型分词、最大熵分词或条件随机场分词等,例如,将问题标题“中关村附近的肯德基具体位置”通过分词,得到“中关村/附近/的/肯德基/具体/位置”,
在此基础上,对上述分词后的结果进行词性标注,如中关村—名词,附近—形容词,的—助词,肯德基—名词等。
对问题的标题分词完毕后,从所切分的关键词中挖掘地理词,如果一个标题中存在多个地理词,则优选第一个地理词作为所挖掘的地理词结果;否则,如果所述标题中不存在地理词,则默认所挖掘的地理词结果为空值。
进一步地,从问题的标题中挖掘兴趣点信息。优选地,通过多模匹配的方式,使用兴趣点词典,从问题标题中挖掘兴趣点信息,例如挖掘兴趣点名称。其中,多模匹配涉及的算法包括哈希(Hash)算法、单词查找树(Trie树)、KMP(D.E.Knuth与V.R.Pratt和J.H.Morris同时发现的)字符串匹配算法和AC(Alfred V.Aho和Margaret J.Corasick提出的)算法等。挖掘中,如果一个问题标题中存在多个兴趣点名称,则优选第一个兴趣点名称作为所挖掘的兴趣点信息结果,否则,如果所述标题中不存在兴趣点信息,则默认所挖掘的兴趣点信息结果为空值。
当从所述标题既不能挖掘出地理词,也不能挖掘出兴趣点信息时,则默认所挖掘的两项值都为空。
步骤S104,基于所述对应的词典项信息访问地图的位置接口,并获得该接口所返回的地图数据列表。
具体地,根据上述步骤获取诸如城市名称、地理词和兴趣点信息的词典项后,访问地图的位置(Place)接口,并获得该接口返回的数据列表。其中,所述位置接口是对外开放的地图应用接口(API),供程序调用的地图检索服务接口,通常对外开放,并且,该接口可以应用于PC端、移动设备端和服务端等。其中,所返回的数据列表中的每一项包括兴趣点的地址、标题、经度和纬度,如中关村大厦、肯德基、39.9°、116.3°。
进一步地,将数据列表中第一项的兴趣点标题与步骤S103中所挖掘的兴趣点名称进行比较,若两者相同,则确认该项数据是所需的数据,否则,默认该数据列表返回的为空值。
步骤S105,根据所获得的地图数据列表,请求地图地址解析接口进行解析,获取上层地理信息并返回。
具体地,根据步骤S104获得的地图数据列表,请求地图地址解析接口进行解析。例如,根据所获得的地图数据列表中的经纬度信息,请求地图地址解析(geocoder)接口进行解析,得到上层地理信息。其中,所述上层地理信息包括兴趣点对应的省、市、区县、街道以及商圈等地理信息。关于解析到的上层地理信息,具体可以参照图3,图3是根据本发明一个实施例的基于地图的地址解析接口获取的地理信息示意图。如图3,其示出了上层地理信息的一个实例:纬度30.94093、经度117.8、省份—安徽省、市—铜陵、区—铜管山、街道—育才路、城市编码—337。
其中,所述地址解析接口为地图向外发布的API接口。
经过地址解析接口获取上层地理信息后,将该信息返回。进一步地,基于所述上层地理信息,生成问题的地理标签,并将问题按照地理信息予以分类展示在前端,有助于用户查看与地理位置相关的问题。例如,将其中都含有地理信息A的问题都分类在地理标签A下,以便于用户查看与地理信息A有关的问题。
进一步地,本方法还包括:基于所挖掘的地理信息,将相应问题推送给用户。
具体地,基于所挖掘的地理信息,获知用户所在的地理位置后,自动地筛选出与该地理位置及用户所提问题最相关、最相近的问题,并将该筛选的问题推送给所述用户。例如,用户提交的问题是“中关村地铁站怎么走?”,而基于上述步骤获知所提问题的用户相关地理信息,经过对问题进行筛选,得到与该问题及用户地理信息最相关和最相近的问题包括:“中关村地铁站在哪”、“中关村鼎好大厦附近有地铁吗”等,将这些所得到的问题以问题列表的形式推送给所述用户。当然,在此并不对所推送的问题列表的显示方式作限制,根据实际应用需求确定即可。
与现有技术相比,本发明所提供的基于问题的地理信息挖掘方法具有以下优点:
1)有效地挖掘出互动问答平台的地理信息,提高了互动平台的信息利用率;
2)灵活地给问题打上地理信息的标签,有助于用户查看与不同地理位置相关的问题;
3)将所挖掘的地理信息作为一种特征,用于推送待解决的问题给感兴趣的人,提升问题的回答满意度。
根据本发明的另一个方面,还提供了一种基于问题的地理信息挖掘系统。
请参考图4所示,图4为根据本发明的基于问题的地理信息挖掘系统的示意性框图。根据图4,该系统包括:
初始化模块401,用于初始化兴趣点词典、城市名称词典和IP地址与城市名称的映射词典信息;
信息接收模块402,用于接收用户提交的问题并获取用户的IP地址信息;
词典信息挖掘模块403,用于从所述问题或IP地址信息中挖掘所述问题对应的词典项信息;
第一接口访问模块404,基于所述对应的词典项信息访问地图位置接口,并获取该接口所返回的地图数据列表;
第二接口访问模块405,基于所获取的地图数据列表,请求地图地址解析接口进行解析,并获取上层地理信息;
信息返回模块406,用于返回所述上层地理信息;
其中,所述地图位置接口,用于获取地图数据列表;
其中,所述地图地址解析接口,用于解析地图数据列表中的信息。
下文将对上述各模块的具体工作流程进行详述。
具体地,初始化模块401初始化的对象包括兴趣点词典、城市名称词典以及IP地址与城市名称的映射词典等信息,对这些词典进行初始化实际上是加载原始的数据到这些词典中。例如,在兴趣点词典中加载各类兴趣点信息,包括银行、餐饮、住宿、交通等各类生活信息;在城市名称词典中加载各类城市名称,包括省级、地级、县级等各级的城市名称,常见的如上海、北京、纽约;在IP地址与城市名称的映射词典中加载诸IP地址与城市名称之间的映射关系数据。
初始化所有词典信息后,由信息接收模块402接收用户提交的各种问题,例如“请问立水桥附近有大型商场吗?”、“请问杜鹃花有哪些品种”等,这些问题可以包含地理信息,也可以不包含地理信息。当然,在接收问题的同时,信息接收模块402进一步获取所提交问题的用户IP地址信息,该获取的过程具体涉及域名解析、地址匹配等技术,并且,在用户的IP地址动态变化的情况下,对所获取的IP地址信息进行实时更新。
进一步地,所述接收模块还用于接收用户提交的注册信息,如户籍、工作地、居住地等属性信息,这些属性信息可作为后续对IP地址信息进行调整的参考项。
接着,由词典信息挖掘模块403基于上述已接收的问题及获取的IP地址信息,从中挖掘各词典项信息,包括兴趣点名称、城市名称、IP地址与城市的映射关系,如招商银行、北京、IP地址123.112.65.0与北京之间的映射关系。所述词典信息挖掘模块403的具体挖掘过程包括:
a)判断所接收问题的标题是否包含城市名称信息,如果有,则直接从问题的标题中挖掘该名称信息;如果否,则基于上述已获取的IP地址信息以及已初始化完毕的IP地址与城市名称的映射词典,从该映射词典中挖掘相匹配的城市名称。例如,判断所接收的问题标题“请问北京的消费有多高”中包含了“北京”,则直接从该标题中挖掘城市名称“北京”;又如,所接收的问题标题为“请问肯德基最近有什么优惠活动”,因该问题标题不包含城市名称信息,则基于上述步骤所获知的IP地址以及已初始化的IP地址与映射词典,挖掘与之相匹配的城市名称。
优选地,所述词典信息挖掘模块403通过词表匹配的方式从问题标题中挖掘城市名称信息,具体可以包括以下步骤:1)建立城市名称词表库,并将词表库中的词按照一定分类标准划分为多个词表,所述分类标准可以为行政区划标准;2)提取问题标题中的词,调用词表库中与所提取的词相对应的词表;3)将所提取的词与对应的词表进行检索匹配,返回所匹配的结果。
b)挖掘地理词和兴趣点信息。
进一步地,所述系统还包括分词和标注模块,用于对问题的标题进行分词和词性标注。
挖掘前,通过系统的分词和标注模块对所述问题的标题进行分词和词性标注。其中,分词的作用是将获取的问题标题切分成有意义的字词,以便后续处理。所述分词和标注模块可以基于下述方法之一或其结合进行分词:正向匹配分词、反向匹配分词、正向反向匹配分词、基于全切分词图的分词、最大熵马尔科夫模型分词、最大熵分词或条件随机场分词等,例如,将问题标题“中关村附近的肯德基具体位置”通过分词,得到“中关村/附近/的/肯德基/具体/位置”,在此基础上,所述分词和标注模块对上述分词后的结果进行词性标注,如中关村—名词,附近—形容词,的—助词,肯德基—名词等。
由分词和标注模块对所述问题的标题分词后,词典信息挖掘模块403进一步从所切分的关键词中挖掘地理词,如果一个标题中存在多个地理词,则优选第一个地理词作为所挖掘的地理词结果;否则,如果所述标题中不存在地理词,则默认所挖掘的地理词结果为空值。
更进一步地,词典信息挖掘模块403从所述问题的标题中挖掘兴趣点信息。优选地,通过多模匹配的方式,使用兴趣点词典,从问题标题中挖掘兴趣点信息,例如挖掘兴趣点名称。挖掘过程中,如果一个问题标题中存在多个兴趣点名称,则优选第一个兴趣点名称作为所挖掘的兴趣点信息结果,否则,如果所述标题中不存在兴趣点信息,则默认所挖掘的兴趣点信息结果为空值。
当所述词典信息挖掘模块403既不能挖掘出地理词,也不能挖掘出兴趣点信息时,则默认所挖掘的两项值都为空。
信息挖掘完成后,由第一接口访问模块404基于所挖掘的信息访问地图位置接口,从该接口获取其返回的地图数据列表。其中,所述位置接口是对外开放的地图应用接口(API),供程序调用的地图检索服务接口,通常对外开放,并且,该接口可以应用于PC端、移动设备端和服务端等。其中,所述返回的地图数据列表中的每一项包括兴趣点的地址、标题、经度和纬度,如中关村大厦、肯德基、39.9°、116.3°。
其中,所述获取返回的地图数据列表还包括:比较返回的数据列表中第一项数据的兴趣点标题与已挖掘的兴趣点名称,若两者相同,则确认该项数据是所需的数据,否则,默认该数据列表返回的为空值。
获取地图数据列表后,由第二接口访问模块405请求地图地址解析接口进行解析,并从该接口获取上层地理信息。其中,所述上层地理信息包括兴趣点对应的省、市、区县、街道以及商圈等地理信息。具体地,根据地图数据列表中的经纬度信息请求地图地址解析接口进行解析,获取相应地理信息。其中,所述地址解析接口为地图向外发布的API接口。
经解析获取上层地理信息后,由信息返回模块将所述信息返回。
进一步地,所述系统还包括:地理标签模块,用于生成问题的地理标签。更进一步地,信息返回模块按照问题的地理标签将问题分类展示在前端,有助于用户查看与地理位置相关的问题。
进一步地,所述系统还包括:问题推送模块,基于所挖掘的地理信息,将相应问题推送给用户。
具体地,所述问题推送模块基于所挖掘的地理信息,获取用户所在的地理位置后,自动地筛选出与该地理位置及用户所提问题最相关、最相近的问题,并将该筛选的问题推送给所述用户。例如,系统所接收的用户问题是“中关村地铁站怎么走?”,基于各模块的处理获取相应用户的地理信息后,经过问题筛选,得到与该问题及用户地理信息最相关和最相近的问题包括:“中关村地铁站在哪”、“中关村鼎好大厦附近有地铁吗”等,则将这些所得到的问题以问题列表的形式推送给所述用户。当然,在此并不对所推送的问题列表的显示方式作限制,根据实际应用需求确定即可。
与现有技术相比,本发明所提供的系统具有以下优点:充分利用了问答互动平台和地图的开放接口,将两者予以巧妙衔接和利用,有效地挖掘出地理信息。
以上所揭露的仅为本发明的较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (18)

1.一种基于问题的地理信息挖掘的方法,该方法包括以下步骤:
a)初始化兴趣点词典、城市名称词典和IP地址与城市名称的映射词典信息;
b)接收用户提交的问题并获取用户的IP地址信息;
c)从所述问题或IP地址信息中挖掘所述问题对应的词典项信息;
d)基于所述对应的词典项信息访问地图的位置接口,并获得该接口返回的地图数据列表;
e)根据所获得的地图数据列表,请求地图地址解析接口进行解析,获取上层地理信息;
f)返回所述上层地理信息。
2.根据权利要求1所述的方法,其中,所述步骤c)进一步包括:
g)从所述问题的标题中挖掘城市名称信息,若成功获取城市名称信息,则进入步骤h),否则,基于用户的IP地址挖掘对应的城市名称信息;
h)从所述问题的标题中挖掘地理词和兴趣点信息。
3.根据权利要求2所述的方法,其中,所述步骤g)通过词表匹配的方式从所述问题的标题中挖掘城市名称信息。
4.根据权利要求2所述的方法,其中,所述步骤h)通过对所述问题的标题进行分词和词性标注,挖掘地理词。
5.根据权利要求2所述的方法,其中,所述步骤h)基于兴趣点词典,通过多模匹配的方式,从所述问题的标题中挖掘兴趣点信息。
6.根据权利要求1所述的方法,其中,所述步骤h)中的地图数据列表包括对应兴趣点的地址、标题、经度和纬度。
7.根据权利要求1-6任一项所述的方法,其中,所述步骤e)基于地图数据列表中的经纬度信息,通过地图地址解析接口,获得省、市、区县、街道以及商圈信息。
8.根据权利要求1-6任一项所述的方法,其中,还包括:基于所述上层地理信息,生成问题的地理标签,并将问题按照地理信息予以分类展示在前端。
9.根据权利要求1-6任一项所述的方法,其中,还包括:基于所述上层地理信息,将问题推送给用户。
10.一种基于问题的地理信息挖掘系统,包括:
初始化模块,用于初始化兴趣点词典、城市名称词典和IP地址与城市名称的映射词典信息;
信息接收模块,用于接收用户提交的问题并获取用户的IP地址信息;
词典信息挖掘模块,用于从所述问题或IP地址信息中挖掘所述问题对应的词典项信息;
第一接口访问模块,基于所述对应的词典项信息访问地图位置接口,并获取该接口所返回的地图数据列表;
第二接口访问模块,基于所获取的地图数据列表,请求地图地址解析接口进行解析,并获取上层地理信息;
信息返回模块,用于返回所述上层地理信息;
其中,所述地图位置接口,用于获取地图数据列表;
其中,所述地图地址解析接口,用于解析地图数据列表中的信息。
11.根据权利要求10所述的系统,其中,所述词典信息挖掘模块的挖掘过程包括:
i)从所述问题的标题中挖掘城市名称信息,若成功获取城市名称信息,则进入步骤j),否则,基于用户的IP地址挖掘对应的城市名称信息;
j)从所述问题的标题中挖掘地理词和兴趣点信息。
12.根据权利要求11所述的系统,其中,所述词典信息挖掘模块通过词表匹配的方式从所述问题的标题中挖掘城市名称信息。
13.根据权利要求11所述的系统,其中,所述系统还包括分词和标注模块,用于对所述问题的标题进行分词和词性标注。
14.根据权利要求11所述的系统,其中,所述词典信息挖掘模块通过多模匹配的方式,从所述问题的标题中挖掘兴趣点信息。
15.根据权利要求10所述的系统,其中,所述地图数据列表包括对应兴趣点的地址、标题、经度和纬度。
16.根据权利要求10-15任一项所述的系统,其中,所述第二接口访问模块基于地图数据列表中的经纬度信息,通过地图地址解析接口,获得省、市、区县、街道以及商圈信息。
17.根据权利要求10-15任一项所述的系统,其中,所述系统还包括:地理标签模块,用于生成问题的地理标签。
18.根据权利要求10-15任一项所述的系统,其中,所述系统还包括问题推送模块,基于所述上层地理信息,将问题推送给用户。
CN201310108951.6A 2013-03-30 2013-03-30 基于问题的地理信息挖掘方法及系统 Pending CN104077322A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310108951.6A CN104077322A (zh) 2013-03-30 2013-03-30 基于问题的地理信息挖掘方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310108951.6A CN104077322A (zh) 2013-03-30 2013-03-30 基于问题的地理信息挖掘方法及系统

Publications (1)

Publication Number Publication Date
CN104077322A true CN104077322A (zh) 2014-10-01

Family

ID=51598581

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310108951.6A Pending CN104077322A (zh) 2013-03-30 2013-03-30 基于问题的地理信息挖掘方法及系统

Country Status (1)

Country Link
CN (1) CN104077322A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104504078A (zh) * 2014-12-23 2015-04-08 北京奇虎科技有限公司 一种确定查询关键字是否调用地图接口的方法与系统
CN105335468A (zh) * 2015-09-28 2016-02-17 北京信息科技大学 一种基于百度地图api的地理位置实体规范化方法
CN105373582A (zh) * 2015-10-13 2016-03-02 郭裴哲 一种政务服务导办方法及系统
CN105893465A (zh) * 2016-03-28 2016-08-24 北京京东尚科信息技术有限公司 自动问答方法和装置
CN106649331A (zh) * 2015-10-29 2017-05-10 阿里巴巴集团控股有限公司 商圈识别方法及设备
CN106846166A (zh) * 2016-12-08 2017-06-13 北京中电普华信息技术有限公司 一种基于地址大数据分析的电力营销客户档案完善方法
CN106919601A (zh) * 2015-12-25 2017-07-04 北京奇虎科技有限公司 从查询词中提取兴趣点的方法和装置
CN107688641A (zh) * 2017-08-28 2018-02-13 江西博瑞彤芸科技有限公司 一种提问管理方法及系统
CN108156012A (zh) * 2016-12-06 2018-06-12 中国移动通信集团设计院有限公司 一种网络报障数据多维度分类统计分析方法及装置
CN108428205A (zh) * 2018-02-06 2018-08-21 武汉大学 一种城市公共地图用户访问量差异因素分析方法
WO2018161719A1 (zh) * 2017-03-07 2018-09-13 广州优视网络科技有限公司 一种基于地域特征向用户推荐文章的方法和装置
CN109344341A (zh) * 2018-10-31 2019-02-15 长春理工大学 一种中文地理信息查询方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002297028A (ja) * 2001-03-30 2002-10-09 Clarion Co Ltd 車載用ナビゲーション装置及び車載用ナビゲーション装置の制御方法並びに車載ナビゲーション用ソフトウェア
CN101350013A (zh) * 2007-07-18 2009-01-21 北京灵图软件技术有限公司 一种地理信息的搜索方法和系统
CN101777082A (zh) * 2010-03-01 2010-07-14 苏州数字地图网络科技有限公司 一种文字信息与地理信息的关联方法及系统
CN102279889A (zh) * 2011-08-29 2011-12-14 百度在线网络技术(北京)有限公司 一种基于地理信息的问题推送方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002297028A (ja) * 2001-03-30 2002-10-09 Clarion Co Ltd 車載用ナビゲーション装置及び車載用ナビゲーション装置の制御方法並びに車載ナビゲーション用ソフトウェア
CN101350013A (zh) * 2007-07-18 2009-01-21 北京灵图软件技术有限公司 一种地理信息的搜索方法和系统
CN101777082A (zh) * 2010-03-01 2010-07-14 苏州数字地图网络科技有限公司 一种文字信息与地理信息的关联方法及系统
CN102279889A (zh) * 2011-08-29 2011-12-14 百度在线网络技术(北京)有限公司 一种基于地理信息的问题推送方法及系统

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104504078B (zh) * 2014-12-23 2019-03-01 北京奇虎科技有限公司 一种确定查询关键字是否调用地图接口的方法与系统
CN104504078A (zh) * 2014-12-23 2015-04-08 北京奇虎科技有限公司 一种确定查询关键字是否调用地图接口的方法与系统
CN105335468A (zh) * 2015-09-28 2016-02-17 北京信息科技大学 一种基于百度地图api的地理位置实体规范化方法
CN105335468B (zh) * 2015-09-28 2019-09-13 北京信息科技大学 一种基于百度地图api的地理位置实体规范化方法
CN105373582A (zh) * 2015-10-13 2016-03-02 郭裴哲 一种政务服务导办方法及系统
CN106649331A (zh) * 2015-10-29 2017-05-10 阿里巴巴集团控股有限公司 商圈识别方法及设备
CN106649331B (zh) * 2015-10-29 2020-09-11 阿里巴巴集团控股有限公司 商圈识别方法及设备
CN106919601A (zh) * 2015-12-25 2017-07-04 北京奇虎科技有限公司 从查询词中提取兴趣点的方法和装置
CN105893465A (zh) * 2016-03-28 2016-08-24 北京京东尚科信息技术有限公司 自动问答方法和装置
CN105893465B (zh) * 2016-03-28 2019-12-27 北京京东尚科信息技术有限公司 自动问答方法和装置
CN108156012A (zh) * 2016-12-06 2018-06-12 中国移动通信集团设计院有限公司 一种网络报障数据多维度分类统计分析方法及装置
CN108156012B (zh) * 2016-12-06 2021-09-10 中国移动通信集团设计院有限公司 一种网络报障数据多维度分类统计分析方法及装置
CN106846166A (zh) * 2016-12-08 2017-06-13 北京中电普华信息技术有限公司 一种基于地址大数据分析的电力营销客户档案完善方法
WO2018161719A1 (zh) * 2017-03-07 2018-09-13 广州优视网络科技有限公司 一种基于地域特征向用户推荐文章的方法和装置
CN107688641A (zh) * 2017-08-28 2018-02-13 江西博瑞彤芸科技有限公司 一种提问管理方法及系统
CN107688641B (zh) * 2017-08-28 2021-12-28 江西博瑞彤芸科技有限公司 一种提问管理方法及系统
CN108428205A (zh) * 2018-02-06 2018-08-21 武汉大学 一种城市公共地图用户访问量差异因素分析方法
CN109344341A (zh) * 2018-10-31 2019-02-15 长春理工大学 一种中文地理信息查询方法及系统

Similar Documents

Publication Publication Date Title
CN104077322A (zh) 基于问题的地理信息挖掘方法及系统
US6611751B2 (en) Method and apparatus for providing location based data services
CN104750799B (zh) 一种基于地址解析数据的建设用地类型快速识别方法
US7096233B2 (en) Server, user terminal, information providing service system and information providing service method for providing information in conjunction with a geographical mapping application
US20150356088A1 (en) Tile-based geocoder
US20120208565A1 (en) System and method for preferred services in nomadic environments
CN105260431A (zh) 基于电子地图的信息获取方法和装置
KR20090018038A (ko) 가상 데이터베이스 환경을 제공하고 디지털 맵 정보를 생성하기 위한 시스템 및 방법
CN101313300A (zh) 本地搜索
Hu et al. Extraction and monitoring approach of dynamic urban commercial area using check-in data from Weibo
CN101608922A (zh) 基于实时交通信息的最短时间路径规划方法
US7688227B1 (en) Dynamic location-based mapping system and method
Zandbergen et al. Positional accuracy of TIGER 2000 and 2009 road networks
WO2011084720A2 (en) A method and system for an augmented reality information engine and product monetization therefrom
CN104320848B (zh) 基于云计算实现室内定位的系统及方法
EP1615146A2 (en) Server system, user terminal, service providing method and service providing system using the server system and the user terminal
Cetl et al. A comparison of address geocoding techniques–case study of the city of Zagreb, Croatia
KR102184048B1 (ko) Gis 기반 토지 이용 계획 검토 시스템 및 방법
CN103631871A (zh) 一维地图装置及一维地图的实现方法
Claridades et al. Developing a data model of indoor points of interest to support location‐based services
CN114820960B (zh) 构建图谱的方法、装置、设备和介质
CN113220814B (zh) 一种将地摊信息与地理空间相连接形成地摊地图的方法
JP2011129143A (ja) 情報提供システム,情報処理装置およびプログラム
Deidda et al. An example of a tourist location-based service (LBS) with open-source software
CN105321092A (zh) 利用互联网基于空间发布和展示广告的方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20141001