CN104102637B - 一种生成热点区域的方法及装置 - Google Patents

一种生成热点区域的方法及装置 Download PDF

Info

Publication number
CN104102637B
CN104102637B CN201310112472.1A CN201310112472A CN104102637B CN 104102637 B CN104102637 B CN 104102637B CN 201310112472 A CN201310112472 A CN 201310112472A CN 104102637 B CN104102637 B CN 104102637B
Authority
CN
China
Prior art keywords
participle
latitude
geographic area
poi
longitude coordinates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310112472.1A
Other languages
English (en)
Other versions
CN104102637A (zh
Inventor
彭钊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Autonavi Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Autonavi Software Co Ltd filed Critical Autonavi Software Co Ltd
Priority to CN201310112472.1A priority Critical patent/CN104102637B/zh
Publication of CN104102637A publication Critical patent/CN104102637A/zh
Application granted granted Critical
Publication of CN104102637B publication Critical patent/CN104102637B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Remote Sensing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种生成热点区域的方法及装置,以提高生成热点区域的效率。方法包括:针对每个POI,对该POI的名称和地址进行分词,得到所述POI的有效分词,并存储各有效分词与所述POI的经纬度坐标的对应关系;针对每个有效分词,执行以下步骤:根据所述有效分词对应的经纬度坐标落入的地理区域,确定所述有效分词所覆盖的地理区域;判断所述有效分词覆盖的地理区域是否为热点区域,若是,则根据落入所述有效分词覆盖的地理区域的所述经纬度坐标计算该热点区域的经纬度坐标,并将所述有效分词作为所述热点区域的聚合地名与该热点区域的经纬度坐标对应存储。

Description

一种生成热点区域的方法及装置
技术领域
本发明涉及电子地图领域,尤其涉及一种生成热点区域的方法及装置。
背景技术
随着移动互联网的不断发展,与位置相关的电子地图应用不断增加,电子地图数据也需要快速满足各种应用需求。目前,越来越多的用户想去查看日常生活中人们所熟知的热点区域的地理信息或兴趣点(Point Of Interest,POI)等,热点区域是指日常生活中人们所熟知的某一地理区域,只要一提起该热点区域立即会想到这个地理区域大致在哪个位置,热点区域既不是行政区划也不是一个具有详细地址的POI,如人们熟知的西单、东单、王府井、五道口、新街口、中关村等均为热点区域。因此,为便于用户在电子地图中查看热点区域或者便于在电子地图中展示热点区域,需要生成可以成为该热点区域的地名,即,聚合地名。
聚合地名的应用场景包括:当电子地图比例尺较小时,在电子地图中显示热点区域内所有POI的名称会使电子地图界面显示内容过多,从而产生用户查看POI不便的问题,为解决这一问题,可以在电子地图中热点区域的某一位置显示聚合地名代替在该热点区域内显示所有POI的名称,从而使电子地图显示内容更加简洁直观;在地图数据库中存储聚合地名与POI的名称及经纬度坐标的对应关系,所述POI是该聚合地名对应的热点区域内的POI,当用户通过电子地图搜索该聚合地名时,该聚合地名在电子地图中对应的热点区域会显示该聚合地名对应的所有POI,如用户搜索聚合地名“新街口”时,在“新街口”对应的热点区域能够显示新华百货、真维斯、森马、同仁堂药店、金象大药房等POI的信息。
目前,热点区域、热点地区的地名及该热点区域内包含的POI主要是通过人工整理得到,由于电子地图数据库中的POI数量非常庞大,若通过人工方式整理得到热点区域,效率较低,且需要消耗大量的人力资源。
发明内容
为提高生成热点区域效率,本发明实施例提供一种生成热点区域的方法及装置。
一种生成热点区域的方法,对地图数据库中每个城市的POI执行以下步骤:
针对每个POI,对该POI的名称和地址进行分词,得到所述POI的有效分词,并存储各有效分词与所述POI的经纬度坐标的对应关系;
针对每个有效分词,执行以下步骤:
根据所述有效分词对应的经纬度坐标落入的地理区域,确定所述有效分词所覆盖的地理区域;
判断所述有效分词覆盖的地理区域是否为热点区域,若是,则根据落入所述有效分词覆盖的地理区域的经纬度坐标计算该热点区域的经纬度坐标,并将所述有效分词作为所述热点区域的聚合地名与该热点区域的经纬度坐标对应存储。
相应的,本发明实施例还提供一种生成热点区域的装置,该装置包括:
分词单元,针对地图数据库中每个城市,对所述城市中的每个POI,对该POI的名称和地址进行分词,得到所述POI的有效分词,并触发对应关系存储单元;
对应关系存储单元,用于存储各有效分词与所述POI的经纬度坐标的对应关系;
地理区域确定单元,用于针对每个有效分词,根据所述有效分词对应的经纬度坐标落入的地理区域,确定所述有效分词所覆盖的地理区域,并触发热点区域判断单元;
热点区域判断单元,用于判断所述有效分词覆盖的地理区域是否为热点区域,若是则触发经纬度坐标计算单元;
经纬度坐标计算单元,用于根据落入所述有效分词覆盖的地理区域的经纬度坐标计算该热点区域的经纬度坐标,并触发热点区域存储单元;
热点区域存储单元,用于将所述有效分词作为所述热点区域的聚合地名与该热点区域的经纬度坐标对应存储。
本发明实施例中,针对每个城市,首先,对该城市的每个POI均执行以下步骤,对POI的名称和地址进行分词,得到所述POI的有效分词,并存储个有效分词与所述POI的经纬度坐标的对应关系;其次,针对每个有效分词,执行以下步骤:根据所述有效分词对应的经纬度坐标落入的地理区域,确定所述有效分词所覆盖的地理区域;判断所述有效分词覆盖的地理区域是否为热点区域,若是,则根据落入所述有效分词覆盖的地理区域的经纬度坐标计算该热点区域的经纬度坐标,并将所述有效分词作为所述热点区域的聚合地名与该热点区域的经纬度坐标对应存储。采用本发明技术方案,可以通过分析POI的名称和地址、经纬度坐标,来得到热点区域,与现有技术通过人工整理得到热点区域的方式相比,提高了生成热点区域的效率。
附图说明
图1为本发明实施例中生成热点区域的方法流程图之一;
图2为本发明实施例中确定分词对应的地理区域的方法流程图;
图3A为本发明实施例中包含分词对应的经纬度坐标的区域块的示意图;
图3B为本发明实施例中分词覆盖的地理区域的示意图;
图4为本发明实施例中生成热点区域的方法流程图之二;
图5为本发明实施例中生成热点区域的详细流程图;
图6为本发明实施例中生成热点区域的装置的结构示意图之一;
图7为本发明实施例中生成热点区域的装置的结构示意图之二。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例,为提高生成热点区域的效率,提供一种生成热点区域的方法,该方法包括:对地图数据库中每个城市的POI执行以下步骤:针对每个POI,对该POI的名称和地址进行分词,得到所述POI的有效分词,并存储各有效分词与所述POI的经纬度坐标的对应关系;针对每个有效分词(此处的有效分词是指与其对应的POI的经纬度坐标建立对应关系的有效分词),执行以下步骤:根据所述有效分词对应的经纬度坐标落入的地理区域,确定所述有效分词所覆盖的地理区域;判断所述有效分词覆盖的地理区域是否为热点区域,若是,则根据落入所述有效分词覆盖的地理区域的所述经纬度坐标计算该热点区域的经纬度坐标,并将所述有效分词作为所述热点区域的聚合地名与该热点区域的经纬度坐标对应存储。
参见图1,为本发明实施例中生成热点区域的方法流程图,该方法流程针对地图数据库中的一个城市所进行的操作,其他城市的处理方式类似。方法包括:
步骤101、针对所述城市中的每个POI,对该POI的名称和地址进行分词,得到所述POI的有效分词,并存储各有效分词与所述POI的经纬度坐标的对应关系;
步骤102、根据当前有效分词对应的经纬度坐标落入的地理区域,确定所述有效分词所覆盖的地理区域;
步骤103、判断所述有效分词覆盖的地理区域是否为热点区域,若是则执行步骤104,否则,执行步骤106;
步骤104、根据落入所述有效分词覆盖的地理区域的所述经纬度坐标计算该热点区域的经纬度坐标;
步骤105、将所述有效分词作为所述热点区域的聚合地名与该热点区域的经纬度坐标对应存储;
步骤106、判断所述有效分词是否为最后一个有效分词,若是则结束流程,若否则将下一有效分词作为当前有效分词执行前述步骤102。
优选地,为提高分词的有效性,将对POI的名称和地址进行切分之后,将无效的分词删除,前述步骤101中,对POI的名称和地址进行分词,得到所述POI的有效分词,具体包括:对POI的名称和地址进行分词,得到所述POI的分词集合;删除所述分词集合中判定为停用词的分词;对于分词集合中重复的分词,保留其中一个分词,删除其他分词;所述分词集合中保留的分词为所述POI的有效分词。在地理分词系统中,停用词通常是指不具有实际意义的词,如副词、连词等。
前述步骤101中,存储各有效分词与所述POI的经纬度坐标的对应关系,具体实现可如下:判断是否已存在以所述有效分词为索引的坐标集,如果存在,则将所述有效分词对应的POI的经纬度坐标添加到所述坐标集中;若否,则新建以所述有效分词为索引的坐标集,并将所述有效分词对应的POI的经纬度坐标添加到所述坐标集中。
在具体的实现中,可以预先为每个城市建立一个与该城市对应的分词集合S。当对该城市的每一个POI的名称或地址进行切分之后,得到该POI的分词集合,对该POI的分词集合中的停用词、重复分词进行处理之后,得到该POI对应的有效分词;再对该POI对应的每个有效分词,判断该有效分词是否已经存在于所述城市对应的分词集合S中,若不存在,则将该有效分词添加到分词集合S中,并新建以该有效分词为索引的坐标集(坐标集可以是一个集合或列表),并将该有效分词对应的POI的经纬度坐标添加到该坐标集中;若存在,则丢弃该有效分词,并将该有效分词对应的POI的经纬度坐标添加到该有效分词的坐标集中。
前述步骤102~步骤106处理的有效分词即为与所述城市对应的分词集合S中的有效分词,即步骤102~步骤106处理的有效分词是指与其对应的POI的经纬度坐标建立了对应关系的有效分词。
优选地,本发明实施例中为便于快速、准确的定位出各有效分词对应的经纬度坐标落入在哪些地理区域,以及所述有效分词所覆盖的地理区域,预先将电子地图切分成大小相同的区域块,如区域块可以是方形栅格,每个方形栅格的大小可以设为1平方公里。一般来说,位于同一个区域块内的多个POI基本属于同一个热点区域,而一个热点区域所覆盖面积一般都会超过一个区域分的大小,因此,将同一个有效分词对应的经纬度坐标落入的区域块中具有相邻关系的区域块构成的区域作为该有效分词对应的地理区域。
前述步骤102,具体实现可如图2所示的流程图,该流程包括:
步骤201、确定包括所述有效分词对应的经纬度坐标的区域块,如图3A所示;
步骤202、将确定出的区域块中相邻的区域块构成的地理区域中包含经纬度坐标最多的地理区域,作为所述有效分词覆盖的地理区域,如图3B为确定出的区域块中相邻区域块构成的3个地理区域,其中标粗框的为包含所述有效分词对应的经纬度坐标最多的地理区域,即为该有效分词覆盖的地理区域。
优选地,前述步骤103,具体实现可如下:
步骤A、根据所述有效分词覆盖的地理区域所包含的经纬度坐标数量和包含的区域块的数量,计算该地理区域的经纬度坐标分布密度;计算地理区域的经纬度坐标分布密度具体可如下:将所述有效分词对应的经纬度坐标中落入该地理区域中的经纬度坐标的数量除以该地理区域包含的区域块数量,得到的商值即为所述经纬度坐标分布密度;
步骤B、判断所述有效分词覆盖的地理区域是否满足以下条件,若满足则确定该地理区域为热点区域,否则确定该地理区域不是热点区域,条件为:所述地理区域包含的经纬度坐标数量大于第一阈值,所述地理区域包含的区域块数量小于第二阈值,所述地理区域的经纬度坐标分布密度大于第三阈值,其中,所述第二阈值和第三阈值均小于所述第一阈值。本发明实施例中的第一阈值、第二阈值和第三阈值均为大于1的自然数,只要确保第二阈值和第三阈值均小于第一阈值即可,在此不作限定,可以根据实际情况灵活设置。三个阈值可以取经验值,如第一阈值为50、第二阈值为5、第三阈值为10。
优选地,步骤104计算该热点区域的经纬度坐标,具体实现可如下:计算落入所述有效分词覆盖的地理区域的经纬度坐标的平均值,将所述平均值确定为所述热点区域的经纬度坐标。具体实现可如下:计算有效分词对应的地理区域中的所有经纬度坐标的经度值的平均值,将该平均值确定为所述热点区域的经纬度坐标的经度值;计算有效分词对应的地理区域中的所有经纬度坐标的纬度值的平均值,将该平均值确定为所述热点区域的经纬度坐标的纬度值。
优选地,本发明实施例中,前述步骤105与步骤106之间,还可包括步骤105a,如图4所示:
步骤105a、将落入所述热点区域中的经纬度坐标对应的POI与所述热点区域的聚合地名关联存储。具体实现:建立热点区域的热点地名与落入该热点区域的经纬度坐标的对应关系;或者,建立热点区域的热点地名与落入该热点区域的经纬度坐标对应的POI的POI名称的对应关系。
为更好的对本发明技术方案进行详细、清楚的描述,以一详细的流程图进行说明,如图5,该流程是对某一城市所做的处理,对其他城市的处理类似,方法包括:
步骤501、定义与所述城市对应的分词集合S,该分词集合S初始化为空。
步骤502、获取当前POI的名称,并调用地理分词系统对该POI的名称进行分词,得到分词N1、N2、…、Nm。
针对前述分词N1、N2、…、Nm,执行以下步骤:
步骤503、判断前述分词Ni是否为停用词,若否则执行步骤504,否则执行步骤505。
步骤504、判断分词Ni(其中1≤i≤m)是否已经在分词集合S中,若是则执行步骤506,否则执行步骤507。
步骤505、丢弃分词Ni。
步骤506、将所述POI对应的经纬度坐标添加到分词Ni的坐标列表中。
步骤507、新建所述分词Ni对应的坐标列表,并将所述POI对应的经纬度坐标添加到该分词Ni对应的坐标列表中。
步骤508、判断Ni是否为最后一个分词,若是则执行步骤509,否则对分词Ni+1重复步骤503;
步骤509、获取该POI的地址,并调用地理分词系统对该POI的地址进行分词,得到分词A1、A2、…、An。
针对前述分词A1、A2、…、An,执行以下步骤:
步骤510、判断分词Aj(1≤j≤n)是否为停用词,若否则执行步骤511,否则执行步骤512。
步骤511、判断分词Aj是否已经在分词集合S中,若是则执行步骤513,否则执行步骤514。
步骤512、丢弃分词Aj。
步骤513、将所述POI对应的经纬度坐标添加到分词Aj的坐标列表中。
步骤514、新建所述分词Aj对应的坐标列表,并将所述POI对应的经纬度坐标添加到该分词Aj对应的坐标列表中。
步骤515、判断所述分词Aj是否为最后一个分词,若是则执行步骤516,否则对下一个分词分词Aj+1重复前述步骤510。
步骤516、判断当前POI是否为所述城市的最后一个POI,若是则执行步骤517,否则将所述城市的下一个POI作为当前POI,重复前述步骤502。
步骤517、针对前述分词集合S中的每个分词,确定包括该分词对应的经纬度坐标的区域块。
针对分词集合S中的分词,进行以下步骤:
步骤518、针对分词集合S中的当前分词,建立该分词与包括该分词对应的经纬度坐标的区域块的对应关系,并记录每个区域块所包含的经纬度坐标。
步骤519、将当前分词对应的区域块中具有相邻关系的区域块构成的地理区域添加到当前分词对应的地理区域列表中。
步骤520、将当前分词对应的地理区域列表中包含经纬度坐标数量最多的地理区域确定为所述当前分词覆盖的地理区域。
步骤521、根据当前分词所覆盖的地理区域中包含的区域块数量、经纬度坐标数量,计算该地理区域的经纬度坐标分布密度。
步骤522、判断当前分词对应的地理区域是否满足预设的条件,若满足则执行步骤523,否则执行步骤525。
步骤523、确定当前分词覆盖的地理区域为热点区域,根据落入该地理区域的经纬度坐标计算该热点区域的经纬度坐标。
步骤524、将所述有效分词作为所述热点区域的聚合地名与该热点区域的经纬度坐标对应存储。
步骤525、确定当前分词所覆盖的地理区域不是热点区域。
步骤526、判断当前分词是否为所述分词集合S中的最后一个分词,若是则结束流程,若否则将分词集合S中的下一个分词作为当前分词,重复执行前述步骤518。
基于前述方法流程,本发明实施例还提供一种生成热点区域的装置,该装置的结构如图6所示,包括:
分词单元61,针对地图数据库中每个城市,对所述城市中的每个POI,对该POI的名称和地址进行分词,得到所述POI的有效分词,并触发对应关系存储单元62;
对应关系存储单元62,用于存储各有效分词与所述POI的经纬度坐标的对应关系;
地理区域确定单元63,用于针对每个有效分词,根据所述有效分词对应的经纬度坐标落入的地理区域,确定所述有效分词所覆盖的地理区域,并触发热点区域判断单元64;
热点区域判断单元64,用于判断所述有效分词覆盖的地理区域是否为热点区域,若是则触发经纬度坐标计算单元65;
经纬度坐标计算单元65,用于根据落入所述有效分词覆盖的地理区域的经纬度坐标计算该热点区域的经纬度坐标,并触发热点区域存储单元66;
热点区域存储单元66,用于将所述有效分词作为所述热点区域的聚合地名与该热点区域的经纬度坐标对应存储。
优选地,前述所述分词单元61对POI的名称和地址进行分词,得到所述POI的有效分词,具体用于:对POI的名称和地址进行分词,得到所述POI的分词集合;删除所述分词集合中判定为停用词的分词;对于分词集合中重复的分词,保留其中一个分词,删除其他分词;所述分词集合中保留的分词为所述POI的有效分词。
优选地,所述对应关系存储单元62,具体用于:判断是否已存在以所述有效分词为索引的坐标集,如果存在,则将所述有效分词对应的POI的经纬度坐标添加到所述坐标集中;若否,则新建以所述有效分词为索引的坐标集,并将所述有效分词对应的POI的经纬度坐标添加到所述坐标集中。
优选地,所述电子地图切分为大小相同的区域块,则地理区域确定单元63,具体用于:确定包括所述有效分词对应的经纬度坐标的区域块;将确定出的区域块中相邻的区域块构成的地理区域中包含经纬度坐标最多的地理区域,作为所述有效分词覆盖的地理区域。
优选地,所述热点区域判断单元64,具体用于:
根据所述有效分词覆盖的地理区域所包含的经纬度坐标的数量和包含的区域块,计算该地理区域的经纬度坐标分布密度;
判断所述有效分词覆盖的地理区域是否满足以下条件,若满足则确定该地理区域为热点区域,否则确定该地理区域不是热点区域,条件为:所述地理区域包含的经纬度坐标数量大于第一阈值,所述地理区域包含的区域块数量小于第二阈值,所述地理区域的经纬度坐标分布密度大于第三阈值,其中,所述第二阈值和第三阈值均小于所述第一阈值。
优选地,所述经纬度坐标计算单元65,具体用于:计算落入所述地理区域的经纬度坐标的平均值,将所述平均值确定为所述热点区域的经纬度坐标。
优选地,在前述图6所示的装置,还包括POI存储单元67,如图7所示,其中:
POI存储单元67,用于将落入所述热点区域中的经纬度坐标对应的POI与所述热点区域的聚合地名关联存储。
本发明实施例中,针对每个城市,首先,对该城市的每个POI均执行以下步骤,对POI的名称和地址进行分词,得到所述POI的有效分词,并存储个有效分词与所述POI的经纬度坐标的对应关系;其次,针对每个有效分词,执行以下步骤:根据所述有效分词对应的经纬度坐标落入的地理区域,确定所述有效分词所覆盖的地理区域;判断所述有效分词覆盖的地理区域是否为热点区域,若是,则根据落入所述有效分词覆盖的地理区域的所述经纬度坐标计算该热点区域的经纬度坐标,并将所述有效分词作为所述热点区域的聚合地名与该热点区域的经纬度坐标对应存储。采用本发明技术方案,可以通过分析POI的名称和地址、经纬度坐标,来得到热点区域,与现有技术通过人工整理得到热点区域的方式相比,提高了生成热点区域的效率。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若对本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (14)

1.一种生成热点区域的方法,其特征在于,对地图数据库中每个城市的POI执行以下步骤:
针对每个POI,对该POI的名称和地址进行分词,得到所述POI的有效分词,并存储各有效分词与所述POI的经纬度坐标的对应关系;
针对每个有效分词,执行以下步骤:
根据所述有效分词对应的经纬度坐标落入的地理区域,确定所述有效分词所覆盖的地理区域;
判断所述有效分词覆盖的地理区域是否为热点区域,若是,则根据落入所述有效分词覆盖的地理区域的经纬度坐标计算该热点区域的经纬度坐标,并将所述有效分词作为所述热点区域的聚合地名与该热点区域的经纬度坐标对应存储。
2.根据权利要求1所述的方法,其特征在于,对POI的名称和地址进行分词,得到所述POI的有效分词,具体包括:
对POI的名称和地址进行分词,得到所述POI的分词集合;
删除所述分词集合中判定为停用词的分词;
对于分词集合中重复的分词,保留其中一个分词,删除其他分词;
所述分词集合中保留的分词为所述POI的有效分词。
3.根据权利要求1所述的方法,其特征在于,所述存储各有效分词与所述POI的经纬度坐标的对应关系,具体包括:
判断是否已存在以所述有效分词为索引的坐标集,如果存在,则将所述有效分词对应的POI的经纬度坐标添加到所述坐标集中;
若否,则新建以所述有效分词为索引的坐标集,并将所述有效分词对应的POI的经纬度坐标添加到所述坐标集中。
4.根据权利要求1所述的方法,其特征在于,电子地图切分为大小相同的区域块,则所述根据所述有效分词对应的经纬度坐标所落入的地理区域,确定所述有效分词所覆盖的地理区域,具体包括:
确定包括所述有效分词对应的经纬度坐标的区域块;
将确定出的区域块中相邻的区域块构成的地理区域中包含经纬度坐标最多的地理区域,作为所述有效分词覆盖的地理区域。
5.根据权利要求4所述的方法,其特征在于,判断所述有效分词覆盖的地理区域是否为热点区域,具体为:
根据所述有效分词覆盖的地理区域所包含的经纬度坐标的数量和包含的区域块数量,计算该地理区域的经纬度坐标分布密度;
判断所述有效分词覆盖的地理区域是否满足以下条件,若满足则确定该地理区域为热点区域,否则确定该地理区域不是热点区域,条件为:所述地理区域包含的经纬度坐标数量大于第一阈值,所述地理区域包含的区域块数量小于第二阈值,所述地理区域的经纬度坐标分布密度大于第三阈值,其中,所述第二阈值和第三阈值均小于所述第一阈值。
6.根据权利要求1~5任一项所述的方法,其特征在于,根据落入所述有效分词覆盖的地理区域的经纬度坐标计算该热点区域的经纬度坐标,具体为:
计算落入所述有效分词覆盖的地理区域的经纬度坐标的平均值,将所述平均值确定为所述热点区域的经纬度坐标。
7.根据权利要求1~5任一项所述的方法,其特征在于,将所述有效分词作为所述热点区域的聚合地名与该热点区域的经纬度坐标对应存储之后,还包括:
将落入所述热点区域中的经纬度坐标对应的POI与所述热点区域的聚合地名关联存储。
8.一种生成热点区域的装置,其特征在于,包括:
分词单元,针对地图数据库中每个城市,对所述城市中的每个POI,对该POI的名称和地址进行分词,得到所述POI的有效分词,并触发对应关系存储单元;
对应关系存储单元,用于存储各有效分词与所述POI的经纬度坐标的对应关系;
地理区域确定单元,用于针对每个有效分词,根据所述有效分词对应的经纬度坐标落入的地理区域,确定所述有效分词所覆盖的地理区域,并触发热点区域判断单元;
热点区域判断单元,用于判断所述有效分词覆盖的地理区域是否为热点区域,若是则触发经纬度坐标计算单元;
经纬度坐标计算单元,用于根据落入所述有效分词覆盖的地理区域的经纬度坐标计算该热点区域的经纬度坐标,并触发热点区域存储单元;
热点区域存储单元,用于将所述有效分词作为所述热点区域的聚合地名与该热点区域的经纬度坐标对应存储。
9.根据权利要求8所述的装置,其特征在于,所述分词单元对POI的名称和地址进行分词,得到所述POI的有效分词,具体用于:
对POI的名称和地址进行分词,得到所述POI的分词集合;
删除所述分词集合中判定为停用词的分词;
对于分词集合中重复的分词,保留其中一个分词,删除其他分词;
所述分词集合中保留的分词为所述POI的有效分词。
10.根据权利要求8所述的装置,其特征在于,所述对应关系存储单元,具体用于:
判断是否已存在以所述有效分词为索引的坐标集,如果存在,则将所述有效分词对应的POI的经纬度坐标添加到所述坐标集中;
若否,则新建以所述有效分词为索引的坐标集,并将所述有效分词对应的POI的经纬度坐标添加到所述坐标集中。
11.根据权利要求8所述的装置,其特征在于,电子地图切分为大小相同的区域块,则地理区域确定单元,具体用于:
确定包括所述有效分词对应的经纬度坐标的区域块;
将确定出的区域块中相邻的区域块构成的地理区域中包含经纬度坐标最多的地理区域,作为所述有效分词覆盖的地理区域。
12.根据权利要求11所述的装置,其特征在于,所述热点区域判断单元,具体用于:
根据所述有效分词覆盖的地理区域所包含的经纬度坐标的数量和包含的区域块的数量,计算该地理区域的经纬度坐标分布密度;
判断所述有效分词覆盖的地理区域是否满足以下条件,若满足则确定该地理区域为热点区域,否则确定该地理区域不是热点区域,条件为:所述地理区域包含的经纬度坐标数量大于第一阈值,所述地理区域包含的区域块数量小于第二阈值,所述地理区域的经纬度坐标分布密度大于第三阈值,其中,所述第二阈值和第三阈值均小于所述第一阈值。
13.根据权利要求12所述的装置,其特征在于,所述经纬度坐标计算单元,具体用于:
计算落入所述有效分词覆盖的地理区域的经纬度坐标的平均值,将所述平均值确定为所述热点区域的经纬度坐标。
14.根据权利要求8~13任一项所述的装置,其特征在于,还包括:
POI存储单元,用于将落入所述热点区域中的经纬度坐标对应的POI与所述热点区域的聚合地名关联存储。
CN201310112472.1A 2013-04-02 2013-04-02 一种生成热点区域的方法及装置 Active CN104102637B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310112472.1A CN104102637B (zh) 2013-04-02 2013-04-02 一种生成热点区域的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310112472.1A CN104102637B (zh) 2013-04-02 2013-04-02 一种生成热点区域的方法及装置

Publications (2)

Publication Number Publication Date
CN104102637A CN104102637A (zh) 2014-10-15
CN104102637B true CN104102637B (zh) 2017-09-29

Family

ID=51670800

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310112472.1A Active CN104102637B (zh) 2013-04-02 2013-04-02 一种生成热点区域的方法及装置

Country Status (1)

Country Link
CN (1) CN104102637B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104572902B (zh) * 2014-12-26 2018-01-23 北京中交兴路车联网科技有限公司 一种信息点匹配的方法及装置
CN105426387B (zh) * 2015-10-23 2020-02-07 北京锐安科技有限公司 一种基于K-means算法的地图聚合方法
CN106681996B (zh) * 2015-11-05 2019-03-26 腾讯科技(深圳)有限公司 确定地理范围内兴趣区域、兴趣点的方法和装置
CN107070961B (zh) 2016-09-30 2020-06-23 阿里巴巴集团控股有限公司 基于地理位置数据的热点区域确定方法及装置
CN110556049B (zh) * 2018-06-04 2021-11-12 百度在线网络技术(北京)有限公司 一种地图数据处理方法、装置、服务器和存储介质
CN110334349B (zh) * 2019-06-28 2022-07-19 腾讯科技(深圳)有限公司 商圈自动命名的方法、装置、计算机设备及存储介质
CN111553279B (zh) * 2020-04-28 2023-05-05 北京百度网讯科技有限公司 兴趣点的表征学习、识别方法、装置、设备及存储介质
CN112016326A (zh) * 2020-09-25 2020-12-01 北京百度网讯科技有限公司 一种地图区域词识别方法、装置、电子设备和存储介质
CN113626668B (zh) * 2021-07-02 2024-05-14 武汉大学 一种面向地图的新闻多尺度可视化方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008108532A1 (en) * 2007-03-07 2008-09-12 Thinkware Systems Corporation Method for searching destination of tree structure and system thereof
CN101271478A (zh) * 2008-05-07 2008-09-24 北京航空航天大学 基于聚类分块的只读兴趣点数据库压缩存储方法
CN101887440A (zh) * 2009-05-13 2010-11-17 财团法人资讯工业策进会 热点分析系统及方法
CN102288183A (zh) * 2011-06-22 2011-12-21 北京农业信息技术研究中心 用于农村事件上报的地址定位系统及方法
CN102541936A (zh) * 2010-12-31 2012-07-04 高德软件有限公司 兴趣点流行度获取方法和装置
US8224565B2 (en) * 2008-12-24 2012-07-17 Mitac International Corp. Method and system for automatically creating POI by identifying geographic information on a screen of a portable navigation device
CN102682128A (zh) * 2012-05-17 2012-09-19 厦门雅迅网络股份有限公司 一种用于兴趣点信息的排重方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008108532A1 (en) * 2007-03-07 2008-09-12 Thinkware Systems Corporation Method for searching destination of tree structure and system thereof
CN101271478A (zh) * 2008-05-07 2008-09-24 北京航空航天大学 基于聚类分块的只读兴趣点数据库压缩存储方法
US8224565B2 (en) * 2008-12-24 2012-07-17 Mitac International Corp. Method and system for automatically creating POI by identifying geographic information on a screen of a portable navigation device
CN101887440A (zh) * 2009-05-13 2010-11-17 财团法人资讯工业策进会 热点分析系统及方法
CN102541936A (zh) * 2010-12-31 2012-07-04 高德软件有限公司 兴趣点流行度获取方法和装置
CN102288183A (zh) * 2011-06-22 2011-12-21 北京农业信息技术研究中心 用于农村事件上报的地址定位系统及方法
CN102682128A (zh) * 2012-05-17 2012-09-19 厦门雅迅网络股份有限公司 一种用于兴趣点信息的排重方法

Also Published As

Publication number Publication date
CN104102637A (zh) 2014-10-15

Similar Documents

Publication Publication Date Title
CN104102637B (zh) 一种生成热点区域的方法及装置
CN110765219B (zh) 地理围栏生成方法、装置、计算机设备和存储介质
CN108932331B (zh) 一种地图数据更新方法、装置及系统
CN103533501B (zh) 一种地理围栏生成方法
CN103092853B (zh) 一种空间索引的建立方法、使用方法及装置
CN105718465A (zh) 地理围栏生成方法及装置
CN104867402B (zh) 一种离线的逆地理编码的方法及其装置和终端设备
CN105761190A (zh) 一种基于手机定位数据的城市居住区空置率动态监测方法
Demesouka et al. Using MACBETH multicriteria technique for GIS-based landfill suitability analysis
Liu et al. Route discovery from mining uncertain trajectories
CN109815419B (zh) 基于地理位置的兴趣点索引方法、装置、介质及电子设备
CN109688532A (zh) 一种划分城市功能区域的方法及装置
CN103955955B (zh) 一种电子地图信息处理方法及装置
CN104636457B (zh) 一种位置搜索认知的方法及装置
CN103914877A (zh) 一种基于扩展合并的三维模型多细节层次结构
Nikzad et al. Model-driven adaptive wireless sensing for environmental healthcare feedback systems
Guo et al. Urban Road Network and Taxi Network Modeling Based on Complex Network Theory.
CN116450958A (zh) 检测点选址方法、装置、电子设备及可读存储介质
CN110113716A (zh) 一种路径状态信息获取方法、装置及存储介质
CN116362606A (zh) 考虑级联失效的生活物资供应网络抗毁性测度方法、装置及介质
Waluyo et al. Mobile query services in a participatory embedded sensing environment
CN103458032A (zh) 一种空间数据访问规律动态统计及信息压缩的方法及系统
CN107832445A (zh) 数据索引方法、装置及电子设备
CN103020244B (zh) 区域影响分析系统及其分析方法
Lückenkötter et al. Methodology for an integrated climate change vulnerability assessment

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20200511

Address after: 310052 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Patentee after: Alibaba (China) Co.,Ltd.

Address before: 102200, No. 8, No., Changsheng Road, Changping District science and Technology Park, Beijing, China. 1-5

Patentee before: AUTONAVI SOFTWARE Co.,Ltd.

TR01 Transfer of patent right