CN106204118A - 一种用于商圈发现的方法与装置 - Google Patents

一种用于商圈发现的方法与装置 Download PDF

Info

Publication number
CN106204118A
CN106204118A CN201610509876.8A CN201610509876A CN106204118A CN 106204118 A CN106204118 A CN 106204118A CN 201610509876 A CN201610509876 A CN 201610509876A CN 106204118 A CN106204118 A CN 106204118A
Authority
CN
China
Prior art keywords
grid
bunch
boundary fitting
boundary
density
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610509876.8A
Other languages
English (en)
Inventor
项雯怡
高艾凤
阚长城
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201610509876.8A priority Critical patent/CN106204118A/zh
Publication of CN106204118A publication Critical patent/CN106204118A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0204Market segmentation
    • G06Q30/0205Location or geographical consideration

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明的目的是提供一种用于商圈发现的方法与装置。其中,将一城市区域划分为多个网格,计算其中每个网格的人流密度;从所述网格中确定核心网格,所述核心网格的密度范围内的所有网格的平均人流密度超过预定密度阈值;以一个所述核心网格作为起点,将其密度范围内的所有网格作为一个初始的网格簇,以获得一个最终的网格簇;将最终获得的每个网格簇作为一个商圈。与现有技术相比,本发明通过对城市区域的网格化来基于网格的人流密度合并关联网格,以根据最终获得的网格簇来重新界定商圈,并可为商家选址、物业定价、经营决策、商业推广等提供科学有效的决策支持。

Description

一种用于商圈发现的方法与装置
技术领域
本发明涉及地图信息技术领域,尤其涉及一种商圈发现的技术。
背景技术
所谓“商圈”,通常可认为是一个商业活动发生较为频繁和集中的区域。但商圈存在识别困难、实际覆盖范围难以界定等问题,现有的商圈发现,多是人工设定的,如通过人力收集人流量、居民人数、购物中心等数据,在此基础上根据行业经验界定商圈的范围。由此产生的问题是,采集成本大;商圈范围依赖人员的主观判断,无精确的商圈边界;覆盖率不高。
发明内容
本发明的目的是提供一种用于商圈发现的方法与装置。
根据本发明的一个方面,提供了一种商圈发现方法,其中,该方法包括以下步骤:
a将一城市区域划分为多个网格,计算其中每个网格的人流密度;
b从所述网格中确定核心网格,所述核心网格的密度范围内的所有网格的平均人流密度超过预定密度阈值,其中,所述密度范围包括以一网格为中心,以一预定距离为半径的范围,所述核心网格到其密度范围内的其他网格均为直接密度可达;
c以一个所述核心网格作为起点,将其密度范围内的所有网格作为一个初始的网格簇,以获得一个最终的网格簇,其中:
-从所述起点核心网格直接密度可达的每个核心网格查找其各自直接密度可达的下一批核心网格,进而从所述下一批核心网格继续查找其各自直接密度可达的再下一批核心网格,以此类推,直至最后查找到的核心网格在其密度范围内没有其他核心网格;
-将以上查找到的所有核心网格的网格簇加入所述初始的网格簇,以获得所述最终的网格簇;
d将最终获得的每个网格簇作为一个商圈。
根据本发明的另一个方面,还提供了一种商圈发现装置,其中,该装置包括:
-用于将一城市区域划分为多个网格,计算其中每个网格的人流密度的装置;
-用于从所述网格中确定核心网格的装置,所述核心网格的密度范围内的所有网格的平均人流密度超过预定密度阈值,其中,所述密度范围包括以一网格为中心,以一预定距离为半径的范围,所述核心网格到其密度范围内的其他网格均为直接密度可达;
-用于以一个所述核心网格作为起点,将其密度范围内的所有网格作为一个初始的网格簇,以获得一个最终的网格簇的装置,其中:
-从所述起点核心网格直接密度可达的每个核心网格查找其各自直接密度可达的下一批核心网格,进而从所述下一批核心网格继续查找其各自直接密度可达的再下一批核心网格,以此类推,直至最后查找到的核心网格在其密度范围内没有其他核心网格;
-将以上查找到的所有核心网格的网格簇加入所述初始的网格簇,以获得所述最终的网格簇;
-用于将最终获得的每个网格簇作为一个商圈的装置。
与现有技术相比,本发明通过对城市区域的网格化来基于网格的人流密度合并关联网格,以根据最终获得的网格簇来重新界定商圈,并可为商家选址、物业定价、经营决策、商业推广等提供科学有效的决策支持。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出根据本发明一个实施例的用于商圈发现的方法流程图;
图2示出根据本发明一个实施例的用于商圈发现的装置示意图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
在上下文中所称“计算机设备”,也称为“电脑”,是指可以通过运行预定程序或指令来执行数值计算和/或逻辑计算等预定处理过程的智能电子设备,其可以包括处理器与存储器,由处理器执行在存储器中预存的程序指令来执行预定处理过程,或是由ASIC、FPGA、DSP等硬件执行预定处理过程,或是由上述二者组合来实现。计算机设备包括但不限于服务器、个人电脑、笔记本电脑、平板电脑、智能手机等。
所述计算机设备例如包括移动终端与网络设备。其中,所述移动终端包括但不限于智能手机、PDA等;所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。其中,所述计算机设备可单独运行来实现本发明,也可接入网络并通过与网络中的其他计算机设备的交互操作来实现本发明。其中,所述计算机设备所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络等。
需要说明的是,所述移动终端、网络设备和网络等仅为举例,其他现有的或今后可能出现的计算机设备或网络如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
本文后面所讨论的方法(其中一些通过流程图示出)可以通过硬件、软件、固件、中间件、微代码、硬件描述语言或者其任意组合来实施。当用软件、固件、中间件或微代码来实施时,用以实施必要任务的程序代码或代码段可以被存储在机器或计算机可读介质(比如存储介质)中。(一个或多个)处理器可以实施必要的任务。
这里所公开的具体结构和功能细节仅仅是代表性的,并且是用于描述本发明的示例性实施例的目的。但是本发明可以通过许多替换形式来具体实现,并且不应当被解释成仅仅受限于这里所阐述的实施例。
应当理解的是,虽然在这里可能使用了术语“第一”、“第二”等等来描述各个单元,但是这些单元不应当受这些术语限制。使用这些术语仅仅是为了将一个单元与另一个单元进行区分。举例来说,在不背离示例性实施例的范围的情况下,第一单元可以被称为第二单元,并且类似地第二单元可以被称为第一单元。这里所使用的术语“和/或”包括其中一个或更多所列出的相关联项目的任意和所有组合。
应当理解的是,当一个单元被称为“连接”或“耦合”到另一单元时,其可以直接连接或耦合到所述另一单元,或者可以存在中间单元。与此相对,当一个单元被称为“直接连接”或“直接耦合”到另一单元时,则不存在中间单元。应当按照类似的方式来解释被用于描述单元之间的关系的其他词语(例如“处于...之间”相比于“直接处于...之间”,“与...邻近”相比于“与...直接邻近”等等)。
这里所使用的术语仅仅是为了描述具体实施例而不意图限制示例性实施例。除非上下文明确地另有所指,否则这里所使用的单数形式“一个”、“一项”还意图包括复数。还应当理解的是,这里所使用的术语“包括”和/或“包含”规定所陈述的特征、整数、步骤、操作、单元和/或组件的存在,而不排除存在或添加一个或更多其他特征、整数、步骤、操作、单元、组件和/或其组合。
还应当提到的是,在一些替换实现方式中,所提到的功能/动作可以按照不同于附图中标示的顺序发生。举例来说,取决于所涉及的功能/动作,相继示出的两幅图实际上可以基本上同时执行或者有时可以按照相反的顺序来执行。
下面结合附图对本发明作进一步详细描述。
图1示出根据本发明的一个实施例的方法流程图,其中具体示出一种商圈发现过程。该方法典型地在网络设备端实现。
如图1所示,在步骤S1中,网络设备将一城市区域划分为多个网格,计算其中每个网格的人流密度;在步骤S2中,网络设备从所述网格中确定核心网格;在步骤S3中,网络设备以一个所述核心网格作为起点,将其密度范围内的所有网格作为一个初始的网格簇,以获得一个最终的网格簇;在步骤S4中,网络设备将最终获得的每个网格簇作为一个商圈。
具体地,在步骤S1中,网络设备将一城市区域划分为多个网格,计算其中每个网格的人流密度。
本发明的商圈发现是基于城市为单位来进行的。
例如,网络设备将整个城市范围的定位坐标(x,y)映射到网格,其中每个网格可以被标记为(gridx,gridy)=floor(x/interval,y/interval),其中,interval为网格边长,floor函数为对浮点数的向下取整函数。
统计每个网格中所有商业实体的日平均人流量,以作为相应网格的人流密度。其中,商业实体可以是兴趣点(POI,Point of Interest),具体如各商家。
优选地,为了充分考虑网格的商业属性,每个网格的人流密度可以基于预定周期内所有节假日的日平均人流量来确定。例如,以1个网格举例,累加一个月内节假日在该网格定位的记录条数,并除以该月内的总节假日天数,即可获得该网格的人流密度。
在引入人流密度之后,每个网格可以被标记为一个三元组(x,y,num),其中x和y为网格编号,num为该网格的人流密度。
随后,在步骤S2中,网络设备从多个网格中确定核心网格。
在此,定义本发明的若干概念如下:
网格之间的距离d=max(abs(x1-x2),abs(y1-y2)),其中,abs函数为取绝对值函数,max函数为取最大值函数。
网格的密度范围:以一网格为中心,以一预定距离为半径的范围,该半径可被标记为e,从而该密度范围在本说明书中有时也被称为E领域。
核心网格:如果一个网格的密度范围内的所有网格的平均人流密度超过预定密度阈值,则该网格为一个核心网格,核心网格可被标记为P。
直接密度可达:核心网格P到其密度范围内的其他网格均为直接密度可达;也即,如果网格Q在核心网格P的密度范围内,则网格Q从核心网格P直接密度可达。
密度可达:给定一系列核心网格P1,P2…Pn,如果核心网格Pi从核心网格Pi-1直接密度可达,则核心网格P1从核心网格P2…Pn各自E领域内的所有网格密度可达。
任选一个网格开始,网络设备确定该网格是否为核心网格。
例如,选择任一网格,网络设备查找到其E领域内的所有网格,计算这些网格的平均人流密度,如果该网格的E领域的平均人流密度超过预定密度阈值,则该网格为核心网格。
接着,在步骤S3中,网络设备以一个核心网格作为起点,将其密度范围内的所有网格作为一个初始的网格簇,以获得一个最终的网格簇。
其中,从该起点核心网格P0直接密度可达的每个核心网格P11-P1n查找其各自直接密度可达的下一批核心网格P21-P2n,进而从这些下一批核心网格P21-P2n继续查找其各自直接密度可达的再下一批核心网格P31-P3n,以此类推,直至最后查找到的核心网格在其密度范围内没有其他核心网格;将以上查找到的所有核心网格的网格簇加入该起点核心网格P0的初始网格簇,以获得最终的网格簇。
根据本发明的一个优选实施例,以一个网格为起点,循环执行步骤S2和步骤S3来获得该城市区域内的所有网格簇。
具体地,在步骤S2中,从任一网格开始,直至查找到一个核心网格,将其标记为起点核心网格P0,接下来转至步骤S3。
在步骤S3中,首先将该起点核心网格P0的E领域内的所有网格作为一个初始网格簇,进而查找该E领域内的其他核心网格,分别标记为如一级核心网格P11-P1n,这些一级核心网格P11-P1n从起点核心网格P0直接密度可达。
对于一级核心网格P11-P1n,继续查找其各自E领域内的其他核心网格,分别标记为如二级核心网格P21-P2n。这可以被认为是相对于起点核心网格P0的E领域的第一次外扩。以一个一级核心网格P11为例,其E领域内还可包括三个二级核心网格P21-P23。
对各二级核心网格P21-P2n,继续在其各自的E领域内查找其他核心网格,分别标记为如三级核心网格P31-P3n。这可以被认为是相对于起点核心网格P0的E领域的第二次外扩。
基于各三级核心网格P31-P3n,继续上述外扩操作,直至最后一次外扩后,如标记为第x-1次外扩,各x级核心网格Px1-Pxn的E领域内不再有其他核心网格。
将在步骤S3中查找到的所有核心网格的E领域内的所有网格加入初始网格簇,以获得最终的网格簇G1。可替代地,在步骤S3中,每查找到一个核心网格,即将该核心网格的网格簇合并至该初始网格簇,直至所查找到的最后一个核心网格的网格簇被并入来获得最终的网格簇G1。
从该起点核心网格P0来看,其从自身E领域(如标记为E0)内的各网格直接密度可达,其从网格簇G1中除E0内网格的其他网格密度可达。
至此,此次步骤S2和步骤S3的循环结束。
查找下一个待处理的网格,即尚未被纳入网格簇G1中的网格,从该新网格开始再次执行上述步骤S2和步骤S3,以获得下一网格簇G2,直至所有网格均被遍历。
根据本发明的另一个优选实施例,在步骤S2中查找到所有的核心网格,并以任一个核心网格为起点,循环执行步骤S3来获得该城市区域内的所有网格簇。
具体地,在步骤S2中,根据各网格的E领域内的平均人流密度,查找到所有的核心网格。
在步骤S3中,任选一核心网格将其作为起点核心网格P0,该起点核心网格P0的E领域内的所有网格作为一个初始网格簇,进而查找该E领域内的其他核心网格,分别标记为如一级核心网格P11-P1n,这些一级核心网格P11-P1n从起点核心网格P0直接密度可达。
对于一级核心网格P11-P1n,继续查找其各自E领域内的其他核心网格,分别标记为如二级核心网格P21-P2n。这可以被认为是相对于起点核心网格P0的E领域的一次外扩。以一个一级核心网格P11为例,其E领域内还包括三个二级核心网格P21-P23。
对各二级核心网格P21-P2n,继续在其各自的E领域内查找其他核心网格,分别标记为如三级核心网格P31-P3n。这可以被认为是相对于起点核心网格P0的E领域的二次外扩。
基于各三级核心网格P31-P3n,继续上述外扩操作,直至最后一次外扩后,如标记为第x-1次外扩,各x级核心网格Px1-Pxn的E领域内不再有其他核心网格。
将在步骤S3中查找到的所有核心网格的E领域内的所有网格加入初始网格簇,以获得最终的网格簇G1。可替代地,在步骤S3中,每查找到一个核心网格,即将该核心网格的网格簇合并至该初始网格簇,直至所查找到的最后一个核心网格的网格簇被并入来获得最终的网格簇G1。至此,步骤S3的此次操作结束。
从该起点核心网格P0来看,其从自身E领域(如标记为E0)内的各网格直接密度可达,其从网格簇G1中除E0内网格的其他网格密度可达。
查找下一个待处理的核心网格,即尚未被纳入网格簇G1中的核心网格,从该新核心网格开始再次执行上述步骤S3,以获得下一网格簇G2,直至所有核心网格均被遍历。
在步骤S4中,网络设备将最终获得的每个网格簇作为一个商圈。
基于步骤S1-步骤S3,网络设备获得多个网格簇G1,G2…Gn。据此,在步骤S4中,网络设备将每个网格簇作为一个商圈。每个网格簇的边缘网格的坐标串联后,即为相应商圈的边界坐标。
根据本发明的一个优选实施例,在图1所示过程的基础上,本发明还可进一步包括以下步骤(图1未示出):在步骤S5中,网络设备计算每个商圈中包含的各类别的热度值,每个类别的热度值基于该类别所包括的兴趣点的热门度来确定。
例如,将一个兴趣点POI定义为一个四元组(x,y,hot,type),其中x和y为POI的坐标,hot为POI的热门度,type为POI的类别。POI的热门度例如可以是搜索热度,该数值可以通过挖掘用户基于地址的搜索行为得出,如在百度地图或大众点评中对POI的搜索量,反映了POI的重要性及热门程度。
首先统计一个商圈中各POI的类别,例如超市、购物中心、快餐等,以确定与该商圈相关的类别,进而确定各类别的热度值,如将其标记为Hj。Hj=∑hoti,typei=j,其中j表示每个具体类别,则Hj为各类别所包含的所有POI的热门度的总和。
进一步地,基于一个行业所关注类别在每个商圈的热度值以及其中每个类别的权重,网络设备可以确定该行业在各商圈的行业指数。
例如,为了能够获得一致的参照,可以先对每个商圈中各类别的热度值Hj进行标准化,如采用Z-score标准化方法获得标准化后的S(Hj),其中S(Hj)=(Hj-平均值)/标准差。其中,平均值例如一城市内所有商圈的所有类别的热度值Hj的平均值,标准差(也即均方差)也由此确定。
各行业例如餐饮、购物、商务等,据此,一个行业在一个商圈中的行业指数V=∑s(Hj)*wj,j∈T,其中T为该行业所关注类别的集合,向量w为各类别的权重值,T和w由行业领域知识和不同类别的相关性综合考虑得出。
更进一步地,根据一个或多个行业各自的行业指数,网络设备可以对各商圈进行分类和/或筛选。
例如,根据具体业务需求,网络设备可以根据各行业的行业指数来筛选商圈或对商圈进行分类。
图2示出根据本发明的一个实施例的装置示意图,其中具体示出一种商圈发现装置。该商圈发现装置典型地被装置于网络设备端,例如可以被装置于云端的任一台或多台网络设备中。
如图2所示,商圈发现装置20包括网格划分装置21、核心确定装置22、簇获取装置23和商圈获取装置24。
其中,网格划分装置21将一城市区域划分为多个网格,计算其中每个网格的人流密度;核心确定装置22从所述网格中确定核心网格;簇获取装置23以一个所述核心网格作为起点,将其密度范围内的所有网格作为一个初始的网格簇,以获得一个最终的网格簇;商圈获取装置24将最终获得的每个网格簇作为一个商圈。
具体地,网格划分装置21将一城市区域划分为多个网格,计算其中每个网格的人流密度。
本发明的商圈发现是基于城市为单位来进行的。
例如,网格划分装置21将整个城市范围的定位坐标(x,y)映射到网格,其中每个网格可以被标记为(gridx,gridy)=floor(x/interval,y/interval),其中,interval为网格边长,floor函数为对浮点数的向下取整函数。
统计每个网格中所有商业实体的日平均人流量,以作为相应网格的人流密度。其中,商业实体可以是兴趣点(POI,Point of Interest),具体如各商家。
优选地,为了充分考虑网格的商业属性,每个网格的人流密度可以基于预定周期内所有节假日的日平均人流量来确定。例如,以1个网格举例,累加一个月内节假日在该网格定位的记录条数,并除以该月内的总节假日天数,即可获得该网格的人流密度。
在引入人流密度之后,每个网格可以被标记为一个三元组(x,y,num),其中x和y为网格编号,num为该网格的人流密度。
随后,核心确定装置22从多个网格中确定核心网格。
任选一个网格开始,核心确定装置22确定该网格是否为核心网格。
例如,选择任一网格,核心确定装置22查找到其E领域内的所有网格,计算这些网格的平均人流密度,如果该网格的E领域的平均人流密度超过预定密度阈值,则该网格为核心网格。
接着,簇获取装置23以一个核心网格作为起点,将其密度范围内的所有网格作为一个初始的网格簇,以获得一个最终的网格簇。
其中,从该起点核心网格P0直接密度可达的每个核心网格P11-P1n查找其各自直接密度可达的下一批核心网格P21-P2n,进而从这些下一批核心网格P21-P2n继续查找其各自直接密度可达的再下一批核心网格P31-P3n,以此类推,直至最后查找到的核心网格在其密度范围内没有其他核心网格;将以上查找到的所有核心网格的网格簇加入由该起点核心网格P0确定的初始网格簇,以获得最终的网格簇。
根据本发明的一个优选实施例,以一个网格为起点,核心确定装置22和簇获取装置23循环执行其各自的操作来获得该城市区域内的所有网格簇。
具体地,核心确定装置22从任一网格开始,直至查找到一个核心网格,将其标记为起点核心网格P0,并将该起点核心网格P0传递给簇获取装置23。
簇获取装置23首先将该起点核心网格P0的E领域内的所有网格作为一个初始网格簇,进而查找该E领域内的其他核心网格,分别标记为如一级核心网格P11-P1n,这些一级核心网格P11-P1n从起点核心网格P0直接密度可达。
对于一级核心网格P11-P1n,继续查找其各自E领域内的其他核心网格,分别标记为如二级核心网格P21-P2n。这可以被认为是相对于起点核心网格P0的E领域的第一次外扩。以一个一级核心网格P11为例,其E领域内还可包括三个二级核心网格P21-P23。
对各二级核心网格P21-P2n,继续在其各自的E领域内查找其他核心网格,分别标记为如三级核心网格P31-P3n。这可以被认为是相对于起点核心网格P0的E领域的第二次外扩。
基于各三级核心网格P31-P3n,继续上述外扩操作,直至最后一次外扩后,如标记为第x-1次外扩,各x级核心网格Px1-Pxn的E领域内不再有其他核心网格。
将簇获取装置23查找到的所有核心网格的E领域内的所有网格加入初始网格簇,以获得最终的网格簇G1。可替代地,每查找到一个核心网格,簇获取装置23即将该核心网格的网格簇合并至该初始网格簇,直至所查找到的最后一个核心网格的网格簇被并入来获得最终的网格簇G1。
至此,核心确定装置22和簇获取装置23所执行的此次循环结束。
从该起点核心网格P0来看,其从自身E领域(如标记为E0)内的各网格直接密度可达,其从网格簇G1中除E0内网格的其他网格密度可达。
查找下一个待处理的网格,即尚未被纳入网格簇G1中的网格,以从该新网格开始再次由核心确定装置22和簇获取装置23执行上述循环,以获得下一网格簇G2,直至所有网格均被遍历。
根据本发明的另一个优选实施例,核心确定装置22查找到所有的核心网格,簇获取装置23以任一个核心网格为起点,循环执行其操作来获得该城市区域内的所有网格簇。
具体地,核心确定装置22根据各网格的E领域内的平均人流密度,查找到所有的核心网格。
簇获取装置23任选一核心网格将其作为起点核心网格P0,该起点核心网格P0的E领域内的所有网格作为一个初始网格簇,进而查找该E领域内的其他核心网格,分别标记为如一级核心网格P11-P1n,这些一级核心网格P11-P1n从起点核心网格P0直接密度可达。
对于一级核心网格P11-P1n,继续查找其各自E领域内的其他核心网格,分别标记为如二级核心网格P21-P2n。这可以被认为是相对于起点核心网格P0的E领域的一次外扩。以一个一级核心网格P11为例,其E领域内还包括三个二级核心网格P21-P23。
对各二级核心网格P21-P2n,继续在其各自的E领域内查找其他核心网格,分别标记为如三级核心网格P31-P3n。这可以被认为是相对于起点核心网格P0的E领域的二次外扩。
基于各三级核心网格P31-P3n,继续上述外扩操作,直至最后一次外扩后,如标记为第x-1次外扩,各x级核心网格Px1-Pxn的E领域内不再有其他核心网格。
将簇获取装置23查找到的所有核心网格的E领域内的所有网格加入初始网格簇,以获得最终的网格簇G1。可替代地,每查找到一个核心网格,簇获取装置23即将该核心网格的网格簇合并至该初始网格簇,直至所查找到的最后一个核心网格的网格簇被并入来获得最终的网格簇G1。
至此,簇获取装置23的此次操作结束。
从该起点核心网格P0来看,其从自身E领域(如标记为E0)内的各网格直接密度可达,其从网格簇G1中除E0内网格的其他网格密度可达。
查找下一个待处理的核心网格,即尚未被纳入网格簇G1中的核心网格,簇获取装置23从该新核心网格开始再次执行上述操作,以获得下一网格簇G2,直至所有核心网格均被遍历。
商圈获取装置24将最终获得的每个网格簇作为一个商圈。
簇获取装置23获得多个网格簇G1,G2…Gn,据此,商圈获取装置24将每个网格簇作为一个商圈。每个网格簇的边缘网格的坐标串联后,即为相应商圈的边界坐标。
根据本发明的一个优选实施例,商圈发现装置还可进一步包括分类热度装置(图2未示出)。分类热度装置计算每个商圈中包含的各类别的热度值,每个类别的热度值基于该类别所包括的兴趣点的热门度来确定。
例如,将一个兴趣点POI定义为一个四元组(x,y,hot,type),其中x和y为POI的坐标,hot为POI的热门度,type为POI的类别。POI的热门度例如可以是搜索热度,该数值可以通过挖掘用户基于地址的搜索行为得出,如在百度地图或大众点评中对POI的搜索量,反映了POI的重要性及热门程度。
分类热度装置首先统计一个商圈中各POI的类别,例如超市、购物中心、快餐等,以确定与该商圈相关的类别,进而确定各类别的热度值,如将其标记为Hj。Hj=∑hoti,typei=j,其中j表示每个具体类别,则Hj为各类别所包含的所有POI的热门度的总和。
进一步地,商圈发现装置还可进一步包括行业指数装置(图2未示出)。基于一个行业所关注类别在每个商圈的热度值以及其中每个类别的权重,行业指数装置可以确定该行业在各商圈的行业指数。
例如,为了能够获得一致的参照,行业指数装置可以先对每个商圈中各类别的热度值Hj进行标准化,如采用Z-score标准化方法获得标准化后的S(Hj),其中S(Hj)=(Hj-平均值)/标准差。其中,平均值例如一城市内所有商圈的所有类别的热度值Hj的平均值,标准差(也即均方差)也由此确定。
各行业例如餐饮、购物、商务等,据此,一个行业在一个商圈中的行业指数V=∑s(Hj)*wj,j∈T,其中T为该行业所关注类别的集合,向量w为各类别的权重值,T和w由行业领域知识和不同类别的相关性综合考虑得出。
更进一步地,商圈发现装置还可进一步包括商圈筛选装置(图2未示出)。根据一个或多个行业各自的行业指数,商圈筛选装置可以对各商圈进行分类和/或筛选。
例如,根据具体业务需求,商圈筛选装置可以根据各行业的行业指数来筛选商圈或对商圈进行分类。
需要注意的是,本发明可在软件和/或软件与硬件的组合体中被实施,例如,本发明的各个装置可采用专用集成电路(ASIC)或任何其他类似硬件设备来实现。在一个实施例中,本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (14)

1.一种商圈发现方法,其中,该方法包括以下步骤:
a将一城市区域划分为多个网格,计算其中每个网格的人流密度;
b从所述网格中确定核心网格,所述核心网格的密度范围内的所有网格的平均人流密度超过预定密度阈值,其中,所述密度范围包括以一网格为中心,以一预定距离为半径的范围,所述核心网格到其密度范围内的其他网格均为直接密度可达;
c以一个所述核心网格作为起点,将其密度范围内的所有网格作为一个初始的网格簇,以获得一个最终的网格簇,其中:
-从所述起点核心网格直接密度可达的每个核心网格查找其各自直接密度可达的下一批核心网格,进而从所述下一批核心网格继续查找其各自直接密度可达的再下一批核心网格,以此类推,直至最后查找到的核心网格在其密度范围内没有其他核心网格;
-将以上查找到的所有核心网格的网格簇加入所述初始的网格簇,以获得所述最终的网格簇;
d将最终获得的每个网格簇作为一个商圈。
2.根据权利要求1所述的方法,其中,所述步骤b在查找到一个核心网格时转入所述步骤c,在所述步骤c中以该核心网格作为起点来获得一个最终的网格簇之后,对一尚未被纳入到所述最终的网格簇的网格重复上述步骤b和c,直至所有网格均被处理完毕。
3.根据权利要求1所述的方法,其中,所述步骤b中确定所有的核心网格,所述步骤c中以任一核心网格作为起点来获得一个最终的网格簇之后,重复上述步骤c,直至每个核心网格均被纳入一个最终的网格簇。
4.根据权利要求1至3中任一项所述的方法,其中,所述人流密度基于预定周期内所有节假日的日平均人流量来确定。
5.根据权利要求1至4中任一项所述的方法,其中,该方法还包括:
-计算每个商圈中包含的各类别的热度值,所述热度值基于每个类别所包括的兴趣点的热门度来确定。
6.根据权利要求5所述的方法,该方法还包括:
-基于一个行业所关注类别在每个商圈的热度值以及其中每个类别的权重,确定该行业在各商圈的行业指数。
7.根据权利要求6所述的方法,其中,该方法还包括:
-根据一个或多个行业各自的行业指数,对商圈进行分类和/或筛选。
8.一种商圈发现装置,其中,该装置包括:
-用于将一城市区域划分为多个网格,计算其中每个网格的人流密度的装置;
-用于从所述网格中确定核心网格的装置,所述核心网格的密度范围内的所有网格的平均人流密度超过预定密度阈值,其中,所述密度范围包括以一网格为中心,以一预定距离为半径的范围,所述核心网格到其密度范围内的其他网格均为直接密度可达;
-用于以一个所述核心网格作为起点,将其密度范围内的所有网格作为一个初始的网格簇,以获得一个最终的网格簇的装置,其中:
-从所述起点核心网格直接密度可达的每个核心网格查找其各自直接密度可达的下一批核心网格,进而从所述下一批核心网格继续查找其各自直接密度可达的再下一批核心网格,以此类推,直至最后查找到的核心网格在其密度范围内没有其他核心网格;
-将以上查找到的所有核心网格的网格簇加入所述初始的网格簇,以获得所述最终的网格簇;
-用于将最终获得的每个网格簇作为一个商圈的装置。
9.根据权利要求8所述的装置,其中,在查找到一个核心网格时,以该核心网格作为起点来获得一个最终的网格簇之后,对一尚未被纳入到所述最终的网格簇的网格重复上述核心网格判断操作和最终网格簇的获取操作,直至所有网格均被处理完毕。
10.根据权利要求8所述的装置,其中,先确定所有的核心网格,在以任一核心网格作为起点来获得一个最终的网格簇之后,重复上述最终网格簇的获取操作,直至每个核心网格均被纳入一个最终的网格簇。
11.根据权利要求8至10中任一项所述的装置,其中,所述人流密度基于预定周期内所有节假日的日平均人流量来确定。
12.根据权利要求8至11中任一项所述的装置,其中,该装置还包括:
-用于计算每个商圈中包含的各类别的热度值的装置,所述热度值基于每个类别所包括的兴趣点的热门度来确定。
13.根据权利要求12所述的装置,该装置还包括:
-用于基于一个行业所关注类别在每个商圈的热度值以及其中每个类别的权重,确定该行业在各商圈的行业指数的装置。
14.根据权利要求13所述的装置,其中,该装置还包括:
-用于根据一个或多个行业各自的行业指数,对商圈进行分类和/或筛选的装置。
CN201610509876.8A 2016-06-30 2016-06-30 一种用于商圈发现的方法与装置 Pending CN106204118A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610509876.8A CN106204118A (zh) 2016-06-30 2016-06-30 一种用于商圈发现的方法与装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610509876.8A CN106204118A (zh) 2016-06-30 2016-06-30 一种用于商圈发现的方法与装置

Publications (1)

Publication Number Publication Date
CN106204118A true CN106204118A (zh) 2016-12-07

Family

ID=57463368

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610509876.8A Pending CN106204118A (zh) 2016-06-30 2016-06-30 一种用于商圈发现的方法与装置

Country Status (1)

Country Link
CN (1) CN106204118A (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107124476A (zh) * 2017-07-04 2017-09-01 百度在线网络技术(北京)有限公司 信息推送方法和装置
CN108009677A (zh) * 2017-11-29 2018-05-08 黑龙江鑫联华信息股份有限公司 一种选址方法
CN108229740A (zh) * 2017-12-29 2018-06-29 百度在线网络技术(北京)有限公司 一种商圈边界的确定方法、装置、服务器及存储介质
CN108280685A (zh) * 2018-01-19 2018-07-13 百度在线网络技术(北京)有限公司 信息获取方法和装置
CN108876440A (zh) * 2018-05-29 2018-11-23 阿里巴巴集团控股有限公司 区域划分方法和服务器
CN108875013A (zh) * 2018-06-19 2018-11-23 百度在线网络技术(北京)有限公司 处理地图数据的方法及装置
CN109003107A (zh) * 2017-06-06 2018-12-14 北京嘀嘀无限科技发展有限公司 区域划分方法及装置
CN109118265A (zh) * 2018-06-27 2019-01-01 阿里巴巴集团控股有限公司 商圈确定方法、装置和服务器
CN109409938A (zh) * 2018-09-30 2019-03-01 拉卡拉支付股份有限公司 商圈圈定方法和装置
CN109583799A (zh) * 2017-09-28 2019-04-05 北京三快在线科技有限公司 区域划分的方法及装置、电子设备
CN110188968A (zh) * 2018-02-22 2019-08-30 北京嘀嘀无限科技发展有限公司 区域划分、热度统计的方法及装置
CN110335068A (zh) * 2019-06-18 2019-10-15 平安普惠企业管理有限公司 一种商户聚集区域确定方法及装置
CN110556049A (zh) * 2018-06-04 2019-12-10 百度在线网络技术(北京)有限公司 一种地图数据处理方法、装置、服务器和存储介质
CN111708859A (zh) * 2020-06-18 2020-09-25 中科宇图科技股份有限公司 一种基于空间数据的商圈边界识别方法
CN111932318A (zh) * 2020-09-21 2020-11-13 腾讯科技(深圳)有限公司 区域划分方法、装置、电子设备及计算机可读存储介质
CN112258126A (zh) * 2020-11-06 2021-01-22 拉扎斯网络科技(上海)有限公司 位置数据的校验方法、装置及计算设备
CN112766718A (zh) * 2021-01-18 2021-05-07 华南理工大学 城市商圈边界识别方法、系统、计算机设备及存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102063486A (zh) * 2010-12-28 2011-05-18 东北大学 一种面向多维数据管理的云计算平台查询处理方法
CN103164487A (zh) * 2011-12-19 2013-06-19 中国科学院声学研究所 一种基于密度与几何信息的聚类算法
CN103714153A (zh) * 2013-12-26 2014-04-09 西安理工大学 基于限定区域数据取样的密度聚类方法
CN103744861A (zh) * 2013-12-12 2014-04-23 深圳先进技术研究院 一种轨迹数据中的频繁子轨迹查找方法及装置
CN103839291A (zh) * 2014-02-19 2014-06-04 百度在线网络技术(北京)有限公司 构建三维地形的方法及装置
CN103902655A (zh) * 2014-02-28 2014-07-02 小米科技有限责任公司 聚类方法、装置及终端设备
CN103902636A (zh) * 2012-12-30 2014-07-02 腾讯科技(深圳)有限公司 基于过滤聚类法推送信息的方法和服务器
CN104991924A (zh) * 2015-06-26 2015-10-21 百度在线网络技术(北京)有限公司 用于确定新供应点的地址的方法和装置
CN105320656A (zh) * 2014-05-30 2016-02-10 广州市邦富软件有限公司 一种基于密度的文章聚合算法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102063486A (zh) * 2010-12-28 2011-05-18 东北大学 一种面向多维数据管理的云计算平台查询处理方法
CN103164487A (zh) * 2011-12-19 2013-06-19 中国科学院声学研究所 一种基于密度与几何信息的聚类算法
CN103902636A (zh) * 2012-12-30 2014-07-02 腾讯科技(深圳)有限公司 基于过滤聚类法推送信息的方法和服务器
CN103744861A (zh) * 2013-12-12 2014-04-23 深圳先进技术研究院 一种轨迹数据中的频繁子轨迹查找方法及装置
CN103714153A (zh) * 2013-12-26 2014-04-09 西安理工大学 基于限定区域数据取样的密度聚类方法
CN103839291A (zh) * 2014-02-19 2014-06-04 百度在线网络技术(北京)有限公司 构建三维地形的方法及装置
CN103902655A (zh) * 2014-02-28 2014-07-02 小米科技有限责任公司 聚类方法、装置及终端设备
CN105320656A (zh) * 2014-05-30 2016-02-10 广州市邦富软件有限公司 一种基于密度的文章聚合算法
CN104991924A (zh) * 2015-06-26 2015-10-21 百度在线网络技术(北京)有限公司 用于确定新供应点的地址的方法和装置

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109003107B (zh) * 2017-06-06 2020-12-04 北京嘀嘀无限科技发展有限公司 区域划分方法及装置
CN109003107A (zh) * 2017-06-06 2018-12-14 北京嘀嘀无限科技发展有限公司 区域划分方法及装置
CN107124476B (zh) * 2017-07-04 2020-04-10 百度在线网络技术(北京)有限公司 信息推送方法和装置
CN107124476A (zh) * 2017-07-04 2017-09-01 百度在线网络技术(北京)有限公司 信息推送方法和装置
CN109583799B (zh) * 2017-09-28 2021-07-30 北京三快在线科技有限公司 区域划分的方法及装置、电子设备
CN109583799A (zh) * 2017-09-28 2019-04-05 北京三快在线科技有限公司 区域划分的方法及装置、电子设备
CN108009677A (zh) * 2017-11-29 2018-05-08 黑龙江鑫联华信息股份有限公司 一种选址方法
CN108009677B (zh) * 2017-11-29 2021-11-30 黑龙江鑫联华信息股份有限公司 一种选址方法
CN108229740A (zh) * 2017-12-29 2018-06-29 百度在线网络技术(北京)有限公司 一种商圈边界的确定方法、装置、服务器及存储介质
CN108229740B (zh) * 2017-12-29 2022-02-11 百度在线网络技术(北京)有限公司 一种商圈边界的确定方法、装置、服务器及存储介质
CN108280685B (zh) * 2018-01-19 2019-07-23 百度在线网络技术(北京)有限公司 信息获取方法和装置
CN108280685A (zh) * 2018-01-19 2018-07-13 百度在线网络技术(北京)有限公司 信息获取方法和装置
CN110188968A (zh) * 2018-02-22 2019-08-30 北京嘀嘀无限科技发展有限公司 区域划分、热度统计的方法及装置
CN108876440A (zh) * 2018-05-29 2018-11-23 阿里巴巴集团控股有限公司 区域划分方法和服务器
CN108876440B (zh) * 2018-05-29 2021-09-03 创新先进技术有限公司 区域划分方法和服务器
CN110556049A (zh) * 2018-06-04 2019-12-10 百度在线网络技术(北京)有限公司 一种地图数据处理方法、装置、服务器和存储介质
CN110556049B (zh) * 2018-06-04 2021-11-12 百度在线网络技术(北京)有限公司 一种地图数据处理方法、装置、服务器和存储介质
CN108875013A (zh) * 2018-06-19 2018-11-23 百度在线网络技术(北京)有限公司 处理地图数据的方法及装置
CN109118265A (zh) * 2018-06-27 2019-01-01 阿里巴巴集团控股有限公司 商圈确定方法、装置和服务器
CN109409938A (zh) * 2018-09-30 2019-03-01 拉卡拉支付股份有限公司 商圈圈定方法和装置
CN110335068A (zh) * 2019-06-18 2019-10-15 平安普惠企业管理有限公司 一种商户聚集区域确定方法及装置
CN111708859A (zh) * 2020-06-18 2020-09-25 中科宇图科技股份有限公司 一种基于空间数据的商圈边界识别方法
CN111708859B (zh) * 2020-06-18 2023-04-25 中科宇图科技股份有限公司 一种基于空间数据的商圈边界识别方法
CN111932318A (zh) * 2020-09-21 2020-11-13 腾讯科技(深圳)有限公司 区域划分方法、装置、电子设备及计算机可读存储介质
CN112258126A (zh) * 2020-11-06 2021-01-22 拉扎斯网络科技(上海)有限公司 位置数据的校验方法、装置及计算设备
CN112258126B (zh) * 2020-11-06 2022-03-04 拉扎斯网络科技(上海)有限公司 位置数据的校验方法、装置及计算设备
CN112766718A (zh) * 2021-01-18 2021-05-07 华南理工大学 城市商圈边界识别方法、系统、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
CN106204118A (zh) 一种用于商圈发现的方法与装置
US10496678B1 (en) Systems and methods for generating and implementing knowledge graphs for knowledge representation and analysis
US9530217B2 (en) Segmentation of an image based on color and color differences
CN106445931B (zh) 数据库节点关联关系展示方法及装置
US7627599B2 (en) Method, apparatus, and program product for visualizing tree structured information
CN106488400B (zh) 生成地理围栏的方法及装置
US20130218864A1 (en) Real Estate Search Engine
CN103870604B (zh) 旅游推荐方法和装置
CN109711399A (zh) 基于图像的店铺识别方法、装置,电子设备
CN108520142B (zh) 一种城市群边界识别方法、装置、设备及存储介质
EP2572267A2 (en) Preference stack
CN107506499A (zh) 兴趣点与建筑物之间建立逻辑关系的方法、装置及服务器
CN109903086A (zh) 一种相似人群扩展方法、装置及电子设备
CN112214616B (zh) 知识图谱流畅展示方法、装置
Li et al. A method based on an adaptive radius cylinder model for detecting pole-like objects in mobile laser scanning data
CN109324796A (zh) 界面布局方法及装置
US20230267660A1 (en) Generating simplified map shapes
Zielasko et al. Interactive 3D force‐directed edge bundling
US11232470B2 (en) Customer flow line and customer flow hot zone determining method and apparatus
US20130219315A1 (en) Graphical User Interface for Real Estate Search
CN110189318A (zh) 带有语义特征得分的肺结节检测方法和系统
JP7422682B2 (ja) 改良された地理的指標付け
CN109299975A (zh) 对象特征参数确定方法、装置、电子设备及可读存储介质
Zhang et al. Multi-hierarchical spatial clustering for characteristic towns in China: An Orange-based framework to integrate GIS and Geodetector
Nguyen et al. A method for efficient clustering of spatial data in network space

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20161207

RJ01 Rejection of invention patent application after publication