CN108182253A - 用于生成信息的方法和装置 - Google Patents

用于生成信息的方法和装置 Download PDF

Info

Publication number
CN108182253A
CN108182253A CN201711481998.1A CN201711481998A CN108182253A CN 108182253 A CN108182253 A CN 108182253A CN 201711481998 A CN201711481998 A CN 201711481998A CN 108182253 A CN108182253 A CN 108182253A
Authority
CN
China
Prior art keywords
geographic area
interest
point
area
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711481998.1A
Other languages
English (en)
Other versions
CN108182253B (zh
Inventor
阚长城
项雯怡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201711481998.1A priority Critical patent/CN108182253B/zh
Publication of CN108182253A publication Critical patent/CN108182253A/zh
Application granted granted Critical
Publication of CN108182253B publication Critical patent/CN108182253B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries

Abstract

本申请实施例公开了用于生成信息的方法和装置。该方法的一具体实施方式包括:获取以下数据:总地理区域内的至少一个类别的兴趣点的热度值,该总地理区域内的、该至少一个类别中的目标类别的兴趣点的热度值,该总地理区域所包括的至少一个地理区域中的目标地理区域内的、该目标类别的兴趣点的热度值,以及该目标地理区域内的兴趣点的热度值,其中,该热度值是根据兴趣点的搜索数据和/或线下访问数据确定的;基于所获取的数据,生成该目标类别的兴趣点在该目标地理区域内的重要性信息。本申请实施例通过生成目标类别的兴趣点在地理区域内的重要性信息,实现了对目标类别的兴趣点在地理区域内的重要程度进行确定。

Description

用于生成信息的方法和装置
技术领域
本申请实施例涉及计算机技术领域,具体涉及互联网技术领域,尤其涉及用于生成信息的方法和装置。
背景技术
兴趣点(Point of Interest)是电子地图中的重要信息。每个兴趣点对应一个地理目标,可以包括名称、类别和经纬度等等。兴趣点可以是景点、公司、商场和饭馆等。不同POI的重要性不尽相同。
发明内容
本申请实施例提出了用于生成信息的方法和装置。
第一方面,本申请实施例提供了一种用于生成信息的方法,包括:获取以下数据:总地理区域内的至少一个类别的兴趣点的热度值,总地理区域内的、至少一个类别中的目标类别的兴趣点的热度值,总地理区域所包括的至少一个地理区域中的目标地理区域内的、目标类别的兴趣点的热度值,以及目标地理区域内的兴趣点的热度值,其中,热度值是根据兴趣点的搜索数据和/或线下访问数据确定的;基于所获取的数据,生成目标类别的兴趣点在目标地理区域内的重要性信息。
在一些实施例中,在基于所获取的数据,生成目标类别的兴趣点在目标地理区域内的重要性信息之后,该方法还包括:将包括各个类别的兴趣点在至少一个地理区域的重要性信息的特征输入地理区域分类模型,得到地理区域分类模型输出的至少一个类别的地理区域的区域标识,其中,地理区域分类模型用以表征特征与至少一个类别的地理区域的区域标识的对应关系。
在一些实施例中,该方法还包括:对至少一个类别的地理区域中的各个类别的地理区域添加功能区标识。
在一些实施例中,特征还包括:总地理区域的人口特征和/或人员在总地理区域内的地理区域之间的移动所产生的地理区域关联特征。
在一些实施例中,基于所获取的数据,生成目标类别的兴趣点在目标地理区域内的重要性信息,包括:确定目标地理区域内的、目标类别的各个兴趣点的热度值之和为第一和,确定目标地理区域内的各个兴趣点的热度值之和为第二和;确定第一和与第二和的比值;确定总地理区域内的各个兴趣点的热度值之和为第三和,确定总地理区域内的目标类别的各个兴趣点的热度值之和为第四和;确定第三和与第四和的比值的对数;确定第一和与第二和的比值与对数的乘积为目标类别的兴趣点在目标地理区域内的重要性信息。
在一些实施例中,通过以下步骤确定总地理区域:确定待处理总地理区域中的目标类别的道路以外的区域;对目标类别道路以外的区域进行网格化,得到至少两个网格区域;根据连通区域提取算法,将各个网格区域中的、道路以外的网格区域合并成至少一个地理区域;将合并成的至少一个地理区域的集合确定为总地理区域。
第二方面,本申请实施例提供了一种用于生成信息的装置,包括:获取单元,配置用于获取以下数据:总地理区域内的至少一个类别的兴趣点的热度值,总地理区域内的、至少一个类别中的目标类别的兴趣点的热度值,总地理区域所包括的至少一个地理区域中的目标地理区域内的、目标类别的兴趣点的热度值,以及目标地理区域内的兴趣点的热度值,其中,热度值是根据兴趣点的搜索数据和/或线下访问数据确定的;生成单元,配置用于基于所获取的数据,生成目标类别的兴趣点在目标地理区域内的重要性信息。
在一些实施例中,该装置还包括:分类单元,配置用于将包括各个类别的兴趣点在至少一个地理区域的重要性信息的特征输入地理区域分类模型,得到地理区域分类模型输出的至少一个类别的地理区域的区域标识,其中,地理区域分类模型用以表征特征与至少一个类别的地理区域的区域标识的对应关系。
在一些实施例中,该装置还包括:添加单元,配置用于对至少一个类别的地理区域中的各个类别的地理区域添加功能区标识。
在一些实施例中,特征还包括:总地理区域的人口特征和/或人员在总地理区域内的地理区域之间的移动所产生的地理区域关联特征。
在一些实施例中,生成单元,包括:第一确定模块,配置用于确定目标地理区域内的、目标类别的各个兴趣点的热度值之和为第一和,确定目标地理区域内的各个兴趣点的热度值之和为第二和;第二确定模块,配置用于确定第一和与第二和的比值;第三确定模块,配置用于确定总地理区域内的各个兴趣点的热度值之和为第三和,确定总地理区域内的目标类别的各个兴趣点的热度值之和为第四和;第四确定模块,配置用于确定第三和与第四和的比值的对数;第五确定模块,配置用于确定第一和与第二和的比值与对数的乘积为目标类别的兴趣点在目标地理区域内的重要性信息。
在一些实施例中,该装置还包括:确定单元,配置用于确定待处理总地理区域中的目标类别的道路以外的区域;网格化单元,配置用于对目标类别道路以外的区域进行网格化,得到至少两个网格区域;合并单元,配置用于根据连通区域提取算法,将各个网格区域中的、道路以外的网格区域合并成至少一个地理区域;总区域确定单元,配置用于将合并成的至少一个地理区域的集合确定为总地理区域。
第三方面,本申请实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如用于生成信息的方法中任一实施例的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如用于生成信息的方法中任一实施例的方法。
本申请实施例提供的用于生成信息的方法和装置,首先,获取以下数据:总地理区域内的至少一个类别的兴趣点的热度值,总地理区域内的、至少一个类别中的目标类别的兴趣点的热度值,总地理区域所包括的至少一个地理区域中的目标地理区域内的、目标类别的兴趣点的热度值,以及目标地理区域内的兴趣点的热度值,其中,热度值是根据兴趣点的搜索数据和/或线下访问数据确定的。然后,基于所获取的数据,生成目标类别的兴趣点在目标地理区域内的重要性信息。本申请实施例通过生成目标类别的兴趣点在地理区域内的重要性信息,实现了对目标类别的兴趣点在地理区域内的重要程度进行确定。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请可以应用于其中的示例性系统架构图;
图2是根据本申请的用于生成信息的方法的一个实施例的流程图;
图3是根据本申请的用于生成信息的方法的一个应用场景的示意图;
图4是根据本申请的用于生成信息的方法的又一个实施例的流程图;
图5是根据本申请的用于生成信息的装置的一个实施例的结构示意图;
图6是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的用于生成信息的方法或用于生成信息的装置的实施例的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类别,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如地图类应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备101、102、103可以是具有显示屏并且支持通信连接的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的重要性信息提供支持的后台服务器。后台服务器可以对接收到的数据进行分析等处理,并将处理结果(例如重要性信息)反馈给终端设备。
需要说明的是,本申请实施例所提供的用于生成信息的方法一般由服务器105执行,相应地,用于生成信息的装置一般设置于服务器105中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本申请的用于生成信息的方法的一个实施例的流程200。该用于生成信息的方法,包括以下步骤:
步骤201,获取以下数据:总地理区域内的至少一个类别的兴趣点的热度值,总地理区域内的、至少一个类别中的目标类别的兴趣点的热度值,总地理区域所包括的至少一个地理区域中的目标地理区域内的、目标类别的兴趣点的热度值,以及目标地理区域内的兴趣点的热度值。
在本实施例中,用于生成信息的方法运行于其上的电子设备(例如图1所示的服务器)可以通过有线连接方式或者无线连接方式从本地或者其他电子设备获取以下数据:总地理区域内的至少一个类别的兴趣点的热度值,总地理区域内的、至少一个类别中的目标类别的兴趣点的热度值,总地理区域所包括的至少一个地理区域中的目标地理区域内的、目标类别的兴趣点的热度值,以及目标地理区域内的兴趣点的热度值。其中,热度值是根据兴趣点的搜索数据和/或线下访问数据确定的。具体地,热度值为指示兴趣点的热度的数值,这个热度可以是用户的线上搜索的搜索热度,也可以是用户的线下访问热度,还可以兼有这两种热度。目标类别为所选定的任意一个类别。
在实践中,搜索热度可以包括搜索人数、搜索次数和搜索频率中的至少一种。此外,也可以是对搜索人数、搜索次数、搜索频率进行数据处理得到的,比如,与固定系数相乘、输入公式或将搜索人数和搜索次数进行加权等等。线下访问热度可以是用户在线下访问某个兴趣点的访问人数、访问次数和访问频率中的至少一种。也可以是对访问人数、访问次数、访问频率进行数据处理得到的。
属于目标类别的兴趣点为属于预先设置的某一个类别的兴趣点。兴趣点可以分为多种类别,比如,餐饮、办公、住宅等等。
步骤202,基于所获取的数据,生成目标类别的兴趣点在目标地理区域内的重要性信息。
在本实施例中,上述电子设备基于所获取的数据,确定属于目标类别的至少一个兴趣点在目标地理区域内的重要性信息。重要性信息用以指示兴趣点的重要程度,可以采用各种字符表示。可以根据字符确定兴趣点的重要程度。比如,采用数值表示重要程度,则较大的数值可以代表比较重要。采用字母表示重要程度,则字母表排序靠前的字母可以代表比较重要。可以对重要性信息设定阈值,以判断重要性信息代表的重要程度的高低。比如,阈值为字母H,那么字母C可以代表重要程度高。搜索数据、线下访问数据可以分别独立地反映兴趣点的重要性,也可以相结合来反映。某一类别的兴趣点的重要性往往体现于用户的生活需求方面。比如,餐饮类别的兴趣点在A地理区域的重要性信息表现为比较重要,则表明A地理区域中的该类别的兴趣点对于用户的生活比较重要,经常对该类别的兴趣点进行搜索和/或访问。
具体地,可以采用多种方式确定目标类别的兴趣点在目标地理区域内的重要性信息。可以直接将获取的数据作为目标类别的兴趣点在目标地理区域内的重要性信息。也可以根据预设的数据和重要性信息的对应关系,确定重要性信息。还可以通过公式或模型确定重要性信息,即是将所获取的数据输入公式或模型,公式或模型输出的即是重要性信息。
继续参见图3,图3是根据本实施例的用于生成信息的方法的应用场景的一个示意图。在图3的应用场景中,电子设备301获取以下数据:总地理区域内的至少一个类别的兴趣点的热度值302,总地理区域内的、至少一个类别中的目标类别的兴趣点的热度值303,总地理区域所包括的至少一个地理区域中的目标地理区域内的、目标类别的兴趣点的热度值304,以及目标地理区域内的兴趣点的热度值305。之后,上述电子设备基于所获取的数据302、303、304和305,生成所述目标类别的兴趣点在所述目标地理区域内的重要性信息306。
本申请实施例通过生成目标类别的兴趣点在地理区域内的重要性信息,实现了对目标类别的兴趣点在地理区域内的重要程度进行确定。并且,通过获取确定的数据生成重要性信息,本申请实施例避免了人工确定重要性信息造成的结果不稳定的问题,进而获得稳定且较为准确的结果。
进一步参考图4,其示出了用于生成信息的方法的又一个实施例的流程400。该用于生成信息的方法的流程400,包括以下步骤:
步骤401,确定待处理总地理区域中的目标类别的道路以外的区域。
在本实施例中,用于生成信息的方法运行于其上的服务器确定待处理总地理区域中的目标类别的道路以外的区域。在此之前,上述服务器可以在本地确定或者从其他设备获取待处理总地理区域以及目标类别的道路。之后,从待处理总地理区域中去除目标类别的道路,则可以得到目标类别的道路以外的区域。待处理总地理区域为有待于处理的总的地理区域,其中包括总地理区域。目标类别的道路是某一种类别的道路,比如,辅路、环岛和匝道等等。
步骤402,对目标类别道路以外的区域进行网格化,得到至少两个网格区域。
在本实施例中,上述服务器对所确定的目标类别道路以外的区域进行网格化,得到至少两个网格区域。对区域进行网格化之后,区域则被划分为至少两个网格状的区域。
步骤403,根据连通区域提取算法,将各个网格区域中的、道路以外的网格区域合并成至少一个地理区域。
在本实施例中,上述服务器根据连通区域提取算法,对所生成的各个网格区域中的、道路以外的网格区域进行合并,以合并成至少一个地理区域。具体地,连通区域提取算法是将像素值相同且位置相邻的网格区域进行合并。
步骤404,将合并成的至少一个地理区域的集合确定为总地理区域。
在本实施例中,上述服务器将合并成的至少一个地理区域中的各个地理区域的集合确定为总地理区域。
步骤405,获取以下数据:目标地理区域内的、属于目标类别的至少一个兴趣点的热度值、目标地理区域内至少一个兴趣点的热度值、目标地理区域所包含于的总地理区域内的至少一个兴趣点的热度值,以及总地理区域内的属于目标类别的至少一个兴趣点的热度值。
在本实施例中,用于生成信息的方法运行于其上的电子设备(例如图1所示的服务器)可以通过有线连接方式或者无线连接方式从本地或者其他电子设备获取以下数据:目标地理区域内的、属于目标类别的至少一个兴趣点的热度值、目标地理区域内至少一个兴趣点的热度值、目标地理区域所包含于的总地理区域内的至少一个兴趣点的热度值,以及总地理区域内的属于目标类别的至少一个兴趣点的热度值。其中,热度值是根据兴趣点的搜索数据和/或线下访问数据确定的。具体地,热度值为指示兴趣点的热度的数值,这个热度可以是用户的线上搜索的搜索热度,也可以是用户的线下访问热度,还可以兼有这两种热度。
步骤406,确定目标地理区域内的、目标类别的各个兴趣点的热度值之和为第一和,确定目标地理区域内的各个兴趣点的热度值之和为第二和。
在本实施例中,上述服务器对目标地理区域内的、目标类别的各个兴趣点的热度值进行加和,得到第一和。上述服务器对目标地理区域内的各个兴趣点的热度值进行加和,得到第二和。上述确定第一和与确定第二和的步骤可以同时执行或者按照任意先后顺序执行。在这里,确定目标地理区域内目标类别的多个兴趣点的热度值的和,可以便于后续确定目标类别的兴趣点在目标地理区域内的重要性信息。
步骤407,确定第一和与第二和的比值。
在本实施例中,上述服务器在确定了第一和与第二和之后,可以确定第一和与第二和的比值。
步骤408,确定总地理区域内的各个兴趣点的热度值之和为第三和,确定总地理区域内的目标类别的各个兴趣点的热度值之和为第四和。
在本实施例中,上述服务器对上述总地理区域内的各个兴趣点的热度值进行加和,得到第三和。上述服务器对上述总地理区域内的目标类别的各个兴趣点的热度值进行加和,得到第四和。
步骤409,确定第三和与第四和的比值的对数。
在本实施例中,上述服务器确定上述第三和与上述第四和的比值,之后确定该比值的对数。在这里,对数的底数可以是自然数e,也可以是10。
步骤410,确定第一和与第二和的比值与对数的乘积为目标类别的兴趣点在目标地理区域内的重要性信息。
在本实施例中,上述服务器确定步骤407所确定的比值与步骤409所确定的对数的乘积。之后,将上述乘积作为上述目标类别的兴趣点在上述目标地理区域内的重要性信息。
在本实施例的一些可选的实现方式中,可以采用以下公式确定重要性信息。
其中,
i为总地理区域中的任意一个地理区域,j为地理区域i中的兴趣点的任意一个类别,log的底数可以是自然数e,也可以是10。
vij表示类别j的兴趣点在地理区域i内的重要性信息;
hj表示地理区域i内的、类别j的各个兴趣点的热度值之和;
Hi表示地理区域i内的各个兴趣点的热度值之和;
U表示总地理区域内的各个兴趣点的热度值之和;
uj表示总地理区域内的类别j的各个兴趣点的热度值之和。
步骤411,将包括各个类别的兴趣点在至少一个地理区域的重要性信息的特征输入地理区域分类模型,得到地理区域分类模型输出的至少一个类别的地理区域的区域标识。
在本实施例中,在对总地理区域内所包括的至少一个地理区域中的各个类别的兴趣点作为目标类别的兴趣点生成重要性信息之后,上述服务器将特征输入地理区域分类模型,得到该模型输出的至少一个类别的地理区域的区域标识。在这里,特征包括各个类别的兴趣点在上述至少一个地理区域中的各个地理区域的重要性信息。其中,地理区域分类模型用以表征特征与至少一个类别的地理区域的区域标识的对应关系。区域标识为用以区分地理区域的标识。
在实践中,地理区域分类模型可以是算法或者公式。比如,K-means算法,或者高斯混合模型GMM等等。在这里,地理区域分类模型所输出的是已经划分为n个类别的地理区域的区域标识。比如,输出类别1和类别2,类别1包括区域标识a和区域标识e,类别2包括区域标识c和区域标识m。
在本实施例的一些可选的实现方式中,对至少一个类别的地理区域中的各个类别的地理区域添加功能区标识。
在本实施例中,本申请实施例通过地理区域分类模型输出的至少一个类别的地理区域,实现了对地理区域划分类别。而划分得到的每一类地理区域可以作为一个功能区,从而使本方案实现了功能区的识别。
在得到至少一个类别的地理区域的区域标识之后,上述电子设备可以对得到的各个类别的地理区域添加功能区标识。功能区为按功能将总地理区域中各种物质要素,如工厂、仓库、住宅等进行分区布置,组成一个互相联系、布局合理的有机整体。在这里,功能区可以是城市功能区。功能区标识用以区别不同的功能区。在添加功能区标识后,上述服务器可以输出各个功能区标识。
在本实施例的一些可选的实现方式中,特征还包括总地理区域的人口特征和/或人员在总地理区域内的地理区域之间的移动所产生的地理区域关联特征。
在本实施例中,人口特征可以包括以下的至少一项:居住人口数量、工作人口数量、工作日客流量、工作日客流密度、节假日客流量、节假日客流密度。客流密度可以是客流量与时间段的比值。地理区域关联特征为表征人员移动的两个地理区域之间的关联性的特征,可以用来指示人员的活动模式。比如,张三从地理区域A移动到地理区域B,那么两个区域之间则具有关联性。可以用数值或者其他标识来表示关联性。比如在两个地理区域之间具有关联性时,地理区域关联特征可以表示为2。
在实践中,地理区域分类模型可以是包括隐含狄利克雷模型LDA(LatentDirichlet Allocation)、狄利克雷多项式回归模型DMR(Dirichlet MultinomialRegression),和K-means算法的模型。可以将步骤410得到的重要性信息、地理区域关联特征输入DMR,上述的人口特征和地理区域关联特征中的至少一项输入LDA。之后将所得到的DMR的输出、LDA的输出,以及步骤410得到的重要性信息输入K-means算法中,最终得到至少一个类别的地理区域的区域标识。
本实施例实现了目标类别的兴趣点在地理区域内的重要程度的量化。进一步地,本申请实施例通过地理区域分类模型输出的至少一个类别的地理区域,实现了对地理区域划分类别。而划分得到的每一类地理区域可以作为一个功能区,从而使本实施例实现了功能区的识别。此外,本实施例将区域进行网格化,使得到的地理区域更加细化、准确,也进一步提高了所划分的功能区的准确性。
进一步参考图5,作为对上述各图所示方法的实现,本申请提供了一种用于生成信息的装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图5所示,本实施例的用于生成信息的装置500包括:获取单元501和生成单元502。其中,获取单元501,配置用于获取以下数据:总地理区域内的至少一个类别的兴趣点的热度值,总地理区域内的、至少一个类别中的目标类别的兴趣点的热度值,总地理区域所包括的至少一个地理区域中的目标地理区域内的、目标类别的兴趣点的热度值,以及目标地理区域内的兴趣点的热度值,其中,热度值是根据兴趣点的搜索数据和/或线下访问数据确定的;生成单元502,配置用于基于所获取的数据,生成目标类别的兴趣点在目标地理区域内的重要性信息。
获取单元501可以通过有线连接方式或者无线连接方式从本地或者其他电子设备获取以下数据:总地理区域内的至少一个类别的兴趣点的热度值,总地理区域内的、至少一个类别中的目标类别的兴趣点的热度值,总地理区域所包括的至少一个地理区域中的目标地理区域内的、目标类别的兴趣点的热度值,以及目标地理区域内的兴趣点的热度值。其中,热度值是根据兴趣点的搜索数据和/或线下访问数据确定的。具体地,热度值为指示兴趣点的热度的数值,这个热度可以是用户的线上搜索的搜索热度,也可以是用户的线下访问热度,还可以兼有这两种热度。目标类别为所选定的任意一个类别。
生成单元502基于所获取的数据,确定属于目标类别的至少一个兴趣点在目标地理区域内的重要性信息。重要性信息用以指示兴趣点的重要程度,可以采用各种字符表示。可以根据字符确定兴趣点的重要程度。比如,采用数值表示重要程度,则较大的数值可以代表比较重要。采用字母表示重要程度,则字母表排序靠前的字母可以代表比较重要。可以对重要性信息设定阈值,以判断重要性信息代表的重要程度的高低。比如,阈值为字母H,那么字母C可以代表重要程度高。搜索数据、线下访问数据可以分别独立地反映兴趣点的重要性,也可以相结合来反映。某一类别的兴趣点的重要性往往体现于用户的生活需求方面。比如,餐饮类别的兴趣点在A地理区域的重要性信息表现为比较重要,则表明A地理区域中的该类别的兴趣点对于用户的生活比较重要,经常对该类别的兴趣点进行搜索和/或访问。
在本实施例的一些可选的实现方式中,该装置还包括:分类单元,配置用于将包括各个类别的兴趣点在至少一个地理区域的重要性信息的特征输入地理区域分类模型,得到地理区域分类模型输出的至少一个类别的地理区域的区域标识,其中,地理区域分类模型用以表征特征与至少一个类别的地理区域的区域标识的对应关系。
在本实施例的一些可选的实现方式中,该装置还包括:添加单元,配置用于对至少一个类别的地理区域中的各个类别的地理区域添加功能区标识。
在本实施例的一些可选的实现方式中,特征还包括:总地理区域的人口特征和/或人员在总地理区域内的地理区域之间的移动所产生的地理区域关联特征。
在本实施例的一些可选的实现方式中,生成单元,包括:第一确定模块,配置用于确定目标地理区域内的、目标类别的各个兴趣点的热度值之和为第一和,确定目标地理区域内的各个兴趣点的热度值之和为第二和;第二确定模块,配置用于确定第一和与第二和的比值;第三确定模块,配置用于确定总地理区域内的各个兴趣点的热度值之和为第三和,确定总地理区域内的目标类别的各个兴趣点的热度值之和为第四和;第四确定模块,配置用于确定第三和与第四和的比值的对数;第五确定模块,配置用于确定第一和与第二和的比值与对数的乘积为目标类别的兴趣点在目标地理区域内的重要性信息。
在本实施例的一些可选的实现方式中,该装置还包括:确定单元,配置用于确定待处理总地理区域中的目标类别的道路以外的区域;网格化单元,配置用于对目标类别道路以外的区域进行网格化,得到至少两个网格区域;合并单元,配置用于根据连通区域提取算法,将各个网格区域中的、道路以外的网格区域合并成至少一个地理区域;总区域确定单元,配置用于将合并成的至少一个地理区域的集合确定为总地理区域。
下面参考图6,其示出了适于用来实现本申请实施例的电子设备的计算机系统600的结构示意图。图6示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括获取单元和生成单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,获取单元还可以被描述为“获取数据的单元”。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的装置中所包含的;也可以是单独存在,而未装配入该装置中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该装置执行时,使得该装置:获取以下数据:总地理区域内的至少一个类别的兴趣点的热度值,总地理区域内的、至少一个类别中的目标类别的兴趣点的热度值,总地理区域所包括的至少一个地理区域中的目标地理区域内的、目标类别的兴趣点的热度值,以及目标地理区域内的兴趣点的热度值,其中,热度值是根据兴趣点的搜索数据和/或线下访问数据确定的;基于所获取的数据,生成目标类别的兴趣点在目标地理区域内的重要性信息。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (14)

1.一种用于生成信息的方法,包括:
获取以下数据:总地理区域内的至少一个类别的兴趣点的热度值,所述总地理区域内的、所述至少一个类别中的目标类别的兴趣点的热度值,所述总地理区域所包括的至少一个地理区域中的目标地理区域内的、所述目标类别的兴趣点的热度值,以及所述目标地理区域内的兴趣点的热度值,其中,所述热度值是根据兴趣点的搜索数据和/或线下访问数据确定的;
基于所获取的数据,生成所述目标类别的兴趣点在所述目标地理区域内的重要性信息。
2.根据权利要求1所述的用于生成信息的方法,其中,在所述基于所获取的数据,生成所述目标类别的兴趣点在所述目标地理区域内的重要性信息之后,所述方法还包括:
将包括各个类别的兴趣点在所述至少一个地理区域的重要性信息的特征输入地理区域分类模型,得到所述地理区域分类模型输出的至少一个类别的地理区域的区域标识,其中,所述地理区域分类模型用以表征特征与至少一个类别的地理区域的区域标识的对应关系。
3.根据权利要求2所述的用于生成信息的方法,其中,所述方法还包括:对至少一个类别的地理区域中的各个类别的地理区域添加功能区标识。
4.根据权利要求2所述的用于生成信息的方法,其中,所述特征还包括:所述总地理区域的人口特征和/或人员在所述总地理区域内的地理区域之间的移动所产生的地理区域关联特征。
5.根据权利要求1所述的用于生成信息的方法,其中,所述基于所获取的数据,生成所述目标类别的兴趣点在所述目标地理区域内的重要性信息,包括:
确定所述目标地理区域内的、所述目标类别的各个兴趣点的热度值之和为第一和,确定所述目标地理区域内的各个兴趣点的热度值之和为第二和;
确定所述第一和与所述第二和的比值;
确定所述总地理区域内的各个兴趣点的热度值之和为第三和,确定所述总地理区域内的所述目标类别的各个兴趣点的热度值之和为第四和;
确定所述第三和与所述第四和的比值的对数;
确定所述第一和与所述第二和的比值与所述对数的乘积为目标类别的兴趣点在所述目标地理区域内的重要性信息。
6.根据权利要求1所述的用于生成信息的方法,其中,通过以下步骤确定所述总地理区域:
确定待处理总地理区域中的目标类别的道路以外的区域;
对所述目标类别道路以外的区域进行网格化,得到至少两个网格区域;
根据连通区域提取算法,将各个网格区域中的、道路以外的网格区域合并成至少一个地理区域;
将合并成的至少一个地理区域的集合确定为总地理区域。
7.一种用于生成信息的装置,包括:
获取单元,配置用于获取以下数据:总地理区域内的至少一个类别的兴趣点的热度值,所述总地理区域内的、所述至少一个类别中的目标类别的兴趣点的热度值,所述总地理区域所包括的至少一个地理区域中的目标地理区域内的、所述目标类别的兴趣点的热度值,以及所述目标地理区域内的兴趣点的热度值,其中,所述热度值是根据兴趣点的搜索数据和/或线下访问数据确定的;
生成单元,配置用于基于所获取的数据,生成所述目标类别的兴趣点在所述目标地理区域内的重要性信息。
8.根据权利要求7所述的用于生成信息的装置,其中,所述装置还包括:
分类单元,配置用于将包括各个类别的兴趣点在所述至少一个地理区域的重要性信息的特征输入地理区域分类模型,得到所述地理区域分类模型输出的至少一个类别的地理区域的区域标识,其中,所述地理区域分类模型用以表征特征与至少一个类别的地理区域的区域标识的对应关系。
9.根据权利要求8所述的用于生成信息的方法,其中,所述装置还包括:
添加单元,配置用于对至少一个类别的地理区域中的各个类别的地理区域添加功能区标识。
10.根据权利要求8所述的用于生成信息的装置,其中,所述特征还包括:所述总地理区域的人口特征和/或人员在所述总地理区域内的地理区域之间的移动所产生的地理区域关联特征。
11.根据权利要求7所述的用于生成信息的装置,其中,所述生成单元,包括:
第一确定模块,配置用于确定所述目标地理区域内的、所述目标类别的各个兴趣点的热度值之和为第一和,确定所述目标地理区域内的各个兴趣点的热度值之和为第二和;
第二确定模块,配置用于确定所述第一和与所述第二和的比值;
第三确定模块,配置用于确定所述总地理区域内的各个兴趣点的热度值之和为第三和,确定所述总地理区域内的所述目标类别的各个兴趣点的热度值之和为第四和;
第四确定模块,配置用于确定所述第三和与所述第四和的比值的对数;
第五确定模块,配置用于确定所述第一和与所述第二和的比值与所述对数的乘积为目标类别的兴趣点在所述目标地理区域内的重要性信息。
12.根据权利要求7所述的用于生成信息的装置,其中,所述装置还包括:
确定单元,配置用于确定待处理总地理区域中的目标类别的道路以外的区域;
网格化单元,配置用于对所述目标类别道路以外的区域进行网格化,得到至少两个网格区域;
合并单元,配置用于根据连通区域提取算法,将各个网格区域中的、道路以外的网格区域合并成至少一个地理区域;
总区域确定单元,配置用于将合并成的至少一个地理区域的集合确定为总地理区域。
13.一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一所述的方法。
14.一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现如权利要求1-6中任一所述的方法。
CN201711481998.1A 2017-12-29 2017-12-29 用于生成信息的方法和装置 Active CN108182253B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711481998.1A CN108182253B (zh) 2017-12-29 2017-12-29 用于生成信息的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711481998.1A CN108182253B (zh) 2017-12-29 2017-12-29 用于生成信息的方法和装置

Publications (2)

Publication Number Publication Date
CN108182253A true CN108182253A (zh) 2018-06-19
CN108182253B CN108182253B (zh) 2021-12-28

Family

ID=62549216

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711481998.1A Active CN108182253B (zh) 2017-12-29 2017-12-29 用于生成信息的方法和装置

Country Status (1)

Country Link
CN (1) CN108182253B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108960624A (zh) * 2018-07-03 2018-12-07 深圳市和讯华谷信息技术有限公司 基于用户到访信息的网格相似度判定方法、装置和系统
CN109670853A (zh) * 2018-09-25 2019-04-23 平安科技(深圳)有限公司 用户特征数据的确定方法、装置、设备及可读存储介质
CN109785351A (zh) * 2018-11-23 2019-05-21 口口相传(北京)网络技术有限公司 道路围栏的合并方法及装置、存储介质、电子装置
CN109886719A (zh) * 2018-12-20 2019-06-14 平安科技(深圳)有限公司 基于网格的数据挖掘处理方法、装置和计算机设备
CN110737841A (zh) * 2018-07-03 2020-01-31 百度在线网络技术(北京)有限公司 用于生成信息的方法和装置
CN110796500A (zh) * 2019-11-07 2020-02-14 秒针信息技术有限公司 一种信息监控方法、装置、电子设备及存储介质
CN111861526A (zh) * 2019-04-30 2020-10-30 京东城市(南京)科技有限公司 一种分析对象来源的方法和装置
CN111897894A (zh) * 2019-05-06 2020-11-06 北京四维图新科技股份有限公司 Poi检索热度确定方法、装置、设备及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140278291A1 (en) * 2013-03-14 2014-09-18 Microsoft Corporation Discovering functional groups
CN104123318A (zh) * 2013-04-28 2014-10-29 百度在线网络技术(北京)有限公司 一种地图显示兴趣点的方法及系统
US20150170616A1 (en) * 2012-04-27 2015-06-18 Google Inc. Local data quality heatmap
US20160063516A1 (en) * 2014-08-29 2016-03-03 The Nielsen Company (Us), Llc Methods and apparatus to estimate commercial characteristics based on geospatial data
CN106503714A (zh) * 2016-10-11 2017-03-15 湖州师范学院 一种基于兴趣点数据识别城市功能区的方法
CN106991142A (zh) * 2017-03-22 2017-07-28 湖州师范学院 一种基于微信数据和兴趣点数据识别城市功能区的方法
CN107070961A (zh) * 2016-09-30 2017-08-18 阿里巴巴集团控股有限公司 基于地理位置数据的热点区域确定方法及装置
CN107220308A (zh) * 2017-05-11 2017-09-29 百度在线网络技术(北京)有限公司 Poi的合理性的检测方法及装置、设备及可读介质
CN107247938A (zh) * 2017-06-08 2017-10-13 中国科学院遥感与数字地球研究所 一种高分辨率遥感影像城市建筑物功能分类的方法
CN107506499A (zh) * 2017-09-30 2017-12-22 百度在线网络技术(北京)有限公司 兴趣点与建筑物之间建立逻辑关系的方法、装置及服务器

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150170616A1 (en) * 2012-04-27 2015-06-18 Google Inc. Local data quality heatmap
US20140278291A1 (en) * 2013-03-14 2014-09-18 Microsoft Corporation Discovering functional groups
CN104123318A (zh) * 2013-04-28 2014-10-29 百度在线网络技术(北京)有限公司 一种地图显示兴趣点的方法及系统
US20160063516A1 (en) * 2014-08-29 2016-03-03 The Nielsen Company (Us), Llc Methods and apparatus to estimate commercial characteristics based on geospatial data
CN107070961A (zh) * 2016-09-30 2017-08-18 阿里巴巴集团控股有限公司 基于地理位置数据的热点区域确定方法及装置
CN106503714A (zh) * 2016-10-11 2017-03-15 湖州师范学院 一种基于兴趣点数据识别城市功能区的方法
CN106991142A (zh) * 2017-03-22 2017-07-28 湖州师范学院 一种基于微信数据和兴趣点数据识别城市功能区的方法
CN107220308A (zh) * 2017-05-11 2017-09-29 百度在线网络技术(北京)有限公司 Poi的合理性的检测方法及装置、设备及可读介质
CN107247938A (zh) * 2017-06-08 2017-10-13 中国科学院遥感与数字地球研究所 一种高分辨率遥感影像城市建筑物功能分类的方法
CN107506499A (zh) * 2017-09-30 2017-12-22 百度在线网络技术(北京)有限公司 兴趣点与建筑物之间建立逻辑关系的方法、装置及服务器

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108960624A (zh) * 2018-07-03 2018-12-07 深圳市和讯华谷信息技术有限公司 基于用户到访信息的网格相似度判定方法、装置和系统
CN110737841A (zh) * 2018-07-03 2020-01-31 百度在线网络技术(北京)有限公司 用于生成信息的方法和装置
CN109670853A (zh) * 2018-09-25 2019-04-23 平安科技(深圳)有限公司 用户特征数据的确定方法、装置、设备及可读存储介质
CN109670853B (zh) * 2018-09-25 2023-09-19 平安科技(深圳)有限公司 用户特征数据的确定方法、装置、设备及可读存储介质
CN109785351A (zh) * 2018-11-23 2019-05-21 口口相传(北京)网络技术有限公司 道路围栏的合并方法及装置、存储介质、电子装置
CN109886719A (zh) * 2018-12-20 2019-06-14 平安科技(深圳)有限公司 基于网格的数据挖掘处理方法、装置和计算机设备
CN111861526A (zh) * 2019-04-30 2020-10-30 京东城市(南京)科技有限公司 一种分析对象来源的方法和装置
CN111897894A (zh) * 2019-05-06 2020-11-06 北京四维图新科技股份有限公司 Poi检索热度确定方法、装置、设备及存储介质
CN110796500A (zh) * 2019-11-07 2020-02-14 秒针信息技术有限公司 一种信息监控方法、装置、电子设备及存储介质
CN110796500B (zh) * 2019-11-07 2023-08-29 秒针信息技术有限公司 一种信息监控方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN108182253B (zh) 2021-12-28

Similar Documents

Publication Publication Date Title
CN108182253A (zh) 用于生成信息的方法和装置
CN104965920B (zh) 用于确定目标地址的方法和装置
CN107315824B (zh) 用于生成热力图的方法和装置
CN107908789A (zh) 用于生成信息的方法和装置
CN107105031A (zh) 信息推送方法和装置
CN110060090A (zh) 推荐商品组合的方法、装置、电子设备及可读存储介质
CN107689008A (zh) 一种用户投保行为预测的方法及装置
CN109460514A (zh) 用于推送信息的方法和装置
CN108268573A (zh) 用于推送信息的方法和装置
CN107465741A (zh) 信息推送方法和装置
CN106991576A (zh) 一种地理区域的热力展现方法和装置
CN107944481A (zh) 用于生成信息的方法和装置
CN110009379A (zh) 一种选址模型构建和选址方法、装置及设备
CN109359170A (zh) 用于生成信息的方法和装置
CN108960912A (zh) 用于确定目标位置的方法和装置
CN107562942A (zh) 内容推荐方法及其装置、设备以及计算机可读存储介质
CN110298716A (zh) 信息推送方法和装置
CN110750697B (zh) 商户分类方法、装置、设备及存储介质
CN109495552A (zh) 用于更新点击率预测模型的方法和装置
CN109949063A (zh) 一种地址确定方法、装置、电子设备及可读存储介质
CN105894028A (zh) 用户识别方法和装置
CN110020162A (zh) 用户识别方法和装置
CN108335390A (zh) 用于处理信息的方法和装置
CN111626767B (zh) 资源数据的发放方法、装置及设备
CN110704754B (zh) 一种由用户终端执行的推送模型优化方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant