CN110688434A - 一种兴趣点处理方法、装置、设备和介质 - Google Patents

一种兴趣点处理方法、装置、设备和介质 Download PDF

Info

Publication number
CN110688434A
CN110688434A CN201810628628.4A CN201810628628A CN110688434A CN 110688434 A CN110688434 A CN 110688434A CN 201810628628 A CN201810628628 A CN 201810628628A CN 110688434 A CN110688434 A CN 110688434A
Authority
CN
China
Prior art keywords
interest
information
missing
interest point
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810628628.4A
Other languages
English (en)
Other versions
CN110688434B (zh
Inventor
张世雷
魏承东
吕辛未
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201810628628.4A priority Critical patent/CN110688434B/zh
Publication of CN110688434A publication Critical patent/CN110688434A/zh
Application granted granted Critical
Publication of CN110688434B publication Critical patent/CN110688434B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种兴趣点处理方法、装置、设备和介质,涉及电子地图领域。该方法包括:确定检索无果的缺失兴趣点信息以及所述缺失兴趣点信息关联的检索位置;确定所述检索位置的所属区域中关联的各种缺失兴趣点信息的检索次数;依据所属区域中关联的各种缺失兴趣点信息的检索次数,从各缺失兴趣点信息中确定所属区域的新增兴趣点信息。本发明实施例提供一种兴趣点处理方法、装置、设备和介质,实现了基于搜索无果的兴趣点信息对新增兴趣点信息的确定。

Description

一种兴趣点处理方法、装置、设备和介质
技术领域
本发明实施例涉及电子地图领域,尤其涉及一种兴趣点处理方法、装置、设备和介质。
背景技术
兴趣点(point of interest,POI)是电子地图上的某个地标或景点,用以标示出该地所代表的不同处所。在地图业务中兴趣点的新增是一个重要课题。
目前,新增兴趣点的确定方法是:通过清洗用户反馈情报,从情报中确定出新增兴趣点。或者,基于人工实地采集的方式确定新增兴趣点。
用户每天通过地图应用检索框搜索大量的兴趣点。若地图上暂时没有该兴趣点,则用户就无法通过地图获取该兴趣点的信息。然而,现有技术引导人们仅从用户反馈情报和人工实地采集的角度进行兴趣点的新增。从而导致当前没有人意识到用户在通过地图应用检索不到的兴趣点往往是现实世界中真实存在的,同时也是地图缺少的。进而导致大量高价值信息的流失。
发明内容
本发明实施例提供一种兴趣点处理方法、装置、设备和介质,以实现基于搜索无果的兴趣点信息对新增兴趣点信息进行确定。
第一方面,本发明实施例提供了一种兴趣点处理方法,该方法包括:
确定检索无果的缺失兴趣点信息以及所述缺失兴趣点信息关联的检索位置;
确定所述检索位置的所属区域中关联的各种缺失兴趣点信息的检索次数;
依据所属区域中关联的各种缺失兴趣点信息的检索次数,从各缺失兴趣点信息中确定所属区域的新增兴趣点信息。
第二方面,本发明实施例还提供了一种兴趣点处理装置,该装置包括:
信息获取模块,用于确定检索无果的缺失兴趣点信息以及所述缺失兴趣点信息关联的检索位置;
次数确定模块,用于确定所述检索位置的所属区域中关联的各种缺失兴趣点信息的检索次数;
兴趣点确定模块,用于依据所属区域中关联的各种缺失兴趣点信息的检索次数,从各缺失兴趣点信息中确定所属区域的新增兴趣点信息。
第三方面,本发明实施例还提供了一种设备,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明实施例中任一所述的兴趣点处理方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例中任一所述的兴趣点处理方法。
本发明实施例通过根据区域中检索无果的缺失兴趣点的检索次数确定新增兴趣点。区域中兴趣点的检索次数越多,表明区域内存在该兴趣点的可能性越大。从而提高候选新增兴趣点的确定准确率。
同时,区域中缺失兴趣点的检索次数越多,还表明用户对该缺失兴趣点的需求越强。而新增加兴趣点的目的是满足用户需求。从而实现根据需求增加兴趣点。对于需求较小或没有需求的,则可以不增加。
附图说明
图1为本发明实施例一提供的一种兴趣点处理方法的流程图;
图2是本发明实施例二提供的一种兴趣点处理方法的流程图;
图3是本发明实施例三提供的一种兴趣点处理方法的流程图;
图4是本发明实施例四提供的一种兴趣点处理方法的流程图;
图5是本发明实施例五提供的一种兴趣点处理方法的流程图;
图6是本发明实施例六提供的一种兴趣点处理装置的结构示意图;
图7为本发明实施例七提供的一种设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种兴趣点处理方法的流程图。本实施例可适用于对地图中缺失的兴趣点进行新增的情况。该方法可以由一种兴趣点处理装置来执行,该装置可以由软件和/或硬件的方式实现。参见图1,本实施例提供的兴趣点处理方法包括:
S110、确定检索无果的缺失兴趣点信息以及所述缺失兴趣点信息关联的检索位置。
检索无果的缺失兴趣点信息是指没有检索到兴趣点时输入的检索框中的兴趣点检索信息。该信息可以是检索无果时检索框中输入的信息,也可以是从检索无果时检索框中输入的信息中进一步提取的信息。其中,上述检索可以是依据地图应用进行的兴趣点检索,也可以是基于搜索引擎进行的兴趣点检索。
典型的,检索无果的缺失兴趣点信息是没有检索到兴趣点的缺失兴趣点的名称和/或地址。
所述缺失兴趣点信息关联的检索位置是指,在对缺失兴趣点信息进行检索时,检索终端所在位置。
S120、确定所述检索位置的所属区域中关联的各种缺失兴趣点信息的检索次数。
因为,通常用户对兴趣点的检索是对用户所在位置的设定区域范围内的兴趣点的检索,所以本实施例中默认缺失兴趣点信息表示的兴趣点位于所述检索位置的所属区域。
具体的,确定所述检索位置的所属区域中关联的各种缺失兴趣点信息的检索次数包括:
确定所述检索位置的所属区域;
将与所述检索位置关联的缺失兴趣点信息与所述区域关联;
统计与所述区域关联的各缺失兴趣点信息的检索次数。
具体的,确定所述检索位置的所属区域包括:将所述检索位置与设定区域进行比较,判断所述检索位置是否落入设定区域内;若是,则将该设定区域作为所述检索位置的所属区域。
其中,设定区域可以根据实际需要进行确定,例如按经纬度坐标确定的任一地理区域。可选的,设定区域也可以是一个城市,例如北京、上海或天津等。
S130、依据所属区域中关联的各种缺失兴趣点信息的检索次数,从各缺失兴趣点信息中确定所属区域的新增兴趣点信息。
具体的,将所属区域中关联的各种缺失兴趣点信息的检索次数大于设定检索次数阈值的缺失兴趣点信息确定为所属区域的新增兴趣点信息。也即,将所属区域中关联的各种缺失兴趣点信息的检索次数大于设定检索次数阈值的缺失兴趣点信息表示的兴趣点确定为所属区域的新增兴趣点。
示例性的,若在地图应用中的检索框中输入一酒店名称进行检索后,且未检索到任何结果,则将该酒店名称确定为检索无果的缺失兴趣点信息,将对该酒店进行检索时检索终端的位置确定为该酒店名称关联的检索位置。确定检索位置所属的城市。将该酒店名称与该城市关联。若统计得到关联该城市的该酒店名称的出现次数大于20次,换而言之在该城市检索该酒店的检索次数大于20次,则将该酒店名称确定为该城市的新增兴趣点信息,将该酒店确定为位于该城市的新增兴趣点。
本发明实施例的技术方案,通过根据区域中检索无果的缺失兴趣点的检索次数确定新增兴趣点。区域中兴趣点的检索次数越多,表明区域内存在该兴趣点的可能性越大。从而提高候选新增兴趣点的确定准确率。
同时,区域中缺失兴趣点的检索次数越多,还表明用户对该缺失兴趣点的需求越强。而新增加兴趣点的目的是满足用户需求。通过根据区域中检索无果的缺失兴趣点的检索次数确定新增兴趣点可以实现根据需求增加兴趣点。对于需求较小或没有需求的,则可以不增加。
实施例二
图2是本发明实施例二提供的一种兴趣点处理方法的流程图。本实施例是在上述实施例的基础上,提出的一种可选方案。参见图2,本实施例提供的兴趣点处理方法包括:
S210、确定检索无果的缺失兴趣点信息以及所述缺失兴趣点信息关联的检索位置。
S220、确定所述检索位置的所属区域。
S230、将与所述检索位置关联的缺失兴趣点信息与所述区域关联。
S240、若与所述区域关联的至少两个缺失兴趣点信息的相似度大于设定相似度阈值,则统一所述缺失兴趣点信息。
其中,设定相似度阈值可以根据实际需要进行设定。缺失兴趣点信息可以是缺失兴趣点的名称,也可以是缺失兴趣点的地址。
具体的,对至少两个缺失兴趣点信息的相似度的判断包括:
对至少两个缺失兴趣点的名称进行文本分割,以提取所述缺失兴趣点的名称中的行政区信息、核心词信息、经营范围信息以及后缀信息中的至少一个;
基于所提取的信息,确定至少两个所述缺失兴趣点之间的名称属性的相似度。
根据本发明的实施例,可以采用现有技术中已知的分词方法,对缺失兴趣点的名称进行文本分割,其具体处理在此不再赘述。此外,例如可以通过建立行政区表、经营范围表以及后缀表,基于所建立的行政区表、经营范围表以及后缀表等信息,从分割后的文本中提取出行政区信息、核心词信息、经营范围信息以及后缀信息至少其中之一。
根据本发明的实施例,在对缺失兴趣点的名称进行提取的过程中,还包括对区缺失兴趣点的名称中的同义词进行提取,并针对该兴趣点的名称中包括的多组同义词进行切割,以提取兴趣点的名称中的行政区信息、核心词信息、经营范围信息以及后缀信息。例如,地图兴趣点的名称为“厦门市第一区第一影视城(原第二影视城)某镇分城”,在对该兴趣点的名称进行分析时,可以首先基于例如名称中包含的同义词符号(例如括号)提取名称中包含的同义词,从而将上述名称分为两个同义词名称“厦门市第一区第一影视城某镇分城”以及“原第二影视城某镇分城”;然后分别对上述两个同义词名称进行文本分割,从而针对每个同义词名称得到相应的分割结果。例如,对于同义词名称“厦门市第一区第一影视城某镇分城”,得到分割结果“厦门市第一区第一影视城”以及“某镇分城”,对于同义词名称“原第二影视城某镇分城”,得到分割结果“第二影视城”以及“某镇分城”,进而针对该文本分割结果提取出行政区信息“厦门市第一区”;核心词“第一区”、“某镇”;经营范围信息“影视”;后缀“城”、“分城”。
在提取到兴趣点的行政区信息、核心词信息、经营范围信息以及后缀信息至少其中之一之后,可以基于所提取的信息,确定两个兴趣点之间的名称属性的相似度。例如,可以将两个兴趣点的行政区信息进行比较以获取两个兴趣点的行政区相似度,将两个兴趣点的核心词信息进行比较以获取核心词相似度,将两个兴趣点的经营范围信息进行比较以获取经营范围相似度,以及将两个兴趣点的后缀信息进行比较以获取后缀相似度。在确定了如上各个子属性的相似度之后,例如,可以选取上述各个子属性相似度中的最小值作为两个兴趣点之间的名称属性的相似度。但是本公开不限于此,例如也可以对上述子属性进行加权组合,来确定两个兴趣点的名称属性的相似度。
和/或,对至少两个缺失兴趣点的地址进行文本分割,以提取所述缺失兴趣点的地址中的行政区信息、道路名称信息、道路后缀信息、区域号码信息、区域名称信息中的至少一个;
基于所提取的信息,确定至少两个所述缺失兴趣点之间的地址属性的相似度。
具体的,例如可以将行政区信息、道路名称信息、区域号码信息、区域名称信息这些地址子属性信息依次进行文本比较。而在依次比较过程中,如果某个子属性信息相同,则继续进行下一子属性的比较。如果某个子属性信息不同,则停止比较,返回比较结果。根据比较结果确定缺失兴趣点之间的地址属性的相似度。
S250、根据统一后的缺失兴趣点信息,对与所述区域关联的各缺失兴趣点信息的检索次数进行统计。
S260、依据所属区域中关联的各种缺失兴趣点信息的检索次数,从各缺失兴趣点信息中确定所属区域的新增兴趣点信息。
可以理解的是,每个用户在对同一兴趣点检索时所使用的检索词是不同的。如果直接利用确定的缺失兴趣点信息进行检索次数的统计,可能导致统计不准确的问题。
例如,针对第一兴趣点,有用户基于第一缺失兴趣点信息的检索词对该兴趣点进行检索,还有用户基于第二缺失兴趣点信息的检索词对该兴趣点进行检索。在统计缺失兴趣点信息的检索次数时会分别基于第一缺失兴趣点信息进行统计,基于第二缺失兴趣点信息进行统计。从而导致不能对第一兴趣点的实际检索次数进行准确地确定。
本发明实施例的技术方案,通过关联同一区域的缺失兴趣点信息进行相似度判断,根据判断结果进行缺失兴趣点信息的统一。从而解决同一缺失兴趣点因缺失兴趣点信息不同而被分别统计导致的检索次数统计不准确的问题。
实施例三
图3是本发明实施例三提供的一种兴趣点处理方法的流程图。本实施例是在上述实施例的基础上,提出的一种可选方案。参见图3,本实施例提供的兴趣点处理方法包括:
S310、确定检索无果的缺失兴趣点信息以及所述缺失兴趣点信息关联的检索位置。
S320、确定所述检索位置的所属区域中关联的各种缺失兴趣点信息的检索次数。
S330、依据所属区域中关联的各种缺失兴趣点信息的检索次数,从各缺失兴趣点信息中确定所属区域的新增兴趣点信息。
S340、将具有相同新增兴趣点信息的兴趣点合并,合并后的兴趣点的位置确定具体使用:
最小外接圆算法,将需要合并的至少两个所述兴趣点的位置构成的最小外接圆的圆心作为合并后兴趣点的位置坐标;
或者,算术平均值法,将需要合并的至少两个所述兴趣点的位置的算术平均值作为合并后兴趣点的位置坐标;
或者,几何平均值法,将需要合并的至少两个所述兴趣点的位置的集合平均值作为合并后兴趣点的位置坐标。
其中,兴趣点的位置可以从缺失兴趣点信息中确定,也可以基于缺失兴趣点信息在已知数据或网络数据中搜索得到。
本发明实施例的技术方案,通过基于最小外接圆算法、算术平均值法或几何平均值法,将具有相同新增兴趣点信息的兴趣点合并。从而实现对具有相同新增兴趣点信息的兴趣点的位置合并。
实施例四
图4是本发明实施例四提供的一种兴趣点处理方法的流程图。本实施例是在上述实施例的基础上,提出的一种可选方案。参见图4,本实施例提供的兴趣点处理方法包括:
S410、确定检索无果的缺失兴趣点信息以及所述缺失兴趣点信息关联的检索位置。
S420、确定所述检索位置的所属区域中关联的各种缺失兴趣点信息的检索次数。
S430、依据所属区域中关联的各种缺失兴趣点信息的检索次数,从各缺失兴趣点信息中确定所属区域的新增兴趣点信息。
S440、基于获得的数据和/或网络数据对确定的新增兴趣点进行真实性验证。
具体的,获得的数据是基于内部渠道获取得数据。网络数据是包含兴趣点的数据,例如可以是美团、大众点评中的网络数据。
具体的,基于获得的数据对确定的新增兴趣点进行真实性验证包括:
若新增兴趣点的名称和地址,与获取的WIFI热点信息中WIFI热点的名称和地址匹配一致,则确定对所述新增兴趣点的真实性验证成功。
基于网络数据对新增兴趣点进行真实性验证包括:
将新增兴趣点的名称和地址作为搜索关键词在互联网中进行搜索;
若存在搜索结果,则确定对所述新增兴趣点的真实性验证成功。
S450、将验证失败的新增兴趣点剔除。
本发明实施例的技术方案,通过基于获得的数据和/或网络数据对确定的新增兴趣点进行真实性验证,从而实现对新增兴趣点的进一步确认,提高对新增兴趣点的确认准确率。
实施例五
图5是本发明实施例五提供的一种兴趣点处理方法的流程图。本实施例是在上述实施例的基础上,提出的一种可选方案。参见图5,本实施例提供的兴趣点处理方法包括:
用户在检索框中输入兴趣点信息检索无果后,采集用户在检索框中输入的兴趣点信息作为缺失兴趣点信息,采集用户当前位置坐标作为检索位置;
判断所述缺失兴趣点信息是否包含兴趣点名称,若没有,则剔除该缺失兴趣点信息及检索位置;
默认缺失兴趣点信息表示的兴趣点位于检索位置所属城市,据此将缺失兴趣点信息与所属城市关联;
对关联同一城市的缺失兴趣点信息进行相似度判断,若与所述区域关联的至少两个缺失兴趣点信息的相似度大于设定相似度阈值,则统一所述缺失兴趣点信息;
根据统一后的缺失兴趣点信息,对与所述区域关联的各缺失兴趣点信息的检索次数进行统计,并依据所属区域中关联的各种缺失兴趣点信息的检索次数,从各缺失兴趣点信息中确定所属区域的新增兴趣点信息;
将具有相同新增兴趣点信息的兴趣点合并,对合并后的新增兴趣点信息基于获得的数据进行真实性验证,并在验证失败后利用网络数据进行真实性验证;
将验证成功的新增兴趣点信息表示的兴趣点增加至地图中。
本实施例对上述步骤的执行顺序不做限定,可以根据实际需要进行调整。
本发明实施例提供的技术方案,通过对检索无果的用户数据进行采集分析,从中挖掘出满足用户需求的新增兴趣点。从而提高地图上兴趣点的完整度,同时改善用户体验。
需要说明的是,经过本实施例的技术教导,本领域技术人员有动机将上述实施例中描述的任一种实施方式进行方案的组合,以实现基于检索无果的兴趣点信息对新增兴趣点的确定。
实施例六
图6是本发明实施例六提供的一种兴趣点处理装置的结构示意图。参见图6,本实施例提供的兴趣点处理装置包括:信息获取模块10、次数确定模块20和兴趣点确定模块30.
其中,信息获取模块10,用于确定检索无果的缺失兴趣点信息以及所述缺失兴趣点信息关联的检索位置;
次数确定模块20,用于确定所述检索位置的所属区域中关联的各种缺失兴趣点信息的检索次数;
兴趣点确定模块30,用于依据所属区域中关联的各种缺失兴趣点信息的检索次数,从各缺失兴趣点信息中确定所属区域的新增兴趣点信息。
本发明实施例的技术方案通过根据区域中检索无果的缺失兴趣点的检索次数确定新增兴趣点。区域中兴趣点的检索次数越多,表明区域内存在该兴趣点的可能性越大。从而提高候选新增兴趣点的确定准确率。
同时,区域中缺失兴趣点的检索次数越多,还表明用户对该缺失兴趣点的需求越强。而新增加兴趣点的目的是满足用户需求。从而实现根据需求增加兴趣点。对于需求较小或没有需求的,则可以不增加。
进一步的,次数确定模块包括:区域确定单元、关联单元和统计单元。
其中,区域确定单元,用于确定所述检索位置的所属区域;
关联单元,用于将与所述检索位置关联的缺失兴趣点信息与所述区域关联;
统计单元,用于统计与所述区域关联的各缺失兴趣点信息的检索次数。
进一步的,统计单元包括:信息统一子单元和信息统计子单元。
其中,信息统一子单元,用于若与所述区域关联的至少两个缺失兴趣点信息的相似度大于设定相似度阈值,则统一所述缺失兴趣点信息;
信息统计子单元,用于根据统一后的缺失兴趣点信息,对与所述区域关联的各缺失兴趣点信息的检索次数进行统计。
进一步的,信息统一子单元中对至少两个缺失兴趣点信息的相似度的判断包括:
对至少两个缺失兴趣点的名称进行文本分割,以提取所述缺失兴趣点的名称中的行政区信息、核心词信息、经营范围信息以及后缀信息中的至少一个;
基于所提取的信息,确定至少两个所述缺失兴趣点之间的名称属性的相似度;和/或
对至少两个缺失兴趣点的地址进行文本分割,以提取所述缺失兴趣点的地址中的行政区信息、道路名称信息、道路后缀信息、区域号码信息、区域名称信息中的至少一个;
基于所提取的信息,确定至少两个所述缺失兴趣点之间的地址属性的相似度。
进一步的,所述兴趣点处理装置还包括:兴趣点合并模块。
其中,兴趣点合并模块,用于在依据所属区域中关联的各种缺失兴趣点信息的检索次数,从各缺失兴趣点信息中确定所属区域的新增兴趣点信息之后,将具有相同新增兴趣点信息的兴趣点合并;
其中,合并后的兴趣点的位置确定具体使用:
最小外接圆算法,将需要合并的至少两个所述兴趣点的位置构成的最小外接圆的圆心作为合并后兴趣点的位置坐标。
进一步的,所述兴趣点处理装置还包括:兴趣点验证模块和兴趣点剔除模块。
其中,兴趣点验证模块用于在依据所属区域中关联的各种缺失兴趣点信息的检索次数,从各缺失兴趣点信息中确定所属区域的新增兴趣点信息之后,基于获得的数据和/或网络数据对确定的新增兴趣点进行真实性验证;
兴趣点剔除模块,用于将验证失败的新增兴趣点剔除。
进一步的,兴趣点验证模块包括:热点信息验证单元。
其中,热点信息验证单元,用于若新增兴趣点的名称和地址,与获取的WIFI热点信息中WIFI热点的名称和地址匹配一致,则确定对所述新增兴趣点的真实性验证成功。
进一步的,兴趣点验证模块包括:网络信息搜索单元和网络信息验证单元。
其中,网络信息搜索单元,用于将新增兴趣点的名称和地址作为搜索关键词在互联网中进行搜索;
网络信息验证单元,用于若存在搜索结果,则确定对所述新增兴趣点的真实性验证成功。
实施例七
图7为本发明实施例七提供的一种设备的结构示意图。图7示出了适于用来实现本发明实施方式的示例性设备12的框图。图7显示的设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图7所示,设备12以通用计算设备的形式表现。设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图7未显示,通常称为“硬盘驱动器”)。尽管图7中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该设备12交互的设备通信,和/或与使得该设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与设备12的其它模块通信。应当明白,尽管图中未示出,可以结合设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的兴趣点处理方法。
实施例八
本发明实施例八还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例中任一所述的兴趣点处理方法,该方法包括:
确定检索无果的缺失兴趣点信息以及所述缺失兴趣点信息关联的检索位置;
确定所述检索位置的所属区域中关联的各种缺失兴趣点信息的检索次数;
依据所属区域中关联的各种缺失兴趣点信息的检索次数,从各缺失兴趣点信息中确定所属区域的新增兴趣点信息。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (18)

1.一种兴趣点处理方法,其特征在于,包括:
确定检索无果的缺失兴趣点信息以及所述缺失兴趣点信息关联的检索位置;
确定所述检索位置的所属区域中关联的各种缺失兴趣点信息的检索次数;
依据所属区域中关联的各种缺失兴趣点信息的检索次数,从各缺失兴趣点信息中确定所属区域的新增兴趣点信息。
2.根据权利要求1所述的方法,其特征在于,确定所述检索位置的所属区域中关联的各种缺失兴趣点信息的检索次数包括:
确定所述检索位置的所属区域;
将与所述检索位置关联的缺失兴趣点信息与所述区域关联;
统计与所述区域关联的各缺失兴趣点信息的检索次数。
3.根据权利要求2所述的方法,其特征在于,统计与所述区域关联的各缺失兴趣点信息的检索次数,包括:
若与所述区域关联的至少两个缺失兴趣点信息的相似度大于设定相似度阈值,则统一所述缺失兴趣点信息;
根据统一后的缺失兴趣点信息,对与所述区域关联的各缺失兴趣点信息的检索次数进行统计。
4.根据权利要求3所述的方法,其特征在于,对至少两个缺失兴趣点信息的相似度的判断包括:
对至少两个缺失兴趣点的名称进行文本分割,以提取所述缺失兴趣点的名称中的行政区信息、核心词信息、经营范围信息以及后缀信息中的至少一个;
基于所提取的信息,确定至少两个所述缺失兴趣点之间的名称属性的相似度;和/或
对至少两个缺失兴趣点的地址进行文本分割,以提取所述缺失兴趣点的地址中的行政区信息、道路名称信息、道路后缀信息、区域号码信息、区域名称信息中的至少一个;
基于所提取的信息,确定至少两个所述缺失兴趣点之间的地址属性的相似度。
5.根据权利要求3所述的方法,其特征在于,在依据所属区域中关联的各种缺失兴趣点信息的检索次数,从各缺失兴趣点信息中确定所属区域的新增兴趣点信息之后,还包括:
将具有相同新增兴趣点信息的兴趣点合并;
合并后的兴趣点的位置确定具体使用:
最小外接圆算法,将需要合并的至少两个所述兴趣点的位置构成的最小外接圆的圆心作为合并后兴趣点的位置坐标。
6.根据权利要求1所述的方法,其特征在于,在依据所属区域中关联的各种缺失兴趣点信息的检索次数,从各缺失兴趣点信息中确定所属区域的新增兴趣点信息之后,还包括:
基于获得的数据和/或网络数据对确定的新增兴趣点进行真实性验证;
将验证失败的新增兴趣点剔除。
7.根据权利要求6所述的方法,其特征在于,基于获得的数据对确定的新增兴趣点进行真实性验证包括:
若新增兴趣点的名称和地址,与获取的WIFI热点信息中WIFI热点的名称和地址匹配一致,则确定对所述新增兴趣点的真实性验证成功。
8.根据权利要求6所述的方法,其特征在于,基于网络数据对新增兴趣点进行真实性验证包括:
将新增兴趣点的名称和地址作为搜索关键词在互联网中进行搜索;
若存在搜索结果,则确定对所述新增兴趣点的真实性验证成功。
9.一种兴趣点处理装置,其特征在于,包括:
信息获取模块,用于确定检索无果的缺失兴趣点信息以及所述缺失兴趣点信息关联的检索位置;
次数确定模块,用于确定所述检索位置的所属区域中关联的各种缺失兴趣点信息的检索次数;
兴趣点确定模块,用于依据所属区域中关联的各种缺失兴趣点信息的检索次数,从各缺失兴趣点信息中确定所属区域的新增兴趣点信息。
10.根据权利要求9所述的装置,其特征在于,所述次数确定模块包括:
区域确定单元,用于确定所述检索位置的所属区域;
关联单元,用于将与所述检索位置关联的缺失兴趣点信息与所述区域关联;
统计单元,用于统计与所述区域关联的各缺失兴趣点信息的检索次数。
11.根据权利要求10所述的装置,其特征在于,所述统计单元包括:
信息统一子单元,用于若与所述区域关联的至少两个缺失兴趣点信息的相似度大于设定相似度阈值,则统一所述缺失兴趣点信息;
信息统计子单元,用于根据统一后的缺失兴趣点信息,对与所述区域关联的各缺失兴趣点信息的检索次数进行统计。
12.根据权利要求11所述的装置,其特征在于,信息统一子单元具体用于:
对至少两个缺失兴趣点的名称进行文本分割,以提取所述缺失兴趣点的名称中的行政区信息、核心词信息、经营范围信息以及后缀信息中的至少一个;
基于所提取的信息,确定至少两个所述缺失兴趣点之间的名称属性的相似度;和/或
对至少两个缺失兴趣点的地址进行文本分割,以提取所述缺失兴趣点的地址中的行政区信息、道路名称信息、道路后缀信息、区域号码信息、区域名称信息中的至少一个;
基于所提取的信息,确定至少两个所述缺失兴趣点之间的地址属性的相似度。
13.根据权利要求11所述的装置,其特征在于,还包括:
兴趣点合并模块,用于在依据所属区域中关联的各种缺失兴趣点信息的检索次数,从各缺失兴趣点信息中确定所属区域的新增兴趣点信息之后,将具有相同新增兴趣点信息的兴趣点合并;
其中,合并后的兴趣点的位置确定具体使用:
最小外接圆算法,将需要合并的至少两个所述兴趣点的位置构成的最小外接圆的圆心作为合并后兴趣点的位置坐标。
14.根据权利要求9所述的装置,其特征在于,还包括
兴趣点验证模块,用于在依据所属区域中关联的各种缺失兴趣点信息的检索次数,从各缺失兴趣点信息中确定所属区域的新增兴趣点信息之后,基于获得的数据和/或网络数据对确定的新增兴趣点进行真实性验证;
兴趣点剔除模块,用于将验证失败的新增兴趣点剔除。
15.根据权利要求14所述的装置,其特征在于,所述兴趣点验证模块包括:
热点信息验证单元,用于若新增兴趣点的名称和地址,与获取的WIFI热点信息中WIFI热点的名称和地址匹配一致,则确定对所述新增兴趣点的真实性验证成功。
16.根据权利要求14所述的装置,其特征在于,所述兴趣点验证模块包括:
网络信息搜索单元,用于将新增兴趣点的名称和地址作为搜索关键词在互联网中进行搜索;
网络信息验证单元,用于若存在搜索结果,则确定对所述新增兴趣点的真实性验证成功。
17.一种设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-8中任一所述的兴趣点处理方法。
18.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-8中任一所述的兴趣点处理方法。
CN201810628628.4A 2018-06-19 2018-06-19 一种兴趣点处理方法、装置、设备和介质 Active CN110688434B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810628628.4A CN110688434B (zh) 2018-06-19 2018-06-19 一种兴趣点处理方法、装置、设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810628628.4A CN110688434B (zh) 2018-06-19 2018-06-19 一种兴趣点处理方法、装置、设备和介质

Publications (2)

Publication Number Publication Date
CN110688434A true CN110688434A (zh) 2020-01-14
CN110688434B CN110688434B (zh) 2022-12-09

Family

ID=69106227

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810628628.4A Active CN110688434B (zh) 2018-06-19 2018-06-19 一种兴趣点处理方法、装置、设备和介质

Country Status (1)

Country Link
CN (1) CN110688434B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111767478A (zh) * 2020-06-22 2020-10-13 北京百度网讯科技有限公司 一种关联关系构建方法、装置、设备及存储介质
CN113268677A (zh) * 2020-02-14 2021-08-17 北京百度网讯科技有限公司 兴趣点状态确定方法、装置、设备及介质
CN113411747A (zh) * 2020-03-16 2021-09-17 百度在线网络技术(北京)有限公司 兴趣点失效确定方法、装置、设备和介质
CN113420104A (zh) * 2021-06-29 2021-09-21 北京百度网讯科技有限公司 兴趣点采全率确定方法、装置、电子设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8014939B2 (en) * 2001-08-16 2011-09-06 Telecommunication Systems, Inc. Point of interest spatial rating search
CN103729478A (zh) * 2014-01-26 2014-04-16 重庆邮电大学 基于MapReduce的LBS兴趣点发现方法
CN104123318A (zh) * 2013-04-28 2014-10-29 百度在线网络技术(北京)有限公司 一种地图显示兴趣点的方法及系统
CN106303955A (zh) * 2016-08-05 2017-01-04 百度在线网络技术(北京)有限公司 用于对无线热点和poi进行匹配的方法和装置
CN107203556A (zh) * 2016-03-17 2017-09-26 高德软件有限公司 一种新增兴趣点信息的方法及装置
CN107220358A (zh) * 2017-06-05 2017-09-29 江苏省基础地理信息中心 兴趣点的推荐方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8014939B2 (en) * 2001-08-16 2011-09-06 Telecommunication Systems, Inc. Point of interest spatial rating search
CN104123318A (zh) * 2013-04-28 2014-10-29 百度在线网络技术(北京)有限公司 一种地图显示兴趣点的方法及系统
CN103729478A (zh) * 2014-01-26 2014-04-16 重庆邮电大学 基于MapReduce的LBS兴趣点发现方法
CN107203556A (zh) * 2016-03-17 2017-09-26 高德软件有限公司 一种新增兴趣点信息的方法及装置
CN106303955A (zh) * 2016-08-05 2017-01-04 百度在线网络技术(北京)有限公司 用于对无线热点和poi进行匹配的方法和装置
CN107220358A (zh) * 2017-06-05 2017-09-29 江苏省基础地理信息中心 兴趣点的推荐方法及装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113268677A (zh) * 2020-02-14 2021-08-17 北京百度网讯科技有限公司 兴趣点状态确定方法、装置、设备及介质
CN113268677B (zh) * 2020-02-14 2024-05-14 北京百度网讯科技有限公司 兴趣点状态确定方法、装置、设备及介质
CN113411747A (zh) * 2020-03-16 2021-09-17 百度在线网络技术(北京)有限公司 兴趣点失效确定方法、装置、设备和介质
CN111767478A (zh) * 2020-06-22 2020-10-13 北京百度网讯科技有限公司 一种关联关系构建方法、装置、设备及存储介质
CN111767478B (zh) * 2020-06-22 2023-08-15 北京百度网讯科技有限公司 一种关联关系构建方法、装置、设备及存储介质
CN113420104A (zh) * 2021-06-29 2021-09-21 北京百度网讯科技有限公司 兴趣点采全率确定方法、装置、电子设备及存储介质
CN113420104B (zh) * 2021-06-29 2023-10-13 北京百度网讯科技有限公司 兴趣点采全率确定方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN110688434B (zh) 2022-12-09

Similar Documents

Publication Publication Date Title
CN107656913B (zh) 地图兴趣点地址提取方法、装置、服务器和存储介质
CN108038183B (zh) 结构化实体收录方法、装置、服务器和存储介质
CN108363698B (zh) 兴趣点关系识别方法及装置
CN110008300B (zh) Poi别名的确定方法、装置、计算机设备和存储介质
CN110390054B (zh) 兴趣点召回方法、装置、服务器和存储介质
CN110688434B (zh) 一种兴趣点处理方法、装置、设备和介质
CN109213844B (zh) 一种文本处理方法、装置以及相关设备
CN108197198B (zh) 一种兴趣点搜索方法、装置、设备和介质
CN109033385B (zh) 图片检索方法、装置、服务器及存储介质
CN107203526B (zh) 一种查询串语义需求分析方法及装置
CN107526846B (zh) 频道排序模型的生成、排序方法、装置、服务器和介质
CN111506771B (zh) 一种视频检索方法、装置、设备及存储介质
CN111782977A (zh) 兴趣点处理方法、装置、设备及计算机可读存储介质
CN105608113B (zh) 判断文本中poi数据的方法及装置
CN110609879B (zh) 兴趣点判重方法、装置、计算机设备及存储介质
CN111259262A (zh) 一种信息检索方法、装置、设备及介质
CN113360789A (zh) 兴趣点数据处理方法、装置、电子设备及存储介质
CN111896016A (zh) 位置信息的处理方法及装置、存储介质、终端
CN107341221B (zh) 索引结构的建立、关联检索方法、装置、设备及存储介质
CN116662583B (zh) 一种文本生成方法、地点检索方法及相关装置
CN110287338B (zh) 行业热点确定方法、装置、设备和介质
CN109241208B (zh) 地址定位、地址监测、信息处理方法及装置
CN107908724B (zh) 一种数据模型匹配方法、装置、设备及存储介质
CN104156364B (zh) 地图搜索结果的展现方法和装置
CN109800361A (zh) 一种兴趣点名称的挖掘方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant