CN104239453B - 数据处理方法及装置 - Google Patents

数据处理方法及装置 Download PDF

Info

Publication number
CN104239453B
CN104239453B CN201410443262.5A CN201410443262A CN104239453B CN 104239453 B CN104239453 B CN 104239453B CN 201410443262 A CN201410443262 A CN 201410443262A CN 104239453 B CN104239453 B CN 104239453B
Authority
CN
China
Prior art keywords
terminal
interest
stop place
point
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410443262.5A
Other languages
English (en)
Other versions
CN104239453A (zh
Inventor
殷磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201410443262.5A priority Critical patent/CN104239453B/zh
Publication of CN104239453A publication Critical patent/CN104239453A/zh
Application granted granted Critical
Publication of CN104239453B publication Critical patent/CN104239453B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries

Abstract

本发明提供一种数据处理方法及装置。本发明实施例通过根据终端的定位数据,获得所述终端的停留位置,进而根据所述终端的停留位置,获得所述终端的停留位置附近的M个候选兴趣点,并根据所述终端的停留位置所在环境,从所述M个候选兴趣点中,选择N个候选兴趣点,以作为目标兴趣点,使得能够对所述终端的停留位置与所述目标兴趣点,进行关联处理,由于将抽象的定位数据关联到了具体的兴趣点,使得能够赋予定位数据更为形象的兴趣点的名称和类型等兴趣点数据,因此,能够进一步扩展终端的定位数据的应用,以满足多个应用场景例如,对终端的用户进行行为分析等,的处理需求,从而提高了终端的定位数据的利用率。

Description

数据处理方法及装置
【技术领域】
本发明涉及定位服务(Location Based Service,LBS)技术,尤其涉及一种数据处理方法及装置。
【背景技术】
随着通信技术的发展,终端集成了越来越多的功能,从而使得终端的系统功能列表中包含了越来越多相应的应用(Application,APP)。有些应用中会涉及一些定位服务(Location Based Service,LBS),又称位置服务,例如,百度地图等。在终端使用LBS的过程中,会产生该终端的定位数据。
然而,在一些应用场景中例如,对终端的用户进行行为分析等,无法利用终端的定位数据作为处理依据,导致了终端的定位数据的利用率的降低。
【发明内容】
本发明的多个方面提供一种数据处理方法及装置,用以提高终端的定位数据的利用率。
本发明的一方面,提供一种数据处理方法,包括:
根据终端的定位数据,获得所述终端的停留位置;
根据所述终端的停留位置,获得所述终端的停留位置附近的M个候选兴趣点,M为大于或等于2的整数;
根据所述终端的停留位置所在环境,从所述M个候选兴趣点中,选择N个候选兴趣点,以作为目标兴趣点,N为大于或等于1,且小于或等于M的整数;
对所述终端的停留位置与所述目标兴趣点,进行关联处理。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据终端的定位数据,获得所述终端的停留位置,包括:
根据所述终端的定位数据,进行基于密度的聚类处理,以获得至少一个候选类;
根据所述至少一个候选类中每个候选类中所包括的定位数据的数量和预先设置的数量阈值,获得至少一个目标类;
根据所述至少一个目标类中每个目标类中所包括的定位数据,获得所述每个目标类的位置,以作为所述终端的停留位置。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据终端的定位数据,获得所述终端的停留位置之后,所述根据所述终端的停留位置所在环境,从所述M个候选兴趣点中,选择N个候选兴趣点,以作为目标兴趣点之前,还包括:
获取所述终端的停留位置所属目标类中所包括的定位数据的定位精度;
根据所述定位精度,获得所述终端的停留位置所在环境。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述定位精度,获得所述终端的停留位置所在环境,包括:
若所述定位精度小于或等于预先设置的精度阈值,且对应时刻所述终端的网络连接方式为私有Wi-Fi连接,获得所述终端的停留位置所在环境为室内环境,所述对应时刻为所述终端的停留位置所属目标类中所包括的定位数据的产生时刻;或者
若所述定位精度小于或等于预先设置的精度阈值,且对应时刻所述终端的网络连接方式为非Wi-Fi连接或公共Wi-Fi连接,获得所述终端的停留位置所在环境为室外环境,所述对应时刻为所述终端的停留位置所属目标类中所包括的定位数据的产生时刻;或者
若所述定位精度大于预先设置的精度阈值,获得所述终端的停留位置所在环境为室外环境。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述终端的停留位置所在环境,从所述M个候选兴趣点中,选择N个候选兴趣点,以作为目标兴趣点,包括:
若所述终端的停留位置所在环境为室内环境,根据所述终端的停留位置,利用K近邻算法,从所述M个候选兴趣点中,选择所述N个候选兴趣点,以作为目标兴趣点;或者
若所述终端的停留位置所在环境为室外环境,根据所述M个候选兴趣点中每个候选兴趣点的兴趣点属性数据,计算两两候选兴趣点之间的相似度;根据两两候选兴趣点之间的相似度,对所述M个候选兴趣点进行分组处理,以获得P个分组,P为大于或等于1的整数,所述P个分组中每个分组中的两两候选兴趣点之间的相似度大于或等于预先设置的相似度阈值;根据所述每个分组中的候选兴趣点的数量,从所述P个分组中,选择Q个分组,以作为目标分组,Q为大于或等于1,且小于或等于P的整数;以及根据所述终端的停留位置,利用K近邻算法,从所述Q个目标分组中,选择所述N个候选兴趣点,以作为目标兴趣点。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述兴趣点属性数据包括兴趣点名称和兴趣点类别。
本发明的另一方面,提供一种数据处理装置,包括:
获得单元,用于根据终端的定位数据,获得所述终端的停留位置;
匹配单元,用于根据所述终端的停留位置,获得所述终端的停留位置附近的M个候选兴趣点,M为大于或等于2的整数;
选择单元,用于根据所述终端的停留位置所在环境,从所述M个候选兴趣点中,选择N个候选兴趣点,以作为目标兴趣点,N为大于或等于1,且小于或等于M的整数;
关联单元,用于对所述终端的停留位置与所述目标兴趣点,进行关联处理。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述获得单元,具体用于
根据所述终端的定位数据,进行基于密度的聚类处理,以获得至少一个候选类;
根据所述至少一个候选类中每个候选类中所包括的定位数据的数量和预先设置的数量阈值,获得至少一个目标类;以及
根据所述至少一个目标类中每个目标类中所包括的定位数据,获得所述每个目标类的位置,以作为所述终端的停留位置。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述获得单元,还用于
获取所述终端的停留位置所属目标类中所包括的定位数据的定位精度;以及
根据所述定位精度,获得所述终端的停留位置所在环境。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述获得单元,具体用于
若所述定位精度小于或等于预先设置的精度阈值,且对应时刻所述终端的网络连接方式为私有Wi-Fi连接,获得所述终端的停留位置所在环境为室内环境,所述对应时刻为所述终端的停留位置所属目标类中所包括的定位数据的产生时刻;或者
若所述定位精度小于或等于预先设置的精度阈值,且对应时刻所述终端的网络连接方式为非Wi-Fi连接或公共Wi-Fi连接,获得所述终端的停留位置所在环境为室外环境,所述对应时刻为所述终端的停留位置所属目标类中所包括的定位数据的产生时刻;或者
若所述定位精度大于预先设置的精度阈值,获得所述终端的停留位置所在环境为室外环境。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述选择单元,具体用于
若所述终端的停留位置所在环境为室内环境,根据所述终端的停留位置,利用K近邻算法,从所述M个候选兴趣点中,选择所述N个候选兴趣点,以作为目标兴趣点;或者
若所述终端的停留位置所在环境为室外环境,根据所述M个候选兴趣点中每个候选兴趣点的兴趣点属性数据,计算两两候选兴趣点之间的相似度;根据两两候选兴趣点之间的相似度,对所述M个候选兴趣点进行分组处理,以获得P个分组,P为大于或等于1的整数,所述P个分组中每个分组中的两两候选兴趣点之间的相似度大于或等于预先设置的相似度阈值;根据所述每个分组中的候选兴趣点的数量,从所述P个分组中,选择Q个分组,以作为目标分组,Q为大于或等于1,且小于或等于P的整数;以及根据所述终端的停留位置,利用K近邻算法,从所述Q个目标分组中,选择所述N个候选兴趣点,以作为目标兴趣点。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述兴趣点属性数据包括兴趣点名称和兴趣点类别。
由上述技术方案可知,本发明实施例通过根据终端的定位数据,获得所述终端的停留位置,进而根据所述终端的停留位置,获得所述终端的停留位置附近的M个候选兴趣点,并根据所述终端的停留位置所在环境,从所述M个候选兴趣点中,选择N个候选兴趣点,以作为目标兴趣点,使得能够对所述终端的停留位置与所述目标兴趣点,进行关联处理,由于将抽象的定位数据关联到了具体的兴趣点,使得能够赋予定位数据更为形象的兴趣点的名称和类型等兴趣点数据,因此,能够进一步扩展终端的定位数据的应用,以满足多个应用场景例如,对终端的用户进行行为分析等,的处理需求,从而提高了终端的定位数据的利用率。
另外,采用本发明提供的技术方案,无需操作人员参与,操作简单,且正确率高,从而提高了终端的定位数据处理的效率和可靠性。
【附图说明】
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的数据处理方法的流程示意图;
图2为本发明另一实施例提供的数据处理装置的结构示意图。
【具体实施方式】
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本发明保护的范围。
需要说明的是,本发明实施例中所涉及的终端可以包括但不限于手机、个人数字助理(Personal Digital Assistant,PDA)、无线手持装置、无线上网本、个人电脑、便携电脑、平板电脑、MP3播放器、MP4播放器、可穿戴设备(例如,智能眼镜、智能手表、智能手环等)等。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
图1为本发明一实施例提供的数据处理方法的流程示意图,如图1所示。
101、根据终端的定位数据,获得所述终端的停留位置。
102、根据所述终端的停留位置,获得所述终端的停留位置附近的M个候选兴趣点(Point of Interest,POI),M为大于或等于2的整数。
103、根据所述终端的停留位置所在环境,从所述M个候选兴趣点中,选择N个候选兴趣点,以作为目标兴趣点,N为大于或等于1,且小于或等于M的整数。
104、对所述终端的停留位置与所述目标兴趣点,进行关联处理。
需要说明的是,101~104的执行主体可以为位于本地终端的应用,或者还可以为设置在位于本地终端的应用中的插件或软件开发工具包(Software Development Kit,SDK)等功能单元,或者还可以为位于网络侧服务器中的处理引擎,本实施例对此不进行特别限定。
可以理解的是,所述应用可以是安装在终端上的本地程序(nativeApp),或者还可以是终端上的浏览器的一个网页程序(webApp),本实施例对此不进行限定。
这样,通过根据终端的定位数据,获得所述终端的停留位置,进而根据所述终端的停留位置,获得所述终端的停留位置附近的M个候选兴趣点,并根据所述终端的停留位置所在环境,从所述M个候选兴趣点中,选择N个候选兴趣点,以作为目标兴趣点,使得能够对所述终端的停留位置与所述目标兴趣点,进行关联处理,由于将抽象的定位数据关联到了具体的兴趣点,使得能够赋予定位数据更为形象的兴趣点的名称和类型等兴趣点数据,因此,能够进一步扩展终端的定位数据的应用,以满足多个应用场景例如,对终端的用户进行行为分析等,的处理需求,从而提高了终端的定位数据的利用率。
本发明所涉及的终端的定位数据,具体可以为终端采用现有的各种定位技术,所获得的该终端的定位结果,即终端所在位置的地理位置数据,本实施例对此不进行特别限定。例如,全球定位系统(Global Positioning System,GPS)技术、无线相容性认证(Wireless Fidelity,Wi-Fi)定位技术或基站定位技术等定位技术。
在终端使用LBS的过程中,会产生一些定位日志。定位日志中可以包括若干条记录,每条记录可以包括但不限于终端的定位数据、终端所采用的定位方式、定位数据的定位精度和终端的网络连接方式等,本实施例对此不进行特别限定。
可选地,在本实施例的一个可能的实现方式中,在101中具体可以根据所述终端的定位数据,进行基于密度的聚类处理,以获得至少一个候选类,进而根据所述至少一个候选类中每个候选类中所包括的定位数据的数量和预先设置的数量阈值,获得至少一个目标类。具体地,具体可以从定位日志中,直接读取所述终端的定位数据。
具体地,具体可以采用现有的基于密度的聚类算法,例如,基于密度的带有噪声的空间聚类(Density-Based Spatial Clustering of Applications with Noise,DBSCAN)算法等,详细描述可以参见现有技术中的相关内容,此处不再赘述。
具体地,若候选类中所包括的定位数据的数量大于或等于预先设置的数量阈值,则将该候选类作为一个目标类;否则,若候选类中所包括的定位数据的数量小于预先设置的数量阈值,则忽略该候选类,不会对该候选类进行任何后续处理。
然后,在获得至少一个目标类之后,则可以根据所述至少一个目标类中每个目标类中所包括的定位数据,获得所述每个目标类的位置,以作为所述终端的停留位置。
具体地,具体可以根据每个目标类中所包括的每个定位数据,计算一个中心定位数据,以作为每个目标类的位置。通常来说,终端利用定位技术进行定位时,所获得的定位数据可以包括经度分量和纬度分量等地理位置数据。一个经度和一个纬度一起确定地球上一个地点的精确位置。例如,具体可以根据每个定位数据,分别计算每个分量的平均值,进而将每个分量的平均值组成一个中心定位数据,以作为每个目标类的位置。进而,将目标类的位置,作为所述终端的停留位置。
可选地,在本实施例的一个可能的实现方式中,在102中,具体可以将在以所述终端的停留位置为中心,预设范围的区域内的兴趣点,作为候选兴趣点,或者还可以将在以所述终端的停留位置为中心,利用K近邻算法,距离该终端的停留位置最近的M个兴趣点,作为候选兴趣点,本实施例对此不进行特别限定。
可选地,在本实施例的一个可能的实现方式中,在101之后,在103之前,还可以进一步获取所述终端的停留位置所属目标类中所包括的定位数据的定位精度,进而根据所述定位精度,获得所述终端的停留位置所在环境。具体地,具体可以从定位日志中,直接读取所述终端的定位数据的定位精度。
具体地,若所述定位精度小于或等于预先设置的精度阈值如60米(m),且对应时刻所述终端的网络连接方式为私有无线相容性认证(Wireless Fidelity,Wi-Fi)连接,获得所述终端的停留位置所在环境为室内环境,所述对应时刻为所述终端的停留位置所属目标类中所包括的定位数据的产生时刻。
具体地,若所述定位精度小于或等于预先设置的精度阈值如60m,且对应时刻所述终端的网络连接方式为非Wi-Fi连接或公共Wi-Fi连接,获得所述终端的停留位置所在环境为室外环境,所述对应时刻为所述终端的停留位置所属目标类中所包括的定位数据的产生时刻。
具体地,若所述定位精度大于预先设置的精度阈值如60米m,获得所述终端的停留位置所在环境为室外环境。
可选地,在本实施例的一个可能的实现方式中,在103中,若所述终端的停留位置所在环境为室内环境,则可以根据所述终端的停留位置,利用K近邻算法,从所述M个候选兴趣点中,选择所述N个候选兴趣点,以作为目标兴趣点。优选地,以所述终端的停留位置为中心,利用K近邻算法,将距离该终端的停留位置最近的一个候选兴趣点,以作为目标兴趣点。
进一步地,具体还可以进一步判断所选择的目标兴趣点与终端的停留位置之间的距离,是否满足关联阈值。若所选择的目标兴趣点与终端的停留位置之间的距离小于或等于关联阈值,则可以执行103;若所选择的目标兴趣点与终端的停留位置之间的距离大于关联阈值,则无需执行103,直接结束本发明的流程即可。
可选地,在本实施例的一个可能的实现方式中,在103中,若所述终端的停留位置所在环境为室外环境,则可以根据所述M个候选兴趣点中每个候选兴趣点的兴趣点属性数据如兴趣点类别等,计算两两候选兴趣点之间的相似度。进而,再根据两两候选兴趣点之间的相似度,对所述M个候选兴趣点进行分组处理,以获得P个分组,P为大于或等于1的整数,所述P个分组中每个分组中的两两候选兴趣点之间的相似度大于或等于预先设置的相似度阈值。然后,则可以根据所述每个分组中的候选兴趣点的数量,从所述P个分组中,选择Q个分组,以作为目标分组,Q为大于或等于1,且小于或等于P的整数。最后,则根据所述终端的停留位置,利用K近邻算法,从所述Q个目标分组中,选择所述N个候选兴趣点,以作为目标兴趣点。
其中,所述兴趣点属性数据可以包括但不限于兴趣点名称和兴趣点类别,还可以进一步包括兴趣点位置数据等其他数据。
具体地,具体可以根据所述每个分组中的候选兴趣点的数量,按照从大到小的顺序,将P个分组进行排序处理,选择排在前Q位的Q个分组,以作为目标分组。
优选地,选择排在第一位的一个分组,以作为目标分组。
进一步优选地,以所述终端的停留位置为中心,利用K近邻算法,将距离该终端的停留位置最近的一个候选兴趣点,以作为目标兴趣点。
进一步地,具体还可以进一步判断所选择的目标兴趣点与终端的停留位置之间的距离,是否满足关联阈值。若所选择的目标兴趣点与终端的停留位置之间的距离小于或等于关联阈值,则可以执行103;若所选择的目标兴趣点与终端的停留位置之间的距离大于关联阈值,则无需执行103,直接结束本发明的流程即可。
可选地,在本实施例的一个可能的实现方式中,在104中,具体可以关联所述终端的停留位置与所述目标兴趣点的名称,或者还可以关联所述终端的停留位置与所述目标兴趣点的兴趣点属性数据
本实施例中,通过根据终端的定位数据,获得所述终端的停留位置,进而根据所述终端的停留位置,获得所述终端的停留位置附近的M个候选兴趣点,并根据所述终端的停留位置所在环境,从所述M个候选兴趣点中,选择N个候选兴趣点,以作为目标兴趣点,使得能够对所述终端的停留位置与所述目标兴趣点,进行关联处理,由于将抽象的定位数据关联到了具体的兴趣点,使得能够赋予定位数据更为形象的兴趣点的名称和类型等兴趣点数据,因此,能够进一步扩展终端的定位数据的应用,以满足多个应用场景例如,对终端的用户进行行为分析等,的处理需求,从而提高了终端的定位数据的利用率。
另外,采用本发明提供的技术方案,无需操作人员参与,操作简单,且正确率高,从而提高了终端的定位数据处理的效率和可靠性。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
图2为本发明另一实施例提供的数据处理装置的结构示意图,如图2所示。本实施例的数据处理装置可以包括获得单元21、匹配单元22、选择单元23和关联单元24。其中,获得单元21,用于根据终端的定位数据,获得所述终端的停留位置;匹配单元22,用于根据所述终端的停留位置,获得所述终端的停留位置附近的M个候选兴趣点,M为大于或等于2的整数;选择单元23,用于根据所述终端的停留位置所在环境,从所述M个候选兴趣点中,选择N个候选兴趣点,以作为目标兴趣点,N为大于或等于1,且小于或等于M的整数;关联单元24,用于对所述终端的停留位置与所述目标兴趣点,进行关联处理。
需要说明的是,本实施例所提供的数据处理装置可以为位于本地终端的应用,或者还可以为设置在位于本地终端的应用中的插件或软件开发工具包(SoftwareDevelopment Kit,SDK)等功能单元,或者还可以为位于网络侧服务器中的处理引擎,本实施例对此不进行特别限定。
可以理解的是,所述应用可以是安装在终端上的本地程序(nativeApp),或者还可以是终端上的浏览器的一个网页程序(webApp),本实施例对此不进行限定。
可选地,在本实施例的一个可能的实现方式中,所述获得单元21,具体可以用于根据所述终端的定位数据,进行基于密度的聚类处理,以获得至少一个候选类;根据所述至少一个候选类中每个候选类中所包括的定位数据的数量和预先设置的数量阈值,获得至少一个目标类;以及根据所述至少一个目标类中每个目标类中所包括的定位数据,获得所述每个目标类的位置,以作为所述终端的停留位置。
可选地,在本实施例的一个可能的实现方式中,所述获得单元21,还可以进一步用于获取所述终端的停留位置所属目标类中所包括的定位数据的定位精度;以及根据所述定位精度,获得所述终端的停留位置所在环境。
具体地,所述获得单元21,具体可以用于若所述定位精度小于或等于预先设置的精度阈值,且对应时刻所述终端的网络连接方式为私有Wi-Fi连接,获得所述终端的停留位置所在环境为室内环境,所述对应时刻为所述终端的停留位置所属目标类中所包括的定位数据的产生时刻。
具体地,所述获得单元21,具体可以用于若所述定位精度小于或等于预先设置的精度阈值,且对应时刻所述终端的网络连接方式为非Wi-Fi连接或公共Wi-Fi连接,获得所述终端的停留位置所在环境为室外环境,所述对应时刻为所述终端的停留位置所属目标类中所包括的定位数据的产生时刻。
具体地,所述获得单元21,具体可以用于若所述定位精度大于预先设置的精度阈值,获得所述终端的停留位置所在环境为室外环境。
可选地,在本实施例的一个可能的实现方式中,所述选择单元23,具体可以用于若所述终端的停留位置所在环境为室内环境,根据所述终端的停留位置,利用K近邻算法,从所述M个候选兴趣点中,选择所述N个候选兴趣点,以作为目标兴趣点。
可选地,在本实施例的一个可能的实现方式中,所述选择单元23,具体可以用于若所述终端的停留位置所在环境为室外环境,根据所述M个候选兴趣点中每个候选兴趣点的兴趣点属性数据,计算两两候选兴趣点之间的相似度;根据两两候选兴趣点之间的相似度,对所述M个候选兴趣点进行分组处理,以获得P个分组,P为大于或等于1的整数,所述P个分组中每个分组中的两两候选兴趣点之间的相似度大于或等于预先设置的相似度阈值;根据所述每个分组中的候选兴趣点的数量,从所述P个分组中,选择Q个分组,以作为目标分组,Q为大于或等于1,且小于或等于P的整数;以及根据所述终端的停留位置,利用K近邻算法,从所述Q个目标分组中,选择所述N个候选兴趣点,以作为目标兴趣点。
其中,所述兴趣点属性数据可以包括但不限于兴趣点名称和兴趣点类别,还可以进一步包括兴趣点位置数据等其他数据。
需要说明的是,图1对应的实施例中方法,可以由本实施例提供的数据处理装置实现。详细描述可以参见图1对应的实施例中的相关内容,此处不再赘述。
本实施例中,通过获得单元根据终端的定位数据,获得所述终端的停留位置,进而由匹配单元根据所述终端的停留位置,获得所述终端的停留位置附近的M个候选兴趣点,并由选择单元根据所述终端的停留位置所在环境,从所述M个候选兴趣点中,选择N个候选兴趣点,以作为目标兴趣点,使得关联单元能够对所述终端的停留位置与所述目标兴趣点,进行关联处理,由于将抽象的定位数据关联到了具体的兴趣点,使得能够赋予定位数据更为形象的兴趣点的名称和类型等兴趣点数据,因此,能够进一步扩展终端的定位数据的应用,以满足多个应用场景例如,对终端的用户进行行为分析等,的处理需求,从而提高了终端的定位数据的利用率。
另外,采用本发明提供的技术方案,无需操作人员参与,操作简单,且正确率高,从而提高了终端的定位数据处理的效率和可靠性。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (12)

1.一种数据处理方法,其特征在于,包括:
根据终端的定位数据,获得所述终端的停留位置;
根据所述终端的停留位置,获得所述终端的停留位置附近的M个候选兴趣点,M为大于或等于2的整数;
根据所述终端的停留位置所在环境,从所述M个候选兴趣点中,选择N个候选兴趣点,以作为目标兴趣点,N为大于或等于1,且小于或等于M的整数;其中,所述环境包括室内环境或室外环境;
对所述终端的停留位置与所述目标兴趣点,进行关联处理。
2.根据权利要求1所述的方法,其特征在于,所述根据终端的定位数据,获得所述终端的停留位置,包括:
根据所述终端的定位数据,进行基于密度的聚类处理,以获得至少一个候选类;
根据所述至少一个候选类中每个候选类中所包括的定位数据的数量和预先设置的数量阈值,获得至少一个目标类;
根据所述至少一个目标类中每个目标类中所包括的定位数据,获得所述每个目标类的位置,以作为所述终端的停留位置。
3.根据权利要求2所述的方法,其特征在于,所述根据终端的定位数据,获得所述终端的停留位置之后,所述根据所述终端的停留位置所在环境,从所述M个候选兴趣点中,选择N个候选兴趣点,以作为目标兴趣点之前,还包括:
获取所述终端的停留位置所属目标类中所包括的定位数据的定位精度;
根据所述定位精度,获得所述终端的停留位置所在环境。
4.根据权利要求3所述的方法,其特征在于,所述根据所述定位精度,获得所述终端的停留位置所在环境,包括:
若所述定位精度小于或等于预先设置的精度阈值,且对应时刻所述终端的网络连接方式为私有Wi-Fi连接,获得所述终端的停留位置所在环境为室内环境,所述对应时刻为所述终端的停留位置所属目标类中所包括的定位数据的产生时刻;或者
若所述定位精度小于或等于预先设置的精度阈值,且对应时刻所述终端的网络连接方式为非Wi-Fi连接或公共Wi-Fi连接,获得所述终端的停留位置所在环境为室外环境,所述对应时刻为所述终端的停留位置所属目标类中所包括的定位数据的产生时刻;或者
若所述定位精度大于预先设置的精度阈值,获得所述终端的停留位置所在环境为室外环境。
5.根据权利要求1~4任一权利要求所述的方法,其特征在于,所述根据所述终端的停留位置所在环境,从所述M个候选兴趣点中,选择N个候选兴趣点,以作为目标兴趣点,包括:
若所述终端的停留位置所在环境为室内环境,根据所述终端的停留位置,利用K近邻算法,从所述M个候选兴趣点中,选择所述N个候选兴趣点,以作为目标兴趣点;或者
若所述终端的停留位置所在环境为室外环境,根据所述M个候选兴趣点中每个候选兴趣点的兴趣点属性数据,计算两两候选兴趣点之间的相似度;根据两两候选兴趣点之间的相似度,对所述M个候选兴趣点进行分组处理,以获得P个分组,P为大于或等于1的整数,所述P个分组中每个分组中的两两候选兴趣点之间的相似度大于或等于预先设置的相似度阈值;根据所述每个分组中的候选兴趣点的数量,从所述P个分组中,选择Q个分组,以作为目标分组,Q为大于或等于1,且小于或等于P的整数;以及根据所述终端的停留位置,利用K近邻算法,从所述Q个目标分组中,选择所述N个候选兴趣点,以作为目标兴趣点。
6.根据权利要求5所述的方法,其特征在于,所述兴趣点属性数据包括兴趣点名称和兴趣点类别。
7.一种数据处理装置,其特征在于,包括:
获得单元,用于根据终端的定位数据,获得所述终端的停留位置;
匹配单元,用于根据所述终端的停留位置,获得所述终端的停留位置附近的M个候选兴趣点,M为大于或等于2的整数;
选择单元,用于根据所述终端的停留位置所在环境,从所述M个候选兴趣点中,选择N个候选兴趣点,以作为目标兴趣点,N为大于或等于1,且小于或等于M的整数;其中,所述环境包括室内环境或室外环境;
关联单元,用于对所述终端的停留位置与所述目标兴趣点,进行关联处理。
8.根据权利要求7所述的装置,其特征在于,所述获得单元,具体用于根据所述终端的定位数据,进行基于密度的聚类处理,以获得至少一个候选类;
根据所述至少一个候选类中每个候选类中所包括的定位数据的数量和预先设置的数量阈值,获得至少一个目标类;以及
根据所述至少一个目标类中每个目标类中所包括的定位数据,获得所述每个目标类的位置,以作为所述终端的停留位置。
9.根据权利要求8所述的装置,其特征在于,所述获得单元,还用于
获取所述终端的停留位置所属目标类中所包括的定位数据的定位精度;以及
根据所述定位精度,获得所述终端的停留位置所在环境。
10.根据权利要求9所述的装置,其特征在于,所述获得单元,具体用于
若所述定位精度小于或等于预先设置的精度阈值,且对应时刻所述终端的网络连接方式为私有Wi-Fi连接,获得所述终端的停留位置所在环境为室内环境,所述对应时刻为所述终端的停留位置所属目标类中所包括的定位数据的产生时刻;或者
若所述定位精度小于或等于预先设置的精度阈值,且对应时刻所述终端的网络连接方式为非Wi-Fi连接或公共Wi-Fi连接,获得所述终端的停留位置所在环境为室外环境,所述对应时刻为所述终端的停留位置所属目标类中所包括的定位数据的产生时刻;或者
若所述定位精度大于预先设置的精度阈值,获得所述终端的停留位置所在环境为室外环境。
11.根据权利要求7~10任一权利要求所述的装置,其特征在于,所述选择单元,具体用于
若所述终端的停留位置所在环境为室内环境,根据所述终端的停留位置,利用K近邻算法,从所述M个候选兴趣点中,选择所述N个候选兴趣点,以作为目标兴趣点;或者
若所述终端的停留位置所在环境为室外环境,根据所述M个候选兴趣点中每个候选兴趣点的兴趣点属性数据,计算两两候选兴趣点之间的相似度;根据两两候选兴趣点之间的相似度,对所述M个候选兴趣点进行分组处理,以获得P个分组,P为大于或等于1的整数,所述P个分组中每个分组中的两两候选兴趣点之间的相似度大于或等于预先设置的相似度阈值;根据所述每个分组中的候选兴趣点的数量,从所述P个分组中,选择Q个分组,以作为目标分组,Q为大于或等于1,且小于或等于P的整数;以及根据所述终端的停留位置,利用K近邻算法,从所述Q个目标分组中,选择所述N个候选兴趣点,以作为目标兴趣点。
12.根据权利要求11所述的装置,其特征在于,所述兴趣点属性数据包括兴趣点名称和兴趣点类别。
CN201410443262.5A 2014-09-02 2014-09-02 数据处理方法及装置 Active CN104239453B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410443262.5A CN104239453B (zh) 2014-09-02 2014-09-02 数据处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410443262.5A CN104239453B (zh) 2014-09-02 2014-09-02 数据处理方法及装置

Publications (2)

Publication Number Publication Date
CN104239453A CN104239453A (zh) 2014-12-24
CN104239453B true CN104239453B (zh) 2018-10-16

Family

ID=52227512

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410443262.5A Active CN104239453B (zh) 2014-09-02 2014-09-02 数据处理方法及装置

Country Status (1)

Country Link
CN (1) CN104239453B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106153031B (zh) * 2015-04-13 2019-08-30 骑记(厦门)科技有限公司 运动轨迹表示方法和装置
CN105119743B (zh) * 2015-08-07 2017-05-10 百度在线网络技术(北京)有限公司 用户行为意图的获取方法及装置
CN106484748B (zh) * 2015-09-02 2019-07-23 阿里巴巴集团控股有限公司 一种确定兴趣点poi布设需求的方法及装置
CN105224659A (zh) * 2015-09-30 2016-01-06 百度在线网络技术(北京)有限公司 信息获取方法和装置
CN106920387B (zh) 2015-12-24 2020-06-09 阿里巴巴集团控股有限公司 获取交通道路中路线热度的方法及装置
CN106846795A (zh) * 2017-01-04 2017-06-13 百度在线网络技术(北京)有限公司 人群密集区域的获取方法及装置
CN109460509A (zh) * 2018-10-12 2019-03-12 平安科技(深圳)有限公司 用户兴趣点评估方法、装置、计算机设备及存储介质
CN110782122B (zh) * 2019-09-16 2023-11-24 腾讯大地通途(北京)科技有限公司 数据处理方法、装置及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101784005A (zh) * 2009-12-17 2010-07-21 华为终端有限公司 兴趣点的检索方法及终端
CN103079270A (zh) * 2013-02-05 2013-05-01 中国电子科技集团公司电子科学研究院 一种基于无线定位的移动节点聚集感知方法
CN103856989A (zh) * 2012-11-28 2014-06-11 中国电信股份有限公司 室内外定位切换的方法和系统、终端以及定位应用平台
CN103983271A (zh) * 2010-03-29 2014-08-13 宏达国际电子股份有限公司 周围兴趣点的显示方法及移动装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI386020B (zh) * 2009-01-21 2013-02-11 Htc Corp 位置選取方法、裝置及電腦程式產品
US9141918B2 (en) * 2009-03-18 2015-09-22 Location Labs, Inc. User contribution based mapping system and method
US20110184945A1 (en) * 2010-01-22 2011-07-28 Qualcomm Incorporated Location aware recommendation engine
CN103456233A (zh) * 2012-05-28 2013-12-18 腾讯科技(深圳)有限公司 一种基于电子地图查找兴趣点的方法和系统
CN103488758A (zh) * 2013-09-24 2014-01-01 大陆汽车投资(上海)有限公司 兴趣点搜索方法及导航方法
CN103739423B (zh) * 2013-12-24 2016-06-15 山东滨州裕华化工厂有限公司 一种醚后液化气回收c5工艺
CN103954278B (zh) * 2014-05-08 2017-01-11 中国科学院软件研究所 一种基于多数据融合的应急逃离引导方法和系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101784005A (zh) * 2009-12-17 2010-07-21 华为终端有限公司 兴趣点的检索方法及终端
CN103983271A (zh) * 2010-03-29 2014-08-13 宏达国际电子股份有限公司 周围兴趣点的显示方法及移动装置
CN103856989A (zh) * 2012-11-28 2014-06-11 中国电信股份有限公司 室内外定位切换的方法和系统、终端以及定位应用平台
CN103079270A (zh) * 2013-02-05 2013-05-01 中国电子科技集团公司电子科学研究院 一种基于无线定位的移动节点聚集感知方法

Also Published As

Publication number Publication date
CN104239453A (zh) 2014-12-24

Similar Documents

Publication Publication Date Title
CN104239453B (zh) 数据处理方法及装置
Kim Geok et al. Review of indoor positioning: Radio wave technology
CN104090970B (zh) 兴趣点的展现方法及装置
CN104123398B (zh) 一种信息推送方法及装置
CN104125638B (zh) 管理用于基于网络的定位系统的位置数据库
JP2019061698A (ja) 経験上のエキスパートを判断する及び質問をルーティングするシステム及び方法
CN103942221B (zh) 检索方法及设备
CN105008959A (zh) 经由gps定位利用分布的分析产生地理围栏
CN105163282A (zh) 一种基于蓝牙位置指纹的室内定位系统及定位方法
CN107480180A (zh) 道路数据的处理方法、道路定位方法、装置及系统
CN106027693B (zh) 基于ip地址的定位方法及装置
CN104182495A (zh) 一种基于场景的社交网络位置信息匹配方法
CN106210163A (zh) 基于ip地址的定位方法及装置
CN109211259A (zh) 轨迹路线的显示方法、装置、终端及存储介质
Umair et al. Discovering personal places from location traces
CN103039036B (zh) 用户数量计算方法及系统
CN110049441B (zh) 基于深度集成学习的WiFi室内定位方法
CN105119743B (zh) 用户行为意图的获取方法及装置
CN106792527A (zh) 一种位置数据处理方法、装置和计算设备
CN103487057B (zh) 基于端点扩展的路径规划方法及装置
CN106131238B (zh) Ip地址的分类方法及装置
Niu et al. NMCT: a novel Monte Carlo-based tracking algorithm using potential proximity information
TWI583984B (zh) 區域性定位系統與方法
CN110320493B (zh) 室内定位方法、装置、电子设备和计算机存储介质
Frias-Martinez et al. Sensing urban land use with twitter activity

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant