CN111372186A - 一种非均匀定位场景下的位置计算方法及终端设备 - Google Patents
一种非均匀定位场景下的位置计算方法及终端设备 Download PDFInfo
- Publication number
- CN111372186A CN111372186A CN201911301897.0A CN201911301897A CN111372186A CN 111372186 A CN111372186 A CN 111372186A CN 201911301897 A CN201911301897 A CN 201911301897A CN 111372186 A CN111372186 A CN 111372186A
- Authority
- CN
- China
- Prior art keywords
- region
- samples
- parameter
- cluster
- clustering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004364 calculation method Methods 0.000 title claims abstract description 18
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 77
- 230000003044 adaptive effect Effects 0.000 claims abstract description 35
- 238000000034 method Methods 0.000 claims abstract description 30
- 238000012545 processing Methods 0.000 claims description 22
- 238000005259 measurement Methods 0.000 claims description 8
- 238000010586 diagram Methods 0.000 description 13
- 239000011159 matrix material Substances 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000000691 measurement method Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000009828 non-uniform distribution Methods 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 210000000707 wrist Anatomy 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/021—Services related to particular areas, e.g. point of interest [POI] services, venue services or geofences
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W64/00—Locating users or terminals or network equipment for network management purposes, e.g. mobility management
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Data Mining & Analysis (AREA)
- Computer Networks & Wireless Communication (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例公开了一种非均匀定位场景下的位置计算方法及终端设备,用于在聚类算法的基础上将非均匀定位点的样本按照不同的密度区域重新划分,得到子区域的样本,对子区域的样本再次重新聚类,得到对应的中心点。本发明实施例方法包括:获取关于终端设备的非均匀定位点的第一样本;根据第一样本,通过参数自适应算法计算得到第一参数;使用第一参数,将第一样本进行聚类,得到聚类后各个区域的第二样本,第二样本为第一样本的子集;根据各个区域的第二样本,通过参数自适应算法计算得到各个区域的第二参数;使用各个区域的第二参数,将各个区域的第二样本进行聚类,得到各个子区域的聚类簇;计算得到每个子区域的聚类簇的中心点。
Description
技术领域
本发明涉及终端设备定位领域,尤其涉及一种非均匀定位场景下的位置计算方法及终端设备。
背景技术
为了给终端设备提供高质量的位置服务,需要不断的计算定位(也称定位点)的中心点以确定终端设备活动的实际中心。但是,在位置服务场景中,一方面由于用户活动不规律,另一方面因为定位方式缺乏准确性,导致一定时间内积累的定位点在区域内分布呈现非均匀状态。这些非均匀状态中定位点表现为常用地点定位点较为密集,人迹罕至的地方定位点却十分稀疏。非均匀定位状态具体的定位场景如图1所示,为终端设备的定位点的第一样本的示意图。其一定区域内定位点或者轨迹点密度不均匀,有些地方定位点较为密集,有些地方定位点较为稀疏。
现有的技术方案中,主要是通过朴素的密度聚类算法的方式计算各个聚类簇的中心点。但是朴素的密度聚类算法需要人工提前配置参数,仅仅适用于簇之间的密度相差小的场景,那么对于上述非均匀定位状态的密度场景中,朴素的密度聚类算法并不适用,亦无法解决非均匀定位状态下定位的中心点的计算。也可以理解为如果用朴素的密度聚类算法,计算出来的中心点可靠性不高。
发明内容
本发明实施例提供了一种非均匀定位场景下的位置计算方法及终端设备,用于在聚类算法的基础上将非均匀定位点的样本按照不同的密度区域重新划分,得到子区域的样本,对子区域的样本再次重新聚类,得到对应的中心点。
有鉴于此,本发明第一方面提供一种非均匀定位场景下的位置计算方法,可以包括:
获取关于终端设备的非均匀定位点的第一样本;
根据所述第一样本,通过参数自适应算法计算得到第一参数;
使用所述第一参数,将所述第一样本进行聚类,得到聚类后各个区域的第二样本,所述第二样本为所述第一样本的子集;
根据所述各个区域的第二样本,通过所述参数自适应算法计算得到各个区域的第二参数;
使用所述各个区域的第二参数,将所述各个区域的第二样本进行聚类,得到各个子区域的聚类簇;
计算得到每个子区域的聚类簇的中心点。
可选的,本发明的一些实施例中,所述根据所述第一样本,通过参数自适应算法计算得到第一参数,包括:
对所述第一样本进行统计,得到统计结果;
根据所述统计结果,通过参数自适应算法计算得到第一参数。
可选的,本发明的一些实施例中,所述使用所述第一参数,将所述第一样本进行聚类,得到聚类后各个区域的第二样本,包括:
使用所述第一参数和聚类算法(Density-Based Spatial Clustering ofApplications with Noise,DBSCAN)将所述第一样本进行聚类,得到聚类后各个区域的第二样本;
所述使用所述各个区域的第二参数,将所述各个区域的第二样本进行聚类,得到各个子区域的聚类簇,包括:
使用所述各个区域的第二参数和聚类算法DBSCAN将所述各个区域的第二样本进行聚类,得到各个子区域的聚类簇。
可选的,本发明的一些实施例中,所述第一参数包括:第一最小样本和第一度量距离;
所述使用所述第一参数,将所述第一样本进行聚类,得到聚类后各个区域的第二样本,包括:
使用所述第一最小样本和所述第一度量距离,将所述第一样本进行聚类,得到聚类后各个区域的第二样本;
所述第二参数包括:第二最小样本和第二度量距离;
所述使用所述各个区域的第二参数,将所述各个区域的第二样本进行聚类,得到各个子区域的聚类簇,包括:
使用所述第二最小样本和所述第二度量距离,将所述各个区域的第二样本进行聚类,得到各个子区域的聚类簇。
可选的,本发明的一些实施例中,所述方法还包括:
根据所述各个子区域的聚类簇,通过所述参数自适应算法计算得到各个子区域的聚类簇的第三参数;
使用所述各个子区域的聚类簇的第三参数,将所述各个子区域的聚类簇进行再次聚类,得到各个子区域的目标聚类簇;
根据所述各个子区域的目标聚类簇,计算得到每个目标聚类簇的中心点。
本发明第二方面提供一种终端设备,可以包括:
获取模块,用于获取关于终端设备的非均匀定位点的第一样本;
处理模块,用于根据所述第一样本,通过参数自适应算法计算得到第一参数;使用所述第一参数,将所述第一样本进行聚类,得到聚类后各个区域的第二样本,所述第二样本为所述第一样本的子集;根据所述各个区域的第二样本,通过所述参数自适应算法计算得到各个区域的第二参数;使用所述各个区域的第二参数,将所述各个区域的第二样本进行聚类,得到各个子区域的聚类簇;计算得到每个子区域的聚类簇的中心点。
可选的,本发明的一些实施例中,
所述处理模块,具体用于对所述第一样本进行统计,得到统计结果;根据所述统计结果,通过参数自适应算法计算得到第一参数。
可选的,本发明的一些实施例中,
所述处理模块,具体用于使用所述第一参数和聚类算法DBSCAN将所述第一样本进行聚类,得到聚类后各个区域的第二样本;
所述处理模块,具体用于使用所述各个区域的第二参数和聚类算法DBSCAN将所述各个区域的第二样本进行聚类,得到各个子区域的聚类簇。可选的,本发明的一些实施例中,
所述第一参数包括:第一最小样本和第一度量距离;
所述处理模块,具体用于使用所述第一最小样本和所述第一度量距离,将所述第一样本进行聚类,得到聚类后各个区域的第二样本;
所述第二参数包括:第二最小样本和第二度量距离;
所述处理模块,具体用于使用所述第二最小样本和所述第二度量距离,将所述各个区域的第二样本进行聚类,得到各个子区域的聚类簇。
可选的,本发明的一些实施例中,
所述处理模块,还用于根据所述各个子区域的聚类簇,通过所述参数自适应算法计算得到各个子区域的聚类簇的第三参数;使用所述各个子区域的聚类簇的第三参数,将所述各个子区域的聚类簇进行再次聚类,得到各个子区域的目标聚类簇;根据所述各个子区域的目标聚类簇,计算得到每个目标聚类簇的中心点。
本发明第三方面提供一种终端设备,包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,用于执行如本发明第一方面及第一方面任一可选实现方式中所述的非均匀定位场景下的位置计算方法的步骤。
本发明实施例第四方面提供一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如本发明第一方面及第一方面任一可选实现方式中非均匀定位场景下的位置计算方法的步骤。
本发明实施例第五方面公开一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行本发明实施例第一方面公开的任意一种非均匀定位场景下的位置计算方法的部分或全部步骤。
本发明实施例第六方面公开一种应用发布平台,所述应用发布平台用于发布计算机程序产品,其中,当所述计算机程序产品在计算机上运行时,使得所述计算机执行本发明实施例第一方面公开的任意一种非均匀定位场景下的位置计算方法的部分或全部步骤。
本发明实施例第六方面提供一种可穿戴设备,所述电子设备包括如上述第二方面或者第三方面所述的终端设备。
从以上技术方案可以看出,本发明实施例具有以下优点:
在本发明实施例中,获取关于终端设备的非均匀定位点的第一样本;根据第一样本,通过参数自适应算法计算得到第一参数;使用第一参数,将第一样本进行聚类,得到聚类后各个区域的第二样本,第二样本为第一样本的子集;根据各个区域的第二样本,通过参数自适应算法计算得到各个区域的第二参数;使用各个区域的第二参数,将各个区域的第二样本进行聚类,得到各个子区域的聚类簇;根据各个子区域的聚类簇,计算得到每个子区域的中心点。本发明技术方案相比较朴素的密度聚类算法DBSCAN而言具备自适应能力,无需过多的人工干预调参,可以自动调节参数。本方案在聚类算法的基础上将非均匀定位点的样本按照不同的密度区域重新划分,得到子区域的样本,对子区域的样本再次重新聚类,得到对应的中心点。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例和现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,还可以根据这些附图获得其它的附图。
图1为终端设备的定位点的第一样本的示意图;
图2为本发明实施例中非均匀定位场景下的位置计算方法的一个实施例示意图;
图3A为本发明实施例中首次聚类后各个区域的第二样本的示意图;
图3B为本发明实施例中二次聚类后各个子区域的聚类簇的示意图;
图3C为本发明实施例中各个样本到邻近样本的距离的示意图;
图4为本发明实施例中终端设备的一个实施例示意图;
图5为本发明实施例中终端设备的另一个实施例示意图。
具体实施方式
本发明实施例提供了一种非均匀定位场景下的位置计算方法及终端设备,用于在聚类算法的基础上将非均匀定位点的样本按照不同的密度区域重新划分,得到子区域的样本,对子区域的样本再次重新聚类,得到对应的中心点。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,都应当属于本发明保护的范围。
下面先对本申请实施例中所涉及的技术名词解释:
簇:对原始的定位点数据聚类之后形成的小规模点集合;
非均匀密度环境:一定范围区域内定位点呈现不同密度程度的聚集,并且密度之间差别甚远。
在位置服务场景中,经常需要寻找终端设备的历史定位簇的中心点,即中心位置,但是不同终端设备在不同地方的历史定位簇常呈现非均匀状态。针对非均匀状态的定位分布位置的中心点计算这一问题,本发明提出了一种新型基于密度定位的中心点计算方法,可以有效地解决非均匀状态下定位的中心点,即中心位置寻找不准确的问题。
对该问题的解决,本方法相比较朴素的密度聚类算法DBSCAN而言具备自适应能力,无需过多的人工干预调参,可以自动调节参数。本方案在朴素的密度聚类算法的基础上,将空间按照不同的密度区域重新划分,得到各个区域簇,对各个区域簇再次重新聚类,得到各个子区域簇,最后得到最终的位置中心。上述方法克服了定位场景的非均匀性,可以有效的获取不同密度定位簇的中心位置。
在本发明实施例中,示例性的,终端设备可以包括一般的手持电子终端,诸如智能电话、便携式终端、终端、个人数字助理(Personal Digital Assistant,PDA)、便携式多媒体播放器(Personal Media Player,PMP)装置、笔记本电脑、笔记本(Note Pad)、无线宽带(Wireless Broadband,Wibro)终端、平板电脑(personal computer,PC)和智能PC。本申请还可应用于非便携式电子装置,诸如提供相机功能的智能电视。
终端设备也可以包括可穿戴设备。可穿戴设备即可以直接穿戴在用户身上,或是整合到用户的衣服或配件的一种便携式电子设备。可穿戴设备不仅仅是一种硬件设备,更可以通过软件支持以及数据交互、云端交互来实现强大的智能功能,比如:计算功能、定位功能、报警功能,同时还可以连接手机及各类终端。可穿戴设备可以包括但不限于以手腕为支撑的watch类(比如手表、手腕等产品),以脚为支撑的shoes类(比如鞋、袜子或者其他腿上佩戴产品),以头部为支撑的Glass类(比如眼镜、头盔、头带等)以及智能服装,书包、拐杖、配饰等各类非主流产品形态。在下述实施例中,以可穿戴设备为智能手表为例进行说明。
本发明是针对非均匀密度样本提出的解决方法,故使用的定位点的样本数据皆为非均匀数据进行说明。本发明为了区分不同的密度区域并且找到各个定位簇的中心点,可以使用大于等于两次的聚类算法。如果为使用两次聚类算法,可以分为首次聚类和二次聚类。
本发明技术方案总的来说可以分为六步:1、初次定位点的样本统计,主要计算得出初次定位点的样本的统计特性;2、参数估计,依据计算出来的统计特性,计算得到对于DBSCAN算法的参数估计;3、输出首轮聚类结果,本部分主要聚类输出相似密度的样本,得到各个区域的样本;4、分别对各个区域进行特征统计;5、针对各个区域的样本再次进行参数估计;6、输出二轮聚类结果,得到各个子区域的样本;7、输出各个子区域的中心点位置。本发明所输出的中心点即代表最终计算获得的位置点。具体的流程图如图2所示。
下面以实施例的方式,对本发明技术方案做进一步的说明,如图2所示,为本发明实施例中非均匀定位场景下的位置计算方法的一个实施例示意图,可以包括:
201、获取关于终端设备的非均匀定位点的第一样本。
终端设备获取关于终端设备的非均匀定位点的第一样本。可以理解的是,该非均匀定位点的第一样本可以是预先通过终端设备或者服务器获取的历史非均匀定位点的位置信息。如果是从服务器获取的,那么获取的方式可以是主动获取,也可以是被动接收。如果是通过终端设备自身获取的,那么可以通过终端设备的位置传感器检测得到位置信息。其中,位置传感器可以用来测量终端设备自身位置的传感器。位置传感器可以分为两种,分别为直线位移传感器和角位移传感器。
202、根据所述第一样本,通过参数自适应算法计算得到第一参数。
终端设备根据所述第一样本,通过参数自适应算法计算得到第一参数,可以包括:终端设备对所述第一样本进行统计,得到统计结果;终端设备根据所述统计结果,通过参数自适应算法计算得到第一参数。
终端设备可以对定位点的第一样本进行计算,得到关于定位点的第一样本的统计特性,然后,终端设备依据对关于定位点的第一样本的统计特性,计算得到对于DBSCAN算法的参数估计,即第一参数。例如,第一参数可以是均值或者方差等参数。
203、使用所述第一参数,将所述第一样本进行聚类,得到聚类后各个区域的第二样本。
可选的,终端设备使用所述第一参数,将所述第一样本进行聚类,得到聚类后各个区域的第二样本,可以包括:终端设备使用所述第一参数和聚类算法DBSCAN将所述第一样本进行聚类,得到聚类后各个区域的第二样本,所述第二样本为所述第一样本的子集。
可选的,所述第一参数可以包括:第一最小样本和第一度量距离;终端设备使用所述第一参数,将所述第一样本进行聚类,得到聚类后各个区域的第二样本,可以包括:终端设备使用所述第一最小样本和所述第一度量距离,将所述第一样本进行聚类,得到聚类后各个区域的第二样本。
本发明所提及的聚类算法方式和参数自适应方式具有相同的理论方法,在接下来的阐述中重点介绍参数自适应和非均匀聚类方法。
在实际操作中,最终目的是得到每一个簇的中心位置,但是由于每一个簇的密度不同,给簇区分带来了难度。进一步分析非均匀场景的特点可以发现,该类型密度无法确定,但是分割的边界依旧非常明显,因此可以两次或两次以上聚类的方式寻找不同密度的分割边界。
示例性的,对终端设备获取的定位的第一样本在首次聚类时,可设参数值为min_samples_1和Eps_1,分别代表最小样本和度量距离。首次聚类之后将图1所示的定位点的第一样本分为了四部分,该首次聚类将设置为小密度值,使得各个密度层次的聚类数据得到很好区分。
得到使用第一次聚类算法得到的区域集合:
A1={(x10,y10),(x11,y12),...,(x1i,y1i)},A2={(x20,y20),...,(x2j,y2j)},A3={(x30,y30),...,(x3k,y3k)},A4={(x40,y40),...,(x4m,y4m)}
其中,i,j,k,m是上述四个区域的定位点数量值。如图3A所示,为本发明实施例中首次聚类后各个区域的第二样本的示意图。
204、根据所述各个区域的第二样本,通过所述参数自适应算法计算得到各个区域的第二参数。
终端设备可以根据各个区域的第二样本,通过所述参数自适应算法计算得到各个区域的第二参数。例如,第二参数可以是均值或者方差等参数。
205、使用所述各个区域的第二参数,将所述各个区域的第二样本进行聚类,得到各个子区域的聚类簇。
可选的,终端设备使用所述各个区域的第二参数,将所述各个区域的第二样本进行聚类,得到各个子区域的聚类簇,可以包括:终端设备使用所述各个区域的第二参数和聚类算法DBSCAN将所述各个区域的第二样本进行聚类,得到各个子区域的聚类簇。
可选的,所述第二参数可以包括:第二最小样本和第二度量距离;终端设备使用所述各个区域的第二参数,将所述各个区域的第二样本进行聚类,得到聚类后各个子区域的聚类簇,可以包括:终端设备使用所述第二最小样本和所述第二度量距离,将所述各个区域的第二样本进行聚类,得到聚类后各个子区域的聚类簇。
二次聚类是在首次聚类的基础上进行的,示例性的,本发明技术方案对An分别进行聚类,其中,An可以包括上述的A1,A2,A3和A4。分别设置参数为min_samples_2和Eps_2。二次聚类结果如图3B所示,图3B为本发明实施例中二次聚类后各个子区域的第二样本的示意图。在图3B所示中,不同图案的圆点代表不同的类别,其中黑色的圆点为噪声点。
二次聚类是一种高密度聚类,也就是说需满足该条件,样本的密度达到指定标准才可以得到聚类结果且不受密度不均匀的限制。在首次聚类的基础上,二次聚类将区域A进行了再分,各个区域将会依据本区域的样本统计特征得到最适合的聚类参数,具体的参数自适应方法将在下一部分体现。
206、计算得到每个子区域的聚类簇的中心点。
终端设备可以根据所述各个子区域的聚类簇,计算得到每个子区域的聚类簇的中心点。可以理解的是,二次聚类完成之后可以进行中心点计算,每一个簇确定的几何中心点就是本发明技术方案需要寻找的位置定位中心点。
可选的,本发明的一些实施例中,终端设备根据所述每个子区域的聚类簇的中心点,计算得到所述终端设备的中心位置。
可以理解的是,图1所示的终端设备获取的定位点的第一样本明显表现出分布的非均匀现象,非均匀聚类的目的就是能够将不均匀分布的样本进行很好的区分。本发明技术方案的基本模型依旧使用DBSCAN算法进行聚类,但是在DBSCAN算法的基础上进行了改进。
需要说明的是,在第一次进行聚类和第二次进行聚类的方法中,都需要配置其参数,本发明技术方案提出依据样本点的样本的统计特性来计算参数。示例性的,定义数据关系矩阵来反映各个样本之间的关联性,设定位点的数据集合中有k个样本,则可以得到一个k*k的关系矩阵R。
在本发明技术方案中,对于关系值x采取距离度量的方式进行计算,本距离度量方式包含但是不限于欧氏距离、马哈顿距离以及余弦相似度等度量方式。由于矩阵R是实对称矩阵,距离度量xij=d(i,j),故R又可以表示为:
d(i,j)是两个样本之间相似的不同程度的刻画,其值大于等于0。对角线上的元素都为0,反映的是样本和自身相比较不存在差别,如果两个样本之间的差别越大,则d值就会越高。依据上述思想,本发明技术方案建立了距离分布矩阵Rk*k,对距离分布矩阵R的每一列进行升序排列,排列之后得到矩阵Qk*k。矩阵Qk*k的第i行表示数据集中每一个对象到第k个最近邻的距离集合。对每一行的数据进行展示可以得到如下的样本表现。
如图3C所示,为本发明实施例中各个样本到邻近样本的距离的示意图。在图3C所示中,可以发现每一条距离曲线都具有相同的趋势,说明各个样本和邻近距离之间的关系具有相似性。使用多项式拟合得出函数f(x),函数的图像如图3C中粗黑线所示。可以设所有的样本点的邻域为I,由于是多项式拟合必然二阶可导,求出满足f″(x0)=0和f″′(x0)>0的x0,则点(x0,f(x0))就是拐点,其中f(x0)对应的值就是Eps。在确定Eps的值之后,需要确定min_samples的值。设单次聚类场景下样本集合为A={(x0,y0),(x1,y2),...,(xi,yi)},本发明技术方案使用的计算方式为:
min_samples=round(ln(len(A)))
其中,min_samples由集合A的样本数量决定,严格来说是对集合A的数量值取对数再取整。自此,聚类算法DBSCAN所需要的两个参数全都已经给出,实际使用表明该方式可以获取可靠的min_samples和Eps。
可选的,在本发明的一些实施例中,根据所述各个子区域的聚类簇,通过所述参数自适应算法计算得到各个子区域的聚类簇的第三参数;使用所述各个子区域的聚类簇的第三参数,将所述各个子区域的聚类簇进行再次聚类,得到各个子区域的目标聚类簇;根据所述各个子区域的目标聚类簇,计算得到每个目标聚类簇的中心点。如果想要终端设备的定位点更准确,也可以根据终端设备的非均匀定位点的第一样本,进行首次聚类和二次聚类之后,再次进行三次或四次等聚类,本发明实施例中不做具体限定。
本发明提出了一种新型基于密度的中心点计算方法,可以有效地解决非均匀定位点的中心位置计算问题。对该问题的解决,本发明实施例相比较朴素的密度聚类算法DBSCAN而言具备自适应能力,无需过多的人工干预调参,可以自动调节参数。本发明技术方案在现有聚类的基础上将空间按照不同的密度区域重新划分,得到各个区域的簇,对各个区域的簇再次重新聚类,得到各个子区域的簇,最后得到最终的位置中心。上述方法克服了定位场景的非均匀性,可以有效的获取不同密度定位簇的中心位置。
示例性的,下面以实际应用场景为例进行说明本发明技术方案,如下所示:
用户小李在一个月内,经常去的地方有家、办公室、商场、健身房等。但是因为去各个地方的次数不一样,例如,在家有120次,办公室60次,商场5次,健身房20次。通过现有技术定位的话,去商场的次数太少了,这部分数据可能就被当成无效数据,从而计算出来的定位点就没有商场,这就导致定位的结果不准确。如果使用本发明技术方案,就可以对非均匀定位样本,如120次+60次+5次+20次的样本数据,最终计算出来的定位点为家,办公室,商场,健身房,定位更加准确。
总而言之,本发明技术方案具备以下优点:
可以解决非均匀密度环境下的位置中心点计算问题;每一次聚类皆可以自适应调参,无需人工干预,且能得到优良的聚类性能。
可以理解的是,本发明技术方案使用的是DBSCAN的聚类方式作为基础算法,可能存在其他的密度聚类算法依旧能实现上述的发明方案替代。
本发明技术方案的基本原理如下所示:
本发明之说以能在非均匀密度环境位置计算方面取得积极效果,是因为本发明提出了两方面的创新改进。一方面是,两层或者两层以上的嵌套聚类,该聚类方式有效的解决了一次性聚类无法克服的非均匀性问题。另一方面则是采用自适应调参的方法确定不同的样本对应不同的中心聚类计算参数,自动调参降低了人工参与的成本且针对不同的密度值能给出不同的参数估计。
在本发明实施例中,获取关于终端设备的非均匀定位点的第一样本;根据第一样本,通过参数自适应算法计算得到第一参数;使用第一参数,将第一样本进行聚类,得到聚类后各个区域的第二样本,第二样本为第一样本的子集;根据各个区域的第二样本,通过参数自适应算法计算得到各个区域的第二参数;使用各个区域的第二参数,将各个区域的第二样本进行聚类,得到各个子区域的聚类簇;根据各个子区域的聚类簇,计算得到每个子区域的中心点。本发明技术方案相比较朴素的密度聚类算法DBSCAN而言具备自适应能力,无需过多的人工干预调参,可以自动调节参数。本方案在聚类算法的基础上将非均匀定位点的样本按照不同的密度区域重新划分,得到子区域的样本,对子区域的样本再次重新聚类,得到对应的中心点。
通过本发明技术方案,可以解决非均匀密度场景的聚类问题;还可以解决密度聚类的参数自适应问题。即可以保护非均匀场景的聚类方案,尤其是非均匀密度环境的位置定位方案,以及各类密度聚类的组合方案。
如图4所示,为本发明实施例中终端设备的一个实施例示意图,可以包括:
获取模块401,用于获取关于终端设备的非均匀定位点的第一样本;
处理模块402,用于根据所述第一样本,通过参数自适应算法计算得到第一参数;使用所述第一参数,将所述第一样本进行聚类,得到聚类后各个区域的第二样本,所述第二样本为所述第一样本的子集;根据所述各个区域的第二样本,通过所述参数自适应算法计算得到各个区域的第二参数;使用所述各个区域的第二参数,将所述各个区域的第二样本进行聚类,得到各个子区域的聚类簇;计算得到每个子区域的聚类簇的中心点。
可选的,本发明的一些实施例中,
处理模块402,具体用于对所述第一样本进行统计,得到统计结果;根据所述统计结果,通过参数自适应算法计算得到第一参数。
可选的,本发明的一些实施例中,
处理模块402,具体用于使用所述第一参数和聚类算法DBSCAN将所述第一样本进行聚类,得到聚类后各个区域的第二样本;
处理模块402,具体用于使用所述各个区域的第二参数和聚类算法DBSCAN将所述各个区域的第二样本进行聚类,得到各个子区域的聚类簇。可选的,本发明的一些实施例中,
所述第一参数包括:第一最小样本和第一度量距离;
处理模块402,具体用于使用所述第一最小样本和所述第一度量距离,将所述第一样本进行聚类,得到聚类后各个区域的第二样本;
所述第二参数包括:第二最小样本和第二度量距离;
处理模块402,具体用于使用所述第二最小样本和所述第二度量距离,将所述各个区域的第二样本进行聚类,得到各个子区域的聚类簇。
可选的,本发明的一些实施例中,
处理模块402,还用于根据所述各个子区域的聚类簇,通过所述参数自适应算法计算得到各个子区域的聚类簇的第三参数;使用所述各个子区域的聚类簇的第三参数,将所述各个子区域的聚类簇进行再次聚类,得到各个子区域的目标聚类簇;根据所述各个子区域的目标聚类簇,计算得到每个目标聚类簇的中心点。
如图5所示,为本发明实施例中终端设备的另一个实施例示意图,可以包括:
存储有可执行程序代码的存储器501;
与所述存储器耦合的处理器502;
收发器503,收发器503与处理器502通过总线连接;
处理器502调用存储器501中存储的所述可执行程序代码,用于执行如下步骤:
获取关于终端设备的非均匀定位点的第一样本;
根据所述第一样本,通过参数自适应算法计算得到第一参数;
使用所述第一参数,将所述第一样本进行聚类,得到聚类后各个区域的第二样本,所述第二样本为所述第一样本的子集;
根据所述各个区域的第二样本,通过所述参数自适应算法计算得到各个区域的第二参数;
使用所述各个区域的第二参数,将所述各个区域的第二样本进行聚类,得到各个子区域的聚类簇;
计算得到每个子区域的聚类簇的中心点。
可选的,本发明的一些实施例中,处理器502调用存储器501中存储的所述可执行程序代码,用于执行如下步骤:
对所述第一样本进行统计,得到统计结果;
根据所述统计结果,通过参数自适应算法计算得到第一参数。
可选的,本发明的一些实施例中,处理器502调用存储器501中存储的所述可执行程序代码,用于执行如下步骤:
使用所述第一参数和聚类算法DBSCAN将所述第一样本进行聚类,得到聚类后各个区域的第二样本;
使用所述各个区域的第二参数和聚类算法DBSCAN将所述各个区域的第二样本进行聚类,得到各个子区域的聚类簇。
可选的,本发明的一些实施例中,所述第一参数可以包括:第一最小样本和第一度量距离;所述第二参数可以包括:第二最小样本和第二度量距离;
处理器502调用存储器501中存储的所述可执行程序代码,用于执行如下步骤:
使用所述第一最小样本和所述第一度量距离,将所述第一样本进行聚类,得到聚类后各个区域的第二样本;
使用所述第二最小样本和所述第二度量距离,将所述各个区域的第二样本进行聚类,得到各个子区域的聚类簇。
可选的,本发明的一些实施例中,处理器502调用存储器501中存储的所述可执行程序代码,用于执行如下步骤:
根据所述各个子区域的聚类簇,通过所述参数自适应算法计算得到各个子区域的聚类簇的第三参数;
使用所述各个子区域的聚类簇的第三参数,将所述各个子区域的聚类簇进行再次聚类,得到各个子区域的目标聚类簇;
根据所述各个子区域的目标聚类簇,计算得到每个目标聚类簇的中心点。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。
所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(Digital Subscriber Line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD(Digital Video Disc))、或者半导体介质(例如固态硬盘(Solid StateDisk,SSD))等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种非均匀定位场景下的位置计算方法,其特征在于,包括:
获取关于终端设备的非均匀定位点的第一样本;
根据所述第一样本,通过参数自适应算法计算得到第一参数;
使用所述第一参数,将所述第一样本进行聚类,得到聚类后各个区域的第二样本,所述第二样本为所述第一样本的子集;
根据所述各个区域的第二样本,通过所述参数自适应算法计算得到各个区域的第二参数;
使用所述各个区域的第二参数,将所述各个区域的第二样本进行聚类,得到各个子区域的聚类簇;
计算得到每个子区域的聚类簇的中心点。
2.根据所述权利要求1所述的方法,其特征在于,所述根据所述第一样本,通过参数自适应算法计算得到第一参数,包括:
对所述第一样本进行统计,得到统计结果;
根据所述统计结果,通过参数自适应算法计算得到第一参数。
3.根据权利要求1或2所述的方法,其特征在于,所述使用所述第一参数,将所述第一样本进行聚类,得到聚类后各个区域的第二样本,包括:
使用所述第一参数和聚类算法DBSCAN将所述第一样本进行聚类,得到聚类后各个区域的第二样本;
所述使用所述各个区域的第二参数,将所述各个区域的第二样本进行聚类,得到各个子区域的聚类簇,包括:
使用所述各个区域的第二参数和聚类算法DBSCAN将所述各个区域的第二样本进行聚类,得到各个子区域的聚类簇。
4.根据权利要求1或2所述的方法,其特征在于,所述第一参数包括:第一最小样本和第一度量距离;
所述使用所述第一参数,将所述第一样本进行聚类,得到聚类后各个区域的第二样本,包括:
使用所述第一最小样本和所述第一度量距离,将所述第一样本进行聚类,得到聚类后各个区域的第二样本;
所述第二参数包括:第二最小样本和第二度量距离;
所述使用所述各个区域的第二参数,将所述各个区域的第二样本进行聚类,得到各个子区域的聚类簇,包括:
使用所述第二最小样本和所述第二度量距离,将所述各个区域的第二样本进行聚类,得到各个子区域的聚类簇。
5.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
根据所述各个子区域的聚类簇,通过所述参数自适应算法计算得到各个子区域的聚类簇的第三参数;
使用所述各个子区域的聚类簇的第三参数,将所述各个子区域的聚类簇进行再次聚类,得到各个子区域的目标聚类簇;
根据所述各个子区域的目标聚类簇,计算得到每个目标聚类簇的中心点。
6.一种终端设备,其特征在于,包括:
获取模块,用于获取关于终端设备的非均匀定位点的第一样本;
处理模块,用于根据所述第一样本,通过参数自适应算法计算得到第一参数;使用所述第一参数,将所述第一样本进行聚类,得到聚类后各个区域的第二样本,所述第二样本为所述第一样本的子集;根据所述各个区域的第二样本,通过所述参数自适应算法计算得到各个区域的第二参数;使用所述各个区域的第二参数,将所述各个区域的第二样本进行聚类,得到各个子区域的聚类簇;计算得到每个子区域的聚类簇的中心点。
7.根据权利要求6所述的终端设备,其特征在于,
所述处理模块,具体用于对所述第一样本进行统计,得到统计结果;根据所述统计结果,通过参数自适应算法计算得到第一参数。
8.根据权利要求6或7所述的终端设备,其特征在于,
所述处理模块,具体用于使用所述第一参数和聚类算法DBSCAN将所述第一样本进行聚类,得到聚类后各个区域的第二样本;
所述处理模块,具体用于使用所述各个区域的第二参数和聚类算法DBSCAN将所述各个区域的第二样本进行聚类,得到各个子区域的聚类簇。
9.根据权利要求6或7所述的终端设备,其特征在于,所述第一参数包括:第一最小样本和第一度量距离;
所述处理模块,具体用于使用所述第一最小样本和所述第一度量距离,将所述第一样本进行聚类,得到聚类后各个区域的第二样本;
所述第二参数包括:第二最小样本和第二度量距离;
所述处理模块,具体用于使用所述第二最小样本和所述第二度量距离,将所述各个区域的第二样本进行聚类,得到各个子区域的聚类簇。
10.根据权利要求6或7所述的终端设备,其特征在于,
所述处理模块,还用于根据所述各个子区域的聚类簇,通过所述参数自适应算法计算得到各个子区域的聚类簇的第三参数;使用所述各个子区域的聚类簇的第三参数,将所述各个子区域的聚类簇进行再次聚类,得到各个子区域的目标聚类簇;根据所述各个子区域的目标聚类簇,计算得到每个目标聚类簇的中心点。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911301897.0A CN111372186B (zh) | 2019-12-17 | 2019-12-17 | 一种非均匀定位场景下的位置计算方法及终端设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911301897.0A CN111372186B (zh) | 2019-12-17 | 2019-12-17 | 一种非均匀定位场景下的位置计算方法及终端设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111372186A true CN111372186A (zh) | 2020-07-03 |
CN111372186B CN111372186B (zh) | 2021-08-24 |
Family
ID=71212441
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911301897.0A Active CN111372186B (zh) | 2019-12-17 | 2019-12-17 | 一种非均匀定位场景下的位置计算方法及终端设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111372186B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102880719A (zh) * | 2012-10-16 | 2013-01-16 | 四川大学 | 基于位置社交网络的用户轨迹相似性挖掘方法 |
CN105843919A (zh) * | 2016-03-24 | 2016-08-10 | 云南大学 | 一种基于多特征融合与聚类集成的移动对象轨迹聚类方法 |
CN106412841A (zh) * | 2016-11-23 | 2017-02-15 | 沈阳航空航天大学 | 一种基于dbscan算法的室内定位方法 |
CN107766808A (zh) * | 2017-09-30 | 2018-03-06 | 北京泓达九通科技发展有限公司 | 道路网络空间中车辆对象移动轨迹聚类的方法及系统 |
CN108182446A (zh) * | 2017-12-13 | 2018-06-19 | 北京中交兴路信息科技有限公司 | 一种基于聚类算法的司机常驻地预测方法及装置 |
CN109948701A (zh) * | 2019-03-19 | 2019-06-28 | 太原科技大学 | 一种基于轨迹间时空关联性的数据聚类方法 |
CN110298558A (zh) * | 2019-06-11 | 2019-10-01 | 欧拉信息服务有限公司 | 车辆资源部署方法和装置 |
CN110324787A (zh) * | 2019-06-06 | 2019-10-11 | 东南大学 | 一种手机信令数据的职住地获取方法 |
US20190325382A1 (en) * | 2018-04-20 | 2019-10-24 | United States Postal Service | Use of geospatial coordinate systems for tracking item delivery |
-
2019
- 2019-12-17 CN CN201911301897.0A patent/CN111372186B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102880719A (zh) * | 2012-10-16 | 2013-01-16 | 四川大学 | 基于位置社交网络的用户轨迹相似性挖掘方法 |
CN105843919A (zh) * | 2016-03-24 | 2016-08-10 | 云南大学 | 一种基于多特征融合与聚类集成的移动对象轨迹聚类方法 |
CN106412841A (zh) * | 2016-11-23 | 2017-02-15 | 沈阳航空航天大学 | 一种基于dbscan算法的室内定位方法 |
CN107766808A (zh) * | 2017-09-30 | 2018-03-06 | 北京泓达九通科技发展有限公司 | 道路网络空间中车辆对象移动轨迹聚类的方法及系统 |
CN108182446A (zh) * | 2017-12-13 | 2018-06-19 | 北京中交兴路信息科技有限公司 | 一种基于聚类算法的司机常驻地预测方法及装置 |
US20190325382A1 (en) * | 2018-04-20 | 2019-10-24 | United States Postal Service | Use of geospatial coordinate systems for tracking item delivery |
CN109948701A (zh) * | 2019-03-19 | 2019-06-28 | 太原科技大学 | 一种基于轨迹间时空关联性的数据聚类方法 |
CN110324787A (zh) * | 2019-06-06 | 2019-10-11 | 东南大学 | 一种手机信令数据的职住地获取方法 |
CN110298558A (zh) * | 2019-06-11 | 2019-10-01 | 欧拉信息服务有限公司 | 车辆资源部署方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111372186B (zh) | 2021-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101691129B1 (ko) | 루틴 이탈 알림 | |
US20230084866A1 (en) | Methods, systems and apparatus to optimize pipeline execution | |
CN109813434B (zh) | 一种基于温度检测的人体识别方法、装置及终端设备 | |
KR101605366B1 (ko) | 주변-위치 업데이트의 그룹화 | |
CN111950543B (zh) | 一种目标检测方法和装置 | |
KR101603682B1 (ko) | 루틴 추정 | |
CN110533693B (zh) | 一种目标跟踪方法及目标跟踪装置 | |
WO2017201621A1 (en) | Determining a location of a wireless device using fingerprinting | |
WO2017125092A1 (zh) | 号码标记方法和系统 | |
CN104427610A (zh) | WiFi室内定位方法与服务器 | |
CN109525933B (zh) | 位置隐私保护方法及装置 | |
KR102472551B1 (ko) | 전자 장치 및 전자 장치에서의 위치 추정 방법 | |
CN111372186B (zh) | 一种非均匀定位场景下的位置计算方法及终端设备 | |
CN108989383B (zh) | 数据处理方法和客户端 | |
CN111008864B (zh) | 一种营销码与商户之间的铺设关系的确定方法、装置及电子设备 | |
CN114760684A (zh) | 无线定位方法、路径识别模型的训练方法和装置 | |
CN111262538A (zh) | 音频信号增益调节方法、装置、终端设备及音频系统 | |
TW201806329A (zh) | 一種可感知干擾源的系統及方法 | |
CN115953655A (zh) | 一种目标分析方法及装置 | |
CN112214639B (zh) | 视频筛选方法、视频筛选装置及终端设备 | |
CN110751046B (zh) | 一种用户识别方法、装置、可读存储介质及终端设备 | |
CN109788431B (zh) | 一种基于相邻节点组的蓝牙定位方法、装置、设备和系统 | |
CN112652410A (zh) | 运动数据回放方法、装置、设备和计算机可读存储介质 | |
KR20200036173A (ko) | 사용자 그루핑 및 그룹별 선호 기계학습 분석 알고리즘을 추천하는 방법 및 장치 | |
CN118555544B (zh) | 定位精度的评测方法、装置、电子设备及计算机存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |