CN104093203A - 一种用于无线室内定位的接入点选择算法 - Google Patents

一种用于无线室内定位的接入点选择算法 Download PDF

Info

Publication number
CN104093203A
CN104093203A CN201410319663.XA CN201410319663A CN104093203A CN 104093203 A CN104093203 A CN 104093203A CN 201410319663 A CN201410319663 A CN 201410319663A CN 104093203 A CN104093203 A CN 104093203A
Authority
CN
China
Prior art keywords
overbar
positioning
algorithm
sigma
location
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410319663.XA
Other languages
English (en)
Inventor
陈丽娜
苏开乐
苗春雨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Normal University CJNU
Original Assignee
Zhejiang Normal University CJNU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Normal University CJNU filed Critical Zhejiang Normal University CJNU
Priority to CN201410319663.XA priority Critical patent/CN104093203A/zh
Publication of CN104093203A publication Critical patent/CN104093203A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Position Fixing By Use Of Radio Waves (AREA)

Abstract

本发明公开了一种用于无线室内定位的接入点选择算法,采集各AP的RSS信号,根据聚类算法确定目标定位区域,部署参考点RP,在每一个RP位置接收来自所有可见AP的信号,并将RSS值与对应的RP坐标存储至指纹数据库,建立原始指纹数据库;对定位区域进行聚类分块,将较大的定位区域分成若干个小的定位子区域,每一个定位子区域,根据IGW信息增益权重准则,进行AP选择,获取更有利于定位精度和复杂度的AP集合;根据KD-LDA算法,从AP集合对应的AP的RSS信号中提取最具判别能力的定位特征,利用定位特征,采用支持向量回归(SVR)的方法进行位置解算。本发明的有益效果是提高室内定位的解算效率和定位精度。

Description

一种用于无线室内定位的接入点选择算法
技术领域
本发明属于无线定位技术领域,涉及一种用于无线室内定位的接入点选择算法。
背景技术
来自不同AP的RSS信号所包含的信息量是不同的,在当前各个公共热点高密度部署AP情况下,这种差异尤为明显。因此并不是所有的AP提供的RSS信号都有利于定位,很多RSS受到各种各样的噪声影响,含有大量的不利于定位的信息,不仅不会提高系统的定位精度,反而起到相反的作用。针对已有的AP选择算法没有考虑AP的查全率和查准率问题,本文基于信息熵理论,提出了基于信息增益权重的AP选择算法。对基于RSS的AP的定位能力进行判别,筛选出最优的AP集合用于定位。该算法更有利于去掉冗余的AP,提高定位算法的解算效率和定位精度。
理论上,可以利用的AP个数越多,越有利于室内定位。在WLAN室内定位初期,由于每个室内环境AP部署数量不多,关于AP的选择还没引起科研人员的足够重视。但为满足人们日常生活和工作的需求,绝大多数的室内环境都部署了大量的较高密度AP。随着可以利用的AP数量急剧增加(比如在某幢大楼,最多可感测到近200个AP),为位置指纹的定位带来了两个突出问题:
其一,并不是所有AP的信息都是有利于定位结果的产生,有些AP由于距离或噪声的干扰,所携带的用于定位的信息量较少,可能会导致定位精度下降;
其二,越多的AP,意味着有更多的信息需要处理,这将增加计算的复杂度。
因此,从感测到的AP中选取最有利于定位结果的AP子集合是新室内环境下提高定位精度、降低定位算法复杂度的重要方法和途径。目前较流行的AP选择法是对RSS进行预处理。AP选择算法的中心思想是通过某种判决准则,在已监测到的AP中保留位置表现力较强的AP用于定位。Kushki等人通过度量AP之间的分散度来选择AP。研究证明,如选取恰当的AP用于定位,既可以降低定位误差,又可以降低定位算法的复杂度。定位算法往往需要若干个AP组成集合用于定位,已有文献中的AP选择法往往是通过计算每个AP的最大信息熵来加以选择,都没有考虑选择接入点的全面性和准确性。本发明可充分考虑AP选择的查全率和查准率,避免漏选和错选,利用本算法获得的用于定位的AP集合能更有效地提高系统的定位精度和小定位误差的概率。并通过减少用户定位的AP数量达到降低系统计算复杂度的目的。
发明内容
本发明的目的在于提供一种用于无线室内定位的接入点选择算法,解决了现有的在当前各个公共热点高密度部署AP情况下,以往的算法没有考虑AP选择的查全率和查准率,也就是来自某些AP的RSS信号所包含的信息量不利于定位精度的问题。
本发明所采用的技术方案是按照以下步骤进行:
Step1:采集各AP的RSS信号,根据聚类算法确定目标定位区域,部署参考点RP,在每一个RP位置接收来自所有可见AP的信号,并将RSS值与对应的RP坐标存储至指纹数据库,建立原始指纹数据库;
Step2:对定位区域进行聚类分块,将较大的定位区域分成若干个小的定位子区域,并分别建模,以达到降低计算复杂度、提高定位精度的目的;
Step3:每一个定位子区域,根据IGW信息增益权重准则,进行AP选择,去掉不利于定位的AP,获取更有利于定位精度和复杂度的AP集合;
Step4:根据KD-LDA算法,从AP集合对应的AP的RSS信号中提取最具判别能力的定位特征,建立实用的RM;
Step5:利用定位特征,采用支持向量回归(SVR)的方法进行位置解算。
进一步,所述step2中将较大的定位区域分成若干个小的定位子区域的方法为:
步骤一,k-means聚类在整个RM中选取k个指纹作为初始聚类中心;
步骤二,对于除k个聚类中心之外的其它所有接收信号强度均值,则根据它们与这些聚类中心的欧式距离,分别将它们分配给与其欧式距离最近的聚类;
步骤三,执行完所有的指纹后,获得新的聚类,将新聚类的所有指纹的平均值作为新的聚类中心;
步骤四,不断重复步骤二和三,直到k个聚类中心不再发生变化,终止迭代。
进一步,所述step3中,信息增益权重准则为:
假设D表示数据集合,F表示特征集合:F={f1,f2,…,f|F|},C表示类别集:C={c1,c2,…,c|C|},同时假设C(ck,fi)为ck的训练例中包含的特征fi数量,|ck|为ck的训练例个数,为ck的训练例中不包含fi的训练例个数,C(D,fi)为集合D中包含fi的总个数,为D中不包含fi的个数,则定义fi对D的信息增益G(D,fi)为:
G ( D , f i ) = E ( D ) - Σ v ∈ { 0,1 } ( D v / D ) E ( D v )
其中,i=1,2,…,|F|;E(D)为D的熵;E(Dv)为Dv的熵,则信息增益计算公式可表达为:
G ( D , f i ) = - Σ c k ∈ C p ( c k ) log 2 p ( c k ) + p ( f i ‾ ) Σ c k ∈ C p ( c k / f i ‾ ) log 2 p ( c k / f i ‾ ) + p ( f i ) Σ c k ∈ C p ( c k / f i ) log 2 p ( c k / f i )
G(D,fi)的物理含义是用fi分割集合D导致期望熵降低的程度,此值越大,表明fi对分类越有用,E(D0)反映的是D0在各类别中分布的混乱程度,其最小值为0,当且仅当满足下列条件的特征分布有利于提高分类器在ck上的查准率,条件为:
p ( c k / f i ‾ ) = 1 , C ( c k / f i ‾ ) = C ( D , f i ‾ ) 0 , C ( c k / f i ‾ ) ≠ C ( D , f i ‾ )
E(D1)反映的是D1在各类别中分布的混乱程度,其最小值为0,当且仅当满足下列条件的特征分布有利于提高分类器在ck上的查全率,条件为:
p ( c k / f i ) = 1 , C ( c k / f i ) = C ( D , f i ) 0 , C ( c k / f i ) ≠ C ( D , f i )
为了平衡|D0|和|D1|对于IG值的影响,修正的信息增益为:
G ( D , f i ) = - Σ c k ∈ C p ( c k ) log 2 p ( c k ) + αp ( f i ‾ ) Σ c k ∈ C p ( c k / f i ‾ ) log 2 p ( c k / f i ‾ ) + βp ( f i ) Σ c k ∈ C p ( c k / f i ) log 2 p ( c k / f i )
式中,α+β=1,α与β值的大小分别与查准率和查全率成正比,权重系数α取值在0.2~0.3之间,而β取在0.7~0.8之间。
本发明的有益效果是可以去掉冗余的AP,优化用于定位的AP子集合,提高室内定位的解算效率和定位精度。
附图说明
图1是本发明SVR定位流程图;
图2是本发明用于检验AP选择算法的实验参考点与测试点部署示意图;
图3是本发明不同AP选择算法的定位精度在2米以内的概率累积分布与AP数量的变化关系图;
图4是本发明最优AP集合情况下各种算法的定位精度概率分布图;
图5是本发明最优AP集合情况下各种算法的定位精度累积概率分布图;
图6是本发明最优AP集合情况下各种算法的最大、最小和平均定位误差比较图;
图7是本发明最优AP集合情况下每种算法的定位误差标准方差比较图。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
信息增益(Information Gain,IG)是机器学习领域广泛采用的一种方法,它通过某一维特征对正确分类数据提供的有用信息量多少进行特征选择,信息量越多,贡献就越大,该特征就越有用。对于一个系统而言,该特征的存在与否信息量是不同的,两种情况的信息量之差就是这个特征给系统带来的信息量,有时也把信息量称为熵。
本发明接入点选择算法步骤:
Step1:采集数据来自各个AP的RSS信号。根据聚类算法确定目标定位区域,部署参考点RP(reference point)数量和位置(本实验是在定位的室内区域按照间隔1米的距离部署参考点),在每一个RP位置接收来自所有可见AP的信号,此信号也是可以接收到的信号,并将RSS(Received Signal Strength,RSS)值与对应的RP坐标存储至指纹数据库,建立原始指纹数据库RM(Radio Map,RM),用与于进行位置解算。
Step2:聚类分块,建立子RM。采用k-means算法进行聚类:
聚类的目的在于:对于较大定位目标区域,接收信号强度(RSS)的统计特性变化大,对于基于学习型定位算法来说,若对整个定位区域进行学习,将增加算法复杂度,建立的定位模型不是最优的,从而不利于提高系统的定位精度。因此需要对定位区域进行聚类分块,将较大的定位区域分成若干个小的定位子区域,并分别建模,以达到降低计算复杂度、提高定位精度的目的。
具体步骤为:
步骤一,k-means聚类在整个RM中选取k个指纹作为初始聚类中心;
步骤二,对于除k个聚类中心之外的其它所有接收信号强度均值,则根据它们与这些聚类中心的欧式距离,分别将它们分配给与其欧式距离最近的聚类;
步骤三,执行完所有的指纹后,获得新的聚类,将新聚类的所有指纹的平均值作为新的聚类中心;
步骤四,不断重复步骤二和三,直到k个聚类中心不再发生变化,终止迭代。
聚类结束,每个位置指纹都被收敛至与之最近的聚类中心,就将每个聚类视为一个定位子区域;离线阶段,每个聚类和对应的位置指纹数据构成一个独立的子指纹数据库;在线定位阶段,新测得的接收信号强度首先通过计算与聚类中心的欧式距离,得到最近聚类中心,然后由这个聚类中心对应的定位函数得出用户的定位子区域。
Step3:在Step2的每一个定位子区域,根据IGW信息增益权重准则(Information Gain Weight,IGW),进行AP选择。去掉不利于定位的AP,获取更有利于定位精度和复杂度的AP集合,即最优的AP结合。
信息增益权重准则:
假设D表示数据集合,F表示特征集合:F={f1,f2,…,f|F|},C表示类别集:C={c1,c2,…,c|C|}。同时假设C(ck,fi)为ck的训练例中包含的特征fi数量,|ck|为ck的训练例个数,为ck的训练例中不包含fi的训练例个数,C(D,fi)为集合D中包含fi的总个数,为D中不包含fi的个数。则定义fi对D的信息增益G(D,fi)为:
G ( D , f i ) = E ( D ) - Σ v ∈ { 0,1 } ( D v / D ) E ( D v )
其中,i=1,2,…,|F|;E(D)为D的熵;E(Dv)为Dv的熵。则信息增益计算公式可表达为:
G ( D , f i ) = - Σ c k ∈ C p ( c k ) log 2 p ( c k ) + p ( f i ‾ ) Σ c k ∈ C p ( c k / f i ‾ ) log 2 p ( c k / f i ‾ ) + p ( f i ) Σ c k ∈ C p ( c k / f i ) log 2 p ( c k / f i )
G(D,fi)的物理含义是用fi分割集合D导致期望熵降低的程度。此值越大,表明fi对分类越有用,则fi要被当作特征值选出来。因此,我们希望G(D,fi)值越大越好。也就是说应让E(D)取较大值,(|D0|/|D|)E(D0)和(|D1|/|D|)E(D1)取较小的值。
E(D0)反映的是D0在各类别中分布的混乱程度。其最小值为0。当且仅当满足下列条件的特征分布有利于提高分类器在ck上的查准率。条件为:
p ( c k / f i ‾ ) = 1 , C ( c k / f i ‾ ) = C ( D , f i ‾ ) 0 , C ( c k / f i ‾ ) ≠ C ( D , f i ‾ )
E(D1)反映的是D1在各类别中分布的混乱程度。其最小值为0。当且仅当满足下列条件的特征分布有利于提高分类器在ck上的查全率。条件为:
p ( c k / f i ) = 1 , C ( c k / f i ) = C ( D , f i ) 0 , C ( c k / f i ) ≠ C ( D , f i )
由于|D0|通常比|D1|要大得多,因此,G(D,fi)过分强调了E(D0)的作用。在分类类别比较相近的情况下,E(D0)会使在其他类别中经常出现而在某一个类别中出现次数不多的特征被选出来,而不倾向于选取在其他类别中出现较少而在某一个类别中出现较多的特征,这明显不是算法期望的结果。为了平衡|D0|和|D1|对于IG值的影响,修正的信息增益为:
G ( D , f i ) = - Σ c k ∈ C p ( c k ) log 2 p ( c k ) + αp ( f i ‾ ) Σ c k ∈ C p ( c k / f i ‾ ) log 2 p ( c k / f i ‾ ) + βp ( f i ) Σ c k ∈ C p ( c k / f i ) log 2 p ( c k / f i )
式中,α+β=1。α与β值的大小分别与查准率和查全率成正比。在发明中我们将权重系数α取值在0.2~0.3之间,而β取在0.7~0.8之间。
即在聚类结束后,在每一个定位子区域,利用信息增益准则进行AP选择。选出最优的AP集合用于定位。
Step4:根据KD-LDA(Kernel Direct Linear Discriminant Analysis,KD-LDA)算法,从第step3中获得的最优的AP集合对应的AP的RSS信号中提取最具判别能力的定位特征,建立实用的RM(也就是去掉了很多不需要的冗余AP后的指纹数据库),具体算法为:
设d维RSS样本空间(这是采样到的信号)r={r1,…,rn},r∈Rd。Rd为d个AP组成的RSS样本空间。将r映射至高维非线性空间:r∈Rd→Φ(r)∈F,F为特征空间。利用Fisher判别准则来寻找最具判别能力的特征值表达式:
W opt = arg max | W T S B W | | W T S W W | = [ w 1 , w 2 , . . . w n ] - - - ( 1 )
式中,SB为样本类间离散度矩阵:
S B = 1 C Σ i = 1 C ( M i - M ) ( M i - M ) T - - - ( 2 )
SW为样本类内离散度矩阵:
S W = 1 L Σ i = 1 C Σ t = 1 n ( Φ ( r i ( t ) ) - M i ) ( Φ ( r i ( t ) ) - M i ) T - - - ( 3 )
其中,表示在第i个参考点Li上对应Ci类的均值;表示在第i个参考点Li上对应所有类别的中心;ri(t)表示第i个参考点Li上第t个RSS向量样本;n表示第i个参考点Li上RSS向量样本数量;C表示整个定位目标区域中总的参考点数目(总类别数);L=n*C表示RSS样本总数。
求解(1)式的最优解,也就是提取RSS中最具有判别能力的定位特征值。通过求解SB的非零空间和SW的零空间交集实现。可将公式(2)变形为:
S B = Σ i = 1 C ( 1 C ( M i - M ) ) ( 1 C ( M i - M ) ) T = Σ i = 1 C M i , ( M i , ) T = M b M b T - - - ( 4 )
其中,Mb=[M’1,…,M’C]。因为核特征空间F的维数通常非常大,甚至无穷大,因此直接求解SB的特征值非常不现实。但是借助公式(4),我们可以将空间维数降为C×C,通过求解的特征向量来求解SB的前m(m≤C-1)个最具判别能力的特征向量。
Step5:在step4的基础上,利用定位特征进行位置解算;
本发明采用支持向量回归(SVR)的方法进行位置解算,具体步骤描述为:
1:通过KD-LDA算法提取出针对实时接收信号RSS的训练样本。假设在第i个参考点Li上接收到第t个RSS向量样本ri(t),则经过KD-LDA特征变换以后为Ki(t),SVR就是要对(Ki(t),(Lix,Liy))样本进行学习,得出位置解算函数,给出物理坐标(Lix,Liy)。假设用户终端实时接收到的AP个数为D个,则测试样本指纹为(K1(t),…,KD(t)),训练样本集合为{Fi=(Ki1(t),…,KiD(t))|1≤i≤k},每个特征库样本的坐标为(Lix,Liy)。
2:针对提取出的训练样本集合,采用交叉验证训练参数,获得SVR模型的优化参数;所谓的交叉验证就是令聚类中心数从1取到8,然后根据来自AP的RSS信号强度值选择AP数量,当聚类和AP集合匹配出最高的2米内的定位精度时,即为最佳的聚类中心数和AP集合。
3:根据得到的优化训练参数,针对提取出的训练样本集合,训练SVR定位模型;
4:将待定位目标接收RSS信号送入SVR定位模型,得到定位结果。
SVR定位流程图,如图1所示。
以上所述仅是对本发明的较佳实施方式而已,并非对本发明作任何形式上的限制,凡是依据本发明的技术实质对以上实施方式所做的任何简单修改,等同变化与修饰,均属于本发明技术方案的范围内。
下面列举具体实施例对本发明进行说明:
实施例1:实验环境,在一间大小约90平方米(长10米,宽9米)的计算机房,实验室内共有24台电脑(在测试的时候均处于关机状态),在门后有一小的实验员更衣室,无其他障碍物。实验室可感测到46个AP,在此房间均匀地设置了90个参考点RP,35个随机测试点TP,如图1所示,图中黑色十字交叉点为RPs,黑色方块为TPs。在每个RP上采集信号样本大概40个,每个测试点接收实时样本大概5~20个。RP上的数据是坚持在一周的5个工作日时间,每天的上午9点到11点进行,然后选取5组数据中每个RP上最接近的3组数据的平均值作为参考点的RSS参考值。测试点上只是采集一次数据作为测试数据,为了模拟实际应用情况,测试点样本与训练样本的采集时间段相同,但测试数据是分散在不同工作日采集的。为了获得各个方向上的信号,数据在采集的时候接收器均在RP或TP处匀速旋转一周。实验参考点和测试点部署示意图如图2所示。
图3对比了不同AP选择算法的定位精度在2米以内的概率累积分布与所用AP数量的变化关系。从图3我们可以得出这样几点结论:首先,理论上是在定位解算时,AP数量越多越有利于定位精度的提高,但这种情况随着室内环境大量AP的部署,已经发生了变化,当AP达到一定数量时,系统的定位性能不会无限制的提高,相反,由于一些携带较大噪声信息的AP介入,可能会给系统的定位性能带来不利影响。如本实验所示,当AP的个数超过25个以后,增加的AP并未给系统带来定位精度的改善,因此,进行AP选择是必要的。其次,当AP数量不足够多的时候,系统的定位精度的确是随着AP数量的增加而递增的。并且各种AP选择算法在对定位精度的贡献能力上并无太大差异。换句话说就是,如AP数量不多、并且对定位精度要求不是非常高的情况下,可以不必考虑AP选择,否则可能反而增加了系统的计算量。第三,从曲线变化可以看出,无论哪种AP选择算法在定位性能上都要优于Random算法,即使是在AP数量较少时(尽管没有太大优势),这也说明了AP选择的必要性。尤其是当前的情况,任何一个公共热点,我们能搜索到的AP数量少则几十个,多则上百个。第四,本实验中,对于每种算法2米以内定位精度累积概率达到最高时的AP数量大致都在20~25个之间,也就是说我们可以去掉约十几个冗余的AP,达到降维、提高算法效率的目的。
接下来我们选取使图3中每种算法的2米以内定位精度概率达到最大值时的AP值,也就是在每种算法最优AP组合情况下,分别比较了不同算法定位精度分布概率,如图4所示;定位精度的累积概率分布,如图5所示;定位误差的最大、最小和平均值,如图6所示;以及定位误差的标准方差,如图7所示。从图4可以看出,IGW-AP选择算法定位精度在1米以内的概率为34.3%,而IG、MM和Random算法则分别为25.7%、20%和14.3%,这说明本文提出的算法实现高精度定位(亚米级)的准确率更高。
图5可以看出,IGW-AP选择算法在1米、2米和3米内的定位精度置信概率分别为34.3%、71.4%和88.6%,均高出其它算法。分别高出IG算法33.5%、8.6%和10.6%;高出MM算法71.5%、4.1%和19.2%,这说明该算法比其它算法更有利于实现小误差定位(误差在3米以内)。IGW在小误差定位(误差在3米以内)置信概率方面比Random算法高出的更多,这也再一次说明了AP选择的必要性。另外,IGW算法的最大定位误差在5米以内,并且有88.6%的概率是在3米以内,而其它几种算法定位误差最高达8米多,因此本算法较其它几种算法具有更小的定位误差范围,更高的定位准确度。
图6比较了在最优AP集合情况下,各种算法的最大、最小和平均定位误差,从图上可以很清楚的看出,IGW算法无论是最大、最小定位误差都低于其它几种算法,并且定位误差范围也远远小于其它算法。实际上本实验中基于IGW的AP选择的定位技术的误差范围为0.18~4.58米,而Random、MM和IG分别为1.04~8.5米、1.04~7.32米和0.82~7.96米。平均定位误差,IGW算法为1.77米,较IG、MM和Random算法分别下降了23.7%、33%和43.8%。图4至图6充分说明,无论在定位精度、定位误差范围还是小误差定位的置信概率方面,IGW算法相对于本文用于比较的其它几种基本流行算法来说都是最好的。另外图7比较了几种AP选择算法的定位误差标准差。我们都知道标准差是用来反映一个数据集的离散程度,其值越大,说明数据越分散;具有相同平均数的数据集未必有相同的标准差;平均值小的方差未必小,但两者都小的数据一般可以认为分布较集中。从图上可以看出IGW算法的定位误差的标准差具有最小值,又因为其平均值也最小,因此说该算法对于每个测试点上的定位误差集合是集中的,这与本算法具有较小的定位误差范围是一致的。

Claims (3)

1.一种用于无线室内定位的接入点选择算法,其特征在于按照以下步骤进行:
Step1:采集各AP的RSS信号,根据聚类算法确定目标定位区域,部署参考点RP,在每一个RP位置接收来自所有可见AP的信号,并将RSS值与对应的RP坐标存储至指纹数据库,建立原始指纹数据库;
Step2:对定位区域进行聚类分块,将较大的定位区域分成若干个小的定位子区域,并分别建模,以达到降低计算复杂度、提高定位精度的目的;
Step3:每一个定位子区域,根据IGW信息增益权重准则,进行AP选择,去掉不利于定位的AP,获取更有利于定位精度和复杂度的AP集合;
Step4:根据KD-LDA算法,从AP集合对应的AP的RSS信号中提取最具判别能力的定位特征,建立实用的RM;
Step5:利用定位特征,采用支持向量回归(SVR)的方法进行位置解算。
2.按照权利要求1所述一种用于无线室内定位的接入点选择算法,其特征在于:所述step2中将较大的定位区域分成若干个小的定位子区域的方法为:
步骤一,k-means聚类在整个RM中选取k个指纹作为初始聚类中心;
步骤二,对于除k个聚类中心之外的其它所有接收信号强度均值,则根据它们与这些聚类中心的欧式距离,分别将它们分配给与其欧式距离最近的聚类;
步骤三,执行完所有的指纹后,获得新的聚类,将新聚类的所有指纹的平均值作为新的聚类中心;
步骤四,不断重复步骤二和三,直到k个聚类中心不再发生变化,终止迭代。
3.按照权利要求1所述一种用于无线室内定位的接入点选择算法,其特征在于:所述step3中,信息增益权重准则为:
假设D表示数据集合,F表示特征集合:F={f1,f2,…,f|F|},C表示类别集:C={c1,c2,…,c|C|},同时假设C(ck,fi)为ck的训练例中包含的特征fi数量,|ck|为ck的训练例个数,为ck的训练例中不包含fi的训练例个数,C(D,fi)为集合D中包含fi的总个数,为D中不包含fi的个数,则定义fi对D的信息增益G(D,fi)为:
G ( D , f i ) = E ( D ) - Σ v ∈ { 0,1 } ( D v / D ) E ( D v )
其中,i=1,2,…,|F|;E(D)为D的熵;E(Dv)为Dv的熵,则信息增益计算公式可表达为:
G ( D , f i ) = - Σ c k ∈ C p ( c k ) log 2 p ( c k ) + p ( f i ‾ ) Σ c k ∈ C p ( c k / f i ‾ ) log 2 p ( c k / f i ‾ ) + p ( f i ) Σ c k ∈ C p ( c k / f i ) log 2 p ( c k / f i )
G(D,fi)的物理含义是用fi分割集合D导致期望熵降低的程度,此值越大,表明fi对分类越有用,E(D0)反映的是D0在各类别中分布的混乱程度,其最小值为0,当且仅当满足下列条件的特征分布有利于提高分类器在ck上的查准率,条件为:
p ( c k / f i ‾ ) = 1 , C ( c k / f i ‾ ) = C ( D , f i ‾ ) 0 , C ( c k / f i ‾ ) ≠ C ( D , f i ‾ )
E(D1)反映的是D1在各类别中分布的混乱程度,其最小值为0,当且仅当满足下列条件的特征分布有利于提高分类器在ck上的查全率,条件为:
p ( c k / f i ) = 1 , C ( c k / f i ) = C ( D , f i ) 0 , C ( c k / f i ) ≠ C ( D , f i )
为了平衡|D0|和|D1|对于IG值的影响,修正的信息增益为:
G ( D , f i ) = - Σ c k ∈ C p ( c k ) log 2 p ( c k ) + αp ( f i ‾ ) Σ c k ∈ C p ( c k / f i ‾ ) log 2 p ( c k / f i ‾ ) + βp ( f i ) Σ c k ∈ C p ( c k / f i ) log 2 p ( c k / f i )
式中,α+β=1,α与β值的大小分别与查准率和查全率成正比,权重系数α取值在0.2~0.3之间,而β取在0.7~0.8之间。
CN201410319663.XA 2014-07-07 2014-07-07 一种用于无线室内定位的接入点选择算法 Pending CN104093203A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410319663.XA CN104093203A (zh) 2014-07-07 2014-07-07 一种用于无线室内定位的接入点选择算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410319663.XA CN104093203A (zh) 2014-07-07 2014-07-07 一种用于无线室内定位的接入点选择算法

Publications (1)

Publication Number Publication Date
CN104093203A true CN104093203A (zh) 2014-10-08

Family

ID=51640870

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410319663.XA Pending CN104093203A (zh) 2014-07-07 2014-07-07 一种用于无线室内定位的接入点选择算法

Country Status (1)

Country Link
CN (1) CN104093203A (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016141527A1 (en) * 2015-03-09 2016-09-15 Hewlett-Packard Development Company, L.P. Predicting available access points
WO2016192081A1 (en) * 2015-06-04 2016-12-08 Hewlett-Packard Development Company, L.P. Enable access point availability prediction
CN106643736A (zh) * 2017-01-06 2017-05-10 中国人民解放军信息工程大学 一种室内定位方法及系统
CN106772235A (zh) * 2017-02-17 2017-05-31 电子科技大学 基于rssi衰减特性和相似性的室内定位方法
CN106851553A (zh) * 2016-09-30 2017-06-13 广州丰石科技有限公司 根据软采信令的自适应指纹定位方法
CN107064866A (zh) * 2017-04-05 2017-08-18 河南师范大学 一种基于iBeacon室内定位的动态指纹库的生成方法
CN107071743A (zh) * 2017-03-20 2017-08-18 华南理工大学 一种基于随机森林的快速KNN室内WiFi定位方法
CN107666707A (zh) * 2017-09-30 2018-02-06 长沙学院 一种基于距离测量和位置指纹的室内定位方法
CN108377546A (zh) * 2016-11-21 2018-08-07 中兴通讯股份有限公司 一种室内定位方法及装置、服务器、用户设备
CN108627798A (zh) * 2018-04-04 2018-10-09 北京工业大学 基于线性判别分析和梯度提升树的wlan室内定位算法
CN108717175A (zh) * 2018-04-18 2018-10-30 同济大学 基于区域划分和稀疏支持向量回归的室内指纹定位方法
CN108989986A (zh) * 2018-09-06 2018-12-11 西安电子科技大学 基于迭代分割空间法的Wi-Fi室内定位方法
CN109963261A (zh) * 2019-03-15 2019-07-02 北京航空航天大学 Wifi室内定位的无线路由器筛选方法及装置
CN110726968A (zh) * 2019-09-08 2020-01-24 天津大学 一种基于聚类指纹法的可见光传感的被动式室内定位方法
CN111263295A (zh) * 2020-01-15 2020-06-09 广东工业大学 一种wlan室内定位方法和装置
CN111757249A (zh) * 2020-05-21 2020-10-09 重庆邮电大学 一种基于信息增益比的多特征模糊映射接入点优化方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
李文斌: "基于特征信息增益权重的文本分类算法", 《北京工业大学学报》 *
邓志安: "《中国博士学位论文全文数据库》", 15 April 2014 *

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10820294B2 (en) 2015-03-09 2020-10-27 Hewlett Packard Enterprise Development Lp Predicting available access points
WO2016141527A1 (en) * 2015-03-09 2016-09-15 Hewlett-Packard Development Company, L.P. Predicting available access points
US10271218B2 (en) 2015-06-04 2019-04-23 Hewlett Packard Enterprise Development Lp Enable access point availability prediction
WO2016192081A1 (en) * 2015-06-04 2016-12-08 Hewlett-Packard Development Company, L.P. Enable access point availability prediction
CN106851553A (zh) * 2016-09-30 2017-06-13 广州丰石科技有限公司 根据软采信令的自适应指纹定位方法
CN108377546A (zh) * 2016-11-21 2018-08-07 中兴通讯股份有限公司 一种室内定位方法及装置、服务器、用户设备
CN106643736A (zh) * 2017-01-06 2017-05-10 中国人民解放军信息工程大学 一种室内定位方法及系统
CN106643736B (zh) * 2017-01-06 2020-05-22 中国人民解放军信息工程大学 一种室内定位方法及系统
CN106772235A (zh) * 2017-02-17 2017-05-31 电子科技大学 基于rssi衰减特性和相似性的室内定位方法
CN106772235B (zh) * 2017-02-17 2020-10-23 电子科技大学 基于rssi衰减特性和相似性的室内定位方法
CN107071743A (zh) * 2017-03-20 2017-08-18 华南理工大学 一种基于随机森林的快速KNN室内WiFi定位方法
CN107071743B (zh) * 2017-03-20 2020-06-19 华南理工大学 一种基于随机森林的快速KNN室内WiFi定位方法
CN107064866A (zh) * 2017-04-05 2017-08-18 河南师范大学 一种基于iBeacon室内定位的动态指纹库的生成方法
CN107666707B (zh) * 2017-09-30 2020-01-10 长沙学院 一种基于距离测量和位置指纹的室内定位方法
CN107666707A (zh) * 2017-09-30 2018-02-06 长沙学院 一种基于距离测量和位置指纹的室内定位方法
CN108627798B (zh) * 2018-04-04 2022-03-11 北京工业大学 基于线性判别分析和梯度提升树的wlan室内定位算法
CN108627798A (zh) * 2018-04-04 2018-10-09 北京工业大学 基于线性判别分析和梯度提升树的wlan室内定位算法
CN108717175B (zh) * 2018-04-18 2020-10-02 同济大学 基于区域划分和稀疏支持向量回归的室内指纹定位方法
CN108717175A (zh) * 2018-04-18 2018-10-30 同济大学 基于区域划分和稀疏支持向量回归的室内指纹定位方法
CN108989986B (zh) * 2018-09-06 2020-09-04 西安电子科技大学 基于迭代分割空间法的Wi-Fi室内定位方法
CN108989986A (zh) * 2018-09-06 2018-12-11 西安电子科技大学 基于迭代分割空间法的Wi-Fi室内定位方法
CN109963261A (zh) * 2019-03-15 2019-07-02 北京航空航天大学 Wifi室内定位的无线路由器筛选方法及装置
CN110726968A (zh) * 2019-09-08 2020-01-24 天津大学 一种基于聚类指纹法的可见光传感的被动式室内定位方法
CN111263295A (zh) * 2020-01-15 2020-06-09 广东工业大学 一种wlan室内定位方法和装置
CN111757249A (zh) * 2020-05-21 2020-10-09 重庆邮电大学 一种基于信息增益比的多特征模糊映射接入点优化方法

Similar Documents

Publication Publication Date Title
CN104093203A (zh) 一种用于无线室内定位的接入点选择算法
WO2022110557A1 (zh) 一种台区户变关系异常诊断方法及装置
CN111199016B (zh) 一种基于DTW的改进K-means的日负荷曲线聚类方法
CN103648106B (zh) 一种基于类别匹配的半监督流形学习的WiFi室内定位方法
US9842159B2 (en) Data analysis apparatus and method
CN103916820B (zh) 基于接入点稳定度的无线室内定位方法
CN110381440A (zh) 基于深度学习的联合rss与csi的指纹室内定位方法
CN106093852A (zh) 一种提高WiFi指纹定位精度与效率的方法
CN104462184A (zh) 一种基于双向抽样组合的大规模数据异常识别方法
CN102930533A (zh) 一种基于改进k-均值聚类的半监督高光谱影像降维方法
CN104540221A (zh) 基于半监督sde算法的wlan室内定位方法
CN106102163A (zh) 基于rss线性相关与二次加权质心算法的wlan指纹定位方法
CN106412841A (zh) 一种基于dbscan算法的室内定位方法
CN105574642A (zh) 一种基于智能电网大数据的电价执行稽查方法
CN105872972A (zh) 基于多目标优化的自适应ap选取方法
CN106067034A (zh) 一种基于高维矩阵特征根的配电网负荷曲线聚类方法
CN102945517A (zh) 一种基于聚类分析的服装标准工时的数据挖掘方法
CN105574265B (zh) 面向模型检索的装配体模型定量描述方法
CN107979817A (zh) 一种移动终端二维指纹定位方法
CN106686720A (zh) 一种基于时间维度的无线指纹定位方法及其系统
Guo et al. Harris hawks optimization algorithm based on elite fractional mutation for data clustering
CN106022578A (zh) 基于数据高维化和K-means聚类的居民用电峰谷平时段划分方法
CN103440292B (zh) 基于比特向量的多媒体信息检索方法和系统
Wang et al. Group pattern mining on moving objects’ uncertain trajectories
Wang et al. A bluetooth location method based on kNN algorithm

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20141008