CN110366244A - 一种WiFi指纹室内定位方法 - Google Patents
一种WiFi指纹室内定位方法 Download PDFInfo
- Publication number
- CN110366244A CN110366244A CN201910715768.XA CN201910715768A CN110366244A CN 110366244 A CN110366244 A CN 110366244A CN 201910715768 A CN201910715768 A CN 201910715768A CN 110366244 A CN110366244 A CN 110366244A
- Authority
- CN
- China
- Prior art keywords
- mac
- rss
- training
- wifi
- clustering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 97
- 238000012549 training Methods 0.000 claims abstract description 147
- 239000013598 vector Substances 0.000 claims abstract description 64
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 55
- 230000006870 function Effects 0.000 claims description 54
- 238000005070 sampling Methods 0.000 claims description 29
- 238000004364 calculation method Methods 0.000 claims description 21
- 230000014509 gene expression Effects 0.000 claims description 12
- 238000005259 measurement Methods 0.000 claims description 11
- 238000010606 normalization Methods 0.000 claims description 9
- 238000013479 data entry Methods 0.000 claims description 7
- 230000001172 regenerating effect Effects 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 3
- 241000287196 Asthenes Species 0.000 claims description 2
- 238000013480 data collection Methods 0.000 claims description 2
- 230000017105 transposition Effects 0.000 claims 1
- 238000003064 k means clustering Methods 0.000 abstract description 12
- 238000005516 engineering process Methods 0.000 abstract description 6
- 230000007547 defect Effects 0.000 description 7
- 238000007476 Maximum Likelihood Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S5/00—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
- G01S5/02—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using radio waves
- G01S5/0257—Hybrid positioning
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S5/00—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
- G01S5/02—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using radio waves
- G01S5/0278—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using radio waves involving statistical or probabilistic considerations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B17/00—Monitoring; Testing
- H04B17/30—Monitoring; Testing of propagation channels
- H04B17/309—Measuring or estimating channel quality parameters
- H04B17/318—Received signal strength
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W64/00—Locating users or terminals or network equipment for network management purposes, e.g. mobility management
- H04W64/006—Locating users or terminals or network equipment for network management purposes, e.g. mobility management with additional information processing, e.g. for direction or speed determination
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Remote Sensing (AREA)
- Bioinformatics & Computational Biology (AREA)
- Signal Processing (AREA)
- Probability & Statistics with Applications (AREA)
- General Engineering & Computer Science (AREA)
- Radar, Positioning & Navigation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Electromagnetism (AREA)
- Quality & Reliability (AREA)
- Mobile Radio Communication Systems (AREA)
- Position Fixing By Use Of Radio Waves (AREA)
Abstract
本发明涉及一种WiFi指纹室内定位方法,属于室内指纹定位技术领域,是一种基于聚类算法和最小二乘支持向量回归机的WiFi指纹室内定位方法。包括步骤离线数据采集;分区域,即按训练子集训练最小二乘支持向量回归机模型;和进行在线位置解算。本发明解决了k‑means聚类算法中无法合理确定k值的问题;克服了k‑means聚类算法中无法确定合理的初始值以缩短算法执行时间的缺点、常见聚类算法未能选择更合理的聚类标准的缺点;解决了常见的定位算法在线位置解算阶段未能合理选择子区域、未能合理解算位置的问题;且定位精确度较高。
Description
技术领域
本发明涉及一种WiFi指纹室内定位方法,属于室内指纹定位技术领域,是一种基于聚类算法和最小二乘支持向量回归机的WiFi指纹室内定位方法。
背景技术
随着无线通信的发展,无线定位技术已经受到人们的普遍关注,室外环境中,GPS等定位导航技术定位效果近乎完美,然而,占据人们80%生活时间的室内环境中,多数室内环境却接收不到GPS信号,因此导致GPS等定位导航技术无法发挥作用,因而,研究开发人员常用基于无线传感网络、WiFi、红外线、超声波、超宽带等技术的定位方法解决室内定位这一难题,其中,WiFi网络在当今社会得到了普遍应用,具有无需增加任何额外成本的天然优势,因此,目前成为众多室内定位导航技术中的首选。WiFi定位技术主要有三边定位法、到达时间定位法、极大似然估计定位法、位置指纹定位法等,其中,位置指纹定位法具备无需知道WiFi网络中AP(AccessPoint,接入点)的位置、发射功率即可实现定位的独特优点,因而成为目前WiFi定位的主流技术。
位置指纹定位法利用RSS(Received Signal Strength,接收信号强度)和物理位置关联性进行定位,其过程分为离线数据采集、训练模型和在线位置解算三个阶段,每种具体的定位方法包含的阶段各有不同,各阶段详细过程和已有方法存在的缺点如下:
1)离线数据采集阶段
离线数据采集主要是在待定位区域范围内按一定的距离间隔部署若干个参考点,在每个参考点处采集所有可见AP的信号强度、MAC地址(该地址用于区别不同的WiFi)以及参考点的物理位置等信息作为一条完整的记录,将所有参考点信息的记录组成位置指纹数据库。
2)训练模型阶段
训练模型主要是将位置指纹数据库中的数据作为训练集,对支持向量回归机、人工神经网络等学习型算法进行训练,从而建立模型。其中,为了在建立模型以及后续使用学习型算法进行在线位置解算过程中提高速度、降低终端的能耗,需根据最小化类间相似性、最大化类内相似性标准合理划分数据集合,形成定位子区域,这一过程称为聚类,k-means聚类算法是模式识别领域普遍采用的一种动态的聚类方法,该算法需提前确定聚类中心的个数(即定位子区域的个数)k,如k值设置过小,则定位子区域就会相对过大,类内相似度不大,不能很好起到缩小定位指纹空间、简化建立模型过程以及减小计算复杂度的作用,反之,如k值设置过大,则定位子区域就会相对过小,类间相似度过大,会降低聚类精度,不利于位置解算。然而,k-means聚类算法却未能确定k值,这是有待解决的问题。此外,如何合理选择聚类算法度量标准、如何选择初始值以缩短算法执行时间也是未能解决的问题。
在使用支持向量回归机算法建立模型的过程中,常用的算法是把整个位置指纹数据库内的数据直接用来训练支持向量回归机模型,然而,随着训练的数据量的增大,建模过程的复杂度急剧增大,并且容易产生训练过度及模型准确度下降弊端,因此,在聚类算法的基础上,针对每个定位子区域,分别用子区域内的位置指纹数据建立支持向量回归机模型,可明显减小模型复杂度、提高模型准确度,然而,如何合理选择核函数、以何种标准合理评判各子区域内的支持向量回归机模型却有待解决。此外,支持向量回归机或分类机中常用的核函数未能优化模型也是没有解决的问题。
3)在线位置解算阶段
在应用WiFi指纹室内定位方法进行定位时,需实地采集所有可见AP的信号强度、MAC地址信息带入最近邻法、朴素贝叶斯法、最大似然概率法、核函数法等无需训练的算法进行计算,或带入人工神经网络、支持向量回归机等第二阶段训练好的模型计算,然而,由于前述的聚类过程是人为过程,本阶段中以何种标准合理选择子区域、如何合理构成最终定位坐标是在线位置解算阶段未能解决的问题。
发明内容
本发明的目的是针对上述未能解决的问题提供一种WiFi指纹室内定位方法,是一种使用固定超球体积确定聚类中心个数、使用接收信号强度的欧式距离和坐标距离作为度量的聚类算法、分区域训练最小二乘支持向量回归机模型、使用一种新型的核函数、使用目标与聚类中心信号强度欧式距离和模型训练标准差加权定位的WIFI指纹室内定位方法,解决了现有的常见算法未能解决的如下几个问题:1、k-means聚类算法中无法确定k值;2、k-means聚类算法中无法确定合理的初始值以缩短算法执行时间;3、常见的聚类算法未能选择合理的聚类标准;4、常见的定位算法在线位置解算阶段未能合理选择子区域、未能合理解算位置坐标;5、常见的核函数未能优化模型。
本发明是采取以下技术方案实现的。
一种WiFi指纹室内定位方法,包括如下步骤:
1)离线数据采集;
1-1)在参考点处进行数据采集;
1-1-1)在整个待定位区域范围内用接收机检测所有可见AP(访问节点),记共检测到totalmac个AP(totalmac是自然数);所述接收机为手机、掌上电脑等。
1-1-2)设置参考点并记录接收到的所有可见AP的信号强度和MAC地址;记共设置了RefNum个参考点,RefNum是自然数;所述MAC地址用于区别不同的WiFi,与WiFi网络的BSSID相同,BSSID的中文含义是基本服务集标识;
1-1-3)计算参考点处接收到的来自同一AP的信号强度的平均值;同一AP即MAC地址相同的AP;
1-2)生成位置指纹记录;
具体是,记录每个参考点的位置指纹记录,总共记录RefNum个参考点的位置指纹记录;
2)分区域,即按训练子集训练最小二乘支持向量回归机模型;
2-1)数据预处理以及生成训练集;
2-1-1)计算RSS平均值和统计方差;
具体是,当所述步骤(1-2)中的RefNum个参考点的采样数据全部记录完后,需依次计算来自不同AP的WiFi信号的RSS均值、统计方差,该过程共需统计所述步骤(1-1-1)检测到的totalmac个AP的WiFi信号的RSS均值、统计方差;不同AP即MAC地址不同;
2-1-2)数据的去除;
具体是,当来自某AP的WiFi信号的RSS统计方差较小时,认为不足以满足定位对数据差异性的要求,去除所有来自该AP的WiFi信号强度数据;
2-1-3)数据的归一化;
具体是,将不同参考点处获得的来自不同AP(以MAC区别)的WiFi信号的RSS依次归一化,该过程共需统计RefNum个参考点,每个参考点计算来自totalmac个AP的RSS归一化值;
2-1-4)数据聚类;
2-1-4-1)使用固定超球体积确定聚类中心个数k,k为自然数;
具体是,将上述步骤(2-1-3)生成的不同参考点处获得的来自不同AP的WiFi信号的RSS归一化值组成总体训练集,遍历总体训练集中所有条目,计算所有条目之间最大欧氏距离,所有参考点都应包含在由该最大欧式距离确定的超球中,让聚类后形成的子区域对应的超球体积固定,用超球体积之比作为聚类中心的个数k,即定位子区域的个数;计算总体训练集中所有条目之间的最大k个欧氏距离,从这k个欧氏距离对应的2k个条目中随机选取k个条目,作为步骤(2-1-4-2)中聚类的k个初始聚类中心;
2-1-4-2)使用接收信号强度的欧式距离和坐标距离度量的聚类算法进行聚类;
2-1-5)重新生成训练子集;
具体是,所述步骤(2-1-4-2)进行完后,形成若干个聚类中心,将总体训练集中每个条目划分到一个聚类中心;
2-2)按训练子集(分区域)训练最小二乘支持向量回归机模型;
2-2-1)使用本发明的新型核函数K(x,x')训练子集训练x轴坐标的最小二乘支持向量回归机模型;
具体是,使用本发明的新型核函数K(x,x')训练子集训练x轴坐标的最小二乘支持向量回归机模型,确定各个训练子集x轴坐标的回归函数、统计方差和标准差;
2-2-2)使用本发明的新型核函数K(x,x')训练子集训练y轴坐标的最小二乘支持向量回归机模型;
具体是,使用本发明的新型核函数K(x,x')训练子集训练y轴坐标的最小二乘支持向量回归机模型,确定各个训练子集y轴坐标的回归函数、统计方差和标准差;
K(x,x')定义见下述公式(95)
其中,exp()是以e为底数的指数函数,ρ取值为正数,都是训练集中的数据,都是n维向量,xl、x′l分别是x、x′的第l维分量。
3)进行在线位置解算;
3-1)计算权重因子;
具体是,获得待定位点的位置指纹后,计算该位置指纹与所述步骤(2-1-4-2)中获得的k个聚类中心的WiFi信号强度的欧氏距离,然后计算k个聚类中心在最终定位结果中所占权重,选取其中最大的3个权重因子并记录这3个权重因子对应的3个训练子集。
3-2)进行位置坐标的计算;
具体是,将待定位点的位置指纹分别代入对应的3个训练子集的x轴坐标的最小二乘支持向量回归机的回归函数,计算对应的x轴坐标的输出值,再将所述步骤(3-1)中对应的权重因子作为权重,加权计算出本发明最终输出的x轴坐标。同理,将待定位点的位置指纹分别代入对应的3个训练子集的y轴坐标的最小二乘支持向量回归机的回归函数,计算对应的y轴坐标的输出值,再将所述步骤(3-1)中对应的权重因子作为权重,加权计算出本发明最终输出的y轴坐标。
本发明与现有的WiFi指纹室内定位方法相比,有如下优点:
1、本发明解决了k-means聚类算法中无法合理确定k值的问题;
2、本发明克服了k-means聚类算法中无法确定合理的初始值以缩短算法执行时间的缺点;
3、本发明克服了常见聚类算法未能选择更合理的聚类标准的缺点;
4、本发明解决了常见的定位算法在线位置解算阶段未能合理选择子区域、未能合理解算位置的问题;
5、本发明的定位方法定位精确度较高;适合推广。
附图说明
图1是本发明WiFi指纹室内定位示意图;
图中共含3个无线AP,分别是AP1、AP2、AP3,实线椭圆所示区域为待定位区域,实线多边形范围是某定位子区域(一个定位子区域对应一个聚类中心)。
具体实施方式
下面结合附图和实施例对本发明作进一步说明。
参照附图1,本发明一种WiFi指纹室内定位方法,使用固定超球体积确定聚类中心个数;使用接收信号强度的欧式距离和坐标距离作为聚类标准进行聚类;分区域训练最小二乘支持向量回归机模型;使用目标与聚类中心距离和均方根标准差加权定位。
一种WiFi指纹室内定位方法,包括如下步骤:
1)离线数据采集
1-1)在参考点处进行数据采集
步骤(1-1)所述数据采集的具体方法如下:
1-1-1)在整个待定位区域范围内用接收机(如手机等)检测所有可见AP,记录所有可见AP的MAC地址(MAC地址用于区别不同的WiFi,与WiFi网络的BSSID相同,BSSID的中文含义是基本服务集标识),记共检测到totalmac个,则MAC地址依次是MAC1,MAC2,…,MACtotalmac;
1-1-2)在待定位区域范围内横向(对应x轴)和纵向(对应y轴)分别每隔interval米(interval介于0.3到2之间,典型值是0.5)设置一个参考点记录参考点的物理位置,参考点的总个数记为RefNum个,在每个参考点处每隔Tsa秒采样一次(15≤Tsa≤25,Tsa的典型值是20),共采样SaNum次(SaNum是自然数,且10≤SaNum≤20,典型值是12),每次采样记录接收到的所有可见AP的信号强度、MAC地址,记第se次(se为自然数)采样只检测到了p个AP的无线信号,将这p个AP按编号从小到大按下列⑴式排列,并记录这p个AP的MAC地址依次是
其中,1≤N1<N2<N3<......Np≤totalmac;
将接收到的来自这些AP的WiFi信号强度记录为
其中,符号“[]”表示组成一次采样的结果,“:”表示对应关系,locNum是该参考点编号,从1开始,每个采样点的所有采样结束后该值增加1,xlocNum和ylocNum分别表示该采样点x轴和y轴方向上的物理坐标,其余表达式含义举例如下:表示第se次采样中,接收到的MAC地址是的AP的WiFi信号强度为 的范围是[-100,0]。对于MAC地址是的AP,如第se次采样中未接收到信号,则该参考点处对该AP的所有SaNum次采样的WiFi信号强度均记为-101;
1-1-3)根据信道衰落模型,RSS符合正态分布,将该采样点处SaNum次采样的平均值作为接收到的对应AP的WiFi信号强度,当所有SaNum次采样进行完后,该参考点接收到MAC地址是的AP的WiFi信号强度按下述公式⑶计算;
其中,表示RSS是与locNum和有关的量,显然,对于MAC地址是的AP,第se次采样中未接收到信号,则根据本步骤的前述记录方法,有
1-2)生成位置指纹记录;
具体方法如下:
生成的每一条位置指纹记录如下所示,
locNum是该参考点编号,从1开始,到RefNum,每个采样点所有采样结束后该值增加1,xlocNum和ylocNum分别表示该采样点x轴和y轴方向上的物理坐标,符号“[]”表示组成一条位置指纹记录,“:”表示对应关系,表示该采样点处接收到MAC地址是的AP的WiFi信号强度是其中按前述步骤(1-1)的方法计算。
2)分区域(按训练子集)训练最小二乘支持向量回归机模型;
2-1)数据预处理以及生成训练集;
2-1-1)计算RSS平均值和统计方差;
当所述步骤(1-2)中的RefNum个(位置指纹记录编号的总数)参考点的采样数据全部记录完后,需依次计算来自不同AP(以MAC区别)的WiFi信号的RSS均值、统计方差,该过程共需统计步骤(1-1)所述的totalmac个AP。
下面以计算MAC为的AP的WiFi信号强度均值和方差为例,说明计算RSS平均值和统计方差的具体方法,如下:
将接收到的来自MAC相同(此处记为)的AP的WiFi信号强度(即所述步骤(1-1)中的)中满足的条目按公式⑸组成一个新的集合
表示该集合与有关,记该集合中的元素个数为则按下述公式⑹计算集合中所有元素的平均值
其中表示对集合中所有元素求和,按下述公式⑺计算集合中所有元素的统计方差;
2-1-2)数据的去除;
步骤(2-1-2)数据的去除步骤,前提是当统计方差较小时(典型值是),认为集合中的元素的区别度很小,不足以满足定位对数据差异性的要求,去除所有来自MAC地址是的AP的WiFi信号强度数据。
2-1-3)数据的归一化;
将不同参考点处获得的来自不同AP的WiFi信号的RSS依次归一化,该过程共需统计RefNum个参考点,每个参考点计算来自totalmac个AP的RSS归一化值。
下面以归一化MAC为的AP的WiFi信号强度为例,说明数据归一化的方法:
记所述步骤(2-1-1)的集合中所有元素的最大值是最小值是对于不同的接收机,其增益不同,因此即使在固定的两个参考位置上,不同的接收机测量同一AP的接收信号强度也有固定差值,这种差异可通过测量值减去同一接收机在待定位区域内测得的某个值来消除。
本发明使用如下方法消除这种差异:用测量值减去在整个待测区域中的测量得到的最小值然后再进行归一化,具体按下述公式⑻计算归一化的RSS值
定义和记录方法见所述步骤(1-1),则最终得到的RSS归一化值满足
2-1-4)数据聚类;
2-1-4-1)使用固定超球体积确定聚类中心个数;
将上述步骤(2-1-3)生成的不同参考点处获得的来自不同AP的WiFi信号的RSS归一化值组成如下总体训练集TotalTraining;
其中,符号“{}”表示组成训练集,每个“[]”内的数据是一个归一化数据条目,且对应于一个参考点,locNum是该参考点编号,从1开始,依次加1,xlocNum和ylocNum分别表示该采样点x轴和y轴方向上的物理坐标,MACj:rss(locNum,MACj)表示在编号为locNum的参考点上计算的MAC地址是MACj的AP的WiFi信号强度归一化值是rss(locNum,MACj)(按前述步骤(2-1-3)计算),参考点的总个数为RefNum个,totalmac是在待定位区域内共检测到的可见AP数目。
欧氏距离可用来对聚类算法中“相近”程度进行度量。本发明中,按下述公式(11)计算总体训练集TotalTraining中第p个和第k个归一化数据条目之间的欧式距离
令p依次等于1,2,……,RefNum,从而遍历TotalTraining中所有条目,对于一个固定的p值,令k也依次等于1,2,……,RefNum,对于每一对p和k,都按上述公式(11)计算欧式距离,最后,取所有欧式距离中的最大值作为总体训练集TotalTraining中所有条目之间最大欧氏距离TotalTrainingMaxDist,记录所有欧式距离中较大的k(k的值按下述公式(15)计算)个距离对应的p值和q值,则一共有2k个数值,从中随机取k个,序号依次为V1,V2,...,Vk(1≤V1<V2...<Vk≤RefNum,且V1,V2,...,Vk都是自然数)。
聚类算法中聚类中心个数是一个未解决的问题,本发明采用如下的固定超球体积算法解决这一问题:总体训练集TotalTraining对应于totalmac维欧式空间中的RefNum个参考点,这些参考点都包含在以TotalTrainingMaxDist为直径的totalmac维超球totalhyper中,该超球totalhyper的体积Vtotalhyper按下述公式(12)计算
其中,n是自然数时,Γ(n+1)=n!(符号“!”表示阶乘运算),(符号“!!”表示双阶乘运算)。
同样,聚类后形成的某个子区域内的数据条目也对应于totalmac维欧式空间中该子区域包含的若干个参考点(具体的参考点数目由聚类算法确定),这些参考点都包含在按下述公式(13)计算的以DivDiameter为直径的totalmac维超球DivHyper中
其中,DivNum=2,3,……,10,典型值是2。
超球Divhyper的体积VDivhyper按下述公式(14)计算;
函数Γ(x)定义与上述公式(12)中的定义相同。
聚类中心的个数(即定位子区域的个数)k按下述公式(15)计算
2-1-4-2)使用接收信号强度的欧式距离和坐标距离度量的聚类算法进行聚类;
记第n次确定聚类中心过程中,使用的k个聚类中心分别为其中,rssClassCenteri n的组成如下:
rssClassCenter(n,i,MACj),AverageXLocation(n,i),以及AverageYLocation(n,i)分别表示在第n次确定聚类中心过程中,计算出的第i个聚类中心的MAC地址是MACj的AP的WiFi信号强度、x轴坐标和y轴坐标,这三个值需在下述过程中计算或者确定。
聚类算法步骤如下:
I)第1次聚类时,n=1,选取总体训练集TotalTraining中参考点编号为V1,V2,...,Vk(V1,V2,...,Vk按所述步骤(2-1-4-1)计算)的k个数据条目作为k个初始聚类中心举例如下:如总体训练集TotalTraining中编号为Vp的条目被随机选为第q个聚类中心(Vp,q均为自然数且都不大于RefNum,p不大于k),则下述(totalmac+2)个关系式成立
结合由所述步骤(2-1-4-1)中V1,V2,...,Vk的计算过程并参照附图1可知,这样选择初始聚类中心可保证初始聚类中心之间距离较大(例如将图1中接收机3、接收机10、接收机8等选为初始聚类中心),比现有的k-mean聚类算法随机选取聚类中心更优化,可缩短聚类算法的执行时间。
II)执行步骤III~步骤V,直到等于就结束聚类过程,此时得到的k个聚类中心rssClassCenter1,rssClassCenter2,...,rssClassCenterk。其中,rssClassCenteri(i=0,1,...,k)组成如下;
rssClassCenter(i,MACj),AverageXLocation(i),以及AverageYLocation(i)分别表示计算出的第i个聚类中心的MAC地址是MACj的AP的WiFi信号强度、x轴坐标和y轴坐标,可由公式组(91)完全确定
rssClassCenter(n+1,i,MACj),AverageXLocation(n+1,i)和AverageYLocation(n+1,i)分别表示在第n+1次确定聚类中心过程中,计算出的第i个聚类中心的MAC地址是MACj的AP的WiFi信号强度、x轴坐标和y轴坐标。
上述公式组(91)等价于公式(70),rssClassCenteri n+1的定义见公式(16)。
rssClassCenteri=rssClassCenteri n+1 (70)
III)训练集TotalTraining中每个条目是1个接收机的相关信息;附图1是含3个无线AP(AP1、AP2、AP3)的WiFi指纹室内定位示意图,实线椭圆所示区域为待定位区域,如该室内待定位区域无障碍物,信号不存在反射、绕射、散射等现象,则接收机1和接收机9在位置上关于AP1、AP2、AP3对称,因此接收机1和接收机9在上述步骤(2-1-4)所述的训练集TotalTraining中对应条目的接收信号强度信息应基本相同;同理,由于对称,接收机3和接收机10也相同,如仅用训练集TotalTraining中条目与聚类中心之间的归一化接收信号强度的欧氏距离作为聚类标准,则会导致将接收机1、2、3、9、10划分到如实线多边形所示的同一聚类中心(定位子区域),这明显很不合理,因为事实上,接收机9、10和接收机1、2、3的距离非常远。除上述对称因素导致物理位置距离很远的接收机RSS指纹非常相近外,室内AP数量较少且存在反射、绕射、散射等现象也经常会导致多个接收机(参考点)实际物理位置相距很远但RSS指纹却大致相同。因此,本发明中,对于训练集TotalTraining中的每个条目,依次计算该条目与所有k个聚类中心归一化接收信号强度的欧氏距离与坐标距离的乘积,将最小化该乘积作为聚类的标准。
对于训练集TotalTraining中第c个条目,依次计算该条目与所有k个聚类中心归一化接收信号强度的欧氏距离与坐标距离的乘积,举例如下:按下述公式(18)计算训练集TotalTraining中第c个条目与聚类中心归一化接收信号强度的欧氏距离与坐标距离的乘积Distcv
其中,“·”表示数值相乘运算,c,v均为自然数且都不大于RefNum。
在所有k个聚类中心归一化接收信号强度的欧氏距离与坐标距离的乘积中,取其中最小值对应的聚类中心作为该条目重新划分的聚类中心(含义是该条目应划分到该聚类中心)。
按本步骤的上述过程将训练集TotalTraining中所有条目重新划分聚类中心。
IV)重新计算当前聚类中心;
举例如下:假设进行完上述步骤III后,训练集TotalTraining中的第N1,N2,N3,...,Nw个条目(1≤N1<N2<N3...<Nw≤locNum且N1,N2,N3,...,Nw,w都是正整数)被划分到第r个聚类中心,则
V)用n+1替代n,转到步骤II。
2-1-5)重新生成训练子集;
当上述步骤(2-1-4-2)进行完后,形成了k个聚类中心,依次为rssClassCenter1,rssClassCenter2,...,rssClassCenterk,总体训练集TotalTraining中每个条目会被划分到一个聚类中心,以下将总体训练集TotalTraining按聚类中心重新生成训练子集。举例如下:将总体训练集TotalTraining中归属于第u个聚类中心的条目(记条目的参考点编号依次为共eu个)组成训练子集TrainingSub Setu;
其中,符号“{}”表示组成训练集,每个“[]”内的数据是一个归一化数据条目,且对应于一个参考点,Ma是该参考点编号,xa和ya分别表示该采样点x轴和y轴方向上的物理坐标,MACj:rss(Ma,MACj)(按所述步骤(2-1-3)计算)表示在编号为Ma的参考点上计算的MAC地址是MACj的AP的WiFi信号强度归一化值是rss(Ma,MACj),训练子集TrainingSubSetu条目的总个数为eu个。
2-2)按训练子集(分区域)训练最小二乘支持向量回归机模型;
位置坐标分x轴坐标和y轴坐标,而且在所述步骤(2-1)中划分了k个训练子集,因此本专利分别对训练子集TrainingSubSet1,TrainingSubSet2,……,TrainingSubSetk训练最小二乘支持向量回归机模型,下面分别以训练TrainingSubSetu这一子集x轴坐标和y轴坐标的最小二乘支持向量回归机模型为例说明。
2-2-1)使用训练子集训练x轴坐标的最小二乘支持向量回归机模型
用下述表达式(21)所示的训练子集训练最小二乘支持向量回归机模型
其中,符号“{}”表示组成训练集,一个“[]”内的所有数据是一个数据点,数据点举例说明如下:表示以totalmac维(列)向量(rss(Ma,MAC1),rss(Ma,MAC2),...,rss(Ma,MACtotalmac))T作为输入(T表示转置),对应的输出为(a是自然数且不大于eu),以下记
rss(Ma)=(rss(Ma,MAC1),rss(Ma,MAC2),...,rss(Ma,MACtotalmac))T (22)
将训练子集SubTraingClassificationu中的数据点带入如下最小二乘支持向量回归机模型,求得其解
其中,是对训练子集SubTraingClassificationu建立的最小二乘支持向量回归机模型中待确定的变量,αu代表它们的整体,rss()含义见公式(22),C是惩罚参数,典型值为0.06,δij的定义如下
K(rss(Mi),rss(Mj))是核函数,其原型是K(x,x'),通过构造不同的核函数,对比定位精度,确定了一种新型的核函数K(x,x'),其表达式见下述公式(95):
其中,exp()是以e为底数的指数函数,ρ取值为正数,都是训练集中的数据,都是n维向量,xl、x′l分别是x、x'的第l维分量。
本发明中,K(rss(Mi),rss(Mj))的具体形式如下,
rss(Mi,MACt)按前述步骤(2-1-3)计算,exp()是以e为底数的指数函数,σ的典型值为DivDiameter,DivDiameter按照上述公式(13)计算。上述模型(23)和(24)的含义是:变量在条件(24)的约束下,求模型(23)的最大值。
任意选取s(1≤s≤eu),用模型(23)和(24)的解按公式(27)计算
按公式(28)计算出x轴坐标的回归函数,
符号“·”表示数值相乘运算,是由表达式(20)定义的SubTraingClassificationu中的第Ms个数据点的输出,xu是回归函数输出的待定位点x轴坐标的值。
其中,rss(MACt)的计算方法如下:RSS(MACt)是在待定位点测得的MAC地址是MACt的WiFi信号强度平均值(15秒测量一次,测量10次后计算平均值,如某次测量检测不到该WiFi,则认为不可接收到MACt的信号),按公式(29)计算rss(MACt),
其中,MaxReceiveRSS(MACt)和MaxReceiveRSS(MACt)分别是所述步骤(2-1-1)定义的集合ReceivedRSSSet(MACt)中所有元素的最大值和最小值。(说明:步骤(2-1-1)定义的集合是但实际上MaxReceiveRSS(MACt)也可由此定义得到);
训练子集SubTraingClassificationu的x轴坐标的统计方差按公式(30)计算,
标准差按公式(31)计算,
2-2-2)使用训练子集训练y轴坐标的最小二乘支持向量回归机模型;
用下述表达式(32)所示的训练子集训练最小二乘支持向量回归机模型
其中,符号“{}”表示组成训练集,一个“[]”内的所有数据是一个数据点,数据点举例说明如下:表示以totalmac维(列)向量(rss(Ma,MAC1),rss(Ma,MAC2),...,rss(Ma,MACtotalmac))T作为输入(T表示转置),对应的输出为(a是自然数且不大于eu),以下记
rss(Ma)=(rss(Ma,MAC1),rss(Ma,MAC2),...,rss(Ma,MACtotalmac))T (33)
将训练子集SubTraingClassificationu'中的数据点带入如下最小二乘支持向量回归机模型,求得其解
其中,是对训练子集SubTraingClassificationu'建立的最小二乘支持向量回归机模型中待确定的变量,βu代表它们的整体,rss()、C、δij、K(rss(Mi),rss(Mj))的含义、形式和取值见步骤(2-2-1)。
上述模型(34)和(35)的含义是:变量在条件(35)的约束下,求模型(34)的最大值。
任意选取g(1≤g≤eu),用模型(34)和(35)的解按公式(36)计算
按公式(37)计算出y轴坐标的回归函数
符号“·”表示数值相乘运算,是由表达式(32)定义的SubTraingClassificationu'中的第Mg个数据点的输出,yu是回归函数输出的待定位点y轴坐标的值,rss(MACt)的计算方法见步骤(2-2-1)相同。
训练子集SubTraingClassificationu'的y轴坐标的统计方差按公式(38)计算
标准差按公式(39)计算
3)进行在线位置解算
3-1)权重因子的计算
实际应用WIFI指纹室内定位方法定位时,需按所述步骤(2-2-1)获取rss(MACt)的方法获得该待定位点的位置指纹rss(MAC1),rss(MAC2),...,rss(MACtotalmac),计算该位置指纹与所述步骤(2-1-4-2)中获得的k个聚类中心rssClassCenter1,rssClassCenter2,...,rssClassCenterk的WiFi信号强度的欧氏距离,下面以计算与第f个聚类中心rssClassCenterf的WiFi信号强度的欧氏距离为例说明
其中,rssClassCenter(f,MACr)表示计算出的第f个聚类中心的MAC地址是MACr的AP的WiFi信号强度(见所述步骤(2-1-4-2))。
然后计算k个聚类中心在最终定位结果中所占权重λ1,λ2,...,λk,下面以计算第v个聚类中心在最终定位结果中所占权重λv为例
其中,的计算方法见所述步骤(2-2-1)中公式(31),的计算方法见所述步骤(2-2-2)中公式(39)。
经实验验证,只需选取λ1,λ2,...,λk中最大的3个值即可获得准确的最终定位,记最大的3个权重因子由大到小依次为其中m1,m2,m3都是取值介于1到k的自然数,cof的取值决定distv和对权重λv的影响,cof越大,对λv影响越大,cof的取值应介于0.1到10之间,典型值为1。
3-2)进行位置坐标的计算
将该待定位点的位置指纹rss(MAC1),rss(MAC2),...,rss(MACtotalmac)分别代入第m1,m2,m3个训练子集的x轴坐标的最小二乘支持向量回归机的回归函数,计算出对应的x轴坐标的输出值(说明:计算回归函数时,分别用m1,m2,m3替代所述公式(28)中的u,即可得对应的回归函数)。
按公式(42)计算本发明的定位方法最终输出的x轴坐标xoutput
同理,将该待定位点的位置指纹rss(MAC1),rss(MAC2),...,rss(MACtotalmac)分别代入第m1,m2,m3个训练子集的y轴坐标的最小二乘支持向量回归机的回归函数,计算出对应的y轴坐标的输出值(说明:计算回归函数时,分别用m1,m2,m3替代所述公式(37)中的u,即可得对应的回归函数)。
按公式(43)计算本发明的定位方法最终输出的y轴坐标youtput
本发明与现有的WIFI指纹室内定位方法相比,有如下有益效果:
1、本发明解决了k-means聚类算法中无法合理确定k值的问题;
本发明计算总体训练集对应在欧式空间的超球体积,同时计算聚类后形成的每个子区域在欧式空间的超球的体积并令其取固定值,从而确定聚类中心个数,解决了聚类算法中无法确定k值的缺点。
2、本发明克服了k-means聚类算法中无法确定合理的初始值以缩短算法执行时间的缺点;
本发明方法步骤(2-1-4-1)中选择初始聚类中心可保证初始聚类中心之间距离较大,比现有的k-mean聚类算法随机选取聚类中心更优化,可缩短聚类算法的执行时间。
3、本发明克服了常见聚类算法未能选择更合理的聚类标准的缺点;
结合本发明所述步骤(2-1-4-2)可知,本发明采用归一化接收信号强度的欧氏距离与坐标距离的乘积作为聚类标准,比单一采用接收信号强度的欧氏距离作为聚类标准更合理。
4、本发明解决了常见的定位算法在线位置解算阶段未能合理选择子区域、未能合理解算位置的问题;
在线位置解算阶段,常见的定位算法计算待测点的WiFi指纹与聚类中心(即子区域)之间的信号强度的欧式距离,进而确定使用哪个子区域的模型进行解算,然而,用该子区域的模型计算训练子集自身的位置坐标时,如输出的坐标值与实际坐标值的标准差尚且很大,那么,是否能用子区域的模型进行解算,以及如何构成最终的位置坐标都需要重新合理确定,本发明所述的步骤(3)正是该问题的一个解决方案。
5、本发明的定位方法定位精确度较高;
实际使用中,线下(计算机)编程使用python语言,用numpy、tensorflow等包进行建模,使用UJIIndoorLoc-Mag数据集训练模型并进行在线位置解算,平均定位误差最小为0.53米、最大为3.10米,均值为1.96米;在其余条件都相同情况下,按k-means聚类算法随机给定k值进行实验,平均定位误差为3.17米;在其余条件都相同情况下,将单一采用接收信号强度的欧氏距离作为聚类标准,平均定位误差为3.82米;在其余条件都相同,在线位置解算阶段更换为下述的情况:仅用接收信号强度的欧氏距离最近作为标准,进而选取定位子区域并进行解算,平均定位误差为5.12米;在其余条件都相同情况下,核函数分别选取高斯径向基核、Sigmoid核函数,平均定位误差分别为3.47米、2.95米;在其余条件都相同情况下,本发明中的聚类算法与初始值按k-means聚类算法选取(进而进行聚类及在线位置解算)进行对比,本发明分区域训练最小二乘支持向量回归机模型的执行时间缩短了20.7%。可见,本发明的定位方法定位精确度和算法执行时间优于以上几种情况。
Claims (10)
1.一种WiFi指纹室内定位方法,其特征在于,包括如下步骤:
1)离线数据采集;
1-1)在参考点处进行数据采集;
1-1-1)在整个待定位区域范围内用接收机检测所有可见AP,记共检测到totalmac个AP;所述接收机为手机和掌上电脑;AP指访问节点,totalmac为自然数;
1-1-2)设置参考点并记录接收到的所有可见AP的信号强度和MAC地址;记共设置了RefNum个参考点,RefNum是自然数;所述MAC地址用于区别不同的WiFi,与WiFi网络的BSSID相同,BSSID的中文含义是基本服务集标识;
1-1-3)计算参考点处接收到的来自同一AP(MAC地址相同)的信号强度的平均值;
1-2)生成位置指纹记录;
具体是,记录每个参考点的位置指纹记录,总共记录RefNum个参考点的位置指纹记录;
2)分区域,即按训练子集训练最小二乘支持向量回归机模型;
2-1)数据预处理以及生成训练集;
2-1-1)计算RSS平均值和统计方差;
具体是,当所述步骤(1-2)中的RefNum个参考点的采样数据全部记录完后,需依次计算来自不同AP的WiFi信号的RSS均值、统计方差,该过程共需统计所述步骤(1-1-1)检测到的totalmac个AP的WiFi信号的RSS均值、统计方差;不同AP即MAC地址不同;
2-1-2)数据的去除;
具体是,当来自某AP的WiFi信号的RSS统计方差较小时,认为不足以满足定位对数据差异性的要求,去除所有来自该的WiFi信号强度数据;
较小的含义是RSS统计方差小于16;
2-1-3)数据的归一化;
具体是,将不同参考点处获得的来自不同AP的WiFi信号的RSS依次归一化,该过程共需统计RefNum个参考点,每个参考点计算来自totalmac个AP的RSS归一化值;
2-1-4)数据聚类;
2-1-4-1)使用固定超球体积确定聚类中心个数k,k为自然数;
具体是,将上述步骤(2-1-3)生成的不同参考点处获得的来自不同AP的WiFi信号的RSS归一化值组成总体训练集,遍历总体训练集中所有条目,计算所有条目之间最大欧氏距离,所有参考点都应包含在由该最大欧式距离确定的超球中,让聚类后形成的子区域对应的超球体积固定,用超球体积之比作为聚类中心的个数k,即定位子区域的个数;计算总体训练集中所有条目之间的最大k个欧氏距离,从这k个欧氏距离对应的2k个条目中随机选取k个条目,作为步骤(2-1-4-2)中聚类的k个初始聚类中心;
2-1-4-2)使用接收信号强度的欧式距离和坐标距离度量的聚类算法进行聚类;
2-1-5)重新生成训练子集;
具体是,所述步骤(2-1-4-2)进行完后,形成若干个聚类中心,将总体训练集中每个条目划分到一个聚类中心;
2-2)按训练子集(分区域)训练最小二乘支持向量回归机模型;
2-2-1)使用新型核函数K(x,x')训练子集训练x轴坐标的最小二乘支持向量回归机模型;
具体是,使用新型核函数K(x,x')训练子集训练x轴坐标的最小二乘支持向量回归机模型,确定各个训练子集x轴坐标的回归函数、统计方差和标准差;
2-2-2)使用新型核函数K(x,x')训练子集训练y轴坐标的最小二乘支持向量回归机模型;
具体是,使用本发明的新型核函数K(x,x')训练子集训练y轴坐标的最小二乘支持向量回归机模型,确定各个训练子集y轴坐标的回归函数、统计方差和标准差;
K(x,x')定义见下述公式(95),
其中,exp()是以e为底数的指数函数,ρ取值为正数,都是训练集中的数据,都是n维向量,xl、x'l分别是x、x'的第l维分量;
3)进行在线位置解算;
3-1)计算权重因子;
具体是,获得待定位点的位置指纹后,计算该位置指纹与所述步骤(2-1-4-2)中获得的k个聚类中心的WiFi信号强度的欧氏距离,然后计算k个聚类中心在最终定位结果中所占权重,选取其中最大的3个权重因子并记录这3个权重因子对应的3个训练子集;
3-2)进行位置坐标的计算;
具体是,将待定位点的位置指纹分别代入对应的3个训练子集的x轴坐标的最小二乘支持向量回归机的回归函数,计算对应的x轴坐标的输出值,再将所述步骤(3-1)中对应的权重因子作为权重,加权计算出本发明最终输出的x轴坐标;
同理,将待定位点的位置指纹分别代入对应的3个训练子集的y轴坐标的最小二乘支持向量回归机的回归函数,计算对应的y轴坐标的输出值,再将所述步骤(3-1)中对应的权重因子作为权重,加权计算出本发明最终输出的y轴坐标。
2.根据权利要求1所述的WiFi指纹室内定位方法,其特征在于,步骤(1)所述离线数据采集,具体方法如下:
1-1)在参考点处进行数据采集
1-1-1)在整个待定位区域范围内用接收机检测所有可见AP,记录所有可见AP的MAC地址,记共检测到totalmac个,则MAC地址依次是MAC1,MAC2,…,MACtotalmac;
1-1-2)在待定位区域范围内横向和纵向分别每隔interval米设置一个参考点记录参考点的物理位置;横向对应x轴,纵向对应y轴;interval的值介于0.3到2之间,典型值是0.5;参考点的总个数记为RefNum个,在每个参考点处每隔Tsa秒采样一次,共采样SaNum次;其中,15≤Tsa≤25,Tsa的典型值是20;10≤SaNum≤20,且SaNum是自然数,典型值是12;
每次采样记录接收到的所有可见AP的信号强度、MAC地址,记第se次采样只检测到了p个AP的无线信号,se为自然数;将这p个AP按编号从小到大按下列⑴式排列,并记录这p个AP的MAC地址依次是
其中1≤N1<N2<N3<......Np≤totalmac⑴;
将接收到的来自这些AP的WiFi信号强度记录为
其中,符号“[]”表示组成一次采样的结果,“:”表示对应关系,locNum是该参考点编号,从1开始,每个采样点的所有采样结束后该值增加1,xlocNum和ylocNum分别表示该采样点x轴和y轴方向上的物理坐标;
表示第se次采样中,接收到的MAC地址是的AP的WiFi信号强度为的范围是[-100,0];对于MAC地址是的AP,如第se次采样中未接收到信号,则该参考点处对该AP的所有SaNum次采样的WiFi信号强度均记为-101;
1-1-3)将该采样点处SaNum次采样的平均值作为接收到的对应AP的WiFi信号强度,当所有SaNum次采样进行完后,该参考点接收到MAC地址是的AP的WiFi信号强度按下述公式⑶计算;
其中,表示RSS是与locNum和有关的量,显然,对于MAC地址是的AP,第se次采样中未接收到信号,则根据本步骤的前述记录方法,有
1-2)生成位置指纹记录;
将生成的每一条位置指纹记录表示如下,
其中,locNum是该参考点编号,从1开始,到RefNum,每个采样点所有采样结束后该值增加1;xlocNum和ylocNum分别表示该采样点x轴和y轴方向上的物理坐标;符号“[]”表示组成一条位置指纹记录;“:”表示对应关系;表示该采样点处接收到MAC地址是的AP的WiFi信号强度是其中按所述步骤(1-1)的方法计算。
3.根据权利要求2所述的WiFi指纹室内定位方法,其特征在于,所述步骤(2-1-1)计算RSS平均值和统计方差的具体方法,包括如下步骤:
将接收到的来自MAC相同的AP的WiFi信号强度中满足的条目按公式⑸组成一个新的集合此处记为信号强度为所述步骤(1-1)中的
表示该集合与有关,记该集合中的元素个数为则按下述公式⑹计算集合中所有元素的平均值
其中表示对集合中所有元素求和,按下述公式⑺计算集合中所有元素的统计方差;
4.根据权利要求3所述的WiFi指纹室内定位方法,其特征在于,所述步骤(2-1-2)数据的去除,去除步骤的前提是当统计方差较小时,典型值是认为集合中的元素的区别度很小,不足以满足定位对数据差异性的要求,去除所有来自MAC地址是的AP的WiFi信号强度数据。
5.根据权利要求4所述的WiFi指纹室内定位方法,其特征在于,所述步骤(2-1-3)数据的归一化的方法,包括如下步骤,记所述步骤(2-1-1)的集合中所有元素的最大值是最小值是对于不同的接收机,其增益不同,因此即使在固定的两个参考位置上,不同的接收机测量同一AP的接收信号强度也有固定差值,则使用如下方法消除差异:用测量值减去在整个待测区域中的测量得到的最小值然后再进行归一化,具体按下述公式⑻计算归一化的RSS值
定义和记录方法见所述步骤(1-1),则最终得到的RSS归一化值满足
6.根据权利要求5所述的WiFi指纹室内定位方法,其特征在于,所述步骤(2-1-4)数据聚类,包括如下步骤:
2-1-4-1)使用固定超球体积确定聚类中心个数;
将上述步骤(2-1-3)生成的不同参考点处获得的来自不同AP的WiFi信号的RSS归一化值组成如下总体训练集TotalTraining;
其中,符号“{}”表示组成训练集,每个“[]”内的数据是一个归一化数据条目,且对应于一个参考点,locNum是该参考点编号,从1开始,依次加1,xlocNum和ylocNum分别表示该采样点x轴和y轴方向上的物理坐标,MACj:rss(locNum,MACj)按所述步骤(2-1-3)计算,表示在编号为locNum的参考点上计算的MAC地址是MACj的AP的WiFi信号强度归一化值是rss(locNum,MACj),参考点的总个数为RefNum个,totalmac是在待定位区域内共检测到的可见AP数目;
按下述公式(11)计算总体训练集TotalTraining中第p个和第k个归一化数据条目之间的欧式距离
令p依次等于1,2,……,RefNum,从而遍历TotalTraining中所有条目,对于一个固定的p值,令k也依次等于1,2,……,RefNum,对于每一对p和k,都按上述公式(11)计算欧式距离,最后,取所有欧式距离中的最大值作为总体训练集TotalTraining中所有条目之间最大欧氏距离TotalTrainingMaxDist,记录所有欧式距离中较大的k(k的值按下述公式(15)计算)个距离对应的p值和q值,则一共有2k个数值,从中随机取k个,序号依次为V1,V2,...,Vk,其中,1≤V1<V2...<Vk≤RefNum,且V1,V2,...,Vk都是自然数;
聚类中心的个数即定位子区域的个数k按下述公式(15)计算
k=DivNumtotalmac (15);
其中,DivNum=2,3,……,10,典型值是2,totalmac的定义见所述步骤(1-1-1);
2-1-4-2)使用接收信号强度的欧式距离和坐标距离度量的聚类算法进行聚类;
记第n次确定聚类中心过程中,使用的k个聚类中心分别为其中,rssClassCenteri n的组成如下:
rssClassCenter(n,i,MACj),AverageXLocation(n,i),以及AverageYLocation(n,i)分别表示在第n次确定聚类中心过程中,计算出的第i个聚类中心的MAC地址是MACj的AP的WiFi信号强度、x轴坐标和y轴坐标,这三个值需在下述过程中计算或者确定;
聚类算法步骤如下:
I)第1次聚类时,n=1,选取总体训练集TotalTraining中参考点编号为V1,V2,...,Vk(V1,V2,...,Vk按所述步骤(2-1-4-1)计算)的k个数据条目作为k个初始聚类中心
如总体训练集TotalTraining中编号为Vp的条目被随机选为第q个聚类中心其中Vp,q均为自然数且都不大于RefNum,p不大于k;则下述(totalmac+2)个关系式成立,
II)执行步骤III~步骤V,直到等于就结束聚类过程,此时得到的k个聚类中心
rssClassCenter1,rssClassCenter2,...,rssClassCenterk;
其中,rssClassCenteri(i=0,1,...,k)组成如下;
rssClassCenter(i,MACj),AverageXLocation(i),以及AverageYLocation(i)分别表示计算出的第i个聚类中心的MAC地址是MACj的AP的WiFi信号强度、x轴坐标和y轴坐标,可由公式组(91)完全确定
AverageXLocation(i)=AverageXLocation(n+1,i)
AverageYLocation(i)=AverageYLocation(n+1,i)
rssClassCenter(i,MAC1)=rssClassCenter(n+1,i,MAC1)
rssClassCenter(i,MAC2)=rssClassCenter(n+1,i,MAC2)
......,
rssClassCenter(i,MACj)=rssClassCenter(n+1,i,MACj)
......,
rssClassCenter(i,MACtotalmac)=rssClassCenter(n+1,i,MACtotalmac)(91)
rssClassCenter(n+1,i,MACj),AverageXLocation(n+1,i)和AverageYLocation(n+1,i)分别表示在第n+1次确定聚类中心过程中,计算出的第i个聚类中心的MAC地址是MACj的AP的WiFi信号强度、x轴坐标和y轴坐标;
上述公式组(91)等价于公式(70),rssClassCenteri n+1的定义见公式(16);
rssClassCenteri=rssClassCenteri n+1 (70)
对于训练集TotalTraining中第c个条目,按下述公式(18)依次计算该条目与所有k个聚类中心归一化接收信号强度的欧氏距离与坐标距离的乘积;
计算训练集TotalTraining中第c个条目与聚类中心归一化接收信号强度的欧氏距离与坐标距离的乘积Distcv公式如下,
其中,“·”表示数值相乘运算,c,v均为自然数且都不大于RefNum;
在所有k个聚类中心归一化接收信号强度的欧氏距离与坐标距离的乘积中,取其中最小值对应的聚类中心作为该条目重新划分的聚类中心;
按本步骤的上述过程将训练集TotalTraining中所有条目重新划分聚类中心;
IV)重新计算当前聚类中心;
;进行完上述步骤III后,训练集TotalTraining中的第N1,N2,N3,...,Nw个条目被划分到第r个聚类中心,其中1≤N1<N2<N3...<Nw≤locNum且N1,N2,N3,...,Nw,w都是正整数,则
V)用n+1替代n,转到步骤II。
7.根据权利要求6所述的WiFi指纹室内定位方法,其特征在于,所述步骤(2-1-5)重新生成训练子集,包括如下步骤:
当上述步骤(2-1-4-2)进行完后,形成了k个聚类中心,依次为rssClassCenter1,rssClassCenter2,...,rssClassCenterk,总体训练集TotalTraining中每个条目会被划分到一个聚类中心,以下将总体训练集TotalTraining按聚类中心重新生成训练子集。举例如下:将总体训练集TotalTraining中归属于第u个聚类中心的条目组成训练子集TrainingSub Setu;记条目的参考点编号依次为共eu个;
其中,符号“{}”表示组成训练集,每个“[]”内的数据是一个归一化数据条目,且对应于一个参考点,Ma是该参考点编号,xa和ya分别表示该采样点x轴和y轴方向上的物理坐标,MACj:rss(Ma,MACj)按所述步骤(2-1-3)计算,表示在编号为Ma的参考点上计算的MAC地址是MACj的AP的WiFi信号强度归一化值是rss(Ma,MACj),训练子集TrainingSubSetu条目的总个数为eu个。
8.根据权利要求7所述的WiFi指纹室内定位方法,其特征在于,所述步骤(2-2)按训练子集分区域训练最小二乘支持向量回归机模型,由于位置坐标分x轴坐标和y轴坐标,而且在所述步骤(2-1)中划分了k个训练子集,因此分别对训练子集
TrainingSubSet1,TrainingSubSet2,……,TrainingSubSetk训练最小二乘支持向量回归机模型;
训练TrainingSubSetu这一子集x轴坐标和y轴坐标的最小二乘支持向量回归机模型包括如下步骤:
2-2-1)使用训练子集训练x轴坐标的最小二乘支持向量回归机模型
用下述表达式(21)所示的训练子集训练最小二乘支持向量回归机模型;
其中,符号“{}”表示组成训练集,一个“[]”内的所有数据是一个数据点;
数据点
表示以totalmac维向量
(rss(Ma,MAC1),rss(Ma,MAC2),...,rss(Ma,MACtotalmac))T作为输入,又称totalmac列向量,T表示转置,其对应的输出为其中a是自然数且不大于eu,以下记
rss(Ma)=(rss(Ma,MAC1),rss(Ma,MAC2),...,rss(Ma,MACtotalmac))T(22)
将训练子集SubTraingClassificationu中的数据点带入如下最小二乘支持向量回归机模型,求得其解
其中,是对训练子集
SubTraingClassificationu建立的最小二乘支持向量回归机模型中待确定的变量,αu代表它们的整体,rss()含义见公式(22),C是惩罚参数,典型值为0.06,δij的定义如下,
K(rss(Mi),rss(Mj))是核函数,其原型是K(x,x'),通过构造不同的核函数,对比定位精度,确定了一种新型的核函数K(x,x'),其表达式见下述公式(95):
其中,exp()是以e为底数的指数函数,ρ取值为正数,都是训练集中的数据,都是n维向量,xl、x’l分别是x、x’的第l维分量;
K(rss(Mi),rss(Mj))的具体形式如下,
rss(Mi,MACt)按前述步骤(2-1-3)计算,exp()是以e为底数的指数函数,σ的典型值为DivDiameter,DivDiameter按照上述公式(13)计算;上述模型(23)和(24)的含义是:变量在条件(24)的约束下,求模型(23)的最大值;
任意选取s(1≤s≤eu),用模型(23)和(24)的解按公式(27)计算
按公式(28)计算出x轴坐标的回归函数,
符号“·”表示数值相乘运算,是由表达式(20)定义的SubTraingClassificationu中的第Ms个数据点的输出,xu是回归函数输出的待定位点x轴坐标的值;
其中,rss(MACt)的计算方法如下:RSS(MACt)是在待定位点测得的MAC地址是MACt的WiFi信号强度平均值(15秒测量一次,测量10次后计算平均值,如某次测量检测不到该WiFi,则认为不可接收到MACt的信号),按公式(29)计算rss(MACt)
其中,MaxReceiveRSS(MACt)和MaxReceiveRSS(MACt)分别是所述步骤(2-1-1)定义的集合ReceivedRSSSet(MACt)中所有元素的最大值和最小值;
训练子集SubTraingClassificationu的x轴坐标的统计方差按公式(30)计算,
标准差按公式(31)计算,
2-2-2)使用训练子集训练y轴坐标的最小二乘支持向量回归机模型;
用下述表达式(32)所示的训练子集训练最小二乘支持向量回归机模型,
其中,符号“{}”表示组成训练集,一个“[]”内的所有数据是一个数据点,数据点举例说明如下:
表示以totalmac维向量,又称totalmac列向量
(rss(Ma,MAC1),rss(Ma,MAC2),...,rss(Ma,MACtotalmac))T作为输入,T表示转置;对应的输出为其中a是自然数且不大于eu,以下记
rss(Ma)=(rss(Ma,MAC1),rss(Ma,MAC2),...,rss(Ma,MACtotalmac))T(33);
将训练子集SubTraingClassificationu'中的数据点带入如下最小二乘支持向量回归机模型,求得其解
其中,是对训练子集SubTraingClassificationu'建立的最小二乘支持向量回归机模型中待确定的变量,βu代表它们的整体,rss()、C、δij、K(rss(Mi),rss(Mj))的含义、形式和取值见步骤(2-2-1);
上述模型(34)和(35)的含义是,变量在条件(35)的约束下,求模型(34)的最大值;
任意选取g,其中1≤g≤eu,用模型(34)和(35)的解按公式(36)计算
按公式(37)计算出y轴坐标的回归函数
符号“·”表示数值相乘运算,是由表达式(32)定义的SubTraingClassificationu'中的第Mg个数据点的输出,yu是回归函数输出的待定位点y轴坐标的值,rss(MACt)的计算方法与步骤(2-2-1)相同;
训练子集SubTraingClassificationu'的y轴坐标的统计方差按公式(38)计算,
标准差按公式(39)计算,
9.根据权利要求8所述的WiFi指纹室内定位方法,其特征在于,所述步骤(3-1)权重因子的计算,包括如下步骤:
实际应用WIFI指纹室内定位方法定位时,需按所述步骤(2-2-1)获取rss(MACt)的方法获得该待定位点的位置指纹rss(MAC1),rss(MAC2),...,rss(MACtotalmac),计算该位置指纹与所述步骤(2-1-4-2)中获得的k个聚类中心,rssClassCenter1,rssClassCenter2,...,rssClassCenterk的WiFi信号强度的欧氏距离,下面以计算与第f个聚类中心,rssClassCenterf的WiFi信号强度的欧氏距离为例说明
其中,rssClassCenter(f,MACr)表示计算出的第f个聚类中心的MAC地址是MACr的AP的WiFi信号强度,计算方法参考所述步骤(2-1-4-2);
然后计算k个聚类中心在最终定位结果中所占权重λ1,λ2,...,λk,其中第v个聚类中心在最终定位结果中所占权重λv计算公式如下,
其中,的计算方法见所述步骤(2-2-1)中公式(31),的计算方法见所述步骤(2-2-2)中公式(39);
选取λ1,λ2,...,λk中最大的3个值即可获得准确的最终定位,记最大的3个权重因子由大到小依次为其中m1,m2,m3都是取值介于1到k的自然数,cof的取值决定distv和对权重λv的影响,cof越大,对λv影响越大,cof的取值应介于0.1到10之间,典型值为1。
10.根据权利要求9所述的WiFi指纹室内定位方法,其特征在于,所述步骤(3-2)进行位置坐标的计算,包括如下步骤:
将该待定位点的位置指纹
rss(MAC1),rss(MAC2),...,rss(MACtotalmac)分别代入第m1,m2,m3个训练子集的x轴坐标的最小二乘支持向量回归机的回归函数,计算出对应的x轴坐标的输出值计算回归函数时,分别用m1,m2,m3替代所述公式(28)中的u,即可得对应的回归函数;
按公式(42)计算本发明的定位方法最终输出的x轴坐标xoutput;
同理,将该待定位点的位置指纹,rss(MAC1),rss(MAC2),...,rss(MACtotalmac)分别代入第m1,m2,m3个训练子集的y轴坐标的最小二乘支持向量回归机的回归函数,计算出对应的y轴坐标的输出值计算回归函数时,分别用m1,m2,m3替代所述公式(37)中的u,即可得对应的回归函数;
按公式(43)计算本发明的定位方法最终输出的y轴坐标youtput;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910715768.XA CN110366244B (zh) | 2019-08-02 | 2019-08-02 | 一种WiFi指纹室内定位方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910715768.XA CN110366244B (zh) | 2019-08-02 | 2019-08-02 | 一种WiFi指纹室内定位方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110366244A true CN110366244A (zh) | 2019-10-22 |
CN110366244B CN110366244B (zh) | 2020-12-22 |
Family
ID=68223143
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910715768.XA Active CN110366244B (zh) | 2019-08-02 | 2019-08-02 | 一种WiFi指纹室内定位方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110366244B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110933631A (zh) * | 2019-12-03 | 2020-03-27 | 浙江科技学院 | 基于wifi位置指纹的室内定位方法 |
CN111866742A (zh) * | 2020-07-15 | 2020-10-30 | 南京信息工程大学 | 一种基于WiFi的室内被动式定位方法 |
CN112333625A (zh) * | 2019-11-05 | 2021-02-05 | 重庆邮电大学 | 一种基于Tensorflow的室内指纹定位方法 |
CN112946567A (zh) * | 2021-01-26 | 2021-06-11 | 西安电子科技大学 | 基于域对抗神经网络的运动目标指纹室内定位方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101631383A (zh) * | 2009-08-07 | 2010-01-20 | 广东省科学院自动化工程研制中心 | 一种基于支持向量回归机的时差定位方法 |
CN103237291A (zh) * | 2013-05-10 | 2013-08-07 | 阿坝师范高等专科学校 | 移动终端的整合定位方法和信息服务主动推荐方法 |
CN108717175A (zh) * | 2018-04-18 | 2018-10-30 | 同济大学 | 基于区域划分和稀疏支持向量回归的室内指纹定位方法 |
-
2019
- 2019-08-02 CN CN201910715768.XA patent/CN110366244B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101631383A (zh) * | 2009-08-07 | 2010-01-20 | 广东省科学院自动化工程研制中心 | 一种基于支持向量回归机的时差定位方法 |
CN103237291A (zh) * | 2013-05-10 | 2013-08-07 | 阿坝师范高等专科学校 | 移动终端的整合定位方法和信息服务主动推荐方法 |
CN108717175A (zh) * | 2018-04-18 | 2018-10-30 | 同济大学 | 基于区域划分和稀疏支持向量回归的室内指纹定位方法 |
Non-Patent Citations (1)
Title |
---|
RUI ZHOU, SHUAI LU, JIESONG CHEN AND ZHIQIANG LI: "An Optimized Space Partitioning Technique to Support Two-layer WiFi Fingerprinting", 《2017 IEEE WIRELESS COMMUNICATIONS AND NETWORKING CONFERENCE (WCNC)》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112333625A (zh) * | 2019-11-05 | 2021-02-05 | 重庆邮电大学 | 一种基于Tensorflow的室内指纹定位方法 |
CN110933631A (zh) * | 2019-12-03 | 2020-03-27 | 浙江科技学院 | 基于wifi位置指纹的室内定位方法 |
CN111866742A (zh) * | 2020-07-15 | 2020-10-30 | 南京信息工程大学 | 一种基于WiFi的室内被动式定位方法 |
CN112946567A (zh) * | 2021-01-26 | 2021-06-11 | 西安电子科技大学 | 基于域对抗神经网络的运动目标指纹室内定位方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110366244B (zh) | 2020-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110366244B (zh) | 一种WiFi指纹室内定位方法 | |
CN104185275B (zh) | 一种基于wlan的室内定位方法 | |
CN106851573B (zh) | 基于对数路径损耗模型的联合加权k近邻室内定位方法 | |
CN111161879B (zh) | 一种基于大数据的疾病预测系统 | |
CN106203521B (zh) | 基于差异图自步学习的sar图像变化检测方法 | |
CN101639527B (zh) | 基于rss-p的k近邻模糊聚类wlan室内定位方法 | |
CN108540929B (zh) | 基于rssi信号强度排序的室内指纹定位方法 | |
CN103889051B (zh) | 基于ap id过滤和卡尔曼滤波的室内wlan指纹定位方法 | |
CN112135248B (zh) | 一种基于K-means最优估计的WIFI指纹定位方法 | |
CN106131959A (zh) | 一种基于Wi‑Fi信号空间划分的两级定位方法 | |
CN114449452B (zh) | 一种基于CNN-RNN的Wi-Fi室内定位方法 | |
CN111586605B (zh) | 基于邻近加权自适应k值的KNN的室内目标定位方法 | |
CN110716792B (zh) | 一种目标检测器及其构建方法和应用 | |
CN106646339A (zh) | 一种无线位置指纹室内定位中在线匹配定位方法 | |
CN110636437B (zh) | 一种基于指纹对的辅助定位方法 | |
CN111726765A (zh) | 一种面向大规模复杂场景的wifi室内定位方法及系统 | |
CN107290714B (zh) | 一种基于多标识指纹定位的定位方法 | |
CN109003266A (zh) | 一种基于模糊聚类统计图像质量主观评价结果的方法 | |
CN110033012A (zh) | 一种基于通道特征加权卷积神经网络的生成式目标跟踪方法 | |
CN108562867B (zh) | 一种基于聚类的指纹定位方法及装置 | |
CN108877947A (zh) | 基于迭代均值聚类的深度样本学习方法 | |
CN113470085A (zh) | 一种基于改进的ransac的图像配准方法 | |
CN111669702A (zh) | 基于wifi地址与场强的粗精匹配定位方法 | |
CN108445443B (zh) | 一种基于knn的指纹点聚类方法 | |
CN114679683B (zh) | 一种基于派生指纹迁移的室内智能定位方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |