CN114679779B - 一种基于改进knn融合随机森林算法的wifi定位方法 - Google Patents
一种基于改进knn融合随机森林算法的wifi定位方法 Download PDFInfo
- Publication number
- CN114679779B CN114679779B CN202210286939.3A CN202210286939A CN114679779B CN 114679779 B CN114679779 B CN 114679779B CN 202210286939 A CN202210286939 A CN 202210286939A CN 114679779 B CN114679779 B CN 114679779B
- Authority
- CN
- China
- Prior art keywords
- knn
- algorithm
- model
- data
- positioning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 37
- 238000007637 random forest analysis Methods 0.000 title claims abstract description 22
- 230000004927 fusion Effects 0.000 title claims abstract description 10
- 238000000034 method Methods 0.000 title claims description 14
- 230000008859 change Effects 0.000 claims abstract description 4
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000007635 classification algorithm Methods 0.000 claims description 7
- 238000003066 decision tree Methods 0.000 claims description 7
- 238000012360 testing method Methods 0.000 claims description 6
- 239000013598 vector Substances 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 3
- 238000010801 machine learning Methods 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 238000012549 training Methods 0.000 claims description 3
- 230000000739 chaotic effect Effects 0.000 claims 1
- 238000007781 pre-processing Methods 0.000 claims 1
- 238000012847 principal component analysis method Methods 0.000 claims 1
- 238000005516 engineering process Methods 0.000 abstract description 10
- 230000008901 benefit Effects 0.000 abstract description 3
- 238000005070 sampling Methods 0.000 abstract description 3
- 238000005562 fading Methods 0.000 abstract 1
- 230000008054 signal transmission Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- NGHVIOIJCVXTGV-ALEPSDHESA-N 6-aminopenicillanic acid Chemical compound [O-]C(=O)[C@H]1C(C)(C)S[C@@H]2[C@H]([NH3+])C(=O)N21 NGHVIOIJCVXTGV-ALEPSDHESA-N 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W64/00—Locating users or terminals or network equipment for network management purposes, e.g. mobility management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/023—Services making use of location information using mutual or relative location information between multiple location based services [LBS] targets or of distance thresholds
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Position Fixing By Use Of Radio Waves (AREA)
Abstract
在室内环境下的定位一直存在很多问题未被解决。由于信号的严重衰减和多径效应,通用的室外定位系统(如GPS)并不能在室内环境下有效的工作,同时定位的准确性也是存在的一个问题。在室内场景下,人们更希望得到精确的位置信息,由于室内环境复杂楼层位置的变化导致的定位效果差以及定位服务不精准的问题尤为突出,显然GPS定位系统不能满足室内环境精准定位的需求。凭借着当今网络的广泛使用,以及无线网络的大量普及和自身成本低等优势,基于WIFI信号的定位技术已经成为了室内定位技术的首选。本发明通过采样各个无线AP(接入点)在室内不同位置RSS(信号强度)的数据信息,将室内划分为多个小网格作为对应各个位置中的RSS标签,而各个RSS数据信息作为标签对应的属性值,二者组合成一个数据集。通过多个点的采样,经过改进的KNN(K最近邻)算法联合随机森林算法的融合模型,在获取新的RSS数据时,通过混合模型获取当前位置的标签信息(网格位置),达到定位效果。
Description
技术领域:
本发明涉及通信,信号与信息处理和基于位置的服务技术领域,具体涉及一种基于改进KNN融合随机森林算法的WIFI定位方法。
背景技术:
在我们日常生活中,大多数常用的定位应用都是基于全球定位系统(GPS)获取的位置信息,但是由于室内环境的复杂性以及位置信号差等原因,GPS的定位服务在室内表现的并不是很理想。
目前主流的室内定位技术方案有:超宽带(UWB)定位技术,射频识别(RFID)定位技术,蓝牙定位技术,超声波定位技术等等。这些都可以实现室内定位。然而,移动电话信号并不是在所有的室内场景下都可以稳定的传播,使用射频识别需要花费额外的硬件安装费用,超声波的商用设备在市场上少之又少,因此这些定位技术在实际应用中并不常见。而WIFI覆盖区域广泛,因此WIFI定位技术通常作为室内定位技术的首选。通常,一个WIFI系统由一些固定的接入点(AP)组成,他们可以部署在室内一些便于安装的位置,能连接WIFI的设备相互之间可以直接或间接的通过AP通信,因此可以考虑在通信功能外实现定位功能。
当前,绝大多数基于WIFI的定位系统都利用信号强度(RSS),其方法主要分为两类:三角形算法和位置指纹识别算法。其中三角形算法利用待测目标到至少三个已知参考点之间的距离信息估计目标位置,而位置指纹识别算法则通过比较定位所需的信号特征指纹信息获取目标位置。
基于三角型算法的WIFI定位很大程度上依赖于确知的AP位置信息及准确的信号传输损耗模型,由于影响信号传输的因素很多,不同环境下的信号传输损耗模型大不相同,建立一个准确的,适合实际应用的损耗模型存在着很大的困难。
本发明从应对强干扰的前提出发,设计了融合改进KNN和随机森林算法得到的模型,二者分别从高维和低维两个角度分析利用数据,增加了模型的抗干扰能力。
发明内容:
本发明在满足实际需求的前提下,有效的提高了该模型在实现WIFI定位的准确度,具有推广应用价值。
本发明实现上述要求采取的技术方案是:
一种基于改进KNN融合随机森林算法的WIFI定位方法,该方法包括以下步骤:
步骤1:采集WIFI信号组合,构建数据集。
步骤2:对数据进行预处理,使用主成分分析法进行特征提取。特征提取是机器学习中常用的数据处理方式,一般出现在实际搭建模型之前,以达到特征空间维度的变化。
步骤3:搭建并训练模型,设置权重。
步骤4:改进KNN模型,传统的KNN模型是将所有维度用于计算距离,然而当某一维度有较大差异时会影响整体的判断,为了解决这一问题构造了基于降维的KNN,以三维样本数据(X1,X2,X3)为例:
使用改进KNN计算公式为:
式中:X′1,X′2,X′3为测试数据,d为样本数据与测试数据之间的距离。
对于N维特征向量而言,同时对N-1维特征向量进行隶属度计算,由于单个误差数据会影响N-1个计算指标,因此该示例模型要求有两个相似权重即视为一类。
步骤5:融合随机森林算法。改进KNN算法增加了计算成本,其输入样本量应该尽可能的小,为了防止样本量较小导致的模型欠拟合问题,采用改进KNN与随机森林融合的模型。随机森林是一种通过多棵决策树进行优化决策的算法。对于特征选取,使用基尼指数增益值ΔGini(A)作为决策树选择特征的依据,其公式为:
ΔGini(A)=Gini(D)-GiniA(D)
式中:选取属性为A,k表示数据集D被分为k个Dj数据集。
步骤6:实际数据输入混合分类算法模型得到整合后结果。
本发明的有益效果是:本发明提供了一种基于混合分类算法模型的WIFI定位方法,本发明在传统KNN模型上做了改进,解决了当某一维度有较大差异时会影响整体的判断这一问题,同时导致计算成本的增加,以及小样本数据会导致欠拟合的问题,因此在此基础上联合了随机森林算法。从实验结果表明:本发明提出的融合模型比传统的KNN和随机森林算法的模型在准确度上分别提高了15.7%和9.6%,其准确率达到了98.3%。
附图说明:
图1为混合分类算法模型的构建及工作过程;
图2为改进KNN在四个维度下的相似度;
图3为随机森林的树状结构;
图4为实验场地区域划分示意图;
具体实施方式:
具体实施方式一:本实施方式所述的基于混合分类算法的WIFI定位方法,该方法具体包括以下步骤:
步骤1:采集WIFI信号组合,构建数据集。
步骤2:对数据进行预处理,使用主成分分析法进行特征提取。特征提取是机器学习中常用的数据处理方式,一般出现在实际搭建模型之前,以达到特征空间维度的变化。
步骤3:搭建并训练模型,设置权重。
步骤4:改进KNN模型,传统的KNN模型是将所有维度用于计算距离,然而当某一维度有较大差异时会影响整体的判断,为了解决这一问题构造了基于降维的KNN,以三维样本数据(X1,X2,X3)为例:
使用改进KNN计算公式为:
式中:X′1,X′2,X′3为测试数据,d为样本数据与测试数据之间的距离。
对于N维特征向量而言,同时对N-1维特征向量进行隶属度计算,由于单个误差数据会影响N-1个计算指标,因此该示例模型要求有两个相似权重即视为一类。
步骤5:融合随机森林算法。改进KNN算法增加了计算成本,其输入样本量应该尽可能的小,为了防止样本量较小导致的模型欠拟合问题,采用改进KNN与随机森林联合的模型。随机森林是一种通过多棵决策树进行优化决策的算法。对于特征选取,使用基尼指数增益值ΔGini(A)作为决策树选择特征的依据,其公式为:
ΔGini(A)=Gini(D)-GiniA(D)
式中:选取属性为A,k表示数据集D被分为k个Dj数据集。
步骤6:实际数据输入混合分类算法模型得到整合后结果。
具体实施二:本实施方式与具体实施方式一不同的是:所述步骤1的具体过程为:
所述改进KNN算法中使用四维样本数据(X1,X2,X3,X4):
具体实施方式三:本实施方式与具体实施方式二不同的是:在室内划分若干个网格,每个网格单元的面积是1m*1m,室内部署6个AP,方位尚不明确;在每一个网格单元中密集采样,保证数据充足,这样做的优点是:提高混合分类算法模型的预测精度。
本发明与传统的KNN算法和随机森林算法在准确率上对比如图4所示,准确率相比传统CNN算法提高了15.7%,相比随机森林算法提高了9.6%。在定位精度上提升显著,定位误差可以保持在1m以内。表明本发明在室内环境中进行WIFI定位的有效性以及可实现性。
本发明的实施方式并不受上述实施实例的限制,其他的任何未违背本发明精神实质与原理下所作的改变,修饰,替代,组合,简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (4)
1.一种基于改进KNN融合随机森林算法的WIFI定位方法,其特征在于,该方法具体包括如下步骤:
步骤1:采集WIFI信号组合,构建数据集;
步骤2:对数据进行预处理,使用主成分分析法进行特征提取;特征提取是机器学习中常用的数据处理方式,一般出现在实际搭建模型之前,以达到特征空间维度的变化;
步骤3:搭建并训练模型,设置权重;
步骤4:改进KNN模型,传统的KNN模型是将所有维度用于计算距离,然而当某一维度有较大差异时会影响整体的判断,为了解决这一问题构造了基于降维的KNN,以三维样本数据(X1,X2,X3)为例:
使用改进KNN计算公式为:
式中:X′1,X′2,X′3为测试数据,d为样本数据与测试数据之间的距离;
对于N维特征向量而言,同时对N-1维特征向量进行隶属度计算,由于单个误差数据会影响N-1个计算指标,因此该模型要求有两个相似权重即视为一类;
步骤5:融合随机森林算法;改进KNN算法增加了计算成本,其输入样本量应该尽可能的小,为了防止样本量较小导致的模型欠拟合问题,采用改进KNN与随机森林算法联合的模型;随机森林是一种通过多棵决策树进行优化决策的算法;对于特征选取,使用基尼指数增益值ΔGini(A)作为决策树选择特征的依据,其公式为:
ΔGini(A)=Gini(D)-GiniA(D)
式中:选取属性为A,k表示数据集D被分为k个Dj数据集;
步骤6:实际数据输入混合分类算法模型得到整合后结果。
2.如权利要求1所述的一种改进KNN融合随机森林算法的WIFI定位方法,其特征在于,所述改进KNN算法解决了传统KNN算法在某个维度有较大差异时影响整体判断。
3.如权利要求1所述的一种改进KNN融合随机森林算法的WIFI定位方法,其特征在于,由于改进KNN算法增加了计算成本,为了防止样本量较小导致的欠拟合问题,采用了联合随机森林算法得到的一种融合模型。
4.如权利要求1所述的一种改进KNN融合随机森林算法的WIFI定位方法,其特征在于,所述决策树选择特征的依据为基尼指数的增益值ΔGini(A);在当集合越是混乱的时候,基尼指数对这种趋势的表现不够充分,相比之下基尼指数的增益值更能区分出混乱和更混乱。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210286939.3A CN114679779B (zh) | 2022-03-22 | 2022-03-22 | 一种基于改进knn融合随机森林算法的wifi定位方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210286939.3A CN114679779B (zh) | 2022-03-22 | 2022-03-22 | 一种基于改进knn融合随机森林算法的wifi定位方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114679779A CN114679779A (zh) | 2022-06-28 |
CN114679779B true CN114679779B (zh) | 2024-04-26 |
Family
ID=82074430
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210286939.3A Active CN114679779B (zh) | 2022-03-22 | 2022-03-22 | 一种基于改进knn融合随机森林算法的wifi定位方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114679779B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107071743A (zh) * | 2017-03-20 | 2017-08-18 | 华南理工大学 | 一种基于随机森林的快速KNN室内WiFi定位方法 |
AU2020100709A4 (en) * | 2020-05-05 | 2020-06-11 | Bao, Yuhang Mr | A method of prediction model based on random forest algorithm |
CN112887902A (zh) * | 2021-01-22 | 2021-06-01 | 湖南大学 | 一种基于高斯聚类与混合度量的WiFi指纹的室内定位方法 |
-
2022
- 2022-03-22 CN CN202210286939.3A patent/CN114679779B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107071743A (zh) * | 2017-03-20 | 2017-08-18 | 华南理工大学 | 一种基于随机森林的快速KNN室内WiFi定位方法 |
AU2020100709A4 (en) * | 2020-05-05 | 2020-06-11 | Bao, Yuhang Mr | A method of prediction model based on random forest algorithm |
CN112887902A (zh) * | 2021-01-22 | 2021-06-01 | 湖南大学 | 一种基于高斯聚类与混合度量的WiFi指纹的室内定位方法 |
Non-Patent Citations (2)
Title |
---|
HybLoc: Hybrid Indoor Wi-Fi Localization Using Soft Clustering-Based Random Decision Forest Ensembles;Beenish A. Akram Et.AL;《IEEE Access 》;20180703;第6卷;全文 * |
基于密度峰值聚类的随机森林室内定位;张萌;吕艳;倪益华;钱小鸿;杨明;;计算机工程与设计;20180516(05);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN114679779A (zh) | 2022-06-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Khalajmehrabadi et al. | Modern WLAN fingerprinting indoor positioning methods and deployment challenges | |
CN109275095B (zh) | 一种基于蓝牙的室内定位系统、定位设备和定位方法 | |
CN102480677B (zh) | 一种指纹定位误差的确定方法和设备 | |
CN109672973B (zh) | 一种基于最强ap的室内定位融合方法 | |
CN111479231A (zh) | 一种用于毫米波大规模mimo系统的室内指纹定位方法 | |
CN110049549B (zh) | 基于WiFi指纹的多融合室内定位方法及其系统 | |
CN110351660B (zh) | 一种基于双步指纹匹配架构的蓝牙室内定位方法 | |
CN113596989B (zh) | 一种用于智慧车间的室内定位方法及系统 | |
CN102480678A (zh) | 一种指纹定位方法和系统 | |
CN114189809B (zh) | 基于卷积神经网络与高维5g观测特征的室内定位方法 | |
CN102480784A (zh) | 一种指纹定位误差的评估方法和系统 | |
Zhong et al. | WiFi indoor localization based on K-means | |
CN108225332B (zh) | 基于监督的室内定位指纹地图降维方法 | |
Tao et al. | AIPS: An accurate indoor positioning system with fingerprint map adaptation | |
Aikawa et al. | WLAN finger print localization using deep learning | |
CN109889975B (zh) | 一种基于NB-IoT的终端指纹定位方法 | |
CN107820202B (zh) | 一种基于空间特征的室内定位分区方法 | |
CN114679779B (zh) | 一种基于改进knn融合随机森林算法的wifi定位方法 | |
CN110691336A (zh) | 一种基于集成学习和相对定位的双尺度定位算法 | |
Nie et al. | Joint access point fuzzy rough set reduction and multisource information fusion for indoor Wi-Fi positioning | |
Zhong et al. | A wifi positioning algorithm based on deep learning | |
Hu et al. | Reducing Wi-Fi fingerprint collection based on affinity propagation clustering and WKNN interpolation algorithm | |
Sangthong | The indoor navigation using mapping technique based on signal strength difference | |
CN105392194A (zh) | 基于异构网络室内定位框架最优通信的能耗精度均衡方法 | |
US11885898B2 (en) | Method for geolocating connected objects and associated device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |