CN114679779B - 一种基于改进knn融合随机森林算法的wifi定位方法 - Google Patents

一种基于改进knn融合随机森林算法的wifi定位方法 Download PDF

Info

Publication number
CN114679779B
CN114679779B CN202210286939.3A CN202210286939A CN114679779B CN 114679779 B CN114679779 B CN 114679779B CN 202210286939 A CN202210286939 A CN 202210286939A CN 114679779 B CN114679779 B CN 114679779B
Authority
CN
China
Prior art keywords
knn
algorithm
model
data
positioning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210286939.3A
Other languages
English (en)
Other versions
CN114679779A (zh
Inventor
李敬兆
唐俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui University of Science and Technology
Original Assignee
Anhui University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui University of Science and Technology filed Critical Anhui University of Science and Technology
Priority to CN202210286939.3A priority Critical patent/CN114679779B/zh
Publication of CN114679779A publication Critical patent/CN114679779A/zh
Application granted granted Critical
Publication of CN114679779B publication Critical patent/CN114679779B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W64/00Locating users or terminals or network equipment for network management purposes, e.g. mobility management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/023Services making use of location information using mutual or relative location information between multiple location based services [LBS] targets or of distance thresholds
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Position Fixing By Use Of Radio Waves (AREA)

Abstract

在室内环境下的定位一直存在很多问题未被解决。由于信号的严重衰减和多径效应,通用的室外定位系统(如GPS)并不能在室内环境下有效的工作,同时定位的准确性也是存在的一个问题。在室内场景下,人们更希望得到精确的位置信息,由于室内环境复杂楼层位置的变化导致的定位效果差以及定位服务不精准的问题尤为突出,显然GPS定位系统不能满足室内环境精准定位的需求。凭借着当今网络的广泛使用,以及无线网络的大量普及和自身成本低等优势,基于WIFI信号的定位技术已经成为了室内定位技术的首选。本发明通过采样各个无线AP(接入点)在室内不同位置RSS(信号强度)的数据信息,将室内划分为多个小网格作为对应各个位置中的RSS标签,而各个RSS数据信息作为标签对应的属性值,二者组合成一个数据集。通过多个点的采样,经过改进的KNN(K最近邻)算法联合随机森林算法的融合模型,在获取新的RSS数据时,通过混合模型获取当前位置的标签信息(网格位置),达到定位效果。

Description

一种基于改进KNN融合随机森林算法的WIFI定位方法
技术领域:
本发明涉及通信,信号与信息处理和基于位置的服务技术领域,具体涉及一种基于改进KNN融合随机森林算法的WIFI定位方法。
背景技术:
在我们日常生活中,大多数常用的定位应用都是基于全球定位系统(GPS)获取的位置信息,但是由于室内环境的复杂性以及位置信号差等原因,GPS的定位服务在室内表现的并不是很理想。
目前主流的室内定位技术方案有:超宽带(UWB)定位技术,射频识别(RFID)定位技术,蓝牙定位技术,超声波定位技术等等。这些都可以实现室内定位。然而,移动电话信号并不是在所有的室内场景下都可以稳定的传播,使用射频识别需要花费额外的硬件安装费用,超声波的商用设备在市场上少之又少,因此这些定位技术在实际应用中并不常见。而WIFI覆盖区域广泛,因此WIFI定位技术通常作为室内定位技术的首选。通常,一个WIFI系统由一些固定的接入点(AP)组成,他们可以部署在室内一些便于安装的位置,能连接WIFI的设备相互之间可以直接或间接的通过AP通信,因此可以考虑在通信功能外实现定位功能。
当前,绝大多数基于WIFI的定位系统都利用信号强度(RSS),其方法主要分为两类:三角形算法和位置指纹识别算法。其中三角形算法利用待测目标到至少三个已知参考点之间的距离信息估计目标位置,而位置指纹识别算法则通过比较定位所需的信号特征指纹信息获取目标位置。
基于三角型算法的WIFI定位很大程度上依赖于确知的AP位置信息及准确的信号传输损耗模型,由于影响信号传输的因素很多,不同环境下的信号传输损耗模型大不相同,建立一个准确的,适合实际应用的损耗模型存在着很大的困难。
本发明从应对强干扰的前提出发,设计了融合改进KNN和随机森林算法得到的模型,二者分别从高维和低维两个角度分析利用数据,增加了模型的抗干扰能力。
发明内容:
本发明在满足实际需求的前提下,有效的提高了该模型在实现WIFI定位的准确度,具有推广应用价值。
本发明实现上述要求采取的技术方案是:
一种基于改进KNN融合随机森林算法的WIFI定位方法,该方法包括以下步骤:
步骤1:采集WIFI信号组合,构建数据集。
步骤2:对数据进行预处理,使用主成分分析法进行特征提取。特征提取是机器学习中常用的数据处理方式,一般出现在实际搭建模型之前,以达到特征空间维度的变化。
步骤3:搭建并训练模型,设置权重。
步骤4:改进KNN模型,传统的KNN模型是将所有维度用于计算距离,然而当某一维度有较大差异时会影响整体的判断,为了解决这一问题构造了基于降维的KNN,以三维样本数据(X1,X2,X3)为例:
使用改进KNN计算公式为:
式中:X′1,X′2,X′3为测试数据,d为样本数据与测试数据之间的距离。
对于N维特征向量而言,同时对N-1维特征向量进行隶属度计算,由于单个误差数据会影响N-1个计算指标,因此该示例模型要求有两个相似权重即视为一类。
步骤5:融合随机森林算法。改进KNN算法增加了计算成本,其输入样本量应该尽可能的小,为了防止样本量较小导致的模型欠拟合问题,采用改进KNN与随机森林融合的模型。随机森林是一种通过多棵决策树进行优化决策的算法。对于特征选取,使用基尼指数增益值ΔGini(A)作为决策树选择特征的依据,其公式为:
ΔGini(A)=Gini(D)-GiniA(D)
式中:选取属性为A,k表示数据集D被分为k个Dj数据集。
步骤6:实际数据输入混合分类算法模型得到整合后结果。
本发明的有益效果是:本发明提供了一种基于混合分类算法模型的WIFI定位方法,本发明在传统KNN模型上做了改进,解决了当某一维度有较大差异时会影响整体的判断这一问题,同时导致计算成本的增加,以及小样本数据会导致欠拟合的问题,因此在此基础上联合了随机森林算法。从实验结果表明:本发明提出的融合模型比传统的KNN和随机森林算法的模型在准确度上分别提高了15.7%和9.6%,其准确率达到了98.3%。
附图说明:
图1为混合分类算法模型的构建及工作过程;
图2为改进KNN在四个维度下的相似度;
图3为随机森林的树状结构;
图4为实验场地区域划分示意图;
具体实施方式:
具体实施方式一:本实施方式所述的基于混合分类算法的WIFI定位方法,该方法具体包括以下步骤:
步骤1:采集WIFI信号组合,构建数据集。
步骤2:对数据进行预处理,使用主成分分析法进行特征提取。特征提取是机器学习中常用的数据处理方式,一般出现在实际搭建模型之前,以达到特征空间维度的变化。
步骤3:搭建并训练模型,设置权重。
步骤4:改进KNN模型,传统的KNN模型是将所有维度用于计算距离,然而当某一维度有较大差异时会影响整体的判断,为了解决这一问题构造了基于降维的KNN,以三维样本数据(X1,X2,X3)为例:
使用改进KNN计算公式为:
式中:X′1,X′2,X′3为测试数据,d为样本数据与测试数据之间的距离。
对于N维特征向量而言,同时对N-1维特征向量进行隶属度计算,由于单个误差数据会影响N-1个计算指标,因此该示例模型要求有两个相似权重即视为一类。
步骤5:融合随机森林算法。改进KNN算法增加了计算成本,其输入样本量应该尽可能的小,为了防止样本量较小导致的模型欠拟合问题,采用改进KNN与随机森林联合的模型。随机森林是一种通过多棵决策树进行优化决策的算法。对于特征选取,使用基尼指数增益值ΔGini(A)作为决策树选择特征的依据,其公式为:
ΔGini(A)=Gini(D)-GiniA(D)
式中:选取属性为A,k表示数据集D被分为k个Dj数据集。
步骤6:实际数据输入混合分类算法模型得到整合后结果。
具体实施二:本实施方式与具体实施方式一不同的是:所述步骤1的具体过程为:
所述改进KNN算法中使用四维样本数据(X1,X2,X3,X4):
具体实施方式三:本实施方式与具体实施方式二不同的是:在室内划分若干个网格,每个网格单元的面积是1m*1m,室内部署6个AP,方位尚不明确;在每一个网格单元中密集采样,保证数据充足,这样做的优点是:提高混合分类算法模型的预测精度。
本发明与传统的KNN算法和随机森林算法在准确率上对比如图4所示,准确率相比传统CNN算法提高了15.7%,相比随机森林算法提高了9.6%。在定位精度上提升显著,定位误差可以保持在1m以内。表明本发明在室内环境中进行WIFI定位的有效性以及可实现性。
本发明的实施方式并不受上述实施实例的限制,其他的任何未违背本发明精神实质与原理下所作的改变,修饰,替代,组合,简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (4)

1.一种基于改进KNN融合随机森林算法的WIFI定位方法,其特征在于,该方法具体包括如下步骤:
步骤1:采集WIFI信号组合,构建数据集;
步骤2:对数据进行预处理,使用主成分分析法进行特征提取;特征提取是机器学习中常用的数据处理方式,一般出现在实际搭建模型之前,以达到特征空间维度的变化;
步骤3:搭建并训练模型,设置权重;
步骤4:改进KNN模型,传统的KNN模型是将所有维度用于计算距离,然而当某一维度有较大差异时会影响整体的判断,为了解决这一问题构造了基于降维的KNN,以三维样本数据(X1,X2,X3)为例:
使用改进KNN计算公式为:
式中:X′1,X′2,X′3为测试数据,d为样本数据与测试数据之间的距离;
对于N维特征向量而言,同时对N-1维特征向量进行隶属度计算,由于单个误差数据会影响N-1个计算指标,因此该模型要求有两个相似权重即视为一类;
步骤5:融合随机森林算法;改进KNN算法增加了计算成本,其输入样本量应该尽可能的小,为了防止样本量较小导致的模型欠拟合问题,采用改进KNN与随机森林算法联合的模型;随机森林是一种通过多棵决策树进行优化决策的算法;对于特征选取,使用基尼指数增益值ΔGini(A)作为决策树选择特征的依据,其公式为:
ΔGini(A)=Gini(D)-GiniA(D)
式中:选取属性为A,k表示数据集D被分为k个Dj数据集;
步骤6:实际数据输入混合分类算法模型得到整合后结果。
2.如权利要求1所述的一种改进KNN融合随机森林算法的WIFI定位方法,其特征在于,所述改进KNN算法解决了传统KNN算法在某个维度有较大差异时影响整体判断。
3.如权利要求1所述的一种改进KNN融合随机森林算法的WIFI定位方法,其特征在于,由于改进KNN算法增加了计算成本,为了防止样本量较小导致的欠拟合问题,采用了联合随机森林算法得到的一种融合模型。
4.如权利要求1所述的一种改进KNN融合随机森林算法的WIFI定位方法,其特征在于,所述决策树选择特征的依据为基尼指数的增益值ΔGini(A);在当集合越是混乱的时候,基尼指数对这种趋势的表现不够充分,相比之下基尼指数的增益值更能区分出混乱和更混乱。
CN202210286939.3A 2022-03-22 2022-03-22 一种基于改进knn融合随机森林算法的wifi定位方法 Active CN114679779B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210286939.3A CN114679779B (zh) 2022-03-22 2022-03-22 一种基于改进knn融合随机森林算法的wifi定位方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210286939.3A CN114679779B (zh) 2022-03-22 2022-03-22 一种基于改进knn融合随机森林算法的wifi定位方法

Publications (2)

Publication Number Publication Date
CN114679779A CN114679779A (zh) 2022-06-28
CN114679779B true CN114679779B (zh) 2024-04-26

Family

ID=82074430

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210286939.3A Active CN114679779B (zh) 2022-03-22 2022-03-22 一种基于改进knn融合随机森林算法的wifi定位方法

Country Status (1)

Country Link
CN (1) CN114679779B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107071743A (zh) * 2017-03-20 2017-08-18 华南理工大学 一种基于随机森林的快速KNN室内WiFi定位方法
AU2020100709A4 (en) * 2020-05-05 2020-06-11 Bao, Yuhang Mr A method of prediction model based on random forest algorithm
CN112887902A (zh) * 2021-01-22 2021-06-01 湖南大学 一种基于高斯聚类与混合度量的WiFi指纹的室内定位方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107071743A (zh) * 2017-03-20 2017-08-18 华南理工大学 一种基于随机森林的快速KNN室内WiFi定位方法
AU2020100709A4 (en) * 2020-05-05 2020-06-11 Bao, Yuhang Mr A method of prediction model based on random forest algorithm
CN112887902A (zh) * 2021-01-22 2021-06-01 湖南大学 一种基于高斯聚类与混合度量的WiFi指纹的室内定位方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HybLoc: Hybrid Indoor Wi-Fi Localization Using Soft Clustering-Based Random Decision Forest Ensembles;Beenish A. Akram Et.AL;《IEEE Access 》;20180703;第6卷;全文 *
基于密度峰值聚类的随机森林室内定位;张萌;吕艳;倪益华;钱小鸿;杨明;;计算机工程与设计;20180516(05);全文 *

Also Published As

Publication number Publication date
CN114679779A (zh) 2022-06-28

Similar Documents

Publication Publication Date Title
Khalajmehrabadi et al. Modern WLAN fingerprinting indoor positioning methods and deployment challenges
CN109275095B (zh) 一种基于蓝牙的室内定位系统、定位设备和定位方法
CN102480677B (zh) 一种指纹定位误差的确定方法和设备
CN109672973B (zh) 一种基于最强ap的室内定位融合方法
CN111479231A (zh) 一种用于毫米波大规模mimo系统的室内指纹定位方法
CN110049549B (zh) 基于WiFi指纹的多融合室内定位方法及其系统
CN110351660B (zh) 一种基于双步指纹匹配架构的蓝牙室内定位方法
CN113596989B (zh) 一种用于智慧车间的室内定位方法及系统
CN102480678A (zh) 一种指纹定位方法和系统
CN114189809B (zh) 基于卷积神经网络与高维5g观测特征的室内定位方法
CN102480784A (zh) 一种指纹定位误差的评估方法和系统
Zhong et al. WiFi indoor localization based on K-means
CN108225332B (zh) 基于监督的室内定位指纹地图降维方法
Tao et al. AIPS: An accurate indoor positioning system with fingerprint map adaptation
Aikawa et al. WLAN finger print localization using deep learning
CN109889975B (zh) 一种基于NB-IoT的终端指纹定位方法
CN107820202B (zh) 一种基于空间特征的室内定位分区方法
CN114679779B (zh) 一种基于改进knn融合随机森林算法的wifi定位方法
CN110691336A (zh) 一种基于集成学习和相对定位的双尺度定位算法
Nie et al. Joint access point fuzzy rough set reduction and multisource information fusion for indoor Wi-Fi positioning
Zhong et al. A wifi positioning algorithm based on deep learning
Hu et al. Reducing Wi-Fi fingerprint collection based on affinity propagation clustering and WKNN interpolation algorithm
Sangthong The indoor navigation using mapping technique based on signal strength difference
CN105392194A (zh) 基于异构网络室内定位框架最优通信的能耗精度均衡方法
US11885898B2 (en) Method for geolocating connected objects and associated device

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant