CN116847283A

CN116847283A - 一种基于csi的室内定位方法及系统

Info

Publication number: CN116847283A
Application number: CN202310939508.7A
Authority: CN
Inventors: 余敏; 谢佳俊; 王康; 郭杭
Original assignee: Jiangxi Normal University
Current assignee: Jiangxi Normal University
Priority date: 2023-07-28
Filing date: 2023-07-28
Publication date: 2023-10-03

Abstract

本发明提供了一种基于CSI的室内定位方法及系统，涉及室内定位技术领域。室内定位方法包括以下步骤：建立离线指纹数据库后训练随机森林回归模型和KD树优化的WKNN模型，将测试点的数据输入两种模型中，并基于敏感哈希算法加快KD树的搜索，根据两种模型在不同位置上的误差表现，将误差转换为概率的形式进行加权，从而为两种模型在每个位置上的位置估计分配不同的权重，从而得到最终的位置估计。本发明提供的室内定位方法能够结合两种模型的优势，提高定位准确性和鲁棒性，提高方法的预测能力和可解释性，适用于不同场景下的定位需求，并且对两种模型的位置估计进行加权集成，能够量化每个模型的贡献，有助于减小误差较大的模型对最终结果的影响。

Description

一种基于CSI的室内定位方法及系统

技术领域

本发明涉及室内定位技术领域，尤其涉及一种基于CSI的室内定位方法及系统。

背景技术

近年来，随着室内定位技术的不断发展，人们对位置服务的质量要求越来越高，慢慢地开始追求多场景适应性、低时延和高精度的目标。特别是随着新一代通信协议的发布，WiFi以及5G商用设备逐渐开放物理层信息，使得信道状态信息(Channel StateInformation，简称CSI)的获取变得更加简单。

虽然，许多学者在室内定位方式、定位算法等上都开展了各式各样的研究，但一些基于CSI的室内定位研究为了获取较低的定位时延，偏向于使用单一、简单的定位模型，这使得模型的泛化能力和预测性能都比较弱，最终导致定位精度不高、稳定性偏差。还有一些基于CSI的室内定位研究为了获取较高的定位精度，偏向于使用比较复杂的定位模型，比如一些复杂的神经网络或者深度学习模型，但他们忽略了定位的时间开销。所以，如何才能提供快速、高效且准确的定位结果以及如何才能使定位系统适用于多维空间的定位场景，是CSI研究者亟待解决的问题。

发明内容

本发明的目的在于提供一种基于CSI的室内定位方法及系统，能够提供一种快速、高效且准确的定位结果，使得定位系统能够适用于多维空间的定位场景。

第一方面，本发明提供的一种基于CSI的室内定位方法，包括以下步骤：

基于室内待定位区域参考点上的参考CSI特征数据包与所述参考点对应的位置信息建立离线指纹数据库，并根据所述离线指纹数据库训练随机森林回归模型和KD树优化的WKNN模型；

获取室内待定位区域测试点上的测试CSI特征数据包，并将其分别输入所述训练好的随机森林回归模型和训练好的KD树优化的WKNN模型，所述随机森林回归模型输出第一位置估计，所述KD树优化的WKNN模型输出第二位置估计；

计算所述第一位置估计与所述测试点实际位置的第一位置偏差，计算所述第二位置估计与所述测试点实际位置的第二位置偏差，基于所述第一位置偏差和所述第二位置偏差，采用位置加权算法集成所述第一位置估计和所述第二位置估计来计算最终位置估计。

本发明提供的一种室内CSI定位方法的有益效果在于：通过采用随机森林回归模型和KD树优化的WKNN模型，能够在室内定位任务中结合两种模型的优势，弥补各自的不足，提高定位准确性和鲁棒性，同时能够更加全面地考虑各种特征和非线性关系，提高模型的预测能力和可解释性，能够适用于不同场景下的定位需求，并且对两种模型的位置估计进行加权集成，能够量化每个模型的贡献，有助于减小误差较大的模型对最终结果的影响。

可选地，执行基于室内待定位区域参考点上的参考CSI特征数据包与所述参考点对应的位置信息建立离线指纹数据库的过程中，包括：在室内待定位区域布设若干个参考点，在每个所述参考点上采集n组包括幅值信号和相位信号的参考特征数据，若干个所述参考点上的n组所述参考特征数据构成参考CSI特征数据包；剔除所述参考特征数据的异常值并进行降噪和降维处理后，建立所述参考特征数据与所述参考点对应的位置信息相对应的离线指纹数据库。

可选地，执行获取室内待定位区域测试点上的测试CSI特征数据包的过程中，包括：在室内待定位区域布设若干个测试点，在每个所述测试点上采集n组包括幅值信号和相位信号的测试特征数据，剔除所述测试特征数据的异常值并进行降噪和降维处理后，若干个所述测试点上的n组所述测试特征数据构成测试CSI特征数据包。

可选地，执行所述KD树优化的WKNN模型输出第二位置估计的过程中，包括：基于所述离线指纹数据库中的若干个参考点特征构建KD树；利用局部敏感哈希算法搜索每个所述测试点对应的k个最近邻参考点；计算k个最近邻参考点与对应测试点的欧式距离，基于k个欧式距离采用加权公式对k个最近邻参考点分配权重值；将k个最近邻参考点的位置信息按所分配的权重值进行加权求和后，得出第二位置估计。

可选地，执行采用位置加权算法集成所述第一位置估计和所述第二位置估计来计算最终位置估计的过程中，包括：将所述第一位置偏差和所述第二位置偏差的数值分别转换为第一指数误差概率和第二指数误差概率；基于所述第一指数误差概率和所述第二指数误差概率，分别对所述第一位置估计和所述第二位置估计分配权重值，并基于权重值集成所述第一位置估计和所述第二位置估计，计算最终位置估计。

可选地，执行基于权重值集成所述第一位置估计和所述第二位置估计的过程中，根据以下公式进行最终位置估计的计算：

X_i＝W_R(i)·pre_rf_x(i)+W_K(i)·pre_wknn_x(i)

Y_i＝W_R(i)·pre_rf_y(i)+W_K(i)·pre_wknn_y(i)

pre_loc(i)＝[X_i，Y_i]

其中，所述pre_rf_x(i)为随机森林回归模型在第i个位置的第一位置估计的x标签，所述pre_rf_y(i)为随机森林回归模型在第i个位置的第一位置估计的y标签，所述pre_wknn_x(i)为KD树优化的WKNN模型在第i个位置的第二位置估计的x标签，所述pre_wknn_y(i)为KD树优化的WKNN模型在第i个位置的第二位置估计的y标签，所述W_R(i)为随机森林回归模型在第i个位置的权重值，所述W_K(i)为KD树优化的WKNN模型在第i个位置的权重值，所述pre_loc(i)为第i个测试点的最终位置估计。

可选地，执行将所述第一位置偏差和所述第二位置偏差的数值分别转换为第一指数误差概率和第二指数误差概率的过程中，根据以下公式进行转换：

rf_probs(i)＝e^-rf_error(i)

wknn_probs(i)＝e^{-wknn_error(i)}

其中，所述rf_probs(i)为随机森林回归模型在第i个位置上的第一指数误差概率，所述rf_error(i)为随机森林回归模型在第i个位置上的第一位置偏差的数值，所述wknn_probs(i)为KD树优化的WKNN模型在第i个位置上的第二指数误差概率，所述wknn_error(i)为KD树优化的WKNN模型在第i个位置上的第二位置偏差的数值。

可选地，执行基于所述第一指数误差概率和所述第二指数误差概率分别对所述第一位置估计和所述第二位置估计分配权重值的过程中，采用以下公式进行权重值分配：

其中，所述W_R(i)为随机森林回归模型在第i个位置的权重值，所述W_K(i)为KD树优化的WKNN模型在第i个位置的权重值。

第二方面，本发明提供的一种室内定位系统，包括离线训练模块和在线匹配模块；

所述离线训练模块用于获取室内待定位区域参考点上的参考CSI特征数据包和所述参考点对应的位置信息建立离线指纹数据库，并根据所述离线指纹数据库训练随机森林回归模型和KD树优化的WKNN模型；

所述在线匹配模块用于获取室内待定位区域测试点上的测试CSI特征数据包，并集成所述随机森林回归模型和所述KD树优化的WKNN模型在每个位置上预测的不同结果来计算最终位置估计。

附图说明

图1为本发明实施例中利用参考点特征构建KD树的存储结构图；

图2为本发明实施例中基于CSI的室内定位系统的结构框图；

图3为本发明实施例中离线训练模块的结构流程图；

图4为本发明实施例中在线匹配模块的结构流程图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，均属于本发明保护的范围。除非另外定义，此处使用的技术术语或者科学术语应当为本发明所属领域内具有一般技能的人士所理解的通常意义。本发明中使用的“包括”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同，而不排除其他元件或者物件。

本发明实施例提供了一种基于CSI的室内定位方法，包括以下步骤：

S1、基于室内待定位区域参考点上的参考CSI特征数据包与参考点对应的位置信息建立离线指纹库，并根据离线指纹数据库训练随机森林回归模型和KD树优化的WKNN模型；

S2、获取室内待定位区域测试点上的测试CSI特征数据包，并将其分别输入训练好的随机森林回归模型和训练好的KD树优化的WKNN模型中，随机森林回归模型输出第一位置估计，KD树优化的WKNN模型输出第二位置估计；

S3、计算第一位置估计与测试点实际位置的第一位置偏差，计算第二位置估计与测试点实际位置的第二位置偏差，基于第一位置偏差和第二位置偏差，采用位置加权算法集成第一位置估计和第二位置估计来计算得到最终位置估计。

一些实施例中，执行步骤S1基于室内待定位区域参考点上的参考CSI特征数据包建立离线指纹库的过程中，包括：

在室内待定位区域布设若干个参考点，在每个参考点上采集n组包括幅值信号和相位信号的参考特征数据，若干个参考点上的n组参考特征数据构成参考CSI特征数据包；

剔除参考特征数据的异常值并进行降噪和降维处理后，建立参考特征数据与参考点位置信息相对应的离线指纹数据库。

一些实施例中，在室内待定位区域上布设若干个参考点，并固定好CSI信号发射基站，利用能够接收到CSI信号的CSI信号接收设备在每个参考点上采集n组包括幅值信号和相位信号的参考特征数据。

具体的，CSI信号发射基站可以是WiFi基站、5G基站或者其他具有相同或类似功能的基站设备，CSI信号接收设备可以是软件无线电设备、能够接收到CSI信号的手机、能够接收到CSI信号的电脑或者其他具有相同或类似功能的设备。具体的，还可以将室内待定位区域划分为若干个区域块，在每个区域块通过CSI信号接收设备进行数据采集。

一些实施例中，剔除参考特征数据的异常值并进行降噪和降维处理时，对CSI特征数据包进行解析并提取原始的幅值信号和相位信号后，利用解卷绕和相位差值最小二乘法还原真实相位，然后利用Hampel标识符剔除幅值信号和相位信号的异常值，最后利用残差修正的自适应卡尔曼滤波算法对幅值信号和相位信号进行平滑降噪处理。

实际上，由于计算一个系统的相频特性时，会利用到四象限反正切函数来计算相位角，这使得直接获得的原始相位信号会随机分布且在±π处发生截断，导致相位特征在不同位置上不可区分，所以当原始相位数据前后两点的相位差超过π的时候，就认为产生相位截断，这就需要将产生截断的相位减去截断幅度2π，以此类推，将由四象限反正切函数运算引起的截断相位恢复成原有的相位分布，最后再利用相位差值最小二乘法对解卷绕之后的相位进行线性矫正处理，得到真实的相位信号。

具体的，利用Hampel标识符剔除幅值信号和相位信号的异常值时，其逻辑是在于，将满足的第i个样本/>识别为异常值；其中，μ_i和σ_i是滑动窗口中第i个样本的局部中值和中值绝对偏差，γ是一个默认为3的实标量。Hampel标识符可以用长度为N_w的滑动窗口内的中值替换单个子载波中随时间波动较大的异常值，从而达到剔除异常值的效果。

具体的，利用残差修正的自适应卡尔曼滤波算法对幅值信号和相位信号进行平滑降噪时，过程如下：首先在原有卡尔曼滤波的基础上，通过计算估计残差，即观测值与预测值之间的差异，然后根据估计残差计算修正系数beta，它是残差与观测噪声协方差矩阵S相关的度量值，取最大值保证其不小于预定义阈值gamma，最后对原始向量进行自适应修正以提高状态估计的准确性，为避免出现矩阵奇异值或接近奇异值的情况，设置一个边界条件并将检测到的存在异常的状态估计值或状态协方差矩阵重置为初始值。

一些实施例中，对降噪后的幅值信号和相位信号进行降维处理时，首先利用自适应加权Kmeans算法减少参考点的数据量，然后将处理后的幅值信号和相位信号作为联合特征，再进行Z-score标准化处理，最后利用基于奇异矩阵分解的PCA算法对联合特征进行降维处理。利用自适应加权Kmeans算法能够在不影响CSI信号细粒度特征的前提下，选取出用来描述位置多径特性并且对定位贡献大的特征数据包，能够减少参考点的数据量，减少定位的时间开销。

具体的，由于提取的幅值信号和相位信号之间的数值差别较大，会对定位结果造成较大影响，因此采用Z-score算法对特征数据进行标准化处理，能够将不同量级的数据转化成统一量级的Z-score分值进行比较，按以下公式(1)进行计算：

式(1)中，F_i表示未经过Z-score标准化处理的特征数据，F_Z-score表示Z-score标准化之后的特征数据，μ表示特征数据的均值，σ表示特征数据的标准差，其中，μ和σ又可以分别表示为如公式(2)和公式(3)：

式(2)和式(3)中，n表示数据包的个数。

具体的，利用基于奇异矩阵分解的PCA算法对联合特征进行降维处理时，包括以下步骤：

计算每列特征数据的均值；

对特征数据去中心化，即用每个样本减去每列特征样本的均值；

将去中心化的样本矩阵进行奇异矩阵分解，得到一个左奇异矩阵U、一个右奇异矩阵V和一个奇异值对角矩阵S；

取右奇异矩阵V的前q个特征分量；

利用前q个特征分量对样本矩阵进行列压缩，得到降维后的特征矩阵。

实际上，通过计算奇异值的平方和，得到方差解释比，然后通过计算方差解释比的累积和，得到累计方差解释比，同时设定一个阈值，例如90％、95％或99％等，并找到累计方差解释比达到或超过该阈值的最小特征数q，以尽可能地保留原始数据的重要信息，最后达到提高定位精度，减少定位时间的效果。

一些实施例中，建立参考特征数据与参考点位置信息相对应的离线指纹数据库后，第m个参考点的坐标(x_m，y_m)对应的指纹特征为F_mn，其中F_mn又可以表示为以下矩阵：

式中，amp_mi表示第m个位置上的第i个子载波的幅值集合；pha_mi表示第m个位置上的第i个子载波的相位集合，n表示幅值或者相位子载波的总数，p表示数据包的总数。

一些实施例中，执行步骤S1中根据离线指纹数据库训练随机森林回归模型和KD树优化的WKNN模型时，首先利用随机种子算法随机打乱离线指纹数据库中的参考特征数据与对应的位置信息，然后分别训练随机森林回归模型和KD树优化的WKNN模型。

具体的，利用随机种子算法随机打乱离线指纹数据库中的参考特征数据与对应的位置信息时，预先产生一组随机种子，然后将参考特征数据和对应参考点的位置信息按随机种子重新排序。如此可以随机化样本的顺序，避免模型过度依赖特定样本的顺序，从而提高模型的泛化能力。

一些实施例中，执行步骤S2中获取室内待定位区域测试点上的测试CSI特征数据包时，包括：

在与步骤S1相同的环境和配置下，在室内待定位区域内布设若干个测试点，并在每个测试点上采集n组包括幅值信号和相位信号的测试特征数据，剔除测试特征数据的异常值并进行降噪和降维处理后，构成测试CSI特征数据包。

具体的，对测试特征数据的异常值的剔除和降噪、降维处理的过程，与上述任一实施例中对参考特征数据进行异常值剔除、降噪和降维处理过程类似或相同。

实际上，执行步骤S2中将测试CSI特征数据包输入KD树优化的WKNN模型中，能够有效加快定位的匹配速度，从而减少定位的时间开销。

具体的，使用KD树优化WKNN模型的步骤如下所示：

利用离线指纹数据库中的参考点特征构建KD树；

选择合适的k值，对于每个测试点利用局部敏感哈希在构建好的KD树中搜索找到它的k个最近邻参考点。

实际上，可以使用交叉验证并结合相关实验得到合适的k值。

进一步的，参见图1，利用离线指纹数据库中的参考点特征构建KD树时，包括以下步骤：

选择切分维度：在离线指纹数据库中，分别计算n个样本的m列特征方差，取具有最大方差的第r列特征作为KD树的切分维度或根节点；

选择切分点：在选定的切分维度上，选择该列特征的中位数med作为KD树的切分点；

构建子树：根据选择的切分维度和切分点，将小于切分点med的数据集划分到左子树，将大于或等于切分点med的数据集划分到右子树，最终可以将数据集划分为左右两个子集；

递归构建：对于每个左右子树，重复上述三个步骤，直到所有参考点特征数据都被组织到KD树中，即可完成构建。

更进一步的，利用局部敏感哈希在构建好的KD树中搜索找到k个最近邻参考点时，包括以下步骤：

创建优先队列：创建一个优先队列(或最大堆)，用于保存当前最近邻参考点，并且队列中的元素按照与测试点的距离进行升序排列；

局部敏感哈希预处理：对每个参考点的CSI特征，使用局部敏感哈希函数将其映射到哈希桶中，然后通过构建一个哈希表，将每个哈希桶与其中的参考点进行关联；

搜索最近邻：对于每个给定的测试点CSI特征，同样使用局部敏感哈希函数映射到哈希桶中，获得对应的哈希桶；然后计算测试点与参考点的距离，并将其加入优先队列，如果队列中的元素数量超过k个，则移除队列中最远距离的元素，保持队列中的元素数量不超过k个；遍历所有哈希桶后，根据优先队列中的最远距离，更新搜索半径，记为R；

KD树搜索：从根节点开始，递归地向下遍历KD树，对于每个遍历到的节点，计算测试点与节点的距离，若当前节点的距离小于R，则将其加入优先队列，若队列中的元素数量超过k个，则移除队列中最远距离的元素，保持队列中的元素数量不超过k个，根据当前节点的切分维度和切分点，确定向左子树或右子树进行遍历；从根节点出发，若切分的坐标值大于输入节点坐标值，则移动到左子节点，否则移动到右子节点；遍历到叶子节点后，以该叶子节点作为当前的最近邻点；

回溯和剪枝：当遍历到叶子节点后，开始回溯，对于每个回溯到的节点，计算测试点与节点的距离，若当前节点距离小于R，则将其加入优先队列，并检查当前节点的另一个子树是否可能包含更近的数据点，若可能，则遍历另一个子树，直至回溯到根节点；

取出搜索到的结果：从优先队列中提取处k个最近邻参考点，按照与测试点的距离进行升序排列，即为搜索到的结果。

实际上，局部敏感哈希是一种哈希技术，旨在将相似的数据点映射到相同或相邻的哈希桶中，从而加速近似或近邻的搜索，通过结合KD树和局部敏感哈希技术，可以进行高效搜索并找到给定测试点的k个最近邻参考数据点，在搜索过程中，根据局部敏感哈希的映射关系和距离阈值R，先通过局部敏感哈希快速筛选出候选点，然后使用KD树进行进一步的精确搜索，优先队列的使用可以保持结果的有序性，并动态地更新最远距离，以剪枝不必要的遍历，从而提高搜索效率。

实际上，执行步骤S2中将测试CSI特征数据包输入训练好的随机森林回归模型时，可以预先通过交叉验证得到随机森林回归模型最佳的参数组合。具体的，最佳的参数组合为训练模型时得出的，例如利用5折交叉验证对训练集进行轮次分割(训练分割集4：测试分割集1)并利用分割集进行训练和测试，进而得出最佳的参数组合。

一些实施例中，KD树优化的WKNN模型输出第二位置估计时，包括：

计算当前测试点与k个最近邻参考点之间的欧式距离，并根据k个欧式距离为k个最近邻参考点分配权重值；

将k个最近邻参考点按所分配的权重值进行加权求和，除以总权重后，得第二位置估计的位置信息。

实际上，为k个最近邻参考点分配权重值时，欧式距离越小说明两个点越相似，所能分配的权重值也越大。

具体的，权重值的分配策略如下公式(4)所示：

式(4)中，W_i表示第i个最近邻参考点的权重值，D_i表示测试点到第i个最近邻参考点的距离，D_min表示测试点到k个最近邻参考点的最短距离，σ_i表示第i个最近邻参考点的自适应近邻带宽，考虑到最近邻参考点周围的密度信息，使带宽能够根据数据分布的密集程度进行自适应调整，σ_i又可以公式(5)表示为：

式(5)中，k表示最近邻参考点的个数。

具体的，计算第二位置估计的位置标签，参考以下公式(6)进行：

式(6)中，表示第二位置估计的位置标签，k表示最近邻参考点的个数，W_i表示第i个最近邻参考点的权重值，(x_nn(i)，y_nn(i))表示最近邻参考点中第i个点的位置标签，ε表示一个非零且数值较小的实数，用来避免出现W_i为零的情况。

实际上，由于随机森林回归模型和KD树优化的WKNN模型在定位精度和稳定性上有不同的表现，且两种模型均能够获得不错的定位效果，因此为了提高定位的泛化能力和预测能力，可以将两种模型的预测结果进行集成。

一些实施例中，采用以下公式(7)计算步骤S3中的第一位置偏差：

式(7)中，N表示当前测试点数据总条数；表示随机森林回归模型输出的第一位置估计的位置标签x；/>表示随机森林回归模型输出的第一位置估计的位置标签y；test_j，x表示当前测试点实际位置的位置标签x；test_j，y表示当前测试点实际位置的位置标签y。

一些实施例中，采用以下公式(8)计算步骤S3中的第二位置偏差：

式(8)中，N表示当前测试点数据总条数；表示KD树优化的WKNN模型输出的第二位置估计的位置标签x；/>表示KD树优化的WKNN模型输出的第二位置估计的位置标签y；test_j，x表示当前测试点实际位置的位置标签x；test_j，y表示当前测试点实际位置的位置标签y。

一些实施例中，执行步骤S3中采用位置加权算法集成第一位置估计和第二位置估计时，包括：

将第一位置偏差和第二位置偏差的数值分别转换为第一指数误差概率和第二指数误差概率：

基于第一指数误差概率和第二指数误差概率，分别对第一位置估计和第二位置估计分配权重值，并基于权重值集成第一位置估计和第二位置估计，计算最终位置估计。

具体的，采用以下公式(9)将第一位置偏差转换为第一指数误差概率：

rf_probs(i)＝e^-rf_error(i) (9)

式(9)中，rf_probs(i)表示随机森林回归模型在第i个位置上的第一指数误差概率。

具体的，采用以下公式(10)将第二位置偏差转换为第二指数误差概率：

wknn_probs(i)＝e^{-wknn_error(i)} (10)

式(10)中，wknn_probs(i)表示KD树优化的WKNN模型在第i个位置上的第二指数误差概率。

实际上，通过指数函数将误差转换为概率，能够对误差较小的模型赋予更大的概率，有助于减小误差较大的模型对最终结果的影响，能够提高定位精度。

具体的，采用以下公式(11)对第一位置估计进行权重值分配：

式(11)中，W_R(i)表示随机森林回归模型在第i个位置上所占权重大小。

具体的，采用以下公式(12)对第二位置估计进行权重值分配：

式(12)中，W_K(i)表示KD树优化的WKNN模型在第i个位置上所占权重大小。

一些实施例中，基于权重值集成第一位置估计和第二位置估计来计算最终位置估计时，采用以下公式(13)-(15)：

X_i＝W_R(i)·pre_rf_x(i)+W_K(i)·pre_wknn_x(i) (13)

Y_i＝W_R(i)·pre_rf_y(i)+W_K(i)·pre_wknn_y(i) (14)

pre_loc(i)＝[X_i，Y_i] (15)

式(13)-(15)中，pre_rf_x(i)表示随机森林回归模型在第i个位置上输出的第一位置估计的位置标签x；pre_rf_y(i)表示随机森林回归模型在第i个位置上输出的第一位置估计的位置标签y；pre_wknn_x(i)表示KD树优化的WKNN模型在第i个位置上输出的第二位置估计的位置标签x；pre_wknn_y(i)表示KD树优化的WKNN模型在第i个位置上输出的第二位置估计的位置标签y；pre_loc(i)表示第i个测试点的最终位置估计。

本发明实施例中还提供一种基于CSI的室内定位系统，包括离线训练模块和在线匹配模块，离线训练模块用于获取室内待定位区域内的参考CSI特征数据包和参考点对应的位置信息建立离线指纹数据库，并根据离线指纹数据库训练随机森林回归模型和KD树优化的WKNN模型；在线匹配模块用于获取室内待定位区域测试点上的测试CSI特征数据包，并集成随机森林回归模型和KD树优化的WKNN模型在每个位置上预测的不同结果来计算最终位置估计。

具体的，离线训练模块包括质量控制模块、轻量化模块和集成学习模块：

质量控制模块用于接收参考CSI特征数据包，在提取数据包中的CSI幅值信号和CSI相位信号后，利用解卷绕和相位差值最小二乘法还原真实相位，然后利用Hampel标识符剔除幅值信号和相位信号的异常值，最后利用残差修正的自适应卡尔曼滤波算法对幅值信号和相位信号进行平滑降噪处理；

轻量化模块用于对降噪后的幅值信号和相位信号进行数据包分割，并使用Z-score算法进行联合特征标准化处理，最后利用基于奇异矩阵分解的PCA算法对联合特征进行降维处理；

集成学习模块用于将处理后的参考CSI特征数据包与参考点位置信息进行结合，并建立离线指纹数据库，并采用随机种子算法随机打乱离线指纹数据库中的参考特征数据与参考点对应的位置信息，然后分别训练随机森林回归模型和KD树优化的WKNN模型。

具体的，在线匹配模块与离线训练模块共用质量控制模块和轻量化模块，区别在于，当在线匹配模块工作时，质量控制模块用于接收测试CSI特征数据包，提取数据包内的CSI幅值信号和CSI相位信号后，利用解卷绕和相位差值最小二乘法还原真实相位，然后利用Hampel标识符剔除幅值信号和相位信号的异常值，最后利用残差修正的自适应卡尔曼滤波算法对幅值信号和相位信号进行平滑降噪处理；轻量化模块用于对降噪后的测试点幅值信号和相位信号进行数据包分割，并使用Z-score算法进行联合特征标准化处理，最后利用基于奇异矩阵分解的PCA算法对联合特征进行降维处理。

具体的，在线匹配模块还包括定位模块，定位模块用于将处理后的测试CSI特征数据包输入训练好的随机森林回归模型和训练好的KD树优化的WKNN模型之中，并计算随机森林回归模型在不同位置上的第一位置偏差和KD树优化的WKNN模型在不同位置上的第二位置偏差，并将第一位置偏差和第二位置偏差转换为第一指数误差概率和第二指数误差概率，并基于第一指数误差概率和第二指数误差概率，对随机森林回归模型和KD树优化的WKNN模型进行权重分配，从而得到最终位置估计。

虽然在上文中详细说明了本发明的实施方式，但是对于本领域的技术人员来说显而易见的是，能够对这些实施方式进行各种修改和变化。但是，应理解，这种修改和变化都属于权利要求书中所述的本发明的范围和精神之内。而且，在此说明的本发明可有其它的实施方式，并且可通过多种方式实施或实现。

Claims

1.一种基于CSI的室内定位方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的室内定位方法，其特征在于，执行基于室内待定位区域参考点上的参考CSI特征数据包与所述参考点对应的位置信息建立离线指纹数据库的过程中，包括：

在室内待定位区域布设若干个参考点，在每个所述参考点上采集n组包括幅值信号和相位信号的参考特征数据，若干个所述参考点上的n组所述参考特征数据构成参考CSI特征数据包；

剔除所述参考特征数据的异常值并进行降噪和降维处理后，建立所述参考特征数据与所述参考点对应的位置信息相对应的离线指纹数据库。

3.根据权利要求2所述的室内定位方法，其特征在于，执行获取室内待定位区域测试点上的测试CSI特征数据包的过程中，包括：

在室内待定位区域布设若干个测试点，在每个所述测试点上采集n组包括幅值信号和相位信号的测试特征数据，剔除所述测试特征数据的异常值并进行降噪和降维处理后，若干个所述测试点上的n组所述测试特征数据构成测试CSI特征数据包。

4.根据权利要求3所述的室内定位方法，其特征在于，执行所述KD树优化的WKNN模型输出第二位置估计的过程中，包括：

基于所述离线指纹数据库中的若干个参考点特征构建KD树；

利用局部敏感哈希算法搜索每个所述测试点对应的k个最近邻参考点；

计算k个最近邻参考点与对应测试点的欧式距离，基于k个欧式距离采用加权公式对k个最近邻参考点分配权重值；

将k个最近邻参考点的位置信息按所分配的权重值进行加权求和后，得第二位置估计。

5.根据权利要求1所述的室内定位方法，其特征在于，执行采用位置加权算法集成所述第一位置估计和所述第二位置估计来计算最终位置估计的过程中，包括：

将所述第一位置偏差和所述第二位置偏差的数值分别转换为第一指数误差概率和第二指数误差概率；

基于所述第一指数误差概率和所述第二指数误差概率，分别对所述第一位置估计和所述第二位置估计分配权重值，并基于权重值集成所述第一位置估计和所述第二位置估计，计算最终位置估计。

6.根据权利要求5所述的室内定位方法，其特征在于，执行基于权重值集成所述第一位置估计和所述第二位置估计的过程中，根据以下公式进行最终位置估计的计算：

X_i＝W_R(i)·pre_rf_x(i)+W_K(i)·pre_wknn_x(i)

Y_i＝W_R(i)·pre_rf_y(i)+W_K(i)·pre_wknn_y(i)

pre_loc(i)＝[X_i，Y_i]

其中，所述pre_rf_x(i)为随机森林回归模型在第i个位置上的第一位置估计的x标签，所述pre_rf_y(i)为随机森林回归模型在第i个位置上的第一位置估计的y标签，所述pre_wknn_x(i)为KD树优化的WKNN模型在第i个位置上的第二位置估计的x标签，所述pre_wknn_y(i)为KD树优化的WKNN模型在第i个位置上的第二位置估计的y标签，所述W_R(i)为随机森林回归模型在第i个位置上的权重值，所述W_K(i)为KD树优化的WKNN模型在第i个位置上的权重值，所述pre_loc(i)为第i个测试点的最终位置估计。

7.根据权利要求5所述的室内定位方法，其特征在于，执行将所述第一位置偏差和所述第二位置偏差的数值分别转换为第一指数误差概率和第二指数误差概率的过程中，根据以下公式进行转换：

rf_probs(i)＝e^-rf_error(i)

wknn_probs(i)＝e^{-wknn_error(i)}

8.根据权利要求7所述的室内定位方法，其特征在于，执行基于所述第一指数误差概率和所述第二指数误差概率分别对所述第一位置估计和所述第二位置估计分配权重值的过程中，采用以下公式进行权重值分配：

9.一种基于CSI的室内定位系统，其特征在于，包括离线训练模块和在线匹配模块；

所述在线匹配模块用于获取室内待定位区域测试点上的测试CSI特征数据包，并集成所述随机森林回归模型和所述KD树优化的WKNN模型在每个位置上输出的不同结果来计算最终位置估计。