CN110837806B

CN110837806B - 一种基于深度卷积记忆网络的室内定位方法

Info

Publication number: CN110837806B
Application number: CN201911093298.4A
Authority: CN
Inventors: 张振宇
Original assignee: Liaoning Institute of Science and Technology
Current assignee: Liaoning Institute of Science and Technology
Priority date: 2019-11-11
Filing date: 2019-11-11
Publication date: 2020-07-28
Anticipated expiration: 2039-11-11
Also published as: CN110837806A

Abstract

本发明公开一种基于深度卷积记忆网络的室内定位方法，属于电子信息技术领域，该方法采用一维卷积神经网络代替二维卷积神经网络，并考虑不同隐含层的重要程度，采用自适应滤波器使得每个隐含层具备“遗忘”功能，在有效提取图像的空间特征的同时有效提取图像的空间特征的时间联系，提高了基于图像的室内定位系统的鲁棒性。本发明同时开发了一维卷积加速器和自适应滤波器加速器，使得在资源有限的嵌入式平台上实现深度记忆卷积神经网络成为可能，提升了硬件的吞吐率，降低了资源占用率。

Description

一种基于深度卷积记忆网络的室内定位方法

技术领域

本发明涉及电子信息技术领域，尤其涉及一种基于深度卷积记忆网络的室内定位方法。

背景技术

随着科学技术的不断进步，精确的位置信息对于人类或其他智能体变得越来越重要。全球卫星定位系统提供了有效的室外定位手段，成为出行导航的必备工具。但是卫星导航也有其不足和脆弱性，在高楼林立的都市峡谷以及大型室内场馆，接收机无法接收到多颗卫星的视线信号，定位精度会大幅度降低，甚至无法定位。然而，大型公共场馆内部建筑结构复杂、人员密度高，对室内定位的需求十分迫切，位置服务的“最后一公里”问题日益突出。

A-GPS、红外线、超声波和WLAN定位都可以用来进行室内定位，但是均有其不足之处。A-GPS在启动的时候能够接收到GPRS传来的辅助定位信息，但是在室内无法接收到卫星信号的情况下，还是无法完成精确定位；另外，A-GPS需要通过GPRS来接收辅助定位信息，导航仪需要另外增加一个GPRS模块，势必会增加制造成本，而且A-GPS定位必须通过多次网络传输，占用了大量的通信资源；最后，A-GPS尽管能够实现室内定位，但是室内信号严重衰减降低了定位精度。红外线只能视距传输，穿透性差，当标识被遮挡时就无法正常工作，也极易受灯光和烟雾等环境因素影响，在建筑物内不能很好的工作。超声波在空气中严重衰减，且测距受多径效应和非视距传播影响很大，需要增加硬件设施，成本过高。WLAN根据接收到信号强度或信噪比等进行定位，但需要额外的基础设施；WLAN信号容易受到流动人群干扰，设备本身存在信号差异性导致精度降低。

目前智能手机均安装有高清摄像头，根据场景图像采用神经网络预测摄像头位姿，对于室内和都市峡谷等卫星导航不准确甚至失效环境下的导航是非常有意义的。英国剑桥大学的科学家Alex Kendall等开发了一种鲁棒的实时单目六自由度重定位系统，该系统训练一个卷积神经网络，该系统模型采用GoogLeNet,包含22个卷积层、特征向量层和全连接回归层，可以端到端的从RGB图像中回归出六自由度位姿，而不需要其他额外的处理。虽然卷积神经网络可以学习和提取各类空间特征，但对于长距离时序数据无能为力。

长短时记忆网络则具备一定的长距离时序数据的信息挖掘能力，输入的数据越长，所含信息量越大。卷积神经网络与长短时记忆网络的融合模型即能有效的提取空间特征，也能够挖掘空间特征之间的时间联系，并被应用于行为预测和语音识别。虽然上述融合模型具有较长短时记忆网络更强的建模能力，但由于训练融合模型经常采用BPTT算法，训练速度缓慢并存在梯度消失问题。

前馈序列记忆神经网络包含输入层、隐含层和输出层，每一个隐含层包含一个记忆块，记忆块用来存储每帧输入的历史信息和未来信息，隐层与记忆块共同构成双向前馈序列记忆神经网络层，可以有效的对输入数据中的长时相关性进行建模，因此可以获得更好的性能。前馈记忆神经网络虽然每个隐藏层均配有一个记忆块，但是并没有考虑到不同隐藏层的重要程度，且隐藏层采用全连接，存在很大弊端，即样本必须面面俱到，否则容易出现预测失败，因而与卷积神经网络相比，其空间特征提取能力较弱。

发明内容

针对上述现有技术的不足，本发明提供一种基于深度卷积记忆网络的室内定位方法。

为解决上述技术问题，本发明所采取的技术方案是：一种基于深度卷积记忆网络的室内定位方法，其原理框图如图2所示，其流程如图1所示，包括如下步骤：

步骤1：采集一组室内图像数据集，并进行预处理；

所述的图像预处理包括：均匀纵横比、图像缩放、降维、数据扩充、规范化；

所述均匀纵横比是通过检查输入图像是否为正方形，并选择图像中间的方形部分进行适当地裁剪，以确保图像具有相同的大小和纵横比；

所述图像缩放是指采用图像金字塔方法进行降采样，再将降采样后的图像放大到与降采样前的图像大小一致；

所述降维是指将图像的RGB三通道变为单个灰度通道，并采用主成分分析PCA算法实现降维，使得神经网络的性能保持不变，或者使训练问题更容易处理；

所述数据扩充是指采用缩放、旋转、监督式扣取和色彩抖动实现图像数据扩充，使得神经网络识别数据集中不需要特征的可能性降低，增强神经网络的鲁棒性；

所述规范化是指通过从每个像素中减去平均值，然后将结果除以标准偏差来完成的，规范化后的数据分布类似于以零为中心的高斯曲线，确保每个输入像素具有相似数据分布，使得神经网络在训练时可以更快地收敛。

步骤2：将预处理后的图像数据集的二维像素数据通过RESHAPE算法进行降维，得到一维数据；

步骤3：搭建一维深度卷积记忆网络架构，如图3所示，输入步骤2得到的一维数据，采用最小均值误差算法(LMS)计算各卷积层的重要性因子，若误差不满足要求则采用端到端方法训练一维深度卷积记忆网络，得到神经网络权值；

步骤3.1：以[0,1]范围内随机数初始化各卷积层的权值和重要性因子；

步骤3.2：将一维卷积神经网络中各池化层的输出作为自适应滤波器的输入，将一维卷积神经网络最后一级全连接层的输出通过RESHAPE算法将一维数据转换成二维数据；

步骤3.3：然后将自适应滤波器的输出与步骤3.2得到的由全连接层输出转化而来的二维数据进行相减，误差反馈给自适应滤波器；

步骤3.4：由自适应滤波器通过最小均值误差算法(LMS)计算各卷积层的重要性因子；

步骤3.5：重复步骤3.2至步骤3.4直到误差满足小于设定的阈值为止；若重复次数达到预定值，误差仍然不能满足要求，则执行步骤3.6至步骤3.7；

步骤3.6：保持各卷积层的重要性因子不变，采用端到端方法训练一维深度卷积记忆网络，更新各卷积层权值；计算自适应滤波器的输出与一维卷积神经网络全连接层输出转化成的二维数据之间的误差，误差反馈给自适应滤波器；

步骤3.7：重复执行步骤3.6，直到误差小于设定的阈值停止迭代；

所述的自适应滤波器和一维卷积神经网络由硬件加速器实现，所述硬件加速器包括：嵌入式平台、一维卷积加速器、自适应滤波器加速器和控制器，其结构如图4所示；

所述嵌入式平台，由ARM和FPGA构成，主要实现一维深度卷积记忆网络的初始化、误差计算、端到端训练、数据的浮点到定点转换、权值和重要性因子的CSD编码，并根据迭代流程将数据、权值和重要性因子传递给对应模块的功能；

所述一维卷积加速器，由输入缓存、参数缓存、一维卷积器、池化层和输出缓存构成，主要实现一维数据集的卷积操作，其结构如图6所示；

所述一维卷积加速器的工作过程如下：

S1：设置步进距离S；

S2：从ARM控制器读入16位二进制数据和CSD编码的权值，二进制数据长度与权重值相同均为L；

S3：一维卷积实现二进制数据和CSD编码权值的乘累加功能，如图7所示，乘法可根据CSD编码对二进制数移位相加实现，乘累加和为64位，在每一级乘法和加法后面均增加流水线以提高吞吐率；

S4：池化层采用均值池化法，对2^M个乘累加值求和，M为整数，求和结果右移M位即可得到均匀池化值，并传递给输出缓存；

S5：从控制器中读取S个数据，与原数据的前L-S数据共同构成新数据，重复执行S2到S4，直到全部数据读完；

不同卷积核的卷积过程与上述步骤完全相同，只是权值不同。

所述自适应滤波器加速器，由输入缓存、参数缓存、自适应滤波器和输出缓存构成，所述自适应滤波器由N路并行滤波器构成，对于一个时钟周期，将同时处理N个输入值，并同时输出N个滤波值，因此滤波吞吐率提高了N倍，自适应滤波器的并行转置实现方式如图8所示；

所述N路并行滤波器的每一路都由M阶滤波器构成，将M个抽头系数同时传递每一路采样值，这样每一路中的M个乘法可以在一个周期内完成，进一步提升了自适应滤波器加速器的工作速度，其N路输出的表达式如下：

y(Nk)＝x(Nk)h(0)+x(Nk-1)h(1)+...+x(Nk-M+2)h(M-2)+x(Nk-M+1)h(M-1)

y(Nk+1)＝x(Nk+1)h(0)+x(Nk)h(1)+...+x(Nk-M+3)h(M-2)+x(Nk-M+2)h(M-1)

......

y(Nk+N-2)＝x(Nk+N-2)h(0)+x(Nk+N-3)h(1)+...+x(Nk+N-M)h(M-2)+x(Nk+N-M-1)h(M-1)

y(Nk+N-1)＝x(Nk+N-1)h(0)+x(Nk+N-2)h(1)+...+x(Nk+N-M+1)h(M-2)+x(Nk+N-M)h(M-1)

其中，x(Nk)、x(Nk+1)……x(Nk+N-2)、x(Nk+N-1)为第k个采样周期的N个输入采样值，y(Nk)、y(Nk+1)……y(Nk+N-2)、y(Nk+N-1)为与输入采样值对应的有N个输出，h(i),i＝0,1,...,M-1为M抽头的滤波器系数。

所述控制器以双向控制信号线连接一维卷积加速器和自适应滤波器加速器，采用摩尔状态机分别使能一维卷积加速器和自适应滤波器加速器。

所述摩尔状态机包括Reset、IDLE、1Dconv、Adap_Filter和Out五个状态，其控制逻辑如图5所示，状态采用独热码编码，如下：

Reset状态：系统上电，自动复位各加速器模块和控制器；

IDLE状态：首先，将数据长度传递给控制器，从ARM接收二进制数据并传递给一维卷积神经网络模块的输入缓存，输出数据准备好信号给控制器；

1Dconv状态：从ARM读取权值保存到一维卷积神经网络模块的参数缓存中；其次，根据权值的CSD编码对二进制数据移位相加实现乘法，并计算累加和；接下来，采用均值池化方法实现池化层，将池化结果存储于输出缓存；最后，输出卷积完成信号给控制器；

Adap_Filter状态：从ARM读取二进制重要性因子保存到输入缓存中，并从一维卷积加速器接收各池化层结果；滤波器为并行架构，各支路以转置方式实现；滤波值保存到输出缓存，并输出滤波完成信号给控制器；

Out状态：输出数据准备好，输出重要性因子和权值至ARM。

所述控制器的工作原理如下：

(1)控制Reset状态：

系统上电后，令rst＝‘1’,迭代计数器iter_cnt＝‘0’，转入IDLE状态；

(2)控制IDLE状态：

从ARM接收二进制数据，若接收数据完成令data_rdy＝‘1’,否则令data_rdy＝‘0’；

(3)控制1Dconv状态：

若it_limit＝’0’，令迭代计数器自动递增，iter_cnt＝iter_cnt+1；从ARM读取CSD编码权值，同时从一维卷积加速器模块读取卷积是否完成信号，若完成conv_rdy＝‘1’，状态转移至Adap_Filter状态；否则，conv_rdy＝‘0’；

若it_limit＝’1’，首先从ARM读取一维神经网络权值并传递给一维卷积神经网络模块；如果conv_rdy＝‘1’则将卷积结果传递给ARM，时通知ARM采用端到端方法训练一维卷积神经网络；

训练完成后ARM将误差传递给控制器，若误差小于设定阈值，err_ok＝’1’,状态转移至Out状态，否则继续训练直到误差满足要求；

(4)控制Adap_Filter状态：

从ARM读取误差和CSD编码重要性因子，如果误差小于设定阈值，err_ok＝’1’,状态转移至Out状态；如果迭代次数没有达到预定次数且误差不满足要求，it_limit＝’0’且err_ok＝’0’,则保持在Adap_Filter状态不变，输出滤波值到ARM，同时通知ARM采用最小均方根(LMS)法计算重要性因子；从ARM读取误差并传递给控制器，如果迭代次数达到预定次数且误差仍然不能满足要求，令it_limit＝’1’，状态转移至1Dconv状态；

(5)控制Out状态：

从输出缓存传递重要性因子和权值到ARM。

步骤4：将步骤3训练后得到的深度卷积记忆网络移植到嵌入式平台；

步骤5：输入一张待室内定位的图片，得出定位结果。

采用上述技术方案所产生的有益效果在于：

1、本发明以一维卷积神经网络代替前馈神经网络，并考虑到不同隐含层的重要程度，采用自适应滤波器使得每个隐含层具备“遗忘”功能，既能有效提取图像的空间特征，也能有效提取空间特征的时间联系，提高了基于图像的室内定位系统的鲁棒性。

2、本发明提供的硬件加速器的解决方案，使得在资源有限的嵌入式平台上实现深度记忆卷积神经网络成为可能，提升了硬件的吞吐率，降低了资源占用率。

附图说明

图1为本发明一种基于深度卷积记忆网络的室内定位方法流程图；

图2为本发明室内定位方法的原理框图；

图3为本发明一维深度卷积记忆网络架构图；

图4为本发明硬件加速器架构图；

图5为本发明摩尔状态机控制逻辑图；

图6为本发明一维卷积神经网络加速器结构框图；

图7为本发明一维卷积硬件实现图；

图8为本发明自适应滤波器的并行转置实现方式图；

图9为本发明实施例中输入的待室内定位的图片。

具体实施方式

下面结合附图和实施例，对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明，但不用来限制本发明的范围。

如图2所示，本实施例的方法如下所述。

步骤1：采集一组室内图像数据集，并进行预处理；本实施例采用的是CambridgeLandmarks数据集中的King College场景数据集，采用均匀纵横比、图像缩放、降维、数据扩充、规范化对King College场景数据集进行预处理。

所述降维是指将图像的RGB三通道变为单个灰度通道，并采用主成分分析PCA算法实现降维，使得神经网络的性能保持不变，或者使训练问题更容易处理时；

步骤3.5：设置误差阈值为10^-10，重复步骤3.2至步骤3.4直到误差满足小于10^-10为止；若重复次数达到预定值，误差仍然不能满足要求，则执行步骤3.6至步骤3.7；

步骤3.7：重复执行步骤3.6，直到误差小于10^-10停止迭代；

所述一维卷积加速器的工作过程如下：

S1：设置步进距离S＝2；

S2：从ARM控制器读入16位二进制数据和CSD编码的权值，二进制数据长度与权重值相同均为L＝256；

S4：池化层采用均值池化法，对2⁴个乘累加值求和，求和结果右移4位即可得到均匀池化值，并传递给输出缓存；

S5：从控制器中读取2个数据，与原数据的前L-S数据共同构成新数据，重复执行S2到S4，直到全部数据读完；

y(Nk)＝x(Nk)h(0)+x(Nk-1)h(1)+...+x(Nk-M+2)h(M-2)+x(Nk-M+1)h(M-1)

y(Nk+1)＝x(Nk+1)h(0)+x(Nk)h(1)+...+x(Nk-M+3)h(M-2)+x(Nk-M+2)h(M-1)

......

y(Nk+N-2)＝x(Nk+N-2)h(0)+x(Nk+N-3)h(1)+...+x(Nk+N-M)h(M-2)+x(Nk+N-M-1)h(M-1)

y(Nk+N-1)＝x(Nk+N-1)h(0)+x(Nk+N-2)h(1)+...+x(Nk+N-M+1)h(M-2)+x(Nk+N-M)h(M-1)

Reset状态：系统上电，自动复位各加速器模块和控制器；

Out状态：输出数据准备好，输出重要性因子和权值至ARM。

所述控制器的工作原理如下：

(1)控制Reset状态：

(2)控制IDLE状态：

(3)控制1Dconv状态：

(4)控制Adap_Filter状态：

(5)控制Out状态：

从输出缓存传递重要性因子和权值到ARM。

步骤5：输入一张待室内定位的图片如图9所示，得出定位结果用三维位置和姿态四元数表示为：[-10.880502 -19.510105 1.592050 0.699503 0.614701 -0.2491060.265012]。

Claims

1.一种基于深度卷积记忆网络的室内定位方法，其特征在于包括如下步骤：

步骤1：采集一组室内图像数据集，并进行预处理；

步骤3：搭建一维深度卷积记忆网络架构，输入步骤2得到的一维数据，采用最小均值误差算法LMS计算各卷积层的重要性因子，若误差不满足要求则采用端到端方法训练一维深度卷积记忆网络，得到神经网络权值；

步骤3.4：由自适应滤波器通过最小均值误差算法LMS计算各卷积层的重要性因子；

步骤5：输入一张待室内定位的图片，得出定位结果。

2.根据权利要求1所述的一种基于深度卷积记忆网络的室内定位方法，其特征在于步骤1所述的图像预处理包括：均匀纵横比、图像缩放、降维、数据扩充、规范化；

3.根据权利要求1所述的一种基于深度卷积记忆网络的室内定位方法，其特征在于步骤3所述的自适应滤波器和一维卷积神经网络由硬件加速器实现，所述硬件加速器包括：嵌入式平台、一维卷积加速器、自适应滤波器加速器和控制器；

所述嵌入式平台，由ARM和FPGA构成，实现一维深度卷积记忆网络的初始化、误差计算、端到端训练、数据的浮点到定点转换、权值和重要性因子的CSD编码，并根据迭代流程将数据、权值和重要性因子传递给对应模块的功能；

所述一维卷积加速器，由输入缓存、参数缓存、一维卷积器、池化层和输出缓存构成，实现一维数据集的卷积操作；

所述自适应滤波器加速器，由输入缓存、参数缓存、自适应滤波器和输出缓存构成，所述自适应滤波器由N路并行滤波器构成，对于一个时钟周期，将同时处理N个输入值，并同时输出N个滤波值，因此滤波吞吐率提高了N倍；

4.根据权利要求3所述的一种基于深度卷积记忆网络的室内定位方法，其特征在于所述一维卷积加速器的工作过程如下：

S1：设置步进距离S；

S3：一维卷积实现二进制数据和CSD编码权值的乘累加功能，乘法可根据CSD编码对二进制数移位相加实现，乘累加和为64位，在每一级乘法和加法后面均增加流水线以提高吞吐率；

5.根据权利要求3所述的一种基于深度卷积记忆网络的室内定位方法，其特征在于所述N路并行滤波器的每一路都由M阶滤波器构成，将M个抽头系数同时传递每一路采样值，这样每一路中的M个乘法可以在一个周期内完成，进一步提升了自适应滤波器加速器的工作速度，其N路输出的表达式如下：

y(Nk)＝x(Nk)h(0)+x(Nk-1)h(1)+...+x(Nk-M+2)h(M-2)+x(Nk-M+1)h(M-1)

y(Nk+1)＝x(Nk+1)h(0)+x(Nk)h(1)+...+x(Nk-M+3)h(M-2)+x(Nk-M+2)h(M-1)

......

y(Nk+N-2)＝x(Nk+N-2)h(0)+x(Nk+N-3)h(1)+...+x(Nk+N-M)h(M-2)+x(Nk+N-M-1)h(M-1)

y(Nk+N-1)＝x(Nk+N-1)h(0)+x(Nk+N-2)h(1)+...+x(Nk+N-M+1)h(M-2)+x(Nk+N-M)h(M-1)

其中，x(Nk)、x(Nk+1)……x(Nk+N-2)、x(Nk+N-1)为第k个采样周期的N个输入采样值，y(Nk)、y(Nk+1)……y(Nk+N-2)、y(Nk+N-1)为与输入采样值对应的有N个输出，h(i)为M抽头的滤波器系数，i＝0,1,...,M-1。

6.根据权利要求3所述的一种基于深度卷积记忆网络的室内定位方法，其特征在于所述摩尔状态机包括Reset、IDLE、1Dconv、Adap_Filter和Out五个状态，状态采用独热码编码，如下：

Reset状态：系统上电，自动复位各加速器模块和控制器；

Out状态：输出数据准备好，输出重要性因子和权值至ARM。

7.根据权利要求3所述的一种基于深度卷积记忆网络的室内定位方法，其特征在于所述控制器的工作原理如下：

(1)控制Reset状态：

(2)控制IDLE状态：

(3)控制1Dconv状态：

若it_limit＝’1’，首先从ARM读取一维神经网络权值并传递给一维卷积神经网络模块；如果conv_rdy＝‘1’则将卷积结果传递给ARM，同时通知ARM采用端到端方法训练一维卷积神经网络；

(4)控制Adap_Filter状态：

从ARM读取误差和CSD编码重要性因子，如果误差小于设定阈值，err_ok＝’1’,状态转移至Out状态；如果迭代次数没有达到预定次数且误差不满足要求，it_limit＝’0’且err_ok＝’0’,则保持在Adap_Filter状态不变，输出滤波值到ARM，同时通知ARM采用最小均方根LMS法计算重要性因子；从ARM读取误差并传递给控制器，如果迭代次数达到预定次数且误差仍然不能满足要求，令it_limit＝’1’，状态转移至1Dconv状态；

(5)控制Out状态：

从输出缓存传递重要性因子和权值到ARM。