CN111428640A

CN111428640A - 一种基于图像的地点识别方法

Info

Publication number: CN111428640A
Application number: CN202010211561.1A
Authority: CN
Inventors: 刘阳; 刘珂
Original assignee: Anhui Guoli Intelligent Technology Co ltd
Current assignee: Anhui Guoli Intelligent Technology Co ltd
Priority date: 2020-03-24
Filing date: 2020-03-24
Publication date: 2020-07-17

Abstract

本发明涉及一种基于图像的地点识别方法，包括以下步骤：1)采集图像、初步提取特征；2)初始化；3)求解特征提取权重矩阵；4)对特征空间进行变换；5)随机生成隐藏层映射函数的输入权重向量与输入偏置；6)生成隐藏层输出函数；7)生成隐藏层输出矩阵；8)初始化输出权重矩阵；9)输出权重矩阵迭代优化；10)使用训练完成的预测模型识别地点类型。该发明仅采用了四层的人工神经网络，相比于深度神经网络具有更小的模型体积、更快的训练速度，同时引入了特征提取层以保证特征提取的性能，提升了分类准确度。

Description

一种基于图像的地点识别方法

技术领域

本发明属于机器人技术领域，特别是涉及一种基于图像的地点识别方法。

背景技术

目前，随着人工智能的发展，移动智能机器人被广泛地应用于工业、军事和服务等领域，且发挥着越来越重要的作用。因此，对智能机器人认知环境的能力提出了越来越高的要求。机器人只有在知道自身位置和工作环境的前提下，才能安全有效地进行自主运动。视觉系统能够为机器人提供最丰富的感知信息，同时也最接近人类感知环境的方式。近年来，基于视觉的机器人自定位问题吸引了大量的研究人员，同时也取得了丰硕的研究成果。对于这类问题，往往称之为地点分类问题。

在文献“CN103810500A一种基于有监督学习概率主题模型的地点图像识别方法”中提出了一种基于有监督学习概率主题模型的地点图像识别方法，目的在于更好地解决地点图像识别中由于不同光照和角度、事物变化和运动导致的不确定问题，以及原有LDA模型中随主题数目增加图像的识别率出现过拟合现象进而影响图像的识别率的问题。对于特征提取部分，采用了SIFT对图像局部特征进行检测并生成“词袋”特征，这种人工提取特征的手段具有一定的局限性，其区分性往往较弱。文献“CN110209859A地点识别及其模型训练的方法和装置以及电子设备”公开了一种地点识别及其模型训练的方法和装置、计算机可读存储介质以及电子设备。方法包括：基于CNN模型的第一部分提取样本图像的局部特征；基于CNN模型的第二部分将局部特征聚合成具有第一维数的特征向量；基于CNN模型的第三部分得到特征向量的压缩表示向量，压缩表示向量具有小于第一维数的第二维数；以及以使得多个图像对应的压缩表示向量之间的距离最小化为目标，调整第一至第三部分的模型参数，直至得到满足预设条件的CNN模型。利用CNN模型可以显著提高提取特征的效率，然而深度神经网络的引入不可避免地导致运算速度慢、耗费资源等问题。相关的工作可见“CN107967457A一种适应视觉特征变化的地点识别与相对定位方法及系统”与“CN102609719A基于改进概率主题模型的地点图像识别方法”。

发明内容

本发明克服现有技术的不足，提出一种基于图像的地点识别方法，其过程如下：

步骤1、采集大量的场景图像，得到一系列图像对

进行初步特征提取得到

的特征向量集合，即样本集合

对

进行标记，得到对应的类别标签

其中，

为N_i维行向量，

为N_o维行向量，N_i为初步提取特征的维度，N_o为地点类别的数量，因此类别集合为

如果样本x_k的类别为

中的第c类，则y_k的第c个元素为1，其余为0；

表示实数域，k为1到n的正整数，n为样本总数，N_o与N_i也分别表示输出层与输入层神经元数量，为正整数；

步骤2、初始化：令迭代步t＝0，根据实际情况人工设定最大迭代步T为大于1的正整数，人工设定拉式乘子λ>0为正实数，隐藏层节点数N_h>0为大于3的正整数，设定损失系数C>0为正实数；令t＝0步的中间变量v_t,d_t＝0；

步骤3、求解特征提取权重矩阵α：

其中，上标T表示矩阵转制，I为单位阵，

为原始样本矩阵；

步骤4、对特征空间进行变换：

其中，

为变换后的样本矩阵；

步骤5、随机生成输入权重向量与输入偏置：

随机生成隐藏层映射函数的输入权重向量

与输入偏置

如下：随机生成N_h个a，得到

随机生成N_h个b，得到

步骤6、计算隐藏层输出函数：

其中，G(a,b,x)为激活函数，x表示样本；

步骤7、计算隐藏层输出矩阵H：

H＝[h(x₁),…,h(x_n)]^T

步骤8、初始化输出权重矩阵β_t：

β_t＝H^*Y

其中，

H^*表示H的伪逆矩阵；

步骤9、输出权重矩阵迭代优化：

首先令β_t+1＝(H^TH+λI)^-1(H^TY+λ(v_t+d_t)+β_t)，然后令

其中soft为软阈值函数；接着计算d_t+1＝d_t-(β_t+1-v_t+1)；最后令t自增1，如果t>T，则令

并跳至步骤10，否则跳至步骤9；

步骤10、将新的场景图像初步提取特征后得到其特征向量x，然后进行特征变换，得到变换后的样本

接着计算

即可获取该场景图像所对应的地点类别。

在上述方法中，其中，所涉及的激活函数G(a,b,x)为：

或者

其中，步骤1和10中初步特征提取方法采用自动编码器、或采用视觉词典。

其中，所述自动编码器包括至少一个卷积层和一个池化层。

发明在仅采用了四层的人工神经网络，相比于深度神经网络具有更小的模型体积、更快的训练速度，同时引入了特征提取层以保证特征提取的性能，提升了分类准确度。

附图说明

图1为本发明方法流程图；

具体实施方式

下面结合实例对本发明作进一步描述，但本发明的保护范围并不限于此。

如图1所示，本发明包括以下步骤：

步骤1、采集大量的场景图像，得到一系列图像

对

进行初步特征提取得到

的特征向量集合，即样本集合

对

进行标记，得到对应的类别标签

其中，

为N_i维行向量，

如果样本x_k的类别为

中的第c类，则y_k的第c个元素为1，其余为0；

步骤3、求解特征提取权重矩阵α：

其中，上标T表示矩阵转制，I为单位阵，

为原始样本矩阵；

步骤4、对特征空间进行变换：

其中，

为变换后的样本矩阵；

步骤5、随机生成输入权重向量与输入偏置：

随机生成隐藏层映射函数的输入权重向量

与输入偏置

如下：随机生成N_h个a，得到

随机生成N_h个b，得到

步骤6、计算隐藏层输出函数：

其中，G(a,b,x)为激活函数，x表示样本；

步骤7、计算隐藏层输出矩阵H：

H＝[h(x₁),…,h(x_n)]^T

步骤8、初始化输出权重矩阵β_t：

β_t＝H^*Y

其中，

H^*表示H的伪逆矩阵；

步骤9、输出权重矩阵迭代优化：

首先令β_t+1＝(H^TH+λI)^-1(H^TY+λ(v_t+d_t)+β_t)，然后令

并跳至步骤10，否则跳至步骤9；

接着计算

即可获取该场景图像所对应的地点类别。

在上述方法中，优选地，所涉及的激活函数G(a,b,x)为：

再次优选地，所涉及的激活函数G(a,b,x)为：

进一步，优选地，步骤1和10中初步特征提取方法采用自动编码器。

再进一步，优选地，步骤1和10中初步特征提取方法采用视觉词典。

最后优选地，所述自动编码器包括至少一个卷积层和一个池化层。

具体实施中，可以根据需求确定地点类别，例如，如果目的是对家庭中的地点进行识别，则地点类别可以包括：厨房、卧室、客厅、走廊、阳台等。

提供以上实施例仅仅是为了描述本发明的目的，而并非要限制本发明的范围。本发明的范围由所附权利要求限定。不脱离本发明的精神和原理而做出的各种等同替换和修改，均应涵盖在本发明的范围之内。

Claims

1.一种基于图像的地点识别方法，其特征在于，包括以下步骤：

步骤1、采集大量的场景图像，得到一系列图像

对

进行初步特征提取得到

的特征向量集合，即样本集合

对

进行标记，得到对应的类别标签

其中，

为N_i维行向量，

如果样本x_k的类别为

中的第c类，则y_k的第c个元素为1，其余为0；

步骤3、求解特征提取权重矩阵α：

其中，上标T表示矩阵转制，I为单位阵，

为原始样本矩阵；

步骤4、对特征空间进行变换：

其中，

为变换后的样本矩阵；

步骤5、随机生成输入权重向量与输入偏置：

随机生成隐藏层映射函数的输入权重向量

与输入偏置

如下：随机生成N_h个a，得到

随机生成N_h个b，得到

步骤6、计算隐藏层输出函数：

其中，G(a,b,x)为激活函数，x表示样本；

步骤7、计算隐藏层输出矩阵H：

H＝[h(x₁),…,h(x_n)]^T

步骤8、初始化输出权重矩阵β_t：

β_t＝H^*Y

其中，

H^*表示H的伪逆矩阵；

步骤9、输出权重矩阵迭代优化：

首先令β_t+1＝(H^TH+λI)^-1(H^TY+λ(v_t+d_t)+β_t)，然后令

并跳至步骤10，否则跳至步骤9；

接着计算

即可获取该场景图像所对应的地点类别。

2.如权利要求1所述的一种基于图像的地点识别方法，其特征在于，所涉及的激活函数G(a,b,x)为：

3.如权利要求1所述的一种基于图像的地点识别方法，其特征在于，所涉及的激活函数G(a,b,x)为：

4.如权利要求1、2、3所述的任意一种基于图像的地点识别方法，其特征在于，

步骤1和10中初步特征提取方法采用自动编码器。

5.如权利要求1、2、3所述的任意一种基于图像的地点识别方法，其特征在于，

步骤1和10中初步特征提取方法采用视觉词典。

6.如权利要求4所述的任意一种基于图像的地点识别方法，其特征在于，

所述自动编码器包括至少一个卷积层和一个池化层。