CN105550687A - 一种基于isa模型的rgb-d图像的多通道融合特征提取方法 - Google Patents

一种基于isa模型的rgb-d图像的多通道融合特征提取方法 Download PDF

Info

Publication number
CN105550687A
CN105550687A CN201510873318.5A CN201510873318A CN105550687A CN 105550687 A CN105550687 A CN 105550687A CN 201510873318 A CN201510873318 A CN 201510873318A CN 105550687 A CN105550687 A CN 105550687A
Authority
CN
China
Prior art keywords
depth
color
rgb
image
channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510873318.5A
Other languages
English (en)
Inventor
杨淑媛
张金剑
龙贺兆
焦李成
刘红英
马文萍
熊涛
刘芳
侯彪
刘志
刘林瓒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN201510873318.5A priority Critical patent/CN105550687A/zh
Publication of CN105550687A publication Critical patent/CN105550687A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/192Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
    • G06V30/194References adjustable by an adaptive method, e.g. learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种RGB-D图像多通道融合特征提取方法。其步骤为:(1)使用Kinect获取数据,将用于训练的RGB-D图像分为彩色可见光,彩色深度,灰度深度三个通道。(2)分别对每个通道内图像数据进行分块,零均值化和白化操作。(3)对每个通道数据依次训练第一层和第二层独立子空间ISA网络。(4)利用RGB-D图像的三通道特征构造融合空间。(5)利用训练好的ISA网络提取三个通道的特征(6)利用构造好的融合空间得到RGB-D图像的多通道融合特征。本发明可以用于互联网和安防等行业中对人体姿态,动作和行为的识别。

Description

一种基于ISA模型的RGB-D图像的多通道融合特征提取方法
技术领域:
本发明涉及图像处理领域,尤其涉及一种对RGB-D图像进行特征提取的方法,可广泛用于互联网和安防等领域。
背景技术:
在计算机视觉和机器学习领域,近几年不断涌现出了许多新进展。从神经科学出发,对图像进行多层次特征抽取,进行线性或非线性转换,并建立区域层次结构对特征进行提取。在机器人自主导航领域,使用多种传感器后进行多特征融合已经是该领域的研究热点问题并且取得了良好的效果。
本发明利用深度学习理论提取RGB-D图像的多层次特征。深度学习理论的动机在于模拟人脑解释如图像、声音和文本等数据。随着深度学习理论的逐渐成熟,基于深度学习的语音和图像识别在识别精度和效率上有了很大突破。
常用于针对RGB图像的特征提取方法有分梯度SIFT(尺度不变特征转换)、PCA-SIFT(主成分分析-尺度不变特征转换)和GLOH等。针对深度图像的特征提取算法则并不多见,实际中的算法多使用彩色图像。独立子空间分析ISA是在独立分量分析ICA基础上建立起来的,比ICA更能反映出数据的本质特征,所提取的特征具有更好的不变性,并且模型训练速度更快。
发明内容:
本发明的目的是提出一种新的基于RGB-D图像的多通道融合特征提取方法,充分挖掘彩色和深度信息。应用深度学习理论,对异质图像进行特征学习,并运用有效融合手段,设计出基于RGB-D图像的特征提取方法,对RGB-D图像进行有效描述。
为了实现上述目的,本发明首先使用Kinect获取RGB-D图像,通过图像增强技术,得到彩色可见光图,彩色深度图与灰度深度图作为三通道图像。分别进行分块和预处理,采用两层堆栈ISA模型实现多层次特征提取。最后再使用度量学习构造融合空间,对三通道特征进行融合,从而得到RGB-D图像的特征描述子。本发明的具体步骤描述如下。
(1)输入所有RGB-D图像(用于训练的数据和用于特征提取的数据),彩色图和深度图均设置为320*240,30fbps。其中彩色图直接使用,将深度图的深度值转为彩色深度图和灰度深度图并用RGB模型表示,得到三通道图像。
(2)对所有数据都分块,分块可以根据实际情况选择时间和空间维度是否重叠。
(3)对所有数据零均值化和白化,得到处理好的用于训练和用于提取特征的三通道数据。
(4)分别对三通道用于训练的数据随机选取,训练堆叠ISA网络。先训练第一层,之后固定第一层,输入相同的数据,得到输出后零均值化和白化,输入第二层网络进行训练。得到该通道训练好的堆叠ISA网络。共进行3次,对每一通道专门训练各自的网络。
(5)使用度量学习方法构造转换矩阵。输入用于训练的数据,使用训练好的三通道堆叠ISA网络,将其输出作为样本,对于相同RGB-D视频的三通道高层特征作为相似样本,对于不同RGB-D视频的特征作为非相似样本,使用凸优化全局度量学习算法构造融合空间,训练转换矩阵M。在融合空间内将三通道特征合并。
(6)进行特征提取。对于用于特征提取的视频,进过(1)到(3)的处理,得到三通道数据,使用(4)中训练好的网络,得到三通道特征,使用(5)中得到的矩阵,得到融合特征。
本发明与现有方法相比,具有以下优点:
由于本发明使用特征学习方法,因此可以根据三种不同图像的不同特点进行特征提取。
由于本发明使用了特征融合方法,使得最终提取出来的特征包含了三个通道两种模式下的图像信息。
由于本发明使用了深度学习方法,可以使用海量无标签互联网数据训练网络,并且对数据进行多层转换,使特征提取更为有效。
附图说明:
图1是本发明的流程图。
图2是具体的分块示意图。
图3是两层ISA算法训练框图。
图4是ISA算法特征提取框图。
图5是度量学习算法框图。
具体实施方式:
步骤1:将获取的RGB-D图像增强为彩色可见光图,彩色深度图和灰度深度图。
1a)获取彩色和深度数据:
从3D体感摄影机Kinect直接获取的是彩色和深度图,也就是RGB-D图像,其中深度数据流设置为图像分辨率320*240,30fps。设置最小探测范围常量和最大探测范围常量,分别为900和4095,Kinect直接传来每个像素的深度值是视场中物体离摄像机的距离。深度数据流中深度帧的每个像素占16位、2个字节,每个像素的深度值占用了该16位中的13位。每个像素的深度值存储在第3至15位中,需要将人物索引位移除,得到深度数据,即:IDepth=FDepth>>3,其中FDepth表示传回的深度数据,IDepth表示深度帧中每个像素的深度值;
1b)获取灰度深度图Igdepth
将彩色影像的格式转化为BGR32类型,其中BGR32类型的每个像素占32位,R、G、B分别占8位,剩余8位留用。分别对深度帧的R、G、B三个通道的每个像素的深度值进行转换:
IGrey=(IDepth/4095)×255,
其中IGrey表示灰度深度图Igdepth单个通道的每个像素的灰度值;
1c)获取彩色深度图Icdepth。先将深度数据值IGrey转换为色调和饱和度HSI模型,之后转换为RGB模式显示深度数据。任何不在范围内的都设置为白色。
将深度值除以深度探测最大值4095,然后乘以255,赋值给H。即H=(IDepth/4095)×255。之后将HSI模型转为RGB模型,设S、I分量的值在[0,1]内,R、G、B分量的值也在[0,1]内,则由HSI模型向RGB模型的转换公式如下:
(1)当0°≤H<120°时,
B=I(1-S)
G=3I-(B+R)
(2)当120°≤H<240°时,
R=I(1-S)
B=3I-(R+G)
(3)当240°≤H<360°时,
R=3I-(B+R)
G=I(1-S)
1d)获取彩色可见光图像Icolor,设置为与深度图相同的320*240,30fps。
步骤2:对视频进行分块。
2a)对视频进行分块时总体上分为时间维度和空间维度。参见图2,其中时间维度为一维,空间维度为2维,将视频分成16×16×10的小块。对于视频每一帧长宽在分块后有剩余的情况,则将剩余部分舍弃;
2b)分块可以根据实际情况选择在时间和空间上是否重叠,重叠越多,精度越高,但是训练和测试时间就越长;
可以选择:
1、时间维度和空间维度都不重叠,如图2(a);
2、空间维度重叠而时间维度不重叠,如图2(b);
3、时间维度重叠,而空间维度不重叠,如图2(c);
4、时间维度和空间维度均重叠,如图2(d)。
2c)分别对彩色可见光图Icolor,彩色深度图Icdepth,灰度深度图Igdepth进行取块,并将每一个图像块拉成列向量x∈R2560,依次存放在矩阵中,其中v表示取块的数目,v=30000~60000。
步骤3:对视频数据预处理。
3a)求矩阵的去均值矩阵X:
X = X ~ - X ^ ,
其中表示矩阵的列均值矩阵,X表示矩阵的去均值矩阵,每一列的值为矩阵对应列的均值;
3b)采用PCA白化算法求得矩阵X的白化矩阵
步骤4:利用训练堆叠ISA网络。
4a)从中分离出彩色可见光图训练集Xcolor,彩色深度图训练集Xcdepth,灰度深度图训练集Xgdepth,并对每一训练集分别进行4b)到4e)的操作,训练相应的ISA网络权值W;
4b)利用训练集训练第一层ISA网络的权值W,W通过解决以下优化问题得到:
min Σ t = 1 T Σ i = 1 m Σ q = 1 k V i q ( Σ j = 1 2560 W q j x j t ) 2 s . t . WW T = I
其中,表示相应训练集第j的行,第t列的值,Wqj表示ISA网络权值矩阵W∈Rk×2560第q行,第j列的值,k表示ISA网络简单单元的数量,Viq表示ISA网络矩阵V∈Rm×k第i行,第q列的值,m是ISA网络复杂单元的数量,T表示训练集的列数,I表示单位矩阵。优化问题通过梯度下降算法求解。
4c)将相应训练集输入ISA网络,得到ISA网络的第一层输出值YISA1,并重复步骤3进行零均值和白化操作;
4d)拼接k个块的输出YISA1组成第二层的输入向量,xISA2=[yISA1;yISA2...yISAk],其中k=3~5,根据视频长度而定;
4e)重复步骤4b),利用xISA2,训练第二层ISA网络权值矩阵W2
步骤5:训练度量学习算法。
5a)构造相似标签集合S:
本发明将RGB-D视频的可见光图,彩色深度图,灰度深度图的第二层输出YISA2定义为同一类。对于n个RGB-D视频来讲,每个RGB-D视频分为三个通道:可见光图,彩色深度图和灰度深度图。通过三个ISA网络得到3n个特征,对属于同一个RGB-D视频的三通道特征定义成相似特征,对每个RGB-D视频来说有2个,由此构造相似特征标签矩阵S,S={(xi,xj)|xi和xj属于同一类};
5b)构造非相似标签集合D:
本发明将不同RGB-D视频的所有通道特征都定义成不同类别。对于n个RGB-D视频间的特征都是不相似的,对于一个特征来说有3(n-1)个,由此来构造不相似特征标签矩阵D,D={(xi,xj)|xi和xj不属于同一类};
5c)构造样本集合C:
对于所有RGB-D视频的所有特征,共有3n个,全部视为样本空间C={x1,x2,....,xn},其中n是样本的个数,包括彩色可见光图像特征xicolor,彩色深度图特征xicdepth,灰度深度图特征xigdepth
5d)训练度量学习算法。
对于度量矩阵A∈Rm×n,两个样本点x和y的距离平方表示为:
d A 2 ( x , y ) = | | x - y | | A 2 = ( x - y ) T A ( x - y ) ,
根据S中的相似约束对和D中的非相似约束对,该方法将距离度量学习表示成如下的凸优化问题:
max A ∈ R m × n Σ ( x i , x j ) ∈ D | | x i - x j | | A 2 s . t . A ≥ 0 , Σ ( x i , x j ) ∈ D | | x i - x j | | A 2 ≤ 1
其中,A≥0表示A为半正定矩阵,是为了保证两点距离不为负和三角不等式成立。
令A=MTM,则x和y的距离平方为通过求解凸规划问题得到特征空间到度量空间的转换矩阵M。
步骤6:使用特征提取网络:
6a)将输入的图像序列IRGB和IDepth使用步骤1,得到三通道图像Icolor,Icdepth,Igdepth
6b)将三通道图像使用步骤2得到分块的数据Xcolor,Xcdepth,Xgdepth
6c)对三通道使用步骤3预处理;
6d)对三通道数据Xcolor,Xcdepth,Xgdepth,分别输入步骤4训练好的网络,得到输出后,合并成矩阵X=[YISA2;YISA2;YISA2];
6e)对矩阵X使用步骤5中得到的转换矩阵M,转换到融合空间YMeric=XM;
6f)对于YMeric中单个的视频,彩色可见光图像特征为yicolor,彩色深度图特征为yicdepth,灰度深度图特征为yigdepth,合并得到单个RGB-D视频特征yRGBDi=[ycolor;ycdepth;ygdepth],对YMeric中所有视频,得到特征矩阵Y=[yRGBD1,yRGBD2...yRGBDn]。

Claims (3)

1.一种基于ISA模型的RGB-D图像的多通道融合特征提取方法,包含以下步骤:
(1)将获取的RGB-D图像增强为彩色图Icolor,彩色深度图Icdepth和灰度深度图Igdepth三通道图像;
(2)依次对彩色图Icolor,彩色深度图Icdepth和灰度深度图Igdepth从时间和空间维度进行分块,分块根据实际情况选择:时间和空间均重叠,时间重叠空间不重叠,时间不重叠空间重叠或时间和空间均不重叠。将数据块转为列向量x∈Rs,依次存放在矩阵中,其中s表示列向量的长度,v表示取块的数目,v=30000~60000;
(3)求矩阵的去均值矩阵X,并采用白化算法求得矩阵X的白化矩阵
(4)依次从中分离出彩色可见光图训练集Xcolor,彩色深度图训练集Xcdepth,灰度深度图训练集Xgdepth,并训练三通道堆叠ISA网络;
(5)利用训练好的三通道堆叠ISA网络抽取彩色图Icolor,彩色深度图Icdepth和灰度深度图Igdepth三通道图像的特征并征构造融合空间。
2.根据权利要求1所述的RGB-D图像多通道融合特征提取方法,其中步骤(1)所述的将获取的RGB-D图像增强为彩色图Icolor,彩色深度图Icdepth和灰度深度图Igdepth三通道图像,按如下步骤进行:
1a)获取彩色和深度数据:
从3D体感摄影机Kinect直接获取的是彩色和深度图,也就是RGB-D图像,其中深度数据流设置为图像分辨率320*240,30fps。设置最小探测范围常量和最大探测范围常量,分别为900和4095,Kinect直接传来每个像素的深度值是视场中物体离摄像机的距离。深度数据流中深度帧的每个像素占16位、2个字节,每个像素的深度值占用了该16位中的13位。每个像素的深度值存储在第3至15位中,需要将人物索引位移除,得到深度数据,即:IDepth=FDepth>>3,其中FDepth表示传回的深度数据,IDepth表示深度帧中每个像素的深度值;
1b)获取灰度深度图Igdepth
将彩色影像的格式转化为BGR32类型,其中BGR32类型的每个像素占32位,R、G、B分别占8位,剩余8位留用。分别对深度帧的R、G、B三个通道的每个像素的深度值进行转换:
IGrey=(IDepth/4095)×255,
其中IGrey表示灰度深度图Igdepth单个通道的每个像素的灰度值;
1c)获取彩色深度图Icdepth
先将深度数据值IGrey转换为色调和饱和度HSI模型,之后转换为RGB模式显示深度数据。任何不在范围内的都设置为白色;
将深度值除以深度探测最大值4095,然后乘以255,赋值给H。即H=(IDepth/4095)×255。之后将HSI模型转为RGB模型,设S、I分量的值在[0,1]内,R、G、B分量的值也在[0,1]内,则由HSI模型向RGB模型的转换公式如下:
(1)当0°≤H<120°时,
B=I(1-S)
G=3I-(B+R)
(2)当120°≤H<240°时,
R=I(1-S)
B=3I-(R+G)
(3)当240°≤H<360°时,
R=3I-(B+R)
G=I(1-S)
1d)获取彩色可见光图像Icolor,并将其设置为与深度图相同的分辨率320*240,30fps。
3.根据权利要求1所述的基于RGB-D图像多通道融合特征提取方法,其中步骤(5)所述的利用训练好的三通道堆叠ISA网络抽取彩色图Icolor,彩色深度图Icdepth和灰度深度图Igdepth三通道图像的特征并征构造融合空间。按如下步骤进行:
5a)构造相似标签集合S:
本发明将RGB-D视频的可见光图,彩色深度图,灰度深度图的第二层输出YISA2定义为同一类。对于n个RGB-D视频来讲,每个RGB-D视频分为三个通道:可见光图,彩色深度图和灰度深度图。通过三个ISA网络得到3n个特征,对属于同一个RGB-D视频的三通道特征定义成相似特征,对每个RGB-D视频来说有2个,由此构造相似特征标签矩阵S,S={(xi,xj)|xi和xj属于同一类};
5b)构造非相似标签集合D:
本发明将不同RGB-D视频的所有通道特征都定义成不同类别。对于n个RGB-D视频间的特征都是不相似的,对于一个特征来说有3(n-1)个,由此来构造不相似特征标签矩阵D,D={(xi,xj)|xi和xj不属于同一类};
5c)构造样本集合C:
对于所有RGB-D视频的所有特征,共有3n个,全部视为样本空间C={x1,x2,....,xn},其中n是样本的个数,包括彩色可见光图像特征xicolor,彩色深度图特征xicdepth,灰度深度图特征xigdepth
5d)训练度量学习算法;
对于度量矩阵A∈Rm×n,两个样本点x和y的距离平方表示为:
d A 2 ( x , y ) = | | x - y | | A 2 = ( x - y ) T A ( x - y ) ,
根据S中的相似约束对和D中的非相似约束对,该方法将距离度量学习表示成如下的凸优化问题:
m a x A ∈ R m × n Σ ( x i , x j ) ∈ D | | x i - x j | | A 2
s . t . A ≥ 0 , Σ ( x i , x j ) ∈ S | | x i - x j | | A 2 ≤ 1
其中,A≥0表示A为半正定矩阵,是为了保证两点距离不为负和三角不等式成立;
令A=MTM,则x和y的距离平方为通过求解凸规划问题得到特征空间到度量空间的转换矩阵M。
CN201510873318.5A 2015-12-02 2015-12-02 一种基于isa模型的rgb-d图像的多通道融合特征提取方法 Pending CN105550687A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510873318.5A CN105550687A (zh) 2015-12-02 2015-12-02 一种基于isa模型的rgb-d图像的多通道融合特征提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510873318.5A CN105550687A (zh) 2015-12-02 2015-12-02 一种基于isa模型的rgb-d图像的多通道融合特征提取方法

Publications (1)

Publication Number Publication Date
CN105550687A true CN105550687A (zh) 2016-05-04

Family

ID=55829870

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510873318.5A Pending CN105550687A (zh) 2015-12-02 2015-12-02 一种基于isa模型的rgb-d图像的多通道融合特征提取方法

Country Status (1)

Country Link
CN (1) CN105550687A (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106127733A (zh) * 2016-06-14 2016-11-16 湖南拓视觉信息技术有限公司 人体目标识别的方法和装置
CN107491712A (zh) * 2016-06-09 2017-12-19 北京雷动云合智能技术有限公司 一种基于rgb‑d图像的人体识别方法
CN108389224A (zh) * 2018-02-26 2018-08-10 北京市商汤科技开发有限公司 图像处理方法及装置、电子设备和存储介质
CN108447080A (zh) * 2018-03-02 2018-08-24 哈尔滨工业大学深圳研究生院 基于分层数据关联和卷积神经网络的目标跟踪方法、系统和存储介质
CN109002792A (zh) * 2018-07-12 2018-12-14 西安电子科技大学 基于分层多模型度量学习的sar图像变化检测方法
CN109035229A (zh) * 2018-07-18 2018-12-18 河南牧业经济学院 一种基于傅里叶描述子的奶牛体况自动评价方法
CN109101946A (zh) * 2018-08-27 2018-12-28 Oppo广东移动通信有限公司 一种图像特征的提取方法、终端设备及存储介质
CN109299639A (zh) * 2017-07-25 2019-02-01 虹软(杭州)多媒体信息技术有限公司 一种用于表情识别的方法和装置
CN109389621A (zh) * 2018-09-11 2019-02-26 淮阴工学院 基于多模式深度特征融合的rgb-d目标跟踪方法
CN109643363A (zh) * 2016-06-15 2019-04-16 诺基亚技术有限公司 特征提取和对象检测的方法、系统和装置
CN110651301A (zh) * 2017-05-24 2020-01-03 黑拉有限责任两合公司 用于自动为夜视图像着色的方法和系统
CN111507266A (zh) * 2020-04-17 2020-08-07 四川长虹电器股份有限公司 一种基于深度图像的人体检测方法和装置
CN112446256A (zh) * 2019-09-02 2021-03-05 中国林业科学研究院资源信息研究所 一种基于深度isa数据融合的植被类型识别方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060177150A1 (en) * 2005-02-01 2006-08-10 Microsoft Corporation Method and system for combining multiple exposure images having scene and camera motion
CN103065158A (zh) * 2012-12-28 2013-04-24 电子科技大学 基于相对梯度的isa模型的行为识别方法
US20140099033A1 (en) * 2012-10-05 2014-04-10 Raytheon Bbn Technologies Corp. Fast computation of kernel descriptors
CN103839042A (zh) * 2012-11-27 2014-06-04 腾讯科技(深圳)有限公司 人脸识别方法和人脸识别系统
CN104154910A (zh) * 2014-07-22 2014-11-19 清华大学 一种微型无人机室内定位方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060177150A1 (en) * 2005-02-01 2006-08-10 Microsoft Corporation Method and system for combining multiple exposure images having scene and camera motion
US20140099033A1 (en) * 2012-10-05 2014-04-10 Raytheon Bbn Technologies Corp. Fast computation of kernel descriptors
CN103839042A (zh) * 2012-11-27 2014-06-04 腾讯科技(深圳)有限公司 人脸识别方法和人脸识别系统
CN103065158A (zh) * 2012-12-28 2013-04-24 电子科技大学 基于相对梯度的isa模型的行为识别方法
CN104154910A (zh) * 2014-07-22 2014-11-19 清华大学 一种微型无人机室内定位方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
赵永威 等: ""基于特征分组与特征值最优化的距离度量学习方法"", 《JOURNAL OF DATA ACQUISITION AND PROCESSING》 *
风雨无阻可1: ""HSI转到RGB"", 《百度文库-HTTPS://WENKU.BAIDU.COM/VIEW/4E0EEFB476EEAEAAD0F3305F.HTML》 *
黄晓琳 等: ""基于压缩感知理论的RGB-D图像分类方法"", 《计算机应用与软件》 *

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107491712A (zh) * 2016-06-09 2017-12-19 北京雷动云合智能技术有限公司 一种基于rgb‑d图像的人体识别方法
CN106127733A (zh) * 2016-06-14 2016-11-16 湖南拓视觉信息技术有限公司 人体目标识别的方法和装置
CN106127733B (zh) * 2016-06-14 2019-02-22 湖南拓视觉信息技术有限公司 人体目标识别的方法和装置
CN109643363A (zh) * 2016-06-15 2019-04-16 诺基亚技术有限公司 特征提取和对象检测的方法、系统和装置
CN110651301A (zh) * 2017-05-24 2020-01-03 黑拉有限责任两合公司 用于自动为夜视图像着色的方法和系统
CN109299639A (zh) * 2017-07-25 2019-02-01 虹软(杭州)多媒体信息技术有限公司 一种用于表情识别的方法和装置
CN109299639B (zh) * 2017-07-25 2021-03-16 虹软科技股份有限公司 一种用于表情识别的方法和装置
CN108389224B (zh) * 2018-02-26 2020-11-27 北京市商汤科技开发有限公司 图像处理方法及装置、电子设备和存储介质
CN108389224A (zh) * 2018-02-26 2018-08-10 北京市商汤科技开发有限公司 图像处理方法及装置、电子设备和存储介质
CN108447080A (zh) * 2018-03-02 2018-08-24 哈尔滨工业大学深圳研究生院 基于分层数据关联和卷积神经网络的目标跟踪方法、系统和存储介质
CN109002792A (zh) * 2018-07-12 2018-12-14 西安电子科技大学 基于分层多模型度量学习的sar图像变化检测方法
CN109002792B (zh) * 2018-07-12 2021-07-20 西安电子科技大学 基于分层多模型度量学习的sar图像变化检测方法
CN109035229A (zh) * 2018-07-18 2018-12-18 河南牧业经济学院 一种基于傅里叶描述子的奶牛体况自动评价方法
CN109035229B (zh) * 2018-07-18 2022-02-18 河南牧业经济学院 一种基于傅里叶描述子的奶牛体况自动评价方法
CN109101946B (zh) * 2018-08-27 2021-02-12 Oppo广东移动通信有限公司 一种图像特征的提取方法、终端设备及存储介质
CN109101946A (zh) * 2018-08-27 2018-12-28 Oppo广东移动通信有限公司 一种图像特征的提取方法、终端设备及存储介质
CN109389621A (zh) * 2018-09-11 2019-02-26 淮阴工学院 基于多模式深度特征融合的rgb-d目标跟踪方法
CN109389621B (zh) * 2018-09-11 2021-04-06 淮阴工学院 基于多模式深度特征融合的rgb-d目标跟踪方法
CN112446256A (zh) * 2019-09-02 2021-03-05 中国林业科学研究院资源信息研究所 一种基于深度isa数据融合的植被类型识别方法
CN111507266A (zh) * 2020-04-17 2020-08-07 四川长虹电器股份有限公司 一种基于深度图像的人体检测方法和装置

Similar Documents

Publication Publication Date Title
CN105550687A (zh) 一种基于isa模型的rgb-d图像的多通道融合特征提取方法
US9418458B2 (en) Graph image representation from convolutional neural networks
CN109508375A (zh) 一种基于多模态融合的社交情感分类方法
CN111274869B (zh) 基于并行注意力机制残差网进行高光谱图像分类的方法
US20200057904A1 (en) Method and apparatus for detecting objects of interest in images
CN106599863A (zh) 一种基于迁移学习技术的深度人脸识别方法
CN106682628B (zh) 一种基于多层深度特征信息的人脸属性分类方法
CN107636691A (zh) 用于识别图像中的文本的方法和设备
CN104794504A (zh) 基于深度学习的图形图案文字检测方法
CN111191664B (zh) 标签识别网络的训练方法、标签识别装置/方法及设备
CN110929665A (zh) 一种自然场景曲线文本检测方法
Doi et al. The effect of focal loss in semantic segmentation of high resolution aerial image
CN105590099A (zh) 一种基于改进卷积神经网络的多人行为识别方法
CN110059728A (zh) 基于注意力模型的rgb-d图像视觉显著性检测方法
CN106960176A (zh) 一种基于超限学习机和颜色特征融合的行人性别识别方法
CN115641473A (zh) 基于cnn-自注意力机制混合架构的遥感图像分类方法
CN111860407A (zh) 一种视频中人物的表情识别方法、装置、设备及存储介质
CN103617597A (zh) 基于差值图像稀疏表示的遥感图像融合方法
CN114387641A (zh) 基于多尺度卷积网络和ViT的虚假视频检测方法及系统
CN114332007A (zh) 一种基于Transformer的工业缺陷检测和识别方法
Fathima Classification of blood types by microscope color images
CN117475216A (zh) 一种基于aglt网络的高光谱与激光雷达数据融合分类方法
CN109508639A (zh) 基于多尺度带孔卷积神经网络的道路场景语义分割方法
CN111898614B (zh) 神经网络系统以及图像信号、数据处理的方法
CN111046213A (zh) 一种基于图像识别的知识库构建方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160504