CN110991513B - 一种具有类人连续学习能力的图像目标识别系统及方法 - Google Patents

一种具有类人连续学习能力的图像目标识别系统及方法 Download PDF

Info

Publication number
CN110991513B
CN110991513B CN201911180534.6A CN201911180534A CN110991513B CN 110991513 B CN110991513 B CN 110991513B CN 201911180534 A CN201911180534 A CN 201911180534A CN 110991513 B CN110991513 B CN 110991513B
Authority
CN
China
Prior art keywords
neural network
image
module
learning
weight
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911180534.6A
Other languages
English (en)
Other versions
CN110991513A (zh
Inventor
吴俊君
邝辉宇
周林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Foshan University
Original Assignee
Foshan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Foshan University filed Critical Foshan University
Priority to CN201911180534.6A priority Critical patent/CN110991513B/zh
Publication of CN110991513A publication Critical patent/CN110991513A/zh
Application granted granted Critical
Publication of CN110991513B publication Critical patent/CN110991513B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种具有类人连续学习能力的图像目标识别系统及方法,其包括神经网络预训练模块、图像输入模块、神经网络模块、正交权重修改模块和分类器模块;本发明具有可以有效提高神经网络模型的连续学习能力,能够适应多类别的小样本连续学习,为后来得出的网络权重分类更加精确;本发明还可以对需要进行多种单一类别样本的训练学习的目标识别方法精度进行提高,应用本发明的正交权重修改算法实现了对网络现有知识的有效保护,并且与现有的梯度反向传播算法完全兼容,在连续学习任务中精度得到很好地提升。

Description

一种具有类人连续学习能力的图像目标识别系统及方法
技术领域
本发明涉及目标视觉检测、目标识别、深度学习领域,具体而言,一种具有类人连续学习能力的图像目标识别系统及方法。
背景技术
目标检测在现实生活中可以应用在安全领域、军事领域、交通领域、医疗领域和生活领域中,而物体目标识别是计算机视觉的四个基本任务之一,目前在目标检测领域中主要应用深度神经网络进行实现,根据深度学习神经网络处理后所得出的神经网络模型对图像中的目标进行检测。
由于目前在深度学习领域中需要通过对同一类物体经过神经网络学习之后应用于识别、分类和预测。在采用现有的深度学习神经网络算法(如faster RCNN、YOLO v3等算法)对于输入图片进行学习后,所得到的神经网络模型会固定下来,很难再去学习新的信息,在实际场景中不足以具有上下文信息,很难满足复杂和不断变化的需求,缺乏依赖于语境的学习,同时受到了在灾难性遗忘的问题困扰,在保留旧知识的同时,很难学习新知识。因此急需提出一种能够解决灾难性遗忘问题的图像目标识别系统及方法。
发明内容
本发明的目的在于提供一种具有类人连续学习能力的图像目标识别系统及方法以解决所述问题。
为实现上述目的,本发明所提供的一种具有类人连续学习能力的图像目标识别系统及方法,其包括神经网络预训练模块、图像输入模块、神经网络模块、正交权重修改模块和分类器模块;
所述神经网络预训练模块,用于将一类图像经过深度学习神经网络学习训练后得到一个神经网络模型权重;
所述图像输入模块,用于对图像进行预处理,为图像中的物体对象类型添加标签;
所述神经网络模块,用于根据预训练的神经网络模型对图像的中的每一个同一类别的对象进行特征提取,同时再通过池化层将图片尺寸还原至原输入图片的尺寸大小;
所述正交权重修改模块,用于在学习新的类别图像任务时,在与旧任务输入空间正交的方向上修改神经网络权重;
所述分类器模块,用于利用分类器网络对经过深度学习的所述神经网络模块和所述正交权重修改模块的图片中的每一类别的对象进行分类,找出图片中每一种类别对象所处的位置并用方框进行标记。
优选的是,所述正交权重修改模块通过训练学习所引起的权重修改公式为:
ΔW=kPΔWBP
其中ΔWBP为根据预训练神经网络模型权重所得到的标准反向传播(backpropagationn BP)计算的权重调整所得到,k是神经网络的学习速率为常数,而P则是构造坐标系用于找到与输入空间正交的方向,P的计算公式为:
P=I-A(ATA+aI)-1A
其中矩阵A包含所有先前训练过的输入向量作为列输入,而I是单位矩阵乘以相对较小的常数a,AT指的是A的转置矩阵的值。
利用Softmax分类器网络对经过深度学习神经网络模块和OWM模块的图片中的每一类别的对象进行分类,找出图片中每一种类别对象所处的位置并用方框进行标记。
另外,本发明还公开了一种具有类人连续学习能力的图像目标识别系统的使用方法,其特包括以下步骤:
步骤1:对同一类别的图像样本进行处理,对于同一类别对象的图像经过深度学习神经网络得到预训练神经网络模型权重;
步骤2:提取图像的物体特征类别信息,利用深度学习神经网络的卷积层提取图像中的物体对象特征。
步骤3:利用金字塔池化层,对具有多个卷积核池化的深度学习神经网络获得固定大小的feature maps;并根据输入的图片将ROI映射到featuremap对应位置,然后将映射后的区域划分为相同大小的选择框,然后对每个选择框进行最大值池化操作,从不同的大小的方框的中得到相应的特征值;
步骤4:利用两个全连接层,对图像中的每一个候选区域作用对于图像中的特征区域进行提取,把在卷积层中得到的所有局部特征组合成全局特征;
步骤5:利用正交权重修改模块,对在图像经过前向传播后得出与预训练模型的相差值进行反向传播,更新权值,重新计算输出;
步骤6:利用分类层,对于深度学习神经网络模型输出每一个分类对象的概率,输出一个确定的变量;
步骤7:得到含有目标对象检测选择框的图像。
优选的是,所述深度学习神经网络为VGG16或ResNet。
优选的是,所述正交权重修改模块通过训练学习所引起的权重修改公式为:
ΔW=kPΔWBP
其中ΔWBP为根据预训练神经网络模型权重所得到的标准反向传播(backpropagationn BP)计算的权重调整所得到,k是神经网络的学习速率为常数,而P则是构造坐标系用于找到与输入空间正交的方向,P的计算公式为:
P=I-A(ATA+aI)-1A
其中矩阵A包含所有先前训练过的输入向量作为列输入,而I是单位矩阵乘以相对较小的常数a,AT指的是A的转置矩阵的值。
上述技术方案所提供的一种具有类人连续学习能力的图像目标识别系统及方法,与现有技术相比,其有益效果包括:基于正交权重修改模块可以有效进行连续学习,在对多个类别图像训练任务进行训练且每次只训练一种类别,在每一次训练的时候根据上一次训练所得到的网络权重文件在输入空间正交的方向上进行修改,这样可以有效提高神经网络模型的连续学习能力,能够适应多类别的小样本连续学习,为后来得出的网络权重分类更加精确,本发明可以对需要进行多种单一类别样本的训练学习的目标识别方法精度进行提高,应用本发明的OWM算法(即正交权重修改算法)实现了对网络现有知识的有效保护,并且与现有的梯度反向传播算法完全兼容,在连续学习任务中精度得到很好地提升。
附图说明
从以下结合附图的描述可以进一步理解本发明。图中的部件不一定按比例绘制,而是将重点放在示出实施例的原理上。在不同的视图中,相同的附图标记指定对应的部分。
图1是本发明实施例中一种具有类人连续学习能力的图像目标识别系统的功能模块示意图;
图2是本发明实施例中一种具有类人连续学习能力的图像目标识别系统的使用方法流程图。
具体实施方式
下面结合附图和实施例对本发明进行进一步说明。
为了使得本发明的目的、技术方案及优点更加清楚明白,以下结合其实施例,对本发明进行进一步详细说明;应当理解,此处所描述的具体实施例仅用于解释本发明,并不用于限定本发明。对于本领域技术人员而言,在查阅以下详细描述之后,本实施例的其它系统、方法和/或特征将变得显而易见。旨在所有此类附加的系统、方法、特征和优点都包括在本说明书内、包括在本发明的范围内,并且受所附权利要求书的保护。在以下详细描述描述了所公开的实施例的另外的特征,并且这些特征根据以下详细描述将是显而易见的。
本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若有术语“上”、“下”、“左”、“右”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或组件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
本实施例提供了一种具有连续学习能力的图像目标识别系统及方法,该系统可以在安全领域、军事领域、交通领域、医疗领域和生活领域中应用,适用于现实工作环境中。
如图1所示的一种具有类人连续学习能力的图像目标识别系统,根据实际应用需求与信息数据处理流程,该系统可以分为五个功能模块:神经网络预训练模块、图像输入模块、神经网络模块、正交权重修改模块和分类器模块。
上述每个功能模块及相应方法依次描述如下:
(1)神经网络预训练模块,将一类图像经过深度学习神经网络学习训练后得到一个神经网络模型权重。
(2)图像输入模块,对图像进行预处理,为图像中的物体对象类型添加标签。
(3)神经网络模块,根据预训练的网络模型对图像的中的每一个同一类别的对象进行特征提取,同时再通过池化层将图片尺寸还原至原输入图片的尺寸大小。
(4)正交权重修改模块,在学习新的类别图像任务时,仅在与旧任务输入空间正交的方向上修改神经网络权重,这样会使得权重增量不影响前一任务的输入,从而保证了在新任务训练过程中网络搜索到的解决方案仍然在前一任务的解空间中,在数学上,OWM通过训练学习所引起的权重修改公式为:
ΔW=kPΔWBP
其中ΔWBP为根据预训练神经网络模型权重所得到的标准反向传播(backpropagationn BP)计算的权重调整所得到,k是神经网络的学习速率为常数,而P则是构造坐标系用于找到与输入空间正交的方向,P的计算公式为:
P=I-A(ATA+aI)-1A
其中矩阵A包含所有先前训练过的输入向量作为列输入,而I是单位矩阵乘以相对较小的常数a,AT指的是A的转置矩阵的值。
(5)分类器模块,利用Softmax分类器网络对经过神经网络模块和OWM模块的图片中的每一类别的对象进行分类,找出图片中每一种类别对象所处的位置并用方框进行标记。
如上所述,在本实施例的一种具有连续学习能力的目标检测方法系统中,基于OWM模块可以有效进行连续学习,在对多个类别图像训练任务进行训练且每次只训练一种类别,在每一次训练的时候根据上一次训练所得到的网络权重文件在输入空间正交的方向上进行修改,这样可以有效提高神经网络模型的连续学习能力,能够适应多类别的小样本连续学习,为后来得出的网络权重分类更加精确,本发明可以对需要进行多种单一类别样本的训练学习的目标识别方法精度进行提高,应用本发明的OWM算法实现了对网络现有知识的有效保护,并且与现有的梯度反向传播算法完全兼容,在连续学习任务中精度得到很好地提升。
本实施例首先利用单一类别的图像数据样本在预处理模块中进行处理得出初始的神经网络模型权重,随后将采集到的另一类别的图像经过神经网络模块和正交权重修改模块进行处理,在前一神经网络模型权重的基础上在其输入空间正交的方向上做出修改得到新的神经网络模型权重。
如图2所示,本实施例中的具有类人连续学习能力的图像目标识别方法,其包括如下所述的步骤:
步骤1:对同一类别的图像样本进行处理,对于同一类别对象的图像经过深度学习神经网络得到预训练神经网络模型权重;
步骤2:提取图像的物体特征类别信息,由于一幅图像通常包含了多种类别的物体对象,可以利用深度学习神经网络(如VGG16、ResNet)的卷积层提取图像中的物体对象特征;
步骤3:利用金字塔池化层,对具有多个卷积核池化的深度学习神经网络获得固定大小的feature maps,将根据输入的图片将ROI映射到feature map对应位置,然后将映射后的区域划分为相同大小的选择框,然后对每个选择框进行最大值池化操作,从不同的大小的方框的中得到相应的特征值。而所输出的特征大小不取决于ROI和卷积核的大小;
步骤4:利用两个全连接层,对图像中的每一个候选区域作用对于图像中的特征区域进行提取,把在卷积层中得到的所有局部特征组合成全局特征;
步骤5:利用正交权重修改模块,在图像经过前向传播后得出与预训练模型的相差值,因此我们需要对误差进行反向传播,更新权值,重新计算输出。对于旧任务所得到的神经网络模型权重在输入空间正交方向上进行修改,这样权重增量就可以几乎不会影响前一任务的输入,从而保证了在新的任务训练过程中网络所得到的解决方案仍然在前一任务的解空间中,在数学上,正交权重修改模块通过训练学习所引起的权重修改公式为:
ΔW=kPΔWBP
其中ΔWBP为根据预训练神经网络模型权重所得到的标准反向传播(backpropagationn BP)计算的权重调整所得到,k是神经网络的学习速率为常数,而P则是构造坐标系用于找到与输入空间正交的方向,P的计算公式为:
P=I-A(ATA+aI)-1A
其中矩阵A包含所有先前训练过的输入向量作为列输入,而I是单位矩阵乘以相对较小的常数a,AT指的是A的转置矩阵的值。
步骤6:利用分类层,对于深度学习神经网络模型输出每一个分类对象的概率,输出一个确定的变量;
步骤7:得到含有目标对象检测选择框的图像。
上述所述的正交权重修改模块的英文表达方式为OWM模块。
虽然上面已经参考各种实施例描述了本发明,但是应当理解,在不脱离本发明的范围的情况下,可以进行许多改变和修改。也就是说上面讨论的方法,系统和设备是示例。各种配置可以适当地省略,替换或添加各种过程或组件。例如,在替代配置中,可以以与所描述的顺序不同的顺序执行方法,和/或可以添加,省略和/或组合各种部件。而且,关于某些配置描述的特征可以以各种其他配置组合,如可以以类似的方式组合配置的不同方面和元素。此外,随着技术发展其中的元素可以更新,即许多元素是示例,并不限制本公开或权利要求的范围。
在说明书中给出了具体细节以提供对包括实现的示例性配置的透彻理解。然而,可以在没有这些具体细节的情况下实践配置。例如,已经示出了众所周知的电路,过程,算法,结构和技术而没有不必要的细节,以避免模糊配置。该描述仅提供示例配置,并且不限制权利要求的范围,适用性或配置。相反,前面对配置的描述将为本领域技术人员提供用于实现所描述的技术的使能描述。在不脱离本公开的精神或范围的情况下,可以对元件的功能和布置进行各种改变。
综上,其旨在上述详细描述被认为是例示性的而非限制性的,并且应当理解,以下权利要求(包括所有等同物)旨在限定本发明的精神和范围。以上这些实施例应理解为仅用于说明本发明而不用于限制本发明的保护范围。在阅读了本发明的记载的内容之后,技术人员可以对本发明作各种改动或修改,这些等效变化和修饰同样落入本发明权利要求所限定的范围。

Claims (4)

1.一种具有类人连续学习能力的图像目标识别系统,其特征在于,其包括神经网络预训练模块、图像输入模块、神经网络模块、正交权重修改模块和分类器模块;
所述神经网络预训练模块,用于将一类图像经过深度学习神经网络学习训练后得到一个神经网络模型权重;
所述图像输入模块,用于对图像进行预处理,为图像中的物体对象类型添加标签;
所述神经网络模块,用于根据预训练的神经网络模型对图像的中的每一个同一类别的对象进行特征提取,同时再通过池化层将图片尺寸还原至原输入图片的尺寸大小;
所述正交权重修改模块,用于在学习新的类别图像任务时,在与旧任务输入空间正交的方向上修改神经网络模型权重;
所述分类器模块,用于利用分类器网络对经过深度学习的所述神经网络模块和所述正交权重修改模块的图片中的每一类别的对象进行分类,找出图片中每一种类别对象所处的位置并用方框进行标记;
所述正交权重修改模块通过训练学习所引起的权重修改公式为:
BP
ΔW=kPΔW
其中ΔWBP为根据预训练神经网络模型权重所得到的标准反向传播计算的权重调整所得到,k是神经网络的学习速率为常数,而P则是构造坐标系用于找到与输入空间正交的方向,P的计算公式为:
P=I-A(ATA+aI)-1A
其中矩阵A包含所有先前训练过的输入向量作为列输入,而I是单位矩阵乘以相对较小的常数a,AT指的是A的转置矩阵的值。
2.根据权利要求1所述的具有类人连续学习能力的图像目标识别系统,其特征在于,所述分类器网络为Softmax。
3.如权利要求1~2任一项的具有类人连续学习能力的图像目标识别系统的使用方法,其特征在于,包括以下步骤:
步骤1:对同一类别的图像样本进行处理,对于同一类别对象的图像经过深度学习神经网络得到预训练神经网络模型权重;
步骤2:提取图像的物体特征类别信息,利用深度学习神经网络的卷积层提取图像中的物体对象特征;
步骤3:利用金字塔池化层,对具有多个卷积核池化的深度学习神经网络获得固定大小的feature maps;并根据输入的图片将ROI映射到feature map对应位置,然后将映射后的区域划分为相同大小的选择框,然后对每个选择框进行最大值池化操作,从不同的大小的方框的中得到相应的特征值;
步骤4:利用两个全连接层,对图像中的每一个候选区域作用对于图像中的特征区域进行提取,把在卷积层中得到的所有局部特征组合成全局特征;
步骤5:利用正交权重修改模块,对在图像经过前向传播后得出与预训练模型的相差值进行反向传播,更新权值,重新计算输出;
步骤6:利用分类层,对于深度学习神经网络模型输出每一个分类对象的概率,输出一个确定的变量;
步骤7:得到含有目标对象检测选择框的图像;
所述正交权重修改模块通过训练学习所引起的权重修改公式为:
ΔW=kPΔWBP
其中ΔWBP为根据预训练神经网络模型权重所得到的标准反向传播计算的权重调整所得到,k是神经网络的学习速率为常数,而P则是构造坐标系用于找到与输入空间正交的方向,P的计算公式为:
P=I-A(ATA+aI)-1A
其中矩阵A包含所有先前训练过的输入向量作为列输入,而I是单位矩阵乘以相对较小的常数a,AT指的是A的转置矩阵的值。
4.根据权利要求3所述的具有类人连续学习能力的图像目标识别方法,其特征在于,所述深度学习神经网络为VGG16或ResNet。
CN201911180534.6A 2019-11-27 2019-11-27 一种具有类人连续学习能力的图像目标识别系统及方法 Active CN110991513B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911180534.6A CN110991513B (zh) 2019-11-27 2019-11-27 一种具有类人连续学习能力的图像目标识别系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911180534.6A CN110991513B (zh) 2019-11-27 2019-11-27 一种具有类人连续学习能力的图像目标识别系统及方法

Publications (2)

Publication Number Publication Date
CN110991513A CN110991513A (zh) 2020-04-10
CN110991513B true CN110991513B (zh) 2023-05-30

Family

ID=70087575

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911180534.6A Active CN110991513B (zh) 2019-11-27 2019-11-27 一种具有类人连续学习能力的图像目标识别系统及方法

Country Status (1)

Country Link
CN (1) CN110991513B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111428739B (zh) * 2020-04-14 2023-08-25 图觉(广州)智能科技有限公司 一种具备连续学习能力的高精度图像语义分割方法
CN111723203A (zh) * 2020-06-15 2020-09-29 苏州意能通信息技术有限公司 一种基于终生学习的文本分类方法
CN112153659B (zh) * 2020-08-21 2022-05-03 中国地质大学(武汉) 高效节能的星载无线传感器网络数据压缩模型的构建方法
CN112434795A (zh) * 2020-12-01 2021-03-02 中国科学院空天信息创新研究院 一种新型三维人工神经元装置及人工神经网络识别系统
CN112488038B (zh) * 2020-12-15 2023-07-07 中国人民解放军国防科技大学 一种基于图网络学习的目标识别方法
CN113642627B (zh) * 2021-08-09 2024-03-08 中国人民解放军海军航空大学航空作战勤务学院 一种基于深度学习的图像与决策多源异类信息融合识别方法和装置
CN113962262B (zh) * 2021-10-21 2024-05-14 中国人民解放军空军航空大学 一种基于连续学习的雷达信号智能分选方法
CN114064954B (zh) * 2022-01-18 2022-05-10 北京中科开迪软件有限公司 一种光盘库中图像清理方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3340109A1 (en) * 2016-12-25 2018-06-27 Facebook, Inc. Shape prediction for face alignment
CN109934343A (zh) * 2019-02-25 2019-06-25 中国科学院自动化研究所 基于正交投影矩阵的人工神经网络优化方法、系统、装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3340109A1 (en) * 2016-12-25 2018-06-27 Facebook, Inc. Shape prediction for face alignment
CN109934343A (zh) * 2019-02-25 2019-06-25 中国科学院自动化研究所 基于正交投影矩阵的人工神经网络优化方法、系统、装置

Also Published As

Publication number Publication date
CN110991513A (zh) 2020-04-10

Similar Documents

Publication Publication Date Title
CN110991513B (zh) 一种具有类人连续学习能力的图像目标识别系统及方法
EP3779774B1 (en) Training method for image semantic segmentation model and server
CN114202672A (zh) 一种基于注意力机制的小目标检测方法
CN111476806B (zh) 图像处理方法、装置、计算机设备和存储介质
CN107545263B (zh) 一种物体检测方法及装置
CN111461213B (zh) 一种目标检测模型的训练方法、目标快速检测方法
CN110782420A (zh) 一种基于深度学习的小目标特征表示增强方法
CN111563502A (zh) 图像的文本识别方法、装置、电子设备及计算机存储介质
CN110781744A (zh) 一种基于多层次特征融合的小尺度行人检测方法
US20210319242A1 (en) Dense and Discriminative Neural Network Architectures for Improved Object Detection and Instance Segmentation
CN111882031A (zh) 一种神经网络蒸馏方法及装置
CN112418351B (zh) 基于全局与局部上下文感知的零样本学习图像分类方法
CN112183491A (zh) 表情识别模型及训练方法、识别方法、装置和计算设备
CN115222946B (zh) 一种单阶段实例图像分割方法、装置以及计算机设备
CN110765882A (zh) 一种视频标签确定方法、装置、服务器及存储介质
CN111709268A (zh) 一种深度图像中的基于人手结构指导的人手姿态估计方法和装置
CN114492634B (zh) 一种细粒度装备图片分类识别方法及系统
CN113343981A (zh) 一种视觉特征增强的字符识别方法、装置和设备
CN113420827A (zh) 语义分割网络训练和图像语义分割方法、装置及设备
CN112668421B (zh) 一种基于注意力机制的无人机高光谱农作物快速分类方法
US20240037911A1 (en) Image classification method, electronic device, and storage medium
CN116958873A (zh) 行人跟踪方法、装置、电子设备及可读存储介质
CN117036658A (zh) 一种图像处理方法及相关设备
CN115861595A (zh) 一种基于深度学习的多尺度域自适应异源图像匹配方法
Kaur et al. Deep transfer learning based multiway feature pyramid network for object detection in images

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant