CN109615016A - 一种基于金字塔输入增益的卷积神经网络的目标检测方法 - Google Patents

一种基于金字塔输入增益的卷积神经网络的目标检测方法 Download PDF

Info

Publication number
CN109615016A
CN109615016A CN201811560431.8A CN201811560431A CN109615016A CN 109615016 A CN109615016 A CN 109615016A CN 201811560431 A CN201811560431 A CN 201811560431A CN 109615016 A CN109615016 A CN 109615016A
Authority
CN
China
Prior art keywords
training
stage
training set
pianet
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811560431.8A
Other languages
English (en)
Other versions
CN109615016B (zh
Inventor
刘峡壁
刘伟华
李慧玉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN201811560431.8A priority Critical patent/CN109615016B/zh
Publication of CN109615016A publication Critical patent/CN109615016A/zh
Application granted granted Critical
Publication of CN109615016B publication Critical patent/CN109615016B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10012Stereo images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10081Computed x-ray tomography [CT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30061Lung
    • G06T2207/30064Lung nodule

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Medical Informatics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于金字塔输入增益的卷积神经网络的目标检测方法,属于计算机视觉及目标检测技术领域。所述目标检测方法基于包括特征提取模块和多任务预测模块的卷积神经网络模型PiaNet;所述目标检测方法,包括训练阶段和测试阶段;训练阶段采用两阶段迁移学习策略,包括:步骤(1)数据增强和数据预处理,产生第一阶段训练的训练集、第二阶段训练的训练集和测试集;步骤(2)在二分类网络中进行第一阶段训练;步骤(3)进行第二阶段训练,得到训练后的PiaNet网络;测试阶段即精确检测目标,具体为:将测试集输入到训练后的PiaNet网络,通过多任务损失函数输出检测框位置和分类结果。适用面广泛,且具有很高的鲁棒性。

Description

一种基于金字塔输入增益的卷积神经网络的目标检测方法
技术领域
本发明涉及一种基于金字塔输入增益的卷积神经网络的目标检测方法,属于计算机视觉及目标检测技术领域。
背景技术
目标检测是指在图像中找出所有感兴趣目标的具体位置和大小等定位信息,该问题是计算机视觉、模式识别等领域中的基础问题之一,解决该问题的方法在汽车自动驾驶、视频监控及分析、人脸识别及其医学CT图像的结节或肿瘤检测等应用中得到广泛使用。
现有的目标检测方法主要分为两类:
1)传统目标检测方法。传统目标检测一般采用滑动窗口的框架,主要包括图像空间分割、特征设计和提取、分类识别等步骤,它需要在尺度和位置等几个维度空间内进行搜索,待处理的窗口数量巨大,使得计算量过大,且手工设计的特征对多样性目标的鲁棒性不强,很难设计出高效的特征,检测精度较低。
2)基于卷积神经网络的目标检测方法。基于卷积神经网络的目标检测方法也主要分成两类。一类是两阶段方法,其中包括第一阶段的候选区域提取,第二阶段对区域进行卷积特征提取和分类,比如R-CNN,Faster R-CNN等;另一类是端到端的检测方法,如Yolo,SSD等,这类方法只需要一个卷积神经网络,直接输出所有的检测结果。
现有技术的缺陷:
1)传统的检测方法,尽管简单,但由于图像中的目标往往在姿态、尺度、灰度空间等方面呈现多样性,检测精度往往达不到实际应用的要求。
2)已有的基于卷积神经网络的目标检测方法,因为采用了复杂的神经网络结构,尽管检测精度优于传统方法,但在训练过程中需要固定输入尺度,且这些模型结构具有层级卷积下采样的特点,对部分尺度相对小的目标提取的特征信息和位置信息经常丢失,使得无法准确定位大尺度目标且经常漏检小尺度目标。这使得在具体目标的检测上,其召回率和准确率不能达到良好的效果。
发明内容
本发明的目的是针对现有基于卷积神经网络进行目标检测的方法存在可靠性低、漏检率高的技术缺陷,提出了一种基于金字塔输入增益的卷积神经网络的目标检测方法,所述方法提出了一种基于金字塔输入增益的卷积神经网络模型PiaNet,PiaNet融合了多尺度处理和多任务学习有效地提高了检测精度和检测准确率。
一种基于金字塔输入增益的卷积神经网络的目标检测方法,提出了一种基于金字塔输入增益的卷积神经网络模型PiaNet,网络模型PiaNet主要包括特征提取模块和多任务预测模块;
其中,所述特征提取模块包括特征压缩模块和特征放大模块;其中,特征压缩模块包括N个卷积块,沿着一条融合源连接输入的特征压缩路径展开;特征放大模块包括M个反卷积块,沿着一条融合了跳跃连接的特征放大路径展开;
其中,源连接对预处理后的图像分别进行average pooling操作得到多尺度源图像并构成了图像金字塔,降低了特征压缩路径上的信息损失;
特征压缩路径上的每个卷积块包含一次卷积、BN、激活和Pooling操作,对输入图像进行特征提取得到特征图;
从特征压缩路径上的第一个卷积块开始,每一层输出的特征图和相应尺度的源图像拼接构成下一层卷积操作的输入;特征放大路径上的每个卷积块包含一次Unpooling、反卷积、BN和激活操作,对特征压缩路径输出的特征图进行特征放大;
从特征放大路径上的第一个反卷积块开始,每一层输出的特征图和来自特征压缩路径的特征图拼接构成下一层反卷积操作的输入,使得压缩路径上具有的目标细节信息能够传输到具有高层语义信息的放大特征层路径上;
多任务预测模块包含多任务损失函数。
一种基于金字塔输入增益的卷积神经网络的目标检测方法,包括训练阶段和测试阶段;
其中,训练阶段采用两阶段迁移学习策略,具体实现步骤如下:
步骤(1)数据增强和数据预处理,具体为:基于数据划分、数据增强以及预处理从带标记的原始数据中产生第一阶段训练的训练集、第二阶段训练的训练集和测试集;
其中,数据增强的使用是为了解决了小样本的学习问题;
步骤(1)又包含如下子步骤:
步骤(1A)将带标记的原始数据划分为带有检测目标的正样本训练集、不带有检测目标的负样本训练集以及测试集;
步骤(1B)采用数据增强手段处理正样本训练集,再与正样本训练集一起构成新的正样本训练集;
其中,数据增强手段包括旋转、缩放和平移操作;
其中,新训练集补充了带有检测目标的正样本训练集,其原因是:带标记的原始数据的数量较少不足以完成PiaNet网络模型的训练;
步骤(1C)对步骤(1B)构成的新的正样本训练集和步骤(1A)输出的负样本训练集以及测试集中的每一幅图像进行灰度归一化和去均值的预处理,分别得到正样本训练集和负样本训练集组成的训练集以及测试集,并将训练集平均划分为第一阶段训练所需的训练集和第二阶段训练所需的训练集;
步骤(2)基于步骤(1)生成的第一阶段训练所需的训练集进行第一阶段训练;
其中,第一阶段训练在二分类网络中进行,二分类网络由PiaNet模型中的特征提取模块和average pooling层以及softmax层相连接组成;步骤(2)的具体训练过程,具体为:将步骤(1C)获得的用于第一阶段训练的训练集输入二分类网络,采用随机梯度下降算法优化softmax损失函数,得到训练后的二分类网络,此训练后的二分类网络中包括训练好的特征提取模块;
由于此分类网络只处理二分类问题,而且训练集中仅包含小尺寸图像,所以在第一阶段训练中仅需很小的计算代价便可获得较好的初始化特征提取模块;
步骤(3)基于步骤(1)生成的第二阶段训练所需的训练集进行第二阶段训练,得到训练后的PiaNet网络;
其中,第二阶段训练在PiaNet网络中进行,且PiaNet网络中的特征提取模块来自步骤(2)中训练好的特征提取模块;
步骤(3)又包含如下子步骤:
步骤(3A)将步骤(2A)训练得到的训练好的特征提取模块载入到PiaNet网络中;
步骤(3B)将步骤(1C)获得的用于第二阶段训练的训练集输入到PiaNet网络,通过特征提取模块中的放大特征路径获得不同尺度的特征图;
步骤(3C)对步骤(3B)输出的不同尺度的特征图进行多尺度锚点设计,并将特征图划分到多尺度锚点中;
步骤(3D)步骤(3C)中的每个锚点对标签中相应的ground-truth检测框进行回归计算,同时对检测框进行优化分类,输出检测框的位置信息和分类结果,采用随机梯度下降算法优化多任务损失函数,得到训练后的PiaNet网络;
测试阶段,即步骤(4)精确检测目标,具体为:
步骤(4A)将步骤(1C)获得的测试集输入到步骤(3D)训练得到的PiaNet网络中,通过多任务损失函数输出检测框的位置信息和分类结果;
步骤(4B)将步骤(4A)中的回归和分类结果输出。
有益效果
本发明是一种基于金字塔输入增益的卷积神经网络的目标检测方法,与现有目标检测方法相比,具有如下有益效果:
1)所述方法采用的检测网络PiaNet适用面广泛,且具有很高的鲁棒性;PiaNet网络中的源链接保留了原始图像的多尺度信息,特征提取模块不仅能把检测目标的细致空间定位信息融合到高层的语义信息,而且能进一步保证检测的准确性和多尺度范围的包容性,在不影响计算速度的前提下,解决了检测中的尺度问题,保证了小目标检测的精度要求;
2)通过实施所述方法,可在各种实际应用场景下获得快速、高精度、高可靠的目标检测效果,解决了小目标检测中的精度下降问题;在3D CT图像的肺结节检测中的应用已表明:即便是小目标的结节检测,检测准确率也能达到99%以上。
附图说明
图1为本发明一种基于金字塔输入增益的卷积神经网络的目标检测方法的PiaNet框架图;
图2为本发明一种基于金字塔输入增益的卷积神经网络的目标检测方法的PiaNet网络所使用的原始输入CT图像;
图3为输入图像经过源连接路径上的多级average pooling操作所生成的多尺度源图像构成的图像金字塔;
图4为特征放大路径输出的多尺度特征图输入多任务预测模块,同时进行检测框位置回归和目标分类操作;
图5为本发明一种基于金字塔输入增益的卷积神经网络的目标检测方法的PiaNet网络检测结果示例。
具体实施方式
下面结合附图与具体实施方式对本发明作进一步说明。
实施例
按照发明内容所述的方法步骤,一种本发明的对CT图像进行肺结节检测的实施例对应的PiaNet网模型结构如图1所示。
步骤(1)数据预处理;
对原始图像进行去均值和灰度归一化的预处理得到预处理后的图像,其中原始CT输入图像如图2所示;
步骤(2)将步骤(1)输出的预处理后的图像输入PiaNet网络;
步骤(2)又包括如下子步骤:
步骤(2A)输入图像经过源连接路径上的average pooling操作得到压缩后的源图像。其中,多级average pooling所生成的多尺度源图像可构成图像金字塔,如图3所示;
步骤(2B)同时,输入图像经过特征压缩路径上的卷积、BN、激活和Pooling操作进行特征提取,得到特征图。
步骤(2C)从特征压缩路径上的第一个卷积块开始,步骤(2A)和步骤(2B)中的输出会经过拼接操作输入到下一层的卷积块中。最终得到压缩后的特征图。
步骤(2D)步骤(2C)输出的特征图经过放大路径上的Unpooling、反卷积、BN和激活操作,对特征压缩路径输出的特征图进行特征放大。从特征压放大径上的第一个反卷积块开始,每一层输出的特征图和来自对称的特征压缩路径的特征图拼接构成下一层反卷积操作的输入。最终得到多尺度的特征图。
步骤(3)将步骤(2)输出的多尺度的特征图作为预测模块的输入,同时进行目标检测和类别分类操作。其中,这一多任务预测过程,如图4所示;
步骤(3)又包括如下子步骤:
步骤(3A)步骤(2D)输出的每张特征图中的每个位置进行不同尺度的锚点设计;
步骤(3B)对每个锚点同时进行位置回归和类别分类,输出检测框位置信息及相应的置信分数;
步骤(3C)通过非极大值抑制方法去掉步骤(3B)输出的重复检测框,最终输出少量精确的检测结果。图5显示了一些最终的最优检测结节例子。其中白色的框是标签,灰色的框为检测结果。可以看出PiaNet不仅能检测出非常微小的结节,而且还能检测出不典型不规则的结节。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (4)

1.一种基于金字塔输入增益的卷积神经网络的目标检测方法,其特征在于:提出了一种基于金字塔输入增益的卷积神经网络模型PiaNet,网络模型PiaNet主要包括特征提取模块和多任务预测模块;
其中,所述特征提取模块包括特征压缩模块和特征放大模块;其中,特征压缩模块包括N个卷积块,沿着一条融合源连接输入的特征压缩路径展开;特征放大模块包括M个反卷积块,沿着一条融合了跳跃连接的特征放大路径展开;
其中,源连接对预处理后的图像分别进行average pooling操作得到多尺度源图像并构成了图像金字塔,降低了特征压缩路径上的信息损失;
特征压缩路径上的每个卷积块包含一次卷积、BN、激活和Pooling操作,对输入图像进行特征提取得到特征图;
从特征压缩路径上的第一个卷积块开始,每一层输出的特征图和相应尺度的源图像拼接构成下一层卷积操作的输入;特征放大路径上的每个卷积块包含一次Unpooling、反卷积、BN和激活操作,对特征压缩路径输出的特征图进行特征放大;
从特征放大路径上的第一个反卷积块开始,每一层输出的特征图和来自特征压缩路径的特征图拼接构成下一层反卷积操作的输入,使得压缩路径上具有的目标细节信息能够传输到具有高层语义信息的放大特征层路径上;
多任务预测模块包含多任务损失函数;
所述目标检测方法,包括训练阶段和测试阶段;
其中,训练阶段采用两阶段迁移学习策略,具体实现步骤如下:
步骤(1)数据增强和数据预处理,具体为:基于数据划分、数据增强以及预处理从带标记的原始数据中产生第一阶段训练的训练集、第二阶段训练的训练集和测试集;
其中,数据增强的使用是为了解决了小样本的学习问题;
步骤(2)基于步骤(1)生成的第一阶段训练所需的训练集进行第一阶段训练;
其中,第一阶段训练在二分类网络中进行,二分类网络由PiaNet模型中的特征提取模块和average pooling层以及softmax层相连接组成;步骤(2)的具体训练过程,具体为:将步骤(1C)获得的用于第一阶段训练的训练集输入二分类网络,采用随机梯度下降算法优化softmax损失函数,得到训练后的二分类网络,此训练后的二分类网络中包括训练好的特征提取模块;
由于此分类网络只处理二分类问题,而且训练集中仅包含小尺寸图像,所以在第一阶段训练中仅需很小的计算代价便可获得较好的初始化特征提取模块;
步骤(3)基于步骤(1)生成的第二阶段训练所需的训练集进行第二阶段训练,得到训练后的PiaNet网络,包含如下子步骤:
步骤(3A)将步骤(2A)训练得到的训练好的特征提取模块载入到PiaNet网络中;
步骤(3B)将步骤(1C)获得的用于第二阶段训练的训练集输入到PiaNet网络,通过特征提取模块中的放大特征路径获得不同尺度的特征图;
步骤(3C)对步骤(3B)输出的不同尺度的特征图进行多尺度锚点设计,并将特征图划分到多尺度锚点中;
步骤(3D)步骤(3C)中的每个锚点对标签中相应的ground-truth检测框进行回归计算,同时对检测框进行优化分类,输出检测框的位置信息和分类结果,采用随机梯度下降算法优化多任务损失函数,得到训练后的PiaNet网络;
测试阶段,即步骤(4)精确检测目标,具体为:
步骤(4A)将步骤(1C)获得的测试集输入到步骤(3D)训练得到的PiaNet网络中,通过多任务损失函数输出检测框的位置信息和分类结果;
步骤(4B)将步骤(4A)中的回归和分类结果输出。
2.根据权利要求1所述的一种基于金字塔输入增益的卷积神经网络的目标检测方法,其特征在于:步骤(1)又包含如下子步骤:
步骤(1A)将带标记的原始数据划分为带有检测目标的正样本训练集、不带有检测目标的负样本训练集以及测试集;
步骤(1B)采用数据增强手段处理正样本训练集,再与正样本训练集一起构成新的正样本训练集;
其中,新训练集补充了带有检测目标的正样本训练集,其原因是:带标记的原始数据的数量较少不足以完成PiaNet网络模型的训练;
步骤(1C)对步骤(1B)构成的新的正样本训练集和步骤(1A)输出的负样本训练集以及测试集中的每一幅图像进行灰度归一化和去均值的预处理,分别得到正样本训练集和负样本训练集组成的训练集以及测试集,并将训练集平均划分为第一阶段训练所需的训练集和第二阶段训练所需的训练集。
3.根据权利要求2所述的一种基于金字塔输入增益的卷积神经网络的目标检测方法,其特征在于:步骤(1B)中,数据增强手段包括旋转、缩放和平移操作。
4.根据权利要求2所述的一种基于金字塔输入增益的卷积神经网络的目标检测方法,其特征在于:步骤(3)中,第二阶段训练在PiaNet网络中进行,且PiaNet网络中的特征提取模块来自步骤(2)中训练好的特征提取模块。
CN201811560431.8A 2018-12-20 2018-12-20 一种基于金字塔输入增益的卷积神经网络的目标检测方法 Active CN109615016B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811560431.8A CN109615016B (zh) 2018-12-20 2018-12-20 一种基于金字塔输入增益的卷积神经网络的目标检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811560431.8A CN109615016B (zh) 2018-12-20 2018-12-20 一种基于金字塔输入增益的卷积神经网络的目标检测方法

Publications (2)

Publication Number Publication Date
CN109615016A true CN109615016A (zh) 2019-04-12
CN109615016B CN109615016B (zh) 2021-06-22

Family

ID=66009936

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811560431.8A Active CN109615016B (zh) 2018-12-20 2018-12-20 一种基于金字塔输入增益的卷积神经网络的目标检测方法

Country Status (1)

Country Link
CN (1) CN109615016B (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110070139A (zh) * 2019-04-28 2019-07-30 吉林大学 面向自动驾驶环境感知的小样本在环学习系统和方法
CN110210538A (zh) * 2019-05-22 2019-09-06 雷恩友力数据科技南京有限公司 一种家居图像多目标识别方法及装置
CN110415244A (zh) * 2019-08-02 2019-11-05 陈晋音 判断骨骼状态的方法及其模型训练方法、装置
CN110472514A (zh) * 2019-07-22 2019-11-19 电子科技大学 一种自适应车辆目标检测算法模型及其构建方法
CN110827312A (zh) * 2019-11-12 2020-02-21 北京深境智能科技有限公司 一种基于协同视觉注意力神经网络的学习方法
CN110852209A (zh) * 2019-10-29 2020-02-28 腾讯科技(深圳)有限公司 目标检测方法及装置、介质和设备
CN111178183A (zh) * 2019-12-16 2020-05-19 深圳市华尊科技股份有限公司 人脸检测方法及相关装置
CN111274981A (zh) * 2020-02-03 2020-06-12 中国人民解放军国防科技大学 目标检测网络构建方法及装置、目标检测方法
CN111340126A (zh) * 2020-03-03 2020-06-26 腾讯云计算(北京)有限责任公司 物品识别方法、装置、计算机设备和存储介质
CN111368672A (zh) * 2020-02-26 2020-07-03 苏州超云生命智能产业研究院有限公司 一种用于遗传病面部识别模型的构建方法及装置
CN111462733A (zh) * 2020-03-31 2020-07-28 科大讯飞股份有限公司 多模态语音识别模型训练方法、装置、设备及存储介质
CN111539291A (zh) * 2020-04-16 2020-08-14 创新奇智(合肥)科技有限公司 基于雷达波的目标检测方法及装置、电子设备、存储介质
CN111783819A (zh) * 2020-05-08 2020-10-16 国家电网有限公司 小规模数据集上基于感兴趣区域训练改进的目标检测方法
CN111950630A (zh) * 2020-08-12 2020-11-17 深圳市烨嘉为技术有限公司 基于两阶段迁移学习的小样本工业产品缺陷分类方法
CN112132816A (zh) * 2020-09-27 2020-12-25 北京理工大学 一种基于多任务与感兴趣区域分割引导的目标检测方法
CN112150460A (zh) * 2020-10-16 2020-12-29 上海智臻智能网络科技股份有限公司 检测方法、检测系统、设备和介质
CN113112482A (zh) * 2021-04-15 2021-07-13 深圳市玻尔智造科技有限公司 一种基于注意力机制网络的pcb缺陷检测方法
CN113572742A (zh) * 2021-07-02 2021-10-29 燕山大学 基于深度学习的网络入侵检测方法
WO2024032010A1 (zh) * 2022-08-11 2024-02-15 重庆邮电大学 一种基于迁移学习策略的少样本目标实时检测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017079522A1 (en) * 2015-11-04 2017-05-11 Nec Laboratories America, Inc. Subcategory-aware convolutional neural networks for object detection
CN107680678A (zh) * 2017-10-18 2018-02-09 北京航空航天大学 基于多尺度卷积神经网络甲状腺超声图像结节自动诊断系统
US20180157938A1 (en) * 2016-12-07 2018-06-07 Samsung Electronics Co., Ltd. Target detection method and apparatus
CN108229495A (zh) * 2017-06-23 2018-06-29 北京市商汤科技开发有限公司 目标对象检测方法、装置、电子设备和存储介质
CN108460403A (zh) * 2018-01-23 2018-08-28 上海交通大学 一种图像中多尺度特征融合的目标检测方法与系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017079522A1 (en) * 2015-11-04 2017-05-11 Nec Laboratories America, Inc. Subcategory-aware convolutional neural networks for object detection
US20180157938A1 (en) * 2016-12-07 2018-06-07 Samsung Electronics Co., Ltd. Target detection method and apparatus
CN108229495A (zh) * 2017-06-23 2018-06-29 北京市商汤科技开发有限公司 目标对象检测方法、装置、电子设备和存储介质
CN107680678A (zh) * 2017-10-18 2018-02-09 北京航空航天大学 基于多尺度卷积神经网络甲状腺超声图像结节自动诊断系统
CN108460403A (zh) * 2018-01-23 2018-08-28 上海交通大学 一种图像中多尺度特征融合的目标检测方法与系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ARNAUD ARINDRA ADIYOSO SETIO等: "Pulmonary nodule detection in CT images: false positive reduction using multi-view convolutional networks", 《IEEE TRANSACTIONS ON MEDICAL IMAGING》 *
IBTISSAM BAKKOURI等: "Breast tumor classification based on deep convolutional neural networks", 《2017 INTERNATIONAL CONFERENCE ON ADVANCED TECHNOLOGIES FOR SIGNAL AND IMAGE PROCESSING》 *
葛园园等: "自动驾驶场景下小且密集的交通标志检测", 《智能系统学报》 *
韩光辉等: "肺部CT图像病变区域检测方法", 《自动化学报》 *

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110070139A (zh) * 2019-04-28 2019-07-30 吉林大学 面向自动驾驶环境感知的小样本在环学习系统和方法
CN110070139B (zh) * 2019-04-28 2021-10-19 吉林大学 面向自动驾驶环境感知的小样本在环学习系统和方法
CN110210538B (zh) * 2019-05-22 2021-10-19 雷恩友力数据科技南京有限公司 一种家居图像多目标识别方法及装置
CN110210538A (zh) * 2019-05-22 2019-09-06 雷恩友力数据科技南京有限公司 一种家居图像多目标识别方法及装置
CN110472514A (zh) * 2019-07-22 2019-11-19 电子科技大学 一种自适应车辆目标检测算法模型及其构建方法
CN110472514B (zh) * 2019-07-22 2022-05-31 电子科技大学 一种自适应车辆目标检测算法模型及其构建方法
CN110415244A (zh) * 2019-08-02 2019-11-05 陈晋音 判断骨骼状态的方法及其模型训练方法、装置
CN110852209A (zh) * 2019-10-29 2020-02-28 腾讯科技(深圳)有限公司 目标检测方法及装置、介质和设备
CN110827312A (zh) * 2019-11-12 2020-02-21 北京深境智能科技有限公司 一种基于协同视觉注意力神经网络的学习方法
CN110827312B (zh) * 2019-11-12 2023-04-28 北京深境智能科技有限公司 一种基于协同视觉注意力神经网络的学习方法
CN111178183A (zh) * 2019-12-16 2020-05-19 深圳市华尊科技股份有限公司 人脸检测方法及相关装置
CN111274981A (zh) * 2020-02-03 2020-06-12 中国人民解放军国防科技大学 目标检测网络构建方法及装置、目标检测方法
CN111368672A (zh) * 2020-02-26 2020-07-03 苏州超云生命智能产业研究院有限公司 一种用于遗传病面部识别模型的构建方法及装置
CN111340126A (zh) * 2020-03-03 2020-06-26 腾讯云计算(北京)有限责任公司 物品识别方法、装置、计算机设备和存储介质
CN111462733A (zh) * 2020-03-31 2020-07-28 科大讯飞股份有限公司 多模态语音识别模型训练方法、装置、设备及存储介质
CN111462733B (zh) * 2020-03-31 2024-04-16 科大讯飞股份有限公司 多模态语音识别模型训练方法、装置、设备及存储介质
CN111539291A (zh) * 2020-04-16 2020-08-14 创新奇智(合肥)科技有限公司 基于雷达波的目标检测方法及装置、电子设备、存储介质
CN111783819A (zh) * 2020-05-08 2020-10-16 国家电网有限公司 小规模数据集上基于感兴趣区域训练改进的目标检测方法
CN111783819B (zh) * 2020-05-08 2024-02-09 国家电网有限公司 小规模数据集上基于感兴趣区域训练改进的目标检测方法
CN111950630B (zh) * 2020-08-12 2022-08-02 深圳市烨嘉为技术有限公司 基于两阶段迁移学习的小样本工业产品缺陷分类方法
CN111950630A (zh) * 2020-08-12 2020-11-17 深圳市烨嘉为技术有限公司 基于两阶段迁移学习的小样本工业产品缺陷分类方法
CN112132816A (zh) * 2020-09-27 2020-12-25 北京理工大学 一种基于多任务与感兴趣区域分割引导的目标检测方法
CN112132816B (zh) * 2020-09-27 2022-12-30 北京理工大学 一种基于多任务与感兴趣区域分割引导的目标检测方法
CN112150460A (zh) * 2020-10-16 2020-12-29 上海智臻智能网络科技股份有限公司 检测方法、检测系统、设备和介质
CN112150460B (zh) * 2020-10-16 2024-03-15 上海智臻智能网络科技股份有限公司 检测方法、检测系统、设备和介质
CN113112482A (zh) * 2021-04-15 2021-07-13 深圳市玻尔智造科技有限公司 一种基于注意力机制网络的pcb缺陷检测方法
CN113572742B (zh) * 2021-07-02 2022-05-10 燕山大学 基于深度学习的网络入侵检测方法
CN113572742A (zh) * 2021-07-02 2021-10-29 燕山大学 基于深度学习的网络入侵检测方法
WO2024032010A1 (zh) * 2022-08-11 2024-02-15 重庆邮电大学 一种基于迁移学习策略的少样本目标实时检测方法

Also Published As

Publication number Publication date
CN109615016B (zh) 2021-06-22

Similar Documents

Publication Publication Date Title
CN109615016A (zh) 一种基于金字塔输入增益的卷积神经网络的目标检测方法
Shinde et al. YOLO based human action recognition and localization
CN109447979B (zh) 基于深度学习和图像处理算法的目标检测方法
CN110751232A (zh) 一种中文复杂场景文本检测与识别方法
Cepni et al. Vehicle detection using different deep learning algorithms from image sequence
CN112528858A (zh) 人体姿态估计模型的训练方法、装置、设备、介质及产品
CN113239807B (zh) 训练票据识别模型和票据识别的方法和装置
CN115131760A (zh) 一种基于改进特征匹配策略的轻量级车辆追踪方法
CN111127454A (zh) 基于深度学习生成工业缺陷样本的方法及系统
CN113435542A (zh) 一种基于深度学习的煤矸实时检测方法
Gao et al. Traffic signal image detection technology based on YOLO
Mirani et al. Object recognition in different lighting conditions at various angles by deep learning method
Voon et al. Computer-vision-based integrated circuit recognition using deep learning
CN114898290A (zh) 一种海上船舶实时检测方法及系统
Wang et al. Automotive Gear Defect Detection Method based on Yolov8 Algorithm
CN118015413A (zh) 目标检测方法、装置、系统和电子设备
CN113344121A (zh) 训练招牌分类模型和招牌分类的方法
CN112132816B (zh) 一种基于多任务与感兴趣区域分割引导的目标检测方法
Kulshrestha et al. Deep learning models for object recognition and quality surveillance
Wen et al. Yolo-sd: simulated feature fusion for few-shot industrial defect detection based on YOLOv8 and stable diffusion
Li et al. Pose2seg: Human instance segmentation without detection
Liu et al. Real-time defect detection of metal surface based on improved YOLOv4
CN113420839A (zh) 用于堆叠平面目标物体的半自动标注方法及分割定位系统
Laptev et al. Integrating Traditional Machine Learning and Neural Networks for Image Processing
Nguyen et al. An algorithm using YOLOv4 and DeepSORT for tracking vehicle speed on highway

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant