CN108596120A - 一种基于深度学习的目标检测方法和装置 - Google Patents

一种基于深度学习的目标检测方法和装置 Download PDF

Info

Publication number
CN108596120A
CN108596120A CN201810397400.9A CN201810397400A CN108596120A CN 108596120 A CN108596120 A CN 108596120A CN 201810397400 A CN201810397400 A CN 201810397400A CN 108596120 A CN108596120 A CN 108596120A
Authority
CN
China
Prior art keywords
image
image space
filled
zoomed
color value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810397400.9A
Other languages
English (en)
Other versions
CN108596120B (zh
Inventor
董玉新
刘巍
陈宇
翁志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201810397400.9A priority Critical patent/CN108596120B/zh
Publication of CN108596120A publication Critical patent/CN108596120A/zh
Application granted granted Critical
Publication of CN108596120B publication Critical patent/CN108596120B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/40Filling a planar surface by adding surface attributes, e.g. colour or texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于深度学习的目标检测方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:根据预先确定的缩放级数和每一级缩放的缩放尺度,对原始图像进行缩放,以得到每一级缩放图像;根据缩放级数和第一级缩放图像的尺寸,生成至少一个图像空间;当图像空间的尺寸大于第一级缩放图像的尺寸时,将每一级缩放图像的颜色值分别填充到对应的图像空间中;将填充有颜色值的图像空间批量输入全卷积网络,以输出目标检测结果。该方法通过对原始图像进行多次缩放,将缩放图像的颜色值填充至同一尺寸的图像空间,并将所有的图像空间批量输入全卷积网络,使得本申请仅需要进行一次前向推理,在保证召回率的同时,提升了检测速度。

Description

一种基于深度学习的目标检测方法和装置
技术领域
本发明涉及计算机领域,尤其涉及一种基于深度学习的目标检测方法和装置。
背景技术
现有的人脸检测方法中包括基于级联卷积神经网络(Convolutional NeuralNetwork,CNN)的深度学习人脸检测算法,该算法需要对输入的原始图像进行不同尺度的缩放处理。该算法的第一个阶段的具体处理过程为:首先根据预先确定的缩放尺度,对原始图像进行第一级缩放,将第一级缩放后得到的图像输入第一级网络,以生成候选框和边框回归向量;之后根据所述缩放尺度进行下一级缩放,将该级缩放后得到的图像输入第一级网络,以生成候选框和边框回归向量,依此循环。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:由于基于级联CNN的深度学习人脸检测算法需要对原始图像进行不同尺度的缩放处理,使得第一级网络需要进行多次前向推理的过程(即将缩放图像输入第一级网络进行计算,并得到输出的过程),这样会导致第一级网络的处理时间占用整个检测过程的70%以上,降低了检测速度。
发明内容
有鉴于此,本发明实施例提供一种基于深度学习的目标检测方法和装置,本发明实施例通过对原始图像进行多次缩放,将缩放图像的颜色值填充至同一尺寸的图像空间,并将所有的图像空间批量输入全卷积网络,使得本申请仅需要进行一次前向推理,在保证召回率的同时,提升了检测速度。
为实现上述目的,根据本发明实施例的一个方面,提供了一种基于深度学习的目标检测方法。
本发明实施例的一种基于深度学习的目标检测方法,包括:根据预先确定的缩放级数和每一级缩放的缩放尺度,对原始图像进行缩放,以得到每一级缩放图像;根据所述缩放级数和第一级缩放图像的尺寸,生成至少一个图像空间;当所述图像空间的尺寸大于所述第一级缩放图像的尺寸时,将所述每一级缩放图像的颜色值分别填充到对应的所述图像空间中;将填充有颜色值的所述图像空间批量输入全卷积网络,以输出目标检测结果。
可选地,所述对原始图像进行缩放的步骤之前,还包括:根据所述原始图像的像素和目标像素,确定所述缩放级数和每一级缩放的缩放尺度。
可选地,所述根据所述缩放级数和第一级缩放图像的尺寸,生成至少一个的图像空间,包括:根据第一级缩放图像的尺寸,生成与所述第一级缩放图像的尺寸相同的图像空间,且生成的所述图像空间的个数比所述缩放级数少1;所述方法还包括:当所述图像空间的尺寸等于所述第一级缩放图像的尺寸时,将缩放级数大于1的所有缩放图像的颜色值分别填充到对应的所述图像空间中。
可选地,所述将填充有颜色值的所述图像空间批量输入全卷积网络,包括:将填充有颜色值的所述图像空间和所述第一级缩放图像批量输入所述全卷积网络。
可选地,所述生成至少一个的图像空间的步骤之后,还包括:对所有的所述图像空间分别进行零填充;所述将所述每一级缩放图像的颜色值分别填充到对应的所述图像空间中,包括:将所述每一级缩放图像的颜色值分别填充到对应的零填充后的所述图像空间中。
可选地,所述将填充有颜色值的所述图像空间批量输入全卷积网络的步骤之前,还包括:对填充有颜色值的所述图像空间中,未填充颜色值的区域分别进行零填充。
可选地,所述将填充有颜色值的所述图像空间批量输入全卷积网络的步骤之前,还包括:对填充有颜色值的各所述图像空间中,进行所述零填充的区域分别增加边界条件保护;所述将填充有颜色值的所述图像空间批量输入全卷积网络,包括:将填充有颜色值的,且增加有边界条件保护的所述图像空间批量输入全卷积网络。
为实现上述目的,根据本发明实施例的另一方面,提供了一种基于深度学习的目标检测装置。
本发明实施例的一种基于深度学习的目标检测装置,包括:缩放模块,用于根据预先确定的缩放级数和每一级缩放的缩放尺度,对原始图像进行缩放,以得到每一级缩放图像;生成模块,用于根据所述缩放级数和第一级缩放图像的尺寸,生成至少一个图像空间;填充模块,用于当所述图像空间的尺寸大于所述第一级缩放图像的尺寸时,将所述每一级缩放图像的颜色值分别填充到对应的所述图像空间中;输出模块,用于将填充有颜色值的所述图像空间批量输入全卷积网络,以输出目标检测结果。
可选地,所述装置还包括:确定模块,用于根据所述原始图像的像素和目标像素,确定所述缩放级数和每一级缩放的缩放尺度。
可选地,所述生成模块,还用于:根据第一级缩放图像的尺寸,生成与所述第一级缩放图像的尺寸相同的图像空间,且生成的所述图像空间的个数比所述缩放级数少1;所述装置还包括:颜色值填充模块,用于当所述图像空间的尺寸等于所述第一级缩放图像的尺寸时,将缩放级数大于1的所有缩放图像的颜色值分别填充到对应的所述图像空间中。
可选地,所述输出模块,还用于:将填充有颜色值的所述图像空间和所述第一级缩放图像批量输入所述全卷积网络。
可选地,所述装置还包括:第一零填充模块,用于对所有的所述图像空间分别进行零填充;所述填充模块,还用于:将所述每一级缩放图像的颜色值分别填充到对应的零填充后的所述图像空间中。
可选地,所述装置还包括:第二零填充模块,用于对填充有颜色值的所述图像空间中,未填充颜色值的区域分别进行零填充。
可选地,所述装置还包括:增加模块,用于对填充有颜色值的各所述图像空间中,进行所述零填充的区域分别增加边界条件保护;所述输出模块,还用于:将填充有颜色值的,且增加有边界条件保护的所述图像空间批量输入全卷积网络。
为实现上述目的,根据本发明实施例的再一方面,提供了一种电子设备。
本发明实施例的一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例的一种基于深度学习的目标检测方法。
为实现上述目的,根据本发明实施例的再一方面,提供了一种计算机可读介质。
本发明实施例的一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明实施例的一种基于深度学习的目标检测方法。
上述发明中的一个实施例具有如下优点或有益效果:通过对原始图像进行多次缩放,将缩放图像的颜色值填充至同一尺寸的图像空间,并将所有的图像空间批量输入全卷积网络,使得本申请仅需要进行一次前向推理,在保证召回率的同时,提升了检测速度;将缩放图像的颜色值填充至与第一级缩放图像的尺寸相同的图像空间中,可减少一次对图像空间的处理,加快了处理速度;将填充有颜色值的所有图像空间和第一级缩放图像批量输入全卷积网络,使得所有生成的图像一次性全部经全卷积网络进行检测,提升了检测速度;对图像空间进行零填充处理,使得图像空间的其他区域的RGB值为零,能够较少计算量,进一步提升检测速度;在图像空间的零填充的区域增加边界条件保护,就不会对该区域进行卷积处理,进一步加快了检测速度。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施例的基于深度学习的目标检测方法的主要步骤的示意图;
图2是根据本发明一个实施例的基于深度学习的目标检测方法的主要流程示意图;
图3为本发明实施例的将第一级缩放图像的颜色值填充到零填充后的图像空间的结果示意图;
图4是根据本发明另一个实施例的基于深度学习的目标检测方法的主要流程示意图;
图5是根据本发明实施例的基于深度学习的目标检测装置的主要模块的示意图;
图6是本发明实施例可以应用于其中的示例性系统架构图;
图7是适用于来实现本发明实施例的电子设备的计算机装置的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
基于级联CNN的深度学习人脸检测算法的具体流程为:
第一阶段:将原始图像缩放到不同尺度,将每一级缩放后的原始图像输入第一级网络,以生成候选框和边框回归向量。之后可以基于边框回归算法对生成的候选框进行校正后,采用非极大值抑制算法合并重叠的候选框。其中,第一级网络为全卷积网络。
第二阶段:将第一级网络输出的候选框输入至第二级网络,以筛除大量错误的候选框,再基于边框回归算法对筛除后的候选框进行校正,并执行非极大值抑制算法合并重叠的候选框。
第三阶段:将第二级网络输出的候选框输入至第三级网络,以输出最终的人脸框和特征点位置。
上述算法在FDDB上的召回率为90%,误检80个人脸。其中,FDDB是全世界最具权威的人脸检测评测平台之一,其包含2845张图像,共有5171个人脸作为测试集。
图1是根据本发明实施例的基于深度学习的目标检测方法的主要步骤的示意图。如图1所示,本发明实施例的基于深度学习的目标检测方法,主要包括如下步骤:
步骤S101:根据预先确定的缩放级数和每一级缩放的缩放尺度,对原始图像进行缩放,以得到每一级缩放图像。根据所述原始图像的像素和目标像素,预先确定所述缩放级数和每一级缩放的缩放尺度。将原始图像的像素缩放到目标像素的过程中可以设置多个缩放尺度。缩放可以采用的方法有:双线性差值、最近邻差值、三次卷积插值等。
步骤S102:根据所述缩放级数和第一级缩放图像的尺寸,生成至少一个图像空间。该步骤可以生成多个大于等于所述第一级缩放图像的尺寸的图像空间。如果所述图像空间的尺寸大于所述第一级缩放图像的尺寸,则生成的所述图像空间的个数与所述缩放级数相等;如果所述图像空间的尺寸等于所述第一级缩放图像的尺寸,则生成的所述图像空间的个数比所述缩放级数少1。优选地,生成的各图像空间的尺寸完全相同,以便后续能够全部一次性地输入全卷积网络。
步骤S103:当所述图像空间的尺寸大于所述第一级缩放图像的尺寸时,将所述每一级缩放图像的颜色值分别填充到对应的所述图像空间中。将每一级缩放图像的所有像素的颜色值连续拷贝复制到图像空间中。由于各级缩放图像与所述图像空间的尺寸不一致,具体实现时可以按照左上角坐标系原点对齐的方式进行拷贝填充。
步骤S104:将填充有颜色值的所述图像空间批量输入全卷积网络,以输出目标检测结果。经过上述处理,使所有的图像空间具有相同的尺寸,进而可以将所有的图像空间一次性全部输入全卷积网络进行检测,以一次性生成所有的候选框和边框回归向量并输出,所述候选框和所述边框回归向量即为目标检测结果。
图2是根据本发明一个实施例的基于深度学习的目标检测方法的主要流程示意图。如图2所示,本发明实施例的基于深度学习的目标检测方法,主要包括如下步骤:
步骤S201:根据原始图像的像素和目标像素,确定所述原始图像需要进行缩放的缩放级数和每一级缩放的缩放尺度。每个深度学习平台,比如Caffe(ConvolutionalArchitecture for Fast Feature Embedding,卷积神经网络框架)、TensorFlow(是谷歌研发的第二代人工智能学习系统)、Mxnet(深度学习库)等都制定了输入的原始图像的像素,故所述目标像素由所使用的深度学习平台来定。
将原始图像的像素缩放到目标像素的过程中可以设置多个缩放尺度。假设原始图像的像素为640*480,每级缩放图像的像素为上一级缩放图像的0.5倍(即缩放尺度),目标像素为12*12,则最少需要进行的缩放次数为5次,即缩放级数为5,每一级缩放后得到的像素依次为:320*240、160*120、80*60、40*30、20*15。
步骤S202:根据所述缩放尺度对所述原始图像进行第一级缩放,以得到第一级缩放图像,确定所述第一级缩放图像的尺寸。根据第一级缩放的缩放尺度对原始图像进行缩放,得到第一级缩放图像,并确定所述第一级缩放图像的宽高尺寸。
步骤S203:根据所述第一级缩放图像的尺寸,生成比所述第一级缩放图像的尺寸大的图像空间,且生成的所述图像空间的个数与所述缩放级数相等。生成多个比第一级缩放图像的尺寸大的图像空间,各图像空间的宽度、高度和通道数均一致,此图像空间用于保证输入至全卷积网络进行处理的图像具有相同的尺寸。假设缩放级数为5,则本发明实施例中生成的图像空间的个数也为5。
步骤S204:对各所述图像空间分别进行零填充,将所述第一级缩放图像的颜色值(RGB值)填充到所有零填充后的所述图像空间的其中一个。零填充是指将图像空间对应像素的RGB值填零。原始图像经多次缩放后得到的图像肯定会变小,由于本申请使用图像空间来保证输入至全卷积网络的图像具有相同的尺寸,会导致图像空间的有效区域(存在图像的区域)变小,如果将其他区域(即零填充的区域,也就是不存在图像的区域)的RGB值均设置为零,能够较少计算量。由于该级缩放图像与该图像空间的尺寸不一致,具体实现时可以按照左上角坐标系原点对齐的方案进行拷贝填充。
图3为本发明实施例的将第一级缩放图像的颜色值填充到零填充后的图像空间的结果示意图。该图中缩放尺度为0.5,第一级缩放图像的左上角与图像空间的左上角相对齐,整个图像区域为零填充后的图像空间,带有人脸的灰色区域为有效区域,黑色区域为其他区域。
步骤S205:根据所述缩放尺度对所述原始图像进行下一级缩放,以得到下一级缩放图像。根据每一级缩放的缩放尺度对原始图像进行对应级别的缩放。假设缩放级数为5,首先根据第二级缩放的缩放尺度对原始图像进行第二级缩放,执行步骤S206和步骤S207;再根据第三级缩放的缩放尺度对原始图像进行第三级缩放,执行步骤S206和步骤S207;依次循环直至下一级缩放为第五级缩放时,根据第五级缩放的缩放尺度对原始图像进行第五级缩放。
步骤S206:将所述下一级缩放图像的RGB值填充到所有未被使用的零填充后的所述图像空间的其中一个。将该级缩放图像的每个像素的RGB值连续拷贝到零填充后的图像空间中,以使得该级缩放图像与该图像空间有相同的RGB值。由于该级缩放图像与该图像空间的尺寸不一致,具体实现时可以按照左上角坐标系原点对齐的方案进行拷贝填充。将每一级缩放图像的RGB值对应填充到不同的图像空间。
步骤S207:判断所述下一级缩放的级数与所述缩放级数是否相同,如果相同,则执行步骤S208;如果不同,则执行步骤S205。当所述下一级缩放的级数小于所述缩放级数时,需要将缩放级数加1,以按照对应的缩放尺度对所述原始图像进行缩放。
步骤S208:将填充有RGB值的所述图像空间批量输入全卷积网络,以批量输出目标检测结果。经过步骤S201至步骤S207的处理后,所有的图像空间具有相同的尺寸,进而可以将所有的图像空间一次性全部输入全卷积网络进行检测,以一次性生成所有的候选框和边框回归向量并输出,该候选框和边框回归向量即为目标检测结果(几个图像对应有几个目标检测结果)。由于本发明的实施例用于对基于级联CNN的深度学习人脸检测算法的第一个阶段进行改进,因此所述目标检测结果为人脸检测结果,该步骤最终会输出所有候选框的相对坐标和各候选框是人脸的概率值。
在另一优选的实施例中,步骤S207和步骤S208之间还包括:根据所述缩放尺度,在填充有颜色值的各所述图像空间的其他区域分别增加边界条件保护。本发明实施例中的边界为各级缩放图像的外边框。将各级缩放图像的宽度和高度进行存储,假设在填充图像空间时,将缩放图像与该图像空间的左上角对齐,将左上角作为坐标原点,将该宽度和高度作为边界,判断图像空间中某点的坐标是否小于等于缩放图像的宽度或者高度,如果大于此宽度或者高度,则不对该点再进行卷积处理;如果小于等于缩放图像的宽度或者高度,则可以进行卷积处理。该实施例中,所述边界条件即为:图像空间中某点的坐标是否小于等于缩放图像的宽度或者高度。
增加边界条件保护后,相应的步骤S208的执行过程可以是:将填充有颜色值的,且增加有边界条件保护的所述图像空间输入全卷积网络,以批量输出目标检测结果。增加边界条件保护目的是:使全卷积网络不对其他区域生成候选框和回归边框向量,由于其他区域本身就不会生成人脸的候选框,所以增加边界条件保护,能够增加本发明方法的稳定性。由于本申请对原始图像进行了不同多级缩放,因此填充有RGB值的各图像空间的有效区域并不相同,由于其他区域已经进行了零填充,在生成候选框和回归边框向量时,增加边界条件保护就不会对其他区域进行处理,进而能够加快本发明方法的检测速度。
在步骤S201至步骤S208执行完毕后,可以采用边框回归算法对生成的候选框进行校正后,采用非极大值抑制算法合并重叠的候选框;之后执行基于级联CNN的深度学习人脸检测算法第二阶段和第三阶段,以得到最终的人脸框和特征点位置。
在另一优选的实施例中,也可以先将各级缩放图像的RGB值对应填充到所有的所述图像空间的其中一个,并在将填充有RGB值的所述图像空间批量输入全卷积网络之前,对其他区域进行零填充。该实施例的具体处理过程可以为:步骤S204:将所述第一级缩放图像的RGB值填充到所有的所述图像空间的其中一个,之后对所述图像空间的其他区域进行零填充。步骤S206:将所述下一级缩放图像的RGB值填充到所有未被使用的所述图像空间的其中一个,之后对所述图像空间的其他区域进行零填充。其他步骤的处理过程不变。
图4是根据本发明另一个实施例的基于深度学习的目标检测方法的主要流程示意图。如图4所示,本发明实施例的基于深度学习的目标检测方法,主要包括如下步骤:
步骤S401:根据原始图像的像素和目标像素确定算所述原始图像需要进行缩放的缩放级数和每一级缩放的缩放尺度。与步骤S201相同,该步骤中将原始图像的像素缩放到目标像素的过程中可以设置多个缩放尺度。
步骤S402:根据所述缩放尺度对所述原始图像进行第一级缩放,以得到第一级缩放图像,确定所述第一级缩放图像的尺寸。与步骤S202相同,该步骤需根据第一级缩放的缩放尺度对原始图像进行缩放,得到第一级缩放图像,并确定所述第一级缩放图像的宽高尺寸。
步骤S403:根据所述第一级缩放图像的尺寸,生成与所述第一级缩放图像的尺寸相同的图像空间,且生成的所述图像空间的个数比所述缩放级数少1,对各所述图像空间进行零填充。本发明实施例中生成了多个与第一级缩放图像的宽度、高度和通道数均一致的图像空间,这样可以减少一次对图像空间的处理,加快本发明方法的处理速度。假设缩放级数为5,则本发明实施例中生成的图像空间的个数为4。
步骤S404:根据所述缩放尺度对所述原始图像进行下一级缩放,以得到下一级缩放图像。与步骤S205相同,该步骤需根据每一级缩放的缩放尺度对原始图像进行对应级别的缩放。
步骤S405:将所述下一级缩放图像的RGB值填充到所有未被使用的零填充后所述图像空间的其中一个。与步骤S206相同,该步骤需将该级缩放图像的每个像素的RGB值连续拷贝到零填充后的图像空间中,以使得该级缩放图像与该图像空间有相同的RGB值。
步骤S406:判断所述下一级缩放的级数与所述缩放级数是否相同,如果相同,则执行步骤S407;如果不同,则执行步骤S404。与步骤S207相同,该步骤需在所述下一级缩放的级数小于所述缩放级数时,将缩放级数加1,以按照对应的缩放尺度对所述原始图像进行缩放。
步骤S407:将所述第一级缩放图像和填充有RGB值的所述图像空间批量输入全卷积网络,以批量输出目标检测结果。经过步骤S401至步骤S406的处理后,所有的图像空间具有相同的尺寸,进而可以将所有的图像空间一次性全部输入全卷积网络进行检测,以一次性生成所有的候选框和边框回归向量并输出,该候选框和边框回归向量即为目标检测结果。
在另一优选的实施例中,步骤S406和步骤S407之间还包括:根据所述缩放尺度,在填充有颜色值的各所述图像空间的其他区域分别增加边界条件保护。增加边界条件保护后,相应的步骤S407的执行过程可以是:将所述第一级缩放图像和填充有颜色值的,且增加有边界条件保护的所述图像空间批量输入全卷积网络,以批量输出目标检测结果。增加边界条件保护,能够加快本发明方法的检测速度和稳定性。
在步骤S401至步骤S407执行完毕后,可以采用边框回归算法对生成的候选框进行校正后,采用非极大值抑制算法合并重叠的候选框;之后执行基于级联CNN的深度学习人脸检测算法第二阶段和第三阶段,以得到最终的人脸框和特征点位置。
在另一优选的实施例中,也可以不在步骤S403中对各图像进行零填充,而在步骤S405中进行零填充。该实施例的具体处理过程可以为:步骤S403:根据所述第一级缩放图像的尺寸,生成与所述第一级缩放图像的尺寸相同的图像空间,且生成的所述图像空间的个数比所述缩放级数少1。步骤S405:将所述下一级缩放图像的RGB值分别填充到所有未被使用的所述图像空间的其中一个,之后对所述图像空间中的其他区域进行零填充。其他步骤的处理过程不变。
本发明方法并未修改全卷积网络和预训练模型,从而能够保持人脸检测算法原有的召回率和误识率。将步骤S401至步骤S407的处理后,本发明方法将FDDB的所有图像处理一遍的平均时间由40ms提升到24ms左右,大大增加了检测速度。
通过本发明实施例的基于深度学习的目标检测方法可以看出,通过对原始图像进行多次缩放,将缩放图像的颜色值填充至同一尺寸的图像空间,并将所有的图像空间批量输入全卷积网络,使得本申请仅需要进行一次前向推理,在保证召回率的同时,提升了检测速度;将缩放图像的颜色值填充至与第一级缩放图像的尺寸相同的图像空间中,可减少一次对图像空间的处理,加快了处理速度;将填充有颜色值的所有图像空间和第一级缩放图像批量输入全卷积网络,使得所有生成的图像一次性全部经全卷积网络进行检测,提升了检测速度;对图像空间进行零填充处理,使得图像空间的其他区域的RGB值为零,能够较少计算量,进一步提升检测速度;在图像空间的零填充的区域增加边界条件保护,就不会对该区域进行卷积处理,进一步加快了检测速度。
图5是根据本发明实施例的基于深度学习的目标检测装置的主要模块的示意图。如图5所示,本发明实施例的基于深度学习的目标检测装置500,主要包括:
缩放模块501,用于根据预先确定的缩放级数和每一级缩放的缩放尺度,对原始图像进行缩放,以得到每一级缩放图像。根据所述原始图像的像素和目标像素,预先确定所述缩放级数和每一级缩放的缩放尺度。将原始图像的像素缩放到目标像素的过程中可以设置多个缩放尺度。缩放可以采用的方法有:双线性差值、最近邻差值、三次卷积插值等。
生成模块502,用于根据所述缩放级数和第一级缩放图像的尺寸,生成至少一个图像空间。该模块可以生成多个大于等于所述第一级缩放图像的尺寸的图像空间。如果所述图像空间的尺寸大于所述第一级缩放图像的尺寸,则生成的所述图像空间的个数与所述缩放级数相等;如果所述图像空间的尺寸等于所述第一级缩放图像的尺寸,则生成的所述图像空间的个数比所述缩放级数少1。优选地,生成的各图像空间的尺寸完全相同,以便后续能够全部一次性地输入全卷积网络。
填充模块503,用于当所述图像空间的尺寸大于所述第一级缩放图像的尺寸时,将所述每一级缩放图像的颜色值分别填充到对应的所述图像空间中。将每一级缩放图像的所有像素的颜色值连续拷贝复制到图像空间中。由于各级缩放图像与所述图像空间的尺寸不一致,具体实现时可以按照左上角坐标系原点对齐的方式进行拷贝填充。
输出模块504,用于将填充有颜色值的所述图像空间批量输入全卷积网络,以输出目标检测结果。经过上述模块处理,使所有的图像空间具有相同的尺寸,进而可以将所有的图像空间一次性全部输入全卷积网络进行检测,以一次性生成所有的候选框和边框回归向量并输出,所述候选框和所述边框回归向量即为目标检测结果。
另外,本发明实施例的基于深度学习的目标检测装置500还可以包括:确定模块、颜色值填充模块、第一零填充模块、第二零填充模块和增加模块(图5中未示出)。其中所述确定模块,用于根据所述原始图像的像素和目标像素,确定所述缩放级数和每一级缩放的缩放尺度。所述颜色值填充模块,用于当所述图像空间的尺寸等于所述第一级缩放图像的尺寸时,将缩放级别大于1的所有缩放图像的颜色值分别填充到对应的所述图像空间中。所述第一零填充模块,用于对所有的所述图像空间分别进行零填充。所述第二零填充模块,用于对填充有颜色值的所述图像空间中,未填充颜色值的区域分别进行零填充。所述增加模块,用于对填充有颜色值的各所述图像空间中,进行所述零填充的区域分别增加边界条件保护。
从以上描述可以看出,通过对原始图像进行多次缩放,将缩放图像的颜色值填充至同一尺寸的图像空间,并将所有的图像空间批量输入全卷积网络,使得本申请仅需要进行一次前向推理,在保证召回率的同时,提升了检测速度;将缩放图像的颜色值填充至与第一级缩放图像的尺寸相同的图像空间中,可减少一次对图像空间的处理,加快了处理速度;将填充有颜色值的所有图像空间和第一级缩放图像批量输入全卷积网络,使得所有生成的图像一次性全部经全卷积网络进行检测,提升了检测速度;对图像空间进行零填充处理,使得图像空间的其他区域的RGB值为零,能够较少计算量,进一步提升检测速度;在图像空间的零填充的区域增加边界条件保护,就不会对该区域进行卷积处理,进一步加快了检测速度。
图6示出了可以应用本发明实施例的基于深度学习的目标检测方法或基于深度学习的目标检测装置的示例性系统架构600。
如图6所示,系统架构600可以包括终端设备601、602、603,网络604和服务器605。网络604用以在终端设备601、602、603和服务器605之间提供通信链路的介质。网络604可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备601、602、603通过网络604与服务器605交互,以接收或发送消息等。终端设备601、602、603上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备601、602、603可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器605可以是提供各种服务的服务器,例如对用户利用终端设备601、602、603所浏览的购物类网站提供支持的后台管理服务器。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如目标推送信息、产品信息)反馈给终端设备。
需要说明的是,本申请实施例所提供的基于深度学习的目标检测方法一般由服务器605执行,相应地,基于深度学习的目标检测装置一般设置于服务器605中。
应该理解,图6中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
根据本发明的实施例,本发明还提供了一种电子设备和一种计算机可读介质。
本发明的电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例的一种基于深度学习的目标检测方法。
本发明的计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明实施例的一种基于深度学习的目标检测方法。
下面参考图7,其示出了适用于来实现本发明实施例的电子设备的计算机系统700的结构示意图。图7示出的电子设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图7所示,计算机系统700包括中央处理单元(CPU)701,其可以根据存储在只读存储器(ROM)702中的程序或者从存储部分708加载到随机访问存储器(RAM)703中的程序而执行各种适当的动作和处理。在RAM 703中,还存储有计算机系统700操作所需的各种程序和数据。CPU 701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
以下部件连接至I/O接口705:包括键盘、鼠标等的输入部分706;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至I/O接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分708。
特别地,根据本发明公开的实施例,上文主要步骤图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行主要步骤图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。在该计算机程序被中央处理单元(CPU)701执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个单元、程序段、或代码的一部分,上述单元、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括缩放模块、生成模块、填充模块和输出模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,缩放模块还可以被描述为“根据预先确定的缩放级数和每一级缩放的缩放尺度,对原始图像进行缩放,以得到每一级缩放图像的模块”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:根据预先确定的缩放级数和每一级缩放的缩放尺度,对原始图像进行缩放,以得到每一级缩放图像;根据所述缩放级数和第一级缩放图像的尺寸,生成至少一个图像空间;当所述图像空间的尺寸大于所述第一级缩放图像的尺寸时,将所述每一级缩放图像的颜色值分别填充到对应的所述图像空间中;将填充有颜色值的所述图像空间批量输入全卷积网络,以输出目标检测结果。
从以上描述可以看出,通过对原始图像进行多次缩放,将缩放图像的颜色值填充至同一尺寸的图像空间,并将所有的图像空间批量输入全卷积网络,使得本申请仅需要进行一次前向推理,在保证召回率的同时,提升了检测速度;将缩放图像的颜色值填充至与第一级缩放图像的尺寸相同的图像空间中,可减少一次对图像空间的处理,加快了处理速度;将填充有颜色值的所有图像空间和第一级缩放图像批量输入全卷积网络,使得所有生成的图像一次性全部经全卷积网络进行检测,提升了检测速度;对图像空间进行零填充处理,使得图像空间的其他区域的RGB值为零,能够较少计算量,进一步提升检测速度;在图像空间的零填充的区域增加边界条件保护,就不会对该区域进行卷积处理,进一步加快了检测速度。
上述产品可执行本发明实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明实施例所提供的方法。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (16)

1.一种基于深度学习的目标检测方法,其特征在于,包括:
根据预先确定的缩放级数和每一级缩放的缩放尺度,对原始图像进行缩放,以得到每一级缩放图像;
根据所述缩放级数和第一级缩放图像的尺寸,生成至少一个图像空间;
当所述图像空间的尺寸大于所述第一级缩放图像的尺寸时,将所述每一级缩放图像的颜色值分别填充到对应的所述图像空间中;
将填充有颜色值的所述图像空间批量输入全卷积网络,以输出目标检测结果。
2.根据权利要求1所述的方法,其特征在于,所述对原始图像进行缩放的步骤之前,还包括:根据所述原始图像的像素和目标像素,确定所述缩放级数和每一级缩放的缩放尺度。
3.根据权利要求1所述的方法,其特征在于,所述根据所述缩放级数和第一级缩放图像的尺寸,生成至少一个的图像空间,包括:根据第一级缩放图像的尺寸,生成与所述第一级缩放图像的尺寸相同的图像空间,且生成的所述图像空间的个数比所述缩放级数少1;
所述方法还包括:当所述图像空间的尺寸等于所述第一级缩放图像的尺寸时,将缩放级数大于1的所有缩放图像的颜色值分别填充到对应的所述图像空间中。
4.根据权利要求3所述的方法,其特征在于,所述将填充有颜色值的所述图像空间批量输入全卷积网络,包括:将填充有颜色值的所述图像空间和所述第一级缩放图像批量输入所述全卷积网络。
5.根据权利要求1所述的方法,其特征在于,所述生成至少一个的图像空间的步骤之后,还包括:对所有的所述图像空间分别进行零填充;
所述将所述每一级缩放图像的颜色值分别填充到对应的所述图像空间中,包括:将所述每一级缩放图像的颜色值分别填充到对应的零填充后的所述图像空间中。
6.根据权利要求1所述的方法,其特征在于,所述将填充有颜色值的所述图像空间批量输入全卷积网络的步骤之前,还包括:对填充有颜色值的所述图像空间中,未填充颜色值的区域分别进行零填充。
7.根据权利要求5或6所述的方法,其特征在于,所述将填充有颜色值的所述图像空间批量输入全卷积网络的步骤之前,还包括:对填充有颜色值的各所述图像空间中,进行所述零填充的区域分别增加边界条件保护;
所述将填充有颜色值的所述图像空间批量输入全卷积网络,包括:将填充有颜色值的,且增加有边界条件保护的所述图像空间批量输入全卷积网络。
8.一种基于深度学习的目标检测装置,其特征在于,包括:
缩放模块,用于根据预先确定的缩放级数和每一级缩放的缩放尺度,对原始图像进行缩放,以得到每一级缩放图像;
生成模块,用于根据所述缩放级数和第一级缩放图像的尺寸,生成至少一个图像空间;
填充模块,用于当所述图像空间的尺寸大于所述第一级缩放图像的尺寸时,将所述每一级缩放图像的颜色值分别填充到对应的所述图像空间中;
输出模块,用于将填充有颜色值的所述图像空间批量输入全卷积网络,以输出目标检测结果。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:确定模块,用于根据所述原始图像的像素和目标像素,确定所述缩放级数和每一级缩放的缩放尺度。
10.根据权利要求8所述的装置,其特征在于,所述生成模块,还用于:根据第一级缩放图像的尺寸,生成与所述第一级缩放图像的尺寸相同的图像空间,且生成的所述图像空间的个数比所述缩放级数少1;
所述装置还包括:颜色值填充模块,用于当所述图像空间的尺寸等于所述第一级缩放图像的尺寸时,将缩放级数大于1的所有缩放图像的颜色值分别填充到对应的所述图像空间中。
11.根据权利要求10所述的装置,其特征在于,所述输出模块,还用于:将填充有颜色值的所述图像空间和所述第一级缩放图像批量输入所述全卷积网络。
12.根据权利要求8所述的装置,其特征在于,所述装置还包括:第一零填充模块,用于对所有的所述图像空间分别进行零填充;
所述填充模块,还用于:将所述每一级缩放图像的颜色值分别填充到对应的零填充后的所述图像空间中。
13.根据权利要求8所述的装置,其特征在于,所述装置还包括:第二零填充模块,用于对填充有颜色值的所述图像空间中,未填充颜色值的区域分别进行零填充。
14.根据权利要求12或13所述的装置,其特征在于,所述装置还包括:增加模块,用于对填充有颜色值的各所述图像空间中,进行所述零填充的区域分别增加边界条件保护;
所述输出模块,还用于:将填充有颜色值的,且增加有边界条件保护的所述图像空间批量输入全卷积网络。
15.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
16.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。
CN201810397400.9A 2018-04-28 2018-04-28 一种基于深度学习的目标检测方法和装置 Active CN108596120B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810397400.9A CN108596120B (zh) 2018-04-28 2018-04-28 一种基于深度学习的目标检测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810397400.9A CN108596120B (zh) 2018-04-28 2018-04-28 一种基于深度学习的目标检测方法和装置

Publications (2)

Publication Number Publication Date
CN108596120A true CN108596120A (zh) 2018-09-28
CN108596120B CN108596120B (zh) 2021-01-26

Family

ID=63610988

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810397400.9A Active CN108596120B (zh) 2018-04-28 2018-04-28 一种基于深度学习的目标检测方法和装置

Country Status (1)

Country Link
CN (1) CN108596120B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110580445A (zh) * 2019-07-12 2019-12-17 西北工业大学 一种基于GIoU和加权NMS改进的人脸关键点检测方法
CN113566062A (zh) * 2021-07-22 2021-10-29 深圳创维-Rgb电子有限公司 智能升降系统及方法
CN114266846A (zh) * 2021-12-25 2022-04-01 福州大学 一种用于目标检测模型的自学习填充方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1658220A (zh) * 2003-12-11 2005-08-24 索尼英国有限公司 目标检测
WO2006108299A1 (en) * 2005-04-13 2006-10-19 Acd Systems, Ltd. Image contrast enhancement
CN104062212A (zh) * 2014-07-17 2014-09-24 扬州大学 一种分析植物细胞淀粉体和蛋白体几何特性的方法
CN105979244A (zh) * 2016-05-31 2016-09-28 十二维度(北京)科技有限公司 一种基于深度学习的2d图像转3d图像的方法及系统
CN106127170A (zh) * 2016-07-01 2016-11-16 重庆中科云丛科技有限公司 一种融合关键特征点的训练方法、识别方法及系统
CN107194380A (zh) * 2017-07-03 2017-09-22 上海荷福人工智能科技(集团)有限公司 一种复杂场景下人脸识别的深度卷积网络及学习方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1658220A (zh) * 2003-12-11 2005-08-24 索尼英国有限公司 目标检测
WO2006108299A1 (en) * 2005-04-13 2006-10-19 Acd Systems, Ltd. Image contrast enhancement
CN104062212A (zh) * 2014-07-17 2014-09-24 扬州大学 一种分析植物细胞淀粉体和蛋白体几何特性的方法
CN105979244A (zh) * 2016-05-31 2016-09-28 十二维度(北京)科技有限公司 一种基于深度学习的2d图像转3d图像的方法及系统
CN106127170A (zh) * 2016-07-01 2016-11-16 重庆中科云丛科技有限公司 一种融合关键特征点的训练方法、识别方法及系统
CN107194380A (zh) * 2017-07-03 2017-09-22 上海荷福人工智能科技(集团)有限公司 一种复杂场景下人脸识别的深度卷积网络及学习方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘伟强: "《基于级联卷积神经网络的人脸检测算法的研究》", 《中国学位论文库》 *
孙康 等;: "《基于级联卷积神经网络的人脸检测算法》", 《南京理工大学学报》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110580445A (zh) * 2019-07-12 2019-12-17 西北工业大学 一种基于GIoU和加权NMS改进的人脸关键点检测方法
CN110580445B (zh) * 2019-07-12 2023-02-07 西北工业大学 一种基于GIoU和加权NMS改进的人脸关键点检测方法
CN113566062A (zh) * 2021-07-22 2021-10-29 深圳创维-Rgb电子有限公司 智能升降系统及方法
CN114266846A (zh) * 2021-12-25 2022-04-01 福州大学 一种用于目标检测模型的自学习填充方法
CN114266846B (zh) * 2021-12-25 2024-06-14 福州大学 一种用于目标检测模型的自学习填充方法

Also Published As

Publication number Publication date
CN108596120B (zh) 2021-01-26

Similar Documents

Publication Publication Date Title
CN109816039B (zh) 一种跨模态信息检索方法、装置和存储介质
CN111144215B (zh) 图像处理方法、装置、电子设备及存储介质
KR101999639B1 (ko) 데이터 처리 시스템, 계산 노드 및 데이터 처리 방법
CN108596120A (zh) 一种基于深度学习的目标检测方法和装置
CN109376659A (zh) 用于人脸关键点网络检测模型的训练方法、人脸关键点检测方法、装置
CN114330692A (zh) 神经网络模型的部署方法、装置、设备及存储介质
CN111160140B (zh) 一种图像检测方法及装置
CN107003834B (zh) 行人检测设备和方法
CN112101360A (zh) 一种目标检测方法、装置以及计算机可读存储介质
CN110807110B (zh) 结合局部和全局特征的图片搜索方法、装置及电子设备
CN112101437A (zh) 基于图像检测的细粒度分类模型处理方法、及其相关设备
CN109711508A (zh) 图像处理方法和装置
CN106296622A (zh) 一种自动布局的拼图方法及装置
CN110069961A (zh) 一种物体检测方法和装置
CN110335330A (zh) 图像模拟生成方法及其系统、深度学习算法训练方法及电子设备
CN110633717A (zh) 一种目标检测模型的训练方法和装置
CN112434188A (zh) 一种异构数据库的数据集成方法、装置及存储介质
CN113191378A (zh) 图像搜索的预测方法、装置和系统
CN110222862A (zh) 码垛方法和装置
CN108182457A (zh) 用于生成信息的方法和装置
CN109522933A (zh) 用于货架的商品检测方法及装置
KR20180117619A (ko) 컴퓨팅 장치를 이용한 객체 관리 및 시각화
CN103955713A (zh) 一种图标识别方法和装置
CN108280135B (zh) 实现数据结构可视化的方法、装置和电子设备
CN110188727A (zh) 海洋溢油量估算方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant