CN108875535A - 图像检测方法、装置和系统及存储介质 - Google Patents

图像检测方法、装置和系统及存储介质 Download PDF

Info

Publication number
CN108875535A
CN108875535A CN201810118765.3A CN201810118765A CN108875535A CN 108875535 A CN108875535 A CN 108875535A CN 201810118765 A CN201810118765 A CN 201810118765A CN 108875535 A CN108875535 A CN 108875535A
Authority
CN
China
Prior art keywords
image
initial pictures
compression
location information
target object
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810118765.3A
Other languages
English (en)
Other versions
CN108875535B (zh
Inventor
周舒畅
杨弋
马灵威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Megvii Technology Co Ltd
Original Assignee
Beijing Megvii Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Megvii Technology Co Ltd filed Critical Beijing Megvii Technology Co Ltd
Priority to CN201810118765.3A priority Critical patent/CN108875535B/zh
Priority to US16/175,269 priority patent/US10796447B2/en
Publication of CN108875535A publication Critical patent/CN108875535A/zh
Application granted granted Critical
Publication of CN108875535B publication Critical patent/CN108875535B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4007Scaling of whole images or parts thereof, e.g. expanding or contracting based on interpolation, e.g. bilinear interpolation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例提供一种图像检测方法、装置和系统以及存储介质。图像检测方法包括:压缩初始图像,以获得压缩图像;对压缩图像进行目标检测,以获得目标对象在压缩图像中的第一位置信息;以及根据第一位置信息确定目标对象在初始图像中的第二位置信息。根据本发明实施例的图像检测方法、装置和系统以及存储介质,将初始图像进行压缩之后进行目标检测,根据压缩图像的目标检测结果确定初始图像中的目标对象的位置。由于基于压缩图像而非初始图像进行目标检测,因此该图像检测方法可以在不影响初始图像的目标位置检测准确度的情况下减少所需的计算量和存储空间。

Description

图像检测方法、装置和系统及存储介质
技术领域
本发明涉及图像处理领域,更具体地涉及一种图像检测方法、装置和系统以及存储介质。
背景技术
近年来,目标检测在很多领域都有广泛的应用,包括安防领域的人脸识别、行人检测、交通检测等,可以说目标检测已经应用于人们日常生活的方方面面。正是由于广泛的应用,使得不同的应用场景都对目标检测技术提出了更高的要求,尤其是在图像质量上。例如,在进行人脸检测时,用户希望得到高质量的人脸检测结果,而高质量的输出依赖于高质量的输入,但是高质量的图像往往会占用更多的计算量和存储空间,有可能会降低检测系统的整体性能。
发明内容
考虑到上述问题而提出了本发明。本发明提供了一种图像检测方法、装置和系统以及存储介质。
根据本发明一方面,提供了一种图像检测方法。图像检测方法包括:压缩初始图像,以获得压缩图像;对压缩图像进行目标检测,以获得目标对象在压缩图像中的第一位置信息;以及根据第一位置信息确定目标对象在初始图像中的第二位置信息。
示例性地,第一位置信息包括用于指示目标对象在压缩图像中的位置的第一对象框的坐标,根据第一位置信息确定目标对象在初始图像中的第二位置信息包括:根据第一对象框的坐标、初始图像与压缩图像之间的压缩比例,将第一对象框映射到初始图像上,以获得初始图像上的与第一对象框对应的第二对象框,其中第二位置信息为第二对象框的坐标。
示例性地,方法还包括:根据第二位置信息从初始图像中提取包含目标对象的图像块;以及将包含目标对象的图像块作为目标对象的对象图像输出。
示例性地,压缩初始图像,以获得压缩图像包括:将初始图像按预定比例压缩,以获得压缩图像。
示例性地,压缩初始图像,以获得压缩图像包括:将初始图像压缩到预定尺寸,以获得压缩图像。
示例性地,压缩初始图像,以获得压缩图像包括:对初始图像进行重采样,以获得压缩图像。
示例性地,在压缩初始图像,以获得压缩图像之前,方法还包括:判断初始图像的尺寸是否大于尺寸阈值,其中,在初始图像的尺寸大于尺寸阈值的情况下执行压缩初始图像,以获得压缩图像的步骤。
根据本发明另一方面,提供了一种图像检测装置,包括:压缩模块,用于压缩初始图像,以获得压缩图像;检测模块,用于对压缩图像进行目标检测,以获得目标对象在压缩图像中的第一位置信息;以及位置确定模块,用于根据第一位置信息确定目标对象在初始图像中的第二位置信息。
根据本发明另一方面,提供了一种图像检测系统,包括处理器和存储器,其中,所述存储器中存储有计算机程序指令,所述计算机程序指令被所述处理器运行时用于执行上述图像检测方法。
根据本发明另一方面,提供了一种存储介质,在所述存储介质上存储了程序指令,所述程序指令在运行时用于执行上述图像检测方法。
根据本发明实施例的图像检测方法、装置和系统以及存储介质,将初始输入图像进行压缩之后进行目标检测,根据压缩图像的目标检测结果确定初始图像中的目标对象的位置。由于基于压缩图像而非初始图像进行目标检测,因此该图像检测方法可以在不影响初始图像的目标位置检测准确度的情况下减少所需的计算量和存储空间。
附图说明
通过结合附图对本发明实施例进行更详细的描述,本发明的上述以及其它目的、特征和优势将变得更加明显。附图用来提供对本发明实施例的进一步理解,并且构成说明书的一部分,与本发明实施例一起用于解释本发明,并不构成对本发明的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1示出用于实现根据本发明实施例的图像检测方法和装置的示例电子设备的示意性框图;
图2示出根据本发明一个实施例的图像检测方法的示意性流程图;
图3示出根据本发明一个实施例的图像检测流程的示意图;
图4示出根据本发明一个实施例的图像检测装置的示意性框图;以及
图5示出根据本发明一个实施例的图像检测系统的示意性框图。
具体实施方式
为了使得本发明的目的、技术方案和优点更为明显,下面将参照附图详细描述根据本发明的示例实施例。显然,所描述的实施例仅仅是本发明的一部分实施例,而不是本发明的全部实施例,应理解,本发明不受这里描述的示例实施例的限制。基于本发明中描述的本发明实施例,本领域技术人员在没有付出创造性劳动的情况下所得到的所有其它实施例都应落入本发明的保护范围之内。
为了解决上述问题,本发明实施例提供了一种图像检测方法、装置和系统以及存储介质。根据本发明实施例,可以用初始图像(其可以为高画质图像,例如4K图像)作为整个图像检测系统的输入,对输入的图像进行压缩处理,将压缩图像作为目标检测算法的输入进行目标检测,计算出目标对象在压缩图像中的位置,然后根据该位置计算目标对象在初始图像中的位置。与直接基于初始图像进行目标检测相比,上述图像检测方法所需的计算量更少。根据本发明实施例的图像检测方法和装置可以应用于任何需要对目标对象进行检测的领域,例如人脸检测、文字检测、行人检测、车辆检测等。
首先,参照图1来描述用于实现根据本发明实施例的图像检测方法和装置的示例电子设备100。
如图1所示,电子设备100包括一个或多个处理器102、一个或多个存储装置104。可选地,电子设备100还可以包括输入装置106、输出装置108、以及图像采集装置110,这些组件通过总线系统112和/或其它形式的连接机构(未示出)互连。应当注意,图1所示的电子设备100的组件和结构只是示例性的,而非限制性的,根据需要,所述电子设备也可以具有其他组件和结构。
所述处理器102可以采用数字信号处理器(DSP)、现场可编程门阵列
(FPGA)、可编程逻辑阵列(PLA)中的至少一种硬件形式来实现,所述处理器102可以是中央处理单元(CPU)、图像处理器(GPU)、专用的集成电路(ASIC)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元中的一种或几种的组合,并且可以控制所述电子设备100中的其它组件以执行期望的功能。
所述存储装置104可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器102可以运行所述程序指令,以实现下文所述的本发明实施例中(由处理器实现)的客户端功能以及/或者其它期望的功能。在所述计算机可读存储介质中还可以存储各种应用程序和各种数据,例如所述应用程序使用和/或产生的各种数据等。
所述输入装置106可以是用户用来输入指令的装置,并且可以包括键盘、鼠标、麦克风和触摸屏等中的一个或多个。
所述输出装置108可以向外部(例如用户)输出各种信息(例如图像和/或声音),并且可以包括显示器、扬声器等中的一个或多个。可选地,所述输入装置106和所述输出装置108可以集成在一起,采用同一交互装置(例如触摸屏)实现。
所述图像采集装置110可以采集初始图像,并且将所采集的图像存储在所述存储装置104中以供其它组件使用。图像采集装置110可以是单独的相机或移动终端中的摄像头。应当理解,图像采集装置110仅是示例,电子设备100可以不包括图像采集装置110。在这种情况下,可以利用其他具有图像采集能力的器件采集初始图像,并将采集的图像发送给电子设备100。
示例性地,用于实现根据本发明实施例的图像检测方法和装置的示例电子设备可以在诸如个人计算机或远程服务器等的设备上实现。
下面,将参考图2描述根据本发明实施例的图像检测方法。图2示出根据本发明一个实施例的图像检测方法200的示意性流程图。如图2所示,图像检测方法200包括以下步骤S210、S220和S230。
在步骤S210,压缩初始图像,以获得压缩图像。
初始图像可以是任何需要进行目标检测的图像。初始图像可以是静态图像,也可以是视频中的视频帧。初始图像可以是图像采集装置采集到的原始图像,也可以是对原始图像进行预处理(诸如数字化、归一化、平滑等)之后获得的图像。
示例性地,初始图像可以为高画质图像,例如4K图像。高画质图像和低画质图像的划分标准可以预先设定。在步骤S210中,可以采用任何合适的现有或将来可能出现的图像压缩技术对初始图像进行压缩,使初始图像的尺寸减小。与初始图像相比,压缩图像所需存储空间更小,对其进行处理所需的计算量也更小。
示例性地,步骤S210可以包括:对初始图像进行重采样,以获得压缩图像。示例性地,可以采用最近邻差值法、双线性差值法或双立方卷积法等方法对初始图像进行重采样,以获得压缩图像。例如,可以将初始图像平均划分为特定数目的区域,初始图像的每个区域对应于压缩图像的一个像素。对初始图像的每个区域内的所有像素的像素值求平均,并将获得的平均值作为压缩图像上的与该区域对应的像素的像素值,从而获得压缩图像。
在步骤S220,对压缩图像进行目标检测,以获得目标对象在压缩图像中的第一位置信息。
目标对象可以是任何物体,包括但不限于:文字、特定图案、人或人体的一部分(诸如人脸)、动物、车辆、建筑物等。在本文中,目标对象是某个特定的对象,例如,假设初始图像是包含多个人脸的图像,则目标对象可以是多个人脸之一。
目标检测是指:给定一张图像(静态图像或者视频帧)作为输入信息,找出输入图像中目标对象的位置和大小,并在图像上用大小适中的对象框进行标识。步骤S220可以采用任何现有的或将来出现的目标检测算法实现。示例性地,目标检测算法可以是基于神经网络的算法,例如faster R-CNN、SSD或R-FCN方法。
示例性地,可以预先训练一个神经网络,将压缩图像输入训练好的神经网络中,神经网络可以输出目标对象的位置信息。本文所述的目标对象的位置信息可以包括目标对象所在的对象区域的信息,例如,目标对象的位置信息可以为包含目标对象的矩形框(即对象框)的四个顶点的坐标或者矩形框的至少一个顶点的坐标以及矩形框的宽度和高度。可以理解,根据本文所述的目标对象的位置信息可以获知目标对象的大小。为区分目标对象在压缩图像和初始图像中的位置信息,将目标对象在压缩图像中的位置信息称为第一位置信息,将目标对象在初始图像中的位置信息称为第二位置信息。可以理解,本文所述的第一、第二等术语并不表示顺序或其他特殊含义,仅用于区分目的。
示例性地,可以检测目标对象所在的对象区域的位置,对象区域可以用矩形框(即对象框)标示,目标对象的位置信息可以为该矩形框的坐标信息。矩形框的坐标信息可以用四个数值表示,例如用矩形框的左上角横坐标x、左上角纵坐标y、矩形框的宽度w和矩形框的高度h表示。
在步骤S230,根据第一位置信息确定目标对象在初始图像中的第二位置信息。
可以理解,初始图像与压缩图像之间的像素具有对应关系,根据第一位置信息将压缩图像上的包含目标对象的对象框映射到初始图像上,即可确定目标对象在初始图像上的位置。例如,步骤S230可以包括:根据第一位置信息以及初始图像与压缩图像之间的压缩比例计算第二位置信息。具体地,可以根据压缩图像中包含目标对象的第一对象框的坐标、初始图像与压缩图像之间的压缩比例,将第一对象框映射到初始图像上,以获得初始图像上的与第一对象框对应的第二对象框,其中第二位置信息为第二对象框在初始图像中的坐标。
图3示出根据本发明一个实施例的图像检测流程的示意图。如图3所示,初始提供一个4K图像(可以是静态图像或视频帧)。随后,通过重采样方式将该4K图像压缩为低画质图像,例如压缩为1080P图像。随后,将低画质图像输入目标检测模块,利用目标检测算法对低画质图像中的目标对象进行检测。随后,将从低画质图像中检测出的对象框映射到4K图像中。最后,可选地,可以从4K图像中提取出包含目标对象的图像块并将图像块作为对象图像输出。如上文所述,与初始图像相比,压缩图像所需的计算量更少。此外,与初始图像相比,在压缩图像的目标检测过程中,所产生的中间数据更少,所需的存储空间也更少。
根据本发明实施例的图像检测方法,将初始图像进行压缩之后进行目标检测,根据压缩图像的目标检测结果确定初始图像中的目标对象的位置。由于基于压缩图像而非初始图像进行目标检测,因此该图像检测方法可以在不影响初始图像的目标位置检测准确度的情况下减少计算量和存储空间。
示例性地,根据本发明实施例的图像检测方法可以在具有存储器和处理器的设备、装置或者系统中实现。
根据本发明实施例的图像检测方法可以部署在人脸图像采集端处,例如,在安防应用领域,可以部署在门禁系统的图像采集端;在金融应用领域,可以部署在个人终端处,诸如智能电话、平板电脑、个人计算机等。
替代地,根据本发明实施例的图像检测方法还可以分布地部署在服务器端(或云端)和个人终端处。例如,可以在个人终端采集初始图像,个人终端将采集的图像传送给服务器端(或云端),然后由服务器端(或云端)进行图像检测。
根据本发明实施例,图像检测方法200还可以包括:根据第二位置信息从初始图像中提取包含目标对象的图像块;以及将包含目标对象的图像块作为目标对象的对象图像输出。
确定初始图像中目标对象的对象框的坐标之后,可以沿对象框截取包含目标对象的图像块,并将截取的图像块作为新的图像(本文称为对象图像)输出,输出的图像可以保存到本地或者传送到服务器端,该过程可以称为推图。参考图3,原始的4K图像中包含两个目标对象(大牛和小牛),在最后的步骤中截取获得两个大小不同的图像,分别包含这两个目标对象。根据本发明实施例,可以输入高画质的初始图像,基于低画质的压缩图像进行目标检测,随后从高画质的初始图像上提取包含目标对象的图像块输出,这种方式可以在尽可能少地占用系统资源的情况下实现具有高画质输入输出的目标检测流程。
根据本发明实施例,步骤S210可以包括:将初始图像按预定比例压缩,以获得压缩图像。在一个示例中,可以直接将初始图像的尺寸压缩至原来的一半,例如将4K图像压缩至1080P图像,这样做的话目标检测所需的计算量可以减小至原来的四分之一。
根据本发明实施例,步骤S210可以包括:将初始图像压缩到预定尺寸,以获得压缩图像。
预定尺寸可以是任何合适的尺寸,其可以根据需要设定,本发明不对此进行限制。例如,可以根据图像检测系统的计算能力确定其能处理的较为合适的图像尺寸,并将该尺寸作为预定尺寸。例如,假设图像检测系统最多能处理720P的图像,则无论初始图像的尺寸多大,均可以直接将其压缩到720P或更小。
根据本发明实施例,在步骤S210之前,图像检测方法200还可以包括:判断初始图像的尺寸是否大于尺寸阈值,其中,在初始图像的尺寸大于尺寸阈值的情况下执行步骤S210。
尺寸阈值可以是任何合适的值,其可以根据需要设定,本发明不对此进行限制。可以设定合适的阈值作为标准,如果初始图像的尺寸不大于该阈值,则认为其所需的计算量不大,可以不对初始图像进行压缩,直接对初始图像进行目标检测即可。
根据本发明另一方面,提供一种图像检测装置。图4示出了根据本发明一个实施例的图像检测装置400的示意性框图。
如图4所示,根据本发明实施例的图像检测装置400包括压缩模块410、检测模块420和位置确定模块430。所述各个模块可分别执行上文中结合图2-3描述的图像检测方法的各个步骤/功能。以下仅对该图像检测装置400的各部件的主要功能进行描述,而省略以上已经描述过的细节内容。
压缩模块410用于压缩初始图像,以获得压缩图像。压缩模块410可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现。
检测模块420用于对压缩图像进行目标检测,以获得目标对象在所述压缩图像中的第一位置信息。检测模块420可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现。
位置确定模块430用于根据第一位置信息确定目标对象在初始图像中的第二位置信息。位置确定模块430可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现。
示例性地,位置确定模块430具体用于:根据第一对象框的坐标、初始图像与压缩图像之间的压缩比例,将第一对象框映射到初始图像上,以获得初始图像上的与第一对象框对应的第二对象框,其中第二位置信息为第二对象框的坐标。
示例性地,图像检测装置400还包括:提取模块(未示出),用于根据第二位置信息从初始图像中提取包含目标对象的图像块;以及输出模块(未示出),用于将包含目标对象的图像块作为目标对象的对象图像输出。
示例性地,压缩模块410具体用于:将初始图像按预定比例压缩,以获得压缩图像。
示例性地,压缩模块410具体用于:将初始图像压缩到预定尺寸,以获得压缩图像。
示例性地,压缩模块410具体用于:对初始图像进行重采样,以获得压缩图像。
示例性地,图像检测装置400还包括:判断模块(未示出),用于在压缩模块410压缩初始图像,以获得压缩图像之前,判断初始图像的尺寸是否大于尺寸阈值,其中,在初始图像的尺寸大于尺寸阈值的情况下启动压缩模块410。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
图5示出了根据本发明一个实施例的图像检测系统500的示意性框图。图像检测系统500包括图像采集装置510、存储装置(即存储器)520、以及处理器530。
所述图像采集装置510用于采集初始图像。图像采集装置510是可选的,图像检测系统500可以不包括图像采集装置510。在这种情况下,可以利用其他图像采集装置采集初始图像,并将采集的图像发送给图像检测系统500。
所述存储装置520存储用于实现根据本发明实施例的图像检测方法中的相应步骤的计算机程序指令。
所述处理器530用于运行所述存储装置520中存储的计算机程序指令,以执行根据本发明实施例的图像检测方法的相应步骤。
在一个实施例中,所述计算机程序指令被所述处理器530运行时用于执行以下步骤:压缩初始图像,以获得压缩图像;对压缩图像进行目标检测,以获得目标对象在压缩图像中的第一位置信息;以及根据第一位置信息确定目标对象在初始图像中的第二位置信息。
示例性地,图像检测系统500可以包括相机,相机可以包括用于采集初始图像的图像传感器。在本实施例中,图像传感器即上述图像采集装置510。可选地,相机还可以包括上述存储装置520以及处理器530。例如,所述相机为人脸抓拍相机。
示例性地,第一位置信息包括用于指示目标对象在压缩图像中的位置的第一对象框的坐标,所述计算机程序指令被所述处理器530运行时所用于执行的根据第一位置信息确定目标对象在初始图像中的第二位置信息的步骤包括:根据第一对象框的坐标、初始图像与压缩图像之间的压缩比例,将第一对象框映射到初始图像上,以获得初始图像上的与第一对象框对应的第二对象框,其中第二位置信息为第二对象框的坐标。
示例性地,所述计算机程序指令被所述处理器530运行时还用于执行以下步骤:根据第二位置信息从初始图像中提取包含目标对象的图像块;以及将包含目标对象的图像块作为目标对象的对象图像输出。
示例性地,所述计算机程序指令被所述处理器530运行时所用于执行的压缩初始图像,以获得压缩图像的步骤包括:将初始图像按预定比例压缩,以获得压缩图像。
示例性地,所述计算机程序指令被所述处理器530运行时所用于执行的压缩初始图像,以获得压缩图像的步骤包括:将初始图像压缩到预定尺寸,以获得压缩图像。
示例性地,所述计算机程序指令被所述处理器530运行时所用于执行的压缩初始图像,以获得压缩图像的步骤包括:对初始图像进行重采样,以获得压缩图像。
示例性地,在所述计算机程序指令被所述处理器530运行时所用于执行的压缩初始图像,以获得压缩图像的步骤之前,所述计算机程序指令被所述处理器530运行时还用于执行以下步骤:判断初始图像的尺寸是否大于尺寸阈值,其中,所述计算机程序指令被所述处理器530运行时用于在初始图像的尺寸大于尺寸阈值的情况下执行压缩初始图像,以获得压缩图像的步骤。
此外,根据本发明实施例,还提供了一种存储介质,在所述存储介质上存储了程序指令,在所述程序指令被计算机或处理器运行时用于执行本发明实施例的图像检测方法的相应步骤,并且用于实现根据本发明实施例的图像检测装置中的相应模块。所述存储介质例如可以包括智能电话的存储卡、平板电脑的存储部件、个人计算机的硬盘、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、便携式紧致盘只读存储器(CD-ROM)、USB存储器、或者上述存储介质的任意组合。
在一个实施例中,所述程序指令在被计算机或处理器运行时可以使得计算机或处理器实现根据本发明实施例的图像检测装置的各个功能模块,并和/或者可以执行根据本发明实施例的图像检测方法。
在一个实施例中,所述程序指令在运行时用于执行以下步骤:压缩初始图像,以获得压缩图像;对压缩图像进行目标检测,以获得目标对象在压缩图像中的第一位置信息;以及根据第一位置信息确定目标对象在初始图像中的第二位置信息。
示例性地,第一位置信息包括用于指示目标对象在压缩图像中的位置的第一对象框的坐标,所述程序指令在运行时所用于执行的根据第一位置信息确定目标对象在初始图像中的第二位置信息的步骤包括:根据第一对象框的坐标、初始图像与压缩图像之间的压缩比例,将第一对象框映射到初始图像上,以获得初始图像上的与第一对象框对应的第二对象框,其中第二位置信息为第二对象框的坐标。
示例性地,所述程序指令在运行时还用于执行以下步骤:根据第二位置信息从初始图像中提取包含目标对象的图像块;以及将包含目标对象的图像块作为目标对象的对象图像输出。
示例性地,所述程序指令在运行时所用于执行的压缩初始图像,以获得压缩图像的步骤包括:将初始图像按预定比例压缩,以获得压缩图像。
示例性地,所述程序指令在运行时所用于执行的压缩初始图像,以获得压缩图像的步骤包括:将初始图像压缩到预定尺寸,以获得压缩图像。
示例性地,所述程序指令在运行时所用于执行的压缩初始图像,以获得压缩图像的步骤包括:对初始图像进行重采样,以获得压缩图像。
示例性地,在所述程序指令在运行时所用于执行的压缩初始图像,以获得压缩图像的步骤之前,所述程序指令在运行时还用于执行以下步骤:判断初始图像的尺寸是否大于尺寸阈值,其中,所述程序指令在运行时用于在初始图像的尺寸大于尺寸阈值的情况下执行压缩初始图像,以获得压缩图像的步骤。
根据本发明实施例的图像检测系统中的各模块可以通过根据本发明实施例的实施图像检测的电子设备的处理器运行在存储器中存储的计算机程序指令来实现,或者可以在根据本发明实施例的计算机程序产品的计算机可读存储介质中存储的计算机指令被计算机运行时实现。
尽管这里已经参考附图描述了示例实施例,应理解上述示例实施例仅仅是示例性的,并且不意图将本发明的范围限制于此。本领域普通技术人员可以在其中进行各种改变和修改,而不偏离本发明的范围和精神。所有这些改变和修改意在被包括在所附权利要求所要求的本发明的范围之内。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。例如,以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个设备,或一些特征可以忽略,或不执行。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该本发明的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如相应的权利要求书所反映的那样,其发明点在于可以用少于某个公开的单个实施例的所有特征的特征来解决相应的技术问题。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域的技术人员可以理解,除了特征之间相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的图像检测装置中的一些模块的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
以上所述,仅为本发明的具体实施方式或对具体实施方式的说明,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。本发明的保护范围应以权利要求的保护范围为准。

Claims (11)

1.一种图像检测方法,包括:
压缩初始图像,以获得压缩图像;
对压缩图像进行目标检测,以获得目标对象在所述压缩图像中的第一位置信息;以及
根据所述第一位置信息确定所述目标对象在所述初始图像中的第二位置信息。
2.如权利要求1所述的方法,其中,所述第一位置信息包括用于指示所述目标对象在所述压缩图像中的位置的第一对象框的坐标,所述根据所述第一位置信息确定所述目标对象在所述初始图像中的第二位置信息包括:
根据所述第一对象框的坐标、所述初始图像与所述压缩图像之间的压缩比例,将所述第一对象框映射到所述初始图像上,以获得所述初始图像上的与所述第一对象框对应的第二对象框,其中所述第二位置信息为所述第二对象框的坐标。
3.如权利要求1所述的方法,其中,所述方法还包括:
根据所述第二位置信息从所述初始图像中提取包含所述目标对象的图像块;以及
将所述包含所述目标对象的图像块作为所述目标对象的对象图像输出。
4.如权利要求1所述的方法,其中,所述压缩初始图像,以获得压缩图像包括:
将所述初始图像按预定比例压缩,以获得所述压缩图像。
5.如权利要求1所述的方法,其中,所述压缩初始图像,以获得压缩图像包括:
将所述初始图像压缩到预定尺寸,以获得所述压缩图像。
6.如权利要求1所述的方法,其中,所述压缩初始图像,以获得压缩图像包括:
对所述初始图像进行重采样,以获得所述压缩图像。
7.如权利要求1至6任一项所述的方法,其中,在所述压缩初始图像,以获得压缩图像之前,所述方法还包括:
判断所述初始图像的尺寸是否大于尺寸阈值,
在所述初始图像的尺寸大于所述尺寸阈值的情况下执行所述压缩初始图像,以获得压缩图像的步骤。
8.一种图像检测装置,包括:
压缩模块,用于压缩初始图像,以获得压缩图像;
检测模块,用于对压缩图像进行目标检测,以获得目标对象在所述压缩图像中的第一位置信息;以及
位置确定模块,用于根据所述第一位置信息确定所述目标对象在所述初始图像中的第二位置信息。
9.一种图像检测系统,包括处理器和存储器,其中,所述存储器中存储有计算机程序指令,所述计算机程序指令被所述处理器运行时用于执行如权利要求1至7任一项所述的图像检测方法。
10.如权利要求9所述的系统,其中,所述图像检测系统包括相机,所述相机包括用于采集所述初始图像的图像传感器。
11.一种存储介质,在所述存储介质上存储了程序指令,所述程序指令在运行时用于执行如权利要求1至7任一项所述的图像检测方法。
CN201810118765.3A 2018-02-06 2018-02-06 图像检测方法、装置和系统及存储介质 Active CN108875535B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201810118765.3A CN108875535B (zh) 2018-02-06 2018-02-06 图像检测方法、装置和系统及存储介质
US16/175,269 US10796447B2 (en) 2018-02-06 2018-10-30 Image detection method, apparatus and system and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810118765.3A CN108875535B (zh) 2018-02-06 2018-02-06 图像检测方法、装置和系统及存储介质

Publications (2)

Publication Number Publication Date
CN108875535A true CN108875535A (zh) 2018-11-23
CN108875535B CN108875535B (zh) 2023-01-10

Family

ID=64326013

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810118765.3A Active CN108875535B (zh) 2018-02-06 2018-02-06 图像检测方法、装置和系统及存储介质

Country Status (2)

Country Link
US (1) US10796447B2 (zh)
CN (1) CN108875535B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110348295A (zh) * 2019-05-30 2019-10-18 深圳大学 目标检测方法、体感交互设备以及存储介质
CN112907517A (zh) * 2021-01-28 2021-06-04 上海商汤智能科技有限公司 一种图像处理方法、装置、计算机设备及存储介质
CN113639871A (zh) * 2020-04-24 2021-11-12 杭州海康威视系统技术有限公司 目标对象检测方法、装置及设备、存储介质

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110555833B (zh) * 2019-08-30 2023-03-21 联想(北京)有限公司 图像处理方法、装置、电子设备以及介质
CN111199230B (zh) * 2020-01-03 2023-07-07 腾讯科技(深圳)有限公司 目标检测的方法、装置、电子设备及计算机可读存储介质
CN111881846B (zh) * 2020-07-30 2024-04-02 北京市商汤科技开发有限公司 图像处理方法和相关装置、设备、存储介质
CN112087590A (zh) * 2020-08-14 2020-12-15 北京大米科技有限公司 图像处理方法、装置、系统及计算机存储介质
CN112380372A (zh) * 2020-11-13 2021-02-19 上海哔哩哔哩科技有限公司 搜索图像的方法及计算设备
CN114531580B (zh) * 2020-11-23 2023-11-21 北京四维图新科技股份有限公司 图像处理方法及装置
CN116596931B (zh) * 2023-07-18 2023-11-17 宁德时代新能源科技股份有限公司 图像处理方法、装置、设备、存储介质和程序产品

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103116987A (zh) * 2013-01-22 2013-05-22 华中科技大学 一种基于监控视频处理的车流统计和违规检测的方法
CN105744232A (zh) * 2016-03-25 2016-07-06 南京第五十五所技术开发有限公司 一种基于行为分析技术的输电线路视频防外破的方法
US9465994B1 (en) * 2015-02-23 2016-10-11 Amazon Technologies, Inc. Predicting performance and success of large-scale vision algorithms
CN106250838A (zh) * 2016-07-27 2016-12-21 乐视控股(北京)有限公司 车辆识别方法及系统
CN106780727A (zh) * 2016-12-27 2017-05-31 深圳市捷顺科技实业股份有限公司 一种车头检测模型重建方法及装置
CN106960195A (zh) * 2017-03-27 2017-07-18 深圳市丰巨泰科电子有限公司 一种基于深度学习的人群计数方法及装置
CN107578021A (zh) * 2017-09-13 2018-01-12 北京文安智能技术股份有限公司 基于深度学习网络的行人检测方法、装置及系统

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69831519T2 (de) * 1997-01-17 2006-06-14 Matsushita Electric Works Ltd System und Verfahren zur Lageermittlung
US6801665B1 (en) * 1998-09-15 2004-10-05 University Of Maryland Method and apparatus for compressing and decompressing images
EP1748387B1 (en) * 2004-05-21 2018-12-05 Asahi Kasei Kabushiki Kaisha Devices for classifying the arousal state of the eyes of a driver, corresponding method and computer readable storage medium
JP4343120B2 (ja) * 2005-01-21 2009-10-14 ソニー株式会社 画像検索装置及び方法、並びにプログラム及びプログラム記録媒体
US8059859B2 (en) * 2007-05-31 2011-11-15 Canon Kabushiki Kaisha Image processing apparatus and method of controlling the same
JP5856682B2 (ja) * 2012-09-14 2016-02-10 本田技研工業株式会社 対象物識別装置
US9607015B2 (en) * 2013-12-20 2017-03-28 Qualcomm Incorporated Systems, methods, and apparatus for encoding object formations
BR102015005929B1 (pt) * 2015-03-17 2021-11-30 Samsung Eletrônica Da Amazônia Ltda Sistema e método para composição e compressão de vídeo com base em contexto a partir de objetos com resolução espacial normalizada
US10019631B2 (en) * 2015-11-05 2018-07-10 Qualcomm Incorporated Adapting to appearance variations when tracking a target object in video sequence
US20170134746A1 (en) * 2015-11-06 2017-05-11 Intel Corporation Motion vector assisted video stabilization
JP6729170B2 (ja) * 2016-08-23 2020-07-22 沖電気工業株式会社 画像処理システム及び画像復号装置
JP2018136803A (ja) * 2017-02-23 2018-08-30 株式会社日立製作所 画像認識システム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103116987A (zh) * 2013-01-22 2013-05-22 华中科技大学 一种基于监控视频处理的车流统计和违规检测的方法
US9465994B1 (en) * 2015-02-23 2016-10-11 Amazon Technologies, Inc. Predicting performance and success of large-scale vision algorithms
CN105744232A (zh) * 2016-03-25 2016-07-06 南京第五十五所技术开发有限公司 一种基于行为分析技术的输电线路视频防外破的方法
CN106250838A (zh) * 2016-07-27 2016-12-21 乐视控股(北京)有限公司 车辆识别方法及系统
CN106780727A (zh) * 2016-12-27 2017-05-31 深圳市捷顺科技实业股份有限公司 一种车头检测模型重建方法及装置
CN106960195A (zh) * 2017-03-27 2017-07-18 深圳市丰巨泰科电子有限公司 一种基于深度学习的人群计数方法及装置
CN107578021A (zh) * 2017-09-13 2018-01-12 北京文安智能技术股份有限公司 基于深度学习网络的行人检测方法、装置及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110348295A (zh) * 2019-05-30 2019-10-18 深圳大学 目标检测方法、体感交互设备以及存储介质
CN113639871A (zh) * 2020-04-24 2021-11-12 杭州海康威视系统技术有限公司 目标对象检测方法、装置及设备、存储介质
CN113639871B (zh) * 2020-04-24 2022-12-23 杭州海康威视系统技术有限公司 目标对象检测方法、装置及设备、存储介质
CN112907517A (zh) * 2021-01-28 2021-06-04 上海商汤智能科技有限公司 一种图像处理方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN108875535B (zh) 2023-01-10
US10796447B2 (en) 2020-10-06
US20190244387A1 (en) 2019-08-08

Similar Documents

Publication Publication Date Title
CN108875535A (zh) 图像检测方法、装置和系统及存储介质
CN106203305B (zh) 人脸活体检测方法和装置
CN106251338B (zh) 目标完整性检测方法及装置
CN106650662B (zh) 目标对象遮挡检测方法及装置
CN108875522A (zh) 人脸聚类方法、装置和系统及存储介质
CN108416902B (zh) 基于差异识别的实时物体识别方法和装置
CN108875517B (zh) 视频处理方法、装置和系统及存储介质
CN108932456B (zh) 人脸识别方法、装置和系统及存储介质
CN108875676A (zh) 活体检测方法、装置及系统
CN109117714A (zh) 一种同行人员识别方法、装置、系统及计算机存储介质
CN108875540A (zh) 图像处理方法、装置和系统及存储介质
CN106716450A (zh) 利用边缘向量的基于图像的特征检测
CN111008935B (zh) 一种人脸图像增强方法、装置、系统及存储介质
CN108875723A (zh) 对象检测方法、装置和系统及存储介质
CN108875481B (zh) 用于行人检测的方法、装置、系统及存储介质
CN108875932A (zh) 图像识别方法、装置和系统及存储介质
US8903139B2 (en) Method of reconstructing three-dimensional facial shape
CN108876804A (zh) 抠像模型训练和图像抠像方法、装置和系统及存储介质
CN108875521A (zh) 人脸检测方法、装置、系统和存储介质
CN110263680B (zh) 图像处理方法、装置和系统及存储介质
CN111626163B (zh) 一种人脸活体检测方法、装置及计算机设备
CN108921876A (zh) 视频处理方法、装置和系统及存储介质
CN109522790A (zh) 人体属性识别方法、装置、存储介质及电子设备
CN108875515A (zh) 人脸识别方法、装置、系统、存储介质和抓拍机
CN108734052A (zh) 文字检测方法、装置和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant