CN108288252B - 图像批处理方法、装置及电子设备 - Google Patents

图像批处理方法、装置及电子设备 Download PDF

Info

Publication number
CN108288252B
CN108288252B CN201810151216.6A CN201810151216A CN108288252B CN 108288252 B CN108288252 B CN 108288252B CN 201810151216 A CN201810151216 A CN 201810151216A CN 108288252 B CN108288252 B CN 108288252B
Authority
CN
China
Prior art keywords
image
convolution
images
processing
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810151216.6A
Other languages
English (en)
Other versions
CN108288252A (zh
Inventor
梁喆
朱雨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aixin Yuanzhi Semiconductor Co ltd
Original Assignee
Beijing Kuangshi Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kuangshi Technology Co Ltd filed Critical Beijing Kuangshi Technology Co Ltd
Priority to CN201810151216.6A priority Critical patent/CN108288252B/zh
Publication of CN108288252A publication Critical patent/CN108288252A/zh
Application granted granted Critical
Publication of CN108288252B publication Critical patent/CN108288252B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4038Image mosaicing, e.g. composing plane images from plane sub-images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4046Scaling of whole images or parts thereof, e.g. expanding or contracting using neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Image Processing (AREA)

Abstract

本发明提供了一种图像批处理方法、装置及电子设备,涉及图像处理技术领域,该方法采用神经网络执行,该方法包括:获取多张待处理的第一图像;对多张第一图像进行拼接处理,以形成一张第二图像;对第二图像进行处理,得到处理结果。本发明能够有效提升图像处理效率。

Description

图像批处理方法、装置及电子设备
技术领域
本发明涉及图像处理技术领域,尤其是涉及一种图像批处理方法、装置及电子设备。
背景技术
在诸如人脸识别、目标检测等智能领域中,神经网络凭借着其强大的计算能力已得到广泛应用,诸如,神经网络可以较好地对图像进行识别处理。在诸如抓拍机、人脸识别器等图像处理设备中均应用神经网络模型对图像进行处理。
神经网络通常一次仅能处理一张图像,得到该张图像对应的处理结果,但是这种方式会在一定程度上影响图像处理设备的处理效率。以抓拍机为例进行说明,抓拍机能够利用抓拍芯片从采集的图像中抠取仅包含有目标对象(诸如,人脸)的小图像,然后将小图像输入至内部芯片上设置的识别神经网络,以使识别神经网络对小图像进行处理,诸如进行人脸识别、属性识别等检测操作。但是,由于抓拍机中的识别神经网络一次仅对一张小图像进行处理,而抓拍芯片可能会从采集的图像中抠取较多数量的待处理的小图像,毫无疑问,这种对多张小图像逐一进行单张处理的方式会导致抓拍机的图像处理效率较低。
针对现有技术中图像处理方式较为低效的问题,目前尚未提出有效的解决方案。
发明内容
有鉴于此,本发明的目的在于提供一种图像批处理方法、装置及电子设备,能够有效提升图像处理效率。
为了实现上述目的,本发明实施例采用的技术方案如下:
第一方面,本发明实施例提供了一种图像批处理方法,所述方法包括:获取多张待处理的第一图像;对多张所述第一图像进行拼接处理,以形成一张第二图像;通过神经网络对所述第二图像进行处理,得到处理结果。
进一步,所述拼接处理的步骤包括:将待要拼接在一起的两张所述第一图像的邻边对齐;在对齐的所述邻边之间填充预设数量的无效像素,通过所述无效像素连接所述邻边。
进一步,所述第二图像为N*M个所述第一图像构成的图像矩阵;N为所述第二图像在水平方向所包含的第一图像的张数,M为所述第二图像在竖直方向所包含的第一图像的张数;所述对多张所述第一图像进行拼接处理的步骤,包括:获取与所述第一图像的数量对应的拼接参数;其中,所述拼接参数N值和M值;按照所述拼接参数对多张所述第一图像进行拼接处理。
进一步,所述通过神经网络对所述第二图像进行处理,得到处理结果的步骤,包括:通过卷积神经网络对所述第二图像进行卷积处理,得到卷积结果;其中,所述卷积结果为有效卷积值和无效卷积值构成的结果矩阵;识别所述结果矩阵中的无效卷积值;将所述无效卷积值从所述结果矩阵中剔除,得到有效结果矩阵;所述有效结果矩阵由所述有效卷积值构成;将所述有效结果矩阵作为所述第二图像的处理结果。
进一步,所述识别所述结果矩阵中的无效卷积值的步骤,包括:根据所述无效像素在所述第二图像中的位置,识别所述结果矩阵中的无效卷积值;其中,所述无效卷积值在所述结果矩阵中的位置与所述无效像素在所述第二图像中的位置相对应。
进一步,所述按照所述拼接参数对多张所述第一图像进行拼接处理的步骤,包括:在所述水平方向上对N张所述第一图像逐一进行拼接处理,形成所述图像矩阵的第一水平图像行列;在已形成的所述第一水平图像行列的下一行继续对另外N张所述第一图像逐一进行拼接处理,形成所述图像矩阵的第二水平图像行列;其中,所述第二水平图像行列中的第一图像分别与水平相邻的第一图像、垂直相邻的第一水平图像行列中的第一图像,拼接在一起;重复执行上述步骤,直至形成所述图像矩阵的第M水平图像行列。
进一步,所述预设数量为一至五个中的任一个。
进一步,所述预设数量为两个。
第二方面,本发明实施例还提供一种图像批处理装置,所述装置包括:图像获取模块,用于获取多张待处理的第一图像;拼接模块,用于对多张所述第一图像进行拼接处理,以形成一张第二图像;处理模块,用于通过神经网络对所述第二图像进行处理,得到处理结果。
第三方面,本发明实施例提供了一种电子设备,包括存储器和处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面任一项所述的方法的步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述第一方面任一项所述的方法的步骤。
本发明实施例提供了一种图像批处理方法、装置及电子设备,通过将多张第一图像进行拼接形成第二图像,神经网络可直接对第二图像进行处理,得到处理结果。本实施例提供的上述方式通过将多张小图像进行拼接形成一张大图像,从而可对多张小图像同时进行批处理,能够有效提升神经网络的图像处理效率。
本公开的其他特征和优点将在随后的说明书中阐述,或者,部分特征和优点可以从说明书推知或毫无疑义地确定,或者通过实施本公开的上述技术即可得知。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本发明实施例所提供的一种电子设备的结构示意图;
图2示出了本发明实施例所提供的一种图像批处理方法流程图;
图3示出了本发明实施例所提供的一种图像拼接示意图;
图4示出了本发明实施例所提供的另一种图像拼接示意图;
图5示出了本发明实施例所提供的一种卷积处理示意图;
图6示出了本发明实施例所提供的一种处理结果示意图;
图7示出了本发明实施例所提供的一种小图像拼接流程图;
图8示出了本发明实施例所提供的一种大图像输出流程图;
图9示出了本发明实施例所提供的一种图像批处理装置的结构框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
考虑到现有技术中神经网络单张处理图像的方式较为低效,从而影响图像处理设备的处理效率的问题,本发明实施例提供的一种图像批处理方法、装置及电子设备,该技术可应用于涉及图像处理的电子设备,诸如摄像机、抓拍机、人脸识别器、智能手机或电脑等,以下对本发明实施例进行详细介绍。
实施例一:
首先,参照图1来描述用于实现本发明实施例的图像批处理方法、装置及电子设备的示例电子设备100。
如图1所示的一种电子设备的结构示意图,电子设备100包括一个或多个处理器102、一个或多个存储装置104、输入装置106、输出装置108以及图像采集装置110,这些组件通过总线系统112和/或其它形式的连接机构(未示出)互连。应当注意,图1所示的电子设备100的组件和结构只是示例性的,而非限制性的,根据需要,所述电子设备也可以具有其他组件和结构。
所述处理器102可以采用数字信号处理器(DSP)、现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)中的至少一种硬件形式来实现,所述处理器102可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元中的一种或几种的组合,并且可以控制所述电子设备100中的其它组件以执行期望的功能。
所述存储装置104可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器102可以运行所述程序指令,以实现下文所述的本发明实施例中(由处理器实现)的客户端功能以及/或者其它期望的功能。在所述计算机可读存储介质中还可以存储各种应用程序和各种数据,例如所述应用程序使用和/或产生的各种数据等。
所述输入装置106可以是用户用来输入指令的装置,并且可以包括键盘、鼠标、麦克风和触摸屏等中的一个或多个。
所述输出装置108可以向外部(例如,用户)输出各种信息(例如,图像或声音),并且可以包括显示器、扬声器等中的一个或多个。
所述图像采集装置110可以拍摄用户期望的图像(例如照片、视频等),并且将所拍摄的图像存储在所述存储装置104中以供其它组件使用。
示例性地,用于实现根据本发明实施例的一种图像批处理方法、装置及电子设备的示例电子设备可以被实现为诸如摄像机、抓拍机、智能手机、平板电脑等智能终端。
实施例二:
参照图2所示的一种图像批处理方法流程图,具体包括如下步骤:
步骤S202,获取多张待处理的第一图像。在一种实施方式中,各第一图像的尺寸相同,均包含j*k个像素,j表示第一图像的水平方向的像素个数,k表示第一图像的垂直方向的像素个数。各第一图像所包含的内容可以相同,也可以不同。
步骤S204,对多张第一图像进行拼接处理,以形成一张第二图像。在本实施例中的图像拼接,即为对空域的图像进行拼接(又可称为图像空域拼接),空域下的图像大多为二维图像。本实施例中的第一图像为小图像,第二图像为多张小图像拼接而成的大图像。在具体实施时,小图像为矩形,对多张小图像进行拼接所形成的大图像也为矩形。也即,第二图像为N*M个第一图像构成的图像矩阵;N为第二图像在水平方向所包含的第一图像的张数,M为第二图像在竖直方向所包含的第一图像的张数。又可以理解为,N*M个第一图像构成了N行M列的图像矩阵,该N行M列的图像矩阵即为第二图像。在实际应用中,N和M可以自行设置,N和M中的值至少为1,当N值或M值有其一为1时,则形成单行或者单列的第二图像。
图像拼接方式有多种,对于多张小图像,可以根据实际情况而灵活设置N值和M值;为便于理解,以6张图像为例,可以参见图3所示的一种图像拼接示意图,示意出(a)、(b)、(c)、(d)四种拼接情况。拼接方式可以基于待处理的第一图像的数量而预先设定。
在一种实施方式中,可以首先获取与第一图像的数量对应的拼接参数;其中,拼接参数包括上述N值和M值;然后按照拼接参数对多张第一图像进行拼接处理。诸如,对于6张小图像,当获取的拼接参数为N=1,M=6,则拼接为图3中的(a)所示的大图像;当获取的拼接参数为N=6,M=1时,则拼接为图3中的(b)所示的大图像;当获取的拼接参数为N=3,M=2时,则拼接为图3中的(c)所示的大图像;当获取的拼接参数为N=2,M=3时,则拼接为图3中的(d)所示的大图像。
步骤S206,通过神经网络对第二图像进行处理,得到处理结果。具体的,神经网络可以为卷积神经网络,通过对第二图像进行卷积处理,得到卷积处理结果。可以理解的是,第二图像进行卷积处理得到的卷积处理结果,是多张第一图像经卷积处理后得到的卷积处理结果的集合。
本发明实施例提供的上述图像批处理方法,通过将多张第一图像进行拼接形成第二图像,然后可使神经网络直接对第二图像进行处理,得到处理结果。本实施例提供的上述方式可以将多张小图像进行拼接形成一张大图像,从而可对多张小图像同时进行批处理,能够有效提升了神经网络的图像处理效率。
由于神经网络是直接对由多张小图拼接成的大图进行诸如卷积处理等操作,同时得到多张小图的卷积处理结果,考虑到相邻小图的拼接边界可能会对卷积处理结果带来一定的影响,为了进一步提升处理结果的准确性和可靠性,使大图的卷积处理结果(也即,包含有多张小图对应的卷积处理结果)可以真实准确地与各张小图单独进行卷积操作后得到的卷积处理结果等效,在本实施例中提供了一种拼接处理方式,具体为:将待要拼接在一起的两张第一图像的邻边对齐;在对齐的邻边之间填充预设数量的无效像素,通过无效像素连接邻边。参见图4所示的另一种图像拼接示意图,为便于理解,在图4中清楚地示出了两两相邻的第一图像之间的无效像素。具体的,图4中示意出每张第一图像包括j*k个像素,j表示第一图像的水平方向的像素个数,k表示第一图像的垂直方向的像素个数,图4中还示意出两张相邻的第一图像的邻边之间填充有2个黑色像素。可以理解的是,第一图像中的像素均为有效像素,能够清楚地反映图像的信息,而在对齐的邻边之间填充的像素为无效像素,并不携带有关于图像的任何信息,仅是作为两张图像之间的填充。在具体实施时,可以设置无效像素为黑色像素,无效像素的像素值为0。此外,两个邻边之间的无效像素个数可以根据需要而灵活设置。
通过在邻边之间填充有无效像素,可以避免两张相邻图像之间的边界像素干扰,有效提升了神经网络对拼接图像进行处理的结果准确性和可靠性,从而使拼接得到的大图像对应的各小图的处理结果能够较好得到与单独小图像对应的处理结果等效。
按照所述拼接参数对多张所述第一图像进行拼接处理时,在基于拼接参数(N值和M值)的基础上,有多种拼接顺序,在一种实施方式中,可以逐行拼接,在另一种实施方式中,也可以逐列拼接。
为便于理解,本实施例提供了逐行拼接的具体方式如下:
(1)在水平方向上对N张第一图像逐一进行拼接处理,形成图像矩阵的第一水平图像行列;
(2)在已形成的第一水平图像行列的下一行继续对另外N张第一图像逐一进行拼接处理,形成图像矩阵的第二水平图像行列;其中,第二水平图像行列中的第一图像分别与水平相邻的第一图像、垂直相邻的第一水平图像行列中的第一图像,拼接在一起;
(3)重复执行上述步骤,直至形成图像矩阵的第M水平图像行列,也即,得到了包含有N*M张第一图像的第二图像。
同理,在逐列拼接中,可以先在垂直方向上对M张第一图像逐一进行拼接处理,形成图像矩阵的第一垂直图像行列,然后平移至该第一垂直图像行列的相邻列位置,继续对另外N张第一图像逐一进行垂直拼接,重复上述步骤,直至拼接形成将第N垂直图像行列,同样得到了包含有N*M张第一图像所拼接而成的第二图像。
可以理解的是,第二图像中的前后左右两两相邻的第一图像之间都填充有无效像素。
考虑到无效像素的数量可能会影响到神经网络的处理效率,诸如,假设无效像素的数量太多,即在相邻小图的邻边之间填充有大量的无效像素,那么神经网络在对大图进行诸如卷积、池化操作时的无效计算量过大,计算效率不高。因此可以合理设置无效像素的数量,使得小图之间填充的无效像素既可以使两个相邻图像的边缘处在处理时不受干扰,又可以使神经网络对包含有无效像素的大图进行处理时的计算量限制在合理范围内。基于此,在一种实施方式中,预设数量可以为一至五个中的任一个;进一步,在另一种实施方式中,预设数量可以为两个。
如果拼接过程中在相邻的两个小图像的边缘处引入了无效像素,本实施例提供了一种对第二图像进行处理,得到处理结果的具体实施方式,包括如下步骤:
(1)对第二图像进行卷积处理,得到卷积结果;其中,卷积结果为有效卷积值和无效卷积值构成的结果矩阵。参见图5所示的一种卷积处理示意图,卷积处理的实际过程即为图像中n*n个像素矩阵与权重矩阵(卷积核)的卷积和。其中,图5中的像素矩阵只简单示意了第二图像中的部分区域,且像素矩阵中的一个小方块代表一个像素。图5中假设一张小图像有3*2个像素,分别为p11、p12、p13、p21、p22、p23;以3*3卷积为例,在权重矩阵中示意出3*3个权重值;通过移动第二图像中可包含有3*3个像素的滑动框,逐一计算滑动框在各位置所圈的像素矩阵与权重矩阵的乘累加结果,可得到第二图像中各个像素对应的卷积结果值。也即,在卷积处理中,对于待处理的图像中的每个像素点,通过计算该像素点及领域像素(诸如以该像素点为中心,滑动框所圈的中心周边像素)与卷积核的对应位置元素的乘积,然后再累加得到累加结果,即可得到该像素点对应的卷积结果值,且像素点对应的卷积结果值在卷积结果矩阵中的位置,与像素点在图像中的位置相对应。
为便于理解,图5中示出的第一滑动框1与权重矩阵进行卷积运算得到卷积结果值r21,r21具体为第一滑动框1的中心位置(p21)对应的卷积结果值,r21在卷积结果中的位置与p21在第二图像中的位置相对应;同理,第二滑动框2与权重矩阵进行卷积运算得到卷积结果值ir11,ir11具体为第二滑动框2的中心位置(ir11)对应的卷积结果值,ir11在卷积结果中的位置与i11在第二图像中的位置相对应;同理,第三滑动框3与权重矩阵进行卷积运算得到卷积结果值ir21,ir21具体为第三滑动框3的中心位置(ir21)对应的卷积结果值,ir21在卷积结果中的位置与i21在第二图像中的位置相对应。
(2)识别结果矩阵中的无效卷积值。具体的,可以根据无效像素在第二图像中的位置,识别结果矩阵中的无效卷积值;其中,无效卷积值在结果矩阵中的位置与无效像素在第二图像中的位置相对应。再如图5所示,i11为无效像素,基于i11在第二图像中的位置,可以对应找到i11的卷积结果值,该卷积结果值即为无效卷积值ir11;同理,i21为无效像素,基于i21在第二图像中的位置,即可确定ir21为无效卷积值。
(3)将无效卷积值从结果矩阵中剔除,得到有效结果矩阵;有效结果矩阵由有效卷积值构成。
(4)将有效结果矩阵作为第二图像的处理结果。参见图6所示的一种处理结果示意图,示意出6张第一图像对应的处理结果,为了便于理解,在图6中示出了相邻图像之间的间隙,以示意无效像素对应的无效处理值被剔除后的效果。
针对前述图像批处理方法,本实施例给出了一种小图拼接成大图的具体实施方式,在该实施方式中,图像以逐行像素输入的方式进行拼接,假设每张小图像素的高为k,宽为j,也即,每张小图在垂直方向有k个像素,每张小图在水平方向有j个像素,在本实施方式中,采取对多张小图进行逐行拼接的方式;具体的,可以获取N值和M值,则水平拼接次数Th=N-1(可以理解为每一行需要进行拼接处理的次数,也即每行所需填充无效像素的次数),垂直拼接次数Tv=M-1(可以理解为每一列需要进行拼接处理的次数,也即每列所需填充无效像素的次数);实际实施时,可以先拼接一个水平图像行列后,在该水平图像行列的下方先整体填充2行像素(作为该水平图像行列与下一水平图像行列的一次垂直拼接),以提升拼接效率。每次输入j个像素时,都需要按照图7所示的一种小图像拼接流程图,执行如下操作:
步骤S702,输入j个像素。具体的,可以是存储有小图的内存向对图像进行批处理的处理芯片上输入j个像素。
步骤S704,判断当前是否已输入Tv*(k+2)*((j+2)*Th+j))+k*((j+2)*Th+j)个像素;如果是,说明所有小图均已拼接完成,执行步骤S712。如果否,执行步骤S706。
步骤S706,判断当前是否已输入k*((j+2)*Th+j)个像素,也即,判断是否已完成多张水平图像在水平方向的一层拼接;如果是,执行步骤S708,如果否,执行步骤S710。
步骤S708,在垂直方向上填充2行无效像素,以在垂直方向拼接上下两层图像(垂直拼接),之后再返回执行步骤S702,也即再开启下一层小图像在水平方向上的拼接。
步骤S710,在水平方向上填充2个无效像素,以在一层上拼接下一个相邻图像(水平拼接),之后再返回执行步骤S702,也即再开始输入当前层的相邻图像。
步骤S712,停止输入像素,确定拼接完成。
通过上述将多个小图按照像素逐行输入的方式进行拼接,更便于实现,且拼接更加快速有效。
同理,将多张小图拼接形成的大图进行输出操作时(诸如,输出至可对大图进行处理的神经网络),每输出j个像素(也即,小图在水平方向的一行像素)时,都需要按照图8所示的一种大图像输出流程图,执行如下操作:
步骤S802,输出j个像素。
步骤S804,判断当前是否已输出Tv*(k+2)*((j+2)*Th+j))+k*((j+2)*Th+j)个像素;如果是,结束,也即说明大图均已输出;如果否,执行步骤S806。
步骤S806,判断当前是否已输出k*((j+2)*Th+j)个像素。如果是,执行步骤S808,如果否,执行步骤S810。
步骤S808,在垂直方向上输出2行无效像素,之后再返回执行步骤S802,也即再开启下一层小图像在水平方向的输出。
步骤S810,在水平方向上输出2个无效像素,之后再返回执行步骤S802,也即再开始输出当前层的相邻图像。
步骤S812,停止输出像素,确定大图已全部输出。
图8可以理解为图7的逆过程,在此不再赘述。通过上述方式,即可将由多张小图拼接形成的大图输出给神经网络,以使神经网络对大图进行卷积处理。
综上所述,本实施例提供的图像批处理方法,通过将多张小图像进行拼接形成一张大图像,从而可对多张小图像同时进行批处理,能够有效提升神经网络的图像处理效率。
实施例三:
对于实施例二中所提供的图像批处理方法,本发明实施例提供了一种图像批处理装置,参见图9所示的一种图像批处理装置的结构框图,包括如下模块:
图像获取模块902,用于获取多张待处理的第一图像。
拼接模块904,用于对多张第一图像进行拼接处理,以形成一张第二图像。
具体应用时,拼接处理的步骤包括:将待要拼接在一起的两张第一图像的邻边对齐;在对齐的邻边之间填充预设数量的无效像素,通过无效像素连接邻边。预设数量可以为一至五个中的任一个;在一个具体的实施方式中,预设数量为两个。
在一种实施方式中,第二图像为N*M个第一图像构成的图像矩阵;N为第二图像在水平方向所包含的第一图像的张数,M为第二图像在竖直方向所包含的第一图像的张数;拼接模块904包括:参数获取单元,用于获取与第一图像的数量对应的拼接参数;其中,拼接参数包括N值和M值;拼接单元,用于按照拼接参数对多张第一图像进行拼接处理。
上述拼接单元进一步用于:在水平方向上对N张第一图像逐一进行拼接处理,形成图像矩阵的第一水平图像行列;在已形成的第一水平图像行列的下一行继续对另外N张第一图像逐一进行拼接处理,形成图像矩阵的第二水平图像行列;其中,第二水平图像行列中的第一图像分别与水平相邻的第一图像、垂直相邻的第一水平图像行列中的第一图像,拼接在一起;重复执行上述步骤,直至形成图像矩阵的第M水平图像行列。
处理模块906,用于通过神经网络对第二图像进行处理,得到处理结果。
在一种实施方式中,处理模块906进一步用于:(1)通过卷积神经网络对第二图像进行卷积处理,得到卷积结果;其中,卷积结果为有效卷积值和无效卷积值构成的结果矩阵;(2)识别结果矩阵中的无效卷积值;具体的,根据无效像素在第二图像中的位置,识别结果矩阵中的无效卷积值;其中,无效卷积值在结果矩阵中的位置与无效像素在第二图像中的位置相对应。
(3)将无效卷积值从结果矩阵中剔除,得到有效结果矩阵;有效结果矩阵由有效卷积值构成;(4)将有效结果矩阵作为第二图像的处理结果。
本发明实施例提供的上述图像批处理装置,通过将多张第一图像进行拼接形成第二图像,然后可使神经网络直接对第二图像进行处理,得到处理结果。本实施例提供的上述方式可以将多张小图像进行拼接形成一张大图像,从而可对多张小图像同时进行批处理,能够有效提升了神经网络的图像处理效率。
本实施例所提供的装置,其实现原理及产生的技术效果和前述实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
实施例四:
对应于前述实施例提供的图像批处理方法及装置,本实施例还提供了一种电子设备,包括存储器和处理器,存储器中存储有可在处理器上运行的计算机程序,其特征在于,处理器执行计算机程序时实现上述实施例二提供的图像批处理方法的步骤。
进一步,本实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述前述方法实施例所提供的方法的步骤。
本发明实施例所提供的图像批处理方法、装置及电子设备的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (9)

1.一种图像批处理方法,其特征在于,所述方法包括:
获取多张待处理的第一图像;
对多张所述第一图像进行拼接处理,以形成一张第二图像;
通过神经网络对所述第二图像进行处理,得到处理结果;所述拼接处理的步骤包括:将待要拼接在一起的两张所述第一图像的邻边对齐;在对齐的所述邻边之间填充预设数量的无效像素,通过所述无效像素连接所述邻边;
所述通过神经网络对所述第二图像进行处理,得到处理结果的步骤,包括:
通过卷积神经网络对所述第二图像进行卷积处理,得到卷积结果;其中,所述卷积结果为有效卷积值和无效卷积值构成的结果矩阵;
识别所述结果矩阵中的无效卷积值;
将所述无效卷积值从所述结果矩阵中剔除,得到有效结果矩阵;所述有效结果矩阵由所述有效卷积值构成;
将所述有效结果矩阵作为所述第二图像的处理结果。
2.根据权利要求1所述的方法,其特征在于,所述第二图像为N*M个所述第一图像构成的图像矩阵;N为所述第二图像在水平方向所包含的第一图像的张数,M为所述第二图像在竖直方向所包含的第一图像的张数;
所述对多张所述第一图像进行拼接处理的步骤,包括:
获取与所述第一图像的数量对应的拼接参数;其中,所述拼接参数包括N值和M值;
按照所述拼接参数对多张所述第一图像进行拼接处理。
3.根据权利要求1所述的方法,其特征在于,所述识别所述结果矩阵中的无效卷积值的步骤,包括:
根据所述无效像素在所述第二图像中的位置,识别所述结果矩阵中的无效卷积值;其中,所述无效卷积值在所述结果矩阵中的位置与所述无效像素在所述第二图像中的位置相对应。
4.根据权利要求2所述的方法,其特征在于,所述按照所述拼接参数对多张所述第一图像进行拼接处理的步骤,包括:
在所述水平方向上对N张所述第一图像逐一进行拼接处理,形成所述图像矩阵的第一水平图像行列;
在已形成的所述第一水平图像行列的下一行继续对另外N张所述第一图像逐一进行拼接处理,形成所述图像矩阵的第二水平图像行列;其中,所述第二水平图像行列中的第一图像分别与水平相邻的第一图像、垂直相邻的第一水平图像行列中的第一图像,拼接在一起;
重复执行上述步骤,直至形成所述图像矩阵的第M水平图像行列。
5.根据权利要求1所述的方法,其特征在于,所述预设数量为一至五个中的任一个。
6.根据权利要求5所述的方法,其特征在于,所述预设数量为两个。
7.一种图像批处理装置,其特征在于,所述装置包括:
图像获取模块,用于获取多张待处理的第一图像;
拼接模块,用于对多张所述第一图像进行拼接处理,以形成一张第二图像;
处理模块,用于通过神经网络对所述第二图像进行处理,得到处理结果;所述拼接模块,还用于将待要拼接在一起的两张所述第一图像的邻边对齐;在对齐的所述邻边之间填充预设数量的无效像素,通过所述无效像素连接所述邻边;
所述处理模块,还用于通过卷积神经网络对所述第二图像进行卷积处理,得到卷积结果;其中,所述卷积结果为有效卷积值和无效卷积值构成的结果矩阵;识别所述结果矩阵中的无效卷积值;将所述无效卷积值从所述结果矩阵中剔除,得到有效结果矩阵;所述有效结果矩阵由所述有效卷积值构成;将所述有效结果矩阵作为所述第二图像的处理结果。
8.一种电子设备,包括存储器和处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至6任一项所述的方法的步骤。
9.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行上述权利要求1至6任一项所述的方法的步骤。
CN201810151216.6A 2018-02-13 2018-02-13 图像批处理方法、装置及电子设备 Active CN108288252B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810151216.6A CN108288252B (zh) 2018-02-13 2018-02-13 图像批处理方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810151216.6A CN108288252B (zh) 2018-02-13 2018-02-13 图像批处理方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN108288252A CN108288252A (zh) 2018-07-17
CN108288252B true CN108288252B (zh) 2022-03-25

Family

ID=62832805

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810151216.6A Active CN108288252B (zh) 2018-02-13 2018-02-13 图像批处理方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN108288252B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109492601A (zh) * 2018-11-21 2019-03-19 泰康保险集团股份有限公司 人脸比对方法及装置、计算机可读介质和电子设备
CN109525810A (zh) * 2018-11-23 2019-03-26 广州路派电子科技有限公司 一种高清动态3d交互式全景环视系统
CN113127658A (zh) * 2019-12-31 2021-07-16 浙江宇视科技有限公司 身份识别数据库的初始化方法、装置、介质及电子设备
CN112967211A (zh) * 2021-01-31 2021-06-15 成都商汤科技有限公司 一种图像处理方法、装置、计算机设备及存储介质
US20230110438A1 (en) * 2021-10-08 2023-04-13 Nvidia Corporation Neural network data replacement

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101214851A (zh) * 2008-01-10 2008-07-09 黄席樾 船舶行驶智能型全天候主动安全预警系统及其预警方法
CN106706653A (zh) * 2017-01-12 2017-05-24 河北省自动化研究所 一种高速宽型板材检测方法
CN106791710A (zh) * 2017-02-10 2017-05-31 北京地平线信息技术有限公司 目标检测方法、装置和电子设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101214851A (zh) * 2008-01-10 2008-07-09 黄席樾 船舶行驶智能型全天候主动安全预警系统及其预警方法
CN106706653A (zh) * 2017-01-12 2017-05-24 河北省自动化研究所 一种高速宽型板材检测方法
CN106791710A (zh) * 2017-02-10 2017-05-31 北京地平线信息技术有限公司 目标检测方法、装置和电子设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种改进的基于深度学习的遥感影像拼接方法;雒培磊等;《计算机工程与应用》;20171113;第53卷(第20期);第180-186页 *

Also Published As

Publication number Publication date
CN108288252A (zh) 2018-07-17

Similar Documents

Publication Publication Date Title
CN108288252B (zh) 图像批处理方法、装置及电子设备
CN110473137B (zh) 图像处理方法和装置
CN107945098B (zh) 图像处理方法、装置、计算机设备和存储介质
CN110246160B (zh) 视频目标的检测方法、装置、设备及介质
CN110032314B (zh) 一种长截屏方法、装置、存储介质和终端设备
CN112016349A (zh) 停车位的检测方法、装置与电子设备
CN111260037B (zh) 图像数据的卷积运算方法、装置、电子设备及存储介质
CN112132265A (zh) 模型训练方法、杯盘比确定方法、装置、设备及存储介质
CN108665421B (zh) 人脸图像高光分量去除装置和方法、存储介质产品
CN108875519B (zh) 对象检测方法、装置和系统及存储介质
JP7414930B2 (ja) 情報処理装置、情報処理方法
CN109308704B (zh) 背景剔除方法、装置、计算机设备及存储介质
CN112418243A (zh) 特征提取方法、装置及电子设备
US20190012797A1 (en) Image processing method and device
CN112819889A (zh) 位置信息的确定方法及装置、存储介质、电子装置
CN111507999B (zh) 一种基于fdsst算法的目标追踪方法及装置
CN110874814B (zh) 一种图像处理方法、图像处理装置及终端设备
CN115018932A (zh) 相机标定方法、装置、电子设备和存储介质
CN112116083B (zh) 神经网络加速器及其检测方法和装置
CN116958104B (zh) 物料表面图像处理方法、装置及存储介质
CN109816613A (zh) 图像补全方法及装置
CN110443835B (zh) 图像配准方法、装置、设备和存储介质
CN114168891A (zh) 震动图像数值化的方法、装置、终端设备及介质
CN113822800B (zh) 一种全景图像拼接融合的方法及装置
WO2024104365A1 (zh) 一种设备测温方法及其相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20230811

Address after: Room 59, 17th Floor, Science and Technology Innovation Building, No. 777 Zhongguan West Road, Zhuangshi Street, Zhenhai District, Ningbo City, Zhejiang Province, 315200

Patentee after: Aixin Yuanzhi Semiconductor (Ningbo) Co.,Ltd.

Address before: 313, block a, No.2, south academy of Sciences Road, Haidian District, Beijing

Patentee before: BEIJING KUANGSHI TECHNOLOGY Co.,Ltd.

TR01 Transfer of patent right
CP03 Change of name, title or address

Address after: Room 59, 17th Floor, Science and Technology Innovation Building, No. 777 Zhongguan West Road, Zhuangshi Street, Ningbo City, Zhejiang Province, 315200

Patentee after: Aixin Yuanzhi Semiconductor Co.,Ltd.

Country or region after: China

Address before: Room 59, 17th Floor, Science and Technology Innovation Building, No. 777 Zhongguan West Road, Zhuangshi Street, Zhenhai District, Ningbo City, Zhejiang Province, 315200

Patentee before: Aixin Yuanzhi Semiconductor (Ningbo) Co.,Ltd.

Country or region before: China

CP03 Change of name, title or address