CN110020678A - 一种数据处理方法、电子设备及计算机存储介质 - Google Patents

一种数据处理方法、电子设备及计算机存储介质 Download PDF

Info

Publication number
CN110020678A
CN110020678A CN201910227603.8A CN201910227603A CN110020678A CN 110020678 A CN110020678 A CN 110020678A CN 201910227603 A CN201910227603 A CN 201910227603A CN 110020678 A CN110020678 A CN 110020678A
Authority
CN
China
Prior art keywords
convolution kernel
submatrix
image
daughter
default
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910227603.8A
Other languages
English (en)
Inventor
李正
邓建林
杨安荣
李远辉
王奇刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN201910227603.8A priority Critical patent/CN110020678A/zh
Publication of CN110020678A publication Critical patent/CN110020678A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Processing (AREA)

Abstract

本发明实施例公开了一种数据处理方法,该方法包括:获取目标图像的图像矩阵;其中,所述图像矩阵包括多个第一元素;所述图像矩阵用于表征所述目标图像的特征信息;获取用于对所述图像矩阵进行处理的卷积核;其中,所述卷积核包括预设行和预设列的第二元素;基于所述图像矩阵,获取多个子矩阵;其中,所述子矩阵包括所述预设行和所述预设列的第一元素;利用所述卷积核并行对所述子矩阵中的第一元素进行处理。本发明实施例同时还公开了一种电子设备和计算机存储介质。

Description

一种数据处理方法、电子设备及计算机存储介质
技术领域
本发明涉及电子与信息技术领域,尤其是涉及一种数据处理方法、电子设备及计算机存储介质。
背景技术
卷积神经网络(Convolutional Neural Networks,CNN)已用于许多计算机的视觉任务,如对象分类和通过输入原始RGB图像进行的分类。卷积神经网络由输入层、卷积层、激活函数、池化层、全连接层组成。当目标图像进入卷积层时,卷积核会对目标图像的图像矩阵的多个子矩阵中每一子矩阵进行处理,由于需要对大量的子矩阵进行处理,导致现有技术中,目标图像在卷积层进行处理时的时间长。
发明内容
为解决上述技术问题,本发明实施例期望提供一种数据处理方法、电子设备及计算机存储介质,解决了现有技术中目标图像在卷积层进行处理时的时间长的问题。
本发明的技术方案是这样实现的:
一种数据处理方法,应用于电子设备,所述方法包括:
获取目标图像的图像矩阵;其中,所述图像矩阵包括多个第一元素;所述图像矩阵用于表征所述目标图像的特征信息;
获取用于对所述图像矩阵进行处理的卷积核;其中,所述卷积核包括预设行和预设列的第二元素;
基于所述图像矩阵,获取多个子矩阵;其中,所述子矩阵包括所述预设行和所述预设列的第一元素;
利用所述卷积核并行对所述子矩阵中的第一元素进行处理。
可选地,所述基于所述图像矩阵,获取多个子矩阵,包括:
获取用于更新所述子矩阵的卷积步长;
基于所述卷积步长,利用预设区域对所述图像矩阵进行扫描,依次得到所述多个子矩阵;其中,所述预设区域的行值和列值分别为所述预设行和所述预设列。
可选地,所述利用所述卷积核并行对所述子矩阵中的第一元素进行处理,包括:
利用预设数量的乘法器,并行对所述卷积核的第二元素和所述子矩阵的第一元素,进行乘法处理;其中,所述预设数量和所述卷积核中的第二元素的数量相同。
可选地,所述利用预设数量的乘法器,并行对所述卷积核的第二元素和所述子矩阵的第一元素,进行乘法处理,包括:
依次存储所述多个子矩阵中的第一元素至存储空间;
从所述存储空间中依次并行读取所述预设数量的第一元素;
利用所述预设数量的乘法器,并行对所述卷积核的第二元素和所述预设数量的第一元素,进行所述乘法处理。
可选地,所述获取目标图像的图像矩阵,包括:
获取所述目标图像的第一通道的第一图像矩阵、第二通道的第二图像矩阵以及第三通道的第三图像矩阵;其中,所述第一图像矩阵包括多个第一子元素,所述第二图像矩阵包括多个第二子元素,所述第三图像矩阵包括多个第三子元素;所述第一子元素、所述第二子元素以及所述第三子元素包括在所述多个第一元素内;
相应地,所述获取用于对所述图像矩阵进行处理的卷积核,包括:
获取用于对所述第一图像矩阵进行处理的第一卷积核、对所述第二图像矩阵进行处理的第二卷积核以及对所述第三图像进行处理的第三卷积核;其中,所述第一卷积核、所述第二卷积核以及所述第三卷积核包括在所述卷积核内;所述第一卷积核包括所述预设行和所述预设列的第四子元素、所述第二卷积核包括所述预设行和所述预设列的第五子元素、以及所述第三卷积核包括所述预设行和所述预设列的第六子元素。
可选地,所述基于所述卷积步长,利用预设区域对所述图像矩阵进行扫描,依次得到所述多个子矩阵,包括:
基于所述卷积步长,利用三个所述预设区域分别对所述第一图像矩阵、所述第二图像矩阵以及所述第三图像矩阵进行扫描,并依次得到所述多个子矩阵;其中,所述子矩阵包括所述第一图像矩阵中的所述预设行和所述预设列的第一子矩阵、所述第二图像矩阵中的与所述第一子矩阵位置对应的第二子矩阵、以及所述第三图像矩阵中的与所述第一子矩阵位置对应的第三子矩阵。
可选地,所述利用预设数量的乘法器,并行对所述卷积核的第二元素和所述子矩阵的第一元素,进行乘法处理,包括:
依次存储多个所述第一子矩阵的第一子元素、所述第二子矩阵的第二子元素以及所述第三子矩阵的第三子元素至所述存储空间;
从所述存储空间中,依次并行读取目标数量的第一子元素、所述目标数量的第二子元素以及所述目标数量的第三子元素;
利用所述预设数量的乘法器,并行对所述第四子元素、所述第五子元素以及所述第六子元素、和所述目标数量的第一子元素、所述目标数量的第二子元素以及所述目标数量的第三子元素,进行乘法处理;其中,所述预设数量为所述目标数量与三的乘积。
可选地,所述利用预设数量的乘法器,并行对所述卷积核的第二元素和所述子矩阵的第一元素,进行乘法处理之后,所述方法还包括:
获取基于所述乘法处理得到的所述预设数量的乘积;
对所述预设数量的乘积和与所述卷积核对应的偏差量求和,生成用于形成特征矩阵的元素,并基于所述元素生成特征矩阵;
基于所述特征矩阵,识别所述目标图像。
一种电子设备,所述电子设备包括:处理器、存储器和通信总线;
所述通信总线用于实现处理器和存储器之间的通信连接;
所述处理器用于执行存储器中的数据处理方法的程序,以实现以下步骤:
获取目标图像的图像矩阵;其中,所述图像矩阵包括多个第一元素;所述图像矩阵用于表征所述目标图像的特征信息;
获取用于对所述图像矩阵进行处理的卷积核;其中,所述卷积核包括预设行和预设列的第二元素;
基于所述图像矩阵,获取多个子矩阵;其中,所述子矩阵包括所述预设行和所述预设列的第一元素;
利用所述卷积核并行对所述子矩阵中的第一元素进行处理。
一种计算机存储介质,该计算机存储介质存储有一个或者多个程序,一个或者多个程序可被一个或者多个处理器执行,以实现上述的数据处理方法的步骤。
本发明实施例所提供的数据处理方法、电子设备及计算机存储介质,获取包括多个第一元素的用于表征目标图像的特征信息的图像矩阵,和包括预设行和预设列的第二元素的用于对图像矩阵进行处理的卷积核,并基于图像矩阵,获取多个包括预设行和预设列的第一元素的子矩阵,进而利用卷积核并行对子矩阵中的第一元素进行处理,通过卷积核并行对子矩阵中多个第一元素进行处理,进而在利用卷积核对每一子矩阵进行处理时,能够一次性地处理每一子矩阵中的多个第一元素,从而缩短了目标图像在卷积层进行处理时的时间。
附图说明
图1为本发明实施例提供的一种数据处理方法的流程示意图;
图2为本发明实施例提供的另一种数据处理方法的流程示意图;
图3为本发明实施例提供的又一种数据处理方法的流程示意图;
图4为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
应理解,说明书通篇中提到的“本发明实施例”或“前述实施例”意味着与实施例有关的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,在整个说明书各处出现的“本发明实施例中”或“在前述实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中应。在本发明的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
卷积神经网络是一类包含卷积计算且具有深度结构的前馈神经网络,是深度学习的代表算法之一。卷积神经网络长期以来是图像识别领域的核心算法之一,并在大量学习数据时有稳定的表现。卷积神经网络由输入层、卷积层、激活函数、池化层、全连接层组成。卷积层用于对图像进行特征提取,得到特征图;池化层用于对输入的特征图进行压缩,一方面使特征图变小,简化网络计算复杂度,另一方面进行对特征图进行压缩,提取主要特征;全连接层用连接所有的压缩后的特征图中的元素,将输出值送给分类器(如softmax分类器),进而输出对目标图像的分类。
当目标图像进入卷积层时,卷积核会对目标图像的图像矩阵进行卷积处理,以得到目标图像的特征矩阵。其中,通过卷积核对目标图像的图像矩阵进行卷积处理,可以包括:将卷积核中的多个第二元素与图像矩阵中的子矩阵中的多个第一元素分别相乘后得到多个相乘结果,并将相乘结果和与卷积核对应的偏移值进行相加得到与子矩阵对应的特征值。由于子矩阵是通过与卷积核大小相同的预设区域对图像矩阵扫描得到的,因此,得到的子矩阵数量很多,而由于卷积核的多个第二元素需要对每个子矩阵的多个第一元素进行多个乘法运算,导致目标图像在卷积层进行处理时的时间长。
本发明实施例提供一种数据处理方法,应用于电子设备,如图1所示,该方法包括以下步骤:
步骤101:获取目标图像的图像矩阵。
其中,图像矩阵包括多个第一元素;图像矩阵用于表征目标图像的特征信息。
本发明是实施例中的电子设备可以为任一具有数据处理能力的设备,例如手机、平板电脑、笔记本电脑、掌上电脑、个人数字助理、便捷式媒体播放器、导航装置、可穿戴设备、智能手环、计步器、数字TV或者台式计算机等。
在步骤101之前,电子设备还可以执行获取目标图像的步骤,从而能够根据获取到的目标图像生成目标图像的图像矩阵。其中,电子设备可以从本地、其它电子设备或者服务器上获取目标图像。
目标图像可以用图像矩阵来表示,从而可以采用矩阵理论和矩阵算法对图像进行分析和处理。图像矩阵中包括多行第一元素和多列第一元素,图像矩阵的行数对应图像的高,图像矩阵的列数对应图像的宽,图像矩阵中的第一元素对应图像的像素值。像素值可以是为像素灰度值、像素颜色值以及像素深度值的至少一个。
图像矩阵中的第一元素的数量,应根据目标图像的大小(即高和宽)和目标图像的分辨率确定。在一实施例中,目标图像具有一个通道,图像矩阵中有M×N个数量的第一元素,M×N个数量的第一元素对应目标图像的M×N个数量的像素值,像素值用于表征目标图像的特征信息。在另一实施例中,目标图像具有三个通道,这三个通道为颜色通道,分别为红色通道、绿色通道以及蓝色通道,目标图像在每一个通道上有一个图像矩阵,在每一通道上的图像矩阵中的元素个数和具有一个通道时图像矩阵的元素个数相同,例如,目标图像在红色通道上可以有M1×N1个数量的元素、在绿色通道上可以有M2×N2个数量的元素以及在蓝色通道上可以有M3×N3个数量的元素,其中,M、M1、M2以及M3大小相同,N、N1、N2以及N3大小相同,M1×N1个元素、M2×N2个元素以及M2×N2个元素分别表征目标图像在红色通道、绿色通道以及蓝色通道的特征信息。
本发明实施例只是列举了图表图像具有一个通道或三个通道时的情况,当然,在其它实施例中,目标图像还可以具有其它个通道,例如两个或四个等等,此处不一一列举。
步骤102:获取用于对图像矩阵进行处理的卷积核。
其中,卷积核包括预设行和预设列的第二元素。
卷积核就是图像处理时,给定输入图像,在输出图像中每一个像素是输入图像中一个小区域中像素的加权平均,其中权值由一个函数定义,这个函数称为卷积核。卷积核也可以称为滤波器。与目标图像相对应,当目标图像具有一个通道时,卷积核通常是一个A×B的矩阵;当目标图像具有三个通道时,卷积核通常是一个A×B×3的矩阵,其中,卷积核可以包括红色通道卷积核、绿色通道卷积核以及蓝色通道卷积核,红色通道卷积核大小为A1×B1,绿色通道卷积核大小为A2×B2,以及蓝色通道卷积核大小为A3×B3,其中,A、A1、A2以及A3大小相同,B、B1、B2以及B3大小相同。上述A和B的值应根据实际情况确定,例如,在一实施例中,A和B的值均可以为3。当然,在其它实施例中,A和B的值还可以为其它数值,例如,A和B的值均为2、4、5或6等等,又或者A的值可以为3,B的值可以为4。
步骤103:基于图像矩阵,获取多个子矩阵。
其中,子矩阵包括预设行和预设列的第一元素。
在一种实施方式中,可以利用预设区域对图像矩阵进行扫描的方式得到多个子矩阵。其中预设区域大小可以为A×B,子矩阵的行数和列数,与卷积核的行数和列数相同,例如,卷积核的行数和列数均为3,则子矩阵的行数和列数也均为3。
子矩阵的数量与卷积核的大小和利用卷积核对图像矩阵进行扫描时的步长相关。当目标图像具有一个通道时,基于图像矩阵获取一个通道的C个子矩阵。当目标图像具有三个通道时,基于三个通道的图像矩阵分别获取红色通道的C1个第一子矩阵、绿色通道的C2个第二子矩阵以及蓝色通道的C3个第三子矩阵。其中,C、C1、C2以及C3大小相同。
步骤104:利用卷积核并行对子矩阵中的第一元素进行处理。
利用卷积核并行对子矩阵中的第一元素进行处理,可以包括:利用卷积核中的第二元素并行对子矩阵中的第一元素作乘法处理。
例如,当卷积核D为子矩阵E为则采用卷积核并行子矩阵中的第一元素进行处理的处理结果为其中,处理结果中的元素值是通过电子设备的9个乘法器同时对卷积核D中的第二元素和子矩阵E的第一元素计算得到的。在得到9个乘法结果后,电子设备还可以对9个乘法结果进行相加,得到与该子矩阵E对应的特征值。
当目标图像具有一个通道时,可以通过卷积核分别对多个子矩阵进行处理;其中,当卷积核大小为3×3,卷积核对每一子矩阵进行处理时,都是并行对每一子矩阵中的第一元素进行处理,这种情况下,并行度为9。当目标图像具有三个通道时,可以通过红色通道卷积核分别对红色通道的多个第一子矩阵进行处理、通过绿色通道卷积核分别对绿色通道的多个第二子矩阵进行处理,以及通过蓝色通道卷积核分别对蓝色通道的多个第三子矩阵进行处理;其中,当卷积核大小为3×3×3,卷积核并行对红色通道的第一子矩阵、绿色通道的第二子矩阵以及蓝色通道的第三子矩阵进行处理,这种情况下,并行度为27。也就是说,利用利用卷积核对子矩阵中的第一元素进行处理时的并行度和卷积核的第二元素的个数相同。
本发明的实施例所提供的数据处理方法,获取包括多个第一元素的用于表征目标图像的特征信息的图像矩阵,和包括预设行和预设列的第二元素的用于对图像矩阵进行处理的卷积核,并基于图像矩阵,获取多个包括预设行和预设列的第一元素的子矩阵,进而利用卷积核并行对子矩阵中的第一元素进行处理,通过卷积核并行对子矩阵中多个第一元素进行处理,进而在利用卷积核对每一子矩阵进行处理时,能够一次性地处理每一子矩阵中的多个第一元素,从而缩短了目标图像在卷积层进行处理时的时间。
基于前述实施例,本发明实施例提供一种数据处理方法,应用于电子设备,如图2所示,该方法包括以下步骤:
步骤201:获取目标图像的图像矩阵。
其中,图像矩阵包括多个第一元素;图像矩阵用于表征目标图像的特征信息。第一元素为目标图像的像素值。
本发明实施例中,目标图像具有一个通道。举例而言,图像矩阵可以是5×5的矩阵。图像矩阵可以利用F来表示,应理解,此处的矩阵F只是为了对图像矩阵作出示例性地描述,在实际中,图像矩阵的大小应远大于5×5。图像矩阵的大小和目标图像的高、宽以及图像的清晰度相关,也就是说,图像矩阵中第一元素的个数和目标图像的像素点的个数相同。
步骤202:获取用于对图像矩阵进行处理的卷积核。
其中,卷积核包括预设行和预设列的第二元素。
在本发明实施例中,卷积核包括3行和3列的第二元素,卷积核可以利用D来表示,应理解,当卷积核具有其它行或其它列的第二元素时,卷积核可以利用其它行和其它列的矩阵进行表示,此处不再赘述。
步骤203:获取用于更新子矩阵的卷积步长。
其中,卷积步长也叫卷积步幅,代表滤波器(或卷积核)每移动一次移动的步幅。卷积步长的取值应根据实际情况确定,但是卷积步长的取值应小于或等于卷积核的行数和列数中的较小者。例如,当卷积核的大小为3×3时,卷积步长可以取1、2或者3。
步骤204:基于卷积步长,利用预设区域对图像矩阵进行扫描,依次得到多个子矩阵。
其中,预设区域的行值和列值分别为预设行和预设列。
利用预设区域对图像矩阵进行扫描时,可以逐行扫描,也可以逐列扫描,在进行扫描时,卷积核每次移动两行或两列。例如,基于数值为2的卷积步长,利用预设区域对图像矩阵F进行逐行扫描,可以得到以下四个子矩阵,以及应理解,此处只是示意性地列举了图像矩阵为F,卷积步长为2时得到的子矩阵,当图像矩阵为其它图像矩阵,或者卷积步长为其它卷积步长时,可以得到其它多个子矩阵,此处不一一列举。
步骤205:利用预设数量的乘法器,并行对卷积核的第二元素和子矩阵的第一元素,进行乘法处理。
其中,预设数量和卷积核中的第二元素的数量相同。
本发明实施例中,电子设备可以包括大于或等于预设数量的乘法器,在本实施例中,预设数量和卷积核中的第二元素相同。例如,在本实施例中,卷积核中的第二元素为9个,那么预设数量也为9。
利用预设数量的乘法器,可以依次并行对卷积核的第二元素和多个子矩阵的第一元素,进行乘法处理。例如,可以采用9个乘法器,首先并行对卷积核D中第二元素和子矩阵F1中的第一元素,进行乘法处理得到处理后的矩阵其次,并行对卷积核的第二元素和子矩阵F2中的第一元素,进行乘法处理得到处理后的矩阵然后,并行对卷积核的第二元素和子矩阵F3中的第一元素,进行乘法处理得到处理后的矩阵最后,并行对卷积核的第二元素和子矩阵F4中的第一元素,进行乘法处理得到处理后的矩阵
在一种实施方式中,步骤205可以通过以下步骤A1~A3来实现:
步骤A1:依次存储多个子矩阵中的第一元素至存储空间。
在一种实施例中,电子设备可以通过逐行存储的方式存储每一个子矩阵至存储空间,直到存储完所有的子矩阵,例如,电子设备可以依次存储第一个子矩阵F1中的第一元素F11、F12、F13、……、F33,在第一个子矩阵F1存储完成后,可以依次存储第二个子矩阵F2中的第一元素F13、F14、F15、……、F35,在第二个子矩阵F2存储完成后,可以依次存储第三个子矩阵F3中的第一元素F31、F32、F33、……、F53,以及在第三个子矩阵F3存储完成后,可以依次存储第四个子矩阵F4中的第一元素F33、F34、F35、……、F55;在另一种实施例中,电子设备可以通过逐列存储的方式存储每一个子矩阵至存储空间,直到存储完所有的子矩阵。当然,在其它实施例中,电子设备可以通过其它方式存储每一个子矩阵至存储空间,直到存储完所有的子矩阵,此处不作限定,只要电子设备是依次存储多个子矩阵,且在存储多个子矩阵时,每个子矩阵的存储方式相同(例如,每个子矩阵都是逐行存储,或者每个子矩阵都是逐列存储)即可。本发明实施例中的存储空间可以为存储器、缓存器或者寄存器,此处不作限定。
步骤A2:从存储空间中依次并行读取预设数量的第一元素。
预设数量可以与卷积核中的第二元素的数量相同。由于在存储多个子矩阵中的第一元素值存储空间时,是以子矩阵为单位为来进行存储的,在从存储空间中读取第一元素时,也是以子矩阵(子矩阵中的元素数量和预设数量相同)为单位并行读取,从而使得电子设备可以直接将并行读取。例如,电子设备可以依次读取第一个子矩阵F1中的第一元素F11、F12、F13、……、F33,第二子矩阵F2中的第一元素F13、F14、F15、……、F35,第三子矩阵F3中的第一元素F31、F32、F33、……、F53,以及第四子矩阵F4中的第一元素F33、F34、F35、……、F55。
步骤A3:利用预设数量的乘法器,并行对卷积核的第二元素和预设数量的第一元素,进行乘法处理。
电子设备每并行读取预设数量的第一元素后,都会对预设数量的第一元素,采用预设数量的乘法器,并行对卷积核的第二元素和预设数量的第一元素,进行乘法处理。例如,在读取到第一个子矩阵F1中的第一元素F11、F12、F13、……、F33后,利用卷积核D中的D11、D12、D13、……、D33,并行对子矩阵F1中的元素进行乘法处理,从而得到处理结果D11×F11、D12×F12、D13×F13、……、D33×F33。
在一种实施方式中,在对第一个子矩阵F1处理完成后,电子设备可以并行对读取到的第二个子矩阵F2的第一元素进行并行乘法处理,并行对读取到的第三个子矩阵F3的第一元素进行并行乘法处理,以及并行对多个子矩阵中的第四个子矩阵F4进行并行乘法处理。
在一实施例中,电子设备是在多个子矩阵全部存储完成后,才执行并行读取子矩阵中的第一元素,和利用卷积核的第二元素对子矩阵中的第一元素进行乘法处理。在另一实施例中,电子设备可以在存储完多个子矩阵中的部分子矩阵后,就执行并行读取子矩阵中的第一元素,和利用卷积核的第二元素对子矩阵中的第一元素进行乘法处理的步骤,如此,可节省数据在卷积层进行处理的时间。
在步骤205之后,电子设备还可以执行下述B1~B3的步骤:
步骤B1:获取基于乘法处理得到的预设数量的乘积。
电子设备可以基于乘法处理得到每个子矩阵中的对应的预设数量的乘积。
步骤B2:对预设数量的乘积和与卷积核对应的偏差量求和,生成用于形成特征矩阵的元素,并基于元素生成特征矩阵。
卷积核对应的偏差量可以根据实际情况来确定,偏差量可以为bias或偏移值。例如,在电子设备对第一个子矩阵F1中的第一元素进行乘法处理后,还可以将得到的处理结果进行相加,得到相加后的结果D11×F11+D12×F12+D13×F13+……+D33×F33+bias,直到得到与第四个子矩阵F4对应的相加后的结果。与这四个子矩阵对应的相加后的结果生成特征矩阵。应理解,此处只是示例性地对数据的处理过程作出说明,当图像矩阵为其它大小的矩阵时,确定的子矩阵不同,生成的特征矩阵也不同。
步骤B3:基于特征矩阵,识别目标图像。
电子设备在得到特征矩阵后,可以将特征矩阵进入池化层和全连接层进行处理,从而识别目标图像并得到识别结果。
需要说明的是,本实施例中与其它实施例中相同步骤和相同内容的说明,可以参照其它实施例中的描述,此处不再赘述。
本发明的实施例所提供的数据处理方法,通过卷积核并行对子矩阵中多个第一元素进行处理,进而在利用卷积核对每一子矩阵进行处理时,能够一次性地处理每一子矩阵中的多个第一元素,并且利用预设数量的乘法器并行对多个子矩阵中的每一子矩阵中的第一元素进行乘法处理,从而能够充分利用电子设备中的乘法器,从而缩短了目标图像在卷积层进行处理时的时间。
基于前述实施例,本发明实施例提供一种数据处理方法,应用于电子设备,如图3所示,该方法包括以下步骤:
步骤301:获取目标图像的第一通道的第一图像矩阵、第二通道的第二图像矩阵以及第三通道的第三图像矩阵。
其中,第一图像矩阵包括多个第一子元素,第二图像矩阵包括多个第二子元素,第三图像矩阵包括多个第三子元素;第一子元素、第二子元素以及第三子元素包括在多个第一元素内。
在一实施例中,获取目标图像的第一通道的第一图像矩阵、第二通道的第二图像矩阵以及第三通道的第三图像矩阵,可以包括:获取目标图像的红色通道的第一图像矩阵、绿色通道的第二图像矩阵以及蓝色通道的第三图像矩阵。其中,第一图像矩阵的第一子元素的个数、第二图像矩阵的第二子元素的个数以及第三图像矩阵的第三子元素的个数,均与目标图像的像素点的个数相同。第一图像矩阵表征目标图像在红色通道的特征信息,第二图像矩阵表征目标图像在绿色通道的特征信息,第三图像矩阵表征目标图像在蓝色通道的特征信息。第一子元素为目标图像在红色通道的像素值,第二子元素为目标图像在绿色通道的像素值,第三子元素为目标图像在蓝色通道的像素值。
第一图像矩阵、第二图像矩阵以及第三图像矩阵的大小均上述实施例中的图像矩阵的大小相同。例如,当上述图像矩阵为5×5大小的矩阵时,第一图像矩阵、第二图像矩阵以及第三图像矩阵均为5×5大小的矩阵,即目标图像矩阵的大小为M×N×3,3为目标图像的深度值,目标图像的深度值与目标图像的通道数相同。第一图像矩阵、第二图像矩阵以及第三图像矩阵可以分别用H、I以及J表示。
步骤302:获取用于对第一图像矩阵进行处理的第一卷积核、对第二图像矩阵进行处理的第二卷积核以及对第三图像进行处理的第三卷积核。
其中,第一卷积核、第二卷积核以及第三卷积核包括在卷积核内;第一卷积核包括预设行和预设列的第四子元素、第二卷积核包括预设行和预设列的第五子元素、以及第三卷积核包括预设行和预设列的第六子元素。
由于目标图像具有三个通道,因此,利用卷积核对三个通道的图像矩阵进行处理时,需要的卷积核的大小为A×B×3,其中,A表示卷积核的行值、B表示卷积核的列值,3为卷积核的层数(也可以称为感受野的深度),卷积核的层数、目标图像的深度值以及目标图像的通道数相同。例如,在一个实施例中的,卷积核的大小为3×3×3,则第一层的卷积核D1、第二层的卷积核D2以及第三层的卷积核D3的大小均为3×3的矩阵。
步骤303:基于卷积步长,利用三个预设区域分别对第一图像矩阵、第二图像矩阵以及第三图像矩阵进行扫描,并依次得到多个子矩阵。
其中,子矩阵包括第一图像矩阵中的预设行和预设列的第一子矩阵、第二图像矩阵中的与第一子矩阵位置对应的第二子矩阵、以及第三图像矩阵中的与第一子矩阵位置对应的第三子矩阵。
利用三个预设区域分别对第一图像矩阵、第二图像矩阵以及第三图像矩阵进行扫描,可以包括:利用第一预设区域对第一图像矩阵进行扫描,利用第二预设区域对第二图像矩阵进行扫描,以及利用第三预设区域对第三图像进行扫描;其中第一预设区域、第二预设区域、第三预设区域以及预设区域的大小均相同,且均为A×B。
利用第一预设区域对第一图像矩阵进行扫描,利用第二预设区域对第二图像矩阵进行扫描,以及利用第三预设区域对第三图像矩阵进行扫描的方式,和上述实施例中,利用预设区域对图像矩阵进行扫描的方式类似,此处不作赘述。但应注意的是,对第一图像矩阵进行扫描,对第二图像矩阵进行扫描以及对第三图像矩阵进行扫描可以是同时进行的,也可以是非同时进行的。当矩阵H、I以及J均为5×5的矩阵,预设区域大小为3×3的矩阵时,利用第一预设矩阵对第一图像矩阵H进行扫描得到4个第一子矩阵,分别为H1、H2、H3以及H4,利用第二预设矩阵对第二图像矩阵I进行扫描得到4个第二子矩阵,分别为I1、I2、I3以及I4,利用第三预设矩阵对第三图像矩阵J进行扫描得到4个第三子矩阵,分别为J1、J2、J3以及J4。其中,H1、I1以及J1可以是同时得到的,H2、I2以及J2可以是同时得到的,H3、I3以及J3可以是同时得到的,以及H4、I4以及J4可以是同时得到的。
步骤304:依次存储多个第一子矩阵的第一子元素、第二子矩阵的第二子元素以及第三子矩阵的第三子元素至存储空间。
电子设备可以采用第一种存储方式对第一子元素、第二子元素以及第三子元素进行存储。即,电子设备可以先存储第一个第一子矩阵H1的第一子元素至存储空间,在第一子矩阵H1的第一子元素存储完成后,存储第二子矩阵I1的第二子元素至存储空间,在第二子矩阵I2的第二子元素存储完成后,存储第三子矩阵J1的第三子元素至存储空间,在第三子矩阵J3的第三子元素存储完成后,再存储第二个第一子矩阵H2的第一子元素至存储空间,以此类推,直到将第三子矩阵存储完成,即存储第四个第三子矩阵J4的第三子元素至存储空间。
电子设备还可以采用第二种存储方式对第一子元素、第二子元素以及第三子元素进行存储。即,电子设备可以先存储第一个第一子矩阵H1的第一部分第一子元素至存储空间,再存储第一个第二子矩阵I1的第一部分第二子元素至存储空间,然后存储第一个第三子矩阵J1的第一部分第三子元素至存储空间,接着存储第一个第一子矩阵H1的第二部分元素至存储空间,以此类推,知道将第三子矩阵存储完成,即存储第四个第三子矩阵J4的第三子元素至存储空间。每次向存储空间存储的第一子元素、第二子元素以及第三子元素的个数必须相同,且每次向存储空间存储的第一元素的个数为1、3或9。
步骤305:从存储空间中,依次并行读取目标数量的第一子元素、目标数量的第二子元素以及目标数量的第三子元素。
目标数量的个数和第一卷积核中第四子元素的个数相同。例如,当第一卷积核的大小为3×3时,则电子设备一次并行从存储空间中读取27个元素,这27个元素中包括9个第一子元素、9个第二子元素以及9个第三子元素。
在一个实施方式中,电子设备在第一次并行读取时,并行读取到第一个第一子矩阵H1中的9个第一子元素、第一个第二子矩阵I1中的9个第二子元素,第一个第三子矩阵J1中的9个第三子元素;接着电子设备进行第二次读取,并行读取到第二个第一子矩阵H2中的9个第一子元素、第二个第二子矩阵I2中的9个第二子元素,第二个第三子矩阵J2中的9个第三子元素;以此类推,直到读取到第四个第三子矩阵J4中的9个第三子元素。
步骤306:利用预设数量的乘法器,并行对第四子元素、第五子元素以及第六子元素、和目标数量的第一子元素、目标数量的第二子元素以及目标数量的第三子元素,进行乘法处理。
其中,预设数量为目标数量与三的乘积。
并行对第四子元素、第五子元素以及第六子元素、和目标数量的第一子元素、目标数量的第二子元素以及目标数量的第三子元素,进行乘法处理,可以包括:通过第一卷积核、第二卷积核以及第三卷积核,并行对第四子元素、第五子元素以及第六子元素、和目标数量的第一子元素、目标数量的第二子元素以及目标数量的第三子元素,进行乘法处理。
可以利用第一卷积核中的第四子元素对目标数量的第一子元素作乘法处理;利用第二卷积核中的第五子元素对目标数量的第二子元素作乘法处理;利用第三卷积核中的第六子元素对目标数量的第三子元素做乘法处理。应理解,在对第一子元素、第二子元素以及第三子元素的乘法处理必须是同时进行的。
电子设备对第一子元素作出乘法处理后,得到第一预设数量的乘积,对第二子元素作出乘法处理后,得到第二预设数量的乘积,对第三子元素作出乘法处理后,得到第三预设数量的乘积;其中第一预设数量、第二预设数量以及第三预设数量,均与上述实施例中的预设数量相同。
电子设备还可以对第一预设数量的乘积、第二预设数量的乘积、第三预设数量的乘积以及卷积核对应的偏差量求和,生成用于形成特征矩阵的元素,并基于元素生成特征矩阵,并基于特征矩阵,识别目标图像。
需要说明的是,本实施例中与其它实施例中相同步骤和相同内容的说明,可以参照其它实施例中的描述,此处不再赘述。
本发明的实施例所提供的数据处理方法,通过卷积核并行对子矩阵中多个第一元素进行处理,进而在利用卷积核对每一子矩阵进行处理时,能够一次性地处理每一子矩阵中的多个第一元素,并且利用预设数量的乘法器并行对多个子矩阵中的每一子矩阵中的第一元素进行乘法处理,从而能够充分利用电子设备中的乘法器,从而缩短了目标图像在卷积层进行处理时的时间。
基于前述实施例,本发明的实施例提供一种电子设备4,该电子设备4可以应用于图1~3对应的实施例提供的一种数据处理方法中,参照图4所示,该电子设备4可以包括:处理器41、存储器42和通信总线43,其中:
通信总线43用于实现处理器41和存储器42之间的通信连接。
处理器41用于执行存储器42中存储的数据处理方法的程序,以实现以下步骤:
获取目标图像的图像矩阵;其中,图像矩阵包括多个第一元素;图像矩阵用于表征目标图像的特征信息;
获取用于对图像矩阵进行处理的卷积核;其中,卷积核包括预设行和预设列的第二元素;
基于图像矩阵,获取多个子矩阵;其中,子矩阵包括预设行和预设列的第一元素;
利用卷积核并行对子矩阵中的第一元素进行处理。
在本发明的其他实施例中,处理器41用于执行存储器42中存储的基于图像矩阵,获取多个子矩阵,以实现以下步骤:
获取用于更新子矩阵的卷积步长;
基于卷积步长,利用预设区域对图像矩阵进行扫描,依次得到多个子矩阵;其中,预设区域的行值和列值分别为预设行和预设列。
在本发明的其他实施例中,处理器41用于执行存储器42中存储的利用卷积核并行对子矩阵中的第一元素进行处理,以实现以下步骤:
利用预设数量的乘法器,并行对卷积核的第二元素和子矩阵的第一元素,进行乘法处理;其中,预设数量和卷积核中的第二元素的数量相同。
在本发明的其他实施例中,处理器41用于执行存储器42中存储的利用预设数量的乘法器,并行对卷积核的第二元素和子矩阵的第一元素,进行乘法处理,以实现以下步骤:
依次存储多个子矩阵中的第一元素至存储空间;
从存储空间中依次并行读取预设数量的第一元素;
利用预设数量的乘法器,并行对卷积核的第二元素和预设数量的第一元素,进行乘法处理。
在本发明的其他实施例中,处理器41用于执行存储器42中存储的获取目标图像的图像矩阵,以实现以下步骤:
获取目标图像的第一通道的第一图像矩阵、第二通道的第二图像矩阵以及第三通道的第三图像矩阵;其中,第一图像矩阵包括多个第一子元素,第二图像矩阵包括多个第二子元素,第三图像矩阵包括多个第三子元素;第一子元素、第二子元素以及第三子元素包括在多个第一元素内;
相应地,处理器41用于执行存储器42中存储的获取用于对图像矩阵进行处理的卷积核,以实现以下步骤:
获取用于对第一图像矩阵进行处理的第一卷积核、对第二图像矩阵进行处理的第二卷积核以及对第三图像进行处理的第三卷积核;其中,第一卷积核、第二卷积核以及第三卷积核包括在卷积核内;第一卷积核包括预设行和预设列的第四子元素、第二卷积核包括预设行和预设列的第五子元素、以及第三卷积核包括预设行和预设列的第六子元素。
在本发明的其他实施例中,处理器41用于执行存储器42中存储的基于卷积步长,利用预设区域对图像矩阵进行扫描,依次得到多个子矩阵,以实现以下步骤:
基于卷积步长,利用三个预设区域分别对第一图像矩阵、第二图像矩阵以及第三图像矩阵进行扫描,并依次得到多个子矩阵;其中,子矩阵包括第一图像矩阵中的预设行和预设列的第一子矩阵、第二图像矩阵中的与第一子矩阵位置对应的第二子矩阵、以及第三图像矩阵中的与第一子矩阵位置对应的第三子矩阵。
在本发明的其他实施例中,处理器41用于执行存储器42中存储的利用预设数量的乘法器,并行对卷积核的第二元素和子矩阵的第一元素,进行乘法处理,以实现以下步骤:
依次存储多个第一子矩阵的第一子元素、第二子矩阵的第二子元素以及第三子矩阵的第三子元素至存储空间;
从存储空间中,依次并行读取目标数量的第一子元素、目标数量的第二子元素以及目标数量的第三子元素;
利用预设数量的乘法器,并行对第四子元素、第五子元素以及第六子元素、和目标数量的第一子元素、目标数量的第二子元素以及目标数量的第三子元素,进行乘法处理;其中,预设数量为目标数量与三的乘积。
在本发明的其他实施例中,处理器41用于执行存储器42中存储的数据处理方法的程序,以实现以下步骤:
获取基于乘法处理得到的预设数量的乘积;
对预设数量的乘积和与卷积核对应的偏差量求和,生成用于形成特征矩阵的元素,并基于元素生成特征矩阵;
基于特征矩阵,识别目标图像。
需要说明的是,本实施例中处理器所执行的步骤的具体实现过程,可以参照图1~3对应的实施例提供的数据方法中的实现过程,此处不再赘述。
本发明的实施例所提供的电子设备,获取包括多个第一元素的用于表征目标图像的特征信息的图像矩阵,和包括预设行和预设列的第二元素的用于对图像矩阵进行处理的卷积核,并基于图像矩阵,获取多个包括预设行和预设列的第一元素的子矩阵,进而利用卷积核并行对子矩阵中的第一元素进行处理,通过卷积核并行对子矩阵中多个第一元素进行处理,进而在利用卷积核对每一子矩阵进行处理时,能够一次性地处理每一子矩阵中的多个第一元素,从而缩短了目标图像在卷积层进行处理时的时间。
基于前述实施例,本发明的实施例提供一种计算机可读存储介质,计算机可读存储介质存储有一个或者多个程序,该一个或者多个程序可被一个或者多个处理器执行,以实现如上任一项的数据处理方法的步骤。
需要说明的是,上述处理器可以为特定用途集成电路(ASIC,ApplicationSpecific Integrated Circuit)、数字信号处理器(DSP,Digital Signal Processor)、数字信号处理装置(DSPD,Digital Signal Processing Device)、可编程逻辑装置(PLD,Programmable Logic Device)、现场可编程门阵列(FPGA,Field Programmable GateArray)、中央处理器(CPU,Central Processing Unit)、控制器、微控制器、微处理器中的至少一种。可以理解地,实现上述处理器功能的电子器件还可以为其它,本申请实施例不作具体限定。
需要说明的是,上述计算机存储介质/存储器可以是只读存储器(Read OnlyMemory,ROM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,EPROM)、电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、磁性随机存取存储器(Ferromagnetic Random Access Memory,FRAM)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(Compact Disc Read-Only Memory,CD-ROM)等存储器;也可以是包括上述存储器之一或任意组合的各种终端,如移动电话、计算机、平板设备、个人数字助理等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,从语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的型式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所描述的方法。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可从计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (10)

1.一种数据处理方法,所述方法包括:
获取目标图像的图像矩阵;其中,所述图像矩阵包括多个第一元素;所述图像矩阵用于表征所述目标图像的特征信息;
获取用于对所述图像矩阵进行处理的卷积核;其中,所述卷积核包括预设行和预设列的第二元素;
基于所述图像矩阵,获取多个子矩阵;其中,所述子矩阵包括所述预设行和所述预设列的第一元素;
利用所述卷积核并行对所述子矩阵中的第一元素进行处理。
2.根据权利要求1所述的方法,其特征在于,所述基于所述图像矩阵,获取多个子矩阵,包括:
获取用于更新所述子矩阵的卷积步长;
基于所述卷积步长,利用预设区域对所述图像矩阵进行扫描,依次得到所述多个子矩阵;其中,所述预设区域的行值和列值分别为所述预设行和所述预设列。
3.根据权利要求2所述的方法,其特征在于,所述利用所述卷积核并行对所述子矩阵中的第一元素进行处理,包括:
利用预设数量的乘法器,并行对所述卷积核的第二元素和所述子矩阵的第一元素,进行乘法处理;其中,所述预设数量和所述卷积核中的第二元素的数量相同。
4.根据权利要求3所述的方法,其特征在于,所述利用预设数量的乘法器,并行对所述卷积核的第二元素和所述子矩阵的第一元素,进行乘法处理,包括:
依次存储所述多个子矩阵中的第一元素至存储空间;
从所述存储空间中依次并行读取所述预设数量的第一元素;
利用所述预设数量的乘法器,并行对所述卷积核的第二元素和所述预设数量的第一元素,进行所述乘法处理。
5.根据权利要求3所述的方法,其特征在于,所述获取目标图像的图像矩阵,包括:
获取所述目标图像的第一通道的第一图像矩阵、第二通道的第二图像矩阵以及第三通道的第三图像矩阵;其中,所述第一图像矩阵包括多个第一子元素,所述第二图像矩阵包括多个第二子元素,所述第三图像矩阵包括多个第三子元素;所述第一子元素、所述第二子元素以及所述第三子元素包括在所述多个第一元素内;
相应地,所述获取用于对所述图像矩阵进行处理的卷积核,包括:
获取用于对所述第一图像矩阵进行处理的第一卷积核、对所述第二图像矩阵进行处理的第二卷积核以及对所述第三图像进行处理的第三卷积核;其中,所述第一卷积核、所述第二卷积核以及所述第三卷积核包括在所述卷积核内;所述第一卷积核包括所述预设行和所述预设列的第四子元素、所述第二卷积核包括所述预设行和所述预设列的第五子元素、以及所述第三卷积核包括所述预设行和所述预设列的第六子元素。
6.根据权利要求5所述的方法,其特征在于,所述基于所述卷积步长,利用预设区域对所述图像矩阵进行扫描,依次得到所述多个子矩阵,包括:
基于所述卷积步长,利用三个所述预设区域分别对所述第一图像矩阵、所述第二图像矩阵以及所述第三图像矩阵进行扫描,并依次得到所述多个子矩阵;其中,所述子矩阵包括所述第一图像矩阵中的所述预设行和所述预设列的第一子矩阵、所述第二图像矩阵中的与所述第一子矩阵位置对应的第二子矩阵、以及所述第三图像矩阵中的与所述第一子矩阵位置对应的第三子矩阵。
7.根据权利要求6所述的方法,其特征在于,所述利用预设数量的乘法器,并行对所述卷积核的第二元素和所述子矩阵的第一元素,进行乘法处理,包括:
依次存储多个所述第一子矩阵的第一子元素、所述第二子矩阵的第二子元素以及所述第三子矩阵的第三子元素至所述存储空间;
从所述存储空间中,依次并行读取目标数量的第一子元素、所述目标数量的第二子元素以及所述目标数量的第三子元素;
利用所述预设数量的乘法器,并行对所述第四子元素、所述第五子元素以及所述第六子元素、和所述目标数量的第一子元素、所述目标数量的第二子元素以及所述目标数量的第三子元素,进行乘法处理;其中,所述预设数量为所述目标数量与三的乘积。
8.根据权利要求3所述的方法,其特征在于,所述利用预设数量的乘法器,并行对所述卷积核的第二元素和所述子矩阵的第一元素,进行乘法处理之后,所述方法还包括:
获取基于所述乘法处理得到的所述预设数量的乘积;
对所述预设数量的乘积和与所述卷积核对应的偏差量求和,生成用于形成特征矩阵的元素,并基于所述元素生成特征矩阵;
基于所述特征矩阵,识别所述目标图像。
9.一种电子设备,其特征在于,所述电子设备包括:处理器、存储器和通信总线;
所述通信总线用于实现处理器和存储器之间的通信连接;
所述处理器用于执行存储器中的数据处理方法的程序,以实现以下步骤:
获取目标图像的图像矩阵;其中,所述图像矩阵包括多个第一元素;所述图像矩阵用于表征所述目标图像的特征信息;
获取用于对所述图像矩阵进行处理的卷积核;其中,所述卷积核包括预设行和预设列的第二元素;
基于所述图像矩阵,获取多个子矩阵;其中,所述子矩阵包括所述预设行和所述预设列的第一元素;
利用所述卷积核并行对所述子矩阵中的第一元素进行处理。
10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如权利要求1至8中任一项所述的数据处理方法的步骤。
CN201910227603.8A 2019-03-25 2019-03-25 一种数据处理方法、电子设备及计算机存储介质 Pending CN110020678A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910227603.8A CN110020678A (zh) 2019-03-25 2019-03-25 一种数据处理方法、电子设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910227603.8A CN110020678A (zh) 2019-03-25 2019-03-25 一种数据处理方法、电子设备及计算机存储介质

Publications (1)

Publication Number Publication Date
CN110020678A true CN110020678A (zh) 2019-07-16

Family

ID=67189949

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910227603.8A Pending CN110020678A (zh) 2019-03-25 2019-03-25 一种数据处理方法、电子设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN110020678A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110737473A (zh) * 2019-09-24 2020-01-31 北京小米移动软件有限公司 数据处理方法及装置、终端、存储介质
CN111753847A (zh) * 2020-06-28 2020-10-09 浙江大华技术股份有限公司 图像预处理方法及装置、存储介质、电子装置
CN112417185A (zh) * 2020-11-27 2021-02-26 北京爱奇艺科技有限公司 一种图像关键点位置计算方法、装置、设备及存储介质
CN112596965A (zh) * 2020-12-14 2021-04-02 上海集成电路研发中心有限公司 一种数字图像坏簇统计方法及集成电路自动测试机
CN113239942A (zh) * 2021-05-21 2021-08-10 佛山育脉科技有限公司 基于卷积运算的图像特征提取方法、装置及可读存储介质
CN113821673A (zh) * 2021-10-09 2021-12-21 成都统信软件技术有限公司 一种图片处理方法、计算设备及可读存储介质
WO2022151779A1 (zh) * 2021-01-13 2022-07-21 华为技术有限公司 卷积运算的实现方法、数据处理方法及装置
WO2022160706A1 (zh) * 2021-01-31 2022-08-04 成都商汤科技有限公司 一种数据处理方法、装置、计算机设备及存储介质
WO2023103551A1 (zh) * 2021-12-06 2023-06-15 广州小鹏自动驾驶科技有限公司 图像数据处理方法、装置、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140368494A1 (en) * 2013-06-18 2014-12-18 Nvidia Corporation Method and system for rendering simulated depth-of-field visual effect
CN107862374A (zh) * 2017-10-30 2018-03-30 中国科学院计算技术研究所 基于流水线的神经网络处理系统和处理方法
CN108681984A (zh) * 2018-07-26 2018-10-19 珠海市微半导体有限公司 一种3*3卷积算法的加速电路
CN108804973A (zh) * 2017-04-27 2018-11-13 上海鲲云信息科技有限公司 基于深度学习的目标检测算法的硬件架构及其执行方法
CN108846095A (zh) * 2018-06-15 2018-11-20 联想(北京)有限公司 一种数据处理方法及装置
CN109299120A (zh) * 2018-08-31 2019-02-01 深圳市商汤科技有限公司 数据处理方法和装置、电子设备、计算机存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140368494A1 (en) * 2013-06-18 2014-12-18 Nvidia Corporation Method and system for rendering simulated depth-of-field visual effect
CN108804973A (zh) * 2017-04-27 2018-11-13 上海鲲云信息科技有限公司 基于深度学习的目标检测算法的硬件架构及其执行方法
CN107862374A (zh) * 2017-10-30 2018-03-30 中国科学院计算技术研究所 基于流水线的神经网络处理系统和处理方法
CN108846095A (zh) * 2018-06-15 2018-11-20 联想(北京)有限公司 一种数据处理方法及装置
CN108681984A (zh) * 2018-07-26 2018-10-19 珠海市微半导体有限公司 一种3*3卷积算法的加速电路
CN109299120A (zh) * 2018-08-31 2019-02-01 深圳市商汤科技有限公司 数据处理方法和装置、电子设备、计算机存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
柳杨 等: "《数字图像物体识别理论详解与实践》", 31 January 2018, 北京邮电大学出版社 *
陈敏 等: "《认知计算导论》", 30 April 2017, 华中科技大学出版社 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110737473A (zh) * 2019-09-24 2020-01-31 北京小米移动软件有限公司 数据处理方法及装置、终端、存储介质
CN111753847A (zh) * 2020-06-28 2020-10-09 浙江大华技术股份有限公司 图像预处理方法及装置、存储介质、电子装置
CN112417185A (zh) * 2020-11-27 2021-02-26 北京爱奇艺科技有限公司 一种图像关键点位置计算方法、装置、设备及存储介质
CN112596965A (zh) * 2020-12-14 2021-04-02 上海集成电路研发中心有限公司 一种数字图像坏簇统计方法及集成电路自动测试机
CN112596965B (zh) * 2020-12-14 2024-04-09 上海集成电路研发中心有限公司 一种数字图像坏簇统计方法及集成电路自动测试机
WO2022151779A1 (zh) * 2021-01-13 2022-07-21 华为技术有限公司 卷积运算的实现方法、数据处理方法及装置
WO2022160706A1 (zh) * 2021-01-31 2022-08-04 成都商汤科技有限公司 一种数据处理方法、装置、计算机设备及存储介质
CN113239942A (zh) * 2021-05-21 2021-08-10 佛山育脉科技有限公司 基于卷积运算的图像特征提取方法、装置及可读存储介质
CN113821673A (zh) * 2021-10-09 2021-12-21 成都统信软件技术有限公司 一种图片处理方法、计算设备及可读存储介质
WO2023103551A1 (zh) * 2021-12-06 2023-06-15 广州小鹏自动驾驶科技有限公司 图像数据处理方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN110020678A (zh) 一种数据处理方法、电子设备及计算机存储介质
CN106951395B (zh) 面向压缩卷积神经网络的并行卷积运算方法及装置
Andrearczyk et al. Using filter banks in convolutional neural networks for texture classification
KR102662349B1 (ko) 컨볼루션 뉴럴 네트워크들에 대한 슈퍼픽셀 방법들
TWI804684B (zh) 用於在深度神經網路中利用啟動稀疏性的方法與裝置
CN108154240B (zh) 一种低复杂度的量子线路模拟系统
CN107729996B (zh) 零系数跳过卷积神经网络引擎
KR101298393B1 (ko) 그래픽 처리 유닛 상에서 콘볼루션 신경망을 트레이닝하는방법
CN110826719B (zh) 一种量子程序的处理方法、装置、存储介质和电子装置
CN107844828A (zh) 神经网络中的卷积计算方法和电子设备
CN108108811A (zh) 神经网络中的卷积计算方法和电子设备
CN106951962A (zh) 用于神经网络的复合运算单元、方法和电子设备
CN113486981B (zh) 基于多尺度特征注意力融合网络的rgb图像分类方法
US11797855B2 (en) System and method of accelerating execution of a neural network
CN106156781A (zh) 排序卷积神经网络构建方法及其图像处理方法与装置
CN110321997A (zh) 高并行度计算平台、系统及计算实现方法
CN107203787A (zh) 一种无监督正则化矩阵分解特征选择方法
CN107516131A (zh) 卷积计算的加速方法和装置、电子设备和存储介质
CN110349225A (zh) 一种bim模型外部轮廓快速提取方法
CN112906865A (zh) 神经网络架构搜索方法、装置、电子设备及存储介质
CN108363962A (zh) 一种基于多层次特征深度学习的人脸检测方法及系统
DE102017117381A1 (de) Beschleuniger für dünnbesetzte faltende neuronale Netze
CN104992425B (zh) 一种基于gpu加速的dem超分辨率方法
CN115485656A (zh) 用于卷积运算的存储器内处理方法
Ahn Computation of deep belief networks using special-purpose hardware architecture

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190716

RJ01 Rejection of invention patent application after publication