WO2022228105A1

WO2022228105A1 - 图像数据的处理方法和装置、存储介质及电子设备

Info

Publication number: WO2022228105A1
Application number: PCT/CN2022/086217
Authority: WO
Inventors: 艾通; 李峰; 李昊沅
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2021-04-26
Filing date: 2022-04-12
Publication date: 2022-11-03
Also published as: EP4296891A1; EP4296891A4; US20230083565A1; CN112990370A; CN112990370B; JP2023547831A

Abstract

本申请公开了一种图像数据的处理方法和装置、存储介质及电子设备。其中，该方法包括：采用获取待处理的第一图像数据集，其中，第一图像数据集中的图像数据按照第一数据格式进行排列，将第一图像数据集中的数据进行交织重排，得到第二图像数据集，其中，第二图像数据集中的图像数据按照第二数据格式进行排列，交织重排的方式与卷积操作匹配，第二数据格式的维度小于第一数据格式，对第二图像数据集和预先获取的第二权重数据集执行卷积操作，得到目标输出结果。

Description

图像数据的处理方法和装置、存储介质及电子设备

本申请要求于2021年4月26日提交中国专利局、申请号为202110451609.0、名称为“图像数据的处理方法和装置、存储介质及电子设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及计算机领域，具体而言，涉及一种图像数据的处理方法和装置、存储介质及电子设备。

背景技术

目前的相关技术中，传统计算模式一般为每一个输出即是一个线程组，利用SIMD(Single Instruction Multiple Data，单指令多数据结构)对图像数据进行处理，例如，在利用SIMD进行卷积运算的过程中，输入维度为[N，C，H，W]＝[1，1，5，5]，卷积核维度为[Cout，Cin，kernel_h，kernel_w]＝[1，1，3，3]，进行卷积计算并最终生成维度为[N，C，H，W]＝[1，1，5，5]的输出，其中，N，C，H，W分别表示批次、通道数、高度、宽度；Cout表示卷积核的输出通道数，Cin表示卷积核的输入通道数，kernel_h表示卷积核的高度，kernel_w表示卷积核的宽度。

现有的技术方案的数据排列通常只针对[N，C，H，W]的维度，且相比传统的数据表达方式对比，对于卷积操作，根据计算机内存排布特点，如果卷积核的尺寸较小而输入空间尺寸较大的话，为了获取信息的完整，需要对输入进行例如补边等操作，而且，由于跨通道获取数据，造成缓存缺失(Cache Miss)以及额外的数据拷贝开销，从而严重影响了计算过程中的设备运行性能，进而降低了处理图像数据的效率。

针对上述的问题，目前尚未提出有效的解决方案。

发明内容

本申请实施例提供了一种图像数据的处理方法和装置、存储介质及电子设备，以至少解决相关技术中存在的处理图像数据的效率比较低的技术问题。

根据本申请实施例的一个方面，提供了一种图像数据的处理方法，由电子设备执行，包括：获取待处理的第一图像数据集，其中，所述第一图像数据集中的图像数据按照第一数据格式进行排列；将所述第一图像数据集中的数据进行交织重排，得到第二图像数据集，其中，所述第二图像数据集中的图像数据按照第二数据格式进行排列，所述交织重排的方式与卷积操作匹配，所述第二数据格式的维度小于所述第一数据格式；对所述第二图像数据集和预先获取的第二权重数据集执行所述卷积操作，得到目标输出结果。

根据本申请实施例的另一方面，还提供了一种图像数据的处理装置，包括：获取模块，用于获取待处理的第一图像数据集，其中，所述第一图像数据集中的图像数据按照第一数据格式进行排列；处理模块，用于将所述第一图像数据集中的数据进行交织重排，得到第二图像数据集，其中，所述第二图像数据集中的图像数据按照第二数据格式进行排列，所述交织重排的方式与卷积操作匹配，所述第二数据格式的维度小于所述第一数据格式；执行模块，用于对所述第二图像数据集和预先获取的第二权重数据集执行所述卷积操作，得到目标输出结果。

根据本申请实施例的又一方面，还提供了一种计算机可读的存储介质，该计算机可读的存储介质中存储有计算机程序，其中，该计算机程序被设置为运行时执行上述图像数据的处理方法。

根据本申请实施例的又一方面，还提供了一种电子设备，包括存储器和处理器，上述存储器中存储有计算机程序，上述处理器被设置为通过所述计算机程序执行上述的图像数据的处理方法。

根据本申请实施例的又一方面，还提供了一种计算机程序产品，包括计算机指令，当所述计算机指令由计算机设备的处理器读取并执行时，使得所述计算机设备执行上述的图像数据的处理方法。

在本申请实施例中，通过对图像数据处理过程中的计算过程实现深度优化，将计算过程中的输入图像数据、输出图像数据以及计算权重进行相应的数据重排，相比传统计算模式降低了额外的数据拷贝开销，并降低了出现Cache Miss的概率，从而实现了优化设备计算性能，提高图像数据的处理效率的技术效果，进而解决了相关技术中存在的处理图像数据的效率比较低的技术问题。

附图简要说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是根据本申请实施例的一种图像数据的处理方法的应用环境的示意图；

图2是根据本申请实施例的一种图像数据的处理方法的流程示意图；

图3是根据本申请实施例的一种图像数据的处理方法的示意图；

图4是根据本申请实施例的又一种图像数据的处理方法的示意图；

图5是根据本申请实施例的又一种图像数据的处理方法的示意图；

图6是根据本申请实施例的又一种图像数据的处理方法的示意图；

图7是根据本申请实施例的又一种图像数据的处理方法的示意图；

图8是根据本申请实施例的又一种图像数据的处理方法的示意图；

图9是根据本申请实施例的又一种图像数据的处理方法的示意图；

图10是根据本申请实施例的又一种图像数据的处理方法的示意图；

图11是根据本申请实施例的又一种图像数据的处理方法的示意图；

图12是根据本申请实施例的一种图像数据的处理装置的结构示意图；

图13是根据本申请实施例的一种电子设备的结构示意图。

具体实施方式

为了使本领域的技术人员更好地理解本申请的技术方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解，这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

首先，在对本申请实施例进行描述的过程中出现的部分名词或者术语适用于如下解释：

CNN：Convolutional Neural Networks(卷积神经网络)；

SIMD：Single Instruction Multiple Data(单指令多数据结构)；

Metal：一种可以访问硬件图像处理单元(GPU)的抽象的框架；

Buffer：Metal Buffer(Metal表示常规的内存)；

Texture：Metal Texture(Metal表示纹理的内存)；

[N，C，H，W]：数据的维度表示方式，[batch，channel，height，width]分别表示[批次，通道数，高度，宽度]；

Cout：卷积核的输出通道数；

Cin：卷积核的输入通道数；

kernel_h：卷积核的高度；

kernel_w：卷积核的宽度。

下面结合实施例对本申请的技术方案进行说明：

根据本申请实施例的一个方面，提供了一种图像数据的处理方法。在本实施例中，上述图像数据的处理方法可以应用于如图1所示的由服务器101和用户终端103所构成的硬件环境中。如图1所示，服务器101通过网络与终端103进行连接，可用于为用户终端或用户终端上安装的客户端提供服务，客户端可以是视频客户端、即时通信客户端、浏览器客户端、教育客户端、游戏客户端等。可在服务器上或独立于服务器设置数据库105，用于为服务器101提供数据存储服务，例如，图像数据存储服务。上述网络可以包括但不限于：有线网络和无线网络，其中，该有线网络包括：局域网、城域网和广域网，该无线网络包括：蓝牙、WIFI及其他实现无线通信的网络。用户终端103可以是配置有应用程序107的终端，可以包括但不限于以下至少之一：手机(如Android手机、iOS手机等)、笔记本电脑、平板电脑、掌上电脑、MID(Mobile Internet Devices，移动互联网设备)、PAD、台式电脑、智能电视等计算机设备。上述服务器可以是单一服务器，也可以是由多个服务器组成的服务器集群，或者是云服务器，使用上述图像数据的处理方法的应用程序107通过用户终端103进行显示。

结合图1所示，上述图像数据的处理方法可以在用户终端103通过如下步骤实现：

S1，在用户终端103的应用程序107中获取待处理的第一图像数据集，其中，第一图像数据集中的图像数据按照第一数据格式进行排列；

S2，在用户终端103的应用程序107中将第一图像数据集中的数据进行交织重排，得到第二图像数据集，其中，第二图像数据集中的图像数据按照第二数据格式进行排列，交织重排的方式与卷积操作匹配，第二数据格式的维度小于第一数据格式；

S3，在用户终端103的应用程序107中对第二图像数据集和预先获取的第二权重数据集执行卷积操作，得到目标输出结果。

在本实施例中，上述图像数据的处理方法还可以包括但不限于由配置于服务器的客户端使用。

在本实施例中，上述图像数据的处理方法可以包括但不限于由用户终端103和设置于服务器101的客户端进行异步使用，例如，通过用户终端103的应用程序107执行上述步骤S1、S2，通过设置于服务器101的客户端执行上述步骤S3，上述仅是一种示例，本实施例不做具体的限定。

作为一种实施方式，如图2所示，上述图像数据的处理方法包括：

S202，获取待处理的第一图像数据集，其中，第一图像数据集中的图像数据按照第一数据格式进行排列；

S204，将第一图像数据集中的数据进行交织重排，得到第二图像数据集，其中，第二图像数据集中的图像数据按照第二数据格式进行排列，交织重排的方式与卷积操作匹配，第二数据格式的维度小于第一数据格式；

S206，对第二图像数据集和预先获取的第二权重数据集执行卷积操作，得到目标输出结果。

在本实施例中，上述第一数据格式的图像数据可以包括但不限于按照N ₁×C ₁×H ₁×W ₁的数据格式进行排列，N ₁表示第一图像数据集包括的图像数据子集的数量，C ₁表示每个图像数据子集中的通道数量，H ₁表示第一图像数据集中每个图像数据子集中的数据高度，W ₁表示第一图像数据集中每个图像数据子集中的数据宽度。

例如，图3是根据本申请实施例的又一种图像数据的处理方法的示意图。上述第一图像数据集中的图像数据按照N ₁×C ₁×H ₁×W ₁的数据格式进行排列可以包括但不限于如图3所示的示例，N ₁表示第一图像数据集包括的图像数据子集的数量，图3中示出N ₁＝2，换言之，在如图3所示的图像数据处理过程中，包括两个批次的待处理数据，其中，一个批次等于一个图像数据子集，C ₁表示每个图像数据子集中的通道数量，图3中示出C ₁＝5，表示该批次的待处理数据包括5个通道的待处理数据，H ₁表示每个图像数据子集中的数据高度，图3中示出H ₁＝h，W ₁表示每个图像数据子集中的数据宽度，图3中示出W ₁＝w，“A，B，C”表示不同通道内的图像数据。

在本实施例中，上述图像数据的处理方法的应用场景可以包括但不限于医疗、金融、征信、银行、游戏、能源、教育、楼宇、游戏、交通、物联、工业以及人工智能等多种需要进行图像数据处理的应用场景，上述应用场景可以包括但不限于应用在神经网络前向计算库中。由于神经网络前向计算库提供了所有神经网络算法的计算能力，因此本申请的应用场景可以涵盖所有使用神经网络前向库的应用场景，例如，包括但不限于与云技术关联的AI算法相关应用，如虚拟背景等。

云技术(Cloud technology)是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来，实现数据的计算、储存、处理和共享的一种托管技术。

其中，云会议是基于云计算技术的一种高效、便捷、低成本的会议形式。使用者只需要通过互联网界面，进行简单易用的操作，便可快速高效地与全球各地团队及客户同步分享语音、数据文件及视频，而会议中数据的传输、处理等复杂技术由云会议服务商帮助使用者进行操作。

目前云会议主要集中在以SaaS(Software as a Service，软件即服务)模式为主体的服务内容，包括电话、网络、视频等服务形式，基于云计算的视频会议就叫云会议。

在云会议时代，数据的传输、处理、存储全部由视频会议厂家的计算机资源处理，用户完全无需再购置昂贵的硬件和安装繁琐的软件，只需打开浏览器，登录相应界面，就能进行高效的远程会议。

云会议系统支持多服务器动态集群部署，并提供多台高性能服务器，大大提升了会议的稳定性、安全性、可用性。近年来，视频会议因能大幅提高沟通效率，持续降低沟通成本，带来内部管理水平升级，而获得众多用户欢迎，并已广泛应用在交通、运输、金融、运营商、教育、企业等各个领域。毫无疑问，视频会议运用云计算以后，在方便性、快捷性、易用性上具有更强的吸引力，必将激发视频会议应用新高潮的到来。

例如，以上述图像数据的处理方法应用在云会议场景中为例，图4是根据本申请实施例的一种图像数据的处理方法的示意图，如图4所示，该方法具体包括但不限于如下步骤：

S1，用户终端402获取待处理的第一图像数据集；

S2，位于用户终端402内部或与用户终端402相连接的处理器404将第一图像数据集中的数据进行交织重排，得到第二图像数据集；

S3，对第二图像数据集和预先获取的第二权重数据集执行卷积操作，得到目标输出结果。

其中，上述第一图像数据集可以包括但不限于如图4所示数据库中存储的待处理的第一图像数据集，上述目标输出结果可以包括但不限于用于在图4所示的云会议应用406的虚拟背景显示区域408中进行显示的虚拟背景，或，其他使用上述图像数据处理方法处理之后得到的图像数据。

上述仅是一种示例，本实施例不做任何具体的限定。

在本实施例中，上述对第二图像数据集和预先获取的第二权重数据集执行卷积操作，得到目标输出结果可以包括但不限于对第二图像数据集和第二权重数据集执行卷积操作，得到第三图像数据集，其中，卷积操作包括但不限于卷积操作，目标输出结果包括但不限于第三图像数据集，第二图像数据集是将S ₁组图像数据中的每组图像数据中的M ₁个通道的图像数据进行交织重排，得到的图像数据集，S ₁组图像数据是将第一图像数据集中每M ₁个通道的图像数据分成一组，得到的图像数据，M ₁≤C ₁。

在本实施例中，获取待处理的第一图像数据集，其中，第一图像数据集中的图像数据按照N ₁×C ₁×H ₁×W ₁的数据格式进行排列，将第一图像数据集中的数据进行交织重排，得到第二图像数据集，其中，第二图像数据集中的图像数据按照N ₁×H ₂×W ₂的数据格式进行排列，交织重排的方式与卷积操作匹配。通过对图像数据处理过程中的计算过程实现深度优化，将计算过程中的输入图像数据、输出图像数据以及计算权重进行相应的数据重排，从而将较高维度的数据重新排列为较低维度的数据，并且在后续进行卷积计算的过程中，处理不同通道的数据时，能够将多个通道的数据进行分组，从而能够通过跨分组形式从不同通道内提取数据，这能够有效降低跨通道提取数据的次数。而在现有技术中，每次从不同通道内提取数据均需要跨通道提取，因此本申请中记载的技术方案相比传统计算模式降低了额外的数据拷贝开销，并降低了出现Cache Miss的概率，从而实现了优化设备计算性能，提高图像数据的处理效率的技术效果，进而解决了相关技术中存在的处理图像数据的效率比较低的技术问题。

作为一种实施例，所述第一图像数据集中的图像数据按照第一数据格式进行排列，包括：第一图像数据集中的图像数据按照N ₁×C ₁×H ₁×W ₁的数据格式进行排列，N ₁表示第一图像数据集包括的图像数据子集的数量，C ₁表示每个图像数据子集中的通道数量，H ₁表示第一图像数据集中每个图像数据子集中的数据高度，W ₁第一图像数据集中表示每个图像数据子集中的数据宽度；

所述第二图像数据集中的图像数据按照第二数据格式进行排列，包括：将第一图像数据集中的数据进行交织重排，得到第二图像数据集，其中，第二图像数据集中的图像数据按照N ₁×H ₂×W ₂的数据格式进行排列，H ₂表示第二图像数据集中每个图像数据子集中的数据高度，W ₂表示第二图像数据集中每个图像数据子集中的数据宽度。

在本实施例中，上述将第一图像数据集中的数据进行交织重排，得到第二图像数据集可以包括但不限于将第一图像数据集中的图像数据进行交织重排，以降低图像数据的维度，便于后续卷积操作。

图5是根据本申请实施例的又一种图像数据的处理方法的示意图。上述将第一图像数据集中的数据进行交织重排，得到第二图像数据集可以包括但不限于如图5所示的示例，将第一图像数据集中每M ₁个通道的图像数据分成一组，其中，M ₁≤C ₁，将每组图像数据中的M ₁个通道的图像数据进行交织重排，得到第二图像数据集，以M ₁＝4为例，则如图5中示出的将每个图像数据按每四个通道为一组分成C ₁/4个组，再将每组内的4个通道维度的图像数据按照交织(混合)的形式重新排列，得到如图5所示的[N，H，C/4，W，C ₄]的数据结构的第二图像数据集，其中，“A，B，C”表示不同通道内的图像数据。

例如，以图5中的示例进行如下说明：

位于第一图像数据集左上角的A(1，1)数据，其位于第一个通道内的第一行、第一列，而B(1，1)数据，其位于第二个通道内的第一行、第一列。当进行卷积运算时，在提取A(1，1)数据后，需要提取B(1，1)数据的情况下，现有技术中需要由提取A通道数据的模式切换为提取B通道数据的模式，也就是说，需要跨通道来进行数据提取，而采用本实施例，通过将A(1，1)的数据排列在第二图像数据集中的第一行、第一列，B(1，1)的数据排列在第二图像数据集中的第一行、第二列，在提取了A(1，1)数据之后，直接可以提取B(1，1)的数据，避免了跨通道提取数据造成的cache miss等问题。

作为一种实施例，将第一图像数据集中的数据进行交织重排，得到第二图像数据集，包括：

将第一图像数据集中每M ₁个通道的图像数据分成一组，得到S ₁组图像数据，其中，M ₁≤C ₁；

将S ₁组图像数据中的每组图像数据中的M ₁个通道的图像数据进行交织重排，得到第二图像数据集。

在本实施例中，上述将第一图像数据集中每M ₁个通道的图像数据分成一组，得到S ₁组图像数据可以包括但不限于，在C ₁为M ₁的整数倍的情况下，将第一图像数据集中每M ₁个通道的图像数据分成一组，得到S ₁组图像数据，其中，

在C ₁不为M ₁的整数倍的情况下，将第一图像数据集中的通道数量从C ₁增加到C ₂，得到第三图像数据集，其中，C ₂为M ₁的整数倍，第三图像数据集中增加的通道上的图像数据为0(即，将通道数量补齐为M ₁的整数倍)；将第三图像数据集中每M ₁个通道的图像数据分成一组，得到S ₁组图像数据，其中，

以N＝1为例，图6是根据本申请实施例的又一种图像数据的处理方法的示意图。上述第二图像数据集可以包括但不限于如图6所示的示例，其中，“A，B，C”表示不同通道内的图像数据，将A(1，1)、B(1，1)、C(1，1)、D(1，1)交织重排为同一高度的图像数据，图像数据中不同通道的数据连续排序，提高了数据访问的局部性能，可以极大地降低Cache Miss的概率。在现有技术中，在卷积核的尺寸为非1x1尺寸的情况下，在对输入的图片进行特征提取时，对于边界区域的特征提取，需要将一些额外的区域配置为0，进而实现对边界区域的特征提取。而在本实施例中，因为M ₁个通道打包处理，因此在使用SIMD进行卷积运算时，不需要对边界区域进行补边操作，从而节省了数据拷贝的额外开销。

以图5为例，在卷积核的尺寸为3x3的情况下，在提取B(2，1)为中心点的特征数据时，现有技术需要在第一图像数据集中B(2，1)的左侧，补入三个数值为0的特征点，以实现B(2，1)数据的特征提取。而在本实施例中重新排列数据之后，第二图像数据集中B(2，1)左侧的数据为A(2，1)的数据，因此，无需进行补边操作，直接基于B(2，1)进行特征提取即可。也就是说，由于在本申请实施例中对待处理数据进行了重新交织排布，在使用卷积核提取边界数据的过程中，可以减少补边操作的次数，将不同通道内的数据置于同一维度，从而能够达到节省数据拷贝的额外开销的效果。

在本实施例中，将第一图像数据集中每M ₁个通道的图像数据分成一组，得到S ₁组图像数据，其中，M ₁≤C ₁，将S ₁组图像数据中的每组图像数据中的M ₁个通道的图像数据进行交织重排，得到第二图像数据集。通过将第一图像数据集中的数据进行交织重排，得到第二图像数据集，相比传统计算模式下容易造成Cache Miss以及额外的数据拷贝开销的情况，本实施例降低了出现Cache Miss的概率，从而实现了优化设备计算性能，提高图像数据的处理效率的技术效果，进而解决了相关技术中存在的处理图像数据的效率比较低的技术问题。

作为一种实施例，将第一图像数据集中每M ₁个通道的图像数据分成一组，得到S ₁组图像数据，包括：

在C ₁为M ₁的整数倍的情况下，将第一图像数据集中每M ₁个通道的图像数据分成一组，得到S ₁组图像数据，其中，

在C ₁不为M ₁的整数倍的情况下，将第一图像数据集中的通道数量从C ₁增加到C ₂，得到第三图像数据集，其中，C ₂为M ₁的整数倍，第三图像数据集中增加的通道上的图像数据为0；将第三图像数据集中每M ₁个通道的图像数据分成一组，得到S ₁组图像数据，其中，

在本实施例中，上述在C ₁不为M ₁的整数倍的情况下，将第一图像数据集中的通道数量从C ₁增加到C ₂可以包括但不限于

向上取整×M ₁，当然也可以向下取整或以其他方式进行取整。

以N＝1，C ₁＝5，M ₁＝4为例，如果通道数量C ₁不能整除4则将通道数量补齐到4的整倍数，补上的激活值(对应于前述的图像数据)全部填0，如图5所示，第二行第二列至第四列均为“0.0f”。

上述仅是一种示例，本实施例不做任何具体限定。

作为一种实施例，将S ₁组图像数据中的每组图像数据中的M ₁个通道的图像数据进行交织重排，得到第二图像数据集，包括：

在C ₁为M ₁的整数倍的情况下，将S ₁组图像数据中的每组图像数据中的M ₁个通道的图像数据进行交织重排，得到第二图像数据集，其中，W ₂＝M ₁×W ₁，

在C ₁不为M ₁的整数倍的情况下，将S ₁组图像数据中的每组图像数据中的M ₁个通道的图像数据进行交织重排，得到第二图像数据集，其中，W ₂＝M ₁×W ₁，

在本实施例中，如图5所示，以N＝1，C ₁＝5，M ₁＝4为例，则上述W ₂＝M ₁×W ₁即为图5所示的W ₂＝w*C ₄，

即为图5所示的H ₂＝H*C/4。

通过本实施例，将数据结构进行重排为N ₁×H ₂×W ₂后，不需要对数据进行补边也可以利用SIMD来加速卷积运算，避免卷积运算时进行补边而导致的数据拷贝的额外开销。

作为一种实施例，该方法还包括：

获取预设的第一权重数据集，其中，第一权重数据集中的权重数据按照N ₂×C ₂×H ₃×W ₃的数据格式进行排列，N ₂表示第一权重数据集包括的权重数据子集的数量，C ₂表示每个权重数据子集中的通道数量，H ₃表示每个权重数据子集中的数据高度，W ₃表示每个权重数据子集中的数据宽度；

将第一权重数据集中的数据进行交织重排，得到第二权重数据集，其中，第二权重数据集中的权重数据按照H ₄×W ₄的数据格式进行排列，H4表示第二权重数据集中的权重数据的数据高度，W4表示第二权重数据集中的权重数据的数据宽度。

在本实施例中，上述第一权重数据集可以包括但不限于进行卷积计算过程中，使用卷积核处理图像数据时所采用的权重数据，例如，以上述图像数据的处理方法应用在云会议场景中为例，图7是根据本申请实施例的又一种图像数据的处理方法的示意图，如图7所示，该方法具体包括但不限于如下步骤：

S1，位于用户终端702内部或与用户终端702相连接的处理器704获取预设的第一权重数据集；

S2，位于用户终端702内部或与用户终端702相连接的处理器704将第一权重数据集中的数据进行交织重排，得到第二权重数据集。

其中，上述第一权重数据集可以包括但不限于在如图7所示数据库中存储，上述第二权重数据集可以包括但不限于用于与待处理的第二图像数据集关联使用，以在图7所示的云会议应用706的虚拟背景显示区域708中生成虚拟背景。

图8是根据本申请实施例的又一种图像数据的处理方法的示意图。在本实施例中，上述第一图像数据集中的图像数据按照N ₂×C ₂×H ₃×W ₃的数据格式进行排列可以包括但不限于如图8所示的示例，N ₂表示第一权重数据集包括的权重数据子集的数量，图8中示出的N ₂＝3，也即N ₂＝C _out，C ₂表示每个权重数据子集中的通道数量，图8中示出的C ₂＝5，也即C ₂＝C _in，H ₃表示每个权重数据子集中的数据高度，图8中示出的H ₃＝4，也即H ₃＝kernel_h，W ₃表示每个权重数据子集中的数据宽度，图8中示出的W ₃＝3，也即W ₃＝kernel_w，“A，B，C”表示不同通道内的图像数据。

上述仅是一种示例，本实施例不做任何具体的限定。

在本实施例中，通过将第一权重数据集中的数据进行交织重排，得到第二权重数据集，相比传统计算模式下容易造成Cache Miss以及额外的数据拷贝开销的情况，本实施例降低了出现Cache Miss的概率，从而实现了优化设备计算性能，提高图像数据的处理效率的技术效果，进而解决了相关技术中存在的处理图像数据的效率比较低的技术问题。

作为一种实施例，将第一权重数据集中的数据进行交织重排，得到第二权重数据集，包括：

将第一权重数据集中每M ₂个权重数据子集的权重数据分成一组，得到S ₂组权重数据，其中，M ₂≤N ₂；

将S ₂组权重数据中的每组权重数据中的M ₂个权重数据进行交织重排，得到第二权重数据集。

图9是根据本申请实施例的又一种图像数据的处理方法的示意图。在本实施例中，上述将第一权重数据集中的数据进行交织重排，得到第二权重数据集可以包括但不限于如图9所示的示例，以N ₂＝1为例，将第一权重数据集中每M ₂个权重数据子集的权重数据分成一组，得到S ₂组权重数据，将S ₂组权重数据中的每组权重数据中的M ₂个权重数据进行交织重排，得到第二权重数据集，以M ₂＝4为例，则如图9中示出的将权重数据按每四个输出通道为一组分成C/4个组，如果输出通道数量不能整除4则将通道数量补齐到4的整倍数，补上的激活值全部填0，每组内的4个通道维度的权重数据按照交织(混合)的形式重新排列，另外在随后的维度将输入通道维度顺序排列，即可得到[Cout/4，kernel_h，kernel_w，Cin，Cout4]的数据结构，OC4即为Cout4，IC即为Cin。

在本实施例中，上述将第一权重数据集中每M ₂个权重数据子集的权重数据分成一组，得到S ₂组权重数据，包括但不限于在N ₂为M ₂的整数倍的情况下，将第一权重数据集中每M ₂ 个权重数据子集的权重数据分成一组，得到S ₂组权重数据，其中，

在N ₂不为M ₂的整数倍的情况下，将第一权重数据集中的权重数据子集的数量从N ₂增加到N ₃，得到第三权重数据集，其中，N ₃为M ₂的整数倍，第三权重数据集中增加的权重数据子集中的权重数据为0；将第三权重数据集中每M ₂个权重数据子集的权重数据分成一组，得到S ₂组权重数据，其中，

作为一种实施例，将第一权重数据集中每M ₂个权重数据子集的权重数据分成一组，得到S ₂组权重数据，包括：

在N ₂为M ₂的整数倍的情况下，将第一权重数据集中每M ₂个权重数据子集的权重数据分成一组，得到S ₂组权重数据，其中，

在N ₂不为M ₂的整数倍的情况下，将第一权重数据集中的权重数据子集的数量的从N ₂增加到N ₃，得到第三权重数据集，其中，N ₃为M ₂的整数倍，第三权重数据集中增加的权重数据子集中的权重数据为0；将第三权重数据集中每M ₂个权重数据子集的权重数据分成一组，得到S ₂组权重数据，其中，

在本实施例中，上述在N ₂不为M ₂的整数倍的情况下，将第一权重数据集中的权重数据子集的数量的从N ₂增加到N ₃，得到第三权重数据集可以包括但不限于

向下取整×M ₂，当然也可以向上取整或以其他方式进行取整。

以N2＝3，M2＝4为例，如果N2不能整除4则补齐到4的倍数，补上的激活值(对应于前述的图像数据)全部填0，如图9所示，第四列、第八列、第十二列，以此类推均为“0.0f”。

上述仅是一种示例，本实施例不做任何具体限定。

通过本实施例，采用在N ₂为M ₂的整数倍的情况下，将第一权重数据集中每M ₂个权重数据子集的权重数据分成一组，得到S ₂组权重数据，其中，

的方式，通过将第一权重数据集中的数据进行交织重排，得到第二权重数据集，降低了传统计算模式下容易造成的Cache Miss以及额外的数据拷贝开销，达到了降低出现Cache Miss的概率的目的，从而实现了优化设备计算性能，提高图像数据的处理效率的技术效果，进而解决了相关技术中存在的处理图像数据的效率比较低的技术问题。

作为一种实施例，将S ₂组权重数据中的每组权重数据中的M ₂个权重数据进行交织重排，得到第二权重数据集，包括：

在N ₂为M ₂的整数倍的情况下，将S ₂组权重数据中的每组权重数据中的M ₂个权重数据进行交织重排，得到第二权重数据集，其中，

H ₄＝H ₃×W ₃；

在N ₂不为M ₂的整数倍的情况下，将S ₂组权重数据中的每组权重数据中的M ₂个权重数据进行交织重排，得到第二权重数据集，其中，

H ₄＝H ₃×W ₃。

在本实施例中，以M ₂＝4为例，则如图9所示，H ₃＝kernel_h*kernel_w，W ₃＝IC*OC ₄，每组权重数据的高为kernel_w，宽为OC _4。

上述仅是一种示例，本实施例不做任何具体限定。

作为一种实施例，N ₂的取值为卷积核的输出通道的数量，C ₂的取值为卷积核的输入通道的数量，卷积操作为使用卷积核执行的卷积操作，每个权重数据子集包括C ₂个输入通道上的权重数据，每个输出通道包括C ₂个输入通道。

在本实施例中，上述每个权重数据子集包括C ₂个输入通道上的权重数据，使用卷积核基于第二权重数据集将C ₂个待处理的第二图像数据集执行卷积操作，得到目标输出结果。

作为一种实施例，对第二图像数据集和预先获取的第二权重数据集执行卷积操作，得到目标输出结果，包括：

对第二图像数据集和第二权重数据集执行卷积操作，得到第四图像数据集，其中，所述目标输出结果包括第四图像数据集，所述第二图像数据集是将S ₁组图像数据中的每组图像数据中的M ₁个通道的图像数据进行交织重排，得到的图像数据集，所述S ₁组图像数据是将第一图像数据集中每M ₁个通道的图像数据分成一组，得到的图像数据，M ₁≤C ₁。

在本实施例中，上述对第二图像数据集和第二权重数据集执行卷积操作包括但不限于，在第二图像数据集中获取C ₂组图像数据，其中，每组图像数据包括第一图像数据集中位于同一个通道的多个图像数据，每组图像数据是从C ₂组图像数据中的上一组图像数据的存储地址偏移1个地址得到的图像数据，对C ₂组图像数据和第二权重数据集中的N ₂×C ₂组权重数据执行卷积操作，得到第四图像数据集中的N ₂组图像数据，其中，每组权重数据与每组图像数据具有相同的数据结构。

在本实施例中，通过将第一权重数据集中的数据以及待处理的第一图像数据集中的数据进行交织重排，相比传统计算模式下容易造成Cache Miss以及额外的数据拷贝开销的情况，降低了出现Cache Miss的概率，从而实现了优化设备计算性能，提高图像数据的处理效率的技术效果，进而解决了相关技术中存在的处理图像数据的效率比较低的技术问题。

作为一种实施例，对第二图像数据集和第二权重数据集执行卷积操作，得到第三图像数据集，包括：

在第二图像数据集中获取C ₂组图像数据，其中，每组图像数据包括第一图像数据集中位于同一个通道的多个图像数据，每组图像数据是从C ₂组图像数据中的上一组图像数据的存储地址偏移1个地址得到的图像数据；

对C ₂组图像数据和第二权重数据集中的N ₂×C ₂组权重数据执行卷积操作，得到第三图像数据集中的N ₂组图像数据，其中，每组权重数据与每组图像数据具有相同的数据结构；

其中，第二权重数据集是将第一权重数据集中的数据进行交织重排，得到第二权重数据集，第一权重数据集中的权重数据按照N ₂×C ₂×H ₃×W ₃的数据格式进行排列，N ₂表示第一权重数据集包括的权重数据子集的数量，C ₂表示每个权重数据子集中的通道数量，H ₃ 表示每个权重数据子集中的数据高度，W ₃表示每个权重数据子集中的数据宽度。

在本实施例中，上述每组图像数据是从C ₂组图像数据中的上一组图像数据的存储地址偏移1个地址得到的图像数据可以包括但不限于，按照预定步长的滑动窗口处理图像数据，也即，从C ₂组图像数据中的上一组图像数据的存储地址偏移1个地址即为步长＝1。

在本实施例中，上述每组权重数据与每组图像数据具有相同的数据结构可以包括但不限于上述M ₁与M ₂相同。

在本实施例中，从C ₂组图像数据中的上一组图像数据的存储地址偏移1个地址得到图像数据，以得到每组图像数据。通过将第一权重数据集中的数据以及待处理的第一图像数据集中的数据进行交织重排，降低了卷积计算过程中，跨通道获取数据的频率。相比传统计算模式下容易造成Cache Miss以及额外的数据拷贝开销的情况，降低了出现Cache Miss的概率，从而实现了优化设备计算性能，提高图像数据的处理效率的技术效果，进而解决了相关技术中存在的处理图像数据的效率比较低的技术问题。

作为一种实施例，对C ₂组图像数据和第二权重数据集中的N ₂×C ₂组权重数据执行卷积操作，得到第三图像数据集中的N ₂组图像数据，包括：

将N ₂×C ₂组权重数据中的每C ₂组权重数据分别与C ₂组图像数据执行加权求和操作，得到N ₂组图像数据。

在本实施例中，该方法可以包括但不限于，按照预定的滑动步长逐个使用卷积核将N ₂×C ₂组权重数据中的每C ₂组权重数据分别与C ₂组图像数据执行加权求和操作，得到N ₂组图像数据。

图10是根据本申请实施例的又一种图像数据的处理方法的示意图。如图10所示，以卷积核尺寸为3x3为例，通过使用卷积核基于第二权重数据集中记录的对应的权重参数，对相同位置的第二图像数据集中的数据进行加权求和，得到N ₂组图像数据中的一组图像数据，按照步长为1的滑动窗口继续处理，以得到上述N ₂组图像数据。

作为一种实施例，该方法还包括：在第一内存空间中存储第一图像数据集和第二图像数据集；

在第二内存空间中存储第二权重数据集，其中，第一内存空间与第二内存空间为相互独立的内存空间。

在本实施例中，上述第一内存空间可以包括但不限于用于存储图像数据的存储空间，例如，Texture资源，上述第二内存空间可以包括但不限于用于存储权重数据的存储空间，例如，Buffer资源。

图11是根据本申请实施例的又一种图像数据的处理方法的示意图。如图11所示，现有的技术方案在使用例如Metal做GPU运算的时候，一般只会使用一种内存(Buffer/Texture)作为数据加载/存储的空间，然而在目前模型设计越来越轻量级的计算模式下，内存带宽的访问限制往往会成为最终性能的瓶颈。而在本申请实施例中，Metal中Data Buffer资源和Texture资源是独立的内存空间。因此，相比传统的数据只使用一种内存结构(Buffer/Texture)表达方式对比，输入/输出使用Texture保存数据，权重/偏置参数使用Buffer来表示存储，区分开使用Texture和Buffer可以获取到更高的内存带宽，降低Cache Miss的概率，使内存访问的性能得到提升。

对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，依据本申请，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，所涉及的动作和模块并不一定是本申请所必须的。

根据本申请实施例的另一个方面，还提供了一种用于实施上述图像数据的处理方法的图像数据的处理装置。如图12所示，该装置包括：

获取模块1202，用于获取待处理的第一图像数据集，其中，第一图像数据集中的图像数据按照第一数据格式进行排列；

处理模块1204，用于将第一图像数据集中的数据进行交织重排，得到第二图像数据集，其中，第二图像数据集中的图像数据按照第二数据格式进行排列，交织重排的方式与卷积操作匹配，第二数据格式的维度小于第一数据格式；

执行模块1206，用于对第二图像数据集和预先获取的第二权重数据集执行卷积操作，得到目标输出结果。

作为一种实施例，所述获取模块，包括：获取单元，用于获取待处理的第一图像数据集，其中，第一图像数据集中的图像数据按照N ₁×C ₁×H ₁×W ₁的数据格式进行排列，N ₁表示第一图像数据集包括的图像数据子集的数量，C ₁表示每个图像数据子集中的通道数量，H ₁表示第一图像数据集中每个图像数据子集中的数据高度，W ₁表示第一图像数据集中每个图像数据子集中的数据宽度；所述处理模块，包括：处理单元，用于将第一图像数据集中的数据进行交织重排，得到第二图像数据集，其中，第二图像数据集中的图像数据按照N ₁×H ₂×W ₂的数据格式进行排列，H ₂表示第二图像数据集中每个图像数据子集中的数据高度，W ₂表示第二图像数据集中每个图像数据子集中的数据宽度。

作为一种实施例，所述处理模块，包括：分组单元，用于将第一图像数据集中每M ₁个通道的图像数据分成一组，得到S ₁组图像数据，其中，M ₁≤C ₁；排列单元，用于将S ₁组图像数据中的每组图像数据中的M ₁个通道的图像数据进行交织重排，得到第二图像数据集。

作为一种实施例，所述分组单元用于通过如下方式将第一图像数据集中每M ₁个通道的图像数据分成一组，得到S ₁组图像数据：在C ₁不为M ₁的整数倍的情况下，将第一图像数据集中的通道数量从C ₁增加到C ₂，得到第三图像数据集，其中，C ₂为M ₁的整数倍，第三图像数据集中增加的通道上的图像数据为0；将第三图像数据集中每M ₁个通道的图像数据分成一组，得到S ₁组图像数据，其中，

作为一种实施例，所述排列单元用于通过如下方式将S ₁组图像数据中的每组图像数据中的M ₁个通道的图像数据进行交织重排，得到第二图像数据集：在C ₁为M ₁的整数倍的情况下，将S ₁组图像数据中的每组图像数据中的M ₁个通道的图像数据进行交织重排，得到第二图像数据集，其中，

W ₂＝M ₁×W ₁，

在C ₁不为M ₁的整数倍的情况下，将S ₁组图像数据中的每组图像数据中的M ₁个通道的图像数据进行交织重排，得到第二图像数据集，其中，

W ₂＝M ₁×W ₁，

作为一种实施例，所述装置还用于：获取预设的第一权重数据集，其中，第一权重数据集中的权重数据按照N ₂×C ₂×H ₃×W ₃的数据格式进行排列，N ₂表示第一权重数据集包括的权重数据子集的数量，C ₂表示每个权重数据子集中的通道数量，H ₃表示每个权重数据子集中的数据高度，W ₃表示每个权重数据子集中的数据宽度；将第一权重数据集中的数据进行交织重排，得到第二权重数据集，其中，第二权重数据集中的权重数据按照H ₄×W ₄的数据格式进行排列，H4表示第二权重数据集中的权重数据的数据高度，W4表示第二权重数据集中的权重数据的数据宽度。

作为一种实施例，所述装置还用于通过如下方式将第一权重数据集中的数据进行交织重排，得到第二权重数据集：将第一权重数据集中每M ₂个权重数据子集的权重数据分成一组，得到S ₂组权重数据，其中，M ₂≤N ₂；将S ₂组权重数据中的每组权重数据中的M ₂个权重数据进行交织重排，得到第二权重数据集。

作为一种实施例，所述装置还用于通过如下方式将第一权重数据集中每M ₂个权重数据子集的权重数据分成一组，得到S ₂组权重数据，包括：

在N ₂为M ₂的整数倍的情况下，将第一权重数据集中每M ₂个权重数据子集的权重数据分成一组，得到所述S ₂组权重数据，其中，

作为一种实施例，所述装置还用于通过如下方式将S ₂组权重数据中的每组权重数据中的M ₂个权重数据进行交织重排，得到第二权重数据集，包括：

H ₄＝H ₃×W ₃；

H ₄＝H ₃×W ₃。

作为一种实施例，所述装置还用于通过如下方式对第二图像数据集和预先获取的第二权重数据集执行所述卷积操作，得到目标输出结果，包括：

对第二图像数据集和第二权重数据集执行卷积操作，得到第四图像数据集，其中，目标输出结果包括第四图像数据集，第二图像数据集是将S ₁组图像数据中的每组图像数据中的M ₁个通道的图像数据进行交织重排，得到的图像数据集，S ₁组图像数据是将第一图像数据集中每M ₁个通道的图像数据分成一组，得到的图像数据，M ₁≤C ₁。

作为一种实施例，所述装置还用于通过如下方式对第二图像数据集和第二权重数据集执行卷积操作，得到第四图像数据集，包括：

对C ₂组图像数据和第二权重数据集中的N ₂×C ₂组权重数据执行卷积操作，得到第四图像数据集中的N ₂组图像数据，其中，每组权重数据与每组图像数据具有相同的数据结构；

其中，第二权重数据集是将第一权重数据集中的数据进行交织重排，得到第二权重数据集，第一权重数据集中的权重数据按照N ₂×C ₂×H ₃×W ₃的数据格式进行排列，N ₂表示第一权重数据集包括的权重数据子集的数量，C ₂表示每个权重数据子集中的通道数量，H ₃表示每个权重数据子集中的数据高度，W ₃表示每个权重数据子集中的数据宽度。

作为一种实施例，所述装置还用于通过如下方式对C ₂组图像数据和第二权重数据集中的N ₂×C ₂组权重数据执行卷积操作，得到第三图像数据集中的N ₂组图像数据，包括：

作为一种实施例，所述装置还用于：在第一内存空间中存储第一图像数据集和第二图像数据集；在第二内存空间中存储第二权重数据集，其中，第一内存空间与第二内存空间为相互独立的内存空间。

根据本申请实施例的又一个方面，还提供了一种用于实施上述图像数据的处理方法的电子设备，该电子设备可以是图1所示的终端设备或服务器。本实施例以该电子设备为服务器为例来说明。如图13所示，该电子设备包括存储器1302和处理器1304，该存储器1302中存储有计算机程序，该处理器1304被设置为通过运行计算机程序执行上述任一项方法实施例中的步骤。

在本实施例中，上述电子设备可以位于计算机网络的多个网络设备中的至少一个网络设备。

在本实施例中，上述处理器可以被设置为通过计算机程序执行以下步骤：

S1，获取待处理的第一图像数据集，其中，第一图像数据集中的图像数据按照N ₁×C ₁×H ₁×W ₁的数据格式进行排列，N ₁表示第一图像数据集包括的图像数据子集的数量，C ₁表示每个图像数据子集中的通道数量，H ₁表示每个图像数据子集中的数据高度，W ₁表示每个图像数据子集中的数据宽度；

S2，将第一图像数据集中的数据进行交织重排，得到第二图像数据集，其中，第二图像数据集中的图像数据按照N ₁×H ₂×W ₂的数据格式进行排列，交织重排的方式与卷积操作匹配；

本领域普通技术人员可以理解，图13所示的结构仅为示意，电子设备也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices，MID)、PAD等终端设备。图13并不对上述电子设备的结构造成限定。例如，电子设备还可包括比图13中所示的更多或者更少的组件(如网络接口等)，或者具有与图13所示的不同的配置。

其中，存储器1302可用于存储软件程序以及模块，如本申请实施例中的图像数据的处理方法和装置对应的程序指令/模块，处理器1304通过运行存储在存储器1302内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的图像数据的处理方法。存储器1302可包括高速随机存储器，还可以包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器1302可进一步包括相对于处理器1304远程设置的存储器，这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。其中，存储器1302具体可以用于但不限于存储待处理的图像数据等信息。作为一种示例，如图13所示，上述存储器1302中可以包括但不限于上述图像数据的处理装置中的获取模块1202、处理模块1204以及执行模块1206。此外，还可以包括但不限于上述图像数据的处理装置中的其他模块或单元，本示例中不再赘述。

在实施例中，上述的传输装置1306用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中，传输装置1306包括一个网络适配器(Network Interface Controller，NIC)，其可通过网线与其他网络设备与路由器相连，从而可与互联网或局域网进行通讯。在一个实例中，传输装置1306为射频(Radio Frequency，RF)模块，其用于通过无线方式与互联网进行通讯。

此外，上述电子设备还包括：显示器1308，用于显示图像数据；和连接总线1310，用于连接上述电子设备中的各个模块部件。

在其他实施例中，上述终端设备或者服务器可以是一个分布式系统中的一个节点，其中，该分布式系统可以为区块链系统，该区块链系统可以是由该多个节点通过网络通信的形式连接形成的分布式系统。其中，节点之间可以组成点对点(P2P，Peer To Peer)网络，任意形式的计算设备，比如服务器、终端等电子设备都可以通过加入该点对点网络而成为该区块链系统中的一个节点。

根据本申请的一个方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述图像数据的处理方面的各种实现方式中提供的方法。其中，该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

在本实施例中，上述计算机可读的存储介质可以被设置为存储用于执行以下步骤的计算机程序：

在本实施例中，本领域普通技术人员可以理解，上述实施例的各种方法中的全部或部分步骤可以通过程序指令终端设备相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，该存储介质可以包括：闪存盘、只读存储器(Read-Only Memory，ROM)、随机存取器(Random Access Memory，RAM)、磁盘或光盘等。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在上述计算机可读存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在存储介质中，包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。

在本申请的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解，所揭露的客户端可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例的技术方案。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

以上所述仅是本申请的几个实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本申请的保护范围。

Claims

一种图像数据的处理方法，由电子设备执行，包括：

获取待处理的第一图像数据集，其中，所述第一图像数据集中的图像数据按照第一数据格式进行排列；

将所述第一图像数据集中的数据进行交织重排，得到第二图像数据集，其中，所述第二图像数据集中的图像数据按照第二数据格式进行排列，所述交织重排的方式与卷积操作匹配，所述第二数据格式的维度小于所述第一数据格式；

对所述第二图像数据集和预先获取的第二权重数据集执行所述卷积操作，得到目标输出结果。
根据权利要求1所述的方法，其中，

所述第一图像数据集中的图像数据按照第一数据格式进行排列，包括：所述第一图像数据集中的图像数据按照N ₁×C ₁×H ₁×W ₁的数据格式进行排列，N ₁表示所述第一图像数据集包括的图像数据子集的数量，C ₁表示每个所述图像数据子集中的通道数量，H ₁表示所述第一图像数据集中每个所述图像数据子集中的数据高度，W ₁表示所述第一图像数据集中表示每个所述图像数据子集中的数据宽度；

所述第二图像数据集中的图像数据按照第二数据格式进行排列，包括：所述第二图像数据集中的图像数据按照N ₁×H ₂×W ₂的数据格式进行排列，H ₂表示所述第二图像数据集中每个所述图像数据子集中的数据高度，W ₂表示所述第二图像数据集中每个所述图像数据子集中的数据宽度。
根据权利要求2所述的方法，其中，所述将所述第一图像数据集中的数据进行交织重排，得到第二图像数据集，包括：

将所述第一图像数据集中每M ₁个通道的图像数据分成一组，得到S ₁组图像数据，其中，M ₁≤C ₁；

将所述S ₁组图像数据中的每组图像数据中的M ₁个通道的图像数据进行交织重排，得到所述第二图像数据集。
根据权利要求3所述的方法，其中，所述将所述第一图像数据集中每M ₁个通道的图像数据分成一组，得到S ₁组图像数据，包括：

在C ₁为M ₁的整数倍的情况下，将所述第一图像数据集中每M ₁个通道的图像数据分成一组，得到S ₁组图像数据，其中，

在C ₁不为M ₁的整数倍的情况下，将所述第一图像数据集中的通道数量的从C ₁增加到C ₂，得到第三图像数据集，其中，C ₂为M ₁的整数倍，所述第三图像数据集中增加的通道上的图像数据为0；将所述第三图像数据集中每M ₁个通道的图像数据分成一组，得到S ₁组图像数据，其中，
根据权利要求4所述的方法，其中，所述将所述S ₁组图像数据中的每组图像数据中的M ₁个通道的图像数据进行交织重排，得到所述第二图像数据集，包括：

在C ₁为M ₁的整数倍的情况下，将所述S ₁组图像数据中的每组图像数据中的M ₁个通道的图像数据进行交织重排，得到所述第二图像数据集，其中，

在C ₁不为M ₁的整数倍的情况下，将所述S ₁组图像数据中的每组图像数据中的M ₁个通道的图像数据进行交织重排，得到所述第二图像数据集，其中，
根据权利要求2所述的方法，其中，所述方法还包括：

获取预设的第一权重数据集，其中，所述第一权重数据集中的权重数据按照N ₂×C ₂×H ₃×W ₃的数据格式进行排列，N ₂表示所述第一权重数据集包括的权重数据子集的数量，C ₂表示每个所述权重数据子集中的通道数量，H ₃表示每个所述权重数据子集中的数据高度，W ₃表示每个所述权重数据子集中的数据宽度；

将所述第一权重数据集中的数据进行交织重排，得到所述第二权重数据集，其中，所述第二权重数据集中的权重数据按照H ₄×W ₄的数据格式进行排列，H4表示第二权重数据集中的权重数据的数据高度，W4表示第二权重数据集中的权重数据的数据宽度。
根据权利要求6所述的方法，其中，所述将所述第一权重数据集中的数据进行交织重排，得到所述第二权重数据集，包括：

将所述第一权重数据集中每M ₂个权重数据子集的权重数据分成一组，得到S ₂组权重数据，其中，M ₂≤N ₂；

将所述S ₂组权重数据中的每组权重数据中的M ₂个权重数据进行交织重排，得到所述第二权重数据集。
根据权利要求7所述的方法，其中，所述将所述第一权重数据集中每M ₂个权重数据子集的权重数据分成一组，得到S ₂组权重数据，包括：

在N ₂为M ₂的整数倍的情况下，将所述第一权重数据集中每M ₂个权重数据子集的权重数据分成一组，得到所述S ₂组权重数据，其中，

在N ₂不为M ₂的整数倍的情况下，将所述第一权重数据集中的权重数据子集的数量的从N ₂增加到N ₃，得到第三权重数据集，其中，N ₃为M ₂的整数倍，所述第三权重数据集中增加的权重数据子集中的权重数据为0；将所述第三权重数据集中每M ₂个权重数据子集的权重数据分成一组，得到所述S ₂组权重数据，其中，
根据权利要求8所述的方法，其中，所述将所述S ₂组权重数据中的每组权重数据中的M ₂个权重数据进行交织重排，得到所述第二权重数据集，包括：

在N ₂为M ₂的整数倍的情况下，将所述S ₂组权重数据中的每组权重数据中的M ₂个权重数据进行交织重排，得到所述第二权重数据集，其中，

在N ₂不为M ₂的整数倍的情况下，将所述S ₂组权重数据中的每组权重数据中的M ₂个权重数据进行交织重排，得到所述第二权重数据集，其中，
根据权利要求6所述的方法，其中，所述N ₂的取值为卷积核的输出通道的数量，所述C ₂的取值为所述卷积核的输入通道的数量，所述卷积操作为使用所述卷积核执行的卷积操作，每个所述权重数据子集包括C ₂个所述输入通道上的权重数据。
根据权利要求1至10中任一项所述的方法，其中，所述对所述第二图像数据集和预先获取的第二权重数据集执行所述卷积操作，得到目标输出结果，包括：

对所述第二图像数据集和所述第二权重数据集执行所述卷积操作，得到第四图像数据集，其中，所述目标输出结果包括所述第四图像数据集，所述第二图像数据集是将S ₁组图像数据中的每组图像数据中的M ₁个通道的图像数据进行交织重排，得到图像数据集，所述S ₁组图像数据是将所述第一图像数据集中每M ₁个通道的图像数据分成一组，得到图像数据，M ₁≤C ₁。
根据权利要求11所述的方法，其中，所述对所述第二图像数据集和所述第二权重数据集执行卷积操作，得到第四图像数据集，包括：

在所述第二图像数据集中获取C ₂组图像数据，其中，每组图像数据包括所述第一图像数据集中位于同一个通道的多个图像数据，所述每组图像数据是从所述C ₂组图像数据中的上一组图像数据的存储地址偏移1个地址得到的图像数据；

对所述C ₂组图像数据和所述第二权重数据集中的N ₂×C ₂组权重数据执行卷积操作，得到所述第四图像数据集中的N ₂组图像数据，其中，每组权重数据与所述每组图像数据具有相同的数据结构；

其中，所述第二权重数据集是将第一权重数据集中的数据进行交织重排，得到第二权重数据集，所述第一权重数据集中的权重数据按照N ₂×C ₂×H ₃×W ₃的数据格式进行排列，N ₂表示所述第一权重数据集包括的权重数据子集的数量，C ₂表示每个所述权重数据子集中的通道数量，H ₃表示每个所述权重数据子集中的数据高度，W ₃表示每个所述权重数据子集中的数据宽度。
根据权利要求1至10中任一项所述的方法，其中，所述方法还包括：

在第一内存空间中存储所述第一图像数据集和所述第二图像数据集；

在第二内存空间中存储所述第二权重数据集，其中，所述第一内存空间与所述第二内存空间为相互独立的内存空间。
一种计算机可读的存储介质，所述计算机可读的存储介质包括存储的程序，其中，所述程序运行时执行所述权利要求1至13任一项中所述的方法。
一种电子设备，包括存储器和处理器，其中，所述存储器中存储有计算机程序，所述处理器被设置为通过所述计算机程序执行所述权利要求1至13任一项中所述的方法。
一种计算机程序产品，包括计算机指令，当所述计算机指令由计算机设备的处理器读取并执行时，使得所述计算机设备执行权利要求1至13任一项中所述的方法。