WO2022183346A1

WO2022183346A1 - 特征数据的编码方法、解码方法、设备及存储介质

Info

Publication number: WO2022183346A1
Application number: PCT/CN2021/078550
Authority: WO
Inventors: 虞露; 邵宇超; 潘雅庆; 于化龙; 戴震宇
Original assignee: 浙江大学; Oppo广东移动通信有限公司
Priority date: 2021-03-01
Filing date: 2021-03-01
Publication date: 2022-09-09
Also published as: US20230412820A1; CN116868570A; EP4304176A1

Abstract

本公开实施例提供了一种特征数据的编码方法、解码方法、编码器、解码器及存储介质，其中，编码方法包括：获取待处理图像对应的多个通道的特征数据；确定所述多个通道的特征数据中的参考通道的特征数据；以所述参考通道的特征数据为排序起始对象，按照所述多个通道的特征数据之间相似度递减的顺序，对所述多个通道的特征数据进行排序，得到排序后的多个通道的特征数据；将所述排序后的多个通道的特征数据进行拼接，得到目标特征帧序列；对所述目标特征帧序列进行编码，生成码流。

Description

特征数据的编码方法、解码方法、设备及存储介质

技术领域

本公开实施例涉及通信领域中的编解码技术，尤其涉及一种特征数据的编码方法、解码方法、编码器、解码器及存储介质。

背景技术

目前，在传统视频编解码的过程中，特征图编解码流程包含三个主要模块：预量化/反预量化、重打包/反重打包、传统视频编码/解码。经过预量化、重打包后的特征图数组数据以亮度色度(YUV)视频数据形式送入传统视频编码器进行压缩编码，传统视频编码器产生的码流包含在特征图数据码流中。其中，重打包/反重打包有多个模式可选，分别为特征图指定顺序叠加、特征图默认顺序或指定顺序平铺。

然而，在叠加模式中，仅适用单一的列表描述特征通道的顺序，没有对特征通道之间在视频编解码器中的参考关系进行指导和设计，这使得叠加之后的特征通道之间的编码效率并不高。在平铺模式中，特征的多通道数据被按照单一的列表顺序平铺在一幅图像中，多通道数据紧密相邻，这就导致在使用现有特征数据的处理方法对平铺图像进行编码时，块划分操作会将多个通道的数据划分到同一个编码单元中。由于不同通道数据之间存在非连续性，这就使得同一个编码单元中的不同通道数据的相关性较差，从而不能有效发挥现有特征数据的处理方法的效率。

由此可知，相关技术中基于特征数据进行编码时至少存在编码效率低的问题。

发明内容

本公开实施例提供了一种特征数据的编码方法、解码方法、编码器、解码器及存储介质，通过对所有通道特征数据进行排序，排序后时空域上相邻通道之间的相关性较大，使得后续编码时可以参考相邻区域相似度较高的特征数据通道，从而提高了特征数据的编码效率。

本公开实施例的技术方案可以如下实现：

第一方面，本公开实施例提供了一种特征数据的编码方法，包括：

获取待处理图像对应的多个通道的特征数据；

确定所述多个通道的特征数据中的参考通道的特征数据；

以所述参考通道的特征数据为排序起始对象，按照多个通道的特征数据之间相似度递减的顺序，对所述多个通道的特征数据进行排序，得到排序后的多个通道的特征数据；

将所述排序后的多个通道的特征数据进行拼接，得到目标特征帧序列；

对所述目标特征帧序列进行编码，生成码流。

第二方面，本公开实施例还提供了一种特征数据的解码方法，包括：

解析码流，获得重建的特征帧序列；

对所述重建的特征帧序列进行逆排序，得到重建的多个通道的特征数据。

第三方面，本公开实施例提供了一种编码器，所述编码器包括第一获得单元、第一处理单元和编码单元；其中，

所述第一获得单元，配置为获取待处理图像对应的多个通道的特征数据；

所述第一处理单元，配置为确定所述多个通道的特征数据中的参考通道的特征数据；

所述第一处理单元，配置为以所述参考通道的特征数据为排序起始对象，按照多个通道的特征数据之间相似度递减的顺序，对所述多个通道的特征数据进行排序，得到排序后的多个通道的特征数据；

所述第一处理单元，配置为将所述排序后的多个通道的特征数据进行拼接，得到目标特征帧序列；

所述编码单元，配置为对所述目标特征帧序列进行编码，生成码流。

第四方面，本公开实施例提供了一种解码器，所述解码器包括解码单元和第二处理单元；其中，

所述解码单元，配置为解析码流，获得重建的特征帧序列；

所述第二处理单元，配置为对所述重建的特征帧序列进行逆排序，得到重建的多个通道的特征数据。

第五方面，本公开实施例提供了一种编码器，包括：

所述第一存储器，用于存储能够在所述第一处理器上运行的计算机程序；

所述第一处理器，用于在运行所述计算机程序时，执行如第一方面所述的编码方法。

第六方面，本公开实施例还提供了一种解码器，包括：

所述第二存储器，用于存储能够在所述第二处理器上运行的计算机程序；

所述第二处理器，用于在运行所述计算机程序时，执行如实现第二方面所述的解码方法。

第七方面，本公开实施例提供了一种计算机可读存储介质，存储有可执行编码指令，用于引起第一处理器执行时，实现第一方面所述的编码方法。

第八方面，本公开实施例提供了一种计算机可读存储介质，存储有可执行解码指令，用于引起第二处理器执行时，实现第二方面所述的解码方法。

本公开实施例提供了一种特征数据的编码方法、解码方法、编码器、解码器及存储介质，其中，特征数据的编码方法通过获取待处理图像对应的多个通道的特征数据；确定多个通道的特征数据中的参考通道的特征数据；以参考通道的特征数据为排序起始对象，按照多个通道的特征数据之间相似度递减的顺序，对多个通道的特征数据进行排序，得到排序后的多个通道的特征数据；将排序后的多个通道的特征数据进行拼接，得到目标特征帧序列；对目标特征帧序列进行编码，生成码流；也就是说，本公开在获得多个通道的特征数据的情况下，以一个通道的特征数据作为基准，即确定参考通道的特征数据；按照与参考通道的特征数据相比，相似度由大到小的顺序，对所有通道的特征数据进行排序；如此，在排序后时空域上相邻通道的特征数据之间的相关性较大，使得后续编码时可以参考相邻区域相似度较高的特征数据通道，从而提高了特征数据的编码效率。

附图说明

图1为本公开实施例提供的“预分析再压缩”框架示意图；

图2为本公开实施例提供的相关技术中的编码流程示意图；

图3为本公开实施例提供的相关技术中的编码流程示意图；

图4为本公开实施例提供的相关技术中的时空拼接示意图；

图5为本公开实施例提供的示例性的特征数据的编码方法的流程示意图一；

图6为本公开实施例提供的示例性的特征数据的编码方法的流程示意图二；

图7为本公开实施例提供的示例性的特征数据的编码方法的流程示意图三；

图8为本公开实施例提供的示例性的特征数据的编码方法的流程示意图四；

图9为本公开实施例提供的示例性的特征数据的编码方法的流程示意图五；

图10为本公开实施例提供的示例性的特征数据的编码方法的流程示意图六；

图11为本公开实施例提供的光栅扫描拼接示意图；

图12为本公开实施例提供的Z字形扫描拼接示意图；

图13为本公开实施例提供的示例性的特征数据的编码方法的流程示意图七；

图14为本公开实施例提供的空域相邻通道的特征数据之间的填充示意图；

图15为本公开实施例提供的示例性的特征数据的解码方法的流程示意图一；

图16为本公开实施例提供的示例性的特征数据的解码方法的流程示意图二；

图17为本公开实施例提供的示例性的特征数据的解码方法的流程示意图三；

图18为本公开实施例提供的一种编码器的结构示意图；

图19为本公开实施例提供的一种解码器的结构示意图；

图20为本公开实施例提供的一种编码器的结构示意图；

图21为本公开实施例提供的一种解码器的结构示意图。

具体实施方式

为使本公开实施例的目的、技术方案和优点更加清楚，下面将结合本公开实施例中的附图，对本公开的具体技术方案做进一步详细描述。以下实施例用于说明本公开，但不用来限制本公开的范围。

除非另有定义，本文所使用的所有的技术和科学术语与属于本公开的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本公开实施例的目的，不是旨在限制本公开。

在以下的描述中，涉及到“一些实施例”，其描述了所有可能实施例的子集，但是可以理解，“一些实施例”可以是所有可能实施例的相同子集或不同子集，并且可以在不冲突的情况下相互结合。

需要指出，本公开实施例所涉及的术语“第一\第二\第三”仅仅是是区别类似的对象，不代表针对对象的特定排序，可以理解地，“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序，以使这里描述的本公开实施例能够以除了在这里图示或描述的以外的顺序实施。

对本公开实施例进行进一步详细说明之前，对本公开实施例中涉及的名词和术语进行说明，本公开实施例中涉及的名词和术语适用于如下的解释。

1)三维特征数据张量(3D Feature Data Tensor)包括通道数(Channel，C)，高度(Height，H)，宽度(Width，W)。

2)特征数据，指的是神经网络中间层输出的数据(the output data at the intermediate layer of neural networks)。

面向智能分析的应用场景下，视频及图像除了需要呈现给用户高质量地观看以外，还更多地被用于分析理解其中的语义信息。针对智能分析任务对视频及图像编码更为独特的分析需求，目前由传统的直接对图像进行压缩编码，转为对智能分析任务网络中间层输出的特征数据进行压缩编码。

摄像头等端侧设备首先对采集或输入得到的原始视频及图像数据利用任务网络进行预分析，提取得到云端分析足够多的特征数据，并对这些特征数据进行压缩编码和传输。云端设备接收到相应的码流后，根据码流的语法信息重建相应的特征数据，并输入到特定任务网络中继续进行分析，这种“预分析再压缩”框架如图1所示。在这种框架下，端侧设备和云端设备之间存在大量特征数据的传输，特征数据压缩的目的即对于现有任务网络中提取的特征数据以可恢复的方式进行压缩编码，以供云端进一步的智能分析处理。

参见图1所示，在一个应用场景中，例如人脸识别场景，端侧设备如图像采集设备采集到人像后，输入到人脸识别的神经网络中。这里，神经网络包括至少一个神经网络，例如，神经网络包括任务网络A、任务网络B以及任务网络C，这些神经网络可以相同，也可以不同。以神经网络有10层为例，由于图像采集设备本地的算力不够，只能执行5层，在神经网络的中间层输出原始特征数据后，图像采集设备对原始特征数据进处理，得到符合特征编码装置的数据输入条件的特征数据；进一步的，图像采集设备将符合输入条件的特征数据发送至编码装置，编码装置对符合输入条件的特征数据进行编码并写入码流。之后，编码装置将码流发送至特征解码装置，这里，特征解码装置可以设置在云端设备中如云服务器内。也就是说，端侧设备在得到码流之后，将其交由云服务器进行处理。云服务器通过特征解码装置对码流进行解码并进行重建，得到重建的特征数据；最后，云服务器将重建的各通道对应的特征数据输入至神经网络的第6层，不断执行到第10层，得到识别结果。

针对此类面向智能分析任务场景的视频及图像高效编码问题，运动图像专家组(Moving Picture Experts Group，MPEG)已于2019年7月在第127次会议上成立了机器视频编码(Video Coding for Machines，VCM)标准工作组来研究该方面的技术，旨在针对压缩视频或者从视频中提取的特征信息定义一个码流，使其可以在不显著降低智能任务分析性能的情况下利用同一码流来执行多个智能分析任务，同时解压后的信息对智能分析任务更加友好，在相同码率下智能分析任务性能的损失更小。与此同时，全国信息技术标准化技术委员会下设的多媒体分委会标准工作会议于2020年1月在浙江省杭州市召开了第一次工作组会议，相应成立面向机器智能的数据编码(Data Compression for Machines，DCM)标准工作组来研究该方面的技术应用，旨在通过高效的数据表征与压缩，支撑所涉及到的机器智能应用或人机混合的智能应用。

目前VCM标准工作组设计了相应的潜在编码流程图，如图2所示，以此来提高智能分析任务下视频及图像的编码效率。视频及图像可以直接通过针对任务优化后的视频及图像编码器，也可以利用网络预分析提取特征数据并对其编码，再将解码后的特征数据输入到后续网络中继续分析。若需要复用现有的视频及图像编码标准对提取的特征数据进行压缩，则需要将浮点型表示的特征数据进行定点化的处理，同时将其转换为适合现有编解码标准的输入，例如将多通道的特征数据拼接为单帧或多帧YUV格式的特征帧序列并输入到视频编码器中进行压缩编码。

任务网络中间层输出的特征数据压缩技术在编解码过程中值得深入研究。例如研究一些常用的任务网络不同层级输出的特征数据在无损压缩和有损压缩时的编码效率。通过利用视频编码标准H.265/HEVC的参考软件对特征数据进行压缩编码，本申请人认为在较大的码率区间内，特征数据的信号保真度差异不大，而当码率低于某一阈值时，特征数据的信号保真度急剧减小。再例如，研究利用现有的视频编码标准对特征数据进行有损压缩，并通过将有损压缩引入到网络训练中，提出有损压缩时提高任务精度的策略。

由于复用传统的视频编码标准需要将特征数据转换为YUV格式的特征帧序列。对特征数据的转换方式进行研究发现，将任务网络输出的多通道特征数据按通道顺序在空域上拼接为单帧和多帧的特征帧序列并进行压缩编码。其实验结果表明，对网络浅层输出的特征数据两种方式编码效率较为接近，对于网络深层输出的特征数据，拼接为单帧的编码效率要明显高于多帧特征帧序列。针对特征数据编码效率评价指标的研究，以任务精度作为评价指标在部分情况下压缩后的特征数据可以获得比目标数据更高的性能，因此分别对于图像分类、图像检索及图像识别三种任务建立相应的评价指标。由于任务网络在训练后可能存在过拟合或欠拟合的情况，导致特征数据在码率较高时任务性能可能高于目标性能，而对各个任务分别建立一套评价指标的方法，其普适性较差，因此可以选择合适的码率区间，即不考虑码率过高及任务性能过低的情况衡量特征数据的编码效率。

除此之外，还可以利用神经网络对特征数据降维以达到压缩数据量的目标。

综上，目前对特征数据压缩技术的研究主要存在三大问题：其一是研究的特征数据压缩技术仅面向特殊的应用场景，仅针对少数中间层数据量小于目标输入的任务网络，对于其他大多数任务网络输出的特征数据则表现较差；其二是研究的方法仅考虑了特征数据压缩后的数据量而未考虑任务质量，例如利用神经网络对特征数据降维，其较难实现高精度任务需求，同时由于未考虑压缩后的任务质量，因而未能对特征数据的压缩进行合适的引导和评价；其三是结合传统视频及图像编码技术对特征数据进行压缩，但并未考虑特征数据与传统视频及图像间的差异，未能高效利用现有视频及图像编码技术以达到较高的编码效率。

进一步地，对相关技术中编解码流程进行说明：

相关技术一、特征数据编解码流程如图3所示，包含三个主要模块：预量化/反预量化；重打包/反重打包；传统视频编码/解码。具体模块内容如下。

预量化/反预量化：当目标输入特征图为浮点型时，需要对特征图进行预量化，使其转化为符合传统视频编码器输入要求的整型数据。

重打包/反重打包：重打包模块将目标特征图三维数组变换为符合传统视频编码器输入要求的YUV格式信息。同时通过改变特征图的组合方式，提高传统视频编码器对特征图数据的编码效率。重打包/反重打包有多个模式可选，分别为特征图指定顺序叠加、特征图默认顺序或指定顺序平铺。

特征图指定顺序叠加：在该模式下，特征图的每个通道对应传统视频编码器输入数据中的一帧。特征图的高、宽被填充至符合统视频编码器输入要求的高度与宽度。特征图通道顺序存进关于特征图的重打包排序列表(repack_order_list)中，其中repack_order_list中的内容可以缺省为默认的顺序数组(例如，[0,1,2,3…])。

在叠加模式中，仅适用单一的列表描述特征通道的顺序，并没有根据特征通道之间的相关性进行特征通道的顺序的最优化排列，且没有对特征通道之间在视频编解码器中的参考关系进行指导和设计，这使得叠加之后的特征通道之间的编码效率并不高。

特征图默认顺序或指定顺序平铺：在该模式下，特征图多个通道平铺拼接成一个二维数组作为传统视频编码器输入数据中的一帧。拼接后的数组的高、宽被填充至符合传统视频编码器输入要求的高度与宽度。拼接顺序为目标特征图通道顺序，由数组宽方向优先，高方向其次依次排列，当前帧铺满后再创造下一帧继续平铺，直到特征图所有通道均平铺完毕。其中通道顺序由repack_order_list记录，内容可以缺省为默认的顺序数组(例如，[0,1,2,3…])。

在平铺模式中，特征的多通道数据被按照单一的列表顺序平铺在一幅图像中，多通道数据紧密相邻，这就导致在使用现有编解码方法对平铺图像进行编码时，块划分操作会将多个通道的数据划分到同一个编码单元中。由于不同通道数据之间存在非连续性，这就使得同一个编码单元中的不同通道数据的相关性较差，从而不能有效发挥现有编解码方法的效率，使得特征数据的压缩效果不够好。

传统视频编码/解码：经过预量化、重打包后的特征图数组数据以YUV视频数据形式送入传统视频编码器进行压缩编码，传统视频编码器产生的码流包含在特征图数据码流中。其中，对于HEVC视频编码器，特征图数组以YUV4:0:0格式输入；对AVS3视频编码器，特征图数组以YUV4:2:0格式输入。

相关技术二、在运动图像专家组沉浸式视频(MPEG Immersive Video)中，存在一种对同一时刻各个相机所拍摄到的图像内容进行重表达和重排列的技术，以便视觉信息的高效表达与高效编码。具体而言，在运动图像专家组沉浸式视频中，多台相机会在所需拍摄的场景中按一定位置关系摆放，这些相机也被称为参考视点。各个参考视点拍摄的内容之间存在一定的视觉冗余，因此在编码端需要对所有参考视点的图像进行重表达和重组织，来去除视点间的视觉冗余；在解码端需要对重表达和重组织后的信息进行解析与还原。

在编码端，对参考视点的图像进行重表达的方式是，在参考视点图像上截取呈矩形形状的大小各异的子块图像(Patch)。截取出所有必要的子块图像后，将这些子块图像由大至小排序。依照上述的顺序，将子块图像逐个摆放在一张待填充的有着较大分辨率的图像上，这张待填充的图像被称为地图集(Atlas)。在摆放子块图像时，每个子块图像的左上角的像素一定会落在待填充图像中划分好的8*8图像块的左上角像素上。每执行一次子块图像的摆放，就会记下当前摆放的子块图像的摆放序号、左上角像素的坐标、子块图像的分辨率大小，按顺序存进关于子块图像的重打包排序列表中。当所有子块图像摆放完毕之后，我们将会对地图集和子块图像信息列表送进传统视频编解码器进行编码。

在解码端，得到重建后的地图集以及子块图像信息列表后，将按照子块图像信息列表中所记载的摆放子块图像的顺序，对摆放在地图集中的子块图像内部的像素逐一地进行渲染，从而合成得到一张观众所在视点处的图像。

运动图像专家组沉浸式视频中的对视觉信息进行重表达、重排列的方案，仅按照子块图像面积由大至小排序的策略进行顺序摆放。在摆放时，未考虑各子块间的纹理相似度以及空间位置相似度，这会导致重组织后的地图集图像在送进传统视频编解码器时，不能充分发挥现有编解码方法的效率。

相关技术三、相似度度量的特征数据时空域拼接方法，如图4所示，并基于图像识别任务下的视觉几何组(Visual Geometry Group，VGG)和残差ResNet网络中间层输出的多通道的特征数据建立实验，通过复用现有的视频编码标准H.265/HEVC对特征数据进行压缩编码，编码效率可以比仅空域排列方法平均提升2.27％。

在编码端，目前是将特定层级输出的特征数据按通道顺序拼接为两帧，以均方误差(Mean Square Error，MSE)度量两帧之间的相似度，通过迭代交换两帧的特征数据通道并计算两帧之间的相似度，最终得到两帧相似度最大的一种排列方式，将目标通道序和新的通道排列顺序对应的列表传输至解码端。

在解码端重建得到相应的特征数据之后，利用目标通道和新的通道排列顺序对应的列表恢复得到目标的特征数据排列，并输入到后续任务网络中继续进行推理分析。

在将特征数据按通道顺序分成两帧的前提下，通过交换两帧之间特征数据通道最大化相似度，此时未考虑同一帧中特征数据通道之间的相关性，同时也未能考虑多帧时的排列方法，使得特征数据在编码时并未充分利用不同通道之间的相关性以达到最佳的编码效率。

为了解决相关技术中存在的问题，并充分挖掘和利用特征数据各个通道之间的相似性，本公开提供了一种时空域排序、拼接、编码及解码的技术。该技术的基本思想是：预处理阶段，将神经网络中间层输出的多通道的特征数据进行排序，并按照排序后顺序将各个通道的特征数据按照特定的方式在时空域拼接成多帧的特征帧序列。编码阶段，将特征帧序列以优化后的帧间参考结构进行编码，并将预处理的关键信息进行编码，一并得到最终的码流。解码阶段，从接收到的码流中，解析得到重建的特征帧序列以及重建的预处理关键信息。后处理阶段，根据重建的预处理关键信息，对重建的特征帧序列进行后处理得到重建特征数据，重建特征数据用于后续网络以进一步进行任务推理分析。

本公开的实施例提供一种特征数据的编码方法，应用于编码器；参照图5所示，该方法包括以下步骤：

步骤501、获取待处理图像对应的多个通道的特征数据。

本公开实施例中，步骤501获取待处理图像对应的多个通道的特征数据可以通过如下步骤实现：获取待处理图像；通过神经网络模型对待处理图像进行特征提取，得到多个通道的特征数据。

一些实施例中，编码器获取到待处理图像后，将待处理图像输入神经网络模型中，进而获取到神经网络模型的中间层输出的各通道的特征数据。这里，图像的各通道即图像的各特征图，一个通道是对某个特征的检测，通道中某一处数值的强弱就是对当前特征强弱的反应。

步骤502、确定多个通道的特征数据中的参考通道的特征数据。

本公开实施例中，参考通道的特征数据可以是多个通道的特征数据中任一通道的特征数据。

确定参考通道的特征数据是为了确定后续对多个通道的特征数据进行排序时的排序起始对象。

步骤503、以参考通道的特征数据为排序起始对象，按照多个通道的特征数据之间相似度递减的顺序，对多个通道的特征数据进行排序，得到排序后的多个通道的特征数据。

本公开实施例中，在确定参考通道的特征数据的情况下，以参考通道的特征数据为排序起始对象，按照多个通道的特征数据之间相似度递减的顺序，对多个通道的特征数据进行排序，即按照与参考通道的特征数据相比，相似度由大到小的顺序，对所有通道的特征数据进行排序，得到排序后的多个通道的特征数据。需要说明的是，排序后时空域上相邻通道之间特征数据的相关性较大。

步骤504、将排序后的多个通道的特征数据进行拼接，得到目标特征帧序列。

本公开实施例中，基于神经网络中间层输出的多个通道的特征数据之间的信息冗余，对多个通道的特征数据按照相似度进行排序，之后按照排序顺序在时域和空域上，或者在空域上排列成目标特征帧序列，使得后续编码时可以参考相邻区域相似度较高的特征数据，提高特征数据的编码效率。

步骤505、对目标特征帧序列进行编码，生成码流。

本公开实施例中，将排序后的多个通道的特征数据进行拼接，得到目标特征帧序列的过程中，若先在时域再在空域进行拼接，则可以更好地利用帧间编码技术对特征数据进行编码，而若先在空域再在时域进行拼接，则可以更好地利用帧内编码技术对特征数据进行编码，从而使得可以复用现有的视频编码标准中的技术对特征数据进行高效编码。

本公开实施例所提供的特征数据的编码方法，通过获取待处理图像对应的多个通道的特征数据；确定多个通道的特征数据中的参考通道的特征数据；以参考通道的特征数据为排序起始对象，按照多个通道的特征数据之间相似度递减的顺序，对多个通道的特征数据进行排序，得到排序后的多个通道的特征数据；将排序后的多个通道的特征数据进行拼接，得到目标特征帧序列；对目标特征帧序列进行编码，生成码流；也就是说，本公开在获得多个通道的特征数据的情况下，以一个通道的特征数据作为基准，即确定参考通道的特征数据；按照与参考通道的特征数据相比，相似度由大到小的顺序，对所有通道的特征数据进行排序；如此，在排序后时空域上相邻通道的特征数据之间的相关性较大，使得后续编码时可以参考相邻区域相似度较高的特征数据通道，从而提高了特征数据的编码效率。

本公开的实施例提供一种特征数据的编码方法，应用于编码器；参照图6所示，该方法包括以下步骤：

步骤601、获取待处理图像对应的多个通道的特征数据。

步骤602、当多个通道的特征数据中特征数据值的累加和满足目标阈值时，确定累加和对应的通道的特征数据为参考通道的特征数据。

其中，特征数据值的累加和满足目标阈值包括：特征数据值的累加和最大，或者，特征数据值的累加和最小。这里，选择累加和最大或最小的特征数据值对应的通道的特征数据作为参考通道的特征数据时，可以提升编码效率。

步骤603、以参考通道的特征数据为排序起始对象，按照多个通道的特征数据之间相似度递减的顺序，对多个通道的特征数据进行排序，得到排序后的多个通道的特征数据。

本公开实施例中，确定了排序起始对象后，可以基于迭代算法确定后续剩余各个通道的特征数据与当前通道的特征数据的相似度，这里，相似度度量可借助于绝对误差(Sum of Absolute Difference，SAD)和/或均方误差(Mean Squared Error，MSE)；从而依次选择相似度最大的一个通道的特征数据作为排序后下一个通道的特征数据。

示例性的，SAD的计算公式如下：

示例性的，MSE的计算公式如下：

步骤604、获得多个通道的特征数据在待处理图像中的原始通道顺序，与在排序后的多个通道的特征数据中的编码通道顺序之间的通道顺序对应关系。

这里，编码通道顺序指的是排序后的每一通道的特征数据所具有的通道顺序。在后续编码的过程中，是参考上述排序后的通道顺序执行编码的，因此，排序后的通道顺序称为编码通道顺序。

本公开实施例中，待所有通道的特征数据按相似度排序完成后，存储排序前后的通道顺序对应关系。在一种可实现的场景中，可以将排序前后的通道顺序对应关系以排序列表channel_idx的方式存储。

排序列表可以存在多种形式，包含但不限于：一维列表、二维列表以及三维列表。

本公开一些实施例中，当时域拼接帧数为一帧时，原始通道顺序为第X个通道，对应的编码通道顺序为第I个通道。

此时，排序列表为一维列表channel_idx[I]＝X。其中，对于一维列表channel_idx[I]＝X，X可以为排序后排在第I个通道的特征数据排序前对应的通道顺序。

本公开另一些实施例中，原始通道顺序与编码通道顺序之间的对应关系，包括：当时域拼接帧数为至少两帧时，原始通道顺序为第X个通道，对应的编码通道顺序为第N第I个通道。

此时，排序列表为二维列表channel_idx[n][I]＝X。其中，对于二维列表channel_idx[N][I]＝X，X可以为排序后排在第N帧第I个通道的特征数据排序前对应的通道顺序。

本公开另一些实施例中，原始通道顺序与编码通道顺序之间的对应关系，包括：当时域拼接帧数为至少两帧时，原始通道顺序为第X个通道，对应的编码通道顺序为第N帧第M区域第I个通道。

此时，排序列表为三维列表channel_idx[N][M][I]＝X。其中，对于三维列表channel_idx[N][M][I]＝X，X可以为排序后排在第N帧第M区域第I个通道的特征数据排序前对应的通道顺序。

步骤605、将排序后的多个通道的特征数据进行拼接，得到目标特征帧序列。

本公开实施例中，将排序后的特征数据在时空域上按照特定的拼接方式进行拼接，在时域上拼接为时域拼接帧数为frame_count的目标特征帧序列。时域拼接帧数为编码端设置的在时间域上对排序后的多个通道的特征数据进行拼接，拼接后得到的帧数。

本公开一些实施例中，若时域拼接帧数frame_count为1时，则在排序后，特征数据只在空域上进行拼接。编码端可以根据实际需求，灵活设置时域拼接帧数。

本公开一些实施例中假设拼接后特征数据为row行col列个通道的特征数据，特征数据的通道数为C，若：

C＜row*col*frame_count

则此时可以在最后一帧中对空余的特征数据通道进行填充使其充满一帧进行编码。

步骤606、对目标特征帧序列进行编码，生成码流，并将通道顺序对应关系写入码流中。

需要说明的是，本公开实施例中与其它实施例中相同步骤和相同内容的说明，可以参照其它实施例中的描述，此处不再赘述。

本公开的实施例提供一种特征数据的编码方法，应用于编码器；参照图7所示，该方法包括以下步骤：

步骤701、获取待处理图像对应的多个通道的特征数据。

步骤702、确定多个通道的特征数据中的参考通道的特征数据。

步骤703、以参考通道的特征数据为排序起始对象，按照多个通道的特征数据之间相似度递减的顺序，对多个通道的特征数据进行排序，得到排序后的多个通道的特征数据。

步骤704、确定时域拼接帧数大于一帧，在时空域上按照拼接策略，将排序后的特征数据进行拼接，得到目标特征帧序列。

本公开实施例中，参见图8所示，步骤704确定时域拼接帧数大于一帧，在时空域上按照拼接策略，将排序后的特征数据进行拼接，得到目标特征帧序列，可以通过如下步骤实现：

步骤801、确定时域拼接帧数大于一帧，在时空域上按照拼接策略，将排序后的特征数据进行拼接，得到拼接后的特征数据。

步骤802、确定拼接后的特征数据的行数、拼接后的特征数据的列数以及时域拼接帧数的乘积。

步骤803、确定多个通道的特征数据的通道数小于乘积，对拼接后的帧中缺少特征数据通道的区域进行填充，得到目标特征帧序列。

这里，对拼接后的帧中缺少特征数据通道的区域进行填充，即对拼接后的特征帧序列中缺少特征数据通道的区域进行填充，以提高编码效率。其中，缺少特征数据通道的区域可以是拼接后的特征帧序列中最后一帧中的区域。缺少特征数据通道的区域也可以是拼接后的特征帧序列中与最后一帧不同的至少一帧中的区域。

本公开实施例中，参见图9所示，步骤704确定时域拼接帧数大于一帧，在时空域上按照拼接策略，将排序后的特征数据进行拼接，得到目标特征帧序列，可以通过如下步骤实现：

步骤901、确定时域拼接帧数大于一帧，在时空域上按照先时域后空域的拼接策略，在时域上按照光栅扫描顺序在不同帧的相同位置进行拼接。

步骤902、在空域上按照光栅扫描顺序在相邻位置进行拼接，或者在空域上按照Z字形扫描顺序在相邻位置进行拼接。

这里，先在时域再在空域进行拼接，则可以更好地利用帧间编码技术对特征数据进行编码，从而使得可以复用现有的视频编码标准中的技术对特征数据进行高效编码。

本公开实施例中，参见图10所示，步骤704确定时域拼接帧数大于一帧，在时空域上按照拼接策略，将排序后的特征数据进行拼接，得到目标特征帧序列，可以通过如下步骤实现：

步骤1001、确定时域拼接帧数大于一帧，在时空域上按照先空域后时域的拼接策略，在空域上按照光栅扫描顺序在相邻位置进行拼接，或者在空域上按照Z字形扫描顺序在相邻位置进行拼接。

步骤1002、在时域上按照光栅扫描顺序在不同帧的相同位置进行拼接。

这里，先在空域再在时域进行拼接，则可以更好地利用帧内编码技术对特征数据进行编码，从而使得可以复用现有的视频编码标准中的技术对特征数据进行高效编码。

步骤705、确定时域拼接帧数为一帧，在空域上按照拼接策略，将排序后的特征数据进行拼接，得到目标特征帧序列。

步骤706、对目标特征帧序列进行编码，生成码流。

步骤707、将时域拼接帧数、多个通道的特征数据对应的通道数量、单个通道的特征数据的高度和单个通道的特征数据的宽度写入码流中。

在一个可实现的场景中，对光栅扫描拼接进行进一步的说明，以拼接为总帧数为4帧的视频序列为例，光栅扫描拼接示意图如图11所示，排序后特征数据的排序顺序包含但不限于：

首先在时域上按照光栅扫描顺序在不同帧的相同位置进行拼接，其次在空域上按照光栅扫描顺序在相邻位置进行拼接；

首先在空域上按照光栅扫描顺序在相邻位置进行拼接，其次在时域上按照光栅扫描顺序在不同帧的相同位置进行拼接。

在一个可实现的场景中，对Z字形扫描拼接进行进一步的说明，以拼接为总帧数为4帧的视频序列为例，Z字形拼接示意图如图12所示，排序后特征数据的排序顺序包含但不限于：

首先在时域上按照光栅扫描顺序在不同帧的相同位置进行拼接，其次在空域上按照Z字形扫描顺序在相邻位置进行拼接；

首先空域上按照Z字形扫描顺序在相邻位置进行拼接，在时域上按照光栅扫描顺序在不同帧的相同位置进行拼接。

本公开实施例中除了需要传统视频编码后生成的码流信息之外，还传输以下额外信息，额外信息又称为特征数据时空排列信息：特征数据的通道数C、单个通道的特征数据的高h、单个通道的特征数据的宽w、排序列表channel_idx、时域拼接帧数frame_count。

本公开的实施例提供一种特征数据的编码方法，应用于编码器；参照图13所示，该方法包括以下步骤：

步骤1101、获取待处理图像对应的多个通道的特征数据。

步骤1102、确定多个通道的特征数据中的参考通道的特征数据。

步骤1103、以参考通道的特征数据为排序起始对象，按照多个通道的特征数据之间相似度递减的顺序，对多个通道的特征数据进行排序，得到排序后的多个通道的特征数据。

步骤1104、在空域上按照先填充后拼接的策略，将排序后的特征数据进行拼接。

本公开实施例中，步骤1104在空域上按照先填充后拼接的策略，将排序后的特征数据进行拼接，可以通过如下步骤实现：在空域上对每一排序后的特征数据进行填充，在空域上将填充后的特征数据进行拼接；其中，填充后的相邻通道的特征数据之间具有缝隙。

参见图14所示，在空域上对每一排序后的特征数据进行填充，包括：在相邻通道的特征数据之间进行填充，确保填充后的相邻通道的特征数据之间具有缝隙。进一步地，相邻通道的特征数据之间的缝隙大小可以相同。例如，每一个小框与每一个虚线框之间上下左右距离相同。本公开实施例中，对相邻通道的特征数据之间进行填充，减少了不同通道之间值的互相影响，提高了通道边界的信号保真度。

步骤1105、对目标特征帧序列进行编码，生成码流。

步骤1106、将时域拼接帧数、填充后的特征数据的高度和填充后的特征数据的宽度写入码流，并将多个通道的特征数据对应的通道数量、单个通道的特征数据的高度和单个通道的特征数据的宽度写入码流中。

这里，特征数据时空排列信息还包括：填充后的特征数据的高度和填充后的特征数据的宽度。

本公开其他实施例中，步骤1104中在空域上按照先填充后拼接的策略，将排序后的特征数据进行拼接的方案同样适用于步骤901、步骤1001和步骤705；例如，在执行步骤901的过程中，确定时域拼接帧数大于一帧，在时空域上按照先时域后空域的拼接策略，在时域上按照光栅扫描顺序在不同帧的相同位置进行拼接；基于在空域上先填充后拼接的策略，在空域上对每一排序后的特征数据进行填充，在空域上将填充后的特征数据，在空域上按照光栅扫描顺序在相邻位置进行拼接，或者在空域上按照Z字形扫描顺序在相邻位置进行拼接。

例如，在执行步骤1001的过程中，确定时域拼接帧数大于一帧，基于在空域上先填充后拼接的策略，在空域上对每一排序后的特征数据进行填充，在空域上将填充后的特征数据，在空域上按照光栅扫描顺序在相邻位置进行拼接，或者在空域上按照Z字形扫描顺序在相邻位置进行拼接，之后，在时域上按照光栅扫描顺序在不同帧的相同位置进行拼接。

例如，在执行步骤705的过程中，确定时域拼接帧数为一帧，基于在空域上先填充后拼接的策略，在空域上对每一排序后的特征数据进行填充，在空域上将填充后的特征数据，在空域上按照拼接策略，将排序后的特征数据进行拼接，得到目标特征帧序列。

在一种实现方式中，特征数据时空排列信息可以记录在补充增强信息中(例如现有视频编码标准H.265/HEVC、H.266/VVC的Supplemental Enhancement Information(SEI)或AVS标准的扩展数据(Extension Data))。例如，在现有视频编码标准AVC/HEVC/VVC/EVC的sei_rbsp()中sei_message()的sei_paylod()，在其中增加一种新的SEI类别，即Feature data quantization SEI message，payloadType可以定义为任意其他SEI没有使用过的编号，例如183，此时，语法结构如表1所示。

表1 sei_payload()语法结构

若排序列表为一维排序列表，其语法结构为：

语法元素可以用不同的高效熵编码方式进行编码，其中语法元素为：

feature_channel_count：用于描述特征数据的通道数为feature_channel_count；

feature_frame_count：用于描述特征数据拼接后的帧数为feature_frame_count；

feature_single_channel_height：用于描述单个通道的特征数据的高为feature_single_channel_height；

feature_single_channel_width：用于描述单个通道的特征数据的宽为feature_single_channel_width；

channel_idx[I]：用于描述排序后排在第I个通道的特征数据排序前对应的通道顺序channel_idx[I]。

本公开的实施例提供一种特征数据的解码方法，应用于解码器；参照图15所示，该方法包括以下步骤：

步骤1201、解析码流，获得重建的特征帧序列。

步骤1202、对重建的特征帧序列进行逆排序，得到重建的多个通道的特征数据。

本公开实施例所提供的解码方法，通过解析码流，获得重建的特征帧序列；对重建的特征帧序列进行逆排序，得到重建的多个通道的特征数据，从而能够准确恢复出时空域排序前的多个通道的特征数据，用于后续网络以进一步进行任务推理分析。

本公开的实施例提供一种特征数据的解码方法，应用于解码器；参照图16所示，该方法包括以下步骤：

步骤1301、解析码流，获得重建的特征帧序列、通道顺序对应关系、通道数量、时域拼接帧数、单个通道的特征数据的高度和单个通道的特征数据的宽度。

步骤1302、基于通道数量、时域拼接帧数、单个通道的特征数据的高度以及单个通道的特征数据的宽度，确定重建的特征帧序列中每一通道的特征数据在的位置。

步骤1303、基于通道顺序对应关系，确定重建的特征帧序列中不同位置的特征数据的原始通道顺序。

步骤1304、基于原始通道顺序，对重建的特征帧序列中不同位置的特征数据进行逆排序，得到重建的多个通道的特征数据。

示例性的，解码端解码得到重建的特征帧序列和重建的特征数据时空排列信息后，对重建的特征帧序列进行时空逆排列操作，得到重建特征数据，步骤如下：

基于重建的特征数据时空排列信息中的特征数据的通道数C，时域拼接帧数frame_count，以及单个通道的特征数据的高h和单个通道的特征数据的宽w，确定特征帧序列中每一通道的特征数据在的位置；

基于重建的特征数据时空排列信息中的排序列表channel_idx，以一维排序列表channel_idx[I]＝X为例，确定每一通道的特征数据在排序前的原始通道顺序，待确定出所有通道的特征数据的原始通道顺序，基于原始通道顺序，对重建的特征帧序列中不同位置的特征数据进行逆排序，得到重建的多个通道的特征数据。

本公开的实施例提供一种特征数据的解码方法，应用于解码器；参照图17所示，该方法包括以下步骤：

步骤1401、解析码流，获得重建的特征帧序列、通道顺序对应关系、通道数量、时域拼接帧数、填充后的特征数据的高度、填充后的特征数据的宽度、单个通道的特征数据的高度和单个通道的特征数据的宽度。

步骤1402、基于通道数量、时域拼接帧数、填充后的特征数据的高度、填充后的特征数据的宽度、单个通道的特征数据的高度以及单个通道的特征数据的宽度，确定重建的特征帧序列中每一通道的特征数据所在的位置。

步骤1403、基于通道顺序对应关系，确定重建的特征帧序列中不同位置的特征数据的原始通道顺序。

步骤1404、基于原始通道顺序，对重建的特征帧序列中不同位置的特征数据进行逆排序，得到重建的多个通道的特征数据。

本公开至少具有如下有益效果：基于神经网络中间层输出的多通道特征数据不同通道之间的信息冗余，对多通道特征数据的所有通道按照相似度进行排序，之后按照排序顺序在时域和空域上排列成特征帧序列，使得编码时可以参考相邻区域相似度较高的特征数据通道，提高特征数据的编码效率。若先在时域再在空域进行拼接，则可以更好地利用帧间编码技术对特征数据进行编码，而若先在空域再在时域进行拼接，则可以更好地利用帧内编码技术对特征数据进行编码，从而使得可以复用现有的视频编码标准中的技术对特征数据进行高效编码。

也就是说，本公开为了高效复用现有的视频编码标准中的技术对神经网络中间层输出的多通道特征数据进行编码，将特征数据的所有通道按照相似度进行排序并在时域和空域上进行排列成特征帧序列。由于排列后时域和空域上相邻通道之间的相关性较大，因此本公开能够更好的利用现有的帧内预测及帧间预测，进一步提高了特征数据的编码效率。为了在解码之后能够恢复时空排列前的多通道特征数据，需要在码流中记录特征数据的时空排列信息。

图18为本公开实施例提供的编码设备的组成结构示意图，如图18所示，编码设备150包括第一获得单元1501、第一处理单元1502和编码单元1503，其中：

第一获得单元1501，配置为获取待处理图像对应的多个通道的特征数据；

第一处理单元1502，配置为确定多个通道的特征数据中的参考通道的特征数据；

第一处理单元1502，配置为以参考通道的特征数据为排序起始对象，按照多个通道的特征数据之间相似度递减的顺序，对多个通道的特征数据进行排序，得到排序后的多个通道的特征数据；

第一处理单元1502，配置为将排序后的多个通道的特征数据进行拼接，得到目标特征帧序列；

编码单元1503，配置为对目标特征帧序列进行编码，生成码流。

在本公开其他实施例中，第一处理单元1502，配置为当多个通道的特征数据中特征数据值的累加和满足目标阈值时，确定累加和对应的通道的特征数据为参考通道的特征数据。

在本公开其他实施例中，特征数据值的累加和满足目标阈值包括：特征数据值的累加和最大，或者，特征数据值的累加和最小。

在本公开其他实施例中，第一获得单元1501，配置为获得多个通道的特征数据在待处理图像中的原始通道顺序，与在排序后的多个通道的特征数据中的编码通道顺序之间的通道顺序对应关系；

编码单元1503，配置为将通道顺序对应关系写入码流中。

在本公开其他实施例中，通道顺序对应关系，包括：

当时域拼接帧数为一帧时，原始通道顺序为第X个通道，对应的编码通道顺序为第I个通道；

当时域拼接帧数为至少两帧时，原始通道顺序为第X个通道，对应的编码通道顺序为第N第I个通道。

在本公开其他实施例中，第一处理单元1502，配置为确定时域拼接帧数大于一帧，在时空域上按照拼接策略，将排序后的特征数据进行拼接，得到目标特征帧序列。

在本公开其他实施例中，第一处理单元1502，配置为确定时域拼接帧数大于一帧，在时空域上按照拼接策略，将排序后的特征数据进行拼接，得到拼接后的特征数据；

确定拼接后的特征数据的行数、拼接后的特征数据的列数以及时域拼接帧数的乘积；

确定多个通道的特征数据的通道数小于乘积，对拼接后的帧中缺少特征数据通道的区域进行填充，得到目标特征帧序列。

在本公开其他实施例中，第一处理单元1502，配置为确定时域拼接帧数大于一帧，在时空域上按照先时域后空域的拼接策略，在时域上按照光栅扫描顺序在不同帧的相同位置进行拼接；

在空域上按照光栅扫描顺序在相邻位置进行拼接，或者在空域上按照Z字形扫描顺序在相邻位置进行拼接。

在本公开其他实施例中，第一处理单元1502，配置为确定时域拼接帧数大于一帧，在时空域上按照先空域后时域的拼接策略，在空域上按照光栅扫描顺序在相邻位置进行拼接，或者在空域上按照Z字形扫描顺序在相邻位置进行拼接；

在时域上按照光栅扫描顺序在不同帧的相同位置进行拼接。

在本公开其他实施例中，第一处理单元1502，配置为确定时域拼接帧数为一帧，在空域上按照拼接策略，将排序后的通道特征数据进行拼接，得到目标特征帧序列。

在本公开其他实施例中，第一处理单元1502，配置为在空域上按照先填充后拼接的策略，将排序后的通道特征数据进行拼接。

在本公开其他实施例中，第一处理单元1502，配置为在空域上对每一排序后的特征数据进行填充，在空域上将填充后的特征数据进行拼接；其中，填充后的相邻通道的特征数据之间具有缝隙。

在本公开其他实施例中，编码单元1503，配置为将填充后的特征数据的高度和填充后的特征数据的宽度写入码流。将多个通道的特征数据对应的通道数量、单个通道的特征数据的高度和单个通道的特征数据的宽度写入码流中。将时域拼接帧数写入码流中。

在本公开其他实施例中，第一获得单元1501，配置为获取待处理图像；

第一处理单元1502，配置为通过神经网络模型对待处理图像进行特征提取，得到多个通道的特征数据。

图19为本公开实施例提供的解码设备的组成结构示意图，如图19所示，解码设备160包括解码单元1601和第二处理单元1602，其中：

解码单元1601，配置为解析码流，获得重建的特征帧序列；

第二处理单元1602，配置为对重建的特征帧序列进行逆排序，得到重建的多个通道的特征数据。

在本公开其他实施例中，解码单元1601，配置为解析码流，获得通道顺序对应关系、通道数量、时域拼接帧数、单个通道的特征数据的高度和单个通道的特征数据的宽度。

第二处理单元1602，配置为基于通道数量、时域拼接帧数、单个通道的特征数据的高度以及单个通道的特征数据的宽度，确定重建的特征帧序列中每一通道的特征数据在的位置；基于通道顺序对应关系，确定重建的特征帧序列中不同位置的特征数据的原始通道顺序；基于原始通道顺序，对重建的特征帧序列中不同位置的特征数据进行逆排序，得到重建的多个通道的特征数据。

在本公开其他实施例中，解码单元1601，配置为解析码流，获得填充后的特征数据的高度和填充后的特征数据的宽度；

第二处理单元1602，配置为基于通道数量、时域拼接帧数、填充后的特征数据的高度、填充后的特征数据的宽度、单个通道的特征数据的高度以及单个通道的特征数据的宽度，确定重建的特征帧序列中每一通道的特征数据在的位置。

图20为本公开实施例提供的编码设备的组成结构示意图，如图20所示，编码设备170(图20中的编码设备170与图18中的编码设备150相对应)包括第一存储器1701和第一处理器1702，其中：

第一处理器1702，用于执行第一存储器1701中存储的编码指令时，实现本公开实施例提供的编码方法。

其中，第一处理器1702可以通过软件、硬件、固件或者其组合实现，可以使用电路、单个或多个专用集成电路(application specific integrated circuits，ASIC)、单个或多个通用集成电路、单个或多个微处理器、单个或多个可编程逻辑器件、或者前述电路或器件的组合、或者其他适合的电路或器件，从而使得该处理器可以执行前述编码方法的相应步骤。

图21为本公开实施例提供的解码设备的组成结构示意图，如图21所示，解码设备180(图21中的解码设备180与图19中的解码设备160相对应)包括第二存储器1801和第二处理器1802，其中：

第二处理器1802，用于执行第二存储器1801中存储的解码指令时，实现本公开实施例提供的解码方法。

其中，第二处理器1802可以通过软件、硬件、固件或者其组合实现，可以使用电路、单个或多个专用集成电路(application specific integrated circuits，ASIC)、单个或多个通用集成电路、单个或多个微处理器、单个或多个可编程逻辑器件、或者前述电路或器件的组合、或者其他适合的电路或器件，从而使得该处理器可以执行前述解码方法的相应步骤。

在本公开实施例中的各组成部分可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。

集成的单元如果以软件功能模块的形式实现并非作为独立的产品进行销售或使用时，可以存储在一个计算机可读取存储介质中，基于这样的理解，本实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，云服务器，或者网络设备等)或processor(处理器)执行本实施例方法的全部或部分步骤。而前述的存储介质包括：磁性随机存取存储器(FRAM，ferromagnetic random access memory)、只读存储器(ROM，Read Only Memory)、可编程只读存储器(PROM，Programmable Read-Only Memory)、可擦除可编程只读存储器(EPROM，Erasable Programmable Read-Only Memory)、电可擦除可编程只读存储器(EEPROM，Electrically Erasable Programmable Read-Only Memory)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(CD-ROM，Compact Disc Read-Only Memory)等各种可以存储程序代码的介质，本公开实施例不作限制。

本公开实施例还提供了一种计算机可读存储介质，存储有可执行编码指令，用于引起第一处理器执行时，实现本公开实施例提供的编码方法。

本公开实施例还提供了一种计算机可读存储介质，存储有可执行解码指令，用于引起第二处理器执行时，实现本公开实施例提供的解码方法。

工业实用性

本公开实施例提供了一种特征数据的编码方法、解码方法、编码器、解码器及存储介质，通过获取待处理图像对应的多个通道的特征数据；确定多个通道的特征数据中的参考通道的特征数据；以参考通道的特征数据为排序起始对象，按照多个通道的特征数据之间相似度递减的顺序，对多个通道的特征数据进行排序，得到排序后的多个通道的特征数据；将排序后的多个通道的特征数据进行拼接，得到目标特征帧序列；对目标特征帧序列进行编码，生成码流；也就是说，本公开在获得多个通道的特征数据的情况下，以一个通道的特征数据作为基准，即确定参考通道的特征数据；按照与参考通道的特征数据相比，相似度由大到小的顺序，对所有通道的特征数据进行排序；如此，在排序后时空域上相邻通道的特征数据之间的相关性较大，使得后续编码时可以参考相邻区域相似度较高的特征数据通道，从而提高了特征数据的编码效率。

Claims

一种特征数据的编码方法，包括：

获取待处理图像对应的多个通道的特征数据；

确定所述多个通道的特征数据中的参考通道的特征数据；

以所述参考通道的特征数据为排序起始对象，按照所述多个通道的特征数据之间相似度递减的顺序，对所述多个通道的特征数据进行排序，得到排序后的多个通道的特征数据；

将所述排序后的多个通道的特征数据进行拼接，得到目标特征帧序列；

对所述目标特征帧序列进行编码，生成码流。
根据权利要求1所述方法，所述确定所述多个通道的特征数据中的参考通道的特征数据，包括：

当所述多个通道的特征数据中特征数据值的累加和满足目标阈值时，确定所述累加和对应的通道的特征数据为所述参考通道的特征数据。
根据权利要求2所述方法，所述特征数据值的累加和满足所述目标阈值包括：所述特征数据值的累加和最大，或者，所述特征数据值的累加和最小。
根据权利要求1所述方法，所述以所述参考通道的特征数据为排序起始对象，按照多个通道的特征数据之间相似度递减的顺序，对所述多个通道的特征数据进行排序，得到排序后的多个通道的特征数据之后，所述方法包括：

获得所述多个通道的特征数据在所述待处理图像中的原始通道顺序，与在所述排序后的多个通道的特征数据中的编码通道顺序之间的通道顺序对应关系；

将所述通道顺序对应关系写入所述码流中。
根据权利要求4所述方法，所述通道顺序对应关系，包括：

当时域拼接帧数为一帧时，所述原始通道顺序为第X个通道，对应的所述编码通道顺序为第I个通道；

当所述时域拼接帧数为至少两帧时，所述原始通道顺序为第X个通道，对应的所述编码通道顺序为第N第I个通道。
根据权利要求1所述方法，所述将所述排序后的特征数据进行拼接，得到目标特征帧序列，包括：

确定时域拼接帧数大于一帧，在时空域上按照拼接策略，将所述排序后的特征数据进行拼接，得到目标特征帧序列。
根据权利要求6所述方法，所述确定时域拼接帧数大于一帧，在时空域上按照拼接策略，将所述排序后的特征数据进行拼接，得到目标特征帧序列，包括：

确定所述时域拼接帧数大于一帧，在时空域上按照所述拼接策略，将所述排序后的特征数据进行拼接，得到拼接后的特征数据；

确定拼接后的特征数据的行数、拼接后的特征数据的列数以及所述时域拼接帧数的乘积；

确定所述多个通道的特征数据的通道数小于所述乘积，对所述拼接后的帧中缺少特征数据通道的区域进行填充，得到所述目标特征帧序列。
根据权利要求6所述方法，所述确定时域拼接帧数大于一帧，在时空域上按照拼接策略，将所述排序后的特征数据进行拼接，包括：

确定时域拼接帧数大于一帧，在时空域上按照先时域后空域的拼接策略，在时域上按照光栅扫描顺序在不同帧的相同位置进行拼接；

在空域上按照光栅扫描顺序在相邻位置进行拼接，或者在空域上按照Z字形扫描顺序在相邻位置进行拼接。
根据权利要求6所述方法，所述确定时域拼接帧数大于一帧，在时空域上按照拼接策略，将所述排序后的特征数据进行拼接，包括：

确定时域拼接帧数大于一帧，在时空域上按照先空域后时域的拼接策略，在空域上按照光栅扫描顺序在相邻位置进行拼接，或者在空域上按照Z字形扫描顺序在相邻位置进行拼接；

在时域上按照光栅扫描顺序在不同帧的相同位置进行拼接。
根据权利要求1所述方法，所述将所述排序后的特征数据进行拼接，得到目标特征帧序列，包括：

确定时域拼接帧数为一帧，在空域上按照拼接策略，将所述排序后的特征数据进行拼接，得到所述目标特征帧序列。
根据权利要求1所述方法，所述将所述排序后的特征数据进行拼接，包括：

在空域上按照先填充后拼接的策略，将所述排序后的特征数据进行拼接。
根据权利要求11所述方法，所述在空域上按照先填充后拼接的策略，将所述排序后的特征数据进行拼接，包括：

在空域上对每一排序后的特征数据进行填充，在空域上将填充后的特征数据进行拼接；其中，填充后的相邻通道的特征数据之间具有缝隙。
根据权利要求12所述方法，所述在空域上将填充后的特征数据进行拼接之后，所述方法包括：

将填充后的特征数据的高度和填充后的特征数据的宽度写入所述码流。
根据权利要求1所述方法，所述方法还包括：

将所述多个通道的特征数据对应的通道数量、单个通道的特征数据的高度和单个通道的特征数据的宽度写入所述码流中。
根据权利要求5所述方法，所述方法还包括：

将所述时域拼接帧数写入所述码流中。
根据权利要求1所述方法，所述方法还包括：

获取待处理图像；

通过神经网络模型对所述待处理图像进行特征提取，得到所述多个通道的特征数据。
一种特征数据的解码方法，包括：

解析码流，获得重建的特征帧序列；

对所述重建的特征帧序列进行逆排序，得到重建的多个通道的特征数据。
根据权利要求17所述的方法，所述方法还包括：

解析所述码流，获得通道顺序对应关系、通道数量、时域拼接帧数、单个通道的特征数据的高度和单个通道的特征数据的宽度；

基于所述通道数量、所述时域拼接帧数、所述单个通道的特征数据的高度以及所述单个通道的特征数据的宽度，确定所述重建的特征帧序列中每一通道的特征数据在的位置；

相应的，所述对所述重建的特征帧序列进行逆排序，得到重建的多个通道的特征数据，包括：

基于所述通道顺序对应关系，确定所述重建的特征帧序列中不同位置的特征数据的原始通道顺序；

基于所述原始通道顺序，对所述重建的特征帧序列中不同位置的特征数据进行逆排序，得到所述重建的多个通道的特征数据。
根据权利要求18所述的方法，所述方法还包括：

解析所述码流，获得填充后的特征数据的高度和填充后的特征数据的宽度；

相应的，所述基于所述通道数量、所述时域拼接帧数、所述单个通道的特征数据的高度以及所述单个通道的特征数据的宽度，确定所述重建的特征帧序列中每一通道的特征数据在的位置，包括：

基于所述通道数量、所述时域拼接帧数、所述填充后的特征数据的高度、所述填充后的特征数据的宽度、所述单个通道的特征数据的高度以及所述单个通道的特征数据的宽度，确定所述重建的特征帧序列中每一通道的特征数据在的位置。
一种编码器，所述编码器包括第一获得单元、第一处理单元和编码单元；其中，

所述第一获得单元，配置为获取待处理图像对应的多个通道的特征数据；

所述第一处理单元，配置为确定所述多个通道的特征数据中的参考通道的特征数据；

所述第一处理单元，配置为以所述参考通道的特征数据为排序起始对象，按照多个通道的特征数据之间相似度递减的顺序，对所述多个通道的特征数据进行排序，得到排序后的多个通道的特征数据；

所述第一处理单元，配置为将所述排序后的多个通道的特征数据进行拼接，得到目标特征帧序列；

所述编码单元，配置为对所述目标特征帧序列进行编码，生成码流。
一种编码器，所述编码器包括第一存储器和第一处理器；其中，

所述第一存储器，用于存储能够在所述第一处理器上运行的计算机程序；

所述第一处理器，用于在运行所述计算机程序时，执行如权利要求1至16任一项所述的方法。
一种解码器，所述解码器包括解码单元和第二处理单元；其中，

所述解码单元，配置为解析码流，获得重建的特征帧序列；

所述第二处理单元，配置为对所述重建的特征帧序列进行逆排序，得到重建的多个通道的特征数据。
一种解码器，所述解码器包括第二存储器和第二处理器；其中，

所述第二存储器，用于存储能够在所述第二处理器上运行的计算机程序；

所述第二处理器，用于在运行所述计算机程序时，执行如权利要求17至19任一项所述的方法。
一种计算机可读存储介质，存储有可执行编码指令，用于引起第一处理器执行时，实现权利要求1至16任一项所述的方法。
一种计算机可读存储介质，存储有可执行解码指令，用于引起第二处理器执行时，实现权利要求17至19中任一项所述的方法。