WO2020181554A1

WO2020181554A1 - 预测值的确定方法、解码器以及计算机存储介质

Info

Publication number: WO2020181554A1
Application number: PCT/CN2019/078160
Authority: WO
Inventors: 周益民; 程学理
Original assignee: Oppo广东移动通信有限公司
Priority date: 2019-03-14
Filing date: 2019-03-14
Publication date: 2020-09-17
Also published as: CN113490953A

Abstract

本申请实施例提供了一种预测值的确定方法、解码器以及计算机存储介质，该方法应用于一解码器中，该方法包括：获取待解码图像块的参考图像块的像素矩阵，根据参考图像块的像素矩阵，确定输入值，将输入值输入至预设的神经网络中得到待解码图像块的预测值；也就是说，在本申请实施例中，首先，获取待解码图像块的参考图像块的像素矩阵，然后，利用预设的神经网络对参考图像块的像素矩阵进行处理，如此，利用神经网络得到待编码图像块的预测值，使得预测值更加接近待编码图像块的像素矩阵，从而减小预测残差的比特流，进而可以提高视频图像编解码的效率。

Description

预测值的确定方法、解码器以及计算机存储介质

技术领域

本申请实施例涉及视频解码中帧间预测技术领域，尤其涉及一种预测值的确定方法、解码器以及计算机存储介质。

背景技术

现有的视频编解码标准中，帧间预测技术是充分利用视频图像帧间的高度时域相关性来达到视频图像压缩的目的，广泛应用于普通电视、会议电视、视频电话、高清晰度电视的压缩编解码中。

为了最大程度上消除时域信息冗余，核心在于运动估计(ME，Motion Estimation)和运动补偿(MC，Motion Compensation)技术，编码器在时域上相邻或相近的已编码重构图像即在参考图像中，搜索待编码图像块的最佳匹配块，作为当前待编码图像块的参考图像块，计算参考图像块与待编码图像块的残差，再经由变换、量化、熵编码等过程生成比特流进行传输。由于视频内容一般为动态内容，通常情况下，当前待编码图像块并不能在参考图像中搜索到像素值完全匹配的参考像素块，它与编码器选出的最优匹配块之间天然存在一定的残差。另外，参考图像是已编码图像而非信源图像，由于量化技术的存在，编码图像与信源图像之间存在一定失真。因此，参考图像块与待编码图像块之间的残差会进一步被放大，导致编码器需要消耗更多比特来编码预测残差信息。

现有编码器通过MC、光流法、加权预测等数学模型对最优参考图像块进行滤波处理，从而减小预测残差，进而尽可能地消除时域冗余，但是由于这些均为经验模型，所预测出的最优参考图像块与当前编码图像块的残差仍处于较高的数量级，影响视频图像的编解码效率；由此可以看出，现有的视频图像的编解码中的所确定出的预测值，导致视频图像的编解码效率较低。

发明内容

有鉴于此，本申请实施例期望提供一种预测值的确定方法、解码器以及计算机存储介质，能够提高解码器的解码效率。

本申请实施例的技术方案可以如下实现：

第一方面，本申请实施例提供了一种预测值的确定方法，所述方法应用于一解码器中，所述方法包括：

获取待解码图像块的参考图像块的像素矩阵；根据所述参考图像块的像素矩阵，确定输入值；将所述输入值输入至预设的神经网络中，得到所述待解码图像块的预测值。

在上述方案中，所述输入值为所述参考图像块的像素矩阵。

在上述方案中，所述根据所述参考图像块的像素矩阵，确定输入值，包括：

获取所述参考图像块的相邻参考图像块的像素矩阵；根据所述参考图像块的像素矩阵和所述相邻参考图像块的像素矩阵，确定所述输入值。

在上述方案中，所述输入值为所述参考图像块的像素矩阵和所述相邻参考图像块的像素矩阵按照相对位置排列组成的像素矩阵。

在上述方案中，所述根据所述参考图像块的像素矩阵和所述相邻参考图像块的像素矩阵，确定所述输入值，包括：

根据预设的插值法，对所述相邻参考图像块的像素矩阵进行处理，得到插值后的相邻参考图像块的像素矩阵；将所述参考图像块的像素矩阵和插值后的相邻参考图像块的像素矩阵按照相对位置排列组成的像素矩阵，确定为所述神经网络的输入值。

第二方面，本申请实施例提供了一种解码器，所述解码器包括：

获取模块，用于获取待解码图像块的参考图像块的像素矩阵；确定模块，用于根据所述参考图像块的像素矩阵，确定输入值；处理模块，用于将所述输入值输入至预设的神经网络中，得到所述待解码图像块的预测值。

在上述方案中，所述输入值为所述参考图像块的像素矩阵。

在上述方案中，所述确定模块，包括：

获取子模块，用于获取所述参考图像块的相邻参考图像块的像素矩阵；

确定子模块，用于根据所述参考图像块的像素矩阵和所述相邻参考图像块的像素矩阵，确定所述输入值。

在上述方案中，所述确定子模块，具体用于：

根据预设的插值法，对所述相邻参考图像块的像素矩阵进行处理，得到插值后的相邻参考图像块的像素矩阵；

将所述参考图像块的像素矩阵和插值后的相邻参考图像块的像素矩阵按照相对位置排列组成的像素矩阵，确定为所述神经网络的输入值。

第三方面，本申请实施例提供了一种解码器，所述解码器包括：

处理器以及存储有所述处理器可执行指令的存储介质，所述存储介质通过通信总线依赖所述处理器执行操作，当所述指令被所述处理器执行时，执行上述第一方面所述的预测值的确定方法。

第四方面，本申请实施例提供了一种计算机存储介质，存储有可执行指令，当所述可执行指令被一个或多个处理器执行的时候，所述处理器执行所述第一方面所述的预测值的确定方法。

本申请实施例提供了一种预测值的确定方法、解码器以及计算机存储介质，该方法应用于一解码器中，该方法包括：获取待解码图像块的参考图像块的像素矩阵，根据参考图像块的像素矩阵，确定输入值，将输入值输入至预设的神经网络中，得到待解码图像块的预测值；也就是说，在本申请实施例中，首先，获取待解码图像块的参考图像块的像素矩阵，然后，利用预设的神经网络对参考图像块的像素矩阵进行处理，如此，利用神经网络得到待编码图像块的预测值，使得预测值更加接近待编码图像块的像素矩阵，从而减小预测残差的比特流，进而可以提高视频图像编解码的效率。

附图说明

图1为本申请实施例提供的一种可选的预测值的确定方法的流程示意图；

图2为待解码图像块的排布示意图；

图3为本申请实施例提供的另一种可选的预测值的确定方法的流程示意图；

图4为本申请实施例提供的一种可选的待编码图像块和参考图像块的排布示意图；

图5为本申请实施例提供的一种可选的神经网络的结构示意图；

图6为本申请实施例提供的一种解码器的结构示意图一；

图7为本申请实施例提供的一种解码器的结构示意图二。

具体实施方式

为了能够更加详尽地了解本申请实施例的特点与技术内容，下面结合附图对本申请实施例的实现进行详细阐述，所附附图仅供参考说明之用，并非用来限定本申请实施例。

本申请实施例提供了一种预测值的确定方法，该方法应用于一解码器中，图1为本申请实施例提供的一种可选的预测值的确定方法的流程示意图，参考图1所示，该预测值的确定方法可以包括：

S101：获取待解码图像块的参考图像块的像素矩阵；

在视频图像的编解码中，编码器可以利用ME、MC和向量预测等技术从重构的参考图像中选取出最佳时域的参考图像块，利用参考图像块和待编码图像块，确定出待编码图像块的预测残差，将预测残差传输至解码器，解码器利用选取出的参考图像块和预测残差来解码出真实图像块。

由此可以看出，若预测残差较大，则编码器需要消耗较多的比特来编码预测残差，这样，会影响编解码的效率。

基于现有的预测残差处于较高的数量等级，导致编解码效率较低，为了提高视频图像编解码的效率，首先，针对待解码图像块来说，解码器可以利用ME、MC和向量预测等技术从重构的参考图像中选取出参考图像块，并得到参考图像块的像素矩阵，利用参考图像块的像素矩阵来确定待解码图像块的预测值，从而根据预测值和预测残差来解码出真实图像块。

图2为待解码图像块的排布示意图，如图2所示，斜条纹的区域为已解码出的图像块，在解码的过程中，解码器是按照图像块的顺序(每一行按照从左往右的顺序)来解码的，在图2中，当解码出左下方的图像块之后，左下方图像块的下一个图像块即为待解码图像块(图2中的空格)。

这里，需要说明的是，参考图像块的像素矩阵可以为参考图像块的色度值的像素矩阵，也可以为参考图像块的亮度值的像素矩阵，本申请实施例对此不作具体限定。

S102：根据参考图像块的像素矩阵，确定输入值；

为了确定出待解码图像块的预测值，解码器采用预先设置有的神经网络，利用神经网络来确定待解码图像块的预测值，那么，为了得到待解码图像块的预测值，需要先确定神经网络的输入值。

为了确定神经网络的输入值，可以通过下列一种或者多种方式来实现：

为了确定出神经网络的输入值，在一种可选的实施例中，该输入值可以为参考图像块的像素矩阵。

具体来说，解码器直接将参考图像块的像素矩阵作为神经网络的输入值，例如，参考图像块的像素矩阵为一个N×N的矩阵，将该矩阵输入至神经网络，利用神经网络对该矩阵进行处理可以得到待编码图像块的预测值。

为了确定出神经网络的输入值，在一种可选的实施例中，图3为本申请实施例提供的另一种可选的预测值的确定方法的流程示意图，参考图3所示，S102可以包括：

S301：获取参考图像块的相邻参考图像块的像素矩阵；

S302：根据参考图像块的像素矩阵和相邻参考图像块的像素矩阵，确定输入值。

具体来说，解码器不仅仅获取参考图像块的像素矩阵，还需要采用ME、MC和向量预测等技术从参考图像中获取参考图像块的相邻参考图像块的像素矩阵，在实际应用中，针对参考图像为非边界参考图像块时，获取与参考图像相邻的全部参考图像块，例如包括位于：参考图像的上方、下方、左方、右方、左上方、右上方、左下方和右下方的参考图像块，这样，便可以获取到参考图像块的相邻参考图像块的像素矩阵。

这里，解码器确定出参考图像块之后，记录参考图像块与待解码图像块的像素距离，即运动向量(MV，Motion Vector)信息，解码器可以采用整像素运动搜索技术，根据MV可以获取8个相邻参考图像的像素矩阵，这样，在得到参考图像的像素矩阵和相邻参考图像的像素矩阵之后，可以根据参考图像的像素矩阵和相邻参考图像的像素矩阵，确定神经网络的输入值。

为了确定出神经网络的输入值，在一种可选的实施例中，在302中，该输入至可以为参考图像块的像素矩阵和相邻参考图像块的像素矩阵按照相对位置排列组成的像素矩阵。

举例来说，参考图像块的像素矩阵为一个N×N的像素矩阵，每个相邻参考图像块的像素矩阵为一个N×N的像素矩阵，那么按照相对位置关系排列组成的像素矩阵为一个3N×3N的像素矩阵，将这个3N×3N的像素矩阵作为神经网络的输入值。

为了确定出神经网络的输入值，在一种可选的实施例中，S302可以包括：

根据预设的插值法，对相邻参考图像块的像素矩阵进行处理，得到插值后的相邻参考图像块的像素矩阵；

将参考图像块的像素矩阵和插值后的相邻参考图像块的像素矩阵按照相对位置排列组成的像素矩阵，确定为神经网络的输入值。

其中，预设的插值法可以包括一次线性插值法，双线性插值法和三次线性插值法，这里，本申请实施例对此不作具体限定。

具体来说，8个相邻参考图像块的像素矩阵若直接作为神经网络的输入值，会导致像素信息不平滑，生成的图像存在肉眼可见的边界效应，为了消除这种边界效应，解码器采用亚像素精度的运动搜索技术，即解码器对8个相邻参考图像块的像素矩阵利用预设的插值法进行处理，得到插值后的相邻参考图像块的像素矩阵，最后，将参考图像块的像素矩阵和插值后的相邻参考图像块的像素矩阵按照相对位置排列组成的像素矩阵，确定为神经网络的输入值。

图4为本申请实施例提供的一种可选的待编码图像块和参考图像块的排布示意图，参考图4所示，最小的方格代表一个像素，每16个像素构成的方格代表一个待解码图像块，在解码时，先利用ME、MC和向量预测等技术从参考图像中获取到待解码图像块的参考图像块，并记录参考图像块与待解码图像块的像素距离，即MV信息，若采用整像素运动搜索技术，参考图像块的像素信息及获得其周围(上、下、左、右、左上、右上、左下和右下)8个相邻块，可以直接根据MV从参考图像中获得。

解码器利用亚像素精度的运动搜索技术选出的参考图像块，在这种情况下，若直接取参考图像块的周围8个相邻参考图像块作为神经网络的输入，会导致像素信息不平滑，生成的图像存在肉眼可见的边界效应，因此，对于亚像素精度的预测像素块，需要对其周围8个相邻参考图像块进行相应的亚像素插值，保证其相对位置重新拼接，作为神经网络的输入。在实际应用中，对于参考图像块为边界图像块，本申请实施例不对其进行插值处理。

其中，在图4中箭头的起始端为待解码图像块，图4中箭头的末端为待解码图像块的参考图像块，在参考图像中，与参考图像块相邻的全部参考图像块为参考图像块的相邻参考图像块。

S103：将输入值输入至预设的神经网络中，得到待解码图像块的预测值。

在S102中确定出神经网络的输入值之后，将输入值输入至神经网络中，其中，该输入值可以为参考图像块的像素矩阵，或者参考图像块的像素矩阵和相邻参考图像块的像素矩阵按照相对位置排列组成的像素矩阵，或者参考图像块的像素矩阵和插值后的相邻参考图像块的像素矩阵按照相对位置排列组成的像素矩阵，这里，利用神经网络对输入值的处理可以根据输入值的不同分为两种处理方式来实现：在一种可选的实施例中，S103可以包括：

将输入值输入至神经网络中，依次对输入值进行归一化运算、卷积运算、特征提取、反归一化运算和加法运算，得到待解码图像块的预测值。

具体来说，分为两种情况来确定待解码图像块的预测值，当待解码图像块的像素矩阵为一个N×N的矩阵时，一种是输入值为参考图像块的像素矩阵，输入值为与待解码图像块相同维度的矩阵，例如N×N的矩阵。

另一种是输入值为参考图像块的像素矩阵和相邻参考图像块的像素矩阵按照相对位置排列组成的像素矩阵，或者参考图像块的像素矩阵和插值后的相邻参考图像块的像素矩阵按照相对位置排列组成的像素矩阵，例如，3N×3N的矩阵；那么，针对不同维度的矩阵可以通过下列方式来确定待解码图像块的预测值：

当输入值为参考图像块的像素矩阵，为了实现利用神经网络对输入值的处理，在一种可选的实施例中，S103可以包括：

对输入值进行归一化处理，得到归一化后的输入矩阵；

根据预设的卷积核，对归一化后的输入矩阵进行卷积运算，得到卷积运算后的矩阵；

对卷积运算后的矩阵进行特征提取，得到残差矩阵；

将残差矩阵与归一化后的输入矩阵相加，得到相加后的矩阵；

对相加后的矩阵进行反归一化处理，得到待解码图像块的预测值。

这里，以待解码图像块的像素矩阵为一个N×N的矩阵为例来说，获取到的参考图像块的像素矩阵也为一个N×N的矩阵，先对参考图像块的像素矩阵(N×N的矩阵)进行归一化处理，得到归一化后的输入矩阵；然后，利用预设的卷积核对归一化后的输入矩阵进行卷积运算，其次，对卷积运算后的矩阵采用残差Res层进行特征提取，得到残差矩阵，再次，将残差矩阵与归一化后的输入矩阵相加，最后，对相加后的矩阵进行反归一化处理，得到待解码图像块的预测值；如此，使得待解码图像块的预测值为一个N×N的矩阵。

当输入值为参考图像块的像素矩阵和相邻参考图像块的像素矩阵按照相对位置排列组成的像素矩阵，或者参考图像块的像素矩阵和插值后的相邻参考图像块的像素矩阵按照相对位置排列组成的像素矩阵，为了实现利用神经网络对输入值的处理，在一种可选的实施例中，S103可以包括：

对输入值进行归一化处理，得到归一化后的输入矩阵；

对参考图像块的像素矩阵进行归一化处理，得到归一化后的参考图像块的像素矩阵；

根据预设的缩放卷积层，对卷积运算后的矩阵进行缩放，得到预设维度的像素矩阵；其中，预设维度与参考图像块的像素矩阵的维度相同；

对预设维度的矩阵进行特征提取，得到残差矩阵；

将残差矩阵与归一化后的参考图像块的像素矩阵相加，得到相加后的矩阵；

仍然以待解码图像块的像素矩阵为一个N×N的矩阵为例来说，获取到的参考图像块的像素矩阵也为一个N×N的矩阵，相邻参考图像块的像素矩阵或者插值后的相邻参考图像块的像素矩阵均为N×N的矩阵，那么，输入值为一个3N×3N的矩阵，将3N×3N的矩阵输入至神经网络中。

其中，该神经网络为基于卷积神经网络的残差网络(ResNet，Residual Network)，图5为本申请实施例提供的一种可选的神经网络的结构示意图，参考图5所示，神经网络可以包括4层不同大小和不同深度的卷积核，一个缩放卷积层，一个Res层；下面表1为图5中的神经网络的网络配置详情，如下表1所示：

表1 网络配置详情

首先，参考图像块的像素矩阵与相邻参考图像块的像素矩阵，或者与插值后的相邻参考图像块的像素矩阵组成的3N×3N的矩阵作为神经网络的输入值(Input)输入至神经网络中，对3N×3N的矩阵进行归一化处理，得到归一化后的输入矩阵，对参考图像块的像素矩阵进行归一化处理，得到归一化后的参考图像块的像素矩阵，然后，利用01、02、03和04层的卷积核对3N×3N的矩阵进行卷积运算；其中，01层卷积核可以为：卷积(32×5×5，stride＝1)+Leaky ReLU(alpha＝0.5)，02层卷积核可以为：卷积(64×5×5，stride＝1)+Leaky ReLU(alpha＝0.5)，03层卷积核可以为：卷积(64×3×3，stride＝1)+Leaky ReLU(alpha＝0.5)，04层卷积核可以为：卷积(64×3×3，stride＝1)+Leaky ReLU(alpha＝0.5)，其中，stride表示卷积的跨度，Leaky ReLU为一种激活函数，alpha为激活函数的参数。

在得到卷积运算后的矩阵之后，解码器采用05层的卷积核(相当于预设的缩放卷积层)对卷积运算后的矩阵进行降维卷积运算，即缩放处理，得到一个N×N的矩阵(相当于预设维度的矩阵)，05层卷积核可以为：卷积(16×5×5，stride＝3)+ReLU；解码器采用神经网络中的Res网络层的卷积核特征提取，得到残差矩阵，ReS网络层的卷积核可以为：卷积(1×3×3，stride＝1)+tanh，tanh为一种双曲函数。

在得到残差矩阵之后，将残差矩阵与归一化后的参考图像块的像素矩阵相加，得到相加后的矩阵，再对相加后的矩阵进行反归一化处理，得到待解码图像块的预测值，作为神经网络的输出值(Output)。

这里，需要说明的是，由于解码器在进行块划分时，像素块大小有8×8、16×16等不同尺寸，不同尺寸的图像块的像素值存在明显的差异，亮度图像块的像素和色度图像块的像素在纹理特征上也有较大的区别，因此，对于不同尺寸的亮度图像块的像素与色度图像块的像素，可以通过训练不同的网络参数以保证得到更优的预测值。

在实际应用中，将神经网络移植到编码器和解码器中，便可以在编码器和解码器选出最佳匹配块后进行预测值的运算，得到预测值之后，针对编码器来说，帧间预测模块传递给后续模块的预测残差就需要用预测值与待编码图像块之差代替。

也就是说，与用参考图像块和待解码图像块的差值作为预测残差相比，编码器用确定出的预测值与待解码图像块的差值作为预测残差，可以消耗较少的比特流来传输预测残差，可以提高编解码的效率。

这里，类似解码端，当编码器进行编码当前块时，需要将重构出的参考图像块及其相邻参考图像块送入对应的神经网络进行预测值的计算，再将预测值减去预测残差得到当前编码图像块的像素，由此完成当前编码图像块的编码工作，并且保证编解码的一致性。

通过该实例，改进帧间预测技术，使用解码器选出的参考图像块及其相邻参考图像块生成待解码图像块的预测值，提升参考图像块与待编码图像块的相似度，减少预测残差，进而提升编解码性能。

本申请实施例提供了一种预测值的确定方法，该方法包括：获取待解码图像块的参考图像块的像素矩阵，根据参考图像块的像素矩阵，确定输入值，将输入值输入至预设的神经网络中，得到待解码图像块的预测值；也就是说，在本申请实施例中，首先，获取待解码图像块的参考图像块的像素矩阵，然后，利用预设的神经网络对参考图像块的像素矩阵进行处理，如此，利用神经网络得到待编码图像块的预测值，使得预测值更加接近待编码图像块的像素矩阵，从而减小预测残差的比特流，进而可以提高视频图像编解码的效率。

基于前述实施例相同的发明构思，参见图6，图6为本申请实施例提供的一种解码器的结构示意图一，该解码器可以包括：

获取模块61，用于获取待解码图像块的参考图像块的像素矩阵；

确定模块62，用于根据参考图像块的像素矩阵，确定输入值；

处理模块63，用于将输入值输入至预设的神经网络中，得到待解码图像块的预测值。

在上述方案中，该输入值可以为将参考图像块的像素矩阵。

在上述方案中，确定模块62，包括：

获取子模块，用于获取参考图像块的相邻参考图像块的像素矩阵；

确定子模块，用于根据参考图像块的像素矩阵和相邻参考图像块的像素矩阵，确定输入值。

在上述方案中，该输入值可以为参考图像块的像素矩阵和相邻参考图像块的像素矩阵按照相对位置排列组成的像素矩阵。

在上述方案中，确定子模块，具体用于：

可以理解地，在本实施例中，“单元”可以是部分电路、部分处理器、部分程序或软件等等，当然也可以是模块，还可以是非模块化的。

另外，在本实施例中的各组成单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。

所述集成的单元如果以软件功能模块的形式实现并非作为独立的产品进行销售或使用时，可以存储在一个计算机可读取存储介质中，基于这样的理解，本实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或processor(处理器)执行本实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

图7为本申请实施例提供的一种解码器的结构示意图二，如图7所示，本申请实施例提供了一种解码器700，

包括处理器71以及存储有处理器71可执行指令的存储介质72，存储介质72通过通信总线73依赖处理器71执行操作，当指令被处理器71执行时，执行上述实施例一的预测值的确定方法。

需要说明的是，实际应用时，终端中的各个组件通过通信总线73耦合在一起。可理解，通信总线73用于实现这些组件之间的连接通信。通信总线73除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见，在图7中将各种总线都标为通信总线73。

本申请实施例提供了一种计算机存储介质，存储有可执行指令，当所述可执行指令被一个或多个处理器执行的时候，所述处理器执行上述一个或多个实施例所述的预测值的确定方法。

可以理解，本申请实施例中的存储器可以是易失性存储器或非易失性存储器，或可包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(Read-Only Memory，ROM)、可编程只读存储器(Programmable ROM，PROM)、可擦除可编程只读存储器(Erasable PROM，EPROM)、电可擦除可编程只读存储器(Electrically EPROM，EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory，RAM)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用，例如静态随机存取存储器(Static RAM，SRAM)、动态随机存取存储器(Dynamic RAM，DRAM)、同步动态随机存取存储器(Synchronous DRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM，DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM， SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM，DRRAM)。本文描述的系统和方法的存储器旨在包括但不限于这些和任意其它适合类型的存储器。

而处理器可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。

可以理解的是，本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现，处理单元可以实现在一个或多个专用集成电路(Application Specific Integrated Circuits，ASIC)、数字信号处理器(Digital Signal Processing，DSP)、数字信号处理设备(DSP Device，DSPD)、可编程逻辑设备(Programmable Logic Device，PLD)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。

对于软件实现，可通过执行本文所述功能的模块(例如过程、函数等)来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端(可以是手机、计算机、服务器、或者网络设备等)执行本申请各个实施例所述的方法。

上面结合附图对本申请的实施例进行了描述，但是本申请并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本申请的启示下，在不脱离本申请宗旨和权利要求所保护的范围情况下，还可做出很多形式，这些均属于本申请的保护之内。

工业实用性

本申请实施例中，首先，获取待解码图像块的参考图像块的像素矩阵，根据参考图像块的像素矩阵，确定输入值，将输入值输入至预设的神经网络中，得到待解码图像块的预测值；也就是说，在本申请实施例中，首先，获取待解码图像块的参考图像块的像素矩阵，然后，利用预设的神经网络对参考图像块的像素矩阵进行处理，如此，利用神经网络得到待编码图像块的预测值，使得预测值更加接近待编码图像块的像素矩阵，从而减小预测残差的比特流，进而可以提高视频图像编解码的效率。

Claims

一种预测值的确定方法，其中，所述方法应用于解码器中，所述方法包括：

获取待解码图像块的参考图像块的像素矩阵；

根据所述参考图像块的像素矩阵，确定输入值；

将所述输入值输入至预设的神经网络中，得到所述待解码图像块的预测值。
根据权利要求1所述的方法，其中，所述输入值为所述参考图像块的像素矩阵。
根据权利要求1所述的方法，其中，所述根据所述参考图像块的像素矩阵，确定输入值，包括：

获取所述参考图像块的相邻参考图像块的像素矩阵；

根据所述参考图像块的像素矩阵和所述相邻参考图像块的像素矩阵，确定所述输入值。
根据权利要求3所述的方法，其中，所述输入值为所述参考图像块的像素矩阵和所述相邻参考图像块的像素矩阵按照相对位置排列组成的像素矩阵。
根据权利要求3所述的方法，其中，所述根据所述参考图像块的像素矩阵和所述相邻参考图像块的像素矩阵，确定所述输入值，包括：

根据预设的插值法，对所述相邻参考图像块的像素矩阵进行处理，得到插值后的相邻参考图像块的像素矩阵；

将所述参考图像块的像素矩阵和插值后的相邻参考图像块的像素矩阵按照相对位置排列组成的像素矩阵，确定为所述神经网络的输入值。
一种解码器，其中，所述解码器包括：

获取模块，用于获取待解码图像块的参考图像块的像素矩阵；

确定模块，用于根据所述参考图像块的像素矩阵，确定输入值；

处理模块，用于将所述输入值输入至预设的神经网络中，得到所述待解码图像块的预测值。
根据权利要求6所述的解码器，其中，所述输入值为所述参考图像块的像素矩阵。
根据权利要求6所述的解码器，其中，所述确定模块，包括：

获取子模块，用于获取所述参考图像块的相邻参考图像块的像素矩阵；

确定子模块，用于根据所述参考图像块的像素矩阵和所述相邻参考图像块的像素矩阵，确定所述输入值。
根据权利要求8所述的解码器，其中，所述输入值为所述参考图像块的像素矩阵和所述相邻参考图像块的像素矩阵按照相对位置排列组成的像素矩阵。
根据权利要求8所述的解码器，其中，所述确定子模块，具体用于：

根据预设的插值法，对所述相邻参考图像块的像素矩阵进行处理，得到插值后的相邻参考图像块的像素矩阵；

将所述参考图像块的像素矩阵和插值后的相邻参考图像块的像素矩阵按照相对位置排列组成的像素矩阵，确定为所述神经网络的输入值。
一种解码器，其中，所述解码器包括：

处理器以及存储有所述处理器可执行指令的存储介质，所述存储介质通过通信总线依赖所述处理器执行操作，当所述指令被所述处理器执行时，执行上述的权利要求1至5任一项所述的预测值的确定方法。
一种计算机存储介质，其中，存储有可执行指令，当所述可执行指令被一个或多个处理器执行的时候，所述处理器执行所述的权利要求1至5任一项所述的预测值的确定方法。