WO2022206217A1

WO2022206217A1 - 在视频编码装置中进行图像处理的方法、装置、介质及系统

Info

Publication number: WO2022206217A1
Application number: PCT/CN2022/077311
Authority: WO
Inventors: 赵娟萍
Original assignee: Oppo广东移动通信有限公司
Priority date: 2021-04-01
Filing date: 2022-02-22
Publication date: 2022-10-06
Also published as: CN115190305A

Abstract

一种在视频编码装置中进行图像处理的方法、装置、存储介质、电子设备及系统。该方法包括：从当前帧图像中确定出待编码块；从当前帧图像的重构帧图像中确定出第一区域，并将第一区域的图像数据存储在预设存储器中；从预设存储器中读取第一区域的图像数据；根据图像数据从第一区域中确定出与待编码块相匹配的匹配块；根据匹配块与待编码块的相对关系，对待编码块进行编码。

Description

在视频编码装置中进行图像处理的方法、装置、介质及系统

本申请要求于2021年04月01日提交中国专利局、申请号为202110357576.3、发明名称为“在视频编码装置中进行图像处理的方法、装置、介质及系统”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请属于电子设备技术领域，尤其涉及一种在视频编码装置中进行图像处理的方法、装置、存储介质、电子设备及系统。

背景技术

随着技术的不断发展，视频编码装置(Video Encoder，VENC)的功能越来越强大。视频编码装置可以对视频图像进行编码。在对一帧视频图像进行编码时，通常会需要多帧已编码视频图像数据量的读取。

发明内容

本申请实施例提供一种在视频编码装置中进行图像处理的方法、装置、存储介质、电子设备及系统。

第一方面，本申请实施例提供一种在视频编码装置中进行图像处理的方法，所述方法包括：

从当前帧图像中确定出待编码块(encoded block)；

从所述当前帧图像的重构帧图像中确定出需要多次重复读取的第一区域，并将所述第一区域的图像数据存储在预设存储器中，所述预设存储器的功耗小于预设功耗阈值；

从所述预设存储器中读取所述第一区域的图像数据；

根据所述第一区域的图像数据从所述第一区域中确定出与所述待编码块相匹配的匹配块；

根据所述匹配块与所述待编码块的相对关系，对所述待编码块进行编码。

第二方面，本申请实施例提供一种在视频编码装置中进行图像处理的装置，所述装置包括：

第一确定模块，用于从当前帧图像中确定出待编码块；

第二确定模块，用于从当前帧图像中确定出需要多次重复读取的第一区域，并将所述第一区域的图像数据存储在预设存储器中，所述预设存储器的功耗小于预设功耗阈值；

读取模块，用于从所述预设存储器中读取所述第一区域的图像数据；

第三确定模块，用于根据所述第一区域的图像数据从所述第一区域中确定出与所述待编码块相匹配的匹配块；

编码模块，用于根据所述匹配块与所述待编码块的相对关系，对所述待编码块进行编码。

第三方面，本申请实施例提供一种存储介质，其上存储有计算机程序，当所述计算机程序在计算机上执行时，使得所述计算机执行本申请实施例提供的在视频编码装置中进行图像处理的方法。

第四方面，本申请实施例还提供一种电子设备，包括存储器，处理器以及视频编码装置，所述处理器通过调用所述存储器中存储的计算机程序，用于执行本申请实施例提供的在视频编码装置中进行图像处理的方法。

第五方面，本申请实施例还提供一种图像处理系统，包括视频编码装置、第一存储器和第二存储器，所述第二存储器的功耗大于所述第一存储器的功耗的第一预设倍数，所述视频编码装置包括第三存储器，所述第三存储器的读取速度大于所述第一存储器的读取速度的第二预设倍数，所述第一存储器和第二存储器分别存储当前帧图像的重构帧图像中需要多次重复读取的图像数据，所述视频编码装置在编码时，按照第一预设次数从所述第一存储器以及按照第二预设次数从所述第二存储器读取所述需要多次重复读取的图像数据，并从所述需要多次重复读取的图像数据中确定出搜索窗(Search Window，SWin)内的图像数据，将所述搜索窗内的图像数据存储在所述第三存储器中，所述视频编码装置从所述第三存储器中读取所述搜索窗内的图像数据，并确定出与待编码块相匹配的匹配块，根据所述匹配块与待编码块的块矢量(Block Vector)和残差进行编码。

附图说明

图1是本申请实施例提供的在视频编码装置中进行图像处理的方法的一种流程示意图。

图2是相关技术中视频压缩系统的结构示意图。

图3是相关技术中视频编码装置中数据存储的示意图。

图4是相关技术中增加动态随机存取内存(Dynamic Random Access Memory,DRAM)的通道(channel)数量进行数据存取的示意图。

图5是相关技术中正方形块的比对示意图。

图6是本申请实施例提供的阶层式搜索的示意图。

图7是本申请实施例提供的非阶层式搜索的示意图。

图8是本申请实施例提供的帧间运动估计(Inter-frame ME)与画面内区块复制(Intra block copy，IntraBC)搜索对象的对比示意图。

图9是本申请实施例提供的在视频编码装置中进行图像处理的方法的另一种流程示意图。

图10是本申请实施例提供的在当前帧图像的重构帧图像中进行搜索的场景示意图。

图11是本申请实施例提供的静态随机存取存储器(Static Random-Access Memory，SRAM)与动态随机存取内存在读取数据时功耗的对比示意图。

图12是本申请实施例提供的使用系统高速缓存(system cache,Sys$)的视频压缩系统的一种架构示意图。

图13是本申请实施例提供的使用系统高速缓存(system cache,Sys$)的视频压缩系统的另一种架构示意图。

图14是本申请实施例提供的使用系统缓冲存储器(System Buffer，SysBuf)的视频压缩系统的架构示意图。

图15是本申请实施例提供的下移一个编码块行时的场景示意图。

图16是本申请实施例提供的从多通道DRAM读取数据时的功耗曲线示意图。

图17是本申请实施例提供的分别从Sys$或SysBuf以及DRAM读取数据时的功耗曲线示意图。

图18是本申请实施例提供的当前帧图像的重构帧图像中搜索窗的搜索范围的场景示意图。

图19是本申请实施例提供的视频编码装置编码的场景示意图。

图20是本申请实施例提供的在视频编码装置中进行图像处理的装置的结构示意图。

图21是本申请实施例提供的电子设备的结构示意图。

图22是本申请实施例提供的电子设备的另一结构示意图。

图23是本申请实施例提供的图像处理系统的结构示意图。

图24是本申请实施例提供的图像处理系统的另一结构示意图。

具体实施方式

本申请实施例提供一种在视频编码装置中进行图像处理的方法，其中，所述方法包括：

从当前帧图像中确定出待编码块；

从所述预设存储器中读取所述第一区域的图像数据；

在本申请实施例中，视频编码装置可以从当前帧图像中确定出待编码块，从当前帧图像的重构帧图像中确定出需要多次重复读取的第一区域，并将第一区域的图像数据存储在预设存储器中，该预设存储器的功耗小于预设功耗阈值。然后，从预设存储器中读取第一区域的图像数据，根据第一区域的图像数据从第一区域中确定出与待编码块相匹配的匹配块。之后，根据匹配块与待编码块的相对关系，对待编码块进行编码。即，本申请实施例中，通过将第一区域的图像数据存储在功耗较小的预设存储器中，以达到降低视频编码装置功耗的目的。因此，本申请实施例可以降低视频编码装置的功耗。

本申请一种可选的实施例中，所述从当前帧图像中确定出待编码块，包括：

从所述当前帧图像中确定出待编码块行；

从所述待编码块行中确定出所述待编码块。

本申请一种可选的实施例中，所述预设存储器包括第一存储器和第二存储器，所述第二存储器的功耗大于所述第一存储器的功耗的第一预设倍数，所述从所述当前帧图像的重构帧图像中确定出需要多次重复读取的第一区域，并将所述第一区域的图像数据存储在预设存储器中，包括：

从所述当前帧图像的重构帧图像中确定出需要多次重复读取的第一区域；

将所述第一区域的图像数据分别存储在所述第一存储器和第二存储器中。

本申请一种可选的实施例中，所述第一区域包括多个块行，所述将所述第一区域的图像数据分别存储在所述第一存储器和第二存储器中，包括：

若所述第一区域下移一个块行，则将下移块行的图像数据分别存储在所述第一存储器和第二存储器中；

将下一个待编码块行编码时用不到的块行从所述第一存储器中进行移除。

本申请一种可选的实施例中，所述第一区域包括多个块行，每个所述块行包括多个块，所述将所述第一区域的图像数据分别存储在所述第一存储器和第二存储器中，包括：

若所述第一区域的最下面一个块行中新增一个块，则将新增块的图像数据分别存储在所述第一存储器和第二存储器中；

将下一个待编码块编码时用不到的块从所述第一存储器中进行移除。

本申请一种可选的实施例中，所述从所述预设存储器中读取所述第一区域的图像数据，包括：

从所述第一存储器中逐块行读取所述第一区域的图像数据第一预设次数，从所述第二存储器中逐块行读取第一区域中未读取块行的图像数据第二预设次数。

本申请一种可选的实施例中，所述根据所述第一区域的图像数据从所述第一区域中确定出与所述待编码块相匹配的匹配块，包括：

从读取的所述第一区域的图像数据中确定出搜索窗的图像数据，所述搜索窗位于所述第一区域内，所述待编码块的左侧与所述搜索窗的最下面一个块行的右侧相邻；

将所述搜索窗的图像数据存储在第三存储器中，所述第三存储器的读写速度大于所述第一存储器的读写速度的第二预设倍数；

从所述第三存储器中读取所述搜索窗的图像数据，并根据所述搜索窗的图像数据，从所述搜索窗中确定出与所述待编码块的编码代价最小的块；

将与所述待编码块的编码代价最小的块作为所述匹配块。

本申请一种可选的实施例中，所述从所述第三存储器中读取所述搜索窗的图像数据，并根据所述搜索窗的图像数据，从所述搜索窗中确定出与所述待编码块的编码代价最小的块，包括：

从所述第三存储器中读取所述搜索窗的图像数据；

将所述搜索窗按照预设阶层数进行缩小，得到缩小后的搜索窗；

根据所述缩小后的搜索窗的图像数据，从所述缩小后的搜索窗中确定出与所述待编码块的编码代价最小的缩小后的块；

根据所述缩小后的块在所述缩小后的搜索窗中的位置，从所述搜索窗中确定出与所述待编码块的编码代价最小的块。

本申请一种可选的实施例中，所述相对关系为块矢量和残差，所述块矢量为所述匹配块与所述待编码块的相对位移，所述根据所述匹配块与所述待编码块的相对关系，对所述待编码块进行编码，包括：

根据所述匹配块与所述待编码块的块矢量和残差，对所述待编码块进行编码。

本申请一种可选的实施例中，所述根据所述匹配块与所述待编码块的块矢量和残差，对所述待编码块进行编码，包括：

将所述匹配块与所述待编码块的残差进行正向变换和量化；

将所述匹配块与所述待编码块的块矢量以及正向变换和量化后的第一残差数据进行熵编码，得到视频流编码数据；或者

将所述正向变换和量化后的第一残差数据进行反向量化与变换，得到第二残差数据；

根据所述第二残差数据对所述待编码块进行重构。

本申请一种可选的实施例中，所述第一存储器包括设置在视频编码装置外部的系统高速缓存或系统缓冲存储器，所述第二存储器包括设置在视频编码装置外部的动态随机存取内存。

本申请一种可选的实施例中，所述第三存储器包括设置在视频编码装置内部的缓存或缓冲。

本申请实施例还提供一种在视频编码装置中进行图像处理的装置，其中，所述装置包括：

第一确定模块，用于从当前帧图像中确定出待编码块；

第二确定模块，用于从所述当前帧图像的重构帧图像中确定出需要多次重复读取的第一区域，并将所述第一区域的图像数据存储在预设存储器中，所述预设存储器的功耗小于预设功耗阈值；

本申请一种可选的实施例中，所述第一确定模块还用于：

从所述当前帧图像中确定出待编码块行；

从所述待编码块行中确定出所述待编码块。

本申请一种可选的实施例中，所述预设存储器包括第一存储器和第二存储器，所述第二存储器的功耗大于所述第一存储器的功耗的第一预设倍数；所述第二确定模块用于：从所述当前帧图像的重构帧图像中确定出需要多次重复读取的第一区域；将所述第一区域的图像数据分别存储在所述第一存储器和第二存储器中；

或者所述第一区域包括多个块行，所述第二确定模块用于：

若所述第一区域下移一个块行，则将下移块行的图像数据分别存储在所述第一存储器和第二存储器中；将下一个待编码块行编码时用不到的块行从所述第一存储器中进行移除；

或者所述第一区域包括多个块行，每个所述块行包括多个块，所述第二确定模块402用于：

若所述第一区域的最下面一个块行中新增一个块，则将新增块的图像数据分别存储在所述第一存储器和第二存储器中；将下一个待编码块编码时用不到的块从所述第一存储器中进行移除。

本申请一种可选的实施例中，所述第三确定模块用于：从读取的所述第一区域的图像数据中确定出搜索窗的图像数据，所述搜索窗位于所述第一区域内，所述待编码块的左侧与所述搜索窗的最下面一个块行的右侧相邻；将所述搜索窗的图像数据存储在第三存储器中，所述第三存储器的读写速度大于所述第一存储器的读写速度的第二预设倍数；从所述第三存储器中读取所述搜索窗的图像数据，并根据所述搜索窗的图像数据，从所述搜索窗中确定出与所述待编码块的编码代价最小的块；将与所述待编码块的编码代价最小的块作为所述匹配块。

或者所述第三确定模块404用于：

从所述第三存储器中读取所述搜索窗的图像数据；将所述搜索窗按照预设阶层数进行缩小，得到缩小后的搜索窗；根据所述缩小后的搜索窗的图像数据，从所述缩小后的搜索窗中确定出与所述待编码块的编码代价最小的缩小后的块；根据所述缩小后的块在所述缩小后的搜索窗中的位置，从所述搜索窗中确定出与所述待编码块的编码代价最小的块。

本申请实施例还提供一种计算机可读的存储介质，其上存储有计算机程序，其中，当所述计算机程序在计算机上执行时，使得所述计算机执行如上任一个实施例所述的在视频编码装置中进行图像处理的方法。

本申请实施例还提供一种电子设备，包括存储器，处理器以及视频编码装置，其中，所述处理器通过调用所述存储器中存储的计算机程序，以执行如上任一个实施例所述的在视频编码装置中进行图像处理的方法。

本申请实施例还提供一种图像处理系统，其中，包括视频编码装置、第一存储器和第二存储器，所述第二存储器的功耗大于所述第一存储器的功耗的第一预设倍数，所述视频编码装置包括第三存储器，所述第三存储器的读取速度大于所述第一存储器的读取速度的第二预设倍数，所述第一存储器和第二存储器分别存储当前帧图像的重构帧图像中需要多次重复读取的图像数据，所述视频编码装置在编码时，按照第一预设次数从所述第一存储器以及按照第二预设次数从所述第二存储器读取所述需要多次重复读取的图像数据，并从所述需要多次重复读取的图像数据中确定出搜索窗内的图像数据，将所述搜索窗内的图像数据存储在所述第三存储器中，所述视频编码装置从所述第三存储器中读取所述搜索窗内的图像数据，并确定出与待编码块相匹配的匹配块，根据所述匹配块与待编码块的块矢量和残差进行编码。

本申请一种可选的实施例中，所述第一存储器和第二存储器中分别存储从所述当前帧图像的重构帧图像中确定出的需要多次重复读取的第一区域的图像数据，若所述第一区域下移一个块行，则将下移块行的图像数据分别存储在所述第一存储器和第二存储器中，并将下一个待编码块行编码时用不到的块行从所述第一存储器中进行移除，所述视频编码装置在读取时，从所述第一存储器中逐块行读取所述第一区域的图像数据第一预设次数，从所述第二存储器中逐块行读取所述第一区域中未读取块行的图像数据第二预设次数。

请参照图示，其中相同的组件符号代表相同的组件，本申请的原理是以实施在一适当的运算环境中来举例说明。以下的说明是基于所例示的本申请具体实施例，其不应被视为限制本申请未在此详述的其它具体实施例。

请参阅图1，图1是本申请实施例提供的在视频编码装置中进行图像处理的方法的一种流程示意图。该在视频编码装置中进行图像处理的方法可以应用于视频编码装置中。该在视频编码装置中进行图像处理的方法的流程可以包括：

101、从当前帧图像中确定出待编码块。

随着技术的不断发展，视频编码装置的功能越来越强大。视频编码装置可以对视频图像进行编码。在对一帧视频图像进行编码时，通常会需要多帧已编码视频图像数据量的读取。然而，相关技术中，在对已编码视频图像的数据进行读取时，视频编码装置的功耗较大。

请参阅图2，图2为相关技术中视频压缩系统的结构示意图。该视频压缩系统中，中央处理器(Central Processing Unit/Processor,CPU)、视频编码装置、显示处理器(Display Processing Unit,DISP)和神经网络处理器(Neural Network Processing Unit,NPU)通过总线和动态随机存取内存控制器(Dynamic Random Access Memory Controller,DRAMC)从DRAM读写数据，中央处理器、视频编码装置、显示处理器和神经网络处理器分时共用带宽，中央处理器、显示处理器和神经网络处理器的优先级高于视频编码装置的优先级。视频编码装置在进行编码时需要进行搜索动作，会占用较大的带宽。

视频编码装置非常重视成本的高低，在帧图像缓冲时，为了达到最低成本与最高生产良率，通常都是以DRAM作为主要的存放空间。请参阅图3，图3是相关技术中视频编码装置中数据存储的示意图。其中，当前帧(Current Frame)图像、参考帧(Reference Frame)图像、重构帧(Reconstructed Frame)图像、比特流(Bitstreams)以及临时数据(Temporary data)都存储在视频编码装置中的DRAM中。该视频编码装置具有屏幕内容编码(Screen Content Coding，SCC)功能。

需要说明的是，对当前帧图像进行编码后变成重构帧图像，该当前帧图像的重构帧图像可以作为下一帧图像的参考帧图像，同理，对前一帧图像进行编码后变成前一帧图像的重构图像，前一帧图像的重构图像可以作为当前帧图像的参考帧图像。临时数据可以是时域运动矢量(Temporal Motion Vector,TMV)、缩放帧(scaled frames)或其它数据。然而，DRAM提供的带宽较小。

随着新型视频标准的出现，如高效率视讯编码(High Efficiency Video Coding,H.265/HEVC)、多功能影像编码(Versatile Video Coding,H.266/VVC)，开放媒体联盟影像编码1代标准(Alliance for Open Media Video 1,AV1)，必要影像编码(Essential Video Coding,MPEG-5/EVC)等，其针对越来越大画面尺寸且越来越高帧率。基于此，通常使用增加DRAM的带宽或提高动态随机存取内存频率的方式以达到加速吞吐数据量。

即使是阶层式搜索(hierarchical search)的画面内区块复制搜索减轻了多倍重构帧图像读取的问题，在大尺寸高帧率的情况下，如，在4096×2160分辨率尺寸(即4K分辨率)或7680x4320分辨率(即8K分辨率)尺寸的情况下，需要DRAM较高的吞吐量。通常会通过增加DRAM的通道数量来实现吞吐量的上升，这样会造成能耗过高的问题。

请参阅图4，图4是相关技术中增加DRAM的通道数量进行数据存取的示意图。通过增加DRAM的通道数量，可以增大带宽，提高频率，以增加DRAM吞吐数据的速度，但会造成较大的功耗。如，为了满足视频编码装置达到读取速度的需求，系统DRAM的带宽消耗较大的能量。但不论视频编码装置是执行即时操作还是非即时操作，维持最高效率是非常重要的。相关技术中的方法，当视频编码装置在预期时间完成的情况下，会造成DRAM极大的功耗。

视频编码装置普遍使用块(即方块)为基本单位，该块可以是长方形，正方形，或梯形，三角形拼凑出来，这样的条件下就出现了以块为单位的比较算法。请参阅图5，图5是相关技术中正方形块的比对示意图。使用正方形块来比对当前帧图像将要压缩的块与参考帧图像的块，该参考帧图像为前一帧图像的重构图像，其中，将要压缩的块与参考帧图像的块为N×N的块，N为大于或等于4的整数，通过块的比对，可以最大化减少时域上的信息冗余，达到压缩数据的效果。图5是以正方形块为基础的比对示例，但长方形、梯形或三角形拼凑出的块也可以使用同样的比对方法。

本申请实施例中，在画面内区块复制时，将图像划分为多个不互相重叠的块，这些块构成矩形阵列，其中每个块是N×N大小的块，比如，可以是4×4的区块，32×32的块，128×128的块等等，其中，4×4、32×32、128×128指的是像素数量。对于每个编码的块，再到当前帧图像的重构帧图像中与待编码块的周围寻找与其最匹配的块，该最匹配的块相对于待编码块的相对位移，可以认为是块矢量。

本申请实施例中，从当前帧图像中确定出待编码块，该待编码块为当前帧图像中将要压缩的块，即当前帧图像中将要编码的块。该待编码块可以是N×N大小的块。在对待编码块进行编码时，通常需要将其与当前帧图像的重构帧图像中的块进行比对，因此需要对当前帧图像的重构帧图像中需要比对的块进行搜索。

102、从当前帧图像的重构帧图像中确定出需要多次重复读取的第一区域，并将第一区域的图像数据存储在预设存储器中，预设存储器的功耗小于预设功耗阈值。

比如，从当前帧图像的重构帧图像中搜索需要比对的块后，才能将该块与待编码块进行比对。需要说明的是，当对当前帧图像的重构帧图像中的块进行搜索时，需要知道当前帧图像的重构帧图像中的搜索范围(search range,SRng)，即第一区域，当在该第一区域中搜索块时，需要多次重复读取该第一区域的图像数据。因此，本申请实施例中从当前帧图像的重构帧图像中确定出需要多次重复读取的第一区域后，将该第一区域的图像数据存放在预设存储器中，便于后续编码时进行图像数据的读取。另外，该预设存储器的功耗小于预设功耗阈值。通过采用功耗小的预设存储器存取图像数据，可以降低视频编码装置的功耗。

103、从预设存储器中读取第一区域的图像数据。

比如，在将第一区域的图像数据存储在预设存储器后，当对第一区域中的块进行搜索时，需要从预设存储器中读取第一区域的图像数据，以从中找到与待编码块最匹配的块。

104、根据第一区域的图像数据从第一区域中确定出与待编码块相匹配的匹配块。

比如，通过读取预设存储器中存储的第一区域的图像数据，实现对第一区域的搜索，在搜索过程中，将第一区域中每个块分别与当前帧图像中待编码块进行比对，从第一区域中找到与待编码块最匹配的块，该最匹配的块就是匹配块。

随着屏幕内容编码越来越重要，新型视频标准如H.265/HEVC，AV1，通用视频编码(Versatile Video Coding,VVC)等都纳入了屏幕内容编码工具，以实现对屏幕图形常发生的状况进行优化压缩。屏幕内容编码中有一个常见的编码选项是画面内区块复制。该技术以常见的块搜索比对(block matching)算法，实现方式可以跟运动估计(Motion Estimation,ME)一样，可以采用阶层式搜索，也可以是非阶层式搜索(not hierarchical search)，经由搜索以后得到块矢量，以进行后续进一步的压缩编码。

请参阅图6，图6是本申请实施例提供的阶层式搜索的示意图。阶层式搜索就是将要搜索的块与被搜索的区域(如第一区域)都同样缩小同样倍率，例如1/2，1/4或1/8等，在缩小的图像上，先决定将要搜索的块的大致范围后，再回到未缩小的图像进行更精细的块搜索。在阶层式搜索中，每个阶层的缩小倍率可以相同，也可以不同，例如每个阶层的缩小倍率可以是1/2、1/4、1/8和1/16。图6是以3个阶层的搜索作为示例，先搜索1/4缩小的图像，然后，由1/4缩小范围的图像得到块矢量，在1/2缩小的图像范围进行更精细范围更小的搜索，之后，由1/2缩小范围的图像得到的块矢量再搜索原始大小图像的范围，得到最终的块矢量。

请参阅图7，图7是本申请实施例提供的非阶层式搜索的示意图。非阶层式搜索指的是直接在未缩小的图像中进行块比对任务，常见的有全搜索(full search)，n步搜索(n-step search)等方法能在公开的文件上看到。图7是在原始大小的图像上直接进行帧内运动搜索，即在当前帧图像的重构帧图像中逐区块进行帧内运动估计，在帧内搜索区域(search region)中，使用全搜索方式找寻当前块(current block)与重构帧像素(reconstructed frame pixels)中哪一个块有最小的残差。即在对当前帧图像的重构帧图像进行搜索后，对当前帧图像中的当前块进行编码时，将当前帧图像的重构帧图像中与当前块残差最小的块作为匹配块，匹配块即为参考块。

请参阅图8，图8是本申请实施例提供的帧间运动估计与画面内区块复制搜索对象的对比示意图。动作估计是估算编码图像(coding picture)与参考图像(reference picture)间运动参数的一种机制。动作估计一般只在编码方进行，其估算的基本单位为块，由参考图像估算所得块与待编码块之间的残差，然后再进行转换编码处理。画面内区块复制与帧间运动估计的搜索方法可以相同，但对象不同，画面内区块复制搜索的对象是当前帧图像已经编码完成的重建像素，搜寻完之后得到块矢量。但帧间运动估计搜索的是前面不同时间点编码过后的重建像素，即历史帧图像中编码过后的重建像素，或者历史帧图像的重构帧图像中的像素。

需要说明的是，本申请实施例中，将帧内运动矢量称为块矢量。块矢量是编码的对象，在对屏幕内容进行编码时，在画面内区块复制模式下，可以对当前帧图像的重构帧图像进行搜索，搜索出匹配块后，该匹配块与待编码块的相对位移即为块矢量，即图8中预测变量(predictor)与当前帧预测单元(current prediction unit)的相对位移。

可以理解的是，根据块矢量可以确定出匹配块在当前帧图像的重构帧图像中的位置。

105、根据匹配块与待编码块的相对关系，对待编码块进行编码。

比如，根据匹配块与待编码块之间的相对位移和相对误差关系，如将待编码块的二维像素减去匹配块对应位置的二维像素，得到匹配块与待编码块的相对误差关系，可以根据匹配块与待编码块的相对位移关系和相对误差关系对待编码块进行编码。

可以理解的是，在本申请实施例中，视频编码装置可以从当前帧图像中确定出待编码块，从当前帧图像的重构帧图像中确定出需要多次重复读取的第一区域，并将第一区域的图像数据存放在预设存储器中，该预设存储器的能耗小于预设能耗阈值。然后，从预设存储器中读取第一区域的图像数据，根据第一区域的图像数据从第一区域中确定出与待编码块相匹配的匹配块。之后，根据匹配块与待编码块的相对关系，对待编码块进行编码。即，本申请实施例中，通过将第一区域的图像数据存储在能耗较小的预设存储器中，以达到降低视频编码装置功耗的目的。因此，本申请实施例可以降低视频编码装置的功耗。

请参阅图9，图9为本申请实施例提供的在视频编码装置中进行图像处理的方法的另一种流程示意图。该在视频编码装置中进行图像处理的方法可以应用于视频编码装置中。该在视频编码装置中进行图像处理的方法的流程可以包括：

201、从当前帧图像中确定出待编码块行(block line)。

比如，每一帧图像都可以划分为多个块行，每个块行可以划分为多个块。在确定当前帧图像的待编码块之前，需要从当前帧图像中确定出待编码块行。待编码块行指的是待编码块所在的块行。

202、从待编码块行中确定出待编码块。

比如，在确定出待编码块行后，需要从待编码块行中的多个块中确定出待编码块。在该待编码块行中，位于该待编码块之前的块均是已编码块。请参阅图10，图10是本申请实施例提供的在当前帧图像的重构帧图像中进行搜索的场景示意图。图10中，待编码块行中位于待编码块左侧的块为已编码块，位于待编码块行上方的多个块行为已编码块行。

203、从当前帧图像的重构帧图像中确定出需要多次重复读取的第一区域。

比如，当确定出待编码块后，需要从当前帧图像的重构帧图像中确定出需要多次重复读取的第一区域，第一区域可以包括多个块行。其中，每个块行都包括多个块，该多个块排成一行。

204、将第一区域的图像数据分别存储在第一存储器和第二存储器中。

比如，预设存储器包括第一存储器和第二存储器，当从当前帧图像的重构帧图像中确定出需要多次重复读取的第一区域后，将确定出的第一区域的图像数据分别存储在第一存储器和第二存储器中，其中，第二存储器的功耗大于第一存储器的功耗的第一预设倍数，且第一存储器的功耗和第二存储器的功耗的总和小于预设功耗阈值，这样可以降低读写数据时的功耗。其中，预设功耗阈值可以认为是将第一区域的图像数据全部由第二存储器进行读写时的功耗。

比如，第一存储器和第二存储器均为视频编码装置外部的存储器，例如，第一存储器可以包括设置在视频编码装置外部的系统高速缓存或系统缓冲存储器，即第一存储器可以包括设置在视频编码装置外部的Sys$或SysBuf，第二存储器可以包括设置在视频编码装置外部的动态随机存取内存，即第二存储器可以包括设置在设置在视频编码装置外部的DRAM。当然第一存储器还可以是视频编码装置外部的其它低功耗存储器等，本申请实施例以Sys$或SysBuf为例进行说明，Sys$或SysBuf由多个SRAM组成，第二存储器可以为DRAM，DRAM的功耗大于视频编码装置外部的Sys$或SysBuf的功耗的第一预设倍数，且Sys$或SysBuf的功耗与DRAM的功耗的总和小于预设功耗阈值，这样可以降低读写数据时的功耗，该预设功耗阈值可以认为是将第一区域的图像数据全部由DRAM进行读写时的功耗。

请参阅图11，图11是本申请实施例提供的静态随机存取存储器与动态随机存取内存在读取数据时能耗的对比示意图。读取SRAM的数据与读取DRAM的数据所消耗的能量相差约为100倍，即读取SRAM中的数据的功耗远远小于读取DRAM中数据的功耗。通过将多个块行的图像数据分别存放在Sys$或SysBuf，以及DRAM，当读取Sys$或SysBuf中的图像数据时，可以降低读取数据时的功耗。

视频编码装置使用画面内区块搜索的方式，画面内区块复制搜索步骤需要DRAM较大的带宽，因为在搜索过程中会读取当前帧图像的重构帧图像中某些关联的区域(第一区域)来做块搜索比对。因成本考虑，通常不会将搜索范围涵盖到的块行(即第一区域)都完整的存于视频编码装置的内部，通常只会储存搜索范围内所需要的大小，如搜索窗范围内的，来满足画面内区块复制时的高速数据存取要求。

若将第一区域的图像数据都存放在视频编码装置的硬件内部，即缓存(cache)或缓冲(buffer)，cache或buffer包括多个SRAM，则需要将视频编码装置内部的SRAM切分成更多的单元，每个单元就是一个区域(bank)，这样会导致单个bank的面积变大。由于单个bank的面积变大，则SRAM的面积也随之变大，而SRAM的存储容量保持不变，这样造成成本较高。比如，以宽度为8192个像素且垂直搜索范围为-64为例，8位(bit)亮度(luma)部分至少需要512千字节(KB)存储空间，若加上色度(chroma)部分，则需要更大的存储空间。另外，由于使用画面内区块复制算法，需要SRAM切分成更多的单元来满足数据进出需求，造成SRAM的面积变大。

需要说明的是，用搜索窗的形式进行画面内区块复制搜索，处理一个块行的压缩，会需要当前帧图像的重构帧图像中多条块行的数据，这意味着处理一帧数据会需要多帧数据量的读取。

比如，视频编码装置在进行块矢量搜索时，请参见图10，通常因搜索窗内的需求带宽很大，在垂直方向的搜索范围越大，占用的带宽越大。而会让搜索窗的图像数据存储于视频编码装置内部的cache或buffer，该cache或buffer包括切分较细的SRAM群，切分的细代表同存储单位的面积变大，例如1个bit在bank中的平均面积占比就比SRAM中的平均面积占比大，这样可以提供足够的数据带宽给画面内区块复制的块矢量搜索电路。这样不仅造成SRAM面积大，且因为切分成较多bank使得版图绕线较困难，因此不会将整个第一区域的块行都使用这种存储单位(例如1bit)面积高的方法实现。需要说明的是，在进行画面内区块复制搜索时会用到块搜索电路，其可以采用阶层式或非阶层式搜索。

也就是说第一区域涵盖到的块行在每次编码过程中下移一条块行时，第一区域会重新又被抓取一次。通常垂直搜索范围会是待编码块高度的多倍，也就造成了读取第一区域的图像数据的带宽会是多倍于写第一区域的图像数据的带宽。且该情况在要编码的画面到达4K或是8K时更加的严重。4K画面的分辨率为3840×2160像素，4K画面的分辨率为7680×4320像素，4K与8K画面编码时，垂直搜索范围必须要比1080P分辨率大一定程度，否则画面压缩程度会大打折扣。

本申请实施例中，第一区域包括多个块行，204中的将第一区域的图像数据分别存储在第一存储器和第二存储器中，可以包括：

将下一个待编码块行编码时用不到的块行从所述第一存储器中进行移除。比如，若把需要重复读取的当前帧图像的重构帧图像中的块行区域(即第一区域)事先存放在视频编码装置外部的Sys$或SysBuf中，请一并参阅图12至图14，图12是本申请实施例提供的使用系统高速缓存的视频压缩系统的一种架构示意图。图13是本申请实施例提供的使用系统高速缓存的视频压缩系统的另一种架构示意图。图14是本申请实施例提供的使用系统缓冲存储器的视频压缩系统的架构示意图。在Sys$或SysBuf中存储的是第一区域的图像数据，视频编码装置内部的cache或buffer存储的是搜索窗的图像数据。图12至图14中的n为数字，表示存储容量的大小。比如，在一个实施例中，DRAM读写数据的速度为0.5GB/s～2GB/s，Sys$或SysBuf读写数据的速度为3GB/s～8GB/s，cache或buffer读写数据的速度为10GB/s～50GB/s。

需要说明的是，在其他实施例中，DRAM读写数据的速度、Sys$或SysBuf读写数据的速度、cache或buffer读写数据的速度也可以为其他值，但要满足cache或buffer读写数据的速度大于Sys$或SysBuf读写数据的速度以及DRAM读写数据的速度，且Sys$或SysBuf读写数据的速度大于DRAM读写数据的速度。

以图12为例，Sys$可以通过DramC从DRAM中读取数据，且Sys$通过DramC从DRAM读取的数据可以被中央处理器、视频编码装置、显示处理器和神经网络处理器读取。当第一区域下移一个块行时，Sys$和DRAM均存入新的块行，Sys$同时将下一个待编码块行编码时用不到的块行移除出去，即将第一区域最上面一个块行的图像数据从Sys$中移除，当视频编码装置需要进行编码时，可以直接读取Sys$中存储的第一区域的数据，另外，Sys$中还通过DramC从DRAM中读取第一区域的图像数据，之后被视频编码装置读取。

在存储时，视频编码装置外部的Sys$或SysBuf会丢弃下一行待编码块行编码时不会用到的块行，则可以让视频编码装置内部的cache或buffer从DRAM读取第一区域的图像数据的次数从多倍变成1倍，同时由于DRAM比SRAM的存取消耗的能量高100倍，因此这样可以大幅降低功耗。

比如，由于当前帧图像的重构帧图像被读取的位置(即第一区域)与行为(重复读取)是可预测的，且读取当前帧图像的重构帧图像会是读取当前帧图像所需带宽的多倍。若将被读取多次的第一区域的图像数据存于Sys$或SysBuf等低功耗的存储空间，在有效维持视频编码装置运算的同时，还能大大降低整个系统的功耗，从而可以改善使用者体验。可根据视频编码装置压缩的当前帧图像的重构帧图像的结构，决定要存多少当前帧图像的重构帧图像的相关块行到这类低功耗的存储空间。每当要编码的块行下移一行，就移除存储在Sys$或SysBuf中第一区域最上面的一个块行，然后重新读取第一区域中下移时新增的块行，并存储新增块行的图像数据。

请参阅图15，图15是本申请实施例提供的当前帧图像的重构帧图像下移一个块行时的场景示意图。视频编码装置每往下编码一个块行，就驱逐原本存储在Sys$或SysBuf的上方无关的块行，然后把新需要的块行的图像数据送进Sys$或SysBuf。即当搜索范围涵盖到的第一区域能够跟着待编码块下移的时候，将用不到的块行驱逐出Sys$或SysBuf，且将即将用到的块行存放在Sys$或SysBuf中。即，视频编码装置每往下编码一个块行，就将Sys$或SysBuf中存储的第一区域上方无关的块行移除，然后把最新已编码的块行存放在视频编码装置外部的Sys$或SysBuf中。

在另一种实施方式中，第一区域包括多个块行，每个块行包括多个块，204中的将第一区域的图像数据分别存储在第一存储器和第二存储器中，可以包括：

在存储时，当编码完一个块，则将该编码完的块的图像数据存储到视频编码装置外部的Sys$或SysBuf以及DRAM中，同时，视频编码装置外部的Sys$或SysBuf会丢弃下一个待编码块编码时用不到的块，则可以让视频编码装置内部的cache或buffer从DRAM读取第一区域的图像数据的次数从多倍变成1倍，同时由于DRAM比SRAM的存取消耗的能量高100倍，因此这样可以大幅降低功耗。且该情况下，视频编码装置在编码时，是逐块从Sys$或SysBuf中读取数据，而不用等待编码完一个块行再进行读取，因此这样可以提高视频编码装置的整体运行速度。

205、从第一存储器中逐块行读取第一区域的图像数据第一预设次数，从第二存储器中逐块行读取第一区域中未读取块行的图像数据第二预设次数。

比如，当视频编码装置需要进行编码时，可以从第一存储器中逐块行读取第一区域的图像数据，如从Sys$或SysBuf读取第一区域的图像数据。在进行读取时，是逐块行进行读取的，即按照从上向下的顺序进行读取。

以H.265/HEVC为例，假设图15中的编码树单元(Coding Tree Unit,CTU)的大小为16×16像素，即横向16个像素乘以纵向16个像素，当然，编码树单元的大小还可以是32×32像素，64×64像素等，编码树单元是H.265的处理单元。该编码树单元为当前帧图像中的待编码块。此处理单元类似进阶视讯编码(Advanced Video Coding,H.264/AVC)中的宏区块(Macroblock)。垂直搜索范围为-96，当前帧图像编码后的重构帧图像被读取的次数是当前帧图像被读取的次数的7倍，即(96+16)/16＝7。

比如，在对第一区域的图像数据进行读取时，可以将原来全部从第二存储器读取的次数分为从第一存储器读取第一预设次数，从第二存储器读取第二预设次数，第一预设次数与第二预设次数的总和为原来全部从第二存储器读取的次数。需要说明的是，第一存储器和第二存储器中在读取时不分先后顺序，只要从第一存储器中读取的次数达到第一预设次数，从第二存储器中读取的次数达到第二预设次数即可。

比如，原来全部从第二存储器读取的次数为7次，当将第一预设次数设置为6次时，则将第二预设次数设置为1次。如在满足Sys$或SysBuf最低需求量的条件下，将对DRAM读取的7份数据量拆解成1次从DRAM读取与6次从Sys$或SysBuf读取。在Sys$或SysBuf的辅助下读取数据的功耗降低到没有辅助时的14.96％，即(1×640+6×5)/(7×640)＝14.96％，该情况下的功耗较低。比如，还可以根据具体的需求，将对DRAM读取的7份数据量拆解成2次从DRAM读取与5次从Sys$或SysBuf读取，等等，当对功耗要求苛刻的条件下，还可以将对DRAM读取的7份数据量全部从Sys$或SysBuf读取，此时功耗最低，但成本会上升。

由于SRAM成本较高，DRAM成本较低，在考虑成本的情况下，SRAM一般不会做的太大，而DRAM可以做的比较大，因此本申请实施例为了降低读取数据时的功耗，可以将原来从DRAM读取的次数，拆分成几次从SRAM读取，另外几次从DRAM读取，从整体上可以降低读取数据的功耗。而且从SRAM读取的次数与从DRAM读取的次数是可以调整的，以适应对不同功耗的需求。

比如，在读取第一区域的图像数据时，可以先从Sys$或SysBuf中读取，当读取的次数达到第一预设次数时，则切换到从DRAM中读取第一区域中未读取块行的图像数据。再比如，在读取第一区域的图像数据时，可以先从DRAM中读取，当读取的次数达到第二预设次数时，则切换到从Sys$或SysBuf中读取第一区域中未读取块行的图像数据。当读取同样的图像数据时，DRAM消耗的能量大于SRAM消耗的能量的100倍。因此，通过将第一区域中图像数据的一部分从Sys$或SysBuf中读取，另一部分数据从DRAM中读取，可以降低读取数据的功耗。

请参阅图16，图16是本申请实施例提供的从多通道DRAM读取数据时的功耗曲线示意图。图16中，横坐标是当前帧图像的重构帧图像的位置，比如，图像的顶端位置，图像的中间位置，图像的底端位置，纵坐标是视频编码时读写数据的功耗。在视频编码装置过度依赖DRAM或其它便宜但耗电的存储以及高带宽的情况下，因视频压缩系统提供的功耗上限是有限的，会使视频编码装置无法满足速度要求，或者会使视频压缩系统过热。如果考虑功耗上限，则读取数据的速度受限，不能达到未考虑功耗上限时的读取速度。

请参阅图17，图17是本申请实施例提供的分别从Sys$或SysBuf以及DRAM读写数据时的功耗曲线示意图。视频编码装置将大量的DRAM功耗改由Sys$或SysBuf的功耗来取代，大大降低功耗。

206、从读取的第一区域的图像数据中确定出搜索窗的图像数据，搜索窗位于第一区域内，待编码块的左侧与搜索窗的最下面一个块行的右侧相邻。

比如，第一区域中的搜索窗是被搜索的范围，从该搜索窗中可以搜索出匹配块。为了进一步缩小搜索范围，可以从第一区域中确定出搜索窗，这样就可以将搜索范围缩小，从而可以进一步降低功耗。对于画面内区块复制模式，采用非阶层式搜索时为非缩小当前帧图像的重构帧图像，采用阶层式搜索时为缩小或非缩小的当前帧图像的重构帧图像，只要是可以预测垂直方向位置的搜索窗都可以适用。

请参阅图18，图18是本申请实施例提供的当前帧图像的重构帧图像中搜索窗的搜索范围的场景示意图。从图18中可以看出搜索窗位于第一区域内，第一区域中相邻虚线之间的区域即为块行，待编码块的左侧与搜索窗的最下面一个块行的右侧相邻，搜索的块矢量可以指向搜索窗内的任何地方。其中， L、R和H分别为搜索窗的左侧搜索范围、右侧搜索范围和垂直搜索范围(Vertical SRng)，R为正数，L和H为负数，且L不一定等于R。

207、将搜索窗的图像数据存储在第三存储器中，第三存储器的读写速度大于第一存储器的读写速度的第二预设倍数。

比如，当确定出搜索窗的图像数据后，将搜索窗的图像数据存储在第三存储器中，该第三存储器可以是视频编码装置内部的存储器，第三存储器可以包括设置在视频编码装置内部的缓存或缓冲。由于进行画面内区块复制时，是对搜索窗范围内的块进行搜索，进行块搜索时对带宽的需求较高，因此第三存储器的读写速度均大于第一存储器的读写速度以及第二存储器的读写速度。以满足搜索速度和高带宽的需求。其中，第三存储器的读写速度大于第一存储器的读写速度的第二预设倍数。

208、从第三存储器中读取搜索窗的图像数据，并根据搜索窗的图像数据，从搜索窗中确定出与待编码块的编码代价最小的块。

比如，在进行搜索时，从第三存储器中读取搜索窗的图像数据，可以采用阶层式或非阶层式方式进行搜索，根据搜索窗的图像数据，将读取的搜索窗中的块与待编码块进行比对，可以确定出读取的搜索窗中的块与待编码块的编码代价最小的块。比如，在一种实施方式中，编码代价可以包括残差，比如，在另外一种实施方式中，编码代价可以包括块矢量和残差，等等。可知，编码代价最小的块可以是与待编码块的残差最小的块，还可以是综合考虑与待编码块的块矢量和残差后编码代价最小的块。

例如，对于画面内区块复制，在搜索窗中逐块行扫描，将搜索的块与待编码块进行比对，从而可以从搜索窗中找到与待编码块的残差最小的块。其中，块矢量可以是搜索的块与待编码块的相对位移。残差可以是待编码块的二维像素减去搜索的块对应位置的二维像素后得到的差值。

比如，在一种实施方式中，208中的从第三存储器中读取搜索窗的图像数据，并根据搜索窗的图像数据，从搜索窗中确定出与待编码块的编码代价最小的块，可以包括：

从所述第三存储器中读取所述搜索窗的图像数据；

比如，在进行搜索时，可以采用阶层式搜索方式，根据阶层数的不同，搜索的层级也不同。比如，若采用2个阶层的搜索，则进行2个层级的搜索，若采用采用3个阶层的搜索，则进行3个层级的搜索。当然，阶层数越多，则搜索的结果越准确，但同时也会增加系统计算资源的消耗。在实际应用中，可以根据具体需求设置合适的阶层数。需要说明的是，每个阶层的缩小倍率可以相同，也可以不同。

例如，从第三存储器中读取搜索窗的图像数据后，将搜索窗按照预设阶层数进行缩小，如按照2个阶层数将搜索窗进行缩小，得到缩小后的搜索窗，该缩小后的搜索窗为原来搜索窗大小的1/2。然后，根据该缩小后的搜索窗的图像数据，从该缩小后的搜索窗中确定出与待编码块的编码代价最小的缩小后的块，该缩小后的块与缩小后的搜索窗的缩小倍率是相同的。在缩小的搜索窗的图像上，先决定将要搜索的缩小的块的大致范围后，再回到未缩小的搜索窗的图像进行更精细的块搜索，即根据该缩小的块在缩小后的搜索窗中的大致范围，对原始搜索窗进行更精细的搜索，可以从未缩小的搜索窗中确定出与待编码块的编码代价最小的块。

再例如，从第三存储器中读取搜索窗的图像数据后，将搜索窗按照预设阶层数进行缩小，如按照3个阶层数将搜索窗进行缩小，得到缩小后的搜索窗，该缩小后的搜索窗为原来搜索窗大小的1/4。然后，根据该1/4缩小范围的搜索窗的图像数据，从该1/4缩小范围的搜索窗中确定出与待编码块的编码代价最小的缩小后的块，得到该1/4缩小范围的搜索窗下对应的块矢量。之后，在1/2缩小范围的搜索窗进行更精细范围更小的搜索，最后，根据1/2缩小范围的搜索窗得到的块矢量再搜索原始大小的搜索窗的范围，得到最终的块矢量，从而可以确定出与待编码块的编码代价最小的块。

又如，从第三存储器中读取搜索窗的图像数据后，将搜索窗按照预设阶层数进行缩小，如按照3个阶层数将搜索窗进行缩小，得到缩小后的搜索窗，该缩小后的搜索窗为原来搜索窗大小的1/6。然后，根据该1/6缩小范围的搜索窗的图像数据，从该1/6缩小范围的搜索窗中确定出与待编码块的编码代价最小的缩小后的块，得到该1/6缩小范围的搜索窗下对应的块矢量。之后，在1/3缩小范围的搜索窗进行更精细范围更小的搜索，最后，根据1/3缩小范围的搜索窗得到的块矢量再搜索原始大小的搜索窗的范围，得到最终的块矢量，从而可以确定出与待编码块的编码代价最小的块。

由此可知，在缩小的搜索窗的图像上，先决定将要搜索的缩小的块的大致范围后，再回到未缩小的搜索窗的图像进行更精细的块搜索，即根据该缩小的块在缩小后的搜索窗中的大致范围，对原始搜索窗进行更精细的搜索，可以从未缩小的搜索窗中确定出与待编码块的编码代价最小的块。

209、将与待编码块的编码代价最小的块作为匹配块。

比如，当从搜索窗中找到与待编码块的编码代价最小的块后，将该与待编码块之间编码代价最小的块作为匹配块。

210、根据匹配块与待编码块的块矢量和残差，对待编码块进行编码。

比如，匹配块与待编码块的相对关系可以是块矢量和残差，在找到匹配块后，可以根据匹配块与待编码块的块矢量和残差，对待编码块进行编码。

在一种实施方式中，210中的根据匹配块与待编码块的块矢量和残差，对待编码块进行编码，可以包括：

将所述匹配块与所述待编码块的残差进行正向变换和量化(Forward Transform&Quantization,FTQ)；

将所述匹配块与所述待编码块的块矢量以及正向变换和量化后的第一残差数据进行熵编码(Entropy Coding,EC)得到视频流编码数据；或者

将所述正向变换和量化后的第一残差数据进行反向量化与变换(De-Quantization&Inv.Transform,DQIT)，得到第二残差数据；

根据所述第二残差数据对所述待编码块进行重构。

请参阅图19，图19是本申请实施例提供的视频编码装置编码的场景示意图。从图19中可以看出画面内区块复制位于视频编码装置中与其它模块之间的数据流关系，画面内区块复制会将当前帧图像中待编码块与当前帧图像的重构帧图像的块做相似度比对。

比如，请参阅图19，画面内区块复制(可以采用阶层式搜索或非阶层式搜索)对当前帧图像的重构帧图像进行搜索，会搜到到匹配块，匹配块与当前块(即待编码块)的相对位移即是块矢量，根据当前块与匹配块的误差得到残差。将残差进行正向变换与量化，其中，正向变换采用快速傅氏变换(Fast Fourier Transformation,FFT)变换得到频谱，频谱曲线上横坐标为频率，纵坐标为能量，经过正向变换，将空间中的像素转换成不相关而且能量集中的频谱系数，正向变换后的数据只是转换到频域，数据量并没有变化，其可以减少失真。正向变换后的矩阵除以量化矩阵中对应位置的值，即可实现量化。频谱系数再用量化与熵编码进一步压缩，得到压缩的视频流。在进行熵编码时，是对块矢量和量化后的第一残差数据进行熵编码。其中，量化过程去掉了一些不重要的高频信息，这样可以压缩图像数据量，所以量化才是压缩的关键。经过正向变换和量化后得到第一残差数据。

将经过正向变换和量化后得到第一残差数据经过反向量化与变换到空域，即得到匹配块与待编码块的第二残差数据，将当前帧图像的待编码块经过画面块区域重构(Block Reconstruction，BlkRec)，作为下一个待编码块的邻居。环路内滤波器(In-loop Filter，InF)用于处理块之间的连续性问题，使图像更加平滑。常用的环路滤波器是一个线性低通滤波器，可以滤除高频分量和噪声。用正向变换与量化可以消除视频图像空间上的冗余，用熵编码可以消除编码冗余。

可以理解的是，本申请实施例基于屏幕内容编码时可预测数据存取行为(即多次重复读取的行为)，从而实现有效率的选择数据存储方式，可以降低视频编码装置的功耗。可以根据编码时帧参考读取策略改变将要读取的数据(如当前帧图像的重构帧图像中已滤波的第一区域)是否该先存储到低功耗的Sys$或SysBuf，使存入Sys$或SysBuf的部分或全部当前帧图像的重构帧图像重复读取的次数最高，以最大程度降低功耗，保证视频编码装置进出数据时能一直维持在最低功耗状态。若该Sys$或SysBuf同时具有高速带宽，由于该Sys$或SysBuf可以满足重复读取数据时所需带宽，这样可以进一步降低DRAM的带宽。

本申请实施例可以保证视频编码装置处理功耗可控，且能让视频编码装置的硬件或软件尽快完成编码工作，充分利用视频编码装置会有多次重复读取第一区域的图像数据的可预期行为来改变所读取数据的存储特性，因为存取数据省电，而使视频编码装置可以维持运行速度，同时又降低功耗。读取数据的速度不会受功耗的限制，因此视频编码装置不会过热，不会触发降频。另外，Sys$或SysBuf中SRAM在读写时本身的时延就低，这样可以提高处理帧率，降低反应时延。由于可以大幅降低功耗，则可以提高视频编码装置中电池的使用时间，提升用户体验。

可以理解的是，本申请实施例可以根据屏幕分享与录制需求等视频相关的屏幕内容，以及低散热成本需求和可预测行为造成的较大功耗，可以选择数据读取的目标位置或属性。比如，将需要重复读取的数据分别从Sys$或SysBuf，以及DRAM进行读取，而不是全部都是从DRAM读取，由于读取相同的数据，SRAM的功耗远远小于DRAM的功耗，因此本申请实施例可以大大降低读取数据时的功耗。

本申请实施例以屏幕内容编码为示例详细说明了如何降低读取数据的功耗。在其它实施方式中，还可以适用所有需要高带宽但存取数据行为可预测的模块与应用，如视频译码器，帧频提升(frame rate up conversion)装置等。这些模块与应用的行为通常是可以预测的，如重复读取的次数，通过这些可以预测的行为，可以预先分配相应的存储特性，即将重复读取的数据存放在低功耗的存储器中，例如根据全部帧或部分帧的图像数据的存取次数需求，来对应不同等级存储目标的能量消耗，即根据全部帧或部分帧图像数据的存取次数需求，来选择对应不同等级的能量消耗，当能量消耗不同时，就可以合理分配从Sys$或SysBuf以及DRAM读取数据的次数。如，视频译码器事先解析码流也可以确定存取数据的行为，帧频提升装置可以通过简单分析得知哪些区域在处理时会被用到多次，等等。因此视频译码器、帧频提升装置的行为是可预期的。

本申请实施例还可以适用于固定的人工智能(Artificial Intelligence，AI)网络行为，AI网络行为重复读取的部分是特征图(feature map)部分，该AI网络行是可预期的。

请参阅图20，图20为本申请实施例提供的在视频编码装置中进行图像处理的装置的结构示意图。该在视频编码装置中进行图像处理的装置400可以包括：第一确定模块401，第二确定模块402，读取模块403，第三确定模块404，编码模块405。

第一确定模块401，用于从当前帧图像中确定出待编码块；

第二确定模块402，用于从当前帧图像的重构帧图像中确定出需要多次重复读取的第一区域，并将所述第一区域的图像数据存放在预设存储器中，所述预设存储器的功耗小于预设功耗阈值；

读取模块403，用于从所述预设存储器中读取所述第一区域的图像数据；

第三确定模块404，用于根据所述第一区域的图像数据从所述第一区域中确定出与所述待编码块相匹配的匹配块；

编码模块405，用于根据所述匹配块与所述待编码块的相对关系，对所述待编码块进行编码。

在一种实施方式中，所述第一确定模块401还可以用于：

从所述当前帧图像中确定出待编码块行；

从所述待编码块行中确定出所述待编码块。

在一种实施方式中，所述预设存储器包括第一存储器和第二存储器，所述第二存储器的功耗大于所述第一存储器的功耗的第一预设倍数，所述第二确定模块402可以用于：

在一种实施方式中，所述第一区域包括多个块行，所述第二确定模块402可以用于：

在一种实施方式中，所述第一区域包括多个块行，每个所述块行包括多个块，所述第二确定模块402可以用于：

在一种实施方式中，所述读取模块403可以用于：

在一种实施方式中，所述第三确定模块404可以用于：

将与所述待编码块的编码代价最小的块作为所述匹配块。

在一种实施方式中，所述第三确定模块404可以用于：

从所述第三存储器中读取所述搜索窗的图像数据；

在一种实施方式中，所述相对关系为块矢量和残差，所述块矢量为所述匹配块与所述待编码块的相对位移，所述编码模块405可以用于：

在一种实施方式中，所述编码模块405可以用于：

将所述匹配块与所述待编码块之间的残差进行正向变换和量化；

根据所述第二残差数据对所述待编码块进行重构。

在一种实施方式中，所述第一存储器包括设置在视频编码装置外部的系统高速缓存或系统缓冲存储器，所述第二存储器包括设置在视频编码装置外部的动态随机存取内存。

在一种实施方式中，所述第三存储器包括设置在视频编码装置内部的缓存或缓冲。

本申请实施例提供一种计算机可读的存储介质，其上存储有计算机程序，当所述计算机程序在计算机上执行时，使得所述计算机执行如本实施例提供的在视频编码装置中进行图像处理的方法中的流程。

本申请实施例还提供一种电子设备，包括存储器，处理器以及视频编码装置，所述处理器通过调用所述存储器中存储的计算机程序，用于执行本实施例提供的在视频编码装置中进行图像处理的方法中的流程。

例如，上述电子设备可以是诸如平板电脑或者智能手机等移动终端。请参阅图21，图21为本申请实施例提供的电子设备的结构示意图。

该电子设备500可以包括视频编码装置501、存储器502、处理器503等部件。本领域技术人员可以理解，图21中示出的电子设备结构并不构成对电子设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

视频编码装置501可以用于对屏幕内容进行编码，以对视频图像的屏幕内容进行压缩。

存储器502可用于存储应用程序和数据。存储器502存储的应用程序中包含有可执行代码。应用程序可以组成各种功能模块。处理器503通过运行存储在存储器502的应用程序，从而执行各种功能应用以及数据处理。

处理器503是电子设备的控制中心，利用各种接口和线路连接整个电子设备的各个部分，通过运行或执行存储在存储器502内的应用程序，以及调用存储在存储器502内的数据，执行电子设备的各种功能和处理数据，从而对电子设备进行整体监控。

在本实施例中，电子设备中的处理器503会按照如下的指令，将一个或一个以上的应用程序的进程对应的可执行代码加载到存储器502中，并由处理器503来运行存储在存储器502中的应用程序，从而执行：

从当前帧图像中确定出待编码块；

从当前帧图像的重构帧图像中确定出需要多次重复读取的第一区域，并将所述第一区域的图像数据存放在预设存储器中，所述预设存储器的功耗小于预设功耗阈值；

从所述预设存储器中读取所述第一区域的图像数据；

请参阅图22，电子设备500可以包括视频编码装置501、存储器502、处理器503、电池504、输入单元505、输出单元506等部件。

电池504可用于为电子设备的各个部件提供电力支持，从而保障各个部件的正常运行。

输入单元505可用于接收视频图像的输入视频流，例如可以用于接收需要进行视频压缩的视频流。

输出单元506可以用于用于输出已压缩的视频流。

从当前帧图像中确定出待编码块；

从所述预设存储器中读取所述第一区域的图像数据；

在一种实施方式中，所述处理器503执行所述从当前帧图像中确定出待编码块时，还可以执行：从所述当前帧图像中确定出待编码块行；从所述待编码块行中确定出所述待编码块。

在一种实施方式中，所述预设存储器包括第一存储器和第二存储器，所述第二存储器的功耗大于所述第一存储器的功耗的第一预设倍数，所述处理器503执行所述从所述当前帧图像的重构帧图像中确定出需要多次重复读取的第一区域，并将所述第一区域的图像数据存储在预设存储器中时，还可以执行：从所述当前帧图像的重构帧图像中确定出需要多次重复读取的第一区域；将所述第一区域的图像数据分别存储在所述第一存储器和第二存储器中。

在一种实施方式中，所述第一区域包括多个块行，所述处理器503执行所述将所述第一区域的图像数据分别存储在所述第一存储器和第二存储器中时，还可以执行：若所述第一区域下移一个块行，则将下移块行的图像数据分别存储在所述第一存储器和第二存储器中；将下一个待编码块行编码时用不到的块行从所述第一存储器中进行移除。

在一种实施方式中，所述第一区域包括多个块行，每个所述块行包括多个块，所述处理器503执行所述将所述第一区域的图像数据分别存储在所述第一存储器和第二存储器中时，还可以执行：若所述第一区域的最下面一个块行中新增一个块，则将新增块的图像数据分别存储在所述第一存储器和第二存储器中；将下一个待编码块编码时用不到的块从所述第一存储器中进行移除。

在一种实施方式中，所述处理器503执行所述从所述预设存储器中读取所述第一区域的图像数据时，还可以执行：从所述第一存储器中逐块行读取所述第一区域的图像数据第一预设次数，从所述第二存储器中逐块行读取第一区域中未读取块行的图像数据第二预设次数。

在一种实施方式中，所述处理器503执行所述根据所述第一区域的图像数据从所述第一区域中确定出与所述待编码块相匹配的匹配块时，还可以执行：从读取的所述第一区域的图像数据中确定出搜索窗的图像数据，所述搜索窗位于所述第一区域内，所述待编码块的左侧与所述搜索窗的最下面一个块行的右侧相邻；将所述搜索窗的图像数据存储在第三存储器中，所述第三存储器的读写速度大于所述第一存储器的读写速度的第二预设倍数；从所述第三存储器中读取所述搜索窗的图像数据，并根据所述搜索窗的图像数据，从所述搜索窗中确定出与所述待编码块的编码代价最小的块；将与所述待编码块的编码代价最小的块作为所述匹配块。

在一种实施方式中，所述所述处理器503执行所述从所述第三存储器中读取所述搜索窗的图像数据，并根据所述搜索窗的图像数据，从所述搜索窗中确定出与所述待编码块的编码代价最小的块时，还可以执行：从所述第三存储器中读取所述搜索窗的图像数据；将所述搜索窗按照预设阶层数进行缩小，得到缩小后的搜索窗；根据所述缩小后的搜索窗的图像数据，从所述缩小后的搜索窗中确定出与所述待编码块的编码代价最小的缩小后的块；根据所述缩小后的块在所述缩小后的搜索窗中的位置，从所述搜索窗中确定出与所述待编码块的编码代价最小的块。

在一种实施方式中，所述相对关系为块矢量和残差，所述块矢量为所述匹配块与所述待编码块的相对位移，所述处理器503执行所述根据所述匹配块与所述待编码块的相对关系，对所述待编码块进行编码时，还可以执行：根据所述匹配块与所述待编码块的块矢量和残差，对所述待编码块进行编码。

在一种实施方式中，所述处理器503执行所述根据所述匹配块与所述待编码块的块矢量和残差，对所述待编码块进行编码时，还可以执行：将所述匹配块与所述待编码块的残差进行正向变换和量化；将所述匹配块与所述待编码块的块矢量以及正向变换和量化后的第一残差数据进行熵编码，得到视频流编码数据；或者将所述正向变换和量化后的第一残差数据进行反向量化与变换，得到第二残差数据；根据所述第二残差数据对所述待编码块进行重构。

本申请实施例还提供一种图像处理系统，请参阅图23和图24，图23是本申请实施例提供的图像处理系统的结构示意图。图24是本申请实施例提供的图像处理系统的另一结构示意图。该图像处理系统600包括视频编码装置601、第一存储器602和第二存储器603，其中，第二存储器603的功耗大于第一存储器602的功耗的第一预设倍数，视频编码装置601可以包括第三存储器，第三存储器的读取速度大于第一存储器的读取速度的第二预设倍数，第一存储器602和第二存储器603分别存储当前帧图像的重构帧图像中需要多次重复读取的图像数据，视频编码装置601在进行编码时，按照第一预设次数从第一存储器602以及按照第二预设次数从第二存储器603读取需要多次重复读取的图像数据，即在读取需要多次重复读取的图像数据时，可以分成从第一存储器602中读取第一预设次数，从第二存储器603中读取第二预设次数。然后，可以从需要多次重复读取的图像数据中确定出搜索窗内的图像数据，将搜索窗内的图像数据存储在第三存储器中。

比如，在从当前帧图像的重构帧图像中确定出需要多次重复读取的第一区域后，可以将从当前帧图像的重构帧图像中确定出的需要多次重复读取的第一区域的图像数据分别存储在第一存储器602和第二存储器603。因此，第一存储器602和第二存储器603中分别存储从当前帧图像的重构帧图像中确定出的需要多次重复读取的第一区域的图像数据。

在编码过程中，若第一区域下移一个块行，则将下移块行的图像数据分别存储在第一存储器602和第二存储器603中，并将下一个待编码块行编码时用不到的块行从第一存储器602中进行移除，在读取数据时，可以从第一存储器602中逐块行读取第一区域的图像数据第一预设次数，从第二存储器603中逐块行读取第一区域中未读取块行的图像数据第二预设次数。

需要说明的是，当从第二存储器603读取图像数据时，视频编码装置601可以直接从第二存储器603读取图像数据，或者是由第一存储器602从第二存储器603读取图像数据后进行存储，该部分图像数据由视频编码装置601直接从第一存储器602中读取。

视频编码装置601可以从第三存储器读取搜索窗内的图像数据，根据从第三存储器中读取的搜索窗内的图像数据，从搜索窗中确定出与待编码模块相匹配的匹配块，并根据匹配块与待编码块的块矢量和残差进行编码。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见上文针对在视频编码装置中进行图像处理的方法的详细描述，此处不再赘述。

本申请实施例提供的所述在视频编码装置中进行图像处理的装置与上文实施例中的在视频编码装置中进行图像处理的方法属于同一构思，在所述在视频编码装置中进行图像处理的装置上可以运行所述在视频编码装置中进行图像处理的方法实施例中提供的任一方法，其具体实现过程详见所述在视频编码装置中进行图像处理的方法实施例，此处不再赘述。

需要说明的是，对本申请实施例所述在视频编码装置中进行图像处理的方法而言，本领域普通技术人员可以理解实现本申请实施例所述在视频编码装置中进行图像处理的方法的全部或部分流程，是可以通过计算机程序来控制相关的硬件来完成，所述计算机程序可存储于一计算机可读取存储介质中，如存储在存储器中，并被至少一个处理器执行，在执行过程中可包括如所述在视频编码装置中进行图像处理的方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储器(ROM，Read Only Memory)、随机存取记忆体(RAM，Random Access Memory)等。

对本申请实施例的所述在视频编码装置中进行图像处理的装置而言，其各功能模块可以集成在一个处理芯片中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中，所述存储介质譬如为只读存储器，磁盘或光盘等。

以上对本申请实施例所提供的一种在视频编码装置中进行图像处理的方法、装置、存储介质、电子设备及系统进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

一种在视频编码装置中进行图像处理的方法，其中，所述方法包括：

从当前帧图像中确定出待编码块；

从所述当前帧图像的重构帧图像中确定出需要多次重复读取的第一区域，并将所述第一区域的图像数据存储在预设存储器中，所述预设存储器的功耗小于预设功耗阈值；

从所述预设存储器中读取所述第一区域的图像数据；

根据所述第一区域的图像数据从所述第一区域中确定出与所述待编码块相匹配的匹配块；

根据所述匹配块与所述待编码块的相对关系，对所述待编码块进行编码。
根据权利要求1所述的在视频编码装置中进行图像处理的方法，其中，所述从当前帧图像中确定出待编码块，包括：

从所述当前帧图像中确定出待编码块行；

从所述待编码块行中确定出所述待编码块。
根据权利要求2所述的在视频编码装置中进行图像处理的方法，其中，所述预设存储器包括第一存储器和第二存储器，所述第二存储器的功耗大于所述第一存储器的功耗的第一预设倍数，所述从所述当前帧图像的重构帧图像中确定出需要多次重复读取的第一区域，并将所述第一区域的图像数据存储在预设存储器中，包括：

从所述当前帧图像的重构帧图像中确定出需要多次重复读取的第一区域；

将所述第一区域的图像数据分别存储在所述第一存储器和第二存储器中。
根据权利要求3所述的在视频编码装置中进行图像处理的方法，其中，所述第一区域包括多个块行，所述将所述第一区域的图像数据分别存储在所述第一存储器和第二存储器中，包括：

若所述第一区域下移一个块行，则将下移块行的图像数据分别存储在所述第一存储器和第二存储器中；

将下一个待编码块行编码时用不到的块行从所述第一存储器中进行移除。
根据权利要求3所述的在视频编码装置中进行图像处理的方法，其中，所述第一区域包括多个块行，每个所述块行包括多个块，所述将所述第一区域的图像数据分别存储在所述第一存储器和第二存储器中，包括：

若所述第一区域的最下面一个块行中新增一个块，则将新增块的图像数据分别存储在所述第一存储器和第二存储器中；

将下一个待编码块编码时用不到的块从所述第一存储器中进行移除。
根据权利要求4或5所述的在视频编码装置中进行图像处理的方法，其中，所述从所述预设存储器中读取所述第一区域的图像数据，包括：

从所述第一存储器中逐块行读取所述第一区域的图像数据第一预设次数，从所述第二存储器中逐块行读取第一区域中未读取块行的图像数据第二预设次数。
根据权利要求6所述的在视频编码装置中进行图像处理的方法，其中，所述根据所述第一区域的图像数据从所述第一区域中确定出与所述待编码块相匹配的匹配块，包括：

从读取的所述第一区域的图像数据中确定出搜索窗的图像数据，所述搜索窗位于所述第一区域内，所述待编码块的左侧与所述搜索窗的最下面一个块行的右侧相邻；

将所述搜索窗的图像数据存储在第三存储器中，所述第三存储器的读写速度大于所述第一存储器的读写速度的第二预设倍数；

从所述第三存储器中读取所述搜索窗的图像数据，并根据所述搜索窗的图像数据，从所述搜索窗中确定出与所述待编码块的编码代价最小的块；

将与所述待编码块的编码代价最小的块作为所述匹配块。
根据权利要求7所述的在视频编码装置中进行图像处理的方法，其中，所述从所述第三存储器中读取所述搜索窗的图像数据，并根据所述搜索窗的图像数据，从所述搜索窗中确定出与所述待编码块的编码代价最小的块，包括：

从所述第三存储器中读取所述搜索窗的图像数据；

将所述搜索窗按照预设阶层数进行缩小，得到缩小后的搜索窗；

根据所述缩小后的搜索窗的图像数据，从所述缩小后的搜索窗中确定出与所述待编码块的编码代价最小的缩小后的块；

根据所述缩小后的块在所述缩小后的搜索窗中的位置，从所述搜索窗中确定出与所述待编码块的编码代价最小的块。
根据权利要求7所述的在视频编码装置中进行图像处理的方法，其中，所述相对关系为块矢量和残差，所述块矢量为所述匹配块与所述待编码块的相对位移，所述根据所述匹配块与所述待编码块的相对关系，对所述待编码块进行编码，包括：

根据所述匹配块与所述待编码块的块矢量和残差，对所述待编码块进行编码。
根据权利要求9所述的在视频编码装置中进行图像处理的方法，其中，所述根据所述匹配块与所述待编码块的块矢量和残差，对所述待编码块进行编码，包括：

将所述匹配块与所述待编码块的残差进行正向变换和量化；

将所述匹配块与所述待编码块的块矢量以及正向变换和量化后的第一残差数据进行熵编码，得到视频流编码数据；或者

将所述正向变换和量化后的第一残差数据进行反向量化与变换，得到第二残差数据；

根据所述第二残差数据对所述待编码块进行重构。
根据权利要求3所述的在视频编码装置中进行图像处理的方法，其中，所述第一存储器包括设置在视频编码装置外部的系统高速缓存或系统缓冲存储器，所述第二存储器包括设置在视频编码装置外部的动态随机存取内存。
根据权利要求7所述的在视频编码装置中进行图像处理的方法，其中，所述第三存储器包括设置在视频编码装置内部的缓存或缓冲。
一种在视频编码装置中进行图像处理的装置，其中，所述装置包括：

第一确定模块，用于从当前帧图像中确定出待编码块；

第二确定模块，用于从所述当前帧图像的重构帧图像中确定出需要多次重复读取的第一区域，并将所述第一区域的图像数据存储在预设存储器中，所述预设存储器的功耗小于预设功耗阈值；

读取模块，用于从所述预设存储器中读取所述第一区域的图像数据；

第三确定模块，用于根据所述第一区域的图像数据从所述第一区域中确定出与所述待编码块相匹配的匹配块；

编码模块，用于根据所述匹配块与所述待编码块的相对关系，对所述待编码块进行编码。
根据权利要求13所述的在视频编码装置中进行图像处理的装置，其中，所述第一确定模块还用于：

从所述当前帧图像中确定出待编码块行；

从所述待编码块行中确定出所述待编码块。
根据权利要求13所述的在视频编码装置中进行图像处理的装置，其中，所述预设存储器包括第一存储器和第二存储器，所述第二存储器的功耗大于所述第一存储器的功耗的第一预设倍数；所述第二确定模块用于：从所述当前帧图像的重构帧图像中确定出需要多次重复读取的第一区域；将所述第一区域的图像数据分别存储在所述第一存储器和第二存储器中；

或者所述第一区域包括多个块行，所述第二确定模块用于：

若所述第一区域下移一个块行，则将下移块行的图像数据分别存储在所述第一存储器和第二存储器中；将下一个待编码块行编码时用不到的块行从所述第一存储器中进行移除；

或者所述第一区域包括多个块行，每个所述块行包括多个块，所述第二确定模块402用于：

若所述第一区域的最下面一个块行中新增一个块，则将新增块的图像数据分别存储在所述第一存储器和第二存储器中；将下一个待编码块编码时用不到的块从所述第一存储器中进行移除。
根据权利要求13所述的在视频编码装置中进行图像处理的装置，其中，所述第三确定模块用于：从读取的所述第一区域的图像数据中确定出搜索窗的图像数据，所述搜索窗位于所述第一区域内，所述待编码块的左侧与所述搜索窗的最下面一个块行的右侧相邻；将所述搜索窗的图像数据存储在第三存储器中，所述第三存储器的读写速度大于所述第一存储器的读写速度的第二预设倍数；从所述第三存储器中读取所述搜索窗的图像数据，并根据所述搜索窗的图像数据，从所述搜索窗中确定出与所述待编码块的编码代价最小的块；将与所述待编码块的编码代价最小的块作为所述匹配块。

或者所述第三确定模块404用于：

从所述第三存储器中读取所述搜索窗的图像数据；将所述搜索窗按照预设阶层数进行缩小，得到缩小后的搜索窗；根据所述缩小后的搜索窗的图像数据，从所述缩小后的搜索窗中确定出与所述待编码块的编码代价最小的缩小后的块；根据所述缩小后的块在所述缩小后的搜索窗中的位置，从所述搜索窗中确定出与所述待编码块的编码代价最小的块。
一种计算机可读的存储介质，其上存储有计算机程序，其中，当所述计算机程序在计算机上执行时，使得所述计算机执行如权利要求1至12中任一项所述的方法。
一种电子设备，包括存储器，处理器以及视频编码装置，其中，所述处理器通过调用所述存储器中存储的计算机程序，以执行如权利要求1至12中任一项所述的方法。
一种图像处理系统，其中，包括视频编码装置、第一存储器和第二存储器，所述第二存储器的功耗大于所述第一存储器的功耗的第一预设倍数，所述视频编码装置包括第三存储器，所述第三存储器的读取速度大于所述第一存储器的读取速度的第二预设倍数，所述第一存储器和第二存储器分别存储当前帧图像的重构帧图像中需要多次重复读取的图像数据，所述视频编码装置在编码时，按照第一预设次数从所述第一存储器以及按照第二预设次数从所述第二存储器读取所述需要多次重复读取的图像数据，并从所述需要多次重复读取的图像数据中确定出搜索窗内的图像数据，将所述搜索窗内的图像数据存储在所述第三存储器中，所述视频编码装置从所述第三存储器中读取所述搜索窗内的图像数据，并确定出与待编码块相匹配的匹配块，根据所述匹配块与待编码块的块矢量和残差进行编码。
根据权利要求19所述的图像处理系统，其中，所述第一存储器和第二存储器中分别存储从所述当前帧图像的重构帧图像中确定出的需要多次重复读取的第一区域的图像数据，若所述第一区域下移一个块行，则将下移块行的图像数据分别存储在所述第一存储器和第二存储器中，并将下一个待编码块行编码时用不到的块行从所述第一存储器中进行移除，所述视频编码装置在读取时，从所述第一存储器中逐块行读取所述第一区域的图像数据第一预设次数，从所述第二存储器中逐块行读取所述第一区域中未读取块行的图像数据第二预设次数。