CN111225205A - 用于执行区块内预测的方法和装置 - Google Patents
用于执行区块内预测的方法和装置 Download PDFInfo
- Publication number
- CN111225205A CN111225205A CN201911097698.2A CN201911097698A CN111225205A CN 111225205 A CN111225205 A CN 111225205A CN 201911097698 A CN201911097698 A CN 201911097698A CN 111225205 A CN111225205 A CN 111225205A
- Authority
- CN
- China
- Prior art keywords
- value
- predicted
- block
- encoded
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 230000009466 transformation Effects 0.000 claims description 7
- 230000000694 effects Effects 0.000 abstract description 2
- 230000008901 benefit Effects 0.000 description 6
- 230000000295 complement effect Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000003384 imaging method Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/18—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/184—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/4402—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明题为“用于执行区块内预测的方法和装置”。本发明涉及一种用于执行区块内预测、特别是对图像数据的帧执行区块内预测的方法和装置。本技术的各种实施方案可包括匹配解码器以在解码器处生成复制内部状态和/或解压缩的数据的数据。该装置还可包括利用复制的数据作出预测的预测模块。然后该装置可利用预测的数据和初始的、输入源数据来确定差值并编码该差值。本发明实现的技术效果是提供区块内预测,该区块内预测对远离已编码的值的那些像素提供准确预测,并且不需要多个预测方向。
Description
技术领域
本发明涉及一种用于执行区块内预测、特别是对图像数据的帧执行区块内预测的方法和装置。
背景技术
许多常规编码器通过使用邻近像素或过往预测的统计特性进行编码或预测来执行预测。然而,该方法对远离已编码的值的那些像素的预测不太准确。许多常规方法还可需要多个预测方向。
发明内容
本发明涉及一种用于执行区块内预测、特别是对图像数据的帧执行区块内预测的方法和装置。
本发明所解决的技术问题是常规编码器通过使用邻近像素或过往预测的统计特性进行编码或预测来执行预测,从而对远离已编码的值的那些像素的预测不太准确。其他常规方法需要多个预测方向。
本技术的各种实施方案可包括匹配解码器以在解码器处生成复制内部状态和/或解压缩的数据的数据。该装置还可包括利用复制的数据作出预测的预测模块。然后该装置可利用预测的数据和初始的、输入源数据来确定差值并编码该差值。
根据一个方面,用于对图像数据的帧执行区块内预测的装置包括:区块生成器,该区块生成器被配置为接收图像数据的帧并且将图像数据的帧分成多个区块;以及编码器,该编码器连接到区块生成器并且被配置为:仅使用先前编码的区块来确定第一位置处的第一预测的像素值;将第一预测的值更换为副本值;使用先前编码的区块和副本值来确定第二位置处的第二预测的像素值;并且使用第一初始的、尚未编码的像素值和第一预测的像素值来计算第一差值编码的值。
在上述装置的一个实施方案中,第一预测的像素值和第一初始的、尚未编码的像素值具有图像数据的帧内的相同坐标位置。
在上述装置的一个实施方案中,编码器包括匹配解码器,该匹配解码器被配置为执行解量化和反变换以生成副本值。
在上述装置的一个实施方案中,先前编码的区块与第一位置和第二位置直接相邻。
在上述装置的一个实施方案中,先前预测的区块包括先前编码的值。
在上述装置的一个实施方案中,编码器根据第一差值编码的值来生成压缩的比特流,并且将压缩的比特流传输到解码器。
在上述装置的一个实施方案中,区块生成器从图像传感器传输初始的、尚未编码的像素值。
根据另一个方面,用于执行区块内预测的方法包括:生成包括多个像素值的图像数据的帧;生成预测的区块,包括:仅使用先前预测的区块在第一位置处生成第一预测的值;将第一预测的值更换为副本值;以及使用先前预测的区块和副本值在第二位置处生成第二预测的值;以及使用来自多个像素值的第一预测的值和第一初始的、尚未编码的值来计算差值。
在上述方法的一种操作中,第一预测的像素值和第一初始的、尚未编码的像素值具有图像数据的帧内的相同坐标位置。
在上述方法的一种操作中,先前预测的区块包括先前编码的值,并且与第一位置和第二位置直接相邻。
本发明实现的技术效果是提供区块内预测,该区块内预测对远离已编码的值的那些像素提供准确预测,并且不需要多个预测方向。
附图说明
当结合以下示例性附图考虑时,可参照具体实施方式更全面地了解本技术。在以下附图中,通篇以类似附图标记指代各附图中的类似元件和步骤。
图1是根据本技术的示例性实施方案的用于编码和解码的系统的框图;
图2是根据本技术的示例性实施方案的成像系统的框图;
图3是根据本技术的示例性实施方案的用于编码图像数据的流程图;
图4是根据本技术的实施方案的示出各种可编码符号和示例性符号概率的图表;
图5A代表性地示出了根据本技术的示例性实施方案的第一图像像素的编码器预测;
图5B代表性地示出了根据本技术的示例性实施方案的第二图像像素的编码器预测;
图5C代表性地示出了根据本技术的示例性实施方案的第三图像像素的编码器预测;
图5D代表性地示出了根据本技术的示例性实施方案的第四图像像素的编码器预测;
图6A代表性地示出了根据本技术的示例性实施方案的第一图像像素的解码器预测;
图6B代表性地示出了根据本技术的示例性实施方案的第二图像像素的解码器预测;
图6C代表性地示出了根据本技术的示例性实施方案的第三图像像素的解码器预测;并且
图6D代表性地示出了根据本技术的示例性实施方案的第四图像像素的解码器预测。
具体实施方式
本技术可在功能块部件和各种加工步骤方面进行描述。此类功能块可通过被配置成执行指定功能并且实现各种结果的任何数量的部件来实现。例如,本技术可采用可执行多种功能的各种量化器、变换算法等。此外,本技术可结合任何数量的电子系统(诸如机动车、航空、“智能设备”、便携式设备和消费类电子产品)实施,并且所描述的系统仅为本技术的示例性应用。此外,本技术可采用任何数量的常规预测技术、量化技术以及传输和/或存储技术。
根据本技术的各个方面的用于变换系数编码和解码的方法和装置可结合任何合适的电子系统来操作,诸如成像系统、音频系统或任何其他能压缩数据和/或对压缩的数据进行操作的系统。
参见图1和图2,根据本技术的各个方面的系统100可被配置为编码源数据,生成压缩的比特流,解码压缩的比特流,并且生成表示源数据的输出数据。在一个示例性实施方案中,系统100可包括编码器105、接口电路155和解码器110,它们一起操作以压缩、传输并重建数据。
成像系统200可包括配备有读出逻辑电路202的图像传感器201、通过在传输之前压缩信号的振幅范围来改善信号的信噪比的压缩扩展器205、以及生成数据区块的第一线缓冲电路210。例如,图像传感器201可生成一个或多个图像数据的帧,其中每个图像数据的帧包括多个像素数据。压缩扩展器205可接收并压缩图像数据的帧。然后压缩扩展器205可将压缩的图像数据的帧传输到第一线缓冲电路210,其中第一线缓冲电路210将图像数据的帧分成多个区块,该多个区块包括来自该多个像素数据的像素值子集,其中每个区块包括多个子区块。例如,每个区块可被描述为包括4个子区块的2×2区块、包括16个子区块的4×4区块等,其中每个子区块表示单独像素信号。然后第一线缓冲电路210可将每个区块相继地传输到编码器105以便进一步处理。
编码器105可被配置为接收源数据,并且将源数据从一种格式或代码转换为另一种格式或代码以用于标准化、速度和/或压缩目的。根据一个示例性实施方案,编码器105可包括预测模块115、差值编码器、变换模块120、量化器125、熵编码模块130和匹配解码器160。
根据一个示例性实施方案,匹配解码器160可被配置为在解码器110处生成复制内部状态和/或解压缩的数据的数据。匹配解码器160可包括反量化器165,该反量化器执行与量化器125所执行的功能互补的解量化功能;以及反变换模块170,该反变换模块执行与变换模块120所执行的功能互补的反变换算法。匹配解码器160可连接在量化器125与预测模块115之间。因此,匹配解码器160可操作以使来自量化器125的数据解量化和反变换,从而在解码器110处生成解压缩的数据的副本(即,副本数据、复制的数据)。然后匹配解码器160可将复制的数据传输到预测模块115。
预测模块115可被配置为使用已编码的区块(即,已在前一循环中编码的区块)和尚未编码的数据来生成预测的区块270。例如,预测模块115可被配置为使用当前区块240、前一区块245、拐角区块250和上区块255中的一者或多者。当前区块240可包括尚未编码(压缩)的当前、初始输入数据(例如,像素数据),并且前一区块245可包括来自匹配解码器160的复制的数据。换句话讲,当第一线缓冲电路210将数据区块传输到编码器105时,当前(实时)数据区块用于形成当前区块240并且副本数据(经由匹配解码器160)用于形成前一区块245。拐角区块250包括已经编码且随后解码的数据(即,数据已由差值编码器215进行差值编码,已由量化器125进行量化,并且已由匹配解码器160进行重建)。类似地,上区块255包括已经编码且随后解码的解码的数据(即,数据已由差值编码器215进行差值编码,已由量化器125进行量化,并且已由匹配解码器160进行重建)。根据一个示例性实施方案,预测模块115在不使用来自解码器110的数据的情况下形成预测的区块270。
根据一个示例性实施方案,预测模块115可以以当前区块240的形式接收尚未编码的像素数据,并且使用已编码的像素数据来作出预测并形成预测的区块270。例如,预测模块115可被配置为使用来自匹配解码器160的复制的数据(形成前一区块245)、拐角区块250和上区块255来形成预测的区块270。
编码器105还可包括差值编码器215(即,Δ编码器),该差值编码器被配置为确定两个数据样本之间的差值并且将该差值而非初始数据样本传输到变换模块120。例如,差值编码器215可连接到预测的区块270和当前区块240并且被配置为接收预测的区块270和当前区块240,从而生成来自预测的区块270的数据与来自当前区块240的初始的、尚未编码的像素数据之间的差值。差值编码器215可包括适用于计算差值的任何电路和/或系统,诸如被配置为执行简单算术减法或任何其他合适的差运算(诸如计算比率等)的电路。
变换模块120可被配置为通过将变换算法应用于预测的区块270或在编码器105包括差值编码器215的情况下将变换算法应用于差值区块来生成变换的输出。根据一个示例性实施方案,变换模块120被配置为将快速沃尔什-哈达玛变换(FWHT)应用于预测的区块270或来自差值编码器215的差值区块。变换模块120可由硬件、软件或它们的组合实现。
量化器125将来自值集合的输入值映射到来自有限的较小值集合的输出值。量化器125可连接到变换模块120并且被配置为接收变换的输出。然后量化器125可将变换的输出映射到量化的输出。量化器125可包括适用于执行量化功能的任何电路和/或系统。
根据一个示例性实施方案,编码器105还可包括编码的线缓冲器260。编码的线缓冲器260可连接到量化器125的输出端子,并且被配置为使用量化的输出来形成上区块255和拐角区块250。
编码器105还可包括重排序模块220,该重排序模块被配置为重新排列量化的输出并且生成量化的输出的有序集合(例如,向量),其中量化的输出按升序重排序。量化的输出可被称为多个量化的系数。重排序模块220可连接到量化器125的输出并且接收量化的输出。
熵编码器130将有序集合(即,多个量化的系数)转换为另一个域,该另一个域使用更少的比特数来表示每个量化的系数。一般来讲,熵编码器130通过利用其统计特性来将量化的系数的值映射到比特流。可将一些变换系数量化到零,并且使用诸如可变长度编码(例如,霍夫曼编码)或算术编码的编码方案来编码非零系数的值。根据一个示例性实施方案,熵编码器130可使用单个代码表来生成压缩的比特流。
根据一个示例性实施方案,熵编码器130可将来自多个量化的系数中的每个量化的系数表示为符号,其中符号包括上下文、量级(即,指数)和尾数。当量化的系数为非零值时,符号还可包括正负号。在这种情况下,上下文是“下一个”上下文。
熵编码器130可使用量级来定义编码的尾数的长度以形成第i个系数:Ci=(-1)正负号*2量级*尾数。在量化的系数具有零值的情况下,熵编码器130将连续零的数量表示为符号。因此,具有零值的量化的系数的符号包括上下文、零的总数(“zero_count_magnitude”)和尾数中的零的数量(“zero_count_mantissa”)。在这种情况下,上下文是“下一个”上下文。零系数由下式描述:Ci(i+n-1)=0,其中n=2zero_count_magnitude*zero_count_mantissa。
可根据特定应用来选择上下文的数量,并且可能希望保持上下文的数量尽可能低。根据一个示例性实施方案,熵编码器可包括四个不同上下文:第一上下文、第二上下文、第三上下文和第四上下文。第一上下文可为起始上下文,并且与来自该多个量化的系数的第一系数相关联。第二上下文可与来自该多个量化的系数的具有零量级的最后一个系数相关联。第三上下文可与来自该多个量化的系数的具有一量级的最后一个系数相关联。第四上下文可为默认上下文。
然后熵编码器130可编码符号。为了减少符号的数量,可使用量级和尾数来表示量化的系数,其中单独地编码正负号和尾数。例如,参见图4,熵编码器130可包括根据每个可能符号的统计概率含有可能符号(例如,E1:E8、Z1:EOB、T1:T8和M1:M8)的查找表、作为四个不同上下文之一的“当前活动的”上下文,以及作为紧跟在“当前活动的”上下文之后的上下文的“下一个”上下文。
熵编码器130可被配置为使用查找表来编码符号。例如,查找表可包括霍夫曼代码。熵编码器130可被配置为使用霍夫曼代码的子集来编码符号,其中基于“当前活动的”上下文来确定该子集。因此,可使用单个查找表基于“当前活动的”上下文、“下一个”上下文和量级来编码每个量化的系数。
根据一个示例性实施方案,熵编码器130可进一步被配置为使用运行长度编码(RLE)算法对多个量化的系数中的零的数量和一的数量进行计数。
编码器105还可包括被配置为暂时保持数据的输出缓冲器230。例如,输出缓冲器230可连接到熵编码器130,并且被配置为从熵编码器130接收压缩的比特流。输出缓冲器230可在将压缩的比特流传输到接口155之前暂时保持压缩的比特流。
编码器105还可包括带宽控制电路235,该带宽控制电路被配置为选择性地增加或减小压缩的比特流的带宽。例如,带宽控制电路235可在所需的质量降至低于设定阈值的情况下增加带宽,并且可在带宽超过系统100的传输或存储容量的情况下减小带宽。
接口电路155将数据从传输设备传输到接收设备。例如,接口电路155可连接到编码器105和/或编码器模块130的输出端子,并且接收压缩的比特流。接口电路155还可连接到解码器110的输入端子,并且被配置为将压缩的比特流传输到解码器110和/或解码模块150。根据一个示例性实施方案,接口电路155包括移动产业处理器接口(MIPI),其是使用MIPI D-PHY串行总线在成像系统200与含有解码器110的主机处理器(未示出)之间传输数据的双向信令协议。
解码器110可被配置为执行编码器105的各种互补过程,诸如解码、解量化、反变换和重建。例如,解码器110可包括解码模块150,该解码模块接收压缩的比特流并解码/解压缩该比特流;解量化器145,该解量化器接收并解量化解码的比特流;反变换模块140,该反变换模块接收解量化的数据并对解量化的数据执行反变换;以及重建模块135,该重建模块接收并重建变换的数据并且生成表示源数据的输出数据。
解码器110可在主机处理器或任何合适的主机设备(诸如用于显示图像和/或视频的设备)中实现。
根据一个示例性实施方案,参见图1和图3,系统100使用图像传感器201生成图像数据的帧,使用第一线缓冲电路210将图像数据的帧分成多个区块,并且使用编码器105编码像素数据。编码器105使用拐角区块250、上区块255、前一区块中的至少一者来生成预测的区块245。然后编码器105通过以下方式使用差值编码器215执行差值编码:计算当前区块240中的值与对应初始的、尚未编码的像素数据的差值。然后编码器105使用FWHT针对差值区块的每行和每列来变换该区块。之后编码器使用变换模块120使变换的区块(包括变换的系数)量化。随后编码器105对量化的系数进行重排序。量化的系数可由符号表示,并且编码器105使用查找表来编码符号。然后将编码的符号作为压缩的比特流传输到输出缓冲器230,其中输出缓冲器230将压缩的比特流传输到接口155和/或解码器110。之后解码器110执行互补功能以构建表示源数据的输出数据。
系统100可包括存储和/或传输压缩的比特流的接口155。系统100进一步使用解码器110来解码压缩的比特流以生成表示源数据的输出数据。解码器110使用解码模块150来扩展压缩的比特流,使用解量化器145来解量化该数据,使用反变换模块140来执行反变换,并且使用重建模块135来重建该数据。
根据一个示例性实施方案,参见图3、图5A至图5D,编码器130使用来自匹配解码器160的包括副本值的副本数据作出预测。例如,编码器105可接收源数据,例如像素数据,其中预测模块115接收源数据并执行区块内预测,包括使用先前预测的区块来生成第一预测的值并且使用先前预测的区块和副本值来生成第二预测的值。例如,使用先前预测的值(例如,sb、sc、sd、se)来预测第一预测的值(例如,sp0)(图5A)。然后编码器105将第一预测的值(sp0)更换为第一副本值(si0),之后编码器105使用第一副本值(si0)和先前预测的值(例如,sa、sb)来预测第二预测的值(例如,sp1)(图5B)。随后编码器105使用先前预测的值(例如,sd、se、sf)和第一副本值(si0)来预测第三预测的值(例如,sp2)(图5C)。然后编码器105将第二预测的值(sp1)和第三预测的值(sp2)分别更换为第二副本值(si1)和第三副本值(si2)。之后编码器105仅使用这些副本值(例如,si0、si1、si2)来预测第四预测的值(例如,sp3)(图5D)。由于可使用单个方向,该方法减少了多个预测方向的需要,并且提供了更准确的预测。
然后编码器105使用差值编码器215来执行差值编码。例如,然后差值编码器215接收如上形成的预测的区块270中的值以及初始的、尚未编码的像素值。之后差值编码器215计算预测的值与初始的、尚未编码的值之间的差值并且编码该差值。从具有图像数据的帧内的相同坐标位置的初始的、尚未编码的值减去预测的区块中的每个预测的值。由于预测的值更准确,编码的差值也比常规方法更准确。
根据一个示例性实施方案,参见图1和图6A至图6D,解码器110操作以执行互补功能,诸如解码、解量化、反变换和重建,从而生成表示源数据的输出数据。为了重建该数据,解码器110可以以与编码器105执行预测类似的方式执行预测。例如,解码器110使用先前预测的值(sb、sc、sd、se)来预测第一解码的值(sp0)(图6A)。解码器110可进一步根据变换系数来校正第一解码的值(sp0)以增加输出数据的准确性。然后解码器110将第一预测的值(sp0)更换为第一解码的像素数据(sd0),之后解码器110使用第一解码的像素数据(sd0)和先前预测的值(例如,sa、sb)来预测第二预测的值(例如,sp1)(图6B)。随后解码器110使用先前预测的值(例如,sd、se、sf)和第一解码的像素数据(sd0)来预测第三预测的值(例如,sp2)(图6C)。然后解码器110将第二预测的值(sp1)和第三预测的值(sp2)分别更换为第二解码的像素数据(sd1)和第三解码的像素数据(sd2)。之后解码器110仅使用解码的像素数据(例如,sd0、sd1、sd2)来预测第四解码的值(例如,sp3)(图6D)。
在上述描述中,已结合具体示例性实施方案描述了所述技术。所示和所述特定具体实施方式用于展示所述技术及其最佳模式,而不旨在以任何方式另外限制本技术的范围。实际上,为简洁起见,方法和系统的常规制造、连接、制备和其它功能方面可能未详细描述。此外,多张图中示出的连接线旨在表示各种元件之间的示例性功能关系和/或步骤。在实际系统中可能存在多个替代的或另外的功能关系或物理连接。
已结合具体示例性实施方案描述了所述技术。然而,可在不脱离本技术的范围的情况下作出各种修改和变化。以示例性而非限制性方式考虑说明和附图,并且所有此类修改旨在包括在本技术的范围内。因此,应通过所述的一般实施方案及其在法律意义上的等同形式,而不是仅通过上述具体示例确定所述技术的范围。例如,除非另外明确说明,否则可以任何顺序执行任何方法或工艺实施方案中列举的步骤,并且不限于具体示例中提供的明确顺序。另外,任何装置实施方案中列举的部件和/或元件可以多种排列组装或者以其它方式进行操作配置,以产生与本技术基本上相同的结果,因此不限于具体示例中阐述的具体配置。
上文已经针对具体实施方案描述了有益效果、其它优点和问题解决方案。然而,任何有益效果、优点、问题解决方案或者可使任何具体有益效果、优点或解决方案出现或变得更明显的任何要素都不应被解释为关键、所需或必要特征或组成部分。
术语“包含”、“包括”或其任何变型形式旨在提及非排它性的包括,使得包括一系列要素的过程、方法、制品、组合物或装置不仅仅包括这些列举的要素,而且还可包括未明确列出的或此类过程、方法、制品、组合物或装置固有的其它要素。除了未具体引用的那些,本技术的实施所用的上述结构、布置、应用、比例、元件、材料或部件的其它组合和/或修改可在不脱离其一般原理的情况下变化或以其它方式特别适于具体环境、制造规范、设计参数或其它操作要求。
上文已结合示例性实施方案描述了本技术。然而,可在不脱离本技术的范围的情况下对示例性实施方案作出改变和修改。这些和其它改变或修改旨在包括在本技术的范围内,如以下权利要求书所述。
根据一个方面,用于对图像数据的帧执行区块内预测的装置包括:区块生成器,该区块生成器被配置为接收图像数据的帧并且将图像数据的帧分成多个区块;以及编码器,该编码器连接到区块生成器并且被配置为:仅使用先前编码的区块来确定第一位置处的第一预测的像素值;将第一预测的值更换为副本值;使用先前编码的区块和副本值来确定第二位置处的第二预测的像素值;并且使用第一初始的、尚未编码的像素值和第一预测的像素值来计算第一差值编码的值。
在一个实施方案中,第一预测的像素值和第一初始的、尚未编码的像素值具有图像数据的帧内的相同坐标位置。
在一个实施方案中,编码器包括匹配解码器,该匹配解码器被配置为执行解量化和反变换以生成副本值。
在一个实施方案中,编码器还包括:预测模块;变换模块,该变换模块连接到预测模块的输出端子;以及量化器,该量化器连接到变换模块的输出端子;以及匹配解码器,该匹配解码器连接在量化器的输出端子与预测模块的输入端子之间。
在一个实施方案中,先前编码的区块与第一位置和第二位置直接相邻。
在一个实施方案中,编码器包括:预测模块,该预测模块包括:接收该多个区块的第一输入端子;以及第二输入端子;变换模块,该变换模块连接到预测模块的输出端子;以及量化器,该量化器连接到变换模块的输出端子和预测模块的第二输入端子,其中该量化器将变换系数传输到预测模块。
在一个实施方案中,先前预测的区块包括先前编码的值。
在一个实施方案中,编码器根据第一差值编码的值来生成压缩的比特流,并且将压缩的比特流传输到解码器。
在一个实施方案中,区块生成器从图像传感器传输初始的、尚未编码的像素值。
根据另一个方面,用于执行区块内预测的方法包括:生成包括多个像素值的图像数据的帧;生成预测的区块,包括:仅使用先前预测的区块在第一位置处生成第一预测的值;将第一预测的值更换为副本值;以及使用先前预测的区块和副本值在第二位置处生成第二预测的值;以及使用来自多个像素值的第一预测的值和第一初始的、尚未编码的值来计算差值。
在一种操作中,第一预测的像素值和第一初始的、尚未编码的像素值具有图像数据的帧内的相同坐标位置。
在一种操作中,先前预测的区块包括先前编码的值,并且与第一位置和第二位置直接相邻。
在一种操作中,该方法还包括:通过使用变换算法使预测的区块变换来生成多个变换的系数;通过使多个变换的系数量化来生成多个量化的系数;编码多个量化的系数;以及输出压缩的比特流。
在一种操作中,该方法还包括:通过使多个量化的系数解量化来生成解量化的值;以及通过将反变换算法应用于解量化的值来生成反变换的值。
根据另一个方面,系统包括:图像传感器,该图像传感器被配置为生成图像数据的帧;区块生成器,该区块生成器连接到图像传感器并且被配置为接收图像数据的帧并将图像数据的帧分成多个区块;编码器,该编码器被配置为:生成预测的区块,包括:仅使用第一先前预测的区块在第一位置处确定第一预测的像素值;将第一预测的像素值更换为第一副本值;以及使用第一先前预测的区块和第一副本值在第二位置处确定第二预测的像素值;并使用来自图像数据的帧的第二预测的像素值和初始的、尚未编码的像素值来计算差值;并且根据预测的区块来生成压缩的比特流;解码器,该解码器被配置为:接收压缩的比特流;并使用压缩的比特流来重建图像数据的帧,包括:仅使用第二先前预测的区块来确定第三预测的像素值;以及使用第二先前预测的区块和解码的值来确定第四预测的像素值。
在一个实施方案中,编码器包括匹配解码器,该匹配解码器被配置为执行解量化和反变换以生成第一副本值。
在一个实施方案中,编码器还包括:预测模块;变换模块,该变换模块连接到预测模块的输出端子;量化器,该量化器连接到变换模块的输出端子;以及匹配解码器,该匹配解码器连接在量化器的输出端子与预测模块的输入端子之间。
在一个实施方案中,第一预测的像素值和第一初始的、尚未编码的像素值具有图像数据的帧内的相同坐标位置。
在一个实施方案中,第一先前预测的区块包括先前编码的值,并且与第一位置和第二位置直接相邻。
在一个实施方案中,解码器进一步根据变换系数来校正第三预测的像素值。
Claims (10)
1.一种用于对图像数据的帧执行区块内预测的装置,其特征在于包括:
区块生成器,所述区块生成器被配置为接收所述图像数据的帧并将所述图像数据的帧分成多个区块;和
编码器,所述编码器连接到所述区块生成器并且被配置为:
仅使用先前编码的区块来确定第一位置处的第一预测的像素值;
将所述第一预测的值更换为副本值;
使用所述先前编码的区块和所述副本值来确定第二位置处的第二预测的像素值;以及
使用第一初始的、尚未编码的像素值和所述第一预测的像素值来计算第一差值编码的值。
2.根据权利要求1所述的装置,其特征在于所述第一预测的像素值和所述第一初始的、尚未编码的像素值具有所述图像数据的帧内的相同坐标位置。
3.根据权利要求1所述的装置,其特征在于所述编码器包括匹配解码器,所述匹配解码器被配置为执行解量化和反变换以生成所述副本值。
4.根据权利要求1所述的装置,其特征在于所述先前编码的区块与所述第一位置和所述第二位置直接相邻。
5.根据权利要求1所述的装置,其特征在于先前预测的区块包括先前编码的值。
6.根据权利要求1所述的装置,其特征在于所述编码器根据所述第一差值编码的值来生成压缩的比特流,并且将所压缩的比特流传输到解码器。
7.根据权利要求1所述的装置,其特征在于所述区块生成器从图像传感器传输所述初始的、尚未编码的像素值。
8.一种用于执行区块内预测的方法,其特征在于包括:
生成包括多个像素值的图像数据的帧;
生成预测的区块,包括:
仅使用先前预测的区块在第一位置处生成第一预测的值;
将所述第一预测的值更换为副本值;以及
使用所述先前预测的区块和所述副本值在第二位置处生成第二预测的值;以及
使用来自所述多个像素值的所述第一预测的值和第一初始的、尚未编码的值来计算差值。
9.根据权利要求8所述的方法,其特征在于所述第一预测的像素值和所述第一初始的、尚未编码的像素值具有所述图像数据的帧内的相同坐标位置。
10.根据权利要求8所述的方法,其特征在于所述先前预测的区块包括先前编码的值,并且与所述第一位置和所述第二位置直接相邻。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410431230.7A CN118075495A (zh) | 2018-11-27 | 2019-11-12 | 用于执行区块内预测的方法和装置 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/201,253 | 2018-11-27 | ||
US16/201,253 US10841617B2 (en) | 2018-11-27 | 2018-11-27 | Methods and apparatus for successive intra block prediction |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410431230.7A Division CN118075495A (zh) | 2018-11-27 | 2019-11-12 | 用于执行区块内预测的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111225205A true CN111225205A (zh) | 2020-06-02 |
CN111225205B CN111225205B (zh) | 2024-04-09 |
Family
ID=70771057
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911097698.2A Active CN111225205B (zh) | 2018-11-27 | 2019-11-12 | 用于执行区块内预测的方法和装置 |
CN202410431230.7A Pending CN118075495A (zh) | 2018-11-27 | 2019-11-12 | 用于执行区块内预测的方法和装置 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410431230.7A Pending CN118075495A (zh) | 2018-11-27 | 2019-11-12 | 用于执行区块内预测的方法和装置 |
Country Status (2)
Country | Link |
---|---|
US (2) | US10841617B2 (zh) |
CN (2) | CN111225205B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020126774A1 (en) * | 2001-03-06 | 2002-09-12 | Communications Research Laboratory, Independent Administrative Institution And Denso Corporation. | Receiving apparatus, receiving method, program and information recording medium |
US20080175492A1 (en) * | 2007-01-22 | 2008-07-24 | Samsung Electronics Co., Ltd. | Intraprediction/interprediction method and apparatus |
CN101682780A (zh) * | 2007-06-14 | 2010-03-24 | 三星电子株式会社 | 使用图像修补进行帧内预测编码/解码的方法和设备 |
CN106416243A (zh) * | 2014-02-21 | 2017-02-15 | 联发科技(新加坡)私人有限公司 | 利用基于帧内图像区块复制预测的视频编码方法 |
US20180220152A1 (en) * | 2017-01-31 | 2018-08-02 | Google Inc. | Multi-reference compound prediction using masking |
CN108781297A (zh) * | 2016-03-18 | 2018-11-09 | 联发科技股份有限公司 | 视频编码的方法与装置 |
Family Cites Families (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5321776A (en) | 1992-02-26 | 1994-06-14 | General Electric Company | Data compression system including successive approximation quantizer |
WO2000002381A1 (en) * | 1998-07-01 | 2000-01-13 | Equator Technologies, Inc. | Image processing circuit and method for modifying a pixel value |
US6738074B2 (en) | 1999-12-29 | 2004-05-18 | Texas Instruments Incorporated | Image compression system and method |
JP4617644B2 (ja) * | 2003-07-18 | 2011-01-26 | ソニー株式会社 | 符号化装置及び方法 |
US7860158B2 (en) * | 2004-08-27 | 2010-12-28 | Mitsubishi Electric Research Laboratories Inc. | Coding correlated images using syndrome bits |
JP2010505343A (ja) | 2006-09-29 | 2010-02-18 | トムソン ライセンシング | 幾何学的なイントラ予測 |
KR101119970B1 (ko) * | 2007-02-05 | 2012-02-22 | 삼성전자주식회사 | 적응적인 양자화 스텝을 이용한 영상의 부호화, 복호화방법 및 장치 |
JP5422168B2 (ja) * | 2008-09-29 | 2014-02-19 | 株式会社日立製作所 | 動画像符号化方法および動画像復号化方法 |
JP5275454B2 (ja) * | 2009-03-31 | 2013-08-28 | パナソニック株式会社 | 画像復号装置 |
NZ627238A (en) | 2009-04-29 | 2016-02-26 | Amarin Pharmaceuticals Ie Ltd | Stable pharmaceutical composition comprising ethyl eicosapentaenoate |
KR20110061468A (ko) * | 2009-12-01 | 2011-06-09 | (주)휴맥스 | 고해상도 영상의 부호화/복호화 방법 및 이를 수행하는 장치 |
US8885711B2 (en) * | 2009-12-17 | 2014-11-11 | Sk Telecom Co., Ltd. | Image encoding/decoding method and device |
JP5759387B2 (ja) * | 2010-01-08 | 2015-08-05 | シャープ株式会社 | 符号化装置および復号装置 |
KR101449692B1 (ko) * | 2010-02-26 | 2014-10-13 | 에스케이 텔레콤주식회사 | 영상 부호화 장치 및 그 방법, 및 영상 복호화 장치 및 그 방법 |
CN102823248B (zh) * | 2010-04-08 | 2015-06-24 | 株式会社东芝 | 图像编码方法以及图像编码装置 |
CN103039073B (zh) * | 2010-06-07 | 2016-09-14 | 数码士有限公司 | 编码/解码高分辨率图像的方法和执行该方法的装置 |
US20130083856A1 (en) | 2011-06-29 | 2013-04-04 | Qualcomm Incorporated | Contexts for coefficient level coding in video compression |
GB2495468B (en) * | 2011-09-02 | 2017-12-13 | Skype | Video coding |
KR20130037161A (ko) * | 2011-10-05 | 2013-04-15 | 한국전자통신연구원 | 스케일러블 비디오 코딩을 위한 향상된 계층간 움직임 정보 예측 방법 및 그 장치 |
JP5821542B2 (ja) * | 2011-11-07 | 2015-11-24 | 富士通株式会社 | 動画像符号化装置、および動画像復号装置 |
KR20130107861A (ko) * | 2012-03-23 | 2013-10-02 | 한국전자통신연구원 | 인터 레이어 인트라 예측 방법 및 장치 |
JP5796899B2 (ja) * | 2012-03-26 | 2015-10-21 | Kddi株式会社 | 画像符号化装置及び画像復号装置 |
KR20140016823A (ko) * | 2012-07-24 | 2014-02-10 | 한국전자통신연구원 | 영상의 복호화 방법 및 이를 이용하는 장치 |
WO2014084674A2 (ko) | 2012-11-29 | 2014-06-05 | 인텔렉추얼 디스커버리 주식회사 | 잔차 변환을 이용한 인트라 예측 방법 및 장치 |
KR20140087971A (ko) * | 2012-12-26 | 2014-07-09 | 한국전자통신연구원 | 계층적 비디오 부호화에서 다중참조계층을 적용한 화면간 부/복호화 방법 및 그 장치 |
JP5983430B2 (ja) * | 2013-01-25 | 2016-08-31 | 富士通株式会社 | 動画像符号化装置、動画像符号化方法及び動画像復号装置ならびに動画像復号方法 |
US20140254664A1 (en) | 2013-03-11 | 2014-09-11 | Sony Corporation | Methods to perform intra prediction for compression of cfa data |
WO2015005753A1 (ko) * | 2013-07-12 | 2015-01-15 | 삼성전자 주식회사 | 깊이 기반 디스패리티 벡터를 이용하는 인터 레이어 비디오 복호화 방법 및 그 장치, 깊이 기반 디스패리티 벡터를 이용하는 인터 레이어 비디오 부호화 방법 및 장치 |
US9445132B2 (en) * | 2013-09-09 | 2016-09-13 | Qualcomm Incorporated | Two level last significant coefficient (LSC) position coding |
KR101621358B1 (ko) | 2015-04-16 | 2016-05-17 | 아주대학교 산학협력단 | Hevc 부호화 장치 및 그 인트라 예측 모드 결정 방법 |
US20180359468A1 (en) * | 2015-10-01 | 2018-12-13 | Lg Electronics Inc. | Image processing method on basis of inter prediction mode and apparatus therefor |
WO2017069505A1 (ko) * | 2015-10-19 | 2017-04-27 | 엘지전자(주) | 영상의 부호화/복호화 방법 및 이를 위한 장치 |
US11563938B2 (en) * | 2016-02-15 | 2023-01-24 | Qualcomm Incorporated | Geometric transforms for filters for video coding |
US10319113B2 (en) * | 2017-06-21 | 2019-06-11 | Foveon, Inc. | Method for recovering highlights and saturated regions and extending dynamic range in a digital image |
-
2018
- 2018-11-27 US US16/201,253 patent/US10841617B2/en active Active
-
2019
- 2019-11-12 CN CN201911097698.2A patent/CN111225205B/zh active Active
- 2019-11-12 CN CN202410431230.7A patent/CN118075495A/zh active Pending
-
2020
- 2020-10-09 US US16/949,007 patent/US11943477B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020126774A1 (en) * | 2001-03-06 | 2002-09-12 | Communications Research Laboratory, Independent Administrative Institution And Denso Corporation. | Receiving apparatus, receiving method, program and information recording medium |
US20080175492A1 (en) * | 2007-01-22 | 2008-07-24 | Samsung Electronics Co., Ltd. | Intraprediction/interprediction method and apparatus |
CN101682780A (zh) * | 2007-06-14 | 2010-03-24 | 三星电子株式会社 | 使用图像修补进行帧内预测编码/解码的方法和设备 |
CN106416243A (zh) * | 2014-02-21 | 2017-02-15 | 联发科技(新加坡)私人有限公司 | 利用基于帧内图像区块复制预测的视频编码方法 |
CN108781297A (zh) * | 2016-03-18 | 2018-11-09 | 联发科技股份有限公司 | 视频编码的方法与装置 |
US20180220152A1 (en) * | 2017-01-31 | 2018-08-02 | Google Inc. | Multi-reference compound prediction using masking |
Also Published As
Publication number | Publication date |
---|---|
US20200169756A1 (en) | 2020-05-28 |
CN111225205B (zh) | 2024-04-09 |
US11943477B2 (en) | 2024-03-26 |
US10841617B2 (en) | 2020-11-17 |
CN118075495A (zh) | 2024-05-24 |
US20210029380A1 (en) | 2021-01-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5815097A (en) | Method and apparatus for spatially embedded coding | |
US20060067582A1 (en) | Progressive JPEG decoding system | |
US8199820B2 (en) | Intermediate compression of reference frames for transcoding | |
JP7046325B2 (ja) | デジタルデータ圧縮のための方法及びデバイス | |
JP7162532B2 (ja) | ビデオデータに関係する構文要素を表す一連の2値シンボルをコンテキスト適応型2値算術符号化するための方法及び装置 | |
EP1653746A2 (en) | Lossless adaptive encoding and decoding of integer data | |
US20140015698A1 (en) | System and method for fixed rate entropy coded scalar quantization | |
JP4163680B2 (ja) | コードワードインデックスに対してパラメータ値のマッピングを行うための適応型方法およびシステム | |
Mahmud | An improved data compression method for general data | |
Rojatkar et al. | Image compression techniques: lossy and lossless | |
TWI626843B (zh) | 解碼器、編碼器及其使用方法 | |
CN112449191B (zh) | 压缩多个图像的方法、解压缩图像的方法和装置 | |
CN111225205B (zh) | 用于执行区块内预测的方法和装置 | |
CN111225207B (zh) | 用于对变换系数进行编码的方法和装置 | |
WO2013011355A1 (en) | Method and apparatus for encoding an image | |
Usevitch | JPEG2000 compatible lossless coding of floating-point data | |
RU2765654C9 (ru) | Способ и устройство для сжатия цифровых данных | |
US11854235B1 (en) | Lossless integer compression scheme | |
Mohamed | Wireless Communication Systems: Compression and Decompression Algorithms | |
Hilles et al. | Image coding techniques in networking | |
US11645079B2 (en) | Gain control for multiple description coding | |
JPH08316846A (ja) | 画像符号化装置、画像復号化装置、画像符号化方法および画像復号化方法 | |
Reddy et al. | LosslessGrayscaleImage Compression Using Intra Pixel Redundancy | |
Abul-Hassan | Multimedia Networking review paper | |
WO1999005862A2 (en) | A method in compression coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |