CN101304532A - 图像处理装置及其方法 - Google Patents
图像处理装置及其方法 Download PDFInfo
- Publication number
- CN101304532A CN101304532A CNA200810097327XA CN200810097327A CN101304532A CN 101304532 A CN101304532 A CN 101304532A CN A200810097327X A CNA200810097327X A CN A200810097327XA CN 200810097327 A CN200810097327 A CN 200810097327A CN 101304532 A CN101304532 A CN 101304532A
- Authority
- CN
- China
- Prior art keywords
- frame
- encoded
- unit
- quantization step
- resolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 22
- 238000013139 quantization Methods 0.000 claims abstract description 67
- 230000006870 function Effects 0.000 claims description 32
- 238000003860 storage Methods 0.000 claims description 14
- 238000000605 extraction Methods 0.000 claims description 5
- 238000007906 compression Methods 0.000 description 13
- 230000006835 compression Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 10
- 238000001514 detection method Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 238000013144 data compression Methods 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 3
- 230000002457 bidirectional effect Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000008676 import Effects 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/192—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
- H04N19/194—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive involving only two passes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/14—Coding unit complexity, e.g. amount of activity or edge presence estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/142—Detection of scene cut or scene change
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/149—Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/15—Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Algebra (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明提供一种图像处理装置及其方法,为了高精度地设置依照目标代码量的量化步长,从与动态图像的分辨率和帧的编码方式对应的多个系数集合中,选择依照待编码图像的分辨率和待编码帧的编码方式的一个系数集合。该待编码帧的特征量被提取,并且当该待编码帧进行帧间编码时,基于已选择的系数集合和特征量生成表示量化步长和生成数据量之间关系的函数。当该函数被生成时,基于该函数,在待编码帧的编码中设置依照目标代码量的量化步长。
Description
技术领域
本发明涉及对动态图像进行编码的图像处理装置及其方法。
背景技术
由于数字动态图像数据的数据量很大,因此需要在记录和传输时对其数据量进行压缩的技术。近来,由于动态图像数据的输入和输出设备使用了较高的分辨率和多色调等级,所以动态图像数据量进一步增加,因而对动态图像数据进行数据压缩变得不可或缺。
一种对动态图像数据进行压缩并编码的装置,当输出动态图像数据到固定传送速率的传送路径上时,执行压缩率控制,以控制量化步长。压缩率控制在实际编码之前,估计出待编码帧的生成数据量,然后根据估计结果控制数据压缩率(量化步长)。
在生成数据量的估计中,可以使用这样一种方法,该方法利用了先前已编码帧的生成数据量。然而,假如待编码帧是场景变化后的一帧,换句话说,假如已编码帧是场景变化前的一帧,则已编码帧的数据生成特性与待编码帧的数据生成特性不同。因此,当场景发生变化时,不能正确估计生成数据量。当然,如果待编码帧为动态图像数据的第一帧,由于没有已编码帧,因此不能估计生成数据量。
发明内容
作为本发明的一个方面,提供一种对动态图像逐帧进行编码的图像处理装置,包括:第一存储器单元,用于存储与帧分辨率及帧的编码方式相对应的多个系数集合;选择单元,用于获取表示待编码帧的分辨率的信息,然后从所述第一存储器单元选择依照所述分辨率和待编码帧的编码方式的系数集合;提取单元,用于提取待编码帧的特征量;生成单元,用于在待编码帧要进行帧间预测编码的情况下,根据已选的系数集合和所述特征量,生成表示量化步长与生成数据量之间关系的函数;设置单元,用于在所述生成单元生成所述函数的情况下,基于所述函数,在待编码帧的编码中设置依照目标代码量的量化步长。
作为本发明的另一个方面,提供一种图像处理装置的方法,该图像处理装置包括用于存储与动态图像的分辨率及帧的编码方式相对应的多个系数集合的第一存储器单元,该方法对动态图像逐帧进行编码,并且包括以下步骤:获取表示待编码帧的分辨率的信息,并从所述存储器单元中选择依照所述分辨率以及待编码帧的编码方式的系数集合;提取待编码帧的特征量;在待编码帧进行帧间预测编码的情况下,基于已选择的系数集合和特征量,生成表示量化步长与生成数据量之间关系的函数;在生成所述函数的情况下,基于所述函数,在待编码帧的编码中设置依照目标代码量的量化步长。
根据这些方面,量化步长能够根据目标代码量被高精度设置。而且,量化步长能够考虑到场景变化,根据目标代码量来设置。
本发明进一步的特征,将在以下参照附图的具体实施方式的描述中,得以清楚地记载。
附图说明
图1为动态图像编码装置的结构的框图。
图2为压缩率控制单元的结构的框图。
图3为压缩率控制单元的其它结构的框图。
图4为压缩率控制单元的其它结构的框图。
图5为模型类型Q确定单元的处理的流程图。
图6为模型类型Q确定单元的结构的框图。
图7A到7C为说明了利用QR功能确定目标代码量相应的量化步长的方法的视图。
具体实施方式
以下将参照附图对本发明的实施例中的图像处理装置和方法详细地进行描述。
第一实施例
【装置的结构】
图1为动态图像编码装置的结构的框图。
输入单元100输入多个时间上连续的帧所形成的数字动态图像数据。减法器101计算从输入单元100输入的帧与从预测图像保持单元111输出的预测值之间的差(下文指“预测误差”)。
输入的动态图像数据的每一帧都被分为小矩形块Bij(每一个被定义为例如8×8像素、16×16像素,诸如此类)。当输入的动态图像为彩色图像时,对每个宏块(MBij>Bij)-即矩形块Bij的集合进行处理。小矩形分割单元116在编码模式确定单元102的控制下,将输入的动态图像数据的每一帧或减法器101输出的预测误差分割成宏块(MB)。
预测方向确定单元117为每一帧在帧内编码和帧间预测编码之间选择。正交变换单元103以MB为单位对待编码的MB进行正交变换。量化单元104在压缩率控制单元112的控制下,对正交变换单元103输出的正交变换系数执行标量量化。
可变长度编码单元113对量化单元104输出的量化值执行可变长度编码,并将编码后的值输出给缓冲器114。缓冲器114缓冲多个已编码帧,并在压缩率控制单元112的控制下,将多个已编码帧作为已进行数据压缩的动态图像数据输出到输出单元115。稍后将对压缩率控制单元112的细节进行描述。
逆量化单元105将量化单元104输出的量化值逆量化,并输出正交变换系数。逆正交变换单元106对逆量化单元105输出的正交变换系数进行逆正交变换,以对MB或预测误差解压缩。
加法器107在编码模式确定单元102的控制下,将逆正交变换单元106解压缩的MB与预测图像保持单元111保持的预测图像的相应块相加,以重构待编码块,并将重构的块存储在帧存储器108的相应区域中。或者,加法器107将逆正交变换单元106解压缩的预测误差存储在帧存储器108的相应区域中。
当编码模式确定单元102控制正交变换单元103对待编码的MB进行正交变换时,其控制加法器107以将待编码的解压缩的MB存储在帧存储器108中。当编码模式确定单元102控制正交变换单元103对预测误差进行正交变换时,其控制加法器107将解压缩的预测误差存储在帧存储器108中。即帧存储器108存储被本地解码的帧。
运动向量检测单元109,参照帧存储器108存储的前一个的待编码帧(上一帧)的编码图像,对每个MB检测运动向量。在此情况下,运动向量检测单元109在待编码的MB周围±15像素的范围内执行块匹配,并用预测误差的绝对和的平均值最小的块作为预测块,检测运动向量。
运动补偿单元110利用运动向量检测单元109的检测信息(运动向量),从帧存储器108存储的重构帧(参照帧)中生成预测图像,并将生成的预测图像存储在预测图像保持单元111中。预测图像保持单元111将存储的预测图像输出给减法器101和加法器107。
【压缩率控制单元】
图2为压缩率控制单元112的框图。
在开始编码时,目标代码量确定单元202输出预定的目标代码量,量化步长确定单元200将预定的量化步长设定在量化单元104中。
在编码开始并且代码被存储在缓冲器114后,目标代码量确定单元202根据代码存储状态输出每一帧的目标代码量。量化步长确定单元200将依照目标代码量的量化步长输出到临时编码单元201。
临时编码单元201用从量化步长确定单元200输入的量化步长,对从正交变换单元103输入的当前帧的正交变换系数进行量化。此外,临时编码单元201使用可变长编码单元113相同的方法来对量化值编码,并通知量化步长确定单元200生成数据量。
如果临时编码单元201通知给量化步长确定单元200的生成数据量(后文指“预测代码量”)落入目标代码量的允许范围内,则量化步长确定单元200将上述的量化步长设定在量化单元104中,以对当前帧进行编码。另一方面,如果预测代码量落在目标代码量的允许范围外,则量化步长确定单元200对设定在量化单元104中的量化步长进行调整,使生成数据量落入目标代码量的允许范围内,以对当前帧进行编码。
在此结构中,虽然需要的计算量近乎实际编码所需计算量的两倍,但是在实际编码之前,能精确地估计生成数据量。
图3为压缩率控制单元112的其它结构的框图。
QR曲线保持单元204为保持由经验计算得到的量化步长Q与生成数据量R之间的关系(QR曲线)的存储器。QR曲线是为各种类型的图像,例如要进行帧内编码的帧(帧内编码图像)、要进行前向预测的帧(预测图像)以及要进行双向估计的帧(双向预测图像)而准备的。要注意的是,QR曲线由以量化步长Q为变量的多项式(QR函数,R=f(Q))来表达。
QR曲线选择单元203,根据编码模式确定单元102输出的表示当前帧的图像类型的信息,输出QR曲线保持单元204保持的QR曲线的选择信息。量化步长确定单元200参照由选择信息所指示的QR曲线,将依照目标代码量的量化步长设定在量化单元104中,对当前帧进行编码。
由于QR曲线根据动态图像数据的分辨率和色调数(位元深度)以及动态图像数据中的对象特性来改变,因而不能保证确实地获得目标代码量。然而,图3所示的压缩率控制单元112的结构与图2所示相比,能够减少计算量。
QR曲线不仅可以与图像类型相关联地,而且可与动态图像的分辨率和位元深度相关联地存储在QR曲线保持单元204中。在此情况下,QR曲线选择单元203从输入的动态图像数据的头信息等,获取表示动态图像数据的分辨率和位元深度的信息,并且能够依照图像类型、分辨率和位元深度来选择QR曲线。如果动态图像的分辨率和位元深度与QR曲线保持单元204保持的QR曲线的代表分辨率和位元深度不相匹配,则选择分辨率和位元深度与动态图像的分辨率和位元深度最相近的QR曲线。
图4为压缩率控制单元112的其它结构的框图。
系数保持单元302为保持依照动态图像的分辨率的系数集合的存储器。系数集合是对各种类型的图像-例如预测图像(P图像)、双向预测图像(B图像)等等以及各种代表分辨率和位元深度而分别准备的。
系数选择单元301从输入的动态图像的头信息等等来获取表示动态图像的分辨率和位元深度的信息。然后,系数选择单元301依照编码模式确定单元102输出的当前帧的图像类型、分辨率和位元深度,来选择系数保持单元302保持的一个系数集合。当动态图像的分辨率和位元深度与系数保持单元302保持的任何代表分辨率和位元深度都不匹配时,系数选择单元301选择与动态图像最接近的系数集合、分辨率和位元深度。
当编码模式确定单元102输出的图像为帧内编码图像(I图像)以外的类型时,特征量提取单元304提取当前帧的特征量(例如每个MB的亮度值的平均离散的统计量)。
QR曲线生成单元303根据系数保持单元302输出的系数集合(由系数选择单元301选择)和特征量提取单元304输出的特征量,生成QR曲线(QR函数,R=f(Q))。QR曲线生成单元303将生成的QR曲线输入给模型类型Q确定单元300。需要注意的是,当编码模式确定单元102输出的图像为I图像以外的类型时,QR曲线生成单元303输出QR曲线;当图像类型为I图像时,不输出QR曲线。
采用这种方式,在当前帧为动态图像的第一帧或紧跟场景变化后的I图像时,既不执行特征量的提取,也不执行QR曲线的生成和输出。生成QR曲线就是确定以量化步长Q为变量的多项式的系数。
当没有从QR曲线生成单元303输入QR曲线时,模型类型Q确定单元300将由例如图2或3描述的量化步长确定方法所确定的量化步长,设定在量化单元104中,以对当前帧进行编码。当从QR曲线生成单元303输入QR曲线时,模型类型Q确定单元300将在QR曲线的基础上根据目标代码量确定的量化步长,设定在量化单元104中,以对当前帧进行编码。
图5为模型类型Q确定单元300的处理的流程图。需要注意的是图5所示为一帧的处理。即当有多帧时,模型类型Q确定单元300反复进行图5所示的处理。
一启动该处理,模型类型Q确定单元300即从目标代码量确定单元202接收目标代码量Rtar(S1001),并检查是否从QR曲线生成单元303输入了QR曲线(步骤S1002)。如果没有输入QR曲线,模型类型Q确定单元300用通过例如图2或3描述的量化步长确定方法,来确定量化步长(步骤S1003)。
如果输入了QR曲线,模型类型Q确定单元300在QR曲线的基础上根据目标代码量Rtar来确定量化步长Q(步骤S1004)。
图6为模型类型Q确定单元300的结构的框图。
Q保持单元403保持由Q更新单元404更新的量化步长Q。R计算单元401利用从Q更新单元404输入的量化步长Q和从QR曲线生成单元303输入的QR函数(R=f(Q)),来计算代码量R。比较单元402比较从目标代码量确定单元202输入的目标代码量和从R计算单元401输入的代码量R。Q更新单元404依照比较单元402的输出,更新Q保持单元403保持的量化步长Q。
Q更新单元404包括从Q保持单元403保持的量化步长Q减去预定值的减运算单元405,以及在Q保持单元403保持的量化步长Q上加上预定值的加运算单元406。另外,Q更新单元包含依照比较单元402的输出来选择减运算单元405的减运算结果或加运算单元406的加运算结果的选择器407。
在步骤S1004中,根据将生成数据量作为变量的函数Q=f(R),很容易确定满足目标代码量Rtar的量化步长Q。然而,从将量化步长Q作为变量的函数R=f(Q)中得出满足目标代码量Rtar的量化步长Q并不容易。
图7A到7C为说明使用QR函数R=f(Q)确定目标代码量Rtar对应的量化步长Q的方法的视图。假定量化步长Q的范围在1到51之间。
如图7A所示,Q更新单元404将Q范围的中值“25”作为量化步长Q的初始值存储在Q保持单元403中,并使R计算单元401计算代码量R。比较单元402将R与Rtar进行比较,然后输出表示比较结果的确定信号(三值)。例如,如果R>Rtar,如图7B所示,比较单元402输出“2”。如果R<Rtar,如图7C所示,比较单元402输出“1”。如果R=Rtar,比较单元402输出“0”。
当比较单元402输出“2”时,选择器407选择加运算单元406的输出;当比较单元402输出“1”时,选择器407选择减运算单元405的输出。换句话说,如果R>Rtar,选择器407选择由加运算单元406在当前的量化步长上加1得到的量化步长Q,以减少代码量R。如果R<Rtar,选择器407选择由减运算单元405在当前的量化步长Q上减1得到的量化步长Q,以增加代码量R。
Q更新单元404对量化步长Q反复进行加法或减法操作,直到R=Rtar(确定信号=0,条件1),或确定信号从“2”变到“1”(条件2)或从“1”变到“2”(条件3)。如果确定信号满足条件1、2或3,Q更新单元404将此时的量化步长Q输出到量化单元104。采用这种方式,通过比较将量化步长Q代入函数f(Q)计算得到的代码量R与目标代码量Rtar,并且使计算得到的代码量R步进式地接近目标代码量Rtar,能够确定满足目标代码量Rtar的量化步长Q。
为了加快量化步长的确定处理,作为计算与模型类型Q确定单元300中的目标代码量Rtar相对应的量化步长Q的方法能够使用二叉树的方法。
根据二叉树的方法,如果根据量化步长的初始值Qi得到的R=f(Qi)与Rtar的比较结果为R=f(Qi)<Rtar,则设定最大Q值为Qi,然后使用Qi与最小Q值“1”之间的中值Qc计算R=f(Qc)。如果R=f(Qc)>Rtar,则设定最小Q值为Qc,并且设定Qc与最大Q值之间的中值为Qc,然后计算R=f(Qc)。采用这种方法,通过使R=f(Q)接近Rtar,能够确定与目标代码量Rtar对应的量化步长Q。
其它实施例
本发明能够适用于由多个设备(例如主计算机、接口、阅读器、打印机)构成的系统或由单一设备(例如,复印机、传真机)构成的装置。
此外,本发明能向计算机系统或装置(例如,个人计算机)提供一种存储了用来执行上述处理的程序代码的存储介质,通过计算机系统或装置的CPU或MPU从该存储介质中读取程序代码,然后执行该程序。
在此情况中,根据实施例,从存储介质读取的程序代码实现了所述功能。
此外,为了提供程序代码,可以使用例如,软盘、硬盘、光盘、磁光盘、CD-ROM、CD-R、磁带、非易失性存储卡和ROM的存储介质。
此外,不仅包含通过执行计算机读取的程序代码,上述实施例的功能得以实现的情况,本发明还包含根据程序代码的指示,在计算机上运行的OS(操作系统)等执行处理的一部分或者全部,通过该处理上述实施例的功能得以实现的情况。
此外,本发明还包含当从存储介质中读取的程序代码,被写入到插入计算机的功能扩展板或者连接到计算机的功能扩展单元上所具备的存储器以后,根据该程序代码的指示,该功能扩展板或者功能扩展单元上所具备的CPU等执行处理的一部分或者全部,通过该处理上述实施例的功能得以实现的情况。
在本发明适用于上述存储介质的情况下,与实施例描述的流程图对应的程序代码就存储在该存储介质中。
虽然参照实施例对本发明进行了描述,应当理解的是本发明并不限于公开的实施例。权利要求的范围被给予最宽泛的解释,包括所有变体、等同结构和功能在内。
Claims (7)
1.一种用于对动态图像逐帧进行编码的图像处理装置,包括:
第一存储器单元,用于存储与帧分辨率及帧的编码方式相对应的多个系数集合;
选择单元,用于获取表示待编码帧的分辨率的信息,并从所述第一存储器单元选择依照所述分辨率和待编码帧的编码方式的系数集合;
提取单元,用于提取待编码帧的特征量;
生成单元,用于在待编码帧要进行帧间预测编码的情况下,根据已选的系数集合和所述特征量,生成表示量化步长与生成数据量之间关系的函数;
设置单元,用于在所述生成单元生成所述函数的情况下,基于所述函数,在待编码帧的编码中设置依照目标代码量的量化步长。
2.根据权利要求1所述的装置,其特征在于,所述第一存储器单元存储除了与动态图像的分辨率和帧的编码方式对应以外,还与动态图像的位元深度相对应的多个系数集合;所述选择单元获取表示待编码的动态图像的位元深度的信息,并从所述第一存储器单元中选择依照所述分辨率、位元深度和待编码帧的编码方式的系数集合。
3.根据权利要求1所述的装置,其特征在于,还包括估计单元,用于估计在待编码帧被编码的情况下的生成数据量;
其中,所述设置单元在所述生成单元不生成函数的情况下,基于所述估计单元的估计结果,在待编码帧的编码中设置依照目标代码量的量化步长。
4.根据权利要求1所述的装置,其特征在于,进一步包括:
第二存储器单元,用于存储至少与帧的编码方式相对应的多个函数,其中每个函数都表示量化步长与生成数据量之间的关系;
选择单元,用于根据待编码帧的编码方式,从所述第二存储器单元中选择函数;
其中,所述设置单元在所述生成单元不生成函数的情况下,基于所述选择单元选择的函数,在待编码帧的编码中设置依照目标代码量的量化步长。
5.根据权利要求1所述的装置,其特征在于,在待编码帧进行帧内编码的情况下,所述生成单元不生成函数。
6.一种图像处理装置的方法,该图像处理装置包括用于存储与动态图像的分辨率及帧的编码方式相对应的多个系数集合的第一存储器单元,该方法对动态图像逐帧进行编码,并且包括以下步骤:
获取表示待编码帧的分辨率的信息,并从所述存储器单元中选择依照所述分辨率和待编码帧的编码方式的系数集合;
提取待编码帧的特征量;
在待编码帧进行帧间预测编码的情况下,基于已选择的系数集合和特征量,生成表示量化步长与生成数据量之间关系的函数;
在生成所述函数的情况下,基于所述函数,在待编码帧的编码中设置依照目标代码量的量化步长。
7.根据权利要求6所述的方法,其特征在于,所述第一存储器单元存储除了与动态图像的分辨率和帧的编码方式对应以外,还与动态图像的位元深度相对应的多个系数集合;并且所述选择步骤包括获取表示待编码帧的位元深度的信息,并从所述第一存储器单元中选择依照分辨率、位元深度和待编码帧的编码方式的系数集合。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007-127104 | 2007-05-11 | ||
JP2007127104A JP2008283560A (ja) | 2007-05-11 | 2007-05-11 | 画像処理装置およびその方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101304532A true CN101304532A (zh) | 2008-11-12 |
CN101304532B CN101304532B (zh) | 2012-01-25 |
Family
ID=39969492
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200810097327XA Expired - Fee Related CN101304532B (zh) | 2007-05-11 | 2008-05-12 | 图像处理装置及其方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8358692B2 (zh) |
EP (1) | EP2028865A3 (zh) |
JP (1) | JP2008283560A (zh) |
CN (1) | CN101304532B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106851307A (zh) * | 2011-01-12 | 2017-06-13 | 佳能株式会社 | 数字图像序列编码方法和位流解码方法 |
CN113489976A (zh) * | 2021-07-29 | 2021-10-08 | 维沃移动通信有限公司 | 预测编码方法、装置和电子设备 |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4569840B2 (ja) * | 2007-09-12 | 2010-10-27 | ソニー株式会社 | 画像符号化装置、画像符号化方法 |
CA2706251C (en) | 2007-11-02 | 2015-06-30 | Ecole De Technologie Superieure | System and method for predicting the file size of images subject to transformation by scaling and a change of quality-controlling parameters |
US8295624B2 (en) * | 2007-12-03 | 2012-10-23 | Ecole De Technologie Superieure | Method and system for generating a quality prediction table for quality-aware transcoding of digital images |
JPWO2009157581A1 (ja) * | 2008-06-27 | 2011-12-15 | ソニー株式会社 | 画像処理装置及び画像処理方法 |
BRPI0904320A2 (pt) * | 2008-06-27 | 2015-06-30 | Sony Corp | Dispositivo e método de processamento de imagem |
CN101779469A (zh) * | 2008-06-27 | 2010-07-14 | 索尼公司 | 图像处理装置和图像处理方法 |
US8270745B2 (en) * | 2008-06-27 | 2012-09-18 | Sony Corporation | Image processing device and image processing method |
US8300961B2 (en) * | 2008-12-12 | 2012-10-30 | Ecole De Technologie Superieure | Method and system for low complexity transcoding of images with near optimal quality |
JP5136470B2 (ja) * | 2009-03-06 | 2013-02-06 | 富士通株式会社 | 動画像符号化装置及び動画像符号化方法 |
EP2285111A1 (en) * | 2009-08-07 | 2011-02-16 | Canon Kabushiki Kaisha | Method for sending compressed data representing a digital image and corresponding device |
CN103443843B (zh) | 2011-03-29 | 2016-08-17 | 瑞萨电子株式会社 | 显示装置和显示装置控制电路 |
CN103974060B (zh) * | 2013-01-31 | 2016-01-27 | 华为技术有限公司 | 视频质量调整方法和装置 |
US10609405B2 (en) | 2013-03-18 | 2020-03-31 | Ecole De Technologie Superieure | Optimal signal encoding based on experimental data |
US9338450B2 (en) | 2013-03-18 | 2016-05-10 | Ecole De Technologie Superieure | Method and apparatus for signal encoding producing encoded signals of high fidelity at minimal sizes |
US9661331B2 (en) | 2013-03-18 | 2017-05-23 | Vantrix Corporation | Method and apparatus for signal encoding realizing optimal fidelity |
CN107078852B (zh) * | 2017-01-18 | 2019-03-08 | 深圳市大疆创新科技有限公司 | 传输编码数据的方法、装置、计算机系统和移动设备 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69230268T2 (de) * | 1991-02-21 | 2000-04-13 | Nec Corp., Tokio/Tokyo | Kodierungsgerät zur Kompression von bewegten Bilddaten |
US5767986A (en) * | 1993-08-30 | 1998-06-16 | Sony Corporation | Picture encoding apparatus and method |
US5654760A (en) * | 1994-03-30 | 1997-08-05 | Sony Corporation | Selection of quantization step size in accordance with predicted quantization noise |
JP3050047B2 (ja) * | 1994-06-24 | 2000-06-05 | 日本ビクター株式会社 | 動画像符号化装置及び動画像符号化方法 |
JP3954656B2 (ja) * | 1994-09-29 | 2007-08-08 | ソニー株式会社 | 画像符号化装置及び方法 |
EP1045590A3 (en) * | 1999-04-13 | 2005-03-09 | Matsushita Electric Industrial Co., Ltd. | Transcoder and transcoding method with bit rate regulation |
US7085318B2 (en) * | 2000-06-15 | 2006-08-01 | Sony Corporation | Image processing system, image processing method, program, and recording medium |
US7308146B2 (en) * | 2002-09-30 | 2007-12-11 | Canon Kabushiki Kaisha | Digital video compression |
US7352808B2 (en) * | 2004-01-29 | 2008-04-01 | International Business Machines Corporation | System and method for the dynamic resolution change for video encoding |
-
2007
- 2007-05-11 JP JP2007127104A patent/JP2008283560A/ja active Pending
-
2008
- 2008-04-25 US US12/109,717 patent/US8358692B2/en not_active Expired - Fee Related
- 2008-05-09 EP EP20080156022 patent/EP2028865A3/en not_active Withdrawn
- 2008-05-12 CN CN200810097327XA patent/CN101304532B/zh not_active Expired - Fee Related
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106851307A (zh) * | 2011-01-12 | 2017-06-13 | 佳能株式会社 | 数字图像序列编码方法和位流解码方法 |
CN106851309A (zh) * | 2011-01-12 | 2017-06-13 | 佳能株式会社 | 错误恢复改进的视频编码和解码 |
US20180352236A1 (en) | 2011-01-12 | 2018-12-06 | Canon Kabushiki Kaisha | Video encoding and decoding with improved error resilience |
US10499060B2 (en) | 2011-01-12 | 2019-12-03 | Canon Kabushiki Kaisha | Video encoding and decoding with improved error resilience |
US10506236B2 (en) | 2011-01-12 | 2019-12-10 | Canon Kabushiki Kaisha | Video encoding and decoding with improved error resilience |
US10609380B2 (en) | 2011-01-12 | 2020-03-31 | Canon Kabushiki Kaisha | Video encoding and decoding with improved error resilience |
US11146792B2 (en) | 2011-01-12 | 2021-10-12 | Canon Kabushiki Kaisha | Video encoding and decoding with improved error resilience |
CN113489976A (zh) * | 2021-07-29 | 2021-10-08 | 维沃移动通信有限公司 | 预测编码方法、装置和电子设备 |
Also Published As
Publication number | Publication date |
---|---|
EP2028865A2 (en) | 2009-02-25 |
US8358692B2 (en) | 2013-01-22 |
CN101304532B (zh) | 2012-01-25 |
US20080279275A1 (en) | 2008-11-13 |
EP2028865A3 (en) | 2012-05-09 |
JP2008283560A (ja) | 2008-11-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101304532B (zh) | 图像处理装置及其方法 | |
CN1922890B (zh) | 分段可逆视频编码、译码方法及装置 | |
CN114467302A (zh) | 针对点云压缩的基于块的预测编码 | |
CN1980393B (zh) | 图像编码装置、方法及集成电路 | |
US6038258A (en) | Encoding and decoding system of motion image containing arbitrary object | |
CN101401434B (zh) | 用于改变视频图像序列的时间频率的方法和装置 | |
CN101854544A (zh) | 图像解码装置、程序、方法、及图像编码装置、程序、方法 | |
CN101622881A (zh) | 图像编码和图像解码的方法及装置 | |
CN103765893A (zh) | 使用用于定点变换的比特深度调整的视频编码方法及其设备,以及视频解码方法及其设备 | |
CN103931191A (zh) | 运动矢量编码设备、运动矢量编码方法和程序、运动矢量解码设备以及运动矢量解码方法和程序 | |
CN102113328A (zh) | 确定用于比较运动补偿视频编码中的图像块的度量的方法和系统 | |
EP3657801A1 (en) | Methods for encoding/decoding camera parameter information and devices corresponding thereto | |
CN101480055B (zh) | 视频编码设备和视频编码方法 | |
JP5176175B2 (ja) | 品質制御パラメータの変更及びスケーリングによって変換される画像のファイルサイズを予想するシステム、方法及びプログラム | |
CN102422642A (zh) | 动态图像编码装置、方法和程序以及动态图像解码装置、方法和程序 | |
WO2018014301A1 (zh) | 视频编码方法及装置 | |
CN101437162A (zh) | 图像解码装置及其方法、图像编码装置及其方法 | |
CN104125460A (zh) | 用于控制视频比特率的方法和设备 | |
CN116828184B (zh) | 视频编码、解码方法、装置、计算机设备和存储介质 | |
CN103517074A (zh) | 图像编码设备及其控制方法 | |
CN104380736A (zh) | 动态图像预测编码装置、动态图像预测编码方法、动态图像预测编码程序、动态图像预测解码装置、动态图像预测解码方法、动态图像预测解码程序 | |
Ridge | Efficient transform-domain size and resolution reduction of images | |
JP4799377B2 (ja) | 画像符号化装置 | |
CN109803147B (zh) | 基于视频纹理特征的变换处理方法及装置 | |
US7747093B2 (en) | Method and apparatus for predicting the size of a compressed signal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120125 Termination date: 20210512 |
|
CF01 | Termination of patent right due to non-payment of annual fee |