CN102348119B - 预测编码装置及其控制方法 - Google Patents

预测编码装置及其控制方法 Download PDF

Info

Publication number
CN102348119B
CN102348119B CN201110216359.9A CN201110216359A CN102348119B CN 102348119 B CN102348119 B CN 102348119B CN 201110216359 A CN201110216359 A CN 201110216359A CN 102348119 B CN102348119 B CN 102348119B
Authority
CN
China
Prior art keywords
unit
value data
data
coding
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201110216359.9A
Other languages
English (en)
Other versions
CN102348119A (zh
Inventor
望月成记
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of CN102348119A publication Critical patent/CN102348119A/zh
Application granted granted Critical
Publication of CN102348119B publication Critical patent/CN102348119B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明提供一种预测编码装置及其控制方法。所述预测编码装置对构成运动图像的各图像进行预测编码,该预测编码装置包括:预测处理单元,其被构造为对要编码图像的各预定块单位进行预测处理;变换单元,其适于对通过所述预测处理单元进行的所述预测处理的结果进行正交变换和量化,以生成多值数据;二值化单元,其被构造为将所述多值数据转换成二值数据;检测单元,其被构造为检测所述二值数据的量;编码单元,其被构造为对所述二值数据进行算术编码,以创建编码数据;以及多重化单元,其被构造为将表示由所述检测单元检测到的所述二值数据的量的信息多重化到所述编码数据,以生成编码数据流。

Description

预测编码装置及其控制方法
技术领域
本发明涉及预测编码装置及其控制方法。
背景技术
运动图像编码方式的示例有MPEG-4AVC:ISO/IEC14496-10,也称为H.264(以下称为MPEG-4AVC),该方式用在数字电视广播及视频记录媒介中。与传统的熵编码方式相比,MPEG-4AVC采用以下两种基于上下文的熵编码方式来提高编码效率:
·基于上下文自适应可变长编码(CAVLC,Context-basedAdaptiveVariableLengthCoding)
·基于上下文自适应二值算术编码(CABAC,Context-basedAdaptiveBinaryArithmeticCoding)
在这些方式中,CABAC进行算术编码如下。对要编码的数据进行二值化处理,以根据上下文(当前编码对象和周围状况)来计算二值数据(bin)的发生概率。然后将计算结果设置为编码数据。通过二值化处理输出的二值数据的长度依据输入到编码装置的视频信号以及编码条件而变化。由此,认识到可能会由于其性质而产生大量二值数据。CABAC存在诸如关于确保对二值数据的实时算术编码处理的担忧以及无法预先决定用以存储所生成的二值数据的存储区域的这类问题。
为了解决这些问题,提出了用于抑制编码中的二值数据量的方法。日本专利特开2007-020141号公报提出了这样一种方法:从正交变换的值中减去偏移值,然后对该值量化,从而削减由二值化处理产生的二值数据的量,以使得消减后的量与由原始二值化处理产生的二值数据的量相比变小。日本专利特开2007-020141号公报还提出一种运动矢量选择方法,该运动矢量与利用在运动矢量检测中提供最小评价值的运动矢量进行编码的情况相比,减少了二值数据量。
发明内容
然而,所提出的方法可能会由于以下两点原因而使原始编码条件下的图像质量劣化:
1)对在原始应用的编码条件下编码的正交变换后的变换系数值进行处理。
2)适用这样一种运动向量,其与利用使得评价值最小的运动向量进行编码的情况相比减少了二值数据量。
考虑到解码处理,二值数据量是算术解码处理后获得的信息。因此,需要假设最坏的情况而准备大于实际生成的二值数据量的冗余存储区域。如果不考虑最坏情况而分配限制大小的存储区域,则存储区域可能上溢(overflow),并且解码处理可能失败。
针对以下技术的需求正在增长,该技术能够通过在不使编码中的图像质量劣化的情况下、在算术解码前在解码装置中布置最佳二值存储区域以省略冗余存储区域,来避免由于二值存储区域的上溢而引起的解码处理失败。
根据实施例的一方面,本发明涉及一种预测编码装置,其对构成运动图像的各图像进行预测编码,该预测编码装置包括:预测处理单元,其被构造为对要编码图像的各预定块单位进行预测处理;变换单元,其适于对通过所述预测处理单元进行的所述预测处理的结果进行正交变换和量化,以生成多值数据;二值化单元,其被构造为将所述多值数据转换成二值数据;检测单元,其被构造为检测所述二值数据的量;编码单元,其被构造为对所述二值数据进行算术编码,以创建编码数据;以及多重化单元,其被构造为将表示由所述检测单元检测到的所述二值数据的量的信息多重化(multiplex)到所述编码数据,以生成编码数据流。
根据实施例的另一方面,本发明涉及一种预测编码装置的控制方法,所述预测编码装置对构成运动图像的各图像进行预测编码,所述控制方法包括:预测处理步骤,用于对要编码图像的各预定块单位进行预测处理;变换步骤,用于对所述预测处理步骤中的所述预测处理的结果进行正交变换和量化,以生成多值数据;二值化步骤,用于将所述多值数据转换成二值数据;检测步骤,用于检测所述二值数据的量;编码步骤,用于对所述二值数据进行算术编码,以生成编码数据;以及多重化步骤,用于将表示在所述检测步骤中检测到的所述二值数据的量的信息多重化到所述编码数据,以生成编码数据流。
根据以下参照附图对示例性实施例的描述,本发明的其他特征将变得清楚。
附图说明
图1是例示根据实施例的预测编码装置的布置的框图;
图2A至图2C是示出NAL单位(NALunit)和访问单位(accessunit)的结构的图;
图3A和图3B是用于说明“bin_infoSEI”的句法的图;
图4A和图4B是例示“bin_infoSEI”多重化的编码数据的图;
图5A和图5B是例示利用“bin_infoSEI”的解码处理的图;
图6A和图6B是例示利用“bin_infoSEI”的另一解码处理的图;
图7是示出根据第二实施例的“bin_infoSEI”生成方法的流程图;
图8A和图8B是例示利用“bin_infoSEI”的又一解码处理的图;
图9是例示根据实施例的解码装置的布置的框图。
具体实施方式
以下将参照附图描述本发明的实施例。
[第一实施例]
将参照图1的框图来描述根据本发明的第一实施例的预测编码装置的布置和处理序列,该预测编码装置通过例如MPEG-4AVC(ISO/IEC14496-10)方式来对构成运动图像的各图像进行预测编码。根据第一实施例的预测编码装置100对通过把要编码图像划分为例如8×8像素或16×16像素的各个块而获得的各个块单位(例如宏模块单位)进行处理。在图1的预测编码装置100中,各个块可以被构成为利用专用逻辑电路或存储器的硬件,或者可以被构成为通过CPU执行存储在存储器中的处理程序的软件。
预测方法确定单元101为针对要编码图像中的各个宏模块确定预测方法的处理单元。预测方法确定单元101通过使用要编码的输入图像以及从存储编码后图像的存储器103读出的编码后图像,执行简单的帧内预测或包括运动检测的帧间预测,由此计算表示编码效率的评价值。然后,预测方法确定单元101确定使计算出的编码效率最优的预测方法。当要编码的宏模块是I片(Slice)时,预测方法确定单元101确定预测像素块大小以及预测模式。当宏模块为P片或B片时,预测方法确定单元101从帧内预测和帧间预测中选择具有较高编码效率的预测。对于帧内预测,预测方法确定单元101确定诸如帧内预测像素块大小和帧内预测模式等的帧内预测编码参数。对于帧间预测,预测方法确定单元101确定诸如参照图像帧、宏模块划分模式以及运动向量等的帧间预测编码参数。
预测处理单元102根据由预测方法确定单元101指定的预测编码参数,由从存储器103读出的编码图像来生成预测图像。预测处理单元102将预测图像输出到局部解码单元105。另外,预测处理单元102生成用作要编码的宏模块与预测图像之间的差分的预测残差信号(predictionresidualsignal),并将其输出到正交变换/量化单元104。
正交变换/量化单元104针对各指定的像素块单位(例如8×8像素或4×4像素的各块单位),执行基于整数离散余弦变换和离散Hardamard变换的正交变换处理。仅对关于按照16×16像素的各块单位经历了帧内预测处理的亮度信号或色差信号、执行了各像素块的整数离散余弦变换的结果的DC(直流)分量,进行离散Hadamard变换。代码量控制单元106(稍后描述)以与指定量化参数对应的量化步长,对正交变换后的变换系数进行量化。量化数据被输出到熵编码单元107。
量化数据同时被输入到局部解码单元105。局部解码单元105对量化数据进行逆量化处理和逆正交变换处理(逆离散Hadamard变换和逆整数离散余弦变换)。局部解码单元105将从预测处理单元102输入的预测图像添加到获得的数据中,并进行解码处理。存储器103保持解码数据。保持在存储器103中的解码数据用于后续的帧内预测处理。另外,存储器103保持已经历解块滤波处理的解码数据。解块滤波处理后保持在存储器103中的解码数据用于后续的帧间预测处理。
熵编码单元107是针对各片输入数据进行利用CABAC(Context-basedAdaptiveBinaryArithmeticCoding,基于上下文自适应二值算术编码)的熵编码处理的处理单元。在熵编码单元107中,二值化单元107a将输入的多值数据转换成二值数据。二值数据存储器107b存储由二值化单元107a生成的二值数据。上下文计算单元107c根据上下文计算并保持二值数据的发生概率。算术编码单元107d根据从上下文计算单元107c提供的发生概率来进行算术编码。二值数据量检测单元107e通过对由二值化单元107a生成并存储在二值数据存储器107b中的二值数据进行计数,来检测针对各片生成的二值数据的量。
针对各图像,将由算术编码单元107d编码的数据以及表示由二值数据量检测单元107e检测的二值数据量的信息(二值数据信息)提供给多重化单元(multiplexingunit)108。注意,二值数据信息包括:按照从图像序列的起始开始的编码顺序的图像计数、表示要编码图像是否为参照图像的信息“ref_pic_flag”、以及表示构成图像的片的数量以及各片中的二值数据量的信息。要编码图像是否是参照图像,意思是指其是否用于对另一要编码的图像进行运动补偿预测编码。从预测方法确定单元101获得该信息。
代码量控制单元106是控制编码数据的代码量以避免编码图像缓冲器(CPB)的上溢或下溢的处理单元。代码量控制单元106基于在熵编码后从熵编码单元107提供的生成代码量来生成量化参数,并将该量化参数提供给正交变换/量化单元104。
多重化单元108将生成的编码流作为编码数据输出。在多重化单元108中,系统信息生成单元108a生成关于编码数据的系统信息。解码辅助信息生成单元108b生成解码辅助信息作为针对编码数据的附加信息。流生成单元108c对生成的系统信息、解码辅助信息以及编码数据以预定单位进行打包,并将它们作为编码数据流输出。这些处理单元构建了预测编码装置100。
在上述布置中,由熵编码单元107的二值化单元107a生成的二值数据为在熵编码期间生成的中间编码数据。二值数据存储器107b需要存储数据。即使考虑解码装置,在算术解码后也将二值数据生成作为中间编码数据,因此需要二值数据存储器。
然而,不能由最终编码数据获得生成的中间二值数据的量。解码装置仅在针对各编码单位(片)的算术解码完成之后才知晓二值数据生成量。因此很难确保与在算术解码前实际生成的二值数据量相对应的最佳二值数据存储器。因此,需要预先确保假定了最差情况方案的二值数据存储器。
在第一实施例中,为了获得解码装置中的解码前的二值数据量,多重化单元108将关于从熵编码单元107提供的二值数据的信息,作为解码辅助信息多重化到编码数据。
下面将说明由解码辅助信息生成单元108b生成的解码辅助信息。考虑到MPEG-4AVC要在各种网络中使用,因此定义了以下两层:
·进行视频编码处理的视频编码层(VideoCodingLayer,VCL)
·具有实际发送/存储系统的网络抽象化层(NetworkAbstractionLayer,NAL)
如图2A所示,在这些层中,按照由NAL头和RBSP(RawByteSequencePayload,原始字节序列负荷)构成的各个NAL单位对NAL打包。NAL头用于识别NAL单位的类型(nal_unit_type)并确定要编码图像是否是参照图像(nal_ref_idc)。对于nal_ref_idc值“00”,图像不是参照图像,而对于其他nal_ref_idc值则是参照图像。RBSP存储编码数据的实体。NAL单位的类型如图2B所示,基于识别号nal_unit_type来识别,并且包括以下内容:
·视频编码数据(片)
·作为关于视频编码数据序列的信息的SPS(SequenceParameterSet,序列参数集)
·作为关于视频编码数据图像的信息的PPS(PictureParameterSet,图像参数集)
·作为视频编码数据的附加信息的SEI(SupplementalEnhancementInformation,补充增强信息)
针对各图像的这些NAL单位的组合单位将称作访问单位。如图2C所示,该访问单位从称作AUD(AccessUnitDelimiter,访问单位分隔符)的NAL单位起始,该AUD包含能够识别访问单位中的图像类型的信息。在AUD之后是图像所需的诸如SPS、PPS和Slice数据的NAL单位。在这些NAL单位中,SPS和PPS由系统信息生成单元108a生成,SEI由解码辅助信息生成单元108b生成。流生成单元108c生成访问单位。
多重化单元108由从熵编码单元107针对各图像接收的二值数据信息来生成解码辅助信息作为SEI。对于SEI,准备能够使用用户定义的句法的“userdataSEI”。对于“userdataSEI”,定义了两种类型,即“userdataunregisteredSEI”和“userregisteredbyITU-TRecommendationT.35SEI”。图3A示出了在假设利用“userdataunregisteredSEI”对解码辅助信息进行多重化的前提下“userdataunregisteredSEI”的句法。
在图3A的句法要素中,“user_data_payload_byte”区域可以存储二值数据信息。“userdataunregisteredSEI”中的二值数据信息的存储可以由“uuid_iso_iec_11578”区域中的UUID来识别。要存储在“user_data_payload_byte”区域中的二值数据信息将称为“bin_info”,其SEI将称为“bin_infoSEI”。图3B示出了该句法的定义。
pic_pos是表示对应于“bin_info”的图像位置的信息,并且按照从序列的起始开始的编码顺序(解码装置中的解码顺序)来存储图像计数。num_slice表示构成图像的片的数量。接着,将对应于由num_slice表示的片的数量的、各片的二值数据量(kbits),存储作为bin_size。注意,该二值数据量可以被存储作为各图像的数据量。
根据上述句法,解码辅助信息生成单元108b基于从熵编码单元107接收的二值数据信息,来生成上述“bin_infoSEI”。流生成单元108c将“bin_infoSEI”多重化到访问单位中。
图4A和图4B例示了通过对“bin_infoSEI”被多重化的每个图像的4片进行编码而获得的编码数据。图4A示出了将“bin_infoSEI”多重化在各个图像上的示例。图4A示出了分别添加到典型图像I0和B6的SEI的内容。图像I0为编码顺序中的第一幅图像,并且pic_pos=0。由于针对4片对1个图像进行编码,因此num_slice=4。之后,针对这4片来存储图像中包含的各片的二值数据量bin_size[0]至bin_size[3]。
图像B6按照编码顺序是第11幅图像,并且pic_pos=10。由于图像B6针对4片进行编码,因此与图像I0类似,num_slice=4。而且,针对该4片存储各片的二值数据量bin_size[0]至bin_size[3]。图4A示出了将“bin_infoSEI”多重化到各访问单位上的示例。然而,如图4B所示,编码数据流中的各图像的SEI可以一次性多重化到编码数据流的起始处的预定图像的访问单位上。例如,多个图像(例如,对于一个GOP或者一个运动图像文件)的“bin_infoSEI”可以一次性被多重化到编码数据流的起始处的I图像的访问单位中。该多重化使得解码装置能够容易地预先获取多个图像的“bin_infoSEI”。
按照上述方式多重化的“bin_infoSEI”在解码装置中的下述情况下有效。
考虑具有能够在共享存储器中动态布置二值数据存储区域的机构的解码装置,可以通过虑及由MPEG-4AVC标准定义的上限二值数据生成量,来布置二值数据存储区域。然而,所生成的二值数据量接近由该标准定义的上限的频率低,并且在大多数情况下,考虑将冗余存储区域分配作为解码处理中的二值数据存储区域。例如,假设编码数据中的各图像的二值数据量如图5A所示的图所表示那样改变,并且解码装置具有由图中虚线所示的大小的存储区域。在该情况下,图中的阴影区域501变成解码装置中解码期间未使用的冗余存储区域。然而,可以使用“bin_infoSEI”来确定由图所代表的二值数据量的改变,因此如图5B所示,可以与各图像相对应地布置最佳二值存储区域。结果,可以在不布置冗余存储区域的情况下有效利用空白区域。
另外,假设编码数据中的各图像的二值数据如图6A所示的图所表示的那样改变,并且解码装置具有大小小于由标准定义的上限的存储区域,如图中虚线601所表示。在这种情况下,第13幅图像可能生成大量二值数据,而在算术解码的执行期间从二值存储区域上溢。甚至在这种情况下,可以基于由“bin_infoSEI”获得的值,来预先分配能够存储第13幅图像的二值数据量的存储区域,如图6B所示。这能够避免二值数据存储区域的上溢。
无须说,可以如图5B所示的示例那样,针对各图像分配最佳值的存储区域。如果不能分配扩展存储区域,则可以预先取消第13幅图像的解码,以执行诸如用另一图像进行替换的误差插值处理。通过这样避免二值存储器的上溢,能够很容易确保实时解码处理。
二值数据量不仅影响存储区域,而且影响算术解码处理的性能。公知CABAC中的算术解码需要1个时钟周期来处理1bin的二值数据。这样,CABAC解码处理的性能依赖于用于驱动算术解码处理单元的时钟频率。
例如,考虑能够动态改变算术解码处理单元的驱动时钟频率的解码装置,算术解码处理单元通常需要以由标准定义的上限二值数据量能够在预定时间内解码的时钟频率来驱动。为了做到这一点,使用根据本发明的解码辅助信息来进行解码,由此获得算术解码开始前的二值数据生成量。可以预先计算算术解码处理所需的性能。这针对各编码数据最佳的时钟频率驱动算术解码处理单元足以,并且能够预期电力消耗的降低。
考虑算术解码处理单元的驱动时钟频率被固定的解码装置,有时难以满足针对生成大量二值数据的编码数据的算术解码处理的性能。为了应对这一情况,解码装置可以被设计为在生成超出算术解码处理的性能的二值数据时执行任何恢复处理。然而,在这种情况下,也仅在算术解码之后获得二值数据是否已超出处理性能的信息。因此,算术解码处理所花费的时间可能被浪费,并且变得难以确保实时解码处理。即使在这种情况下,使用根据本发明的解码辅助信息也使得能够在算术解码开始前获得二值数据生成量。可以采用诸如跳过对算术解码处理产生重负的图像的措施,从而容易地确保实时解码处理。
图9是示出根据第一实施例的能够对通过上述预测编码装置100生成的编码数据进行解码的解码装置900的框图。参照图9,CPU901在存储器906中布置诸如解码处理所需的图像数据存储缓冲器和编码数据存储缓冲器的工作存储区。CPU901控制构建解码装置900的各个处理单元(稍后描述)。
时钟生成单元902生成用于驱动构建解码装置的各处理单元的时钟信号,并将它们提供给各处理单元。注意,由时钟生成单元902生成的时钟信号的时钟频率,可以由CPU901以可程序化的方式来控制。
编码数据输入单元903基于起始代码(0x000001)从输入编码数据流检测NAL单位的起始,并确定NAL单位的类型。NAL单位包含作为关于输入编码数据的序列的信息的SPS(SequenceParameterSet,序列参数集)、作为关于编码数据的图像的信息的PPS(PictureParameterSet,图像参数集)、作为编码数据的附加信息的SEI(SupplementalEnhancementInformation,补充增强信息)以及视频编码数据(片)。编码数据输入单元903将来自类型确定了的NAL单位中的SPS、PPS、SEI和Slice头的位流信息(将SPS、PPS、SEI和Slice头统称为位流信息)通知给CPU901。编码数据输入单元903将片数据发送给熵解码处理单元904。
熵解码处理单元904基于由CPU901设置的位流信息来进行熵解码,并将作为中间数据的二值数据写入存储器906中。
存储器I/F905对来自各处理单元的存储器访问请求进行调停,并控制对存储器906的读取/写入。
存储器906存储通过熵解码处理单元904解码的二值数据,以及通过预测解码处理单元907重构的图像数据。经由存储器I/F905在各个处理单元之间共享存储器906。
预测解码处理单元907是针对由16×16像素块构成的各宏模块单位进行预测解码处理的处理单元。预测解码处理单元907包括对二值数据解码的二值数据解码处理单元、通过帧内预测或帧间预测生成预测图像的预测图像生成单元、通过逆量化和逆正交变换重构残差信号的逆变换处理单元、通过将预测图像和残差信号相加来重构图像数据的图像解码处理单元、以及针对解码的图像数据进行解块滤波处理的解块滤波处理单元。
首先,预测解码处理单元907基于由CPU901设置的位流信息来从存储器906中读出二值数据,重构生成预测解码所需的帧内预测图像或帧间预测图像所需的预测模式、运动向量信息等,并且基于从存储器906读出的参照图像生成预测图像。然后,预测解码处理单元907通过逆量化和逆正交变换来重构残差信号,并且将预测图像和残差信号相加,从而重构图像数据。根据需要,预测解码处理单元907对重构的图像数据进行解块滤波处理,并将结果图像数据写入存储器906。
视频数据输出单元908按照CPU901指定的显示顺序,从存储器906读出由预测解码处理单元907重构的图像数据。视频数据输出单元908将垂直和水平同步信号添加给图像数据,然后将图像数据输出为视频信号。
当具有上述布置的解码装置900接收到由预测编码装置100生成的编码数据时,CPU901通过获取包含二值数据信息的SEI(即“bin_infoSEI”)能够获得二值数据生成量。如上所述,能够在执行视频解码处理前在存储器906中分配最佳二值数据缓冲区域。另外,时钟生成单元902可以生成具有最佳频率的时钟信号。
[第二实施例]
第二实施例中的预测编码装置具有与第一实施例中的预测编码装置100相同的布置,并且适用于图1。作为差别,将说明解码辅助信息生成单元108b中的解码辅助信息生成方法。
在第一实施例中,针对各图像多重化“bin_infoSEI”。然而,当实际生成的二值数据量小于解码装置中假设的二值存储区域时,认为“bin_infoSEI”没有必要。通常,对参照图像分配比非参照图像更大的代码量。由此,参照图像极有可能生成更大量的二值数据,而认为非参照图像的二值数据量小。
由此,当二值数据量等于或大于预定阈值时或者当要编码图像是参照图像时,从代码量方面而言,生成并多重化“bin_infoSEI”是有效的。预先将二值数据量的阈值设置为“bin_thr”。此外,针对从熵编码单元107输入到多重化单元108的二值数据信息,由“ref_pic_flag”来给出表示要编码图像是否是参照图像的信息。而且,给出表示二值数据量的信息作为“bin_cur”。当二值数据量等于或大于预定阈值并且要编码图像是参照图像时,生成“bin_infoSEI”。
将参照图7的流程图来说明第二实施例中的“bin_infoSEI”生成方法。用作多重化单元108的CPU可以通过执行(存储在ROM等中的)相应的程序来实现对应于流程图的处理。
当熵编码单元107向多重化单元108输入二值数据信息时,在步骤S701中解码辅助信息生成单元108b由“ref_pic_flag”值来确定要编码图像是否是参照图像。如果“ref_pic_flag”值为1并且要编码图像是参照图像(步骤S701中“是”),则处理转移到步骤S702。在步骤S702中,解码辅助信息生成单元108b将阈值“bin_thr”与输入二值数据量“bin_cur”比较。如果“bin_cur”等于或大于“bin_thr”(步骤S702中“是”),则在步骤S703中解码辅助信息生成单元108b由输入二值数据信息来生成“bin_infoSEI”。流生成单元108c将“bin_infoSEI”多重化到访问单位中。如果要编码图像不是参照图像(步骤S701中“否”)或者“bin_cur”小于“bin_thr”(步骤S702中“否”),则解码辅助信息生成单元108b不生成解码辅助信息。
在上面的描述中,输入二值数据量被认为是要编码的一个图像的数据量。然而,可以针对各片来比较数据量。在这种情况下,当任何片的数据量超过阈值时,解码辅助信息生成单元108b生成解码辅助信息。
以这种方式,根据第二实施例,解码辅助信息生成单元108b确定要编码图像是否是参照图像并确定二值数据量。仅对作为参照图像并且具有等于或大于阈值的二值数据量的要编码图像生成“bin_infoSEI”。这能够避免由于冗余“bin_infoSEI”引起的数据量的增加。在第二实施例中,生成条件规定要编码图像为参照图像并且二值数据量等于或大于阈值。然而,如果满足任一条件,则可以生成“bin_infoSEI”。
根据第二实施例,甚至解码装置也能够确定多重化“bin_infoSEI”生成临界二值数据量并进行解码处理。例如,假设编码数据中的各图像的二值数据量如图8A所示的图所表示的那样改变。阴影图像为参照图像,并且图中的虚线表示针对二值数据量设置的阈值“bin_thr”。在这种情况下,根据图7的流程图所示的方法,将“bin_infoSEI”多重化到作为参照图像并且具有等于或大于“bin_thr”的二值数据的图像I0、P0和P3。在解码装置中,如图8B所示,根据针对I0、P0和P3接收的“bin_infoSEI”来布置存储器。解码装置能够容易地在二值数据区域不短缺的情况下进行解码。
[其他实施例]
本发明的各方而还能够通过读出并执行记录在存储设备上的用于执行上述实施例的功能的程序的系统或装置的计算机(或诸如CPU或MPU的设备)、以及由系统或装置的计算机例如读出并执行记录在存储设备上的用于执行上述实施例的功能的程序来执行各步骤的方法来实现。鉴于此,例如经由网络或者从用作存储设备的各种类型的记录介质(例如计算机可读介质)向计算机提供程序。
虽然参照示例性实施例描述了本发明,但是应当理解,本发明不限于所公开的示例性实施例。应对所附权利要求的范围给予最宽的解释,以使其覆盖所有变型、等同结构和功能。

Claims (6)

1.一种预测编码装置,其对运动图像进行预测编码,该预测编码装置包括:
预测处理单元,其由要编码图像和预测的图像生成差分;
正交变换和量化单元,其进行正交变换和量化,以由所述预测处理单元生成的差分生成量化数据;
二值化单元,其将所述正交变换和量化单元生成的量化数据转换成二值数据;
检测单元,其在所述要编码图像的各片处检测所述二值化单元生成的二值数据的量;
算术编码单元,其进行算术编码,以由所述二值化单元生成的二值数据生成编码数据;以及
多重化单元,其由所述算术编码单元生成的编码数据生成编码数据流,其中所述编码数据流包括表示所述检测单元在所述要编码图像的各片处检测到的二值数据的量的信息。
2.根据权利要求1所述的预测编码装置,其中,所述编码数据流还包括表示所述要编码图像中有多少片的信息。
3.根据权利要求1或权利要求2所述的预测编码装置,其中,在所述检测单元检测到的二值数据的量大于阈值的情况下,所述多重化单元将所述算术编码单元生成的编码数据和表示所述检测单元在所述要编码图像的各片处检测到的二值数据的量的信息多重化。
4.根据权利要求1或权利要求2所述的预测编码装置,其中,在所述要编码图像用作另一要编码图像的参照图像的情况下,所述多重化单元将所述算术编码单元生成的编码数据和表示所述检测单元在所述要编码图像的各片处检测到的二值数据的量的信息多重化。
5.根据权利要求1或权利要求2所述的预测编码装置,其中,所述多重化单元生成的编码数据流的起始处的预定图像的访问单位包括表示所述检测单元在多个图像的各片处检测到的二值数据的量的信息。
6.一种预测编码装置的控制方法,所述预测编码装置对运动图像进行预测编码,所述控制方法包括:
预测处理步骤,用于由要编码图像和预测的图像生成差分;
正交变换和量化步骤,用于进行正交变换和量化,以由所述预测处理步骤中生成的差分生成量化数据;
二值化步骤,用于将所述正交变换和量化步骤中生成的量化数据转换成二值数据;
检测步骤,用于在所述要编码图像的各片处检测所述二值化步骤中生成的二值数据的量;
算术编码步骤,用于进行算术编码,以由所述二值化步骤中生成的二值数据生成编码数据;以及
多重化步骤,用于由所述算术编码步骤中生成的编码数据生成编码数据流,其中所述编码数据流包括表示在所述检测步骤中在所述要编码图像的各片处检测到的二值数据的量的信息。
CN201110216359.9A 2010-07-30 2011-07-28 预测编码装置及其控制方法 Expired - Fee Related CN102348119B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2010172727 2010-07-30
JP2010-172727 2010-07-30
JP2011141221A JP5706771B2 (ja) 2010-07-30 2011-06-24 動画像の予測符号化装置及びその制御方法、コンピュータプログラム
JP2011-141221 2011-06-24

Publications (2)

Publication Number Publication Date
CN102348119A CN102348119A (zh) 2012-02-08
CN102348119B true CN102348119B (zh) 2016-06-08

Family

ID=45526690

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110216359.9A Expired - Fee Related CN102348119B (zh) 2010-07-30 2011-07-28 预测编码装置及其控制方法

Country Status (3)

Country Link
US (1) US9113174B2 (zh)
JP (1) JP5706771B2 (zh)
CN (1) CN102348119B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9083976B2 (en) * 2008-09-05 2015-07-14 Freescale Semiconductor, Inc. Processing a video stream in real time based on binary information of the video stream
JP2014007469A (ja) * 2012-06-21 2014-01-16 Canon Inc 画像符号化装置及び画像符号化方法
JP5885604B2 (ja) * 2012-07-06 2016-03-15 株式会社Nttドコモ 動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法及び動画像予測復号プログラム
DE102015100727A1 (de) 2015-01-20 2016-07-21 Leica Mikrosysteme Gmbh Probentransfereinrichtung
WO2017169722A1 (ja) * 2016-03-28 2017-10-05 ソニー株式会社 画像処理装置および方法
JP6430045B2 (ja) * 2018-01-04 2018-11-28 株式会社Nttドコモ 動画像予測符号化方法及び動画像予測復号方法
CN110446047A (zh) * 2019-08-16 2019-11-12 苏州浪潮智能科技有限公司 视频码流的解码方法及装置
CA3163401A1 (en) * 2019-11-27 2021-06-03 Lg Electronics Inc. Method and apparatus for signaling picture partitioning information

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1529988A (zh) * 2001-11-16 2004-09-15 ��ʽ����Ntt����Ħ 图像编码方法、图像译码方法、图像编码装置、图像译码装置、程序、计算机数据信号、以及图像传送系统
CN1547854A (zh) * 2001-11-16 2004-11-17 株式会社Ntt都科摩 图像编码方法、图像译码方法、图像编码装置、图像译码装置、程序、计算机数据信号,以及图像传送系统
CN1633811A (zh) * 2001-11-16 2005-06-29 株式会社Ntt都科摩 图像编码方法、图像译码方法、图像编码装置、图像译码装置、程序、计算机数据信号,以及图像传送系统
CN101087417A (zh) * 2006-06-06 2007-12-12 松下电器产业株式会社 图像编码装置

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4034380B2 (ja) * 1996-10-31 2008-01-16 株式会社東芝 画像符号化/復号化方法及び装置
US6141053A (en) 1997-01-03 2000-10-31 Saukkonen; Jukka I. Method of optimizing bandwidth for transmitting compressed video data streams
US7646816B2 (en) 2001-09-19 2010-01-12 Microsoft Corporation Generalized reference decoder for image or video processing
US7586924B2 (en) * 2004-02-27 2009-09-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding an information signal into a data stream, converting the data stream and decoding the data stream
JP4856954B2 (ja) * 2005-06-08 2012-01-18 パナソニック株式会社 画像符号化装置
US7894597B2 (en) * 2005-10-12 2011-02-22 Cisco Technology, Inc. Categorization of telephone calls
JP4540585B2 (ja) * 2005-10-20 2010-09-08 パナソニック株式会社 符号化装置及び復号化装置
US20070171977A1 (en) 2006-01-25 2007-07-26 Shintaro Kudo Moving picture coding method and moving picture coding device
US8699583B2 (en) * 2006-07-11 2014-04-15 Nokia Corporation Scalable video coding and decoding
JP2008022383A (ja) * 2006-07-13 2008-01-31 Matsushita Electric Ind Co Ltd 画像符号化装置
WO2008125900A1 (en) * 2007-04-13 2008-10-23 Nokia Corporation A video coder
JP4513841B2 (ja) * 2007-08-28 2010-07-28 ソニー株式会社 符号化装置、符号化方法、符号化方法のプログラム及び符号化方法のプログラムを記録した記録媒体
US7710296B2 (en) * 2007-09-19 2010-05-04 Texas Instruments Incorporated N-bin arithmetic coding for context adaptive binary arithmetic coding
JP5330672B2 (ja) * 2007-10-29 2013-10-30 パナソニック株式会社 映像符号化装置及び映像符号化方法
JP4915350B2 (ja) * 2008-01-16 2012-04-11 日本電気株式会社 エントロピ符号化器、映像符号化装置、映像符号化方法および映像符号化プログラム
JP2009272712A (ja) * 2008-04-30 2009-11-19 Canon Inc 画像符号化装置及び画像符号化方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1529988A (zh) * 2001-11-16 2004-09-15 ��ʽ����Ntt����Ħ 图像编码方法、图像译码方法、图像编码装置、图像译码装置、程序、计算机数据信号、以及图像传送系统
CN1547854A (zh) * 2001-11-16 2004-11-17 株式会社Ntt都科摩 图像编码方法、图像译码方法、图像编码装置、图像译码装置、程序、计算机数据信号,以及图像传送系统
CN1633811A (zh) * 2001-11-16 2005-06-29 株式会社Ntt都科摩 图像编码方法、图像译码方法、图像编码装置、图像译码装置、程序、计算机数据信号,以及图像传送系统
CN101087417A (zh) * 2006-06-06 2007-12-12 松下电器产业株式会社 图像编码装置

Also Published As

Publication number Publication date
US20120027086A1 (en) 2012-02-02
CN102348119A (zh) 2012-02-08
JP5706771B2 (ja) 2015-04-22
JP2012050067A (ja) 2012-03-08
US9113174B2 (en) 2015-08-18

Similar Documents

Publication Publication Date Title
CN102348119B (zh) 预测编码装置及其控制方法
TWI504237B (zh) 視訊寫碼中之緩衝預測資料
CN101637028B (zh) 图像信息编码设备和编码方法
CN107211148B (zh) 在视频译码中调色板块大小的限制
CN102150427B (zh) 用于使用自适应环路滤波器进行视频编码的系统和方法
KR20210113390A (ko) 인트라 예측의 인코더, 디코더 및 대응하는 방법
CN102271257B (zh) 图像处理设备
TW201720150A (zh) 用於視訊寫碼之調色板預測初始化及合併
CN107660341A (zh) 切片级帧内块复制及其它视频译码改进
KR20110047697A (ko) 픽처 경계의 부호화 단위를 부호화, 복호화 하는 방법 및 장치
KR101147744B1 (ko) 비디오 트랜스 코딩 방법 및 장치와 이를 이용한 pvr
CN103931190A (zh) 图像编码设备、图像编码方法、图像解码设备、图像解码方法及存储介质
US20140286417A1 (en) Data encoding and decoding
US20160219289A1 (en) Data encoding and decoding
CN100401780C (zh) 在视频解码器中动态选择变换尺寸的方法和系统
KR102513756B1 (ko) 이미지 인코딩 방법, 디코딩 방법, 인코더, 디코더 및 저장매체
JP5472094B2 (ja) 動画像変換装置、動画像配信システム、動画像変換方法及びプログラム
JP2006262159A (ja) 動画像符号化装置及びその制御方法、コンピュータプログラム及び記憶媒体
KR102432580B1 (ko) 화상의 블록 기반 예측 코딩 및 디코딩
CN115668939A (zh) 视频数据编码和解码
JP2010035025A (ja) 符号化装置およびその方法
JP6874844B2 (ja) 動画像符号化装置、動画像符号化方法、及び、動画像符号化プログラム
JPH10164594A (ja) 動画像の圧縮符号化方法およびその装置
US20220038690A1 (en) Image data encoding and decoding
JP2014075708A (ja) 動画像符号化装置及び動画像符号化方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160608