CN1722847A - 数字信号转换方法和数字信号转换装置 - Google Patents

数字信号转换方法和数字信号转换装置 Download PDF

Info

Publication number
CN1722847A
CN1722847A CN 200510089451 CN200510089451A CN1722847A CN 1722847 A CN1722847 A CN 1722847A CN 200510089451 CN200510089451 CN 200510089451 CN 200510089451 A CN200510089451 A CN 200510089451A CN 1722847 A CN1722847 A CN 1722847A
Authority
CN
China
Prior art keywords
signal
conversion
decoding
orthogonal transform
digital signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200510089451
Other languages
English (en)
Other versions
CN1722847B (zh
Inventor
柳原尚史
泉伸明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN1722847A publication Critical patent/CN1722847A/zh
Application granted granted Critical
Publication of CN1722847B publication Critical patent/CN1722847B/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

第一格式(DV视频信号)的输入数字信号,通过使其成帧被解成帧部分(11)取消,然后由可变长度解码(VLD)部分(12)解码,由逆量化(IQ)部分(13)逆量化,由逆加权(IW)部分(14)逆加权,被恢复到可变长度的代码。然后,在正交变换域(频域)由分辨率转换部分(16)对逆加权的视频信号进行需要的分辨率转换。此后,分辨率转换的视频信号被加权(W)部分(18)加权,然后由量化(Q)部分(19)量化,由可变长度编码(VLC)部分(20)可变长度编码,以第二格式(MPEG视频信号)的数字信号输出。

Description

数字信号转换方法和数字信号转换装置
本发明专利申请是以下发明专利申请的分案申请:
申请号:98801684.2;申请日:1998年11月05日;发明名称:数字信号转换方法和数字信号转换装置
技术领域
本发明涉及通过使用正交变换诸如离散余弦变换(DCT)对压缩编码的数字信号的转换处理,尤其涉及数字信号转换方法和数字信号转换装置,用于转换不同格式的压缩视频信号之间的分辨率。
背景技术
传统上,离散余弦变换(DCT)(一种正交变换编码)已经被用作编码系统,用于有效地压缩编码静止画面数据和动态画面数据。在处置这类已经进行了正交变换的数字信号时,有时必须改变分辨率或变换基。
例如,若具有家用数字视频格式例如720×480像素的分辨率的第一正交变换的数字信号要被转换为具有所谓MPEG1格式的360×240像素的分辨率的第二正交变换的数字信号,则对第一信号进行逆正交变换,以便恢复空间域的信号,然后进行诸如插值和稀化(thinning)的变换处理,以便再次执行正交变换,这样将第一信号转换为第二信号。
以该方式,通常的情况是正交变换的数字信号被逆变换一次,以便恢复原始信号,然后由需要的变换运算处理,然后再次执行正交变换。
图28示出了用于对已经进行了DCT的数字信号进行上述分辨率转换的传统数字信号处理装置的示例结构。
在该传统数字信号转换装置中,所谓“DV格式”(一种家用数字视频信号的格式)的视频信号(以下称为DV视频信号),被作为第一格式的数字信号输入,符合所谓MPEG(运动图像专家组)标准的格式的视频信号(以下称为MPEG视频信号),被作为第二格式的数字信号输出。
解成帧(de-framing)部分51用于消除DV视频信号的成帧。在该解成帧部分51中,按照所谓DV格式成帧的DV视频信号被恢复为可变长度代码。
可变长度解码(VLD)部分52对由解成帧部分51恢复为可变长度代码的视频信号进行可变长度解码。以DV格式压缩的数据被以固定速率压缩,这样其数据量被减少到大约原始信号的1/5,并由可变长度编码来编码,以便提高数据压缩效率。可变长度解码部分52进行对应于该可变长度编码的解码。
逆量化(IQ)部分53对由可变长度解码部分52解码的视频信号进行逆量化。
逆加权(IW)部分54进行逆加权,该逆加权是对由逆量化部分53逆量化的视频信号进行的加权的逆运算。
通过利用人的视觉对高频侧的失真不很敏感的特性,加权运算是为了减少视频信号的较高频率分量的DCT系数的值。这样,具有0值的高频系数的数目增加,可变长度编码效率可以被提高。结果是,在某些情况下,可以减少DCT变换的算术运算量。
逆离散余弦变换(IDCT)部分55对由逆加权部分54逆加权的视频信号进行逆DCT(逆离散余弦变换),这样将DCT系数恢复为空间域的数据,即像素数据。
然后,分辨率转换部分56对由逆离散余弦变换部分55恢复为像素数据的视频信号进行需要的分辨率转换。
离散余弦变换(DCT)部分57对由分辨率转换部分56分辨率转换的视频信号进行离散余弦变换(DCT),这样再次将视频信号转换为正交变换系数(DCT系数)。
加权(W)部分58对分辨率转换并转换为DCT系数的视频信号进行加权。该加权和上述的一样。
量化(Q)部分59量化由加权部分58加权的视频信号。
然后,可变长度编码(VLC)部分60对由量化部分59量化的视频信号进行可变长度编码,输出结果信号作为MPEG视频信号。
上述的“MPEG”是ISO/IEC JTC1/SC29(国际标准化组织/国际电工委员会,联合技术委员会1/分委员会29)的运动图像专家组的缩写。ISO11172标准作为MPEG1标准,ISO13818标准作为MPEG2标准。在这些国际标准中,在多媒体多路复用部分ISO11172-1和ISO13818-1被标准化,在视频部分ISO11172-2和ISO13818-2被标准化,在音频部分ISO11172-3和ISO13818-3被标准化。
按照作为图像压缩编码标准的ISO11172-2或ISO13818-2,在画面(帧或场)基础上通过使用画面在时间或空间方向的相关,图像信号被压缩编码,在空间方向上相关的使用是通过使用DCT编码来实现的。
另外,该正交变换,诸如DCT被各种类型的画面信息压缩编码诸如JPEG(联合图像编码专家组)所广泛采用。
通常,正交变换通过将时域或空间域的原始信号转换到正交变换域,诸如频域,使得压缩编码具有高的压缩效率和出色的可再现性。
上述的“DV格式”用于将数字视频信号的数据量压缩到大约1/5,以分量记录在磁带上。DV格式用于家用数字视频装置和一些专业用数字视频装置。该DV格式通过将离散余弦变换(DCT)和可变长度编码(VLC)结合,实现了视频信号的有效压缩。
同时,对于诸如离散余弦变换(DCT)的正交变换和逆正交变换,通常需要大量的计算。因而,带来的问题是,上述的视频信号的分辨率转换不能有效地进行。同样,由于随着计算量的增加,错误被累积,带来了信号劣化的问题。
本发明的公开
考虑到本技术的前述状态,本发明的一个目的是提供一种数字信号转换方法和数字信号转换装置,能够通过减少由用于转换到不同格式的分辨率转换所处理的信号的数据量的算术处理量,使诸如分辨率转换的转换处理有效且较少劣化。
为了解决前述的问题,根据本发明的一种数字信号转换方法包括:数据提取步骤,从包括预定单元的正交变换系数块的第一格式的数字信号的相应块中提取一部分正交变换系数,从而构成部分块;逆正交变换步骤,在所述部分块的基础上,对构成每个部分块的正交变换系数进行逆正交变换;部分块连接步骤,连接由逆正交变换处理的所述部分块,从而构成所述预定单元的新块;和正交变换步骤,在所述块的基础上,对所述新块进行正交变换,从而产生包括所述预定单元的所述新正交变换块的第二数字信号。
同样,为了解决前述的问题,根据本发明的一种数字信号转换方法包括:逆正交变换步骤,对包括预定单元的正交变换系数块的第一格式的数字信号,基于所述块进行逆正交变换;块划分步骤,划分由逆正交变换处理的所述第一格式的数字信号的每个块;正交变换步骤,基于划分的块,对构成每个划分的块的正交变换系数进行正交变换;和数据放大步骤,用预定值的正交变换系数插值到每个正交变换的块以构成所述预定单元,从而产生第二格式的数字信号。
同样,为了解决前述的问题,根据本发明的一种数字信号转换装置包括:解码装置,用于解码包括预定单元的正交变换系数的第一格式的数字信号;逆量化装置,用于对所述解码的数字信号进行逆量化;分辨率转换装置,用于从所述逆量化的数字信号的预定单元的正交变换系数块的相邻块提取一部分正交变换系数,从而构成部分块,转换分辨率;量化装置,用于量化由分辨率转换处理的所述数字信号;和编码装置,用于编码所述量化的数字信号,从而产生第二格式的数字信号。
同样,为了解决前述的问题,根据本发明的一种数字信号转换装置包括:解码装置,用于解码通过使用正交变换压缩编码的第一格式的数字信号;逆量化装置,用于对所述解码的数字信号逆量化;分辨率转换装置,用于将预定值的正交变换系数插值到所述逆量化的数字信号的每个预定块,从而构成所述预定单元,转换分辨率;量化装置,用于量化由分辨率转换处理的所述数字信号;和编码装置,用于编码所述逆量化的数字信号,从而产生第二格式的数字信号。
同样,为了解决前述的问题,根据本发明的一种数字信号转换方法,用于将包括预定单元的正交变换系数块的第一格式的数字信号转换为包括另一预定单元的新正交变换系数块的第二格式的数字信号。在该方法中,通过利用包含在所述第一格式的数字信号中的数据量信息,控制所述第二格式的数字信号的数据量。
同样,为了解决前述的问题,根据本发明的一种数字信号转换装置,用于将包括预定单元的正交变换系数块的第一格式的数字信号转换为包括另一预定单元的新正交变换系数块的第二格式的数字信号,该装置包括:解码装置,用于解码所述第一格式的数字信号;逆量化装置,用于对所述解码的数字信号进行逆量化;信号转换装置,用于伴随所述逆量化的数字信号的格式转换,进行信号处理;量化装置,用于量化由信号处理处理的所述数字信号;数据量控制装置,用于控制所述量化装置的数据量;和编码装置,用于编码其数据量被所述数据量控制装置控制而量化的数字信号,从而产生所述第二格式的数字信号。
同样,为了解决前述的问题,根据本发明的一种数字信号转换方法,用于将第一格式的数字信号转换为第二格式的数字信号。该方法包括:解码步骤,解码所述第一格式的数字信号;信号转换步骤,将所述第一格式的解码的数字信号转换为所述第二格式的数字信号;编码步骤,编码所述第二格式的数字信号;和加权处理步骤,整体地进行所述第一格式的数字信号的逆加权和所述第二格式的数字信号的加权。
同样,为了解决前述的问题,根据本发明的一种数字信号转换装置,用于将第一格式的数字信号转换为第二格式的数字信号。该装置包括:解码装置,用于解码所述第一格式的数字信号;信号转换装置,用于将所述第一格式的解码的数字信号转换为所述第二格式的数字信号;编码装置,用于编码所述第二格式的数字信号;和加权处理装置,用于整体地进行所述第一格式的数字信号的逆加权和所述第二格式的数字信号的加权。
同样,为了解决前述的问题,根据本发明,对带运动检测的压缩编码的输入信息信号进行带运动补偿的解码,对该解码信号进行信号转换处理。然后,基于所述输入信息信号的运动矢量信息,对带运动检测的转换的信号进行压缩编码处理。
同样,为了解决前述的问题,根据本发明,对输入信息信号进行部分解码处理,所述输入信息信号由包括带运动检测的预测编码和正交变换编码的压缩编码进行了处理,从而获得正交变换域的解码的信号。然后,对正交变换域的解码的信号进行信号转换处理,通过使用基于所述输入信息信号的运动矢量信息的运动检测,对所述转换的信号进行带运动补偿预测的压缩编码处理。
同样,为了解决前述的问题,根据本发明,对输入信息信号进行部分解码处理,所述输入信息信号由包括带运动检测的预测编码和正交变换编码的压缩编码处理,从而获得正交变换域的信号。然后,对该信号进行信号转换处理,通过加上基于所述输入信息信号的运动矢量信息而转换的运动矢量信息,对所述转换的信号进行压缩编码处理。
同样,为了解决前述的问题,根据本发明,解码第一格式的数字信号,所述第一格式的数字信号具有提前加上的动态模式/静态模式信息,对解码的信号进行信号转换处理。然后,对所述转换的信号的每个预定块,根据所述动态模式/静态模式信息,区别是否进行帧间差分编码。基于区别的结果,编码所述转换的信号,输出通过使用帧间差的编码处理的第二格式的数字信号。
同样,为了解决前述的问题,根据本发明,对第一格式的数字信号进行部分解码处理,从而获得正交变换域的信号。对所述正交变换域的信号进行信号转换处理,对所述转换的信号的每个预定块,根据所述转换的信号的帧间差的绝对值的最大值,区别是否进行帧间差分编码。基于区别的结果,编码所述转换的信号,输出第二格式的数字信号。
另外,为了解决前述的问题,根据本发明,对包括由帧内编码处理的帧内编码的信号和由带运动检测的正向和双向帧间预测编码处理的正向预测编码信号和双向预测编码信号的第一格式的数字信号,对帧内编码的信号和正向预测编码信号进行逆正交变换。基于逆正交变换输出,产生要加到部分解码的正向预测编码的信号和双向预测编码的信号的运动补偿输出。对运动补偿输出进行正交变换,将正交变换输出加到所述部分解码的正向预测编码的信号和双向预测编码的信号。对基于相加输出的信号进行压缩编码,输出第二格式的数字信号。
附图的简要说明
图1是示出根据本发明的第一个实施例的数字信号转换装置的示例结构的方框图。
图2示出在正交变换域的分辨率转换的原理。
图3示出在正交变换域的分辨率转换的原理。
图4A至4C示意地示出了通过根据本发明的第一个实施例的数字信号转换,DV视频信号被转换为MPEG视频信号的状态。
图5示出DV格式和MPEG格式之间的关系。
图6示出分辨率转换处理的基本计算过程。
图7A和7B示出DV格式的“静态模式”和“动态模式”。
图8示出在“静态模式”中转换处理的过程。
图9A至9C是示出根据本发明的第二个实施例的数字信号转换装置的示例结构的方框图。
图10示出在图像的放大中转换处理的过程。
图11是示出根据本发明的第三个实施例的数字信号转换装置的示例结构的方框图。
图12是示出根据本发明的第四个实施例的数字信号转换装置的示例结构的方框图。
图13是示出根据本发明的第五个实施例的数字信号转换装置的示例结构的方框图。
图14是示出根据本发明的第六个实施例的数字信号转换装置的示例结构的方框图。
图15是示出根据本发明的第七个实施例的数字信号转换装置的示例结构的方框图。
图16是示出在本发明的第七个实施例中,当DV视频信号被转换为MPEG信号时,用于设定每帧的每个宏块(MB)的量化器比例的基本过程的流程图。
图17是示出在本发明的第七个实施例中,通过使用预定量化器比例施加反馈到下一帧的基本过程的流程图。
图18是示出用于将MPEG视频信号转换为DV视频信号的传统数字信号转换装置的示例结构的方框图。
图19是示出根据本发明的第八个实施例的数字信号转换装置的示例结构的方框图。
图20是示出根据本发明的第九个实施例的数字信号转换装置的示例结构的方框图。
图21是示出根据本发明的第十个实施例的数字信号转换装置的示例结构的方框图。
图22是示出根据本发明的第十一个实施例的数字信号转换装置的示例结构的方框图。
图23是示出根据本发明的第十二个实施例的数字信号转换装置的示例结构的方框图。
图24示出在本发明的第十二个实施例中的正交变换域中的运动补偿和运动估计处理,示出了宏块B在参考画面的多个宏块上伸展的状态。
图25示出在本发明的第十二个实施例中的正交变换域中的运动补偿和运动估计处理,示出了参考宏块的转换处理。
图26示出在本发明的第十二个实施例中的正交变换域中的运动补偿和运动估计处理,示出了参考宏块的转换过程。
图27是示出根据本发明的第十三个实施例的数字信号转换装置的示例结构的方框图。
图28是示出传统的数字信号转换装置的示例结构的方框图。
实现本发明的最好模式
下面参考附图说明本发明的优选实施例。
首先,将描述根据本发明的数字信号转换装置的结构,然后将参考该结构描述根据本发明的数字信号转换方法。
图1示出作为本发明的第一个实施例的数字信号转换装置的主要部分的示例结构。尽管信号转换以分辨率转换为例,但实际上信号转换不限于分辨率转换,各种类型的信号处理诸如格式转换和滤波处理可以被采用。
在该数字信号转换装置中,上述所谓“DV格式”的视频信号(以下称为DV视频信号)被作为第一数字信号输入,符合MPEG(运动图像专家组)标准的格式的视频信号(以下称为MPEG视频信号)被作为第二数字信号输出。
解成帧部分11用于消除DV视频信号的成帧。在该解成帧部分11中,按照预定格式(所谓DV格式)成帧的DV视频信号被恢复为可变长度代码。
可变长度解码(VLD)部分12对由解成帧部分11恢复为可变长度代码的视频信号进行可变长度解码。
逆量化(IQ)部分13对由可变长度解码部分12解码的视频信号进行逆量化。
逆加权(IW)部分14进行逆加权,该逆加权是对由逆量化部分13逆量化的视频信号进行的加权的逆运算。
若进行分辨率转换,作为信号转换处理的例子,则分辨率转换部分16在正交变换域(频域)中对由逆加权部分14逆加权的视频信号进行需要的分辨率转换。
加权(W)部分18对由分辨率转换处理的视频信号进行加权。
量化(Q)部分19量化由加权部分18加权的视频信号。
然后,可变长度编码(VLC)部分20对由量化部分19量化的视频信号进行可变长度编码,输出结果信号作为MPEG视频信号。
可以使根据图1所示的本发明的上述数字信号转换装置的每个部件的结构类似于图28所示的传统的数字信号转换装置的每个部件的结构。
然而,根据本发明的数字信号转换装置不同于传统的数字信号转换装置之处在于,在分辨率转换部分16之前和之后没有提供逆离散余弦变换(IDCT)部分和离散余弦变换(DCT)部分。
即,在传统数字信号转换装置中,输入的第一格式的数字信号的正交变换系数被逆正交变换以便被恢复为空间域(在频率轴上)的数据,然后进行需要的转换运算。因此,再次进行正交变换,以便将数据恢复为正交变换系数。
相反,在根据本发明的数字信号转换装置中,在正交变换系数域(频域)中进行第一格式的输入数字信号的正交变换系数的需要的转换运算,在用于进行诸如分辨率转换的转换处理的装置之前和之后没有提供逆正交变换装置和正交变换装置。
现在参考图2和3描述分辨率转换部分16中的分辨率转换处理的原理。
在图2中,输入正交变换矩阵产生部分1产生表示已经对输入数字信号5预先进行的正交变换的正交变换矩阵Ts(k)的逆矩阵Ts(k) -1,将该逆矩阵送给变换矩阵产生部分3。输出正交变换矩阵产生部分2产生对应于表示将要对输出数字信号进行的逆正交变换的逆变换矩阵Td(L) -1的正交变换矩阵Td(L),将该正交变换矩阵送给变换矩阵产生部分3。变换矩阵产生部分3产生用于进行诸如频域内的分辨率转换的转换处理的变换矩阵D,将该变换矩阵送给信号转换部分4。信号转换部分4转换已经由正交变换转换到频域的输入数字信号5,同时保持诸如频域的正交变换域,产生输出数字信号6。
特别地,如图3中所示,通过使用正交变换矩阵Ts(k),原始时域(或空间域)的信号(原始信号)A被转换到频域,以产生频率信号B1(对应于输入数字信号5)。该频率信号B1被信号转换部分4缩减到N/L(或者放大),以产生频率信号B2(对应于输出数字信号6)。通过使用逆变换矩阵Td(L) -1,该频率信号B2被逆正交变换,以产生时域的信号C。
在图3的例子中,一维原始信号A的每个转换块被正交变换,每个转换块长度为k,频域的所得到的转换块的m个单元的相邻块,即具有L(=k×m)的长度的连续频率信号,被转换为具有N(N<L)的长度的块,即整体缩减到N/L。
在下面的描述中,具有长度为n的正交变换基矢量 e 1e 2,…, e n被安排在相应行的矩阵(正交变换矩阵)被表示为T(n),其逆变换矩阵被表示为T(n) -1。在该描述中, x代表x矢量。在该情况下,每个矩阵为n阶正向矩阵(forwardmatrix)。例如,n=8的一维DCT变换矩阵T(8)由下面的等式(1)表示。
T ( 8 ) = e 1 ‾ e 2 ‾ e 3 ‾ e 4 ‾ e 5 ‾ e 6 ‾ e 7 ‾ e 8 ‾ = 1 2 1 / 2 1 / 2 1 / 2 1 / 2 1 / 2 1 / 2 1 / 2 1 / 2 cos ( π / 16 ) cos ( 3 π / 16 ) cos ( 5 π / 16 ) cos ( 7 π / 16 ) cos ( 9 π / 16 ) cos ( 11 π / 16 ) cos ( 13 π / 16 ) cos ( 15 π / 16 ) cos ( 2 π / 16 ) cos ( 6 π / 16 ) cos ( 10 π / 16 ) cos ( 14 π / 16 ) cos ( 18 π / 16 ) cos ( 22 π / 16 ) cos ( 26 π / 16 ) cos ( 30 π / 16 ) cos ( 3 π / 16 ) cos ( 9 π / 16 ) cos ( 15 π / 16 ) cos ( 21 π / 16 ) cos ( 27 π / 16 ) cos ( 33 π / 16 ) cos ( 39 π / 16 ) cos ( 45 π / 16 ) cos ( 4 π / 16 ) cos ( 12 π / 16 ) cos ( 20 π / 16 ) cos ( 28 π / 16 ) cos ( 36 π / 16 ) cos ( 44 π / 16 ) cos ( 52 π / 16 ) cos ( 60 π / 16 ) cos ( 5 π / 16 ) cos ( 15 π / 16 ) cos ( 25 π / 16 ) cos ( 35 π / 16 ) cos ( 45 π / 16 ) cos ( 55 π / 16 ) cos ( 65 π / 16 ) cos ( 75 π / 16 ) cos ( 6 π / 16 ) cos ( 18 π / 16 ) cos ( 30 π / 16 ) cos ( 42 π / 16 ) cos ( 54 π / 16 ) cos ( 66 π / 16 ) cos ( 78 π / 16 ) cos ( 90 π / 16 ) cos ( 7 π / 16 ) cos ( 21 π / 16 ) cos ( 35 π / 16 ) cos ( 49 π / 16 ) cos ( 63 π / 16 ) cos ( 77 π / 16 ) cos ( 91 π / 16 ) cos ( 105 π / 16 ) . . . ( 1 )
在图3中,当已经通过使用正交变换矩阵Ts(k)被正交变换到频域的输入数字信号5的正交变换块的大小是k时,即,当基长度等于k时,输入正交变换矩阵产生部分1产生逆正交变换矩阵Ts(k) -1,输出正交变换矩阵产生部分2产生具有基长度L(=k×m)的正交变换矩阵Td(L)
在此,由输入正交变换矩阵产生部分1产生的逆正交变换矩阵Ts(k) -1,对应于在产生输入数字信号5中的正交变换处理的逆处理,由输出正交变换矩阵产生部分2产生的正交变换矩阵Td(L),对应于在解码由信号转换部分4转换的输出数字信号中,即将信号转换到时域中的逆正交变换处理的逆处理。这些正交变换矩阵产生部分1和2都可以产生任意长度的基矢量。
正交变换矩阵产生部分1和2可以是同样的正交变换矩阵产生部分。在这种情况下,正交变换矩阵Ts(k)和Td(L)变成同样类型的正交变换矩阵,除了它们的基长度彼此不同。每个不同的正交变换系统都存在正交变换矩阵产生部分。
接着,变换矩阵产生部分3通过在对角线安排由输入正交变换矩阵产生部分1产生的m个单元的逆正交变换矩阵Ts(k) -1,产生L阶正向矩阵A,如下面的等式(2)所示。当输出数字信号6的基长度等于N时,变换矩阵产生部分3取出正交变换矩阵Td(L)的N个单元的低频基矢量,产生N行L列的矩阵B。
Figure A20051008945100151
Figure A20051008945100152
然而,在表达式中,当Td(L)由如下基矢量表示时, e 1e 2,…, e N是N个单元的低频基矢量。
Figure A20051008945100161
然后,计算等式
D=α·B·A                        …(5)
以产生N行L列的矩阵D。该矩阵D是变换矩阵,用于以N/L的缩减率(或放大率)转换分辨率。在该等式中,α是标量值或矢量值,是水平校正(levelcorrection)的系数。
图2的信号变换部分4将频域的输入数字信号B1的m个块收集为一组,将该信号分为具有L大小的元块(meta-block)(其中一个元块包括m个块),如图3所示。如果输入数字信号B1的长度不是L的倍数,该信号用诸如0的伪(dummy)数据补充和填满,变成L的倍数。这样产生的元块由Mi(其中i=0,1,2,…)来表示。
上述的分辨率转换处理的原理在由本受让人1998年6月16日提交的PCT/JP98/02653中详细描述。
下面参考上述的数字信号转换装置的结构描述第一个实施例的数字信号转换方法。
图4A至4C示意地示出了通过根据本发明的实施例的数字信号转换,DV视频信号被转换为MPEG视频信号中的处理。该处理主要由图1所示的本发明的实施例的数字信号转换装置中的分辨率转换部分16来进行。
在下面的描述中,一维DCT系数块被用作例子。但是,两维DCT系数的处理可以类似地进行。
首先,低频侧的四个DCT系数被从相邻块(i)和(i+1)的每个中取出,块(i)和(i+1)每个包括第一格式的数字信号的8个DCT系数,如图4A所示。即,在块(i)的8个DCT系数a0,a1,a2,a3,…,a7中,只有低频侧的4个DCT系数a0,a1,a2,a3被取出,得出具有DCT系数的数目减少到1/2的部分块,类似地,在块(i+1)的8个DCT系数b0,b1,b2,b3,...,b7中,只有低频侧的4个DCT系数b0,b1,b2,b3被取出,得出具有DCT系数的数目减少到1/2的部分块。取出在低频侧的DCT系数的运算是基于视频信号被频率转换时能量集中于DC和AC的低频的特性。
然后,对包括4个DCT系数的每个部分块进行4点逆离散余弦变换(4点IDCT),这样获得缩减的像素数据。这些像素数据被表示为图4B中的像素数据p0,p1,p2,p3和像素数据p4,p5,p6,p7。
接着,包括由逆离散余弦变换处理的缩减的像素数据的每个部分块被连接,以产生具有与原始块相同大小的块。即,像素数据p0,p1,p2,p3和像素数据p4,p5,p6,p7被连接,以产生包括8个像素数据的新块。
然后,对包括8个像素数据的新块进行8点离散余弦变换,这样产生包括8个DCT系数c0,c1,c2,c3,...,c7的一个块(j),如图4C所示。
通过上述的过程,通过将每个预定块单元的正交变换系数(DCT系数)的数目稀化到一半,视频信号可以被转换为不同分辨率格式的视频信号。当DCT系数的数目要被稀化到1/4时,上述处理被连续进行两次。
例如,上述分辨率转换处理可以被应用到从DV格式到MPEG1格式的转换。
现在将参考图5描述DV格式和MPEG格式之间的关系以及这些格式之间的格式转换。
特别地,对于符合图5所示的NTSC制式的视频信号的情况,DV格式的视频信号是具有720×480像素的分辨率的压缩视频信号,亮度信号的采样频率和两个色差信号的采样频率的比率等于4∶1∶1。MPEG1格式的视频信号是具有360×240像素的分辨率的压缩视频信号,亮度信号的采样频率和两个色差信号的采样频率的比率等于4∶2∶0。因而,在这种情况下,通过根据本发明的上述分辨率转换处理,在亮度(Y)信号的水平和垂直方向DCT系数的数目可以被减少到1/2,在色差(C)信号的垂直方向的DCT系数的数目可以被减少到1/4。
由于奇数行和偶数行交替地采用4∶2∶0和4∶0∶2的值,4∶2∶0的比率表示奇数行或偶数行的值。
另一方面,对于符合PAL制式的视频信号的情况,DV格式的视频信号是具有720×576像素的分辨率的压缩视频信号,亮度信号的采样频率和两个色差信号的采样频率的比率等于4∶2∶0。MPEG1格式的视频信号是具有360×288像素的分辨率的压缩视频信号,亮度信号的采样频率和两个色差信号的采样频率的比率等于4∶2∶0。因而,在这种情况下,通过根据本发明的上述分辨率转换处理,在Y信号的水平和垂直方向DCT系数的数目可以被减少到1/2,在C信号的水平和垂直方向的DCT系数的数目可以被减少到1/2。
上述的分辨率转换处理可以被类似地应用到从DV格式到MPEG2格式的转换。
对于符合NTSC制式的视频信号的情况,MPEG2格式的视频信号是具有720×480像素的分辨率的压缩视频信号,亮度信号的采样频率和两个色差信号的采样频率的比率等于4∶2∶0。因而,在这种情况下,在C信号的垂直方向的DCT系数的数目可以被减少到1/2,在C信号的水平方向的DCT系数的数目可以被加倍,而不进行Y信号的转换处理。对这种放大的方法,将以后描述。
对于符合PAL制式的视频信号的情况,MPEG2格式的视频信号是具有720×576像素的分辨率的压缩视频信号,亮度信号的采样频率和两个色差信号的采样频率的比率等于4∶2∶0。因而,在这种情况下,不需对Y信号或C信号进行转换处理。
图6示出上述分辨率转换处理的基本计算过程。
具体地,通过连接从输入的第一格式的数字信号的两个相邻块取出的四个DCT系数a0,a1,a2,a3和四个DCT系数b0,b1,b2,b3得出的包括8个DCT系数的块,被乘以一(8×8)矩阵,该矩阵包括在对角线的两个逆离散余弦变换矩阵(IDCT4),每个是(4×4)矩阵,其它分量是0。
其积再次被乘以一为(8×8)矩阵的离散余弦变换矩阵(DCT8),就产生了包括8个DCT系数c0,c1,c2,c3,...,c7的一个新块。
在根据本发明的数字信号转换方法中,由于在DCT域(频域)中进行分辨率转换处理,在分辨率转换之前的逆DCT和在分辨率转换之后的DCT是不必要的。另外,通过预先求出在对角线包括两个(4×4)逆离散余弦变换矩阵(IDCT4)的(8×8)矩阵和(8×8)离散余弦变换矩阵的积作为变换矩阵D,算术运算量可被有效地减少。
用于将作为第一格式的数字信号的DV视频信号转换为作为第二格式的数字信号的MPEG1视频信号的处理将进一步详细描述。
DV格式有“静态模式”和“动态模式”,按照画面的运动检测结果来切换。例如,这些模式在视频段的每个(8×8)矩阵的DCT之前由运动检测来区别,根据区别的结果以某一种模式进行DCT。运动检测的各种方法可以被考虑。具体地,可以采用比较场间差(inter-field difference)的绝对值之和和预定阈值的方法。
“静态模式”是DV格式的基本模式,其中对在一个块中的(8×8)像素进行(8×8)DCT。
(8×8)块由一个DC分量和63个AC分量构成。
“动态模式”用于避免一种情况,即如果在对象运动时进行DCT,由于隔行扫描由能量的分散降低了压缩效率。在该动态模式下,(8×8)块被分为第一场的(4×8)块和第二场的(4×8)块,对每个(4×8)块的像素数据进行(4×8)DCT。这样,在垂直方向的高频分量的增加被抑制,可以防止压缩率降低。
每个上述的(4×8)块由一个DC分量和31个AC分量构成。
这样,在DV格式中,块结构在静态模式和动态模式之间不同。因而,为了对后续处理能够进行类似处理,在每个(4×8)块的DCT之后,通过求出每个块的同阶的系数的和与差,构成了相对动态模式块的(8×8)块。通过这一处理,动态模式块可以被看作是由一个DC分量和63个AC分量构成,类似于静态模式块。
同时,在将DV格式的视频信号转换为MPEG1格式的视频信号中,必须仅分离一个场,由于MPEG1格式仅处置30帧/秒的视频信号,没有场的概念。
图7A示意性地示出了在将按照DV格式的“动态模式(2×4×8DCT模式)”的DCT系数转换为MPEG1格式的DCT系数中用于分离场的处理。
(8×8)的DCT系数块31的上半(4×8)块31a是第一场的系数和第二场的系数的和(A+B),而(8×8)的DCT系数块31的下半(4×8)块31b是两场的系数的差(A-B)。
因而,通过将(8×8)的DCT系数块31的上半(4×8)块31a和下半(4×8)块31b相加,然后将其和除以2,可以得到包括第一场(A)的DCT系数的(4×8)块35a。类似地,通过从上半(4×8)块31a中减去下半(4×8)块31b,然后将其差除以2,可以得到包括第二场(B)的离散余弦系数的(4×8)块35b。即,通过该处理,可以得到具有分离场的(8×8)块35。
然后,对这些场之一,例如第一场的DCT系数进行上述分辨率转换处理。
图7B示意性地示出在“静态模式(8×8DCT模式)”下用于分离场的处理。
在(8×8)的DCT系数块32中,第一场(A)的DCT系数和第二场(B)的DCT系数被混合。这样,必须进行转换处理,通过使用下文描述的场分离处理,类似地通过(4×8)块35a和(4×8)块35b之间的相减,用于获得包括第一场(A)的(4×8)块35a和包括第二场(B)的(4×8)块35b。
图8示出在“静态模式”中场分离处理的过程。
首先,包括8个DCT系数d0,d1,d2,d3,...,d7的输入被乘以8阶逆离散余弦变换矩阵(IDCT8),以恢复像素数据。
接着,该数据被乘以用于场分离的(8×8)矩阵,从而将(8×8)块分为上侧的第一场和下侧的第二场,每个是(4×8)块。
然后,该数据再乘以(8×8)块,该(8×8)块包括在对角线上的两个离散余弦变换矩阵(DCT4),每个是(4×4)矩阵。
这样,就得到了包括第一场的四个DCT系数e0,e1,e2,e3和第二场的四个DCT系数f0,f1,f2,f3的八个DCT系数。
然后,对这些场之一,例如第一场的DCT系数进行上述分辨率转换处理。
在根据本发明的数字信号转换方法中,由于在DCT域(频域)中进行分辨率转换,在分辨率转换之前的逆DCT和在分辨率转换之后的DCT是不必要的。另外,通过预先求出在对角线包括两个(4×4)逆离散余弦变换矩阵(IDCT4)的(8×8)矩阵和(8×8)离散余弦变换矩阵的积,算术运算量可被有效地减少。
上述分辨率转换是为了缩减图像。下文中,用于放大图像的分辨率转换处理将作为第二个实施例描述。
图9A至9C示意性地示出由根据本发明的数字信号转换方法、DV视频信号被转换为MPEG2视频信号的状态。
同样在下面的描述中,一维DCT系数被使用。但是,类似的处理可以对两维DCT系数进行。
首先,对图9A所示的包括8个正交系数(DCT系数g0到g7)的块(u)进行8点逆离散余弦变换(8点IDCT),这样恢复8个像素数据(h0到h7)。
接着,包括8个像素数据的块被分为两个部分,从而产生各包括四个像素数据的两个部分块。
然后,对各包括4个DCT系数的两个部分块进行4点DCT,从而产生各包括4个DCT系数的两个部分块(i0到i3和j0到j3)。
然后,如图9C所示,各包括4个像素数据的两个部分块的每个的高频侧用0填满作为四个DCT系数。这样,产生了各包括8个DCT系数的块(v)和块(v+1)。
按照上述过程,在正交变换域中进行了不同格式的压缩视频信号之间的分辨率转换。
图10示出了在这种情况下,转换处理的过程。
首先,包括8个DCT系数g0,g1,g2,g3,...,g7的输入被乘以8阶逆离散余弦变换(IDCT)矩阵,以恢复8个像素数据。
接着,包括8个像素数据的块被分为两个部分,从而产生各包括四个像素数据的两个部分块。
然后,各包括四个DCT系数的两个部分块的每个,被乘以包括4点离散余弦变换矩阵作为上侧(4×4)矩阵和0矩阵作为下侧(4×4)矩阵的(4×8)矩阵。这样,产生了包括8个DCT系数的两个部分块(i0到i7和j0到j7)。
通过这样的处理,从一个块得到两个DCT系数块。因而,在频域可以放大分辨率。
在NTSC制式的情况下,为了将DV格式转换为MPEG2格式,不必进行亮度信号Y的水平和垂直转换,但是必须在水平方向将色差信号C放大一倍,在垂直方向将色差信号C缩减到1/2,如图5所示。因而,上述放大处理用于在将DV格式转换为MPEG2格式中在水平方向的色差信号C的分辨率转换。
图11示出根据本发明的第三个实施例的数字信号转换装置的主要部分的示例结构。和第一个实施例相同的结构部分用相同的标号表示。和图1的结构的不同在于加权部分18和逆加权部分14被整体合为加权处理部分21。
特别地,加权处理(IW*W)部分21整体地进行逆加权和加权,逆加权是对作为第一格式的输入数字信号的DV视频信号执行的加权的逆运算,加权是用于作为第二格式的输出数字信号的MPEG视频信号。
利用这一结构,由于第一格式的输入视频信号的逆加权处理和第二格式的输出视频信号的加权处理可以被整体地进行,与逆加权处理和加权处理被分别进行的情况相比,计算的数量可以被减少。
在图11所示的第三个实施例的数字信号转换装置中,在分辨率转换部分16的后续级提供加权处理部分21。然而,加权处理部分可以被提供在分辨率转换部分16之前的级。
图12示出根据本发明的第四个实施例的数字信号转换装置,其中加权处理部分22被提供在分辨率转换部分16之前的级。图12所示的该数字信号转换装置的结构的部分可以类似于图11的数字信号转换装置的相应部分。
用于整体地进行第一格式的数字信号的逆加权和第二数字信号的加权的加权处理和上述加权处理可以在诸如离散余弦变换(DCT)的正交变换之前或之后进行。这是因为其算术运算是线性运算。
现在参考图13描述根据本发明的第五个实施例的数字信号转换方法和装置。
该数字信号转换装置有:解码部分8,用于解码DV视频信号;分辨率转换部分16,用于对从解码部分8输出的解码的格式转换进行分辨率转换处理;区别部分7,用于根据动态模式/静态模式信息,区别是否对从分辨率转换部分16输出的每个预定转换块单元进行正向帧间差分编码;和编码部分9,用于基于区别部分7的区别结果对从分辨率转换部分16输出的转换进行编码和输出MPEG视频信号,如图13所示。
在下面的描述中,采用由这些部分构成的数字视频信号转换装置。当然,各个部分进行根据本发明的数字信号转换方法的每个步骤的处理。
在输入到该数字视频信号转换装置中的DV视频信号中,作为指示静态模式/动态模式信息的模式标志(例如,一位),被预先加到每个DCT块。
在该数字视频信号转换装置中,区别部分7基于该模式标志,区别是否对从分辨率转换部分16输出的每个预定转换块单元进行正向帧间差分编码。该运算将在后面详细描述。
解成帧部分11提取指示静态模式/动态模式信息的模式标志,将该模式标志供给区别部分7。
解混洗部分15取消混洗,进行混洗是为了将视频段中的信息量统一为一个单元,用于DV编码侧的长度固定。
区别部分7包括加法器27和I(I画面)/P(P画面)区别和确定部分28。加法器27将作为存储在帧存储器(FM)部分24中的负DCT系数的参考DCT系数加到分辨率转换输出,帧存储器(FM)部分24将在后面描述。从加法器27输出的和被提供到I/P区别和确定部分28,I/P区别和确定部分28也被提供了模式标志,该模式标志指示了来自解成帧部分11的静态模式/动态模式。
现在详细描述I/P区别和确定部分28的运算。从分辨率转换部分16输出的转换有8×8DCT系数,作为一个单元。各有8×8DCT系数的四个DCT系数块被分配给亮度信号,两个DCT系数块被分配给色差信号,这样由六个DCT系数块总地构成了一个预定块。该预定块被称为宏块。
同时,P画面假定和前一帧的差被简单地求取。在静止图像的情况下,在求取差时减少了信息量。然而,在动态图像的情况下,在求取差时增加了信息量。因而,如果从指示静态模式/动态模式的模式标志区别出图像是动态的,则宏块被作为I画面,以便不增加信息量。如果区别出图像是静态的,通过求取差以制作P画面可以进行有效的编码。
当从解成帧部分送来的关于六个DCT系数块的所有模式标志指示动态模式时,I/P区别和确定部分28为宏块使用I画面。另一方面,当指示动态模式的标志仅可在六个DCT系数块之一中被检测到时,I/P区别和确定部分28为宏块使用P画面。
如果动态模式的标志被加到六个DCT系数块的四个或更多DCT系数块,可以将I画面用作宏块。同样,当指示静态模式的标志被加到所有六个DCT系数块时,可以将P画面用作宏块。
由I/P区别和确定部分28基于宏块确定为I/P画面的DCT系数被提供给编码部分9。
编码部分9有加权(W)部分18,量化(Q)部分19,逆量化(IQ)部分26,逆加权(IW)部分25,FM部分24,可变长度编码(VLC)部分20,缓冲存储器23,速率控制部分29。
加权(W)部分18对作为从转换部分16经过区别部分7提供的转换输出的DCT系数进行加权。
量化(Q)部分19对由加权(W)部分18加权的DCT系数进行量化。然后,可变长度编码(VLC)部分20对由量化(Q)部分19量化的DCT系数进行可变长度编码,将MPEG编码的数据提供给缓冲存储器23。
缓冲存储器23固定MPEG编码的数据的传输率,将MPEG编码的数据作为位流输出。速率控制部分29根据诸如缓冲存储器23的缓冲容量的增加或减少的变化信息,控制在量化(Q)部分19中产生的信息量的增加或减少,即量化步长。
逆量化(IQ)部分26对来自量化(Q)部分19量化的DCT系数进行逆量化,将逆量化的DCT系数提供给逆加权(IW)部分25。逆加权(IW)部分25对来自逆量化(IQ)部分26的DCT系数进行逆加权,该逆加权是加权的逆运算。由逆加权(IW)部分25逆加权处理的DCT系数被存储在FM部分24中,作为参考DCT系数。
如上所述,在图13所示的数字视频信号转换装置中,区别部分7通过使用I/P区别和确定部分28根据从解成帧部分11送来的指示动态模式/静态模式的模式标志,为每个宏块区别I画面或P画面。因而,最初单包括I画面的DV信号可以被转换为使用I画面或P画面的MPEG画面,作为MPEG视频信号的特征的压缩率的改进的优点可以被利用。
现在描述根据本发明的第六个实施例的数字信号转换方法和装置。
根据第六个实施例的数字视频信号转换装置是一种数字视频信号转换装置,其中图13所示的区别部分7被图14所示的区别部分30所取代。
具体地,数字视频信号转换装置有:解码部分8,用于对DV信号进行部分解码处理和获得诸如DCT系数的正交变换域的信号;转换部分16,用于为格式转换对来自解码部分8的DCT系数进行信号转换处理;区别部分30,用于根据转换输出的帧间差的绝对值的最大值,区别是否对从转换部分16输出的每个预定转换块单元进行正向帧间差分编码;和编码部分9,用于基于区别部分30的区别结果对从转换部分16输出的转换进行编码和输出MPEG视频信号。
在当作为来自转换部分16的转换输出的转换的DCT系数和来自FM部分24的参考DCT系数之间的差被提取时,区别部分30参考AC系数的绝对值的最大值,将该最大值和预定阈值进行比较。区别部分30基于比较的结果,将I/P画面分配给每个宏块。
区别部分30有差计算部分31,最大值检测部分32,比较部分33,I/P确定部分35。
差计算部分31计算来自转换部分16转换的DCT系数和来自FM部分24的参考DCT系数之间的差。从差计算部分31输出的差分被提供给最大值检测部分32,也被提供给I/P确定部分35。
最大值检测部分32检测差分输出的AC系数的绝对值的最大值。基本上,当大量信息被转换为DCT系数时,AC系数变大。另一方面,当小量信息被转换为DCT系数时,AC系数变小。
比较部分33将来自最大值检测部分32的绝对值的最大值与从终端34提供的预定阈值相比较。当该预定阈值被合适地选择时,转换为DCT系数的信息量可以根据AC系数的绝对值的最大值来区别。
I/P确定部分35通过使用比较部分33的比较结果,区别来自差计算部分31的DCT系数的差,即信息量的差是大还是小。当区别出该差大时,I/P确定部分35将I画面分配给包括来自转换部分16的转换的DCT系数块的宏块。当区别出该差小时,I/P确定部分35将P画面分配给来自差计算部分31的宏块。
即,如果最大值的绝对值大于阈值,就区别出差的信息量大,采用I画面为宏块。另一方面,如果最大值的绝对值小于阈值,就区别出差的信息量小,采用P画面为宏块。
这样,根据第六个实施例的数字视频信号转换装置能够将最初包括I画面的DV信号转换为使用I画面或P画面的MPEG画面,可以利用作为MPEG信号视频信号的特征的压缩率的改进的优点。
在图13和14所示的数字视频信号转换装置中,符合NTSC制式的DV信号和MPEG1视频信号被分别用作输入和输出。然而,该数字视频信号转换装置也可以应用到PAL制式的每个信号中。
上述的分辨率转换处理可以类似地应用到从DV格式到MPEG2格式的转换中。
由于分辨率转换处理由转换部分16进行,上面主要描述了缩减的分辨率转换。然而,放大也是可能的。具体地,通常,通过将高频分量加到频域的输入数字信号中,可以以任意放大率放大分辨率。
当MPEG2视频信号被应用到数字广播服务时,信号根据性能(profile)(功能)/级别(level)(分辨率)来分类。例如,分辨率的放大可以应用的情况是,用于美国的数字HDTV的主性能/高级别(MP@HL)视频信号被转换为DV信号。
第六个实施例的处理也可以用软件方式来进行。
现在参考图15描述根据本发明的第七个实施例的数字信号转换方法和装置。和上述实施例相同的结构的部件用相同的标号来表示。
速率控制部分40根据来自解成帧部分11的量化器号(Q_NO)和类号(Class)控制量化部分19中的数据量。
图16是示出通过第七个实施例的数字信号转换方法,在将DV视频信号转换为MPEG视频信号中为每帧的每个宏块(MB)设定量化器比例的基本过程。
首先,在步骤S1,为每个宏块获得量化器号(Q_NO)和类号(Class)。该量化器号(Q_NO)由0到15的值来表达,对宏块中的所有六个DCT块是共同的。类号(Class)由0到3的值来表达,为六个DCT块的每个提供。
接着,在步骤S2,根据下面的过程为每个DCT块计算量化参数(q_param)。
量化表q_table[4]={9,6,3,0}
量化参数q_param=Q_NO+q_table[class]
具体地,量化表有四种值(9,6,3,0),分别对应于类号0,1,2,3。例如,当类号是2、量化器号是8时,对应于类号2的量化表值3和量化器号8相加以得出量化参数11。
接着,在步骤S3,在宏块中的六个DCT块的量化参数(q_param)的平均值被计算。
然后,在步骤S4,MPEG宏块的量化器比例(quantizer_scale)根据下面的过程求出,处理结束。
量化表q_table[25]={32,16,16,16,16,8,8,8,8,4,4,4,2,2,2,2,2,2,2,2,2,2,
                   2,2}
quantizer_scale=q_table[q_param]
具体地,量化表有25种值(32到2),对应于以上述方式计算的量化参数。对应于量化参数值0的量化表是32。对应于量化参数值1的量化表是16。对应于量化参数值5的量化表是8。例如,当以上述方式求出的量化参数的平均值是10时,对应于量化参数值10的值4变成量化器比例值。通过该过程,依赖目标(target)速率的MPEG量化器比例(quantizer_scale)基于每帧内的每个宏块的量化参数(q_param)来计算。类号和量化表之间的对应关系以及量化参数和量化器比例之间的关系被凭经验求出。
在图15所示的本发明的数字信号转换装置中,上述处理由速率控制部分40基于从解成帧部分11送来的量化器号(Q_NO)和类号(Class)而进行。
图17示出用于通过使用根据上述过程设定的量化器比例将反馈施加到下一帧的基本过程。
首先,在步骤S11,以根据上述过程设定的位速率,设定每帧的目标位的数目。
接着,在步骤S12,每帧所产生的位的总数目被合计。
接着,在步骤S13,目标位的数目和所产生的位的总数目之间的差(diff)被计算。
然后,在步骤S14,根据计算的结果调整量化器比例。
在每步的计算表达如下:
diff=cont*diff(cont:constant)
q_param=q_param±f(diff)
quantizer_scale=q_table[q_Param]
具体地,将在步骤S13求出的差值diff乘以常数cont来进行归一化。归一化的差值乘以经验求出的函数,加到量化参数或从量化参数中减去。结果值被用作量化参数。对应于该量化参数值的值从有25种值的量化表中选择,用作下一帧的量化器比例。
通过前述过程,通过基于调整的量化参数(q_param)计算新的量化器比例(quantizer_scale)和使用下一帧的新量化器比例,进行在帧之间的反馈。
现在描述根据本发明的第八个实施例的数字信号转换方法和数字信号转换装置。尽管在前述的实施例中DV格式被转换为MPEG格式,在下面的实施例中,MPEG格式被转换为DV格式。
参照图18,首先描述用于将MPEG格式转换为DV格式的传统的装置。
图18所示的数字视频信号转换装置由MPEG解码器70和DV编码器80构成。MPEG解码器70用于解码MPEG视频数据,DV编码器80用于输出DV视频数据。
在MPEG解码器70中,提供有MPEG2视频数据的位流的句法分析器71,检测根据MPEG2格式成帧的量化DCT系数的位流的首标,将由可变长度编码编码的量化DCT系数提供给可变长度解码(VLD)部分72。同样,句法分析器71提取运动矢量(mv),将提取的运动矢量提供给运动补偿(MC)部分77。
可变长度解码(VLD)部分72对通过可变长度编码编码的量化DCT系数进行可变长度解码,将可变长度解码的结果提供给逆量化(IQ)部分73。
逆量化部分73通过将由可变长度解码部分72解码的量化DCT系数乘以在编码侧使用的量化步长,进行逆量化。这样,逆量化部分73获得DCT系数,将DCT系数提供给逆离散余弦变换(IDCT)部分74。
逆离散余弦变换部分74对来自逆量化部分73的DCT系数执行逆DCT,这样将DCT系数恢复为空间域的数据,即像素数据。具体地,通过逆DCT,对包括8×8像素的每个块计算像素值(亮度Y和色差Cr,Cb)。在I画面的情况下,像素值是其实际像素值。然而,在P画面和B画面的情况下,像素值是对应的像素值之间的差值。
运动补偿部分77通过使用存储在帧存储器(FM)部分76的两个帧存储器FM中的画面信息和由句法分析器71提取的运动矢量mv,产生运动补偿输出,将该运动补偿输出提供给加法器75。
加法器75将运动补偿输出加到来自逆离散余弦变换部分74的差值,将解码的画面数据提供给DV编码器80的离散余弦变换(DCT)部分81和帧存储器部分76。
在DV编码器80中,离散余弦变换部分81对解码的画面数据执行DCT处理,以便再次将解码的画面数据转换为正交变换域的数据,即,DCT系数,并将该DCT系数提供给量化(Q)部分82。
量化部分82考虑视觉特性,通过使用矩阵表来量化DCT系数,将量化结果作为DV格式的I画面提供给可变长度编码(VLC)部分83。
可变长度编码部分83通过进行可变长度编码处理来压缩DV格式的I画面,将压缩的I画面提供给成帧部分84。
成帧部分84将执行了可变长度编码处理的DV格式数据成帧,并输出DV视频数据的位流。
同时,诸如离散余弦变换(DCT)和其逆变换的正交变换通常需要大量的计算,因而带来的问题是如上所述的视频数据的格式转换不能有效率地进行。由于错误随计算量的增加而累积,信号劣化也是一个问题。
这样,为了解决这些问题,将参考图19描述根据本发明的第八个实施例的数字视频信号转换装置。
在图19所示的数字信号转换装置中,符合MPEG格式的上述MPEG视频信号作为第一数字信号输入,DV信号作为第二数字信号输出。
句法分析器111参照作为第一格式的数字信号的MPEG视频信号的首标,提取诸如运动矢量mv和量化器比例的图像的运动信息。
运动矢量mv被送到运动补偿(MC)部分115,其中运动补偿被进行。量化器比例(quantizer_scale)被送给评价部分123,其将在后面描述。
可变长度解码(VLD)部分112对MPEG视频信号的位流进行可变长度解码,必要的信息由句法分析器111从该MPEG视频信号提取。
逆量化(IQ)部分113对由可变长度解码部分112解码的MPEG视频信号逆量化。
然后,由逆量化部分113逆量化的MPEG视频信号被输入加法器125。来自句法分析器111的运动矢量mv的运动补偿结果也从运动补偿部分115输入到该加法器125。
从加法器125的输出被送给信号转换部分116,它将在后面描述。该输出也被通过帧存储器114输入到运动补偿部分115。信号转换部分116对通过加法器125输入的视频信号在正交变换域(频域)执行诸如分辨率转换的需要的信号转换处理。
要由信号转换部分116执行需要的信号转换处理的视频信号由混洗部分117混洗,然后被送到缓冲器118和分类部分122。
送到缓冲器118的视频信号被送到量化(Q)部分119,由该量化部分119量化。然后,该视频信号由可变长度编码(VLC)部分120可变长度编码。另外,该视频信号由成帧部分121成帧,作为DV视频信号的位流输出。
另一方面,分类部分122对由混洗部分117混洗的视频信号分类,并将分类的结果作为分类信息送给评价部分123。
评价部分123基于来自分类部分122的分类信息和来自句法分析器111的量化器比例(quantizer_scale)确定在量化部分119的量化数目。
对于该结构,由于作为第二格式的视频信号输出的DV视频信号的数据量可以基于包括在作为第一格式的视频信号输入的MPEG视频信号中的数据量信息来确定,用于确定由信号转换产生的第二格式的视频信号的数据量的处理可以被简化。
上述的第七个和第八个实施例也可以被应用到第一格式的数字信号和第二格式的数字信号之一是MPEG1视频信号而另一个是MPEG2视频信号的情况。
现在参考图20描述根据本发明的第九个实施例的数字信号转换方法和数字信号转换装置。
该数字信号转换装置是一种装置,用于将符合MPEG2格式的MPEG视频信号转换为符合DV格式的DV视频信号。假定这些数据是PAL制式的数据。
在视频信号是PAL制式的信号的情况下,符合MPEG2格式和DV格式的信号具有720×576像素的分辨率,亮度信号的采样频率和两个色差信号的采样频率的比率等于4∶2∶0。因而,对于Y信号或C信号不必进行分辨率转换处理。
在图20中,MPEG解码器100有句法分析器111,可变长度解码(VLD)部分112,逆量化(IQ)部分113,加法器125,逆离散余弦变换(IDCT)部分131,帧存储器(FM)部分132,运动补偿(MC)部分115,和离散余弦变换(DCT)部分130。帧存储器(FM)部分132的构成使得它被用作两个预测存储器。
正如将在后面详细描述的,逆离散余弦变换部分131对由可变长度解码部分112和逆量化部分113部分解码的I画面和P画面进行逆离散余弦变换处理。运动补偿部分115基于逆离散余弦变换输出来产生运动补偿输出。离散余弦变换部分130对运动补偿输出进行离散余弦变换。加法器125将来自离散余弦变换部分130的运动补偿输出加到由可变长度解码部分112和逆量化部分113部分解码的P画面和B画面。
下文将描述整个运算。首先,句法分析器111参照作为位流输入的MPEG2视频数据的首标,将符合MPEG2格式成帧的量化DCT系数恢复为可变长度代码,将该可变长度代码提供给可变长度解码部分112。同样,句法分析器111提取运动矢量mv,将提取的运动矢量提供给运动补偿部分115。
可变长度解码部分112对恢复为可变长度代码的量化DCT系数进行可变长度解码,将可变长度解码的结果提供给逆量化部分113。
逆量化部分113通过将由可变长度解码部分112解码的量化DCT系数乘以在编码侧使用的量化步长,进行逆量化处理。这样,逆量化部分113获得DCT系数,并将该DCT系数提供给加法器125。由可变长度解码部分112和逆量化部分113获得的DCT系数被提供给加法器125作为输出,它不被逆离散余弦变换恢复为像素数据,即,作为部分解码数据。
加法器125也被提供有来自运动补偿部分115的运动补偿输出,其由离散余弦变换部分130正交变换。然后,加法器125将运动补偿输出加到在正交变换域中部分解码的数据。加法器125将加法输出提供给DV编码器110,也提供给逆离散余弦变换部分131。
逆离散余弦变换部分131对加法输出内的I画面或P画面执行逆离散余弦变换处理,从而产生空间域的数据。该空间域的数据是为运动补偿使用的参考画面数据。该为运动补偿使用的参考画面数据被存储在帧存储器部分132中。
运动补偿部分115通过使用存储在帧存储器部分132中的参考画面数据和由句法分析器111提取的运动矢量mv,产生运动补偿输出,将该运动补偿输出提供给离散余弦变换部分130。
离散余弦变换部分130将在空间域处理的运动补偿输出恢复到如上所述的正交变换域,然后将该运动补偿输出提供给加法器125。
加法器125将来自离散余弦变换部分130的运动补偿输出的DCT系数加到来自逆量化部分113的部分解码的P和B画面的差分信号的DCT系数。然后,来自加法器125的相加输出被作为在正交变换域的部分解码的数据提供给DV编码器110和逆离散余弦变换部分131。
由于来自逆量化部分113的部分解码的I画面是帧内编码图像信号,不需运动补偿相加处理。部分解码的I画面被原样提供给逆离散余弦变换部分131,也提供给DV编码器110。
DV编码器110包括量化(Q)部分141,可变长度编码(VLC)部分142和成帧部分143。
量化部分141量化来自MPEG解码器100的正交变换域中的I画面、P画面和B画面的解码输出,即DCT系数,将量化的DCT系数提供给可变长度编码部分142。
可变长度编码部分142对量化的DCT系数进行可变长度编码处理,将编码的数据提供给成帧部分143。成帧部分143对来自可变长度编码部分142的压缩编码的数据成帧,输出DV视频数据的位流。
以这种方式,当要被转换的MPEG2视频数据是I画面时,MPEG解码器100使可变长度解码部分112和逆量化部分113部分解码MPEG2视频数据到正交变换域,DV编码器110使量化部分141和可变长度编码部分142部分编码视频数据。同时,MPEG解码器100使逆离散余弦变换部分131对I画面执行逆离散余弦变换,将结果的I画面存储在帧存储器部分132中作为P/B画面的参考画面。
另一方面,当要被转换的MPEG2视频数据是P画面或B画面时,仅有用于产生运动补偿输出的处理通过使用逆离散余弦变换部分131在空间域进行,用于构成除了作为由可变长度解码部分112和逆量化部分113部分解码的P画面或B画面的差分信号的帧的处理在离散余弦变换域通过使用离散余弦变换部分130进行,如上所述。此后,由DV编码器110进行部分编码。
特别地,在P画面的情况下,在由运动矢量mv指示的位置的宏块,被从由逆离散余弦变换部分131逆离散余弦变换处理的I画面中,通过运动补偿部分115的运动补偿处理提取。由离散余弦变换部分130对该宏块执行离散余弦变换处理,再被加法器25加到P画面的DCT系数作为离散余弦变换域的差分信号。该处理是基于,对空间域的相加结果执行的离散余弦变换的结果等价于由离散余弦变换处理的数据相加的结果。该结果由DV编码器110部分编码。同时,作为下一B画面的参考,由逆离散余弦变换部分131对来自加法器125的相加输出执行逆离散余弦变换,结果的数据被存储在帧存储器部分132中。
在B画面的情况下,在由运动矢量mv指示的位置的宏块,被从由逆离散余弦变换部分131逆离散余弦变换处理的P画面中提取。然后,由离散余弦变换部分130对该宏块执行离散余弦变换处理,作为差分信号的B画面的DCT系数在离散余弦变换域中被加到其上。在双向的情况下,从两个参考帧中提取宏块,其平均值被使用。
其结果被DV编码器110部分编码。由于B画面不变成参考帧,不需由逆离散余弦变换部分131进行逆离散余弦变换。
传统上为了解码I画面需要逆离散余弦变换(IDCT)和离散余弦变换(DCT)处理,而根据上述的第九个实施例的数字视频信号转换装置仅需要IDCT作参考。
为了解码P画面,作参考的DCT和IDCT处理是必需的。然而,为解码B画面传统上需要DCT和IDCT,而根据该实施例的数字视频信号转换装置仅需要DCT,不需IDCT。
在具有GOP数目N=15、前向预测画面间距M=3的典型MPEG2数据的情况下,包括一个I画面、四个P画面和10个B画面。假定DCT的计算量和IDCT的计算量基本相等,当加权被省略时,每15帧MPEG2数据在传统技术的情况下由下式表示
2×DCT×(1/15)+2×DCT×(4/15)+2×DCT×(10/15)
=2×DCT
在图20所示的数字视频信号转换装置的情况下由下式表示
1×DCT×(1/15)+2×DCT×(4/15)+1×DCT×(10/15)
=1.2666×DCT
这样,可以显著减少计算量。在这些等式中DCT代表计算量。
即,在图20所示的数字视频信号转换装置中,用于从MPEG2视频数据到DV视频数据的格式转换的数据计算处理量可以被显著地减少。
现在参考图21描述根据本发明的第十个实施例的数字视频信号转换装置。
在该第十个实施例中,采用了用于将符合MPEG2格式的MPEG视频数据转换为符合DV格式的DV视频数据的数字视频信号转换装置。然而,假定MPEG2视频数据是高分辨率例如1440×1080像素的压缩视频信号。
例如,当MPEG2视频信号被应用到数字广播服务时,信号根据性能(功能)/级别(分辨率)来分类。用于美国的数字HDTV的主性能/高级别(MP@HL)视频信号具有高分辨率,如上所述,该信号被转换为DV视频数据。
因而,图21所示的数字视频信号转换装置的结构是,在图20的MPEG解码器100和DV编码器110之间提供了用于进行上述转换处理的信号转换部分140。
该信号转换部分140通过使用基于逆正交变换矩阵和正交变换矩阵产生的变换矩阵,对来自MPEG解码器的DCT变换域的DCT系数进行分辨率转换处理。所述逆正交变换矩阵对应于用于对MPEG编码数据执行DCT编码的正交变换矩阵,所述正交变换矩阵对应于用于为获得在时域的信号转换输出信号的IDCT编码的逆正交变换矩阵。
来自该信号转换部分140的作为分辨率转换输出的DCT系数被提供给DV编码器110。
DV编码器110对作为分辨率转换输出的DCT系数进行量化和可变长度编码,然后成帧DCT系数,输出DV视频数据的位流。
这样,在该数字视频信号转换装置中,在MPEG视频信号内的主性能/高级别(MP@HL)视频信号被信号转换部分140分辨率转换,然后由DV编码器编码以产生DV视频数据。
类似于图20的数字视频信号转换装置,关于I画面,该第十个实施例的数字视频信号转换装置仅需要IDCT作参考,而传统上IDCT和DCT处理都需要。
关于P画面,如传统技术中,进行DCT和IDCT作参考。关于B画面,该数字视频信号转换装置仅需要DCT而不需要IDCT,而传统上IDCT和DCT都需要。
即,在图21所示的数字视频信号转换装置中,用于从高分辨率的MPEG2视频数据到DV视频数据的格式转换的数据计算处理量也可以被显著地减少。
作为由信号转换部分140进行的分辨率转换处理,主要描述了缩减的分辨率转换。然而,放大也是可能的。具体说,通常,通过将高频分量加到频域的输入数字信号中,可以以任意放大率放大分辨率。例如,进行从MPEG1视频信号到DV视频信号的格式转换。
上述处理也可以通过软件来进行。
同时,在上述MPEG格式或DV格式的压缩系统中,为了有效压缩编码静止图像数据或动态图像数据,可以采用使用结合预测编码的正交变换编码的混合压缩编码方法。
在对由混合压缩编码方法压缩编码的输入信息信号进行分辨率转换处理后,当再次进行正交变换和随运动补偿的预测编码时,在进行再预测编码处理的步骤时必须估计运动矢量。
如果用完全相同的分辨率再次进行预测编码而不进行分辨率转换处理,在预测编码时可以使用运动矢量。然而,如果分辨率被转换,则转换失真被改变。因而,在再预测编码步骤使用的运动矢量也被改变。
这样,在再预测编码步骤时需要估计运动矢量。然而,运动矢量估计需要算术处理量。
为了消除该问题,使用了根据第十一个实施例的数字信号转换装置。在根据第十一个实施例的数字信号转换方法和装置中,由用使用结合预测编码的正交变换编码的混合压缩编码压缩编码的输入信息信号,在时域或正交变换域由诸如分辨率转换的信号转换处理来处理,然后恢复到正交变换域用于再压缩编码,或者在正交变换域压缩编码。
上述混合压缩编码的例子是由ITU-T(国际电信联盟-电信标准化部)推荐的H.261和H.263,和MPEG和DV编码标准。
H.261标准是低位速率的图像编码标准,其发展主要是为了通过ISDN的远程会议和可视电话。H.263是为了GSTN视频电话系统的H.261的改进版。
现在参考图22描述第十一个实施例,在第十一个实施例的数字视频信号转换装置中,符合MPEG格式的MPEG编码数据被输入,由作为信号转换处理的分辨率转换处理来处理,分辨率转换的MPEG编码信号被输出。
该数字视频信号转换装置有:解码部分210,用于对随运动矢量(mv)检测压缩编码的MPEG编码数据的位流使用运动补偿MC进行解码;分辨率转换部分160,用于对来自解码部分210的解码输出执行分辨率转换处理;和编码部分220,用于随基于加到MPEG编码的数据的运动矢量mv的运动检测,对来自分辨率转换部分160的转换输出图像执行压缩编码处理和输出分辨率转换的视频编码数据的位流,如图22所示。
由这些部件构成的数字视频信号转换装置将在下文描述。当然每个构件进行根据本发明的数字信号转换方法的每个步骤的处理。
解码部分210包括可变长度解码(VLD)部分112、逆量化(IQ)部分113、逆离散余弦变换(IDCT)部分150、加法器151、运动补偿(MC)部分152和帧存储器(FM)部分153。FM部分153由两个帧存储器FM构成,用作预测存储器。
VLD部分112对MPEG编码数据,即由运动矢量和作为附加信息的量化DCT系数的可变长度编码获得的编码数据根据可变长度编码解码,并提取运动矢量mv。IQ部分113通过将由VLD部分112解码的量化DCT系数乘以在编码侧使用的量化步长,进行逆量化处理。
IDCT部分150对来自IQ部分113的DCT系数执行逆DCT,从而将DCT系数恢复到空间域的数据,即像素数据。具体地,通过逆DCT,对包括8×8像素的每个块计算相应的像素值(亮度Y和色差Cr,Cb)。在I画面的情况下,像素值是其实际像素值。然而,在P画面和B画面的情况下,像素值是对应的像素值之间的差值。
MC部分152通过使用由VLD部分112提取的运动矢量mv,对存储在FM部分153的两个帧存储器中的图像信息执行运动补偿处理,将该运动补偿输出提供给加法器151。
加法器151将来自MC部分152的运动补偿输出加到来自IDCT部分150的差值,从而输出解码的图像信号。分辨率转换部分160对解码的图像信号进行需要的分辨率转换处理。来自分辨率转换部分160的转换输出被提供给编码部分220。
编码部分220包括比例转换部分171、运动估计(ME)部分172、加法器173、DCT部分175、速率控制部分183、量化(Q)部分176、可变长度编码(VLC)部分177、缓冲存储器178、IQ部分179、IDCT部分180、加法器181、FM部分182和MC部分174。
比例转换部分171根据由分辨率转换部分160使用的分辨率转换速率,对由VLD部分112提取的运动矢量mv进行比例转换。例如,如果由分辨率转换部分160使用的分辨率转换速率是1/2,运动矢量mv被转换到1/2的比例。
ME部分172通过使用来自比例转换部分171的比例转换信息,搜索来自分辨率转换部分160的转换输出的窄范围,从而估计转换的分辨率的最佳运动矢量。
由ME部分172估计的运动矢量在由MC部分174进行运动补偿时使用。来自分辨率转换部分160的由ME部分172用于运动矢量的估计的转换输出图像被提供给加法器173。
加法器173计算后面描述的参考画面和来自分辨率转换部分160的转换输出之间的差,将该差提供给DCT部分175。
DCT部分175通过使用8×8大小的块,对由MC部分174通过运动补偿获得的参考画面和转换输出画面之间的差进行离散余弦变换。关于I画面,由于进行帧间编码,直接进行DCT算术运算,而不计算帧间的差。
量化(Q)部分176考虑可视特性,通过使用矩阵表对来自DCT部分175的DCT系数进行量化。VLC部分177通过使用可变长度编码,对来自Q部分176的量化的DCT系数进行压缩。
缓冲存储器178是一个存储器,用于保持编码数据的恒定传输率,该编码数据由VLC部分177用可变长度编码来压缩。从该缓冲存储器178,分辨率转换的视频编码数据被作为恒定传输率的位流输出。
速率控制部分183根据缓冲存储器178的缓冲容量的增加/降低的有关改变信息,控制Q部分176中所产生信息量的增加/降低,即量化步长。
IQ部分179和IDCT部分180一起构成本地解码部分。IQ部分179逆量化来自Q部分176的量化DCT系数,将DCT系数提供给IDCT部分180。IDCT部分180对来自IQ部分179的DCT系数进行逆DCT,以恢复像素数据,将像素数据提供给加法器181。
加法器181将来自MC部分174的运动补偿输出加到作为来自IDCT部分180的逆DCT输出的像素数据。作为来自加法器181的相加输出的图像信息被提供给FM部分182。存储在FM部分182中的图像信息由MC部分174用运动补偿处理。
MC部分174通过使用由ME部分172估计的最佳运动矢量,对存储在FM部分182中的图像信息进行运动补偿,将作为参考画面的运动补偿输出提供给加法器173。
加法器173计算来自分辨率转换部分160的转换输出画面和参考画面之间的差,将该差提供给DCT部分175,如上所述。
DCT部分175、Q部分176、VLC部分177和缓冲存储器178如上所述运算。最终,分辨率转换的视频编码数据被作为位流以恒定传输率从该数字视频信号转换装置输出。
在该数字视频信号转换装置中,当由编码部分220的ME部分172估计运动矢量时,附加到最初压缩的视频信号宏块的运动矢量,由比例转换部分171根据分辨率转换部分160中的分辨率转换速率按比例转换,基于来自比例转换部分171的比例转换信息,搜索来自分辨率转换部分160的转换输出画面的窄范围,以便为运动补偿估计运动矢量,代替缺少任何信息时的运动矢量的估计。这样,由于在ME部分172中的计算量可以被显著减少,可以实现装置的微型化和转换处理时间的减少。
现在描述第十二个实施例。在该实施例中,也采用了用于对MPEG视频信号执行分辨率转换处理和输出分辨率转换的视频信号的数字视频信号转换装置。
该数字视频信号转换装置有:解码部分211,用于对执行上述混合编码的MPEG编码数据用MC通过仅进行预测解码处理,获得正交变换域的解码数据;分辨率转换部分260,用于对来自解码部分211的正交变换域的解码数据执行分辨率转换处理;和编码部分221,用于通过使用基于MPEG编码的数据的运动矢量信息的运动检测,随着对来自分辨率转换部分260的转换输出的运动补偿预测,执行压缩编码处理,如图23所示。
由这些部件构成的数字视频信号转换装置将在下文描述。当然每个构件进行根据本发明的数字信号转换方法的每个步骤的处理。
在该数字视频信号转换装置中,和图22所示的装置相比,IDCT部分150在解码部分210中是不必要的,DCT部分175和IDCT部分180在编码部分220中是不必要的。即,在该数字视频信号转换装置中,对DCT域的解码数据进行分辨率转换处理,其转换输出被编码。
诸如DCT的正交变换和逆正交变换,通常需要大量的计算。因而,上述的分辨率转换不能有效地进行。同样,由于随着计算量的增加,错误被累积,信号可能劣化。
因而,在图23的数字视频信号转换装置中,图22的IDCT部分150、DCT部分174和IDCT部分180被消除。分辨率转换部分160的功能被改变。
同样,为了在DCT域从来自分辨率转换部分160的转换DCT系数计算后面将描述的活度(activity)和通过使用该活度估计运动矢量,一活度计算部分200被用于取代图22的比例转换部分171。
图23中所示的分辨率转换部分260提供有相加输出(DCT系数),该相加输出(DCT系数)是通过由加法器251将来自MC部分252的运动补偿输出加到由IQ部分213通过逆量化由VLD部分212解码的量化DCT系数得到的DCT系数而得到的。
该分辨率转换部分260通过使用一变换矩阵,对来自解码部分211的DCT变换域的DCT系数进行分辨率转换处理。所述变换矩阵是基于对应于用于对MPEG编码的数据执行的DCT编码的正交变换矩阵的逆正交变换矩阵和对应于用于为获得时域的信号转换输出信号的IDCT编码的逆正交变换矩阵的正交变换矩阵产生的。
来自分辨率转换部分260的作为分辨率转换输出的DCT系数被提供给活度计算部分200。活度计算部分200从来自分辨率转换部分260的DCT系数的亮度分量为每个宏块计算空间活度。具体地,通过使用DCT系数的AC值的最大值计算图像的特征。例如,更少高频分量的存在指明了平滑图像。
ME部分272基于由活度计算部分200计算的活度,估计在转换的分辨率的最佳运动矢量。具体地,ME部分272基于由活度计算部分200计算的活度,转换由VLD 212提取的运动矢量mv,以便估计运动矢量mv,将估计的运动矢量mv提供给MC部分274。ME部分272在正交变换域估计运动矢量。在正交变换域的该运动估计将随后描述。
来自分辨率转换部分260的分辨率转换的DCT系数通过活度计算部分200和ME部分272被提供给加法器273。
加法器273计算后面将描述的参考DCT系数和来自分辨率转换部分260的转换的DCT系数之间的差,将该差提供给量化(Q)部分276。
Q部分276量化差值(DCT系数),将量化的DCT系数提供给VLC部分277和IQ部分279。
速率控制部分283根据来自活度计算部分200的活度信息和有关缓冲存储器278的缓冲容量的增加/减少的变化信息,控制在Q部分276中产生的信息量的增加/减少,即量化步长。
VLC部分277通过使用可变长度编码,压缩编码来自Q部分276的量化DCT系数,将压缩的DCT系数提供给缓冲存储器278。缓冲存储器278保持由VLC部分277通过可变长度编码压缩的编码数据的恒定传输率,将分辨率转换的视频编码数据以恒定传输率作为位流输出。
IQ部分279对来自Q部分276的量化DCT系数进行逆量化,将DCT系数提供给加法器281。加法器281将来自MC部分274的运动补偿输出加到来自IQ部分279作为逆量化输出的DCT系数。来自加法器281作为相加输出的DCT系数信息被提供给FM部分282。存储在FM部分282中的DCT系数信息由MC部分274通过运动补偿处理。
MC部分274通过使用由ME部分272估计的最佳运动矢量,对存储在FM部分282中的DCT系数信息进行运动补偿,将运动补偿输出作为参考DCT系数提供给加法器281。
加法器273计算来自分辨率转换部分260的转换的DCT系数和参考DCT系数之间的差,将该差提供给Q部分276,如上所述。
Q部分276、VLC部分277和缓冲存储器278如上所述运算。最终,分辨率转换的视频编码数据从该数字视频信号转换装置以恒定传输率输出。
MC部分274通过使用由ME部分272估计的最佳运动矢量和存储在FM部分282中的参考DCT系数,类似于ME部分272在正交变换域进行运动补偿。
现在参考图24至图26描述正交变换域中的运动估计和运动补偿。在图24中,实线表示要压缩的画面A的宏块,虚线表示参考画面B的宏块。当通过使用运动矢量,使得要压缩的画面A和参考画面B彼此交叠时,如图24所示,宏块的边界可能不重合。在图24的情况下,要压缩的宏块B′部分地在参考画面B的四个宏块B1,B2,B3和B4上伸展。因而,没有参考画面B的宏块一一对应于宏块B′,不能获得参考画面B在宏块B′的位置的DCT系数。因而,必须通过转换宏块B′在其上部分伸展的参考画面B的四个宏块的DCT系数,以获得宏块B′所位于的部分的参考画面B的DCT系数。
图25示意性地示出了该转换处理的过程。由于参考画面B的宏块B1的左下部分交叠于宏块B′的右上部分,通过转换宏块B1的DCT系数产生宏块B13,如后面所述。类似地,由于参考画面B的宏块B2的右下部分交叠于宏块B′的左上部分,通过转换宏块B2的DCT系数产生宏块B24,如后面所述。类似的处理对宏块B3和B4进行,从而产生宏块B31和B42。通过结合这样产生的四个宏块B13、B24、B31和B42,可以获得宏块B′所位于的部分的参考画面B的DCT系数。
简而言之,该处理可以由下面的等式(6)和(7)表达。
B′=B13+B24+B31+B42                 ...(6)
DCT(B′)=DCT(B13)+DCT(B24)+DCT(B31)+DCT(B42)      ...(7)
现在参考图26描述宏块的DCT系数的转换。图26示出用于在空间域通过从原始块B4等的计算求出部分宏块B42的数学模型。具体地,在左上侧B4被提取,插入0,移位到右下侧。即,示出从块B4通过下面的等式(8)的计算获得的B42
B42=H1×B4×H2
H 1 = 0 0 Ih 0 , H 2 0 Iw 0 0 . . . ( 8 )
在该等式中,Ih和Iw是从块B4提取的包括h行和h列的具有h×h大小的矩阵的标识码和包括w行和w列的具有w×w大小的矩阵的标识码。如图26所示,对于首先和B4合成的先矩阵(pre-matrix)H1,第一h列被提取并转换到底。对于随后和B4合成的H2,第一w行被提取并转换到右侧。
基于等式(8),B42的DCT系数可以根据下面的等式(9)直接从B4的DCT系数计算。
DCT(B42)=DCT(H1)×DCT(B4)×DCT(H2)        ...(9)
该等式被应用于所有子块(subblocks),总和被计算。这样,新块B′的DCT系数可以直接从原始块B1到B4的DCT系数获得,如下面的等式(10)所表示。
DCT ( B ′ ) = Σ i = 1 4 DCT ( H i 1 ) × DCT ( B i ) × DCT ( H i 2 ) . . . ( 10 )
Hi1和Hi2的DCT系数可以被计算并预先存储在存储器中,以便构成表存储器。以这种方式,甚至在正交变换域中可以进行运动估计和运动补偿。
然后,在编码部分221,当由ME部分272估计运动矢量时,附加到最初压缩的视频信号宏块的运动矢量,基于由活度计算部分200计算的活度,通过搜索来自分辨率转换部分260的转换输出的窄范围来估计,代替缺少任何信息时的运动矢量的估计。
如上所述,在该实施例的数字视频信号转换装置的解码部分211中,对MPEG编码的数据进行带运动补偿的预测解码处理,对所述MPEG编码的数据,包括带运动检测的预测编码和正交变换编码的混合编码被执行,即在可变长度解码之后进行逆量化。然后,进行运动补偿以获得保持在DCT域的解码数据,对DCT域的解码数据执行分辨率转换。因而,可以直接在正交变换域进行分辨率转换,解码(逆正交变换)到时域或空间域就不必要了。这样,计算被简化,可以实现较少计算错误的高质量转换。甚至,在编码部分221中,当由ME部分272估计运动矢量时,附加到最初压缩的视频信号宏块的运动矢量,基于从分辨率转换输出计算的活度通过搜索窄范围来估计,代替缺少任何信息时的运动矢量的估计。因而,由于ME部分272的计算量可以被显著减少,可以实现装置的微型化和转换处理时间的减少。
现在描述第十三个实施例。在该实施例中,也采用了用于对MPEG编码数据执行诸如分辨率转换处理的信号转换处理和输出视频编码数据的数字视频信号转换装置。
该数字视频信号转换装置有:解码部分340,用于对执行上述混合编码的MPEG编码数据通过进行部分解码处理,获得正交变换域的数据;转换部分343,用于对来自解码部分340的正交变换域的数据执行分辨率转换处理;和编码部分350,用于加一基于MPEG编码的数据的运动矢量信息的运动矢量,对来自转换部分343的转换输出执行压缩编码处理,如图27所示。
解码部分340包括VLD部分341、IQ部分342。这些VLD部分341和IQ部分342具有分别类似于图21的VLD部分112和IQ部分113的结构,且类似地运算。该解码部分340的特性是,不进行运动补偿。
具体地,关于P画面和B画面,由转换部分343对作为差信息的DCT系数进行分辨率转换,不进行运动补偿。通过分辨率转换获得的转换的DCT系数由Q部分345量化,Q部分345由速率控制部分348按速率控制。DCT系数由VLC部分346可变长度编码,然后以恒定速率从缓冲存储器347输出。
在这种情况下,编码部分350的运动矢量转换部分344根据分辨率转换速率对由VLD部分341提取的运动矢量mv刷新比例(rescale),将刷新比例的运动矢量提供给VLC部分346。
VLC部分346将刷新比例的运动矢量mv加到来自Q部分345的量化DCT系数,进行可变长度编码处理。VLC部分346然后将编码的数据提供给缓冲存储器347。
如上所述,在图27所示的数字视频信号转换装置中,由于在解码部分340和编码部分350中不进行运动补偿,计算可以简化,硬件的负担可以被减少。
在上述的数字视频信号转换装置中,可以进行速率转换。简而言之,该数字视频信号转换装置可以被应用到从4Mbps到2Mbps的传输率的转换,而分辨率不改变。
尽管在上述实施例中描述了装置的结构,通过使用本发明的数字信号转换方法可以将相应装置构造为软件。
根据本发明,对带运动检测的压缩编码的输入信息信号进行带运动补偿的解码,对解码的信号进行信号转换处理。对该转换的信号,进行带基于输入信息信号的运动矢量信息的运动检测的压缩编码处理。当作为该信号转换处理的分辨率转换处理被应用时,对转换的信号进行带运动补偿的压缩编码处理,该运动补偿是基于通过根据分辨率转换处理比例转换运动矢量信息获得的信息。特别地,在压缩编码时需要的运动矢量信息根据分辨率转换速率按比例转换,搜索窄范围。因而,在运动矢量估计时的计算量可以被显著减少,可以实现装置的小型化和转换处理时间的减少。
同样,根据本发明,对执行了包括带运动检测的预测编码和正交变换编码的压缩编码的输入信息信号进行部分解码,从而获得正交变换域的解码信号。然后,对正交变换域的解码信号进行信号转换处理。对该转换的信号,进行带运动补偿预测的压缩编码处理,该运动补偿使用基于输入信息信号的运动矢量信息的运动检测。当分辨率转换处理被作为该信号转换处理应用时,对转换的信号进行带运动补偿的压缩编码处理,该运动补偿基于通过根据从分辨率转换处理获得的活度转换运动矢量信息获得的信息。因而,通过搜索窄范围可以估计在压缩编码时需要的运动矢量信息,计算量可以被显著减少。这样,可以实现装置的小型化和转换处理时间的减少。同样,由于可以在正交变换域进行信号转换处理,不需要逆正交变换处理,不需要解码(逆正交变换)到时域或空间域。因而,计算被简化,可以进行较少计算错误的高质量的转换。
另外,根据本发明,对执行了包括带运动检测的预测编码和正交变换编码的压缩编码的输入信息信号进行部分解码,从而获得正交变换域的解码信号。然后,对正交变换域的解码信号进行信号转换处理。对该转换的信号,通过加上基于输入信息信号的运动矢量信息转换的运动矢量信息,进行压缩编码处理。因而,当分辨率转换处理被作为该信号转换处理应用时,通过加上通过比例转换根据分辨率转换处理的运动矢量信息获得的信息,对转换的信号进行压缩编码处理。
即,由于通过搜索窄范围可以估计在压缩编码时加上的运动矢量信息,在运动矢量估计时的计算量可以被显著减少。同样,由于可以在正交变换域进行信号转换处理,不需要逆正交变换处理。另外,由于在解码和编码时不用运动补偿处理,可以进一步减少计算量。

Claims (17)

1.一种数字信号转换方法,包括:
解码步骤,对带运动检测的压缩编码的输入信息信号进行带运动补偿的解码;
信号转换处理步骤,对来自所述解码步骤的解码的信号进行信号转换处理;和
编码步骤,对来自所述信号转换处理步骤的转换的信号,进行带基于所述输入信息信号的运动矢量信息的运动检测的压缩编码处理。
2.如权利要求1所述的数字信号转换方法,其中在所述信号转换处理步骤,对所述解码的信号进行分辨率转换处理。
3.如权利要求2所述的数字信号转换方法,其中在所述编码处理步骤,根据分辨率转换处理,基于通过比例转换所述运动矢量信息获得的信息,对所述转换的信号进行压缩编码处理。
4.如权利要求1所述的数字信号转换方法,其中在所述信号转换处理步骤,对所述解码的信号进行速率转换处理。
5.一种数字信号转换装置,包括:
解码装置,用于对带运动检测的压缩编码的输入信息信号进行带运动补偿的解码;
信号转换处理装置,用于对来自所述解码装置的解码的信号进行信号转换处理;和
编码处理装置,用于基于所述输入信息信号的运动矢量信息,对来自所述信号转换处理装置的转换的信号进行带运动检测的压缩编码处理。
6.一种数字信号转换方法,包括:
解码步骤,对输入信息信号仅进行带运动补偿的预测解码处理,在所述输入信息信号上执行了包括带运动检测的预测编码和正交变换编码的压缩编码,从而获得执行了正交变换编码的正交变换域的解码的信号;
信号转换处理步骤,对来自所述解码步骤的正交变换域的解码的信号进行信号转换处理;和
编码处理步骤,通过使用基于所述输入信息信号的运动矢量信息的运动检测,对来自所述信号转换处理步骤的转换的信号进行带运动补偿预测的压缩编码处理。
7.如权利要求6所述的数字信号转换方法,其中在所述信号转换处理步骤,通过使用基于对应于用于对所述输入信息信号执行正交变换编码的正交变换矩阵的逆正交变换矩阵、和对应于用于获得时域的信号转换输出信号的逆正交变换矩阵的正交变换矩阵产生的变换矩阵,对来自所述解码步骤的所述正交变换域的解码的信号进行信号转换处理。
8.如权利要求6所述的数字信号转换方法,其中在所述信号转换处理步骤,对来自所述解码步骤的所述正交变换域的解码的信号进行分辨率转换处理。
9.如权利要求8所述的数字信号转换方法,其中在所述编码处理步骤,对所述转换的信号,进行基于根据所述分辨率转换处理通过比例转换所述运动矢量信息而获得的信息的压缩编码处理。
10.如权利要求6所述的数字信号转换方法,其中在所述信号转换处理步骤,对来自所述解码步骤的所述正交变换域的解码的信号进行速率转换处理。
11.一种数字信号转换装置,包括:
解码装置,用于对输入信息信号仅进行带运动补偿的预测解码处理,在所述输入信息信号上执行了包括带运动检测的预测编码和正交变换编码的压缩编码,从而获得执行了正交变换编码的正交变换域的解码的信号;
信号转换装置,用于对来自所述解码装置的正交变换域的解码的信号进行信号转换处理;和
编码处理装置,通过使用基于所述输入信息信号的运动矢量信息的运动检测,对来自所述信号转换装置的转换的信号进行带运动补偿预测的压缩编码处理。
12.一种数字信号转换方法,包括:
解码步骤,对输入信息信号进行部分解码处理,所述输入信息信号由包括带运动检测的预测编码和正交变换编码的压缩编码进行了处理,从而获得正交变换域的信号;
信号转换处理步骤,对来自所述解码步骤的正交变换域的信号进行信号转换处理;和
编码处理步骤,对来自所述信号转换处理步骤的所述转换的信号,加上基于所述输入信息信号的运动矢量信息转换的运动矢量信息,进行压缩编码处理。
13.如权利要求12所述的数字信号转换方法,其中在所述信号转换处理步骤,通过使用基于对应于用于对所述输入信息信号执行正交变换编码的正交变换矩阵的逆正交变换矩阵、和对应于用于获得时域的信号转换输出信号的逆正交变换矩阵的正交变换矩阵产生的变换矩阵,对来自所述解码步骤的所述正交变换域的解码的信号进行信号转换处理。
14.如权利要求12所述的数字信号转换方法,其中在所述信号转换处理步骤,对来自所述解码步骤的所述正交变换域的解码的信号进行分辨率转换处理。
15.如权利要求14所述的数字信号转换方法,其中在所述编码处理步骤,对所述转换的信号,加上根据所述分辨率转换处理通过比例转换所述运动矢量信息而获得的信息,进行压缩编码处理。
16.如权利要求12所述的数字信号转换方法,其中在所述信号转换处理步骤,对来自所述解码步骤的所述正交变换域的解码的信号进行速率转换处理。
17.一种数字信号转换装置,包括:
解码装置,对输入信息信号进行部分解码处理,所述输入信息信号由包括带运动检测的预测编码和正交变换编码的压缩编码进行了处理,从而获得正交变换域的信号;
信号转换处理装置,对来自所述解码装置的正交变换域的信号进行信号转换处理;和
编码处理装置,对来自所述信号转换处理装置的所述转换的信号,加上基于所述输入信息信号的运动矢量信息转换的运动矢量信息,进行压缩编码处理。
CN 200510089451 1997-11-05 1998-11-05 数字信号转换方法和数字信号转换装置 Expired - Fee Related CN1722847B (zh)

Applications Claiming Priority (12)

Application Number Priority Date Filing Date Title
JP303132/97 1997-11-05
JP30313397 1997-11-05
JP30313297 1997-11-05
JP303133/97 1997-11-05
JP304623/97 1997-11-06
JP30462397 1997-11-06
JP305959/97 1997-11-07
JP30595997 1997-11-07
JP310721/97 1997-11-12
JP31072197 1997-11-12
JP314078/97 1997-11-14
JP31407897 1997-11-14

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CNB988016842A Division CN1251518C (zh) 1997-11-05 1998-11-05 数字信号转换方法和数字信号转换装置

Publications (2)

Publication Number Publication Date
CN1722847A true CN1722847A (zh) 2006-01-18
CN1722847B CN1722847B (zh) 2010-06-16

Family

ID=35912737

Family Applications (9)

Application Number Title Priority Date Filing Date
CN 200510089453 Expired - Fee Related CN100481951C (zh) 1997-11-05 1998-11-05 数字信号转换方法和数字信号转换装置
CNB2005100894503A Expired - Fee Related CN100421473C (zh) 1997-11-05 1998-11-05 数字信号转换方法和数字信号转换装置
CN 200510089448 Expired - Fee Related CN100502488C (zh) 1997-11-05 1998-11-05 数字信号转换装置
CN 200510089452 Expired - Fee Related CN100474931C (zh) 1997-11-05 1998-11-05 数字信号转换方法和数字信号转换装置
CN 200510089447 Pending CN1722844A (zh) 1997-11-05 1998-11-05 数字信号转换方法
CN 200510089444 Pending CN1722850A (zh) 1997-11-05 1998-11-05 数字信号转换方法和数字信号转换装置
CN 200510089446 Expired - Fee Related CN100521788C (zh) 1997-11-05 1998-11-05 数字信号转换方法
CN 200510089451 Expired - Fee Related CN1722847B (zh) 1997-11-05 1998-11-05 数字信号转换方法和数字信号转换装置
CN 200510089449 Expired - Fee Related CN100481950C (zh) 1997-11-05 1998-11-05 数字信号转换装置

Family Applications Before (7)

Application Number Title Priority Date Filing Date
CN 200510089453 Expired - Fee Related CN100481951C (zh) 1997-11-05 1998-11-05 数字信号转换方法和数字信号转换装置
CNB2005100894503A Expired - Fee Related CN100421473C (zh) 1997-11-05 1998-11-05 数字信号转换方法和数字信号转换装置
CN 200510089448 Expired - Fee Related CN100502488C (zh) 1997-11-05 1998-11-05 数字信号转换装置
CN 200510089452 Expired - Fee Related CN100474931C (zh) 1997-11-05 1998-11-05 数字信号转换方法和数字信号转换装置
CN 200510089447 Pending CN1722844A (zh) 1997-11-05 1998-11-05 数字信号转换方法
CN 200510089444 Pending CN1722850A (zh) 1997-11-05 1998-11-05 数字信号转换方法和数字信号转换装置
CN 200510089446 Expired - Fee Related CN100521788C (zh) 1997-11-05 1998-11-05 数字信号转换方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN 200510089449 Expired - Fee Related CN100481950C (zh) 1997-11-05 1998-11-05 数字信号转换装置

Country Status (1)

Country Link
CN (9) CN100481951C (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5195032B2 (ja) * 2008-05-28 2013-05-08 富士通株式会社 符号化装置/復号化装置、符号化方法/復号化方法及びプログラム
CN101873292A (zh) * 2010-05-24 2010-10-27 电子科技大学 一种变换域通信系统信号发射、接收方法及功能模块架构
US11354790B2 (en) * 2018-04-06 2022-06-07 Sony Corporation Image processing apparatus, image processing method, and recording medium

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5262854A (en) * 1992-02-21 1993-11-16 Rca Thomson Licensing Corporation Lower resolution HDTV receivers
JPH0865663A (ja) * 1994-08-19 1996-03-08 Canon Inc ディジタル画像情報処理装置
WO1997013371A1 (en) * 1995-10-06 1997-04-10 Matsushita Electric Industrial Co., Ltd. Compressed video data processing with conversion of image compression format
US5847762A (en) * 1995-12-27 1998-12-08 Thomson Consumer Electronics, Inc. MPEG system which decompresses and then recompresses MPEG video data before storing said recompressed MPEG video data into memory

Also Published As

Publication number Publication date
CN1722846A (zh) 2006-01-18
CN1722844A (zh) 2006-01-18
CN1722847B (zh) 2010-06-16
CN100481950C (zh) 2009-04-22
CN1722845A (zh) 2006-01-18
CN1722848A (zh) 2006-01-18
CN1722843A (zh) 2006-01-18
CN100502488C (zh) 2009-06-17
CN100521788C (zh) 2009-07-29
CN100421473C (zh) 2008-09-24
CN1722849A (zh) 2006-01-18
CN1722850A (zh) 2006-01-18
CN100474931C (zh) 2009-04-01
CN1747542A (zh) 2006-03-15
CN100481951C (zh) 2009-04-22

Similar Documents

Publication Publication Date Title
CN1251518C (zh) 数字信号转换方法和数字信号转换装置
CN1297148C (zh) 动画图像编码传送系统、动画图像编码传送方法、该系统和方法使用的适合的编码装置、译码装置、编码方法、译码方法以及程序
CN1315331C (zh) 图像信号转换方法和设备以及图像提供系统
CN1254111C (zh) 画面编码和解码装置及其方法
CN1719905A (zh) 编码装置、编码方法、编码方法程序及相应的记录媒体
CN1701616A (zh) 图像信息编码装置和方法,以及图像信息解码装置和方法
CN1076935C (zh) 运动图象变换系数逆变换时防止舍入误差的方法和设备
CN1204751C (zh) 编码数据变换方法、再编码方法、再编码系统以及数据记录媒体
CN1335724A (zh) 编码装置和编码方法
CN1653822A (zh) 用于代码转换压缩视频比特流的方法和设备
CN1778110A (zh) 图像解码设备和图像解码方法
CN1339922A (zh) 编码信号的分离和合并装置、方法及计算机程序产品
CN1993993A (zh) 图像处理设备、其程序、及其方法
CN1379366A (zh) 图像处理装置和方法
CN1090115A (zh) 图象信号编码方法和装置和图象信号解码方法和装置
CN1630374A (zh) 用于前向预测的隔行扫描视频帧的场的预测运动矢量
CN1596547A (zh) 移动图像编码设备、移动图像解码设备、移动图像编码方法、移动图像解码方法、程序和存储程序的计算机可读记录媒介
CN1537384A (zh) 用于子像素值内插的方法
CN1926576A (zh) 用于数字编码3d立体视频图像的方法和系统
CN1801945A (zh) 编码视频序列变换装置和编码视频序列变换方法
CN1969559A (zh) 移动图像编码装置和移动图像译码装置、其方法和程序
CN1216199A (zh) 数字图象填补方法、图象处理装置及数据记录媒体
CN1149499C (zh) 用于采用离散变换进行数字视频数据压缩的方法和系统
CN1662069A (zh) 图像、视频信号的编码/解码方法
CN1288641A (zh) 视频信号编码方法、视频信号编码装置及程序记录媒体

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100616

Termination date: 20121105