CN104137544A - 图像编码装置、图像解码装置、图像编码方法以及图像解码方法 - Google Patents

图像编码装置、图像解码装置、图像编码方法以及图像解码方法 Download PDF

Info

Publication number
CN104137544A
CN104137544A CN201380011367.7A CN201380011367A CN104137544A CN 104137544 A CN104137544 A CN 104137544A CN 201380011367 A CN201380011367 A CN 201380011367A CN 104137544 A CN104137544 A CN 104137544A
Authority
CN
China
Prior art keywords
scene
image
unit
data
coded data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201380011367.7A
Other languages
English (en)
Other versions
CN104137544B (zh
Inventor
关口俊一
杉本和夫
伊谷裕介
山田悦久
工藤大树
西川博文
木槻纯一
竹内浩一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of CN104137544A publication Critical patent/CN104137544A/zh
Application granted granted Critical
Publication of CN104137544B publication Critical patent/CN104137544B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/179Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/92Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/7921Processing of colour television signals in connection with recording for more than one processing mode
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

场景内/场景间自适应编码部(6)在数据记录部(2)中记录了的主式流内的场景影像单位的编码数据中,将由场景间预测判定部(5)未检索出在预测参照中使用的代替的编码数据的编码数据、和由场景间预测判定部(5)检索出的编码数据使用于预测参照,将该MPEG-2视频比特流变换为从式流。

Description

图像编码装置、图像解码装置、图像编码方法以及图像解码方法
技术领域
本发明涉及对图像进行压缩编码来传送或者记录编码数据的图像编码装置以及图像编码方法、和从由图像编码装置传送或者记录了的编码数据对图像进行解码的图像解码装置以及图像解码方法。
背景技术
在以往的图像编码装置对规定的影像序列进行压缩编码时,被构成为通过利用该影像序列内的空间上的相关或者时间上的相关来进行预测编码,提高压缩效率。
另一方面,在近年来的HDD内置型数字录像设备、云型系统等中,在庞大的记录空间内,管理多个压缩了的影像流,所以根据条件,在不同的影像序列之间影像的内容类似的状况也增加。
在这样的状况下,能够还应用在不同的影像序列之间存在的相关来进一步进行数据压缩。
在以下的专利文献1中,公开了在HDD内置型数字录像设备中,在多个不同的录像节目之间进行比较,并对根据其比较结果得到的差分信息进行压缩编码,从而以高的压缩效率记录多个录像节目的技术。
专利文献1:日本特开2006-262311号公报(段落编号[0006])
发明内容
以往的图像编码装置如以上那样构成,所以在不同的影像流之间始终将同一时刻的帧的信号作为比较评价标准而取差分,对该差分信号进行压缩编码。因此,在影像之间类似的切割的时刻有偏差等的情况下,存在无法进行高效的压缩的课题。
另外,对影像流全部在图像信号等级下实施了比较,所以还存在处理量增加的课题。
本发明是为了解决上述那样的课题而完成的,其目的在于得到一种不会导致处理量的增加、影像质量的降低,而能够进行高效的压缩的图像编码装置以及图像编码方法。
另外,本发明的目的在于提供一种能够高效地对压缩了的图像进行解码的图像解码装置以及图像解码方法。
本发明的图像编码装置具备影像编码数据变换单元,该影像编码数据变换单元针对依照第一影像编码方式的影像编码数据内的每个场景影像数据,选择性地应用使用其它场景影像数据的预测参照,变换为依照第二影像编码方式的影像编码数据,影像编码数据变换单元在变换第一影像编码数据内的场景影像单位的编码数据时,探索应在预测参照中使用的其它场景影像单位的编码数据,选择是否将探索出的场景影像单位的编码数据使用于预测参照,将第一场景影像单位的编码数据变换为依照第二影像编码方式的影像编码数据,并且生成表示是否将探索出的场景影像单位的编码数据使用于预测参照的元数据。
根据本发明,具备影像编码数据变换单元,该影像编码数据变换单元针对依照第一影像编码方式的影像编码数据内的每个场景影像数据,选择性地应用使用其它场景影像数据的预测参照,变换为依照第二影像编码方式的影像编码数据,影像编码数据变换单元在变换第一影像编码数据内的场景影像单位的编码数据时,探索应在预测参照中使用的其它场景影像单位的编码数据,选择是否将探索出的场景影像单位的编码数据使用于预测参照,将第一场景影像单位的编码数据变换为依照第二影像编码方式的影像编码数据,并且生成表示是否将探索出的场景影像单位的编码数据使用于预测参照的元数据,所以具有不会导致处理量的增加、影像质量的降低,而能够进行高效的压缩的效果。
附图说明
图1是示出本发明的实施方式1的图像编码装置的结构图。
图2是示出本发明的实施方式1的图像编码装置的处理内容(图像编码方法)的流程图。
图3是示出本发明的实施方式1的图像编码装置的场景内/场景间自适应编码部6的结构图。
图4是示出本发明的实施方式1的图像解码装置的结构图。
图5是示出本发明的实施方式1的图像解码装置的处理内容(图像编码方法)的流程图。
图6是示出从式编码数据与主式流的关系的说明图。
图7是示出场景内/场景间自适应编码部6中的场景内预测编码部14以及场景间预测编码部15的处理的说明图。
图8是示出本发明的实施方式2的图像编码装置的结构图。
图9是示出包括作为主式流再压缩的“MPEG-2视频比特流”和作为从式流再压缩的“MPEG-2视频比特流”的单一的视频比特流的说明图。
图10是示出从主式流中抽出从式流编码管理信息表示的场景影像的编码数据的状态的说明图。
图11是示出交替反复主式流和从式流的单一的MPEG-2视频比特流的说明图。
图12是示出主式流的时间上的长度、和从式流的时间上的长度不同的MPEG-2视频比特流的说明图。
图13是示出场景刚刚变换之后的场景影像是主式流的MPEG-2视频比特流的说明图。
图14是示出表示单一的MPEG-2视频比特流中包含的各个流是主式流还是从式流的flag(标志)的说明图。
图15是示出性质与编码中的场景影像明显地不同的场景影像被跳过(skip)了的MPEG-2视频比特流的说明图。
图16是示出记录器(图像编码装置、图像解码装置)连接到网络的系统例的结构图。
图17是示出仅I图片的变换例的说明图。
图18是示出仅I、P图片的变换例的说明图。
图19是示出本发明的实施方式4的图像编码装置的处理内容的流程图。
符号说明
1:场景相关测定参数计算部(场景相关测定参数计算单元);2:数据记录部(数据记录单元);3:开关;4:H.264变换部(第一影像编码数据变换单元);5:场景间预测判定部(场景影像检索单元);6:场景内/场景间自适应编码部(第二影像编码数据变换单元);7:复用部;11:MPEG-2解码部;12:开关;13:场景间预测参照部位抽出部;14:场景内预测编码部;15:场景间预测编码部;16:从式流复用部;21:开关;22:H.264解码部(第一影像解码单元);23:复用分离部(第二影像解码单元);24:解码流形成部(第二影像解码单元);25:从影像解码部(第二影像解码单元);31:开关(编码数据分割单元)。
具体实施方式
以下,为了更详细地说明本发明,依照附图,说明具体实施方式。
实施方式1.
在该实施方式1中,说明在接收MPEG-2视频比特流,对该MPEG-2视频比特流进行再压缩而记录的设备或者系统中,抑制质量降低而高效地进行再压缩的图像编码装置、和根据从该图像编码装置输出了的编码数据再生影像信号的图像解码装置。
图1是示出本发明的实施方式1的图像编码装置的结构图。
在图1中,场景相关测定参数计算部1由安装了例如CPU的半导体集成电路、或者、单片式微型计算机等构成,实施如下处理:如果输入了通过MPEG-2影像编码方式压缩编码了的MPEG-2视频比特流(第一影像编码数据),则针对该MPEG-2视频比特流中包含的各场景的影像(以下,称为“场景影像”)的每一个,计算成为测定与其它场景影像的相关的标准的场景相关测定参数。
此处,场景既可以是规定的时间的单位,也可以是规定MPEG-2视频比特流的数据构造的GOP(Group Of Picture(图片组))、即能够随机访问MPEG-2视频比特流的数据单位(在2个I图片之间包含的全部图片数据)等。
另外,场景相关测定参数计算部1构成了场景相关测定参数计算单元。
数据记录部2由例如硬盘、SSD等记录介质构成,记录由场景相关测定参数计算部1计算了的场景相关测定参数。
另外,数据记录部2记录由后述H.264变换部4变换了的主式流(第二影像编码数据),并且记录从后述复用部7输出了的从式编码数据等。
关于从式编码数据的详细将后述,包括在由场景内/场景间自适应编码部6变换了的从式流(第三影像编码数据)中不使用由场景间预测判定部5检索了的编码数据而变换出的场景影像单位的编码数据(场景内预测编码数据)、和表示由场景间预测判定部5检索了的编码数据等的从式流编码管理信息。
另外,数据记录部2构成了数据记录单元。
开关3实施如下处理:在从外部提供的再压缩方法识别信号指示了“将MPEG-2视频比特流作为主式流再压缩”的意思的情况下,将从场景相关测定参数计算部1输出了的MPEG-2视频比特流提供给H.264变换部4,在该再压缩方法识别信号指示了“将MPEG-2视频比特流作为从式流再压缩”的意思的情况下,将从场景相关测定参数计算部1输出了的MPEG-2视频比特流提供给场景内/场景间自适应编码部6。
H.264变换部4由安装了例如CPU的半导体集成电路或者单片式微型计算机等构成,实施如下处理:如果从开关3提供了MPEG-2视频比特流,则将该MPEG-2视频比特流通过规定的处理过程变换为依照H.264影像编码方式的视频比特流,将该视频比特流作为主式流记录到数据记录部2。另外,H.264变换部4构成了第一影像编码数据变换单元。
场景间预测判定部5由安装了例如CPU的半导体集成电路或者单片式微型计算机等构成,实施如下处理:根据由场景相关测定参数计算部1计算了的场景相关测定参数(相关测定参数A、相关测定参数B),从数据记录部2中记录了的主式流内的场景影像单位的编码数据中,在场景内/场景间自适应编码部6进行预测编码时,代替MPEG-2视频比特流内的场景影像单位的编码数据而检索在预测参照中使用的编码数据。另外,场景间预测判定部5构成了编码数据检索单元。
场景相关测定参数A是在再压缩方法识别信号指示了“将MPEG-2视频比特流作为主式流再压缩”的意思时计算了的参数,场景相关测定参数B是在再压缩方法识别信号指示了“将MPEG-2视频比特流作为从式流再压缩”的意思时计算了的参数。
即,场景间预测判定部5实施如下处理:使用由场景相关测定参数计算部1计算了的场景相关测定参数A、B,测定MPEG-2视频比特流内的各个场景影像、和数据记录部2中记录了的主式流内的各个场景影像的相关值,并且针对MPEG-2视频比特流内的各个场景影像,确定相关值最高的主式流内的场景影像,如果该相关值是规定值以上,则将该场景影像的编码数据决定为在预测参照中使用的编码数据。
另外,场景间预测判定部5实施如下处理:如果发现在预测参照中使用的编码数据(存在相关高的场景影像的情况),则将表示“在该处理对象的场景中,利用主式流内的相关高的场景影像的编码数据来进行编码”的意思的从式流编码管理信息输出到场景内/场景间自适应编码部6以及复用部7,如果未发现在预测参照中使用的编码数据(不存在相关高的场景影像的编码数据的情况),则将表示“在该处理对象的场景中,不使用主式流内的编码数据,进行在场景内封闭的编码”的意思的从式流编码管理信息输出到场景内/场景间自适应编码部6以及复用部7。
另外,在从式流编码管理信息中至少包括数据记录部2中记录的多个比特流数据中的、确定主式流的主式流ID、确定是否将主式流内的场景影像单位的编码数据使用于预测参照的场景间预测指示标志、确定主式流上的主场景(预测参照中使用的场景)的主场景ID等。
场景内/场景间自适应编码部6由安装了例如CPU的半导体集成电路或者单片式微型计算机等构成,实施如下处理:在数据记录部2中记录了的主式流内的场景影像单位的编码数据中,将由场景间预测判定部5未检索出在预测参照中使用的代替的编码数据的编码数据、和由场景间预测判定部5检索出的编码数据使用于预测参照,将该MPEG-2视频比特流变换为从式流。另外,场景内/场景间自适应编码部6构成了第二影像编码数据变换单元。
复用部7由安装了例如CPU的半导体集成电路或者单片式微型计算机等构成,实施如下处理:对由场景内/场景间自适应编码部6变换了的从式流、和从场景间预测判定部5输出了的从式流编码管理信息进行复用,将其复用结果作为从式编码数据记录到数据记录部2。
在图1的例子中,假设作为图像编码装置的构成要素的场景相关测定参数计算部1、数据记录部2、开关3、H.264变换部4、场景间预测判定部5、场景内/场景间自适应编码部6以及复用部7的各个由专用的硬件构成了的例子,但图像编码装置也可以由计算机构成。
在由计算机构成了图像编码装置的情况下,在计算机的存储器上构成数据记录部2,并且将记述了场景相关测定参数计算部1、开关3、H.264变换部4、场景间预测判定部5、场景内/场景间自适应编码部6以及复用部7的处理内容的程序储存到计算机的存储器,该计算机的CPU执行在该存储器中储存了的程序即可。
图2是示出本发明的实施方式1的图像编码装置的处理内容(图像编码方法)的流程图。
图3是示出本发明的实施方式1的图像编码装置的场景内/场景间自适应编码部6的结构图。
在图3中,MPEG-2解码部11实施如下处理:如果从开关3提供了MPEG-2视频比特流,则实施针对该MPEG-2视频比特流内的各个场景影像的编码数据的解码处理,按照场景影像单位生成解码图像。
开关12实施如下处理:如果从场景间预测判定部5输出了的从式流编码管理信息中包含的场景间预测指示标志表示不将主式流内的场景影像单位的编码数据使用于预测参照的意思,则将由MPEG-2解码部11生成了的解码图像输出到场景内预测编码部14,如果该场景间预测指示标志表示将主式流内的场景影像单位的编码数据使用于预测参照的意思,则将由MPEG-2解码部11生成了的解码图像输出到场景间预测编码部15。
场景间预测参照部位抽出部13实施如下处理:如果从场景间预测判定部5输出了的从式流编码管理信息中包含的场景间预测指示标志表示将主式流内的场景影像单位的编码数据使用于预测参照的意思,则从该从式流编码管理信息中包含的主式流ID表示的主式流中,抽出主场景ID表示的场景影像的编码数据,实施针对该编码数据的H.264解码处理,生成该场景影像的解码图像(以下,称为“主式流解码图像”)。
场景内预测编码部14实施如下处理:完全不使用主式流内的编码数据,对从开关12输出了的解码图像实施H.264压缩编码处理,输出作为其编码处理结果的场景内预测编码数据。
场景间预测编码部15实施如下处理:利用从开关12输出了的解码图像的时间相关、以及该解码图像和由场景间预测参照部位抽出部13生成了的主式流解码图像中的同一时刻位置的图像数据之间的相关,执行H.264的运动补偿处理或者使用了帧内部预测的压缩编码处理,输出作为其处理结果的场景间预测编码数据。
从式流复用部16实施如下处理:对从场景内预测编码部14输出了的场景内预测编码数据和从场景间预测编码部15输出了的场景间预测编码数据进行复用来生成从式流,将该从式流输出到复用部7。
图4是示出本发明的实施方式1的图像解码装置的结构图。
在图4中,数据记录部2是与图1的图像编码装置的数据记录部2相同的记录部。
开关21实施如下处理:在从外部提供的流类别识别信号表示“将该编码数据作为主式流来解码”的意思的情况下,读入在数据记录部2中记录了的主式流而输出到H.264解码部22,在该流类别识别信号指示了“将该编码数据作为从式编码数据来解码”的意思的情况下,将在数据记录部2中记录了的从式编码数据输出到复用分离部23。
H.264解码部22由安装了例如CPU的半导体集成电路或者单片式微型计算机等构成,实施如下处理:如果从开关21接收到主式流,则对该主式流实施依照H.264影像编码方式的规定的解码处理,从而生成再生影像。另外,H.264解码部22构成了第一影像解码单元。
复用分离部23由安装了例如CPU的半导体集成电路或者单片式微型计算机等构成,实施如下处理:如果从开关21接收到从式编码数据,则将该从式编码数据分离为从式流和从式流编码管理信息。
解码流形成部24由安装了例如CPU的半导体集成电路或者单片式微型计算机等构成,实施如下处理:读出在数据记录部2中记录了的多个主式流中的、由复用分离部23分离了的从式流编码管理信息中包含的主式流ID表示的主式流,并且从该主式流中,抽出在该从式流编码管理信息中包含的主场景ID表示的场景影像的编码数据,将该编码数据嵌入到由复用分离部23分离了的从式流的对应的场景影像的位置,从而形成解码流。
从影像解码部25由安装了例如CPU的半导体集成电路或者单片式微型计算机等构成,实施如下处理:通过对由解码流形成部24形成了的解码流实施规定的解码处理,生成与从式编码数据对应的再生影像。
另外,由复用分离部23、解码流形成部24以及从影像解码部25构成了第二影像解码单元。
在图4的例子中,假设了作为图像解码装置的构成要素的数据记录部2、开关21、H.264解码部22、复用分离部23、解码流形成部24以及从影像解码部25的各个由专用的硬件构成了的例子,但图像解码装置也可以由计算机构成。
在由计算机构成了图像解码装置的情况下,在计算机的存储器上构成数据记录部2,并且将记述了开关21、H.264解码部22、复用分离部23、解码流形成部24以及从影像解码部25的处理内容的程序储存到计算机的存储器,该计算机的CPU执行在该存储器中储存了的程序即可。
图5是示出本发明的实施方式1的图像解码装置的处理内容(图像编码方法)的流程图。
接下来,说明动作。
首先,说明图1的图像编码装置的处理内容。
场景相关测定参数计算部1如果输入了通过MPEG-2影像编码方式压缩编码了的MPEG-2视频比特流,则针对该MPEG-2视频比特流的每个场景影像,计算成为测定与其它场景影像的相关的标准的场景相关测定参数(图2的步骤ST1)。
此处,场景既可以是规定的时间的单位,也可以是规定MPEG-2视频比特流的数据构造的GOP、即能够随机访问MPEG-2视频比特流的数据单位(在2个I图片之间包含的全部图片数据)等。
由场景相关测定参数计算部1计算了的每个场景影像的场景相关测定参数被记录到数据记录部2中。
此处,叙述场景相关测定参数的具体的事例。
场景相关测定参数是使用能够测量“2个场景之间的类似度”的量的参数。
例如,可以考虑由MPEG-2视频比特流的I图片编码数据中包含的DCT系数的DC分量构成缩小图像,生成表示该缩小图像的亮度平均、亮度分散等纹理特征、或者、该缩小图像的颜色平均、颜色分散等颜色特征的量,将表示该纹理特征或者颜色特征的量用作场景相关测定参数。
另外,也可以针对由该DC分量构成的缩小图像,生成在以下的非专利文献1中公开了的“Image Signature(图片签名)”,将“ImageSignature”用作场景相关测定参数。
[非专利文献1]
西川,P.Brasnett他、“MPEG-7技術Image Signature:画像同定技術”、三菱電機技報2008年12月号
“Image Signature”是使用在以下的非专利文献2中公开了的跟踪变换,用空间的频率表现了亮度信息的量,作为评价图像的同一性的参数进行了国际标准化。
具体而言,考虑将场景开头的“Image Signature”、或者、与在场景内包含的多个I图片的缩小图像对应的“Image Signature”的集合用作场景相关测定参数。
[非专利文献2]
A.Kadyrov、M.Petrou、“The Trace Transform and ItsApplications”、IEEE Trans.Pattern Analysis and MachineIntelligence、vol.23no.8pp.811-8282001
另外,也可以生成在以下的非专利文献3中公开的“VideoSignature(视频签名)”,将“Video Signature”用作场景相关测定参数。
[非专利文献3]
工藤、西川、“画像同定技術(Visual Signature)”、三菱電機技報2011年11月号
在上述任意一个中,都根据MPEG-2视频比特流的I图片编码数据中包含的DCT系数的DC分量生成缩小图像,将针对该缩小图像的特征量作为场景相关测定参数,但也可以将MPEG-2视频比特流解码为图像数据,在解码图像等级中执行同样的特征量的抽出。
由此,虽然处理量增加,但能够抽出适合于实际的图像数据的特征量。
如果从外部提供的再压缩方法识别信号指示了“将MPEG-2视频比特流作为主式流再压缩”的意思(步骤ST2),则开关3将从场景相关测定参数计算部1输出了的MPEG-2视频比特流提供给H.264变换部4。
另一方面,如果该再压缩方法识别信号指示了“将MPEG-2视频比特流作为从式流再压缩”的意思(步骤ST2),则将从场景相关测定参数计算部1输出了的MPEG-2视频比特流提供给场景内/场景间自适应编码部6。
如果从开关3提供了MPEG-2视频比特流,则H.264变换部4将该MPEG-2视频比特流通过规定的处理过程变换为依照H.264影像编码方式的视频比特流,将该视频比特流作为主式流,记录到数据记录部2(步骤ST3)。
如果场景相关测定参数计算部1计算了场景相关测定参数A或者场景相关测定参数B,则场景间预测判定部5根据该场景相关测定参数A、B,从数据记录部2中记录了的主式流内的场景影像单位的编码数据中,在场景内/场景间自适应编码部6进行预测编码时,代替MPEG-2视频比特流内的场景影像单位的编码数据而检索在预测参照中使用的编码数据。
场景相关测定参数A是在再压缩方法识别信号指示了“将MPEG-2视频比特流作为主式流再压缩”的意思时计算了的参数,场景相关测定参数B是在再压缩方法识别信号指示了“将MPEG-2视频比特流作为从式流再压缩”的意思时计算了的参数。
以下,具体说明由场景间预测判定部5实施的编码数据的检索处理。
首先,场景间预测判定部5使用由场景相关测定参数计算部1计算了的场景相关测定参数A、B,测定MPEG-2视频比特流内的各个场景影像、和在数据记录部2中记录了的主式流内的各个场景影像的相关值。
接下来,场景间预测判定部5针对MPEG-2视频比特流内的每个场景影像,比较针对该场景影像的主式流内的各个场景影像的相关值,探索相关值最大的主式流内的场景影像。
场景间预测判定部5如果探索出相关值最大的主式流内的场景影像,则如果其相关值是预先设定了的规定值以上,则将该场景影像的编码数据决定为在预测参照中使用的场景影像。
另一方面,如果其相关值小于预先设定了的规定值,则不将该主式流内的场景影像的编码数据使用于预测参照。
另外,由场景间预测判定部5实施的探索相关值最大的主式流内的场景影像的处理对应于场景相关测定参数A和场景相关测定参数B的匹配处理,例如,能够利用在上述非专利文献3中公开了的“ImageSignature”、“Video Signature”等匹配处理。
场景间预测判定部5如果发现了场景内/场景间自适应编码部6在预测参照中使用的编码数据(存在与MPEG-2视频比特流内的场景影像相关高的主式流内的场景影像的情况),则将表示“在该处理对象的场景中,利用主式流内的相关高的场景影像的编码数据来进行编码”的意思的从式流编码管理信息输出到场景内/场景间自适应编码部6以及复用部7。
另一方面,如果未发现场景内/场景间自适应编码部6在预测参照中使用的编码数据(不存在与MPEG-2视频比特流内的场景影像相关高的主式流内的场景影像的情况),则将表示“在该处理对象的场景中,不使用主式流内的编码数据,进行在场景内封闭的编码”的意思的从式流编码管理信息输出到场景内/场景间自适应编码部6以及复用部7。
另外,在从式流编码管理信息中,至少包括数据记录部2中记录的多个比特流数据中的、确定主式流的主式流ID、确定是否将主式流内的场景影像单位的编码数据使用于预测参照的场景间预测指示标志、确定主式流上的主场景(预测参照中使用的场景)的主场景ID等。
在从场景间预测判定部5输出了从式流编码管理信息之后,场景相关测定参数B变得不需要,所以也可以构成为从数据记录部2删除。
关于场景相关测定参数A在以后生成其它的从式流时需要,所以也可以构成为预先保存于数据记录部2,也可以为了确保数据记录部2的记录容量,每当生成从式流时,从主式流随时生成。
另外,在生成从式流时,在不使用主式流的情况下,场景相关测定参数A也变得不需要,所以构成为从数据记录部2删除。
场景内/场景间自适应编码部6在数据记录部2中记录了的主式流内的场景影像单位的编码数据中,将由场景间预测判定部5未检索在预测参照中使用的代替的编码数据的编码数据、和由场景间预测判定部5检索了的编码数据使用于预测参照,将该MPEG-2视频比特流变换为从式流。
此处,图6是示出从式编码数据与主式流的关系的说明图。
图6所示的主式流是数据记录部2中记录了的1个以上的主式流中的、从式流编码管理信息中包含的主式流ID表示的主式流,通过H.264影像编码方式生成。
从式流通过从式流编码管理信息中包含的场景间预测指示标志,被分类为主式流内的场景影像单位的编码数据、和不替代地使用主式流内的场景影像单位的编码数据的编码数据。
另外,通过从式流编码管理信息中包含的主场景ID,确定主式流上的主场景(预测参照中使用的场景)。
以下,具体说明由场景内/场景间自适应编码部6实施的流的变换处理。
首先,场景内/场景间自适应编码部6的MPEG-2解码部11如果被从开关3提供了MPEG-2视频比特流,则实施针对该MPEG-2视频比特流内的各个场景影像的编码数据的解码处理,按照场景影像单位生成解码图像(步骤ST4)。
开关12如果从场景间预测判定部5输出了的从式流编码管理信息中包含的场景间预测指示标志表示不将主式流内的场景影像单位的编码数据使用于预测参照的意思(步骤ST5),则将由MPEG-2解码部11生成了的解码图像输出到场景内预测编码部14。
如果该场景间预测指示标志表示将主式流内的场景影像单位的编码数据使用于预测参照的意思(步骤ST5),则将由MPEG-2解码部11生成了的解码图像输出到场景间预测编码部15。
场景间预测参照部位抽出部13如果从场景间预测判定部5输出了的从式流编码管理信息中包含的场景间预测指示标志表示将主式流内的场景影像单位的编码数据使用于预测参照的意思(步骤ST5),则从该从式流编码管理信息中包含的主式流ID表示的主式流中,抽出主场景ID表示的场景影像的编码数据(步骤ST6)。
场景间预测参照部位抽出部13如果抽出了主场景ID表示的场景影像的编码数据,则实施针对该编码数据的H.264解码处理,生成作为该场景影像的解码图像的主式流解码图像(步骤ST7)。
此时,关于从主式流抽出的场景影像的编码数据,既可以构成为场景开头的图片是IDR图片、并且能够随机访问的数据,也可以以场景开头的图片并非IDR图片的状态构成。
前者虽然具有抽出处理变得简易的优点,但由于频繁地插入IDR图片,所以存在主式流自身的压缩效率被限制这样的折衷的关系。
相逆地后者不会受到IDR插入的影响,所以能够维持主式流自身的压缩效率,但存在从能够对场景开头的图片正常地进行解码的时间上最接近的IDR图片位置抽出编码数据而解码等抽出处理变得复杂这样的折衷的关系。它们能够根据实际的装置的要求条件来构成。
此处,图7是示出场景内/场景间自适应编码部6中的场景内预测编码部14以及场景间预测编码部15的处理的说明图。
在图7中,记号I、P、B表示从主式流抽出的场景影像单位的编码数据中的各图片的编码类型,记号I’、P’、B’表示与记号I、P、B的图片的时刻位置对应的从式流上的各图片的编码类型。
在图7中,图示了关于I’、P’、B’图片,除了与主式流上的对应的I、P、B图片等价的场景内预测编码以外,还能够从与同一时刻位置对应的图片进行场景间预测参照的结构。
其并非施加本发明针对I’、P’、B’图片执行与I、P、B图片始终等价的预测编码处理的制约。
例如,也可以构成为在B’图片中,进行与P’图片相当的编码处理。
在该实施方式1中,为便于说明,关于从主式流上抽出的编码数据,设为从IDR图片开始(将图7的I图片设为“IDR图片”),使用P图片以及B图片的编码数据进行编码,关于从式流的I’、P’、B’图片,并用与I、P、B图片等价的预测编码处理和场景间预测编码处理。
场景间预测编码部15如果从开关12接收到解码图像,则利用该解码图像的时间相关、以及该解码图像和由场景间预测参照部位抽出部13生成了的主式流解码图像中的同一时刻位置的图像数据之间的相关,执行H.264的运动补偿处理或者使用了帧内部预测的压缩编码处理,输出作为其处理结果的场景间预测编码数据(步骤ST8)。
场景内预测编码部14如果从开关12接收到解码图像,则完全不使用主式流内的编码数据,对该解码图像实施H.264压缩编码处理,输出作为其编码处理结果的场景内预测编码数据(步骤ST9)。
此处,关于I’图片,不使用从影像内的时间相关,利用从I图片的场景间相关进行预测编码。
由此,得到在维持从式流上的随机访问性的同时提高编码效率的效果。
另外,场景间预测构成为能够局部地选择是否按照宏块或者成为运动补偿预测的单位的块等规定的处理单位使用,仅对预测效率高的图像上的局部部位利用场景间预测。
通过以依照在H.264的推荐AnnexH中规定的MVC(多视点编码)技术规范的方式构成该预测参照的制约和编码数据排列,能够构成为依照将由场景间预测参照部位抽出部13抽出的主式流的编码数据作为基本视点、将由场景内预测编码数据和场景间预测编码数据构成的从式流作为增强视点的MVC规格的编码数据。
通过这样构成,为了再生与从式编码数据对应的影像信号,针对图4的从影像解码部25,并非采用完全新的处理技术规范,而采用依照标准技术规范的既存的解码装置,能够实现期望的动作。
从式流复用部16对从场景内预测编码部14输出了的场景内预测编码数据、和从场景间预测编码部15输出了的场景间预测编码数据进行复用来生成从式流,将该从式流输出到复用部7(步骤ST10)。
复用部7对由场景内/场景间自适应编码部6变换了的从式流、和从场景间预测判定部5输出了的从式流编码管理信息进行复用,将其复用结果作为从式编码数据记录到数据记录部2(步骤ST11)。
此处,复用部7既可以物理上以1个文件或者流等形式记录从式流和从式流编码管理信息,也可以关于从式流编码管理信息,例如以XML形式的数据等管理,以构成与从式流的链接的方式记录。
从式流并非设为以其单体进行解码/影像再生的形式,而是构成为在进行解码/影像再生时,针对每个场景影像,自适应地抽出/追加主式流的编码数据。
主式流记录于数据记录部2中,所以主式流的编码数据的抽出/追加处理构成为在对与从式流对应的影像进行解码再生的情况下随时执行即可。
由此,关于在编码中使用主式流的场景影像,能够构成为不将实际上在解码中必要的主式流的编码数据逐一作为记录数据包括,所以能够不伴随质量劣化地削减应作为从式流记录的数据量,能够高效地使用数据记录部2的记录容量。
接下来,说明图4的图像解码装置的处理内容。
首先,开关21依照从外部提供的流类别识别信号,选择在数据记录部2中记录了的编码数据的解码处理过程。
即,开关21在从外部提供的流类别识别信号指示了“将该编码数据作为主式流来解码”的意思的情况下(图5的步骤ST21),读入在数据记录部2中记录了的主式流,将该主式流输出到H.264解码部22(步骤ST22)。
另一方面,在该流类别识别信号指示了“将该编码数据作为从式编码数据来解码”的意思的情况下(步骤ST21),读入在数据记录部2中记录了的从式编码数据,将该从式编码数据输出到复用分离部23(步骤ST23)。
H.264解码部22如果从开关21接收到主式流,则针对该主式流,实施依照H.264影像编码方式的规定的解码处理,从而生成再生影像(步骤ST24)。
复用分离部23如果从开关21接收到从式编码数据,则将该从式编码数据分离为从式流和从式流编码管理信息,将该从式流和从式流编码管理信息输出到解码流形成部24(步骤ST25)。
解码流形成部24如果从复用分离部23接收到从式流和从式流编码管理信息,则读出在数据记录部2中记录了的多个主式流中的、该从式流编码管理信息中包含的主式流ID表示的主式流。
另外,解码流形成部24从读出了的主式流中,抽出该从式流编码管理信息中包含的主场景ID表示的场景影像的编码数据。在图6的主式流中,抽出附加了斜线的部分的场景影像的编码数据。
解码流形成部24如果抽出了主场景ID表示的场景影像的编码数据,则确定由复用分离部23分离了的从式流内的场景影像中的、与主场景ID表示的场景影像对应的场景影像。在图6的从式流中,确定附加了斜线的部分的场景影像。
然后,解码流形成部24通过将从主式流抽出了的编码数据嵌入到从式流的对应的场景影像的位置,形成解码流(步骤ST26)。
此处,关于从主式流抽出的编码数据,如图6所示,一般,场景开头帧与从式流侧的该场景的开头在时间上不一致,所以以使它们匹配的方式,变换与抽出了的主式流的各图片(访问单元)对应的编码数据的时刻信息而追加到从式流。
通过该结构,解码流还能够形成为例如将主式流作为基本视点的流(在H.264推荐Annex H中规定的MVC(多视点编码)形式的流)。
从影像解码部25如果解码流形成部24形成了解码流,则针对该解码流实施规定的解码处理,从而生成与从式编码数据对应的再生影像(步骤ST27)。
如以上说明,根据该实施方式1,构成为设置有:场景相关测定参数计算部1,针对MPEG-2视频比特流内的每个场景影像,计算成为测定与其它场景影像的相关的标准的场景相关测定参数;H.264变换部4,将MPEG-2视频比特流变换为依照H.264影像编码方式的视频比特流;以及场景间预测判定部5,根据由场景相关测定参数计算部1计算出的场景相关测定参数A、B,从数据记录部2中记录了的主式流内的场景影像单位的编码数据中,在场景内/场景间自适应编码部6进行预测编码时,代替MPEG-2视频比特流内的场景影像单位的编码数据而检索在预测参照中使用的编码数据,场景内/场景间自适应编码部6在数据记录部2中记录了的主式流内的场景影像单位的编码数据中,将由场景间预测判定部5未检索在预测参照中使用的代替的编码数据的编码数据、和由场景间预测判定部5检索了的编码数据使用于预测参照,将该MPEG-2视频比特流变换为从式流,所以起到得到不会导致处理量的增加、影像质量的降低,而能够进行高效的压缩的图像编码装置的效果。
另外,根据该实施方式1,设置解码流形成部24,该解码流形成部24读出在数据记录部2中记录了的多个主式流中的、由复用分离部23分离了的从式流编码管理信息中包含的主式流ID表示的主式流,并且从该主式流中,抽出在该从式流编码管理信息中包含的主场景ID表示的场景影像的编码数据,将该编码数据嵌入到由复用分离部23分离了的从式流的对应的场景影像的位置,从而形成解码流,从影像解码部25通过对由解码流形成部24形成了的解码流,实施规定的解码处理,生成与从式编码数据对应的再生影像,所以起到得到能够对高效地压缩了的图像进行解码的图像解码装置的效果。
在该实施方式1中,示出了输入到图像解码化装置的视频比特流是MPEG-2视频比特流,将该MPEG-2视频比特流的编码方式通过使用了H.264的场景内/场景间自适应预测编码处理变换的例子,但输入到图像解码化装置的视频比特流不限于MPEG-2视频比特流,例如也可以是MPEG-4视觉(ISO/IEC14496-2)、H.264(ISO/IEC 14496-10)等任意的影像编码形式。
另外,变换编码中使用的编码方式也不限于H.264。
另外,能够构成为根据输入到图像解码化装置的视频比特流的影像编码形式,定义由场景相关测定参数计算部1计算的场景相关测定参数。
另外,作为与从式编码数据对应的影像信号的编码数据格式,以在H.264的推荐Annex H中规定的MVC为例子,但其也不限于MVC形式,能够构成为通过依照该实施方式1中的图像编码装置、图像解码装置的结构,应对其它同样的标准编码方式。
实施方式2.
在上述实施方式1中,示出了作为主式流再压缩的“MPEG-2视频比特流”、或者、作为从式流再压缩的“MPEG-2视频比特流”被输入到场景相关测定参数计算部1的例子,但也可以是作为主式流再压缩的“MPEG-2视频比特流”和作为从式流再压缩的“MPEG-2视频比特流”包含于单一的视频比特流中,单一的视频比特流输入到场景相关测定参数计算部1的例子。
图8是示出本发明的实施方式2的图像编码装置的结构图,在图中,与图1相同的符号表示同一或者相当部分,所以省略说明。
开关31实施如下处理:在从外部提供的再压缩方法识别信号指示了“输入到场景相关测定参数计算部1的MPEG-2视频比特流的前半部分是作为主式流再压缩的视频比特流,后半部分是作为从式流再压缩的视频比特流”的意思的情况下,分割从场景相关测定参数计算部1输出了的MPEG-2视频比特流,将该MPEG-2视频比特流的前半部分提供给H.264变换部4,将该MPEG-2视频比特流的后半部分提供给场景内/场景间自适应编码部6。另外,开关31构成了编码数据分割单元。
接下来,说明动作。
在上述实施方式1中,示出了作为主式流再压缩的“MPEG-2视频比特流”、或者、作为从式流再压缩的“MPEG-2视频比特流”输入到场景相关测定参数计算部1的例子,但在该实施方式2中,说明如图9所示,作为主式流再压缩的“MPEG-2视频比特流”和作为从式流再压缩的“MPEG-2视频比特流”包含于单一的视频比特流中,单一的视频比特流输入到场景相关测定参数计算部1的例子。
在单一的视频比特流输入到场景相关测定参数计算部1的情况下,相比于图1的图像解码化装置,仅开关31的处理内容不同。
在开关31中,从外部输入指示“输入到场景相关测定参数计算部1的MPEG-2视频比特流的前半部分是作为主式流再压缩的视频比特流,后半部分是作为从式流再压缩的视频比特流”意思的再压缩方法识别信号。
开关31如果在从外部提供了上述再压缩方法识别信号之后,从场景相关测定参数计算部1输出了MPEG-2视频比特流,则将该MPEG-2视频比特流分割为前半部分和后半部分,将该MPEG-2视频比特流的前半部分提供给H.264变换部4,将该MPEG-2视频比特流的后半部分提供给场景内/场景间自适应编码部6。
开关31以外的图像编码装置的处理内容与上述实施方式1相同,所以省略详细的说明,通过将该MPEG-2视频比特流的前半部分提供给H.264变换部4,该MPEG-2视频比特流的前半部分被变换为依照H.264影像编码方式的视频比特流,将该视频比特流作为主式流记录到数据记录部2中。
另一方面,通过将该MPEG-2视频比特流的后半部分提供给场景内/场景间自适应编码部6,该MPEG-2视频比特流的后半部分被变换为从式流,对该从式流和从场景间预测判定部5输出了的从式流编码管理信息进行了复用的从式编码数据被记录到数据记录部2中。
图像解码装置的处理内容与上述实施方式1相同,从由数据记录部2记录了的主式流中,抽出从式流编码管理信息表示的场景影像的编码数据(参照图10),将该场景影像的编码数据嵌入到从式流的对应场景影像的位置,从而形成解码流,来进行图像的解码处理。
例如,在电视节目等中,在1个节目内包括相关高的场景影像情况较多,如上所述,在主式流和从式流包含于单一的视频比特流中的情况下,能够高效地检索来利用相关高的场景影像。
在该实施方式2中,示出了输入到场景相关测定参数计算部1的MPEG-2视频比特流的前半部分被分成作为主式流再压缩的“MPEG-2视频比特流”、后半部分被分成作为从式流再压缩的“MPEG-2视频比特流”的例子,但也可以如图11所示,将交替反复主式流和从式流的单一的MPEG-2视频比特流输入到场景相关测定参数计算部1。
一般,根据时间上接近的场景影像进行预测相比于根据时间上远离的场景影像进行预测,编码效率更佳,但在如图11所示,交替反复主式流和从式流的情况下,主式流和从式流的时间上的距离接近,所以能够生成编码效率高的流。
此处,示出了交替反复主式流和从式流的例子,但也可以如图12所示,主式流的时间上的长度和从式流的时间上的长度不同。
在图12的例子中,MPEG-2视频比特流内的主式流的个数是2个,MPEG-2视频比特流内的从式流的个数是6个,所以从式流的时间上的长度成为主式流的时间上的长度的3倍。
这样,通过使从式流的时间上的长度比主式流的时间上的长度更长,进行使用了场景间相关的编码的场景影像增加,所以有助于改善编码效率。
此时,也可以针对主场景的编码管理信息,复用主式流和从式流的长度信息。
但是,在MPEG-2视频比特流的方式是上述那样的方式时,有在编码对象的序列内,包括场景变换的可能性。
在场景变换前后,在场景影像之间无相关的可能性高,所以如果如图13所示,场景刚刚变换之后的场景影像是主式流,则能够防止场景变换所致的编码效率降低。
因此,也可以将场景刚刚变换之后的场景影像一定是主式流的MPEG-2视频比特流输入到场景相关测定参数计算部1。
在该实施方式2中,示出了主式流和从式流包含于单一的MPEG-2视频比特流中的例子,但也可以如图14所示,按照特定的单位(例如,GOP),将表示单一的MPEG-2视频比特流中包含的各个流是主式流还是从式流的flag(标志)作为主场景的编码管理信息,向图像解码装置发信号(signaling)。
例如,既可以通过构成标志通知单元的复用部7将该编码管理信息记录到数据记录部2,向图像解码装置发信号,也可以通过将该编码管理信息发送到图像解码装置,向图像解码装置发信号。
由此,能够根据影像的特性,自由地决定设为主式流还是设为从式流,能够改善编码效率。
另外,如图15所示,有如下可能性:在序列的途中,插入了性质与编码中的场景影像明显地不同的场景影像(例如,相应于电视节目中的CM等)。
在这样的情况下,考虑事先检测性质与编码中的场景影像明显地不同的场景影像,按照在其场景影像内封闭的形式检测场景相关测定参数来进行编码。
由此,能够减少检测场景相关测定参数的场景影像,来降低处理量,所以也可以将性质与编码中的场景影像明显地不同的场景影像被跳过了的(未包括该场景影像的流的)MPEG-2视频比特流输入到场景相关测定参数计算部1。
在该实施方式2中,示出了将MPEG-2视频比特流变换为依照H.264影像编码方式的视频比特流,将该视频比特流作为主式流记录到数据记录部2的例子,但影像编码方式不限于H.264影像编码方式,例如,也可以使用MPEG-4等其它影像编码方式。另外,将输入比特流设为MPEG-2视频比特流,但其不限于MPEG-2视频比特流,例如,也可以将通过MPEG-4、H.264等其它影像编码方式编码了的视频比特流用作输入。
在上述实施方式1、2中,虽然未特别提到,但有如下情况:图像编码装置以及图像解码装置具备编辑由数据记录部2记录了的主式流或者从式编码数据的编辑功能(例如,相应于具备键盘、鼠标等人机界面,依照通过人机界面受理了的操作内容编辑主式流或者从式编码数据的CPU等处理部等)。
但是,通过用户操作编辑功能,有时发生主式流被删除的状况。
因此,图像编码装置以及图像解码装置的编辑功能也可以在进行了删除主式流的操作的情况下,将表示“进行删除主式流的操作”意思的警告消息显示于显示器中。
另外,也可以通过关于根据主式流的预测进行再编码等处理,防止由于主式流被删除而不能解码。
实施方式3.
在上述实施方式1、2中,示出了主式流以及从式编码数据记录到数据记录部2的例子,但关于主式流,也可以不记录到数据记录部2,而记录到图像编码装置以及图像解码装置的外部装置中。
图16是示出记录器(record)(图像编码装置、图像解码装置)连接到网络的系统例的结构图。
在图16的例子中,也可以作为记录器的图像编码装置的H.264变换部4不将主式流记录到数据记录部2,而经由网络接口,将该主式流传送到作为外部装置的服务器(例如,公共服务器、服务业者提供的专用服务器、个人所有的服务器),该服务器记录主式流。
例如,关于在服务器中记录了的主式流,如果设定为无法通过用户的操作删除的结构,则能够防止由于错误地删除主式流而无法对流进行解码。
另外,能够构成服务器的管理者限于特定的用户公开主式流的系统,通过这样的结构,能够实现安全的影像管理。
实施方式4.
在上述实施方式1中,示出了场景间预测编码部15如果从开关12接收到解码图像,则利用该解码图像的时间相关、以及该解码图像和由场景间预测参照部位抽出部13生成了的主式流解码图像中的同一时刻位置的图像数据之间的相关,执行H.264的运动补偿处理或者使用了帧内部预测的压缩编码处理,输出作为其处理结果的场景间预测编码数据的例子(在I、P、B图片的各个中,能够根据与同一时刻位置对应的图片进行场景间预测),但也可以如图17所示,仅限于I图片能够进行场景间预测。或者,也可以如图18所示,仅限于I、P图片能够进行场景间预测。
通过限制场景间预测,在相关高的场景影像的情况下,虽然编码效率降低,但能够削减变换时的处理量。
另外,也可以场景间预测编码部15根据场景相关度切换仅限于I图片进行场景间预测的处理(参照图17)、和仅限于I、P图片进行场景间预测的处理(参照图18)。
例如,被构成为在场景途中有场景变换的情况等相关高的场景影像仅为开头的情况下,仅对开头的I图片实施场景间预测,并且在是大致相同的场景的情况下,对I、P、B图片的全部实施场景间预测,从而起到不会降低编码效率而能够削减处理量的效果。
图19是示出本发明的实施方式4的图像编码装置的处理内容的流程图。
以下,说明图19所示的处理内容。
场景相关测定参数计算部1如果输入了通过MPEG-2影像编码方式压缩编码了的MPEG-2视频比特流,则与上述实施方式1同样地,针对该MPEG-2视频比特流的每个场景影像,计算成为测定与其它场景影像的相关的标准的场景相关测定参数(步骤ST31)。
如果从外部提供的再压缩方法识别信号指示了“将MPEG-2视频比特流作为主式流再压缩”的意思(步骤ST32),则与上述实施方式1同样地,开关3将从场景相关测定参数计算部1输出了的MPEG-2视频比特流提供给H.264变换部4。
另一方面,如果该再压缩方法识别信号指示了“将MPEG-2视频比特流作为从式流再压缩”的意思(步骤ST32),则与上述实施方式1同样地,将从场景相关测定参数计算部1输出了的MPEG-2视频比特流提供给场景内/场景间自适应编码部6。
H.264变换部4如果被从开关3提供了MPEG-2视频比特流,则与上述实施方式1同样地,将该MPEG-2视频比特流通过规定的处理过程变换为依照H.264影像编码方式的视频比特流,将该视频比特流作为主式流,记录到数据记录部2(步骤ST33)。
如果场景相关测定参数计算部1计算了场景相关测定参数A或者场景相关测定参数B,则与上述实施方式1同样地,场景间预测判定部5根据该场景相关测定参数A、B,从数据记录部2中记录了的主式流内的场景影像单位的编码数据中,在场景内/场景间自适应编码部6进行预测编码时,代替MPEG-2视频比特流内的场景影像单位的编码数据而检索在预测参照中使用的编码数据。
以下,具体说明由场景间预测判定部5实施的编码数据的检索处理。
首先,场景间预测判定部5与上述实施方式1同样地,使用由场景相关测定参数计算部1计算了的场景相关测定参数A、B,测定MPEG-2视频比特流内的各个场景影像、和在数据记录部2中记录了的主式流内的各个场景影像的相关值。
接下来,场景间预测判定部5针对MPEG-2视频比特流内的每个场景影像,比较针对该场景影像的主式流内的各个场景影像的相关值,探索相关值最大的主式流内的场景影像。
场景间预测判定部5如果探索出相关值最大的主式流内的场景影像,则与上述实施方式1同样地,如果其相关值是预先设定了的规定值以上,则将该场景影像的编码数据决定为在预测参照中使用的场景影像。
另一方面,如果其相关值小于预先设定了的规定值,则不将该主式流内的场景影像的编码数据使用于预测参照。
场景间预测判定部5如果发现了场景内/场景间自适应编码部6在预测参照中使用的编码数据(存在与MPEG-2视频比特流内的场景影像相关高的主式流内的场景影像的情况),则与上述实施方式1同样地,将表示“在该处理对象的场景中,利用主式流内的相关高的场景影像的编码数据来进行编码”的意思的从式流编码管理信息输出到场景内/场景间自适应编码部6以及复用部7。
另一方面,如果未发现场景内/场景间自适应编码部6在预测参照中使用的编码数据(不存在与MPEG-2视频比特流内的场景影像相关高的主式流内的场景影像的情况),则与上述实施方式1同样地,将表示“在该处理对象的场景中,不使用主式流内的编码数据,进行在场景内封闭的编码”的意思的从式流编码管理信息输出到场景内/场景间自适应编码部6以及复用部7。
场景内/场景间自适应编码部6在数据记录部2中记录了的主式流内的场景影像单位的编码数据中,将由场景间预测判定部5未检索出在预测参照中使用的代替的编码数据的编码数据、和由场景间预测判定部5检索出的编码数据使用于预测参照,将该MPEG-2视频比特流变换为从式流。
以下,具体说明由场景内/场景间自适应编码部6实施的流的变换处理。
首先,如果从开关3提供了MPEG-2视频比特流,则场景内/场景间自适应编码部6的MPEG-2解码部11与上述实施方式1同样地,实施针对该MPEG-2视频比特流内的各个场景影像的编码数据的解码处理,按照场景影像单位生成解码图像(步骤ST34)。
如果从场景间预测判定部5输出了的从式流编码管理信息中包含的场景间预测指示标志表示不将主式流内的场景影像单位的编码数据使用于预测参照的意思,则与上述实施方式1同样地,开关12将由MPEG-2解码部11生成了的解码图像输出到场景内预测编码部14。
如果该场景间预测指示标志表示将主式流内的场景影像单位的编码数据使用于预测参照的意思,则与上述实施方式1同样地,将由MPEG-2解码部11生成了的解码图像输出到场景间预测编码部15。
如果从场景间预测判定部5输出了的从式流编码管理信息中包含的场景间预测指示标志表示将主式流内的场景影像单位的编码数据使用于预测参照的意思,则场景间预测参照部位抽出部13与上述实施方式1同样地,从该从式流编码管理信息中包含的主式流ID表示的主式流中,抽出主场景ID表示的场景影像的编码数据。
场景间预测参照部位抽出部13如果抽出了主场景ID表示的场景影像的编码数据,则与上述实施方式1同样地,实施针对该编码数据的H.264解码处理,生成作为该场景影像的解码图像的主式流解码图像。
场景间预测编码部15如果从开关12接收到解码图像,则例如在场景相关度低于作为预先设定了的阈值的第一相关度的情况(例如在场景途中有场景变换的情况)下,仅限于I图片,利用场景相关(步骤ST35),如图17所示,仅对I图片实施场景间预测,进行再编码(步骤ST36)。
另外,场景间预测编码部15在例如虽然场景相关度高于第一相关度但低于作为预先设定了的阈值的第二相关度的情况下,仅限于I、P图片,利用场景相关(步骤ST35、ST37),如图18所示,仅对I、P图片实施场景间预测,进行再编码(步骤ST38)。
另外,场景间预测编码部15在例如场景相关度高于第二相关度的情况下,针对I、P、B图片的全部利用场景相关(步骤ST37),针对I、P、B图片的全部实施场景间预测,进行再编码(步骤ST39)。
另外,场景间预测编码部15如果实施场景间预测而进行了再编码,则将作为其再编码结果的场景间预测编码数据输出到从式流复用部16。
场景内预测编码部14如果从开关12接收到解码图像,则与上述实施方式1同样地,完全不使用主式流内的编码数据,对该解码图像实施H.264压缩编码处理,输出作为其编码处理结果的场景内预测编码数据。
从式流复用部16与上述实施方式1同样地,对从场景内预测编码部14输出了的场景内预测编码数据、和从场景间预测编码部15输出了的场景间预测编码数据进行复用来生成从式流,将该从式流输出到复用部7(步骤ST40)。
复用部7与上述实施方式1同样地,对由场景内/场景间自适应编码部6变换了的从式流、和从场景间预测判定部5输出了的从式流编码管理信息进行复用,将其复用结果作为从式编码数据记录到数据记录部2(步骤ST41)。
如以上说明,根据该实施方式4,场景间预测编码部15构成为根据场景相关度切换仅限于I图片进行场景间预测的处理、和仅限于I、P图片进行场景间预测的处理,所以关于不进行场景间预测的图片,起到通过再利用再编码前的流信息(模式信息、运动信息等)能够简化处理的效果。通过进行这样的处理,编码效率稍微降低,但能够削减伴随再编码的处理量。特别,在嵌入设备等使用了低功耗、低CPU的系统中是有用的。
另外,本申请发明能够在该发明的范围内,实现各实施方式的自由的组合、或者各实施方式的任意的构成要素的变形、或者各实施方式中的任意的构成要素的省略。
产业上的可利用性
本发明的图像编码装置具备影像编码数据变换单元,该影像编码数据变换单元针对依照第一影像编码方式的影像编码数据内的每个场景影像数据,选择性地应用使用其它场景影像数据的预测参照,变换为依照第二影像编码方式的影像编码数据,能够不会导致处理量的增加、影像质量的降低地进行高效的压缩,所以适合于用作HDD内置型数字录像设备、云型系统等图像编码装置。

Claims (7)

1.一种图像编码装置,具备影像编码数据变换单元,该影像编码数据变换单元针对依照第一影像编码方式的影像编码数据内的每个场景影像数据,选择性地应用使用其它场景影像数据的预测参照,变换为依照第二影像编码方式的影像编码数据,其特征在于,
所述影像编码数据变换单元在变换第一影像编码数据内的场景影像单位的编码数据时,探索应在预测参照中使用的其它场景影像单位的编码数据,选择是否将探索出的场景影像单位的编码数据使用于预测参照,将所述第一场景影像单位的编码数据变换为依照第二影像编码方式的影像编码数据,并且生成表示是否将探索出的场景影像单位的编码数据使用于预测参照的元数据。
2.根据权利要求1所述的图像编码装置,其特征在于,
所述影像编码数据变换单元具备场景相关测定参数计算单元,该场景相关测定参数计算单元针对第一影像编码数据内的每个场景影像,计算成为测定与其它场景影像的相关的标准的场景相关测定参数,
根据从该场景相关测定参数计算单元输出的参数值,在变换第一影像编码数据内的场景影像单位的编码数据时探索应在预测参照中使用的其它场景影像单位的编码数据。
3.根据权利要求1所述的图像编码装置,其特征在于,
具备数据记录单元,该数据记录单元对由所述影像编码数据变换单元变换了的依照第二影像编码方式的影像编码数据,复用记录所述元数据。
4.根据权利要求1所述的图像编码装置,其特征在于,
所述影像编码数据变换单元将成为探索源的影像编码数据、和将探索出的场景影像单位的编码数据使用于预测参照而变换了的依照第二影像编码方式的影像编码数据记录到用网络连接的不同的装置。
5.一种图像解码装置,实施针对影像编码数据的解码处理来生成再生影像,其特征在于,具备:
判定单元,针对影像编码数据的每个场景影像单位的编码数据,根据另行输入的元数据,判定是否预测参照其它场景影像单位的编码数据而对该场景影像单位的编码数据进行了编码,并且在预测参照其它场景影像单位的编码数据而进行了编码的情况下,确定在预测参照中使用的其它场景影像单位的编码数据的位置;以及
解码单元,在所述判定单元的结果是预测参照其它场景影像单位的编码数据而进行了编码的情况下,从由所述判定单元确定的位置,取得预测参照目的地的编码数据,与解码对象的场景影像单位的编码数据一起进行解码处理。
6.一种图像编码方法,影像编码数据变换单元针对依照第一影像编码方式的影像编码数据内的每个场景影像数据,选择性地应用使用其它场景影像数据的预测参照,变换为依照第二影像编码方式的影像编码数据,其特征在于,
在由所述影像编码数据变换单元变换第一影像编码数据内的场景影像单位的编码数据时,探索应在预测参照中使用的其它场景影像单位的编码数据,接下来选择是否将探索出的场景影像单位的编码数据使用于预测参照,接下来将所述第一场景影像单位的编码数据变换为依照第二影像编码方式的影像编码数据,并且生成表示是否将探索出的场景影像单位的编码数据使用于预测参照的元数据。
7.一种图像解码方法,实施针对影像编码数据的解码处理来生成再生影像,其特征在于,具备:
判定处理步骤,判定单元针对影像编码数据的每个场景影像单位的编码数据,根据另行输入的元数据,判定是否预测参照其它场景影像单位的编码数据而对该场景影像单位的编码数据进行了编码,并且在预测参照其它场景影像单位的编码数据而进行了编码的情况下,确定在预测参照中使用的其它场景影像单位的编码数据的位置;以及
解码处理步骤,解码单元在所述判定处理步骤的结果是预测参照其它场景影像单位的编码数据而进行了编码的情况下,从通过所述判定处理步骤确定的位置,取得预测参照目的地的编码数据,与解码对象的场景影像单位的编码数据一起进行解码处理。
CN201380011367.7A 2012-02-29 2013-02-28 图像编码装置、图像解码装置、图像编码方法以及图像解码方法 Active CN104137544B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2012-043456 2012-02-29
JP2012043456 2012-02-29
JP2012-221775 2012-10-04
JP2012221775 2012-10-04
PCT/JP2013/055451 WO2013129585A1 (ja) 2012-02-29 2013-02-28 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法

Publications (2)

Publication Number Publication Date
CN104137544A true CN104137544A (zh) 2014-11-05
CN104137544B CN104137544B (zh) 2017-10-20

Family

ID=49082776

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380011367.7A Active CN104137544B (zh) 2012-02-29 2013-02-28 图像编码装置、图像解码装置、图像编码方法以及图像解码方法

Country Status (5)

Country Link
US (1) US9560365B2 (zh)
JP (2) JPWO2013129585A1 (zh)
KR (1) KR20140136474A (zh)
CN (1) CN104137544B (zh)
WO (1) WO2013129585A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106657961B (zh) * 2015-10-30 2020-01-10 微软技术许可有限责任公司 立体视频的混合数字-模拟编码
KR20210029615A (ko) * 2019-09-06 2021-03-16 에스케이하이닉스 주식회사 반도체장치

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1312638A (zh) * 1997-07-10 2001-09-12 松下电器产业株式会社 图象传送用数据结构、图象编码方法和解码方法
CN1401189A (zh) * 2000-11-23 2003-03-05 皇家菲利浦电子有限公司 视频编码方法和相应的编码器
US20030118239A1 (en) * 2001-12-26 2003-06-26 Suh Ki-Bum Apparatus for prediction coding or decoding image signal and method therefor
JP2005303773A (ja) * 2004-04-14 2005-10-27 Nippon Telegr & Teleph Corp <Ntt> 映像符号化方法、映像符号化装置、映像符号化プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体、並びに、映像復号方法、映像復号装置、映像復号プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体
US20080101473A1 (en) * 2006-10-26 2008-05-01 Matsushita Electric Industrial Co., Ltd. Transcoding apparatus and transcoding method
US20090103898A1 (en) * 2006-09-12 2009-04-23 Yoshihiro Morioka Content shooting apparatus
CN101521823A (zh) * 2009-03-27 2009-09-02 北京航空航天大学 空间相关的全景数据压缩方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3426668B2 (ja) * 1993-11-19 2003-07-14 三洋電機株式会社 動画像符号化方法
JPH0993592A (ja) 1995-07-13 1997-04-04 Matsushita Electric Ind Co Ltd 画像符号化装置
WO2001015459A1 (en) 1999-08-24 2001-03-01 Fujitsu Limited Time-varying image processor, its method, and recorded medium
JP3696104B2 (ja) * 2001-02-26 2005-09-14 日本電信電話株式会社 ステレオ動画像符号化方法および装置と、ステレオ動画像符号化処理用プログラムおよびそのプログラムの記録媒体
JP2005184062A (ja) * 2003-12-16 2005-07-07 Fuji Photo Film Co Ltd 画像データ変換装置および画像データ変換プログラム
WO2006028156A1 (ja) * 2004-09-10 2006-03-16 Pioneer Corporation 画像処理装置、画像処理方法、および画像処理プログラム
JP2006262311A (ja) 2005-03-18 2006-09-28 Toshiba Corp 情報記録装置及び情報記録方法
JP4866417B2 (ja) * 2006-03-09 2012-02-01 パイオニア株式会社 画像処理装置、画像処理方法、および画像処理プログラム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1312638A (zh) * 1997-07-10 2001-09-12 松下电器产业株式会社 图象传送用数据结构、图象编码方法和解码方法
CN1401189A (zh) * 2000-11-23 2003-03-05 皇家菲利浦电子有限公司 视频编码方法和相应的编码器
US20030118239A1 (en) * 2001-12-26 2003-06-26 Suh Ki-Bum Apparatus for prediction coding or decoding image signal and method therefor
JP2005303773A (ja) * 2004-04-14 2005-10-27 Nippon Telegr & Teleph Corp <Ntt> 映像符号化方法、映像符号化装置、映像符号化プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体、並びに、映像復号方法、映像復号装置、映像復号プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体
US20090103898A1 (en) * 2006-09-12 2009-04-23 Yoshihiro Morioka Content shooting apparatus
US20080101473A1 (en) * 2006-10-26 2008-05-01 Matsushita Electric Industrial Co., Ltd. Transcoding apparatus and transcoding method
CN101521823A (zh) * 2009-03-27 2009-09-02 北京航空航天大学 空间相关的全景数据压缩方法

Also Published As

Publication number Publication date
JP6320450B2 (ja) 2018-05-09
CN104137544B (zh) 2017-10-20
JPWO2013129585A1 (ja) 2015-07-30
JP2016165147A (ja) 2016-09-08
WO2013129585A1 (ja) 2013-09-06
US9560365B2 (en) 2017-01-31
US20140376613A1 (en) 2014-12-25
KR20140136474A (ko) 2014-11-28

Similar Documents

Publication Publication Date Title
US11889058B2 (en) Picture encoding/decoding method and related apparatus
US9743080B2 (en) Encoding or decoding method and apparatus
KR101571573B1 (ko) 부가적인 정보 역량을 이용한 멀티미디어 코딩 및 디코딩
JP2021524176A (ja) ビデオ符号化のための方法、機器及びコンピュータ・プログラム
JP5905890B2 (ja) 事例ベースのデータ・プルーニングを用いたビデオ復号
CN110740329A (zh) 视频编码解码方法和装置、计算机设备和存储介质
CN102939752A (zh) 通过基于树结构的数据单元执行环路滤波来对视频进行编码的方法和设备,以及通过基于树结构的数据单元执行环路滤波来对视频进行解码的方法和设备
JP2010516158A (ja) 多視点映像の符号化、復号化方法及び装置
CN105684441A (zh) 视频和图像编码中的基于散列的块匹配
CN105556971A (zh) 针对帧内块复制预测中的块翻动和跳跃模式的编码器侧判定
CN103636222A (zh) 用于对多视点视频进行统一可分级视频编码的方法和设备以及对多视点视频进行统一可分级视频解码的方法和设备
JP4734047B2 (ja) ビデオドキュメントを圧縮するためのプロセス及び装置
US20240089494A1 (en) Video encoding and decoding method and apparatus, storage medium, electronic device, and computer program product
CN104137544A (zh) 图像编码装置、图像解码装置、图像编码方法以及图像解码方法
US20130223525A1 (en) Pixel patch collection for prediction in video coding system
Adami et al. Embedded indexing in scalable video coding
KR102072576B1 (ko) 데이터 인코딩 및 디코딩 장치와 방법
CN104093025A (zh) 编解码方法和装置
JP2015002512A (ja) 画像符号化装置及び画像符号化方法
JP2024508865A (ja) 点群符号化・復号方法、装置、及び電子機器
JP5610981B2 (ja) 画像暗号化装置及び画像復号装置及び画像暗号化方法及び画像復号方法及び画像暗号化プログラム及び画像復号プログラム
CN107005704A (zh) 处理编码视频数据的方法和装置及生成编码视频数据的方法和装置
AU2015202063A1 (en) Image signal decoding device, image signal decoding method, image signal encoding device, image signal encoding method, and program

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant