CN105519117A - 动态图像编码装置、动态图像转码装置、动态图像编码方法、动态图像转码方法以及动态图像流传输系统 - Google Patents

动态图像编码装置、动态图像转码装置、动态图像编码方法、动态图像转码方法以及动态图像流传输系统 Download PDF

Info

Publication number
CN105519117A
CN105519117A CN201480048963.7A CN201480048963A CN105519117A CN 105519117 A CN105519117 A CN 105519117A CN 201480048963 A CN201480048963 A CN 201480048963A CN 105519117 A CN105519117 A CN 105519117A
Authority
CN
China
Prior art keywords
coding
information
bit stream
picture
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201480048963.7A
Other languages
English (en)
Inventor
服部亮史
守屋芳美
峯泽彰
宫泽一之
关口俊一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of CN105519117A publication Critical patent/CN105519117A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/114Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/57Motion estimation characterised by a search window with variable size or shape
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/58Motion compensation with long-term prediction, i.e. the reference frame for a current frame not being the temporally closest one
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/4728End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for selecting a Region Of Interest [ROI], e.g. for requesting a higher resolution version of a selected region
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/55Motion estimation with spatial constraints, e.g. at image or region borders

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

可变长度编码部(23)将包含表示运动矢量的可搜索最大范围的运动矢量限制信息、表示属于GOP的图片的个数即GOP大小的最大值的GOP大小限制信息和表示在对属于GOP的各图片进行解码时参照的图片的参照构造指定信息的提示信息复用到总区域比特流中。由此,能够以低运算量生成适于生成高效的部分区域的比特流的总区域的比特流,而不会导致总区域的比特流的压缩效率的降低。

Description

动态图像编码装置、动态图像转码装置、动态图像编码方法、动态图像转码方法以及动态图像流传输系统
技术领域
本发明涉及对图像进行压缩编码来生成编码数据的图像编码装置以及图像编码方法、根据由图像编码装置生成的编码数据来生成性质不同的其它编码数据的动态图像转码装置以及动态图像转码方法和收发由图像编码装置生成的编码数据的动态图像流传输系统。
背景技术
目前,伴随着摄像设备、显示设备、压缩编码技术、传输技术等的进步,正在研究具有超过HD(HighDefinition:高清晰度)的清晰度(例如,4K、8K等的清晰度)的UHD(Ultra-HighDefinition:超高清晰度)的超高清晰度影像的发布服务。
在超高清晰度影像中,因为影像的信息量巨大,所以,一般在影像信号的传输或积蓄时采用影像编码技术进行压缩。
以下,作为前提是,在传输超高清晰度影像时,以利用规定的影像编码技术压缩的比特流形式进行处理。
在收看超高清晰度影像时假定存在以下这样的情况:由于与影像的像素数相比显示设备的外观大小过小,从而即使影像中的细微构造(例如文字信息、人物的面部等)作为影像中的信息而存在,也难以进行收看。
为了解决这样的问题,可考虑以下的系统:在主显示设备(例如,在客厅中设置的大画面的TV等)上显示所传输来的超高清晰度影像的总区域,并且从超高清晰度影像的总区域中提取由用户指定的部分区域的影像,向副显示设备(例如,用户手中的平板终端等)传输该部分区域的影像进行收看。
在上述系统中,虽然从主显示设备向副显示设备传输部分区域影像,但在传输该部分区域影像时,期望以仅包含与该部分区域影像相关的信息的比特流的形式进行传输。
这是因为,当不把超高清晰度影像的总区域比特流压缩为部分区域比特流(仅包含与部分区域影像相关的信息的比特流)而直接传输该超高清晰度影像的总区域比特流时,传输信息量非常多,并且,副显示设备需要对超高清晰度影像的总区域进行解码,因此,处理负荷变大。
由此,期望的是,上述系统中的主显示设备具有根据超高清晰度影像的总区域比特流生成任意的部分区域比特流的转码功能。
作为根据总区域比特流生成任意的部分区域比特流的方法,例如可考虑以下的方法。
[方法1]
在主显示设备对超高清晰度影像的总区域进行解码之后,从总区域的解码图像中取出由用户指定的部分区域的解码图像,再次利用规定的影像编码技术对该部分区域的解码图像进行编码。
然后,主显示设备生成包含作为其编码结果的部分区域的编码数据和编码参数的部分区域比特流。
但是,在方法1的情况下,因为需要对部分区域的解码图像再次进行编码,所以具有主显示设备的处理负荷变大并且画质伴随着重新编码而劣化的问题。
[方法2]
方法2公开于以下的专利文献1中,其方式是在生成总区域比特流时,实施片(tile)分割,来切断图像的区域间的参照。
即,将总区域分割成被称为片的矩形区域的图像,对各矩形区域进行编码,由此,生成总区域比特流,但关于在对各矩形区域进行编码时参照的局部解码图像或编码参数,限制成不进行跨越片边界的参照(还包含帧间参照、熵编码)。
通过设定这样的限制,能够完全独立地对各个片进行解码,所以,只要从总区域比特流中提取包含由用户指定的部分区域的片的编码数据以及编码参数,就能够生成包含部分区域的编码数据以及编码参数的部分区域比特流。
但是,在方法2中,因为编码数据以及编码参数的提取以片为单位,所以,在由用户指定的部分区域跨越多个片的情况或者片大小大于部分区域等的情况下,生成包含大量显示不需要的区域的部分区域比特流,效率不高。
为了提高部分区域比特流的生成效率而减小片大小时,切断参照的位置变多,所以,具有总区域比特流的压缩效率降低的问题。
现有技术文献
专利文献
专利文献1:国际公开2012/060459号
发明内容
发明要解决的课题
因为现有的动态图像编码装置如以上这样构成,所以,如果在将总区域分割成矩形区域(片)的图像并限制了跨越片边界的参照的状态下对各矩形区域进行编码,则能够抑制处理负荷的增大和画质的劣化。但是,在由用户指定的部分区域跨越多个片的情况下,存在生成包含大量显示不需要的区域的部分区域比特流从而变得低效的课题。另一方面,为了提高部分区域比特流的生成效率而缩小片大小时,切断参照的位置变多,所以,具有总区域比特流的压缩效率降低的课题。
本发明是为了解决上述这样的课题而完成的,其目的是获得以下这样的动态图像编码装置以及动态图像编码方法:能够以低运算量生成适于生成高效的部分区域比特流的总区域比特流,而不会导致总区域比特流的压缩效率的降低。
另外,本发明的目的是,获得能够以低运算量生成高效的部分区域比特流的动态图像转码装置以及动态图像转码方法。
另外,本发明的目的是,获得收发由图像编码装置生成的编码数据的动态图像流传输系统。
解决问题的手段
本发明的动态图像编码装置具备:预测图像生成单元,其决定针对属于GOP(GroupOfPictures:图像组)的图片内的编码对象块的编码参数,使用该编码参数生成预测图像;以及比特流生成单元,其对编码对象块与由预测图像生成单元生成的预测图像之间的差分图像进行压缩编码,复用作为其编码结果的编码数据和编码参数而生成比特流,比特流生成单元将提示信息复用到比特流中,该提示信息包含:运动矢量限制信息,其表示运动矢量的可搜索范围;GOP大小限制信息,其表示属于GOP的图片的个数即GOP大小;以及参照构造指定信息,其表示在对属于GOP的各图片进行解码时参照的图片。
发明效果
根据本发明,因为比特流生成单元构成为,将提示信息复用到比特流中,该提示信息包含:运动矢量限制信息,其表示运动矢量的可搜索范围;GOP大小限制信息,其表示属于GOP的图片的个数即GOP大小;以及参照构造指定信息,其表示在对属于GOP的各图片进行解码时参照的图片,所以具有以下这样的效果:能够以低运算量生成适于生成高效的部分区域的比特流的总区域的比特流,而不会导致总区域的比特流的压缩效率的降低。
附图说明
图1是示出应用本发明的实施方式1的动态图像编码装置以及动态图像转码装置的系统的结构图。
图2是示出本发明的实施方式1的动态图像编码装置1的结构图。
图3是示出本发明的实施方式1的动态图像转码装置2的总区域流解码部3的结构图。
图4是示出本发明的实施方式1的动态图像转码装置2的部分区域转码部4的结构图。
图5是示出本发明的实施方式1的动态图像编码装置1的处理内容(动态图像编码方法)的流程图。
图6是示出本发明的实施方式1的动态图像转码装置2的总区域流解码部3的处理内容的流程图。
图7是示出本发明的实施方式1的动态图像转码装置2的部分区域转码部4的处理内容的流程图。
图8是示出将最大编码块以层级的方式分割为多个编码对象块的例子的说明图。
图9(a)是示出分割后的分区的分布的说明图,(b)是以四叉树图示出通过层级分割来分配编码模式m(Bn)的状况的说明图。
图10是示出GOP大小限制信息和参照构造指定信息所指的信息的意思的说明图。
图11是示出应用本发明的实施方式2的动态图像编码装置以及动态图像转码装置的系统的结构图。
图12是示出将总区域图像分割为6个子图片的例子的说明图。
图13是示出本发明的实施方式3的动态图像流传输系统的结构图。
图14是示出本发明的实施方式3的动态图像流传输系统的结构图。
图15是示出本发明的实施方式4的动态图像流传输系统的结构图。
具体实施方式
以下,为了更详细地说明本发明,根据附图来说明用于实施本发明的方式。
实施方式1.
在该实施方式1中,说明以下这样的动态图像编码装置:通过对进行帧间预测时的运动矢量的最大值或随机访问点间的帧数设定限制,以使随机访问点间的像素值信息的传播范围收敛于一定范围以内的方式实施编码,生成总区域比特流,并且将表示运动矢量的最大值的限制值或随机访问点间的帧数的限制值等的信息作为提示信息复用到总区域的比特流中。
另外,说明以下这样的动态图像转码装置:根据由上述动态图像编码装置生成的总区域的比特流,对总区域的编码数据进行解码,并且参照复用到总区域的比特流中的提示信息,从总区域的编码数据以及编码参数中,确定在对由用户指定的显示区域正确地进行解码时所需的编码数据以及编码参数,沿用该编码数据以及编码参数,由此,以低运算量生成部分区域的比特流。
图1是示出应用本发明的实施方式1的动态图像编码装置以及动态图像转码装置的系统的结构图。
在图1中,动态图像编码装置1通过以后级的动态图像转码装置2能够处理的形式对所输入的动态图像的总区域(包含帧整体的区域)的图片实施编码处理,生成总区域比特流,并且将转码用的提示信息(后面详细地进行叙述)复用到总区域比特流中,向动态图像转码装置2输出提示信息复用后的总区域比特流。
即,动态图像编码装置1实施以下这样的处理:决定与属于GOP(Groupofpictures:图像组)的图片内的编码对象块相对的编码参数,采用该编码参数来生成预测图像,并且对编码对象块与该预测图像的差分图像进行压缩编码,对作为其编码结果的编码数据和该编码参数进行复用,来生成总区域比特流,另外,实施以下这样的处理:将提示信息复用到总区域比特流中,向动态图像转码装置2输出该总区域比特流,该提示信息包含表示可搜索运动矢量的最大范围的运动矢量限制信息、表示属于GOP的图片的个数即GOP大小的最大值的GOP大小限制信息以及表示在对属于GOP的各图片进行解码时参照的图片的参照构造指定信息。
此外,GOP表示某随机访问点图片以及从该随机访问点图片起按照解码顺序在后面连续的不是随机访问点的图片的集合。
图10是示出GOP大小限制信息和参照构造指定信息所指的信息的意思的说明图。
GOP大小限制信息表示上述定义的GOP的大小。在现有的动态图像编码装置生成的比特流中,存在GOP这样的数据构造,但不存在表示GOP的大小的信息。即,从对随机访问点图片进行解码到对下一随机访问点图片进行解码的图片数是GOP大小,在解码装置侧对GOP全部进行解码之前,无法知晓GOP大小。通过将GOP大小限制信息复用到例如GOP的起始帧的编码数据中,具有在对GOP全部进行解码之前、向解码装置侧传递GOP大小的效果。
参照构造指定信息描述了图片间的参照构造。在现有的动态图像编码装置中,仅仅是在各个帧中分别复用该帧的参照目的地帧信息。即,为了在解码装置侧知晓某GOP以怎样的参照构造进行了编码,需要对GOP全部进行解码。通过将参照构造指定信息复用到例如GOP的起始帧的编码数据,具有在对GOP全部进行解码之前、向解码侧传输参照构造的效果。
动态图像转码装置2由总区域流解码部3以及部分区域转码部4构成,实施以下这样的处理:根据由动态图像编码装置1生成的总区域比特流,对总区域的图像进行解码,将总区域的图像(以下称为“总区域解码图像”)输出至总区域显示装置5。
另外,动态图像转码装置2实施以下这样的处理:从由动态图像编码装置1生成的总区域比特流中提取提示信息,参照该提示信息所包含的运动矢量限制信息、GOP大小限制信息以及参照构造指定信息,确定对从外部赋予的显示区域信息所示的图片的显示区域进行解码时所需的区域即必须编码区域。
此外,动态图像转码装置2实施以下这样的处理:从由动态图像编码装置1生成的总区域比特流中提取必须编码区域所包含的编码对象块的编码数据以及编码参数,生成遵照根据该编码数据和编码参数而预先设定的编解码器的部分区域比特流。
总区域流解码部3实施以下这样的处理:提取由动态图像编码装置1生成的总区域比特流所包含的总区域的编码数据以及编码参数和提示信息,根据总区域的编码数据以及编码参数对总区域解码图像进行解码,将总区域解码图像输出至部分区域转码部4以及总区域显示装置5,并且将总区域的编码数据以及编码参数和提示信息输出至部分区域转码部4。
部分区域转码部4实施以下这样的处理:参照从总区域流解码部3输出的提示信息所包含的运动矢量限制信息、GOP大小限制信息以及参照构造指定信息,来确定对从外部赋予的显示区域信息所示的图片的显示区域进行解码时所需的区域即必须编码区域。
此外,必须编码区域确定单元由总区域流解码部3以及部分区域转码部4构成。
另外,部分区域转码部4实施以下这样的处理:从由总区域流解码部3输出的总区域的编码数据以及编码参数中,提取上述必须编码区域所包含的编码对象块的编码数据以及编码参数,生成遵照根据编码对象块的编码数据以及编码参数而预先设定的编解码器的部分区域比特流。
此外,部分区域转码部4构成参数提取单元以及部分区域流生成单元。
总区域显示装置5是显示从总区域流解码部3输出的总区域解码图像的显示设备。
动态图像解码装置6根据从部分区域转码部4输出的部分区域比特流,对部分区域的图像进行解码,将部分区域的图像(以下,称为“部分区域解码图像”)输出至部分区域显示装置7。
部分区域显示装置7是显示从动态图像解码装置6输出的部分区域解码图像的显示设备。
作为具体的运用例,说明将动态图像转码装置2内置于可进行超高清晰度影像的接收再现的固定型TV中的情况。
在此情况下,动态图像编码装置1是存在于发布超高清晰度影像的系统侧并生成发布对象的总区域比特流的编码器装置。
因此,由作为编码器装置的动态图像编码装置1生成的总区域比特流经由规定的传输系统发布至固定型TV。
内置于固定型TV的动态图像转码装置2接收从动态图像编码装置1发布的总区域比特流,根据总区域比特流对总区域解码图像进行解码,由此,在总区域显示装置5上显示总区域解码图像。
这里的固定型TV能够相对于收看者的平板终端收发数据,当用户操作平板终端指定了任意的显示区域时,表示该显示区域的显示区域信息被输入至固定型TV内的动态图像转码装置2,动态图像转码装置2生成包含用户指定的显示区域再现所需的编码参数等的部分区域比特流,将该部分区域比特流发送到平板终端。
在平板终端中内置有动态图像解码装置6,动态图像解码装置6接收从动态图像转码装置2发送的部分区域比特流,根据该部分区域比特流对部分区域解码图像进行解码,由此在部分区域显示装置7中显示部分区域解码图像。
此外,在平板终端中,可适当放大部分区域解码图像进行显示。
以上,用户可通过采用图1所示的系统来收看超高清晰度的TV影像,并且利用手里的平板终端来适当放大任意的部分区域进行显示。
图2是示出本发明的实施方式1的动态图像编码装置1的结构图。
在图2中,编码控制部11实施以下这样的处理:输入运动矢量限制信息、GOP大小限制信息、参照构造指定信息等信息,决定属于GOP的图片(输入图像)内的编码对象块的大小即编码块大小,将该编码块大小输出至块分割部12。
另外,编码控制部11实施根据GOP大小限制信息、参照构造指定信息等来决定编码参数的处理。
即,编码控制部11实施以下这样的处理:决定各编码对象块的编码模式(帧内编码模式、帧间编码模式、PCM(PulseCodeModulation:脉冲码调制)编码模式)、预测参数(帧内预测参数、帧间预测参数)或PCM编码参数,作为编码参数。
另外,编码控制部11实施以下这样的处理:决定在实施正交变换处理或量化处理等时参照的预测差分编码参数作为编码参数,将该预测差分编码参数输出至转换/量化部18、逆量化/逆转换部19以及可变长度编码部23,并且决定在实施滤波处理时参照的环路滤波参数作为编码参数,将该环路滤波参数输出至环路滤波部21以及可变长度编码部23。
此外,编码控制部11实施将运动矢量限制信息输出至运动补偿预测部15并将提示信息(运动矢量限制信息、GOP大小限制信息、参照构造指定信息)输出至可变长度编码部23的处理。
块分割部12实施以下这样的处理:每次输入属于GOP的图片(输入图像)时,将图片分割为由编码控制部11决定的编码块大小的块,将作为预测处理单位的块的编码对象块输出至切换开关13以及减法部17。
切换开关13实施以下这样的处理:当由编码控制部11决定的编码模式是帧内编码模式时,将从块分割部12输出的编码对象块输出至帧内预测部14,当由编码控制部11决定的编码模式是帧间编码模式时,将从块分割部12输出的编码对象块输出至运动补偿预测部15,当由编码控制部11决定的编码模式是PCM编码模式时,将从块分割部12输出的编码对象块输出至PCM编码部16。
帧内预测部14实施以下这样的处理:采用由编码控制部11决定的帧内预测参数,对从切换开关13输出的编码对象块实施帧内预测处理,生成帧内预测图像。
运动补偿预测部15实施以下这样的处理:通过比较从切换开关13输出的编码对象块与存储在帧存储器22中的环路滤波处理后的局部解码图像,在从编码控制部11输出的运动矢量限制信息所示的最大范围的区域内搜索运动矢量,采用该运动矢量和由编码控制部11决定的帧间预测参数,对该编码对象块实施帧间预测处理,生成帧间预测图像。
此外,运动补偿预测部15实施将搜索到的运动矢量作为编码参数输出至可变长度编码部23的处理。
PCM编码部16不实施预测处理而实施以下这样的处理:采用由编码控制部11决定的PCM编码参数,通过将与从切换开关13输出的编码对象块对应的图片(输入图像)内的区域的像素数据转换为规定的位宽(bitwidth),生成PCM信号(编码数据),将该PCM信号输出至可变长度编码部23,并且同样地将像素数据转换为规定的位宽来生成PCM图像,将该PCM图像输出至环路滤波部21。
此外,预测图像生成单元由编码控制部11、块分割部12、切换开关13、帧内预测部14、运动补偿预测部15以及PCM编码部16构成。
减法部17实施以下这样的处理:从由块分割部12输出的编码对象块减去由帧内预测部14生成的帧内预测图像或由运动补偿预测部15生成的帧间预测图像,将作为其减法结果的预测差分信号(差分图像)输出至转换/量化部18。
转换/量化部18实施以下这样的处理:参照由编码控制部11决定的预测差分编码参数,实施对从减法部17输出的预测差分信号的正交变换处理(例如,DCT(离散余弦变换)或预先对特定的学习序列进行了基础设计的KL变换等正交变换处理),来计算变换系数,并且参照该预测差分编码参数,对该变换系数进行量化,将量化后的变换系数(以下称为“量化后系数”)输出至逆量化/逆转换部19以及可变长度编码部23。
逆量化/逆转换部19实施以下这样的处理:参照由编码控制部11决定的预测差分编码参数,对从转换/量化部18输出的量化后系数进行逆量化,并且参照该预测差分编码参数,实施对逆量化后的变换系数的逆正交变换处理,计算与从减法部17输出的预测差分信号对应的局部解码预测差分信号。
加法部20实施以下这样的处理:使由逆量化/逆转换部19算出的局部解码预测差分信号所示的差分图像与由帧内预测部14生成的帧内预测图像或由运动补偿预测部15生成的帧间预测图像进行相加,计算与从块分割部12输出的编码对象块对应的局部解码图像。
环路滤波部21根据从编码控制部11输出的滤波参数,依次实施0种以上的滤波处理。但是,在构成为不对PCM编码模式的编码对象块实施环路滤波处理的情况下,不对PCM编码模式的编码对象块实施环路滤波处理。
帧存储器22是存储环路滤波部21进行的环路滤波处理后的局部解码图像的记录介质。
可变长度编码部23实施以下这样的处理:对从转换/量化部18输出的量化后系数(编码数据)、从编码控制部11输出的编码模式(帧内编码模式/帧间编码模式/PCM编码模式)、预测参数(帧内预测参数/帧间预测参数)/PCM编码参数、预测差分编码参数以及滤波参数、从运动补偿预测部15输出的运动矢量(编码模式是帧间编码模式的情况)、从PCM编码部16输出的PCM信号(编码数据)和从编码控制部11输出的提示信息(运动矢量限制信息、GOP大小限制信息、参照构造指定信息)进行可变长度编码,生成表示它们的编码结果的总区域比特流。
此外,比特流生成单元由减法部17、转换/量化部18以及可变长度编码部23构成。
在图2中,假定动态图像编码装置1的构成要素即编码控制部11、块分割部12、切换开关13、帧内预测部14、运动补偿预测部15、PCM编码部16、减法部17、转换/量化部18、逆量化/逆转换部19、加法部20、环路滤波部21以及可变长度编码部23分别由专用的硬件(例如,安装CPU的半导体集成电路或者单片微型计算机等),但动态图像编码装置1也可以由计算机构成。
在动态图像编码装置1由计算机构成的情况下,在计算机的内部存储器或外部存储器上构成帧存储器22,并且在计算机的存储器中存储记述了编码控制部11、块分割部12、切换开关13、帧内预测部14、运动补偿预测部15、PCM编码部16、减法部17、转换/量化部18、逆量化/逆转换部19、加法部20、环路滤波部21以及可变长度编码部23的处理内容的程序,该计算机的CPU执行该存储器所存储的程序即可。
图5是示出本发明的实施方式1的动态图像编码装置1的处理内容(动态图像编码方法)的流程图。
图3是示出本发明的实施方式1的动态图像转码装置2的总区域流解码部3的结构图。
在图3中,可变长度码解码部31实施以下这样的处理:当接收到从图2的动态图像编码装置1的可变长度编码部23输出的总区域比特流时,对与预测处理单位的块即解码对象块(编码对象块)相关的编码数据(量化后系数/PCM信号)、编码模式(帧内编码模式/帧间编码模式/PCM编码模式)、帧内预测参数(编码模式是帧内编码模式的情况)、帧间预测参数(编码模式是帧间编码模式的情况)、运动矢量(编码模式是帧间编码模式的情况)、PCM编码参数(编码模式是PCM编码模式的情况)、预测差分编码参数、环路滤波参数和提示信息(运动矢量限制信息、GOP大小限制信息、参照构造指定信息)进行可变长度解码后输出。
切换开关32实施以下这样的处理:当由可变长度码解码部31进行可变长度解码的编码模式是帧内编码模式时,将从可变长度码解码部31输出的帧内预测参数输出至帧内预测部33,当由可变长度码解码部31进行可变长度解码的编码模式是帧间编码模式时,将从可变长度码解码部31输出的帧间预测参数以及运动矢量输出至运动补偿部34,当由可变长度码解码部31进行可变长度解码的编码模式是PCM编码模式时,将从可变长度码解码部31输出的PCM编码参数以及PCM信号输出至PCM解码部35。
帧内预测部33实施以下这样的处理:采用从切换开关32输出的帧内预测参数,实施对解码对象块的帧内预测处理,生成帧内预测图像。
运动补偿部34实施以下这样的处理:参照存储在帧存储器39中的环路滤波处理后的解码图像,并且采用从切换开关32输出的运动矢量和帧间预测参数,实施对解码对象块的帧间预测处理,生成帧间预测图像。
PCM解码部35实施以下这样的处理:采用从切换开关32输出的PCM编码参数以及PCM信号来生成PCM图像,将该PCM图像输出至环路滤波部38。
逆量化/逆转换部36实施以下这样的处理:参照从可变长度码解码部31输出的预测差分编码参数,对从可变长度码解码部31输出的量化后系数进行逆量化,并且参照该预测差分编码参数,实施对逆量化后的正交变换系数的逆正交变换处理,计算解码预测差分信号。
加法部37实施以下这样的处理:使由逆量化/逆转换部36算出的解码预测差分信号所示的差分图像与由帧内预测部33生成的帧内预测图像或由运动补偿部34生成的帧间预测图像相加,生成环路滤波处理前的解码图像,并且将环路滤波处理前的解码图像输出至环路滤波部38以及总区域流解码部3的外部。
环路滤波部38根据从可变长度码解码部31输出的滤波参数,依次实施0种以上的滤波处理。但是,在构成为不对PCM编码模式的解码对象块实施环路滤波处理的情况下,不对PCM编码模式的解码对象块实施环路滤波处理。
帧存储器39是存储环路滤波部38进行的环路滤波处理后的解码图像的记录介质。
在图3中,假定总区域流解码部3的构成要素即可变长度码解码部31、切换开关32、帧内预测部33、运动补偿部34、PCM解码部35、逆量化/逆转换部36、加法部37以及环路滤波部38分别由专用的硬件(例如,安装CPU的半导体集成电路或者单片微型计算机等)构成,但总区域流解码部3也可以由计算机构成。
在总区域流解码部3由计算机构成的情况下,在计算机的内部存储器或外部存储器上构成帧存储器39,并且在计算机的存储器上存储记述有可变长度码解码部31、切换开关32、帧内预测部33、运动补偿部34、PCM解码部35、逆量化/逆转换部36、加法部37以及环路滤波部38的处理内容的程序,该计算机的CPU执行存储在该存储器中的程序即可。
图6是示出本发明的实施方式1的动态图像转码装置2的总区域流解码部3的处理内容的流程图。
图4是示出本发明的实施方式1的动态图像转码装置2的部分区域转码部4的结构图。
在图4中,转码控制部41实施以下这样的处理:参照从总区域流解码部3输出的提示信息所包含的运动矢量限制信息、GOP大小限制信息以及参照构造指定信息,根据从外部赋予的显示区域信息所示的图片的显示区域确定作为转码对象的区域(转码对象区域),并且确定在对该转码对象区域进行解码时所需的区域(在转码时需要沿用编码参数的区域)即必须编码区域,输出表示该转码对象区域的转码对象区域信息以及表示必须编码区域的必须编码区域信息。
此外,转码控制部41在属于GOP的各图片中的必须编码区域的大小不同的情况下(例如,在GOP大小限制信息所示的GOP大小的最大值是N且参照构造指定信息表示当对各图片(帧)进行解码时参照前1个图片(帧)的情况下,在N个图片(帧)的必须编码区域中,第N个图片(帧)的必须编码区域的大小最小,第1个图片(帧)的必须编码区域的大小最大),例如,将大小最大的必须编码区域决定为转码对象区域。因此,成为必须编码区域转码对象区域的关系。
另外,转码控制部41实施以下这样的处理:根据转码对象区域信息来生成部分区域比特流的头部信息,将该头部信息输出至可变长度编码部46。
编码参数提取部42实施以下这样的处理:从由总区域流解码部3输出的总区域的编码数据以及编码参数中,提取由转码控制部41输出的必须编码区域信息所示的必须编码区域内包含的编码对象块的编码数据(量化后计数/PCM信号)以及编码参数(编码模式(帧内编码模式/帧间编码模式/PCM编码模式)、预测参数(帧内预测参数/帧间预测参数)/PCM编码参数、运动矢量(编码模式是帧间编码模式的情况)、预测差分编码参数、环路滤波参数、提示信息(运动矢量限制信息、GOP大小限制信息、参照构造指定信息)),将编码对象块的编码数据以及编码参数输出至外部参照块编码部43以及切换开关45。
外部参照块编码部43实施以下这样的处理:在从转码控制部41输出的必须编码区域信息所示的必须编码区域内包含的编码对象块(属于必须编码区域的边界的编码对象块)是参照必须编码区域的外部的像素值进行帧内编码的外部参照块的情况下,以不将该必须编码区域外部的像素值用于预测参照的编码方式,对该编码对象块的解码图像进行编码,将作为其编码结果的编码数据和用于上述解码图像的编码的编码参数输出到切换开关45。
例如,在采用参照编码对象块的画面端的像素值的帧内编码方式的帧内编码模式作为不将必须编码区域外部的像素值用于预测参照的编码方式的情况下,利用该帧内编码模式生成帧内预测图像,并且从由总区域流解码部3输出的环路滤波处理前的总区域解码图像中提取编码对象块(外部参照块)的解码图像。然后,对该编码对象块的解码图像与上述帧内预测图像的差分图像进行压缩编码,将作为其编码结果的编码数据(量化后系数)和在生成上述帧内预测图像时采用的帧内预测参数(编码参数)输出至切换开关45。
另外,在采用PCM编码模式作为不将必须编码区域外部的像素值用于预测参照的编码方式的情况下,从由总区域流解码部3输出的环路滤波处理前的总区域解码图像中提取编码对象块(外部参照块)的解码图像。然后,对该解码图像进行PCM编码,将作为其编码结果的PCM信号和用于解码图像的PCM编码的PCM编码参数(编码参数)输出到切换开关45。
无用块编码部44实施以下这样的处理:针对处于必须编码区域的外部且处于转码对象区域的内部的编码对象块(无用块),例如以帧间编码方式中的跳过模式进行编码,将作为其编码结果的编码数据和用于上述编码对象块的编码的编码参数输出到切换开关45。
这里,虽然示出了以帧间编码方式中的跳过模式进行编码并将用于跳过模式下的编码的编码参数输出到切换开关45的例子,但不限于此,也可以将预先设定的虚拟参数输出至切换开关45。
切换开关45实施以下这样的处理:参照从转码控制部41输出的转码对象区域信息以及必须编码区域信息,当必须编码区域所包含的编码对象块不是外部参照块时,选择从编码参数提取部42输出的编码数据以及编码参数,当必须编码区域所包含的编码对象块是外部参照块时,选择从外部参照块编码部43输出的编码数据以及编码参数,当编码对象块是无用块时,选择从无用块编码部44输出的编码数据以及编码参数,将所选择的编码数据以及编码参数输出至可变长度编码部46。
可变长度编码部46实施以下这样的处理:对从切换开关45输出的编码数据以及编码参数进行可变长度编码,生成表示它们的编码结果的部分区域比特流,并且将从转码控制部41输出的部分区域比特流的头部信息复用到该部分区域比特流中,输出头部信息复用后的部分区域比特流(遵照规定的编解码器的部分区域流)。
在图4中,假定部分区域转码部4的构成要素即转码控制部41、编码参数提取部42、外部参照块编码部43、无用块编码部44、切换开关45以及可变长度编码部46分别由专用的硬件(例如,安装CPU的半导体集成电路或者单片微型计算机等)构成,但部分区域转码部4也可以由计算机构成。
在部分区域转码部4由计算机构成的情况下,在计算机的存储器中存储记述有转码控制部41、编码参数提取部42、外部参照块编码部43、无用块编码部44、切换开关45以及可变长度编码部46的处理内容的程序,该计算机的CPU执行该存储器所存储的程序即可。
图7是示出本发明的实施方式1的动态图像转码装置2的部分区域转码部4的处理内容的流程图。
接着,对动作进行说明。
图2的动态图像编码装置1的特征在于,采用利用帧内预测编码/帧间预测编码/PCM编码对输入图像进行压缩编码的编码方式,在进行帧间预测编码的情况下,根据从外部赋予的运动矢量限制信息,限制运动矢量的最大值(限制运动矢量的搜索范围)。
另外,特征在于,将在决定编码模式(帧内编码模式/帧间编码模式/PCM编码模式)或编码参数(帧内预测参数/帧间预测参数/PCM编码参数)时成为基础的GOP大小或参照构造限制为特定的模式,将表示其限制信息的提示信息(运动矢量限制信息、GOP大小限制信息、参照构造指定信息)复用到总区域比特流中。
在图像编码处理中,利用一般的图像的图像特征与在时间空间上接近的区域具有高度相关性的情况,提高压缩效率。在帧间编码(帧间参照编码)中,利用上述的特征,参照时间上接近的编码完成帧中的空间上接近的区域,来预测图像特征,由此,提高压缩效率。
此时,因为有时图像内的对象在帧间移动,所以,实施以下这样的处理(运动补偿预测处理):搜索相关性高的区域,利用运动矢量这样的信息表示与预测对象区域相关性高的区域的相位差,吸收对象的移动。
由此,即使希望根据已编码的流仅对特定帧的特定限制的区域进行解码时,在该帧所参照的帧中,也需要对运动矢量所指的目的地区域进行解码。
因为还具有通过帧间参照而解码的帧被后级的帧参照的情况,所以,存在某帧的解码图像的某区域的信息传播到比帧间参照中的后级的帧大的范围的区域的情况。例如,当对运动矢量的最大值没有设置限制时,解码图像信息的传播范围事实上有可能无限宽。
在该实施方式1的动态图像编码装置1中采用了以下这样的结构:可通过对运动矢量、GOP大小或参照构造设置一定的限制,将解码图像信息的传播抑制在一定范围内,且将这些限制信息作为提示信息传输到解码侧。
作为图1的动态图像编码装置1的处理对象的影像信号格式除了由亮度信号和两个色差信号构成的YUV信号或从数字摄像元件输出的RGB信号等任意的颜色空间的彩色影像信号之外,还作为单色图像信号或红外线图像信号等的影像帧由水平/垂直2维的数字采样(像素)列构成的任意影像信号。
其中,各像素的灰度可以是8位,也可以是10位或12位等的灰度。
在以下的说明中,为了方便起见,只要没有特别声明,则针对输入图像的影像信号是YUV信号且使用两个色差分量U、V相对于亮度分量Y进行二次采样(subsample)后的4:2:0格式的信号的情况进行叙述。
另外,将与影像信号的各个帧对应的处理数据单位称为“图片”。
在此实施方式1中,虽然“图片”作为依次扫描(渐进扫描)的影像帧信号进行说明,当在影像信号是交织信号的情况下,“图片”可以是作为构成影像帧的单位的场图像信号。
以下,说明动态图像编码装置1的处理内容。
编码控制部11针对规定的最大编码块(CTU、宏块)大小的每个图像区域,在达到规定的分割层级数的上限之前,分层地分割为具有编码块大小的编码对象块,决定对各编码对象块的编码模式(图5的步骤ST1)。
这里,图8是示出将最大编码块分层地分割为多个编码对象块的例子的说明图。
在图8中,最大编码块是记述为“第0层级”的亮度分量具有(L0,M0)的大小的编码对象块。
将CTU大小的块作为出发点,在到达以四叉树构造另外设定的规定深度之前分层地进行分割,由此,获得编码对象块。
在深度n中,编码对象块是大小(Ln,Mn)的图像区域。
其中,虽然Ln和Mn可以相同,也可以不同,在图8中示出Ln=Mn的情况。
下面,将由编码控制部11决定的编码块大小定义为编码对象块的亮度分量中的大小(Ln,Mn)。
由于进行四叉树分割,所以,(Ln+1,Mn+1)=(Ln/2,Mn/2)始终成立。
此外,在RGB信号等全部颜色分量具有同一采样数的彩色影像信号(4:4:4格式)中,虽然全部颜色分量的大小成为(Ln,Mn),但在处理4:2:0格式的情况下,对应的色差分量的编码块大小成为(Ln/2,Mn/2)。
下面,用Bn表示第n层级的编码对象块,用m(Bn)表示对于编码对象块Bn可选择的编码模式。
在由多个颜色分量构成的彩色影像信号的情况下,编码模式m(Bn)可构成为针对每个色分量分别采用单独的模式,也可以构成为针对全部的颜色分量采用共同的模式。下面,只要没有特别声明,则是指与YUV信号、4:2:0格式的编码块的亮度分量相对的编码模式而进行说明。
编码模式m(Bn)具有1个或多个帧内编码模式(总称为“INTRA”)、1个或多个帧间编码模式(总称为“INTER”)、1个或多个PCM编码模式,编码控制部11从该图片的图片类型可利用的全部编码模式或其子集中,选择针对编码对象块Bn的编码模式。
此外,编码对象块Bn如图9所示通过块分割部12分割为1个或多个预测处理单位(分区)。
下面,将属于编码对象块Bn的分区表述为Pi n(i是第n层级中的分区编号)。
在编码模式m(Bn)中,作为信息包含怎样进行了编码对象块Bn的分区分割。
分区Pi n全部根据编码模式m(Bn)进行预测处理,按照每个编码对象块Bn或分区Pi n,选择预测参数。
编码控制部11针对最大编码块,生成例如图9所示的块分割状态,确定编码对象块。
图9(a)的斜线部分表示分割后的分区的分布,图9(b)利用四叉树图表示通过层级分割来分配编码模式m(Bn)的状况。
被图9(b)的□包围的节点是被分配编码模式m(Bn)的节点(编码对象块)。
另外,编码控制部11将从外部赋予的运动矢量限制信息输出至运动补偿预测部15。
运动矢量限制信息用于实现以下这样的功能:通过限制运动矢量的长度的最大值,来限制某帧的解码图像的一部分区域的信息在参照关系中传播到后级帧的哪个区域。该运动矢量限制信息可以是在全部帧中都固定的值,也可以是针对每个帧不同的值。
另外,编码控制部11将所决定的编码模式、预测差分信号参数、帧内预测参数、帧间预测参数、PCM编码参数、环路滤波参数输出到可变长度编码部23。
另外,将从外部赋予的运动矢量限制信息、GOP大小限制信息、参照构造指定信息输出到可变长度编码部23。
此外,对向动态图像编码装置1输入的各个图片实施编码控制部11的处理。根据从外部赋予的参照构造指定信息、GOP大小限制信息或其它的编码控制信息,在编码控制部11的内部控制图片的类型、图片间参照的构造等,根据这些图片类型信息,如上述那样决定编码模式/编码参数。
在图片类型是I图片的情况下,将编码模式限定为帧内编码模式或PCM编码模式。
另外,在图片类型是B图片或P图片的情况下,将编码模式决定为帧内编码模式、帧间编码模式或PCM编码模式。
另外,在图片类型是B图片或P图片的情况下,可根据其它的编码控制信息进行控制,以限制使用帧内编码模式或限制对全部图片使用PCM编码模式。
切换开关13在由编码控制部11决定的编码模式m(Bn)是帧内编码模式的情况(m(Bn)∈INTRA的情况)下,将从块分割部12输出的编码对象块Bn输出到帧内预测部14(步骤ST2)。
切换开关13在由编码控制部11决定的编码模式m(Bn)是帧间编码模式的情况(m(Bn)∈INTER的情况)下,将从块分割部12输出的编码对象块Bn输出到运动补偿预测部15(步骤ST3)。
另外,切换开关13在由编码控制部11决定的编码模式m(Bn)是PCM编码模式的情况下,将从块分割部12输出的编码对象块Bn输出到PCM编码部16(步骤ST3)。
当由编码控制部11决定的编码模式m(Bn)是帧内编码模式(m(Bn)∈INTRA的情况)并从切换开关13接收到编码对象块Bn时,帧内预测部14采用由编码控制部11决定的帧内预测参数,实施对该编码对象块Bn内的各分区Pi n的帧内预测处理,来生成帧内预测图像PINTRAi n(步骤ST4)。
当由编码控制部11决定的编码模式m(Bn)是帧间编码模式(m(Bn)∈INTER的情况)并从切换开关13接收到编码对象块Bn时,运动补偿预测部15对该编码对象块Bn内的各分区Pi n与存储在帧存储器22中的运动补偿预测参照图像(实施环路滤波处理之后的其它帧的局部解码图像)进行比较,搜索运动矢量。
但是,在搜索运动矢量时,限制运动矢量的长度不超过从编码控制部11输出的运动矢量限制信息所示的最大值。(在运动矢量限制信息所示的最大范围的区域内搜索运动矢量)。
此外,运动矢量限制信息所示的最大值可以是在全部帧中固定,也可以是按照每个帧而不同。
另外,可按照当前帧与参照目的地帧的每个组合进行变化。例如,可以以与当前帧的POC(PictureOrderCount:以时间序列按照每个帧增加1的计数值)和参照目的地帧的POC的差分绝对值成比例的方式,指定运动矢量的最大值,。一般情况下,帧间的POC的差分越大,则帧间的运动量也越大,所以,利用上述这样的规则来指定最大值是合理的。
这样,以怎样的规则来指定运动矢量的最大值这样的信息也能够一并包含在运动矢量限制信息内。
当搜索到运动矢量时,运动补偿预测部15采用该运动矢量和由编码控制部11决定的帧间预测参数,实施对该编码对象块Bn内的各分区Pi n的帧间预测处理,生成帧间预测图像PINTERi n(步骤ST5)。
当由编码控制部11决定的编码模式m(Bn)是PCM编码模式且从切换开关13接收到编码对象块Bn时,PCM编码部16根据从编码控制部11输出的PCM编码参数,对编码对象块Bn所包含的像素实施像素灰度的降低处理,将降低灰度后的像素值作为PCM信号输出至可变长度编码部23(步骤ST6)。
另外,PCM编码部16将降低灰度之后、再次恢复至初始灰度后的像素值作为PCM图像(PCM编码模式中的局部解码图像)输出至环路滤波部21。
此外,在PCM编码参数表示不进行灰度降低的情况下,不实施像素灰度的降低处理,所以,能够无劣化地对编码对象块Bn的像素值进行编码。
从块分割部12接收到编码对象块Bn时,减法部17从该编码对象块Bn内的分区Pi n减去由帧内预测部14生成的帧内预测图像PINTRAi n或由运动补偿预测部15生成的帧间预测图像PINTERi n,将作为其减法结果的预测差分信号输出至转换/量化部18(步骤ST7)。
当从减法部17接收到预测差分信号时,转换/量化部18参照由编码控制部11决定的预测差分编码参数,实施对该预测差分信号的正交变换处理(例如,DCT(离散余弦变换)或预先对特定学习序列进行了基础设计的KL变换等正交变换处理),计算其变换系数。
另外,转换/量化部18参照该预测差分编码参数,使该变换系数进行量化,将量化后的变换系数即量化后系数输出至逆量化/逆转换部19以及可变长度编码部23(步骤ST8)。
当从转换/量化部18接收到量化后系数时,逆量化/逆转换部19参照由编码控制部11决定的预测差分编码参数,对该量化后系数进行逆量化。
另外,逆量化/逆转换部19参照该预测差分编码参数,实施对逆量化后的变换系数的逆正交变换处理(例如,逆DCT、逆KL变换等),计算与从减法部17输出的预测差分信号对应的局部解码预测差分信号(步骤ST9)。
当从逆量化/逆转换部19接收到局部解码预测差分信号时,加法部20使该局部解码预测差分信号所示的差分图像与由帧内预测部14生成的帧内预测图像PINTRAi n或由运动补偿预测部15生成的帧间预测图像PINTERi n进行相加,作为局部解码分区图像或者该局部解码分区图像的集合,计算与从块分割部12输出的编码对象块Bn对应的局部解码图像(步骤ST10)。
当针对总编码对象块Bn的步骤ST2~ST10的处理结束时(步骤ST11、ST12),环路滤波部21采用从加法部20输出的局部解码图像(环路滤波处理前的局部解码图像),根据从编码控制部11输出的环路滤波参数,实施0种以上的环路滤波处理,将环路滤波处理后的局部解码图像输出至帧存储器22(步骤ST13)。
此外,当构成为不对PCM编码模式的编码对象块Bn实施环路滤波处理时,不对PCM编码模式的编码对象块Bn实施环路滤波处理。
可变长度编码部23对从转换/量化部18输出的量化后系数(编码数据)、从编码控制部11输出的编码模式m(Bn)、预测参数(帧内预测参数/帧间预测参数)/PCM编码参数、预测差分编码参数以及滤波参数、从运动补偿预测部15输出的运动矢量(编码模式是帧间编码模式的情况)、从PCM编码部16输出的PCM信号(编码数据)和从编码控制部11输出的提示信息(运动矢量限制信息、GOP大小限制信息、参照构造指定信息)进行可变长度编码,生成表示它们的编码结果的总区域比特流(步骤ST14)。
接着,说明动态图像转码装置2的总区域流解码部3的处理内容。
当输入了由动态图像编码装置1生成的总区域比特流时,可变长度码解码部31利用与图2的编码控制部11同样的方法,决定最大编码块大小以及分割层级数的上限。
在总区域比特流中复用了表示最大编码块大小以及分割层级数的上限的信息的情况下,可通过对该信息进行解码,决定最大编码块大小以及分割层级数的上限。
接着,可变长度码解码部31对分配给复用到总区域比特流中的最大编码块的编码模式进行解码,对表示该编码模式所包含的最大编码块的分割状态的信息(片分割控制信息)进行解码(图6的步骤ST21)。
另外,可变长度码解码部31在对表示最大编码块的分割状态的信息进行解码后,根据最大编码块的分割状态,确定分层地分割的解码对象块(编码对象块)。
另外,可变长度码解码部31根据解码对象块的分割状态,将该解码对象块进一步分割为1个或多个预测处理单位,对分配给编码对象块单位或预测处理单位的编码参数进行解码(步骤ST21)。
可变长度码解码部31在分配给解码对象块(编码对象块)的编码模式是帧内编码模式的情况下,按照该解码对象块所包含的1个以上的分区,对帧内预测参数进行解码(步骤ST21)。
另外,在分配给解码对象块的编码模式是帧间编码模式的情况下,按照解码对象块或者按照该解码对象块所包含的1个以上的分区,对帧间预测参数进行解码(步骤ST21)。
另外,在分配给解码对象块的编码模式是PCM编码模式的情况下,对分配给解码对象块的PCM信号以及PCM编码参数进行解码(步骤ST21)。
另外,可变长度码解码部31在分配给解码对象块的编码模式是帧内编码模式或帧间编码模式的情况下,根据编码参数所包含的预测差分编码参数内的变换块大小的信息,将作为预测处理单位的分区分割成作为变换处理单位的1个或多个分区,按照作为变换处理单位的分区,对量化后系数进行解码(步骤ST21)。
此外,可变长度码解码部31对复用在总区域比特流中的滤波参数进行解码,将该滤波参数输出至环路滤波部38(步骤ST21)。
此外,可变长度码解码部31将已解码的总编码参数(编码模式、帧内预测参数、帧间预测参数、PCM编码参数、运动矢量、预测差分编码参数、环路滤波参数)、提示信息(运动矢量限制信息、GOP大小限制信息、参照构造指定信息)和编码数据(量化后系数、PCM信号)输出至图4的部分区域转码部4。
当由可变长度码解码部31进行可变长度解码后的编码模式m(Bn)是帧内编码模式时(m(Bn)∈INTRA的情况),切换开关32将由可变长度码解码部31进行可变长度解码后的帧内预测参数输出至帧内预测部33(步骤ST22)。
当由可变长度码解码部31进行可变长度解码的编码模式m(Bn)是帧间编码模式时(m(Bn)∈INTER的情况),切换开关32将由可变长度码解码部31进行可变长度解码后的帧间预测参数以及运动矢量输出至运动补偿部34(步骤ST23)。
另外,当由可变长度码解码部31进行可变长度解码后的编码模式m(Bn)是PCM编码模式时,切换开关32将由可变长度码解码部31进行可变长度解码后的PCM信号以及PCM编码参数输出至PCM解码部35(步骤ST23)。
当由可变长度码解码部31进行可变长度解码后的编码模式m(Bn)是帧内编码模式(m(Bn)∈INTRA的情况)并从切换开关32接收到帧内预测参数时,帧内预测部33按照与图2的帧内预测部14同样的顺序,采用该帧内预测参数,来实施对解码对象块Bn内的各分区Pi n的帧内预测处理,生成帧内预测图像PINTRAi n,并将该帧内预测图像PINTRAi n输出至加法部37(步骤ST24)。
当由可变长度码解码部31进行可变长度解码的编码模式m(Bn)是帧间编码模式(m(Bn)∈INTER的情况)并从切换开关32接收到帧间预测参数以及运动矢量时,运动补偿部34参照帧存储器39所存储的环路滤波处理后的解码图像,并且采用该运动矢量和帧间预测参数,实施对解码对象块Bn或分区Pi n的帧间预测处理,生成帧间预测图像PINTERi n,并将该帧间预测图像PINTERi n输出至加法部37(步骤ST25)。
PCM解码部35实施以下这样的处理:当由可变长度码解码部31进行可变长度解码的编码模式m(Bn)是PCM编码模式并从切换开关32接收到PCM信号以及PCM编码参数时,根据该PCM编码参数,将与解码对象块Bn的各像素对应的PCM信号的灰度恢复成解码图像的灰度,将所恢复的解码对象块Bn的环路滤波处理前的解码图像输出至环路滤波部38(步骤ST26)。另外,将环路滤波处理前的解码图像输出至图4的部分区域转码部4。
当从可变长度码解码部31接收到量化后系数以及预测差分编码参数时,逆量化/逆转换部36按照与图2的逆量化/逆转换部19同样的顺序,参照该预测差分编码参数,使该量化后系数进行逆量化,并且实施对逆量化后的变换系数的逆正交变换处理,计算与从图2的减法部17输出的预测差分信号对应的解码预测差分信号,将该解码预测差分信号输出至加法部37(步骤ST27)。
加法部37使由逆量化/逆转换部36算出的解码预测差分信号所示的差分图像与由帧内预测部33生成的帧内预测图像PINTRAi n或由运动补偿部34生成的帧间预测图像PINTERi n进行相加,作为解码对象块内所包含的1个或多个解码分区图像的集合,将解码图像输出至环路滤波部38(步骤ST28)。另外,将环路滤波处理前的解码图像输出至图4的部分区域转码部4。
当针对图片内的总编码对象块Bn的步骤ST21~ST28的处理结束时(步骤ST29、ST30),环路滤波部38根据从可变长度码解码部31输出的滤波参数,对从加法部37或PCM解码部35输出的环路滤波处理前的解码图像实施0种以上的环路滤波处理,将环路滤波处理后的解码图像存储到帧存储器39中(步骤ST31)。
此外,环路滤波处理后的解码图像可输出到动态图像转码装置2的外部。
接着,说明动态图像转码装置2的部分区域转码部4的处理内容。
当从图3的总区域流解码部3接收到提示信息(运动矢量限制信息、GOP大小限制信息、参照构造指定信息)时,转码控制部41参照该提示信息所包含的运动矢量限制信息、GOP大小限制信息以及参照构造指定信息,根据从外部赋予的显示区域信息所示的图片的显示区域,确定作为转码对象的区域(转码对象区域),并且确定在对该转码对象区域进行解码时所需的区域(该区域是保证被进行与总区域解码图像相同或相近的解码的区域,是需要在转码时沿用编码参数的区域)即必须编码区域,输出表示该转码对象区域的转码对象区域信息以及表示必须编码区域的必须编码区域信息(图7的步骤ST41)。
此外,在属于GOP的各图片中的必须编码区域的大小不同时,例如,将大小最大的必须编码区域决定为在各个图片共用的转码对象区域。
以下,具体地说明由转码控制部41进行的转码对象区域信息以及必须编码区域的确定处理。
在动态图像解码处理中实施以下的处理:通过使实施运动补偿预测处理而获得的预测图像(参照解码完成的帧并且根据运动矢量来确定的位置的图像)与预测差分信号相加,生成解码图像。
这里,当设作为GOP的起始帧的随机访问点帧为F1、参照帧Fn的帧为Fn+1时,在帧Fn中的解码对象的区域是部分区域Pn的情况下,在帧Fn-1中,需要将帧Fn的部分区域Pn所参照的帧Fn-1的部分区域Pn-1全部作为解码对象区域。
此时,帧Fn参照帧Fn-1,帧Fn-1参照帧Fn-2,在到达未进行任何参照的帧即F1之前,在GOP内多级地执行运动补偿预测处理中的帧间参照,因此,帧间的依存关系从帧F1传播到帧Fn
因此,为了利用GOP内的参照构造来对属于最终级的帧FN的部分区域PN进行正确解码,需要将基于上述依存关系的传播的从帧F1到帧FN的部分区域P1至PN作为解码对象区域。
假设在动态图像转码装置2不是对从图2的动态图像编码装置1输出的总区域比特流进行处理而是对未给运动矢量/GOP大小/参照构造施加限制的比特流进行处理时,为了求出帧Fn的部分区域Pn,必须分析帧Fn+1的全部运动矢量,来确定这些运动矢量所指的区域,分析所需的时间变长。
另外,因为GOP大小/运动矢量的最大值、参照构造根据比特流而不同,所以,与相同的显示区域指定信息相对的各帧Fn的部分区域Pn的形状/大小根据比特流而不定,在转码处理或对转码后的流进行解码的处理中难以进行处理。
但是,在该实施方式1中,如上所述,从图2的动态图像编码装置1输出的总区域比特流根据提示信息对运动矢量/GOP大小/参照构造施加了限制,所以,能够在以下的处理中以低运算量固定地求出各帧Fn的部分区域Pn
这里,为了简化安装,在各帧Fn的部分区域Pn不是矩形区域的情况下,将内包部分区域Pn的矩形区域PLn作为解码对象。
另外,考虑以下这样的情况:包含于提示信息内的运动矢量限制信息所示的运动矢量的水平垂直分量绝对值的最大值在全部帧中固定为V[像素]。另外,参照帧Fn-1的帧Fn的解码对象矩形区域是PLn
在此情况下,帧Fn-1的解码对象矩形区域PLn-1能够成为对解码对象矩形区域PLn的周围固定地追加V像素后的矩形区域,而不用分析运动矢量的值。这是因为,运动矢量的最大值是V,所以,将指示解码对象矩形区域PLn外部的运动矢量的露出量至多抑制为V像素。
关于参照的依存关系,由于从随机访问点帧F1开始传播,所以,帧F1的解码对象矩形区域PL1能够作为对解码对象矩形区域PLn的周围追加V*(n-1)像素后的矩形区域来求出。
另外,在各帧中,即使在运动矢量的最大值不同的情况下,也能够同样地求出各帧Fn的解码对象矩形区域PLn。例如,在帧Fn的运动矢量最大值为Vn时,相对于帧FN的解码对象矩形区域PLN,将帧Fn(n<N)的解码对象矩形区域PLn作为对解码对象矩形区域PLN的周围追加像素Vsum后的矩形区域求出。
V s u m = Σ i = n + 1 N V i
另外,如在动态图像编码装置1的说明中叙述的那样,当与帧Fn和其参照目的地帧Fn-1的POC的差分绝对值成比例地指定运动矢量的最大值时,如以下这样地求出解码对象矩形区域。
首先,在将帧Fn与参照目的地帧Fn-1的POC的差分绝对值设为d(Fn-Fn-1)的情况下,考虑将参照Fn至Fn-1时的运动矢量的最大值指定为αd(Fn-Fn-1)(α是固定的系数)。
在此情况下,相对于帧FN的解码对象矩形区域PLN,将帧Fn(n<N)的解码对象矩形区域PLn作为对解码对象矩形区域PLN的周围追加像素Vsum后的矩形区域求出。
V s u m = Σ i = n + 1 N α d ( F i - F i - 1 )
另外,可如以下这样地简化上述的式子。
Vsum=αd(FN-Fn)
即,Vsum的值由FN与Fn的POC的差分绝对值来确定。
另外,当把与帧Fn的解码对象矩形区域PLn相对的帧Fm(m<n)的解码对象矩形区域PLm(对解码对象矩形区域PLN的周围追加像素Vsum’后的矩形区域)称为与解码对象矩形区域PLn的帧Fm相对的依存矩形区域PDLnm时,在从多个帧中参照某个帧这样的参照构造的情况下,将由各个参照源帧求出的依存矩形区域中的最大的依存矩形区域作为该帧的解码对象矩形区域。
V sum , = Σ i = m + 1 N V i
以上,为了在GOP内一贯地生成能够正确地对特定的部分区域进行解码的部分区域比特流,需要在比特流中至少包含各帧的解码对象矩形区域的信息。另外,因为在GOP内变更帧的大小(水平/垂直的像素数)是不可能或困难的,所以,需要使GOP内的各帧的大小成为包含GOP内的全部帧的解码对象矩形区域中的最大解码对象矩形区域(大多情况下,是帧F1的解码对象矩形区域)的大小。
根据以上情况,转码控制部41当从外部被赋予了显示区域信息时,按照以下的顺序,求出必须编码区域以及转码对象区域。
(1)在GOP内的帧F1以外的帧中,将自身不被参照的帧(非参照帧:I图片)的解码对象矩形区域设定为内包显示区域的区域。
(2)根据在(1)的处理中设定的各非参照帧的解码对象矩形区域,求出与全部帧相对的依存矩形区域的大小,将各帧中的最大的依存矩形区域作为该帧的解码对象矩形区域。
(3)将GOP内的各帧的解码对象矩形区域设定为各帧的必须编码区域。
(4)将在GOP内的帧中内包最大的解码对象矩形区域的区域统一设定为GOP内的各帧的转码对象区域。
当从转码控制部41接收到必须编码区域信息时,编码参数提取部42从由总区域流解码部3输出的总区域的编码数据以及编码参数中,提取在该必须编码区域信息所示的必须编码区域中包含的编码对象块(包含仅有一部分处于必须编码区域内的编码对象块)的编码数据(量化后计数/PCM信号)以及编码参数(编码模式(帧内编码模式/帧间编码模式/PCM编码模式)、预测参数(帧内预测参数/帧间预测参数)/PCM编码参数、运动矢量(编码模式是帧间编码模式的情况)、预测差分编码参数、环路滤波参数、提示信息(运动矢量限制信息、GOP大小限制信息、参照构造指定信息)),并将所提取的编码对象块的编码数据以及编码参数输出至外部参照块编码部43以及切换开关45(步骤ST42)。
当从转码控制部41接收到必须编码区域信息时,外部参照块编码部43确认在该必须编码区域信息所示的必须编码区域中包含的编码对象块(属于必须编码区域的边界的编码对象块)是否是参照必须编码区域的外部的像素值而进行了帧内编码的外部参照块(步骤ST43)。
关于在必须编码区域中包含的编码对象块是否是外部参照块,从由总区域流解码部3输出的总区域的编码数据以及编码参数中提取该编码对象块的编码参数,确认在该编码参数中包含的编码模式以及预测参数,即可判别。
当在必须编码区域中包含的编码对象块是外部参照块时,外部参照块编码部43以不将必须编码区域外部的像素值用于预测参照中的编码方式,对该编码对象块的解码图像进行编码,将作为其编码结果的编码数据和用于上述解码图像的编码的编码参数输出到切换开关45(步骤ST44)。
这样,在编码对象块是外部参照块的情况下,不是从总区域的编码数据以及编码参数中提取该编码对象块的编码数据以及编码参数,而是重新决定编码对象块的编码数据和编码参数,其原因是,必须编码区域的外部区域不被保证进行接近于转码前的解码图像的解码结果,所以,在参照该区域的帧内编码预测中,预测结果与本来的结果不同。
作为编码数据和编码参数的重新决定方法,例如可举出以下的方法。
(1)从由总区域流解码部3输出的总区域的解码图像(环路滤波处理前)中,提取外部参照块的解码图像,按照与动态图像编码装置1的PCM编码部16相同的顺序,使用PCM编码模式对外部参照块的解码图像进行编码。将作为其编码结果的PCM信号(编码数据)和用于该编码的PCM编码参数输出到切换开关45。
在此方法的情况下,根据PCM编码的精度,能够对与所输入的解码图像完全相同的结果进行解码。
(2)根据所输入的解码图像,仅对在外部参照块进行帧内预测时所参照的必须编码区域外的编码对象块中的用于参照的像素部分进行PCM编码,将作为其编码结果的PCM信号(编码数据)输出至切换开关45。但是,关于帧内预测参数等编码参数,从总区域的编码参数中提取外部参照块的编码参数,将该编码参数输出至切换开关45。
在此方法的情况下,根据PCM编码的精度,可对与所输入的解码图像完全相同的结果进行解码。根据外部参照块的大小,与(1)的方法相比,能够削减码量。
(3)因为必须编码区域外的解码图像根据后述的无用块编码部44的结果来确定,所以,直接采用该解码图像,利用帧内编码预测或帧间编码预测,以成为与所输入的解码图像接近的结果的方式,决定编码参数。
可利用与图2的动态图像编码装置1中的编码方式等同的方法来实施(3)的方法中的编码参数决定。
(4)通过扩大必须编码区域,使解码区域与该帧中的必须编码区域一致,利用与参照画面外的帧内编码预测等同的方法实施外部参照块的编码。
无用块编码部44针对处于必须编码区域的外部且处于转码对象区域的内部的编码对象块(无用块),例如以帧间编码方式中的跳过模式进行编码,将作为其编码结果的编码数据和用于上述编码对象块的编码的编码参数输出至切换开关45(步骤ST45)。
这里,虽然无用块对于统一GOP内的帧大小是必要的,但因为该无用块是属于在显示或后级帧的参照中不被使用的图像区域的编码对象块,所以,无用块的解码结果可以是任意结果。由此,关于无用块,期望采用码量尽量少的编码参数。
因此,关于无用块,采用尽可能不进行块分割而以帧间编码预测的跳过模式(不对矢量信息(存在除了预测矢量信息的情况)、量化后系数进行编码的模式)进行编码的方法等。
此外,在外部参照块编码部43中,当采用上述(2)的方法作为决定外部参照块的编码参数的方法的情况下,即使是不包含在必须编码区域内的编码对象块,在是从外部参照块参照的编码对象块时,需要利用上述(2)的方法决定编码参数。
切换开关45参照从转码控制部41输出的转码对象区域信息以及必须编码区域信息,确认编码对象块是否是无用块,并且当编码对象块包含在必须编码区域内时,确认该编码对象块是否是外部参照块(步骤ST46、ST47)。
切换开关45在编码对象块包含在必须编码区域内、编码对象块不是外部参照块时,将从编码参数提取部42输出的编码数据以及编码参数输出到可变长度编码部46(步骤ST48)。
当编码对象块是外部参照块时,切换开关45将从外部参照块编码部43输出的编码数据以及编码参数输出至可变长度编码部46(步骤ST49)。
另外,当编码对象块是无用块时,切换开关45将从无用块编码部44输出的编码数据以及编码参数输出至可变长度编码部46(步骤ST50)。
可变长度编码部46当从切换开关45接收到编码对象块的编码数据以及编码参数时,对该编码数据以及编码参数进行熵编码,生成表示这些编码结果的部分区域比特流(步骤ST51)。
关于编码对象块,因为在转码对象区域的内部包含的块已被取出,所以,有时存在于原来的比特流中的相邻编码对象块不再存在。因此,需要重新进行运动矢量或滤波参数等采用相邻的编码对象块的信息的编码参数预测处理。利用与动态图像编码装置1的可变长度编码部23等同的方法实施也包含这样的预测处理在内的可变长度编码部46的处理。
另外,因为部分区域比特流成为包含比显示区域信息所示的显示区域宽的范围的比特流,所以,可变长度编码部46从转码控制部41取得表示显示区域是哪个区域的部分区域比特流的头部信息,将该头部信息复用到该部分区域比特流中,将头部信息复用后的部分区域比特流(遵照规定的编解码器的部分区域流)输出至动态图像解码装置6。
此外,由可变长度编码部46生成的部分区域比特流构成为可利用动态图像解码装置6进行解码。
动态图像解码装置6具有与总区域流解码部3等同的功能。但是,动态图像解码装置6也可以不具备将总区域流解码部3具有的提示信息、编码参数以及环路滤波处理前的解码图像输出至外部的功能。
另外,动态图像解码装置6也可以构成为利用与总区域流解码部3不同的手段进行解码,在此情况下,部分区域转码部4的可变长度编码部46以与动态图像解码装置6的解码单元(部分区域比特流用编解码器)对应的方式,实施编码数据以及编码参数的可变长度编码。
如以上可知,在该实施方式1中,构成为,因为动态图像编码装置1的可变长度编码部23将包含表示运动矢量的可搜索最大范围的运动矢量限制信息、表示属于GOP的图片的个数即GOP大小的最大值的GOP大小限制信息、和表示在对属于GOP的各图片进行解码时参照的图片的参照构造指定信息的提示信息复用到总区域比特流中,所以起到如下这样的效果:能够以低运算量生成适于生成高效的部分区域比特流的总区域比特流,而不会导致总区域比特流的压缩效率的降低。
即,根据此实施方式1,在动态图像编码装置1中,针对输入图像,以限制运动矢量的最大值、GOP大小以及参照构造按照运动矢量限制信息、GOP大小限制信息以及参照构造指定信息的方式进行编码,所以,在使用帧间参照的运动补偿预测处理中,可将某帧的解码图像的特定区域的信息在帧间参照的后级帧中传播的范围抑制在特定范围内,另外,可变长度编码部23将运动矢量限制信息、GOP大小限制信息以及参照构造指定信息作为提示信息复用到总区域比特流中,因此,起到能够向动态图像转码装置2明示地传递解码图像信息的传播范围的效果。
另一方面,动态图像转码装置2构成为,当接收到从动态图像编码装置1输出的总区域比特流时,总区域流解码部3对总区域的编码数据、编码参数、提示信息以及环路滤波处理前的解码图像进行解码后,输出至部分区域转码部4,部分区域转码部4根据所输入的显示区域信息以及提示信息,确定为了对各帧的显示区域信息进行解码所需的区域即必须编码区域以及表示部分区域比特流的图像大小的转码对象区域,对于属于必须编码区域的内部且不需要参照必须编码区域的外部的信息的编码对象块直接分配从总区域流解码部3输出的编码参数,对于属于必须编码区域的内部且需要参照必须编码区域的外部的信息的编码对象块,重新生成编码数据以及编码参数,对于虽然是必须编码区域的外部、但位于转码对象区域内部的编码对象块分配码量小的虚拟编码参数,将这样分配的转码对象区域内的编码对象块的编码数据以及编码参数与适当的部分区域比特流的头部信息一并作为部分区域比特流进行复用,所以,起到以下这样的效果:能够对输出到动态图像转码装置2的总区域比特流的解码图像中的与对应于显示区域信息的部分区域相同或接近的图像进行解码,并且能够以低运算量取得大小比总区域比特流小的部分区域比特流。
实施方式2.
在该实施方式2中,说明将上述实施方式1所示的动态图像编码装置、动态图像转码装置应用于与上述实施方式1不同的系统的例子。
图11是示出应用本发明的实施方式2的动态图像编码装置以及动态图像转码装置的系统的结构图。
在图11中,动态图像编码装置51具有与图1的动态图像编码装置1等同的功能。动态图像编码装置51将所生成的总区域流输出至动态图像发布装置53或存储器52。
动态图像发布装置53由总区域流解码部54、部分区域转码部55以及发布控制部56构成,具有以下的功能:根据由动态图像编码装置51生成的总区域比特流以及从动态图像解码装置50-1~50-N输入的显示区域指定信息,生成部分区域流,向动态图像解码装置50-1~50-N输出所生成的部分区域流。
总区域流解码部54具有与图1的总区域流解码部3等同的功能。另外,具有将所生成的总区域解码图像输出至总区域显示装置57的功能。
部分区域转码部55具有与图1的部分区域转码部4等同的功能。
发布控制部56具有接收从动态图像解码装置50-1~50-N输出的显示区域信息并输出至部分区域转码部55的功能。还具有以下的功能:当接收到从部分区域转码部55输出的部分区域比特流时,向输出了在生成该部分区域比特流时使用的显示区域信息的动态图像解码装置输出该部分区域比特流。
总区域显示装置57是显示从总区域流解码部54输出的总区域解码图像的显示设备。
动态图像解码装置50-1~50-N向动态图像发布装置53输出显示区域信息,并且根据动态图像发布装置53基于显示区域信息而输出的部分区域比特流,对部分区域的图像进行解码,生成部分区域解码图像。
部分区域显示装置51-1~51-N是分别显示与动态图像解码装置50-1~50-N对应的部分区域解码图像的显示装置。
作为具体的应用例,说明将动态图像发布装置53内置于保管高清晰度的监视影像的监视摄像机记录仪的例子。
在此情况下,动态图像编码装置51是存在于可取得对摄像机记录仪提供监视影像数据的高清晰度影像的监视摄像机侧并生成发布对象的总区域比特流的编码装置。由编码装置即动态图像编码装置51生成的总区域比特流被存储于摄像机记录仪内置的存储器52中。
摄像机记录仪可利用总区域流解码部54对存储在存储器52中的总区域比特流进行解码,在与摄像机记录仪直接连接的总区域显示装置57上显示所生成的总区域解码图像。
另外,这里的摄像机记录仪能够向远程的多个用户的显示终端(平板终端、智能手机、PC等)发布监视影像数据。虽然可经由规定的传输系统向远程的用户的显示终端发布监视影像数据,但要考虑根据传输系统的传输容量的不同而难以全部传输总区域比特流的情况。这里,在本系统中,在用户操作显示终端而指定了任意的显示区域来请求监视影像数据时,经由规定的传输系统将表示其显示区域的显示区域信息输出到摄像机记录仪的动态图像发布装置53,动态图像发布装置53生成包含用户指定的显示区域的再现所需的编码参数等的部分区域比特流,经由规定的传输系统将该部分区域比特流发送至请求源的显示终端。
通过仅指定监视影像的必要区域,可抑制所传输的数据量,以远程的方式收看监视影像。另外,因为显示区域可针对每个用户分别指定,所以,例如可使用传输容量大的传输路径的用户能够指定更大的显示区域。
动态图像解码装置50-1~50-N分别内置于各用户的显示终端,各动态图像解码装置50-1~50-N接收从动态图像发布装置53发送的部分区域比特流,根据该部分区域比特流对部分区域解码图像进行解码,由此,在各显示终端上显示部分区域解码图像。
以上,通过采用图11所示的系统,用户可利用与摄像机记录仪直接连接的显示装置收看高清晰度的监视影像,并且即使在经由规定的传输系统的远处,也能够通过仅指定必要的区域来抑制所传输的数据量,收看监视影像。另外,也可以针对每个用户分别地变更所指定的显示区域。
实施方式3.
在此实施方式3中,说明用于更有效地应用上述实施方式1、2所示的动态图像编码装置以及动态图像转码装置的动态图像流传输系统。
在此实施方式3中,假定以薄片或片等的子图片单位来分割总区域图像的状态。
图12是示出将总区域图像分割为6个子图片(Sub-pic)的例子的说明图。
图13是示出本发明的实施方式3的动态图像流传输系统的结构图,在图13中,因为与图1相同的标号表示相同或相当的部分,所以,省略说明。
动态图像编码装置1是在上述实施方式1中所示的动态图像编码装置1(或者,在上述实施方式2中所示的动态图像编码装置51),在生成复用了提示信息的比特流(子图片单位的比特流)之后,汇总与总区域图像相应的子图片单位的比特流,输出作为总区域图像的比特流的总区域比特流(总区域流)。
在图12的例子中,因为将总区域图像分割为6个子图片,所以,输出汇总6个子图片的比特流后的总区域比特流。
MUXER61是以下这样的复用传输装置:将从动态图像编码装置1输出的总区域比特流和表示总区域图像中的子图片的分割状态以及总区域比特流所包含的子图片单位的比特流的数据位置的子图片信息复用到预先设定的传输格式的复用信号中,传输该复用信号。
DEMUXER62是以下这样的复用分离装置:接收由MUXER61传输的复用信号,分离该复用信号所包含的总区域比特流与子图片信息,参照该子图片信息和表示解码对象的子图片的显示区域信息,从该总区域比特流中提取解码对象的子图片的比特流。
接着,对动作进行说明。
例如,在将总区域图像如图12所示地分割为6个子图片(Sub-pic)时,从动态图像编码装置1输出汇总6个子图片的比特流后的总区域比特流。
此时,在动态图像解码装置6中,当仅对总区域图像中的一部分区域进行解码时,表示解码对象的子图片的显示区域信息被输出至DEMUXER62以及动态图像转码装置2。
在图12的例子中,用虚线包围的区域(必须编码区域)是解码对象的区域,显示区域信息表示用虚线包围的区域所属的子图片是Sub-pic1、Sub-pic4的情况。
不过,虽然在解码装置侧需要以可解码的编码单位(例如,HEVC或H.264中的NAL等)对各子图片独立地进行编码,但在该实施方式3中,假定动态图像解码装置6能够以NAL单位进行解码,所以即使动态图像转码装置2仅采用与Sub-pic1、Sub-pic4对应的NAL生成比特流,动态图像解码装置6也能够对解码对象的子图片进行解码。
MUXER61从外部接收表示总区域图像中的子图片的分割状态以及总区域比特流所包含的子图片单位的比特流的数据位置的子图片信息的输入。
在图12的例子中,子图片信息表示Sub-pic1~6存在于总区域图像的哪个位置,还表示与Sub-pic1~6对应的比特流存在于总区域比特流的哪个位置。
这里,虽然示出了子图片信息包含表示分割状态的信息和数据位置信息的例子,但也可以包含其它信息。
MUXER61当从动态图像编码装置1接收到总区域比特流时,将总区域比特流和子图片信息复用到预先设定的传输格式的复用信号中,传输该复用信号。
作为这里的传输格式,例如可考虑以MPEG-2TS或MMT(MPRGMediaTransport)等定义的传输格式。上述的子图片信息作为这些传输系统的描述符与总区域比特流进行复用。但是,上述传输格式仅为一例,所以,也可以是其它传输格式。
DEMUXER62当接收到由MUXER61传输的复用信号时,分离该复用信号所包含的总区域比特流和子图片信息。
另外,DEMUXER62通过参照表示从外部赋予的作为解码对象的子图片的显示区域信息,来确定解码对象的子图片。在图12的例子中,确定Sub-pic1、Sub-pic4是作为解码对象的子图片。
DEMUXER62当确定了作为解码对象的子图片时,参照从复用信号分离的子图片信息,确定总区域比特流所包含的解码对象的子图片的比特流,从总区域比特流中提取解码对象的子图片的比特流。
在图12的例子中,提取与Sub-pic1、Sub-pic4对应的比特流(VCL-NAL1、VCL-NAL4)。
动态图像转码装置2当DEMUXER62提取了解码对象的子图片的比特流时,与上述实施方式1同样,根据这些比特流生成部分区域比特流,将该部分区域比特流输出至动态图像解码装置6。
如以上可知,因为在该实施方式3中构成为具备:MUXER61,其将从动态图像编码装置1输出的总区域比特流和表示总区域图像中的子图片的分割状态以及总区域比特流所包含的子图片单位的比特流的数据位置的子图片信息复用到预先设定的传输格式的复用信号中,传输该复用信号;以及DEMUXER62,其接收由MUXER61传输的复用信号,分离该复用信号所包含的总区域比特流与子图片信息,参照该子图片信息和表示解码对象的子图片的显示区域信息,从该总区域比特流中提取解码对象的子图片的比特流,所以,起到以下这样的效果:只要仅传输由动态图像编码装置1生成的总区域比特流中的解码所需的比特流即可,从而能够削减比特流的传输量。
在该实施方式3中示出了DEMUXER62将从总区域比特流提取的比特流输出至动态图像转码装置2的例子,但如图14所示,可省略动态图像转码装置2,将从总区域比特流提取的比特流输出至动态图像解码装置6。
在此情况下,当与图13的结构进行比较时,虽然输入至动态图像解码装置6的比特流的大小变大,但不再实施动态图像转码装置2中的转码处理,所以,能够高速地实施部分区域的解码。
实施方式4.
虽然在上述实施方式3中示出了DEMUXER62参照子图片信息和显示区域信息从总区域比特流中提取解码对象的子图片的比特流的情况,但如图15所示,MUXER61也可以参照子图片信息和显示区域信息,从总区域比特流中提取解码对象的子图片的比特流。
在此情况下,MUXER61将从总区域比特流提取的解码对象的子图片的比特流复用到预先设定的传输格式的复用信号中,将该复用信号传输至DEMUXER62。
DEMUXER62接收由MUXER61传输的复用信号,分离该复用信号所包含的解码对象的子图片的比特流,将该比特流输出至动态图像转码装置2或动态图像解码装置6。
根据该实施方式4,可起到比上述实施方式3更能够削减比特流的传输量的效果。
此外,MUXER61所得到的显示区域信息例如可从作为解码侧的动态图像解码装置6取得,也可以从作为发送侧的动态图像编码装置1取得。或者,可通过用户的输入来取得。
此外,本申请发明在其发明的范围内,在各实施方式的自由组合、各实施方式的任意的构成要素的变形或者各实施方式中,可省略任意的构成要素。
工业上的可利用性
本发明的动态图像编码装置适合需要以低运算量生成高效的部分区域比特流的设备,而不会导致总区域比特流的压缩效率的降低。
标号说明
1动态图像编码装置,2动态图像转码装置,3总区域流解码部(必须编码区域确定单元),4部分区域转码部(必须编码区域确定单元,参数提取单元,部分区域流生成单元),5总区域显示装置,6动态图像解码装置,7部分区域显示装置,11编码控制部(预测图像生成单元),12块分割部(预测图像生成单元),13切换开关(预测图像生成单元),14帧内预测部(预测图像生成单元),15运动补偿预测部(预测图像生成单元),16PCM编码部,17减法部(比特流生成单元),18转换/量化部(比特流生成单元),19逆量化/逆转换部,20加法部,21环路滤波部,22帧存储器,23可变长度编码部(比特流生成单元),31可变长度码解码部,32切换开关,33帧内预测部,34运动补偿部,35PCM解码部,36逆量化/逆转换部,37加法部,38环路滤波部,39帧存储器,41转码控制部,42编码参数提取部,43外部参照块编码部,44无用块编码部,45切换开关,46可变长度编码部,51动态图像编码装置,52存储器,53动态图像发布装置,54总区域流解码部,55部分区域转码部,56发布控制部,57总区域显示装置,50-1~50-N动态图像解码装置,51-1~51-N部分区域显示装置,61MUXER(复用传输装置),62DEMUXER(复用分离装置)。

Claims (13)

1.一种动态图像编码装置,其特征在于,其具备:
预测图像生成单元,其决定针对属于GOP(GroupOfPictures)的图片内的编码对象块的编码参数,使用所述编码参数生成预测图像;以及
比特流生成单元,其对所述编码对象块和由所述预测图像生成单元生成的预测图像之间的差分图像进行压缩编码,对作为其编码结果的编码数据和所述编码参数进行复用而生成比特流,
所述比特流生成单元将提示信息复用到所述比特流中,该提示信息包含:运动矢量限制信息,其表示运动矢量的可搜索范围;GOP大小限制信息,其表示属于所述GOP的图片的个数即GOP大小;以及参照构造指定信息,其表示在对属于所述GOP的各图片进行解码时参照的图片。
2.根据权利要求1所述的动态图像编码装置,其特征在于,
所述预测图像生成单元在针对所述编码对象块的编码模式是帧间编码模式的情况下,在所述运动矢量限制信息所示的区域内搜索运动矢量,使用所述运动矢量和所述编码参数,实施对所述编码对象块的预测处理,生成预测图像。
3.一种动态图像转码装置,其具备:
必须编码区域确定单元,其从由权利要求1所述的动态图像编码装置生成的比特流中提取提示信息,参照所述提示信息所包含的运动矢量限制信息、GOP大小限制信息以及参照构造指定信息,确定必须编码区域,该必须编码区域是对从外部赋予的显示区域信息表示的图片的显示区域进行解码时所需的区域;
参数提取单元,其从由所述动态图像编码装置生成的比特流中,提取由所述必须编码区域确定单元确定的必须编码区域所包含的编码对象块的编码数据以及编码参数;以及
部分区域流生成单元,其生成部分区域流,该部分区域流遵照根据由所述参数提取单元提取的编码数据以及编码参数而预先设定的编解码器。
4.根据权利要求3所述的动态图像转码装置,其特征在于,
所述参数提取单元具备:
编码参数提取部,其在由所述必须编码区域确定单元确定的必须编码区域所包含的编码对象块不是参照所述必须编码区域的外部的像素值而进行了帧内编码的外部参照块的情况下,从由所述动态图像编码装置生成的比特流中提取所述编码对象块的编码数据以及编码参数,输出所述编码数据以及编码参数;
外部参照块编码部,其在由所述必须编码区域确定单元确定的必须编码区域所包含的编码对象块是参照所述必须编码区域的外部的像素值而进行了帧内编码的外部参照块的情况下,使用不将所述必须编码区域的外部的像素值用于预测参照的编码方式,对所述编码对象块的解码图像进行编码,输出作为其编码结果的编码数据和用于所述解码图像的编码的编码参数;以及
切换开关,其选择从所述编码参数提取部输出的编码数据以及编码参数或从所述外部参照块编码部输出的编码数据以及编码参数,将该选择出的编码数据以及编码参数输出至所述部分区域流生成单元。
5.根据权利要求4所述的动态图像转码装置,其特征在于,
所述外部参照块编码部使用参照所述编码对象块的画面端部的像素值的帧内编码方式,生成帧内预测图像,对所述编码对象块的解码图像和所述帧内预测图像之间的差分图像进行压缩编码,输出作为其编码结果的编码数据和在生成所述帧内预测图像时使用的编码参数。
6.根据权利要求4所述的动态图像转码装置,其特征在于,
所述外部参照块编码部对所述编码对象块的解码图像进行PCM(PulseCodeModulation)编码,输出作为其编码结果的编码数据和PCM编码参数。
7.根据权利要求4所述的动态图像转码装置,其特征在于,
所述参数提取单元具备无用块编码部,
该无用块编码部在属于所述GOP的各图片中的必须编码区域的大小不同的情况下,根据所述大小,从所述各图片内的必须编码区域中指定作为转码对象区域的必须编码区域,
在各个图片中,使用帧间编码方式中的跳过模式对处于所述指定的必须编码区域的外部且处于所述转码对象区域的内部的编码对象块进行编码,输出作为其编码结果的编码数据和用于所述编码对象块的编码的编码参数,
所述切换开关选择从所述编码参数提取部输出的编码数据以及编码参数、从所述外部参照块编码部输出的编码数据以及编码参数、或从所述无用块编码部输出的编码数据以及编码参数,将该选择出的编码数据以及编码参数输出至所述部分区域流生成单元。
8.一种动态图像编码方法,其中,
预测图像生成单元决定针对属于GOP的图片内的编码对象块的编码参数,使用所述编码参数生成预测图像;
比特流生成单元对所述编码对象块与所述预测图像之间的差分图像进行压缩编码,复用作为其编码结果的编码数据和所述编码参数而生成比特流;
该动态图像编码方法的特征在于,
所述比特流生成单元将提示信息复用到所述比特流中,该提示信息包含:运动矢量限制信息,其表示运动矢量的可搜索范围;GOP大小限制信息,其表示属于所述GOP的图片的个数即GOP大小;以及参照构造指定信息,其表示在对属于所述GOP的各图片进行解码时参照的图片。
9.一种动态图像转码方法,其中,
必须编码区域确定单元从使用权利要求8所述的动态图像编码方法生成的比特流中提取提示信息,参照所述提示信息所包含的运动矢量限制信息、GOP大小限制信息以及参照构造指定信息,确定对从外部赋予的显示区域信息所示的图片的显示区域进行解码时所需的区域即必须编码区域,
参数提取单元从使用所述动态图像编码方法生成的比特流中,提取所述必须编码区域所包含的编码对象块的编码数据以及编码参数,
部分区域流生成单元生成部分区域流,该部分区域流遵照根据由所述参数提取单元提取的编码数据以及编码参数而预先设定的编解码器。
10.根据权利要求1所述的动态图像编码装置,其特征在于,
所述比特流生成单元在所述编码对象块相当于以子图片为单位对总区域图像进行分割而成的块的情况下,生成复用了所述提示信息的子图片单位的比特流,然后,汇总与总区域图像相应的所述子图片单位的比特流,输出作为总区域图像的比特流的总区域流。
11.一种动态图像流传输系统,具备:
权利要求10所述的动态图像编码装置;
复用传输装置,其将从所述动态图像编码装置输出的总区域流和表示所述总区域图像中的子图片的分割状态以及所述总区域流所包含的子图片单位的比特流的数据位置的子图片信息复用到预先设定的传输格式的复用信号中,传输所述复用信号;以及
复用分离装置,其接收由所述复用传输装置传输的复用信号,分离所述复用信号所包含的所述总区域流和所述子图片信息,参照所述子图片信息和表示作为解码对象的子图片的显示区域信息,从所述总区域流中提取作为解码对象的子图片的比特流。
12.一种动态图像流传输系统,其具备:
权利要求10所述的动态图像编码装置;
复用传输装置,其参照表示所述总区域图像中的子图片的分割状态以及所述总区域流所包含的子图片单位的比特流的数据位置的子图片信息,从由所述动态图像编码装置输出的总区域流中提取作为解码对象的子图片的比特流,将作为所述解码对象的子图片的比特流复用到预先设定的传输格式的复用信号中,传输所述复用信号;以及
复用分离装置,其接收由所述复用传输装置传输的复用信号,分离在所述复用信号中包含的作为所述解码对象的子图片的比特流。
13.根据权利要求12所述的动态图像流传输系统,其特征在于,
所述复用传输装置从对作为所述解码对象的子图片的比特流进行解码的动态图像解码装置中取得所述显示区域信息。
CN201480048963.7A 2013-09-06 2014-09-05 动态图像编码装置、动态图像转码装置、动态图像编码方法、动态图像转码方法以及动态图像流传输系统 Pending CN105519117A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2013185196 2013-09-06
JP2013-185196 2013-09-06
PCT/JP2014/073532 WO2015034061A1 (ja) 2013-09-06 2014-09-05 動画像符号化装置、動画像トランスコード装置、動画像符号化方法、動画像トランスコード方法及び動画像ストリーム伝送システム

Publications (1)

Publication Number Publication Date
CN105519117A true CN105519117A (zh) 2016-04-20

Family

ID=52628522

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480048963.7A Pending CN105519117A (zh) 2013-09-06 2014-09-05 动态图像编码装置、动态图像转码装置、动态图像编码方法、动态图像转码方法以及动态图像流传输系统

Country Status (6)

Country Link
US (1) US20160234523A1 (zh)
EP (1) EP3043560A4 (zh)
JP (1) JPWO2015034061A1 (zh)
KR (1) KR20160054530A (zh)
CN (1) CN105519117A (zh)
WO (1) WO2015034061A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6421422B2 (ja) * 2014-03-05 2018-11-14 日本電気株式会社 映像解析装置、監視装置、監視システムおよび映像解析方法
WO2016110943A1 (ja) * 2015-01-06 2016-07-14 日立マクセル株式会社 映像表示装置、映像表示方法、及び映像表示システム
CN106162167B (zh) * 2015-03-26 2019-05-17 中国科学院深圳先进技术研究院 基于学习的高效视频编码方法
US11025942B2 (en) 2018-02-08 2021-06-01 Samsung Electronics Co., Ltd. Progressive compressed domain computer vision and deep learning systems
WO2021054811A1 (ko) * 2019-09-20 2021-03-25 한국전자통신연구원 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
EP4088463A4 (en) 2020-02-14 2023-05-10 Beijing Bytedance Network Technology Co., Ltd. USING GENERAL STRESS INDICATORS IN VIDEO BITSTREAMS
US11533499B2 (en) 2020-03-31 2022-12-20 Tencent America LLC Method for signaling mixed NAL unit type and subpicture partitioning in coded video stream

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001069936A2 (en) * 2000-03-13 2001-09-20 Sony Corporation Method and apparatus for generating compact transcoding hints metadata
CN101453642A (zh) * 2007-11-30 2009-06-10 华为技术有限公司 图像编/解码方法、装置和系统
US20120163452A1 (en) * 2010-12-28 2012-06-28 Ebrisk Video Inc. Method and system for selectively breaking prediction in video coding
US20120307904A1 (en) * 2011-06-04 2012-12-06 Apple Inc. Partial frame utilization in video codecs
WO2013001730A1 (ja) * 2011-06-30 2013-01-03 三菱電機株式会社 画像符号化装置、画像復号装置、画像符号化方法および画像復号方法
US20130077681A1 (en) * 2011-09-23 2013-03-28 Ying Chen Reference picture signaling and decoded picture buffer management
US20130215016A1 (en) * 2010-11-01 2013-08-22 Nec Corporation Dynamic image distribution system, dynamic image distribution method and dynamic image distribution program

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG116400A1 (en) * 1997-10-24 2005-11-28 Matsushita Electric Ind Co Ltd A method for computational graceful degradation inan audiovisual compression system.
JP4622121B2 (ja) * 2000-03-13 2011-02-02 ソニー株式会社 データ変換装置および方法、並びに、符号化装置および方法
JP2002152749A (ja) * 2000-11-09 2002-05-24 Matsushita Electric Ind Co Ltd 画像再符号化装置
JP2005341093A (ja) * 2004-05-26 2005-12-08 Mitsubishi Electric Corp コンテンツ適応化装置、コンテンツ適応化システム、コンテンツ適応化方法
JP4534935B2 (ja) * 2005-10-04 2010-09-01 株式会社日立製作所 トランスコーダ、記録装置及びトランスコード方法
JP5055078B2 (ja) * 2007-10-01 2012-10-24 キヤノン株式会社 画像処理装置及びその方法
US8270473B2 (en) * 2009-06-12 2012-09-18 Microsoft Corporation Motion based dynamic resolution multiple bit rate video encoding
UA109312C2 (uk) * 2011-03-04 2015-08-10 Імпульсно-кодова модуляція з квантуванням при кодуванні відеоінформації
JP5678807B2 (ja) * 2011-06-09 2015-03-04 富士通セミコンダクター株式会社 映像・音声データ処理装置およびデータ多重化方法
US10244246B2 (en) * 2012-02-02 2019-03-26 Texas Instruments Incorporated Sub-pictures for pixel rate balancing on multi-core platforms
JP5197864B2 (ja) * 2012-04-12 2013-05-15 株式会社東芝 画像復号化方法及び装置
WO2014057131A1 (en) * 2012-10-12 2014-04-17 Canon Kabushiki Kaisha Method and corresponding device for streaming video data
US10021414B2 (en) * 2013-01-04 2018-07-10 Qualcomm Incorporated Bitstream constraints and motion vector restriction for inter-view or inter-layer reference pictures
CN106233745B (zh) * 2013-07-29 2021-01-15 皇家Kpn公司 向客户端提供瓦片视频流

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001069936A2 (en) * 2000-03-13 2001-09-20 Sony Corporation Method and apparatus for generating compact transcoding hints metadata
CN101453642A (zh) * 2007-11-30 2009-06-10 华为技术有限公司 图像编/解码方法、装置和系统
US20130215016A1 (en) * 2010-11-01 2013-08-22 Nec Corporation Dynamic image distribution system, dynamic image distribution method and dynamic image distribution program
US20120163452A1 (en) * 2010-12-28 2012-06-28 Ebrisk Video Inc. Method and system for selectively breaking prediction in video coding
US20120307904A1 (en) * 2011-06-04 2012-12-06 Apple Inc. Partial frame utilization in video codecs
WO2013001730A1 (ja) * 2011-06-30 2013-01-03 三菱電機株式会社 画像符号化装置、画像復号装置、画像符号化方法および画像復号方法
US20130077681A1 (en) * 2011-09-23 2013-03-28 Ying Chen Reference picture signaling and decoded picture buffer management

Also Published As

Publication number Publication date
KR20160054530A (ko) 2016-05-16
WO2015034061A1 (ja) 2015-03-12
US20160234523A1 (en) 2016-08-11
JPWO2015034061A1 (ja) 2017-03-02
EP3043560A1 (en) 2016-07-13
EP3043560A4 (en) 2017-03-01

Similar Documents

Publication Publication Date Title
CN105519117A (zh) 动态图像编码装置、动态图像转码装置、动态图像编码方法、动态图像转码方法以及动态图像流传输系统
CN100581232C (zh) 用于在视频序列中对运动进行编码的方法
CN104885471B (zh) 用于下一代视频的编码/未编码的数据的内容自适应熵编码
CN103118252B (zh) 运动图像编码装置以及运动图像译码装置
CN102835111B (zh) 使用先前块的运动矢量作为当前块的运动矢量来对图像进行编码/解码的方法和设备
CN103339940B (zh) 运动图像编码方法以及运动图像解码方法
CN107277524B (zh) 视频解码设备以及视频解码方法
CN104620576A (zh) 可缩放视频译码中的替代变换
CN103155563A (zh) 通过使用块合并对视频进行编码的方法和设备以及通过使用块合并对视频进行解码的方法和设备
CN103313052A (zh) 用于对运动矢量进行编码/解码的方法和设备
CN104025591A (zh) 运动图像编码装置、运动图像解码装置、运动图像编码方法以及运动图像解码方法
CN101584219A (zh) 基于帧内预测进行编码和解码的方法和设备
CN105791834A (zh) 图像解码装置和图像解码方法
JP2007116351A (ja) 画像予測符号化装置、画像予測復号装置、画像予測符号化方法、画像予測復号方法、画像予測符号化プログラム、及び画像予測復号プログラム
CN102273080A (zh) 在dct系数编码模式之间切换
CN103782595A (zh) 通过使用用于统一参考可能性的检查处理的帧内预测的视频编码方法、视频解码方法及其装置
JP2018113702A (ja) 画像符号化装置、動画像符号化方法、動画像復号装置、動画像復号方法、動画像符号化データ及び記録媒体
CN103210646A (zh) 通过有效选择帧内预测模式组来对图像编码/解码的方法和装置
CN101663895B (zh) 使用所估计译码成本的视频译码模式选择
CN103416062A (zh) 能够执行双向预测和单向预测的视频预测方法及其装置、视频编码方法及其装置以及视频解码方法及其装置
CN101584220B (zh) 对视频信号进行编码的方法和系统、编码的视频信号、对视频信号进行解码的方法和系统
CN107005710B (zh) 多视点图像编码/解码方法和装置
CN107079159B (zh) 基于多核系统的并行视频解码的方法和设备
CN100411444C (zh) 用于视频数据的空间预测编码和/或解码的方法和设备
CN105025298A (zh) 对图像进行编码/解码的方法和设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160420

WD01 Invention patent application deemed withdrawn after publication