JP2017192157A - ビデオデータの再生状態識別のためのビデオデータの多重化方法及び装置、逆多重化方法及び装置 - Google Patents

ビデオデータの再生状態識別のためのビデオデータの多重化方法及び装置、逆多重化方法及び装置 Download PDF

Info

Publication number
JP2017192157A
JP2017192157A JP2017145227A JP2017145227A JP2017192157A JP 2017192157 A JP2017192157 A JP 2017192157A JP 2017145227 A JP2017145227 A JP 2017145227A JP 2017145227 A JP2017145227 A JP 2017145227A JP 2017192157 A JP2017192157 A JP 2017192157A
Authority
JP
Japan
Prior art keywords
unit
picture
coding
depth
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017145227A
Other languages
English (en)
Other versions
JP6486421B2 (ja
Inventor
パク,ヨン−ホ
Young-O Park
チェー,クァン−ピョ
Kwang-Pyo Choi
キム,チャン−ヨル
Chan-Yul Kim
ヤン,ヒ−チョル
Hee-Chul Yang
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2017192157A publication Critical patent/JP2017192157A/ja
Application granted granted Critical
Publication of JP6486421B2 publication Critical patent/JP6486421B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/188Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/423Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
    • H04N19/426Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements using memory downsizing methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
    • H04N21/2387Stream processing in response to a playback request from an end-user, e.g. for trick-play
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/426Internal components of the client ; Characteristics thereof
    • H04N21/42607Internal components of the client ; Characteristics thereof for processing the incoming bitstream
    • H04N21/42623Internal components of the client ; Characteristics thereof for processing the incoming bitstream involving specific decryption arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server
    • H04N21/6587Control parameters, e.g. trick play commands, viewpoint selection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8455Structuring of content, e.g. decomposing content into time segments involving pointers to the content, e.g. pointers to the I-frames of the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/24Systems for the transmission of television signals using pulse code modulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Signal Processing For Recording (AREA)
  • Time-Division Multiplex Systems (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

【課題】 ビデオ復号化装置を開示する。【解決手段】 ビデオ復号化装置は、受信したNAL単位データのヘッダから前記NAL単位データに含まれた現在ピクチャの類型を指すNAL単位類型情報及び現在ピクチャがランダムアクセスまたは一般再生によって再生されるか否かを示すランダムアクセスフラグを獲得する逆多重化部と、前記類型情報及び前記ランダムアクセスフラグが、前記現在ピクチャが一般再生に用いられるCRAピクチャであることを示す場合、復号化順序が現在ピクチャよりも以後であり、ディスプレイ順序上、現在ピクチャよりも先行するリーディングピクチャを復号化し、前記類型情報及び前記ランダムアクセスフラグが、前記現在ピクチャがランダムアクセスに用いられるCRAピクチャを示す場合、前記リーディングピクチャを復号化することを省略(skip)する復号化部を含み、前記現在ピクチャは、複数の最大符号化単位に分割される。【選択図】 図19

Description

本発明は、ビデオの符号化、復号化方法及び装置に係り、さらに詳細には、復号化側で再生されるイントラピクチャーがランダムアクセスまたは一般再生のうちいかなる再生状態であるかを識別できるように、ビデオデータを多重化/逆多重化する方法及び装置に関する。
ITU−T H.261、ISO/IEC MPEG−1 Visual、ITU−T H.262(ISO/IEC MPEG−2 Visual)、ITU−T H.264、ISO/IEC MPEG−4Visual及びITU−T H.264(ISO/IEC MPEG−4AVC)のようなビデオコーデックでは、インター予測またはイントラ予測を通じてマクロブロックを予測符号化し、符号化された映像データを各ビデオコーデックで規定された所定フォーマットによって、ビットストリームを生成して出力する。
本発明が解決しようとする技術的課題は、ランダムアクセス再生のための新たな類型のイントラピクチャーを定義する一方、復号化装置に関するハードウェアまたはソフトウェア側面で、一般再生状態とランダムアクセスによる再生状態とを識別可能にすることである。
本発明の実施形態は、所定伝送データに含まれたシンタックスを通じてイントラピクチャーの再生状態を識別可能にする。
本発明の実施形態によれば、復号化装置に関するハードウェアまたはソフトウェア側面で、一般再生状態とランダムアクセスによる再生状態とを識別できるので、復号化の不要なピクチャーの復号化にかかるシステム資源が省ける。
本発明の一実施形態によるビデオ符号化装置のブロック図である。 本発明の一実施形態によるビデオ復号化装置のブロック図である。 本発明の一実施形態による符号化単位の概念を示す図面である。 本発明の一実施形態による符号化単位に基づいた映像符号化部のブロック図である。 本発明の一実施形態による符号化単位に基づいた映像復号化部のブロック図である。 本発明の一実施形態による深度別符号化単位及びパーティションを示す図面である。 本発明の一実施形態による符号化単位及び変換単位の関係を示す図面である。 本発明の一実施形態による深度別符号化情報を示す図面である。 本発明の一実施形態による深度別符号化単位を示す図面である。 本発明の一実施形態による符号化単位の関係を示す図面である。 本発明の一実施形態による予測単位の関係を示す図面である。 本発明の一実施形態による周波数変換単位の関係を示す図面である。 表1の符号化モード情報による符号化単位、予測単位及び変換単位の関係を示す図面である。 本発明の一実施形態による、一般再生時のCRA(Clean Random Access)ピクチャーの復号化過程を説明するための図面である。 本発明の一実施形態による、ランダムアクセス時のCRAピクチャーの復号化過程を説明するための図面である。 本発明の一実施形態によるビデオデータ多重化装置の構成を示す図面である。 本発明の一実施形態によるNAL(Network Abstraction Layer)単位の構成を示す図面である。 本発明の他の実施形態による、一般再生時のCRAピクチャーの復号化過程を説明するための図面である。 本発明の他の実施形態による、ランダムアクセス時のCRAピクチャーの復号化過程を説明するための図面である。 本発明の一実施形態によるビデオデータの多重化方法を示すフローチャートである。 本発明の一実施形態によるビデオデータ逆多重化装置の構成を示す図面である。 本発明の一実施形態によるビデオデータの逆多重化方法を示すフローチャートである。
本発明の一実施形態によるビデオデータの多重化方法は、階層的構造のデータ単位に基づいて前記ビデオデータを構成するピクチャーを符号化する段階と、復号化装置から前記符号化されたデータの伝送要請がある場合、前記伝送要請が一般再生による要請であるか、あるいはランダムアクセスのための要請であるかを判断する段階と、ランダムアクセスに用いられるイントラピクチャーとして、前記イントラピクチャーより表示順序上先立つものの、符号化順序上、前記イントラピクチャー以後に符号化されるリーディング(leading)ピクチャーを持つイントラピクチャーを多重化した伝送単位データに、前記判断結果によって、前記イントラピクチャーが、一般再生による要請とランダムアクセスのための要請のうちいかなる要請に応じて提供されるイントラピクチャーであるかを示す所定のシンタックスを付加する段階と、を含むことを特徴とする。
本発明の一実施形態によるビデオデータの多重化装置は、階層的構造のデータ単位に基づいて前記ビデオデータを構成するピクチャーを符号化するビデオ符号化部と、復号化装置から前記符号化されたデータの伝送要請がある場合、前記伝送要請が一般再生による要請であるか、あるいはランダムアクセスのための要請であるかを判断する再生状態識別部と、ランダムアクセスに用いられるイントラピクチャーとして、前記イントラピクチャーより表示順序上先立つものの、符号化順序上、前記イントラピクチャー以後に符号化されるリーディングピクチャーを持つイントラピクチャーを多重化した伝送単位データに、前記判断結果によって、前記イントラピクチャーが、一般再生による要請とランダムアクセスのための要請のうちいかなる要請に応じて提供されるイントラピクチャーであるかを示す所定のシンタックスを付加する多重化部と、を備えることを特徴とする。
本発明の一実施形態によるビデオデータの逆多重化方法は、階層的構造のデータ単位に基づいて、前記ビデオデータを構成するピクチャーを符号化したビットストリームを多重化した伝送単位データを受信する段階と、前記伝送単位データのうちランダムアクセスに用いられるイントラピクチャーとして、前記イントラピクチャーより表示順序上先立つものの、復号化順序上、前記イントラピクチャー以後に復号化されるリーディングピクチャーを持つイントラピクチャーを多重化した伝送単位データから、前記イントラピクチャーが、一般再生状態によって復号化されたものであるか、またはランダムアクセス状態によって復号化されたものであるかを示す所定のシンタックスを獲得する段階と、前記獲得されたシンタックスに基づいて、前記イントラピクチャーが、一般再生されるピクチャーであるか、あるいはランダムアクセスピクチャーであるかを識別する段階と、を含むことを特徴とする。
本発明の一実施形態によるビデオデータの逆多重化装置は、階層的構造のデータ単位に基づいて、前記ビデオデータを構成するピクチャーを符号化したビットストリームを多重化した伝送単位データを受信し、前記伝送単位データのうち、ランダムアクセスに用いられるイントラピクチャーとして、前記イントラピクチャーより表示順序上先立つものの、復号化順序上、前記イントラピクチャー以後に復号化されるリーディングピクチャーを持つイントラピクチャーを多重化した伝送単位データから、前記イントラピクチャーが、一般再生状態によって復号化されたものであるか、またはランダムアクセス状態によって復号化されたものであるかを示す所定のシンタックスを獲得する逆多重化部と、前記獲得されたシンタックスに基づいて、前記イントラピクチャーが一般再生されるピクチャーであるか、あるいはランダムアクセスピクチャーであるかを識別する再生状態識別部と、を備えることを特徴とする。
以下、添付した図面を参照して本発明の望ましい実施形態について具体的に説明する。本発明を説明するにあたって映像は、静止画、動画を含み、ビデオとも称される。また、本発明を説明するにあたって映像フレームは、ピクチャーとも称される。
図1は、本発明の一実施形態によるビデオ符号化装置のブロック図を示す。
一実施形態によるビデオ符号化装置100は、最大符号化単位分割部110、符号化単位決定部120及び出力部130を備える。
最大符号化単位分割部110は、映像の現在ピクチャーのための最大サイズの符号化単位である最大符号化単位に基づいて現在ピクチャーを区切る。現在ピクチャーが最大符号化単位より大きければ、現在ピクチャーの映像データは、少なくとも1つの最大符号化単位に分割される。一実施形態による最大符号化単位は、サイズ32×32、64×64、128×128、256×256などのデータ単位であり、横及び縦サイズが8より大きい2の二乗である正方形のデータ単位である。映像データは、少なくとも1つの最大符号化単位別に符号化単位決定部120に出力される。
一実施形態による符号化単位は、最大サイズ及び深度に特徴づけられる。深度とは、最大符号化単位から符号化単位が空間的に分割された回数を示し、深度が深くなるほど深度別符号化単位は、最大符号化単位から最小符号化単位まで分割される。最大符号化単位の深度が最上位深度と、最小符号化単位が最下位符号化単位と定義される。最大符号化単位は、深度が深くなるにつれて深度別符号化単位のサイズは縮小するので、上位深度の符号化単位は、複数の下位深度の符号化単位を含む。
前述したように符号化単位の最大サイズによって、現在ピクチャーの映像データを最大符号化単位に分割し、それぞれの最大符号化単位は、深度別に分割される符号化単位を含む。一実施形態による最大符号化単位は深度別に分割されるので、最大符号化単位に含まれた空間領域(spatial domain)の映像データが深度によって階層的に分類される。
最大符号化単位の高さ及び幅を階層的に分割できる総回数を制限する最大深度及び符号化単位の最大サイズは、予め定されている。
符号化単位決定部120は、深度ごとに最大符号化単位の領域が分割された少なくとも1つの分割領域を符号化して、少なくとも1つの分割領域別に最終符号化結果が出力される深度を定める。すなわち、符号化単位決定部120は、現在ピクチャーの最大符号化単位ごとに深度別符号化単位で映像データを符号化し、最小符号化誤差が発生する深度を選択して符号化深度と定める。定められた符号化深度及び最大符号化単位別映像データは、出力部130に出力される。
最大符号化単位内の映像データは、最大深度以下の少なくとも1つの深度によって深度別符号化単位に基づいて符号化され、それぞれの深度別符号化単位に基づいた符号化結果が比較される。深度別符号化単位の符号化誤差の比較結果、符号化誤差の最も小さな深度が選択される。それぞれの最大化符号化単位ごとに少なくとも1つの符号化深度が定められる。
最大符号化単位のサイズは、深度が深くなるにつれて符号化単位が階層的に分割されることで、符号化単位の数は増加する。また、1つの最大符号化単位に含まれる同一深度の符号化単位であっても、それぞれのデータに対する符号化誤差を測定して下位深度への分割如何が定められる。よって、1つの最大符号化単位に含まれるデータであっても、位置によって深度別符号化誤差が異なるため、位置によって符号化深度が異なって定められる。よって、1つの最大符号化単位に対して符号化深度が1つ以上設定され、最大符号化単などのデータは、1つ以上の符号化深度の符号化単位によって区切られる。
したがって、一実施形態による符号化単位決定部120は、現在最大符号化単位に含まれるツリー構造による符号化単位が定められる。一実施形態による‘ツリー構造による符号化単位’は、現在最大符号化単位に含まれるすべての深度別符号化単位のうち、符号化深度と定められた深度の符号化単位を含む。符号化深度の符号化単位は、最大符号化単位内で同一領域では深度によって階層的に定められ、他の領域に対しては独立して定められる。同様に、現在領域に対する符号化深度は、他の領域に対する符号化深度と独立して定められる。
一実施形態による最大深度は、最大符号化単位から最小符号化単位までの分割回数に関する指標である。一実施形態による第1最大深度は、最大符号化単位から最小符号化単位までのすべて分割回数を示す。一実施形態による第2最大深度は、最大符号化単位から最小符号化単位までの深度レベルの総数を示す。例えば、最大符号化単位の深度が0であれば、最大符号化単位が1回分割された符号化単位の深度は1に設定され、2回分割された符号化単位の深度が2に設定される。この場合、最大符号化単位から4回分割された符号化単位が最小符号化単位ならば、深度0、1、2、3、4の深度レベルが存在するため、第1最大深度は4、第2最大深度は5に設定される。
最大符号化単位の予測符号化及び周波数変換が行われる。予測符号化及び周波数変換も同様に、最大符号化単位ごとに、最大深度以下の深度ごとに深度別符号化単位に基づいて行われる。
最大符号化単位が深度別に分割される度に深度別符号化単位の数が増加するので、深度が深くなるにつれて生成されるすべての深度別符号化単位に対して、予測符号化及び周波数変換を含む符号化が行われねばならない。以下、説明の便宜のために、少なくとも1つの最大符号化単位のうち現在深度の符号化単位に基づいて予測符号化及び周波数変換を説明する。
一実施形態によるビデオ符号化装置100は、映像データの符号化のためのデータ単位のサイズまたは形態を多様に選択する。映像データの符号化のためには、予測符号化、周波数変換、エントロピー符号化などの段階を経るが、全段階にかけて同じデータ単位が使われてもよく、段階別にデータ単位が変わってもよい。
例えば、ビデオ符号化装置100は、映像データの符号化のための符号化単位だけではなく、符号化単位の映像データの予測符号化を行うために、符号化単位と異なるデータ単位を選択する。
最大符号化単位の予測符号化のためには、一実施形態による符号化深度の符号化単位、すなわち、これ以上分割されない符号化単位に基づいて予測符号化が行われる。以下、予測符号化の基盤になる、これ以上分割されない符号化単位を‘予測単位’と称する。予測単位が分割されたパーティションは、予測単位及び予測単位の高さ及び幅のうち少なくとも1つが分割されたデータ単位を含む。
例えば、サイズ2N×2N(但し、Nは正の定数)の符号化単位がこれ以上分割されない場合、サイズ2N×2Nの予測単位になり、パーティションのサイズは2N×2N、2N×N、N×2N、N×Nなどである。一実施形態によるパーティションタイプは、予測単位の高くまたは幅が対称的な割合で分割された対称的パーティションだけではなく、1:nまたはn:1のように非対称的な割合で分割されたパーティション、幾何学的な形態に分割されたパーティション、任意的形態のパーティションなども選択的に含む。
予測単位の予測モードは、イントラモード、インターモード及びスキップモードのうち少なくとも1つである。例えば、イントラモード及びインターモードは、2N×2N、2N×N、N×2N、N×Nサイズのパーティションに対して行われる。また、スキップモードは、2N×2Nサイズのパーティションのみに対して行われる。符号化単位以内の1つの予測単位ごとに独立して符号化が行われ、符号化誤差の最も小さな予測モードが選択される。
また、一実施形態によるビデオ符号化装置100は、映像データの符号化のための符号化単位だけではなく、符号化単位と異なるデータ単位に基づいて符号化単位の映像データの周波数変換を行う。
符号化単位の周波数変換のためには、符号化単位より小さいか、または同じサイズのデータ単位に基づいて周波数変換が行われる。例えば、周波数変換のためのデータ単位は、イントラモードのためのデータ単位及びインターモードのためのデータ単位を含む。
以下、周波数変換の基盤になるデータ単位は‘変換単位’と称される。符号化単位と類似した方式で、符号化単位内の変換単位も再帰的にさらに小さなサイズの変換単位に分割されつつ、符号化単位のレジデュアルデータが、変換深度によってツリー構造による変換単位によって区切られる。
一実施形態による変換単位に対しても、符号化単位の高さ及び幅が分割されて変換単位に至るまでの分割回数を示す変換深度が設定される。例えば、サイズ2N×2Nの現在符号化単位の変換単位のサイズが2N×2Nならば変換深度0、変換単位のサイズがN×Nならば変換深度1、変換単位のサイズがN/2×N/2ならば変換深度2に設定される。すなわち、変換単位に対しても、変換深度によってツリー構造による変換単位が設定される。
符号化深度別符号化情報は、符号化深度だけではなく予測関連情報及び周波数変換関連情報が必要である。よって、符号化単位決定部120は、最小符号化誤差を発生させた符号化深度だけではなく、予測単位をパーティションに分割したパーティションタイプ、予測単位別予測モード、周波数変換のための変換単位のサイズなどを定める。
一実施形態による最大符号化単位のツリー構造による符号化単位及びパーティションの決定方式については、図3ないし図12を参照して詳細に後述する。
符号化単位決定部120は、深度別符号化単位の符号化誤差をラグランジュ乗数(Lagrangian Multiplier)基盤の率−歪曲最適化技法(Rate−Distortion Optimization)を用いて測定する。
出力部130は、符号化単位決定部120で定められた少なくとも1つの符号化深度に基づいて符号化された最大符号化単位の映像データ、及び深度別符号化モードに関する情報をビットストリーム形態に出力する。
符号化された映像データは、映像のレジデュアルデータの符号化結果である。
深度別符号化モードに関する情報は、符号化深度情報、予測単位のパーティションタイプ情報、予測モード情報、変換単位のサイズ情報などを含む。
符号化深度情報は、現在深度に符号化せずに下位深度の符号化単位で符号化するかどうかを示す深度別分割情報を用いて定義される。現在符号化単位の現在深度が符号化深度ならば、現在符号化単位は現在深度の符号化単位で符号化されるので、現在深度の分割情報はこれ以上下位深度に分割されないように定義される。逆に、現在符号化単位の現在深度が符号化深度でなければ、下位深度の符号化単位を用いた符号化を試みる必要があるので、現在深度の分割情報は、下位深度の符号化単位に分割されるように定義される。
現在深度が符号化深度ではなければ、下位深度の符号化単位に分割された符号化単位について符号化が行われる。現在深度の符号化単位内に下位深度の符号化単位が1つ以上存在するので、それぞれの下位深度の符号化単位ごとに繰り返して符号化が行われ、同一深度の符号化単位ごとに再帰的符号化が行われる。
1つの最大符号化単位内にツリー構造の符号化単位が定められ、符号化深度の符号化単位ごとに少なくとも1つの符号化モードに関する情報が定められねばならないので、1つの最大符号化単位に対しては、少なくとも1つの符号化モードに関する情報が定められる。また、最大符号化単などのデータは、深度によって階層的に区切られて位置別に符号化深度が異なるため、データに対して符号化深度及び符号化モードに関する情報が設定される。
したがって、一実施形態による出力部130は、最大符号化単位に含まれている符号化単位、予測単位及び最小単位のうち少なくとも1つに対して、該符号化深度及び符号化モードに関する符号化情報を割り当てる。
一実施形態による最小単位は、最下位符号化深度である最小符号化単位が4分割されたサイズの正方形のデータ単位であり、最大符号化単位に含まれるすべての符号化単位、予測単位及び変換単位内に含まれる最大サイズの正方形のデータ単位である。
例えば、出力部130を通じて出力される符号化情報は、深度別符号化単位別符号化情報と予測単位別符号化情報とに分類される。深度別符号化単位別符号化情報は、予測モード情報、パーティションサイズ情報を含む。予測単位別に伝送される符号化情報は、インターモードの推定方向に関する情報、インターモードの参照映像インデックスに関する情報、動きベクトルに関する情報、イントラモードのクロマ成分に関する情報、イントラモードの補間方式に関する情報などを含む。また、ピクチャー、スライスまたはGOP(Group Of Picture)別に定義される符号化単位の最大サイズに関する情報及び最大深度に関する情報は、ビットストリームのヘッダに挿入される。
最大符号化単位分割部110及び符号化単位決定部120は、映像シーケンスの各映像フレームに対して符号化単位別に動き予測及び補償を行って映像シーケンスを構成する各映像フレームの参照フレームを定め、定められた参照フレームを用いて各映像フレームを符号化するビデオ符号化階層(Video Coding Layer)に該当する。
また、後述するように出力部130は、復号化器で映像フレームの復号化に必要なバッファの最大サイズを示すシンタックス(max_dec_frame buffering)、再整列の必要な映像フレームの数を示すシンタックス(num_reorder_frames)、及び映像シーケンスを構成する映像フレームのうち符号化順序と表示順序との差が最も大きい映像フレームの遅延(latency)情報を示すシンタックス(max_latency_increase)を、ネットワーク抽象階層(Network Abstraction Layer、以下‘NAL’という)単位でマッピングしてビットストリームを生成する。
ビデオ符号化装置100の最も簡単な形態の実施形態によれば、深度別符号化単位は、一階層上位深度の符号化単位の高さ及び幅を半分したサイズの符号化単位である。すなわち、現在深度の符号化単位のサイズが2N×2Nならば、下位深度の符号化単位のサイズはN×Nである。また、2N×2Nサイズの現在符号化単位は、N×Nサイズの下位深度符号化単位を最大4個含む。
したがって、一実施形態によるビデオ符号化装置100は、現在ピクチャーの特性を考慮して定められた最大符号化単位のサイズ及び最大深度に基づいて、それぞれの最大符号化単位ごとに最適の形態及びサイズの符号化単位を定め、ツリー構造による符号化単位を構成する。また、それぞれの最大符号化単位ごとに多様な予測モード、周波数変換方式などで符号化できるので、多様な映像サイズの符号化単位の映像特性を考慮して最適の符号化モードが定められる。
したがって、映像の解像度が非常に高いか、またはデータ量の非常に大きい映像を既存マクロブロック単位で符号化したならば、ピクチャーだマクロブロックの数が過度に多くなる。これによって、マクロブロックごとに生成される圧縮情報も多くなるので、圧縮情報の伝送負担が大きくなり、データ圧縮効率が低減する。よって、一実施形態によるビデオ符号化装置は、映像のサイズを考慮して符号化単位の最大サイズを増大させつつ、映像特性を考慮して符号化単位を調節できるので、映像圧縮効率が向上する。
図2は、本発明の一実施形態によるビデオ復号化装置のブロック図を示す。一実施形態によるビデオ復号化装置200は、受信部210、映像データ及び符号化情報抽出部220及び映像データ復号化部230を備える。一実施形態によるビデオ復号化装置200の各種プロセッシングのための符号化単位、深度、予測単位、変換単位、各種符号化モードに関する情報など各種用語の定義は、図1及びビデオ符号化装置100を参照して前述した通りである。
受信部210は、符号化されたビデオについてのビットストリームを受信してパージングする。映像データ及び符号化情報抽出部220は、パージングされたビットストリームから、最大符号化単位別にツリー構造による符号化単位によって、符号化単位ごとに符号化された映像データを抽出して映像データ復号化部230に出力する。映像データ及び符号化情報抽出部220は、現在ピクチャーについてのヘッダから現在ピクチャーの符号化単位の最大サイズに関する情報を抽出する。
また、映像データ及び符号化情報抽出部220は、パージングされたビットストリームから、最大符号化単位別にツリー構造による符号化単位についての符号化深度及び符号化モードに関する情報を抽出する。抽出された符号化深度及び符号化モードに関する情報は、映像データ復号化部230に出力される。すなわち、ビット列の映像データを最大符号化単位に分割して、映像データ復号化部230が最大符号化単位ごとに映像データを復号化可能にする。
最大符号化単位別符号化深度及び符号化モードに関する情報は、1つ以上の符号化深度情報について設定され、符号化深度別符号化モードに関する情報は、該符号化単位のパーティションタイプ情報、予測モード情報及び変換単位のサイズ情報などを含む。また、符号化深度情報として、深度別分割情報が抽出されることもある。
映像データ及び符号化情報抽出部220が抽出した最大符号化単位別符号化深度及び符号化モードに関する情報は、一実施形態によるビデオ符号化装置100のように、符号化端で、最大符号化単位別深度別符号化単位ごとに繰り返して符号化を行って最小符号化誤差を発生させることで定められた符号化深度及び符号化モードに関する情報である。よって、ビデオ復号化装置200は、最小符号化誤差を発生させる符号化方式によってデータを復号化し、映像を復元する。
一実施形態による符号化深度及び符号化モードに関する符号化情報は、該符号化単位、予測単位及び最小単位のうち所定データ単位について割り当てられるので、映像データ及び符号化情報抽出部220は、所定データ単位別に符号化深度及び符号化モードに関する情報を抽出する。所定データ単位別に、該最大符号化単位の符号化深度及び符号化モードに関する情報が記録されているならば、同じ符号化深度及び符号化モードに関する情報を持っている所定データ単位は、同じ最大符号化単位に含まれるデータ単位と類推される。
映像データ復号化部230は、最大符号化単位別符号化深度及び符号化モードに関する情報に基づいて、それぞれの最大符号化単位の映像データを復号化して現在ピクチャーを復元する。すなわち、映像データ復号化部230は、最大符号化単位に含まれるツリー構造による符号化単位のうちそれぞれの符号化単位ごとに、読み取られたパーティションタイプ、予測モード、変換単位に基づいて符号化された映像データを復号化する。復号化過程は、イントラ予測及び動き補償を含む予測過程、及び周波数逆変換過程を含む。
映像データ復号化部230は、符号化深度別符号化単位の予測単位のパーティションタイプ情報及び予測モード情報に基づいて、符号化単位ごとにそれぞれのパーティション及び予測モードによってイントラ予測または動き補償を行う。
また、映像データ復号化部230は、最大符号化単位別周波数逆変換のために、符号化深度別符号化単位の変換単位のサイズ情報に基づいて、符号化単位ごとにそれぞれの変換単位によって周波数逆変換を行う。
映像データ復号化部230は、深度別分割情報を用いて現在最大符号化単位の符号化深度を定める。もし、分割情報が現在深度でこれ以上分割されないことを示すならば、現在深度が符号化深度である。よって、映像データ復号化部230は、現在最大符号化単位の映像データについて現在深度の符号化単位を、予測単位のパーティションタイプ、予測モード及び変換単位サイズ情報を用いて復号化する。
すなわち、符号化単位、予測単位及び最小単位のうち所定データ単位について設定されている符号化情報を観察し、等しい分割情報を含む符号化情報を保有しているデータ単位を集めて、映像データ復号化部230によって同じ符号化モードで復号化する1つのデータ単位と見なす。
また、受信部210及び映像データ及び符号化情報抽出部220は、復号化器で映像フレームの復号化に必要なバッファの最大サイズを示すシンタックス(max_dec_framebuffering)、再整列の必要な映像フレームの数を示すシンタックス(num_reorder_frames)、及び映像シーケンスを構成する映像フレームのうち復号化順序と表示順序との差が最も大きい映像フレームの遅延情報を示すシンタックス(max_latency_increase)をビットストリームから獲得して、映像データ復号化部230に出力するNALでの復号化過程を行う。
一実施形態によるビデオ復号化装置200は、符号化過程で最大符号化単位ごとに再帰的に符号化を行って最小符号化誤差を発生させた符号化単位に関する情報を獲得し、現在ピクチャーについての復号化に用いる。すなわち、最大符号化単位ごとに最適符号化単位と定められたツリー構造による符号化単位の符号化された映像データの復号化が可能になる。
したがって、高い解像度の映像またはデータ量が過度に多い映像であっても、符号化端から伝送された最適符号化モードに関する情報を用いて、映像の特性に適応的に定められた符号化単位のサイズ及び符号化モードによって、効率的に映像データを復号化して復元する。
以下、図3ないし図13を参照して本発明の一実施形態によるツリー構造による符号化単位、予測単位及び変換単位の決定方式を詳細に説明する。
図3は、階層的符号化単位の概念を示す。
符号化単位の例は、符号化単位のサイズは幅×高さで表現され、サイズ64×64人符号化単位から32×32、16×16、8×8を含む。サイズ64×64の符号化単位は、サイズ64×64、64×32、32×64、32×32のパーティションに分割され、サイズ32×32の符号化単位は、サイズ32×32、32×16、16×32、16×16のパーティションで、サイズ16×16の符号化単位は、サイズ16×16、16×8、8×16、8×8のパーティションに、サイズ8×8の符号化単位は、サイズ8×8、8×4、4×8、4×4のパーティションに分割される。
ビデオデータ310については、解像度は1920×1080、符号化単位の最大サイズは64、最大深度が2に設定されている。ビデオデータ320については、解像度は1920×1080、符号化単位の最大サイズは64、最大深度が3に設定されている。ビデオデータ330については、解像度は352×288、符号化単位の最大サイズは16、最大深度が1に設定されている。図3に示した最大深度は、最大符号化単位から最小符号化単位までの総分割回数を示す。
解像度が高いか、またはデータ量が多い場合、符号化効率の向上だけではなく映像特性を正確に反映するために符号化サイズの最大サイズが相対的に大きいことが望ましい。よって、ビデオデータ330に比べて解像度の高いビデオデータ310、320は、符号化サイズの最大サイズが64に選択される。
ビデオデータ310の最大深度は2であるので、ビデオデータ310の符号化単位315は、長軸サイズが64の最大符号化単位から、2回分割しつつ深度が2階層深くなって長軸サイズが32、16の符号化単位まで含む。一方、ビデオデータ330の最大深度は1であるので、ビデオデータ330の符号化単位335は、長軸サイズが16の符号化単位から、1回分割しつつ深度が1階層深くなって長軸サイズが8の符号化単位まで含む。
ビデオデータ320の最大深度は3であるので、ビデオデータ320の符号化単位325は、長軸サイズが64の最大符号化単位から、3回分割しつつ深度が3階層深くなって長軸サイズが32、16、8の符号化単位まで含む。深度が深くなるほど詳細情報の表現能力が向上する。
図4は、本発明の一実施形態による符号化単位に基づいた映像符号化部のブロック図を示す。一実施形態による映像符号化部400は、ビデオ符号化装置100の符号化単位決定部120で映像データの符号化時に経る作業を含む。すなわち、イントラ予測部410は、現在フレーム405のうちイントラモードの符号化単位についてイントラ予測を行い、動き推定部420及び動き補償部425は、インターモードの現在フレーム405及び参照フレーム495を用いてインタ推定及び動き補償を行う。
イントラ予測部410、動き推定部420及び動き補償部425から出力されたデータは周波数変換部430及び量子化部440を経て、量子化された変換係数に出力される。量子化された変換係数は、逆量子化部460、周波数逆変換部470を通じて空間領域のデータに復元され、復元された空間領域のデータは、デブロッキング部480及びループフィルタリング部490を経て後処理され、参照フレーム495に出力される。量子化された変換係数は、エントロピー符号化部450を通じてビットストリーム455に出力される。特に、エントロピー符号化部450は、復号化器で映像フレームの復号化に必要なバッファの最大サイズを示す最大復号フレームバッファリングシンタックス(max_dec_framebuffering)、再整列の必要な映像フレームの数を示す再整列フレーム数シンタックス(num_reorder_frames)、及び映像シーケンスを構成する映像フレームの符号化順序と表示順序との差値の最大値を示す最大遅延フレームシンタックス(MaxLatencyFrame)、または最大遅延フレームシンタックス(MaxLatencyFrame)を定めるための最大遅延増加シンタックス(max_latency_increase)をNAL単位でマッピングしてビットストリームを生成する。特に、本発明の一実施形態によるエントロピー符号化部450は、復号化器で映像フレームの復号化に必要なバッファの最大サイズを示す最大復号フレームバッファリングシンタックス(max_dec_framebuffering)、再整列の必要な映像フレームの数を示す再整列フレーム数シンタックス(num_reorder_frames)、及び最大遅延フレームシンタックス(MaxLatencyFrame)を定めるための最大遅延増加シンタックス(max_latency_increase)を、映像シーケンス全体の符号化に関する情報を含むヘッダ情報であるシーケンスパラメータセット(Sequence Parameter Set、以下‘SPS’という)に必須構成要素として含ませる。
一実施形態によるビデオ符号化装置100に適用されるためには、映像符号化部400の構成要素であるイントラ予測部410、動き推定部420、動き補償部425、周波数変換部430、量子化部440、エントロピー符号化部450、逆量子化部460、周波数逆変換部470、デブロッキング部480及びループフィルタリング部490がいずれも、最大符号化単位ごとに最大深度を考慮して、ツリー構造による符号化単位のうちそれぞれの符号化単位に基づいた作業を行わねばならない。
特に、イントラ予測部410、動き推定部420及び動き補償部425は、現在最大符号化単位の最大サイズ及び最大深度を考慮して、ツリー構造による符号化単位のうちそれぞれの符号化単位のパーティション及び予測モードを定め、周波数変換部430は、ツリー構造による符号化単位のうちそれぞれの符号化単位内の変換単位のサイズを定めねばならない。
図5は、本発明の一実施形態による符号化単位に基づいた映像復号化部のブロック図を示す。
ビットストリーム505がパージング部510を経て、復号化対象である符号化された映像データ及び復号化のために必要な符号化に関する情報がパージングされる。特に、パージング部510は、SPSに必須構成要素として含まれた映像フレームの復号化に必要なバッファの最大サイズを示す最大復号フレームバッファリングシンタックス(max_dec_framebuffering)、再整列の必要な映像フレームの数を示す再整列フレーム数シンタックス(num_reorder_frames)、及び最大遅延フレームシンタックス(MaxLatencyFrame)を定めるための最大遅延増加シンタックス(max_latency_increase)をビットストリームから獲得して、エントロピー復号化部520に出力する。図5では、パージング部510及びエントロピー復号化部520を別個の構成要素と示したが、パージング部510で行われる映像データの獲得、及び符号化された映像データに関する各シンタックス情報の獲得過程は、エントロピー復号化部520で行われるように具現されてもよい。
符号化された映像データは、エントロピー復号化部520及び逆量子化部530を経て逆量子化されたデータに出力され、周波数逆変換部540を経て空間領域の映像データが復元される。
空間領域の映像データについて、イントラ予測部550は、イントラモードの符号化単位についてイントラ予測を行い、動き補償部560は、参照フレーム585を共に用いてインターモードの符号化単位について動き補償を行う。
イントラ予測部550及び動き補償部560を経て復元された映像フレームデータは、デブロッキング部570を通じて後処理され、復号ピクチャーバッファであるDPB(Decoded Picture Buffer)580に出力される。DPB 580は、参照フレームの保存、映像フレームの表示順序の転換、及び映像フレームの出力のために復号化された映像フレームを保存する復号ピクチャーバッファである。DPB 580は、復号化された映像フレームを保存する一方、パージング部510またはエントロピー復号化部520から出力される映像フレームの正常な復号化に必要な最大バッファサイズを示す最大復号フレームバッファリングシンタックス(max_dec_framebuffering)を用いて、映像シーケンスの正常な復号化に必要なバッファの最大サイズを設定する。
また、DPB 580は、再整列の必要な映像フレームの数を示す再整列フレーム数シンタックス(num_reorder_frames)、及び最大遅延フレームシンタックス(MaxLatencyFrame)を定めるための最大遅延増加シンタックス(max_latency_increase)を用いて、先に復号化されて保存された参照映像フレームの出力如何を定める。具体的なDPB 580に保存された参照映像フレームの出力過程については、後述する。
ビデオ復号化装置200の映像データ復号化部230で映像データを復号化するため、一実施形態による映像復号化部500のパージング部510以後の段階別作業が行われる。
一実施形態によるビデオ復号化装置200に適用されるためには、映像復号化部500の構成要素であるパージング部510、エントロピー復号化部520、逆量子化部530、周波数逆変換部540、イントラ予測部550、動き補償部560、デ−ブルロックキングブ570はいずれも、最大符号化単位ごとにツリー構造による符号化単位に基づいて復号化作業を行う。特に、イントラ予測部550、動き補償部560は、ツリー構造による符号化単位それぞれごとにパーティション及び予測モードを定め、周波数逆変換部540は、符号化単位ごとに変換単位のサイズを定める。
図6は、本発明の一実施形態による深度別符号化単位及びパーティションを示す。
一実施形態によるビデオ符号化装置100及び一実施形態によるビデオ復号化装置200は、映像特性を考慮するために階層的な符号化単位を使う。符号化単位の最大高さ及び幅、最大深度は、映像の特性によって適応的に定められてもよく、ユーザのニーズに応じて多様に設定されてもよい。既定された符号化単位の最大サイズによって、深度別符号化単位のサイズが定められる。
一実施形態による符号化単位の階層構造600は、符号化単位の最大高さ及び幅が64、最大深度が4の場合を図示している。一実施形態による符号化単位の階層構造600の縦軸に沿って深度が深くなるので、深度別符号化単位の高さ及び幅をそれぞれ分割する。また、符号化単位の階層構造600の横軸に沿って、それぞれの深度別符号化単位の予測符号化の基盤になる予測単位及びパーティションが図示されている。
すなわち、符号化単位610は、符号化単位の階層構造600のうち最大符号化単位であり、深度が0であり、符号化単位のサイズ、すなわち、高さ及び幅が64×64である。縦軸に沿って深度が深くなり、サイズ32×32の深度1の符号化単位620、サイズ16×16の深度2の符号化単位630、サイズ8×8の深度3の符号化単位640、サイズ4×4の深度4の符号化単位650が存在する。サイズ4×4の深度4の符号化単位650は、最小符号化単位である。
それぞれの深度別に横軸に沿って、符号化単位の予測単位及びパーティションが配列される。すなわち、深度0のサイズ64×64の符号化単位610が予測単位ならば、予測単位は、サイズ64×64の符号化単位610に含まれるサイズ64×64のパーティション610、サイズ64×32のパーティション612、サイズ32×64のパーティション614、サイズ32×32のパーティション616に分割される。
同様に、深度1のサイズ32×32の符号化単位620の予測単位は、サイズ32×32の符号化単位620に含まれるサイズ32×32のパーティション620、サイズ32×16のパーティション622、サイズ16×32のパーティション624、サイズ16×16のパーティション626に分割される。
同様に、深度2のサイズ16×16の符号化単位630の予測単位は、サイズ16×16の符号化単位630に含まれるサイズ16×16のパーティション630、サイズ16×8のパーティション632、サイズ8×16のパーティション634、サイズ8×8のパーティション636に分割される。
同様に、深度3のサイズ8×8の符号化単位640の予測単位は、サイズ8×8の符号化単位640に含まれるサイズ8×8のパーティション640、サイズ8×4のパーティション642、サイズ4×8のパーティション644、サイズ4×4のパーティション646に分割される。
最後に、深度4のサイズ4×4の符号化単位650は、最小符号化単位かつ最下位深度の符号化単位であり、該予測単位もサイズ4×4のパーティション650のみで設定される。
一実施形態によるビデオ符号化装置100の符号化単位決定部120は、最大符号化単位610の符号化深度を定めるために、最大符号化単位610に含まれるそれぞれの深度の符号化単位ごとに符号化を行わねばならない。
同じ範囲及びサイズのデータを含むための深度別符号化単位の数は、深度が深くなるほど深度別符号化単位の数も増加する。例えば、深度1の符号化単位1つが含むデータについて、深度2の符号化単位は4つ必要である。よって、同じデータの符号化結果を深度別に比較するために、1つの深度1の符号化単位及び4つの深度2の符号化単位を用いてそれぞれ符号化されねばならない。
それぞれの深度別符号化のためには、符号化単位の階層構造600の横軸に沿って深度別符号化単位の予測単位ごとに符号化を行って、該深度で最も小さな符号化誤差である代表符号化誤差が選択される。また、符号化単位の階層構造600の縦軸に沿って深度が深くなり、それぞれの深度ごとに符号化を行って、深度別代表符号化誤差を比べて最小符号化誤差が検索される。最大符号化単位610のうち最小符号化誤差が発生する深度及びパーティションが、最大符号化単位610の符号化深度及びパーティションタイプと選択される。
図7は、本発明の一実施形態による符号化単位及び変換単位の関係を示す。
一実施形態によるビデオ符号化装置100または一実施形態によるビデオ復号化装置200は、最大符号化単位ごとに最大符号化単位より小さいか、または同じサイズの符号化単位で映像を符号化または復号化する。符号化過程中に周波数変換のための変換単位のサイズは、それぞれの符号化単位より大きくないデータ単位に基づいて選択される。
例えば、一実施形態によるビデオ符号化装置100または一実施形態によるビデオ復号化装置200で、現在符号化単位710が64×64サイズの時、32×32サイズの変換単位720を用いて周波数変換が行われる。
また、64×64サイズの符号化単位710のデータを、64×64サイズ以下の32×32、16×16、8×8、4×4サイズの変換単位でそれぞれ周波数変換を行って符号化した後、原本との誤差が最も少ない変換単位が選択される。
図8は、本発明の一実施形態によって深度別符号化情報を示す。
一実施形態によるビデオ符号化装置100の出力部130は、符号化モードに関する情報として、それぞれの符号化深度の符号化単位ごとにパーティションタイプに関する情報800、予測モードに関する情報810、変換単位サイズに関する情報820を符号化して伝送する。
パーティションタイプに関する情報800は、現在符号化単位の予測符号化のためのデータ単位として、現在符号化単位の予測単位が分割されたパーティションの形態に関する情報を示す。例えば、サイズ2N×2Nの現在符号化単位CU_0は、サイズ2N×2Nのパーティション802、サイズ2N×Nのパーティション804、サイズN×2Nのパーティション806、サイズN×Nのパーティション808のうちいずれか1つのタイプに分割されて用いられる。この場合、現在符号化単位のパーティションタイプに関する情報800は、サイズ2N×2Nのパーティション802、サイズ2N×Nのパーティション804、サイズN×2Nのパーティション806及びサイズN×Nのパーティション808のうち1つを示すように設定される。
予測モードに関する情報810は、それぞれのパーティションの予測モードを示す。例えば、予測モードに関する情報810を通じて、パーティションタイプに関する情報800が示すパーティションが、イントラモード812、インターモード814及びスキップモード816のうちいずれか1つで予測符号化が行われるかどうかが設定される。
また、変換単位サイズに関する情報820は、現在符号化単位をいかなる変換単位に基づいて周波数変換を行うかを示す。例えば、変換単位は、第1イントラ変換単位サイズ822、第2イントラ変換単位サイズ824、第1インタ変換単位サイズ826、第2イントラ変換単位サイズ828のうちいずれか1つである。
一実施形態によるビデオ復号化装置200の映像データ及び符号化情報抽出部210は、それぞれの深度別符号化単位ごとにパーティションタイプに関する情報800、予測モードに関する情報810、変換単位サイズに関する情報820を抽出して復号化に用いる。
図9は、本発明の一実施形態による深度別符号化単位を示す。
深度の変化を示すために分割情報が用いられる。分割情報は、現在深度の符号化単位が下位深度の符号化単位に分割されるかどうかを示す。
深度0及び2N_0×2N_0サイズの符号化単位900の予測符号化のための予測単位910は、2N_0×2N_0サイズのパーティションタイプ912、2N_0×N_0サイズのパーティションタイプ914、N_0×2N_0サイズのパーティションタイプ916、N_0×N_0サイズのパーティションタイプ918を含む。予測単位が対称的な割合で分割されたパーティション912、914、916、918のみ例示されているが、前述したように、パーティションタイプはこれに限定されず、非対称的パーティション、任意的形態のパーティション、幾何学的形態のパーティションなどを含む。
パーティションタイプごとに、1つの2N_0×2N_0サイズのパーティション、2つの2N_0×N_0サイズのパーティション、2つのN_0×2N_0サイズのパーティション、4つのN_0×N_0サイズのパーティションごとに繰り返して予測符号化が行われねばならない。サイズ2N_0×2N_0、サイズN_0×2N_0及びサイズ2N_0×N_0及びサイズN_0×N_0のパーティションについては、イントラモード及びインターモードで予測符号化が行われる。スキップモードはサイズ2N_0×2N_0のパーティションのみに予測符号化が行われる。
サイズ2N_0×2N_0、2N_0×N_0及びN_0×2N_0のパーティションタイプ912、914、916のうち1つによる符号化誤差が最も小さければ、これ以上下位深度に分割する必要がない。
サイズN_0×N_0のパーティションタイプ918による符号化誤差が最も小さければ、深度0を1に変更しつつ分割920し、深度2及びサイズN_0×N_0のパーティションタイプの符号化単位930について繰り返して符号化を行って、最小符号化誤差を検索する。
深度1及びサイズ2N_1×2N_1(=N_0×N_0)の符号化単位930の予測符号化のための予測単位940は、サイズ2N_1×2N_1のパーティションタイプ942、サイズ2N_1×N_1のパーティションタイプ944、サイズN_1×2N_1のパーティションタイプ946、サイズN_1×N_1のパーティションタイプ948を含む。
また、サイズN_1×N_1サイズのパーティションタイプ948による符号化誤差が最も小さければ、深度1を深度2に変更しつつ分割950し、深度2及びサイズN_2×N_2の符号化単位960について繰り返して符号化を行って最小符号化誤差を検索する。
最大深度がdの場合、深度別分割情報は深度d−1の時まで設定され、分割情報は深度d−2まで設定される。すなわち、深度d−2から分割970されて深度d−1まで符号化が行われる場合、深度d−1及びサイズ2N_(d−1)×2N_(d−1)の符号化単位980の予測符号化のための予測単位990は、サイズ2N_(d−1)×2N_(d−1)のパーティションタイプ992、サイズ2N_(d−1)×N_(d−1)のパーティションタイプ994、サイズN_(d−1)×2N_(d−1)のパーティションタイプ996、サイズN_(d−1)×N_(d−1)のパーティションタイプ998を含む。
パーティションタイプのうち、1つのサイズ2N_(d−1)×2N_(d−1)のパーティション、2つのサイズ2N_(d−1)×N_(d−1)のパーティション、2つのサイズN_(d−1)×2N_(d−1)のパーティション、4つのサイズN_(d−1)×N_(d−1)のパーティションごとに繰り返して予測符号化を通じる符号化が行われ、最小符号化誤差が発生するパーティションタイプが検索される。
サイズN_(d−1)×N_(d−1)のパーティションタイプ998による符号化誤差が最も小さいとしても、最大深度がdであるので、深度d−1の符号化単位CU_(d−1)は、これ以上下位深度への分割過程を経ず、現在最大符号化単位900についての符号化深度が深度d−1に定められ、パーティションタイプはN_(d−1)×N_(d−1)に定められる。また最大深度がdであるので、深度d−1の符号化単位952について分割情報は設定されない。
データ単位999は、現在最大符号化単位に対する‘最小単位’と称する。一実施形態による最小単位は、最下位符号化深度である最小符号化単位が4分割されたサイズの正方形のデータ単位である。このような繰り返しの符号化過程を通じて、一実施形態によるビデオ符号化装置100は、符号化単位900の深度別符号化誤差を比べて、最小符号化誤差の発生深度を選択して符号化深度を定め、該パーティションタイプ及び予測モードが符号化深度の符号化モードと設定される。
このような形で深度0、1、…、d−1、dのすべての深度別最小符号化誤差を比べて、誤差の最も小さな深度が選択されて符号化深度と定められる。符号化深度、及び予測単位のパーティションタイプ及び予測モードは、符号化モードに関する情報として符号化されて伝送される。また、深度0から符号化深度に至るまで符号化単位が分割されねばならないので、符号化深度の分割情報のみが‘0’と設定され、符号化深度を除いた深度別分割情報は‘1’と設定されねばならない。
一実施形態によるビデオ復号化装置200の映像データ及び符号化情報抽出部220は、符号化単位900についての符号化深度及び予測単位に関する情報を抽出して符号化単位912の復号化に用いる。一実施形態によるビデオ復号化装置200は、深度別分割情報を用いて分割情報が‘0’の深度を符号化深度と把握し、該深度についての符号化モードに関する情報を用いて復号化に用いる。
図10ないし図12は、本発明の一実施形態による符号化単位、予測単位及び周波数変換単位の関係を示す。
符号化単位1010は、最大符号化単位について一実施形態によるビデオ符号化装置100が定めた符号化深度別符号化単位である。予測単位1060は、符号化単位1010うちそれぞれの符号化深度別符号化単位の予測単位のパーティションであり、変換単位1070は、それぞれの符号化深度別符号化単位の変換単位である。
深度別符号化単位1010は、最大符号化単位の深度が0ならば、符号化単位1012、1054は深度が1、符号化単位1014、1016、1018、1028、1050、1052は深度が2、符号化単位1020、1022、1024、1026、1030、1032、1048は深度が3、符号化単位1040、1042、1044、1046は深度が4である。
予測単位1060のうち一部のパーティション1014、1016、1022、1032、1048、1050、1052、1054は、符号化単位が分割された形態である。すなわち、パーティション1014、1022、1050、1054は、2N×Nのパーティションタイプであり、パーティション1016、1048、1052は、N×2Nのパーティションタイプ、パーティション1032は、N×Nのパーティションタイプである。深度別符号化単位1010の予測単位及びパーティションは、それぞれの符号化単位より小さいか、または同一である。
変換単位1070のうち一部1052の映像データについては、符号化単位に比べて小さなサイズのデータ単位で周波数変換または周波数逆変換が行われる。また、変換単位1014、1016、1022、1032、1048、1050、1052、1054は、予測単位1060のうち該予測単位及びパーティションと比べれば、互いに異なるサイズまたは形態のデータ単位である。すなわち、一実施形態によるビデオ符号化装置100及び一実施形態によるビデオ復号化装置200は、同じ符号化単位についてのイントラ予測/動き推定/動き補償作業、及び周波数変換/逆変換作業であるといっても、それぞれ別個のデータ単位に基づいて行う。
これによって、最大符号化単位ごとに、領域別に階層的な構造の符号化単位ごとに再帰的に符号化が行われて最適符号化単位が定められることで、再帰的ツリー構造による符号化単位が構成される。符号化情報は、符号化単位に関する分割情報、パーティションタイプ情報、予測モード情報、変換単位サイズ情報を含む。以下、表1は、一実施形態によるビデオ符号化装置100及び一実施形態によるビデオ復号化装置200で設定できる一例を示す。
Figure 2017192157
一実施形態によるビデオ符号化装置100の出力部130は、ツリー構造による符号化単位についての符号化情報を出力し、一実施形態によるビデオ復号化装置200の符号化情報抽出部220は、受信されたビットストリームからツリー構造による符号化単位についての符号化情報を抽出する。
分割情報は、現在符号化単位が下位深度の符号化単位に分割されるかどうかを示す。現在深度dの分割情報が0ならば、現在符号化単位が下位符号化単位にこれ以上分割されない深度が符号化深度であるので、符号化深度についてパーティションタイプ情報、予測モード、変換単位サイズ情報が定義される。分割情報によって1段階さらに分割されねばならない場合には、分割された4つの下位深度の符号化単位ごとに独立して符号化が行われねばならない。
予測モードは、イントラモード、インターモード及びスキップモードのうちいずれか1つで示す。イントラモード及びインターモードは、すべてのパーティションタイプで定義され、スキップモードは、パーティションタイプ2N×2Nのみで定義される。
パーティションタイプ情報は、予測単位の高くまたは幅が対称的な割合で分割された対称的パーティションタイプ2N×2N、2N×N、N×2N及びN×Nと、非対称的な割合で分割された非対称的パーティションタイプ2N×nU、2N×nD、nL×2N、nR×2Nとを示す。非対称的パーティションタイプ2N×nU及び2N×nDは、それぞれ高さが1:3及び3:1に分割された形態であり、非対称的パーティションタイプnL×2N及びnR×2Nは、それぞれ幅が1:3及び3:1に分割された形態を示す。
変換単位サイズは、イントラモードで2種のサイズ、インターモードで2種のサイズに設定される。すなわち、変換単位分割情報が0ならば、変換単位のサイズが現在符号化単位のサイズ2N×2Nに設定される。変換単位分割情報が1ならば、現在符号化単位が分割されたサイズの変換単位が設定される。またサイズ2N×2Nの現在符号化単位についてのパーティションタイプが対称形パーティションタイプならば、変換単位のサイズはN×N、非対称形パーティションタイプならば、N/2×N/2に設定される。
一実施形態によるツリー構造による符号化単位の符号化情報は、符号化深度の符号化単位、予測単位及び最小単位単位のうち少なくとも1つについて割り当てられる。符号化深度の符号化単位は、同じ符号化情報を保有している予測単位及び最小単位を1つ以上含む。
したがって、隣接するデータ単位同士それぞれ保有している符号化情報を確認すれば、同じ符号化深度の符号化単位に含まれるかどうかが確認される。また、データ単位が保有している符号化情報を用いれば、該符号化深度の符号化単位を確認できるので、最大符号化単位内の符号化深度の分布が類推される。
したがって、この場合、現在符号化単位が周辺データ単位を参照して予測符号化が行われる場合、現在符号化単位に隣接する深度別符号化単位内のデータ単位の符号化情報が直接参照されて用いられる。
さらに他の実施形態で、現在符号化単位が周辺符号化単位を参照して予測符号化が行われる場合、隣接する深度別符号化単位の符号化情報を用いて、深度別符号化単位内で現在符号化単位に隣接するデータが検索されることで、周辺符号化単位が参照されることもできる。
図13は、表1の符号化モード情報による符号化単位、予測単位及び変換単位の関係を示す。
最大符号化単位1300は、符号化深度の符号化単位1302、1304、1306、1312、1314、1316、1318を含む。これらのうち1つの符号化単位1318は、符号化深度の符号化単位であるので、分割情報が0に設定される。サイズ2N×2Nの符号化単位1318のパーティションタイプ情報は、パーティションタイプ2N×2N 1322、2N×N 1324、N×2N 1326、N×N 1328、2N×nU 1332、2N×nD 1334、nL×2N 1336及びnR×2N 1338のうち1つに設定される。
パーティションタイプ情報が、対称形パーティションタイプ2N×2N 1322、2N×N 1324、N×2N 1326及びN×N 1328のうち1つに設定されている場合、変換単位分割情報(TU size flag)が0ならば、サイズ2N×2Nの変換単位1342が設定され、変換単位分割情報が1ならば、サイズN×Nの変換単位1344が設定される。
パーティションタイプ情報が、非対称形パーティションタイプ2N×nU 1332、2N×nD 1334、nL×2N 1336及びnR×2N 1338のうち1つに設定された場合、変換単位分割情報(TU size flag)が0ならば、サイズ2N×2Nの変換単位1352が設定され、変換単位分割情報が1ならば、サイズN/2×N/2の変換単位1354が設定される。
前述したように、本発明の一実施形態によるビデオ符号化装置100及びビデオ復号化装置200は、最大符号化単位より小さいか、または同じ符号化単位で最大符号化単位を分割して符号化及び復号化を行う。ビデオ符号化装置100で符号化されたデータは、通信チャネルや保存メディア、ビデオ編集システム、メディアフレームワークなどが持つプロトコルやフォーマットに好適な伝送データ単位を用いて多重化され、伝送データ単位は、ビデオ復号化装置200に伝送される。
ビデオ復号化装置200は、ビデオデータを再生する場合、トリックプレー方式、ノーマルプレー方式のうち1つによってビデオデータを復元して再生する。トリックプレー方式は、一般再生(normal play)方式、ファスト・フォワード(fast forward)方式、またはファストバックワード方式(fast backward)方式及びランダムアクセス(random access)方式を含む。一般再生方式は、ビデオデータに含まれたすべてのピクチャーを順次に処理して再生する方式である。ファストフォワードまたはファストバックワード方式は、再生速度によって巡行または逆行し、所定周期ごとの基準ピクチャー、すなわち、Iピクチャーを選択して再生する方式である。ランダムアクセス方式は、所定位置のキーピクチャー、すなわち、Iピクチャーに飛ばして再生を行う方式である。H.264規格によれば、ランダムアクセスのためのキーピクチャーとして、IDR(Instantaneous Decoder Refresh)ピクチャーを用いる。IDRピクチャーは、該ピクチャーを復号化する瞬間に復号化装置をリフレッシュするイントラピクチャーである。具体的に、IDRピクチャーが復号化される瞬間にDPBは、IDRピクチャーを除いた以前に復号化されたピクチャーを、これ以上参照されないピクチャーとマーキングし、POC(Picture Order Count)も初期化される。また、IDRピクチャー以後に復号化されるピクチャーは、表示順序上IDRピクチャーより常に後にあり、IDRピクチャー以前のピクチャーを参照せずに復号化される。
本発明の一実施形態によれば、このようなIDRピクチャー以外に、ランダムアクセスのためのキーピクチャーとしてCRA(Clean Random Access)ピクチャーを用いる。CRAピクチャーは、CDR(Clean Decoding Refresh)ピクチャーまたはDDR(Deferred Decoding Refresh)ピクチャーと呼ばれてもよい。CRAピクチャーは、イントラピクチャーであり、表示順序上先立つものの、符号化(または復号化)順序上CRAピクチャーより遅く符号化(または復号化)されるピクチャーを持つイントラピクチャーを示す。以下の説明で、CRAピクチャーと同じGOP内のピクチャーとして、CRAピクチャーより表示順序上先立つものの、符号化(または復号化)順序上CRAピクチャーより遅く符号化(または復号化)されるピクチャーを、リーディング(leading)ピクチャーと定義する。
IDRピクチャー及びCRAピクチャーはいずれも、他のピクチャーを参照せずに符号化(復号化)されるイントラピクチャーであり、ランダムアクセスのためのキーピクチャーであるという点で共通するが、IDRピクチャーは、符号化(復号化)順序上後行のピクチャーが表示順序上IDRピクチャーを先立つ場合はないが、前述したようにCRAピクチャーは、符号化(復号化)順序上後行するものの、表示順序上先立つリーディングピクチャーが存在する。復号化順序及び符号化順序は、それぞれ復号化側及び符号化側を基準とするピクチャーの処理順序を意味し、ピクチャーの符号化順序は復号化順序と同一である。よって、以下で本発明を説明するにあたって、符号化順序では復号化順序を意味し、また復号化順序も符号化順序を意味する。
図14A及び図14Bは、本発明の一実施形態によって、一般再生及びランダムアクセス時のCRAピクチャーの復号化過程を説明するための図面である。図14A及び図14Bで、Bi及びbiは、L0予測及びL1予測を用いて予測される双方向(Bi−predictive)ピクチャーであり、iは表示順序、すなわち、POCを示す。また、大文字に表示されたBiは、他のピクチャーの参照ピクチャーとして用いられるピクチャーを示し、小文字に表示されたbiは、他のピクチャーの参照ピクチャーとして用いられないピクチャーを示す。
図14Aを参照すれば、一般再生時、すなわち、すべてのピクチャーを復号化して再生する場合、CRA24ピクチャー1410以後に復号化されるリーディングピクチャー1420は、以前に復号化された参照ピクチャーを参照して正常に復号化される。例えば、B22ピクチャー1421がB18ピクチャー1401を参照するL0予測、及びCRA24ピクチャー1410を参照するL1予測を用いて双方向予測されたとする時、一般再生時にB22ピクチャー1421は、以前に復号化されてDPB1430に保存されたCRA24ピクチャー1410及びB18ピクチャー1401を参照して正常に復号化される。
図14Bを参照すれば、Bピクチャー1402の復号化以後にランダムアクセスを通じてCRA24ピクチャー1410の復号化が開始された場合、B22ピクチャー1421の予測のためのL0予測は、L0方向の参照ピクチャーインデックスに基づいて参照ピクチャーを定める。この場合、以前に復号化されてDPB 1440に保存されたBピクチャー1402が、B22ピクチャー1421のL0予測のための参照ピクチャーと定められる。この場合、B22ピクチャー1421のL0予測のための参照ピクチャーは、B18ピクチャー1401にならねばならないにもかかわらず、ランダムアクセスによって、Bピクチャー1402とCRA24ピクチャー1410との間の参照ピクチャーを参照するピクチャーは、正常に復号化されない。
また、再び図14Aを参照すれば、リーディングピクチャー1420は、表示順序上CRA24ピクチャーより先に表示されるピクチャーであるので、ランダムアクセスを通じてCRA24ピクチャー1410が復号化されて表示された以後には、リーディングピクチャー1420は表示されないため、復号化される必要もない。
しかし、ビデオ復号化装置200の立場では、入力されたビデオデータを順次に復号化して出力することに過ぎないため、リーディングピクチャー1420が一般再生で、CRA24ピクチャー1410以後に復号化されるピクチャーであるか、またはランダムアクセスによってCRA24ピクチャー1410以後に復号化されるピクチャーであるかが識別できない。言い換えれば、ビデオ復号化装置200の立場では、CRA24ピクチャー1410がランダムアクセスによって復号化されるピクチャーであるか、または一般再生によって復号化されるピクチャーであるかを区別できない。
したがって、本発明の実施形態は、CRAピクチャーがランダムアクセスによって復号化されるピクチャーであるか、または一般再生によって復号化されるピクチャーであるかを区別するように符号化されたCRAピクチャーを多重化した所定伝送単位データに、CRAピクチャーの復号化状態を識別するためのシンタックスを加える多重化方式及び逆多重化方式を提供する。
先ず、本発明の一実施形態によるビデオデータの多重化方法及び装置について説明する。
図15は、本発明の一実施形態によるビデオデータ多重化装置の構成を示す図面である。図15を参照すれば、一実施形態によるビデオデータ多重化装置1500は、ビデオ符号化部1510、多重化部1520及び再生状態識別部1530を備える。
ビデオ符号化部1510は、前述した図1の映像符号化装置100に対応するものであり、ビデオデータの符号化処理自体を取り扱うビデオ符号化階層(Video Coding Layer)で、前述した階層的符号化単位に基づいてビデオデータを符号化する。多重化部1520は、通信チャネルや保存メディア、ビデオ編集システム、メディアフレームワークなどが持つプロトコルや保存フォーマットに好適な伝送データ単位を用いて、ビデオデータを多重化する。後述するように、多重化部1520は、NALでの伝送単位であるNAL単位を用いて、ビデオデータを多重化する。
再生状態識別部1530は、通信チャネルを通じて連結されたクライアント、保存メディアを管理する装置、ビデオ編集システム、メディアフレームワーク(以下、“復号化装置”と総称する)などで符号化されたビデオデータに関する伝送要請がある場合、このような伝送要請が一般再生によって提供されるビデオデータを順次に再生するための場合であるか、またはランダムアクセスのためのビデオデータの伝送要請であるかを識別する。再生状態識別部1530は、復号化装置から要請されたピクチャーの表示時間と、現在復号化装置で表示されるピクチャーの表示時間とを比べて、ビデオデータの伝送要請がランダムアクセスによるビデオデータの伝送要請であるかどうかを識別できる。
多重化部1520は、再生状態識別部1530の判断結果に基づいて、ランダムアクセスのためのキーピクチャーであるCRAピクチャーに関する情報を含むNAL単位に、一般再生による要請とランダムアクセスのための要請のうちいかなる要請に応じて提供されるCRAピクチャーであるかを示す所定のシンタックスを加える。
図16は、本発明の一実施形態によるNAL単位の構成を示す図面である。図16を参照すれば、NAL単位1600は、NALヘッダ1610及びRBSP(Raw Byte Sequence Payload)1620の2つの部分で構成される。RBSP充填ビット1630は、RBSP 1620の長さを8ビットの倍数で表現するために、RBSP 1620の最後に付け加えた長さ調節用ビットである。RBSP充填ビット1630は、‘1’から始まった後、RBSP 1620の長さによって定められる連続的な‘0’で構成されて‘100…’のようなパターンを持ち、最初のビット値である‘1’を検索することで、その直前にあるRBSP 1620の最後のビット位置を定める。
NALヘッダ1610には、0の値を持つforbidden_zero_bit1611以外に、該NAL単位1600が参照ピクチャーとなるスライスが含まれているかどうかを示すフラッグ(nal_ref_idc)などを含む。特に、一実施形態によるNALヘッダ1610には、前述したCRAピクチャーに関する情報を含むNAL単位に、一般再生による要請とランダムアクセスのための要請のうちいかなる要請に応じて提供されるCRAピクチャーであるかを示す状態識別シンタックス1612が含まれる。
このようなCRAピクチャーの再生状態を識別するための状態識別シンタックス1612は、NAL単位1600の類型を示す識別子(nal unit type)に含まれる。すなわち、一般再生による要請に応じて提供されるCRAピクチャーを多重化したNAL単位、及びランダムアクセスのための要請に応じて提供されるCRAピクチャーを多重化したNAL単位が、互いに異なる類型の識別子(nal unit type)を持つように設定される。
表2は、識別子(nal_unit_type)の値によってNAL単位1600の種類を示す一例である。
Figure 2017192157
一実施形態による多重化部1520は、一般再生による要請に応じて提供されるCRAピクチャーを多重化したNAL単位、及びランダムアクセスのための要請に応じて提供されるCRAピクチャーを多重化したNAL単位に、表2のように識別子(nal_unit_type)としてそれぞれ4、5の互いに異なる値を割り当てることで、CRAピクチャーに関する情報を持つNAL単位が、一般再生によって提供されるCRAピクチャー及びランダムアクセスによって提供されるCRAピクチャーののうちどちらかをシグナリングする。
また多重化部1520は、NAL単位のヘッダに加えられるシンタックスとして、一般再生による要請に応じて提供されるCRAピクチャーを多重化したNAL単位、及びランダムアクセスのための要請に応じて提供されるCRAピクチャーを多重化したNAL単位が、それぞれ0または1のうちいずれか1つの互いに異なる値を持つように設定されたフラッグを用いる。
図17A及び図17Bは、本発明の他の実施形態によって一般再生及びランダムアクセス時のCRAピクチャーの復号化過程を説明するための図面である。
一実施形態による多重化部1520は、NAL単位にCRAピクチャーの再生状態を直接的に知らせる類型情報を加えた。他の実施形態による多重化部1520は、CRAピクチャーの再生状態類型を直接的にシグナリングする代りに、CRAピクチャー以前に復号化されたキーピクチャーのカウンタと、復号化順序上CRAピクチャーより先立ちつつ、リーディングピクチャーの参照ピクチャーとして用いられるピクチャーのPOCに関する情報とを用いて、CRAが一般再生状態であるか、またはランダムアクセスによって再生される状態であるかを識別可能にする。
図17A及び図17Bを参照すれば、CRA44ピクチャー以前に復号化されるピクチャーとして、リーディングピクチャーであるb41、B42、b43ピクチャーが参照するB38ピクチャー1710、B40ピクチャー1720が存在する。B38ピクチャー1710は、リーディングピクチャーであるB42ピクチャーによって参照され、B40ピクチャー1720は、リーディングピクチャーであるb41によって参照される。このようなCRAピクチャーより復号化順序上先立ちつつ、リーディングピクチャーの参照ピクチャーとして用いられるB38ピクチャー1710、B40ピクチャー1720を、兄弟ピクチャー(brother picture)と定義する。このような兄弟ピクチャー(brother picture)を定義する理由は、兄弟ピクチャーのPOCを用いてCRAピクチャーが一般再生状態であるか、またはランダムアクセスによる再生状態であるかを識別できるからである。
例えば、図17Aを参照すれば、一般再生状態でピクチャーが順次に復号化されるにつれて、CRA44ピクチャーの復号化時点で、以前に復号化されたB38ピクチャー1710、B40ピクチャー1720がDPB 1740に保存される。もし、CRA44ピクチャーのスライスヘッダに兄弟ピクチャーであるB38ピクチャー1710のPOC値38と、B40ピクチャー1720のPOC値である40とが加えられならば、復号化側では、CRA44ピクチャーの復号化時点で、DPB 1740に以前に復号化されて保存されたピクチャーのPOCと、CRA44ピクチャーのスライスヘッダに含まれている兄弟ピクチャーのPOCとを比べて、CRA44ピクチャーがランダムアクセスによって再生されるピクチャーであるか、あるいは一般再生によって再生されるピクチャーであるかを識別できる。なぜならば、ランダムアクセスによる再生の場合、CRA44ピクチャーに再生順序、すなわち、復号化順序をジャンプするため、もしCRA44ピクチャーの復号化時点で、DPB 1740に保存された以前に復号化されたピクチャーのPOCが兄弟ピクチャーのPOCではない場合、現在CRA44ピクチャーは、ランダムアクセスによるピクチャーである可能性が大きいからである。
但し、このような兄弟ピクチャーのPOC情報のみでは、現在CRA44ピクチャーがランダムアクセスによるピクチャーであるか、または一般再生によって再生されるピクチャーであるかを混同する場合が発生する恐れがある。
例えば、図17Bを参照すれば、B40ピクチャー1745を復号化した後でランダムアクセスによってCRA44ピクチャーが復号化される場合、CRA44ピクチャーの復号化時点で、DPB 1780にはB40ピクチャー1745のPOC値である40が保存されており、復号化側では、CRA44ピクチャーのスライスヘッダに含まれた兄弟ピクチャーのPOC値である40と、DPBに保存された以前ピクチャーのPOC値とが同一であるので、現在CRA44ピクチャーを一般再生によって再生されるピクチャーと見損なう。このように兄弟ピクチャーのPOC情報のみではCRAピクチャーの再生状態を正確に識別できない理由は、IDRピクチャーを復号化する度にPOCがリセットされるため、ランダムアクセス時に兄弟ピクチャーが参照する実際参照ピクチャーとは異なる参照ピクチャーが、兄弟ピクチャーのPOCと同じPOCを持つ場合が発生するからである。
したがって、他の実施形態による多重化部1520は、CRAピクチャーの伝送単位データのシンタックスに兄弟ピクチャーのPOC情報だけではなく、CRAピクチャーより以前のピクチャーを符号化する過程中にPOCがリセットされるか、またはCRAピクチャーを符号化する度に1ずつ増加する値を持つカウンタであるPDC(POC discontinuity counter)を獲得し、PDCをCRAピクチャーの伝送単位データのシンタックスに加える。
再び図17Aを参照すれば、前述したように多重化部1520は、ピクチャーを符号化する過程で、POCがリセットされるか、またはCRAピクチャーを符号化する度にPDCを1ずつ増加させる。IDRピクチャーが符号化される度にPOCはリセットされるので、IDRピクチャーを符号化する度にPDCの値が1ずつ増加し、現在CRA44ピクチャーを除いた以前のCRAピクチャーを符号化する時にもPDCの値が1ずつ増加する。多重化部1520は、このようなPDC値を、兄弟ピクチャーのPOCと共にCRAピクチャーの伝送単位データのヘッダ1740に加える。復号化側では、符号化側と同様に、入力された伝送単位データを復号化する過程で、POCがリセットされるか、すなわち、IDRピクチャーを復号化するか、またはCRAピクチャーを復号化する度にPDCを1ずつ増加させる。図17Aに示したように、一般再生の場合、CRA44ピクチャーを復号化する時点でCRA44ピクチャーを多重化した伝送単位データのヘッダ1730に含まれたPDC値と、復号化側でピクチャーを復号化する過程でカウントしたPDC値1745とはいずれも3と同一になる。
再び図17Bを参照すれば、ランダムアクセス時にCRA44ピクチャー以前に復号化されたIDRピクチャーが1個、CRAピクチャーが1個のみ存在するので、ランダムアクセスによってCRA44ピクチャーが復号化される時点でPDC値1785は2の値を持ち、これは、CRA44ピクチャーを多重化した伝送データヘッダ1770に含まれているPDC値である3と異なる。よって、復号化側では、このようなPDC値の不一致に基づいて、現在CRAピクチャーがランダムアクセスによって再生されるピクチャーであると判断する。
図18は、本発明の一実施形態によるビデオデータの多重化方法を示すフローチャートである。図18を参照すれば、段階1810でビデオ符号化部1510は、階層的構造のデータ単位に基づいて、ビデオデータを構成するピクチャーを符号化する。前述したように、ビデオ符号化部1510は、ビデオを構成するピクチャーを最大サイズの符号化単位に分割した少なくとも1つの最大符号化単位ごとに、前記最大符号化単位の空間的分割回数を示す深度によって階層的に構成される深度別符号化単位のうち、符号化深度の符号化単位を含むツリー構造による符号化単位を定め、前記符号化深度の符号化単位ごとに予測符号化のためのパーティションを定め、階層的構造の変換単位に基づいて変換を行ってツリー構造による変換単位を定める。このような階層的データ単位の決定は、RD(Rate Distortion)コストに基づいて最適の階層的データ単位の構造が定められる。
段階1820で、再生状態識別部1530は、復号化装置から符号化されたデータの伝送要請がある場合、伝送要請が一般再生による要請であるか、またはランダムアクセスのための要請であるかを判断する。前述したように復号化装置は、符号化されたビデオデータを保存、または再生、編集する装置を総称するものであり、通信チャネルを通じて連結されたクライアント、保存メディアを管理する装置、ビデオ編集システム、メディアフレームワークなどである。
段階1830で、多重化部1520は、リーディングピクチャーを持つイントラピクチャーであるCRAピクチャーを多重化した伝送単位データに、段階1820の判断結果によって、イントラピクチャーが、一般再生による要請とランダムアクセスのための要請のうちいかなる要請に応じて提供されるCRAピクチャーであるかを示す所定のシンタックスを加える。前述したように、リーディングピクチャーは、CRAピクチャーより表示順序上先立つものの、符号化順序上CRAピクチャー以後に符号化されるピクチャーを意味する。また、伝送単位データは、NALデータ単位である。また、多重化部1520は、NAL単位の類型を示す識別子(nal unit type)に、一般再生による要請に応じて提供されるCRAピクチャーを多重化したNAL単位、及びランダムアクセスのための要請に応じて提供されるイントラピクチャーを多重化したNAL単位が互いに異なる類型の識別子(nal unit type)を持つように、NAL単位のヘッダに識別子(nal unit type)を加える。また、多重化部1520は、一般再生による要請に応じて提供されるCRAピクチャーを多重化したNAL単位であるか、またはランダムアクセスのための要請に応じて提供されるCRAピクチャーを多重化したNAL単位であるかによって、NAL単位のヘッダに0または1の値を持つフラッグを加える。また、多重化部1520は、ピクチャーの多重化過程でPOCがリセットされるか、またはCRAピクチャーを符号化する度に1ずつ増加するPOC不連続カウンタ(POC discontinuity counter)を獲得し、CRAピクチャーの兄弟ピクチャーのPOC情報及びPOC不連続カウンタをNAL単位のヘッダに加える。
図19は、本発明の一実施形態によるビデオデータ逆多重化装置の構成を示す図面である。図19を参照すれば、一実施形態によるビデオデータ逆多重化装置1900は、ビデオ復号化部1910、逆多重化部1920及び再生状態識別部1930を備える。
逆多重化部1920は、図15のビデオデータ多重化装置1500から伝送された伝送単位データ、すなわち、NAL単位データを受信し、NAL単位データのうちCRAピクチャーを多重化したNAL単位データから、CRAピクチャーが一般再生状態によって復号化されたものであるか、またはランダムアクセス状態によって復号化されたものであるかを示すシンタックスを獲得する。
再生状態識別部1930は、C獲得されたシンタックスを用いて、CRAピクチャーが一般再生状態のCRAピクチャーであるか、またはランダムアクセスによる再生状態であるかを判断する。
前述したように、NAL単位の類型を示す識別子(nal unit type)に、一般再生による要請に応じて提供されるCRAピクチャーを多重化したNAL単位、及びランダムアクセスのための要請に応じて提供されるイントラピクチャーを多重化したNAL単位が、互いに異なる類型の識別子(nal unit type)を持つように設定された場合、再生状態識別部1930は、このような識別子(nal unit type)の値を通じて現在CRAピクチャーの復号化状態が分かる。もし、一般再生による要請に応じて提供されるCRAピクチャーを多重化したNAL単位であるか、またはランダムアクセスのための要請に応じて提供されるCRAピクチャーを多重化したNAL単位であるかによって、NAL単位のヘッダに0または1の値を持つフラッグを加えた場合、再生状態識別部1930は、このようなフラッグ情報から現在CRAピクチャーの復号化状態が分かる。
また、POC不連続カウンタ及び兄弟ピクチャーのPOC情報がNAL単位ヘッダに含まれた場合、再生状態識別部1930は、以前ピクチャーの復号化過程でIDRピクチャーまたはCRAピクチャーを復号化する度にPDCを増加させ、現在CRAピクチャーの復号化時点でNAL単位のヘッダから獲得されたPDCと、復号化過程でカウントされたPDCとの同一性如何を判断する。また、再生状態識別部1930は、NAL単位のヘッダに含まれたCRAピクチャーの兄弟ピクチャーのPOC値と、現在CRAピクチャーの復号化時点でDPBに保存された以前ピクチャーのPOC値との同一性如何を判断する。もしPDCや兄弟ピクチャーのPOC値のうちいずれか1つでも一致しない場合、再生状態識別部1930は、現在CRAピクチャーをランダムアクセスによって再生されるピクチャーと判断し、PDCと兄弟ピクチャーのPOC値との同一性が満たされる場合、現在CRAピクチャーを一般再生によって再生されるピクチャーと判断する。もし、現在CRAピクチャーがランダムアクセスによって再生されるピクチャーである場合、現在CRAピクチャーのリーディングピクチャーは復号化される必要がないので、再生状態識別部1930は、現在CRAピクチャー以後のリーディングピクチャーの復号化が不要であるということをビデオ復号化部1910に通知する。
ビデオ復号化部1910は、図2の映像復号化装置200または図5の映像復号化装置500に対応するものであり、ビデオ復号化部1910は、NAL単位から符号化された映像データ及び符号化されたデータの生成に用いられた符号化単位に関する分割情報、パーティションタイプ情報、予測モード情報、変換単位サイズ情報、符号化過程に関するパラメータセット情報を獲得して復号化を行う。
図20は、本発明の一実施形態によるビデオデータの逆多重化方法を示すフローチャートである。図20を参照すれば、段階2010で逆多重化部1920は、階層的構造のデータ単位に基づいて、ビデオデータを構成するピクチャーを符号化したビットストリームを多重化した伝送単位データを受信する。前述したように、伝送単位データはNAL単位データである。
段階2020で、逆多重化部1920は、NAL単位データのうちCRAピクチャーを多重化したNAL単位データから、CRAピクチャーが一般再生状態によって復号化されたものであるか、またはランダムアクセス状態によって復号化されたものであるかを示す所定のシンタックスを獲得する。
段階2030で、再生状態識別部1930は、獲得されたシンタックスに基づいて、CRAピクチャーが一般再生されるピクチャーであるか、あるいはランダムアクセスピクチャーであるかを識別する。前述したように、NAL単位のヘッダに、識別子(nal unit type)を通じてCRAピクチャーの復号化状態をシグナリングする場合、再生状態識別部1930は、このような識別子(nal unit type)の値を通じて現在CRAピクチャーの復号化状態が分かる。もし、NAL単位のヘッダに0または1の値を持つフラッグが加えられた場合、再生状態識別部1930は、このようなフラッグ情報から現在CRAピクチャーの復号化状態が分かる。また、POC不連続カウンタ(POC discontinuity counter)及び兄弟ピクチャーのPOC情報がNAL単位ヘッダに含まれた場合、再生状態識別部1930は、復号化過程で獲得されたPDCカウンタ及びDPBに保存された以前ピクチャーのPOC値と、NAL単位ヘッダに含まれたPDCカウンタ及び兄弟ピクチャーのPOCとの同一性如何を判断して、現在CRAピクチャーの復号化状態が分かる。
CRAピクチャーがランダムアクセスによる再生状態であると判断された場合、CRAピクチャーのリーディングピクチャーは表示されないため復号化される必要がない。本発明の実施形態によれば、このようなランダムアクセス状態で再生されるCRAピクチャーを識別し、CRAピクチャーのリーディングピクチャーについての復号化を行わないことで復号化側のシステム資源を省く。
本発明はまた、コンピュータで読み取り可能な記録媒体にコンピュータで読み取り可能なコードとして具現できる。コンピュータで読み取り可能な記録媒体は、コンピュータシステムによって読み取られるデータが保存されるすべての記録装置を含む。コンピュータで読み取り可能な記録媒体の例には、ROM、RAM、CD−ROM、磁気テープ、フロッピー(登録商標)ディスク、光データ保存装置などが含まれる。またコンピュータで読み取り可能な記録媒体は、ネットワークに連結されたコンピュータシステムに分散され、分散方式でコンピュータで読み取り可能なコードとして保存されて実行される。
これまで本発明についてその望ましい実施形態を中心として説明した。当業者ならば、本発明が本発明の本質的な特性から逸脱しない範囲で変形された形態で具現できるということを理解できるであろう。本発明の範囲は、前述した説明ではなく特許請求の範囲に示されており、それと同等な範囲内にあるすべての差は本発明に含まれていると解釈されねばならない。
1900 ビデオデータ逆多重化装置
1910 ビデオ復号化部
1920 逆多重化部
1930 再生状態識別部

Claims (2)

  1. ネットワーク抽象階層(Network Abstraction Layer:NAL)における伝送単位であるNAL単位データを受信し、前記NAL単位データのヘッダから前記NAL単位データに含まれた現在ピクチャの類型を指すNAL単位類型(Network Adaptive Layer unit type:NAL unit type)情報及び現在ピクチャがランダムアクセスまたは一般再生によって再生されるか否かを示すランダムアクセスフラグを獲得する逆多重化部と、
    前記類型情報及び前記ランダムアクセスフラグが、前記現在ピクチャが一般再生に用いられるCRA(Clean Random Access)ピクチャであることを示す場合、復号化順序が現在ピクチャよりも以後であり、ディスプレイ順序上、現在ピクチャよりも先行するリーディングピクチャを復号化し、
    前記類型情報及び前記ランダムアクセスフラグが、前記現在ピクチャがランダムアクセスに用いられるCRA(Clean Random Access)ピクチャを示す場合、前記リーディングピクチャを復号化することを省略(skip)する復号化部を含み、
    前記現在ピクチャは、複数の最大符号化単位に分割されることを特徴とするビデオ復号化装置。
  2. ネットワーク抽象階層(Network Abstraction Layer: NAL)における伝送単位であるNAL単位データを受信する段階と、
    前記NAL単位データのヘッダから前記NAL単位データに含まれた現在ピクチャの類型を指すNAL単位類型(Network Adaptive Layer unit type:NAL unit type)情報及び現在ピクチャがランダムアクセスまたは一般再生によって再生されるか否かを示すランダムアクセスフラグを獲得する段階と、
    前記類型情報及び前記ランダムアクセスフラグが、前記現在ピクチャが一般再生に用いられるCRA(Clean Random Access)ピクチャであることを示す場合、復号化順序が現在ピクチャよりも以後であり、ディスプレイ順序上、現在ピクチャよりも先行するリーディングピクチャを復号化する段階と、
    前記類型情報及び前記ランダムアクセスフラグが、前記現在ピクチャがランダムアクセスに用いられるCRA(Clean Random Access)ピクチャを示す場合、前記リーディングピクチャを復号化することを省略(skip)する段階とを含み、
    前記現在ピクチャは、複数の最大符号化単位に分割されることを特徴とするビデオ復号化方法。
JP2017145227A 2011-07-02 2017-07-27 ビデオデータの再生状態識別のためのビデオデータの多重化方法及び装置、逆多重化方法及び装置 Expired - Fee Related JP6486421B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201161504178P 2011-07-02 2011-07-02
US61/504,178 2011-07-02
US201161552549P 2011-10-28 2011-10-28
US61/552,549 2011-10-28

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2016053464A Division JP6185620B2 (ja) 2011-07-02 2016-03-17 ビデオデータの再生状態識別のためのビデオデータの多重化方法及び装置、逆多重化方法及び装置

Publications (2)

Publication Number Publication Date
JP2017192157A true JP2017192157A (ja) 2017-10-19
JP6486421B2 JP6486421B2 (ja) 2019-03-20

Family

ID=47437548

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2014518821A Active JP5905960B2 (ja) 2011-07-02 2012-07-02 ビデオデータの再生状態識別のためのビデオデータの多重化方法及び装置、逆多重化方法及び装置
JP2016053464A Expired - Fee Related JP6185620B2 (ja) 2011-07-02 2016-03-17 ビデオデータの再生状態識別のためのビデオデータの多重化方法及び装置、逆多重化方法及び装置
JP2017145227A Expired - Fee Related JP6486421B2 (ja) 2011-07-02 2017-07-27 ビデオデータの再生状態識別のためのビデオデータの多重化方法及び装置、逆多重化方法及び装置

Family Applications Before (2)

Application Number Title Priority Date Filing Date
JP2014518821A Active JP5905960B2 (ja) 2011-07-02 2012-07-02 ビデオデータの再生状態識別のためのビデオデータの多重化方法及び装置、逆多重化方法及び装置
JP2016053464A Expired - Fee Related JP6185620B2 (ja) 2011-07-02 2016-03-17 ビデオデータの再生状態識別のためのビデオデータの多重化方法及び装置、逆多重化方法及び装置

Country Status (26)

Country Link
US (2) US9788003B2 (ja)
EP (3) EP3267681B1 (ja)
JP (3) JP5905960B2 (ja)
KR (7) KR101457895B1 (ja)
CN (5) CN107483980A (ja)
AU (3) AU2012278485B2 (ja)
BR (1) BR112013033902A2 (ja)
CA (1) CA2840893C (ja)
CY (2) CY1119757T1 (ja)
DK (2) DK3267681T3 (ja)
ES (2) ES2642839T3 (ja)
HR (2) HRP20171487T1 (ja)
HU (2) HUE042458T2 (ja)
LT (2) LT2728861T (ja)
MX (3) MX337078B (ja)
MY (1) MY168370A (ja)
PH (4) PH12017501055A1 (ja)
PL (2) PL2728861T3 (ja)
PT (2) PT2728861T (ja)
RS (2) RS56448B1 (ja)
RU (3) RU2014103489A (ja)
SG (1) SG10201505182UA (ja)
SI (2) SI2728861T1 (ja)
TW (5) TWI637628B (ja)
WO (1) WO2013005969A2 (ja)
ZA (1) ZA201400764B (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX337078B (es) * 2011-07-02 2016-02-11 Samsung Electronics Co Ltd Metodo y aparato para multiplexar y desmultiplexar datos de video para identificar el estado de reproduccion de los datos de video.
US9131245B2 (en) 2011-09-23 2015-09-08 Qualcomm Incorporated Reference picture list construction for video coding
US9264717B2 (en) * 2011-10-31 2016-02-16 Qualcomm Incorporated Random access with advanced decoded picture buffer (DPB) management in video coding
US9432694B2 (en) * 2012-03-06 2016-08-30 Apple Inc. Signal shaping techniques for video data that is susceptible to banding artifacts
US9516308B2 (en) 2012-04-27 2016-12-06 Qualcomm Incorporated Parameter set updates in video coding
US9736476B2 (en) * 2012-04-27 2017-08-15 Qualcomm Incorporated Full random access from clean random access pictures in video coding
JP6045222B2 (ja) * 2012-06-28 2016-12-14 株式会社Nttドコモ 動画像予測復号装置、方法及びプログラム
US9591303B2 (en) * 2012-06-28 2017-03-07 Qualcomm Incorporated Random access and signaling of long-term reference pictures in video coding
KR20140123914A (ko) 2013-04-12 2014-10-23 삼성전자주식회사 랜덤 엑세스를 위한 멀티 레이어 비디오 부호화 방법 및 그 장치, 랜덤 엑세스를 위한 멀티 레이어 비디오 복호화 방법 및 그 장치
CN105325000B (zh) 2013-06-12 2019-01-08 三菱电机株式会社 图像编码装置、图像编码方法、图像解码装置和图像解码方法
US10264272B2 (en) * 2013-10-15 2019-04-16 Qualcomm Incorporated Device and method for scalable coding of video information
KR102248848B1 (ko) 2013-10-26 2021-05-06 삼성전자주식회사 멀티 레이어 비디오 부호화 방법 및 장치, 멀티 레이어 비디오 복호화 방법 및 장치
US10283091B2 (en) * 2014-10-13 2019-05-07 Microsoft Technology Licensing, Llc Buffer optimization
KR102477964B1 (ko) * 2015-10-12 2022-12-16 삼성전자주식회사 미디어 전송 시스템에서 비디오 비트스트림의 임의 접근 및 재생을 가능하게 하는 기법
JP6854716B2 (ja) * 2017-07-05 2021-04-07 キヤノン株式会社 画像処理装置、画像処理方法
US11310560B2 (en) * 2019-05-17 2022-04-19 Samsung Electronics Co., Ltd. Bitstream merger and extractor

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010002214A2 (ko) * 2008-07-02 2010-01-07 삼성전자 주식회사 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치
WO2011115045A1 (ja) * 2010-03-17 2011-09-22 株式会社エヌ・ティ・ティ・ドコモ 動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法、及び動画像予測復号プログラム
WO2012122480A1 (en) * 2011-03-10 2012-09-13 Qualcomm Incorporated Video coding techniques for coding dependent pictures after random access
WO2013012372A1 (en) * 2011-07-15 2013-01-24 Telefonaktiebolaget L M Ericsson (Publ) An encoder and method thereof for assigning a lowest layer identity to clean random access pictures
JP6185620B2 (ja) * 2011-07-02 2017-08-23 サムスン エレクトロニクス カンパニー リミテッド ビデオデータの再生状態識別のためのビデオデータの多重化方法及び装置、逆多重化方法及び装置

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3860323B2 (ja) * 1997-10-27 2006-12-20 三菱電機株式会社 画像復号化装置、画像復号化方法
TW416220B (en) 1998-01-23 2000-12-21 Matsushita Electric Ind Co Ltd Image transmitting method, image processing method, image processing device, and data storing medium
US7366402B2 (en) * 2000-06-02 2008-04-29 Lg Electronics Inc. Method and apparatus of recording a high definition digital television broadcast signal
PL367241A1 (en) 2001-11-30 2005-02-21 Matsushita Electric Industrial Co, Ltd. A method and an apparatus for stream conversion, a method and an apparatus for data recording, and data recording medium
US7149247B2 (en) 2002-01-22 2006-12-12 Microsoft Corporation Methods and systems for encoding and decoding video data to enable random access and splicing
JP3852366B2 (ja) * 2002-04-26 2006-11-29 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
CA2492751C (en) * 2002-07-16 2012-06-12 Nokia Corporation A method for random access and gradual picture refresh in video coding
US20040260827A1 (en) * 2003-06-19 2004-12-23 Nokia Corporation Stream switching based on gradual decoder refresh
US7924921B2 (en) 2003-09-07 2011-04-12 Microsoft Corporation Signaling coding and display options in entry point headers
KR20050078099A (ko) * 2004-01-30 2005-08-04 삼성전자주식회사 적응적으로 키 프레임을 삽입하는 비디오 코딩 장치 및 방법
ATE555475T1 (de) 2004-04-28 2012-05-15 Panasonic Corp Stream-erzeugungsvorrichtung für bewegliche bilder, kodierungsvorrichtung für bewegliche bilder, multiplex-vorrichtung für bewegliche bilder und decodierungsvorrichtung für bewegliche bilder
US8514938B2 (en) * 2004-10-07 2013-08-20 Hewlett-Packard Development Company L.P. Picture coding apparatus for a still picture sequence and picture decoding apparatus for a still picture sequence
BRPI0610398B1 (pt) * 2005-04-13 2019-07-02 Nokia Technologies Oy Método e aparelho
TWI264951B (en) 2005-05-19 2006-10-21 Cheertek Inc Deblock filter method for applying on video encoding/decoding and the apparatus thereof
KR100934674B1 (ko) * 2006-03-30 2009-12-31 엘지전자 주식회사 비디오 신호를 디코딩/인코딩하기 위한 방법 및 장치
JP4737003B2 (ja) * 2006-08-10 2011-07-27 ソニー株式会社 編集装置、編集方法、編集プログラムおよび編集システム
JP4793366B2 (ja) * 2006-10-13 2011-10-12 日本ビクター株式会社 多視点画像符号化装置、多視点画像符号化方法、多視点画像符号化プログラム、多視点画像復号装置、多視点画像復号方法、及び多視点画像復号プログラム
US20080095228A1 (en) * 2006-10-20 2008-04-24 Nokia Corporation System and method for providing picture output indications in video coding
IN2014MN01853A (ja) 2006-11-14 2015-07-03 Qualcomm Inc
CN101198052B (zh) * 2006-12-04 2010-05-19 华为技术有限公司 一种视频编码方法、解码方法及其装置
US20080159407A1 (en) 2006-12-28 2008-07-03 Yang Nick Y Mechanism for a parallel processing in-loop deblock filter
US20080170528A1 (en) * 2007-01-12 2008-07-17 Peter Bosch Method of multicasting base and enhancement layers of a video stream
KR101142379B1 (ko) * 2007-02-14 2012-05-18 삼성전자주식회사 디지털 방송 재생 방법 및 장치, 디지털 방송 녹화 방법
CN101257624B (zh) * 2007-02-27 2011-08-24 华为技术有限公司 实现随机访问的方法及解码器
AP2923A (en) * 2007-05-04 2014-05-31 Nokia Corp Media stream recording into a reception hint trackof a multimedia container file
US20080317124A1 (en) * 2007-06-25 2008-12-25 Sukhee Cho Multi-view video coding system, decoding system, bitstream extraction system for decoding base view and supporting view random access
BRPI0818444A2 (pt) * 2007-10-12 2016-10-11 Qualcomm Inc codificação adaptativa de informação de cabeçalho de bloco de vídeo
CN101459840B (zh) * 2007-12-13 2010-04-21 华为技术有限公司 视频图像编码和解码方法及装置和系统
CN101222616B (zh) * 2008-01-22 2011-08-10 中兴通讯股份有限公司 点播服务中的mpeg传送流的传输处理方法
JP5170708B2 (ja) * 2008-01-24 2013-03-27 日本電気株式会社 動画像ストリーム加工方法及び装置、それを用いた動画像再生装置並びに動画像配信装置
JP2010062529A (ja) * 2008-08-04 2010-03-18 Toshiba Corp 半導体装置の製造方法
TW201032597A (en) * 2009-01-28 2010-09-01 Nokia Corp Method and apparatus for video coding and decoding
KR101457894B1 (ko) * 2009-10-28 2014-11-05 삼성전자주식회사 영상 부호화 방법 및 장치, 복호화 방법 및 장치
KR101503269B1 (ko) * 2010-04-05 2015-03-17 삼성전자주식회사 영상 부호화 단위에 대한 인트라 예측 모드 결정 방법 및 장치, 및 영상 복호화 단위에 대한 인트라 예측 모드 결정 방법 및 장치
US9516379B2 (en) * 2011-03-08 2016-12-06 Qualcomm Incorporated Buffer management in video codecs
US9674525B2 (en) * 2011-07-28 2017-06-06 Qualcomm Incorporated Multiview video coding
US9357275B2 (en) 2011-09-06 2016-05-31 Qualcomm Incorporated Network streaming of coded video data
US9736476B2 (en) 2012-04-27 2017-08-15 Qualcomm Incorporated Full random access from clean random access pictures in video coding
US9225978B2 (en) 2012-06-28 2015-12-29 Qualcomm Incorporated Streaming adaption based on clean random access (CRA) pictures

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010002214A2 (ko) * 2008-07-02 2010-01-07 삼성전자 주식회사 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치
WO2011115045A1 (ja) * 2010-03-17 2011-09-22 株式会社エヌ・ティ・ティ・ドコモ 動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法、及び動画像予測復号プログラム
WO2012122480A1 (en) * 2011-03-10 2012-09-13 Qualcomm Incorporated Video coding techniques for coding dependent pictures after random access
JP6185620B2 (ja) * 2011-07-02 2017-08-23 サムスン エレクトロニクス カンパニー リミテッド ビデオデータの再生状態識別のためのビデオデータの多重化方法及び装置、逆多重化方法及び装置
WO2013012372A1 (en) * 2011-07-15 2013-01-24 Telefonaktiebolaget L M Ericsson (Publ) An encoder and method thereof for assigning a lowest layer identity to clean random access pictures

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
AKIRA FUJIBAYASHI AND TK TAN: "Random access support for HEVC", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11, vol. JCTVC-D234, JPN6018029146, January 2011 (2011-01-01), pages 1 - 8, ISSN: 0003846463 *
TK TAN AND A. FUJIBAYASHI: "Clean decoding refresh definition and decoding process", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11, vol. JCTVC-F381, JPN6018029148, July 2011 (2011-07-01), pages 1 - 3, ISSN: 0003846465 *
YE-KUI WANG ET AL.: "On CDR picture", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11, vol. JCTVC-F464, JPN6018029149, July 2011 (2011-07-01), pages 1 - 3, ISSN: 0003846466 *
YING CHEN ET AL.: "Comments on Clean Decoding Refresh Pictures", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11, vol. JCTVC-E400, JPN6018029147, March 2011 (2011-03-01), pages 1 - 4, ISSN: 0003846464 *
YING CHEN ET AL.: "Conforming bitstreams startings with CRA pictures", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11, vol. JCTVC-G319, JPN6018029151, November 2011 (2011-11-01), pages 1 - 6, ISSN: 0003846468 *
YOUNGO PARK ET AL.: "Detection of a CDR for random access", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11, vol. JCTVC-F604, JPN6018029150, July 2011 (2011-07-01), pages 1 - 4, ISSN: 0003846467 *
YOUNGO PARK ET AL.: "On syntax for clean random access (CRA) pictures", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11, vol. JCTVC-G533-r3, JPN6018029152, November 2011 (2011-11-01), pages 1 - 6, ISSN: 0003846469 *

Also Published As

Publication number Publication date
SI3267681T1 (sl) 2019-01-31
US20150382002A1 (en) 2015-12-31
PT2728861T (pt) 2017-10-17
HRP20181956T1 (hr) 2019-01-25
CN107454417A (zh) 2017-12-08
CN107483980A (zh) 2017-12-15
AU2012278485B2 (en) 2016-12-15
ZA201400764B (en) 2019-07-31
PH12017501053A1 (en) 2017-10-18
MX337078B (es) 2016-02-11
CY1119757T1 (el) 2018-06-27
BR112013033902A2 (pt) 2017-12-12
KR101457895B1 (ko) 2014-11-04
KR20130004436A (ko) 2013-01-10
KR101872978B1 (ko) 2018-07-02
RU2636131C1 (ru) 2017-11-20
KR20160121459A (ko) 2016-10-19
HUE035904T2 (en) 2018-05-28
PL3267681T3 (pl) 2019-02-28
EP2728861A2 (en) 2014-05-07
DK3267681T3 (en) 2018-12-17
HRP20171487T1 (hr) 2017-11-17
JP6486421B2 (ja) 2019-03-20
TW201547255A (zh) 2015-12-16
PH12017501054A1 (en) 2017-10-18
TWI637628B (zh) 2018-10-01
EP3439299A1 (en) 2019-02-06
TW201315245A (zh) 2013-04-01
TW201626800A (zh) 2016-07-16
KR20150000852A (ko) 2015-01-05
EP2728861A4 (en) 2015-04-01
SG10201505182UA (en) 2015-08-28
PH12017501056A1 (en) 2017-10-18
MX2014000048A (es) 2014-04-30
KR101753370B1 (ko) 2017-07-03
TWI578765B (zh) 2017-04-11
WO2013005969A3 (ko) 2013-02-28
JP6185620B2 (ja) 2017-08-23
AU2017201284B2 (en) 2018-03-01
CN103765908A (zh) 2014-04-30
CA2840893A1 (en) 2013-01-10
MY168370A (en) 2018-10-31
KR101661696B1 (ko) 2016-09-30
TWI535272B (zh) 2016-05-21
JP5905960B2 (ja) 2016-04-20
RU2014103489A (ru) 2015-08-10
TWI526053B (zh) 2016-03-11
EP3267681A1 (en) 2018-01-10
CY1120978T1 (el) 2019-12-11
CN107623856A (zh) 2018-01-23
US20140146885A1 (en) 2014-05-29
KR101997039B1 (ko) 2019-07-05
TWI604720B (zh) 2017-11-01
LT2728861T (lt) 2017-10-25
AU2018203606A1 (en) 2018-06-14
PL2728861T3 (pl) 2017-12-29
CN103765908B (zh) 2017-11-03
TW201743617A (zh) 2017-12-16
RU2668284C1 (ru) 2018-09-28
KR20180087203A (ko) 2018-08-01
PT3267681T (pt) 2018-12-17
KR20170094097A (ko) 2017-08-17
RS56448B1 (sr) 2018-01-31
TW201717639A (zh) 2017-05-16
DK2728861T3 (en) 2017-10-23
WO2013005969A2 (ko) 2013-01-10
CA2840893C (en) 2018-12-18
ES2642839T3 (es) 2017-11-20
KR20140085394A (ko) 2014-07-07
EP2728861B1 (en) 2017-10-04
CN107820094A (zh) 2018-03-20
ES2699503T3 (es) 2019-02-11
EP3267681B1 (en) 2018-11-21
US9788003B2 (en) 2017-10-10
KR101648557B1 (ko) 2016-08-16
JP2014524196A (ja) 2014-09-18
KR20160129791A (ko) 2016-11-09
HUE042458T2 (hu) 2019-07-29
KR101748178B1 (ko) 2017-06-16
RS57976B1 (sr) 2019-01-31
AU2012278485A1 (en) 2014-01-23
LT3267681T (lt) 2018-12-10
SI2728861T1 (sl) 2017-11-30
MX337077B (es) 2016-02-11
JP2016131391A (ja) 2016-07-21
AU2017201284A1 (en) 2017-03-16
PH12017501055A1 (en) 2017-10-18

Similar Documents

Publication Publication Date Title
JP6486421B2 (ja) ビデオデータの再生状態識別のためのビデオデータの多重化方法及び装置、逆多重化方法及び装置
KR100908062B1 (ko) 비디오 신호의 디코딩/인코딩 방법 및 장치
CN107517388B (zh) 对图像进行解码的设备以及对图像进行编码的设备
JP4947389B2 (ja) 画像信号復号装置、画像信号復号方法、および画像信号符号化方法
US11252423B2 (en) Method and apparatus for coding video having temporal scalability, and method and apparatus for decoding video having temporal scalability
US20150063463A1 (en) Method and device for coding multi-layer video, and method and device for decoding multi-layer video
US20150358629A1 (en) Method and apparatus for coding multilayer video, method and apparatus for decoding multilayer video
US20150288975A1 (en) Method and apparatus for encoding video and method and appartaus for decoding video for random access
US20150023432A1 (en) Scalable video-encoding method and apparatus, and scalable video-decoding method and apparatus
CN116686289A (zh) 用于单参考运动矢量差的自适应精度
US9973765B2 (en) Method and apparatus for coding multilayer video, method and apparatus for decoding multilayer video
CN116584097A (zh) 联合运动矢量差编解码
CN116783892A (zh) 用于修正运动矢量候选的方法和设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170727

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180723

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A132

Effective date: 20180731

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20181030

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190104

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190129

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190219

R150 Certificate of patent or registration of utility model

Ref document number: 6486421

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees