JP6209026B2 - 画像符号化装置及びその制御方法 - Google Patents

画像符号化装置及びその制御方法 Download PDF

Info

Publication number
JP6209026B2
JP6209026B2 JP2013180354A JP2013180354A JP6209026B2 JP 6209026 B2 JP6209026 B2 JP 6209026B2 JP 2013180354 A JP2013180354 A JP 2013180354A JP 2013180354 A JP2013180354 A JP 2013180354A JP 6209026 B2 JP6209026 B2 JP 6209026B2
Authority
JP
Japan
Prior art keywords
encoding
tile
dividing
target
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013180354A
Other languages
English (en)
Other versions
JP2015050584A (ja
JP2015050584A5 (ja
Inventor
成記 望月
成記 望月
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2013180354A priority Critical patent/JP6209026B2/ja
Priority to US14/470,661 priority patent/US9762916B2/en
Publication of JP2015050584A publication Critical patent/JP2015050584A/ja
Publication of JP2015050584A5 publication Critical patent/JP2015050584A5/ja
Application granted granted Critical
Publication of JP6209026B2 publication Critical patent/JP6209026B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/16Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter for a given display mode, e.g. for interlaced or progressive display mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Description

本発明は、動画像の符号化技術に関するものである。
従来、動画データを圧縮符号化する画像処理装置として撮像装置や携帯型通信装置等が知られている。撮像装置や携帯型通信装置では、撮像部で撮影された画像に基づいて動画信号を取得し、取得した動画信号を圧縮符号化して、記録媒体に記録していた。
また、近年、このような記録コンテンツを再生することができる機器のアスペクト比も多種多様のものが登場してきている。
このような再生環境の多様化にともない、たとえば特許文献1のような、複数の解像度の動画像の符号化を実現する方法が提案されてきている。特許文献1では、動画像に対して、注目領域を切り出した低解像度と切出していない動画像の解像度の2つの動画像を符号化する技術を開示している。特許文献1では、動画像の解像度の注目領域に対応する画素値を単一色に置き換えることで符号量を抑えつつ、2つの異なる解像度の動画像データを符号化している。
特開2010−212811号公報
しかしながら、特許文献1の技術により符号化された動画像データは、高解像度の動画像を再生する場合に2つの符号化データを復号化し、1つの再生画像として合成する処理が必要であった。そのため、復号処理が複雑化してしまうことがあった。
そこで、本発明は、復号装置における表示画面のサイズが、設定した複数の画面サイズのいずれかに一致している限りは、その復号処理を簡略化可能とするための符号化データを生成する技術を提供する。
この課題を解決するため、例えば本発明の画像符号化装置は以下の構成を備える。すなわち、
動画像の符号化を行う画像符号化装置であって、
符号化対象のフレームに対し、当該フレームより小さくかつ互いに異なるサイズの複数の画面サイズを設定する設定手段と、
設定された各画面サイズに従って前記フレームをタイル状に分割する分割手段と、
該分割手段で分割したイル毎に、符号化を行う際の予測画素ブロックの探索する参照領域を決定する決定手段と、
所定の符号化対象ブロックを符号化する際に、前記決定手段により決定された、前記所定の符号化対象ブロックを含む所定のタイルに対応する参照領域から予測画素ブロックを探索し、前記所定の符号化対象ブロックと探索された前記予測画素ブロックとの差分に基づいて、前記符号化対象ブロックを予測符号化する符号化手段と、
前記分割手段によって分割されたタイル毎に独立して復号を可能なように、前記符号化手段により符号化された符号化データを処理する処理手段とを有し、
前記設定手段は、前記複数の画面サイズの中央を、前記符号化対象のフレームの中央の位置と一致させ、
前記分割手段は、各画面サイズの辺で示される座標位置を前記フレームを分割する位置として決定し、
前記決定手段は、
前記分割手段で分割したタイルの総数をNとし、各タイルをT 0 乃至T N-1 で表し、
前記フレームを構成するタイルの集合をA0={T 1 ,T 2 , …, T N-1 }と表し、
前記設定手段で設定した画面サイズの個数をMとした場合の、各画面サイズに含まれるタイルの集合をA1乃至AMと表したとき、
タイルT i (iは0乃至N−1のいずれか)を符号化する際に参照する参照領域を、集合A0乃至AMの中の、タイルT i を要素に有する集合に共通するタイルで構成される領域とすることを特徴とする
本発明によれば、設定した画面サイズで復号する限り、復号処理を不要とするタイルを特定できることになり、復号処理を簡略化できるようになる。
第1の実施形態における画像符号化装置のブロック構成図。 画面分割部の画面分割処理を説明するための図。 設定した画面サイズとその中に含まれるタイルとの関係を示し図。 第2の実施形態におけるタイル分割の例を示す図。 第1の実施形態における画像符号化装置の処理手順を示すフローチャート。 第3の実施形態における画像符号化装置のブロック構成図。 第3の実施形態におけるuser data unregistered SEIのシンタクスを示す図である。 第1の実施形態における画像符号化装置で生成される動画像データファイルの構造の一例を示す図である。
以下、図面を参照して本発明の実施形態を詳細に説明するが、この発明は以下の実施の形態に限定されない。なお、以下の実施の形態は特許請求の範囲に係る発明を限定するものでなく、また実施の形態で説明されている特徴の組み合わせの全てが発明の解決手段に必須のものとは限らない。
なお、本実施形態において説明される各機能ブロックは必ずしも個別のハードウェアである必要はない。すなわち、例えばいくつかの機能ブロックの機能は、1つのハードウェアにより実行されても良い。また、いくつかのハードウェアの連係動作により1つの機能ブロックの機能または、複数の機能ブロックの機能が実行されても良い。また、各機能ブロックの機能は、CPUがメモリ上に展開したコンピュータプログラムにより実行されても良い。
[第1の実施形態]
本実施形態では、映像符号化装置の構成、処理について説明する。本発明の適用範囲は、動画像の圧縮符号化部を有する装置であればどのような装置であっても良い。たとえば、ビデオカメラやデジタルカメラに代表される撮像装置、携帯型通信装置、コンピュータであってもよい。
本発明を適用可能な第1の実施形態であるH.265(ITU H.265又はISO/IEC23008−2)方式で符号化する映像符号化装置の構成及び処理の流れについて図1に示すブロック図を参照しながら説明を行う。
まず、画面分割部101は、復号側の表示画面のサイズに適合するため、符号化対象の入力映像の画面サイズよりも小さい、いくつかの画面サイズに関する画面サイズ情報を画像サイズ設定部110より取得する。画面サイズ設定部110は、典型的には、不図示の操作部より設定した情報を記憶する記憶部(不揮発性メモリなど)であり、各画面サイズを示す画面サイズ情報を画面分割部101に供給する。従って、特に変更がない限り、画面分割部101は、毎回、同じ画面サイズ情報を取得することになる。なお、ここでは画面サイズ情報の入力源を不揮発性メモリとしたが、これに限られるわけではなく、その種類は問わない。また、画面サイズは、水平、垂直方向の画素数で定義されるものとする。また、ここで言う画面サイズとは、水平、垂直方向の画素数で表されるものとする。ただし、一方の辺の画素数とアスペクト比があれば画面サイズは特定できるので、この限りではない。
さて、画面分割部101は、取得した画面サイズ情報を解析する。そして、各画面サイズで定義される矩形の中央位置を、符号化対象のフレームの中央位置に合わせた場合の、各画面サイズの境界を示す座標から、符号化対象の画面を分割する分割位置を決定する。そして、画面分割部101は、決定した座標位置で、符号化対象の画面をタイル状に分割した各領域(以下、この領域を単にタイルと呼ぶ)に番号(以下、タイル番号という)を付し、タイル番号で示されるタイル番号と符号化対象の画面におけるタイルの位置とを対応づける。そして、画面分割部101は、符号化処理中に、タイル毎の予測符号化条件を予測符号化方法決定部102へ出力する。この予測符号化条件には、或るタイル内の着目画素ブロックを符号化する際、その着目画素ブロック(符号化対象ブロック)の予測画素ブロックを取得する範囲を規定する情報が含まれる(詳細後述)。
予測符号化方法決定部102は、画面分割部101から入力される画面分割情報及び予測符号化条件に基づき符号化対象画面内の各画素ブロックに対する予測方法を決定する。そして、予測符号化方法決定部102は、入力される映像信号と符号化済みの復号画像を格納するメモリ104から読み出した符号化済み画素値から簡易的な画面内予測又は動き検出を含む画面間予測処理を行うことにより符号化効率を示す評価値を算出し、その符号化効率が最適となる予測方式を決定する。符号化対象画素ブロックがIスライスの場合は、画面内予測画素ブロックサイズ及び予測モードを決定する。Pスライス又はBスライスの場合には、画面内予測又は画面間予測の内、符号化効率の高い方を選択する。ここで、画面間予測の場合には画面内予測画素ブロックサイズ及び画面内予測モード等の画面内予測符号化用パラメータを決定する。また、画面間予測の場合には、参照画像フレーム、画素ブロック分割パターン、動きベクトル等の画面間予測符号化用パラメータを決定する。予測符号化方法決定部102は、決定した予測符号化用パラメータを予測符号化処理部103へ出力する。
予測符号化処理部103は、符号化対象のフレーム中の着目タイル内の着目画素ブロックを符号化する際、予測符号化方法決定部102により決定された予測符号化用パラメータに応じて、メモリ104から読出した符号化済み画像から予測画素ブロックを生成する。そして、着目画素ブロックと予測画素ブロックの差分である予測残差ブロックを、直交変換・量子化部105へ出力する。また、予測画素ブロックを、局所復号化部106にも出力する。
直交変換・量子化部105は、与えられた予測残差ブロックに対して直交変換処理を行う。また、直交変換・量子化部105は、後述する符号量制御部107から設定された量子化パラメータに応じた量子化ステップを用いて、直交変換して得られた係数を量子化する。その量子化後の係数(量子化データ)はエントロピー符号化部108、局所復号化部106へ供給される。局所復号化部106は、入力した量子化データに対し逆量子化処理、逆直交変換処理を行うことで、予測残差データを生成する。そして、局所復号化部106は、その予測残差データに、予測符号化処理部103から入力される予測画像を加算して復号化処理を行い、得られた画素ブロックが示す画像データをメモリ104へ格納する。メモリ104へ格納された復号後の画像データは、以降の画面内予測処理に利用される。更にデブロッキングフィルタ処理が施された復号化画像データをメモリ104へ保持する。メモリ104へ保持されたデブロッキングフィルタ処理後の復号化データは、以降の画面間予測処理にも利用される。
エントロピー符号化部108では、入力された量子化データに対してスライス単位にCABAC(コンテキスト適応型2値算術符号化)によるエントロピー符号化処理を行う。エントロピー符号化部108は、このため入力される量子化データ(多値データ)を2値データに変換する2値化部、その2値化部により生成された2値化データを格納する2値化データ・メモリを有する。また、エントロピー符号化部108は、2値化データの発生確率をコンテキストに応じて計算し、保持するコンテキスト計算部、及びコンテキスト計算部により供給される発生確率に応じて算術符号化を行う算術符号化部を有する。こうして符号化したデータをタイル単位に多重化処理部109へ供給すると共に、発生符号量を符号量制御部107へ出力する。
符号量制御部107は、符号化ピクチャバッファをオーバーフロー、又はアンダーフローさせないように符号化データの符号量を制御する処理部である。符号量制御部107は、エントロピー符号化部108から供給されるエントロピー符号化後の発生符号量を元に、後続して入力するフレームに対する量子化パラメータを生成し、直交変換・量子化部105へ供給する。
ここで、実施の形態における画面分割部101の画面分割処理方法について説明を行う。実施形態における符号化対象のフレームは、水平方向4160画素、垂直方向2352画素のサイズを有するものとする。また、説明を単純化するため、H.265におけるCUを16×16画素として説明する。このため、符号化対象のフレームのタイルへの分割位置は、垂直、水平とも16の整数倍になる。
実施の形態では、画面分割部101が取得する複数の画面サイズ情報は次の3通りであるものとする。
画面1:3840×2160画素(アスペクト比=16:9)
画面2:2880×2160画素(アスペクト比= 4:3)
画面3:3840×1584画素(アスペクト比=12:5)
先に説明したように、画面分割部101は、各画面サイズの中央位置を、符号化対象のフレームの中央位置と一致させる。このため、各画面サイズを規定する矩形の左上、右下の座標をまず算出する。符号化対象のフレームの水平方向サイズ(画素数)をWH(=4160),垂直方向サイズ(画素数)をWV(=2352)とする。そして、より小さい画面の水平サイズをSH、垂直サイズをSVと表す。原点を、符号化対象のフレームの左上隅位置とすると、その画面が示す矩形の左上座標、右下座標はそれぞれ以下の式(1)、(2)により算出する。
左上座標:(X0,Y0)=((WH−SH)/2,(WV−SV)/2)…式(1)
右下座標:(X1,Y1)=(X0+SH,Y0+SV) …式(2)
上式(1)、(2)により画面1が表す矩形の左上隅、右下隅の座標は次のようになる。
左上座標:(X0,Y0)=( 160, 96)
右下座標:(X1,Y1)=(4000,2256)
また、画面2の左上隅、右下隅の座標は次のようになる。
左上座標:(X0,Y0)=( 640, 96)
右下座標:(X1,Y1)=(3250,2256)
そして、画面3の左上隅、右下隅の座標は次のようになる。
左上座標:(X0,Y0)=( 160, 384)
右下座標:(X1,Y1)=(4000,1968)
上記の算出した結果の、符号化対象のフレームに対する画面1乃至3の領域との関係を示すのが図2である。
符号化対象のフレームを、上記の算出で得られた各座標を通る水平、垂直線で分割した状態を示すのが図2である。同図の矩形領域T0乃至T24がタイルであり、各タイルはH.265のスライスとして符号化される。
画面1は、図3(a)に示すように、タイルT6乃至T8、T11乃至T13、及びT15乃至T18の計9個のタイルで表される。画面2は、図3(b)に示すように、タイルT7,T12、T17の計3個のタイルで表される。そして、画面3は、図3(c)に示すように、タイルT11乃至T13の計3つで表される。
実施形態における画面分割部101は、さらに画面1、2及び3を構成するタイルを、それぞれにタイルのみを参照することで復号化が可能にするため、分割された各タイルに対する予測符号化条件となる画像参照範囲を決定する。すなわち、各画面のサイズを構成するタイルのみを参照することで復号可能とするために、各タイルに対する予測符号化条件となる画像参照範囲を決定する。
(i)まず、符号化対象のフレーム全体で利用されるタイルT0〜4、5、9、10、14、15、19、20〜24に対しては画面全体を参照可能とする。たとえば、タイルT0は、画面全体を参照可能であるので、タイルT0を符号化する際に参照することが許容されるタイルの集合をR(T0)と表現するのであれば、
R(T0)={T0、T1、T2,…、T24}(全タイル)として決定する。
(ii)次に、全画面及び画面1のみで利用されるタイル番号6、8、16、18は、画面1を構成する全てのタイル内を参照可能とする。上記と同様にR()で表すと次の通りである。
R(T6)=R(T8)=R(T16)=R(T18)={T6,T7、T8,T11.T12.T13,T16,T17,T18}として決定する。
(iii)次に、全画面、画面1及び画面2でのみ利用されるタイルT7、17は、画面2を構成する全てのタイル内を参照可能とする。R(T7)=R(T17)={T7、T12、T17}
(iv)次に、全画面、画面1、及び、画面3でのみ利用されるタイルT11、T13は、画面3を構成する全てのタイル内を参照可能とする。R(T11)=R(13)={T11、T12,T13}として決定する。
(v)最後にタイルT12は、自身のタイルT12のみを参照可能とする。すなわち、R(T12)={T12}である。
上記は設定する画面数が3つの場合であったが、設定する画面数をM個、それによってタイル数の総数がN個、各タイルをT0乃至TN-1と定義して、一般化して表せば次の通りである。
符号化対象のフレームを構成するタイルの集合A0とすると、A0は全てのタイルを含むことになるので、A0={T1,T2, …, TN-1}と表せる。同様に、画面1乃至画面Mそれぞれを構成するタイルの集合A1乃至AMも同様に定義できる。タイルTi(iは0乃至N−1のいずれか)を符号化する際に参照するタイルは、集合A0乃至AMの中で、タイルTiを要素に持つ集合に共通にタイルとして決定すればよい。
たとえば、上記実施の形態に適合した場合(設定する画面の個数が3つの場合)、タイルT1に着目すると、タイルT1を要素に持つ集合はA0のみとなるので、集合A0の全要素(全タイル)が参照対象となる。また、タイルT7に着目すると、T7を要素に持つ集合はA0と、図3からA1,A2である(A3は除外される)。そこで、A0,A1,A2に共通な要素を求めると{T7、T12,T17}となる。また、T11を着目した場合、タイルT11を要素に持つ集合はA0,A1,A3(A2は除外される)となる。そこで、この集合に共通な要素は{T11、T12、T13}となる。また、T12に着目すると、集合A0乃至A3の全てがT12を有するが、それらすべてに共通に有する要素はT12のみとなる。
以上のようにして、画面分割部101は、各タイル毎に、そのタイルを符号化する際に参照できる範囲を決定する。そして、画面分割部101は、各タイルT0乃至T25の位置とサイズを規定するための情報で構成される画面分割情報を予測符号化方法決定部102へ供給する。さらに、画面分割部101は、タイル毎にそのタイルを符号化する際に参照可能な範囲を規定する情報(予測符号化の条件情報)をも予測符号化方法決定部102へ供給する。
予測符号化処理部103は、例えば、タイルT11内の着目画素ブロックを符号化するとき、参照可能な範囲R(T11)={T11.T12,T13}が指定されているので、これらのタイルで規定される画像領域の中から、予測画素ブロックを探索する。そして、予測符号化処理部103は、探索した予測画素ブロックと着目画素ブロックとの差分である残差ブロックデータを直行変換・量子化部105に供給する。上記は画面内(イントラ)、画面間(インター)符号化を問わない。たとえば、タイルT11内の着目画素ブロックを画面間符号化を行う場合には、時間的に異なるフレームを参照するものの、その参照する範囲はその参照することになるフレームにおけるタイルT11,T12,T13で表される領域となる。
図8は実施の形態の符号化装置の多重化処理部109が生成する符号化画像ファイルのデータ構造の例を示している。
多重化処理部109は、画像の符号化の開始時には、ファイルヘッダに符号化対象のフレームのサイズ等の情報に加えて、各タイルの分割位置と、設定された画面サイズ、タイル番号、並びに、設定した画面で利用するタイル番号(たとえば画面2では、タイルT7、T12,T17を用いること)を示す情報を格納する。なお、タイル番号が、タイルを単位とするラスタースキャン順に符番されることが、符号化、復号化を行う装置双方の共通事項である場合にはタイル番号は不要としてもよい。また、多重化処理部109は、1フレーム毎の符号化データを生成する際、各タイルの符号化データの開始位置を特定するための情報をフレームのヘッダに格納する。典型的には、1フレームの符号化データの先頭からのビット位置である。また、各タイルの符号量でも構わない。すなわち、符号化データの順番がタイル番号順に並んでいる場合には、タイルT3の符号化データのオフセットアドレスは、タイルT1とタイルT2の符号量の合計値が示すビット位置とすれば良い。
上記処理をまとめると、図2に示す符号化装置は、図5のフローチャートに従って処理を行えばよい。
まず、S1にて、画面分割部101は画面サイズ情報を入力する。そして、S2にて、入力した画面サイズ情報を解析し、符号化対象のフレームの分割位置の座標を決定する。そして、S3にて、画面サイズ情報を参照して、各分割領域に順番にタイル番号を割り当て、各タイル毎に、そのタイルを符号化する際に参照が許容されるタイル領域を決定する。先の例では、タイルT11を符号化する際に参照することが許容されるのは、タイルT11、T12.T13で規定される領域となる。
上記のようにして、各タイル毎に参照するタイル領域が決定されると、S4にて1フレームの着目画素ブロックを入力する。そして、S5にて予測符号化方法決定部102、予測符号化処理部103、直交変換・量子化部105に代表される処理部で、着目画素ブロックを符号化する。このとき、着目タイルが属するいずれのタイルに属するかを判定し、そのタイルに対して設定されたタイル領域から、予測画素ブロックを探索する。予測ブロックを探索する対象のフレームが現在のフレームか他のフレームかは、その際の符号化モードに依存するが、かかる点は本願発明には直接には関係しないので、その説明は省略する。着目画素ブロックについての符号化を終えると、S6に進み、多重化処理部109が有するメモリに予め確保された、タイル毎のバッファにその符号化データを一時的に格納する。そして、現フレームにおける全画素ブロックについての符号化が未完であると判断される限り、S5、S6の処理を繰り返す。
上記のようにして1フレーム分の符号化を終えると、処理はS8に進み、多重化処理部109は、内部のバッファに格納されや各タイル毎の符号化データを所定の順序で結合し、タイルヘッダをその先頭に付加して出力する。このとき、タイルヘッダには、各タイルの符号化データそれぞれを独立してアクセス可能にするため、それぞれの符号化データの開始位置を示すオフセットアドレスを格納する。
この後、処理はS9に進み、符号化すべきフレームがあるか否かを判定し、あればS4以降の処理を繰り返す。また、なければ、符号化処理を終了する。
上記実施形態の結果、入力するフレームに対し、画面1としてQFHD(Quad Full High Difinition=3840×2160画素)、画面2、3としてQFHDに対してそれぞれ4:3のアスペクト比の画面サイズ、12:5のアスペクト比の画面サイズの符号化データを生成できる。
この符号化データ(符号化ストリーム)を再生する復号装置が、仮に、画面2(2880×2160画素)の画像を表示する機能を有している場合には、フレーム後の符号化データのうち、タイルT7、T12,T17の符号化データのみの復号処理を行えば良くなり、復号処理にかかる負担を最小化させることも可能になる。
なお、上記実施の形態によって生成される符号化データは、H.265に適用した復号装置であれば復号可能できる。しかしながら、復号装置が画面2(2880×2160画素)の画像を表示すれば十分である場合であっても、受信した全符号化データの全タイルを復号化してしまう可能性がある。そこで、実施形態で示した符号化装置で符号化したことを示す情報、いいかえれば、表示すべき画面に対応するタイルの符号化データのみを復号するだけで十分であることを示す情報(復号処理から除外しても構わないタイルが存在し得ることを示す情報とも言える)を、ファイルヘッダに格納するようにしても良い。この情報がファイルヘッダに存在し、ファイルヘッダに規定される画面サイズの中に、現実の画面サイズと一致しているものがあれば、復号処理で参照する領域が、必ず画面に規定されるタイル内にあることが約束され、無駄な復号処理をしなくて済むことになる。なお、この情報に、設定された画面サイズを用いても構わない。
[第2の実施形態]
1つのタイルを符号化する際に参照する領域(予測画素ブロックを導出する領域)を以下のようにして決定しても良い。
符号化対象のタイルを着目タイルとしたとき、符号化しようとするフレームの中心位置に対して点対象の位置にあるタイルと着目タイルが対角位置となる矩形領域の範囲を参照領域とする。
たとえば、タイルT0に着目したとき、図4(a)に示すように、点対称のタイルはT24となる。それ故、タイルT0とT24を対角に有する矩形領域、すなわち、全領域がタイル0を符号化する際に参照する領域とする。また、タイルT6に着目したとき、図4(b)に示すように、点対称のタイルがT18となる。それ故、タイルT6乃至T8,T11乃至T13,T16乃至T18が、タイルT6を符号化する際の参照領域となる。さらに、タイルT11を着目したとき、図4(c)に示すように、その点対称に位置するのはタイルT13となる。それ故、タイルT11を符号化する際の参照領域はT11乃至T13となる。
[第3の実施形態]
本発明を適用可能な第3の実施形態であるH.265方式で符号化する画像符号化装置の構成及び処理の流れについて図6に示すブロック図を参照しながら説明を行う。ここで、図6の画面分割部501〜多重化処理部509は、第1の実施形態で示した映像符号化装置の画面分割部101〜多重化処理部109と共通であるため説明は省略する。従って、以下では、図6に固有の復号化補助情報生成部510について説明を行う。
まず、H.265では、映像符号化処理を扱うビデオ符号化層(VCL:Video Coding Layer)と実際の伝送・蓄積のシステムとの間にネットワーク抽象化層(NAL:Network Abstraction Layer)が規定されている。NALは、NALヘッダとRBSP(Row Byte Sequence Payload)から構成されるNALユニットと呼ばれる単位でパケット化される。NALヘッダによりNALユニットの種類が識別できるようになっており、続くRBSPに実際の符号化データが格納される。NALユニットの種類は、主に映像符号化データ(スライス)、映像符号化データのシーケンスに関する情報であるSPS(Sequence Parameter Set)、映像符号化データのピクチャに関する情報であるPPS(Picture Parameter Set)、映像符号化データの付加情報であるSEI(Supplemental Enhancement Information)等がある。SEIには、ユーザー定義のシンタクスを使用可能なuser data SEIが用意されており、user data unregistered SEIを利用してユーザー定義の復号化補助情報を生成することが可能となっている。
図7(a)にuser data unregistered SEIのシンタクスを示す。シンタクス要素の内、user_data_payload_byte領域にユーザー定義情報を格納することが可能であり、user data unregistered SEIにユーザー定義情報が格納されていることをuuid_iso_iec_11578によりUUIDとして識別できるようにしておくことでユーザー定義情報を利用可能となる。
そこで、復号化補助情報生成部510では、画面分割部501から入力される画面サイズ情報と画面分割情報に基づき、符号化データが対応する各画面サイズに関わるコンフィギュレーション情報をSEIとして生成する。ここで、user_data_payload_byte領域に格納するための各画面サイズに関わるコンフィギュレーション情報を「pic_config」、そのSEIを「pic_config SEI」と呼ぶものとし、そのシンタクスの定義を図7(b)に示す。
「config_num」は、符号化ストリームが対応する画面サイズのコンフィギュレーション数を示す。「aspect_ratio」は、各画面サイズのアスペクト比を示し、上位8ビットに水平、下位8ビットに垂直の比が格納される。例えば16:9の場合は、16進数で0x1009となる。「pic_width」、「pic_height」は、それぞれ各画面の水平画素数、垂直画素数を示す。「tile_num」は、各画面を構成するタイルの数を示す。「tile」は、各画面を構成するタイル番号を示す。
第1の実施形態に示した例の場合、全画面を含む4つのコンフィギュレーション情報となり、「config_num」には“4”が格納され、それぞれのコンフィギュレーション情報は以下のように格納される。
全画面は、
aspect_ratio[0]= 0x1009(16:9)
pic_width[0]= 4160
pic_height[0]= 2352
tile_num[0]= 25
tile[0][25]={0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24}
画面1は以下の通りになる。
aspect_ratio[1]= 0x1009(16:9)
pic_width[1]= 3840
pic_height[1]= 2160
tile_num[1]= 9
tile[1][9]={6,7,8,11,12,13,16,17,18}
画面2は以下の通りになる。
aspect_ratio[2]= 0x0403(4:3)
pic_width[2]= 2880
pic_height[2]= 2160
tile_num[2]= 3
tile[2][3]={7,12,17}
画面3は以下の通りになる。
aspect_ratio[3]= 0x0c05(12:5)
pic_width[3]= 3840
pic_height[3]= 1584
tile_num[3]= 3
tile[3][3]={11,12,13}
このように「pic_config SEI」を復号化補助情報として符号化データに多重化しておくことで、事前に符号化データの対応する画面サイズやアスペクト比及びタイル情報を取得することが可能となり、所望の画面サイズの再生や変換を容易にする事が可能となる。
(その他の実施例)
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。

Claims (6)

  1. 動画像の符号化を行う画像符号化装置であって、
    符号化対象のフレームに対し、当該フレームより小さくかつ互いに異なるサイズの複数の画面サイズを設定する設定手段と、
    設定された各画面サイズに従って前記フレームをタイル状に分割する分割手段と、
    該分割手段で分割したタイル毎に、符号化を行う際の予測画素ブロックの探索する参照領域を決定する決定手段と、
    所定の符号化対象ブロックを符号化する際に、前記決定手段により決定された、前記所定の符号化対象ブロックを含む所定のタイルに対応する参照領域から予測画素ブロックを探索し、前記所定の符号化対象ブロックと探索された前記予測画素ブロックとの差分に基づいて、前記符号化対象ブロックを予測符号化する符号化手段と、
    前記分割手段によって分割されたタイル毎に独立して復号を可能なように、前記符号化手段により符号化された符号化データを処理する処理手段とを有し、
    前記設定手段は、前記複数の画面サイズの中央を、前記符号化対象のフレームの中央の位置と一致させ、
    前記分割手段は、各画面サイズの辺で示される座標位置を前記フレームを分割する位置として決定し、
    前記決定手段は、
    前記分割手段で分割したタイルの総数をNとし、各タイルをT0乃至TN-1で表し、
    前記フレームを構成するタイルの集合をA0={T1,T2, …, TN-1}と表し、
    前記設定手段で設定した画面サイズの個数をMとした場合の、各画面サイズに含まれるタイルの集合をA1乃至AMと表したとき、
    タイルTi(iは0乃至N−1のいずれか)を符号化する際に参照する参照領域を、集合A0乃至AMの中の、タイルTiを要素に有する集合に共通するタイルで構成される領域とする
    ことを特徴とする画像符号化装置。
  2. 動画像の符号化を行う画像符号化装置であって、
    符号化対象のフレームに対し、当該フレームより小さくかつ互いに異なるサイズの複数の画面サイズを設定する設定手段と、
    設定された各画面サイズに従って前記フレームをタイル状に分割する分割手段と、
    該分割手段で分割したタイル毎に、符号化を行う際の予測画素ブロックの探索する参照領域を決定する決定手段と、
    所定の符号化対象ブロックを符号化する際に、前記決定手段により決定された、前記所定の符号化対象ブロックを含む所定のタイルに対応する参照領域から予測画素ブロックを探索し、前記所定の符号化対象ブロックと探索された前記予測画素ブロックとの差分に基づいて、前記符号化対象ブロックを予測符号化する符号化手段と、
    前記分割手段によって分割されたタイル毎に独立して復号を可能なように、前記符号化手段により符号化された符号化データを処理する処理手段とを有し、
    前記設定手段は、前記複数の画面サイズの中央を、前記符号化対象のフレームの中央の位置と一致させ、
    前記分割手段は、各画面サイズの辺で示される座標位置を前記フレームを分割する位置として決定し、
    前記決定手段は、
    着目タイルと当該着目タイルに対して点対象に位置するタイルとが対角位置に有する矩形領域を、前記着目タイルを符号化する際に参照する参照領域として決定する
    ことを特徴とする画像符号化装置。
  3. 動画像の符号化を行う画像符号化装置の制御方法であって、
    設定手段が、符号化対象のフレームに対し、当該フレームより小さくかつ互いに異なるサイズの複数の画面サイズを設定する設定工程と、
    分割手段が、設定された各画面サイズに従って前記フレームをタイル状に分割する分割工程と、
    決定手段が、該分割工程で分割したイル毎に、符号化を行う際の予測画素ブロックの探索する参照領域を、前記設定工程で設定した画面サイズに基づいて決定する決定工程と、
    符号化手段が、着目タイル内の着目画素ブロックに対し、前記決定工程で前記着目タイルに対して決定した参照領域から予測画素ブロックを探索し、前記着目画素ブロックを予測符号化する符号化工程と、
    処理手段が、前記分割工程によって分割されたタイル毎に独立して復号を可能なように前記符号化工程により符号化された符号化データを処理する処理工程とを有し、
    前記設定工程では、前記複数の画面サイズの中央を、前記符号化対象のフレームの中央の位置と一致させ、
    前記分割工程では、各画面サイズの辺で示される座標位置を前記フレームを分割する位置として決定し、
    前記決定工程では、
    前記分割工程で分割したタイルの総数をNとし、各タイルをT 0 乃至T N-1 で表し、
    前記フレームを構成するタイルの集合をA0={T 1 ,T 2 , …, T N-1 }と表し、
    前記設定工程で設定した画面サイズの個数をMとした場合の、各画面サイズに含まれるタイルの集合をA1乃至AMと表したとき、
    タイルT i (iは0乃至N−1のいずれか)を符号化する際に参照する参照領域を、集合A0乃至AMの中の、タイルT i を要素に有する集合に共通するタイルで構成される領域とする
    ことを特徴とする画像符号化装置の制御方法。
  4. 動画像の符号化を行う画像符号化装置の制御方法であって、
    設定手段が、符号化対象のフレームに対し、当該フレームより小さくかつ互いに異なるサイズの複数の画面サイズを設定する設定工程と、
    分割手段が、設定された各画面サイズに従って前記フレームをタイル状に分割する分割工程と、
    決定手段が、該分割工程で分割したタイル毎に、符号化を行う際の予測画素ブロックの探索する参照領域を、前記設定工程で設定した画面サイズに基づいて決定する決定工程と、
    符号化手段が、着目タイル内の着目画素ブロックに対し、前記決定工程で前記着目タイルに対して決定した参照領域から予測画素ブロックを探索し、前記着目画素ブロックを予測符号化する符号化工程と、
    処理手段が、前記分割工程によって分割されたタイル毎に独立して復号を可能なように前記符号化工程により符号化された符号化データを処理する処理工程とを有し、
    前記設定工程では、前記複数の画面サイズの中央を、前記符号化対象のフレームの中央の位置と一致させ、
    前記分割工程では、各画面サイズの辺で示される座標位置を前記フレームを分割する位置として決定し、
    前記決定工程では、
    着目タイルと当該着目タイルに対して点対象に位置するタイルとが対角位置に有する矩形領域を、前記着目タイルを符号化する際に参照する参照領域として決定する
    ことを特徴とする画像符号化装置の制御方法。
  5. コンピュータに読み込ませ、実行させることで、前記コンピュータに請求項3又は4に記載の方法の各工程を実行させるためのプログラム。
  6. 請求項に記載のプログラムを格納したことを特徴とするコンピュータが読み取り可能な記憶媒体。
JP2013180354A 2013-08-30 2013-08-30 画像符号化装置及びその制御方法 Expired - Fee Related JP6209026B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2013180354A JP6209026B2 (ja) 2013-08-30 2013-08-30 画像符号化装置及びその制御方法
US14/470,661 US9762916B2 (en) 2013-08-30 2014-08-27 Encoding apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013180354A JP6209026B2 (ja) 2013-08-30 2013-08-30 画像符号化装置及びその制御方法

Publications (3)

Publication Number Publication Date
JP2015050584A JP2015050584A (ja) 2015-03-16
JP2015050584A5 JP2015050584A5 (ja) 2016-10-06
JP6209026B2 true JP6209026B2 (ja) 2017-10-04

Family

ID=52583244

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013180354A Expired - Fee Related JP6209026B2 (ja) 2013-08-30 2013-08-30 画像符号化装置及びその制御方法

Country Status (2)

Country Link
US (1) US9762916B2 (ja)
JP (1) JP6209026B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170042431A (ko) * 2015-10-08 2017-04-19 삼성전자주식회사 디스플레이 모양에 따라 영상 데이터를 불균일하게 인코딩/디코딩하도록 구성되는 전자 장치
TWI610292B (zh) * 2015-11-19 2018-01-01 瑞鼎科技股份有限公司 驅動電路及其運作方法
KR102543444B1 (ko) * 2017-08-29 2023-06-13 삼성전자주식회사 영상 부호화 장치
JP7148236B2 (ja) * 2017-10-27 2022-10-05 キヤノン株式会社 符号化装置及びその制御方法及びプログラム
GB2570879B (en) * 2018-02-06 2022-08-17 Advanced Risc Mach Ltd Encoding data arrays

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8698840B2 (en) * 1999-03-05 2014-04-15 Csr Technology Inc. Method and apparatus for processing video and graphics data to create a composite output image having independent and separate layers of video and graphics display planes
AU2001264723A1 (en) * 2000-05-18 2001-11-26 Imove Inc. Multiple camera video system which displays selected images
JP4724919B2 (ja) * 2000-06-02 2011-07-13 ソニー株式会社 記録装置および記録方法、再生装置および再生方法、並びに記録媒体
WO2003073365A1 (en) * 2002-02-22 2003-09-04 Bacus Research Laboratories, Inc. Focusable virtual microscopy apparatus and method
JP4148462B2 (ja) * 2003-01-20 2008-09-10 株式会社リコー 画像処理装置、電子カメラ装置及び画像処理方法
US7664292B2 (en) * 2003-12-03 2010-02-16 Safehouse International, Inc. Monitoring an output from a camera
US7958369B2 (en) * 2004-10-22 2011-06-07 Hewlett-Packard Development Company, L.P. Systems and methods for multiple level control of access of privileges to protected media content
JP4341662B2 (ja) * 2006-10-06 2009-10-07 ソニー株式会社 映像合成装置
JP4380740B2 (ja) * 2007-07-09 2009-12-09 セイコーエプソン株式会社 画像処理装置
JP2010212811A (ja) 2009-03-06 2010-09-24 Panasonic Corp 動画像符号化装置及び動画像復号化装置
MY167857A (en) * 2011-08-11 2018-09-26 Sun Patent Trust Image coding method, image decoding method, image coding apparatus, image decoding apparatus, and image coding and decoding apparatus
CN103650501B (zh) * 2011-08-25 2017-10-27 太阳专利托管公司 使用瓦片编码方案对视频进行编码、提取和解码的方法和装置
US9584819B2 (en) * 2011-10-24 2017-02-28 Qualcomm Incorporated Grouping of tiles for video coding
CN104885456A (zh) * 2012-09-18 2015-09-02 Vid拓展公司 使用图块和图块组的感兴趣区域视频编码
US20140108963A1 (en) * 2012-10-17 2014-04-17 Ponga Tools, Inc. System and method for managing tagged images
CN105393532B (zh) * 2013-07-22 2019-04-19 索尼公司 信息处理设备和方法

Also Published As

Publication number Publication date
US9762916B2 (en) 2017-09-12
JP2015050584A (ja) 2015-03-16
US20150063439A1 (en) 2015-03-05

Similar Documents

Publication Publication Date Title
KR102424829B1 (ko) 비디오 데이터가 부호화된 비트스트림을 처리하는 방법
CN110612553A (zh) 对球面视频数据进行编码
KR102408765B1 (ko) 비디오 코딩 및 디코딩
US11589047B2 (en) Video encoding and decoding methods and apparatus
JP6209026B2 (ja) 画像符号化装置及びその制御方法
US20150365698A1 (en) Method and Apparatus for Prediction Value Derivation in Intra Coding
JP7421600B2 (ja) フレーム部分を有するビデオデータを符号化又は復号する方法及び装置
JP7345051B2 (ja) サブピクチャ、スライス、およびタイルをサポートするビデオ符号化
JP2022511744A (ja) ビデオ符号化及び復号
JP2022523441A (ja) デジタルビデオにおけるパラメータセットシグナリング
BR112021004442A2 (pt) método de decodificação de vídeo e decodificador de vídeo
CN113056910A (zh) 用于视频编码的运动矢量预测子索引编码
US8594192B2 (en) Image processing apparatus
CN112153391A (zh) 视频编码的方法、装置、电子设备及存储介质
TW201924352A (zh) 用於在支援輔助訊框的視訊編碼格式中編碼視訊串流的方法和編碼器
KR101476532B1 (ko) Hevc nal 유닛 구문 구조의 확장
KR102453850B1 (ko) 비디오 데이터가 부호화된 비트스트림을 처리하는 방법
JP7416820B2 (ja) ビデオコーディングにおけるヌルタイルコーディング
JP4514666B2 (ja) 動画像符号化装置
US20230342983A1 (en) Vertex prediction based on mesh triangulation derivation
US20230412842A1 (en) Vertex prediction based on decoded neighbors
US20230388544A1 (en) Dynamic mesh compression using inter and intra prediction
JP6942504B2 (ja) 符号化装置、撮像装置、符号化方法、及びプログラム
JP2023552224A (ja) 探索範囲制限を用いたイントラブロックコピー(intrabc)モードコーディングのための方法および装置
JP2023553921A (ja) 探索範囲切り替えを用いたイントラブロックコピーモードコーディングのための方法および装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160823

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160823

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170517

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170529

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170714

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170810

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170908

R151 Written notification of patent or utility model registration

Ref document number: 6209026

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees