JP2011029962A - スケーラブル動画像符号化方法、スケーラブル動画像符号化装置およびスケーラブル動画像符号化プログラム - Google Patents

スケーラブル動画像符号化方法、スケーラブル動画像符号化装置およびスケーラブル動画像符号化プログラム Download PDF

Info

Publication number
JP2011029962A
JP2011029962A JP2009173956A JP2009173956A JP2011029962A JP 2011029962 A JP2011029962 A JP 2011029962A JP 2009173956 A JP2009173956 A JP 2009173956A JP 2009173956 A JP2009173956 A JP 2009173956A JP 2011029962 A JP2011029962 A JP 2011029962A
Authority
JP
Japan
Prior art keywords
prediction mode
optimum
correspondence
combination
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009173956A
Other languages
English (en)
Other versions
JP5038367B2 (ja
Inventor
Kazuya Hayase
和也 早瀬
Yukihiro Bando
幸浩 坂東
Masayuki Takamura
誠之 高村
Kazuto Kamikura
一人 上倉
Yoshiyuki Yajima
由幸 八島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2009173956A priority Critical patent/JP5038367B2/ja
Publication of JP2011029962A publication Critical patent/JP2011029962A/ja
Application granted granted Critical
Publication of JP5038367B2 publication Critical patent/JP5038367B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】本発明は、上位レイヤと下位レイヤが空間的に1対1に対応しないレイヤ構造のスケーラブル動画像符号化において、符号化時間を削減する技術の提供を目的とする。
【解決手段】従来の符号化で選択された最適予測モードに基づいて、上位レイヤのブロックとその直下の下位レイヤの画像領域で選択された最適予測モードの組み合わせの発生率を求め、それらの関係について記述する対応表を生成する。続いて、発生率に基づいて対応表に記述される最適予測モードの組み合わせを絞り込むことで、予測モード対応情報を生成する。そして、上位レイヤのブロックを符号化する場合に、その直下の下位レイヤの画像領域で選択された最適予測モードを取得して、その中から処理対象の最適予測モードを選択し、その選択した最適予測モードを組み合わせに持つ予測モード対応情報を参照することで、上位レイヤのブロックの符号化で探索する予測モード探索候補を絞り込む。
【選択図】図2

Description

本発明は、動画像をスケーラブルに符号化するスケーラブル動画像符号化方法およびその装置と、そのスケーラブル動画像符号化方法の実現に用いられるスケーラブル動画像符号化プログラムとに関し、特に、符号化時間の削減を実現するスケーラブル動画像符号化方法およびその装置と、そのスケーラブル動画像符号化方法の実現に用いられるスケーラブル動画像符号化プログラムとに関する。
近年の多様な表示端末・ネットワーク環境の背景を受け、JVT(Joint Video Team:合同ビデオ・チーム)では、AVC(Advanced Video Coding:高度動画像圧縮符号化標準)に対して、空間/時間/SNRのスケーラビリティを付与した符号化方式SVC(Scalable Video Coding)が検討されている(例えば、非特許文献1参照)。
SVCでは、Inter予測、Intra予測、レイヤ間予測の3つの予測方法を取り入れており、時間、空間、レイヤ間に内在する冗長性除去を行う。SVCでとり得る予測モードを下記に列挙する。
〔Inter予測〕
・Skip モード(Skip )
・Direct モード(Direct )
・16×16ブロックサイズ動き予測モード(P16×16)
・16×8ブロックサイズ動き予測モード(P16×8)
・8×16ブロックサイズ動き予測モード(P8×16)
・8×8ブロックサイズ動き予測モード(P8×8)
〔Intra予測〕
・16×16ブロックサイズIntra予測モード(I16×16)
・8×8ブロックサイズIntra予測モード(I8×8)
・4×4ブロックサイズIntra予測モード(I4×4)
〔レイヤ間予測〕
・BLSkip モード(BLSkip )
・IntraBLモード(IntraBL)
P8×8を行う場合の各8×8ブロックは、さらに8×4、4×4、4×4のブロックサイズに分割可能である。SVCでは、マクロブロックごとに、これらの予測モード探索候補の中から1つを最適予測モードとして選択する。
最適予測モードの決定方法の例を以下に挙げる。
JVTがSVCの参照エンコーダとして提供しているJSVM(例えば、非特許文献2参照)では、各予測モードにおいて符号量と符号化歪みとからなる符号化コストを計算し、上に挙げたすべての予測モード中で最も符号化コストが小さくなる予測モードを最適として定める。
また、下記に示す特許文献1では、参照フレームの動きベクトルを符号化対象フレームに外挿/内挿したベクトルを生成し、それによって動いたマクロブロックの各画素の座標を求め、画素が一致する回数を各画素毎にカウントする。そして、符号化対象マクロブロック内の各画素のカウント数から算出されるスコアの値の大小に従って予測モード探索候補の絞り込みを行う。本絞り込み方法はH.264/AVCの予測モード探索高速化のために提案されたものであるが、H.264/AVCと同じ予測モード探索の仕組みであるSVCにおいても適用可能である。
また、下記に示す特許文献2では、フレーム内符号化を高速で行うことができるようにするために、近接符号化ブロックの画素値を用いてフレーム内符号化を行うブロックの例えば9通りの画面内予測誤差を求めて、それに基づいてそのブロックの予測モードを決定する。次に、近接既符号化ブロックの画面内予測モードを用いてそのブロックの予測モードを決定して、その2つの予測モードが一致する場合には、そのままその予測モードを選択し、一致しない場合は、符号化コストの小さい方の予測モードを選択するようにしている。
しかしながら、非特許文献2のJSVMにおける最適予測モードの決定方法では、予測モード探索候補の絞り込みを行っていないため、高い符号化性能を実現できる反面、予測モード探索に莫大な時間を要する。マクロブロック内の画像の特性を考慮すれば明らかに選ばれる可能性が低い予測モード(例えば、静止領域におけるIntra予測モード)も探索しており無駄が多い。
また、特許文献1の予測モード探索候補の絞り込みは、Intra予測をするのか否かの判定を下す方法であるため、Intra予測モードの探索と比べて長い計算時間を要するInter予測モード探索の削減効果はない。つまり、Inter予測モード探索については、改良の余地をそのまま残している。
また、特許文献2の予測モード探索候補の絞り込みは、Intra予測のみの絞り込みであるため、特許文献1の予測モード探索候補の絞り込みと同様に、Intra予測モードの探索と比べて長い計算時間を要するInter予測モード探索の削減効果はない。つまり、Inter予測モード探索については、改良の余地をそのまま残している。
このようなことを背景にして、本発明者は、下記の非特許文献3で、予測モードの使用に制限を設けることなく行ったスケーラブル動画像符号化で選択された最適予測モードの情報に基づいて、空間的に対応するブロックで選択された上位レイヤと下位レイヤの最適予測モードの組み合わせの発生率を求めることで、その最適予測モードの組み合わせとその発生率との対応関係について記述する対応表を生成するようにして、上位レイヤのブロックを符号化する場合に、下位レイヤの空間的に対応するブロックの符号化で選択された最適予測モードの情報を取得して、その取得した最適予測モードの情報とその対応表とに基づいて、上位レイヤのブロックの符号化で探索する予測モードの探索候補を絞り込むようにするという発明を開示した。
特開2006−033451号公報 特開2005−184241号公報
T. Wiegand, G. Sullivan, J. Reichel, H. Schwarz and M. Wien :"Joint Draft ITU-T Rec. H.264|ISO/IEC 14496-10 / Amd.3 Scalable video coding," ISO/IEC JTC1/SC29/WG11 and ITU-T SG16 Q.6, JVT-X201,2007. http://ftp3.itu.ch/av-arch/jvt-site/2007_06_Geneva/JVTX201.zip J. Reichel, H. Schwarz and M. Wien: "Joint Scalable Video Model JSVM-11," ISO/IEC JTC1/SC29/WG11 and ITU-T SG16 Q.6, JVT-X202, 2007. http://ftp3.itu.ch/av-arch/jvt-site/2007_06_Geneva/JVTX202.zip 早瀬和也, 坂東幸浩, 高村誠之, 上倉一人, 八島由幸: "SVCにおけるレイヤ間予測モード相関性を利用したモード選択高速化",画像符号化シンポジウムPCSJ2008.
本発明者が非特許文献3で開示した発明は、スケーラブル動画像符号化におけるレイヤ間の予測モードの相関性を利用して、拡張レイヤにおけるマクロブロックの予測モードの探索候補を絞り込むようにすることから、スケーラブル動画像符号化の高速化を実現することができるようになる。
しかしながら、非特許文献3で開示した発明では、上位レイヤのブロックと下位レイヤのブロックとが空間的に1対1に対応するというレイヤ構造を想定しており、そのようなレイヤ構造を持たない場合には適用できないという問題が残されている。
すなわち、非特許文献3で開示した発明は、上位レイヤと下位レイヤとの間に2のべき乗の解像度スケーラビリティが成立する場合には適用できるものの、2のべき乗の解像度スケーラビリティが成立しない場合には、拡張レイヤのマクロブロックの直下の画像領域に複数の最適予測モードが存在することになることから適用できないのである。
ちなみに、上位レイヤの映像から一部の映像を切り出すことで下位レイヤの映像を生成する場合にも、上位レイヤのブロックと下位レイヤのブロックとが空間的に1対1に対応しないレイヤ構造をとることになり、この問題は、そのような場合にも同様に発生することになる。
本発明はかかる事情に鑑みてなされたものであり、レイヤ構造によってスケーラビリティを実現するスケーラブル動画像符号化において、レイヤ間の最適予測モードの相関性を利用して上位レイヤの予測モード探索候補の絞り込みを行い高速化する新たなスケーラブル動画像符号化技術の実現を目的とするものであり、さらに、この実現にあたって、レイヤ構造が上位レイヤのブロックと下位レイヤのブロックとが空間的に1対1に対応しない構造をとる場合に、その高速化を実現できるようにすることを目的とする。
〔1〕本発明の基本的な考え方
この目的を達成するために、本発明では、レイヤ構造によってスケーラビリティを実現するスケーラブル動画像符号化において、
(i)予測モード対応率表(レイヤ間の最適予測モードの相関性について記述する
表)の生成
(ii)予測モード対応率表を使った予測モード探索候補の絞り込み
という2つの処理によって予測モード探索の高速化を実現する。
このとき、レイヤ構造が上位レイヤのブロックと下位レイヤのブロックとが空間的に1対1に対応しない構造をとることを考慮して、予測モード対応率表を生成するように処理するとともに、そのことを考慮して、予測モード対応率表を使った予測モード探索候補の絞り込みを実行するように処理する。
以降、図1のような例に従って説明を進める。すなわち、レイヤLとレイヤL−1の両方が、IBBBPの階層的B構造で符号化をしていると仮定する。図中の矢印は予測参照先を示している。符号化対象レイヤをL、符号化対象フレームをB2bとし、予測モード対応率表の生成対象フレームをB2aとする。また、B2bの同一時刻のレイヤL−1のフレームをB’2b、B2aの同一時刻のレイヤL−1のフレームをB’2aとする。時間レベルが低い順に符号化され、同一時間レベル中では時間が早いフレーム順に符号化されるとする。また、レイヤはレベルが小さい順に符号化されるとする。
次に、図2に示すフローチャートに従って、本発明の処理の大きな流れについて説明する。
本発明では、動画像をスケーラブル符号化する場合、図2のフローチャートに示すように、まず最初に、ステップS101で、変数nに1をセットし、続くステップS102で、全てのフレームを符号化したのか否かを判断して、全てのフレームを符号化したことを判断する場合には、処理を終了する。
一方、ステップS102の判断処理に従って、全てのフレームを符号化していないことを判断するときには、ステップS103に進んで、先頭フレームからの順番に従って、未処理のフレームを1つ選択し、続くステップS104で、使用可能なものとして定義された予測モードの使用に制限を加えることなく予測を行うことで、その選択したフレームを符号化する。
続いて、ステップS105で、変数nの値を1つインクリメントし、続くステップS106で、変数nの値が所定の閾値N1(N1は1以上の整数)よりも大きくなったのか否かを判断して、閾値N1よりも大きくなっていないことを判断するときには、ステップS102の処理に戻ることで、使用可能なものとして定義された予測モードの使用に制限を加えることなくフレームを符号化することを続行する。
一方、ステップS106の判断処理で、変数nの値が閾値N1よりも大きくなったことを判断するときには、ステップS107に進んで、後述するようなデータ構造を持つ、レイヤ間の最適予測モードの相関性について記述する予測モード対応率表を生成する。
続いて、ステップS108で、変数nに1をセットし、続くステップS109で、全てのフレームを符号化したのか否かを判断して、全てのフレームを符号化したことを判断する場合には、処理を終了する。
一方、ステップS109の判断処理に従って、全てのフレームを符号化していないことを判断するときには、ステップS110に進んで、先頭フレームからの順番に従って、未処理のフレームを1つ選択し、続くステップS111で、予測モード対応率表を使って予測モードの探索候補の絞り込みを行いつつ予測を行うことで、その選択したフレームを符号化する。
続いて、ステップS112で、変数nの値を1つインクリメントし、続くステップS113で、変数nの値が所定の閾値N2(N2は1以上の整数)よりも大きくなったのか否かを判断して、閾値N2よりも大きくなっていないことを判断するときには、ステップS109の処理に戻ることで、予測モード対応率表を使って予測モードの探索候補の絞り込みを行いつつフレームを符号化することを続行する。
一方、ステップS113の判断処理で、変数nの値が閾値N2よりも大きくなったことを判断するときには、予測モード対応率表を更新する必要があることを判断して、ステップS101の処理に戻ることで、予測モード対応率表を更新しつつ、ステップS101〜ステップS113の処理を続行する。
このように、本発明では、動画像をスケーラブル符号化する場合に、N1枚のフレームを符号化した後、その符号化結果に基づいて、レイヤ間の最適予測モードの相関性について記述する予測モード対応率表を生成し、続いて、それに続くN2枚のフレームの符号化に入って、その生成した予測モード対応率表を使って予測モードの探索候補の絞り込みを行いつつ、そのN2枚のフレームを符号化することを繰り返していくように処理するのである。
(i)予測モード対応率表の生成処理
次に、ステップS107で実行する予測モード対応率表の生成処理について説明する。以降の説明は、レイヤL−1がレイヤLの映像の切り出し処理によって生成される任意倍率の空間スケーラブル符号化を行う場合の例である。
ここで、この切り出し処理では、例えば、レイヤLの映像の上下左右の端の部分を取り除くことでレイヤL−1の映像を生成することになり、これにより、上位レイヤのブロックと下位レイヤのブロックとが空間的に1対1に対応しないレイヤ構造をとることになる。
ステップS104の処理に従って、図1に示す予測モード対応率表の生成対象フレームB2aとその直下のB’2aはすでに符号化済みであり、最適予測モードはすでに選択されている。
フレームB2aとB’2aの符号化時には、選択された最適予測モードの情報をバッファに格納しておく。そして、そのバッファに格納されるフレームB2aのマクロブロック(以下、MBと略記する)の最適予測モードと、フレームB’2aの空間的に対応する画像領域に含まれるブロックが属するMBの最適予測モードとの対応関係を調べる。
図3に、これらの空間的な位置関係を示す。レイヤL−1の映像がレイヤLの映像を切り取ることによって生成された場合、フレームB2aのMBと空間的に対応するフレームB’2aのブロックは最大4つ存在しうる。ここでは例として、4つ存在しうるとし、それらのブロックをそれぞれBLK1〜BLK4と定める。
予測モード対応率表の生成は、以降に記す2つの手順で行われる。
まず、フレームB2aのMBがある予測モードであるとき、その直下のフレームB’2aのBLK1〜4ではどの予測モードが選択されているのかを解析し、その対応する組み合わせの画素数を計算する。そして、その画素数を図4に示すような表の各セルに入力していき、その数値を累積加算していく。例えば、フレームB2aでP16×16が選択されたMBの直下の画像領域の25画素においてP8×16が選択された、ということになる。
次に、図5に示すような予測モード対応率表を生成する。図5の数値は、図4の横軸の各予測モードの累積画素数で各セルの画素数を割ったものである。これは、フレームB’2aのある画像領域においてある予測モードが選ばれているときに、その直上のフレームB2aのMBで選ばれた各予測モードの割合を示している。
フレームB2aやB’2aにおける最適予測モードの選択方法は、非特許文献2に記したJSVMの方法でもよいし、特許文献1に記したような予測モード探索候補の絞り込みを行う方法でもよい。また、この例では、予測モード対応率表の生成対象フレームは符号化対象フレームと同一時間レイヤの符号化済みフレーム1枚としているが、これに限らない。異なる時間レイヤの符号化済みフレーム(例えば、フレームB1)を生成対象としてもよい。また、複数のフレームを生成対象(例えば、フレームB1とB2a)として、その複数のフレームの累積で予測モード対応率表を計算してもよい。つまり、符号化対象レイヤおよびその直下レイヤにおいて符号化済みのフレームであれば、予測モード対応率表の生成対象フレームと成りうる。
(ii)予測モード対応率表を使った予測モード探索候補の絞り込み処理
次に、ステップS111で実行する予測モード対応率表を使った予測モード探索候補の絞り込み処理について説明する。
ステップS107で生成した予測モード対応率表中の予測モード対応率の値に従って、符号化対象フレームB2bの各MBにおいて、予測モード探索候補を絞り込む。この予測モード対応率表の中の数値を、符号化対象フレームB2bにおける各予測モードの発生確率とみなす。つまり、フレームB’2bのある画像領域において最適予測モードj(図5に示す予測モード対応率表の縦軸の予測モード)が選択されているときに、符号化対象フレームB2bの空間的に対応する画像領域が属するMBにおいて予測モードi(図5に示す予測モード対応率表の横軸の予測モード)が最適となる確率が各セルに記述されている、とみなす。
符号化対象フレームB2bの符号化対象マクロブロックをMBL と表記し、MBL と空間的に同一位置にあるレイヤL−1のフレームB’2bのブロックをBLK1L-1 、BLK2L-1 、BLK3L-1 、BLK4L-1 と表記する。
まず、下記の(a)〜(c)に示す3つのいずれかの方法に従って、予測モード対応率表の縦軸jに入力する参照予測モードを決定する。
ここで、参照予測モードについては、1つの予測モードを参照予測モードとして決定することも可能であるし、複数の予測モードを参照予測モードとして決定することも可能であるが、下記に示す例では、1つの参照予測モードを決定することを想定している。
(a)累積面積が最大となる予測モード
BLK1L-1 〜BLK4L-1 の内で、累積の面積が最大となるブロックの予測モードを同定し、それを予測モード対応率表の参照予測モードとする。このとき、累積面積が同じになる予測モードがある場合には、あらかじめ決められた手法に従って決定する。例えば、後述の(b)や(c)の手法などが考えられる。累積面積の対象となるブロックは、BLK1L-1 〜BLK4L-1 にとどまる必要はない。あらかじめ決められた範囲にある当該領域の周囲のブロックを含めてもよい。さらに、距離情報などを参考に、それらの面積に重み付けをして累積を求めてもよい。
(b)優先順位が最も高い予測モード
あらかじめ初期の予測モード間で優先順位付けを行っておき、BLK1L-1 〜BLK4L-1 がとりうる各予測モードの中で、最も優先順位の高い予測モードを同定し、それを予測モード対応率表の参照予測モードとする。この優先順位のつけ方として例としては、高速性を重視して絞り込みが厳しく行われる順に優先順位を高くする方法や、反対に、符号化性能を重視して絞り込みが少ない順に優先順位を高くする方法などが考えられる。
(c)レイヤ間予測で参照する予測モード
レイヤ間で参照する予測モードを調査し、それを予測モード対応率表の参照予測モードとする。
このようにして、予測モード対応率表の縦軸jに入力する参照予測モードを決定すると、次に、予測モード対応率表と参照予測モードとを照合し、符号化対象マクロブロックMBL において各予測モードが最適となりうる確率を調査する。ここで、参照予測モードは図5の縦軸に入力される予測モードとなる。そして、この最適予測モードとなりうる確率をもとに予測モード探索候補を絞り込む。下記に、絞り込みの例を2つ示す。
(イ)絞り込み手法1
絞り込み手法1は、予測モード探索候補絞り込み閾値を用いて予測モード探索候補を絞り込む手法である。
この絞り込み手法1では、予測モード探索候補絞り込み閾値t%を設け、この閾値t%未満の予測モードを探索候補から除外する。閾値tの値は外部より与える。値の決定方法としては、符号化性能の劣化を許容範囲以内に抑える値を複数回のエンコード処理により決定する方法が一例に考えられる。
ここで、参照予測モードの情報を取得した時点に、予測モード対応率表からMBL における各予測モードの最適予測モードとなりうる確率(対応率)を読み出して、予測モード探索候補絞り込み閾値と比較するという方法を用いると、その比較処理が煩雑なものとなる。
そこで、前もって、予測モード対応率表の対応率を予測モード探索候補絞り込み閾値で閾値処理しておいて、予測モード対応率表の対応率を2値化しておくようにする。
図6に、図5に示す予測モード対応率表において予測モード探索候補絞り込み閾値5%と設定した場合の予測モード探索候補の絞り込み結果を図示する。図中に示す○が探索候補、×が探索候補から除外された予測モードを示している。
(ロ)絞り込み手法2
絞り込み手法2は、予測モード対応率が最大となる予測モードのみを探索候補と設定する手法である。
予測モード対応率が最大となる予測モードを探索候補として設定する。通常はここで1つの予測モードに絞られるが、最大値を与える予測モード探索候補が複数ある場合には、それらをすべて探索候補として設定する。
ここで、参照予測モードの情報を取得した時点に、予測モード対応率表からMBL における各予測モードの最適予測モードとなりうる確率(対応率)を読み出して、その中から最大値の対応率を特定するという方法を用いると、その特定処理が煩雑なものとなる。
そこで、前もって、予測モード対応率表の対応率の中に含まれる最大値の対応率を特定しておいて、予測モード対応率表の対応率を2値化しておくようにする。
図7に、図5に示す予測モード対応率表において最大値の予測モードを予測モード探索候補として設定した場合の絞り込み結果を図示する。図中に示す○が探索候補、×が探索候補から除外された予測モードを示している。
〔2〕本発明の構成
次に、本発明の構成について説明する。
本発明のスケーラブル動画像符号化装置は、上位レイヤのブロックと下位レイヤのブロックとが空間的に1対1に対応しないレイヤ構造を処理対象とするスケーラブル動画像符号化において予測モード探索の高速化を実現するために、(1)予測モードの使用に制限を設けることなく行ったスケーラブル符号化で選択された最適予測モードに基づいて、上位レイヤのブロックとその直下の下位レイヤの画像領域で選択された最適予測モードの組み合わせの発生率を求めて、その最適予測モードの組み合わせとその発生率との対応関係について記述する対応表を生成する生成手段と、(2)上位レイヤのブロックを符号化する場合に、その直下の下位レイヤの画像領域で選択された最適予測モードの情報を取得する取得手段と、(3)取得手段の取得した最適予測モードの中から処理対象の最適予測モードを選択する選択手段と、(4)選択手段の選択した最適予測モードと生成手段の生成した対応表に記述される発生率とに基づいて、その対応表に記述される最適予測モードの組み合わせの中から有効な組み合わせを抽出して、その抽出した組み合わせの持つ上位レイヤの最適予測モードを、上位レイヤのブロックの符号化で探索する予測モード探索候補として決定する決定手段と、(5)対応表を用いて実行される予測モードの使用に制限を設けるスケーラブル符号化と、対応表を用いないで実行される予測モードの使用に制限を設けないスケーラブル符号化とを交互に繰り返すように制御する制御手段とを備えるように構成する。
この構成をとるときに、選択手段は、上位レイヤのブロックと下位レイヤの画像領域との重なりの大きさに基づいて、処理対象の最適予測モードを選択したり、あらかじめ設定された予測モードの優先順位に基づいて、処理対象の最適予測モードを選択したり、レイヤ間予測で参照する予測モードがある場合には、その予測モードを優先する形で処理対象の最適予測モードを選択することがある。
ここで、選択手段は、取得手段の取得した最適予測モードのすべてを処理対象の最適予測モードとして選択するようにしてもよい。
また、生成手段は、上位レイヤのブロックと下位レイヤのブロックとが空間的に1対1に対応しないことを考慮して、上位レイヤのブロックで選択された最適予測モードのそれぞれについて、そのブロックの直下の下位レイヤの画像領域の画素数をその画像領域で選択された最適予測モード毎に集計して、その集計結果に基づいて対応表を生成することがある。
このように構成される本発明のスケーラブル動画像符号化装置では、選択手段は、上位レイヤのブロックと下位レイヤのブロックとが空間的に1対1に対応しないことで、取得手段の取得した最適予測モードが複数となることがあることを考慮して、その中から処理対象の最適予測モードを選択する。
例えば、取得手段の取得した最適予測モードの中から処理対象となる1つの最適予測モードを選択する場合、取得手段の取得した最適予測モードが1つである場合には、その最適予測モードを選択し、一方、取得手段の取得した最適予測モードが複数である場合には、上位レイヤのブロックと最も重なりの大きい直下の下位レイヤの画像領域で選択された最適予測モードを選択したり、あらかじめ設定された予測モードの優先順位に従って、その複数の最適予測モードの中の最も優先順位の高い最適予測モードを選択したり、その複数の最適予測モードの中にレイヤ間予測で参照する予測モードがある場合には、その予測モードを選択する。
ここで、選択手段の選択した最適予測モードが前述した参照予測モードに相当することになる。
この選択手段による選択処理を受けて、決定手段は、選択手段の選択した最適予測モードの情報をキーにして対応表を参照することで、その最適予測モードに対応付けられる発生率を特定して、その特定した発生率に含まれる所定の閾値よりも大きな値を示す発生率を持つ最適予測モードの組み合わせを抽出したり、その特定した発生率に含まれる最も大きな値を示す発生率を持つ最適予測モードの組み合わせを抽出したり、その特定した発生率に含まれるその値の大きな順に選択される所定の個数の発生率を持つ最適予測モードの組み合わせを抽出し、そして、その抽出した最適予測モードの組み合わせの持つ上位レイヤの最適予測モードを、上位レイヤのブロックの符号化で探索する予測モード探索候補として決定する。
さらに、決定手段による決定処理が効率的な処理になることを実現するために、本発明のスケーラブル動画像符号化装置は、前もって、対応表に記述される発生率の値に基づいて、対応表に記述される最適予測モードの組み合わせを絞り込むことで有効な最適予測モードの組み合わせを抽出して、その抽出した有効な最適予測モードの組み合わせについて記述する予測モード対応情報を生成するようにする。
この場合には、本発明のスケーラブル動画像符号化装置は、(1)予測モードの使用に制限を設けることなく行ったスケーラブル符号化で選択された最適予測モードに基づいて、上位レイヤのブロックとその直下の下位レイヤの画像領域で選択された最適予測モードの組み合わせの発生率を求めて、その最適予測モードの組み合わせとその発生率との対応関係について記述する対応表を生成する対応表生成手段と、(2)対応表生成手段の生成した対応表に記述される発生率の値に基づいて、対応表に記述される最適予測モードの組み合わせを絞り込むことで有効な最適予測モードの組み合わせを抽出して、その抽出した有効な最適予測モードの組み合わせについて記述する予測モード対応情報を生成する予測モード対応情報生成手段と、(3)上位レイヤのブロックを符号化する場合に、その直下の下位レイヤの画像領域で選択された最適予測モードの情報を取得する取得手段と、(4)取得手段の取得した最適予測モードの中から処理対象の最適予測モードを選択する選択手段と、(5)選択手段の選択した最適予測モードを組み合わせに持つ予測モード対応情報を参照することで、上位レイヤのブロックの符号化で探索する予測モード探索候補を決定する決定手段と、(6)対応表を用いて実行される予測モードの使用に制限を設けるスケーラブル符号化と、対応表を用いないで実行される予測モードの使用に制限を設けないスケーラブル符号化とを交互に繰り返すように制御する制御手段とを備えるように構成する。
この構成をとるときに、予測モード対応情報生成手段は、図6に示すように、所定の閾値よりも大きな値を示す発生率を持つ最適予測モードの組み合わせを有効なものとして抽出することで予測モード対応情報を生成したり、図7に示すように、下位レイヤについて同一の最適予測モードを持つ最適予測モードの組み合わせの中から、最も大きな値を示す発生率を持つ最適予測モードの組み合わせを有効なものとして抽出することで予測モード対応情報を生成したり、大きな値を示す発生率の順に選択される所定の個数の最適予測モードの組み合わせを有効なものとして抽出することで予測モード対応情報を生成することがある。
以上の各処理手段が動作することで実現される本発明のスケーラブル動画像符号化方法はコンピュータプログラムでも実現できるものであり、このコンピュータプログラムは、適当なコンピュータ読み取り可能な記録媒体に記録して提供されたり、ネットワークを介して提供され、本発明を実施する際にインストールされてCPUなどの制御手段上で動作することにより本発明を実現することになる。
本発明では、上位レイヤのブロックと下位レイヤのブロックとが空間的に1対1に対応しないレイヤ構造を処理対象とするスケーラブル動画像符号化において、レイヤ間の最適予測モードの相関性を利用して上位レイヤの予測モード探索候補の絞り込みを行うことから、符号化時間を削減することができるようになる。
そして、本発明では、予測モード探索候補を絞り込むことで符号化時間の削減を図るときに、符号化済みフレームにおけるレイヤ間の最適予測モードの対応関係をもとに、その絞り込みを行うことから、最適予測モードが絞り込みによって省かれてしまう危険性を回避できることで、予測モード探索候補を絞り込むことにより発生する可能性がある符号化性能の低下を抑制することができるようになる。
予測モード対応率表の生成対象となるフレームと符号化対象フレームとの一例を示す説明図である。 本発明の処理の大きな流れを示すフローチャートである。 上位レイヤと下位レイヤの空間的な位置関係の説明図である。 予測モード対応率表の生成のために作成される表の説明図である。 予測モード対応率表の説明図である。 予測モード探索候補の絞り込み結果の説明図である。 予測モード探索候補の絞り込み結果の説明図である。 本発明により実行されるスケーラブル動画像符号化処理のフローチャートである。 本発明により実行されるスケーラブル動画像符号化処理のフローチャートである。 本発明により実行されるスケーラブル動画像符号化処理のフローチャートである。 本発明を具備するスケーラブル動画像符号化装置の装置構成図である。 本発明を具備するスケーラブル動画像符号化装置の装置構成図である。 本発明を具備するスケーラブル動画像符号化装置の装置構成図である。 本発明の有効性を説明するための図である。
以下、実施の形態に従って本発明を詳細に説明する。
図8〜図10に、本発明により実行されるスケーラブル動画像符号化処理のフローチャートを図示する。
図8は、本発明により実行されるスケーラブル動画像符号化処理の全体的なフローチャートであり、図9と図10のそれぞれは、図8のフローチャートのステップS201で実行する処理の詳細なフローチャートの一例である。
次に、これらのフローチャートに従って、本発明により実行されるスケーラブル動画像符号化処理について詳細に説明する。
ここで、本発明の符号化処理は拡張レイヤに対する処理であり、基本レイヤには非スケーラブルのシングルレイヤ符号化処理を適用する。シングルレイヤ符号化処理の一例には、非特許文献2で挙げたSVCの参照エンコーダJSVMの基本レイヤ部分の符号化処理が挙げられる。
まず最初に、図8のフローチャートで実行するステップS201〜ステップS206の処理について説明する。
ステップS201:符号化対象マクロブロック(MB)において探索する予測モード探索候補の初期値を読み込み、最終的に符号化対象MBにおいて探索する予測モードの探索候補を決定して、レジスタに格納する。本処理の詳細については、図9および図10で後述する。
ステップS202:ステップS201の処理によって格納された予測モード探索候補の情報をレジスタより読み込み、各予測モード探索候補の探索を実行し、符号化に利用する最適予測モードを1つ決定して、その情報をレジスタに格納する。最適予測モードの決定方法の一例としては、JSVMで行われている符号量と符号化歪みの線形和で表現される符号化コストを最小化する予測モードを最適とする方法が挙げられる。
ステップS203:符号化対象MBにおける最適予測モードの情報をレジスタより読み込み、その最適予測モードにて動き補償を行い、予測残差信号を生成して、バッファに格納する。
ステップS204:予測残差信号をバッファより読み込み、その予測残差信号の符号化を行い、符号化データをバッファに格納する。本処理の一例には、非特許文献2で挙げたSVCの参照エンコーダJSVMにおける、DCT、量子化、可変長符号化の一連処理が挙げられる。
ステップS205:全てのMBの符号化が完了したのか否かの判定処理を行い、全てのMBの符号化が完了した場合には符号化処理を終了し、バッファより各MBの符号化データおよび必要なその他のヘッダ情報を読み込み、最終的な符号化データとして出力する。一方、全てのMBの符号化が完了していない場合にはステップS206の処理に移る。
ステップS206:次の符号化対象MBに移り、ステップS201の処理を行う。
次に、図9のフローチャートで実行するステップS301〜ステップS307の処理について説明することで、ステップS201で実行する処理の具体的な内容の一例について説明する。
ステップS301:符号化対象MBが本発明を適用する予測モード探索候補絞り込み対象MBであるのか否かについて指定する情報を読み込み、予測モード探索候補絞り込み対象MBである場合には、ステップS302の処理に移り、予測モード探索候補絞り込み対象MBでない場合には、予測モード探索候補の初期値を最終的な予測モード探索候補として出力する。
ステップS302:予測モード対応率表の計算対象とする符号化済みフレームの指定情報を外部より読み込み、その指定フレームの予測モード情報をレジスタに格納する。
ステップS303:予測モード対応率表の計算対象フレームにおける予測モード情報(符号化で用いられた最適な予測モードの情報)を読み込み、符号化対象レイヤとその直下レイヤの最適予測モードの対応率(発生率)を計算して、予測モード対応率表としてレジスタに格納する。すなわち、前述した手順に従って、図4に示すような予測モード対応率表の生成のための表を作成して、それに基づいて、図5に示すような予測モード対応率表を生成してレジスタに格納するのである。
ステップS304:符号化対象MBの直下画像領域における1つ以上の最適予測モード群を読み込み、ある規範に従って、その中から予測モード対応率表の縦軸に用いる参照予測モードを1つ決定して、それをレジスタに出力する。ここで、参照予測モード決定の規範の例としては、前述した、(a)累積面積が最大となる予測モード、(b)優先順位が最も高い予測モード、(c)レイヤ間予測で参照する予測モード、などが適用可能である。
ステップS305:参照予測モードに対応付けられる予測モード対応率表部分の情報を読み込み、それをバッファに格納する。
ステップS306:予測モード探索候補絞り込み閾値を読み込み、それをレジスタに格納する。
ステップS307:参照予測モードに対応付けられる予測モード対応率表部分の情報をバッファより読み込むとともに、予測モード探索候補絞り込み閾値をレジスタより読み込み、対応率(発生率)が予測モード探索候補絞り込み閾値以上の予測モードのみを予測モード探索候補として設定して、その情報をレジスタに格納する。ここで、この設定・格納にあたっては、基本レイヤの符号化で得られた最適予測モードに対応付けられる予測モード探索候補のみを選択して、設定・格納することになる。
このようにして、図8のフローチャートでは、図9のフローチャートの処理に従ってステップS201の処理を実行する場合には、図5に示すようなデータ構造を持つ予測モード対応率表に基づいて、図6に示すような形態で予測モード探索候補を絞り込むように処理するのである。
次に、図10のフローチャートで実行するステップS401〜ステップS406の処理について説明することで、ステップS201で実行する処理の具体的な内容の他の一例について説明する。
ステップS401:符号化対象MBが本発明を適用する予測モード探索候補絞り込み対象MBであるのか否かについて指定する情報を読み込み、予測モード探索候補絞り込み対象MBである場合には、ステップS402の処理に移り、予測モード探索候補絞り込み対象MBでない場合には、予測モード探索候補の初期値を最終的な予測モード探索候補として出力する。
ステップS402:予測モード対応率表の計算対象とする符号化済みフレームの指定情報を外部より読み込み、その指定フレームの予測モード情報をレジスタに格納する。
ステップS403:予測モード対応率表の計算対象フレームにおける予測モード情報(符号化で用いられた最適な予測モードの情報)を読み込み、符号化対象レイヤとその直下レイヤの最適予測モードの対応率(発生率)を計算して、予測モード対応率表としてレジスタに格納する。すなわち、前述した手順に従って、図4に示すような予測モード対応率表の生成のための表を作成して、それに基づいて、図5に示すような予測モード対応率表を生成してレジスタに格納するのである。
ステップS404:符号化対象MBの直下画像領域における1つ以上の最適予測モード群を読み込み、ある規範に従って、その中から予測モード対応率表の縦軸に用いる参照予測モードを1つ決定して、それをレジスタに出力する。ここで、参照予測モード決定の規範の例としては、前述した、(a)累積面積が最大となる予測モード、(b)優先順位が最も高い予測モード、(c)レイヤ間予測で参照する予測モード、などが適用可能である。
ステップS405:参照予測モードに対応付けられる予測モード対応率表部分の情報を読み込み、それをバッファに格納する。
ステップS406:参照予測モードに対応付けられる予測モード対応率表部分の情報をバッファより読み込み、対応率(発生率)が最大の予測モードのみを予測モード探索候補として設定し、その情報をレジスタに格納する。ここで、この設定・格納にあたっては、基本レイヤの符号化で得られた最適予測モードに対応付けられる予測モード探索候補のみを選択して、設定・格納することになる。
このようにして、図8のフローチャートでは、図10のフローチャートの処理に従ってステップS201の処理を実行する場合には、図5に示すようなデータ構造を持つ予測モード対応率表に基づいて、図7に示すような形態で予測モード探索候補を絞り込むように処理するのである。
図11〜図13に、本発明を具備するスケーラブル動画像符号化装置の装置構成を図示する。
図11は、本発明を具備するスケーラブル動画像符号化装置の全体的な装置構成であり、図12と図13のそれぞれは、図11に示す予測モード探索候補決定部102の詳細な装置構成の一例である。
次に、これらの装置構成図に従って、本発明を具備するスケーラブル動画像符号化装置について詳細に説明する。
ここで、本発明を具備するスケーラブル動画像符号化装置は、拡張レイヤに対する処理装置であり、基本レイヤには非スケーラブルのシングルレイヤ符号化処理を適用する。シングルレイヤ符号化処理の一例には、非特許文献2で挙げたSVCの参照エンコーダJSVMの基本レイヤ部分の符号化処理が挙げられる。
まず最初に、図11に従って、本発明を具備するスケーラブル動画像符号化装置の全体構成について説明する。
予測モード探索候補初期値記憶部101:予測モード探索候補の初期値を読み込み、レジスタに出力する。
予測モード探索候補決定部102:予測モード探索候補の初期値を読み込み、最終的に探索する予測モード探索候補を決定し、その最終的に決定した予測モード探索候補の情報をレジスタに出力して、最適予測モード決定部103に移る。本処理部の詳細な構成については、図12および図13で後述する。
最適予測モード決定部103:予測モード探索候補をレジスタより読み込み、各予測モード探索候補について探索を実行し、符号化に利用する最適予測モードを1つ決定して、その情報を最適予測モード記憶部104に出力する。最適予測モードの決定方法の一例としては、JSVMで行われている符号量と符号化歪みの線形和で表現される符号化コストを最小化する予測モードを最適とする方法が挙げられる。
予測残差信号生成部105:最適予測モード記憶部104より符号化対象MBにおける最適予測モードを読み込み、その最適予測モードにて動き補償を行い、予測残差信号を生成して、バッファに出力する。
予測残差信号符号化部106:符号化対象MBにおける予測残差信号をバッファより読み込み、その予測残差信号の符号化を行い、符号化データをバッファに出力する。本処理の一例に、H.264/AVCの参照エンコーダJMや、非特許文献2で挙げたSVCの参照エンコーダJSVMのDCT、量子化、可変長符号化の一連処理の適用が考えられる。
全MB完了判定部107:全てのMBの符号化が完了したのか否かの判定処理を行い、全てのMBの符号化が完了した場合には符号化処理を終了して、最終的な符号化データを出力し、全てのMBの符号化が完了していない場合には符号化対象MB更新部108の処理に移る。
符号化対象MB更新部108:次の符号化対象MBに移り、予測モード探索候補決定部102の処理を行う。
次に、図12に従って、予測モード探索候補決定部102の詳細な構成の一例について説明する。
予測モード探索候補絞り込み対象MB指定情報記憶部201:予測モード探索候補の絞り込みを行うMBであるのか否かについて指定する情報を読み込み、レジスタに出力する。
予測モード探索候補絞り込み対象MB判定部202:予測モード探索候補絞り込み対象MB指定情報記憶部201より予測モード探索候補の絞り込みを行うMBの指定情報を読み込み、符号化対象MBが絞り込みを行うMBであるのか否かの判定処理を行い、絞り込みを行うMBである場合には予測モード対応率表生成部206の処理に移り、絞り込みを行わないMBである場合には予測モード探索候補の初期値を最終的な予測モード探索候補として決定して、出力する。
予測モード対応率計算対象フレーム指定情報記憶部203:予測モード対応率の計算対象となる符号化済みのフレームの指定情報を読み込み、レジスタに出力する。
対象フレーム拡張レイヤ最適予測モード記憶部204:予測モード対応率計算対象フレーム指定情報記憶部203の読み込んだ指定情報の指す予測モード対応率の計算対象となるフレームについて、符号化対象レイヤにおける最適予測モード情報を読み込み、レジスタに出力する。
対象フレーム直下レイヤ最適予測モード記憶部205:予測モード対応率計算対象フレーム指定情報記憶部203の読み込んだ指定情報の指す予測モード対応率の計算対象となるフレームについて、符号化対象レイヤの直下レイヤにおける最適予測モード情報を読み込み、レジスタに出力する。
予測モード対応率表生成部206:対象フレーム拡張レイヤ最適予測モード記憶部204より予測モード対応率の計算対象フレームの符号化対象レイヤにおける最適予測モード情報を読み込むとともに、対象フレーム直下レイヤ最適予測モード記憶部205より予測モード対応率の計算対象フレームの符号化対象レイヤの直下レイヤにおける最適予測モード情報を読み込んで、符号化対象レイヤのマクロブロックとその直下の画像領域との間での最適予測モードの対応率(発生率)を計算して、予測モード対応率表として予測モード対応率表記憶部207に出力する。すなわち、前述した手順に従って、図4に示すような予測モード対応率表の生成のための表を作成して、それに基づいて、図5に示すような予測モード対応率表を生成して予測モード対応率表記憶部207に出力するのである。
参照予測モード決定部208:対象フレーム直下レイヤ最適予測モード記憶部205より、直下レイヤにおける1つ以上の最適予測モード群を読み込み、ある規範に従って、その中から予測モード対応率表の縦軸に用いる参照予測モードを1つ決定して、それを参照予測モード記憶部209に出力する。ここで、参照予測モード決定の規範の例としては、前述した、(a)累積面積が最大となる予測モード、(b)優先順位が最も高い予測モード、(c)レイヤ間予測で参照する予測モード、などが適用可能である。
予測モード対応率絞り込み閾値記憶部210:予測モード探索候補絞り込み閾値を読み込み、レジスタに出力する。
予測モード対応率閾値比較部211:予測モード対応率表記憶部207より予測モード対応率表を読み込むとともに、参照予測モード記憶部209より参照予測モードを読み込み、さらに、予測モード対応率絞り込み閾値記憶部210より予測モード対応率絞り込み閾値を読み込んで、参照予測モードに対応付けられる符号化対象MBの最適予測モードの発生確率を調査し、発生確率が予測モード対応率絞り込み閾値以上の予測モードのみを最終的な予測モード探索候補として設定して、出力する。
このようにして、図12に示す装置構成では、図5に示すようなデータ構造を持つ予測モード対応率表に基づいて、図6に示すような形態で予測モード探索候補を絞り込むように処理するのである。
次に、図13に従って、予測モード探索候補決定部102の詳細な構成の他の一例について説明する。
予測モード探索候補絞り込み対象MB指定情報記憶部301:予測モード探索候補の絞り込みを行うMBであるのか否かについて指定する情報を読み込み、レジスタに出力する。
予測モード探索候補絞り込み対象MB判定部302:予測モード探索候補絞り込み対象MB指定情報記憶部301より予測モード探索候補の絞り込みを行うMBの指定情報を読み込み、符号化対象MBが絞り込みを行うMBであるのか否かの判定処理を行い、絞り込みを行うMBである場合には予測モード対応率表生成部306の処理に移り、絞り込みを行わないMBである場合には予測モード探索候補の初期値を最終的な予測モード探索候補として決定して、出力する。
予測モード対応率計算対象フレーム指定情報記憶部303:予測モード対応率の計算対象となる符号化済みのフレームの指定情報を読み込み、レジスタに出力する。
対象フレーム拡張レイヤ最適予測モード記憶部304:予測モード対応率計算対象フレーム指定情報記憶部303の読み込んだ指定情報の指す予測モード対応率の計算対象となるフレームについて、符号化対象レイヤにおける最適予測モード情報を読み込み、レジスタに出力する。
対象フレーム直下レイヤ最適予測モード記憶部305:予測モード対応率計算対象フレーム指定情報記憶部303の読み込んだ指定情報の指す予測モード対応率の計算対象となるフレームについて、符号化対象レイヤの直下レイヤにおける最適予測モード情報を読み込み、レジスタに出力する。
予測モード対応率表生成部306:対象フレーム拡張レイヤ最適予測モード記憶部304より予測モード対応率の計算対象フレームの符号化対象レイヤにおける最適予測モード情報を読み込むとともに、対象フレーム直下レイヤ最適予測モード記憶部305より予測モード対応率の計算対象フレームの符号化対象レイヤの直下レイヤにおける最適予測モード情報を読み込んで、符号化対象レイヤのマクロブロックとその直下の画像領域との間での最適予測モードの対応率(発生率)を計算して、予測モード対応率表として予測モード対応率表記憶部307に出力する。すなわち、前述した手順に従って、図4に示すような予測モード対応率表の生成のための表を作成して、それに基づいて、図5に示すような予測モード対応率表を生成して予測モード対応率表記憶部307に出力するのである。
参照予測モード決定部308:対象フレーム直下レイヤ最適予測モード記憶部305より、直下レイヤにおける1つ以上の最適予測モード群を読み込み、ある規範に従って、その中から予測モード対応率表の縦軸に用いる参照予測モードを1つ決定して、それを参照予測モード記憶部309に出力する。ここで、参照予測モード決定の規範の例としては、前述した、(a)累積面積が最大となる予測モード、(b)優先順位が最も高い予測モード、(c)レイヤ間予測で参照する予測モード、などが適用可能である。
発生率最大予測モード特定部310:予測モード対応率表記憶部307より予測モード対応率表を読み込むとともに、参照予測モード記憶部309より参照予測モードを読み込んで、参照予測モードに対する符号化対象MBの最適予測モードの発生確率を調査し、発生確率が最大の予測モードを最終的な予測モード探索候補として設定して、出力する。
このようにして、図13に示す装置構成では、図5に示すようなデータ構造を持つ予測モード対応率表に基づいて、図7に示すような形態で予測モード探索候補を絞り込むように処理するのである。
次に、本発明の有効性について説明する。
前述したように、本発明者は、非特許文献3で、スケーラブル動画像符号化におけるレイヤ間の予測モードの相関性を利用して、拡張レイヤにおけるマクロブロックの予測モードの探索候補を絞り込むようにするという発明を開示した。
この発明によれば、拡張レイヤにおけるマクロブロックの予測モードの探索候補を絞り込むことができることから、スケーラブル動画像符号化処理の高速化を実現できるようになる。
しかしながら、この発明は、符号化対象ブロックと空間的に対応する直下の画像領域の持つ最適予測モードが1つである場合にのみ適用できるものであり、複数の最適予測モードを持つ場合には適用できない。
上位レイヤと下位レイヤとの間に2のべき乗の解像度スケーラビリティが成立しない場合や、上位レイヤの映像から一部の映像を切り出すことで下位レイヤの映像を生成する場合には、符号化対象ブロックと空間的に対応する直下の画像領域の持つ最適予測モードが複数となるので、非特許文献3に開示した発明は適用できないことになる。
これに対して、本発明は、符号化対象ブロックと空間的に対応する直下の画像領域が複数の最適予測モードを持つ場合であっても適用可能であり、非特許文献3に開示した発明よりも、符号化対象ブロックの予測モード選択を高速に実行できることになる。
例えば、図14に示すように、1920×1080画素サイズの映像を上位レイヤとし、それを横方向に3/4倍して生成した1440×1080画素サイズの映像を下位レイヤとする空間スケーラビリティを持つスケーラブル動画像符号化を実施したとする。
この場合、非特許文献3で開示した発明では、符号化対象ブロックと空間的に対応する直下の画像領域の持つ最適予測モードが1つのみの場合に適用可能であるという制約条件によって、上位レイヤの符号化の際に、総マクロブロック数の1/2の数のマクロブロックでしか高速予測モード探索を実施できない。これに対して、本発明では、すべてのマクロブロックに対して実施できることから、予測モード探索処理の絞り込みの行われるマクロブロックの数が非特許文献3に開示した発明と比較して2倍に増加する。
すなわち、図14に示すように、下位レイヤの4つのブロックa,b,c,dの内、ブロックa,dについては、最適予測モードを1つしか持たないのに対して、ブロックbについては、左のマクロブロックAで導出された最適予測モードと右のマクロブロックBで導出された最適予測モードとがあることで最適予測モードを2つ持つことになり、そして、ブロックcについては、左のマクロブロックBで導出された最適予測モードと右のマクロブロックCで導出された最適予測モードとがあることで最適予測モードを2つ持つことになる。
これから、非特許文献3で開示した発明では、上位レイヤの符号化の際に、4つのブロックa,b,c,dの内のブロックa,dの上位に位置する2つのマクロブロックでしか高速予測モード探索を実施できないのに対して、本発明では、4つのブロックa,b,c,dの上位に位置する4つのすべてのマクロブロックで高速予測モード探索を実施できることから、予測モード探索処理の絞り込みの行われるマクロブロックの数が非特許文献3に開示した発明と比較して2倍に増加するのである。
同様にして、本発明によれば、非特許文献3で開示した発明と比較して、予測モード探索処理の絞り込みの行われるマクロブロックの数が、
(1)1920×1080画素サイズと1280×720画素サイズとの空間スケーラ ビリティを持つスケーラブル動画像符号化では9/4倍
(2)1920×1080画素サイズと720×480画素サイズとの空間スケーラビ リティを持つスケーラブル動画像符号化では2倍
(3)1920×1080画素サイズと640×480画素サイズとの空間スケーラビ リティを持つスケーラブル動画像符号化では3/2倍
というように増加することになる。
したがって、本発明によれば、非特許文献3で開示した発明と比較して、符号化に要する計算時間を大幅に削減することができるようになる。
図示実施形態例に従って本発明を説明したが、本発明はこれに限定されるものではない。例えば、実施形態例では、基本レイヤ・拡張レイヤという階層レイヤ構成に対しての適用に従って本発明を説明したが、本発明はこのような階層レイヤ構成に、その適用が限られるものではない。
また、実施形態例では、参照予測モードとして1つの予測モードを選択するという構成をとったが、参照予測モードとして複数の予測モードを選択するようにするという構成をとることも可能である。
本発明は、レイヤ構造によってスケーラビリティを実現するスケーラブル動画像符号化に適用できるものであり、本発明を適用することで符号化時間を削減することができるようになる。
101 予測モード探索候補初期値記憶部
102 予測モード探索候補決定部
103 最適予測モード決定部
104 最適予測モード記憶部
105 予測残差信号生成部
106 予測残差信号符号化部
107 全MB完了判定部
108 符号化対象MB更新部
201 予測モード探索候補絞り込み対象MB指定情報記憶部
202 予測モード探索候補絞り込み対象MB判定部
203 予測モード対応率計算対象フレーム指定情報記憶部
204 対象フレーム拡張レイヤ最適予測モード記憶部
205 対象フレーム直下レイヤ最適予測モード記憶部
206 予測モード対応率表生成部
207 予測モード対応率表記憶部
208 参照予測モード決定部
209 参照予測モード記憶部
210 予測モード対応率絞り込み閾値記憶部
211 予測モード対応率閾値比較部
301 予測モード探索候補絞り込み対象MB指定情報記憶部
302 予測モード探索候補絞り込み対象MB判定部
303 予測モード対応率計算対象フレーム指定情報記憶部
304 対象フレーム拡張レイヤ最適予測モード記憶部
305 対象フレーム直下レイヤ最適予測モード記憶部
306 予測モード対応率表生成部
307 予測モード対応率表記憶部
308 参照予測モード決定部
309 参照予測モード記憶部
310 発生率最大予測モード特定部

Claims (12)

  1. 動画像をスケーラブルに符号化するスケーラブル動画像符号化方法であって、
    予測モードの使用に制限を設けることなく行ったスケーラブル符号化で選択された最適予測モードに基づいて、上位レイヤのブロックとその直下の下位レイヤの画像領域で選択された最適予測モードの組み合わせの発生率を求めて、その最適予測モードの組み合わせとその発生率との対応関係について記述する対応表を生成する過程と、
    上位レイヤのブロックを符号化する場合に、その直下の下位レイヤの画像領域で選択された最適予測モードの情報を取得する過程と、
    前記取得した最適予測モードの中から処理対象の最適予測モードを選択する過程と、
    前記選択した最適予測モードと前記対応表に記述される発生率とに基づいて、前記対応表に記述される最適予測モードの組み合わせの中から有効な組み合わせを抽出して、その抽出した組み合わせの持つ上位レイヤの最適予測モードを、上位レイヤのブロックの符号化で探索する予測モード探索候補として決定する過程とを備えることを、
    特徴とするスケーラブル動画像符号化方法。
  2. 動画像をスケーラブルに符号化するスケーラブル動画像符号化方法であって、
    予測モードの使用に制限を設けることなく行ったスケーラブル符号化で選択された最適予測モードに基づいて、上位レイヤのブロックとその直下の下位レイヤの画像領域で選択された最適予測モードの組み合わせの発生率を求めて、その最適予測モードの組み合わせとその発生率との対応関係について記述する対応表を生成する過程と、
    前記発生率の値に基づいて、前記対応表に記述される最適予測モードの組み合わせを絞り込むことで有効な最適予測モードの組み合わせを抽出して、その抽出した有効な最適予測モードの組み合わせについて記述する予測モード対応情報を生成する過程と、
    上位レイヤのブロックを符号化する場合に、その直下の下位レイヤの画像領域で選択された最適予測モードの情報を取得する過程と、
    前記取得した最適予測モードの中から処理対象の最適予測モードを選択する過程と、
    前記選択した最適予測モードを組み合わせに持つ前記予測モード対応情報を参照することで、上位レイヤのブロックの符号化で探索する予測モード探索候補を決定する過程とを備えることを、
    特徴とするスケーラブル動画像符号化方法。
  3. 請求項2に記載のスケーラブル動画像符号化方法において、
    前記予測モード対応情報を生成する過程では、所定の閾値よりも大きな値を示す発生率を持つ最適予測モードの組み合わせを有効なものとして抽出することを、
    特徴とするスケーラブル動画像符号化方法。
  4. 請求項2に記載のスケーラブル動画像符号化方法において、
    前記予測モード対応情報を生成する過程では、下位レイヤについて同一の最適予測モードを持つ最適予測モードの組み合わせの中から、最も大きな値を示す発生率を持つ最適予測モードの組み合わせを有効なものとして抽出するか、あるいは、大きな値を示す発生率の順に選択される所定の個数の最適予測モードの組み合わせを有効なものとして抽出することを、
    特徴とするスケーラブル動画像符号化方法。
  5. 請求項1ないし4のいずれか1項に記載のスケーラブル動画像符号化方法において、
    前記最適予測モードを選択する過程では、上位レイヤのブロックと下位レイヤの画像領域との重なりの大きさに基づいて、処理対象の最適予測モードを選択することを、
    特徴とするスケーラブル動画像符号化方法。
  6. 請求項1ないし4のいずれか1項に記載のスケーラブル動画像符号化方法において、
    前記最適予測モードを選択する過程では、あらかじめ設定された予測モードの優先順位に基づいて、処理対象の最適予測モードを選択することを、
    特徴とするスケーラブル動画像符号化方法。
  7. 請求項1ないし6のいずれか1項に記載のスケーラブル動画像符号化方法において、
    前記最適予測モードを選択する過程では、前記取得した最適予測モードの中にレイヤ間予測で参照する予測モードがある場合には、その予測モードを処理対象の最適予測モードとして選択することを、
    特徴とするスケーラブル動画像符号化方法。
  8. 請求項1ないし7のいずれか1項に記載のスケーラブル動画像符号化方法において、
    前記対応表を生成する過程では、上位レイヤのブロックで選択された最適予測モードのそれぞれについて、そのブロックの直下の下位レイヤの画像領域の画素数をその画像領域で選択された最適予測モード毎に集計して、その集計結果に基づいて前記対応表を生成することを、
    特徴とするスケーラブル動画像符号化方法。
  9. 請求項1ないし8のいずれか1項に記載のスケーラブル動画像符号化方法において、
    前記対応表を用いて実行される予測モードの使用に制限を設けるスケーラブル符号化と、前記対応表を用いないで実行される予測モードの使用に制限を設けないスケーラブル符号化とを交互に繰り返すように制御する過程を備えることを、
    特徴とするスケーラブル動画像符号化方法。
  10. 動画像をスケーラブルに符号化するスケーラブル動画像符号化装置であって、
    予測モードの使用に制限を設けることなく行ったスケーラブル符号化で選択された最適予測モードに基づいて、上位レイヤのブロックとその直下の下位レイヤの画像領域で選択された最適予測モードの組み合わせの発生率を求めて、その最適予測モードの組み合わせとその発生率との対応関係について記述する対応表を生成する手段と、
    上位レイヤのブロックを符号化する場合に、その直下の下位レイヤの画像領域で選択された最適予測モードの情報を取得する手段と、
    前記取得した最適予測モードの中から処理対象の最適予測モードを選択する手段と、
    前記選択した最適予測モードと前記対応表に記述される発生率とに基づいて、前記対応表に記述される最適予測モードの組み合わせの中から有効な組み合わせを抽出して、その抽出した組み合わせの持つ上位レイヤの最適予測モードを、上位レイヤのブロックの符号化で探索する予測モード探索候補として決定する手段とを備えることを、
    特徴とするスケーラブル動画像符号化装置。
  11. 動画像をスケーラブルに符号化するスケーラブル動画像符号化装置であって、
    予測モードの使用に制限を設けることなく行ったスケーラブル符号化で選択された最適予測モードに基づいて、上位レイヤのブロックとその直下の下位レイヤの画像領域で選択された最適予測モードの組み合わせの発生率を求めて、その最適予測モードの組み合わせとその発生率との対応関係について記述する対応表を生成する手段と、
    前記発生率の値に基づいて、前記対応表に記述される最適予測モードの組み合わせを絞り込むことで有効な最適予測モードの組み合わせを抽出して、その抽出した有効な最適予測モードの組み合わせについて記述する予測モード対応情報を生成する手段と、
    上位レイヤのブロックを符号化する場合に、その直下の下位レイヤの画像領域で選択された最適予測モードの情報を取得する手段と、
    前記取得した最適予測モードの中から処理対象の最適予測モードを選択する手段と、
    前記選択した最適予測モードを組み合わせに持つ前記予測モード対応情報を参照することで、上位レイヤのブロックの符号化で探索する予測モード探索候補を決定する手段とを備えることを、
    特徴とするスケーラブル動画像符号化装置。
  12. 請求項1ないし9のいずれか1項に記載のスケーラブル動画像符号化方法をコンピュータに実行させるためのスケーラブル動画像符号化プログラム。
JP2009173956A 2009-07-27 2009-07-27 スケーラブル動画像符号化方法、スケーラブル動画像符号化装置およびスケーラブル動画像符号化プログラム Expired - Fee Related JP5038367B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009173956A JP5038367B2 (ja) 2009-07-27 2009-07-27 スケーラブル動画像符号化方法、スケーラブル動画像符号化装置およびスケーラブル動画像符号化プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009173956A JP5038367B2 (ja) 2009-07-27 2009-07-27 スケーラブル動画像符号化方法、スケーラブル動画像符号化装置およびスケーラブル動画像符号化プログラム

Publications (2)

Publication Number Publication Date
JP2011029962A true JP2011029962A (ja) 2011-02-10
JP5038367B2 JP5038367B2 (ja) 2012-10-03

Family

ID=43638165

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009173956A Expired - Fee Related JP5038367B2 (ja) 2009-07-27 2009-07-27 スケーラブル動画像符号化方法、スケーラブル動画像符号化装置およびスケーラブル動画像符号化プログラム

Country Status (1)

Country Link
JP (1) JP5038367B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014003519A1 (ko) * 2012-06-29 2014-01-03 삼성전자 주식회사 스케일러블 비디오 부호화 방법 및 그 장치, 스케일러블 비디오 복호화 방법 및 장치
US9420279B2 (en) 2012-06-01 2016-08-16 Samsung Electronics Co., Ltd. Rate control method for multi-layered video coding, and video encoding apparatus and video signal processing apparatus using the rate control method
JP2016526336A (ja) * 2013-05-24 2016-09-01 ソニック アイピー, インコーポレイテッド 適応ビットレートストリーミングのための適応量子化を用いて複数のビデオストリームをエンコードするシステムおよび方法
WO2016140090A1 (ja) * 2015-03-04 2016-09-09 ソニー株式会社 画像符号化装置および方法
US10148989B2 (en) 2016-06-15 2018-12-04 Divx, Llc Systems and methods for encoding video content
US10178399B2 (en) 2013-02-28 2019-01-08 Sonic Ip, Inc. Systems and methods of encoding multiple video streams for adaptive bitrate streaming
US11025902B2 (en) 2012-05-31 2021-06-01 Nld Holdings I, Llc Systems and methods for the reuse of encoding information in encoding alternative streams of video data
US11611785B2 (en) 2011-08-30 2023-03-21 Divx, Llc Systems and methods for encoding and streaming video encoded using a plurality of maximum bitrate levels

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006148419A (ja) * 2004-11-18 2006-06-08 Nippon Telegr & Teleph Corp <Ntt> 画像符号化装置,画像符号化方法,画像符号化プログラムおよびコンピュータ読み取り可能な記録媒体
JP2008205864A (ja) * 2007-02-21 2008-09-04 Nippon Telegr & Teleph Corp <Ntt> スケーラブル動画像符号化方法,装置,そのプログラムおよびその記録媒体
WO2010047099A1 (ja) * 2008-10-22 2010-04-29 日本電信電話株式会社 スケーラブル動画像符号化方法、スケーラブル動画像符号化装置、スケーラブル動画像符号化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006148419A (ja) * 2004-11-18 2006-06-08 Nippon Telegr & Teleph Corp <Ntt> 画像符号化装置,画像符号化方法,画像符号化プログラムおよびコンピュータ読み取り可能な記録媒体
JP2008205864A (ja) * 2007-02-21 2008-09-04 Nippon Telegr & Teleph Corp <Ntt> スケーラブル動画像符号化方法,装置,そのプログラムおよびその記録媒体
WO2010047099A1 (ja) * 2008-10-22 2010-04-29 日本電信電話株式会社 スケーラブル動画像符号化方法、スケーラブル動画像符号化装置、スケーラブル動画像符号化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11611785B2 (en) 2011-08-30 2023-03-21 Divx, Llc Systems and methods for encoding and streaming video encoded using a plurality of maximum bitrate levels
US11025902B2 (en) 2012-05-31 2021-06-01 Nld Holdings I, Llc Systems and methods for the reuse of encoding information in encoding alternative streams of video data
US9420279B2 (en) 2012-06-01 2016-08-16 Samsung Electronics Co., Ltd. Rate control method for multi-layered video coding, and video encoding apparatus and video signal processing apparatus using the rate control method
WO2014003519A1 (ko) * 2012-06-29 2014-01-03 삼성전자 주식회사 스케일러블 비디오 부호화 방법 및 그 장치, 스케일러블 비디오 복호화 방법 및 장치
US10728564B2 (en) 2013-02-28 2020-07-28 Sonic Ip, Llc Systems and methods of encoding multiple video streams for adaptive bitrate streaming
US10178399B2 (en) 2013-02-28 2019-01-08 Sonic Ip, Inc. Systems and methods of encoding multiple video streams for adaptive bitrate streaming
JP2016526336A (ja) * 2013-05-24 2016-09-01 ソニック アイピー, インコーポレイテッド 適応ビットレートストリーミングのための適応量子化を用いて複数のビデオストリームをエンコードするシステムおよび方法
WO2016140090A1 (ja) * 2015-03-04 2016-09-09 ソニー株式会社 画像符号化装置および方法
US10893276B2 (en) 2015-03-04 2021-01-12 Sony Corporation Image encoding device and method
US10595070B2 (en) 2016-06-15 2020-03-17 Divx, Llc Systems and methods for encoding video content
US11483609B2 (en) 2016-06-15 2022-10-25 Divx, Llc Systems and methods for encoding video content
US10148989B2 (en) 2016-06-15 2018-12-04 Divx, Llc Systems and methods for encoding video content
US11729451B2 (en) 2016-06-15 2023-08-15 Divx, Llc Systems and methods for encoding video content

Also Published As

Publication number Publication date
JP5038367B2 (ja) 2012-10-03

Similar Documents

Publication Publication Date Title
JP7071453B2 (ja) 動き情報の復号化方法、符号化方法及び記録媒体
JP5038367B2 (ja) スケーラブル動画像符号化方法、スケーラブル動画像符号化装置およびスケーラブル動画像符号化プログラム
JP5225388B2 (ja) スケーラブル動画像符号化方法、スケーラブル動画像符号化装置、スケーラブル動画像符号化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP5937717B2 (ja) 映像復号化方法及び装置
US8811488B2 (en) Method and apparatus for encoding/decoding motion vector
JP4357590B2 (ja) 画像符号化システム及び画像復号システム
RU2696237C2 (ru) Способ декодирования видеосигнала
TW202013967A (zh) 改進的模式匹配的運動向量推導
CN113163211B (zh) 基于合并模式的帧间预测方法及装置
KR20210016054A (ko) 영상 부호화/복호화 방법 및 장치
JP5118075B2 (ja) スケーラブル画像符号化方法、スケーラブル画像符号化装置、スケーラブル画像符号化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2008153907A (ja) 画像符号化装置及びそれらを含む情報端末ならびに画像符号化方法
KR20140031974A (ko) 화상 부호화 방법, 화상 복호 방법, 화상 부호화 장치, 화상 복호 장치, 화상 부호화 프로그램 및 화상 복호 프로그램
JP6728870B2 (ja) 画像圧縮装置、画像圧縮方法、及び画像圧縮プログラム
JP6935553B2 (ja) 縮小された予測動きベクトルの候補に基づいて、動きベクトルを符号化/復号化する方法及び装置
CN116325735A (zh) 用于针对参考帧进行自适应重新排序的方法和装置
JP2013517733A (ja) 以前ブロックの動きベクトルを現在ブロックの動きベクトルとして用いる映像符号化/復号化方法及び装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111018

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120618

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120703

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120705

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150713

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5038367

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees