JP2014523700A - スキップモードを用いたモーション情報符号化方法及び装置、その復号化方法及び装置 - Google Patents
スキップモードを用いたモーション情報符号化方法及び装置、その復号化方法及び装置 Download PDFInfo
- Publication number
- JP2014523700A JP2014523700A JP2014518817A JP2014518817A JP2014523700A JP 2014523700 A JP2014523700 A JP 2014523700A JP 2014518817 A JP2014518817 A JP 2014518817A JP 2014518817 A JP2014518817 A JP 2014518817A JP 2014523700 A JP2014523700 A JP 2014523700A
- Authority
- JP
- Japan
- Prior art keywords
- motion information
- highest probability
- candidate
- unit
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 60
- 238000010586 diagram Methods 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
- H04N19/52—Processing of motion vectors by encoding by predictive encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
スキップモード(skip mode)を用いる符号化方法において、現在予測単位に関する少なくとも1つの予測単位を用いて現在予測単位についての複数のモーション情報候補を獲得し、複数のモーション情報候補のうち最高確率予測候補(most probable predictor candidate)を定め、現在予測単位の予測モードが定められた最高確率予測候補を用いる最高確率スキップモード(most probable skip mode)の場合、最高確率スキップモードを示すフラグを符号化する符号化方法が提供される。
Description
本発明は、映像の符号化、復号化方法及び装置に係り、具体的には、現在予測単位のモーション情報を効率的に符号化する方法及び装置、復号化する方法及び装置に関する。
最近、高解像度(High Definition)ビデオコンテンツの増加につれて、MPEG−4 H.264/MPEG−4 AVC(Advanced Video Coding)のような既存のビデオコーデックに比べてさらに高いコーディング効率を持つビデオコーデックの必要性が増加しつつある。
これにより、次世代ビデオ符号化/復号化技術として、HEVC(High Efficiency Video Coding)標準がJCT−VC(Joint Collaborative Team on Video Coding)によって準備されている。
モーション補償は、ビデオ信号から時間的重複性(redundancy)をとり除くための技術であり、原ビデオ信号とモーションベクトルが指示する参照信号との差値である残差(residual)信号を伝送することで、ビデオコーディングで圧縮効率を高める。一般的に、モーション補償を用いた各ブロックについての符号化結果として、各ブロックのモーション情報及び残差値が復号化側に伝送される。
一方、スキップモード(skip mode)は、予測モード(prediction mode)、パーティションのサイズ(partition size)、参照インデックス(reference index)、予測方向(prediction direction)、モーションベクトル差分値(motion vector difference)、及び残差情報の一体を伝送しないモードである。
本発明が解決しようとする技術的課題は、低いビットレート環境で複数のモーション情報候補群を用いて符号化を行う場合、符号化効率を改善してオーバーヘッドを低減させるための符号化/復号化方法及び装置を提供することである。また、前述した方法を行うためのプログラムが記録された記録媒体を提供することである。
前記技術的課題を解決するためのスキップモードを用いた符号化方法は、現在予測単位に関する少なくとも1つの予測単位を用いて、前記現在予測単位についての複数のモーション情報候補を獲得する段階と、前記複数のモーション情報候補のうち、既定の基準によって選択可能性の最も高い最高確率予測候補(most probable predictor candidate)を定める段階と、前記現在予測単位の予測モードが前記定められた最高確率予測候補を用いる最高確率スキップモード(most probable skip mode)の場合、前記最高確率スキップモードを示すフラグを符号化する段階と、を含む。
前記技術的課題を解決するための一実施形態によれば、前記符号化方法は、前記現在予測単位の予測モードが、前記最高確率予測候補ではないモーション情報候補を用いる非最高確率スキップモード(non−most probable skip mode)の場合、前記複数のモーション情報候補のうち、前記最高確率予測候補以外のモーション情報候補を前記現在予測単位に関するモーション情報と定める段階と、前記非最高確率スキップモードを示すフラグ及び前記最高確率予測候補以外のモーション情報候補に関するインデックス情報を符号化する段階と、をさらに含む。
前記技術的課題を解決するための一実施形態によれば、前記非最高確率スキップモードは、前記モーション情報候補が2個以上の場合に選択され、前記定められた最高確率予測候補以外のモーション情報候補に関するインデックス情報は、前記モーション情報候補が3個以上の場合に符号化される。
前記技術的課題を解決するための一実施形態によれば、前記最高確率予測候補以外のモーション情報候補は、前記最高確率予測候補を除いたモーション情報候補から選択可能性の最も高いモーション情報候補である。
前記技術的課題を解決するための一実施形態によれば、前記インデックス情報を符号化する段階は、前記最高確率予測候補以外のモーション情報候補のインデックス情報を1ほど低減させて符号化する段階である。
前記技術的課題を解決するための一実施形態によれば、前記最高確率予測候補を定める段階は、前記モーション情報候補のうち、インデックス情報が0のモーション情報候補を前記最高確率予測候補と定める段階である。
前記技術的課題を解決するための一実施形態によれば、前記最高確率予測候補を定める段階は、前記現在予測単位と空間的に隣接している複数の予測単位によって最も多く選択されたモーション情報候補を前記最高確率予測候補と定める段階である。
前記技術的課題を解決するためのスキップモードを用いた符号化装置は、現在予測単位に関する少なくとも1つの予測単位を用いて、前記現在予測単位についての複数のモーション情報候補を獲得するモーション情報候補群生成部と、前記複数のモーション情報候補のうち、既定の基準によって選択可能性の最も高い最高確率予測候補を定める最高確率予測候補決定部と、前記現在予測単位の予測モードが、前記定められた最高確率予測候補を用いる最高確率スキップモードの場合、前記最高確率スキップモードを示すフラグを符号化するモーション情報符号化部と、を備える。
前記技術的課題を解決するためのスキップモードを用いた復号化方法は、現在予測単位に関する少なくとも1つの予測単位を用いて、前記現在予測単位についての複数のモーション情報候補を獲得する段階と、前記複数のモーション情報候補のうち、既定の基準によって選択可能性の最も高い最高確率予測候補を定める段階と、ビットストリームから前記現在予測単位の予測モードを示すフラグを獲得する段階と、前記フラグが、前記最高確率予測候補を用いる最高確率スキップモードを示す場合、前記最高確率予測候補を前記現在予測単位のモーション情報として獲得する段階と、を含む。
前記技術的課題を解決するためのスキップモードを用いた復号化装置は、現在予測単位に関する少なくとも1つの予測単位を用いて、前記現在予測単位についての複数のモーション情報候補を獲得するモーション情報候補群生成部と、前記複数のモーション情報候補のうち、既定の基準によって選択可能性の最も高い最高確率予測候補を定める最高確率予測候補決定部と、ビットストリームから前記現在予測単位の予測モードを示すフラグを獲得するエントロピー復号化部と、前記フラグが、前記最高確率予測候補を用いる最高確率スキップモードを示す場合、前記最高確率予測候補を前記現在予測単位のモーション情報として獲得するモーション情報復号化部と、を備える。
前記技術的課題を解決するためのスキップモードを用いた符号化方法をコンピュータで実行させるためのプログラムを記録した、コンピュータで読み取り可能な記録媒体を提供する。
前記技術的課題を解決するためのスキップモードを用いた復号化方法をコンピュータで実行させるためのプログラムを記録した、コンピュータで読み取り可能な記録媒体を提供する。
本発明によれば、モーション情報候補群に含まれた最高確率予測候補が現在予測単位のモーション情報と類似するほど、スキップモードの符号化効率が向上する。また、低いビットレート環境でオーバーヘッドが低減する。
本発明は、次の詳細な説明とそれに伴う図面との結合で容易に理解され、参照番号(reference numerals)は、構造的構成要素(structural elements)を意味する。
本発明の一実施形態によるスキップモードを用いた符号化装置の構成を示すブロック図である。
本発明の一実施形態によってスキップモードを用いた符号化方法を説明するフローチャートである。
本発明の一実施形態によって、文脈基盤適応的二進算術符号化(CABAC、Context−based Adaptive Binary Arithmetic Coding)を用いた符号化過程を説明するための図面である。
本発明の一実施形態によって、文脈基盤適応的可変長符号化(CAVLC、Context−based Adaptive Variable Length Coding)または低複雑度エントロピー符号化(LCEC、Low Complexity Entropy Coder)を用いた符号化過程を説明するための図面である。
本発明の一実施形態によるスキップモードを用いた復号化装置の構成を示すブロック図である。
本発明の一実施形態によってスキップモードを用いた復号化方法を説明するフローチャートである。
本発明で使われる用語は、本発明での機能を考慮してなるべく現在広く使われる一般的な用語を選択したが、これは当業者の意図または判例、新たな技術の出現などによって変わりうる。また、特定の場合には出願人が任意に選定した用語もあり、この場合に該発明の説明部分で詳細にその意味を記載する。したがって、本発明で使われる用語は単純な用語の名称ではなく、その用語が持つ意味及び本発明の全般の内容に基づいて定義されねばならない。
明細書全体で、いずれかの部分がいずれかの構成要素を“含む”とする時、これは、特に逆の記載がない限り、他の構成要素を除くものではなく他の構成要素をさらに含むことができるということを意味する。また、明細書に記載の“…部”、“…モジュール”などの用語は、少なくとも1つの機能や動作を処理する単位を意味し、これは、ハードウェアまたはソフトウェアで具現されるか、またはハードウェアとソフトウェアとの結合で具現される。
以下では、図面を参照して本発明の実施形態を詳細に説明する。
図1は、本発明の一実施形態による符号化装置100を示すブロック図である。一実施形態による符号化装置100は、モーション情報候補群生成部110、最高確率予測候補決定部120、及びモーション情報符号化部130を備える。符号化装置100が図1に示された構成以外にも他の汎用的な構成をさらに含むことができるということは、当業者ならば容易に分かるであろう。
符号化装置100は、入力される映像データを処理してビットストリーム(bitstream)として出力する。詳細には、符号化装置100は、入力される映像データに含まれたそれぞれのピクチャー(picture)を複数の予測単位(PU、Prediction Unit)に分割し、符号化して出力する。
一実施形態よれば、映像データに含まれた空間領域(spatial domain)は、それぞれの深度(depth)によって階層的に分類される。また、それぞれの予測単位は、サイズ32×32、64×64、128×128、256×256などのデータ単位であって、横及び縦のサイズが8より大きい2の二乗である正方形のデータ単位である。符号化装置100は、映像データを処理するための予測単位のサイズまたは形態を多様に選択できる。
モーション情報候補群生成部110は、現在予測単位についての複数のモーション情報候補を獲得する。すなわち、モーション情報候補群生成部110は、入力される映像データにおいて、現在予測単位に関する少なくとも1つの予測単位を用いてモーション情報候補を獲得する。モーション情報候補群生成部110が参照する予測単位は、現在予測単位と空間的に(spatially)、または時間的に(temporally)連関する予測単位を含む。
最高確率予測候補決定部120は、複数のモーション情報候補のうち最高確率予測候補(most probable prediction candidate)を定める。詳細に説明すれば、最高確率予測候補決定部120は、複数のモーション情報候補のうち、既定の基準によって選択可能性の最も高いモーション情報候補を定める。今後に再び説明するが、最高確率予測候補は、符号化側及び復号化側で黙示的に(implicitly)選択される。
最高確率予測候補決定部120は、最高確率予測候補を、多様な方法及びアルゴリズムを通じて定める。一実施形態よれば、最高確率予測候補決定部120は、複数のモーション情報候補のうち0番のインデックスを持つ最初のモーション情報候補を最高確率予測候補と定める。
さらに他の実施形態よれば、最高確率予測候補決定部120は、隣接している予測単位から最も多く選択されたモーション情報候補を最高確率予測候補と定めてもよい。または、最高確率予測候補決定部120は、既定の期間(certain period)の間に最も多く選択されたモーション情報候補を最高確率予測候補と定めてもよい。
さらに他の例をあげれば、最高確率予測候補決定部120は、現在予測単位が持つ復元されたテンプレート(reconstructed template)の領域を他の予測単位と比べて、その差が最も少ない予測単位のモーション情報候補を最高確率予測候補と定めてもよい。すなわち、最高確率予測候補決定部120は、現在予測単位の左側と上側とを連結する既定の形態の領域を比べて最高確率予測候補を定める。
さらに他の例をあげれば、最高確率予測候補決定部120は、複数のモーション情報候補のうち、そのモーション距離(distance of motion)が最小のモーション情報候補を最高確率予測候補と定めてもよい。すなわち、現在予測単位から遠くなる距離が最も短いモーション情報候補を最高確率予測候補と定める。
前述した様々な実施形態以外にも、最高確率予測候補決定部120は、多様な方法及びアルゴリズムを通じて最高確率予測候補を定める。
モーション情報符号化部130は、現在予測単位の予測モードを示すフラグを符号化する。予測単位の予測モードは、イントラモード(intra mode)、インターモード(inter mode)及びスキップモード(skip mode)のうち少なくとも1つである。
予測モードについて詳細に説明すれば、スキップモードは、現在予測単位のモーション情報に関するインデックス情報及びスキップモードを示すフラグを符号化するモードである。すなわち、スキップモードでは、モーションベクトル差分値(MVD、Motion Vector Difference)を0に設定し、その差値に関する情報である残差(residual)情報を符号化しない。
以下では、スキップモードを2つの場合に分けて詳細に説明する。
第1に、最高確率スキップモード(most probable skip mode)は、最高確率予測候補を用いるモードである。すなわち、符号化側及び復号化側で黙示的に定められた最高確率予測候補を現在予測単位のモーション情報として用いる。
これにより、既定の基準によって最高確率予測候補が定められた結果を復号化側で予め分かることができ、符号化側では、現在予測単位に関するインデックス情報を伝送する必要がなくなる。言い換えれば、最高確率スキップモードでは、現在予測単位の予測モードが最高確率スキップモードであることを示すフラグのみを符号化する。
第2に、非最高確率スキップモード(non−most probable skip mode)は、最高確率予測候補ではないモーション情報候補を用いるモードである。すなわち、複数のモーション情報候補のうち最高確率予測候補以外のモーション情報候補を現在予測単位のモーション情報と定めるモードである。
非最高確率スキップモードで、符号化側では、現在予測単位のモーション情報に関するインデックス情報をフラグと共に符号化する。すなわち、最高確率予測候補以外のモーション情報候補に関するインデックス情報が、現在予測単位のモーション情報として符号化される。これにより、非最高確率スキップモードでは、予測モードを示すフラグ以外にもインデックス情報についてのさらなるシンタックス(syntax)が符号化されて伝送される。
モーション情報符号化部130は、現在予測単位の予測モードが最高確率スキップモードの場合、これを示すフラグである“most probable skip_flag”を符号化する。また、モーション情報符号化部130は、現在予測単位の予測モードが非最高確率スキップモードの場合、“non−most probable skip_flag”を符号化する。前述したように、後者の場合において、モーション情報符号化部130は、フラグ以外にも現在予測単位のモーション情報に関するインデックス情報をさらに符号化できる。
モーション情報符号化部130によって符号化されたデータは、符号化装置100からビットストリームに出力されて復号化側に伝送される。
図2は、本発明の一実施形態によってスキップモードを用いた符号化方法を説明するフローチャートである。図2に示されたフローチャートは、図1に示された符号化装置100、モーション情報候補群生成部110、最高確率予測候補決定部120、及びモーション情報符号化部130で時系列的に処理される段階で構成される。よって、以下で省略される内容であっても、図1に示された構成に関して以上で記述された内容は、図2に示されたフローチャートにも適用されるということが分かる。
段階210で、符号化装置100は、現在予測単位についての動き予測を行って、現在予測単位に関するモーション情報を獲得する。
段階220で、符号化装置100は、現在予測単位に関する予測単位を用いて、複数のモーション情報候補を獲得する。すなわち、符号化装置100は、現在予測単位と空間的または時間的に隣接している予測単位が持つモーション情報から、複数のモーション情報候補(モーション情報候補群)を獲得する。一実施形態よれば、現在予測単位と空間的に左側または上側に隣接している予測単位が、モーション情報候補の獲得に用いられる。
段階230で、符号化装置100は、モーション情報候補群から最高確率予測候補を定める。すなわち、符号化装置100は、複数のモーション情報候補のうち、選択可能性の最も高いモーション情報候補を既定の基準によって定める。図1で前述したように、最高確率予測候補を定めるための多様な方法及びアルゴリズムが活用される。
段階240で、現在予測単位の予測モードが最高確率スキップモードであるかどうかが定められる。最高確率スキップモードならば、段階251に進み、最高確率スキップモードでなければ、段階261に進む。
段階251で、符号化装置100は、最高確率予測候補を現在予測単位に関するモーション情報と定める。すなわち、現在予測単位の予測モードが最高確率スキップモードであるので、符号化装置100は、複数のモーション情報候補から予め選択された最高確率予測候補を現在予測単位のモーション情報と定める。
段階252で、符号化装置100は、最高確率スキップモードを示すフラグを符号化する。すなわち、符号化装置100は、現在予測単位のモーション情報に関するインデックス情報を符号化する必要なく、予測モードを示すフラグのみを符号化する。復号化側でも最高確率予測候補を黙示的に定められるため、フラグ以外にさらなる情報の伝送が不要になる。
段階261で、現在予測単位の予測モードが非最高確率スキップモードであるかどうかが定められる。非最高確率スキップモードならば、段階262に進み、非最高確率スキップモードでなければ、段階271に進む。
段階262で、符号化装置100は、最高確率予測候補以外のモーション情報候補を現在予測単位のモーション情報と定める。すなわち、符号化装置100は、段階220で獲得した複数のモーション情報候補のうち、最高確率予測候補ではないモーション情報候補を現在予測単位のモーション情報と定める。
一実施形態よれば、符号化装置100は、最高確率予測候補を除いたモーション情報候補のうち、選択可能性の最も高いモーション情報候補(すなわち、段階220で獲得された複数のモーション情報のうち2番目に選択可能性の高いモーション情報候補)を現在予測単位のモーション情報と定める。
段階263で、符号化装置100は、非最高確率スキップモードを示すフラグ及び定められたモーション情報候補に関するインデックス情報を符号化する。すなわち、複数のモーション情報候補のうち、いかなるモーション情報候補が現在予測単位のモーション情報として定められたかを示すインデックス情報が、予測モードを示すフラグと共に符号化される。
段階271で、現在予測単位の予測モードが2種のスキップモードにいずれも該当しないので、符号化装置100は、スキップモード以外の予測モードで符号化を行う。
一方、一実施形態よれば、符号化装置100は、非最高確率スキップモードを、モーション情報候補の数が2個以上の場合に選択する。すなわち、非最高確率スキップモードは、モーション情報候補の数が1個の場合には選択されない。
モーション情報候補の数が1個の場合には、唯一のモーション情報候補が、すなわち最高確率予測候補であるため、符号化装置100は、非最高確率スキップモードに進む必要がなくなる。
さらに他の実施形態よれば、符号化装置100は、モーション情報候補の数が3個以上の場合に、現在予測単位のモーション情報に関するインデックス情報を符号化する。
モーション情報候補の数が1個の場合には、非最高確率スキップモードが選択される必要がないということは前述した通りである。さらに、モーション情報候補の数が2個の非最高確率スキップモードの場合、現在予測単位のモーション情報は、最高確率予測候補ではないモーション情報候補である。
すなわち、モーション情報候補のうち最高確率予測候補を除いたモーション情報は1個であるため、モーション情報候補の数が2個ならば、非最高確率スキップモードであるにもかかわらずインデックス情報を符号化する必要がなくなる。言い換えれば、復号化側では非最高確率スキップモードであることを示すフラグのみでも、現在予測単位のモーション情報がいかなるモーション情報候補から符号化されたかが分かる。
一方、モーション情報候補の数が3個以上ならば、最高確率予測候補を除いても、現在予測単位のモーション情報がいかなるモーション情報候補から符号化されたかに関する情報が必要になる。よって、符号化装置100は、予測モードについてのフラグと共にインデックス情報を符号化する。
さらに他の実施形態よれば、最高確率予測候補以外のモーション情報候補を符号化する非最高確率スキップモードの場合、符号化装置100は、モーション情報候補のインデックス情報を1ほど低減させて符号化する。
詳細に説明すれば、符号化装置100は、非最高確率スキップモードで符号化されるモーション情報候補が、最高確率予測候補のインデックス情報より大きいインデックス情報を持つ場合、符号化されるモーション情報候補のインデックス情報を低減させて符号化する。最高確率スキップモードでは、予測モードを示すフラグのみを符号化するため、最高確率予測候補のインデックス情報は符号化される必要がないからである。
例をあげて説明すれば、符号化装置100は、5個のモーション情報候補のうち既定の基準によって、最初のモーション情報候補(0番のインデックスを持つモーション情報候補)を最高確率予測候補と定める。これにより、非最高確率スキップモードで3番目のモーション情報候補(2番のインデックスを持つモーション情報候補)のインデックス情報が符号化される場合、2番ではない1番のインデックスを持つことで符号化する。
なぜならば、最高確率スキップモードで最高確率予測候補のインデックス情報は符号化される必要がないので、符号化装置100は、非最高確率スキップモードで、5個のモーション情報候補のうち最初のモーション情報候補を除いた4個のモーション情報候補のみを考慮する。よって、符号化装置100は、4個のモーション情報候補のインデックス情報を1ずつ低減させて符号化する。言い換えれば、5個のモーション情報候補のうち3番目のモーション情報候補は、低減した4個のモーション情報候補のうち2番目のモーション情報候補として符号化される。一方、復号化装置500は、ビットストリームを受信してパージングした後、低減したインデックス情報を1ずつ延ばして復号化する。
図3は、本発明の一実施形態によって、文脈基盤適応的二進算術符号化(CABAC、Context−based Adaptive Binary Arithmetic Coding)を用いた符号化過程を説明するための図面である。
‘1’が入力される場合(311)、Most probable skip_flag 310が符号化され、現在予測単位の予測モードが最高確率スキップモードであることを示す。すなわち、最高確率予測候補が現在予測単位のモーション情報と定められる。
‘01’が入力される場合(321)、Non−most probable skip_flag 320が符号化され、現在予測単位の予測モードが非最高確率スキップモードであることを示す。これにより、最高確率予測候補以外のモーション情報候補が現在予測単位のモーション情報と定められる。この場合、Non−most probable skip_flag 320以外に、現在予測単位のモーション情報と定められたモーション情報候補に関するインデックス情報が符号化される。
‘00’が入力される場合(330)、スキップモード301ではない場合であるので、符号化装置100は、イントラモードまたはインターモードなど様々に符号化を進められる。
図4は、本発明の一実施形態によって、文脈基盤適応的可変長符号化(CAVLC、Context−based Adaptive Variable Length Coding)または低複雑度エントロピー符号化(LCEC、Low Complexity Entropy Coder)を用いた符号化過程を説明するための図面である。
最高確率スキップモード410の場合、‘01’が符号化される。すなわち、最高確率予測候補が現在予測単位のモーション情報と定められる(411)。
非最高確率スキップモード420の場合、‘001’が符号化される。すなわち、最高確率予測候補以外のモーション情報候補が現在予測単位のモーション情報と定められ、これを示すインデックス情報がさらに符号化される(421)。
図3で説明したように、スキップモード401以外の予測モードについて、符号化装置100は、併合(merge)モード、インターモードなどの様々なモードで符号化を進められる。
図5は、本発明の一実施形態によるスキップモードを用いた復号化装置500の構成を示すブロック図である。
一実施形態による復号化装置500は、モーション情報候補群生成部510、最高確率予測候補決定部520、エントロピー復号化部530、及びモーション情報復号化部540を備える。復号化装置500が、図5に示された構成以外にも他の汎用的な構成をさらに備えられるということは、当業者ならば容易に理解できるであろう。
復号化装置500は、ビットストリームを受信して、符号化された映像データを復号化する。すなわち、復号化装置500は、符号化装置100から受信される映像データを予測単位ごとに処理して、元々の映像データを復元する。
モーション情報候補群生成部510は、現在予測単位についての複数のモーション情報候補を獲得する。すなわち、モーション情報候補群生成部510は、ビットストリームに含まれた現在予測単位に関する予測単位を用いて、少なくとも1つのモーション情報候補を獲得する。図1で符号化装置100について説明した内容と同様に、モーション情報候補群生成部510が参照する予測単位は、現在予測単位と空間的に(spatially)、または時間的に(temporally)連関された予測単位を含む。
最高確率予測候補決定部520は、モーション情報候補のうち最高確率予測候補を定める。最高確率予測候補決定部520は、符号化装置100で定めた基準または方法を同じく用いて、複数のモーション情報候補のうち最高確率予測候補を定める。すなわち、最高確率予測候補決定部520は、符号化装置100及び復号化装置500で同じ基準及び/または方法を用いて黙示的に定められる。
最高確率予測候補決定部520は、符号化側と同じく多様な方法及びアルゴリズムを通じて最高確率予測候補を定める。
エントロピー復号化部530は、ビットストリームから現在予測単位の予測モードを示すフラグを獲得する。すなわち、エントロピー復号化部530は、予測モードが、最高確率スキップモード、非最高確率スキップモード、及びスキップモード以外のモードのうちいずれか1つであることを示すフラグを獲得する。
一実施形態よれば、現在予測単位の予測モードが非最高確率スキップモードまたはスキップモード以外のモードの場合、エントロピー復号化部530は、ビットストリームから現在予測単位のモーション情報を示すインデックス情報を獲得することもできる。
前述したように、最高確率スキップモードの場合とは異なって、非最高確率スキップモードの場合、符号化側ではフラグ以外にもモーション情報を示すインデックス情報をさらに符号化して伝送する。これにより、エントロピー復号化部530は、さらに伝送されたインデックス情報をビットストリームから獲得する。
モーション情報復号化部540は、エントロピー復号化部530が獲得したフラグが示す予測モードによって、現在予測単位のモーション情報を獲得する。
詳細に説明すれば、予測モードが最高確率スキップモードの場合、モーション情報復号化部540は、最高確率予測候補決定部520で定められた最高確率予測候補を現在予測単位のモーション情報として獲得する。前述したように、符号化側及び復号化側では、現在予測単位について選択可能性の最も高いモーション候補を予め定める。これにより、最高確率予測候補が選択されたということを示すフラグが受信されれば、さらなるインデックス情報なしでも既定のモーション候補を現在予測単位のモーション情報として獲得可能になる。
予測モードが非最高確率スキップモードの場合、モーション情報復号化部540は、最高確率予測候補以外のモーション情報候補を現在予測単位のモーション情報として獲得する。すなわち、モーション情報復号化部540は、エントロピー復号化部530が獲得したインデックス情報を用いて、現在予測単位に関するモーション情報を獲得する。
図6は、本発明の一実施形態によってスキップモードを用いた復号化方法を説明するフローチャートである。図6に示されたフローチャートは、図5に示された復号化装置500、モーション情報候補群生成部110、最高確率予測候補決定部120、エントロピー復号化部530及びモーション情報復号化部540で時系列的に処理される段階で構成される。よって、以下で省略される内容であっても、図5に示された構成に関して以上で記述された内容は、図6に示されたフローチャートにも適用されるということが分かる。
段階610で、復号化装置500は、現在予測単位に関する予測単位を用いて、複数のモーション情報候補を獲得する。図2で説明したように、復号化装置500は、現在予測単位と時間的または空間的に隣接している予測単位を参照してモーション情報候補を獲得する。
段階620で、復号化装置500は、モーション情報候補のうち最高確率予測候補を定める。復号化装置500は、符号化装置100で最高確率予測候補を定めるのに用いられた基準と同じ基準によって最高確率予測候補を定める。符号化装置100及び復号化装置500で最高確率予測候補を定める方法及びアルゴリズムは、図1で説明したように多様に選択される。
段階630で、復号化装置500は、ビットストリームから現在予測単位のエツックモードを示すフラグを獲得する。
次いで、段階640では、予測モードを示すフラグが最高確率スキップモードの場合、段階651に進み、そうでなければ、段階661に進む。
段階651で、復号化装置500は、最高確率予測候補を現在予測単位のモーション情報として獲得する。すなわち、最高確率スキップモードを示すフラグのみ受信された場合であるので、復号化装置500は、さらなる情報なしに、段階620で定められた最高確率予測候補を用いて現在予測単位を復号化する。
段階661で、予測モードを示すフラグが非最高確率スキップモードであるかどうかが定められ、非最高確率スキップモードならば、段階662に進み、そうでなければ、段階671に進む。
段階662で、復号化装置500は、現在予測単位に関するインデックス情報を獲得する。すなわち、最高確率予測候補以外のモーション情報候補が用いられて符号化された場合であるので、復号化装置500は、現在予測単位のモーション情報に関するさらなる情報を必要とする。これにより、復号化装置500は、モーション情報を示すインデックス情報を復号化できる。
段階663で、復号化装置500は、インデックス情報を用いて現在予測単位のモーション情報を獲得する。すなわち、復号化装置500は、現在予測単位のモーション情報を示すインデックス情報を用いて、現在予測単位を復元する。
図2で説明した実施形態によって、非最高確率スキップモードでインデックス情報を1ずつ低減させて符号化した場合、復号化装置500は、低減したインデックス情報を1ずつ再び延ばして復号化する。
段階671では、復号化装置500は、スキップモード以外のモードで復号化過程を行う。
一方、前述した方法は、コンピュータで実行されるプログラムで作成でき、コンピュータで読み取り可能な媒体を用いて前記プログラムを動作させる汎用デジタルコンピュータで具現される。また、前述した方法で使われたデータの構造は、コンピュータで読み取り可能な媒体に様々な手段を通じて記録される。本発明の多様な方法を行うための実行可能なコンピュータコードを含む保存デバイスを説明するために使われるプログラム保存デバイスは、搬送波や信号のような一時的な対象を含むと理解されてはならない。前記コンピュータで読み取り可能な媒体は、マグネチック記録媒体(例えば、ROM、フロッピー(登録商標)ディスク、ハードディスクなど)、光学的判読媒体(例えば、CD−ROM、DVDなど)のような記録媒体を含む。
本発明の実施形態に係る技術分野の当業者ならば、前記記載の本質的な特性から逸脱しない範囲で変形された形態で具現できるということを理解できるであろう。したがって、開示された方法は限定的な観点ではなく説明的な観点で考慮されねばならない。本発明の範囲は、発明の詳細な説明ではない特許請求の範囲に示され、それと同等な範囲内にあるすべての差は本発明の範囲に含まれると解釈されねばならない。
Claims (15)
- スキップモードを用いた符号化方法において、
現在予測単位に関する少なくとも1つの予測単位を用いて、前記現在予測単位についての複数のモーション情報候補を獲得する段階と、
前記複数のモーション情報候補のうち、既定の基準によって選択可能性の最も高い最高確率予測候補を定める段階と、
前記現在予測単位の予測モードが前記定められた最高確率予測候補を用いる最高確率スキップモードの場合、前記最高確率スキップモードを示すフラグを符号化する段階と、を含む符号化方法。 - 前記符号化方法は、
前記現在予測単位の予測モードが、前記最高確率予測候補ではないモーション情報候補を用いる非最高確率スキップモードの場合、前記複数のモーション情報候補のうち、前記最高確率予測候補以外のモーション情報候補を前記現在予測単位に関するモーション情報と定める段階と、
前記非最高確率スキップモードを示すフラグ及び前記最高確率予測候補以外のモーション情報候補に関するインデックス情報を符号化する段階と、をさらに含む請求項1に記載の符号化方法。 - 前記非最高確率スキップモードは、前記モーション情報候補が2個以上の場合に選択され、
前記定められた最高確率予測候補以外のモーション情報候補に関するインデックス情報は、前記モーション情報候補が3個以上の場合に符号化されることを特徴とする請求項2に記載の符号化方法。 - 前記最高確率予測候補以外のモーション情報候補は、前記最高確率予測候補を除いたモーション情報候補から選択可能性の最も高いモーション情報候補であることを特徴とする請求項2に記載の符号化方法。
- 前記インデックス情報を符号化する段階は、前記最高確率予測候補以外のモーション情報候補のインデックス情報を1ほど低減させて符号化する段階である請求項2に記載の符号化方法。
- 前記最高確率予測候補を定める段階は、前記モーション情報候補のうち、インデックス情報が0のモーション情報候補を前記最高確率予測候補と定める段階である請求項1に記載の符号化方法。
- 前記最高確率予測候補を定める段階は、前記現在予測単位と空間的に隣接している複数の予測単位によって最も多く選択されたモーション情報候補を前記最高確率予測候補と定める段階である請求項1に記載の符号化方法。
- スキップモードを用いた符号化装置において、
現在予測単位に関する少なくとも1つの予測単位を用いて、前記現在予測単位についての複数のモーション情報候補を獲得するモーション情報候補群生成部と、
前記複数のモーション情報候補のうち、既定の基準によって選択可能性の最も高い最高確率予測候補を定める最高確率予測候補決定部と、
前記現在予測単位の予測モードが、前記定められた最高確率予測候補を用いる最高確率スキップモードの場合、前記最高確率スキップモードを示すフラグを符号化するモーション情報符号化部と、を備える符号化装置。 - 前記モーション情報符号化部は、
前記現在予測単位の予測モードが、前記最高確率予測候補ではないモーション情報候補を用いる非最高確率スキップモードの場合、前記複数のモーション情報候補のうち、前記最高確率予測候補以外のモーション情報候補を前記現在予測単位に関するモーション情報と定め、
前記非最高確率スキップモードを示すフラグ及び前記定められた最高確率予測候補以外のモーション情報候補に関するインデックス情報を符号化することを特徴とする請求項8に記載の符号化装置。 - スキップモードを用いた復号化方法において、
現在予測単位に関する少なくとも1つの予測単位を用いて、前記現在予測単位についての複数のモーション情報候補を獲得する段階と、
前記複数のモーション情報候補のうち、既定の基準によって選択可能性の最も高い最高確率予測候補を定める段階と、
ビットストリームから前記現在予測単位の予測モードを示すフラグを獲得する段階と、
前記フラグが、前記最高確率予測候補を用いる最高確率スキップモードを示す場合、前記最高確率予測候補を前記現在予測単位のモーション情報として獲得する段階と、を含む復号化方法。 - 前記復号化方法は、
前記フラグが、前記最高確率予測候補ではないモーション情報候補を用いる非最高確率スキップモードを示す場合、ビットストリームから前記現在予測単位のモーション情報を示すインデックス情報を獲得する段階と、
前記獲得されたインデックス情報を用いて前記現在予測単位のモーション情報を獲得する段階と、をさらに含む請求項10に記載の復号化方法。 - スキップモードを用いた復号化装置において、
現在予測単位に関する少なくとも1つの予測単位を用いて、前記現在予測単位についての複数のモーション情報候補を獲得するモーション情報候補群生成部と、
前記複数のモーション情報候補のうち、既定の基準によって選択可能性の最も高い最高確率予測候補を定める最高確率予測候補決定部と、
ビットストリームから前記現在予測単位の予測モードを示すフラグを獲得するエントロピー復号化部と、
前記フラグが、前記最高確率予測候補を用いる最高確率スキップモードを示す場合、前記最高確率予測候補を前記現在予測単位のモーション情報として獲得するモーション情報復号化部と、を備える復号化装置。 - 前記エントロピー復号化部は、前記フラグが、前記最高確率予測候補ではないモーション情報候補を用いる非最高確率スキップモードを示す場合、ビットストリームから前記現在予測単位のモーション情報を示すインデックス情報を獲得し、
前記モーション情報復号化部は、前記獲得されたインデックス情報を用いて前記現在予測単位のモーション情報を獲得することを特徴とする請求項12に記載の復号化装置。 - 請求項1ないし7のうちいずれか一項に記載の方法を具現するためのプログラムが記録されたコンピュータで読み取り可能な記録媒体。
- 請求項10及び11のうちいずれか一項に記載の方法を具現するためのプログラムが記録されたに記載のコンピュータで読み取り可能な記録媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161503162P | 2011-06-30 | 2011-06-30 | |
US61/503,162 | 2011-06-30 | ||
PCT/KR2012/005245 WO2013002620A2 (ko) | 2011-06-30 | 2012-07-02 | 스킵 모드를 이용한 모션 정보 부호화 방법 및 장치, 그 복호화 방법 및 장치 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2014523700A true JP2014523700A (ja) | 2014-09-11 |
Family
ID=47424720
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014518817A Pending JP2014523700A (ja) | 2011-06-30 | 2012-07-02 | スキップモードを用いたモーション情報符号化方法及び装置、その復号化方法及び装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20140153648A1 (ja) |
EP (1) | EP2728871A4 (ja) |
JP (1) | JP2014523700A (ja) |
KR (1) | KR20130004181A (ja) |
CN (1) | CN103765883A (ja) |
WO (1) | WO2013002620A2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015005750A1 (ko) * | 2013-07-12 | 2015-01-15 | 삼성전자 주식회사 | 변이 벡터 유도를 사용하는 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치 |
DE102013223609B4 (de) | 2013-11-19 | 2024-05-29 | BSH Hausgeräte GmbH | Verfahren und Vorrichtung zum Betreiben einer Getränkezubereitungseinrichtung |
KR101695769B1 (ko) * | 2015-07-10 | 2017-01-12 | 동국대학교 산학협력단 | Hevc 인터 예측을 위한 예측 유닛 프루닝 방법 및 장치 |
KR101637406B1 (ko) * | 2016-04-07 | 2016-07-07 | 원진산업 주식회사 | 카페트 마감방법 |
CN113453014B (zh) * | 2019-06-21 | 2022-03-25 | 杭州海康威视数字技术股份有限公司 | 预测模式的解码、编码方法及装置 |
CN114710665B (zh) * | 2019-09-20 | 2024-10-25 | 杭州海康威视数字技术股份有限公司 | 一种解码、编码方法、装置及其设备 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2140684B1 (en) * | 2007-04-12 | 2018-08-15 | Thomson Licensing DTV | Method and apparatus for context dependent merging for skip-direct modes for video encoding and decoding |
KR100924048B1 (ko) * | 2007-07-30 | 2009-10-27 | 한국과학기술원 | 비디오 부호화에서 화면내 방향성 예측모드 고속 결정방법 |
KR20090129926A (ko) * | 2008-06-13 | 2009-12-17 | 삼성전자주식회사 | 영상 부호화 방법 및 그 장치, 영상 복호화 방법 및 그 장치 |
US20100079605A1 (en) * | 2008-09-29 | 2010-04-01 | William Marsh Rice University | Sensor-Assisted Motion Estimation for Efficient Video Encoding |
KR101279573B1 (ko) * | 2008-10-31 | 2013-06-27 | 에스케이텔레콤 주식회사 | 움직임 벡터 부호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치 |
US9788010B2 (en) * | 2009-05-07 | 2017-10-10 | Texas Instruments Incorporated | Reducing computational complexity when video encoding uses bi-predictively encoded frames |
WO2011074919A2 (ko) * | 2009-12-17 | 2011-06-23 | 에스케이텔레콤 주식회사 | 영상 부호화/복호화 방법 및 장치 |
US8885711B2 (en) * | 2009-12-17 | 2014-11-11 | Sk Telecom Co., Ltd. | Image encoding/decoding method and device |
US9866859B2 (en) * | 2011-06-14 | 2018-01-09 | Texas Instruments Incorporated | Inter-prediction candidate index coding independent of inter-prediction candidate list construction in video coding |
-
2012
- 2012-07-02 CN CN201280042622.XA patent/CN103765883A/zh active Pending
- 2012-07-02 JP JP2014518817A patent/JP2014523700A/ja active Pending
- 2012-07-02 EP EP12805088.7A patent/EP2728871A4/en not_active Withdrawn
- 2012-07-02 US US14/130,087 patent/US20140153648A1/en not_active Abandoned
- 2012-07-02 KR KR1020120071974A patent/KR20130004181A/ko not_active Application Discontinuation
- 2012-07-02 WO PCT/KR2012/005245 patent/WO2013002620A2/ko active Application Filing
Non-Patent Citations (2)
Title |
---|
CSNC201318018056; McCann,K. et al: 'HM3: High Efficiency Video Coding (HEVC) Test Model 3 Encoder Description' JCTVC-E602 , 20110602, P.28-30, <URL:http://phenix.it-sudparis.eu/jct/doc_end_use * |
JPN6014051925; McCann,K. et al: 'HM3: High Efficiency Video Coding (HEVC) Test Model 3 Encoder Description' JCTVC-E602 , 20110602, P.28-30, <URL:http://phenix.it-sudparis.eu/jct/doc_end_use * |
Also Published As
Publication number | Publication date |
---|---|
EP2728871A4 (en) | 2016-01-13 |
WO2013002620A2 (ko) | 2013-01-03 |
KR20130004181A (ko) | 2013-01-09 |
EP2728871A2 (en) | 2014-05-07 |
CN103765883A (zh) | 2014-04-30 |
WO2013002620A3 (ko) | 2013-04-11 |
US20140153648A1 (en) | 2014-06-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7145252B2 (ja) | 映像復号化方法 | |
KR102614661B1 (ko) | 인트라 예측 모드 부호화/복호화 방법 및 컴퓨터로 읽을 수 있는 기록 매체 | |
US8929450B2 (en) | Temporal block merge mode | |
JP2014523700A (ja) | スキップモードを用いたモーション情報符号化方法及び装置、その復号化方法及び装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141209 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20150309 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20150409 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20151006 |