JPWO2003026315A1 - 符号化方法、復号方法、符号化装置、復号装置、画像処理システム、符号化プログラム及び復号プログラム - Google Patents
符号化方法、復号方法、符号化装置、復号装置、画像処理システム、符号化プログラム及び復号プログラム Download PDFInfo
- Publication number
- JPWO2003026315A1 JPWO2003026315A1 JP2003529779A JP2003529779A JPWO2003026315A1 JP WO2003026315 A1 JPWO2003026315 A1 JP WO2003026315A1 JP 2003529779 A JP2003529779 A JP 2003529779A JP 2003529779 A JP2003529779 A JP 2003529779A JP WO2003026315 A1 JPWO2003026315 A1 JP WO2003026315A1
- Authority
- JP
- Japan
- Prior art keywords
- information
- prediction
- block
- motion vector
- allocation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/577—Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/109—Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/117—Filters, e.g. for pre-processing or post-processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/196—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
- H04N19/463—Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/57—Motion estimation characterised by a search window with variable size or shape
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/573—Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
本発明は、動き補償予測を用いて動画像の圧縮符号化を行う符号化方法、符号化装置及び符号化プログラム、動き補償予測を用いて圧縮動画像データの伸長・復号を行う復号方法、復号装置及び復号プログラム、上記符号化装置と復号装置とを含んで構成された画像処理システムに関する。
背景技術
従来の映像符号化方式の事例として、国際標準化作業文書ITU−T SG16 VCEG−M81、“H.26L Test Model Long Term Number7(TML−7)”draft0(http://standard.pictel.com/ftp/video−site/0104_Aus/VCEG−M81d0.doc)に記載の、H.26L符号化方式に基づく画像符号化・復号方式が知られている。
このH.26L映像符号化では、インター予測モードとして精緻な動き補償が可能となるよう、図4A〜図4Gに示す多くの動き分割パターンを用意している。この工夫によって、マクロブロックの内部で細かい動きが生じているようなケースで効率よく動きを捉えることができ、予測効率を向上させることができる、という効果を奏する。
しかしながら、インター予測モードとして多くの動き分割パターンを用意する方式では、動き分割の数が多くなるほど、より多くの動きベクトル情報を伝送する必要が生じ、オーバーヘッドが大きくなる、という問題がある。図5に、図4A〜図4Gの各モードに対して必要な伝送情報量を示す。この図5に示す「モードビット」は予測モードを表現するための可変長符号の符号長を、「最小動きベクトルビット」はマクロブロック単位で伝送すべき動きベクトルに関する情報量としてとりうる最小の情報量を、「最小必要ビット数」はモードビットと最小動きベクトルビットとを総和した値を示している。動きベクトルビットは水平・垂直方向の2つの値の総ビット数であるが、最小になるケースは水平・垂直ともに動きベクトル予測値と同一ベクトルになる場合となる(動きベクトルは所定の規則で近傍の動きベクトルを予測値としてその差分値が符号化される)。しかし、通常このようなケースになることはまれであり、このビット数よりも多くの情報を伝送する必要が生じる。この図5から、モード4あるいは5以上ではオーバーヘッドが非常に多くなることがわかる。
一方で、一般の映像では、マクロブロック領域を4分割以上に細分化して動き検出を精緻化せずとも、大局的に2分割程度の動きの捉え方で十分な動き補償が行える場合が存在すると考えられる。しかし、H.26L符号化方式に用意される16×8画素単位、8×16画素単位という固定的な動き割当では、マクロブロック内部の動き分割を正確に表現できないという問題があり、そのことが図4A〜図4Gの7つのインター予測モードを用意する理由になっていた。
本発明は、上記課題を解決するために成されたものであり、映像中の動き情報を少ないオーバーヘッドで符号化又は復号することができる符号化方法、復号方法、符号化装置、復号装置、画像処理システム、符号化プログラム及び復号プログラムを提供することを目的とする。
発明の開示
上記目的を達成するために、本発明に係る符号化方法は、動き補償予測を用いて動画像の圧縮符号化を行う符号化方法であって、動画像のフレームを分割した第1のブロックの各々についてさらに分割した第2のブロックの単位で、1つ又は複数の動きベクトルを割り当てて動き補償予測を行う動き補償予測工程と、前記第2のブロックに対する動きベクトルの割当状況に関する情報をビットストリームに多重して出力する割当情報符号化工程とを備えたことを特徴とする。
ここでの第1のブロックとしては、例えば16×16画素のブロックを、第2のブロックとしては、例えば4×4画素のブロックを、採用することができる。この符号化方法では、動き補償予測工程にて、動画像のフレームを分割した第1のブロックの各々についてさらに分割した第2のブロックの単位で、1つ又は複数の動きベクトルを割り当てて動き補償予測を行い、割当情報符号化工程にて、第2のブロックに対する動きベクトルの割当状況に関する情報をビットストリームに多重して出力するため、第1のブロック内の様々な動きを少ないオーバーヘッドで的確に捉えることが可能となり、効率よく映像伝送・記録・再生を行うことが可能となる。
このとき、動き補償予測工程では、第2のブロックの位置及び数に関わらず動きベクトルを割り当ててもよい。即ち、動き補償予測工程では、第1のブロック内での第2のブロックの位置及び数に関わらず第2のブロックの単位で動きベクトルを割り当てて動き補償予測を行い、割当情報符号化工程では、第2のブロックの位置及び当該第2のブロックに割り当てられた動きベクトルについての情報を、動きベクトルの割当状況に関する情報として用いることができる。
また、動き補償予測工程では、予め定めた割当パターンに従って第2のブロックの単位で動きベクトルを割り当ててもよい。即ち、動き補償予測工程では、1つ又は複数の第2のブロックをグループ化することにより予め定めた割当パターンに従って第2のブロックの単位で動きベクトルを割り当てて動き補償予測を行い、割当情報符号化工程では、前記割当パターンの識別情報を、動きベクトルの割当状況に関する情報として用いることができる。
このように予め定めた割当パターンに従う態様として、動き補償予測工程では、第1のブロック単位に定まる第2のブロックへの動きベクトル割当パターンを予めグループ化した複数のパターングループのうちのいずれかを選択し、該選択されたパターングループに含まれる割当パターンに基づいて第2のブロックに対して動きベクトルを割り当てて動き補償予測を行い、割当情報符号化工程では、第1のブロック単位に符号化される動きベクトル割当状況に関する情報を、前記選択されたパターングループの中から特定される動きベクトル割当パターンの識別情報として出力する態様を採用することができる。
このように動きベクトル割当状況に関する情報を、データ量の少ない当該動きベクトル割当パターンの識別情報として出力するので、第1のブロック内の様々な動きを少ないオーバーヘッドで的確に捉えることが可能となり、効率よく映像伝送・記録・再生を行うことが可能となる。
また、割当情報符号化工程では、符号化対象となる第1のブロックについての動きベクトル割当パターンの形状に応じて動きベクトルの予測値を定め、当該予測値による予測差分値を動きベクトル情報として符号化する態様を採用することができる。
このように、動きベクトル割当パターンの形状に応じて動きベクトルの予測値を定め、データ量の少ない当該予測値による予測差分値を、動きベクトル情報として符号化するので、第1のブロック内の様々な動きを少ないオーバーヘッドで的確に捉えることが可能となり、効率よく映像伝送・記録・再生を行うことが可能となる。
なお、ここで割当情報符号化工程では、符号化対象となる第1のブロックについての動きベクトル割当パターンの形状に応じて動きベクトルの予測候補位置を定め、前記符号化対象となる第1のブロック近傍に位置する第1のブロックについての割当パターンの形状に応じて予測候補位置のうちのいずれかを予測値とし、当該予測値の予測差分値を動きベクトル情報として符号化することが望ましい。
また、予め定めた割当パターンに従う態様として、動き補償予測工程では、符号化対象となる第1のブロックについての動きベクトル割当パターンの形状に応じて動きベクトルの予測値を定め、当該予測値を中心とする動きベクトル探索窓を設けて動きベクトルを検出し、割当情報符号化工程では、前記検出された動きベクトルと前記動きベクトル予測値との予測差分値を動きベクトル情報として符号化する態様を採用することができる。
このように、データ量の少ない、検出された動きベクトルと動きベクトル予測値との予測差分値、が動きベクトル情報として符号化されるので、第1のブロック内の様々な動きを少ないオーバーヘッドで的確に捉えることが可能となり、効率よく映像伝送・記録・再生を行うことが可能となる。
上記の予め定めた割当パターンに従う各種態様において、動き補償予測工程では、第2のブロック単位での割り当て可能な動きベクトル数を最大2本とするとともに、第1のブロック単位に定まる該第1のブロックに含まれる第2のブロックへの割当状態を表す予め定められた複数の割当パターンのいずれかに基づいて、第2のブロックに対し動きベクトルを割り当てて動き補償予測を行い、割当情報符号化工程では、第1のブロック単位に定まる動きベクトルの割当状況に関する情報を、前記割当パターンの識別情報として出力する態様を採用することが望ましい。
このとき割当パターンは、前記第1のブロックを水平方向又は垂直方向に不均一に分割するパターン、及び前記第1のブロックを斜め方向に分割するパターンを含むよう構成とすることが望ましい。
また、割当情報符号化工程では、各割当パターンの形状に基づいて、可変長の符号を各割当パターンに割り当てて前記割当パターンの識別情報を符号化することが望ましい。
また、割当情報符号化工程では、符号化対象となる第1のブロック近傍に位置する第1のブロックについての割当パターンの状況に基づいて、前記符号化対象となる第1のブロックについて、可変長の符号を各割当パターンに割り当てて前記割当パターンの識別情報を符号化することが望ましい。
また、割当情報符号化工程では、映像内容に基づいて、可変長の符号を各割当パターンに割り当てて前記割当パターンの識別情報を符号化することが望ましい。
上記の予め定めた割当パターンに従う各種態様、並びに第2のブロックの位置及び数に関わらず割り当てる態様においては、動き補償予測工程にて得られた予測残差信号を、前記第2のブロックのサイズと同一サイズのブロック単位で符号化する残差信号符号化工程をさらに備えた構成とすることができる。
即ち、動画像のフレームを分割した第1のブロックの各々についてさらに分割した第2のブロックの単位で、1つ又は複数の動きベクトルを割り当てて動き補償予測を行う動き補償予測工程と、前記第2のブロックに対する動きベクトルの割当状況に関する情報をビットストリームに多重して出力する割当情報符号化工程と、動き補償予測工程にて得られた予測残差信号を、前記第2のブロックのサイズと同一サイズのブロック単位で符号化する残差信号符号化工程とを備えた態様を採用することができる。この場合、動き補償予測工程にて得られた予測残差信号を、第2のブロックのサイズと同一サイズのブロック単位で符号化するので、符号化されるデータ量を少なく抑えることができ、第1のブロック内の様々な動きを少ないオーバーヘッドで的確に捉えることが可能となり、効率よく映像伝送・記録・再生を行うことが可能となる。
また、予め定めた割当パターンに従う各種態様、並びに第2のブロックの位置及び数に関わらず割り当てる態様において、割当情報符号化工程では、前記動きベクトルの割当状況に基づき、1つ又は複数の第2のブロックから構成される動きベクトル割当領域において符号化すべき予測残差信号があるか否かを識別する情報を符号化する態様を採用することができる。この場合、動きベクトルの割当状況に基づき、1つ又は複数の第2のブロックから構成される動きベクトル割当領域において符号化すべき予測残差信号があるか否かを識別する情報を符号化するので、符号化されるデータ量を少なく抑えることができ、第1のブロック内の様々な動きを少ないオーバーヘッドで的確に捉えることが可能となり、効率よく映像伝送・記録・再生を行うことが可能となる。
また、第2のブロックの位置及び数に関わらず割り当てる態様において、割当情報符号化工程では、符号化対象となる第1のブロック及び隣接の第1のブロックにおける動きベクトルの割当状況に基づいて、当該割当状況における動きベクトル割当の変化点を表す情報を、前記動きベクトルの割当状況に関する情報としてビットストリームに多重して出力する態様を採用することができる。
また、予め定めた割当パターンに従う各種態様、並びに第2のブロックの位置及び数に関わらず割り当てる態様において、動き補償予測工程では、第1のブロック単位でインター予測モード又はイントラ予測モードが設定された場合に加え、第2のブロックの1つ又は複数からなる単位でインター予測モード又はイントラ予測モードが設定された場合も含めて、動き補償予測を行う態様を採用することができる。
上記目的を達成するために、本発明に係る符号化方法は、動き補償予測を用いて動画像の圧縮符号化を行う符号化方法であって、動画像のフレームを分割した第1のブロックの各々についてさらに分割した第2のブロックの1つ又は複数からなる単位で、動き補償予測のために保持された複数の参照フレームの中から一の参照フレームを選択して動き補償予測を行う補償予測工程と、前記1つ又は複数の第2のブロックに対する参照フレームの選択状況に関する情報をビットストリームに多重して出力する参照フレーム情報符号化工程とを備えたことを特徴とする。
この符号化方法によれば、1つ又は複数の第2のブロックに対する参照フレームの選択状況に関する情報はデータ量が少ないので、符号化されるデータ量を少なく抑えることができ、第1のブロック内の様々な動きを少ないオーバーヘッドで的確に捉えることが可能となり、効率よく映像伝送・記録・再生を行うことが可能となる。
なお、参照フレーム情報符号化工程では、前記第1のブロックの単位で含まれる前記1つ又は複数の第2のブロックに対する参照フレームの選択状況の組み合わせ情報として符号化する態様を採用することができる。
また、参照フレーム情報符号化工程では、近傍に位置する前記第1もしくは1つ又は複数の前記第2のブロックにおける参照フレームの選択状況から、1つ又は複数の第2のブロックに対する参照フレームの予測値をそれぞれ求め、該予測値と選択された参照フレームとの差分情報を、参照フレームの選択状況に関する情報として用いる態様を採用することができる。
上記目的を達成するために、本発明に係る符号化方法は、動き補償予測を用いて動画像の圧縮符号化を行う符号化方法であって、動画像のフレームを分割した第1のブロックの各々についてさらに分割した1つ又は複数の第2のブロックからなる単位で、双方向インター予測に用いる予測方向を選択して動き補償予測を行う動き補償予測工程と、前記1つ又は複数の第2のブロックに対する予測方向の選択状況に関する情報をビットストリームに多重して出力する予測情報符号化工程とを備えたことを特徴とする。
この符号化方法によれば、第1のブロック内の様々な動きを、少ないオーバーヘッドで的確に捉えることが可能になるとともに、それぞれ別の動きを捉えた1つ又は複数の第2のブロック毎に適切な双方向インター予測を適用することができ、効率よく映像伝送・記録・再生を行うことが可能となる。
上記目的を達成するために、本発明に係る符号化方法は、動き補償予測を用いて動画像の圧縮符号化を行う符号化方法であって、動画像のフレームを分割した第1のブロックの各々についてさらに分割した1つ又は複数の第2のブロックからなる単位で、インター予測モードもしくはイントラ予測モードを選択してインター予測もしくはイントラ予測を行う予測工程と、前記1つ又は複数の第2のブロックに対するインター予測モードもしくはイントラ予測モードの選択状況に関する情報をビットストリームに多重して出力する予測モード情報符号化工程とを備えたことを特徴とする。
この符号化方法によれば、第1のブロック内の様々な動きを、少ないオーバーヘッドで的確に捉えることが可能になるとともに、それぞれ別の動きを捉えた1つ又は複数の第2のブロック毎に適切なインター予測あるいはイントラ予測を適用することができ、効率よく映像伝送・記録・再生を行うことが可能となる。
なお、上記の予測情報符号化工程又は予測モード情報符号化工程では、前記選択状況に関する情報を、前記第1のブロックの単位で含まれる前記第1のブロックに対する動きベクトルの割当状況に関する情報とともに組み合わせた情報として符号化してビットストリームへ多重し出力する態様を採用することができる。
また、上記の予測情報符号化工程又は予測モード情報符号化工程では、前記選択状況に関する情報を、前記1つ又は複数の第2のブロック単位で含まれる前記1つ又は複数の第2のブロックに対する複数参照フレームからの参照フレームの選択状況に関する情報とともに組み合わせた情報として符号化してビットストリームへ多重し出力する態様を採用することができる。
上記目的を達成するために、本発明に係る復号方法は、動き補償予測を用いて圧縮動画像データの伸長・復号を行う復号方法であって、動画像のフレームを分割した第1のブロックの各々についてさらに分割した第2のブロックの単位で割り当てられた動きベクトルが、前記第1のブロックの単位で復号される1つ又は複数の動きベクトルのうちいずれに該当するか、を示す動きベクトル割当情報を復号する割当情報復号工程と、該動きベクトル割当情報に基づいて前記第2のブロックの単位で特定された動きベクトルを用いて動き補償を行い予測画像を生成する動き補償工程とを備えたことを特徴とする。
この復号方法では、割当情報復号工程にて、第2のブロックの単位で割り当てられた動きベクトルが、第1のブロックの単位で復号される1つ又は複数の動きベクトルのうちいずれに該当するか、を示す動きベクトル割当情報を復号し、動き補償工程にて、該動きベクトル割当情報に基づいて第2のブロックの単位で特定された動きベクトルを用いて動き補償を行い予測画像を生成する。よって、第2のブロックの単位で割り当てられた動きベクトルに関する動きベクトル割当情報が復号され、該動きベクトル割当情報に基づいて第2のブロックの単位で特定された動きベクトルを用いて動き補償が行われ予測画像が生成される。これにより、少ないオーバーヘッドで的確に復号することが可能となり、効率よく映像伝送・記録・再生を行うことが可能となる。
このとき、割当情報復号工程では、割り当て対象の第2のブロックの位置及び数に関わらず、当該第2のブロックの位置及び当該第2のブロックに割り当てられた動きベクトルについての情報として、前記動きベクトル割当情報を復号する態様を採用することができる。
また、割当情報復号工程では、1つ又は複数の第2のブロックをグループ化することにより予め定めた割当パターンの識別情報として、前記動きベクトル割当情報を復号する態様を採用することができる。
このように予め定めた割当パターンの識別情報として動きベクトル割当情報を復号する態様として、割当情報復号工程では、前記動きベクトル割当情報を、第1のブロック単位に予め定められた第2のブロックへの動きベクトル割当パターンを識別する情報として復号するものとし、該割当パターン識別情報から割当パターンを特定するに際して、該割当パターンが属するパターングループを識別する情報を復号し、該パターングループ識別情報によって特定されたパターングループの定義に従って前記割当パターン識別情報から第2のブロックへの動きベクトル割当を決定する態様を採用することができる。この場合、動きベクトル割当情報を、予め定められた第2のブロックへの動きベクトル割当パターンを識別する情報として、少ないオーバーヘッドで的確に復号することが可能となり、効率よく映像伝送・記録・再生を行うことが可能となる。
また、予め定めた割当パターンの識別情報として動きベクトル割当情報を復号する態様として、割当情報復号工程では、復号対象となる第1のブロックについての動きベクトル割当パターンの形状に応じて定めた動きベクトルの予測値、による予測差分値を符号化することで得られた動きベクトル情報を復号する態様を採用することができる。この場合、復号対象となる第1のブロックについての動きベクトル割当パターンの形状に応じて定めた動きベクトルの予測値、による予測差分値を符号化することで得られた動きベクトル情報を復号するので、データ量の少ない予測差分値を符号化することで得られた動きベクトル情報の復号が可能となり、効率よく映像伝送・記録・再生を行うことが可能となる。
このとき割当情報復号工程では、復号対象となる第1のブロックについての動きベクトル割当パターンの形状に応じて定めた動きベクトルの予測候補位置のうちのいずれかを、近傍に位置する第1のブロックについての割当パターンの形状に応じて予測値とし、当該予測値の予測差分値を符号化することで得られた動きベクトル情報を復号することが望ましい。
上記の予め定めた割当パターンの識別情報として復号する態様においては、第1のブロックの単位で復号される動きベクトルは最大2本とされ、動きベクトル割当情報は、第1のブロック単位に定まる該第1のブロックに含まれる第2のブロックへの動きベクトルの割当状態を表す予め定められた複数の割当パターンを識別する情報として復号されるよう構成とすることが望ましい。
このとき割当パターンは、前記第1のブロックを水平方向又は垂直方向に不均一に分割するパターン、及び前記第1のブロックを斜め方向に分割するパターンを含むよう構成することが望ましい。
また、割当情報復号工程では、各割当パターンの形状に基づいて各割当パターン毎に割り当てられた可変長の符号を、各割当パターンの識別情報として復号することが望ましい。
また、割当情報復号工程では、復号対象となる第1のブロック近傍に位置する第1のブロックについての割当パターンの状況に基づいて各割当パターン毎に割り当てられた可変長の符号を、前記復号対象となる第1のブロックについての各割当パターンの識別情報として復号することが望ましい。
また、割当情報復号工程では、映像内容に基づいて各割当パターン毎に割り当てられた可変長の符号を、各割当パターンの識別情報として復号することが望ましい。
上記の予め定めた割当パターンの識別情報として復号する態様、並びに、第2のブロックの位置及び数に関わらず動きベクトル割当情報を復号する態様においては、第2のブロックのサイズと同一サイズのブロック単位での符号化処理により得られた動き補償予測の予測残差信号を復号する残差信号復号工程をさらに備えた構成とすることができる。
即ち、動画像のフレームを分割した第1のブロックの各々についてさらに分割した第2のブロックの単位で割り当てられた動きベクトルが、前記第1のブロックの単位で復号される1つ又は複数の動きベクトルのうちいずれに該当するか、を示す動きベクトル割当情報を復号する割当情報復号工程と、該動きベクトル割当情報に基づいて前記第2のブロックの単位で特定された動きベクトルを用いて動き補償を行い予測画像を生成する動き補償工程と、第2のブロックのサイズと同一サイズのブロック単位での符号化処理により得られた動き補償予測の予測残差信号を復号する残差信号復号工程とを備えた構成とすることができる。この場合、第2のブロックのサイズと同一サイズのブロック単位での符号化処理により得られた動き補償予測の予測残差信号を復号するので、符号化すべきデータ量の少ない予測残差信号の復号が可能となり、効率よく映像伝送・記録・再生を行うことが可能となる。
また、上記の予め定めた割当パターンの識別情報として復号する態様、並びに、第2のブロックの位置及び数に関わらず動きベクトル割当情報を復号する態様においては、割当情報復号工程では、復号対象となる第1のブロックについての動きベクトル割当パターンの形状に基づき、1つ又は複数の第2のブロックから構成される動きベクトル割当領域内に復号すべき予測残差信号があるか否かを識別する情報を復号することが望ましい。この場合、符号化すべきデータ量の少ない予測残差信号の復号が可能となり、効率よく映像伝送・記録・再生を行うことが可能となる。
また、上記の第2のブロックの位置及び数に関わらず動きベクトル割当情報を復号する態様においては、割当情報復号工程では、動きベクトルの割当状況に関する情報として出力される、動きベクトル割当の変化点を表す情報を復号することが望ましい。
また、上記の予め定めた割当パターンの識別情報として復号する態様、並びに、第2のブロックの位置及び数に関わらず動きベクトル割当情報を復号する態様においては、動きベクトルは、第1のブロック単位でインター予測モード又はイントラ予測モードが設定された場合に加え、第2のブロックの1つ又は複数からなる単位でインター予測モード又はイントラ予測モードが設定された場合も含めた動き補償予測により得られた動きベクトルであることが望ましい。
上記目的を達成するために、本発明に係る復号方法は、動き補償予測を用いて圧縮動画像データの伸長・復号を行う復号方法であって、動画像のフレームを分割した第1のブロックの各々についてさらに分割した第2のブロックの1つ又は複数からなる単位で割り当てられた、動き補償予測に用いる参照フレームの選択状況に関する情報を復号する参照フレーム情報復号工程と、当該参照フレーム情報に基づいて、動き補償のために保持された複数の参照フレームの中から一の参照フレームを選択して動き補償を行い予測画像を生成する補償工程とを備えたことを特徴とする。
この態様によれば、上記1つ又は複数の第2のブロックに対する参照フレームの選択状況に関する情報はデータ量が少ないので、データ量の少ない当該参照フレームの選択状況に関する情報の復号が可能となり、効率よく映像伝送・記録・再生を行うことが可能となる。
このとき参照フレーム情報復号工程では、前記第1のブロックの単位で含まれる前記1つ又は複数の第2のブロックに対する参照フレームの選択状況の組み合わせ情報から、前記1つ又は複数の第2のブロックに対する参照フレーム情報を復号することが望ましい。
また、参照フレーム情報復号工程では、近傍に位置する前記第1もしくは1つ又は複数の前記第2のブロックにおける参照フレームの選択状況から、1つ又は複数の第2のブロックに対する参照フレームの予測値をそれぞれ求め、参照フレームの選択状況に関する情報として出力される参照フレームの差分情報と前記求めた予測値とに基づいて復号を行うことが望ましい。
上記目的を達成するために、本発明に係る復号方法は、動き補償予測を用いて圧縮動画像データの伸長・復号を行う復号方法であって、動画像のフレームを分割した第1のブロックの各々についてさらに分割した1つ又は複数の第2のブロックからなる単位で割り当てられた、双方向インター予測に用いる予測方向の選択状況に関する情報を復号する予測情報復号工程と、当該予測情報に基づいて、双方向フレーム間動き補償に用いる予測方向を順方向と逆方向の双方について保持している参照フレームの中から選択して動き補償を行い予測画像を生成する動き補償工程とを備えたことを特徴とする。
この態様によれば、第1のブロック内の様々な動きを、少ないオーバーヘッドで的確に捉えることが可能になるとともに、それぞれ別の動きを捉えた1つ又は複数の第2のブロック毎に適切な双方向インター予測を適用することができ、効率よく映像伝送・記録・再生を行うことが可能となる。
上記目的を達成するために、本発明に係る復号方法は、動き補償予測を用いて圧縮動画像データの伸長・復号を行う復号方法であって、動画像のフレームを分割した第1のブロックの各々についてさらに分割した1つ又は複数の第2のブロックからなる単位で割り当てられたインター予測モードもしくはイントラ予測モードの選択状況に関する情報を復号する予測モード情報復号工程と、当該予測情報に基づいて、インター予測モードもしくはイントラ予測モードを選択してインター予測もしくはイントラ予測を行い予測画像を生成する予測画像生成工程とを備えたことを特徴とする。
この態様によれば、第1のブロック内の様々な動きを、少ないオーバーヘッドで的確に捉えることが可能になるとともに、それぞれ別の動きを捉えた1つ又は複数の第2のブロック毎に適切なインター予測あるいはイントラ予測を適用することができ、効率よく映像伝送・記録・再生を行うことが可能となる。
なお、予測情報復号工程又は予測モード情報復号工程では、前記第1のブロックの単位で含まれる前記第1のブロックに対する動きベクトルの割り当て状況に関する情報と前記選択状況に関する情報とを組み合わせた情報から、前記1つ又は複数の第2のブロックに対する前記選択状況に関する情報を復号する態様を採用することができる。
また、予測情報復号工程又は予測モード情報復号工程では、前記1つ又は複数の第2のブロックの単位で含まれる前記1つ又は複数の第2のブロックに対する複数参照フレームからの参照フレームの選択状況に関する情報と前記選択状況に関する情報とを組み合わせた情報から、前記1つ又は複数の第2のブロックに対する前記選択状況に関する情報を復号する態様を採用することができる。
ところで、本発明は、符号化方法、復号方法としての発明以外に、符号化方法を使用する符号化装置、復号方法を使用する復号装置、これら符号化装置と復号装置とを含んで構成される画像処理システム、符号化装置にて実行される符号化プログラム、及び復号装置にて実行される復号プログラムの各々の発明としても捉えることができ、同様の作用・効果を奏する。即ち、以下のように記述することができる。
上記目的を達成するために、本発明に係る符号化装置は、動き補償予測を用いて動画像の圧縮符号化を行う符号化装置であって、動画像のフレームを分割した第1のブロックの各々についてさらに分割した第2のブロックの単位で、1つ又は複数の動きベクトルを割り当てて動き補償予測を行う動き補償予測手段と、前記第2のブロックに対する動きベクトルの割当状況に関する情報をビットストリームに多重して出力する割当情報符号化手段とを備えたことを特徴とする。
このとき動き補償予測手段は、第1のブロック内での第2のブロックの位置及び数に関わらず第2のブロックの単位で動きベクトルを割り当てて動き補償予測を行い、割当情報符号化手段は、第2のブロックの位置及び当該第2のブロックに割り当てられた動きベクトルについての情報を、動きベクトルの割当状況に関する情報として用いる態様を採用することができる。
また、動き補償予測手段は、1つ又は複数の第2のブロックをグループ化することにより予め定めた割当パターンに従って第2のブロックの単位で動きベクトルを割り当てて動き補償予測を行い、割当情報符号化手段は、前記割当パターンの識別情報を、動きベクトルの割当状況に関する情報として用いる態様を採用することができる。
上記目的を達成するために、本発明に係る復号装置は、動き補償予測を用いて圧縮動画像データの伸長・復号を行う復号装置であって、動画像のフレームを分割した第1のブロックの各々についてさらに分割した第2のブロックの単位で割り当てられた動きベクトルが、前記第1のブロックの単位で復号される1つ又は複数の動きベクトルのうちいずれに該当するか、を示す動きベクトル割当情報を復号する割当情報復号手段と、該動きベクトル割当情報に基づいて前記第2のブロックの単位で特定された動きベクトルを用いて動き補償を行い予測画像を生成する動き補償手段とを備えたことを特徴とする。
このとき割当情報復号手段は、割り当て対象の第2のブロックの位置及び当該第2のブロックに割り当てられた動きベクトルについての情報として、前記動きベクトル割当情報を復号する態様を採用することができる。
また、割当情報復号手段は、1つ又は複数の第2のブロックをグループ化することにより予め定めた割当パターンの識別情報として、前記動きベクトル割当情報を復号する態様を採用することができる。
上記目的を達成するために、本発明に係る画像処理システムは、動き補償予測を用いて動画像の圧縮符号化を行う符号化装置と、動き補償予測を用いて圧縮動画像データの伸長・復号を行う復号装置とを含んで構成された画像処理システムであって、符号化装置は、動画像のフレームを分割した第1のブロックの各々についてさらに分割した第2のブロックの単位で、1つ又は複数の動きベクトルを割り当てて動き補償予測を行う動き補償予測手段と、前記第2のブロックに対する動きベクトルの割当状況に関する情報をビットストリームに多重して出力する割当情報符号化手段とを備え、復号装置は、動画像のフレームを分割した第1のブロックの各々についてさらに分割した第2のブロックの単位で割り当てられた動きベクトルが、前記第1のブロックの単位で復号される1つ又は複数の動きベクトルのうちいずれに該当するか、を示す動きベクトル割当情報を復号する割当情報復号手段と、該動きベクトル割当情報に基づいて前記第2のブロックの単位で特定された動きベクトルを用いて動き補償を行い予測画像を生成する動き補償手段とを備えたことを特徴とする。
このとき、符号化装置における動き補償予測手段は、第1のブロック内での第2のブロックの位置及び数に関わらず第2のブロックの単位で動きベクトルを割り当てて動き補償予測を行い、割当情報符号化手段は、第2のブロックの位置及び当該第2のブロックに割り当てられた動きベクトルについての情報を、動きベクトルの割当状況に関する情報として用いることを特徴とし、復号装置における割当情報復号手段は、割り当て対象の第2のブロックの位置及び当該第2のブロックに割り当てられた動きベクトルについての情報として、動きベクトル割当情報を復号する態様を採用することができる。
また、符号化装置における動き補償予測手段は、1つ又は複数の第2のブロックをグループ化することにより予め定めた割当パターンに従って第2のブロックの単位で動きベクトルを割り当てて動き補償予測を行い、割当情報符号化手段は、前記割当パターンの識別情報を、動きベクトルの割当状況に関する情報として用いることを特徴とし、復号装置における割当情報復号手段は、1つ又は複数の第2のブロックをグループ化することにより予め定めた割当パターンの識別情報として、前記動きベクトル割当情報を復号する態様を採用することができる。
上記目的を達成するために、本発明に係る符号化プログラムは、動き補償予測を用いて動画像の圧縮符号化を行う符号化装置に内蔵されたコンピュータに、前述した符号化方法に係る発明の各々における各工程を実行させることを特徴とする。
上記目的を達成するために、本発明に係る復号プログラムは、動き補償予測を用いて圧縮動画像データの伸長・復号を行う復号装置に内蔵されたコンピュータに、前述した復号方法に係る発明の各々における各工程を実行させることを特徴とする。
本発明の上記目的及びその他の特徴や利点は、添付図面を参照して以下の詳細な説明を読むことで、当業者にとり明らかとなろう。
発明を実施するための最良の形態
以下、本発明に関する各種の実施形態を順に説明する。
まず、本発明に関する第1実施形態では、マクロブロック単位で符号化を行う映像符号化装置において、マクロブロックを4×4画素単位に分割したサブブロックごとに、最大2本の動きベクトルを割り当てて動き補償予測を行えるように構成した映像符号化装置および復号装置について述べる。
まず、本発明が適用されるH.26L符号化方式に基づく画像符号化・復号装置の構成及び動作を説明する。
図1に符号化装置の構成、図2に復号装置の構成を示す。図1の符号化装置では、動き補償インター予測により時間方向に存在する冗長度を削減し、直交変換によりさらに空間方向に残る冗長度を削減することで映像信号の情報圧縮を行う。動き補償インター予測の説明図を図3A、図3Bに、ブロックマッチング処理の概要を図4A〜図4Gにそれぞれ示す。また、図43には符号化装置の基本的な動作を示す流れ図を、図44には復号装置の基本的な動作を示す流れ図を、それぞれ示す。
以下、これらの図を参照しながら、図1および図2の符号化・復号装置の動作を説明する。
図1における入力映像信号1はフレーム画像の時間系列であり、以後はフレーム画像単位の信号を表すものとする。また、符号化対象となるフレーム画像を、図3Bにおける現フレーム30Bとする。現フレーム30Bは、16画素×16ライン固定の正方矩形領域(マクロブロックと呼ぶ)に分割され、その単位で以下の符号化処理が行われる。
現フレーム30Bの各マクロブロックはまず動き検出部2に送られ、ここで、予測モード3の決定とそれに対応した本数の動きベクトル4の検出が行われる。H.26L符号化方式では、予測モード3として、同一空間上の符号化済み近傍画素を用いた空間予測を行うイントラ予測モードと、時間的に異なる符号化済みフレーム画像(図3Aにおける前フレーム30A)を用いた動き補償予測を行うインター予測モードが複数用意され、これらを映像信号の局所的な性質に応じてマクロブロック単位で切り替え、効率的な情報圧縮を行うことができるよう構成されている。
即ち、図43の流れ図において、符号化装置に入力映像信号1が入力され(S01)、動き検出(S02)及び動き補償(S03)を行うとともに、空間予測部9による後述の空間予測(S04)を行う。
動き補償予測とは、図3A、図3Bに示すように現フレーム30Bの入力映像に類似する信号パターン(予測値)を前フレーム30Aの復号画像から所定の探索範囲32内で探し出して、空間的な変位量を動きベクトルとして検出し(例えばホイール31の空間的な変位量を動きベクトル33として検出し)、予測残差信号と動きベクトルとを符号化情報として伝送する技術である。H.26Lでは図4A〜図4Gに示すように7種類のインター予測モードがある。正確には、映像が静止している場合などで有用な、前フレームの同位置の画素をそのままコピーする予測モード(スキップモード)も用意されているがここでは説明の都合上割愛する。図4Aのモード1では16×16画素単位、図4Bのモード2は8×16画素単位、図4Cのモード3は16×8画素単位、図4Dのモード4は8×8画素単位、図4Eのモード5は4×8画素単位、図4Fのモード6は8×4画素単位、図4Gのモード7は4×4画素単位に動きベクトルを検出する。つまり、これら7種類の予測モードは、マクロブロック内の動き検出単位を細分化できるようにしたものであり、マクロブロック内に存在しうる種々の動きを正確に捉えることを目的として設けられている。
動き検出部2では、マクロブロックごとに図4A〜図4Gのすべてのインター予測モードについて評価を行い、もっとも符号化効率がよいと判断されるモードを選択する。イントラ予測モードも同様に符号化効率を評価して、インター予測モードよりも効率がよい場合にはイントラ予測モードが選択される。インター予測モードが選択される場合には、結果として、動きベクトル4は予測モード3で定められる本数分(最大でマクロブロックあたり16本)検出・伝送されることになる。イントラ予測モードが選択される場合には動きベクトル4は伝送されない。
インター予測モードが選択される場合には、決定された予測モード3と動きベクトル4が動き補償部5に送られ、動きベクトル4を用いてフレームメモリ6中の前フレームの符号化済み画像信号7を参照して、各マクロブロックの動き補償予測画像8が取り出される。
イントラ予測モードが選択される場合は、空間予測部9において、近傍の符号化済み画像信号7を参照して予測値10が生成される。最終的に使用される予測値11は、予測モード3に基づいてスイッチ12において動き補償予測画像8と予測値10のいずれかとして選択される。
上記のような予測値11と入力映像信号1との差分値を表す予測残差信号13が生成され(図43のS05)、予測残差信号13は直交変換部14に送られ直交変換により直交変換係数15となる(S06)。直交変換係数15は量子化部16に送られ量子化処理によって量子化直交変換係数17となり(S07)、可変長符号化部23に送られる。ここでエントロピー符号化が行われて圧縮ストリーム24に多重される(S08)。
一方、図43では省略したが、量子化直交変換係数17は逆量子化部18、逆直交変換部19を経て局所復号され、予測値11と加算されて局所復号画像20となる。局所復号画像20は、直交変換ブロックの境界におけるブロックひずみなどの劣化を除去するためにループフィルタ21にて境界画素に対してフィルタ処理が施され、フィルタ後局所復号画像22となり、フレームメモリ6に格納される。フレームメモリ6に格納された画像データは以降のフレームの動き補償予測のための参照データ7として用いられる。
また、予測モード3も、マクロブロックの単位で可変長符号化部23にてエントロピー符号化され、圧縮ストリーム24に多重される(S08)。このようにして得られた圧縮ストリーム24は出力される(S09)。
次に、図2及び図44をもとに復号装置の動作を説明する。復号装置では、符号化データとしての圧縮ストリーム24を受信した(図44のS21)のち、可変長復号部25で各フレームの先頭を表す同期ワードを検出し、以後、マクロブロック単位に予測モード3、動きベクトル4、量子化直交変換係数17が復元される(S22)。
予測モード3がインター予測モードを示している場合(S23で肯定判断の場合)は、動きベクトル4は動き補償部5に送られ、動き補償部5は符号化装置の動作と同様、フレームメモリ26(フレームメモリ6と同じように使用される)から動きベクトル4だけ動いた画像部分を動き補償予測画像8として取り出す(S24)。一方、予測モード3がイントラ予測モードを示している場合(S23で否定判断の場合)は、空間予測部9において近傍の符号化済み画像信号7を参照して予測値10が生成される(S25)。
S23〜S25と並行して、予測残差信号に対し逆量子化部18による逆量子化(S26)、逆直交変換部19による逆直交変換(S27)が順に行われ、予測残差信号の復号値が生成される。
一方、予測モード3に応じて、スイッチ12において最終的な予測値11が決定され、これが上記生成された予測残差信号の復号値と加算され、復号画像20となる(S28)。さらにループフィルタ21を介して最終的な復号再生画像22が得られ(S29)、所定の表示タイミングで表示デバイスへ出力され(S30)、映像が再生される。復号再生画像22は同時に以降のフレームの動き補償に用いられるため、フレームメモリ26に格納される。ここで、画像データ20、22は符号化装置における同一番号のデータと同一の値となる。
以下、本実施形態の詳細な説明に移るが、本実施形態では、上述した図1および図2に示す符号化装置、復号装置において、圧縮ストリーム24中に含まれる予測モード3(特にインター予測モード)および動きベクトル4の定義と、動き検出部2および動き補償部5の動作に特徴がある。そのため、以下では、符号化装置に関しては動き検出部2の動作、および予測モード3、動きベクトル4の定義を中心に説明を行い、復号装置に関しては予測モード3と動きベクトル4とから映像信号を復号する手順を中心に説明を行うこととする。
▲1▼固定的な動きベクトル割当パターンの定義
動き検出部2は用意されるすべての予測モードについて評価を行い、符号化効率がもっともよいモードと対応動きベクトルを検出する。従来例のH.26L符号化方式では、インター予測モードとして図4に示すパターンが吟味されるが、本実施形態では、4×4ブロック(サブブロック)単位で最大2本の動きベクトルを割り当てる方法として、図6A〜図6Dに示す固定の分割パターンをインター予測モードとして用意し、これらの中から最も符号化効率がよいものを選択する構成をとる。固定分割パターンとして図6A〜図6Dのパターンを用いる理由は、マクロブロック内を2分割するにあたって、これらのパターンが分割ルールとして最も利用頻度が高いことが予測されるという点にある。例えば、中央部分と周辺部分とでベクトル割当が行われるパターンは、16画素×16ラインの内部という極めて局所的な動きがあるケースを示すが、このようなケースは映像中ではまれにしか発生しない。一方で、図6A〜図6Dに用意した分割パターンは、水平・垂直・斜め方向の典型的な動きがマクロブロック外にもつながるパターンを示しており、利用頻度が高いと推察される。このうち図6B〜図6Dにおいて、白領域と灰色領域とが動きベクトル割当の区別を示しており、マクロブロック内をこれらのパターンに動き分割して動き補償予測することが可能となる。
図6Aのモード0では、マクロブロック(16×16画素)領域を1本の動きベクトルで予測する。これはH.26L符号化方式のインター予測モードのモード1と全く同じ定義である。また、図6Bのモード1、2はマクロブロックを16×8、8×16画素の領域に2分割しており、これも図4B、図4Cにおけるモード2、3と等価である。一方、図6C、図6Dのモード3以降は本実施形態特有のモード定義であり、図6Cのモード3〜6ではマクロブロックを水平・垂直方向に不均一に分割することを許可する。不均一な水平・垂直方向の分割は特に画面端のように新しい絵柄が徐々に現れるような箇所において利用価値が高い。さらに図6Dのモード7以降は、マクロブロック内を斜め方向に分割することを許可する。斜め方向の分割は物体の境界部分に沿った動きの不連続性を捉えたり、画面隅から現れる新しい絵柄に対する予測という点で利用価値が高い。以上、図6Aのモード0を除くすべてのモードでは動きベクトルは2本のみであるが、様々な動き分割パターンをあらかじめ用意しておくことにより、図6Bのモード1、2のような均等分割では捉え切れないマクロブロック内の動きを、少ない動きベクトル数で的確に捉えることが可能となる。
図6A〜図6Dのモード0〜14に対する4つのグループ分け(図6AのグループG1、図6BのグループG2、図6CのグループG3、図6DのグループG4)は、各予測モードを伝送する場合の符号量の違いを示している。本実施形態では、図4A〜図4GのH.26L予測モード情報に比べて倍の数のモード数を有するため、そのオーバーヘッドを効率よく符号化するために、各モードにおける分割数、分割方向、あるいは分割された領域の面積比に応じて、可変符号長割当による可変長符号化を行う。まず、分割数という観点からは動きベクトルの数が少なくオーバーヘッドが少ないモード0に対して全モード中で最短の符号を割り当てる。一般に、映像信号は時間相関が非常に高いため、マクロブロック内を動きに応じて分割する必要性はマクロブロック単位で動き補償(Motion Compensation:MC)を行う場合に比べれば低いと考えられる。また、2分割パターンについては、映像信号の性質上、斜め分割パターンよりも水平・垂直分割の頻度が高いと考えられる。さらに、ブロックサイズが均一で両セグメントが同じ面積を単位としてMCを行うほうが平均的な予測残差電力を低減させやすいという観点から、均一分割の符号長を短く設定する。一方、不均一分割は、特に画面端など新しい絵柄が現れる場合、すでにフレーム内に存在する絵柄部分をよりよく予測する用途に適すると考えられる。斜め分割は、映像中の動物体の輪郭において、水平−垂直の動きだけでは捉え切れない動きを捉える用途で適するが、一般に他のモードよりは発生頻度は少ないと考えられる。
ただし、この可変長符号化方法は一意ではなく、あるマクロブロックの予測モードの可変長符号化を行うにあたって、その近傍の予測モードの状況(文脈、コンテクスト)を加味して符号長割当を行う方法も可能である。例えば、あるマクロブロックの予測モードを符号化する場合に、左のマクロブロックがモード0、左上のマクロブロックがモード9であった場合、現在のマクロブロックにはモード9のパターンを継承する動き分割が発生しやすい、と考えることができる。すなわち、このようなケースではモード9の符号長を短くするなど、左、上、右上などの近傍マクロブロックの予測モード状況(コンテクスト)をパラメータとして符号テーブルを変更するなどといった工夫が考えられる。映像の種類によらず汎用的なコンテクストを定めることによって効果的な符号割当が可能となる。同時に、このようなコンテクストを見出すことによって、固定的な符号割当の代わりに算術符号化を採用し、コンテクスト依存で算術符号化の確率テーブルを切り替えて符号化することによる冗長度削減効果も期待できる。
予測モード符号化のための可変長符号化テーブルは、映像の動きの内容に応じて切り替えてもよい。例えば、極めて動きの激しい映像やシーンチェンジを含むフレームでは、図6C、図6Dにおけるモード3〜14のような斜め分割や不均等分割などのイレギュラーなパターンが多発すると考えられ、一方で静かな映像ではこれらの予測モードはあまり発生しないことが考えられる。つまり、フレームやシーケンスの単位で有効な予測モードの割合はかなり変動するのが自然であると考えられる。このような区別を行うために、例えばフレームもしくはフレーム群の先頭のヘッダ情報の一部に、当該フレームにて用いる予測モード符号化用の可変長符号化テーブルや、コンテクスト定義を決定するためのフラグ情報を多重しておくことが考えられる。また、予測モード値の分布は符号化圧縮率にも依存すると考えられ、フレーム単位の量子化パラメータ初期値にしたがって、複数用意した予測モード値の可変長符号化テーブルを切り替えて使用するように構成してもよい、
このように、映像信号の局所的性質に応じて予測モードのコンテクストの設定を行うことで、出現し得る予測モードをある程度限定できるため、図6C、図6Dに示したよりもさらに多くの予測モードを用意するようにしても、予測モード情報を符号化することによるオーバーヘッドを低く抑えることが可能となる。例えば、図6C、図6Dの予測モードバリエーションを図4A〜図4Gのバリエーションに加えたものを使用するようにしてもよい。ただし、コンテクストを前提とする可変長符号化では近傍領域の圧縮データが伝送誤りなどによって正しく復号されなかった場合、現在の予測モード情報を独立に正しく復号することができないという問題がある、こういった問題を回避するためには、例えばMPEG−2映像符号化方式などで用いられているようにフレーム画像内をより細かい独立符号化画像領域(スライス)の単位に区切り、スライスの境界ではスライスをまたがるコンテクストを使用しないようにすればよい。この方法ではスライスの境界で若干の符号化効率の低下があるが、そのトレードオフで誤りに対する耐性を高めることができる。
さらに、多くの予測モード情報を符号化条件に応じて切り替えるように構成してもよい。従来、従来例に述べたH.26Lより以前の標準符号化方式(MPEG−1やMPEG−2など)で見られる動き補償による予測符号化では、一つのマクロブロックに一つの動きベクトルを割り当て、符号量の調整は残差符号化の結果であるDCT係数の精度で行われていた。ところが、近年の符号化(H.263やMPEG−4)からはひとつのマクロブロック内を複数ブロックに分割する予測モードが備えられ、符号量の調整はDCT係数だけではなく、予測に関する符号量のバランスで行われるようになった。その後のH.26Lでは、さらに多くの予測モードを用意し、符号量の調整は用いられる動きベクトル数に応じた動き補償の精度で行われる傾向が強くなっている。H.26Lでは、高レートでは図4A〜図4Gのモードのうち多くの動きベクトル数を利用できるモードを用い動き補償の精緻化により符号量を調整している。しかし、低レートでは符号量の調整が動きベクトル数で行われるために、図4A〜図4Gのモードのうち選択できるモードはほとんどが一つのマクロブロック当たり1又は2(モード1〜3)に限定され、動き補償精緻化による符号化効率の向上が望めないことが課題として考えられる。
符号量対誤差(Rate−Distortion)の最適化の観点からは、最適な動き補償モデルは与えられた符号化速度(符号量)に応じて異なるべきである。即ち低レートで用いられる動き補償モデルと高レートで用いられる動き補償モデルは異なるべきである。高い符号化レートでは多モード多数動きベクトルにより波形保存の意味で動き補償を精緻化する一方で、低い符号化レートでは、限られた動きベクトル数でより効率の良い動き補償を行うアプローチが必要となる。このようなレートに応じて動き補償モデルを切り替えるアプローチはこれまでの符号化標準では行われていない。
ここで、低レートでは図6A〜図6Dのように、一つのマクロブロックに単一の動きが存在するか、単一の動きが存在しない場合でも動きの異なる物体の境界が一つ存在する(すなわちマクロブロックあたりの動きベクトル数が2に限定される)動き補償モデルを考える。一つのマクロブロック当たりの動きベクトルが2に限定された場合として、マクロブロックの2分割を単純な水平垂直分割ではなく、水平垂直斜めおよび位相を加えた分割に拡張することにより、一つのマクロブロック内に動きの異なる物体の境界が存在する場合に対処する。一方、高レートでは図4A〜図4Gに示したような多くの動きベクトル本数を許容する動き補償モデルも許容する。つまり、このような動き補償モデルの変更を映像の符号化条件に応じて切り替えられるような仕組みが有用である。例えば、フレームもしくはフレーム群(例えばMPEG−2映像符号化方式におけるシーケンスやGOP、MPEG−4映像符号化方式におけるビデオオブジェクトレイヤ、ビデオオブジェクトプレーンなどの単位に相当)単位で、その先頭のヘッダ情報の一部に、使用する動き補償モデル(すなわち、予測モードのセット定義)の動的変更を行うための識別情報を多重化するように構成する。
また、そのような動き補償モデルの変更は、スケーラブルな構成として実装上及び符号化データ利用上の利便性を向上させることができる。例えば、図32A〜図32Cに示すように、3つの予測モードのセットを定義する。図32Aでは最小限の予測モードが用いられることとし、図32Bではそれに加えて本実施形態にて提示している、少ない動きベクトルを用いた予測モードが用いられる。図32Cではさらに、多数分割多数動きベクトルによる予測モードが加えられたセットとしている。
このようなセットを定義することにより、計算量負荷の低減が最優先される場合には図32Aの予測モードセットを用いることとし、高い符号化レートにおいて多モード多数動きベクトルによるより精緻な動き補償を追求することが求められる場合には図32Cの予測モードセットを用いることとし、これら特別な要求がない場合では図32Bの予測モードセットを用いることとすれば、符号化条件に応じて動き補償モデルを切り替えることができる。また、図32A〜図32Cの構成では、それぞれの予測モードは、より予測モード数の多いセットのサブセットとなっている。例えば、図32Bの予測モードセットは図32Cのセットのサブセットとなっている。したがって、それぞれの予測モードセットに基づいて符号化された符号化データは、より上位のセットに基づいた実装において復号可能とすることができる。
このような動き補償モデルの変更は、映像符号化方式におけるプロファイルとして定義して用途別に利用可能な動き補償モデルを規定することも考えられる。プロファイルとは、多数の符号化機能を規定する符号化方式において、用途別に必須とする符号化機能のサブセットを定義することにより実装・計算量負荷と符号化効率とのバランスをとる仕組みである。図32A〜図32Cに示した予測モードのセットは、それぞれを個別のプロファイルにおいて利用される予測モードセットとして扱うことができ、またそれぞれのプロファイルをより上位のプロファイルのサブセットとして、スケーラブルなプロファイル構造とすることができる。
このとき、動き補償のモデル変更と、残差符号化の単位を独立に扱うと符号化器、復号器の実装上都合が良い。H.26Lの場合、残差符号化は4×4画素単位で行われるため、マクロブロックの分割モデルも4×4画素単位ブロックとする。これにより、動き補償モデルの変更は、残差符号化ブロックの各動きベクトルへの帰属の付け替えとして扱えるため、実装効率の観点での効果は大きい。
▲2▼動きベクトル情報の予測符号化
一般に低ビットレートでは、動きベクトル情報のオーバーヘッド比率が高まるため、検出された動きベクトル情報を効率よく符号化する必要がある。通常、マクロブロックの単位で動きが大きさ・方向ともにバラバラになることは考えにくく、その意味で、動きベクトルは近傍マクロブロックと似通った値をとるのが普通である。このような観点から、動きベクトルは近傍の動きベクトルから予測値を決定し、その予測残差データを符号化する。以下、本実施形態における動きベクトル符号化方法について説明する。
H.26L符号化方式では、フレームメモリ6内に過去の複数の符号化済みフレーム画像を参照画像として格納しておき、それらのうちのいずれかを指定して動き補償予測を行う仕組みを備えている。これは特に、静止背景の前に動領域が存在して、動領域の動きによって背景が見え隠れするような映像において効果的な予測が期待できる。本実施形態においても動き検出部2においてこの仕組みを利用可能であり、かつ、マクロブロック内に2本の動きベクトルが存在する場合、個々に参照フレームを変更できるように構成することができる。
H.26L映像符号化方式のインター予測モードではマクロブロック内を動き分割しているにも関わらず、動きベクトルの本数が多いために各動きベクトルは同一参照フレームから求める必要があったが、本実施形態では多数の動きベクトルを使用しないでオーバーヘッドを削減する分、各動きベクトルに参照フレーム切替情報を付与することを許可することで、さらに動き補償予測の効率を向上することができる。このとき参照フレーム切替情報は、同一マクロブロック内あるいは近隣のマクロブロックもしくはサブブロックにおける切替情報と似通った値をとることが多くなる。このことを利用して切替情報を予測したり、まとめて符号化することにより、参照フレーム切替情報に必要となる符号量を削減することもできる。
もちろん、参照フレーム切替情報自体は付加情報として伝送しなければならないため、そういった切替が必要ないシンプルな映像の場合は、マクロブロック内で参照フレームは同一にするというルールも選択できるように構成してもよい。この場合、例えば、フレームもしくはフレーム群の単位で、マクロブロック内の参照フレーム変更を許すか否かを識別するためのフラグ情報を多重することが考えられる。これにより、復号装置は、マクロブロック内で参照フレームが変更しない場合は、参照フレーム切替情報をマクロブロックにつき1つだけ復号するように動作すればよい。
一方で、参照フレームを動き検出の単位で変化させることが可能である場合、隣り合う動き検出単位間で参照フレームが異なるとそれらの動きベクトル間の相関が低くなるという問題がある。つまり、その場合には動きベクトルの予測の精度が低くなることになる。
例えば、図7Aは現在のマクロブロックがモード1であり、その左、上、右上のマクロブロックがそれぞれモード0、1、8であるケースを示す。このような場合、近傍予測モードのコンテクストつまり動き分割の連続性から、同図中の矢印に示すように、左セグメントの動きベクトルは左、上ともに相関が高いことが予想され、右セグメントの動きベクトルは上、右上ともに相関が高いことが予想される。つまり、図7Aで現在、左、上、右上がともに同じ参照フレームを参照している場合は、いずれの予測値でも精度よく予測できると考えられる。しかし、例えば上のマクロブロックの2つの動きベクトルが現在のマクロブロックの動きベクトルと異なる参照フレームを使用していて、左のマクロブロックは同一参照フレームを用いている場合は、左側のマクロブロックの動きベクトルの方がより予測精度が高いと考えられる。
一方、図7Bにおいて、上のマクロブロックが現在のマクロブロックと異なる参照フレームを使用しているものと考えると、上のマクロブロックとの動きの連続性はなくなり、かつ、コンテクスト上、左のマクロブロックのいずれの動きベクトルを予測に使用するべきかが定まらないばかりでなく、動きの連続性が期待できないため高い予測精度が期待できない。
このような問題を解決するために、本実施形態では、近傍予測モードのコンテクストに基づいた予測候補の優先度付けを行い、適応的に動きベクトル予測値を定める。近傍予測モード情報や参照フレーム切替情報自体はすでに復号済みの情報を用いるため、この動きベクトル予測値決定プロセスのための特別な付加情報は必要ない。以下、具体的な動きベクトル予測値決定処理の流れを説明する。
1)各セグメントごとに、予測値候補となる近傍動きベクトルを定める。図8A〜図8Cにモード0、1、7の例を示す。図8Aのモード0では動きベクトルが1本しかないため、斜線の網がけのブロック位置の動きベクトルを候補とする。図8Bのモード1では白領域、灰色領域(図8Bのマクロブロック内で斜線を付した領域)に対してそれぞれ動きベクトルが存在するため、白領域の動きベクトルについて斜線の網がけブロック、灰色領域の動きベクトルについて横縞の網がけブロック位置の動きベクトルを予測値候補とする。なお、このモード1の図8Bでは、マクロブロック上方の中央部にて、斜線の網がけブロックと横縞の網がけブロックとが重なっている。図8Cのモード7では、白領域は上部とは動きの連続性に欠けるため、左の斜線網がけブロック位置の動きベクトルのみを予測値候補とする。灰色領域では、横縞網がけブロック位置の動きベクトルを予測値候補とする。これらの予測候補位置を各モードに対してあらかじめ定めておき、符号化装置と復号装置の間で共有する。
2)予測値候補が含まれるマクロブロックのうち、同一参照フレームを使用する予測値を含んだマクロブロックを特定する。近傍が同一参照フレームを用いているか否かの判断は、すでに復号済みの近傍マクロブロックの情報を保持しておけば可能である。
3)2)で特定したマクロブロックのうち、予測モード情報に基づいて予測使用優先度の高いマクロブロックと動きベクトルを特定して、その動きベクトルを予測値とする。予測使用優先度は、図9のように近傍との動きの連続性を考慮し、各予測モードに対して固定的に定義しておき、符号化装置と復号装置とで共有する。図9において、例えばモード5を例にとって説明すると、現在動きベクトル予測の対象となっているマクロブロックの予測モードがモード5である場合、その上のマクロブロックでは、モード値にして0、6、2、8、9、12、13の順序で動きの連続性についての優先度が高いと定義する。また、左のマクロブロックのとるモード値は、5、0、2、8、12の順序で優先度が高いと定義する。右上のマクロブロックについても同様に定義を行う。例えば上と左とで優先順位が同じになった場合は、いずれか一方を断定的に予測値とするように定める。つまり、この例では、自身の予測モードがモード5で灰色領域の動きベクトルの予測を行う場合、上、左の予測候補位置の動きベクトルが同一参照フレーム、右上が異なる参照フレームを用いていて、且つ上にモード13が、左にモード5が現れた場合、左の動きベクトルを予測値として最優先する。
4)図8Cにおけるモード7の白領域のように、予測候補位置がひとつだけの場合は、同一参照フレームであればそれをそのまま予測値として用い、異なる参照フレームであれば所定の位置の複数の予測値候補を用いて予測値を決定する(例えばメディアン予測を用いる)。
5)複数の予測値候補位置があるにも関わらず、いずれの近傍マクロブロックも動きの連続性が期待できない場合(図9の優先順位に含まれていない予測モードである場合)は、すべての予測値候補を用いた予測値決定(例えばメディアン予測)を行う。
6)予測値候補のすべての動きベクトルが、予測しようとする動きベクトルとは異なる参照フレームを用いている場合は、すべての予測値候補を用いた予測値決定(例えばメディアン予測)を行う。
動きベクトルの符号化は以上の処理の結果得られる予測値を用いて予測残差データを可変長符号化する。
また、動きベクトルの予測値は図10A〜図10Dのように固定的に与えてもよい。これらの図において、白矢印は白領域の動きベクトルに対する予測の方向、黒矢印は黒領域の動きベクトルに対する予測の方向を示している。図10Cのモード4を例にとると、モード4の白領域の動きベクトルの予測には、白領域のうちの上から3番目のサブブロックと左隣の位置にあるサブブロックの動きベクトルを予測値とする。このルールでは、近傍との動きの連続性に対する考慮が十分になされないが、固定的に予測位置を割り当てるために動きベクトル予測処理に関する装置実装を軽くできるメリットがある。なお、図10A〜図10Dにおいても、予測値として使用する予定のブロックが異なる参照フレームを使用している場合には、その連続性は絶たれるものとしてメディアン予測などの手法に切り替えることが望ましい。
▲3▼圧縮ストリームシンタックス
本実施形態の符号化装置から出力される圧縮ストリーム24のマクロブロックデータのシンタックスを、図11AのH.26Lの現行シンタックスと比較して図11Bに示す。
これらの図に示すラン情報(RUN)とは、上述のスキップモードと判断されたマクロブロックの数を符号化するデータであり、第n番目のマクロブロックから第n+5番目のマクロブロックまでの間がスキップで、第n+6番目のマクロブロックがスキップではない場合、ラン情報=5という符号化データが第n+6番目のマクロブロックデータの先頭に付与される。マクロブロックタイプ情報(MB_Type)は図1の予測モード3を示す。
インター予測モードとしては図4A〜図4Gに示す7種類がここで識別される。なお、図11Aのイントラ予測モード情報(Intra_pred_mode)とは、イントラ予測モードにおいて複数の空間予測方法の識別のために用いる情報でありインター予測モードが選択される場合は省かれる(図11Aの矢印P1)。参照フレーム情報(Ref_frame)はインター予測モードが選択された場合に動きベクトルが指し示す参照フレームの番号を指定するデータであり、直前のフレーム1枚だけを参照フレームとして使用する場合には省かれる(矢印P2)。動きベクトル差分値(MVD)は動きベクトルについての予測値との差分値であり、水平・垂直成分の順でそれぞれ多重される。ここで、図4Gに示すようにH.26Lでは動きベクトルが最大16本であるため、動きベクトル差分値のデータは最大で16個多重されることになる(即ち、矢印Q1は最大16回のループを示す)。動きベクトル差分値の個数はマクロブロックタイプ情報によって決まる。なお、イントラ予測モードが選択される場合は省かれる(矢印P3)。以上のデータに引き続いて、予測残差信号の直交変換係数データ(Texture Coding Syntax)が多重される。
一方、図11Bに示す本実施形態のシンタックスでは、マクロブロックタイプ情報において図6A〜図6Dに示す14種類のインター予測モードが識別される(イントラ予測モードはH.26Lと同じとみなす)。また、1つの動きベクトルに対して1つの参照フレーム情報が対応づけられるため、参照フレーム情報と動きベクトル差分値とは常に組として多重される。参照フレーム情報と動きベクトル差分値の組の個数はマクロブロックタイプ情報によって決まる。最大個数は2個である(即ち、図11Bの矢印Q2は最大2回のループを示す)。なお、インター予測モードが選択される場合は矢印P4のようにイントラ予測モード情報が省略され、またイントラ予測モードが選択される場合は矢印P5のように参照フレーム情報および動きベクトル差分値が省略される。
このとき参照フレーム情報は、同一マクロブロック内あるいは近隣のマクロブロックもしくはサブブロックにおける参照フレーム情報と似通った値をとることが多くなることから、これを利用した符号化を行ってもよい。例えば、同一マクロブロック内での2つの参照フレーム情報の値の組み合わせに対して1つの符号を割り当てることとして、組み合わせパターンの発生確率をもとに符号を構成し、数多く発生する組み合わせについての符号量を低減することができる。
図33AにH.26Lにおける参照フレーム情報の符号構成を、図33Bに参照フレーム情報の組み合わせに対して割り当てた符号の例を示す。例えば同一マクロブロック内での参照フレーム情報がどちらのブロックも0となることが多ければ、図33Aの符号では参照フレーム情報2つで2ビット必要になるのに対して、図33Bの符号では1ビットで符号化することができ、符号量を低減することができる。この場合、参照フレーム情報に関する符号は図11Bのシンタックスと異なり、図33Cに示すように、動きベクトル差分値と組にはならずにマクロブロック毎に1つだけ多重されることとなる。なお、図33Cの矢印P26、P27は該当の処理を省略してジャンプすることを表し、矢印Q11は最大2回のループを表す。
また、近隣のマクロブロックもしくはサブブロックにおける参照フレーム情報をもとに予測を行い、符号を切り替えるようにしても良い。例えば、前述の動きベクトルの予測と同様に図10A〜図10Dのように固定的に予測位置を割り当て、予測位置に対応づけられている参照フレーム情報を予測値とすることができる。モード0のように固定的な予測位置が割り当てられていない場合や予測位置がイントラ予測モードである等により参照フレーム情報が対応づけられていない場合も存在するので、これらの場合には既定の予測値を用いることとする。この予測値が得られた場合の参照フレーム情報の値の発生確率をもとに符号を構成し、予測値に応じて符号を切り替える。
例えば、図34Aの符号を変更前もしくは予測値が0であった場合の符号とし、一例として予測値が4であった場合の符号として図34Bのように構成された符号を使うものとする。参照フレーム情報が予測値と同じ値をとることが多く、予測値が4である場合に参照フレーム情報が4となる確率が、参照フレーム情報が2となる確率よりも高くなるのであれば、図34Aの符号をそのまま使う場合よりも図34Bの符号を使うことにより参照フレーム情報の符号量を低減することができる。なお、この場合には、参照フレーム情報は図11Bと同じく動きベクトル差分値とは常に組として多重化されることとなる。
図示はしていないが、直交変換係数データの中には、マクロブロック内の8×8ブロックの単位で符号化すべきデータが存在するか否かを示す有意係数存在識別情報(CBP:Coded Block Patternの略)があり、このデータを用いることによって、有意係数のない8×8ブロックでは一切情報伝送を省くことができ、直交変換係数データの符号化が効率化されている。図35A〜図35Cにその例を示す。マクロブロックが図35Aのように分割されて符号化され、かつ各サブブロック(4×4ブロック)において、白で示されたブロックには有意係数が無かったものとする。この場合、図35Bに示すように8×8ブロックの単位で有意係数の有無を符号化して伝送し、8×8ブロックに含まれる各4×4ブロックでの直交変換係数データの有無をあらかじめ指示することにより、各4×4ブロックでの情報伝送を省いて符号量を削減することができる。
本実施形態による予測モードを用いる場合、2本の動きベクトルを使用するパターンが選択されるケースでは、その分割により予測効率が向上しているため、分割境界に位置する予測残差信号では符号化すべき係数データが少なくなっていることが予想される・特に、モード3以降の不均一分割、斜め分割では8×8ブロックの内部に分割境界が存在することがあり、この部分については符号化を要する係数データが存在しない確率が高くなると考えられる。したがって、その状況に合わせて、予測モードに応じて有意係数存在識別情報の可変長符号化テーブルや算術符号化の確率テーブルを変更するように構成することができる。これによって、予測モードに応じて有意係数存在識別情報の符号化を効率化することが可能となる。
また、本実施形態による予測モードを用いる場合には、マクロブロックが変化の無い部分と変化の大きい部分とに分割されるなどして、有意係数の有無が各分割領域毎に一定となることも考えられる。このような場合には、H.26Lにて用いられているように8×8ブロック毎に有意係数の有無を指示するのではなく、各分割領域について有意係数の有無を指示するように有意係数存在識別情報を構成して符号化することとして、有意係数存在識別情報に必要となる符号量を低減することもできる。図35Cにその例を示す。図35Bのように8×8ブロック単位で有意係数の有無を伝送する場合にはそのパターン数が多くなってしまうが、図35Cのように分割領域について有意係数の有無を送る場合にはパターン数を小さくすることができ、有意係数存在識別情報に必要な符号量を削減することができる。
次いで、復号装置における復号処理手順について説明する。図12に復号装置の処理フローを示す。
まず、可変長復号部25において、ピクチャ(即ち、映像の個々のフレームの符号化データ)の先頭を表す同期ワードを検出し(S101)、ピクチャヘッダを復号する(S102)。ピクチャヘッダには、当該ピクチャがイントラ符号化されるピクチャ(すべてのマクロブロックをイントラ予測によって符号化するピクチャのこと。以下、Iピクチャと呼ぶ)か、インター予測を使用するピクチャ(以下、Pピクチャと呼ぶ)かを識別するピクチャタイプ情報や、直交変換係数データの量子化パラメータなどの値が含まれる。続いて、図11Bのシンタックスで構成される個々のマクロブロックデータの復号に進む。マクロブロックのレイヤでははじめにラン情報を復号する(S103)。ラン情報のデータの定義は前述の通りであり、ラン情報の数分だけのスキップマクロブロックが発生する。スキップマクロブロックについては、フレームメモリ26中に格納されている所定の参照フレーム上で同位置にある16×16画素領域をそのまま復号画像データとして獲得する(S104、S105)。復号画像を獲得する処理は、動き補償部5に対して動きベクトルゼロ、所定の参照フレーム番号を与えることによって行われる。ラン情報が当該ピクチャの最終マクロブロックを示す場合には(S106)、その時点で当該ピクチャの可変長復号処理を終了し、ループフィルタ21においてブロック歪み除去処理を施した後(S118)、次のピクチャの可変長復号処理へ移る。
通常の符号化マクロブロックに関しては、ステップS107に進んでマクロブロックタイプ情報の復号を行う。これで予測モード3が確定する。予測モード3がイントラ予測モードを示す場合(S108で肯定判断の場合)は、イントラ予測モード情報の復号を行う(S109)。なお、正確にはH.26Lには、サブブロック(4×4ブロック)単位でイントラ予測を行うイントラ4×4モードと、16×16画素の単位でイントラ予測を行うイントラ16×16モードの2種類のイントラ予測モードがあり、イントラ予測モード情報を必要とするのはイントラ4×4モードのみであるが、本実施形態の説明としては趣旨が異なるため、これらの処理の違いについての詳細説明は省略する。イントラ予測モード情報が確定すると、空間予測部9において近傍の画像データからイントラ予測値が生成される(S110)。
一方、予測モード3がインター予測モードを示す場合(S108で否定判断の場合)は、それは図6に示したいずれかのモードを示す値となっている。したがって、この時点で参照フレーム情報および動きベクトル差分値を何組復号すべきかが確定する(モード0では1組、それ以外では2組)。この情報にしたがって、参照フレーム情報と動きベクトル差分値の組を復号する。ただし、参照フレーム情報が多重されているかどうかは、前述のピクチャタイプの情報に統合されているため、ピクチャタイプの値で参照フレーム情報が存在するか否かの判断を行う必要がある(S111)。
また、図には記載していないが前述のように同一マクロブロック内あるいは近隣のマクロブロックもしくはサブブロックにおける参照フレーム情報の値を利用した参照フレーム情報の符号化が行われている場合には、それらに応じて参照フレーム情報の組み合わせ情報をもととして、あるいは予測値による符号の切り替えを行った上で、参照フレーム情報の復号を行う。
参照フレーム情報がある場合はその値を復号したあとで動きベクトル差分値を復号し(S112、113)、参照フレーム情報がない場合は動きベクトル差分値のみが復号される(S113)。こうして得られた参照フレーム情報、動きベクトル差分値、マクロブロックタイプ情報で示される予測モード、および近傍の予測モード情報、並びに、図8A〜図8C、図9に示す符号化装置と同じ予測値候補位置、予測使用優先度に基づいて、動きベクトルの予測値が決定され、マクロブロック内のすべてのサブブロックに対応する各動きベクトル情報が復元される。この動きベクトル情報4が動き補償部5に送られ、動き補償部5は、指定された参照フレーム情報と動きベクトルとに基づいて、個々のサブブロックに対する動き補償予測値を生成する(S114)。
以上の処理が終了すると、可変長復号部25では当該マクロブロックの予測残差信号の直交変換係数データ17の復号を行い(S115)、逆量子化部18、逆直交変換部19にて予測残差信号の復元を行う(S116)。最後にS110又はS114で得られた予測値を加算することによって当該マクロブロックの復号画像を獲得する(S117)。その後、次のマクロブロックの復号処理に移る。
以上述べた符号化装置・復号装置によれば、マクロブロック内の様々な動きを少ないオーバーヘッドで的確に捉えることが可能となり、効率よく映像伝送・記録・再生を行うことが可能となる。また、本実施形態では、マクロブロック内を様々な形状で動き分割して予測効率を向上すると同時に、動き補償予測対象となる領域がサブブロックの組み合わせで構成されているため、H.26L映像符号化方式のようにサブブロック単位の予測残差信号符号化を行う場合、サブブロックの内部には予測の分割境界が存在しないため、不連続波形が生じないというメリットがある。これは予測残差信号符号化にDCTを用いる場合には余分な高周波係数を発生させなくて済むというメリットがあり、ベクトル量子化を用いる場合でも特異な信号波形が抑えられ、コードブックで規定される汎用的な波形での表現で済む、という意味で効率的な符号化を行うことができる。
次に、第2実施形態を説明する。本実施形態では、マクロブロック単位で符号化を行う映像符号化装置において、マクロブロックあたり最大2本の動きベクトルを使用し、マクロブロックを4×4画素単位に分割したサブブロックごとに、上記2本の動きベクトルを割り当てて動き補償予測を行えるように構成した映像符号化装置および復号装置について述べる。第1実施形態が、サブブロックに対する動きベクトル割当が固定パターンとして与えられていたのに対して、本実施形態ではサブブロックへの動きベクトル割当を任意に指定できるように構成された符号化装置・復号装置について述べる。
本実施形態では、従来例の図1および図2で示した符号化装置、復号装置において、圧縮ストリーム24中に含まれる予測モード3(特にインター予測モード)、動きベクトル4の定義と、動き検出部2および動き補償部5の動作が異なること以外は同一の部材・動作にて説明できる。以下では符号化装置に関しては動き検出部2の動作、および予測モード3、動きベクトル4の定義を中心に説明を行い、復号装置に関しては予測モード3と動きベクトル4とから映像信号を復号する手順を中心に説明を行うこととする。
まず、本実施形態における予測モード3の構成とそれに伴う動きベクトル4の検出手順を中心に、符号化装置の処理ならびに復号装置に伝送される圧縮ストリームの構成について説明する。本実施形態における予測モード3は、図13A〜図13Cに示すように、前述した図6A〜図6Dの固定の動きベクトル割当だけでなく、任意の割当状況を指定できるように拡張された情報として定義される。すなわち、2本の動きベクトルのIDをそれぞれ0、1とすれば、図13A〜図13Cのように4×4のバイナリマップ情報として表現される。ここで、IDの割り振りは例えば圧縮ストリーム中の伝送順序としての意味を有する。
以下、図13A〜図13Cのように割当が可能な動きベクトル4の決定方法(動き検出部2において実施)と、図13A〜図13Cの表現による予測モード3の符号化方法について説明する。第1実施形態では固定的に動きベクトルの割当が定まっている複数のパターンを評価すればよかったため、動きベクトルの検出はそれぞれの領域で固定的に実施すればよかったが、本実施形態における動きベクトル検出は、動きベクトル割り当ての最適性を考慮しながら実施する必要がある。
図14に検出の一例の手順を示す。まず、S201にて16×16画素を単位とする動きベクトル検出を実施する。これは図4Aのモード1、図6Aのモード0の場合と同様の動きベクトル検出でよい。この結果得られる動きベクトルを第1動きベクトルV1とする。次に、その結果得られる予測値を用いて、各4×4のサブブロックごとに予測評価値(ここでは差分絶対値和SAD:Sum of Absolute Differenceを用いることにしている)を求め、所定値よりも予測評価値が大きくなるサブブロックを例外サブブロック領域として抽出する(S202)。これにより、斜線部が例外サブブロック領域を示す動きベクトル割当マップ40が得られる。この例外サブブロック領域は第1動きベクトルV1では十分な予測ができなかった領域を示しており、例外サブブロック領域を特定することで、予測効率に基づいた動きベクトル割当が可能となる。次いで例外サブブロック領域のみを対象とする動きベクトル検出を行い、第2動きベクトルV2を検出する(S203)。
以上の処理過程で、予測評価値だけでなく、動きベクトル値や例外サブブロック領域で決定される動きベクトル割当情報(即ち、図1の予測モード3)の符号量も考慮に入れて検出処理を行うように構成してもよい。また、第1実施形態のように、第1および第2動きベクトルの検出はそれぞれ個別に参照フレームを変更して検出するようにしてもよい。
図15に別の検出例の手順を示す。この例ではまず、サブブロックを単位として動きベクトルの検出を行い、16本のベクトルを求める(S204)。ついで、マクロブロック全体として、符号量と予測効率の観点で最適になるよう、16本のベクトルを2本のベクトルV1、V2にクラスタリングする(S205)。特に、予測モード3の符号量を考慮してベクトル割当を行うことにより、マクロブロックを符号化するにあたって最適なレート歪みバランスとなるような動きベクトルを検出することが可能である。以上のような方法に基づいて動き検出部2において、予測モード3および動きベクトル4が決定される。
次に、予測モード3の情報の符号化方法について図16A、Bを用いて説明する。符号化の手順を図17のフローチャートに示す。図16A、BのマクロブロックCが符号化対象のマクロブロックであるとし、マクロブロックAはCの直上に位置するマクロブロック、マクロブロックBはCの左隣に位置するマクロブロックとする。各マクロブロックは4×4のサブブロック単位に分割して白色・灰色の違いで動きベクトル割当(図1の予測モード3)の様子を示している。符号化は、マクロブロックAおよびBの予測モードの状況に基づいて、サブブロックにおける動きベクトル割当の変化点を符号化していく。まず、マクロブロックAおよびBの予測モード状況から、A又はBのいずれの予測モードの状況を継承するか(予測優先コンテクスト)を定める(図17のS206)。また、ラインカウンタLをゼロにリセットする。図16Aでは、あきらかにマクロブロックAからの動きの連続性が高いことがわかるため、矢印で示したように垂直方向の動きベクトル割当の変化を検出対象とする。以後、これを垂直予測優先コンテクストと呼ぶ。逆に、図16Bのように、マクロブロックBからの動きの連続性が高いと判断される場合は水平方向の動きベクトル割当の変化を検出対象とする。以後、これを水平予測優先コンテクストと呼ぶ。図16A、Bでは、マクロブロックCがそれぞれの予測優先コンテクストで符号化されるとした場合の変化点を太線で示している。以下は図16Aの事例で説明する。
ラインLの処理にあたって、まず残りラン数r、ラン開始点a0、ラン終了点a1を確定する(S207)。ラン終了点a1とは、予測優先コンテクストで指定されるマクロブロック(図16Aの場合はマクロブロックA)の最隣接サブブロックで割り当てられている動きベクトルと異なる動きベクトルが割り当てられるサブブロック位置を示す。
ただし、実際にはマクロブロックAとCとで同一の動きベクトルを連続的に検出することは一般的ではないため、例えば予測優先コンテクストで指定されるマクロブロックの最隣接サブブロックの動きベクトル割当状況(0又は1)を、符号化対象のマクロブロックの初期ラン開始点a0の割当と同一であるとみなして処理を開始する、などの方法をとる必要がある。
別の方法としては、予測優先コンテクストをマクロブロックC内に閉じて適用する方法もある。つまり、16個のサブブロックのうち、左上隅のサブブロックはその0又は1の値そのものを残し、最上ライン4つについては左隣のサブブロックからの変化点を1とし、最左列4つについては常に直上サブブロックからの変化点を1とする。このように決めることによって、残りのサブブロックの変化点は予測優先コンテクストに基づいて決定する。
ラインLの先頭ではr=4、a0=0であり、図16Aの例ではL=0におけるa1は3であることがわかる。これにより、ラインLにおける、同一動きベクトルが割り当てられ続けるサブブロック数はR=a1−a0で与えられる。この値を、残りラン数rによって決まる符号長CB(r)を用いて可変長符号化する(S208)。符号長CB(r)の例を図18A〜図18Cに示す。Rの符号化に際しては途中経過によって残りのRの発生状況が制約をうけるため、このように残りラン数rに応じて符号長を切り替えることによって、符号化効率を高めることができる。例えば、図16AのL=0では、まずr=4、R=3が得られるため、CB(4)を用いてR=3(符号1が割り当てられ、符号長は3ビット)の符号化を行う。次いで、残りラン数rを、r=r−Rによって更新するとともに、ラン開始点a0をa1に移す(S209)。これにより、r=1となるが、残りラン数が1というのはその時点でラインLにおける動きベクトル割当がすべて確定したことを意味するため、特に符号を伝送する必要はない。これがCB(1)が定義されない理由である。したがって、r≦1の場合はLをカウントアップして次のラインに処理を移行する(S210、S212)。逆にr>1の場合は、新しい変化点を検出し(S211)、上記の処理を繰り返す。図16AのマクロブロックCの最終ラインL=3においては、最初のサブブロックがいきなりラン終了点になっているため、CB(4)の「初期反転0」のコードを符号化し、以降、残りラン情報数r=3として処理を進める。ライン数Lが4になった時点で符号化処理を終了する。
以上、図16AではL=0で3ビット、L=1で4ビット、L=2、3で6ビット、さらに予測優先コンテクストの符号量分(ここでは水平・垂直いずれの場合でも3ビットとする)を加えて、18ビットで予測モード3の符号化が行われる。図16Bのケースでは、L=0、1で4ビット、L=2、3では各1ビットで符号化可能であり、コンテクスト分を加えて13ビットで符号化できる。バイナリ情報のままでも16ビットで表現可能であるため、16ビット以上の表現になるケースはエスケープ符号などの工夫によって16ビット固定長符号で符号化するように構成することができる。さらに、図16Aのケースのように、分割パターンとして出現頻度が高くなると予想されるパターン(図6B〜図6Dに示したようなケース)については、あらかじめ固定の短い符号を割り当て、それ以外の任意の分割パターンを表現する場合に、上記符号化による符号を使用するように構成してもよい。以上の符号化処理手順によれば、サブブロック単位での任意の動きベクトル割当状況を示す図1の予測モード3の情報を効率よく符号化・伝送することが可能となる。
上記説明を踏まえて、本実施形態の符号化装置から出力される圧縮ストリーム24のマクロブロックデータのシンタックスを、H.26Lのシンタックス(図19A)と比較して図19B、Cに示す。図19Bは本実施形態のもっともシンプルなシンタックス例で、マクロブロックタイプ情報は、イントラ予測かインター予測かの判別のみ含み、インター予測については、16×16画素単位動き補償の場合に最短符号を割当て、予測優先コンテクストの情報に対して次に短い符号を割り当てる。予測優先コンテクスト情報はすなわち、任意分割パターンによるインター予測モードであることを示す。
イントラ予測は一般にインター予測よりも出現頻度が低いので、予測優先コンテクスト情報よりも長い符号を割り当てる。例えば、H.26Lの可変長符号定義に基づけば、16×16画素単位動き補償モードに符号”1”(1ビット)を、予測優先コンテクスト情報に符号”001”、”011”(3ビット)を割り当てる。イントラ予測モードが選択される場合、H.26Lと同様、イントラ予測モード情報が復号される(インター予測モードの場合は矢印P9のようにイントラ予測モード情報が省略される)。次に、上記の符号化方法で符号化されるサブブロック単位の動きベクトル割当情報動きベクトル割当情報を多重する。これは16ビットの固定長符号であってもよい。なお、イントラ予測モードの場合はこの情報は、矢印P10のように該当の処理が省略される。以降は、第1実施形態に述べた通りである。
図19Cは別のシンタックス構成を示しており、マクロブロックタイプ情報で予測優先コンテクストを表現する代わりに、符号”001”、”011”(3ビット)によって任意分割パターンでのインター予測のモード情報を可変長で送るか固定長(16ビット)で送るかの識別情報として使用する。可変長であることが示された場合は、予測優先コンテクスト(pred_ctx)に続いて、動きベクトル割当情報(Pattern_info)を多重する。一方、固定長であることが示された場合は16ビットの固定長符号で多重する。また、図19Bにおいて、マクロブロックタイプ情報において、図6B〜図6Dに示されるような特定の出現頻度の高い分割パターンを示す情報と、それ以外のパターンであることを示すエスケープ符号とを表現できるように定義することも可能である。この場合、動きベクトル割当情報には予測優先コンテクストの値を含ませることになる。これにより、出現頻度の高い分割パターンは動きベクトル割当のための追加情報を必要とせず、より効率的な符号化が可能となる。なお、図19A〜図19Cにおいて、矢印P6〜P15は該当の情報が省略されることを表し、矢印Q3は最大16回のループを、矢印Q4、Q5は最大2回のループを表す。
復号装置の動作フローを図20に示す。本実施形態における復号装置は、第1実施形態の復号装置と比べ、予測モード情報3の復号手順が異なる点を除いて同じ動作であるため、予測モード情報3の復号処理の部分についてのみ説明する。
図20において、S101〜S118は図12に示した第1実施形態の復号装置の処理ステップと同じ処理ステップである。図20のS108において、インター予測モードであることが示された場合、S215にて図19Bにおける動きベクトル割当情報を復号する。この際、予測優先コンテクスト情報はすでにマクロブロックタイプ情報に含まれており、ここではS214のプロセスで復号された予測優先コンテクスト情報に基づいてCB(r)を用いた復号処理を行う。これは一般の可変長復号処理にて実施可能であるため詳細説明は省略する。16個すべてのサブブロック分の動きベクトル割当が確定した段階でS215の処理を終了し、参照フレーム情報、動きベクトル差分値の復号処理に移行する。以降は第1実施形態に述べた通りである。
また、図20において、図19Cのシンタックスに基づく復号処理も説明できる。この場合、ステップS214では、予測優先コンテクスト情報の代わりに、動きベクトル割当情報が可変長符号か、固定長符号かが示される。これに基づいて、ステップS215では図19Cのシンタックスに基づいて動きベクトル割当情報の復号を実施する。可変長符号の場合は、予測優先コンテクスト情報の復号処理を先に実施する。さらに、マクロブロックタイプ情報がいくつかの出現頻度の高い分割パターン(例えば図6B〜図6Dのモード1〜14)の識別情報を含む場合は、S214のステップですでに分割パターンが定まるので、任意分割パターンを示すエスケープ符号を検出したとき以外はS215のステップをスキップするように構成すればよい。
以上述べた符号化装置・復号装置によれば、マクロブロック内の様々な動きをサブブロックの単位で任意に分割して捉えることが可能となり、少ないオーバーヘッドで効率よく映像伝送・記録・再生を行うことが可能となる。
次に、第3の実施形態を説明する。本実施形態では、第2実施形態における任意の分割パターンを示す図1の予測モード3の別の符号化方法を説明する。図21はその処理フローを、図16Aで用いた具体例とともに示したものであり、図22はその処理の説明図である。まず、図21のS301にて第2実施形態と同様の予測優先コンテクストを決定する。ここで、垂直予測優先コンテクストが選択されると、マクロブロックAの最下端のサブブロックラインから見て、動きベクトル割当がどこで変化するかを変化点として検出する(S302)。例えば、図22AのマクロブロックA、Cでは、太線部分が変化点として検出される。これにより、有変化点を1、無変化点を0とする図22Bのバイナリマップが生成される。これを所定のスキャンテーブル(例えば図22Cのスキャンテーブル)を用いてスキャニングしてゼロランを生成する(S303)。
例えば、ここでは垂直予測優先コンテクストが採用されていることから、図22Cの垂直方向にスキャンを行うためのスキャンテーブルを用いて図22Bのバイナリマップをスキャニングする。この結果、{3、1、3、5}というゼロランの組が生成される。この情報を可変長符号化する(S304〜S307)ことによって、予測モード3の符号化が行われる。スキャンの途中で変化点がなくなる場合(S305で肯定判断の場合)、以降のゼロラン情報は1つの終端符号(EOB)のみで代替される(S306)。
逆にスキャンの終了時点まで変化点が存在する場合は、ゼロランと変化点の数の総計が16であることを利用して最後のゼロランの符号が確定されるため、終端符号による符号化は行わない(S307で肯定判断されS306を実施しない)。
スキャンテーブルについては、例えば、図23Aのジグザグスキャン、図23Bの水平スキャン、図23Cのヒルベルトスキャンを使用するようにしてもよいし、これ以外にも任意のテーブルを使用可能である。予測優先コンテクストに基づいてスキャンを変更するようにしてもよいし(水平予測優先コンテクスト選択時には水平スキャンとする等)、ある特定の汎用的なスキャンルールを固定的に使用してもよい。また、スキャンテーブルを切り替えるための専用フラグを予測モード3の情報の一部として符号化するようにしてもよい。この場合は、符号化装置で複数のスキャン方法から最も符号化効率のよいスキャンテーブルを選択的に使用することができる。
以上述べた符号化方法によって得られる予測モード3のシンタックスは、図19B、Cに示した動きベクトル割当情報を、第2実施形態の符号化方法とおきかえることによって実現できる。また、復号装置の構成も図20におけるS215のステップが、本実施形態で述べた符号化方法による符号を復号して予測モード3を確定させる処理に該当する。
なお、本実施形態では、予測優先コンテクスト情報を使用する事例を説明したが、予測優先コンテクストに依存せず、変化点をある固定の規則で検出するようにして、予測優先コンテクストの情報を符号化しない様に構成することも可能である。このときスキャンテーブルは固定でもよいし、フラグを設けて効率のよいテーブルを切り替えるように構成してもよい。
以上述べた符号化装置・復号装置によれば、マクロブロック内の様々な動きをサブブロックの単位で任意に分割して捉えることが可能となり、少ないオーバーヘッドで効率よく映像伝送・記録・再生を行うことが可能となる。
次に、第4実施形態を説明する。本実施形態では、サブブロック単位に、動きベクトル割当を変更するだけでなくイントラ/インター予測の区別も行えるように図1の予測モード3を構成した符号化装置・復号装置について説明する。これにより、サブブロックごとにイントラ、インター(複数動きベクトルのうちのいずれか)を選択して符号化することができるため、マクロブロック単位にモード切替を行うよりも、実際の映像の性質に適応した効率的な符号化を行うことが可能となる。
まず、本実施形態における図1の予測モード3の定義について、図24A、Bの例を用いて説明する。H.26L符号化方式では、イントラ予測として4×4のサブブロック単位でイントラ予測モード情報で識別される複数の予測方法を切り替えて空間予測を行うイントラ4×4モード(INTRA_4×4)と、マクロブロックの単位で複数の予測方法を切り替えて空間予測を行うイントラ16×16モード(INTRA_16×16)との2種類が用意されている。
イントラ予測モード情報には計6種類(1〜6)の空間予測方法が定義されており、これらをサブブロックの単位で指定することが可能である。そこで、これを拡張し、4×4サブブロックの予測モードとして動きベクトル割当情報を統合する。つまり、2本の動きベクトルが使用可能である場合、その予測方法のIDを7、8と定義する。この定義に基づいてサブブロックに予測方法1〜8が割り当てられた例が図24A、Bに示されている。図24Aでは対角方向にイントラ/インターの区別が行われ、インターの中でも2つの動きベクトルが使用されている。
図24Bではマクロブロックが上下に分割され、上部がイントラで下部がインターで予測される例で、この例ではインター予測には1本の動きベクトルしか使用されない。以下、この多値の予測割当情報のことを、多値予測識別マップ情報と呼ぶ。
なお、イントラ16×16モードと、16×16画素単位動き補償モード(以下、インター16×16モード)との識別については、4×4サブブロック単位の予測割当情報を必要としないため、マクロブロックタイプ情報による識別だけで実現できる。すなわち、マクロブロックタイプ情報を、イントラ16×16モード、インター16×16モード、及びサブブロック単位任意予測割当の3種類に分類する。次いで、サブブロック単位任意予測割当のモードである場合には、上記の多値予測識別マップ情報を符号化することによってすべてのサブブロックの予測方法を確定する。
この例では、符号化装置の動き検出部2において、イントラ16×16モード、インター16×16モード、及びサブブロック単位任意予測割当のすべての可能性について評価を行い、もっとも符号化効率のよいモードを選択することができる。もちろん、いずれかのモードの組合せに固定して符号化するような装置を構成してもよい。サブブロック単位予測の最適な検出は様々な手法が考えられるが、例えば第2実施形態の図14で示した方法を拡張し、例外サブブロック領域のうち、イントラ予測の予測評価値よりも大きな予測評価値を有するサブブロックはイントラ予測にする、などの方法でマップ情報を確定することができる。
以下では、図24A、Bに示した多値予測識別マップ情報の符号化方法について述べる。このマップ情報は、第2実施形態および第3実施形態で示した動きベクトル割当情報とほぼ同じ符号化方法で符号化できる。異なるのは、第2実施形態および第3実施形態の符号化対象の情報がバイナリマップであったのに対し、本実施形態の符号化対象がグレイスケールマップであることである。
(1)符号化方法1
第2実施形態の方法で実現するには、個々のモード情報をビットプレーンに展開する。例えば、イントラかインターかを示すプレーン、個々のイントラ予測方法についての使用の有無を示すプレーン(計6プレーン)、動きベクトルの割当のプレーンという分け方ができる。これらの各プレーンを第2実施形態に示す方法で符号化することができる。例えば、図24Aの多値予測識別マップ情報を上記のルールでビットプレーンに分解すると、図25A〜図25Cのようになる。ここで、図25Aのイントラ/インター分類のプレーンと図25Cの動きベクトル割当のプレーンはいずれも予測優先コンテクストを用いているが、イントラ予測方法のプレーンについてはその予測方法の有無のみでビットプレーンを構成している。
図25A〜図25Cの計8つのプレーンのバイナリマップを第2実施形態の方法で所定の順序で符号化することにより、本実施形態の予測モード3の情報を表現できる。また、最初にイントラ/インターの区別を伝送しておくことにより、イントラ予測方法に関する図25Bの6プレーンおよび図25Cの動きベクトル割当のプレーンは、図26B、Cのように、それぞれイントラ、インターに該当するサブブロック分だけをビットプレーンデータとするように構成してもよい(即ち、図26B、Cの灰色部分は符号化対象としない)。これにより、符号化すべき情報量を効率よく低減することができる。以上のプレーン情報を、第3実施形態の符号化方式を使用して符号化するように構成してもよい。
(2)符号化方法2
また、第3実施形態の変形として符号化する方法として、予測方法の無変化点を0とし、同一予測方法が継続する無変化区間をラン表記する方法も考えられる。この方法による場合、図24Aのケースは図27のように変換される(水平予測優先コンテクストにて変化点検出)。この情報を、ゼロランと変化点の予測方法IDとの組で符号化する。この例では、図23Bの水平スキャンを用いて、{(5、7)、(0、1)、(2、7)、(3、8)、(1、7)}という組に展開できる。これらの組に可変長符号を割り当てて符号化する。スキャンテーブルはフラグを用意して効率のよいテーブルを切り替えて使用できるように構成してもよい。
また、この時、インター予測である7、8の値による変化は予測方法の変化ではないものとみなして無変化点とし、動きベクトル割当情報のプレーンを別に符号化するように構成してもよい。
(3)符号化方法3
さらに、従来例のH.26L符号化方式におけるイントラ予測モード情報に、インター予測のフラグを追加するように拡張し、インター予測部分だけを動きベクトル割当プレーンの形で伝送するように構成してもよい。
(4)符号化方法4
イントラ/インター分類パターンおよび動きベクトル割当パターンを、例えば図6A〜図6Dのように固定的に割り振っておく。全てのイントラ/インター分割状況、動きベクトル割当状況は、固定パターンIDとして符号化器・復号器間で識別可能であるため、これらのパターンのIDを出現頻度の順で可変長符号化する。また、イントラ/インター分割パターン、動きベクトル割当パターン(第1実施形態相当)については、近傍のマクロブロックで選択されるパターンとの相関が高いことが考えられるので、イントラ/インターの分割パターンについても第1実施形態と同様に、近傍マクロブロックの状況によるコンテクストを定義し、コンテクストに応じてその可変長符号化テーブルもしくは算術符号化のための確率テーブルを切り替えるように構成してもよい。
以上の方法で符号化される予測モード3のシンタックスを図28〜図31に示す。図28〜図31は、上記符号化方法1〜4にそれぞれ対応する。符号化方法1では、図28に示すように、動きベクトル割当情報をビットプレーンごとに符号化する。予測優先コンテクストについては第2実施形態に記載の通り、同一マクロブロック内で閉じた定義にしてもよいし、使用しないように構成してもよい。
符号化方法2では、図29に示すように、予測優先コンテクストに続いてスキャンテーブルを識別するためのスキャンテーブルフラグ情報を多重している。これは予測優先コンテクストに依存してスキャンテーブルを決定する場合や固定的にスキャンテーブルを決めてしまう場合には必要ない。続いて、ゼロランと変化点の予測方法IDの組をスキャンの結果得られる数分だけ伝送する。
符号化方法3では、図30に示すように、イントラ予測モード情報にインター予測フラグを追加した拡張版情報によって、6種類のイントラ予測方法にインター予測方法を加えた計7種類の方法が指定できるように拡張を行い、この拡張版情報に、インター予測の場合の動きベクトル割当を指定するための動きベクトル割当情報を伝送する構成になる。
符号化方法4では、図31に示すように、マクロブロックタイプ情報として、イントラ/インターの分類パターン、動きベクトル割当パターンを含む固定的なモード割当パターンが含まれており、非常に多くの予測モード値を一意に識別するデータとして拡張される。次いで、マクロブロックタイプ情報で指定されたイントラ予測を行う領域内の4×4サブブロックに対してのみ、イントラ予測モードの識別情報を別に伝送する構成になっている。このシンタックスのように、例えば、H.26L符号化方式のイントラ4×4モードにおいて用いられる、サブブロック単位のイントラ予測モード識別情報(イントラ予測モード情報)をそのまま用いるように構成することができる。
なお、図28〜図31において、矢印P16〜P25は該当の情報が省略されることを表し、矢印Q7は最大16回のループを、矢印Q6、Q8〜Q10は最大2回のループを表す。
復号装置においては、図12、図20などの復号動作フローをもとに、以上の種々の構成のシンタックスを受信し、符号化方法に規定される手順と逆の手順をたどってマクロブロック内の予測モード割当を確定して、映像信号を復号する。
以上述べた符号化装置・復号装置によれば、マクロブロック内の様々な変化状況をサブブロックの単位で任意に分割して捉えることが可能となり、少ないオーバーヘッドで効率よく映像伝送・記録・再生を行うことが可能となる。
なお、本実施形態においては、予測モード定義において、動きベクトルの本数を3〜4本にして、それぞれに予測方法IDを追加で割り当てるようにしてもよい。
次に、第5実施形態を説明する。本実施形態では、第1実施形態の符号化装置・復号装置に、動きベクトル検出処理および動きベクトル予測方法に関する別の実施態様を実装した例を説明する。
第1実施形態で述べた図6A〜図6Dのインター予測モードを利用した場合、各モードの動きベクトルの検出方法は、第1実施形態の復号装置の動作で述べたように所定のシンタックスで解釈できる限りいかなる方法を採用してもよいが、本実施形態では、演算量の負荷をあまり増やさずに予測効率を向上させる動きベクトル検出手法と、それに伴う動きベクトル予測ルールを採用する符号化装置および復号装置について説明する。以下の説明において、動きベクトル検出処理は図1の動き検出部2において行われ、動きベクトル予測処理は図1の可変長符号化部23(符号化装置側)、図2の可変長復号部25(復号装置側)で行われるものであり、以降の説明では、これらの処理のフローチャートによる動作説明を行うものとする。
図6A〜図6Dに示した第1実施形態のインター予測モードセットでは、マクロブロックあたり1本又は2本の動きベクトルを検出する必要がある。低レート符号化においては、動きベクトルの本数が増える分だけ直交変換係数の表現に使用できる符号量が少なくなるため、動きベクトルの符号量のコストと、検出した動きベクトルによる予測の精度とのトレードオフを考慮しながら動きベクトルの検出を行うことが望ましい。第1実施形態のベースとしているH.26L映像符号化方式では、時間的にiフレーム分だけ前の参照フレームRFi(i≧1)において検出される動きベクトルをMVi(n,j)(n:マクロブロック位置、j:セグメント番号)、動きベクトルMVi(n,j)および参照フレーム識別情報RFiの符号化に要するビット量をRpで表し、その時に得られる予測残差電力Dpと定数λを用いて、下の式(1)で決まるコストCpを最小化する動きベクトルMVi(n,j)、参照フレームRFi(i≧1)を定める。定数λはターゲット符号化ビットレートが低くなるにつれ値が大きくなるように設定されるため、低レート符号化ではビット量Rpによる制約が厳しくなる。
Cp=Dp+λRp・・・(1)
動きベクトルは、第1実施形態に述べたように予測値を定めて予測差分値を符号化することから、検出される動きベクトルが予測値にできるだけ近い方が、ビット量Rpは小さくなる。このため、H.26L映像符号化方式では、動きベクトル探索範囲の中心点を動きベクトル予測値に設定し、動きベクトル探索窓の位置をセグメントごとに適応化することを推奨している。これにより少なくとも動きベクトルの符号量が削減され、上式のコストCpを最小化するにあたってビット量Rpの制約が緩和され、予測残差電力Dpの最小化により有利な条件で動きベクトル検出を行うことができる。近傍マクロブロックとの動きの連続性を考慮しても、探索窓位置を予測値に合わせて適応化することは予測残差電力Dpの低下にもつながるものと期待される。その一方で、探索窓の適応化には予測残差電力の計算処理負荷が大きくなるという問題がある。
この問題を説明するため、図36Aに動きベクトル探索範囲の適応化を行う場合について、図36Bに動きベクトル探索範囲の適応化を行わない場合について、それぞれ図式化した。図36Bのように、探索範囲がセグメントによらず一定の場合、セグメントの形状が階層的になっていることを利用して予測残差電力の計算回数を削減することが可能である。
例えば、図6Dにおいて、モード13の上部セグメント(白色セグメント)について一意に定められた探索窓ですべての動きベクトル候補に対して予測残差電力計算を行うことにより、モード9ではモード13の上部セグメント内の3つのサブブロックに対する予測残差電力計算を再び行う必要はなくなり、残る3つのサブブロックについての予測残差電力計算を実施すればよいことになる。これに対して、図36Aでは、図10Dの動きベクトル予測ルールを使用することを前提とすると、モード13の上部セグメントはモード9の同一箇所とはもはや探索位置が共通化されないため、その予測残差電力計算結果を再利用することができない。
そこで、本実施形態では、演算量を抑えながら探索窓のセグメントごとの適応化を行って予測精度の向上を図る動きベクトル検出処理および動きベクトル予測ルールについて説明する。本実施形態の動きベクトル予測ルールは図37A〜図37Dのように固定的に定める。このルールでは図10A〜図10Dに比べて、使用する予測位置のバリエーションが少なく、大きく分けて4種類の動きベクトル予測のみを使用する。
1種類目は、モード0と、モード9、10、13、14の上部セグメントの予測(MV予測▲1▼)であり、この場合、点線で囲んだ3ヶ所のサブブロック(4×4ブロック)位置の動きベクトルを使用したメディアン予測とする。
2種類目と3種類目はモード1〜8、11、12の予測であり、図37B〜図37Dに示すように、セグメントに応じて左又は上の固定位置のサブブロックの動きベクトルを使用した予測とする(MV予測▲2▼、▲3▼。左側からの予測を▲2▼、上側からの予測を▲3▼とする)。
4種類目はモード9、10、13、14の下部セグメントの予測であり、この場合は、マクロブロックの右上隅のサブブロックに隣接する点線位置のサブブロックを使用して予測する(MV予測▲4▼)。
また、予測に使用する箇所の動きベクトルが、現在予測しようとする動きベクトルと異なる参照フレームを用いている場合や、イントラ符号化されていて動きベクトルが定義されていない場合には、モード0とモード9、10、13、14の上部セグメントに用いるメディアン予測をそのまま適用する。図10A〜図10Dでは、各モード、各セグメントに対して個別の予測ルールを適用していたが、本実施形態の予測ルールを適用することで、最大4種類の予測に集約される。このことによって、動きベクトルの探索時に、予測値に適応化した探索窓を設定しても、予測残差電力の計算回数を大幅に削減することが可能となる。
以上の動きベクトル予測ルールを利用して符号化装置の動き検出部2で実施される動きベクトル検出処理のフローチャートを図38に示す。そこで、図38を用いて、上記動きベクトル予測ルールを利用した動きベクトル検出処理を説明する。
まず、MV予測▲1▼を用いて動きベクトル予測値を求め、これを探索窓▲1▼の中心位置とする(SA1)。この探索窓▲1▼内で、まずモード0についてコストCpを最小化する動きベクトル(および参照フレーム)を検出する(SA2)。この時、マクロブロックの各サブブロックについて、探索窓▲1▼内の動きベクトル候補に対して得られる予測残差電力(予測評価値(SAD)で算出)をすべてSAD値▲1▼として保持しておく(SA3)。SAD値▲1▼は、同じMV予測▲1▼を用いるモード9、10、13、14の動きベクトルおよび参照フレーム決定の際に再利用することができる(SA4)。すなわち、モード9、10、13、14に関するコストCpを最小化する動きベクトルおよび参照フレームを、SAD値▲1▼として保持されている値から選択して加算するだけで決定することが可能であり、予測残差電力(SAD)計算を行う必要がない。
次いで、SA5において、モード1〜8、11、12についてMV予測▲2▼,▲3▼が使用可能であるか否かを判断する。ここで、MV予測▲2▼,▲3▼を使用するモード1〜8、11、12について、MV予測▲2▼,▲3▼に使用する予測位置の動きベクトルが異なる参照フレームを使用していたり、イントラ符号化であるような場合は、MV予測▲2▼,▲3▼が使用可能でないと判断し、SAD値▲1▼を用いて動きベクトルと参照フレームを決定する(SA8)。一方、SA5においてMV予測▲2▼,▲3▼が使用可能であると判断されれば、MV予測▲2▼,▲3▼を用いて求めた動きベクトル予測値を探索窓▲2▼,▲3▼の中心位置とし(SA6)、この探索窓▲2▼,▲3▼内で、モード1〜8、11、12についてそれぞれコストCpを最小化する動きベクトル(および参照フレーム)を検出する(SA7)。その後、モード9、10、13、14の下部セグメントに対してもSA5〜8と同様の処置をSA9〜12において実施する。そして、最後にSA13において、全モードのうち最小のコストCpを与えるモードを選択する。
以上の動きベクトル検出処理により、SA4,7,8,11,12の各プロセスでは、セグメントの大きさに応じて動きベクトル計算順序を定めることによって、SAD演算量をさらに削減することが可能である。例えば、モード9、10、13、14の関係では、上部セグメントに関し、モード13⊂モード9⊂モード10⊂モード14なる関係がある。つまり、モード13の上部セグメントのSAD計算の結果は、モード9の上部セグメントのSAD計算にそのまま流用可能であり、SAD値▲1▼から直接的に加算を行うよりも加算回数を削減することができる。モード1〜8、11、12についても同様のことが言えるため、これらの階層性に従って動き検出処理を実装することによって、演算量を抑えることが可能である。
一方、復号装置では、可変長復号部25における動きベクトルシンタックスの復号処理において、図10A〜図10Dの動きベクトル予測ルールの代わりに、図37A〜図37Dに示す動きベクトル予測ルールを導入して予測値を決定して、動きベクトルを復元すればよい。
次に、第6実施形態を説明する。本実施形態では、第1実施形態における動きベクトル分割パターンについて、順方向インター予測だけでなく逆方向インター予測も用いた双方向インター予測とともに用い、またマクロブロック内のそれぞれの分割セグメントについて、双方向予測の予測方向を選択することができる符号化及び復号方法を説明する。
本実施形態は、第1実施形態の場合と同様に、従来例の図1及び図2で示した符号化装置、復号装置において、圧縮ストリーム24中に含まれる予測モード3、動きベクトル4についてのシンタックスと、動き検出部2及び動き補償部5の動作が異なること以外は同一の部材・動作にて説明できる。以下では、符号化装置に関しては動き検出部2の動作を中心に説明を行うとともにシンタックスを説明し、また復号装置に関しては動き補償部5において予測画像を生成する手順を中心に説明を行うこととする。
本実施形態における動き補償モデル、すなわち固定的な動きベクトル割り当ての定義については、第1実施形態において示したものと同一のものを用いる。すなわち図6A〜図6Dに示すように、マクロブロックの2分割を単純な水平分割又は垂直分割ではなく、水平・垂直・斜め及び位相を加えた分割に拡張することとした動きベクトル割り当てを用いる。
本実施形態では、この動きベクトル割り当てにより分割されたセグメントについて、さらにセグメント毎に双方向インター予測の予測方向を選択することができることとする。これにより、一つのマクロブロック内に動きの異なる物体の境界が存在する場合などに、マクロブロック内の様々な動きを少ないオーバーヘッドで的確に捉えることが可能な当該セグメントについて、さらにセグメント毎に、より良い符号化効率を得ることのできる予測方向を、双方向予測における複数の予測方向の中から選択して割り当てることができ、予測効率を向上させることができる。
図39に、本実施形態における双方向予測の例を示す。図39では双方向予測フレームBtのマクロブロックMにおいて図6のモード9の分割が用いられ、かつマクロブロック内の2つのセグメント毎にそれぞれ、時間的に前となる参照フレームPt−1からの順方向予測F1、時間的に後となる参照フレームPt+1からの逆方向予測B1が用いられている場合を示す。
マクロブロックMの符号化を行う場合、インター予測モードとしてまず図6A〜図6Dにおけるそれぞれの予測モードの中から、より良い符号化効率を得ることのできる予測モードならびに動きベクトルが、図1における動き検出部2において評価・検出される。このとき本実施形態では、それぞれの予測モードにおいてさらに、2つのセグメント毎に双方向予測における複数の予測方向の中から、より良い符号化効率を得ることのできる予測方向が評価・検出される。図39はこれらの評価・検出の結果、マクロブロックMにおいて予測モードとしてモード9が選択され、かつそれぞれのセグメントについて異なる予測方向が選択された場合を示している。この選択結果は、以下に示す圧縮ストリーム中の情報として伝送される。
本実施形態の符号化装置から出力される圧縮ストリームのマクロブロックデータのシンタックスを、H.26Lにおける双方向動き補償予測時のシンタックス(図40A)と比較して図40Bに示す。
図40Aに示すH.26Lのシンタックスにおいては、予測方向の情報は動きベクトル分割パターンを示す予測モードマクロブロックタイプ情報の中でマクロブロックにつき1つだけ伝送され、予測モードと合わせて識別される。本発明の動き補償モデルすなわち固定的な動きベクトル割り当てにおける双方向予測時のシンタックスを用いる場合においても同様な構成を採ることとし、セグメント毎の予測方向の選択状況に関する情報も含めて予測モードマクロブロックタイプ情報として構成し伝送することもできる。しかしながら本実施形態においては、H.26Lにおける構成とは異なるものとして、予測モードの可変長符号化テーブルが長大となってしまうことを防ぐ構成とする。
図40Bには本実施形態におけるシンタックスを示す。ここでは予測方向の情報は、双方向予測においてスキップマクロブロックに相当する予測モードとなるダイレクト(Direct)モードの識別についてのみマクロブロックタイプ情報に伝送されることとし、その他の予測方向の情報は参照フレーム情報としてとして伝送され、参照フレーム番号と合わせて識別されることとしている。またH.26Lにおいて、双方向予測でのそれぞれの方向での予測モードを識別するために導入されているブロックサイズは用いないこととしている。なお、図40A、Bの矢印P28〜P36は該当の処理を省略してジャンプすることを表し、矢印Q12〜Q19はループを表す。
図41には本実施形態におけるマクロブロックタイプ情報の符号表を示す。この符号表の構成は、符号表の先頭にダイレクトモードを置いたことを除けば、第1実施形態にて用いられるマクロブロックタイプ情報の構成と同様でよい。また、コード番号17以降のイントラ16×16モードについての定義は省略しているが、これらはH.26Lの符号表におけるイントラ16×16モードについての定義に準ずるものとする。マクロブロックタイプ情報の内容により後続のシンタックスが異なるものとなり、多くの予測モードではセグメント毎に参照フレーム情報が存在するため参照フレーム情報は2つ存在することとなるが、セグメント分割の無い予測モードであるモード0においては参照フレーム情報は1つだけとなり、またイントラ4×4モードでは参照フレーム情報は存在せずイントラ予測モード情報が存在することとなる。
図42には本実施形態における参照フレーム情報の符号表を示す。H.26Lにおける参照フレーム情報の構成では、順方向予測の参照フレーム番号を識別するための番号が順に並ぶ構成となるが、ここでは参照フレーム番号の他に、双方向予測における予測方向として、順方向(Forward)、逆方向(Backward)、順方向と逆方向の予測値の平均値を用いる双方向(Bidirectional)についての情報が含まれた構成となり、またセグメント毎の参照フレーム情報が存在することとなる。順方向予測については複数の参照フレームの中から選択することができることから、順方向予測及び双方向予測についてはそれぞれ順方向での参照フレームを変更した場合についての符号が順に並ぶ構成となっている。参照フレーム情報にて予測方向が識別されることから、参照フレーム情報の内容により後続のシンタックスが異なるものとなり、順方向予測となる場合には順方向動きベクトル差分動きベクトル差分値FW、逆方向予測では逆方向動きベクトル差分動きベクトル差分値BW、双方向予測では動きベクトル差分値FWと動きベクトル差分値BWの両方が存在することとなる。また、それぞれの動きベクトル差分の数は、マクロブロックタイプ情報により識別された予測モードにより異なるものとなる。
図42の参照フレーム情報符号は、H.26Lにおける複数参照フレームの機能が用いられない場合、すなわち順方向予測の参照フレーム番号が1(1 frameback of Forward)しか存在しない場合にもセグメント毎に存在し、この場合には双方向予測の予測方向のみが参照フレーム情報から識別されることとなる。
一方、復号装置では、圧縮ストリームから得られるこれらの情報から復号処理を行うが、その処理は第1実施形態において示した流れと同様であるので、ここでは詳細説明は省略する。本実施形態の復号装置が第1実施形態の復号装置と異なる点は、圧縮ストリームから得られる情報に予測モードのセグメント毎に異なる双方向予測の予測方向の選択状況に関する情報が含まれ、これに従い図2における動き補償部5が、セグメント毎に異なる双方向予測の予測方向を用いて動き補償ならびに予測画像の生成を行うことである。これにより、セグメント毎に、より良い予測効率を得ることのできる予測方向を割り当てて得られた予測画像が生成され、より符号化効率を向上させた復号映像を圧縮ストリームから得ることができる。
本実施形態においては動き補償モデルとして図6A〜図6Dに示したものを用いることとしたが、さらに図4A〜図4Gに示したような多くの動きベクトル本数を許容する動き補償モデルを同時にあるいは図6A〜図6Dの補償モデルと切り替えて用いることとしてもよい。その場合にも分割されたブロック毎に予測の変更を行うことができるものとし、分割数が2以上となったものとみなして、本実施形態にて示したシンタックス及び符号化・復号方法を同じように適用し、マクロブロック内のブロック毎に、より良い符号化効率を得ることのできる予測方向を選択して割り当て、予測効率を向上させることができる。このとき分割数が2より大きくなる場合には、ブロック毎に予測方向の選択を行った場合の選択状況に関する情報のオーバーヘッドが大きくなってしまうことから、予測方向の選択は分割数が2の予測モードが使われる場合のみに許可されることとして、個々のマクロブロックにおいて使われる予測モードによって、ブロック毎の選択状況に関する情報が送付されるか否かが切り替えられる構成としてもよい。
セグメント毎の予測方向の選択状況に関する情報は付加的な情報として伝送されることとなるため、そういった切替が必要とされないようなシンプルな映像の場合は、マクロブロック内で予測方向は同一にするというルールも選択できるように構成してもよい。この場合、例えば、フレームもしくはフレーム群の単位で、マクロブロック内の予測方向変更を許すか否かを識別するためのフラグ情報を多重することが考えられる。これにより、復号装置は、マクロブロック内で予測方向が変更されない場合は、予測方向の選択状況を含んだシンタックスはマクロブロックにつき1つだけ存在するものとして動作すればよい。
また、本実施形態においては、マクロブロック内のセグメント毎に、双方向インター予測に用いる予測方向を選択して動き補償予測を行う符号化・復号方法を説明したが、まったく同じ方法にて、マクロブロック内のセグメント毎に、インター予測もしくはイントラ予測を選択してインター予測もしくはイントラ予測を行う符号化・復号方法を構成することもできる。そのような構成を採ることにより、インター予測によっては効率的な予測ができないセグメントに対してのみイントラ予測を選択して割り当てることができ、予測効率をさらに向上させることができる。
以上述べた本実施形態に係る符号化方法・復号方法によれば、マクロブロック内の様々な動きを少ないオーバーヘッドで的確に捉えることが可能になるとともに、それぞれ別の動きを捉えたセグメント毎に適切な双方向インター予測あるいはイントラ予測を適用することができ、効率よく映像伝送・記録・再生を行うことが可能となる。
ところで、上述した本発明の目的を達成するために、本発明に係る画像処理システムは、以下の各種の構成態様を採用することができる。
即ち、本発明に係る画像処理システムでは、符号化装置において動き補償予測手段が、第1のブロック単位に定まる第2のブロックへの動きベクトル割当パターンを予めグループ化した複数のパターングループのうちのいずれかを選択し、該選択されたパターングループに含まれる割当パターンに基づいて第2のブロックに対して動きベクトルを割り当てて動き補償予測を行い、割当情報符号化手段が、第1のブロック単位に符号化される動きベクトル割当状況に関する情報を、前記選択されたパターングループの中から特定される動きベクトル割当パターンの識別情報として出力する構成とされ、復号装置において割当情報復号手段が、動きベクトル割当情報を、第1のブロック単位に予め定められた第2のブロックへの動きベクトル割当パターンを識別する情報として復号するものとし、該割当パターン識別情報から割当パターンを特定するに際して、該割当パターンが属するパターングループを識別する情報を復号し、該パターングループ識別情報によって特定されたパターングループの定義に従って前記割当パターン識別情報から第2のブロックへの動きベクトル割当を決定する構成態様を採用することができる。
また、本発明に係る画像処理システムでは、符号化装置において割当情報符号化手段が、符号化対象となる第1のブロックについての動きベクトル割当パターンの形状に応じて動きベクトルの予測値を定め、当該予測値による予測差分値を動きベクトル情報として符号化する構成とされ、復号装置において割当情報復号手段が、復号対象となる第1のブロックについての動きベクトル割当パターンの形状に応じて定めた動きベクトルの予測値、による予測差分値を符号化することで得られた動きベクトル情報を復号する構成態様を採用することができる。
また、本発明に係る画像処理システムでは、符号化装置において割当情報符号化手段が、符号化対象となる第1のブロックについての動きベクトル割当パターンの形状に応じて動きベクトルの予測候補位置を定め、前記符号化対象となる第1のブロック近傍に位置する第1のブロックについての割当パターンの形状に応じて予測候補位置のうちのいずれかを予測値とし、当該予測値の予測差分値を動きベクトル情報として符号化する構成とされ、復号装置において割当情報復号手段が、復号対象となる第1のブロックについての動きベクトル割当パターンの形状に応じて定めた動きベクトルの予測候補位置のうちのいずれかを、近傍に位置する第1のブロックについての割当パターンの形状に応じて予測値とし、当該予測値の予測差分値を符号化することで得られた動きベクトル情報を復号する構成態様を採用することができる。
また、本発明に係る画像処理システムでは、符号化装置において動き補償予測手段が、第2のブロック単位での割り当て可能な動きベクトル数を最大2本とするとともに、第1のブロック単位に定まる該第1のブロックに含まれる第2のブロックへの割当状態を表す予め定められた複数の割当パターンのいずれかに基づいて、第2のブロックに対し動きベクトルを割り当てて動き補償予測を行い、割当情報符号化手段が、第1のブロック単位に定まる動きベクトルの割当状況に関する情報を、前記割当パターンの識別情報として出力する構成とされ、復号装置において第1のブロックの単位で復号される動きベクトルは最大2本とされ、動きベクトル割当情報は、第1のブロック単位に定まる該第1のブロックに含まれる第2のブロックへの動きベクトルの割当状態を表す予め定められた複数の割当パターンを識別する情報として復号される構成態様を採用することができる。
また、本発明に係る画像処理システムでは、符号化装置が、動画像のフレームを分割した第1のブロックの各々についてさらに分割した第2のブロックの1つ又は複数からなる単位で、動き補償予測のために保持された複数の参照フレームの中から一の参照フレームを選択して動き補償予測を行う補償予測手段と、1つ又は複数の第2のブロックに対する参照フレームの選択状況に関する情報をビットストリームに多重して出力する参照フレーム情報符号化手段とを備えた構成とされ、復号装置が、動画像のフレームを分割した第1のブロックの各々についてさらに分割した第2のブロックの1つ又は複数からなる単位で割り当てられた、動き補償予測に用いる参照フレームの選択状況に関する情報を復号する参照フレーム情報復号手段と、当該参照フレーム情報に基づいて、動き補償のために保持された複数の参照フレームの中から一の参照フレームを選択して動き補償を行い予測画像を生成する補償手段とを備えた構成態様を採用することができる。
また、本発明に係る画像処理システムでは、符号化装置が、動画像のフレームを分割した第1のブロックの各々についてさらに分割した1つ又は複数の第2のブロックからなる単位で、双方向インター予測に用いる予測方向を選択して動き補償予測を行う動き補償予測手段と、前記1つ又は複数の第2のブロックに対する予測方向の選択状況に関する情報をビットストリームに多重して出力する予測情報符号化手段とを備えた構成とされ、復号装置が、動画像のフレームを分割した第1のブロックの各々についてさらに分割した1つ又は複数の第2のブロックからなる単位で割り当てられた、双方向インター予測に用いる予測方向の選択状況に関する情報を復号する予測情報復号手段と、当該予測情報に基づいて、双方向フレーム間動き補償に用いる予測方向を順方向と逆方向の双方について保持している参照フレームの中から選択して動き補償を行い予測画像を生成する動き補償手段とを備えた構成態様を採用することができる。
また、本発明に係る画像処理システムでは、符号化装置が、動画像のフレームを分割した第1のブロックの各々についてさらに分割した1つ又は複数の第2のブロックからなる単位で、インター予測モードもしくはイントラ予測モードを選択してインター予測もしくはイントラ予測を行う予測手段と、前記1つ又は複数の第2のブロックに対するインター予測モードもしくはイントラ予測モードの選択状況に関する情報をビットストリームに多重して出力する予測モード情報符号化手段とを備えた構成とされ、復号装置が、動画像のフレームを分割した第1のブロックの各々についてさらに分割した1つ又は複数の第2のブロックからなる単位で割り当てられたインター予測モードもしくはイントラ予測モードの選択状況に関する情報を復号する予測モード情報復号手段と、当該予測情報に基づいて、インター予測モードもしくはイントラ予測モードを選択してインター予測もしくはイントラ予測を行い予測画像を生成する予測画像生成手段とを備えた構成態様を採用することができる。
産業上の利用可能性
以上説明したように、本発明によれば、第1のブロック内の様々な動きを少ないオーバーヘッドで的確に捉えることが可能となり、効率よく映像伝送・記録・再生を行うことが可能となる。
【図面の簡単な説明】
図1は、符号化装置の構成図である。
図2は、復号装置の構成図である。
図3Aは、動き補償インター予測の説明に用いられる前フレームの内容を示す図である。
図3Bは、動き補償インター予測の説明に用いられる現フレームの内容を示す図である。
図4Aは、H.26Lにおけるインター予測モードのモード1を示す図である。
図4Bは、H.26Lにおけるインター予測モードのモード2を示す図である。
図4Cは、H.26Lにおけるインター予測モードのモード3を示す図である。
図4Dは、H.26Lにおけるインター予測モードのモード4を示す図である。
図4Eは、H.26Lにおけるインター予測モードのモード5を示す図である。
図4Fは、H.26Lにおけるインター予測モードのモード6を示す図である。
図4Gは、H.26Lにおけるインター予測モードのモード7を示す図である。
図5は、インター予測モードの各モードに対して必要な最小の伝送情報量を示す表である。
図6Aは、発明の実施形態における固定分割パターンの第1グループを示す図である。
図6Bは、発明の実施形態における固定分割パターンの第2グループを示す図である。
図6Cは、発明の実施形態における固定分割パターンの第3グループを示す図である。
図6Dは、発明の実施形態における固定分割パターンの第4グループを示す図である。
図7Aは、現在のマクロブロックがモード1で、その左、上、右上のマクロブロックがそれぞれモード0、1、8であるケースを示す図である。
図7Bは、上のマクロブロックが現在のマクロブロックと異なる参照フレームを使用しているケースを示す図である。
図8Aは、モード0のケースでの動きベクトル予測値決定処理の流れを説明するための図である。
図8Bは、モード1のケースでの動きベクトル予測値決定処理の流れを説明するための図である。
図8Cは、モード7のケースでの動きベクトル予測値決定処理の流れを説明するための図である。
図9は、近傍のマクロブロックとの動きの連続性を考慮して各予測モードに対して定義された上部優先度及び左部優先度の一例を示す表である。
図10Aは、固定分割パターンの第1グループの各予測モードに対して固定的に与えられた動きベクトルの予測値を示す図である。
図10Bは、固定分割パターンの第2グループの各予測モードに対して固定的に与えられた動きベクトルの予測値を示す図である。
図10Cは、固定分割パターンの第3グループの各予測モードに対して固定的に与えられた動きベクトルの予測値を示す図である。
図10Dは、固定分割パターンの第4グループの各予測モードに対して固定的に与えられた動きベクトルの予測値を示す図である。
図11Aは、H.26Lにおける圧縮ストリームのマクロブロックデータのシンタックスを示す図である。
図11Bは、第1実施形態における圧縮ストリームのマクロブロックデータのシンタックスを示す図である。
図12は、第1実施形態における復号装置の処理内容を示す流れ図である。
図13Aは、任意の割当状況を指定するため4×4のバイナリマップ情報として表現された予測モードの第1の定義例を示す図である。
図13Bは、任意の割当状況を指定するため4×4のバイナリマップ情報として表現された予測モードの第2の定義例を示す図である。
図13Cは、任意の割当状況を指定するため4×4のバイナリマップ情報として表現された予測モードの第3の定義例を示す図である。
図14は、第2実施形態における動きベクトル検出の手順を示す図である。
図15は、動きベクトル検出の別の手順を示す図である。
図16Aは、第2実施形態における予測モード情報の符号化方法のうちマクロブロックAからの動きの連続性が高い場合の例を説明するための図である。
図16Bは、第2実施形態における予測モード情報の符号化方法のうちマクロブロックBからの動きの連続性が高い場合の例を説明するための図である。
図17は、第2実施形態における符号化処理の内容を示す流れ図である。
図18Aは、符号長CB(4)の例を示す表である。
図18Bは、符号長CB(3)の例を示す表である。
図18Cは、符号長CB(2)の例を示す表である。
図19Aは、H.26Lにおける圧縮ストリームのマクロブロックデータのシンタックスを示す図である。
図19Bは、第2実施形態における圧縮ストリームのマクロブロックデータの最もシンプルなシンタックス例を示す図である。
図19Cは、第2実施形態における圧縮ストリームのマクロブロックデータの別のシンタックス例を示す図である。
図20は、第2実施形態における復号装置の処理内容を示す流れ図である。
図21は、第3実施形態における符号化装置の処理内容を示す流れ図である。
図22は、第3実施形態における符号化装置の処理内容の説明図である。
図23Aは、スキャンテーブルのジグザグスキャンの例を示す図である。
図23Bは、スキャンテーブルの水平スキャンの例を示す図である。
図23Cは、スキャンテーブルのヒルベルトスキャンの例を示す図である。
図24Aは、第4実施形態における対角方向にイントラ/インターの区別が行われインターの中でも2つの動きベクトルが使用された予測モードの定義例を示す図である。
図24Bは、第4実施形態におけるマクロブロックが上下に分割され上部がイントラで下部がインターで予測される予測モードの定義例を示す図である。
図25Aは、イントラ/インター分類のプレーンを示す図である。
図25Bは、イントラ予測方法のプレーンを示す図である。
図25Cは、動きベクトル割当のプレーンを示す図である。
図26Aは、イントラ/インター分類のプレーンを示す図である。
図26Bは、イントラ、インターに該当するサブブロック分だけをビットプレーンデータとした場合のイントラ予測方法のプレーンを示す図である。
図26Cは、イントラ、インターに該当するサブブロック分だけをビットプレーンデータとした場合の動きベクトル割当のプレーンを示す図である。
図27は、図24Aのケースを第4実施形態の符号化方法2で変換した例を示す図である。
図28は、第4実施形態の符号化方法1に対応する圧縮ストリームのマクロブロックデータのシンタックスを示す図である。
図29は、第4実施形態の符号化方法2に対応する圧縮ストリームのマクロブロックデータのシンタックスを示す図である。
図30は、第4実施形態の符号化方法3に対応する圧縮ストリームのマクロブロックデータのシンタックスを示す図である。
図31は、第4実施形態の符号化方法4に対応する圧縮ストリームのマクロブロックデータのシンタックスを示す図である。
図32Aは、最小限の予測モードを用いた予測モードセットの定義例を示す図である。
図32Bは、第1実施形態で提示した少ない動きベクトルを用いた予測モードセットの定義例を示す図である。
図32Cは、多数分割多数動きベクトルによる予測モードセットの定義例を示す図である。
図33Aは、H.26Lにおける参照フレーム情報の符号構成を示す表である。
図33Bは、参照フレーム情報の組み合わせに対して割り当てた符号の例を示す表である。
図33Cは、図33Bに対応するマクロブロックデータのシンタックスを示す図である。
図34Aは、変更前もしくは予測値が0であった場合に予測値に応じて切り替えた符号を示す表である。
図34Bは、予測値が4であった場合に予測値に応じて切り替えた符号を示す表である。
図35Aは、直交変換係数データの符号化の効率化を説明する上でマクロブロックの分割例を示す図である。
図35Bは、8×8ブロック単位で有意係数の有無を伝送する例を示す図である。
図35Cは、分割領域について有意係数の有無を送る例を示す図である。
図36Aは、第5実施形態における動きベクトル探索範囲の適応化を行う場合の動きベクトル検出処理を説明するための図である。
図36Bは、第5実施形態における動きベクトル探索範囲の適応化を行わない場合の動きベクトル検出処理を説明するための図である。
図37Aは、第5実施形態の固定分割パターンの第1グループに関する動きベクトル予測ルールを説明するための図である。
図37Bは、第5実施形態の固定分割パターンの第2グループに関する動きベクトル予測ルールを説明するための図である。
図37Cは、第5実施形態の固定分割パターンの第3グループに関する動きベクトル予測ルールを説明するための図である。
図37Dは、第5実施形態の固定分割パターンの第4グループに関する動きベクトル予測ルールを説明するための図である。
図38は、第5実施形態の動きベクトル検出処理を示す流れ図である。
図39は、第6実施形態における双方向予測の例を示す図である。
図40Aは、H.26Lにおける双方向動き補償予測時のシンタックスを示す図である。
図40Bは、第6実施形態での圧縮ストリームのマクロブロックデータのシンタックスを示す図である。
図41は、第6実施形態におけるマクロブロックタイプ情報の符号表である。
図42は、第6実施形態における参照フレーム情報の符号表である。
図43は、符号化装置の基本的な動作を示す流れ図である。
図44は、復号装置の基本的な動作を示す流れ図である。
Claims (56)
- 動き補償予測を用いて動画像の圧縮符号化を行う符号化方法であって、
動画像のフレームを分割した第1のブロックの各々についてさらに分割した第2のブロックの単位で、1つ又は複数の動きベクトルを割り当てて動き補償予測を行う動き補償予測工程と、
前記第2のブロックに対する動きベクトルの割当状況に関する情報をビットストリームに多重して出力する割当情報符号化工程と、
を備えたことを特徴とする符号化方法。 - 前記動き補償予測工程では、
第1のブロック内での第2のブロックの位置及び数に関わらず第2のブロックの単位で動きベクトルを割り当てて動き補償予測を行い、
前記割当情報符号化工程では、
第2のブロックの位置及び当該第2のブロックに割り当てられた動きベクトルについての情報を、動きベクトルの割当状況に関する情報として用いる、
ことを特徴とする請求項1記載の符号化方法。 - 前記動き補償予測工程では、
1つ又は複数の第2のブロックをグループ化することにより予め定めた割当パターンに従って第2のブロックの単位で動きベクトルを割り当てて動き補償予測を行い、
前記割当情報符号化工程では、
前記割当パターンの識別情報を、動きベクトルの割当状況に関する情報として用いる、
ことを特徴とする請求項1記載の符号化方法。 - 前記動き補償予測工程では、
第1のブロック単位に定まる第2のブロックへの動きベクトル割当パターンを予めグループ化した複数のパターングループのうちのいずれかを選択し、該選択されたパターングループに含まれる割当パターンに基づいて第2のブロックに対して動きベクトルを割り当てて動き補償予測を行い、
前記割当情報符号化工程では、
第1のブロック単位に符号化される動きベクトル割当状況に関する情報を、前記選択されたパターングループの中から特定される動きベクトル割当パターンの識別情報として出力する、
ことを特徴とする請求項3記載の符号化方法。 - 前記割当情報符号化工程では、
符号化対象となる第1のブロックについての動きベクトル割当パターンの形状に応じて動きベクトルの予測値を定め、当該予測値による予測差分値を動きベクトル情報として符号化する、
ことを特徴とする請求項3記載の符号化方法。 - 前記割当情報符号化工程では、
符号化対象となる第1のブロックについての動きベクトル割当パターンの形状に応じて動きベクトルの予測候補位置を定め、前記符号化対象となる第1のブロック近傍に位置する第1のブロックについての割当パターンの形状に応じて予測候補位置のうちのいずれかを予測値とし、当該予測値の予測差分値を動きベクトル情報として符号化する、
ことを特徴とする請求項5記載の符号化方法。 - 前記動き補償予測工程では、
符号化対象となる第1のブロックについての動きベクトル割当パターンの形状に応じて動きベクトルの予測値を定め、当該予測値を中心とする動きベクトル探索窓を設けて動きベクトルを検出し、
前記割当情報符号化工程では、
前記検出された動きベクトルと前記動きベクトル予測値との予測差分値を動きベクトル情報として符号化する、
ことを特徴とする請求項3記載の符号化方法。 - 前記動き補償予測工程では、
第2のブロック単位での割り当て可能な動きベクトル数を最大2本とするとともに、第1のブロック単位に定まる該第1のブロックに含まれる第2のブロックへの割当状態を表す予め定められた複数の割当パターンのいずれかに基づいて、第2のブロックに対し動きベクトルを割り当てて動き補償予測を行い、
前記割当情報符号化工程では、
第1のブロック単位に定まる動きベクトルの割当状況に関する情報を、前記割当パターンの識別情報として出力する、
ことを特徴とする請求項3〜7の何れか1項に記載の符号化方法。 - 前記割当パターンは、
前記第1のブロックを水平方向又は垂直方向に不均一に分割するパターン、及び前記第1のブロックを斜め方向に分割するパターンを含むことを特徴とする請求項8記載の符号化方法。 - 前記割当情報符号化工程では、
各割当パターンの形状に基づいて、可変長の符号を各割当パターンに割り当てて前記割当パターンの識別情報を符号化することを特徴とする請求項8記載の符号化方法。 - 前記割当情報符号化工程では、
符号化対象となる第1のブロック近傍に位置する第1のブロックについての割当パターンの状況に基づいて、前記符号化対象となる第1のブロックについて、可変長の符号を各割当パターンに割り当てて前記割当パターンの識別情報を符号化することを特徴とする請求項8記載の符号化方法。 - 前記割当情報符号化工程では、
映像内容に基づいて、可変長の符号を各割当パターンに割り当てて前記割当パターンの識別情報を符号化することを特徴とする請求項8記載の符号化方法。 - 前記動き補償予測工程にて得られた予測残差信号を、前記第2のブロックのサイズと同一サイズのブロック単位で符号化する残差信号符号化工程をさらに備えたことを特徴とする請求項2又は3に記載の符号化方法。
- 前記割当情報符号化工程では、
前記動きベクトルの割当状況に基づき、1つ又は複数の第2のブロックから構成される動きベクトル割当領域において符号化すべき予測残差信号があるか否かを識別する情報を符号化する、
ことを特徴とする請求項2又は3に記載の符号化方法。 - 前記割当情報符号化工程では、
符号化対象となる第1のブロック及び隣接の第1のブロックにおける動きベクトルの割当状況に基づいて、当該割当状況における動きベクトル割当の変化点を表す情報を、前記動きベクトルの割当状況に関する情報としてビットストリームに多重して出力する、
ことを特徴とする請求項2に記載の符号化方法。 - 前記動き補償予測工程では、
第1のブロック単位でインター予測モード又はイントラ予測モードが設定された場合に加え、第2のブロックの1つ又は複数からなる単位でインター予測モード又はイントラ予測モードが設定された場合も含めて、動き補償予測を行う、
ことを特徴とする請求項2又は請求項3に記載の符号化方法。 - 動き補償予測を用いて動画像の圧縮符号化を行う符号化方法であって、
動画像のフレームを分割した第1のブロックの各々についてさらに分割した第2のブロックの1つ又は複数からなる単位で、動き補償予測のために保持された複数の参照フレームの中から一の参照フレームを選択して動き補償予測を行う補償予測工程と、
前記1つ又は複数の第2のブロックに対する参照フレームの選択状況に関する情報をビットストリームに多重して出力する参照フレーム情報符号化工程と、
を備えた符号化方法。 - 前記参照フレーム情報符号化工程では、
前記第1のブロックの単位で含まれる前記1つ又は複数の第2のブロックに対する参照フレームの選択状況の組み合わせ情報として符号化する、
ことを特徴とする請求項17記載の符号化方法。 - 前記参照フレーム情報符号化工程では、
近傍に位置する前記第1もしくは1つ又は複数の前記第2のブロックにおける参照フレームの選択状況から、1つ又は複数の第2のブロックに対する参照フレームの予測値をそれぞれ求め、
該予測値と選択された参照フレームとの差分情報を、参照フレームの選択状況に関する情報として用いる、
ことを特徴とする請求項17記載の符号化方法。 - 動き補償予測を用いて動画像の圧縮符号化を行う符号化方法であって、
動画像のフレームを分割した第1のブロックの各々についてさらに分割した1つ又は複数の第2のブロックからなる単位で、双方向インター予測に用いる予測方向を選択して動き補償予測を行う動き補償予測工程と、
前記1つ又は複数の第2のブロックに対する予測方向の選択状況に関する情報をビットストリームに多重して出力する予測情報符号化工程と、
を備えた符号化方法。 - 動き補償予測を用いて動画像の圧縮符号化を行う符号化方法であって、
動画像のフレームを分割した第1のブロックの各々についてさらに分割した1つ又は複数の第2のブロックからなる単位で、インター予測モードもしくはイントラ予測モードを選択してインター予測もしくはイントラ予測を行う予測工程と、
前記1つ又は複数の第2のブロックに対するインター予測モードもしくはイントラ予測モードの選択状況に関する情報をビットストリームに多重して出力する予測モード情報符号化工程と、
を備えた符号化方法。 - 前記予測情報符号化工程又は予測モード情報符号化工程では、
前記選択状況に関する情報を、前記第1のブロックの単位で含まれる前記第1のブロックに対する動きベクトルの割当状況に関する情報とともに組み合わせた情報として符号化してビットストリームへ多重し出力する、
ことを特徴とする請求項20又は21に記載の符号化方法。 - 前記予測情報符号化工程又は予測モード情報符号化工程では、
前記選択状況に関する情報を、前記1つ又は複数の第2のブロック単位で含まれる前記1つ又は複数の第2のブロックに対する複数参照フレームからの参照フレームの選択状況に関する情報とともに組み合わせた情報として符号化してビットストリームへ多重し出力する、
ことを特徴とする請求項20又は21に記載の符号化方法。 - 動き補償予測を用いて圧縮動画像データの伸長・復号を行う復号方法であって、
動画像のフレームを分割した第1のブロックの各々についてさらに分割した第2のブロックの単位で割り当てられた動きベクトルが、前記第1のブロックの単位で復号される1つ又は複数の動きベクトルのうちいずれに該当するか、を示す動きベクトル割当情報を復号する割当情報復号工程と、
該動きベクトル割当情報に基づいて前記第2のブロックの単位で特定された動きベクトルを用いて動き補償を行い予測画像を生成する動き補償工程と、
を備えたことを特徴とする復号方法。 - 前記割当情報復号工程では、
割り当て対象の第2のブロックの位置及び数に関わらず、当該第2のブロックの位置及び当該第2のブロックに割り当てられた動きベクトルについての情報として、前記動きベクトル割当情報を復号する、
ことを特徴とする請求項24記載の復号方法。 - 前記割当情報復号工程では、
1つ又は複数の第2のブロックをグループ化することにより予め定めた割当パターンの識別情報として、前記動きベクトル割当情報を復号する、
ことを特徴とする請求項24記載の復号方法。 - 前記割当情報復号工程では、
前記動きベクトル割当情報を、第1のブロック単位に予め定められた第2のブロックへの動きベクトル割当パターンを識別する情報として復号するものとし、該割当パターン識別情報から割当パターンを特定するに際して、該割当パターンが属するパターングループを識別する情報を復号し、該パターングループ識別情報によって特定されたパターングループの定義に従って前記割当パターン識別情報から第2のブロックへの動きベクトル割当を決定する、
ことを特徴とする請求項26記載の復号方法。 - 前記割当情報復号工程では、
復号対象となる第1のブロックについての動きベクトル割当パターンの形状に応じて定めた動きベクトルの予測値、による予測差分値を符号化することで得られた動きベクトル情報を復号する、
ことを特徴とする請求項26記載の復号方法。 - 前記割当情報復号工程では、
復号対象となる第1のブロックについての動きベクトル割当パターンの形状に応じて定めた動きベクトルの予測候補位置のうちのいずれかを、近傍に位置する第1のブロックについての割当パターンの形状に応じて予測値とし、当該予測値の予測差分値を符号化することで得られた動きベクトル情報を復号する、
ことを特徴とする請求項28記載の復号方法。 - 第1のブロックの単位で復号される動きベクトルは最大2本とされ、
前記動きベクトル割当情報は、
第1のブロック単位に定まる該第1のブロックに含まれる第2のブロックへの動きベクトルの割当状態を表す予め定められた複数の割当パターンを識別する情報として復号される、
ことを特徴とする請求項26〜29の何れか1項に記載の復号方法。 - 前記割当パターンは、
前記第1のブロックを水平方向又は垂直方向に不均一に分割するパターン、及び前記第1のブロックを斜め方向に分割するパターンを含むことを特徴とする請求項30記載の復号方法。 - 前記割当情報復号工程では、
各割当パターンの形状に基づいて各割当パターン毎に割り当てられた可変長の符号を、各割当パターンの識別情報として復号することを特徴とする請求項30記載の復号方法。 - 前記割当情報復号工程では、
復号対象となる第1のブロック近傍に位置する第1のブロックについての割当パターンの状況に基づいて各割当パターン毎に割り当てられた可変長の符号を、前記復号対象となる第1のブロックについての各割当パターンの識別情報として復号することを特徴とする請求項30記載の復号方法。 - 前記割当情報復号工程では、
映像内容に基づいて各割当パターン毎に割り当てられた可変長の符号を、各割当パターンの識別情報として復号することを特徴とする請求項30記載の復号方法。 - 前記第2のブロックのサイズと同一サイズのブロック単位での符号化処理により得られた動き補償予測の予測残差信号を復号する残差信号復号工程をさらに備えたことを特徴とする請求項25又は26に記載の復号方法。
- 前記割当情報復号工程では、
復号対象となる第1のブロックについての動きベクトル割当パターンの形状に基づき、1つ又は複数の第2のブロックから構成される動きベクトル割当領域内に復号すべき予測残差信号があるか否かを識別する情報を復号する、
ことを特徴とする請求項25又は26に記載の復号方法。 - 前記割当情報復号工程では、
前記動きベクトルの割当状況に関する情報として出力される、動きベクトル割当の変化点を表す情報を復号する、
ことを特徴とする請求項25に記載の復号方法。 - 前記動きベクトルは、
第1のブロック単位でインター予測モード又はイントラ予測モードが設定された場合に加え、第2のブロックの1つ又は複数からなる単位でインター予測モード又はイントラ予測モードが設定された場合も含めた動き補償予測により得られた動きベクトルである、
ことを特徴とする請求項25又は26に記載の復号方法。 - 動き補償予測を用いて圧縮動画像データの伸長・復号を行う復号方法であって、
動画像のフレームを分割した第1のブロックの各々についてさらに分割した第2のブロックの1つ又は複数からなる単位で割り当てられた、動き補償予測に用いる参照フレームの選択状況に関する情報を復号する参照フレーム情報復号工程と、
当該参照フレーム情報に基づいて、動き補償のために保持された複数の参照フレームの中から一の参照フレームを選択して動き補償を行い予測画像を生成する補償工程と、
を備えた復号方法。 - 前記参照フレーム情報復号工程では、
前記第1のブロックの単位で含まれる前記1つ又は複数の第2のブロックに対する参照フレームの選択状況の組み合わせ情報から、前記1つ又は複数の第2のブロックに対する参照フレーム情報を復号する、
ことを特徴とする請求項39記載の復号方法。 - 前記参照フレーム情報復号工程では、
近傍に位置する前記第1もしくは1つ又は複数の前記第2のブロックにおける参照フレームの選択状況から、1つ又は複数の第2のブロックに対する参照フレームの予測値をそれぞれ求め、
参照フレームの選択状況に関する情報として出力される参照フレームの差分情報と前記求めた予測値とに基づいて復号を行う、
ことを特徴とする請求項39記載の復号方法。 - 動き補償予測を用いて圧縮動画像データの伸長・復号を行う復号方法であって、
動画像のフレームを分割した第1のブロックの各々についてさらに分割した1つ又は複数の第2のブロックからなる単位で割り当てられた、双方向インター予測に用いる予測方向の選択状況に関する情報を復号する予測情報復号工程と、
当該予測情報に基づいて、双方向フレーム間動き補償に用いる予測方向を順方向と逆方向の双方について保持している参照フレームの中から選択して動き補償を行い予測画像を生成する動き補償工程と、
を備えた復号方法。 - 動き補償予測を用いて圧縮動画像データの伸長・復号を行う復号方法であって、
動画像のフレームを分割した第1のブロックの各々についてさらに分割した1つ又は複数の第2のブロックからなる単位で割り当てられたインター予測モードもしくはイントラ予測モードの選択状況に関する情報を復号する予測モード情報復号工程と、
当該予測情報に基づいて、インター予測モードもしくはイントラ予測モードを選択してインター予測もしくはイントラ予測を行い予測画像を生成する予測画像生成工程と、
を備えた復号方法。 - 前記予測情報復号工程又は予測モード情報復号工程では、
前記第1のブロックの単位で含まれる前記第1のブロックに対する動きベクトルの割り当て状況に関する情報と前記選択状況に関する情報とを組み合わせた情報から、前記1つ又は複数の第2のブロックに対する前記選択状況に関する情報を復号する、
ことを特徴とする請求項42又は43に記載の復号方法。 - 前記予測情報復号工程又は予測モード情報復号工程では、
前記1つ又は複数の第2のブロックからなる単位で含まれる前記1つ又は複数の第2のブロックからなる単位に対する複数参照フレームからの参照フレームの選択状況に関する情報と前記選択状況に関する情報とを組み合わせた情報から、前記1つ又は複数の第2のブロックからなる単位に対する前記選択状況に関する情報を復号する、
ことを特徴とする請求項42又は43に記載の復号方法。 - 動き補償予測を用いて動画像の圧縮符号化を行う符号化装置であって、
動画像のフレームを分割した第1のブロックの各々についてさらに分割した第2のブロックの単位で、1つ又は複数の動きベクトルを割り当てて動き補償予測を行う動き補償予測手段と、
前記第2のブロックに対する動きベクトルの割当状況に関する情報をビットストリームに多重して出力する割当情報符号化手段と、
を備えたことを特徴とする符号化装置。 - 前記動き補償予測手段は、
第1のブロック内での第2のブロックの位置及び数に関わらず第2のブロックの単位で動きベクトルを割り当てて動き補償予測を行い、
前記割当情報符号化手段は、
第2のブロックの位置及び当該第2のブロックに割り当てられた動きベクトルについての情報を、動きベクトルの割当状況に関する情報として用いる、
ことを特徴とする請求項46記載の符号化装置。 - 前記動き補償予測手段は、
1つ又は複数の第2のブロックをグループ化することにより予め定めた割当パターンに従って第2のブロックの単位で動きベクトルを割り当てて動き補償予測を行い、
前記割当情報符号化手段は、
前記割当パターンの識別情報を、動きベクトルの割当状況に関する情報として用いる、
ことを特徴とする請求項46記載の符号化装置。 - 動き補償予測を用いて圧縮動画像データの伸長・復号を行う復号装置であって、
動画像のフレームを分割した第1のブロックの各々についてさらに分割した第2のブロックの単位で割り当てられた動きベクトルが、前記第1のブロックの単位で復号される1つ又は複数の動きベクトルのうちいずれに該当するか、を示す動きベクトル割当情報を復号する割当情報復号手段と、
該動きベクトル割当情報に基づいて前記第2のブロックの単位で特定された動きベクトルを用いて動き補償を行い予測画像を生成する動き補償手段と、
を備えたことを特徴とする復号装置。 - 前記割当情報復号手段は、
割り当て対象の第2のブロックの位置及び当該第2のブロックに割り当てられた動きベクトルについての情報として、前記動きベクトル割当情報を復号する、
ことを特徴とする請求項49記載の復号装置。 - 前記割当情報復号手段は、
1つ又は複数の第2のブロックをグループ化することにより予め定めた割当パターンの識別情報として、前記動きベクトル割当情報を復号する、
ことを特徴とする請求項49記載の復号装置。 - 動き補償予測を用いて動画像の圧縮符号化を行う符号化装置と、動き補償予測を用いて圧縮動画像データの伸長・復号を行う復号装置とを含んで構成された画像処理システムであって、
前記符号化装置は、
動画像のフレームを分割した第1のブロックの各々についてさらに分割した第2のブロックの単位で、1つ又は複数の動きベクトルを割り当てて動き補償予測を行う動き補償予測手段と、
前記第2のブロックに対する動きベクトルの割当状況に関する情報をビットストリームに多重して出力する割当情報符号化手段と、
を備え、
前記復号装置は、
動画像のフレームを分割した第1のブロックの各々についてさらに分割した第2のブロックの単位で割り当てられた動きベクトルが、前記第1のブロックの単位で復号される1つ又は複数の動きベクトルのうちいずれに該当するか、を示す動きベクトル割当情報を復号する割当情報復号手段と、
該動きベクトル割当情報に基づいて前記第2のブロックの単位で特定された動きベクトルを用いて動き補償を行い予測画像を生成する動き補償手段と、
を備えたことを特徴とする画像処理システム。 - 前記符号化装置における動き補償予測手段は、第1のブロック内での第2のブロックの位置及び数に関わらず第2のブロックの単位で動きベクトルを割り当てて動き補償予測を行い、
前記割当情報符号化手段は、第2のブロックの位置及び当該第2のブロックに割り当てられた動きベクトルについての情報を、動きベクトルの割当状況に関する情報として用いることを特徴とし、
前記復号装置における割当情報復号手段は、割り当て対象の第2のブロックの位置及び当該第2のブロックに割り当てられた動きベクトルについての情報として、前記動きベクトル割当情報を復号することを特徴とする請求項52記載の画像処理システム。 - 前記符号化装置における動き補償予測手段は、1つ又は複数の第2のブロックをグループ化することにより予め定めた割当パターンに従って第2のブロックの単位で動きベクトルを割り当てて動き補償予測を行い、
前記割当情報符号化手段は、前記割当パターンの識別情報を、動きベクトルの割当状況に関する情報として用いることを特徴とし、
前記復号装置における割当情報復号手段は、1つ又は複数の第2のブロックをグループ化することにより予め定めた割当パターンの識別情報として、前記動きベクトル割当情報を復号することを特徴とする請求項52記載の画像処理システム。 - 動き補償予測を用いて動画像の圧縮符号化を行う符号化装置に内蔵されたコンピュータに、請求項1〜23の何れか1つに記載した符号化方法の各工程を実行させるための符号化プログラム。
- 動き補償予測を用いて圧縮動画像データの伸長・復号を行う復号装置に内蔵されたコンピュータに、請求項24〜45の何れか1つに記載した復号方法の各工程を実行させるための復号プログラム。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001279266 | 2001-09-14 | ||
JP2001279266 | 2001-09-14 | ||
JP2001343540 | 2001-11-08 | ||
JP2001343540 | 2001-11-08 | ||
JP2002002944 | 2002-01-10 | ||
JP2002002944 | 2002-01-10 | ||
PCT/JP2002/009368 WO2003026315A1 (en) | 2001-09-14 | 2002-09-12 | Coding method, decoding method, coding apparatus, decoding apparatus, image processing system, coding program, and decoding program |
Publications (1)
Publication Number | Publication Date |
---|---|
JPWO2003026315A1 true JPWO2003026315A1 (ja) | 2005-01-06 |
Family
ID=27347500
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003529779A Pending JPWO2003026315A1 (ja) | 2001-09-14 | 2002-09-12 | 符号化方法、復号方法、符号化装置、復号装置、画像処理システム、符号化プログラム及び復号プログラム |
Country Status (6)
Country | Link |
---|---|
US (1) | US7643559B2 (ja) |
EP (6) | EP2099228B1 (ja) |
JP (1) | JPWO2003026315A1 (ja) |
KR (1) | KR100642043B1 (ja) |
CN (2) | CN102025991B (ja) |
WO (1) | WO2003026315A1 (ja) |
Families Citing this family (177)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1998042134A1 (en) * | 1997-03-17 | 1998-09-24 | Mitsubishi Denki Kabushiki Kaisha | Image encoder, image decoder, image encoding method, image decoding method and image encoding/decoding system |
KR100642043B1 (ko) * | 2001-09-14 | 2006-11-03 | 가부시키가이샤 엔티티 도코모 | 부호화 방법, 복호 방법, 부호화 장치, 복호 장치, 화상 처리 시스템, 및 저장 매체 |
EP1445956A4 (en) * | 2001-11-16 | 2009-09-02 | Ntt Docomo Inc | IMAGE ENCODING METHOD, IMAGE DECODING METHOD, ENCODER AND IMAGE DECODER, PROGRAM, COMPUTER DATA SIGNAL, AND IMAGE TRANSMISSION SYSTEM |
WO2003053066A1 (en) | 2001-12-17 | 2003-06-26 | Microsoft Corporation | Skip macroblock coding |
CN100553339C (zh) | 2002-07-15 | 2009-10-21 | 株式会社日立制作所 | 动态图像解码方法 |
JP4724351B2 (ja) * | 2002-07-15 | 2011-07-13 | 三菱電機株式会社 | 画像符号化装置、画像符号化方法、画像復号装置、画像復号方法、および通信装置 |
KR100563781B1 (ko) * | 2002-09-24 | 2006-03-27 | 가부시키가이샤 히다치 고쿠사이 덴키 | 주목해야 할 화상의 표시방법과 장치 및 원격화상감시시스템 |
CN1232126C (zh) | 2002-09-30 | 2005-12-14 | 三星电子株式会社 | 图像编码方法和装置以及图像解码方法和装置 |
US20040081238A1 (en) * | 2002-10-25 | 2004-04-29 | Manindra Parhy | Asymmetric block shape modes for motion estimation |
MXPA05006718A (es) | 2003-02-21 | 2005-09-08 | Matsushita Electric Ind Co Ltd | Metodo de codificacion de imagenes y metodo de decodificacion de imagenes. |
US7471725B2 (en) * | 2003-03-26 | 2008-12-30 | Lsi Corporation | Segmented motion estimation with no search for small block sizes |
US20060251168A1 (en) * | 2003-04-04 | 2006-11-09 | Koninklijke Philips Electronics N.V. | Video encoding and decoding methods and corresponding devices |
CN100542286C (zh) * | 2003-05-06 | 2009-09-16 | Nxp股份有限公司 | 视频编解码方法和相应的编解码设备 |
US8824553B2 (en) | 2003-05-12 | 2014-09-02 | Google Inc. | Video compression method |
KR100508975B1 (ko) * | 2003-05-20 | 2005-08-17 | 주식회사 팬택 | 다층 레벨 연속 제거 알고리즘을 이용한 동영상 움직임추정 방법 |
US7978769B2 (en) * | 2003-06-30 | 2011-07-12 | Ntt Docomo, Inc. | Method and apparatus for coding motion information |
CN101616330B (zh) * | 2003-07-16 | 2012-07-04 | 三星电子株式会社 | 用于色彩图像的视频编码/解码装置和方法 |
US20050013498A1 (en) | 2003-07-18 | 2005-01-20 | Microsoft Corporation | Coding of motion vector information |
WO2005020588A1 (en) * | 2003-08-25 | 2005-03-03 | Agency For Science, Technology And Research | Mode decision for inter prediction in video coding |
US7599438B2 (en) * | 2003-09-07 | 2009-10-06 | Microsoft Corporation | Motion vector block pattern coding and decoding |
US7860326B2 (en) * | 2003-09-22 | 2010-12-28 | Kddi Corporation | Adaptable shape image encoding apparatus and decoding apparatus |
KR100846780B1 (ko) | 2003-11-10 | 2008-07-16 | 삼성전자주식회사 | 움직임 벡터 추정 방법 및 장치 |
KR100987775B1 (ko) * | 2004-01-20 | 2010-10-13 | 삼성전자주식회사 | 영상의 3차원 부호화 방법 |
KR101196429B1 (ko) * | 2004-03-12 | 2012-11-01 | 삼성전자주식회사 | 동영상 트랜스코딩 방법 및 그 장치, 이에 사용되는움직임 벡터 보간방법 |
JP4419062B2 (ja) | 2004-03-29 | 2010-02-24 | ソニー株式会社 | 画像処理装置および方法、記録媒体、並びにプログラム |
JP4421940B2 (ja) * | 2004-05-13 | 2010-02-24 | 株式会社エヌ・ティ・ティ・ドコモ | 動画像符号化装置および方法、並びに動画像復号化装置および方法 |
FR2872989A1 (fr) * | 2004-07-06 | 2006-01-13 | Thomson Licensing Sa | Procede et dispositif pour choisir un vecteur mouvement pour le codage d'un ensemble de blocs |
FR2872975A1 (fr) * | 2004-07-06 | 2006-01-13 | Thomson Licensing Sa | Procede et dispositif pour choisir un mode de codage |
FR2872974A1 (fr) * | 2004-07-06 | 2006-01-13 | Thomson Licensing Sa | Procede ou dispositif de codage adaptatif |
DE102004038110B3 (de) * | 2004-08-05 | 2005-12-29 | Siemens Ag | Verfahren zum Codieren und Decodieren, sowie Codier- und Decodiervorrichtung zur Videocodierung |
JP4284265B2 (ja) * | 2004-11-02 | 2009-06-24 | 株式会社東芝 | 動画像符号化装置、動画像符号化方法、動画像復号化装置および動画像復号化方法 |
JP4495580B2 (ja) * | 2004-12-13 | 2010-07-07 | パナソニック株式会社 | 面内予測装置および面内予測方法 |
JP4501675B2 (ja) * | 2004-12-22 | 2010-07-14 | 日本電気株式会社 | 動画像圧縮符号化方法と動画像圧縮符号化装置並びにプログラム |
US7970219B2 (en) * | 2004-12-30 | 2011-06-28 | Samsung Electronics Co., Ltd. | Color image encoding and decoding method and apparatus using a correlation between chrominance components |
FR2881898A1 (fr) * | 2005-02-10 | 2006-08-11 | Thomson Licensing Sa | Procede et dispositif de codage d'une image video en mode inter ou intra |
JP4064973B2 (ja) * | 2005-03-23 | 2008-03-19 | 株式会社東芝 | ビデオエンコーダ及びこれを用いた携帯無線端末装置 |
US8929464B2 (en) * | 2005-03-25 | 2015-01-06 | Sharp Laboratories Of America, Inc. | Video entropy decoding with graceful degradation |
US8588304B2 (en) | 2005-03-31 | 2013-11-19 | Panasonic Corporation | Video decoding device, video decoding method, video decoding program, and video decoding integrated circuit |
US8774272B1 (en) * | 2005-07-15 | 2014-07-08 | Geo Semiconductor Inc. | Video quality by controlling inter frame encoding according to frame position in GOP |
US20080130989A1 (en) * | 2005-07-22 | 2008-06-05 | Mitsubishi Electric Corporation | Image encoder and image decoder, image encoding method and image decoding method, image encoding program and image decoding program, and computer readable recording medium recorded with image encoding program and computer readable recording medium recorded with image decoding program |
US9077960B2 (en) | 2005-08-12 | 2015-07-07 | Microsoft Corporation | Non-zero coefficient block pattern coding |
KR100727969B1 (ko) * | 2005-08-27 | 2007-06-14 | 삼성전자주식회사 | 영상의 부호화 및 복호화 장치와, 그 방법, 및 이를수행하기 위한 프로그램이 기록된 기록 매체 |
KR100727970B1 (ko) * | 2005-08-30 | 2007-06-13 | 삼성전자주식회사 | 영상의 부호화 및 복호화 장치와, 그 방법, 및 이를수행하기 위한 프로그램이 기록된 기록 매체 |
KR100750128B1 (ko) * | 2005-09-06 | 2007-08-21 | 삼성전자주식회사 | 영상의 인트라 예측 부호화, 복호화 방법 및 장치 |
KR100727972B1 (ko) * | 2005-09-06 | 2007-06-14 | 삼성전자주식회사 | 영상의 인트라 예측 부호화, 복호화 방법 및 장치 |
KR100738075B1 (ko) * | 2005-09-09 | 2007-07-12 | 삼성전자주식회사 | 영상 부호화/복호화 장치 및 방법 |
JP4534935B2 (ja) * | 2005-10-04 | 2010-09-01 | 株式会社日立製作所 | トランスコーダ、記録装置及びトランスコード方法 |
US8428136B2 (en) * | 2006-03-09 | 2013-04-23 | Nec Corporation | Dynamic image encoding method and device and program using the same |
WO2007132647A1 (ja) * | 2006-05-12 | 2007-11-22 | Panasonic Corporation | 動画像復号化装置 |
JP4752631B2 (ja) * | 2006-06-08 | 2011-08-17 | 株式会社日立製作所 | 画像符号化装置、及び画像符号化方法 |
KR101380580B1 (ko) * | 2006-08-02 | 2014-04-02 | 톰슨 라이센싱 | 비디오 인코딩을 위한 적응형 기하학적 파티셔닝 방법 및 장치 |
JP4902854B2 (ja) * | 2006-09-12 | 2012-03-21 | パナソニック株式会社 | 動画像復号化装置、動画像復号化方法、動画像復号化プログラム、動画像符号化装置、動画像符号化方法、動画像符号化プログラム、及び動画像符号化復号化装置 |
GB2443667A (en) * | 2006-11-10 | 2008-05-14 | Tandberg Television Asa | Obtaining a motion vector for a partition of a macroblock in block-based motion estimation |
KR101365570B1 (ko) | 2007-01-18 | 2014-02-21 | 삼성전자주식회사 | 인트라 예측 부호화, 복호화 방법 및 장치 |
JP4635016B2 (ja) * | 2007-02-16 | 2011-02-16 | 株式会社東芝 | 情報処理装置およびインター予測モード判定方法 |
KR101366093B1 (ko) * | 2007-03-28 | 2014-02-21 | 삼성전자주식회사 | 영상의 부호화, 복호화 방법 및 장치 |
KR101086434B1 (ko) * | 2007-03-28 | 2011-11-25 | 삼성전자주식회사 | 비디오 데이터 디스플레이 방법 및 장치 |
JP5082548B2 (ja) * | 2007-03-30 | 2012-11-28 | 富士通株式会社 | 画像処理方法、符号化器および復号化器 |
BRPI0809512A2 (pt) * | 2007-04-12 | 2016-03-15 | Thomson Licensing | método e aparelho para mesclagem dependente de contexto para modos salto-direto para codificação e decodificação de vídeo |
US9288504B2 (en) * | 2007-04-12 | 2016-03-15 | Thomson Licensing | Method and apparatus for fast geometric mode desicion in a video encoder |
JP4823150B2 (ja) * | 2007-05-31 | 2011-11-24 | キヤノン株式会社 | 符号化装置並びに符号化方法 |
US20090003443A1 (en) * | 2007-06-26 | 2009-01-01 | Nokia Corporation | Priority-based template matching intra prediction video and image coding |
JP4922101B2 (ja) * | 2007-08-21 | 2012-04-25 | 株式会社東芝 | 情報処理装置およびインター予測モード判定方法 |
JP5437807B2 (ja) * | 2007-09-18 | 2014-03-12 | 富士通株式会社 | 動画像符号化装置および動画像復号装置 |
EP2208350A2 (en) * | 2007-10-12 | 2010-07-21 | Thomson Licensing | Methods and apparatus for video encoding and decoding geometrically partitioned bi-predictive mode partitions |
KR101375664B1 (ko) | 2007-10-29 | 2014-03-20 | 삼성전자주식회사 | 영상의 디퓨전 특성을 이용한 영상 부호화/복호화 방법 및장치 |
KR101505195B1 (ko) * | 2008-02-20 | 2015-03-24 | 삼성전자주식회사 | 직접 모드 부호화 및 복호화 방법 |
EP2266318B1 (en) * | 2008-03-19 | 2020-04-22 | Nokia Technologies Oy | Combined motion vector and reference index prediction for video coding |
US20090245371A1 (en) * | 2008-03-28 | 2009-10-01 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding/decoding information about intra-prediction mode of video |
CN102067602B (zh) * | 2008-04-15 | 2014-10-29 | 法国电信公司 | 通过预先确定基准像素族而进行的图像预测、使用这样的预测的编码和解码 |
US8379995B2 (en) * | 2008-05-15 | 2013-02-19 | Motorola Mobility Llc | In-picture prediction for video coding |
KR100949917B1 (ko) * | 2008-05-28 | 2010-03-30 | 한국산업기술대학교산학협력단 | 적응적 인트라 예측을 통한 고속 부호화 방법 및 시스템 |
US8761253B2 (en) * | 2008-05-28 | 2014-06-24 | Nvidia Corporation | Intra prediction mode search scheme |
KR20100018810A (ko) * | 2008-08-07 | 2010-02-18 | 전자부품연구원 | 초고화질 영상 부호화, 복호화 방법 및 장치 및 컴퓨터로판독가능한 기록매체 |
US8325796B2 (en) | 2008-09-11 | 2012-12-04 | Google Inc. | System and method for video coding using adaptive segmentation |
US8385404B2 (en) | 2008-09-11 | 2013-02-26 | Google Inc. | System and method for video encoding using constructed reference frame |
US8326075B2 (en) | 2008-09-11 | 2012-12-04 | Google Inc. | System and method for video encoding using adaptive loop filter |
US8867854B2 (en) * | 2008-10-01 | 2014-10-21 | Electronics And Telecommunications Research Institute | Image encoder and decoder using undirectional prediction |
JP5401071B2 (ja) * | 2008-10-09 | 2014-01-29 | 株式会社Nttドコモ | 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、動画像符号化プログラム、動画像復号プログラム、動画像処理システムおよび動画像処理方法 |
US8831099B2 (en) * | 2008-12-17 | 2014-09-09 | Nvidia Corporation | Selecting a macroblock encoding mode by using raw data to compute intra cost |
US9432674B2 (en) * | 2009-02-02 | 2016-08-30 | Nvidia Corporation | Dual stage intra-prediction video encoding system and method |
KR101690291B1 (ko) | 2009-02-05 | 2016-12-27 | 톰슨 라이센싱 | 적응형 모드 비디오 인코딩 및 디코딩 방법 및 장치 |
KR20100095992A (ko) | 2009-02-23 | 2010-09-01 | 한국과학기술원 | 비디오 부호화에서의 분할 블록 부호화 방법, 비디오 복호화에서의 분할 블록 복호화 방법 및 이를 구현하는 기록매체 |
ES2935961T3 (es) * | 2009-03-23 | 2023-03-13 | Ntt Docomo Inc | Procedimiento de descodificación predictiva de imágenes |
US8363722B2 (en) * | 2009-03-31 | 2013-01-29 | Sony Corporation | Method and apparatus for hierarchical bi-directional intra-prediction in a video encoder |
JP5199955B2 (ja) * | 2009-06-16 | 2013-05-15 | キヤノン株式会社 | 画像復号装置及びその制御方法 |
JP5199956B2 (ja) * | 2009-06-16 | 2013-05-15 | キヤノン株式会社 | 画像復号装置及びその制御方法 |
ES2744316T3 (es) * | 2009-07-01 | 2020-02-24 | Interdigital Vc Holdings Inc | Métodos y aparato para señalización de predicción intra para grandes bloques para codificadores y decodificadores de vídeo |
RU2520425C2 (ru) * | 2009-07-03 | 2014-06-27 | Франс Телеком | Предсказание вектора движения текущего раздела изображения, указывающего на опорную зону, которая перекрывает несколько разделов опорного изображения, кодирование и декодирование с использованием такого предсказания |
EP3678374A1 (fr) * | 2009-07-03 | 2020-07-08 | Orange | Prédiction d'un vecteur mouvement d'une partition d'image courante de forme géometrique ou de taille différente de celle d'au moins une partition d'image de référence voisine, codage et decodage utilisant une telle prediction |
JP5416277B2 (ja) * | 2009-07-10 | 2014-02-12 | サムスン エレクトロニクス カンパニー リミテッド | 階層的映像符号化における空間予測方法及び装置 |
JP2010009624A (ja) * | 2009-10-07 | 2010-01-14 | Ntt Docomo Inc | 画像信号変換方法、画像信号逆変換方法、画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、画像符号化プログラム、及び、画像復号プログラム |
MY189368A (en) * | 2009-10-20 | 2022-02-08 | Sharp Kk | Moving image decoding device, moving image decoding method, moving image coding device, and moving image coding method |
KR101484280B1 (ko) | 2009-12-08 | 2015-01-20 | 삼성전자주식회사 | 임의적인 파티션을 이용한 움직임 예측에 따른 비디오 부호화 방법 및 장치, 임의적인 파티션을 이용한 움직임 보상에 따른 비디오 복호화 방법 및 장치 |
WO2011075071A1 (en) * | 2009-12-17 | 2011-06-23 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and arrangement for video coding |
KR101768207B1 (ko) * | 2010-01-19 | 2017-08-16 | 삼성전자주식회사 | 축소된 예측 움직임 벡터의 후보들에 기초해 움직임 벡터를 부호화, 복호화하는 방법 및 장치 |
JP5583439B2 (ja) * | 2010-03-17 | 2014-09-03 | パナソニック株式会社 | 画像符号化装置及びカメラシステム |
KR101633153B1 (ko) * | 2010-04-01 | 2016-06-23 | 소니 주식회사 | 화상 처리 장치 및 방법 |
KR20140017018A (ko) | 2010-04-07 | 2014-02-10 | 가부시키가이샤 제이브이씨 켄우드 | 동화상 부호화 장치, 동화상 부호화 방법 및 동화상 부호화 프로그램, 및 동화상 복호 장치, 동화상 복호 방법 및 동화상 복호 프로그램 |
CN102215396A (zh) | 2010-04-09 | 2011-10-12 | 华为技术有限公司 | 一种视频编解码方法和系统 |
CN106454371B (zh) | 2010-04-13 | 2020-03-20 | Ge视频压缩有限责任公司 | 解码器、数组重建方法、编码器、编码方法及存储介质 |
ES2549734T3 (es) | 2010-04-13 | 2015-11-02 | Ge Video Compression, Llc | Codificación de vídeo que usa subdivisiones multi-árbol de imágenes |
KR101584480B1 (ko) | 2010-04-13 | 2016-01-14 | 지이 비디오 컴프레션, 엘엘씨 | 평면 간 예측 |
KR102166520B1 (ko) | 2010-04-13 | 2020-10-16 | 지이 비디오 컴프레션, 엘엘씨 | 샘플 영역 병합 |
EP2560369A1 (en) * | 2010-04-15 | 2013-02-20 | Konica Minolta Holdings, Inc. | Image processing system, image processing method, and program |
KR101379188B1 (ko) | 2010-05-17 | 2014-04-18 | 에스케이 텔레콤주식회사 | 인트라 블록 및 인터 블록이 혼합된 코딩블록을 이용하는 영상 부호화/복호화 장치 및 그 방법 |
JP2012023597A (ja) * | 2010-07-15 | 2012-02-02 | Sony Corp | 画像処理装置及び画像処理方法 |
ES2820437T3 (es) | 2010-07-20 | 2021-04-21 | Ntt Docomo Inc | Método de codificación predictiva de imágenes, dispositivo de decodificación predictiva de imágenes, método de decodificación predictiva de imágenes y programa de decodificación predictiva de imágenes |
KR20120014676A (ko) * | 2010-08-10 | 2012-02-20 | 에스케이 텔레콤주식회사 | 적응적 부호화/복호화 모드 인덱싱 기법을 이용한 영상 부호화/복호화 장치 및 방법 |
KR20120016991A (ko) * | 2010-08-17 | 2012-02-27 | 오수미 | 인터 프리딕션 방법 |
EP2421266A1 (en) * | 2010-08-19 | 2012-02-22 | Thomson Licensing | Method for reconstructing a current block of an image and corresponding encoding method, corresponding devices as well as storage medium carrying an images encoded in a bit stream |
US9202289B2 (en) * | 2010-09-30 | 2015-12-01 | Electronics And Telecommunications Research Institute | Method for coding and decoding target block partition information using information about neighboring blocks |
EP2606648A1 (en) | 2010-10-05 | 2013-06-26 | General instrument Corporation | Coding and decoding utilizing adaptive context model selection with zigzag scan |
US9300961B2 (en) * | 2010-11-24 | 2016-03-29 | Panasonic Intellectual Property Corporation Of America | Motion vector calculation method, picture coding method, picture decoding method, motion vector calculation apparatus, and picture coding and decoding apparatus |
JP2012124591A (ja) * | 2010-12-06 | 2012-06-28 | Sony Corp | 画像符号化装置と動きベクトル符号化方法、画像復号化装置と動きベクトル復号化方法、およびプログラム |
US9288491B2 (en) | 2010-12-13 | 2016-03-15 | Electronics And Telecommunications Research Institute | Method and device for determining reference unit |
JPWO2012086829A1 (ja) * | 2010-12-21 | 2014-06-05 | 日本電気株式会社 | 動き推定装置、動き推定方法、動き推定プログラム、および動画像符号化装置 |
AU2011354441B2 (en) * | 2011-01-07 | 2014-07-17 | Hfi Innovation Inc. | Method and apparatus of improved intra luma prediction mode coding |
US8755437B2 (en) | 2011-03-17 | 2014-06-17 | Mediatek Inc. | Method and apparatus for derivation of spatial motion vector candidate and motion vector prediction candidate |
CN102611884B (zh) | 2011-01-19 | 2014-07-09 | 华为技术有限公司 | 图像编解码方法及编解码设备 |
US9008181B2 (en) * | 2011-01-24 | 2015-04-14 | Qualcomm Incorporated | Single reference picture list utilization for interprediction video coding |
US20130329797A1 (en) * | 2011-02-25 | 2013-12-12 | Panasonic Corporation | Image coding method and image decoding method |
US20140003521A1 (en) * | 2011-03-11 | 2014-01-02 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding images and method and apparatus for decoding |
WO2012122927A1 (en) | 2011-03-14 | 2012-09-20 | Mediatek Inc. | Method and apparatus for derivation of motion vector candidate and motion vector prediction candidate |
US8938001B1 (en) | 2011-04-05 | 2015-01-20 | Google Inc. | Apparatus and method for coding using combinations |
US8780971B1 (en) | 2011-04-07 | 2014-07-15 | Google, Inc. | System and method of encoding using selectable loop filters |
US8780996B2 (en) | 2011-04-07 | 2014-07-15 | Google, Inc. | System and method for encoding and decoding video data |
US8781004B1 (en) | 2011-04-07 | 2014-07-15 | Google Inc. | System and method for encoding video using variable loop filter |
US9154799B2 (en) | 2011-04-07 | 2015-10-06 | Google Inc. | Encoding and decoding motion via image segmentation |
US8638854B1 (en) | 2011-04-07 | 2014-01-28 | Google Inc. | Apparatus and method for creating an alternate reference frame for video compression using maximal differences |
US8718389B2 (en) | 2011-04-13 | 2014-05-06 | Huawei Technologies Co., Ltd. | Image encoding and decoding methods and related devices |
US8891616B1 (en) | 2011-07-27 | 2014-11-18 | Google Inc. | Method and apparatus for entropy encoding based on encoding cost |
KR101256893B1 (ko) * | 2011-08-05 | 2013-04-23 | 고려대학교 산학협력단 | 데이터 부호화/복호화 장치 및 방법 |
CN102970526B (zh) | 2011-08-31 | 2016-12-14 | 华为技术有限公司 | 一种获得变换块尺寸的方法和模块 |
US8885706B2 (en) | 2011-09-16 | 2014-11-11 | Google Inc. | Apparatus and methodology for a video codec system with noise reduction capability |
US9237356B2 (en) | 2011-09-23 | 2016-01-12 | Qualcomm Incorporated | Reference picture list construction for video coding |
KR102050761B1 (ko) | 2011-10-05 | 2019-12-02 | 선 페이턴트 트러스트 | 화상 복호 방법 및 화상 복호 장치 |
US9247257B1 (en) | 2011-11-30 | 2016-01-26 | Google Inc. | Segmentation based entropy encoding and decoding |
US10805617B2 (en) * | 2012-01-19 | 2020-10-13 | Texas Instruments Incorporated | Scalable prediction type coding |
ES2728146T3 (es) | 2012-01-20 | 2019-10-22 | Sun Patent Trust | Procedimientos y aparato de codificación y decodificación de vídeo utilizando predicción temporal de vector de movimiento |
WO2013114860A1 (ja) | 2012-02-03 | 2013-08-08 | パナソニック株式会社 | 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置及び画像符号化復号装置 |
US9262670B2 (en) | 2012-02-10 | 2016-02-16 | Google Inc. | Adaptive region of interest |
US9131073B1 (en) | 2012-03-02 | 2015-09-08 | Google Inc. | Motion estimation aided noise reduction |
WO2013132792A1 (ja) | 2012-03-06 | 2013-09-12 | パナソニック株式会社 | 動画像符号化方法、動画像復号方法、動画像符号化装置、動画像復号装置、及び動画像符号化復号装置 |
US11039138B1 (en) | 2012-03-08 | 2021-06-15 | Google Llc | Adaptive coding of prediction modes using probability distributions |
RU2607998C9 (ru) * | 2012-03-28 | 2017-07-07 | ДжейВиСи КЕНВУД КОРПОРЕЙШН | Устройство кодирования изображения, способ кодирования изображения и программа кодирования изображения, а также устройство декодирования изображения, способ декодирования изображения и программа декодирования изображения |
US9609341B1 (en) | 2012-04-23 | 2017-03-28 | Google Inc. | Video data encoding and decoding using reference picture lists |
WO2013162980A2 (en) | 2012-04-23 | 2013-10-31 | Google Inc. | Managing multi-reference picture buffers for video data coding |
US9014266B1 (en) | 2012-06-05 | 2015-04-21 | Google Inc. | Decimated sliding windows for multi-reference prediction in video coding |
US8819525B1 (en) | 2012-06-14 | 2014-08-26 | Google Inc. | Error concealment guided robustness |
JP6019797B2 (ja) * | 2012-06-22 | 2016-11-02 | 富士通株式会社 | 動画像符号化装置、動画像符号化方法、及びプログラム |
US9774856B1 (en) | 2012-07-02 | 2017-09-26 | Google Inc. | Adaptive stochastic entropy coding |
US9344729B1 (en) | 2012-07-11 | 2016-05-17 | Google Inc. | Selective prediction signal filtering |
US9509998B1 (en) | 2013-04-04 | 2016-11-29 | Google Inc. | Conditional predictive multi-symbol run-length coding |
CN104104961B (zh) * | 2013-04-10 | 2018-09-21 | 华为技术有限公司 | 一种视频编码方法、解码方法和装置 |
KR20160002679A (ko) * | 2013-05-01 | 2016-01-08 | 엘지전자 주식회사 | 신호 송수신 장치 및 신호 송수신 방법 |
US9756331B1 (en) | 2013-06-17 | 2017-09-05 | Google Inc. | Advance coded reference prediction |
CN103491380A (zh) * | 2013-07-29 | 2014-01-01 | 朱洪波 | 高灵活变尺寸块帧内预测编码 |
US9392288B2 (en) | 2013-10-17 | 2016-07-12 | Google Inc. | Video coding using scatter-based scan tables |
US9179151B2 (en) | 2013-10-18 | 2015-11-03 | Google Inc. | Spatial proximity context entropy coding |
US20150189269A1 (en) * | 2013-12-30 | 2015-07-02 | Google Inc. | Recursive block partitioning |
US10631005B2 (en) * | 2014-04-21 | 2020-04-21 | Qualcomm Incorporated | System and method for coding in block prediction mode for display stream compression (DSC) |
US9392272B1 (en) | 2014-06-02 | 2016-07-12 | Google Inc. | Video coding using adaptive source variance based partitioning |
US9578324B1 (en) | 2014-06-27 | 2017-02-21 | Google Inc. | Video coding using statistical-based spatially differentiated partitioning |
US10102613B2 (en) | 2014-09-25 | 2018-10-16 | Google Llc | Frequency-domain denoising |
JP6086619B2 (ja) * | 2015-03-27 | 2017-03-01 | 株式会社日立国際電気 | 符号化装置および符号化方法 |
JP2017103744A (ja) * | 2015-12-04 | 2017-06-08 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 画像復号方法、画像符号化方法、画像復号装置、画像符号化装置、及び画像符号化復号装置 |
US10404989B2 (en) * | 2016-04-26 | 2019-09-03 | Google Llc | Hybrid prediction modes for video coding |
KR102670040B1 (ko) * | 2017-01-16 | 2024-05-28 | 세종대학교산학협력단 | 영상 신호 부호화/복호화 방법 및 장치 |
CN116866553A (zh) * | 2017-01-16 | 2023-10-10 | 世宗大学校产学协力团 | 影像解码/编码方法以及传送比特流的方法 |
EP3637766B1 (en) * | 2017-07-06 | 2021-09-01 | Samsung Electronics Co., Ltd. | Image encoding method, and image decoding method and apparatus |
US11178406B2 (en) | 2017-09-29 | 2021-11-16 | Nikon Corporation | Video compression apparatus, electronic apparatus, and video compression program |
US10681374B2 (en) | 2017-11-16 | 2020-06-09 | Google Llc | Diversified motion using multiple global motion models |
WO2020218582A1 (ja) * | 2019-04-26 | 2020-10-29 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 符号化装置、復号装置、符号化方法、および復号方法 |
CN110213588B (zh) * | 2019-06-25 | 2021-07-13 | 浙江大华技术股份有限公司 | 空域候选运动信息获取方法、装置、编解码器及存储装置 |
US11475601B2 (en) * | 2019-10-21 | 2022-10-18 | Google Llc | Image decoding during bitstream interruptions |
CN113313774A (zh) * | 2020-02-26 | 2021-08-27 | 华为技术有限公司 | 图像处理方法、装置、电子设备及存储介质 |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU6099594A (en) * | 1993-02-03 | 1994-08-29 | Qualcomm Incorporated | Interframe video encoding and decoding system |
EP0614317A3 (en) * | 1993-03-05 | 1995-01-25 | Sony Corp | Decoding video signals. |
KR970002967B1 (ko) * | 1993-04-09 | 1997-03-13 | 대우전자 주식회사 | 영역 분류패턴을 이용한 움직임벡터 검출장치 |
KR0156958B1 (ko) | 1994-10-13 | 1998-11-16 | 조백제 | 2차원 영상의 웨이브렛 변환 영역에서 가변 블럭 크기를 갖는 움직임 추정 장치 |
US5751377A (en) | 1994-11-04 | 1998-05-12 | Matsushita Electric Industrial Co., Ltd. | Picture coding apparatus and decoding apparatus |
DE69619002T2 (de) * | 1995-03-10 | 2002-11-21 | Kabushiki Kaisha Toshiba, Kawasaki | Bildkodierungs-/-dekodierungsvorrichtung |
JP2001224036A (ja) | 1995-10-18 | 2001-08-17 | Sharp Corp | 動画像符号化装置 |
WO1997017797A2 (en) * | 1995-10-25 | 1997-05-15 | Sarnoff Corporation | Apparatus and method for quadtree based variable block size motion estimation |
JP3855286B2 (ja) * | 1995-10-26 | 2006-12-06 | ソニー株式会社 | 画像符号化装置および画像符号化方法、画像復号化装置および画像復号化方法、並びに記録媒体 |
JP2001238220A (ja) * | 1995-10-27 | 2001-08-31 | Toshiba Corp | 動画像符号化装置および動画像符号化方法 |
JP3788823B2 (ja) | 1995-10-27 | 2006-06-21 | 株式会社東芝 | 動画像符号化装置および動画像復号化装置 |
US5909513A (en) | 1995-11-09 | 1999-06-01 | Utah State University | Bit allocation for sequence image compression |
US6111917A (en) * | 1996-07-05 | 2000-08-29 | Nippon Telegraph And Telephone Corporation | Image communication system and method |
ES2545066T3 (es) * | 1997-06-09 | 2015-09-08 | Hitachi, Ltd. | Medio de grabación de información de imágenes |
US6795501B1 (en) | 1997-11-05 | 2004-09-21 | Intel Corporation | Multi-layer coder/decoder for producing quantization error signal samples |
AU1928999A (en) | 1997-12-19 | 1999-07-12 | Kenneth Rose | Scalable predictive coding method and apparatus |
CA2265089C (en) * | 1998-03-10 | 2007-07-10 | Sony Corporation | Transcoding system using encoding history information |
JP3775630B2 (ja) | 1998-07-29 | 2006-05-17 | Kddi株式会社 | 動画像の領域分割符号化装置 |
FR2782879B1 (fr) | 1998-08-28 | 2000-11-03 | Thomson Multimedia Sa | Procede de compression d'images |
JP2000324498A (ja) * | 1999-05-13 | 2000-11-24 | Nec Corp | 動画像符号化装置 |
US6542545B1 (en) | 1999-10-01 | 2003-04-01 | Mitsubishi Electric Reseach Laboratories, Inc. | Estimating rate-distortion characteristics of binary shape data |
JP3694888B2 (ja) * | 1999-12-03 | 2005-09-14 | ソニー株式会社 | 復号装置および方法、符号化装置および方法、情報処理装置および方法、並びに記録媒体 |
KR100642043B1 (ko) * | 2001-09-14 | 2006-11-03 | 가부시키가이샤 엔티티 도코모 | 부호화 방법, 복호 방법, 부호화 장치, 복호 장치, 화상 처리 시스템, 및 저장 매체 |
JP4353460B2 (ja) * | 2003-05-09 | 2009-10-28 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 動画データ処理装置及び方法並びにプログラム |
-
2002
- 2002-09-12 KR KR1020037006557A patent/KR100642043B1/ko active IP Right Grant
- 2002-09-12 US US10/432,044 patent/US7643559B2/en active Active
- 2002-09-12 EP EP09162925.3A patent/EP2099228B1/en not_active Expired - Lifetime
- 2002-09-12 CN CN201010548694.4A patent/CN102025991B/zh not_active Expired - Lifetime
- 2002-09-12 EP EP02765514A patent/EP1351510A4/en not_active Ceased
- 2002-09-12 WO PCT/JP2002/009368 patent/WO2003026315A1/ja active Application Filing
- 2002-09-12 EP EP18178788.8A patent/EP3399747B1/en not_active Expired - Lifetime
- 2002-09-12 JP JP2003529779A patent/JPWO2003026315A1/ja active Pending
- 2002-09-12 EP EP14183129.7A patent/EP2819411B1/en not_active Expired - Lifetime
- 2002-09-12 EP EP09162991.5A patent/EP2096872B1/en not_active Expired - Lifetime
- 2002-09-12 EP EP09162973.3A patent/EP2096871B1/en not_active Expired - Lifetime
- 2002-09-12 CN CN028032225A patent/CN1513268B/zh not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
CN1513268B (zh) | 2010-12-22 |
EP3399747B1 (en) | 2021-05-12 |
CN102025991B (zh) | 2017-12-29 |
EP2819411B1 (en) | 2018-08-29 |
CN102025991A (zh) | 2011-04-20 |
EP1351510A1 (en) | 2003-10-08 |
EP1351510A4 (en) | 2008-12-10 |
EP2096872A3 (en) | 2009-10-21 |
EP2096871A2 (en) | 2009-09-02 |
WO2003026315A1 (en) | 2003-03-27 |
EP2099228A2 (en) | 2009-09-09 |
CN1513268A (zh) | 2004-07-14 |
KR100642043B1 (ko) | 2006-11-03 |
EP2819411A1 (en) | 2014-12-31 |
US20040028282A1 (en) | 2004-02-12 |
KR20030062341A (ko) | 2003-07-23 |
EP2096871A3 (en) | 2009-10-07 |
EP2096872B1 (en) | 2014-11-12 |
US7643559B2 (en) | 2010-01-05 |
EP2099228A3 (en) | 2009-10-21 |
EP2096872A2 (en) | 2009-09-02 |
EP2099228B1 (en) | 2014-11-12 |
EP2096871B1 (en) | 2014-11-12 |
EP3399747A1 (en) | 2018-11-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPWO2003026315A1 (ja) | 符号化方法、復号方法、符号化装置、復号装置、画像処理システム、符号化プログラム及び復号プログラム | |
KR101088972B1 (ko) | 화상 부호화 장치 및 방법 | |
CN107295347B (zh) | 用于解码合并模式下的运动信息的装置 | |
CA2732532C (en) | Image decoder that decodes a color image signal and related method | |
EP1534018B1 (en) | Apparatus and method for generating coded block pattern for alpha channel image and alpha channel image encoding/decoding apparatus and method using the same | |
US8948243B2 (en) | Image encoding device, image decoding device, image encoding method, and image decoding method | |
KR20120092692A (ko) | 화상 예측 부호화 장치, 화상 예측 복호 장치, 화상 예측 부호화 방법, 화상 예측 복호 방법, 화상 예측 부호화 프로그램, 및 화상 예측 복호 프로그램 | |
WO2012172668A1 (ja) | 動画像符号化方法及び装置並びに動画復号化方法及び装置 | |
KR20140057397A (ko) | 인터 예측 부호화 방법 | |
CN101360240B (zh) | 编码方法、译码方法、编码装置、译码装置、图象处理系统 | |
CN116684577A (zh) | 基于运动矢量差的快速仿射模式决策 | |
JPWO2012172668A1 (ja) | 動画像符号化方法及び装置並びに動画復号化方法及び装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050913 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20051114 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051206 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060206 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20060228 |