JPWO2008072500A1 - 動画像符号化装置および動画像復号装置 - Google Patents

動画像符号化装置および動画像復号装置 Download PDF

Info

Publication number
JPWO2008072500A1
JPWO2008072500A1 JP2008549248A JP2008549248A JPWO2008072500A1 JP WO2008072500 A1 JPWO2008072500 A1 JP WO2008072500A1 JP 2008549248 A JP2008549248 A JP 2008549248A JP 2008549248 A JP2008549248 A JP 2008549248A JP WO2008072500 A1 JPWO2008072500 A1 JP WO2008072500A1
Authority
JP
Japan
Prior art keywords
prediction
image
unit
block
prediction method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008549248A
Other languages
English (en)
Other versions
JP4888919B2 (ja
Inventor
山本 智幸
智幸 山本
高橋 真毅
真毅 高橋
友子 青野
友子 青野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2008549248A priority Critical patent/JP4888919B2/ja
Publication of JPWO2008072500A1 publication Critical patent/JPWO2008072500A1/ja
Application granted granted Critical
Publication of JP4888919B2 publication Critical patent/JP4888919B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

予測制御部(11)が、符号化対象のブロックに含まれている高周波成分の多寡により、画面内予測方式または符号化済の縮小された符号化対象ブロックの局所復号画像を用いて予測画像を生成する縮小画像に基づく予測方式のいずれを用いるかを決定する。画面内予測方式を決定した場合には、フレームメモリ(6)に記憶されている符号化済みの隣接ブロックにおける局所復号画像がダウンサンプリング部(7b)によりダウンサンプリングされて画面内予測部(1)により画面内予測し、その予測データを用いて符号化する。縮小画像に基づく予測方式を決定した場合には、下位レイヤ処理で得られた局所復号画像をフレームメモリ(6)から読出して得られた隣接画像を用いて階層間予測を行い、予測データを用いて符号化する。

Description

本発明は、動画像の高能率符号化を行なう動画像符号化装置、および、当該動画像符号化装置で符号化された符号化データを復号する動画像復号装置に関するものである
動画像の持つ空間的相関および時間的相関を利用し、高能率な符号化および復号を実現する背景技術として、非特許文献1(ISO/IEC 14496−10:2004 Advanced Video Coding)および非特許文献2(ISO/IEC 14496−10:2005/FPDAM3 Scalable Video Coding)記載の動画像符号化方式を用いた動画像符号化装置および動画像復号装置がある。
これらの動画像符号化方式について、以下、説明する。まず非特許文献1記載の動画像符号化方式(以下、背景技術1)について説明する。この背景技術1の動画像符号化方式は、符号化対象のブロックに対して、符号化済の隣接ブロックの局所復号画像を用いた画面内予測により予測画像を生成し、その予測画像を用いて符号化する画面内予測符号化方式である。以下、具体的に説明する。
図6は背景技術1を用いた動画像符号化装置のブロック図を示す。図6において、背景技術1を用いた動画像符号化装置は、画面内予測部1と、直交変換部2と、量子化部3と、逆量子化部4と、逆直交変換部5と、フレームメモリ6と、可変長符号化部9とを含む。
画面内予測部1は、画像の空間的相関を利用した画面内予測を行ない、予測画像を生成する。直交変換部2は、入力データに対し、直交変換を行なう。量子化部3は、入力データの量子化を行なう。逆量子化部4は、量子化部3の逆操作にあたる逆量子化を行なう。逆直交変換部5は、直交変換部2の逆操作にあたる逆直交変換を行なう。フレームメモリ6は、画像を一時的に記憶する。可変長符号化部9は、入力データに対し、可変長符号化を行なう。
図6に示した背景技術1における動画像符号化装置の動作は以下の通りである。
<ステップ501>
所定のブロックサイズ(M×M画素ブロック)に分割された符号化対象画像(以下符号化対象ブロック)が、当該動画像符号化装置に入力される。
<ステップ502>
画面内予測部1は、当該動画像符号化装置に入力された符号化対象ブロックに対する予測画像(M×M画素ブロック)を生成する。
予測画像は、フレームメモリ6に記憶されている既に符号化済みの隣接ブロックにおける局所復号画像を用いて画面内予測を行なうことで生成される。この「既に符号化済みの隣接ブロック」とは、今回の符号化対象ブロック(M×M画素ブロック)よりも1つ前の段階で既に符号化されているM×M画素ブロックのことであり、具体的には、符号化対象ブロックの、左・上・左上・右上に位置する局所復号された4つのM×M画素ブロックのことである。
<ステップ503>
符号化対象ブロックと当該ブロックの予測画像の差分である予測残差データ(M×M画素ブロック)が直交変換部2および量子化部3の順に入力され、それぞれ直交変換および量子化処理が実行される。
<ステップ504>
さらに量子化された予測残差データは、逆量子化部4および逆直交変換部5での処理によって局所復号が行なわれ、さらに、ステップ502にて生成された予測画像と合成されることで、当該符号化対象ブロックの局所復号画像(M×M画素ブロック)として、フレームメモリ6へ記憶される。
<ステップ505>
また量子化された予測残差データは、可変長符号化部9にも入力され、可変長符号化された後、符号化データとして出力される。
<ステップ506>
符号化対象画像を構成するすべての符号化対象ブロックについて、ステップ501〜505を繰り返す。
以上のような処理で背景技術1の符号化処理は実現されており、画面内予測部1の行なう画面内予測および、直交変換部2の行なう直交変換により、符号化対象画像の持つ空間的冗長度が削減され、効率的な符号化が実現されている。
次に非特許文献2記載の動画像符号化方式(以下、背景技術2)について説明する。背景技術2では、階層符号化と呼ばれる技術を用いることで符号化を行なう。つまり、符号化対象のブロックに対して、符号化済の階層の情報に基づき階層間の冗長性を利用して符号化対象である階層を予測する階層間予測を行ない、その予測画像を用いて符号化する階層符号化方式を採用している。
図7に、背景技術2を用いた動画像符号化装置のブロック図を示す。図7において、背景技術2を用いた動画像符号化装置は、ダウンサンプリング部7と、アップサンプリング部8と、切替スイッチ10と、フィルタ処理部13と、階層切替制御部14とをさらに含む。
ダウンサンプリング部7は、入力画像の画素間引きにより、縮小画像を生成する。アップサンプリング部8は、入力画像の画素補間により、拡大画像を生成する。切替スイッチ10bは、2種類の入力データを所定の条件で切替えて出力する。フィルタ処理部13は、入力画像に対しローパスフィルタ処理を行なう。階層切替制御部14は、符号化対象の階層の切替を制御する。
その他の構成要素については、図6の動画像符号化装置と同一であるため、説明は繰り返さない。なお、切替スイッチ10は図中に複数存在するため、符号a,bを付与し識別するものとする。なお以後、図中に複数の同一要素が存在する場合も同様の方法で識別することとする。
図7に示した背景技術2における動画像符号化装置の動作は以下の通りである。なお以下の説明では、符号化対象画像を、上位レイヤ、下位レイヤの2階層に階層化し符号化する場合に限って説明する。この階層化された上位レイヤには高周波成分および低周波成分が含まれ、下位レイヤには低周波成分のみが含まれるようにする。たとえば、VGA(640×480画素)の画像を2レイヤで階層符号化する場合に、上位レイヤをVGAの画像、下位レイヤを上位レイヤの画像を縮小して得られるQVGA(320×240画素)の画像とする。
<ステップ601>
まず、下位レイヤの符号化を行なうため、階層切替制御部14が切替スイッチ10a、10bに対する制御を行なう。切替スイッチ10aの出力は、ダウンサンプリング部7の出力する縮小画像、切替スイッチ10bの出力は、画面内予測部1の出力する予測画像がそれぞれ選択される。
<ステップ602>
所定のブロックサイズ(N×N画素ブロック)に分割された符号化対象画像(以下符号化対象ブロック)が、当該動画像符号化装置に入力される。
<ステップ603>
符号化対象ブロックに対し、フィルタ処理部13にてローパスフィルタ処理が施され、さらにダウンサンプリング部7にて当該符号化対象ブロックに対する縮小画像(M×M画素ブロック)が生成される。なお、ブロックサイズを表わす整数N、MはN=αM(αは任意の整数)の関係を満たすものとする。
<ステップ604>
画面内予測部1は、ステップ603で生成された縮小画像に対する予測画像(M×M画素ブロック)を生成する。
予測画像は、フレームメモリ6に記憶されている既に符号化済みの隣接ブロックにおける局所復号画像(下位レイヤ)に対して背景技術1と同様の画面内予測を行なうことで生成される。
<ステップ605>
ステップ603で生成された縮小画像と当該ブロックの予測画像の差分である予測残差データ(M×M画素ブロック)が直交変換部2および量子化部3の順に入力され、それぞれ直交変換および量子化処理が実行される。
<ステップ606>
さらに量子化された予測残差データは、逆量子化部4、逆直交変換部5での処理を経て局所復号が行なわれ、ステップ604にて生成された予測画像と合成されることで、当該符号化対象ブロックの局所復号画像(M×M画素ブロック)として、フレームメモリ6へ記憶される。
<ステップ607>
また量子化された予測残差データは、可変長符号化部9にも入力され、可変長符号化された後、符号化データとして出力される。
<ステップ608>
符号化対象画像を構成するすべての符号化対象ブロックについて、ステップ601〜607を繰り返す。
<ステップ609>
次に、上位レイヤの符号化を行なうため、階層切替制御部14が切替スイッチ10a、10bに対する制御を行なう。切替スイッチ10aの出力は、符号化対象画像、切替スイッチ10bの出力は、アップサンプリング部8の出力する拡大画像がそれぞれ選択される。
<ステップ610>
所定のブロックサイズ(M×M画素ブロック)に分割された符号化対象画像(以下符号化対象ブロック)が、再度、当該動画像符号化装置に入力される。
<ステップ611>
アップサンプリング部8は、フレームメモリ6に記憶された符号化対象ブロックに対応する下位レイヤの局所復号画像を基に、補間処理により、当該ブロックに対応する拡大画像(M×M画素ブロック)を生成する。当該拡大画像は、符号化対象ブロックの予測画像として出力される。
<ステップ612>
符号化対象ブロックと階層間予測により得られた予測画像の差分である予測残差データ(M×M画素ブロック)が直交変換部2および量子化部3の順に入力され、それぞれ直交変換および量子化処理が実行される。
<ステップ613>
さらに量子化された予測残差データは、逆量子化部4、逆直交変換部5での処理を経て、局所復号が行なわれ、ステップ611にて生成された予測画像と合成されることで、当該符号化対象ブロックの局所復号画像(M×M画素ブロック)として、フレームメモリ6へ記憶される。
<ステップ614>
また量子化された予測残差データは、可変長符号化部9にも入力され、可変長符号化された後、符号化データとして出力される。
<ステップ615>
符号化対象画像を構成する、すべての符号化対象ブロックについて、ステップ609〜614を繰り返す。
以上の処理によって、背景技術2の符号化処理は実現されている。背景技術2の動画像符号化装置においては、図8に示すように、符号化対象画像PicAが縮小処理され、得られた縮小画像Picaを背景技術1と同様の処理を用いて符号化する。縮小画像に対して、画面内予測および直交変換を行なうことで、背景技術1に比べ画像における広範囲の空間的相関を利用することが可能である。
また上位レイヤの符号化においては、下位レイヤの符号化・復号処理で得られた画像Picbを拡大処理して得られた画像PicBを予測画像として用いる階層間予測を行なうことで、背景技術1を用いてPicAを予測するのに比べ、高精度の予測が可能になる。
ISO/IEC 14496−10:2004 Advanced Video Coding ISO/IEC 14496−10:2005/FPDAM3 Scalable Video Coding
以上説明したように、背景技術1では、背景技術2に比べ画像の持つ空間的相関を狭い範囲でしか利用することができないため、画像の空間的冗長度が高い画像に対して、効率のよい符号化を行なうことができない。このような傾向は画像の解像度が高くなるほど強くなる。
一方、背景技術2では、縮小画像に対して画面内予測を行なうことで、広い範囲での空間的相関を利用することが可能である。しかしながら、背景技術2が必ずしも背景技術1に比べ効率の良い符号化を行える訳ではない。
図9は、背景技術2を用いて符号化処理を行った場合の、符号化処理過程における画像の空間周波数特性を示す図である。なお図中の記号PicA〜PicDは図8中の各エンコード処理過程における画像、PicEは復号処理によって得られた復号画像に対応する。
図9では、符号化対象画像が、低周波数領域から高周波数領域までの広範囲の信号を含む場合(以下、ケース1:図中の実線)と、低周波数領域のみに信号が存在する場合と(以下、ケース2:図中の点線)の2種類の例を表わしている。下位レイヤの符号化の過程(図9(b)〜(d))においては、折り返し歪の影響を考慮して、縮小処理の際に、高周波数領域の信号が除去された後に、符号化処理が行なわれるため、いずれの場合も、低周波数領域の信号のみが処理され、処理の間に違いはみられない。しかし、上位レイヤの符号化においては、図9(e)に示す通り、階層間予測後の予測残差画像PicDにおいて、ケース1のみ予測残差として現れている。ケース1のように低周波数領域から高周波数領域までの広範囲の信号を含む画像の符号化を行なう場合、縮小画像を生成する際のローパスフィルタ処理の影響、および、下位レイヤの符号化に伴う符号化歪などが影響し、上位レイヤの符号化において予測残差が低周波数領域にまで発生する場合がある。このような場合、下位レイヤ、上位レイヤのそれぞれで重複して低周波数領域に存在する信号を符号化することになるため、効率の良い符号化が出来なくなる問題すなわち圧縮率が低下するという問題が発生する。
本発明は、係る実情に鑑み考え出されたものであり、その目的は、階層符号化方式による利点を極力維持しつつ、階層符号化方式を採用した場合の無駄な符号化処理の問題をも解決することである。
上記目的を達成するためこの発明のある局面に従えば、画像を所定サイズの複数のブロックに分割し、かつ符号化する動画像符号化装置を提供する。動画像符号化装置は、予測部と、符号化部と、予測制御部と、予測方式情報生成部とを含む。予測部は、符号化対象のブロックに対して、符号化済の隣接ブロックの局所復号画像を用いて予測画像を生成する画面内予測方式と、符号化済の縮小された符号化対象ブロックの局所復号画像を用いて予測画像を生成する縮小画像に基づく予測方式との、いずれの方式でも予測を実行可能である。符号化部は、該予測部による予測画像を用いて符号化を行なう。予測制御部は、符号化対象のブロックに対する予測方式として、画面内予測方式または縮小画像に基づく予測方式のいずれを用いるかを所定のブロック毎に決定し、該決定した予測方式により予測部に予測を実行させる制御を行なう。予測方式情報生成部は、符号化部により符号化された符号化データを復号する際に当該符号化データの生成に用いられた予測方式を特定できるように、予測制御部が所定のブロック毎に決定した予測方式を特定するための予測方式情報を符号化する。
好ましくは、予測部は、符号化対象のブロックに対して、符号化済の隣接ブロックの局所復号画像を用いて予測画像を生成する画面内予測部と、当該ブロックの符号化済縮小画像を拡大し、当該ブロックの予測画像を生成するアップサンプリング部とを含む。符号化部は、予測制御部が画面内予測方式に決定した場合に、画面内予測部による予測画像を符号化に用い、予測制御部が縮小画像に基づく予測方式に決定した場合に、アップサンプリング部による予測画像を符号化に用いる。
さらに好ましくは、符号化済縮小画像は、画面内予測部を用いて画面内予測された後、符号化される。
好ましくは、予測方式情報生成部は、予測方式情報として、所定のブロックに隣接する符号化済ブロックの符号化に用いられた予測方式に基づいて導出された推定予測方式と、所定のブロックの予測方式が一致するか否かの情報とを出力する。
好ましくは、符号化部は、予測制御部が縮小画像に基づく予測方式を選択した場合には、予測部による予測画像と符号化対象ブロックの画像との差分画像を符号化しない。
この発明の別の局面に従えば、画像を構成するブロック毎に符号化データを復号する動画像復号装置を提供する。動画像復号装置は、予測部と、復号部と、予測方式特定部とを含む。予測部は、復号対象のブロックに対する予測方式として、復号済の隣接ブロックの局所復号画像を用いて予測画像を生成する画面内予測方式と、復号済の縮小された復号対象ブロックを用いて予測画像を生成する縮小画像に基づく予測方式との、いずれの方式でも予測を実行可能である。復号部は、該予測部による予測画像を復号に用いる。予測方式特定部は、復号対象のブロックに用いられた予測方式を特定する予測方式情報から予測方式を特定する。予測部は、予測方式特定部により特定された予測方式により予測を実行する。
好ましくは、予測部は、復号対象のブロックに対して、復号済の隣接ブロックの局所復号画像を用いて予測画像を生成する画面内予測部と、当該ブロックの復号済縮小画像を拡大し、当該ブロックの予測画像を生成するアップサンプリング部とを含む。復号部は、予測方式特定部が画面内予測方式を特定した場合に、画面内予測部による予測画像を復号に用い、予測方式特定部が縮小画像に基づく予測方式を特定した場合に、アップサンプリング部による予測画像を復号に用いる。
さらに好ましくは、復号済縮小画像は、復号された後、画面内予測部を用いて画面内予測された画像データである。
好ましくは、予測方式特定部は、予測方式情報として、復号対象ブロックに隣接する復号済ブロックの復号に用いられた予測方式に基づいて導出された推定予測方式と、復号対象ブロックの予測方式が一致するか否かの情報とを出力する。
好ましくは、復号部は、予測制御部が縮小画像に基づく予測方式を選択した場合には、予測部による予測画像を当該復号対象ブロックの復号画像とする。
本発明の動画像符号化装置および動画像復号装置によれば、所定サイズのブロック毎に予測方式を適応的に切替えることで、効率的な符号化および復号を実現できる。また、本発明の動画像符号化装置では、縮小画像を基にした予測を行なう際、縮小画像作成のためのローパスフィルタ処理が不要であり、処理量を削減することが可能である。
本発明の第1の実施形態に従う動画像符号化装置のブロック図である。 本発明の第1の実施形態の別形態に従う動画像符号化装置のブロック図である。 本発明の第1の実施形態に従う動画像復号装置のブロック図である。 本発明の第2の実施形態に従う動画像符号化装置のブロック図である。 本発明の第2の実施形態に従う動画像復号装置のブロック図である。 背景技術1を用いた動画像符号化装置のブロック図である。 背景技術2を用いた動画像符号化装置のブロック図である。 背景技術2における符号化処理の説明図である。 背景技術2における符号化特性の説明図である。
符号の説明
1 画面内予測部、2 直交変換部、3 量子化部、4 逆量子化部、5 逆直交変換部、6 フレームメモリ、7 ダウンサンプリング部、8 アップサンプリング部、9 可変長符号化部、10 切替スイッチ、11 予測制御部、12 可変長復号部、13 フィルタ処理部、14 階層切替制御部。
[実施形態1]
まず、本発明の第1の実施形態に従う動画像符号化装置について説明する。図1は、本実施形態における動画像符号化装置のブロック図を示す。図1において、予測制御部11は、符号化対象画像の符号化対象ブロック毎に、切替スイッチ10a、10b、10cを制御することで、当該符号化対象ブロックに用いる予測方法を決定する。その他の構成要素については、図7の動画像符号化装置における各構成要素と同一であるため、詳細な説明は繰り返さない。
次に本実施形態に従う動画像符号化装置の動作について説明する。本実施形態に従う動画像符号化装置の動作は、以下の通りである。なお、以下の説明においても、背景技術の説明で用いたのと同じブロックサイズN×N画素ブロック、M×M画素ブロックを単位として符号化および復号するものとして説明する。
<ステップ101>
所定のブロックサイズ(N×N画素ブロック)に分割された符号化対象画像(以下符号化対象ブロック)が、当該動画像符号化装置に入力される。
<ステップ102>
予測制御部11は、符号化対象ブロックの空間周波数特性を基に、当該ブロックに用いる予測方式を決定する。当該ブロックに、高周波数成分が所定量以上含まれている場合には、背景技術1と同様に画面内予測を用いる。一方、当該ブロックにおける高周波数成分が所定量未満の場合には、当該ブロックに対する縮小画像を基にした予測を用いるよう制御する。予測方式の決定方法の詳細については後述する。
なお予測制御部11が決定した当該ブロックに用いる予測方式は、可変長符号化部9にて可変長符号化され、符号化データとして出力される。
また予測制御部11は、切替スイッチ10a、10b、10cを制御し、背景技術1と同様に画面内予測による予測を行なう場合には、切替スイッチ10aの出力を符号化対象画像、切替スイッチ10bの出力をフレームメモリ6から出力される局所復号画像、切替スイッチ10cの出力を画面内予測部1の出力する予測画像、にそれぞれ設定する。この場合、以降の処理としてはステップ103〜ステップ108までの処理が行なわれる。
一方、縮小画像を基にした予測を用いる場合には、一旦、切替スイッチ10a、10bの出力は、ダウンサンプリング部の出力する縮小画像、切替スイッチ10cの出力は画面内予測部1の出力する予測画像、にそれぞれ設定され、ステップ109以降の処理が行なわれる。
<ステップ103>
符号化対象ブロックはさらに、所定ブロックサイズ(M×M画素ブロック)に分割され、それぞれのブロックについて、以下の処理が行なわれる。
<ステップ104>
画面内予測部1は、当該ブロックに対する予測画像(M×M画素ブロック)を生成する。なお予測画像は、フレームメモリ6に記憶されている既に符号化済みの隣接ブロックにおける局所復号画像を用いて画面内予測を行なうことで生成される。
<ステップ105>
当該ブロックとステップ104にて生成された予測画像の差分である予測残差データ(M×M画素ブロック)が直交変換部2および量子化部3の順に入力され、それぞれ直交変換および量子化処理が実行される。
<ステップ106>
さらに量子化された予測残差データは、逆量子化部4および逆直交変換部5での処理を経て、局所復号が行なわれ、ステップ102にて生成された予測画像と合成されることで、当該ブロックの局所復号画像(M×M画素ブロック)として、フレームメモリ6へ記憶される。
<ステップ107>
また量子化された予測残差データは、可変長符号化部9にも入力され、可変長符号化された後、符号化データとして出力される。
<ステップ108>
符号化対象ブロック(N×N画素ブロック)を構成するすべてのブロック(M×M画素ブロック)について、ステップ103〜ステップ107が繰り返された後、ステップ119の処理が実行される。
<ステップ109>
ダウンサンプリング部7aが、符号化対象ブロックに対し、縮小画像(M×M画素ブロック)を生成する。具体的には、符号化対象ブロック(N×N画素ブロック)をM×M個の正方形の小領域に分割して、各小領域の左上に位置する画素を抽出することで縮小画像が生成される。
<ステップ110>
画面内予測部1は、ステップ109で生成された縮小画像に対する予測画像(M×M画素ブロック)を生成する。なお、フレームメモリ6に記憶されている既に符号化済みの隣接ブロックにおける局所復号画像(N×N画素ブロック)をダウンサンプリング部7bにて縮小処理して得られる画素ブロックを用いて画面内予測を行なうことで、予測画像は生成される。ダウンサンプリング部7bにおける縮小処理は、ダウンサンプリング7aにおける縮小処理と同様である。
<ステップ111>
ステップ109で生成された縮小画像とステップ110で生成された当該ブロックの予測画像との差分である予測残差データ(M×M画素ブロック)が直交変換部2および量子化部3の順に入力され、それぞれ直交変換および量子化処理が実行される。
<ステップ112>
さらに量子化された予測残差データは、逆量子化部4および逆直交変換部5での処理を経て、局所復号が行なわれ、ステップ110にて生成された予測画像と合成されることで、当該ブロックの局所復号画像(M×M画素ブロック)として、フレームメモリ6へ記憶される。
<ステップ113>
また量子化された予測残差データは、可変長符号化部9にも入力され、可変長符号化された後、符号化データとして出力される。
<ステップ114>
予測制御部11は、切替スイッチ10a、10cを制御し、切替スイッチ10aの出力を符号化対象画像、切替スイッチ10cの出力をアップサンプリング部8の出力する拡大画像、にそれぞれ設定する。
<ステップ115>
アップサンプリング部8は、ステップ112でフレームメモリ6に記憶した縮小画像の局所復号画像(M×M画素ブロック)から拡大画像(N×N画素ブロック)を生成する。なお当該拡大画像は、符号化対象ブロックに対する予測画像として出力する。
<ステップ116>
符号化対象ブロックをM×M画素ブロックに分割して、各画素ブロックとステップ115により得られた予測画像上の対応する領域の差分である予測残差データ(M×M画素ブロック)がそれぞれ直交変換部2および量子化部3の順に入力され、それぞれ直交変換および量子化処理が実行される。
<ステップ117>
さらに量子化された予測残差データは、逆量子化部4および逆直交変換部5での処理を経て、局所復号が行なわれ、ステップ111にて生成された予測画像と合成されることで、当該符号化対象ブロックの局所復号画像(M×M画素ブロック)として、フレームメモリ6へ記憶される。
<ステップ118>
また量子化された予測残差データは、可変長符号化部9にも入力され、可変長符号化された後、符号化データとして出力される。
<ステップ119>
符号化対象画像を構成する、すべての符号化対象ブロックについて、ステップ101〜118を繰り返す。
以上説明したように、本実施形態に従う動画像符号化装置においては、所定のブロックサイズ毎に画面内予測、あるいは、縮小画像を基にした予測のいずれかを適応的に切替えることで、効率の良い符号化を実現することができる。
次に、上述した動画像符号化装置の動作のステップ102における予測方式決定方法の詳細について説明する。前述の通り、予測制御部11は符号化対象ブロックに含まれる高周波成分の推定量の大小により予測方式を決定する。8×8画素からなる符号化対象ブロックの高周波成分の推定量AHは次式により導出される。
Figure 2008072500
ここで、A(u,v)は符号化対象ブロックの画像a(i,j)をDCT変換して得られる周波数成分である。なお、i,jはブロック内の水平方向,鉛直方向の位置をそれぞれ示す値である。また、u,vは8×8画素ブロックをDCT変換して得られる水平、鉛直方向の周波数成分の位置をそれぞれ表わす。
予測制御部11は、あらかじめ実験により定めた閾値D1を用いて、高周波成分の推定量AHがD1よりも小さいならば縮小画像を基にした予測を行ない、AHがD1以上ならば背景技術1と同様の画面内予測を行なうように制御する。
なお上記の説明では、予測制御部11は、符号化対象ブロックの空間周波数特性を基に当該ブロックに用いる予測方式を決定するものとしたが、一旦、それぞれの予測方式を用いた符号化を行った後、発生符号量と、局所復号画像に含まれる歪の量を基に、当該ブロックに用いる予測方式を決定する構成であってもよい。
さらに本実施形態に従う動画像符号化装置においては、予測方式として、画面内予測、縮小画像を用いた予測の2種類のみを切替える構成として説明したが、たとえば、予測特性の異なる複数の画面内予測方式を適応的に切替え可能な構成であってもよい。たとえば、符号化対象ブロックに隣接するブロックをDCT変換して得られるDCT係数を用いて当該ブロックにおけるDCT係数を予測し、予測したDCT係数を逆DCTして当該ブロックの予測画像を得る予測方式を、前述した2つの予測方式に加えることもできる。
なお、本実施形態に従う動画像符号化装置においては、対象画像に含まれる空間周波数成分を解析し、高周波数成分が殆ど存在しない場合にのみ、縮小画像を用いた予測を行なうため、背景技術2では縮小画像を作成する際に折り返し歪の影響を考慮し必須であったローパスフィルタ処理は実施する必要がない。しかし高周波数領域に存在するノイズ除去し、更に符号化効率を高める目的で、ダウンサンプリング処理の直前にローパスフィルタ処理を実施する図2のような構成を採用してもよい。
なお、本実施形態に従う動画像符号化装置の説明においては、予測制御部11にて決定された当該ブロックに用いる予測方式が、可変長符号化部9にて可変長符号化されるものとしたが、予測制御部11が隣接ブロックの符号化に用いた予測方式に基づいて当該ブロックに用いる予測方式を推定し、当該ブロックに用いる予測方式と推定した予測方式が異なるか否かの情報を可変長符号化部9にて可変長符号化しても構わない。たとえば、当該ブロックの符号化に用いる予測方式をPc、当該ブロックの上、左に隣接するブロックにおいて用いられた予測方式をそれぞれPt,Plとする。そして、PtとPlがともに縮小画像を基にした予測である場合には、縮小画像を基にした予測をPcの推定値とし、それ以外の場合には、画面内予測をPcの推定値とする。当該ブロックの予測方式と隣接ブロックの予測方式との間の相関を利用することにより、予測方式の符号化に必要な符号量を削減することができる。
次に本実施形態に従う動画像復号装置について説明する。図3は、本実施形態に従う動画像復号装置のブロック図を示す。
図3において、可変長復号部12は、符号化データの可変長復号を行なう。その他の構成は、図1の動画像符号化装置の各要素と同一であり、詳細な説明は繰り返さない。
<ステップ201>
入力された符号化データから、N×N画素ブロックからなる復号対象画像(以下復号対象ブロック)に用いる予測方式が、可変長復号部12にて復号される。
このとき、背景技術1と同様の画面内予測が用いられる場合には、切替スイッチ10aの出力はフレームメモリ6の出力する局所復号画像に設定され、以降の処理はステップ202〜ステップ205までの処理が実行される。
一方、縮小画像を基にした予測が用いられる場合には、切替スイッチ10aの出力は、ダウンサンプリング部7の出力結果に設定され、ステップ206以降の処理が行なわれる。
また、いずれの予測方式が用いられる場合においても、一旦、切替スイッチ10bの出力は画面内予測部1の出力する予測画像に設定される。
<ステップ202>
復号対象ブロックは更に、所定ブロックサイズ(M×M画素ブロック)に分割され、それぞれのブロックについて、可変長復号部12にて予測残差データの可変長復号が行なわれる。
<ステップ203>
画面内予測部1は、当該ブロックに対する予測画像(M×M画素ブロック)を生成する。
<ステップ204>
ステップ202で可変長復号された予測残差データは、逆量子化部4、逆直交変換部5での処理を経て、局所復号が行なわれ、ステップ203にて生成された予測画像と合成されることで、当該復号対象ブロックの局所復号画像(M×M画素ブロック)として、フレームメモリ6へ記憶される。
<ステップ205>
復号対象ブロックを構成するすべてのブロックについて、ステップ202〜ステップ204が繰り返された後、ステップ214の処理が実行される。
<ステップ206>
復号対象ブロックに対する縮小画像(M×M画素ブロック)について、可変長復号部12にて予測残差データの可変長復号が行なわれる。
<ステップ207>
画面内予測部1は、当該ブロックに対する予測画像(M×M画素ブロック)を生成する。画面内予測には、動画像符号化装置と同様に、フレームメモリ6に記憶された隣接ブロックの局所復号画像をダウンサンプリング部7bにて縮小処理した上で用いる。
<ステップ208>
ステップ206で可変長復号された予測残差データは、逆量子化部4および逆直交変換部5での処理を経て局所復号が行なわれ、ステップ207にて生成された予測画像と合成されることで、当該ブロックの局所復号画像(M×M画素ブロック)として、フレームメモリ6へ記憶される。
<ステップ209>
可変長復号部12は、切替スイッチ10bを制御し、切替スイッチ10bの出力をアップサンプリング部8の出力する拡大画像へ切替える。
<ステップ210>
復号対象ブロックは更に、所定ブロックサイズ(M×M画素ブロック)に分割され、それぞれのブロックについて、可変長復号部12にて予測残差データの可変長復号が行なわれる。
<ステップ211>
アップサンプリング部8は、ステップ208でフレームメモリに記憶した縮小画像の局所復号画像を基に拡大画像(M×M画素ブロック)を生成する。
当該拡大画像は、復号対象ブロックに対する予測画像として出力する。
<ステップ212>
ステップ210にて可変長復号された予測残差データは、逆量子化部4および逆直交変換部5での処理を経て局所復号が行なわれ、ステップ211にて生成された予測画像と合成されることで、当該復号対象ブロックの局所復号画像(M×M画素ブロック)として、フレームメモリ6へ記憶される。
<ステップ213>
復号対象ブロックを構成するすべてのブロックについて、ステップ206〜ステップ212を繰り返す。
<ステップ214>
復号対象画像を構成する、すべての復号対象ブロックについて、ステップ201〜213を繰り返す。
以上のような動画像復号装置の処理により、本実施形態に従う動画像符号化装置で生成された符号化データは復号される。
[実施形態2]
次に本発明の第2の実施形態に従う動画像符号化装置および動画像復号装置について順に説明する。
まず本実施形態の動画像符号化装置について説明する。図4は、本発明の第2の実施形態に従う動画像符号化装置のブロック図を示す。各構成要素については、図1の動画像符号化装置の構成要素と同一であるため詳細な説明は繰り返さない。
なお本実施形態の動画像符号化装置の動作は、以下の通りである。
<ステップ301>
所定のブロックサイズ(N×N画素ブロック)に分割された符号化対象画像(以下符号化対象ブロック)が、当該動画像符号化装置に入力される。
<ステップ302>
予測制御部11は、符号化対象ブロックの空間周波数特性を基に、当該ブロックに用いる予測方式を決定する。当該ブロックに、高周波数成分が所定量以上含まれている場合には、背景技術1と同様に画面内予測を用いる。一方、当該ブロックにおける高周波数成分が所定量未満の場合には、当該ブロックに対する縮小画像を基にした予測を用いるよう制御する。
なお予測制御部11が決定した当該ブロックに用いる予測方式は、可変長符号化部9にて可変長符号化され、符号化データとして出力される。
また予測制御部11は、切替スイッチ10a、10b、10cを制御し、背景技術1と同様に画面内予測による予測を行なう場合には、切替スイッチ10aの出力を符号化対象画像、切替スイッチ10bの出力はフレームメモリ6の出力する局所復号画像、切替スイッチ10cの出力は画面内予測部1と逆直交変換部5の出力を合成した合成画像を出力するように設定する。この場合、以降の処理としてはステップ303〜ステップ308までの処理が行なわれる。
一方、縮小画像を基にした予測を用いる場合には、切替スイッチ10a、10bの出力は、ダウンサンプリング部の出力する縮小画像、切替スイッチ10cの出力はアップサンプリング部8の出力する拡大画像、がそれぞれ設定され、ステップ309以降の処理が行なわれる。
<ステップ303>
符号化対象ブロックは更に、所定ブロックサイズ(M×M画素ブロック)に分割され、それぞれのブロックについて、以下の処理が行なわれる。
<ステップ304>
画面内予測部1は、当該ブロックに対する予測画像(M×M画素ブロック)を生成する。予測画像は、フレームメモリ6に記憶されている既に符号化済みの隣接ブロックにおける局所復号画像に対して画面内予測を行なうことで生成される。
<ステップ305>
当該ブロックとステップ304にて生成された予測画像の差分である予測残差データ(M×M画素ブロック)が直交変換部2および量子化部3の順に入力され、それぞれ直交変換および量子化処理が実行される。
<ステップ306>
さらに量子化された予測残差データは、逆量子化部4および逆直交変換部5での処理を経て局所復号が行なわれ、ステップ302にて生成された予測画像と合成されることで、当該符号化対象ブロックの局所復号画像(M×M画素ブロック)として、フレームメモリ6へ記憶される。
<ステップ307>
また量子化された予測残差データは、可変長符号化部9にも入力され、可変長符号化された後、符号化データとして出力される。
<ステップ308>
符号化対象ブロックを構成するすべてのブロックについて、ステップ303〜ステップ307が繰り返された後、ステップ314の処理が実行される。
<ステップ309>
ダウンサンプリング部7aにて、符号化対象ブロックに対し、縮小画像(M×M画素ブロック)が生成される。
<ステップ310>
画面内予測部1は、ステップ309で生成された縮小画像に対する予測画像(M×M画素ブロック)を生成する。
なお、フレームメモリ6に記憶されている既に符号化済みの隣接ブロックにおける局所復号画像をダウンサンプリング部7bにて縮小処理して得られる画素ブロックを用いて、画面内予測を行なうことで予測画像は生成される。
<ステップ311>
ステップ309で生成された縮小画像と当該ブロックの予測画像の差分である予測残差データ(M×M画素ブロック)が直交変換部2および量子化部3の順に入力され、それぞれ直交変換および量子化処理が実行される。
<ステップ312>
さらに量子化された予測残差データは、逆量子化部4および逆直交変換部5での処理を経て、局所復号が行なわれ、ステップ310にて生成された予測画像と合成される。
<ステップ313>
ステップ312で得られた画像(M×M画素ブロック)は、アップサンプリング部8の補間処理によって拡大され、当該符号化対象ブロックの局所復号画像(N×N画素ブロック)として、フレームメモリ6へ記憶される。
<ステップ314>
符号化対象画像を構成する、すべての符号化対象ブロックについて、ステップ301〜313を繰り返す。
以上説明したように、本実施形態の動画像符号化装置においても、実施形態1に従う動画像符号化装置と同様、予測方式を適応的に切替えることで、効率の良い符号化を実現する。
さらに、本実施形態に従う動画像符号化装置では、縮小画像を用いた予測を行なう場合には、当該ブロックにおける高周波数成分が殆ど存在しないことを利用し、縮小画像の符号化結果のみを符号化する。すなわち、本実施形態に従う動画像符号化装置では、局所復号された縮小画像をアップサンプリングして得られる画像と当該ブロックの画像との差分画像を符号化しないことで、更なる符号化効率の向上を可能としている。さらに、当該ブロックにおける高周波成分が殆ど存在しないため、図1、図4に示した動画像符号化装置では、縮小画像を基にした予測を行なう際、縮小画像作成のためのローパスフィルタ処理が不要であり、処理量を削減することが可能である。
次に本実施形態に従う動画像復号装置について説明する。図5は、本発明の第2の実施形態における動画像復号装置のブロック図を示す。各構成要素については、図3の動画像復号装置の各構成要素と同一であるため説明は繰り返さない。なお本実施形態の動画像復号装置の動作は以下の通りである。
<ステップ401>
入力された符号化データから、N×N画素ブロックからなる復号対象画像(以下復号対象ブロック)に用いる予測方式が、可変長復号部12にて復号される。
復号対象ブロックに対し、背景技術1と同様の画面内予測が用いられる場合には、切替スイッチ10aの出力はフレームメモリから出力される局所復号画像、切替スイッチ10bの出力は、画面内予測部1と逆直交変換部5からの出力の合成画像にそれぞれ設定され、以降の処理としてステップ402〜ステップ405が実行される。
一方、縮小画像を基にした予測が用いられる場合には、切替スイッチ10aの出力は、ダウンサンプリング部7の出力、切替スイッチ10bの出力は、アップサンプリング部8の出力にそれぞれ設定され、以降の処理として、ステップ406以降の処理が行なわれる。
<ステップ402>
復号対象ブロックは更に、所定ブロックサイズ(M×M画素ブロック)に分割され、それぞれのブロックについて、可変長復号部12にて予測残差データの可変長復号が行なわれる。
<ステップ403>
画面内予測部1は、当該ブロックに対する予測画像(M×M画素ブロック)を生成する。
<ステップ404>
ステップ402で可変長復号された予測残差データは、逆量子化部4および逆直交変換部5での処理を経て局所復号が行なわれ、ステップ403にて生成された予測画像と合成されることで、当該復号対象ブロックの局所復号画像(M×M画素ブロック)として、フレームメモリ6へ記憶される。
<ステップ405>
復号対象ブロックを構成するすべてのブロックについて、ステップ402〜ステップ404が繰り返された後、ステップ409へ。
<ステップ406>
復号対象ブロックに対する縮小画像(M×M画素ブロック)について、可変長復号部12にて予測残差データの可変長復号が行なわれる。
<ステップ407>
画面内予測部1は、当該ブロックに対する予測画像(M×M画素ブロック)を生成する。画面内予測には、動画像符号化装置と同様に、フレームメモリ6に記憶された隣接ブロックの局所復号画像をダウンサンプリング部7にて縮小処理した上で用いる。
<ステップ408>
ステップ406で可変長復号された予測残差データは、逆量子化部4および逆直交変換部5での処理を経て局所復号が行なわれ、ステップ407にて生成された予測画像と合成された後、アップサンプリング部8にてN×N画素ブロックに拡大処理され、当該ブロックの局所復号画像として、フレームメモリ6へ記憶される。
<ステップ409>
復号対象画像を構成するすべての復号対象ブロックについて、ステップ401〜408を繰り返す。
以上のような動画像復号装置の処理により、本実施形態の動画像符号化装置で生成された符号化データは復号される。
[その他の変形例]
次に、その他の変形例を記載する。
(1) 上述した動画像符号化装置の動作説明のステップ115(図1)またはステップ313(図4)において縮小画像を拡大する方法について以下に示す。背景技術2で定められた方法を用いる以外にもアップサンプリングを行ない予測画像を導出する方法がある。たとえば、背景技術2ではLanczos3関数に基づく6タップの補間フィルタを基本としてアップサンプリング処理を行なうことで、画像の高周波成分の高精度に補間することができる。しかし、本発明の場合には高周波成分をあまり含まない領域に対してのみ縮小画像を基にした予測を行なうので、高周波成分の補間精度で劣る2タップの線形補間フィルタを利用しても符号化効率への影響は小さい。2タップの線形補間フィルタを利用する場合は、アップサンプリングに必要な処理量を低減することができる。
(2) 上述した動画像符号化装置の動作説明では、ダウンサンプリング部7aおよびダウンサンプリング部7bにおいて、M×M個の各小領域内で左上に位置する画素を抽出して縮小画像を構成するとしたが、各小領域内の別の位置、たとえば右下に位置する画素を抽出して縮小画像を構成しても構わない。ブロックをラスタスキャン順に処理する場合には、小領域内の右下の画素を使って縮小画像を構成することで、アップサンプリング時に参照可能な画素数が増加し、その結果として縮小画像を基にした予測画像の精度が向上するという利点がある。
なお、上記実施の形態は、すべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて請求の範囲によって示され、請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。

Claims (10)

  1. 符号化対象のブロックに対して、符号化済の隣接ブロックの局所復号画像を用いて予測画像を生成する画面内予測方式と、符号化済の縮小された前記符号化対象ブロックの局所復号画像を用いて予測画像を生成する縮小画像に基づく予測方式との、いずれの方式でも予測を実行可能な予測部と、
    該予測部による予測画像を用いて符号化を行なう符号化部と、
    前記符号化対象のブロックに対する予測方式として、前記画面内予測方式または前記縮小画像に基づく予測方式のいずれを用いるかを所定のブロック毎に決定し、該決定した予測方式により前記予測部に予測を実行させる制御を行なう予測制御部と、
    前記符号化部により符号化された符号化データを復号する際に当該符号化データの生成に用いられた予測方式を特定できるように、前記予測制御部が前記所定のブロック毎に決定した予測方式を特定するための予測方式情報を符号化する予測方式情報生成部とを備える、動画像符号化装置。
  2. 前記予測部は、
    符号化対象のブロックに対して、符号化済の隣接ブロックの局所復号画像を用いて予測画像を生成する画面内予測部と、
    当該ブロックの符号化済縮小画像を拡大し、当該ブロックの予測画像を生成するアップサンプリング部と、を含み、
    前記符号化部は、前記予測制御部が前記画面内予測方式に決定した場合に、前記画面内予測部による予測画像を前記符号化に用い、前記予測制御部が前記縮小画像に基づく予測方式に決定した場合に、前記アップサンプリング部による予測画像を前記符号化に用いる、請求の範囲第1項に記載の動画像符号化装置。
  3. 前記符号化済縮小画像は、前記画面内予測部を用いて画面内予測された後、符号化される、請求の範囲第2項に記載の動画像符号化装置。
  4. 前記予測方式情報生成部は、前記予測方式情報として、前記所定のブロックに隣接する符号化済ブロックの符号化に用いられた予測方式に基づいて導出された推定予測方式と、前記所定のブロックの予測方式が一致するか否かの情報とを出力する、請求の範囲第1項に記載の動画像符号化装置。
  5. 前記符号化部は、前記予測制御部が前記縮小画像に基づく予測方式を選択した場合には、前記予測部による予測画像と前記符号化対象ブロックの画像との差分画像を符号化しない、請求の範囲第1項に記載の動画像符号化装置。
  6. 画像を構成するブロック毎に符号化データを復号する動画像復号装置であって、
    復号対象のブロックに対する予測方式として、復号済の隣接ブロックの局所復号画像を用いて予測画像を生成する画面内予測方式と、復号済の縮小された前記復号対象ブロックを用いて予測画像を生成する縮小画像に基づく予測方式との、いずれの方式でも予測を実行可能な予測部と、
    該予測部による予測画像を復号に用いる復号部と、
    前記復号対象のブロックに用いられた予測方式を特定する予測方式情報から予測方式を特定する予測方式特定部と、を備え、
    前記予測部は、前記予測方式特定部により特定された予測方式により予測を実行する、動画像復号装置。
  7. 前記予測部は、
    復号対象のブロックに対して、復号済の隣接ブロックの局所復号画像を用いて予測画像を生成する画面内予測部と、
    当該ブロックの復号済縮小画像を拡大し、当該ブロックの予測画像を生成するアップサンプリング部と、を含み、
    前記復号部は、前記予測方式特定部が前記画面内予測方式を特定した場合に、前記画面内予測部による予測画像を前記復号に用い、前記予測方式特定部が前記縮小画像に基づく予測方式を特定した場合に、前記アップサンプリング部による予測画像を前記復号に用いる、請求の範囲第6項に記載の動画像復号装置。
  8. 前記復号済縮小画像は、復号された後、前記画面内予測部を用いて画面内予測された画像データである、請求の範囲第7項に記載の動画像復号装置。
  9. 前記予測方式特定部は、前記予測方式情報として、前記復号対象ブロックに隣接する復号済ブロックの復号に用いられた予測方式に基づいて導出された推定予測方式と、前記復号対象ブロックの予測方式が一致するか否かの情報とを出力する、請求の範囲第6項に記載の動画像復号装置。
  10. 前記復号部は、前記予測制御部が前記縮小画像に基づく予測方式を選択した場合には、前記予測部による予測画像を当該復号対象ブロックの復号画像とする、請求の範囲第6項に記載の動画像復号装置。
JP2008549248A 2006-12-13 2007-12-04 動画像符号化装置および動画像復号装置 Expired - Fee Related JP4888919B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008549248A JP4888919B2 (ja) 2006-12-13 2007-12-04 動画像符号化装置および動画像復号装置

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2006336072 2006-12-13
JP2006336072 2006-12-13
JP2008549248A JP4888919B2 (ja) 2006-12-13 2007-12-04 動画像符号化装置および動画像復号装置
PCT/JP2007/073363 WO2008072500A1 (ja) 2006-12-13 2007-12-04 動画像符号化装置および動画像復号装置

Publications (2)

Publication Number Publication Date
JPWO2008072500A1 true JPWO2008072500A1 (ja) 2010-03-25
JP4888919B2 JP4888919B2 (ja) 2012-02-29

Family

ID=39511522

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008549248A Expired - Fee Related JP4888919B2 (ja) 2006-12-13 2007-12-04 動画像符号化装置および動画像復号装置

Country Status (4)

Country Link
US (1) US8306126B2 (ja)
EP (1) EP2104359A4 (ja)
JP (1) JP4888919B2 (ja)
WO (1) WO2008072500A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010092740A1 (ja) * 2009-02-10 2010-08-19 パナソニック株式会社 画像処理装置、画像処理方法、プログラムおよび集積回路
KR101710883B1 (ko) * 2009-11-04 2017-02-28 삼성전자주식회사 필터 정보를 이용한 영상 압축 장치 및 방법과 영상 복원 장치 및 방법
WO2011064932A1 (ja) * 2009-11-30 2011-06-03 三菱電機株式会社 画像符号化装置及び画像復号装置
EP2541938A4 (en) * 2010-02-24 2015-11-04 Sharp Kk Image Coding Device, Image Decoding Device and Data Structure
GB2525170A (en) * 2014-04-07 2015-10-21 Nokia Technologies Oy Stereo viewing
JP6641149B2 (ja) * 2015-10-07 2020-02-05 日本放送協会 映像符号化装置、映像復号装置及びプログラム
CN113329228B (zh) * 2021-05-27 2024-04-26 杭州网易智企科技有限公司 视频编码方法、解码方法、装置、电子设备及存储介质

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR970000683B1 (ko) 1993-05-31 1997-01-16 삼성전자 주식회사 해상도 가변 적응적 화상압축/복원방법 및 장치
JPH09200772A (ja) 1996-01-18 1997-07-31 Fuji Facom Corp 圧縮画像データ表示装置
JP3701825B2 (ja) 1999-11-01 2005-10-05 日本電信電話株式会社 動画像符号化方法、動画像符号化装置、動画像復号方法、動画像復号装置、および動画像符号化、復号プログラムを記憶した記憶媒体
US6456663B1 (en) * 2000-03-29 2002-09-24 Matsushita Electric Industrial Co., Ltd. DCT domain down conversion system that compensates for IDCT mismatch
JP4151374B2 (ja) * 2002-03-29 2008-09-17 セイコーエプソン株式会社 動画像符号化装置および動画像符号化方法
EP1842379A4 (en) * 2005-01-25 2010-08-11 Samsung Electronics Co Ltd METHOD FOR EFFECTIVELY PREDICTING A MULTILAYER VIDEO FRAME, VIDEO ENCODING METHOD, AND APPARATUS USING THE SAME
JP2006295408A (ja) * 2005-04-07 2006-10-26 Matsushita Electric Ind Co Ltd 画像符号化装置及び画像符号化プログラム
US7876833B2 (en) * 2005-04-11 2011-01-25 Sharp Laboratories Of America, Inc. Method and apparatus for adaptive up-scaling for spatially scalable coding
KR100746007B1 (ko) 2005-04-19 2007-08-06 삼성전자주식회사 엔트로피 코딩의 컨텍스트 모델을 적응적으로 선택하는방법 및 비디오 디코더
AU2006201490B2 (en) * 2005-04-19 2008-05-22 Samsung Electronics Co., Ltd. Method and apparatus for adaptively selecting context model for entropy coding
JP2007288446A (ja) 2006-04-14 2007-11-01 Toshiba Corp 動画像復号装置

Also Published As

Publication number Publication date
EP2104359A4 (en) 2012-07-11
EP2104359A1 (en) 2009-09-23
US8306126B2 (en) 2012-11-06
WO2008072500A1 (ja) 2008-06-19
US20100080291A1 (en) 2010-04-01
JP4888919B2 (ja) 2012-02-29

Similar Documents

Publication Publication Date Title
CN111066326B (zh) 机器学习视频处理系统和方法
JP5658033B2 (ja) ビデオ信号処理方法及び装置
JP5289440B2 (ja) 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法
JP5134001B2 (ja) 下層のフィルタリングを備えたスケーラブルビデオ符号化
EP2805499B1 (en) Video decoder, video encoder, video decoding method, and video encoding method
KR102038243B1 (ko) 인코딩 방법 및 장치, 디코딩 방법 및 장치, 및 컴퓨터 판독가능 저장 매체
JP4888919B2 (ja) 動画像符号化装置および動画像復号装置
JP2009111691A (ja) 画像符号化装置及び符号化方法、画像復号化装置及び復号化方法
JP2007174634A (ja) 階層符号化装置、階層復号化装置、階層符号化方法、階層復号方法、階層符号化プログラム及び階層復号プログラム
JP2019017002A (ja) 映像符号化方法、映像復号方法、映像符号器及び映像復号器
JP6042899B2 (ja) 映像符号化方法および装置、映像復号方法および装置、それらのプログラム及び記録媒体
JP2013110518A (ja) 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
EP2034742A2 (en) Video coding method and device
JP4870120B2 (ja) 動画像階層符号化装置、動画像階層符号化方法、動画像階層符号化プログラム、動画像階層復号化装置、動画像階層復号化方法、および動画像階層復号化プログラム
JP2007013298A (ja) 画像符号化装置
CN106028031B (zh) 视频编码装置和方法、视频解码装置和方法
CN112075080A (zh) 帧内预测装置、图像编码装置、图像解码装置以及程序
KR101294364B1 (ko) 고화질 영상을 위한 무손실 영상 압축방법, 압축 해제방법 및 이를 적용한 전자기기
JP2009027693A (ja) 動画像圧縮符号化装置
JP4797999B2 (ja) 画像符号化・復号化装置
JP6265414B2 (ja) 映像符号化装置及び映像復号装置
JPWO2013001720A1 (ja) 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法
JP2008141407A (ja) 符号化方式変換装置及び符号化方式変換方法
JP6557483B2 (ja) 符号化装置、符号化システム、及びプログラム
JP2006191287A (ja) 画像符号化装置、画像符号化方法および画像符号化プログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110906

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111018

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111115

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111207

R150 Certificate of patent or registration of utility model

Ref document number: 4888919

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141222

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees