JP2009111691A - 画像符号化装置及び符号化方法、画像復号化装置及び復号化方法 - Google Patents

画像符号化装置及び符号化方法、画像復号化装置及び復号化方法 Download PDF

Info

Publication number
JP2009111691A
JP2009111691A JP2007281605A JP2007281605A JP2009111691A JP 2009111691 A JP2009111691 A JP 2009111691A JP 2007281605 A JP2007281605 A JP 2007281605A JP 2007281605 A JP2007281605 A JP 2007281605A JP 2009111691 A JP2009111691 A JP 2009111691A
Authority
JP
Japan
Prior art keywords
prediction
image
prediction direction
encoding
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007281605A
Other languages
English (en)
Inventor
Masashi Takahashi
昌史 高橋
Tomokazu Murakami
智一 村上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2007281605A priority Critical patent/JP2009111691A/ja
Priority to EP20080253486 priority patent/EP2063644A3/en
Priority to US12/260,332 priority patent/US20090110070A1/en
Priority to CNA2008101730561A priority patent/CN101426141A/zh
Publication of JP2009111691A publication Critical patent/JP2009111691A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】ブロック単位で画面内予測を行って予測差分を符号化・復号化する際に、予測方向を表すための符号量を減少させることにより圧縮効率の向上を図ることができる画像の符号化及び復号化を提供する。
【解決手段】画面内予測処理の対象となるブロックに隣接する符号化済みのブロックを利用して対象ブロックの予測方向を推定する。隣接するブロックの復号化画像のエッジ情報としてエッジの強度と角度を計算し、各予測方向に付いて、例えばニューラルネットワークを利用して計算した尤度のうち最も尤度の高い予測方向を対象ブロックにおける予測方向とすることで、予測方向を表す符号をストリームに付加する必要をなくして、符号量を大幅に削減し、圧縮効率が向上される。また、推定結果に基づいて可変長符号表を動的に作成することにより、予測方向を表す符号量を大幅に削減することもできる。
【選択図】図1

Description

本発明は動画や静止画のような画像を符号化する画像符号化技術及び画像を復号化する画像復号化技術に関する。
大容量の動画像情報をデジタルデータ化して記録、伝達する手法として、MPEG(Moving Picture Experts Group)方式等の符号化方式が策定され、MPEG−1規格、MPEG−2規格、MPEG−4規格、H.264/AVC(Advanced Video Coding)規格等として国際標準の符号化方式となっている。これらの方式はデジタル衛星放送やDVD、携帯電話やデジタルカメラなどにおける符号化方式として採用され、現在、ますます利用範囲が広がり、身近なものとなってきている。
これらの規格では、符号化処理が完了した画像情報を利用して符号化対象画像をブロック単位で予測し、原画像との予測差分を符号化することによって、動画像の持つ冗長性を除いて符号量を減らしている。特にH.264/AVCでは、符号化対象ブロックの周辺画素を利用する画面内予測符号化方式を採用することにより、劇的な圧縮率の向上を実現した。
H.264/AVCによる上記の画面内予測符号化方式では、符号化済みのブロックに含まれる画素の中から参照画素を1つ選び、特定の予測方向に沿った画素をすべてその値で予測する。このとき、予め定義された複数の予測方向の中から画像に適したものを選択可能にすることにより、予測精度を向上させている。しかしこの場合、予測単位となるブロックごとに予測方向を表すための符号を付加する必要があり、その付加の分、符号量が増大するといった問題があった。
この問題に対しては、例えば非特許文献1にて解決を試みている。この手法では、利用できる予測方向数の少ない画面端のブロックにおいて、予測方向を表すための符号を短くすることによって、符号量を減らしている。しかし、この手法は画面端のブロックにしか適用できず、圧縮効率向上の効果は少ない。
また、特許文献1には、予測方法に関するモード情報を削減することによって、効率的な復号処理を実現することを図った画像予測復号方法が提案されている。この画像予測復号方法においては、更に、符号化対象領域に隣接する既再生の画素信号からなる隣接領域に対応する既処理のデータに基づいて、所定の複数の予測方法の中から、隣接領域の画素信号相関の高い画面内予測信号を生成する予測方法を導き出している。既処理のデータを用いて予測方法(方向)に関するモード情報を復元している。
更に、特許文献2には、イントラ映像の色相成分を空間予測符号化、復号化する方法が開示されており、ビットストリームに予測モードが含まれていない場合に、復元された上位及び側面の参照ブロックを利用して現在ブロックに対する画素値の垂直及び水平方向の変化量を計算し、その変化量によって予測方法を決めている。
Jamil-ur-Rehman and Zhang Ye, "Efficient Techniques for Signalling Intra Prediction Modes of H.264/Mpeg-4 Part 10", Proc. ICICIC2006, August,2006. 特開2007−116351号公報(段落0009、0020、0027) 特開2004−129260号公報(段落0026)
そこで、圧縮効率を向上するため、画面内のすべてのブロックに対して予測方向を表すための符号量を減少させる点で解決すべき点がある。
本発明の目的は、予測方向を表すための符号量を減少させることにより圧縮効率を向上することにある。
本発明では、画面内予測処理の対象となるブロックに隣接する符号化済みのブロックを利用することによって対象ブロックの予測方向を推定する。例えば、対象ブロックの左側、左上側、上側、右上側に隣接する4つのブロックの復号化画像に対し、それぞれソーベルフィルタを作用させてエッジの強度と角度とを含むエッジ情報を計算する。当該計算で得られたこれら8つの強度と角度のパラメータを用いて各予測方向の尤度を計算し、最も尤度の高い予測方向を対象ブロックにおける予測方向とする。こうした予測方向を採用することにより、予測方向を表す符号をストリームに付加する必要がなくなる。
本発明は、例えばH.264/AVCのDC予測など、方向に依存しない画面内予測方式にも有効であり、符号量の大幅な削減が期待できる。また、推定結果に基づいて可変長符号表を動的に作成することにより、予測方向を表す符号量を大幅に削減することもできる。その結果、圧縮効率の向上が期待できる。なお、各予測方向の尤度計算には、例えばニューラルネットワークを利用すれば効果的である。
本発明によれば、少ない符号量で高画質の映像を提供するための画像符号化技術及び復号化技術を提供することができる。
以下、本発明の実施例を、図面を参照して説明する。
図3は、H.264/AVCによる画面内予測符号化処理の動作を説明する概念図である。H.264/AVCでは、符号化対象画像に対してラスタースキャンの順序に従って符号化を実行し(301)、符号化対象ブロックの左、左上、上、右上に隣接する符号化済みの4つのブロックの復号化画像を用いて予測を行う。
特に、予測にはこれらのブロックに含まれる13個の復号化された画素を利用し(302)、当該符号化対象ブロックに含まれる画素のうち、予測方向ベクトルを傾きとする同一直線上の画素はすべて同一画素から予測される。即ち、13個の画素は、当該四つのブロックに含まれる画素のうち当該符号化対象ブロックに隣接して並ぶ画素であり、左ブロックについては最右側縦列の4つの画素、左上ブロックについては右下コーナの1つの画素、上ブロック及び右上ブロックについてはそれぞれ最下側で横に並ぶ4つの画素である。予測については、例えば(303)に示すように、予測方向ベクトルの向きが下向きである場合には、符号化対象ブロックの縦4つの画素B、C、D、Eはすべて上ブロックの当該予測方向ベクトル上の同一画素(画素Bの直上の画素を復号化した値A’)を参照して予測符号化(値A’と同じ値として予測する)が行われる。画素B、C、D、Eについて、値A’との差分(予測差分)b、c、d、eが計算される。
H.264/AVCでは、上記の下向き予測方向ベクトルに限らず、縦、横、斜めなど、8種類の予測方向(図3中、0,1,3〜8の矢印で示す方向)候補の中から最適なものをブロック単位で選択することができる。ただし、H.264/AVCでは、上記特定の方向に沿った予測の他に、参照画素の平均値によって符号化対象ブロックに含まれるすべての画素を予測する「DC予測」を利用することができる(304)。DC予測には、予測方向2が与えられる。上記9種類の番号(8方向+DC予測)で区別して表される予測方法(以下では、「予測モード」と呼ぶ)の中からどのモードを選択したのかを示す情報は、予測差分とともに符号化される。
図4は、H.264/AVCによる画面内予測復号化処理の動作を説明する概念図である。復号化処理も符号化処理と同様にラスタースキャンの順序に従って復号化を実行し(401)、復号化済みの参照画素と予測差分を用いて符号化処理の逆手順を踏む。即ち、復号化対象ブロックにおいては、符号化の際に選択された予測モードに従い、当該予測方向に沿って、参照画素に予測差分(復号化された値)を足し合わせることによって復号化画像を取得する。例えば(402)では、復号化対象ブロックの予測差分b’、c’、d’、e’(それぞれ、上記図3に示されている予測差分b、c、d、eが復号化され量子化誤差を含んだもの)に対して、すべて復号化済みの参照画素A’との和を計算することにより、復号化画素B’、C’、D’、E’(それぞれ、上記図3のB、C、D、Eに対する復号化画素)を取得する過程を示している。
以上のように、H.264/AVCによる画面内予測符号化処理では、参照画素を1つだけ指定して予測方向に沿った画素をすべてその値で予測するといった単方向による方法を採用している。この場合、予測処理の単位となる符号化対象ブロックごとに、どの方向に予測を行うのかについての情報を付加する必要があった。
図5は、H.264/AVCによる画面内予測方式における予測モードの符号化方法について表している。H.264/AVCでは、符号化対象ブロックの予測モードが隣接するブロックの予測モードと相関が高いことに着目し、符号化済みの隣接ブロックにおける予測モードから符号化対象ブロックの予測モードを予測する。即ち、(501)に示すように、符号化対象ブロックの左側に隣接するブロックAの予測モードMAと、同じく符号化対象ブロックの上側に隣接するブロックBの予測モードMBを参照し、この2つの予測モードMA,MBのうち番号(図3(図4)に示す9種類の番号)が小さい方を符号化対象ブロックにおける予測モードの予測値(隣接モード)としている(502)。
図5の(503)は、予測方法を表すビット構成の詳細を示している。H.264/AVCでは、符号化対象ブロックにおける予測モードが隣接モードと同じ場合には、隣接モードと同じ予測モードか否かを示すフラグ(1ビット)によって隣接モードと同じであるという情報を符号化(当該フラグとして「1」の符号)する。一方、両者が異なる場合には、同フラグにて隣接モードと異なるという情報を符号化(当該フラグとして「0」の符号)した後、実際の予測モード(9通りの予測モードのうち、隣接モードを除く8通り)を3ビットで符号化する。この場合、予測モードを表すために多くの符号を必要とし、例えば4×4画素サイズのブロック単位で画面内予測を行った場合、一つのマクロブロックあたり最大で64ビットの符号が発生する。
図6は、本発明による予測モードの符号化に関する一実施例を示す概念図である。ここでは、(601)に示すように、符号化(復号化)対象ブロックに対してそれぞれ左側、上側、左上側、右上側に隣接する符号化済みの隣接ブロックA、B、C、Dの復号化画像を利用して対象ブロックの予測モードを推定する。例えば隣接ブロックA〜Dのエッジ情報を入力して対象ブロックの予測モードを出力する関数fを利用して予測モードを特定することにより(602)、予測モードを符号化する必要がなくなり、予測モードに必要なビット量は0となる(603)。
上記エッジの検出方法の種類については問わないが、例えば、図14に示すソーベルフィルタを利用すれば効果的である。ソーベルフィルタを利用する場合、垂直方向用のフィルタ(1401)及び水平方向用のフィルタ(1402)の2種類を用いて各方向のエッジを検出する。また、プレウィットフィルタを利用しても良い。この場合、垂直方向用のフィルタ(1403)や水平方向用のフィルタ(1404)の他にも、斜め方向用のフィルタ(1405)(1406)が用意されている。また、より単純なフィルタの利用例として、まず特定の大きさの矩形フィルタを用意し、その中の濃度値の最大値と最小値の差を計算するMIN−MAXフィルタの利用が考えられる。
図15は、ソーベルフィルタ(1401)(1402)を利用する場合のエッジ強度とエッジ角度を計算する方法について、その一例を示している。ここでは、符号化(復号化)対象ブロックに対してそれぞれ左側、上側、左上側、右上側に隣接する符号化済みの隣接ブロックA、B、C、Dの復号化画像に対して(1501)、それぞれ中心の4画素(1502)(画素1〜画素4)を取り出し(1503)、垂直方向用のフィルタ(1401)と水平方向用のフィルタ(1402)を適用させる。このとき、画素i(i=1,..,4)に水平方向用のフィルタと垂直方向用のフィルタを作用させた値をそれぞれfx(i)、fy(i)とすると、例えばエッジ強度は(1504)のように、エッジ角度は(1505)や(1506)のように計算できる。
対象ブロックの予測モードを出力するための関数fはどのようなものでも構わないが、例えばニューラルネットワークの機械学習機能を利用することによって実現することができる。図7は、ニューラルネットワークを利用して関数fを実現した場合の例について示している。ニューラルネットワークとは、複数の閾値論理ユニットを入力層から出力層まで階層的に配置したネットワークのことであり、フィードフォーワード型のネットワークでは、ユニット間の結合は隣接する層間でのみ存在し、かつ入力層から出力層へ向かう一方向である。結合されたユニット間には結合の重みが与えられ、上位階層のユニットへの入力は下位階層のユニット群が出力する値と結合の重みの積和となる。学習を行う際には、出力層で所望の結果が得られるようにこれらの重みを調整する。ここでは、隣接ブロックA〜Dのエッジ強度とエッジ角度を正規化して入力した際に(701)、予測モードn(n=0,1,..,8)の尤度がそれぞれ計算されて出力される(703)ように、あらかじめニューラルネットワーク(702)の学習を行っておく。このとき、最も高い尤度が出力されるモード番号を返す関数を上記関数fとして設定すれば(704)、図6にて示した方法による符号化及び復号化が可能になる。上記学習方法は特に問わないが、例えば誤差逆伝播法(BP法:Back Propagation method)を利用すれば大きな効果が見られる。BP法については、例えば次の文献の第3章に詳しく解説されている。
文献;石井健一郎, 上田修功, 前田英作, 村瀬洋:"わかりやすいパターン認識",オーム社, 1998.
関数fとしては、例えばエッジの強度や角度などを変数とする単純な多項式から、カーネル法、SVM(Support Vector Machine)、k近傍法、線形判別式分析、ベイズベット、隠れマルコフモデル、決定木学習などの機械学習手法を利用したものまで、幅広く考えられる。また、ブースティングを利用するなどの手段により、複数の識別機を組み合わせても良い。どのモデルを利用して関数fを実現するかについて、また、関数fがどのような入出力を行うのかについては規格によってあらかじめ定めておいても良いし、ストリームに関数fの情報を格納できるようにしても構わない。また、上記の実施例では変数として隣接ブロックにおける中心4画素のエッジの強度や角度を利用しているが、周辺ブロックの画素値平均や分散、標準偏差、符号化方法、予測モードなど、周辺ブロックの情報ならどのようなものを利用しても良いし、QP(Quantization Parameter:量子化パラメータ)や画面解像度など、符号化条件に関する画像パラメータを追加しても構わない。
図1は本発明による動画像符号化装置の一実施例を示すブロック図である。動画像符号化装置は、入力された原画像(101)を保持する原画像メモリ(102)と、入力された原画像を小領域に分割するブロック分割部(103)と、ブロック単位で動きを検出する動き探索部(104)と、画面内予測における予測方向を推定する予測モード推定部(105)と、ブロック単位で画面内予測を行う画面内予測部(106)と、動き探索部(104)にて検出された動き量を基にブロック単位で画面間予測を行う画面間予測部(107)と、画像の性質に合った予測符号化手段(予測方法及びブロックサイズ)を決定するモード選択部(108)と、予測差分を生成するための減算部(109)と、予測差分に対して符号化を行う周波数変換部(110)及び量子化部(111)と、記号の発生確率に応じた符号化を行うための可変長符号化部(112)と、一度符号化した予測差分を復号化するための逆量子化処理部(113)及び逆周波数変換部(114)と、復号化された予測差分を用いて復号化画像を生成するための加算部(115)と、復号化画像を保持して後の予測に活用するための参照画像メモリ(116)を有する。
原画像メモリ(102)は原画像(101)の中から一枚の画像を符号化対象画像として保持し、これをブロック分割部(103)にて細かなブロックに分割し、動き探索部(104)、画面内予測部(106)及び画面間予測部(107)に渡す。動き探索部(104)では、参照画像メモリ(116)に格納されている復号化済み画像を用いて該当ブロックの動き量を計算し、動きベクトルを画面間予測部(107)に渡す。予測方向推定部(105)では、対象ブロックの周辺に位置する符号化済みのブロックの復号化画像を参照画像メモリ(116)から取り出し、エッジ検出を行い対象ブロックの予測方向を特定して画面内予測部(106)に渡す。画面内予測部(106)及び画面間予測部(107)では画面内予測処理及び画面間予測処理をいくつかの大きさのブロック単位で実行し、モード選択部(108)にてどちらか最適な予測方法を選ぶ。
続いて減算部(109)では最適な予測符号化手段による予測差分を生成し、周波数変換部(110)に渡す。周波数変換部(110)及び量子化処理部(111)では、送られてきた予測差分に対して指定された大きさのブロック単位でそれぞれDCT(Discrete Cosine Transformation:離散コサイン変換)などの周波数変換及び量子化処理を行い、可変長符号化処理部(112)及び逆量子化処理部(113)に渡す。さらに可変長符号化処理部(112)では、周波数変換係数によって表される予測差分情報を、例えば画面内予測符号化における予測方向や画面間予測符号化における動きベクトルなど、予測復号化に必要な情報とともに、記号の発生確率に基づいて可変長符号化を行って符号化ストリームを生成する。また、逆量子化処理部(113)及び逆周波数変換部(114)では、量子化後の周波数変換係数に対して、それぞれ逆量子化及びIDCT(Inverse DCT :逆DCT )などの逆周波数変換を施し、予測差分を取得して加算部(115)に送る。続いて加算部(115)により復号化画像を生成して参照画像メモリ(116)に格納する。なお、予測方向推定部(105)では、特定の予測方向の外にも、例えばH.264/AVCのDC予測など、方向に依存しない画面内予測方式を推定の対象としてもよい。
図2は本発明による動画像復号化装置の一実施例を示すブロック図である。動画像復号化装置は、例えば図1に示す動画像符号化装置によって生成された符号化ストリーム(201)に対して可変長符号化の逆の手順を踏む可変長復号化部(202)と、予測差分を復号化するための逆量子化処理部(203)及び逆周波数変換部(204)と、画面内予測における予測方向を推定する予測モード推定部(205)と、画面内予測を行う画面内予測部(206)と、画面間予測を行う画面間予測部(207)と、復号化画像を取得するための加算部(208)と、復号化画像を一時的に記憶しておくための参照画像メモリ(209)を有する。
可変長復号化部(202)では、符号化ストリーム(201)を可変長復号化し、予測差分の周波数変換係数成分と、ブロックサイズや動きベクトルなど予測処理に必要な情報を取得する。前者の予測差分情報に対しては逆量子化処理部(203)に、後者の予測処理に必要な情報に対しては、予測手段に応じて画面内予測部(206)、又は画面間予測部(207)に送られる。続いて、逆量子化処理部(203)及び逆周波数変換部(204)では、予測差分情報に対してそれぞれ逆量子化と逆周波数変換を施して復号化を行う。また、予測方向推定部(205)では、対象ブロックの周辺に位置する符号化済みのブロックの復号化画像を参照画像メモリ(209)から取り出し、エッジ検出を行い対象ブロックの予測方向を特定して画面内予測部(206)に渡す。続いて画面内予測部(206)又は画面間予測部(207)では、可変長復号化部(202)から送られてきた情報を基に参照画像メモリ(209)を参照して予測処理を実行し、加算部(208)にて復号化画像を生成するとともに、復号化画像を参照画像メモリ(208)に格納する。このように、動画像復号化装置それ自身が、動画像符号化装置と同様に予測方向推定部(205)とそれに続く予測部(206)(207)を備えており、符号化ストリームから復号された信号から、動画像符号化装置の場合と同様にして対象ブロックの予測方向を特定し予測処理が実行される。したがって、符号化ストリームには予測モードを表す符号を付加する必要がなく、画像の符号化及び復号化に際して符号量を減少させることができる。
図8は、図1に示す動画像符号化装置の実施例における1フレームの符号化処理手順を示すフローチャートである。まず、符号化対象となるフレーム内に存在するすべてのブロックに対して(801)、以下の814までの各処理を繰り返すループ1の処理が行われる。ループ1の処理内では、更に、すべての符号化モードに対して処理(803)から処理(806又は807)までの各処理を繰り返すループ2の処理が行われる。即ち、該当ブロックに対して一度すべての符号化モード(予測方法とブロックサイズの組み合わせ)に対して予測符号化処理を行って予測差分を計算し、その中から最も符号化効率の高いものを選択する。上記予測処理方法としては、画面内予測符号化処理(806)や画面間予測符号化処理(807)を実行し、その中から最適なものを選ぶことによって、画像の性質に応じて効率良く符号化できる。ここで、画面内予測モード(803)である場合には、画面内予測符号化処理(806)を行う際には、ソーベルフィルタなどを利用して対象ブロックの周辺に位置する符号化済みのブロックに含まれるエッジを検出し(804)、例えば(704)に示す関数fなどを利用して予測方向を特定する(805)。多数の符号化モードの中から最も符号化効率の高いものを選択する際には(808)、例えば画質歪みと符号量の関係から最適な符号化モードを決定するRD−Optimization方式を利用することによって、効率良く符号化できる。RD−Optimization方式の詳細については次の文献に記載されている。
文献3;G. Sullivan and T.Wiegand : "Rate-Distortion Optimization for Video Compression", IEEE Signal Processing Magazine, vol.15, no.6, pp.74-90, 1998.
ループ2の処理が終了すると、続いて、選ばれた符号化モードで生成された予測差分に対して周波数変換(809)と量子化処理(810)を施し、さらに可変長符号化を行うことによって符号化ストリームを生成する(811)。一方、量子化済みの周波数変換係数に対しては、逆量子化処理(812)と逆周波数変換処理(813)を施して予測差分を復号化し、復号化画像を生成して参照画像メモリに格納する(814)。以上の処理をすべてのブロックに対して完了すれば、ループ1の処理が終了し、画像1フレーム分の符号化は終了する(815)。
図9は、図2に示す動画像復号化装置の実施例における1フレームの復号化処理手順を示すフローチャートである。まず、1フレーム内のすべてのブロックに対して、以下の処理(902)から処理(908又は909)までの各処理を繰り返すループ1の処理(901)が行われる。即ち、入力ストリームに対して可変長復号化処理を施し(902)、逆量子化処理(903)及び逆周波数変換処理(904)を施して予測差分を復号化する。続いて、対象ブロックがどの方法によって予測符号化されているかに応じて、画面内予測復号化処理(908)又は画面間予測復号化処理(909)を行い、復号化画像を取得して参照画像メモリに格納する。ここで、画面内予測復号化処理(908)を行う際には、ソーベルフィルタなどを利用して対象ブロックの周辺に位置する復号化済みのブロックに含まれるエッジを検出し(906)、例えば(704)に示す関数fなどを利用して予測方向を特定する(907)。以上の処理をフレーム中のすべてのブロックに対して完了すれば、ループ1の処理として画像1フレーム分の復号化が終了する(910)。
実施例では周波数変換の一例としてDCTを挙げているが、DST(Discrete Sine Transformation:離散サイン変換)、WT(Wavelet Transformation:ウェーブレット変換)、DFT(Discrete Fourier Transformation:離散フーリエ変換)、KLT(Karhunen-Loeve Transformation:カルーネン−レーブ変換)など、画素間相関除去に利用する直交変換であればどのような変換方法でも構わない。また、特に周波数変換を施さずに予測差分そのものに対して符号化を行っても構わない。さらに、可変長符号化も特に行わなくて良い。また、実施例では特に4×4画素サイズのブロック単位で輝度成分の予測を行う場合について記載しているが、例えば8×8画素サイズや16×16画素サイズなど、どのようなサイズのブロックに対して本発明を適用しても良いし、輝度成分以外にも、例えば色差成分に対する予測に本発明を適用しても良い。また、実施例ではH.264/AVCで定められている8方向に沿った予測を行っているが、方向数を増やしても減らしても構わない。
図10は、本発明による予測モードの符号化に対する別の実施例を示す概念図である。本実施例でも、図6に示した実施例と同様に、対象ブロックに対してそれぞれ左側、上側、左上側、右上側の隣接する符号化済みのブロックA、B、C、Dの復号化画像を用いて対象画像の予測方向を推定する(1001)。また、H.264/AVCと同様に、対象ブロックに対してそれぞれ左側と上側に隣接するブロックの予測モードのうち番号の小さい方を隣接モードとして定義する(1002)。ここで、本実施例では、隣接ブロックA〜Dのエッジ情報と予測モード番号pを入力して予測モードpの尤度を計算する関数gを利用し(1002)、各モードの尤度に基づいて可変長符号表を動的に作成する。即ち、尤度が高い予測モードには短い符号を割り当て、尤度が低い予測モードには長い符号を割り当てることによって、平均符号長を小さくする。可変長符号表の作り方はどのようなものでも構わないが、例えばハフマン符号化を利用すれば効果的である。(1004)では、対象ブロックにおける予測モードが隣接モードと同じかどうかを1ビットで表し、隣接モードと異なる場合には、隣接モードを除く8種類の予測モードに対する可変長符号表を作成し、その符号表に基づいて符号化するという実施例について説明している。また、(1005)では、対象ブロックにおける予測モードが隣接モードと同じかどうかによらず、9種類すべての予測モードに対する可変長符号表を作成し、その符号表に基づいて符号化を行うという実施例について述べている。
対象ブロックにおける予測モードpの尤度を出力する関数gはどのように実現しても構わないが、例えば図6の実施例と同様にニューラルネットワークの機械学習機能を利用することによって実現することができる。図11は、ニューラルネットワークを利用して関数gを実現した場合の例について示している。ここでも図7のニューラルネットワークと同様に、隣接ブロックA〜Dのエッジ強度とエッジ角度を正規化して入力した際に(1001)、予測モードn(n=0,1,..,8)の尤度がそれぞれ計算されて出力される(1103)ように、予めニューラルネットワーク(1103)の学習を行っておく。このとき、関数gとして、予測モードp(p=0,..,8)の尤度が出力される関数を設定すれば(1104)、図10にて示した方法による符号化及び復号化が可能になる。
図12及び図13は、(1005)に示す方法に基づき、ハフマン符号化を利用して予測モードを符号化した場合に、各予測モードに対して割り当てられる符号の例(可変長符号表)を示している。ここでは、隣接モードがモード8である場合について示している。H.264/AVCでは、対象ブロックが隣接モードと異なる場合、予測モードを符号化するためには4ビットの符号が必要であったのに対し、図12の例では、最小で3ビット(隣接モードとの異同のための1ビット+予測モードの番号のための2ビット(符号長m=2))に減少することができる。さらに、図13のように予測モードの尤度に偏りがある場合には、最小で2ビット(隣接モードとの異同のための1ビット+予測モードの番号のための1ビット(符号長m=1))にまで減少することができる。このように、推定された尤度に基づいて可変長符号表を動的に作成しても良いし、予め複数の可変長符号表を作成しておき、推定された尤度に基づいてそれらの符号表を使い分けても構わない。
本実施例は動画像を符号化する場合について述べているが、本発明は静止画像の符号化にも有効である。すなわち、図1のブロック図から動き探索部(104)と画面間予測部(107)を排除すれば、静止画像に特化した符号化装置のブロック図に相当する。また、本発明は、画像符号化装置と画像復号化装置とを組み合わせた画像処理(符号化・復号化)システム、あるいは画像符号化方法と画像復号化方法とを組み合わせた画像処理(符号化・復号化)方法としても実現し得るものである。
本発明による画像符号化装置の一実施例を示すブロック図。 本発明による画像復号化装置の一実施例を示すブロック図。 H.264/AVCで用いる画面内予測符号化処理の概念的な説明図。 H.264/AVCで用いる画面内予測復号化処理の概念的な説明図。 H.264/AVCで用いる予測モードの符号化処理の概念的な説明図。 本実施例で用いる予測モードの符号化処理の一実施例についての概念的な説明図。 予測モードの尤度計算に関する一実施例についての概念的な説明図。 本実施例で用いる画像符号化装置の流れ図。 本実施例で用いる画像復号化装置の流れ図。 本実施例で用いる予測モードの符号化処理の一実施例を説明する概念図。 予測モードの尤度計算に関する一実施例を説明する概念図。 可変長符号表に関する一例を示す表。 可変長符号表に関する別の一例を示す表。 エッジ検出に用いるフィルタの例を示す図。 エッジ情報の計算方法についての一例を示す概念図。
符号の説明
101…原画像 102…原画像メモリ
103…ブロック分割部 104…動き探索部
105…予測方向推定部 106…画面内予測部
107…画面間予測部 108…モード選択部
109…減算部 110…周波数変換部
111…量子化処理部 112…可変長符号化部
113…逆量子化処理部 114…逆周波数変換部
115…加算部 116…参照画像メモリ
201…符号化ストリーム 202…可変長復号化部
203…逆量子化処理部 204…逆周波数変換部
205…予測方向推定部 206…画面内予測部
207…画面間予測部 208…加算部
209…参照画像メモリ
301〜304…H.264/AVCによる画面内予測符号化処理の説明図
401〜402…H.264/AVCによる画面内予測復号化処理の説明図
501〜503…H.264/AVCによる予測モードの符号化処理に関する説明図
601〜603…本発明による予測モードの符号化処理に関する説明図
701…ニューラルネットワークへの入力 702…ニューラルネットワーク
703…ニューラルネットワークの出力 704…関数の入出力の関係
801〜815…フローチャートのブロック
901〜910…フローチャートのブロック
1001…ニューラルネットワークへの入力 1201…可変長符号表
1301…可変長符号表
1401〜1406…エッジ検出に用いるフィルタ
1501〜1506…エッジ情報の計算方法に関する説明図

Claims (24)

  1. ブロック単位で画面内予測を行って予測差分を計算する画面内予測符号化部と、画面内予測を行う際の予測方向を推定する予測方向推定部と、予測差分に対して符号化を行う周波数変換部及び量子化処理部と、可変長符号化を行うための可変長符号化部とを有し、
    前記予測方向推定部は、符号化対象となるブロックに隣接するブロックの復号化画像から前記予測方向を推定することを特徴とする画像符号化装置。
  2. 請求項1記載の画像符号化装置において、
    前記画面内予測符号化部は、前記予測差分を符号化し、前記予測方向推定部が推定した前記予測方向を符号化しないことを特徴とする画像符号化装置。
  3. 請求項1記載の画像符号化装置において、
    前記可変長符号化部は、前記予測方向推定部によって得られた予測方向の推定結果に基づいて可変長符号表を動的に作成し、作成された前記可変長符号表に基づいて前記予測方向を可変長符号化することを特徴とする画像符号化装置。
  4. 請求項1記載の画像符号化装置において、
    前記可変長符号化部は、前記予測方向推定部によって得られた予測方向の推定結果に基づいて、予め作成しておいた複数の可変長符号表の中から1つの予測方向を選択し、選択された前記予測方向を可変長符号化することを特徴とする画像符号化装置。
  5. 請求項1〜4のいずれか1項記載の画像符号化装置において、
    前記予測方向推定部は、前記符号化対象ブロックに隣接する前記ブロックの前記復号化画像のエッジ情報等の画像パラメータに基づいて前記予測方向を推定することを特徴とする画像符号化装置。
  6. 請求項5記載の画像符号化装置において、
    前記予測方向推定部は、前記画像パラメータの入力を受けて、下位階層のユニット群が出力する値と結合の重みの積和を上位階層のユニットへの入力とし、予測モードの尤度を出力するニューラルネットワークを備えており、前記尤度が最大となる前記予測モードを前記予測方向として推定することを特徴とする画像符号化装置。
  7. ブロック単位で画面内予測を行って予測差分を符号化する画像符号化方法において、
    符号化対象ブロックに隣接するブロックの復号化画像を利用して推定された予測方向に沿って画面内予測を行うことを特徴とする画像符号化方法。
  8. 請求項7記載の画像符号化方法において、
    画面内予測を行う際に推定された前記予測方向を符号化しないことを特徴とする画像符号化方法。
  9. 請求項7記載の画像符号化方法において、
    推定された前記予測方向に基づいて可変長符号表を動的に作成し、作成された前記可変長符号表に基づいて前記予測方向を可変長符号化することを特徴とする画像符号化方法。
  10. 請求項7記載の画像符号化方法において、
    推定された前記予測方向に基づいて、予め作成しておいた複数の可変長符号表の中から1つの予測方向を選択し、選択された前記予測方向を可変長符号化することを特徴とする画像符号化方法。
  11. 請求項7〜10のいずれか1項記載の画像符号化方法において、
    前記符号化対象ブロックに隣接する前記ブロックの前記復号化画像のエッジ情報等の画像パラメータに基づいて前記予測方向を推定することを特徴とする画像符号化方法。
  12. 請求項11記載の画像符号化方法において、
    前記画像パラメータの入力を受けて、下位階層のユニット群が出力する値と結合の重みの積和を上位階層のユニットへの入力とするニューラルネットワークによって、予測モードの尤度を出力し、前記尤度が最大となる前記予測モードを前記予測方向として推定することを特徴とする画像符号化方法。
  13. 可変長符号化の逆の手順を踏む可変長復号化部と、予測差分を復号化するための逆量子化処理部及び逆周波数変換部と、画面内予測を行って復号化画像を取得するための画面内予測復号化部とを有し、
    復号化対象ブロックに隣接するブロックの復号化画像を利用して、画面内予測を行う際の予測方向を推定する予測方向推定部を備えることを特徴とする画像復号化装置。
  14. 請求項13記載の画像復号化装置において、
    前記可変長復号化部は、符号化された予測方向が含まれていないブロックを含む符号化ストリームの入力を受けることを特徴とする画像復号化装置。
  15. 請求項13記載の画像復号化装置において、
    前記可変長復号化部は、前記予測方向推定部によって得られた予測方向の推定結果に基づいて可変長符号表を動的に作成し、作成された前記可変長符号表に基づいて前記予測方向を可変長復号化することを特徴とする画像復号化装置。
  16. 請求項13記載の画像復号化装置において、
    前記可変長復号化部は、前記予測方向推定部によって得られた予測方向の推定結果に基づいて、予め作成しておいた複数の可変長符号表の中から1つを選択し、選択された前記予測方向を可変長復号化することを特徴とする画像復号化装置。
  17. 請求項11〜14のいずれか1項記載の画像復号化装置において、
    前記予測方向推定部は、前記復号化対象ブロックに隣接する前記ブロックの前記復号化画像のエッジ情報等の画像パラメータに基づいて前記予測方向を推定することを特徴とする画像復号化装置。
  18. 請求項17記載の画像復号化装置において、
    前記予測方向推定部は、前記画像パラメータの入力を受けて、下位階層のユニット群が出力する値と結合の重みの積和を上位階層のユニットへの入力とし、予測モードの尤度を出力するニューラルネットワークを備えており、前記尤度が最大となる前記予測モードを前記予測方向として推定することを特徴とする画像復号化装置。
  19. ブロック単位で画面内予測を行って予測差分を復号化する画像復号化方法において、
    復号化対象ブロックに隣接するブロックの復号化画像を利用して推定された予測方向に沿って画面内予測を行うことを特徴とする画像復号化方法。
  20. 請求項19記載の画像復号化方法において、
    画面内予測を行う際に推定された前記予測方向を復号化しないことを特徴とする画像復号化方法。
  21. 請求項19記載の画像復号化方法において、
    推定された前記予測方向に基づいて可変長符号表を動的に作成し、作成された前記可変長符号表に基づいて前記予測方向を可変長復号化することを特徴とする画像復号化方法。
  22. 請求項19記載の画像復号化方法において、
    推定された前記予測方向に基づいて、予め作成しておいた複数の可変長符号表の中から1つの予測方向を選択し、選択された前記予測方向を可変長復号化することを特徴とする画像復号化方法。
  23. 請求項19〜22のいずれか1項記載の画像復号化方法において、
    前記復号化対象ブロックに隣接する前記ブロックの前記復号化画像のエッジ情報等の画像パラメータに基づいて前記予測方向を推定することを特徴とする画像復号化方法。
  24. 請求項23記載の画像符号化方法において、
    前記画像パラメータの入力を受けて、下位階層のユニット群が出力する値と結合の重みの積和を上位階層のユニットへの入力とするニューラルネットワークによって、予測モードの尤度を出力し、前記尤度が最大となる前記予測モードを前記予測方向として推定することを特徴とする画像復号化方法。
JP2007281605A 2007-10-30 2007-10-30 画像符号化装置及び符号化方法、画像復号化装置及び復号化方法 Pending JP2009111691A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2007281605A JP2009111691A (ja) 2007-10-30 2007-10-30 画像符号化装置及び符号化方法、画像復号化装置及び復号化方法
EP20080253486 EP2063644A3 (en) 2007-10-30 2008-10-27 Image encoding device and encoding method, and image decoding device and decoding method
US12/260,332 US20090110070A1 (en) 2007-10-30 2008-10-29 Image encoding device and encoding method, and image decoding device and decoding method
CNA2008101730561A CN101426141A (zh) 2007-10-30 2008-10-29 图像编码装置和编码方法,图像译码装置和译码方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007281605A JP2009111691A (ja) 2007-10-30 2007-10-30 画像符号化装置及び符号化方法、画像復号化装置及び復号化方法

Publications (1)

Publication Number Publication Date
JP2009111691A true JP2009111691A (ja) 2009-05-21

Family

ID=40512581

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007281605A Pending JP2009111691A (ja) 2007-10-30 2007-10-30 画像符号化装置及び符号化方法、画像復号化装置及び復号化方法

Country Status (4)

Country Link
US (1) US20090110070A1 (ja)
EP (1) EP2063644A3 (ja)
JP (1) JP2009111691A (ja)
CN (1) CN101426141A (ja)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009246975A (ja) * 2008-03-28 2009-10-22 Samsung Electronics Co Ltd 画像のイントラ予測モード情報の符号化及び/又は復号化方法及び装置
JP2011205259A (ja) * 2010-03-24 2011-10-13 Nippon Hoso Kyokai <Nhk> イントラ予測装置、符号化器、復号器及びプログラム
WO2012008125A1 (ja) * 2010-07-15 2012-01-19 三菱電機株式会社 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法
WO2012043678A1 (ja) * 2010-09-30 2012-04-05 シャープ株式会社 画像復号装置、画像符号化装置、および、データ構造
WO2012043766A1 (ja) * 2010-09-29 2012-04-05 シャープ株式会社 画像復号装置、画像符号化装置、および、符号化データのデータ構造
WO2012043676A1 (ja) * 2010-09-29 2012-04-05 シャープ株式会社 復号装置、符号化装置、および、データ構造
WO2012090413A1 (ja) 2010-12-27 2012-07-05 日本電気株式会社 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法及びプログラム
WO2012096174A1 (en) * 2011-01-13 2012-07-19 Canon Kabushiki Kaisha Image coding apparatus, image coding method and program, image decoding apparatus, and image decoding method and program
JP2012533209A (ja) * 2009-07-10 2012-12-20 サムスン エレクトロニクス カンパニー リミテッド 階層的映像符号化における空間予測方法及び装置
JP2013504972A (ja) * 2009-09-14 2013-02-07 トムソン ライセンシング イントラ予測モードの効率的なビデオ符号化及び復号化方法及び装置
WO2015133320A1 (ja) * 2014-03-05 2015-09-11 ソニー株式会社 画像符号化装置および方法
JP2016010603A (ja) * 2014-06-30 2016-01-21 株式会社東芝 医用画像処理装置およびx線ct装置
WO2016152446A1 (ja) * 2015-03-25 2016-09-29 Nttエレクトロニクス株式会社 動画像符号化装置
JP2018125718A (ja) * 2017-02-01 2018-08-09 日本放送協会 モード予測情報生成装置およびプログラム
WO2018199051A1 (ja) * 2017-04-25 2018-11-01 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法および復号方法
KR20190043930A (ko) * 2017-10-19 2019-04-29 삼성전자주식회사 머신 러닝을 사용하는 영상 부호화기 및 그것의 데이터 처리 방법
KR20200062322A (ko) * 2017-10-13 2020-06-03 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 블록 단위의 화상 코딩을 위한 인트라 예측 모드 개념
JPWO2019150435A1 (ja) * 2018-01-30 2020-11-19 富士通株式会社 映像符号化装置、映像符号化方法、映像復号装置、映像復号方法、及び映像符号化システム
JP2022003775A (ja) * 2018-06-19 2022-01-11 株式会社ソニー・インタラクティブエンタテインメント ニューラルネットワークを利用したコーデック

Families Citing this family (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090180701A1 (en) * 2008-01-10 2009-07-16 Seungyeob Choi Video Data Encoding System
TWI386068B (zh) * 2008-10-22 2013-02-11 Nippon Telegraph & Telephone 解塊處理方法、解塊處理裝置、解塊處理程式及記錄該程式之可由電腦讀取之記錄媒體
WO2010087157A1 (ja) * 2009-01-29 2010-08-05 パナソニック株式会社 画像符号化方法及び画像復号方法
KR101572462B1 (ko) * 2009-03-23 2015-11-27 가부시키가이샤 엔.티.티.도코모 화상 예측 부호화 장치, 화상 예측 부호화 방법, 화상 예측 부호화 프로그램, 화상 예측 복호 장치, 화상 예측 복호 방법, 및 화상 예측 복호 프로그램
KR101527085B1 (ko) * 2009-06-30 2015-06-10 한국전자통신연구원 인트라 부호화/복호화 방법 및 장치
KR101474756B1 (ko) 2009-08-13 2014-12-19 삼성전자주식회사 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치
CN102577379B (zh) 2009-10-05 2017-12-19 汤姆逊许可证公司 用于视频编码和译码中的嵌入量化参数调节的方法和装置
JP2011151682A (ja) * 2010-01-22 2011-08-04 Sony Corp 画像処理装置および方法
EP3506637A1 (en) * 2010-02-24 2019-07-03 Velos Media International Limited Image encoding device, image decoding device, and data structure
US20110274169A1 (en) * 2010-05-05 2011-11-10 Paz Adar Device, system, and method for spatially encoding video data
US8559512B2 (en) 2010-05-05 2013-10-15 Ceva D.S.P. Ltd. Device, system, and method for predicting residual data for intra and inter frame encoding of image or video data
ES2627431T3 (es) 2010-05-12 2017-07-28 Nippon Telegraph And Telephone Corporation Método y aparato de control de cantidad de código
US8902978B2 (en) 2010-05-30 2014-12-02 Lg Electronics Inc. Enhanced intra prediction mode signaling
CN103081471B (zh) 2010-07-15 2017-06-06 夏普株式会社 帧内预测模式估计装置、编码装置、以及解码装置
CN105898326B (zh) 2010-07-20 2019-01-29 株式会社Ntt都科摩 图像预测解码装置和图像预测解码方法
US8885704B2 (en) 2010-10-01 2014-11-11 Qualcomm Incorporated Coding prediction modes in video coding
US9490839B2 (en) 2011-01-03 2016-11-08 Qualcomm Incorporated Variable length coding of video block coefficients
HRP20221363T1 (hr) * 2011-01-07 2023-01-06 Lg Electronics Inc. Postupak kodiranja video informacija, postupak dekodiranja video informacija i uređaj za dekodiranje za dekodiranje video informacija
ES2459890B2 (es) * 2011-04-25 2015-06-05 Lg Electronics Inc. Método de predicción intra, y codificador y descodificador que lo usan
CA3082413C (en) * 2011-04-25 2022-01-25 Lg Electronics Inc. Intra-prediction method, and video encoder and decoder using same
GB2491391B (en) * 2011-06-02 2014-09-03 Canon Kk Encoding mode values representing prediction modes
US9654785B2 (en) 2011-06-09 2017-05-16 Qualcomm Incorporated Enhanced intra-prediction mode signaling for video coding using neighboring mode
RU2619706C2 (ru) * 2011-06-28 2017-05-17 Самсунг Электроникс Ко., Лтд. Способ и устройство для кодирования видео, а также способ и устройство для декодирования видео, сопровождаемого внутренним прогнозированием
US9516316B2 (en) 2011-06-29 2016-12-06 Qualcomm Incorporated VLC coefficient coding for large chroma block
US9338456B2 (en) 2011-07-11 2016-05-10 Qualcomm Incorporated Coding syntax elements using VLC codewords
WO2013014693A1 (ja) * 2011-07-22 2013-01-31 株式会社日立製作所 動画像復号化方法及び画像符号化方法
CN103931193B (zh) * 2011-09-21 2017-11-21 Lg电子株式会社 编码/解码图像的方法和装置
CN107820079B9 (zh) * 2011-10-18 2021-09-21 株式会社Kt 视频信号解码方法
CN103918265B (zh) * 2011-11-07 2018-09-18 英特尔公司 跨通道残余预测
CN103096060B (zh) * 2011-11-08 2017-03-29 乐金电子(中国)研究开发中心有限公司 帧内图像预测编解码的自适应环路滤波方法及装置
US20160132754A1 (en) * 2012-05-25 2016-05-12 The Johns Hopkins University Integrated real-time tracking system for normal and anomaly tracking and the methods therefor
US9532080B2 (en) 2012-05-31 2016-12-27 Sonic Ip, Inc. Systems and methods for the reuse of encoding information in encoding alternative streams of video data
US9374592B2 (en) * 2012-09-08 2016-06-21 Texas Instruments Incorporated Mode estimation in pipelined architectures
US9357210B2 (en) 2013-02-28 2016-05-31 Sonic Ip, Inc. Systems and methods of encoding multiple video streams for adaptive bitrate streaming
EP3032830A1 (en) * 2014-12-08 2016-06-15 Thomson Licensing Differential coding of intra modes
WO2016197317A1 (zh) * 2015-06-09 2016-12-15 富士通株式会社 拷贝信息的编解码方法、装置以及图像处理设备
KR102517615B1 (ko) * 2015-06-12 2023-04-04 파나소닉 아이피 매니지먼트 가부시키가이샤 화상 부호화 방법, 화상 복호 방법, 화상 부호화 장치 및 화상 복호 장치
JP2017099616A (ja) * 2015-12-01 2017-06-08 ソニー株式会社 手術用制御装置、手術用制御方法、およびプログラム、並びに手術システム
KR101974261B1 (ko) * 2016-06-24 2019-04-30 한국과학기술원 Cnn 기반 인루프 필터를 포함하는 부호화 방법과 장치 및 복호화 방법과 장치
FR3053555A1 (fr) * 2016-06-29 2018-01-05 B<>Com Procede de codage d'une image numerique, procede de decodage, dispositifs, terminal et programmes d'ordinateurs associes
US10623775B1 (en) * 2016-11-04 2020-04-14 Twitter, Inc. End-to-end video and image compression
WO2018099579A1 (en) * 2016-12-02 2018-06-07 Huawei Technologies Co., Ltd. Apparatus and method for encoding an image
US10542275B2 (en) 2016-12-28 2020-01-21 Arris Enterprises Llc Video bitstream coding
KR102651878B1 (ko) * 2017-07-06 2024-03-28 삼성전자주식회사 영상을 부호화 또는 복호화하는 방법 및 장치
JP2019041165A (ja) * 2017-08-23 2019-03-14 富士通株式会社 画像符号化装置、画像復号装置、画像処理方法、及び画像処理プログラム
EP3451670A1 (en) * 2017-08-28 2019-03-06 Thomson Licensing Method and apparatus for filtering with mode-aware deep learning
CN108289224B (zh) * 2017-12-12 2019-10-29 北京大学 一种视频帧预测方法、装置及自动补偿神经网络
US10687054B2 (en) * 2017-12-20 2020-06-16 Intel Corporation Decoupled prediction and coding structure for video encoding
EP3562162A1 (en) 2018-04-27 2019-10-30 InterDigital VC Holdings, Inc. Method and apparatus for video encoding and decoding based on neural network implementation of cabac
US10635939B2 (en) 2018-07-06 2020-04-28 Capital One Services, Llc System, method, and computer-accessible medium for evaluating multi-dimensional synthetic data using integrated variants analysis
US11474978B2 (en) 2018-07-06 2022-10-18 Capital One Services, Llc Systems and methods for a data search engine based on data profiles
CN112514388B (zh) * 2018-08-08 2022-10-25 富士通株式会社 编码装置、编码方法、解码装置
CN111131829B (zh) * 2018-10-31 2021-12-24 联发科技股份有限公司 视频编码装置及方法
US11601644B2 (en) * 2018-12-11 2023-03-07 Google Llc Image and video coding using machine learning prediction coding models
CN111641831B (zh) * 2019-03-01 2023-09-01 杭州海康威视数字技术股份有限公司 帧内预测方法、装置、设备及存储介质
US11876988B2 (en) * 2021-01-19 2024-01-16 Tencent America LLC Method and apparatus for task-adaptive pre-processing for neural image compression

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2681750A1 (fr) * 1991-09-20 1993-03-26 Thomson Csf Procede de compression d'images.
CN1232126C (zh) * 2002-09-30 2005-12-14 三星电子株式会社 图像编码方法和装置以及图像解码方法和装置
JP4542447B2 (ja) * 2005-02-18 2010-09-15 株式会社日立製作所 画像の符号化/復号化装置、符号化/復号化プログラム及び符号化/復号化方法
KR101037855B1 (ko) * 2005-07-22 2011-05-31 미쓰비시덴키 가부시키가이샤 화상 부호화 장치, 화상 복호 장치, 화상 부호화 방법 및 화상 복호 방법
US20080123947A1 (en) * 2005-07-22 2008-05-29 Mitsubishi Electric Corporation Image encoding device, image decoding device, image encoding method, image decoding method, image encoding program, image decoding program, computer readable recording medium having image encoding program recorded therein
JP2007116351A (ja) 2005-10-19 2007-05-10 Ntt Docomo Inc 画像予測符号化装置、画像予測復号装置、画像予測符号化方法、画像予測復号方法、画像予測符号化プログラム、及び画像予測復号プログラム
JP4769605B2 (ja) * 2006-03-17 2011-09-07 富士通株式会社 動画像符号装置及び方法

Cited By (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009246975A (ja) * 2008-03-28 2009-10-22 Samsung Electronics Co Ltd 画像のイントラ予測モード情報の符号化及び/又は復号化方法及び装置
JP2012533209A (ja) * 2009-07-10 2012-12-20 サムスン エレクトロニクス カンパニー リミテッド 階層的映像符号化における空間予測方法及び装置
US8767816B2 (en) 2009-07-10 2014-07-01 Samsung Electronics Co., Ltd. Spatial prediction method and apparatus in layered video coding
JP2014045515A (ja) * 2009-07-10 2014-03-13 Samsung Electronics Co Ltd 階層的映像符号化における空間予測方法及び装置
US9154798B2 (en) 2009-09-14 2015-10-06 Thomson Licensing Methods and apparatus for efficient video encoding and decoding of intra prediction mode
JP2013504972A (ja) * 2009-09-14 2013-02-07 トムソン ライセンシング イントラ予測モードの効率的なビデオ符号化及び復号化方法及び装置
JP2011205259A (ja) * 2010-03-24 2011-10-13 Nippon Hoso Kyokai <Nhk> イントラ予測装置、符号化器、復号器及びプログラム
TWI565307B (zh) * 2010-07-15 2017-01-01 三菱電機股份有限公司 動畫像編碼裝置、動畫像解碼裝置、動畫像編碼方法、動畫像解碼方法及記憶媒體
WO2012008125A1 (ja) * 2010-07-15 2012-01-19 三菱電機株式会社 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法
US9462271B2 (en) 2010-07-15 2016-10-04 Mitsubishi Electric Corporation Moving image encoding device, moving image decoding device, moving image coding method, and moving image decoding method
JP5656998B2 (ja) * 2010-07-15 2015-01-21 三菱電機株式会社 動画像復号装置及び動画像復号方法
WO2012043676A1 (ja) * 2010-09-29 2012-04-05 シャープ株式会社 復号装置、符号化装置、および、データ構造
WO2012043766A1 (ja) * 2010-09-29 2012-04-05 シャープ株式会社 画像復号装置、画像符号化装置、および、符号化データのデータ構造
WO2012043678A1 (ja) * 2010-09-30 2012-04-05 シャープ株式会社 画像復号装置、画像符号化装置、および、データ構造
WO2012090413A1 (ja) 2010-12-27 2012-07-05 日本電気株式会社 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法及びプログラム
US9270992B2 (en) 2011-01-13 2016-02-23 Canon Kabushiki Kaisha Image coding apparatus, image coding method and program, image decoding apparatus, and image decoding method and program
WO2012096174A1 (en) * 2011-01-13 2012-07-19 Canon Kabushiki Kaisha Image coding apparatus, image coding method and program, image decoding apparatus, and image decoding method and program
JPWO2015133320A1 (ja) * 2014-03-05 2017-04-06 ソニー株式会社 画像符号化装置および方法
WO2015133320A1 (ja) * 2014-03-05 2015-09-11 ソニー株式会社 画像符号化装置および方法
JP2016010603A (ja) * 2014-06-30 2016-01-21 株式会社東芝 医用画像処理装置およびx線ct装置
US9872654B2 (en) 2014-06-30 2018-01-23 Toshiba Medical Systems Corporation Medical image processing apparatus and X-ray CT apparatus
WO2016152446A1 (ja) * 2015-03-25 2016-09-29 Nttエレクトロニクス株式会社 動画像符号化装置
US11432005B2 (en) 2015-03-25 2022-08-30 Ntt Electronics Corporation Moving image encoding device
JP2016184801A (ja) * 2015-03-25 2016-10-20 Nttエレクトロニクス株式会社 動画像符号化装置
JP2018125718A (ja) * 2017-02-01 2018-08-09 日本放送協会 モード予測情報生成装置およびプログラム
WO2018199051A1 (ja) * 2017-04-25 2018-11-01 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法および復号方法
US11477485B2 (en) 2017-04-25 2022-10-18 Panasonic Intellectual Property Corporation Of America Encoder, decoder, encoding method, and decoding method
US11190804B2 (en) 2017-04-25 2021-11-30 Panasonic Intellectual Property Corporation Of America Encoder, decoder, encoding method, and decoding method
US11889066B2 (en) 2017-10-13 2024-01-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Intra-prediction mode concept for block-wise picture coding
JP2020537445A (ja) * 2017-10-13 2020-12-17 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ブロック単位の画像符号化のためのイントラ予測モード概念
KR20200062322A (ko) * 2017-10-13 2020-06-03 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 블록 단위의 화상 코딩을 위한 인트라 예측 모드 개념
US11363259B2 (en) 2017-10-13 2022-06-14 Fraunhofer-Gesellschaft Zur Förderung Der Angewandten Forschung E.V., München Intra-prediction mode concept for block-wise picture coding
JP7210568B2 (ja) 2017-10-13 2023-01-23 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ブロック単位の画像符号化のためのイントラ予測モード概念
KR102454936B1 (ko) 2017-10-13 2022-10-17 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 블록 단위의 화상 코딩을 위한 인트라 예측 모드 개념
US11694125B2 (en) 2017-10-19 2023-07-04 Samsung Electronics Co., Ltd. Image encoder using machine learning and data processing method of the image encoder
KR102535361B1 (ko) * 2017-10-19 2023-05-24 삼성전자주식회사 머신 러닝을 사용하는 영상 부호화기 및 그것의 데이터 처리 방법
KR20190043930A (ko) * 2017-10-19 2019-04-29 삼성전자주식회사 머신 러닝을 사용하는 영상 부호화기 및 그것의 데이터 처리 방법
US11218705B2 (en) 2018-01-30 2022-01-04 Fujitsu Limited Information processing device and video encoding method
JP6992825B2 (ja) 2018-01-30 2022-01-13 富士通株式会社 映像符号化装置、映像符号化方法、映像復号装置、映像復号方法、及び映像符号化システム
JPWO2019150435A1 (ja) * 2018-01-30 2020-11-19 富士通株式会社 映像符号化装置、映像符号化方法、映像復号装置、映像復号方法、及び映像符号化システム
JP7098805B2 (ja) 2018-06-19 2022-07-11 株式会社ソニー・インタラクティブエンタテインメント ニューラルネットワークを利用したコーデック
JP2022003775A (ja) * 2018-06-19 2022-01-11 株式会社ソニー・インタラクティブエンタテインメント ニューラルネットワークを利用したコーデック

Also Published As

Publication number Publication date
US20090110070A1 (en) 2009-04-30
CN101426141A (zh) 2009-05-06
EP2063644A2 (en) 2009-05-27
EP2063644A3 (en) 2009-09-30

Similar Documents

Publication Publication Date Title
JP2009111691A (ja) 画像符号化装置及び符号化方法、画像復号化装置及び復号化方法
US9058659B2 (en) Methods and apparatuses for encoding/decoding high resolution images
RU2696237C2 (ru) Способ декодирования видеосигнала
KR102355841B1 (ko) 모션 벡터 정제를 위한 검색 영역
JP5400798B2 (ja) 動画像復号化方法及び装置、動画像符号化方法及び装置
US20150010243A1 (en) Method for encoding/decoding high-resolution image and device for performing same
KR102140331B1 (ko) 인트라 예측 방법 및 그 장치
WO2010084692A1 (ja) 画像予測符号化装置、方法及びプログラム、画像予測復号装置、方法及びプログラム、並びに、符号化・復号システム及び方法
US9357219B2 (en) Video encoding apparatus and video decoding apparatus
JP2007166617A (ja) 映像のイントラ予測符号化、復号化方法及び装置
JP5717465B2 (ja) 動画像符号化装置及び動画像符号化方法
WO2011099428A1 (ja) 動きベクトル予測符号化方法、動きベクトル予測復号方法、動画像符号化装置、動画像復号装置およびそれらのプログラム
JP2011029863A (ja) 復号化処理方法
US20090028241A1 (en) Device and method of coding moving image and device and method of decoding moving image
JP2022000953A (ja) イントラ予測装置、画像符号化装置、画像復号装置、及びプログラム
JP2014007469A (ja) 画像符号化装置及び画像符号化方法
WO2016116984A1 (ja) 動画像符号化装置、動画像符号化方法および動画像符号化プログラム
JP5832263B2 (ja) 画像符号化装置及び画像符号化方法
JP2005244749A (ja) 動画像符号化装置
JP2009049969A (ja) 動画像符号化装置及び方法並びに動画像復号化装置及び方法
WO2009136475A1 (ja) 画像符号化装置及び画像符号化方法、画像復号化装置及び画像復号化方法
WO2010061515A1 (ja) 動画像符号化装置及び符号化方法、動画像復号化装置及び復号化方法
JP2013098715A (ja) 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法
WO2010100860A1 (ja) 動画像符号化方法及び動画像復号化方法