JP7273339B2 - 画像符号化方法、及び画像復号方法 - Google Patents

画像符号化方法、及び画像復号方法 Download PDF

Info

Publication number
JP7273339B2
JP7273339B2 JP2021528644A JP2021528644A JP7273339B2 JP 7273339 B2 JP7273339 B2 JP 7273339B2 JP 2021528644 A JP2021528644 A JP 2021528644A JP 2021528644 A JP2021528644 A JP 2021528644A JP 7273339 B2 JP7273339 B2 JP 7273339B2
Authority
JP
Japan
Prior art keywords
tree
color information
prediction
color
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021528644A
Other languages
English (en)
Other versions
JPWO2020261313A1 (ja
Inventor
志織 杉本
誠之 高村
淳 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
NTT Inc USA
Original Assignee
Nippon Telegraph and Telephone Corp
NTT Inc USA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, NTT Inc USA filed Critical Nippon Telegraph and Telephone Corp
Publication of JPWO2020261313A1 publication Critical patent/JPWO2020261313A1/ja
Application granted granted Critical
Publication of JP7273339B2 publication Critical patent/JP7273339B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/40Tree coding, e.g. quadtree, octree
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/94Vector quantisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、画像符号化方法、及び画像復号方法に関する。
一般的な画像符号化では、DCT(Discrete Cosine Transform;離散コサイン変換)、DST(Discrete Sine Transform;離散サイン変換)、及びウェーブレット変換等によって、画像領域から周波数領域への直交変換が行われてからエントロピー符号化が行われる。変換基底の次元と画像の次元とが同一であるため、変換の前後でデータの数は変わらず情報量は削減されないが、変換によってデータの分布が偏ることでエントロピー符号化による符号化効率が向上する。また、このとき主観的な画像品質への寄与率が低いといわれている高周波成分を荒く量子化することで、さらに情報量を削減することもできる。
また、特に複数の画像を効率的に圧縮する必要のある映像符号化では、より圧縮率を上げるため、画像を処理単位ブロックに分割し、被写体の空間的/時間的な連続性を利用してブロックごとにその画像信号を空間的/時間的に予測する。その予測方法を示す予測情報と、予測残差信号に対して上述の変換や量子化を行ったものとを符号化することで、画像信号そのものを符号化する場合に比べて大幅な符号化効率の向上が図られる。
画像/映像符号化の標準規格であるJPEG(Joint Photographic Experts Group)、H.264/MPEG(Moving Picture Experts Group)-4 AVC(Advanced Video Coding)、及びH.265/HEVC(High Efficiency Video Coding)では、DCTやDSTの係数を量子化する際のQP(Quantization Parameter;量子化パラメータ)が調整されることで発生符号量が制御される。一方で、QPの上昇に伴う高周波成分の欠落、またブロック境界に発生するブロック歪みが画像品質に影響を与え、対象となる画像によってはコンテキストに関わる情報が欠損する。
このように、一般的には画像を周波数領域に変換し量子化することで情報量を削減する方法が主流である。その一方で、別の方法として、画像に使われている色を並べたルックアップテーブル(色のセット)であるパレット(カラーパレット)と、画素ごとにテーブル参照のために割り当てられたインデックスとを符号化対象とする、パレット符号化と呼ばれる方法もある。パレット符号化は、画像中に出現する色の数が少ない場合、及び、DCT等の自然画像向けの変換基底で効率よく表現ができない場合における画像に対して主に用いられる。
H.265/HEVCでは、パレット符号化モードをスクリーンコンテンツのプロファイルのためのツールとして採用している。スクリーンコンテンツとは、コンピュータグラフィックスで生成された映像等、自然画ではない映像の総称である。HEVCでは、通常のパレットに対するインデックスの他に、隣接画素と同じ色を使用することを意味するコピーインデックスを定義している。従って、局所的に色数が少なく、かつ、多くの場合において同じ色が空間的に連続するスクリーンコンテンツに対しては、ブロックごとにパレット符号化モードを使用し、またコピーインデックスに短い符号長を割り当てることで、効率の良い圧縮が可能である。なお、HEVCのパレットコーディングについては、例えば、非特許文献1に詳しい。
一方で、画素のスキャン順が決まっており、スキャン順が前後に隣接している隣接画素同士の色が異なる場合、いくら近傍に同じ色が存在していても、コピーインデックスを使うことはできず、通常のパレットインデックスを使わざるを得ない。また、局所的に色数が多い場合は、パレットインデックスの情報量が増加するため、圧縮効率を期待することはできない。
W. Pu, M. Karczewicz, R. Joshi, V. Seregin, F. Zou, J. Sole, Y. C. Sun, T. D. Chuang, P. Lai, S. Liu, S. T. Hsiang, J. Ye, and Y. W. Huang, "Palette Mode Coding in HEVC Screen Content Coding Extension," IEEE Journal on Emerging and Selected Topics in Circuits and Systems, vol. 6, no. 4, pp. 420-432, 2016.
上述したように、隣接画素同士の色が異なる場合、及び、局所的に色数が多い場合には、パレット符号化の符号化効率が悪化する。
本発明は、このような事情に鑑みてなされたもので、効率的に符号化を行うことができる画像符号化方法及び画像復号方法を提供することを目的とする。
本発明の一態様は、符号化対象画像を符号化する場合に、画像を、画素又はブロックと、前記画素又は前記ブロックに割り当てられた色と、で表し、ブロック分割ツリーと、前記ブロック分割ツリーのルートノードと中間ノードとリーフノードとを含む全てのノードに割り当てられた色情報と、を符号化する画像符号化方法であって、前記符号化対象画像に対して任意の分割木による分割を行い、前記ブロック分割ツリーを生成する分割ツリー生成ステップと、前記ブロック分割ツリーの各ノードに対応する、分割途中のブロック又は分割終了後のブロックについて、前記分割途中のブロック又は前記分割終了後のブロックを代表する代表色を決定し、決定された前記色を前記各ノードに対応する色情報として割り当てる色情報決定ステップと、前記ブロック分割ツリーを符号化するツリー符号化ステップと、前記色情報を符号化する色情報符号化ステップと、を有する画像符号化方法である。
本発明により、効率的に符号化を行うことができる。
本発明の一実施形態における画像符号化装置100の構成を示すブロック図である。 本発明の一実施形態における画像符号化装置100の動作を示すフローチャートである。 本発明の一実施形態における画像復号装置200の構成を示すブロック図である。 本発明の一実施形態における画像復号装置200の動作を示すフローチャートである。
以下、本発明の一実施形態における画像符号化装置100及び画像復号装置200について説明する。
[画像符号化装置の機能構成]
以下、図1を参照して、画像符号化装置100の機能構成について説明する。図1は、本発明の一実施形態における画像符号化装置100の構成を示すブロック図である。画像符号化装置100は、図1に示すように、画像入力部101と、ツリー決定部102と、ツリー予測部103と、色決定部104と、色予測部105と、エントロピー符号化部106と、を備えている。
画像入力部101は、外部の装置から出力された、処理対象となる画像(以下、「符号化対象画像」という。)の入力を受け付ける。画像入力部101は、符号化対象画像を、ツリー決定部102、及び色決定部104へそれぞれ出力する。
ツリー決定部102は、画像入力部101から出力された、符号化対象画像を取得する。ツリー決定部102は、符号化対象画像からツリーベクトル(ブロック分割ツリー)を生成する。なお、ツリーは、二分木、三分木、又は四分木等、どのようなツリーでも構わないが、本実施形態においては説明を簡単にするため、一例として四分木であるものとする。ツリー決定部102は、符号化対象画像と、生成されたツリーベクトルとを、ツリー予測部103へ出力する。
ツリー予測部103は、ツリー決定部102から出力された符号化対象画像とツリーベクトルとを取得する。ツリー予測部103は、符号化対象画像とツリーベクトルとから、ツリー予測ベクトルとツリー圧縮ベクトルとを生成する。ツリー予測部103は、生成されたツリー予測ベクトルとツリー圧縮ベクトルとを、色決定部104、及び色予測部105へそれぞれ出力する。また、ツリー予測部103は、生成されたツリー圧縮ベクトルをエントロピー符号化部106へ出力する。
色決定部104は、画像入力部101から出力された符号化対象画像を取得する。また、色決定部104は、ツリー予測部103から出力された、ツリー予測ベクトルとツリー圧縮ベクトルとを取得する。色決定部104は、符号化対象画像とツリー予測ベクトルとツリー圧縮ベクトルとから、色ベクトルを生成する。色決定部104は、符号化対象画像と、生成された色ベクトルとを、色予測部105へ出力する。
色予測部105は、ツリー予測部103から出力された、ツリー予測ベクトルとツリー圧縮ベクトルとを取得する。また、色予測部105は、色決定部104から出力された、符号化対象画像と色ベクトルとを取得する。色予測部105は、符号化対象画像と色ベクトルとツリー予測ベクトルとツリー圧縮ベクトルとから、色圧縮ベクトルを生成する。色予測部105は、生成された色圧縮ベクトルをエントロピー符号化部106へ出力する。
エントロピー符号化部106は、ツリー予測部103から出力されたツリー圧縮ベクトルを取得する。また、エントロピー符号化部106は、色予測部105から出力された色圧縮ベクトルを取得する。エントロピー符号化部106は、ツリー圧縮ベクトルと色圧縮ベクトルとをエントロピー符号化する。エントロピー符号化部106は、符号を外部の装置へ出力する。
[画像符号化装置の動作]
以下、図2を参照して、画像符号化装置100の動作について説明する。図2は、本発明の一実施形態における画像符号化装置100の動作を示すフローチャートである。
まず、画像入力部101は、符号化対象画像の入力を受け付ける(ステップS101)。次に、ツリー決定部102は、符号化対象画像からツリーベクトルを生成する(ステップS102)。なお、上述したように、ツリーは、例えば二分木、三分木、又は四分木等、どのようなツリーであっても構わないが、以下の説明においては四分木であるものとする。
以下、説明を簡単にするため、符号化対象画像の画像サイズは、縦横それぞれ2Nであるものとして説明する。まず、ツリー決定部102は、符号化対象画像を四分割するか否かについての判定を行う。この判定において、どのような判定基準が用いられても構わない。例えば、最も単純な判定基準として、符号化対象画像の色数が閾値以上の場合に符号化対象画像の分割を行う、という判定基準を用いることができる。ここで、閾値を2とした場合、ロスレス圧縮(可逆圧縮)となる。
なお、ヒストグラムや、分散等の統計的情報を使用して判定がなされてもよい。あるいは、符号化対象画像の分割によって生じる、ツリー構造を示す情報及び色情報についての情報量と、他の情報量等(例えば、直交変換と量子化又はパレット符号化を行う場合に必要な情報量及び復号画像の品質)とのトレードオフを計算することによって、判定がなされてもよい。
ツリー決定部102は、符号化対象画像の分割を行った場合、ツリーのルートノードに分割を示すシンボルを割り当て、さらに4つの子ノードを生成する。そして、ツリー決定部102は、各子ノードについて順番に、上記と同様に、符号化対象画像を四分割するか否かについての判定を行う。符号化対象画像を分割しないことを示すシンボルをa、符号化対象画像を分割することを示すシンボルをbとした場合、ツリーベクトルは二値のベクトルとなる。
なお、判定の順番はどのような順番であってもよいが、本実施形態においては、説明を簡単にするため、深さを優先させた順番で判定が行われるものとする。例えば、ツリー決定部102は、あるノードにおいて符号化対象画像の分割が行われた場合には、さらに当該ノードの子ノードについての判定に移行する。また、ツリー決定部102は、あるノードにおいて分割が行われなかった場合には、未判定の兄弟ノード(並列するノード)について判定に移行する。なお、全ての兄弟ノードについての判定が完了した場合には、ツリー決定部102は、当該ノードの親ノードの兄弟ノードについての判定に移行する。
次に、ツリー予測部103は、符号化対象画像とツリーベクトルとから、ツリー予測ベクトルとツリー圧縮ベクトルとを生成する(ステップS103)。符号化対象画像にフラクタル性がある場合、画像のある部分集合が別の部分集合の縮小で表され、該当する部分を表す部分ツリー構造同士が、一致する、又は互いに回転や反転した関係になることがある。上述したように、深さ優先の探索によってツリー構造が作成された場合、互いに直系の親子関係にはない部分ツリー同士においては、前に符号化された方のツリー構造をコピー、回転、又は判定することによって、後に符号化される方のツリー構造(予測部分ツリー)を予測することができる。
なお、符号化対象画像が映像の中のある1フレームである場合には、ツリー予測部103は、他の復号済みのフレームにおいて使用したツリーベクトルを予測参照元として、同様の予測を行うようにしてもよい。
ある部分ツリーが、既に符号化済みのツリー構造の一部によって予測可能であるか否かについての判定は、ツリーベクトルが二値である場合、対象部分ツリーを表す部分ベクトルと、それまでに生成したツリーベクトルに対するビット演算とによって、高速に行うことが可能である。回転及び反転等の操作を伴う場合には、部分ベクトルを操作に応じて並べ替えてからビット演算を行うことによって判定が可能である。なお、その他、どのような判定方法が用いられてもよい。
ある部分ツリーが、他の部分ツリー(参照部分ツリー)を参照することによって予測される場合、ツリー予測部103は、参照先及び操作を特定するための予測情報(ツリー予測情報)に新たなシンボルを割当てて、元の部分ベクトルと交換して、ツリー圧縮ベクトルとしてもよい。又は、ツリー予測部103は、予測を用いることだけを表すシンボルを元の部分ベクトルと交換してツリー圧縮ベクトルとし、予測情報を別のベクトルによって表現するようにしてもよい。
なお、予測参照先を特定する情報は、画像上での座標情報であってもよいし、ツリーベクトル上のインデックスであってもよい。又は、予測参照先を特定する情報は、ツリー構造に基づきノードの深度を特定するための深度情報と当該深度内でのノード位置を示すインデックスとであってもよい。又は、予測参照先を特定する情報(ツリー予測情報)は、予測参照元の位置を表す同種の情報との差分(差分ツリー)であってもよい。また、ツリー予測部103は、予測情報ベクトルの情報量及び予測残差を表すベクトルの情報量と、元の予測対象ベクトルの情報量とを比較して、予測を行うかどうかを決定してもよい。
また、本実施形態においては、ツリー予測部103による処理を、色決定部104による処理の前に行っているが、これらの処理の順序を逆にしてもよい。この場合、色情報も参照元から予測されるものとして、最適な参照先が決定されるようにしてもよい。
次に、色決定部104は、符号化対象画像とツリー予測ベクトルとツリー圧縮ベクトルとから、色ベクトルを生成する(ステップS104)。色ベクトルは、ツリー予測ベクトルの全てのノードに対応する色情報からなるベクトルである。対応ノードがブロックである場合、色情報は、ブロック全体の平均値を示したものであってもよいし、中央値又は再頻値等の統計量であってもよい。
なお、後述する色情報予測の方法、及び対象ブロックの状態により、親ノードがどのような種類の情報を持つかによって、子ノードの予測性能が大きく変わることがある。したがって、各ノードが持つ種類の情報を示す情報が、別途付加情報として符号化されてもよい。
また、色決定部104による処理と色予測部10によるの処理とが同時に実行され、最適な種類の情報が選択されるようにしてもよい。また、色情報そのものの代わりに、パレットに対応するインデックスが用いられてもよい。また、対応ノードがブロックである場合、色情報そのものの代わりに、予め定められたパターン辞書のインデックスが用いられてもよい。
次に、色予測部105は、符号化対象画像と色ベクトルとツリー予測ベクトルとから、色予測ベクトルと色圧縮ベクトルとを生成する(ステップS105)。色予測ベクトル及び色圧縮ベクトルの生成の手順は、ツリー予測ベクトルの生成手順に依存する。本実施形態においては、説明を簡単にするため、ツリー予測ベクトルが、上述したように、深さ優先の探索で生成されていることとし、上記と同様にルートノードから深さ優先で予測が行われていくこととする。
なお、予測の方法はどのような方法であってもよい。例えば、予測の方法として、親ノードの色情報を使用して子ノード(符号化対象ノード)の予測を行い、予測値を色予測ベクトルに追加する親子間予測が考えられる。この場合、色予測部105は、親子間予測による予測値(色情報隣接予測値)と実際の色情報との差分(色情報隣接予測残差)を色圧縮ベクトルに追加するようにしてもよい。さらに、色予測部105は、その差分値を、既に符号化済みの他の兄弟ノードから予測し、予測された差分値(色情報ツリー間予測値)と実際の差分値との差分(色情報ツリー間予測残差)を、色圧縮ベクトルに追加するようにしてもよい。
又は、対象ノードを含む部分ツリーが他の部分ツリー(参照部分ツリー)を参照することによって予測されている場合、色予測部105は、その予測参照先の対応するノードの色情報を予測値とするようにしてもよい。
又は、色予測部105は、色情報そのものを予測値とせず、参照先ツリーの各ノードの親子間及び兄弟間の相関関係だけを継承し、当該相関関係を対象ノードの予測に利用するようにしてもよい。例えば、色予測部105は、参照先ノードの色情報と当該参照先ノードの親ノードの色情報との差を導出し、この差を対象ノードの親ノードの色情報に加算したものを対象ノードの予測値とするようにしてもよい。
又は、色情報としてパレットに対するインデックス値を使用している場合、色予測部105は、インデックスをそのまま継承し、パレットのみを対象ツリーに合わせて作成するようにしてもよい。
又は、色予測部105は、符号化対象画像が映像のある1フレームである場合に、他の復号済みのフレームの色情報を参照することによって、色情報を予測するようにしてもよい。
最後に、エントロピー符号化部106は、ツリー圧縮ベクトルと色圧縮ベクトルとをエントロピー符号化し、符号を出力する(ステップS106)。エントロピー符号化の方法はどのような方法あってもよい。また、ツリー及び色情報の並び順についても、任意である。例えば、エントロピー符号化部106は、ルートノードから順に、深度を優先してスキャンを行うようにしてもよい。又は、例えば、エントロピー符号化部106は、同じ深度に属するノードについて全て並べた後、さらに一段階深い深度について同様にスキャンを行うようにしてもよい。
なお、深度別にスキャンされる場合には、復号時にエントロピー復号が途中で打ち切られたとしても、既に復号した深度までの情報を用いて、低解像度画像を生成することが可能である。
[画像復号装置の機能構成]
以下、図3を参照して、画像復号装置200の機能構成について説明する。図3は、本発明の一実施形態における画像復号装置200の構成を示すブロック図である。画像復号装置200は、図3に示すように、符号入力部201と、エントロピー復号部202と、ツリー予測部203と、色予測部204と、画像再構成部205と、を備えている。
符号入力部201は、外部の装置から出力された、処理対象となる符号(以下、「復号対象符号」という。)の入力を受け付ける。符号入力部201は、復号対象符号を、エントロピー復号部202へ出力する。
エントロピー復号部202は、符号入力部201から出力された復号対象符号を取得する。エントロピー復号部202は、復号対象符号をエントロピー復号し、復号ツリー圧縮ベクトルと復号色圧縮ベクトルとを生成する。エントロピー復号部202は、生成された復号ツリー圧縮ベクトルをツリー予測部203へ出力する。また、エントロピー復号部202は、生成された復号色圧縮ベクトルを色予測部204へ出力する。
ツリー予測部203は、エントロピー復号部202から出力された復号ツリー圧縮ベクトルを取得する。ツリー予測部203は、復号ツリー圧縮ベクトルから復号ツリーベクトルを生成する。ツリー予測部203は、生成された復号ツリーベクトルを、色予測部204及び画像再構成部205へそれぞれ出力する。
色予測部204は、エントロピー復号部202から出力された復号色圧縮ベクトルを取得する。また、色予測部204は、ツリー予測部203から出力された復号ツリーベクトルを取得する。色予測部204は、復号色圧縮ベクトルと復号ツリーベクトルとから、復号色ベクトルを生成する。色予測部204は、生成された復号色ベクトルを画像再構成部205へ出力する。
画像再構成部205は、ツリー予測部203から出力された復号ツリーベクトルを取得する。また、画像再構成部205は、色予測部204から出力された復号色ベクトルを取得する。画像再構成部205は、復号ツリーベクトルと復号色ベクトルとから、復号画像を生成する。画像再構成部205は、生成された復号画像を外部の装置へ出力する。
[画像復号装置の動作]
以下、図4を参照して、画像復号装置200の動作について説明する。図4は、本発明の一実施形態における画像復号装置200の動作を示すフローチャートである。
まず、符号入力部201は、復号対象符号の入力を受け付ける(ステップS201)。次に、エントロピー復号部202は、復号対象符号をエントロピー復号し、復号ツリー圧縮ベクトルと復号色圧縮ベクトルとを生成する(ステップS202)。
次に、ツリー予測部203は、復号ツリー圧縮ベクトルから復号ツリーベクトルを生成する(ステップS203)。復号ツリーベクトルの生成の方法は、画像符号化装置100におけるツリー構造の生成方法に対応する方法であるならば、どのような方法であってもよい。別途付加情報が符号化されている場合には、ツリー予測部203は、当該付加情報それを復号して使用することができる。
なお、ツリー生成が途中で打ち切られるようにすることで、スケーラブル復号が実現されてもよい。この場合、全ての枝が同じ深度で打ち切られてもよいし、枝ごとに何らかの判定が行われて適切な深度で打ち切られるようにしてもよい。また、この場合、対応する復号色圧縮ベクトルが、上記の打ち切りの判定に用いられてもよい。又は、対応する復号色ベクトルの復号が同時に行われるようにし、復号色ベクトルの値が、上記の打ち切りの判定に用いられてもよい。
次に、色予測部204は、復号色圧縮ベクトルと復号ツリーベクトルとから、復号色ベクトルを生成する(ステップS204)。復号色ベクトルの生成の方法は、画像符号化装置100におけるの色情報の生成方法に対応する方法であるならば、どのような方法であってもよい。
最後に、画像再構成部205は、復号ツリーベクトルと復号色ベクトルとから、復号画像を生成し、出力する(ステップS205)。画像再構成部205は、復号ツリーベクトルの各リーフノードにおける対応画素又はブロックを特定し、対応する色情報を使用して対応画素の色を決定する。対応画素の色の決定の方法は、画像符号化装置100におけるツリー構造の生成方法と色情報の生成方法とに対応する方法であるならば、どのような方法であってもよい。
上述したように、復号色圧縮ベクトルの生成が途中で打ち切られている場合、画像再構成部205は、打ち切られた部分をリーフノードとして、通常通りそのリーフノードの色情報を用いて、対応画素の色を決定する。打ち切りが行われている場合、復号画像は、原画像と同じ解像度の画像として復号されてもよいし、又は、最も深いリーフノードに最小単位である1画素が割り当てられる低解像度の画像として復号されてもよい。
例えば、もし色情報としてブロック平均色が選択されており、かつ、全ての枝が同じ深度で打ち切られているケースで低解像度復号が行われると、復号される画像は、打ち切りがなされなかった場合の画像がハールウェーブレットでダウンサンプリングされたものになる。また、上記と同じケースで原解像度復号が行われると、ダウンサンプリング画像がアップサンプリングされたものになる。また、色情報としてブロック最頻値が使用されていた場合、原画像に対し最頻値フィルタでサンプリングが行われた画像が得られる。
なお、枝ごとに異なる深度で打ち切りがなされる場合、画像の領域ごとに品質をコントロールすることが可能となる。例えば、ROI(Region of Interest;対象領域)が設定され、当該ROIが優先的に復号されるようにすることが容易に実現される。
以上説明したように、本発明の一実施形態における画像符号化装置100による画像符号化方法は、符号化対象画像を符号化する場合に、画像を、画素又はブロックと、画素又はブロックに割り当てられた色と、で表し、ブロック分割ツリーと、ブロック分割ツリーのルートノードと中間ノードとリーフノードとを含む全てのノードに割り当てられた色情報と、を符号化する。当該画像符号化方法は、符号化対象画像に対して任意の分割木による分割を行い、ブロック分割ツリーを生成する分割ツリー生成ステップと、ブロック分割ツリーの各ノードに対応する、分割途中のブロック又は分割終了後のブロックについて、分割途中のブロック又は分割終了後のブロックを代表する代表色を決定し、決定された色を各ノードに対応する色情報として割り当てる色情報決定ステップと、ブロック分割ツリーを符号化するツリー符号化ステップと、色情報を符号化する色情報符号化ステップとを有する。
また、以上説明したように、本発明の一実施形態における画像復号装置200による画像復号方法は、符号データからツリー情報と色情報とを復号し、復号されたツリー情報と色情報とに基づいて画像を復号する。当該画像復号方法は、符号データから、分割ツリーを復号するツリー復号ステップと、符号データから、分割ツリーのルートノードと中間ノードとリーフノードとを含む全てのノードに対応する色情報を復号する色情報復号ステップと、分割ツリーと色情報とに基づいて画像を復号する画像復号ステップとを有する。
上記の構成を備えることにより、本実施形態における画像符号化装置100及び画像復号装置200は、任意の符号化対象画像を、画素又は画素の集合であるブロックと、画素又はブロックに割り当てられた色と、で表す。また、画像符号化装置100及び画像復号装置200は、ブロック分割を、二分木/三分木/四分木等のツリー構造と、中間ノードとリーフノードとを含めた各ノードが持つ色情報と、で表す。画像符号化装置100及び画像復号装置200は、親ノードと子ノードとの間での色情報予測、及び異なるツリー深度の間でのツリー構造の予測を行うことによって、隣接画素間だけでなく、広域な空間的予測を行うことができる。また、画像符号化装置100及び画像復号装置200は、既に復号済みの部分ツリーを参照してツリー構造予測を行うこともできる。画像符号化装置100及び画像復号装置200は、ツリー構造予測を、異なるツリー深度同士で行うことで、画像の持つフラクタル性を利用して、効率的な圧縮を行うことができる。
以上により、本発明の一実施形態における画像符号化装置100及び画像復号装置200は、符号化効率を向上させることができる。
上述した実施形態における画像符号化装置100と画像復号装置200を、コンピュータで実現するようにしてもよい。その場合、この機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。
また上記プログラムは、上述した機能の一部を実現するためのものであっても良く、さらに上述した機能をコンピュータシステムに既に記録されているプログラムとの組み合わせで実現できるものであってもよく、PLD(Programmable Logic Device)やFPGA(Field Programmable Gate Array)等のハードウェアを用いて実現されるものであってもよい。
以上、図面を参照して本発明の実施の形態を説明してきたが、上記実施の形態は本発明の例示に過ぎず、本発明が上記実施の形態に限定されるものではないことは明らかである。したがって、本発明の技術思想及び範囲を逸脱しない範囲で構成要素の追加、省略、置換、その他の変更を行ってもよい。
100・・・画像符号化装置、101・・・画像入力部、102・・・ツリー決定部、103・・・ツリー予測部、104・・・色決定部、105・・・色予測部、106・・・エントロピー符号化部、200・・・画像復号装置、201・・・符号入力部、202・・・エントロピー復号部、203・・・ツリー予測部、204・・・色予測部、205・・・画像再構成部

Claims (9)

  1. 符号化対象画像を符号化する場合に、画像を、画素又はブロックと、前記画素又は前記ブロックに割り当てられた色と、で表し、ブロック分割ツリーと、前記ブロック分割ツリーのルートノードと中間ノードとリーフノードとを含む全てのノードに割り当てられた色情報と、を符号化する画像符号化方法であって、
    前記符号化対象画像に対して任意の分割木による分割を行い、前記ブロック分割ツリーを生成する分割ツリー生成ステップと、
    前記ブロック分割ツリーの任意のノード以下のツリーである部分ツリーについて、既に符号化済みの他の部分ツリーである参照部分ツリーを参照して予測を行い、予測された前記部分ツリーである予測部分ツリーを生成するツリー予測ステップと、
    前記ブロック分割ツリーの各ノードに対応する、分割途中のブロック又は分割終了後のブロックについて、前記分割途中のブロック又は前記分割終了後のブロックを代表する代表色を決定し、決定された前記色を前記各ノードに対応する色情報として割り当てる色情報決定ステップと、
    前記ブロック分割ツリーの任意の前記部分ツリーのそれぞれのノードについて、前記参照部分ツリーに対応する前記色情報を参照して色情報ツリー間予測値を生成し、前記色情報ツリー間予測値と符号化対象ノードの色情報との差分である色情報ツリー間予測残差を生成する色情報ツリー間予測ステップと、
    前記参照部分ツリーを特定するツリー予測情報と、前記部分ツリーと前記予測部分ツリーとの差を特定する差分ツリーと、を符号化して前記ブロック分割ツリーを符号化するツリー符号化ステップと、
    前記参照部分ツリーを特定する色情報ツリー間予測情報と、前記色情報ツリー間予測残差と、を符号化して前記色情報を符号化する色情報符号化ステップと、
    を有する画像符号化方法。
  2. 任意の前記符号化対象ノードについて、前記符号化対象ノードの既に符号化済みである親ノード又は兄弟ノードの色情報を参照して色情報隣接予測値を生成し、前記符号化対象ノードの色情報と前記色情報隣接予測値との差分である色情報隣接予測残差を生成する色情報隣接予測ステップ
    をさらに備え、
    前記色情報符号化ステップは、前記色情報隣接予測残差を符号化対象とする
    請求項に記載の画像符号化方法。
  3. 前記画像に含まれる前記色情報、前記色情報隣接予測残差、及び前記色情報ツリー間予測残差に使用される色のセットであるカラーパレットを生成するカラーパレット生成ステップ
    をさらに備え、
    前記色情報符号化ステップは、前記カラーパレットと、前記カラーパレットに対応するインデックスと、を符号化する
    請求項に記載の画像符号化方法。
  4. 前記ツリー符号化ステップ及び前記色情報符号化ステップは、前記ブロック分割ツリー及び前記色情報を符号化する場合に、前記ブロック分割ツリーの深度別に符号化を行う
    請求項1から請求項のいずれか一項に記載の画像符号化方法。
  5. 前記色情報決定ステップは、前記ブロックに含まれる画素について、前記画素の再頻値を代表色として前記代表色をノードに対応する色情報として割り当てる
    請求項1から請求項のいずれか一項に記載の画像符号化方法。
  6. 符号データからツリー情報と色情報とを復号し、復号されたツリー情報と前記色情報とに基づいて画像を復号する画像復号方法であって、
    ブロック分割ツリーの任意のノード以下のツリーである部分ツリーについて、既に復号済みの他の部分ツリーである参照部分ツリーを特定するツリー予測情報と、前記参照部分ツリーに基づいて予測された前記部分ツリーである予測部分ツリーと前記部分ツリーとの差を特定する差分ツリーと、を復号して前記符号データから前記ブロック分割ツリーを復号するツリー復号ステップと、
    前記参照部分ツリーを参照して前記予測部分ツリーを生成し、前記予測部分ツリーと前記差分ツリーとから前記ブロック分割ツリーを生成するツリー予測ステップと、
    前記ブロック分割ツリーの任意の前記部分ツリーのそれぞれのノードについて、既に符号化済みの他の前記参照部分ツリーを特定する色情報ツリー間予測情報と、色情報ツリー間予測値と復号対象ノードの色情報との差分である色情報ツリー間予測残差と、を復号して前記符号データから前記ブロック分割ツリーのルートノードと中間ノードとリーフノードとを含む全てのノードに対応する色情報を復号する色情報復号ステップと、
    前記参照部分ツリーに対応する色情報を参照して色情報ツリー間予測値を生成し、前記色情報ツリー間予測値と前記色情報ツリー間予測残差とから前記色情報を生成する色情報ツリー間予測ステップと、
    前記ブロック分割ツリーと前記色情報とに基づいて前記画像を復号する画像復号ステップと、
    を有する画像復号方法。
  7. 色情報隣接予測ステップ
    をさらに有し、
    前記色情報復号ステップは、前記復号対象ノードの色情報と色情報隣接予測値との差分である色情報隣接予測残差を復号し、
    前記色情報隣接予測ステップは、任意の前記復号対象ノードについて、前記復号対象ノードの既に符号化済みの親ノード又は兄弟ノードの色情報を参照して前記色情報隣接予測値を生成し、前記色情報隣接予測値と前記色情報隣接予測残差とから前記色情報を生成する
    請求項に記載の画像復号方法。
  8. カラー割当ステップ
    をさらに有し、
    前記色情報復号ステップは、前記画像に含まれる、前記色情報、前記色情報隣接予測残差、又は前記色情報ツリー間予測残差に使用される色のセットであるカラーパレットと、各ノードにおける前記カラーパレットに対応するインデックスとを復号し、
    前記カラー割当ステップは、前記カラーパレットと前記インデックスとから前記各ノードの色情報を生成する
    請求項に記載の画像復号方法。
  9. 前記ツリー復号ステップ及び前記色情報復号ステップは、
    前記ブロック分割ツリー及び前記色情報を復号する場合に、前記ブロック分割ツリーの深度別に復号を行う
    請求項から請求項のいずれか一項に記載の画像復号方法。
JP2021528644A 2019-06-24 2019-06-24 画像符号化方法、及び画像復号方法 Active JP7273339B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2019/024859 WO2020261313A1 (ja) 2019-06-24 2019-06-24 画像符号化方法、及び画像復号方法

Publications (2)

Publication Number Publication Date
JPWO2020261313A1 JPWO2020261313A1 (ja) 2020-12-30
JP7273339B2 true JP7273339B2 (ja) 2023-05-15

Family

ID=74061556

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021528644A Active JP7273339B2 (ja) 2019-06-24 2019-06-24 画像符号化方法、及び画像復号方法

Country Status (3)

Country Link
US (1) US20220358685A1 (ja)
JP (1) JP7273339B2 (ja)
WO (1) WO2020261313A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116996687B (zh) * 2023-07-21 2024-07-26 深圳市战音科技有限公司 一种图像拆分编码方法、装置及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000092331A (ja) 1998-09-17 2000-03-31 Sony Corp 階層データの生成装置および方法、階層データの生成復元システムおよび方法
JP2003513538A (ja) 1999-10-22 2003-04-08 アクティブスカイ,インコーポレイテッド オブジェクト指向ビデオシステム
JP2005524319A (ja) 2002-04-30 2005-08-11 ヒューレット−パッカード デベロップメント カンパニー エル.ピー. 適応的な区画を通じた画像および画像シーケンスの圧縮

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5274718A (en) * 1991-09-30 1993-12-28 At&T Bell Laboratories Image representation using tree-like structures
JPH05250136A (ja) * 1992-03-04 1993-09-28 Fujitsu Ltd データ圧縮用辞書作成方法及び符号化方法
US6005981A (en) * 1996-04-11 1999-12-21 National Semiconductor Corporation Quadtree-structured coding of color images and intra-coded images
US8000547B2 (en) * 2005-09-23 2011-08-16 Slipstream Data Inc. Method, system and computer program product for providing entropy constrained color splitting for palette images with color-wise splitting
KR101484280B1 (ko) * 2009-12-08 2015-01-20 삼성전자주식회사 임의적인 파티션을 이용한 움직임 예측에 따른 비디오 부호화 방법 및 장치, 임의적인 파티션을 이용한 움직임 보상에 따른 비디오 복호화 방법 및 장치
CN104661038B (zh) * 2009-12-10 2018-01-05 Sk电信有限公司 使用树形结构的解码装置
JP5281624B2 (ja) * 2010-09-29 2013-09-04 日本電信電話株式会社 画像符号化方法,画像復号方法,画像符号化装置,画像復号装置およびそれらのプログラム
CN103460694B (zh) * 2011-03-10 2017-02-15 夏普株式会社 图像解码装置、图像编码装置以及编码数据的数据构造
JP5357199B2 (ja) * 2011-03-14 2013-12-04 日本電信電話株式会社 画像符号化方法,画像復号方法,画像符号化装置,画像復号装置,画像符号化プログラムおよび画像復号プログラム
US9467701B2 (en) * 2012-04-05 2016-10-11 Qualcomm Incorporated Coded block flag coding
US9558567B2 (en) * 2013-07-12 2017-01-31 Qualcomm Incorporated Palette prediction in palette-based video coding
US9883197B2 (en) * 2014-01-09 2018-01-30 Qualcomm Incorporated Intra prediction of chroma blocks using the same vector
US10382791B2 (en) * 2015-03-06 2019-08-13 Qualcomm Incorporated Data structure for video coding unit
WO2017205621A1 (en) * 2016-05-25 2017-11-30 Arris Enterprises Llc Jvet coding block structure with asymmetrical partitioning
CN107566848B (zh) * 2016-06-30 2020-04-14 华为技术有限公司 编解码的方法及装置
RU2753643C2 (ru) * 2017-01-31 2021-08-18 Шарп Кабусики Кайся Системы и способы для выполнения планарного кодирования видеосигналов с внутренним прогнозированием
CN108933941A (zh) * 2017-05-26 2018-12-04 富士通株式会社 图像编码方法和装置以及图像解码方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000092331A (ja) 1998-09-17 2000-03-31 Sony Corp 階層データの生成装置および方法、階層データの生成復元システムおよび方法
JP2003513538A (ja) 1999-10-22 2003-04-08 アクティブスカイ,インコーポレイテッド オブジェクト指向ビデオシステム
JP2005524319A (ja) 2002-04-30 2005-08-11 ヒューレット−パッカード デベロップメント カンパニー エル.ピー. 適応的な区画を通じた画像および画像シーケンスの圧縮

Also Published As

Publication number Publication date
JPWO2020261313A1 (ja) 2020-12-30
WO2020261313A1 (ja) 2020-12-30
US20220358685A1 (en) 2022-11-10

Similar Documents

Publication Publication Date Title
CN114631320B (zh) 对图像执行人工智能ai编码和ai解码的设备和方法
CN113545064B (zh) 用于处理视频内容的方法和装置及计算机可读存储介质
CN114467302B (zh) 针对点云压缩的基于块的预测编码
US12177493B2 (en) Use of embedded signalling for backward-compatible scaling improvements and super-resolution signalling
JP6351040B2 (ja) 層状の信号品質階層のおける信号処理およびインヘリタンスの方法、プログラム、及び、コンピュータシステム
TWI554082B (zh) 於視訊寫碼處理中用於係數階層寫碼之萊斯(rice)參數更新
CN104054342B (zh) 针对于hevc中的cabac的高吞吐量编码的方法和装置
KR101146162B1 (ko) 멀티-레벨 이미지의 적응 압축 용이 방법
JPWO2020066680A1 (ja) 画像処理装置および方法
WO2015194187A1 (en) Harmonized palette coding
JP2005333622A (ja) イメージおよびビデオの予測可逆符号化
CN108683916A (zh) 视频编解码方法、存储比特流方法、计算机可读存储介质
KR20120013324A (ko) 화상 처리 방법 및 장치
KR102012906B1 (ko) 디지털 이미지의 블록을 처리하는 시스템 및 방법
EP2171684A2 (en) Efficient image representation by edges and low-resolution signal
JP6426227B2 (ja) Hevcにおけるcabacに対する変換スキップブロックに対する高スループット残差符号化
KR102380579B1 (ko) 비디오 데이터에 관련된 신택스 엘리먼트를 나타내는 이진 심볼들의 시퀀스의 컨텍스트-적응적 이진 산술 코딩을 위한 방법 및 디바이스
CN111316642A (zh) 信令图像编码和解码划分信息的方法和装置
Chawla et al. Image compression techniques: a review
KR100908282B1 (ko) 단계적 가역 비디오 부호화 방법, 단계적 가역 비디오 복호 방법, 단계적 가역 비디오 부호화 장치, 단계적 가역 비디오 복호 장치, 이들의 프로그램의 기록 매체
JP7273339B2 (ja) 画像符号化方法、及び画像復号方法
CN114731447B (zh) 用于视频解码的方法和设备
Singh et al. A brief introduction on image compression techniques and standards
RU2856417C1 (ru) Способ кодирования коэффициентов, кодер и декодер
JP2005167991A (ja) メディアストリームを非ブロック化しコード変換する方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211026

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221018

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230328

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230410

R150 Certificate of patent or registration of utility model

Ref document number: 7273339

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350