JP2021536718A - 画像符号化/復号化方法及び装置 - Google Patents

画像符号化/復号化方法及び装置 Download PDF

Info

Publication number
JP2021536718A
JP2021536718A JP2021537423A JP2021537423A JP2021536718A JP 2021536718 A JP2021536718 A JP 2021536718A JP 2021537423 A JP2021537423 A JP 2021537423A JP 2021537423 A JP2021537423 A JP 2021537423A JP 2021536718 A JP2021536718 A JP 2021536718A
Authority
JP
Japan
Prior art keywords
block
prediction
mode
prediction mode
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021537423A
Other languages
English (en)
Other versions
JP7453236B2 (ja
JPWO2020050704A5 (ja
Inventor
キム、ギベク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
B1 Institute of Image Technology Inc
Original Assignee
B1 Institute of Image Technology Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by B1 Institute of Image Technology Inc filed Critical B1 Institute of Image Technology Inc
Publication of JP2021536718A publication Critical patent/JP2021536718A/ja
Publication of JPWO2020050704A5 publication Critical patent/JPWO2020050704A5/ja
Priority to JP2024032951A priority Critical patent/JP2024063178A/ja
Application granted granted Critical
Publication of JP7453236B2 publication Critical patent/JP7453236B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本発明に係る画像符号化/復号化方法及び装置は、対象ブロックの画面内予測モードを決定し、画面内予測モードに基づいて対象ブロックの予測ブロックを生成し、生成された予測ブロックを補正することができる。

Description

本発明は、画像符号化/復号化方法及び装置に関する。
インターネットと携帯端末の普及及び情報通信技術の発展に伴い、マルチメディアデータに対する利用が急増している。したがって、各種のシステムで画像予測を介して様々なサービスや作業を行うために、画像処理システムの性能及び効率の改善に対する必要性が大幅に増加しているが、このような雰囲気に呼応することができる研究開発の結果が不十分な実情である。
このように、従来技術の画像符号化/復号化方法及び装置では、画像処理、特に画像符号化又は画像復号化に対する性能改善が求められている。
本発明は、カラー成分による画面内予測モードの誘導方法及び装置を提供することを目的とする。
本発明は、画面内予測のための参照画素構成方法及び装置を提供することを目的とする。
本発明は、任意の画素を用いて画面内予測に補正を行う画像符号化/復号化方法及び装置を提供することを目的とする。
本発明による画像符号化/復号化方法及び装置は、対象ブロックの画面内予測モードを決定し、前記画面内予測モードに基づいて、前記対象ブロックの予測ブロックを生成し、前記予測ブロックを補正することができる。
本発明による画像符号化/復号化方法及び装置において、前記対象ブロックの画面内予測モードは、前記対象ブロックの状態情報に応じた予測モード候補群内のモードに決定できる。
本発明による画像符号化/復号化方法及び装置において、前記対象ブロックのカラー成分が輝度成分である場合、方向性モードと非方向性モードで構成された予測モード候補群を参照し、前記対象ブロックのカラー成分が色差成分である場合、方向性モード、非方向性モード、カラーモード又はカラーコピーモードのうちの少なくとも一つが支援される予測モード候補群を参照することができる。
本発明による画像符号化/復号化方法及び装置において、前記予測モード候補群は、各カテゴリーに含むことが可能な予測モードの最大個数又は優先順位を考慮して、複数のカテゴリーに分類できる。
本発明による画像符号化/復号化方法及び装置において、前記予測モード候補群は、非方向性モードと方向性モードを含む第1カテゴリー、及びカラーコピーモードを含む第2カテゴリーに分類できる。
本発明による画像符号化/復号化方法及び装置において、複数のカテゴリーのうちのいずれかを特定する第1情報を取得し、前記第1情報によるカテゴリー内で前記対象ブロックの画面内予測モードを特定する第2情報を取得することができる。
本発明による画像符号化/復号化方法及び装置において、前記対象ブロックの画面内予測モードは、前記第1情報及び前記第2情報に基づいて、前記特定されたカテゴリーから決定できる。
本発明による画像符号化/復号化方法及び装置において、前記第2情報は、前記第1情報によるカテゴリーに一つの予測モードのみが含まれている場合には取得されなくてもよい。
本発明による画像符号化/復号化方法及び装置において、前記画面内予測に使用される参照画素を構成するステップをさらに含み、前記参照画素は、復号化装置で支援される複数の参照画素ラインの全部又は一部に属することができる。
本発明による画像符号化/復号化方法及び装置において、前記構成された参照画素に加重フィルタ又は補間フィルタのうちの少なくとも一つを行うステップをさらに含むことができる。
本発明による画像符号化/復号化方法及び装置において、前記予測ブロックを補正するステップは、所定の符号化情報に基づいて選択的に行われ、前記符号化情報は、画像タイプ、カラー成分、状態情報、符号化モード、画面内予測モード、サブブロック単位の画面内予測が適用されるか否か、又は参照画素ラインのうちの少なくとも一つを含むことができる。
本発明によれば、画面内予測モードを効率よく誘導することができる。
本発明によれば、参照画素ラインの選択的利用と所定のフィルタリングを介して画面内予測の効率を向上させることができる。
本発明によれば、予測ブロックを補正することにより画面内予測の精度を向上させ、符号化性能を向上させることができる。
本発明の実施形態による画像符号化及び復号化システムを示す概念図である。 本発明の一実施形態による画像符号化装置を示すブロック構成図である。 本発明の一実施形態による画像復号化装置を示すブロック構成図である。 本発明のブロック分割部で取得することができる様々な分割形態を示す例示図である。 本発明の一実施形態に係る画面内予測での予測モードを示す例示図である。 本発明の一実施形態に係る対象ブロックとそれに隣接するブロックに関する配置図である。 本発明の一実施形態に係る画面内予測の補正方法を示すフローチャートである。 本発明の一実施形態による対象ブロック及び隣接ブロックの画素に関する配置図である。 本発明の一実施形態に係る多重参照画素ラインに基づく補正方法に関する例示図である。 本発明の一実施形態に係る画面内予測の補正方法を示すフローチャートである。 本発明の一実施形態に係る予測画素補正に使用される任意の画素に対する例示図である。 本発明の一実施形態に係る任意の画素に基づいて補正が行われる例示図である。
本発明による画像符号化/復号化方法及び装置は、対象ブロックの画面内予測モードを決定し、前記画面内予測モードに基づいて、前記対象ブロックの予測ブロックを生成し、前記予測ブロックを補正することができる。
本発明による画像符号化/復号化方法及び装置において、前記対象ブロックの画面内予測モードは、前記対象ブロックの状態情報に応じた予測モード候補群内のモードに決定できる。
本発明による画像符号化/復号化方法及び装置において、前記対象ブロックのカラー成分が輝度成分である場合には、方向性モードと非方向性モードで構成された予測モード候補群を参照し、前記対象ブロックのカラー成分が色差成分である場合には、方向性モード、非方向性モード、カラーモード又はカラーコピーモードのうちの少なくとも一つが支援される予測モード候補群を参照することができる。
本発明による画像符号化/復号化方法及び装置において、前記予測モード候補群は、各カテゴリーに含むことが可能な予測モードの最大個数又は優先順位を考慮して、複数のカテゴリーに分類できる。
本発明による画像符号化/復号化方法及び装置において、前記予測モード候補群は、非方向性モードと方向性モードを含む第1カテゴリー、及びカラーコピーモードを含む第2カテゴリーに分類できる。
本発明による画像符号化/復号化方法及び装置において、複数のカテゴリーのうちのいずれかを特定する第1情報を取得し、前記第1情報によるカテゴリー内で前記対象ブロックの画面内予測モードを特定する第2情報を取得することができる。
本発明による画像符号化/復号化方法及び装置において、前記対象ブロックの画面内予測モードは、前記第1情報及び前記第2情報に基づいて、前記特定されたカテゴリーから決定できる。
本発明による画像符号化/復号化方法及び装置において、前記第2情報は、前記第1情報によるカテゴリーに一つの予測モードのみが含まれている場合には取得されなくてもよい。
本発明による画像符号化/復号化方法及び装置において、前記画面内予測に使用される参照画素を構成するステップをさらに含み、前記参照画素は、復号化装置で支援される複数の参照画素ラインの全部又は一部に属することができる。
本発明による画像符号化/復号化方法及び装置において、前記構成された参照画素に加重フィルタ又は補間フィルタのうちの少なくとも一つを行うステップをさらに含むことができる。
本発明による画像符号化/復号化方法及び装置において、前記予測ブロックを補正するステップは、所定の符号化情報に基づいて選択的に行われ、前記符号化情報は、画像タイプ、カラー成分、状態情報、符号化モード、画面内予測モード、サブブロック単位の画面内予測が適用されるか否か、又は参照画素ラインのうちの少なくとも一つを含むことができる。
[発明の実施のための形態]
本発明は、様々な変更を加えることができ、様々な実施形態を有することができるので、特定の実施形態を図面に例示し、詳細な説明に詳細に説明する。ところが、これは本発明を特定の実施形態について限定するものではなく、本発明の思想及び技術範囲に含まれるすべての変更、均等物乃至代替物を含むものと理解されるべきである。
用語「第1」、「第2」などは多様な構成要素の説明に使用できるが、これらの構成要素は上記の用語によって限定されてはならない。これらの用語は、一つの構成要素を他の構成要素から区別する目的にのみ使われる。例えば、本発明の権利範囲から外れることなく、第1構成要素は第2構成要素と命名することができ、これと同様に、第2構成要素も第1構成要素と命名することができる。用語「及び/又は」は、複数の関連した記載項目の組み合わせ又は複数の関連した記載項目のいずれかを含む。
ある構成要素が他の構成要素に「連結されて」いる或いは「接続されて」いるとした場合には、その他の構成要素に直接連結されている或いは接続されていることもあるが、それらの間に別の構成要素が介在することもあると理解されるべきである。これに対し、ある構成要素が他の構成要素に「直接連結されて」いる或いは「直接接続されて」いるとした場合には、それらの間に別の構成要素が介在しないと理解されるべきである。
本発明で使用した用語は、単に特定の実施形態を説明するために使われたものであり、本発明を限定するものではない。単数の表現は、文脈上明白に異なる意味ではない限り、複数の表現を含む。本発明において、「含む」又は「有する」などの用語は、明細書上に記載された特徴、数字、段階、動作、構成要素、部品又はこれらの組み合わせが存在することを指定するものであり、一つ又はそれ以上の他の特徴や数字、段階、動作、構成要素、部品又はこれらの組み合わせの存在又は付加可能性を予め排除しないと理解されるべきである。
他に定義されない限り、技術的又は科学的な用語を含めてここで使用されるすべての用語は、本発明の属する技術分野における通常の知識を有する者によって一般的に理解されるのと同一であることを意味する。一般的に使用される辞典に定義されている用語は、関連技術の文脈上持つ意味と一致するものと解釈されるべきであり、本発明で明らかに定義しない限り、理想的又は過度に形式的な意味で解釈されない。
通常、画像のカラーフォーマット(Color Format)に応じて一つ以上のカラー空間で構成できる。カラーフォーマットに応じて、一定の大きさを有する一つ以上のピクチャ、又は異なる大きさを有する一つ以上のピクチャで構成できる。一例として、YCbCrカラー構成において4:4:4、4:2:2、4:2:0、Monochrome(Yのみで構成)などのカラーフォーマットが支援できる。一例として、YCbCr4:2:0の場合、一つの輝度成分(本例では、Y)と二つの色差成分(本例では、Cb/Cr)で構成できる。このとき、色差成分と輝度成分の構成比は、横、横が1:2であり得る。一例として、4:4:4の場合は、横と縦が同じ構成比を持つことができる。上記の例のように一つ以上のカラー空間で構成される場合、ピクチャは、各カラー空間への分割を行うことができる。
画像は、画像タイプ(例えば、ピクチャタイプ、スライスタイプ、タイルグループタイプ、タイルタイプ、ブリックタイプなど)によってI、P、Bなどに分類することができるが、I画像タイプは、参照ピクチャを用いず、自体的に符号化される画像を意味することができ、P画像タイプは、参照ピクチャを用いて符号化を行うが、前方向予測のみを許容する画像を意味することができ、B画像タイプは、参照ピクチャを用いて符号化を行い、前/後方向予測を許容する画像を意味することができるが、符号化の設定に応じて、前記タイプの一部が結合(PとBを結合)されるか或いは他の構成の画像タイプが支援されてもよい。
本発明で発生する様々な符号化/復号化情報は、明示的(Explicit)又は黙示的(Implicit)な処理が可能である。ここで、明示的な処理は、符号化/復号化情報をシーケンス、スライス、タイルグループ、タイル、ブリック(Brick)、ブロック、サブブロックなどで生成し、これをビットストリームに収録することができ、復号化器で符号化器と同じレベルの単位で関連情報をパーシング(Parsing)して復号化情報に復元するものと理解することができる。ここで、黙示的な処理は、符号化/復号化情報を符号化器と復号化器で同じ過程や規則などで処理するものと理解することができる。
図1は本発明の実施形態による画像符号化及び復号化システムを示す概念図である。
図1を参照すると、画像符号化装置105及び復号化装置100は、パーソナルコンピュータ(PC:Personal Computer)、ノートパソコン、携帯端末(PDA:Personal Digital Assistant)、携帯型マルチメディアプレーヤー(PMP:Portable Multimedia Player)、プレイステーションポータブル(PSP:PlayStation Portable)、無線通信端末(Wireless Communication Terminal)、スマートフォン(Smart Phone)又はTVなどのユーザー端末であるか、或いはアプリケーションサーバーやサービスサーバなどのサーバ端末であり、各種機器又は有無線通信網との通信を行うための通信モデムなどの通信装置、画像を符号化又は復号化するためにインター又はイントラ予測するための各種プログラムとデータを格納するためのメモリ(memory、120、125)、又はプログラムを実行して演算及び制御するためのプロセッサ(processor、110、115)などを備える様々な装置を含むことができる。
また、画像符号化装置105によってビットストリームに符号化された画像は、リアルタイム又は非リアルタイムでインターネット、近距離無線通信システム、無線LAN網、WiBro網又は移動通信網などの有無線通信網(Network)などを介して、或いはケーブル又は汎用シリアルバス(USB:Universal Serial Bus)などの様々な通信インターフェースを介して画像復号化装置100に伝送されて画像復号化装置100で復号化されることにより画像に復元され、再生できる。また、画像符号化装置105によってビットストリームに符号化された画像は、コンピュータ可読記録媒体を介して画像符号化装置105から画像復号化装置100に伝達できる。
前述した画像符号化装置と画像復号化装置は、それぞれ別個の装置であり得るが、実現によって一つの画像符号化/復号化装置に作られてもよい。その場合、画像符号化装置の一部の構成は、画像復号化装置の一部の構成と実質的に同一の技術要素であって、少なくとも同じ構造を含むか、或いは少なくとも同じ機能を行うように実現できる。
したがって、以下の技術要素とこれらの作動原理などについての詳細な説明では、対応技術要素の重複説明を省略する。また、画像復号化装置は、画像符号化装置で行われる画像符号化方法を復号化に適用するコンピューティング装置に対応するので、以下の説明では、画像符号化装置を中心に説明する。
コンピューティング装置は、画像符号化方法及び/又は画像復号化方法を実現するプログラムやソフトウェアモジュールを格納するメモリと、メモリに接続され、プログラムを行うプロセッサとを含むことができる。ここで、画像符号化装置は符号化器、画像復号化装置は復号化器とそれぞれ呼ばれることがある。
図2は本発明の一実施形態による画像符号化装置を示すブロック構成図である。
図2を参照すると、画像符号化装置20は、予測部200、減算部205、変換部210、量子化部215、逆量子化部220、逆変換部225、加算部230、フィルタ部235、符号化ピクチャバッファ240、及びエントロピー符号化部245を含むことができる。
予測部200は、ソフトウェアモジュールである予測モジュール(prediction module)を用いて実現でき、符号化するブロックに対して画面内予測方式(Intra Prediction)や画面間予測方式(Inter Prediction)で予測ブロックを生成することができる。予測部200は、画像で現在符号化しようとする対象ブロック(Target Block)を予測して予測ブロックを生成することができる。言い換えれば、予測部200は、画像で符号化しようとする対象ブロックの各画素の画素値(pixel value)を画面内予測又は画面間予測によって予測して、生成された各画素の予測画素値(prediced pixel value)を有する予測ブロックを生成することができる。また、予測部200は、画面内予測モード又は画面間予測モードなどの予測モードに関する情報など、予測ブロックを生成するために必要な情報を符号化部へ伝達して、符号化部が予測モードに関する情報を符号化するようにすることができる。このとき、予測が行われる処理単位と、予測方法及び具体的な内容が定められる処理単位は、符号化の設定に応じて定められ得る。例えば、予測方法、予測モードなどは予測単位で決定され、予測の実行は変換単位で行われ得る。
画面間予測部で参照ピクチャに基づいて時間予測と空間予測に区分することができる。時間予測の場合は、現在ピクチャと時間的に異なるピクチャから動きを見付ける予測方法であり、空間予測の場合は、現在ピクチャと時間的に同じ現在ピクチャ(符号化が完了した領域。対象ブロックに隣接する所定の領域)で動きを見付ける予測方法であり得る。これは、参照ピクチャリストを介して統合管理するか、或いは符号化モードを区分して管理することができる。
また、画面間予測部で動き予測方法によって移動動きモデルと移動外の動きモデルに区分することができる。移動動きモデルの場合は、平行移動だけを考慮して予測を行い、移動外の動きモデルの場合は、平行移動だけでなく、回転、遠近、ズームイン/ズームアウト(Zoom in/out)などの動きを考慮して予測を行うことができる。単方向予測を仮定するとき、移動動きモデルの場合は一つの動きベクトルが必要であり得るが、移動外の動きモデルの場合は一つ以上の動き情報(例えば、一つの動きベクトル+回転角度/スケールファクタ、二つ以上の動きベクトルなど。次は、二つ以上の動きベクトルを使用すると仮定)が必要であり得る。移動外の動きモデルの場合は、各動きベクトルは、対象ブロックの左上側頂点、右上側頂点、左下側頂点などのように、対象ブロックの所定の位置に適用される情報であることができ、当該動きベクトルを介して対象ブロックの予測しようとする領域の位置を画素単位又はサブブロック単位(4×4、8×8のような2以上の整数)で取得することができる。画面間予測部は、前記動きモデルに応じて、後述する一部の過程は共通に適用でき、一部の過程は個別に適用できる。
画面間予測部は、参照ピクチャ構成部、動き推定部、動き補償部、動き情報決定部、動き情報符号化部を含むことができる。参照ピクチャ構成部は、現在ピクチャを中心に以前又は以後に符号化されたピクチャを参照ピクチャリストL0、L1に含むことができる。前記参照ピクチャリストに含まれている参照ピクチャから予測ブロックを取得することができ、符号化の設定に応じて現在画像も参照ピクチャで構成されて参照ピクチャリストのうちの少なくとも一箇所に含まれ得る。
画面間予測部における参照ピクチャ構成部は、参照ピクチャ補間部を含むことができ、補間精度に応じて小数単位の画素のための補間過程を行うことができる。例えば、輝度成分の場合は、8−tap DCTベースの補間フィルタを適用し、色差成分の場合は、4−tap DCTベースの補間フィルタを適用することができる。
画面間予測部における動き推定部は、対象ブロックとの相関性が高いブロックを参照ピクチャを介して探索する過程であり、FBMA(Full search−based block matching algorithm)、TSS(Three step search)などの様々な方法が使用でき、動き補償部は、動き推定過程を介して予測ブロックを取得する過程を意味する。
画面間予測部における動き情報決定部は、対象ブロックの最適の動き情報を選定するための過程が行われ得る。動き情報は、スキップモード(Skip Mode)、マージモード(Merge Mode)、競争モード(Competition Mode)などの動き情報符号化モードによって符号化できる。前記モードは、動きモデルに応じて支援されるモードが結合されて構成でき、スキップモード(移動)、スキップモード(移動外)、マージモード(移動)、マージモード(移動外)、競争モード(移動)、競争モード(移動外)がそれに対する例になることができる。符号化の設定に応じて前記モードの一部が候補群に含まれ得る。
前記動き情報符号化モードは、少なくとも一つの候補ブロックから対象ブロックの動き情報(動きベクトル、参照ピクチャ、予測方向など)の予測値を取得することができ、二つ以上の候補ブロックが支援される場合には、最適の候補選択情報が発生することができる。スキップモード(残差信号なし)とマージモード(残差信号あり)は、前記予測値をそのまま対象ブロックの動き情報として使用することができ、競争モードは、対象ブロックの動き情報と前記予測値との差分値情報が発生することができる。
対象ブロックの動き情報予測値のための候補群は、動き情報符号化モードに応じて適応的であり、多様な構成を持つことができる。対象ブロックに空間的に隣接するブロック(例えば、左、上、左上、右上、左下ブロックなど)の動き情報が候補群に含まれることができ、時間的に隣接するブロック(例えば、対象ブロックと対応又は相応する他の画像内のブロック<中央>を含めて左、右、上、下、左上、右上、左下、右下ブロックなど)の動き情報が候補群に含まれることができ、空間的候補と時間的候補の混合動き情報(例えば、空間的に隣接するブロックの動き情報と時間的に隣接するブロックの動き情報を用いて二つ以上の候補の平均値、中央値などで取得される情報。対象ブロック又は対象ブロックのサブブロック単位で動き情報を取得することができる)などが候補群に含まれることができる。
動き情報予測値候補群の構成のための優先順位が存在することができる。前記優先順位に従って、予測値候補群の構成に含まれる順序が定められることができ、前記優先順位に従って候補群の個数(動き情報符号化モードに応じて定められる)だけ満たされると、候補群の構成を完了することができる。このとき、空間的に隣接するブロックの動き情報、時間的に隣接するブロックの動き情報、空間的候補と時間的候補の混合動き情報順に優先順位が定められることができるが、その他の変形も可能である。
例えば、空間的に隣接するブロックは、左−上−右上−左下−左上ブロックなどの順序で候補群に含むことができ、時間的に隣接するブロックは、右下−中−右−下ブロックなどの順序で候補群に含むことができる。
減算部205は、対象ブロックから予測ブロックを減算して残差ブロック(residual block)を生成することができる。つまり、減算部205は、符号化しようとする対象ブロックの各画素の画素値と、予測部を介して生成された予測ブロックの各画素の予測画素値との差を計算して、ブロック形状の残差信号(residual signal)である残差ブロックを生成することができる。また、減算部205は、後述するブロック分割部を介して取得されたブロック単位以外の単位に基づいて残差ブロックを生成することもできる。
変換部210は、空間領域に属する信号を、周波数領域に属する信号に変換することができる。変換過程を経て取得される信号を変換係数(Transformed Coeffcient)という。例えば、減算部から伝達された残差信号を有する残差ブロックを変換して、変換係数を有する変換ブロックを取得することができるが、入力された信号は符号化の設定に応じて決定され、これは残差信号に限定されない。
変換部は、残差ブロックをアダマール変換(Hadamard Transform)、離散サイン変換(DST Based−Transform:Discrete Sine Transform)、離散コサイン変換(DCT Based−Transform:Discrete Cosine Transform)などの変換技法を用いて変換することができ、これに限定されず、これを改良及び変形させた様々な変換技法が使用できる。
前記変換技法のうちの少なくとも一つの変換技法が支援でき、各変換技法で少なくとも一つの詳細変換技法が支援できる。このとき、前記詳細変換技法は、各変換技法で基底ベクトルの一部が異なるように構成される変換技法であり得る。
例えば、DCTの場合は、DCT−1〜DCT−8のうちの一つ以上の詳細変換技法が支援でき、DSTの場合は、DST−1〜DST−8のうちの一つ以上の詳細変換技法が支援できる。前記詳細変換技法の一部を構成して変換技法候補群を構成することができる。一例として、DCT−2、DCT−8、DST−7を変換技法候補群として構成して変換を行うことができる。
変換は、水平/垂直方向に行われ得る。例えば、DCT−2の変換技法を用いて水平方向に1次元変換を行い、DST−7の変換技法を用いて垂直方向に1次元変換を行って合計2次元変換を行うことにより、空間領域の画素値を周波数領域に変換することができる。
固定的な一つの変換技法を用いて変換を行うことができるか、或いは符号化の設定に応じて変換技法を適応的に選択して変換を行うことができる。このとき、適応的な場合には、明示的又は黙示的な方法を用いて変換技法を選択することができる。明示的な場合には、水平、垂直方向に適用されるそれぞれの変換技法選択情報又は変換技法セット選択情報がブロックなどの単位で発生することができる。黙示的な場合は、画像タイプ(I/P/B)、カラー成分、ブロックの大きさ/形状/位置、画面内予測モードなどに応じて符号化の設定が定義でき、これにより所定の変換技法が選択できる。
また、符号化の設定に応じて前記一部の変換が省略される場合が可能である。つまり、明示的又は黙示的に水平/垂直単位のうちの一つ以上を省略することができることを意味する。
変換部は、変換ブロックを生成するために必要な情報を符号化部へ伝達してこれを符号化するようにすることができ、それによる情報をビットストリームに収録してこれを復号化器へ伝送し、復号化器の復号化部は、これに対する情報をパーシングして逆変換過程に使用することができる。
量子化部215は、入力された信号を量子化することができる。この時、量子化過程を経て取得される信号を量子化係数(Quantized Coefficient)という。例えば、変換部から伝達された残差変換係数を有する残差ブロックを量子化して、量子化係数を有する量子化ブロックを取得することができるが、入力された信号は符号化の設定に応じて決定され、これは残差変換係数に限定されない。
量子化部は、変換された残差ブロックをデッドゾーン均一境界量子化(Dead Zone Uniform Threshold Quantization)、量子化重みマトリックス(Quantization Weighted Matrix)などの量子化技法を用いて量子化することができ、これに限定されず、これを改良及び変形させた様々な量子化技法が使用できる。
符号化の設定に応じて、量子化過程は省略することができる。例えば、符号化の設定(例えば、量子化パラメータが0。すなわち、無損失圧縮環境)に応じて量子化過程を省略(逆過程も含む)することができる。他の例として、画像の特性に応じて量子化による圧縮性能が発揮されない場合には量子化過程を省略することができる。このとき、量子化ブロック(M×N)における、量子化過程が省略される領域は、全体領域又は一部領域(M/2×N/2、M×N/2、M/2×Nなど)であり、量子化省略選択情報は、黙示的又は明示的に定められ得る。
量子化部は、量子化ブロックを生成するために必要な情報を符号化部へ伝達してこれを符号化するようにすることができ、それによる情報をビットストリームに収録してこれを復号化器へ伝送し、復号化器の復号化部は、これに対する情報をパーシングしてこれを逆量子化過程に使用することができる。
上記例では、変換部と量子化部を介して残差ブロックを変換し量子化するという仮定の下に説明したが、残差信号を変換して、変換係数を有する残差ブロックを生成し、量子化過程を行わなくてもよく、残差ブロックの残差信号を変換係数に変換せずに量子化過程のみを行うことができるだけでなく、変換と量子化過程の両方を行わなくてもよい。これは符号化器の設定に応じて決定できる。
逆量子化部220は、量子化部215によって量子化された残差ブロックを逆量子化する。つまり、逆量子化部220は、量子化周波数係数列を逆量子化して、周波数係数を有する残差ブロックを生成する。
逆変換部225は、逆量子化部220によって逆量子化された残差ブロックを逆変換する。つまり、逆変換部225は、逆量子化された残差ブロックの周波数係数を逆変換して、画素値を有する残差ブロック、すなわち復元された残差ブロックを生成する。ここで、逆変換部225は、変換部210で使用した変換方式を逆に用いて逆変換を行うことができる。
加算部230は、予測部200で予測された予測ブロックと、逆変換部225によって復元された残差ブロックとを加算して対象ブロックを復元する。復元された対象ブロックは、符号化ピクチャバッファ240に参照ピクチャ(又は参照ブロック)として格納され、対象ブロックの次のブロック又は向後の他のブロック、他のピクチャを符号化するときに参照ピクチャとして使用できる。
フィルタ部235は、デブロッキングフィルタ、SAO(Sample Adaptive Offset)、ALF(Adaptive Loop Filter)などの一つ以上の後処理フィルタ過程を含むことができる。デブロッキングフィルタは、復元されたピクチャからブロック間の境界に生じたブロック歪みを除去することができる。ALFは、デブロッキングフィルタを介してブロックがフィルタリングされた後に復元された画像と、原本画像とを比較した値に基づいて、フィルタリングを行うことができる。SAOは、デブロッキングフィルタが適用された残差ブロックに対して、画素単位で原本画像とのオフセット差を復元することができる。このような後処理フィルタは、復元されたピクチャ又はブロックに適用できる。
符号化ピクチャバッファ240は、フィルタ部235を介して復元されたブロック又はピクチャを格納することができる。符号化ピクチャバッファ240に格納された復元ブロック又はピクチャは、画面内予測又は画面間予測を行う予測部200に提供できる。
エントロピー符号化部245は、生成された量子化周波数係数列を様々なスキャン方式に応じてスキャンして量子化係数列を生成し、これをエントロピー符号化技法などを用いて符号化することにより出力する。スキャンパターンは、ジグザグ、対角線、ラスター(raster)などの様々なパターンのうちのいずれかに設定することができる。また、各構成部から伝達される符号化情報を含む符号化データを生成してビットストリームとして出力することができる。
図3は本発明の一実施形態による画像復号化装置を示すブロック構成図である。
図3を参照すると、画像復号化装置30は、エントロピー復号化部305、予測部310、逆量子化部315、逆変換部320、加減算器325、フィルタ330及び復号化ピクチャバッファ335を含んで構成できる。
また、予測部310は、さらに画面内予測モジュール及び画面間予測モジュールを含んで構成できる。
まず、画像符号化装置20から伝達された画像ビットストリームが受信されると、エントロピー復号化部305へ伝達できる。
エントロピー復号化部305は、ビットストリームを復号化して、量子化された係数と各構成部へ伝達される復号化情報を含む復号化データを復号化することができる。
予測部310は、エントロピー復号化部305から伝達されたデータに基づいて予測ブロックを生成することができる。このとき、復号化されたピクチャバッファ335に格納された参照画像に基づいて、デフォルト(default)構成技法を用いた参照ピクチャリストを構成することもできる。
画面間予測部は、参照ピクチャ構成部、動き補償部、動き情報復号化部を含むことができ、一部は符号化器と同じ過程を行い、一部は逆に誘導する過程を行うことができる。
逆量子化部315は、ビットストリームとして提供されてエントロピー復号化部305によって復号化された量子化変換係数を逆量子化することができる。
逆変換部320は、逆DCT、逆整数変換又はそれと類似の概念の逆変換技法を変換係数に適用して残差ブロックを生成することができる。
このとき、逆量子化部315、逆変換部320は、先立って説明した画像符号化装置20の変換部210及び量子化部215で行った過程を逆に行い、様々な方法で実現できる。例えば、変換部210及び量子化部215と共有する同じ過程及び逆変換を使用することもでき、画像符号化装置20から変換及び量子化過程に関する情報(例えば、変換サイズ、変換形状、量子化タイプなど)を用いて変換及び量子化過程を逆に行うことができる。
逆量子化及び逆変換過程を経た残差ブロックは、予測部310によって導出された予測ブロックと加算されて復元された画像ブロックが生成できる。このような加算は、加減算器325によって行われ得る。
フィルタ330は、復元された画像ブロックに対して、必要に応じてブロッキング(blocking)現象を除去するためにデブロッキングフィルタを適用することもでき、前記復号化過程の前後に、別のループフィルタを、ビデオの品質を向上させるためにさらに使用することもできる。
復元及びフィルタを経た画像ブロックは、復号化ピクチャバッファ335に格納できる。
図示してはいないが、画像符号化/復号化装置にブロック分割部をさらに含むことができる。
ブロック分割部を介して様々な単位と大きさのブロックに分割することができる。基本符号化単位(又は最大符号化単位。Coding Tree Unit。CTU)は、画像符号化過程で予測、変換、量子化などに対する基本(又は開始)単位を意味することができる。このとき、基本符号化単位は、カラーフォーマット(本例において、YCbCr)に応じて一つの輝度基本符号化ブロック(又は、最大符号化ブロック。Coding Tree Block。CTB)と二つの基本色差符号化ブロックで構成でき、カラーフォーマットに応じて各ブロックの大きさが定められ得る。分割過程に応じて符号化ブロック(Coding Block。CB)が取得できる。符号化ブロックは、一定の制限に応じてそれ以上の符号化ブロックに分割されていない単位と理解することができ、下位単位への分割の開始単位として設定できる。本発明において、ブロックは、四角形の形状にのみ制限せず、三角形や円形などの様々な形状を含む広い概念と理解することができる。
後述する内容は、一つのカラー成分を対象とするが、カラーフォーマットによる比率(例えば、YCbCr4:2:0の場合、輝度成分と色差成分の横及び縦の長さ比は2:1)に比例して、他のカラー成分に変更適用できることを理解すべきである。また、他のカラー成分に依存的なブロック分割(例えば、Cb/CrにおいてYのブロック分割結果に依存的な場合)が可能であるが、各カラー成分に独立的なブロック分割が可能であることを理解すべきである。また、共通する一つのブロック分割設定(長さ比に比例することは考慮)を使用することができるが、カラー成分に応じて個別的なブロック分割設定が使用されることも考慮して理解する必要がある。
ブロック分割部において、ブロックは、M×Nで表現でき、各ブロックの最大値と最小
値が範囲内で取得できる。例えば、ブロックの最大値を256×256、最小値を4×4に定める場合には、サイズ2×2のブロック(本例において、mとnは2から8までの整数)又はサイズ2m×2mのブロック(本例において、mとnは2から128までの整数)又はサイズm×mのブロック(本例において、mとnは4から256までの整数)を取得することができる。ここで、mとnは同じでも同じでなくてもよく、前記最大値と最小値などのブロックが支援される範囲は一つ以上発生することができる。
例えば、ブロックの最大大きさ及び最小大きさなどに関する情報が発生することができ、一部分割設定におけるブロックの最大大きさ及び最小大きさなどに関する情報が発生することができる。ここで、前者の場合は、画像内で発生可能な最大及び最小大きさに対する範囲の情報であり、後者の場合は、一部分割設定に基づいて発生可能な最大及び最小大きさに関する情報であり得る。ここで、前記分割設定は、画像タイプ(I/P/B)、カラー成分(YCbCrなど)、ブロック種類(符号化/予測/変換/量子化など)、分割種類(Index or Type)、分割方式(ツリー方式におけるQT、BT、TTなど、Index方式におけるSI2、SI3、SI4など)などによって定義できる。
また、ブロックが持つことができる横/縦の長さ比(ブロックの形状)に対する制限が存在することができ、これに対する境界値の条件が設定できる。このとき、任意の境界値(k)以下/未満のブロックのみ支援でき、kはA/B(Aは横と縦のうちのより長いか同じ値、Bはその残りの値)のような横と縦の長さ比に基づいて定義でき、1.5、2、3、4などの1以上の実数であり得る。上記の例でのように画像における一つのブロックの形状に関する制限条件が支援されるか或いは分割設定に応じて一つ以上の制限条件が支援され得る。
まとめると、上述した説明のような範囲及び条件と後述する分割設定などによってブロック分割の支援有無が定められ得る。例えば、ブロック(親ブロック)の分割による候補(子ブロック)が支援されるブロック条件を満足する場合には、当該分割は支援でき、満足しない場合には、当該分割は支援できない。
ブロック分割部は、画像符号化装置及び復号化装置の各構成部に関係して設定でき、この過程を介してブロックの大きさと形状が定められ得る。このとき、設定されるブロックは構成部によって異なるように定義でき、予測部の場合は予測ブロック(Prediction Block)、変換部の場合は変換ブロック(Transform Block)、量子化部の場合は量子化ブロック(Quantization Block)などがこれに該当することができる。但し、これに限定されず、他の構成部によるブロック単位がさらに定義できる。本発明では、各構成部で入力と出力が長方形の形状である場合を中心に説明するが、一部の構成部では、他の形状(例えば、直角三角形など)の入力/出力が可能である。
ブロック分割部の初期(又は開始)ブロックの大きさ及び形状は、上位単位から決定できる。前記初期ブロックは、より小さい大きさのブロックに分割でき、ブロックの分割による最適の大きさ及び形状が決定されると、そのブロックは、下位単位の初期ブロックに決定できる。ここで、上位単位は符号化ブロック、下位単位は予測ブロック又は変換ブロックであり得るが、これに限定されず、様々な変形の例が可能である。上記の例のように下位単位の初期ブロックが定められると、上位単位のように最適の大きさ及び形状のブロックを見付けるための分割過程が行われ得る。
まとめると、ブロック分割部は、基本符号化ブロック(又は最大符号化ブロック)を少なくとも一つの符号化ブロックに分割することができ、符号化ブロックを少なくとも一つの予測ブロック/変換ブロック/量子化ブロックに分割することができる。また、予測ブロックは、少なくとも一つの変換ブロック/量子化ブロックに分割を行うことができ、変換ブロックは、少なくとも一つの量子化ブロックに分割を行うことができる。ここで、一部のブロックは、他のブロックと従属的な関係(つまり、上位単位と下位単位によって定義)を持ってもよく、独立した関係を持ってもよい。一例として、予測ブロックは、変換ブロックの上位単位であってもよく、変換ブロックと独立した単位であってもよく、ブロックの種類に応じて様々な関係設定が可能である。
符号化の設定に応じて、上位単位と下位単位の結合有無が定められ得る。ここで、単位間の結合は、上位単位から下位単位への分割を行わず、上位単位のブロック(大きさ及び形状)で下位単位の符号化過程(例えば、予測部、変換部、逆変換部など)を行うことを意味する。つまり、複数の単位における分割過程が共有され、分割情報はその中の一つの単位(例えば、上位単位)で発生することを意味することができる。
一例として、(符号化ブロックが予測ブロック、変換ブロックと結合される場合)符号化ブロックで予測過程、変換及び逆変換過程を行うことができる。
一例として、(符号化ブロックが予測ブロックと結合される場合)符号化ブロックで予測過程を行うことができ、符号化ブロックと同じかより小さい変換ブロックで変換及び逆変換過程を行うことができる。
一例として、(符号化ブロックが変換ブロックと結合される場合)符号化ブロックと同じかより小さい予測ブロックで予測過程を行うことができ、符号化ブロックで変換及び逆変換過程を行うことができる。
一例として、(予測ブロックが変換ブロックと結合された場合)符号化ブロックと同じかより小さい予測ブロックで予測過程を行うことができ、予測ブロックで変換及び逆変換過程を行うことができる。
一例として、(いずれのブロックでも結合されていない場合)符号化ブロックと同じかより小さい予測ブロックで予測過程を行うことができ、符号化ブロックと同じかより小さい変換ブロックで変換及び逆変換過程を行うことができる。
上記の例において符号化、予測、変換ブロックに関する様々な場合を説明したが、これに限定しない。
前記単位間の結合は、画像で固定的な設定が支援できるか、或いは様々な符号化要素を考慮して適応的な設定が支援できる。ここで、前記符号化要素は、画像タイプ、カラー成分、符号化モード(Intra/Inter)、分割の設定、ブロックの大きさ/形状/位置、横/縦の長さ比、予測関連情報(例えば、画面内予測モード、画面間予測モードなど)、変換関連情報(例えば、変換技法選択情報など)、量子化関連情報(例えば、量子化領域選択情報、量子化された変換係数符号化情報など)などを含むことができる。
上述したように、最適な大きさ及び形状のブロックを見付けた場合、これに対するモード情報(例えば、分割情報など)が生成できる。モード情報は、ブロックの属する構成部で発生する情報(例えば、予測関連情報及び変換関連情報など)と一緒にビットストリームに収録されて復号化器へ伝送でき、復号化器で同じレベルの単位にパーシングされて画像復号化過程で使用できる。
以下では、分割方式について説明し、説明の便宜のために、初期ブロックが正方形の形状であることを仮定するが、初期ブロックが長方形の形状である場合にも同一又は類似に適用することができるので、これに限定されるものではない。
ブロック分割部は、様々な種類の分割を支援することができる。例えば、ツリーベースの分割又はインデックスベースの分割を支援することができ、その他の方法が支援することもできる。ツリーベースの分割は、様々な種類の情報(例えば、分割か否か、ツリー種類、分割方向など)で分割形態を決定することができ、インデックスベースの分割は、所定のインデックス情報で分割形態を決定することができる。
図4は本発明のブロック分割部で取得することができる様々な分割形態を示す例示図である。
本例では、1回の分割実行(又は過程)によって図4のような分割形態を取得する場合を仮定するが、これに限定されず、複数の分割動作によって取得される場合も可能である。また、図4に示されていない追加の分割形態が可能である。
(ツリーベースの分割)
本発明のツリーベースの分割において四分木(Quad Tree。QT)、二分木(Binary Tree。BT)、三分木(Ternary Tree。TT)などが支援できる。一つのツリー方式が支援される場合は単一ツリー分割と呼び、二つ以上のツリー方式が支援される場合は多重ツリー分割と呼ぶことができる。
QTの場合は、ブロックが水平と垂直方向にそれぞれ二分割(すなわち、四分割)される方式(n)を意味し、BTの場合は、ブロックが水平又は垂直のうちの一つの方向に二分割される方式(b乃至g)を意味し、TTの場合は、ブロックが水平又は垂直のうちの一つの方向に三分割される方式(h乃至m)を意味する。
ここで、QTの場合は、分割方向を水平と垂直のうちのいずれかに限定して四分割する方式(o、p)を支援することもできる。また、BTの場合は、均等な大きさを有する方式(b、c)のみを支援するか、或いは非均等な大きさを有する方式(d乃至g)のみを支援するか、或いは両方の方式を混合して支援することができる。また、TTの場合は、分割が特定の方向に偏る配置(左→右又は上→下の方向に1:1:2、2:1:1など)を有する方式(h、j、k、m)のみ支援するか、或いは中央に配置(1:2:1など)される方式(i、l)のみを支援するか、或いは両方の方式を混合して支援することができる。また、分割方向を水平と垂直方向にそれぞれ四分割(すなわち、16分割)される方式(q)も支援することができる。
そして、前記ツリー方式のうち、水平分割方向に限定してz分割する方式(b、d、e、h、i、j、o)を支援するか、或いは垂直分割方向に限定してz分割する方式(c、f、g、k、l、m、p)を支援するか、或いは両方の方式を混合して支援することができる。ここで、zは、2、3、4のような2以上の整数であり得る。
本発明において、QTはn、BTはbとc、TTはiとlを支援する場合を仮定して説明する。
符号化の設定に応じて前記ツリー分割のうちの一つ以上の方式が支援できる。例えば、QTを支援することができるか、或いはQT/BTを支援することができるか、或いはQT/BT/TTを支援することができる。
上記の例は、基本ツリー分割がQTであり、その他のツリー支援有無に応じてBTとTTが追加分割方式に含まれる場合についての例であるが、様々な変形が可能である。このとき、その他のツリー支援有無についての情報(bt_enabled_flag、tt_enabled_flag、bt_tt_enabled_flagなど。0又は1の値を持つことができ、0であれば支援せず、1であれば支援)は、符号化の設定に応じて黙示的に定められるか、或いはシーケンス、ピクチャ、スライス、タイルグループ、タイル、ブリックなどの単位で明示的に決定できる。
分割情報は、分割か否かについての情報(tree_part_flag、又は、qt_part_flag、bt_part_flag、tt_part_flag、bt_tt_part_flag。0又は1の値を持つことができ、0であれば分割されず、1であれば分割される)が含まれ得る。また、分割方式(BTとTT)に応じて分割方向(dir_part_flag、又は、bt_dir_part_flag、tt_dir_part_flag、bt_tt_dir_part_flag。0又は1の値を持つことができ、0であれば<横/水平>であり、1であれば<縦/垂直>)についての情報が追加でき、これは、分割が行われる場合に発生可能な情報であることができる。
複数のツリー分割が支援される場合には、様々な分割情報構成が可能である。次は、一つの深さ(Depth)レベル(つまり、支援される分割深さが一つ以上に設定されて再帰的な分割が可能であることもあるが、説明の便宜のための目的)で分割情報がどのように構成されているかについての例として仮定して説明する。
一例(1)として、分割か否かについての情報を確認する。このとき、分割が行われない場合であれば、分割が終了する。
もし分割が行われる場合であれば、分割の種類に関する選択情報(例えば、tree_idx。0であればQT、1であればBT、2であればTT)を確認する。このとき、選択される分割の種類に応じて分割方向情報をさらに確認し、次のステップ(分割深さが最大に達していない場合などの理由により追加分割が可能であれば、さらに最初から開始し、分割が不可能であれば、分割終了)に移行する。
一例(2)として、一部のツリー方式(QT)に対する分割か否かについての情報を確認し、次のステップに移行する。このとき、分割が行われない場合であれば、一部のツリー方式(BT)の分割か否かについての情報を確認する。このとき、分割が行われない場合であれば、一部のツリー方式(TT)の分割か否かについての情報を確認する。このとき、分割が行われない場合であれば、分割が終了する。
もし一部のツリー方式(QT)の分割が行われる場合であれば、次のステップに移行する。また、もし一部のツリー方式(BT)の分割が行われる場合であれば、分割方向情報を確認し、次のステップに移行する。また、もし一部のツリー分割方式(TT)の分割が行われる場合であれば、分割方向情報を確認し、次のステップに移行する。
一例(3)として、一部のツリー方式(QT)に対する分割か否かについての情報を確認する。このとき、分割が行われない場合であれば、一部のツリー方式(BTとTT)の分割か否かについての情報を確認する。このとき、分割が行われない場合であれば、分割が終了する。
もし一部のツリー方式(QT)の分割が行われる場合であれば、次のステップに移行する。また、もし一部のツリー方式(BTとTT)の分割が行われる場合であれば、分割方向情報を確認し、次のステップに移行する。
上記の例は、ツリー分割の優先順位が存在(2番と3番の例)するか或いは存在しない場合(1番の例)であり得るが、様々な変形の例が可能である。また、上記の例において、現在ステップの分割は、以前ステップの分割結果とは無関係な場合を説明する例であるが、現在ステップの分割が以前ステップの分割結果に依存的な設定も可能である。
例えば、1番乃至3番の例は、以前ステップで一部のツリー方式の分割(QT)が行われて現在ステップに移されてきた場合であれば、現在ステップでも同じツリー方式(QT)の分割が支援できる。
一方、以前ステップで一部のツリー方式の分割(QT)が行われず、他のツリー方式の分割(BT又はTT)が行われて現在ステップに移されてきた場合であれば、一部のツリー方式の分割(QT)を除いて一部のツリー方式の分割(BTとTT)が現在ステップを含む後続ステップに支援される設定も可能である。
上述したような場合には、ブロック分割に支援されるツリー構成が適応的であり得るということを意味するので、前述した分割情報構成も異なるように構成できることを意味する。(後述する例は3番の例と仮定)すなわち、上記の例において一部のツリー方式(QT)の分割が以前ステップで行われていない場合、現在ステップでは一部のツリー方式(QT)は考慮せずに分割過程が行われ得る。また、関連ツリー方式に関する分割情報(例えば、分割か否かについての情報、分割方向情報など。本例<QT>では、分割か否かについての情報)は除去して構成できる。
上記の例は、ブロック分割が許容される場合(例えば、ブロックの大きさが最大値と最小値の間の範囲内に存在する。各ツリー方式の分割深さが最大深さ<許容深さ>に達しないなど)に対する適応的な分割情報構成に関する場合であり、ブロック分割が制限される場合(例えば、ブロックの大きさが最大値と最小値の間の範囲に存在しない。各ツリー方式の分割深さが最大深さに達するなど)にも適応的な分割情報構成が可能である。
既に述べたように、本発明において、ツリーベースの分割は、再帰的な方式を用いて行われ得る。例えば、分割深さがkである符号化ブロックの分割フラグが0である場合、符号化ブロックの符号化は、分割深さがkである符号化ブロックで行われ、分割深さがkである符号化ブロックの分割フラグが1である場合、符号化ブロックの符号化は、分割方式に応じて、分割深さがk+1であるN個のサブ符号化ブロック(このとき、Nは2、3、4などの2以上の整数)で行われる。
前記サブ符号化ブロックは、再び符号化ブロック(k+1)に設定され、前記過程を経て、サブ符号化ブロック(k+2)に分割できる。このような階層的分割方式は、分割範囲及び分割許容深さなどの分割設定に応じて決定できる。
このとき、分割情報を表現するためのビットストリーム構造は、一つ以上のスキャン方法の中から選択することができる。例えば、分割深さの順序を基準に分割情報のビットストリームを構成することができるか、或いは分割か否かを基準に分割情報のビットストリームを構成することができる。
例えば、分割深さの順序を基準とした場合、最初ブロックを基準に現レベルの深さでの分割情報を取得した後、次のレベルの深さでの分割情報を取得する方法であり、分割か否かを基準とした場合、最初ブロックを基準に分割されたブロックでの追加分割情報を優先的に取得する方法を意味し、他の追加のスキャン方法が考慮できる。
最大ブロックの大きさと最小ブロックの大きさは、ツリーの種類に関係なく、(又はすべてのツリー)共通する設定を持つことができるか、或いは各ツリーに応じて個別的な設定を持つことができるか、或いは二つ以上のツリーに対する共通の設定を持つことができる。この時、最大ブロックの大きさは、最大符号化ブロックと同じかより小さく設定できる。もし所定の第1ツリーによる最大ブロックの大きさが最大符号化ブロックと同じでなければ、第1ツリーの最大ブロックの大きさに到達するまで所定の第2ツリー方式を用いて黙示的に分割を行う。
そして、ツリーの種類に関係なく、共通の分割深さが支援できるか、或いは各ツリーに応じて個別的な分割深さが支援できるか、或いは二つ以上のツリーに対する共通の分割深さが支援できる。又は、一部のツリーには分割深さが支援され、一部のツリーには分割深さが支援されなくてもよい。
前記設定情報に対する明示的な構文要素が支援でき、一部の設定情報は黙示的に定められてもよい。
(インデックスベースの分割)
本発明のインデックスベースの分割において、CSI(Constant Split Index)方式とVSI(Variable Split Index)方式などが支援できる。
CSI方式は、所定の方向の分割によってk個のサブブロックが取得される方式であり得る。このとき、kは2、3、4などの2以上の整数であり得る。詳細には、ブロックの大きさ及び形状に関係なく、前記k値に基づいて、サブブロックの大きさ及び形状が定められる構成の分割方式であり得る。ここで、所定の方向は、水平、垂直、対角線(左上→右下方向、又は、左下→右上方向など)方向のうちの一つ又は二つ以上の方向が結合できる。
本発明のインデックスベースのCSI分割方式は、水平又は垂直のうちのいずれかの方向にz個に分割される候補を含むことができる。このとき、zは、2、3、4などの2以上の整数であり、各サブブロックの横又は縦の長さのうち、いずれか一つは同じであり、他の一つは同じか異なり得る。前記サブブロックの横又は縦の長さ比はA:A:...:Aであって、A乃至Aは1、2、3などの1以上の整数であり得る。
また、水平と垂直方向にそれぞれx、y個に分割される候補を含むことができる。このとき、xとyは1、2、3、4などの1以上の整数であり得るが、xとyが同時に1である場合(aが既に存在するので)は制限することができる。図4は、各サブブロックの横又は縦の長さ比が同じである場合を示しているが、異なる場合を含む候補を含んでもよい。
また、一部の対角線方向(左上→右下方向)又は一部の対角線方向(左下→右上方向)のうちのいずれか一方向にw個に分割される候補を含むことができ、wは2、3などの2以上の整数であることができる。
図4を参照すると、各サブブロックの長さ比によって対称的な分割形態(b)と非対称的な分割形態(d、e)に区分することができ、特定の方向に偏った分割形態(k、m)と中央に配置される分割形態(k)に区分することができる。サブブロックの長さ比だけでなく、サブブロックの形態などを含む様々な符号化要素によって分割形態を定義することができるが、符号化の設定に応じて、支援される分割形態が黙示的又は明示的に定められ得る。そこで、支援される分割形態に基づいてインデックスベースの分割方式での候補群が定められ得る。
一方、VSI方式は、サブブロックの幅w又は高さhが固定されたまま、所定の方向の分割を介して一つ以上のサブブロックが取得される方式であり得る。wとhは1、2、4、8などの1以上の整数であり得る。詳細には、ブロックの大きさ及び形状と前記w又はnの値に基づいてサブブロックの個数が定められる構成の分割方式であり得る。
本発明のインデックスベースのVSI分割方式は、サブブロックの横又は縦の長さのうちのいずれか一つを固定して分割される候補を含むことができる。又は、サブブロックの横と縦の長さを固定して分割される候補を含むことができる。サブブロックの横又は縦の長さが固定されるので、水平又は垂直方向に均等分割を許容する特徴を持つことができるが、これに限定されない。
分割前のブロックがM×Nであり、サブブロックの横の長さが固定(w)されるか、或いは縦の長さが固定(h)されるか、或いは横と縦の長さが固定(w、h)される場合には、取得されるサブブロックの個数は、それぞれ(M*N)/w、(M*N)/h、(M*N)/w/hであることができる。
符号化の設定に応じて、CSI方式のみ支援されるか、或いはVSI方式のみ支援されるか、或いは両方の方式とも支援されることができ、支援される方式についての情報が黙示的又は明示的に定められ得る。
本発明では、CSI方式が支援される場合を仮定して説明する。
符号化の設定に応じて、前記インデックス分割のうちの二つ以上の候補を含んで候補群を構成することができる。
例えば、{a、b、c}、{a、b、c、n}、{a乃至g、n}のような候補群を構成することができるが、水平又は垂直方向に二分割されるか、或いは水平と垂直方向にそれぞれ二分割されるブロック形状のように、一般的な統計的特性に基づいて多く発生するものと予測されるブロック形状を候補群として構成する例であり得る。
又は、{a、b}、{a、o}、{a、b、o}又は{a、c}、{a、p}、{a、c、p}のような候補群を構成することができるが、それぞれ水平と垂直方向に二分割、四分割される候補を含む。これは、特定の方向の分割が多く発生するものと予測されるブロック形状を候補群として構成する例であり得る。
又は、{a、o、p}又は{a、n、q}のような候補群を構成することができるが、分割前のブロックよりも小さい大きさを有する分割が多く発生するものと予測されるブロック形状を候補群として構成する例であり得る。
又は、{a、r、s}のような候補群を構成することができるが、分割前のブロックから他の方式(ツリー方式)を用いて長方形の形状に得ることができる最適な分割結果を得たものと判断し、非四角形の分割形態を候補群として構成する例であり得る。
上記例のように様々な候補群の構成が可能であり、一つ以上の候補群の構成が様々な符号化要素を考慮して支援できる。
前記候補群の構成が完了すると、さまざまな分割情報構成が可能である。
例えば、分割されない候補(a)と分割される候補(b乃至s)を含んで構成される候補群からインデックス選択情報が発生することができる。
又は、分割か否かを示す情報(分割形態がaであるか否か)が発生することができ、分割が行われる場合(aではない場合)に分割される候補(b乃至s)で構成される候補群からインデックス選択情報が発生することができる。
上記説明以外の多様な方式の分割情報構成が可能であり、前記分割か否かを示す情報を除いては候補群で各候補のインデックスに固定長の2値化、可変長の2値化などの様々な方法を用いてバイナリビットが割り当てられ得る。もし候補群の個数が二つである場合には、インデックス選択情報に1ビットが割り当てられ、三つ以上である場合には、インデックス選択情報に1ビット以上が割り当てられ得る。
ツリーベースの分割方式とは異なり、インデックスベースの分割方式は、多く発生すると予測される分割形態を選別的に候補群に構成する方式であることができる。
そして、支援される候補群の個数に応じて、インデックス情報を表現するためのビット量が増加することができるので、ツリーベースの方式の階層的分割(再帰的分割)ではなく、単一階層分割(例えば、分割深さが0に限定)に適した方式であり得る。つまり、1回の分割動作を支援する方式であってもよく、インデックスベースの分割を介して取得されたサブブロックはそれ以上の追加の分割が不可能な方式であってもよい。
このとき、より小さい大きさを有する同じ種類のブロックへの追加分割が不可能な場合(例えば、インデックス分割方式によって取得された符号化ブロックは、符号化ブロックへの追加分割が不可)を意味することができるが、他の種類のブロックへの追加分割が不可能な設定(例えば、符号化ブロックから符号化ブロックだけでなく、予測ブロックへの分割も不可)も可能である。もちろん、上記の例に限定されず、他の変形の例が可能である。
次に、符号化要素のうちブロックの種類を中心にブロック分割の設定が定められる場合について考察する。
まず、分割過程を介して符号化ブロックが取得できる。ここで、分割過程は、ツリーベースの分割方式が使用でき、ツリーの種類によって図4のa(no split)、n(QT)、b、c(BT)、i、l(TT)などの分割形態結果が得られる。符号化の設定に応じて、QT/QT+BT/QT+BT+TTなどの各ツリーの種類の様々な組み合わせが可能である。
後述する例は、上記の過程によって取得された符号化ブロックを基礎に予測ブロックと変換ブロックが最終的に区画される過程を示し、各区画された大きさに基づいて予測、変換及び逆変換過程が行われる場合を仮定する。
一例(1)として、符号化ブロックの大きさのまま予測ブロックが設定されて予測過程を行うことができ、符号化ブロック(又は予測ブロック)の大きさのまま変換ブロックが設定されて変換及び逆変換過程を行うことができる。予測ブロックと変換ブロックの場合は、符号化ブロックに基づいて設定されたため、別に発生する分割情報は存在しない。
一例(2)として、符号化ブロックの大きさのまま予測ブロックが設定されて予測過程を行うことができる。変換ブロックの場合は、符号化ブロック(又は予測ブロック)を基礎に分割過程を介して変換ブロックが取得でき、取得された大きさに基づいて変換及び逆変換過程を行うことができる。
ここで、分割過程は、ツリーベースの分割方式が使用でき、ツリーの種類に応じて、図4のa(no split)、b、c(BT)、i、l(TT)、n(QT)などの分割形態結果が得られる。符号化の設定に応じて、QT/BT/QT+BT/QT+BT+TTなどの各ツリーの種類の様々な組み合わせが可能である。
ここで、分割過程は、インデックスベースの分割方式が使用でき、インデックスの種類に応じて、図4のa(no split)、b、c、dなどの分割形態の結果が得られる。符号化の設定に応じて、{a、b、c}、{a、b、c、d}などのさまざまな候補群の構成が可能である。
一例(3)として、予測ブロックの場合は、符号化ブロックを基礎に分割過程を行うことにより予測ブロックが取得でき、取得された大きさに基づいて予測過程を行うことができる。変換ブロックの場合は、符号化ブロックの大きさのまま設定されて変換及び逆変換過程を行うことができる。本例は、予測ブロックと変換ブロックが互いに独立した関係を持つ場合に該当することができる。
ここで、分割過程は、インデックスベースの分割方式が使用でき、インデックスの種類に応じて、図4のa(no split)、b乃至g、n、r、sなどの分割形態結果が得られる。符号化の設定に応じて、{a、b、c、n}、{a乃至g、n}、{a、r、s}などのさまざまな候補群の構成が可能である。
一例(4)として、予測ブロックの場合は、符号化ブロックを基礎に分割過程を行うことにより予測ブロックが取得でき、取得された大きさに基づいて予測過程を行うことができる。変換ブロックの場合は、予測ブロックの大きさのまま設定されて変換及び逆変換過程を行うことができる。本例は、取得された予測ブロックの大きさのまま変換ブロックが設定される場合であってもよく、又はその逆の場合(変換ブロックの大きさのまま予測ブロックが設定)であってもよい。
ここで、分割過程は、ツリーベースの分割方式が使用でき、ツリーの種類に応じて、図4のa(no split)、b、c(BT)、n(QT)などの分割形態が得られる。符号化の設定に応じて、QT/BT/QT+BTなどの各ツリーの種類の様々な組み合わせが可能である。
ここで、分割過程は、インデックスベースの分割方式が使用でき、インデックスの種類に応じて、図4のa(no split)、b、c、n、o、pなどの分割形態が得られる。符号化の設定に応じて、{a、b}、{a、c}、{a、n}、{a、o}、{a、p}、{a、b、c}、{a、o、p}、{a、b、c、n}、{a、b、c、n、p}などのさまざまな候補群の構成が可能である。また、インデックスベースの分割方式のうち、VSI方式が単独で、又は前記CSI方式と組み合わせられて候補群が構成されてもよい。
一例(5)として、予測ブロックの場合は、符号化ブロックを基礎に分割過程を行うことにより予測ブロックが取得でき、取得された大きさに基づいて予測過程を行うことができる。また、変換ブロックの場合も、符号化ブロックを基礎に分割過程を行うことにより予測ブロックが取得でき、取得された大きさに基づいて変換及び逆変換過程を行うことができる。本例は、符号化ブロックを基礎に予測ブロックと変換ブロックそれぞれの分割を行う場合であり得る。
ここで、分割過程は、ツリーベースの分割方式とインデックスベースの分割方式が使用でき、4番の例と同一又は類似に候補群が構成できる。
上記の例は、各種類のブロックの分割過程が共有されるか否かなどによって発生可能な一部の場合を説明しているが、これに限定されず、様々な変形の例が可能である。また、ブロックの種類だけでなく、様々な符号化要素が考慮されてブロック分割設定が定められ得る。
このとき、符号化要素は、画像タイプ(I/P/B)、カラー成分(YCbCr)、ブロックの大きさ/形状/位置、ブロックの横/縦の長さ比、ブロックの種類(符号化ブロック、予測ブロック、変換ブロック、量子化ブロックなど)、分割状態、符号化モード(Intra/Inter)、予測関連情報(画面内予測モード、画面間予測モードなど)、変換関連情報(変換技法選択情報など)、量子化関連情報(量子化領域選択情報、量子化された変換係数符号化情報など)などが含まれ得る。
図5は本発明の一実施形態に係る画面内予測での予測モードを示す例示図である。
図5を参照すると、95個の予測モードは、画面内予測のために支援でき、この中の93個は方向性モードであり、二つは非方向性モード(DC、Planar)である。このとき、方向性モードは、傾き(例えば、dy/dx)又は角度情報(Degree)に区分することができる。
非方向性モードの場合は、ブロックの隣接する参照画素の平均、内挿などの方法によって予測を行う方法であり、方向性モードの場合は、ブロックの隣接する参照画素の外挿、内挿などの方法によって予測を行う方法であり得る。
方向性モードの場合は、垂直(上→下/下→上)、水平(左→右/右→左)、対角線A(左上→右下/右下→左上)、対角線B(右上→左下/左下→右上)などの方向性を持つことができる。
一般的に、ラスタースキャンなどで符号化を行う場合、左、上、左上、右上、左下方向に隣接するブロックが存在することができ、これを予測の開始点又は参照画素とした非方向性モード、又は垂直(上→下)、水平(左→右)、対角線A(左上→右下)、対角線B−1(右上→左下)、対角線B−2(左下→右上)方向の予測モードが支援できる。ラスタースキャン以外の他のスキャンが支援される場合には、方向性モードは異なるように定義できる。
例えば、左ブロックは利用不可で、右ブロックは利用不可能な状態での水平モードは、(右→左)方向の外挿を介して予測を行うことができる。又は、左ブロックと右ブロックがすべて利用可能な状態では、所定の方向(左→右又は右→左)の外挿を介して予測を行うことができるか、或いは両ブロックの内挿によって予測を行うことができる。本発明では、ラスタースキャン又はzスキャンの順序に従って符号化が行われ、左、上、左上、右上、左下方向に参照可能な画素が位置する場合を仮定して説明する。
また、カラー空間間の相関性を用いて、符号化済みの他のカラー空間の復元ブロックを対象ブロックの予測に使用することができ、これを支援する予測モードを含むことができる。例えば、色差成分の場合、対象ブロックと対応する輝度成分の復元されたブロックを用いて対象ブロックの予測ブロックを生成することができる。つまり、カラー空間間の相関性を考慮して、復元されたブロックに基づいて予測ブロックを生成することができ、色差成分のための画面内予測モードとして含むことができる。
色差成分の場合は、輝度成分の予測モード候補群と同じ候補群を持つか、或いは輝度成分の予測モード候補群のうちの一部のモードと色差成分に関する追加の予測モード(カラーコピーモード、カラーモード)が予測モード候補群に含まれ得る。ここで、カラーコピーモードの場合は、他のカラー空間内に位置した領域から予測ブロックの生成のためのデータを取得する方法に関する予測モードであることができ、カラーモードの場合は、他のカラー空間内に位置した領域から予測モードを取得する方法に関連する予測モードであることができる。カラーコピーモードとカラーモードの場合は、それぞれm個、n個(m、nは0、1、2、3又はそれ以上の整数)のモードが支援できる。
カラーコピーモードが一つ支援される場合、予測ブロックの生成のための所定のデータ取得方法を予め定義することができ、二つ以上支援される場合、予測ブロックの生成のためのデータ取得方法を区分(例えば、相関性取得のために参照される位置など。<1>左側、<2>上側、<3>左側+上側領域など)して支援することができる。
カラーモードは、一つ支援される場合には、予測モード取得のための所定の位置が予め定義でき、二つ以上支援される場合には、予測モード取得のための複数の位置(例えば、対応するブロックの<1>中央、<2>左上側、<3>右上側、<4>左下側、<5>右下側など)を支援することができる。
上記の例で説明される予測モードの全部又は一部が輝度成分又は色差成分の予測モード候補群に含まれることができ、その他の追加モードが予測モード候補群に含まれることができる。
前記予測モードは、支援される画面内予測モードのすべての候補を意味することができる。この中の全部又は一部の構成で予測モード候補群を構成することができる。この際、ブロックの大きさ、形状(横/縦の長さ比)などに応じて、前記予測モード候補群を構成することができる。
例えば、ブロックの大きさに応じて、予測モード候補群の個数が定められ得る。この際、ブロックの大きさは、一つ以上の所定の閾値の大きさ(A×B、C×Dなど)を基準に区分される二つ以上の範囲の中の一つに分類でき、前記分類された範囲に応じて、11、35、67などと複数の候補群の個数のうちのいずれか一つに定められるか、或いはカラーコピーモードやカラーモードなどの支援有無及び個数が定められ得る。この時、前記閾値の大きさは幅(W)、高さ(H)、W×Hなどで表現でき、WとHは4、8、16、32、64などの2以上の整数であり得る。
又は、ブロックの形状(又はブロックの横/縦の長さ比)に応じて予測モード候補群の構成が定められ得る。この際、ブロックの横/縦の長さ比は、一つ以上の所定の閾値を基準に区分される二つ以上の範囲の中のいずれか一つに分類でき、前記分類された範囲に応じて候補群の構成が定められ得る。このとき、前記閾値は、W/H(又はH/W)などで表現でき、1、2、4、8、16などの1以上の整数値を持つか、或いは1、1/2、1/4、1/8、1/16など、0と1の間の小数値を持つことができる。
本発明における画面内予測は、方向性及び非方向性モードのために、図5のような95個の予測モードが支援され、カラーモードとカラーコピーモードが支援され得る場合を仮定する。また、輝度成分の予測モード候補群は、方向性モードと非方向性モード67個が支援され、色差成分の予測モード候補群は、方向性及び非方向性モード4個、カラーモード1個、カラーコピーモード3個の合計8個が支援される場合を仮定するが、これに限定されない。前記仮定以外の予測モード候補群に含まれるモードを選定するための所定の構成基準が存在することができる。
次に、ブロックの横/縦の長さ比による予測モード候補群の構成の一例を示す。
Figure 2021536718
前記表は、正方形のブロック形状であるときに0と1番の予測モード、及び2番乃至66番モードの予測モードが予測モード候補群に含まれる場合を基準に設定する。長方形のブロック形状であるときに正方形のブロックの予測モード候補群(非方向性モードを除く)に対して追加又は除外される予測モードで上記表のような候補構成が可能であるが、これは、ブロックの長さが短い方よりも長い方で予測モードをさらに広く構成することが、予測の精度の面で有利であるという仮定の下に設定される例であり得るが、これに反対される構成も可能である。
参照画素構成部では、画面内予測に使用される参照画素を構成することができる。このとき、参照画素は、一時メモリ(例えば、配列<Array>。1次、2次配列など)を介して管理でき、画面内予測過程ごとに生成及び除去でき、一時メモリの大きさは参照画素の構成に応じて決定できる。
対象ブロックを中心に左、上、左上、右上、左下ブロックが画面内予測に使用される場合を仮定して説明するが、これに限定されず、他の構成のブロック候補群が画面内予測に使用されてもよい。
例えば、前記参照画素のための隣接ブロックの候補群は、ラスター又はZスキャンに従う場合の一例であり、支援されるスキャンの順序に応じて前記候補群の一部を除去することができるか、或いは他のブロック候補群(例えば、右、下、右下ブロックなどが追加の構成)を含んで構成できる。
一方、対象ブロックに隣接する画素は、少なくとも一つの参照画素階層に分類することができるが、対象ブロックに最隣接する画素は、ref_0{対象ブロックの境界画素と画素値との差が1である画素。p(−1、−1)〜p(2m−1、−1)、p(−1、0)〜p(−1、2n−1)}、その次の隣接する画素{対象ブロックの境界画素と画素値との差が2である画素。p(−2、−2)〜p(2m、−2)、p(−2、−1)〜p(−2、2n)}はref_1、その次の隣接する画素{対象ブロックの境界画素と画素値との差が3である画素。p(−3、−3)〜p(2m+1、−3)、p(−3、−2)〜p(−3、2n+1)}はref_2などに分けることができる。つまり、対象ブロックの境界画素に隣接する画素の距離によって、参照画素を複数の参照画素階層に分類することができる。
ここで支援される参照画素ラインはN個以上であることができ、Nは1、2、3、4又はそれ以上の整数であることができる。この際、対象ブロックに最隣接する参照画素ラインから順次参照画素ライン候補群に含まれることが一般的であるが、これに限定されない。例えば、Nが3である場合、<ref_0、ref_1、ref_2>のように順次前記候補群が構成できるか、或いは<ref_0、ref_1、ref_3>、<ref_0、ref_2、ref_3>、<ref_1、ref_2、ref_3>のように順次でないか、或いは最隣接する参照画素ラインを除外する構成で前記候補群が構成されることも可能である。
前記候補群内のすべての参照画素ラインを用いて予測を行うか、或いは一部の参照画素ライン(一つ以上)を用いて予測を行うことができる。
例えば、符号化の設定に応じて、複数の参照画素ラインのうちのいずれかが選択され、当該参照画素ラインを用いて画面内予測を行うことができる。又は、複数の参照画素ラインのうちの二つ以上が選択され、当該参照画素ラインを用いて(例えば、各参照画素ラインのデータに重み平均などを適用)画面内予測を行うことができる。
ここで、参照画素ラインの選択は、黙示的又は明示的に定められ得る。例えば、黙示的な場合には、画像タイプ、カラー成分、ブロックの大きさ/形状/位置などの要素のうちのいずれか一つ又は二つ以上の組み合わせに応じて定義される符号化の設定に基づいて定められることを意味する。また、明示的な場合は、ブロックなどの単位で参照画素ライン選択情報が発生しうることを意味する。
本発明では、最隣接する参照画素ラインを用いて画面内予測を行う場合を中心に説明する。但し、予測に参照される参照画素ラインは、本発明の主要符号化要素の一つとして考慮できる。つまり、選択される参照画素ラインに関係なく、画面内予測の設定が定められ得るが、それによる画面内予測の設定が定められることも可能である。
本発明の画面内予測の参照画素構成部は、参照画素生成部、参照画素補間部、参照画素フィルタ部などを含むことができ、前記構成の全部又は一部を含んで構成することができる。
参照画素構成部で参照画素使用可能性(Availability)を確認して、使用可能な参照画素と使用不可能な参照画素を分類することができる。ここで、前記参照画素使用可能性は、次の条件のうちの少なくとも一つを満足する場合に使用不可と判断する。
例えば、ピクチャ境界の外に位置する場合には、対象ブロックと同じ分割単位(例えば、スライス、タイルなどのように互いに参照が不可能な単位。但し、スライスやタイルなどの単位であっても互いに参照可能な特性を持つ場合には、同じ分割単位でなくても例外処理)に属さない場合、符号化が完了していない場合のうちのいずれかでも満足する場合には、使用不可と判断することができる。すなわち、前記条件を全く満足しない場合には、使用可能と判断することができる。
また、符号化の設定によって参照画素使用を制限することができる。例えば、前記条件に基づいて使用可能と判断された場合であっても、限られた画面内予測(例えば、constrained_intra_pred_flag)の実行か否かによって参照画素の使用が制限できる。制限された画面内予測は、通信環境などの外部要因へのエラー伝播を防ぐために、他の画像から参照されて復元されたブロックを参照画素として使用禁止しようとするときに行われ得る。
制限された画面内予測が非活性化された場合(例えば、I画像タイプ。又はP又はB画像タイプにおけるconstrained_intra_pred_flag=0)、参照画素候補ブロックはすべて使用可能である。
又は、制限された画面内予測が活性化された場合(例えば、P又はB画像タイプにおけるconstrained_intra_pred_flag=1)、参照画素候補ブロックは符号化モード(Mode_Intra、Mode_InterD、Mode_InterC)に応じて使用有無を判断する条件と仮定することができるが、それ以外の様々な符号化要素によって上記の条件が定められることも可能である。
ここで、Mode_Intra、Mode_Inter_D、Mode_Inter_Cは、それぞれ画面内予測、他のピクチャで参照する画面間予測(ブロックマッチングなど)、現在ピクチャで参照する画面間予測を意味することができる。Mode_Intraの場合には参照が可能であり、Mode_Interの場合には参照が不可能な設定が一般的であり得るが、これに限定されない。
参照画素は、一つ以上のブロックで構成されているので、前記参照画素可能性を確認した後に分類すると、<すべて使用可能>、<一部使用可能>、<すべて使用不可>のように三つの場合に分類することができる。すべて使用可能な場合を除いた残りの場合には、使用不可能な候補ブロック位置の参照画素を満たすか或いは生成することができる。
参照画素候補ブロックが使用可能な場合には、当該位置の画素を対象ブロックの参照画素メモリに含むことができる。この時、前記画素データは、そのままコピーされるか、或いは参照画素フィルタリング、参照画素補間などの過程を経て参照画素メモリに含むことができる。また、参照画素候補ブロックが使用不可能な場合には、参照画素生成過程を経て取得された画素を対象ブロックの参照画素メモリに含むことができる。
次に、さまざまな方法を用いて、使用不可能なブロック位置の参照画素を生成する例を示す。
例えば、任意の画素値を用いて参照画素を生成することができる。ここで、任意の画素値とは、画素値の範囲(例えば、ビット深度に基づいた画素値の範囲又は当該画像内の画素分布による画素値の範囲)に属する一つの画素値(例えば、画素値の範囲の最小値、最大値、中央値など)であり得る。詳細には、参照画素候補ブロックがすべて使用不可能な場合に適用される例であり得る。
又は、画像の符号化が完了した領域から参照画素を生成することができる。詳細には、使用不可能なブロックに隣接する少なくとも一つの使用可能なブロックから参照画素を生成することができる。このとき、外挿、内挿、コピーなどの方法のうちの少なくとも一つを使用することができる。
上記例の場合、参照画素は、対象ブロックを中心に隣接する領域を対象とすることができ、一部の予測モード(例えば、カラーコピーモードなど)で参照される他のカラー空間における、対象ブロックと対応する領域(予測データを取得する領域又はその隣接する領域)も含んで考慮できる。
前記参照画素の構成を完了した後に、参照画素フィルタリング又は参照画素補間を行うことができる。例えば、参照画素フィルタリングのみを行うことができ、参照画素補間のみを行うことができ、参照画素フィルタリングと参照画素補間を行うことができる。参照画素フィルタリングが参照画素補間に先行又は後行してもよく、同時に結合されて行われてもよい。
参照画素フィルタリングは、参照画素に残っている劣化を減らすための目的で行われる過程であり得る。参照画素フィルタリングに[1、2、1]/4、[2、3、6、3、2]/16などのように様々なフィルタタップの長さ及び係数の設定で区分可能な複数のフィルタのうちのいずれかであることができる。また、フィルタの種類を異ならせて複数のフィルタリングが行われてもよい。
参照画素フィルタリングは、明示的に実行有無が決定できるか、或いは符号化の設定に応じて黙示的に実行有無が決定できる。ここで、符号化の設定は、対象ブロックの状態情報(ブロックの大きさ、形状、位置など)、画像タイプ(I/P/B)、カラー成分(Y/Cb/Cr)、参照画素ライン選択情報、サブブロック単位の画面内予測が適用されるか否か、画面内予測モードなどに基づいて定義できる。
参照画素補間は、整数単位の画素だけを参照する予測モードには参照画素補間が行われず、小数単位の画素が参照される予測モードには参照画素補間が行われることができる。
予測モード(例えば、予測モードの方向性。dy/dxなど)と参照画素及び予測画素の位置に基づいて補間が行われる画素位置(つまり、どの小数単位が補間されるか)が決定できる。このとき、小数単位の精度に関係なく、一つのフィルタが適用できるか、或いは複数のフィルタ(例えば、フィルタ係数やフィルタタップの長さを決定するために使用される数式が区分されるフィルタを仮定)のうちのいずれかが小数単位に応じて選択されて適用できる。
前者の場合は、小数単位画素の補間のために整数単位の画素を入力として使用する例であり、後者の場合は、ステップ別に入力画素を異ならせる例(例えば、1/2単位の場合は整数画素を使用。1/4単位の場合は整数と1/2単位画素を使用など)であることができるが、これに限定されず、本発明では、前者の場合を中心に説明する。
参照画素補間のために、固定的なフィルタリング又は適応的なフィルタリングを行うことができる。これは、符号化の設定に応じて定められることができる。ここで、符号化の設定は、対象ブロックの状態情報、画像タイプ、カラー成分、参照画素ライン選択情報、サブブロック単位の画面内予測が適用されるか否か、画面内予測モードなどに基づいて定義できる。
固定的なフィルタリングは、一つのフィルタを用いて参照画素補間を行うことができ、適応的なフィルタリングは、複数のフィルタのうちのいずれかを用いて参照画素補間を行うことができる。
このとき、適応的なフィルタリングの場合は、符号化の設定に応じて、複数のフィルタのうちのいずれかが黙示的に決定できるか、或いは明示的に決定できる。このとき、フィルタの種類は、4−tap DCT−IFフィルタ、4−tapキュービックフィルタ、4−tapガウスフィルタ、6−tapウィーナーフィルタ、8−tapカルマンフィルタなどから一つ以上選択されて構成でき、カラー成分に応じて支援されるフィルタ候補群が異なるように定義されること(例えば、フィルタの種類が一部は同じか異なり、そしてフィルタータブの長さが短いか長いなど)も可能である。
予測ブロック生成部で少なくとも一つの予測モードに応じて予測ブロックを生成することができ、前記予測モードに基づいて参照画素を使用することができる。このとき、参照画素は、予測モードに応じて外挿(Extrapolation)などの方法に使用でき、内挿(Interpolation)又は平均(DC)又はコピー(Copy)などの方法で使用できる。
予測モード決定部では、複数の予測モード候補群の中から最適のモードを選定するための過程が行われる。一般的に、ブロックの歪み{例えば、対象ブロックと復元ブロックの歪み(Distortion)。SAD(Sum of Absolute Difference)、SSD(Sum of Square Differenceなど}と、当該モードに応じた発生ビット量が考慮されるレート歪み(Rate−Distortion)技法を用いて、符号化費用の面で最適なモードを決定することができる。上記の過程を経て決定される予測モードに基づいて生成される予測ブロックを減算部と加算部へ送信することができる。
予測モード符号化部では、予測モード決定部によって選定された予測モードを符号化することができる。予測モード候補群で前記予測モードに対応するインデックス情報を符号化することができるか、或いは前記予測モードを予測してそれに関する情報を符号化することができる。前者の場合は、輝度成分に適用される方法であり、後者の場合は、色差成分に適用される方法であり得るが、これに限定されない。
予測モードを予測して符号化する場合、複数のカテゴリー(k個。kは2、3、4又はそれ以上の整数)に分類して管理することができる。例えば、二つのカテゴリーに分類するとしたとき、一つのカテゴリーは、対象ブロックの予測モードと一致すると予想される予測モードで構成でき、他のカテゴリーは、予測モードと一致する可能性が少ないと予想される予測モードで構成できる。つまり、他のカテゴリーは、対象ブロックの予測モードと一致すると予想されるモードとして選定されない予測モードで構成できる。
上記例の場合、二つのカテゴリーに予測モードを分類する場合であり、それ以上のカテゴリーに分類することもできる。三つのカテゴリーに分類するとき、第1カテゴリーは、対象ブロックの予測モードと一致する可能性が高いと予想される予測モードで構成でき、第2カテゴリーは、対象ブロックの予測モードと一致する可能性が普通であると予想される予測モードで構成でき、第3カテゴリーは、対象ブロックの予測モードと一致する可能性が少ないと予想される予測モードで構成できる。すなわち、第2カテゴリーは、第1カテゴリーに属していない予測モードのうち、対象ブロックの予測モードと一致すると予想される予測モードで構成でき、第3カテゴリーは、第1カテゴリー及び第2カテゴリーに属していない予測モードで構成できる。
カテゴリー分類に対する他の例として、予測方法による分類が可能である。例えば、外挿による予測方法、内挿/平均による予測方法、コピーによる予測方法などに分類することができる。ここで、外挿による予測方法は、方向性モードを意味することができ、内挿/平均による予測方法は、非方向性モードを意味することができ、コピーによる予測方法は、カラーコピーモードに分類することができ、その他の様々な分類が可能である。カラーモードの場合は、他のカラー空間で予測モードを誘導するため、前記方向性又は非方向性モードとは区分できるが、説明の便宜のために、方向性/非方向性モードに分類される場合を仮定する。
予測方法によって二つのカテゴリーに分類する場合、第1カテゴリーには方向性/非方向性モードが構成でき、第2カテゴリーにはカラーコピーモードが構成できる。又は、第1カテゴリーには方向性モードが構成でき、第2カテゴリーには非方向性モードが構成できる。前者の場合は、色差成分の画面内予測に適用可能であり、後者の場合は、輝度成分の画面内予測に適用可能な例であり得る。後述する部分においてもカラーコピーモードが含まれている場合、色差成分の画面内予測モードに適用可能であることを前提するが、カラーコピーモードが含まれていない場合でも、輝度成分の画面内予測モードのみに限定されて適用されないことを理解すべきである。
もし三つのカテゴリーに分類する場合、第1カテゴリーには方向性モードが構成でき、第2カテゴリーには非方向性モードが構成でき、第3カテゴリーにはカラーコピーモードが構成できる。又は、第1カテゴリーには、方向性モードのうちの所定のモード(例えば、垂直、水平、対角線Aモードなど)が構成でき、第2カテゴリーには、方向性モードのうちの所定のモード(例えば、対角線Bモードなど)が構成でき、第3カテゴリーには、カラーコピーモードが構成できる。ここで、対角線Aモードの場合は、予測時に整数画素のみを使用する対角線モードで構成し、対角線Bモードの場合は、予測時に整数画素及び小数画素を使用する対角線モードで構成することができるが、これに限定されない。
上記の説明は、カテゴリーの構成に関する一例であり、これに限定されず、様々な所定の基準によって分類できる。また、複数の所定の基準が混合されてカテゴリーの構成について適用できる。
複数のカテゴリーに予測モードを区分する場合、対象ブロックの予測モードがどのカテゴリーで発生したのかに関する選択情報が発生することができ、各カテゴリー内の候補選択情報が発生することができる。もしカテゴリー内の候補が一つである場合には、候補選択情報が省略できる。前記カテゴリーの選択及びカテゴリー内の候補選択に関する様々な構文要素の構成が可能である。次に、三つのカテゴリーが支援される場合を仮定する。
*カテゴリーの選択に関する一つの構文要素が支援
本例において、カテゴリーの選択のために支援される構文要素の値は、0〜2の値(1以上の値)を持つことができる。一例として、第1〜第3カテゴリーのために、<0>、<10>、<11>のビットが割り当てられる2値化が可能である。つまり、カテゴリーの選択のための一つの構文要素が支援され、各カテゴリーに対するインデックスの割り当て及び2値化が適用される形式で構成できる。
*カテゴリーの選択に関する複数の構文要素が支援
本例において、カテゴリーの選択のために支援される構文要素の値は、0又は1の値(1以上の値も可能)を持つことができる。
一例として、一つの構文要素(第1構文要素)は、第1カテゴリーと第2カテゴリーのために<0>が割り当てられ、第3カテゴリーのために<1>が割り当てられ得る。この時、前記構文要素が<0>の値を持つ場合に、第1カテゴリーと第2カテゴリーの中からいずれか一つを選択する詳細カテゴリーの選択に関する他の一つの構文要素(第2構文要素)が支援でき、当該構文要素は第1カテゴリーと第2カテゴリーのために<0>、<1>が割り当てられ得る。
一例として、一つの構文要素(第1構文要素)は、第1カテゴリーのために<0>が割り当てられ、第2カテゴリーと第3カテゴリーのために<1>が割り当てられ得る。この時、前記構文要素が<1>の値を持つ場合、第2カテゴリーと第3カテゴリーのうちのいずれかを選択する詳細カテゴリーの選択に関する他の一つの構文要素(第2構文要素)が支援でき、当該構文要素は、第2カテゴリーと第3カテゴリーのために<0>、<1>が割り当てられ得る。
上記の例は、カテゴリーの選択のための構文要素の構成に関する一例であり、様々な変形及び構成が可能である。
前記各カテゴリーは、少なくとも一つの予測モードを含むことができる。第1〜第3カテゴリーの予測モードの数はa、b、cであることができ、aはbとcよりも小さいか同じであり、bはcより小さいか同じであり得る。本例において、aは1〜5の間の整数、bは3〜8の間の整数、cは予測モード候補群の個数からaとbの個数を減算した個数と仮定する。前記カテゴリーに属する予測モードにTruncated Rice2値化、Truncated Binary2値化、k−th Exp−Golomb2値化などの可変長2値化又は固定長2値化が適用できる。
後述する例によって、カテゴリーの構成及び設定が固定的な場合を仮定して説明するが、様々な符号化要素に応じて適応的に設定(例えば、カテゴリーの個数、関連フラグの構成など)が可能である。ここで、前記符号化要素は、カラー成分(輝度/色差)、ブロックの状態情報(例えば、ブロックの大きさ、形状、横/縦の長さ比、位置など)、画像タイプ(I/P/B)、サブブロック単位の画面内予測が適用されるか否か、参照画素ライン選択情報などに基づいて定義できる。一例として、前記符号化情報に基づいてカテゴリーの数が二つ又は三つのいずれかに決定できる。
次に、予測モードと一致する可能性に基づいて、複数のカテゴリー3に予測モードを区分し、カテゴリー選択情報及びカテゴリー内の候補選択情報に基づいて予測モードを符号化する例を考察する。但し、カテゴリー構成のために予測方法によるカテゴリーの分類に対する基準が混合される例も可能である。また、第1カテゴリーと第2カテゴリーの中から第2カテゴリーの部分を除くか、或いは第1カテゴリーと第2カテゴリーに関する説明を統合する場合、二つのカテゴリーで構成される説明が誘導できるので、これについての詳細な説明は省略する。
図6は本発明の一実施形態に係る対象ブロックとそれに隣接するブロックの配置図である。
対象ブロックは、それに隣接するブロックと高い相関性を持つことができ、隣接する参照画素を用いて予測を行うだけでなく、隣接するブロックの予測モードも、対象ブロックの予測モードの予測に使用することができる。そこで、対象ブロックの隣接するブロックの予測モードを、第1又は第2カテゴリーに含まれる候補として選定することができる。この際、対象ブロックの左、上、左上、右上、左下ブロックの全部又は一部の予測モードを(先立った)カテゴリーに含まれる候補として考慮することができる。一例として、(左/上)、(左/上/右上)、(左/上/左下)、(左/上/左上/右下/左上)などが考慮できる。
隣接するブロックの予測モードをカテゴリーに含まれる候補として考慮するとき、各方向のブロックから少なくとも一つの予測モードを選定することができる。例えば、左ブロックの場合はL0乃至L3から一つを選定することができ、上ブロックの場合はU0乃至U3から一つを選定することができる。
所定の方向の隣接するブロック(本例において、左、上ブロック)が複数のサブブロックに分割された場合を考慮して予測モードを選定するための特定の位置のサブブロック(例えば、左ブロックはL3、上ブロックはU3)が定義できる。もし当該位置のブロックの予測モードが使用不可能な場合(例えば、当該ブロックが符号化されていない場合、参照不可能な位置にある場合、符号化モード<Intra/Inter>が異なる場合など)であれば、当該方向のブロックでは予測モードを選定しなくてもよい。
又は、予測モード選択のための(サブブロック)優先順位が支援(例えば、L3→L0→L1→L2など)でき、それにより先立った順位の利用可能なサブブロックの予測モードを、当該方向の予測モードとして選定することができる。もしすべての位置のサブブロックの予測モードが使用不可能な場合であれば、当該方向のブロックでは予測モードを選定しなくてもよい。
そして、各方向のブロックから取得される予測モードをカテゴリーに含むための優先順位が支援できる。例えば、左→上→右上→左下→左上、左→上→左下→右上→左上、上→左→左下→右上→左上などの設定が可能であり、これに限定されない。
予測モード候補群に多くの予測モードが含まれているが、この中で一般的に多く発生する予測モードが存在することができる。例えば、垂直、水平方向のエッジは、多く発見可能な画像の特性であることができ、背景などの平坦な領域も多く発見できる。そこで、多く発生すると予想される所定の予測モードを、第1又は第2カテゴリーに含まれる候補として選定することができる。
前記多く発生すると予想される所定の予測モードの候補として、非方向性予測モードであるPlanar(0番)、DCモード(1番)、及び水平(18番)、垂直(50番)、対角線モード(2番、34番、66番など)がその対象となることができる。前記予測モードをカテゴリーに含むための優先順位が支援できる。例えば、Planar→DC→Ver→Horなどの設定が可能であり、これに限定されない。
隣接するブロックの予測モードのうちの全部又は一部が利用不可能な場合であれば、前記所定の予測モード(例えば、Planar、DCなど)の少なくとも一つを代替して満たすことが可能である。
上記の説明によって、対象ブロックの隣接するブロックの予測モードと所定の予測モードを、(先立った)カテゴリーの構成のために考慮される予測モードとして言及した。しかし、予測モード候補群の個数が多い場合、上記の構成では対象ブロックの予測モードを効率よく予測するのに困難を経験することができる。一例として、方向性モードで(図5の予測モードを基準)1、2だけの差が発生する場合には、上記の構成で予測に失敗する場合が発生することができる。
このため、隣接するブロックの予測モードと所定の予測モードに基づいて誘導される予測モードをカテゴリー候補群の構成に考慮することができる。一例として、前記予測モード(本例において、方向性モード)を基準にkの間隔を持つ予測モードを、誘導される予測モードとして考慮することができ、これを第1又は第2カテゴリーに含まれる候補として選定することができる。ここで、kは1、2、3、4又はそれ以上の整数であり得る。
ここで、隣接するブロックの予測モード又は所定の予測モードに基づく予測モードをZと仮定するとき、Z−1、Z+1、Z−2のような誘導される予測モードの優先順位が存在することができる。本例は、1、2のような絶対値の順に優先順位が定められ(一つの絶対値を基準)、<−>符号に次いで、<+>符号が続く場合を仮定するが、これに限定されない。すなわち、前記誘導される予測モードを満たすための間隔情報が1から始まらなくてもよい(例えば、4、8、12などの整数)ことを意味する。そして、隣接するブロックの予測モードと所定の予測モードに基づいて誘導される予測モードとのk間隔は同じか同じでなくてもよい。
また、隣接するブロックの予測モード又は所定の予測モードに基づく予測モードがX、Yであると仮定するとき、X−1、X+1、Y−1、Y+1又はX−1、Y−1、X+1、Y+1などの誘導される予測モードの優先順位が存在することができる。本例は、XがYに先立った順位を持ち、<−>符号と<+>符号が交互に現れるか、或いは一つの符号(本例では、負数)が(一つの絶対値を基準)すべて誘導された後に他の符号(本例では、正数)が誘導される場合を仮定するが、これに限定されない。
また、複数のモード(本例では、X、Y)が誘導されるモードの基準モードとして使用できるか、或いはその中に所定のモード(つまり、X、Yのうちのいずれか)が基準モードとして使用できる。これは、所定の基準によって分類が可能であるが、取得されたブロックの位置(例えば、左側ブロックと上側ブロックのうちのいずれかの特定ブロックのモードを基準モードとして設定)、対象ブロックの形状(例えば、横に長い長方形の形状である場合には、左側と上側のうちの上側ブロックのモード、縦に長い長方形の形状である場合には、左側ブロックのモードを基準モードとして設定。又はその逆の場合など)、予測モードの傾き情報(例えば、垂直又は水平モードを基準に特定の方向<左又は右、上又は下>にさらに傾いたモードを基準モードとして設定)に基づいて定められ得る。
まとめると、所定の予測モードに隣接するブロックの予測モード、そして先立った予測モードに基づいて誘導される予測モードを(先立った)カテゴリーに含むことができる。
各カテゴリーは、所定の予測モードに隣接するブロックの予測モード、そして誘導される予測モードのうちの少なくとも一つの予測モードを含むことができ、説明の便宜のために、それぞれGroup_A、Group_B、Group_Cと呼ぶ。
例えば、第1カテゴリーにはGroup_Aが構成でき、第2カテゴリーにはGroup_A、Group_B、Group_Cが構成でき、第3カテゴリーには残りのモード(この場合は、Group_Cと見ることも可能である)が構成できる。
又は、第1カテゴリーにはGroup_Bが構成でき、第2カテゴリーにはGroup_A、Group_B、Group_Cが構成でき、第3カテゴリーには残りのモードが構成できる。
又は、第1カテゴリーにはGroup_A、Group_Bが構成でき、第2カテゴリーにはGroup_A、Group_B、Group_Cが構成でき、第3カテゴリーには残りのモードが構成できる。
上記の例は、カテゴリーの区分によるモードの構成に関する一例であり、複数のカテゴリーに含まれるGroup_AとGroup_Bの場合は、先立ったカテゴリーで構成されていない残りのモードが後続のカテゴリーに構成される場合と理解できる。また、上記の例に限定されず、様々なカテゴリーの区分によるモードの構成が可能である。
次に、カテゴリーの構成のための予測モードの優先順位が支援され、カテゴリーの優先順位(例えば、1−2−3のカテゴリー順序)に基づいて先順位のカテゴリー(例えば、第1カテゴリー)の個数だけモードの構成が完了すると、残ったモードが後順位のカテゴリー(例えば、第2カテゴリー、第3カテゴリーなど)に構成される場合を仮定する。
後述する例において、Planar(0番インデックスの割当と仮定)→L→A→DC→<L−1>→<L+1>→<A−1>→<A+1>→<L−2>→<L+2>→−<A−2>→<A+2>→Ver→Hor→<Ver−4>→<Ver+4>→<Hor−4>→<Hor+4>などの優先順位が支援される場合を仮定する。
例えば、第1カテゴリーの予測モードの数が一つである場合、Group_Aに属する予測モードはPlanar(0番インデックス)であることができ、予測モードの数が増加するほど、後順位の予測モードでGroup_Aを構成することができる。
また、第2カテゴリーの予測モードの数が一つである場合、第1カテゴリーに最終的に構成された予測モード(m番インデックス)の次の予測モード(m+1番インデックス)からGroup_Bに属する予測モードであることができ、予測モードの数が増加するほど、後順位の予測モードでGroup_Bを構成することができる。
また、第3カテゴリーは、第2カテゴリーに最終的に構成された予測モード(n番インデックス)の次の予測モード(n+1番インデックス)から残った予測モードでGroup_Cを構成することができる。
第1〜第3カテゴリーの予測モードの数(本例は、予測モード候補群が67個である場合)は、(1、5、61)、(2、4、61)、(4、8、55)などの様々な設定が可能であり、予測モード候補群の個数に基づいて定められ得る。
上記の例における所定の予測モードは、符号化の環境に関係なく固定的に支援されるモードであることができ、誘導される予測モードは、既に候補群に存在する予測モードを基準モードにして取得できる。
一方、隣接するブロックの予測モードは、隣接するブロックの状態(例えば、分割単位境界、符号化か否か、符号化モードなど)に応じて取得が難しい場合が発生することができる。ここで、隣接するブロックの状態は、(1)隣接するブロックの全てが利用不可能な場合、(2)隣接するブロックの一部が利用不可能な場合、(3)隣接するブロックの全てが利用可能な場合に区分することができるが、前記優先順位の例は、隣接するブロックの全てが利用可能な場合を仮定して説明できる。
また、隣接するブロックの予測モードは、二つ以上のブロックから取得できるが、前記優先順位の例は、各ブロックの予測モードが重複しない場合を仮定して説明できる。
また、隣接するブロックの予測モードは、所定の予測モードと重複しない場合を仮定して、前記優先順位の例が説明できる。
カテゴリーの構成に関する優先順位は、前記要素を考慮して適応的に設定できる。例えば、隣接するブロックの予測モードに該当するインデックスは、前記優先順位から除去することができ、隣接するブロックの予測モードを基準モードにして誘導されるモードに関するインデックスも除去することができる。これは、隣接するブロックの予測モードが方向性モードであるだけでなく、非方向性モードである場合にも共通に適用される説明であることができる。
また、隣接するブロックの予測モードが重複する場合、重複する他の予測モードに該当するインデックスと誘導されるモードに関するインデックスを除去することができる。又は、前記要素を考慮した優先順位が複数個支援されることにより、それによるカテゴリーの構成が可能である。
本発明の画面内予測では、支援される予測モードの一部を予測モード候補群として構成することができることを言及した。これは、対象ブロックの状態情報(例えば、ブロックの大きさ、形状など)に応じて、それぞれ個別的な予測モード(例えば、方向性モード)が支援できることを意味することができる。
予測モード符号化のために、これを共通する予測モード候補群の構成に統一する過程が、前記符号化過程に先行することができる。例えば、予測モード符号化のための所定の範囲の予測モード候補群の構成に統一することができ、これに基づいて予測モード符号化を行うことができる。この時、前記所定の範囲は、図5の0番乃至66番に該当する予測モードで構成することができるが、これに限定されない。
前記統一過程は、前記所定の範囲にマッピングする過程が行われ得るが、予測モードの方向性に基づいてマッピングが行われ得る。一例として、前記所定の範囲の外に存在する予測モードの場合は、当該予測モードと同様の特性を有する予測モードであって、マッピング過程(例えば、エッジ方向が同じ場合など。つまり、予測の開始点と予測方向は異なるが、エッジ方向が一致する場合を含む)を行うことができ、その他の様々な方法が支援できる。
前記過程によって生成される予測関連情報は、符号化部へ伝送されてビットストリームに収録できる。
上記の説明によって画面内予測が行われる単位は、対象ブロックと呼ぶ。この際、ブロックの設定に応じて、前記対象ブロックは様々なブロック単位で設定できる。
一例として、符号化ブロックが予測ブロック、変換ブロックと同じ単位である場合(つまり、符号化ブロックがすぐに予測ブロック又は変換ブロックに設定される場合)、参照画素領域の設定、参照画素の構成(参照画素フィルタリング/参照画素補間)、予測モード候補群の構成、予測の実行、予測モード符号化などのための画面内予測の対象ブロックは符号化ブロックとして選定できる。
一例として、符号化ブロックが予測ブロック、変換ブロックと同じか同じでない可能性が存在する単位である場合(つまり、符号化ブロックから二つ以上のサブブロック<予測ブロック又は変換ブロック>に分割できる)、画面内予測の対象ブロックは符号化ブロック、予測ブロック及び変換ブロックのうちのいずれかに設定できる。
例えば、(予測モード符号化/予測モード候補群の構成/参照画素の構成)などに符号化ブロックが対象ブロックとして設定でき、(参照画素領域の設定/予測の実行)などに予測ブロック又は変換ブロックが対象ブロックとして設定できる。
又は、(予測モード符号化/予測モード候補群の構成)などに符号化ブロックが対象ブロックとして設定でき、(参照画素領域の設定/参照画素の構成/予測の実行)などに予測ブロック又は変換ブロックが対象ブロックとして設定できる。
まとめると、対象ブロックは、符号化ブロック、予測ブロック及び変換ブロックのうちの一つに設定でき、符号化の設定に応じて詳細構成の対象ブロック単位が定められ得る。
本発明の一実施形態による画像復号化方法において、画面内予測は、次のとおり構成できる。予測部の画面内予測は、予測モード復号化ステップ、参照画素構成ステップ及び予測ブロック生成ステップを含むことができる。また、画像復号化装置は、予測モード復号化ステップ、参照画素構成ステップ、予測ブロック生成ステップを実現する予測モード復号化部、参照画素構成部及び予測ブロック生成部を含むように構成することができる。前述した過程の一部は省略できるか、他の過程が追加でき、前記記載された順序ではない他の順序に変更できる。
画像復号化装置の参照画素構成部、予測ブロック生成部は、画像符号化装置の対応する構成と同じ役割を果たすので、詳細な説明は省略し、予測モード復号化部は、予測モード符号化部で使用した方式を逆に採用して行うことができる。
図7は本発明の一実施形態に係る画面内予測の補正方法を示すフローチャートである。
図7を参照すると、対象ブロックの画面内予測モードを決定し(S700)、画面内予測モードに基づいて予測ブロックを生成することができる(S710)。予測ブロックの補正設定を決定し(S720)、予測ブロックの補正を行うことができる(S730)。
対象ブロックの画面内予測は、対象ブロックの状態情報に基づいて取得される予測モード候補群の中から選定でき、その中の一つの予測モードを決定することができる。
輝度成分の場合は、方向性モードと非方向性モードで構成された予測モード候補群を参照することができ、色差成分の場合は、方向性モードと非方向性モードにカラーモード又はカラーコピーモードが支援される予測モード候補群を参照することができる。
このとき、予測方法による区分は、方向性モード/非方向性モード/カラーコピーモードに区分することができ、各方法は、外挿、内挿又は平均、コピー方法を使用することができるが、これに限定されず、他の変形が可能である。一例として、参照画素領域の設定に応じて、方向性モードは、外挿だけでなく、内挿(双方向予測)が支援される場合が可能である。
まとめると、各予測方法に応じて、画面内予測のための参照領域が異なるように設定できるが、外挿の場合は、対象ブロックの左、上、左上、右上、左下方向のブロックのうちの少なくとも一つが参照領域として設定でき、内挿の場合は、外挿の場合にさらに対象ブロックの右、下、右下方向のブロックのうちの少なくとも一つが参照領域として設定できる。このとき、隣接する領域が符号化されていない場合であれば、符号化された領域の一つ以上の画素から誘導して満たすことができる。また、コピーの場合は、対象ブロックと異なるカラー空間内の対応するブロックが参照領域として設定できる。
前記参照領域のデータと画面内予測モードに基づいて予測ブロックを生成することができる。
予測ブロックに対する補正は、所定の予測モードに応じて生成される予測ブロックが隣接ブロックとの不連続的な境界特性が現れることを減らすために行われ得る。しかし、画像の特性に応じて補正を行うことが、むしろ逆効果が現れることがあるので、様々な符号化要素を考慮して補正を行うことが必要である。
予測ブロックに補正を支援するか否かは、明示的に関連情報が生成できるか、或いは黙示的に決定できる。そして、シーケンスやピクチャなどの上位単位で補正を支援することに決定されても、対象ブロックの補正設定は、画像タイプ、カラー成分、対象ブロックの状態情報、符号化モード、画面内予測モード、サブブロック単位の画面内予測が適用されるか否か、参照画素ライン選択情報などに基づいて定義できる。また、補正に関する設定情報(例えば、ブロック単位の補正を行うかについてのフラグ、補正に適用される重み情報など)が下位単位(例えば、前者の情報はブロック、サブブロックなど)又は上位単位(例えば、後者の情報は、シーケンス、ピクチャ、スライス、タイルなど)に明示的に生成できる。
前記補正の設定は、補正が行われるか否か、補正に使用される参照画素の個数、位置、重みなどを含んで構成できる。補正が行われる場合でも、対象ブロック内の画素の全部又は一部に対して補正が行われ得る。例えば、対象ブロックがm×nである場合、1個乃至(m×n)個の画素に対して補正が行われ得る。
ここで、(画素単位)補正が適用されるか否か、(補正が行われるとき)補正に使用される参照画素の個数(1〜5個)、位置、重みなどは、前記補正設定だけでなく、ブロック内画素の位置などに基づいて設定できる。
ここで、補正が支援される画面内予測モードは、所定の予測モードグループに属するか否かに応じて定められ得る。例えば、Planar、DC、水平、垂直、対角線モード(例えば、右上方向、右下方向、左下方向モードなど。図5の2、34、66番モード)、カラーコピーモードで前記予測モードグループを構成することができる。又は、前記予測モードグループから誘導される予測モード(例えば、方向性モードを基準にkだけの間隔を持つモード。このとき、kは絶対値が1、2、3、4又はそれ以上の整数)をさらに含んで構成することができる。
補正が支援される対象ブロックは、所定の第1閾値の大きさよりも小さいか同じであり得る。ここで、第1閾値の大きさは、対象ブロックが持つことができる最大大きさを意味することができる。
また、補正が支援されるブロックは、所定の第2閾値の大きさよりも大きいか同じであり得る。ここで、第2閾値の大きさは、対象ブロックが持つことができる最小大きさを意味することができる。
ここで、第1閾値の大きさと第2閾値の大きさは、幅(W)、高さ(H)、W×H、W*Hなどで表現でき、WとHは4、8、16、32又はそれ以上の整数であることができる。ここで、第1閾値の大きさは、第2閾値の大きさよりも大きいか同じであることができる。
図8は本発明の一実施形態による対象ブロック及び隣接するブロックの画素に関する配置図である。
図8を参照すると、対象ブロック内の画素(a〜p)、隣接する符号化が完了したブロック内の画素(A〜Q)、及び隣接する符号化が完了していないブロック内の画素(aa〜ii)で構成されている。ここで、対象ブロック内の画素は補正が行われ、隣接するブロック内の画素は補正に参照できる。
この際、隣接するブロックの参照画素は、参照画素前処理過程(例えば、参照画素フィルタリング)が行われないか或いは行われて取得された値の一つであることができる。これは、ブロック単位で決定できるか、或いは画素単位で決定できる。
次に、予測画素に補正が適用されて補正画素が取得される数式を示す。
Z=(z*w0)+(a*w1)+(b*w2)+(c*w3)
ここで、zとZはそれぞれ予測画素と補正画素を意味し、a乃至cは補正に使用される参照画素を意味し、w0乃至w3は補正に適用される重みを意味する。補正に使用される参照画素の個数に応じて、前記参照画素及び重みは定められ得る。このとき、重みは0を含んで正規化を考慮した値が割り当てられ得る。
対象ブロックの予測モードに応じて前記参照画素の位置及び個数が定められ得る。
例えば、対象ブロックの予測モードがPlanar、DC、垂直、水平モードである場合、前記a、b、cは、対象ブロックの外の左上側参照画素(例えば、<−1、−1>)、対象画素のx成分と対応又は相応する対象ブロックの上側参照画素(例えば、<x、−1>)、対象画素のy成分と対応又は相応する対象ブロックの左側参照画素(例えば、<−1、y>)に設定することができる。
ここで、Planar、DCモードの場合は、対象ブロックの上側と左側の参照画素変化度を反映するために、w2とw3に重みを割り当てることができる。これは、対象画素のxとy成分に対応する参照画素からどれほど変化するかに基づいた重み設定の一例(例えば、w1は0)であることができる。
ここで、垂直モードの場合は、予測方向と対応する参照画素の変化度を反映するために、w0に負の符号を有する重みを割り当て、w3には正の符号(つまり、反対される符号)を有する重みを割り当てることことができる。これは、対象画素のy成分に対応する参照画素が左上側参照画素からどれほど変化するかに基づいた重み設定の一例(例えば、w2は0)であることができる。水平モードの場合は、垂直モードでの関連説明を誘導することができるので、詳細な説明は省略する。
又は、対象ブロックの予測モードが対角線モードである場合、前記a、b、cは、対象ブロックの外の左上側参照画素、対象ブロックの予測方向の開始点に対応又は相応する参照画素(例えば、<x+y+1、−1>)、対象ブロックの予測方向の開始点反対側に対応又は相応する参照画素(例えば、<−1、x+y+1>)に設定することができる。この時、前記参照画素が整数単位で取得されていない場合(つまり、小数単位で補間が必要な場合)には、隣接する一つの参照画素に置き換えるか、或いは両方に隣接する参照画素を介して補間して取得する方法の一つに設定することができる。
ここで、右上方向の対角線モードの場合は、予測方向の開始点に位置した画素画素と反対側に位置する参照画素の変化度を反映するために、w3に重みを割り当てることができる。これは、対象画素の予測方向の線上に置かれた参照画素からどれほど変化するかに基づいた重み設定の一例(例えば、w1とw2は0)であることができる。左下方向の対角線モードの場合は、前記モードでの関連説明を誘導することができるので、詳細な説明は省略する。
図9は本発明の一実施形態に係る多重参照画素ラインに基づいた補正方法に関する例示図である。
後述する例は、前述した複数の参照画素ラインから、画面内予測に使用される参照画素ラインが選択される構成とは別に支援できる構成であることができ、それに基づいて説明するが、相互結合される構成への適用も可能である。
図9を参照すると、(a)は水平又は垂直モードでの補正に対する例示を示す。詳細には、二つ以上の参照画素ラインの参照画素が補正に使用される場合に対する例示であることができる。
対象ブロックの予測モードが垂直モードである場合には、aに加えてaを参照画素として設定することにより、補正の精度を向上させることができる。又は、aとaに重み平均を適用してa**を取得した後、前述した補正数式に適用することもできる。
これは、ブロック分割が画像特性を正確に区分する境界線を持つように行われないので、対象ブロックの隣接する参照画素を予測画素として使用するのと同じ理由であることができる。
対象ブロックの予測モードが水平モードである場合には、bに加えてbを参照画素として設定して補正の精度を向上させることができ、bとbに重み平均を適用してb**を取得した後、前述した補正数式に適用することができる。
図9を参照すると、(b)は対角線モードでの補正に対する例示を示す。詳細には、二つ以上の参照画素ラインの参照画素が補正に使用される場合の例示であることができる。
対象ブロックの予測モードが左下方向である場合には、予測の開始点位置のaに加えてaを参照画素として設定することにより、補正の精度を向上させることができるか、或いは、aとaに重み平均を適用してa**を取得した後、前述した補正数式に適用することもできる。
また、予測の開始点反対側の位置のbに加えてbを参照画素として設定することにより、補正の精度を向上させることができるか、或いは、bとbに重み平均を適用してb**を取得した後、前述した補正数式に適用することもできる。
対角線モードの場合、予測の開始点又は開始点の反対側のうちの一つ以上の参照画素に基づいて取得された参照画素を補正に使用することができる。この時、前記参照画素は、予測モードの方向線上に置かれた画素を対象に選定することができる。
上記の例で多重参照画素ラインに位置する参照画素を補正に使用する場合は、画像タイプ、カラー成分、対象ブロックの状態情報、画面内予測モード、サブブロック単位の画面内予測モードが適用されるか否か、参照画素ライン選択情報などに基づいて支援有無が決定できる。
図10は本発明の一実施形態に係る画面内予測の補正方法を示すフローチャートである。
図10を参照すると、対象ブロックの補正のための任意の画素を取得し(S900)、対象ブロックと画面内予測モードに基づいて補正設定を決定し(S910)、予測ブロックの補正を行うことができる(S920)。
予測ブロックの補正のために、対象ブロックに隣接するブロックは、特定の方向(例えば、左上方向)に偏って構成できるが、これは、ラスタースキャン又はZスキャンの方法による符号化順序により発生する状況である。
特定の方向に偏った参照画素を対象に予測及び補正を行うことに加えて、符号化が完了していない領域のデータを使用することにより、予測の精度を向上させることができる。このため、任意の画素を取得する過程が行われ得る。このとき、任意の画素個数は、1、2又はそれ以上の整数であり得る。
例えば、対象ブロックの補正に使用される任意の画素は、図8のaa乃至ii画素の中から定められ得る。詳細には、対象ブロックの隣接するブロックのうち未だ符号化が完了していない領域に属する画素が任意の画素として設定できる。
又は、図8のa乃至p画素の中から定められ得る。詳細には、対象ブロックも、未だ符号化が完了していない画素に属するので、任意の画素選定対象に含まれ得る。
図11は本発明の一実施形態に係る予測画素補正に使用される任意の画素の例示図である。
図11を参照すると、(a)の場合は対象ブロック内の右下側画素、(b)の場合は対象ブロックの外の右下側画素、(c)の場合は対象ブロックの外の下側と左側画素、(d)の場合は対象ブロックの外の下側画素、(e)の場合は対象ブロックの外の右側画素が任意の画素(X、X1、X2)として定められる例示図を示す。
任意の画素を用いて補正を行うか否かは、明示的に関連情報が生成できるか、或いは黙示的に決定できる。そして、シーケンス、ピクチャなどの上位単位で任意の画素を使用することに決定されても、任意の画素に関する設定は、画像タイプ、カラー成分、対象ブロックの状態情報、符号化モード、画面内予測モード、サブブロック単位の画面内予測が適用されるか否か、参照画素ライン選択情報などに基づいて定義できる。また、任意の画素に関する設定情報(例えば、ブロック単位で任意の画素を用いて補正を行うかに関するフラグ等)が明示的に生成できる。
前記任意の画素に関する設定は、任意の画素を使用するか否か(つまり、補正に任意の画素を使用するか否か)、任意の画素の個数、位置などを含んで構成できる。
ここで、任意の画素を用いて補正を行う画面内予測モードは、所定の予測モードグループに属するか否かによって定められ得る。例えば、Planar、DC、水平、垂直、対角線モード(例えば、右上方向、右下方向、左下方向モードなど。図5の2、34、66番モード)、カラーコピーモードで前記予測グループを構成することができる。又は、前記予測モードグループから誘導される予測モード(例えば、方向性モードを基準にkだけの間隔を有するモード。このとき、kは、絶対値が1、2、3、4又はそれ以上の整数)をさらに含んで構成することができる。
任意の画素を用いて補正が行われる対象ブロックは、所定の第1閾値の大きさよりも小さいか同じであることができ、第1閾値の大きさは、対象ブロックが持つことができる最大大きさを意味することができる。又は、所定の第2閾値の大きさより大もきいか同じであることができ、第2閾値の大きさは、対象ブロックが持つことができる最小大きさを意味することができる。ここで、前記閾値の大きさは幅(W)、高さ(H)、W×H、W*Hなどで表現でき、WとHは4、8、16、32又はそれ以上の整数であることができ、第1閾値の大きさは第2閾値の大きさよりも大きいか同じであることができる。
上記の説明は、以前の実施形態によって言及した補正設定の下位構成に属するか或いは結合される内容と理解することができるので、重複説明は省略する。後述する例では、図11の(a)に任意の画素が設定される場合を仮定する。
任意の画素位置は、未だ符号化が完了していない領域であるため、様々な方法で当該位置の画素値を取得することができる。
例えば、任意の画素位置に関するデータを明示的に符号化することができる。当該位置の画素値をそのまま符号化(例えば、ビット深度に基づく)することができるか、或いは所定の分割値(例えば、量子化。補正への使用時には量子化された値を使用)で取得された値を符号化することができる。
又は、任意の画素位置に関するデータ候補値を対象ブロックの隣接する符号化が完了した領域から二つ以上取得し、これに対するインデックス情報を構成して符号化することができる。一例として、任意の画素位置の画素値が67であり、対象ブロックの隣接領域(例えば、上側領域)から取得された第1候補値が70、対象ブロックの隣接領域(例えば、左側領域)から取得された第2候補値が85であって合計二つの候補が支援されるとき、候補値選択情報(例えば、第1候補値として選定。1ビットのフラグ)を符号化することができる。このとき、前記候補値の取得について後述する例で言及される方法が使用されてもよい。前記候補値は、2、3、4又はそれ以上の整数だけ支援できる。
上記例の場合、任意の画素位置のデータについての情報を明示的に符号化する場合であることができ、黙示的に任意の画素位置のデータを取得することができる。
例えば、所定の位置の参照画素又は任意の画素位置に対応又は相応する参照画素から取得することができる。所定の位置に対する例として、対象ブロックの外の左上側、上側、左側位置の参照画素(図8のA、E、M)から取得することもでき、前記位置における対象ブロックの幅又は高さに基づいた位置(右上側、左下側)の参照画素(図8のI、Q)から取得することもできる。
また、任意の画素位置に対応する参照画素の例として、任意の画素のx又はy成分と対応する参照画素(例えば、<x、−1>、<−1、y>、<x+y+1、−1>、<−1、x+y+1>など)から取得することができる。
前記位置の参照画素のうち、一つの参照画素のデータ値をそのまま任意の画素位置のデータ値として取得することができるか、或いは二つ以上の参照画素に基づいて誘導された値(例えば、距離による重み平均など)を任意の画素位置のデータ値として取得することができる。
例えば、任意の画素位置に使用される複数の参照画素のうち所定の位置の参照画素を任意の画素位置のデータ値として取得することができる。又は、複数の参照画素のうち、所定のプロセス(例えば、最大値、最小値、中央値など)で取得された値を任意の画素位置のデータ値として取得することができる。又は、複数の参照画素のうち、所定のプロセス(例えば、重み平均など)で取得された値を任意の画素位置のデータ値として取得することができる。
次に、複数の参照画素に基づいて任意の画素位置のデータ値を取得する方法について説明する。図8のA、E、Mが参照画素として使用される場合を仮定し、後述する例では、x、y、zと呼ぶ。
Figure 2021536718
前記表の0番乃至2番候補は、所定の位置の参照画素を任意の画素位置のデータ値として取得する場合を意味する。3番乃至6番候補は、対象ブロックの変化度を反映して任意の画素位置のデータを取得するための場合を意味する。詳細には、対象ブロックの変化度を所定の位置の参照画素に基づいて取得する場合に該当することができる。
上記の例は、対象ブロックが正方形の形状である場合を仮定して、複数の画素から誘導される数式の一例であり、ブロックの横/縦の長さ比に応じて変更適用できることを理解すべきである。また、任意の画素位置のデータ値は、上記の例に限定されず、様々な方法によって取得できる。
図12は本発明の一実施形態に係る任意の画素に基づいて補正が行われる例示図である。
図12を参照すると、(a)は任意の画素と上側ブロックに対応する参照画素を用いてそれらの間を補間する過程を示し、これにより取得された対象ブロックの左、右、上、左上、右上方向の参照画素を用いて補正を行う過程を示す。
前記過程は、対象ブロックの予測モードが垂直モードである場合に左、右方向の参照画素の変化度を反映して補正を行おうとするときに適用することができる。これは、従来の場合の左方向の参照画素の変化度に基づいて補正を行おうとするときとは異なる点であり得る。
図12を参照すると、(c)は、任意の画素と左側ブロックに対応する参照画素を用いてそれらの間を補間する過程を示し、これにより取得された対象ブロックの上、下、左、左上、左下方向の参照画素を用いて補正を行う過程を示す。
前記過程は、対象ブロックの予測モードが水平モードである場合に上、下方向の参照画素の変化度を反映して補正を行おうとするときに適用することができる。これは、従来の場合の上方向の参照画素の変化度に基づいて補正を行おうとするときとは異なる点であり得る。
図12を参照すると、(e)は、任意の画素と左側及び上側ブロックに対応する参照画素を用いてそれらの間を補間する過程を示し、これにより取得された対象ブロックの上、下、左、右、左上、右上、左下、右下方向の参照画素を用いて補正を行う過程を示す。
次に、予測画素に補正が適用されて補正画素が取得される数式を示す。このとき、参照画素は、任意の画素又は任意の画素に基づいて取得された参照画素が含まれることが、以前の数式とは異なる構成であり得る。
Z=(z*w0)+(a*w1)+(b*w2)+(c*w3)+(d*w4)+(e*w5)
ここで、zとZはそれぞれ予測画素と補正画素を意味し、a乃至eは補正に使用される参照画素を意味し、w0乃至w5は補正に適用される重みを意味する。補正に使用される参照画素の個数に応じて、前記参照画素及び重みは定められ得る。このとき、重みは、0を含んで正規化を考慮した値が割り当てられ得る。
対象ブロックの予測モードに応じて前記参照画素の位置及び個数が決定でき、図12のような様々な場合が可能である。その他の補正設定に関する説明は、以前の数式に関する部分から誘導することができるので、詳細な説明は省略する。
様々な実施形態によって画面内予測で補正を行う場合を説明した。ここで、補正は、予測ブロックを取得した後に行われる場合に限定して説明したが、画面内予測過程(つまり、予測ブロック生成過程)に反映されて行われる場合が可能である。
また、補正過程で生成されるフラグ情報は、画面内予測モードとは別個の構成で符号化/復号化できるが、画面内予測モードと結合されるか或いは依存的な構成が可能である。つまり、画面内予測過程以後の付加的又は後続的な部分に限定されないことを理解すべきである。
本発明に係る方法は、様々なコンピュータ手段を介して実行できるプログラム命令形態で実現され、コンピュータ可読媒体に記録できる。コンピュータ可読媒体は、プログラム命令、データファイル、データ構造などを単独で又は組み合わせて含むことができる。コンピュータ可読媒体に記録されるプログラム命令は、本発明のために特別に設計されて構成されたもの、又はコンピュータソフトウェア当業者に公知されて使用可能なものである。
コンピュータ可読媒体の例には、ROM、RAM、フラッシュメモリ(flash memory)などのようにプログラム命令を格納及び実行するように特別に構成されたハードウェア装置が含まれ得る。プログラム命令の例には、コンパイラ(compiler)によって作られる機械語コードだけでなく、インタープリタ(interpreter)などを用いてコンピュータによって実行できる高級言語コードを含むことができる。上述したハードウェア装置は、本発明の動作を行うために少なくとも一つのソフトウェアモジュールとして作動するように構成でき、その逆も同様である。
また、上述した方法又は装置は、その構成や機能の全部又は一部が結合されて実現されるか、分離されて実現され得る。
上記では、本発明の好適な実施形態を参照して説明したが、当該技術分野の熟練した当業者は、下記の特許請求の範囲に記載された本発明の思想及び領域から逸脱することなく、本発明を多様に修正及び変更させることができることが理解できるだろう。
本発明は、ビデオ信号を符号化/復号化するために利用可能である。

Claims (9)

  1. 対象ブロックの画面内予測モードを決定するステップと、
    前記画面内予測モードに基づいて前記対象ブロックの予測ブロックを生成するステップと、
    前記予測ブロックを補正するステップとを含み、
    前記対象ブロックの画面内予測モードは、前記対象ブロックの状態情報に応じた予測モード候補群内のモードに決定される、画像復号化方法。
  2. 前記対象ブロックのカラー成分が輝度成分である場合、方向性モードと非方向性モードで構成された予測モード候補群を参照し、
    前記対象ブロックのカラー成分が色差成分である場合、方向性モード、非方向性モード、カラーモード又はカラーコピーモードのうちの少なくとも一つが支援される予測モード候補群を参照する、請求項1に記載の画像復号化方法。
  3. 前記予測モード候補群は、各カテゴリーに含むことが可能な予測モードの最大個数又は優先順位を考慮して、複数のカテゴリーに分類される、請求項2に記載の画像復号化方法。
  4. 前記予測モード候補群は、非方向性モードと方向性モードを含む第1カテゴリー、及びカラーコピーモードを含む第2カテゴリーに分類される、請求項2に記載の画像復号化方法。
  5. 複数のカテゴリーのうちのいずれかを特定する第1情報を取得するステップと、
    前記第1情報によるカテゴリー内で前記対象ブロックの画面内予測モードを特定する第2情報を取得するステップとをさらに含み、
    前記対象ブロックの画面内予測モードは、前記第1情報及び前記第2情報に基づいて、前記特定されたカテゴリーから決定される、請求項3に記載の画像復号化方法。
  6. 前記第2情報は、前記第1情報によるカテゴリーに一つの予測モードのみが含まれている場合には取得されない、請求項5に記載の画像復号化方法。
  7. 前記画面内予測に使用される参照画素を構成するステップをさらに含み、
    前記参照画素は、復号化装置で支援される複数の参照画素ラインの全部又は一部に属する、請求項1に記載の画像復号化方法。
  8. 前記構成された参照画素に加重フィルタ又は補間フィルタのうちの少なくとも一つを行うステップをさらに含む、請求項7に記載の画像復号化方法。
  9. 前記予測ブロックを補正するステップは、所定の符号化情報に基づいて選択的に行われ、
    前記符号化情報は、画像タイプ、カラー成分、状態情報、符号化モード、画面内予測モード、サブブロック単位の画面内予測が適用されるか否か、又は参照画素ラインのうちの少なくとも一つを含む、請求項1に記載の画像復号化方法。
JP2021537423A 2018-09-07 2019-09-09 画像符号化/復号化方法及び装置 Active JP7453236B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2024032951A JP2024063178A (ja) 2018-09-07 2024-03-05 画像符号化/復号化方法及び装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR10-2018-0107256 2018-09-07
KR20180107256 2018-09-07
PCT/KR2019/011648 WO2020050704A1 (ko) 2018-09-07 2019-09-09 영상 부호화/복호화 방법 및 장치

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2024032951A Division JP2024063178A (ja) 2018-09-07 2024-03-05 画像符号化/復号化方法及び装置

Publications (3)

Publication Number Publication Date
JP2021536718A true JP2021536718A (ja) 2021-12-27
JPWO2020050704A5 JPWO2020050704A5 (ja) 2022-09-20
JP7453236B2 JP7453236B2 (ja) 2024-03-19

Family

ID=69723085

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2021537423A Active JP7453236B2 (ja) 2018-09-07 2019-09-09 画像符号化/復号化方法及び装置
JP2024032951A Pending JP2024063178A (ja) 2018-09-07 2024-03-05 画像符号化/復号化方法及び装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2024032951A Pending JP2024063178A (ja) 2018-09-07 2024-03-05 画像符号化/復号化方法及び装置

Country Status (15)

Country Link
US (3) US11128859B2 (ja)
EP (1) EP3849193A4 (ja)
JP (2) JP7453236B2 (ja)
KR (1) KR20210046804A (ja)
CN (1) CN112740699A (ja)
AU (2) AU2019336046B2 (ja)
BR (1) BR112021004326A2 (ja)
CA (1) CA3112936A1 (ja)
IL (1) IL281260A (ja)
MX (2) MX2021002548A (ja)
PH (1) PH12021550492A1 (ja)
RU (2) RU2022109978A (ja)
SG (1) SG11202101877PA (ja)
WO (1) WO2020050704A1 (ja)
ZA (2) ZA202101432B (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200213595A1 (en) * 2018-12-31 2020-07-02 Comcast Cable Communications, Llc Methods, Systems, And Apparatuses For Adaptive Processing Of Non-Rectangular Regions Within Coding Units

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101503269B1 (ko) * 2010-04-05 2015-03-17 삼성전자주식회사 영상 부호화 단위에 대한 인트라 예측 모드 결정 방법 및 장치, 및 영상 복호화 단위에 대한 인트라 예측 모드 결정 방법 및 장치
US9025661B2 (en) * 2010-10-01 2015-05-05 Qualcomm Incorporated Indicating intra-prediction mode selection for video coding
US10021384B2 (en) * 2010-12-23 2018-07-10 Samsung Electronics Co., Ltd. Method and device for encoding intra prediction mode for image prediction unit, and method and device for decoding intra prediction mode for image prediction unit
US8913662B2 (en) * 2011-01-06 2014-12-16 Qualcomm Incorporated Indicating intra-prediction mode selection for video coding using CABAC
AU2012200345B2 (en) * 2012-01-20 2014-05-01 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding the significance map residual coefficients of a transform unit
KR101475286B1 (ko) * 2013-01-18 2014-12-23 연세대학교 산학협력단 인트라 예측 방법 및 장치, 그리고 영상 처리 장치
JP6112031B2 (ja) * 2013-03-29 2017-04-12 株式会社Jvcケンウッド 画像復号装置、画像復号方法及び画像復号プログラム
KR20140123008A (ko) * 2013-04-05 2014-10-21 삼성전자주식회사 휘도차를 보상하기 위한 인터 레이어 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치
KR102145439B1 (ko) * 2015-03-23 2020-08-18 엘지전자 주식회사 인트라 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
WO2017018664A1 (ko) * 2015-07-28 2017-02-02 엘지전자(주) 인트라 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
EP3367680B1 (en) * 2015-10-22 2020-07-01 LG Electronics Inc. Intra-prediction method and apparatus in video coding system
US11259047B2 (en) * 2016-04-06 2022-02-22 Kt Corporation Method and apparatus for processing video signal
CN117221601A (zh) * 2016-06-22 2023-12-12 Lx 半导体科技有限公司 图像编码/解码设备以及传输图像数据的设备
US11368681B2 (en) * 2016-07-18 2022-06-21 Electronics And Telecommunications Research Institute Image encoding/decoding method and device, and recording medium in which bitstream is stored
WO2018026166A1 (ko) * 2016-08-01 2018-02-08 한국전자통신연구원 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
CN109565591B (zh) * 2016-08-03 2023-07-18 株式会社Kt 用于对视频进行编码和解码的方法和装置
WO2018116925A1 (ja) 2016-12-21 2018-06-28 シャープ株式会社 イントラ予測画像生成装置、画像復号装置、および画像符号化装置
US10904568B2 (en) * 2017-03-09 2021-01-26 Kt Corporation Video signal processing method and device for intra prediction of coding or prediction blocks based on sample position based parameters
CN117395405A (zh) * 2017-04-28 2024-01-12 英迪股份有限公司 图像解码方法、图像编码方法和用于发送比特流的方法
US10742975B2 (en) * 2017-05-09 2020-08-11 Futurewei Technologies, Inc. Intra-prediction with multiple reference lines
KR101883430B1 (ko) * 2017-08-30 2018-07-30 삼성전자주식회사 영상 부호화 방법 및 장치, 그 기록매체
CN111434109A (zh) * 2017-11-28 2020-07-17 韩国电子通信研究院 图像编码/解码方法和装置以及存储有比特流的记录介质
US10771781B2 (en) * 2018-03-12 2020-09-08 Electronics And Telecommunications Research Institute Method and apparatus for deriving intra prediction mode
JP2021522713A (ja) 2018-04-24 2021-08-30 サムスン エレクトロニクス カンパニー リミテッド ビデオ符号化方法及びその装置、ビデオ復号方法及びその装置

Also Published As

Publication number Publication date
AU2019336046B2 (en) 2024-02-15
PH12021550492A1 (en) 2021-11-08
JP7453236B2 (ja) 2024-03-19
RU2022109978A (ru) 2022-05-04
ZA202203000B (en) 2023-10-25
AU2024200258A1 (en) 2024-02-01
SG11202101877PA (en) 2021-03-30
RU2771250C1 (ru) 2022-04-29
ZA202101432B (en) 2024-02-28
AU2019336046A1 (en) 2021-05-06
US11616944B2 (en) 2023-03-28
EP3849193A1 (en) 2021-07-14
US20230171398A1 (en) 2023-06-01
WO2020050704A1 (ko) 2020-03-12
CA3112936A1 (en) 2020-03-12
EP3849193A4 (en) 2022-09-28
MX2021002548A (es) 2021-04-29
IL281260A (en) 2021-04-29
JP2024063178A (ja) 2024-05-10
MX2023007730A (es) 2023-07-06
US11128859B2 (en) 2021-09-21
KR20210046804A (ko) 2021-04-28
CN112740699A (zh) 2021-04-30
BR112021004326A2 (pt) 2021-07-20
US20210092365A1 (en) 2021-03-25
US20210092397A1 (en) 2021-03-25

Similar Documents

Publication Publication Date Title
KR102378882B1 (ko) 영상 부호화/복호화 방법 및 장치
US11956425B2 (en) Image encoding/decoding method and device
US20240080440A1 (en) Method and apparatus for encoding/decoding images
KR102296536B1 (ko) 색차 성분에 관한 화면내 예측 부호화/복호화 방법 및 장치
JP2024063178A (ja) 画像符号化/復号化方法及び装置
KR20240036533A (ko) 복수의 예측 모드 후보군을 사용하여 화면내 예측을 수행하는 영상 부호화/복호화 방법 및 장치
KR20190112249A (ko) 영상 부호화/복호화 방법 및 장치
KR20190113611A (ko) 영상 부호화/복호화 방법 및 장치

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220909

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220909

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230721

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230829

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231031

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240117

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240209

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240307

R150 Certificate of patent or registration of utility model

Ref document number: 7453236

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150