JP2021500818A - 画像データ符号化及び復号化 - Google Patents

画像データ符号化及び復号化 Download PDF

Info

Publication number
JP2021500818A
JP2021500818A JP2020523332A JP2020523332A JP2021500818A JP 2021500818 A JP2021500818 A JP 2021500818A JP 2020523332 A JP2020523332 A JP 2020523332A JP 2020523332 A JP2020523332 A JP 2020523332A JP 2021500818 A JP2021500818 A JP 2021500818A
Authority
JP
Japan
Prior art keywords
sample
prediction
image
current
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020523332A
Other languages
English (en)
Other versions
JPWO2019081927A5 (ja
Inventor
ステファン マーク キーティング
ステファン マーク キーティング
カール ジェームス シャーマン
カール ジェームス シャーマン
マガリ キムリー ミリ フィリップ
マガリ キムリー ミリ フィリップ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of JP2021500818A publication Critical patent/JP2021500818A/ja
Publication of JPWO2019081927A5 publication Critical patent/JPWO2019081927A5/ja
Priority to JP2023148233A priority Critical patent/JP2023166555A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • H04N19/45Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder performing compensation of the inverse transform mismatch, e.g. Inverse Discrete Cosine Transform [IDCT] mismatch
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/156Availability of hardware or computational resources, e.g. encoding based on power-saving criteria

Abstract

画像データ符号化及び復号化。画像符号化装置は、それぞれ少なくとも予測方向を定義する一連の予測動作候補の中から、現在の画像の現在の領域のサンプルを予測するための予測動作を選択するように構成されるセレクタであって、現在の領域はサンプルの複数の行及び複数の列のアレイを含むセレクタと、現在の予測対象サンプルと複数の参照サンプル間の参照位置との間の選択された予測動作によって定義される予測方向に基づいて、同じ画像の参照サンプル群のうちの1以上の参照サンプルに対する現在の領域の予測サンプルを導出するように構成されるイントラ画像予測部であって、少なくとも一部の予測動作候補に関して、参照サンプル群はそれぞれ現在の領域から離れた異なる場所に配置された参照サンプルの複数の平行線形アレイを含むイントラ画像予測部と、参照サンプルの上記複数の平行線形アレイのいずれかに対応するサンプルが現在の領域のサンプルの予測に利用することができないかどうかを検出するように構成される検出部であって、参照サンプルの上記複数の平行線形アレイのいずれかが利用できない場合は、利用できない参照サンプルに基づく予測動作候補が上記セレクタによって選択されることを妨ぐように構成される検出部とを含む。【選択図】図47

Description

本願は、2017年10月27日に提出されたGB1717684.3及び2018年6月1日に提出されたGB1809024.1に対する優先権を主張する。両出願の内容は参照により本明細書に組み入れられる。
本開示は、画像データ符号化及び復号化に関する。
本明細書に記載する背景技術の説明は、本開示がどのような文脈で為されたかの概要を説明する目的で記載するものである。本願の発明者として名前を挙げているものの研究内容は、この背景技術のセクションに記載されている限りにおいて、出願時に先行技術と認められない部分と同様に、本開示に対する先行技術として明示的にも暗示的にも認めるものではない。
ビデオデータを周波数領域表現に変換し、周波数領域係数を量子化し、その後、量子化係数に対して何らかのエントリ符号化を適用する、いくつかのビデオデータ符号化及び復号化システムが存在している。これにより、ビデオデータの圧縮が実現される。元のビデオデータの再構築バージョンを復元するためには、対応する復号化又は解凍技術が適用される。
H.264/MPEG−4アドバンスド・ビデオ符号化(AVC:Advanced Video Coding)などで使用されているような、現在におけるビデオコーデック(コーダ‐デコーダ)は、主に、連続的なビデオフレーム間における差を符号化するだけでデータ圧縮を実現している。これらのコーデックは、マクロブロックと呼ばれる規則的なアレイを使用している。マクロブロックのそれぞれは、以前のビデオフレームにおける対応するマクロブロックとの比較領域として使用される。また、マクロブロック内における画像領域は、そのとき、ビデオシーケンスにおける、対応する現在及び以前のマクロブロック間、あるいは、ビデオシーケンスにおける単フレーム内の隣接マクロブロック間において見出された移動度に応じて符号化される。
H.265又はMPEG−Hパート2としても知られている高効率ビデオ符号化(HEVC:High Efficiency Video Coding)は、H.264/MPEG−4AVCの後継案である。HEVCでは、ビデオ画質が改善され、H.264と比べてデータ圧縮率が2倍とされている。また、ピクセル解像度が128×96から7680×4320まで拡張可能であり、大まかには、128kbit/sから800Mbit/sまでの範囲のビットレートに等しい。
本願は、このような処理により発生する問題に対処し又は軽減する。
本開示各態様及び特徴は、添付の特許請求の範囲において定義される。
なお、上述の一般的な説明及び以降の詳細な説明は、本発明の一例であり、これらに限定されるものではない。
添付の図面と合わせて検討される以下の詳細な記載を参照することにより、記載する実施形態は更なる利点と共に最も良好に理解される。
ビデオデータの圧縮と解凍を用いるオーディオ/ビデオ(A/V)データ送受信システムを示す概略図である。 ビデオデータの圧縮と解凍を用いるビデオ表示システムを示す概略図である。 ビデオデータの圧縮と解凍を用いるオーディオ/ビデオ記憶システムを示す概略図である。 ビデオデータの圧縮を用いるビデオカメラを示す概略図である。 記憶媒体を示す概略図である。 記憶媒体を示す概略図である。 ビデオデータ圧縮及び解凍装置を示す概略図である。 予測部を示す概略図である。 部分的に符号化された画像を示す概略図である。 可能なイントラ予測方向の組を示す概略図である。 予測モードの組を示す概略図である。 可能なイントラ予測方向の組を示す概略図である。 イントラ予測処理を示す概略図である。 参照サンプル射影処理を示す概略図である。 参照サンプル射影処理を示す概略図である。 予測部を示す概略図である。 射影参照サンプルの使用について示す概略図である。 射影参照サンプルの使用について示す概略図である。 予測処理を示す概略図である。 補間技術の例を示す概略図である。 補間技術の例を示す概略図である。 補間技術の例を示す概略図である。 各参照サンプルの行と列の群を示す概略図である。 各参照サンプルの行と列の群を示す概略図である。 各参照サンプルの行と列の群を示す概略図である。 各参照サンプルの行と列の群を示す概略図である。 図23の射影バージョンを示す概略図である。 図24の射影バージョンを示す概略図である。 図25の射影バージョンを示す概略図である。 図26の射影バージョンを示す概略図である。 イントラモードセレクタを示す概略図である。 図31のイントラモードセレクタの操作方法を示す概略的なフローチャートである。 図31のイントラモードセレクタの操作方法を示す概略的なフローチャートである。 イントラモードセレクタを示す概略図である。 イントラ予測部の操作方法を示す概略的なフローチャートである。 予測部の操作方法を示す概略的なフローチャートである。 イントラ予測部の機能の一部を示す概略図である。 図37の配置の操作を示す概略的なフローチャートである。 各方法について示す概略的なフローチャートである。 各方法について示す概略的なフローチャートである。 符号化単位の配列を示す概略図である。 サンプル予測部を示す概略図である。 参照サンプルストレージを示す概略図である。 参照サンプルストレージを示す概略図である。 イントラモードセレクタを示す概略図である。 予測処理を示す概略図である。 予測処理を示す概略図である。 予測処理を示す概略図である。 予測処理を示す概略図である。 各方法について示す概略的なフローチャートである。 各方法について示す概略的なフローチャートである。
図面を参照すると、図1〜図4には、本発明の実施形態に関連して、以降で説明される圧縮及び/又は解凍装置を利用する装置及びシステムが概略的に示されている。
以降で説明される全てのデータ圧縮及び/又は解凍装置は、ハードウェアで実現されてもよいし、例えば、ASIC(Application Specific Integrated Circuit)又はFPGA(Field Programmable Gate Array)、あるいはこれらの組み合わせなどのようなプログラム可能なハードウェアとして、汎用コンピュータなどの汎用データ処理装置上で動作するソフトウェアで実現されてもよい。ソフトウェア及び/又はファームウェアで実現される実施形態の場合、このようなソフトウェア及び/又はファームフェア、並びに、このようなソフトウェア及び/又はファームウェアが記憶又は提供される非一時的なデータ記録媒体が、本発明の実施形態であると考えられる。
図1は、ビデオデータ圧縮及び解凍を使用するオーディオ/ビデオデータ送受信システムを示す概略図である。
入力オーディオ/ビデオ信号10は、例えば、ケーブル、光ファイバ、無線リンク等の送信ルート30に沿って送信されるオーディオ/ビデオ信号10のビデオ要素を少なくとも圧縮するビデオデータ圧縮装置20へ供給される。圧縮された信号は、解凍装置40によって処理されて、出力オーディオ/ビデオ信号50が提供される。戻りパスでは、圧縮装置60は、送信ルート30に沿って解凍装置70へと送信されるオーディオ/ビデオ信号を圧縮する。
圧縮装置20及び解凍装置70は、それ故、送信リンクにおける1つのノードを形成することができる。また、解凍装置40及び圧縮装置60は、送信リンクにおける他の1つのノードを形成することができる。もちろん、送信リンクが単方向である場合、一方のノードのみが圧縮装置として要求され、他方のモードのみが解凍装置として要求される。
図2は、ビデオデータ解凍を使用するビデオ表示システムを模式的に示す図である。特に、圧縮されたオーディオ/ビデオ信号100は解凍装置110によって処理され、表示装置120上で表示され得る解凍信号が提供される。解凍装置110は、表示装置120の不可欠な部分として実現され、例えば、表示装置として同じケージング内に提供される。あるいは、解凍装置110は、(例えば、)いわゆるセットトップボックス(STB:Set Top Box)として提供されてもよい。なお、「セットトップ」との表現は、表示装置120に対して特定の方向又は位置に位置されるボックスに対する要求を意味しているのではなく、単に、周辺機器として表示部に接続可能なデバイスを示すためにこの用語は使用されている。
図3は、ビデオデータ圧縮及び解凍を使用するオーディオ/ビデオ記憶システムを示す概略図である。入力オーディオ/ビデオ信号130は、例えば、磁気ディスク装置、光ディスク装置、磁気テープ装置、あるいは、半導体メモリやその他の記憶装置などの半導体記憶装置などの記憶装置150によって記憶される圧縮信号を生成する圧縮装置140に供給される。再生においては、圧縮データが記憶装置150から読み出されて、解凍のために解凍装置160を通され、これにより出力オーディオ/ビデオ信号170が提供される。
当然、圧縮又は符号化信号、並びに、この信号を記憶する機械読み取り可能非一過性記憶媒体等の記憶媒体は、本技術の一実施形態であると考えられる。
図4は、ビデオデータ圧縮を使用するビデオカメラを示す概略図である。図4において、例えば、CCD(Charge Coupled Device)イメージセンサや、関連する制御及び読み出しの電子機器などの画像撮影装置180は、圧縮装置190を通されるビデオ信号を生成する。1つのマイクロフォン(あるいは複数のマイクロフォン)200は、圧縮装置190を通されるオーディオ信号を生成する。圧縮装置190は、記憶及び/又は送信される圧縮オーディオ/ビデオ信号を生成する(概略ステージ220として一般的に表されている)。
以降で述べられる技術は、主に、ビデオデータ圧縮及び解凍に関連している。なお、圧縮オーディオ/ビデオ信号を生成するために、多くの既存の技術が、以降で説明されるビデオデータ圧縮技術と共にオーディオデータ圧縮に使用されてもよい。対応して、オーディオデータ圧縮についての分離した説明は行わない。また、特に、放送品質ビデオデータにおいて、ビデオデータに関連するデータレートは、一般的に、オーディオデータに関連するデータレートよりも非常に高い(圧縮及び非圧縮を問わず)。従って、非圧縮オーディオデータは、圧縮オーディオ/ビデオ信号を形成するために、圧縮ビデオデータと一緒にすることができる。さらに、図示される例(図1〜図4参照)は、オーディオ/ビデオデータに関連しているが、以降で説明される技術は、単にビデオデータを扱う(つまり、圧縮、記憶、表示及び送信する)システムにおける使用されてもよい。つまり、この実施形態は、必ずしも関連するオーディオデータの処理を必要とすることなく、ビデオデータ圧縮に適用することができる。
したがって、図4は後述の種類の符号化装置及びイメージセンサを含むビデオ撮影装置の例を示す。図2は後述の種類の復号装置と、復号画像が出力される表示装置の例を示す。
図2と図4を組み合わせることによって、イメージセンサ180、符号化装置190、復号装置110、及び復号画像が出力される表示装置120を含むビデオ撮影装置が提供され得る。
図5、図6は記憶媒体を示す概略図である。この記憶媒体は(例えば)装置20,60によって生成された圧縮データや、装置110や記憶媒体又はステージ150に入力される圧縮データを記憶する。図5は磁気ディスクや光ディスク等のディスク記憶媒体を示す概略図である。図6はフラッシュメモリ等の半導体記憶媒体を示す概略図である。 なお、図5、6は非一過性の機械読み取り可能な記憶媒体の例でもある。この非一過性の機械読み取り可能な記憶媒体は、コンピュータによって実行されると1以上の後述の方法をコンピュータに行わせるコンピュータソフトウェアを記憶する。
つまり上記は本技術を実現するビデオ保存、撮影、送信、又は受信装置の例を示す。
図7はビデオデータ圧縮及び解凍装置を示す概略図である。
制御部343は、ビデオデータ圧縮及び解凍装置の全体的な動作を制御する。制御部343は、特に、圧縮モードについて言えば、ブロックのサイズ及び形状等の種々の動作形態を選択するセレクタとして動作することによって、試行符号化処理を制御する。また、制御部343は、ビデオデータが符号化されるに当たって損失が生じるか否かを制御する。 この制御部は、画像エンコーダ又は画像デコーダ(場合による)の一部と見なされる。 入力ビデオ信号300の連続画像は、加算部310及び画像予測部320に供給される。画像予測部320については、図8を参照して後で詳述する。画像エンコーダ又は画像デコーダ(場合による)は、図8のイントラ画像予測部と共に、図7に示す装置を構成する。 しかしながら、この画像エンコーダ又は画像デコーダは、必ずしも図7に示す全ての特徴を必要とするわけではない。
加算部310は、「+」入力上で入力ビデオ信号300を受信し、「−」入力上で画像予測部320の出力を受信する事実上の減算(負の加算)動作を実行する。これにより、入力画像から予測画像が減算される。この結果、実画像と予測画像との差を表すいわゆる残差画像信号330が生成される。
残差画像信号を生成する理由の1つは次の通りである。説明を行うデータ符号化技術、すなわち、残差画像信号に適用される技術は、符号化される画像において「エネルギー」が少ない場合に、より効率的に作用する傾向がある。ここで、「効率的」という用語は、生成した符号化データの量が少ないことを示す。特定の画像品質レベルにおいては、生成するデータができるだけ少ないことが望ましい(且つ、「効率的」と考えられる)。残差画像における「エネルギー」は、残差画像に含まれる情報量に関連する。仮に、予測画像と実画像とが同一だとすると、これら2つの画像の差(すなわち、残差画像)は、ゼロの情報(ゼロエネルギー)を含み、非常に容易に少量の符号化データに符号化することができる。一般的に、予測画像の内容が、符号化される画像の内容と同様になるように、予測処理を或る程度良好に実行することができる場合、残差画像データは、入力画像よりも情報が少なく(エネルギーが少ない)、容易に少量の符号化データに符号化することができると予想される。
(残差又は差分画像を符号化する)エンコーダとして動作する装置の残りの部分を説明する。残差画像データ330は、残差画像データのブロック又は領域の離散コサイン変換(DCT:Discrete Cosine Transform)表現を生成する変換部又は回路340に供給される。このDCT技術自体は広く知られているため、ここでは詳しく説明しない。また、DCTの使用は、一構成例の例示に過ぎない。他の変換方式として、例えば、離散サイン変換(DST:Discrete Sine Transform)を用いることができるであろう。変換方式は、例えば、1つの変換方式に別の変換方式が(直接的又は間接的に)続く構成等、個々の変換方式を組み合わせてもよい。変換方式の選択は、明示的に決定されてもよく、且つ/又は、エンコーダ及びデコーダを構成するのに用いられる付帯情報(side information)に依存してもよい。
変換部340の出力、すなわち、画像データにおける各変換ブロックに対する一連のDCT係数は、量子化部350に供給される。量子化スケーリング要素による単純な乗算から、量子化パラメータの制御下における複雑なルックアップテーブルの応用に至るまで、様々な量子化技術がビデオデータ圧縮の分野において広く知られている。その目的として一般的なものには2つある。1つ目は、変換データが取り得る値を量子化処理により減少させることである。2つ目は、変換データの値がゼロである可能性を量子化処理により増加させることである。これらにより、少量の圧縮ビデオデータの生成において、後述するエントロピー符号化処理をより効率的に行うことができる。
スキャン部360により、データスキャン処理が適用される。スキャン処理の目的は、非ゼロの量子化変換係数をできるだけひとまとめにするため、また、もちろん、これにより、ゼロ値の係数をできるだけひとまとめにするために、量子化変換データを再整理することである。これらの機能により、いわゆるランレングス符号化又は同様の技術を効率的に適用することができる。したがって、スキャン処理は、(a)スキャンの一部として全ての係数が一度は選択されるように、且つ、(b)スキャンにより所望の再整理を行うことができるように、「スキャン順」に従って、量子化変換データ、及び、特に、変換及び量子化された画像データのブロックに対応する係数のブロックから係数を選択することを含む。有効な結果をもたらすスキャン順の一例は、いわゆるUp−right Diagonalスキャン順である。
スキャンされた係数は、その後、エントロピーエンコーダ(EE)370に送られる。この場合もやはり、各種エントロピー符号化を実行してもよい。2つの例は、いわゆるCABAC(Context Adaptive Binary Coding)システムの変形、及び、いわゆるCAVLC(Context Adaptive Variable−Length Coding)システムの変形である。一般的に、CABACは効率がよいと考えられている。或る研究では、CABACにおける符号化出力データの量は、同等の画像品質に対して、CAVLCよりも10〜20%少ないことが示されている。しかしながら、CAVLCが示す(実行する上での)複雑性のレベルは、CABACの複雑性のレベルよりもはるかに低いと考えられている。なお、スキャン処理及びエントロピー符号化処理は、別々の処理として示されているが、実際には、組み合わせるか、又は、一緒に扱うことができる。すなわち、エントロピーエンコーダへのデータの読み出しは、スキャン順で行うことができる。これは、後述する各逆処理の場合も同様である。
エントロピーエンコーダ370の出力により、例えば、予測部320が予測画像を生成する方法を定義する(上述及び/又は後述の)追加データと共に、圧縮出力ビデオ信号380が提供される。
一方、予測部320自体の動作は解凍された圧縮出力データに依存するため、リターンパスも提供される。
この機能の理由は以下の通りである。解凍処理(後述する)における適切なステージで、解凍された残差データが生成される。この解凍残差データは、出力画像を生成するために、予測画像に追加する必要がある(なぜなら、元の残差データは、入力画像と予測画像との差であったため)。圧縮側と解凍側とでこの処理が同等となるように、予測部320によって生成される予測画像は、圧縮処理中及び解凍処理中において、同一であるべきである。もちろん、装置は、解凍時において元の入力画像にアクセスすることができない。装置がアクセスすることができるのは、解凍画像のみである。したがって、圧縮時において、予測部320は、解凍された圧縮画像に基づいて(少なくともインター画像符号化について)その予測を行う。
エントロピーエンコーダ370により実行されるエントロピー符号化処理は、(少なくともいくつかの例では)「無損失(lossless)」であると考えられる。すなわち、エントロピーエンコーダ370に最初に供給されたデータと全く同じデータに置き換えることができる。したがって、このような例では、リターンパスは、エントロピー符号化ステージよりも前に実装することができる。実際、スキャン部360によって実行されるスキャン処理も無損失であると考えられるが、本実施形態では、リターンパス390は、量子化部350の出力から、補足逆量子化部420の入力までとされている。ステージによって損失が生じる又は損失が生じる可能性がある場合、当該ステージは、リターンパスによって形成されるフィードバックループに含めてもよい。例えば、エントロピー符号化ステージは、例えば、ビットをパリティ情報において符号化する技術によって、少なくとも原理的には損失を生じるものとされ得る。 このような例では、エントロピー符号化及び復号化は、フィードバックループの一部を形成する必要がある。
一般的には、エントロピーデコーダ410、逆スキャン部400、逆量子化部420、逆変換部又は回路430は、それぞれ、エントロピーエンコーダ370、スキャン部360、量子化部350、及び変換部340の逆機能を提供する。ここでは、圧縮処理について説明を続け、入力圧縮ビデオ信号を解凍するための処理については、別途後述する。
圧縮処理において、スキャンされた係数は、リターンパス390により量子化部350から、スキャン部360の逆動作を実行する逆量子化部420に送られる。逆量子化処理及び逆変換処理が逆量子化部420、逆変換部430により実行され、圧縮−解凍残差画像信号440が生成される
画像信号440は、加算部450で予測部320の出力に追加され、再構築出力画像460が生成される。これにより、後述するように、画像予測部320への1つの入力が構成される。
受信した圧縮ビデオ信号470を解凍するために適用される処理について説明する。圧縮ビデオ信号470は、まず、エントロピーデコーダ410に供給され、そこから逆スキャン部400、逆量子化部420、及び逆変換部430の順に供給される。その後、加算部450によって画像予測部320の出力に追加される。したがって、デコーダ側では、デコーダは、残差画像を再構築し、これを(ブロック単位で)(加算部450によって)予測画像に適用することで各ブロックを復号化する。端的に言うと、加算部450の出力460が出力解凍ビデオ信号480を形成する。実際には、信号を出力する前に、さらに(例えば、フィルタ560を用いて)フィルタリングを任意選択で施してもよい。このフィルタ560は、図8に示す。図8に比べて全体的な構成を示す図7では、フィルタ560は、見易さのために省略している。
図7及び図8に示す装置は、圧縮(符号化)装置又は解凍(復号)装置として動作することができる。二種類の装置の機能が実質的に重複する。スキャン部360及びエントロピーエンコーダ370は、解凍モードでは使用されない。予測部320(後で詳述する)及び他の各部の動作は、受信した圧縮ビットストリームに含まれるモード及びパラメータ情報に従い、自らはこれらの情報を生成しない。
図8は、予測画像の生成を示す概略図であり、特に、画像予測部320の動作を示している。
2つの基本的な予測モードが画像予測部320によって実行される。2つの基本的な予測モードとは、いわゆるイントラ画像予測及びいわゆるインター画像予測又は動き補償(MC:Motion−Compensated)予測である。エンコーダ側では、これらの予測はそれぞれ、予測対象である現在のブロックについて予測方向を検出し、(同じ(イントラ)又は別の(インター)画像における)他のサンプルに応じてサンプルの予測ブロックを生成することを含む。加算部310又は450により、予測ブロックと実際のブロックとの差異を符号化又は復号化することで、ブロックをそれぞれ符号化又は復号化する。
(デコーダ側又はエンコーダの逆復号化側では、この予測方向の検出は、どの方向がエンコーダで用いられたかを示す、エンコーダによる符号化データに関係付けられたデータに応じるものであってもよい。或いは、当該予測方向の検出は、エンコーダで決定された要素と同じものに応じるものであってもよい。)
イントラ画像予測は、同一画像内から得られるデータにおける画像ブロック又は領域の内容の予測を基礎としている。これは、他のビデオ圧縮技術における、いわゆるIフレーム符号化に対応する。しかし、画像全体をイントラ符号化によって符号化するIフレーム符号化とは対照的に、本実施形態では、イントラ符号化及びインター符号化の選択を、ブロック毎に行うことができる。他の実施形態では、当該選択が依然として画像毎に行われる。
動き補償予測は、インター画像予測の一例であり、他の隣接画像又は近接画像において、現在の画像において符号化される画像詳細のソースを定義しようとする動き情報が用いられる。したがって、理想的な例では、予測画像における画像データのブロックの内容は、隣接画像において同じ位置又はわずかに異なる位置に存在する対応ブロックを示す参照(動きベクトル)として、非常に容易に符号化することができる。
「ブロックコピー」予測として知られる技術は、現在の予測ブロックを生成するためにコピーすべき、同一の画像内の現在の予測ブロックから変位した位置にある、サンプルから成るブロックを示すベクトルを用いるため、いくつかの点において、上記2つの予測のハイブリッドと言える。
図8に戻る。図8には(イントラ画像予測及びインター画像予測に対応する)2つの画像予測構成が示されており、その予測結果が、加算部310及び450に供給するための予測画像のブロックを提供するように、(例えば、制御部343の)モード信号510の制御下において乗算部500によって選択される。当該選択は、どちらを選択すれば最少の「エネルギー」(上述のように、符号化が必要な情報の量と考えてもよい)となるかに基づいて行われ、また、当該選択は、符号化出力データストリームでデコーダに通知される。これに関して、例えば、入力画像から、2つのバージョンの予測画像の領域を試行減算し、差分画像の各ピクセル値を2乗し、乗算値を合計し、当該2つのバージョンのうち、その画像領域に関連する差分画像の平均乗算値が低いのはどちらのバージョンかを特定することによって、画像エネルギーを検出することができる。他の例では、選択毎に又はあり得る選択毎に試行符号化を実行することができる。そして、符号化に必要なビット数及び当該画像に対する歪みのうちの一方又は両方に関する、あり得る選択毎の費用に応じて選択が行われる。
イントラ予測システムでは、実際の予測は、信号460の一部として受信された画像ブロックに基づいて行われる。すなわち、予測は、解凍装置において全く同じ予測を行うことができるように、符号化−復号化画像ブロックに基づいて行われる。しかしながら、データを入力ビデオ信号300から導出して、イントラモード選択部520により、イントラ画像予測部530の動作を制御することもできる。
インター画像予測では、動き補償(MC)予測部540は、例えば、動き推定部550によって入力ビデオ信号300から導出された動きベクトル等の動き情報を用いる。動き補償予測部540は、これら動きベクトルを再構築画像460に適用し、インター画像予測のブロックを生成する。
したがって、イントラ画像予測部530及び動き補償予測部540(推定部550と共に動作する)はそれぞれ、予測対象である現在のブロックについての予測方向を検出する検出部として、また、予測方向によって画定される他のサンプルに応じてサンプルの予測ブロック(加算部310及び450に送る予測結果の一部をなす)を生成する生成部として動作する。
ここで、信号460に適用される処理について説明する。まず、信号460は、フィルタ部560によって任意選択でフィルタリングされる。フィルタ部560については、以下でさらに詳細に説明する。この処理では、変換部340が実行する、ブロックに基づく処理及び後続の動作に対する影響を排除する、又は少なくとも軽減させるために「非ブロック化(deblocking)」フィルタが適用される。サンプルアダプティブオフセット(SAO:Sample Adaptive Offsetting)フィルタを用いることも可能である。また、再構築信号460及び入力ビデオ信号300を処理することによって得られる係数を使用して、適応ループフィルタが任意選択で適用される。この適応ループフィルタは、公知の技術を使用して、フィルタリング対象のデータに対して適応フィルタ係数を適用するフィルタの一種である。すなわち、フィルタ係数は、各種要素に基づいて変化し得る。どのフィルタ係数を用いるかを定義するデータは、符号化出力データストリームの一部に挿入される。
装置が解凍装置として動作している場合、フィルタ部560からのフィルタリングされた出力は、実際には、出力ビデオ信号480を形成する。この信号は、1つ又は複数の画像又はフレーム記憶部570に記憶される。連続画像の記憶は、動き補償予測処理、特に、動きベクトルの生成において必要となる。必要なメモリを確保するため、画像記憶部570に記憶される画像は、圧縮形式で保持され、その後、動きベクトルの生成に用いるために解凍されてもよい。この特定の目的のために、公知のいかなる圧縮/解凍システムを用いてもよい。記憶画像は、より高い解像度の記憶画像を生成する補間フィルタ580に送られる。この例では、補間フィルタ580によって出力される補間画像の解像度が、輝度チャンネルが4:2:0である場合に画像記憶部570に記憶された画像の4倍(各寸法)となるように、色チャンネルが4:2:0である場合に画像記憶部570に記憶された画像の8倍(各寸法)となるように、中間サンプル(サブサンプル)が生成される。補間画像は、動き推定部550及び動き補償予測部540への入力として送られる。
ここで、圧縮処理のために画像を分割する方法について説明する。基本的なレベルでは、圧縮対象の画像は、サンプルから成るブロック又は領域の配列として考えることができる。このような画像のブロック又は領域への分割は、参照によりその内容が本明細書に援用されるBross他著「High Efficiency Video Coding(HEVC)text specification draft 6」、JCTVC−H1003_d0(November 2011)に記載されているような決定木によって行うことができる。いくつかの例では、結果として得られるブロック又は領域は、様々なサイズを有し、場合によっては、決定木により、全体的に当該画像内の画像特徴の配列に沿った形状を有する。これだけでも符号化効率を向上させることができる。というのも、類似の画像特徴を表す又はこれらに沿うサンプルは、このような構成によって、グループ化される傾向にあるからである。いくつかの例では、異なるサイズの正方形ブロック又は領域(例えば、4×4サンプル〜例えば64×64、又はより大きいブロック)は、選択に利用することができない。他の構成例では、(例えば、垂直方向又は水平方向に配向された)矩形ブロック等の異なる形状のブロック又は領域を用いることができる。他の非正方形及び非矩形ブロックも包含される。このような画像のブロック又は領域への分割結果として、(少なくとも本例では)画像のサンプルがそれぞれ1つの、さらには、1つのみの係るブロック又は領域サンプルに割り当てられる。
これより、イントラ予測処理について説明する。一般的に、イントラ予測は、同一の画像において先に符号化及び復号化されたサンプルからサンプルの現在のブロックの予測結果を生成することを含む。
図9は、部分的に符号化された画像800を示す概略図である。ここで、当該画像は、左上から右下に向かってブロック単位で符号化されている。画像全体の処理において符号化途中にあるブロックの一例を、ブロック810として示す。上方の影付き領域820からブロック810の左側までは既に符号化されている。ブロック810の内容のイントラ画像予測のために、影付き領域820のうちのいずれも利用することができるが、それより下方の影なし領域を利用することはできない。
いくつかの例では、より大きいブロック(CU(Coding Unit)と称する)が、図9を参照して説明した順序等の順序で符号化されるように、画像をブロック単位で符号化する。CU毎に、(行われたブロック分割処理に応じて)CUは、セットの2つ以上のより小さいブロック又はTU(Transform Unit)として処理される可能性がある。これによって、当該画像がCU単位で符号化されるような符号化の階層順が与えられる。各CUは、可能性として、TU単位で符号化される。なお、現在のCTU(Coding Tree Unit)内の個々のTU(ブロック分割のツリー構造において最大のノード)について、上述した(CU毎の、次いで、TU毎の)符号化の階層順は、現在のCUにおいて先に符号化されたサンプルが存在し、当該TUの符号化に利用可能であり得ることを意味する。これらのサンプルは、例えば、当該TUの右上又は左下に存在する。
ブロック810は、CUを表す。上述したように、イントラ画像予測処理のために、これは、セットのより小さい単位に細分化してもよい。現在のTU830の一例をCU810内に示す。より一般的には、画像は、シグナリング情報及び変換後のデータを効率的に符号化することができるように、領域又はサンプル群に分割される。情報のシグナリングは、当該変換の構造に対して、実際には、予測情報又は予測そのものの構造に対して、細分化されたものから成る異なるツリー構造を必要とし得る。このような理由から、CUは、変換ブロック又は領域、予測ブロック又は領域及び予測情報の構造に対して異なるツリー構造を有し得る。HEVC等のいくつかの例では、当該構造は、葉ノードが1つ又は複数の予測単位及び1つ又は複数のTUを含む、CUのいわゆる四分木とすることができる。TUは、画像のルマ及びクロマ表現に対応する複数の変換ブロックを含むことができ、予測方式は、変換ブロックレベルで適用可能であると考えることができる。いくつかの例では、特定のサンプル群に適用されるパラメータは、主にブロックレベルで定義されると考えることができる。このブロックレベルは、変換構造と同じ粒度ではない可能性がある。
イントラ画像予測は、現在のTUを考慮する前に符号化されたサンプルを考慮する。当該サンプルは、現在のTUの上方及び/又は左側のサンプルである。必要なサンプルの予測元となるサンプルは、現在のTUに対して異なる位置又は方向に存在し得る。現在の予測単位に対していずれの方向が適しているかを決定するために、例示的なエンコーダのモード選択部520は、候補方向毎に利用可能なTU構造の組み合わせを全て試し、圧縮効率が最高となる予測方向及びTU構造を選択することができる。
画像は、「スライス」毎に符号化されてもよい。一例では、スライスは、水平方向に隣接するCU群である。しかしながら、より一般的には、残差画像全体でスライスを構成することができ、或いは、スライスを単一のCU又はCUの行等とすることもできる。スライスは、独立した単位として符号化されるため、エラーに対する回復力が或る程度得られる。エンコーダ及びデコーダの状態は、スライス境界で完全にリセットされる。例えば、イントラ予測はスライス境界を跨いでは行われない。このため、スライス境界は、画像境界として処理される。
図10は、考えられる(候補となる)組の予測方向を示す概略図である。予測単位に対して方向候補を全て利用可能である。方向は、現在のブロック位置に対する水平及び垂直移動により決定されるが、予測「モード」として符号化される。当該組の方向を図11に示す。なお、いわゆるDCモードは、周囲にある上部及び左側のサンプルの単純算術平均を表す。また、図10に示す方向の組は一例に過ぎない。図12に示すように、他の例では、(例えば)65の角度モードにDC及びplanarを合わせた組(合計67のモード)で一組とする。他のモード数も採用可能である。
一般的に、システムは、予測方向の検出後、予測方向によって確定された他のサンプルに応じてサンプルの予測ブロックを生成するように動作可能である。いくつかの例では、画像エンコーダは、画像のサンプル又は領域毎に選択された予測方向を識別するデータを符号化するように構成される(また、画像デコーダはこのようなデータを検出するように構成される)。
図13は、イントラ予測処理を示す概略図である。このイントラ予測処理では、サンプルから成るブロック又は領域910のサンプル900を、当該サンプルに関連するイントラ予測モードによって確定された方向930に応じて同一の画像の他の参照サンプル920から導出する。本例の参照サンプル920は、対象のブロック910の上方及び左側のブロックが元となっており、サンプル900の予測値は、参照サンプル920に対して方向930に沿ってトラッキングすることによって得られる。方向930は、単一の個別の参照サンプルを示してもよいが、より一般的には、周辺の参照サンプルの補間値を予測値として用いる。なお、ブロック910は、図13に示すように正方形であってもよく、矩形等の他の形状であってもよい。
図14、15は上述の参照サンプル射影処理を示す概略図である。
図14、15において、予測対象サンプルのブロック又は領域910は、予測サンプルのイントラ予測が行われる参照サンプルの線形アレイによって囲まれている。図14、15において、参照サンプル1410は影付きブロックとして示されており、予測対象サンプルは影なしブロックとして示されている。なお、本例では8x8の予測対象サンプルのブロック又は領域が用いられ鵜が、本技術は様々なサイズや形状のブロックに適用可能である。
上述のように、参照サンプルは、予測対象サンプルの現在の画像領域に対する各方向おいて少なくとも2つの線形アレイを含む。例えば、2つの線形アレイとは、予測対象サンプルのブロックの上方に位置するサンプルアレイ(又はサンプル行)1420と、予測対象サンプルのブロックの左柄に位置するサンプルアレイ(又はサンプル列)1430であり得る。
図13を参照しながら上記において述べたように、参照サンプルアレイは、予測対象ブロックの範囲を超えて延伸することができる。これは、図10〜12に示す範囲における予測モードや方向に対応するためである。必要であれば、前回復号したサンプルが特定の参照サンプル位置において参照サンプルとして利用できない場合に、この不足位置において他の参照サンプルを再利用することもできる。この参照サンプルに関して、参照サンプルフィルタリング処理を用いることができる。
サンプル射影処理は、図14、15に図示する方法で、現在の画像領域に対する異なるそれぞれの位置に対して参照サンプルのうちの少なくとも一部を射影するために用いられる。つまり、実施形態において、例えば図14、15に示すように、現在の画像領域に対して異なる空間位置において少なくとも一部の参照サンプルを表すように射影処理(及び射影回路)は動作する。そのため、(少なくともサンプルの予測を行う参照サンプルアレイを定義する目的で)少なくとも一部の参照サンプルが現在の画像領域に対する相対位置に基づいて移動させられ得る。特に、図14は一般的に対角モード(図11の18)の左側に位置するモード、主にモード2から17のために行われる射影処理に関する。図15は、モード19から34、つまり一般的に予測対象ブロックの上部に位置するもの(対角モード18の右側に位置するモード)に関して行われる参照サンプル射影を示す概略図である。任意の選択として、対角モード18は対角線の右側のモード群など、上記の2つの群のいずれかに割り当てることができる。従って、図14において、現在の予測モードがモード2とモード17の間にある場合(又は異なる数の予測モード候補を有する図12のシステムにおいて同様の場合)、現在のブロックの上部のサンプルアレイ1420は、左側の列に追加の参照サンプル1440を形成するように射影される。その後、元の左列1430と射影サンプル1440からなる線形射影アレイ1450に対して予測が行われる。図15において、図11のモード18から34に関して(又は図12に示すような予測モードの他の組において対応するモードに関して)、左側の列の参照サンプル1500が射影され、現在のブロックの上部に位置する参照サンプル1510を左に向けて延伸される。これにより、射影アレイ1520を作成する。
このような射影を行う理由は、予測対象の全てのサンプルが1つの平行線形アレイを参照するのではなく参照サンプルの1つの線形アレイを参照するという点において、イントラ予測処理の複雑さを抑えることができるからである。
図16は上述の、図14、15の予測処理を行うように構成される予測回路600の概略図である。具体的には、この予測処理は射影回路1610によって行われる。射影回路1610は、予測対象領域のブロックのために現在選択中の参照サンプルに関して射影処理を行うように構成される。射影参照サンプルはバッファ1620に記憶され、イントラ予測部1630によってアクセスされ、射影参照サンプルを基に予測サンプルを生成する。この射影処理は図14、15に関連して述べた上記の技術を用いて現在の予測対象ブロックに関連する予測モードに基づいて行われる。
実施形態において、デコーダ及びエンコーダにおいても同様の射影処理が行われる。このため、どの場合でも同じ予測サンプルが生成される。以下に、「ストレイトモード」と呼ばれる予測モードを用いる場合と、「カーブモード」と呼ばれる予測モードを用いる場合に起こり得る動作の違いについて説明する。
さらなる背景として、図17及び18は、参照サンプル1920に基づいて現在の領域1910又は予測対象ブロックのサンプル1900が予測される技術の例を概略的に示す。この例において、参照サンプルは、上記の図14〜16を参照して説明した技術を用いて線形アレイへ射影されている。
各参照サンプル又は予測サンプルの位置を識別するのに、便宜上(x,y)座標系を用いる。図17に示す例において、行1930の数によってx座標を示し、列1940の数によってy座標を示す。つまり、各参照サンプル又は予測サンプルの位置は、この座標系の関連する(x,y)座標によって表される。
図17の例では、図11において指定されるモード23等の概垂直モード(例えば、水平よりも垂直よりのモード)1950が、ブロック又は領域1910のサンプル1900の予測のために選択される。なお、図12に示されるモードの組が使用される場合、異なるモード番号が使用され得る。図14から16を参照して上述したように、ブロック又は領域1910の上部の参照サンプルの延長線1960に参照サンプルの左列を射影することによって、図16の回路によってこのような概垂直の予測モードが処理される。
各予測対象サンプル1900に関しては以下のように予測が行われる。各予測対象サンプルはそれぞれ(x,y)位置と関連付けられている。例えば、サンプル1970には位置(0,5)が、サンプル1972には位置(0,4)が関連付けられている。これらの2つのサンプルはあくまで例として示したものであり、同様の技術が各予測対象サンプル1900に適用される。
予測対象サンプルのサンプル位置1970、1972は現在の予測モードに関連する方向1950に基づいて、各参照サンプルの位置(参照位置)1974、1976に対してマッピングされる。このマッピングは、以下に示すような式を用いて行われる。なお、以下に示すのは座標系(x,y)に対する一次式である。
図11に示す水平モード2〜17に関して、
予測値(x.y)={1−f(p)}×ref[y+i(p)]+f(p)×ref[y+i(p)+1]となる。
なお、p=A×(x+1)である。
図11に示す垂直モード18〜34に関して、
予測値(x.y)={1−f(p)}×ref[x+i(p)]+f(p)×ref[x+i(p)+1]となる。
なお、p=A×(y+1)である。
また、i(p)=floor(p)は値pを(負の無限大の方向に)切り捨てて最も近い整数にする式であり、f(p)=p−i(p)は値pの端数部分を示す。
Aは現在のモードの角度を表す角度パラメータである。例えば、水平線又は垂直線の場合、Aは0となり、45°の対角線の場合、Aは±1となる。
当業者であれば、整数近似値を使用して線形方程式を単純化し、例えば角度パラメータAを小数固定精度数として表すことができるということを理解するであろう。HEVCにおいて、角度は5小数ビットの精度を有する。
つまり、例えば、各予測対象サンプルは現在の領域内の座標位置と関連付けられ、イントラ画像予測部は所与の予測対象サンプルの座標位置の機能として、所与の予測対象サンプルの参照位置を検出するように構成される。この機能は選択された予測モードに基づく。
構成例として、参照位置1974、1976は1サンプル以下の精度又は分解能で検出される。つまり、参照サンプル位置(−5,−1)から(15,−1)を参照し、射影参照サンプル1920の組における参照位置のx座標に関する小数値を用いる。例えば、1/32のサンプル分離分解能で参照位置が検出される。これにより、参照位置1974、1976のx座標が同じ分解能で識別される。全ての場合においてy座標は−1となっているが、これはその後に実際に行われる演算とは無関係である。この演算は、参照サンプル1920のx軸に関連する。
予測値1970、1972の予測とは、例えば上述の式で説明したように、参照サンプル位置1974、1976に関して検出したx座標に適用可能な値の補間である。
同様の概略構成を図18に示すが、概水平予測モードが用いられる点で上記と異なる。水平予測モードとは、例えば図11に示す(例えば)モード14(又は図12に示す組のうちの対応する数の類似モード)等の垂直よりも水平に近い予測モードである。特定の予測モードの選択は、予測対象サンプル2020のブロック又は領域2010全体に適用される。ここに記載する特定例は、本説明の目的のためだけに選択されるものである。
概水平モードの場合、上記のように、図16に示す予測回路はこれらの参照サンプルをブロック又は領域2010の上部から射影を行い、この領域の左側に参照サンプルの延長線2030を形成する。再び、2つの予測対象サンプルの例、つまりサンプル2032、2034の導出にすいて説明する。サンプル位置2032、2034は、方向2000を用いて参照サンプル2040の組の中の参照位置2036、2038に対してマッピングされる。再度、同様の(x,y)座標系を用いて参照位置206、2038がy方向において1/32のサンプル分解能で表現される。x座標の参照サンプル位置は−1であるが、これは続く処理とは無関係である。予測対象サンプルのサンプル値は上記の方法で取得される。
これらの構成において、イントラ予測部530は検出部とフィルタの例を提供する。この検出部は、参照サンプルアレイに対する、現在の予測対象サンプルに適用可能な予測方向によって示された参照位置をアレイ位置として検出するように構成されている。フィルタは、検出したアレイ位置における参照サンプルアレイの補間によって予測サンプルを生成するように構成されている。検出部は、例えば1/32サンプル等の1サンプル以下の精度でアレイ位置の検出を行うように構成され得る。
イントラモードセレクタ520、セレクタは少なくとも部分的なエンコーディングを行い、予測モードを先約するように構成され得る。
図19は予測処理を示す概略図である。
図17、18に示す構成において、例えば、参照サンプル1920、2440は現在の予測対象領域(又はブロック)の周囲に1つのサンプル行とサンプル列を含む。図17、18において、この1つのサンプル行とサンプル列の射影が行われ、図17においては1つの延長サンプル行を構成し、図18では1つの延長サンプル列を構成する。しかし、両方のケースにおいて、参照サンプルの原点は現在の領域の左側又は上部にある1つの行又は列である。
以下に、さらなる可能性について述べる。少なくともいくつかの例示的な状況において、複数の行及び/又は複数の列の参照サンプルが用いられる。
図19は8x8ブロック2050の参照サンプル2055に関する状況を示す概略図である。ここで用いる例は8x8ブロックの例だが、本技術は様々なサイズや形状のブロックに適用可能である。つまり、本技術は4x4ブロック、16x16ブロック、32x32ブロック、64x64ブロック等の他のサイズのブロックや、8x16ブロック等の正方形ではないブロックにも適用可能である。つまり、8x8ブロックについて述べたのは単に説明上の目的のためである。
図19では、領域2050の上部にて2行の参照サンプルが使用され、ブロック又は領域2050の左側にて2列の参照サンプルが使用される。例えば、予測方向2060がブロック2050に対して選択されたと仮定する。これは、例えば、図11の表記法におけるモード2又は図12の表記法における対応するモードに相当し得る。特定の例の予測サンプル2065の補間又は予測について説明するが、同様の技術がブロック又は領域2050における各予測対象サンプル2055に適用される。
まず、参照サンプルについて述べる。図19において使用される参照サンプルは、行及び列2070に隣接する行又は列2075と共に、ブロック2050に空間的に最も近い位置にある行及び列2070を含む。また、行及び列2075は、使用される図11の予測モード2〜34又は図12における対応するモードに相当する角度の範囲において予測を可能にするために、行及び列2070よりも長く(参照サンプル2080、2085まで)延びている。参照サンプル2080、2085は通常、以前に復号された参照サンプルから簡単に導出することができる。(参照サンプル2080、2085がまだ復号されていないために)参照サンプル2080、2085が利用できない場合、次に隣接するサンプル2081、2086が、それぞれサンプル2080、2085を形成するために繰り返されてもよい。又は以下に説明するように外挿処理を使用してもよい。
サンプル2065の補間の際には、現在の予測モードによって定義される方向2060を適用し、参照サンプルの第1の行及び列2070における参照位置2090を示すことができる。予測方向を延長することによって、第2の行及び列2075におけるさらなる一2095を示す。以降の説明を明確にするために、上記の2つの参照位置の周りの参照サンプルには、参照サンプルa〜gの符号が付されている。また、例えば、上述の処理のような3タップ補間処理が、予測サンプルを導出するために使用されると仮定する。もちろん、他の補間技術を使用することも可能である。以下の説明は、それに応じて簡単に適用され得る。
図20〜図22は、図19に示す形態の参照サンプルの2つの行及び列を使用するためにイントラ予測部530によって適用され得る種々の技術の候補に関する。
まず、図20の場合では、参照位置2090が考慮され、行及び列2070の3つのサンプル(すなわち、参照サンプルb、d、f)と行及び列2075の参照サンプル(すなわち、参照サンプルc、e、g)、が組み合わされる。参照サンプルc、e、gは、使用中の予測方向によって示される範囲2120内の参照サンプルである。したがって、この例では、行/列2070、2075の各々の1つずつサンプルからなる参照サンプルのペアがそれぞれの群で組み合わされ、その結果得られた複合参照サンプルが補間処理において使用される。複合参照サンプルは、行/列2070内の参照位置2090に基づいて、及び行/列2075内の参照位置2095に基づいて別々に選択される。これはつまり、行/列2070内の参照サンプルの範囲2100が使用され、(使用の予測方向に従って)行/列2075内の参照位置2095に基づいて、異なる、又は少なくとも潜在的に異なる範囲2120の参照サンプル(c、e、g)が使用されることを意味する。この組合せは、参照サンプルのペアの間で行われる、すなわち、参照サンプルc及びbを組み合わせて参照サンプルhを形成する。参照サンプルe及びdを組み合わせて参照サンプルiを形成する。参照サンプルg及びfを合わせて参照サンプルjを形成する。次いで、参照サンプルh、i及びjは、(この例においては)3タップ補間処理によって処理されて、予測サンプルpを形成する。
参照サンプルのペア(c、b)、(e、d)、(g、f)に適用される組合せは、任意の記号「Θ」によって示され、任意の記号「Θ」はこの組合せの性質について様々な可能性が存在することを示している。この組み合わせは単純な算術平均であり得る。他の例では、これは加重平均とすることができる。例えば、ブロック2050から空間的に離れた参照サンプル(この例ではc、e、g)よりもブロック2050に空間的に近い参照サンプル(b、d、f)に、より大きな重みを加える。例えば、2つの行及び列の参照サンプルが使用される図19の場合において、各ペアにおいて近い方の参照サンプルに対する重みは0.6であり、遠い方のサンプルについて0.4であり得る。つまり(例えば)h=0.4c+0.6bとなる。以下に記載するように(例えば)3つ又は4つの行及び列の参照サンプルが使用される状況においては、重み付けは以下のように類似の方法で行われ得る(以下において、Rnは、行/列nにおける参照サンプルであり、n=1の場合、予測対象ブロック又は領域に空間的に最も近い行/列であることを示す)。
3つの行/列の場合、
複合参照サンプル=0.5R1+0.3R2+0.2R3となる。
4つの行/列の場合、
複合参照サンプル=0.5R1+0.25R2+0.15R3+0.1R4となる。
もちろん、他の組み合わせや実質的に等しい組み合わせを使用してもよい。
つまり、上記の例において。、算術平均又は加重算術平均のような組合せ処理を用いて、行/列2070、2075の参照サンプルを組み合わせ、そして3タップ補間処理等の予測サンプル生成処理を、組み合わせられた値に対して用いる。
図36を参照して後述するように、この組み合わせは、「あらかじめ」行うことができる。これにより、イントラ予測部530の第1ステージの動作において、現在選択されている予測方向に従って、複数の行及び列の参照サンプルを組み合わせ、この組み合わせた値が参照サンプル自体であるかのように、この組み合わせた値に対して予測サンプル生成処理が行われ、イントラ画像予測部が、参照サンプルの線形アレイを形成するために参照サンプルの2つ以上の平行線形アレイを組み合わせるように構成される例を提供する。
したがって、図20における例において、イントラ画像予測部は2つ以上組の参照サンプル(例えば、図20の(a、c、e)及び(b、d、f)、又は図20の(c、e、g)及び(b、d、f))を組み合わせて、中間参照サンプル値(h、I、j)を導出し、中間参照サンプル値から予測サンプルpを導出するように構成される。この構成例では、イントラ画像予測部は、中間参照サンプル間を補間することによって予測サンプルを導出するように構成される。例えば、参照サンプルの各組は、参照サンプルのそれぞれ1つ又は2つ以上の並列アレイ2070、2075のサンプルを含み得る。参照位置2095を中心に図20のサンプル(c、e、g)を使用する場合、これは、参照サンプルの各組が、予測方向によって示される参照サンプルの各アレイ内の組を含む例である。いくつかの例では、イントラ画像予測部は、重み付けされた組み合わせに従って参照サンプル値を組み合わせるように構成され、参照サンプル値に適用される重みは、その参照サンプル値を含む参照サンプルの組が現在の予測対象領域又は現在の予測対象サンプルから離れると共に減少する。例えば、アレイ2070の参照サンプル(b、d、f)に対して0.6の重みを使用することができ、アレイ2075の参照サンプル(a、c、e)又は(c、e、g)に対して0.4の重み付けを使用することができる。
他の例においては、c、b→hを混合するのではなく、{a、c、e、g}のうちの2つ以上の重み付け混合(補間)を用いて、補間値が予測方向2060に従ってbと空間的に一直線になるよに調整し、その後、hは、50:50又はbとインターpとの間の他の重み付け混合({a、c、e、g}のうちの2つ以上)とすることができる。
これは、実質的には、方向2060に従って列2075が2070と一直線になるように、列全体を補間することを含む。この補間列はその後に列2070と混合される(50:50,25:75又は他の重みを用いる)。
上述の補間処理の中で、現在の予測方向に従って列2075のサンプルと空間的に一直線になるような列2070の射影には補間を必要とするため、スーパーサンプリング(元の参照サンプルよりも小さな空間分解能で補間サンプルを生成するため)を使用して、補間処理の悪影響低減することができる(状況によっては補間のせいでデータが軟化したり高周波数のディテールを削減したりするため)。
他の選択肢として、いわゆる不均一サンプリングを使用して、2つの列をスーパーサンプリングデータセットに結合することが挙げられる。サンプリングされた2つの規則的なセットの位相は、現在選択されている予測方向の角度によって決定される。ノイズの影響を回避するため、後続の処理において、又はスーパーサンプリング処理の一部として、新しい参照サンプルにローパスフィルタリングが行われてもよい。
他の動作方法の例においては、各行/列2070、2075は、中間予測サンプル値を生成するために個別に使用され、その後、中間予測サンプル値が組み合わされる。
したがって、このような構成により、各参照サンプルの組が、予測方向によって示される、各参照サンプルアレイにおける組、又は各参照サンプルアレイから補間された値の組を含む例が提供される。
まず図21を参照すると、図21は、行/列2070における参照位置2090のみと一直線になるように整列されている各行/列における範囲2100の使用に関するものであり、これにより、(例えば、3タップ補間処理によって)参照サンプルa、c及びeが組み合わされ、第1の中間予測サンプルp1が生成される。行/列2070の参照サンプルb、d及びfは、同様の処理によって組み合わされ、第2の中間予測値p2を生成する。次いで、値p1及びp2は、例えば、算術平均又は加重平均(例えば、上述したように、中間予測サンプル値p2上に0.6のような重い重みをかけ、中間予測サンプル値p1上に0.4のような軽い重みをかけ、ブロック2050から離れた参照サンプルから生成されることを前提とする。)によって結合され、最終予測サンプル値p2200を生成することができる。
同様の構成が図22に示されているが、行/列2070における参照サンプル2100の範囲及び行/列2075における範囲2120を利用している。すなわち、その行/列における参照位置2095の周囲の行/列2075における参照サンプルが使用される。
つまり、参照サンプルc,e,gから第1中間予測サンプル値p1を生成し、参照サンプルb,d,fから第2中間予測サンプル値p2を生成する。前に述べたように、これらは、最終的な予測サンプル値pを形成するために、上述した任意の処理によって組み合わせることができる。
図20〜図23を参照して説明した例は、1対の行/列2070、2075のペアに関する。3つ以上の行/列を使用する場合は、前述の処理のいずれかを個別に適用することができる。したがって、図20の場合、nが少なくとも2であるn個の行/列について、各行/列のそれぞれの範囲2100、2120等における参照サンプルのすべてが組み合わされて、3つの中間参照サンプルh、i、jの組が形成され、その後これらが組み合わされる。図21及び22の場合、nが少なくとも2であるn行/列について、n個の中間予測サンプル値が生成され、次いで、例えば重み付けされた組み合わせを使用してn個の中間予測サンプル値が組み合わされる。
とある構成例において、制御部343は、現在の補間処理の1以上の特性又はパラメータに従って重みを変化させることができる。例えば、そのようなパラメータは、現在の補間対象ブロックのブロックサイズであってもよい。制御部343は、重みの値の所定の組の又は(例えば、圧縮データストリームの一部としてやりとりされるパラメータセットを介して)プログラム可能な組から重みを検出してもよいし、又は所定の又はプログラム可能な関数を使用して導出してもよい。このような関係(検索又は関数のどちらによって定義されるか)の例を以下に示す。
閾値ブロックサイズ(4x4、8x8のブロックサイズや、(正方形でないブロックの場合は)8サンプルまでの1次元の閾値)までのブロックサイズの場合、重みは25:75となる(参照サンプル又はそれらから導出された補間サンプルの更なる行/列については25%、近接する行/列については75%)。上記の閾値ブロックサイズよりも大きいブロックサイズの場合は、重みは50:50となる。
他の例において、上記(又は別のとある)パラメータは、参照サンプルの最も近い行/列から現在の補間対象サンプルの、サンプルの行又は列における、又は予測方向に沿った空間的な分かれ目を表し得る。図19の例では、サンプル位置2065は、参照サンプル2070から数えて補間対象サンプルの4列目にある。概垂直な予測方向の場合には、マッピングは、重み付けと列分離(又は行分離との間で使用することができる。例えば、mは参照サンプルのより近い列/行又はそれらから導出される補間サンプルに適用される重みを示し、
nは参照サンプルのより遠い列/行、又はそれらから導出される補間サンプルに適用される重みを示し、
sは現在のサンプル位置と列/行における直近の参照との分かれ目を示し、
bsはその次元におけるブロックサイズを示す(列又は行のうち、sを定義するのに使われる方)。
例えば、
m:n=s:(s+1)
又は
m=0.25+(0.25*s/bs);n=(1−m)となる。
使用される重みは、これらの関数のうちの2つ以上を適用することによって生成することができる。例えば、m,nはそれぞれ、ブロックサイズによって導出される重みm,nと、サンプル位置によって導出される重みm,nとの積である。
つまり、参照サンプルの隣接しない行又は列の影響は、その行/列から予測対象サンプルが離れるにつれて増加する。例えば、参照サンプルの最も近い行/列に隣接する予測対象サンプルについては、現在のブロックに隣接する参照サンプルの行/列から予測対象サンプルが遠く離れている(8ピクセル以上)場合よりも参照サンプルの他の(さらに離れた)行/列の影響が低いことが予想され、参照サンプルの隣接していない(例えば隣の)行/列の影響は大きくなると予想される。
したがって、いくつかの例においては、イントラ画像予測部は、重み付けされた組み合わせに従って中間サンプル値を組み合わせるように構成され、この重み付けされた組み合わせでは、現在の画像領域に隣接しない参照サンプルから導出された中間サンプル値に適用される重みは、中間サンプル値生成するために用いる参照サンプルの組が現在の予測対象サンプルから離れるにつれて増加する。
いくつかの例では、イントラ画像予測部は、重み付けされた組み合わせに従って参照サンプル値を組み合わせるように構成され、現在の画像領域に隣接しない参照サンプル値に適用される重みは、その参照サンプル値を含む参照サンプルの組が現在の予測対象サンプルから離れるにつれて増加する。
これらの組み合わせに関する様々な異なる選択肢は、試験的な符号化としてテストすることによってそのうちの1つを選択することができる。例えば、圧縮データストリームの一部としてやりとりされるパラメータデータによって示される選択肢を用いて、符号化において使用するため、例えばテスト対象の間で一番小さい差分絶対値和(SAD)に従って選択される。
あるいは、行/列内のサブグループ内の参照サンプルを、図20の技術を用いて組み合わせて、サブコンビネーションを形成することができる。その後、サブコンビネーションは図21及び22に示す技術を用いて処理することができる。この構成の例は例えば以下のような構成例である。4つの行/列が1から4の数字で那波リングされ、行/列1は、現在のブロック又は領域に空間的に最も近いブロック又は領域である。
行/列1及び2は、
・ 図20に示すように第1の複合参照サンプルを生成し、
・ 第1の複合参照サンプルから第1の中間予測サンプル値を生成し、
行/列3及び4は、
・ 図20に示すように第2の複合参照サンプルを生成し、
・ 第2の複合参照サンプルから第2の中間予測サンプル値を生成し、
その後、
・ 第1及び第2の中間予測サンプル値から最終的な予測サンプル値pを生成する。
以降、参照サンプルの行と列の数に応じた、様々なオプションについて説明する。繰り返しになるが、上述のように、以下の例では8x8の予測対象サンプルのブロック2400に関して説明を行うが、本技術は様々なサイズや形状のブロックに適用可能である。
なお、しかしながら、いくつかの例においては、特定のブロックサイズ及び/又は形状は、本技術の適用において除外又は制限され得る。例えば、4サンプル以下のいずれかの寸法を有するブロックなどの小さなブロックについては除外又は制限され得る。
また、後述するイントラモードセレクタの動作において、特定の方向モードは本技術から除外される可能性がある。
したがって、図21及び22は、イントラ画像予測部が1以上の組の参照サンプルの間を補間することによって予測サンプルを導出するように構成される例について示す。例えば、イントラ画像予測部は、2つ以上の組の参照サンプル(例えば図21における(a,c,e)及び(b,d,f)又は図22における(c,e,g)及び(b,d,f))間の補間を行い、各組の参照サンプルから中間サンプル値p1,p2をそれぞれ導出し、この中間サンプル値を組み合わせ、予測サンプルpを導出するように構成される。この構成例において、参照サンプルの組は、参照サンプルの1又は2以上の平行アレイ2070,2075のそれぞれからのサンプルを含む。図22の例において、参照位置2090、2095を中心に、参照サンプルの各組が、予測方向によって示される参照サンプルの各アレイ内の組を含む。上述したように、イントラ画像予測部530は、重み付けされた組み合わせに従って中間サンプル値を組み合わせるように構成することができ、この場合、中間サンプル値に適用される重みは、現在の領域(上記の例では、0.6の重みがより近いアレイ2070に適用され、0.4の重みがより遠いアレイ2075に適用されるように)又は現在の予測対象サンプルから、参照サンプルの組が離れるにつれて減少する。
図23は単一の行/列2410の参照サンプルを示す概略図である。これがイントラ予測部に使用可能な唯一のオプションである場合、この動作は上記のイントラ予測部に対応するが、図24から26に示される1つ以上の他の技術の任意の選択(イントラモードセレクタによる)と組み合わせて、その任意の選択(イントラモードセレクタによる)の状況において、本開示の実施形態を形成するイントラ予測部が単一の行/列2410を使用してもよい。
図24は、行/列2500、2510のペアを示し、ここでは、上述のように、行/列2510は、1つ以上のサンプル2520、2530によって延長され、上述した予測方向の全範囲の使用を可能にする。
同様に、図25は3つの行/列の参照サンプル2600、2610、2620を示す概略図である。上記と同じ理由で、行/列2620は1以上のサンプル2630、2640によって第2の行/列2610に対して延長される。
最後の例として、図23は、主に行/列2700、2710、2720、2730の4つの行/列の参照サンプルを示す概略図である。しかしこれは使用可能な行/列の数の制限を表しているわけではない。上記と同じ理由で、行/列2730も1以上のサンプル2740、2750によって第3の行/列2720に対して延長される。
図27から30は例えばそれぞれ図23から26の場合に関する、射影バージョンの複数の行/列の参照サンプルを示す(図27から30における影付きブロック)。なお、少なくとも一部の例においては、射影処理は使用する予測方向に基づくことができる。つまり、図27から30において任意の予測方向に対する一例を用いている。射影参照サンプルに関しては、図17の技術と同様の技術を使用して、図19の技術を適用するための参照位置及び参照サンプルを導出することができる。
図31は、上述した図8のイントラモードセレクタ520などのイントラモードセレクタの動作の少なくとも一部を概略的に示す。
イントラモードセレクタは、1組の参照サンプル3205に関する現在のブロック又は領域のイントラ予測に使用するための適切なモードを検出するように動作することができる。上記を達成するために、予測演算候補の中から予測演算を選択するため、参照サンプルの特性の(少なくとも部分的な)テスト符号化及び/又は分析などの様々な技法が提案されている。
本実施例では、これらの技術のいずれかを使用し、(いくつかの構成例においては、)参照サンプルの行/列の数の複数の順列に関して、技術を繰り返すか、又は技術複数の例において適用することができる。
ここで、「順列」とは、参照サンプルの行/列の群を示すために使用される。この群は、現在のブロック又は領域に空間的に最も近い行/列と、現在のブロック又は領域から空間的に徐々に離れる0以上の次に近い行/列とを含み得る。
「予測動作」は、モード又は方向及び/又は行/列の関連順列に関して述べる際に用いられることができる。従って、実施例において、イントラモードセレクタは、それぞれ少なくとも予測方向を定義する一連の予測演算候補の中から、現在の画像の現在の領域のサンプルを予測するための予測演算を選択するように構成されるセレクタであって、現在の領域はサンプルの複数の行及び複数の列のアレイを含む。イントラ画像予測部は、現在の予測対象サンプルと複数の参照サンプル間の参照位置との間の選択された予測動作によって定義される予測方向に基づいて、同じ画像の参照サンプル群のうちの1以上の参照サンプルに対する現在の領域の予測サンプルを導出するように構成される。予測動作候補の少なくとも一部に関して、参照サンプル群はそれぞれ現在の領域から離れた異なる場所に配置された参照サンプルの複数の平行線形アレイ(例えば行、列、行及び列(なお、行と列は「角」があっても線形配列である)、及び/又は射影アレイ)を含む。
イントラモードセレクタは、試験用の各モードの符号化特性を検出するように動作するモード特性検出部3200を含む(そして、少なくともいくつかの例においては、各モードにおいて、参照サンプルのn個の行/列の順列Pnがそのモードで利用可能であり、でnは1から最大で少なくとも2の範囲にある)。符号化効率検出部3210は、モード特性検出部3200で検査されたモード/順列毎の符号化効率を検出する。符号化効率とは、そのモード及び行/列の順列が使用される場合に生じ得る残差画像を符号化するために必要なデータの量や、そのモード/順列の使用を伝達するために必要なデータの量等の特徴に関連し得る。
予測方向の選択において、構成例によると、単純なSAD(差分絶対値和)テストを用いて全34方向のモードをテストし、現在のブロックに対して最も有用である可能性が高いモードの候補リストを導出する。次に、モードの候補リストは、使用する予測モードを選択するためにフルエンコードでテストされる。
参照サンプルの複数の行及び/又は列を使用する現在の技術は、状況によっては、単一の行/列を使用するよりも遅い(又は処理要件が高い)場合がある。このような決定を行い、そしてデコーダに伝達するエンコーダ側でこれを緩和するため、モードの候補リストをテストするためだけに複数の行/列予測を使用するように、構成例を用意してもよい。
符号化効率検出部3210による検出結果に基づいて、モードセレクタ3220はイントラ予測部530に送る予測モード3230を選択し、情報3240も、モードエンコーダ3245に送られる。モードエンコーダ3245は、使用中のモード/順列を示す符号化データストリームの一部を形成するデータ3250、すなわち、画像の各領域に対して選択された予測動作を識別するデータを符号化する制御部343の一部等である。
したがって、これにより、イントラモードセレクタが、2つ以上の群の参照サンプルの中から選択を行うように構成され、各群がそれぞれ異なる数の参照サンプルの平行アレイを含む例が提供される。
図32、33は図31のイントラモードセレクタの動作方法の候補を示す概略的なフローチャートである。
図32において、参照サンプルの行/列の利用可能な順列Pがある限り(本明細書に概略的に示されているように直列であろうと並列であろうと)多くの場合において実行されるステップ3300〜3310は、参照サンプルの行/列のそれぞれの順列候補を使用してベストモードを検出するモード特性検出部3200及び符号化効率検出部3210に関する。したがって、ベストモードは、単一の行/列の参照サンプルを使用して選択することができ、別のベストモードは、2つの行/列の参照サンプル等を使用して選択することができる。次に、ステップ3320において、符号化効率検出部3210は、ステップ3300〜3310において検出されたモード及び順列それぞれの効率を検出する。これにより、ステップ3330において、モードセレクタ3220は、単一モード及び順列の行/列を選択し、モードエンコーダ3245は、選択されたモード及び順列を定義する情報を符号化する。
図33の他の動作モードでは、符号化処理における最初のステージでは、ステップ3400において、n行/列(nは2以上であるため、順列は2行/列になり得る)の特定の順列の使用を確立し、これを例えばパラメータセット内のデコーダに伝達する。次いで、ステップ3410において、モード特性検出部3200、符号化効率検出部3210及びモードセレクタ3220は協働して、行/列の特定の確立された順列を用いてベストな予測モードを選択し、ステップ3420において、モードエンコーダ3425は、そのモードを定義する情報を符号化する。
デコーダ側では、図34の例ではイントラモードセレクタが示されており、このイントラモードセレクタは、使用される特定のモード(オプションとして行/列の組)を定義する符号化データストリーム内のデータ3250等のデータを検出する符号化データ検出部3500を備え、モードセレクタ3510は、使用される行/列のモード及び順列を示す情報3520をイントラ予測部530に提供する。すなわち、画像の各領域に対して選択される予測動作を識別する符号化データを検出するように構成される。
図35、36はそれぞれ図8のイントラ予測部等のイントラ予測部の動作方法を示す概略的なフローチャートである。
図35は、主に、上述の図21及び22に示される動作に関係する。ステップ3600において、中間予測サンプル値p2等の中間予測サンプル値は、第1の組の参照サンプルから、例えば、現在のブロック又は領域に最も近い行/列の参照サンプルの組から補間され、そして、参照サンプルの行/列と同じだけ繰り返しを行い、ステップ3610は、参照サンプルのそれぞれの行/列からの参照サンプルの残りの各組から中間予測サンプル値p1の補間を表す。上述のように、参照サンプルの最も近い行/列よりも現在のブロック又は領域から離れた参照サンプルの行/列について、使用する参照サンプルの選択は、例えば、予測方向に従って各行/列における参照位置を検出することによって、又は最も近い行/列において識別された対応する位置を使用することによって行うことができる。そして、ステップ3620において、中間予測サンプル値を例えば加重平均によって組み合わせ、最終的な予測サンプル値を生成する。
図36は、図20に示される処理にさらに関連している。ステップ3700において、2つ以上の組の参照サンプルのそれぞれのメンバー(例えば、予測方向に沿ってさらなる参照位置を追跡することによって定義された最も近い行/列内の組以外の組)は、組み合わされた組(図20のh、i、j)に組み込まれ、そして、ステップ3710において組み合わされた組からの予測サンプル値pを補間する。
イントラ予測部の動作のオプション機能として、図37は、必ずしも近傍又は隣接の参照サンプルを単に繰り返す必要なしに、追加の参照サンプル2520、2530、2630、2640、2740、2750、又はそれらの少なくとも一部を提供する技術を概略的に示す。
図37を参照すると、不足参照サンプル検出部3800は、参照サンプルが利用可能でないことを検出する。これは、その位置のサンプルが必ずしも復号されていないせいである可能性がある。いくつかの例において、サンプルは復号されていないことがある。他の例では、サンプルは復号化されている、このサンプルが現在の符号化単位の外部にあるため、参照サンプルを現在の予測に利用可能にするために必要なバッファリングなどのハードウェア要件が不当に高くなる可能性があり、したがって、予測のためにサンプルが提供されないような設計決定が行われる。例えば、上記の考察によると、図25及び26においてサンプル2530、2640、2642が現在の符号化単位の外にある場合には、それらが利用できない。これらの問題に対処するために、いくつかの構成例においては、外挿部3810は、利用可能な参照サンプルのうちの複数の参照サンプルに基づく外挿処理を用いて必要な値3820を生成する。この構成における動作は、図38の概略的なフローチャートによって示される。ステップ3900は、不足参照サンプルの検出部3800による検出に関するものであり、ステップ3910は、必要な値の外挿部3810による外挿に関するものである。
不足参照サンプル検出の使用について述べる他の例に関して、以下に説明する。
図39は画像符号化方法について示す概略的なフローチャートであり、この画像符号化方法は、
それぞれ少なくとも予測方向を定義する一連の予測動作候補の中から、現在の画像の現在の領域のサンプルを予測するための予測動作を選択するステップであって、現在の領域はサンプルの複数の行及び複数の列のアレイを含むステップ(ステップ4000)と、
現在の予測対象サンプルと複数の参照サンプル間の参照位置との間の選択された予測動作によって定義される予測方向に基づいて、同じ画像の参照サンプル群のうちの1以上の参照サンプルに対する現在の領域のイントラ画像予測サンプルを導出するステップ(ステップ4010)を含み、
少なくとも一部の予測動作候補に関して、参照サンプル群はそれぞれ現在の領域から離れた異なる場所に配置された参照サンプルの複数の平行線形アレイを含む。
図40は画像符号化方法について示す概略的なフローチャートであり、この画像符号化方法は、
それぞれ少なくとも予測方向を定義する一連の予測動作候補の中から、現在の画像の現在の領域のサンプルを予測するための予測動作を選択するステップであって、現在の領域はサンプルの複数の行及び複数の列のアレイを含むステップ(ステップ4100)と、
現在の予測対象サンプルと複数の参照サンプル間の参照位置との間の選択された予測動作によって定義される予測方向に基づいて、同じ画像の参照サンプル群のうちの1以上の参照サンプルに対する現在の領域のイントラ画像予測サンプルを導出するステップ(ステップ4110)を含み、
少なくとも一部の予測動作候補に関して、参照サンプル群はそれぞれ現在の領域から離れた異なる場所に配置された参照サンプルの複数の平行線形アレイを含む。
上述の構成例のうち少なくともいくつかにおいてが、参照サンプルの複数の行又は列の使用は、「追加の」(隣接していない)行又は複数の列(又はその両方)が現在のブロックと同じ符号化ツリー単位内にある場合に限定され得る。これらの条件は、個別に適用することもできるし、まとめて適用することもできる。以下において、このような構成についてさらに説明する。
図41は、画像符号化装置が現在の画像を連続的な符号化単位4100のサンプルとして符号化するように構成される構成例における符号化単位アレイを概略的に示す。
少なくともいくつかの実施形態では、符号化単位ごとに、符号化単位4110の組の左上から右下に向けて符号化が行われることが、図9の説明から理解される。これは、符号化単位の最端(この例では、上端及び/又は左端、あるいはその両方)における画像領域について、上述のように複数の線形アレイにおける参照サンプルとして必要とされる少なくともいくつかのサンプルが、先行して復号化された符号化単位のどれだけ(もしあれば)がバッファリングされているかに応じて、利用可能であるか又は利用不可能であるかを判断する場合を意味する。例えば、特定の符号化単位4110について、符号化単位の上側4120及び/又は左側4130における予測は、このような影響を受け得る。画像の左側及び/又は上側の符号化単位については、必要な参照サンプルデータが全く存在しない場合もある。
なお、左上から右下への符号化順序は単なる例に過ぎない。別の順序が使用された場合に考慮する端は、上記で述べた上端及び左端とは異なる可能性がある。また、図41の概略図に示される符号化単位の形状は、符号化単位の実際の形状又は相対的なサイズを表す場合もあれば、そうでない場合もある。
図42は、図8のイントラ画像予測部530に類似するサンプル予測部530'を概略的に示すが、特に現在の領域以外の現在の画像の領域に対応するサンプルを格納するサンプル記憶部4200を明示的に示している。特に、サンプル記憶部4200は、前の符号化単位に隣接する現在の符号化単位内の位置における(例えば)画像領域に関して参照サンプルとして使用するための、現在の領域が位置する符号化単位に隣接する1以上の符号化単位から以前に符号化及び復号化したサンプルを記憶するように構成することができる。
図43、44はサンプル記憶部4200による参照サンプルストレージを示す概略図である。図43に概略的に示すようにいくつかの例では、サンプル記憶部4200は、現在の符号化単位4310の真上の符号化単位から、以前に符号化及び復号化されたサンプルの1以上のライン又は行を格納するライン記憶部として構成され得る。
なお、ライン記憶部は、比較的「高価」であると考えられる。「高価」とは、ライン記憶部の実装のために大量の記憶装置が必要となる可能性があることを意味し、その結果、例えば、エンコーダ及び/又はデコーダの集積回路の実装において大量の論理回路が必要となる可能性がある。従って、ライン記憶部を提供するこということは、論理回路の観点において要件が厳しくなる可能性と、複数の行及び/又は列の参照サンプルが使用され得る本発明の技術によって提供される符号化効率における改善の可能性との間のバランスを取ることを意味する。このような参照サンプルは、特定の符号化単位において容易に利用可能であり得るが、現在の符号化単位の外部からの参照サンプルへのアクセスは、サンプル記憶部4200のようなサンプルストレージの実装(の有無)によって制限される可能性がある。
図44では、以前に符号化及び復号化された符号化単位から現在の符号化単位4410の左側へのサンプル4400の列が、符号化単位4410の領域の左側の列に関する参照サンプルとして使用するために記憶される。
当然、サンプル記憶部4200は、現在の符号化単位の上部(図43)及び左側(図44)にサンプルを格納することができる。当然、1以上の行(及び/又は列)のサンプルを保存することもできる。当然、サンプル記憶部4200は実際に提供されなくてもよい。
図45は、(モードセレクタ3220とほとんどの点で類似している)モードセレクタ3220'が検出部4500に応答することを除いて、図31に示す種類のイントラモードセレクタの構成を概略的に示す。検出部4500は、参照サンプルの上記複数の平行線形アレイのいずれかに対応するサンプルが現在の領域のサンプルの予測に利用することができないかどうかを検出するように構成される検出部であって、参照サンプルの上記複数の平行線形アレイのいずれかが利用できない場合は、利用できない参照サンプルに基づく予測動作候補が上記イントラモードセレクタ3220'によって選択されることを妨ぐように構成される。
なお、これは、図38の構成とは別個のテスト及び機構であり得る。本テストでは、例えば、現在の領域が符号化単位及び/又は画像に対して周辺位置にあるため、及び/又は参照サンプルの2つ以上の平行線形アレイのいずれかがバッファされていない(例えばライン記憶部にある)ために、2以上の平行線形アレイの参照サンプルのいずれかが利用できないかどうかが検出される。図38で使用される種類のサンプル毎の外挿処理は適用されず、代わりに、利用できない行/列を使用する予測モード候補が選択されることが禁止される。
同様に、検出部4500は、現在の画像の現在の領域に関して、上記複数の平行線形アレイが存在する場合、どの平行線形アレイが現在の領域のサンプルの予測に利用することができるかを検出し、利用可能な平行線形アレイのうちの少なくとも1つに基づく予測動作候補を上記セレクタによって予測動作として選択するようにさらに構成される。したがって、例示的な実施形態では、検出部4500は、現在の画像領域について、参照サンプルの必要な行及び/又は列が利用可能であるかどうか(例えば、記憶されていたりバッファされていたりするかどうか)に応じて、セレクタ3220'によるモードの選択を許可又は禁止する。
次に、検出部4500は、サンプル記憶部4200が存在するかしないかを定義する構成データ4510、特に、現在の符号化単位の画像領域に関する参照サンプルとして使用するために保持する、前の隣接する符号化単位のサンプルの行及び/又は列の数(もしあれば)を定義する構成データ4510に応答する。
構成データ4510は、以下のうちの下の方を重大なものとして定義することができる。(a)どの記憶部がデコーダ側に存在しているか(b)どの記憶部がエンコーダ側において存在している又は利用可能であるか。これは、選択されたモードは、最終的にはデコーダで実施される必要があるが、関連する記憶部がエンコーダ側にも存在しない限り、モードを符号化において実施することができないためである。符号化データが最終的に既知のデコーダによって復号される場合、そのデコーダの特性は、構成データ4510として提供されることができる。しかし、デコーダが未知である場合、構成データ4510は、任意のデコーダではデコードできない符号化データの生成を許可しないように、(たとえエンコーダ側に1つ以上の記憶部が存在しても)サンプル記憶部がゼロであると定義してもよい。他の例においては、公式規格であれ、専有の規格であれ、あるいは事実上の業界規格であれ、デコーダ規格が(例えば)1つのライン記憶部(又は一般的な数であるn個のライン記憶部)が常に存在しなければならないと指定する場合、未知のデコーダに対しては、n個のライン記憶部がエンコーダ側で利用可能であると仮定して、n個のライン記憶部を指定するように構成データ4510を構成することができる。
このように、検出部4500は、復号化装置の1以上のパラメータを定義する構成データに反応して、参照サンプルの複数の平行線形アレイのいずれかに対応するサンプルが上記復号化装置における現在の領域のサンプルの予測に利用できるかどうかを検出することができる。
検出部4500はまた、画像及び/又は現在の符号化単位に関する現在の画像領域の画像位置を定義する位置情報4520に反応する。現在の画像領域が画像の左端又は上端に隣接している場合、検出部は、参照サンプルの複数の行及び/又は列が利用できないことを検出するように構成することができる。現在の画像領域が符号化単位の左端及び/又は上端に隣接している場合、検出部は、構成データ4510が参照サンプルがサンプル記憶部4200によって保持されることを定義しない限り、参照サンプルの複数の行及び/又は列が利用できないことを検出するように構成することができる。従って、これらの例において、検出部は、前回の符号化単位に隣接する符号化単位内の位置にある画像領域に関して、参照サンプルの複数の平行線形アレイのうちのいずれかがサンプル記憶部によって保持されているかどうかを検出するように構成される。
図46から49は検出部4500の動作の例を示す予測処理を示す概略図であり、この検出部4500は、参照サンプルの複数の平行線形アレイのうち少なくとも一部の平行線形アレイに対応するサンプル位置が現在の画像の外に位置するように、現在の領域が現在の領域の縁に隣接しているかどうかを検出する。
図46及び図47において、符号化又は復号される画像領域4600は、そのそれぞれの符号化単位の上部にある。次の上部符号化単位との境界線は、太線4610によって模式的に示されている。この例では、1つのライン記憶部を提供するサンプル記憶部4200が使用され、その結果、次の上部符号化ユニットからの1ライン分のサンプルが参照サンプルとして使用可能となる。参照サンプルの2行目は、画像領域4600の上方では利用できない。
図46では、参照サンプルの単一行が、参照位置4620のような、画像領域4600の上方の参照サンプル間の参照位置を含む予測のために使用される。しかし、(図46の例では)参照サンプルとして使用するためにサンプル4630の2以上の列が領域4600の左側において利用可能であるため、矢印4640によって示される予測など、画像領域4600の左側の参照サンプル間の参照位置を含む予測においては、参照サンプルの2つの列又は線形アレイを使用する。
図47では、すべての予測に関して一貫した技術が使用されるように、すべての参照サンプル位置についての予測に単一の線形アレイ(行、列)のみが使用される。上記は、上部にある2行目が使用できない場合でも行われる。そして2列目4700が利用可能であっても、それは使用されない。
図48及び49において、再び、現在の画像領域4800は、符号化単位(境界線4810は太線で示されている)の上部にある。図48では、1つのライン記憶部が利用可能であり、図49では、2つのライン記憶部が利用可能である。
図48において、単一行予測は、参照サンプル位置4820のような現在の画像領域4800の上部の参照サンプル位置に対して使用されるが、左側の参照サンプル位置に対しては、(上記の技術のいずれかを用いた)4つの列4830の予測を使用することができる。これは、行データを使用せず列データのみを使用する参照サンプル位置に適用される。
図49において、追加のライン記憶部が使用されているため(つまり、2つのライン記憶部が提供される)、すべてのサンプル位置で2つの行/列予測が用いられる。3番目及び4番目の列4900も利用可能であるが、一貫したアプローチを提供するために、これらは使用されない。他の例では、現在の領域の上部の参照サンプル位置のために2つの行を使用し、現在の領域の左の参照サンプル位置のために4つの列を使用することができる。
なお、本明細書に記載される全ての実施形態において、複数の行/列について、予測とは加重和であり得るが、これは、必ずしも25:25:25:25の重み付けではなく、例えば0:100:0:0の重み付けであってもよい(ここで、4つの重みは、例えば、第1、第2、第3及び第4の隣接する行/列のように、現在の画像領域からアレイが遠ざかる順である)。これは、マルチプレクサとして実装されることができる。
したがって、少なくとも図46、48において、検出部4500は、現在の画像領域に対して垂直又は平行に配置されるそれぞれの参照サンプル位置に関して、参照サンプルの複数の平行線形アレイのいずれかに対応するサンプルが(例えば、現在の領域に関して存在しないサンプルの提供又はライン記憶部に依存するものを除くすべての予測モード候補である)現在の領域のサンプルの予測に利用することができないかどうかを検出し、もし現在の画像領域に対して垂直又は平行に配置される参照サンプル位置に関して上記参照サンプルの複数の平行線形アレイのいずれかが利用できない場合は、利用できない参照サンプルに基づく予測動作候補が上記セレクタによって選択されることを妨ぐように構成される。なお、ライン記憶部が存在するかどうかは一般的に領域の一番上の行及び/又は現在の領域の上部のサンプルに依存するモードにのみ関連するので、検出は領域ごとに行うことができる。
(図41の4140で示されるような)画像の最上部などの場合では、どのようなローカルバッファリングがあるかにかかわらず、単に現在の領域が画像の最上部にあるという理由だけで、現在の領域より上のサンプルを利用できない場合がある。このような状況では、所定の値(例えばグレー)のサンプルを参照サンプルに置き換えることができる。検出部4500は位置情報4520からこの状況を検出し、所定の参照サンプルに依存するモード以外のモードを使用しないように検出部4500を制御することができる。したがって、例示的な実施形態では、予測動作候補のうちの少なくとも一部に関して、参照サンプル群は、1以上の所定の値を含む。検出部4500は現在の画像の現在の領域に関して、現在の領域のサンプルの予測に上記複数の平行線形アレイが1つも利用できないかどうか検出し、予測動作として、参照サンプルとして上記所定の値に基づいて現在の領域の予測動作候補の検出を上記セレクタによって行うようにさらに構成される。
デコーダ側では、検出部による対応する検出、導出、及び制御動作を実行することができる。あるいは、符号化の特性を、上述の図34を参照して説明したのと同じ方法でデコーダに伝達することができる。
図50、51は各方法について示す概略的なフローチャートである。
図50は画像符号化方法について示す概略的なフローチャートであり、この画像符号化方法は、
それぞれ少なくとも予測方向を定義する一連の予測動作候補の中から、現在の画像の現在の領域のサンプルを予測するための予測動作を選択するステップであって、現在の領域はサンプルの複数の行及び複数の列のアレイを含むステップ(ステップ5000)と、
現在の予測対象サンプルと複数の参照サンプル間の参照位置との間の選択された予測動作によって定義される予測方向に基づいて、同じ画像の参照サンプル群のうちの1以上の参照サンプルに対する現在の領域のイントラ画像予測サンプルを導出するステップ(ステップ5010)であって、
少なくとも一部の予測動作候補に関して、参照サンプル群はそれぞれ現在の領域から離れた異なる場所に配置された参照サンプルの複数の平行線形アレイを含むステップと、
参照サンプルの複数の平行線形アレイのいずれかに対応するサンプルが上記現在の領域のサンプルの予測に利用することができないかどうかを検出するステップ(ステップ5020)と、
参照サンプルの複数の平行線形アレイのいずれかが利用できない場合は、利用できない参照サンプルに基づく予測動作候補が選択されることを妨ぐステップ(ステップ5030)とを含む。
図51は画像復号方法について示す概略的なフローチャートであり、この画像復号方法は、
それぞれ少なくとも予測方向を定義する一連の予測動作候補の中から、現在の画像の現在の領域のサンプルを予測するための予測動作を選択するステップであって、現在の領域はサンプルの複数の行及び複数の列のアレイを含むステップ(ステップ5100)と、
現在の予測対象サンプルと複数の参照サンプル間の参照位置との間の選択された予測動作によって定義される予測方向に基づいて、同じ画像の参照サンプル群のうちの1以上の参照サンプルに対する現在の領域のイントラ画像予測サンプルを導出するステップ(ステップ5110)であって、
少なくとも一部の予測動作候補に関して、参照サンプル群はそれぞれ現在の領域から離れた異なる場所に配置された参照サンプルの複数の平行線形アレイを含むステップと、
参照サンプルの複数の平行線形アレイのいずれかに対応するサンプルが上記現在の領域のサンプルの予測に利用することができないかどうかを検出するステップ(ステップ5120)と、
参照サンプルの複数の平行線形アレイのいずれかが利用できない場合は、利用できない参照サンプルに基づく予測動作候補が選択されることを妨ぐステップ(ステップ5130)とを含む。
本発明の実施形態は、ソフトウェア制御型データ処理装置によって、少なくとも部分的に実施されるものとして記載する限りにおいて、そのようなソフトウェアを有する光ディスク、磁気ディスク、半導体メモリ等の非一過性の機械読み取り可能媒体も本発明の一実施形態を表すと考えられることが理解される。さらに、このようなソフトウェアを、他の形態で配信することができる。同様に、上述の方法に従って生成された符号化データを含むデータ信号(非一過性の機械読み取り可能媒体に具体化されているかどうかに関わらない)も、本開示の実施形態を表すと考えられる。
上記の教示に照らして本開示の多数の修正及び変形が可能である。したがって、添付の特許請求の範囲内で、本技術が、本明細書に具体的に記載したものと異なる方法で実践され得ることが理解されるべきである。
本開示の各の様態及び特徴は、以下の項目によって定義される。
1.
それぞれ少なくとも予測方向を定義する一連の予測動作候補の中から、現在の画像の現在の領域のサンプルを予測するための予測動作を選択するように構成されるセレクタであって、現在の領域はサンプルの複数の行及び複数の列のアレイを含むセレクタと、
現在の予測対象サンプルと複数の参照サンプル間の参照位置との間の選択された予測動作によって定義される予測方向に基づいて、同じ画像の参照サンプル群のうちの1以上の参照サンプルに対する現在の領域の予測サンプルを導出するように構成されるイントラ画像予測部であって、
少なくとも一部の予測動作候補に関して、参照サンプル群はそれぞれ現在の領域から離れた異なる場所に配置された参照サンプルの複数の平行線形アレイを含む、
画像符号化装置。
2.
項目1に記載の装置であって、
イントラ画像予測部が1以上の組の参照サンプルの間を補間することによって予測サンプルを導出するように構成される、
装置。
3.
項目2に記載の装置であって、
イントラ画像予測部は、2つ以上の組の参照サンプル間の補間を行い、各組の参照サンプルから中間サンプル値を導出し、この中間サンプル値を組み合わせ、予測サンプルを導出するように構成される、
装置。
4.
項目3に記載の装置であって、
参照サンプルの各組は、参照サンプルのそれぞれ1つ又は2つ以上の平行アレイからのサンプルを含む、
装置。
5.
項目4に記載の装置であって、
参照サンプル各組が、予測方向によって示される、各参照サンプルアレイにおける組、又は各参照サンプルアレイから補間された値の組を含む
装置。
6.
項目3又は4に記載の装置であって、
イントラ画像予測部は、重み付けされた組み合わせに従って中間サンプル値を組み合わせるように構成され、中間サンプル値に適用される重みは、中間サンプル値を生成する参照サンプルの組が、現在の領域から離れるにつれて減少する、
装置。
7.
項目3に記載の装置であって、
イントラ画像予測部は、重み付けされた組み合わせに従って中間サンプル値を組み合わせるように構成され、この重み付けされた組み合わせでは、現在の画像領域に隣接しない参照サンプルから導出された中間サンプル値に適用される重みは、中間サンプル値生成するために用いる参照サンプルの組が現在の予測対象サンプルから離れるにつれて増加する、
装置。
8.
上記の項目のいずれか1つに記載の装置であって、
イントラ画像予測部は、2つ以上の組の参照サンプルを組み合わせ、中間参照サンプル値を導出し、この中間参照サンプル値から予測サンプルを導出するように構成される、
装置。
9.
項目8に記載の装置であって、
イントラ画像予測部は、中間参照サンプルの間を補間することによって予測サンプルを導出すように構成される、
装置。
10.
項目8又は9に記載の装置であって、
参照サンプルの各組は、参照サンプルのそれぞれ1つ又は2つ以上の平行アレイからのサンプルを含む、
装置。
11.
項目10に記載の装置であって、
参照サンプル各組は、予測方向によって示される、各参照サンプルアレイにおける組を含む
装置。
12.
項目8に記載の装置であって、
イントラ画像予測部は、重み付けされた組み合わせに従って参照サンプル値を組み合わせるように構成され、参照サンプル値に適用される重みは、その参照サンプル値を含む参照サンプルの組が、現在の領域から離れるにつれて減少する、
装置。
13.
項目8に記載の装置であって、
イントラ画像予測部は、重み付けされた組み合わせに従って参照サンプル値を組み合わせるように構成され、現在の画像領域に隣接しない参照サンプル値に適用される重みは、その参照サンプル値を含む参照サンプルの組が現在の予測対象サンプルから離れるにつれて増加する、
装置。
14.
項目8に記載の装置であって、
イントラ画像予測部が、参照サンプルの線形アレイを形成するために参照サンプルの2つ以上の平行線形アレイを組み合わせるように構成される、
装置。
15.
上記の項目のいずれか1つに記載の装置であって、
セレクタは2つ以上の群の参照サンプルの中から選択を行うように構成され、各群がそれぞれ異なる数の参照サンプルの平行アレイを含む、
装置。
16.
上記の項目のいずれか1つに記載の装置であって、
セレクタは少なくとも部分的な符号化を行い、予測動作候補の中から予測動作を選択する、
装置。
17.
上記の項目のいずれか1つに記載の装置であって、
制御部は画像の各領域に対して選択される予測動作を識別するデータを符号化するように構成される、
装置。
18.
上記の項目のいずれか1つに記載装置を含む、
ビデオ保存、撮影、送信、又は受信装置。
19.
それぞれ少なくとも予測方向を定義する一連の予測動作候補の中から、現在の画像の現在の領域のサンプルを予測するための予測動作を選択するように構成されるセレクタであって、現在の領域はサンプルの複数の行及び複数の列のアレイを含むセレクタと、
現在の予測対象サンプルと複数の参照サンプル間の参照位置との間の選択された予測動作によって定義される予測方向に基づいて、同じ画像の参照サンプル群のうちの1以上の参照サンプルに対する現在の領域の予測サンプルを導出するように構成されるイントラ画像予測部であって、
少なくとも一部の予測動作候補に関して、参照サンプル群はそれぞれ現在の領域から離れた異なる場所に配置された参照サンプルの複数の平行線形アレイを含む、
画像復号装置。
20.
項目19に記載の装置であって、
イントラ画像予測部が1以上の組の参照サンプルの間を補間することによって予測サンプルを導出するように構成される、
装置。
21.
項目20に記載の装置であって、
イントラ画像予測部は、2つ以上の組の参照サンプル間の補間を行い、各組の参照サンプルから中間サンプル値を導出し、この中間サンプル値を組み合わせ、予測サンプルを導出するように構成される、
装置。
22.
項目21に記載の装置であって、
参照サンプルの各組は、参照サンプルのそれぞれ1つ又は2つ以上の平行アレイからのサンプルを含む、
装置。
23.
項目22に記載の装置であって、
参照サンプル各組は、予測方向によって示される、各参照サンプルアレイにおける組を含む
装置。
24.
項目21に記載の装置であって、
イントラ画像予測部は、重み付けされた組み合わせに従って中間サンプル値を組み合わせるように構成され、中間サンプル値に適用される重みは、中間サンプル値を生成する参照サンプルの組が、現在の領域から離れるにつれて減少する、
装置。
25.
項目の19に記載の装置であって、
イントラ画像予測部は、2つ以上の組の参照サンプルを組み合わせ、中間参照サンプル値を導出し、この中間参照サンプル値から予測サンプルを導出するように構成される、
装置。
26.
項目25に記載の装置であって、
イントラ画像予測部は、中間参照サンプルの間を補間することによって予測サンプルを導出すように構成される、
装置。
27.
項目25に記載の装置であって、
参照サンプルの各組は、参照サンプルのそれぞれ1つ又は2つ以上の平行アレイからのサンプルを含む、
装置。
28.
項目27に記載の装置であって、
参照サンプル各組は、予測方向によって示される、各参照サンプルアレイにおける組を含む
装置。
29.
項目25に記載の装置であって、
イントラ画像予測部は、重み付けされた組み合わせに従って参照サンプル値を組み合わせるように構成され、参照サンプル値に適用される重みは、その参照サンプル値を含む参照サンプルの組が、現在の領域から離れるにつれて減少する、
装置。
30.
項目25に記載の装置であって、
イントラ画像予測部が、参照サンプルの線形アレイを形成するために参照サンプルの2つ以上の平行線形アレイを組み合わせるように構成される、
装置。
31.
項目19から30のいずれか1つに記載の装置であって、
セレクタは2つ以上の群の参照サンプルの中から選択を行うように構成され、各群がそれぞれ異なる数の参照サンプルの平行アレイを含む、
装置。
32.
項目19から30のいずれか1つに記載の装置であって、
制御部は画像の各領域に対して選択される予測動作を識別する符号化データを検出するように構成される、
装置。
33.
項目19から30のいずれか1つに記載装置を含む、
ビデオ保存、撮影、送信、又は受信装置。
34.
それぞれ少なくとも予測方向を定義する一連の予測動作候補の中から、現在の画像の現在の領域のサンプルを予測するための予測動作を選択するステップであって、現在の領域はサンプルの複数の行及び複数の列のアレイを含むステップと、
現在の予測対象サンプルと複数の参照サンプル間の参照位置との間の選択された予測動作によって定義される予測方向に基づいて、同じ画像の参照サンプル群のうちの1以上の参照サンプルに対する現在の領域のイントラ画像予測サンプルを導出するステップであって、
少なくとも一部の予測動作候補に関して、参照サンプル群はそれぞれ現在の領域から離れた異なる場所に配置された参照サンプルの複数の平行線形アレイを含むステップを含む、
画像符号化方法。
35.
コンピュータによって実行されると、項目34に記載された方法をコンピュータに行わせる、
コンピュータソフトウェア。
36.
項目35に記載のソフトウェアを記憶する、
機械読み取り可能な非一過性記憶媒体。
37.
項目34に記載の方法によって生成された符号化データを含む、
データ信号。
38.
それぞれ少なくとも予測方向を定義する一連の予測動作候補の中から、現在の画像の現在の領域のサンプルを予測するための予測動作を選択するステップであって、現在の領域はサンプルの複数の行及び複数の列のアレイを含むステップと、
現在の予測対象サンプルと複数の参照サンプル間の参照位置との間の選択された予測動作によって定義される予測方向に基づいて、同じ画像の参照サンプル群のうちの1以上の参照サンプルに対する現在の領域のイントラ画像予測サンプルを導出するステップであって、
少なくとも一部の予測動作候補に関して、参照サンプル群はそれぞれ現在の領域から離れた異なる場所に配置された参照サンプルの複数の平行線形アレイを含むステップを含む、
画像復号方法。
39.
コンピュータによって実行されると、項目38に記載された方法をコンピュータに行わせる、
コンピュータソフトウェア。
40.
項目39に記載のソフトウェアを記憶する、
機械読み取り可能な非一過性記憶媒体。
41.
イメージセンサと、項目1から17のいずれか1つに記載の符号化装置と、項目19から32のいずれか1つに記載の復号装置と、復号画像を出力する表示装置を含む、
ビデオ撮影装置。
本開示のさらなる様態及び特徴は、以下の項目によって定義される。
1.
それぞれ少なくとも予測方向を定義する一連の予測動作候補の中から、現在の画像の現在の領域のサンプルを予測するための予測動作を選択するように構成されるセレクタであって、現在の領域はサンプルの複数の行及び複数の列のアレイを含むセレクタと、
現在の予測対象サンプルと複数の参照サンプル間の参照位置との間の選択された予測動作によって定義される予測方向に基づいて、同じ画像の参照サンプル群のうちの1以上の参照サンプルに対する現在の領域の予測サンプルを導出するように構成されるイントラ画像予測部であって、少なくとも一部の予測動作候補に関して、参照サンプル群はそれぞれ現在の領域から離れた異なる場所に配置された参照サンプルの複数の平行線形アレイを含むイントラ画像予測部と、
参照サンプルの上記複数の平行線形アレイのいずれかに対応するサンプルが現在の領域のサンプルの予測に利用することができないかどうかを検出するように構成される検出部であって、参照サンプルの上記複数の平行線形アレイのいずれかが利用できない場合は、利用できない参照サンプルに基づく予測動作候補が上記セレクタによって選択されることを妨ぐように構成される検出部とを含む、
画像符号化装置。
2.
項目1に記載の装置であって、
上記検出部は、現在の画像の現在の領域に関して、上記複数の平行線形アレイが存在する場合、どの平行線形アレイが現在の領域のサンプルの予測に利用することができるかを検出し、利用可能な平行線形アレイのうちの少なくとも1つに基づく予測動作候補を上記セレクタによって予測動作として選択するようにさらに構成される、
装置。
3.
項目1又は2に記載の装置であって、
少なくとも一部の予測動作候補に関して、上記参照サンプル群は1以上の所定の値を含み、
上記検出部は現在の画像の現在の領域に関して、現在の領域のサンプルの予測に上記複数の平行線形アレイが1つも利用できないかどうか検出し、予測動作として、参照サンプルとして上記所定の値に基づいて現在の領域の予測動作候補の選択を上記セレクタによって行うようにさらに構成される、
装置。
4.
上記の項目のいずれか1つに記載の装置であって、
上記検出部は現在の領域の画像位置に対して反応する
装置。
5.
項目4に記載の装置であって、
上記検出部は、参照サンプルの複数の平行線形アレイのうち少なくとも一部の平行線形アレイに対応するサンプル位置が現在の画像の外に位置するように、現在の領域が現在の領域の縁に隣接しているかどうかを検出するように構成される、
装置。
6.
項目4又は5に記載の装置であって、
上記画像符号化装置は、サンプルの一連の符号化単位として現在の画像の符号化を行うように構成され、
上記画像符号化装置は、現在の領域以外の現在の画像の領域に対応するサンプルを保存するサンプル記憶部を含み、
上記検出部は、前の符号化単位に隣接する符号化単位内の位置にある画像領域に関して、参照サンプルの複数の平行線形アレイのうちのいずれかがサンプル記憶部によって保持されているかどうかを検出するように構成される、
装置。
7.
上記の項目のいずれか1つに記載の装置であって、
上記検出部は、現在の画像領域に対して垂直又は平行に配置されるそれぞれの参照サンプル位置に関して、参照サンプルの複数の平行線形アレイのいずれかに対応するサンプルが現在の領域のサンプルの予測に利用することができないかどうかを検出し、もし現在の画像領域に対して垂直又は平行に配置される参照サンプル位置に関して上記参照サンプルの複数の平行線形アレイのいずれかが利用できない場合は、利用できない参照サンプルに基づく予測動作候補が上記セレクタによって選択されることを妨ぐように構成される、
装置。
8.
上記の項目のいずれか1つに記載の装置であって、
上記検出部は、復号化装置の1以上のパラメータを定義する構成データに反応して、参照サンプルの複数の平行線形アレイのいずれかに対応するサンプルが上記復号化装置における現在の領域のサンプルの予測に利用できるかどうかを検出する、
装置。
9.
上記の項目のいずれか1つに記載の装置を含む、
ビデオ保存、撮影、送信、又は受信装置。
10.
それぞれ少なくとも予測方向を定義する一連の予測動作候補の中から、現在の画像の現在の領域のサンプルを予測するための予測動作を選択するように構成されるセレクタであって、現在の領域はサンプルの複数の行及び複数の列のアレイを含むセレクタと、
現在の予測対象サンプルと複数の参照サンプル間の参照位置との間の選択された予測動作によって定義される予測方向に基づいて、同じ画像の参照サンプル群のうちの1以上の参照サンプルに対する現在の領域の予測サンプルを導出するように構成されるイントラ画像予測部であって、少なくとも一部の予測動作候補に関して、参照サンプル群はそれぞれ現在の領域から離れた異なる場所に配置された参照サンプルの複数の平行線形アレイを含むイントラ画像予測部と、
参照サンプルの複数の平行線形アレイのいずれかに対応するサンプルが現在の領域のサンプルの予測に利用することができないかどうかを検出するように構成される検出部であって、参照サンプルの複数の平行線形アレイのいずれかが利用できない場合は、利用できない参照サンプルに基づく予測動作候補が上記セレクタによって選択されることを妨ぐように構成される検出部とを含む、
画像復号装置。
11.
項目10に記載の装置であって、
上記検出部は、現在の画像の現在の領域に関して、上記複数の平行線形アレイが存在する場合、どの平行線形アレイが現在の領域のサンプルの予測に利用することができないかどうかを検出し、利用可能な平行線形アレイのうちの少なくとも1つに基づく予測動作候補を上記セレクタによって予測動作として選択するようにさらに構成される、
装置。
12.
項目10又は11に記載の装置であって、
少なくとも一部の予測動作候補に関して、参照サンプル群は1以上の所定の値を含み、
上記検出部は、現在の画像の現在の領域に関して、現在の領域のサンプルの予測に上記複数の平行線形アレイが1つも利用できないかどうか検出し、予測動作として、参照サンプルとして上記所定の値に基づいて現在の領域に関する予測動作候補の選択を上記セレクタによって行うようにさらに構成される、
装置。
13.
項目10から12のいずれか1つに記載の装置であって、
上記検出部は現在の領域の画像位置に対して反応する
装置。
14.
項目13に記載の装置であって、
上記検出部は、参照サンプルの複数の平行線形アレイのうち少なくとも一部の平行線形アレイに対応するサンプル位置が現在の画像の外に位置するように、現在の領域が現在の領域の縁に隣接しているかどうかを検出するように構成される、
装置。
15.
項目13又は14に記載の装置であって、
上記画像復号装置は、サンプルの一連の符号化単位として現在の画像の復号を行うように構成され、
上記画像復号装置は、現在の領域以外の現在の画像の領域に対応するサンプルを保存するサンプル記憶部を含み、
上記検出部は、前の符号化単位に隣接する符号化単位内の位置にある画像領域に関して、参照サンプルの複数の平行線形アレイのうちのいずれかがサンプル記憶部によって保持されているかどうかを検出するように構成される、
装置。
16.
項目10から15のいずれか1つに記載の装置であって、
上記検出部は、現在の画像領域に対して垂直又は平行に配置されるそれぞれの参照サンプル位置に関して、参照サンプルの複数の平行線形アレイのいずれかに対応するサンプルが現在の領域のサンプルの予測に利用することができないかどうかを検出し、もし現在の画像領域に対して垂直又は平行に配置される参照サンプル位置に関して参照サンプルの複数の平行線形アレイのいずれかが利用できない場合は、利用できない参照サンプルに基づく予測動作候補が上記セレクタによって選択されることを妨ぐように構成される、
装置。
17.
項目10から16のいずれか1つに記載の装置を含む、
ビデオ保存、撮影、送信、又は受信装置。
18.
それぞれ少なくとも予測方向を定義する一連の予測動作候補の中から、現在の画像の現在の領域のサンプルを予測するための予測動作を選択するステップであって、現在の領域はサンプルの複数の行及び複数の列のアレイを含むステップと、
現在の予測対象サンプルと複数の参照サンプル間の参照位置との間の選択された予測動作によって定義される予測方向に基づいて、同じ画像の参照サンプル群のうちの1以上の参照サンプルに対する現在の領域のイントラ画像予測サンプルを導出するステップであって、少なくとも一部の予測動作候補に関して、参照サンプル群はそれぞれ現在の領域から離れた異なる場所に配置された参照サンプルの複数の平行線形アレイを含むステップと、
参照サンプルの複数の平行線形アレイのいずれかに対応するサンプルが上記現在の領域のサンプルの予測に利用することができないかどうかを検出するステップと、
参照サンプルの複数の平行線形アレイのいずれかが利用できない場合は、利用できない参照サンプルに基づく予測動作候補が上記選択ステップにおいて選択されることを妨ぐステップとを含む、
画像符号化方法。
19.
コンピュータによって実行されると、項目18に記載された方法をコンピュータに行わせる、
コンピュータソフトウェア。
20.
項目19に記載のソフトウェアを記憶する、
機械読み取り可能な非一過性記憶媒体。
21.
項目18に記載の方法によって生成された符号化データを含む、
データ信号。
22.
それぞれ少なくとも予測方向を定義する一連の予測動作候補の中から、現在の画像の現在の領域のサンプルを予測するための予測動作を選択するステップであって、現在の領域はサンプルの複数の行及び複数の列のアレイを含むステップと、
現在の予測対象サンプルと複数の参照サンプル間の参照位置との間の選択された予測動作によって定義される予測方向に基づいて、同じ画像の参照サンプル群のうちの1以上の参照サンプルに対する現在の領域のイントラ画像予測サンプルを導出するステップであって、少なくとも一部の予測動作候補に関して、参照サンプル群はそれぞれ現在の領域から離れた異なる場所に配置された参照サンプルの複数の平行線形アレイを含むステップと、
参照サンプルの複数の平行線形アレイのいずれかに対応するサンプルが現在の領域のサンプルの予測に利用することができないかどうかを検出するステップと、
参照サンプルの複数の平行線形アレイのいずれかが利用できない場合は、利用できない参照サンプルに基づく予測動作候補が上記選択ステップにおいて選択されることを妨ぐステップとを含む、
画像復号方法。
23.
コンピュータによって実行されると、項目22に記載された方法をコンピュータに行わせる、
コンピュータソフトウェア。
24.
項目23に記載のソフトウェアを記憶する、
機械読み取り可能な非一過性記憶媒体。

Claims (24)

  1. それぞれ少なくとも予測方向を定義する一連の予測動作候補の中から、現在の画像の現在の領域のサンプルを予測するための予測動作を選択するように構成されるセレクタであって、現在の領域はサンプルの複数の行及び複数の列のアレイを含むセレクタと、
    現在の予測対象サンプルと複数の参照サンプル間の参照位置との間の選択された予測動作によって定義される予測方向に基づいて、同じ画像の参照サンプル群のうちの1以上の参照サンプルに対する現在の領域の予測サンプルを導出するように構成されるイントラ画像予測部であって、少なくとも一部の予測動作候補に関して、参照サンプル群はそれぞれ現在の領域から離れた異なる場所に配置された参照サンプルの複数の平行線形アレイを含むイントラ画像予測部と、
    参照サンプルの前記複数の平行線形アレイのいずれかに対応するサンプルが現在の領域のサンプルの予測に利用することができないかどうかを検出するように構成される検出部であって、参照サンプルの前記複数の平行線形アレイのいずれかが利用できない場合は、利用できない参照サンプルに基づく予測動作候補が前記セレクタによって選択されることを妨ぐように構成される検出部とを含む、
    画像符号化装置。
  2. 請求項1に記載の装置であって、
    前記検出部は、現在の画像の現在の領域に関して、前記複数の平行線形アレイが存在する場合、どの平行線形アレイが現在の領域のサンプルの予測に利用することができるかを検出し、利用可能な平行線形アレイのうちの少なくとも1つに基づく予測動作候補を前記セレクタによって予測動作として選択するようにさらに構成される、
    装置。
  3. 請求項1に記載の装置であって、
    少なくとも一部の予測動作候補に関して、前記参照サンプル群は1以上の所定の値を含み、
    前記検出部は現在の画像の現在の領域に関して、現在の領域のサンプルの予測に前記複数の平行線形アレイが1つも利用できないかどうか検出し、予測動作として、参照サンプルとして前記所定の値に基づいて現在の領域の予測動作候補の選択を前記セレクタによって行うようにさらに構成される、
    装置。
  4. 請求項1に記載の装置であって、
    前記検出部は現在の領域の画像位置に対して反応する
    装置。
  5. 請求項4に記載の装置であって、
    前記検出部は、参照サンプルの複数の平行線形アレイのうち少なくとも一部の平行線形アレイに対応するサンプル位置が現在の画像の外に位置するように、現在の領域が現在の領域の縁に隣接しているかどうかを検出するように構成される、
    装置。
  6. 請求項4に記載の装置であって、
    前記画像符号化装置は、サンプルの一連の符号化単位として現在の画像の符号化を行うように構成され、
    前記画像符号化装置は、現在の領域以外の現在の画像の領域に対応するサンプルを保存するサンプル記憶部を含み、
    前記検出部は、前の符号化単位に隣接する符号化単位内の位置にある画像領域に関して、参照サンプルの複数の平行線形アレイのうちのいずれかがサンプル記憶部によって保持されているかどうかを検出するように構成される、
    装置。
  7. 請求項1に記載の装置であって、
    前記検出部は、現在の画像領域に対して垂直又は平行に配置されるそれぞれの参照サンプル位置に関して、参照サンプルの複数の平行線形アレイのいずれかに対応するサンプルが現在の領域のサンプルの予測に利用することができないかどうかを検出し、もし現在の画像領域に対して垂直又は平行に配置される参照サンプル位置に関して前記参照サンプルの複数の平行線形アレイのいずれかが利用できない場合は、利用できない参照サンプルに基づく予測動作候補が前記セレクタによって選択されることを妨ぐように構成される、
    装置。
  8. 請求項1に記載の装置であって、
    前記検出部は、復号化装置の1以上のパラメータを定義する構成データに反応して、参照サンプルの複数の平行線形アレイのいずれかに対応するサンプルが前記復号化装置における現在の領域のサンプルの予測に利用できるかどうかを検出する、
    装置。
  9. 請求項1に記載の装置を含む、
    ビデオ保存、撮影、送信、又は受信装置。
  10. それぞれ少なくとも予測方向を定義する一連の予測動作候補の中から、現在の画像の現在の領域のサンプルを予測するための予測動作を選択するように構成されるセレクタであって、現在の領域はサンプルの複数の行及び複数の列のアレイを含むセレクタと、
    現在の予測対象サンプルと複数の参照サンプル間の参照位置との間の選択された予測動作によって定義される予測方向に基づいて、同じ画像の参照サンプル群のうちの1以上の参照サンプルに対する現在の領域の予測サンプルを導出するように構成されるイントラ画像予測部であって、少なくとも一部の予測動作候補に関して、参照サンプル群はそれぞれ現在の領域から離れた異なる場所に配置された参照サンプルの複数の平行線形アレイを含むイントラ画像予測部と、
    参照サンプルの複数の平行線形アレイのいずれかに対応するサンプルが現在の領域のサンプルの予測に利用することができないかどうかを検出するように構成される検出部であって、参照サンプルの複数の平行線形アレイのいずれかが利用できない場合は、利用できない参照サンプルに基づく予測動作候補が前記セレクタによって選択されることを妨ぐように構成される検出部とを含む、
    画像復号装置。
  11. 請求項10に記載の装置であって、
    前記検出部は、現在の画像の現在の領域に関して、前記複数の平行線形アレイが存在する場合、どの平行線形アレイが現在の領域のサンプルの予測に利用することができないかどうかを検出し、利用可能な平行線形アレイのうちの少なくとも1つに基づく予測動作候補を前記セレクタによって予測動作として選択するようにさらに構成される、
    装置。
  12. 請求項10に記載の装置であって、
    少なくとも一部の予測動作候補に関して、参照サンプル群は1以上の所定の値を含み、
    前記検出部は、現在の画像の現在の領域に関して、現在の領域のサンプルの予測に前記複数の平行線形アレイが1つも利用できないかどうか検出し、予測動作として、参照サンプルとして前記所定の値に基づいて現在の領域に関する予測動作候補の選択を前記セレクタによって行うようにさらに構成される、
    装置。
  13. 請求項10に記載の装置であって、
    前記検出部は現在の領域の画像位置に対して反応する
    装置。
  14. 請求項13に記載の装置であって、
    前記検出部は、参照サンプルの複数の平行線形アレイのうち少なくとも一部の平行線形アレイに対応するサンプル位置が現在の画像の外に位置するように、現在の領域が現在の領域の縁に隣接しているかどうかを検出するように構成される、
    装置。
  15. 請求項13に記載の装置であって、
    前記画像復号装置は、サンプルの一連の符号化単位として現在の画像の復号を行うように構成され、
    前記画像復号装置は、現在の領域以外の現在の画像の領域に対応するサンプルを保存するサンプル記憶部を含み、
    前記検出部は、前の符号化単位に隣接する符号化単位内の位置にある画像領域に関して、参照サンプルの複数の平行線形アレイのうちのいずれかがサンプル記憶部によって保持されているかどうかを検出するように構成される、
    装置。
  16. 請求項10に記載の装置であって、
    前記検出部は、現在の画像領域に対して垂直又は平行に配置されるそれぞれの参照サンプル位置に関して、参照サンプルの複数の平行線形アレイのいずれかに対応するサンプルが現在の領域のサンプルの予測に利用することができないかどうかを検出し、もし現在の画像領域に対して垂直又は平行に配置される参照サンプル位置に関して参照サンプルの複数の平行線形アレイのいずれかが利用できない場合は、利用できない参照サンプルに基づく予測動作候補が前記セレクタによって選択されることを妨ぐように構成される、
    装置。
  17. 請求項10に記載の装置を含む、
    ビデオ保存、撮影、送信、又は受信装置。
  18. それぞれ少なくとも予測方向を定義する一連の予測動作候補の中から、現在の画像の現在の領域のサンプルを予測するための予測動作を選択するステップであって、現在の領域はサンプルの複数の行及び複数の列のアレイを含むステップと、
    現在の予測対象サンプルと複数の参照サンプル間の参照位置との間の選択された予測動作によって定義される予測方向に基づいて、同じ画像の参照サンプル群のうちの1以上の参照サンプルに対する現在の領域のイントラ画像予測サンプルを導出するステップであって、少なくとも一部の予測動作候補に関して、参照サンプル群はそれぞれ現在の領域から離れた異なる場所に配置された参照サンプルの複数の平行線形アレイを含むステップと、
    参照サンプルの複数の平行線形アレイのいずれかに対応するサンプルが前記現在の領域のサンプルの予測に利用することができないかどうかを検出するステップと、
    参照サンプルの複数の平行線形アレイのいずれかが利用できない場合は、利用できない参照サンプルに基づく予測動作候補が前記選択ステップにおいて選択されることを妨ぐステップとを含む、
    画像符号化方法。
  19. コンピュータによって実行されると、請求項18に記載された方法をコンピュータに行わせる、
    コンピュータソフトウェア。
  20. 請求項19に記載のソフトウェアを記憶する、
    機械読み取り可能な非一過性記憶媒体。
  21. 請求項18に記載の方法によって生成された符号化データを含む、
    データ信号。
  22. それぞれ少なくとも予測方向を定義する一連の予測動作候補の中から、現在の画像の現在の領域のサンプルを予測するための予測動作を選択するステップであって、現在の領域はサンプルの複数の行及び複数の列のアレイを含むステップと、
    現在の予測対象サンプルと複数の参照サンプル間の参照位置との間の選択された予測動作によって定義される予測方向に基づいて、同じ画像の参照サンプル群のうちの1以上の参照サンプルに対する現在の領域のイントラ画像予測サンプルを導出するステップであって、少なくとも一部の予測動作候補に関して、参照サンプル群はそれぞれ現在の領域から離れた異なる場所に配置された参照サンプルの複数の平行線形アレイを含むステップと、
    参照サンプルの複数の平行線形アレイのいずれかに対応するサンプルが現在の領域のサンプルの予測に利用することができないかどうかを検出するステップと、
    参照サンプルの複数の平行線形アレイのいずれかが利用できない場合は、利用できない参照サンプルに基づく予測動作候補が前記選択ステップにおいて選択されることを妨ぐステップとを含む、
    画像復号方法。
  23. コンピュータによって実行されると、請求項22に記載された方法をコンピュータに行わせる、
    コンピュータソフトウェア。
  24. 請求項23に記載のソフトウェアを記憶する、
    機械読み取り可能な非一過性記憶媒体。
JP2020523332A 2017-10-27 2018-10-24 画像データ符号化及び復号化 Pending JP2021500818A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023148233A JP2023166555A (ja) 2017-10-27 2023-09-13 画像データ符号化及び復号化

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
GB1717684.3A GB2567861A (en) 2017-10-27 2017-10-27 Image data encoding and decoding
GB1717684.3 2017-10-27
GB1809024.1 2018-06-01
GB1809024.1A GB2567913A (en) 2017-10-27 2018-06-01 Image data encoding and decoding
PCT/GB2018/053077 WO2019081927A1 (en) 2017-10-27 2018-10-24 CODING AND DECODING IMAGE DATA

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2023148233A Division JP2023166555A (ja) 2017-10-27 2023-09-13 画像データ符号化及び復号化

Publications (2)

Publication Number Publication Date
JP2021500818A true JP2021500818A (ja) 2021-01-07
JPWO2019081927A5 JPWO2019081927A5 (ja) 2023-02-22

Family

ID=60580162

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2020523332A Pending JP2021500818A (ja) 2017-10-27 2018-10-24 画像データ符号化及び復号化
JP2023148233A Pending JP2023166555A (ja) 2017-10-27 2023-09-13 画像データ符号化及び復号化

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2023148233A Pending JP2023166555A (ja) 2017-10-27 2023-09-13 画像データ符号化及び復号化

Country Status (11)

Country Link
US (7) US10728556B2 (ja)
EP (1) EP3701723A1 (ja)
JP (2) JP2021500818A (ja)
CN (1) CN111279704B (ja)
AU (1) AU2018357062B2 (ja)
BR (1) BR112020007835A2 (ja)
CA (1) CA3080084A1 (ja)
GB (3) GB2567861A (ja)
MX (1) MX2020003873A (ja)
RU (1) RU2020113977A (ja)
WO (2) WO2019081929A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112672161A (zh) 2018-06-27 2021-04-16 株式会社Kt 用于处理视频信号的方法和设备
GB2577336A (en) 2018-09-24 2020-03-25 Sony Corp Image data encoding and decoding
US11509919B2 (en) * 2018-10-17 2022-11-22 Tencent America Reference sample memory size restrictions for intra block copy
JP7481332B2 (ja) * 2018-12-25 2024-05-10 オッポ広東移動通信有限公司 デコードのための予測方法及びその装置、並びにコンピュータ記憶媒体

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012191295A (ja) * 2011-03-09 2012-10-04 Canon Inc 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
US20170272757A1 (en) * 2016-03-18 2017-09-21 Mediatek Inc. Method and apparatus of video coding

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030202590A1 (en) * 2002-04-30 2003-10-30 Qunshan Gu Video encoding using direct mode predicted frames
US7440500B2 (en) * 2003-07-15 2008-10-21 Lsi Logic Corporation Supporting motion vectors outside picture boundaries in motion estimation process
JP5686499B2 (ja) * 2009-01-22 2015-03-18 株式会社Nttドコモ 画像予測符号化装置、方法及びプログラム、画像予測復号装置、方法及びプログラム、並びに、符号化・復号システム及び方法
US20120236936A1 (en) * 2011-03-14 2012-09-20 Segall Christopher A Video coding based on edge determination
KR101383775B1 (ko) 2011-05-20 2014-04-14 주식회사 케이티 화면 내 예측 방법 및 장치
US9077578B1 (en) * 2011-06-06 2015-07-07 Vuemix, Inc. Scalable real-time video compositing systems and methods
KR20130049525A (ko) 2011-11-04 2013-05-14 오수미 잔차 블록 복원을 위한 역변환 방법
US9237344B2 (en) 2012-03-22 2016-01-12 Qualcomm Incorporated Deriving context for last position coding for video coding
US9247251B1 (en) * 2013-07-26 2016-01-26 Google Inc. Right-edge extension for quad-tree intra-prediction
GB2521828A (en) * 2013-12-23 2015-07-08 Sony Corp Data encoding and decoding
CA2964642A1 (en) 2014-10-31 2016-05-06 Mediatek Inc. Method of improved directional intra prediction for video coding
WO2016119048A1 (en) * 2015-01-29 2016-08-04 École De Technologie Supérieure Method and apparatus for video intermodal transcoding
EP3306935A4 (en) * 2015-06-05 2019-01-02 Intellectual Discovery Co., Ltd. Image encoding and decoding method and image decoding device
KR102124714B1 (ko) * 2015-09-03 2020-06-19 미디어텍 인크. 비디오 코딩에서의 신경망 기반 프로세싱의 방법 및 장치
EP3148190A1 (en) * 2015-09-25 2017-03-29 Thomson Licensing Method and apparatus for intra prediction in video encoding and decoding
KR20180075660A (ko) * 2015-11-24 2018-07-04 삼성전자주식회사 비디오 복호화 방법 및 그 장치 및 비디오 부호화 방법 및 그 장치
US10742974B2 (en) * 2015-12-17 2020-08-11 Samsung Electronics Co., Ltd. Method for encoding/decoding image and device thereof
ES2711189R1 (es) 2016-04-06 2020-02-04 Kt Corp Metodo y aparato para procesar senales de video
EP3453180A4 (en) * 2016-05-04 2020-04-01 Microsoft Technology Licensing, LLC INTRA-IMAGE PREDICTION USING NON-ADJACENT REFERENCE LINES OF SAMPLE VALUES
US10523949B2 (en) * 2016-05-25 2019-12-31 Arris Enterprises Llc Weighted angular prediction for intra coding
US10230961B2 (en) * 2016-06-03 2019-03-12 Mediatek Inc. Method and apparatus for template-based intra prediction in image and video coding
CN113873239A (zh) * 2016-06-24 2021-12-31 株式会社Kt 用于处理视频信号的方法和设备
CN116527888A (zh) * 2016-08-01 2023-08-01 韩国电子通信研究院 图像编码/解码方法和设备以及存储比特流的记录介质
CN116915985A (zh) * 2016-10-04 2023-10-20 Lx 半导体科技有限公司 图像编码/解码方法和发送方法
US10798404B2 (en) 2016-10-05 2020-10-06 Qualcomm Incorporated Systems and methods of performing improved local illumination compensation
CN116684620A (zh) * 2017-11-28 2023-09-01 Lx 半导体科技有限公司 图像编码/解码方法、图像数据的传输方法和存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012191295A (ja) * 2011-03-09 2012-10-04 Canon Inc 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
US20170272757A1 (en) * 2016-03-18 2017-09-21 Mediatek Inc. Method and apparatus of video coding

Also Published As

Publication number Publication date
AU2018357062B2 (en) 2023-02-23
GB2567918A (en) 2019-05-01
GB2567861A (en) 2019-05-01
US11159803B2 (en) 2021-10-26
WO2019081927A1 (en) 2019-05-02
US20200252606A1 (en) 2020-08-06
US20210360261A1 (en) 2021-11-18
GB2567913A (en) 2019-05-01
CN111279704B (zh) 2023-06-30
US20230083246A1 (en) 2023-03-16
GB201809024D0 (en) 2018-07-18
RU2020113977A3 (ja) 2022-02-15
US11330275B2 (en) 2022-05-10
BR112020007835A2 (pt) 2020-10-13
US20200267410A1 (en) 2020-08-20
MX2020003873A (es) 2020-08-13
EP3701723A1 (en) 2020-09-02
RU2020113977A (ru) 2021-10-20
CN111279704A (zh) 2020-06-12
WO2019081929A1 (en) 2019-05-02
JP2023166555A (ja) 2023-11-21
GB201717684D0 (en) 2017-12-13
AU2018357062A1 (en) 2020-04-02
GB201812556D0 (en) 2018-09-12
US11949882B2 (en) 2024-04-02
US20230171413A1 (en) 2023-06-01
CA3080084A1 (en) 2019-05-02
US20190132596A1 (en) 2019-05-02
US11523121B2 (en) 2022-12-06
US20200344484A1 (en) 2020-10-29
US10728556B2 (en) 2020-07-28

Similar Documents

Publication Publication Date Title
JP6050478B2 (ja) データ符号化及び復号化
KR102187246B1 (ko) 영상 정보 부호화 방법 및 복호화 방법
TW201817236A (zh) 用於視頻寫碼之線性模型色度內預測
KR20170108367A (ko) 인트라 예측 기반의 비디오 신호 처리 방법 및 장치
US11290709B2 (en) Image data encoding and decoding
JP2021500818A (ja) 画像データ符号化及び復号化
JP7047777B2 (ja) 画像データ符号化及び復号化
KR20200139116A (ko) 영상 정보 부호화 방법 및 복호화 방법
CN111164975B (zh) 图像数据编码和解码
GB2564150A (en) Image data encoding and decoding
GB2567859A (en) Image data encoding and decoding
GB2567863A (en) Image data encoding and decoding
US20200413039A1 (en) Image data encoding and decoding apparatus and method
GB2567862A (en) Image data encoding and decoding

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210728

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20210728

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220630

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220705

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220902

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230213

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20230213

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230613