JP2021517423A - 双方向イントラ予測のシグナリング - Google Patents

双方向イントラ予測のシグナリング Download PDF

Info

Publication number
JP2021517423A
JP2021517423A JP2020552404A JP2020552404A JP2021517423A JP 2021517423 A JP2021517423 A JP 2021517423A JP 2020552404 A JP2020552404 A JP 2020552404A JP 2020552404 A JP2020552404 A JP 2020552404A JP 2021517423 A JP2021517423 A JP 2021517423A
Authority
JP
Japan
Prior art keywords
bip
flag
prediction
signaled
intra
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020552404A
Other languages
English (en)
Other versions
JP7086208B2 (ja
Inventor
アレクセイ・コンスタンチノヴィチ・フィリポフ
ヴァシリー・アレクセーヴィチ・ルフィトスキー
Original Assignee
ホアウェイ・テクノロジーズ・カンパニー・リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ホアウェイ・テクノロジーズ・カンパニー・リミテッド filed Critical ホアウェイ・テクノロジーズ・カンパニー・リミテッド
Publication of JP2021517423A publication Critical patent/JP2021517423A/ja
Application granted granted Critical
Publication of JP7086208B2 publication Critical patent/JP7086208B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

ビデオ符号化のためのデバイスおよび方法が説明されている。1つの方法は、ビットストリームを受信することを含み、ビットストリームは予測関連情報を含み、予測関連情報は、利用可能な1次参照サンプルの数および位置、イントラ予測モードインデックスまたは現在の符号化ブロックのサイズのうちの少なくとも1つを含み、双方向イントラ予測(BIP)フラグがビットストリームにおいてシグナリングされるかどうかを予測関連情報に基づいて決定すること、および画像を再構築することを含む。提案された技術は、オーバーヘッドを節減するかまたはエントロピー符号化もしくは復号の効率を向上させる。

Description

本発明は、ビデオ符号化の分野に関する。より詳細には、本発明は、双方向イントラ予測モードシグナリング機構、ならびにビデオエンコーダおよびビデオデコーダのための方法に関する。
デジタルビデオ通信および記憶アプリケーションは、例えばデジタルカメラ、セルラー無線電話、ラップトップ、放送システム、テレビ会議システムなど、幅広いデジタル機器によって実施される。これらのアプリケーションの最も重要で困難なタスクの1つは、ビデオ圧縮である。ビデオ圧縮のタスクは複雑であり、圧縮効率および計算の複雑性という2つの相反するパラメータによって制約される。ITU−T H.264/高度ビデオ符号化方式(Advanced Video Coding、AVC)またはITU−T H.265/高効率ビデオ符号化方式(High Efficiency Video Coding、HEVC)などのビデオ符号化規格は、これらのパラメータ間の適切な交換をもたらす。
次世代ビデオ符号化方式(Next Generation Video Coding、NGVC)は、最新のビデオ圧縮規格であり、ISO/IECのムービング・ピクチャー・エキスパーツ・グループ(Moving Picture Experts Group、MPEG)およびITU−Tのビデオ・コーディング・エキスパーツ(Video Coding Experts、VCEG)によって結成された共同ビデオ符号化研究部会(Joint Collaborative Team on Video Coding、JCT−VC)によって開発されている。NGVCは、従来のH.265/HEVC(高効率ビデオ符号化方式)規格に対応して開発されている。従来のビデオ符号化規格と同様に、NGVCは、イントラ/インター予測、変換、量子化、ループ内フィルタリングおよびエントロピー符号化などの基本的な機能モジュールを含む。
NGVCを含む符号化規格は、ソース画像をビデオ符号化ブロック、例えば符号化単位(CU)などに分割することに基づいている。各CUを、さらに小さなCUまたは予測単位(PU)に分割することができる。これらのブロックの処理は、サイズ、空間位置、およびエンコーダによって特定された符号化モードに依存する。符号化モードは、予測の種類に応じて、イントラ予測モードおよびインター予測モードの2つの群に分類することができる。イントラ予測モードは、参照サンプルを生成して、再構築されるブロックのピクセルの予測値を計算するために、同じ画像(フレームもしくはイメージとも呼ばれる)のピクセルを使用する。イントラ予測は、空間予測とも呼ばれる。インター予測モードは時間的予測のために設計されており、現在の画像のブロックのピクセルを予測するために前後の画像の参照サンプルを使用する。予測段階の後、元の信号とその予測との差分である予測エラーに対して変換符号化が行われる。
現在のCUもしくはPUに対して予測モードの1つが選択されている場合、予測値は、現在のCUもしくはPUを囲む符号化済のピクセルを使用した外挿によって生成される。双方向予測方法の場合、予測値は、各サブブロックで2種類のイントラ予測モードと組み合わせて生成される。双方向イントラ予測モードのセットは、高ビットレートを必要とする最先端技術において導入されている。
本発明の目的は、ビデオ符号化のための改善されたデバイスおよび方法を提供することであり、双方向イントラ予測モードのセットを導入することによって引き起こされる高ビットレートを低減することを可能にする。
本発明の実施形態は、特許請求の範囲および以下の説明に記載されている。
保護の範囲は請求項によって定義される。
本発明のさらなる実施例を、以下の図面に関連して説明する。
ビデオの符号化および復号システム100の一例を示す概略図である。 ビデオエンコーダ200の一例を示す概略図である。 ビデオデコーダ300の一例を示す概略図である。 提案された67個のイントラ予測モードを示す概略図である。 固定長ブロック符号化順序(BCO)の一例を示す図である。 可変長ブロック符号化順序(FBCO)の一例を示す図である。 一般化されたDWDIPを示す概略図である。 1次参照サンプルと構築された予測子の精度との関係を示す図である。 1次参照サンプルと構築された予測子の精度との関係を示す図である。 1次対1次伝搬率と、シグナリングされているBIPの有無との関係を示している。 BIPが無効である場合の例示的なシナリオを示す図である。 BIPがデフォルトで適用される場合の例示的なシナリオを示す図である。 イントラ予測モードの例を示す概略図である。 BIPがデフォルトで適用される場合の別のシナリオ例を示す図である。 BIPフラグのコンテキスト選択処理の一例を示す概略図である。 隣接するピクセルの左側および右側が利用可能である場合のイントラ予測モードの範囲を示す概略図である。 隣接するピクセルの左側および上側が利用可能である場合のイントラ予測モードの範囲を示す概略図である。 BIPがコンテキスト選択処理で使用される例示的なシナリオを示す図である。 ビットストリームを符号化する方法の一例を示すフローチャートである。 ビットストリームを符号化する方法の一例を示すフローチャートである。 符号化ビットストリームを復号する方法の一例を示すフローチャートである。 符号化ビットストリームを復号する方法の一例を示すフローチャートである。 様々な実施形態を実施するために使用することができるネットワーク要素のブロック図である。
様々な図において、同一の参照記号が同一もしくは少なくとも機能的に同等の特徴に使用される。
以下の説明では添付の図面を参照するが、この図面は開示の一部をなし、この図面内には本発明を位置付けてもよい特定の態様が例示として示されている。
例えば、記載の方法に関連する開示は、その方法を実行するように構成された対応するデバイスまたはシステムにも当てはまり、その逆も同様であることが理解される。例えば、特定の方法ステップを説明する場合、対応するデバイスは、明確に記載または図示されていない場合であっても記載の方法ステップを実行するためのユニットを含むことができる。さらに、特に断りのない限り、本明細書に記載の様々な例示的な態様の特徴を互いに組み合わせてもよいことが理解される。
双方向イントラ予測(BIP)フラグをビットストリームに追加することによるシグナリングのオーバーヘッドなど、双方向イントラ予測モードのセットを導入することに起因する高ビットレートを低減するために、以下の3つの技術、つまり、
−双方向イントラ予測モードはシグナリングされず、かつ使用されないこと、
−双方向イントラ予測モードはシグナリングされず、かつ従来の方向性イントラ予測モードの代わりにデフォルトで使用されること、または
−双方向イントラ予測モードは、コンテキスト適応型二値算術符号化方式(Context−Adaptive Binary Arithmetic Coding、CABAC)のコンテキストを使用してシグナリングされること
のうちのいずれか1つが実施されてもよい。
これらの技術は、様々な例を参照して以下でさらに説明される。
以下に説明するように、BIPフラグをビットストリームに追加すべきかどうか、またはどのCABACのコンテキストを選択すべきかを決定するために、以下の要因、つまり、
−利用可能な1次参照サンプルの数および位置、
−イントラ予測モードインデックス、
−予測されるブロックのアスペクト比、および/または
−予測されるブロックのサイズ
が考慮されてもよい。
図1は、イントラ予測モードでブロックを符号化しかつ復号するための技術を含む、本開示に記載の技術を利用してもよい例示的なビデオの符号化および復号システム100を示すブロック図である。図1に示すように、システム100は、宛先デバイス104によって後で復号される符号化ビデオデータを生成するソースデバイス102を含む。図2に示すビデオエンコーダ200は、ソースデバイス102の一例である。図3に示すビデオデコーダ300は、宛先デバイス104の一例である。ソースデバイス102および宛先デバイス104は、デスクトップコンピュータ、ノートブック(すなわち、ラップトップ)コンピュータ、タブレットコンピュータ、セットトップボックス、いわゆる「スマート」フォンなどの電話ハンドセット、いわゆる「スマート」パッド、テレビ、カメラ、表示デバイス、デジタルメメディアプレーヤ、ビデオゲームコンソール、ビデオストリーミングデバイスなどを含む幅広いデバイスを含んでもよい。いくつかの場合、ソースデバイス102および宛先デバイス104は、無線通信のために装備されてもよい。
宛先デバイス104は、リンク112を介して復号される符号化ビデオデータを受信してもよい。リンク112は、符号化ビデオデータをソースデバイス102から宛先デバイス104に移動することが可能な任意の種類の媒体もしくはデバイスを含んでもよい。一例では、リンク112は、ソースデバイス102が符号化ビデオデータを宛先デバイス104にリアルタイムで直接送信することを可能にする通信媒体を含んでもよい。符号化ビデオデータは、無線通信プロトコルなどの通信規格に従って変調され、かつ宛先デバイス104に送信されてもよい。通信媒体は、無線周波数(RF)スペクトルまたは1つ以上の物理伝送路などの任意の無線もしくは有線の通信媒体を含んでもよい。通信媒体は、ローカルエリアネットワーク、広域ネットワーク、またはインターネットなどのグローバルネットワークなどのパケットベースのネットワークの一部を形成してもよい。通信媒体は、ルータ、スイッチ、基地局、またはソースデバイス102から宛先デバイス104への通信を容易にするのに有用であり得る他の任意のデバイスを含んでもよい。
あるいは、符号化データは、出力インタフェース110から記憶装置(図1には示されていない)に出力されてもよい。同様に、符号化データは、入力インタフェース114によって記憶装置からアクセスされてもよい。宛先デバイス104は、ストリーミングもしくはダウンロードを介して、記憶装置から保存されたビデオデータにアクセスしてもよい。本開示の技術は、必ずしも無線のアプリケーションもしくは設定に限定されない。この技術は、地上波テレビ放送、ケーブルテレビ伝送、衛星テレビ伝送、例えばインターネットを介したストリーミングビデオ伝送、データ記憶媒体に保存するためのデジタルビデオの符号化、データ記憶媒体に保存されたデジタルビデオの復号、または他のアプリケーションなどの様々なマルチメディアアプリケーションのサポートにおいて、ビデオ符号化に適用されてもよい。いくつかの例では、システム100は、ビデオストリーミング、ビデオ再生、ビデオ放送および/またはテレビ電話などのアプリケーションをサポートするために、片方向もしくは双方向のビデオ伝送をサポートするように構成されてもよい。
図1の例では、ソースデバイス102は、ビデオソース106と、ビデオエンコーダ108と、出力インタフェース110とを含む。いくつかの場合、出力インタフェース110は、変調器/復調器(モデム)および/または送信機を含んでもよい。ソースデバイス102では、ビデオソース106は、例えばビデオカメラなどのビデオキャプチャ装置、先に取り込まれたビデオを含むビデオアーカイブ、ビデオコンテンツプロバイダからビデオを受信するためのビデオフィードインタフェース、および/またはソースビデオとしてコンピュータグラフィックスデータを生成するためのコンピュータグラフィックスシステムなどのソース、またはこのようなソースの組合せを含んでもよい。一例として、ビデオソース106がビデオカメラである場合、ソースデバイス102および宛先デバイス104は、いわゆるカメラ付き携帯電話もしくはテレビ電話を形成してもよい。しかし、本開示に記載の技術は、一般にビデオ符号化に適用可能であってもよく、無線および/または有線のアプリケーションに適用されてもよい。
取り込まれたビデオ、事前に取り込まれたビデオまたはコンピュータで生成されたビデオは、ビデオエンコーダ108によって符号化されてもよい。符号化ビデオデータは、ソースデバイス102の出力インタフェース110を介して宛先デバイス104に直接送信されてもよい。符号化ビデオデータは、さらに(または代替的に)、復号および/または再生のために宛先デバイス104もしくは他のデバイスが後でアクセスできるように記憶装置に保存されてもよい。
宛先デバイス104は、入力インタフェース114と、ビデオデコーダ116と、表示デバイス118とを含む。いくつかの場合、入力インタフェース114は、受信機および/またはモデムを含んでもよい。宛先デバイス104の入力インタフェース114は、リンク112を介して符号化ビデオデータを受信する。リンク112を介して通信されるかまたは記憶装置上で提供される符号化ビデオデータは、ビデオデコーダ116などのビデオデコーダがビデオデータを復号する際に使用するために、ビデオエンコーダ108によって生成される様々な構文要素を含んでもよい。このような構文要素は、通信媒体上で送信されるか、記憶媒体に保存されるか、またはファイルサーバに保存される符号化ビデオデータに含まれてもよい。
表示デバイス118は、宛先デバイス104と統合されるかまたはその外部に存在してもよい。いくつかの例では、宛先デバイス104は、統合された表示デバイスを含んでもよく、また、外部表示デバイスと連動するように構成されてもよい。他の例では、宛先デバイス104は表示デバイスであってもよい。一般に、表示デバイス118は復号されたビデオデータをユーザに表示し、液晶ディスプレイ(LDC)、プラズマディスプレイ、有機発光ダイオード(OLED)ディスプレイ、または別の種類の表示デバイスなどの様々な表示デバイスのいずれかを含んでもよい。
ビデオエンコーダ108およびビデオデコーダ116は、MPEG−2、MPEG−4、ITU−T H.263、ITU−T H.264/MPEG−4 Part 10、高度ビデオ符号化方式(AVC)、高効率ビデオ符号化方式(HEVC)、ITU−T H.266/次世代ビデオ符号化方式(NGVC)規格を含むがこれらに限定されない全ての種類のビデオ圧縮規格に従って動作してもよい。
ソースデバイス102のビデオエンコーダ108は、これらの現在または将来の規格のいずれかに従ってビデオデータを符号化するように構成されてもよいことが一般的に企図されている。同様に、宛先デバイス104のビデオデコーダ116が、これらの現在または将来の規格のいずれかに従ってビデオデータを復号するように構成されてもよいこともまた、一般的に企図されている。
ビデオエンコーダ108およびビデオデコーダ116はそれぞれ、1つ以上のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、個別論理、ソフトウェア、ハードウェア、ファームウェアまたはそれらの任意の組合せなどの、様々な適切なエンコーダ回路のいずれかとして実装されてもよい。技術がソフトウェアにおいて部分的に実装される場合、デバイスは、ソフトウェアの命令を適切な非一時的コンピュータ可読媒体に記憶し、かつ、本開示の技術を行うために1つ以上のプロセッサを使用して、命令をハードウェアにおいて実行してもよい。ビデオエンコーダ108およびビデオデコーダ116のそれぞれは、1つ以上のエンコーダまたはデコーダに含まれてもよく、いずれか一方は、それぞれのデバイスにおいて組み合わされたエンコーダ/デコーダ(CODEC)の一部として統合されてもよい。
ビデオ符号化の規格では、ビデオシーケンスは一連の画像を一般的に含む。写真はまた、「フレーム」と呼ばれてもよい。ビデオエンコーダ108は、符号化された画像および関連するデータの表現を形成するビットのシーケンスを含むビットストリームを出力してもよい。ビデオデコーダ116は、ビデオエンコーダ108によって生成されたビットストリームを受信してもよい。さらに、ビデオデコーダ116は、ビットストリームから構文要素を取得するためにビットストリームを解析してもよい。ビデオデコーダ116は、ビットストリームから取得された構文要素に少なくとも部分的に基づいて、ビデオデータの画像を再構築してもよい。ビデオデータを再構築する処理は、一般に、ビデオエンコーダ108によって行われる処理と相反してもよい。
図2はビデオエンコーダ200の一例を示す概略図である。ビデオエンコーダ200は、ビデオストリームのフレームもしくは画像の入力ブロックを受信するための入力と、符号化ビデオビットストリームを生成するための出力とを備える。ビデオエンコーダ200は、予測、変換、量子化およびエントロピー符号化をビデオストリームに適用するように適合されている。変換、量子化およびエントロピー符号化は、符号化ビデオビットストリームを出力として生成するために、変換ユニット201、量子化ユニット202およびエントロピー符号化ユニット203によってそれぞれ実行される。
ビデオストリームは複数のフレームに対応し、各フレームは、イントラ符号化またはインター符号化された特定のサイズのブロックに分割される。例えばビデオストリームの第1のフレームのブロックは、イントラ予測ユニット209によってイントラ符号化される。イントラフレームは、同じフレーム内の情報のみを使用して符号化されるので、独立して復号することができ、ランダムアクセスのためにビットストリーム内にエントリポイントを提供することができる。ビデオストリームの他のフレームのブロックは、インター予測ユニット210によってインター符号化され、参照フレームと呼ばれる符号化されたフレームからの情報は時間的冗長性を低減するために使用され、これにより、インター符号化されたフレームの各ブロックが参照フレーム内の同じサイズのブロックから予測される。モード選択ユニット208は、フレームのブロックがイントラ予測ユニット209またはインター予測ユニット210のどちらによって処理されるかを選択するように適合される。
インター予測を行うために、符号化された参照フレームは、逆量子化ユニット204、逆変換ユニット205、フィルタリングユニット206(任意)によって処理されて、フレームバッファ207に格納される参照フレームを取得する。特に、再構築された参照ブロックを取得するために、参照フレームの参照ブロックをこれらのユニットによって処理することができる。次いで、再構築された参照ブロックは参照フレームに再結合される。
インター予測ユニット210は、インター符号化される現在のフレームもしくは画像と、フレームバッファ207からの1つ以上の参照フレームもしくは参照画像とを入力として備える。動き推定および動き補償は、インター予測ユニット210によって適用される。動き推定は、特定のコスト関数に基づいて動きベクトルおよび参照フレームを取得するために使用される。次いで、動き補償は、参照フレームの参照ブロックの現在のフレームへの変換の観点から、現在のフレームの現在のブロックを記述する。インター予測ユニット210は現在のブロックに対する予測ブロックを出力し、前記予測ブロックは、符号化される現在のブロックとその予測ブロックとの間の差分を最小化し、すなわち、残差ブロックを最小化する。残差ブロックの最小化は、例えばレート歪み最適化手順に基づいている。
次いで、現在のブロックとその予測との差分、すなわち残差ブロックは変換ユニット201によって変換される。変換係数は、量子化ユニット202およびエントロピー符号化ユニット203によって量子化され、かつエントロピー符号化される。このように生成された符号化ビデオビットストリームは、イントラ符号化されたブロックおよびインター符号化されたブロックを含む。
図3はビデオデコーダ300の一例を示す概略図である。
ビデオデコーダ300は、フレームバッファ307とインター予測ユニット310とを特に備える。フレームバッファ307は、符号化ビデオビットストリームから取得された少なくとも1つの参照フレームを格納するように適合されている。インター予測ユニット310は、現在のフレームの現在のブロックの予測ブロックを参照フレームの参照ブロックから生成するように適合されている。
デコーダ300は、ビデオエンコーダ200によって生成された符号化ビデオビットストリームを復号するように適合され、デコーダ300およびコーダ200の両方は同一の予測を生成する。フレームバッファ307、インター予測ユニット310の特徴は、図2のフレームバッファ207、インター予測ユニット210の特徴と同様である。
特に、ビデオデコーダ300は、例えば、ビデオエンコーダ200の逆量子化ユニット204、逆変換ユニット205、フィルタリングユニット206およびイントラ予測ユニット209にそれぞれ対応する、逆量子化ユニット304、逆変換ユニット305、フィルタリングユニット306(任意)およびイントラ予測ユニット309などの、ビデオエンコーダ200にも存在するユニットを備える。エントロピー復号ユニット303は、受信した符号化ビデオビットストリームを復号し、かつそれに対応して量子化された残差変換係数を取得するように適合されている。量子化された残差変換係数は、残差ブロックを生成するために逆量子化ユニット304および逆変換ユニット305に供給される。残差ブロックは予測ブロックに追加され、追加されたものは、復号されたビデオを取得するためにフィルタリングユニット306に供給される。復号されたビデオのフレームはフレームバッファ307に格納され、インター予測のための参照フレームとして機能することができる。
HEVC/H.265規格によれば、35個のイントラ予測モードが利用可能である。図4に示すように、このセットは、平面モード(イントラ予測モードインデックスは0)、DCモード(イントラ予測モードインデックスは1)、および180°の範囲をカバーし、かつ図4の黒い矢印で示されるイントラ予測モードのインデックス値の範囲が2〜34である方向性(角度)モードというモードを含む。加工していないビデオに存在する任意のエッジ方向を取り込むために、HEVCにおいて使用されているように、方向性イントラモードの数は33から65にまで及ぶ。追加の方向性モードは図4において点線の矢印で示され、平面モードおよびDCモードは同じままである。注目すべきは、イントラ予測モードによってカバーされる範囲が180°より広くなり得ることである。特に、インデックス値が3〜64である62個の方向性モードは、約230°の範囲をカバーし、すなわち、いくつかの対のモードは反対の方向性を有する。HEVC参照モデル(HM)およびJEMプラットフォームの場合、図4に示すように、一対の角度モード(つまり、モード2およびモード66)のみが反対の方向性を有する。予測子を構築するために、従来の角度モードは参照サンプルを取得し、かつ(必要に応じて)参照サンプルをフィルタリングしてピクセル予測子を取得する。予測子の構築に必要な参照サンプルの数は、内挿に使用されるフィルタの長さに依存する(例えば、バイリニアフィルタおよびキュービックフィルタの長さはそれぞれ2および4である)。
イントラ予測の段階で使用される参照サンプルの可用性を利用するために、図5Bの例によって概略的に示されるように、さらなる可変長ブロック符号化順序(BCO)が導入される。図5Aに示すような固定長ブロック符号化順序(BCO)の例と比較すると、図5Bに示すような可変長ブロック符号化順序(FBCO)は、非固定長ブロック符号化順序を可能にするブロック符号化順序構造である。FBCOは、分割単位符号化順序(Split Unit Coding Order、SUCO)、任意ブロック符号化順序(Arbitrary Block Coding Order、ABCO)などの異なる構造を含む。例えば、FBCOは図9、図12および図15において使用することができる。FBCOでは、上側および左側(LR_10)の参照サンプルだけでなく、例えば上側および右側(LR_01)、および3つ(上、左、右)の側もイントラ予測に利用可能である。しかし、いくつかの場合、画像境界に位置しないブロックであっても、固定BCOによってフレームワークを分割することが不可能な片側(つまり、上側)のみ利用可能である。
双方向イントラ予測(BIP)は、各ブロック内の2種類のイントラ予測モードと組み合わせて予測値を生成することによって、方向予測子を構築する構造である。距離加重方向イントラ予測(DWDIP)は、BIPの特定の実施態様である。DWDIPによる予測子の生成は2つのステップ、つまり、
a)2次参照サンプルが生成される初期化、および
b)距離加重機構を使用した予測子の生成
を含む。
1次参照サンプルおよび2次参照サンプルの両方をb)のステップで使用することができる。
予測子内のサンプルは、選択された予測方向によって定義され、かつ図6に示すように反対側に配置された参照サンプルの加重和として計算される。ブロックの予測は、まだ再構築されておらず、かつ予測される予定のブロックの側に位置する2次参照サンプル、すなわち未知のピクセルを生成するステップを含んでもよい。これらの2次参照サンプルの値は、画像の先に再構成された部分のピクセル、すなわち既知のピクセルから取得される1次参照サンプルから導出される。これは、1次参照サンプル602が隣接するブロックから取得されることを意味する。2次参照サンプル604は1次参照サンプル602を使用して生成される。図6では、1次参照ピクセル/サンプル602は点を含む正方形によって識別され、2次参照ピクセル/サンプル604は格子を含む正方形によって識別される。ピクセル/サンプル606は、距離加重機構を使用して予測される。
BIPベースのモードのフラグは常に従来の方法でシグナリングされるため、ビットストリームにおけるシグナリングのオーバーヘッドの原因となる。
2次参照サンプルは一般的に、1次参照サンプルほどソースピクセルに近似していないので、図7Aおよび図7Bに示すように、ブロック内のより多くのピクセルが1次参照サンプルのみを使用して予測されるほど、構築された予測子が元のブロックに近似する可能性が高くなる。図7Aおよび図7Bは、1次参照サンプルと構築された予測子の精度との関係を概略的に示している。これを考慮して、BIPをシグナリングするために選択すべきコンテキストを決定するために、ブロック内のピクセルの総数に対する1次対1次予測を使用して生成されたピクセルの数の比率が使用される。1次対1次伝搬率は、ブロック内のピクセルの総数に対する2つの1次参照から予測されるピクセル数の比率である。図8に示すように、1次対1次伝搬率が第1の閾値を下回る場合、BIPは無効となり、対応するフラグはシグナリングされない。1次対1次伝搬率が第2の閾値を超える場合、BIPはデフォルトで使用され、対応するフラグはシグナリングされない。1次対1次伝搬率が第1の閾値と第2の閾値との間である場合、BIPはCABACコンテキストを使用してシグナリングされる。詳細について、様々なシナリオが以下に説明される。
BIPは無効であり、対応するフラグはシグナリングされない
モードIIPMを使用してイントラ予測される幅wおよび高さhのブロックの場合、BIPは無効であり、次の条件、つまり、
−隣接するピクセルの上側が利用不可能である
−隣接するピクセルの左側および右側が利用不可能である
−w=最小サイズであり、h=最小サイズであり、例えば最小サイズは4である
・w>第1の最大閾値であり、例えば第1の最大閾値は32である
・h>第2の最大閾値であり、例えば第2の最大閾値は32である
−左側または右側のみが利用可能であり、次のいずれかが真である
・w=最小サイズであり、イントラ予測モードの数が水平方向のイントラ予測モードの数とは第3の閾値以下だけ異なるか、または
・h=最小サイズであり、イントラ予測モードの数が垂直方向のイントラ予測モードの数とは第4の閾値以下だけ異なる
という条件のいずれかが真である場合、対応するフラグはシグナリングされない。第3の閾値は、第4の閾値と同じあっても異なってもよい。例えば、第3の閾値は第4の閾値と同じであり、5であってもよい。
−隣接するピクセルの左側および右側が利用可能であり、
・IIPM=47(イントラ予測方向は水平)であるか、または
・IIPMは範囲開始値未満であるか、もしくはIIPMは範囲終了値を超える。開始値および終了値は、所与のブロックのアスペクト比、すなわち、log2(w)−log2(h)に対して表1に明記されている。
−IIPM>2(イントラ予測は角度あり)
隣接するピクセルの上側は、現在の符号化ブロックの上側にある1次参照サンプルを意味する。同様に、隣接するピクセルの左側は、現在の符号化ブロックの左側にある1次参照サンプルを意味する。隣接するピクセルの右側は、現在の符号化ブロックの右側にある1次参照サンプルを意味する。
Figure 2021517423
図9は、上側の参照サンプル行のみがイントラ予測に利用可能(LR_00)であり、かつ隣接するピクセルの左側および右側が利用不可能であるためにBIPが無効であるシナリオの一例を示している。
BIPはデフォルトで使用され、対応するフラグはシグナリングされない
BIPはデフォルトで従来のイントラ予測に取って代わり、追加の参照ピクセルが利用可能であり、かつイントラ予測モードが特定のサブ範囲に属している場合、対応するフラグはシグナリングされない。
例えば図10に示すように、範囲は、ブロックのアスペクト比に応じて、水平(HOR)イントラ予測モード番号(47)および表2に明記された最終イントラ予測モード番号によって特定される。
Figure 2021517423
表2に記載されているように、IIPM_TLは、左上のブロックについて選択されたモードIIPMを使用してイントラ予測されたものを表す。IIPM_LLは、左下のブロックについて選択されたモードIIPMを使用してイントラ予測されたものを表す。
水平イントラ予測に位置合せされた範囲に加えて、左下側が利用可能な場合に追加の範囲が特定される(図10の右端の部分を参照)。この場合の範囲は、第1の利用可能な角度イントラ予測モード(#3)および表3の対応する値によって定義される。
Figure 2021517423
表3に記載されているように、IIPM_TRは、右上のブロックについて選択されたモードIIPMを使用して予測されたものを表す。
上述の場合に加えて、BIPは従来のイントラ予測に取って代わり、対応するフラグは、
−左下側および右上側が利用可能であり、かつイントラ予測モードが、表3に明記されたものまたは表2に明記されたものと等しい場合、
−右下側および左上側が利用可能であり、かつイントラ予測モードが表2に明記されたものと等しい場合
など、このような場合にシグナリングされない。
表2および表3に記載されたイントラ予測モード番号は図11に示されている。図11では、IIPM_LAは、最後に利用可能なイントラ予測方向に対するイントラ予測モードIIPMを表し、IIPM_FAは、最初に利用可能なイントラ予測方向に対するイントラ予測モードIIPMを表す。イントラ予測モード番号は、IIPM_FAからIIPM_LAまで昇順で配置されている。水平(HOR)および垂直(VER)の方向モード(それぞれIIPM_HORおよびIIPM_VER)は、ブロックのアスペクト比RAに依存しない。図11に示す残りのイントラ予測モード番号は、表2および表3に提供されたRAと依存関係にある。
図12は、隣接するピクセルの上側だけでなく左側および右側(3つの側面)も使用できるためBIPがデフォルトで使用される場合のシナリオの一例を示している。
BIPは、CABACコンテキスト(または確率モデル)を使用してシグナリングされる
「BIPが無効であり、かつ対応するフラグがシグナリングされない」段落、および「BIPがデフォルトで使用され、かつ対応するフラグがシグナリングされない」段落で説明されている手順のいずれもが有効でない場合、コンテキスト選択処理がBIPフラグに対して行われる。例示的なコンテキスト選択手順のフローチャートは、図13に提供されている。この処理の入力は、フローチャートの最初のステップ(ブロック1302)で行われる。この入力は、
・ブロックに対して選択されたイントラ予測モード(IIPM)、
・ブロック幅(w)および高さ(h)、
・隣接するピクセルSの利用可能側のセット、つまり、左(sL)、右(sR)、上(sT)、左下(sLL)、右下(sLR)および右上(sTR
を含む。
例えば低信頼性予測(CTXLRと表記)、中間信頼性予測(CTXMRと表記)および高信頼性予測(CTXHRと表記)の場合など、様々なコンテキストを確率モデルに対して特定することができる。デフォルトのコンテキストは、中程度の信頼性のあるコンテキストである。予測の信頼性は、BIPフラグが0に等しい確率に影響し、IIPMが上記の最終モードのうちの1つに対する近似程度によって推定することができる。これらのモードは、次のステップ(ブロック1304)で計算されるブロックのアスペクト比に従って決定される。例えば、RA=log2(w)−log2(h)である。アスペクト比は、ブロックが水平に整列している場合(すなわち、幅が高さよりも大きい場合)は正の値で表され、ブロックが垂直に整列している場合は負の値で表される。次のステップ(ブロック1306)は、表2および表3に明記されるような最終モードを選択するためのものである。例えば、{IIPM_LL、IIPM_TL、IIPM_TR}=LUT(RA)である。
コンテキスト選択に関する次の決定は、
・左側および右側が利用可能であるかどうか、
・左側が利用可能であるかどうか、および/または、
・残りの場合
に依存する。
参照サンプル側(S)の可用性に応じて様々な範囲が定義され、コンテキストは、IIPMがこの範囲に属するかどうかに基づいて選択される。
左側および右側がブロック1308で利用可能、つまり{sL、sR}⊇Sである場合、上側が利用不可能であり、かつIIPMが図14A(ブロック1310)に示す範囲に属するとき、ブロック1328で、CTXLRが選択される。ブロック1310では、上側が利用不可能であるかどうか、およびIIPMが図14Aに示す範囲に属するかどうか、例えば、
Figure 2021517423
および
(IIPM_TR<IIPM<IIPM_LTまたはIIPM_LL<IIPM<IIPM_LA
であるかどうかが決定される。
左側および右側がブロック1308で利用可能、つまり{sL、sR}⊇Sである場合、上側が利用可能であるか、またはIIPMが図14A(ブロック1310)に示す範囲に属していないとき、ブロック1326で、CTXMRが選択される。
左側および上側が利用可能である場合、CTXHRは、右側が利用不可能であり、かつIIPMが図14Bに示す範囲に属する場合に選択される。図14Aおよび図14Bにおいて。残りの場合については、追加の計算がブロック1312で行われてもよく、具体的には、
IIPMが水平方向と垂直方向との間にあるかどうか(条件C)、および
最終イントラ予測モードとの閾値の差分(ΔIPM)が計算され、
ここで、C=IIPM_VER≦IIPM≦IIPM_HOR
ΔIPM=min(IIPM_VER−IIPM_TR、IIPM_LL−IIPM_HOR)/2
である。
コンテキスト選択処理の残りの部分は図13に示され、これにより、予測信頼性の推定に応じて、上記で特定したコンテキストのうちの1つが選択される。左側が利用可能であり、かつ右側がブロック1314で利用不可能である場合、ブロック1318で、Cが真であるか、または
Figure 2021517423
であるかが決定される。Cが真であるかまたは
Figure 2021517423
である場合、ブロック1326で、CTXMRが選択される。Cが偽であり、かつ{sLL、sTR}⊇Sの場合、ブロック1322で、
max(IIPM_TR−ΔIPM、IIPM_FA)≦IIPM≦IIPM_TR+ΔIPMであるか、または
IIPM_LL−ΔIPM≦IIPM≦min(IIPM_LL+ΔIPM、IIPM_LA)であるかが決定される。ブロック1322で「yes」の場合、ブロック1326でCTXMRが選択され、「no」の場合、ブロック1324でCTXHRが選択される。
左側が利用不可能であるか、または右側がブロック1314で利用可能である場合、ブロック1316で、Cが偽であるか、または
Figure 2021517423
であるかが決定される。Cが偽であるかまたは
Figure 2021517423
である場合、ブロック1326で、CTXMRが選択される。Cが真であり、かつ{sLR、sTL}⊇Sである場合、ブロック1320で、
IIPM_TL−ΔIPM≦IIPM≦IIPM_TL+ΔIPMであるかどうかが決定される。ブロック1320で「yes」の場合、ブロック1324でCTXHRが選択され、「no」の場合、ブロック1326でCTXMRが選択される。
3つより少ないかまたは多いコンテキストが存在してもよい。一般に、コンテキストは
−最も近似する最終イントラ予測モード、
−IIPMとその最終イントラ予測モードの数との差分
などの関数として定義することができる。
したがって、例えば複数の閾値の差分値ΔIPMが導入された場合、最終的なイントラ予測ごとに1つ以上のコンテキストを提供することができる。
図15は、上側および左側(LR_10)の参照サンプルまたは上側および右側(LR_01)のいずれかがイントラ予測に利用可能である場合に、コンテキスト選択処理によってBIPが使用される際のシナリオの一例を示している。
例示的な符号化処理
図16は、ビットストリームを符号化(または圧縮)する方法の一例のフローチャートであり、この方法は、図1に示すようにソースデバイス102によって、または図2に示すようにビデオエンコーダ200によって行われてもよい。処理1600は、エンコーダの処理の一例である。本開示によって導入されたエンコーダ側の変更は、主に、レート歪み最適化(RDO)手順を使用したイントラ予測モードの選択に関連している。この手順は、以下のブロックを特に含んでもよい。
ブロック1602では、エンコーダは画像の現在の符号化ブロックのイントラ予測モード候補のリストを生成し、ここで、イントラ予測モード候補のリストは少なくとも1つのBIPモードを含む。
ブロック1604では、エンコーダは、BIPフラグがビットストリームにおいてシグナリングされるかどうかを予測関連情報に従って決定し、ここで、BIPフラグは現在の符号化ブロックに対して選択されたBIPモードを示す。予測関連情報は、
−利用可能な1次参照サンプルの数および位置、
−イントラ予測モードインデックス、
−予測されるブロックのアスペクト比、および/または
−予測されるブロックのサイズ
を含む。
BIPフラグがビットストリームにおいてシグナリングされるものかどうかを決定する例は前述されており、図1〜図15に示されている。
ブロック1606では、BIPフラグがビットストリームにおいてシグナリングされない場合、エンコーダはBIPフラグの値をビットストリームに符号化しない。2つの例については、「BIPが無効であり、かつ対応するフラグがシグナリングされない」段落、および「BIPがデフォルトで使用され、かつ対応するフラグがシグナリングされない」段落で前述している。
ブロック1608では、BIPフラグがビットストリームにおいてシグナリングされる場合、エンコーダは符号化のための確率モデルを予測関連情報から導出する。次いでブロック1610では、エンコーダは、確率モデルを使用してBIPフラグの値をビットストリームに符号化する。この例については、「BIPがCABACコンテキスト(または確率モデル)を使用してシグナリングされる」段落で前述している。
図17は、ビットストリームを符号化(または圧縮)する方法の一例の別のフローチャートであり、この方法は、図1に示すようにソースデバイス102によって、または図2に示すようにビデオエンコーダ200によって行われてもよい。プロセス1700は、エンコーダの処理の一例である。本開示によって導入されたエンコーダ側の変更は、主に、レート歪み最適化(RDO)手順を使用したイントラ予測モードの選択に関連している。この手順は、
−イントラ予測残差の推定に基づくコスト推定を使用してイントラ予測モード候補LRCのリストを作成すること、および
−イントラ予測残差の符号化に基づくコスト推定を使用してLRCリストから最適なイントラ予測を選択すること
を特に含んでもよい。
可能な実施態様の1つは、イントラ予測モード候補LRCのリストを作成する特定の方法を含む。イントラ予測モードの数に加えて、LRCリストは、対応するイントラ予測モードに関連付けられたbip_flagの値も含む。図16は、イントラ予測残差の推定に基づくコスト推定を使用して、イントラ予測モード候補およびbip_flagの対応する値のリストを作成するための例示的なフローチャートを示している。フローチャート1700によれば、利用可能なイントラ予測モードは、bip_flagの値がそれぞれ0および1に等しい状態で2回走査される。フローチャート1700はまた、bip_flagが照合されているイントラ予測モードIIPMに準拠していない場合のレート歪み最適化(RDO)コスト推定を省略する。
ブロック1702では、エンコーダは現在のブロックのintra_pred_list()を生成する。最初は、ブロック1704に示すようにbip_flagは0であり、ブロック1706に示すようにIIPMは0である。
ブロック1708では、エンコーダは、bip_flagが0であるかまたはbip_flagが1であるかを決定する。bip_flagが0である場合、ブロック1710で、エンコーダはBIPがデフォルトで適用されたかどうかを決定する。bip_flagが1である場合、ブロック1712で、エンコーダはBIPが有効であるかどうかを決定する。
BIPがデフォルトで適用されない場合、またはBIPが有効である場合、ブロック1714で、エンコーダは現在のブロックのイントラ予測モードとしてIIPMを使用する。ブロック1716では、エンコーダはRDOコスト推定を行う。次に、エンコーダは、ブロック1718でのイントラ予測残差の推定に基づくRDOコスト推定を使用してイントラ予測モード候補LRCのリストを作成し、ここで、LRCリストは、対応するイントラ予測モードに関連付けれられたbip_flagの値を含んでもよい。次いでブロック1718では、イントラ予測残差の符号化に基づくコスト推定を使用して、最適のイントラ予測がLRCリストから選択されるかまたは更新される。
ブロック1718でIIPMによってLRCを更新した後、またはブロック1710でBIPがデフォルトで適用されたか、またはブロック1712でBIPが有効でなければ、ブロック1720で、エンコーダは、IIPMが最後に利用可能なイントラ予測IIPM_LAであるかどうかを決定する。IIPMが最後に利用可能なイントラ予測IIPM_LAでない場合、ブロック1722では、IIPM=IIPM+1となる。IIPM=IIPM+1となった後、処理はブロック1708に戻り、bip_flagが0であるかまたはbip_flagが1であるかを決定する。IIPMが最後に利用可能なイントラ予測IIPM_LAである場合、ブロック1724で、エンコーダはbip_flag<1であるかどうかを決定する。ブロック1726では、bip_flag<1である場合、bip_flag=bip_flag+1となる。bip_flag=bip_flag+1となった後、処理はブロック1706に戻る。
BIPが有効であるかどうかの例示的な決定、およびBIPがデフォルトで適用されたかどうかの例示的な決定は、前述されかつ図1〜図15に示されている。
この実施形態では、イントラ予測モード候補LRCの単一のリストが使用される。しかし、2つの別個のリストを作成し、かつ2つのリストから対{bip_flag、IIPM}を選択することは可能である。この場合、実施形態は依然として、LRCリストから最良のイントラ予測を選択する処理に影響を及ぼさないであろう。図17との唯一の違いは、bip_flagループがintra_pred_list処理とは無関係であり、更新されるリストLRCがbip_flagの入力値に従って選択されることである。
例示的な復号処理
図18は、符号化されたビットストリームを復号(または解析または解凍)する例示的なフローチャート1800であり、このフローチャートは、図1に示す宛先デバイス104、または図3に示すビデオデコーダ300によって行われる。処理1800は、デコーダの処理の一例である。
ブロック1802で、デコーダはビットストリームを受信し、ビットストリームは予測関連情報を含む。予測関連情報は、
−利用可能な1次参照サンプルの数および位置、
−イントラ予測モードインデックス、
−予測されるブロックのアスペクト比、および/または
−予測されるブロックのサイズ
を含む。
ブロック1804では、デコーダは、BIPフラグがビットストリームにおいてシグナリングされたかどうかを予測関連情報に従って決定し、ここで、BIPフラグは現在の符号化ブロックに対して選択されたBIPモードを示す。
BIPフラグがビットストリームにおいてシグナリングされるかどうかを決定する例は前述されており、図1〜図15に示されている。
ブロック1806では、BIPフラグがビットストリームにおいてシグナリングされない場合、デコーダはBIPフラグの値を予測関連情報から導出する。2つの例については、「BIPが無効であり、かつ対応するフラグがシグナリングされない」段落、および「BIPがデフォルトで使用され、かつ対応するフラグがシグナリングされない」段落で前述している。
ブロック1808では、BIPフラグがビットストリームにおいてシグナリングされる場合、デコーダは復号のための確率モデルを予測関連情報から導出する。次いで、デコーダはBIPフラグの値を確率モデルを使用して復元する。この例については、「BIPがCABACコンテキスト(または確率モデル)を使用してシグナリングされる」段落で前述している。
ブロック1810では、デコーダは画像をBIPフラグの値に基づいて再構築する。
図19は、符号化されたビットストリームを復号(または解析または解凍)する別の例示的なフローチャート1900であり、このフローチャートは、図1に示す宛先デバイス104、または図3に示すビデオデコーダ300によって行われる。処理1900は、デコーダの処理の一例である。
ビットストリームからの予測関連情報の解析は、ブロック1902で、coding_unit手順によって行われる。解析は様々なシンボルを含んでもよいが、イントラ予測ブロックについては、イントラ予測モードは手順1900において解析されるべきである。この実施形態では、intra_luma_pred_modeがブロック1904で解析された後、bip_flagの値を条件付きで解析することが提案されている。イントラ予測モード、ブロックの形状およびサイズに応じて、bip_flagの値が割り当てられるかまたはビットストリームから解析される。詳細情報は、上記の図1〜図15に開示されている。ブロック1906で、デコーダはBIPが有効であるかどうかを決定する。BIPが有効でない場合、ブロック1908で、bip_flagは偽となる。BIPが有効である場合、ブロック1910で、デコーダはBIPがデフォルトで適用されたかどうかを決定する。デフォルトでBIPが適用される場合、ブロック1912で、bip_flagは真となる。BIPがデフォルトで適用されない場合、ブロック1914で、デコーダはbip_flagを解析する。bip_flag値を復号する場合、イントラ予測モード、ブロックの形状およびサイズに基づいてコンテキストを選択することができる。例示的なコンテキスト選択は前述されかつ図13に示されている。BIPが有効であるかどうかの例示的な決定、およびBIPがデフォルトで適用されたかどうかの例示的な決定は、前述されかつ図1〜図15に示されている。
図20は、ネットワーク要素2000の概略図である。ネットワーク要素2000は、本明細書に記載の開示された実施形態を実施するのに適している。ネットワーク要素2000は、上述の方法を行うためのエンコーダもしくはデコーダであってもよい。ネットワーク要素2000は、データを受信する入力ポート2010および受信機ユニット(Rx)2020、データを処理するプロセッサ、論理ユニットもしくは中央処理装置(CPU)2030、データを送信する送信機ユニット(Tx)2040および出力ポート2050、および、データを格納するメモリ2060を備える。ネットワーク要素2000はまた、光学信号または電気信号の出力用または入力用の入力ポート2010、受信機ユニット2020、送信機ユニット2040および出力ポート2050に結合された光学−電気(OE)素子および電気−光学(EO)素子を含んでもよい。
プロセッサ2030は、ハードウェアおよびソフトウェアによって実施される。プロセッサ2030は、1つ以上のCPUチップ、コア(例えば、マルチコアプロセッサとして)、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路ASIC)、およびデジタル信号プロセッサ(DSP)として実装されてもよい。プロセッサ2030は、入力ポート2010、受信機ユニット2020、送信機ユニット2040、出力ポート2050およびメモリ2060と通信する。プロセッサ2030は、符号化モジュール2070を含む。符号化モジュール2070は、上述の開示された実施形態を実施する。例えば符号化モジュール2070は、最後の符号化ブロックもしくは最後の予測ブロックを圧縮/解凍する方法を実施する。したがって、符号化モジュール2070を含めることは、ネットワーク要素2000の機能に実質的な改善をもたらし、ネットワーク要素2000を異なる状態に転換させる。あるいは、符号化モジュール2070はメモリ2060に記憶され、かつプロセッサ2030によって実行される命令として実装される。
メモリ2060は、1つ以上のディスク、テープドライブおよびソリッドステートドライブを含み、プログラムが実行のために選択された場合にそのようなプログラムを記憶し、かつプログラムの実行中に読み取られた命令およびデータを記憶するために、オーバーフローデータ記憶装置として使用されてもよい。メモリ2060は、揮発性および/または不揮発性であってもよく、読取り専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、三値連想メモリ(TCAM)、および/またはスタティックランダムアクセスメモリ(SRAM)であってもよい。
本明細書に開示の技術は、双方向イントラ予測モードがシグナリングされず、かつデフォルトで使用されないことを決定するために、または双方向イントラ予測モードがシグナリングされず、かつ使用されないことを決定するためにオーバーヘッドを節減することができる。双方向イントラ予測モードが様々なコンテキストに基づいてシグナリングされる場合であっても、この技術は、BIPの信頼性を高めることができる。BIPモードはDWDIPモードであってもよい。同様に、BIPフラグはDWDIPフラグであってもよい。
この技術は、次の局面においても有益な場合がある。
−エンコーダ側およびデコーダ側の両方における計算の複雑性の増加を無視して、可変長ブロック符号化順序によって分割するフレームワーク内のBIPの圧縮性能を向上させる。
−HMソフトウェアおよびVPXビデオコーデック群、およびJEMソフトウェア、VPX/AV1ビデオコーデック群、およびその他の最先端の類似のプラットフォーム、および次世代のビデオ符号化フレームワークとそれぞれ互換性のあるハイブリッドビデオ符号化パラダイムにおける多くの潜在的なアプリケーションにおいて使用することができる。
−予測関連情報を使用することによって、双方向予測が片方向予測よりも少ないRDOコストを提供する確率の推定が改善される。より正確な確率モデリングは、エントロピー符号化の効率を向上させ、その結果、ビットレートを低減する。
本開示の特定の特徴または態様を、いくつかの実施例もしくは実施形態のうちの1つのみに関して開示してきたが、所望の通りに、または任意の所与または特定の用途に有利であるように、このような特徴または態様を他の実施例もしくは実施形態のうちの1つ以上のさらなる特徴または態様と組み合わせてもよい。さらに、「含む(include)」、「有する(have)」、「備える(with)」という用語またはその変化形が詳細な説明あるいは特許請求の範囲において使用される場合、このような用語は、用語「(などを)含む(comprise)」と同様に包括的であるものとする。また、「例示的な(exemplary)」、「例えば(for example)」および「例えば(e.g.)」という用語は、最良または最適というよりもむしろ、単なる一例にすぎない。「結合される(coupled)」および「接続される(connected)」という用語は、その派生語と共に使用されてもよい。これらの用語は、2つの要素が直接物理的または電気的に接触しているか、または互いに直接接触していないかに関わらず、これら2つの要素が互いに協働するかまたは相互作用していることを示すために使用されてもよいことが理解されるべきである。
本明細書において特定の態様を図示し説明してきたが、様々な代替および/または等価の実施態様を、本開示の範囲から逸脱することなく図示および説明された特定の態様に代えてもよいことが理解されるであろう。本出願は、本明細書に記載の特定の態様の任意の適応または変形を網羅することを意図している。
以下の特許請求の範囲における要素は、対応する標示と共に特定の順序で列挙しているが、特許請求の範囲の列挙が、別にこれらの要素のいくつかまたは全てを実施する特定の順序を示唆していない限り、これらの要素は、必ずしもその特定の順序での実施に限定されるものではない。
多くの代替、修正および変形は、上述の教示を考慮すると当業者にとって明らかであろう。当然ながら、本明細書に記載されたものを超えて本開示の多くの用途があることを、当業者は容易に認識している。1つ以上の特定の実施例を参照して本開示を説明してきたが、本開示の範囲を逸脱することなく多くの変更を加えてもよいことを当業者は認識している。したがって、添付の特許請求の範囲およびその等価物の範囲内で、本開示を本明細書で具体的に説明した以外の方法で実施してもよいことが理解されるべきである。
100 ビデオの符号化および復号システム
102 ソースデバイス
104 宛先デバイス
106 ビデオソース
108、200 ビデオエンコーダ
110 出力インタフェース
112 リンク
114 入力インタフェース
116、300 ビデオデコーダ
118 表示デバイス
201 変換ユニット
202 量子化ユニット
203 エントロピー符号化ユニット
204、304 逆量子化ユニット
205、305 逆変換ユニット
206、306 フィルタリングユニット
207、307 フレームバッファ
208 モード選択ユニット
209、309 イントラ予測ユニット
210、310 インター予測ユニット
303 エントロピー復号ユニット
602 1次参照サンプル
604 2次参照サンプル
606 ピクセル/サンプル
2000 ネットワーク要素
2010 入力ポート
2020 受信機ユニット
2030 中央処理装置、プロセッサ
2040 送信機ユニット
2050 出力ポート
2060 メモリ
2070 符号化モジュール
1600、1700、1800、1900 処理
1800、1900 フローチャート
デコーダ300は、ビデオエンコーダ200によって生成された符号化ビデオビットストリームを復号するように適合され、デコーダ300およびエンコーダ200の両方は同一の予測を生成する。フレームバッファ307、インター予測ユニット310の特徴は、図2のフレームバッファ207、インター予測ユニット210の特徴と同様である。
左側および右側がブロック1308で利用可能、つまり{sL、sR}⊇Sである場合、上側が利用不可能であり、かつIIPMが図14A(ブロック1310)に示す範囲に属するとき、ブロック1328で、CTXLRが選択される。ブロック1310では、上側が利用不可能であるかどうか、およびIIPMが図14Aに示す範囲に属するかどうか、例えば、
Figure 2021517423
および
(IIPM_TR<IIPM<IIPM_LTまたはIIPM_LL<IIPM<IIPM_LA
であるかどうかが決定される。
左側および上側が利用可能である場合、CTXHRは、右側が利用不可能であり、かつIIPMが図14Bに示す範囲に属する場合に選択される。図14Aおよび図14Bにおいて残りの場合については、追加の計算がブロック1312で行われてもよく、具体的には、
IIPMが水平方向と垂直方向との間にあるかどうか(条件C)、および
最終イントラ予測モードとの閾値の差分(ΔIPM)が計算され、
ここで、C=IIPM_VER≦IIPM≦IIPM_HOR
ΔIPM=min(IIPM_VER−IIPM_TR、IIPM_LL−IIPM_HOR)/2
である。
コンテキスト選択処理の残りの部分は図13に示され、これにより、予測信頼性の推定に応じて、上記で特定したコンテキストのうちの1つが選択される。左側が利用可能であり、かつ右側がブロック1314で利用不可能である場合、ブロック1318で、Cが真であるか、または
Figure 2021517423
であるかが決定される。Cが真であるかまたは
Figure 2021517423
である場合、ブロック1326で、CTXMRが選択される。Cが偽であり、かつ{sLL、sTR}⊇Sの場合、ブロック1322で、
max(IIPM_TR−ΔIPM、IIPM_FA)≦IIPM≦IIPM_TR+ΔIPMであるか、または
IIPM_LL−ΔIPM≦IIPM≦min(IIPM_LL+ΔIPM、IIPM_LA)であるかが決定される。ブロック1322で「yes」の場合、ブロック1324でCTX HR が選択され、「no」の場合、ブロック1326でCTX MR が選択される。
可能な実施態様の1つは、イントラ予測モード候補LRCのリストを作成する特定の方法を含む。イントラ予測モードの数に加えて、LRCリストは、対応するイントラ予測モードに関連付けられたbip_flagの値も含む。図17は、イントラ予測残差の推定に基づくコスト推定を使用して、イントラ予測モード候補およびbip_flagの対応する値のリストを作成するための例示的なフローチャートを示している。フローチャート1700によれば、利用可能なイントラ予測モードは、bip_flagの値がそれぞれ0および1に等しい状態で2回走査される。フローチャート1700はまた、bip_flagが照合されているイントラ予測モードIIPMに準拠していない場合のレート歪み最適化(RDO)コスト推定を省略する。



Claims (24)

  1. 画像を符号化する方法であって、前記方法は前記画像を再構築するビットストリームを生成するステップを含み、前記方法は、
    前記画像の現在の符号化ブロックのイントラ予測モード候補のリストを生成するステップであって、前記イントラ予測モード候補の前記リストが少なくとも1つのBIPモードを含む、ステップと、
    BIPフラグが前記ビットストリームにおいてシグナリングされるかどうかを予測関連情報に従って決定するステップであって、前記BIPフラグは前記現在の符号化ブロックに対して選択されたBIPモードを示し、前記予測関連情報は、利用可能な1次参照サンプルの数および位置、イントラ予測モードインデックス、または前記現在の符号化ブロックのサイズのうちの少なくとも1つを含む、ステップと、
    前記BIPフラグが前記ビットストリームにおいてシグナリングされる場合に、符号化のための確率モデルを前記予測関連情報から導出し、前記確率モデルを使用して前記BIPフラグの値を前記ビットストリームに符号化するステップと、
    前記BIPフラグが前記ビットストリームにおいてシグナリングされない場合に、前記BIPフラグの値を前記ビットストリームに符号化しないステップと
    を含む、方法。
  2. 前記BIPフラグがシグナリングされるかどうかを決定する前記ステップは、
    前記BIPが有効であり、前記BIPフラグがデフォルトで適用され、かつ前記ビットストリームにおいてシグナリングされないことを決定するステップ、または
    前記BIPが無効であり、前記BIPフラグが前記ビットストリームにおいてシグナリングされないことを決定するステップ
    を含む、請求項1に記載の方法。
  3. 前記BIPフラグが、利用可能な1次参照サンプルの数および位置に従ってシグナリングされるかどうかを決定する前記ステップは、
    前記現在の符号化ブロックの上側にある1次参照サンプルが利用不可能である場合に、前記BIPが無効であり、かつ前記BIPフラグが前記ビットストリームにおいてシグナリングされないことを決定するステップ、または
    前記現在の符号化ブロックの左側および右側にある1次参照サンプルが利用不可能である場合に、前記BIPが無効であり、かつ前記BIPフラグが前記ビットストリームにおいてシグナリングされないことを決定するステップ
    を含む、請求項1または2に記載の方法。
  4. 前記BIPフラグが前記現在の符号化ブロックの前記サイズに従ってシグナリングされるかどうかを決定する前記ステップは、
    前記現在の符号化ブロックの幅および高さの両方が最小サイズに等しい場合、または前記現在の符号化ブロックの前記幅が第1の最大閾値よりも大きい場合、または前記現在の符号化ブロックの前記高さが第2の最大閾値よりも大きい場合に、前記BIPが無効であり、かつ前記BIPフラグがビットストリームにおいてシグナリングされないことを決定するステップ
    を含む、請求項1から3のいずれか一項に記載の方法。
  5. 前記BIPフラグが、利用可能な1次参照サンプルの数および位置、およびイントラ予測モードインデックスに従ってシグナリングされるかどうかを決定する前記ステップが、
    前記イントラ予測モードインデックスが範囲開始値未満であるかまたは範囲終了値を超える場合、および前記現在の符号化ブロックの左側および右側にある1次参照サンプルが利用可能である場合に、前記BIPが無効であり、かつ前記BIPフラグが前記ビットストリームにおいてシグナリングされないことを決定するステップであって、前記範囲開始値および前記範囲終了値が前記現在の符号化ブロックの幅および高さを使用して決定される、ステップ、または
    前記現在の符号化ブロックの左側または右側にある1次参照サンプルのみが利用可能であり、かつ、次のいずれかが真である場合、つまり、
    前記現在の符号化ブロックの幅が最小サイズに等しく、かつイントラ予測モードの数が水平方向のイントラ予測モードの数とは第1の閾値以下だけ異なるか、または
    前記現在の符号化ブロックの高さが最小サイズに等しく、前記イントラ予測モードの前記数が垂直方向のイントラ予測モードの数とは第2の閾値以下だけ異なる
    場合に、前記BIPが無効であり、かつ前記BIPフラグが前記ビットストリームにおいてシグナリングされないことを決定するステップ
    を含む、請求項1から4のいずれか一項に記載の方法。
  6. 前記BIPフラグが利用可能な1次参照サンプルの数および位置、およびイントラ予測モードインデックスに従ってシグナリングされるかどうかを決定する前記ステップは、
    前記イントラ予測モードインデックスが前記範囲開始値を超え、前記範囲終了値未満である場合、および前記現在の符号化ブロックの下側または上側にある1次参照サンプルが利用可能である場合に、前記BIPが有効であり、前記BIPフラグがデフォルトで適用され、かつビットストリームにおいてシグナリングされないことを決定するステップであって、前記範囲開始値および前記範囲終了値が前記現在の符号化ブロックの幅および高さを使用して決定される、ステップ
    を含む、請求項1または2に記載の方法。
  7. 前記BIPフラグがシグナリングされるかどうかを決定する前記ステップは、
    前記BIPの信頼性を決定するステップであって、前記BIPの前記信頼性が低信頼性予測(CTXLR)、中間信頼性予測(CTXMR)、または高信頼性予測(CTXHR)を含む、ステップ
    を含む、請求項1に記載の方法。
  8. 前記BIPの前記信頼性を決定する前記ステップは、
    前記現在の符号化ブロックの左側および右側にある1次参照サンプルが利用可能であり、前記現在の符号化ブロックの上側にある1次参照サンプルが利用不可能であり、IIPMが第1の所定の範囲に属する場合に、前記BIPの前記信頼性をCTXLRとして決定するステップ
    を含む、請求項7に記載の方法。
  9. 前記BIPの前記信頼性を決定する前記ステップは、
    前記現在の符号化ブロックの左側および上側にある1次参照サンプルが利用可能であり、前記現在の符号化ブロックの右側にある1次参照サンプルが利用不可能であり、IIPMが第2の所定の範囲に属する場合に、前記BIPの前記信頼性をCTXHRとして決定するステップ
    を含む、請求項7に記載の方法。
  10. 前記BIPの前記信頼性を決定する前記ステップは、
    前記現在の符号化ブロックの左側および右側にある1次参照サンプルが利用可能であり、かつ、次のいずれか、つまり
    前記現在の符号化ブロックの上側にある1次参照サンプルが利用可能である、または、
    IIPMが前記第1の所定の範囲に属さない
    が真である場合に、前記BIPの前記信頼性をCTXMRとして決定するステップ
    を含む、請求項7に記載の方法。
  11. 画像の現在の符号化ブロックのイントラ予測方法であって、
    ビットストリームを受信するステップであって、前記ビットストリームが予測関連情報を含み、前記予測関連情報が、利用可能な1次参照サンプルの数および位置、イントラ予測モードインデックスまたは現在の符号化ブロックのサイズのうちの少なくとも1つを含む、ステップと、
    双方向イントラ予測(BIP)フラグが前記ビットストリームにおいてシグナリングされるかどうかを前記予測関連情報に基づいて決定するステップと、
    前記BIPフラグがシグナリングされない場合に、前記BIPフラグの値を前記予測関連情報から導出するステップと、
    前記BIPフラグがシグナリングされる場合に、前記BIPフラグの値を復元するために確率モデルを前記予測関連情報から導出するステップと、
    前記画像を前記BIPフラグの前記値に基づいて再構築するステップと
    を含む、方法。
  12. 前記BIPフラグがシグナリングされるかどうかを決定する前記ステップが、
    前記BIPが有効であり、前記BIPフラグがデフォルトで適用され、かつ前記ビットストリームにおいてシグナリングされないことを決定するステップ、または
    前記BIPが無効であり、前記BIPフラグが前記ビットストリームにおいてシグナリングされないことを決定するステップ
    を含む、請求項11に記載の方法。
  13. 前記予測関連情報が利用可能な1次参照サンプルの数および位置を含み、前記BIPフラグがシグナリングされるかどうかを決定する前記ステップが、
    前記現在の符号化ブロックの上側にある1次参照サンプルが利用不可能である場合に、前記BIPが無効であり、かつ前記BIPフラグが前記ビットストリームにおいてシグナリングされないことを決定するステップ、または
    前記現在の符号化ブロックの左側および右側にある1次参照サンプルが利用不可能である場合に、前記BIPが無効であり、かつ前記BIPフラグが前記ビットストリームにおいてシグナリングされないことを決定するステップ
    を含む、請求項11または請求項12に記載の方法。
  14. 前記予測関連情報が前記現在の符号化ブロックのサイズを含み、前記BIPフラグがシグナリングされるかどうかを決定する前記ステップが、
    前記現在の符号化ブロックの幅および高さの両方が最小サイズに等しい場合、または前記現在の符号化ブロックの前記幅が第1の最大閾値よりも大きい場合、または前記現在の符号化ブロックの前記高さが第2の最大閾値よりも大きい場合に、前記BIPが無効であり、かつ前記BIPフラグがビットストリームにおいてシグナリングされないことを決定するステップ
    を含む、請求項11から13のいずれか一項に記載の方法。
  15. 前記予測関連情報が利用可能な1次参照サンプルの数および位置とイントラ予測モードインデックスとを含み、前記BIPフラグがシグナリングされるかどうかを決定する前記ステップが、
    前記イントラ予測モードインデックスが範囲開始値未満であるかまたは範囲終了値を超える場合、および前記現在の符号化ブロックの左側および右側にある1次参照サンプルが利用可能である場合に、前記BIPが無効であり、かつ前記BIPフラグが前記ビットストリームにおいてシグナリングされないことを決定するステップであって、前記範囲開始値および前記範囲終了値が前記現在の符号化ブロックの幅および高さを使用して決定される、ステップ、または
    前記現在の符号化ブロックの左側または右側にある1次参照サンプルのみが利用可能であり、かつ、次のいずれかが真である場合、つまり、
    前記現在の符号化ブロックの幅が4であり、かつイントラ予測モードの数が水平方向のイントラ予測モードの数とは第1の閾値以下だけ異なるか、または
    前記現在の符号化ブロックの高さが4であり、前記イントラ予測モードの前記数が垂直方向のイントラ予測モードの数とは第2の閾値以下だけ異なる
    場合に、前記BIPが無効であり、かつ前記BIPフラグが前記ビットストリームにおいてシグナリングされないことを決定するステップ
    を含む、請求項11から14のいずれか一項に記載の方法。
  16. 前記予測関連情報が利用可能な1次参照サンプルの数および位置とイントラ予測モードインデックスとを含み、前記BIPフラグがシグナリングされるかどうかを決定する前記ステップが、
    前記イントラ予測モードインデックスが前記範囲開始値を超え、前記範囲終了値未満である場合、および前記現在の符号化ブロックの下側または上側にある1次参照サンプルが利用可能である場合に、前記BIPが有効であり、前記BIPフラグがデフォルトで適用され、かつビットストリームにおいてシグナリングされないことを決定するステップであって、前記範囲開始値および前記範囲終了値が前記現在の符号化ブロックの幅および高さを使用して決定される、ステップ
    を含む、請求項11または請求項12に記載の方法。
  17. 前記BIPフラグがシグナリングされるかどうかを決定する前記ステップが、
    前記BIPの信頼性を前記予測関連情報に従って決定するステップであって、前記BIPの前記信頼性が、低信頼性予測(CTXLR)、中間信頼性予測(CTXMR)、または高信頼性予測(CTXHR)を含む、ステップ
    を含む、請求項11に記載の方法。
  18. 前記BIPの前記信頼性を決定する前記ステップが、
    前記現在の符号化ブロックの左側および右側にある1次参照サンプルが利用可能であり、前記現在の符号化ブロックの上側にある1次参照サンプルが利用不可能であり、IIPMが第1の所定の範囲に属する場合に、前記BIPの前記信頼性をCTXLRとして決定するステップ
    を含む、請求項17に記載の方法。
  19. 前記BIPの前記信頼性を決定する前記ステップが、
    前記現在の符号化ブロックの左側および上側にある1次参照サンプルが利用可能であり、前記現在の符号化ブロックの右側にある1次参照サンプルが利用不可能であり、IIPMが第2の所定の範囲に属する場合に、前記BIPの前記信頼性をCTXHRとして決定するステップ
    を含む、請求項17に記載の方法。
  20. 前記BIPの前記信頼性を決定する前記ステップが、
    前記現在の符号化ブロックの左側および右側にある1次参照サンプルが利用可能であり、かつ、次のいずれかが真である場合、つまり
    前記現在の符号化ブロックの上側にある1次参照サンプルが利用可能であるか、または、
    IIPMが前記第1の所定の範囲に属さない
    場合に、前記BIPの前記信頼性をCTXMRとして決定するステップ
    を含む、請求項17に記載の方法。
  21. 前記BIPモードが、距離加重方向イントラ予測(DWDIP)モードであり、前記BIPフラグがDWDIPフラグである、請求項11から20のいずれか一項に記載の方法。
  22. 請求項1から10のいずれか一項に記載の方法を実行する処理回路を備えるエンコーダ(108、200)。
  23. 請求項11から21のいずれか一項に記載の方法を実行する処理回路を備えるデコーダ(116、300)。
  24. コンピュータプログラムがコンピュータデバイス上で実行される場合に、請求項1から10のいずれか一項に記載の、または請求項11から21のいずれか一項に記載の方法を行うためのプログラムコードを含むコンピュータプログラム製品。
JP2020552404A 2018-03-29 2019-03-28 双方向イントラ予測のシグナリング Active JP7086208B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
RUPCT/RU2018/000206 2018-03-29
RU2018000206 2018-03-29
PCT/EP2019/057838 WO2019185781A1 (en) 2018-03-29 2019-03-28 Bidirectional intra prediction signalling

Publications (2)

Publication Number Publication Date
JP2021517423A true JP2021517423A (ja) 2021-07-15
JP7086208B2 JP7086208B2 (ja) 2022-06-17

Family

ID=66102044

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020552404A Active JP7086208B2 (ja) 2018-03-29 2019-03-28 双方向イントラ予測のシグナリング

Country Status (8)

Country Link
US (1) US11323695B2 (ja)
EP (1) EP3777171A1 (ja)
JP (1) JP7086208B2 (ja)
KR (1) KR102407912B1 (ja)
CN (1) CN111937389B (ja)
BR (1) BR112020019831A2 (ja)
SG (1) SG11202009565SA (ja)
WO (1) WO2019185781A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11343536B2 (en) 2018-06-27 2022-05-24 Kt Corporation Method and apparatus for processing video signal
CN115460182A (zh) * 2021-05-21 2022-12-09 华为技术有限公司 编解码方法、装置、设备、存储介质及计算机程序
CN117957837A (zh) * 2021-07-14 2024-04-30 抖音视界有限公司 用于视频处理的方法、装置和介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015518338A (ja) * 2012-04-25 2015-06-25 ノキア コーポレイション ビデオコーディング方法および装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101179734B (zh) * 2006-11-28 2010-09-15 腾讯科技(深圳)有限公司 一种视频压缩的帧内预测方法和系统
CN101267567A (zh) * 2007-03-12 2008-09-17 华为技术有限公司 帧内预测、编解码方法及装置
WO2011083573A1 (ja) * 2010-01-07 2011-07-14 株式会社 東芝 動画像符号化装置及び動画像復号化装置
US8902978B2 (en) 2010-05-30 2014-12-02 Lg Electronics Inc. Enhanced intra prediction mode signaling
CN102685506B (zh) * 2011-03-10 2015-06-17 华为技术有限公司 帧内预测的方法和预测装置
US9088796B2 (en) * 2011-11-07 2015-07-21 Sharp Kabushiki Kaisha Video decoder with enhanced CABAC decoding
JP2014022787A (ja) * 2012-07-12 2014-02-03 Canon Inc 画像符号化装置、画像符号化方法
WO2017014412A1 (ko) 2015-07-20 2017-01-26 엘지전자 주식회사 비디오 코딩 시스템에서 인트라 예측 방법 및 장치
CN106162197B (zh) * 2016-08-31 2019-07-12 北京奇艺世纪科技有限公司 一种视频编码帧内预测方法和装置
KR102228474B1 (ko) 2016-10-14 2021-03-16 후아웨이 테크놀러지 컴퍼니 리미티드 비디오 코딩을 위한 디바이스들 및 방법들
KR102293097B1 (ko) 2016-10-14 2021-08-25 후아웨이 테크놀러지 컴퍼니 리미티드 비디오 코딩을 위한 디바이스들 및 방법들
CN109845263B (zh) 2016-10-14 2021-07-16 华为技术有限公司 用于视频编码的设备和方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015518338A (ja) * 2012-04-25 2015-06-25 ノキア コーポレイション ビデオコーディング方法および装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
TAICHIRO SHIODERA, ET.AL.: "CE6 Subset A: Bidirectional intra prediction", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11 4TH M, vol. JCTVC-D108, JPN6021052420, 15 January 2011 (2011-01-15), ISSN: 0004673571 *

Also Published As

Publication number Publication date
BR112020019831A2 (pt) 2021-01-05
JP7086208B2 (ja) 2022-06-17
SG11202009565SA (en) 2020-10-29
CN111937389B (zh) 2022-01-14
KR20200132985A (ko) 2020-11-25
WO2019185781A1 (en) 2019-10-03
KR102407912B1 (ko) 2022-06-10
US11323695B2 (en) 2022-05-03
US20210014482A1 (en) 2021-01-14
CN111937389A (zh) 2020-11-13
EP3777171A1 (en) 2021-02-17

Similar Documents

Publication Publication Date Title
US11218694B2 (en) Adaptive multiple transform coding
KR101918873B1 (ko) 비디오 코딩에서 교차 구성 예측과 적응형 컬러 변환의 조화
KR101977450B1 (ko) 팔레트 코딩 모드에서의 비디오 블록의 이스케이프 픽셀들의 양자화
TWI714548B (zh) 用於視訊寫碼之調色盤索引分組
TWI705697B (zh) 在視訊寫碼中調色板區塊大小之限制
JP6396439B2 (ja) 残差差分パルスコード変調(dpcm)拡張ならびに変換スキップ、回転、および走査との調和
JP5922244B2 (ja) ビデオコーディングにおいて適応ループフィルタとマージされたサンプル適応オフセット
JP6144333B2 (ja) レートひずみ最適量子化におけるレベル決定
CN112913250B (zh) 编码器、解码器及对任意ctu尺寸使用ibc搜索范围优化的对应方法
JP5890031B2 (ja) ビデオコーディング用の断片化されたパラメータセット
JP7366149B2 (ja) 行列ベースのイントラ予測と二次変換コア選択を調和させるエンコーダ、デコーダ、および対応する方法
EA034473B1 (ru) Система и способ кодирования и декодирования видеоданных
JP2018524873A (ja) ビデオコーディングのためのパレットバイパスビンのグループ化
JP2018524906A (ja) イントラブロックコピーモードでの参照ピクチャリスト構成
JP2017535161A (ja) パレットベースビデオコーディングのためのパレットインデックスの2値化
CN112673633B (zh) 合并模式的编码器、解码器及对应方法
US11323695B2 (en) Bidirectional intra prediction signaling
CN113557527A (zh) 通用视频编解码中色彩变换的方法和装置
WO2020114356A1 (zh) 帧间预测方法和相关装置
US20240205459A1 (en) Systems and methods for wedge-based prediction mode signaling
WO2022117036A1 (zh) 量化参数的解码方法和装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201109

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201109

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220104

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220311

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220509

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220607

R150 Certificate of patent or registration of utility model

Ref document number: 7086208

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150