JP6913755B2 - 広角イントラ予測によるビデオおよび画像の符号化 - Google Patents

広角イントラ予測によるビデオおよび画像の符号化 Download PDF

Info

Publication number
JP6913755B2
JP6913755B2 JP2019535877A JP2019535877A JP6913755B2 JP 6913755 B2 JP6913755 B2 JP 6913755B2 JP 2019535877 A JP2019535877 A JP 2019535877A JP 2019535877 A JP2019535877 A JP 2019535877A JP 6913755 B2 JP6913755 B2 JP 6913755B2
Authority
JP
Japan
Prior art keywords
prediction
angle
intra
wide
image block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019535877A
Other languages
English (en)
Other versions
JP2020503785A (ja
Inventor
ヤニ ライネマ
ヤニ ライネマ
Original Assignee
ノキア テクノロジーズ オーユー
ノキア テクノロジーズ オーユー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ノキア テクノロジーズ オーユー, ノキア テクノロジーズ オーユー filed Critical ノキア テクノロジーズ オーユー
Publication of JP2020503785A publication Critical patent/JP2020503785A/ja
Priority to JP2021114685A priority Critical patent/JP7258958B2/ja
Application granted granted Critical
Publication of JP6913755B2 publication Critical patent/JP6913755B2/ja
Priority to JP2023061164A priority patent/JP2023082179A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本出願に記載の各種実施形態は、方向性イントラ予測に基づく画像および/またはビデオの符号化に関する。異なる複数の態様について、画像およびビデオの符号化で方向性イントラ予測を使用するための方法、装置、システム、およびコンピュータプログラム製品、さらにその信号またはデータ構造が説明される。
背景
本セクションは、請求項に記載の発明に背景や文脈を添えることを意図したものである。本稿の説明は、特許化可能であって、既に必ずしも概念化、特許化されていないものを含みうる。したがって、本稿で別途記載しない限り、本セクションの内容は、本願の明細書および請求項に対する先行技術ではなく、本セクションに含めることで先行技術として認められるものではない。
方向性イントラ予測は、予測対象ブロック内で、方向性をもって、境界サンプルを推定することで、ブロック周りの復号サンプルに基づいて、予測サンプル(すなわち画素値)のブロックを生成する。この予測ブロックを、画像ブロックの符号化の基盤として利用してもよい。また、元のブロックを直接符号化する代わりに、予測ブロックと、元ブロックとの間の予測誤差を符号化してもよい。一般的に、予測が良好であるほど、画像の符号化効率は高い。典型的には、例えば、インター符号化画像と比較して、イントラ符号化画像が最大の符号化画像となる。
したがって、方向性イントラ予測に基づく画像およびビデオの符号化を向上する手段が求められている。
摘要
上記問題を軽減する改良された方法と、その方法を実施する技術的機器が発明されている。本発明の各種態様には、各独立請求項の記載を特徴とする方法、装置、サーバ、クライアントおよびコンピュータプログラムを記憶するコンピュータ可読媒体が含まれる。本発明の各種実施形態は、各従属請求項に開示されている。
本明細書では、広角予測方向によるイントラピクチャ方向性予測用の方法、装置、システム、コンピュータプログラム製品および信号が提示される。広角とは、参照位置から予測される画素への方向が、左上方向(「上」および「左」方向の中間の方向)に対して鈍角となることを指す。当該広角予測モード(すなわち方向)は、選択されたモードとして直接ビットストリームに符号化してもよい。使用時の広角方向、その数、正確な方向、確率は、予測されるブロックの形状により決定されてもよい。広角モードは、その反転モードにより、従来の狭角モードに対応してもよい。この反転モードは、基本狭角モードに対して反対、基本的に反対、または傾いているが、ある程度反対であってもよい。基本モードと広角モードのいずれを使用するか選択可能である。
第1の態様では復号方法が提供され、当該方法は、符号化画像データを含むビットストリームを受信することと、コンピュータメモリ内の当該ビットストリームから、イントラピクチャ方向性予測のための参照画素値を有する参照画素の組を形成することと、予測された画素値を形成する際に、前記予測された画素に対する予測方向から選択された1つまたは複数の参照画素の値を使用することにより、イントラピクチャ方向性予測によって予測された画像ブロックにおける画素値を予測することと、前記予測方向は、前記予測された画素の左上方向に対して鈍角を形成する広角予測方向であり、複数の画素に対して前記画素予測を繰り返して、予測された画像ブロックを形成することと、前記ビットストリームから画像ブロックを復号する際に当該予測された画像ブロックを使用して、復号された画像ブロックを取得することとを含む。
前記予測された画像ブロックは、ある形状を有してもよい。前記方法は、前記ビットストリームから当該形状を判定することを含んでもよい。前記方法は、前記形状に基づいて、前記イントラピクチャ方向性予測において使用される方向性予測モードを判定することと、前記画素値を予測する際に、前記方向性予測モードから前記予測方向を選択することと、を含んでもよい。前記方法は、前記イントラピクチャ方向性予測において使用される予測モードを判定することと、前記形状に基づいて、可能性の高い予測モードを判定することと、前記予測方向が当該可能性の高い予測モードのうちの1つであるかを示す前記ビットストリームから、インジケータを復号することと、前記可能性の高い予測モードから前記予測方向を選択することと、を含んでもよい。前記方法は、前記イントラピクチャ方向性予測に使用される方向性予測モードを判定することと、前記ビットストリームから方向インジケータを復号することと、当該方向インジケータに関連付けられている基本方向と広角方向とから前記画素値を予測するための前記予測方向を選択することと、を含んでもよい。前記方法は、前記ビットストリームから予測方向選択インジケータを復号することと、当該予測方向選択インジケータを使用して、前記基本方向と前記広角方向から前記画素値を予測するための前記予測方向を選択することと、を含んでもよい。前記方法は、前記形状に基づいて、基本方向と広角方向とから前記画素値を予測するための前記予測方向を選択することを含んでもよい。前記基本方向は、前記広角方向と実質的に反対方向となるように、前記広角方向に関連付けられていてもよい。前記基本方向は、前記広角方向と実質的に反対方向とならないように、かつ前記広角方向とは左上方向の反対側となるように、前記広角方向に関連付けられていてもよい。2つ以上の広角方向が1つの基本方向に関連付けられていてもよく、2つ以上の基本方向が同一の広角方向に関連付けられていてもよく、またはその両方であってもよい。前記方法は、前記イントラピクチャ方向性予測において使用される予測モードを判定することと、前記ビットストリームから方向インジケータを復号することと、前記形状を使用して、当該方向インジケータに関連付けられている基本方向と広角方向との間の前記画素値を予測するための予測された予測方向を形成することと、当該予測された予測方向に基づいて前記予測方向を選択することと、を含んでもよい。
第2の態様では、符号化方法が提供され、当該方法は、符号化される画像データを受信することと、コンピュータメモリ内の前記画像データからイントラピクチャ方向性予測のための参照画素値を有する参照画素の組を形成することと、予測された画素値を形成する際に、前記予測された画素に対する予測方向から選択された1つまたは複数の参照画素の値を使用することにより、イントラピクチャ方向性予測によって予測された画像ブロックにおける画素値を予測することと、前記予測方向は、前記予測された画素の左上方向に対して鈍角を形成する広角予測方向であり、複数の画素に対して前記画素予測を繰り返して、予測された画像ブロックを形成することと、画像ブロックをビットストリームに符号化する際に、当該予測された画像ブロックを使用することとを含む。前記符号化方法はその一部として、本稿の採番された例に記載されているように、前記復号方法と同様の特徴を備えてもよい。
第3の態様では、本稿の採番された例に記載されているように、前記復号方法を実施させるように構成されたデコーダが提供される。
第4の態様では、本稿の採番された例に記載されているように、前記符号化方法を実施させるように構成されたエンコーダが提供される。
第5の態様では、本稿の採番された例に記載されているように、復号システムが提供される。
第6の態様では、本稿の採番された例に記載されているように、符号化システムが提供される。
第7の態様では、本稿の採番された例に記載されているように、復号コンピュータプログラム製品が提供される。
第8の態様では、本稿の採番された例に記載されているように、符号化コンピュータプログラム製品が提供される。
第9の態様では、本稿の採番された例に記載されているように、非一時的コンピュータ可読媒体に実施される信号が提供される。
以下では、添付の図面を参照して本発明の各種実施形態をより詳細に説明する。
画像またはビデオの符号化および復号用システムおよびデバイスを示す。 画像またはビデオの符号化および復号用システムおよびデバイスを示す。 エンコーダおよびデコーダのブロック図である。 エンコーダおよびデコーダのブロック図である。 画像の方向性イントラ予測を示す。 図3b〜dは、画像の方向性イントラ予測を示す。 図4a〜dは、画像の広角方向性イントラ予測を示す。 広角方向性イントラ予測モードを示す。 広角方向性イントラ予測モードを示す。 広角方向性イントラ予測モードを示す。 広角方向性イントラ予測モードを示す。 広角方向性イントラ予測モードを示す。 図6a、図6bは、広角方向性イントラ予測を利用した符号化および復号を示すフローチャートである。 広角方向性イントラ予測を利用した符号化および復号を示すフローチャートである。 広角方向性イントラ予測を利用した符号化および復号を示すフローチャートである。
例示的実施形態の説明
以下に、本発明のいくつかの実施形態を、ビデオの符号化および復号の文脈に準じて説明する。ただし、本発明はビデオの符号化および復号に限定されず、静止画像の符号化および復号、画像およびビデオ形式間の変換(トランスコーディング)に利用されてもよい。実際に、異なる様々な実施形態は、画像またはビデオの符号化や復号用の方向性イントラ予測が求められる任意の環境に幅広く適用されうる。
図1aおよび図1bは、各例に係る、画像および/またはビデオの符号化および/または送信用のシステムおよびデバイスを示す。図1aにおいて、異なる複数のデバイスが、インターネットまたはローカルエリアネットワークのような固定ネットワーク110、あるいはモバイル通信ネットワーク120を介して接続されてもよい。モバイル通信ネットワーク120は、GSM(Global System for Mobile communications)ネットワーク、3Gネットワーク、3.5Gネットワーク、4Gネットワーク、5Gネットワーク、無線LAN(Wireless Local Area Network:WLAN)、Bluetooth(登録商標)、またはその他現行または将来的なネットワークを含む。異なる複数のネットワークは、通信インタフェース180により互いに接続される。ネットワークは、ルータやスイッチのような、データ取り扱い用のネットワーク要素と、基地局130および131のような、異なる複数のデバイスをネットワークにアクセス可能にするための通信インタフェースとを備える。基地局130、131はそれ自体が、固定接続176または無線接続177を介してモバイルネットワーク120に接続されている。
ネットワークに接続された複数のサーバが存在してもよい。図1aの例では、画像または動画アクセスまたはストリーミング用のネットワークサービスを提供し、固定ネットワーク110に接続されたサーバ140と、画像/動画データの処理(例えば、符号化またはトランスコーディング)用であって、固定ネットワーク110に接続されたサーバ141と、例えば、画像/動画共有サービスのようなネットワークサービスを提供し、モバイルネットワーク120に接続されたサーバ142と、が示される。例えばコンピュータ140、141、142のような上述のデバイスのいくつかは、固定または無線ネットワーク110に存在する通信要素と共に、インターネットを構築するようなものであってもよい。
また、複数のエンドユーザデバイスが存在してもよい。当該デバイスは、携帯電話およびスマートフォン151、インターネットアクセスデバイス(インターネットタブレット)150、各種サイズおよび形式のパーソナルコンピュータ160、テレビおよびその他視聴用デバイス161、ビデオデコーダおよびプレーヤ162、ビデオカメラ163、およびその他エンコーダを含む。これらデバイス150、151、160、161、162、および163も、複数のパーツから形成されてもよい。各種デバイスは、インターネットへの固定接続170、171、172、180等の通信接続、インターネット110への無線接続173、モバイルネットワーク120への固定接続175、モバイルネットワーク120への無線接続178、179、182を介してネットワーク110および120に接続される。接続171から182は、通信接続の各端において、通信インタフェースに実現される。各種デバイスは、本稿記載の例にしたがって、画像およびビデオを生成、変換、送信、受信、復号、表示してもよい。
図1bは、画像またはビデオデータの符号化および復号(さらにトランスコーディング、すなわち、異なる形式での復号および符号化)用のデバイスを示す。図1bに示すように、サーバ140は、メモリ145と、1つまたは複数のプロセッサ146、147と、例えば、符号化および/または復号機能を実現するために、メモリ145内に存在するコンピュータプログラムコード148とを含む。異なるサーバ141、142は、各サーバに関する機能を利用するために、少なくともこれら同一の要素を含んでもよい。同様に、エンドユーザデバイス151は、メモリ152と、少なくとも1つのプロセッサ153、156と、例えば、デバイスカメラからの画像データの符号化または復号を実現するために、メモリ152内に存在するコンピュータプログラムコード154とを含む。エンドユーザデバイスは、例えば複数のフレームまたは静止画像を含むビデオストリームのような、画像データを取得する1つまたは複数のカメラ155および159を有してもよい。エンドユーザデバイスはさらに、音を拾うための、1つまたは2つ以上のマイクロフォン157および158をさらに含んでもよい。異なるエンドユーザデバイス150、160は、各デバイスに関する機能を利用するために、少なくともこれら同一の要素を含んでもよい。エンドユーザデバイスはさらに、グラフィカルユーザインタフェースを見るためのスクリーンを備えてもよい。エンドユーザデバイスおよびサーバはさらに、その他デバイスと通信するため、1つのモジュール内に実現される各種通信モジュールまたは通信機能を備えてもよい。
各種エンドユーザデバイスおよびサーバは、通信デバイスまたは通信機能を有するその他デバイスの形式であってもよい。例えば、デバイスは玩具、キッチン用電子機器等の家電、娯楽デバイス(テレビ、音楽/メディアデバイス)、さらにまたは建物、衣服、車両、または互いに通信するその他デバイスの一部であってもよい。
なお、異なる実施形態は、異なる要素内で、異なる部位が実施可能であることを理解されたい。例えば、画像データ(画像またはビデオ)の受信および変換は、すべてデバイス150、151または160のような1つのユーザデバイス、もしくは1つのサーバデバイス140、141、または142で実行されてもよいし、または複数のユーザデバイス150、151、160間、複数のネットワークデバイス140、141、142間、もしくはユーザデバイス150、151、160およびネットワークデバイス140、141、142の両方の間で実行されてもよい。例えば、画像データ(画像またはビデオ)は、単一のデバイスで形成および記憶されてもよい。画像データの符号化は、別のデバイスで行われ、復号はさらに別にデバイス(例えば、サーバ)で行われてもよい。例えば、機能を実行するための関連ソフトウェアが、単一のデバイスに存在してもよいし、上述のように複数のデバイス間に分散してもよい。これにより、例えば、デバイスはいわゆるクラウドを形成する。
異なる実施形態は、モバイルデバイスや、任意でサーバ上で動作するソフトウェアで実現されてもよい。携帯電話には、少なくともメモリ、プロセッサ、ディスプレイ、キーパッド、人感センサハードウェア、2G、3G、WLAN他等の通信手段が設けられてもよい。異なるデバイスは、タッチスクリーン(シングルタッチまたはマルチタッチ)のようなハードウェア、およびネットワーク・ポジショニングまたはグローバル・ポジショニング・システム(GPS)モジュール等の測位手段を有してもよい。デバイス上に、各種アプリケーションが存在してもよい。例えば、カレンダーアプリケーション、連絡アプリケーション、地図アプリケーション、メッセージアプリケーション、ブラウザアプリケーション、ギャラリーアプリケーション、ビデオプレーヤアプリケーション、さらにオフィスおよび/または個人用の各種その他アプリケーションである。デバイスは、その他デバイスと通信するための各種通信モジュールを有してもよい。
ビデオコーデックは、入力ビデオを記憶/送信に適した圧縮表現に変換するエンコーダと、圧縮ビデオ表現を、視聴可能な形式に解凍するデコーダとからなる。典型的には、エンコーダは、元のビデオシーケンスから一部の情報を破棄することで、よりコンパクトなビデオ表現にする(すなわち、より低いビットレートにする)。
典型的なハイブリッドビデオコーデック(例えば、ITU−T H.263およびH.264)は、ビデオ情報を二段階で符号化する。まずは、所与のピクチャ領域(または「ブロック」)における画素値を予測する。この予測は、例えば動き補償手段(符号化されているブロックに強く関連する、既に符号化されたビデオフレームの1つ内の領域を見つけ、示す)、または空間的手段(符号化されるブロックの周りの画素値を特定の方法で使用する)によって行われる。次に、画素の予測ブロックと、画素の元のブロックとの間の差分である予測誤差が符号化される。これは、典型的には、画素値間の差分を特定の手法(例えば、離散コサイン変換(DCT)またはその変形)で変換し、係数を量子化し、量子化された係数をエントロピー符号化することで実現される。量子化処理の性能を変更することで、エンコーダは画素表現の精度(ピクチャ品質)と、得られる符号化ビデオ表現のサイズ(ファイルサイズまたは送信ビットレート)との間のバランスを制御できる。
図2aはエンコーダと、それが実行する符号化方法を示す。図2aにおいて、符号化される画像Iが、エンコーダへの入力となる。入力画像は、静止画像またはビデオ信号のフレームでありうる。画像ブロックP'の予測表現は、入力される画像データから減算されて予測誤差信号Dが得られるように生成される。予測誤差信号は、変換Tおよび量子化Qにより符号化される。逆量子化Q−1および逆変換T−1により得られた再構成された予測誤差信号D'が、仮再構成画像I'を生成するために使用される。画像ブロックP'の予測表現は、モードに応じて(モード選択MS)、イントラ予測Pintraまたはインター予測Pinterにより取得されうる。インター予測において、適宜フィルタリングFおよび参照フレームメモリRFMを使用して、最終再構成画像R'を記憶する。参照フレームメモリ内の画像は、デコーダにより、復号処理の結果として最終的に得られた画像に対応する。変換、量子化後の予測誤差、モード選択、およびその他符号化パラメータは、エントロピーエンコーダEによりエントロピー符号化される。得られたビットストリームは、記憶または送信され、その後デコーダにより復号できる。
図2aに示すようなエンコーダは、符号化画像データを復号して、復号画像データが予測処理に使用できるようにするデコーダを備えてもよい。復号画像データは、例えば、参照ピクチャバッファのようなバッファに記憶される。エンコーダが予測により入力ビデオデータを復号する場合、バッファからのバッファされた復号データが使用される。エンコーダはさらに、より高速処理を実現するため、入力ビデオデータを予測の基礎としてもよい。しかし、そのような手法の場合、デコーダが予測の基礎として使用する符号化および復号ビデオデータは、エンコーダにより使用される入力ビデオデータと異なるため、符号化誤差が生じてしまう。
HEVC[1]等のいくつかのビデオコーデックでは、ビデオピクチャはピクチャの領域を網羅する複数の符号化単位(CU)に分割される。CUは、当該CU内のサンプルに対する予測処理を定義する1つまたは複数の予測単位(PU)と、当該CU内のサンプルに対する予測誤差符号化処理を定義する1つまたは複数の変換単位(TU)とからなる。典型的には、CUはサンプルの、正方形または長方形ブロックからなる。そのサイズは、所定組の可能なCUサイズから選択可能である。典型的には、設定可能な最大サイズを有するCUは、最大符号化単位(Largest Coding Unit:LCU)、またはコーディングツリーユニット(Coding Tree Unit:CTU)と称され、ビデオピクチャは非重複のCTUに分割される。CTUはさらに、より小さなCUの組合せに分割できる。例えば、これはCTUや結果として得られたCUを再帰的に分割することで実現される。典型的には、得られたCUはそれぞれ、少なくとも1つのPUと、これに関連付けられた少なくとも1つのTUとを有する。各PUおよびTUは、それぞれ予測処理および予測誤差符号化処理の粒度を増すために、さらにより小さなPUおよびTUに分割できる。各PUは、それに関連付けられた予測情報を有する。この情報は、当該PU内の画素にどのような予測が適用されるかを定義するものである(例えば、インター予測PUのための動きベクトル情報と、イントラ予測PUのためのイントラ予測方向性情報)。同様に、各TUは、当該TU内のサンプルのための予測誤差復号処理を示す情報に関連付けられる(例えば、DCT係数情報を含む)。典型的には、各CUについて予測誤差符号化が適用されるか否かが、CUレベルでシグナリングされる。CUに関連付けられた予測誤差残差がない場合、当該CUに対するTUが存在しないと考えられる。典型的には、画像のCUへの分割、CUのPUおよびTUへの分割が、ビットストリームでシグナリングされる。これにより、デコーダは、これら単位の所望の構造を再生できる。
インター予測(時間予測とも称されうる)、動き補償、または動き補償予測により、時間的冗長性が低減する。インター予測の基となるのは、以前に復号されたピクチャである。イントラ予測は、同一のピクチャ内の隣接画素が相関する可能性が高いという事実を利用する。イントラ予測は、空間または変換領域内で実行できる。すなわち、サンプル値も変換係数も予測可能である。典型的には、イントラ予測はイントラ符号化で利用され、その場合、インター予測は適用されない。
符号化手順により得られるものの1つとして、動きベクトルおよび量子化変換係数等の符号化パラメータ組が挙げられる。多くのパラメータは、まずは空間または時間的に隣接したパラメータから予測することで、より効率的にエントロピー符号化できる。例えば、動きベクトルを空間的に隣接した動きベクトルから予測し、動きベクトル予測子に関する差分のみを符号化してもよい。1つまたは複数の静止画像の符号化の場合、その結果としての出力は画像ビットストリームと称され、ビデオの符号化の場合、その結果としての出力はビデオビットストリームと称されてもよい。
デコーダは、画素ブロックの予測表現を生成するエンコーダと同様の予測手段を適用し(エンコーダにより生成され、圧縮表現に記憶された動きまたは空間情報を利用する)、予測誤差復号(空間画素領域内の、量子化予測誤差信号を回復する予測誤差符号化と逆の処理)を適用して、出力ビデオを再構成する。予測および予測誤差復号手段を適用した後、デコーダは予測と予測誤差信号(画素値)とを加算して、出力ビデオフレームを生成する。デコーダ(およびエンコーダ)は、追加的なフィルタリング手段を適用して、表示および/またはビデオシーケンスにおける後続のフレーム用の予測参照としての記憶のために送る前に、出力ビデオの品質を向上してもよい。
図2bは、デコーダとそれによる復号方法を示す。図2bにおいて、入力ビットストリームが、エントロピーデコーダE−1により復号されて、予測誤差信号および復号モード情報が得られる。予測誤差は、逆量子化Q−1および逆変換T−1により復号されて、再構成予測誤差信号D'が得られる。モードに応じて、イントラまたはインター予測Pを利用した画素予測により、画像ブロックP'の予測表現が得られる。参照フレームメモリRFMにより、既に復号されたピクチャが記憶される。再構成予測誤差信号D'と、画像ブロックP'の予測表現から、仮再構成画像I'が得られる。この仮再構成画像I'はイントラ予測において使用可能で、フィルタリングFを通じて最終再構成画像R'を取得するために使用可能である。出力された最終再構成画像R'は、参照ピクチャメモリRFMに記憶され、ユーザに表示されてもよい。
H.264/AVCおよびH.265エンコーダの入力と、H.264/AVCおよびH.265デコーダの出力それぞれの基本単位はピクチャである。ピクチャは、フレームまたはフィールドでありうる。フレームは、輝度サンプルと、対応する彩度サンプルの行列を含む。フィールドは、フレームの交互のサンプル行の組であり、ソース信号がインタレースされる場合に、エンコーダ入力として使用されうる。H.264/AVCおよびH.265において、マクロブロックは輝度サンプルの16×16ブロックと、対応する彩度サンプルのブロックである。例えば、4:2:0サンプリングパターンにおいて、マクロブロックは、各彩度成分について彩度サンプルの8×8ブロックを1つ含む。H.264/AVCおよびH.265において、ピクチャは1つまたは複数のスライス群に区画され、各スライス群は、1つまたは複数のスライスを含む。H.264/AVCおよびH.265において、スライスは整数個のブロックからなる。
符号化サンプル値を示すためにサンプル値予測および変換符号化を利用する手法に代えて、または加えて、カラーパレット式符号化を利用してもよい。パレット式符号化とは、色と関連指標の組であるパレットが定義され、符号化単位内の各サンプルの値が、パレット内の対応する指標を示すことで表現される、複数の同様の手法である。パレット式符号化によると、比較的少ない色数で(テキストやシンプルなグラフィックのような、コンピュータ画面コンテンツを示す画像領域等)、符号化単位内で高い符号化効率を実現できる。パレット符号化の符号化効率を向上するために、異なる複数の種類のパレット指標予測手法を利用してもよい。あるいは、パレット指標は、効率的により大きな同種画像領域を示すことが可能なように、ランレングス方式で符号化されてもよい。また、CUが当該CU内で繰り返さないサンプル値を含む場合、エスケープ符号化を利用してもよい。エスケープ符号化されたサンプルは、いずれのパレット指標も参照することなく送信される。その代わりに、その値は、各エスケープ符号化サンプルについて個別に示される。
典型的なビデオコーデックでは、動き情報は、各動き補償画像ブロックに関連付けられた動きベクトルにより示される。これら動きベクトルは、符号化される(エンコーダ側)または復号される(デコーダ側)ピクチャにおける画像ブロックの、既に符号化または復号されたピクチャの1つにおける予測ソースブロックに対するずれを示す。動きベクトルを効率的に表すために、これらは典型的にはブロック固有予測動きベクトルに対して異なる符号化がなされる。典型的なビデオコーデックにおいては、予測動きベクトルは所定の方法で生成される。例えば、隣接した複数のブロックの符号化または復号動きベクトルの中央値を取るのである。動きベクトル予測を生成する別の方法として、時間参照ピクチャにおける隣接したブロックおよび/または同位置のブロックからの予測候補リストを生成し、選択された候補を動きベクトル予測子としてシグナリングしてもよい。動きベクトル値の予測に加えて、既に符号化/復号ピクチャの参照インデクスを予測してもよい。典型的には、参照インデクスは時間参照ピクチャにおける隣接したブロックおよび/または同位置ブロックから予測される。さらに、典型的な高効率ビデオコーデックは、追加的な動き情報符号化/復号メカニズムを利用する。これはいわゆるマージング/マージモードと呼ばれるものであって、あらゆる動きフィールド情報(各利用可能な参照ピクチャリストに対する動きベクトルと、対応する参照ピクチャインデクスとを含む)が、変更/修正を一切介さずに、予測、使用される。同様に、動きフィールド情報は、時間参照ピクチャにおける隣接したブロックおよび/または同位置ブロックの動きフィールド情報を使用して予測される。使用される動きフィールド情報は、利用可能な隣接/同位置ブロックの動きフィールド情報で満たされた動きフィールド候補リスト内でシグナリングされる。
典型的には、ビデオコーデックは、1つのソース画像からの動き補償予測(単方向予測)と、2つのソースからの予測(双方向予測)に対応する。単方向予測の場合、単一の動きベクトルが適用される。双方向予測の場合、2つの動きベクトルがシグナリングされ、2つのソースからの動き補償予測が平均化されて、最終サンプル予測が生成される。重み付け予測の場合、2つの予測の相対重みが調整できる。またはシグナリングされたオフセットを予測信号に加えることができる。
インターピクチャ予測用に動き補償を適用することに加え、イントラピクチャ予測に同様の手法を適用できる。この場合、変位ベクトルが、符号化または復号されるブロックの予測を生成するために、サンプルのブロックが同一のピクチャのどこからコピーできるかを示す。このようなイントラブロックコピー手法は、テキストまたはその他グラフィックのような、フレーム内の繰返し構造が存在する場合、符号化の効率を大幅に上げることができる。
典型的なビデオコーデックは、動き補償またはイントラ予測後の予測残差はまず変換カーネル(DCT等)により変換されて、その後符号化される。この理由は、残差間はある程度相関することが多く、変換はこの相関の低減に寄与する場合が多く、符号化の効率化が図られるためである。
典型的なビデオエンコーダは、ラグランジュ費用関数を利用して、理想的な符号化モード、例えば所望のマクロブロックモードと、これに関連付けられた動きベクトルとを見つける。この種の費用関数は、重み係数λを利用して、非可逆符号化方法に起因する(正確な、または推定された)画像歪みと、画像領域内の画素値を表すのに必要な(正確な、または推定された)情報量とを結びつける。
C = D + λR (数1)
式中、Cは最小化されるラグランジュ費用、Dはモードおよびベクトルを考慮した画像歪み(例えば平均平方誤差)、Rはデコーダ内で画像ブロックを再構成するのに必要なデータを表すのに要するビット数(候補動きベクトルを表すデータ量を含む)を表す。
スケーラブルなビデオの符号化は、1ビットストリームが異なるビットレート、解像度、またはフレームレートの複数のコンテンツ表現を含みうる、符号化構造を指す。このような場合、受信側は、その特性に応じて、所望の表現を抽出できる(例えば、ディスプレイデバイスに最も適した解像度)。あるいは、サーバまたはネットワーク要素が、例えばネットワーク特性または受信側の処理能力に応じて、受信側に送られるビットストリームの一部を抽出できる。典型的には、スケーラブルビットストリームは、「ベース層」と、1つまたは複数の強化層とからなる。ベース層は、可能な最低画質ビデオを提供するものである。1つまたは複数の強化層は、低層と共に受信、復号された際に、ビデオ品質を上げるものである。典型的には、強化層の符号化効率を上げるために、当該層の符号化表現は、低層に依存する。例えば、低層から、強化層の動きおよびモード情報を予測可能である。同様に、低層の画素データを利用して、強化層の予測を生成できる。
画質スケーラビリティ(いわゆる信号雑音比またはSNR)および/または空間スケーラビリティ用のスケーラブルビデオコーデックは以下のとおり実現される。ベース層に対して、従来の非スケーラブルビデオエンコーダおよびデコーダが使用される。ベース層の再構成/符号化ピクチャは、強化層用の参照ピクチャバッファに含まれる。インター予測用の(1つまたは複数の)参照ピクチャリストを利用するH.264/AVC、HEVC、および同様のコーデックにおいては、ベース層復号ピクチャを、(1つまたは複数の)参照ピクチャリストに挿入して、強化層の復号参照ピクチャ同様に強化層ピクチャの符号化/復号を実行してもよい。したがって、エンコーダはベース層参照ピクチャを、インター予測参照として選択し、典型的には、符号化ビットストリーム内の参照ピクチャインデクスにより、その使用を示す。デコーダは、ビットストリームから、例えば、参照ピクチャインデクスから、ベース層ピクチャが、強化層に対するインター予測参照として使用されることを復号される。復号ベース層ピクチャが、強化層に対する予測参照として使用される場合、それはレイヤ間参照ピクチャと称される。
画質スケーラビリティに加えて、以下のスケーラビリティモードが存在する。
・空間スケーラビリティ:ベース層ピクチャが、強化層ピクチャよりも低解像度で復号される。
・ビット深度スケーラビリティ:ベース層ピクチャが、強化層ピクチャ(例えば10または12ビット)よりも低いビット深度(例えば8ビット)で符号化される。
・彩度形式スケーラビリティ:強化層ピクチャが、彩度に関して、ベース層ピクチャ(例えば4:2:0形式)よりも高い忠実度(例えば4:4:4彩度形式で符号化)となる。
すべての上述のスケーラビリティにおいて、ベース層情報を使用して、追加ビットレートオーバーヘッドを最低限に抑えるように、強化層を符号化することができる。
スケーラビリティは、2つの基本的な方法で実現可能である。すなわち、スケーラブル表現の低層から、画素値またはシンタクスの予測を実行する新しい符号化モードを導入するか、高層の参照ピクチャバッファ(復号ピクチャバッファ(Decoded Picture Buffer:DPB))に対する低層ピクチャに配置するのである。前者の方がより柔軟で、大抵の場合、より高符号化効率を実現できる。一方で、後者の、参照フレーム式スケーラビリティの場合、実現可能な符号化効率ゲインの大部分を損なわずに、単層コーデックに対して最小の変化で、極めて効率的に実現できる。基本的に、参照フレーム式スケーラビリティコーデックは、DPB管理を外部手段に任せるだけで、全層に対して、同じハードウェアまたはソフトウェア実装を利用して、実現できる。
並行処理を利用可能にするため、画像を、個別に符号化、復号可能な画像セグメント(スライスまたはタイル)に分割できる。スライスは、典型的には、初期の符号化または復号順序で処理される、所与の数の基本符号化単位から構成される画像セグメントである。タイルは、典型的には、少なくともある程度は個別フレームとして処理される長方形画像領域として定義された画像セグメントを指す。
従来の方向性イントラ予測では、ブロックの上から−45から+45度、左から−45から+45度の範囲に、利用可能な方向組が限定される。斜め右上から斜め左下に広がるこの180度範囲は、従来の正方形イントラ予測ブロックには十分である。例えば、H.264/AVCおよびH.265/HEVCビデオの符号化規格は、正方形予測ブロックおよびイントラ予測方向による従来の空間イントラ予測を使用する。その範囲は、ブロックの上から−45から+45度、左から−45から+45度となる。
図3aは、H.265/HEVCビデオの符号化規格で使用されるイントラ予測方向組を示す。左の境界からの水平予測と、上の境界からの垂直予測との数値は、−32から+32の範囲で、1/32サンプル精度で、サンプル距離毎に、投影差分を定義する。言い換えると、方向性イントラ予測に利用される参照画素(1つまたは複数)は、利用される予測およびイントラ予測方向に利用される境界からの水平および垂直距離により決定できる。例えば、+32という値は、予測サンプルと、参照サンプルとの間の各サンプル単位についての+32/32参照位置変位に対応する(すなわち、+45度予測角度を利用)。別の例として、水平予測の−17という値は、(垂直)境界から4画素から離れた画素が、予測される画素に対して−68/32の参照位置を有することを意味する。すなわち、予測される画素が存在するレベルから、2番目と3番目の画素の間に参照画素位置があり、予測される画素の値は、2番目と3番目の画素値の重み付け平均として(28×a+4×a)/32で得られる。一般的に、イントラ予測方向を使用して、参照画素または予測用画素を決定する。参照画素(1つまたは複数)は、予測された画素値の決定に利用される。これは例えば、参照画素値の重み付け平均による。ブロック境界(またはブロック境界の延長上)に直接隣接する画素を参照画素として利用できる。さらに/あるいは、ブロック境界からさらに離れた画素も利用できる。
図3bは、予測ブロック内の各サンプルが、予測処理において、同じ予測方向を利用する手法を示す。図3bにおいて、丸い画素は、予測サンプルのブロックを示し、黒い四角は、参照サンプルの行を示す。さらに、図3bは、固定予測方向の、第1および第2サンプル行についての予測投影を示す。上述のように、真上の参照サンプルからのずれが計算されることで、予測サンプルの第1列について、ずれはdとなり、予測サンプルの第2列について、ずれは2dとなり、以下同様となる。
図3cは、参照行からの予測対象サンプル行の距離に応じて変化するイントラ予測方向を適用する場合を示す。図3cにおいて、予測投影は、参照サンプルからの垂直距離に基づいて評価される。第1、第2、第3、第4行のずれは、d、d+d、d+d+d、d+d+d+dとなる。ずれの増分d、d、d、dは大きさが異なる。例えば、大きさが大小する。言い換えると、予測対象ブロック内の予測方向は可変である。例えば、予測対象の第1行の予測方向が決まっており、その第1予測方向から、その他の行の予測方向が計算されてもよい。
図3dは、ブロックレベルで同様の手法を適用する場合を示す。予測された画素値の各4×4予測ブロックは、ブロックの位置に基づいて計算されている明確な予測方向を有する。ブロックの第1行のブロックは、当該ブロックの上方の参照サンプルを予測の参照に使用できる。ブロックの第1行のブロックより下方のブロックは、それらの真上のブロック内のサンプルを予測の参照に使用できる。各ブロックは、その予測方向が個別に、互いの相対ブロック位置に基づいて(あるいは、定義された原点に対して)決定されている。したがって、予測方向はブロック間に変化する場合があり、予測対象画素の第1行のずれは、ここではd、d、d、dとなる。
上述のように、重み付け平均を利用して、参照画素値から予測された画素値を取得してもよい。一行の参照画素に加え、複数行の参照画素を利用してもよい。予測処理の目的は、一貫性があり、平滑な予測ブロックを提供することで、残りの予測誤差信号を効率的に符号化できるようにすることであると理解されたい。実際、エンコーダは異なる複数の予測方向でブロックを符号化し、最高の符号化効率が得られる予測方向を選択してもよい。
利用可能な方向性予測方向(方向性予測モードとも称する)は、方向性予測モード組を形成するものと理解できる。例えば、H.265/HEVCビデオの符号化規格で利用される方向性イントラ予測方向組または方向性イントラ予測モード組は、水平予測では−32、−26、−21、−17、−13、−9、−5、−2、0、+2、+5、+9、+13、+17、+21、+26、+32で、垂直予測では−32、−26、−21、−17、−13、−9、−5、−2、0、+2、+5、+9、+13、+17、+21、+26、+32である。方向−32は、水平および垂直予測方向に一致する。図3aにおいて、水平予測における方向+32は、+32垂直予測方向と真逆である。別の予測方向組も利用できる。例えば、共同探索テストモデル4(Joint Exploration Test Model:JEM4)は、イントラ予測方向がH.265/HEVCと同じ角度範囲で、四角(正方形および非正方形)予測ブロックに対応する。ただし、H.265/HEVC方向間により多くの予測方向が導入される。
図3aに示すように、予測の左上方向は、予測対象の正方形ブロックの中心から、当該ブロックの左上角への、45度方向であると理解できる。左上方向は、より一般的には、水平(左)および垂直(上)方向の間の、左上への45度方向として理解されたい。この左上方向を参照として利用でき、例えば図3aにおけるすべての予測方向が、左上方向に対して0度、鋭角(90度未満)、または直角(90度)のいずれかとなる。図3aにおいて、角度αは、水平予測方向(ブロックの左の参照サンプルからの予測)を示し、角度βは、垂直予測方向(ブロックの上方の参照サンプルからの予測)を示す。図3aにおける破線は、境界の水平および垂直境界またはその境界の延長戦と、左上方向に対する直角(90度)線を示す。小図中の数字は、予測方向についての大図の数字に対応する。小図における表記に応じた図形は、後続の図でも使用される。
ただし、非正方形ブロックの場合、特に予測ブロックの水平および垂直寸法間の比率が大きい場合、この図3aの予測方向の選択は不十分となりうる。例えば図3aのような従来のイントラ予測モードにおいて、非正方形予測ブロックの場合、0と+45度との間の方向(完全垂直方向と、右上からの45度予測との間、または完全水平方向と、左下方向からの45度予測)においてブロックの境界のいずれに対して直接繋がりのない大量の有効な参照サンプルがありうる。これらの場合、予測方向を180度「反転」または回転し、ブロックの別の境界上の参照サンプルを使用して(左境界ではなく上境界、または上境界ではなく左境界)、同様の方向構造での予測サンプルブロックが、予測サンプルと元のサンプルとが高相関で生成できる。ここから、従来の−45から+45を超えて、垂直および水平予測に対する角度範囲に延びる、すなわち、左上方向から−90から90度を超えて延びる予測方向組の利用が可能となる。新たなイントラ予測方向による符号化効率をさらに向上するため、これら広角イントラ予測方向はビットストリームでシグナリングされてもよいし、組み合わせて双方向予測イントラブロックを生成できることをここで説明する。
ここで、従来の水平または垂直方向から45度よりも広がる、すなわち、左上方向から鈍角になるように広がるイントラ予測方向組を利用した(広角予測)ビデオ/画像符号器が提供される。利用可能な予測モード(方向)は、予測単位の形状に基づいて選択されてもよい。例えば、予測単位のより狭い方向からの狭角が反転されて、広角予測方向が利用できるようにする。ブロックの概略方向性を最初に示すモード情報が、ビットストリームにおいて符号化されてもよい(これは、後続の予測単位の方向性予測に使用できる)。この概略予測方向性に対して、その方向性の互いに反対の2方向が、いずれも予測モードとして利用可能であるか確認される。両方が利用可能であると確認されると、その2方向のいずれが使用されるかが示される。基本方向および広角方向は、ブロックの形状または寸法に基づいて、確率が異なりうる。
以下に、広角予測を説明する。すなわち、予測対象画素の左上方向に対して鈍角内の参照サンプルを利用した予測である。図4aは、予測対象ブロックPと、予測処理の参照に利用可能な再構成済み領域Rと、まだ処理されていない利用不能領域Uとを有する画像を示す。
図4bは、ブロックの左および上境界上の参照サンプルを示す。既に復号された参照サンプルを、黒円で示す。利用不能な参照サンプルを、白円で示す。そのような利用不能な参照サンプルは、まだ復号/処理されていない、または画像縁の先にありうる。当該利用不能な参照サンプルは、同じ境界上の最近傍の利用可能参照サンプルのパディング、すなわち最近傍の利用可能参照サンプル等の利用可能参照サンプルからの値をコピーすることで生じうる。予測方向が左上方向から直角内にあれば、水平および垂直方向のいずれにおける、参照サンプルの必要数は、w+h+1となる。これは、垂直予測において、真上からの最大ずれが、ブロックの高さhと等しく(45度右上予測方向)、ブロックの幅がwであるためであり、水平予測も同様の論理となる。左上角の画素は常に必要である。
図4cは、非正方形予測ブロックを示し、ブロックの最も右のサンプルについて水平+45度予測を示し(長い矢印)、ブロックの最も右のサンプルについて垂直+45度予測を示す(短い矢印)。図示のように、利用不能な参照画素(最も下)は1つのみである。
図4dは、非正方形予測ブロックと、0から+45度の間の角度の(すなわち左上方向に対して鋭角である)水平予測(長い矢印)と、その反転モード(広角モード)である、+45度を超える角度の(すなわち左上方向に対して鈍角である)垂直予測(短い矢印)を示す。図示のように、追加参照サンプル410(または黒い塗り潰しパターンで示す、2つ以上の追加参照サンプル)を上の行で使用する。これにより、広角方向(短い矢印)からの予測が可能となる。このような長方形の非正方形ブロックに対する広角、すなわち鈍角方向性イントラ予測の場合、広角予測に利用される参照画素(図4dの最も右の画素410)が予測対象ブロックの多くの画素により近くなるという利点がある。すなわち、狭角方向における基本参照サンプル(図4dの下から3つ目の参照画像420)よりも、予測対象画素に対してより高い相関が得られるのである。
従来の角度を利用する場合(図3aにおける−32から+32の方向)、例えば、利用できるのはせいぜいw+h個の「上および右上」参照サンプルと、左上角サンプル1つである。広角モードの場合、それ以上に必要となる。上のw+h個のサンプルを超えるサンプルについて、参照サンプルとして利用可能かを確認してもよい。あるいは、そのような「遠い」参照サンプルは、利用不能として捉えられ、それらの代わりに、利用可能と示された再近傍の参照サンプルを利用してパディング(コピー)された値を使用してもよい。
図5aは、方向性イントラ予測モード(方向)組を示す。対応する広角モード520、522、525、527を(それぞれ)有する元モード510、512、515、517を丸点で示し、対応する広角モードを四角点で示す。このような基本モードと広角モードは、いわゆる広角方向性イントラ予測対をなすものと理解されたい。ここでは、(510、520)、(512、522)、(515、525)、(517、527)の各対である。これら対は、例えば狭角モードで示される関連概略方向性を有してもよく、対(510、520)に対しては+21等となる。また、+45度水平および垂直モード(図5aにおいて、+32サンプル変位が示される)は、基本モード−広角モード対として表されうる。これは、概略方向性(+32)と、さらに従来の2つの個別モードの表現の代わりに、2方向のいずれを有効にするかを指定するものである。
図5b、5c、5d、5eは、関連付けられた広角モードのいくつかの例を示す。図5bの左図では、基本(鋭角)モード530の正反対に「反転された」広角モード540を示す。広角モード540の左上方向に対する角度は、基本モード530から得られる。具合的には、180度から基本モード角度を減算することで得られる。すなわち、基本モード角度がαで鋭角だとすると、左上方向に対する広角モードの角度は180°−αとなる。図5bの右図に示すように、広角モード542は対応する基本狭角(鋭角)モード532の正反対でなくてもよく、略反対、あるいは正反対ではないが反対側でありうる。言い換えると、広角モードとは、左上方向(図5bで強調されている方向)に対して鈍角となる方向を有し、左上方向に対して基本モードの反対側にあるものであってもよい。
図5c(左画像)は、基本(狭角)モードおよび広角モードとの間の、対を形成しない対応関係を示す。例えば、同じ広角モード560に関連付けられた2つの基本モード(狭角モード)550、552がありうる。これにより、異なるモードの数が減ることで、符号化効率が向上しうる。さらに、これにより予測ブロックに近い参照画素の選択が可能となりうる。同様に、1つの基本狭角モード555に対して、2つ以上の広角モード565、567が関連付けられうる。これにより、関連付けられた広角モードがある基本モードの数が減ることにより、符号化効率の上昇が図られうる。
図5dは、方向性予測広角モード組の概念を示す。広角モード組は、四角で示されており、広角モード組580、582、584を含む。これら広角モードは、丸で示される基本モード570、572、574に関連付けられてもよい。このような広角モード組は、ビットストリームで通信されてもよい。定義され、ビットストリームで通信される広角モード組が複数ありうる。符号化および復号に使用される広角モード組は、広角モード組インジケータと共に、ビットストリームで通信されてもよい。当該インジケータは、例えばピクチャヘッダまたはスライスヘッダ、あるいはピクチャまたはスライスから参照されるパラメータ組に配置されてもよい。
図5eは、1つまたは複数の広角モード組が使用されうることを示す。例えば、モード590、591、592は、1つの広角モード組内にあり、モード595、596、597が別のモード組内にあってもよい。符号化および復号において、これらのモード組は、使用されるモード組が直接ビットストリームで通信され、そのモード組からのモードがビットストリームで通信されるように使用されてもよい。
本発明に係るビデオまたは画像デコーダまたはエンコーダは、予測モード組に対する従来の制限である+45度よりも大きい角度の空間イントラ予測方向を含んでもよい。これは、従来の正方形予測ブロックに対してもある程度有効だが、非正方形の長方形予測ブロックで特に有効であることが確認されている。すなわち、従来の予測方向のいくつかは、ブロックの狭角側の方向に適用されると、予測ブロックの境界から、多くの参照サンプルが切り離されることが確認されている。同様の方向性のテキスト構造を、略逆方向から生成できる(予測方向を、正確に、または略180度「反転」または回転することによる)。そのような動作により、予測ブロックに対して、多くの参照サンプルがより近く隣接するため、統計的により良い予測が提供でき、その結果、符号化効率ゲインが確認される。
完全水平または完全垂直に対して、+45度を超える方向性の広角予測モードの場合、直接予測が従来のイントラモード符号化手段で符号化できる。すなわち、これらは利用可能な予測モードのリストに追加でき、これらモードそれぞれに、個別モード番号が割り当てられる。復号イントラ予測モードが広角モードを参照する場合、イントラ予測処理において、示された方向からのサンプル予測が実行される。非正方形予測ブロックの場合、この処理が修正され、ブロックの形状が復号処理の一部として考慮されることが有利である。これを実現する一つの可能性として、ブロックの長手方向となる主方向に対してのみ、+45度を超える方向性方向性の広角モードを含めることが考えられる。例えば、予測ブロックの幅が16サンプルで、予測ブロックの高さが4サンプルである場合、方向性イントラ予測モードの組は、−45から+45度内の角度の狭角水平モードと、−45から+45度内の角度の狭角垂直モードと、+45度を超える角度の1つまたは複数の広角垂直モード(例えば図5eに示す)とを含むように構成される。さらに、広角モードの数と方向性もブロックの形状に依存してもよい。例えば、幅と高さの比率が2:1である場合に、利用可能なモードのリスト内に所与の数の広角方向が含まれ、比率が4:1であれば、別の数の広角方向が同リストに含まれてもよい。同様に、予測ブロックの形状により、ブロックについての利用可能なモードのリスト内に、いくつの狭角モード(−45から+45度)が含まれるかが定義されてもよい。例えば、これにより、ブロックが細長いほど、より多くの広角モードが含まれる。なお、広角(鈍角)方向を選択することで、予測対象の非正方形ブロックの場合に、鋭角予測方向よりも、より信頼性の高い予測が実現できうる。
広角モードを示す1つの可能性として、あらゆるブロックサイズに対して、−45度から+45度の範囲の角度の従来の狭角イントラ予測方向組を有効にし、ブロック形状に応じて関連付けられた「反転」広角モードを有する狭角モードを判定してもよい(図5dに示す)。このようにして、デコーダはまずブロックの概略方向性を定義する狭角予測モードを復号し、当該モードが関連付けられた広角モードを有するモードを示す場合、追加識別子「基本モードの代わりに広角モードを使用」をさらに復号してもよい。当該識別子は、モードが従来の狭角モードとして解されるか、反転広角モードとして解されるかを定義する。この種の手法は、最終的な予測モードの予測に対して狭角モードが使用できるため、便利である。すなわち、ブロックに対してサンプル予測処理が生成するテキスチャの方向性を定義する。+45度を超える角度の広角方向を、単純に独立したモードとして予測モードのリストに追加する場合、結果として得られるモードのリストは、同じ方向性を生成し、異なる参照サンプルを有するモード対を含む。これにより、後続のブロックの方向性予測の信頼性が下がりうる。
別の形態として、予測ブロックに対して利用可能なイントラ予測モードの数を一定として、指定されたモード数を、デコーダは予測ブロックの形状に応じて可変に解釈してもよい。例えば、予測モードに関連付けられたいくつかの方向は、ブロックの形状に応じて、正確に、または略180度「反転」されてもよい(図5b参照)。例えば、図5aを参照して、予測ブロックの幅が高さより大きい場合、変位パラメータ+21および+26に関連付けられた水平狭角予測は、それぞれ変位パラメータ+48および+39の垂直広角モードとして解することができる(その左よりも上の参照サンプルに対して、予測ブロックの相対距離が短いため、垂直予測がより良く働くと考えられるため)。同様に、予測ブロックの幅が高さより小さい場合、変位パラメータ+21および+26に関連付けられた垂直狭角予測は、それぞれ変位パラメータ+48および+39の水平広角モードとして解することができる。これら予測方向の選択は例示的であり、実際には異なる数の、狭角と反転広角の変位パラメータが異なるモードを、広角候補として選択できる。
別形態として、予測ブロックに利用可能なイントラ予測モードの数を一定にして、予測ブロックの形状または寸法に基づいて、モードのエントロピー符号化および復号を変更してもよい。例えば、主方向性が異なる予測方向を復号するため、計算デコーダは、異なるコンテキストを利用してもよい。デコーダはまず、ビットストリームから水平、垂直主方向のいずれを使用するかの指標を読み、主予測方向と、ブロックの形状に基づいて、異なるテキストモード間を切り替えてもよい。あるいは、最も可能性の高いモード予測(すなわち、選択された予測モードが優先モードの1つであることを示すシンタクス要素を有する)を利用する手法の場合、優先モードリストは、ブロックの形状に基づいて構成されてもよい。例えば、予測ブロックの幅が高さよりも大きい場合、水平候補の前またはその代わりに垂直候補モードが組に含まれてもよい。ブロックの幅が高さよりも小さい場合、垂直候補の前またはその代わりに水平候補モードがリストに含まれてもよい。
言い換えると、ブロック形状についての情報は、使用される広角方向性予測モードの数、使用する広角方向性予測モード、使用する広角方向性予測モード組、異なるモードの可能性等に影響しうる。このようにブロック形状の情報を利用することで、符号化効率の向上が図られうる。これは、情報のすべてを明確に符号化する必要はなく、より可能性の高いパラメータ値に割り当てられるコードワードをより短くすることができるためである。
ブロック形状に基づいて、最も可能性を高いモードを選択することは、従来の狭角イントラピクチャ方向性予測と共に利用されてもよい。
所定の精度で、元のモードの逆を利用することで、元の狭角モードの変位パラメータから、「反転した」広角変位パラメータを計算できる(図5b左パネル参照)。例えば、精度1/32サンプルの変位パラメータの場合、次の整数計算により、元の狭角変位パラメータdNから、広角変位パラメータdWが計算できる。
inverseAngle(dN)=(256×32)/dN
dW=32×inverseAngle(dN)>>8
式中、>>はビットシフト演算を示す(これは、計算構造に応じて、略切り捨てまたは四捨五入される、1024/dNの計算結果に対応しうる)。このようにして「反転した」広角変位パラメータを定義することで、dWの最終計算において、パラメータが2の冪乗になりえない割り算を避けられるという利点がある。これにより、inverseAngle(dN)の中間値が事前計算でき、メモリバッファに記憶されて、エンコーダまたはデコーダによりdWの評価が必要である際に使用される。異なる方法でdWを定義してもよい。例えば、dNに対して、線形または逆依存性を有さなくてもよい。dNの値に応じて、エンコーダと対応するデコーダにおいて、経験則により求められ、同じ値に設定されてもよい。
別形態として、1つの狭角モードに複数の広角モードが関連付けられてもよいし、1つの広角モードに2つ以上の狭角モードが関連付けられてもよい(図5c参照)。エンコーダおよびデコーダはさらに、狭角モードと、関連付けられた広角反転モードのサンプル予測を組み合わせて予測を生成することで、双方向予測サンプルを生成してもよい。これは例えば、予測サンプルを参照サンプルからの距離に基づいて重み付けすること、またはその他の手法により実現してもよい。双方向予測の場合にも、またはより一般的には単方向予測の場合、広角モードに対するずれ指標があってもよい。これにより、ブロックの所望のテキスチャ構造により良く一致するように調整できる。
従来の−45から+45度の狭角予測は、予測ブロックの左上角から、最大でブロック幅+ブロック高さ分だけ離間した参照サンプルが必要である(図2bおよび図2cに示す)。+45度を超える広角予測の場合、より離間した参照サンプルがいくつか必要となりうる。一つの可能性として、パディングを使用して(最近傍の利用可能参照サンプルの値をコピーする)、ブロックの左上座標からブロック幅+高さよりも大きな距離の参照サンプルを生成できる。別の可能性として、狭角参照サンプルの範囲について利用されたものと同様の利用可能条件の、処理済みサンプルを利用できる。
予測ブロックの品質をさらに向上するため、フィルタリングやその他の調整動作を、広角イントラモードと利用するサンプル予測の前(例えば、参照サンプル用)または後に実行してもよい(例えば、予測ブロックの側部または内部をフィルタリング)。
ビデオまたは画像デコーダはさらに、(完全に水平または完全に垂直方向である)主予測方向に対して−45度から+45度の間の角度を有する狭角方向性イントラ予測モードと、主予測方向に対して+45度を超える角度の広角モードとの間で選択するように構成されてもよい。
+45度以上の角度の1つまたは複数の広角予測モードが利用可能かは、予測ブロックの形状に依存する。
ビデオまたは画像デコーダは、予測モード識別子を復号し、復号モードに関連付けられた利用可能な「反転」モード(広角モード)があるかを確認し、その確認に基づいて、元の予測方向か、その逆方向を利用するかを判定する第2識別子を復号する。
元の(基本)予測方向は、第1予測サンプル変位パラメータの、ブロックの第1境界からの基本サンプルを利用してもよい。広角予測方向は、第2予測サンプル変位パラメータの、ブロックの第2境界からのサンプルを使用してもよい(図3b参照)。ブロックの第1境界は、ブロックの第2境界とは異なり、第1予測サンプル変位パラメータは、第2予測サンプル変位パラメータと同じでも異なっていてもよい。
利用可能なイントラ予測モード組は、予測ブロックの形状(すなわち、長方形ブロック構造の場合、予測ブロックの幅および高さ)に依存してもよい。
所与の識別子を有する方向性イントラ予測モードは、ブロックの幅が高さより大きい場合、第1角度を有すると解され、ブロックの幅が高さより小さい場合、第2角度を有すると解されてもよい。第1角度は、第2角度とは異なる。
第1イントラ予測モードは、完全に水平または完全に垂直な主方向に対して、−45度から+45度の間の角度を有し、第1イントラ予測モードの主方向とは異なる主方向に対して少なくとも+45度の角度を有する、対応する広角モードを有してもよい。
イントラ予測モードのエントロピー復号に対するコンテキスト選択は、ブロックの形状に依存してもよい。例えば、二値計算デコーダは、ブロックが正方形か否かに応じて、モード識別子に対して異なる推定された可能性を利用してもよい。すなわち、正方形ブロックに対しては、左および上方向に対して略同一の可能性を仮定し、ブロックが正方形でなければ、長い方の縁の方向にバイアスをかける。実際、これにより符号化されるより可能性の高いシンボルに対して、より短いコードワードが利用されるため、符号化効率が向上する。
エンコーダおよびデコーダは、ブロックの形状に基づいて、予測ブロックに対する最も可能性の高いモード組を特定し、選択されたモードが最も可能性の高いモードの1つであるかを示す識別子を符号化/復号してもよい。
エンコーダおよびデコーダは、ブロックの形状に基づいて、予測ブロックに対する最も可能性の高いモード組を特定し、その最も可能性の高いモードのうち、ブロックに対して選択されたものを示す識別子を符号化/復号してもよい。
提案された方法およびデバイスは、方向性イントラ予測の精度を上げうる。これはさらに、利用可能な予測モードのリスト内に、方向性が反対の複数の方向性予測モードが存在する場合に、効率的なシグナリング機構を提供する。
図6aは、復号方法のフローチャートを示す。フェーズ610において、受信したイントラピクチャ方向性予測用のビットストリームから参照画素が形成されてもよい。フェーズ612において、画素値を予測して予測ブロックを取得してもよい。この予測は、上述のように広角予測方向を使用して実行されてもよい。フェーズ614において、取得された広角イントラ予測ブロックを使用して、ビットストリームからの画像ブロックの復号を行ってもよい。予測誤差信号は、ビットストリームから復号され、予測された画像ブロックに加えて、復号された画像ブロックを取得してもよい。
図6bは、符号化方法のフローチャートを示す。フェーズ616において、符号化する画像データから参照画素を生成してもよい。これら参照画素を、後続のイントラピクチャ方向性予測で使用してもよい。フェーズ618において、上述のように広角予測方向により画素値を予測して、予測ブロックを取得してもよい。フェーズ619において、広角イントラ予測ブロックを使用して、画像ブロックをビットストリームに符号化してもよい。符号化される画像ブロックから予測ブロックを差し引いて、予測誤差信号を取得してもよい。誤差信号と、イントラピクチャ方向性予測用のパラメータおよびインジケータとをビットストリームに符号化してもよい。
図6cは、復号方法のフローチャートを示す。フェーズ620において、受信したイントラピクチャ方向性予測用のビットストリームから、参照画素を生成してもよい。フェーズ622において、ビットストリームから、予測するブロックの形状を判定してもよい。フェーズ624において、当該形状に基づいて使用されている方向性予測モードを判定してもよい。フェーズ626において、使用されている方向性予測モードが、形状により判定された、可能性の高いモードのうちの1つであるかを判定してもよい。フェーズ630において、ビットストリームからモード選択インジケータが受信されてもよい。フェーズ634において、使用されるモードが、基本モードと、基本モードの反転モードとの間で選択されてもよい。フェーズ636において、ブロックの形状に基づいて、使用されるモードが選択されてもよい。フェーズ638において、ブロックの形状に基づいて、予測されたモードから使用されるモードが選択されてもよい。フェーズ640において、画素値を予測して予測ブロックを取得してもよい。この予測は、上述のように広角予測方向を使用して実行されてもよい。フェーズ642において、取得された広角イントラ予測ブロックが、ビットストリームからの画像ブロックの復号に使用されてもよい。予測誤差信号は、ビットストリームから復号され、予測された画像ブロックに加えて、復号された画像ブロックを取得してもよい。図6cの方法において、フェーズは、図示の順番と順番が異なっていてもよい。個別のフェーズを、実行しても、省略してもよい。異なる複数のフェーズを組み合わせたり、代替物として扱ったりしてもよい。
図6dは、符号化方法のフローチャートである。フェーズ660において、符号化する画像データから参照画素を生成してもよい。これら参照画素を、後続のイントラピクチャ方向性予測で使用してもよい。フェーズ662において、予測するブロックの形状を判定して、それを後続の方向性予測で使用できるようにしてもよい。フェーズ664において、当該形状に基づいて使用されている方向性予測モードを判定してもよい。フェーズ667において、使用されている方向性予測モードが、形状により判定された、可能性の高いモードのうちの1つであるかを判定してもよい。フェーズ670において、モード選択インジケータがビットストリームに符号化されてもよい。フェーズ672において、使用されるモードが、基本モードと、基本モードの反転モードとの間で選択されてもよい。フェーズ674において、ブロックの形状に基づいて、使用されるモードが選択されてもよい。フェーズ676において、ブロックの形状に基づいて、予測されたモードから使用されるモードが選択されてもよい。フェーズ680において、上述のように広角予測方向により画素値を予測して、予測ブロックを取得してもよい。フェーズ682において、広角イントラ予測ブロックを使用して、画像ブロックをビットストリームに符号化してもよい。符号化する画像ブロックから予測ブロックを差し引いて、予測誤差信号を取得してもよい。誤差信号と、イントラピクチャ方向性予測用のパラメータおよびインジケータとをビットストリームに符号化してもよい。図6dの方法において、フェーズは、図示の順番と順番が異なっていてもよい。個別のフェーズを、実行しても、省略してもよい。異なる複数のフェーズを組み合わせたり、代替物として扱ったりしてもよい。
以下に、採番された例を挙げる。
1.
・ 符号化画像データを含むビットストリームを受信することと、
・ コンピュータメモリ内の当該ビットストリームから、イントラピクチャ方向性予測のための参照画素値を有する参照画素の組を形成することと、
・ 予測された画素値を形成する際に、前記予測された画素に対する予測方向から選択された1つまたは複数の参照画素の値を使用することにより、イントラピクチャ方向性予測によって予測された画像ブロックにおける画素値を予測することであって、ここで前記予測方向は、前記予測された画素の左上方向に対して鈍角を形成する広角予測方向である、予測することと、
・ 複数の画素に対して前記画素予測を繰り返して、予測された画像ブロックを形成することと、
・ 前記ビットストリームから画像ブロックを復号する際に当該予測された画像ブロックを使用して、復号された画像ブロックを取得することと、
を含む方法。
2.前記予測された画像ブロックはある形状を有し、
・ 前記ビットストリームから当該形状を判定することと、
・ 前記形状に基づいて、前記イントラピクチャ方向性予測に使用される方向性予測モードを判定することと、
・ 前記画素値を予測する際に、前記方向性予測モードから前記予測方向を選択することと、
を含む、例1に記載の方法。
3.前記予測された画像ブロックはある形状を有し、
・ 前記ビットストリームから当該形状を判定することと、
・ 前記イントラピクチャ方向性予測において使用される予測モードを判定することと、
・ 前記形状に基づいて、可能性の高い予測モードを判定することと、
・ 前記予測方向が当該可能性の高い予測モードのうちの1つであるかを示す前記ビットストリームから、インジケータを復号することと、
・ 前記可能性の高い予測モードから前記予測方向を選択することと、
を含む、例1または2に記載の方法。
4.
・ 前記イントラピクチャ方向性予測に使用される方向性予測モードを判定することと、
・ 前記ビットストリームから方向インジケータを復号することと、
・ 当該方向インジケータに関連付けられている基本方向と広角方向とから前記画素値を予測するための前記予測方向を選択することと、
を含む、例1から3のいずれかに記載の方法。
5.
・ 前記ビットストリームから予測方向選択インジケータを復号することと、
・ 当該予測方向選択インジケータを使用して、前記基本方向と前記広角方向から前記画素値を予測するための前記予測方向を選択することと、
を含む、例4に記載の方法。
6.前記予測された画像ブロックはある形状を有し、
・ 前記ビットストリームから当該形状を判定することと、
・ 前記形状に基づいて、基本方向と広角方向とから前記画素値を予測するための前記予測方向を選択することと、
を含む、例4に記載の方法。
7.前記基本方向は、前記広角方向と実質的に反対方向となるように、前記広角方向に関連付けられている、例4から6のいずれかに記載の方法。
8.前記基本方向は、前記広角方向と実質的に反対方向とならないように、かつ前記広角方向とは左上方向の反対側となるように、前記広角方向に関連付けられている、例4から6のいずれかに記載の方法。
9.2つ以上の広角方向が1つの基本方向に関連付けられており、または2つ以上の基本方向が同一の広角方向に関連付けられており、またはその両方である、例4から8のいずれかに記載の方法。
10.前記予測された画像ブロックはある形状を有し、
・ 前記ビットストリームから当該形状を判定することと、
・ 前記イントラピクチャ方向性予測において使用される予測モードを判定することと、
・ 前記ビットストリームから方向インジケータを復号することと、
・ 前記形状を使用して、当該方向インジケータに関連付けられている基本方向と広角方向との間の前記画素値を予測するための予測された予測方向を形成することと、
・ 前記予測された予測方向に基づいて前記予測方向を選択することと、
を含む、例1から9のいずれかに記載の方法。
11.
・ 符号化される画像データを受信することと、
・ コンピュータメモリ内の前記画像データから、イントラピクチャ方向性予測のための参照画素値を有する参照画素の組を形成することと、
・ 予測された画素値を形成する際に、前記予測された画素に対する予測方向から選択された1つまたは複数の参照画素の値を使用することにより、イントラピクチャ方向性予測によって予測された画像ブロックにおける画素値を予測することであって、ここで前記予測方向は、前記予測された画素の左上方向に対して鈍角を形成する広角予測方向である、予測することと、
・ 複数の画素に対して前記画素予測を繰り返して、予測された画像ブロックを形成することと、
・ 画像ブロックをビットストリームに符号化する際に、当該予測された画像ブロックを使用することと、
を含む方法。
12.前記予測された画像ブロックはある形状を有し、
・ 前記形状に基づいて、前記イントラピクチャ方向性予測に使用される方向性予測モードを判定することと、
・ 前記画素値を予測する際に、前記方向性予測モードから前記予測方向を選択することと、
を含む、例11に記載の方法。
13.前記予測された画像ブロックはある形状を有し、
・ 前記イントラピクチャ方向性予測において使用される予測モードを判定することと、
・ 前記形状に基づいて、可能性の高い予測モードを判定することと、
・ 前記可能性の高い予測モードから前記予測方向を選択することと、
・ 前記予測方向が当該可能性の高い予測モードのうちの1つであるかを示す前記ビットストリームにインジケータを符号化することと、
を含む、例11または12に記載の方法。
14.
・ 前記イントラピクチャ方向性予測に使用される方向性予測モードを判定することと、
・ 方向インジケータに関連付けられている基本方向と広角方向とから前記画素値を予測するための前記予測方向を選択することと、
・ 前記ビットストリームに方向インジケータを符号化することと、
を含む、例11から13のいずれかに記載の方法。
15.
・ 予測方向選択インジケータを使用して、前記基本方向と前記広角方向から前記画素値を予測するための前記予測方向を選択することと、
・ 予測方向選択インジケータを前記ビットストリームに符号化することと、
を含む、例14に記載の方法。
16.前記復号された画像ブロックはある形状を有し、
・ 前記形状に基づいて、基本方向と広角方向とから前記画素値を予測するための前記予測方向を選択することを含む、例14に記載の方法。
17.前記基本方向は、前記広角方向と実質的に反対方向となるように、前記広角方向に関連付けられている、例14から16のいずれかに記載の方法。
18.前記基本方向は、前記広角方向と実質的に反対方向とならないように、かつ前記広角方向とは左上方向の反対側となるように、前記広角方向に関連付けられている、例14から16のいずれかに記載の方法。
19.2つ以上の広角方向が1つの基本方向に関連付けられており、または2つ以上の基本方向が同一の広角方向に関連付けられており、またはその両方である、例14から18のいずれかに記載の方法。
20.前記復号された画像ブロックはある形状を有し、
・ 前記イントラピクチャ方向性予測において使用される予測モードを判定することと、
・ 前記形状を使用して、方向インジケータに関連付けられている基本方向と広角方向との間の前記画素値を予測するための予測された予測方向を形成することと、
・ 前記予測された予測方向に基づいて前記予測方向を選択することと、
・ 前記ビットストリームに方向インジケータを符号化することと、
を含む、例11から19のいずれかに記載の方法。
21.少なくとも1つのプロセッサと、コンピュータプログラムコードを含むメモリとを備える装置であって、前記メモリおよび前記コンピュータプログラムコードは、前記少なくとも1つのプロセッサによって、前記装置に少なくとも、
・ 符号化画像データを含むビットストリームを受信することと、
・ コンピュータメモリ内の当該ビットストリームから、イントラピクチャ方向性予測のための参照画素値を有する参照画素の組を形成することと、
・ 予測された画素値を形成する際に、前記予測された画素に対する予測方向から選択された1つまたは複数の参照画素の値を使用することにより、イントラピクチャ方向性予測によって予測された画像ブロックにおける画素値を予測することであって、ここで前記予測方向は、前記予測された画素の左上方向に対して鈍角を形成する広角予測方向である、予測することと、
・ 複数の画素に対して前記画素予測を繰り返して、予測された画像ブロックを形成することと、
・ 前記ビットストリームから画像ブロックを復号する際に当該予測された画像ブロックを使用して、復号された画像ブロックを取得することと、を実行させるように構成される、装置。
22.前記予測された画像ブロックはある形状を有し、前記装置に、
・ 前記ビットストリームから前記形状を判定することと、
・ 前記形状に基づいて、前記イントラピクチャ方向性予測において使用される方向性予測モードを判定することと、
・ 前記画素値の予測において、当該方向性予測モードから前記予測方向を選択することと、を実行させるコンピュータプログラムコードを備える、例21に記載の装置。
23.前記予測された画像ブロックはある形状を有し、前記装置に、
・ 前記ビットストリームから前記形状を判定することと、
・ 前記イントラピクチャ方向性予測において使用される予測モードを判定することと、
・ 前記形状に基づいて、可能性の高い予測モードを判定することと、
・ 前記予測方向が当該可能性の高い予測モードのうちの1つであるかを示す前記ビットストリームから、インジケータを復号することと、
・ 前記可能性の高い予測モードから前記予測方向を選択することと、を実行させるコンピュータプログラムコードを備える、例21または22に記載の装置。
24.前記装置に、
・ 前記イントラピクチャ方向性予測において使用される方向性予測モードを判定することと、
・ 前記ビットストリームから方向インジケータを復号することと、
・ 当該方向インジケータに関連付けられている基本方向と広角方向とから前記画素値を予測するための前記予測方向を選択することと、を実行させるコンピュータプログラムコードを備える、例21から23のいずれかに記載の装置。
25.前記装置に、
・ 前記ビットストリームから予測方向選択インジケータを復号することと、
・ 当該予測方向選択インジケータを使用して、前記基本方向と前記広角方向から前記画素値を予測するための前記予測方向を選択することと、を実行させるコンピュータプログラムコードを備える、例24に記載の装置。
26.前記予測された画像ブロックはある形状を有し、前記装置に、
・ 前記ビットストリームから前記形状を判定することと、
・ 前記形状に基づいて、基本方向と広角方向とから前記画素値を予測するための前記予測方向を選択することと、を実行させるコンピュータプログラムコードを備える、例24に記載の装置。
27.前記基本方向は、前記広角方向と実質的に反対方向となるように、前記広角方向に関連付けられている、例24から26のいずれかに記載の装置。
28.前記基本方向は、前記広角方向と実質的に反対方向とならないように、かつ前記広角方向とは左上方向の反対側となるように、前記広角方向に関連付けられている、例24から26のいずれかに記載の装置。
29.2つ以上の広角方向が1つの基本方向に関連付けられており、または2つ以上の基本方向が同一の広角方向に関連付けられており、またはその両方である、例24から28のいずれかに記載の装置。
30.前記予測された画像ブロックはある形状を有し、前記装置に、
・ 前記イントラピクチャ方向性予測において使用される予測モードを判定することと、
・ 前記形状を使用して、方向インジケータに関連付けられている基本方向と広角方向との間の前記画素値を予測するための予測された予測方向を形成することと、
・ 当該予測された予測方向に基づいて前記予測方向を選択することと、
・ 前記ビットストリームに前記方向インジケータを符号化することと、を実行させるコンピュータプログラムコードを備える、例21から29のいずれかに記載の装置。
31.少なくとも1つのプロセッサと、コンピュータプログラムコードを含むメモリとを備えるシステムであって、前記メモリおよび前記コンピュータプログラムコードは、前記少なくとも1つのプロセッサによって、前記システムに少なくとも、
・ 符号化画像データを含むビットストリームを受信することと、
・ コンピュータメモリ内の当該ビットストリームから、イントラピクチャ方向性予測のための参照画素値を有する参照画素の組を形成することと、
・ 予測された画素値を形成する際に、前記予測された画素に対する予測方向から選択された1つまたは複数の参照画素の値を使用することにより、イントラピクチャ方向性予測によって予測された画像ブロックにおける画素値を予測することであって、ここで前記予測方向は、前記予測された画素の左上方向に対して鈍角を形成する広角予測方向である、予測することと、
・ 複数の画素に対して前記画素予測を繰り返して、予測された画像ブロックを形成することと、
・ 前記ビットストリームから画像ブロックを復号する際に当該予測された画像ブロックを使用して、復号された画像ブロックを取得することと、を実行させるように構成される、システム。
32.少なくとも1つのプロセッサと、コンピュータプログラムコードを含むメモリとを備えるシステムであって、前記メモリおよび前記コンピュータプログラムコードは、前記少なくとも1つのプロセッサによって、前記システムに少なくとも、
・ 符号化される画像データを受信することと、
・ コンピュータメモリ内の前記画像データから、イントラピクチャ方向性予測のための参照画素値を有する参照画素の組を形成することと、
・ 予測された画素値を形成する際に、前記予測された画素に対する予測方向から選択された1つまたは複数の参照画素の値を使用することにより、イントラピクチャ方向性予測によって予測された画像ブロックにおける画素値を予測することであって、ここで前記予測方向は、前記予測された画素の左上方向に対して鈍角を形成する広角予測方向である、予測することと、
・ 複数の画素に対して前記画素予測を繰り返して、予測された画像ブロックを形成し、
・ 画像ブロックをビットストリームに符号化する際に、当該予測された画像ブロックを使用することと、を実行させるように構成される、システム。
33.
・ 符号化画像データを含むビットストリームを受信する手段と、
・ コンピュータメモリ内の当該ビットストリームから、イントラピクチャ方向性予測のための参照画素値を有する参照画素の組を形成する手段と、
・ 予測された画素値を形成する際に、前記予測された画素に対する予測方向から選択された1つまたは複数の参照画素の値を使用することにより、イントラピクチャ方向性予測によって予測された画像ブロックにおける画素値を予測する手段であって、ここで前記予測方向は、前記予測された画素の左上方向に対して鈍角を形成する広角予測方向である、予測する手段と、
・ 複数の画素に対して前記画素予測を繰り返して、予測された画像ブロックを形成する手段と、
・ 前記ビットストリームから画像ブロックを復号する際に当該予測された画像ブロックを使用して、復号された画像ブロックを取得する手段と、を備える装置。
34.前記予測された画像ブロックはある形状を有し、
・ 前記ビットストリームから当該形状を判定する手段と、
・ 前記形状に基づいて、前記イントラピクチャ方向性予測に使用される方向性予測モードを判定する手段と、
・ 前記画素値を予測する際に、前記方向性予測モードから前記予測方向を選択する手段と、
を備える、例33に記載の装置。
35.前記予測された画像ブロックはある形状を有し、
・ 前記ビットストリームから当該形状を判定する手段と、
・ 前記イントラピクチャ方向性予測において使用される予測モードを判定する手段と、
・ 前記形状に基づいて、可能性の高い予測モードを判定する手段と、
・ 前記予測方向が当該可能性の高い予測モードのうちの1つであるかを示す前記ビットストリームから、インジケータを復号する手段と、
・ 前記可能性の高い予測モードから前記予測方向を選択する手段と、を備え、例33または34に記載の装置。
36.
・ 前記イントラピクチャ方向性予測に使用される方向性予測モードを判定する手段と、
・ 前記ビットストリームから方向インジケータを復号する手段と、
・ 方向インジケータに関連付けられている基本方向と広角方向とから前記画素値を予測するための前記予測方向を選択する手段と、
を備える、例33から35のいずれかに記載の装置。
37.
・ 前記ビットストリームから予測方向選択インジケータを復号する手段と、
・ 当該予測方向選択インジケータを使用して、前記基本方向と前記広角方向から前記画素値を予測するための前記予測方向を選択する手段と、
を備える、例36に記載の装置。
38.前記予測された画像ブロックはある形状を有し、
・ 前記ビットストリームから当該形状を判定する手段と、
・ 前記形状に基づいて、基本方向と広角方向とから前記画素値を予測するための前記予測方向を選択する手段と、
を備える、例36に記載の装置。
39.前記基本方向は、前記広角方向と実質的に反対方向となるように、前記広角方向に関連付けられている、例36から38のいずれかに記載の装置。
40.前記基本方向は、前記広角方向と実質的に反対方向とならないように、かつ前記広角方向とは左上方向の反対側となるように、前記広角方向に関連付けられている、例36から38のいずれかに記載の装置。
41.2つ以上の広角方向が1つの基本方向に関連付けられており、または2つ以上の基本方向が同一の広角方向に関連付けられており、またはその両方である、例36から40のいずれかに記載の装置。
42.前記予測された画像ブロックはある形状を有し、
・ 前記ビットストリームから当該形状を判定する手段と、
・ 前記イントラピクチャ方向性予測において使用される予測モードを判定する手段と、
・ 前記ビットストリームから方向インジケータを復号する手段と、
・ 前記形状を使用して、前記方向インジケータに関連付けられている基本方向と広角方向との間の前記画素値を予測するための予測された予測方向を形成する手段と、
・ 前記予測された予測方向に基づいて前記予測方向を選択する手段と、
を備える、例33から41のいずれかに記載の装置。
43.
・ 符号化される画像データを受信する手段と、
・ コンピュータメモリ内の前記画像データから、イントラピクチャ方向性予測のための参照画素値を有する参照画素の組を形成する手段と、
・ 予測された画素値を形成する際に、前記予測された画素に対する予測方向から選択された1つまたは複数の参照画素の値を使用することにより、イントラピクチャ方向性予測によって予測された画像ブロックにおける画素値を予測する手段であって、ここで前記予測方向は、前記予測された画素の左上方向に対して鈍角を形成する広角予測方向である、予測する手段と、
・ 複数の画素に対して前記画素予測を繰り返して、予測された画像ブロックを形成する手段と、
・ 画像ブロックをビットストリームに符号化する際に、当該予測された画像ブロックを使用する手段と、を備える装置。
44.前記予測された画像ブロックはある形状を有し、
・ 前記形状に基づいて、前記イントラピクチャ方向性予測に使用される方向性予測モードを判定する手段と、
・ 前記画素値を予測する際に、前記方向性予測モードから前記予測方向を選択する手段と、
を備える、例43に記載の装置。
45.前記予測された画像ブロックはある形状を有し、
・ 前記イントラピクチャ方向性予測において使用される予測モードを判定する手段と、
・ 前記形状に基づいて、可能性の高い予測モードを判定する手段と、
・ 前記可能性の高い予測モードから前記予測方向を選択する手段と、
・ 前記予測方向が当該可能性の高い予測モードのうちの1つであるかを示す前記ビットストリームにインジケータを符号化する手段と、
を備える、例43または44に記載の装置。
46.
・ 前記イントラピクチャ方向性予測に使用される方向性予測モードを判定する手段と、
・ 前記方向インジケータに関連付けられている基本方向と広角方向とから前記画素値を予測するための前記予測方向を選択する手段と、
・ 前記ビットストリームに方向インジケータを符号化する手段と、
を備える、例43から45のいずれかに記載の装置。
47.
・ 予測方向選択インジケータを使用して、前記基本方向と前記広角方向から前記画素値を予測するための前記予測方向を選択する手段と、
・ 予測方向選択インジケータを前記ビットストリームに符号化する手段と、
を備える、例46に記載の装置。
48.前記復号された画像ブロックはある形状を有し、
・ 前記形状に基づいて、基本方向と広角方向とから前記画素値を予測するための前記予測方向を選択する手段を備える、例46に記載の装置。
49.前記基本方向は、前記広角方向と実質的に反対方向となるように、前記広角方向に関連付けられている、例46から48のいずれかに記載の装置。
50.前記基本方向は、前記広角方向と実質的に反対方向とならないように、かつ前記広角方向とは左上方向の反対側となるように、前記広角方向に関連付けられている、例46から48のいずれかに記載の装置。
51.2つ以上の広角方向が1つの基本方向に関連付けられており、または2つ以上の基本方向が同一の広角方向に関連付けられており、またはその両方である、例46から50のいずれかに記載の装置。
52.前記復号された画像ブロックはある形状を有し、
・ 前記イントラピクチャ方向性予測において使用される予測モードを判定する手段と、
・ 前記形状を使用して、方向インジケータに関連付けられている基本方向と広角方向との間の前記画素値を予測するための予測された予測方向を形成する手段と、
・ 前記予測された予測方向に基づいて前記予測方向を選択する手段と、
・ 前記ビットストリームに方向インジケータを符号化する手段と、
を備える、例43から51のいずれかに記載の装置。
53.非一時的コンピュータ可読媒体に実施されるビットストリーム信号であって、前記信号は、デコーダに復号されると、前記デコーダに、当該ビットストリーム信号から画像データを復号させるように構成され、前記信号は、イントラピクチャ方向性予測を使用して形成された符号化された予測誤差信号を含み、ここで予測された画素値を形成する際に、前記予測された画素に対する予測方向から選択された1つまたは複数の参照画素の値を使用することにより、イントラピクチャ方向性予測によって予測された画像ブロックに、予測された画素値が形成されており、前記予測方向は、前記予測された画素の左上方向に対して鈍角を形成する広角予測方向であり、前記ビットストリーム信号は、前記デコーダに、前記予測方向を前記ビットストリームの復号のための広角予測方向となるように選択させるように構成される。
54.非一時的コンピュータ可読媒体に実施されるビットストリーム信号であって、前記信号は、デコーダに復号されると、前記デコーダに、当該ビットストリーム信号から画像データを復号させるように構成され、前記信号は、復号される画像ブロックの形状を判定するための情報を含み、当該復号は予測方向を使用したイントラピクチャ方向性予測を利用し、可能性の高い予測モードが前記形状と関連付けられており、前記デコーダに前記ビットストリームの復号のための前記予測方向を選択させるべく、前記ビットストリームは、前記予測方向が前記形状に関連付けられた当該可能性の高い予測モードのうちの1つであるかを示すインジケータを含む。
本発明の各種実施形態は、メモリ内のコンピュータプログラムコードの助けによって実現することができ、関連する装置に本発明を実施させる。例えば、デバイスは、データを操作、送受信するための回路や電子部品、メモリ内のコンピュータプログラムコード、さらにコンピュータプログラムコード実行中に、デバイスに実施形態の特徴を実施させるプロセッサを備えてもよい。さらに、サーバのようなネットワークデバイスは、データを操作、送受信するための回路や電子部品、メモリ内のコンピュータプログラムコード、さらにコンピュータプログラムコード実行中に、ネットワークデバイスに実施形態の特徴を実施させるプロセッサを備えてもよい。
本発明が上述の実施形態のみに限定されるものではなく、添付の請求項の範囲内で変更できることは明らかである。

Claims (15)

  1. 方法であって、
    ・ 符号化画像データを含むビットストリームを受信することと、
    ・ コンピュータメモリ内の当該ビットストリームから、イントラピクチャ方向性予測のための参照画素値を有する参照画素の組を形成することと、
    ・ 画像ブロックに対するイントラ予測モードを判定することと、
    を含み、前記イントラ予測モードを判定することが、
    ・ 前記ビットストリームから前記画像ブロックの幅及び高さを決定することと;
    ・ 前記幅が前記高さよりも大きい場合、第1の変位パラメータを用いる少なくとも一つの水平イントラ予測モードを、第2の変位パラメータを用いる垂直広角イントラ予測モードと解釈することと;
    ・ 前記幅が前記高さよりも小さい場合、第3の変位パラメータを用いる少なくとも一つの垂直イントラ予測モードを、第4の変位パラメータを用いる水平広角イントラ予測モードと解釈することと;
    を含み、
    前記第1の変位パラメータ及び前記第4の変位パラメータは、前記画像ブロックの中心を基準とした前記画像ブロックの左水平方向からの角度変位に関係するパラメータであり、前記左水平方向から半時計回りに正の値、時計回りに負の値をとるパラメータであり、
    前記第2の変位パラメータ及び前記第3の変位パラメータは、前記画像ブロックの中心を基準とした前記画像ブロックの垂直上方向からの角度変位に関係するパラメータであり、前記垂直上方向から時計回りに正の値、半時計回りに負の値をとるパラメータであり、
    前記第1の変位パラメータ、前記第2の変位パラメータ、前記第3の変位パラメータ、前記第4の変位パラメータは、いずれも方向性イントラ予測モード組のいずれかに対応し、前記第2の変位パラメータは前記第1の変位パラメータより大きく、前記第4の変位パラメータは前記第3の変位パラメータより大きく、前記垂直広角イントラ予測モードは、前記画像ブロックの中心から前記画像ブロックの左上角への方向を0度の基準方向として該基準方向から時計回りに90度を超える予測方向を使用する垂直イントラ予測モードであり、前記水平広角イントラ予測モードは、前記基準方向から反時計回りに90度を超える予測方向を使用する水平イントラ予測モードであり、
    前記方法は更に、
    ・ 予測された画素値を形成する際に、前記予測された画素に対する広角予測方向から選択された1つまたは複数の参照画素の値を使用することにより、イントラピクチャ方向性予測によって予測された画像ブロックにおける画素値を予測することと、
    ・ 複数の画素に対して前記画素予測を繰り返して、予測された画像ブロックを形成することと、
    ・ 前記ビットストリームから画像ブロックを復号する際に当該予測された画像ブロックを使用して、復号された画像ブロックを取得することと、
    を含み、ここで前記広角予測方向は、前記基準方向から時計回り又は反時計回りに90度を超える方向である、方法。
  2. 前記幅が前記高さよりも大きい場合、前記広角予測方向として、前記基準方向から時計回りに90度より大きな方向性に対応する変位パラメータを用いる垂直広角イントラ予測方向を選択することを含む、請求項1に記載の方法。
  3. 前記高さが前記幅よりも大きい場合、前記広角予測方向として、前記基準方向から反時計回りに90度より大きな方向性に対応する変位パラメータを用いる水平広角イントラ予測方向を選択することを含む、請求項1又は2に記載の方法。
  4. 複数のイントラ予測モードを特定することと;
    前記複数のイントラ予測モードの各々について、前記高さ及び前記幅に基づいて該イントラ予測モードを解釈することにより、変位パラメータを特定することと;
    を含み、前記基準方向から時計回り又は反時計回りに90度を超える予測方向を使用するイントラ予測モードの数は、前記画像ブロックが細長いほど多い、請求項1から3のいずれかに記載の方法。
  5. ・ 前記イントラピクチャ方向性予測に使用される方向性予測モードを判定することと、
    ・ 前記ビットストリームから方向インジケータを復号することと、
    ・ 当該方向インジケータに関連付けられている狭角方向と広角方向とから前記画素値を予測するための前記予測方向を選択することと、
    を含み、ここで前記狭角方向は前記基準方向から時計回り又は反時計回りに90度を超えない方向であり、前記広角方向は、前記基準方向から時計回り又は反時計回りに90度を超える方向である、請求項1から4のいずれかに記載の方法。
  6. ・ 前記ビットストリームから予測方向選択インジケータを復号することと、
    ・ 当該予測方向選択インジケータを使用して、前記狭角方向と前記広角方向から前記画素値を予測するための前記予測方向を選択することと、
    を含む、請求項5に記載の方法。
  7. ・ 前記高さ及び前記幅に基づいて、前記狭角方向と前記広角方向とから前記画素値を予測するための前記予測方向を選択することと、
    を含む、請求項6に記載の方法。
  8. 方法であって、
    ・ 符号化される画像データを受信することと、
    ・ コンピュータメモリ内の前記画像データから、イントラピクチャ方向性予測のための参照画素値を有する参照画素の組を形成することと、
    ・ 画像ブロックに対するイントラ予測モードを判定することと、
    を含み、前記イントラ予測モードを判定することが、
    ・ 前記画像ブロックの幅及び高さを決定することと;
    ・ 前記幅が前記高さよりも大きい場合、広角予測方向として、垂直上方向を0度として時計回りに+45度より大きな方向性を用いる垂直広角イントラ予測方向を選択することと;
    ・ 前記高さが前記幅よりも大きい場合、広角予測方向として、水平左方向を0度として反時計回りに45度より大きな方向性を用いる水平広角イントラ予測方向を選択することと;
    を含み、前記方法は更に、
    ・ 予測された画素値を形成する際に、前記予測された画素に対する予測方向から選択された1つまたは複数の参照画素の値を使用することにより、イントラピクチャ方向性予測によって予測された画像ブロックにおける画素値を予測することと、
    ・ 複数の画素に対して前記画素予測を繰り返して、予測された画像ブロックを形成することと、
    ・ 画像ブロックをビットストリームに符号化する際に、当該予測された画像ブロックを使用することと、
    を含む方法。
  9. ・ 前記イントラピクチャ方向性予測に使用される方向性予測モードを判定することと、
    ・ 方向インジケータに関連付けられている狭角方向と広角方向とから前記画素値を予測するための前記予測方向を選択することと、を含み、
    ・ 前記ビットストリームに方向インジケータを符号化することと、
    を含み、ここで前記狭角方向は、前記画像ブロックの中心から前記画像ブロックの左上角への方向を0度の基準方向として、前記基準方向から時計回り又は反時計回りに90度を超えない方向であり、前記広角方向は、前記基準方向から時計回り又は反時計回りに90度を超える方向である、請求項に記載の方法。
  10. 装置であって、
    ・ 符号化画像データを含むビットストリームを受信する手段と、
    ・ コンピュータメモリ内の当該ビットストリームから、イントラピクチャ方向性予測のための参照画素値を有する参照画素の組を形成する手段と、
    ・ 画像ブロックに対するイントラ予測モードを判定する手段と、
    を備え、前記イントラ予測モードを判定することが、
    ・ 前記ビットストリームから前記画像ブロックの幅及び高さを決定することと;
    ・ 前記幅が前記高さよりも大きい場合、第1の変位パラメータを用いる少なくとも一つの水平イントラ予測モードを、第2の変位パラメータを用いる垂直広角イントラ予測モードと解釈することと;
    ・ 前記幅が前記高さよりも小さい場合、第3の変位パラメータを用いる少なくとも一つの垂直イントラ予測モードを、第4の変位パラメータを用いる水平広角イントラ予測モードと解釈することと;
    を含み、
    前記第1の変位パラメータ及び前記第4の変位パラメータは、前記画像ブロックの中心を基準とした前記画像ブロックの左水平方向からの角度変位に関係するパラメータであり、前記左水平方向から半時計回りに正の値、時計回りに負の値をとるパラメータであり、
    前記第2の変位パラメータ及び前記第3の変位パラメータは、前記画像ブロックの中心を基準とした前記画像ブロックの垂直上方向からの角度変位に関係するパラメータであり、前記垂直上方向から時計回りに正の値、半時計回りに負の値をとるパラメータであり、
    前記第1の変位パラメータ、前記第2の変位パラメータ、前記第3の変位パラメータ、前記第4の変位パラメータは、いずれも方向性イントラ予測モード組のいずれかに対応し、前記第2の変位パラメータは前記第1の変位パラメータより大きく、前記第4の変位パラメータは前記第3の変位パラメータより大きく、前記垂直広角イントラ予測モードは、前記画像ブロックの中心から前記画像ブロックの左上角への方向を0度の基準方向として該基準方向から時計回りに90度を超える予測方向を使用する垂直イントラ予測モードであり、前記水平広角イントラ予測モードは、前記基準方向から反時計回りに90度を超える予測方向を使用する水平イントラ予測モードであり、
    前記装置は更に、
    ・ 予測された画素値を形成する際に、前記予測された画素に対する予測方向から選択された1つまたは複数の参照画素の値を使用することにより、イントラピクチャ方向性予測によって予測された画像ブロックにおける画素値を予測する手段であって、ここで前記予測方向は、前記予測された画素の左上方向に対して鈍角を形成する広角予測方向である、予測する手段と、
    ・ 複数の画素に対して前記画素予測を繰り返して、予測された画像ブロックを形成する手段と、
    ・ 前記ビットストリームから画像ブロックを復号する際に当該予測された画像ブロックを使用して、復号された画像ブロックを取得する手段と、
    を備える、装置。
  11. 装置であって、
    ・ 符号化される画像データを受信する手段と、
    ・ コンピュータメモリ内の前記画像データから、イントラピクチャ方向性予測のための参照画素値を有する参照画素の組を形成する手段と、
    ・ 画像ブロックに対するイントラ予測モードを判定する手段と、
    を備え、前記イントラ予測モードを判定することが、
    ・ 前記画像ブロックの幅及び高さを決定することと;
    ・ 前記幅が前記高さよりも大きい場合、広角予測方向として、垂直上方向を0度として時計回りに+45度より大きな方向性を用いる垂直広角イントラ予測方向を選択することと;
    ・ 前記高さが前記幅よりも大きい場合、広角予測方向として、水平左方向を0度として反時計回りに45度より大きな方向性を用いる水平広角イントラ予測方向を選択することと;
    を含み、前記装置は更に、
    ・ 予測された画素値を形成する際に、前記予測された画素に対する前記広角予測方向から選択された1つまたは複数の参照画素の値を使用することにより、イントラピクチャ方向性予測によって予測された画像ブロックにおける画素値を予測する手段と、
    ・ 複数の画素に対して前記画素予測を繰り返して、予測された画像ブロックを形成する手段と、
    ・ 画像ブロックをビットストリームに符号化する際に、当該予測された画像ブロックを使用する手段と、
    を備える、装置。
  12. 少なくとも1つのプロセッサと、コンピュータプログラムコードを含むメモリとを備える装置であって、前記コンピュータプログラムコードは、前記少なくとも1つのプロセッサに実行されると、前記装置に、請求項1から7のいずれかに記載の方法を実施させる、装置。
  13. 装置の少なくとも1つのプロセッサに実行されると、前記装置に、請求項1から7のいずれかに記載の方法を実施させるプログラムコードを含む、コンピュータプログラム。
  14. 少なくとも1つのプロセッサと、コンピュータプログラムコードを含むメモリとを備える装置であって、前記コンピュータプログラムコードは、前記少なくとも1つのプロセッサに実行されると、前記装置に、請求項8又は9に記載の方法を実施させる、装置。
  15. 装置の少なくとも1つのプロセッサに実行されると、前記装置に、請求項8又は9に記載の方法を実施させるプログラムコードを含む、コンピュータプログラム。
JP2019535877A 2017-01-03 2017-12-29 広角イントラ予測によるビデオおよび画像の符号化 Active JP6913755B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2021114685A JP7258958B2 (ja) 2017-01-03 2021-07-12 広角イントラ予測によるビデオおよび画像の符号化
JP2023061164A JP2023082179A (ja) 2017-01-03 2023-04-05 広角イントラ予測によるビデオおよび画像の符号化

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FI20175006 2017-01-03
FI20175006A FI20175006A1 (en) 2017-01-03 2017-01-03 Video and image coding using wide-angle intra-prediction
PCT/FI2017/050950 WO2018127624A1 (en) 2017-01-03 2017-12-29 Video and image coding with wide-angle intra prediction

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2021114685A Division JP7258958B2 (ja) 2017-01-03 2021-07-12 広角イントラ予測によるビデオおよび画像の符号化

Publications (2)

Publication Number Publication Date
JP2020503785A JP2020503785A (ja) 2020-01-30
JP6913755B2 true JP6913755B2 (ja) 2021-08-04

Family

ID=62789367

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2019535877A Active JP6913755B2 (ja) 2017-01-03 2017-12-29 広角イントラ予測によるビデオおよび画像の符号化
JP2021114685A Active JP7258958B2 (ja) 2017-01-03 2021-07-12 広角イントラ予測によるビデオおよび画像の符号化
JP2023061164A Pending JP2023082179A (ja) 2017-01-03 2023-04-05 広角イントラ予測によるビデオおよび画像の符号化

Family Applications After (2)

Application Number Title Priority Date Filing Date
JP2021114685A Active JP7258958B2 (ja) 2017-01-03 2021-07-12 広角イントラ予測によるビデオおよび画像の符号化
JP2023061164A Pending JP2023082179A (ja) 2017-01-03 2023-04-05 広角イントラ予測によるビデオおよび画像の符号化

Country Status (13)

Country Link
US (1) US11044467B2 (ja)
EP (3) EP4093028A1 (ja)
JP (3) JP6913755B2 (ja)
KR (2) KR102360648B1 (ja)
CN (2) CN110140356B (ja)
AU (1) AU2017391028B2 (ja)
BR (1) BR112019013797A2 (ja)
CA (2) CA3048115C (ja)
FI (1) FI20175006A1 (ja)
PH (1) PH12019501445A1 (ja)
RU (1) RU2732996C1 (ja)
WO (1) WO2018127624A1 (ja)
ZA (1) ZA201904958B (ja)

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109155851A (zh) 2016-05-02 2019-01-04 汉阳大学校产学协力团 利用画面内预测的影像编码、解码方法及装置
US10764587B2 (en) * 2017-06-30 2020-09-01 Qualcomm Incorporated Intra prediction in video coding
JP6956543B2 (ja) * 2017-07-03 2021-11-02 日本放送協会 決定装置、符号化装置、復号装置及びプログラム
JP2019041165A (ja) 2017-08-23 2019-03-14 富士通株式会社 画像符号化装置、画像復号装置、画像処理方法、及び画像処理プログラム
JP7043616B2 (ja) 2017-10-24 2022-03-29 ウィルス インスティテュート オブ スタンダーズ アンド テクノロジー インコーポレイティド ビデオ信号処理方法及び装置
JP7165192B2 (ja) * 2017-11-17 2022-11-02 鴻穎創新有限公司 調整済みイントラモードリストに基づいてビデオデータを符号化するための装置および方法
KR20240125065A (ko) * 2017-12-08 2024-08-19 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 이미지 인코딩 장치, 이미지 디코딩 장치, 이미지 인코딩 방법 및 이미지 디코딩 방법
KR101842178B1 (ko) * 2018-01-19 2018-05-14 광성(주) 선박용 황산화물 저감장치 및 선박용 황산화물 저감장치의 운전방법
US10841578B2 (en) * 2018-02-12 2020-11-17 Tencent America LLC Method and apparatus for using an intra prediction coding tool for intra prediction of non-square blocks in video compression
CN117834858A (zh) * 2018-04-24 2024-04-05 三星电子株式会社 视频编码方法和装置以及视频解码方法和装置
US11856184B2 (en) 2018-05-14 2023-12-26 Interdigital Vc Holdings, Inc. Block shape adaptive intra prediction directions for quadtree-binary tree
US11509889B2 (en) 2018-06-27 2022-11-22 Kt Corporation Method and apparatus for processing video signal
EP3815359B1 (en) * 2018-06-27 2024-10-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Contour mode prediction
CA3102546A1 (en) 2018-06-27 2020-01-02 Kt Corporation Method and apparatus for processing video signal
US10284844B1 (en) 2018-07-02 2019-05-07 Tencent America LLC Method and apparatus for video coding
US10567752B2 (en) 2018-07-02 2020-02-18 Tencent America LLC Method and apparatus for intra prediction for non-square blocks in video compression
US10284860B1 (en) * 2018-07-02 2019-05-07 Tencent America LLC Method and apparatus for video coding
US11128872B2 (en) 2018-07-16 2021-09-21 Qualcomm Incorporated Position dependent intra prediction combination with wide angle intra prediction
JP2021531677A (ja) * 2018-07-16 2021-11-18 インターデジタル ヴイシー ホールディングス, インコーポレイテッド 広角イントラ予測と位置依存イントラ予測の組み合わせ
KR102553341B1 (ko) * 2018-08-12 2023-07-06 엘지전자 주식회사 영상 신호를 처리하기 위한 방법 및 장치
BR112021004890A2 (pt) * 2018-09-13 2021-06-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. intrapredições ponderadas lineares afins
MX2021002968A (es) * 2018-09-19 2021-05-12 Fujitsu Ltd Aparato de codificacion de video, metodo de codificacion de video, programa de codificacion de video, aparato de decodificacion de video, metodo de decodificacion de video y programa de decodificacion de video.
JP7323014B2 (ja) * 2018-09-19 2023-08-08 富士通株式会社 映像復号方法
US20220124337A1 (en) * 2018-09-21 2022-04-21 Interdigital Vc Holdings, Inc. Harmonization of intra transform coding and wide angle intra prediction
US10469845B1 (en) * 2018-09-21 2019-11-05 Tencent America, Llc Method and apparatus for intra mode coding
WO2020072249A1 (en) * 2018-10-01 2020-04-09 Interdigital Vc Holdings, Inc. Directions for wide angle intra prediction
US20200112728A1 (en) * 2018-10-03 2020-04-09 Qualcomm Incorporated Wide-angle intra prediction for video coding
NZ776204A (en) * 2018-11-14 2023-02-24 Huawei Tech Co Ltd Method and apparatus for intra prediction
US11109023B2 (en) * 2018-11-27 2021-08-31 Tencent America LLC Intra mode selection in intra prediction
CN112956191A (zh) 2019-01-02 2021-06-11 Oppo广东移动通信有限公司 帧内预测方法及装置、计算机可读存储介质
WO2020140219A1 (zh) * 2019-01-02 2020-07-09 Oppo广东移动通信有限公司 帧内预测方法、装置及计算机存储介质
CN113545090A (zh) * 2019-02-01 2021-10-22 北京达佳互联信息技术有限公司 用于帧内子分区编解码模式的方法和设备
US11533506B2 (en) * 2019-02-08 2022-12-20 Tencent America LLC Method and apparatus for video coding
US11425374B2 (en) * 2019-03-12 2022-08-23 FG Innovation Company Limited Device and method for coding video data
WO2020216255A1 (en) * 2019-04-25 2020-10-29 Mediatek Inc. Method and apparatus of encoding or decoding with mode dependent intra smoothing filter in intra prediction
JP7030246B2 (ja) 2019-06-25 2022-03-04 日本放送協会 イントラ予測装置、画像復号装置、及びプログラム
KR20220032634A (ko) * 2019-08-06 2022-03-15 에이치에프아이 이노베이션 인크. 인트라 예측 모드 매핑을 사용하여 비디오 데이터를 인코딩 또는 디코딩하는 방법 및 장치
EP4026322A4 (en) * 2019-09-07 2024-01-03 Beijing Dajia Internet Information Technology Co., Ltd. PREDICTIVE MODE SIGNALING IN VIDEO CODING
GB201913403D0 (en) * 2019-09-17 2019-10-30 Canon Kk Method and apparatus for encoding and decoding a video stream with subpictures
CN113439440A (zh) 2019-12-19 2021-09-24 Oppo广东移动通信有限公司 图像分量预测方法、编码器、解码器以及存储介质
JP2020182247A (ja) * 2020-07-30 2020-11-05 富士通株式会社 画像符号化方法及び画像復号方法
JP2020182248A (ja) * 2020-07-30 2020-11-05 富士通株式会社 画像復号方法及び画像符号化方法
JP2020182249A (ja) * 2020-07-30 2020-11-05 富士通株式会社 画像符号化装置及び画像復号装置
US11432006B2 (en) * 2020-08-14 2022-08-30 Tencent America LLC Chroma mode video coding
CN111988627B (zh) * 2020-08-19 2024-01-23 北京达佳互联信息技术有限公司 一种视频编解码方法及设备
WO2023044617A1 (zh) * 2021-09-22 2023-03-30 深圳市大疆创新科技有限公司 编解码方法及装置
CN116320428A (zh) * 2021-12-20 2023-06-23 维沃移动通信有限公司 帧间预测方法及终端

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003279015A1 (en) * 2002-09-27 2004-04-19 Videosoft, Inc. Real-time video coding/decoding
EP1696679B1 (en) * 2003-12-10 2015-08-26 NEC Corporation Projector color correcting method
WO2008084817A1 (ja) * 2007-01-09 2008-07-17 Kabushiki Kaisha Toshiba 画像符号化と復号化の方法及び装置
KR101379255B1 (ko) * 2007-04-06 2014-03-28 삼성전자주식회사 미분 방정식을 이용한 인트라 예측 부호화, 복호화 방법 및장치
JPWO2009001793A1 (ja) 2007-06-26 2010-08-26 株式会社東芝 画像符号化と画像復号化の方法及び装置
US8619857B2 (en) 2010-04-09 2013-12-31 Sharp Laboratories Of America, Inc. Methods and systems for intra prediction
KR101739987B1 (ko) * 2010-12-28 2017-05-26 에스케이 텔레콤주식회사 주변블록의 특징벡터를 이용한 영상 부호화/복호화 방법 및 장치
CN102595118B (zh) * 2011-01-14 2015-04-08 华为技术有限公司 一种编解码中的预测方法和预测器
JP2013012995A (ja) * 2011-06-30 2013-01-17 Sony Corp 画像処理装置および方法
US9787982B2 (en) * 2011-09-12 2017-10-10 Qualcomm Incorporated Non-square transform units and prediction units in video coding
GB2501518A (en) * 2012-04-27 2013-10-30 Canon Kk Encoding and Decoding an Image Comprising Blocks of Pixels Including Selecting the Prediction Mode of Prediction Units
JP6135239B2 (ja) * 2012-05-18 2017-05-31 株式会社リコー 画像処理装置、画像処理プログラム、画像処理方法
JP5885604B2 (ja) * 2012-07-06 2016-03-15 株式会社Nttドコモ 動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法及び動画像予測復号プログラム
KR101650532B1 (ko) * 2012-09-28 2016-08-23 니폰 덴신 덴와 가부시끼가이샤 인트라 예측 부호화 방법, 인트라 예측 복호 방법, 인트라 예측 부호화 장치, 인트라 예측 복호 장치, 이들의 프로그램 및 프로그램을 기록한 기록매체
GB2508339A (en) * 2012-11-22 2014-06-04 Sony Corp Manipulation of transform coefficient blocks in high-efficiency video coding (HEVC)
US20140286413A1 (en) * 2013-03-25 2014-09-25 Qualcomm Incorporated Disabling sign data hiding in video coding
EP2936816B1 (en) 2013-04-09 2020-04-29 MediaTek Singapore Pte Ltd. Method and apparatus for non-square intra mode coding
KR102210946B1 (ko) * 2014-03-04 2021-02-01 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 스크린 컨텐츠의 딕셔너리 인코딩 및 디코딩
JP6295805B2 (ja) * 2014-04-24 2018-03-20 富士通株式会社 画像符号化方法、画像符号化装置および画像符号化プログラム
MX2018011198A (es) 2016-03-16 2019-05-20 Mediatek Inc Metodo y aparato de procesamiento de datos de video con tamaño restringido de bloque en codificacion de video.
CN113810705B (zh) * 2016-04-29 2024-05-10 世宗大学校产学协力团 用于对图像信号进行编码和解码的方法和装置
US20170374369A1 (en) 2016-06-24 2017-12-28 Mediatek Inc. Methods and Apparatuses of Decoder Side Intra Mode Derivation

Also Published As

Publication number Publication date
US11044467B2 (en) 2021-06-22
AU2017391028B2 (en) 2022-05-12
JP2023082179A (ja) 2023-06-13
CN110140356A (zh) 2019-08-16
CN110140356B (zh) 2023-10-27
JP2020503785A (ja) 2020-01-30
EP4383704A3 (en) 2024-08-21
FI20175006A1 (en) 2019-02-15
EP4093028A1 (en) 2022-11-23
JP2021184606A (ja) 2021-12-02
CA3131100A1 (en) 2018-07-12
AU2017391028A1 (en) 2019-07-18
KR20210116673A (ko) 2021-09-27
PH12019501445A1 (en) 2020-02-10
EP3566450A4 (en) 2020-08-26
EP4383704A2 (en) 2024-06-12
US20190356909A1 (en) 2019-11-21
CA3048115C (en) 2021-11-09
FI20175006A (fi) 2018-07-04
CN117640953A (zh) 2024-03-01
KR102360648B1 (ko) 2022-02-09
RU2732996C1 (ru) 2020-09-28
CA3048115A1 (en) 2018-07-12
ZA201904958B (en) 2021-02-24
KR102301656B1 (ko) 2021-09-15
KR20190102251A (ko) 2019-09-03
BR112019013797A2 (pt) 2020-01-21
JP7258958B2 (ja) 2023-04-17
EP3566450A1 (en) 2019-11-13
WO2018127624A1 (en) 2018-07-12

Similar Documents

Publication Publication Date Title
JP6913755B2 (ja) 広角イントラ予測によるビデオおよび画像の符号化
JP7150130B2 (ja) 広角イントラ予測を伴う位置依存イントラ予測組み合わせ
CN116723315B (zh) 视频解码的方法和装置、视频编码的方法和装置及存储介质
CN112235572B (zh) 视频解码方法和装置以及计算机设备和存储介质
JP6333942B2 (ja) ビデオ情報のスケーラブルコード化のための装置及び方法
CN112042188A (zh) 用于视频压缩中非正方形块的帧内预测的方法和装置
US20140247883A1 (en) Scalable video encoding and decoding method and apparatus using same
EP2685739A1 (en) Real-time encoding system of multiple spatially scaled video based on shared video coding information
TWI535273B (zh) 經組態以寫碼視訊資訊之設備及視訊寫碼裝置、編碼及解碼視訊資訊之方法與非暫態電腦可讀媒體
JP7164710B2 (ja) ビデオ復号化方法及びビデオ・デコーダ
TW201735635A (zh) 用於螢幕內容寫碼及多層寫碼之加權預測
CN114501000B (zh) 用于视频编码的方法和电子装置
CN111327907B (zh) 一种帧间预测的方法、装置、设备及存储介质
KR102325977B1 (ko) 영상의 복호화 방법 및 이를 이용하는 장치
WO2020002762A1 (en) Method and apparatus for motion compensation with non-square sub-blocks in video coding
CN116806427A (zh) 用于基于偏移的修正和多参考行选择的协调设计

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190802

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190802

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200826

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200909

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201105

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201125

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210407

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210616

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210629

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210712

R150 Certificate of patent or registration of utility model

Ref document number: 6913755

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150