JP2022527555A - エンコーダ、デコーダ、および対応する方法 - Google Patents

エンコーダ、デコーダ、および対応する方法 Download PDF

Info

Publication number
JP2022527555A
JP2022527555A JP2021559241A JP2021559241A JP2022527555A JP 2022527555 A JP2022527555 A JP 2022527555A JP 2021559241 A JP2021559241 A JP 2021559241A JP 2021559241 A JP2021559241 A JP 2021559241A JP 2022527555 A JP2022527555 A JP 2022527555A
Authority
JP
Japan
Prior art keywords
picture
irap
flag
pictures
leading
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021559241A
Other languages
English (en)
Inventor
フヌ・ヘンドリー
イェ-クイ・ワン
Original Assignee
ホアウェイ・テクノロジーズ・カンパニー・リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ホアウェイ・テクノロジーズ・カンパニー・リミテッド filed Critical ホアウェイ・テクノロジーズ・カンパニー・リミテッド
Publication of JP2022527555A publication Critical patent/JP2022527555A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

ビデオコーディング機構が開示される。この機構は、フラグと、イントラランダムアクセスポイント(IRAP)ピクチャおよびIRAPピクチャと関連付けられる1つ以上の非先行ピクチャを含む複数のコーディングされたピクチャとを備える、ビットストリームを受信することを含む。フラグが第1の値に設定されるとき、IRAPピクチャと関連付けられる任意の先行ピクチャが、復号順序において、IRAPピクチャと関連付けられるすべての非先行ピクチャの前にある。フラグが第2の値に設定されるとき、非先行ピクチャが、復号順序において、IRAPピクチャと関連付けられる最初の先行ピクチャの前にある。IRAPピクチャ、IRAPピクチャと関連付けられる任意の先行ピクチャ、およびIRAPピクチャと関連付けられる1つ以上の非先行ピクチャが、フラグに基づいて復号順序において復号される。

Description

関連出願の相互参照
本特許出願は、参照によって本明細書に組み込まれる、「Handling Intra Random Access Point And Leading Pictures In Video Coding」という表題のFNU Hendry他により2019年4月3日に出願された米国仮特許出願第62/828,875号、および「Handling Intra Random Access Point And Leading Pictures In Video Coding」という表題のFNU Hendry他により2019年6月21日に出願された米国仮特許出願第62/864,958号の利益を主張する。
本開示は一般にビデオコーディングに関し、詳細には、インターレースビデオコーディングの文脈において先行ピクチャをコーディングすることに関する。
比較的短いビデオでもそれを描写するために必要なビデオデータの量はかなり多いことがあり、これは、帯域幅容量が限られている通信ネットワークを介してデータがストリーミングまたは別様に通信されることになるときに、困難さをもたらし得る。したがって、ビデオデータは一般に、現代の遠隔通信ネットワークを介して通信される前に圧縮される。メモリリソースは限られていることがあるので、ビデオがストレージデバイスに記憶されるときには、ビデオのサイズも問題であり得る。ビデオ圧縮デバイスはしばしば、ソースにおけるソフトウェアおよび/またはハードウェアを使用して、送信または記憶の前にビデオデータをコーディングし、それにより、デジタルビデオ画像を表現するために必要とされるデータの量を減らす。圧縮されたデータは次いで、ビデオデータを復号するビデオ圧縮解除デバイスによってデスティネーションにおいて受信される。ネットワークリソースが限られていること、およびより高いビデオ品質に対する要求が高まり続けていることにより、画像品質をほとんどまたはまったく犠牲にせずに圧縮比を改善する、改善された圧縮および圧縮解除技法が望ましい。
ある実施形態では、本開示は、デコーダにおいて実施される方法を含み、この方法は、デコーダの受信機によって、フラグと、イントラランダムアクセスポイント(IRAP)ピクチャおよびIRAPピクチャと関連付けられる1つ以上の非先行ピクチャを含む複数のコーディングされたピクチャとを備える、ビットストリームを受信するステップと、
フラグが第1の値に設定されるとき、プロセッサによって、IRAPピクチャと関連付けられる任意の先行ピクチャが、復号順序において、IRAPピクチャと関連付けられるすべての非先行ピクチャの前にあると決定するステップと、フラグが第2の値に設定されるとき、プロセッサによって、非先行ピクチャが、復号順序において、IRAPピクチャと関連付けられる最初の先行ピクチャの前にあると決定するステップと、フラグが第1の値に設定されるか第2の値に設定されるかに基づいて、プロセッサによって、IRAPピクチャ、IRAPピクチャと関連付けられる任意の先行ピクチャ、およびIRAPピクチャと関連付けられる1つ以上の非先行ピクチャを復号順序において復号するステップと、プロセッサによって、復号されたビデオシーケンスの一部として表示するために1つ以上の復号されたピクチャを転送するステップとを備える。
バーサタイルビデオコーディング(VVC)ビデオシステムは、IRAPピクチャ、先行ピクチャ、および非先行ピクチャを含むビットストリームを利用し得る。いくつかの例では、非先行ピクチャは後端ピクチャとも呼ばれ得る。IRAPピクチャは、コーディングされたビデオシーケンスの始点として働くイントラ予測コーディングされたピクチャである。先行ピクチャは、提示順序においてIRAPピクチャの前にあるが、コーディング順序ではIRAPピクチャの後にコーディングされるピクチャである。非先行ピクチャ/後端ピクチャは、提示順序とコーディング順序の両方においてIRAPピクチャの後にあるピクチャである。一部のビデオコーディングシステムは、先行ピクチャが復号順序においてIRAPピクチャの直後にあることと、すべての非先行ピクチャが先行ピクチャの後にあることとを要求する。インターレースビデオコーディングは、ストリーミング帯域幅を増大させることなく知覚されるフレームレートを上げる機構である。インターレースビデオコーディングでは、ビデオフレームは2つのフィールドに分割される。フレームの第1のフィールドのための水平線は、第1の時間にキャプチャされて第1のピクチャにおいてコーディングされる。フレームの第2のフィールドのための水平線は、第2の時間にキャプチャされて第1のピクチャのすぐ隣の第2のピクチャにおいてコーディングされる。このようにして、得られるフレームは、第1の時間における第1のピクチャからのスライスと第2における第2のピクチャからのスライスとを含み、これは動きの感覚を高める。VVCシステムは、インターレースビデオをサポートするように設計されないことがある。たとえば、インターレースフレームは、機能するためにIRAPピクチャおよび隣接するイントラ予測コーディングされたピクチャを利用することがある。イントラ予測コーディングされたピクチャは、非先行/後端ピクチャであると見なされる。さらに、先行ピクチャが利用されるとき、先行ピクチャは、その隣接するイントラ予測コーディングされたピクチャの後に位置決めされる。これは、先行ピクチャが復号順序においてIRAPピクチャの直後にある、およびすべての非先行ピクチャが先行ピクチャの後にあるという、VVCの制約に違反する。この例は、先行ピクチャを利用するVVCシステムにおいてイン
ターレースビデオコーディングを実施するために利用され得るフラグを含む。フラグが0などの第1の値に設定されると、先行ピクチャがもしあれば、それは非先行ピクチャのすべてに先行する。しかしながら、IRAPピクチャと任意の先行ピクチャとの間に単一の非先行ピクチャが位置決めされることをデコーダに示すために、エンコーダはフラグを1などの第2の値に設定することができる。ある例では、非先行ピクチャは先行ピクチャ間に位置決めされなくてもよい。フラグは、シーケンスパラメータセット(SPS)に含まれてもよく、ピクチャのシーケンス全体に適用されてもよい。したがって、この例は、先行ピクチャおよびインターレースビデオが同じビットストリームにおいて一緒に実装されることを許容することによって、エンコーダおよび/またはデコーダの機能を高めるフラグを含む。さらに、この例は、先行ピクチャおよびインターレースビデオが一緒に実装されることを許容することによって、得られるビットストリームのコーディング効率を高める。したがって、この例は、エンコーダおよび/またはデコーダにおける、プロセッサリソース、メモリリソース、および/またはネットワークリソースの使用を減らし得る。
任意選択で、先行する態様のいずれにおいても、態様の別の実装形態は、フラグが第2の値に設定されるとき、プロセッサによって、復号順序において最初の先行ピクチャと最後の先行ピクチャとの間に先行ピクチャが位置決めされないと決定することをさらに備えることを規定する。
任意選択で、先行する態様のいずれにおいても、態様の別の実装形態は、ビットストリームがSPSを含み、フラグがSPSから取得されることを規定する。
任意選択で、先行する態様のいずれにおいても、態様の別の実装形態は、フラグがシーケンシャルフィールドフラグ(field_seq_flag)であることを規定する。
任意選択で、先行する態様のいずれにおいても、態様の別の実装形態は、コーディングされたビデオシーケンスがフィールドを表すピクチャを含むことを示すとき、field_seq_flagが1に設定され、コーディングされたビデオシーケンスがフレームを表すピクチャを含むことを示すとき、field_seq_flagが0に設定されることを規定する。
任意選択で、先行する態様のいずれにおいても、態様の別の実装形態は、IRAPピクチャがフレームの第1のフィールドを含み、最初の先行ピクチャの前にある非先行ピクチャがフレームの第2のフィールドを含むことを規定する。
任意選択で、先行する態様のいずれにおいても、態様の別の実装形態は、IRAPピクチャおよび1つ以上の非先行ピクチャを復号することが、IRAPピクチャからの第1のフィールドおよび最初の先行ピクチャの前にある非先行ピクチャからの第2のフィールドをインターレースして単一のフレームを作成することを含むことを規定する。
ある実施形態では、本開示は、エンコーダにおいて実施される方法を含み、方法は、エンコーダのプロセッサによって、IRAPピクチャおよびIRAPピクチャと関連付けられる1つ以上の非先行ピクチャを含む複数のピクチャを備えるビデオシーケンスのためのコーディング順序を決定するステップと、プロセッサによって、フラグをビットストリームへと符号化するステップであって、IRAPピクチャと関連付けられる任意の先行ピクチャがコーディング順序においてIRAPピクチャと関連付けられるすべての非先行ピクチャの前にあるとき、フラグが第1の値に設定され、非先行ピクチャがコーディング順序においてIRAPピクチャと関連付けられる最初の先行ピクチャの前にあるとき、フラグが第2の値に設定される、ステップと、プロセッサによって、IRAPピクチャ、IRAPピクチャと関連付けられる任意の先行ピクチャ、およびIRAPピクチャと関連付けられる1つ以上の非先行ピクチャをコーディング順序においてビットストリームへと符号化するステップと、プロセッサに結合されたメモリによって、デコーダへの通信のためにビットストリームを記憶するステップとを備える。
VVCビデオシステムは、IRAPピクチャ、先行ピクチャ、および非先行ピクチャを含むビットストリームを利用し得る。いくつかの例では、非先行ピクチャは後端ピクチャとも呼ばれ得る。IRAPピクチャは、コーディングされたビデオシーケンスの始点として働くイントラ予測コーディングされたピクチャである。先行ピクチャは、提示順序においてIRAPピクチャの前にあるが、コーディング順序ではIRAPピクチャの後にコーディングされるピクチャである。非先行ピクチャ/後端ピクチャは、提示順序とコーディング順序の両方においてIRAPピクチャの後にあるピクチャである。一部のビデオコーディングシステムは、先行ピクチャが復号順序においてIRAPピクチャの直後にあることと、すべての非先行ピクチャが先行ピクチャの後にあることとを要求する。インターレースビデオコーディングは、ストリーミング帯域幅を増大させることなく知覚されるフレームレートを上げる機構である。インターレースビデオコーディングでは、ビデオフレームは2つのフィールドに分割される。フレームの第1のフィールドのための水平線は、第1の時間にキャプチャされて第1のピクチャにおいてコーディングされる。フレームの第2のフィールドのための水平線は、第2の時間にキャプチャされて第1のピクチャのすぐ隣の第2のピクチャにおいてコーディングされる。このようにして、得られるフレームは、第1の時間における第1のピクチャからのスライスと第2における第2のピクチャからのスライスとを含み、これは動きの感覚を高める。VVCシステムは、インターレースビデオをサポートするように設計されないことがある。たとえば、インターレースフレームは、機能するためにIRAPピクチャおよび隣接するイントラ予測コーディングされたピクチャを利用することがある。イントラ予測コーディングされたピクチャは、非先行/後端ピクチャであると見なされる。さらに、先行ピクチャが利用されるとき、先行ピクチャは、その隣接するイントラ予測コーディングされたピクチャの後に位置決めされる。これは、先行ピクチャが復号順序においてIRAPピクチャの直後にある、およびすべての非先行ピクチャが先行ピクチャの後にあるという、VVCの制約に違反する。この例は、先行ピクチャを利用するVVCシステムにおいてインターレースビデオコーディングを実施
するために利用され得るフラグを含む。フラグが0などの第1の値に設定されるとき、先行ピクチャがもしあれば、それは非先行ピクチャのすべての前にある。しかしながら、IRAPピクチャと任意の先行ピクチャとの間に単一の非先行ピクチャが位置決めされることをデコーダに示すために、エンコーダはフラグを1などの第2の値に設定することができる。ある例では、非先行ピクチャは先行ピクチャ間に位置決めされなくてもよい。フラグは、SPSに含まれてもよく、ピクチャのシーケンス全体に適用されてもよい。したがって、この例は、先行ピクチャおよびインターレースビデオが同じビットストリームにおいて一緒に実装されることを許容することによって、エンコーダおよび/またはデコーダの機能を高めるフラグを含む。さらに、この例は、先行ピクチャおよびインターレースビデオが一緒に実装されることを許容することによって、得られるビットストリームのコーディング効率を高める。したがって、この例は、エンコーダおよび/またはデコーダにおける、プロセッサリソース、メモリリソース、および/またはネットワークリソースの使用を減らし得る。
任意選択で、先行する態様のいずれにおいても、態様の別の実装形態は、フラグが第2の値に設定されるとき、コーディング順序において最初の先行ピクチャと最後の先行ピクチャとの間に先行ピクチャが位置決めされないことを規定する。
任意選択で、先行する態様のいずれにおいても、態様の別の実装形態は、ビットストリームがSPSを含み、フラグがSPSへと符号化されることを規定する。
任意選択で、先行する態様のいずれにおいても、態様の別の実装形態は、フラグがfield_seq_flagであることを規定する。
任意選択で、先行する態様のいずれにおいても、態様の別の実装形態は、コーディングされたビデオシーケンスがフィールドを表すピクチャを含むことを示すとき、field_seq_flagが1に設定され、コーディングされたビデオシーケンスがフレームを表すピクチャを含むことを示すとき、field_seq_flagが0に設定されることを規定する。
任意選択で、先行する態様のいずれにおいても、態様の別の実装形態は、IRAPピクチャがフレームの第1のフィールドを含み、最初の先行ピクチャの前にある非先行ピクチャがフレームの第2のフィールドを含むことを規定する。
任意選択で、先行する態様のいずれにおいても、態様の別の実装形態は、IRAPピクチャからの第1のフィールドおよび最初の先行ピクチャの前にある非先行ピクチャからの第2のフィールドが、単一のインターレースビデオフレームを表すビデオデータの交互の線を含むことを規定する。
ある実施形態では、本開示は、プロセッサと、プロセッサに結合された受信機と、プロセッサに結合されたメモリと、プロセッサに結合された送信機とを備える、ビデオコーディングデバイスを含み、プロセッサ、受信機、メモリ、および送信機は、先行する態様のいずれかの方法を実行するように構成される。
ある実施形態では、本開示は、ビデオコーディングデバイスにより使用するためのコンピュータプログラム製品を備える非一時的コンピュータ可読媒体を含み、コンピュータプログラム製品は、プロセッサによって実行されるとビデオコーディングデバイスに先行する態様のいずれかの方法を実行させる非一時的コンピュータ可読媒体に記憶されたコンピュータ実行可能命令を備える。
ある実施形態では、本開示は、フラグと、IRAPピクチャおよびIRAPピクチャと関連付けられる1つ以上の非先行ピクチャを含む複数のコーディングされたピクチャとを備える、ビットストリームを受信するための受信手段と、フラグが第1の値に設定されるとき、IRAPピクチャと関連付けられる任意の先行ピクチャが、復号順序において、IRAPピクチャと関連付けられるすべての非先行ピクチャの前にあると決定し、フラグが第2の値に設定されるとき、非先行ピクチャが、復号順序において、IRAPピクチャと関連付けられる最初の先行ピクチャの前にあると決定するための決定手段と、フラグが第1の値に設定されるか第2の値に設定されるかに基づいて、IRAPピクチャ、IRAPピクチャと関連付けられる任意の先行ピクチャ、およびIRAPピクチャと関連付けられる1つ以上の非先行ピクチャを復号順序において復号するための復号手段と、復号されたビデオシーケンスの一部として表示するために1つ以上の復号されたピクチャを転送するための転送手段とを備える、デコーダを含む。
任意選択で、先行する態様のいずれにおいても、態様の別の実装形態は、デコーダが先行する態様のいずれかの方法を実行するようにさらに構成されることを規定する。
ある実施形態では、本開示は、IRAPピクチャおよびIRAPピクチャと関連付けられる1つ以上の非先行ピクチャを含む複数のピクチャを備えるビデオシーケンスのためのコーディング順序を決定するための決定手段と、フラグをビットストリームへと符号化し、IRAPピクチャと関連付けられる任意の先行ピクチャが、コーディング順序において、IRAPピクチャと関連付けられるすべての非先行ピクチャの前にあるとき、フラグが第1の値に設定され、ある非先行ピクチャが、コーディング順序において、IRAPピクチャと関連付けられる最初の先行ピクチャの前にあるとき、フラグが第2の値に設定され、IRAPピクチャ、IRAPピクチャと関連付けられる任意の先行ピクチャ、およびIRAPピクチャと関連付けられる1つ以上の非先行ピクチャをコーディング順序においてビットストリームへと符号化するための符号化手段と、デコーダへの通信のためにビットストリームを記憶するための記憶手段とを備える、エンコーダを含む。
任意選択で、先行する態様のいずれにおいても、態様の別の実装形態は、エンコーダが先行する態様のいずれかの方法を実行するようにさらに構成されることを規定する。
明確にするために、前述の実施形態のいずれか1つが、本開示の範囲内で新しい実施形態を作成するために、他の前述の実施形態の任意の1つ以上と組み合わせられ得る。
これらおよび他の特徴は、添付の図面および請求項と併せて、以下の詳細な説明からより明確に理解されるであろう。
本開示のより完全な理解のために、ここで、添付の図面および詳細な説明に関連して、以下の簡単な説明への参照が行われ、同様の参照番号は同様の部分を表す。
ビデオ信号をコーディングする例示的な方法のフローチャートである。 ビデオコーディングのための例示的な符号化および復号(コーデック)システムの概略図である。 例示的なビデオエンコーダを示す概略図である。 例示的なビデオデコーダを示す概略図である。 先行ピクチャを伴う例示的なコーディングされたビデオシーケンスを示す概略図である。 インターレースビデオコーディングの例を集合的に示す概略図である。 インターレースビデオコーディングの例を集合的に示す概略図である。 インターレースビデオコーディングの例を集合的に示す概略図である。 インターレースビデオコーディングと先行ピクチャの両方を利用する例示的なコーディングされたビデオシーケンスを示す概略図である。 インターレースビデオコーディングと先行ピクチャの両方を含むように構成される例示的なビットストリームを示す概略図である。 例示的なビデオコーディングデバイスの概略図である。 インターレースビデオコーディングを伴うビデオシーケンスおよび先行ピクチャをビットストリームへと符号化する例示的な方法のフローチャートである。 インターレースビデオコーディングを伴うビデオシーケンスおよび先行ピクチャをビットストリームから復号する例示的な方法のフローチャートである。 インターレースビデオコーディングを伴うビデオシーケンスおよび先行ピクチャをビットストリームへとコーディングするための例示的なシステムの概略図である。
1つ以上の実施形態の説明のための実装形態が以下で与えられるが、開示されるシステムおよび/または方法は、現在知られているか、または存在しているかにかかわらず、任意の数の技法を使用して実装され得ることを始めに理解されたい。本開示は、いかなる場合でも、本明細書において例証され説明される例示的な設計および実装形態を含む、以下で例証される説明のための実装形態、図、および技法に限定されるべきではなく、それらの均等物の完全な範囲とともに添付の特許請求の範囲内で修正され得る。
以下の用語は、本明細書において逆の文脈で使用されない限り、次のように定義される。具体的には、以下の定義は、本開示をさらにわかりやすくすることが意図されている。しかしながら、用語は異なる文脈では異なるように説明され得る。したがって、以下の定義は、補足として見なされるべきであり、本明細書におけるそのような用語に対して与えられる説明の他の定義を限定するものと見なされるべきではない。
ビットストリームは、エンコーダとデコーダとの間の送信のために圧縮されるビデオデータを含むシーケンスビットである。エンコーダは、ビデオデータをビットストリームへと圧縮するための符号化プロセスを利用するように構成されるデバイスである。デコーダは、表示のためにビットストリームからビデオデータを再構築するために復号プロセスを利用するように構成されるデバイスである。フラグは、符号化の間にエンコーダによって利用される機構をシグナリングするビットストリームへとコーディングされるビットまたはビットのグループであるので、復号の間にデコーダによって利用されるべき機構がビットストリームからビデオデータを正確に再構築することを示す。イントラ予測は、ピクチャが他のピクチャを参照することなく再構築され得るように、それ自身を参照してピクチャをコーディングする機構である。インター予測は、1つ以上の他のピクチャを参照することによってピクチャをコーディングする機構である。イントラランダムアクセスポイント(IRAP)ピクチャは、イントラ予測に従ってコーディングされ、コーディングされたビデオシーケンスのための始点として働く、ピクチャである。先行ピクチャは、コーディング順序において関連するIRAPピクチャの後にコーディングされ、しかし出力順序において関連するIRAPピクチャに先行する、ピクチャである。後端ピクチャとも呼ばれ得る非先行ピクチャは、コーディング順序と出力順序の両方においてIRAPピクチャの後にあるピクチャである。インターレースビデオコーディングは、第1のピクチャの中の第1の時間におけるビデオデータの第1のフィールドをコーディングし、第2のピクチャの中の第2の時間におけるビデオデータの第2のフィールドをコーディングし、向上したフレームレートの印象を与えるために第1のフィールドおよび第2のフィールドを提示のために単一のフレームへと組み合わせる、ビデオコーディング機構である。フレームは、ビデオシーケンスの中の対応する瞬間におけるユーザへの完全なまたは部分的な表示が意図される、完全な画像である。ピクチャは、ピクチャがフレームのフィールドであるようなインターレースビデオに関する状況を除き、フレームである。パラメータセットは、コーディングされたビデオシーケンスの対応するセクションのための、フラグおよび他のパラメータなどのデータをシグナリングする、ビットストリームの部分である。シーケンシャルフィールドフラグ(field_seq_flag)は、インターレースビデオのために使用され、コーディング順序においてIRAPピクチャと先行ピクチャとの間に非先行ピクチャがいつ位置決めされるかをシグナリングする、フラグである。
以下の頭字語が本明細書において使用される。コーディングツリーブロック(CTB)、コーディングツリーユニット(CTU)、コーディングユニット(CU)、コーディングされたビデオシーケンス(CVS)、ジョイントビデオエキスパーツチーム(JVET)、動き制約タイルセット(MCTS)、最大伝送単位(MTU)、ネットワーク抽象化レイヤ(NAL)、ピクチャ順序カウント(POC)、ローバイトシーケンスペイロード(RBSP)、シーケンスパラメータセット(SPS)、およびワーキングドラフト(WD)。
データの喪失を最小限にしながらビデオファイルのサイズを減らすために、多くのビデオ圧縮技法を利用することができる。たとえば、ビデオ圧縮技法は、空間(たとえば、イントラピクチャ)予測および/または時間(たとえば、インターピクチャ)予測を実行して、ビデオシーケンスにおけるデータ冗長性を低減または除去することを含み得る。ブロックベースのビデオコーディングのために、ビデオスライス(たとえば、ビデオピクチャまたはビデオピクチャの一部)がビデオブロックへと区分されてもよく、これは、ツリーブロック、コーディングツリーブロック(CTB)、コーディングツリーユニット(CTU)、コーディングユニット(CU)、および/またはコーデイングノードとも呼ばれ得る。ピクチャのイントラコーディングされた(I)スライスの中のビデオブロックは、同じピクチャの中の近隣ブロックの中の参照サンプルに関する空間予測を使用してコーディングされる。ピクチャのインターコーディングされた単方向予測(P)または双方向予測(B)スライスの中のビデオブロックは、同じピクチャの近隣ブロックの中の参照サンプルに関する空間予測、または他の参照ピクチャの中の参照サンプルに関する時間予測を利用することによってコーディングされ得る。ピクチャはフレームおよび/または画像と呼ばれることがあり、参照ピクチャは参照フレームおよび/または参照画像と呼ばれることがある。空間予測または時間予測は、画像ブロックを表す予測ブロックをもたらす。残差データは、元の画像ブロックと予測ブロックとの間のピクセル差分を表す。したがって、インターコーディングされたブロックは、予測ブロックを形成する参照サンプルのブロックを指し示す動きベクトルと、コーディングされたブロックと予測ブロックとの間の差を示す残差データとに従って符号化される。イントラコーディングされたブロックは、イントラコーディングモードおよび残差データに従って符号化される。さらなる圧縮のために、残差データはピクセル領域から変換領域に転送され得る。これらは、量子化され得る残差変換係数をもたらす。量子化された変換係数は最初に、二次元アレイに配列され得る。量子化された変換係数が、変換係数の一次元ベクトルを生み出すために走査され得る。エントロピーコーディングは、さらなる圧縮を達成するために適用され得る。そのようなビデオ圧縮技法は、以下でより詳しく論じられる。
符号化されたビデオが確実に正しく復号され得ることを確実にするために、対応するビデオコーディング規格に従って、ビデオが符号化され復号される。ビデオコーディング規格は、国際電気通信連合(ITU)標準化部門(ITU-T)H.261、国際標準化機構/国際電気標準会議(ISO/IEC)モーションピクチャエキスパーツグループ(MPEG)-1 Part 2、ITU-T H.262またはISO/IEC MPEG-2 Part 2、ITU-T H.263、ISO/IEC MPEG-4 Part 2、ITU-T H.264またはISO/IEC MPEG-4 Part 10としても知られているアドバンストビデオコーディング(AVC)、およびITU-T H.265またはMPEG-H Part 2としても知られている高効率ビデオコーディング(HEVC)を含む。AVCは、スケーラブルビデオコーディング(SVC)、マルチビュービデオコーディング(MVC)およびマルチビュービデオコーディングプラスデプス(MVC+D)、ならびに三次元(3D)AVC(3D-AVC)などの拡張を含む。HEVCは、スケーラブルHEVC(SHVC)、マルチビューHEVC(MV-HEVC)、および3D HEVC(3D-HEVC)などの拡張を含む。ITU-TおよびISO/IECのジョイントビデオエキスパーツチーム(JVET)は、バーサタイルビデオコーディング(VVC)と呼ばれるビデオコーディング規格の開発を開始した。VVCはワーキングドラフト(WD)に含まれており、これは、JVET-M1001-v7を含む。
ビデオコーディングシステムは、IRAPピクチャおよび非IRAPピクチャを利用することによってビデオを符号化し得る。IRAPピクチャは、ビデオシーケンスのためのランダムアクセスポイントとしての役割を果たす、インター予測に従ってコーディングされるピクチャである。イントラ予測では、ピクチャのブロックは、同じピクチャの中の他のブロックへの参照によってコーディングされる。これは、インター予測を利用する非IRAPピクチャとは対照的である。インター予測では、現在のピクチャのブロックは、現在のピクチャと異なる参照ピクチャの中の他のブロックへの参照によってコーディングされる。IRAPピクチャは他のピクチャを参照せずにコーディングされるので、IRAPピクチャは、最初に他のピクチャを復号することなく復号され得る。したがって、デコーダは、任意のIRAPピクチャにおいてビデオシーケンスを復号することを始めることができる。対照的に、非IRAPピクチャは他のピクチャを参照してコーディングされるので、デコーダは一般に、非IRAPピクチャにおいてビデオシーケンスの復号を始めることができない。IRAPピクチャはまた、復号ピクチャバッファ(DPB)をリフレッシュし得る。これは、IRAPピクチャがコーディングされたビデオシーケンス(CVS)の始点であり、CVSの中のピクチャが以前のCVSの中のピクチャを参照しないからである。したがって、IRAPピクチャは、インター予測関連のコーディングエラーを止めることもでき、それは、そのようなエラーはIRAPピクチャを通って広がることができないからである。しかしながら、IRAPピクチャは、データサイズの観点から、非IRAPピクチャよりはるかに大きい。したがって、ビデオシーケンスは一般に、コーディング効率と機能性のバランスをとるために、多数の非IRAPピクチャとともに、より少数の散在するIRAPピクチャを含む。たとえば、60フレームのCVSは、1つのIRAPピクチャおよび59個の非IRAPピクチャを含み得る。したがって、IRAPピクチャはビットストリームにおける圧縮効率を下げる。さらに、ビットストリームにおけるIRAPピクチャの存在は、ビットレートの急上昇を引き起こす。圧縮効率に対するこの不利益は、ピクチャを表現するためにインター予測よりはるかに多くのビットをイントラ予
測が利用するという事実により一部は引き起こされる。さらに、IRAPピクチャは、復号プロセスをリフレッシュし、DPBから参照ピクチャを除去し得る。これは、IRAPピクチャの後にあるピクチャをコーディングするときにインター予測のために利用可能な参照ピクチャの数を減らすので、インター予測プロセスの効率を一時的に下げる。
ビデオコーディングシステムは、先行ピクチャも利用し得る。先行ピクチャは、コーディング順序においてIRAPピクチャの後に位置し提示順序においてIRAPピクチャの前に位置決めされるピクチャである。先行ピクチャは、対応するピクチャがIRAPピクチャから効率的に予測され得るとき、その対応するピクチャがIRAPピクチャの前に提示されるべきであっても利用され得る。そのようなピクチャは、IRAPピクチャがインター予測のための参照ピクチャとして利用されることを許容するために、コーディング順序においてIRAPピクチャの後に位置決めされる。デコーダは次いで、異なる提示順序を作成するために、提示の前に先行ピクチャとIRAPピクチャの順序を入れ替えることができる。先行ピクチャは、ランダムアクセススキップ先行(RASL)ピクチャおよびランダムアクセス復号先行(RADL)ピクチャを含み得る。RASLピクチャはまた、IRAPピクチャの前にピクチャに依存することがあり、IRAPピクチャがランダムアクセスポイントとして使用されるときスキップされる。これは、そのような他のピクチャが復号されず、したがってIRAPピクチャから復号が開始するときにそのような他の参照ピクチャとして利用可能ではないからである。RADLピクチャは、参照のためにIRAPピクチャまたはRADLピクチャとIRAPピクチャとの間の他のピクチャのみに依存する。したがって、RADLピクチャは、IRAPがランダムアクセスポイントとして使用されるときでも復号される。これは、コーディングがIRAPピクチャにおいて開始するときでも、RADLピクチャが参照し得るあらゆるピクチャが復号されることが保証されるからである。ビデオコーディングシステムは、復号順序において参照するIRAPピクチャの直後に先行ピクチャが位置決めされることを必要とし得る。次いで、あらゆる関連する後端ピクチャが、復号順序において先行ピクチャの後にある。
ビデオコーディングは、広範囲の機構を利用する。たとえば、インターレースコーディングは、フレームを1つより多くのフィールドおよび1つより多くのピクチャにコーディングする。たとえば、フレームは、偶数フィールドと奇数フィールドに分割され得る。インターレースフレームの偶数フィールドは、フレームの偶数番号の水平線からのサンプルを含み、インターレースフレームの奇数フィールドは、フレームの奇数番号の水平線からのサンプルを含む。ある特定の例として、奇数フィールドは、第1の時間においてキャプチャされ、第1のピクチャに記憶され得る。奇数フィールドは次いで、第2の時間においてキャプチャされ、第2のピクチャに記憶され得る。同じフレームへと2つのフィールドを含めることは、動きの感覚を高める。したがって、インターレースコーディングは、ビデオシーケンスの帯域幅を増やすことなく、向上したフレームレートの印象を生み出す。インターレースコーディングは、標準化されたコーディングシステムによりネイティブでサポートされないことがある。しかしながら、インターレースコーディングは、ビットストリームがインターレースコーディングされたビットストリームであることを示すためにビデオ使用可能性情報(VUI)の中のシンタックス要素を利用することによって、何らかのシステムにおいて管理され得る。そのようなシンタックス要素は、field_seq_flag、general_frame_only_constraint_flagを含み得る。
先行ピクチャを利用する標準化されたビデオコーディングシステムは、インターレースビデオコーディングをサポートするように構成されない。たとえば、VVCおよびHEVCは、先行ピクチャがもしあればそれがIRAPピクチャの後にあることを要求するコーディング順序を利用し得る。次いで、先行ピクチャの後には、非先行/後端ピクチャがある。そのような順序は、非先行ピクチャがIRAPピクチャと関連する先行ピクチャとの間に位置決めされるのを防ぐ。しかしながら、インターレースビデオコーディングの文脈では、IRAPフレームは、2つのピクチャの中の2つのフィールド間で分割される。第1のフィールドを伴う第1のピクチャは、IRAPピクチャとしてコーディングされる。第2のフィールドを伴う第2のピクチャは、IRAPピクチャの代わりに非先行/後端ピクチャとしてコーディングされ、それは、第2のピクチャをランダムアクセスポイントとして使用できないからである。これは、両方のピクチャが復号を開始するために必要とされ、したがって第1のピクチャをスキップすることができないからである。IRAPフレームを構成する2つのピクチャは、効率的なコーディングのために互いに隣り合って位置決めされるべきである。しかしながら、第1のIRAPフィールドを伴うIRAPピクチャの隣に第2のIRAPフィールドを伴う非先行ピクチャを位置決めすることは、VVCおよびHEVCのコーディング順序に違反する。これは、そのような位置決めがあらゆる先行ピクチャの前に非先行ピクチャを配置するからである。
本明細書において開示されるのは、インターレースビデオを符号化するために先行ピクチャを利用するビデオコーディングシステムを構成するための機構である。たとえば、先行ピクチャを利用するVVCシステムへとインターレースビデオコーディングを実装するために、フラグが利用され得る。フラグは、IRAPピクチャと任意の先行ピクチャとの間にいつ非先行ピクチャが存在し得るかをデコーダにシグナリングするために利用され得る。デコーダは、フラグを読み取り、インターレースビデオコーディングをサポートするために望まれるような順序を調整することができる。フラグが0などの第1の値に設定されるとき、先行ピクチャがもしあれば、それは非先行ピクチャのすべての前にある。しかしながら、エンコーダは、IRAPピクチャと任意の先行ピクチャとの間に単一の非先行ピクチャが位置決めされることをデコーダに示すために、1などの第2の値にフラグを設定することができる。ある例では、非先行ピクチャは、先行ピクチャ間に位置決めされないことがある。たとえば、シーケンシャルフィールドフラグ(field_seq_flag)は、この目的で利用され得る。このフラグは、シーケンスパラメータセット(SPS)に含まれてもよく、ピクチャのシーケンス全体に適用されてもよい。インターレースビデオの文脈において、フレームは複数のピクチャ(たとえば、2つ)を含み得ることに留意されたい。しかしながら、インターレースビデオの文脈以外では、フレームは単一のピクチャを含むので、フレームという用語およびピクチャという用語は交換可能に使用され得る。したがって、フレームおよびピクチャという用語の以下での使用は、インターレースコーディングの文脈で使用されない限り、限定するものと見なされるべきではない。
図1は、ビデオ信号をコーディングすることの例示的な動作方法100のフローチャートである。具体的には、ビデオ信号はエンコーダにおいて符号化される。符号化プロセスは、ビデオファイルサイズを減らすための様々な機構を利用することによってビデオ信号を圧縮する。より小さいファイルサイズは、圧縮されたビデオファイルがユーザへ送信されることを可能にしながら、関連する帯域幅オーバーヘッドを減らす。デコーダは次いで、圧縮されたビデオファイルを復号して、エンドユーザへの表示のために元のビデオ信号を再構築する。復号プロセスは一般に、デコーダがビデオ信号を安定して再構築することを可能にするために、符号化プロセスを鏡写しにしたものである。
ステップ101において、ビデオ信号がエンコーダに入力される。たとえば、ビデオ信号は、メモリに記憶された圧縮されていないビデオファイルであり得る。別の例として、ビデオファイルは、ビデオカメラなどのビデオキャプチャデバイスによって捉えられ、ビデオのライブストリーミングをサポートするために符号化され得る。ビデオファイルは、オーディオ成分とビデオ成分の両方を含み得る。ビデオ成分は、順番に見られると視覚的な動きの効果を与える一連の画像フレームを含む。フレームは、ルマ成分(またはルマサンプル)と本明細書で呼ばれる光に関して表されるピクセル、およびクロマ成分(またはカラーサンプル)と呼ばれる色に関して表現されるピクセルを含む。いくつかの例では、フレームは、三次元視聴をサポートするために深度値も含み得る。
ステップ103において、ビデオはブロックへと区分される。区分は、各フレームのピクセルを、圧縮のために正方形および/または長方形のブロックへと再分割することを含む。たとえば、高効率ビデオコーディング(HEVC)(H.265およびMPEG-H Part 2としても知られている)では、フレームをまずコーディングツリーユニット(CTU)へと分割することができ、CTUはあらかじめ定められたサイズ(たとえば、64ピクセル対64ピクセル)のブロックである。CTUはルマサンプルとクロマサンプルの両方を含む。コーディングツリーは、CTUをブロックへと分割し、次いで、さらなる符号化をサポートする構成が達成されるまでブロックを再帰的に再分割するために利用され得る。たとえば、フレームのルマ成分は、個々のブロックが比較的一様な照明値を含むまで再分割され得る。さらに、フレームのクロマ成分は、個々のブロックが比較的一様な色値を含むまで再分割され得る。したがって、区分機構はビデオフレームの内容に依存して変化する。
ステップ105において、ステップ103において区分された画像ブロックを圧縮するために様々な圧縮機構が利用される。たとえば、インター予測および/またはイントラ予測が利用され得る。インター予測は、共通のシーンにおける物体が連続するフレームに出現する傾向にあるという事実を利用するように設計される。したがって、参照フレームの中の物体を描写するブロックは、隣接フレームにおいて繰り返し記述される必要はない。具体的には、テーブルなどの物体は、複数のフレームにわたって一定の位置にとどまり得る。したがって、テーブルは一度記述され、隣接フレームは参照フレームを参照することができる。複数のフレームにわたって物体を照合するために、パターン照合機構が利用され得る。さらに、動いている物体は、たとえば物体の動きまたはカメラの動きにより、複数のフレームにまたがって表現されることがある。特定の例として、ビデオは、複数のフレームにわたって画面上を動き回る自動車を示すことがある。動きベクトルは、そのような動きを記述するために利用され得る。動きベクトルは、フレームにおける物体の座標から参照フレームにおける物体の座標までのオフセットを与える二次元ベクトルである。したがって、インター予測は、参照フレームの中の対応するブロックからのオフセットを示す動きベクトルのセットとして、現在のフレームの中の画像ブロックを符号化することができる。
イントラ予測は共通のフレームの中のブロックを符号化する。イントラ予測は、ルマ成分およびクロマ成分がフレームにおいて密集する傾向があるという事実を利用する。たとえば、木の一部における緑色の斑点は、同様の緑色の斑点の隣に位置決めされる傾向がある。イントラ予測は、複数の指向性予測モード(たとえば、HEVCでは33個)、平面モード、および直流(DC)モードを利用する。指向性モードは、現在のブロックが対応する方向における近隣ブロックのサンプルと類似する/同じであることを示す。平面モードは、行/列(たとえば、平面)に沿った一連のブロックが行の端にある近隣ブロックに基づいて補間され得ることを示す。平面モードは、実質的に、値を変化させることにより比較的一定の勾配を利用することによって、行/列にわたる光/色の滑らかな遷移を示す。DCモードは、境界平滑化のために利用され、指向性予測モードの角度方向と関連付けられるすべての近隣ブロックのサンプルと関連付けられる平均値とブロックが同様/同じであることを示す。したがって、イントラ予測ブロックは、実際の値の代わりに様々な関係予測モード値として画像ブロックを表すことができる。さらに、インター予測ブロックは、実際の値の代わりに動きベクトル値として画像ブロックを表すことができる。いずれの場合でも、予測ブロックは、いくつかの場合、画像ブロックを厳密に表現しないことがある。あらゆる差分が残差ブロックに蓄積される。ファイルをさらに圧縮するために、残差ブロックに変換が適用され得る。
ステップ107において、様々なフィルタリング技法が適用され得る。HEVCでは、フィルタはループ内フィルタリング方式に従って適用される。上で論じられたブロックベースの予測は、デコーダにおけるブロック状画像の作成をもたらし得る。さらに、ブロックベースの予測方式は、ブロックを符号化し、次いで、参照ブロックとして後で使用するために符号化されたブロックを再構築し得る。ループ内フィルタリング方式は、ノイズ抑制フィルタ、デブロッキングフィルタ、適応ループフィルタ、およびサンプル適応オフセット(SAO)フィルタをブロック/フレームに反復的に適用する。これらのフィルタは、符号化されたファイルが正確に再構築され得るように、そのようなブロッキングアーティファクトを軽減する。さらに、これらのフィルタは再構築された参照ブロックにおけるアーティファクトを軽減するので、アーティファクトは、再構築された参照ブロックに基づいて符号化される後続のブロックにおいて追加のアーティファクトを生み出す可能性がより低くなる。
ビデオ信号が区分され、圧縮され、フィルタリングされると、ステップ109において、得られるデータがビットストリームにおいて符号化される。ビットストリームは、上で論じられたデータ、ならびにデコーダにおける適切なビデオ信号の再構築をサポートするために望まれるあらゆるシグナリングデータを含む。たとえば、そのようなデータは、区分データ、予測データ、残差ブロック、およびコーディング命令をデコーダに提供する様々なフラグを含み得る。ビットストリームは、要求に応じたデコーダへの送信のためにメモリに記憶され得る。ビットストリームは、複数のデコーダへのブロードキャストおよび/またはマルチキャストでもあり得る。ビットストリームの作成は反復的なプロセスである。したがって、ステップ101、103、105、107、および109は、多数のフレームおよびブロックにわたって連続的および/または同時に発生し得る。図1に示される順序は、明確にするために、かつ議論を簡単にするために提示されており、ビデオコーディングプロセスを特定の順序に制限することは意図されていない。
ステップ111において、デコーダが、ビットストリームを受信して復号プロセスを開始する。具体的には、デコーダは、エントロピー復号方式を利用して、ビットストリームを対応するシンタックスおよびビデオデータへと変換する。ステップ111において、デコーダが、ビットストリームからのシンタックスデータを利用して、フレームに対する区分を決定する。この区分は、ステップ103におけるブロック区分の結果と一致しなければならない。ステップ111において利用されるようなエントロピー符号化/復号がここで説明される。エンコーダは、入力画像における値の空間的な位置決めに基づいて、いくつかの可能な選択肢からブロック区分方式を選択することなどの、圧縮プロセスの間に多くの選択を行う。厳密な選択のシグナリングは、多数のビンを利用し得る。本明細書では、ビンは、変数として扱われる二進値(たとえば、状況に応じて変化し得るビット値)である。エントロピーコーディングは、特定の事例に対して明らかに実行可能ではないあらゆる選択肢をエンコーダが廃棄することを可能にし、許容可能な選択肢のセットを残す。次いで、各々の許容可能な選択肢が符号語を割り当てられる。符号語の長さは、許容可能な選択肢の数に基づく(たとえば、2つの選択肢に対しては1つのビン、3つから4つの選択肢に対しては2つのビンなど)。エンコーダは次いで、選択された選択肢に対する符号語を符号化する。この方式は符号語のサイズを減らし、それは、すべての可能な選択肢の大きい可能性のあるセットからの選択を一意に示すのではなく、許容可能な選択肢の小さいサブセットからの選択を一意に示すのに望まれる程度の大きさに符号語がなるからである。デコーダは次いで、許容可能な選択肢のセットをエンコーダと同様の方式で決定することによって、選択を復号する。許容可能な選択肢のセットを決定することによって、デコーダは、符号語を読み取り、エンコーダによって行われる選択を決定することができる。
ステップ113において、デコーダがブロック復号を実行する。具体的には、デコーダは、逆変換を利用して残差ブロックを生成する。次いで、デコーダは、残差ブロックおよび対応する予測ブロックを利用して、区分に従って画像ブロックを再構築する。予測ブロックは、ステップ105においてエンコーダで生成されたようなイントラ予測ブロックとインター予測ブロックの両方を含み得る。再構築された画像ブロックは次いで、ステップ111において決定された区分データに従って、再構築されたビデオ信号のフレームへと位置決めされる。ステップ113に対するシンタックスはまた、上で論じられたようにエントロピーコーディングを介してビットストリームにおいてシグナリングされ得る。
ステップ115において、エンコーダにおいて、ステップ107と同様の方式で、再構築されたビデオ信号のフレームに対してフィルタリングが実行される。たとえば、ノイズ抑制フィルタ、デブロッキングフィルタ、適応ループフィルタ、およびSAOフィルタが、ブロッキングアーティファクトを取り除くためにフレームに適用され得る。フレームがフィルタリングされると、ビデオ信号は、エンドユーザによる視聴のために、ステップ117においてディスプレイに出力され得る。
図2は、ビデオコーディングのための例示的なコーディングおよび復号(コーデック)システム200の概略図である。具体的には、コーデックシステム200は、動作方法100の実施をサポートするための機能を提供する。コーデックシステム200は、エンコーダとデコーダの両方において利用されるコンポーネントを描写するために一般化されている。コーデックシステム200は、動作方法100においてステップ101および103に関して論じられるようなビデオ信号を受信して区分し、これは区分されたビデオ信号201をもたらす。コーデックシステム200は次いで、方法100のステップ105、107、および109に関して論じられたようなエンコーダとして動作するとき、区分されたビデオ信号201をコーディングされたビットストリームへと圧縮する。デコーダとして動作するとき、コーデックシステム200は、動作方法100のステップ111、113、115、および117に関して論じられたようなビットストリームから出力ビデオ信号を生成する。コーデックシステム200は、汎用コーダ制御コンポーネント211、変換スケーリングおよび量子化コンポーネント213、イントラピクチャ推定コンポーネント215、イントラピクチャ予測コンポーネント217、動き補償コンポーネント219、動き推定コンポーネント221、スケーリングおよび逆変換コンポーネント229、フィルタ制御分析コンポーネント227、ループ内フィルタコンポーネント225、復号ピクチャバッファコンポーネント223、ならびにヘッダフォーマッティングおよびコンテキスト適応バイナリ算術コーディング(CABAC)コンポーネント231を含む。そのようなコンポーネントは示されるように結合される。図2では、黒い線は符号化/復号されるべきデータの動きを示し、破線は他のコンポーネントの動作を制御する制御データの動きを示す。コーデックシステム200のコンポーネントは、すべてエンコーダの中に存在し得る。デコーダは、コーデックシステム200のコンポーネントのサブセットを含み得る。たとえば、デコーダは、イントラピクチャ予測コンポーネント217、動き補償コンポーネント219、スケーリングおよび逆変換コンポーネント229、ループ内フィルタコンポーネント225、ならびに復号ピクチャバッファコンポーネント223を含み得る。これらのコンポーネントがここで説明される。
区分されたビデオ信号201は、コーディングツリーによってピクセルのブロックへと区分された、キャプチャされたビデオシーケンスである。コーディングツリーは、様々な分割モードを利用して、ピクセルのブロックをピクセルのより小さいブロックへと再分割する。これらのブロックは次いで、より小さいブロックへとさらに再分割され得る。ブロックは、コーディングツリー上のノードと呼ばれ得る。より大きい親ノードは、より小さい子ノードへと分割される。ノードが再分割される回数は、ノード/コーディングツリーの深度と呼ばれる。いくつかの場合、分割されたブロックはコーディングユニット(CU)に含まれ得る。たとえば、CUは、ルマブロック、赤差分クロマ(Cr)ブロック、および青差分クロマ(Cb)ブロックを、CUに対する対応するシンタックス命令とともに含む、CTUの下位部分であり得る。分割モードは、利用される分割モードに応じて形状が変化する2つ、3つ、または4つの子ノードへとそれぞれノードを区分するために利用される、二分木(BT)、三分木(TT)、および四分木(QT)を含み得る。区分されたビデオ信号201は、圧縮のために、汎用コーダ制御コンポーネント211、変換スケーリングおよび量子化コンポーネント213、イントラピクチャ推定コンポーネント215、フィルタ制御分析コンポーネント227、ならびに動き推定コンポーネント221に転送される。
汎用コーダ制御コンポーネント211は、適用形態の制約に従って、ビデオシーケンスの画像のビットストリームへのコーディングに関する決定を行うように構成される。たとえば、汎用コーダ制御コンポーネント211は、ビットレート/ビットストリームサイズ対再構築品質の最適化を管理する。そのような決定は、記憶空間/帯域幅の利用可能性および画像解像度の要求に基づいて行われ得る。汎用コーダ制御コンポーネント211はまた、バッファのアンダーランおよびオーバーランの問題を軽減するために、送信速度を考慮してバッファ利用率を管理する。これらの問題を管理するために、汎用コーダ制御コンポーネント211は、他のコンポーネントによる区分、予測、およびフィルタリングを管理する。たとえば、汎用コーダ制御コンポーネント211は、圧縮の複雑さを動的に上げて解像度を向上させて帯域幅使用率を向上させ、または、圧縮の複雑さを下げて解像度および帯域幅使用率を低下させ得る。したがって、汎用コーダ制御コンポーネント211は、コーデックシステム200の他のコンポーネントを制御して、ビデオ信号再構築の品質とビットレートの問題のバランスをとる。汎用コーダ制御コンポーネント211は、制御データを作成し、これは他のコンポーネントの動作を制御する。制御データは、ヘッダフォーマッティングおよびCABACコンポーネント231にも転送されて、デコーダにおける復号のためのパラメータをシグナリングするためにビットストリームにおいて符号化される。
区分されたビデオ信号201はまた、インター予測のために動き推定コンポーネント221および動き補償コンポーネント219に送信される。区分されたビデオ信号201のフレームまたはスライスは、複数のビデオブロックへと分割され得る。動き推定コンポーネント221および動き補償コンポーネント219は、1つ以上の参照フレームの中の1つ以上のブロックに対して相対的な、受信されたビデオブロックのインター予測コーディングを実行して、時間予測を行う。コーデックシステム200は、複数のコーディングパスを実行して、たとえば、ビデオデータの各ブロックに対して適切なコーディングモードを選択し得る。
動き推定コンポーネント221および動き補償コンポーネント219は、高度に統合され得るが、概念上の目的で別々に示される。動き推定コンポーネント221によって実行される動き推定は、ビデオブロックの動きを推定する動きベクトルを生成するプロセスである。動きベクトルは、たとえば、予測ブロックに対して相対的なコーディングされたオブジェクトのずれを示し得る。予測ブロックは、ピクセル差分に関して、コーディングされるべきブロックによく一致することが見いだされるブロックである。予測ブロックは参照ブロックとも呼ばれ得る。そのようなピクセル差分は、絶対値差分和(SAD)、平方差分和(SSD)、または他の差分尺度によって決定され得る。HEVCは、CTU、コーディングツリーブロック(CTB)、およびCUを含む、いくつかのコーディングされたオブジェクトを利用する。たとえば、CTUをCTBへと分割することができ、次いで、CUに含めるためにCTBをCBへと分割することができる。CUは、予測データを含む予測ユニット(PU)および/またはCUのための変換された残差データを含む変換ユニット(TU)として符号化され得る。動き推定コンポーネント221は、レート歪み最適化プロセスの一部としてレート歪み分析を使用することによって、動きベクトル、PU、およびTUを生成する。たとえば、動き推定コンポーネント221は、現在のブロック/フレームのための複数の参照ブロック、複数の動きベクトルなどを決定してもよく、最良のレート歪み特性を有する参照ブロック、動きベクトルなどを選択してもよい。最良のレート歪み特性は、ビデオ再構築の品質(たとえば、圧縮によるデータ喪失の量)とコーディング効率(たとえば、最終的な符号化のサイズ)のバランスをとる。
いくつかの例では、コーデックシステム200は、復号ピクチャバッファコンポーネント223に記憶されている参照ピクチャのサブ整数ピクセル位置に対する値を計算し得る。たとえば、ビデオコーデックシステム200は、4分の1ピクセル位置、8分の1ピクセル位置、または参照ピクチャの他の分数ピクセル位置の値を補間し得る。したがって、動き推定コンポーネント221は、整数ピクセル位置と分数ピクセル位置に対する動き探索を実行して、分数ピクセル精度の動きベクトルを出力し得る。動き推定コンポーネント221は、PUの位置を参照ピクチャの予測ブロックの位置と比較することによって、インターコーディングされたスライスの中のビデオブロックのPUに対する動きベクトルを計算する。動き推定コンポーネント221は、計算された動きベクトルを符号化のために動きデータとしてヘッダフォーマッティングおよびCABACコンポーネント231に出力し、動きを動き補償コンポーネント219に出力する。
動き補償コンポーネント219によって実行される動き補償は、動き推定コンポーネント221によって決定される動きベクトルに基づいて予測ブロックをフェッチまたは生成することを伴い得る。再び、動き推定コンポーネント221および動き補償コンポーネント219は、いくつかの例では機能的に統合され得る。現在のビデオブロックのPUに対する動きベクトルを受信すると、動き補償コンポーネント219は、動きベクトルが指し示す予測ブロックを位置特定し得る。残差ビデオブロックは次いで、コーディングされている現在のビデオブロックのピクセル値から予測ブロックのピクセル値を差し引き、ピクセル差分値を形成することによって形成される。一般に、動き推定コンポーネント221は、ルマ成分に対する動き推定を実行し、動き補償コンポーネント219は、クロマ成分とルマ成分の両方に対して、ルマ成分に基づいて計算される動きベクトルを使用する。予測ブロックおよび残差ブロックは、変換スケーリングおよび量子化コンポーネント213に転送される。
区分されたビデオ信号201は、イントラピクチャ推定コンポーネント215およびイントラピクチャ予測コンポーネント217にも送信される。動き推定コンポーネント221および動き補償コンポーネント219のように、イントラピクチャ推定コンポーネント215およびイントラピクチャ予測コンポーネント217は高度に統合され得るが、概念上の目的で別々に示されている。イントラピクチャ推定コンポーネント215およびイントラピクチャ予測コンポーネント217は、上で説明されたように、フレーム間で動き推定コンポーネント221と動き補償コンポーネント219によって実行されるインター予測に対する代替として、現在のフレームの中のブロックに対して現在のブロックをイントラ予測する。具体的には、イントラピクチャ推定コンポーネント215は、現在のブロックを符号化するために使用すべきイントラ予測モードを決定する。いくつかの例では、イントラピクチャ推定コンポーネント215は、複数の試験されるイントラ予測モードから、現在のブロックを符号化するための適切なイントラ予測モードを選択する。選択されたイントラ予測モードは次いで、符号化のためにヘッダフォーマッティングおよびCABACコンポーネント231に転送される。
たとえば、イントラピクチャ推定コンポーネント215は、様々な試験されたイントラ予測モードに対するレート歪み分析を使用してレート歪み値を計算し、試験されたモードの中で最良のレート歪み特性を有するイントラ予測モードを選択する。レート歪み分析は一般に、符号化されたブロックと、符号化されたブロックを生み出すために符号化された元の符号化されていないブロックとの間の歪み(またはエラー)の量、ならびに、符号化されたブロックを生み出すために使用されるビットレート(たとえば、ビットの数)を決定する。イントラピクチャ推定コンポーネント215は、どのイントラ予測モードがブロックに対して最良のレート歪み値を示すかを決定するために、様々な符号化されたブロックに対する歪みおよびレートから比を計算する。加えて、イントラピクチャ推定コンポーネント215は、レート歪み最適化(RDO)に基づいて、深度モデリングモード(DMM)を使用して深度マップの深度ブロックをコーディングするように構成され得る。
イントラピクチャ予測コンポーネント217は、エンコーダ上で実装されるとき、イントラピクチャ推定コンポーネント215によって決定される選択されたイントラ予測モードに基づいて予測ブロックから残差ブロックを生成し、または、デコーダ上で実装されるとき、ビットストリームから残差ブロックを読み取り得る。残差ブロックは、行列として表される、予測ブロックと元のブロックとの間の値の差分を含む。残差ブロックは次いで、変換スケーリングおよび量子化コンポーネント213に転送される。イントラピクチャ推定コンポーネント215およびイントラピクチャ予測コンポーネント217は、ルマ成分とクロマ成分の両方に対して動作し得る。
変換スケーリングおよび量子化コンポーネント213は、残差ブロックをさらに圧縮するように構成される。変換スケーリングおよび量子化コンポーネント213は、離散コサイン変換(DCT)、離散サイン変換(DST)、または概念的に同様の変換などの変換を残差ブロックに適用し、残差変換係数値を備えるビデオブロックを生み出す。ウェーブレット変換、整数変換、サブバンド変換、または他のタイプの変換も使用され得る。変換は、残差情報をピクセル値領域から周波数領域などの変換領域に変換し得る。変換スケーリングおよび量子化コンポーネント213はまた、たとえば周波数に基づいて、変換された残差情報をスケーリングするように構成される。そのようなスケーリングは、異なる周波数情報が異なる粒度で量子化されるように、スケール係数を残差情報に適用することを伴い、これは、再構築されたビデオの最終的な視覚的品質に影響し得る。変換スケーリングおよび量子化コンポーネント213はまた、ビットレートをさらに低減するために変換係数を量子化するように構成される。量子化プロセスは、係数の一部またはすべてと関連付けられるビット深度を低減し得る。量子化の程度は、量子化パラメータを調整することによって修正され得る。いくつかの例では、変換スケーリングおよび量子化コンポーネント213は次いで、量子化された変換係数を含む行列の走査を実行し得る。量子化された変換係数は、ヘッダフォーマッティングおよびCABACコンポーネント231に転送されて、ビットストリームにおいて符号化される。
スケーリングおよび逆変換コンポーネント229は、動き推定をサポートするために、変換スケーリングおよび量子化コンポーネント213の逆の動作を適用する。スケーリングおよび逆変換コンポーネント229は、逆スケーリング、変換、および/または量子化を適用して、たとえば、別の現在のブロックに対する予測ブロックになり得る参照ブロックとして後で使用するために、ピクセル領域において残差ブロックを再構築する。動き推定コンポーネント221および/または動き補償コンポーネント219は、後のブロック/フレームの動き推定において使用するために残差ブロックを対応する予測ブロックに加算し戻すことによって参照ブロックを計算し得る。スケーリング、量子化、および変換の間に生み出されるアーティファクトを軽減するために、再構築された参照ブロックにフィルタが適用される。そのようなアーティファクトは、そうされなければ、後続のブロックが予測されるときに不正確な予測を引き起こす(およびさらなるアーティファクトを生み出す)ことがある。
フィルタ制御分析コンポーネント227およびループ内フィルタコンポーネント225は、フィルタを残差ブロックおよび/または再構築された画像ブロックに適用する。たとえば、スケーリングおよび逆変換コンポーネント229からの変換された残差ブロックは、元の画像ブロックを再構築するために、イントラピクチャ予測コンポーネント217および/または動き補償コンポーネント219からの対応する予測ブロックと組み合わせられ得る。フィルタは次いで、再構築された画像ブロックに適用され得る。いくつかの例では、フィルタは代わりに、残差ブロックに適用され得る。図2の他のコンポーネントのように、フィルタ制御分析コンポーネント227およびループ内フィルタコンポーネント225は高度に統合され、一緒に実装され得るが、概念上の目的で別々に図示されている。再構築された参照ブロックに適用されるフィルタは、特定の空間領域に適用され、そのようなフィルタがどのように適用されるかを調整するための複数のパラメータを含む。フィルタ制御分析コンポーネント227は、そのようなフィルタがどこで適用されるべきかを決定するために再構築された参照ブロックを分析し、対応するパラメータを設定する。そのようなデータは、符号化のためにフィルタ制御データとしてヘッダフォーマッティングおよびCABACコンポーネント231に転送される。ループ内フィルタコンポーネント225は、フィルタ制御データに基づいてそのようなフィルタを適用する。フィルタは、デブロッキングフィルタ、ノイズ抑制フィルタ、SAOフィルタ、および適応ループフィルタを含み得る。そのようなフィルタは、例に応じて、空間/ピクセル領域で(たとえば、再構築されたピクセルブロック上で)、または周波数領域で適用され得る。
エンコーダとして動作するとき、フィルタリングされた再構築された画像ブロック、残差ブロック、および/または予測ブロックは、上で論じられたような動き推定において後で使用するために、復号ピクチャバッファコンポーネント223に記憶される。デコーダとして動作するとき、復号ピクチャバッファコンポーネント223は、出力ビデオ信号の一部として、再構築されフィルタリングされたブロックを記憶してディスプレイに転送する。復号ピクチャバッファコンポーネント223は、予測ブロック、残差ブロック、および/または再構築された画像ブロックを記憶することが可能な任意のメモリデバイスであり得る。
ヘッダフォーマッティングおよびCABACコンポーネント231は、コーデックシステム200の様々なコンポーネントからデータを受信し、デコーダへの送信のためにそのようなデータをコーディングされたビットストリームへと符号化する。具体的には、ヘッダフォーマッティングおよびCABACコンポーネント231は、一般的な制御データおよびフィルタ制御データなどの制御データを符号化するために、様々なヘッダを生成する。さらに、イントラ予測および動きデータ、ならびに量子化された変換係数データの形態の残差データを含む予測データが、すべてビットストリームにおいて符号化される。最終的なビットストリームは、元の区分されたビデオ信号201を再構築するためにデコーダによって望まれるすべての情報を含む。そのような情報は、イントラ予測モードインデックステーブル(符号語マッピングテーブルとも呼ばれる)、様々なブロックに対する符号化コンテキストの定義、最も確率の高いイントラ予測モードの指示、区分情報の指示なども含み得る。そのようなデータは、エントロピーコーディングを利用することによって符号化され得る。たとえば、情報は、コンテキスト適応可変長コーディング(CAVLC)、CABAC、シンタックスベースコンテキスト適応バイナリ算術コーディング(SBAC)、確率間隔区分エントロピー(PIPE)コーディング、または別のエントロピーコーディング技法を利用することによって符号化され得る。エントロピーコーディングに続いて、コーディングされたビットストリームは、別のデバイス(たとえば、ビデオデコーダ)に送信されてもよく、または、より後の送信もしくは取り出しのためにアーカイブされてもよい。
図3は、例示的なビデオエンコーダ300を示すブロック図である。ビデオエンコーダ300は、コーデックシステム200の符号化機能を実装するために、ならびに/または動作方法100のステップ101、103、105、107、および/もしくは109を実装するために利用され得る。エンコーダ300は、入力ビデオ信号を区分し、区分されたビデオ信号201と実質的に同様である区分されたビデオ信号301をもたらす。区分されたビデオ信号301は次いで圧縮されて、エンコーダ300のコンポーネントによりビットストリームへと符号化される。
具体的には、区分されたビデオ信号301は、イントラ予測のためにイントラピクチャ予測コンポーネント317に転送される。イントラピクチャ予測コンポーネント317は、イントラピクチャ推定コンポーネント215およびイントラピクチャ予測コンポーネント217と実質的に同様であり得る。区分されたビデオ信号301はまた、復号ピクチャバッファコンポーネント323の中の参照ブロックに基づくインター予測のために動き補償コンポーネント321に転送される。動き補償コンポーネント321は、動き推定コンポーネント221および動き補償コンポーネント219と実質的に同様であり得る。イントラピクチャ予測コンポーネント317および動き補償コンポーネント321からの予測ブロックおよび残差ブロックは、残差ブロックの変換および量子化のために変換および量子化コンポーネント313に転送される。変換および量子化コンポーネント313は、変換スケーリングおよび量子化コンポーネント213と実質的に同様であり得る。変換され量子化された残差ブロックおよび対応する予測ブロックは(関連する制御データとともに)、ビットストリームへのコーディングのためにエントロピーコーディングコンポーネント331に転送される。エントロピーコーディングコンポーネント331は、ヘッダフォーマッティングおよびCABACコンポーネント231と実質的に同様であり得る。
変換され量子化された残差ブロックおよび/または対応する予測ブロックは、動き補償コンポーネント321により使用される参照ブロックへの再構築のために、変換および量子化コンポーネント313から逆変換および量子化コンポーネント329にも転送される。逆変換および量子化コンポーネント329は、スケーリングおよび逆変換コンポーネント229と実質的に同様であり得る。ループ内フィルタコンポーネント325の中のループ内フィルタは、例に応じて、残差ブロックおよび/または再構築された参照ブロックにも適用される。ループ内フィルタコンポーネント325は、フィルタ制御分析コンポーネント227およびループ内フィルタコンポーネント225と実質的に同様であり得る。ループ内フィルタコンポーネント325は、ループ内フィルタコンポーネント225に関して論じられたような複数のフィルタを含み得る。フィルタリングされたブロックは次いで、動き補償コンポーネント321により参照ブロックとして使用するために、復号ピクチャバッファコンポーネント323に記憶される。復号ピクチャバッファコンポーネント323は、復号ピクチャバッファコンポーネント223と実質的に同様であり得る。
図4は、例示的なビデオデコーダ400を示すブロック図である。ビデオデコーダ400は、コーデックシステム200の復号機能を実装するために、ならびに/または動作方法100のステップ111、113、115、および/もしくは117を実施するために利用され得る。デコーダ400は、たとえばエンコーダ300から、ビットストリームを受信し、エンドユーザに表示するために、再構築された出力ビデオ信号をビットストリームに基づいて生成する。
ビットストリームは、エントロピー復号コンポーネント433によって受信される。エントロピー復号コンポーネント433は、CAVLC、CABAC、SBAC、PIPEコーディング、または他のエントロピーコーディング技法などのエントロピー復号方式を実装するように構成される。たとえば、エントロピー復号コンポーネント433は、ビットストリームにおいて符号語として符号化される追加のデータを解釈するためのコンテキストを提供するために、ヘッダ情報を利用し得る。復号された情報は、一般的な制御データ、フィルタ制御データ、区分情報、動き情報、予測データ、および残差ブロックからの量子化された変換係数などの、ビデオ信号を復号するための任意の望まれる情報を含む。量子化された変換係数は、残差ブロックへの再構築のために逆変換および量子化コンポーネント429に転送される。逆変換および量子化コンポーネント429は、逆変換および量子化コンポーネント329と同様であり得る。
再構築された残差ブロックおよび/または予測ブロックは、イントラ予測動作に基づいて、画像ブロックへの再構築のためにイントラピクチャ予測コンポーネント417に転送される。イントラピクチャ予測コンポーネント417は、イントラピクチャ推定コンポーネント215およびイントラピクチャ予測コンポーネント217と同様であり得る。具体的には、イントラピクチャ予測コンポーネント417は、フレームの中で参照ブロックを位置特定するために予測モードを利用し、残差ブロックを結果に適用してイントラ予測された画像ブロックを再構築する。再構築されたイントラ予測された画像ブロックおよび/または残差ブロックならびに対応するインター予測データは、ループ内フィルタコンポーネント425を介して復号ピクチャバッファコンポーネント423に転送され、これらは、復号ピクチャバッファコンポーネント223およびループ内フィルタコンポーネント225とそれぞれ実質的に同様であり得る。ループ内フィルタコンポーネント425は、再構築された画像ブロック、残差ブロック、および/または予測ブロックをフィルタリングし、そのような情報は復号ピクチャバッファコンポーネント423に記憶される。復号ピクチャバッファコンポーネント423からの再構築された画像ブロックは、インター予測のために動き補償コンポーネント421に転送される。動き補償コンポーネント421は、動き推定コンポーネント221および/または動き補償コンポーネント219と実質的に同様であり得る。具体的には、動き補償コンポーネント421は、参照ブロックからの動きベクトルを利用して予測ブロックを生成し、残差ブロックを結果に適用して画像ブロックを再構築する。得られる再構築されたブロックはまた、ループ内フィルタコンポーネント425を介して復号ピクチャバッファコンポーネント423に転送され得る。復号ピクチャバッファコンポーネント423は、追加の再構築された画像ブロックを記憶し続け、これらは区分情報を介してフレームへと再構築され得る。そのようなフレームは、シーケンスにも配置されてもよい。シーケンスは、再構築された出力ビデオ信号としてディスプレイに出力される。
図5は、先行ピクチャを伴う例示的なCVS500を示す概略図である。たとえば、CVS500は、方法100に係る、コーデックシステム200および/またはエンコーダ300などのエンコーダによって符号化され得る。さらに、CVS500は、コーデックシステム200および/またはデコーダ400などのデコーダによって復号され得る。CVS500は、復号順序508でコーディングされるピクチャを含む。復号順序508は、ピクチャがビットストリームにおいて位置決めされる順序である。CVS500のピクチャは次いで、提示順序510で出力される。提示順序510は、得られたビデオを適切に表示させるためにデコーダによってピクチャが表示されるべき順序である。たとえば、CVS500のピクチャは、一般に提示順序510で位置決めされ得る。しかしながら、たとえばインター予測をサポートするために類似したピクチャをより近くに配置することによって、コーディング効率を高めるために、いくつかのピクチャが異なる位置へと移動され得る。このようにそのようなピクチャを動かすと、復号順序508が得られる。示される例では、ピクチャは、0から4まで復号順序508でインデックスをつけられる。提示順序510において、インデックス2およびインデックス3におけるピクチャは、インデックス0におけるピクチャの前に移動されている。
CVS500はIRAPピクチャ502を含む。IRAPピクチャ502は、CVS500のためのランダムアクセスポイントとして役割を果たす、イントラ予測に従ってコーディングされるピクチャである。具体的には、IRAPピクチャ502のブロックは、IRAPピクチャ502の他のブロックへの参照によってコーディングされる。IRAPピクチャ502は他のピクチャを参照せずにコーディングされるので、いずれの他のピクチャも先に復号することなく、IRAPピクチャ502が復号され得る。したがって、デコーダは、IRAPピクチャ502においてCVS500の復号を開始することができる。さらに、IRAPピクチャ502により、DPBがリフレッシュされるようになり得る。たとえば、IRAPピクチャ502の後に提示される大半のピクチャは、インター予測のためにIRAPピクチャ502の前のピクチャ(たとえば、ピクチャインデックス0)に依存しなくてもよい。したがって、ピクチャバッファは、IRAPピクチャ502が復号されるとリフレッシュされ得る。これには、あらゆるインター予測関連のコーディングエラーを止める効果があり、それは、そのようなエラーはIRAPピクチャ502を通って広がることができないからである。IRAPピクチャ502は、様々なタイプのピクチャを含み得る。たとえば、IRAPピクチャは、瞬時デコーダリフレッシュ(IDR)またはクリーンランダムアクセス(CRA)としてコーディングされ得る。IDRは、新しいCVS500を開始してピクチャバッファをリフレッシュする、イントラコーディングされたピクチャである。CRAは、新しいCVS500を開始することなく、またはピクチャバッファをリフレッシュすることなく、ランダムアクセスポイントとして動作するイントラコーディングされたピクチャである。このようにして、CRAと関連付けられる先行ピクチャ504はCRAの前のピクチャを参照することがあるが、IDRと関連付けられる先行ピクチャ504はIDRの前のピクチャを参照しないことがある。
CVS500は様々な非IRAPピクチャも含む。これらは、先行ピクチャ504および後端ピクチャ506を含む。先行ピクチャ504は、復号順序508においてIRAPピクチャ502の後に位置決めされるが、提示順序510においてIRAPピクチャ502の前に位置決めされるピクチャである。後端ピクチャ506は、復号順序508と提示順序510の両方においてIRAPピクチャ502の後に位置決めされる。先行ピクチャ504および後端ピクチャ506はともに、大半の場合、インター予測に従ってコーディングされる。後端ピクチャ506は、IRAPピクチャ502またはIRAPピクチャ502の後に位置決めされるピクチャを参照してコーディングされる。したがって、後端ピクチャ506は、IRAPピクチャ502が復号されると常に復号されることが可能である。先行ピクチャ504は、ランダムアクセススキップ先行(RASL)ピクチャおよびランダムアクセス復号可能先行(RADL)ピクチャを含み得る。RASLピクチャは、IRAPピクチャ502の前のピクチャへの参照によってコーディングされるが、IRAPピクチャ502の後の位置においてコーディングされる。RASLピクチャは以前のピクチャに依存するので、IRAPピクチャ502においてデコーダが復号を開始するとき、RASLピクチャを復号することはできない。したがって、RASLピクチャは、IRAPピクチャ502がランダムアクセスポイントとして使用されるとき、スキップされ、復号されない。しかしながら、デコーダがランダムアクセスポイントとして前のIRAPピクチャ(インデックス0より前にあり示されていない)を使用するとき、RASLピクチャが復号されて表示される。RADLピクチャは、IRAPピクチャ502および/またはIRAPピクチャ502の後のピクチャを参照してコーディングされるが、提示順序においてIRAPピクチャ502の前に位置決めされる。RADLピクチャはIRAPピクチャ502の前のピクチャに依存しないので、IRAPピクチャ502がランダムアクセスポイントであるとき、RADLピクチャを復号して表示することができる。
図6A~図6Cは、インターレースビデオコーディングの例を集合的に示す概略図である。インターレースビデオコーディングは、図6Aおよび図6Bに示されるような第1のピクチャ601および第2のピクチャ602から、図6Cに示されるようなインターレースビデオフレーム600を生成する。たとえば、インターレースビデオコーディングは、インターレースビデオフレーム600を含むビデオを方法100の一部として符号化するとき、コーデックシステム200および/またはエンコーダ300などのエンコーダによって利用され得る。さらに、コーデックシステム200および/またはデコーダ400などのデコーダは、インターレースビデオフレーム600を含むビデオを復号し得る。加えて、インターレースビデオフレーム600は、以下で図7に関してより詳しく論じられるような、CVS500などのCVSに符号化され得る。
インターレースビデオコーディングを実行するとき、図6Aに示されるように、第1のフィールド610は第1の時間においてキャプチャされ、第1のピクチャ601へと符号化される。第1のフィールド610は、ビデオデータの水平線を含む。具体的には、第1のフィールド610の中のビデオデータの水平線は、第1のピクチャ601の左の境界から第1のピクチャ601の右の境界に延びる。しかしながら、第1のフィールド610はビデオデータの行を交互に省略する。ある例示的な実装形態では、第1のフィールド610は、第1の時間においてビデオキャプチャデバイスによってキャプチャされたビデオデータの半分を含む。
図6Bに示されるように、第2のフィールド612は、第2の時間においてキャプチャされ、第2のピクチャ602へと符号化される。たとえば、第2の時間は、ビデオのためのフレームレートセットに基づいて設定される値だけ第1の時間の直後にあり得る。たとえば、15フレーム毎秒(FPS)というフレームレートで表示するように設定されるビデオでは、第2の時間は第1の時間から15分の1秒後にあり得る。示されるように、第2のフィールド612は、第1のピクチャ601の第1のフィールド610の水平線を補完するビデオデータの水平線を含む。具体的には、第2のフィールド612の中のビデオデータの水平線は、第2のピクチャ602の左の境界から第2のピクチャ602の右の境界に延びる。第2のフィールド612は、第1のフィールド610によって省略される水平線を含む。加えて、第2のフィールド612は、第1のフィールド610に含まれる水平線を省略する。
第1のピクチャ601の第1のフィールド610および第2のピクチャ602の第2のフィールド612は、図6Cに示されるようにインターレースビデオフレーム600としてデコーダにおいて表示するために合成され得る。具体的には、インターレースビデオフレーム600は、第1の時間においてキャプチャされた第1のピクチャ601の第1のフィールド610および第2の時間においてキャプチャされた第2のピクチャ602の第2のフィールド612を含む。そのような合成には、動きを強調および/または誇張する視覚的な効果がある。ビデオの一部として表示されると、一連のインターレースビデオフレーム600は、追加のフレームを実際に符号化する必要なく、向上したフレームレートでビデオが符号化されているかのような印象を生み出す。このようにして、インターレースビデオフレーム600を利用するインターレースビデオコーディングは、ビデオデータサイズの増大を伴うことなく、ビデオの実効的なフレームレートを上げることができる。したがって、インターレースビデオコーディングは、符号化されたビデオシーケンスのコーディング効率を向上させ得る。
図7は、たとえばインターレースビデオフレーム600を作成するためのインターレースビデオコーディングと、先行ピクチャとの両方を利用する例示的なCVS700を示す概略図である。CVS700は、かなりCVS500に似ているが、第1のピクチャ601および第2のピクチャ602などのフィールドを伴うピクチャを符号化しながら先行ピクチャを保持するように修正される。たとえば、CVS700は、方法100に係る、コーデックシステム200および/またはエンコーダ300などのエンコーダによって符号化され得る。さらに、CVS700は、コーデックシステム200および/またはデコーダ400などのデコーダによって復号され得る。
CVS700は、復号順序708および提示順序710を有し、これはそれぞれ、復号順序508および提示順序510にかなり似た方式で動作する。CVS700はまた、IRAPピクチャ702、先行ピクチャ704、および後端ピクチャ706を含み、これらは、IRAPピクチャ502、先行ピクチャ504、および後端ピクチャ506に似ている。違いは、IRAPピクチャ702、先行ピクチャ704、および後端ピクチャ706はすべて、図6A~図6Cに関して説明されたように、第1のフィールド610および第2のフィールド612とかなり似た方式でフィールドを利用することによってコーディングされるということである。したがって、各フレームは2つのピクチャを含む。したがって、CVS700はCVS500の2倍のピクチャを含む。しかしながら、CVS700は、CVS700のピクチャが各々フレームの半分を省略するので、CVS500と概ね同じ量のデータを含む。
CVS700についての問題は、イントラ予測コーディングされたデータの第1のフィールドを含めることによってIRAPピクチャ702が符号化されるということである。次いで、イントラ予測コーディングされたデータの第2のフィールドが、非先行ピクチャ703に含まれる。非先行ピクチャ703はIRAPピクチャ702ではなく、それは、デコーダが非先行ピクチャ703においてCVS700の復号を開始できないからである。これは、そうすることでIRAPピクチャ702と関連付けられるフレームの半分を省略するからである。これは、VVCを利用するビデオコーディングシステムが復号順序708においてIRAPピクチャ702の直後に先行ピクチャ704を位置決めするように制約され得るので、問題を生み出す。
本開示は、CVS700がVVCシステムにより利用されることを許容する。具体的には、IRAPピクチャ702と先行ピクチャ704との間に単一の非先行ピクチャ703が位置決めされることがいつ許容されるかを示すために、フラグがシグナリングされ得る。ビデオシステムはそれでも、非先行ピクチャ703および/または後端ピクチャ706が先行ピクチャ704間で位置決めされるのを防ぐように制約され得る。したがって、このフラグは、復号順序708が、IRAPピクチャ702、単一の非先行ピクチャ703、任意の先行ピクチャ704(たとえば、先行ピクチャ704は任意選択でありいくつかの例では省略され得る)、次いで1つ以上の後端ピクチャ706を含むことを示し得る。したがって、このフラグは、CVS500を予期すべきであるか、またはCVS700を予期すべきであるかをデコーダに示すことができる。いくつかの例では、SPSの中のfield_seq_flagは、以下で論じられるような目的で利用され得る。
図8は、インターレースビデオコーディングと先行ピクチャの両方を含むように構成される例示的なビットストリーム800を示す概略図である。たとえば、ビットストリーム800は、方法100に係るコーデックシステム200および/またはデコーダ400によって復号するための、コーデックシステム200および/またはエンコーダ300によって生成され得る。さらに、ビットストリーム800は、CVS500および/または700を含み得る。したがって、ビットストリーム800は、インターレースビデオフレーム600を作成するために合成され得る第1のピクチャ601および第2のピクチャ602を含み得る。さらに、ビットストリーム800は先行ピクチャ504および/または704を含み得る。
ビットストリーム800は、SPS810、複数のピクチャパラメータセット(PPS)811、複数のスライスヘッダ815、および画像データ820を含む。SPS810は、ビットストリーム800に含まれるコーディングされたビデオシーケンスの中のすべてのピクチャに共通のシーケンスデータを含む。そのようなデータは、ピクチャサイズ、ビット深度、コーディングツールパラメータ、ビットレート制限などを含み得る。PPS811は、ピクチャ全体に適用されるパラメータを含む。したがって、ビデオシーケンスの中の各ピクチャは、PPS811を参照し得る。各ピクチャはPPS811を参照するが、いくつかの例では、単一のPPS811は複数のピクチャのためのデータを含み得ることに留意されたい。たとえば、複数の類似するピクチャは、類似するパラメータに従ってコーディングされ得る。そのような場合、単一のPPS811はそのような類似するピクチャのためのデータを含み得る。PPS811は、対応するピクチャの中のスライスに利用可能なコーディングツール、量子化パラメータ、オフセットなどを示すことができる。スライスヘッダ815は、ピクチャの中の各スライスに固有のパラメータを含む。したがって、ビデオシーケンスの中のスライスごとに1つのスライスヘッダ815があり得る。スライスヘッダ815は、スライスタイプ情報、ピクチャ順序カウント(POC)、参照ピクチャリスト、予測重み、タイルエントリポイント、デブロッキングパラメータなどを含み得る。スライスヘッダ815はまた、いくつかの文脈ではタイルグループヘッダとも呼ばれ得ることに留意されたい。
画像データ820は、インター予測および/またはイントラ予測に従って符号化されるビデオデータ、ならびに対応する変換され量子化される残差データを含む。たとえば、ビデオシーケンスは複数のフレーム821を含む。フレーム821は、ビデオシーケンスの中の対応する瞬間におけるユーザへの完全なまたは部分的な表示を意図されている完全な画像である。フレーム821は1つ以上のピクチャ823を含み得る。大半の文脈において、フレーム821は単一のピクチャ823を含む。そのような場合、単一のアクセスユニット(AU)に含まれるピクチャ823画像/フレーム821。しかしながら、インターレースビデオの文脈では、ピクチャ823は、第1のフィールド610または第2のフィールド612などの、AUに含まれる水平線のフィールドである。したがって、フレーム821は、インターレースビデオコーディングを利用するとき、2つのピクチャ823から生成され得る。ピクチャ823は1つ以上のスライス825を含む。スライス825は、単一のネットワーク抽象化レイヤ(NAL)ユニットに独占的に含まれるピクチャ823の整数個の完全なタイルまたは整数個の連続する完全なコーディングツリーユニット(CTU)行(たとえば、タイル内の)として定義され得る。したがって、スライス725はさらに、CTUおよび/またはコーディングツリーブロック(CTB)へと分割される。CTU/CTBはさらに、コーディングツリーに基づいてコーディングブロックへと分割される。コーディングブロックは次いで、予測機構に従って符号化/復号され得る。
ビットストリーム800はfield_seq_flag827を含み得る。field_seq_flag827は、CVS500に示されるように、IRAPピクチャと関連付けられる任意の先行ピクチャが、コーディング順序において、IRAPピクチャと関連付けられるすべての非先行ピクチャの前にあるとき、第1の値に設定され得る。このフラグは、CVS700に示されるように、非先行ピクチャが、コーディング順序において、IRAPピクチャと関連付けられる最初の先行ピクチャの前にあり、復号順序において最初の先行ピクチャと最後の先行ピクチャとの間に先行ピクチャが位置決めされないとき、第2の値に設定され得る。この場合、IRAPピクチャはフレームの第1のフィールドを含み、最初の先行ピクチャの前にある非先行ピクチャはフレームの第2のフィールドを含む。示される例では、field_seq_flag827はSPS810に含まれ得る。具体的な例として、field_seq_flag827は、フレーム821のフィールドを表すピクチャ823をコーディングされたビデオシーケンスが含むことを示すとき、1に設定されてもよく、または、完全なフレーム821を各々表すピクチャ823をコーディングされたビデオシーケンスを含むことを示すとき、0に設定されてもよい。したがって、デコーダは、field_seq_flag827を読み取り、IRAPピクチャおよび1つ以上の非先行ピクチャを復号することがIRAPピクチャからの第1のフィールドと最初の先行ピクチャの前にある非先行ピクチャからの第2のフィールドとをインターレースして単一のフレームを作成することをいつ含むべきであるかを決定することができる。したがって、field_seq_flag827は、先行ピクチャに関連してインターレースビデオコーディングが利用されることを可能にする。したがって、field_seq_flag827を利用することは、エンコーダおよび/またはデコーダの機能を高める。さらに、field_seq_flag827を利用することは、ビデオシーケンスをコーディングするために必要とされるデータの量を大きく増やすことなく実効的なフレームレートの向上を可能にすることによって、ビットストリーム800のコーディング効率を上げ得る。したがって、field_seq_flag827を利用することは、エンコーダおよび/またはデコーダにおける、プロセッサ、メモリ、および/またはネットワーク送信リソースの使用量を減らし得る。
ここで、上記の情報が本明細書において以下でより詳しく説明される。IRAPピクチャは、様々な有益な機能を提供するが、圧縮効率に対する不利益を生み出す。IRAPピクチャの存在は、ビットレートの急上昇を引き起こし得る。圧縮効率に対するこの不利益は、複数の理由で引き起こされ得る。たとえば、IRAPピクチャはイントラ予測されたピクチャであるので、IRAPピクチャは、インター予測されたピクチャと比較して表現するためにより多くのビットを必要とする。さらに、IRAPピクチャの存在は時間的な予測を壊し得る。これは、デコーダがIRAPピクチャを受信すると復号プロセスをリフレッシュし得るからであり、これはDPBにおける以前の参照ピクチャの除去をもたらす。これにより、インター予測コーディングを実行するときにより少数の参照ピクチャへのアクセスをそのようなが有するので、復号順序においてIRAPピクチャの後にあるピクチャのコーディングがより非効率になり得る。
IRAPピクチャとして使用されるピクチャタイプの中で、IDRピクチャは、他のピクチャタイプと比較して異なるシグナリングおよび導出を利用し得る。違いのいくつかは次の通りである。IDRピクチャのPOC値をシグナリングおよび/または導出するとき、POCの最上位ビット(MSB)部分は、以前のキーピクチャから導出されないことがある。代わりに、POCのMSBは0に等しく設定され得る。さらに、IDRピクチャのスライスヘッダは、参照ピクチャ管理を実行する際にデコーダを支援するための情報を含まないことがある。CRA、後端、および時間サブレイヤアクセス(TSA)などの他のピクチャタイプに対して、参照ピクチャセット(RPS)または参照ピクチャリストなどの情報は、スライスヘッダに含まれ、参照ピクチャマーキングプロセスのために利用され得る。ピクチャマーキングプロセスは、参照のために使用されるか、または参照のために使用されないかのいずれかであるものとして、DPBの中の参照ピクチャのステータスを決定するために利用される。しかしながら、IDRピクチャに対して、そのような情報は、参照のために使用されないものとしてDPBの中のすべての参照ピクチャを復号プロセスが単にマークすべきであることをIDRの存在が示すので、シグナリングされないことがある。
加えて、先行ピクチャはIRAPと関連付けられ得る。先行ピクチャは、復号順序においてその関連するIRAPピクチャの後にあるが出力順序においてIRAPピクチャの前にあるピクチャである。コーディング構成およびピクチャ参照構造に応じて、先行ピクチャはさらに2つのタイプへと識別され得る。RASLピクチャとして知られているピクチャの第1のタイプは、関連するIRAPピクチャにおいて復号プロセスが開始するとき、正しく復号されないことがある先行ピクチャである。このことは、復号順序においてIRAPピクチャの前にあるピクチャを参照してこれらの先行ピクチャがコーディングされるので、起こり得る。RADLピクチャとして知られているピクチャの第2のタイプは、復号プロセスが関連するIRAPピクチャにおいて開始するときでも正しく復号されることになる先行ピクチャである。これは、これらの先行ピクチャが、直接または間接的に、復号順序においてIRAPピクチャの前にあるあらゆるピクチャを参照することなくコーディングされるので可能である。いくつかのビデオコーディングシステムでは、IRAPピクチャと関連付けられるRASLピクチャは、出力順序において同じIRAPピクチャと関連付けられるRADLピクチャの前にあるように制約される。
IRAPピクチャおよび先行ピクチャは、それらがシステムレベルアプリケーションによって容易に識別され得るように、所与の異なるNALユニットタイプであり得る。たとえば、ビデオ接合器は、コーディングされたビットストリームの中の詳細なシンタックス要素を考慮する必要なく、コーディングされたピクチャタイプを理解し得る。たとえば、接合は、後端ピクチャからのRASLピクチャおよびRADLピクチャを決定することを含めて、非IRAPピクチャからのIRAPピクチャを識別し、先行ピクチャを識別することが必要であり得る。後端ピクチャは、IRAPピクチャと関連付けられ、出力順序においてIRAPピクチャの後にあるピクチャである。現在のピクチャは、現在のピクチャが復号順序においてIRAPピクチャの後にあり、復号順序において任意の他のIRAPピクチャの前にあるとき、IRAPピクチャと関連付けられる。したがって、IRAPピクチャおよび先行ピクチャに対応するNALユニットタイプを提供することは、そのような適用例の機能性を支える。
いくつかのビデオコーディングシステムでは、IRAPピクチャおよび先行ピクチャのためのNALユニットタイプは、以下を含み得る。先行ピクチャを伴うブロークンリンクアクセス(BLA)(BLA_W_LP)は、復号順序において1つ以上の先行ピクチャが後にあり得るBLAピクチャのためのNALユニットである。RADLを伴うBLA(BLA_W_RADL)は、復号順序において1つ以上のRADLピクチャが後にあり得るがRASLピクチャが後にないことがあるBLAピクチャのためのNALユニットである。先行ピクチャを伴わないBLA(BLA_N_LP)は、復号順序において先行ピクチャが後にないBLAピクチャのNALユニットである。RADLを伴うIDR(IDR_W_RADL)は、復号順序において1つ以上のRADLピクチャが後にあり得るがRASLピクチャが後にないことがあるIDRピクチャのNALユニットである。先行ピクチャを伴わないIDR(IDR_N_LP)は、復号順序において先行ピクチャが後にないIDRピクチャのNALユニットである。CRAは、RASLピクチャおよび/またはRADLピクチャを含む先行ピクチャが後にあり得るCRAピクチャのNALユニットである。RADLはRADLピクチャのNALユニットである。RASLはRASLピクチャのNALユニットである。
他のビデオコーディングシステムは、IRAPおよび先行ピクチャのために以下のNALユニットタイプを利用し得る。IDR_W_RADLは、復号順序において1つ以上のRADLピクチャが後にあり得るがRASLピクチャが後にないことがある、IDRピクチャのNALユニットである。IDR_N_LPは、復号順序において先行ピクチャが後にないIDRピクチャのNALユニットである。CRAは、RASLピクチャおよび/またはRADLピクチャなどの先行ピクチャが後にあり得るCRAピクチャのNALユニットである。RADLはRADLピクチャのNALユニットである。RASLはRASLピクチャのNALユニットである。
ビットストリーム適合のために、いくつかの制約が、たとえばHEVCおよび/またはVVCシステムにおける先行ピクチャに適用され得る。そのような制約は次の通りである。復号順序においてビットストリームの中の最初のピクチャ以外の各ピクチャは、復号順序において前のIRAPピクチャと関連付けられると見なされ得る。ピクチャがIRAPピクチャの先行ピクチャであるとき、ピクチャはRADLまたはRASLピクチャであるものとする。ピクチャがIRAPピクチャの後端ピクチャであるとき、ピクチャはRADLピクチャまたはRASLピクチャではないものとする。ピクチャがIRAPピクチャの先行ピクチャであるとき、ピクチャは、復号順序において、同じIRAPピクチャと関連付けられるすべての後端ピクチャの前にあるものとする。RASLピクチャはIDRピクチャと関連付けられないものとする。RADLピクチャはIDR_N_LPに等しいnal_unit_typeを有するIDRピクチャと関連付けられないものとする。IRAPアクセスユニットの前のすべてのアクセスユニットを廃棄することによって、ランダムアクセスがIRAPアクセスユニットの位置において実行され得ることに留意されたい。そのようなランダムアクセスは、復号順序において、IRAPピクチャおよびすべての後続の非RASLピクチャを正しく復号することをもたらし得る。各パラメータセットが利用可能であると仮定すると、そのようなパラメータセットがアクティブ化されるべきであるとき、ビットストリームの中で、またはユーザ入力などの外部の手段によってのいずれかで、そのようなランダムアクセスが実行され得る。さらに、復号順序においてIRAPピクチャの前にあるあらゆるピクチャが、出力順序においてIRAPピクチャの前にあり、出力順序においてIRAPピクチャと関連付けられる任意のRADLピクチャの前にあるものとする。CRAピクチャと関連付けられる任意のRASLピクチャが、出力順序においてCRAピクチャと関連付けられる任意のRADLピクチャの前にあるものとする。CRAピクチャと関連付けられる任意のRASLピクチャは、出力順序において、復号順序でCRAピクチャの前にあるあらゆるIRAPピクチャの後にあるものとする。
したがって、上で説明されたような先行ピクチャに関するビットストリーム適合制約は、インターレースビデオコーディング機構と競合し得る。競合は次の通りである。インターレースコーディングが使用されるとき、IRAPピクチャの2つのフィールドはともにIRAPピクチャとしてマークされない。代わりに、第1のフィールドだけがIRAPピクチャとしてマークされ、第2のフィールドが後端ピクチャとしてマークされる。ピクチャの第2のフィールドを含むインターレース後端ピクチャは、復号順序においてインターレースIRAPピクチャの直後にあるべきである。これは、インターレースIRAPピクチャおよびインターレース後端ピクチャが完全なフレームをなすからである。先行ピクチャが復号順序においてIRAPピクチャの後にある場合、次いで、ピクチャがIRAPピクチャの先行ピクチャであるとき、ピクチャは、復号順序において、同じIRAPピクチャと関連付けられるすべての後端ピクチャより前にあるものとするということを述べる制約に違反する。上記の制約は、IRAPと関連付けられる先行ピクチャがあるかどうか、およびすべての先行ピクチャが考慮されたかどうかを効率的に決定する際に、ビデオ接合器などの外部エンティティを助け得るので、それらの制約を単純に取り除くことはできない。そのような外部エンティティは次のように動作し得る。IRAPピクチャから開始して、IRAPピクチャの直後のピクチャが後端ピクチャである場合、外部エンティティは、IRAPピクチャと関連付けられる先行ピクチャはないと決定することができる。したがって、IRAPピクチャと関連付けられるすべての先行ピクチャを探すために、外部エンティティは、この制約に基づいて、復号順序においてIRAPピクチャの後にある最初の後端ピクチャを見つけ得る。上記の制約がなければ、外部エンティティは、IRAPピクチャと関連付けられるすべての先行ピクチャを見つけるために、次のIRAPピクチャまで探すことが必要とされ得る。
一般に、本開示は、IRAPピクチャと関連付けられる先行ピクチャを扱うための方法を説明する。より具体的には、本開示は、IRAPピクチャと関連付けられる先行ピクチャを効率的に探して特定しながら、インターレースビデオコンテンツの効率的なコーディングをサポートするための方法を説明する。本技法の説明は、ITU-TおよびISO/IECのJVETによるVVC規格に基づいて説明される。しかしながら、本技法は他のビデオコーデック規格にも適用され得る。
上で列挙された問題を解決するために、本開示は以下の態様を含み、これらは個別に、または組み合わせて適用され得る。たとえば、IRAPピクチャと関連付けられる先行ピクチャは、復号順序において間に非先行ピクチャを伴わずに連続して位置決めされ得る。さらに、以下の制約は、IRAPピクチャおよび先行ピクチャのビットストリーム適合のために適用される。picAおよびpicBをそれぞれ、IRAPピクチャと関連付けられる最初の先行ピクチャおよび最後の先行ピクチャとする。そのような場合、復号順序においてそれぞれpicAの後にありpicBの前にある、先行ピクチャではないピクチャはないものとする。
以下の制約も適用され得る。field_seq_flagが0に等しく設定され、現在のピクチャがIRAPピクチャと関連付けられる先行ピクチャである場合、現在のピクチャは、復号順序において、同じIRAPピクチャと関連付けられるすべての非先行ピクチャの前にある。そうではなく、field_seq_flagが1に等しく設定される場合、picAおよびpicBを、復号順序において、それぞれIRAPピクチャと関連付けられる最初の先行ピクチャおよび最後の先行ピクチャとする。そのような場合、復号順序においてpicAより前に多くても1つの非先行ピクチャしかないものとし、復号順序においてpicAの後にあり復号順序においてpicBより前にある非先行ピクチャはないものとする。
以下の制約も適用され得る。general_frame_only_constraint_flagが1に等しく、現在のピクチャがIRAPピクチャと関連付けられる先行ピクチャである場合、現在のピクチャは、復号順序において、同じIRAPピクチャと関連付けられるすべての非先行ピクチャの前にあるものとする。そうではなく、general_frame_only_constraint_flagが0に等しい場合、picAおよびpicBをそれぞれ、復号順序において、IRAPピクチャと関連付けられる最初および最後の先行ピクチャとする。そのような場合、復号順序においてpicAより前には多くても1つの非先行ピクチャしかないものとし、復号順序においてpicAより後にあり復号順序においてpicBより前にある非先行ピクチャはないものとする。
ある例では、IRAPピクチャのNALユニットタイプは、IRAPピクチャと関連付けられる先行ピクチャが存在するかどうかを決定するために十分な情報を提供する。このために、以下の方法が使用され得る。NALユニットタイプCRA_NUTは、先行ピクチャがCRAピクチャと関連付けられることを示すためにCRA_W_LPで置き換えられ、および/または、先行ピクチャがCRAピクチャと関連付けられないことを示すためにCRA_N_LPで置き換えられ得る。別の例では、NALユニットタイプIDR_W_RADL、IDR_N_LP、およびCRA_NUTは、先行ピクチャがIRAPピクチャと関連付けられることを示すためにIRAP_W_LPで置き換えられ、先行ピクチャがIRAPピクチャと関連付けられないことを示すためにIRAP_N_LPで置き換えられ得る。
ある例では、以下のことが、CRA_W_LP、CRA_N_LP、IDR_W_RADL、およびIDR_N_LPに当てはまり得る。IDR_N_LPに等しいNalUnitTypeを有するIDRピクチャは、ビットストリームに存在するいずれの先行ピクチャとも関連付けられない。IDR_W_RADLに等しいNalUnitTypeを有するIDRピクチャは、ビットストリームに存在するRASLピクチャと関連付けられず、ビットストリームの中のRADLピクチャと関連付けられ得る。CRA_N_LPに等しいNalUnitTypeを有するCRAピクチャは、ビットストリームに存在する先行ピクチャと関連付けられない。CRA_W_LPに等しいNalUnitTypeを有するCRAピクチャは、ビットストリームの中の先行ピクチャと関連付けられ得る。
ある例では、Stream Access Point(SAP)タイプへの上記のNALユニットタイプのマッピングは次の通りである。IDR_N_LPおよびCRA_N_LPはSAPタイプ1と関連付けられ、IDR_W_RADLはSAPタイプ2と関連付けられ、CRA_W_LPはSAPタイプ3と関連付けられる。
ある例では、以下のことがIRAP_W_LPおよびIRAP_N_LPに当てはまり得る。IRAP_N_LPに等しいNalUnitTypeを有するIRAPピクチャは、ビットストリームに存在する先行ピクチャと有する関連付けられない。IRAP_W_LPに等しいNalUnitTypeを有するIRAPピクチャは、ビットストリームの中の先行ピクチャと関連付けられ得る。
ある例では、SAPタイプへの上記のNALユニットタイプのマッピングは次の通りである。IRAP_N_LPはSAPタイプ1と関連付けられ、IRAP_W_LPはSAPタイプ3と関連付けられる。
ある例では、IRAPと関連付けられる先行ピクチャが存在するかどうかを決定するために、デバイスは、IRAPピクチャのNALユニットタイプを確認し得る。IRAPピクチャが、関連する1つ以上の先行ピクチャと関連付けられ得るとき、以下のステップが、IRAPピクチャと関連付けられるすべての先行ピクチャを見つけるために使用され得る。デバイスはIRAPピクチャから開始し得る。復号順序においてIRAPピクチャの直後にあるピクチャが非先行ピクチャである場合、ピクチャは無視され得る。IRAPピクチャの直後のそのような非先行ピクチャの存在は、ビットストリームがインターレースビデオコーディングビットストリームであることを示し得ることに留意されたい。次のピクチャは先行ピクチャであるものとする。プロセスは、最初の非先行ピクチャに遭遇するまで次のピクチャを確認することを続け得る。
図9は、例示的なビデオコーディングデバイス900の概略図である。ビデオコーディングデバイス900は、本明細書で説明されるような開示される例/実施形態を実装するのに適している。ビデオコーディングデバイス900は、ネットワークを介してデータアップストリームおよび/またはダウンストリームを通信するための送信機および/または受信機を含む、ダウンストリームポート920、アップストリームポート950、および/またはトランシーバユニット(Tx/Rx)910を備える。ビデオコーディングデバイス900はまた、データを処理するための論理ユニットおよび/または中央処理装置(CPU)を含むプロセッサ930と、データを記憶するためのメモリ932とを含む。ビデオコーディングデバイス900はまた、電気コンポーネント、光-電気(OE)コンポーネント、電気-光(EO)コンポーネント、ならびに/または、電気通信ネットワーク、光通信ネットワーク、もしくはワイヤレス通信ネットワークを介したデータの通信のためにアップストリームポート950および/もしくはダウンストリームポート920に結合されるワイヤレス通信コンポーネントを備え得る。ビデオコーディングデバイス900はまた、ユーザとの間でデータを通信するための入力および/または出力(I/O)デバイス960を含み得る。I/Oデバイス960は、ビデオデータを表示するためのディスプレイ、オーディオデータを出力するためのスピーカーなどの出力デバイスを含み得る。I/Oデバイス960はまた、キーボード、マウス、トラックボールなどの入力デバイス、および/または、そのような出力デバイスと対話するための対応するインターフェースを含み得る。
プロセッサ930はハードウェアおよびソフトウェアによって実装される。プロセッサ930は、1つ以上のCPUチップ、コア(たとえば、マルチコアプロセッサとして)、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、およびデジタルシグナルプロセッサ(DSP)として実装され得る。プロセッサ930は、ダウンストリームポート920、Tx/Rx910、アップストリームポート950、およびメモリ932と通信している。プロセッサ930はコーディングモジュール914を備える。コーディングモジュール914は、CVS500、インターレースビデオフレーム600、CVS700、および/またはビットストリーム800を利用し得る、方法100、1000、および1100などの、本明細書において説明される開示された実施形態を実装する。コーディングモジュール914は、本明細書において説明される任意の他の方法/機構も実装し得る。さらに、コーディングモジュール914は、コーデックシステム200、エンコーダ300、および/またはデコーダ400を実装し得る。たとえば、コーディングモジュール914は、IRAPピクチャと先行ピクチャのセットとの間に非先行ピクチャがいつ位置決めされるかを示すためのフラグをSPSにおいて設定することができる。したがって、コーディングモジュール914は、ビデオデータをコーディングするとき、追加の機能および/またはコーディング効率をビデオコーディングデバイス900がもたらすようにする。したがって、コーディングモジュール914は、ビデオコーディングデバイス900の機能を改善し、ならびにビデオコーディングの技術に特有の問題に対処する。さらに、コーディングモジュール914は、異なる状態へのビデオコーディングデバイス900の変換を実施する。代替的に、コーディングモジュール914は、メモリ932に記憶されプロセッサ930によって実行される命令として(たとえば、非一時的媒体に記憶されるコンピュータプログラム製品として)実装され得る。
メモリ932は、ディスク、テープドライブ、ソリッドステートドライブ、読取り専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、フラッシュメモリ、三値連想メモリ(TCAM)、スタティックランダムアクセスメモリ(SRAM)などの、1つ以上のメモリタイプを備える。メモリ932は、実行のためにプログラムが選択されるときにそのようなプログラムを記憶するために、およびプログラム実行の間に読み取られる命令とデータを記憶するために、オーバーフローデータストレージデバイスとして使用され得る。
図10は、インターレースビデオフレーム600などのインターレースビデオコーディングを伴うCVS500および/または700などのビデオシーケンスと、先行ピクチャとを、ビットストリーム800などのビットストリームへと符号化する例示的な方法1000のフローチャートである。方法1000は、方法100を実行するとき、コーデックシステム200、エンコーダ300、および/またはビデオコーディングデバイス900などのエンコーダによって利用され得る。
方法1000は、エンコーダが、複数のピクチャを含むビデオシーケンスを受信し、たとえばユーザ入力に基づいてそのビデオシーケンスをビットストリームへと符号化すると決定するときに開始し得る。ステップ1001において、エンコーダが、ビデオシーケンスのためのコーディング順序を決定する。ビデオシーケンスは、IRAPピクチャおよびIRAPピクチャと関連付けられる1つ以上の非先行ピクチャを含む、複数のピクチャを備える。ビデオシーケンスはまた、先行ピクチャのうちの1つ以上(たとえば、グループ)を任意選択で含み得る。
ステップ1003において、エンコーダがフラグをビットストリームへと符号化することができる。フラグは、IRAPピクチャと関連付けられる任意の先行ピクチャが、コーディング順序において、CVS500におけるようにIRAPピクチャと関連付けられるすべての非先行ピクチャの前にあるとき、第1の値に設定され得る。これは、ビデオシーケンスがインターレースビデオを含まないことを示す。フラグはまた、非先行ピクチャが、コーディング順序において、CVS700におけるようにIRAPピクチャと関連付けられる最初の先行ピクチャの前にあるとき、第2の値に設定され得る。フラグが第2の値に設定されるとき、ビットストリームはまた、コーディング順序において最初の先行ピクチャと最後の先行ピクチャとの間に先行ピクチャが位置決めされないように制約され得る。これは、ビデオシーケンスがインターレースビデオを含むことを示し得る。ある特定の例として、エンコーダはSPSをビットストリームへと符号化することができ、フラグはSPSへと符号化され得る。いくつかの例では、フラグはfield_seq_flagである。たとえば、field_seq_flagは、フィールドを表すピクチャをコーディングされたビデオシーケンスが含むことを示すとき、1に設定され得る。さらに、field_seq_flagは、フレームを表すピクチャをコーディングされたビデオシーケンスが含むことを示すとき、0に設定され得る。したがって、インターレースビデオコーディングがビットストリームにおいて利用されることを示すために、フラグが設定され得る。したがって、IRAPピクチャがフレームの第1のフィールドを含むとき、および最初の先行ピクチャの前にある非先行ピクチャがフレームの第2のフィールドを含むとき、フラグが設定され得る。たとえば、IRAPピクチャからの第1のフィールドおよび最初の先行ピクチャの前にある非先行ピクチャからの第2のフィールドは、図6A~図6Cに関して示されるように、単一のインターレースビデオフレームを表すビデオデータの交互の線を含み得る。
ステップ1005において、エンコーダが、IRAPピクチャ、IRAPピクチャと関連付けられる任意の先行ピクチャ、およびIRAPピクチャと関連付けられる1つ以上の非先行ピクチャを、コーディング順序においてビットストリームへと符号化することができる。エンコーダは次いで、ステップ1007において、デコーダへの通信のためにビットストリームを記憶することができる。
図11は、インターレースビデオフレーム600などのインターレースビデオコーディングを伴う、CVS500および/または700などのビデオシーケンスと、先行ピクチャとを、ビットストリーム800などのビットストリームから復号する、例示的な方法1100のフローチャートである。方法1100は、方法100を実行するとき、コーデックシステム200、デコーダ400、および/またはビデオコーディングデバイス900などのデコーダによって利用され得る。
方法1100は、たとえば方法1000の結果として、ビデオシーケンスを表現するコーディングされたデータのビットストリームの受信をデコーダが開始すると、開始し得る。ステップ1101において、デコーダが、フラグと、IRAPピクチャおよびIRAPピクチャと関連付けられる1つ以上の非先行ピクチャを含む複数のコーディングされたピクチャとを備える、ビットストリームを受信する。ビデオシーケンスはまた、先行ピクチャのうちの1つ以上(たとえば、グループ)を任意選択で含み得る。
ステップ1103において、デコーダが、CVS500に示されるように、フラグが第1の値に設定されるとき、IRAPピクチャと関連付けられる任意の先行ピクチャが、復号順序において、IRAPピクチャと関連付けられるすべての非先行ピクチャの前にあると決定することができる。これは、ビデオシーケンスがインターレースビデオを含まないことを示す。ステップ1105において、デコーダは、CVS700に示されるように、フラグが第2の値に設定されるとき、非先行ピクチャが、復号順序において、IRAPピクチャと関連付けられる最初の先行ピクチャの前にあると決定することができる。フラグが第2の値に設定されるとき、デコーダはさらに、コーディング順序において最初の先行ピクチャと最後の先行ピクチャとの間に先行ピクチャが位置決めされないと決定することができる。これは、ビデオシーケンスがインターレースビデオを含むことを示し得る。ある特定の例として、ビットストリームはSPSを含んでもよく、フラグはSPSから取得されうる。いくつかの例では、フラグはfield_seq_flagである。たとえば、フィールドを表すピクチャをコーディングされたビデオシーケンスが含むことを示すとき、field_seq_flagは1に設定され得る。さらに、フレームを表すピクチャをコーディングされたビデオシーケンスが含むことを示すとき、field_seq_flagは0に設定され得る。したがって、インターレースビデオコーディングがビットストリームにおいて利用されることを示すために、フラグが設定され得る。したがって、IRAPピクチャがフレームの第1のフィールドを含み、最初の先行ピクチャの前にある非先行ピクチャがフレームの第2のフィールドを含むとき、フラグが設定され得る。
ステップ1107において、デコーダが、フラグに基づいて、IRAPピクチャ、IRAPピクチャと関連付けられる任意の先行ピクチャ、およびIRAPピクチャと関連付けられる1つ以上の非先行ピクチャを復号順序において復号する。たとえば、IRAPピクチャ、先行ピクチャ(もしあれば)、および1つ以上の非先行ピクチャを復号することは、図6A~図6Cに関して示されるように単一のフレームを作成するために、IRAPピクチャからの第1のフィールドおよび初期の先行ピクチャの前にある非先行ピクチャからの第2のフィールドをインターレースすることを含み得る。ステップ1109において、デコーダが、復号されたビデオシーケンスの一部として表示するために、ステップ1107の結果として1つ以上の復号されたピクチャを転送し得る。
図12は、インターレースビデオフレーム600などのインターレースビデオコーディングを伴う、CVS500および/またはCVS700などのビデオシーケンスと、先行ピクチャとを、ビットストリーム800などのビットストリームへとコーディングするための例示的なシステム1200の概略図である。システム1200は、コーデックシステム200、エンコーダ300、デコーダ400、および/またはビデオコーディングデバイス900などのエンコーダとデコーダによって実装され得る。さらに、システム1200は、方法100、1000、および/または1100を実施するときに利用され得る。
システム1200はビデオエンコーダ1202を含む。ビデオエンコーダ1202は、IRAPピクチャを含む複数のピクチャおよびIRAPピクチャと関連付けられる1つ以上の非先行ピクチャを備えるビデオシーケンスのためのコーディング順序を決定するための決定モジュール1201を備える。ビデオエンコーダ1202はさらに、フラグをビットストリームへと符号化するための符号化モジュール1203を備え、IRAPピクチャと関連付けられる任意の先行ピクチャが、コーディング順序において、IRAPピクチャと関連付けられるすべての非先行ピクチャの前にあるとき、フラグは第1の値に設定され、非先行ピクチャが、コーディング順序において、IRAPピクチャと関連付けられる最初の先行ピクチャの前にあるとき、フラグは第2の値に設定される。符号化モジュール1203はさらに、IRAPピクチャ、IRAPピクチャと関連付けられる任意の先行ピクチャ、およびIRAPピクチャと関連付けられる1つ以上の非先行ピクチャを、コーディング順序においてビットストリームへと符号化するためのものである。ビデオエンコーダ1202はさらに、デコーダへの通信のためにビットストリームを記憶するための記憶モジュール1205を備える。ビデオエンコーダ1202はさらに、ビットストリームをビデオデコーダ1210に送信するための送信モジュール1207を備える。ビデオエンコーダ1202はさらに、方法1000のステップのいずれをも実行するように構成され得る。
システム1200はビデオデコーダ1210も含む。ビデオデコーダ1210は、フラグと、IRAPピクチャおよびIRAPピクチャと関連付けられる1つ以上の非先行ピクチャを含む複数のコーディングされたピクチャとを備える、ビットストリームを受信するための受信モジュール1211を備える。ビデオデコーダ1210はさらに、フラグが第1の値に設定されるとき、IRAPピクチャと関連付けられる任意の先行ピクチャが、復号順序において、IRAPピクチャと関連付けられるすべての非先行ピクチャの前にあると決定するための決定モジュール1213を備える。決定モジュール1213はさらに、フラグが第2の値に設定されるとき、非先行ピクチャが、復号順序において、IRAPピクチャと関連付けられる最初の先行ピクチャの前にあると決定するためのものである。ビデオデコーダ1210はさらに、フラグに基づいて復号順序において、IRAPピクチャ、IRAPピクチャと関連付けられる任意の先行ピクチャ、およびIRAPピクチャと関連付けられる1つ以上の非先行ピクチャを復号するための復号モジュール1215を備える。ビデオデコーダ1210はさらに、復号されたビデオシーケンスの一部として表示するために1つ以上の復号されたピクチャを転送するための転送モジュール1217を備える。ビデオデコーダ1210はさらに、方法1100のステップのいずれかを実行するように構成され得る。
第1のコンポーネントと第2のコンポーネントとの間の線、配線、または別の媒体を除き、介在するコンポーネントがないとき、第1のコンポーネントは第2のコンポーネントに直接結合される。第1のコンポーネントと第2のコンポーネントとの間に線、配線、または別の媒体以外の介在するコンポーネントがあるとき、第1のコンポーネントは第2のコンポーネントに間接的に結合される。「結合される」という用語およびその変形は、直接結合されることと間接的に結合されることの両方を含む。「約」という用語の使用は、別段述べられない限り、その後にある数字の±10%を含む範囲を意味する。
本明細書に記載される例示的な方法のステップは、必ずしも説明された順序で実行されることは必要とされず、そのような方法のステップの順序は単に例示的であると理解されるべきであることも理解されたい。同様に、追加のステップがそのような方法に含まれてもよく、本開示の様々な実施形態に適合する方法で、いくつかのステップが省略または結合されてもよい。
いくつかの実施形態が本開示において提供されたが、開示されたシステムおよび方法は、本開示の趣旨または範囲から逸脱することなく、多くの他の特定の形式で具現化され得ることが理解され得る。本実施例は、限定するためのものではなく説明のためのものであると見なされるべきであり、意図は本明細書で与えられる詳細に限定されないものとする。たとえば、別のシステムでは様々な要素またはコンポーネントが結合もしくは統合されてもよく、またはいくつかの特徴が省略され、もしくは実装されなくてもよい。
加えて、様々な実施形態において個別のもの、または別々のものとして説明され図示される技法、システム、サブシステム、および方法は、本開示の範囲から逸脱することなく、他のシステム、コンポーネント、技法、もしくは方法と合成または統合されてもよい。変化、置換、および変更の他の例が当業者により確認可能であり、本明細書で開示される趣旨および範囲から逸脱することなく行われ得る。
200 コーデックシステム
201 区分されたビデオ信号
211 汎用コーダ制御コンポーネント
213 変換スケーリングおよび量子化コンポーネント
215 イントラピクチャ推定コンポーネント
217 イントラピクチャ予測コンポーネント
219 動き補償コンポーネント
221 動き推定コンポーネント
223 復号ピクチャバッファコンポーネント
225 ループ内フィルタコンポーネント
227 フィルタ制御分析コンポーネント
229 スケーリングおよび逆変換コンポーネント
231 ヘッダフォーマッティングおよびCABACコンポーネント
300 エンコーダ
301 区分されたビデオ信号
313 変換および量子化コンポーネント
317 イントラピクチャ予測コンポーネント
321 動き補償コンポーネント
323 復号ピクチャバッファコンポーネント
325 ループ内フィルタコンポーネント
329 逆変換および量子化コンポーネント
331 エントロピーコーディングコンポーネント
400 デコーダ
417 イントラピクチャ予測コンポーネント
421 動き補償コンポーネント
423 復号ピクチャバッファコンポーネント
425 ループ内フィルタコンポーネント
429 逆変換および量子化コンポーネント
433 エントロピー復号コンポーネント
500 CVS
502 IRAPピクチャ
504 先行ピクチャ
506 後端ピクチャ
508 復号順序
510 提示順序
600 インターレースビデオフレーム
601 第1のピクチャ
602 第2のピクチャ
610 第1のフィールド
612 第2のフィールド
700 CVS
702 IRAPピクチャ
703 非先行ピクチャ
704 先行ピクチャ
706 後端ピクチャ
708 復号順序
710 提示順序
725 スライス
810 SPS
811 ピクチャパラメータセット(PPS)
815 スライスヘッダ
820 画像データ
821 フレーム
823 ピクチャ
825 スライス
900 ビデオコーディングデバイス
910 トランシーバユニット(Tx/Rx)
914 コーディングモジュール
920 ダウンストリームポート
930 プロセッサ
932 メモリ
950 アップストリームポート
960 I/Oデバイス
1200 システム
1201 決定モジュール
1202 ビデオエンコーダ
1203 符号化モジュール
1205 記憶モジュール
1207 送信機
1210 ビデオデコーダ
1211 受信機、受信モジュール
1213 決定モジュール
1215 復号モジュール
1217 転送モジュール

Claims (20)

  1. デコーダにおいて実施される方法であって、
    前記デコーダの受信機によって、フラグと、イントラランダムアクセスポイント(IRAP)ピクチャおよび前記IRAPピクチャと関連付けられる1つ以上の非先行ピクチャを含む複数のコーディングされたピクチャとを備える、ビットストリームを受信するステップと、
    前記フラグが第1の値に設定されるとき、前記デコーダのプロセッサによって、前記IRAPピクチャと関連付けられる任意の先行ピクチャが、復号順序において、前記IRAPピクチャと関連付けられるすべての非先行ピクチャの前にあると決定するステップと、
    前記フラグが第2の値に設定されるとき、前記プロセッサによって、非先行ピクチャが、復号順序において、前記IRAPピクチャと関連付けられる最初の先行ピクチャの前にあると決定するステップと、
    前記フラグが前記第1の値に設定されるか前記第2の値に設定されるかに基づいて、前記プロセッサによって、前記IRAPピクチャ、前記IRAPピクチャと関連付けられる任意の先行ピクチャ、および前記IRAPピクチャと関連付けられる前記1つ以上の非先行ピクチャを復号順序において復号するステップとを備える、方法。
  2. 前記フラグが前記第2の値に設定されるとき、前記プロセッサによって、復号順序において前記最初の先行ピクチャと最後の先行ピクチャとの間に先行ピクチャが位置決めされないと決定するステップをさらに備える、請求項1に記載の方法。
  3. 前記ビットストリームがシーケンスパラメータセット(SPS)を含み、前記フラグが前記SPSから取得される、請求項1から2のいずれか一項に記載の方法。
  4. 前記フラグがシーケンシャルフィールドフラグ(field_seq_flag)である、請求項1から3のいずれか一項に記載の方法。
  5. コーディングされたビデオシーケンスがフィールドを表すピクチャを含むとき、前記field_seq_flagが1に設定され、前記コーディングされたビデオシーケンスがフレームを表すピクチャを含むとき、前記field_seq_flagが0に設定される、請求項1から4のいずれか一項に記載の方法。
  6. 前記IRAPピクチャがフレームの第1のフィールドを含み、前記最初の先行ピクチャの前にある前記非先行ピクチャが前記フレームの第2のフィールドを含む、請求項1から5のいずれか一項に記載の方法。
  7. 前記IRAPピクチャおよび前記1つ以上の非先行ピクチャを復号するステップが、前記IRAPピクチャからの前記第1のフィールドと、前記最初の先行ピクチャの前にある前記非先行ピクチャからの前記第2のフィールドとをインターレースして、単一のフレームを作成するステップを含む、請求項1から6のいずれか一項に記載の方法。
  8. エンコーダにおいて実施される方法であって、
    前記エンコーダのプロセッサによって、イントラランダムアクセスポイント(IRAP)ピクチャおよび前記IRAPピクチャと関連付けられる1つ以上の非先行ピクチャを含む複数のピクチャを備えるビデオシーケンスのためのコーディング順序を決定するステップと、
    前記プロセッサによって、フラグをビットストリームへと符号化するステップであって、前記IRAPピクチャと関連付けられる任意の先行ピクチャが、コーディング順序において、前記IRAPピクチャと関連付けられるすべての非先行ピクチャの前にあるとき、前記フラグが第1の値に設定され、非先行ピクチャが、コーディング順序において、前記IRAPピクチャと関連付けられる最初の先行ピクチャの前にあるとき、前記フラグが第2の値に設定される、ステップと、
    前記プロセッサによって、前記IRAPピクチャ、前記IRAPピクチャと関連付けられる任意の先行ピクチャ、および前記IRAPピクチャと関連付けられる前記1つ以上の非先行ピクチャを、コーディング順序において前記ビットストリームへと符号化するステップと、
    前記プロセッサに結合されたメモリによって、デコーダへの通信のために前記ビットストリームを記憶するステップとを備える、方法。
  9. 前記フラグが前記第2の値に設定されるとき、コーディング順序において前記最初の先行ピクチャと最後の先行ピクチャとの間に先行ピクチャが位置決めされない、請求項8に記載の方法。
  10. 前記ビットストリームがシーケンスパラメータセット(SPS)を含み、前記フラグが前記SPSへと符号化される、請求項8から9のいずれか一項に記載の方法。
  11. 前記フラグがシーケンシャルフィールドフラグ(field_seq_flag)である、請求項8から10のいずれか一項に記載の方法。
  12. コーディングされたビデオシーケンスがフィールドを表すピクチャを含むとき、前記field_seq_flagが1に設定され、前記コーディングされたビデオシーケンスがフレームを表すピクチャを含むとき、前記field_seq_flagが0に設定される、請求項8から11のいずれか一項に記載の方法。
  13. 前記IRAPピクチャがフレームの第1のフィールドを含み、前記最初の先行ピクチャの前にある前記非先行ピクチャが前記フレームの第2のフィールドを含む、請求項8から12のいずれか一項に記載の方法。
  14. 前記IRAPピクチャからの前記第1のフィールドおよび前記最初の先行ピクチャの前にある前記非先行ピクチャからの前記第2のフィールドが、単一のインターレースビデオフレームを表すビデオデータの交互の線を含む、請求項8から13のいずれか一項に記載の方法。
  15. プロセッサと、前記プロセッサに結合される受信機と、前記プロセッサに結合されるメモリと、前記プロセッサに結合される送信機とを備え、前記プロセッサ、受信機、メモリ、および送信機が、請求項1から14のいずれか一項に記載の方法を実行するように構成される、ビデオコーディングデバイス。
  16. ビデオコーディングデバイスにより使用するためのコンピュータプログラム製品を備える非一時的コンピュータ可読媒体であって、前記コンピュータプログラム製品が、プロセッサによって実行されると、前記ビデオコーディングデバイスに請求項1から14のいずれか一項に記載の方法を実行させる、前記非一時的コンピュータ可読媒体に記憶されたコンピュータ実行可能命令を備える、非一時的コンピュータ可読媒体。
  17. フラグと、イントラランダムアクセスポイント(IRAP)ピクチャおよび前記IRAPピクチャと関連付けられる1つ以上の非先行ピクチャを含む複数のコーディングされたピクチャとを備える、ビットストリームを受信するための受信手段と、
    前記フラグが第1の値に設定されるとき、前記IRAPピクチャと関連付けられる任意の先行ピクチャが、復号順序において、前記IRAPピクチャと関連付けられるすべての非先行ピクチャの前にあると決定し、
    前記フラグが第2の値に設定されるとき、非先行ピクチャが、復号順序において、前記IRAPピクチャと関連付けられる最初の先行ピクチャの前にあると決定する
    ための決定手段と、
    前記フラグが前記第1の値に設定されるか前記第2の値に設定されるかに基づいて、前記IRAPピクチャ、前記IRAPピクチャと関連付けられる任意の先行ピクチャ、および前記IRAPピクチャと関連付けられる前記1つ以上の非先行ピクチャを復号順序において復号するための復号手段と、
    復号されたビデオシーケンスの一部として表示するために1つ以上の復号されたピクチャを転送するための転送手段とを備える、デコーダ。
  18. 前記デコーダがさらに、請求項1から7のいずれか一項に記載の方法を実行するように構成される、請求項17に記載のデコーダ。
  19. イントラランダムアクセスポイント(IRAP)ピクチャおよび前記IRAPピクチャと関連付けられる1つ以上の非先行ピクチャを含む複数のピクチャを備えるビデオシーケンスのためのコーディング順序を決定するための決定手段と、
    フラグをビットストリームへと符号化することであって、前記IRAPピクチャと関連付けられる任意の先行ピクチャが、コーディング順序において、前記IRAPピクチャと関連付けられるすべての非先行ピクチャの前にあるとき、前記フラグが第1の値に設定され、非先行ピクチャが、コーディング順序において、前記IRAPピクチャと関連付けられる最初の先行ピクチャの前にあるとき、前記フラグが第2の値に設定される、符号化することと、
    前記IRAPピクチャ、前記IRAPピクチャと関連付けられる任意の先行ピクチャ、および前記IRAPピクチャと関連付けられる前記1つ以上の非先行ピクチャを、コーディング順序において前記ビットストリームへと符号化することと
    を行うための符号化手段と、
    デコーダへの通信のために前記ビットストリームを記憶するための記憶手段とを備える、エンコーダ。
  20. 前記エンコーダがさらに、請求項8から14のいずれか一項に記載の方法を実行するように構成される、請求項19に記載のエンコーダ。
JP2021559241A 2019-04-03 2020-04-02 エンコーダ、デコーダ、および対応する方法 Pending JP2022527555A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962828875P 2019-04-03 2019-04-03
US62/828,875 2019-04-03
US201962864958P 2019-06-21 2019-06-21
US62/864,958 2019-06-21
PCT/US2020/026457 WO2020206171A1 (en) 2019-04-03 2020-04-02 Interlaced video coding with leading pictures

Publications (1)

Publication Number Publication Date
JP2022527555A true JP2022527555A (ja) 2022-06-02

Family

ID=72667174

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021559241A Pending JP2022527555A (ja) 2019-04-03 2020-04-02 エンコーダ、デコーダ、および対応する方法

Country Status (13)

Country Link
US (2) US20220021896A1 (ja)
EP (2) EP3939290B1 (ja)
JP (1) JP2022527555A (ja)
KR (1) KR20210141710A (ja)
CN (1) CN113632478A (ja)
DK (1) DK3939290T3 (ja)
ES (1) ES2967911T3 (ja)
FI (1) FI3939290T3 (ja)
HU (1) HUE064155T2 (ja)
MX (1) MX2021012094A (ja)
PL (1) PL3939290T3 (ja)
PT (1) PT3939290T (ja)
WO (1) WO2020206171A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220009376A (ko) * 2019-05-20 2022-01-24 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 복호 장치
KR20220114557A (ko) 2019-12-26 2022-08-17 바이트댄스 아이엔씨 코딩된 픽처 내에서 디코딩 순서를 구현하기 위한 기술들
KR20220156827A (ko) 2020-03-19 2022-11-28 바이트댄스 아이엔씨 레퍼런스 픽처 리스트 엔트리에 대한 제약들
EP4140128A4 (en) 2020-05-22 2023-08-02 ByteDance Inc. RESTRICTIONS ON IMAGE TYPES IN VIDEO BITSTREAM PROCESSING
CN117730534A (zh) * 2021-06-28 2024-03-19 抖音视界有限公司 补充增强信息的增强信令通知

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015025747A1 (ja) * 2013-08-22 2015-02-26 ソニー株式会社 符号化装置、符号化方法、送信装置、復号化装置、復号化方法および受信装置
US20160234527A1 (en) * 2015-02-05 2016-08-11 Cisco Technology, Inc. Method and System for Processing HEVC Coded Video in Broadcast and Streaming Applications
WO2018150934A1 (ja) * 2017-02-20 2018-08-23 ソニー株式会社 画像処理装置および方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9591303B2 (en) * 2012-06-28 2017-03-07 Qualcomm Incorporated Random access and signaling of long-term reference pictures in video coding
US9374583B2 (en) * 2012-09-20 2016-06-21 Qualcomm Incorporated Video coding with improved random access point picture behaviors
US9525883B2 (en) * 2013-07-15 2016-12-20 Qualcomm Incorporated Cross-layer alignment of intra random access point pictures
EP3962089A1 (en) * 2014-06-18 2022-03-02 Telefonaktiebolaget LM Ericsson (publ) Dependent random access point pictures
US20170105004A1 (en) 2015-10-07 2017-04-13 Qualcomm Incorporated Methods and systems of coding a predictive random access picture using a background picture
US10999590B2 (en) * 2018-12-28 2021-05-04 Tencent America LLC Method for identification of random access point and picture types
KR20220009376A (ko) * 2019-05-20 2022-01-24 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 복호 장치

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015025747A1 (ja) * 2013-08-22 2015-02-26 ソニー株式会社 符号化装置、符号化方法、送信装置、復号化装置、復号化方法および受信装置
US20160234527A1 (en) * 2015-02-05 2016-08-11 Cisco Technology, Inc. Method and System for Processing HEVC Coded Video in Broadcast and Streaming Applications
WO2018150934A1 (ja) * 2017-02-20 2018-08-23 ソニー株式会社 画像処理装置および方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
"SERIES H: AUDIOVISUAL AND MULTIMEDIA SYSTEMS Infrastructure of audiovisual services - Coding of movi", RECOMMENDATION ITU-T H.265 (12/2016) HIGH EFFICIENCY VIDEO CODING, JPN6023000367, 16 March 2017 (2017-03-16), pages 34 - 35, ISSN: 0004961473 *
DRUGEON, VIRGINIE AND ABE, KIYOFUMI: "AHG17: On constraint about position of leading pictures and trailing pictures associated to an IRAP", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 15TH MEETING: GOTH, vol. JVET-O0226 (version 1), JPN6023000364, 24 June 2019 (2019-06-24), ISSN: 0004961476 *
HENDRY AND WANG, YE-KUI: "AHG17: Constraints on IRAP pictures and leading pictures", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 15TH MEETING: GOTH, vol. JVET-O0147 (version 1), JPN6023000365, 20 June 2019 (2019-06-20), ISSN: 0004961475 *
SJOBERG, RICKARD ET AL.: "RExt HLS: Picture referencing across CRA pictures", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11, vol. JCTVC-Q0116 (version 2), JPN6023000366, 27 March 2014 (2014-03-27), ISSN: 0004961474 *

Also Published As

Publication number Publication date
HUE064155T2 (hu) 2024-02-28
WO2020206171A1 (en) 2020-10-08
FI3939290T3 (fi) 2024-01-08
CN113632478A (zh) 2021-11-09
KR20210141710A (ko) 2021-11-23
ES2967911T3 (es) 2024-05-06
EP3939290A4 (en) 2022-06-15
US20220021896A1 (en) 2022-01-20
PL3939290T3 (pl) 2024-03-11
EP3939290B1 (en) 2023-10-04
PT3939290T (pt) 2024-01-02
US20240163467A1 (en) 2024-05-16
EP3939290A1 (en) 2022-01-19
MX2021012094A (es) 2021-11-03
EP4277271A2 (en) 2023-11-15
DK3939290T3 (da) 2023-12-18
EP4277271A3 (en) 2024-02-21

Similar Documents

Publication Publication Date Title
US11889030B2 (en) Adaptation parameter set types in video coding
US11778205B2 (en) Flexible tiling in video coding
EP3939290B1 (en) Interlaced video coding with leading pictures
US20220217376A1 (en) Picture Timing And Decoding Unit Information For Temporal Scalability
JP7454657B2 (ja) ピクチャーレベルでの非ピクチャーレベルの構文要素のシグナリング
JP2024028361A (ja) ビデオコーディングにおける回復ポイントシグナリング
US11425377B2 (en) Arbitrary and wrap-around tile grouping
JP2022549651A (ja) マルチレイヤビデオビットストリームのためのdpbパラメータのシグナリング
KR20210105980A (ko) 비디오 인코더, 비디오 디코더 및 상응하는 방법들
US20220166970A1 (en) Types of Reference Pictures in Reference Picture Lists
KR102650289B1 (ko) 비디오 인코더, 비디오 디코더 및 상응하는 방법들
US20220210477A1 (en) Signaling subpicture ids in subpicture based video coding
JP7383795B2 (ja) ビデオコーディングにおけるalf aps制約

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211118

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211118

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230410

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230724

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20231023

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231225

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20240318