JP7319384B2 - 符号化ビデオビットストリームを生成する方法、装置、及びコンピュータプログラム - Google Patents

符号化ビデオビットストリームを生成する方法、装置、及びコンピュータプログラム Download PDF

Info

Publication number
JP7319384B2
JP7319384B2 JP2021557674A JP2021557674A JP7319384B2 JP 7319384 B2 JP7319384 B2 JP 7319384B2 JP 2021557674 A JP2021557674 A JP 2021557674A JP 2021557674 A JP2021557674 A JP 2021557674A JP 7319384 B2 JP7319384 B2 JP 7319384B2
Authority
JP
Japan
Prior art keywords
picture
irap
flag
gdr
decoding order
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021557674A
Other languages
English (en)
Other versions
JP2022526173A (ja
Inventor
チョイ,ビョンドゥ
リィウ,シャン
ウェンジャー,ステファン
Original Assignee
テンセント・アメリカ・エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テンセント・アメリカ・エルエルシー filed Critical テンセント・アメリカ・エルエルシー
Publication of JP2022526173A publication Critical patent/JP2022526173A/ja
Priority to JP2023118697A priority Critical patent/JP2023134778A/ja
Application granted granted Critical
Publication of JP7319384B2 publication Critical patent/JP7319384B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/188Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

[関連出願]
本願は、参照により全体がここに組み込まれる、2019年12月30日に出願した米国仮特許出願番号第62/954,880号、及び2020年10月5日に出願した米国特許出願番号第17/063,082号、の優先権を主張する。
技術分野
開示の主題は、ビデオ符号化及び復号に関し、より具体的には、符号化ビデオビットストリームを生成する間にフラグを設定することに関する。
ITU-T VCEG(Q6/16) 及びISO/IEC MPEG (JTC1/SC29/WG11)の発行したH.265/HEVC (High Efficiency Video Coding)規格、 2013 (version 1) 2014 (version 2) 2015 (version 3) 及び 2016 (version 4)。2015年に、これらの2つの標準化組織は、一緒にJVET(Joint Video Exploration Team)を形成して、HEVC以後の次世代ビデオコーディング規格を開発する可能性を探索した。2017年10月、彼らは、Joint Call for Proposals on Video Compression with Capability beyond HEVC(CfP)を発表した。2018年2月15日までに、合計で、標準ダイナミックレンジ(standard dynamic range(SDR))に関する22個のCfP応答、高ダイナミックレンジ(high dynamic range(HDR))に関する12個のCfP応答、及び360個のビデオカテゴリに関する12個のCfP応答がそれぞれ提出された。2018年4月、全部の受信されたCfP応答は、122MPEG/10th JVET会議で評価された。この会議の結果として、JVETは、HEVC以後の次世代ビデオコーディングの標準化プロセスを正式に発表した。新たな規格は、VVC(Versatile Video Coding)と名付けられ、JVETはJoint Video Expert Teamに改名した。
実施形態では、少なくとも1つのプロセッサを用いて符号化ビデオビットストリームを生成する方法が提供される。当該方法は、
ビデオビットストリームからイントラランダムアクセスポイント(IRAP)アクセスユニット(AU)を取得するステップと、
前記IRAP AUが復号順で最初のAUかどうか、前記IRAP AUに含まれる各ピクチャがデコーダ復号動作の瞬時リフレッシュ(IDR)ピクチャかどうか、及び前記IRAP AUに含まれる各ピクチャが前記復号順でシーケンス終了(EOS)ネットワーク抽象レイヤ(NAL)単位に続くレイヤの最初のピクチャであるかどうかを決定するステップと、
前記IRAP AUが前記ビデオビットストリームの前記復号順で最初のAUであるという決定、前記IRAP AUに含まれる各ピクチャが前記IDRピクチャであるという決定、又は前記IRAP AUに含まれる各ピクチャが前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャであるという決定に基づき、前記IRAP AUの第1フラグを1に等しく設定するステップと、
前記IRAP AUが前記復号順で最初のAUではないという決定、前記IRAP AUに含まれる各ピクチャはIDRピクチャではないという決定、及び前記IRAP AUに含まれる各ピクチャは前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャではないという決定に基づき、前記IRAP AUの第2フラグが外部処理により提供される値に設定されるかどうかを決定するステップと、
前記IRAP AUが前記復号順で最初のAUではないという決定、前記IRAP AUに含まれる各ピクチャは前記IDRピクチャではないという決定、前記IRAP AUに含まれる各ピクチャは前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャではないという決定、及び前記IRAP AUの前記第2フラグが前記外部処理により提供される値に設定されるという決定に基づき、前記IRAP AUの前記第1フラグを前記外部処理により提供される値に等しく設定するステップと、
前記IRAP AUが前記復号順で最初のAUではないという決定、前記IRAP AUに含まれる各ピクチャは前記IDRピクチャではないという決定、前記IRAP AUに含まれる各ピクチャは前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャではないという決定、及び前記第2フラグが前記外部処理により提供される値に設定されないという決定に基づき、前記IRAP AUの前記第1フラグを0に等しく設定し、前記IRAP AUの前記第2フラグを0に等しく設定するステップと、
前記IRAP AUの前記第1フラグ及び前記IRAP AUの前記第2フラグに基づき、前記ビデオビットストリームを符号化するステップと、
前記符号化ビデオビットストリームを送信するステップと、
を含む。
実施形態では、符号化ビデオビットストリームを生成する装置が提供され、前記装置は、
プログラムコードを格納するよう構成される少なくとも1つのメモリと、
前記プログラムコードを読み出し前記プログラムコードにより指示されるように動作するよう構成される少なくとも1つのプロセッサと、
を含み、前記プログラムコードは、
前記少なくとも1つのプロセッサに、ビデオビットストリームからイントラランダムアクセスポイント(IRAP)アクセスユニット(AU)を取得させるよう構成される第1取得コードと、
前記少なくとも1つのプロセッサに、前記IRAP AUが復号順で最初のAUかどうか、前記IRAP AUに含まれる各ピクチャがデコーダ復号動作の瞬時リフレッシュ(IDR)ピクチャかどうか、及び前記IRAP AUに含まれる各ピクチャが前記復号順でシーケンス終了(EOS)ネットワーク抽象レイヤ(NAL)単位に続くレイヤの最初のピクチャであるかどうかを決定させるよう構成される第1決定コードと、
前記少なくとも1つのプロセッサに、前記IRAP AUが前記ビデオビットストリームの前記復号順で最初のAUであるという決定、前記IRAP AUに含まれる各ピクチャが前記IDRピクチャであるという決定、又は前記IRAP AUに含まれる各ピクチャが前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャであるという決定に基づき、前記IRAP AUの第1フラグを1に等しく設定させるよう構成される第1設定コードと、
前記少なくとも1つのプロセッサに、前記IRAP AUが前記復号順で最初のAUではないという決定、前記IRAP AUに含まれる各ピクチャはIDRピクチャではないという決定、及び前記IRAP AUに含まれる各ピクチャは前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャではないという決定に基づき、前記IRAP AUの第2フラグが外部処理により提供される値に設定されるかどうかを決定させる第2決定コードと、
前記少なくとも1つのプロセッサに、前記IRAP AUが前記復号順で最初のAUではないという決定、前記IRAP AUに含まれる各ピクチャは前記IDRピクチャではないという決定、前記IRAP AUに含まれる各ピクチャは前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャではないという決定、及び前記IRAP AUの前記第2フラグが前記外部処理により提供される値に設定されるという決定に基づき、前記IRAP AUの前記第1フラグを前記外部処理により提供される値に等しく設定させる第2設定コードと、
前記少なくとも1つのプロセッサに、前記IRAP AUが前記復号順で最初のAUではないという決定、前記IRAP AUに含まれる各ピクチャは前記IDRピクチャではないという決定、前記IRAP AUに含まれる各ピクチャは前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャではないという決定、及び前記第2フラグが前記外部処理により提供される値に設定されないという決定に基づき、前記IRAP AUの前記第1フラグを0に等しく設定し、前記IRAP AUの前記第2フラグを0に等しく設定させる第3設定コードと、
前記少なくとも1つのプロセッサに、前記IRAP AUの前記第1フラグ及び前記IRAP AUの前記第2フラグに基づき、前記ビデオビットストリームを符号化させるよう構成される符号化と、
前記少なくとも1つのプロセッサに、前記符号化ビデオビットストリームを送信させるよう構成される送信と、を含む。
実施形態では、命令を記憶している非一時的コンピュータ可読媒体が提供され、前記命令は1つ以上の命令を含み、符号化ビデオビットストリームを生成する装置の1つ以上のプロセッサにより実行されると、前記少なくとも1つのプロセッサに、
ビデオビットストリームからイントラランダムアクセスポイント(IRAP)アクセスユニット(AU)を取得させ、
前記IRAP AUが復号順で最初のAUかどうか、前記IRAP AUに含まれる各ピクチャがデコーダ復号動作の瞬時リフレッシュ(IDR)ピクチャかどうか、及び前記IRAP AUに含まれる各ピクチャが前記復号順でシーケンス終了(EOS)ネットワーク抽象レイヤ(NAL)単位に続くレイヤの最初のピクチャであるかどうかを決定させ、
前記IRAP AUが前記ビデオビットストリームの前記復号順で最初のAUであるという決定、前記IRAP AUに含まれる各ピクチャが前記IDRピクチャであるという決定、又は前記IRAP AUに含まれる各ピクチャが前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャであるという決定に基づき、前記IRAP AUの第1フラグを1に等しく設定させ、
前記IRAP AUが前記復号順で最初のAUではないという決定、前記IRAP AUに含まれる各ピクチャはIDRピクチャではないという決定、及び前記IRAP AUに含まれる各ピクチャは前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャではないという決定に基づき、前記IRAP AUの第2フラグが外部処理により提供される値に設定されるかどうかを決定させ、
前記IRAP AUが前記復号順で最初のAUではないという決定、前記IRAP AUに含まれる各ピクチャは前記IDRピクチャではないという決定、前記IRAP AUに含まれる各ピクチャは前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャではないという決定、及び前記IRAP AUの前記第2フラグが前記外部処理により提供される値に設定されるという決定に基づき、前記IRAP AUの前記第1フラグを前記外部処理により提供される値に等しく設定させ、
前記IRAP AUが前記復号順で最初のAUではないという決定、前記IRAP AUに含まれる各ピクチャは前記IDRピクチャではないという決定、前記IRAP AUに含まれる各ピクチャは前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャではないという決定、及び前記第2フラグが前記外部処理により提供される値に設定されないという決定に基づき、前記IRAP AUの前記第1フラグを0に等しく設定させ、前記IRAP AUの前記第2フラグを0に等しく設定させ、
前記IRAP AUの前記第1フラグ及び前記IRAP AUの前記第2フラグに基づき、前記ビデオビットストリームを符号化させ、
前記符号化ビデオビットストリームを送信させる。
開示の主題の更なる特徴、特性、及び種々の利点は、以下の詳細な説明及び添付の図面から一層明らかになるだろう。
実施形態による、通信システムの簡易ブロック図の概略図である。
実施形態による、通信システムの簡易ブロック図の概略図である。
実施形態による、デコーダの簡易ブロック図の概略図である。
実施形態による、エンコーダの簡易ブロック図の概略図である。
実施形態による、符号化ピクチャがIRAPピクチャである、非IRAP AUがIRAP PUを含むビットストリーム構造の例を示す。
実施形態による、符号化ビデオビットストリームを生成する例示的な処理のフローチャートである。 実施形態による、符号化ビデオビットストリームを生成する例示的な処理のフローチャートである。 実施形態による、符号化ビデオビットストリームを生成する例示的な処理のフローチャートである。 実施形態による、符号化ビデオビットストリームを生成する例示的な処理のフローチャートである。
実施形態による、コンピュータシステムの概略図である。
図1は、本発明の一実施形態による通信システム(100)の簡易ブロック図を示す。システム(100)は、ネットワーク(150)を介して相互接続される少なくとも2つの端末(110~120)を含んでよい。データの一方向送信では、第1端末(110)は、ネットワーク(150)を介して他の端末(120)へ送信するために、ビデオデータをローカル位置でコーディングしてよい。第2端末(120)は、ネットワーク(150)から他の端末のコーディングビデオデータを受信し、コーディングデータを復号して、復元したビデオデータを表示してよい。単方向データ伝送は、メディアサービングアプリケーション等で共通であってよい。
図1は、例えばビデオ会議中に生じ得る、符号化ビデオの双方向送信をサポートするために適用される第2の端末ペア(130、140)を示す。データの双方向送信では、各端末(130、140)は、ネットワーク(150)を介して他の端末へ送信するために、ローカルでキャプチャしたビデオデータを符号化してよい。各端末130、140は、また、他の端末により送信された符号化ビデオデータを受信してよく、符号化データを復号してよく、及び復元したビデオデータをローカルディスプレイ装置で表示してよい。
図1では、端末装置(110~140)は、サーバ、パーソナルコンピュータ、及びスマートフォンとして示されてよいが、本開示の原理はこれらに限定されない。本開示の実施形態は、ラップトップコンピュータ、タブレットコンピュータ、メディアプレイヤ、及び/又は専用ビデオ会議設備による適用がある。ネットワーク(150)は、端末装置(110~140)の間でコーディングビデオデータを運ぶ任意の数のネットワークを表し、例えば有線及び/又は無線通信ネットワークを含む。通信ネットワーク(150)は、回線切り替え及び/又はパケット切り替えチャネルでデータを交換してよい。代表的なネットワークは、電子通信ネットワーク、ローカルエリアネットワーク、広域ネットワーク、及び/又はインターネットを含む。本発明の議論の目的で、ネットワーク(150)のアーキテクチャ及びトポロジは、以下で特に断りの無い限り、本開示の動作にとって重要でないことがある。
図2は、開示の主題の適用の一例として、ストリーミング環境におけるビデオエンコーダ及びビデオデコーダの配置を示す。開示の主題は、例えばビデオ会議、デジタルTV、CD、DVD、メモリスティック、等を含むデジタル媒体への圧縮ビデオの格納、他のビデオ可能アプリケーション、等に等しく適用可能である。
ストリーミングシステムは、例えば非圧縮ビデオサンプルストリーム(202)を生成するビデオソース(201)、例えばデジタルカメラを含み得るキャプチャサブシステム(213)を含んでよい。サンプルストリーム202は、符号化ビデオビットストリームと比べるとき高データ容量を強調するために太線で示され、カメラ201に結合されるエンコーダ203により処理できる。エンコーダ203は、ハードウェア、ソフトウェア、又はそれらの組み合わせを含み、以下に詳述するように開示の主題の態様を可能にし又は実装することができる。符号化ビデオビットストリーム204は、サンプルストリームと比べたとき、低データ容量を強調するために細線で示され、将来の使用のためにストリーミングサーバ205に格納できる。1つ以上のストリーミングクライアント206、208は、ストリーミングサーバ205にアクセスして、符号化ビデオビットストリーム204のコピー207、209を読み出すことができる。クライアント206は、ビデオデコーダ210を含むことができる。ビデオデコーダ310は、符号化ビットストリーム207の入来するコピーを復号し、ディスプレイ212又は他のレンダリング装置(図示しない)においてレンダリング可能な出力ビデオサンプルストリーム211を生成する。幾つかのストリーミングシステムでは、ビデオビットストリーム204、207、209は、特定のビデオコーディング/圧縮規格に従い符号化できる。これらの規格の例は、ITU-T Recommendation H.265を含む。策定中のビデオコーディング規格は、略式にVVC(Versatile Video Coding)として知られている。開示の主題は、VVCの文脈で使用されてよい。
図3は、本開示の実施形態によるビデオデコーダ(210)の機能ブロック図であり得る。
受信機(310)は、ビデオデコーダ(210)により復号されるべき1つ以上のコーディングビデオシーケンス、同じ又は別の実施形態では、一度に1つのコーディングビデオシーケンスを受信してよい。ここで、各コーディングビデオシーケンスの復号は、他のコーディングビデオシーケンスと独立している。コーディングビデオシーケンスは、符号化ビデオデータを格納する記憶装置へのハードウェア/ソフトウェアリンクであってよいチャネル(312)から受信されてよい。受信機(310)は、他のデータ、例えば、それぞれの使用エンティティ(図示しない)へと転送され得るコーディング音声データ及び/又は補助データストリームと共に、符号化ビデオデータを受信してよい。受信機(310)は、他のデータからコーディングビデオシーケンスを分離してよい。ネットワークジッタを除去するために、バッファメモリ(315)は、受信機(310)とエントロピーデコーダ/パーサ(320)(以後、「パーサ」)との間に接続されてよい。受信機(310)が、十分な帯域幅の記憶/転送装置から制御可能に、又はアイソクロナス(isosynchronous)ネットワークから、データを受信しているとき、バッファ(315)は、必要なくてよく又は小さくできる。インターネットのようなベストエフォート型パケットネットワークで使用する場合、バッファ(315)が必要であってよく、比較的大きくすることができ、有利なことに適応サイズにすることができる。
ビデオデコーダ(210)は、エントロピーコーディングビデオシーケンスからシンボル(321)を再構成するために、パーサ(320)を含んでよい。これらのシンボルのカテゴリは、デコーダ(210)の動作を管理するために使用される情報、及び場合によっては図3に示したようにデコーダの統合部分ではないがデコーダに接続され得るディスプレイ(212)のようなレンダリング装置を制御するための情報を含む。レンダリング装置のための制御情報は、SEI(Supplementary Enhancement Information)メッセージ又はVUI(Video Usability Information)パラメータセットフラグメント(図示しない)の形式であってよい。パーサ320は、受信された符号かビデオシーケンスをパース/エントロピー復号してよい。コーディングビデオシーケンスのコーディングは、ビデオコーディング技術又は規格に従うことができ、可変長コーディング、ハフマンコーディング、コンテキスト依存性を有する又は有しない算術的コーディング、等を含む、当業者によく知られた原理に従うことができる。パーサ(320)は、コーディングビデオシーケンスから、ビデオデコーダの中のピクセルのサブグループのうちの少なくとも1つについて、該グループに対応する少なくとも1つのパラメータに基づき、サブグループパラメータのセットを抽出してよい。サブグループは、GOP(Groups of Picture)、ピクチャ、サブピクチャ、タイル、スライス、ブロック、マクロブロック、コーディング木単位(Coding Tree Unit :CTU)、コーディング単位(Coding Unit:CU)、ブロック、変換単位(Transform Unit:TU)、予測単位(Prediction Unit:PU)、等を含み得る。タイルは、ピクチャ内の特定のタイル列及び行の中で長方形領域のCU/CTUを示してよい。ブロックは、特定のタイル内の長方形領域のCU/CTU行を示してよい。スライスは、NAL単位に含まれる、ピクチャの1つ以上のブロックを示してよい。サブピクチャは、ピクチャ内の1つ以上のスライスの長方形領域を示してよい。エントロピーデコーダ/パーサは、コーディングビデオシーケンスから、変換係数、量子化パラメータ値、動きベクトル、等のような情報も抽出してよい。
パーサ(320)は、バッファ(315)から受信したビデオシーケンスに対してエントロピー復号/パース動作を実行して、シンボル(321)を生成してよい。
シンボル(321)の再構成は、コーディングビデオピクチャ又はその部分の種類(例えば、インター及びイントラピクチャ、インター及びイントラブロック)及び他の要因に依存して、複数の異なるユニットを含み得る。どのユニットがどのように含まれるかは、パーサ(320)によりコーディングビデオシーケンスからパースされたサブグループ制御情報により制御できる。パーサ320と以下の複数のユニットとの間のこのようなサブグループ制御情報のフローは、明確さのために示されない。
既に言及した機能ブロックを超えて、デコーダ(210)は、後述のように、多数の機能ユニットに概念的に細分化できる。商用的制約の下で動作する実際の実装では、これらのユニットの多くは、互いに密に相互作用し、少なくとも部分的に互いに統合され得る。しかしながら、開示の主題を説明する目的で、機能ユニットへの以下の概念的細分化は適切である。
第1ユニットは、スケーラ/逆変換ユニット351である。スケーラ/逆変換ユニット351は、量子化された変換係数、及び、どの変換が使用されるべきか、ブロックサイズ、量子化係数、量子化スケーリングマトリクス、等を含む制御情報を、パーサ320からのシンボル321として受信する。これは、アグリゲータ355に入力され得るサンプル値を含むブロックを出力できる。
幾つかの例では、スケーラ/逆変換ユニット(351)の出力サンプルは、イントラコーディングブロック、つまり、前に再構成されたピクチャからの予測情報を使用しないが現在ピクチャの前に再構成された部分からの予測情報を使用可能なブロック、に属することができる。このような予測情報は、イントラピクチャ予測ユニット352により提供できる。幾つかの場合には、イントラピクチャ予測ユニット352は、再構成中のブロックと同じサイズ及び形状のブロックを、現在(部分的にさは再構成された)ピクチャ358からフェッチした周囲の既に再構成された情報を用いて、生成する。アグリゲータ(355)は、幾つかの場合には、サンプル毎に、イントラ予測ユニット(352)の生成した予測情報を、スケーラ/逆変換ユニット(351)により提供された出力サンプル情報に追加する。
他の場合には、スケーラ/逆変換ユニット(351)の出力サンプルは、インターコーディングされた、場合によっては動き補償されたブロックに関連し得る。このような場合には、動き補償予測ユニット353は、参照ピクチャメモリ357にアクセスして、予測のために使用されるサンプルをフェッチできる。ブロックに関連するシンボル321に従いフェッチしたサンプルを動き補償した後に、これらのサンプルは、アグリゲータ355により、出力サンプル情報を生成するために、スケーラ/逆変換ユニットの出力に追加され得る(この場合、残差サンプル又は残差信号と呼ばれる)。動き補償予測ユニットが予測サンプルをフェッチする参照ピクチャメモリ内のアドレスは、例えばX、Y及び参照ピクチャコンポーネントを有し得るシンボル321の形式で、動き補償予測ユニットの利用可能な動きベクトルにより制御できる。動き補償は、サブサンプルの正確な動きベクトルが使用中であるとき参照ピクチャメモリからフェッチされたサンプル値の補間、動きベクトル予測メカニズム、等も含み得る。
アグリゲータ(355)の出力サンプルは、ループフィルタユニット(356)において種々のループフィルタリング技術を受け得る。ビデオ圧縮技術は、コーディングビデオビットストリームに含まれ且つパーサ(320)からのシンボル(321)としてループフィルタユニット(356)に利用可能にされたパラメータにより制御されるが、コーディングピクチャ又はコーディングビデオシーケンスの(復号順序で)前の部分の復号中に取得されたメタ情報にも応答し、前に再構成されループフィルタリングされたサンプル値にも応答し得るインループフィルタ技術を含み得る。
ループフィルタユニット(356)の出力は、レンダー装置(212)へと出力でき及び将来のインターピクチャ予測で使用するために参照ピクチャメモリに格納され得るサンプルストリームであり得る。
特定のコーディングピクチャは、一旦完全に再構成されると、将来の予測のための参照ピクチャとして使用できる。コーディングピクチャが完全に再構成され、コーディングピクチャが(例えばパーサ(320)により)参照ピクチャとして識別されると、現在参照ピクチャ(358)は、参照ピクチャバッファ(357)の一部になることができ、後続のコーディングピクチャの再構成を開始する前に、新鮮な現在ピクチャメモリを再割り当てできる。
ビデオデコーダ210は、ITU-T Rec. H.265のような規格で策定され得る所定のビデオ圧縮技術に従い復号動作を実行してよい。コーディングビデオシーケンスが、ビデオ圧縮技術又は規格で、具体的にはその中のプロファイル文書で指定された、ビデオ圧縮技術又は規格のシンタックスに従うという意味で、コーディングビデオシーケンスは、使用中のビデオ圧縮技術又は規格により指定されたシンタックスに従ってよい。また、遵守のために必要なことは、コーディングビデオシーケンスの複雑さが、ビデオ圧縮技術又は規格のレベルにより定められる限界の範囲内であることであり得る。幾つかの場合には、レベルは、最大ピクチャサイズ、最大フレームレート、最大再構成サンプルレート(例えばメガサンプル/秒で測定される)、最大参照ピクチャサイズ、等を制限する。レベルにより設定される限界は、幾つかの場合には、HRD(Hypothetical Reference Decoder)仕様及びコーディングビデオシーケンスの中でシグナリングされるHDRバッファ管理のためのメタデータを通じて更に制限され得る。
実施形態では、受信機(310)は、符号化ビデオと共に追加(冗長)データを受信してよい。追加データは、コーディングビデオシーケンスの部分として含まれてよい。追加データは、データを正しく復号するため及び/又は元のビデオデータをより正確に再構成するために、ビデオデコーダ210により使用されてよい。追加データは、例えば、時間的、空間的、又はSNR拡張レイヤ、冗長スライス、冗長ピクチャ、前方誤り訂正符号、等の形式であり得る。
図4は、本開示の一実施形態によるビデオエンコーダ203の機能ブロック図であり得る。
エンコーダ(203)は、ビデオサンプルを、エンコーダ(203)によりコーディングされるべきビデオ画像をキャプチャし得るビデオソース(201)(エンコーダの部分ではない)から受信してよい。
ビデオソース(201)は、エンコーダ(203)により符号化されるべきソースビデオシーケンスを、任意の適切なビット深さ(例えば、8ビット、10ビット、12ビット、...)、任意の色空間(例えば、BT.601 Y CrCB, RGB,...)、及び任意の適切なサンプリング構造(例えば、Y CrCb 4:2:0, Y CrCb 4:4:4)のデジタルビデオサンプルストリームの形式で、提供してよい。メディア提供システムでは、ビデオソース201は、前に準備されたビデオを格納する記憶装置であってよい。ビデオ会議システムでは、ビデオソース203は、ビデオシーケンスとしてローカル画像情報をキャプチャするカメラであってよい。ビデオデータは、続けて閲覧されると動きを与える複数の個別ピクチャとして提供されてよい。ピクチャ自体は、ピクセルの空間的配列として組織化されてよい。各ピクセルは、使用中のサンプリング構造、色空間、等に依存して、1つ以上のサンプルを含み得る。当業者は、ピクセルとサンプルとの間の関係を直ちに理解できる。以下の説明はサンプルに焦点を当てる。
実施形態によると、エンコーダ(203)は、ソースビデオシーケンスのピクチャを、コーディングビデオシーケンス(443)へと、リアルタイムに又はアプリケーションにより要求される任意の他の時間制約の下でコーディングし圧縮してよい。適切なコーディング速度の実施は、制御部(450)の1つの機能である。制御部は、後述するように他の機能ユニットを制御し、他の機能ユニットに機能的に結合される。結合は、明確さのために図示されない。制御部により設定されるパラメータは、レート制御関連パラメータ(ピクチャスキップ、量子化器、レート歪み最適化技術のラムダ値、...)、ピクチャサイズ、GOP(group of pictures)レイアウト、最大動きベクトル探索範囲、等を含み得る。当業者は、特定のシステム設計のために最適化されたビデオエンコーダ203に関連し得るとき、制御部450の他の機能を直ちに識別できる。
幾つかのビデオエンコーダは、当業者が「コーディングループ」として直ちに認識する中で動作する。非常に簡略化した説明として、コーディングループは、エンコーダ(430)(以後、「ソースコーダ」)(コーディングされるべき入力ピクチャと参照ピクチャとに基づき、シンボルを生成する)及びエンコーダ203内に組み込まれ、シンボルを再構成して、(シンボルとコーディングビデオビットストリームとの間の任意の圧縮が開示の主題において考慮されるビデオ圧縮技術の中で無損失であるとき)(リモート)デコーダが生成し得るサンプルデータを生成する(ローカル)デコーダ(433)の符号化部分を含むことができる。再構成されたサンプルストリームは、参照ピクチャメモリ434に入力される。シンボルストリームの復号が、デコーダ位置(ローカル又はリモート)と独立にビット正確な結果をもたらすとき、参照ピクチャバッファの内容も、ローカルエンコーダとリモートエンコーダとの間でビット正確である。言い換えると、エンコーダの予測部分が、復号中に予測を用いるときデコーダが「見る」のと正確に同じサンプル値を、参照ピクチャサンプルとして「見る」。参照ピクチャ同期性のこの基本原理(及び、例えばチャネルエラーのために同期性が維持できない場合には、結果として生じるドリフト)は、当業者によく知られている。
「ローカル」デコーダ433の動作は、図3と関連して以上に詳述した「リモート」デコーダ210のものと同じであり得る。簡単に図4も参照すると、しかしながら、シンボルが利用可能であり、エントロピーコーダ(445)及びパーサ(320)によるコーディングビデオシーケンスへのシンボルの符号化/復号が無損失であり得るので、チャネル(312)、受信機(310)、バッファ(315)、及びパーサ(320)を含むデコーダ(210)のエントロピー復号部分は、ローカルデコーダ(433)に完全に実装されなくてよい。
この点で行われる考察は、デコーダ内に存在するパース/エントロピー復号を除く任意のデコーダ技術も、対応するエンコーダ内と実質的に同一の機能形式で存在する必要があるということである。この理由から、開示の主題は、デコーダ動作に焦点を当てる。エンコーダ技術の説明は、それらが包括的に説明されるデコーダ技術の逆であるので、省略できる。特定の領域においてのみ、より詳細な説明が必要であり、以下に提供される。
動作中、幾つかの例では、ソースコーダ(430)は、動き補償された予測コーディングを実行してよい。これは、「参照フレーム」として指定されたビデオシーケンスからの1つ以上の前にコーディングされたフレームを参照して予測的に入力フレームをコーディングする。この方法では、コーディングエンジン(432)は、入力フレームのピクセルブロックと、入力フレームに対する予測基準として選択されてよい参照フレームのピクセルブロックとの間の差分をコーディングする。
ローカルビデオデコーダ(433)は、ソースコーダ(430)により生成されたシンボルに基づき、参照フレームとして指定されてよいフレームのコーディングビデオデータを復号してよい。コーディングエンジン(432)の動作は、有利なことに、損失処理であってよい。コーディングビデオデータがビデオデコーダ(図4に図示されない)において復号され得るとき、再構成ビデオシーケンスは、標準的に、幾つかのエラーを有するソースビデオシーケンスの複製であってよい。ローカルビデオデコーダ(433)は、参照フレームに対してビデオデコーダにより実行され得る復号処理を複製し、参照ピクチャキャッシュ(434)に格納されるべき再構成参照フレームを生じ得る。このように、エンコーダ(203)は、(伝送誤りが無ければ)遠端ビデオデコーダにより取得される再構成参照フレームと共通の内容を有する再構成参照フレームのコピーをローカルに格納してよい。
予測器(435)は、コーディングエンジン(432)のために予測探索を実行してよい。つまり、コーディングされるべき新しいフレームについて、予測器(435)は、新しいピクチャのための適切な予測基準として機能し得る(候補参照ピクセルブロックのような)サンプルデータ又は参照ピクチャ動きベクトル、ブロック形状、等のような特定のメタデータについて、参照ピクチャメモリ(434)を検索してよい。予測器(435)は、適切な予測基準を見付けるために、サンプルブロック-ピクセルブロック毎に動作してよい。幾つかの例では、予測器(435)により取得された検索結果により決定されるように、入力ピクチャは、参照ピクチャメモリ(434)に格納された複数の参照ピクチャから引き出された予測基準を有してよい。
制御部(450)は、例えば、ビデオデータの符号化のために使用されるパラメータ及びサブグループパラメータの設定を含む、ビデオコーダ(430)のコーディング動作を管理してよい。
全ての前述の機能ユニットの出力は、エントロピーコーダ(445)におけるエントロピーコーディングを受けてよい。エントロピーコーダは、ハフマンコーディング、可変長コーディング、算術コーディング、等のような当業者によく知られた技術に従いシンボルを無損失圧縮することにより、種々の機能ユニットにより生成されたシンボルを、コーディングビデオシーケンスへと変換する。
送信機(440)は、符号化ビデオデータを格納し得る記憶装置へのハードウェア/ソフトウェアリンクであってよい通信チャネル(460)を介する伝送のために準備するために、エントロピーコーダ(445)により生成されたコーディングビデオシーケンスをバッファリングしてよい。送信機(440)は、ビデオコーダ(430)からのコーディングビデオデータを、送信されるべき他のデータ、例えばコーディング音声データ及び/又は補助データストリーム(図示されないソース)とマージ(merge)してよい。
制御部450は、エンコーダ203の動作を管理してよい。コーディング中、制御部(450)は、それぞれのピクチャに適用され得るコーディング技術に影響し得る特定のコーディングピクチャタイプを、各コーディングピクチャに割り当ててよい。例えば、ピクチャは、多くの場合、以下のピクチャタイプのうちの1つとして割り当てられてよい。
イントラピクチャ(Iピクチャ)は、予測のソースとしてシーケンス内の任意の他のフレームを使用せずにコーディング及び復号され得るピクチャであってよい。幾つかのビデオコーデックは、例えばIDR(Independent Decoder Refresh)ピクチャを含む異なる種類のイントラピクチャを許容する。当業者は、Iピクチャの変形、及びそれらの個々の適用及び特徴を認識する。
予測ピクチャ(Pピクチャ)は、殆どの場合、各ブロックのサンプル値を予測するために1つの動きベクトル及び参照インデックスを用いてイントラ予測又はインター予測を用いてコーディング及び復号され得るピクチャであってよい。
双方向予測ピクチャ(Bピクチャ)は、各ブロックのサンプル値を予測するために最大2つの動きベクトル及び参照インデックスを用いてイントラ予測又はインター予測を用いてコーディング及び復号され得るピクチャであってよい。同様に、マルチ予測ピクチャは、単一のブロックの再構成のために、2つより多くの参照ピクチャ及び関連付けられたメタデータを使用できる。
ソースピクチャは、共通に、複数のサンプルブロック(例えば、それぞれ4×4、8×8、4×8、又は16×16個のサンプルのブロック)に空間的に細分化され、ブロック毎にコーディングされてよい。ブロックは、ブロックのそれぞれのピクチャに適用されるコーディング割り当てにより決定される他の(既にコーディングされた)ブロックへの参照により予測的にコーディングされてよい。例えば、Iピクチャのブロックは、非予測的にコーディングされてよく、又はそれらは同じピクチャの既にコーディングされたブロックを参照して予測的にコーディングされてよい(空間予測又はイントラ予測)。Pピクチャのピクセルブロックは、1つの前にコーディングされた参照ピクチャを参照して、空間予測を介して又は時間予測を介して、予測的にコーディングされてよい。Bピクチャのブロックは、1つ又は2つの前にコーディングされた参照ピクチャを参照して、空間予測を介して又は時間予測を介して、非予測的にコーディングされてよい。
ビデオコーダ(203)は、ITU-T Rec. H.265のような所定のビデオコーディング技術又は規格に従いコーディング動作を実行してよい。その動作において、ビデオコーダ(203)は、入力ビデオシーケンスの中の時間的及び空間的冗長性を利用する予測コーディング動作を含む種々の圧縮動作を実行してよい。コーディングビデオデータは、したがって、使用されているビデオコーディング技術又は規格により指定されたシンタックスに従ってよい。
一実施形態では、送信機440は、符号化ビデオと共に追加データを送信してよい。ビデオコーダ(430)は、このようなデータをコーディングビデオシーケンスの部分として含んでよい。追加データは、時間/空間/SNR拡張レイヤ、冗長ピクチャ及びスライスのような他の形式の冗長データ、SEI(Supplementary Enhancement Information)メッセージ、VUI(Visual Usability Information)パラメータセットフラグメント、等を含んでよい。
実施形態は、非IRAP AU内のフラグ(HandleCraAsCvsStartFlag、HandleGdrAsCvsStartFlag、及びNoIncorrectPicOutputFlag)に関連するバグを修正すること、及びVVCにおいてレイヤ毎のランダムアクセスのサポートを明確にすることに関連し得る。例えば、実施形態では、HandleCraAsCvsStartFlag、HandleGdrAsCvsStartFlag、及びNoIncorrectPicOutputFlagの値は、非IRAP AU毎にデフォルトで0に設定されてよい。更に、実施形態では、HandleCraAsCvsStartFlag、HandleGdrAsCvsStartFlag、及びNoIncorrectPicOutputFlagの値は、(レイヤ毎の)(IRAP)PU毎に操作される。
現在のVVC仕様ドラフトJVET-P2001(JVET-Q0041により編集上更新された)では、コーディングビデオシーケンス(coded video sequence (CVS))は、イントラランダムアクセスポイント(intra random access point (IRAP))アクセスユニット(access unit (AU))で開始し、その中には、CVSの中のレイヤ毎にピクチャユニット(picture unit (PU))があり、各PU内のコーディングピクチャはIRAPピクチャである。IRAP AU毎に、復号のときには利用できない関連付けられたRASLピクチャを扱うためにHandleCraAsCvsStartFlag及びNoIncorrectPicOutputFlagの値が設定される。漸次復号リフレッシュ(gradual decoding refresh (GDR))AU毎に、HandleGdrAsCvsStartFlag及びNoIncorrectPicOutputFlagの値が同様に設定される。
一方、VCCドラフトは、非IRAP AUがIRAP PUを含むことを許容し、その中ではコーディングピクチャはIRAPピクチャである。図5は、そのような状況の例を示す。しかしながら、HandleCraAsCvsStartFlag、HandleGdrAsCvsStartFlag、及びNoIncorrectPicOutputFlagの値は、非IRAP AU内の特定の値に等しく設定されない。これらのフラグは、現在のAUがIRAP AUであり、規定値を有しないときにのみ、特定の値に等しく設定される。従って、フラグは、非IRAP AU内のIRAP PUが復号されるとき、値設定を伴わずに参照される。これは、現在の仕様の中のバグである。
更に、レイヤ毎のランダムアクセスをサポートするために、現在VCC仕様においてIRAP PUの前の全部のPUを破棄することにより、IRAP PUの位置においてランダムアクセスを実行することが可能である。非IRAP AU内のIRAP PUの前の幾つかの前のPUを除去することにより、このようなレイヤ毎のランダムアクセスを可能にするために、HandleCraAsCvsStartFlag、HandleGdrAsCvsStartFlag、及びNoIncorrectPicOutputFlagの値は、各レイヤの各IRAP PUについて操作されてよい。
実施形態は、非IRAP AU内のフラグ(HandleCraAsCvsStartFlag、HandleGdrAsCvsStartFlag、及びNoIncorrectPicOutputFlag)に関する上述のバグを修正すること、及びVVCにおいてレイヤ毎のランダムアクセスのサポートを明確にすることに関連し得る。
例えば、実施形態では、HandleCraAsCvsStartFlag、HandleGdrAsCvsStartFlag、及びNoIncorrectPicOutputFlagの値は、非RAP AU毎にデフォルトで0に設定されてよい。更に、実施形態では、HandleCraAsCvsStartFlag、HandleGdrAsCvsStartFlag、及びNoIncorrectPicOutputFlagの値は、IRAP PU毎に操作されてよい。
実施形態では、ビットストリーム内のIRAP AU毎に、以下が適用されてよい。AUが復号順でビットストリーム内の最初のAUである場合、各ピクチャはデコーダ復号動作の瞬時リフレッシュ(instantaneous decoder refresh (IDR))ピクチャであるか、又は各ピクチャが復号順でシーケンス終了(EOS)ネットワーク抽象レイヤ(NAL)単位に続くレイヤの最初のピクチャである場合、変数NoIncorrectPicOutputFlagは1に等しく設定される。その他の場合、特定の外部処理が変数HandleCraAsCvsStartFlagをAUについての値に設定するために利用可能であるならば、HandleCraAsCvsStartFlagは外部処理により提供される値に等しく設定され、NoIncorrectPicOutputFlagはHandleCraAsCvsStartFlagに等しく設定される。その他の場合、HandleCraAsCvsStartFlag及びNoIncorrectPicOutputFlagは両方とも0に等しく設定される。
ビットストリーム内の各IRAP AUについて、HandleCraAsCvsStartFlag及びNoIncorrectPicOutputFlagは両方とも0に等しく設定されてよい。
実施形態では、ビットストリーム内の各GDR AUについて、以下が適用されてよい。AUが復号順でビットストリーム内の最初のAUであるか、又は各ピクチャが復号順でEOS NAL単位に続くレイヤの最初のピクチャである場合、変数NoIncorrectPicOutputFlagは1に等しく設定されてよい。その他の場合、特定の外部処理が変数HandleGdrAsCvsStartFlagをAUについての値に設定するために利用可能であるならば、HandleGdrAsCvsStartFlag は外部処理により提供される値に等しく設定され、NoIncorrectPicOutputFlagはHandleGdrAsCvsStartFlagに等しく設定されてよい。その他の場合、HandleGdrAsCvsStartFlag及びNoIncorrectPicOutputFlagは両方とも0に等しく設定されてよい。
上述の動作は、IRAPピクチャ及びGDRピクチャの両方について、ビットストリーム内のCVSの識別のために使用されてよい。
実施形態では、ビットストリーム内の各 AUについて、以下が適用されてよい。AUが復号順でビットストリーム内の最初のAUであるか、各ピクチャがIDRピクチャであるか、又は各ピクチャが復号順でEOS NAL単位に続くレイヤの最初のピクチャである場合、変数NoIncorrectPicOutputFlagは1に等しく設定されてよい。その他の場合、特定の外部処理が変数HandleCraAsCvsStartFlagをIRAP AUについての値に設定するために利用可能であるならば、HandleCraAsCvsStartFlagは外部処理により提供される値に等しく設定され、NoIncorrectPicOutputFlagはHandleCraAsCvsStartFlagに等しく設定される。その他の場合、HandleCraAsCvsStartFlag及びHandleCraAsCvsStartFlagは両方とも0に等しく設定されてよい。
実施形態では、ビットストリーム内の各GDR AUについて、以下が適用されてよい。AUが復号順でビットストリーム内の最初のAUであるか、又は各ピクチャが復号順でEOS NAL単位に続くレイヤの最初のピクチャである場合、変数NoIncorrectPicOutputFlagは1に等しく設定されてよい。その他の場合、特定の外部処理が変数HandleGdrAsCvsStartFlagをAUについての値に設定するために利用可能ではないならば、HandleGdrAsCvsStartFlag は外部処理により提供される値に等しく設定され、NoIncorrectPicOutputFlagはHandleGdrAsCvsStartFlagに等しく設定されてよい。その他の場合、HandleGdrAsCvsStartFlag及びNoIncorrectPicOutputFlagは両方とも0に等しく設定されてよい。
上述の動作は、IRAPピクチャ及びGDRピクチャの両方について、ビットストリーム内のCVSの識別のために使用されてよい。
実施形態では、ビットストリーム内の各IRAP AUについて、以下が適用されてよい。AUが復号順でビットストリーム内の最初のAUであるか、各ピクチャがIDRピクチャであるか、又は各ピクチャが復号順でEOS NAL単位に続くレイヤの最初のピクチャである場合、変数NoIncorrectPicOutputFlagは1に等しく設定されてよい。その他の場合、特定の外部処理が変数HandleCraAsCvsStartFlagをAUについての値に設定するために利用可能であるならば、HandleCraAsCvsStartFlag は外部処理により提供される値に等しく設定され、NoIncorrectPicOutputFlagはHandleCraAsCvsStartFlagに等しく設定されてよい。その他の場合、HandleCraAsCvsStartFlag及びNoIncorrectPicOutputFlagは両方とも0に等しく設定されてよい。
実施形態では、ビットストリーム内の非IRAP AUの各IRAPピクチャユニット(picture unit (PU))は、以下が適用されてよい。IRAP PUのピクチャが、IDRピクチャ、又は復号順でEOS NAL単位に続くレイヤの最初のピクチャである場合、IRAP PUについて変数NoIncorrectPicOutputFlagは1に等しく設定されてよい。その他の場合、特定の外部処理が変数HandleCraAsCvsStartFlagをIRAP PUについての値に設定するために利用可能であるならば、HandleCraAsCvsStartFlag は外部処理により提供される値に等しく設定され、NoIncorrectPicOutputFlagはIRAP PUについてHandleCraAsCvsStartFlagに等しく設定されてよい。その他の場合、HandleCraAsCvsStartFlag及びNoIncorrectPicOutputFlagは、IRAP PUについて両方とも0に等しく設定されてよい。
実施形態では、ビットストリーム内の各GDR AUについて、以下が適用されてよい。AUが復号順でビットストリーム内の最初のAUであるか、又は各ピクチャが復号順でEOS NAL単位に続くレイヤの最初のピクチャである場合、変数NoIncorrectPicOutputFlagは1に等しく設定されてよい。その他の場合、特定の外部処理が変数HandleGdrAsCvsStartFlagをAUについての値に設定するために利用可能であるならば、HandleGdrAsCvsStartFlag は外部処理により提供される値に等しく設定され、NoIncorrectPicOutputFlagはHandleGdrAsCvsStartFlagに等しく設定されてよい。その他の場合、HandleGdrAsCvsStartFlag及びNoIncorrectPicOutputFlagは両方とも0に等しく設定されてよい。
実施形態では、ビットストリーム内の非IRAP AUの各GDR PUは、以下が適用されてよい。GDR PUのピクチャが復号順でEOS NAL単位に続くレイヤの最初のピクチャである場合、変数NoIncorrectPicOutputFlagは1に等しく設定されてよい。その他の場合、特定の外部処理が変数HandleGdrAsCvsStartFlagをGDR PUについての値に設定するために利用可能であるならば、HandleGdrAsCvsStartFlag は外部処理により提供される値に等しく設定され、NoIncorrectPicOutputFlagはGDR PUについHandleGdrAsCvsStartFlagに等しく設定されてよい。その他の場合、HandleGdrAsCvsStartFlag及びNoIncorrectPicOutputFlagは、GDR PUについて両方とも0に等しく設定されてよい。
図6A~6Dは、実施形態による、符号化ビデオビットストリームを生成する例示的な処理600A、600B、600C、及び600Dのフローチャートである。実施形態では、処理600A、600B、600C、及び600Dのいずれか、又は処理600A、600B、600C、及び600Dの任意の部分は、望ましい場合には任意の組合せ又は順列で及び任意の順序で結合されてよい。幾つかの実装では、図6A~6Dの1つ以上の処理ブロックは、デコーダ210により実行されてよい。幾つかの実装では、図6A~6Dの1つ以上の処理ブロックは、エンコーダ203のような、デコーダ210と別個の又はそれを含む別の装置又は装置のグループにより実行されてよい。
図6Aに示すように、処理600Aは、ビデオビットストリームからイントラランダムアクセスポイント(intra random access point (IRAP))アクセスユニット(access unit (AU))を取得するステップを含んでよい(ブロック611)。
更に図6Aに示すように、処理600Aは、IRAP AUが復号順で最初のAUかどうか、IRAP AUに含まれる各ピクチャがデコーダ復号動作の瞬時リフレッシュ(IDR)ピクチャかどうか、及びIRAP AUに含まれる各ピクチャが復号順でシーケンス終了(EOS)ネットワーク抽象レイヤ(NAL)単位に続くレイヤの最初のピクチャであるかどうかを決定するステップを含んでよい(ブロック612)。
更に図6Aに示すように、ブロック612における決定のいずれかの結果がYES(ブロック612でYES)である場合、処理600Aは、ブロック613へ進んでよい。しかしながら、ブロック612における決定の全部の結果がNO(ブロック612でNO)である場合、処理600Aは、ブロック614へ進んでよい。
更に図6Aに示すように、処理600Aは、IRAP AUの第1フラグを1に等しく設定するステップを含んでよい(ブロック613)。
更に図6Aに示すように、処理600Aは、IRAP AUの第2フラグが外部処理により提供される値に等しく設定されているかどうかを決定するステップを含んでよい(ブロック614)。
更に図6Aに示すように、IRAP AUの第2フラグが外部処理により提供される値に設定されていると決定された場合(ブロック614でYES)、処理600Aはブロック615へ進んでよい。しかしながら、IRAP AUの第2フラグが外部処理により提供される値に設定されていないと決定された場合(ブロック614でNO)、処理600Aはブロック616へ進んでよい。
更に図6Aに示すように、処理600Aは、IRAP AUの第1フラグを外部処理により提供される値に等しく設定するステップを含んでよい(ブロック615)。
更に図6Aに示すように、処理600Aは、IRAP AUの第1フラグ及びIRAP AUの第2フラグを0に等しく設定するステップを含んでよい(ブロック616)。
更に図6Aに示すように、処理600Aは、IRAP AUの第1フラグ及びIRAP AUの第2フラグに基づき、ビデオビットストリームを符号化するステップと、符号化ビデオビットストリームを送信するステップと、を含んでよい(ブロック617)。
図6Bに示すように、処理600Bは、ビデオビットストリームから非IRAP AUを取得するステップを含んでよい(ブロック621)。
更に図6Bに示すように、処理600Bは、非IRAP AUからIRAP PUを取得するステップを含んでよい(ブロック600B)。
更に図6Bに示すように、処理600Bは、IRAP PUに対応するピクチャがIDRピクチャであるかどうか、及びピクチャが復号順でEOS NAL単位に続くレイヤの最初のピクチャであるかどうか、を決定するステップを含んでよい(ブロック623)。
更に図6Bに示すように、ブロック623における決定のいずれかの結果がYES(ブロック623でYES)である場合、処理600Bは、ブロック624へ進んでよい。しかしながら、ブロック623における決定の全部の結果がNO(ブロック623でNO)である場合、処理600Bはブロック625へ進んでよい。
更に図6Aに示すように、処理600Bは、IRAP PUの第1フラグを1に等しく設定するステップを含んでよい(ブロック624)。
更に図6Bに示すように、処理600Bは、IRAP PUの第2フラグが外部処理により提供される値に等しく設定されているかどうかを決定するステップを含んでよい(ブロック625)。
更に図6Bに示すように、IRAP PUの第2フラグが外部処理により提供される値に設定されていると決定された場合(ブロック625でYES)、処理600Bはブロック626へ進んでよい。しかしながら、IRAP PUの第2フラグが外部処理により提供される値に設定されていないと決定された場合(ブロック625でNO)、処理600Bはブロック627へ進んでよい。
更に図6Bに示すように、処理600Bは、IRAP PUの第1フラグを外部処理により提供される値に等しく設定するステップを含んでよい(ブロック626)。
更に図6Bに示すように、処理600Bは、IRAP PUの第1フラグ及びIRAP PUの第2フラグを0に等しく設定するステップを含んでよい(ブロック627)。
更に図6Bに示すように、処理600Bは、IRAPPUの第1フラグ及びIRAP PUの第2フラグに基づき、ビデオビットストリームを符号化するステップと、符号化ビデオビットストリームを送信するステップとを含んでよい(ブロック628)。
図6Cに示すように、処理600Cは、ビデオビットストリームからイントラランダムアクセスポイント(intra random access point (IRAP))アクセスユニット(access unit (AU))を取得するステップを含んでよい(ブロック631)。
更に図6Cに示すように、処理600Cは、GDR AUが復号順で最初のAUであるかどうか、及びGDR AUに含まれる各ピクチャが復号順でEOS NAL単位に続くレイヤの最初のピクチャであるかどうか、を決定するステップを含んでよい(ブロック632)。
更に図6Cに示すように、ブロック632における決定のいずれかの結果がYES(ブロック632でYES)である場合、処理600Cは、ブロック633へ進んでよい。しかしながら、ブロック632における決定の全部の結果がNO(ブロック632でNO)である場合、処理600Cはブロック634へ進んでよい。
更に図6Cに示すように、処理600Cは、GDR AUの第1フラグを1に等しく設定するステップを含んでよい(ブロック633)。
更に図6Cに示すように、処理600Cは、GDR AUの第2フラグが外部処理により提供される値に等しく設定されているかどうかを決定するステップを含んでよい(ブロック634)。
更に図6Cに示すように、GDR AUの第2フラグが外部処理により提供される値に設定されていると決定された場合(ブロック634でYES)、処理600Cはブロック635へ進んでよい。しかしながら、GDR AUの第2フラグが外部処理により提供される値に設定されていないと決定された場合(ブロック634でNO)、処理600Cはブロック636へ進んでよい。
更に図6Cに示すように、処理600Cは、GDR AUの第1フラグを外部処理により提供される値に等しく設定するステップを含んでよい(ブロック635)。
更に図6Cに示すように、処理600Cは、GDR AUの第1フラグ及びGDR AUの第2フラグを0に等しく設定するステップを含んでよい(ブロック636)。
更に図6Cに示すように、処理600Cは、GDR AUの第1フラグ及びGDR AUの第2フラグに基づき、ビデオビットストリームを符号化するステップと、符号化ビデオビットストリームを送信するステップと、を含んでよい(ブロック637)。
図6Dに示すように、処理600Dは、ビデオビットストリームから非IRAP AUを取得するステップを含んでよい(ブロック641)。
更に図6Dに示すように、処理600Dは、非GDR AUからGDR PUを取得するステップを含んでよい(ブロック642)。
更に図6Dに示すように、処理600DはGDR PUに対応するピクチャが復号順でEOS NAL単位に続くレイヤの最初のピクチャであるかどうか、を決定するステップを含んでよい(ブロック643)。
更に図6Dに示すように、ブロック643における決定の結果がYES(ブロック643でYES)である場合、処理600Dは、ブロック644へ進んでよい。しかしながら、ブロック6432における決定の結果がNO(ブロック643でNO)である場合、処理600Dはブロック645へ進んでよい。
更に図6Dに示すように、処理600Dは、GDR PUの第1フラグを1に等しく設定するステップを含んでよい(ブロック644)。
更に図6Dに示すように、処理600Dは、GDR PUの第2フラグが外部処理により提供される値に等しく設定されているかどうかを決定するステップを含んでよい(ブロック645)。
更に図6Dに示すように、GDR PUの第2フラグが外部処理により提供される値に設定されていると決定された場合(ブロック645でYES)、処理600Dはブロック646へ進んでよい。しかしながら、GDR PUの第2フラグが外部処理により提供される値に設定されていないと決定された場合(ブロック645でNO)、処理600Dはブロック647へ進んでよい。
更に図6Dに示すように、処理600Dは、GDR PUの第1フラグを外部処理により提供される値に等しく設定するステップを含んでよい(ブロック646)。
更に図6Dに示すように、処理600Dは、GDR PUの第1フラグ及びGDR PUの第2フラグを0に等しく設定するステップを含んでよい(ブロック647)。
更に図6Dに示すように、処理600Dは、GDR PUの第1フラグ及びGDR PUの第2フラグに基づき、ビデオビットストリームを符号化するステップと、符号化ビデオビットストリームを送信するステップと、を含んでよい(ブロック648)。
実施形態では、IRAP AUの第1フラグが1に等しく設定されることは、IRAP AUに含まれるクリーンランダムアクセス(clean random access (CRA))ピクチャに関連付けられた全部のランダムアクセススキップリーディング(random access skipped leading (RASL))ピクチャが復号されずに破棄されるべきであることを示し、IRAP AUの第2フラグが1に等しく設定されることは、IRAP AUに含まれるCRAピクチャに関連付けられた全部のリーディングピクチャが復号されずに廃棄されるべきであることを示してよい。
実施形態では、IRAP AUの第1フラグは、NoIncorrectPicOutputFlagフラグを含んでよく、IRAP AUの第2フラグは、HandleCraAsCvsStartFlagフラグを含んでよい。
実施形態では、GDR AUの第1フラグが1に等しく設定されることは、GDR AUに含まれるGDRピクチャに関連付けられた全部のランダムアクセススキップリーディング(RASL)ピクチャが復号されずに破棄されるべきであることを示し、GDR AUの第2フラグが1に等しく設定されることは、GDR AUに含まれるGDRピクチャに関連付けられた全部のリーディングピクチャが復号されずに廃棄されるべきであることを示してよい。
実施形態では、GDR AUの第1フラグは、NoIncorrectPicOutputFlagフラグを含んでよく、GDR AUの第2フラグは、HandleGdrAsCvsStartFlagフラグを含んでよい。
図6A~6Dは処理600A、600B、600C及び600Dの例示的なブロックを示すが、幾つかの実装では、処理600A、600B、600C及び600Dは、図6A~6Dに示されたブロックより多数のブロック、少数のブロック、又は異なる配置のブロックを含んでよい。追加又は代替として、処理700のブロックのうちの2つ以上は、並列に実行されてよい。
さらに、提案した方法は、処理回路(例えば、1つ以上のプロセッサ又は1つ以上の集積回路)により実施されてよい。一例では、1つ以上のプロセッサは、提案した方法のうちの1つ以上を実行するための、非一時的コンピュータ可読媒体に格納されたプログラムを実行する。
上述の技術は、コンピュータ可読命令を用いてコンピュータソフトウェアとして実装でき、1つ以上のコンピュータ可読媒体に物理的に格納でる。例えば、図7は、本開示の主題の特定の実施形態を実装するのに適するコンピュータシステム700を示す。
コンピュータソフトウェアは、アセンブリ、コンパイル、リンク等のメカニズムにより処理されて、コンピュータ中央処理ユニット(CPU)、グラフィック処理ユニット(GPU)、等により直接又はインタープリット、マイクロコード実行、等を通じて実行可能な命令を含むコードを生成し得る、任意の適切な機械コード又はコンピュータ言語を用いてコーディングできる。
命令は、例えばパーソナルコンピュータ、タブレットコンピュータ、サーバ、スマートフォン、ゲーム装置、モノのインターネット装置、等を含む種々のコンピュータ又はそのコンポーネントで実行できる。
コンピュータシステム700の図7に示すコンポーネントは、本来例示であり、本開示の実施形態を実装するコンピュータソフトウェアの使用又は機能の範囲に対するようないかなる限定も示唆しない。さらに、コンポーネントの構成も、コンピュータシステム700の例示的な実施形態に示されたコンポーネントのうちのいずれか又は組み合わせに関連する任意の依存性又は要件を有すると解釈されるべきではない。
コンピュータシステム700は、特定のヒューマンインタフェース入力装置を含んでよい。このようなヒューマンインタフェース入力装置は、例えば感覚入力(例えば、キーストローク、スワイプ、データグラブ動作)、音声入力(例えば、音声、クラッピング)、視覚的入力(例えば、ジェスチャ)、嗅覚入力(示されない)を通じた1人以上の人間のユーザによる入力に応答してよい。ヒューマンインタフェース装置は、必ずしも人間による意識的入力に直接関連する必要のない特定の媒体、例えば音声(例えば、会話、音楽、環境音)、画像(例えば、スキャンされた画像、デジタルカメラから取得された写真画像)、ビデオ(例えば、2次元ビデオ、3次元ビデオ、立体ビデオを含む)をキャプチャするためにも使用できる。
入力ヒューマンインタフェース装置は、キーボード701、マウス702、トラックパッド703、タッチスクリーン710及び関連するグラフィックアダプタ750、データグラブ1204、ジョイスティック705、マイクロフォン706、スキャナ707、カメラ708、のうちの1つ以上を含んでよい(そのうちの1つのみが示される)。
コンピュータシステム700は、特定のヒューマンインタフェース出力装置も含んでよい。このようなヒューマンインタフェース出力装置は、例えば感覚出力、音声、光、及び匂い/味を通じて1人以上の人間のユーザの感覚を刺激してよい。このようなヒューマンインタフェース出力装置は、感覚出力装置を含んでよい(例えば、タッチスクリーン710、データグラブ1204、又はジョイスティック705による感覚フィードバック、しかし入力装置として機能しない感覚フィードバック装置も存在し得る)、音声出力装置(例えば、スピーカ709、ヘッドフォン(図示しない)、視覚的出力装置(例えば、スクリーン710、陰極線管(CRT)スクリーン、液晶ディスプレイ(LCD)スクリーン、プラズマスクリーン、有機発光ダイオード(OLED)スクリーンを含み、それぞれタッチスクリーン入力能力を有し又は有さず、それぞれ感覚フィードバック能力を有し又は有さず、これらのうちの幾つかは例えば立体出力、仮想現実眼鏡(図示しない)、ホログラフィックディスプレイ、及び発煙剤タンク(図示しない)、及びプリンタ(図示しないより多くの出力を出力可能であってよい))。
コンピュータシステム700は、人間のアクセス可能な記憶装置、及び、例えばCD/DVD等の媒体721を備えるCD/DVDROM/RW720のような光学媒体、サムドライブ722、取り外し可能ハードドライブ又は個体状態ドライブ723、テープ及びフロッピディスク(図示しない)のようなレガシー磁気媒体、セキュリティドングル(図示しない)等のような専用ROM/ASIC/PLDに基づく装置のような関連する媒体も含み得る。
当業者は、本開示の主題と関連して使用される用語「コンピュータ可読媒体」が伝送媒体、搬送波、又は他の一時的信号を包含しないことも理解すべきである。
コンピュータシステム700は、1つ以上の通信ネットワークへのインタフェース(955)も含み得る。ネットワークは、例えば無線、有線、光であり得る。ネットワークへは、更に、ローカル、広域、都市域、車両及び産業、リアルタイム、耐遅延性、等であり得る。ネットワークの例は、イーサネットのようなローカルエリアネットワーク、無線LAN、GSM(global systems for mobile communications)、第3世代(3G)、第4世代(4G)、第5世代(5G)、LTE(Long-Term Evolution)等を含むセルラネットワーク、ケーブルTV、衛星TV、地上波放送TVを含むTV有線又は無線広域デジタルネットワーク、CANBusを含む車両及び産業、等を含む。特定のネットワークは、一般に、特定の汎用データポート又は周辺機器バス(949)(例えば、コンピュータシステム700のユニバーサルシリアルバス(USB)ポート))に取り付けられる外部ネットワークインタフェースを必要とする。他のものは、一般に、後述するようなシステムバスへの取り付けによりコンピュータシステム700のコアに統合される(例えば、イーサネットインタフェースをPCコンピュータシステムへ、又はセルラネットワークインタフェースをスマートフォンコンピュータシステムへ)。例として、ネットワーク755は、ネットワークインタフェース754を用いて周辺機器バス749に接続されてよい。これらのネットワークを用いて、コンピュータシステム700は、他のエンティティと通信できる。このような通信は、単方向受信のみ(例えば、放送TV)、単方向送信のみ(例えば、特定のCANbus装置へのCANbus)、又は例えばローカル又は広域デジタルネットワークを用いて他のコンピュータシステムへの双方向であり得る。特定のプロトコル及びプロトコルスタックが、それらのネットワーク及びネットワークインタフェース(954)の各々で使用され得る。
前述のヒューマンインタフェース装置、人間のアクセス可能な記憶装置、及びネットワークインタフェースは、コンピュータシステム700のコア740に取り付け可能である。
コア740は、1つ以上の中央処理ユニット(CPU)741、グラフィック処理ユニット(GPU)742、FPGAの形式の専用プログラマブル処理ユニット743、特定タスクのためのハードウェアアクセラレータ744、等を含み得る。これらの装置は、読み出し専用メモリ(ROM)745、ランダムアクセスメモリ(RAM)746、内部のユーザアクセス不可能なハードドライブ、SSD、等のような内蔵大容量記憶装置747と共に、システムバス748を通じて接続されてよい。幾つかのコンピュータシステムでは、追加CPU、GPU、等による拡張を可能にするために、システムバス748は、1つ以上の物理プラグの形式でアクセス可能である。周辺機器は、コアのシステムバス748に直接に、又は周辺機器バス749を通じて、取り付け可能である。周辺機器バスのアーキテクチャは、周辺機器相互接続(peripheral component interconnect (PCI))、USB、等を含む。
CPU741、GPU742、FPGA743、及びアクセラレータ744は、結合されて前述のコンピュータコードを生成可能な特定の命令を実行できる。該コンピュータコードは、ROM745又はRAM746に格納できる。一時的データもRAM746に格納でき、一方で、永久的データは例えば内蔵大容量記憶装置747に格納できる。メモリ装置のうちのいずれかへの高速記憶及び読み出しは1つ以上のCPU741、GPU742、大容量記憶装置747、ROM745、RAM746等に密接に関連付けられ得るキャッシュメモリの使用を通じて可能にできる。
コンピュータ可読媒体は、種々のコンピュータにより実施される動作を実行するためのコンピュータコードを有し得る。媒体及びコンピュータコードは、本開示の目的のために特別に設計され構成されたものであり得、又は、コンピュータソフトウェア分野の当業者によく知られ利用可能な種類のものであり得る。
例として及び限定ではなく、アーキテクチャを有するコンピュータシステム700、及び具体的にはコア740は、プロセッサ(CPU、GPU、FPGA、アクセラレータ、等を含む)が1つ以上の有形コンピュータ可読媒体内に具現化されたソフトウェアを実行した結果として、機能を提供できる。このようなコンピュータ可読媒体は、コア内蔵大容量記憶装置747又はROM745のような非一時的特性のコア740の特定の記憶装置、及び上述のようなユーザアクセス可能な大容量記憶装置と関連付けられた媒体であり得る。本開示の種々の実施形態を実装するソフトウェアは、このような装置に格納されコア740により実行できる。コンピュータ可読媒体は、特定の必要に従い、1つ以上のメモリ装置又はチップを含み得る。ソフトウェアは、コア740及び具体的にはその中のプロセッサ(CPU、GPU、FPGA、等を含む)に、ソフトウェアにより定義された処理に従うRAM746に格納されたデータ構造の定義及び該データ構造の変更を含む、ここに記載した特定の処理又は特定の処理の特定の部分を実行させることができる。追加又は代替として、コンピュータシステムは、ここに記載の特定の処理又は特定の処理の特定の部分を実行するためにソフトウェアと一緒に又はそれに代わって動作可能な論理ハードワイヤド又は他の回路内の実装(例えば、アクセラレータ744)の結果として機能を提供できる。ソフトウェアへの言及は、ロジックを含み、適切な場合にはその逆も同様である。コンピュータ可読媒体への言及は、適切な場合には、実行のためにソフトウェアを格納する(集積回路(IC)のような)回路、実行のためにロジックを実装する回路、又はそれらの両方を含み得る。本開示は、ハードウェア及びソフトウェアの任意の適切な組み合わせを含む。
本開示は、幾つかの例示的な実施形態を記載したが、代替、置換、及び種々の代用の均等物が存在し、それらは本開示の範囲に包含される。当業者に明らかなことに、ここに明示的に示され又は説明されないが、本開示の原理を実施し、したがって、本開示の精神及び範囲に含まれる多数のシステム及び方法を考案可能である。

Claims (16)

  1. 符号化ビデオビットストリームを生成する装置により実行される方法であって、前記方法は、
    ビデオビットストリームからイントラランダムアクセスポイント(IRAP)アクセスユニット(AU)を取得するステップと、
    前記IRAP AUが復号順で最初のAUかどうか、前記IRAP AUに含まれる各ピクチャがデコーダ復号動作の瞬時リフレッシュ(IDR)ピクチャかどうか、及び前記IRAP AUに含まれる各ピクチャが前記復号順でシーケンス終了(EOS)ネットワーク抽象レイヤ(NAL)単位に続くレイヤの最初のピクチャであるかどうかを決定するステップと、
    前記IRAP AUが前記ビデオビットストリームの前記復号順で最初のAUであるという決定、前記IRAP AUに含まれる各ピクチャが前記IDRピクチャであるという決定、又は前記IRAP AUに含まれる各ピクチャが前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャであるという決定に基づき、前記IRAP AUの第1フラグを1に等しく設定するステップと、
    前記IRAP AUが前記復号順で最初のAUではないという決定、前記IRAP AUに含まれる各ピクチャはIDRピクチャではないという決定、及び前記IRAP AUに含まれる各ピクチャは前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャではないという決定に基づき、前記IRAP AUの第2フラグが外部処理により提供される値に設定されるかどうかを決定するステップと、
    前記IRAP AUが前記復号順で最初のAUではないという決定、前記IRAP AUに含まれる各ピクチャは前記IDRピクチャではないという決定、前記IRAP AUに含まれる各ピクチャは前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャではないという決定、及び前記IRAP AUの前記第2フラグが前記外部処理により提供される値に設定されるという決定に基づき、前記IRAP AUの前記第1フラグを前記外部処理により提供される値に等しく設定するステップと、
    前記IRAP AUが前記復号順で最初のAUではないという決定、前記IRAP AUに含まれる各ピクチャは前記IDRピクチャではないという決定、前記IRAP AUに含まれる各ピクチャは前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャではないという決定、及び前記第2フラグが前記外部処理により提供される値に設定されないという決定に基づき、前記IRAP AUの前記第1フラグを0に等しく設定し、前記IRAP AUの前記第2フラグを0に等しく設定するステップと、
    前記IRAP AUの前記第1フラグ及び前記IRAP AUの前記第2フラグに基づき、前記ビデオビットストリームを符号化するステップと、
    前記ビデオビットストリームから非IRAPAUを取得するステップと、
    前記非IRAP AUからIRAPピクチャユニット(PU)を取得するステップと、
    前記IRAP PUに対応するピクチャがIDRピクチャかどうか、及び前記ピクチャが、前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャであるかどうかを決定するステップと、
    前記ピクチャが前記IDRピクチャであるという決定、又は前記ピクチャが前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャであるという決定に基づき、前記IRAP PUの第1フラグを1に等しく設定するステップと、
    前記ピクチャはIDRピクチャではないという決定、及び前記ピクチャは前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャではないという決定に基づき、前記IRAP PUの第2フラグが外部処理により提供される値に設定されるかどうかを決定するステップと、
    前記ピクチャは前記IDRピクチャではないという決定、前記ピクチャは前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャではないという決定、及び前記IRAP PUの前記第2フラグが前記外部処理により提供される値に設定されるという決定に基づき、前記IRAP PUの前記第1フラグを前記外部処理により提供される値に設定するステップと、
    前記ピクチャは前記IDRピクチャではないという決定、前記ピクチャは前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャではないという決定、及び前記IRAP PUの前記第2フラグが前記外部処理により提供される値に設定されないという決定に基づき、前記IRAP PUの前記第1フラグを0に等しく設定し、前記IRAP PUの前記第2フラグを0に等しく設定するステップと、
    前記符号化ビデオビットストリームを送信するステップと、
    を含み、
    前記ビデオビットストリームは、前記IRAP PUの前記第1フラグ及び前記IRAP PUの前記第2フラグに基づき、更に符号化される、方法。
  2. 前記IRAP AUの前記第1フラグが1に等しく設定されることは、前記IRAP AUに含まれるクリーンランダムアクセス(CRA)ピクチャに関連付けられた全部のランダムアクセススキップリーディング(RASL)ピクチャが復号されずに破棄されるべきであることを示し、前記IRAP AUの前記第2フラグが1に等しく設定されることは、前記IRAP AUに含まれる前記CRAピクチャに関連付けられた全部のリーディングピクチャが復号されずに廃棄されるべきであることを示す、請求項1に記載の方法。
  3. 前記IRAP AUの前記第1フラグは、NoIncorrectPicOutputFlagフラグを含み、
    前記IRAP AUの前記第2フラグは、HandleCraAsCvsStartFlagフラグを含む、請求項1に記載の方法。
  4. 前記ビデオビットストリームから漸次復号リフレッシュ(GDR)AUを取得するステップと、
    前記GDR AUが前記復号順で最初のAUかどうか、及び前記GDR AUに含まれる各ピクチャが前記復号順で前記EOSNAL単位に続くレイヤの最初のピクチャであるかどうかを決定するステップと、
    前記GDR AUが前記ビデオビットストリームの前記復号順で最初のAUであるという決定、又は前記GDR AUに含まれる各ピクチャが前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャであるという決定に基づき、前記GDR AUの第1フラグを1に等しく設定するステップと、
    前記GDR AUが前記復号順で最初のAUではないという決定、前記GDR AUに含まれる各ピクチャは前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャではないという決定に基づき、前記GDR AUの第2フラグが外部処理により提供される値に設定されるかどうかを決定するステップと、
    前記GDR AUが前記復号順で最初のAUではないという決定、前記GDR AUに含まれる各ピクチャは前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャではないという決定、及び前記GDR AUの前記第2フラグが前記外部処理により提供される値に設定されるという決定に基づき、前記GDR AUの前記第1フラグを前記外部処理により提供される値に等しく設定するステップと、
    前記GDR AUが前記復号順で最初のAUではないという決定、前記GDR AUに含まれる各ピクチャは前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャではないという決定、及び前記第2フラグが前記外部処理により提供される値に設定されないという決定に基づき、前記GDR AUの前記第1フラグを0に等しく設定し、前記GDR AUの前記第2フラグを0に等しく設定するステップと、
    を更に含み、
    前記ビデオビットストリームは、前記GDR AUの前記第1フラグ及び前記GDR AUの前記第2フラグに基づき、更に符号化される、請求項1~3のいずれか一項に記載の方法。
  5. 前記GDR AUの前記第1フラグが1に等しく設定されることは、前記GDR AUに含まれるGDRピクチャに関連付けられた全部のランダムアクセススキップリーディング(RASL)ピクチャが復号されずに破棄されるべきであることを示し、
    前記GDR AUの前記第2フラグが1に等しく設定されることは、前記GDR AUに含まれる前記GDRピクチャに関連付けられた全部のリーディングピクチャが復号されずに廃棄されるべきであることを示す、請求項に記載の方法。
  6. 前記GDR AUの前記第1フラグは、NoIncorrectPicOutputFlagフラグを含み、
    前記GDR AUの前記第2フラグは、HandleGdrAsCvsStartFlagフラグを含む、請求項に記載の方法。
  7. 前記非IRAP AUからGDRピクチャユニット(PU)を取得するステップと、
    前記GDR PUに対応するピクチャが前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャであるかどうかを決定するステップと、
    前記ピクチャが前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャであるという決定に基づき、前記GDR PUの第1フラグを1に等しく設定するステップと、
    前記ピクチャは前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャではないという決定に基づき、前記GDR PUの第2フラグが外部処理により提供される値に設定されるかどうかを決定するステップと、
    前記ピクチャは前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャではないという決定、及び前記GDR PUの前記第2フラグが前記外部処理により提供される値に設定されるという決定に基づき、前記IRAP PUの前記第1フラグを前記外部処理により提供される値に設定するステップと、
    前記ピクチャは前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャではないという決定、及び前記GDR PUの前記第2フラグが前記外部処理により提供される値に設定されないという決定に基づき、前記GDR PUの前記第1フラグを0に等しく設定し、前記GDR PUの前記第2フラグを0に等しく設定するステップと、
    を更に含み、
    前記ビデオビットストリームは、前記GDR PUの前記第1フラグ及び前記GDR PUの前記第2フラグに基づき、更に符号化される、請求項4~6のいずれか一項に記載の方法。
  8. 符号化ビデオビットストリームを生成する装置であって、前記装置は、
    プログラムコードを格納するよう構成される少なくとも1つのメモリと、
    前記プログラムコードを読み出し前記プログラムコードにより指示されるように動作するよう構成される少なくとも1つのプロセッサと、
    を含み、前記プログラムコードは、
    前記少なくとも1つのプロセッサに、ビデオビットストリームからイントラランダムアクセスポイント(IRAP)アクセスユニット(AU)を取得させるよう構成される第1取得コードと、
    前記少なくとも1つのプロセッサに、前記IRAP AUが復号順で最初のAUかどうか、前記IRAP AUに含まれる各ピクチャがデコーダ復号動作の瞬時リフレッシュ(IDR)ピクチャかどうか、及び前記IRAP AUに含まれる各ピクチャが前記復号順でシーケンス終了(EOS)ネットワーク抽象レイヤ(NAL)単位に続くレイヤの最初のピクチャであるかどうかを決定させるよう構成される第1決定コードと、
    前記少なくとも1つのプロセッサに、前記IRAP AUが前記ビデオビットストリームの前記復号順で最初のAUであるという決定、前記IRAP AUに含まれる各ピクチャが前記IDRピクチャであるという決定、又は前記IRAP AUに含まれる各ピクチャが前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャであるという決定に基づき、前記IRAP AUの第1フラグを1に等しく設定させるよう構成される第1設定コードと、
    前記少なくとも1つのプロセッサに、前記IRAP AUが前記復号順で最初のAUではないという決定、前記IRAP AUに含まれる各ピクチャはIDRピクチャではないという決定、及び前記IRAP AUに含まれる各ピクチャは前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャではないという決定に基づき、前記IRAP AUの第2フラグが外部処理により提供される値に設定されるかどうかを決定させる第2決定コードと、
    前記少なくとも1つのプロセッサに、前記IRAP AUが前記復号順で最初のAUではないという決定、前記IRAP AUに含まれる各ピクチャは前記IDRピクチャではないという決定、前記IRAP AUに含まれる各ピクチャは前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャではないという決定、及び前記IRAP AUの前記第2フラグが前記外部処理により提供される値に設定されるという決定に基づき、前記IRAP AUの前記第1フラグを前記外部処理により提供される値に等しく設定させる第2設定コードと、
    前記少なくとも1つのプロセッサに、前記IRAP AUが前記復号順で最初のAUではないという決定、前記IRAP AUに含まれる各ピクチャは前記IDRピクチャではないという決定、前記IRAP AUに含まれる各ピクチャは前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャではないという決定、及び前記第2フラグが前記外部処理により提供される値に設定されないという決定に基づき、前記IRAP AUの前記第1フラグを0に等しく設定し、前記IRAP AUの前記第2フラグを0に等しく設定させる第3設定コードと、
    前記少なくとも1つのプロセッサに、前記IRAP AUの前記第1フラグ及び前記IRAP AUの前記第2フラグに基づき、前記ビデオビットストリームを符号化させるよう構成される符号化コードと、
    前記少なくとも1つのプロセッサに、前記ビデオビットストリームから非IRAPAUを取得させるよう構成される第2取得コードと、
    前記少なくとも1つのプロセッサに、前記非IRAP AUからIRAPピクチャユニット(PU)を取得させるよう構成される第3取得コードと、
    前記少なくとも1つのプロセッサに、前記IRAP PUに対応するピクチャがIDRピクチャかどうか、及び前記ピクチャが、前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャであるかどうかを決定させるよう構成される第3決定コードと、
    前記少なくとも1つのプロセッサに、前記ピクチャが前記IDRピクチャであるという決定、又は前記ピクチャが前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャであるという決定に基づき、前記IRAP PUの第1フラグを1に等しく設定させるよう構成される第4設定コードと、
    前記少なくとも1つのプロセッサに、前記ピクチャはIDRピクチャではないという決定、及び前記ピクチャは前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャではないという決定に基づき、前記IRAP PUの第2フラグが外部処理により提供される値に設定されるかどうかを決定させるよう構成される第4決定コードと、
    前記少なくとも1つのプロセッサに、前記ピクチャは前記IDRピクチャではないという決定、前記ピクチャは前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャではないという決定、及び前記IRAP PUの前記第2フラグが前記外部処理により提供される値に設定されるという決定に基づき、前記IRAP PUの前記第1フラグを前記外部処理により提供される値に設定させるよう構成される第5設定コードと、
    前記少なくとも1つのプロセッサに、前記ピクチャは前記IDRピクチャではないという決定、前記ピクチャは前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャではないという決定、及び前記IRAP PUの前記第2フラグが前記外部処理により提供される値に設定されないという決定に基づき、前記IRAP PUの前記第1フラグを0に等しく設定し、前記IRAP PUの前記第2フラグを0に等しく設定させるよう構成される第6設定コードと、
    前記少なくとも1つのプロセッサに、前記符号化ビデオビットストリームを送信させるよう構成される送信コードと、
    を含み、
    前記ビデオビットストリームは、前記IRAP PUの前記第1フラグ及び前記IRAP PUの前記第2フラグに基づき、更に符号化される、装置。
  9. 前記IRAP AUの前記第1フラグが1に等しく設定されることは、前記IRAP AUに含まれるクリーンランダムアクセス(CRA)ピクチャに関連付けられた全部のランダムアクセススキップリーディング(RASL)ピクチャが復号されずに破棄されるべきであることを示し、前記IRAP AUの前記第2フラグが1に等しく設定されることは、前記IRAP AUに含まれる前記CRAピクチャに関連付けられた全部のリーディングピクチャが復号されずに廃棄されるべきであることを示す、請求項に記載の装置。
  10. 前記IRAP AUの前記第1フラグは、NoIncorrectPicOutputFlagフラグを含み、
    前記IRAP AUの前記第2フラグは、HandleCraAsCvsStartFlagフラグを含む、請求項に記載の装置。
  11. 前記プログラムコードは、
    前記少なくとも1つのプロセッサに、前記ビデオビットストリームから漸次復号リフレッシュ(GDR)AUを取得させるよう構成される第4取得コードと、
    前記少なくとも1つのプロセッサに、前記GDR AUが前記復号順で最初のAUかどうか、及び前記GDR AUに含まれる各ピクチャが前記復号順で前記EOSNAL単位に続くレイヤの最初のピクチャであるかどうかを決定させるよう構成される第5決定コードと、
    前記少なくとも1つのプロセッサに、前記GDR AUが前記ビデオビットストリームの前記復号順で最初のAUであるという決定、又は前記GDR AUに含まれる各ピクチャが前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャであるという決定に基づき、前記GDR AUの第1フラグを1に等しく設定させるよう構成される第7設定コードと、
    前記少なくとも1つのプロセッサに、前記GDR AUが前記復号順で最初のAUではないという決定、前記GDR AUに含まれる各ピクチャは前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャではないという決定に基づき、前記GDR AUの第2フラグが外部処理により提供される値に設定されるかどうかを決定させるよう構成される第6決定コードと、
    前記少なくとも1つのプロセッサに、前記GDR AUが前記復号順で最初のAUではないという決定、前記GDR AUに含まれる各ピクチャは前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャではないという決定、及び前記GDR AUの前記第2フラグが前記外部処理により提供される値に設定されるという決定に基づき、前記GDR AUの前記第1フラグを前記外部処理により提供される値に等しく設定させるよう構成される第8設定コードと、
    前記少なくとも1つのプロセッサに、前記GDR AUが前記復号順で最初のAUではないという決定、前記GDR AUに含まれる各ピクチャは前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャではないという決定、及び前記第2フラグが前記外部処理により提供される値に設定されないという決定に基づき、前記GDR AUの前記第1フラグを0に等しく設定し、前記GDR AUの前記第2フラグを0に等しく設定させるよう成されるコードと、
    を更に含み、
    前記ビデオビットストリームは、前記GDR AUの前記第1フラグ及び前記GDR AUの前記第2フラグに基づき、更に符号化される、請求項8~10のいずれか一項に記載の装置。
  12. 前記GDR AUの前記第1フラグが1に等しく設定されることは、前記GDR AUに含まれるGDRピクチャに関連付けられた全部のランダムアクセススキップリーディング(RASL)ピクチャが復号されずに破棄されるべきであることを示し、
    前記GDR AUの前記第2フラグが1に等しく設定されることは、前記GDR AUに含まれる前記GDRピクチャに関連付けられた全部のリーディングピクチャが復号されずに廃棄されるべきであることを示す、請求項11に記載の装置。
  13. 前記GDR AUの前記第1フラグは、NoIncorrectPicOutputFlagフラグを含み、
    前記GDR AUの前記第2フラグは、HandleGdrAsCvsStartFlagフラグを含む、請求項11に記載の装置。
  14. 前記プログラムコードは、
    前記少なくとも1つのプロセッサに、前記非IRAP AUからGDRピクチャユニット(PU)を取得させるよう構成される第6取得コードと、
    前記少なくとも1つのプロセッサに、前記GDR PUに対応するピクチャが前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャであるかどうかを決定させるよう構成される第7決定コードと、
    前記少なくとも1つのプロセッサに、前記ピクチャが前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャであるという決定に基づき、前記GDR PUの第1フラグを1に等しく設定させるよう構成される第9設定コードと、
    前記少なくとも1つのプロセッサに、前記ピクチャは前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャではないという決定に基づき、前記GDR PUの第2フラグが外部処理により提供される値に設定されるかどうかを決定させるよう構成される第8決定コードと、
    前記少なくとも1つのプロセッサに、前記ピクチャは前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャではないという決定、及び前記GDR PUの前記第2フラグが前記外部処理により提供される値に設定されるという決定に基づき、前記IRAP PUの前記第1フラグを前記外部処理により提供される値に設定させるよう構成される第10設定コードと、
    前記少なくとも1つのプロセッサに、前記ピクチャは前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャではないという決定、及び前記GDR PUの前記第2フラグが前記外部処理により提供される値に設定されないという決定に基づき、前記GDR PUの前記第1フラグを0に等しく設定し、前記IRAP PUの前記第2フラグを0に等しく設定させるよう構成される第11設定コードと、
    を更に含み、
    前記ビデオビットストリームは、前記GDR PUの前記第1フラグ及び前記GDR PUの前記第2フラグに基づき、更に符号化される、請求項11~13のいずれか一項に記載の装置。
  15. 符号化ビデオビットストリームを生成する装置の1つ以上のプロセッサにより実行されると、前記1つ以上のプロセッサに、請求項1~のいずれか一項に記載の方法を実行させる、コンピュータプログラム。
  16. 符号化ビデオビットストリームを生成する装置により実行される方法であって、前記方法は、
    ビデオビットストリームからイントラランダムアクセスポイント(IRAP)アクセスユニット(AU)を取得するステップと、
    前記IRAP AUが復号順で最初のAUかどうか、前記IRAP AUに含まれる各ピクチャがデコーダ復号動作の瞬時リフレッシュ(IDR)ピクチャかどうか、及び前記IRAP AUに含まれる各ピクチャが前記復号順でシーケンス終了(EOS)ネットワーク抽象レイヤ(NAL)単位に続くレイヤの最初のピクチャであるかどうかを決定するステップと、
    前記IRAP AUが前記ビデオビットストリームの前記復号順で最初のAUであるという決定、前記IRAP AUに含まれる各ピクチャが前記IDRピクチャであるという決定、又は前記IRAP AUに含まれる各ピクチャが前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャであるという決定に基づき、前記IRAP AUの第1フラグを1に等しく設定するステップと、
    前記IRAP AUが前記復号順で最初のAUではないという決定、前記IRAP AUに含まれる各ピクチャはIDRピクチャではないという決定、及び前記IRAP AUに含まれる各ピクチャは前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャではないという決定に基づき、前記IRAP AUの第2フラグが外部処理により提供される値に設定されるかどうかを決定するステップと、
    前記IRAP AUが前記復号順で最初のAUではないという決定、前記IRAP AUに含まれる各ピクチャは前記IDRピクチャではないという決定、前記IRAP AUに含まれる各ピクチャは前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャではないという決定、及び前記IRAP AUの前記第2フラグが前記外部処理により提供される値に設定されるという決定に基づき、前記IRAP AUの前記第1フラグを前記外部処理により提供される値に等しく設定するステップと、
    前記IRAP AUが前記復号順で最初のAUではないという決定、前記IRAP AUに含まれる各ピクチャは前記IDRピクチャではないという決定、前記IRAP AUに含まれる各ピクチャは前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャではないという決定、及び前記第2フラグが前記外部処理により提供される値に設定されないという決定に基づき、前記IRAP AUの前記第1フラグを0に等しく設定し、前記IRAP AUの前記第2フラグを0に等しく設定するステップと、
    前記IRAP AUの前記第1フラグ及び前記IRAP AUの前記第2フラグに基づき、前記ビデオビットストリームを符号化するステップと、
    前記ビデオビットストリームから非IRAPAUを取得するステップと、
    前記非IRAP AUからIRAPピクチャユニット(PU)を取得するステップと、
    前記IRAP PUに対応するピクチャがIDRピクチャかどうか、及び前記ピクチャが、前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャであるかどうかを決定するステップと、
    前記ピクチャが前記IDRピクチャであるという決定、又は前記ピクチャが前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャであるという決定に基づき、前記IRAP PUの第1フラグを1に等しく設定するステップと、
    前記ピクチャはIDRピクチャではないという決定、及び前記ピクチャは前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャではないという決定に基づき、前記IRAP PUの第2フラグが外部処理により提供される値に設定されるかどうかを決定するステップと、
    前記ピクチャは前記IDRピクチャではないという決定、前記ピクチャは前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャではないという決定、及び前記IRAP PUの前記第2フラグが前記外部処理により提供される値に設定されるという決定に基づき、前記IRAP PUの前記第1フラグを前記外部処理により提供される値に設定するステップと、
    前記ピクチャは前記IDRピクチャではないという決定、前記ピクチャは前記復号順で前記EOS NAL単位に続くレイヤの最初のピクチャではないという決定、及び前記IRAP PUの前記第2フラグが前記外部処理により提供される値に設定されないという決定に基づき、前記IRAP PUの前記第1フラグを0に等しく設定し、前記IRAP PUの前記第2フラグを0に等しく設定するステップと、
    を含み、
    前記ビデオビットストリームは、前記IRAP PUの前記第1フラグ及び前記IRAP PUの前記第2フラグに基づき、更に符号化される、方法。

JP2021557674A 2019-12-30 2020-10-09 符号化ビデオビットストリームを生成する方法、装置、及びコンピュータプログラム Active JP7319384B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023118697A JP2023134778A (ja) 2019-12-30 2023-07-20 符号化ビデオビットストリームを生成する方法、装置、及びコンピュータプログラム

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962954880P 2019-12-30 2019-12-30
US62/954,880 2019-12-30
US17/063,082 2020-10-05
US17/063,082 US11228777B2 (en) 2019-12-30 2020-10-05 Method for layerwise random access in a coded video stream
PCT/US2020/054972 WO2021137915A1 (en) 2019-12-30 2020-10-09 Method for layerwise random access in a coded video stream

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2023118697A Division JP2023134778A (ja) 2019-12-30 2023-07-20 符号化ビデオビットストリームを生成する方法、装置、及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2022526173A JP2022526173A (ja) 2022-05-23
JP7319384B2 true JP7319384B2 (ja) 2023-08-01

Family

ID=76546784

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2021557674A Active JP7319384B2 (ja) 2019-12-30 2020-10-09 符号化ビデオビットストリームを生成する方法、装置、及びコンピュータプログラム
JP2023118697A Pending JP2023134778A (ja) 2019-12-30 2023-07-20 符号化ビデオビットストリームを生成する方法、装置、及びコンピュータプログラム

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2023118697A Pending JP2023134778A (ja) 2019-12-30 2023-07-20 符号化ビデオビットストリームを生成する方法、装置、及びコンピュータプログラム

Country Status (9)

Country Link
US (3) US11228777B2 (ja)
EP (1) EP4085619A4 (ja)
JP (2) JP7319384B2 (ja)
KR (2) KR102650213B1 (ja)
CN (1) CN113826387B (ja)
AU (2) AU2020417163B2 (ja)
CA (1) CA3137489A1 (ja)
SG (1) SG11202111505SA (ja)
WO (1) WO2021137915A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7417104B2 (ja) 2020-06-16 2024-01-18 キョーラク株式会社 スタンド、及びこれを備えた飛沫防止スクリーン

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115336273A (zh) * 2020-03-19 2022-11-11 字节跳动有限公司 用于图片编解码的帧内随机访问点
EP4144093A4 (en) 2020-05-22 2023-08-23 ByteDance Inc. SIGNALING OF IMAGE INFORMATION IN ACCESS UNITS

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017225159A (ja) 2012-09-28 2017-12-21 クゥアルコム・インコーポレイテッドQualcomm Incorporated ビデオコーディングにおける関心領域および漸次復号リフレッシュのシグナリング

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9596486B2 (en) * 2013-04-05 2017-03-14 Qualcomm Incorporated IRAP access units and bitstream switching and splicing
US9674533B2 (en) * 2013-04-05 2017-06-06 Qualcomm Incorporated Picture alignments in multi-layer video coding
US9525883B2 (en) * 2013-07-15 2016-12-20 Qualcomm Incorporated Cross-layer alignment of intra random access point pictures
KR20150042683A (ko) * 2013-10-11 2015-04-21 한국전자통신연구원 점진적 계층전환을 이용한 영상 부호화/복호화 방법 및 그 장치
CN105765978B (zh) * 2013-10-11 2019-01-29 韩国电子通信研究院 用于编码/解码图像的方法和使用其的装置
WO2015057124A1 (en) * 2013-10-14 2015-04-23 Telefonaktiebolaget L M Ericsson (Publ) Picture order count alignment in scalble video
US9794595B2 (en) * 2014-03-18 2017-10-17 Qualcomm Incorporated Derivation of end of sequence NAL unit information for multi-layer bitstreams
US20170105004A1 (en) * 2015-10-07 2017-04-13 Qualcomm Incorporated Methods and systems of coding a predictive random access picture using a background picture

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017225159A (ja) 2012-09-28 2017-12-21 クゥアルコム・インコーポレイテッドQualcomm Incorporated ビデオコーディングにおける関心領域および漸次復号リフレッシュのシグナリング

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Benjamin Bross et al.,"Versatile Video Coding(Draft5)", Joint Video Exploration Team (JVET),2019年07月02日,pp.2,6,127-134,[JVET-N1001-V1](version 10)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7417104B2 (ja) 2020-06-16 2024-01-18 キョーラク株式会社 スタンド、及びこれを備えた飛沫防止スクリーン

Also Published As

Publication number Publication date
EP4085619A1 (en) 2022-11-09
JP2023134778A (ja) 2023-09-27
KR102650213B1 (ko) 2024-03-22
CN113826387A (zh) 2021-12-21
US20230328265A1 (en) 2023-10-12
SG11202111505SA (en) 2021-11-29
AU2020417163A1 (en) 2021-10-28
US20210203970A1 (en) 2021-07-01
CA3137489A1 (en) 2021-07-08
CN113826387B (zh) 2024-04-19
US11228777B2 (en) 2022-01-18
WO2021137915A1 (en) 2021-07-08
AU2023258361A1 (en) 2023-11-23
EP4085619A4 (en) 2023-12-27
AU2020417163B2 (en) 2023-08-17
US11765373B2 (en) 2023-09-19
KR20240040130A (ko) 2024-03-27
KR20210104892A (ko) 2021-08-25
JP2022526173A (ja) 2022-05-23
US20220103850A1 (en) 2022-03-31

Similar Documents

Publication Publication Date Title
JP7321286B2 (ja) 様々な色度フォーマットをサポートするビデオコーディングツールのシグナリング
JP7108138B2 (ja) ランダムアクセスポイントおよびピクチャタイプの識別方法
JP7177179B2 (ja) 簡略化された最確モードリスト生成スキーム
JP7319384B2 (ja) 符号化ビデオビットストリームを生成する方法、装置、及びコンピュータプログラム
JP7297089B2 (ja) コード化ピクチャにおける混合nalユニット・タイプをサポートする方法、システム及びコンピュータ・プログラム
JP7288081B2 (ja) ビデオビットストリームを復号する方法、装置、及びプログラム
JP7318087B2 (ja) マルチラインイントラ予測のためのモードリストを生成する方法、並びにその装置及びコンピュータプログラム
JP2023041875A (ja) ビデオ符号化及び復号の方法及び装置並びにコンピュータプログラム
KR20210130804A (ko) 스케일러블 비디오 스트림에서의 출력 계층 세트 시그널링을 위한 방법
JP7237410B2 (ja) ビデオビットストリームにおけるピクチャサイズおよび分割情報の効率的なシグナリングのための方法、装置、およびコンピュータプログラム
JP7254188B2 (ja) 点群符号化のためのパラメータセット設計の方法並びにその装置及びプログラム
JP7326436B2 (ja) イントラ予測におけるイントラモード選択
JP7342125B2 (ja) ネットワーク抽象化レイヤユニットヘッダ
JP2023510504A (ja) ニューラルネットワークベースのビデオコーディングのためのプルーニング方法、装置およびコンピュータプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210927

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230620

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230720

R150 Certificate of patent or registration of utility model

Ref document number: 7319384

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150