JP2021520144A - デコードまたはエンコードのための方法並びに装置およびコンピュータプログラム - Google Patents

デコードまたはエンコードのための方法並びに装置およびコンピュータプログラム Download PDF

Info

Publication number
JP2021520144A
JP2021520144A JP2020556806A JP2020556806A JP2021520144A JP 2021520144 A JP2021520144 A JP 2021520144A JP 2020556806 A JP2020556806 A JP 2020556806A JP 2020556806 A JP2020556806 A JP 2020556806A JP 2021520144 A JP2021520144 A JP 2021520144A
Authority
JP
Japan
Prior art keywords
transformation
recursive
dct
dst
data structure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020556806A
Other languages
English (en)
Other versions
JP7213264B2 (ja
Inventor
ジャオ,シン
リ,シアン
リィウ,シャン
Original Assignee
テンセント・アメリカ・エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テンセント・アメリカ・エルエルシー filed Critical テンセント・アメリカ・エルエルシー
Publication of JP2021520144A publication Critical patent/JP2021520144A/ja
Application granted granted Critical
Publication of JP7213264B2 publication Critical patent/JP7213264B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

一つ又は複数の非再帰的変換をより大きい再帰的変換に埋め込むことにより、新しいマルチ変換データ構造を生成することを含む、デコードまたはエンコード方法である。該方法は、ターゲットデータブロックに関する情報を受信するステップと、再帰的変換を使用するかそれとも非再帰的変換を使用するかを判定するステップとをさらに含み得る。前記再帰的変換を使用すると判定された場合、該方法は、前記マルチ変換データ構造を使用して前記再帰的変換を生成し、生成された前記再帰的変換を使用して前記ターゲットデータブロックをエンコードまたはデコードさせることを含み得る。そうでない場合、該方法は、前記マルチ変換データ構造に埋め込まれた前記一つ又は複数の非再帰的変換のうちの1つを使用して前記ターゲットデータブロックをエンコードまたはデコードさせることを含み得る。

Description

[優先情報]
本出願は、それぞれ米国特許商標庁へ、2018年5月11日に出願された米国仮出願番号第62/670,704号、および、2018年5月7日に出願された米国仮出願第62/668,065号の優先権を主張し、その内容を全て参照により本出願に組み込むものとする。
[技術分野]
この開示は、ビデオ圧縮技術を対象とする。特に、本開示は、多目的ビデオ符号化(VVC)などの高効率ビデオ符号化(HEVC)を超えるビデオ符号化/デコード技術を含む次世代のビデオ符号化技術を対象とする。VVCは、現在開発中のビデオ符号化規格である。開示された主題は、VVCのコンテキストで使用されてもよい。より具体的には、本開示の一態様は、1つの正規直交変換をより大きい正規直交変換に埋め込むことに基づいてエンコードまたはデコードするための方法、デバイスおよびコンピュータ媒体を対象とする。
何十年にもわたって、動き補償を伴うインターピクチャ予測を使用するビデオ符号化およびデコードが知られている。非圧縮デジタルビデオは、一連のピクチャで構成されることができ、各ピクチャは、例えば、1920×1080の輝度サンプルと関連する色差サンプルの空間次元を持っている。該一連のピクチャは、例えば毎秒60ピクチャまたは60ヘルツ(Hz)の固定または可変ピクチャレート(非公式にはフレームレートとも呼ばれる)を持つことができる。非圧縮ビデオには、顕著なビットレート要件がある。例えば、サンプルあたり8ビットでの1080p60 4:2:0ビデオ(60Hzフレームレートでの1920×1080の輝度サンプル解像度)には、1.5Gbit/sに近い帯域幅が必要である。このようなビデオを1時間使用するには、600GByteを超えた記憶領域が必要である。
ビデオ符号化およびデコードの1つの目的は、圧縮によって入力ビデオ信号の冗長性を減らすことであり得る。圧縮は、前述の帯域幅または記憶領域の要件を、場合によっては2桁以上削減するのに役立つ。可逆圧縮と非可逆圧縮の両方、およびそれらの組み合わせを使用することができる。可逆圧縮とは、圧縮された元の信号から元の信号の正確なコピーを再構築できる技法を指す。非可逆圧縮を使用する場合、再構築された信号は元の信号と同一ではない可能性があるが、元の信号と再構築された信号との間の歪みが十分小さくて、再構築された信号が意図された応用に役立てる。ビデオの場合、非可逆圧縮が広く採用されている。許容される歪みの量はアプリケーションによって異なる。例えば、特定のコンシューマストリーミングアプリケーションのユーザは、テレビコントリビューションアプリケーションのユーザよりも高い歪みを許容できる。達成可能な圧縮率は、受け入れ可能/許容可能な歪みが大きいほど、圧縮率が高くなることを反映することができる。
当業者は一般に、ビデオ圧縮/解凍技術を理解している。一般に、ビデオまたは画像データを圧縮するには、一連の機能ステップを実行して、圧縮されたビデオまたは画像データブロックを生成する。360°画像(例えば、360°カメラによって獲得される)などの画像は圧縮に適しているかもしれないが、読みやすくするために、ビデオデータブロックの圧縮について説明する。圧縮ビデオデータブロックを生成するには、従来の規格(例えば、H.264、H.265)でビデオソースから受信された非圧縮ビデオサンプルストリームは分割または構文解析されることができ、結果として、2つ以上の参照ピクチャのサンプルのブロックが得られる。
双方向予測は、サンプルの予測ブロックなどの予測ユニット(PU)が、2つ以上の参照ピクチャのサンプルの2つの動き補償ブロックから予測され得る技術に関連し得る。双方向予測は、MPEG−1でのビデオ符号化規格に最初に導入され、MPEG−2パート2(またはH.262)、H.264、H.265などの他のビデオ符号化技術および規格にも含まれたことがある。
圧縮ビデオファイルを解凍するとき、双方向予測されたPUのサンプルの再構築中に、各参照ブロックからの動き補償および補間された入力サンプルは、各参照ブロックごとに異なる可能性がある重み付け係数によって乗算されることができ、該2つの参照ブロックのそのような重み付けされたサンプル値を加算して再構築中のサンプルを生成することができる。このようなサンプルは、ループフィルタリングなどのメカニズムでさらに処理されることができる。
MPEG―1およびMPEG―2では、再構築中のPUが属するピクチャと2つの参照ピクチャとの間の相対的な時間的距離に基づいて、重み付け係数を決定することができる。これが可能となるのは、MPEG−1およびMPEG−2では、2つの参照IまたはPピクチャのうちの1つが再構築中のBピクチャの「過去」にあり、もう1つが「未来」(提示順で)にあったためであり、また、MPEG−1およびMPEG−2では、再構築中の如何なるピクチャに対してその参照ピクチャと関連して明確なタイミング関係が確立されていたためである。
H.264以降、双方向予測ピクチャの参照ピクチャ選択の概念が緩和されたため、参照ピクチャは、デコード順で以前にあるだけでよく、提示順で以前にある必要はなくなった。さらに、H.264も、H.265も、時間領域での制約された/固定されたピクチャ間隔を必要としないという点で、時間の概念も緩和された。したがって、デコーダは、ビットストリームで使用可能なタイミング情報に基づいて重み付け係数を計算することができなくなった。代わりに、H.264およびH.265は、双方向予測ピクチャの参照サンプルのための重み付け係数として「デフォルト」0.5を含む。このデフォルトは、pred_weight_table()と呼ばれるスライスヘッダで使用可能な構文で上書きされることができる。デフォルト0.5またはpred_weight_tableにおける情報は、特定のスライス内のすべての双方向予測PUに適用され得る。
非特許文献1には、H.265/HEVC規格が示されている。しかしながら、圧縮能力がHEVC規格(その拡張を含む)の圧縮能力を大幅に上回る将来のビデオ符号化技術の標準化の必要性は、本発明者らによって研究されてきた。
非特許文献2は、バージョンVTM(VVCテストモデル)を備えた多目的ビデオ符号化(VVC)と呼ばれるHEVCを超える次世代ビデオ符号化のための最近開始された標準化フォーマットを開示している。VVCは一般に、10ビット整数行列を使用して大きい(例えば、64点以上の)変換コアを提供する。
[発明が解決しようとする課題]
高速な方法が広く研究されてきたDCT―2とは異なり、DST―7の実施は、DCT―2、例えば、非特許文献2のVTM1に基づく行列乗算よりも遥かに効率が悪い。非特許文献3では、DCT−2、DCT−3、DST−2およびDST−3を含むDCT−2ファミリーの変換に調整ステージを適用することにより、JEM7における異なるタイプのDCTおよびDSTを近似する方法が提案されており、調整ステージは、比較的少ない演算数を必要とするスパース行列を使用した行列乗算を指す。非特許文献4では、2N+1点離散フーリエ変換(DFT)を用いてN点DST−7を実施する方法が提案されている。
しかしながら、実際の実施のために追加の変換コアをオンチップメモリに記憶する必要があるとともに、変換タイプをあるブロックから別のブロックに切り替えるときに変換コアをロードする必要があるため、適応多重変換(AMT)における追加の変換タイプによって複雑さおよび実施コストが増加する。HEVCでは、小さいDCT−2変換は大きいDCT−2変換の一部であり、これは、異なるサイズの変換を実施するために同じロジックの再利用をサポートする。しかし、AMTでは、DCT−2を除き、このような機能が欠落しているため、大きい変換に小さい変換を再利用することはできず、その場合は、異なるサイズの変換を実施するには、異なるロジックを設計する必要があることを意味する。
HEVCにおけるDCT―2は、行列乗算と部分バタフライとの間の同一の出力、すなわち、デュアル実装をサポートする部分バタフライを使用して実施される。しかしながら、依然として計算負担であるハーフサイズの行列乗算も必要であり、例えば、32点HEVC DCT−2の部分バタフライには、2×2、4×4、8×8、16×16の行列乗算が必要である。
関連技術のリスト
"Transform design for HEVC with 16 bit intermediate datarepresentation"; published by: Joint Collaborative Team on Video Coding (JCT-VC) ofITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11, 5th Meeting: Geneva, CH, March16-23, 2011 (Document: JCTVC-E243)。H.265/HEVC(高効率ビデオ符号化)規格は、ITU−T VCEG(Q6/16)ISO/IEC MPEG(JTC 1/SC 29/WG 11)によって発刊されたバージョン1(2013)、バージョン2(2014)、バージョン3(2015)、およびバージョン4(2016)を含み得る。
"Algorithm description for Versatile Video Coding and Test Model 1(VTM 1)"; published by Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3and ISO/IEC JTC 1/SC 29/WG 11, 10thMeeting: San Diego, US, April 10-20, 2018 (Document: JVET-J1002-v2).
A.Said, H.Egilmez, V.Seregin,M.Karczewicz, "Complexity Reduction for Adaptive Multiple Transforms (AMTs) usingAdjustment Stages", Joint Video Exploration Team (JVET) of ITU-T SG 16 WP 3 andISO/IEC JTC 1/SC 29/WG 11, San Diego, US, 10-20 Apr. 2018 (Document:JVET-J0066).
M.Koo, J.Heo, J.Nam, N.Park,J.Lee, J.Choi, S.Yoo, H.Jang, L.Li, J.Lim, S.Paluri, M.Salehifar, S.Kim, "Descriptionof SDR video coding technology proposal by LG Electronics," Joint VideoExploration Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11, SanDiego, US, 10-20 Apr. 2018 (Document: JVET-J0017).
本開示の一態様によれば、デコードまたはエンコード方法は、一つ又は複数の非再帰的変換をより大きい再帰的変換に埋め込むことにより、新しいマルチ変換データ構造を生成するステップを含み得る。前記方法は、圧縮されたビデオまたは画像データブロック、もしくは非圧縮であるビデオまたは画像データブロックのうちの1つである、エンコードまたはデコード用のターゲットデータブロックに関する情報を受信するステップをさらに含み得る。前記デコードまたはエンコード方法は、前記ターゲットデータブロックに対する前記エンコードまたはデコードに再帰的変換を使用するかそれとも非再帰的変換を使用するかを判定するステップをさらに含み得る。前記デコードまたはエンコード方法は、前記判定の結果が、前記再帰的変換を使用する場合、前記マルチ変換データ構造を使用して前記再帰的変換を生成し、生成された前記再帰的変換を使用して前記ターゲットデータブロックをエンコードまたはデコードさせる情報を発生または送信するステップをさらに含み得る。前記エンコードまたはデコード方法は、前記マルチ変換データ構造に埋め込まれた前記一つ又は複数の非再帰的変換のうちの1つを使用して前記ターゲットデータブロックをエンコードまたはデコードさせる情報を発生または送信するステップをさらに含み得る。
前記エンコードまたはデコード方法は、前記マルチ変換データ構造の前記一つ又は複数の非再帰的変換のうちの1つの少なくとも一部が、前記マルチ変換データ構造の前記より大きい再帰的変換の半分の少なくとも一部に埋め込まれているステップをさらに含み得る。
本開示の一態様によれば、装置は、コンピュータプログラムコードを記憶するように構成される少なくとも1つのメモリと、前記少なくとも1つのメモリにアクセスし、前記コンピュータプログラムコードに従って動作するように構成される少なくとも1つのプロセッサと、を備えてもよい。前記コンピュータプログラムコードは、第1の適用コード、第2の適用コード、第3の適用コード、第4の適用コード、第5の適用コード、および第6の適用コードを含み得るが、含まれ得るコードセグメントの数は限定されていない。
第1の適用コードは、一つ又は複数の非再帰的変換をより大きい再帰的変換に埋め込むことにより、新しいマルチ変換データ構造を生成するように構成され得る。第2の適用コードは、圧縮されたビデオまたは画像データブロック、もしくは非圧縮であるビデオまたは画像データブロックのうちの1つである、エンコードまたはデコード用のターゲットデータブロックに関する情報を前記少なくとも1つのプロセッサに受信させるように構成され得る。第3の適用コードは、前記ターゲットデータブロックに対する前記エンコードまたはデコードのために、前記ターゲットデータブロックに対する前記エンコードまたはデコードに再帰的変換を使用するかそれとも非再帰的変換を使用するかを前記少なくとも1つのプロセッサに判定させるように構成され得る。
第4の適用コードは、前記判定の結果が、前記再帰的変換を使用する場合、前記マルチ変換データ構造を使用して前記再帰的変換を生成し、生成された前記再帰的変換を使用して前記ターゲットデータブロックをエンコードまたはデコードさせる情報を発生または送信することを前記少なくとも1つのプロセッサに実行させるように構成され得る。第5の適用コードは、前記判定の結果が、前記マルチ変換データ構造の前記非再帰的変換を使用する場合、少なくとも一部が前記マルチ変換データ構造の前記より大きい再帰的変換の半分の少なくとも一部に埋め込まれている、前記マルチ変換データ構造に埋め込まれた前記一つ又は複数の非再帰的変換のうちの1つを使用して前記ターゲットデータブロックをエンコードまたはデコードさせる情報を前記少なくとも1つのプロセッサに引き起こさせるまたは送信させるように構成され得る。
エンコードまたはデコードのための装置は、前記マルチ変換データ構造の前記一つ又は複数の非再帰的変換のうちの1つの少なくとも一部が、前記マルチ変換データ構造の前記より大きい再帰的変換の半分の少なくとも一部に埋め込まれることをさらに含み得る。
本開示の一態様によれば、非一時的なコンピュータ読取可能な記憶媒体は、一つ又は複数のプロセッサにいくつかのステップを実行させる命令を記憶することができる。前記いくつかのステップは、一つ又は複数の非再帰的変換をより大きい再帰的変換に埋め込むことにより、新しいマルチ変換データ構造を生成するステップを含み得る。前記いくつかのステップは、圧縮されたビデオまたは画像データブロック、もしくは非圧縮であるビデオまたは画像データブロックのうちの1つである、エンコードまたはデコード用のターゲットデータブロックに関する情報を受信するステップをさらに含み得る。前記いくつかのステップは、前記ターゲットデータブロックに対する前記エンコードまたはデコードのために、前記ターゲットデータブロックに対して前記エンコードまたはデコードに再帰的変換を使用するかそれとも非再帰的変換を使用するかを判定するステップをさらに含み得る。
前記いくつかのステップは、前記判定の結果が、前記再帰的変換を使用する場合、前記マルチ変換データ構造を使用して前記再帰的変換を生成し、生成された前記再帰的変換を使用して前記ターゲットデータブロックをエンコードまたはデコードさせる情報を発生または送信するステップをさらに含み得る。前記いくつかのステップは、前記判定の結果が、前記マルチ変換データ構造の前記非再帰的変換を使用する場合、前記マルチ変換データ構造に埋め込まれた前記一つ又は複数の非再帰的変換のうちの1つを使用して前記ターゲットデータブロックをエンコードまたはデコードさせる情報を発生または送信し、前記マルチ変換データ構造の前記一つ又は複数の非再帰的変換のうちの1つの少なくとも一部が、前記マルチ変換データ構造の前記より大きい再帰的変換の半分の少なくとも一部に埋め込まれるステップをさらに含み得る。
開示される主題のさらなる特徴、性質、および様々な利点は、以下の詳細な説明および添付の図面からより明らかになるであろう。
一実施形態による通信システムの簡略化されたブロック図の概略図である。
一実施形態によるストリーミングシステムの簡略化されたブロック図の概略図である。
一実施形態によるデコーダの簡略化されたブロック図の概略図である。
一実施形態によるエンコーダの簡略化されたブロック図の概略図である。
一実施形態によるエンコードまたはデコードの例示的な方法の概略図である。
64点DCT―2の第2、第4、第6および第8の基底、32点DCT―8の第1、第2、第3および第4の基底を示すグラフである。
64点DCT−2の第2、第4、第6および第8の基底、スケーリングされた32点DCT−8の第1、第2、第3および第4の基底、逆符号を有するスケーリングされた32点DCT−8の反転された第1、第2、第3および第4の基底を示すグラフである。
一実施形態によるコンピュータシステムの概略図である。
図1は、本開示の実施形態による通信システム(100)の簡略ブロック図を示している。システム(100)は、ネットワーク(150)を介して相互接続される少なくとも2つの端末(110,120)を含み得る。データの単方向送信の場合、第1の端末(110)は、ネットワーク(150)を介して他の端末(120)に送信するためにビデオデータをローカル位置で符号化し得る。第2の端末(120)は、ネットワーク(150)から他の端末の符号化ビデオデータを受信し、符号化されたデータをデコードし、復元されたビデオデータを表示することができる。単方向のデータ送信は、メディア供給アプリケーションなどで一般的である。
図1は、例えば、ビデオ会議中に発生し得る符号化ビデオの双方向送信をサポートするように提供される第2の端末のペア(130,140)を示している。データの双方向送信の場合、各端末(130,140)は、ネットワーク(150)を介して他の端末に送信するためにローカル位置で獲得されたビデオデータを符号化し得る。各端末(130,140)はまた、他の端末によって送信された符号化ビデオデータを受信することができ、符号化されたデータをデコードすることができ、復元されたビデオデータをローカル表示デバイスに表示することができる。
図1において、端末(110〜140)は、ラップトップ110、サーバ120、およびスマートフォン130と140として示されているが、しかし、本開示の原理はこれに制限されることはない。本開示の実施形態は、ラップトップコンピュータ、タブレットコンピュータ、メディアプレーヤー、および/または専用のビデオ会議機器を含むがこれらに限定されない他の機器における用途を見出す。ネットワーク(150)は、例えば有線および/または無線通信ネットワークを含む、端末(110〜140)間で符号化ビデオデータを伝達する任意の数のネットワークを表す。通信ネットワーク(150)は、回線交換および/またはパケット交換チャネルでデータを交換することができる。代表的なネットワークは、電気通信ネットワーク、ローカルエリアネットワーク、ワイドエリアネットワークおよび/またはインターネットを含む。本議論の目的のために、ネットワーク(150)のアーキテクチャおよびトポロジーは、以下で本明細書において説明されない限り、本開示の操作にとって重要でないかもしれない。
図2は、開示された主題の適用の例として、ストリーミング環境におけるビデオエンコーダおよびデコーダの配置を示している。開示された主題は、例えば、ビデオ会議、デジタルTV、および、CD、DVD、メモリスティックなどを含むデジタルメディアへの圧縮ビデオの記憶など、を含む他のビデオ対応アプリケーションに等しく適用可能である。
ストリーミングシステムは、例えば、非圧縮ビデオサンプルストリーム(202)を作成し得るデジタルカメラなどのビデオソース(201)を含むことができる獲得サブシステム(213)を含み得る。エンコードされたビデオビットストリームと比較して高データ量を強調するために太線で示されたサンプルストリーム(202)は、カメラ(201)に結合されたエンコーダ(203)によって処理されることができる。以下でより詳細に説明されるように、エンコーダ(203)は、開示された主題の態様を実現できるまたは実施できるハードウェア(例えば、プロセッサまたは回路およびメモリ)、ソフトウェア、またはそれらの組み合わせを含むことができる。エンコードされたビデオビットストリーム(204)は、サンプルストリームと比較して、より低いデータ量を強調するために細い線で示され、将来使うためにストリーミングサーバ(205)に記憶されることができる。一つ又は複数のストリーミングクライアント(206,208)は、ストリーミングサーバ(205)にアクセスして、エンコードされたビデオビットストリーム(204)のコピー(207,209)を検索することができる。クライアント(206)は、エンコードされたビデオビットストリーム(207)の入り方向コピーをデコードし、ディスプレイ(212)または他のレンダリングデバイス(示されていない)でレンダリングできる出方向ビデオサンプルストリーム(211)を作成するデコーダ(210)を含むことができる。
図3は、本開示の実施形態によるデコーダ(210)の機能ブロック図を示している。図3に示されるように、受信機(310)は、デコーダ(210)によるデコード対象となる一つ又は複数のコーデックビデオシーケンスを受信し得る。同一または別の実施形態では、一度に1つの符号化ビデオシーケンスを受信してもよく、各符号化ビデオシーケンスのデコードは、他の符号化ビデオシーケンスから独立している。符号化ビデオシーケンスは、エンコードされたビデオデータを記憶する記憶装置へのハードウェア/ソフトウェアリンクであり得るチャネル(312)から受信されることができる。受信機(310)は、それぞれの使用エンティティ(示されていない)に転送され得る他のデータ、例えば、符号化オーディオデータおよび/または補助データストリームとともに、エンコードされたビデオデータを受信し得る。受信機(310)は、符号化ビデオシーケンスを他のデータから分離することができる。ネットワークジッタに対抗するために、バッファメモリ(315)は、受信機(310)とエントロピーデコーダ/パーサ(320)(以降、「パーサ」)との間に結合されてもよい。受信機(310)が十分な帯域幅および可制御性を有する記憶/転送装置から、または等同期ネットワークからデータを受信する際に、バッファ(315)は必要とされないことがあり、または小さくされることがある。インターネットなどのベストエフォートパケットネットワークで使用するために、比較的大きくされることができ、有利には適応サイズであることができるバッファ(315)が必要とされることがある。
ビデオデコーダ(310)は、エントロピー符号化ビデオシーケンスからシンボル(321)を再構築するパーサ(320)を含み得る。これらのシンボルのカテゴリには、デコーダ(210)の操作を管理するために使用される情報、および、デコーダの不可欠な部分ではないが、図2および図3に示されように、デコーダに結合されることができるディスプレイ(212)のようなレンダリングデバイスを制御する潜在的情報が含まれる。レンダリングデバイスの制御情報は、付加情報(SEIメッセージ)またはビデオ表示情報(VUI)パラメータセットフラグメント(示されていない)の形態であってよい。パーサ(320)は、受信された符号化ビデオシーケンスを構文解析/エントロピーデコードすることができる。符号化ビデオシーケンスの符号化は、ビデオ符号化技術または規格に合わせることができ、可変長符号化、ハフマン符号化、コンテキスト依存性を有するもしくは有さない算術符号化などを含む当業者によく知られる原理に従うことができる。パーサ(320)は、グループに対応する少なくとも1つのパラメータに基づいて、符号化ビデオシーケンスからビデオデコーダ内の画素のサブグループのうちの少なくとも1つのサブグループパラメータのセットを抽出することができる。サブグループは、ピクチャ群(GOP)、ピクチャ、タイル、スライス、マクロブロック、符号化ユニット(CU)、ブロック、変換ユニット(TU)、予測ユニット(PU)などを含むことができる。エントロピーデコーダ/パーサは、符号化ビデオシーケンスから変換係数、量子化パラメータ値、動きベクトルなどのような情報をも抽出することができる。
パーサ(320)は、シンボル(321)を作成するために、バッファ(315)から受信されたビデオシーケンスに対してエントロピーデコード/構文解析操作を実行することができる。シンボル(321)の再構築は、符号化ビデオピクチャまたはその一部(インターおよびイントラピクチャ、インターおよびイントラブロックなど)のタイプ、および他の要因に応じて、複数の異なるユニットを含み得る。どのユニットが、どのように関与するかは、符号化ビデオシーケンスからパーサ(320)によって構文解析されたサブグループ制御情報によって制御されることができる。パーサ(320)と以下の複数のユニットとの間のそのようなサブグループ制御情報の流れは、明確にするために示されていない。
既に述べた機能ブロックに加えて、デコーダ210は、以下で説明されるように、概念的にいくつかの機能ユニットに細分されることができる。商業的な制約の下で実際の実施操作にあたっては、これらのユニットの多くは互いに密接に相互作用し、少なくとも一部は互いに統合することができる。しかしながら、開示された主題の説明の目的で、以下の機能ユニットへの概念的な細分は、適切に行われる。
第1のユニットは、スケーラ/逆変換ユニット(351)であり得る。スケーラ/逆変換ユニット(351)は、量子化された変換係数を、使用する変換、ブロックサイズ、量子化因子、量子化スケーリングマトリックスなどを含む制御情報とともに、シンボル(321)としてパーサ(320)から受信することができる。これは、アグリゲータ(355)に入力可能なサンプル値を含むブロックを出力することができる。
場合によっては、スケーラ/逆変換ユニット(351)の出力サンプルは、イントラ符号化ブロック、すなわち、予め再構築されたピクチャからの予測情報を使用していないが、現在ピクチャの予め再構築された部分からの予測情報を使用できるブロックに関係し得る。このような予測情報は、イントラピクチャ予測ユニット(352)によって提供されることができる。場合によっては、イントラピクチャ予測ユニット(352)は、現在の(一部再構築された)ピクチャ(356)から取り出された周囲の既に再構築された情報を用いて、再構築中のブロックの同じサイズおよび形状のブロックを生成する。アグリゲータ(355)は、場合によっては、サンプルごとに、イントラ予測ユニット(352)が生成した予測情報を、スケーラ/逆変換ユニット(351)によって提供される出力サンプル情報に追加する。
他の場合では、スケーラ/逆変換ユニット(351)の出力サンプルは、インター符号化されたブロック、および潜在的に動き補償されたブロックに関係し得る。このような場合、動き補償予測ユニット(353)は、参照ピクチャメモリ(357)にアクセスして、予測に使用されるサンプルを取り出すことができる。取り出されたサンプルをブロックに関係するシンボル(321)に従って動き補償した後、これらのサンプルは、出力サンプル情報を生成するように、アグリゲータ(355)によってスケーラ/逆変換ユニットの出力に追加されることができる(この場合、残差サンプルまたは残差信号と呼ばれる)。動き補償予測ユニットが予測サンプルを取り出す参照ピクチャメモリ内のアドレスは、動きベクトルによって制御されることができ、例えばX、Y、および参照ピクチャ成分を有し得るシンボル(321)の形態で動き補償予測ユニットに利用可能な動きベクトルによって制御されることができる。動き補償は、サブサンプル正確な動きベクトルが使用中であるときに参照ピクチャメモリから取り出されたサンプル値の補間、動きベクトル予測メカニズムなどをも含むことができる。
アグリゲータ(355)の出力サンプルは、ループフィルタユニット(356)において様々なループフィルタリング技術を受けられる。ビデオ圧縮技術は、符号化されたビデオビットストリームに含まれるパラメータによって制御され、パーサ(320)からのシンボル(321)としてループフィルタユニット(356)に利用可能とされたループ内フィルタ技術を含むことができるが、しかし、符号化ピクチャまたは符号化ビデオシーケンスの(デコード順で)前の部分のデコード中に取得されたメタ情報に応答することができるとともに、予め再構築されループフィルタリングされたサンプル値に応答することもできる。
ループフィルタユニット(356)の出力は、レンダリングデバイス(212)へ出力されることができるとともに、将来のインターピクチャ予測で使用するために参照ピクチャメモリ(356)に記憶されることができるサンプルストリームであり得る。
特定の符号化ピクチャは、完全に再構築されると、将来の予測のために参照ピクチャとして使用されることができる。符号化ピクチャが完全に再構築され、該符号化ピクチャが(例えば、パーサ(320)によって)参照ピクチャとして識別されると、現在参照ピクチャ(356)は、参照ピクチャバッファ(357)の一部となり得、次の符号化ピクチャの再構築を開始する前に新しい現在ピクチャメモリを再割当てすることができる。
ビデオデコーダ320は、ITU―T Rec.H.265などの規格で文書化され得る所定のビデオ圧縮技術に従って、デコード操作を実行し得る。符号化ビデオシーケンスが、ビデオ圧縮技術ドキュメントまたは規格、特にその中のプロファイルドキュメントに指定されたようにビデオ圧縮技術または規格の構文に準拠しているという意味で、符号化ビデオシーケンスは、使用されているビデオ圧縮技術ドキュメントまたは規格によって指定される構文に準拠し得る。符号化ビデオシーケンスの複雑さがビデオ圧縮技術または規格のレベルで定義される範囲内にあることも、コンプライアンスに必要である。場合によっては、最大ピクチャサイズ、最大フレームレート、最大再構築サンプルレート(例えば、1秒あたりのメガサンプルで測定される)、および/または最大参照ピクチャサイズがレベルによって制限される。レベルによって設定された制限は、場合によっては、符号化ビデオシーケンスでシグナリングされたHRDバッファ管理のための仮想参照デコーダ(HRD)仕様およびメタデータによってさらに制限され得る。
一実施形態では、受信機(310)は、エンコードされたビデオとともに追加の(冗長な)データを受信することができる。追加のデータは、符号化ビデオシーケンスの一部として含まれてもよい。追加のデータは、データを適切にデコードし、および/または、元のビデオデータをより正確に再構築するためにビデオデコーダ(320)によって使用され得る。追加のデータは、例えば、時間的、空間的、またはSNRエンハンスメントレイヤ、冗長スライス、冗長ピクチャ、前方向誤り訂正コードなどの形態にされることができる。
図4は、本開示の実施形態によるエンコーダ(203)の機能ブロック図であり得る。
エンコーダ(203)は、エンコーダ(203)によって符号化されるビデオ画像を獲得し得る(エンコーダの一部ではない)ビデオソース(201)からビデオサンプルを受信し得る。
ビデオソース(201)は、エンコーダ(203)によって符号化されるソースビデオシーケンスを、任意の適切なビット深度(例えば、8ビット、10ビット、12ビット、・・・)、任意の色空間(例えば、BT.601 Y CrCB、RGB、・・・)および任意の適切なサンプリング構造(例えば、Y CrCb 4:2:0、Y CrCb 4:4:4)であり得るデジタルビデオサンプルストリームの形態で提供し得る。メディア供給システムでは、ビデオソース(201)は、事前に準備されたビデオを記憶するメモリおよびプロセッサを含み得る記憶装置であり得る。ビデオ会議システムでは、ビデオソース(201)は、ローカル画像情報をビデオシーケンスとして獲得するカメラを含み得る。ビデオデータは、順番に見たときに動きを与える複数の個別のピクチャとして提供されてもよい。ピクチャ自体は、画素の空間アレイとして編成されてもよく、各画素は、使用中のサンプリング構造、色空間などに応じて一つ又は複数のサンプルを含むことができる。当業者は、画素とサンプルとの間の関係を容易に理解することができる。以下の説明では、サンプルを中心に説明する。
一実施形態によれば、エンコーダ(203)は、リアルタイムでまたはアプリケーションが要求する任意の他の時間制約の下でソースビデオシーケンスのピクチャを符号化し、符号化ビデオシーケンス(443)に圧縮することができる。適切な符号化速度を実施することは、コントローラ(450)の機能の1つである。コントローラは、以下で説明される他の機能ユニットを制御し、これらのユニットに機能的に結合されている。分かりやすくするために、カップリングは示されていない。コントローラによって設定されるパラメータは、レート制御関連パラメータ(例えば、ピクチャスキップ、量子化器、レート歪み最適化技法のラムダ値)、ピクチャサイズ、ピクチャグ群(GOP)レイアウト、最大動きベクトル検索範囲などを含むことができる。コントローラ(450)の他の機能が特定のシステム設計に対して最適化されたエンコーダ(203)に関係し得るので、当業者はそれらを容易に識別することができる。
一部のビデオエンコーダは、当業者が「符号化ループ」として容易に認識するもので動作する。過度に簡略化した説明として、符号化ループは、符号化対象となる入力ピクチャおよび参照ピクチャに基づいてシンボルを作成する役割を担うビデオコーダ(430)(以降、「ソースコーダ」)のエンコード部分と、参照ピクチャと、シンボルを再構築して、サンプルデータを作成するエンコーダ(203)に埋め込まれた(ローカル)デコーダ(433)から構成されることができ、ここで、前記サンプルデータは(リモート)デコーダにより作成してもよい(シンボルと符号化されたビデオビットストリーム間の如何なる圧縮は、開示された主題で考慮されるビデオ圧縮技術では可逆であるためである)。再構築されたサンプルストリームは、参照ピクチャメモリ(434)に入力される。シンボルストリームのデコードにより、デコーダの位置(ローカルまたはリモート)に関係なくビット正確な結果が得られるため、参照ピクチャバッファのコンテンツもローカルエンコーダとリモートエンコーダとの間でビットが正確である。言い換えれば、エンコーダの予測部分は、参照ピクチャサンプルとして、デコード中に予測を使用するときにデコーダが「見る」のと全く同じサンプル値を「見る」。参照ピクチャの同期性の該基本原理(および、例えば、チャネルエラーに起因して同期性を維持できない場合に生じるドリフト)は、当業者によく知られている。
「ローカル」デコーダ(433)の動作は、前文で図3に関連して既に詳細に説明された、「リモート」デコーダ(210)の動作と同様であり得る。しかしながら、図3も簡単に参照し、シンボルが利用可能であり、エントロピーコーダ(445)およびパーサ(320)による符号化ビデオシーケンスへのシンボルのエンコード/デコードは可逆であり得るので、デコーダ(210)のエントロピーデコード部分(チャネル(312)、受信機(310)、バッファ(315)、およびパーサ(320)を含む)は、ローカルデコーダ(433)では完全に実施されない場合がある。
デコーダに存在する構文解析/エントロピーデコード以外の任意のデコーダ技術も、対応するエンコーダに実質的に同一の機能形式で必ず存在する必要があることがこの時点で行える観察である。エンコーダ技術の説明は、説明されたデコーダ技術の逆である。特定の領域でのみ、より詳細な説明が必要であり、以下に提供される。
その操作の一部として、ソースコーダ(430)は、「参照フレーム」として指定されたビデオシーケンスからの一つ又は複数の予め符号化されたフレームを参照して入力フレームを予測的に符号化する動き補償予測符号化を実行してもよい。このようにして、符号化エンジン(432)は、入力フレームの画素ブロックと、入力フレームへの予測参照として選択され得る参照フレームの画素ブロックとの間の差異を符号化する。
ローカルビデオデコーダ(433)は、ソースコーダ(430)によって作成されたシンボルに基づいて、参照フレームとして指定され得るフレームの符号化ビデオデータをデコードし得る。符号化エンジン(432)の操作は、有利にはロッシープロセスであり得る。符号化ビデオデータがビデオデコーダ(図4に示されていない)でデコードされ得るとき、再構築されたビデオシーケンスは、通常、いくつかのエラーを伴うソースビデオシーケンスのレプリカであってもよい。ローカルビデオデコーダ(433)は、ビデオデコーダによって参照フレームに対して実行され得るデコードプロセスを複製し、再構築された参照フレームを参照ピクチャキャッシュ(434)に記憶させることができる。このようにして、エンコーダ(203)は、遠端ビデオデコーダによって取得される再構築された参照フレームと共通するコンテンツ(送信エラー無し)を有する再構築された参照フレームのコピーをローカルに記憶し得る。
予測器(435)は、符号化エンジン(432)の予測検索を実行することができる。すなわち、符号化対象となる新しいフレームについて、予測器(435)は、(候補の参照画素ブロックとしての)サンプルデータ、または、参照ピクチャの動きベクトル、ブロック形状など、新しいピクチャの適切な予測基準として機能し得る特定のメタデータを参照ピクチャメモリ(434)で検索することができる。予測器(435)は、適切な予測基準を見つけるために、サンプルブロックに対して画素ブロックごとに操作することができる。場合によっては、予測器(435)で取得された検索結果によって決定されるように、入力ピクチャは、参照ピクチャメモリ(434)に記憶された複数の参照ピクチャから引き出された予測基準を有してもよい。
コントローラ(450)は、例えば、ビデオデータをエンコードするために使用されるパラメータおよびサブグループパラメータの設定を含む、ビデオコーダ(430)の符号化操作を管理することができる。
前述のすべての機能ユニットの出力は、エントロピーコーダ(445)においてエントロピー符号化を受けられる。エントロピーコーダは、例えば、ハフマン符号化、可変長符号化、算術符号化など、当業者に知られている技術に従ってシンボルを可逆圧縮することにより、様々な機能ユニットによって生成されたシンボルを符号化ビデオシーケンスに変換することができる。
送信機(440)は、エンコードされたビデオデータを記憶する記憶装置へのハードウェア/ソフトウェアリンクであり得る通信チャネル(460)を介した送信の準備のために、エントロピーコーダ(445)によって作成された符号化ビデオシーケンスをバッファリングすることができる。送信機(440)は、ビデオコーダ(430)からの符号化ビデオデータを、送信されるべき他のデータ、例えば、符号化オーディオデータおよび/または補助データストリーム(ソースは示されていない)とマージすることができる。
コントローラ(450)は、エンコーダ(203)の操作を管理することができる。符号化中、コントローラ(450)は、各符号化ピクチャに特定の符号化されたピクチャタイプを割り当てることができ、これは、それぞれのピクチャに適用され得る符号化技法に影響を及ぼし得る。例えば、ピクチャは、多くの場合、例えばイントラピクチャ(Iピクチャ)、予測ピクチャ(Pピクチャ)および双方向予測ピクチャ(Bピクチャ)から以下のフレームタイプの1つとして割り当てられる。
イントラピクチャ(Iピクチャ)は、予測のソースとしてシーケンス内の他のいかなるフレームを使用せずに符号化およびデコードされ得るものであり得る。一部のビデオコーデックは、例えば、デコーダ復号動作の瞬時リフレッシュピクチャ(Instantaneous Decoder Refresh Picture)など、異なるタイプのイントラピクチャを許容する。当業者は、Iピクチャのそれらの変形およびそれらのそれぞれの用途および特徴を知っている。
予測ピクチャ(Pピクチャ)は、各ブロックのサンプル値を予測するために最大1つの動きベクトルおよび参照インデックスを使用したイントラ予測またはインター予測により符号化およびデコードされ得るものであり得る。
双方向予測ピクチャ(Bピクチャ)は、各ブロックのサンプル値を予測するために最大2つの動きベクトルおよび参照インデックスを使用したイントラ予測またはインター予測により符号化およびデコードされ得るものであり得る。同様に、多重予測ピクチャは、単数のブロックの再構築のために2つを超えた参照ピクチャおよび関連メタデータを使用することができる。
ソースピクチャは、一般に、複数のサンプルブロック(例えば、それぞれ4×4、8×8、4×8、または16×16サンプルのブロック)に空間的に細分され、ブロック単位で符号化され得る。ブロックは、ブロックのそれぞれのピクチャに適用される符号化割り当てによって決定された他の(既に符号化された)ブロックを参照して予測的に符号化され得る。例えば、Iピクチャのブロックは、非予測的に符号化されてもよく、或いは、同一のピクチャの既に符号化されたブロック(空間予測またはイントラ予測)を参照して予測的に符号化されてもよい。Pピクチャの画素ブロックは、1つの予め符号化された参照ピクチャを参照して、空間予測または時間予測を介して非予測的に符号化され得る。Bピクチャのブロックは、1つまたは2つの予め符号化された参照ピクチャを参照して、空間予測または時間予測を介して非予測的に符号化され得る。
ビデオコーダ(430)は、ITU―T Rec.H.265などの予め設定されたビデオ符号化技術または規格に従って、符号化操作を実行することができる。この操作において、ビデオコーダ(430)は、入力ビデオシーケンスにおける時間的および空間的冗長性を利用する予測符号化操作を含む、様々な圧縮操作を実行することができる。したがって、符号化ビデオデータは、使用されているビデオ符号化技術または規格によって指定された構文に準拠する場合がある。
一実施形態では、送信機(440)は、エンコードされたビデオとともに追加のデータを送信することができる。ビデオコーダ(430)は、このようなデータを符号化ビデオシーケンスの一部として含み得る。追加のデータは、時間的/空間的/SNRエンハンスメントレイヤ、冗長なピクチャやスライスなどの他の形態での冗長データ、付加情報(SEI)メッセージ、ビジュアル表示情報(VUI)パラメータセットフラグメントなどを含み得る。
上述のように、符号化ビデオシーケンスの符号化は、ビデオ符号化技術または規格に合わせることができ、可変長符号化、ハフマン符号化、コンテキスト依存性を有するもしくは有さない算術符号化などを含む様々な原理に従うことができる。一部のストリーミングシステムでは、ビデオビットストリーム(204,207,209)は、特定のビデオ符号化/圧縮規格に従ってエンコードされることができる。これらの規格の例には、H.265のITU−T HEVC勧告が含まれる。
HEVCでは、一次変換は、4点、8点、16点、または32点DCT―2変換コア行列を有することができ、変換コア行列は、8ビット整数を用いて表されることができる(すなわち、8ビット変換コア行列)。以下に示されるように、小さいDCT−2のHEVC変換コア行列は、大きいDCT−2の一部である。
4×4 DCT―2変換
Figure 2021520144
8×8 DCT―2変換
Figure 2021520144
16×16 DCT―2変換
Figure 2021520144
32×32 DCT―2変換
Figure 2021520144
以上で示されたように、DCT―2コアのそれぞれは、対称性/反対称性特性を示している。これらの対称性/反対称性特性には、少なくとも次の3つの特徴(Feature#1〜#3)が含まれる。Feature#1は、インデックス0、2、4、・・・を持つ偶数行は、係数番号N/2の前に対称点があるという状況で対称である点である。Feature#2は、インデックス1、3、5、7、・・・を持つ奇数行は、係数番号N/2の前に対称点があるという状況で反対称である点である。さらに、Feature#3は、N点DCT−2コア(TNで示される)が2N点DCT−2(T2Nで示される)の一部であり、TNx,y=T2Nx,2yであり、ただし、x,y=0、1、・・・、N−1である点である。
上記対称性/反対称性特性(Feature#1および#2)、および、N点DCT―2と2N点DCT―2(Feature#3)との間の関係に基づいて、いわゆる「部分バタフライ」の実施がサポートされ、操作回数(乗算、加算/減算、シフト)を減らすことができ、部分バタフライの実施を使用して、行列乗算の同一結果を得ることができる。HEVC変換設計に関する詳細は、非特許文献1に見出すことができる。
本開示では、変換基底のそれぞれが対称または反対称であり、かつN点変換が2N点変換の一部であれば、これは「再帰的変換」と呼ばれる。再帰的変換の例は、DCT−2、アダマール変換、DCT−1、DST−1、およびDST−2である。ある再帰的変換の変換基底を並べ替えると、別の再帰的変換になる。
HEVCで採用されているDCT―2および4×4 DST―7に加えて、適応多重変換(AMT。或いは拡張多重変換(EMT)としても知られており、或いは多重変換選択(MTS)としても知られている)スキームは、インターおよびイントラの両方の符号化ブロックの残差符号化に対して提案されている。AMTは、HEVCにおける現在の変換以外に、DCT/DSTファミリーから選択された複数の変換を使用し得る。新しく導入された変換行列には、DST−7、DCT−8、DST−1、DCT−5が含まれる。
以下の表1は、選択されたDST/DCTの例示的な基底関数を示す。
[表1]N点入力のためのDCT−II/V/VIIIおよびDST−I/VIIの変換基底関数
Figure 2021520144
変換行列の直交性を維持するために、変換行列は、HEVCでの8ビットの代わりに10ビット表現で、HEVCでの変換行列よりも正確に量子化されてもよい。変換された係数の中間値を16ビットの範囲内に保つために、水平および垂直変換後に、すべての係数は、現在のHEVC変換で使用されている右シフトと比較して、さらに2ビット右シフトされる。AMTは、幅と高さの両方が64以下の符号化ユニット(CU)に適用され得、AMTが適用されるか否かは、CUレベルフラグによって制御され得る。CUレベルフラグが0に等しい場合、DCT−2をCUに適用して残差をエンコードすることができる。AMT有効化されたCU内の輝度符号化ブロックの場合、使用される水平および垂直変換を識別するために、2つの追加のフラグをシグナリングしてもよい。
イントラ残差符号化の場合、異なるイントラ予測モードの残差統計が異なるため、モード依存の変換候補選択処理を使用することができる。以下の表2に示されるように、3つの変換サブセットを定義することができる。
変換サブセットは、以下の表3に指定されるように、イントラ予測モードに基づいて選択され得る。
[表2]3つの事前定義された変換候補セット
Figure 2021520144

サブセットの概念により、表3に基づいて、1に等しいCUレベルAMTフラグを有するCUのイントラ予測モードを使用して変換サブセットを最初に識別することができる。その後、水平変換および垂直変換のそれぞれについて、「エラー!参照元が見つからない」に従って、識別された変換サブセット内の2つの変換候補のうちの1つを、フラグで明示的にシグナリングされることに基づいて選択することができる。
[表3]各イントラ予測モードのための選択された(H)水平および(V)垂直変換セット
Figure 2021520144
しかしながら、インター予測残差の場合、DST―7およびDCT―8からなる1つの変換セットのみが、すべてのインターモードに、ならびに水平および垂直変換の両方に使用され得る。4つの追加の変換タイプ、つまりDST−7、DCT−8、DST−1およびDCT−5の中で、最も効率的に使用される変換タイプはDST−7とDCT−8である。なお、DCT−8は実質的にDST−7基底を符号変更に伴って左右に反転しているため、DCT−8とDST−7は基本的に同じ変換基底を共有する場合がある。
DST―7の、基底ベクトルによって構成される行列である変換コアは、以下に示されるように表すこともできる。
4点DST―7:
Figure 2021520144
8点DST―7:
Figure 2021520144
16点DST―7:
Figure 2021520144
32点DST―7:
Figure 2021520144
64点DST―7:
Figure 2021520144
Figure 2021520144
Figure 2021520144
Figure 2021520144

Figure 2021520144

Figure 2021520144

Figure 2021520144

Figure 2021520144

Figure 2021520144

Figure 2021520144

変数a,bc,・・・aa,ab,ac,・・・,clは、表1に示されるDST―7の公式に基づいて導出されることができる。
それらの値は、DST―7の異なるサイズの間で異なる可能性がある。例えば、「a」の値は、4点DST−7と8点DST−7とで異なる場合がある。
浮動小数点演算を回避するために、DST―7の変換コアは、HEVCで使用されるDCT―2コアに類似し、64・√(N‘)(8ビット変換コアに対応)または64・√N(10ビット変換コアに対応)などの事前定義された係数によってスケーリングされ、最も近い整数に丸められるか、或いは、+1/−1などのオフセットによってさらにチューニングされてもよい。
高速な方法が広く研究されてきたDCT−2とは異なり、DST−7の実施は、DCT−2、例えば、非特許文献2のVTM1に基づく行列乗算よりも遥かに効率が悪い。
非特許文献3では、DCT―2、DCT―3、DST―2およびDST−3を含むDCT―2ファミリーの変換に調整ステージを適用することにより、JEM7における異なるタイプのDCTおよびDSTを近似する方法が提案されており、調整ステージは、比較的少ない演算数を必要とするスパース行列を使用した行列乗算を指す。非特許文献4では、2N+1点離散フーリエ変換(DFT)を用いてN点DST−7を実施する方法が提案されている。
しかしながら、実際の実施のために追加の変換コアをオンチップメモリに記憶する必要があるとともに、変換タイプをあるブロックから別のブロックに切り替えるときに変換コアをロードする必要があるため、AMTにおける追加の変換タイプによって複雑さおよび実施コストが増加する。HEVCでは、小さいDCT−2変換は大きいDCT−2変換の一部であり、これは、異なるサイズの変換を実施するために同じロジックの再利用をサポートする。しかし、AMTでは、DCT−2を除き、このような機能が欠落しているため、大きい変換に小さい変換を再利用することはできず、その場合は、異なるサイズの変換を実施するには、異なるロジックを設計する必要があることを意味する。
HEVCにおけるDCT−2は、行列乗算と部分バタフライとの間の同一の出力、すなわち、デュアル実装をサポートする部分バタフライを使用して実施される。しかしながら、依然として計算負担であるハーフサイズの行列乗算も必要であり、例えば、32点HEVC DCT−2の部分バタフライには、2×2、4×4、8×8、16×16の行列乗算が必要である。
DCT―2における奇数の基底(奇数の基底は、奇数のインデックスに関連付けられる基底ベクトルを指し、第1の基底はインデックス0に関連付けられる)の一部は、スケーリングされたDCT―8の基底に非常に類似していることが観察された。以下の図6Aにおいて、64点DCT―2の第2、第4、第6、および第8の基底ベクトルを、実線の曲線で示されるように示している。さらに、定数1/√2によってスケーリングされた32点DCT−8の第1、第2、第3、および第4の基底ベクトルも点線の曲線で示されるように、図6Aに示されている。図6Aから、64点DCT―2の第2、第4、第6、および第8の基底ベクトルの前半は、1/√2によってスケーリングされた32点DCT―8の第1、第2、第3および第4の基底ベクトルに非常に近いことが分かる。
この観察に基づいて、2N点DCT―2の奇数の基底の前半をN点スケーリングされたDCT―8基底で置き換え、その後半を反転されたDCT―8基底および逆符号で埋めると、結果としての基底は、図6Bに示されるように、2N点DCT−2の元の奇数の基底に非常に近くなる。
したがって、N点DCT―8(またはDST―7。DST―7基底とDCT―8基底が互いに対称になっているのがその理由である)を2N点DCT−2に埋め込むことにより、新しい正規直交変換、すなわち複合正規直交変換(COT)を導出することができ、結果としての変換は、DCT−2の対称性/反対称性特性、つまり、Feature#1およびFeature#2により、正規直交変換のままである。
このようにして、N点DCT−8/DST−7を2N点DCT−2に埋め込むことによりAMTを実行する複雑さは、下記の3点で低減される。(i)DCT−2およびDCT−8/DST−7の変換を実行するロジックは共有されることができる。(ii)DCT−8およびDST−7基底を記憶するためのオンチップメモリコストは、それらがDCT−2基底の一部であるため削減されることができる。(iii)DST−7がDCT−2の一部であるため、参照することにより組み込まれる‘065出願のロスレス高速DST−7方法は、提案されたCOTとともに、DCT−2の計算コストをさらに削減するために適用されることができる。
提案された方法は、別々に使用されてもよいし、任意の順序で組み合わせられてもよい。前述のCOTコアの利点により、従来の変換コア(DCT−2やDST−7など)の代わりにCOTコアを変換画像や残差ブロックなどのビデオおよび/または画像圧縮に使用することが提案されている。2N点COTコアは、N点正規直交変換(変換コアがT、T、T・・・で表される)を別の2N点再帰的変換(変換コアがRで表される)に埋め込むことにより生成されることができる。得られた変換コア(RTで表される)も正規直交行列である。該新たに得られた変換コアRT(COTコア)は、画像ブロックまたは残差ブロックのエンコードまたはデコードに使用されることができる。COTコアは次の特徴がある。
Feature#A:一実施形態では、N点正規直交変換コア、すなわち、T、T、T・・・は、反対称性であるRT基準行の半分を置き換え、残りの半分は、反対称性特性を維持するために導出される。Feature#B:一実施形態では、N点正規直交変換コア、すなわち、T、T、T・・・は、対称であるRT基準行の半分を置き換え、残りの半分は対称性を維持するために導出される。
Feature#C:一実施形態では、1つのN点正規直交変換は、対称であるRT基準行の選択されたセット(set0によって示される)の半分を置き換え、別のN点正規直交変換は、反対称であるRT基準行の選択されたセット(setlで示される)の半分を置き換え、残りの半分は、関連する対称性と反対称性特性を維持するために導出される。該Feature#Cの例では、一例として、set0はRTの最後のN行内にあるRT基準行を指し、setlはRTの最初のN行内にあるRT基準行を指す。
Feature#D:一実施形態では、RTは、DCT/DSTファミリーからの変換であり、その例にはDCT―2、DCT―3、DST―2またはDST―3がある。該Feature#Dの例では、RTは、さらに、定数によってスケーリングされ、最も近い整数に丸められてもよい。定数の例示的な値は、64・√N、128・√N、256・√Nである。該Feature#Dの例では、RTは、さらに、定数によってスケーリングされ、最も近い整数に丸められ、さらにオフセットによって調整されてもよい。オフセットの例示的な値は、+1/−1、+2/−2などがある。
Feature#E:一実施形態では、T、T、T・・・は、DST−7、DCT−8、選択された行/列の逆符号付きDST−7、選択された行/列の逆符号付きDCT−8、DST−4、またはDCT−4を例として含むDCT/DSTファミリーからの変換である。Feature#Eの一例では、T、T、T・・・は、さらに、定数によってスケーリングされ、最も近い整数に丸められてもよい。定数の例示的な値は、
64・√N、128・√N、256・√Nである。Feature#Eの一例では、T、T、T・・・は、さらに、定数によってスケーリングされ、最も近い整数に丸められ、さらにオフセットによって調整されてもよい。オフセットの例示的な値は、+1/−1、+2/−2を含む。
Feature#F:一実施形態では、T、T、T・・・はKLTである。Feature#G:一実施形態では、Nは、4、8、16、32、および/または64であり得る。Feature#G:一実施形態では、T、T、T・・・は、Rに埋め込まれる前に事前定義された定数sによってスケーリングされる。Feature#Gの一例では、定数sは√2である。
Feature#Iでは、新たに得られた変換コアRTを使用してDCT―2コアを置き換えることができる。Feature#Iの例では、一例として、32点DCT−2コアおよび/または64点DCT−2コアのみを置き換えることができる。
Feature#Jでは、新たに得られた変換コアRTが適用されるか否かは、VPS、SPS、PPS、またはスライスヘッダ、またはCTUレベルのフラグで示されている。Feature#Jの一例では、新たに得られた変換コアRTが適用されない場合、元の2N点変換コアRが使用され得る。Feature#Jの一例では、ビデオシーケンス/ピクチャ/スライス/CTUを符号化するために、DST−7/DCT−8/DCT−4/DST−4など、DCT−2以外の追加の変換タイプが使用されていれば、それに応じて、新たに得られた変換コアRTは、DCT−2を置き換えてもよい。それ以外の場合、DCT−2のみが使用されていれば、新しい変換コアRTは使用されない。
正規直交変換をより大きい正規直交変換Kに埋め込む代わりに、より大きい正規直交変換Kを変わらないままで保つが、このより大きい正規直交変換から正規直交変換Tを抽出し、すなわち、変換コアTはKの一部であることが提案されている。一実施形態では、Kは2N点変換コアであり、TはN点変換コアであり、Tは、反対称であるRTの基準行の半分から抽出される。一実施形態では、Kは、DCT―2、DCT―3、DST―2またはDST―3がその例であるDCT/DSTファミリーからの変換である。
一実施形態では、Tは、特定の変換サイズのみ、例えば、16点および/または32点でKから抽出される。一実施形態では、DCT−4は、DCT−2から抽出され、DCT−4は、特定のブロックサイズ、例えば、16点および/または32点に対してAMTにおけるDCT−8を置き換える。一実施形態では、DCT−4変換基底を左右に反転することにより新しい変換コアを得、この新しい変換コアは、特定のブロックサイズ、例えば、16点、32点に対してAMTにおけるDST−7を置き換える。
一実施形態では、DCT―4はDCT―2から抽出され、DCT―4は、例えば、4点、8点などの特定のブロックサイズに対して追加の変換タイプとしてAMTに含まれ、DCT―4が使用されるか否かは、ブロックサイズ、イントラ予測モード、水平/垂直変換、AMTフラグ、AMTインデックスによって決まる。一実施形態では、新しい変換コアは、DCT−4変換基底を左右に反転することにより導出され、この新しい変換コアは、例えば、4点、8点などの特定のブロックサイズに対して追加の変換タイプとしてAMTに含まれ、この新しい変換コアが使用されるか否かは、ブロックサイズ、イントラ予測モード、水平/垂直変換、AMTフラグ、AMTインデックスによって決まる。
これらの理由により、変換画像または残差ブロックなどのビデオおよび/または画像圧縮において、従来の変換コア(DCT―2およびDST―7など)の代わりにCOTコアを使用することが提案されている。複数の直交変換コア間でクロネッカー積を計算することによりCOTコアを生成し、直交変換コアでもある1つのより大きい行列としてまとめて、COTコアとして使用することができる。
一実施形態では、例えば、変換コアがT、T、・・・TN−1によって示されるN個の正規直交変換のセット、および、変換コアがPによって示される追加の正規直交変換が与えられ、PがN個の行列P、P、・・・PN−1に分割されると、つまり、P、P、・・・PN−1をまとめると、Pが得られる。その後、
Figure 2021520144
を1つの行列(i=0、1、・・・、N−1であり、「○」の中に「×」はクロネッカー積を示す)としてまとめることで、新しい正規直交変換Xを導出することができ、該行列をCOTコアとして使用する。
一実施形態では、Pはアダマール変換である。一実施形態では、Pは、N個の行列P、P、・・・、PN−1に水平に分割される。一実施形態では、Pは、N個の行列P、P、・・・、PN−1に垂直に分割される。一実施形態では、N個の正規直交変換のセットは、DCT−1〜DCT−8、DST−1〜DST−7を含む。
一例では、N=2であり、N個の正規直交変換のセットは{T=n点DCT―2,T=n点DST―8}であり、Pは2×2アダマール変換行列
Figure 2021520144
であり、Pは、P0=[1 1]およびPl=[1 −1]に垂直に分割される。
Figure 2021520144
を計算してまとめると、新しい2n点正規直交変換Xが得られる。
一実施形態では、
Figure 2021520144
を1つのマトリクスとしてまとめた後、行および/または列はさらに並べ替えられ、これは、新しい変換の直交性を変えない。
一実施形態では、クロネッカー積、即ち
Figure 2021520144
を実行する前に、Tおよび/またはPの行および/または列はさらに並べ替えられ、これは、新しい変換の直交性を変えない。
図5を参照し、第1の簡単な例では、複合正規直交変換を利用する方法は、図5に示される以下のステップを含み得る。ステップ500:一つ又は複数の非再帰的変換をより大きい再帰的変換に埋め込むことにより、新しいマルチ変換データ構造を生成する。ステップ501:エンコードまたはデコード用のターゲットデータブロックに関する情報を受信し、エンコードまたはデコード用のターゲットデータブロックは、圧縮されたビデオまたは画像データブロック、もしくは非圧縮であるビデオまたは画像データブロックのうちの1つである。図5の方法は、ターゲットデータブロックのエンコードまたはデコードのために再帰的変換を使用するか否かを判定することを含むステップ502をも含み得る。同様に、ステップ502は、ターゲットデータブロックのエンコードまたはデコードに再帰的変換を使用するかそれとも非再帰的変換を使用するかを判定することを含み得る。
図5に示されるように、ステップ502の判定がYESである(すなわち、再帰的変換を使用する)場合、ステップ503を実行する。ステップ503は、判定の結果が、再帰的変換を使用する場合、マルチ変換データ構造を使用して再帰的変換を生成し、生成された再帰的変換を使用してターゲットデータブロックをエンコードまたはデコードさせる情報を発生または送信することを含む。ステップ502の判定がNOである(すなわち、再帰的変換を使用しないか、あるいは代替的に非再帰的変換を使用する)場合、ステップ504を実行する。ステップ504は、判定の結果が、再帰的変換を使用しない場合、マルチ変換データ構造に埋め込まれた一つ又は複数の非再帰的変換のうちの1つを使用することを含み得る。特に、ステップ504は、マルチ変換データ構造に埋め込まれた一つ又は複数の非再帰的変換のうちの1つを使用してターゲットデータブロックをエンコードまたはデコードさせる情報を発生または送信することを含み得る。図5の方法は、マルチ変換データ構造の非再帰的変換の少なくとも一部を、マルチ変換データ構造の再帰的変換の半分の少なくとも一部に埋め込むことをさらに含み得る。
図5に示される方法は、一つ又は複数のプロセッサによって実行される処理ステップ500〜504をさらに含み得る。図5に示される方法は、ステップ501〜504の実行前または実行中に、メモリ内の一つ又は複数のプロセッサによってマルチ変換データ構造を事前に記憶することをさらに含み得る。
図5に示される方法は、非再帰的変換のサイズがMであり、M=N/2であり、ただし、Nが、マルチ変換データ構造の再帰的変換のサイズであることをさらに含み得る。図5の方法は、再帰的変換が、DCT―2、アダマール変換、DCT―1、DST―1、またはDST―2のうちの1つであることをさらに含み得る。図5の方法は、非再帰的変換が、DST−7またはDCT−8のうちの1つであることをさらに含み得る。
図5の方法は、再帰的変換がDCT―2であり、非再帰的変換がDST―7またはDCT―8であることをさらに含み得る。図5の方法は、再帰的変換がDCT―2であることをさらに含み得、該方法は、マルチ変換データ構造の再帰的DCT―2変換を使用する場合、(i)マルチ変換データ構造に基づいて、DCT―2変換行列の左半分を決定するステップと、(ii)DCT−2変換行列の左半分を考慮して、DCT−2変換行列の右半分をDCT−2コアの対称性/反対称性特性に従って導出するステップと、をさらに含み得る。
図5の方法は、(i)2N点DCT−2の奇数の基底の前半をN点スケーリングされたDST−7またはDCT−8基底で置き換えるステップと、(ii)2N点DCT−2の奇数の基底の後半を、反転されたDST−7基底またはDCT−8基底および逆符号で埋めることにより、2N点DCT−2の元の奇数の基底に対応する結果としての基底を作成することをさらに含み得る。図5の方法は、変換行列が10ビット表現で量子化されることをさらに含み得る。
図5の方法は、N点非再帰的変換を2N点再帰的変換に埋め込むことにより、複合正規直交変換(COT)である新しい正規直交変換としてマルチ変換データ構造を導出し、新しい正規直交変換は、再帰的変換の対称性/反対称性特性により、正規直交変換のままであることをさらに含み得る。図5の方法は、N点DCT−8またはDST−7を2N点DCT−2に埋め込むことにより、複合正規直交変換(COT)である新しい正規直交変換としてマルチ変換データ構造を導出し、新しい正規直交変換は、DCT−2の対称性/反対称性特性により、正規直交変換のままであることをさらに含み得る。
一例では、マルチ変換データ構造として、以下に示されるように、64点COTコアが提案される。
Figure 2021520144


Figure 2021520144

Figure 2021520144
Figure 2021520144

Figure 2021520144
Figure 2021520144
Figure 2021520144
Figure 2021520144

Figure 2021520144

ここで、
Figure 2021520144
は事前定義された数値である。
上記の事前定義された数値(64点COTコアにおける要素)の例示的な値は、次の通りである。
Figure 2021520144
64点COTコアにおける要素の例示的な値は、次の通りである。
Figure 2021520144
上記の変換コアから、以下に示されるように、2点DCT―2を抽出することができる。
Figure 2021520144
上記の変換コアから、以下に示されるように、4点DCT−2を抽出することができる。
Figure 2021520144
上記の変換コアから、以下に示されるように、8点DCT−2を抽出することができる。
Figure 2021520144

上記の変換コアから、以下に示されるように、16点DCT−2を抽出することができる。
Figure 2021520144
上記の変換コアから、以下に示されるように、32点DCT−2を置き換える32点COTを抽出することができる。
Figure 2021520144
Figure 2021520144
Figure 2021520144
32点COTコアにおける要素の例示的な値は、次の通りである。
Figure 2021520144
さらに、16点DCT−8変換コアは、以下のように抽出されることもでき、16点DST−7変換コアは、16点DCT−8変換コアを左右に反転することおよび奇数行の符号の変更により導出されることができる。
Figure 2021520144
さらに、32点DCT−8変換コアは、以下のように抽出されることもでき、32点DST−7変換コアは、32点DCT−8変換コアを左右に反転することおよび奇数行の符号の変更により導出されることができる。
32点DCT−8変換コアを以下に示す。
Figure 2021520144

Figure 2021520144

Figure 2021520144
Figure 2021520144
32点DCT−8コアにおける要素の例示的な値は、次の通りである。
Figure 2021520144
エンコード/デコードのための技法は、一つ又は複数のコンピュータ読取可能な媒体(例えば、ハードディスクドライブ)に物理的に記憶され得るコンピュータ読取可能な命令を有するコンピュータソフトウェアを実行し得る一つ又は複数のプロセッサによって実施されることができる。例えば、図7は、開示された主題の特定の実施形態を実施することに適したコンピュータシステム700を示す。
コンピュータソフトウェアは、アセンブリ、コンパイル、リンク、またはそのようなメカニズムを施されて、コンピュータ中央処理装置(CPU)、グラフィックスプロセッシングユニット(GPU)などによって直接、または解釈、マイクロコード実行などによって実行されることができる命令を含むコードを作成する任意の適切な機械コードまたはコンピュータ言語を用いて符号化されることができる。
命令は、例えば、パーソナルコンピュータ、タブレットコンピュータ、サーバ、スマートフォン、ゲームデバイス、モノのインターネットデバイスなどを含む、様々なタイプのコンピュータまたはそのコンポーネント上で実行されることができる。
コンピュータシステム700について図7に示されるコンポーネントは、本質的に例示的なものであり、本開示の実施形態を実施するコンピュータソフトウェアの使用または機能の範囲に関していかなる限定を示唆することも意図しない。コンポーネントの構成は、コンピュータシステム700の例示的な実施形態で示されるコンポーネントのうちのいずれか1つ又は組み合わせに関する任意の依存性又は必要性を有するとして解釈されるべきではない。
コンピュータシステム700は、特定のヒューマンインターフェース入力デバイスを含み得る。このようなヒューマンインターフェース入力デバイスは、例えば、触覚入力(キーストローク、スワイプ、データグローブの動きなど)、オーディオ入力(音声、拍手など)、視覚入力(ジェスチャーなど)、嗅覚入力(示されていない)によって、1人以上のユーザによる入力に応答することができる。ヒューマンインターフェースデバイスは、オーディオ(音声、音楽、環境音など)、画像(走査画像、静止画像カメラから取得される写真画像など)、ビデオ(2次元ビデオ、立体ビデオを含む3次元ビデオなど)など、人間による意識的な入力に必ずしも直接関係しない特定のメディアを獲得することにも使用できる。
入力ヒューマンインターフェースデバイスは、キーボード701、マウス702、トラックパッド703、タッチスクリーン710、データグローブ704、ジョイスティック705、マイクロフォン706、スキャナ707、カメラ708(それぞれ1つのみ示されている)のうちの一つ又は複数を含み得る。
コンピュータシステム700は、特定のヒューマンインターフェース出力デバイスをも含み得る。このようなヒューマンインターフェース出力デバイスは、例えば、触覚出力、音声、光、および嗅覚/味覚を介して1人以上のユーザの感覚を刺激し得る。このようなヒューマンインターフェース出力デバイスは、触覚出力デバイス(例えば、タッチスクリーン710、データグローブ704、またはジョイスティック705による触覚フィードバックがあるが、入力デバイスとして機能しない触覚フィードバックデバイスであってもよい)、オーディオ出力デバイス(スピーカ709、ヘッドホン(示されていない)など)、視覚出力デバイス(CRTスクリーン、LCDスクリーン、プラズマスクリーン、OLEDスクリーンを含むスクリーン710(それぞれタッチスクリーン入力能力を有するかもしくは有せず、それぞれ触覚フィードバック能力を有するかもしくは有しない。それらの一部は、ステレオグラフィック出力などの手段を介して、2次元の視覚出力または3次元以上の出力を出力することができる)、仮想現実眼鏡(示されていない)、ホログラフィックディスプレおよびスモークタンク(示されていない)など)、およびプリンタ(示されていない)を含み得る。
コンピュータシステム700は、人間がアクセス可能な記憶装置およびそれらの関連する媒体、例えば、CD/DVDなどの媒体721付きのCD/DVD ROM/RW720を含む光学媒体、サムドライブ722、リムーバブルハードドライブまたはソリッドステートドライブ723、テープやフロッピーディスクなどの従来の磁気媒体(示されていない)、セキュリティドングルなどの専用のROM/ASIC/PLD基底のデバイス(示されていない)などをも含むことができる。
ここで開示された主題に関連して使用される「コンピュータ読取可能な媒体」あるいは「コンピュータ読取可能なメディア」という用語は、送信媒体、搬送波、または他の一時的な信号を包含しないことをも当業者が理解するべきである。
コンピュータシステム700は、一つ又は複数の通信ネットワークへのインターフェースをさらに含むことができる。ネットワークは、例えば、無線、有線、光学的であり得る。ネットワークは、さらに、ローカル、広域、大都市圏、車両用および産業用、リアルタイム、遅延耐性などであり得る。ネットワークの例は、イーサネット、無線LANなどのローカルエリアネットワーク、GSM、3G、4G、5G、LTEなどを含むセルラーネットワーク、ケーブルTV、衛星TV、および地上放送TVを含むTV有線または無線広域デジタルネットワーク、CANBusを含む車両用や産業用などを含む。特定のネットワークは、一般に、特定の汎用データポートまたは周辺バス749(例えば、コンピュータシステム700のUSBポートなど)に接続された外部ネットワークインターフェースアダプターを必要とする。他のものは一般に、以下で説明するようにシステムバスに接続されることにより、コンピュータシステム700のコアに統合される(例えば、PCコンピュータシステムへのイーサネットインターフェースまたはスマートフォンコンピューターシステムへのセルラーネットワークインターフェース)。これらのネットワークのいずれかを用いて、コンピュータシステム700は、他のエンティティと通信することができる。このような通信は、単方向、受信のみ(例えば、放送TV)、単方向の送信のみ(例えば、特定のCANbusデバイスへのCANbus)、または双方向、例えばローカルまたはワイドエリアデジタルネットワークを用いる他のコンピュータシステムへの送信であり得る。特定のプロトコルおよびプロトコルスタックを上述したこれらのネットワークおよびネットワークインターフェースのそれぞれで使用することができる。
前述のヒューマンインターフェースデバイス、人間がアクセス可能な記憶装置、およびネットワークインターフェースは、コンピュータシステム700のコア740に接続されることができる。
コア740は、一つ又は複数の中央処理装置(CPU)741、グラフィックスプロセッシングユニット(GPU)742、フィールドプログラマブルゲートアレイ(FPGA)743の形態での専用プログラマブル処理ユニット、特定のタスクのためのハードウェアアクセラレータ744などを含むことができる。これらのデバイスは、リードオンリーメモリ(ROM)745、ランダムアクセスメモリ746、非ユーザアクセス可能な内部ハードドライブ、SSDなどの内部大容量記憶装置747とともに、システムバス748を介して接続されてもよい。一部のコンピュータシステムでは、システムバス748は、一つ又は複数の物理プラグの形態でアクセスでき、追加のCPU、GPUなどによる拡張を可能にする。周辺機器は、コアのシステムバス748に直接、または周辺バス749を介して接続されることができる。周辺バスのアーキテクチャは、PCI、USBなどを含む。
CPU741、GPU742、FPGA743、およびアクセラレータ744は、組み合わせて、前述のコンピュータコードを構成することができる特定の命令を実行することができる。そのコンピュータコードは、ROM745またはRAM746に記憶されることができる。推移データはRAM746にも記憶できるが、永続データは、例えば、内部大容量ストレージ747に記憶されることができる。一つ又は複数のCPU741、GPU742、大容量ストレージ747、ROM745、RAM746などと密接に関連付けることができるキャッシュメモリを使用することにより、任意のメモリデバイスへの高速保存および検索が可能になる。
コンピュータ読取可能な媒体は、様々なコンピュータ実施操作を実行するためのコンピュータコードを備えることができる。媒体およびコンピュータコードは、本開示の目的のために特別に設計および構築されたものであり得るか、もしくは、それらは、コンピュータソフトウェア技術の当業者に周知であって利用可能な種類のものであり得る。
限定ではなく、一例として、アーキテクチャを有するコンピュータシステム700、特にコア740は、一つ又は複数の有形のコンピュータ読取可能な媒体に組み込まれたソフトウェアを実行するプロセッサ(CPU、GPU、FPGA、アクセラレータなどを含む)の結果としての機能性を提供することができる。このようなコンピュータ読取可能な媒体は、以上で紹介したようにユーザがアクセス可能な大容量ストレージ、および、コア内部大容量ストレージ747またはROM745などの非一時的な性質を持つコア740の特定のストレージに関連付けられた媒体であり得る。本開示の様々な実施形態を実行するソフトウェアは、このようなデバイスに記憶され、コア740によって実行されることができる。コンピュータ読取可能な媒体は、特定の必要に応じて、一つ又は複数のメモリデバイスまたはチップを含むことができる。ソフトウェアは、コア740、具体的にはその中のプロセッサ(CPU、GPU、FPGAなどを含む)に、RAM746に記憶されたデータ構造を定義すること、および、ソフトウェアで定義されたプロセスに従ってこのようなデータ構造を変更することを含む、ここで説明する特定のプロセスまたは特定のプロセスの特定の部分を実行させることができる。加えて、または、代替として、コンピュータシステムは、本明細書に記載された特定のプロセスまたは特定のプロセスの特定の部分を実行するためにソフトウェアの代わりにまたは一緒に動作することができる回路(例えば、アクセラレータ744)に有線接続されたまたは組み込まれたロジックの結果としての機能性を提供することができる。ソフトウェアへの言及は、必要に応じて、ロジックを含むことができ、その逆も同様である。コンピュータ読取可能な媒体への言及は、必要に応じて、実行のためのソフトウェアを記憶する回路(集積回路(IC)など)、実行のためのロジックを具現化する回路、またはその両方を含むことができる。本開示は、ハードウェアとソフトウェアの任意の適切な組み合わせを含む。
本開示はいくつかの例示的な実施形態を説明してきたが、本開示の範囲内に含まれる変更、置換、および様々な代替の均等物が存在する。したがって、当業者は、本明細書では明示的に示されていないか、または記載されていないが、本開示の原理を具現化し、その思想および範囲内に含まれる様々なシステムおよび方法を考案できることが理解されよう。

Claims (20)

  1. 一つ又は複数の非再帰的変換をより大きい再帰的変換に埋め込むことにより、新しいマルチ変換データ構造を生成するステップと、
    エンコードまたはデコード用のターゲットデータブロックに関する情報を受信するステップであって、前記エンコードまたはデコード用のターゲットデータブロックは、圧縮されたビデオまたは画像データブロック、もしくは非圧縮であるビデオまたは画像データブロックのうちの1つである、ステップと、
    前記ターゲットデータブロックに対する前記エンコードまたはデコードに再帰的変換を使用するかそれとも非再帰的変換を使用するかを判定するステップと、
    前記判定の結果が、前記再帰的変換を使用する場合、前記マルチ変換データ構造を使用して前記再帰的変換を生成し、生成された前記再帰的変換を使用して前記ターゲットデータブロックをエンコードまたはデコードさせる情報を発生または送信するステップと、
    前記判定の結果が、前記マルチ変換データ構造の前記非再帰的変換を使用する場合、前記マルチ変換データ構造に埋め込まれた前記一つ又は複数の非再帰的変換のうちの1つを使用して前記ターゲットデータブロックをエンコードまたはデコードさせる情報を発生または送信するステップであって、前記マルチ変換データ構造の前記一つ又は複数の非再帰的変換のうちの1つの少なくとも一部が、前記マルチ変換データ構造の前記より大きい再帰的変換の半分の少なくとも一部に埋め込まれている、ステップと、
    を含むデコードまたはエンコード方法。
  2. 前記一つ又は複数の非再帰的変換のサイズはMであり、M=N/2であり、ただし、Nは前記マルチ変換データ構造の前記再帰的変換のサイズである、請求項1に記載の方法。
  3. N点非再帰的変換を2N点再帰的変換に埋め込むことにより、複合正規直交変換(COT)である新しい正規直交変換として前記マルチ変換データ構造を導出するステップであって、前記新しい正規直交変換は、前記再帰的変換の対称性/反対称性特性により、正規直交変換のままである、ステップをさらに含む、請求項1に記載の方法。
  4. 前記再帰的変換は、DCT―2、アダマール変換、DCT―1、DST―1、DST―2、DCT―3またはDST―3のうちの1つである、請求項1〜3のいずれか一項に記載の方法。
  5. 前記一つ又は複数の非再帰的変換は、DST―7またはDCT―8のうちの一つ又は複数である、請求項1〜4のいずれか一項に記載の方法。
  6. 前記再帰的変換はDCT―2であり、前記一つ又は複数の非再帰的変換のうちの1つはDST―7またはDCT―8である、請求項1〜3のいずれか一項に記載の方法。
  7. 前記再帰的変換はDCT―2であり、前記方法は、前記マルチ変換データ構造の再帰的DCT―2変換を使用する場合、(i)前記マルチ変換データ構造に基づいてDCT−2変換行列の左半分を決定するステップと、(ii)前記DCT−2変換行列の左半分を考慮して、前記DCT−2変換行列の右半分を、DCT−2コアの対称性/反対称性特性に従って導出するするステップと、をさらに含む、請求項1〜3のいずれか一項に記載の方法。
  8. (i)2N点DCT―2の奇数の基底の前半をN点スケーリングされたDST−7またはDCT−8基底で置き換えるステップと、(ii)前記2N点DCT−2の奇数の基底の後半を、反転されたDST−7またはDCT−8基底および逆符号で埋めるステップとにより、2N点DCT―2の元の奇数の基底に対応する結果としての基底を作成するステップをさらに含む、請求項6に記載の方法。
  9. 前記一つ又は複数の非再帰的変換をより大きい再帰的変換に埋め込み、生成された新しい再帰的変換をエンコードまたはデコードに使用することによる前記新しい再帰的変換の生成が高レベル構文で示され、前記高レベル構文は、ビデオパラメータセット(VPS)、シーケンスパラメータセット(SPS)、ピクチャパラメータセット(PPS)、スライスヘッダ、またはCTUヘッダのうちの少なくとも1つを含む、請求項1〜8のいずれか一項に記載の方法。
  10. N点DCT―8またはDST―7を2N点DCT−2に埋め込むことにより、複合正規直交変換(COT)である新しい正規直交変換として前記マルチ変換データ構造を導出するステップであって、前記新しい正規直交変換は、DCT−2の対称性/反対称性特性により、正規直交変換のままである、ステップをさらに含む、請求項1に記載の方法。
  11. DCT−4はDCT−2から抽出され、
    DCT−4は、特定のブロックサイズに対して適応多重変換(AMT)におけるDCT−8を置き換え、
    前記新しい変換コアは、DCT−4変換基底を左右に反転することにより導出され、
    前記新しい変換コアは、特定のブロックサイズに対してAMTにおけるDST−7を置き換える、請求項1に記載の方法。
  12. コンピュータプログラムコードを記憶するように構成される少なくとも1つのメモリと、
    前記少なくとも1つのメモリにアクセスし、前記コンピュータプログラムコードに従って動作するように構成される少なくとも1つのプロセッサと、を備え、前記コンピュータプログラムコードは、
    一つ又は複数の非再帰的変換をより大きい再帰的変換に埋め込むことにより、新しいマルチ変換データ構造を生成するように構成される第1の適用コードと、
    エンコードまたはデコード用のターゲットデータブロックに関する情報を前記少なくとも1つのプロセッサに受信させるように構成される適用コードであって、前記エンコードまたはデコード用のターゲットデータブロックは、圧縮されたビデオまたは画像データブロック、もしくは非圧縮であるビデオまたは画像データブロックのうちの1つである、第2の適用コードと、
    前記ターゲットデータブロックに対する前記エンコードまたはデコードのために、前記ターゲットデータブロックに対する前記エンコードまたはデコードに再帰的変換を使用するかそれとも非再帰的変換を使用するかを前記少なくとも1つのプロセッサに判定させるように構成される第3の適用コードと、
    前記判定の結果が、前記再帰的変換を使用する場合、前記マルチ変換データ構造を使用して前記再帰的変換を生成し、生成された前記再帰的変換を使用して前記ターゲットデータブロックをエンコードまたはデコードさせる情報を発生または送信することを前記少なくとも1つのプロセッサに実行させるように構成される第4の適用コードと、
    前記判定の結果が、前記マルチ変換データ構造の前記非再帰的変換を使用する場合、前記マルチ変換データ構造に埋め込まれた前記一つ又は複数の非再帰的変換のうちの1つを使用して前記ターゲットデータブロックをエンコードまたはデコードさせる情報を発生または送信する適用コードであって、前記マルチ変換データ構造の前記一つ又は複数の非再帰的変換のうちの1つの少なくとも一部が、前記マルチ変換データ構造の前記より大きい再帰的変換の半分の少なくとも一部に埋め込まれている、第5の適用コードと、を含む装置。
  13. 前記一つ又は複数の非再帰的変換のうちの1つのサイズはMであり、M=N/2であり、ただし、Nは前記マルチ変換データ構造の前記再帰的変換のサイズである、請求項12に記載の装置。
  14. 前記第1の適用コードは、N点非再帰的変換を2N点再帰的変換に埋め込むことにより、複合正規直交変換(COT)である新しい正規直交変換として前記マルチ変換データ構造を前記少なくとも1つのプロセッサに導出させ、前記新しい正規直交変換は、前記再帰的変換の対称性/反対称性特性により、正規直交変換のままであるように構成される、請求項12に記載の装置。
  15. 前記再帰的変換は、DCT−2、アダマール変換、DCT−1、DST−1、またはDST−2のうちの1つであり、
    前記一つ又は複数の非再帰的変換は、DST−7またはDCT−8のうちの一つ又は複数である、
    請求項12〜14のいずれか一項に記載の装置。
  16. 前記再帰的変換はDCT―2であり、前記コンピュータプログラムコードは、前記マルチ変換データ構造の再帰的DCT―2変換を使用する場合、前記少なくとも1つのプロセッサに、(i)前記マルチ変換データ構造に基づいてDCT−2変換行列の左半分を決定させ、(ii)前記DCT−2変換行列の左半分を考慮して、前記DCT−2変換行列の右半分を、DCT−2コアの対称性/反対称性特性に従って導出させるように構成される第6の適用コードをさらに含む、請求項12〜14のいずれか一項に記載の装置。
  17. 前記第6の適用コードは、(i)2N点DCT―2の奇数の基底の前半をN点スケーリングされたDST−7またはDCT−8基底で置き換えるステップと、(ii)前記2N点DCT−2の奇数の基底の後半を、反転されたDST−7またはDCT−8基底および逆符号で埋めるステップとにより、2N点DCT―2の元の奇数の基底に対応する結果としての基底を、少なくとも1つのプロセッサに作成させるように構成される、請求項16に記載の装置。
  18. 前記一つ又は複数の非再帰的変換をより大きい再帰的変換に埋め込み、生成された新しい再帰的変換をエンコードまたはデコードに使用することによる前記新しい再帰的変換の生成は高レベル構文で示され、前記高レベル構文は、ビデオパラメータセット(VPS)、シーケンスパラメータセット(SPS)、ピクチャパラメータセット(PPS)、スライスヘッダ、またはCTUヘッダのうちの少なくとも1つを含む、請求項12〜17のいずれか一項に記載の装置。
  19. 前記第1の適用コードは、少なくとも1つのプロセッサに、N点DCT―8またはDST―7を2N点DCT−2に埋め込むことにより、複合正規直交変換(COT)である新しい正規直交変換として前記マルチ変換データ構造を導出させるように構成され、前記新しい正規直交変換は、DCT−2の対称性/反対称性特性により、正規直交変換のままである、請求項18に記載の装置。
  20. コンピュータに請求項1〜11のいずれか一項に記載の方法のステップを実行させるコンピュータプログラム。
JP2020556806A 2018-05-07 2019-04-12 デコードまたはエンコードのための方法並びに装置およびコンピュータプログラム Active JP7213264B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201862668065P 2018-05-07 2018-05-07
US62/668,065 2018-05-07
US201862670704P 2018-05-11 2018-05-11
US62/670,704 2018-05-11
US16/235,336 2018-12-28
US16/235,336 US10536720B2 (en) 2018-05-07 2018-12-28 Method, apparatus and medium for decoding or encoding
PCT/US2019/027209 WO2019217033A1 (en) 2018-05-07 2019-04-12 Method, apparatus and medium for decoding or encoding

Publications (2)

Publication Number Publication Date
JP2021520144A true JP2021520144A (ja) 2021-08-12
JP7213264B2 JP7213264B2 (ja) 2023-01-26

Family

ID=68385627

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020556806A Active JP7213264B2 (ja) 2018-05-07 2019-04-12 デコードまたはエンコードのための方法並びに装置およびコンピュータプログラム

Country Status (6)

Country Link
US (2) US10536720B2 (ja)
EP (1) EP3756353B1 (ja)
JP (1) JP7213264B2 (ja)
KR (1) KR102473929B1 (ja)
CN (1) CN112106374B (ja)
WO (1) WO2019217033A1 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10812797B2 (en) * 2018-02-05 2020-10-20 Tencent America LLC Method, apparatus and medium for decoding or encoding using a low-complexity transform
US11665368B2 (en) * 2018-12-06 2023-05-30 Lg Electronics Inc. Method and device for processing video signal by using transform having low complexify
WO2020184314A1 (ja) * 2019-03-11 2020-09-17 ソニー株式会社 画像処理装置および方法
US11134275B2 (en) 2019-06-04 2021-09-28 Tencent America LLC Method and apparatus for performing primary transform based on filtering of blocks
US11212545B2 (en) 2019-06-07 2021-12-28 Tencent America LLC Method and apparatus for improved implicit transform selection
US11405647B2 (en) * 2020-02-18 2022-08-02 Tencent America LLC Primary transforms using 8-bit and 10-bit cores
US11432018B2 (en) 2020-05-11 2022-08-30 Tencent America LLC Semi-decoupled partitioning for video coding
US11310529B2 (en) 2020-05-27 2022-04-19 Tencent America LLC Mode-dependent joint component transform
US11388401B2 (en) * 2020-06-26 2022-07-12 Google Llc Extended transform partitions for video compression
US11259055B2 (en) 2020-07-10 2022-02-22 Tencent America LLC Extended maximum coding unit size
US11206428B1 (en) 2020-07-14 2021-12-21 Tencent America LLC Method and apparatus for frequency-dependent joint component secondary transform
US11575937B2 (en) 2020-07-24 2023-02-07 Tencent America LLC Methods for efficient application of LGT
US11310504B2 (en) 2020-07-30 2022-04-19 Tencent America LLC Complexity reduction for 32-p and 64-p LGT

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014509108A (ja) * 2011-01-10 2014-04-10 クゥアルコム・インコーポレイテッド メディアデータコーディングのための32点変換

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101448162B (zh) * 2001-12-17 2013-01-02 微软公司 处理视频图像的方法
US8631060B2 (en) * 2007-12-13 2014-01-14 Qualcomm Incorporated Fast algorithms for computation of 5-point DCT-II, DCT-IV, and DST-IV, and architectures
US8526495B2 (en) 2010-11-22 2013-09-03 Mediatek Singapore Pte. Ltd. Apparatus and method of constrained partition size for high efficiency video coding
US9049452B2 (en) 2011-01-25 2015-06-02 Mediatek Singapore Pte. Ltd. Method and apparatus for compressing coding unit in high efficiency video coding
US9788019B2 (en) 2011-03-09 2017-10-10 Hfi Innovation Inc. Method and apparatus of transform unit partition with reduced complexity
WO2013023518A1 (en) 2011-08-17 2013-02-21 Mediatek Singapore Pte. Ltd. Method and apparatus for intra prediction using non-square blocks
PL3139596T3 (pl) 2011-09-13 2020-03-31 Hfi Innovation Inc. Sposób i urządzenie do kodowania wewnątrzklatkowego w HEVC
KR101978194B1 (ko) * 2014-11-14 2019-05-14 후아웨이 테크놀러지 컴퍼니 리미티드 디지털 이미지를 처리하는 방법 및 시스템
US10306229B2 (en) * 2015-01-26 2019-05-28 Qualcomm Incorporated Enhanced multiple transforms for prediction residual
US10448053B2 (en) 2016-02-15 2019-10-15 Qualcomm Incorporated Multi-pass non-separable transforms for video coding
US10390048B2 (en) 2016-02-15 2019-08-20 Qualcomm Incorporated Efficient transform coding using optimized compact multi-pass transforms
US10880564B2 (en) * 2016-10-01 2020-12-29 Qualcomm Incorporated Transform selection for video coding
US11095893B2 (en) * 2016-10-12 2021-08-17 Qualcomm Incorporated Primary transform and secondary transform in video coding
US20180288439A1 (en) * 2017-03-31 2018-10-04 Mediatek Inc. Multiple Transform Prediction
US10750181B2 (en) * 2017-05-11 2020-08-18 Mediatek Inc. Method and apparatus of adaptive multiple transforms for video coding

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014509108A (ja) * 2011-01-10 2014-04-10 クゥアルコム・インコーポレイテッド メディアデータコーディングのための32点変換

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JICHENG AN ET AL., NON-CE7: BOUNDARY-DEPENDENT TRANSFORM FOR INTER-PREDICTED RESIDUE, JPN6021050440, 22 November 2011 (2011-11-22), ISSN: 0004667568 *
YURIY A. REZNIK: "Relationship between DCT-II, DCT-VI, and DST-VII transforms", 2013 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING, JPN6021050443, 26 May 2013 (2013-05-26), pages 5642 - 5646, XP032508092, ISSN: 0004667567, DOI: 10.1109/ICASSP.2013.6638744 *

Also Published As

Publication number Publication date
US10536720B2 (en) 2020-01-14
EP3756353B1 (en) 2024-02-28
EP3756353A4 (en) 2021-03-31
WO2019217033A1 (en) 2019-11-14
KR20200125732A (ko) 2020-11-04
JP7213264B2 (ja) 2023-01-26
US20200084476A1 (en) 2020-03-12
KR102473929B1 (ko) 2022-12-02
EP3756353A1 (en) 2020-12-30
US20190342580A1 (en) 2019-11-07
CN112106374B (zh) 2022-10-18
US11032573B2 (en) 2021-06-08
CN112106374A (zh) 2020-12-18

Similar Documents

Publication Publication Date Title
JP7213264B2 (ja) デコードまたはエンコードのための方法並びに装置およびコンピュータプログラム
JP7073536B2 (ja) 復号化または符号化の方法、装置および媒体
JP2022515876A (ja) ビデオデコーディングのための方法、装置、媒体、およびプログラム
JP7053947B2 (ja) ビデオシーケンスを復号する方法、装置及びコンピュータプログラム
JP2021518088A (ja) 小ブロックの予測と変換のための方法、装置、及びプログラム
JP7257516B2 (ja) ビデオ・コーディングのための方法、装置及びコンピュータ・プログラム
JP2022507314A (ja) 単一レベルの変換分割および適応サブブロック変換を行うための方法、装置、およびプログラム
US20230247214A1 (en) Configurable maximum transform size
JP2022515126A6 (ja) ビデオ・コーディングのための方法、装置及びコンピュータ・プログラム
US11032543B2 (en) Method and apparatus for video coding
JP2022511851A (ja) 最大変換サイズの制御
CN113424532A (zh) 视频编解码方法和装置
KR20220085836A (ko) 비디오 코딩 방법 및 장치
JP7357679B2 (ja) 改善された最確モードリスト生成方法
US11831911B2 (en) Method and apparatus for video coding
JP7512430B2 (ja) ゼロ残差フラグコーディング
RU2778250C1 (ru) Управление максимальным размером преобразования

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201026

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220322

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220628

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220927

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221220

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230116

R150 Certificate of patent or registration of utility model

Ref document number: 7213264

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150