JP2014535250A - ビデオコード化のための量子化行列の信号伝達 - Google Patents

ビデオコード化のための量子化行列の信号伝達 Download PDF

Info

Publication number
JP2014535250A
JP2014535250A JP2014541203A JP2014541203A JP2014535250A JP 2014535250 A JP2014535250 A JP 2014535250A JP 2014541203 A JP2014541203 A JP 2014541203A JP 2014541203 A JP2014541203 A JP 2014541203A JP 2014535250 A JP2014535250 A JP 2014535250A
Authority
JP
Japan
Prior art keywords
values
quantization matrix
downsampled
sampling
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014541203A
Other languages
English (en)
Other versions
JP5902311B2 (ja
Inventor
ジョシ、ラジャン・ラクスマン
カークゼウィックズ、マルタ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2014535250A publication Critical patent/JP2014535250A/ja
Application granted granted Critical
Publication of JP5902311B2 publication Critical patent/JP5902311B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Magnetic Ceramics (AREA)

Abstract

本開示の技術は、一般的に、量子化行列の値の信号伝達に関する。一部の例では、量子化行列の係数値は、係数値が量子化行列のどこに位置するかに基づいて、異なる係数でダウンサンプリングすることができる。

Description

本出願は、その全内容が参照によって本明細書に組み込まれる、2011年11月7日に出願された米国仮出願第61/556,785号、2012年2月3日に出願された米国仮出願第61/594,885号、2012年2月9日に出願された米国仮出願第61/597,107号、及び、2012年3月1日に出願された米国仮出願第61/605,654号の優先権を主張するものである。
本開示は、データコード化に関し、より詳細には、ビデオデータをコード化するための技術に関する。
デジタルビデオ機能は、デジタルテレビ、デジタル直接放送システム、ワイヤレス放送システム、携帯情報端末(PDA)、ラップトップコンピュータ又はデスクトップコンピュータ、デジタルカメラ、デジタル記録機器、デジタルメディアプレイヤー、ビデオゲーム機器、ビデオゲーム機、セル方式電話又は衛星方式の無線電話、ビデオ会議機器などを含む多種多様の機器に組み込むことができる。デジタルビデオ情報をより効率的に送信、受信、及び格納するために、デジタルビデオ機器は、MPEG−2、MPEG−4、ITU−T H.263、ITU−T H.264/MPEG−4、パート10、Advanced Video Coding(AVC)、現在開発中の高効率ビデオコード化(HEVC:High Efficiency Video Coding)標準、及びそのような標準の拡張に規定された標準に記述されているものなど、画像圧縮技術を実装する。
画像圧縮技術は、ビデオシーケンスに固有の冗長性を減らす、又は取り除くために、空間的予測及び/又は時間的予測を含む。ブロックベースのビデオのコード化について、ビデオのフレーム又はスライスはブロックへと分割することができる。各ブロックは、更に分割することができる。イントラコード化(I)されたフレーム又はスライスのブロックは、同じフレーム又はスライスの隣接するブロックの参照サンプルに関して空間的予測を使用して符号化される。インターコード化(P又はB)されたフレーム又はスライスのブロックは、同じフレーム若しくはスライスの隣接するブロックの参照サンプルに関して空間的予測、又は他の参照フレームの参照サンプルに関して時間的な予測を使用することができる。空間的又は時間的な予測の結果として、コード化されるブロックの予測的なブロックが得られる。残余データは、コード化されるオリジナルブロックと予測的なブロックとの間の画素差を表している。
インターコード化されるブロックは、予測的なブロックを形成する参照サンプルのブロックを指し示す運動ベクトルと、コード化されたブロックと予測的なブロックとの間の差を示す残余データとに従って符号化される。イントラコード化されるブロックは、イントラコード化モードと残余データとに従って符号化される。さらなる圧縮のために、残余データは、画素領域から変換領域に変形させ、次いで量子化できる、残余の変換係数を得ることができる。2次元配列に最初に配置された、量子化された変換係数は、エントロピーコード化のために変換係数の一次元ベクトルを生成するために特定の順序でスキャンすることができる。
一般的に、本開示は、量子化行列の値の信号伝達について説明するものである。例えば、ビデオ符号器は、量子化行列の値を少なくとも値の第1のサブセットと値の第2のサブセットとに分割することができる。ビデオ符号器は、構文要素として第1のサブセットの値を符号化し信号伝達することができる。ビデオ復号器は、第1のサブセットの値の構文要素を受信し、第1のサブセットの値を生成するために構文要素を復号することができる。第2のサブセットの値を受信することなく、ビデオ復号器は、第1のサブセットの値から第2のサブセットの値を予測することができる。
本開示の一例では、ビデオデータを符号化する方法は、複数の値を含む量子化行列を生成することと、ダウンサンプリングされた値の第1の組を生成するために、第1のダウンサンプリング係数によって量子化行列の値の第1の組をダウンサンプリングすることと、ダウンサンプリングされた値の第2の組を生成するために、第2のダウンサンプリング係数によって量子化行列の値の第2の組をダウンサンプリングすることと、ダウンサンプリングされた値の第1の組とダウンサンプリングされた値の第2の組とを含むコード化されたビットストリームを生成することとを備える。
本開示の別の実施例では、ビデオデータを復号するための方法は、コード化されたビットストリームのダウンサンプリングされた値でコード化された量子化行列を受信することと、値の第1の組を生成するために、第1のアップサンプリング係数によって量子化行列のダウンサンプリングされた値の第1の組をアップサンプリングすることと、値の第2の組を生成するために、第2のアップサンプリング係数によって量子化行列のダウンサンプリングされた値の第2の組をアップサンプリングすることと、値の第1及び第2の組で変換係数のブロックを逆量子化することとを備える。
1つ又は複数の例の詳細は、添付の図面及び下記の記述に述べられている。他の特徴、目的、及び利点は、説明及び図、ならびに特許請求の範囲から明白になるだろう。
本開示で説明された技術を利用できる例示的なビデオ符号化及び復号化システムを示すブロック図。 本開示で説明された技術を実装できる例示的なビデオ符号器を示すブロック図。 本開示で説明された技術を実装できる例示的なビデオ復号器を示すブロック図。 例示的な量子化行列を示す概念図。 例示的な値を用いる量子化行列を示す概念図。 本開示の1つ又は複数の例示的な技術を利用する再構築された量子化行列を示す概念図。 量子化行列の一例における異なる部分のダウンサンプリング係数を示す概念図。 量子化行列の別の例における異なる部分のダウンサンプリング係数を示す概念図。 量子化行列の別の例における異なる部分のダウンサンプリング係数を示す概念図。 本開示の技術に従ったビデオ符号化方法を示す流れ図。 本開示の技術に従ったビデオ復号方法を示す流れ図。
本開示は、ビデオコード化における量子化行列の値を信号伝達するための技術について説明するものである。量子化行列は、複数の値を含む2次元行列の場合がある。例として、量子化行列は、ビデオコード化のために変換単位に関連する残余の変換係数を量子化するために使用される量子化ステップサイズを基準化するために使用することができる。量子化パラメータ(QP)は、量子化ステップサイズを指定するために、変換単位など、変換係数のブロックに割り当てることができる。量子化行列の各値は、量子化されるブロックの係数に対応し、QP値を前提として、係数に適用される量子化の程度を決定するために使用される。
特に、本開示は、より少ない量子化値を送信し、及び/又は符号化されたビデオのビットストリームに格納される必要があるように、量子化行列をダウンサンプリングするための技術を提案する。ビデオデータのブロックに関連する量子化行列全体を送信又は格納することは、大量のビットを必要とする可能性があるため、コード化されたビデオのビットストリームの帯域幅効率を減らすことになる。また、ビデオ復号器は、逆量子化プロセスのためにメモリに量子化行列全体を格納することができる。本開示の技術を用いて量子化行列をダウンサンプリングすることによって、コード化されたビデオの品質を実質的に下げることなくビットを節約することができる。
本開示では、例示を目的として、ビデオコード化について説明する。本開示に記述されているコード化技術は、また、他のタイプのデータコード化に適用可能な場合がある。デジタルビデオ機器は、デジタルビデオ情報をより効率的に符号化し復号するために画像圧縮技術を実装する。画像圧縮は、ビデオシーケンスに固有の冗長性を減らす、又は取り除くために、空間的(イントラフレーム)予測及び/又は時間的(インターフレーム)予測の技術を適用することができる。
「フレーム(frame)」という用語は、「ピクチャ(picture)」という用語と区別なく使用できることを理解されたい。言い換えると、「フレーム」及び「ピクチャ」という用語はそれぞれをビデオの一部を表し、フレーム又はピクチャを連続して表示するとスムーズな再生が得られる。従って、本開示において「フレーム」という用語を使用する場合、本開示の技術は、「フレーム」という用語を利用するビデオコード化技術又は標準に限定するものと解釈されるべきではなく、技術は、開発済みの標準、開発中の標準、若しくは将来的な標準、又は「ピクチャ」という用語を利用する他のビデオコード化技術など、他の標準に拡張可能な可能性がある。
典型的なビデオ符号器は、「ブロック」又は「コード化単位」と呼ばれる隣接する方形領域へとオリジナルのビデオシーケンスの各フレームを分割する。これらのブロックは「イントラモード」(Iモード)又は「インターモード」(Pモード又はBモード)で符号化される。
Pモード又はBモードについて、符号器は最初に、Frefによって示された「参照フレーム」で符号化される対象に類似するブロックを検索する。検索は、一般的に、符号化されるブロックからの特定の空間的な変位だけに限定される。最適な一致、即ち予測的なブロック又は「予測」が識別された場合、二次元(2D)の運動ベクトル(Δx,Δy)の形で表現され、ここで、コード化されるブロックの画素の位置に関連する参照フレームの予測的なブロックにおける画素の位置において、Δxは水平、Δyは垂直な変位である。
参照フレームとともに運動ベクトルは、次のように予測されたブロックFpredを構成するために使用される。
Figure 2014535250
フレーム内の画素の場所は、(x,y)によって示される。
Iモードで符号化されたブロックについて、予測されたブロックは、同じフレーム内で以前に符号化された隣接するブロックから空間的予測を使用して形成される。IモードとP又はBモードの両方について、予測誤差、即ち符号化されるブロックと予測されたブロックとの画素値の残余の差は、離散コサイン変換(DCT)など、一部の個別の変換の重み付き基底関数の組として表される。変換は、4×4、8×8、又は16×16以上など、異なるサイズのブロックに基づいて実行することができる。変換ブロックの形状は、必ずしも正方形とは限らない。例えば、16×4、32×8などの変換ブロックサイズを持つ方形の変換ブロックも使用することができる。
重み(即ち変換係数)は、次に量子化される。量子化により情報の消失が生じ、そのため量子化された係数は、オリジナルの変換係数より低い精度を持つ。量子化された変換係数及び運動ベクトルは「構文要素」の例である。これらの構文要素、及び一部の制御情報は、ビデオシーケンスのコード化された表現を形成する。構文要素は、また、エントロピーコード化できるため、表現に必要なビット数を更に減らすことができる。エントロピーコード化は、それらの分散の特性を利用することによって(一部の記号は他の記号より頻繁に出現する)、送信又は格納された記号(この場合、構文要素)を表すのに必要なビット数を最小限にすることを目的とした損失がない演算である。
圧縮比、即ち、オリジナルシーケンスと圧縮されたシーケンスとを表すために使用されるビット数の比は、量子化パラメータ(QP)の値と量子化行列の値の一方又は両方を調整することによって制御することができ、それらは両方、変換係数値を量子化するために使用することができる。圧縮比は、用いられるエントロピーコード化の方法に依存することができる。量子化行列は、典型的には、行列の量子化値が、一般的に、必ずしも例外がないとは限らないが、行(左から右)と列(上から下)の両方向に増加するように設計されている。例えば、変換係数のブロックは、左上(0,0)の角にあるDC位置から、より高い周波数係数へと変換係数のブロックの右下(n,n)の角に向けて伸びるにつれて、量子化行列の対応する値は一般的に増加する。そのような設計の理由は、人間の視覚系(HVS)のコントラスト感度機能(CSF)は、水平と上下の両方向において、周波数の上昇とともに低下するためである。
復号器では、符号器と同じ方法でその予測を最初に構成することによって、そして圧縮された予測誤差を予測に追加することによって、現在のフレームのブロックが取得される。圧縮された予測誤差は、量子化された係数を使用して、変換基底関数に重み付けすることによって見つかる。再構築されたフレームとオリジナルのフレームとの間の差は、再構成誤差と呼ばれる。
図1は、本開示で説明した技術を利用できる例示的なビデオ符号化及び復号化システム10を示すブロック図である。図1に示すように、システム10は、通信チャネル16を介して宛先機器14に符号化されたビデオを送信する発信源機器12を含む。符号化されたビデオデータは、また、記憶媒体34又はファイルサーバ36に格納することができ、希望に応じて宛先機器14によってアクセスすることができる。記憶媒体又はファイルサーバに格納される場合、ビデオ符号器20は、記憶媒体にコード化されたビデオデータを格納するために、ネットワークインターフェース、コンパクトディスク(CD)、Blu−ray(登録商標)又はデジタルビデオディスク(DVD)のバーナ若しくはスタンピング機能機器(stamping facility device)、又は他の機器など、他の機器にコード化されたビデオデータを提供することができる。同様に、ネットワークインターフェース、CD、又はDVDリーダーなど、ビデオ復号器30から離れた機器は、記憶媒体からコード化されたビデオデータを取得し、ビデオ復号器30に取得されたデータを提供した。
発信源機器12及び宛先機器14は、デスクトップコンピュータ、ノートブック(即ちラップトップ)コンピュータ、タブレットコンピュータ、セットトップボックス、所謂スマートフォンなどハンドセット電話機、テレビ、カメラ、表示装置、デジタルメディアプレイヤー、テレビゲームコンソールなどを含む多種多様な機器のいずれかを備えることができる。多くの場合において、ワイヤレス通信のためにそのような機器を装備することができる。よって、通信チャネル16は、ワイヤレスチャネル、有線チャネル、又は符号化されたビデオデータの送信に適したワイヤレス及び有線のチャネルの組合せを備えることができる。同様に、ファイルサーバ36は、インターネット接続を含む、任意の標準データ接続を通じた宛先機器14によってアクセスすることができる。これは、ワイヤレスチャネル(例えばWi−Fi(登録商標)接続)、有線接続(例えば、DSL、ケーブルモデムなど)、又はファイルサーバに格納された符号化されたビデオデータにアクセスするのに適した両方の組合せを含むことができる。
本開示の例に従った量子化行列を信号伝達するための技術は、例えば、インターネット、データ記憶媒体に格納するためのデジタルビデオの符号化、データ記憶媒体に格納されたデジタルビデオの復号、又は他のアプリケーションを介して、無線経由のテレビ放送、ケーブルテレビ送信、衛星テレビ放送、ストリーミングビデオ送信など、様々なマルチメディアアプリケーションのいずれかをサポートするビデオコード化に適用することができる。一部の例では、システム10は、ビデオストリーミング、ビデオ再生、ビデオブロードキャスト、及び/又はビデオ電話などのアプリケーションをサポートするために1方向又は2方向のビデオ送信をサポートするように構成することができる。
図1の例では、発信源機器12は、ビデオ発信源18と、ビデオ符号器20と、変復調装置22と、送信機24とを含む。発信源機器12において、ビデオ発信源18は、ビデオカメラなどの撮像装置、以前に撮影されたビデオを含むビデオのアーカイブ、ビデオコンテンツプロバイダからビデオを受信するためのビデオフィードインターフェース、及び/又は発信源ビデオとしてコンピュータグラフィックスデータを生成するためのコンピュータグラフィックスシステムなどの発信源、又はそのような発信源の組合せを含むことができる。一例として、ビデオ発信源18がビデオカメラである場合、発信源機器12及び宛先機器14は、所謂カメラ電話又はテレビ電話を形成することができる。しかし、本開示で説明した技術は、一般的にビデオのコード化に適用可能な場合があり、ワイヤレス及び/又は有線のアプリケーション、又は符号化されたビデオデータがローカルディスクに格納されるアプリケーションに適用することができる。
撮影、事前撮影、又はコンピュータで生成されたビデオは、ビデオ符号器20によって符号化することができる。符号化されたビデオ情報は、ワイヤレス通信プロトコルなどの通信標準に従ってモデム22によって変調し、送信機24を介して宛先機器14に送信することができる。モデム22は、様々なミキサー、フィルタ、増幅器、又は信号変調のために設計された他のコンポーネントを含むことができる。送信機24は、増幅器と、フィルタと、1つ又は複数のアンテナとを含む、データを送信するために設計された回路を含むことができる。
ビデオ符号器20によって符号化された、撮影、事前撮影、又はコンピュータで生成されたビデオは、また、後で消費するために記憶媒体34又はファイルサーバ36に格納することができる。記憶媒体34は、符号化されたビデオを格納するために、Blu−ray(登録商標)ディスク、DVD、CD−ROM、フラッシュメモリ、又は任意の他の適切なデジタル記憶媒体を含むことができる。次いで、記憶媒体34に格納された符号化されたビデオは、復号及び再生のために宛先機器14によってアクセスすることができる。図1に図示していないが、一部の例では、記憶媒体34及び/又はファイルサーバ36は、送信機24の出力を格納することができる。
ファイルサーバ36は、符号化されたビデオを格納することができ、宛先機器14にその符号化されたビデオを送信することができる任意のタイプのサーバでもよい。例示的なファイルサーバは、ウェブサーバ(例えばウェブサイトのため)、FTPサーバ、ネットワーク接続記憶(NAS)機器、ローカルディスクドライブ、又は符号化されたビデオデータを格納することができ、宛先機器にそれを送信することができる任意の他のタイプの機器を含む。ファイルサーバ36からの符号化されたビデオデータの送信は、ストリーミング送信、ダウンロード送信、又は両方の組合せでもよい。ファイルサーバ36は、インターネット接続を含む、任意の標準データ接続を通じて宛先機器14によってアクセスすることができる。これは、ワイヤレスチャネル(例えばWi−Fi(登録商標)接続)、有線接続(例えば、DSL、ケーブルモデム、イーサネット(登録商標)、USBなど)、又はファイルサーバに格納された符号化されたビデオデータにアクセスするのに適した両方の組合せを含むことができる。
宛先機器14は、図1の例では、受信機26と、モデム28と、ビデオ復号器30と、表示装置32とを含む。宛先機器14の受信機26は、チャネル16を通じて情報を受信し、モデム28は、ビデオ復号器30のために復調されたビットストリームを生成するために情報を復調する。チャネル16を通じて通信された情報は、ビデオデータの復号においてビデオ復号器30によって使用するために、ビデオ符号器20によって生成された様々な構文情報を含むことができる。そのような構文は、また、記憶媒体34又はファイルサーバ36に格納された符号化されたビデオデータに含まれていてもよい。ビデオ符号器20及びビデオ復号器30の各々は、ビデオデータを符号化又は復号できるそれぞれの符号器−復号器(CODEC)の一部を形成することができる。
表示装置32は、宛先機器14に統合されても、又は外付けされてもよい。一部の例では、宛先機器14は、統合された表示装置を含むことができ、また、外部表示装置とインターフェースを取るように構成することができる。他の例では、宛先機器14は、表示装置でもよい。一般的に、表示装置32は、復号されたビデオデータをユーザに表示し、液晶表示器(LCD)、プラズマ表示器、有機発光ダイオード(OLED)表示器、又は別のタイプの表示装置など、様々な表示装置のいずれかを備えることができる。
図1の例では、通信チャネル16は、無線周波数(RF)スペクトル又は1つ以上の物理的送信路など、ワイヤレス若しくは有線の通信媒体、又はワイヤレス及び有線の媒体の任意の組合せも備えることができる。通信チャネル16は、ローカルエリアネットワーク、ワイドエリアネットワーク、又はインターネットなどグローバルなネットワークなど、パケットベースのネットワークの一部を形成することができる。通信チャネル16は、一般的に、有線又はワイヤレスの媒体の任意の適切な組合せを含む、発信源機器12から宛先機器14にビデオデータを送信するための任意の適切な通信媒体、又は異なる通信媒体の集合を表している。通信チャネル16は、ルータ、スイッチ、基地局、又は発信源機器12から宛先機器14への通信を促進するのに役に立つ可能性がある任意の他の装置を含むことができる。
ビデオ符号器20及びビデオ復号器30は、現在開発中の高能率ビデオコード化標準(HEVC)標準など、画像圧縮標準に従って動作することができ、HEVCテストモデル(HM)に準拠することができる。或いは、ビデオ符号器20及びビデオ復号器30は、MPEG−4、パート10、Advanced Video Coding(AVC)とも呼ばれるITU−T H.264標準、又はそのような標準の拡張など、他の知的所有権下にある、又は業界標準に従って動作することができる。しかし、本開示の技術は、任意の特定のコード化標準にも限定されない。画像圧縮標準の他の例には、MPEG−2とITU−T H.263とが含まれる。
図1に図示していないが、一部の態様では、ビデオ符号器20及びビデオ復号器30はそれぞれ、オーディオ符号器及び復号器に統合することができ、共通のデータストリーム又は個別のデータストリームにおいて、オーディオとビデオの両方の符号化を扱うために、適切なMUX−DEMUXユニット、又は他のハードウェア及びソフトウェアを含むことができる。該当する場合は、一部の例では、MUX−DEMUXユニットは、ITU H.223多重化プロトコル(multiplexer protocol)、又はユーザデータグラムプロトコル(UDP)など他のプロトコルに準拠することができる。
ビデオ符号器20及びビデオ復号器30はそれぞれ、1つ又は複数のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、個別のロジック、ソフトウェア、ハードウェア、ファームウェア、又はそれらの任意の組合せなど、様々な適切な符号器回路のいずれかとして実装することができる。技術が部分的にソフトウェアで実装される場合、機器は、適切な非一時的コンピュータ可読媒体にソフトウェアのための命令を格納し、本開示の技術を実行するために1つ又は複数のプロセッサを使用してハードウェアで命令を実行することができる。ビデオ符号器20及びビデオ復号器30の各々は、1つ又は複数の符号器又は復号器に含まれていてもよく、そのいずれかは、それぞれの機器に組み合わせられた符号器/復号器(CODEC)の一部として統合することができる。
ビデオコード化のための共同協調チーム(JCT−VC:Joint Cooperative Team for Video Coding)によって現在開発中の新たなHEVC標準に従ったビデオコード化について、一例として、ビデオフレームはコード化単位へと分割することができる。コード化単位(CU)は、一般的に、画像圧縮のために様々なコード化ツールが適用される基本単位として役に立つ画像領域を表している。CUは、通常、Yとして示される輝度成分とU及びVとして示される2つの彩度成分とを持つ。ビデオのサンプリング形式に依存して、U及びVの成分のサイズは、サンプル数に関して、Y成分のサイズと同じ、又は異なる場合がある。CUは、典型的に正方形であり、例えばITU−T H.264など他のビデオコード化標準において、所謂マクロブロックに類似すると考えることができる。開発中のHEVC標準の現在提案された態様の一部に従ったコード化について、例示を目的として本明細書に説明する。しかし、本開示で説明された技術は、H.264又は他の標準により規定されたものなど他のビデオコード化プロセス又は知的所有権下にあるビデオコード化プロセスに役に立つ場合がある。
HEVC標準化事業は、HEVCテストモデル(HM)と呼ばれるビデオコード化機器のモデルに基づいている。HMは、例えばITU−T H.264/AVCに従った機器を通じたビデオコード化機器の複数の機能を想定する。例えば、H.264では、9つのイントラ予測符号化モードが提供されるが、HMでは、35ものイントラ予測符号化モードが提供される。以下HEVC WD7と呼ばれる、HEVCの最近の最新作業草案(WD)は、2012年10月30日時点で、http://phenix.int−evry.fr/jct/doc_end_user/documents/9_Geneva/wg11/JCTVC−I1003−v6.zipから利用可能である。
一般的に、HMの作業モデルは、ビデオフレーム又はピクチャは、輝度と彩度の両方のサンプルを含むツリーブロック(treeblock)又は最大のコード化単位(LCU)のシーケンスへと分割できると説明している。ツリーブロックは、H.264標準のマクロブロックと同様の目的を持っている。スライスは、コード化の順序に多数の連続するツリーブロックを含む。ビデオフレーム又はピクチャは、1つ又は複数のスライスへと分割することができる。各ツリーブロックは、4分木に従ってコード化単位(CU)へと分割することができる。例えば、ツリーブロックは、4分木のルートノードとして、4つの子ノードへと分割することができ、各子ノードは、次に親ノードになることができ、更に4つの子ノードへと分割される。最終的な分割されていない子ノードは、4分木の葉ノードとして、コード化ノード、即ちコード化されたビデオブロックを備える。コード化されたビットストリームに関連する構文データは、ツリーブロックを分離できる最大数を規定することができ、またコード化ノードの最小サイズを規定することができる。
CUは、コード化ノード及び予測ユニット(PU)、及びコード化ノードに関連する変換単位(TU)を含む。CUのサイズは、コード化ノードのサイズに対応し、形状は正方形である必要がある。CUのサイズは、8×8画素から、最大64×64画素以上であるツリーブロックのサイズまで及ぶことができる。各CUは、1つ又は複数のPU及び1つ又は複数TUを含むことができる。CUに関連する構文データは、例えば、1つ又は複数のPUへとCUを区分することについて記述することができる。モードの区分は、CUがSkipモード又はDirectモードで符号化されているか、イントラ予測モードで符号化されているか、又はインター予測モードで符号化されているかによって異なる場合がある。PUは、正方形以外の形状に区分することができる。CUに関連する構文データは、また、例えば、4分木に従って1つ又は複数のTUへとCUを区分することについて記述することができる。TUは、形状が正方形又は正方形以外でもよい。
HEVC標準では、異なるCUには異なる場合がある、TUに従って変形が可能になる。TUは、典型的には、区分されたLCUに対して規定された所与のCU内のPUのサイズに基づいてサイズが決定されるが、これが必ずしも当てはまるとは限らない。TUは、典型的には、同じサイズであるか、又はPUより小さい。一部の例では、CUに対応する残余のサンプルは、「残余4分木」(RQT)として知られている4分木構造を使用して、より小さい単位へと細分化することができる。RQTの葉ノードは、変換単位(TU)と呼ぶことができる。TUに関連する画素差異値は、量子化できる、変換係数を生成するために変形することができる。
一般的に、PUは、予測プロセスに関係するデータを含む。例えば、PUがイントラモード符号化されている場合、PUは、PUのイントラ予測モードについて記述するデータを含むことができる。別の例では、PUがインターモード符号化されている場合、PUは、PUの運動ベクトルを規定するデータを含むことができる。PUの運動ベクトルを規定するデータは、例えば、運動ベクトルの水平成分、運動ベクトルの垂直成分、運動ベクトルの解像度(例えば4分の1画素精度又は8分の1画素精度)、運動ベクトルが指し示す参照ピクチャ、及び/又は運動ベクトルの参照ピクチャリスト(例えばリスト0、リスト1、又はリストC)について記述することができる。
一般的に、TUは、変換及び量子化のプロセスに使用される。1つ又は複数のPUを持つ所与のCUは、また、1つ又は複数の変換単位(TU)を含むことができる。予測に続いて、ビデオ符号器20は、PUに対応する残余の値を計算することができる。残余の値は、エントロピーコード化のために連続した変換係数を生成するためにTUを使用して変換係数に転換、量子化、及びスキャンできる画素差異値を備える。本開示は、典型的に、CUのコード化ノードを示すために「ビデオブロック」という用語を使用する。一部の特定の場合には、本開示は、また、コード化ノード及びPU及びTUを含む、ツリーブロック、即ちLCU又はCUを示すために「ビデオブロック」という用語を使用することができる。
ビデオシーケンスは、典型的には、一連のビデオフレーム又はピクチャを含む。ピクチャのグループ(GOP)は、一般的に、ビデオピクチャの1つ又は複数の連続を備える。GOPは、GOPのヘッダに、ピクチャの1つ又は複数のヘッダに、又は他の場所に、GOPに含まれている多数のピクチャについて記述する構文データを含むことができる。ピクチャの各スライスは、それぞれのスライスに対する符号化モードについて記述するスライス構文データを含むことができる。ビデオ符号器20は、典型的には、ビデオデータを符号化するために個々のビデオスライス内のビデオブロックに対して動作する。ビデオブロックは、CU内のコード化ノードを対応することができる。ビデオブロックは、固定されたサイズ又は変動するサイズを持つことができ、指定されたコード化標準に従ってサイズが異なる場合がある。
例えば、HMは、様々なPUサイズの予測をサポートする。特定のCUのサイズが2N×2Nであると想定すると、HMは、PUサイズが2N×2N又はN×Nのイントラ予測、及び対称なPUサイズ2N×2N、2N×N、N×2N、又はN×Nのインター予測をサポートする。HMは、また、2N×nU、2N×nD、nL×2N、及びnR×2NのPUサイズにおいてインター予測に対して非対称の区分化をサポートする。非対称の区分化では、CUの一方向は区分化されない一方、他の方向は、25%及び75%へと区分化される。25%の区分化に対応するCUの部分は、「n」と、後に続く「Up」、「Down」、「Left」、又は「Right」の指示によって示される。従って、例えば、「2N×nU」は、上に2N×0.5N PU及び下に2N×1.5N PUで水平に区分される2N×2N CUを表している。
本開示では、例えば16×16画素又は16かける16画素など、「N×N」及び「NかけるN(N by N)」は、垂直及び水平の寸法に関して、ビデオブロックの画素範囲を示すために区別なく使用することができる。一般的に、16×16ブロックは、垂直方向に16個の画素を持ち(y=16)、水平方向に16個の画素を持つ(x=16)。同様に、N×Nブロックは、一般的に、垂直方向にN個の画素を持ち、水平方向にN個の画素を持ち、ここでNは負でない整数値を表している。ブロックの画素は、列及び行に配置することができる。更に、ブロックは、必ずしも垂直方向と水平全方向に同じ画素数を持つ必要はない。例えば、ブロックはN×M画素を備えることができ、ここでMはNと必ずしも等しいとは限らない。
CUのPUを使用するイントラ予測又はインター予測の符号化に続いて、ビデオ符号器20は、CUのTUの残余データを計算することができる。PUは、空間的な領域に画素データを備えることができ(画素領域とも呼ばれる)、TUは、例えば、離散コサイン変換(DCT)、整数変換、ウェーブレット変換、又は残余のビデオデータへの概念的に同様の変換など、変換の適用に続き変換領域において係数を備えることができる。残余データは、符号化されていないピクチャの画素とPUに対応する予測値との間の画素差に対応することができる。ビデオ符号器20は、CUの残余データを含むTUを形成し、次いでCUの変換係数を生成するためにTUを変形することができる。
変換係数を生成するための任意の変換に続き、ビデオ符号器20は、変換係数の量子化を実行することができる。量子化は、一般的に、変換係数が、場合によっては、係数を表すために使用されるデータの量を減らすために量子化されるプロセスを表し、さらなる圧縮を提供する。量子化プロセスは、係数の一部又は全てに関連するビット深度を減らすことができる。例えば、nビット値は、量子化の間にmビット値に切り捨てることができ、ここでnはmより大きい。
一部の例では、ビデオ符号器20は、エントロピー符号化できる連続したベクトルを生成するために、量子化された変換係数をスキャンするために事前定義されたスキャン命令を利用することができる。他の例では、ビデオ符号器20は、適応可能なスキャンを実行することができる。一次元のベクトルを形成するために量子化された変換係数をスキャンした後、ビデオ符号器20は、例えば、コンテキスト適応可能な可変長コード化(CAVLC:context adaptive variable length coding)、コンテキスト適応可能な2進算術コード化(CABAC:context adaptive binary arithmetic coding)、構文ベースのコンテキスト適応可能な2進算術コード化(SBAC:syntax-based context-adaptive binary arithmetic coding)、確率間隔区分化エントロピー(PIPE:Probability Interval Partitioning Entropy)コード化、又は他のエントロピー符号化方法などに従って、一次元のベクトルをエントロピー符号化することができる。ビデオ符号器20は、また、ビデオデータを復号する際にビデオ復号器30によって使用するために符号化されたビデオデータに関連する構文要素をエントロピー符号化することができる。
CABACを実行するために、ビデオ符号器20は、送信される記号にコンテキストモデル内のコンテキストを割り当てることができる。コンテキストは、例えば、記号の隣接する値が非ゼロかどうかに関することができる。CAVLCを実行するために、ビデオ符号器20は、送信される記号の可変長コードを選択することができる。比較的より短いコードはより可能性の高い記号に対応し、より長いコードはより可能性の低い記号に対応するように、VLCのコードワードを構成することができる。このようにして、VLCを使用することで、例えば、送信される各記号に対して等しい長さのコードワードを使用することによって、ビットの節約を達成することができる。確率の決定は、記号に割り当てられたコンテキストに基づいてもよい。
ビデオ符号器20は、ビデオコード化プロセスにおいて量子化行列をダウンサンプリング及び信号伝達するために、本開示の技術の一部又は全てを実装することができる。同様に、ビデオ復号器30は、ビデオコード化プロセスにおいて、量子化行列をアップサンプリングするために、これらの技術の一部又は全てを実装することができる。本開示に記述したように、ビデオコーダは、ビデオ符号器又はビデオ復号器を表すことができる。同様に、ビデオコード化ユニットは、ビデオ符号器又はビデオ復号器を表すことができる。同様に、ビデオコード化は、ビデオ符号化又はビデオ復号化を表すことができる。
本開示の一例では、ビデオ符号器20は、複数の値を含む量子化行列を生成し、ダウンサンプリングされた値の第1の組を生成するために、第1のダウンサンプリング係数によって量子化行列の値の第1の組をダウンサンプリングし、ダウンサンプリングされた値の第2の組を生成するために、第2のダウンサンプリング係数によって量子化行列の値の第2の組をダウンサンプリングし、ダウンサンプリングされた値の第1の組とダウンサンプリングされた値の第2の組とを含むコード化されたビットストリームを生成するように構成することができる。一部の例では、ダウンサンプリング係数は1つでもよく、その場合には、値はダウンサンプリングなしで直接的にコード化される。
本開示の別の例では、ビデオ復号器30は、コード化されたビットストリームのダウンサンプリングされた値でコード化された量子化行列を受信し、値の第1の組を生成するために、第1のアップサンプリング係数によって量子化行列のダウンサンプリングされた値の第1の組をアップサンプリングし、値の第2の組を生成するために、第2のアップサンプリング係数によって量子化行列のダウンサンプリングされた値の第2の組をアップサンプリングし、値の第1及び第2の組で変換係数のブロックを逆量子化するように構成することができる。一部の例では、アップサンプリング係数は1でもよく、その場合には、値は、アップサンプリングなしで直接的にコード化される。
図2は、本開示で説明された技術を実装できる例示的なビデオ符号器20を示すブロック図である。ビデオ符号器20は、ビデオスライス内でビデオブロックのイントラコード化及びインターコード化を実行することができる。所与のビデオフレーム又はピクチャ内のビデオの空間的な冗長性を減らすか取り除くために、イントラコード化は空間的予測に依存する。ビデオシーケンスの隣接するフレーム又はピクチャ内のビデオの時間的な冗長性を減らすか取り除くために、インターコード化は、時間的予測に依存する。イントラモード(Iモード)は、いくつかの空間に基づく圧縮モードのいずれかを表すことができる。片方向予測(Pモード)又は両予測(Bモード)など、インターモードは、いくつかの時間に基づく圧縮モードのいずれかを表すことができる。
図2の例では、ビデオ符号器20は、区分ユニット35と、予測処理ユニット41と、参照ピクチャメモリ64と、加算器50と、変換処理ユニット52と、量子化ユニット54と、エントロピー符号化ユニット56とを含む。予測処理ユニット41は、運動推定ユニット42と、運動補償ユニット44と、イントラ予測処理ユニット46とを含む。ビデオブロックの再構成について、ビデオ符号器20は、また、逆量子化ユニット58と、逆変換処理ユニット60と、加算器62とを含む。再構築されたビデオからブロック歪み(blockiness artifacts)を削除するために、デブロッキングフィルタ(図2に図示せず)も、フィルタブロックの境界に含めることができる。望まれる場合は、デブロッキングフィルタは、典型的には、加算器62の出力をフィルタする。追加的なループフィルタ(ループ内又はループ後)もデブロッキングフィルタに加えて使用することができる。
図2に示すように、ビデオ符号器20は、ビデオデータを受信し、区分化ユニット35は、ビデオブロックへとデータを区分する。この区分化は、また、例えば、LCU及びCUの4分木構造に従って、ビデオブロックの区分化だけでなく、スライス、タイル、又は他のより大きな単位へと区分することを含むことができる。ビデオ符号器20は、一般的に、符号化されるビデオスライス内のビデオブロックを符号化する成分を示している。スライスは、複数のビデオブロック(及び場合によってはタイルと呼ばれるビデオブロックの組)に分割することができる。予測処理ユニット41は、誤差結果(例えばコード化レート及び歪みのレベル)に基づいて現在のビデオブロックについて、複数のイントラコード化モードの1つ、又は複数のインターコード化モードの1つなど、複数の可能なコード化モードの1つを選択することができる。予測処理ユニット41は、結果として生じるイントラ又はインターコード化されたブロックを残余のブロックデータを生成するために加算器50に、かつ参照ピクチャとして使用するために符号化されたブロックを再構築するために加算器62に提供することができる。
予測処理ユニット41内のイントラ予測処理ユニット46は、空間的な圧縮を提供するためにコード化される現在のブロックと同じフレーム又はスライスにおいて、1つ又は複数の隣接するブロックに関して現在のビデオブロックのイントラ予測コード化を実行することができる。予測処理ユニット41内の運動推定ユニット42及び運動補償ユニット44は、時間的な圧縮を提供するために1つ又は複数の参照ピクチャの1つ又は複数の予測的なブロックに関して現在のビデオブロックのインター予測コード化を実行する。
運動推定ユニット42は、ビデオシーケンスに対して事前に定めたパターンに従って、ビデオスライスに対してインター予測モードを決定するように構成することができる。事前に定めたパターンは、Pスライス、Bスライス、又はGPBスライスとしてシーケンスにおいてビデオスライスを指定することができる。運動推定ユニット42及び運動補償ユニット44は、高度に統合することができるが、概念的な目的のために別々に示されている。運動推定ユニット42によって実行される運動推定は、ビデオブロックの運動を推定する、運動ベクトルを生成するプロセスである。運動ベクトルは、例えば、参照ピクチャ内の予測的なブロックに関する現在のビデオフレーム又はピクチャ内のビデオブロックのPUの変位を示すことができる。
予測的なブロックは、絶対差(SAD)の合計、正方形差(SSD)の合計、又は他の差の測定基準によって決定することができる、画素差に関してコード化されるビデオブロックのPUに厳密に一致することがわかるブロックである。一部の例では、ビデオ符号器20は、参照ピクチャメモリ64に格納された参照ピクチャの下位整数画素位置(sub-integer pixel position)に対する値を計算することができる。例えば、ビデオ符号器20は、4分の1の画素位置、8分の1の画素位置、又は参照ピクチャの他の断片的な画素位置の値を補間することができる。従って、運動推定ユニット42は、完全な画素位置及び断片的な画素位置に関して運動検索を実行し、断片的な画素精度を用いて運動ベクトルを出力することができる。
運動推定ユニット42は、PUの位置を参照ピクチャの予測的なブロックの位置と比較することによって、インターコード化されたスライスのビデオブロックのPUの運動ベクトルを計算する。参照ピクチャは、第1の参照ピクチャリスト(リスト0)又は第2の参照ピクチャリスト(リスト1)から選択することができ、その各々は参照ピクチャメモリ64に格納された1つ又は複数の参照ピクチャを識別する。運動推定ユニット42は、エントロピー符号化ユニット56と運動補償ユニット44とに計算された運動ベクトルを送る。
運動補償ユニット44によって実行された運動補償は、運動推定によって決定された運動ベクトルに基づいて予測的なブロックを取り込むか、又は生成することを含み、場合によってはサブ画素精度への補間を実行することができる。現在のビデオブロックのPUの運動ベクトルを受信すると、運動補償ユニット44は、参照ピクチャリストの1つで運動ベクトルが指し示す予測的なブロックを見つけることができる。ビデオ符号器20は、コード化されている現在のビデオブロックの画素値から予測的なブロックの画素値を引くことによって、残差ビデオブロックを形成し、画素差異値を形成する。画素差異値は、ブロックに対して残余データを形成し、輝度と彩度との差成分の両方を含むことができる。加算器50は、この減法演算を実行するコンポーネント(複数可)を表している。運動補償ユニット44は、また、ビデオスライスのビデオブロックを復号する際に、ビデオ復号器30によって使用するためにビデオブロック及びビデオスライスに関連する構文要素を生成することができる。
イントラ予測処理ユニット46は、上に記述したように、運動推定ユニット42及び運動補償ユニット44によって実行されたインター予測の代替案として、現在のブロックをイントラ予測することができる。特に、イントラ予測処理ユニット46は、現在のブロックを符号化するために使用するためにイントラ予測モードを決定することができる。一部の例では、イントラ予測処理ユニット46は、例えば個別の符号化パス(encoding pass)の間に、様々なイントラ予測モードを使用して、現在のブロックを符号化することができ、イントラ予測処理ユニット46(又は一部の例ではモード選択ユニット40)は、テスト済みのモードから使用するために適切なイントラ予測モードを選択することができる。例えば、イントラ予測処理ユニット46は、様々なテスト済みのイントラ予測モードにレート歪み分析を使用して、レート歪み値を計算し、テスト済みのモードの中から最善のレート歪み特性を持つイントラ予測モードを選択することができる。レート歪み分析は、一般的に、符号化されたブロックを作成するために使用されるビットレート(即ちビット数)だけでなく、符号化されたブロックと、符号化されたブロックを作成するために符号化されたオリジナルのコード化されていないブロックとの間で歪み(又は誤差)の量を決定する。イントラ予測処理ユニット46は、どのイントラ予測モードがブロックに対して最善のレート歪み値を示すかを決定するために、様々な符号化されたブロックの歪み及びレートからの比を計算することができる。
いずれの場合にも、ブロックにイントラ予測モードを選択した後、イントラ予測処理ユニット46は、ブロックに対して選択されたイントラ予測モードを示す情報をエントロピーコード化ユニット56に提供することができる。エントロピーコード化ユニット56は、本開示の技術に従って選択されたイントラ予測モードを示す情報を符号化することができる。ビデオ符号器20は、複数のイントラ予測モードインデックステーブルと複数の変更されたイントラ予測モードインデックステーブル(コードワードマッピングテーブルとも呼ばれる)とを含むことのできる送信されたビットストリーム構成データにおいて、様々なブロックのコンテキストを符号化する定義と、最も可能性の高いイントラ予測モード、イントラ予測モードインデックステーブル、及びコンテキストの各々に使用する変更されたイントラ予測モードインデックステーブルの指示とを含むことができる。
予測処理ユニット41がインター予測又はイントラ予測のいずれかを介して、現在のビデオブロックについて予測的なブロックを生成した後、ビデオ符号器20は、現在のビデオブロックから予測的なブロックを引くことによって、残差ビデオブロックを形成する。残余のブロックの残余のビデオデータは、1つ又は複数のTUに含まれ、変換処理ユニット52に適用することができる。変換処理ユニット52は、離散コサイン変換(DCT)又は概念的に同様の変換などの変換を使用して、残余のビデオデータを残余の変換係数に転換する。変換処理ユニット52は、周波数領域など、残余のビデオデータを画素領域から変換領域に変換することができる。
変換処理ユニット52は、結果として生じる変換係数を量子化ユニット54に送ることができる。量子化ユニット54は、ビットレートを更に減らすために変換係数を量子化する。量子化プロセスは、係数の一部又は全てに関連するビット深度を減らすことができる。量子化の程度は、量子化パラメータを調整することによって、又は量子化行列の値を変更することによって変更することができる。一部の例では、次いで、量子化ユニット54は、量子化された変換係数を含む行列のスキャンを実行することができる。或いは、エントロピー符号化ユニット56は、スキャンを実行することができる。
場合によっては、量子化ユニット54は、量子化演算に加えて変換後調整演算を実行することができる。変換後調整演算は、残余データのブロックに関して完全な空間から周波数への変換演算又はその概算を効果的に実行するために、変換ユニット52によって実行された中核となる変換演算に関連して使用することができる。一部の例では、変換後調整演算は、量子化演算に統合できるため、変換後演算及び量子化演算は、量子化される1つ又は複数の変換係数に関して同じ1組の演算の一部として実行される。
一部の例では、量子化ユニット54は、量子化行列に基づいて変換係数を量子化することができる。量子化行列は、複数の値を含むことができ、その各々は、量子化される変換係数ブロックの複数の変換係数のそれぞれ1つに対応する。量子化行列の値は、量子化ユニット54によって、変換係数ブロックの対応する変換係数に適用される量子化の量を決定するために使用することができる。例えば、量子化される変換係数の各々について、量子化ユニット54は、量子化される変換係数に対応する量子化行列の値のそれぞれ1つによって少なくとも部分的に決定される量子化の量に従ってそれぞれの変換係数を量子化することができる。
他の例では、量子化ユニット54は、量子化パラメータ及び量子化行列に基づいて変換係数を量子化することができる。量子化パラメータは、変換係数ブロックに適用される量子化の量を決定するために使用できるブロックレベルパラメータ(即ち変換係数ブロック全体に割り当てられたパラメータ)でもよい。そのような例では、量子化行列及び量子化パラメータの値は、変換係数ブロックの対応する変換係数に適用される量子化の量を決定するためにともに使用することができる。言い換えると、量子化行列は、量子化パラメータを用いて、対応する変換係数に適用される量子化の量を決定するために使用できる値を指定することができる。例えば、変換係数ブロックで量子化される変換係数の各々について、量子化ユニット54は、変換係数ブロックについてブロックレベルの量子化パラメータ(QP)によって少なくとも部分的に決定される量子化の量と、量子化される変換係数に対応する量子化行列の複数の係数に特有の値のそれぞれ1つとに従って、それぞれの変換係数を量子化することができる。よって、量子化行列は、各変換係数に対する対応する値を提供し、変換係数値の量子化の量を決定するためにQPに値を適用する。
一部の例では、量子化プロセスは、HEVCについて提案された、及び/又はH.264復号標準によって規定されたプロセスの1つ又は複数に類似するプロセスを含むことができる。例えば、変換係数の値(即ちレベル)を量子化するために、量子化ユニット54は、量子化行列の対応する値によって、及び変換後調整値によって変換係数を基準化することができる。次いで、量子化ユニット54は、量子化パラメータに基づく量によって基準化された変換係数をシフトすることができる。場合によっては、変換後調整値は、量子化パラメータに基づいて選択することができる。他の量子化技術も使用することができる。
量子化ユニット54は、一部の例では、変換係数の量子化について量子化ユニット54によって使用される量子化行列を示すデータが、符号化されたビットストリームに含まれるようにすることができる。例えば、量子化ユニット54は、符号化されたビットストリームのデータ及び続く配置をエントロピー符号化するために、エントロピー符号化ユニット56に量子化行列を示すデータを提供することができる。
符号化されたビットストリームに含まれる量子化行列データは、ビットストリームを復号するためにビデオ復号器30によって使用することができる(例えば逆量子化演算を実行するため)。一部の例では、データは、1組の量子化行列から事前に定めた量子化行列を識別するインデックス値でもよく、又は量子化行列を生成するための関数を識別することができる。他の例では、データは、量子化行列に含まれる実際の値を含むことができる。追加的な例では、データは、量子化行列に含まれる実際の値のコード化されたバージョンを含むことができる。例えば、量子化行列のコード化されたバージョンは、量子化行列の特定の場所にダウンサンプリングされた値を含むことができる。別の実施例では、コード化されたバージョンは、本開示で後に更に詳細に説明されるような予測値に基づいて生成することができる。一部の例では、データは、コード化されるビデオブロックに対応する変換係数ブロックを量子化するために、量子化ユニット54によって使用される量子化行列を指定する1つ又は複数の構文要素の形を取ることができ、量子化ユニット54は、1つ又は複数の構文要素をコード化されたビデオブロックのヘッダに含めさせることができる。
MPEG−2及びAVC/H.264などの以前の標準では、上に説明したような量子化行列は、主観的な品質を向上させるために使用された。量子化行列は、また、HEVC標準の一部として含まれている。
HM5.1では、4×4、8×8、16×16、及び32×32の変換サイズが可能である。32×32の変換は、輝度及び場合によっては(つまり、場合によっては彩度成分ではなく)輝度のみに使用することができる。合計20の量子化行列を可能にすることが適切な場合がある(即ち、Y、U、及びV成分について、4×4、8×8、16×16のイントラ及びインター予測されたボック(bocks)の個別の量子化行列、及びY成分について、32×32のイントラ及びインター予測されたブロック)。従って、全ての可能な順列を信号で送るために、符号器が4064の量子化行列値を信号伝達することが可能な場合がある。一部の例では、量子化行列を損失なく圧縮するために、一次予測(例えば差分コード化)及び指数関数的なゴロムコード化(exponential Golomb coding)(パラメータ=0)に続いて、量子化行列エントリのジグザグスキャンを使用することができる。しかし、多数の量子化行列係数のためにHEVCでは、より良好な圧縮手法が望ましい場合がある。
量子化行列は、典型的に、人間の視覚系(HVS)を利用するために設計されている。人間の視覚系は、典型的に、より高い周波数の量子化誤差で影響を受けにくい。この理由の1つは、人間の視覚系のコントラスト感度機能(CSF)は、水平方向及び垂直方向の両方において、周波数の上昇とともに減少するからである。従って、良く設計された量子化行列について、行列エントリは、行(左から右)と列(上から下)方向の両方に増加する。特に、変換係数のブロックは、左上(0,0)の角にあるDC位置から、より高い周波数係数へと右下(n,n)の角に向けて伸びるにつれて、量子化行列の対応する値は、一般的に増加するか、又は少なくとも減少しない。
量子化行列を信号伝達するための以前の技術では、量子化行列全体に対する全ての値(即ち係数)が信号伝達された。しかし、量子化行列の右下の角に向けたものなど一部の係数は、ビデオ品質に実質的に寄与しない場合があるため、量子化行列全体の信号伝達は必要ではない場合がある。
一例として、残余のブロックが平滑な場合、32×32などより高いブロックサイズが典型的に使用される。ここで、残余のブロックは、ビデオデータの実際のブロックとビデオデータの予測されたブロックとの間の差である。平滑な残余ブロックは、残余のブロック内の値に偏差をほとんど示さない。この場合、量子化の後、変換されたブロックのより高い周波数に(即ち右下の角に向けて)多くの非ゼロ係数がある可能性は低い場合がある。
符号化されたビデオシーケンスの統計は、この想定をサポートしている。例えば、部分的な周波数変換技術(例えば、32×32ブロックからの最小の16×16係数を符号化)を使用すると、コード化効率において損失はほとんど示されない。これは、16×16領域外の周波数について量子化行列エントリに対して非常に高い値を選択することと等しいと考えることができる(例えば、16×16領域外の周波数に対する量子化行列の係数に対する高い値)。この例では、コード化効率に損失がほとんどない可能性があるので、符号化されたビデオビットストリームにおいて、1024の値である32×32量子化行列値を全て信号伝達することは必要ない場合がある。
以下に、量子化行列の信号伝達及びコード化の例について説明する。例えば、信号伝達について、ビデオ符号器20は、量子化行列全体又は量子化行列のサブセットだけがコード化されるかを示すために、1ビットのフラグを信号伝達することができる。量子化行列全体がコード化されることをフラグが示している場合、HM5.1、AVC/H.264、JCTVC−F085、JCTVC−E073の方式など、又はその全体が参照により本明細書に組み込まれ、以下により詳細に記述した、米国仮特許出願第61/547,647号に記述されている技術など、任意のコード化方式を使用することができる。
量子化行列のサブセットだけがコード化されることをフラグが示している場合(例えば第1のサブセット)、サブセットのサイズは1対の値(last_row、last_col)としてコード化することができる。この例では、サブセットは方形であり、位置(0,0)から位置(last_row、last_col)までの量子化行列エントリを対象にすることが想定される。しかし、他の形状を使用することが可能な場合がある。形状を正方形に限定することが可能な場合もあり、その場合、last_row及びlast_colの値が同じになるので、単一の最終値のみをコード化する必要がある場合がある。最終値(last_row、last_col)は、量子化行列のサイズに依存する可能性がある固定数のビットを用いてコード化することができる。例えば、32×32の量子化行列について、最終値は5+5=10ビット使用してコード化することができる。最終値をコード化するために、指数関数的ゴロム又はゴロムコードなど、可変長コードを使用することが可能な場合がある。
最終値(last_row、last_col)をコード化した後、サブセットに属する量子化行列エントリをコード化することができる(例えば第1のサブセットの値)。HM5.1の方法又は他の方法(AVC/H.264、JCTVC−F085、JCTVC−E073、又は2012年10月11日に出願された米国特許出願第13/649,836号に記述されている技術など)は、サブセットに属する量子化行列エントリをコード化するために使用することができる。コード化は、損失ありでも損失なしでもよい。
米国特許出願第13/649,836号の技術に従って、ビデオ符号器20及びビデオ復号器30は、量子化行列の第1のサブセットの値の予測誤差をコード化するために、ラスタースキャン及び非線形の予測値技術を実行することができる。例示的な技術に従って、予測値は、量子化行列の現在のスキャン位置に関して、量子化行列の第1のサブセットにおいて左の値及び上の値の最大値である。言い換えると、量子化行列がラスター順にスキャンされると、量子化行列の現在値は、現在値の左の値及び現在値の上の値の最大値に基づいて予測される。ラスター順は、一般的に、量子化行列の値が、行において上から下に、各行内では左から右にスキャンされる順を表すことができる。一般的に、量子化行列の値は、変換係数のブロックのそれぞれの変換係数に対応し、ここで左上に向かう係数は周波数が低く、右下に近づく係数は周波数が高くなる。
サブセットに属する量子化行列エントリのコード化が完了した後、量子化行列エントリの残り(例えば第2のサブセットの係数値)は、サブセットに属する量子化行列エントリから予測することができる。このプロセスは、符号器と復号器の両方の後に続いてもよい。例えば、サブセットに属する量子化行列エントリが損失のある方法でコード化された場合、それらは再構築される。次いで、サブセット外の量子化行列エントリ(例えば第2のサブセットの係数値)は、一例として、第2のサブセットの係数値を予測するために、ラスタースキャン順にスキャンされる。
本開示の例では、ビデオ符号器20は、量子化行列のサブセットに対して量子化行列値を信号伝達するように構成することができる。例えば、ビデオ符号器は、量子化行列を量子化行列値の少なくとも第1のサブセット及び第2のサブセットへと分割することができる。ビデオ符号器は、第1のサブセットの係数値を符号化し、構文要素としてこれらの符号化された値をビデオ復号器に信号伝達することができる。ビデオ復号器は、受信された構文要素から第1のサブセットの係数値を復号することができる。
本開示の一部の例では、ビデオ復号器30は、第2のサブセットの値を予測することができる。例えば、一部の例では、ビデオ符号器20は、第2のサブセットの量子化行列の係数値を導き出すために使用される構文要素を信号伝達する必要がない場合があるため、ビデオ復号器は、第2のサブセットの値を予測することができる。むしろ、ビデオ復号器30は、そのような構文要素を利用せずに、第2のサブセットの値を予測するために本開示の技術を利用することができる。このようにして、量子化行列について信号伝達する必要のあるデータの量を減らすことができる。
一例として、ビデオ復号器20は、より詳細には以下に説明するように、量子化行列値の第1のサブセットの復号された係数値に基づいて、量子化行列値の第2のサブセットに対して係数値を予測することができる。別の例では、量子化行列値の第2のサブセットに対する値を予測するために、ビデオ復号器30は、第2のサブセットの各係数に定数値を割り当てることができ、ここで定数値は、限定を目的としない例を挙げると、最大許容量子化行列値でもよい。一部の例では、ビデオ符号器20は、ビデオ復号器に定数値を信号伝達することができ、あるいはビデオ符号器20及びビデオ復号器30は、定数値を用いてプリプログラムすることもできる。
図4は、例示的な量子化行列を示す図である。図4は、残余の変換係数の32×32ブロックを量子化するために使用される32×32量子化行列である量子化行列94を示している。図4に関する技術は、32×32量子化行列の文脈で説明されているが、本開示の態様はそのように限定されるものではなく、正方形でない量子化行列を含む、他のサイズの量子化行列に拡張することができる。量子化行列94は、量子化行列94のエントリの値のサブセットを含む第1のサブセット96を含む。この例では、第1のサブセット96は8×8行列である(左上の角に量子化行列値A001と、右下の角にA232とを含む)が、正方形でないサイズを含む他のサイズが可能である。この例では、第1のサブセット96のエントリの係数値は、ビデオ符号器20によって符号化され信号伝達することができる。第1のサブセット96のサイズも符号化され信号伝達することができる。サイズは、第1のサブセット96の最後の行及び最後の列でもよい。変数A001が量子化行列94の(0,0)に位置すると想定すると、これは(7,7)である。このサブセットは正方形なので、1つの変数だけを信号伝達する必要がある可能性がある(例えば7)。正方形でないサブセットについて、最後の行及び最後の列の値は、符号化されて信号伝達することができる。
一部の例では、第2のサブセット98のエントリの値は、第2のサブセット98のエントリの値を予測するために利用されなくてもよい。第2のサブセットは、量子化行列値A009と、A257と、A1024とを含み、特に、点線によって境界が付けられている。楕円は追加的な量子化行列値を表し、図のサイズを減らすために使用されている。言い換えると、第2のサブセット98のエントリの値は、第2のサブセットのエントリの係数値から計算される構文要素を利用せずに予測することができる。他の一部の例では、より詳細には以下に説明するように、第2のサブセット98のエントリの値は、ビデオ符号器からの第2のサブセットの受信されたダウンサンプリングされた値から決定することができる。
一部の例では、第2のサブセット98のエントリの値は、特定の値の上にある量子化行列値の最大又は特定の値の左にある量子化行列値の最大でもよい。左又は上の値が存在しない場合、左又は上の値はゼロであると想定される。例えば、量子化行列の第2のサブセットの係数値を予測するために、ビデオ符号器20又はビデオ復号器30は、座標位置[x−1,y]の左にある量子化行列のエントリの係数値、及び座標位置[x,y−1]の上にある量子化行列のエントリの係数値の大きい方として、座標位置[x,y]で第2のサブセットの現在のエントリについて係数値を設定することができる(nかけるnの量子化行列において、左上の角は[0,0]であり、右下の角は[n,n]であると想定する)。
一部の例では、第1のサブセット96のエントリの値は、ラスタースキャン順に予測することができる。しかし、他のスキャン順を使用することができる。この例では、量子化行列自体の値を信号伝達するのではなく、現在の量子化行列値と、ラスタースキャン順に沿った以前の量子化行列値との間の差が信号伝達される。量子化行列値は、一般的に、水平及び垂直方向に増加するため、提案された予測値(即ち上及び左の量子化行列値)に対する予測誤差(即ちスキャン順に沿った現在及び以前の量子化行列値の間の差)は、ほぼ常に負ではない。非対称の量子化行列が使用される場合、この提案された予測方式はうまく機能するが、ジグザグに基づくスキャンは、同じほどには効果的ではないだろうことに注意されたい。
一部の例では、予測誤差は、ゴロムコードを使用して符号化される。ゴロムコードパラメータは、(固定又は可変長コードを使用して)符号化されたビデオビットストリームで符号器によって含めることができるか、又は符号器と復号器の両方に認識させることができる。予測誤差を符号化するために、指数関数的なゴロムコード化など、他の方法を使用することが可能である。予測誤差にはわずかに広がる性質があるため、ゴロムコードが望ましい場合がある。時々発生する負の値を符号化できるように、再マッピング方法を用いることができる。
一部の例では、第2のサブセットの予測された係数値の1つ又は複数は、第2のサブセットの他の予測された係数値から予測することができる。例えば、第2のサブセットの一部でもある量子化行列のエントリの係数値は、第2のサブセットの現在のエントリの上にある場合があり、第2のサブセットの一部でもある量子化行列のエントリの係数値は、第2のサブセットの現在のエントリの左にある場合がある。この例では、現在のエントリの係数値を予測するために使用できるエントリに対する係数値は、予測された値自体でもよい。その理由は、これらのエントリは、第2のサブセットの一部でもあり、第2のサブセットのエントリに対する係数値は全て予測することができるためである。ビデオ符号器20及びビデオ復号器30は、サブセットの外(例えば第2のサブセット内)にある量子化エントリを全て導き出すために、このプロセスを使用することができる。量子化行列及び再構築された量子化行列を示す図が、図5及び図6に示されており、より詳細には以下に説明する。
図4に戻ると、一例として、A009の上では値は利用可能ではないので、第2のサブセット98の係数A009の値は、第1のサブセット96の係数A008に等しいことが予測される。A257の左では値が利用可能ではないので、第2のサブセット98の係数A257の値は、第1のサブセット96の係数A225に等しいことが予測される。第2のサブセット98の係数A042の値は、両方とも第2のサブセット98にある係数A010及び係数A041の値のより大きい方であると予測される。この例では、係数A010及びA041の値は、両方の係数が第2のサブセット98にあるので、予測された値である。
図5は、上に説明した技術に従って予測を使用して信号伝達できる例示的な値を用いる量子化行列を示す図である。図6は、本開示の1つ又は複数の例示的な技術を利用する再構築された量子化行列を示す図である。例えば、例を示す目的のために、図5は、8×8行列である量子化行列100を示している。この例では、ビデオ符号器20は、量子化行列100の第1の5×5エントリに対する値を信号伝達することができる(太線で示す)。例えば、この例では、量子化行列100の第1のサブセット101は、第1の5×5の値である。これが意味するのは、この例では、ゼロベースの行列を想定すると、last_row及びlast_colの値はそれぞれ4であるということである。第1のサブセット101が正方形なので、ビデオ符号器20は、5の値のみを信号伝達することができる(例えば、last_row及びlast_colの値が同じであるので)。量子化行列100の残りの値(即ち第1のサブセット101の外の値)は、第2のサブセットにあると考えられる。
図6は、再構築された量子化行列102を示している。この例では、ビデオ復号器30(又は再構成ループのビデオ符号器20)は、再構築された量子化行列102を生成するために例示的な技術の1つを利用することができる。例えば、ビデオ復号器30及びビデオ符号器20は、現在の係数に関して左の係数と上の係数との間の最大を使用することによって、量子化行列値の第2のサブセットの値を決定する技術を利用することができる。
再構築された量子化行列102は、この技術の結果を示している。例えば、第1のサブセット103の第1の5×5エントリは、これらの値は明示的に信号伝達されるため、量子化行列100の第1のサブセット101の第1の5×5エントリと同じである。残りの値(例えば、第1のサブセット103の外の第2のサブセットの値)は、現在の係数に関して上及び左の係数の最大を決定することから得られる。
一部の例では、上に説明した予測及びラスタースキャンの代わりに、他のスキャン及び/又は予測を使用することができる。あるいは、サブセットの外の量子化行列エントリ(例えば第2のサブセットの係数値)は、最大許容量子化行列値など定数値に設定することができる。そのような定数値は、ビデオ符号器からビデオ復号器にビットストリームで信号伝達することができるか、又はビデオ符号器及びビデオ復号器を定数値でプリプログラムすることができる。
一部の例では、ビデオ復号器30によって実行されるように、ビデオ符号器20は、第2のサブセットの値を同様に予測することができる。例えば、ビデオ符号器20は、第2のサブセットの値を予測し、第2のサブセットの予測された値で第2のサブセットの値を置き換えることができる。このように、ビデオ符号器側及びビデオ復号器側で使用される量子化行列は、同じでもよい。
一部のビデオコード化の例では、明示的に信号伝達されない量子化行列エントリ(即ち、長方形(0,0)から(last_row,last_col)の外のエントリ、第2のサブセットの値)を決定するために、量子化行列値の定数値又は第1のサブセットからの予測を使用することが十分でない場合がある。以下に、第2のサブセットの値を決定するために、異なる行列に対する値を使用する、ダウンサンプリングされた値を使用するなど、量子化行列値を信号伝達するための他の例について説明する。
一例として、明示的に信号伝達されないエントリ(例えば第2のサブセットの値)は、異なる行列(例えばサイズがより小さい量子化行列)から得られる。一例として、このサイズがより小さい量子化行列は、ビデオ符号器が信号伝達するビットストリームですでにコード化されている場合がある。一部の例では、異なる行列は量子化行列でもよい。ビデオ符号器20は、以前にこの異なる行列を信号伝達したことがある場合がある。
例えば、ビデオ符号器は、4×4、8×8、16×16、又は32×32を含むサイズの量子化行列など、異なる量子化行列に対する値を信号伝達することができる。この例では、ビデオ復号器30は、現在の量子化行列を再構築するために、以前にビットストリームで符号化された量子化行列のいずれかから係数値を利用することができる。例えば、再構築されることになっている量子化行列が32×32量子化行列であると想定する。この例では、ビデオ符号器20は、32×32量子化行列の第1のサブセットの係数値を信号伝達することができる。ビデオ復号器は、サイズ4×4、8×8、又は16×16の量子化行列をすでに受信したと想定すると、ビデオ復号器は、32×32量子化行列を再構築するために、第2のサブセットの値を決定するために4×4、8×8、又は16×16の量子化行列を利用することができる。
一部の例では、32×32量子化行列を再構築するために、4×4、8×8、又は16×16の量子化行列のいずれかを使用することが可能な場合がある。例えば、32×32量子化行列を再構築するために、ビデオ復号器30は、8×8量子化行列を使用することができ、8×8量子化行列は、再構成に4×4量子化行列を使用した再構築された量子化行列でもよい。しかし、量子化行列のそのような階層状の再構成は、全ての例において必要とは限らない。例えば、ビデオ符号器20は、32×32量子化行列を再構築するためにビデオ復号器30が使用する8×8量子化行列の全体を信号伝達することができる。32×32量子化行列の値の一部は信号伝達することができる一方、他の値は、より小さな行列の1つ又は複数から再構築することができる。
加えて、一部の例では、ビデオ符号器は、より小さな行列のサイズを信号伝達することができる(例えば第1のサブセット)。別の実施例では、ビデオ復号器30及びビデオ符号器20は、より小さい行列のサイズでプリプログラムすることができる(例えば、より小さい行列のサイズは、ビデオ符号器20及びビデオ復号器30に先験的に認識されていてもよい)。
具体的な一例として、量子化行列は32×32であり、last_row=14、last_col=14であることを想定する。この例では、ビデオ符号器20は、32×32量子化行列の最低の15×15エントリに対する値を信号伝達する。ビデオ復号器30が、インデックス(r,c)の行列エントリに対する値を導き出していると想定する。ここでr>=15又はc>=15である。この例では、量子化行列値を導き出すために、ビデオ復号器は、よりサイズが小さい量子化行列の場合がある異なる行列(例えば、8×8行列)からの値を使用することができる。
ビデオ復号器30は、第2のサブセットに対する値を決定するために、より小さいサイズの量子化行列を使用する異なる方法を利用することができる。例えば、ビデオ復号器は、量子化行列のサイズと、異なるより小さいサイズの行列のサイズとの間の比を決定することができる。ビデオ復号器30は、その値が比を用いて決定される量子化行列内のエントリの場所座標を分割することができ(例えば第2のサブセットのエントリに対する値)、異なるより小さいサイズの行列の対応する場所を決定するために天井及び床の関数を使用することができる。次いで、ビデオ復号器30は、再構築されている量子化行列の第2のサブセットに対する値を決定するために、異なるより小さいサイズの行列内の識別された場所に対応する異なるサイズがより小さい行列の値を使用することができる。
Figure 2014535250
L=floor(r/4)、rH=ceil(r/4)、cL=floor(c/4)、及びcH=ceil(c/4)であり、係数4は(32/8)として導き出されるとする。ここで、floor(χ)は、χ以下の最も大きい整数を示している。同様に、ceil(χ)は、χ以上の最も小さい整数を示している。
Figure 2014535250
8×8量子化行列全体が復号器に送られた場合、再構築された8×8行列は、オリジナルの8×8量子化行列と同じである。双直線補間又は他のより高度な補間技術、及び/又はより長い補間フィルタを使用することができる。欠けている値を得られる行列のサイズは、ビットストリームで信号伝達することができるか、又はビデオ符号器及びビデオ復号器に先験的に認識されていてもよい。より小さい行列(例えば第1のサブセット)の値も、ビットストリームにも含まれていてもよい。
AVC/H.264では、ジグザグスキャン及び差分パルス符号変調(DPCM、即ちスキャン順に最終値からの予測)が使用される。次いで、量子化行列値がゼロにコード化されている場合、これは、それ以上は量子化行列値がコード化されないこと、及び最後にコード化された正の量子化行列値が繰り返されることを示している。そのような場合は、すでに説明したように、最後にコード化された量子化行列値を繰り返す代わりに、残りの量子化行列値をより小さいサイズの量子化行列から得ることができる。
上記のように、一部の例では、ビデオ復号器30は、第2のサブセットの値に基づいて、任意の構文要素を受信することなく、第2のサブセットの値を決定することができる。しかし、第2のサブセットの量子化行列値を信号伝達することを回避するのは、全ての例において有益とは限らない場合がある。つまり、量子化行列のより高い周波数成分に対して少なくとも一部の量子化行列値を信号伝達することは(例えば、値の第2のサブセットのもの)、再構築された量子化行列においてコード化効率と誤差との間でより良好なトレードオフを提供することができる。
本開示の別の例では、より詳細に以下に説明するように、ビデオ符号器20は、量子化行列値のサブセットの値をダウンサンプリングし、ダウンサンプリングされた値を信号伝達することができる。ビデオ復号器は、ビデオ復号器側で量子化行列を再構築するために必要な値を決定するために、ダウンサンプリングされた値をアップサンプリングすることができる。ダウンサンプリングされた値には、オリジナルの値と比較して、より少ないデータがある場合があり、ダウンサンプリングされた値を信号伝達することによって、量子化行列のために信号伝達されるデータの量を減らすことができる。
ダウンサンプリングの一例では、量子化行列のサブセットの外の値(例えば(0,0)から(last_row,last_col)の値、即ち第2のサブセットの値)は、特定の係数(例えば2)によってダウンサンプリングすることができ、ダウンサンプリングされた値は、損失がない方法でビットストリームでコード化することができる。ダウンサンプリングされた値をコード化するために、AVC/H.264、JCTVC−F085、JCTVC−E073、又は米国特許出願第13/649,836号に記述されている技術に記述されているような任意のコード化方式を使用することができる。ダウンサンプリングは、単純な平均算出(例えば、N×N領域の量子化行列値の平均算出)を使用して、又はより高度なフィルタ及び/又は等式を使用して実行することができる。ビデオ符号器20とビデオ復号器30の両方は、第1のサブセットの外の値を生成するために、コード化された値のアップサンプリングを使用することができる(例えば、第2のサブセットに対する値)。アップサンプリングの技術は単純な画素複製を使用することができる(即ち、ダウンサンプリングされた領域内の全ての座標に対して、ダウンサンプリングされた値又はより高度な技術を使用することができる)。例えば、ダウンサンプリングされた量子化行列値は、ダウンサンプリングされたイメージと同様に処理することができる。次いで、ダウンサンプリングされた量子化行列をアップサンプリングするために、双直線補間、バイキュービック補間など、イメージのアップサンプリングを実行するために当技術分野で知られている技術を使用することができる。
上記のように、ビデオ符号器20は、第1のサブセットの係数値を明示的に信号伝達し、何らかの形の予測を使用して、第2のサブセットに対して係数値を決定することができる。以下の例では、第1のサブセットの係数値を信号伝達し、予測を用いて第2のサブセットの値を決定するのではなく、以下の技術により、ビデオ符号器が、異なるレベルの粗さを持つ量子化行列の係数値を信号伝達するコード化されたビットストリームを生成することを可能にできる場合がある。例えば、量子化行列のより低い周波数成分に対応する係数値は、損失なく(即ち明示的に)信号伝達することができ、(例えば第2のサブセット、第3のサブセットなどの)他の係数値は、(例えば異なるダウンサンプリング係数を使用することによって)ますます粗く信号伝達することができる。より低い周波数位置に対応する係数値は、一般的に、量子化行列の起点に隣接して配置される(例えば、係数値に対する行及び列のインデックスは(0,0)に隣接する)。一般的に、以下の技術により、量子化行列値が量子化行列のどこに位置するかに基づいて、ビデオ符号器が、不均一な量のダウンサンプリングを量子化行列値に適用することが可能になる。
この例の技術は、量子化行列の起点から更に離れて配置された係数値が、量子化行列の起点により隣接して配置された係数値より粗く近似される方式を提供することができる。この例では、近似された量子化行列値(例えば、第2及び/又は第3のサブセット以上)は、ビットストリームでコード化され、信号伝達することができる。
しかし、一部の代替例では、第1のサブセットの係数値に対して以下の技術を利用することが可能な場合があり、ここで第1のサブセットは、上で説明しものに類似している。これらの代替例では、技術は、上記の例の技術のいずれかを使用して、第2のサブセットに対して係数値を決定することができる。
例えば、量子化行列の起点の近くの領域に位置する量子化行列値について(例えば、(0,0)に近い第1のサブセット)、ビデオ符号器20は、ダウンサンプリングを適用しなくてもよい(即ち、ダウンサンプリング係数1を適用)この領域で、全ての量子化行列値が信号伝達される。量子化行列の係数値の場所が量子化行列の起点から更に遠い場合(例えば第1のサブセットの外の第2のサブセット)、ビデオ符号器20は、より高いレベルのダウンサンプリングを適用することができる(例えば、ダウンサンプリング係数2、3、4などを適用)。1を超えるダウンサンプリング係数は、1つの値によって表される係数値の数を示すことができる。一例として、ダウンサンプリング係数2は、再構成に画素反復が使用される場合、量子化行列の22(即ち4)の係数値を各符号化された値によって表すことができることを意味する場合がある。同様に、ダウンサンプリング係数4は、再構成に画素反復が使用される場合、量子化行列の24(即ち16)の係数値を各符号化された値によって表すことができることを意味する場合がある。
上記のように、ダウンサンプリング係数に従って計算された値は単純な平均でもよい。例えば、符号器側で、ダウンサンプリング係数2について、2×2正方形の4つの量子化行列値が平均され、それら4つの量子化行列値の平均が信号伝達される。同様に、ダウンサンプリング係数が4である場合、4×4正方形の16の量子化行列値が平均され、それら16の量子化行列値の平均が信号伝達される。ダウンサンプリングされた値を計算するために、他のより高度な等式又はフィルタ技術を使用することができる。
一部の例では、ビデオ符号器20は、量子化行列内にダウンサンプリング遷移点(例えば境界)を確立することができる。第1の遷移点と量子化行列の起点との間の量子化行列に位置する係数値は、第1のダウンサンプリング係数(1と同じくらい低い場合がある。即ちダウンサンプリングなしを意味する)に従ってダウンサンプリングされ、第1の遷移点と第2の遷移点との間の量子化行列に位置する係数値は、第2のダウンサンプリング係数によってダウンサンプリングすることができ、第2の遷移点と第3の遷移点との間の量子化行列に位置する係数値は、第3のダウンサンプリング係数によってダウンサンプリングすることができる、のように続く。一部の例では、遷移点ごとにダウンサンプリング係数が変化する量は不均一でもよいが、本開示の態様はそのように限定されるものではない。
例えば、一部の例では、量子化行列値のサブセットの場所を示す構文要素は、ビットストリームに含まれていなくてもよい。代わりに、領域の場所は、ビデオ符号器と復号器の両方で先験的に認識されている。ダウンサンプリング係数1を使用することは、以前の例において低い周波数のサブセット値について行ったように、全ての値を送ることに等しい場合がある(例えば、低い周波数のサブセット値は、量子化行列の起点に隣接して配置される値を表している)。加えて、1を超えるダウンサンプリング係数を使用する他の領域について、追加的な量子化行列値をビットストリームに含めることができる。この一例は、16×16ブロックについて図7に示されている。
図7の例では、行と列の両方のインデックスが0<=インデックス<=3の範囲にある場合、ダウンサンプリング係数1が各方向に使用される(即ち、ダウンサンプリングなし)。行と列の両方のインデックスが0<=インデックス<=7の範囲にあるが、両方が0<=インデックス<=3の範囲にあるとは限らない場合、ダウンサンプリング係数2が各方向(行/列)に使用される。全ての残りの値について、ダウンサンプリング係数4が各方向に使用される。図7では、1つの量子化行列値が、番号が付けられた正方形のそれぞれ1つについてコード化される。この値は、対応する正方形に属するオリジナルの16×16量子化行列からの全ての量子化行列値の単純な平均算出によって導き出すことができる。この例では単純な平均算出が使用されているが、より高度なダウンサンプリングフィルタを使用することも可能な場合がある。この領域のダウンサンプリング係数は1であるため、正方形0〜15は、それぞれ1つの量子化行列値に直接的に対応する。この領域のダウンサンプリング係数は2であるため、正方形17〜27は、量子化行列値の2×2ブロックに対応する(即ち4つの量子化行列値)。この領域のダウンサンプリング係数は4であるため、正方形29〜39は、量子化行列値の4×4ブロックに対応する(即ち16の量子化行列値)。正方形内の数値は、ビットストリームで値がコード化されるジグザグスキャン順を表している。
各正方形に対応する1つの量子化行列値は、ビットストリームに含まれていてもよい。これは、各ダウンサンプリング係数について、特定の領域で個別のジグザグスキャンを使用して達成することができる。例えば、ダウンサンプリング係数1に対応する、第1の正方形0〜15は、ジグザグ順にスキャンされる。この後に、ダウンサンプリング係数2に対応する、正方形17〜27のジグザグスキャンが続く。この後に、ダウンサンプリング係数4に対応する、正方形28〜39のジグザグスキャンが続く。より高いダウンサンプリング係数のジグザグスキャンが、より低いダウンサンプリング係数の別のジグザグスキャンの対象である領域に及ぶ場合、値はコード化されない(例えば、正方形16から正方形17に行く場合)。しかし、ダウンサンプリングされた値をコード化するためにDPCMが使用される場合、ジグザグスキャンでの次の値の予測値は、すでにビットストリームでコード化されている、より低いサブサンプリング係数に対する対応する量子化行列値から得ることができる。
例えば、図7では、サブサンプリング係数2に対応するジグザグスキャンについて考える。ジグザグスキャンは、インデックス16及び17を持つ正方形を通る。これら2つの正方形の間には、すでに、サブサンプリング係数1に対応するジグザグスキャンの対象にされている領域がある(正方形11〜15)。従って、この領域はすでにコード化されているため、その領域のビットストリームには値はコード化されない。しかし、DPCMを使用してインデックス17を持つ正方形に対して量子化行列値がコード化されている場合、予測値は、インデックス11、13、14、及び15を持つ正方形に対してすでにコード化されていた値から得られる。この量子化行列値は、最も近い整数へと端数を切り捨てたコード化された値の単純平均でもよい。
ダウンサンプリングされた量子化行列を受信すると、ビデオ復号器30は、それらがビットストリームに含まれているのと同じ順に、係数値に対する量子化行列値を復号することができる。ビデオ復号器30は、量子化行列値のアップサンプリングを実行するために単純な複製を使用することができる。つまり、正方形内の全ての位置は、同じ量子化行列値を使用する。これは、典型的には、その正方形に対応するコード化された値である。より高度なアップサンプリングフィルタを使用することもできる。
他の技術について上に説明したように、ダウンサンプリングされた量子化行列値は、DPCM(スキャンの以前の値からの予測)、続いて署名付き関数的ゴロムコード化を使用してコード化することができる。その領域がより低いサブサンプリング係数に対応するジグザグスキャンによってすでに対象にされていたので、一部の値がコード化されない場合、上に説明するように、次のコード化された値の予測が変更される。任意の他の予測及びコード化方式を使用することもできる。3つのダウンサンプリング係数の代わりに、図7に示すようになど、より少数又はより多くのダウンサンプリング係数及び領域を使用することができる。図8は、8×8ブロックに対して2つのダウンサンプリング係数を用いる例を示しており、ここでブロック0〜15は、ダウンサンプリング係数1を持ち、ブロック17〜27は、ダウンサンプリング係数2を持つ。
上向き対角線など他のタイプのスキャンを使用できることも注意されたい。また、スキャンは逆順でもよい。例えば、最初に、ダウンサンプリング係数3に対応する値をコード化することができる。この後に、ダウンサンプリング係数2に対応する値などが続くことができる。
本開示の特定の一例では、量子化行列のDC係数(即ち位置(0,0)での量子化行列値が、第1のサブセットの唯一の値であり、ダウンサンプリング係数1でダウンサンプリングされる(即ち明示的に信号伝達される)。量子化行列の他の全ての量子化行列値は、第2のサブセットにあると考えられ、2以上の係数でダウンサンプリングされる。図9は、この例に従ってコード化された16×16量子化行列を示している。図9に示すように、正方形0のDC係数は明示的にコード化され(即ちダウンサンプリング係数1)、量子化行列の他の全ての量子化行列値は、係数2でダウンサンプリングされる。係数2でダウンサンプリングされた正方形1は、技術的にDC係数を含んでいることに注意されたい。この特定の2×2ブロックに使用される値は、3つの残りの量子化行列値の平均として(即ち、DC係数以外のもの)、領域において4つの量子化行列値全ての平均として(即ち、DC係数を含む平均)、又は他の一部のフィルタ技術を使用して決定することができる。
本開示の別の例では、32×32ブロックについて、以下のダウンサンプリング遷移点を使用することができる。行と列の両方のインデックスが範囲0<=インデックス<=3にある場合、ダウンサンプリング係数1は、各方向に使用される(即ち、ダウンサンプリングなし)。行と列の両方のインデックスが、範囲が0<=インデックス<=15にあるが、両方が範囲0<=インデックス<=3にあるとは限らない場合、ダウンサンプリング係数2は、各方向(行/列)に使用することができる。全ての残りの値について、ダウンサンプリング係数4を各方向に使用することができる。ダウンサンプリング係数が値を変更する遷移点(例えば1から2又は2から4)及び実際のダウンサンプリング係数は、ビットストリームに含めることができるか、又はビデオ符号器20及びビデオ復号器30の両方で先験的に認識することができる。
本開示の一例では、均一なサンプリングが使用される場合、8×8行列のみをコード化する必要がある。不均一なサンプリングについて、完全な量子化行列(32×32又は16×16)へのより正確な概算が達成されるため、より多くの量子化行列値がコード化される。
均一なサンプリング例について、16×16又は32×32の量子化行列をコード化する代わりに、より小さいサイズ(例えば8×8)の量子化行列がビットストリームでコード化される。次いで、より大きい行列のために量子化行列エントリの値を生成する必要がある場合、補間を使用することができる。最低の8×8周波数など、量子化行列エントリがより低い周波数サブセットの周波数を表している場合、より大きい量子化行列のために量子化行列エントリの値を計算するために、双直線補間が使用される。領域の残りについて、より小さいサイズの量子化行列からの対応する値の複製が使用される。最低の8×8周波数を使用する代わりに、他のサブセットを使用することができる。更に、双直線補間及び画素複製の代わりに、任意の2つの補間法を使用することができる。この技術は、2つを超える領域及び2つを超える補間法へと更に一般化することができる。
図7、図8、及び図9、並びに係数値がダウンサンプリングされる上に説明した例に関して、異なるダウンサンプリング係数が(即ち量子化行列値の異なるサブセットを表す)異なる領域で使用される。各サブセットについて、1つの量子化行列値をブロックごとに信号伝達することができ(例えば、図7〜図9の番号が付けられた正方形)、ここで各ブロックによって表される量子化行列値の数は、特定のサブセットに対するダウンサンプリング係数によって決定される。ダウンサンプリング係数間で切り換えが発生する位置は、ビデオ符号器及びビデオ復号器に認識されてもよいし、又は明示的に信号伝達されてもよい。
言い換えると、上に説明したダウンサンプリング技術は、ビデオ符号器20が、より低い周波数の量子化行列値で損失がなく信号伝達することを可能にすることができ(DC係数の一例)、他の量子化行列値をますます粗く近似することができる。これにより、メモリに量子化行列全体を持つ必要を回避することができ、16×16及び32×32のブロックサイズにとって有益な場合がある(ただし、利点は、異なるサイズのブロックにも適用可能な場合がある)。
上に説明した技術に従って、ビデオ符号器20は、複数の値を含む量子化行列を決定し、ダウンサンプリングされた値の第1の組を生成するために、第1のダウンサンプリング係数によって量子化行列の値の第1の組をダウンサンプリングし、ダウンサンプリングされた値の第2の組を生成するために、第2のダウンサンプリング係数によって量子化行列の値の第2の組をダウンサンプリングし、ダウンサンプリングされた値の第1の組とダウンサンプリングされた値の第2の組とを含むコード化されたビットストリームを生成するように構成することができる。
図2に戻ると、量子化に続いて、エントロピー符号化ユニット56は、量子化された変換係数をエントロピー符号化する。例えば、エントロピー符号化ユニット56は、コンテキスト適応可能な可変長コード化(CAVLC)、コンテキスト適応可能な2進算術コード化(CABAC)、構文ベースのコンテキスト適応可能な2進算術コード化(SBAC)、確率間隔区分化エントロピー(PIPE)コード化、又は別のエントロピー符号化方法若しくは技術を実行することができる。エントロピー符号化ユニット56によるエントロピー符号化に続いて、符号化されたビットストリームは、ビデオ復号器30に送信するか、又はビデオ復号器30によって後の送信若しくは検索のためにアーカイブすることができる。エントロピー符号化ユニット56は、また、コード化される現在のビデオスライスの運動ベクトル及び他の構文要素をエントロピー符号化することができる。
一部の例では、エントロピー符号化ユニット56は、本開示の技術を実行するように動作可能な場合がある。しかし、本開示の態様はそのように限定されない。代替の例では、プロセッサなどビデオ符号器20の他の一部のユニット、又はビデオ符号器20の他のユニットは、本開示の技術を実行するように課することができる。一例として、エントロピー符号化ユニット56は、量子化行列の第1のサブセットのサイズを符号化し、第1のサブセットの係数値を符号化し、量子化行列の第2のサブセットの係数値を予測するように動作可能な場合がある。また、一部の例では、本開示の技術は、ビデオ符号器20のユニットの1つ又は複数の中で分割することができる。
逆量子化ユニット58及び逆変換処理ユニット60は、それぞれ、参照ピクチャの参照ブロックとして、後で使用するために画素領域において残余のブロックを再構築するために、逆量子化及び逆変換を適用する。運動補償ユニット44は、参照ピクチャリストの1つ内の参照ピクチャの1つの予測的なブロックに、残余のブロックを追加することによって、参照ブロックを計算することができる。運動補償ユニット44は、また、運動推定で使用される下位整数画素値を計算するために、再構築された残余ブロックに1つ又は複数補間フィルタを適用することができる。加算器62は、参照ピクチャメモリ64に格納するために参照ブロックを生成するために、運動補償ユニット44によって生成された運動補正された予測ブロックに再構築された残余ブロックを追加する。参照ブロックは、続くビデオフレーム又はピクチャにおいてブロックをインター予測するために、参照ブロックとして運動推定ユニット42及び運動補償ユニット44によって使用することができる。
図3は、本開示で説明した技術を実装できる例示的なビデオ復号器30を示すブロック図である。図3の例では、ビデオ復号器30は、エントロピー復号ユニット80と、予測処理ユニット81と、逆量子化ユニット86と、逆変換ユニット88と、加算器90と、参照ピクチャメモリ92とを含む。予測処理ユニット81は、運動補償ユニット82とイントラ予測処理ユニット84とを含む。ビデオ復号器30は、一部の例では、図2からのビデオ符号器20に関して説明した符号化段階に一般的に相互関係がある復号段階を実行することができる。
復号プロセスの間に、ビデオ復号器30は、ビデオ符号器20から符号化されたビデオスライスのビデオブロック、及び関連する構文要素を表す符号化されたビデオビットストリームを受信する。ビデオ復号器30のエントロピー復号ユニット80は、量子化された係数と、運動ベクトルと、他の構文要素とを生成するためにビットストリームをエントロピー復号する。エントロピー復号ユニット80は、運動ベクトルと他の構文要素とを予測処理ユニット81に転送する。ビデオ復号器30は、ビデオスライスレベル及び/又はビデオブロックレベルで構文要素を受信することができる。
一部の例では、エントロピー復号ユニット80は、本開示の技術を実行するように動作可能な場合がある。しかし、本開示の態様はそのように限定されない。代替の例では、プロセッサなどビデオ復号器30の他の一部のユニット、又はビデオ復号器30の他のユニットは、本開示の技術を実行するように課すことができる。一例として、エントロピー復号ユニット80は、量子化行列の第1のサブセットのサイズを復号し、第1のサブセットの係数値を復号し、量子化行列の第2のサブセットの係数値を予測するように動作可能な場合がある。また、一部の例では、本開示の技術は、ビデオ復号器30のユニットの1つ又は複数の中で分割することができる。
ビデオスライスがイントラ符号化(I)されたスライスとしてコード化される場合、予測処理ユニット81のイントラ予測処理ユニット84は、信号伝達されたイントラ予測モード、及び現在のフレーム又はピクチャの以前に復号されたブロックからのデータに基づいて、現在のビデオスライスのビデオブロックのための予測データを生成することができる。ビデオフレームがインターコード化(即ちB、P、又はGPB)されたスライスとしてコード化される場合、予測処理ユニット81の運動補償ユニット82は、エントロピー復号ユニット80から受信された運動ベクトル及び他の構文要素に基づいて、現在のビデオスライスのビデオブロックについて予測的なブロックを作成する。予測的なブロックは、参照ピクチャリストの1つ内の参照ピクチャの1つから作成することができる。ビデオ復号器30は、参照ピクチャメモリ92に格納された参照ピクチャに基づいて、デフォルト構造技術を使用して、参照フレームリスト、リスト0及びリスト1を構成することができる。
運動補償ユニット82は、運動ベクトル及び他の構文要素を解析することによって、現在のビデオスライスのビデオブロックの予測情報を決定し、復号されている現在のビデオブロックについて予測的なブロックを作成するために予測情報を使用する。例えば、運動補償ユニット82は、ビデオスライスのビデオブロックをコード化するために使用される予測モード(例えばイントラ又はインター予測)と、インター予測のスライスタイプ(例えばBスライス、Pスライス、又はGPBスライス)と、スライスの参照ピクチャリストの1つ又は複数の構築情報と、スライスの各インター符号化されたビデオブロックの運動ベクトルと、スライスの各インターコード化されたビデオブロックのインター予測ステータスと、現在のビデオスライスのビデオブロックを復号するための他の情報とを決定するために受信された構文要素の一部を使用する。
運動補償ユニット82は、また、補間フィルタに基づいて補間を実行することができる。運動補償ユニット82は、参照ブロックの下位整数画素に対する補間された値を計算するために、ビデオブロックの符号化の間にビデオ符号器20によって使用されるような補間フィルタを使用することができる。この場合、運動補償ユニット82は、受信された構文要素からのビデオ符号器20によって使用される補間フィルタを決定し、予測的なブロックを作成するために補間フィルタを使用することができる。
逆量子化ユニット86は、ビットストリームで提供され、エントロピー復号ユニット80によって復号される、量子化された変換係数を逆量子化、即ち逆量子化する。逆量子化プロセスは、量子化の程度、及び同様に適用されるべき逆量子化の程度を決定するために、ビデオスライスの各ビデオブロックのビデオ符号器20によって計算され信号伝達される量子化パラメータ及び/又は量子化行列の使用を含むことができる。特に、逆量子化ユニット86は、上に説明した技術に従ってコード化された、受信された量子化行列を復号するように構成することができる。特に、ビデオ復号器30は、本開示の技術に従ってダウンサンプリングされた、受信された量子化行列をアップサンプリングするように構成することができる。
本開示の一例では、ビデオ復号器30は、コード化されたビットストリームのダウンサンプリングされた値でコード化された量子化行列を受信し、値の第1の組を生成するために、第1のアップサンプリング係数によって量子化行列のダウンサンプリングされた値の第1の組をアップサンプリングし、値の第2の組を生成するために、第2のアップサンプリング係数によって量子化行列のダウンサンプリングされた値の第2の組をアップサンプリングし、値の第1及び第2の組で変換係数のブロックを逆量子化するように構成することができる。
逆変換処理ユニット88は、画素領域において残余のブロックを作成するために、例えば、逆DCT、逆整数変換、又は概念的に同様の逆変換プロセスなどの逆変換を変換係数に適用する。
運動補償ユニット82が運動ベクトル及び他の構文要素に基づいて現在のビデオブロックについて予測的なブロックを生成した後、ビデオ復号器30は、運動補償ユニット82によって生成された対応する予測的なブロックを用いて、逆変換処理ユニット88からの残余のブロックを加算することによって、復号されたビデオブロックを形成する。加算器90は、この加算演算を実行するコンポーネント(複数可)を表している。望まれる場合は、デブロッキングフィルタは、また、ブロックノイズアーティファクトを取り除くために復号されたブロックをフィルタするために適用することができる。他のループフィルタは(コード化ループで、又はコード化ループの後)、また、画素移行を平滑化するか、又は他の場合にはビデオ品質を向上させるために使用することができる。次いで、所与のフレーム又はピクチャの復号されたビデオブロックは、続く運動補償に使用される参照ピクチャを格納する、参照ピクチャメモリ92に格納される。参照ピクチャメモリ92は、また、図1の表示装置32など表示装置に後に表示するために復号されたビデオを格納する。
図10は、本開示の技術に従ったビデオ符号化方法を示す流れ図である。図10の方法は、ビデオ符号器20によって実行することができる。ビデオ符号器20は、複数の値を含む量子化行列を決定し(920)、ダウンサンプリングされた値の第1の組を生成するために、第1のダウンサンプリング係数によって量子化行列の値の第1の組をダウンサンプリングし(922)、ダウンサンプリングされた値の第2の組を生成するために、第2のダウンサンプリング係数によって量子化行列の値の第2の組をダウンサンプリングする(924)ように構成することができる。
本開示の一例では、ビデオ符号器20は、量子化行列の値の第1の組の場所に基づいて第1のダウンサンプリング係数を決定し、量子化行列の値の第2の組の場所に基づいて第2のダウンサンプリング係数を決定することができる。特定の例では、値の第1の組は、量子化行列の場所(0,0)の値のみを含み、ここで第1のダウンサンプリング係数は1に決定され、ここで第2のダウンサンプリング係数は2及び4の1つであると決定される。
ビデオ符号器20は、量子化行列値がどのようにダウンサンプリングされるかを決定するために、量子化行列の遷移点を決定するように構成することができる。一例では、ビデオ符号器20は、量子化行列の第1の遷移点を決定することであって、第1の遷移点と量子化行列の起点との間に位置する値は、ダウンサンプリングされない、決定することと、量子化行列の第2の遷移点を決定することであって、量子化行列の値の第1の組は、第1の遷移点と第2の遷移点との間に位置する、決定することと、量子化行列の第3の遷移点を決定することであって、量子化行列の値の第2の組は、第2の遷移点と第3の遷移点との間に位置する、決定することとを行うように構成することができる。ビデオ符号器20は、第1、第2、及び第3の遷移点と、コード化されたビットストリームの第1及び第2のダウンサンプリング係数とを信号伝達するように構成することができる。
本開示の一例では、ビデオ符号器20は、ダウンサンプリングされた値の第1及び第2組のスキャン順に沿った以前のダウンサンプリングされた値からダウンサンプリングされた値の第1及び第2の組のスキャン順に沿ったダウンサンプリングされた値の1つを予測することによって、ダウンサンプリングされた値を信号伝達するように構成することができ、ここで第1の組のダウンサンプリングされた値は、第2の組のダウンサンプリングされた値を予測するために使用することができる。
本開示の別の例では、量子化行列の値の第1の組のダウンサンプリングは、ダウンサンプリングされた値の第1の組の値を生成するために、値の第1の組の量子化行列値の第1の数を平均することを備え、ここで第1の数は、第1のダウンサンプリング係数から決定され、ここで量子化行列の値の第2の組のダウンサンプリングは、ダウンサンプリングされた値の第2の組の値を生成するために、値の第2の組の量子化行列値の第2の数を平均することを備え、ここで第2の数は、第2のダウンサンプリング係数から決定される。
ビデオ符号器20は、量子化された変換係数を形成するために、量子化行列に従って変換係数のブロックの変換係数の値を量子化するように更に構成することができる(926)。ビデオ符号器20は、ダウンサンプリングされた値の第1の組とダウンサンプリングされた値の第2の組とを含むコード化されたビットストリームを生成するように更に構成することができる(928)。
図11は、本開示の技術に従ったビデオ復号方法を示す流れ図である。図11の方法は、ビデオ復号器30によって実行することができる。ビデオ復号器30は、コード化されたビットストリームのダウンサンプリングされた値でコード化された量子化行列を受信し(1020)、値の第1の組を生成するために、第1のアップサンプリング係数によって量子化行列のダウンサンプリングされた値の第1の組をアップサンプリングし(1022)、値の第2の組を生成するために、第2のアップサンプリング係数によって量子化行列のダウンサンプリングされた値の第2の組をアップサンプリングし(1024)、値の第1及び第2の組で変換係数のブロックを逆量子化する(1026)ように構成することができる。
本開示の一例では、ビデオ復号器30は、量子化行列のダウンサンプリングされた値の第1の組の場所に基づいて、第1のアップサンプリング係数を決定し、量子化行列のダウンサンプリングされた値の第2の組の場所に基づいて、第2のアップサンプリング係数を決定するように構成することができる。特定の例では、ダウンサンプリングされた値の第1の組は、量子化行列の場所(0,0)の値のみを含み、ここで第1のアップサンプリング係数は1であると決定され、第2のアップサンプリング係数は、2及び4の1つであると決定される。
本開示の別の例では、ビデオ復号器30は、量子化行列の第1の遷移点を決定することであって、第1の遷移点と量子化行列の起点との間に位置する量子化行列の値はダウンサンプリングされない、決定することと、量子化行列の第2の遷移点を決定することであって、量子化行列のダウンサンプリングされた値の第1の組は、第1の遷移点と第2の遷移点との間に位置する、決定することと、量子化行列の第3の遷移点を決定することであって、量子化行列のダウンサンプリングされた値の第2の組は、第2の遷移点と第3の遷移点との間に位置する、決定することとを行うように構成することができる。この例では、第1、第2、及び第3の遷移点と、第1及び第2のダウンサンプリング係数とは、コード化されたビットストリームで受信される。
本開示の別の例では、ビデオ復号器30はダウンサンプリングされた値の第1及び第2の組のスキャン順に沿った以前のダウンサンプリングされた値からダウンサンプリングされた値の第1及び第2の組のスキャン順に沿ったダウンサンプリングされた値の各連続する1つを予測するように構成され、第1の組のダウンサンプリングされた値は、第2の組のダウンサンプリングされた値を予測するために使用することができる。
本開示の別の例では、量子化行列の値の第1の組をアップサンプリングすることは、値の第1の組の第1の数に対するダウンサンプリングされた値の第1の組のダウンサンプリングされた値を複製することを備え、第1の数は、第1のアップサンプリング係数から決定され、量子化行列の値の第2の組をアップサンプリングすることは、値の第2の組の第2の数に対するダウンサンプリングされた値の第2の組のダウンサンプリングされた値を複製することを備え、第2の数は、第2のアップサンプリング係数から決定される。
本開示の一例では、ダウンサンプリングされた値の第1及び第2の組をアップサンプリングするために、異なるアップサンプリング技術が使用される。特定の例では、値の少なくとも第1及び第2の組は、双直線補間を使用してアップサンプリングされる。
ビデオ復号器30は、ビデオデータの残余のブロックを形成するために変換係数の逆量子化されたブロックを逆変換し、ビデオデータの復号されたブロックを形成するためにビデオデータの残余のブロックに対して予測プロセスを実行するように更に構成することができる。
1つ又は複数の例では、説明した機能は、ハードウェア、ソフトウェア、ファームウェア、又はそれらの任意の組合せに実装することができる。ソフトウェアに実装した場合、機能は、1つ又は複数の命令又はコードとして、コンピュータ可読媒体に格納されるか、又はコンピュータ可読媒体を通じて送信され、ハードウェアベースの処理ユニットによって実行することができる。コンピュータ可読媒体は、データ記憶媒体など有形媒体に対応する、コンピュータ可読記憶媒体、又は例えば通信プロトコルに従って、ある場所から他の場所にコンピュータプログラムの転送を促進する任意の媒体を含む通信媒体を含むことができる。このようにして、コンピュータ可読媒体は、一般的に、(1)非一時的な有形のコンピュータ可読記憶媒体又は(2)信号若しくは搬送波などの通信媒体に対応することができる。データの記憶媒体は、本開示に説明した技術を実装するために、命令、コード、及び/又はデータ構造を取得するために、1つ以上のコンピュータ又は1つ以上のプロセッサによってアクセスできる任意の利用可能な媒体でもよい。コンピュータプログラム製品は、コンピュータ可読媒体を含むことができる。
限定を目的とせずに例を挙げると、そのようなコンピュータ可読記憶媒体は、RAM、ROM、EEPROM(登録商標)、CD−ROM又は他の光学ディスク記憶装置、磁気ディスク記憶装置若しくは他の磁気記憶装置、フラッシュメモリ、又は命令若しくはデータ構造の形で望まれるプログラムコードを格納するために使用でき、コンピュータによってアクセスできる他の媒体を備えることができる。また、どのような接続も正しくはコンピュータ可読媒体と呼ばれる。例えば、同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者線(DSL)、又は赤外線、無線、及びマイクロ波などの無線技術を使用して、命令がウェブサイト、サーバ又は他の遠隔発信源から伝送される場合、同軸ケーブル、光ファイバケーブル、ツイストペア、DSL、又は赤外線、無線、及びマイクロ波など無線技術は、媒体の定義に含まれる。しかし、コンピュータ可読記憶媒体及びデータの記憶媒体は、接続、搬送波、信号、又は他の一時的な媒体を含まないが、その代わりに、非一時的で有形の記憶媒体を示していることを理解するべきである。本明細書に使用する場合、ディスク(disk)及びディスク(disc)は、コンパクトディスク(CD)、レーザーディスク(登録商標)、光ディスク、デジタルバーサタイルディスク(DVD)、フロッピー(登録商標)ディスク、及びBlu−ray(登録商標)ディスクを含み、ここでディスク(disk)は通常、磁気的にデータを再生する一方、ディスク(disc)は、レーザーを用いてデータを光学的に再生する。上記の組合せも、コンピュータ可読媒体の範囲内に含まれている。
命令は、1つ又は複数のデジタル信号プロセッサ(DSP)、汎用マイクロプロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラマブルロジックアレイ(FPGA)又は他の等しい統合されているか個別の論理回路など1つ又は複数のプロセッサによって実行することができる。従って、「プロセッサ」という用語は、本明細書に使用する場合、前述の構造のいずれか又は本明細書で説明した技術の実装に適した任意の他の構造を表すことができる。加えて、一部の態様では、本明細書で説明した機能は、符号化及び復号のために構成された専用ハードウェア及び/又はソフトウェアモジュール内に提供することも、又は組み合わせたコーデックに組み込むこともできる。また、技術は、1つ以上の回路又は論理素子に完全に実装することができる。
本開示の技術は、ワイヤレスハンドセット、集積回路(IC)、又は1組のIC(例えばチップセット)を含む、多種多様な機器又は装置に実装することができる。開示された技術を実行するように構成された機器の機能的な態様を強調するために、様々なコンポーネント、モジュール、又はユニットについて本開示で説明しているが、必ずしも異なるハードウェアユニットによって実現する必要があるとは限らない。むしろ、上記のように、各種ユニットは、コーデックハードウェアユニットに組み合わせることも、又は適切なソフトウェア及び/又はファームウェアに関連して、上に説明するような1つ又は複数のプロセッサを含む、相互に機能するハードウェアユニットの集合によって提供することもできる。
様々な例について説明してきた。これら及び他の例は、以下の特許請求の範囲に入るものである。
様々な例について説明してきた。これら及び他の例は、以下の特許請求の範囲に入るものである。
以下に、出願当初の特許請求の範囲に記載された発明を付記する。
[C1]
ビデオデータを符号化する方法であって、
複数の値を含む量子化行列を決定することと、
ダウンサンプリングされた値の第1の組を生成するために、第1のダウンサンプリング係数によって前記量子化行列の値の第1の組をダウンサンプリングすることと、
ダウンサンプリングされた値の第2の組を生成するために、第2のダウンサンプリング係数によって前記量子化行列の値の第2の組をダウンサンプリングすることと、
前記ダウンサンプリングされた値の第1の組と前記ダウンサンプリングされた値の第2の組とを含むコード化されたビットストリームを生成することと
を備える方法。
[C2]
前記量子化行列の前記値の第1の組の位置に基づいて前記第1のダウンサンプリング係数を決定することと、
前記量子化行列の前記値の第2の組の位置に基づいて前記第2のダウンサンプリング係数を決定することと
を更に備えるC1に記載の方法。
[C3]
前記値の第1の組は、前記量子化行列の位置(0,0)の値のみを含み、前記第1のダウンサンプリング係数は1に決定され、前記第2のダウンサンプリング係数は2及び4の一方であると決定されるC2に記載の方法。
[C4]
前記量子化行列は、16×16又は32×32のサイズを持つC3に記載の方法。
[C5]
前記量子化行列の第1の遷移点を決定することと、前記第1の遷移点と前記量子化行列の起点との間に位置する値はダウンサンプリングされない、
前記量子化行列の第2の遷移点を決定することと、前記量子化行列の前記値の第1の組は、前記第1の遷移点と前記第2の遷移点との間に位置する、
前記量子化行列の第3の遷移点を決定することと、前記量子化行列の前記値の第2の組は、前記第2の遷移点と前記第3の遷移点との間に位置する、
前記コード化されたビットストリームで、前記第1、第2、及び第3の遷移点と、前記第1及び第2のダウンサンプリング係数とを信号伝達することと
を更に備えるC1に記載の方法。
[C6]
前記ダウンサンプリングされた値の第1及び第2の組のスキャン順に沿った以前のダウンサンプリングされた値から前記ダウンサンプリングされた値の第1及び第2の組の前記スキャン順に沿った前記ダウンサンプリングされた値の1つを予測することを更に含み、前記第1の組のダウンサンプリングされた値は、前記第2の組のダウンサンプリングされた値を予測するために使用することができる、C1に記載の方法。
[C7]
前記量子化行列の前記値の第1の組のダウンサンプリングは、前記ダウンサンプリングされた値の第1の組の値を生成するために、前記値の第1の組の量子化行列値の第1の数を平均化することを備え、前記第1の数は、前記第1のダウンサンプリング係数から決定され、
前記量子化行列の前記値の第2の組のダウンサンプリングは、前記ダウンサンプリングされた値の第2の組の値を生成するために、前記値の第2の組の量子化行列値の第2の数を平均化することを備え、前記第2の数は、前記第2のダウンサンプリング係数から決定される
C1に記載の方法。
[C8]
残余のビデオデータのブロックを形成するために、ビデオデータのブロックに対して予測プロセスを実行することと、
変換係数のブロックを形成するために、前記残余のビデオデータを変換することと、
量子化された変換係数を形成するために、前記量子化行列に従って前記変換係数のブロックの変換係数の値を量子化することと、
前記量子化された変換係数を前記コード化されたビットストリームにエントロピーコード化することと
を更に備えるC1に記載の方法。
[C9]
コード化されたビットストリームのダウンサンプリングされた値でコード化された量子化行列を受信することと、
値の第1の組を生成するために、第1のアップサンプリング係数によって前記量子化行列のダウンサンプリングされた値の第1の組をアップサンプリングすることと、
値の第2の組を生成するために、第2のアップサンプリング係数によって前記量子化行列のダウンサンプリングされた値の第2の組をアップサンプリングすることと、
前記値の第1及び第2の組で変換係数のブロックを逆量子化することと
を備えるビデオデータを復号するための方法。
[C10]
前記量子化行列の前記ダウンサンプリングされた値の第1の組の位置に基づいて前記第1のアップサンプリング係数を決定することと、
前記量子化行列の前記ダウンサンプリングされた値の第2の組の位置に基づいて前記第2のアップサンプリング係数を決定することと
を更に備えるC9に記載の方法。
[C11]
ダウンサンプリングされた前記値の第1の組は、前記量子化行列の位置(0,0)の値のみを含み、前記第1のアップサンプリング係数は、1であると決定され、前記第2のアップサンプリング係数は、2及び4の一方であると決定されるC10に記載の方法。
[C12]
前記量子化行列は、16×16又は32x32のサイズを持つ
C11に記載の方法。
[C13]
前記量子化行列の第1の遷移点を決定することと、前記第1の遷移点と前記量子化行列の起点との間に位置する前記量子化行列の値はダウンサンプリングされない、
前記量子化行列の第2の遷移点を決定することと、前記量子化行列の前記ダウンサンプリングされた値の第1の組は、前記第1の遷移点と前記第2の遷移点との間に位置する、
前記量子化行列の第3の遷移点を決定することと、前記量子化行列のダウンサンプリングされた値の第2の組は、前記第2の遷移点と前記第3の遷移点との間に位置する、
前記コード化されたビットストリームで、前記第1、第2、及び第3の遷移点と、前記第1及び第2のダウンサンプリング係数とを受信することと
を更に備えるC9に記載の方法。
[C14]
前記ダウンサンプリングされた値の第1及び第2の組のスキャン順に沿った以前のダウンサンプリングされた値から前記ダウンサンプリングされた値の第1及び第2の組の前記スキャン順に沿った前記ダウンサンプリングされた値の各連続する1つを予測することを更に含み、前記第1の組のダウンサンプリングされた値は、前記第2の組のダウンサンプリングされた値を予測するために使用することができる、C9に記載の方法。
[C15]
前記量子化行列の前記値の第1の組をアップサンプリングすることは、前記値の第1の組の第1の数に対する前記ダウンサンプリングされた値の第1の組のダウンサンプリングされた値を複製することを備え、前記第1の数は、前記第1のアップサンプリング係数から決定され、
前記量子化行列の前記値の第2の組をアップサンプリングすることは、前記値の第2の組の第2の数に対する前記ダウンサンプリングされた値の第2の組のダウンサンプリングされた値を複製することを備え、前記第2の数は、前記第2のアップサンプリング係数から決定される
C9に記載の方法。
[C16]
前記ダウンサンプリングされた値の第1及び第2の組をアップサンプリングするために、異なるアップサンプリング技術が使用されるC9に記載の方法。
[C17]
少なくとも前記値の第1及び第2の組は、双直線補間を使用してアップサンプリングされるC9に記載の方法。
[C18]
ビデオデータの残余のブロックを形成するために、前記変換係数の逆量子化されたブロックを逆変換することと、
ビデオデータの復号されたブロックを形成するために、前記ビデオデータの残余のブロックに対して予測プロセスを実行することと
を更に備えるC9に記載の方法。
[C19]
複数の値を含む量子化行列を決定し、
ダウンサンプリングされた値の第1の組を生成するために、第1のダウンサンプリング係数によって前記量子化行列の値の第1の組をダウンサンプリングし、
ダウンサンプリングされた値の第2の組を生成するために、第2のダウンサンプリング係数によって前記量子化行列の値の第2の組をダウンサンプリングし、
前記ダウンサンプリングされた値の第1の組と前記ダウンサンプリングされた値の第2の組とを含むコード化されたビットストリームを生成する
ように構成されたビデオ符号器
を備えるビデオデータをコード化するように構成された装置。
[C20]
前記ビデオ符号器は、
前記量子化行列の前記値の第1の組の位置に基づいて前記第1のダウンサンプリング係数を決定し、
前記量子化行列の前記値の第2の組の位置に基づいて前記第2のダウンサンプリング係数を決定する
ように更に構成されたC19に記載の装置。
[C21]
前記値の第1の組は、前記量子化行列の位置(0,0)の値のみを含み、
前記第1のダウンサンプリング係数は、1に決定され、前記第2のダウンサンプリング係数は、2及び4の一方であると決定されるC20に記載の装置。
[C22]
前記量子化行列は、16×16又は32x32のサイズを持つ
C21に記載の装置。
[C23]
前記ビデオ符号器は、
前記量子化行列の第1の遷移点を決定することと、前記第1の遷移点と前記量子化行列の起点との間に位置する値は、ダウンサンプリングされない、
前記量子化行列の第2の遷移点を決定することと、前記量子化行列の前記値の第1の組は、前記第1の遷移点と前記第2の遷移点との間に位置する、
前記量子化行列の第3の遷移点を決定することと、前記量子化行列の前記値の第2の組は、前記第2の遷移点と前記第3の遷移点との間に位置する、
前記コード化されたビットストリームで、前記第1、第2、及び第3の遷移点と、前記第1及び第2のダウンサンプリング係数とを信号伝達することと
を行うように更に構成されたC19に記載の装置。
[C24]
前記ビデオ符号器は、
前記ダウンサンプリングされた値の第1及び第2の組のスキャン順に沿った以前のダウンサンプリングされた値から前記ダウンサンプリングされた値の第1及び第2の組の前記スキャン順に沿った前記ダウンサンプリングされた値の1つを予測するように更に構成され、前記第1の組のダウンサンプリングされた値は、前記第2の組のダウンサンプリングされた値を予測するために使用することができるC19に記載の装置。
[C25]
前記量子化行列の前記値の第1の組のダウンサンプリングは、前記ダウンサンプリングされた値の第1の組の値を生成するために、前記値の第1の組の量子化行列値の第1の数を平均することを備え、前記第1の数は、前記第1のダウンサンプリング係数から決定され、
前記量子化行列の前記値の第2の組のダウンサンプリングは、前記ダウンサンプリングされた値の第2の組の値を生成するために、前記値の第2の組の量子化行列値の第2の数を平均することを備え、前記第2の数は、前記第2のダウンサンプリング係数から決定される
C19に記載の装置。
[C26]
前記ビデオ符号器は、
残余のビデオデータのブロックを形成するために、ビデオデータのブロックに対して予測プロセスを実行し、
変換係数のブロックを形成するために、前記残余のビデオデータを変換し、
量子化された変換係数を形成するために、前記量子化行列に従って前記変換係数のブロックの変換係数の値を量子化し、
前記量子化された変換係数を前記コード化されたビットストリームにエントロピーコード化する
ように更に構成されたC19に記載の装置。
[C27]
ビデオデータを復号するように構成された装置であって、
コード化されたビットストリームのダウンサンプリングされた値でコード化された量子化行列を受信し、
値の第1の組を生成するために、第1のアップサンプリング係数によって前記量子化行列のダウンサンプリングされた値の第1の組をアップサンプリングし、
値の第2の組を生成するために、第2のアップサンプリング係数によって前記量子化行列のダウンサンプリングされた値の第2の組をアップサンプリングし、
前記値の第1及び第2の組で変換係数のブロックを逆量子化する
ように構成されたビデオ復号器
を含む装置。
[C28]
前記ビデオ復号器は、
前記量子化行列の前記ダウンサンプリングされた値の第1の組の位置に基づいて、前記第1のアップサンプリング係数を決定し、
前記量子化行列の前記ダウンサンプリングされた値の第2の組の位置に基づいて、前記第2のアップサンプリング係数を決定する
ように更に構成されたC27に記載の装置。
[C29]
ダウンサンプリングされた前記値の第1の組は、前記量子化行列の位置(0,0)の値のみを含み、前記第1のアップサンプリング係数は、1であると決定され、前記第2のアップサンプリング係数は、2及び4の1つであると決定されるC28に記載の装置。
[C30]
前記量子化行列は、16×16又は32×32のサイズを持つ
C29に記載の装置。
[C31]
前記ビデオ復号器は、
前記量子化行列の第1の遷移点を決定することと、前記第1の遷移点と前記量子化行列の起点との間に位置する前記量子化行列の値はダウンサンプリングされない、
前記量子化行列の第2の遷移点を決定することと、前記量子化行列の前記ダウンサンプリングされた値の第1の組は、前記第1の遷移点と前記第2の遷移点との間に位置する、
前記量子化行列の第3の遷移点を決定することと、前記量子化行列のダウンサンプリングされた値の第2の組は、前記第2の遷移点と前記第3の遷移点との間に位置する、
前記コード化されたビットストリームで、前記第1、第2、及び第3の遷移点と、前記第1及び第2のダウンサンプリング係数とを受信することと
を行うように更に構成されたC27に記載の装置。
[C32]
前記ビデオ復号器は、
前記ダウンサンプリングされた値の第1及び第2の組のスキャン順に沿った以前のダウンサンプリングされた値から前記ダウンサンプリングされた値の第1及び第2の組の前記スキャン順に沿った前記ダウンサンプリングされた値の各連続する1つを予測するように更に構成され、前記第1の組のダウンサンプリングされた値は、前記第2の組のダウンサンプリングされた値を予測するために使用することができるC27に記載の装置。
[C33]
前記量子化行列の前記値の第1の組をアップサンプリングすることは、前記値の第1の組の第1の数に対する前記ダウンサンプリングされた値の第1の組のダウンサンプリングされた値を複製することを備え、前記第1の数は、前記第1のアップサンプリング係数から決定され、
前記量子化行列の前記値の第2の組をアップサンプリングすることは、前記値の第2の組の第2の数に対する前記ダウンサンプリングされた値の第2の組のダウンサンプリングされた値を複製することを備え、前記第2の数は、前記第2のアップサンプリング係数から決定される
C27に記載の装置。
[C34]
前記ダウンサンプリングされた値の第1及び第2の組をアップサンプリングするために、異なるアップサンプリング技術が使用されるC27に記載の装置。
[C35]
値の少なくとも第1及び第2の組は、双直線補間を使用してアップサンプリングされるC27に記載の装置。
[C36]
前記ビデオ復号器は、
ビデオデータの残余のブロックを形成するために、前記変換係数の逆量子化されたブロックを逆変換し、
ビデオデータの復号されたブロックを形成するために、前記ビデオデータの残余のブロックに対して予測プロセスを実行する
ように更に構成されたC27に記載の装置。
[C37]
複数の値を含む量子化行列を決定するための手段と、
ダウンサンプリングされた値の第1の組を生成するために、第1のダウンサンプリング係数によって前記量子化行列の値の第1の組をダウンサンプリングするための手段と、
ダウンサンプリングされた値の第2の組を生成するために、第2のダウンサンプリング係数によって前記量子化行列の値の第2の組をダウンサンプリングするための手段と、
前記ダウンサンプリングされた値の第1の組と前記ダウンサンプリングされた値の第2の組とを含むコード化されたビットストリームを生成するための手段と
を備えるビデオデータを符号化するように構成された装置。
[C38]
コード化されたビットストリームのダウンサンプリングされた値でコード化された量子化行列を受信するための手段と、
値の第1の組を生成するために、第1のアップサンプリング係数によって前記量子化行列のダウンサンプリングされた値の第1の組をアップサンプリングするための手段と、
値の第2の組を生成するために、第2のアップサンプリング係数によって前記量子化行列のダウンサンプリングされた値の第2の組をアップサンプリングするための手段と、
前記値の第1及び第2の組で変換係数のブロックを逆量子化するための手段と
を含むビデオデータを復号するように構成された装置。
[C39]
実行されたときに、ビデオデータを符号化するように構成された機器の1つ以上のプロセッサに、
複数の値を含む量子化行列を決定し、
ダウンサンプリングされた値の第1の組を生成するために、第1のダウンサンプリング係数によって前記量子化行列の値の第1の組をダウンサンプリングし、
ダウンサンプリングされた値の第2の組を生成するために、第2のダウンサンプリング係数によって前記量子化行列の値の第2の組をダウンサンプリングし、
前記ダウンサンプリングされた値の第1の組と前記ダウンサンプリングされた値の第2の組とを含むコード化されたビットストリームを生成する
ことをさせる命令を格納するコンピュータ可読記憶媒体。
[C40]
実行されたときに、ビデオデータを復号するように構成された機器の1つ以上のプロセッサに、
コード化されたビットストリームのダウンサンプリングされた値でコード化された量子化行列を受信し、
値の第1の組を生成するために、第1のアップサンプリング係数によって前記量子化行列のダウンサンプリングされた値の第1の組をアップサンプリングし、
値の第2の組を生成するために、第2のアップサンプリング係数によって前記量子化行列のダウンサンプリングされた値の第2の組をアップサンプリングし、
前記値の第1及び第2の組で変換係数のブロックを逆量子化する
ことをさせる命令を格納するコンピュータ可読記憶媒体。

Claims (40)

  1. ビデオデータを符号化する方法であって、
    複数の値を含む量子化行列を決定することと、
    ダウンサンプリングされた値の第1の組を生成するために、第1のダウンサンプリング係数によって前記量子化行列の値の第1の組をダウンサンプリングすることと、
    ダウンサンプリングされた値の第2の組を生成するために、第2のダウンサンプリング係数によって前記量子化行列の値の第2の組をダウンサンプリングすることと、
    前記ダウンサンプリングされた値の第1の組と前記ダウンサンプリングされた値の第2の組とを含むコード化されたビットストリームを生成することと
    を備える方法。
  2. 前記量子化行列の前記値の第1の組の場所に基づいて前記第1のダウンサンプリング係数を決定することと、
    前記量子化行列の前記値の第2の組の場所に基づいて前記第2のダウンサンプリング係数を決定することと
    を更に備える請求項1に記載の方法。
  3. 前記値の第1の組は、前記量子化行列の場所(0,0)の値のみを含み、前記第1のダウンサンプリング係数は1に決定され、前記第2のダウンサンプリング係数は2及び4の一方であると決定される請求項2に記載の方法。
  4. 前記量子化行列は、16×16又は32×32のサイズを持つ請求項3に記載の方法。
  5. 前記量子化行列の第1の遷移点を決定することと、前記第1の遷移点と前記量子化行列の起点との間に位置する値はダウンサンプリングされない、
    前記量子化行列の第2の遷移点を決定することと、前記量子化行列の前記値の第1の組は、前記第1の遷移点と前記第2の遷移点との間に位置する、
    前記量子化行列の第3の遷移点を決定することと、前記量子化行列の前記値の第2の組は、前記第2の遷移点と前記第3の遷移点との間に位置する、
    前記コード化されたビットストリームで、前記第1、第2、及び第3の遷移点と、前記第1及び第2のダウンサンプリング係数とを信号伝達することと
    を更に備える請求項1に記載の方法。
  6. 前記ダウンサンプリングされた値の第1及び第2の組のスキャン順に沿った以前のダウンサンプリングされた値から前記ダウンサンプリングされた値の第1及び第2の組の前記スキャン順に沿った前記ダウンサンプリングされた値の1つを予測することを更に含み、前記第1の組のダウンサンプリングされた値は、前記第2の組のダウンサンプリングされた値を予測するために使用することができる、請求項1に記載の方法。
  7. 前記量子化行列の前記値の第1の組のダウンサンプリングは、前記ダウンサンプリングされた値の第1の組の値を生成するために、前記値の第1の組の量子化行列値の第1の数を平均化することを備え、前記第1の数は、前記第1のダウンサンプリング係数から決定され、
    前記量子化行列の前記値の第2の組のダウンサンプリングは、前記ダウンサンプリングされた値の第2の組の値を生成するために、前記値の第2の組の量子化行列値の第2の数を平均化することを備え、前記第2の数は、前記第2のダウンサンプリング係数から決定される
    請求項1に記載の方法。
  8. 残余のビデオデータのブロックを形成するために、ビデオデータのブロックに対して予測プロセスを実行することと、
    変換係数のブロックを形成するために、前記残余のビデオデータを変換することと、
    量子化された変換係数を形成するために、前記量子化行列に従って前記変換係数のブロックの変換係数の値を量子化することと、
    前記量子化された変換係数を前記コード化されたビットストリームにエントロピーコード化することと
    を更に備える請求項1に記載の方法。
  9. コード化されたビットストリームのダウンサンプリングされた値でコード化された量子化行列を受信することと、
    値の第1の組を生成するために、第1のアップサンプリング係数によって前記量子化行列のダウンサンプリングされた値の第1の組をアップサンプリングすることと、
    値の第2の組を生成するために、第2のアップサンプリング係数によって前記量子化行列のダウンサンプリングされた値の第2の組をアップサンプリングすることと、
    前記値の第1及び第2の組で変換係数のブロックを逆量子化することと
    を備えるビデオデータを復号するための方法。
  10. 前記量子化行列の前記ダウンサンプリングされた値の第1の組の場所に基づいて前記第1のアップサンプリング係数を決定することと、
    前記量子化行列の前記ダウンサンプリングされた値の第2の組の場所に基づいて前記第2のアップサンプリング係数を決定することと
    を更に備える請求項9に記載の方法。
  11. ダウンサンプリングされた前記値の第1の組は、前記量子化行列の場所(0,0)の値のみを含み、前記第1のアップサンプリング係数は、1であると決定され、前記第2のアップサンプリング係数は、2及び4の一方であると決定される請求項10に記載の方法。
  12. 前記量子化行列は、16×16又は32x32のサイズを持つ
    請求項11に記載の方法。
  13. 前記量子化行列の第1の遷移点を決定することと、前記第1の遷移点と前記量子化行列の起点との間に位置する前記量子化行列の値はダウンサンプリングされない、
    前記量子化行列の第2の遷移点を決定することと、前記量子化行列の前記ダウンサンプリングされた値の第1の組は、前記第1の遷移点と前記第2の遷移点との間に位置する、
    前記量子化行列の第3の遷移点を決定することと、前記量子化行列のダウンサンプリングされた値の第2の組は、前記第2の遷移点と前記第3の遷移点との間に位置する、
    前記コード化されたビットストリームで、前記第1、第2、及び第3の遷移点と、前記第1及び第2のダウンサンプリング係数とを受信することと
    を更に備える請求項9に記載の方法。
  14. 前記ダウンサンプリングされた値の第1及び第2の組のスキャン順に沿った以前のダウンサンプリングされた値から前記ダウンサンプリングされた値の第1及び第2の組の前記スキャン順に沿った前記ダウンサンプリングされた値の各連続する1つを予測することを更に含み、前記第1の組のダウンサンプリングされた値は、前記第2の組のダウンサンプリングされた値を予測するために使用することができる、請求項9に記載の方法。
  15. 前記量子化行列の前記値の第1の組をアップサンプリングすることは、前記値の第1の組の第1の数に対する前記ダウンサンプリングされた値の第1の組のダウンサンプリングされた値を複製することを備え、前記第1の数は、前記第1のアップサンプリング係数から決定され、
    前記量子化行列の前記値の第2の組をアップサンプリングすることは、前記値の第2の組の第2の数に対する前記ダウンサンプリングされた値の第2の組のダウンサンプリングされた値を複製することを備え、前記第2の数は、前記第2のアップサンプリング係数から決定される
    請求項9に記載の方法。
  16. 前記ダウンサンプリングされた値の第1及び第2の組をアップサンプリングするために、異なるアップサンプリング技術が使用される請求項9に記載の方法。
  17. 少なくとも前記値の第1及び第2の組は、双直線補間を使用してアップサンプリングされる請求項9に記載の方法。
  18. ビデオデータの残余のブロックを形成するために、前記変換係数の逆量子化されたブロックを逆変換することと、
    ビデオデータの復号されたブロックを形成するために、前記ビデオデータの残余のブロックに対して予測プロセスを実行することと
    を更に備える請求項9に記載の方法。
  19. 複数の値を含む量子化行列を決定し、
    ダウンサンプリングされた値の第1の組を生成するために、第1のダウンサンプリング係数によって前記量子化行列の値の第1の組をダウンサンプリングし、
    ダウンサンプリングされた値の第2の組を生成するために、第2のダウンサンプリング係数によって前記量子化行列の値の第2の組をダウンサンプリングし、
    前記ダウンサンプリングされた値の第1の組と前記ダウンサンプリングされた値の第2の組とを含むコード化されたビットストリームを生成する
    ように構成されたビデオ符号器
    を備えるビデオデータをコード化するように構成された装置。
  20. 前記ビデオ符号器は、
    前記量子化行列の前記値の第1の組の場所に基づいて前記第1のダウンサンプリング係数を決定し、
    前記量子化行列の前記値の第2の組の場所に基づいて前記第2のダウンサンプリング係数を決定する
    ように更に構成された請求項19に記載の装置。
  21. 前記値の第1の組は、前記量子化行列の場所(0,0)の値のみを含み、
    前記第1のダウンサンプリング係数は、1に決定され、前記第2のダウンサンプリング係数は、2及び4の一方であると決定される請求項20に記載の装置。
  22. 前記量子化行列は、16×16又は32x32のサイズを持つ
    請求項21に記載の装置。
  23. 前記ビデオ符号器は、
    前記量子化行列の第1の遷移点を決定することと、前記第1の遷移点と前記量子化行列の起点との間に位置する値は、ダウンサンプリングされない、
    前記量子化行列の第2の遷移点を決定することと、前記量子化行列の前記値の第1の組は、前記第1の遷移点と前記第2の遷移点との間に位置する、
    前記量子化行列の第3の遷移点を決定することと、前記量子化行列の前記値の第2の組は、前記第2の遷移点と前記第3の遷移点との間に位置する、
    前記コード化されたビットストリームで、前記第1、第2、及び第3の遷移点と、前記第1及び第2のダウンサンプリング係数とを信号伝達することと
    を行うように更に構成された請求項19に記載の装置。
  24. 前記ビデオ符号器は、
    前記ダウンサンプリングされた値の第1及び第2の組のスキャン順に沿った以前のダウンサンプリングされた値から前記ダウンサンプリングされた値の第1及び第2の組の前記スキャン順に沿った前記ダウンサンプリングされた値の1つを予測するように更に構成され、前記第1の組のダウンサンプリングされた値は、前記第2の組のダウンサンプリングされた値を予測するために使用することができる請求項19に記載の装置。
  25. 前記量子化行列の前記値の第1の組のダウンサンプリングは、前記ダウンサンプリングされた値の第1の組の値を生成するために、前記値の第1の組の量子化行列値の第1の数を平均することを備え、前記第1の数は、前記第1のダウンサンプリング係数から決定され、
    前記量子化行列の前記値の第2の組のダウンサンプリングは、前記ダウンサンプリングされた値の第2の組の値を生成するために、前記値の第2の組の量子化行列値の第2の数を平均することを備え、前記第2の数は、前記第2のダウンサンプリング係数から決定される
    請求項19に記載の装置。
  26. 前記ビデオ符号器は、
    残余のビデオデータのブロックを形成するために、ビデオデータのブロックに対して予測プロセスを実行し、
    変換係数のブロックを形成するために、前記残余のビデオデータを変換し、
    量子化された変換係数を形成するために、前記量子化行列に従って前記変換係数のブロックの変換係数の値を量子化し、
    前記量子化された変換係数を前記コード化されたビットストリームにエントロピーコード化する
    ように更に構成された請求項19に記載の装置。
  27. ビデオデータを復号するように構成された装置であって、
    コード化されたビットストリームのダウンサンプリングされた値でコード化された量子化行列を受信し、
    値の第1の組を生成するために、第1のアップサンプリング係数によって前記量子化行列のダウンサンプリングされた値の第1の組をアップサンプリングし、
    値の第2の組を生成するために、第2のアップサンプリング係数によって前記量子化行列のダウンサンプリングされた値の第2の組をアップサンプリングし、
    前記値の第1及び第2の組で変換係数のブロックを逆量子化する
    ように構成されたビデオ復号器
    を含む装置。
  28. 前記ビデオ復号器は、
    前記量子化行列の前記ダウンサンプリングされた値の第1の組の場所に基づいて、前記第1のアップサンプリング係数を決定し、
    前記量子化行列の前記ダウンサンプリングされた値の第2の組の場所に基づいて、前記第2のアップサンプリング係数を決定する
    ように更に構成された請求項27に記載の装置。
  29. ダウンサンプリングされた前記値の第1の組は、前記量子化行列の場所(0,0)の値のみを含み、前記第1のアップサンプリング係数は、1であると決定され、前記第2のアップサンプリング係数は、2及び4の1つであると決定される請求項28に記載の装置。
  30. 前記量子化行列は、16×16又は32×32のサイズを持つ
    請求項29に記載の装置。
  31. 前記ビデオ復号器は、
    前記量子化行列の第1の遷移点を決定することと、前記第1の遷移点と前記量子化行列の起点との間に位置する前記量子化行列の値はダウンサンプリングされない、
    前記量子化行列の第2の遷移点を決定することと、前記量子化行列の前記ダウンサンプリングされた値の第1の組は、前記第1の遷移点と前記第2の遷移点との間に位置する、
    前記量子化行列の第3の遷移点を決定することと、前記量子化行列のダウンサンプリングされた値の第2の組は、前記第2の遷移点と前記第3の遷移点との間に位置する、
    前記コード化されたビットストリームで、前記第1、第2、及び第3の遷移点と、前記第1及び第2のダウンサンプリング係数とを受信することと
    を行うように更に構成された請求項27に記載の装置。
  32. 前記ビデオ復号器は、
    前記ダウンサンプリングされた値の第1及び第2の組のスキャン順に沿った以前のダウンサンプリングされた値から前記ダウンサンプリングされた値の第1及び第2の組の前記スキャン順に沿った前記ダウンサンプリングされた値の各連続する1つを予測するように更に構成され、前記第1の組のダウンサンプリングされた値は、前記第2の組のダウンサンプリングされた値を予測するために使用することができる請求項27に記載の装置。
  33. 前記量子化行列の前記値の第1の組をアップサンプリングすることは、前記値の第1の組の第1の数に対する前記ダウンサンプリングされた値の第1の組のダウンサンプリングされた値を複製することを備え、前記第1の数は、前記第1のアップサンプリング係数から決定され、
    前記量子化行列の前記値の第2の組をアップサンプリングすることは、前記値の第2の組の第2の数に対する前記ダウンサンプリングされた値の第2の組のダウンサンプリングされた値を複製することを備え、前記第2の数は、前記第2のアップサンプリング係数から決定される
    請求項27に記載の装置。
  34. 前記ダウンサンプリングされた値の第1及び第2の組をアップサンプリングするために、異なるアップサンプリング技術が使用される請求項27に記載の装置。
  35. 値の少なくとも第1及び第2の組は、双直線補間を使用してアップサンプリングされる請求項27に記載の装置。
  36. 前記ビデオ復号器は、
    ビデオデータの残余のブロックを形成するために、前記変換係数の逆量子化されたブロックを逆変換し、
    ビデオデータの復号されたブロックを形成するために、前記ビデオデータの残余のブロックに対して予測プロセスを実行する
    ように更に構成された請求項27に記載の装置。
  37. 複数の値を含む量子化行列を決定するための手段と、
    ダウンサンプリングされた値の第1の組を生成するために、第1のダウンサンプリング係数によって前記量子化行列の値の第1の組をダウンサンプリングするための手段と、
    ダウンサンプリングされた値の第2の組を生成するために、第2のダウンサンプリング係数によって前記量子化行列の値の第2の組をダウンサンプリングするための手段と、
    前記ダウンサンプリングされた値の第1の組と前記ダウンサンプリングされた値の第2の組とを含むコード化されたビットストリームを生成するための手段と
    を備えるビデオデータを符号化するように構成された装置。
  38. コード化されたビットストリームのダウンサンプリングされた値でコード化された量子化行列を受信するための手段と、
    値の第1の組を生成するために、第1のアップサンプリング係数によって前記量子化行列のダウンサンプリングされた値の第1の組をアップサンプリングするための手段と、
    値の第2の組を生成するために、第2のアップサンプリング係数によって前記量子化行列のダウンサンプリングされた値の第2の組をアップサンプリングするための手段と、
    前記値の第1及び第2の組で変換係数のブロックを逆量子化するための手段と
    を含むビデオデータを復号するように構成された装置。
  39. 実行されたときに、ビデオデータを符号化するように構成された機器の1つ以上のプロセッサに、
    複数の値を含む量子化行列を決定し、
    ダウンサンプリングされた値の第1の組を生成するために、第1のダウンサンプリング係数によって前記量子化行列の値の第1の組をダウンサンプリングし、
    ダウンサンプリングされた値の第2の組を生成するために、第2のダウンサンプリング係数によって前記量子化行列の値の第2の組をダウンサンプリングし、
    前記ダウンサンプリングされた値の第1の組と前記ダウンサンプリングされた値の第2の組とを含むコード化されたビットストリームを生成する
    ことをさせる命令を格納するコンピュータ可読記憶媒体。
  40. 実行されたときに、ビデオデータを復号するように構成された機器の1つ以上のプロセッサに、
    コード化されたビットストリームのダウンサンプリングされた値でコード化された量子化行列を受信し、
    値の第1の組を生成するために、第1のアップサンプリング係数によって前記量子化行列のダウンサンプリングされた値の第1の組をアップサンプリングし、
    値の第2の組を生成するために、第2のアップサンプリング係数によって前記量子化行列のダウンサンプリングされた値の第2の組をアップサンプリングし、
    前記値の第1及び第2の組で変換係数のブロックを逆量子化する
    ことをさせる命令を格納するコンピュータ可読記憶媒体。
JP2014541203A 2011-11-07 2012-11-07 ビデオコード化のための量子化行列の信号伝達 Active JP5902311B2 (ja)

Applications Claiming Priority (11)

Application Number Priority Date Filing Date Title
US201161556785P 2011-11-07 2011-11-07
US61/556,785 2011-11-07
US201261594885P 2012-02-03 2012-02-03
US61/594,885 2012-02-03
US201261597107P 2012-02-09 2012-02-09
US61/597,107 2012-02-09
US201261605654P 2012-03-01 2012-03-01
US61/605,654 2012-03-01
US13/670,011 2012-11-06
US13/670,011 US10277915B2 (en) 2011-11-07 2012-11-06 Signaling quantization matrices for video coding
PCT/US2012/063943 WO2013070766A1 (en) 2011-11-07 2012-11-07 Signaling quantization matrices for video coding

Publications (2)

Publication Number Publication Date
JP2014535250A true JP2014535250A (ja) 2014-12-25
JP5902311B2 JP5902311B2 (ja) 2016-04-13

Family

ID=48223683

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014541203A Active JP5902311B2 (ja) 2011-11-07 2012-11-07 ビデオコード化のための量子化行列の信号伝達

Country Status (19)

Country Link
US (1) US10277915B2 (ja)
EP (1) EP2777263B1 (ja)
JP (1) JP5902311B2 (ja)
KR (1) KR101895652B1 (ja)
CN (1) CN104137546B (ja)
AU (1) AU2012335896B2 (ja)
BR (1) BR112014011054B1 (ja)
CA (1) CA2853835C (ja)
ES (1) ES2715838T3 (ja)
HK (1) HK1199995A1 (ja)
HU (1) HUE043156T2 (ja)
IL (1) IL232284A (ja)
IN (1) IN2014CN03345A (ja)
MY (1) MY174583A (ja)
RU (1) RU2582579C2 (ja)
SG (1) SG11201401566UA (ja)
TW (1) TWI520585B (ja)
WO (1) WO2013070766A1 (ja)
ZA (1) ZA201404179B (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013219727A (ja) * 2011-11-07 2013-10-24 Canon Inc 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
JP2016528810A (ja) * 2013-07-24 2016-09-15 マイクロソフト テクノロジー ライセンシング,エルエルシー 非変換符号化のためのスキャン順序
JP2020098984A (ja) * 2018-12-17 2020-06-25 キヤノン株式会社 画像符号化装置及び画像復号装置及びそれらの制御方法及びプログラム

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8385404B2 (en) 2008-09-11 2013-02-26 Google Inc. System and method for video encoding using constructed reference frame
US9167252B2 (en) 2010-12-01 2015-10-20 Texas Instruments Incorporated Quantization matrix compression in video coding
JP5741076B2 (ja) * 2010-12-09 2015-07-01 ソニー株式会社 画像処理装置及び画像処理方法
US8638854B1 (en) 2011-04-07 2014-01-28 Google Inc. Apparatus and method for creating an alternate reference frame for video compression using maximal differences
JP6312879B2 (ja) * 2011-11-07 2018-04-18 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
CN107580230B (zh) * 2012-01-20 2021-08-20 韩国电子通信研究院 视频解码方法和视频编码方法
US9313497B2 (en) * 2012-01-25 2016-04-12 Intel Corporation Systems, methods, and computer program products for transform coefficient sub-sampling
EP3432582B1 (en) * 2012-02-29 2020-04-01 Sony Corporation Image processing device and method
AU2015258162B2 (en) * 2012-02-29 2017-01-12 Sony Corporation Image Processing Device and Method
CN104919798B (zh) * 2012-04-16 2018-12-14 华为技术有限公司 量化矩阵编码的方法和装置
US9609341B1 (en) * 2012-04-23 2017-03-28 Google Inc. Video data encoding and decoding using reference picture lists
FI2869557T3 (fi) 2012-06-29 2023-11-02 Electronics & Telecommunications Res Inst Menetelmä ja laite kuvien koodaamiseksi/dekoodaamiseksi
US9445124B2 (en) * 2013-03-15 2016-09-13 Samsung Electronics Co., Ltd. Electronic system with frequency mechanism and method of operation thereof
US10516898B2 (en) 2013-10-10 2019-12-24 Intel Corporation Systems, methods, and computer program products for scalable video coding based on coefficient sampling
US9716884B2 (en) * 2014-03-20 2017-07-25 Hfi Innovation Inc. Method of signaling for mode selection in 3D and multi-view video coding
US10863188B2 (en) * 2014-09-19 2020-12-08 Futurewei Technologies, Inc. Method and apparatus for non-uniform mapping for quantization matrix coefficients between different sizes of quantization matrices in image/video coding
WO2017020808A1 (en) * 2015-07-31 2017-02-09 Versitech Limited A depth discontinuity-based method for efficient intra coding for depth videos
US10660047B2 (en) * 2016-04-28 2020-05-19 Sony Mobile Communications Inc. Transmit power of pilot signals
CN111373757B (zh) * 2017-11-24 2022-10-21 索尼公司 图像处理设备和方法
US10491897B2 (en) * 2018-04-13 2019-11-26 Google Llc Spatially adaptive quantization-aware deblocking filter
GB2578633B (en) * 2018-11-02 2021-10-13 Advanced Risc Mach Ltd Encoding data arrays
JP2020098986A (ja) * 2018-12-17 2020-06-25 キヤノン株式会社 画像符号化装置及び画像復号装置及びそれらの制御方法及びプログラム
JP2020098983A (ja) * 2018-12-17 2020-06-25 キヤノン株式会社 画像符号化装置、画像符号化方法、画像復号装置、画像復号方法
US11470329B2 (en) * 2018-12-26 2022-10-11 Tencent America LLC Method and apparatus for video coding
EP3917142A4 (en) * 2018-12-26 2022-11-09 Electronics and Telecommunications Research Institute METHOD AND DEVICE FOR ENCODING/DECODING QUANTIFICATION MATRIX AND RECORDING MEDIUM WITH BITSTREAM STORED THEREON
EP3958571A4 (en) * 2019-06-03 2022-07-27 LG Electronics Inc. MATRIX-BASED INTRA PREDICTION DEVICE AND METHOD
US20220286692A1 (en) * 2019-08-27 2022-09-08 Hyundai Motor Company Video encoding and decoding using differential encoding
WO2021120122A1 (zh) * 2019-12-19 2021-06-24 Oppo广东移动通信有限公司 图像分量预测方法、编码器、解码器以及存储介质
CN111586411B (zh) * 2020-05-06 2022-07-12 深圳市梦网视讯有限公司 一种低对比度视频编码方法、系统及设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013157825A1 (ko) * 2012-04-16 2013-10-24 한국전자통신연구원 영상 부호화/복호화 방법 및 장치
JP2014534749A (ja) * 2011-11-04 2014-12-18 インフォブリッジ ピーティーイー. エルティーディー. 量子化ブロック逆量子化方法
JP2014534751A (ja) * 2011-11-04 2014-12-18 ジェニップ ピーティーイー. エルティーディー. 復元ブロック生成方法

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3202433B2 (ja) * 1993-09-17 2001-08-27 株式会社リコー 量子化装置、逆量子化装置及び画像処理装置並びに量子化方法、逆量子化方法及び画像処理方法
JPH07123269A (ja) * 1993-10-22 1995-05-12 Fuji Xerox Co Ltd 画像信号の符号化装置
US5489943A (en) * 1994-02-14 1996-02-06 Sony Corporation One-pass adaptive bit rate control
US5629780A (en) 1994-12-19 1997-05-13 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Image data compression having minimum perceptual error
US5708732A (en) * 1996-03-06 1998-01-13 Hewlett-Packard Company Fast DCT domain downsampling and inverse motion compensation
DE69829783T2 (de) * 1997-02-08 2005-09-01 Matsushita Electric Industrial Co., Ltd., Kadoma Quantisierungsmatrix für die Codierung von Stand- und Bewegtbildern
US6487249B2 (en) 1998-10-09 2002-11-26 Matsushita Electric Industrial Co., Ltd. Efficient down conversion system for 2:1 decimation
US6647061B1 (en) 2000-06-09 2003-11-11 General Instrument Corporation Video size conversion and transcoding from MPEG-2 to MPEG-4
US6771703B1 (en) 2000-06-30 2004-08-03 Emc Corporation Efficient scaling of nonscalable MPEG-2 Video
EP1231794A1 (en) * 2001-02-09 2002-08-14 STMicroelectronics S.r.l. A process for changing the resolution of MPEG bitstreams, a system and a computer program product therefor
US20020196854A1 (en) * 2001-06-15 2002-12-26 Jongil Kim Fast video encoder using adaptive hierarchical video processing in a down-sampled domain
US7123655B2 (en) 2001-08-09 2006-10-17 Sharp Laboratories Of America, Inc. Method for reduced bit-depth quantization
US7412003B2 (en) * 2003-09-17 2008-08-12 Texas Instruments Incorporated Transcoders and methods
KR101169895B1 (ko) 2004-01-20 2012-07-31 파나소닉 주식회사 화상 부호화 방법, 화상 복호화 방법, 화상 부호화 장치, 화상 복호화 장치 및 그 프로그램
US7365748B2 (en) * 2004-08-12 2008-04-29 Broadcom Corporation Unique method for performing horizontal and vertical video decimation within a wireless device
US8879857B2 (en) 2005-09-27 2014-11-04 Qualcomm Incorporated Redundant data encoding methods and device
RU2378790C1 (ru) 2005-09-27 2010-01-10 Квэлкомм Инкорпорейтед Методики масштабируемости на основе информации содержимого
WO2008044511A1 (en) 2006-10-12 2008-04-17 Kabushiki Kaisha Toshiba Method and apparatus for encoding image
KR100848816B1 (ko) * 2007-01-29 2008-07-28 경희대학교 산학협력단 정수 dct를 이용한 영상 이미지의 크기 변환 방법
EP2198376B1 (en) * 2007-10-05 2016-01-27 Dolby Laboratories Licensing Corp. Media fingerprints that reliably correspond to media content
CN101578878A (zh) * 2007-10-19 2009-11-11 松下电器产业株式会社 编码率变换装置、编码率变换方法及集成电路
KR101426272B1 (ko) 2008-03-10 2014-08-07 삼성전자주식회사 영상 부호화장치 및 영상 복호화장치
US8948270B2 (en) 2008-08-19 2015-02-03 Qualcomm Incorporated Power and computational load management techniques in video processing
US8964828B2 (en) 2008-08-19 2015-02-24 Qualcomm Incorporated Power and computational load management techniques in video processing
IT1392673B1 (it) * 2009-01-13 2012-03-16 Saipem Spa Procedimento per l'ottenimento di 1-butene ad elevata purezza da miscele idrocarburiche c4
WO2010100089A1 (en) 2009-03-02 2010-09-10 Thomson Licensing Method and device for displaying a sequence of pictures
US20110274162A1 (en) * 2010-05-04 2011-11-10 Minhua Zhou Coding Unit Quantization Parameters in Video Coding
US9167252B2 (en) * 2010-12-01 2015-10-20 Texas Instruments Incorporated Quantization matrix compression in video coding
US20120230422A1 (en) * 2011-03-11 2012-09-13 Korodi Gergely Ferenc Method and System Using Prediction and Error Correction for the Compact Representation of Quantization Matrices In Video Compression
US9560347B2 (en) * 2011-08-23 2017-01-31 Hfi Innovation Inc. Method and system of transform block processing according to quantization matrix in video coding
CN104919798B (zh) * 2012-04-16 2018-12-14 华为技术有限公司 量化矩阵编码的方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014534749A (ja) * 2011-11-04 2014-12-18 インフォブリッジ ピーティーイー. エルティーディー. 量子化ブロック逆量子化方法
JP2014534751A (ja) * 2011-11-04 2014-12-18 ジェニップ ピーティーイー. エルティーディー. 復元ブロック生成方法
WO2013157825A1 (ko) * 2012-04-16 2013-10-24 한국전자통신연구원 영상 부호화/복호화 방법 및 장치
JP2015516754A (ja) * 2012-04-16 2015-06-11 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュートElectronics And Telecommunications Research Institute 映像符号化/復号化方法及び装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN6015037558; Minhua Zhou, et.al.: '"Compact representation of quantization matrices for HEVC"' [online] Document: JCTVC-D024(version 1), 20110115, Joint Collaborative Team on Video Coding (JCT-VC) *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013219727A (ja) * 2011-11-07 2013-10-24 Canon Inc 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
US9826241B2 (en) 2011-11-07 2017-11-21 Canon Kabushiki Kaisha Image coding apparatus, image coding method, image decoding apparatus, image decoding method, and storage medium
JP2016528810A (ja) * 2013-07-24 2016-09-15 マイクロソフト テクノロジー ライセンシング,エルエルシー 非変換符号化のためのスキャン順序
JP2020098984A (ja) * 2018-12-17 2020-06-25 キヤノン株式会社 画像符号化装置及び画像復号装置及びそれらの制御方法及びプログラム
WO2020129489A1 (ja) * 2018-12-17 2020-06-25 キヤノン株式会社 画像符号化装置及び画像復号装置及びそれらの制御方法及びプログラム

Also Published As

Publication number Publication date
US20130114695A1 (en) 2013-05-09
ES2715838T3 (es) 2019-06-06
CN104137546B (zh) 2018-01-26
CA2853835A1 (en) 2013-05-16
CN104137546A (zh) 2014-11-05
US10277915B2 (en) 2019-04-30
HK1199995A1 (en) 2015-07-24
EP2777263B1 (en) 2018-12-19
EP2777263A1 (en) 2014-09-17
TW201334549A (zh) 2013-08-16
IN2014CN03345A (ja) 2015-07-03
IL232284A0 (en) 2014-06-30
AU2012335896B2 (en) 2016-05-12
BR112014011054B1 (pt) 2022-06-07
IL232284A (en) 2017-09-28
AU2012335896A1 (en) 2014-05-29
JP5902311B2 (ja) 2016-04-13
HUE043156T2 (hu) 2019-08-28
MY174583A (en) 2020-04-28
RU2014123320A (ru) 2015-12-20
SG11201401566UA (en) 2014-09-26
BR112014011054A2 (pt) 2017-05-02
KR101895652B1 (ko) 2018-09-05
RU2582579C2 (ru) 2016-04-27
ZA201404179B (en) 2020-11-25
CA2853835C (en) 2017-02-28
WO2013070766A1 (en) 2013-05-16
TWI520585B (zh) 2016-02-01
KR20140089583A (ko) 2014-07-15

Similar Documents

Publication Publication Date Title
JP5902311B2 (ja) ビデオコード化のための量子化行列の信号伝達
JP6636564B2 (ja) ビデオコーディングにおける4:2:2サンプルフォーマットのためのコード化ブロックフラグ(cbf)コーディング
JP6542225B2 (ja) イントラブロックコピーのための残差予測
JP6129969B2 (ja) スケーラブルビデオコード化における代替変換
JP6250678B2 (ja) スケーラブル映像コーディングに関するイントラ予測改良
JP5869008B2 (ja) ビデオコーディングにおける変換
JP5788517B2 (ja) ジョイントコンテキストモデルを使用した係数のエントロピーコード化
JP5833249B2 (ja) ビデオコーディングのための適応的な中心帯域オフセットフィルタ
JP6151434B2 (ja) 絶対値変換差分和に基づくビデオ符号化のためのイントラレート制御
US20130101033A1 (en) Coding non-symmetric distributions of data
JP6239612B2 (ja) スケーラブル映像コーディング及び3d映像コーディングに関する一般化された残差予測
JP2017519447A (ja) ビデオコーディングのためのイントラブロックコピーブロックベクトルシグナリング
JP5755808B2 (ja) ルーマおよびクロマブロックのためのvlc係数コーディング
TW201342920A (zh) 在視訊寫碼中用於色度分量之變換單位分割
JP2013543317A5 (ja)
JP2017513311A (ja) 残差差分パルス符号変調のための量子化プロセス
JP2016054493A (ja) Vlcコードワードを使用したシンタックス要素のコーディング

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150915

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151215

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160209

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160309

R150 Certificate of patent or registration of utility model

Ref document number: 5902311

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250