JP2013517681A - 圧縮センシングを用いるビデオコーディング - Google Patents

圧縮センシングを用いるビデオコーディング Download PDF

Info

Publication number
JP2013517681A
JP2013517681A JP2012548958A JP2012548958A JP2013517681A JP 2013517681 A JP2013517681 A JP 2013517681A JP 2012548958 A JP2012548958 A JP 2012548958A JP 2012548958 A JP2012548958 A JP 2012548958A JP 2013517681 A JP2013517681 A JP 2013517681A
Authority
JP
Japan
Prior art keywords
image block
measurement vector
measurement
block
residual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012548958A
Other languages
English (en)
Other versions
JP2013517681A5 (ja
JP5785955B2 (ja
Inventor
ド,トン
リュ,シャオアン
ソーレ,ジョエル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2013517681A publication Critical patent/JP2013517681A/ja
Publication of JP2013517681A5 publication Critical patent/JP2013517681A5/ja
Application granted granted Critical
Publication of JP5785955B2 publication Critical patent/JP5785955B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/567Motion estimation based on rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

圧縮センシングを用いるビデオエンコーダとデコーダのための方法と装置を提供する。外符号化方法は、ピクチャ中の画像ブロックの測定値ベクトルを生成し、前記測定値ベクトルを符号化し、前記符号化された測定値ベクトルに応じた前記画像ブロックの信号希薄性を最小化して前記画像ブロックを再構成することにより、前記画像ブロックを符号化するステップを有し、前記測定値ベクトルは前記画像ブロックに関する変換係数を含む(900)。対応する復号方法は、ピクチャの画像ブロックの測定値ベクトルを受け取り、前記測定値ベクトルを復号し、前記復号された測定値ベクトルに応じた前記画像ブロックの信号希薄性を最小化して前記画像ブロックを再構成することにより、前記画像ブロックを復号する復号し、前記測定値ベクトルは前記画像ブロックに関する変換係数を含む。

Description

本原理は概してビデオの符号化及び復号に関し、より具体的には圧縮センシングを用いるビデオエンコーダ及びデコーダの方法及び装置に関する。
[関連出願との相互参照]
この出願は、2010年1月15日に出願した米国仮出願第61/295,258号の利益を主張するものである。この文献はその全体をここに参照援用する。
[背景技術]
圧縮センシング(compressive sensing、compressive sampling、compressed sensingとも呼ぶ)は、信号が希薄な又は圧縮可能なことが事前に分かっている場合に信号を取得及び再構成する手法である。圧縮センシングの理論を用いると、ナイキストのサンプリングレートより非常に低いレートで信号をサンプリングできる。圧縮センシングは、データ圧縮、磁気共鳴映像法(MRI)などのいろいろなアプリケーションに利用できる。文献では、圧縮センシングは、残差コーディングを改善するビデオ圧縮のフレームワークに組み込まれている。残差はあまり希薄でないことが多いので、改善には限界がある。
圧縮センシング(CS)フレームワークの概要
xを長さNの信号であるとする。ある線形変換Ψ(例えば、離散余弦変換(DCT)や離散ウェーブレット変換(DWT)):
Figure 2013517681
で、K<<N個の計数を用いてxをよく近似できるとき、xはKスパース(K-sparse又は圧縮可能)であると言う。ここで、Ψは希薄化変換(sparsifying
transform)であり、αは変換係数ベクトルであり、αのうちK個の計数のみが非ゼロである。図1を参照して、参照数字100で希薄信号の表示を示した。表示100は、長さNの信号xと、希薄化変換Ψと、変換係数ベクトルαとを含む。
圧縮センシング理論によると、かかる信号は次の非コヒーレント線形予測
Figure 2013517681
により取得できる。ここで、yはM個のエントリーを有する測定ベクトルであり、ΦはM×N非コヒーレントセンシング行列であり、M<<Nである。図2を参照して、参照数字200で、圧縮センシングにおける測定取得方法を示した。方法200は、長さNの信号xと、M個のエントリーを有する測定ベクトルyと、M×N非コヒーレントセンシング行列Φとを含む。
圧縮センシングフレームワークは、次の最適化問題
Figure 2013517681
を解くことにより、xをM≧cKlogN(cは小さい定数)個の測定値のみから正確に回復できるということを主張するものである。ここで、入力信号はx=Ψαにより近似できる。式(3)において、測定ベクトルyとセンシング行列Φと希薄化行列Ψは既知である。しかし、信号xとその変換係数ベクトルαは未知である(求めねばならない)。この場合、αは最適化変数である。
<外1>
Figure 2013517681
文献中最も使われている非コヒーレントセンシング行列Φは、ランダム予測又はランダム行列である。これは各エントリーが、独立かつ同じ分布をしたランダム変数を含む(例えば、各エントリーはガウス分布又はベルヌーイ分布を有する)。かかるランダム行列は、希薄化Ψと最適に非コヒーレントであり、そのため最適な性能を与えることが示せる。
式(3)の目的関数は他の希薄度(sparsity measures)で置き換えることもできる。例えば、画像(又は画像ブロック)などの2次元信号では、希薄度として全変動(TV)を用いることが一般的である。全変動は連続した画素間の差の関数である。全変動の一例は
Figure 2013517681
である。これは、各画素における水平離散グラジエントDhと垂直離散グラジエントDvの大きさの和である。テクスチャがほとんど無い小さな画像ブロックの全変動は小さいことが多い。言い換えると、かかる画像ブロックはグラジエントドメインでは希薄であることが多い。
関連研究
第1の先行技術アプローチでは、ブロック残差のDCT変換係数のサブセットを符号化し、希薄信号回復アルゴリズムを用いて符号化された係数からブロック残差を回復するビデオコーデックが提案されている。希薄信号回復はTV最小化により得られる。式(3)の最適化問題は
Figure 2013517681
となる。ここで、xは残差データであり、すなわち元のデータから予測データを引いた結果である。基本的に、このアプローチは、観測データyの制約の下に、再構成される残差のグラジエントを最小化しようとするものである。量子化プロセスが含まれるので、完全な再構成は原理的に不可能である(すなわち、y=Φxの等号は制約のし過ぎである)。そのため、このアルゴリズムでは、次の問題
Figure 2013517681
を解くことにより、ある誤差の範囲(式(6)のεで示す)を許容する。
このアプローチには以下に説明するように少数だが重大な欠点がある。上記の第1の先行技術アプローチのデコーダは、TV最小化ベースのアルゴリズムを用いてブロック残差を再構成する。このアプローチは、ブロック残差がグラジエントドメインで希薄であるとの前提でうまく機能する。しかし、ブロック残差は、ブロック予測後のグラジエントドメインでは希薄でないことが多く、この前提は空間的冗長性を利用した有向イントラ予測とは互換性が無い。
第1の先行技術アプローチでは、係数をトランケート(truncate)する前に、ブロック残差に対して1次元DCT係数が計算される。このトランケーションすなわちサンプリングパターンは、ブロック残差のエネルギーを最適に捕捉せず、そのためエンコーダの符号化効率を低下させる。さらに、第1の先行技術アプローチで用いられる希薄回復アルゴリズムでは、符号化計数の量子化効果を完全には考慮していないため、再構成されるブロックの画質低下につながる。さらに、第1の先行技術アプローチの実装(implementation)では、準最適なl1最小化アルゴリズム(l1-minimization algorithm)を用いる。そのため、得られるエンコーダは実際のアプリケーションに用いるには遅すぎる。
図3を参照するに、参照数字300で、ピクチャの画像データの符号化方法を示した。方法300は、ループリミットブロック320に制御を渡す開始ブロック310を含む。ループリミットブロック320は、1からピクチャ中のブロックの数(#)までの範囲を有する変数iを用いるループを開始し、機能ブロック330に制御を渡す。機能ブロック330は、イントラ予測/インター予測を行い、カレントブロックの予測を求め、機能ブロック340に制御を渡す。機能ブロック340は、(元のカレントブロックとカレントブロックの予測との間の差を表す)残差にDCT変換を適用し、その変換係数を求め、機能ブロック350に制御を渡す。機能ブロック350は、変換係数を量子化して、量子化変換係数を求め、機能ブロック360に制御を渡す。機能ブロック360は、量子化変換係数をエントロピー符号化して、機能ブロック370に制御を渡す。機能ブロック370は、量子化変換係数を逆量子化して、機能ブロック380に制御を渡す。機能ブロック380は、逆量子化された変換係数を(例えば、離散余弦変換(DCT)を用いて)逆変換して、カレントブロックの再構成残差を求め、機能ブロック390に制御を渡す。機能ブロック390は、カレントブロックの再構成残差(reconstructed residue)をカレントブロックの予測に加えて、カレントブロックを再構成し、ループリミットブロック395に制御を渡す。機能ブロック395において、エンハンスメントレイヤ画像を描き、終了ブロック399に進む。
図4を参照するに、参照数字400で、ピクチャの画像データの復号方法を示した。方法400は、ループリミットブロック420に制御を渡す開始ブロック410を含む。ループリミットブロック420は、1からピクチャ中のブロックの数(#)までの範囲を有する変数iを用いるループを開始し、関数ブロック430に制御を渡す。機能ブロック430は、エントロピー復号をして、量子化された変換係数と、イントラ/インター予測モードと、その他の情報とを求め、機能ブロック440に制御を渡す。機能ブロック440は、カレントブロックの量子化変換係数を逆量子化して、機能ブロック450に制御を渡す。機能ブロック450は、逆量子化された変換係数を(例えば、離散余弦変換(DCT)を用いて)逆変換して、再構成残差を求め、機能ブロック460に制御を渡す。機能ブロック460は、カレントブロックの再構成残差をカレントブロックの予測に加えて、カレントブロックを再構成し、ループリミットブロック470に制御を渡す。機能ブロック470において、エンハンスメントレイヤ画像を描き、終了ブロック499に進む。
こうした先行技術の欠点や不利な点を、本原理は解消する。本原理は圧縮センシングを用いるビデオエンコーダ及びデコーダの方法及び装置に関する。
本原理の一態様によると、装置が提供される。該装置は、ピクチャ中の画像ブロックの測定値ベクトルを生成し、前記測定値ベクトルを符号化し、前記符号化された測定値ベクトルに応じた前記画像ブロックの信号希薄性を最小化して前記画像ブロックを再構成することにより、前記画像ブロックを符号化するビデオエンコーダを有する。前記測定値ベクトルは前記画像ブロックに関する変換係数を含む。
本原理の他の一態様によると、ビデオエンコーダにおける方法が提供される。該方法は、ピクチャ中の画像ブロックの測定値ベクトルを生成し、前記測定値ベクトルを符号化し、前記符号化された測定値ベクトルに応じた前記画像ブロックの信号希薄性を最小化して前記画像ブロックを再構成することにより、前記画像ブロックを符号化するステップを有する。前記測定値ベクトルは前記画像ブロックに関する変換係数を含む。
本原理の他の一態様によると、装置が提供される。該装置は、ピクチャの画像ブロックの測定値ベクトルを受け取り、前記測定値ベクトルを復号し、前記復号された測定値ベクトルに応じた前記画像ブロックの信号希薄性を最小化して前記画像ブロックを再構成することにより、前記画像ブロックを復号するビデオデコーダを有する。前記測定値ベクトルは前記画像ブロックに関する変換係数を含む。
本原理のさらに別の一態様によると、ビデオデコーダにおける方法が提供される。該方法は、ピクチャの画像ブロックの測定値ベクトルを受け取り、前記測定値ベクトルを復号し、前記復号された測定値ベクトルに応じた前記画像ブロックの信号希薄性を最小化して前記画像ブロックを再構成することにより、前記画像ブロックを復号するステップを有する。前記測定値ベクトルは前記画像ブロックに関する変換係数を含む。
本原理の上記その他の態様、特徴、及び有利性は、添付した図面を参照して読むと、実施形態の詳細な説明から明らかとなるであろう。
本原理は以下の図面を参照してよりよく理解することができる。
本原理を適用できる希薄信号の表現を示す図である。 先行技術による圧縮センシングにおける測定値取得方法を示す図である。 先行技術によるピクチャの画像データ符号化方法を示すフロー図である。 先行技術によるピクチャの画像データ復号方法を示すフロー図である。 本原理の一実施形態による、本原理を適用できるビデオエンコーダの一例を示すブロック図である。 本原理の一実施形態による、本原理を適用できるビデオデコーダの一例を示すブロック図である。 本原理の一実施形態による、ブロック再構成方法の一例を示すフロー図である。 本原理の一実施形態による、重み付けファクタの適応的調整を含む、量子化ノイズ補正方法の一例を示すフロー図である。 本原理の一実施形態による、ピクチャの画像データ符号化方法の一例を示すフロー図である。 本原理の一実施形態による、ピクチャの画像データ復号方法の一例を示すフロー図である。
本原理は、圧縮センシングを用いるビデオエンコーダとビデオデコーダの方法と装置とに関する。
この説明は本原理を例示するものである。言うまでもなく、当業者は、ここには明示的に説明や図示はしていないが、本原理を化体し、その精神と範囲内に含まれる様々な構成を工夫することができる。
ここに記載したすべての例と条件付きの言葉は、発明者が技術発展に対してなした本原理とコンセプトとを、読者が理解しやすいようにするためのものであり、その解釈は具体的に記載した実施例や条件に限定されるべきではない。
さらに、本原理の原理、態様、実施形態、及びその実施例のすべての記載は、その構成的等価物及び機能的等価物の両方を含むものである。また、かかる等価物は、現在知られている等価物及び将来開発される等価物を含み、すなわち、構成にかかわらず同じ機能を発揮する開発されるすべての要素を含む。
よって、例えば、当業者には言うまでもなく、ここに説明したブロック図は本原理を化体する回路を概念的に示すものである。同様に、言うまでもなく、フローチャート、フロー図、状態遷移図、擬似コード等は、様々な方法(processes)を表し、これらの方法をコンピュータ読み取り可能媒体に実質的に表しても、(明示的に示していようがいまいが)コンピュータやプロセッサで実行してもよい。
図示した様々な要素の機能は、専用ハードウェアを用いても、ソフトウェアを実行可能なハードウェアと適当なソフトウェアとを組み合わせても提供できる。プロセッサを設けるとき、機能を単一の専用プロセッサで提供してもよいし、共有された単一のプロセッサで提供してもよいし、一部が共有された複数の個別プロセッサで提供してもよい。さらに、「プロセッサ」または「コントローラ」という用語を明示的に使用した場合、ソフトウェアを実行できるハードウェアのみをいうと解釈してはならず、限定はされないが、デジタルシグナルプロセッサ(DSP)、ソフトウェアを記憶するROM、RAM、不揮発性記憶装置を黙示的に含んでもよい。
その他のハードウェアを従来のものでもカスタムのものであっても含んでもよい。同様に、図面に示したスイッチは概念的なものである。スイッチの機能は、プログラムロジックの動作、専用ロジックの動作、プログラム制御や専用ロジックのインターラクション、またはマニュアルで実行されてもよく、具体的な方法は実施者が文脈から判断して選択できる。
請求項において、特定の機能を実行する手段として表した要素は、その機能を実行するいかなる方法も含み、例えば、a)その機能を実行する回路要素の組合せと、b)ファームウェアやマイクロコード等を含む任意の形式のソフトウェア及びそれと組み合わせたその機能を実行する適当な回路とを含む。請求項に記載した本原理は、記載した様々な手段が提供する機能を、請求項に記載したように組み合わせることにある。よって、これらの機能を提供できる手段はどれでも、ここに示したものと等化であると見なせる。
明細書において、本発明の「一実施形態」、またはそのバリエーションと言う場合、本発明の少なくとも1つの実施形態に含まれるその実施形態に関して説明する具体的な特徴、構造、特性などを意味する。それゆえ、本明細書を通していろいろなところに記載した「一実施形態において」またはそのバリエーションは、必ずしもすべてが同じ実施形態を参照するものではない。
言うまでもなく、例えば、「A/B」、「A及び/又はB」、および「AとBの少なくとも一方」のうちの「及び/又は」および「少なくとも一方」などと言うとき、第1のオプション(A)のみを選択する場合、第2のオプション(B)のみを選択する場合、又は両方のオプション(AとB)を選択する場合を含むものとする。別の例として、例えば、「A、B、及び/又はC」、および「A、B、及びCの少なくとも一方」などと言うとき、第1のオプション(A)のみを選択する場合、第2のオプション(B)のみを選択する場合、第3のオプション(C)のみを選択する場合、第1と第2のオプション(AとB)のみを選択する場合、第2と第3のオプション(BとC)を選択する場合、第1と第3のオプション(AとC)を選択する場合、又は3つすべてのオプション(AとBとC)を選択する場合を含むものとする。本技術分野及び関連技術分野の当業者には明らかなように、これは多数の場合にも拡張できる。
また、ここで、「ピクチャ(picture)」と「画像(image)」との用語は、交換可能に使い、静止画像とビデオシーケンスの画像とを言う。知られているように、ピクチャはフレーム又はフィールドであってもよい。
さらに、以下を付記する。ここで、「測定ベクトル」とは、変換係数のサブセットを言う。例えば、一実施形態では、次の式を使う。これは以下、式(4)である。すなわち、y=A(x)。ここで、yは測定ベクトルであり、A()は演算子であり、xは信号である。われわれの例では、演算A()において、変換係数はxを変換することにより生成され、変換係数をジグザグの順序でスキャンし、第1の計数をサブセットとして選択する。この変換係数のサブセットを測定ベクトルと呼ぶベクトルに入れる。このように、ここでは、「画像ブロックに関する変換係数」とは、以下にもっと詳しく説明するように、画像ブロックに対して生成された測定ベクトルに関連して用いるとき、その画像ブロックの残差の変換係数のサブセット及び/又はその画像ブロックの予測に対する変換係数のサブセットを言う。残差に対する変換係数のサブセットと予測に対する変換係数のサブセットを組み合わせて、画像ブロックの測定ベクトルを求める(例えば、以下の式(9)を参照)。
一実施形態では、(1)残差係数A(xres)のサブセットと、(2)予測ブロック(Xpred)とが分かっている時に、画像ブロックxをいかに再構成するかを説明する。直感的には、定数A(x)が受け取った情報に近くなければならないという制約の下で、すべての可能なxの値にわたりループを回して、xの希薄性を最小化する値を見つける。定数A(x)はここで「推定された測定値」とも呼ぶ。受け取られる情報はy=A(xres)+A(xpred)であり、ここで「再構成された測定値」とも呼ぶ。この問題は重み付けファクタμを用いて式(8)に定式化する。
図5を参照して、本原理を適用できるビデオエンコーダを参照数字500で示した。ビデオエンコーダ500は、コンバイナ585の非反転入力と信号通信している出力を有するフレーム順序付けバッファ510を含む。コンバイナ585の出力は変換器及び量子化器525の第1の入力と接続され信号通信している。変換器及び量子化器525の出力は、エントロピーコーダ545の第1の入力及び逆変換器及び逆量子化器550の第1の入力と接続され信号通信している。エントロピーコーダ545の出力は、コンバイナ590の第1の非反転入力と接続され信号通信している。コンバイナ590の出力は出力バッファ535の第1の入力と接続され信号通信している。
エンコーダコントローラ505の第1の出力は、フレーム順序付けバッファ510の第2の入力と、逆変換器及び逆量子化器550の第2の入力と、ピクチャタイプ決定モジュール515の入力と、マクロブロックタイプ(MBタイプ)決定モジュール520の第1の入力と、イントラ予測モジュール560の第2の入力と、デブロッキングフィルタ565の第2の入力と、動き補償器570の第1の入力と、動き推定器575の第1の入力と、基準ピクチャバッファ580の第2の入力とに接続され、信号通信している。
エンコーダコントローラ505の第2の出力は、サプリメンタルエンハンスメント情報(SEI)挿入器530の第1の入力と、変換器及び量子化器525の第2の入力と、エントロピーコーダ545の第2の入力と、出力バッファ535の第2の入力と、シーケンスパラメータセット(SPS)及びピクチャパラメータセット(PPS)挿入器540の入力とに接続され、信号通信している。
SEI挿入器530の出力は、コンバイナ590の第2の非反転入力と接続され信号通信している。
ピクチャタイプ決定モジュール515の第1の出力は、フレーム順序付けバッファ510の第3の入力に接続され信号通信している。ピクチャタイプ決定モジュール515の第2の出力は、マクロブロックタイプ決定モジュール520の第2の入力に接続され信号通信している。
シーケンスパラメータセット(SPS)及びピクチャパラメータセット(PPS)挿入器540の出力は、コンバイナ590の第3の非反転入力と接続され信号通信している。
逆量子化及び逆変換器550の出力は、コンバイナ519の第1の非反転入力と接続され信号通信している。コンバイナ519の出力は、イントラ予測モジュール560の第1の入力と、及びデブロッキングフィルタ565の第1の入力と接続され、信号通信している。デブロッキングフィルタ565の出力は基準ピクチャバッファ580の第1の入力と接続され、信号通信している。基準ピクチャバッファ580の出力は、動き推定器575の第2の入力と、及び動き補償器570の第3の入力と接続され、信号通信している。動き推定器575の第1の出力は動き補償器570の第2の入力と接続され、信号通信している。動き推定器575の第2の出力はエントロピーコーダ545の第3の入力と接続され、信号通信している。
動き補償器570の出力はスイッチ597の第1の入力と接続され、信号通信している。イントラ予測モジュール560の出力はスイッチ597の第2の入力と接続され、信号通信している。マクロブロックタイプ決定モジュール520の出力はスイッチ597の第3の入力と接続され、信号通信している。スイッチ597の第3の入力は、スイッチの「データ」入力が、(制御入力すなわち第3の入力と比較して)動き補償器570から提供されるか、又はイントラ予測モジュール560から提供されるか、判断する。スイッチ597の出力は、コンバイナ519の第2の非反転入力と、及びコンバイナ585の反転入力と接続され、信号通信している。
フレーム順序付けバッファ510の第1の入力と、エンコーダコントローラ505の入力は、入力ピクチャを受け取る、エンコーダ500の入力としても利用可能である。さらに、サプリメンタルエンハンスメント情報(SEI)挿入器530の第2の入力は、メタデータを受け取る、エンコーダ500の入力としても利用可能である。出力バッファ535の出力は、ビットストリームを出力する、エンコーダ500の出力として利用できる。
図6を参照して、本原理を適用できるビデオデコーダの一例を参照数字600で示した。ビデオデコーダ600は入力バッファ610を含む。入力バッファ610の出力は、エントロピーデコーダ645の第1の入力と接続され、信号通信している。エントロピーデコーダ645の第1の出力は逆変換及び逆量子化器650の第1の入力と接続され、信号通信している。逆量子化及び逆変換器650の出力は、コンバイナ625の第2の非反転入力と接続され、信号通信している。コンバイナ625の出力は、デブロッキングフィルタ665の第2の入力と、及びイントラ予測モジュール660の第1の入力と接続され、信号通信している。デブロッキングフィルタ665の第2の出力は基準ピクチャバッファ680の第1の入力と接続され、信号通信している。基準ピクチャバッファ680の出力は動き補償器670の第2の入力と接続され、信号通信している。
エントロピーデコーダ645の第2の出力は、動き報償器670の第3の入力と、デブロッキングフィルタ665の第1の入力と、及びイントラ予測器660の第3の入力と接続され、信号通信している。エントロピーデコーダ645の第3の出力はデコーダコントローラ605の入力と接続され、信号通信している。デコーダコントローラ605の第1の出力はエントロピーデコーダ645の第2の入力と接続され、信号通信している。デコーダコントローラ605の第2の出力は逆変換及び逆量子化器650の第2の入力と接続され、信号通信している。デコーダコントローラ605の第3の出力はデブロッキングフィルタ665の第3の入力と接続され、信号通信している。デコーダコントローラ505の第4の出力はイントラ予測モジュール660の第2の入力と、動き補償器670の第1の入力と、基準ピクチャバッファ680の第2の入力と接続され、信号通信している。
動き補償器670の出力はスイッチ697の第1の入力と接続され、信号通信している。イントラ予測モジュール660の出力はスイッチ697の第2の入力と接続され、信号通信している。スイッチ697の出力は、コンバイナ625の第1の非反転入力と接続され、信号通信している。
入力バッファ610の入力は、入力ビットストリームを受け取る、デコーダ600の入力として利用できる。デブロッキングフィルタ665の第1の出力は、出力ピクチャを出力する、デコーダ600の出力として利用できる。
量子化ステップのため、最終的に再構成されるブロックには量子化ノイズがある。すなわち、我々は、現在の技術水準のビデオエンコーダ及びデコーダ(例えば、International Organization for Standardization/International
Electrotechnical Commission (ISO IEC) Moving Picture Experts Group-4 (MPEG-4) Part 10
Advanced Video Coding (AVC) Standard/International
Telecommunication Union, Telecommunication Sector (ITU-T) H.264 Recommendation(以下、「MPEG-4 AVC Standard」と呼ぶ)や、ISO/IEC MPEG-2 Standardなど)では、量子化パラメータが希薄になるとより大きな性能損失が生じることを認識した。かかる量子化ノイズは、ブロック残差の変換係数の量子化及び逆量子化により生じる。
本原理では、量子化ノイズの効果を緩和する方法と装置を提案する。一実施形態では、本原理により、量子化ノイズを緩和する非線形再構成法を提供する。提案の再構成は、部分的に、ノイズ除去方法とみなすことができる。また、本原理は、変換係数のサブセットのみを符号化してビットレートを低減する新しい圧縮センシングコーディング法も提供する。新しい非線形再構成法は、量子化ノイズを補償し、トランケート(truncate)された変換係数を回復するために利用できる。
我々が提案するアプローチは、先行技術の上記の限界の解決を試み、コーディング効率が高く実行が速いソリューションを提供するものである。
ここで、変換係数を符号化する新しい方法と、画像ブロックを回復する新しい再構成アルゴリズムとを提案する。我々が導入する新しいコーディングモード(すなわち、圧縮センシングモード又はCSモード)は、圧縮センシング理論に基づくものである。このモードでは、変換係数のサブセットのみを符号化し、希薄信号回復アルゴリズムを利用して符号化係数からブロックを回復する。エンコーダは既存のコーディングモードと提案のCSモードとを選択して、ブロック残差を符号化する。
ブロック残差を符号化する新規のCSコーディングモード
圧縮センシングフレームワークの通常のプラクティスに従えば、非コヒーレンスを保証するには、変換係数のランダムなサブセットの選択又はランダム予測が最適である。しかし、圧縮アプリケーションでは、このセンシング行列はよい性能は得られない。これは以下のように理解できる。圧縮センシングフレームワークの性能基準と画像圧縮の性能基準とはまったく異なる。前者は、再構成信号の品質に対する測定数(PSNR)であり、後者は再構成信号の品質に対するコーディングビット量である。留意点として、コーディングビット量は、符号化された測定の数だけでなく、その測定の統計的分布にも依存する。それゆえ、画像圧縮アプリケーションに対するよいセンシングオペレータは、非コヒーレントであり圧縮率の高い測定をしなければならない。ランダム予測では非コヒーレンスが高くなるが、その測定値はガウス分布しやすく、圧縮するのが困難である。このように、圧縮アプリケーションにとってランダム予測は非効率である。
我々は、ランダム予測を利用せず、ブロック残差の変換係数を全部は符号化しない。そのかわり、変換係数のサブセットのみを符号化し、残りの変換係数は無視することを提案する。一実施形態では、ジグザクの順番で変換係数をスキャンして、最初の係数をサブセットとして選択する。この変換係数のサブセットをブロック残差の測定ベクトルと呼ぶベクトルに入れる。測定値の取得は数学的に
Figure 2013517681
で表せる。ここで、xresはブロック残差を示し、yresはブロック残差の変換係数のサブセットを含むベクトルを示し、Aは(例えば、2次元DCT変換や整数MPEG−4AVC標準変換により)ブロック残差を変換してジグザグのスキャン順序で最初のエントリーのサブセットを選択する演算子を表す。
このセンシング演算子Aは、(イ)ブロック残差のエネルギーを最大限捕捉し、(ロ)簡単に統合できるように、現在のMPEG−4AVC標準整数変換と調和する。我々が提案するセンシング方法では、非コヒーレンスと圧縮可能性との間のバランスがよくなり、圧縮性能が高くなる。
新規なブロック再構成方法
画像ブロックを再構成するため、ピクセルドメインにおけるTV最小化ブロック再構成を用いる。これは量子化パラメータで適応的に調整できる。言うまでもなく、式(4)又は(5)に関する制約下での最適化は、
Figure 2013517681
の無制約下の最適化と等価である。ここで、μはTV重み付け係数と呼ばれることが多い実正数である。この無制約最適化アプローチを用いるのは、制約下でのものよりもずっと速く解けるからである。また、適応的TV重み付け係数μを用いて量子化ノイズを補償する。
(カレントブロックの)予測ブロックと、カレントブロックのブロックのブロック残差の測定値ベクトル(カレントブロックのブロック残差yresの測定値ベクトルはそのブロック残差yresの変換係数のサブセットを含む)とに基づき、カレントブロックのブロック再構成をする新規な方法を次に提案する。
ステップ1:予測ブロックの重要な変換係数のサブセットを含む、予測ブロックの測定値ベクトルを生成し、ypredで示す:
Figure 2013517681
ステップ2:(現)再構成ブロックの測定値ベクトルを、ブロック残差の測定値ベクトルを予測ブロックの測定値ベクトルに加えることにより生成する:
Figure 2013517681
ステップ3:最終的な再構成ブロックの最適化問題
Figure 2013517681
を解く。ここで、xrecは最終的再構成ブロックであり、Ψはxに対する演算子であり、μは重み付けファクタである。Ψはどんな演算子でもよいが、このアルゴリズムは、信号が希薄な空間にΨがマッピングするときに機能する。この点で、トータルバリエーション(TV)がよい例であるのは、ピクチャ中の多くのブロックはグラジエントドメインでは希薄だからである。最適化変数はxである。
図7を参照して、参照数字700でブロック再構成方法を示した。方法700は、開始ブロック710を含み、開始ブロック710は機能ブロック720に制御を渡す。機能ブロック720は、予測ブロックの変換係数のサブセットである測定値ベクトルを生成し、制御を機能ブロック730に渡す。機能ブロック730は、予測ブロックの測定ベクトルを、ブロック残差の変換係数のサブセットである(逆量子化した)測定値ベクトルに加えることにより、再構成ブロックの測定値ベクトルを生成し、機能ブロック740に制御を渡す。機能ブロック740は、再構成ブロックの測定値ベクトルで目標関数を最小化して、終了ブロック799に制御を渡す。
ブロック残差yresの測定値ベクトルを量子化(し、再構成のために逆量子化)する時に量子化ノイズが生じる。この量子化ノイズを補正するため、図8に示したように、ファクタμを量子化ステップに対して適応的に調整する。図8を参照して、重み付けファクタの適応的調整を含む量子化ノイズ補正方法の一例を参照数字800で示した。方法800は、開始ブロック810を含み、開始ブロック710は機能ブロック815に制御を渡す。機能ブロック815は、信号の希薄性と測定誤差との、重み付けファクタμによる重み付け和として、最小化関数を定式化し、機能ブロック820に制御を渡す。測定誤差は再構成した測定値と推測した測定値との間の差を表す。機能ブロック820は、重み付けファクタμを量子化パラメータに適応するように設定し、機能ブロック830に制御を渡す。機能ブロック830は、適応的重み付けファクタμで目標関数を最小化して、終了ブロック899に制御を渡す。
新規なビデオ符号化とビデオ復号
本原理は、既存の(例えば、MPEG−4AVC標準、MPEG−2標準などの)ビデオエンコーダとデコーダに対して、新しい圧縮センシングコーディングモードと新しいブロック再構成アルゴリズムとを組み込む。図5を参照して、本原理を適用できるビデオエンコーダを説明し、図6を参照して、本原理を適用できるビデオデコーダを説明する。
図9を参照するに、参照数字900で、ピクチャの画像データの符号化方法を示した。方法900は、有利にも、本原理による新規の圧縮センシングモードと新規のブロック再構成とを組み込んだものである。方法900は、ループリミットブロック910に制御を渡す開始ブロック905を含む。ループリミットブロック910は、1からブロックの数(#)までの範囲を有する変数iを用いるループを開始し、機能ブロック915に制御を渡す。機能ブロック915はイントラ/インター予測を行い、機能ブロック920に制御を渡す。機能ブロック920は、残差にDCT変換を適用して、変換係数を求め、機能ブロック925に制御を渡す。機能ブロック925は、係数トランケーションを行い、(変換係数のサブセットのみを残して)測定値ベクトルを求め、機能ブロック930に制御を渡す。機能ブロック930は、(トランケーションされた)変換係数を量子化して、機能ブロック935に制御を渡す。機能ブロック935は、量子化された変換係数をエントロピー符号化して、機能ブロック940に制御を渡す。機能ブロック940は、量子化された変換係数を逆量子化して、機能ブロック945に制御を渡す。機能ブロック945は、例えば、図7の方法700を用いて、ブロック測定値の生成を行い、機能ブロック950に制御を渡す。機能ブロック950は、式(8)に記載した最適化問題を解いて、TV最小再構成ブロックを求め、機能ブロック955に制御を渡す。機能ブロック955は、レート歪み計算を行い、レート歪み値J1を求め、判断ブロック990に制御を渡す。判断ブロック990は、J1<J2かどうか判断する。そうであれば、制御は機能ブロック992に渡される。そうでなければ、制御は機能ブロック994に渡される。機能ブロック992は、圧縮センシング(CS)コーディング法を選択し、CSフラグ=1を設定し、ループ制限ブロック996に制御を渡す。ループ制限ブロック996は、ループを終了し、終了ブロック999に制御を渡す。機能ブロック960は、変換係数を量子化して、機能ブロック965に制御を渡す。機能ブロック965は、量子化された変換係数をエントロピー符号化して、機能ブロック970に制御を渡す。機能ブロック970は、量子化された変換係数を逆量子化して、機能ブロック975に制御を渡す。機能ブロック975は、量子化された変換係数に逆離散余弦変換(IDCT)を適用して、再構成残差を求め、機能ブロック980に制御を渡す。機能ブロック980は、(機能ブロック980で求めた)再構成残差を(機能ブロック915で求めた)予測値に加えて、予測値で補正した再構成ブロックを求め、機能ブロック985に制御を渡す。機能ブロック985は、レート歪み補正を行い、レート歪み値J2を求め、判断ブロック990に制御を渡す。
図10を参照するに、参照数字1000で、ピクチャの画像データの復号方法を示した。方法1000は、有利にも、本原理による新規の圧縮センシングモードと新規のブロック再構成とを組み込んだものである。方法1000は、開始ブロック1005を含み、開始ブロック1005はループリミットブロック1010に制御を渡す。ループリミットブロック1010は、1からブロックの数(#)までの範囲を有する変数iを用いるループを開始し、機能ブロック1015に制御を渡す。機能ブロック1015は、ビットストリームをエントロピー復号して、残差の量子化された変換係数と、イントラ/インター予測モードと、その他の情報とを求め、機能ブロック1020に制御を渡す。機能ブロック1020は、CSフラグを読み、機能ブロック1025に制御を渡す。判断ブロック1025は、CSフラグ=1かどうか判断する。そうであれば、制御は機能ブロック1030に渡される。そうでなければ、制御は機能ブロック1050に渡される。機能ブロック1030は、量子化された変換係数を逆量子化して、残差の変換係数を求め、機能ブロック1035に制御を渡す。機能ブロック1035は、例えば、図7の方法700を用いて、ブロック測定値の生成を行い、機能ブロック1040に制御を渡す。機能ブロック1040は、式(8)に記載した最適化問題を解いて、TV最小再構成ブロックを求め、機能ブロック1045に制御を渡す。ループ制限ブロック1045は、ループを終了し、終了ブロック1099に制御を渡す。機能ブロック1050は、残差の量子化された変換係数を逆量子化して、その変換係数を求め、機能ブロック1055に制御を渡す。機能ブロック1055は、残差の変換係数に逆変換(例えば、離散余弦変換(IDCT))を適用して、残差を再構成し、機能ブロック1060に制御を渡す。機能ブロック1060は、カレントブロックの再構成残差をカレントブロックの予測値に加えて、予測補正再構成ブロックを求め、ループリミットブロック1045に制御を渡す。
我々が提案するブロック再構成に対するアプローチは、上記の先行技術のアプローチのようにブロック残差を再構成するのではなく、画像/ピクセルドメインでブロックを再構成することを試みるものである。これは、自然画像ブロックはその残差よりもグラジエントが希薄である(gradient sparse)との我々の観察に基づく。よって、ピクセルドメインでTV最小化を解くことにより、信号再構成の品質を高くすることができる。また、(イ)従来のアプローチにおける1次元DCTではなく、2次元DCT変換(又は正数MPEG−4AVC標準変換)を用い、(ロ)ジグザグスキャニング順に基づく異なるサンプリングパターンを用いる(すなわち、変換係数をジグザグスキャニング順にソートし、最初のエントリーを用いてサブセットを選択する)。我々の目標は、符号化係数の数を一定にしつつ、より多くのブロック残差エネルギーをキャプチャすることである。信号を再構成するため、より高速で効率的なTV最小化アルゴリズムを用いてブロック再構成をスピードアップする。また、ブロック再構成をノイズ除去プロセス(de-noising process)とみなす。このように、量子化ノイズを補償するため、式(7)のファクタμを、量子化ステップサイズや量子化パラメータに対して適応的に調整する。
エンコーダは、レート歪み(RD)最適化に基づき、ブロック残差を、既存のコーディングモードを用いて符号化するか、圧縮センシングコーディングモードを用いて符号化するか決定する。各ブロックについて、エンコーダが圧縮センシングモードを用いるかどうか示すフラグがデコーダに送られる。デコーダは、エンコーダで選択されたコーディングモードの情報をえるためCSフラグを読み、適切な再構成アルゴリズムを実行する。
ここで、本発明に付随する多くの利点/特徴を説明する。一部はすでに上記したことである。例えば、一利点/特徴は、装置が、ピクチャ中の画像ブロックの測定値ベクトルを生成し、前記測定値ベクトルを符号化し、前記符号化された測定値ベクトルに応じた前記画像ブロックの信号希薄性を最小化して前記画像ブロックを再構成することにより、前記画像ブロックを符号化するビデオエンコーダを有し、前記測定値ベクトルは前記画像ブロックに関する変換係数を含むことである。
他の一利点/特徴は、上記のビデオエンコーダを有する装置において、前記測定値ベクトルは前記画像ブロック対して決まる残差に応じて決まり、前記残差は前記画像ブロックの元のものと前記画像ブロックの予測との間の差を表すことである。
さらに他の一利点/特徴は、上記ビデオエンコーダを有する装置において、前記測定値ベクトルは前記画像ブロック対して決まる残差に応じて決まり、前記残差は前記画像ブロックの元のものと前記画像ブロックの予測との間の差を表し、前記測定値ベクトルは、前記残差の変換係数のサブセットを含むことである。
他の一利点/特徴は、上記のビデオエンコーダを有する装置において、前記測定ベクトルが量子化とエントロピー符号化とを用いて符号化されていることである。
さらに、他の一利点/特徴は、上記のビデオエンコーダを有する装置において、前記信号の希薄性は画像ドメインで決定されることである。
さらに他の一利点/特徴は、上記ビデオエンコーダを有する装置において、上記の通り、前記信号の希薄性は画像ドメインで決定される、前記信号の希薄性はトータルバリエーションで測定され、前記トータルバリエーションは前記画像ブロック中の連続するピクセル間の差の関数であることである。
さらに、他の一利点/特徴は、上記のビデオエンコーダを有する装置において、前記画像ブロックの信号の希薄性は、信号希薄性と測定誤差の重み付け和として定式化される最小化関数を用いて最小化され、前記測定誤差は前記画像ブロックの再構成された測定値と推定された測定値との間の差を表すことである。
本原理の上記その他の特徴と利点は、当業者はここに開示した教示に基づき容易に確認できるであろう。言うまでもなく、本原理の教示は、ハードウェア、ソフトウェア、ファームウェア、特殊用途プロセッサ、またはこれらの組み合わせなどのいろいろな形体で実施することができる。
最も好ましくは、本原理の教示をハードウェアとソフトウェアの組合せとして実施する。また、ソフトウェアはプログラム記録装置に実態的に化体されたアプリケーションプログラムとして実施してもよい。そのアプリケーションプログラムは、好適なアーキテクチャを有する機械にアップロードされ、実行される。好ましくは、機械は、中央処理装置(CPU)、ランダムアクセスメモリ(RAM)、及び入出力(I/O)インターフェイス等のハードウェアを有するコンピュータプラットフォームで実施される。コンピュータプラットフォームはオペレーティングシステムとマイクロコードも含んでもよい。ここに説明した様々なプロセスや機能は、CPUが実行できる、マイクロ命令コードの一部やアプリケーションプログラムの一部であってもよく、これらのいかなる組合せであってもよい。また、追加的データ記憶装置や印刷装置等その他の様々な周辺装置をコンピュータプラットフォームに接続してもよい。
さらに言うまでもなく、添付した図面に示したシステム構成要素や方法の一部はソフトウェアで実施されることが好ましいが、システム構成要素(または方法)間の実際的な結合は本原理をプログラムするそのプログラム方法に応じて異なる。ここに開示された本発明の教示を受けて、関連技術分野の当業者は、本原理の同様な実施形態や構成を考えることができるであろう。
例示した実施形態を添付した図面を参照して説明したが、言うまでもなく、本原理はこれらの実施形態には限定されず、当業者は、本原理の範囲と精神から逸脱することなく、様々な変化と修正を施すことができるであろう。かかる変更や修正はすべて添付した請求項に記載した本原理の範囲内に含まれるものである。

Claims (29)

  1. ピクチャ中の画像ブロックの測定値ベクトルを生成し、前記測定値ベクトルを符号化し、前記符号化された測定値ベクトルに応じた前記画像ブロックの信号希薄性を最小化して前記画像ブロックを再構成することにより、前記画像ブロックを符号化するビデオエンコーダを有し、前記測定値ベクトルは前記画像ブロックに関する変換係数を含む、装置。
  2. 前記測定値ベクトルは前記画像ブロック対して決まる残差に応じて決まり、前記残差は前記画像ブロックの元のものと前記画像ブロックの予測との間の差を表す、請求項1に記載の装置。
  3. 前記測定値ベクトルは、前記残差の変換係数のサブセットを含む、請求項2に記載の装置。
  4. 前記測定ベクトルが量子化とエントロピー符号化とを用いて符号化されている、請求項1に記載の装置。
  5. 前記信号の希薄性は画像ドメインで決定される、請求項1に記載の装置。
  6. 前記信号の希薄性はトータルバリエーションで測定され、前記トータルバリエーションは前記画像ブロック中の連続するピクセル間の差の関数である、請求項5に記載の装置。
  7. 前記画像ブロックの信号の希薄性は、信号希薄性と測定誤差の重み付け和として定式化される最小化関数を用いて最小化され、前記測定誤差は前記画像ブロックの再構成された測定値と推定された測定値との間の差を表す、請求項1に記載の装置。
  8. ビデオエンコーダにおいて、
    ピクチャ中の画像ブロックの測定値ベクトルを生成し、前記測定値ベクトルを符号化し、前記符号化された測定値ベクトルに応じた前記画像ブロックの信号希薄性を最小化して前記画像ブロックを再構成することにより、前記画像ブロックを符号化するステップを有し、前記測定値ベクトルは前記画像ブロックに関する変換係数を含む、方法。
  9. 前記測定値ベクトルは前記画像ブロック対して決まる残差に応じて決まり、前記残差は前記画像ブロックの元のものと前記画像ブロックの予測との間の差を表す、請求項8に記載の方法。
  10. 前記測定値ベクトルは、前記残差の変換係数のサブセットを含む、請求項9に記載の方法。
  11. 前記測定ベクトルが量子化とエントロピー符号化とを用いて符号化されている、請求項8に記載の方法。
  12. 前記信号の希薄性は画像ドメインで決定される、請求項8に記載の方法。
  13. 前記信号の希薄性はトータルバリエーションで測定され、前記トータルバリエーションは前記画像ブロック中の連続するピクセル間の差の関数である、請求項12に記載の方法。
  14. 前記画像ブロックの信号の希薄性は、信号希薄性と測定誤差の重み付け和として定式化される最小化関数を用いて最小化され、前記測定誤差は前記画像ブロックの再構成された測定値と推定された測定値との間の差を表す、請求項8に記載の方法。
  15. 前記方法はコーディングモードとして実装され、前記コーディングモードを選択するかどうかはフラグを用いてシグナリングされる、請求項1に記載の方法。
  16. 前記コーディングモードはレート歪みに基づく、請求項15に記載の方法。
  17. ピクチャの画像ブロックの測定値ベクトルを受け取り、前記測定値ベクトルを復号し、前記復号された測定値ベクトルに応じた前記画像ブロックの信号希薄性を最小化して前記画像ブロックを再構成することにより、前記画像ブロックを復号するビデオデコーダを有し、前記測定値ベクトルは前記画像ブロックに関する変換係数を含む、装置。
  18. 前記測定値ベクトルは前記画像ブロック対して決まる残差に応じて決まり、前記残差は前記画像ブロックの元のものと前記画像ブロックの予測との間の差を表す、請求項17に記載の装置。
  19. 前記測定値ベクトルは、前記残差の変換係数のサブセットを含む、請求項18に記載の装置。
  20. 前記測定ベクトルが量子化とエントロピー符号化とを用いて符号化されている、請求項17に記載の装置。
  21. 前記信号の希薄性は画像ドメインで決定される、請求項17に記載の装置。
  22. 前記画像ブロックの信号の希薄性は、信号希薄性と測定誤差の重み付け和として定式化される最小化関数を用いて最小化され、前記測定誤差は前記画像ブロックの再構成された測定値と推定された測定値との間の差を表す、請求項17に記載の装置。
  23. ビデオデコーダにおいて、
    ピクチャの画像ブロックの測定値ベクトルを受け取り、前記測定値ベクトルを復号し、前記復号された測定値ベクトルに応じた前記画像ブロックの信号希薄性を最小化して前記画像ブロックを再構成することにより、前記画像ブロックを復号するステップを有し、前記測定値ベクトルは前記画像ブロックに関する変換係数を含む、方法。
  24. 前記測定値ベクトルは前記画像ブロック対して決まる残差に応じて決まり、前記残差は前記画像ブロックの元のものと前記画像ブロックの予測との間の差を表す、請求項23に記載の方法。
  25. 前記測定値ベクトルは、前記残差の変換係数のサブセットを含む、請求項24に記載の方法。
  26. 前記測定ベクトルが量子化とエントロピー符号化とを用いて符号化されている、請求項23に記載の方法。
  27. 前記信号の希薄性は画像ドメインで決定される、請求項23に記載の方法。
  28. 前記画像ブロックの信号の希薄性は、信号希薄性と測定誤差の重み付け和として定式化される最小化関数を用いて最小化され、前記測定誤差は前記画像ブロックの再構成された測定値と推定された測定値との間の差を表す、請求項23に記載の方法。
  29. ビデオ信号データがエンコードされたコンピュータ読み取り可能記憶媒体であって、
    ピクチャ中の画像ブロックの測定値ベクトルを生成し、前記測定値ベクトルを符号化し、前記符号化された測定値ベクトルに応じた前記画像ブロックの信号希薄性を最小化して前記画像ブロックを再構成することにより、符号化された前記画像ブロックを有し、前記測定値ベクトルは前記画像ブロックに関する変換係数を含む、コンピュータ読み取り可能記憶媒体。
JP2012548958A 2010-01-15 2011-01-14 圧縮センシングを用いるビデオコーディング Expired - Fee Related JP5785955B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US29525810P 2010-01-15 2010-01-15
US61/295,258 2010-01-15
PCT/US2011/000064 WO2011087908A1 (en) 2010-01-15 2011-01-14 Video coding using compressive sensing

Publications (3)

Publication Number Publication Date
JP2013517681A true JP2013517681A (ja) 2013-05-16
JP2013517681A5 JP2013517681A5 (ja) 2014-01-16
JP5785955B2 JP5785955B2 (ja) 2015-09-30

Family

ID=44070685

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012548958A Expired - Fee Related JP5785955B2 (ja) 2010-01-15 2011-01-14 圧縮センシングを用いるビデオコーディング

Country Status (7)

Country Link
US (1) US20120288003A1 (ja)
EP (1) EP2524506B1 (ja)
JP (1) JP5785955B2 (ja)
KR (1) KR101846467B1 (ja)
CN (2) CN102714730B (ja)
BR (1) BR112012017145A2 (ja)
WO (1) WO2011087908A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013543312A (ja) * 2010-09-30 2013-11-28 アルカテル−ルーセント 圧縮測定値を使用するビデオ符号化
WO2017183448A1 (ja) * 2016-04-19 2017-10-26 ソニー株式会社 データ処理装置、データ処理方法、プログラム

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112012017145A2 (pt) * 2010-01-15 2018-06-19 Thomson Licensing codificação de vídeo usando detecção compressiva.
US9313465B2 (en) 2010-06-07 2016-04-12 Thomson Licensing Learned transform and compressive sensing for video coding
JP5908914B2 (ja) * 2010-10-14 2016-04-26 トムソン ライセンシングThomson Licensing 運動行列を用いた映像の符号化および復号のための方法および装置
US9042440B2 (en) 2010-12-03 2015-05-26 Qualcomm Incorporated Coding the position of a last significant coefficient within a video block based on a scanning order for the block in video coding
US8976861B2 (en) 2010-12-03 2015-03-10 Qualcomm Incorporated Separately coding the position of a last significant coefficient of a video block in video coding
US20120163472A1 (en) * 2010-12-22 2012-06-28 Qualcomm Incorporated Efficiently coding scanning order information for a video block in video coding
US20120163456A1 (en) 2010-12-22 2012-06-28 Qualcomm Incorporated Using a most probable scanning order to efficiently code scanning order information for a video block in video coding
US9106913B2 (en) 2011-03-08 2015-08-11 Qualcomm Incorporated Coding of transform coefficients for video coding
US10397577B2 (en) 2011-03-08 2019-08-27 Velos Media, Llc Inverse scan order for significance map coding of transform coefficients in video coding
US9167253B2 (en) 2011-06-28 2015-10-20 Qualcomm Incorporated Derivation of the position in scan order of the last significant transform coefficient in video coding
US9032075B2 (en) * 2011-10-12 2015-05-12 President And Fellows Of Harvard College Systems and methods for medium access control
CN102572435B (zh) * 2012-01-16 2014-03-12 中南民族大学 基于压缩采样的视频编解码系统及其方法
DE112012000517T5 (de) 2012-03-05 2014-02-06 Empire Technology Development Llc Integrierte Belegungs- und Umgebungslichtsensoren
US8949704B2 (en) * 2012-03-22 2015-02-03 Lsi Corporation Systems and methods for mis-correction correction in a data processing system
JP5761812B2 (ja) * 2012-06-28 2015-08-12 日本電信電話株式会社 信号処理システム及び信号処理方法
JP5761811B2 (ja) * 2012-06-28 2015-08-12 日本電信電話株式会社 信号処理システム及び信号処理方法
WO2014047606A2 (en) * 2012-09-24 2014-03-27 President And Fellows Of Harvard College Techniques for data synchronization using compressive sensing
US9124808B2 (en) 2013-03-04 2015-09-01 Raytheon Company Foveated imaging system and method
US20140376605A1 (en) * 2013-06-25 2014-12-25 Electronics And Telecommunications Research Institute Apparatus and method for compressing and decompressing data
US9094046B2 (en) 2013-09-03 2015-07-28 Lsi Corporation Systems and methods for variable sector count spreading and de-spreading
US8976471B1 (en) 2013-09-05 2015-03-10 Lsi Corporation Systems and methods for two stage tone reduction
US9436550B2 (en) 2013-10-31 2016-09-06 Avago Technologies General Ip (Singapore) Pte. Ltd. Systems and methods for internal disk drive data compression
CN104834476B (zh) 2014-02-10 2016-10-19 安华高科技通用Ip(新加坡)公司 基于段结束标记的数据对准的系统和方法
US9734601B2 (en) * 2014-04-04 2017-08-15 The Board Of Trustees Of The University Of Illinois Highly accelerated imaging and image reconstruction using adaptive sparsifying transforms
US9184954B1 (en) 2014-07-02 2015-11-10 Seagate Technology Llc Systems and methods for directed soft data perturbation in layered decoding
US9384761B1 (en) 2015-04-09 2016-07-05 Avago Technologies General Ip (Singapore) Pte. Ltd. Systems and methods for flexible variable code rate support
US10728555B1 (en) * 2019-02-06 2020-07-28 Sony Corporation Embedded codec (EBC) circuitry for position dependent entropy coding of residual level data

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2046045A1 (en) * 2007-10-02 2009-04-08 Thomson Licensing Methods of encoding and reconstructing image data and devices implementing said methods

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6549674B1 (en) * 2000-10-12 2003-04-15 Picsurf, Inc. Image compression based on tiled wavelet-like transform using edge and non-edge filters
US8483492B2 (en) * 2005-10-25 2013-07-09 William Marsh Rice University Method and apparatus for signal detection, classification and estimation from compressive measurements
US8805106B2 (en) * 2008-09-26 2014-08-12 Futurewei Technologies, Inc. System and method for compressing and decompressing images and video
CN101510943A (zh) * 2009-02-26 2009-08-19 上海交通大学 利用超完备拓扑稀疏编码有效去除图像噪声的方法
CN101493890B (zh) * 2009-02-26 2011-05-11 上海交通大学 基于特征的动态视觉注意区域提取方法
BR112012017145A2 (pt) * 2010-01-15 2018-06-19 Thomson Licensing codificação de vídeo usando detecção compressiva.

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2046045A1 (en) * 2007-10-02 2009-04-08 Thomson Licensing Methods of encoding and reconstructing image data and devices implementing said methods

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013543312A (ja) * 2010-09-30 2013-11-28 アルカテル−ルーセント 圧縮測定値を使用するビデオ符号化
WO2017183448A1 (ja) * 2016-04-19 2017-10-26 ソニー株式会社 データ処理装置、データ処理方法、プログラム
JPWO2017183448A1 (ja) * 2016-04-19 2019-02-21 ソニー株式会社 データ処理装置、データ処理方法、プログラム
US10812790B2 (en) 2016-04-19 2020-10-20 Sony Corporation Data processing apparatus and data processing method

Also Published As

Publication number Publication date
CN102714730A (zh) 2012-10-03
BR112012017145A2 (pt) 2018-06-19
US20120288003A1 (en) 2012-11-15
CN105791830A (zh) 2016-07-20
CN102714730B (zh) 2016-05-04
KR20120115303A (ko) 2012-10-17
EP2524506A1 (en) 2012-11-21
JP5785955B2 (ja) 2015-09-30
KR101846467B1 (ko) 2018-04-09
WO2011087908A1 (en) 2011-07-21
EP2524506B1 (en) 2018-03-07
CN105791830B (zh) 2019-06-11

Similar Documents

Publication Publication Date Title
JP5785955B2 (ja) 圧縮センシングを用いるビデオコーディング
US9313465B2 (en) Learned transform and compressive sensing for video coding
RU2736421C1 (ru) Способ кодирования и декодирования изображений и устройство кодирования и декодирования
JP5746182B2 (ja) イントラ予測モードの効率的なビデオ符号化及び復号化方法及び装置
TWI469644B (zh) 使用辭典編碼視訊之方法
KR101890203B1 (ko) 비디오 인코더 내에서 기준 이미지들의 압축 및 압축해제
KR102393180B1 (ko) 복원 블록을 생성하는 방법 및 장치
US9736500B2 (en) Methods and apparatus for spatially varying residue coding
KR101378749B1 (ko) 성김에 기반한 아티팩트 제거 필터링에서 가변 변환들에 응답하여 필터 파라미터 결정 및 선택을 위한 방법과 장치
JP6029984B2 (ja) 分類ベースのループ・フィルタのための方法と装置
KR101753273B1 (ko) 변환 선택을 갖는 비디오 코딩 및 디코딩을 위한 제약 변환 방법 및 장치
WO2013158669A1 (en) Method and apparatus of quantization matrix coding
JP2016015752A (ja) 映像符号化及び復号化のためのdcイントラ予測モードのための方法及び装置
KR20210024624A (ko) 이미지 인코딩 방법, 디코딩방법, 인코더 및 디코더
KR101462637B1 (ko) 영상 부호화/복호화 방법 및 장치
JP2013537381A5 (ja)
CN113132734A (zh) 一种编码、解码方法、装置及其设备

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131121

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20131121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141028

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20150126

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150428

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150630

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150727

R150 Certificate of patent or registration of utility model

Ref document number: 5785955

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees