JP2011510566A - スケーラブル符号化フレームワーク内でテクスチャ解析及び合成を使用するビデオ符号化システム - Google Patents

スケーラブル符号化フレームワーク内でテクスチャ解析及び合成を使用するビデオ符号化システム Download PDF

Info

Publication number
JP2011510566A
JP2011510566A JP2010543155A JP2010543155A JP2011510566A JP 2011510566 A JP2011510566 A JP 2011510566A JP 2010543155 A JP2010543155 A JP 2010543155A JP 2010543155 A JP2010543155 A JP 2010543155A JP 2011510566 A JP2011510566 A JP 2011510566A
Authority
JP
Japan
Prior art keywords
texture
base layer
video
synthesis
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010543155A
Other languages
English (en)
Other versions
JP5606326B2 (ja
Inventor
モハメッド ゼット ヴィシャラム
アリ タバタバイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of JP2011510566A publication Critical patent/JP2011510566A/ja
Application granted granted Critical
Publication of JP5606326B2 publication Critical patent/JP5606326B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

スケーラブルビデオ符号化フレームワーク内でテクスチャ解析及び合成技術を使用して高分解能ビデオを効率的に符号化する装置又は方法を提供する。高分解能ビデオ信号が基層に空間的にダウンサンプリング及び復号化される。ダウンサンプリングされた信号及び基層から、テクスチャ及び構造情報が抽出されテクスチャ合成において使用される。合成器の基層からのエッジ情報を利用してテクスチャ合成を構造的及びテクスチャ的に認識し、合成を改善する。合成後、ビデオ品質評価器が、従来のAVC又はMPEG−2符号化などの代替の(非テクスチャ式)符号化方法により、容認不可能な合成領域の強化層符号化を指示する。1つのモードでは、品質評価器が、あるブロックの合成を反復的に改善して、これらを強化層符号化に対して容認できるようにする。装置又は方法は、符号化された基層及び強化層の両方を含む単数又は複数のビットストリームを出力する。
【選択図】図1

Description

本発明は、一般にビデオ符号化に関し、より具体的には、高分解能ビデオの効率的な符号化のためのテクスチャ解析及び合成を使用するスケーラブル符号化フレームワークに関する。
(関連出題との相互参照)
本出願は、2008年1月16日に出願された米国仮出願番号61/011,428号、及び2008年9月22日に出願された米国特許出願番号第12/235,499号からの優先性を主張するものであり、これらの出願はその全体が引用により本明細書に組み入れられる。
(連邦政府が支援する研究又は開発に関する記述)
該当なし
(コンパクトディスクで提出された資料の引用による組み入れ)
該当なし
(著作権保護を受ける資料の通知)
この特許文献中の資料の一部は、アメリカ合衆国及びその他の国の著作権法に従って著作権保護を受ける。著作権の権利所有者は、合衆国特許商標庁の一般公開ファイル又は記録内に表されるとおりに特許文献又は特許開示を第三者が複製することには異議を唱えないが、それ以外は全ての著作権を留保する。著作権所有者は、限定的な意味ではないが、米国特許法施行規則§1.14に従う権利を含み、この特許文献を秘密裏に保持しておく諸権利のいずれも放棄するものではない。
AVC/H.264などの現在の単層ビデオ符号化標準の目的は、MPEG−2、H.263、又はMPEG−4パート2のような、以前の標準よりも実質的に低いビットレートで良質なビデオ品質を提供できる標準を作成する一方で、複雑性を実用レベルに保つことにあった。この分野におけるさらなる拡張によって、SVC標準などのスケーラブルビデオ符号化手法の発展に至り、スケーラブルビデオ符号化は、異なる分解能で動作する数多くの異なるアプリケーション又は装置に適合させるべくビデオを符号化するメカニズムを提供する。スケーラブル符号器は、基層及び少なくとも1つの強化層を含むような複数の層にビデオを符号化する。基層は、最も高い信頼度で送信される必要があるとともに、強化層が依拠する「基準」を含む。
ビデオ符号化標準の符号化効率の改善を模索する中で、さらなるビットレート削減を約束する一方で現在の標準に対して同等の又は改善された映像品質を提供する新技術が現在研究されている。関心が高まっている1つのこのような技術は、テクスチャ解析及び合成の分野に存在する。
ビデオ符号化及び知覚評価における最近の傾向では、オリジナルテクスチャ自体を正確に再現するよりも特定のテクスチャであるという意味合いの方が視聴者にとってより重要であることが示されている。このため、ある等級のテクスチャを納得のいく精度で再現する十分に良好なテクスチャ合成法が提供されれば、特に視聴者がオリジナルテクスチャを見ていなかった場合には、再現されたテクスチャに違いが存在することを確認できなくなる。この技術はビデオ符号化の分野で現在利用されており、符号化効率を大きく進歩させている。
しかしながら、現在利用可能な技術の大部分は、テクスチャ解析及び合成に非常に複雑なスキームを使用する。このようなスキームが高分解能ビデオデータに適用された場合、システムが非常に複雑になる。また、現在の技術の多くは、合成段階中におけるテクスチャ構造の損失を被るか、或いはテクスチャ特性を保持するために追加データ/サイド情報のような構造情報の送信を要求され、この結果、符号化データ/ビットストリームの比率が増える。従って、これらの現行のアプローチには、高度な処理の複雑性、又はビットレートに関する追加のオーバーヘッドが必要となるなどの数多くの短所が存在する。
このため、高度に複雑な処理を必要とせずに高品質な符号化を提供するスケーラブルビデオ符号化のシステム又は方法に対する必要性が存在する。これらの又はその他の必要性は本発明により満たされ、すでに開発されたビデオ符号化システム及び方法の欠点が克服される。
本発明は、スケーラブルビデオ符号化フレームワーク内でテクスチャ解析及び合成を使用して高分解能ビデオを圧縮するための装置及びシステム内で具体化できるビデオ符号化法である。本発明による方法は、より高い符号化効率を目的として、下部空間層からの情報を使用したテクスチャ解析及び合成の概念を利用し、符号化中のコンテンツの性質(例えば、テクスチャ領域、構造領域、平坦領域など)を判定する。
本発明は、基層ビデオからの構造情報を使用してビットレートのオーバーヘッドを軽減するとともによりロバストな合成結果を提供するテクスチャ解析及び合成技術を使用したスケーラブル符号化フレームワークを採用することにより、現在の方法論の短所を軽減する。この結果、本発明の装置及び方法は、現在の技術と比較して高い符号化効率を提供することを目的とした非常に競争力のある符号化パッケージを提供する。
本発明の方法は、先行のテクスチャ解析及び合成を採用したビデオ符号化システムを凌ぐいくつかの利点を提供する。単層ビデオ符号化のテクスチャ解析及び合成を採用する先行スキームには、追加のサイド情報を合成パラメータとともに送信して、合成器が構造を保ちながらテクスチャをうまく生成できるようにする必要があるという難点があった。本発明は、下位層の合成器からエッジ情報を利用して合成を改善する、構造及びテクスチャ認識合成器を提案する。このような実施構成は、空間分解能の低い基層で実行される、いわゆる「低複雑度」のテクスチャ解析を含む。ビデオ品質評価器モジュールを利用して、ある領域の合成を容認又は拒絶する。1つのモードでは、品質評価プログラミングが、わずかに容認不可能な合成領域を強化層の記録に容認可能として提供するために、合成を反復的に改善するように構成される。テクスチャ解析の大半はいくつかの低分解能の基層で行われるので、この方法は、構造を認識した高度なテクスチャ合成の使用に応じて、より空間分解能の高い強化された符号化性能を提供すると同時に低複雑度を提供する。
以下の用語は、仕様に関して一般的に記述するものであり、特定の仕様の詳述を制約するものであると解釈すべきではない。
画像に用いられるような「分解能(resolution)」という用語は、通常は空間分解能のことを意味するが、本明細書では、この文字列が「時間分解能」又は「空間分解能」を指定しない場合には、「分解能」という単語のもっとも一般的な背景に即して「空間分解能」を意味するとみなすことができる。「高分解能(high−resolution)」という用語及び「高品位(high−definition)」という用語は、両方とも空間分解能の側面を対象としたものであり、本出願の中では、従来のスケーラブル符号化フォーマットの基層において符合化できる空間分解能を超える空間分解能のことを意味する。
ビデオ圧縮において使用されるような「マクロブロック(MB)」という用語は、16×16画素のような画素ブロックを表し、これらは、アレイの形で配列された16ブロックの4×4画素のような、ブロックの集合としてみなすこともできる。個々のマクロブロックは、4つのYブロック、1つのCbブロック、1つのCrブロック(4:2:0)のような個々のカラープレーンの画素を含むが、他の構成は、4:2:2又は4:4:4のYCbCrフォーマットを含むことが一般的である。本明細書では、「ブロック」という用語は、通常「マクロブロック」の短縮形として使用される。
本明細書で用いられる「テクスチャ的に認識した(texturally aware)」という用語は、ビデオ内におけるマクロブロック(ブロック)の視覚的テクスチャ特性の認識を意味し、本明細書ではダウンサンプリングビデオから、又はあまり好ましくはないが基本レベルの符号化からテクスチャ情報が抽出される。
本明細書で用いられる「構造的に認識した(structurally aware)」という用語は、ビデオ内におけるブロックの視覚的構造特性(例えば、エッジ、これらの方向性、厚み、及び同様の構造特性)の認識を意味し、本明細書では基本レベルの符号化から、又はあまり好ましくはないがダウンサンプリングビデオから構造情報が抽出される。
本発明は、以下の説明に限定されるものではないが、この説明を含む数多くの方法で具体化することができる。
本発明の1つの実施形態は、高分解能ビデオシーケンスを符号化する方法であり、この方法は、(a)入力として受け取った高分解能ビデオシーケンスに空間的ダウンサンプリングを行って、より低い空間分解能ビデオ信号を有するダウンサンプリングビデオを取得するステップと、(b)従来のビデオ符号化のようないずれかの所望のビデオ符号化メカニズムを利用して、ダウンサンプリングビデオの基層を符号化するステップと、(c)ダウンサンプリングビデオにテクスチャ解析及び分類を実行するステップと、(d)基層の復号化ビデオからの構造情報を判定するステップと、(e)構造情報に応じて、テクスチャ合成対応と判定されたブロックに構造に関する追加情報をテクスチャ合成するステップと、(f)容認可能な形で合成されたブロックに対しては基層の構造解析に応じて強化層を符号化し、容認不可能な形で合成されたブロックに対しては(従来の符号化などの)代替のスケーラブル符号化フレームワークを使用するステップと、(g)符合化基層及び強化層の両方を含むビットストリームを出力するステップと、を含む。
ダウンサンプリングビデオからテクスチャ解析が行われる一方で、基層の符号化から(すなわち、復号化基層から)構造認識が抽出されることが好ましい。テクスチャ合成を実行する前にテクスチャ合成対応ブロックの判定が行われ、対応性のないブロック(非テクスチャブロックと呼ばれる)は、(SVCのような従来のスケーラブル符号化アプローチなどの)非テクスチャ符号化手段により強化層に符号化される。
ダウンサンプリングビデオから得られる構造及びテクスチャ情報に基づいて行われる合成は、高分解能ビデオ内の合成領域のエッジ情報を保存する。テクスチャ−構造的に認識した合成の後、品質評価プログラミングが、強化層の符号化に対していずれのブロックが視覚的に容認可能かを判定する。容認不可能ブロックは、(SVCのような)従来の強化層符号化手段などの代替手段により符号化される。
本発明の1つのモードでは、評価によりわずかに容認不可能とされたブロックに追加の合成処理を行って、これらのブロックを容認可能なレベルの映像品質に引き上げる。これらのわずかに容認不可能なブロックは、時間、反復回数、又はその他の指数などの所望の制限内で容認可能な品質レベルに届くことができない場合には容認不可能として扱われる。
本発明の1つの実施形態は、高分解能ビデオシーケンスを符号化する方法であり、この方法は、(a)入力として受け取った高分解能ビデオシーケンスに空間的ダウンサンプリングを行って、より低い空間分解能ビデオ信号を有するダウンサンプリングビデオを取得するステップと、(b)従来のビデオ符号化を利用してダウンサンプリングビデオの基層を符号化するステップと、(c)ダウンサンプリングビデオのテクスチャ解析を実行するステップと、(d)ブロックを、テクスチャ合成を行うことができるテクスチャブロック(Tブロック)と代替の非テクスチャ符号化を行うことになる非テクスチャブロック(NTブロック)とに分類するステップと、(e)復号化基層から構造情報を取得するステップと、(f)テクスチャ及び構造情報に応じてテクスチャ合成を行うステップと、(g)テクスチャブロックにテクスチャ品質評価を行って、合成領域の視覚的容認可能性を、容認可能、容認不可能、及び任意のわずかに容認不可能なブロックとして分類し、容認可能な形で合成されたブロックの判定を、わずかに容認不可能なブロックを容認可能なレベルの映像品質に引き上げるための反復処理を任意に利用する品質評価プログラミングによって行うステップと、(h)容認可能な形で合成されたブロックに対しては基層の構造解析に応じて強化層を符号化し、容認不可能な形で合成されたブロックに対しては代替の非テクスチャ符号化を使用するステップと、(j)符合化基層及び強化層の両方を含むビットストリームを出力するステップと、を含む。異なる実施構成に応じて、本明細書で説明する方法を、拡張可能な強化層及び/又は2以上の強化層をサポートするように拡張する事ができる。
本発明の1つの実施形態は、高分解能ビデオシーケンスを符号化する方法であり、この方法は、(a)高品位ビデオ信号を処理するように構成されたコンピュータと、(b)コンピュータ上で、(b)(i)入力として受け取った高分解能ビデオシーケンスに空間的ダウンサンプリングを行って、より低い空間分解能ビデオ信号を有するダウンサンプリングビデオを取得し、(b)(ii)従来のビデオ符号化のようないずれかの所望のビデオ符号化メカニズムを利用して、ダウンサンプリングビデオの基層を符号化し、(b)(iii)テクスチャ解析及び分類を実行し、(b)(iv)復号化基層のビデオからの構造情報を判定し、(b)(v)基層のビデオからの構造情報に応じて、テクスチャ合成対応と判定されたブロックをテクスチャ合成し、(b)(vi)容認可能な形で合成されたブロックに対しては基層の構造解析に応じて強化層を符号化し、容認不可能な形で合成されたブロックに対しては従来のスケーラブル符号化フレームワークを使用し、(b)(vii)符合化基層及び強化層の両方を含むビットストリームを出力するように実行可能なプログラミングと、を含む。
本発明の1つの実施形態は、コンピュータ上で実行可能なコンピュータプログラムを含むコンピュータ可読媒体であり、このコンピュータプログラムは、(a)入力として受け取った高分解能ビデオシーケンスに空間的ダウンサンプリングを行って、より低い空間分解能ビデオ信号を有するダウンサンプリングビデオを取得するステップと、(b)従来のビデオ符号化のようないずれかの所望のビデオ符号化メカニズムを利用して、ダウンサンプリングビデオの基層を符号化するステップと、(c)テクスチャ解析及び分類を実行するステップと、(d)復号化基層からの構造情報を判定するステップと、(e)基層から取得した構造情報に応じて、テクスチャ合成対応と判定されたブロックをテクスチャ合成するステップと、(f)容認可能な形で合成されたブロックに対しては基層の構造解析に応じて強化層を符号化し、容認不可能な形で合成されたブロックに対しては従来のスケーラブル符号化フレームワークを使用するステップと、(g)符合化基層及び強化層の両方を含むビットストリームを出力するステップと、を含むステップに応じて高分解能ビデオを処理するとともにコンピュータにスケーラブル符号化を引き起こさせるように構成される。
本発明は、単独で又は本教示から逸脱しないいずれかの組み合わせで実施できるいくつかの有利な面を提供する。
本発明の1つの態様は、高品位ビデオのスケーラブルビデオ符号化を引き起こすための装置及び方法である。
本発明の別の態様は、構造的に認識した高度なテクスチャ合成の使用に応じて高い符号化性能を提供する高品位符号器である。
本発明の別の態様は、復号化済みの基層から判定されるような構成の認識に応じて合成領域のエッジ情報を保存する高品位符号器である。
本発明の別の態様は、基層及び強化層を生成する高品位符号器である。
本発明の別の態様は、構造を認識するテクスチャ合成器を使用する高品位符号器である。
本発明の別の態様は、基層から(エッジの範囲、位置及び方向などの)エッジ情報を抽出する構造認識テクスチャ合成器である。
本発明の別の態様は、高品位ビデオ入力からダウンサンプリングされた後のデータに対して行われる低複雑度レベルのテクスチャ合成を利用する高品位符号器である。
本発明の別の態様は、生成された強化層内に合成結果を選択的に受け入れるための品質評価器を使用する高品位符号器である。
本発明の別の態様は、 わずかに容認不可能な合成ブロックを強化層内で使用できるように処理しようと反復的に試みる品質評価器である。
本発明の別の態様は、十分に修正されなかったわずかに容認不可能なブロックを含む容認不可能な合成ブロックを、従来の技術などの代替の非テクスチャ手段で符号化されるように移管する品質評価器である。
本発明の別の態様は、容認可能に合成されなかったブロックを符号化するための、AVC又はMPEG−2プロトコルなどの代替の非テクスチャ手段を利用する高品位符号器である。
本発明のさらに別の態様は、装置、システム、方法として、コンピュータ上で実行可能なプログラミングとして、媒体上で又は通信ネットワークを介して配信されるように、及び1又はそれ以上の関連するコンピュータにより実行されるように、及びこれらを組み合わせるように構成されたプログラミングとして実装できる高品位符号器である。
本発明のさらなる態様は明細書の以下の部分において明らかになり、この詳細な説明は、本発明をこの詳細な説明に限定することなく好ましい実施形態を完全に開示することを目的とする。
例示のみを目的とした以下の図面を参照することにより、本発明をより完全に理解することが出来る。
本発明の実施形態による、テクスチャ解析及び構造的合成を使用したスケーラブルビデオ符号化のブロック図である。 本発明の実施形態による強化層符号化ステップのフロー図である。 本発明の態様による詳細な強化層符号化ステップのフロー図である。 本発明の態様によるシステム内のコンピュータ及びメモリを示す、基層及び強化層を含むビットストリームを生成するように構成されたシステム(又は装置)のブロック図である。
図面をより具体的に参照すると、本発明は、例示として図1〜図4に大まかに示す装置及び方法の形で具体化される。本明細書で開示するような基本概念から逸脱することなく、装置(又はシステム)は構成及び各部分の詳細が異なってもよく、方法はステップ及び順序が異なってもよい。
図1は、本発明による、スケーラブルビデオ符号化システムの実施形態例10を示しており、このシステムは、基層又はダウンサンプリングビデオなどの下位空間層から構造及びテクスチャ認識を取得するテクスチャ解析及び合成を利用する。図1に示す機能ブロックは、本発明の態様の実現に必要な処理を都合良く分割して提供するものであり、個々のブロックの境界によってこれらの機能を分離することを求めるものではない。当業者であれば、本発明の教示から逸脱せずに、正確なモジュール定義を保持することなく本発明の教示を容易に採用することができるであろう。従って、本発明の教示から逸脱することなく本発明の機能を様々な方法で組み合わせ、又は分離することができる。以下の説明では、これらの機能について言及するために「モジュール」という便利な用語をしばしば使用するが、この単語の使用は、機能の特定の物理的な分離又は包括の制限を暗示するものではない。
(高品位(HD)などの)高分解能ビデオシーケンス12を入力として使用し、これを(ダウンサンプリングフィルタなどの)空間的ダウンサンプリング手段14に通して低分解能ビデオ信号を取得し、これをAVC対応基層16に代表されるようないずれかの所望のビデオ符号化システムを使用して符合化することができるが、MPEG−2及びその他のプロトコルを使用することもできる。このダウンサンプリングされた低空間分解能信号は、テクスチャ解析モジュール18及びビデオ符号化システムの実施形態の残り部分への入力信号として使用される。
基層の符号化と並行して、テクスチャ解析モジュール18が、一般的には単純に「ブロック」と呼ばれる入力ビデオ内マクロブロック(MB)の各々をテクスチャ合成との適合性に関して分類する。例えば、個々のブロックは、入力信号の時空間特性に基づく解析及びその後の判定に応じて、本明細書ではテクスチャブロック(Tブロック)20と呼ぶテクスチャ合成の候補、又は非テクスチャブロック(NTブロック)22のいずれかとして分類される。
Tブロックとして分類されたブロックは、到来するテクスチャブロック「T」の特性を正確にカテゴリ化して次のテクスチャ合成器26が適正な合成メカニズムを後から使用できるようにするという主機能を有するテクスチャ分類器24を使用したさらなる絞り込みを通じて処理される。テクスチャ分類器は、例えば石及び花などのように非常に堅い例から、水及び煙などのようにそれほど堅くない例までの様々なローカル特性に基づいてTブロックを分離することにより、合成モジュールがこのようなテクスチャによりふさわしい合成スキームを適用できるようにすることができる。テクスチャ合成器もまた、構造認識モジュール28から入力を受け取る。本発明の方法において構造認識を使用する1つの重要な側面は、この構造認識が、通常であれば合成中に失われる合成領域内のエッジ情報を保存するという点である。構造に関する情報は基層の復号化ビデオ16から得られる。単純なエッジ検出技術を採用することにより、或いは基層のビデオにより複雑な時空間分離技術を適用することにより、エッジの形の構造情報の範囲及び方向を得ることができる。基層16はテクスチャ合成を受けないので、基層が乱暴に量子化されていない限りオリジナルのエッジ情報の大半が保存される。基層からの構造情報はエッジ情報を含むとともに、これらのエッジ/構造の範囲及び方向を記述することができる。構造認識合成器26は、この構造情報を基層から受け取って合成処理を強化し導く。少なくとも1つの実施構成では、テクスチャ合成が、復号化済みの基層において入手可能なテクスチャ情報を使用してこれを合成処理中に役立てる。図1には合成器26を基層16につなぐフロー線が見られ、合成モジュールは、基層からの低分解能テクスチャ情報を利用して、これを高分解能層の合成処理において役立てることができる。
次に、合成領域の合成データが、合成出力の容認可能性を判定する品質評価器モジュール30に出力される。1つの好ましい実施構成では、評価器が、合成領域が(1)視覚的に容認可能、(2)視覚的に容認不可能、又は(3)わずかに容認不可能のいずれであるかを判定する。合成領域が容認可能であれば、解析/合成パラメータ32が、関連するマスクとともに強化層34内へ受け入れられる。領域合成が容認不可能な場合、合成が拒否され(36)、この合成領域の拡張符号化がスキップされて、好ましくはNTブロックの符号化に利用されるものと同じアプローチに従うような非構造的認識符号化法が利用される。わずかに容認不可能な合成の場合、品質評価器30による反復絞り込み処理が開始され(38)、この処理は、合成が容認可能になるまで、或いは処理の限界に達して最終的に合成が拒否される(36)まで動作することが好ましい。図から、結果として得られる強化層及び基層がビットストリーム46に組み合わせられる(44)ことに留意されたい。
NTブロックとして分類されたブロックの処理について検討すると、図は、代替の符号化メカニズムによるこれらのブロックの処理を示している。この代替の符号化には、従来のスケーラブル符号化フレームワークのようないずれかの所望の符号化フレームワークを利用することができる。
図示の例では、基層ブロックがイントラ符号化されていた場合、この基層ブロックを復号化し、オリジナルの入力済み高品位ビデオ信号12を使用して残余符号器42でアップサンプリングして(40)強化層34を符号化する。
しかしながら、基層ブロックがインター符号化されていた場合、基層ブロックからの動きベクトル情報(mv)がアップサンプリングされ、以下は限定ではなく一例として2つの例及び下位分類について説明するものである。
(1)アップサンプリングされた動きベクトルが、強化層の基準フレーム内の非合成領域に含まれる場合、絞り込みmvが計算され、残りが絞り込みmvとともに符号化される。
(2)このアップサンプリングされた動きベクトルが、基準フレーム内の合成領域内に含まれる場合、(a)現在のブロックを合成された基準ブロックと置き換え、残りは送らない、又は(b)基層のインター符号化ブロックを復号化し、信号をアップサンプリングして、強化層のビデオから得た残りを符号化するという複数の復号機を必要とする可能性のある処理、の2つの選択肢が考えられる。
上記の処理の結果、高品位ビデオがスケーラブルビットストリームに符号化され、このスケーラブルビットストリームでは、基層が(AVC又はMPEG−2などの)従来のビデオ符号化システムに準拠し、強化層がテクスチャ及び非テクスチャ符号化の混合を使用する。
テクスチャ解析は低空間分解能の基層で行われるので、これは低複雑度の解析である。合成処理は、構造及びテクスチャの認識に応じて行われる。この合成処理では、合成は、合成を使用することができるか、さらなる作業が必要か、或いは従来の拡張符号化アプローチのような代替方法に敬意を表して合成を拒否するかを決定する品質評価器モジュールの動作に応じて「選択余地のある」提案となる。全体的に見て、本発明の装置及び方法は、テクスチャ及び構造合成の高度な使用の結果、空間分解能の高い改善された符号化性能を提供する。
図2は、本発明のテクスチャ及び構造的に認識した強化層符号化の実施形態を示している。フロー図を参照すると、ビデオ操作を行う対象のマクロブロック(ブロック)との混乱を最小限に抑えるために、図の個々のフローチャートの「ブロック」について言及する際には「ステップ」という用語を使用する。当業者であれば、本発明の教示から逸脱することなく具体的なステップ又は順序の変更を実施することができる。高品位ビデオの受け取りをステップ50で示しており、ステップ52においてこれが空間的にダウンサンプリングされ、その後ステップ54により基層に符号化される。ステップ56において、ダウンサンプリングビデオ基層にテクスチャ解析が行われ、ステップ58において、ブロックがTブロック(テクスチャ合成可能ブロック)及びNTブロック(非テクスチャ合成可能ブロック)として分類される。ステップ60において行われる追加のテクスチャ分類及び構造的に認識したテクスチャ合成によりTブロックのさらなる絞り込みが行われる。合成された情報から、強化層の符号化62が、非テクスチャ符号化ブロックからの符号化と組み合わせて行われる。ステップ64は、基層及び少なくとも1つの強化層を含む少なくとも1つのビットストリームを出力するステップを示す。ほとんどのアプリケーションでは、基層及び(単複の)強化層を含む単一のビットストリームが出力されるが、追加の処理を実行するためなどの情報を基層及び強化層から別々に受け取るように選択アプリケーションを構成することができる。
図3は、図2に示していない追加の詳細を示す、本発明のテクスチャ及び構造的に認識した強化層符号化の実施形態を示している。高分解能ビデオの受け取りをステップ70で示しており、これがステップ72において空間的にダウンサンプリングされ、その後これがステップ74において基層に符号化される。ステップ76において、ダウンサンプリングビデオ基層にテクスチャ解析が行われ、ステップ78において、ブロックがTブロック及びNTブロックに分類される。ステップ80において、エッジの存在及び位置に関する情報を含む構造情報が基層から求められる。Tブロックのさらなる絞り込みが追加のテクスチャ分類とともに行われ、その後ステップ82において、構造的に認識したテクスチャ合成が行われる。次にステップ84で示すように、品質評価処理により、合成領域のテクスチャブロックが容認可能又は容認不可能として分類される。本発明の好ましいモードでは、ステップ84において、領域を任意にわずかに容認不可能として分類することができ、この場合任意のステップ86において、わずかに容認不可能なブロックを容認可能なレベルの合成映像品質に引き上げるために反復処理が実行される。合成領域を容認可能な品質レベルに引き上げる試みは、時間、反復回数、又はその他の閾値メカニズムに関して制限を有するが、これにより全体的な符号化処理が妨げられることはない。ステップ88において、AVC又はMPEG−2符号化を含む従来のビデオ符号化のような代替の非テクスチャ符号化方法により、容認不可能ブロックの処理が行われる。合成情報から、強化層がステップ90において非テクスチャ符号化ブロックからの情報と組み合わせて符号化される。最終的に、ステップ92は、基層及び強化層を含むビットストリーム(又は少なくとも1つのビットストリーム)を出力するステップを示す。
図4は、コンピュータプロセッサ対応装置110との関連における本発明の実施構成を示している。ビデオソースが高分解能信号112を提供し、これが少なくとも1つのメモリ116へのアクセス権を有する(CPU、マイクロプロセッサ、DSP、プロセッサコアを含むASICなどの)少なくとも1つのコンピュータ処理要素114により受け取られ、このメモリ116から、本発明による方法を実施するための、及び基層と少なくとも1つの強化層とを含む少なくとも1つのビットストリーム118などのデータ出力を生成するための命令が実行される。
メモリ116は、コンピュータが処理するための実行可能命令を受け入れる(静的ランダムアクセスメモリ(SRAM)、動的ランダムアクセスメモリ(DRAM)、フラッシュメモリ、読み出し専用メモリ(ROM)、及びその他の形のデジタルメモリなどの)内部半導体メモリのようなあらゆる所望のメモリ形式及びこれらの組み合わせを含むとともに、半導体メモリ、媒体装置、ネットワークなどを含む外部メモリソースから情報を受け取る。
本発明による構造的に認識したテクスチャ合成処理に応答して、スケーラブルビデオ符号化を含む1又はそれ以上のビットストリーム118が出力される。本発明のスケーラブルビデオ出力は、ビデオ出力120、(インターネットなどを介した)通信122、記憶装置124などに関連する数多くの用途において、及び様々なビデオ対応システム126内で利用することができる。従って、スケーラブル符号化技術を適用できる数多くの異なる用途範囲に本発明を適用することができる。
上記の説明は多くの詳細を含んでいるが、これらは本発明の範囲を限定するものではなく、現在のところ本発明の好ましい実施形態の一部を例示するためのものにすぎないと解釈すべきである。従って、本発明の範囲は、当業者にとって明らかになると考えられる他の実施形態も完全に含み、従って本発明の範囲は、添付の特許請求の範囲以外のいかなるものによっても限定すべきものではなく、特許請求の範囲では、単数形による要素への言及は、明述しない限り「唯一」を意味するものではなく、「1又はそれ以上」を意味することが意図されると理解できるであろう。当業者に周知の上述の好ましい実施形態の要素の構造上及び機能上の同等物は、引用により本明細書に明確に組み入れられ、本特許請求の範囲に含まれることが意図されている。さらに、本発明が解決しようとする個々の及び全ての問題は本特許請求の範囲に含まれるため、装置及び方法によりこれらの問題に対応する必要はない。さらに、本開示の要素、構成要素又は方法ステップは、これらが特許請求の範囲に明示されているかどうかにかかわらず、一般に開放することを意図されたものではない。本明細書に記載される請求項の要素は、この要素が「〜のための手段」という表現を使用して明確に示されない限り、米国特許法112条第6項の規定により解釈すべきではない。
10 スケーラブルビデオ符号化システム
12 高分解能ビデオ入力
14 空間的ダウンサンプリング器
16 AVC対応基層
18 基層でのテクスチャ解析
20 テクスチャ(T)ブロック
24 テクスチャ分類器
26 テクスチャ/構造合成器
28 構造的認識
30 品質評価器
32 容認
34 TAS/SVCスキームを利用しで強化層を符号化
36 拒否
38 絞り込み
40 基準ブロックのアップサンプリング
42 残りの符号化
44 組み合わせ
46 ビットストリーム

Claims (20)

  1. 高分解能ビデオシーケンスを効率的に符号化する方法であって、
    入力として受け取った高分解能ビデオシーケンスに空間的ダウンサンプリングを行って、より低い空間分解能ビデオ信号を有するダウンサンプリングビデオを取得するステップと、
    従来のビデオ符号化を利用して前記ダウンサンプリングビデオの基層を符号化するステップと、
    前記ダウンサンプリングビデオからのテクスチャ解析及び分類を実行するステップと、
    前記復号化した基層からの構造情報を判定するステップと、
    前記構造情報に応じて、テクスチャ合成対応と判定されたブロックにテクスチャ合成を行うステップと、
    容認可能な形で合成されたブロックに対しては前記基層の構造解析に応じて強化層を符号化し、容認不可能な形で合成されたブロックに対しては従来のスケーラブル符号化フレームワークを使用するステップと、
    前記符合化基層及び強化層を含む少なくとも1つのビットストリームを出力するステップと、
    を含むことを特徴とする方法。
  2. 前記テクスチャ解析が、前記ダウンサンプリングビデオから実行される、
    ことを特徴とする請求項1に記載の方法。
  3. 前記テクスチャ合成対応ブロックの判定が、ブロックのテクスチャ解析と、及びテクスチャ合成(Tブロック)及び非テクスチャブロック(NTブロック)を含むテクスチャブロックへの分類とを行うステップを含み、前記非テクスチャブロック(NTブロック)には代替の非テクスチャ符号化が行われる、
    ことを特徴とする請求項1に記載の方法。
  4. テクスチャ合成の視覚的容認可能性を評価し、テクスチャブロックを容認可能又は容認不可能として分類するステップをさらに含む、
    ことを特徴とする請求項1に記載の方法。
  5. わずかに容認不可能な容認不可能ブロックを判定し、これらのブロックに追加の合成処理を行って、これらのブロックを容認可能なレベルの視覚的品質に引き上げるステップをさらに含む、
    ことを特徴とする請求項4に記載の方法。
  6. 前記ブロックが、時間又は反復回数という所望の制限内で容認可能な品質レベルに届くことができなかった場合には容認不可能とみなされる、
    ことを特徴とする請求項5に記載の方法。
  7. 前記ダウンサンプリングビデオから得た前記構造情報に基づく合成が、前記高分解能ビデオ内の前記構造的認識データに応じて合成領域のエッジ情報を保存する、
    ことを特徴とする請求項1に記載の方法。
  8. 前記合成が、前記高分解能層の合成処理中に前記復号化基層からの低分解能テクスチャ情報を利用する、
    ことを特徴とする請求項1に記載の方法。
  9. 前記方法が、高品位ビデオ信号を処理するように構成された、コンピュータ上におけるプログラミングの実行に応答して行われる、
    ことを特徴とする請求項1に記載の方法。
  10. 高分解能ビデオシーケンスを効率的に符号化する方法であって、
    入力として受け取った高分解能ビデオシーケンスに空間的ダウンサンプリングを行って、より低い空間分解能ビデオ信号を有するダウンサンプリングビデオを取得するステップと、
    従来のビデオ符号化を利用して前記ダウンサンプリングビデオの基層を符号化するステップと、
    前記ダウンサンプリングビデオを、テクスチャ合成を行うことができるテクスチャブロック(Tブロック)と、代替の非テクスチャ符号化を行うことになる非テクスチャブロック(NTブロック)とにテクスチャ分析するステップと、
    Tブロックを、非常に堅いものから堅くないものまで様々なカテゴリにテクスチャ分類することにより、該分類に応じた効果的な合成技術を実行できるようにするステップと、
    前記基層から構造情報を取得するステップと、
    前記構造情報に応じてテクスチャ合成を行うステップと、
    テクスチャブロックにテクスチャ品質評価を行って、合成領域の視覚的容認可能性を、容認可能、容認不可能、及びわずかに容認不可能として分類し、容認可能な形で合成されたブロックの判定を、わずかに容認不可能なブロックを容認可能なレベルの映像品質に引き上げるために反復処理を利用する品質評価プログラミングによって行うステップと、
    容認可能な形で合成されたブロックに対しては基層の構造解析に応じて強化層を符号化し、容認不可能な形で合成されたブロックに対しては代替の非テクスチャ符号化を使用するステップと、
    符合化基層及び強化層を含む少なくとも1つのビットストリームを出力するステップと、
    を含むことを特徴とする方法。
  11. 前記テクスチャ分類するステップが、前記ダウンサンプリングビデオの時空間特性に応じて、該ダウンサンプリングビデオ内の個々のブロックをそのテクスチャ合成能力に関して特徴付けるステップを含む、
    ことを特徴とする請求項10に記載の方法。
  12. 前記代替の非テクスチャ符号化が、AVC又はMPEG−2プロトコルを利用する従来のビデオ符号化を含む、
    ことを特徴とする請求項10に記載の方法。
  13. 前記代替の非テクスチャ符号化が、
    ブロックがイントラ符号化された非テクスチャブロックであると判断した場合、前記基層ブロックを復号化し、アップサンプリングし、オリジナルの入力済み高品位ビデオ信号を使用して残余計算するステップと、
    ブロックがインター符号化された非テクスチャブロックであると判断した場合、前記基層からの動きベクトル情報(mv)をアップサンプリングするステップと、
    を含み、
    (i)mvが、前記強化層の基準フレーム内の非合成領域内にある場合、mvの絞り込みを計算し、その後残りの及び絞り込みmvを符号化し、又は、
    (ii)mvが、前記強化層の基準フレームの合成領域内にある場合、合成された基準ブロックを現在のブロックと置き換え、又は、
    (iii)mvが、前記強化層の基準フレームの合成領域内にある場合、基層インターブロックを復号化し、ダウンサンプリングビデオをアップサンプリングし、強化層ビデオからの残りを少なくとも1つの復号機を通じて符号化する、
    ことを特徴とする請求項10に記載の方法。
  14. 前記方法は、基層の復号化に応じて構造を認識し、構造的特徴を抽出すること、
    を特徴とする請求項10に記載の方法。
  15. 前記構造的特徴が、エッジの範囲又は構造並びにその位置及び方向を含む、
    ことを特徴とする請求項14に記載の方法。
  16. テクスチャ合成を受けない復号化済み基層から構造情報を取得することにより構造的特徴が保存される、
    ことを特徴とする請求項15に記載の方法。
  17. 前記テクスチャ合成が、エッジの存在、範囲及び位置、及び構造に関する構造情報に応じて行われる、
    ことを特徴とする請求項10に記載の方法。
  18. 前記テクスチャ合成が、前記高分解能層の合成処理中に前記復号化基層からの低分解能テクスチャ情報を利用する、
    ことを特徴とする請求項10に記載の方法。
  19. 高分解能ビデオシーケンスの効果的な符号化のための装置であって、
    高品位ビデオ信号を処理するように構成されたコンピュータと、
    前記コンピュータ上で、
    高分解能ビデオシーケンス入力に空間的ダウンサンプリングを行って、低空間分解能ビデオ信号を有するダウンサンプリングビデオを取得するステップと、
    非テクスチャビデオ符号化を利用して、前記ダウンサンプリングビデオの基層を復号化基層に符号化するステップと、
    テクスチャ解析及び分類を行うステップと、
    前記復号化基層からの構造情報を判定するステップと、
    前記復号化基層からの前記構造情報に応じて、テクスチャ合成対応と決定されたブロックにテクスチャ合成を行うステップと、
    容認可能な形で合成されたブロックには、符号化基層からの構造情報に応じて強化層を符号化し、合成されなかったブロック又は容認可能な合成結果が得られなかったブロックには非テクスチャ符号化フレームワークを使用するステップと、
    符号化済み基層及び強化層を含む少なくとも1つのビットストリームを出力するステップと、
    を実行可能なプログラミングと、
    を含むことを特徴とする装置。
  20. コンピュータ上で実行可能なコンピュータプログラムを含むコンピュータ可読媒体であって、前記コンピュータプログラムは、
    入力として受け取った高分解能ビデオシーケンスに空間的ダウンサンプリングを行って、より低い空間分解能ビデオ信号を有するダウンサンプリングビデオを取得するステップと、
    非テクスチャビデオ符号化を利用して、前記ダウンサンプリングビデオの基層を復号化基層に符号化するステップと、
    テクスチャ解析及び分類を実行するステップと、
    前記復号化済み基層からの構造情報を判定するステップと、
    前記復号化済み基層から取得した前記構造情報の受け取りに応答して、テクスチャ合成対応と判定されたブロックをテクスチャ合成するステップと、
    容認可能な形で合成されたブロックには、基層からの構造情報に応じて強化層を符号化し、合成されなかったブロック又は容認可能な合成結果が得られなかったブロックには非テクスチャ符号化フレームワークを使用するステップと、
    符号化済み基層及び強化層を含む少なくとも1つのビットストリームを出力するステップと、
    を含むステップに応じて高分解能ビデオを処理するとともにコンピュータにスケーラブル符号化を引き起こさせるように構成される、
    ことを特徴とするコンピュータ可読媒体。
JP2010543155A 2008-01-16 2009-01-05 スケーラブル符号化フレームワーク内でテクスチャ解析及び合成を使用するビデオ符号化システム Expired - Fee Related JP5606326B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US1142808P 2008-01-16 2008-01-16
US61/011,428 2008-01-16
US12/235,499 US8155184B2 (en) 2008-01-16 2008-09-22 Video coding system using texture analysis and synthesis in a scalable coding framework
US12/235,499 2008-09-22
PCT/US2009/030117 WO2009091625A1 (en) 2008-01-16 2009-01-05 Video coding system using texture analysis and synthesis in a scalable coding framework

Publications (2)

Publication Number Publication Date
JP2011510566A true JP2011510566A (ja) 2011-03-31
JP5606326B2 JP5606326B2 (ja) 2014-10-15

Family

ID=40850603

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010543155A Expired - Fee Related JP5606326B2 (ja) 2008-01-16 2009-01-05 スケーラブル符号化フレームワーク内でテクスチャ解析及び合成を使用するビデオ符号化システム

Country Status (5)

Country Link
US (1) US8155184B2 (ja)
JP (1) JP5606326B2 (ja)
CN (1) CN101911712B (ja)
TW (1) TW200943968A (ja)
WO (1) WO2009091625A1 (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8204325B2 (en) * 2008-01-18 2012-06-19 Sharp Laboratories Of America, Inc. Systems and methods for texture synthesis for video coding with side information
KR20110020242A (ko) * 2008-06-05 2011-03-02 톰슨 라이센싱 텍스처 합성을 이용하는 이미지 코딩 방법
DK3958573T3 (da) 2010-04-13 2023-08-28 Ge Video Compression Llc Videokodning ved anvendelse af multitræsunderinddeling af billeder
BR122020007921B1 (pt) 2010-04-13 2021-08-03 Ge Video Compression, Llc Predição interplano
SI3697089T1 (sl) 2010-04-13 2022-01-31 Ge Video Compression, Llc Dedovanje v večdrevesni razčlenitvi niza vzorcev
CN105933715B (zh) * 2010-04-13 2019-04-12 Ge视频压缩有限责任公司 跨平面预测
KR102360005B1 (ko) 2010-04-13 2022-02-08 지이 비디오 컴프레션, 엘엘씨 샘플 영역 병합
JP5351094B2 (ja) * 2010-06-01 2013-11-27 日本電信電話株式会社 画像符号化方法,画像符号化装置および画像符号化プログラム
JP5351093B2 (ja) * 2010-06-01 2013-11-27 日本電信電話株式会社 画像符号化方法,画像符号化装置および画像符号化プログラム
RU2595966C1 (ru) * 2012-09-27 2016-08-27 Долби Лабораторис Лайсэнзин Корпорейшн Обработка межуровневого эталонного изображения для масштабируемости стандартов кодирования
US10147202B2 (en) * 2013-03-15 2018-12-04 Arm Limited Methods of and apparatus for encoding and decoding data
JP2014230176A (ja) 2013-05-23 2014-12-08 ソニー株式会社 画像信号処理装置、画像信号処理方法、撮像装置および画像表示方法
US9992502B2 (en) * 2016-01-29 2018-06-05 Gopro, Inc. Apparatus and methods for video compression using multi-resolution scalable coding
US10291910B2 (en) 2016-02-12 2019-05-14 Gopro, Inc. Systems and methods for spatially adaptive video encoding
US10163029B2 (en) 2016-05-20 2018-12-25 Gopro, Inc. On-camera image processing based on image luminance data
US10198862B2 (en) 2017-01-23 2019-02-05 Gopro, Inc. Methods and apparatus for providing rotated spherical viewpoints
KR102323395B1 (ko) * 2017-11-02 2021-11-08 삼성전자주식회사 로우-퀄리티 부호화 모드에 따라 영상을 부호화하는 방법 및 장치, 및 영상을 복호화하는 방법 및 장치
WO2021141372A1 (ko) * 2020-01-06 2021-07-15 현대자동차주식회사 이종 해상도를 갖는 참조 픽처 기반의 영상 부호화 및 복호화

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002520959A (ja) * 1998-07-08 2002-07-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ビデオ送信用低帯域幅符号化体系
JP2006519533A (ja) * 2003-02-28 2006-08-24 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ ビデオコーディングがテクスチャ解析およびテクスチャ合成を含むビデオコーディングのための方法およびアセンブリと、対応するコンピュータプログラムおよび対応するコンピュータで読み込み可能な記録媒体
WO2007010446A2 (en) * 2005-07-15 2007-01-25 Koninklijke Philips Electronics N.V. Image coder for regions of texture

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6985526B2 (en) * 1999-12-28 2006-01-10 Koninklijke Philips Electronics N.V. SNR scalable video encoding method and corresponding decoding method
JP2001204026A (ja) * 2000-01-21 2001-07-27 Sony Corp 画像情報変換装置及び方法
US6490320B1 (en) * 2000-02-02 2002-12-03 Mitsubishi Electric Research Laboratories Inc. Adaptable bitstream video delivery system
US6493387B1 (en) * 2000-04-10 2002-12-10 Samsung Electronics Co., Ltd. Moving picture coding/decoding method and apparatus having spatially scalable architecture and signal-to-noise ratio scalable architecture together
JP2007532063A (ja) * 2004-04-02 2007-11-08 トムソン ライセンシング 複雑度スケーラブルなビデオデコーダの方法及び装置
US8340177B2 (en) * 2004-07-12 2012-12-25 Microsoft Corporation Embedded base layer codec for 3D sub-band coding
US8374238B2 (en) * 2004-07-13 2013-02-12 Microsoft Corporation Spatial scalability in 3D sub-band decoding of SDMCTF-encoded video
EP1769640A1 (en) * 2004-07-15 2007-04-04 Samsung Electronics Co., Ltd. Scalable motion information encoding/decoding apparatus and method and scalable video encoding/decoding apparatus and method using them
KR100763181B1 (ko) * 2005-04-19 2007-10-05 삼성전자주식회사 기초계층과 향상계층의 데이터를 바탕으로 예측 정보를코딩하여 코딩율을 향상시키는 방법 및 장치
KR100746007B1 (ko) * 2005-04-19 2007-08-06 삼성전자주식회사 엔트로피 코딩의 컨텍스트 모델을 적응적으로 선택하는방법 및 비디오 디코더
FR2889017A1 (fr) * 2005-07-19 2007-01-26 France Telecom Procedes de filtrage, de transmission et de reception de flux video scalables, signal, programmes, serveur, noeud intermediaire et terminal correspondants
KR100736080B1 (ko) * 2005-10-27 2007-07-06 삼성전자주식회사 다 계층으로 구성된 멀티미디어 스트림의 저작권을 계층별로 관리하는 방법 및 장치
US20070160134A1 (en) * 2006-01-10 2007-07-12 Segall Christopher A Methods and Systems for Filter Characterization
US8320450B2 (en) * 2006-03-29 2012-11-27 Vidyo, Inc. System and method for transcoding between scalable and non-scalable video codecs
US20070268964A1 (en) * 2006-05-22 2007-11-22 Microsoft Corporation Unit co-location-based motion estimation

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002520959A (ja) * 1998-07-08 2002-07-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ビデオ送信用低帯域幅符号化体系
JP2006519533A (ja) * 2003-02-28 2006-08-24 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ ビデオコーディングがテクスチャ解析およびテクスチャ合成を含むビデオコーディングのための方法およびアセンブリと、対応するコンピュータプログラムおよび対応するコンピュータで読み込み可能な記録媒体
WO2007010446A2 (en) * 2005-07-15 2007-01-25 Koninklijke Philips Electronics N.V. Image coder for regions of texture

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN6014016229; Patrick Ndjiki-Nya, Tobias Hinz, and Thomas Wiegand: 'Generic and Robust Video Coding with Texture Analysis and Synthesis' 2007 IEEE International Conference on Multimedia and Expo , 20070702, pp.1447-1450 *

Also Published As

Publication number Publication date
TW200943968A (en) 2009-10-16
US8155184B2 (en) 2012-04-10
US20090180552A1 (en) 2009-07-16
CN101911712B (zh) 2013-08-14
CN101911712A (zh) 2010-12-08
JP5606326B2 (ja) 2014-10-15
WO2009091625A1 (en) 2009-07-23

Similar Documents

Publication Publication Date Title
JP5606326B2 (ja) スケーラブル符号化フレームワーク内でテクスチャ解析及び合成を使用するビデオ符号化システム
RU2479939C2 (ru) Способ кодирования и декодирования видеосигнала с использованием взвешенного предсказания и устройство для его осуществления
KR100893868B1 (ko) 영상 신호의 인코딩 및 디코딩 방법
US8953673B2 (en) Scalable video coding and decoding with sample bit depth and chroma high-pass residual layers
US7949053B2 (en) Method and assembly for video encoding, the video encoding including texture analysis and texture synthesis, and corresponding computer program and corresponding computer-readable storage medium
JP3788823B2 (ja) 動画像符号化装置および動画像復号化装置
KR102062764B1 (ko) 모바일 단말 화면을 위한 3k해상도를 갖는 디스플레이 영상 생성 방법 및 장치
US20130107938A9 (en) Method And Apparatus For Scalable Video Decoder Using An Enhancement Stream
KR101249652B1 (ko) 비디오 인코딩 및 디코딩 방법 및 장치
JP5872896B2 (ja) パッチベースのサンプリングテクスチャ合成を用いたテクスチャ圧縮の方法及び装置
KR20060105407A (ko) 영상 신호의 스케일러블 인코딩 및 디코딩 방법
KR20110020242A (ko) 텍스처 합성을 이용하는 이미지 코딩 방법
Li et al. End-to-end optimized 360° image compression
CA2600410C (en) Video coding and decoding method using weighted prediction and apparatus for the same
Seppälä et al. Enhancing image coding for machines with compressed feature residuals
EP4392899A1 (en) Multi-level latent fusion in neural networks for image and video coding
JP2023162141A (ja) 点群符号化装置、点群復号装置、点群符号化方法、点群復号方法及びプログラム
WO2022246809A1 (zh) 编解码方法、码流、编码器、解码器以及存储介质
JP5941097B2 (ja) パッチベースのサンプリングテクスチャ合成を用いたテクスチャ圧縮の方法及び装置
KR100938553B1 (ko) 스케일러블 영상 부/복호화기에서 주변 블록 정보를 이용한바운더리 처리 방법 및 장치
JPH11112979A (ja) 符号化装置及び方法、復号化装置及び方法並びに記録媒体
JPH03227189A (ja) 画像データ符号化方法及び復号化方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111220

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130830

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130909

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20131206

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20131213

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20140108

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20140116

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20140207

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20140217

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140307

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140423

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140710

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140818

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140826

R150 Certificate of patent or registration of utility model

Ref document number: 5606326

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees