JP2005510982A - 画面がスライスに分割される前景および背景のビデオ符号化および復号 - Google Patents

画面がスライスに分割される前景および背景のビデオ符号化および復号 Download PDF

Info

Publication number
JP2005510982A
JP2005510982A JP2003548548A JP2003548548A JP2005510982A JP 2005510982 A JP2005510982 A JP 2005510982A JP 2003548548 A JP2003548548 A JP 2003548548A JP 2003548548 A JP2003548548 A JP 2003548548A JP 2005510982 A JP2005510982 A JP 2005510982A
Authority
JP
Japan
Prior art keywords
picture
encoded
video
coding
single encoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003548548A
Other languages
English (en)
Other versions
JP2005510982A5 (ja
JP4485796B2 (ja
Inventor
ハンヌクセラ,ミスカ
ワン,イェ−クイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Oyj
Original Assignee
Nokia Oyj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=9926514&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP2005510982(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Nokia Oyj filed Critical Nokia Oyj
Publication of JP2005510982A publication Critical patent/JP2005510982A/ja
Publication of JP2005510982A5 publication Critical patent/JP2005510982A5/ja
Application granted granted Critical
Publication of JP4485796B2 publication Critical patent/JP4485796B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • H04N19/29Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding involving scalability at the object level, e.g. video object layer [VOL]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • H04N19/23Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding with coding of regions that are present throughout a whole video segment, e.g. sprites, background or mosaic

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Television Systems (AREA)

Abstract

ビデオ符号化および復号方法であって、最初にピクチャが、1つ以上の主観的に重要なピクチャ領域と背景領域サブピクチャとに対応するサブピクチャに分割され、背景領域サブピクチャは主観的に重要なサブピクチャがピクチャから取り去られた後に残ったものである。サブピクチャは、ビデオ符号化マクロブロック(MB)の所定の許容されるグループに合致するように形成される。許容されるMBのグループは、例えば、矩形形状を持つことができる。ピクチャは次に、主観的に重要なサブピクチャを使って符号化できる背景領域サブピクチャを除いて各サブピクチャが他のサブピクチャから独立して符号化されるように、スライスに分割される。背景サブピクチャのスライスは、主観的に重要なサブピクチャに属するMBをスキップするスキャン順序で形成される。ピクチャを復号するときにすべての主観的に重要なサブピクチャのすべての位置およびサイズが再構成できたときのみ、背景サブピクチャが復号される。

Description

本発明は、ビデオ符号化および復号に関する。本発明は特に、ただしそれ以外を排除するものではないが、エラーが起きがちなデータコネクション上でのビデオ符号化および送信に関する。
映像(ビデオ)の送信には、その送信を可能にする形式で映像を符号化することを必要とする。一般的に、これは、送信される映像を構成する画面(ピクチャ)のストリーム中に膨大な情報量が含まれるため、効果的な圧縮を要する。
ITU−T H.263は、ビットストリーム構文およびビットストリームの復号を規定する国際電気通信連合(ITU)ビデオ符号化勧告である。この標準において、画面は、輝度および2つの色差(クロミナンス)成分(Y、CBおよびCR)を用いて符号化される。クロミナンス成分はそれぞれ、両座標軸に沿って輝度成分と比べて半分の解像度でサンプリングされる。
当該符号化されたビットストリーム並びに、各符号化された画面(ピクチャ)は、上層から下層の順で、ピクチャ層、ピクチャセグメント層、マクロブロック(MB)層およびブロック層の4つの層を持つ階層構造に構成される。ピクチャセグメント層は、グループオブブロック層またはスライス層のいずれかである。
ピクチャ層のデータは、画面全体および画面データの復号に影響するパラメータを含む。デフォルトでは、各画面は複数のグループオブブロックに分割される。1つのグループオブブロック(GOB)は一般に、1列のマクロブロック(16本の連続画素ライン)またはその複数個を含む。各GOBについてのデータは、オプションとしてのGOBヘッダとそれに続くMBのデータから成る。GOBの代わりに、いわゆるスライスを用いることができ、それにより各ピクチャはGOBでなくスライスに分割される。各スライスについてのデータは、スライスヘッダとそれに続くMBのデータから成る。
スライスは、符号化画面内で複数の領域を定める。各領域は、通常のスキャン順序における多数のMBである。1つの符号化画面内におけるスライス境界にまたがる予測依存性はない。しかしながら、ITU-T H.263別紙R(独立セグメント復号)が用いられない限り、時間予測は一般にスライス境界を横断できる。スライスは、ピクチャデータの(ピクチャヘッダを除く)他の部分から独立して復号できる。その結果、スライスは、パケット損失の多いネットワークにおけるエラー耐性を改善する。
各GOBまたはスライスは、MBに分割される。1つのMBは、輝度データの16×16画素および空間的に対応するクロミナンスデータの8×8画素に関するものである。言い換えれば、1つのMBは、4つの8×8輝度ブロックおよび空間的に対応する2つの8×8クロミナンスブロックから成る。
通常のスキャン順序における多数のMBで形成された領域を用いるのでなく、N×M個のマクロブロック(N,Mは1以上)から成りスライスおよびGOB構造に取って代わる矩形領域が、Sen−ching Cheung,“H.263+において領域層を使用することについての提案”,ITU−T SG15 WP1文書LBC−96−213,1996年7月、によってITU−T H.263に対して提案された。しかしながら、この提案はH.263に採用されなかった。
ITU−T H.263独立セグメント復号モード(ITU−T H.263別紙R)においては、セグメント境界(スライスの境界またはGOBヘッダが送られるGOBの上層の境界、あるいは画面の境界であって最も小さい領域を区切るもので定められる)が画面の境界と同様に取り扱われ、近隣スライスからのすべてのエラー伝播を排除する。例えば、近隣スライスからの動き補償またはデブロッキングループフィルタリングによるエラーの伝播がない。セグメント境界は、イントラピクチャ、すなわち画面間符号化が全く必要とされない場合にのみ変更し得る。
MPEG−4ビジュアルまたはMPEG−4ビデオと呼ばれるISO/IEC標準草案14496−2:1999(E)は、オーディオビジュアルオブジェクト(AVO)と呼ばれる内容の基本単位を中心に設計された標準草案である。AVOの例は、オーケストラ中の(動いている)演奏者、その演奏者が出した音、その演奏者が座っている椅子、オーケストラ背後の(ことによると動いている)背景、および現在の楽節についての説明テキストである。MPEG−4ビデオにおいて、各AVOは別個に表現され、独立したストリームのための基礎になる。
普通の二次元動画映像の符号化は、MPEG−4ビデオの一部である。MPEG−4ビデオは、従来の矩形ビデオオブジェクトならびに任意形状の二次元ビデオオブジェクト双方を符号化できる。基本的ビデオAVOはビデオオブジェクト(VO)と呼ばれる。VOは、スケーラブルである。すなわち、これらを分割し、符号化し、そして2つ以上のビデオオブジェクト層(VOL)で送ることができる。これらのVOLの1つは、基本層と呼ばれ、どのような種類の映像であっても表示のためにすべての端末が受信しなければならない。残りのVOLは拡張層と呼ばれ、万一伝送エラーや伝送容量に制限がある場合に犠牲にすることができる。非スケーラブルビデオ符号化の場合には、1つのVOにつき1つのVOLが符号化される。
ビデオオブジェクト層のインタイムのスナップショットは、ビデオオブジェクトプレーン(VOP)を呼ばれる。矩形ビデオについては、これは画面またはフレームに対応する。しかしながら、一般に、VOPは任意の形状を持つことができる。各VOPはビデオパケットに分割できる。各VOPおよびビデオパケットは、ITU−T H.263と同様にマクロブロックにさらに分割される。マクロブロックの色(YUV)情報は、ITU−T H.263と同様に符号化される。すなわち、マクロブロックは8×8ブロックにさらに分割される。加えて、もしVOPが任意の形状を持っていれば、マクロブロックの形状が次の段落で説明されるように符号化される。
MPEG−4ビデオVOはどのような形状でも持つことができ、さらに、オブジェクトの形状、サイズ、および位置は、1つのフレームから次のフレームかけて変わり得る。一般的な表現で言えば、ビデオオブジェクトは、3つの色成分(YUV)と1つのアルファ成分とで構成されている。アルファ成分は、画面ごとにオブジェクトの形状を定める。バイナリオブジェクトは、オブジェクトの最も単純なクラスを形成する。それらは、一連のバイナリアルファマップ、すなわち各画素が黒または白のどちらか一方である2次元画面により表現される。MPEG−4ビデオは、これらのオブジェクトを圧縮するためのバイナリ形状のみのモードを提供する。圧縮プロセスは、一連のアルファマップを符号化するためのバイナリ形状符号器によりもっぱら定義される。バイナリオブジェクトに加えて、オブジェクトの不透明度を定義するために、グレイレベルアルファマップが使用できる。オブジェクト境界はバイナリアルファマップを用いて符号化されるのに対して、グレイレベルアルファ情報は、DCT変換を用いるテクスチュア符号化と同様に符号化される。オブジェクト形状の連続および不透明度の定義に加えて、表現は、オブジェクト形状内部の全画素の色を含む。MPEG−4ビデオは、これらのオブジェクトを、バイナリ形状符号器を用いて、次に内部テクスチュア符号化のための動き補償離散コサイン変換(DCT)ベースのアルゴリズムを用いて符号化する。
ビデオビットストリームを、例えば、上記で論じたスケーラブルビデオ符号化、データパーティショニング、または領域ベース符号化により、種々の優先順位の部分にセグメント化するのが有利であることも知られている。
しかしながら、スケーラブルビデオ符号化およびデータパーティショニングのメリットは、種々の符号化要素間の依存性により損なわれる。例えば、もし基本レイヤが正しく受信されなかったら、拡張レイヤは、正しく復号できない。同様に、もし対応する高優先順位パーティションが受信されなかったら、低優先順位パーティションは全く役立たない。これにより、スケーラブルビデオ符号化およびデータパーティションニングがいくつかのケースで不利になる。スケーラブル符号化およびデータパーティショニングは、関心空間領域を主観的に重要度の低い区域とは別に扱うための手段を提供しない。さらに、従来の信号対雑音比(SNR)および空間スケーラビリティのような、スケーラブル符号化の多くの形態のメリットは、非スケーラブル符号化と比べてより悪い圧縮効率により損なわれる。一方で、領域ベース映像符号化においては、GOBまたはスライスは、主観的重要性が異なるマクロブロックを含み得る。従って、GOBおよびスライスの優先順位付けは一般に全くできない。
任意形状オブジェクトの符号化は、ハンドヘルドデバイスにとりあまりに複雑であると現在見なされている。このことは、MPEG−4ビデオ形状符号化ツールは、計画された第3世代移動電話機の移動ビデオ通信サービスから一般に除外されているという事実によりさらに例証される。
MPEG−4ビデオによりもたらされる利点と同様な利点の少なくともいくつかをやはり提供する移動通信に適した選択肢を提供することが本発明の目的である。
本発明の第1の形態によれば、
ピクチャを、ピクチャの区域に関連した所定の並びを有する、各々が基本的符号化要素の少なくとも1つのグループに対応する規則的形状の符号化ブロックの集合に分割するステップと、
ピクチャ内で少なくとも1つの形状を決定するステップと、
該少なくとも1つの決定された形状をカバーする少なくとも1つの区域を定める符号化ブロックの少なくとも1つの部分集合を選択するステップと、
符号化ブロックの該選択された少なくとも1つの部分集合を、少なくとも1つの単独符号化オブジェクトと決定するステップと、
該少なくとも1つの単独符号化オブジェクトを除くピクチャの部分を、背景オブジェクトと決定するステップと、
該少なくとも1つの単独符号化オブジェクトを符号化するステップと、
1つの符号化オブジェクトとして、背景オブジェクトを符号化するステップとを含むビデオ符号化方法が提供される。
背景符号化オブジェクトが、どのような単独符号化オブジェクトにも属さないピクチャの部分として定められる一体状の符号化オブジェクトとして決定できることおよび単独符号化オブジェクトが、それらがカバーする形状に一致する必要がないことが本発明の利点である。
好ましくは、背景符号化オブジェクトは、少なくとも1つの単独符号化オブジェクトを使って符号化される。
背景オブジェクトは、各単独符号化オブジェクトの位置、形状およびサイズの決定なくして再構成することはできない。単独符号化オブジェクトを運んでいるいずれかのデータパケットがもし失われれば、いずれせよ背景符号化オブジェクトを復号する機会は皆無である。少なくとも1つの単独符号化オブジェクトの位置およびサイズの決定により、少なくとも1つの単独符号化オブジェクトのビデオデータの存在が示される。従って、少なくとも1つの単独符号化オブジェクトを用いて背景符号化オブジェクトを首尾良く予測できる見込みが高く、そのため、少なくとも1つの単独符号化オブジェクトを用いて背景符号化オブジェクトを符号化することは一般に妥当である。
好ましくは、背景符号化オブジェクトをビデオ符号化するステップは、少なくとも1つの単独符号化オブジェクトに含まれる基本符号化オブジェクトをスキップする連続的な符号化ブロックによりスライスが構成されるように、符号化スライスをスキャン順序で定めるサブステップをさらに含む。
好ましくは、スキャン順序は最初に1つの水平線をスキャンし、それから、次の水平線へ垂直に進む。あるいは、スキャン順序は、最初に1つの垂直線をスキャンし、それから、次の垂直線へ水平に進む。またさらに、他のどのようなスキャン順序も用いることができる。
好ましくは、少なくとも1つの単独符号化オブジェクトをビデオ符号化するステップは、少なくとも1つの単独符号化オブジェクトに含まれる符号化ブロックのスキャン順序でスライスが構成されるように、各単独符号化オブジェクト内でスライスをスキャン順序で符号化スライスを定めるサブステップをさらに含む。
ある形状について定められた区域が符号化ブロックの所定の並びに一致するので、主観的関心が高いオブジェクトを、計算要求の少ない背景とは別にビデオ符号化できることは本発明の利点である。
好ましくは、符号化ブロックはマクロブロックである。
好ましくは、少なくとも1つの決定された形状をカバーする区域は矩形区域であり、それにより正方形が矩形の1つの部分集合になる。
好ましくは、単独符号化オブジェクトは主観的重要性の降順で定められる。
好ましくは、主観的にさほど重要でない単独符号化オブジェクトは、主観的により重要な単独符号化オブジェクトに対応する少なくとも1つの決定された形状をカバーしている区域を定める符号化ブロックを除いて定められる。これにより、そうしなければ主観的にさほど重要ではない符号化オブジェクトにより定められた矩形区域の角が主観的により重要な区域により定められたいずれかの区域と重なるような場合に、それらを自動的にクリッピングすることができる。
好ましくは、少なくとも1つの単独符号化オブジェクトのビデオ符号化は、少なくとも1つの単独符号化オブジェクト中へのエラー伝播を阻止するために、背景オブジェクトのビデオ符号化から独立している。
少なくとも1つの単独符号化オブジェクトの独立したビデオ符号化を使用すると、ビデオ符号化の堅牢性が強化されるが、その場合にその少なくとも1つの単独符号化オブジェクトの位置は以前のピクチャに基づかないイントラピクチャを送信することなく変更することはできない。
代わりに、その少なくとも1つの単独符号化オブジェクトのビデオ符号化を、背景オブジェクトのビデオ符号化および他のいずれかの少なくとも1つの単独符号化オブジェクトのビデオ符号化に依存させることが可能である。
この実施の形態により基本的に、少なくとも1つの単独符号化オブジェクトのサブピクチャ境界がスライス境界として取り扱われるようになる。それによりたとえ少なくとも1つの単独符号化オブジェクトがインター符号化されていても、少なくとも1つの単独符号化オブジェクトの位置およびサイズは変更され得る。
好ましくは、背景オブジェクトのビデオ符号化は、ビデオ圧縮効率を向上するために、少なくとも1つの単独符号化オブジェクトを使うことが可能になる。
好ましくは、この方法は、ピクチャの復号において使用するための少なくとも1つの単独符号化オブジェクトの位置およびサイズを特徴付ける情報を決定するステップをさらに含む。
好ましくは、少なくとも1つの単独符号化オブジェクトのサイズを特徴付ける情報を決定するステップは、ピクチャの幅に基づいて基準幅を計算し、その基準幅を使って少なくとも1つの単独符号化オブジェクトの幅を表すサブステップを含む。
好ましくは、少なくとも1つの単独符号化オブジェクトのサイズを特徴付ける情報を決定するステップは、ピクチャの高さに基づいて基準高さを計算し、その基準高さを使って少なくとも1つの単独符号化オブジェクトの高さを表すサブステップを含む。
好ましくは、この方法は、ピクチャの復号において使用するための少なくとも1つの単独符号化オブジェクトの各々のタイプを特徴付けるステップをさらに含む。
好ましくは、この方法は、少なくとも1つの単独符号化オブジェクト各々および対応する特徴を相関させるために少なくとも1つの単独符号化オブジェクトに異なる識別子を割り当てるステップをさらに含む。
好ましくは、少なくとも1つの単独符号化オブジェクトのビデオ符号化は、背景オブジェクトのビデオ符号化よりも高い量子化段階密度を用いる。
好ましくは、この方法は、少なくとも1つの単独符号化オブジェクトをデータ破壊からエラー保護するステップをさらに含む。
好ましくは、この方法は、背景オブジェクトをデータ破壊からエラー保護するステップをさらに含む。
好ましくは、少なくとも1つの単独符号化オブジェクトは、背景オブジェクトよりも多くデータ破壊からエラー保護される。
好ましくは、不均衡エラー保護は、少なくとも1つの単独符号化オブジェクトに関連付けられた情報を含むデータパケットを優先順位付けするために用いられる。
好ましくは、ピクチャ内の少なくとも1つの形状の決定は、その外観に基づく。
代わりに、ピクチャ内の少なくとも1つの形状の決定は、同じ動きをしている領域の選択に基づく。
本発明の第2の形態によれば、各符号化ブロックが基本符号化要素の少なくとも1つのグループに対応し、符号化ブロックがピクチャの区域に関連して所定の並びを有している符号化ブロックの集合により符号化されたピクチャをビデオ復号するための方法であって、
復号されているピクチャの少なくとも1つの部分を定める符号化ブロックの少なくとも1つの部分集合に対応する少なくとも1つの単独符号化オブジェクトを決定するステップと、
該少なくとも1つの単独符号化オブジェクトを除くピクチャの部分に対応する符号化ブロックの部分集合を、背景オブジェクトと決定するステップと、
該少なくとも1つの単独符号化オブジェクトを復号するステップと、
背景オブジェクトを復号するステップとを含む方法が提供される。
好ましくは、この方法は、連続した符号化ブロックの復号スライスを形成し、前記少なくとも1つの単独符号化オブジェクトに属する符号化ブロックをスキップするサブステップを含む、背景オブジェクトのためのビデオ復号スライスを決定するステップをさらに含む。
好ましくは、符号化ブロックの少なくとも1つの部分集合の各々が矩形のサブピクチャを定め、それによって正方形が矩形の部分集合となる。
好ましくは、符号化ブロックはマクロブロックである。
好ましくは、少なくとも1つの単独符号化オブジェクトのビデオ復号は、背景オブジェクトのビデオ復号から独立している。
主観的に重要な領域の優先順位付けされた転送のような種々の用途にこの方法を用い得ることがこの方法の利点である。加えて、この方法により、“ピクチャ解像度スケーラビリティ”が可能になる。すなわち、適当なサイズの単独符号化オブジェクトのみを復号することにより、完全なピクチャのためには解像度が小さすぎるディスプレイにちょうど収まるようにピクチャを倍率変更できる。
好ましくは、背景オブジェクトのビデオ復号は、少なくとも1つの単独符号化オブジェクトを使うことを許されている。よりいっそう好ましくは、背景オブジェクトは、処理をより簡単にするために、少なくとも1つの単独オブジェクトから空間的、パラメータ的および/または時間的に予測される。
好ましくは、少なくとも1つの単独オブジェクトは、少なくとも1つの前景領域サブピクチャに対応する。
背景オブジェクトが、主観的に意義が限定されていることがよくあることは、少なくとも1つの単独オブジェクトに基づく予測の利点である。従って、少なくとも1つの単独オブジェクトの情報は、前景領域サブピクチャから背景オブジェクトへの考えられるエラー伝播が主観的なピクチャ品質を過剰に劣化させることはないであろうから、ビデオ圧縮をさらに向上するために用い得る。
好ましくは、この方法は、少なくとも1つの単独符号化オブジェクトの位置およびサイズを決定するステップをさらに含む。
好ましくは、少なくとも1つの単独符号化オブジェクトのサイズを決定するステップは、ピクチャの幅に基づいて基準幅を計算しこの基準幅を用いて少なくとも1つの単独符号化オブジェクトの幅を決定するサブステップを含む。
好ましくは、少なくとも1つの単独符号化オブジェクトのサイズを決定するステップは、ピクチャの高さに基づいて基準高さを計算しこの基準高さを用いて少なくとも1つの単独符号化オブジェクトの高さを決定するサブステップを含む。
好ましくは、この方法は、少なくとも1つの単独符号化オブジェクト各々のタイプを決定するステップをさらに含む。
好ましくは、少なくとも1つの単独符号化オブジェクトのビデオ復号は、背景オブジェクトのビデオ復号よりも高い量子化段階密度を用いる。
好ましくは、この方法は、少なくとも1つの単独符号化オブジェクトの欠損を検出するステップをさらに含む。
好ましくは、少なくとも1つの単独符号化オブジェクトの欠損を検出する方法は、最初に既定の値を有し既定の増分または減分で増加または減少する値を持つ多数の単独符号化オブジェクトを列挙することに基づく。
次に、いずれかの予期されるオブジェクト数が欠けると、復号器は対応する単独符号化オブジェクトの欠損を検出することができる。
好ましくは、この方法は、他の符号化オブジェクトと切り離して少なくとも1つの単独符号化オブジェクトを復号することをさらに含む。
好ましくは、この方法は、少なくとも1つの単独符号化オブジェクトのエラー補正復号のステップをさらに含む。
好ましくは、この方法は、背景オブジェクトのエラー補正復号のステップをさらに含む。
ビットストリームのすべての部分の均等転送およびエラー保護に比べ、よりよい主観的ピクチャ品質を達成できることが、ビデオビットストリームの主観的に最も重要な部分を優先順位付けすることの利点である。
本発明の第3の形態によれば、
ピクチャを、ピクチャの区域に関連した所定の並びを有する、各々が基本符号化要素の1つのグループに対応する規則的形状の符号化ブロックの集合に分割する手段と、
ピクチャ内で少なくとも1つの形状を決定する手段と、
該少なくとも1つの決定された形状をカバーする少なくとも1つの区域を定める符号化ブロックの少なくとも1つの部分集合を選択する手段と、
符号化ブロックの該選択された少なくとも1つの部分集合を、少なくとも1つの単独符号化オブジェクトと決定する手段と、
該少なくとも1つの単独符号化オブジェクトを除くピクチャの部分を、背景オブジェクトと決定する手段と、
該少なくとも1つの単独符号化オブジェクトを符号化する手段と、
1つの符号化オブジェクトとして、背景オブジェクトを符号化する手段とを含むビデオ符号器が提供される。
本発明の第4の形態によれば、
各符号化ブロックが基本符号化要素の少なくとも1つのグループに対応し、符号化ブロックがピクチャの区域に関連して所定の並びを有している符号化ブロックの集合により符号化されたピクチャをビデオ復号するためのビデオ復号器であって、
復号されているピクチャの少なくとも1つの部分を定める符号化ブロックの少なくとも1つの部分集合に対応する少なくとも1つの単独符号化オブジェクトを決定する手段と、
該少なくとも1つの単独符号化オブジェクトを除くピクチャの部分を、背景オブジェクトと決定する手段と、
該少なくとも1つの単独符号化オブジェクトを復号する手段と、
背景オブジェクトを復号する手段とを含む復号器が提供される。
本発明の第5の形態によれば、装置に第1の形態の方法を実現させるためのコンピュータ実行可能プログラム手段を含むコンピュータプログラム製品が提供される。
本発明の第6の形態によれば、装置に第2の形態の方法を実現させるためのコンピュータ実行可能プログラム手段を含むコンピュータプログラム製品が提供される。
本発明の第7の形態によれば、第3の形態のビデオ符号器を含む装置が提供される。
本発明の第8の形態によれば、第4の形態のビデオ復号器を含む装置が提供される。
好ましくは、形態3〜8の装置は、移動通信装置、ワイヤレス通信装置、ゲーム装置、ビデオ記録装置、ビデオ出力装置、通信ネットワークサーバ、通信ネットワークゲートウェイ、パーソナルコンピュータ、ポータブルコンピュータ、およびパーソナルデジタルアシスタント装置からなる群から選ばれる。
本発明の第9の形態によれば、
可変サイズおよび位置を有するビデオ符号化されたピクチャの部分に対応する少なくとも1つの単独符号化オブジェクトに対応する複数の圧縮されたビデオ符号化ブロックと、
該少なくとも1つの単独符号化オブジェクトに対応する少なくとも1つの識別子と、
該少なくとも1つの単独符号化オブジェクトに対応する少なくとも1つの位置およびサイズ情報と、
該少なくとも1つの単独符号化オブジェクトを除くビデオ符号化されたピクチャに対応する符号化ブロックの集合に対応する背景オブジェクトに対応する複数の圧縮されたビデオ符号化ブロックとを含むビデオ信号が提供される。
簡潔にするため、本発明の様々な実施の形態を本発明の1つの形態に関連してのみ例示してきたが、対応する実施の形態が他の局面にも同様に当てはまり得ることが理解されるべきである。
本発明を例として添付図面に関して説明する。
本発明の好ましい実施の形態は、ピクチャおよびスライス層間にサブピクチャ符号化層を付加することによりITU−T H26Lを補っていると見なすことができる。サブピクチャ符号化層は、いわゆる背景領域(BR)SPを除いて、一般に矩形のいわゆるサブピクチャ(SP)(前景領域SPまたはFR SP)を形成するものとする。BR SPは、矩形のSPのいずれにも入らない画面領域からなる。すべてのSPは最初はスキャン順序で符号化される。すなわち、スライスはSPから開始し、次に、主観的に最も重要なSPが最初に符号化されBR SPが最後に符号化されるように、スライスは一般に主観的優先順位の順番に従って選ばれる。SPは重ならない。すなわち、符号化された画面全体は、すべてのSPで構成されている。
図1は、ビデオ符号化用に定義されたマクロブロック(MB)に関連して符号化される画面100を示している。この画面は、主たる関心である前景オブジェクト101と見なされる(描かれたアニメーションの)ハート形を含む。矩形の前景領域サブピクチャ(FR SP)102が、MB境界線に沿って前景オブジェクト周囲に描かれている。前景オブジェクト101を取り囲んで、画面は背景も有している。FR SP102を取り囲む背景の部分は、背景領域サブピクチャ103(BR SP)と呼ばれる。ここでのケースのように、背景の一部分もFR SP102に属することがあることに注目されたい。図1は、0から79まで昇順で番号を割り当てられたMBも示しており、最初のMB(0)は、左側上隅にあり、番号は右へ行くにつれて大きくなり、各行の後は次行の左から再開する。
図2は、本発明の好ましい実施の形態による図1のピクチャについて形成されたビデオ符号化スライスの主要図を示している。画面は、5マクロブロックのスライスサイズによりビデオ符号化スライスに分割される。分割は最も重要なFR SPから開始され、BR SPは、すべてのFR SPの後にスライスに分割される(図1および図2には、1つのFR SPのみが存在している)。0から始まる連続スライス番号がスライスに与えられる。スライス0がFR SP内の第1行の3つのMBとFR SP内の第2行の2つのMBを占めること、およびとりわけBR SPが符号化される前にFR SPの最後のスライスが閉じられることに注目されたい。次にBR SP中のMBは、最後のスライスを除いて各スライスが1つのMBについて許される最大数のMBで一般に構成されるように、スキャン順序でスライスに分割される。スライスは各FR SPを単純にスキップする。一般に、スライスがより大きいほど画面を符号化するために必要とされる冗長性の量がより少ないという結果になる。
図3は、本発明の好ましい実施の形態による画面のビデオ符号化プロセスのフローチャートを示す。このフローチャートは、ビデオ符号化される画面が受信されたブロック310から始まる。
開始後、プロセスはブロック320へ続き、そこで1つ以上の前景オブジェクト101の検出が試みられる。次にブロック330では、いずれかの前景オブジェクト101が検出されたか否かをチェックする。もしノーであれば、ブロック331においてその画面を単独の符号化ブロックとして符号化し、プロセスは終了する。もしイエスであれば、まだ符号化されていない最も重要な前景オブジェクト101をブロック340において選ぶ。次にブロック350において、選ばれた前景オブジェクト101をカバーするマクロブロック(FR SP102)の可能な最小領域を決定する。一般に、可能な領域は、矩形形状(正方形を含む)のような所定形状に限られる。それはこの形状が、携帯型デバイスに適した単純なビデオ符号化および復号を提供するからである。本発明の別の実施の形態においては、ビデオ符号器について、用いられた形状を復号器に知らせるためのメカニズムが合意されているのであれば、可能な領域の他の種々の所定形状を用いることができる。
ブロック360で、次にFR SP102はビデオ符号化される。その後、ブロック370は、まだ符号化されていない前景オブジェクト101が依然としてあるかどうかをチェックする。もしイエスなら、プロセスはブロック340へ戻り、そうでなければプロセスはブロック380へ進む。ブロック380で、BR SP、すなわちいずれのFR SPにも属さないMBがビデオ符号化される。次にプロセスはブロック390で終了する。
別の実施の形態において、ブロック350は、一連の連続した画面中の選ばれた前景オブジェクト101をカバーするマクロブロック(FR SP102)の可能な最小領域を決定する。さらに別の実施の形態において、ブロック350は、可能な最小領域を、それが選ばれた前景オブジェクト周囲にある量の余地を確保するように決定する。さらに別の実施の形態において、マクロブロックの可能な領域は、所定のサイズおよび/または形状である。
図4は、本発明の好ましい実施の形態による画面の復号プロセスのフローチャートを示す。このプロセスは、ビデオ符号化された画面に対応する符号化されたビデオ情報が受信されたブロック410から始まる。ブロック420において、復号器は次に、なんらかの符号化されたFR SPを検出しようと試みる。ブロック430において、なんらかのFR SPが検出されたか否かがチェックされる。もしノーであれば、次にブロック431においてそのピクチャを単独の符号化オブジェクトとして復号することが試みられ、そうでなければ、プロセスはブロック440へ進む。ブロック440は、まだ復号されていない最も重要なFR SPを選ぶ。ブロック450において、選ばれたFR SPが次に復号され、ブロック460は、まだ復号されていないFR SPが依然としてあるか否かをチェックする。もしイエスであれば、プロセスはブロック440へ戻り、そうでなければブロック470へ進む。ブロック470において、すべてのFR SPが正しく復号されたか否かがチェックされる。もしノーであれば、プロセスは、図5に示されるブロックAから続行する。もしイエスであれば、プロセスはブロック480へ進み、そこでBR SPが復号される。この後、プロセスはブロック490で終了する。
図5は、万一すべてのFR SPが正しく復号されなかった場合の、本発明の好ましい実施の形態によるBR SPの復号のフローチャートを示す。復号はブロック510から開始する。ブロック520において、各FR SPの位置およびサイズが既知であるか否かが次にチェックされる。独立したサブピクチャ復号モードでは、サブピクチャの位置およびサイズは、INTRAピクチャにおいてのみ変更できる(H.263独立セグメント復号と同様)。この事実は、実際的な実装において用い得る。各FR SPの位置およびサイズの知識は、BR SP復号にとって重要である。なぜならは、BR SPは、すべてのFR SPの位置およびサイズが既知である場合にのみ決定できるからである。もしノーであれば、復号器はBR SPを全く復号できず、プロセスは終了し、そうでなければ、復号器はブロック530へ進む。ブロック530において、いずれかの破損FR SPを用いてBR SPが符号化されたか否かがチェックされる。FR SPのMBへのどのような参照もなくBR SPが符号化されることがあり、その場合に答えはノーになるはずであり、プロセスはブロック550へ進む。ブロック550において、BR SPは復号される。しかしながら、もしBR SPがいずれかの破損FR SPを用いて符号化されたのであれば、プロセスはブロック530から、BR SPのエラー隠しブロック540へ進む。基本的に、各FR SPの位置およびサイズが既知である場合、BR SPは、前回のBR SPおよび/または現在のFR SPを用いて推定し得る。最も単純には、すべてのFR SPがそれらのサイズおよび位置について前回の画面と同じであれば、まさにその前回のBR SPをそのまま用いることができる。ビデオ符号化において、このタイプのエラー隠しを可能にする多くの時間的冗長性が一般にある。さらに、BR SPのエラー隠しは、回復のためにBR SPの符号化された表現を利用できることがよくある。
次に、符号化プロセスをより詳細に説明する。好ましい実施の形態において、FR SPを符号化するために、2つの異なる符号化モード、すなわち独立SP符号化および通常予測モード、を用いることができる。独立SP符号化においては、FR SPの境界はピクチャ境界として取り扱われる。SPのセグメント化は一群の画面(または、同様なピクチャのグループ)に渡って静的である。SP境界上での時間的および空間的予測の両方は、エラー伝播を制限するためにFR SPを符号化する際に阻止される。しかしながら、BR SPはより低い主観的重要性を持っていると見なされ、エラー伝播から保護される必要はないので、BR SPはBR SP境界上での時間的および空間的予測を可能にしつつ符号化できる。例えば、動き補償ビデオ符号化において用いられる動きベクトルがFR SPの外をポイントすることはない。空間的予測もループフィルタリングも、FR SP境界を越えて許可されない。
従って、BR SPはFR SPを用いて予測することができ、もしFR SPを特徴付けるデータパケットのいずれかが復号器により受信されなかったなら、BR SPは全く決定できない。連続して、FR SPのいずれかのサイズまたは位置が決定できない場合には、BR SPの復号は試みられる必要すらなく、これにより復号器の電力消費が低減される。さらに、BR SPが復号される前にはFR SPのサイズおよび位置が常に知られているので、それらは、BR SPを符号化するための基礎としてうまく用いることができる。
好ましい実施の形態によるビットストリーム構文を次に説明する。
FR SPの使用は、例えば2001年9月26日のITU−T VCEG文書VCEG−N72R1中で示唆されたように、ピクチャおよびシーケンスレイヤデータのパラメータリスト中で示される。サブピクチャの特徴はおそらく、ベースラインプロファイルの範囲から外れ、エラー多発環境のみのためのプロファイルに属する。
サブピクチャが使用中の場合には、スライスヘッダは以下の通りである。
PictureID 前記のVCEG−N72−R1中で定義されたもの。
SliceType 前記のVCEG−N72−R1中で定義されたもの。
FirstMBInSliceX サブピクチャに関連するスライス中の最初のマクロブロックの水平位置(列)。
FirstMBInSliceY サブピクチャに関連するスライス中の最初のマクロブロックの垂直位置(行)。
InitialQP 前記のVCEG−N72−R1中で定義されたもの。
SubPictureID 一意のサブピクチャ識別子。各サブピクチャに、0から始まり符号化順序で1ずつ増分されるIDが割り当てられる。カウントは各ピクチャごとにリ集合される。もし独立サブピクチャ符号化が使用されていれば、サブピクチャIDは、1つのピクチャグループにわたり空間的に一致するサブピクチャについて同じままである。
SubPictureInfo 0:サブピクチャ属性は、前回のピクチャ中の同じIDを持っているサブピクチャの属性と同じである。この値は、特に独立サブピクチャ符号化モードにおいて有用である。
1:サブピクチャ属性は、同じピクチャ中で同じIDを持っているサブピクチャの属性と同じである。もしサブピクチャが複数のスライスを含んでいれば、この値が用いられる。
2:サブピクチャ位置およびサイズは、以下の4つの符号語中で定義される。もし独立サブピクチャ符号化が使用されていれば、以下の4つの符号語はブロックの1つのグループ内で同じままであある。符号語の反復はエラー耐性目的を考慮してある。
3:背景サブピクチャ。もし同じピクチャについてのより以前のサブピクチャの1つが失われており、その位置およびサイズが外部に知らされていなければ(これは普通の予測モードで一般的)、復号器は背景サブピクチャを、その形状が未知なので復号しない。
Left サブピクチャ中の最も左のマクロブロックの座標(マクロブロック中)。ピクチャの最も左のマクロブロック列は、値ゼロが割り当てられる。
Top サブピクチャ中の一番上のマクロブロックの座標(マクロブロック中)。ピクチャの一番上のマクロブロック行は、値ゼロが割り当てられる。
Width サブピクチャの幅。符号語は以下のように割り当てられる。
Figure 2005510982
Height サブピクチャの高さ。符号語はWidthと同様に割り当てられる。
ソース符号化方法の応用
好ましい実施の形態のビデオ符号化および復号方法の主要な応用の1つは、主観的に重要なサブピクチャの転送優先順位付けである。
提案された方法は、頻繁な、すなわち固定的に割り当てられたスライスの符号化と比較して圧縮効率を高めることができる。矩形サブピクチャは、滑らかな動き場または一貫したテクスチュアを持っていることがよくあり、従って、比較的均質なサブピクチャ上で用いられた場合に動きベクトルまたはINTRA符号化はより良好に動作する。
独立サブピクチャは、ピクチャ解像度スケーラビリティのためにも用いることができる。同じQCIFビットストリーム、例えばマルチメディアメッセージが、スクリーンサイズが異なる2つのハンドヘルドデバイスへ転送されると仮定する。一方は、QCIF(176×144)までのサイズをサポートし、他方はQQVGA(160×120)までのサイズをサポートする。QQVGAディスプレイ矩形上にQCIFピクチャを適合させるために、従来は2つの可能性がある。すなわち、第1は、ピクチャはダウンスケールできるが、これは計算が高価なことがある。第2に、ピクチャはトリミングできる(左右から8画素および上下から12画素)けれども、トリミングされた画素はいずれにせよ復号されなければならない。独立サブピクチャはさらに別の解決策を提供する。すなわち、144×112サイズのサブピクチャがQCIFピクチャの中心に置かれるように、ビットストリームを符号化することができるであろう。ビットストリームは、サブピクチャのみが復号されるように、QQVGAディスプレイ矩形用に復号できる。その結果、ピクチャあたり99個のオリジナルのマクロブロックのうち36個は復号される必要がない。
好ましい実施の形態を用いるインターネットストリーミングについての例を次に説明する。
マルチキャストインターネットストリーミングを目標アプリケーションとして選択した。選択のための根拠は、低遅延インターネットアプリケーション(VCEG−N79R1)のための共通条件がマルチキャストストリーミングに容易に適用できることであった。
対話型エラー補正をIPマルチキャストで大規模に用いることができないので、順方向エラー制御方法が用いられた。この方法は、伝送符号化レベル(FECパケット、パケット複製)またはソース符号化レベル(INTRAマクロブロック更新)に応用できる。3つのケースを検討した。
1. クライアントにおけるプレイバック開始前の比較的長い(1秒、または10フレーム/秒のフレームレートで10フレーム)初期バッファリング。リードソロモン(Reed-Solomon)順方向エラー符号化を用いた。
2. クライアントにおけるプレイバック開始前の中程度量(2フレーム)の初期バッファリング。RFC2733によるパリティ順方向符号化を用いた。
3. クライアントにおけるプレイバック開始前の中程度量(2フレーム)の初期バッファリング。伝送レベル順方向エラー符号化なし。
最良の結果がケース1で達成できる一方で、クライアントは必要なバッファリング能力を欠くことがある。さらに、リードソロモンFECパケットは(本発明者らの知る限り)標準化されていない。従って、単純パリティFECベース方式(ケース2)でも結果は得られ、この方式はほとんどの実用システムに実装が十分容易なはずである。しかしながら、3GPPパケット交換ストリーミングサービス(リリース4)のようないくつかのシステムは、パリティFECのためのサポートを含まず、従って、ケース3も試験集合に付け加えた。
試験条件
コーデック:
本発明の好ましい実施の形態の符号化方法を、TML−8.5にエラー補正実装(VCEG−N62)を加えた暫定バージョンTML−8.6に基づいて実装した。これは矩形サブピクチャ(RSP)コーデックと呼ばれた。RSPコーデックの性能を、従来のコーデック1(TML−86に関心領域量子化を加えたもの)および従来のコーデック2(TML−86、関心領域量子化なし)と比較した。
コーデックパラメータ:
・ 動きベクトル解像度:1/8pel
・ アダマール変換:使用
・ 最大サーチ範囲:16
・ インター動きサーチ用に使用された前回のフレーム数:5
・ すべてのブロックタイプを可能にした
・ スライスモード:スライスあたりMB数を固定
・ BフレームおよびSP−フレーム:使用せず
・ 記号モード:CABAC
・ データパーティション:1スライスあたり1パーティション
・ シーケンスヘッダ:シーケンスヘッダなし
・ サーチ範囲制限:なし
・ レート歪み最適化モード決定:オン
・ 制約イントラ予測:使用せず
・ 変更QP:使用せず
・ 付加的基準フレーム:使用せず
その他の条件:
・ VCEG−N79R1中で規定されるように4000フレームを符号化する代わりに、復号されたビデオのPSNRが10回のランの各々について計算され、平均PSNRに加えて10回のランの最良および最悪のケースが、VCEG−M77中で提案されるように示される。この方法は、損失パターンファイルの位置に依存するPSNRの変化を示すために用いられる。このシミュレーションにおいて、n+1番目のランの開始損失位置は、n番目のランの終了損失位置に継続的に続く。
・ 一定のパケット化オーバーヘッド(40バイト/パケット)が、VCEG−N79R1におけるように仮定される。FECパケットを含むすべてのパケットのパケット化オーバーヘッドは、利用可能なビデオビットレートを計算するために、利用可能な総ビットレートから引かれる。
・ 現行のTMLソフトウェアにはレート制御ストラテジーが全く実装されていないので、本発明者らは、サブセクション4.4に記載されているビット割り当て方法に従って所望のビットレートを取得する。
・ VCEG−N79R1中で規定されるように、PSNRは、(フルフレームレートでの)ソースシーケンスのすべてと、対応する再構成フレームとの間で計算される。
・ INTRA GOB更新が、マクロブロックモード選択メカニズムの代わりに用いられた。
テストシーケンスおよびセグメンテーション
実験はカーフォン(Carphone)シーケンスで行った。シーケンスのQCIFバージョンが用いられた。これは10fpsのフレームレートで符号化された。目標総ビットレートは64kbpsであった。符号化されたフレーム数は101個であった(2つ置きにスキップされたカーフォンシーケンスの303個のフレーム)。
前景サブピクチャは手動で選択され、ビデオクリップの全ピクチャ中のシリーズ中に現われる仲間の頭部をカバーした。従来のコーデック1においては、前景サブピクチャのための区域は、ピクチャの残部よりも細かく量子化された関心領域として選択された。一定の64×64前景サブピクチャがシーケンス全体を通して用いられた。独立サブピクチャ符号化モードが使用されていた。
パケット化および順方向エラー補正
すべてのケースにおいて、RS FECパケットのサイズは、RS FECパケットによって保護されたパケットの最大サイズに等しいと仮定される。もしn個のビデオパケットの各ブロックについてm個のFECパケットが符号化されれば、符号化方式はRS(n,m)として記録される。FEC方式は、各ブロックあたりm個までのパケット(ビデオパケットとFECパケットとの任意の組み合わせ)の損失を補正することができる。
ケース1:RS FECでバッファされた10個のフレーム
RSPコーデック(唯一の前景サブピクチャ):
・ イントラピクチャについては、4個のパケットがある。すなわち、前景サブピクチャ(GOBインターリーブ適用)のための2個のパケット、2個の前景パケットのための1個のRS(2,1)パケット、および背景サブピクチャのための1個のパケットである。
・ インターピクチャについては、10個のフレームが1つのグループを成す。各グループについて、10個の前景サブピクチャパケット、前景パケットのためのm(mは可変)個のRS(10,m)パケット、および10個の背景サブピクチャパケットがある。前景および背景のためのパケット化方法がインターリーブ方法であることに留意されたい。すなわち、フレームnのGOBの偶数とフレームn+1のGOBの奇数とが1個のパケット中にあり、逆もまた同様である。
従来のコーデック:
・ イントラピクチャについては、3個のパケットがある。すなわち、ピクチャ全体のための2個のGOBインターリーブパケット、および1個のRS(2,1)パケットである。
・ インターピクチャについては、10個のフレームが1つのグループを成す。各グループについて、20個のパケットがあり、その各々は、特定フレームの1つおきのGOB、およびm(mは可変)個のRS(20,m)パケットを含んでいる。
ケース2:パリティFECでバッファされた2つのフレーム
2個のパケットについてのパリティFECの結果がRS(2,1)の結果と同じであることに留意されたい。従って、文書化を単純化するため、パリティFECはRS(2,1)と同じであると見なされる。
RSPコーデック(唯一の前景サブピクチャ):
・ イントラピクチャについては、ケース1と同じである。
・ インターピクチャについては、2個のフレームが1つのグループを成す。各グループについて、2個の前景サブピクチャパケット、前景パケットについての1個のRS(2,1)パケット、および1個の背景サブピクチャパケットがある。前景および背景のパケット化方法はケース1におけるものと同じである。
従来のコーデック:
・ イントラピクチャについては、ケース1と同じである。
・ インターピクチャについては、各フレームは3個のパケットを有している。すなわち、2個のGOBインターリーブパケットおよび1個のRS(2,1)パケットである。
ケース3:FECなしでバッファされた2個のフレーム
すべてのコーデックは、ケース2におけるものと同じパケット化方法を用いる。唯一の違いはFECパケットが全くないことである。
ビット割り当て
ビットレートはいくつかの要因により決定される。すなわち、イントラGOB更新(IGU)レート、FECレート、スライス方法、およびQPである。(非GOB形状スライスが用いられる場合、イントラ更新されたGOB外からの予測が防止されるべきであることに留意されたい。GOB形状スライスについては、予測防止はスライス予測制限によりなされる。)シミュレーションにおいて、前者の3つの要因は、もし可変であれば、試行錯誤により最適化される。他の要因が固定されている場合、QPは以下のように調整される。
関心領域(ROI)符号化の領域のためのQPまたはQPペアは、シーケンス全体について固定される。
ROI符号化なしの従来のコーデックについては、QPは、利用可能なビデオビットレートにできるだけ密接に適合するように直接的に調整される。
RSPコーデックまたはROI符号化を伴う従来のコーデックについては、QPペアは以下のように調整される(QPfは前景用であり、QPbは背景用である):
最初に、QPfを決める。QPbを最大(31)になるように設定し、QPfを、利用可能なビデオビットレートにできるだけ密接に適合するように調整する。
次に、QPbを改良する。QPfを上記で決められたように固定させ、利用可能なビデオビットレートにできるだけ密接に適合するようにQPbを調整する。
結果
客観的結果
最適化された結果のみをここに提示する。IGUレート、FECレート、およびスライシング方法を最適化する時には、これらに範囲制限は全く適用されない。コーデックにより決められた最大範囲が用いられる。すなわち、IGUレート範囲は、0〜1GOB/フレームであり、FECレート(RS(n,m)中のm)は、0〜(上限なし)であり、スライシングは、1〜9(QCIFシーケンスの場合の最大値)GOB/スライスである。
3つのケースの結果が得られた。以下の議論において、PLRはパケット損失レートを意味し、IGUfおよびIGUbはそれぞれ、前景および背景サブピクチャのIGUである。IGUレートの単位はGOB/フレームである。
結果は以下の通りであった:
・ 各ケースにおいて、提案されたRSPコーデックは、前景領域について最高のPSNRを有し、ROI符号化を伴う従来のコーデックは、ROIなしの従来のコーデックよりも優れている。ケース1では、RSPコーデックの平均PSNRは、ROI符号化を伴う従来のコーデックよりも0.78dB〜0.96dB高く、ROI符号化なしの従来のコーデックよりも1.94dB〜2.40dB高い。ケース1では、向上はそれぞれ、1.09dB〜1.59dBおよび2.04dB〜2.38dBである。ケース3では、向上はそれぞれ、PLRが非0である場合、0.28dB〜1.52dBおよび1.28dB〜1.86dBである。
・ もし比較的長いシーケンスがバッファされれば(ケース1)、適切なRS FECが、PLR3%、5%、および10%におけるすべてのパケット損失、ならびにPLR20%におけるほとんどのパケット損失を回復できる。
・ ケース3では、RSPコーデックは従来のコーデックより優れている。1つの理由は、RSPコーデックを使用している前景領域がより大きいIGUレートを有していることである。QCIFシーケンスについては、フレームあたり9つのGOBがある。従って、IGU=1は、真のIGUレートが1/9であることを意味している。前景サブピクチャ(それがMBの6本のラインを持っていると仮定する)については、IGU=1は、真のIGUレートが1/6であることを意味している。現行のTMLソフトウェアにおいては、最大IGUは1である。しかしながら、提示された結果から、より大きいIGUレートまたは他のイントラ更新方法が開発されるべきと推論できる。主観的結果
各ケースについて、主観的評価のための代表的シーケンスとして、平均値に最も近いPSNR値を持っているシーケンスが選ばれた。
たとえスナップショットが種々の方式の挙動の完全な概念を与えないとしても、スナップショットはいくつかの局面を捕らえる。0%、5%、および20%パケット損失レートならびに提示された符号化方式についての最後に復号されたピクチャのスナップショットが試験された。
スナップショットは、一定のQPを持つ従来の符号化方式がすべてのケースで明確に最悪であるように見えることを示した。スナップショットは、提示された符号化方式における関心区域が他の方式より主観的に優れることも示している。このことは、20%損失レートのケースにおいて、FECパケットが全く用いられない場合にこれは最も明確に見ることができる。
一般に、提示されたスナップショットは、損失がFECパケットにより回復されることおよびINTRA GOBが(スナップショット中にどのような可視エラーもほとんどないので)比較的早く更新するという事実と合致する。
図6は、本発明の好ましい実施の形態による移動通信装置MSのブロック図を示す。この移動通信装置において、主制御ユニットMCUは、移動通信装置の様々な機能を担うブロック、すなわち、ランダムアクセスメモリRAM、無線周波数部分RF、リードオンリーメモリROM、ビデオコーデックCODECおよびユーザーインタフェースUIを制御する。ユーザーインタフェースは、キーボードKB、ディスプレイDP、スピーカーSPおよびマイクMFを含む。MCUは、マイクロプロセッサー、あるいは別の実施の形態においては、なんらかの他の種類のプロセッサ、例えばデジタルシグナルプロセッサである。有利には、MCUの操作命令はあらかじめROMメモリ中に格納されている。その命令(すなわち、コンピュータプログラム)に従って、MCUは、無線パス上でデータを送信および受信するためにRFブロックを用いる。ビデオコーデックは、ハードウェアベースとするか、あるいは完全または部分的にソフトウェアベースとすることができ、その場合に、CODECは、必要とされる符号化および復号機能を実行するためにMCUを制御するためのコンピュータプログラムを含む。MCUは、その作業メモリとしてRAMを使う。移動通信装置は、ビデオカメラによって動画ビデオを取り込むことができ、MCU、RAMおよびコーデックベースのソフトウェアを用いてその動画ビデオを符号化およびパケット化することができる。次に、符号化されたビデオを相手方と交換するためにRFブロックが使用される。
図7は、複数の移動通信装置MS、移動通信ネットワーク71、インターネット72、ビデオサーバ73およびインターネットに接続された固定PCを含むビデオ通信システム70を示す。ビデオサーバは、ビデオ符号器を備え、天気予報やニュースのようなオンデマンドビデオストリームを提供することができる。
本発明の好ましい実施の形態は、領域ベースの符号化方式に基づく。MPEG−4ビデオとは異なり、この実施の形態は、ビデオ符号化および復号における任意形状領域のどのような複雑な処理も必要とせず、従ってハンドヘルド装置に適用可能である。本発明の好ましい実施の形態により、転送優先順位付けを可能にし、エラーが起きがちなビデオ通信システムにおいて主観的により優れたピクチャ品質を達成するための堅牢なビデオ符号化および復号ツールが提供される。
好ましい実施の形態は、種々の文脈、例えばITU−T H26Lビデオ符号化標準の文脈において応用できる。本発明の特定の実施および実施の形態を説明してきた。本発明は上記で提示された実施の形態の詳細に限定されないが、本発明の特徴を逸脱することなく同等の手段を用いることにより本発明を実施できることは当業者にとり明確である。本発明の範囲は、添付の特許請求の範囲により限定されるのみである。
略語:
AVO オーディオビジュアルオブジェクト
BR 背景領域
CABAC コンテキストベース適応バイナリ算術符号化
DCT 離散コサイン変換
DPL データパーティショニング層
FEC 順方向エラー補正
FR 前景領域
GOB グループオブブロック
IGU イントラGOB更新
ITU 国際電気通信連合
MB マクロブロック
MPEG 動画専門家グループ
NAL ネットワーク適応レイヤ
QCIF クオーター共通交換形式(Quarter Common Intermediate Format)
QP 量子化パラメータ
QPb 背景用量子化パラメータ
QPf 前景用量子化パラメータ
QQVGA 160×120画素ビデオ型式
ROI 関心領域
RS リードソロモン(Reed-Solomon)
RSP 矩形サブピクチャ
RTP リアルタイム転送プロトコル
SEI 補足的拡張情報
SP サブピクチャ
TML テストモデル長期(Test Model Long-term)
UVLC 汎用可変長コード
VCL ビデオ符号化層
VO ビデオオブジェクト
VOL ビデオオブジェクト層
VOP ビデオオブジェクトプレーン
YUV 3つの色成分
ビデオ符号化用に定められたマクロブロックに関して符号化される画面を示す。 本発明の好ましい実施の形態による図1の画面について形成されたビデオ符号化スライスの主要図面を示す。 本発明の好ましい実施の形態による画面のビデオ符号化のフローチャートを示す。 本発明の好ましい実施の形態による画面の復号のフローチャートを示す。 すべての前景領域サブピクチャが正しく復号されない場合の、本発明の好ましい実施の形態による背景領域の復号のフローチャートを示す。 本発明の好ましい実施の形態による移動通信装置のブロック図を示す。 本発明の好ましい実施の形態によるシステムを示す。

Claims (17)

  1. ビデオ符号化方法であって、
    ピクチャを、ピクチャの区域に関連した所定の並びを有する、各々が基本的符号化要素の少なくとも1つのグループに対応する規則的形状の符号化ブロックの集合に分割するステップと、
    ピクチャ内で少なくとも1つの形状を決定するステップと、
    該少なくとも1つの決定された形状をカバーする少なくとも1つの区域を定める符号化ブロックの少なくとも1つの部分集合を選択するステップと、
    符号化ブロックの該選択された少なくとも1つの部分集合を、少なくとも1つの単独符号化オブジェクトと決定するステップと、
    該少なくとも1つの単独符号化オブジェクトを除くピクチャの部分を、背景オブジェクトと決定するステップと、
    該少なくとも1つの単独符号化オブジェクトを符号化するステップと、
    1つの符号化オブジェクトとして、背景オブジェクトを符号化するステップとを含む方法。
  2. 前記背景符号化オブジェクトは、前記少なくとも1つの単独符号化オブジェクトを用いて符号化される請求項1に記載の方法。
  3. 前記背景符号化オブジェクトをビデオ符号化するステップは、前記少なくとも1つの単独符号化オブジェクトに含まれる基本符号化オブジェクトをスキップする連続的な符号化ブロックによりスライスが構成されるように、符号化スライスをスキャン順序で定めるサブステップをさらに含む請求項1または2に記載の方法。
  4. 前記少なくとも1つの単独符号化オブジェクトをビデオ符号化するステップは、該少なくとも1つの単独符号化オブジェクトに含まれる符号化ブロックのスキャン順序でスライスが構成されるように、各単独符号化オブジェクト内でスキャン順序で符号化スライスを定めるサブステップをさらに含む先行請求項のいずれか1項に記載の方法。
  5. 前記少なくとも1つの決定された形状をカバーする区域は矩形区域であり、それにより正方形が矩形の1つの部分集合になる先行請求項のいずれか1項に記載の方法。
  6. 前記単独符号化オブジェクトは主観的重要性の降順で定められる先行請求項のいずれか1項に記載の方法。
  7. 前記少なくとも1つの単独符号化オブジェクトのビデオ符号化は、該少なくとも1つの単独符号化オブジェクト中へのエラー伝播を阻止するために、背景オブジェクトのビデオ符号化から独立している先行請求項のいずれか1項に記載の方法。
  8. 前記少なくとも1つの単独符号化オブジェクト各々および対応する特徴を相関させるために該少なくとも1つの単独符号化オブジェクトに異なる識別子を割り当てるステップをさらに含む先行請求項のいずれか1項に記載の方法。
  9. 各符号化ブロックが基本符号化要素の少なくとも1つのグループに対応し、符号化ブロックがピクチャの区域に関連して所定の並びを有している符号化ブロックの集合により符号化されたピクチャをビデオ復号するための方法であって、
    復号されているピクチャの少なくとも1つの部分を定める符号化ブロックの少なくとも1つの部分集合に対応する少なくとも1つの単独符号化オブジェクトを決定するステップと、
    該少なくとも1つの単独符号化オブジェクトを除くピクチャの部分に対応する符号化ブロックの部分集合を、背景オブジェクトと決定するステップと、
    該少なくとも1つの単独符号化オブジェクトを復号するステップと、
    背景オブジェクトを復号するステップとを含む方法。
  10. 連続した符号化ブロックの復号スライスを形成し、前記単独符号化オブジェクトのいずれかに属する符号化ブロックをスキップするサブステップを含む、背景オブジェクトのためのビデオ復号スライスを決定するステップをさらに含む請求項9に記載の方法。
  11. 前記少なくとも1つの単独符号化オブジェクトのビデオ復号は、背景オブジェクトのビデオ復号から独立している請求項9または10に記載の方法。
  12. 前記少なくとも1つの単独オブジェクトは、少なくとも1つの前景領域に対応する請求項9〜11のいずれか1項に記載の方法。
  13. ビデオ符号器であって、
    ピクチャを、ピクチャの区域に関連した所定の並びを有する、各々が基本符号化要素の1つのグループに対応する規則的形状の符号化ブロックの集合に分割する手段と、
    ピクチャ内で少なくとも1つの形状を決定する手段と、
    該少なくとも1つの決定された形状をカバーする少なくとも1つの区域を定める符号化ブロックの少なくとも1つの部分集合を選択する手段と、
    符号化ブロックの該選択された少なくとも1つの部分集合を、少なくとも1つの単独符号化オブジェクトと決定する手段と、
    該少なくとも1つの単独符号化オブジェクトを除くピクチャの部分を、背景オブジェクトと決定する手段と、
    該少なくとも1つの単独符号化オブジェクトを符号化する手段と、
    1つの符号化オブジェクトとして、背景オブジェクトを符号化する手段とを含むビデオ符号器。
  14. 各符号化ブロックが基本符号化要素の少なくとも1つのグループに対応し、符号化ブロックがピクチャの区域に関連して所定の並びを有している符号化ブロックの集合により符号化されたピクチャをビデオ復号するためのビデオ復号器であって、
    復号されているピクチャの少なくとも1つの部分を定める符号化ブロックの少なくとも1つの部分集合に対応する少なくとも1つの単独符号化オブジェクトを決定する手段と、
    該少なくとも1つの単独符号化オブジェクトを除くピクチャの部分に対応する符号化ブロックの部分集合を、背景オブジェクトと決定する手段と、
    該少なくとも1つの単独符号化オブジェクトを復号する手段と、
    1つの符号化オブジェクトとして、背景オブジェクトを復号する手段とを含む復号器。
  15. 装置にピクチャをビデオ符号化させるためのコンピュータ実行可能プログラム手段を含むコンピュータプログラム製品であって、
    装置にピクチャを、ピクチャの区域に関連した所定の並びを有する、各々が基本符号化要素の少なくとも1つのグループに対応する規則的形状の符号化ブロックの集合に分割させるためのコンピュータ実行可能プログラムコードと、
    装置にピクチャ内で少なくとも1つの形状を決定させるためのコンピュータ実行可能プログラムコードと、
    装置に該少なくとも1つの決定された形状をカバーする少なくとも1つの区域を定める符号化ブロックの少なくとも1つの部分集合を選択させるためのコンピュータ実行可能プログラムコードと、
    装置に符号化ブロックの該選択された少なくとも1つの部分集合を、少なくとも1つの単独符号化オブジェクトと決定させるためのコンピュータ実行可能プログラムコードと、
    装置に該少なくとも1つの単独符号化オブジェクトを除くピクチャの部分を、背景オブジェクトと決定させるためのコンピュータ実行可能プログラムコードと、
    装置に該少なくとも1つの単独符号化オブジェクトを符号化させるためのコンピュータ実行可能プログラムコードと、
    装置に1つの符号化オブジェクトとして、背景オブジェクトを符号化させるためのンピュータ実行可能プログラムコードとを含むコンピュータプログラム製品。
  16. 装置に各符号化ブロックが基本符号化要素の少なくとも1つのグループに対応し、符号化ブロックがピクチャの区域に関連して所定の並びを有している符号化ブロックの集合により符号化されたピクチャをビデオ復号させるためのコンピュータ実行可能プログラム手段を含むコンピュータプログラム製品であって、
    装置に復号されているピクチャの少なくとも1つの部分を定める符号化ブロックの少なくとも1つの部分集合に対応する少なくとも1つの単独符号化オブジェクトを決定させるためのコンピュータ実行可能プログラムコードと、
    装置に該少なくとも1つの単独符号化オブジェクトを除くピクチャの部分に対応する符号化ブロックの部分集合を背景オブジェクトと決定させるためのコンピュータ実行可能プログラムコードと、
    装置に該少なくとも1つの単独符号化オブジェクトを復号させるためのコンピュータ実行可能プログラムコードと、
    装置に背景オブジェクトを1つの符号化オブジェクトとして復号させるためのコンピュータ実行可能プログラムコードとを含むコンピュータプログラム製品。
  17. ビデオ信号であって、
    可変サイズおよび位置を有するビデオ符号化されたピクチャの部分に対応する少なくとも1つの単独符号化オブジェクトに対応する複数の圧縮されたビデオ符号化ブロックと、
    該少なくとも1つの単独符号化オブジェクトに対応する少なくとも1つの識別子と、
    該少なくとも1つの単独符号化オブジェクトに対応する少なくとも1つの位置およびサイズ情報と、
    該少なくとも1つの単独符号化オブジェクトを除くビデオ符号化されたピクチャに対応する符号化ブロックの集合に対応する背景オブジェクトに対応する複数の圧縮されたビデオ符号化ブロックとを含むビデオ信号。
JP2003548548A 2001-11-27 2002-11-22 画面がスライスに分割される前景および背景のビデオ符号化および復号 Expired - Lifetime JP4485796B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB0128359A GB2382940A (en) 2001-11-27 2001-11-27 Encoding objects and background blocks
PCT/IB2002/004932 WO2003047266A1 (en) 2001-11-27 2002-11-22 Video encoding and decoding of foreground and background; wherein picture is divided into slices

Publications (3)

Publication Number Publication Date
JP2005510982A true JP2005510982A (ja) 2005-04-21
JP2005510982A5 JP2005510982A5 (ja) 2006-05-25
JP4485796B2 JP4485796B2 (ja) 2010-06-23

Family

ID=9926514

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003548548A Expired - Lifetime JP4485796B2 (ja) 2001-11-27 2002-11-22 画面がスライスに分割される前景および背景のビデオ符号化および復号

Country Status (13)

Country Link
US (2) US7206456B2 (ja)
EP (1) EP1452037B1 (ja)
JP (1) JP4485796B2 (ja)
CN (1) CN1593065B (ja)
AT (1) ATE474421T1 (ja)
AU (1) AU2002347489A1 (ja)
BR (2) BR0214410A (ja)
DE (1) DE60237028D1 (ja)
ES (1) ES2347537T3 (ja)
GB (1) GB2382940A (ja)
HU (1) HU229462B1 (ja)
MX (1) MXPA04004422A (ja)
WO (1) WO2003047266A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2005076622A1 (ja) * 2004-02-06 2008-01-10 ソニー株式会社 情報処理装置、情報処理方法、プログラム、データ構造、および記録媒体
WO2011096071A1 (ja) * 2010-02-05 2011-08-11 株式会社 東芝 動画像符号化装置及び動画像復号化装置
JP2016197906A (ja) * 2016-07-25 2016-11-24 ソニー株式会社 画像処理装置および方法、記録媒体、並びにプログラム

Families Citing this family (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4150951B2 (ja) * 2002-02-19 2008-09-17 ソニー株式会社 動画配信システム、動画配信装置および方法、並びにプログラム
US20060193523A1 (en) * 2002-04-01 2006-08-31 Matrixview Limited Repetition coded compression for highly correlated image data
EP1492351A1 (en) * 2003-06-27 2004-12-29 Sony NetServices GmbH Method and system to transmit and receive foreground/background segmented images in DVB/MHP systems
US7269288B2 (en) * 2003-07-30 2007-09-11 Mediatek Inc. Apparatus for parallel calculation of prediction bits in a spatially predicted coded block pattern and method thereof
KR101106910B1 (ko) * 2004-02-17 2012-01-25 엔엑스피 비 브이 큰 스틸 사진 처리 방법 및 디바이스와 컴퓨터 판독가능 저장 매체
EP1571850A3 (en) * 2004-03-05 2006-12-13 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding image containing grayscale alpha channel image
US7463781B2 (en) * 2004-04-14 2008-12-09 Lsi Corporation Low overhead context intializations for arithmetic video codecs
US8693537B2 (en) * 2005-03-01 2014-04-08 Qualcomm Incorporated Region-of-interest coding with background skipping for video telephony
US7724972B2 (en) * 2005-03-01 2010-05-25 Qualcomm Incorporated Quality metric-biased region-of-interest coding for video telephony
US8768084B2 (en) * 2005-03-01 2014-07-01 Qualcomm Incorporated Region-of-interest coding in video telephony using RHO domain bit allocation
CN101313578B (zh) 2005-09-26 2011-10-19 韩国电子通信研究院 用于在可伸缩视频编码中定义和重构感兴趣区域的方法和装置
KR101255226B1 (ko) 2005-09-26 2013-04-16 한국과학기술원 스케일러블 비디오 코딩에서 다중 roi 설정, 복원을위한 장치 및 방법
US7702131B2 (en) * 2005-10-13 2010-04-20 Fujifilm Corporation Segmenting images and simulating motion blur using an image sequence
US20070127846A1 (en) * 2005-12-07 2007-06-07 Yi-Kuo Wei Apparatus and method for sub-picture processing by performing at least scaling and pixel data encoding
CN101507281B (zh) 2006-07-12 2013-06-05 诺基亚公司 媒体文件中的兴趣区域可缩放性信息的信号发送
US20080025196A1 (en) * 2006-07-25 2008-01-31 Jeyhan Karaoguz Method and system for providing visually related content description to the physical layer
WO2008028334A1 (en) 2006-09-01 2008-03-13 Thomson Licensing Method and device for adaptive video presentation
US9019830B2 (en) 2007-05-15 2015-04-28 Imagine Communications Corp. Content-based routing of information content
WO2009032255A2 (en) * 2007-09-04 2009-03-12 The Regents Of The University Of California Hierarchical motion vector processing method, software and devices
CN101389021B (zh) 2007-09-14 2010-12-22 华为技术有限公司 视频编解码方法及装置
WO2009033432A1 (en) * 2007-09-14 2009-03-19 Huawei Technologies Co., Ltd. A method and apparatus for video encoding and decoding
US8358700B2 (en) * 2008-06-03 2013-01-22 Omnivision Technologies, Inc. Video coding apparatus and method for supporting arbitrary-sized regions-of-interest
FR2932036B1 (fr) * 2008-06-03 2011-01-07 Thales Sa Procede et systeme permettant de proteger un flux video compresse contre les erreurs survenant lors d'une transmission
JP5029543B2 (ja) * 2008-09-09 2012-09-19 富士通株式会社 符号化装置および符号化プログラム
US9602821B2 (en) * 2008-10-01 2017-03-21 Nvidia Corporation Slice ordering for video encoding
US8503527B2 (en) 2008-10-03 2013-08-06 Qualcomm Incorporated Video coding with large macroblocks
US8897365B2 (en) * 2008-11-19 2014-11-25 Nvidia Corporation Video rate control processor for a video encoding process
US8605791B2 (en) * 2008-11-21 2013-12-10 Nvidia Corporation Video processor using an optimized slicemap representation
US20100128798A1 (en) * 2008-11-25 2010-05-27 Nvidia Corporation Video processor using optimized macroblock sorting for slicemap representations
JP5359657B2 (ja) * 2009-07-31 2013-12-04 ソニー株式会社 画像符号化装置および方法、記録媒体、並びにプログラム
JP5233897B2 (ja) 2009-07-31 2013-07-10 ソニー株式会社 画像処理装置および方法
KR20110017719A (ko) * 2009-08-14 2011-02-22 삼성전자주식회사 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
CN101753270B (zh) * 2009-12-28 2013-04-17 杭州华三通信技术有限公司 一种编码发送方法和装置
US8356114B2 (en) 2010-04-15 2013-01-15 Canon Kabushiki Kaisha Region of interest-based image transfer
US8755441B2 (en) 2010-05-10 2014-06-17 Canon Kabushiki Kaisha Region of interest-based video transfer
KR101645465B1 (ko) * 2010-07-23 2016-08-04 삼성전자주식회사 휴대용 단말기에서 입체 영상 데이터를 생성하기 위한 장치 및 방법
US20120106622A1 (en) * 2010-11-03 2012-05-03 Mediatek Inc. Method and Apparatus of Slice Grouping for High Efficiency Video Coding
US9247258B2 (en) * 2011-10-26 2016-01-26 Qualcomm Incorporated Unified design for picture partitioning schemes
KR101865014B1 (ko) * 2012-06-25 2018-06-05 닛본 덴끼 가부시끼가이샤 비디오 디코딩 장치, 방법 및 프로그램
TWI560650B (en) * 2012-09-12 2016-12-01 Realtek Semiconductor Corp Image processing method, image output processing method, and image reception processing method
US9565452B2 (en) * 2012-09-28 2017-02-07 Qualcomm Incorporated Error resilient decoding unit association
EP2952003B1 (en) * 2013-01-30 2019-07-17 Intel Corporation Content adaptive partitioning for prediction and coding for next generation video
CN103179402A (zh) * 2013-03-19 2013-06-26 中国科学院半导体研究所 一种视频压缩编码与解码方法及其装置
GB2513303B (en) 2013-04-16 2017-06-07 Canon Kk Method and device for partitioning an image
GB2516224A (en) 2013-07-11 2015-01-21 Nokia Corp An apparatus, a method and a computer program for video coding and decoding
GB2516824A (en) 2013-07-23 2015-02-11 Nokia Corp An apparatus, a method and a computer program for video coding and decoding
US9432624B2 (en) * 2014-01-03 2016-08-30 Clearone Communications Hong Kong Ltd. Method for improving an MCU's performance using common properties of the H.264 codec standard
US9774881B2 (en) * 2014-01-08 2017-09-26 Microsoft Technology Licensing, Llc Representing motion vectors in an encoded bitstream
CN105791837A (zh) * 2014-12-24 2016-07-20 北京数码视讯科技股份有限公司 一种视频数据编码方法、解码方法、转码方法及设备
EP3343913B1 (en) * 2015-09-30 2022-05-25 Samsung Electronics Co., Ltd. Display device and method for controlling same
KR102499355B1 (ko) * 2016-02-26 2023-02-13 벌시테크 리미티드 손실 및 무손실 영상 압축을 위한 형상-적응형 모델-기반 코덱
US10499065B2 (en) 2016-07-21 2019-12-03 Samsung Display Co. Ltd. System and method for sending video data over a wireless channel
CA3100316A1 (en) * 2018-05-15 2019-11-21 Sharp Kabushiki Kaisha Image encoding device, encoded stream extraction device, and image decoding device
JP7437374B2 (ja) * 2018-07-02 2024-02-22 ノキア テクノロジーズ オーユー ビデオコーディングでのタイル関連アドレス指定のための方法および装置
HRP20230702T1 (hr) 2019-01-09 2023-10-13 Huawei Technologies Co., Ltd. Signaliziranje identifikatora podslike kod kodiranja videa
MX2021011016A (es) 2019-03-11 2021-11-12 Huawei Tech Co Ltd Un codificador, un decodificador y métodos correspondientes.
CN113574889B (zh) 2019-03-14 2024-01-12 北京字节跳动网络技术有限公司 环路整形信息的信令和语法
CN109951706B (zh) * 2019-04-22 2021-01-01 湖南国科微电子股份有限公司 一种视频编码方法、装置及编码器
US11317104B2 (en) * 2019-05-15 2022-04-26 Tencent America LLC Method and apparatus for video coding
US11284113B2 (en) * 2019-09-25 2022-03-22 Tencent America LLC Method for signaling subpicture identifier
US11936880B2 (en) 2019-09-27 2024-03-19 Tencent America LLC Method for signaling output subpicture layer set
WO2021063420A1 (en) * 2019-10-02 2021-04-08 Beijing Bytedance Network Technology Co., Ltd. Slice level signaling in video bitstreams that include sub-pictures
CN114631317B (zh) 2019-10-18 2024-03-15 北京字节跳动网络技术有限公司 子图片的参数集信令中的语法约束
MX2022006360A (es) * 2019-11-27 2022-08-17 Lg Electronics Inc Metodo y aparato para se?alizacion de informacion de imagen.
WO2021133063A1 (ko) * 2019-12-23 2021-07-01 엘지전자 주식회사 영상 코딩 장치 및 방법
KR20220100048A (ko) * 2019-12-23 2022-07-14 엘지전자 주식회사 가상 경계 기반 영상 코딩 장치 및 방법
US11582463B2 (en) 2019-12-30 2023-02-14 Tencent America LLC Method for alignment across layers in coded video stream
JP2021175035A (ja) * 2020-04-21 2021-11-01 キヤノン株式会社 画像処理装置、画像処理方法
CN115868167A (zh) * 2020-05-22 2023-03-28 抖音视界有限公司 子比特流提取处理中对编解码视频的处理
EP3972278A1 (en) 2020-09-17 2022-03-23 Lemon Inc. Subpicture tracks in coded video
EP4304173A1 (en) 2022-07-06 2024-01-10 Axis AB Method and image-capturing device for encoding image frames of an image stream and transmitting encoded image frames on a communications network
CN116962712B (zh) * 2023-09-20 2023-12-12 成都索贝数码科技股份有限公司 一种视频图像分层编码的增强层改进编码方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09102953A (ja) * 1995-10-04 1997-04-15 Matsushita Electric Ind Co Ltd デジタル画像符号化方法、装置及び復号化装置
JP2001145101A (ja) * 1999-11-12 2001-05-25 Mega Chips Corp 人物画像圧縮装置
JP2001160965A (ja) * 1999-12-01 2001-06-12 Toshiba Corp 画像符号化装置及び画像符号化方法
JP2001211164A (ja) * 2000-01-27 2001-08-03 Victor Co Of Japan Ltd 画像符号化方式

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6798834B1 (en) * 1996-08-15 2004-09-28 Mitsubishi Denki Kabushiki Kaisha Image coding apparatus with segment classification and segmentation-type motion prediction circuit
US5960111A (en) * 1997-02-10 1999-09-28 At&T Corp Method and apparatus for segmenting images prior to coding
GB2322509B (en) * 1997-02-21 2001-09-12 Motorola Ltd Communication system and method for transmitting information
US6404813B1 (en) * 1997-03-27 2002-06-11 At&T Corp. Bidirectionally predicted pictures or video object planes for efficient and flexible video coding
US6249613B1 (en) 1997-03-31 2001-06-19 Sharp Laboratories Of America, Inc. Mosaic generation and sprite-based coding with automatic foreground and background separation
US6157733A (en) * 1997-04-18 2000-12-05 At&T Corp. Integration of monocular cues to improve depth perception
SE9800088D0 (sv) 1997-10-10 1998-01-16 Ericsson Telefon Ab L M Long filter lossless region of interest coding
US6606746B1 (en) 1997-10-16 2003-08-12 Opentv, Inc. Interactive television system and method for displaying a graphical user interface using insert pictures
CN1175373C (zh) * 1998-03-20 2004-11-10 三菱电机株式会社 有损失/无损失感兴趣区域图像编码的方法和系统
SE9803454L (sv) * 1998-10-09 2000-04-10 Ericsson Telefon Ab L M Förfarande och system för kodning av ROI
GB9912079D0 (en) * 1999-05-24 1999-07-21 Motorola Ltd An image encoding method and apparatus
GB2350512A (en) * 1999-05-24 2000-11-29 Motorola Ltd Video encoder
KR20010019704A (ko) * 1999-08-30 2001-03-15 정선종 움직임이 없는 배경을 갖는 영상의 매크로블록 단위 객체 기반부호화 처리 방법
JP2001266158A (ja) * 2000-01-11 2001-09-28 Canon Inc 画像処理装置、画像処理システム、画像処理方法、及び記憶媒体
US6801661B1 (en) * 2001-02-15 2004-10-05 Eastman Kodak Company Method and system for archival and retrieval of images based on the shape properties of identified segments
US6909745B1 (en) * 2001-06-05 2005-06-21 At&T Corp. Content adaptive video encoder
TW530498B (en) * 2001-08-14 2003-05-01 Nat Univ Chung Cheng Object segmentation method using MPEG-7
US7492387B2 (en) * 2002-08-05 2009-02-17 Chih-Lung Yang Implementation of MPCP MCU technology for the H.264 video standard

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09102953A (ja) * 1995-10-04 1997-04-15 Matsushita Electric Ind Co Ltd デジタル画像符号化方法、装置及び復号化装置
JP2001145101A (ja) * 1999-11-12 2001-05-25 Mega Chips Corp 人物画像圧縮装置
JP2001160965A (ja) * 1999-12-01 2001-06-12 Toshiba Corp 画像符号化装置及び画像符号化方法
JP2001211164A (ja) * 2000-01-27 2001-08-03 Victor Co Of Japan Ltd 画像符号化方式

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2005076622A1 (ja) * 2004-02-06 2008-01-10 ソニー株式会社 情報処理装置、情報処理方法、プログラム、データ構造、および記録媒体
US8483053B2 (en) 2004-02-06 2013-07-09 Sony Corporation Information processing device, information processing method, program, and data structure
WO2011096071A1 (ja) * 2010-02-05 2011-08-11 株式会社 東芝 動画像符号化装置及び動画像復号化装置
JP2016197906A (ja) * 2016-07-25 2016-11-24 ソニー株式会社 画像処理装置および方法、記録媒体、並びにプログラム

Also Published As

Publication number Publication date
ES2347537T3 (es) 2010-11-02
US7206456B2 (en) 2007-04-17
BRPI0214410B1 (pt) 2019-07-02
HUP0402623A2 (hu) 2005-07-28
DE60237028D1 (de) 2010-08-26
US20070183676A1 (en) 2007-08-09
GB2382940A (en) 2003-06-11
BR0214410A (pt) 2004-09-14
WO2003047266A1 (en) 2003-06-05
EP1452037B1 (en) 2010-07-14
US20030112867A1 (en) 2003-06-19
CN1593065A (zh) 2005-03-09
ATE474421T1 (de) 2010-07-15
GB0128359D0 (en) 2002-01-16
CN1593065B (zh) 2010-05-05
AU2002347489A1 (en) 2003-06-10
JP4485796B2 (ja) 2010-06-23
MXPA04004422A (es) 2004-08-11
EP1452037A1 (en) 2004-09-01
HU229462B1 (en) 2013-12-30

Similar Documents

Publication Publication Date Title
JP4485796B2 (ja) 画面がスライスに分割される前景および背景のビデオ符号化および復号
US7826531B2 (en) Indicating regions within a picture
Puri et al. Video coding using the H. 264/MPEG-4 AVC compression standard
Hannuksela et al. Isolated regions in video coding
US20030140347A1 (en) Method for transmitting video images, a data transmission system, a transmitting video terminal, and a receiving video terminal
KR20140120891A (ko) 효율적인 변환 유닛 인코딩을 위한 방법 및 장치
US10798417B2 (en) Deblock filtering for 360-degree video coding
JP2023505270A (ja) ビデオコーディングのための方法および装置
Dominguez et al. The H. 264 video coding standard
KR20220104041A (ko) 비디오 코딩을 위한 방법 및 장치
KR20220160667A (ko) 분리된 변환 분할
Kolkeri Error concealment techniques in H. 264/AVC, for video transmission over wireless networks
CA2542026C (en) Indicating regions within a picture
Wang et al. Error-robust inter/intra macroblock mode selection using isolated regions
US20230224465A1 (en) Cross-Channel Prediction based on Multiple Prediction Modes
Igarta A study of MPEG-2 and H. 264 video coding
Nemethova Principles of video coding
Castellà TREBALL DE FI DE CARRERA

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060323

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081014

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090114

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090728

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20091027

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20091104

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100128

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100223

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100325

R150 Certificate of patent or registration of utility model

Ref document number: 4485796

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130402

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130402

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140402

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term