JP2006505153A - ビデオ符号化におけるランダム・アクセス・ポイント - Google Patents

ビデオ符号化におけるランダム・アクセス・ポイント Download PDF

Info

Publication number
JP2006505153A
JP2006505153A JP2004502635A JP2004502635A JP2006505153A JP 2006505153 A JP2006505153 A JP 2006505153A JP 2004502635 A JP2004502635 A JP 2004502635A JP 2004502635 A JP2004502635 A JP 2004502635A JP 2006505153 A JP2006505153 A JP 2006505153A
Authority
JP
Japan
Prior art keywords
region
video
video sequence
trusted
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004502635A
Other languages
English (en)
Other versions
JP4468800B2 (ja
Inventor
ワン,イェ−クイ
ハンヌクセラ,ミスカ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Oyj
Original Assignee
Nokia Oyj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Oyj filed Critical Nokia Oyj
Publication of JP2006505153A publication Critical patent/JP2006505153A/ja
Application granted granted Critical
Publication of JP4468800B2 publication Critical patent/JP4468800B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/65Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience
    • H04N19/67Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience involving unequal error protection [UEP], i.e. providing protection according to the importance of the data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/162User input
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/164Feedback from the receiver or from the transmission channel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/37Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability with arrangements for assigning different transmission priorities to video input data or to video coded data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/523Motion estimation or motion compensation with sub-pixel accuracy
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/55Motion estimation with spatial constraints, e.g. at image or region borders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/57Motion estimation characterised by a search window with variable size or shape
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder

Abstract

複数のビデオ・フレームから構成されるビデオ・シーケンスを符号化/復号化する方法が開示されている。この方法においては、少なくとも1つのビデオ・フレームが1組の符号化ブロックに分割され、符号化ブロックのうち少なくとも1つは内部符号化によって符号化される。その後、少なくとも1つの内部符号化された符号化ブロックを含む第1の高信頼領域が決定され、第1の高信頼領域と第1の高信頼領域外の符号化ブロックとの間に情報従属性が生じるのを防止するようにビデオ・シーケンスの第1の高信頼領域が符号化される。

Description

本発明はビデオ符号化に関し、特に、ビデオ・シーケンスへのランダム・アクセス・ポイント(random access points)の符号化に関するものである。
ビデオ・ファイルは、複数の静止画像フレームから構成され、これらの静止画像フレームがビデオ・シーケンスとして高速で連続的に示されて(典型的には1秒当たり15〜30フレーム)、動画の印象を生じさせる。画像フレームは、一般に、実質的に同じままの画像情報によって定義される複数の静止背景被写体および多少変化する画像情報によって定義される少数の移動被写体を含む。このような場合、連続的に示される画像フレームに含まれる画像情報は、一般に非常に類似している。換言すれば、連続する画像フレームは多くの冗長を含む。より特定的にいえば、ビデオ・ファイルに含まれる冗長は、空間的冗長、時間的冗長およびスペクトル冗長に分割することができる。空間的冗長は、隣接する画像ピクセル間の相互関係を表し、空間的冗長は、後に続くフレームにおける特定の画像被写体の変化を表し、スペクトル冗長は、1つの画像フレーム内における異なる色成分間の相関関係を表す。
いくつかのビデオ符号化の方法は、前述のような連続する画像フレームの時間的冗長を利用している。この場合、いわゆる動き補償時間予測(motion-compensated temporal prediction)が使用される。ここでは、ビデオ・シーケンスにおける一部(典型的には大部分)の画像フレームの内容が、連続する画像フレーム間における画像フレーム内の特定の被写体またはエリアの変化を追跡することによって、上記シーケンスの他のフレームから予測され得る。ビデオ・シーケンスは、動き補償時間予測を使用せずに決定される画像情報を有する圧縮画像フレームを含む。この種のフレームは、INTRAフレーム(イントラ・フレーム)またはIフレームと呼ばれる。同様に、ビデオ・シーケンスに含まれかつ以前の画像フレームから予測される動き補償画像フレームは、INTERフレームまたはP(予測)フレームと呼ばれる。一般に、Pフレームの画像情報の決定には、少なくとも1つのIフレーム、およびおそらくは1つまたは2つ以上の予め符号化されたPフレームが使用される。1つのフレームが失われると、もはやそれに依存するフレームを正確に復号化することはできない。
例えば、JVT(Joint Video Team)は、動き補償時間予測を利用するビデオ符号化規格である。このJVTは、ISO/IEC動画専門家委員会(MPEG:Motion Picture Experts Group )とITU−T(国際電気通信連合電気通信規格部門:International Telecommunications Union, Telecommunications Standardization Sector)ビデオ符号化専門家委員会(VCEG:Video Coding Experts Group)の共同ビデオチーム(JVT)の現行プロジェクトである。これは、ITU−T VCEGのプロジェクトであるH.26Lから受け継いでいる。
JVT/H26.Lにおいては、画像は、輝度成分および2つの色差(クロミナンス)成分(Y、CBおよびCR)を用いて符号化される。これらのクロミナンス成分は、各々、輝度成分と比較して両方の座標軸に沿って半分の解像度でサンプリングがなされる。
符号化された各々の画像ならびに対応する符号化されたビットストリームは、階層構造で配列され、上から下に向かって画像層、画像セグメント層、マクロブロック(MB:macroblock)層およびブロック層からなる4つの層を有する。画像セグメント層は、ブロック・グループ層かまたはスライス層のいずれかであり得る。
各々のスライス用のデータは、スライス・ヘッダおよびこれに続く複数のマクロブロック(MB)用のデータにより構成される。複数のスライスは、符号化された画像内の領域を定義する。各々の領域は、標準的な走査順の中のある数のMBである。符号化された同じ画像内において、スライスの境界を横切ることに関して予測従属性はない。ただし、時間的予測は、一般にスライスの境界を横切ることができる。スライスは、残りの画像データから独立して復号化することができる。したがって、スライスは、パケット損失の高いネットワークにおいてエラー回復力を向上させる。
各々のスライスは複数のMBに分割される。1つのMBは、16×16ピクセルの輝度データおよび空間的に対応する8×8ピクセルのクロミナンス・データに関係している。
JVT/H26.Lにおいて、画像内容の中心的高圧縮表示を提供するビデオ符号化層(VCL:Video Coding Layer)、および特定のタイプのネットワークを経由して配信するために上記高圧縮表示を一まとめにするネットワーク適応層(NAL:Network Adaptive Layer)は、概念的には分離されている。JVT/H26.Lビデオ・コーダは、ブロックを基礎とする動き補償ハイブリッド変換符号化に基づいている。以前の規格と同様に、相互運用を可能にするために復号化プロセスのみが精確に指定されており、その一方で、復号化プロセスの実施に融通性を持たせるために、取り込み、予備処理、符号化、事後処理および表示のプロセスは全て指定範囲から除かれる。しかしながら、JVT/H26.Lは、以前の規格の設計に比べて符号化の効率を大幅に向上させることが可能な多くの新しい特徴を含む。
JVT/H26.Lは、基準画像選択と呼ばれる最近開発された方法を利用することができる。この基準画像選択は、基準の画像バッファに記憶される複数の画像の中から、動き補償のための基準画像を選択することができるような符号化技術である。JVT/H26.Lにおける基準画像選択は、マクロブロックごとの基準画像選択を可能にする。この基準画像選択は、圧縮効率およびエラー回復力を向上させるために使用することができる。
ビデオ符号化にて動き補償技術を使用することができるようにするために、任意のポイントからビデオの走査が行えるようにビデオ・シーケンスにおいてランダム・アクセス・ポイントが符号化されなければならない。ビデオ・シーケンスを走査するために使用されるアプリケーションに応じて、ビデオ・ストリームにおけるランダム・アクセス・ポイント間の望ましい時間間隔(time span )は、0.5〜10秒(sec)程度であろう。イントラ・フレームの符号化が、ランダム・アクセス・ポイントの符号化に関する従来の方法である。しかしながら、上記の基準画像選択の手法はイントラ・フレーム以前のフレームを参照することができるようにするので、イントラ・フレームはそのままではランダム・アクセス・ポイントの十分な条件ではない。さらに、ビデオ・シーケンスにおける頻繁なイントラ・フレームの符号化によって、より大きなコーデック処理容量が必要になり、かつ、より大きな帯域が使用される。
漸進的デコーダ・リフレッシュは、「ダーティー(dirty )」・ランダム・アクセスを参照し、以前に符号化されたがおそらく未受信のデータが参照されて、正しい画像内容が複数の符号化画像において徐々に回復される。一般的に言って、漸進的デコーダ・リフレッシュのランダム・アクセスにより提供される画像内容の漸進的回復は、JVT/H26.Lビデオ符号化における望ましい特徴であると見なされる。漸進的デコーダ・リフレッシュの基本的な思想は、フレームのマクロブロックの一部を内部符号化として符号化することである。デコーダがランダム・ポイントで復号化を開始するとき、動き補償のための基準フレームはデコーダにとっては未知であり、これらの基準フレームは、例えば中間レベルのグレイになるように初期化される。デコーダは内部符号化マクロブロックを再構築することができるが、動き補償プロセスにおいて未知のエリアを参照する内部符号化マクロブロックを正確に再構築することはできない。内部符号化マクロブロックの累積数が1フレームずつ増大するにつれて、最終的に完全に再構築された画像を得ることができる。しかしながら、このような動作を実行させるに際しては、いくつかの問題が発生する。
ここでは、基準画像を選択するために、動き補償プロセスにおいて、信頼できる復号化が可能な内部符号化マクロブロックの領域外にある基準フレームのマクロブロックが参照されるかもしれない。
JVT/H26.Lにおいては、突然現れる境界線に対するフェードアウト(fade out)を行うために、4×4ブロックごとの境界を横切ってループ・フィルタリングが適用される。このようにして、隣接するマクロブロックにて不正確に再構築されたピクセルによって、高信頼エリア(reliable area )が影響を受ける可能性がある。
動き補償プロセスにおいては、参照される非整数ピクセルの位置は、マルチタップ・フィルタを用いてピクセル値から補間される。現行のJVTコーデックの設計において、ハーフ・ピクセル(half-pixel)の位置は、6タップのフィルタ(six-tap filter)を用いて補間される。それゆえに、信頼できる復号化が可能なエリア内ではあるがその境界近くに存在するような参照されるべき非整数ピクセルの位置を補間するために、不正確に再構築されたピクセルを使用するおそれがある。
デコーダがフレームの復号化を開始するとき、このデコーダは、内部符号化がなされた全てのマクロブロックが信頼できると仮定する。しかしながら、上記の全てのプロセスは、隣接するマクロブロックのグレイ画像の情報が、内部符号化マクロブロックにて信頼できる復号化が可能な画像の情報と混ざり合うといったような効果を有する。これによって、あるフレームから別のフレームへと復号化が進むときに、空間的および時間的に伝播するエラーが生じる。
したがって、本発明の目的は、上記問題点の中の少なくとも一部を軽減させるための方法および当該方法を実施するための装置を提供することである。このような本発明の目的は、独立形式の請求項にて開示されている特徴を有する方法、ビデオ・エンコーダ、ビデオ・デコーダおよびコンピュータ・ソフトウェアによって達成される。
本発明の好ましい実施態様は、従属形式の請求項にて開示されている。
本発明は、漸進的デコーダ・リフレッシュ法の実施の基礎にある複雑化の要因を識別することに基づいている。本発明によれば、複数のビデオ・フレームから構成されるビデオ・シーケンスが符号化される。このビデオ・シーケンスを符号化する方法が、少なくとも1つのビデオ・フレームを1組の符号化ブロックに分割するステップ、および、上記の符号化ブロックのうち少なくとも1つを内部符号化によって符号化するステップを含む。次に、少なくとも1つの内部符号化された符号化ブロックを含む第1の高信頼領域(first reliable region )が決定され、第1の高信頼領域と第1の高信頼領域外の符号化ブロックとの間に情報従属性(information dependency)が生じるのを防止するように当該第1の高信頼領域が上記ビデオ・シーケンスにおいて符号化される。
好ましい実施態様に従えば、デコーダは、任意のポイントからビデオ・シーケンスにアクセスするときにランダム・アクセス・ポイントとして上記高信頼領域を使用することができる。
好ましい実施態様に従えば、上記情報従属性は、上記高信頼領域の境界でループ・フィルタリングを停止させることによって防止される。
好ましい実施態様に従えば、上記情報従属性は、動き補償予測を適用する際に上記高信頼領域の符号化ブロックのみを参照することによって防止される。
好ましい実施態様に従えば、上記情報従属性は、上記高信頼領域の境界で端数ピクセル値の補間を無効にすることによって防止される。
好ましい実施態様に従えば、上前記高信頼領域は、サブピクチャ(sub-picture )としてビデオ・シーケンスに符号化される。
本発明は、いくつかの利点をもたらす。上記のようなメカニズムを用いて、符号化されたビデオ・ストリームにランダム・アクセス・ポイントを付与し、これと同時に、画像エリアのイントラ・マクロブロックの有効範囲を完全にカバーすることなく画像エリアの一部を確実に更新することができる。本発明のさらなる利点は、伝送エラーの空間的および時間的な伝播を停止させることである。さらなる利点は、本発明が不等なエラー保護およびトランスポート優先順位付けを可能にして、受信画像品質を改善し様々な部分的なビデオ・データの主観的優先順位に従ってトラフィックを形成することができることである。本発明の別の利点は、本発明が、端末間遅延を最小限に抑えて受信画像品質を改善するために、会話式アプリケーションにおいてイントラ・フレーム全体を回避することができるようにすることである。さらに、この方法は、ワイプ(wipe)等のマスキングがなされたシーン遷移(scene transition)を符号化するために使用することができる。
以下、添付図面を参照しながら、本発明の好ましい実施態様について詳細に説明する。
本発明は、領域ベースの動き補償時間予測を使用する全てのビデオ符号化方法に適用され得る。本発明は、特に、一般に有限帯域電気通信システムに使用される様々な低ビットレート・ビデオ符号化に適用され得る。この中には、例えば、ITU−T規格H.263および現在規格化されているH.26L(後に、おそらくH.264となるであろう)が含まれる。これらのシステムにおいて、本発明は、例えば移動局において適用され得る。
以下に1つの例としてJVT/H26.Lビデオ符号化を使用する本発明の例を示す。JVT/H26.Lについては、本発明およびその好ましい実施態様を理解するために十分と思われるような詳細なレベルで説明する。JVT/H26.Lのさらに詳細な説明については、書類ISO/IEC MPEGおよびITU−Y VCEG共同ビデオチーム(JVT)、DRAFT ISO/IEC 14496−10:2002(E)“JVT ワーキング ドラフト 2,リリース 7(JVT Working draft 2,Release 7)”を参照されたい。
JVT/H26.L設計の概念的構造について図1を参照しながら説明する。JVT/H26.Lにおいては、ビデオ画像内容の中心的高圧縮表示を提供するビデオ符号化層(VCL)、および特定のタイプのネットワークを経由して配信するために上記高圧縮表示を一まとめにするネットワーク適応層(NAL)は、概念的に分離されている。
VCLの主要なタスクは、効率良くビデオ・データを符号化することである。しかしながら、前述したように、エラーは効率的に符号化されたデータに悪影響を及ぼすので、発生する可能性のあるエラーについてのある程度の認識が含まれている。VCLは、予測符号化の連鎖に割り込んで、エラーの発生および伝播を補償するための措置を取ることができる。これを実行することができるような方法はいくつかある。すなわち、このような方法は、INTRAフレームおよびINTRA−MBを導入することによって時間予測の連鎖に割り込む、スライス概念を導入することによって空間的なエラー伝播に割り込む、および、例えば複数のフレームにまたがる適応算術符号化を使用することなく個別に復号化できるような可変の長さコードを導入する、等である。
VCLの出力は、符号化されたマクロブロックのストリームであり、各々のマクロブロックは単一ピースのデータとして現れる。データ区分化層(DPL:Data Partitioning layer )は、単一のスライスに属する1つのデータ・タイプ(例えば、DC係数、マクロブロック・ヘッダ、運動ベクトル)の全ての記号が1つの符号化ビットストリームに集められるように記号を再配列する。復号化においてほぼ等しい主観的重要性および/またはシンタックス上の重要性を有する複数の記号は、1つの区分にまとめられる。
NALは、VCLまたはDPLデータのフォーマットを多様なネットワークを経由して配信するために当該VCLまたはDPLデータのフォーマットをカストマイズする機能を提供する。NAL設計は、選択されるネットワーク適応戦略に応じて、ビデオ符号化層およびデータ区分化層からデータ区分またはスライスのいずれか一方を受信することができる。データ区分は、主観的に重要性のより高いデータおよびシンタックス上の重要性のより高いデータを、これより重要性の低いデータとは別個に伝送することができるようにする。デコーダは、重要性の高い方のデータを受信するまでは重要性の低いデータを復号化することができない。エラーが発生しやすいネットワークを経由してビットストリームを伝送しながら、重要性の低いデータより重要性の高いデータを保護するための手段を適用することが可能である。
さらに、NALの出力を、様々なトランスポート・フォーマットに挿入することができる。ビデオ・データは、将来の走査のためにファイル・フォーマットで記憶され得る。さらに、ビデオ・データは、ITU−T H.223多重化フォーマットに従ってカプセル化することもできる。RTPトランスポート・フォーマットに関しては、RTPトランスポート・ストリームは画像層も画像ヘッダも全く含まない。その代わりに、従来は画像層およびシーケンス層に属していたデータが、主に帯域外で伝送される。この種のデータの多数の組み合わせを伝送することが可能であり、伝送された各々の組み合わせはパラメータ・セットと呼ばれて、列挙される。その後、伝送されたスライス・ヘッダにおいて、使用中のパラメータ・セットが識別される。
次に、好ましい実施態様に従った漸進的デコーダ・リフレッシュ周期の符号化について説明する。エンコーダは、独立型(standalone)エンコーダにおける構成パラメータ、またはリアルタイム画像通信システムにおける内部更新要求等のような外部信号に応じて、デコーダ・リフレッシュ周期の第1のフレームを決定することによって動作を開始する。エンコーダはまた、未圧縮画像の内容を分析して、例えばマスキングがなされたシーン遷移への応答として漸進的デコーダ・リフレッシュを符号化することもできる。
エンコーダは、独立型エンコーダの構成パラメータ等の外部指令に基づいて、または例えばマスキングがなされたシーン遷移に対する応答としての内部推論に基づいて、漸進的デコーダ・リフレッシュ周期の長さを決定する。エンコーダはまた、例えば速度制御の必要性に基づいて、遷移の符号化期間中のシーン遷移の予想される長さを調整することもできる。
「高信頼領域(reliable region )」という用語は、漸進的デコーダ・リフレッシュ周期の開始から復号化が開始されるときに正確に再構築される画像の領域を指すために使用される。高信頼領域は、相互に隣接するマクロブロックによって構成されることが好ましい。漸進的デコーダ・リフレッシュ周期内の各々の画像は、それ自身の高信頼領域を有する。1つの画像の高信頼領域に存在する各々のマクロブロックは、漸進的デコーダ・リフレッシュ周期にて引き続いて記憶される画像(符号化順に)の高信頼領域に属する。このようにして、高信頼領域は少なくとも画像間で同じままか、または当該高信頼領域は漸次増大することが好ましい(符号化順に)。
高信頼領域の形状は、マクロブロックが相互に隣接するという以外の制約によって制限されるべきではない。符号化/復号化のために、高信頼領域の最も単純な形状は、マクロブロックの中身のある四角形である。好ましい実施態様に従えば、高信頼領域は、四角形の4つの辺の中で1つの辺に沿って複数のマクロブロック中の不完全な1マクロブロックの幅および高さ方向の行列で拡張されるようなマクロブロックの中身のある四角形である。
別の好ましい実施態様に従えば、高信頼領域は、マクロブロックの任意のエリアであって、ただし中身のあるエリアである。さらに別の好ましい実施態様に従えば、高信頼領域は、1つの四角形の穴を持つマクロブロックの中空の四角形であり、これは、ボックスイン・タイプ(box-in type )の漸進的デコーダ・リフレッシュに使用することができる。別の好ましい実施態様に従えば、高信頼領域は、本発明の好ましい実施態様の高信頼領域と同様に形成される穴を有するマクロブロックの中空の四角形である。高信頼領域は、例えば2つの高信頼領域が螺旋運動で成長するように各々の高信頼領域の中で相互関係をもって存在することさえ可能である。
したがって、中空の高信頼領域の定義を高信頼領域に複数の穴があるように普遍化することができる。
本発明はまた、1つの画像に複数の高信頼領域があるように普遍化することもできる。この場合、その後のフレームの高信頼領域のブロックを予測するためにどの高信頼領域でも使用することができる。さらに、リフレッシュ周期を重ね合わせることによって、異なる周期の高信頼領域を互いに重なり合う周期内の画像においてネスティング(nest)することができる。高信頼領域はまた、符号化された1つの画像から次の画像に場所を移したり収縮したりすることができる。このような動作は、カメラ・パノラマ等のグローバル・モーションまたは例えば速度制御のおかげで妥当となり得る。
漸進的デコーダ・リフレッシュ・パターンは、どのような順番でマクロブロックが高信頼領域に追加されるかを明確に定義する。例えば、ワイプダウン(wipe-down )においては、マクロブロックをラスタ走査順に高信頼領域に挿入することができる。エンコーダは、漸進的デコーダ・リフレッシュ・パターンのタイプを決定する。符号化仕様/規格において明示され、かつ、エンコーダおよびデコーダの両方において事前に既知の事前定義デフォルト・パターンがある場合もある。また一方で、この種のリフレッシュ・パターンをエンコーダからデコーダへ符号化画像ビットストリームの一部として送信することもできる。エンコーダは、選択されたリフレッシュ・タイプを信号としてデコーダに送信する。この送信は、帯域内信号方式または帯域外信号方式として行うことができる。
増大する高信頼領域の実施態様については、図2を参照して説明することができる。図2において、小さい四角形はマクロブロックを示し、小さい四角形の9×11ブロックは1つの画像フレーム200〜208を表す。各々のフレームにおいて厚いマクロブロックのエッジが高信頼領域を取り囲む。中程度のグレイのマクロブロックは高信頼領域の増大を示す。画像フレーム200〜208は、時間順で示されている。
フレーム200は、3×3マクロブロックの高信頼領域を含む。次のフレーム202においては、高信頼領域は、前の領域の4辺全てに沿って拡張されて、5×5マクロブロックの高信頼領域となる。ボックスアウト・リフレッシュ・パターン(box-out refresh pattern )と呼ばれ得る同様の手順が、その後のフレーム204〜208に適用される。フレーム208において、高信頼領域は、フレームエリアの全て、すなわちフレームの全てのマクロブロックを包含するまでに拡張される。高信頼領域の空間的境界を示す厚いエッジは、マクロブロックの境界であることが好ましい。
エンコーダは、符号化される現在のフレームにおいて高信頼領域に追加されるマクロブロックの数を決定する。この決定は、予め定められたリフレッシュ率に基づいてなされるか、または、例えば支配的なネットワーク条件に従って調整することができる。選択されるべき数のマクロブロックは、主として、漸進的デコーダ・リフレッシュ・パターンに従って選択される。漸進的デコーダ・リフレッシュ周期の第1のフレームにおいて第1の高信頼領域に挿入されるマクロブロックは、内部符号化される。
好ましい実施態様に従えば、融通性と複雑さの折衷案として、最初は高信頼領域がマクロブロックの中身のある四角形であるように高信頼領域の形状の進化を限定することができる。高信頼領域は、四角形の4つの辺のうちで1つの辺に沿って明確な順番でマクロブロックを挿入することによって拡張することができる。高信頼領域が再び四角形になったら、四角形の別の辺をマクロブロック挿入の対象として選択することができる。拡張率は0マクロブロックでもよい。
漸進的デコーダ・リフレッシュ周期のその他のフレームについては、エンコーダは次のように進む。すなわち、新たに選択されたマクロブロックが、現在のフレームの高信頼領域に挿入される。高信頼領域のマクロブロックは、マクロブロック・モード選択および動き補償の手順を用いて符号化される。ただし、動き補償の手順において、運動ベクトルの探索範囲は限られているので、当該運動ベクトルは、その漸進的デコーダ・リフレッシュ周期内の以前のフレームの高信頼領域内にあるピクセルしか参照することができない。
高信頼領域の再構築は、この高信頼領域外にある再構築されたピクセル値に依存してはならない。したがって、結果として多少の符合化制約が生じる。例えば、ループ・フィルタリングおよび高信頼領域外のピクセル値からの端数ピクセル補間は、無効とされなければならない。この種の符号化従属性の遮断は、符号化データで信号化することが可能であり、データを復号化するときに同様の動作を行うことができる。例えば、符号化データにおいて、ループ・フィルタリングを停止させなければならない境界を信号化することができる。その代わりに、エンコーダは、信頼できない領域を参照するようなこの種の符号化データの生成を避けることができる。例えば、信頼できない領域のピクセルが動き補間に使用されないように運動ベクトルを制限することができる。
あるリフレッシュ周期内にいくつかの少なくとも部分的に同時に存在する高信頼領域が存在する場合、漸進的デコーダ・リフレッシュ周期の第1のフレームにおいて第1の高信頼領域に挿入されるマクロブロックは、内部符号化される。次に、その後の高信頼領域は、必要であれば相互の間で符号化できるように別の高信頼領域のマクロブロックを参照することができる。基準画像選択のおかげで、相互に参照する高信頼領域の時間順は制限されない。ただし、上記の通り、ループ・フィルタリングおよび高信頼領域外のピクセル値からの端数ピクセル補間に関する同様の符号化制約が、別の高信頼領域を参照する際にも適用される。
さらに、マクロブロックの符号化および復号化の走査順は、まずラスタ走査順で高信頼領域が符号化/復号化されるように変更されることが好ましい。その後、高信頼領域に含まれない残りのマクロブロックがラスタ走査順に符号化/復号化される。高信頼領域の境界はスライス境界として処理される。したがって、高信頼領域の境界を横切ってイン−スライス予測(in-slice prediction)が生じることはあり得ない。
さらに、高信頼領域が定義されるが上記の符号化制約の全てが適用されるわけではない符号化方法を適用することも可能である。この方法においては、画像全体のマクロブロックは標準的な順序(すなわち、分散スライスまたは同様の符号化法が使用されない場合に、ラスタ走査順)で符号化される。したがって、高信頼領域および残りの領域(すなわち高信頼領域に属さないマクロブロック)の符号化データは、相互にインターリーブ(interleave)がなされる。さらに、ある画像の高信頼領域の符号化パラメータの一部は、残りの領域の符号化パラメータに依存する。このような符号化パラメータの例としては、高信頼領域の境界付近の運動ベクトルが含まれる。このような運動ベクトルは、残りの領域の隣接する運動ベクトルから予測される。しかしながら、ループ・フィルタリングおよび高信頼領域外のピクセル値からの端数ピクセル補間に関する符号化制約が依然として適用される。このような方法は、IREG−D法と呼ぶことができる。ここで、IREGは隔離領域を意味し、Dは隔離領域と残りの領域との間における符号化パラメータの一部の従属性を指している。
したがって、上記に開示されているような全ての符号化制約が適用される高信頼領域の符号化の方法は、IREG−I符号化法と呼ぶことができる。IREG−I法においては、高信頼領域のマクロブロックがまず符号化され、残りのマクロブロックはその後に符号化される。したがって、高信頼領域は、残りの領域の符号化データから分離可能な符号データの部分を構成する。略語IREG−Iの文字Iは、隔離領域と残りの領域の間の符号化パラメータの独立性を示している。この方法は、いわゆるサブピクチャを使用することによって適用され得ることが好ましい。サブピクチャ使用の好ましい実施態様については、後にさらに詳しく説明する。
次に、好ましい実施態様に従った復号化の手順について説明する。ビデオ・シーケンスの復号化の手順が符号化の手順から独立していることは注目に値する。したがって、復号化のためには、復号化の対象であるビデオ・シーケンスが、本発明によって特徴付けられる特定の特性を含むことしか要求されない。したがって、復号化が可能なビデオ・シーケンスは、上記の符号化の方法によって制限されない。
デコーダがビデオ・シーケンスと一緒に送信されるパラメータ・セットを受信すると、当該デコーダは、このパラメータ・セットが高信頼領域の使用を指示するか否かをチェックする。送信されたパラメータ・セットがIREG−Iの使用を指示している場合、デコーダは新しい画像の復号化を開始するか、または現在の画像の復号化を継続する。
新しい画像の復号化が開始される場合、デコーダは、新しい高信頼領域が確立されるか否かをチェックする。新しい高信頼領域が確立される場合、高信頼領域の以前の形状、サイズおよび位置がリセットされる。新しい画像の復号化が開始されると、高信頼領域の形状、サイズおよび位置は、受信されるパラメータに従って更新される。
高信頼領域の形状、サイズおよび位置が最新のものになったら、スライスの第1のマクロブロックのマクロブロック・アドレスは、どの高信頼領域にスライスが属するのか、またはスライスが残りの領域に属するのか否かを識別する。画像の高信頼領域がまず復号化される。
各々のマクロブロックのループ・フィルタリングは、隣接するマクロブロックが異なる領域に属する(すなわち、隣接するマクロブロックの一方が高信頼領域に属し、他方が残りの領域に属するか、または異なる高信頼領域に属する)か否かがチェックされるように限定される。隣接するマクロブロックが異なる領域に属する場合、該当するマクロブロックの境界が、画像境界にあるかのようにフィルタリングされる。さらに、復号化される高信頼領域外の領域からの内部予測が適用されず有利である。
送信されるパラメータ・セットがIREG−Dの使用を指示する場合、デコーダは、マクロブロックの位置の決定を除いて、前述のようなIREG−Iの場合と同様にスライスを復号化する。空間的なマクロブロックの順序は通常通りであり、スライスは、多くの高信頼領域および残りの領域からのマクロブロックを同時に含む可能性がある。主なる差異は、領域境界を横切って内部予測および運動ベクトル予測が生じる可能性があることである。しかしながら、ループ・フィルタリングおよび高信頼領域外のピクセル値からの端数ピクセル補間に関する符号化制約が依然として適用される。
好ましい実施態様に従えば、上記の手順によって要求される変化は、符号化されたビデオ・シーケンスに関連して送信される新しいパラメータを追加することによって可能になる。パラメータは、ビデオ走査セッション前に送信するか、またはビデオ走査セッション中に伝送または更新することができる。例えば、下記のパラメータをパラメータ・セットに追加することができる。
1.隔離領域のタイプ(TIR:Type of Isolated Region ):隔離領域が使用されているか否か、および、どのようなタイプの隔離領域が使用されているかを識別する。
None(なし):隔離領域は使用されていない。したがって、マクロブロックは標準的な符号化に従って符号化される。
IREG−D:隔離領域の標準的なビットストリーム順バージョンが使用される。
IREG−I:隔離領域の隔離ビットストリーム順バージョンが使用される。
2.同時隔離領域の数(NSIR):ある画像内に同時にいくつの隔離領域が存在するかを信号で知らせる。この値はプロフィルおよびレベルによって制限される。各々の最初の隔離領域は、例えば0または1から始まる通し番号で一意に識別される。識別子はIREG IDと呼ばれる。各々のIREG IDについて、下記のパラメータが伝送される。
3.隔離領域の形状進化のタイプ(Shape Evolution Type of Isolated Regions):隔離領域の位置、形状および変化の順序がこのパラメータによって定義される。下記の値が提案されている。
Raster Scan(ラスタ走査順):隔離領域の第1のマクロブロックは画像の左上端のマクロブロックである。隔離領域はラスタ走査順に増大する。
Reverse Raster Scan(逆ラスタ走査順):隔離領域の第1のマクロブロックは画像の右下端のマクロブロックである。隔離領域は逆ラスタ走査順に増大する。
Wipe right(右ワイプ):隔離領域の第1のマクロブロックは画像の左上端のマクロブロックである。隔離領域は上から下に増大する。ある列の下端マクロブロックの次のマクロブロックは、以前の列における右側の列の上端マクロブロックである。
Wipe left(左ワイプ):隔離領域の第1のマクロブロックは画像の右下端マクロブロックである。隔離領域は下から上に増大する。ある列の上端マクロブロックの次のマクロブロックは、以前の列における左側の列の下端マクロブロックである。
Box out clockwise(右回りボックスアウト):隔離領域の第1のマクロブロックは制限されないことが好ましい。隔離領域は、以前に定義された隔離領域の周囲を右回りに増大する。
Box out counter-clockwise(左回りボックスアウト):上記の場合と同様であるが、隔離領域は左回りに増大する。
Pre-defined free-form(事前定義フリーフォーム):このパラメータ値には、隔離領域の位置、形状および増大順を定義するマクロブロック番号のリストが添付される。この事前定義フリーフォームは、ビデオ走査セッション中最初にデコーダに通信されることが好ましい。マクロブロックは、番号0を持つ画像の左上端のマクロブロックから始めてラスタ走査順に番号が付けられる。隔離領域の形状は、以前に示された制限に従わなければならないことに注意すべきである。
Pre−defined static rectangle(事前定義静的四角形):このパラメータ値は、隔離領域がIREG GOP内で同じままであることを知らせる。この値は、隔離領域の左上端ならびに隔離領域の幅および高さに関係する。さらに、この事前定義値は、ビデオ走査セッション中最初にデコーダに通信されることが好ましい。
Dynamic rectangle(動的四角形):このパラメータは、IREG−Iが使用されている場合にしか存在しない。この領域変化モードは、サブピクチャの符号化に使用される。ここでは、どのフレームの隔離領域も四角形であることに注意すべきである。隔離領域の位置、形状または増大順は、パラメータ・セットにおいて定義されず、同様のパラメータがスライス・ヘッダに含まれる。
4.隔離領域の増大率(GRIR:Growth Rate of Isolated Region)。このパラメータは、これ以前のパラメータの記述において言及される隔離領域に対し、画像ごとにいくつのマクロブロックが追加されるかを決定する。さらに、変動する増大率を示す特殊なパラメータ値も存在する。変動する増大率がパラメータ・セットにおいて指示される場合、実際のフレームごとの増大率はスライス・ヘッダにおいて指示される。
Constant rate of N(N>=1)macroblocks(定速Nマクロブロック(N>=1)):隔離領域は画像ごとにNマクロブロックずつ増大する。
Pre-defined rate(事前定義率):これらのパラメータ値の各々は、1つの画像において隔離領域に追加されるべきマクロブロックの数を定義する1組の値{a1、a2、...、aN}と関連付けられる。NはIREG周期における画像の数に等しく、a1はマクロブロック数で表される隔離領域の初期サイズである。
変動率:スライス・ヘッダにおいて隔離領域の増大率(GRIR)によって指示される増大率。
あるリフレッシュ・パターンに従って高信頼領域にマクロブロックを挿入する手順の例は図3を参照することによって説明することができる。図3は、増大する高信頼領域の最初のいくつかの画像フレーム(300〜310)を示しており、「右回りボックスアウト」と定義される形状進化のタイプおよび3マクロブロックの一定増大率(GRIR)を有する。第1のフレーム300は、3つのマクロブロックから構成される(「右回りボックスアウト」に従った)L形高信頼領域を有する。次のフレーム302において、次の3つのマクロブロックが高信頼領域に追加される。形状進化のタイプが新しいブロックの位置を制御するので、3×2マクロブロックの高信頼領域が得られる。各々のフレーム304〜310において、右回りに高信頼領域の輪郭に沿って3つの新しいマクロブロックを追加することによって上記の手順が継続される。
前述したように、JVT/H26.Lの設計は、多様なネットワークを経由して配信するためにビデオ符号化層(VCL)またはデータ区分化層(DPL)のデータ・フォーマットをカストマイズすることができるようにする。データ区分は、主観的に重要性の低いデータおよびシンタックス上の重要性の低いデータとは別個に重要性のより高いデータを伝送することができるようにする。デコーダは、重要性のより高いデータを受信するまでは重要性の低いデータを復号することができない場合がある。例えば、RPTトランスポート・フォーマットを使用する場合、RPTトランスポート・ストリームは画像層または画像ヘッダを全く含まない。その代わりに、従来の画像およびシーケンス層に属するこのデータは帯域外で伝送される。この種のデータのたくさんの組み合わせを伝送することが可能であり、伝送される各々の組み合わせはパラメータ・セットと呼ばれて、列挙される。使用中のパラメータ・セットは、伝送されるスライス・ヘッダにおいて識別される。
したがって、好ましい実施態様に従えば、下記の条件パラメータを、好ましくは基準画像選択パラメータの前に、スライス・ヘッダに追加することができる。
1.隔離領域の連続番号(SNIR:Sequence Number of the Isolated Region):このパラメータは、パラメータ・セットが隔離領域の使用を指示する場合に存在する。値0は、連続番号(SNIR)が、最近伝送されたSNIR値SNIRa、対応する画像番号Pnaおよび現在の画像番号PNbから、下記の通りに推論されることを示す。すなわち、SNIRb=PNb−Pna+SNIRaの関係から推論される。ここで、画像番号間の算術は重なりの可能性を考慮する。値1は、新しい高信頼領域の開始を示し、各々のIREG周期に少なくとも1回伝送される。0より大きい値は明示的に連続番号を示し、エラー回復力を改善するために使用することができる。
2.隔離領域の形状変化(SCIR:Shape Change of Isolated Region )。このパラメータは、パラメータ・セットが隔離領域の変動増大率を指示する場合、または隔離領域の形状進化のタイプが動的四角形である場合に存在する。値0は、四角形の隔離領域の増大率または形状、サイズおよび位置が、同じ画像の他のスライスと同じであることを意味する。値1は、GRIRおよびIRIRが、以前に記憶され伝送された画像と同じであることを示す。値2は、GRIRまたはIRIRが続くことを示す。GRIRおよびIRIRは、その画像の隔離領域ごとに繰り返される。
3.隔離領域の増大率(GRIR):このパラメータは、パラメータ・セットが隔離領域の変動増大率を指示する場合のみ存在する。このパラメータは、符号化順に以前に記憶されているフレームの隔離領域と比べて隔離領域に追加されるマクロブロックの数を知らせる。
4.四角形隔離領域に関する情報(IRIR:Information about Rectangular Isolated Region ):このパラメータのグループは、隔離領域の形状進化のタイプが動的四角形である場合に存在する。下記のコードワードが後に続く。
左端:隔離領域において左端のマクロブロックの座標(マクロブロック数の単位で)を意味する。画像の左端のマクロブロック列に値0が割り当てられる。
上端:隔離領域において上端のマクロブロックの座標(マクロブロック数の単位で)を意味する。画像の上端のマクロブロック行に値0が割り当てられる。
幅:隔離領域の幅を意味する。コードワードは下記の〔表1〕のように割り当てられる。
Figure 2006505153
高さ:サブピクチャの高さを意味する。コードワードは幅と同様に割り当てられる。
JVTビデオ・コーデック・パラメータ・セットに関して詳しくは、ISO/IEC文書“VCEG−N52”および“VCEG−N72r1”を参照されたい。
次に、好ましい実施態様に従った復号化の手順について説明する。説明を簡単にするために、ここでは、(帯域内または帯域外で)ビデオ・シーケンスと一緒に送信されるパラメータ・セットが、上記に開示されているようなパラメータのうち少なくとも一部を含むものと仮定する。ただし、上記のパラメータは、どのようにして望ましい特性を得ることができるかについての単なる例にすぎないことに留意しなければならない。当業者にとっては、異なるパラメータのセットを用いて様々な方法で同じ結果に到達するような実施を行うことができることが明らかであろう。
デコーダがビデオ・シーケンスと一緒に送信されるパラメータ・セットを受信すると、当該デコーダは、パラメータ・セットが高信頼領域の使用を指示するか否かをチェックする。送信されるパラメータ・セットがIREG−Iの使用を指示する場合、デコーダは下記の通りにスライスを復号化する。
復号化の対象であるスライスの画像番号がその前に復号されたスライスの画像番号と異なる場合、または復号化の対象であるスライスの時間基準がその前に復号されたスライスの時間基準と異なる場合、新しい画像の復号化が開始される。そうでなければ、現在の画像の復号化が継続される。
新しい画像の復号化が開始される場合、デコーダは新しい高信頼領域が確立されるか否かをチェックする。パラメータ・セットのうち高信頼領域関係のパラメータのどれかが変更されていたら、デコーダは、新しい高信頼領域の開始であると推量する。同様にSNIRが1である場合、デコーダは新しい高信頼領域の開始であると推論する。新しい高信頼領域が確立される場合、高信頼領域の以前の形状、サイズおよび位置はリセットされる。新しい画像の復号化が開始される場合、高信頼領域の形状、サイズおよび位置は下記の通りに更新される。
高信頼領域の形状進化のタイプが非四角形であり、かつ、増大率が一定である場合、高信頼領域の形状、サイズおよび位置は、一定数のマクロブロックが、SNIRの回数がゼロ・サイズの高信頼領域に追加されるかのように計算される。
高信頼領域の形状進化のタイプが非四角形であり、かつ、増大率が事前に定義されている場合、SNIRは、その前に記憶され伝送された画像の対応する高信頼領域に追加されるべきマクロブロックの数aSNIRを指している。
高信頼領域の事前定義フリーフォーム・タイプが使用されるが、各々の画像によって個別に増大率が送信される場合、高信頼領域の形状およびサイズは、その前に記憶され伝送された画像の高信頼領域に事前定義の順にGRIR個のマクロブロックを追加することによって形成される。
形状進化のタイプが事前定義静的四角形である場合、そのサイズ、形状および位置はパラメータ・セットに示される。形状進化のタイプが動的四角形である場合、四角形の高信頼領域のサイズ、形状および位置は、スライス・ヘッダに示される。高信頼領域の形状、サイズおよび位置が最新のものになったら、そのスライスの第1のマクロブロックにおけるマクロブロック・アドレスは、どの高信頼領域にスライスが属するか、またはスライスが残りの領域に属するか否かを識別する。画像の高信頼領域がまず復号化される。
マクロブロックの符号化データが復号化される前に、その空間的位置が計算される。空間的なマクロブロックの順序は標準的(ラスタ走査順または分散走査順)であるが、現在復号化される高信頼領域外または残りの領域外のマクロブロック位置はスキップされる。
各々のマクロブロックのループ・フィルタリングは下記の通りに制限される。すなわち、あるマクロブロックの左側の隣接するマクロブロックが異なる領域に属する場合(すなわち、互いに隣接するマクロブロックの一方が高信頼領域に属し、他方が残りの領域に属する、または異なる高信頼領域に属する場合)、このマクロブロックは、それが左端の画像境界上にあるかのようにフィルタリングされる。あるマクロブロック上の隣接するマクロブロックが異なる領域に属する場合、このマクロブロックは、画像の上端のマクロブロック行にあるかのごとくにフィルタリングされる。
さらに、復号化される高信頼領域外の領域からの内部予測が適用されないことが有利である。
送信されるパラメータ・セットがIREG−Dの使用を指示する場合、デコーダは、マクロブロックの位置の決定を除いて、前述のようなIREG−Iの場合と同様にスライスを復号化する。空間的なマクロブロックの順序は通常通りであり、スライスは、多くの高信頼領域および残りの領域からのマクロブロックを同時に含む可能性がある。主なる差異は、領域境界を横切って内部予測および運動ベクトル予測が生じる可能性があることである。しかしながら、ループ・フィルタリングおよび高信頼領域外のピクセル値からの端数ピクセル補間に関する符号化制約が依然として適用される。
IREG−I法の好ましい実施態様は、JVT/H26.Lにて提案されているようないわゆるサブピクチャに関連して実施することができる。サブピクチャは、画像層とスライス層との間にサブピクチャ符号化層を追加することによって生成することができる。サブピクチャ符号化層は、いわゆるサブピクチャ(SP)を形成し、これは、通常、バックグラウンド領域(BR)SPを除いた状態の四角形のフォアグラウンド領域SP(FR SP)である。BR SPは、四角形のSPのいずれにも当てはまらない画像領域から構成される。画像のフォアグラウンド領域SPは、バックグラウンド領域SPの前に符号化される。SP内のマクロブロックは走査順に符号化される。SPは重なり合わない。すなわち、符号化画像全体が全てのSPによって構成される。本発明の上記実施態様に従えば、サブピクチャは、高信頼領域として使用することができる。サブピクチャの形状およびサイズは、例えば上記のパラメータによって制御することができる。
図4は、ビデオ符号化のために定義されるマクロブロック(MB)に関連して符号化される画像400を示している。この画像は、フォアグラウンド被写体と見なされる被写体を含む。四角形のフォアグラウンド領域サブピクチャ(FR SP)402が、MB境界に沿ってフォアグラウンド被写体の周囲に描かれている。この画像は、フォアグラウンド被写体402の周囲にバックグラウンドも有する。FR SP402を取り囲むバックグラウンドの部分は、バックグラウンド領域サブピクチャ401(BR SP)と呼ばれる。この場合のように、バックグラウンドの一部もFRSP 402に属する可能性があることに留意しなければならない。図4は、0から79まで昇順に番号が付けられるMBを示しており、ここで、第1のMB(0)は左上隅にあり、番号は、右に向かって大きくなり、1行が終わると次の行の左端から継続する。
図5は、サブピクチャの実施に従って図4の画像に関して形成されるビデオ符号化スライスの主要な図である。ここで、画像は、5マクロブロックのスライス・サイズを用いてビデオ符号化スライスに分割される。この場合、分割は最も重要なFR SPから始まり、BP SPは、全てのFR SPがスライスに分割された後に分割される(図4および図5においては、1つのFR SPしかない)。スライスには、0から始まるスライス通し番号が付与される。スライス0は、FR SP内の最初の行からの3MBおよびFR SP内の第2の行の2つのMBを占めること、特に、FR SPの最後のスライスはBR SPが符号化される前に閉じられることに留意しなければならない。次に、最後の1つのスライスを除いて各々のスライスが1つのスライスに許容される最大数のMBで構成されるように、BR SPのMBが走査順にスライスに分割される。スライスは、各々のFR SPを単純にスキップする。一般に、スライスが大きくなると、画像を符号化するために必要な冗長量が小さくなる。
好ましい実施態様に従えば、サブピクチャ・ベースの漸進的デコーダ・リフレッシュ法は、高信頼領域をフォアグラウンド・サブピクチャとして符号化するように実施することが可能である。フォアグラウンド・サブピクチャの外部境界を横切るループ・フィルタリングが停止するように、独立サブピクチャ符号化モードを使用することが可能である。画像全体内におけるフォアグラウンド・サブピクチャの形状および位置は、サブピクチャに属するマクロブロックが相互に隣接しなければならないという制約以外の制約によって制限されるべきではない。
デコーダにランダム・アクセス・ポイントを付与することに加えて、本発明は、ビデオ伝送のエラー回復力を向上させるためにも適用され得る。上記に開示されている方法は、予め定められたマクロブロック内の更新パターンを伴うエラー認識符号化法(error-aware encoding method )として使用することが可能である。フレーム・アルゴリズム当たりの更新マクロブロックの数は、選択される条件に応じて変わる可能性があるが、更新されるマクロブロックの順序は同じままである。この方法は、高信頼領域内の一部のマクロブロックを内部モードで決して更新しないように使用することも可能である。したがって、上記の手法は、適応マクロブロック内更新のカテゴリーに属する。
損失認識内部更新のための隔離領域の使用は、第1の隔離領域が開始されるところから隔離領域を連続的に使用するような非常に直接的な方法で適用され得る。シーケンスの最初のフレームは完全に内部符号化されるので、第1の隔離領域は第2の符号化フレームから始まることが好ましい。エンコーダは、画像サイズおよび想定されるパケット損失率に従って適切な増大率を選択することができる。一般的に言って、適切な増大率(すなわち、リフレッシュ率)は、マクロブロックの損失率に等しい。例えば、パケット損失率が20%である場合、80マクロブロックの増大率が適切である。
高信頼領域の符号化は、上記に開示されているように実施されるが、残りの領域に関していえば、残りの領域のピクセルは、その前に再構築されたフレームの空間的に対応するピクセルによって複製される。すなわち、残りの領域のマクロブロックは、内容がその前のフレームから不変であるかのように符号化される。
デコーダのサイドにおいては、リフレッシュ周期中に空間的に更新された画像は、これが視覚的に心地よいと見なされる場合に見ることができる。
この実施態様は、端末間の伝送遅延がフレーム内符号化に比べて明らかに減少するという利点を有する。量子化パラメータが一定なので、低ビットレート変動を維持しながら安定した画質を得ることができる。より安定した画質は、一般に、不快さがより少ないと見なされる。さらに、損失があった場合に、空間的および時間的なエラー補正を適用することができる。
様々な種類のワイプおよびボクシング等の多種のリフレッシュ・パターンを使用することが可能である。特に、ボックスアウト・リフレッシュ・パターンが使用される場合、画像中央部がまず表示される。関心領域の観点から見て、中央部は重要性がより高いことが多い。
イントラ・フレームを避ける結果として、エンドユーザーは、リフレッシュ要求後よりも速く応答画像が表示されると感じる。さらに、エンドユーザーは、画像表示速度の低下が軽減されたと感じる。
上記の実施態様に従った手順は、いくつかの利点をもたらす。イントラ・フレームが独立して復号化可能な画像グループ(GOP)から始まるような、ランダム・アクセス・ポイントの従来の符号化法に比べると、本発明は、特に、事前に定義された画像エリアのイントラ・マクロブロックの有効範囲を完全にカバーすることなく高い信頼性で上記画像エリアを更新することを可能にするという利点を有する。このエリアは多くの画像符号化の間に漸進的に更新される。以前の画像の高信頼領域を、次の画像の高信頼領域の動き補償基準として使用することが可能である。高信頼領域の各々のマクロブロックについてのマクロブロック・モードの選択は、速度−歪み最適化を用いて行うことができる。このようにして、本発明は、速度−歪みの観点からして最適に高信頼領域の符号化を行うことを可能にする。
本発明のこの特性は、任意の方向へのカメラ撮影等の比較的安定した全体的動きのシーケンスにおいて特に有用であるかもしれない。このような場合、第1のフレームにおいて画像の境界近くにあった領域が、次のフレームにおいては画像の真ん中に近づく。第1のフレームにおけるこの領域を内部符号化することができれば、次のフレームにおいて再び内部符号化する必要はない。
さらに、符号化ストリームの瞬間ビットレート変動は、よりなだらかである。この事実は、バッファ・オーバーフローを避けるのに役立ち、プレデコーダ・バッファに必要とされるサイズを小さくすることを可能し、端末間の伝送遅延を減少させるであろう。
エラーが生じやすい伝送の場合、いずれにしても画像当たりある程度の数のマクロブロックがイントラ・モードで符号化される。本発明は、ランダム・アクセスのためにもこれらのマクロブロックを再使用することができるようにしている。
インフラ・フレームの少なくとも一部が失われるかまたはだめになった場合、受信側のデコーダは、空間的なエラー補正または空間的および時間的なエラー補正を使用すべきか否かを検出する手段をほとんど持たない。空間的に隣接する領域は内部符号化されているので、簡単な選択は空間的なエラー補正である。しかしながら、空間的および時間的なエラー補正であれば、より良い補正結果を生じているかもしれない。このような現象は、本発明に従った方法を適用すれば、すなわち、一度に画像の一部のみをイントラ・モードで更新すれば、回避され得る。
会話型ビデオ・アプリケーションとは、テレビ電話、テレビ会議およびその他のこれに類似するアプリケーションを意味する。この系統のアプリケーションは、端末間の遅延を最小限に抑えるという目標を特徴とする。会話型アプリケーションは、ISDN(ITU−T推奨H.320を参照のこと)、PSTN(ITU−T H.324を参照のこと)、固定IPネットワーク(ITU−T H.323を参照のこと)およびパケット交換方式移動通信網(3GPP TS 26.235を参照のこと)等のように、様々なネットワークで動作し得る。一般に、ネットワークの少なくとも1つのリンクの最大スループット・ビットレートは限られている。ISDN等の一部のネットワークは伝送エラー率が低いが、インターネットおよび移動通信網等の他のネットワークは比較的伝送エラーが生じやすい。
会話型アプリケーションにおいては、目標は端末間の遅延を最小限に抑えることであり、また一方で最大スループットは固定されるので、ビデオ・ビットレートを比較的一定に維持することがその目標となる。ビットレートの観点からすれば、一般に、内部符号化は、相互間符号化に比べてコスト高なので、一度にフレーム全体を内部符号化することは避けるべきである。
デコーダは、シーケンスの開始の時点で、画像内更新要求の応答として画像のリフレッシュを予想する。本発明に従った方法においては、画像内全体ではなく、漸進的デコーダ・リフレッシュ周期を信号とし、符号化することができる。要望する場合には、このリフレッシュ周期中に部分的に更新される画像を見ることができる。この画像は視覚的に快適なものであるかもしれない。
画像内全体の代わりに漸進的デコーダ・リフレッシュを使用することによって、ビットレートの変動が滑らかになり、端末間の伝送遅延が減少する。エンドユーザーは、セッションの初期化において画像がより速く表示されると感じる。受信画像が損なわれすぎている場合には、受信側の端末は遠端のエンコーダに画像内更新を要求する。このような場合、本発明が使用されると、エンドユーザーは画像表示速度の低下が軽減されたと感じる。
漸進的量子化の精細化および漸進的解像度の精細化に比べて、本発明の方法は、画像内更新要求に対する応答としてより安定した画質を提供する。このように安定した画質は、一般に不快さが少ないと見なされる。
本発明の主な利点は、空間的および時間的なエラー伝播を完全に停止させることである。このような特徴は、基準画像選択、ループ・フィルタリングおよび端数ピクセル補間を伴うJVT設計等の複雑な符号化法においてこれまでは得ることができなかった。
このように、上記に開示されている方法は、予め定められた高信頼マクロブロック更新パターンを伴うエラー認識符号化法として使用することができる。予め定められたパターン・アルゴリズムにおいてフレーム当たりで更新されるマクロブロックの数は、選択される条件に応じて変わることが可能であるが、更新されるマクロブロックの順序は同じままであることに留意しなければならない。したがって、この方法は、同時に2つの利点を有する。すなわち、内部符号化によってエラー伝播を停止させながら、完全なランダム・アクセスの可能性を提供する。
この方法は、他の領域よりも優れたエラー保護を有する高信頼領域を伝送することを可能にする。したがって、この方法は、この種のトランスポート優先順位付けが不可能な内部更新方法による従来の符号化よりも機能が優れている。高信頼領域は、伝送エラーに対して残りの符号化データよりも優れた保護を受けることができる。実際に、フォワード・エラー符号化等のより多くの冗長性を高信頼領域に適用することが可能である。代替的に、標準的なビデオ・データ伝送に使用されるチャネルより高いサービスの質(QoS)を保証するチャネルを経由して、高信頼領域を送信することが可能である。ユニキャスト・ストリーミング(unicast streaming )においては、サーバーは、漸進的ランダム・アクセス・ポジションからストリーミングを開始するよう要求されると、非信頼性領域(バックグラウンド・サブピクチャ)を全く伝送する必要がない。
ニュース、映画予告編および音楽ビデオ等の多くのタイプのビデオ素材は、頻繁なシーン・カットを含む。時には、シーン・カットは唐突であるが、多くの場合、フェードまたはワイプ等の遷移が使用される。遷移における画像間の変化を表すためには動き補償は十分に強力な方法ではない場合があるので、シーン遷移の符号化は、圧縮効率の観点からして解消すべき問題である。
シーン遷移は、例えば、突然の遷移、マスキング遷移、フェード遷移、および混成シーン遷移に分類することができる。突然の遷移は遷移期間がなく、2つの連続するシーンの内容が同時に存在する画像がないものである。マスキングがなされた遷移は、第2のシーンが空間的に徐々に第1のシーンから顕わになるものである。全ての画像は十分な強度で表示される。マスキングがなされたシーン遷移の符号化は、一般に、少なくとも1つのイントラ・フレームを含む。マスキングがなされたシーン遷移の例としては、ボックスイン、ボックスアウト、ワイプ、スプリットおよびディゾルブがある。フェード遷移は、2つのシーンの画像が半透明的に相互に上に置かれ、上にある画像の透明性が遷移期間で徐々に変化するものである。フェード遷移の例には、通常のクロスフェードおよびフェード・スルー・ブラック(ブラックからの遷移およびブラックへの遷移)がある。混成シーン遷移は、マスキング遷移およびフェード遷移の組み合わせである。
本発明に従った方法はまた、シーン遷移、特にマスキングがなされたシーン遷移に適用される場合に利点をもたらす。本発明によって、画像内全体を符号化することなくランダムに遷移に対するアクセスを行うことができる。サブピクチャ・ベースの漸進的デコーダ・リフレッシュが使用中であり、ランダムに遷移に対するアクセスが行われる場合、遷移の第1のシーンの符号化データを送信したり、復号化したり、表示したりする必要はない。さらに、マスキングがなされたシーン遷移は、突然のシーン変化が使用される場合よりも符号化ビデオ・ビットレートにおける変動が小さくなるように符号化することができる。
ここでは、ビデオ・シーケンスへの漸進的デコーダ・リフレッシュ・ランダム・アクセス・ポイントを符号化するための方法が説明されている。具体的に言うと、この方法は、ビデオ・エンコーダにおいて行われる。ビデオ・エンコーダはそれ自体既知のビデオ・エンコーダでよい。使用されるビデオ・エンコーダは、例えば、ITU−T推奨H.263またはH.26Lに従ったビデオ・エンコーダとすることが可能である。この種のビデオ・エンコーダは、本発明に従って、少なくとも1つの内部符号化された符号化ブロックを含む第1の高信頼領域を決定し、かつ、この第1の高信頼領域と第1の高信頼領域外の符号化ブロックとの間に情報従属性が生じるのを防止するようにビデオ・シーケンスにおいてこの第1の高信頼領域を符号化するように構成される。
これに対して、復号化はビデオ・デコーダにおいて行われる。これはそれ自体既知のビデオ・デコーダでよい。使用されるビデオ・デコーダは、例えばITU−T推奨H.263またはH.26Lに従った低ビットレート・ビデオ・デコーダとすることが可能である。この種のデコーダは、本発明に従って、少なくとも1つの内部符号化された符号化ブロックを含むビデオ・シーケンスの第1の高信頼領域を決定する情報を受信し、かつ、上記第1の高信頼領域と第1の高信頼領域外の符号化ブロックの間に情報従属性が生じるのを防止するように上記のビデオ・シーケンスから第1の高信頼領域を復号化するように構成される。
ビデオ・ベースの電気通信システムの様々な部品、特に端末は、マルチメディア・ファイルの双方向転送、すなわちファイルの送受信を可能にする特性を含むことが可能である。これによって、エンコーダおよびデコーダを、エンコーダおよびデコーダ両方の機能を含むビデオ・コーデックとして実現することが可能である。
上記のビデオ・エンコーダ、ビデオ・デコーダおよび端末における本発明の機能的な要素は、ソフトウェア、ハードウェアまたはその組み合わせとして有利に実施され得る点に注意すべきである。本発明の符号化および復号化の方法は、特に、本発明の機能上のステップを実施するためのコンピュータ読み取り可能なコマンドを含むコンピュータ・ソフトウェアとして実施されることに非常に適している。エンコーダおよびデコーダは、記憶手段に記憶されかつパーソナル・コンピュータ(PC)または移動局等のコンピュータ様の装置によって符号化/復号化機能を果たすために上記の装置によって実行可能なソフトウェア・コードとして実施されることが好ましい。
図6は、本発明の好ましい実施態様に係る移動通信装置MSのブロック図を示している。移動通信装置において、主制御装置MCUは、移動通信装置の各種の機能を担当するブロック、すなわちランダム・アクセス・メモリRAM、無線周波数部品RF、読み出し専用メモリROM、ビデオ・コーデックCODECおよびユーザー・インターフェイスUIを制御する。ユーザー・インターフェイスは、キーボードKB、ディスプレイDP、スピーカSPおよびマイクロフォンMFを含む。MCUは、マイクロプロセッサであるか、または代替的な実施態様においては、その他の種類のプロセッサ、例えばデジタル信号プロセッサである。MCUの動作命令は前もってROMに記憶されていると有利である。この動作命令(すなわち、コンピュータ・プログラム)に従って、MCUは、無線経路(AER)を経由してデータを送受信するためにRFブロックを使用する。ビデオ・コーデックCODECは、ハードウェア・ベースであっても、または完全にまたは部分的にソフトウェア(SW)・ベースであってもよく、この場合にはビデオ・コーデックCODECは、必要に応じてビデオ符号化および復号化を実施するためにMCUを制御するためのコンピュータ・プログラムを含む。MCUは、そのワーキング・メモリとしてRAMを使用する。移動通信装置は、ビデオ・カメラ(図6のカメラ)によって運動画像を取り込み、MCU、RAMおよびCODECベースのソフトウェアを用いて運動画像を符号化し、パケット化することができる。その後、RFブロックを用いて、符号化されたビデオを相手と交換する。
図7は、複数の移動通信装置MS、移動通信網71、インターネット72、ビデオ・サーバー73およびインターネットに接続される固定PCを含む画像通信システム70を示している。ビデオ・サーバーは、ビデオ・エンコーダを有し、天気予報またはニュース等のオンデマンド・ビデオ・ストリームを提供することが可能である。
本発明の好ましい実施態様は、領域ベースの符号化構造に基づいている。
本発明はまた、ビデオ・シーケンスを含むビデオ信号として実施され得る。ビデオ・シーケンスは、複数のビデオ・フレームから構成され、少なくとも1つのビデオ・フレームは1組の符号化ブロックに分割され、この符号化ブロックのうち少なくとも1つは内部符号化によって符号化される。このビデオ信号は、さらに、ビデオ・シーケンスの第1の高信頼領域を決定する情報を含み、この高信頼領域は少なくとも1つの内部符号化された符号化ブロックを含む。上記のビデオ信号は、さらに、第1の高信頼領域と第1の高信頼領域外の符号化ブロックとの間に情報従属性が生じるのを防止するように上記ビデオ・シーケンスから第1の高信頼領域を復号化するための情報を含む。上記のビデオ信号は、リアルタイム伝送信号とするか、または、大容量メモリもしくはプレイバック・ビデオ・ディスク等の媒体を使用するコンピュータ読み取り可能なキャリアに記憶することが可能である。
当業者には、技術の進歩につれて、本発明の基本概念を多様な方法で実施することが可能であることが明らかであろう。したがって、本発明およびその実施態様は、上記の例に限定されるものではなく、本願の特許請求の範囲内で変化し得る。
JVT/H26.L設計の概念的構造を示すブロック図である。 高信頼領域の増大に関する好ましい実施態様を示す図である。 特定のリフレッシュ・パターンに従って高信頼領域にマクロブロックを追加する手順の例を示す図である。 ビデオ符号化のために定義されるマクロブロックに関連して符号化される画像を示す図である。 サブピクチャの実施に従って図4の画像に関して形成されるビデオ符号化スライスの主要な図である。 本発明の好ましい実施態様に係る移動通信装置を示すブロック図である。 本発明が適用され得るビデオ通信システムを示すブロック図である。

Claims (23)

  1. ビデオ・シーケンスを符号化する方法であり、前記ビデオ・シーケンスが複数のビデオ・フレームから構成され、前記方法は、
    少なくとも1つのビデオ・フレームを1組の符号化ブロックに分割するステップと、
    前記符号化ブロックのうち少なくとも1つを内部符号化によって符号化するステップとを含み、前記方法は、さらに、
    少なくとも1つの内部符号化された符号化ブロックを含む第1の高信頼領域を決定するステップと、
    前記第1の高信頼領域と第1の高信頼領域外の符号化ブロックとの間に情報従属性が生じるのを防止するように前記ビデオ・シーケンスにおいて前記第1の高信頼領域を符号化するステップとを有することを特徴とする、ビデオ・シーケンスを符号化する方法。
  2. 前記高信頼領域のその後の符号化ブロックを、その前のビデオ・フレームの高信頼領域から予測するステップを有することを特徴とする、請求項1に記載の方法。
  3. 前記高信頼領域の境界においてループ・フィルタリングを停止させることによって前記情報従属性を防止するステップを有することを特徴とする、請求項1または2に記載の方法。
  4. 動き補償予測を適用する際に前記高信頼領域の前記符号化ブロックのみを参照することによって前記情報従属性を防止するステップを有することを特徴とする、請求項1から3のいずれか一項に記載の方法。
  5. 前記高信頼領域の境界でピクセル値の動き補間を無効にすることによって前記情報従属性を防止するステップを有することを特徴とする、請求項1から4のいずれか一項に記載の方法。
  6. 前記高信頼領域をサブピクチャとしてビデオ・シーケンスに符号化するステップを有することを特徴とする、請求項1から5のいずれか一項に記載の方法。
  7. 初めに、前記高信頼領域の前記符号化ブロックをラスタ走査順に符号化するステップと、
    その後に、前記第1の高信頼領域外の前記符号化ブロックをラスタ走査順に符号化するステップとを有することを特徴とする、請求項1から6のいずれか一項に記載の方法。
  8. 前記ビデオ・シーケンスにおいて前記ビデオ・シーケンスを復号化するためのパラメータを符号化するステップを有し、前記パラメータは、
    前記高信頼領域のタイプを定義するパラメータ、
    同時に存在する高信頼領域の数を定義するパラメータ、
    前記高信頼領域の形状進化のタイプを定義するパラメータ、および
    前記高信頼領域の増大率を定義するパラメータのうち少なくとも1つを含むことを特徴とする、請求項1から7のいずれか一項に記載の方法。
  9. スライス・ヘッダにおいて前記パラメータのうち少なくとも1つを符号化するステップを有し、前記スライスは、少なくとも1つの符号化ブロックから構成されることを特徴とする、請求項8に記載の方法。
  10. ビデオ・シーケンスを符号化するためのビデオ・エンコーダであり、前記ビデオ・シーケンスが複数のビデオ・フレームから構成され、前記ビデオ・エンコーダは、
    少なくとも1つのビデオ・フレームを1組の符号化ブロックに分割し、
    前記符号化ブロックのうち少なくとも1つを内部符号化によって符号化するように構成され、
    前記ビデオ・エンコーダは、さらに、
    少なくとも1つの内部符号化された符号化ブロックを含む第1の高信頼領域を決定し、
    前記第1の高信頼領域と第1の高信頼領域外の符号化ブロックとの間に情報従属性が生じるのを防止するように前記ビデオ・シーケンスにおいて前記第1の高信頼領域を符号化するように構成されることを特徴とする、ビデオ・エンコーダ。
  11. ビデオ・シーケンスを符号化するためのコンピュータ読み取り可能なキャリアに記憶されるコンピュータ・ソフトウェアであり、前記ビデオ・シーケンスが複数のビデオ・フレームから構成され、前記コンピュータ・ソフトウェアは、
    少なくとも1つのビデオ・フレームを1組の符号化ブロックに分割するためのソフトウェア手段と、
    前記符号化ブロックのうち少なくとも1つを内部符号化によって符号化するためのソフトウェア手段とを含み、
    前記コンピュータ・ソフトウェアは、さらに、
    少なくとも1つの内部符号化された符号化ブロックを含む第1の高信頼領域を決定するためのソフトウェア手段と、
    前記第1の高信頼領域と第1の高信頼領域外の符号化ブロックとの間に情報従属性が生じるのを防止するように前記ビデオ・シーケンスにおいて前記第1の高信頼領域を符号化するためのソフトウェア手段とを含むことを特徴とする、コンピュータ・ソフトウェア。
  12. ビデオ・シーケンスの符号化におけるサブピクチャの使用であり、前記ビデオ・シーケンスが複数のビデオ・フレームから構成され、前記使用において、少なくとも1つのビデオ・フレームが1組の符号化ブロックに分割され、前記符号化ブロックのうち少なくとも1つが内部符号化によって符号化され、1つのサブピクチャが、少なくとも1つの内部符号化された符号化ブロックを含む第1の高信頼領域として決定され、かつ、前記第1の高信頼領域としての前記サブピクチャが、前記第1の高信頼領域と第1の高信頼領域外の符号化ブロックとの間に情報従属性が生じるのを防止するように前記ビデオ・シーケンスにおいて符号化されることを特徴とする、ビデオ・シーケンスの符号化におけるサブピクチャの使用。
  13. ビデオ・シーケンスを復号化する方法であり、前記ビデオ・シーケンスが複数のビデオ・フレームから構成され、前記方法において、少なくとも1つのビデオ・フレームが1組の符号化ブロックに分割され、前記符号化ブロックのうち少なくとも1つが内部符号化によって符号化され、前記方法は、
    前記ビデオ・シーケンスの第1の高信頼領域を決定する情報を受信するステップを有し、前記第1の高信頼領域は、少なくとも1つの内部符号化された符号化ブロックを含み、
    前記方法は、さらに、
    前記第1の高信頼領域と第1の高信頼領域外の符号化ブロックとの間に情報従属性が生じるのを防止するように前記ビデオ・シーケンスから前記第1の高信頼領域を復号化するステップを有することを特徴とする、ビデオ・シーケンスを復号化する方法。
  14. 前記高信頼領域の境界においてループ・フィルタリングを停止させることによって前記情報従属性を防止するステップを有することを特徴とする、請求項13に記載の方法。
  15. 動き補償予測を適用する際に前記高信頼領域の前記符号化ブロックのみを参照することによって前記情報従属性を防止するステップを有することを特徴とする、請求項13または14に記載の方法。
  16. 前記高信頼領域の境界でピクセル値の動き補間を無効にすることによって前記情報従属性を防止するステップを有することを特徴とする、請求項13から15のいずれか一項に記載の方法。
  17. 初めに、前記高信頼領域の前記符号化ブロックをラスタ走査順に復号化するステップと、
    その後に、前記第1の高信頼領域外の前記符号化ブロックをラスタ走査順に復号化するステップとを有することを特徴とする、請求項13から16のいずれか一項に記載の方法。
  18. パラメータに従って前記ビデオ・シーケンスを復号化するステップであり、前記パラメータは、
    前記高信頼領域のタイプを定義するパラメータ、
    同時に存在する高信頼領域の数を定義するパラメータ、
    前記高信頼領域の形状進化のタイプを定義するパラメータ、および
    前記高信頼領域の増大率を定義するパラメータのうち少なくとも1つを含むことを特徴とする、請求項13から17のいずれか一項に記載の方法。
  19. ビデオ・シーケンスを復号化するためのデコーダであり、前記ビデオ・シーケンスが複数のビデオ・フレームから構成され、前記デコーダは、
    少なくとも1つのビデオ・フレームが1組の符号化ブロックに分割され、
    前記符号化ブロックのうち少なくとも1つが内部符号化によって符号化されるように構成され、
    前記デコーダは、さらに、
    少なくとも1つの内部符号化された符号化ブロックを含む前記ビデオ・シーケンスの第1の高信頼領域を決定する情報を受信し、
    前記第1の高信頼領域と第1の高信頼領域外の符号化ブロックとの間に情報従属性が生じるのを防止するように前記ビデオ・シーケンスから前記第1の高信頼領域を復号化するように構成されることを特徴とする、デコーダ。
  20. ビデオ・シーケンスを復号化するためのコンピュータ読み取り可能なキャリアに記憶されるコンピュータ・ソフトウェアであり、前記ビデオ・シーケンスが複数のビデオ・フレームから構成され、前記コンピュータ・ソフトウェアにおいて、少なくとも1つのビデオ・フレームが1組の符号化ブロックに分割され、前記符号化ブロックのうち少なくとも1つが内部符号化によって符号化され、前記コンピュータ・ソフトウェアは、
    前記ビデオ・シーケンスの第1の高信頼領域を決定する情報を受信するためのソフトウェア手段を含み、前記第1の高信頼領域は、少なくとも1つの内部符号化された符号化ブロックを含み、
    前記コンピュータ・ソフトウェアは、さらに、
    前記第1の高信頼領域と第1の高信頼領域外の符号化ブロックとの間に情報従属性が生じるのを防止するように前記ビデオ・シーケンスから前記第1の高信頼領域を復号化するためのソフトウェア手段を含むことを特徴とする、コンピュータ・ソフトウェア。
  21. ビデオ・シーケンスを含むビデオ信号であり、前記ビデオ・シーケンスが複数のビデオ・フレームから構成され、前記ビデオ信号において、少なくとも1つのビデオ・フレームが1組の符号化ブロックに分割され、前記符号化ブロックのうち少なくとも1つが内部符号化によって符号化され、
    前記ビデオ信号は、
    前記ビデオ・シーケンスの第1の高信頼領域を決定する情報を含み、前記第1の高信頼領域は、少なくとも1つの内部符号化された符号化ブロックを含み、
    前記ビデオ信号は、さらに、
    前記第1の高信頼領域と第1の高信頼領域外の符号化ブロックとの間に情報従属性が生じるのを防止するように前記ビデオ・シーケンスから前記第1の高信頼領域を復号化するための情報を含むことを特徴とする、ビデオ信号。
  22. ビデオ・シーケンスを復号化するための端末であり、前記端末が、請求項19に記載のデコーダを含むことを特徴とする、端末。
  23. ビデオ・シーケンスを符号化するための電気通信網のネットワーク素子であり、前記ネットワーク素子が、請求項10に記載のビデオ・エンコーダを含むことを特徴とする、ネットワーク素子。
JP2004502635A 2002-04-29 2003-04-28 ビデオ符号化におけるランダム・アクセス・ポイント Expired - Lifetime JP4468800B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FI20020810A FI114679B (fi) 2002-04-29 2002-04-29 Satunnaisaloituspisteet videokoodauksessa
PCT/FI2003/000331 WO2003094530A1 (en) 2002-04-29 2003-04-28 Random access points in video encoding

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2006126367A Division JP2006246524A (ja) 2002-04-29 2006-04-28 デジタル画像内の領域のサイズ、形状および位置を表示する方法、デジタル画像を符号化してビットストリームを生成するためのエンコーダ、ビットストリームを復号化するためのデコーダ、およびコンピュータ・プログラム製品

Publications (2)

Publication Number Publication Date
JP2006505153A true JP2006505153A (ja) 2006-02-09
JP4468800B2 JP4468800B2 (ja) 2010-05-26

Family

ID=8563849

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2004502635A Expired - Lifetime JP4468800B2 (ja) 2002-04-29 2003-04-28 ビデオ符号化におけるランダム・アクセス・ポイント
JP2006126367A Withdrawn JP2006246524A (ja) 2002-04-29 2006-04-28 デジタル画像内の領域のサイズ、形状および位置を表示する方法、デジタル画像を符号化してビットストリームを生成するためのエンコーダ、ビットストリームを復号化するためのデコーダ、およびコンピュータ・プログラム製品
JP2010018864A Pending JP2010136428A (ja) 2002-04-29 2010-01-29 デジタル画像内の領域のサイズ、形状および位置を示す方法、デジタル画像を符号化してビットストリームを生成するためのエンコーダ、ビットストリームを復号するためのデコーダ、およびコンピュータ・プログラム製品

Family Applications After (2)

Application Number Title Priority Date Filing Date
JP2006126367A Withdrawn JP2006246524A (ja) 2002-04-29 2006-04-28 デジタル画像内の領域のサイズ、形状および位置を表示する方法、デジタル画像を符号化してビットストリームを生成するためのエンコーダ、ビットストリームを復号化するためのデコーダ、およびコンピュータ・プログラム製品
JP2010018864A Pending JP2010136428A (ja) 2002-04-29 2010-01-29 デジタル画像内の領域のサイズ、形状および位置を示す方法、デジタル画像を符号化してビットストリームを生成するためのエンコーダ、ビットストリームを復号するためのデコーダ、およびコンピュータ・プログラム製品

Country Status (10)

Country Link
US (3) US7302001B2 (ja)
EP (2) EP1500280B1 (ja)
JP (3) JP4468800B2 (ja)
KR (2) KR100973518B1 (ja)
CN (2) CN100521793C (ja)
AU (1) AU2003229800A1 (ja)
BR (1) BR0309713A (ja)
CA (1) CA2483293C (ja)
FI (1) FI114679B (ja)
WO (1) WO2003094530A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8428131B2 (en) 2007-09-18 2013-04-23 Fujitsu Limited Video encoder and decoder using region based coding and decoding techniques with sequential refresh
JP2013153387A (ja) * 2012-01-26 2013-08-08 Nippon Telegr & Teleph Corp <Ntt> 動画像符号化方法,動画像符号化装置および動画像符号化プログラム
JP2014511641A (ja) * 2011-03-09 2014-05-15 シーメンス アクチエンゲゼルシヤフト デジタル画像のシーケンスを符号化する方法

Families Citing this family (117)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7082450B2 (en) 2001-08-30 2006-07-25 Nokia Corporation Implementation of a transform and of a subsequent quantization
US7159197B2 (en) 2001-12-31 2007-01-02 Synopsys, Inc. Shape-based geometry engine to perform smoothing and other layout beautification operations
JP4130780B2 (ja) * 2002-04-15 2008-08-06 松下電器産業株式会社 画像符号化方法および画像復号化方法
KR101075860B1 (ko) * 2002-07-15 2011-10-25 노키아 코포레이션 비디오 시퀀스에서 오류 은폐 방법
US9330060B1 (en) 2003-04-15 2016-05-03 Nvidia Corporation Method and device for encoding and decoding video image data
US7724818B2 (en) * 2003-04-30 2010-05-25 Nokia Corporation Method for coding sequences of pictures
US8660182B2 (en) 2003-06-09 2014-02-25 Nvidia Corporation MPEG motion estimation based on dual start points
KR100987764B1 (ko) * 2003-09-04 2010-10-13 경희대학교 산학협력단 영상 데이터의 예측 부호화를 위한 참조 데이터 유닛 결정방법 및 그 장치
EP1719081B1 (en) * 2004-01-30 2013-09-04 Telefonaktiebolaget L M Ericsson (Publ) Prioritising data elements of a data stream
US7991053B2 (en) 2004-05-04 2011-08-02 Qualcomm Incorporated Method and apparatus to enable acquisition of media in streaming applications
EP1751955B1 (en) 2004-05-13 2009-03-25 Qualcomm, Incorporated Header compression of multimedia data transmitted over a wireless communication system
CN100534196C (zh) * 2004-05-25 2009-08-26 Nxp股份有限公司 用于编码数字视频数据的方法和设备
US20060050976A1 (en) * 2004-09-09 2006-03-09 Stephen Molloy Caching method and apparatus for video motion compensation
US7813562B2 (en) * 2004-09-27 2010-10-12 Intel Corporation Low-latency remote display rendering using tile-based rendering systems
US20090080519A1 (en) * 2004-10-18 2009-03-26 Electronics And Telecommunications Research Institute Method for encoding/decoding video sequence based on mctf using adaptively-adjusted gop structure
WO2006049412A1 (en) * 2004-11-01 2006-05-11 Electronics And Telecommunications Research Institute Method for encoding/decoding a video sequence based on hierarchical b-picture using adaptively-adjusted gop structure
FR2886433B1 (fr) * 2005-05-30 2007-09-07 Commissariat Energie Atomique Methode de segmentation d'une sequence d'images tridimensionnelles, notamment en pharmaco-imagerie.
KR100736041B1 (ko) * 2005-06-30 2007-07-06 삼성전자주식회사 에러 은닉 방법 및 장치
US7912219B1 (en) * 2005-08-12 2011-03-22 The Directv Group, Inc. Just in time delivery of entitlement control message (ECMs) and other essential data elements for television programming
KR100667808B1 (ko) 2005-08-20 2007-01-11 삼성전자주식회사 영상의 인트라 예측 부호화, 복호화 방법 및 장치
KR100727969B1 (ko) * 2005-08-27 2007-06-14 삼성전자주식회사 영상의 부호화 및 복호화 장치와, 그 방법, 및 이를수행하기 위한 프로그램이 기록된 기록 매체
KR100727970B1 (ko) * 2005-08-30 2007-06-13 삼성전자주식회사 영상의 부호화 및 복호화 장치와, 그 방법, 및 이를수행하기 위한 프로그램이 기록된 기록 매체
US9467659B2 (en) * 2005-09-27 2016-10-11 Qualcomm Incorporated Method and apparatus for progressive channel switching
KR100750137B1 (ko) 2005-11-02 2007-08-21 삼성전자주식회사 영상의 부호화,복호화 방법 및 장치
US8233535B2 (en) 2005-11-18 2012-07-31 Apple Inc. Region-based processing of predicted pixels
US8731071B1 (en) 2005-12-15 2014-05-20 Nvidia Corporation System for performing finite input response (FIR) filtering in motion estimation
US8724702B1 (en) 2006-03-29 2014-05-13 Nvidia Corporation Methods and systems for motion estimation used in video coding
US8179961B2 (en) * 2006-07-17 2012-05-15 Thomson Licensing Method and apparatus for adapting a default encoding of a digital video signal during a scene change period
WO2008020792A1 (en) * 2006-08-17 2008-02-21 Telefonaktiebolaget Lm Ericsson (Publ) Error recovery for rich media
US8660380B2 (en) 2006-08-25 2014-02-25 Nvidia Corporation Method and system for performing two-dimensional transform on data value array with reduced power consumption
EP1940179B1 (de) 2006-10-17 2013-08-28 Siemens Aktiengesellschaft Verfahren und Kodiervorrichtung zum Generieren eines kodierten Datenstroms sowie Extraktionsverfahren und Extraktionsvorrichtung zum Extrahieren zumindest eines Datenobjekts aus einem kodierten Datenstrom
JP4875008B2 (ja) * 2007-03-07 2012-02-15 パナソニック株式会社 動画像符号化方法、動画像復号化方法、動画像符号化装置及び動画像復号化装置
US8824567B2 (en) * 2007-04-04 2014-09-02 Ittiam Systems (P) Ltd. Method and device for tracking error propagation and refreshing a video stream
KR101379255B1 (ko) * 2007-04-06 2014-03-28 삼성전자주식회사 미분 방정식을 이용한 인트라 예측 부호화, 복호화 방법 및장치
US8756482B2 (en) 2007-05-25 2014-06-17 Nvidia Corporation Efficient encoding/decoding of a sequence of data frames
CN101321284B (zh) 2007-06-10 2012-01-04 华为技术有限公司 一种编解码方法、设备及系统
US9118927B2 (en) 2007-06-13 2015-08-25 Nvidia Corporation Sub-pixel interpolation and its application in motion compensated encoding of a video signal
JP4678015B2 (ja) * 2007-07-13 2011-04-27 富士通株式会社 動画像符号化装置及び動画像符号化方法
US8873625B2 (en) 2007-07-18 2014-10-28 Nvidia Corporation Enhanced compression in representing non-frame-edge blocks of image frames
CN101874408A (zh) * 2007-11-22 2010-10-27 日本电气株式会社 图像捕获设备、编码方法及程序
US8542748B2 (en) * 2008-03-28 2013-09-24 Sharp Laboratories Of America, Inc. Methods and systems for parallel video encoding and decoding
US8358700B2 (en) * 2008-06-03 2013-01-22 Omnivision Technologies, Inc. Video coding apparatus and method for supporting arbitrary-sized regions-of-interest
EP2136565A1 (en) * 2008-06-19 2009-12-23 Thomson Licensing Method for determining a filter for interpolating one or more pixels of a frame, method for encoding or reconstructing a frame and method for transmitting a frame
CN102084658B (zh) * 2008-07-01 2013-06-05 法国电信公司 实施改进的预测的图像编码方法和装置、对应的解码方法和装置、信号和计算机程序
US8649426B2 (en) * 2008-09-18 2014-02-11 Magor Communications Corporation Low latency high resolution video encoding
US20100128797A1 (en) * 2008-11-24 2010-05-27 Nvidia Corporation Encoding Of An Image Frame As Independent Regions
US8666181B2 (en) 2008-12-10 2014-03-04 Nvidia Corporation Adaptive multiple engine image motion detection system and method
US9113169B2 (en) 2009-05-07 2015-08-18 Qualcomm Incorporated Video encoding with temporally constrained spatial dependency for localized decoding
US8724707B2 (en) * 2009-05-07 2014-05-13 Qualcomm Incorporated Video decoding using temporally constrained spatial dependency
US20110026596A1 (en) * 2009-07-28 2011-02-03 Wei Hong Method and System for Block-Based Motion Estimation for Motion-Compensated Frame Rate Conversion
EP2299717A1 (en) * 2009-09-10 2011-03-23 Thomson Licensing Method and apparatus for image encoding using Hold-MBs, and method and apparatus for image decoding using Hold-MBs
KR20110068792A (ko) * 2009-12-16 2011-06-22 한국전자통신연구원 적응적 영상 부호화 장치 및 방법
KR101743482B1 (ko) 2010-01-22 2017-06-07 삼성전자주식회사 영역 기반의 부호화/복호화 장치 및 방법
US9223134B2 (en) 2010-02-28 2015-12-29 Microsoft Technology Licensing, Llc Optical imperfections in a light transmissive illumination system for see-through near-eye display glasses
US8477425B2 (en) 2010-02-28 2013-07-02 Osterhout Group, Inc. See-through near-eye display glasses including a partially reflective, partially transmitting optical element
US9341843B2 (en) 2010-02-28 2016-05-17 Microsoft Technology Licensing, Llc See-through near-eye display glasses with a small scale image source
WO2011106797A1 (en) 2010-02-28 2011-09-01 Osterhout Group, Inc. Projection triggering through an external marker in an augmented reality eyepiece
US9128281B2 (en) 2010-09-14 2015-09-08 Microsoft Technology Licensing, Llc Eyepiece with uniformly illuminated reflective display
US9229227B2 (en) 2010-02-28 2016-01-05 Microsoft Technology Licensing, Llc See-through near-eye display glasses with a light transmissive wedge shaped illumination system
US9129295B2 (en) 2010-02-28 2015-09-08 Microsoft Technology Licensing, Llc See-through near-eye display glasses with a fast response photochromic film system for quick transition from dark to clear
US9134534B2 (en) 2010-02-28 2015-09-15 Microsoft Technology Licensing, Llc See-through near-eye display glasses including a modular image source
US9182596B2 (en) 2010-02-28 2015-11-10 Microsoft Technology Licensing, Llc See-through near-eye display glasses with the optical assembly including absorptive polarizers or anti-reflective coatings to reduce stray light
US8472120B2 (en) 2010-02-28 2013-06-25 Osterhout Group, Inc. See-through near-eye display glasses with a small scale image source
US9285589B2 (en) 2010-02-28 2016-03-15 Microsoft Technology Licensing, Llc AR glasses with event and sensor triggered control of AR eyepiece applications
US8488246B2 (en) 2010-02-28 2013-07-16 Osterhout Group, Inc. See-through near-eye display glasses including a curved polarizing film in the image source, a partially reflective, partially transmitting optical element and an optically flat film
US20120249797A1 (en) 2010-02-28 2012-10-04 Osterhout Group, Inc. Head-worn adaptive display
US9097890B2 (en) 2010-02-28 2015-08-04 Microsoft Technology Licensing, Llc Grating in a light transmissive illumination system for see-through near-eye display glasses
US9091851B2 (en) 2010-02-28 2015-07-28 Microsoft Technology Licensing, Llc Light control in head mounted displays
US9759917B2 (en) 2010-02-28 2017-09-12 Microsoft Technology Licensing, Llc AR glasses with event and sensor triggered AR eyepiece interface to external devices
US8482859B2 (en) 2010-02-28 2013-07-09 Osterhout Group, Inc. See-through near-eye display glasses wherein image light is transmitted to and reflected from an optically flat film
US10180572B2 (en) 2010-02-28 2019-01-15 Microsoft Technology Licensing, Llc AR glasses with event and user action control of external applications
US9097891B2 (en) 2010-02-28 2015-08-04 Microsoft Technology Licensing, Llc See-through near-eye display glasses including an auto-brightness control for the display brightness based on the brightness in the environment
US20150309316A1 (en) 2011-04-06 2015-10-29 Microsoft Technology Licensing, Llc Ar glasses with predictive control of external device based on event input
US8467133B2 (en) 2010-02-28 2013-06-18 Osterhout Group, Inc. See-through display with an optical assembly including a wedge-shaped illumination system
US9366862B2 (en) 2010-02-28 2016-06-14 Microsoft Technology Licensing, Llc System and method for delivering content to a group of see-through near eye display eyepieces
GB2481573A (en) * 2010-06-15 2012-01-04 Nds Ltd Splicng of encoded media content
US10244239B2 (en) 2010-12-28 2019-03-26 Dolby Laboratories Licensing Corporation Parameter set for picture segmentation
US20120170648A1 (en) * 2011-01-05 2012-07-05 Qualcomm Incorporated Frame splitting in video coding
GB2488829A (en) * 2011-03-10 2012-09-12 Canon Kk Encoding and decoding image data
GB2488830B (en) * 2011-03-10 2015-07-29 Canon Kk Method and device for encoding image data and method and device for decoding image data
HUE060260T2 (hu) 2011-06-14 2023-02-28 Lg Electronics Inc Eljárás képinformációk kódolására és dekódolására
US8184069B1 (en) 2011-06-20 2012-05-22 Google Inc. Systems and methods for adaptive transmission of data
JP5760953B2 (ja) * 2011-10-31 2015-08-12 富士通株式会社 動画像復号装置、動画像符号化装置、動画像復号方法、及び動画像符号化方法
US20130170559A1 (en) * 2011-12-28 2013-07-04 Rovi Technologies Corporation Systems and methods for region of interest video processing
US10536726B2 (en) * 2012-02-24 2020-01-14 Apple Inc. Pixel patch collection for prediction in video coding system
EP2645713A1 (en) * 2012-03-30 2013-10-02 Alcatel Lucent Method and apparatus for encoding a selected spatial portion of a video stream
CN102647593B (zh) * 2012-04-18 2014-04-16 北京大学 一种avs帧内模式决策方法和装置
JP6045222B2 (ja) * 2012-06-28 2016-12-14 株式会社Nttドコモ 動画像予測復号装置、方法及びプログラム
JP5891975B2 (ja) 2012-07-02 2016-03-23 富士通株式会社 動画像符号化装置、動画像復号装置、動画像符号化方法および動画像復号方法
US9491457B2 (en) * 2012-09-28 2016-11-08 Qualcomm Incorporated Signaling of regions of interest and gradual decoding refresh in video coding
CN103796019B (zh) * 2012-11-05 2017-03-29 北京勤能通达科技有限公司 一种均衡码率编码方法
US9749627B2 (en) 2013-04-08 2017-08-29 Microsoft Technology Licensing, Llc Control data for motion-constrained tile set
GB2516224A (en) 2013-07-11 2015-01-21 Nokia Corp An apparatus, a method and a computer program for video coding and decoding
GB2516824A (en) 2013-07-23 2015-02-11 Nokia Corp An apparatus, a method and a computer program for video coding and decoding
KR102116985B1 (ko) 2013-08-16 2020-05-29 삼성전자 주식회사 비디오 인코딩을 위한 인트라 리프레쉬 방법
US11425395B2 (en) 2013-08-20 2022-08-23 Google Llc Encoding and decoding using tiling
US9432624B2 (en) * 2014-01-03 2016-08-30 Clearone Communications Hong Kong Ltd. Method for improving an MCU's performance using common properties of the H.264 codec standard
US20150264358A1 (en) * 2014-03-11 2015-09-17 Kabushiki Kaisha Toshiba Video transmitter, video transceiver system and video transmission method
FR3029333A1 (fr) * 2014-11-27 2016-06-03 Orange Procede de codage et decodage d'images, dispositif de codage et decodage et programmes d'ordinateur correspondants
CN105872539B (zh) * 2015-02-08 2020-01-14 同济大学 图像编码方法和装置及图像解码方法和装置
WO2016124154A1 (zh) * 2015-02-08 2016-08-11 同济大学 图像编码方法和装置及图像解码方法和装置
CN104883572B (zh) * 2015-05-21 2018-04-27 浙江宇视科技有限公司 一种基于h.264或h.265的前背景分离编码设备和方法
EP3185553A1 (en) * 2015-12-21 2017-06-28 Thomson Licensing Apparatus, system and method of video compression using smart coding tree unit scanning and corresponding computer program and medium
KR102301352B1 (ko) 2016-02-09 2021-09-14 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 효율적인 감소성 또는 효율적인 랜덤 액세스를 허용하는 픽처/비디오 데이터 스트림들에 대한 개념
US10499065B2 (en) 2016-07-21 2019-12-03 Samsung Display Co. Ltd. System and method for sending video data over a wireless channel
US10325166B2 (en) * 2017-04-13 2019-06-18 Here Global B.V. Method, apparatus, and system for a parametric representation of signs
EP3836541A4 (en) * 2018-08-06 2022-06-22 Sharp Kabushiki Kaisha MOVING PICTURE DECODING APPARATUS AND MOVING PICTURE CODING APPARATUS
JP7248735B2 (ja) * 2018-09-10 2023-03-29 ルミレッズ ホールディング ベーフェー 高速画像リフレッシュシステム
US11083055B2 (en) 2018-09-10 2021-08-03 Lumileds Llc High speed image refresh system
EP3918789A1 (en) * 2019-02-01 2021-12-08 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Video codec allowing sub-picture or region wise random access and concept for video composition using the same
US11049290B2 (en) * 2019-03-21 2021-06-29 Adobe Inc. Generation of a sequence of textures for video delivery
WO2020188149A1 (en) * 2019-03-21 2020-09-24 Nokia Technologies Oy A method, an apparatus and a computer program product for video encoding and video decoding
WO2021029987A1 (en) * 2019-08-09 2021-02-18 Futurewei Technologies, Inc. External decoding refresh (edr) in video coding
KR20220044271A (ko) * 2019-08-10 2022-04-07 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 비디오 비트스트림들에서의 서브픽처 의존적 시그널링
WO2021058596A1 (en) * 2019-09-24 2021-04-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and data stream for gradual decoder refresh coding and scalable coding
KR102609308B1 (ko) 2019-10-02 2023-12-05 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 비디오 비트스트림에서의 서브픽처 시그널링을 위한 신택스
EP4032290A4 (en) 2019-10-18 2022-11-30 Beijing Bytedance Network Technology Co., Ltd. SYNTAX CONSTRAINTS IN REPORTING SUBPICTURE PARAMETER SETS

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5778143A (en) * 1993-01-13 1998-07-07 Hitachi America, Ltd. Method and apparatus for the selection of data for use in VTR trick playback operation in a system using progressive picture refresh
JP3086396B2 (ja) * 1995-03-10 2000-09-11 シャープ株式会社 画像符号化装置及び画像復号装置
US5568200A (en) * 1995-06-07 1996-10-22 Hitachi America, Ltd. Method and apparatus for improved video display of progressively refreshed coded video
KR100211916B1 (ko) * 1995-10-26 1999-08-02 김영환 물체 모양정보 부호화에서의 부호화타입과 모드의 결정방법
ES2191177T3 (es) * 1996-05-17 2003-09-01 Matsushita Electric Ind Co Ltd Decodificador de imagenes.
KR100215451B1 (ko) * 1996-05-29 1999-08-16 윤종용 임의형태 물체를 포함한 동화상의 부호화 및 복호화시스템
JP3570863B2 (ja) * 1997-08-05 2004-09-29 三菱電機株式会社 動画像復号化装置および動画像復号化方法
US6304295B1 (en) * 1998-09-18 2001-10-16 Sarnoff Corporation Region-based refresh strategy for video compression
US6987805B1 (en) * 1999-09-24 2006-01-17 Lsi Logic Corporation Macroblock level intrarefresh technique for encoded video
EP1395948A2 (en) * 1999-11-29 2004-03-10 Koninklijke Philips Electronics N.V. Method for coding and decoding multimedia data
US6700933B1 (en) * 2000-02-15 2004-03-02 Microsoft Corporation System and method with advance predicted bit-plane coding for progressive fine-granularity scalable (PFGS) video coding
GB2366464A (en) 2000-08-14 2002-03-06 Nokia Mobile Phones Ltd Video coding using intra and inter coding on the same data

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8428131B2 (en) 2007-09-18 2013-04-23 Fujitsu Limited Video encoder and decoder using region based coding and decoding techniques with sequential refresh
JP5437807B2 (ja) * 2007-09-18 2014-03-12 富士通株式会社 動画像符号化装置および動画像復号装置
JP2014511641A (ja) * 2011-03-09 2014-05-15 シーメンス アクチエンゲゼルシヤフト デジタル画像のシーケンスを符号化する方法
US9872017B2 (en) 2011-03-09 2018-01-16 Siemens Aktiengesellschaft Method for coding a sequence of digitized images
JP2013153387A (ja) * 2012-01-26 2013-08-08 Nippon Telegr & Teleph Corp <Ntt> 動画像符号化方法,動画像符号化装置および動画像符号化プログラム

Also Published As

Publication number Publication date
US20070110154A1 (en) 2007-05-17
CN1774934A (zh) 2006-05-17
KR20060065740A (ko) 2006-06-14
FI114679B (fi) 2004-11-30
US7760802B2 (en) 2010-07-20
US20040008766A1 (en) 2004-01-15
US20060115001A1 (en) 2006-06-01
CN1829329B (zh) 2013-03-20
EP1500280A1 (en) 2005-01-26
AU2003229800A1 (en) 2003-11-17
EP1672930A2 (en) 2006-06-21
EP1672930A3 (en) 2010-11-03
JP2010136428A (ja) 2010-06-17
KR20040106409A (ko) 2004-12-17
JP4468800B2 (ja) 2010-05-26
EP1500280B1 (en) 2013-05-22
US7826531B2 (en) 2010-11-02
CN1829329A (zh) 2006-09-06
CA2483293C (en) 2012-11-27
KR100972403B1 (ko) 2010-07-27
US7302001B2 (en) 2007-11-27
CN100521793C (zh) 2009-07-29
CA2483293A1 (en) 2003-11-13
FI20020810A (fi) 2003-10-30
FI20020810A0 (fi) 2002-04-29
KR100973518B1 (ko) 2010-08-03
JP2006246524A (ja) 2006-09-14
BR0309713A (pt) 2005-02-15
WO2003094530A1 (en) 2003-11-13

Similar Documents

Publication Publication Date Title
JP4468800B2 (ja) ビデオ符号化におけるランダム・アクセス・ポイント
JP4485796B2 (ja) 画面がスライスに分割される前景および背景のビデオ符号化および復号
JP5007012B2 (ja) ビデオ符号化方法
US6611561B1 (en) Video coding
US7916796B2 (en) Region clustering based error concealment for video data
JP2001285876A (ja) 画像符号化装置とその方法、ビデオカメラ、画像記録装置、画像伝送装置
JP2004328634A (ja) 画像復号化装置及び方法
JP4203036B2 (ja) 動画像復号装置とこの装置を備えた移動体端末
US6859500B2 (en) Run-length coding of non-coded macroblocks
JP2004527981A (ja) 予測タイプの選択によるビデオデータブロックのイントラ符号化
JP3818819B2 (ja) 画像符号化方式変換装置、画像符号化方式変換方法および記録媒体
CA2542026C (en) Indicating regions within a picture
JP4043406B2 (ja) 画像復号方法と装置、およびそれらを利用可能なテレビジョン受信装置
JP5147546B2 (ja) 映像符号化装置及び映像復号化装置
JP3147636B2 (ja) ビデオデータ配列方法並びにその符号化装置及び復号化装置
AU2002243161B9 (en) Run-length coding of non-coded macroblocks
JP2003224850A (ja) 映像中継システム並びに符号化情報指示装置及びそのプログラム並びに符号化映像伝送装置及びそのプログラム
JP2002142225A (ja) 画像信号符号化装置
JP2003143551A (ja) ディジタル映像信号記録装置および再生装置
JPH1079946A (ja) 画像符号化装置および画像復号化装置
JP2002165223A (ja) 画像信号符号化装置
JP2002165219A (ja) 画像信号復号装置及び画像信号復号・符号化装置
AU2002243161A1 (en) Run-length coding of non-coded macroblocks

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060428

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090602

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090902

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090929

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091224

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100126

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100225

R150 Certificate of patent or registration of utility model

Ref document number: 4468800

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130305

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130305

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140305

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term