JP2006279971A - ビデオ符号化における画像フレームのグループ化 - Google Patents

ビデオ符号化における画像フレームのグループ化 Download PDF

Info

Publication number
JP2006279971A
JP2006279971A JP2006120296A JP2006120296A JP2006279971A JP 2006279971 A JP2006279971 A JP 2006279971A JP 2006120296 A JP2006120296 A JP 2006120296A JP 2006120296 A JP2006120296 A JP 2006120296A JP 2006279971 A JP2006279971 A JP 2006279971A
Authority
JP
Japan
Prior art keywords
image frames
image
frame
numbering
video sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006120296A
Other languages
English (en)
Other versions
JP4819562B2 (ja
Inventor
Miska Hannuksela
ハンウクセラ,ミスカ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Oyj
Original Assignee
Nokia Oyj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=27614673&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP2006279971(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Priority claimed from FI20020127A external-priority patent/FI114527B/fi
Application filed by Nokia Oyj filed Critical Nokia Oyj
Publication of JP2006279971A publication Critical patent/JP2006279971A/ja
Application granted granted Critical
Publication of JP4819562B2 publication Critical patent/JP4819562B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/114Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/587Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/65Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder
    • H04N19/895Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder in combination with error concealment

Abstract

【課題】圧縮ビデオシーケンスの復号において、エンゴータが意図的に除去した画像フレームをデコーダが復号時に考慮できるようにする方法及び装置を提供する。
【解決手段】圧縮ビデオシーケンスの復号において、画像フレームを復号に関連してバッファメモリに格納する。ビデオシーケンスは画像フレームの番号付けにおける不連続に関する指示を含み、この指示をビデオシーケンスから復号する。次に、この指示に応答して、上記のバッファメモリを、画像フレームの番号付けにおける不連続に対応する数の画像フレームを与えるように構成し、このバッファメモリによって与えられる画像フレームを復号プロセスにおいて使用する。上記の指示は、ビデオシーケンスの画像フレームの番号付けにおける不連続が意図的であることを知らせ、またバッファメモリによって与えられる数の画像フレームが、デコーダに存在しない画像フレームの代わりに使用される。
【選択図】図2

Description

本発明は、マルチメディアファイルのグループ化、特にビデオファイルのグループ化、そして特に、ストリーミングとの関連におけるそのグループ化に関する。
「ストリーミング(streaming)」なる用語は、データ(通例、オーディオおよびビデオファイルなどのマルチメディアデータ)を同時に送信および再生することに関するものであり、受信側(recipient)は、送信されるべきデータの全てが受信される前に、既にデータの再生を開始できるものである。マルチメディアデータストリーミングシステムは、ストリーミングサーバと、受信側がストリーミングサーバに対する(通例、通信ネットワークを通じての)データ接続を設定するために用いる端末装置とを備える。ストリーミングサーバ(streaming server)から、受信側は、格納されているかあるいはリアルタイムのマルチメディアデータを検索すると、そのマルチメディアデータの再生が、最も有利には、データの送信とほとんどリアルタイムで、端末に含まれたストリーミングアプリケーション(streaming application)により開始可能となる。
ストリーミングサーバの観点からすると、ストリーミングは、端末に対して、通常のストリーミングとして、あるいは、プログレッシブダウンロード(progressive downloading)として実行することができる。通常のストリーミングでは、マルチメディアデータ及び/又はデータの内容の送信は、送信のビットレートが端末装置の再生速度に実質的に相当していることを確認することにより制御される、あるいは、送信に用いられる通信ネットワークにより、データ転送にボトルネックが生じているならば、送信のビットレートが通信ネットワークにて利用可能な帯域幅に実質的に相当していることを確認することにより制御される。プログレッシブダウンロードでは、マルチメディアデータ及び/又はデータの内容の送信は、必ずしも干渉されなければならないものではなく、マルチメディアファイルは、それ自体、受信側に対して、通例転送プロトコルフロー制御(transfer protocol flow control)を用いることによって送信される。そのとき、端末は、サーバから送信されたデータの正確なコピーを受信し、格納及び再生し、そして、そのコピーは、通信ネットワークを通じてストリーミングを再開する必要なしに、端末上で後で再生可能である。しかしながら、端末内に格納されているマルチメディアファイルは、通例、非常に大きく、それを端末へ転送するには時間がかかり、また、かなりの量の記憶容量を必要とし、このことが、通常のストリーミングの方が好まれることが多い理由である。
マルチメディアファイル内のビデオファイルには、非常に多くの静止画像フレームが含まれており、それらは、連続して高速に表示されて(通例、毎秒15から30フレーム)、動画として感じられるようになる。通例、画像フレームは、実質的に変更されないままの画像情報により決定されるいくつもの静止した背景オブジェクト(background object)と、ある程度変化する画像情報により決定される若干の動くオブジェクトとを含んでいる。連続的に表示される画像フレームからなる情報は、通例、ほとんど類似している、すなわち、連続した画像フレームにはかなりの冗長性がある。ビデオフレームに現れるこの冗長性は、空間的、時間的、及びスペクトル的な冗長性に分けられる。空間的冗長性(spatial redundancy)は近接した画素の相関のことであり、時間的冗長性(temporal redundancy)は連続したフレームにおける特定の画像オブジェクト内に生じる変化のことであり、スペクトル的冗長性(spectral redundancy)は画像フレーム内の異った色成分の相関のことである。
ビデオファイル内のデータ量を減らすために、画像データは、画像フレームにおける冗長な情報を量を減少させることにより、小さな形式に圧縮可能である。なお、現在用いられているほとんどのビデオエンコーダは、符号化の際に、ビデオ情報における重要度の低い画像フレーム部分の画像品質を劣化させるものである。さらに、多くのビデオ符号化方法では、画像データから符号化されたビットストリームの冗長性を、VLC(可変長符号化)として知られる効率的で損失のない圧縮パラメータの符号化により、減少させることができる。
また、多くのビデオ符号方法は、上述の連続した画像フレームの時間的冗長性を利用している。その場合に、動き補償時間的予測(motion-compensated temporal prediction)として知られる方法が用いられる、すなわち、ビデオシーケンス(video sequence)内の画像フレームのいくつか(通例、ほとんど)の内容は、連続した画像フレームにおける特定のオブジェクト又は領域における変化を追跡することにより、そのシーケンス内の他のフレームから予測される。ビデオシーケンスには、常に、その画像情報が動き補償時間的予測を用いて決定されなかったいくつかの圧縮画像フレームが含まれる。このようなフレームをINTRAフレーム又はIフレームと称する。これに対応して、先行する画像フレームから予測される動き補償されたビデオシーケンス画像フレームを、INTERフレーム又はPフレーム(Predicted)と称する。Pフレームの画像情報は、1つのIフレームと、場合によって1つ又はそれ以上の先行して符号化されたPフレームとを用いて決定される。あるフレームが失われた場合、それに依存したフレームは、もはや正確に復号することができない。
通例、Iフレームは、ピクチャグループ(GOP:Group of Pictures)として規定されたビデオシーケンスを起動し、そのPフレームは、問題となっているGOPのIフレーム及び先行するPフレームに基づいてのみ決定可能である。次のIフレームは、新規のピクチャグループGOPを開始し、従ってそれに含まれる画像情報は、先行するGOPのフレームに基づいて決定することができない。換言すると、ピクチャグループは、時間的に重複しておらず、各ピクチャグループは個別に符号化可能である。さらに、多くのビデオ圧縮方法は、双方向に予測されるBフレーム(Bi-directional)を用いており、このBフレームは、1つのピクチャグループGOP内の2つのアンカーフレーム(anchor frame)(I及びPフレーム、又は2つのPフレーム)間に設定され、Bフレームの画像情報は、先行するアンカーフレームとそのBフレームに続くものの両者から予測される。従って、Bフレームは、Pフレームよりも高品質の画像情報を提供するが、通例、それらはアンカーフレームとしては使用されないので、ビデオシーケンスからそれらが削除されても、後続の画像品質を劣化させることはない。しかしながら、Bフレームをもアンカーフレームとして使用することを妨げるものはなく、その場合には、Bフレームを、それに依存したフレームの品質を劣化させることなくビデオシーケンスから削除することができなくなるだけである。
各ビデオフレームは、矩形画像領域の全画素の色成分(Y,U,V等)を含むマクロブロック(macroblock)として知られるものに分割することができる。より具体的には、マクロブロックは、色成分毎に少なくとも1つのブロックから構成され、各ブロックは、該当する画像領域内に1つの色レベルの色値(Y,U又はV等)を含む。このブロックの空間解像度(spatial resolution)は、マクロブロックのそれとは異なってもよく、例えば、U及びV成分は、Y要素の半分の解像度のみを用いて表示されてもよい。マクロブロックは、さらにスライス(slice)にグループ化可能であり、例えば、スライスは、通例、画像の走査順に選択されるマクロブロックのグループである。通例、時間的予測は、ビデオ符号化方法において、画像フレーム別にではなく、ブロック又はマクロブロック別に実行される。
ビデオファイルの柔軟なストリーミングを可能とするために、多くのビデオ符号化システムは、スケーラブル符号化(scalable coding)を採用しており、スケーラブル符号化では、ビデオシーケンスのいくつかの要素又は要素グループが、そのビデオシーケンスの他の部分の再構成(reconstruction)に影響することなく除去可能である。スケーラビリティ(scalability)は、通例、画像フレームをいくつもの階層レイヤ(hierarchical layer)にグループ化することにより実行される。ベースレイヤ(base layer)の画像フレームに符号化された画像フレームは、実質的に、受信端におけるビデオ情報の復号に必須であるもののみを含む。このように、各ピクチャグループGOPのベースレイヤは、1つのIフレームと、必要な数のPフレームとを含んでいる。1つ又はそれ以上のエンハンスメントレイヤ(enhancement layer)が、ベースレイヤの下に決めることができ、その各レイヤは、上位レイヤと比較して、ビデオ符号化の品質を向上させている。このように、エンハンスメントレイヤは、1つ又はそれ以上の上位レイヤの画像から動き補償(motion compensation)に基づいて予測されたP又はBフレームを含んでいる。通例、このフレームは、等差級数に従って付番される。
ストリーミングにおいて、送信ビットレートは、使用される帯域幅若しくは受信側の最大復号(maximum decoding)あるいはビットレート値に基づいて、制御可能でなければならない。ビットレートは、ストリーミングサーバにて、あるいは、インターネットルータあるいは移動通信ネットワークの基地局のような通信ネットワークのどれかの要素にて制御可能である。ストリーミングサーバがビットレートを制御するための最も簡単な手段は、情報内容が大きいBフレームを送信から除外することである。さらに、ストリーミングサーバは、ビデオストリームにて送信されるべきスケーラビリティレイヤ(scalability layer)の数を決めてもよく、それにより、スケーラビリティレイヤの数は、新規のピクチャグループGOPが開始する度にいつも変更することができる。また、様々なビデオシーケンス符号化方法を使用することもできる。それに対応して、Bフレームは、エンハンスメントレイヤの他のPフレームとともに、通信ネットワーク要素におけるビットストリームから除去することができる。
上述の仕組みには、いくつもの欠点がある。ITU−T(International Telecommunications Union, Telecommunications Standardization Sector:国際電気通信連合電気通信標準化セクタ)規格H.263による符号化のような多くの符号化方法は、参照ピクチャ選択と呼ばれる処理(procedure called reference picture selection)に通じている。参照ピクチャ選択では、P画像の少なくとも一部は、その時間領域における直前のP画像以外の少なくとも1つの画像から予測されている。選択された参照画像(reference image)は、符号化されたビットストリーム又はビットストリームのヘッダフィールドにおいて、画像、画像セグメント(スライス、マクロブロックのグループ等)、マクロブロック、又はブロック別に、信号伝送される。参照ピクチャ選択は、時間的に後続の符号化されるべき画像からも予測可能なように、一般化可能である。さらに、参照ピクチャ選択は、Bフレームを含む、全ての時間的に予測されるフレームタイプに対応するように、一般化可能である。ピクチャグループGOPを開始するI画像に先行する少なくとも1つの画像を、参照画像として選択することもできるので、参照ピクチャ選択を用いるピクチャグループは、必ずしも独立して復号可能ではない。さらに、検出されるべき様々な画像グループ間のいかなる依存性をも許容できるように、ビデオシーケンスは、長時間に亘って、復号、パーシング(parsed)、及びバッファ化されなければならないので、ストリーミングサーバ又はネットワーク要素におけるスケーラビリティ又は符号化方法の調整は難しくなる。
さらなる問題は、別のビデオシーケンスの途中にビデオシーケンスを挿入することに関するものであり、これは、一般に画像の番号付け(numbering)に不連続を引き起こす。ビデオシーケンス画像の番号付けは一般に画像フレームの喪失を検出するために使用される。しかしながら、あるビデオシーケンスにコマーシャルなど別個のビデオシーケンスが挿入される場合、この別個のビデオシーケンスには一般に別個の画像の番号付けが与えられており、この番号付けは元のビデオシーケンスの昇順画像番号付け(ascending image numbering)と整合しない。従って、受信端末は逸脱した画像番号付けを画像フレーム喪失の信号として解釈して、喪失と疑われる画像フレームを再構成するかあるいはその再送信を要求するための不必要な動作を開始する場合がある。
同様の問題が、エンコーダ及びデコーダにおいて参照ピクチャ(reference picture)をバッファに記憶しインデックスを付すときに生じる。このインデックス付与(indexing)の一部として、エンコーダは、残りのどの画像フレームの時間的予測プロセス(temporal prediction process)のための参照画像フレーム(reference image frame)としても不必要な複数の画像フレームを意図的に除去する場合がある。この場合にも、デコーダにこの除去の理由を知らせるプロセスがない。例えば、複数の画像フレームが除去される場合、受信端末はこの意図的な除去をプロトコルエラーとして不必要に解釈する場合がある。
従って、本発明の目的は、上述の問題により生じる欠点を減らすことが可能な方法及びその方法を実行する装置を提供することであり、特にエンコーダが意図的に除去した画像フレームをデコーダが考慮に入れることができるようにする、改良された方法及びこの方法を実施する装置を提供することである。
本発明の様々な態様は、独立請求項において記述されることを特徴とする、方法、ビデオエンコーダ、ビデオデコーダ、ビデオ信号、ビデオシーケンスのビットレートを調整するための装置、望ましくはストリーミングシステム要素、及びコンピュータプログラムを含む。
本発明の好適な実施形態は従属請求項において開示されている。
本発明は、圧縮ビデオシーケンスを復号する場合において、画像フレームはその復号に関連してバッファメモリに入れられるという考えに基づいている。ビデオシーケンスは画像フレームの番号付けにおける少なくとも1つの不連続に関する指示を含み、この指示は上記のビデオシーケンスから復号される。次に、この指示に応答して、上記のバッファメモリは画像フレームの番号付けにおける不連続に対応する数の画像フレームを与えるように構成され、このバッファメモリの中の画像フレームは、上記の復号プロセスにおいて使用される。前記の指示は、ビデオシーケンスの画像フレームの番号付けにおける少なくとも1つの不連続が意図的であることを知らせ、そして上記のバッファメモリにおいて生成された上記の数の画像フレームが、デコーダに存在しない画像フレームの代わりに使用されることが好ましい。この欠落した画像フレームが、画像フレームの番号付けにおいて不連続を生じさせる。
1つの実施形態に従えば、上記のバッファメモリが画像フレームの番号付けにおける不連続に対応する数の画像フレームを与えるように構成された後、当該ビデオシーケンスに含まれる画像フレームは、正しい画像フレーム番号から引き続きバッファメモリに入れられる。
1つの実施形態に従えば、上記の画像フレームの番号付けにおける不連続に対応する数のつなぎフレーム(filler frame)がバッファメモリに入れられる。このつなぎフレームは、そのつなぎフレームが実際のビデオシーケンスに属さないことを示す識別子によって指定されることが望ましい。
1つの実施形態に従えば、上記の画像フレームの番号付けにおける不連続に対応する数の画像フレームを与えるようにバッファメモリを構成するステップは、メモリ指示(memory indication)によって行われ、これによってバッファメモリにはデータが入れられない。
本発明の手順の利点は、画像フレーム番号付けのギャップは意図的であるという情報をデコーダに与え、それによってデコーダが不必要なエラー修正動作を開始しないことである。さらなる利点は、エンコーダ及びデコーダのバッファメモリを同期して維持することができ、それによって、参照ピクチャ選択のプロセスを淀みなく行えることである。
以下、本発明について、その好適な実施形態に関連して、添付の図面を参照して説明する。
以下に、汎用のマルチメディアデータストリーミングシステムについて開示するが、その基本原理は、いかなる通信システムに関連しても適用可能である。本発明について、ここでは、最も好ましくはマルチメディアデータがパケット交換データプロトコル(packet-switched data protocol)を用いたIPネットワーク等の通信ネットワークを通じて送信されるストリーミングシステムに関して特に述べるが、本発明は、固定電話ネットワークPSTN/ISDN(Public Switched Telephone Network/Integrated Service Digital Network:公衆交換電話網/総合デジタル通信網)や移動通信ネットワークPLMN(Public Land Mobile Network)等の回線交換ネットワーク(circuit-switched network)においても、同様に効果的に実施可能である。さらに、本発明は、通常のストリーミング及びプログレッシブダウンロードの双方の形式でのマルチメディアファイルのストリーミングに、また、例えば、ビデオ通話(video call)を実行するために、適用可能である。
また、本発明は、ここでは、ストリーミングシステムに関して特に記述されており、それらにおいても有利に適用可能であるものの、本発明は、ストリーミングシステムだけに限定されるものではなく、復号されるべきビデオファイルがどのようにダウンロードされ、また、それがどこからダウンロードされるかに関わらず、いかなるビデオ再生システムにも適用可能である。従って、本発明は、例えば、DVDディスク又は他の何らかのコンピュータの記憶担体(memory carrier)からダウンロードされるべきビデオファイルの再生に、例えば、ビデオ再生に利用可能な様々な処理能力に関連して、適用可能である。特に、本発明は、帯域幅の制限が課せられた通信システムに通例用いられる低ビットレートの種々のビデオ符号化に適用可能である。例として、ITU−T規格H.263に規定されたシステム、及び、H.26L(後にH.264となるかもしれない)に規定されているシステムがある。これらに関連して、本発明は、移動局に適用可能であり、例えば、その場合には、ビデオ再生は、移動局がビデオ再生以外の他のアプリケーションを実行するためにも使用されているときに、転送容量又はチャネル品質の変更、及び、現在利用可能なプロセッサ能力(processor power)の双方を調整して行うことができる。
なお、説明を明確にするために、本発明は、画像フレームレベルでの画像フレーム符号化及び時間的予測を考慮して、以下に記述されることにも注意すべきである。しかしながら、実際には、符号化及び時間的予測は、通例、ブロック又はマクロブロックレベルで上述のように実行される。
図1を参照すると、典型的なマルチメディアストリーミングシステムが示されており、それは、本発明の方法を適用するのに好ましいシステムである。
通例、マルチメディアデータストリーミングシステムは、ビデオカメラ及びマイクロフォン、又は記憶担体内に格納されたビデオ画像若しくはコンピュータグラフィックファイル等の1つ又はそれ以上のマルチメディアソース(multimedia source)100を、備えている。様々なマルチメディアソース100から得られた生データは、エンコーダ102においてマルチメディアファイルに結合され、このエンコーダ102は編集ユニットと呼ぶこともできる。1つ又はそれ以上のマルチメディアソース100から到来した生データは、まず、エンコーダ102に含まれる取込手段(capturing means)104を用いて取り込まれ、この取込手段は、通例、様々なインターフェースカード、ドライバソフトウェア、又はカードの機能を制御するアプリケーションソフトウェアとして実施可能である。例えば、ビデオデータはビデオキャプチャカード(video capture card)及びそれに付属のソフトウェアを用いて取込むことができる。通例、取込手段104の出力は、非圧縮、あるいは僅かに圧縮されたデータフローであり、例えば、ビデオキャプチャカードに関する場合は、YUV4:2:0形式又はモーションJPEG画像形式の非圧縮ビデオフレームである。
エディタ106は、異ったメディアフロー(media flow)を相互にリンクさせて、ビデオと音声のフローを同期させて、所望の如く同時に再生させる。エディタ106はまた、例えば、フレームレート(frame rate)を半減させたり、空間解像度を低減させたりすることによって、ビデオフロー等の各メディアフローを編集する。同期しているものの独立している複数のメディアフローは、コンプレッサ108において圧縮され、そこでは、各メディアフローは、そのメディアフローに適したコンプレッサを用いて、個別に圧縮される。例えば、YUV4:2:0形式のビデオフレームは、ITU−T勧告H.263又はH.26Lに従った低いビットレートのビデオ符号化を用いて、圧縮することができる。通例、独立し、同期化され、かつ圧縮されたメディアフローは、マルチプレクサ110にてインターリーブ(interleave)され、エンコーダ102から得られる出力は、複数のメディアフローのデータを含むとともにマルチメディアファイルと呼ぶことができる、単一の均一なビットフロー(sigle, uniform bit flow)である。なお、マルチメディアファイルの形成は、複数のメディアフローを単一のファイルに多重化することを必ずしも必要としないが、ストリーミングサーバは、メディアフローを、それを送信する直前にインターリーブしてもよいことに注意すべきである。
マルチメディアファイルは、ストリーミングサーバ112へと転送され、従ってストリーミングサーバは、リアルタイムストリーミングとしてかあるいはプログレッシブダウンロードの形式で、ストリーミングを実施可能である。プログレッシブダウンロードでは、マルチメディアファイルは、まず、必要に応じて送信のためにそれを検索することができるサーバ112のメモリ内に格納される。リアルタイムストリーミングでは、エディタ102は、マルチメディアファイルの連続したマルチメディアフローをストリーミングサーバ112に送信し、サーバ112は、そのフローを、直接クライアント114へ送る。さらなる選択肢として、リアルタイムストリーミングはまた、マルチメディアファイルがサーバ112からアクセス可能な記憶域(storage)に格納され、そこから、リアルタイムストリーミングが駆動可能であり、また、マルチメディアファイルの連続したメディアフローが、必要に応じて開始されるように実施されてもよい。このような場合、エディタ102は、必ずしも何らかの手段によりストリーミングを制御する必要はない。ストリーミングサーバ112は、クライアント114の利用可能な帯域幅又は最大復号及び再生速度を考慮して、マルチメディアデータのトラフィック形成(traffic shaping)を実行し、ストリーミングサーバは、例えば、Bフレームを送信から除外したり、スケーラビリティレイヤの数を調整することにより、メディアフローのビットレートを調整することができる。さらに、ストリーミングサーバ112は、多重化されたメディアフローのヘッダフィールドを修正して、そのサイズを小さくし、マルチメディアデータを、使用される通信ネットワークにおける通信に適したデータパケットにカプセル化することができる。通例、クライアント114は、適切な制御プロトコルを用いて、サーバ112の動作を少なくともある程度は調整することができる。クライアント114は、少なくとも、所望のマルチメディアファイルがクライアントへの送信のために選択可能となるように、サーバ112を制御することができ、それに加えて、クライアントは、通例、マルチメディアファイルの送信を停止及び中断することができる。
クライアント114がマルチメディアファイルを受信しているとき、ファイルはまずデマルチプレクサ(demultiplexer)116へ供給され、デマルチプレクサ116は、マルチメディアファイルに含まれるマルチメディアフローを分離する。それから、分離し、圧縮されたメディアフローは、デコンプレッサ(decompressor)118へ供給される、そこにおいて、分離した各メディアフローは、個々の各メディアフローに適したデコンプレッサにより伸長(decompress)される。伸長されて再構成されたメディアフローは、再生ユニット120へ供給され、そこにおいて、メディアフローは、その同期データに従って正確な速度でレンダリングされ、表示手段(presentation means)124へ供給される。実際の表示手段124は、例えば、コンピュータ又は移動局のディスプレイ、及びスピーカ手段を含むことができる。クライアント114はまた、通例、エンドユーザが通例ユーザーインタフェースを介して制御可能な制御ユニット122であって、エンドユーザが与えた命令に基づいて、上述の制御プロトコルを通じてサーバの動作を制御するとともに、再生ユニット120の動作をも制御する制御ユニット122を備えている。
マルチメディアフィルのストリーミングサーバ112からクライアント114への転送は、通信ネットワークを通じて実行され、転送経路は、通例、複数の通信ネットワーク要素を含むということに注目すべきである。従って、ストリーミングサーバに関連して上述したのと少なくとも部分的には同様に、利用可能な帯域幅又はクライアント114の最大復号及び再生速度を考慮して、マルチメディアデータのトラフィック形成を実行することができる、少なくともいくつかのネットワーク要素が存在し得る。
以下に、本発明の好適な実施形態及び図2に示す実施例を参照して、スケーラブル符号化(scalable coding)について説明する。図2は、第1のフレーム200を有する圧縮ビデオシーケンスの一部を示し、このフレーム200はINTRAフレームすなわちIフレームであり、従って、このフレームの画像情報が動き補償時間的予測を用いずに決定される、独立して決定されるビデオフレームである。Iフレーム200は、第1のスケーラビリティレイヤ上に配置され、この第1のスケーラビリティレイヤをINTRAレイヤと呼ぶこともある。各スケーラビリティレイヤには、レイヤ番号等の固有の識別子が割り当てられる。従って、INTRAレイヤには、例えば番号0が与えられるか、あるいは、例えば文字等の他の何らかの英数字の識別子が与えられるか、あるいは、文字と数字の組み合わせが与えられる。
それに対応して、1つ又はそれ以上のビデオフレームのグループからなるサブシーケンスは、各スケーラビリティレイヤに対して決定され、1つのグループ内の画像の少なくとも1つ(通例、最初又は最後のもの)は、他の1つの、通例はより高位あるいは同じスケーラビリティレイヤのサブシーケンスのビデオフレームから少なくとも時間的に予測され、残りのビデオフレームは、同じサブシーケンスのビデオフレームのみからか、又は、場合によっては、前記の第2のサブシーケンスの1つ若しくはそれ以上のビデオフレームから、少なくとも時間的に予測される。サブシーケンスは、前記第2のサブシーケンス以外の他のサブシーケンスに関わらずに、独立して復号することができる。各スケーラビリティレイヤのサブシーケンスには、例えば、スケーラビリティレイヤの最初のサブシーケンスに与えられる、番号0で始まる連続番号付けを用いた固有の識別子が割り当てられる。Iフレーム200は、独立して決定され、受信時に独立して復号することもできるので、それはまた、他の画像ファイルに関係なく、ある意味で独立したサブシーケンスを形成する。
従って、本発明の本質的な側面は、各サブシーケンスをこのサブシーケンスが依存している複数のサブシーケンスによって、決定することである。言い換えると、あるサブシーケンスは、当該サブシーケンスの画像フレームを予測するのに直接用いられた全てのサブシーケンスについての情報を含んでいる。この情報は、ビデオシーケンスのビットストリームにおいて、好ましくは実際の画像情報からは独立して信号伝送され、従って、独立して復号されるべきであり、かつ残りの画像データの復号に影響を与えることなく除去可能であるビデオシーケンス部分を決定することは容易であるので、上記のビデオシーケンスの画像データは、調整可能であることが好ましい。
次に、各サブシーケンス内で、このサブシーケンスのビデオフレームには、例えば、そのサブシーケンスの最初のビデオフレームに与えられる、番号0で始まる連続番号付けを用いて、画像番号が与えられる。Iフレーム200はまた、独立したサブシーケンスを形成するので、その画像番号は0である。図2において、Iフレーム200は、タイプ(I)、サブシーケンス識別子、及びそのフレームの画像番号(0.0)を示している。
さらに、図2は、上記のINTRAレイヤの次のIフレーム202を示しており、このように、このフレームも、動き補償時間的予測を用いることなく決定された、独立して決定されたビデオフレームである。Iフレームの時間的送信周波数は、ビデオ符号化、画像情報内容、及び用いられるべき帯域幅に関連する多くの要因に依存し、またアプリケーション又はアプリケーション環境に依存して、Iフレームは、ビデオシーケンスにおいて、例えば0.5秒から10秒の間隔で送信される。Iフレーム202は、独立して復号可能であるので、それもまた独立したサブシーケンスを形成する。これは、INTRAレイヤにおける第2のサブシーケンスであるので、Iフレーム202のサブシーケンス識別子の連続番号付けは1である。さらに、Iフレーム202はまた、独立したサブシーケンスを形成する、すなわち、そのサブシーケンス内の唯1つのビデオフレームであるので、その画像番号は0である。このように、Iフレーム202は、識別子(I.1.0)で指定可能である。それに対応して、INTRAレイヤのその次の識別子は(I.2.0)、などである。その結果、画像情報が動き補償時間的予測を用いて決定されていない、独立して決定されたIフレームのみが、第1のスケーラビリティレイヤ、すなわちINTRAレイヤ内に符号化される。このサブシーケンスはまた、そのサブシーケンスが相互に識別可能であれば、他の種類の番号付け又は他の識別子を用いて決定することもできる。
次のスケーラビリティレイヤは、例えばレイヤ番号1を有し、ベースレイヤと呼ぶことができる、符号化され、動き補償されたINTERすなわちPフレームを含み、このフレームは、通例、先行する画像フレームのみから、すなわち、この場合には上位のINTRAレイヤのIフレームから、予測されるものである。図2に示すベースレイヤの第1のPフレーム204の画像情報は、INTRAレイヤのIフレーム200を用いて決定される。Pフレーム204は、上記のベースレイヤの第1のサブシーケンスを開始し、従って、Pフレーム204のサブシーケンス識別子は0である。さらに、Pフレーム204は、上記のベースレイヤにおける第1のサブシーケンスの第1の画像フレームであるので、Pフレーム204の画像番号は0である。このように、Pフレーム204は(P.0.0)にて識別可能である。
ベースレイヤの時間的に後続のPフレーム206は、先行のPフレーム204から予測される。このように、Pフレーム204と206は、同じサブシーケンスに属しており、これによってPフレーム206もサブシーケンス識別子0を受け取る。Pフレーム206は、サブシーケンス0における第2の画像フレームであるので、Pフレーム206の画像番号は1であり、Pフレーム206は、(P.0.1)で識別可能である。
ベースレイヤの次の、レイヤ番号2を有するスケーラビリティレイヤを、エンハンスメントレイヤ(enhancement layer)1と称する。このレイヤは、符号化され、動き補償され、先行する画像フレームのみから、この場合にはINTRAレイヤのIフレームかあるいはベースレイヤのPフレームから、予測されるPフレームを含む。図2は、エンハンスメントレイヤ1の第1の画像フレーム208及び第2の画像フレーム210を示し、これらは、いずれも、INTRAレイヤの第1の画像フレーム200からのみ予測される。Pフレーム208は、エンハンスメントレイヤ1の第1のサブシーケンスを開始し、このため、このPフレームのサブシーケンス識別子は0である。さらに、Pフレーム208は前記のサブシーケンスにおける第1かつ唯一の画像フレームであるので、Pフレーム208は画像番号0を受け取る。従って、Pフレーム208は、(P.0.0)で識別可能である。
第2の画像フレーム210もINTRAレイヤの第1の画像フレーム200のみから予測されるので、Pフレーム210は、エンハンスメントレイヤ1の第2のサブシーケンスを開始し、従って、Pフレーム210のサブシーケンス識別子は1である。Pフレーム210はサブシーケンスにおける第1の画像フレームであるので、Pフレーム210の画像番号は0である。従って、Pフレームは、(P.1.0)で識別可能である。エンハンスメントレイヤ1の時間的に後続のPフレーム212は先行するPフレーム210から予測される。このように、Pフレーム210と212は、同じサブシーケンスに属しているので、このPフレームも、サブシーケンス識別子1を受け取る。Pフレーム212は、サブシーケンス1における第2の画像フレームであるので、このPフレームは、画像番号1を受け取り、(P.1.1)で識別可能である。
エンハンスメントレイヤ1の時間的に第4の画像フレーム214は、上記のベースレイヤの第1の画像フレーム204から予測される。従って、Pフレーム214は、エンハンスメントレイヤ1の第3のサブシーケンスを開始するので、Pフレーム214は、サブシーケンス識別子2を受け取る。さらに、Pフレーム214は、そのサブシーケンスにおける第1かつ唯一の画像フレームであるので、Pフレーム214の画像番号は0である。従って、Pフレーム214は(P.2.0)で識別可能である。
また、エンハンスメントレイヤ1の時間的に第5の画像フレーム216は、ベースレイヤの第1の画像フレーム204から予測され、従って、Pフレーム216は、エンハンスメントレイヤ1の第4のサブシーケンスを開始し、Pフレーム216のサブシーケンス識別子は3である。さらに、Pフレーム216は、当該サブシーケンスにおける第1の画像フレームであるので、Pフレーム216の画像番号は0である。従って、Pフレーム216は(P.3.0)で識別可能である。エンハンスメントレイヤ1の時間的に後続のPフレーム218は、先行するPフレーム216から予測される。このように、Pフレーム216と218は、同じサブシーケンスに属しており、Pフレーム218のサブシーケンス識別子も3である。Pフレーム218は、サブシーケンス3における第2の画像フレームであるので、Pフレーム218の画像番号は1であり、Pフレーム218の識別子は(P.3.1)である。
説明を簡潔かつ明瞭にするために、上述の開示は、I及びPフレームのみに関している。しかしながら、本発明のスケーラブルビデオ符号化は、他の既知の画像フレームタイプ、上述のBフレーム及び少なくともSIフレーム、SPフレーム及びMHフレーム等を用いても実施可能であることが明らかであることは、当業者には理解されるであろう。SIフレームは、Iフレームに相当するが、SPフレームとともに、同一の画像が再構成されることを可能としている。SPフレームもまた、SIフレーム又は他のSPフレームとともに同一の画像が再構成されることを可能とする特定の符号化に従うPフレームである。通例、SPフレームは、ビデオシーケンスの中で、アクセスポイント又はスキャニングポイントが望まれているか、あるいは、ビデオストリームの符号化パラメータの変更が可能であるべき点に配置される。また、このフレームは、エラー補正や許容誤差を増大させることのためにも使用可能である。他の点では、SPフレームは、SP又はSI型の他のビデオフレームで置き換えられるように規定されていること以外は、先行するフレームから予測される通常のPフレームと同様であり、新規フレームの復号結果は、ビデオストリーム内にあった元のSPフレームの復号結果と同一である。言い換えれば、ビデオストリーム内にあったものを置き換えるために用いられる新規のSPフレームは、他のシーケンス又はビデオストリームから予測され、しかも再構成されたフレームは同一の内容を有する。SPフレームについては、例えば、本出願人の以前の出願であるPCT/FI02/00004に記載されている。
Bフレームと同様、動き補償予測に基づくMH(Multi Hypothesis)フレームのマクロブロックは、他の2つのフレームから予測される。但し、これらのフレームは、必ずしもMHフレームに隣接して配置される必要はない。より正確には、予測されたマクロブロックは、他の2つのフレームの2つのマクロブロックの平均として算出される。2つのフレームの代わりに、MHフレームのマクロブロックは当然、他の1つのフレームから予測することもできる。参照画像(reference image)は、マクロブロックに応じて変更されてもよく、言い換えれば、1つの同じ画像内の全てのマクロブロックが、必ずしも同じフレームを用いて予測される必要はない。
従って、サブシーケンスは、ビデオシーケンスにおける特定の時間期間をカバーする。同じレイヤ又は異なるレイヤのサブシーケンスは、部分的に又は完全に重複してもよい。同じレイヤ上に時間的に重複した画像フレームがある場合は、そのフレームは、同じ画像内容の代替的な表現として解釈されるので、画像表示のいかなるモードでも使用可能である。他方で、異なるレイヤ上に時間的に重複した画像フレームがある場合は、それらは、同じ画像内容の異なる表示を形成するので、表示は、画像品質において異なる、すなわち、画像の品質は、低位のレイヤほど良くなる。
図2を参照する上記の開示内容は、本発明の好適な実施形態によるスケーラブル符号化構成及び階層的構造及び画像フレームの番号付けについて説明している。本実施形態では、INTRAレイヤはIフレームのみを含み、ベースレイヤは、INTRAレイヤから受け取った情報を用いて復号することのみ可能である。それに対応して、エンハンスメントレイヤ1の復号には、通例、ベースレイヤ及びINTRAレイヤの双方からの情報が必要である。
スケーラビリティレイヤの数は、上記のように3つに限定されるものではなく、充分なスケーラビリティをもたらすのに必要と考えられる任意の数のエンハンスメントレイヤを使用することができる。それ故、エンハンスメントレイヤ2のレイヤ番号は4であり、エンハンスメントレイヤ3のレイヤ番号は5である、などである。上記実施例における画像フレームのいくつかには、同一の識別子が与えられているので(例えば画像フレーム204,208の双方の識別子は(P.0.0))、レイヤ番号を識別子に含めることにより、各画像フレームは一意的に識別され、同時に、各画像フレームの他の画像フレームに対する依存性が決定されることが望ましい。このように、各画像フレームは、一意的に識別され、例えば、画像フレーム204の識別子は、(P.1.0.0)あるいは単に(1.0.0)、そしてそれに対して、画像208の識別子は、(P.2.0.0)又は(2.0.0)である。
本発明の好適な実施形態によると、参照画像フレームの番号は、特定の予め定められた英数字列、例えば、0と255の間の整数として、決定される。パラメータ値が当該英数字列の最大値N(例えば255)に達した場合、パラメータ値の決定は、その最初から、すなわち、文字列の最小値(例えば0)から始まる。従って、画像フレームは、同じ画像番号が再び使用される点までは、特定のサブシーケンス内で一意的に識別される。また、サブシーケンスの識別子は、特定の予め定められた等差級数に従って決定可能である。サブシーケンス識別子の値が、その級数の最大値に達したとき、級数の最初から識別子の決定が再開する。但し、サブシーケンスに対して、未だ使用中(同じレイヤ内で)の識別子を割り当てることはできない。また、使用中の級数は、算術的にではない他の方法で決定されてもよい。一代替例は、ランダムなサブシーケンス識別子を、割り当てられた識別子は再使用されないことを考慮して割り当てることである。
ユーザがビデオシーケンスの途中でビデオファイルの閲覧を開始したい場合に、画像フレームの付番に問題が生じる。このような状況は、例えば、ユーザが、ローカルに格納されたビデオファイルを逆若しくは順方向に閲覧したい場合、あるいは、ある特定の点にてストリーミングファイルを閲覧したい場合や、ユーザが、ランダムな点からストリーミングファイルの再生を開始する場合、又は、再生されるべきビデオファイルに、再生を中断したり、あるいはエラー後の点から再生が再開される必要があるエラーが含まれていることが検出された場合に発生する。ビデオファイルの閲覧が以前の閲覧後のランダムな位置から再開される場合、通例、画像の付番に不連続が生じる。デコーダは、通例、これを画像フレームの意図しない喪失と解釈して、喪失したと疑われる画像フレームを不必要に再構成しようと試みることになる。
本発明の好適な実施形態によると、このことは、デコーダにおいて、独立して復号可能なピクチャグループGOP中に、ビデオファイルのランダムな点で開始される開始画像(initiation image)を定義することにより回避可能であり、この開始画像の番号は0に設定される。従って、この独立して復号可能な画像グループは、INTRAレイヤのサブシーケンスであることが可能で、例えば、この場合、Iフレームが開始画像として使用されるか、あるいは、ベースレイヤから始まるスケーリングが用いられる場合は、上記の独立して復号可能な画像グループは、ベースレイヤのサブシーケンスであり、この場合、このサブシーケンスの第1の画像フレーム、通例Iフレーム、が、通常開始画像として用いられる。従って、ランダムな点で開始されると、デコーダは、独立して復号可能なサブシーケンスの第1の画像フレーム、好ましくはIフレーム、の識別子を、ゼロに設定することが望ましい。復号されるべきサブシーケンスはまた、識別子がゼロである(例えば上述の英数字列が最初から開始する)他の画像フレームをも含むので、そのサブシーケンスの始まり、すなわち、その最初の画像フレームは、例えば、その画像フレームのスライスのヘッダフィールドに追加された独立したフラグにより、デコーダに指示することができる。これにより、デコーダは、画像番号を正確に解釈可能となり、上記のサブシーケンスをビデオシーケンス画像フレームから起動する正確な画像フレームを検出可能となる。
上述の付番システムは、本発明の一意的な画像フレームがどのように実施されて画像フレーム間の相互依存性が同時に示されるかについて、1つの例を提供しているのみである。しかしながら、ITU−T規格H.263及びH.26Lによるビデオ符号化方法等の、本発明の方法が適用され得るビデオ符号化方法は、符号テーブル(code table)を用いており、これはまた可変長符号(variable length code)を用いている。レイヤ番号の符号化に可変長符号が用いられる場合は、例えば、符号ワードインデックス(code word index)が低いほど、すなわち、レイヤ番号が小さいほど、符号ワードが短くなることを意味する。実際には、本発明のスケーラブルな符号化は、ほとんどの場合、ベースレイヤがINTRAレイヤよりも著しく多くの画像フレームからなるような場合に用いられることになる。このことにより、INTRAレイヤ上よりもベースレイヤ上において、より低い指数、すなわち、より小さいレイヤ番号を使用することが正当化される。これは、符号化されたビデオデータの量がそれによって有利に低減されるからである。従って、INTRAレイヤにはレイヤ番号1が割り当てられ、ベースレイヤにはレイヤ番号0が割り当てられることが望ましい。その代わりに、ベースレイヤ番号を符号化するためにコードを、INTRAレイヤ番号よりももっと少ないビットを用いることにより形成可能であり、この場合、実際のレイヤ番号値は、生成されるコードの長さに関しては、関連しない。
さらに、本発明の第2の好適実施形態により、スケーラビリティレイヤの数が低く抑えられるべきである場合は、特に第1のスケーラビリティレイヤは、INTRAレイヤとベースレイヤの双方を含むように符号化可能である。符号化の階層性(coding hierarchy)の観点からすると、このことを構想するための最も簡単な方法は、INTRAレイヤを全体的に削除し、また、ベースレイヤとして、独立して規定されたIフレームで、その画像情報が動き補償時間的予測を用いて決定されなかったもの、及び先行するフレームから予測される画像フレームで、この場合の画像フレームは同じレイヤのIフレームから予測される動き補償されたPフレームであるものの双方からなる符号化されたフレームを有するベースレイヤを提供することである。従って、レイヤ番号0は、なおベースレイヤのために使用可能であり、また、エンハンスメントレイヤがビデオシーケンス内に符号化される場合は、エンハンスメントレイヤ1にはレイヤ番号1が割り当てられる。以下、このことについて、図3(a)及び図3(b)を参照して説明する。
図3(a)は、非スケーラブルビデオシーケンス構造を示し、ここで、全ての画像フレームが、同一のスケーラビリティレイヤ、すなわちベースレイヤ、上に配置される。ビデオシーケンスは、第1の画像フレーム300を含み、この第1の画像フレーム300は、Iフレーム(I.0.0)であり、従って第1のサブシーケンスを開始する。画像フレーム300は、そのサブシーケンスの第2の画像フレーム302、すなわち、Pフレーム(P.0.1)を予測するために用いられ、このPフレーム(P.0.1)は、次に上記のサブシーケンスの第3の画像フレーム304、すなわち、Pフレーム(P.0.2)を予測するために用いられ、このPフレーム(P.0.2)は今度は、次の画像フレーム306、すなわちPフレーム(P.0.3)を予測するのに用いられる。それから、上記のビデオシーケンスには、そこで符号化されたIフレーム(I.1.0)、すなわち、Iフレーム308が提供され、このIフレーム308は、上記のビデオシーケンスにおける第2のサブシーケンスを開始する。この種の非スケーラブル符号化は、例えば、使用されているアプリケーションがスケーラブル符号化の使用を許容しない場合や、その必要がない場合に、使用可能である。例えば、回路交換式テレビ電話(circuit-switched videophone)の用途では、チャネル帯域幅は一定のままであり、そのビデオシーケンスはリアルタイムで符号化されるので、通例、スケーラブル符号化の必要がない。
次に、図3(b)は、どのように、必要なときに、組合されたINTRAとベースレイヤにスケーラビリティが追加されるのかについての例を説明する。ここでも、ビデオシーケンスのベースレイヤは第1の画像フレーム310を含み、この第1の画像フレームはIフレーム(I.0.0)であり、上記のベースレイヤの第1のサブシーケンスを開始する。画像フレーム310は、このサブシーケンスの第2の画像フレーム312、すなわち、Pフレーム(P.0.1)を予測するのに用いられ、このPフレーム(P.0.1)は、次に上記のサブシーケンスの第3の画像フレーム314、すなわち、Pフレーム(P.0.2)を予測するのに用いられる。しかしながら、エンハンスメントレイヤ1もまた、このビデオシーケンス内に符号化され、それは、第1のサブシーケンスを含み、その第1かつ唯一の画像フレーム316はPフレーム(P.0.0)であり、これは、ベースレイヤの第1の画像フレームから予測される。エンハンスメントレイヤの第2のサブシーケンスの第1の画像フレーム318は、今度はベースレイヤの第2の画像フレーム312から予測されるので、このPフレームの識別子は(P.1.0)である。エンハンスメントレイヤの次の画像フレーム320は、同じレイヤの先行する画像フレーム318から再び予測されるので、それは同じサブシーケンスに属し、従って、その識別子は(P.1.1)である。
本発明の本実施形態では、ベースレイヤのサブシーケンスは他のベースレイヤのサブシーケンスに依存することができるが、上記のベースレイヤのサブシーケンスは、独立して復号可能である。ベースレイヤのサブシーケンスの復号には、ベースレイヤから及び/又はエンハンスメントレイヤ1の第2のサブシーケンスからの情報が必要であり、エンハンスメントレイヤ2のサブシーケンスの復号には、エンハンスメントレイヤ1から及び/又はエンハンスメントレイヤ2の第2のサブシーケンスからの情報が必要であるなどである。一実施形態によると、Iフレームは、ベースレイヤだけに限られるものではなく、より低位のエンハンスメントレイヤもIフレームを含み得る。
上記の実施形態の背景にある基本的な考えは、サブシーケンスには、それが依存する全てのサブシーケンスについての情報、すなわち、当該サブシーケンスの画像フレームの少なくとも1つを予測するために用いられた全てのサブシーケンスについての情報が含まれるというものである。しかしながら、一実施形態によると、サブシーケンスは、当該サブシーケンスに依存する全てのサブシーケンスについての情報、言いかえれば、少なくとも1つの画像フレームが当該サブシーケンスの少なくとも1つの画像フレームを用いて予測されたその全ての画像フレームについての情報を含むことも可能である。後者の場合、その依存性は、通例、時間的に前方向(forward)に決定されるので、画像フレームバッファは、後述のように符号化において有利に利用可能である。
上述の全ての実施形態では、画像フレームの番号付けは、サブシーケンス別(sub-sequence-specific)になっている、すなわち、新規のサブシーケンスは、常に最初から付番が開始される。従って、個々の画像フレームの識別子には、レイヤ番号、サブシーケンス識別子、及び画像フレーム番号が定められる必要がある。本発明の好適な一実施形態によると、画像フレームは、符号化順の連続した参照画像フレームが1つずつインクリメントされる番号で示される、連続的な番号付けを用いて独立して付番可能である。レイヤ番号及びサブシーケンス識別子に関しては、上述の付番手順が使用可能である。これにより、各画像フレームは、必要であればレイヤ番号及びサブシーケンス識別子を使用することなく、一意的に識別可能となる。
このことは、図4(a)に示す例で図示されている。ここでは、ベースレイヤは、時間的に最初のIフレーム400(I.0.0)を含んでいる。このフレームは、エンハンスメントレイヤ1の第1の画像フレーム402、すなわち(P.0.1)を予測するために用いられ、この画像フレーム402は、同じサブシーケンス(サブシーケンス識別子0を有する)に属する第2の画像フレーム404、すなわち(P.0.2)を予測するために用いられ、この画像フレーム404は、同じサブシーケンスの第3の画像フレーム406、すなわち(P.0.3)を予測するために用いられ、この画像フレーム406は、第4の画像フレーム408(P.0.4)を予測するために用いられ、そして最後に、上記の第4のフレームは第5の画像フレーム410(P.0.5)を予測するために用いられる。時間的に次のビデオシーケンスの画像フレーム412は、ベースレイヤ上に配置されており、そこでは、それは、単に時間的に7番目に符号化された画像フレームであるというだけであるが、Iフレーム400と同一のサブシーケンスにあり、従ってその識別子は(P.0.6)である。それから、この第7のフレームは、エンハンスメントレイヤ1の第2のサブシーケンスの第1の画像フレーム414、すなわち(P.1.7)を予測するために用いられ、そして、この画像フレーム414は、同じサブシーケンス(サブシーケンス識別子1を有する)に属する第2の画像フレーム416、すなわち(P.1.8)を予測するために用いられ、そしてまた、この画像フレーム416は、今度は第3の画像フレーム418(P.1.9)を予測するために用いられ、この第3番目は第4の画像フレーム420(P.1.10)を予測するために用いられ、そして最後に、この第4番目は、同じサブシーケンスの第5の画像フレーム422(P.1.11)を予測するために用いられる。再び、時間的に次のビデオシーケンスの画像フレーム424はベースレイヤ上に配置され、そこでは、それは、単に時間的に13番目に符号化された画像フレームであるというだけであるが、Iフレーム400及びPフレーム412と同一のサブシーケンスにあり、従ってその識別子は(P.0.12)である。説明を簡潔にするため、本実施形態の上述の説明は、レイヤの識別子を含まないが、スケーラビリティを実施するために、レイヤの識別子も、ビデオシーケンスとともに、通例、画像フレーム識別子の一部として信号伝送されねばならないことは明らかである。
図4(b)及び図4(c)は、図4(a)に示したビデオシーケンスの画像フレームをグループ化するための代替的な実施形態を示す。図4(b)の画像フレームは、サブシーケンスに従って付番されている、すなわち、新規のサブシーケンスは、常に、最初から(0から)付番を開始する。図4(c)では、今度は、ベースフレームのPフレームがSPフレーム対によって置き換えられて、画像情報の同一の再構成に備えていること以外は、図4(a)で用いられたものに対応した画像フレームの番号付けが用いられている。
上述のように、本発明の手順は、Bフレームを用いても実施可能である。この1例が、図5(a),図5(b),及び図5(c)に示されている。図5(a)は、時間領域におけるビデオシーケンスを示し、そのシーケンスは、PフレームP1,P4及びP7を含み、Bフレームがそれらの間に配置されており、時間的予測に関するBフレームの相互依存性が矢印で示されている。図5(b)は、図5(a)に示した相互依存性が指定されるビデオシーケンスの画像フレームの好適なグループ化を示す。図5(b)は、新規のサブシーケンスは常に画像フレームの付番をゼロから開始する、サブシーケンス別の画像フレームの番号付けを示す。図5(c)もまた、画像フレームの付番を示し、この付番は時間的予測の順に連続し、ここで後続の参照フレームは、常に次の画像番号を、先行して符号化された参照フレームとして受け取る。画像フレーム(B1.8)(及び(B2.10))は、他のどのフレームに対する参照予測フレーム(reference prediction frame)としても機能することはないので、それは画像フレームの付番に影響を与えることもない。
上述の例は、ビデオシーケンスのスケーラビリティが本発明の方法を用いてどのように調整可能かについての様々な代替例を示している。端末装置がビデオシーケンスを再生する観点からすると、スケーラビリティレイヤがより一層利用可能になるか、あるいは、復号可能なスケーラビリティレイヤが増えるほど、画像品質も向上する。言い換えれば、画像情報量及び情報を転送するために用いられるビットレートが増大すると、時間若しくは空間解像度、あるいは画像データの空間品質(spatial quality)が向上する。また、これに対応して、スケーラビリティレイヤの数が増えることは、復号を行う端末装置の処理容量にかなり高い要求を課すことにもなる。
さらに、上述の例は、サブシーケンスを用いることにより得られる利点を示している。画像フレーム識別子を用いて、上記のサブシーケンスにおける各画像フレームの他の画像フレームからの依存性が明白な方法で示される。従って、サブシーケンスは、必要であれば、ビデオシーケンスの後続の画像フレームの復号に影響を与えることなく、上記のビデオシーケンスから除外可能な独立したかたまり(independent whole)を形成する。その場合、当該サブシーケンスの画像フレーム、及び、それに依存する同一及び/又はより低位のスケーラビリティレイヤ上のこれらのサブシーケンスの画像フレームのみが復号されない。
ビデオシーケンスとともに送信される画像フレームの識別子データは、そのビデオシーケンスのヘッダフィールド内に、あるいは、そのビデオシーケンスの送信のために用いられるべき転送プロトコル(transfer protocol)のヘッダフィールド内に含まれることが好ましい。言い換えれば、予測された画像フレームの識別子は、その符号化されたビデオシーケンスの画像データ内には含まれないが、常に、そのヘッダフィールド内に含まれ、これにより、その画像フレームの依存性が、実際のビデオシーケンスを復号することなく検出可能となることである。上記の画像フレームの識別子データは、例えば、上記のビデオシーケンスが送信のために符号化されてゆくのにつれて、ストリーミングサーバのバッファメモリ内に格納可能である。さらに、サブシーケンスの画像フレームは、同じスケーラビリティレイヤの他のサブシーケンスに依存しないので、そのサブシーケンスは、各スケーラビリティレイヤに独立して復号可能である。
本発明の一実施形態によると、サブシーケンスに含まれる画像フレームは、同一のスケーラビリティレイヤの他のサブシーケンスにも依存してもよい。このとき、同一のレイヤ上に配置された相互依存サブシーケンス(interdependent sub-sequences)は、送信されるべきビデオシーケンスから別々に除去されることはできないので、この依存性は、例えば、トラフィック形成(traffic shaping)を実行するストリーミングサーバに対して信号伝送されなければならない。この信号伝送を実施する好適な方法は、それを、例えば、当該サブシーケンスが依存するレイヤ−サブシーケンス対(layer-sub-sequence pairs)をリストアップすることにより、送信されるべき画像フレームの識別子内に含めることである。また、このことにより、同一のスケーラビリティレイヤの他のサブシーケンスからの依存性を示す好適な方法が提供される。
上述の例は、画像フレームが、先行する画像フレームから時間的に予測される状況を示している。しかしながら、ある符号化方法では、参照ピクチャ選択は、時間的に後続の画像フレームから画像フレームの画像情報を予測することをも含むように、さらに拡張されてきている。参照ピクチャ選択は、様々な時間的にスケーラブルな画像フレーム構造を創造するための最も多様化した手段を提供し、ビデオシーケンスのエラー感度(error sensitivity)を低減させることができるようにする。参照ピクチャ選択に基づいた符号化技術の1つが、INTRAフレームの延期(INTRA-frame postponement)である。このINTRAフレームは、ビデオシーケンス内の時間的に「正しい」位置に配置されるのではなく、その位置が時間的に延期される。このINTRAフレームの「正しい」位置とその実際の位置との間にあるビデオシーケンスの画像フレームは、当該INTRAフレームから時間的に後ろ方向(backward)に予測される。このことは、必然的に、表示されるべきである全ての画像フレームが符号化可能となるとともに、それらがそれらの表示順に配列可能となるように、非符号化画像フレームが十分に長時間の間バッファに入れられることを必要とする。本発明に従ったINTRAフレーム転送及びそれに関連したサブシーケンスの決定について、以下に、図6を参照して説明する。
図6(a)は、INTRAフレームが単一のIフレーム600を含むビデオシーケンス部分を示し、このビデオシーケンスにおけるIフレームの「正しい」位置は第1の画像フレームであったが、このIフレーム600は、図6に示す位置へ時間的に移転されている。従って、「正しい」位置と実際の位置600との間のビデオシーケンスの画像フレームは、Iフレーム600から時間的に後ろ方向に予測される。このことは、エンハンスメントレイヤ1の中に符号化され、第1の時間的に後ろ方向に予測された画像フレーム602、これはPフレーム(P.0.0)であるが、これを有するサブシーケンスによって示される。このフレームは、先行する画像フレーム604、すなわちPフレーム(P.0.1)を時間的に予測するために用いられ、このフレーム604は、今度は画像フレーム606、すなわちPフレーム(P.0.2)を予測するために用いられ、そして最終的に、画像フレーム606は、画像フレーム608、すなわちPフレーム(P.0.3)を予測するために用いられ、この画像フレーム608は、ビデオシーケンスにおけるIフレーム600の「正しい」位置であったはずの位置にある。それに対応して、ベースレイヤのIフレーム600は、4つのPフレーム610,612,614,616、すなわちPフレーム(P.0.0),(P.0.1),(P.0.2)及び(P.0.3)を含むサブシーケンスの、時間的に前方向の予測のために用いられる。
本実施形態で、後ろ方向に予測された画像フレームは、前方向に予測された画像レイヤよりも低位のレイヤに置かれるということは、説明のために、後ろ方向に予測された画像フレームは、この符号化の例では、前方向に予測された画像フレームよりも、主観的には重要度が低いとみなされることを示している。もちろん、サブシーケンスは、同一のレイヤ上に置かれてもよく、この場合には、それらは同等とみなされることになるか、あるいは、後ろ方向に予測されたサブシーケンスは、上位のレイヤにあることも可能であり、この場合には、それは主観的により重要であるとみなされることになる。
図6(b)及び図6(c)は、図6(a)によるビデオシーケンスの符号化のためのいくつかの代替例を示す。図6(b)では、前向き及び後ろ向きに予測されたサブシーケンスの両方共ベースレイヤ上に置かれており、IフレームのみがINTRAレイヤ上に置かれている。従って、このレイヤ上の前方向に予測されたサブシーケンスは、第2のサブシーケンスであり、そのサブシーケンスの識別子は1である。図6(c)では、今度は、Iフレーム及びそれに基づいて前方向に予測されたサブシーケンスが、ベースレイヤ上に置かれているのに対し、その一方で、後ろ方向に予測されたサブシーケンスはエンハンスメントレイヤ1上に置かれている。
さらに、本発明の好適な一実施形態によると、上述のスケーラビリティは、ビデオシーケンスへの場面転換(scene transition)として知られるものの符号化に利用可能である。ニュースレポート、音楽ビデオ及び映画の予告編(movie trailer)等のビデオ素材には、独立した画像素材場面間に急な切れ目が含まれる。時として、そのような切れ目は突然のものであるが、場面転換として知られる手順が用いられることが多く、この手順においては、ある場面から他への転換は、先行する場面の画像フレームを減光(dimming)、消去(wiping)、モザイクディゾルブ、又はスクロールし、それに応じて、後続の場面の画像フレームを表示することによりなされる。符号化の効率からすると、場面転換のビデオ符号化は、最も問題となることが多いが、これは、場面転換中に現れる画像フレームが、終了及び開始場面の両方の画像フレームについての情報を含むためである。
通例の場面転換である映像の漸移(fading)は、第1の場面の画像フレームの強度又は輝度を徐々に0に減少させ、一方では第2の場面の画像フレームの強度又は輝度を徐々にその最大値まで増加させることにより行われる。この場面転換を、クロスフェード場面転換(cross-faded scene transition)と称する。
一般的に言えば、コンピュータ作成画像は、レイヤ又は画像オブジェクトからなるものと考えることができる。各オブジェクトは、少くとも3つの情報タイプ、すなわち、画像オブジェクトの構造、その形状及び透明度(transparency)、及び、画像の背景及び他の画像オブジェクトとの関係におけるレイヤ化の順番(深度)を参照して定義され得る。形状及び透明度は、アルファ面(alpha plane)として知られるものを用いて決定されることが多く、アルファ面により不透明度(opacity)が測定され、通常はその値は各画像オブジェクトについて個別に決定され、背景は除外されることもあるが、通例、背景は、不透明として決められる。従って、完全に透明な画像オブジェクトのアルファ面の値が0.0であるのに対して、背景等の不透明画像オブジェクトのアルファ面の値は、1.0に設定可能である。中間の値により、ピクチャ内の特定の画像オブジェクトの視感度(visibility)の強度が、背景と、当該画像オブジェクトよりも高い深度値を有する他の、少なくとも部分的に重複する画像オブジェクトとに比例して定義される。
レイヤにおける画像オブジェクトの、それらの形状、透明度及び深度位置(depth position)に従った重ね合わせ(superimposition)のことを場面構成(scene composition)と称する。実際には、その手順は、加重平均の使用に基づいている。第1に、背景に最も近接した、すなわち、その深度位置に従う最も深い画像オブジェクトは背景上に配置され、組み合わせ画像はその2つから形成される。この組み合わせ画像の画素値は、背景画像及び当該画像オブジェクトのアルファ面値により加重平均されたものとして形成される。そのとき、この組み合わせ画像のアルファ面値は、1.0に設定され、その後、それは次の画像オブジェクトに対して背景画像としての役割を果たす。全ての画像オブジェクトがその画像に付加されるまで上記の処理は継続する。
以下に、本発明の好適な一実施形態による手順について説明するが、ここでは、ビデオシーケンスのスケーラビリティレイヤが、上述の画像フレームの画像オブジェクト及びその情報タイプと組み合わされて、圧縮効率もよいスケーラブルビデオ符号化を伴う場面転換が提供される。
以下に、本発明の本実施形態について、一方では、クロスフェード場面転換を用いることにより、他方では、突然の場面転換を例として用いることにより、例により簡単化して説明する。場面転換中に表示されるべき画像フレームは、通例、2つの重ね合わせ画像フレームから形成され、第1の画像フレームは第1の画像場面を含み、第2の画像フレームは第2の場面を含んでいる。一方の画像フレームは背景画像となり、前景画像(foreground image)と称する他方は、背景画像の先端(top)に配置される。背景画像の不透明度、すなわちその不透明度値は、一定である。換言すれば、その画素別アルファ面値(pixel-specific alpha plane value)は調整されない。
本発明のこの実施形態では、背景及び前景画像は、いずれもスケーラビリティレイヤに従って定義される。このことは図7に図示されており、図7は、2つの異なる場面の画像フレームが、本発明の場面転換中にスケーラビリティレイヤ上にどのように配置可能であるかについての例を示す。図7は、ベースレイヤ上に配置された第1の(終了(terminating))場面の第1の画像フレーム700を示す。画像フレーム700は、動き補償時間的予測を用いて決定されなかった画像情報を含むIフレームでもよく、あるいは先行する画像フレームから予測された動き補償された画像フレームであるPフレームであってもよい。第2の(開始(initiating))場面の符号化は、時間的に後続の画像フレーム中に開始し、そして本発明によって、その場面の画像フレームも、ベースレイヤ上に配置される。それから、第2(開始)場面の残りの画像フレーム702,704は、エンハンスメントレイヤ1上に配置される。これらの画像フレームは、通例、Pフレームである。
本実施形態では、第2(開始)場面の画像フレームは少なくとも場面転換の時間中はこのようにベースレイヤ上に配置される。その場面の第1の画像フレーム706は、通例、Iフレームであり、それは、その場面の後続の画像フレームを時間的に予測するために用いられる。従って、第2の場面の後続の画像フレームは、図7に示すフレーム708及び710等の時間的に予測されたフレーム、通例はPフレームである。
本発明の好適な実施形態により、画像フレームをスケーラビリティレイヤ上にこのように配置することは、ベースレイヤ上にある画像レイヤを、常に、最大不透明度(opacity)(100%)、すなわち不透明値(non-transparency value)の背景画像として決めることによって、クロスフェード場面転換を実行するために用いられ得る。場面転換中に、エンハンスメントレイヤ上に配置された画像フレームは、背景画像上に配置され、そしてその不透明度は、不透明から透明へとフレームが徐々に変化するように例えば適切なフィルタにより調整される。
図7のビデオシーケンスでは、第1のベースレイヤの画像フレーム700中には、低位のスケーラビリティレイヤ上の画像フレームがない。この時刻には、第1の画像フレーム700は、ビデオシーケンス内に符号化されるだけである。
ベースレイヤの次の画像フレーム706は、新規(第2)の場面を開始し、その間、画像フレーム706には、それを背景画像として置く深度位置決め(depth positioning)が与えられ、その不透明度値が最大に設定される。ベースレイヤの画像フレーム706と時間的に同時に、エンハンスメントレイヤ1上の終了(第1)場面の画像フレーム702が存在している。クロスフェード場面転換が作成されることを可能とするために、フレーム702の透明度は増大されなければならない。図7の例では、画像フレーム702の不透明度は67%に設定され、さらに、画像フレーム702に対してそれを前景画像として決定する深度位置決めが与えられることが想定されている。この時刻に、画像フレーム706及び702を組み合わせる画像は、ビデオシーケンス内に符号化され、画像706は、背景上の弱い画像として見え、画像702は、不透明度値が本質的に高い(67%)ため、前面で強い画像として見える。
時間的に後続の画像フレーム中に、ベースレイヤ上の第2の場面の第2の画像フレーム708があり、従って、それに対応して、フレーム708には、それを背景画像であると決定する深度位置決めが与えられ、その不透明度値は最大に設定される。さらに、エンハンスメントレイヤ1は、時間的に同時に終了する(第1の)場面の最後の画像フレーム704を含み、そのフレームの不透明度値は33%に設定され、さらに、画像フレーム704には、それも同様に前景画像として決定する深度位置決めが与えられる。従って、この時刻には、画像フレーム708及び704を組み合わされた画像が、ビデオシーケンス内に符号化され、画像708は背景画像上でより強い画像として表示され、そして、画像704の不透明度値がもはや33%以下であるので、画像704は前景上でより弱い画像として表示される。
時間的に後続の画像フレーム中に、ベースレイヤは、第2の場面の第3の画像710を含む。第1の場面が終了したので、画像フレーム710のみがビデオシーケンス内に符号化されて、第2の場面の表示はフレーム710から続行する。
上述の開示では、例として、符号化効率の点から有利な方法で、クロスフェード場面転換を実行するために、本発明に従い、画像フレームをスケーラビリティレイヤ上に配置することについて、記述されている。しかしながら、ビデオシーケンスが送信又は復号された場合に、ビデオシーケンスのビットレートが、データ転送に利用可能な帯域幅及び/又は端末装置の復号速度(decoding rate)の最大値に従って調整されなければならないという状況が、発生しうる。従来技術のビデオ符号化方法を用いて場面転換が実行されなければならない場合、この種のビットレート制御により問題が生じる。
本発明の好適な実施形態により、今や、1つ若しくはそれ以上のスケーラビリティレイヤ、又はそれに含まれた独立して復号可能なサブシーケンスを、ビデオシーケンスから除去することが可能となり、それにより、ビデオシーケンスのビットレートは、低減可能となり、同時に、ビデオシーケンスは、画像周波数を減少させることなく復号可能となる。図7による画像フレーム配置では、エンハンスメントレイヤ1をビデオシーケンスから除去することにより、このことが実行可能である。従って、ビデオシーケンスは、ベースレイヤの画像フレーム700,706,708,710を表示するためにのみ使用される。換言すると、第1(終了)の場面から第2(開始)の場面への直接的な転換は、突然の場面転換という形式で起こる、すなわち、第1の場面の画像フレーム700から第2の場面を開始するI画像フレーム706へと直接なされる。従って、この転換は、クロスフェード場面転換ではなく、突然の場面転換となる。それにもかかわらず、この場面転換は、ビデオシーケンスの画像の品質に影響を与えることなく、有利な方法で実行可能であり、視聴者は、通例、妨害又は障害のいずれにあっても、クロスフェード場面転換の代わりに実施された突然の場面転換を感じるということはない。反対に、従来技術の実施では、スケーラビリティレイヤが削除可能ではないので、場面転換には、多くの場合、画像周波数を減少させることが必要となることになり、それにより、視聴者は、ぎくしゃくした動き及び障害を感じることになる。
このように、本発明は、ビデオシーケンスの様々なサブシーケンスについての情報即ち、それらの平均ビットレート、そのビデオシーケンス全体との関連での位置、継続時間、及びレイヤに関するそれらの相互依存性の情報を含むストリーミングサーバにおいてマルチメディアデータトラフィック形成(multimedia data traffic shaping)を実行するための好適な手段を提供するものである。また、このストリーミングサーバは、データ転送に利用可能な帯域幅及び/又は端末装置の復号速度の最大値を決定する。この情報に基づき、ストリーミングサーバは、どの位のスケーラビリティレイヤ数かを決定するとともに、どのサブシーケンスがビデオシーケンス内に送信されるかを決定する。このように、ビットレートの制御は、必要なときに、まずスケーラビリティレイヤの数を大まかに調整することにより、実行可能であり、その後、より精密なサブシーケンス別の調整が、容易に実行可能となる。最も簡単には、ビットレート制御は、特定のサブシーケンスがビデオシーケンスに追加されるか、あるいはそれから除去されるかについて、サブシーケンス別に決定することを意味する。除去の場合、ビデオシーケンスからサブシーケンスの全体を除去したほうが望ましい。これは、個々の画像を除去すると、同じサブシーケンスの他の画像にエラーが生じることがあるためである。同じ理由により、低位のエンハンスメントレイヤのサブシーケンスは、それらが高位のレイヤの除去されたサブシーケンスに依存している場合は、全て除去されるべきである。もし1つの同じスケーラビリティレイヤ上に、相互依存した複数のサブシーケンスがある場合は、先行のサブシーケンスに依存したサブシーケンスは、その先行のサブシーケンスが除去される場合は、除去されるべきである。
画像フレーム識別子データが、送信されるべきであるビデオシーケンスに追加される場合は、トラフィック形成は、ビデオシーケンスの転送に用いられるべき通信ネットワーク要素、例えば、インターネットルータ、様々なゲートウェイ、又は、移動通信ネットワークの基地局若しくは基地局コントローラ、において実施することができる。サブシーケンス情報を管理及び処理することが可能であるべきネットワーク要素に対しては、余分の記憶及び処理容量を持たなければならない。この理由から、ネットワークにおいて実行されるべきトラフィック形成は、多分、DiffServすなわち差別化サービス(differentiated service)、ある種のIPベースのネットワークが対応している手順等の簡単な処理方法を用いて実行されることにまずなりそうである。DiffServ方法では、各IPデータパケットに対して優先度が割り当てられ、それにより、より優先度が高いデータパケットが、優先度が低いパケットよりも、より高速かつ高信頼で受信側に中継される。このことは、スケーラビリティレイヤ別の優先度だけでなく、サブシーケンス別の優先度を決定することにより、本発明のスケーラビリティに有利に適用され、それにより、高度に進歩した優先順位付け(priorisation)が可能となる。
画像フレーム識別子を、送信されるべきビデオシーケンスに追加することについては、多くの代替例がある。さらに、ビデオシーケンスに識別子データを何ら含めないことも可能であり、その場合には、トラフィック形成は、ストリーミングサーバでのみ実行される。識別子データは、ビデオシーケンスのヘッダフィールド、又は、RTP(Real Time Protocol:リアルタイムプロトコル)等の使用されるべき転送プロトコルのヘッダフィールド内に、含めることが可能である。好適な実施形態によると、識別子データは、追加拡張情報(Supplemental Enhancement Information:SEI)メカニズムを用いて転送可能である。SEIは、ビデオデータ内容と同期に転送されるデータ配信メカニズム(data delivery mechanism)を提供し、従って、ビデオシーケンスの復号及び表示において補助を行う。SEIメカニズムは、特に、レイヤ及びサブシーケンスの情報を転送するために使用される場合について、ITU−T規格書ITU-T Rec. H.264(ISO/IEC 14496-10:2002),Annex Dに、より詳細に開示されている。識別子のデータ転送のために、独立した転送プロトコル又はメカニズムが用いられる場合においては、トラフィック形成は、転送経路のネットワーク要素の1つでも実行可能である。さらに、受信端末装置が復号を制御することができる。
エンコーダ又はデコーダが参照ピクチャ選択をサポートしている場合は、ビデオシーケンス符号化のためには、異なる画像フレーム間の関係が、1つ又はそれ以上の他の画像フレームから時間的に予測可能となるように、符号化前に、復号された画像フレームをバッファに入れることが必要となる。画像フレームのバッファリングは、少なくとも2つの異なる方法、すなわち、スライディングウインドウ(Sliding Windowing)か、あるいは、適応バッファメモリ制御(adaptive buffer memory control)で取り決められる。スライディングウインドウでは、最後に符号化されたM画像フレームが、バッファとして用いられる。バッファメモリ内のフレームは、復号及び再構成された形式になっており、これにより、符号化において、それらを参照画像として使用可能となる。符号化が進むにつれ、画像フレームバッファリングは、FIFO(First-In-First-Out)原理に基づいて機能する。従来のB画像等の、参照画像として用いられない画像は、バッファ内に格納する必要はない。代わりの方法として、バッファリングは、適応バッファメモリ制御として実行可能であり、その場合には、画像のバッファリングは、FIFO原理に限定されず、必要のない画像フレームは、処理の途中でバッファから除外可能であり、あるいはそれに応じて、どれかの画像フレームが、後の画像フレーム用に参照画像として必要であるなら、より長時間の間バッファ内に格納しておくこともできる。既知の参照ピクチャ選択は、バッファメモリ内の画像フレームに特定の順序にインデックスを付すことにより実行され、このとき、この画像インデックスは、例えば、動き補償に関連して画像を参照するために用いられる。一般に、このインデックス化方法は、例えば、動き補償参照画像が信号伝送されるべき場合に特定の画像を参照するために、画像番号を用いることに比べて、より良好な圧縮効率を提供する。
上述の参照画像インデックス化方法は、送信側のエンコーダ及び受信側のデコーダのバッファが相互に対応して再構成された画像を同一の順序で含んで、そのエンコーダ及びデコーダの両者が、確実に同一のインデックス順序を形成するようにしなければならないので、転送エラーによる影響を受けやすい。画像フレームに、上記のエンコーダ及びデコーダのバッファ内で異なる順でインデックスが付されると、デコーダ内で間違った参照画像が使用されることがある。これを防止するためには、ビデオシーケンスからエンコーダが意図的に除外した画像フレーム及びサブシーケンスを考慮するように、デコーダが制御可能であることが不可欠である。その場合、画像フレームの番号付けはギャップを含む場合があり、デコーダは、通例、そのギャップをエラーと解釈し、喪失したと解釈された画像フレームを再構成しようと試みる。この理由から、エンコーダがデコーダに対して、送信される画像フレームの画像の番号付けにおける不連続は意図されたものであることを通知することが可能であることが不可欠である。
これに応答し、そして、画像フレームをバッファリングするためにスライディングウインドウが用いられるとして、デコーダは、バッファメモリ内に、いくつもの画像フレームを入れてゆき、その内容は、喪失した画像番号に応じて完全にランダムとなり得る。それから、これらのランダムな画像フレームは、「無効」という識別子により指定されて、当該フレームが実際のビデオシーケンスに属するものではなく、単にバッファメモリ管理のために入れられたつなぎフレーム(filler frame)に過ぎないことを示す。つなぎフレームは、当然、メモリインジケータのみを用いて実行可能である、すなわち、バッファメモリにはデータが入れられないで、メモリ管理は単に、一般的な「無効」フレーム(generic“invalid”frame)に対する参照を格納するために用いられることが望ましい。実際のビデオシーケンスの画像フレームの挿入(entering)は、喪失した画像番号により指定されるつなぎフレームの番号がバッファに入れられた後、正しい画像フレーム番号から続行し、それにより、エンコーダ及びデコーダのバッファメモリが、好適に同期が保たれるようにすることができる。復号中に、画像番号への参照が検出されて、それからバッファ内に位置するつなぎフレームを指していることがわかった場合、例えば、エンコーダに、当該参照画像を再送するように要求することによって、実際の参照画像を再構成するように、デコーダ内でエラー訂正動作が開始される。
さらに、本発明の手順により、それぞれのスケーラビリティレイヤ上で、あるいは、それに対応してサブシーケンス別に、独立したバッファメモリを使用することが可能となる。従って、各スケーラビリティレイヤは、概念的に独立していてスライディングウインドウ原理に基づいて機能する独立したバッファメモリを持ってもよい。同様に、各サブシーケンスに対しても、やはりスライディングウインドウ原理に基づいて機能する、概念的に独立したバッファメモリが備えられてもよい。このことは、サブシーケンスが終了したときには、バッファメモリは常に空いていることを意味する。通常のスライディングウインドウバッファリングが適切でなく、その代わりに動的適用バッファメモリ管理が用いられる必要がありそうな、ある状況において信号伝送のためのその必要性を減らすような、好適な方法で、独立したバッファメモリを使用することが可能である。
H.26L規格は、ピクチャ順序の計数を、出力順のピクチャ位置として規定している。H.26L規格に指定された復号処理は、Bスライス内の参照ピクチャ用にデフォルトのインデックス順序付け(default index ordering)を決定するために、動きベクトル予測(motion vector prediction)におけるベクトルスケーリングのために、また、Bスライス内の暗黙のモード加重予測(implicit mode weighted prediction)のために、フレームとフィールド間のピクチャ順序差を表すために、そして、復号順に連続するスライスがどの時点で異なるピクチャに属するかを決定するために、ピクチャ順序計数を用いる。このピクチャ順序計数は、各ピクチャに対して符号化されて送信される。
本発明の一実施形態では、デコーダは、ピクチャ順序計数を用いて、ピクチャが時間的に重複していること、すなわち、等しいピクチャ順序計数を有するピクチャ同士は時間的に重複していることを判断する。デコーダは、最高位の受信されたレイヤ上のピクチャのみを出力することが望ましい。画像情報が欠落していると、デコーダは、復号順序において最も新しい時間的に重複したピクチャが最高位の受信レイヤ上に存在するものと判断する。
上記の開示には、スケーラブルで圧縮されたビデオシーケンスを生成する目的のためのビデオフレームを符号化するための手順が記述されている。実際の手順は、図1のコンプレッサ108等のビデオエンコーダ内で実行され、これは、既知のどのようなビデオエンコーダであってもよい。例えば、ITU−T勧告H.263又はH.26Lによるビデオエンコーダが用いられてもよく、そのビデオエンコーダは、本発明に従って、第1のサブシーケンスをビデオシーケンス内に形成するようになっており、そのサブシーケンスの少なくとも一部がIフレームを符号化することにより形成され、また、少なくとも第2のサブシーケンスをビデオシーケンス内に形成し、そのサブシーケンスの少なくとも一部が少なくともP又はBフレームを符号化することにより形成され、そしてその第2のサブシーケンスの少なくとも1つのビデオフレームが、第1のサブシーケンスの少なくとも1つのビデオフレームから予測され、そして、少なくとも第2のサブシーケンスのビデオフレームの識別データを上記のビデオシーケンス内に決定するようになっている。
本発明の手順により、個々のスケーラビリティレイヤの各サブシーケンスは、当然、高位のスケーラビリティレイヤからの依存性を考慮し、場合によって、同じスケーラビリティレイヤの他のサブシーケンスを考慮して独立して復号可能であることが好ましい。従って、上述したもののようなスケーラブルに圧縮されたビデオシーケンスは、ビデオシーケンスの第1のサブシーケンスを復号することにより復号可能であり、そのサブシーケンスの少なくとも一部は、少なくともIフレームを符号化することにより形成されたものであり、そして、少なくともビデオシーケンスの第2のサブシーケンスを復号することにより復号可能であり、この第2のサブシーケンスの少なくとも一部は、少なくともP又はBフレームを符号化することにより形成されたものであり、そしてこの第2のサブシーケンスの少なくとも1つのビデオフレームは、上記の第1のサブシーケンスの少なくとも1つのビデオフレームから予測されたものであり、そして少なくともビデオシーケンスの第2のサブシーケンスに含まれるビデオフレームの識別及び依存性データを決定することにより、そして、ビデオシーケンスの少なくとも一部を上記のサブシーケンスの依存性に基づいて再構成することによって復号可能である。
実際の復号は、図1のデコンプレッサ118等のビデオデコーダ内で行われ、これは、既知のどのようなビデオデコーダであってもよい。例えば、ITU−T勧告H.263又はH.26Lによる低ビットレートデコーダが用いられてもよく、これは、本発明では、ビデオシーケンスの第1のサブシーケンスを復号するようにされており、このサブシーケンスの少なくとも一部は、Iフレームを符号化することによって形成されたものであり、また、少なくともビデオシーケンスの第2のサブシーケンスを復号するようにされて、この第2のサブシーケンスの少なくとも一部は、少なくともP又はBフレームを符号化することにより形成されたものであり、そしてこの第2のサブシーケンスの少なくとも1つのビデオフレームは、上記の第1のサブシーケンスの少なくとも1つのビデオフレームから予測されたものである。ビデオデコーダは、少なくとも上記のビデオシーケンスの第2のサブシーケンスに含まれたビデオフレームの識別及び依存性データを決定し、そしてビデオシーケンスの少なくとも一部を、そのサブシーケンスの依存性に基づいて再構成するようにされている。
本発明のストリーミングシステムの動作において不可欠な側面は、エンコーダ及びデコーダが、少なくとも、エンコーダがストリーミングサーバに動作可能に接続され、そしてデコーダが受信側の端末装置に動作可能に接続されるように、配置されていることである。しかしながら、ストリーミングシステムの様々な要素、特に端末装置は、マルチメディアファイルの双方向転送、すなわち送信及び受信、を可能にする機能(functionality)を含んでいてもよい。従って、エンコーダ及びデコーダは、エンコーダ及びデコーダ機能を統合したビデオコーデック(video codec)として知られるものの形で実施されてもよい。
本発明によって、ストリーミングサーバ、ビデオエンコーダ、ビデオデコーダ、及び端末等の上述のストリーミングシステム及びその要素の機能的要素は、ソフトウェアによって、またハードウェアソリューションによって、又はその両者の組合せによって好適に実施されることに注意すべきである。本発明の符号化及び復号方法は、特に、本発明の処理手順を実行するためのコンピュータリーダブルコマンドを含むコンピュータソフトウェアとして実施するのに適している。エンコーダ及びデコーダを実施する好適な方法は、それらを記憶手段内に、コンピュータのような装置、例えば、パーソナルコンピュータ(PC)又は移動局により実行可能なプログラムコードとして格納して、当該装置上に符号化/復号機能を提供することである。
他の代替例は、本発明を、この場合は、少なくとも第1及び第2のフレームフォーマットに従って符号化されたビデオフレームを含み、スケーラブルに圧縮されたビデオシーケンスを含むビデオ信号として実施することであり、この第1のフレームフォーマットによるビデオフレームは、他のビデオフレームと独立しており、そして第2のフレームフォーマットのビデオフレームは、他のビデオフレームの少なくとも1つから予測されるものである。本発明によると、当該ビデオ信号は、少なくとも第1のフレームフォーマットのビデオフレームを符号化することにより少なくともその一部が形成された少なくとも第1のサブシーケンスと、少なくとも第2のフレームフォーマットのビデオフレームを符号化することにより少なくともその一部が形成された少なくとも第2のサブシーケンスと、上記の第1のサブシーケンスの少なくとも1つのビデオフレームから予測された上記の第2のサブシーケンスの少なくとも1つのビデオフレームと、そして上記の第2のサブシーケンスに属するビデオフレームを決定する少なくとも1つのデータフィールドとを、含んでいる。
技術の進歩につれて、本発明の基本的概念は様々な方法で実施可能であることが、当業者には明らかである。従って、本発明及びその実施形態は、上述の実施例に限定されるものではなく、それらは、特許請求の範囲の請求項の範囲内で様々変り得るものである。
本発明のスケーラブル符号化の階層構造が適用可能な通常のマルチメディアデータストリーミングシステムを示す図である。 本発明の好適な実施形態のスケーラブル符号化の階層構造を示す図である。 図3(a)、3(b)はスケーラビリティを調整するための本発明の実施形態を示す図である。 図4(a)、4(b)、及び4(c)は画像の番号付けを調整するための本発明の実施形態を示す図である。 図5(a)、5(b)、及び5(c)はスケーラブル符号化の階層構造内にBフレームを用いた本発明の実施形態を示す図である。 図6(a)、6(b)、及び6(c)は参照ピクチャ選択に関連した本発明の好適な実施形態のスケーラブル符号化の階層構造を示す図である。 場面転換を符号化するための本発明の好適な実施形態による構成を示す図である。
符号の説明
200,202 Iフレーム
204,206,208,210,212,214,216,218 Pフレーム

Claims (29)

  1. 圧縮ビデオシーケンスを復号するための方法であって、画像フレームが前記復号に関連してバッファメモリに入れられる方法において、
    前記画像フレームの番号付けの少なくとも1つの不連続に関する指示を前記ビデオシーケンスから復号するステップと、
    前記指示に応答して前記画像フレームの番号付けにおける不連続に対応する数の画像フレームを与えるように前記バッファメモリを構成するステップと、
    前記復号のプロセスにおいて前記バッファメモリ内の前記画像フレームを使用するステップと、を含むことを特徴とする方法。
  2. 前記指示は、前記ビデオシーケンスの前記画像フレームの番号付けにおける少なくとも1つの不連続が意図的であることを知らせることを特徴とする請求項1に記載の方法。
  3. さらに、前記画像フレームの番号付けにおける前記不連続のためにデコーダに存在しない画像フレームの代わりに前記バッファメモリ内の前記の数の画像フレームを使用するステップを含むことを特徴とする請求項1または2に記載の方法。
  4. 前記バッファメモリ内の前記の数の画像フレームが画像フレームのスライディングウィンドウバッファリングにおいて使用されることを特徴とする請求項1から3までのいずれか一項に記載の方法。
  5. さらに、前記バッファメモリが前記画像フレームの番号付けにおける前記不連続に対応する数の画像フレームを与えるように構成された後、前記の当該ビデオシーケンスに含まれる前記画像フレームを正しい画像フレーム番号から引き続き前記バッファメモリに入れるステップを含むことを特徴とする請求項1から4までのいずれか一項に記載の方法。
  6. さらに、前記画像フレームの番号付けにおける前記不連続に対応する数のつなぎフレームを前記バッファメモリに入れるステップを含むことを特徴とする請求項1から5までのいずれか一項に記載の方法。
  7. 前記つなぎフレームが実際のビデオシーケンスに属さないことを示す識別子によって前記つなぎフレームが指定されることを特徴とする請求項6に記載の方法。
  8. 前記画像フレームの番号付けにおける前記不連続に対応する数の画像フレームを与えるように前記バッファメモリを構成するステップは、メモリ指示によって実行されることによって、前記バッファメモリにデータが入れられないことを特徴とする請求項1から5までのいずれか一項に記載の方法。
  9. さらに、前記復号のプロセスにおいて画像フレームの前記番号付けにおける不連続に対応する画像フレームを参照することに基づいて前記圧縮ビデオシーケンスのエラーを検出するステップを含むことを特徴とする請求項3または6に記載の方法。
  10. 圧縮ビデオシーケンスを復号するためのビデオデコーダであって、該ビデオデコーダがバッファメモリに接続され、前記復号に関連して前記バッファメモリに画像フレームが入れられ、
    該ビデオデコーダが、
    前記画像フレームの番号付けにおける少なくとも1つの不連続に関する指示を前記ビデオシーケンスから復号し、
    前記指示に応答して、前記画像フレームの前記番号付けの不連続に対応する数の画像フレームを与えるように前記バッファメモリを構成し、かつ
    前記復号のプロセスにおいて前記バッファメモリ内の前記画像フレームを使用するように配列されることを特徴とするビデオデコーダ。
  11. 前記指示は、前記ビデオシーケンスにおける前記画像フレームの番号付けの不連続が意図的であることを知らせることを特徴とする請求項10に記載のビデオデコーダ。
  12. 該ビデオデコーダは、さらに、
    前記画像フレームの番号付けにおける不連続のためにデコーダに存在しない画像フレームの代わりに前記バッファメモリ内の前記の数の画像フレームを使用するように配列されることを特徴とする請求項10または11に記載のビデオデコーダ。
  13. 前記バッファメモリ内の前記の数の画像フレームが画像フレームのスライディングウィンドウバッファリングにおいて使用されることを特徴とする請求項10から12までのいずれか一項に記載のビデオデコーダ。
  14. 前記ビデオデコーダは、さらに、
    前記バッファメモリが前記画像フレームの番号付けにおける前記不連続に対応する前記の数の画像フレームを与えるように構成された後、前記の当該ビデオシーケンスに含まれる前記画像フレームを正しい画像フレーム番号から引き続き前記バッファメモリに入れるように配列されることを特徴とする請求項10から13までのいずれか一項に記載のビデオデコーダ。
  15. 前記ビデオデコーダは、さらに、
    前記画像フレームの番号付けにおける前記不連続に対応する数のつなぎフレームを前記バッファメモリに入れるように配列されることを特徴とする請求項10から14までのいずれか一項に記載のビデオデコーダ。
  16. 前記つなぎフレームは、該つなぎフレームが実際のビデオシーケンスに属さないことを示す識別子によって指定されることを特徴とする請求項15に記載のビデオデコーダ。
  17. 前記ビデオデコーダは、さらに、
    メモリ指示によって前記画像フレームの番号付けにおける前記不連続に対応する数の画像フレームを与えるように前記バッファメモリを構成することによりデータは前記バッファメモリに入れられないように配列されることを特徴とする請求項10から14までのいずれか一項に記載のビデオデコーダ。
  18. データ処理装置において実行可能な、圧縮ビデオシーケンスを復号するためのコンピュータプログラムであって、前記ビデオシーケンスの画像フレームが前記復号に関連してバッファメモリに入れられるコンピュータプログラムにおいて、
    該コンピュータプログラムが、
    前記画像フレームの番号付けの少なくとも1つの不連続に関する指示を前記ビデオシーケンスから復号するための手順と、
    前記指示に応答して、前記画像フレームの前記番号付けの不連続に対応する数の画像フレームを与えるように前記バッファメモリを構成するための手順と、
    前記復号のプロセスにおいて前記バッファメモリ内に前記画像フレームを含めるための手順と、
    を含むことを特徴とするコンピュータプログラム。
  19. 前記指示は、前記ビデオシーケンスの前記画像フレームの番号付けにおける不連続が意図的であることを知らせることを特徴とする請求項18に記載のコンピュータプログラム。
  20. 前記コンピュータプログラムは、さらに、
    前記画像フレームの番号付けにおける前記不連続のためにデコーダに存在しない画像フレームの代わりに前記バッファメモリに前記の数の画像フレームを含めるための手順を含むことを特徴とする請求項18または19に記載のコンピュータプログラム。
  21. 前記コンピュータプログラムは、さらに、
    画像フレームのスライディングウィンドウバッファリングにおいて前記バッファメモリ内の前記の数の画像フレームを使用するための手順を含むことを特徴とする請求項18から20までのいずれか一項に記載のコンピュータプログラム。
  22. 前記コンピュータプログラムは、さらに、
    前記バッファメモリが前記画像フレームの番号付けにおける前記不連続に対応する前記の数の画像フレームを与えるように構成された後、前記の当該ビデオシーケンスに含まれる前記画像フレームを正しい画像フレーム番号から引き続き前記バッファメモリに入れるための手順を含むことを特徴とする請求項18から21までのいずれか一項に記載のコンピュータプログラム。
  23. 前記コンピュータプログラムは、さらに、
    前記画像フレームの番号付けにおける前記不連続に対応する数のつなぎフレームを前記バッファメモリに入れるための手順を含むことを特徴とする請求項18から22までのいずれか一項に記載のコンピュータプログラム。
  24. 前記コンピュータプログラムは、さらに、
    前記つなぎフレームが実際のビデオシーケンスに属さないことを示す識別子によって前記つなぎフレームを指定するための手順を含むことを特徴とする請求項23に記載のコンピュータプログラム。
  25. 前記コンピュータプログラムは、さらに、
    メモリ指示によって前記画像フレームの番号付けにおける前記不連続に対応する数の画像フレームを与えるように前記バッファメモリを構成するための手順によって、データが前記バッファメモリに入れられない手順を含むことを特徴とする請求項18から22までのいずれか一項に記載のコンピュータプログラム。
  26. ビデオシーケンスを符号化するためのビデオエンコーダであって、
    該ビデオエンコーダが、
    少なくとも1つの画像フレームが前記ビデオシーケンスから除外されて、画像フレームの番号付けに不連続を生じさせるように前記ビデオシーケンスを符号化し、かつ
    前記画像フレームの番号付けの前記不連続に関する指示を前記ビデオシーケンス内に符号化するように配列されることを特徴とするビデオエンコーダ。
  27. 前記指示が前記ビデオシーケンスの前記画像フレームの番号付けにおける前記不連続が意図的であることを知らせることを特徴とする請求項26に記載のビデオエンコーダ。
  28. ビデオシーケンスのビットレートを調整するための装置であり、該装置が符号化されたビデオシーケンスを受信するように配列される装置であって、
    該装置が、さらに、
    少なくとも1つの画像フレームを前記ビデオシーケンスから除外することによって、画像フレームの番号付けにおいて不連続を生じさせ、かつ
    前記画像フレームの番号付けの前記不連続に関する指示を前記ビデオシーケンス内に含めるように配列されることを特徴とする装置。
  29. 前記指示は、前記ビデオシーケンスの前記画像フレームの番号付けにおける不連続が意図的であることを知らせることを特徴とする請求項28に記載の装置。
JP2006120296A 2002-01-23 2006-04-25 ビデオ符号化における画像フレームのグループ化 Expired - Lifetime JP4819562B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
FI20020127A FI114527B (fi) 2002-01-23 2002-01-23 Kuvakehysten ryhmittely videokoodauksessa
FI20020127 2002-01-23
US10/306,942 US7894521B2 (en) 2002-01-23 2002-11-29 Grouping of image frames in video coding
US10/306,942 2002-11-29

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2003563229A Division JP2005516498A (ja) 2002-01-23 2003-01-22 ビデオ符号化における画像フレームのグループ化

Publications (2)

Publication Number Publication Date
JP2006279971A true JP2006279971A (ja) 2006-10-12
JP4819562B2 JP4819562B2 (ja) 2011-11-24

Family

ID=27614673

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2003563229A Pending JP2005516498A (ja) 2002-01-23 2003-01-22 ビデオ符号化における画像フレームのグループ化
JP2006120296A Expired - Lifetime JP4819562B2 (ja) 2002-01-23 2006-04-25 ビデオ符号化における画像フレームのグループ化
JP2006120297A Withdrawn JP2006279972A (ja) 2002-01-23 2006-04-25 ビデオ符号化における画像フレームのグループ化

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2003563229A Pending JP2005516498A (ja) 2002-01-23 2003-01-22 ビデオ符号化における画像フレームのグループ化

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2006120297A Withdrawn JP2006279972A (ja) 2002-01-23 2006-04-25 ビデオ符号化における画像フレームのグループ化

Country Status (9)

Country Link
US (2) US8050321B2 (ja)
EP (3) EP1670259A3 (ja)
JP (3) JP2005516498A (ja)
KR (2) KR100931915B1 (ja)
CN (1) CN1288915C (ja)
BR (1) BR0306958A (ja)
MX (1) MXPA04007020A (ja)
RU (2) RU2297729C2 (ja)
WO (1) WO2003063505A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016063481A (ja) * 2014-09-19 2016-04-25 株式会社東芝 エンコード装置、デコード装置、ストリーミングシステム、および、ストリーミング方法

Families Citing this family (122)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7068729B2 (en) 2001-12-21 2006-06-27 Digital Fountain, Inc. Multi-stage code generator and decoder for communication systems
US6307487B1 (en) 1998-09-23 2001-10-23 Digital Fountain, Inc. Information additive code generator and decoder for communication systems
US6499060B1 (en) 1999-03-12 2002-12-24 Microsoft Corporation Media coding for loss recovery with remotely predicted data units
FI114527B (fi) * 2002-01-23 2004-10-29 Nokia Corp Kuvakehysten ryhmittely videokoodauksessa
EP1670259A3 (en) * 2002-01-23 2010-03-03 Nokia Corporation Grouping of image frames in video coding
US7003035B2 (en) 2002-01-25 2006-02-21 Microsoft Corporation Video coding methods and apparatuses
US20040001546A1 (en) 2002-06-03 2004-01-01 Alexandros Tourapis Spatiotemporal prediction for bidirectionally predictive (B) pictures and motion vector prediction for multi-picture reference motion compensation
US9240810B2 (en) 2002-06-11 2016-01-19 Digital Fountain, Inc. Systems and processes for decoding chain reaction codes through inactivation
EP2357732B1 (en) 2002-10-05 2022-04-06 QUALCOMM Incorporated Systematic encoding and decoding of chain reaction codes
US9138644B2 (en) 2002-12-10 2015-09-22 Sony Computer Entertainment America Llc System and method for accelerated machine switching
US9077991B2 (en) 2002-12-10 2015-07-07 Sony Computer Entertainment America Llc System and method for utilizing forward error correction with video compression
US8711923B2 (en) * 2002-12-10 2014-04-29 Ol2, Inc. System and method for selecting a video encoding format based on feedback data
US8964830B2 (en) * 2002-12-10 2015-02-24 Ol2, Inc. System and method for multi-stream video compression using multiple encoding formats
US9192859B2 (en) 2002-12-10 2015-11-24 Sony Computer Entertainment America Llc System and method for compressing video based on latency measurements and other feedback
US9314691B2 (en) 2002-12-10 2016-04-19 Sony Computer Entertainment America Llc System and method for compressing video frames or portions thereof based on feedback information from a client device
EP1665539B1 (en) * 2003-10-06 2013-04-10 Digital Fountain, Inc. Soft-Decision Decoding of Multi-Stage Chain Reaction Codes
CN103124182B (zh) 2004-05-07 2017-05-10 数字方敦股份有限公司 文件下载和流系统
EP3157252B1 (en) * 2004-07-01 2019-10-30 Mitsubishi Electric Corporation Randomly accessible visual information recording medium and recording method, and reproducing device and reproducing method
US20060015919A1 (en) * 2004-07-13 2006-01-19 Nokia Corporation System and method for transferring video information
WO2006020826A2 (en) * 2004-08-11 2006-02-23 Digital Fountain, Inc. Method and apparatus for fast encoding of data symbols according to half-weight codes
US8634413B2 (en) 2004-12-30 2014-01-21 Microsoft Corporation Use of frame caching to improve packet loss recovery
KR100567157B1 (ko) * 2005-02-11 2006-04-04 비디에이터 엔터프라이즈 인크 모바일 환경에서의 플레이리스트를 통한 다수 파일의 스트리밍 방법 및 그 시스템
CA2604203A1 (en) * 2005-04-13 2006-10-19 Nokia Corporation Coding, storage and signalling of scalability information
US9049449B2 (en) * 2005-04-13 2015-06-02 Nokia Corporation Coding of frame number in scalable video coding
KR100896279B1 (ko) 2005-04-15 2009-05-07 엘지전자 주식회사 영상 신호의 스케일러블 인코딩 및 디코딩 방법
EP1936996A3 (en) * 2005-04-28 2011-07-27 Apple Inc. Video processing in a multi-participant video conference
WO2007003836A2 (fr) * 2005-06-30 2007-01-11 France Telecom Procede et dispositif de codage video
WO2007076486A2 (en) * 2005-12-22 2007-07-05 Vidyo, Inc. System and method for videoconferencing using scalable video coding and compositing scalable video conferencing servers
US7933294B2 (en) 2005-07-20 2011-04-26 Vidyo, Inc. System and method for low-delay, interactive communication using multiple TCP connections and scalable coding
US8289370B2 (en) 2005-07-20 2012-10-16 Vidyo, Inc. System and method for scalable and low-delay videoconferencing using scalable video coding
JP5265383B2 (ja) * 2005-09-07 2013-08-14 ヴィドヨ,インコーポレーテッド 低遅延かつ分散した会議アプリケーション向けコンファレンスサーバアーキテクチャのためのシステムおよび方法
EP1952631A4 (en) * 2005-09-07 2012-11-21 Vidyo Inc SYSTEM AND METHOD FOR SCALABLE AND DECELERATING VIDEO CONFERENCES WITH SCALABLE VIDEO CODING
WO2007075196A1 (en) 2005-09-07 2007-07-05 Vidyo, Inc. System and method for a high reliability base layer trunk
TWI341136B (en) 2005-10-11 2011-04-21 Nokia Corp System and method for efficient scalable stream adaptation
WO2007042914A1 (en) * 2005-10-11 2007-04-19 Nokia Corporation Efficient decoded picture buffer management for scalable video coding
CN102036071B (zh) * 2005-12-08 2014-04-02 维德约股份有限公司 用于视频通信系统中的差错弹性和随机接入的系统和方法
CA2636858C (en) * 2006-01-27 2015-11-24 Imax Corporation Methods and systems for digitally re-mastering of 2d and 3d motion pictures for exhibition with enhanced visual quality
WO2007095550A2 (en) 2006-02-13 2007-08-23 Digital Fountain, Inc. Streaming and buffering using variable fec overhead and protection periods
US8619865B2 (en) 2006-02-16 2013-12-31 Vidyo, Inc. System and method for thinning of scalable video coding bit-streams
EP2360843A3 (en) * 2006-02-16 2013-04-03 Vidyo, Inc. System and method for thinning of scalable video coding bit-streams
US9270414B2 (en) 2006-02-21 2016-02-23 Digital Fountain, Inc. Multiple-field based code generator and decoder for communications systems
CN101421936B (zh) * 2006-03-03 2016-09-21 维德约股份有限公司 用于在可缩放视频通信中提供差错弹性、随机接入和率控制的系统和方法
US8693538B2 (en) 2006-03-03 2014-04-08 Vidyo, Inc. System and method for providing error resilience, random access and rate control in scalable video communications
EP1997236A4 (en) * 2006-03-03 2011-05-04 Vidyo Inc SYSTEM AND METHOD FOR PROVIDING ROBUST ERROR, DIRECT ACCESS, AND FLOW CONTROL IN SCALABLE VIDEO COMMUNICATIONS
US8937997B2 (en) 2006-03-16 2015-01-20 Apple Inc. Scalable video coding/multiplexing compatible with non-scalable decoders
CN102318202B (zh) * 2006-03-29 2014-06-04 维德约股份有限公司 用于可缩放与非可缩放视频编解码器之间的译码的系统和方法
US8320450B2 (en) 2006-03-29 2012-11-27 Vidyo, Inc. System and method for transcoding between scalable and non-scalable video codecs
US7971129B2 (en) 2006-05-10 2011-06-28 Digital Fountain, Inc. Code generator and decoder for communications systems operating using hybrid codes to allow for multiple efficient users of the communications systems
US9020047B2 (en) * 2006-05-24 2015-04-28 Panasonic Intellectual Property Management Co., Ltd. Image decoding device
US9380096B2 (en) 2006-06-09 2016-06-28 Qualcomm Incorporated Enhanced block-request streaming system for handling low-latency streaming
US9419749B2 (en) 2009-08-19 2016-08-16 Qualcomm Incorporated Methods and apparatus employing FEC codes with permanent inactivation of symbols for encoding and decoding processes
US9178535B2 (en) 2006-06-09 2015-11-03 Digital Fountain, Inc. Dynamic stream interleaving and sub-stream based delivery
US9209934B2 (en) 2006-06-09 2015-12-08 Qualcomm Incorporated Enhanced block-request streaming using cooperative parallel HTTP and forward error correction
US9432433B2 (en) 2006-06-09 2016-08-30 Qualcomm Incorporated Enhanced block-request streaming system using signaling or block creation
US9386064B2 (en) 2006-06-09 2016-07-05 Qualcomm Incorporated Enhanced block-request streaming using URL templates and construction rules
CA2884702C (en) 2006-06-23 2018-06-05 Samuel Zhou Methods and systems for converting 2d motion pictures for stereoscopic 3d exhibition
JP2008040347A (ja) * 2006-08-09 2008-02-21 Toshiba Corp 画像表示装置、画像表示方法および画像表示プログラム
WO2008031263A1 (en) * 2006-09-07 2008-03-20 Thomson Licensing Method and apparatus for encoding groups of pictures of a video sequence, each of said groups including an intra encoded picture and more than two predicted encoded pictures
AU2012201235B2 (en) * 2006-10-16 2014-09-11 Vidyo, Inc. Systems and methods for signaling and performing temporal level switching in scalable video coding
JP2010507346A (ja) * 2006-10-16 2010-03-04 ヴィドヨ,インコーポレーテッド スケーラブルビデオ符号化においてシグナリング及び時間レベルスイッチングを実施するためのシステム及び方法
US20080098447A1 (en) * 2006-10-19 2008-04-24 Moshe Yannai Programming of informational channels for digital video broadcasting
US20080141091A1 (en) * 2006-12-06 2008-06-12 General Instrument Corporation Method and Apparatus for Recovering From Errors in Transmission of Encoded Video Over a Local Area Network
JP5455648B2 (ja) 2007-01-09 2014-03-26 ヴィドヨ,インコーポレーテッド ビデオ通信システムに於けるエラー耐性の向上したシステム及びその方法
CN101321284B (zh) * 2007-06-10 2012-01-04 华为技术有限公司 一种编解码方法、设备及系统
WO2009036378A1 (en) 2007-09-12 2009-03-19 Digital Fountain, Inc. Generating and communicating source identification information to enable reliable communications
US8233532B2 (en) * 2007-09-21 2012-07-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Information signal, apparatus and method for encoding an information content, and apparatus and method for error correcting an information signal
MY162861A (en) * 2007-09-24 2017-07-31 Koninl Philips Electronics Nv Method and system for encoding a video data signal, encoded video data signal, method and system for decoding a video data signal
KR20100027686A (ko) * 2008-09-03 2010-03-11 엘지전자 주식회사 이동단말기 및 그 제어 방법
US20100118938A1 (en) * 2008-11-12 2010-05-13 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoder and method for generating a stream of data
US9281847B2 (en) 2009-02-27 2016-03-08 Qualcomm Incorporated Mobile reception of digital video broadcasting—terrestrial services
JP5195550B2 (ja) * 2009-03-17 2013-05-08 沖電気工業株式会社 復号装置及び符号化システム
US9075883B2 (en) 2009-05-08 2015-07-07 The Nielsen Company (Us), Llc System and method for behavioural and contextual data analytics
SG176160A1 (en) * 2009-05-29 2011-12-29 Mitsubishi Electric Corp Image encoding device, image decoding device, image encoding method, and image decoding method
KR20100131365A (ko) * 2009-06-05 2010-12-15 한국전자통신연구원 채널 변경 지연을 줄이기 위한 스트리밍 서버, 이동 단말기 및 그 방법
CN101945261B (zh) * 2009-07-07 2014-03-12 中兴通讯股份有限公司 移动多媒体广播系统中分级传送、接收方法与装置
US9565479B2 (en) * 2009-08-10 2017-02-07 Sling Media Pvt Ltd. Methods and apparatus for seeking within a media stream using scene detection
KR101456498B1 (ko) * 2009-08-14 2014-10-31 삼성전자주식회사 계층적 부호화 단위의 스캔 순서를 고려한 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
US9288010B2 (en) 2009-08-19 2016-03-15 Qualcomm Incorporated Universal file delivery methods for providing unequal error protection and bundled file delivery services
US8285218B2 (en) * 2009-08-31 2012-10-09 The Nielsen Company (Us), Llc Methods and apparatus to identify wireless carrier performance effects
US9917874B2 (en) 2009-09-22 2018-03-13 Qualcomm Incorporated Enhanced block-request streaming using block partitioning or request controls for improved client-side handling
US9485546B2 (en) 2010-06-29 2016-11-01 Qualcomm Incorporated Signaling video samples for trick mode video representations
US8918533B2 (en) 2010-07-13 2014-12-23 Qualcomm Incorporated Video switching for streaming video data
US9185439B2 (en) 2010-07-15 2015-11-10 Qualcomm Incorporated Signaling data for multiplexing video components
US9596447B2 (en) 2010-07-21 2017-03-14 Qualcomm Incorporated Providing frame packing type information for video coding
US9319448B2 (en) * 2010-08-10 2016-04-19 Qualcomm Incorporated Trick modes for network streaming of coded multimedia data
JP5765920B2 (ja) * 2010-11-16 2015-08-19 キヤノン株式会社 送信装置および送信方法
US8842723B2 (en) * 2011-01-03 2014-09-23 Apple Inc. Video coding system using implied reference frames
KR101912472B1 (ko) * 2011-01-14 2018-10-26 선 페이턴트 트러스트 화상 부호화 방법, 화상 복호 방법, 메모리 관리 방법, 화상 부호화 장치, 화상 복호 장치, 메모리 관리 장치 및 화상 부호화 복호 장치
US8934530B2 (en) 2011-02-01 2015-01-13 Vidyo, Inc. Spatial scalability using redundant pictures and slice groups
US8958375B2 (en) 2011-02-11 2015-02-17 Qualcomm Incorporated Framing for an improved radio link protocol including FEC
US9270299B2 (en) 2011-02-11 2016-02-23 Qualcomm Incorporated Encoding and decoding using elastic codes with flexible source block mapping
US20120213275A1 (en) * 2011-02-22 2012-08-23 Kwon Nyeong-Kyu Scalable video coding and devices performing the scalable video coding
JP5833682B2 (ja) 2011-03-10 2015-12-16 ヴィディオ・インコーポレーテッド スケーラブルなビデオ符号化のための依存性パラメータセット
KR101803970B1 (ko) * 2011-03-16 2017-12-28 삼성전자주식회사 컨텐트를 구성하는 장치 및 방법
US10873772B2 (en) 2011-07-21 2020-12-22 V-Nova International Limited Transmission of reconstruction data in a tiered signal quality hierarchy
ES2800049T3 (es) 2011-08-25 2020-12-23 Sun Patent Trust Procedimientos y aparatos para codificar y decodificar vídeo utilizando una descripción actualizada de memoria intermedia
US9253233B2 (en) 2011-08-31 2016-02-02 Qualcomm Incorporated Switch signaling methods providing improved switching between representations for adaptive HTTP streaming
ES2625097T3 (es) 2011-09-07 2017-07-18 Sun Patent Trust Método de codificación de imágenes y aparato de codificación de imágenes
JP5932811B2 (ja) 2011-09-19 2016-06-08 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 画像復号方法、及び画像復号装置
US9131245B2 (en) 2011-09-23 2015-09-08 Qualcomm Incorporated Reference picture list construction for video coding
US20130089152A1 (en) * 2011-10-05 2013-04-11 Qualcomm Incorporated Signaling picture identification for video coding
US9843844B2 (en) 2011-10-05 2017-12-12 Qualcomm Incorporated Network streaming of media data
ES2924280T3 (es) 2011-10-19 2022-10-05 Sun Patent Trust Procedimiento de descodificación de imágenes y aparato de descodificación de imágenes
US9264717B2 (en) * 2011-10-31 2016-02-16 Qualcomm Incorporated Random access with advanced decoded picture buffer (DPB) management in video coding
US9930379B2 (en) 2012-01-31 2018-03-27 Comcast Cable Communications, Llc System and method for data stream fragmentation
US9294226B2 (en) 2012-03-26 2016-03-22 Qualcomm Incorporated Universal object delivery and template-based file delivery
CN108696759B (zh) * 2012-04-06 2020-11-17 索尼公司 解码装置和解码方法以及编码装置和编码方法
US9979959B2 (en) 2012-04-20 2018-05-22 Qualcomm Incorporated Video coding with enhanced support for stream adaptation and splicing
US9313486B2 (en) 2012-06-20 2016-04-12 Vidyo, Inc. Hybrid video coding techniques
FR2992815A1 (fr) * 2012-06-27 2014-01-03 France Telecom Procede de codage d'un bloc courant d'une premiere composante d'image par rapport a un bloc de reference d'au moins une deuxieme composante d'image, dispositif de codage et programme d'ordinateur correspondant
EP2869564A4 (en) * 2012-07-02 2015-09-23 Panasonic Ip Corp America IMAGE DECODING METHOD, IMAGE ENCODING METHOD, IMAGE DECODING DEVICE, IMAGE ENCODING DEVICE, AND IMAGE ENCODING AND DECODING DEVICE
CN104813663B (zh) * 2012-09-28 2018-05-22 索尼公司 编码设备、编码方法、解码设备和解码方法
JP6788346B2 (ja) 2012-10-01 2020-11-25 ジーイー ビデオ コンプレッション エルエルシー ベース層からの予測のための副ブロックの副分割の派生を使用するスケーラブルビデオ符号化
US20140119446A1 (en) * 2012-11-01 2014-05-01 Microsoft Corporation Preserving rounding errors in video coding
US9185437B2 (en) 2012-11-01 2015-11-10 Microsoft Technology Licensing, Llc Video data
US9940686B2 (en) * 2014-05-14 2018-04-10 Intel Corporation Exploiting frame to frame coherency in a sort-middle architecture
TWI548266B (zh) * 2014-06-24 2016-09-01 愛爾達科技股份有限公司 多媒體檔案儲存系統與相關裝置
US9848089B2 (en) 2014-11-05 2017-12-19 The Nielsen Company (Us), Llc Methods and apparatus to generate an overall performance index
US20170332096A1 (en) * 2016-05-11 2017-11-16 Advanced Micro Devices, Inc. System and method for dynamically stitching video streams
WO2017196582A1 (en) * 2016-05-11 2017-11-16 Advanced Micro Devices, Inc. System and method for dynamically stitching video streams
US10841621B2 (en) * 2017-03-01 2020-11-17 Wyse Technology L.L.C. Fault recovery of video bitstream in remote sessions
CN114745600B (zh) * 2022-06-10 2022-09-27 中国传媒大学 一种基于sei的视频标签标注方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04348690A (ja) * 1991-05-27 1992-12-03 Mitsubishi Electric Corp 画像蓄積伝送装置
JPH08265694A (ja) * 1995-12-30 1996-10-11 Sony Corp 符号化データ復号化方法及び符号化データ復号化装置
JPH11177987A (ja) * 1997-12-10 1999-07-02 Matsushita Electric Ind Co Ltd 映像情報処理装置及び方法
JP2005516498A (ja) * 2002-01-23 2005-06-02 ノキア コーポレイション ビデオ符号化における画像フレームのグループ化

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US626158A (en) * 1899-05-30 Device for opening or closing gates
JPS5617401A (en) * 1979-07-23 1981-02-19 Omron Tateisi Electronics Co Sequence controller
US5144426A (en) 1989-10-13 1992-09-01 Matsushita Electric Industrial Co., Ltd. Motion compensated prediction interframe coding system
NL9000424A (nl) 1990-02-22 1991-09-16 Philips Nv Overdrachtsysteem voor gedigitaliseerde televisiebeelden.
US5122875A (en) * 1991-02-27 1992-06-16 General Electric Company An HDTV compression system
US5786858A (en) * 1993-01-19 1998-07-28 Sony Corporation Method of encoding image signal, apparatus for encoding image signal, method of decoding image signal, apparatus for decoding image signal, and image signal recording medium
RU2123769C1 (ru) 1993-04-09 1998-12-20 Сони Корпорейшн Способы и устройства кодирования изображений и носители информации для записи изображений
EP1139670B1 (en) * 1994-03-25 2010-08-18 Nec Corporation Image reproducing device
JPH07322248A (ja) * 1994-05-30 1995-12-08 Matsushita Electric Ind Co Ltd 動画像データの伝送方法および伝送装置
DE19524808A1 (de) 1995-07-07 1997-01-09 Thomson Brandt Gmbh Verfahren, Encoder und Decoder zur Resynchronisierung auf einen fehlerbehafteten Datenstrom
US5774593A (en) * 1995-07-24 1998-06-30 University Of Washington Automatic scene decomposition and optimization of MPEG compressed video
US5877812A (en) 1995-11-21 1999-03-02 Imedia Corporation Method and apparatus for increasing channel utilization for digital video transmission
US5818539A (en) 1996-03-29 1998-10-06 Matsushita Electric Corporation Of America System and method for updating a system time constant (STC) counter following a discontinuity in an MPEG-2 transport data stream
CA2208950A1 (en) * 1996-07-03 1998-01-03 Xuemin Chen Rate control for stereoscopic digital video encoding
US6233017B1 (en) * 1996-09-16 2001-05-15 Microsoft Corporation Multimedia compression system with adaptive block sizes
JP4013286B2 (ja) * 1997-01-22 2007-11-28 松下電器産業株式会社 画像符号化装置と画像復号化装置
EP2173103A3 (en) * 1997-02-13 2010-09-08 Mitsubishi Denki Kabushiki Kaisha Moving picture prediction system
JP3861362B2 (ja) * 1997-03-19 2006-12-20 ソニー株式会社 ディジタル信号再生方法及び装置
US6167083A (en) * 1997-04-04 2000-12-26 Avid Technology, Inc. Computer system and process for capture editing and playback of motion video compressed using interframe and intraframe techniques
US6483875B1 (en) * 1997-06-19 2002-11-19 Sony Corporation Picture signal processing apparatus
US5852630A (en) * 1997-07-17 1998-12-22 Globespan Semiconductor, Inc. Method and apparatus for a RADSL transceiver warm start activation procedure with precoding
JP3529599B2 (ja) * 1997-09-02 2004-05-24 株式会社東芝 符号化装置における編集可能点挿入方法および符号化装置
US6295094B1 (en) * 1997-09-11 2001-09-25 U.S. Philips Corporation Instant replay of digital video optimized using non MPEG frame tags
US6307886B1 (en) * 1998-01-20 2001-10-23 International Business Machines Corp. Dynamically determining group of picture size during encoding of video sequence
TW416220B (en) 1998-01-23 2000-12-21 Matsushita Electric Ind Co Ltd Image transmitting method, image processing method, image processing device, and data storing medium
US6108382A (en) * 1998-02-06 2000-08-22 Gte Laboratories Incorporated Method and system for transmission of video in an asynchronous transfer mode network
US6510553B1 (en) 1998-10-26 2003-01-21 Intel Corporation Method of streaming video from multiple sources over a network
RU2137197C1 (ru) 1998-11-20 1999-09-10 Закрытое акционерное общество "АВ - ТЕХНОЛОГИЯ" Носитель информации для защиты от подделки изделий с идентификационным контрастным изображением
US6570922B1 (en) * 1998-11-24 2003-05-27 General Instrument Corporation Rate control for an MPEG transcoder without a priori knowledge of picture type
US6496980B1 (en) * 1998-12-07 2002-12-17 Intel Corporation Method of providing replay on demand for streaming digital multimedia
FI113124B (fi) 1999-04-29 2004-02-27 Nokia Corp Tiedonsiirto
US6639943B1 (en) 1999-11-23 2003-10-28 Koninklijke Philips Electronics N.V. Hybrid temporal-SNR fine granular scalability video coding
US6614936B1 (en) 1999-12-03 2003-09-02 Microsoft Corporation System and method for robust video coding using progressive fine-granularity scalable (PFGS) coding
CN1435055A (zh) * 1999-12-22 2003-08-06 通用仪器公司 使用空间可调性及同时传送编码的多投射环境的视讯压缩
WO2001084850A1 (en) 2000-04-27 2001-11-08 Koninklijke Philips Electronics N.V. Video compression
GB2362532B (en) * 2000-05-15 2004-05-05 Nokia Mobile Phones Ltd Video coding
US6920175B2 (en) 2001-01-03 2005-07-19 Nokia Corporation Video coding architecture and methods for using same
US7103669B2 (en) * 2001-02-16 2006-09-05 Hewlett-Packard Development Company, L.P. Video communication method and system employing multiple state encoding and path diversity
US20030012287A1 (en) * 2001-03-05 2003-01-16 Ioannis Katsavounidis Systems and methods for decoding of systematic forward error correction (FEC) codes of selected data in a video bitstream
JP4348690B2 (ja) 2004-02-11 2009-10-21 株式会社クマタカ エンジニアリング 路面性状測定装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04348690A (ja) * 1991-05-27 1992-12-03 Mitsubishi Electric Corp 画像蓄積伝送装置
JPH08265694A (ja) * 1995-12-30 1996-10-11 Sony Corp 符号化データ復号化方法及び符号化データ復号化装置
JPH11177987A (ja) * 1997-12-10 1999-07-02 Matsushita Electric Ind Co Ltd 映像情報処理装置及び方法
JP2005516498A (ja) * 2002-01-23 2005-06-02 ノキア コーポレイション ビデオ符号化における画像フレームのグループ化

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016063481A (ja) * 2014-09-19 2016-04-25 株式会社東芝 エンコード装置、デコード装置、ストリーミングシステム、および、ストリーミング方法

Also Published As

Publication number Publication date
KR20060069528A (ko) 2006-06-21
KR100959573B1 (ko) 2010-05-27
KR100931915B1 (ko) 2009-12-15
EP1670259A3 (en) 2010-03-03
US20060120464A1 (en) 2006-06-08
CN1288915C (zh) 2006-12-06
MXPA04007020A (es) 2004-10-11
RU2297729C2 (ru) 2007-04-20
BR0306958A (pt) 2004-11-03
JP4819562B2 (ja) 2011-11-24
US8204134B2 (en) 2012-06-19
EP1670259A2 (en) 2006-06-14
RU2006110321A (ru) 2007-11-10
EP1670260A3 (en) 2010-03-03
US8050321B2 (en) 2011-11-01
WO2003063505A1 (en) 2003-07-31
EP1479245A1 (en) 2004-11-24
JP2006279972A (ja) 2006-10-12
US20060120451A1 (en) 2006-06-08
JP2005516498A (ja) 2005-06-02
RU2004125579A (ru) 2006-01-27
CN1620820A (zh) 2005-05-25
RU2402886C2 (ru) 2010-10-27
KR20060069527A (ko) 2006-06-21
EP1670260A2 (en) 2006-06-14

Similar Documents

Publication Publication Date Title
JP4819562B2 (ja) ビデオ符号化における画像フレームのグループ化
US7894521B2 (en) Grouping of image frames in video coding
FI114433B (fi) Otossiirtymän koodaaminen videokoodauksessa
US7924921B2 (en) Signaling coding and display options in entry point headers
US7852919B2 (en) Field start code for entry point frames with predicted first field
US7609762B2 (en) Signaling for entry point frames with predicted first field
EP3158752B1 (en) Dependent random access point pictures
JP4928726B2 (ja) ビデオストリーム中の有効エントリポイントの指示
US20040218669A1 (en) Picture coding method
US20050135783A1 (en) Trick mode elementary stream and receiver system

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090519

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090818

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100112

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100408

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100413

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100707

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100824

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20101122

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20101126

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110802

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110901

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140909

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4819562

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term