JP3920356B2 - ビデオコーディング - Google Patents

ビデオコーディング Download PDF

Info

Publication number
JP3920356B2
JP3920356B2 JP52633998A JP52633998A JP3920356B2 JP 3920356 B2 JP3920356 B2 JP 3920356B2 JP 52633998 A JP52633998 A JP 52633998A JP 52633998 A JP52633998 A JP 52633998A JP 3920356 B2 JP3920356 B2 JP 3920356B2
Authority
JP
Japan
Prior art keywords
frame
sequence
frames
video
encoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP52633998A
Other languages
English (en)
Other versions
JP2001509329A (ja
JP2001509329A5 (ja
Inventor
ダルビイ、デイビッド
ホワイティング、リチャード・ジェイムズ
オードンネル、ジョン・マーティン
リーニング、アンソニー・リチャード
Original Assignee
ブリティッシュ・テレコミュニケーションズ、パブリック・リミテッド・カンパニー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ブリティッシュ・テレコミュニケーションズ、パブリック・リミテッド・カンパニー filed Critical ブリティッシュ・テレコミュニケーションズ、パブリック・リミテッド・カンパニー
Publication of JP2001509329A publication Critical patent/JP2001509329A/ja
Publication of JP2001509329A5 publication Critical patent/JP2001509329A5/ja
Application granted granted Critical
Publication of JP3920356B2 publication Critical patent/JP3920356B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/587Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Description

本発明は、ビデオ信号のコーディング、とくに、例えば128kbit/s以下であることが要求される低帯域幅伝送システムで伝送するビデオ信号のコーディングに関する。
約6MHzのアナログ帯域幅またはディジタル情報に対する100Mbit/sを超えたデータレートが、圧縮されていない品質の放送テレビジョン信号を送信するには必要である。このような高ビットレート信号は、帯域幅が制限されるシステムによって送信するには非実用的である。したがってビデオ信号を圧縮することによって情報量を低減する必要がある。これは隣接する画素(ピクセル)間の相関関係を利用すること、およびデータの低減と画像品質との間で妥協をはかることによって達成される。
ビデオ圧縮技術は、空間または時間、あるいはその両方における隣接するピクセル間の相関関係に依存する。例えば、比較的に均一な情景領域(例えば部屋の壁)内で1つのピクセルと、この領域内の隣接するピクセルとはかなり類似していることが多い。同様に、かなり静的な情景では、1フレームのピクセルは次のフレームの同等のピクセルと密接に対応することになる。したがって単一フレームのピクセルは互いの関連性に関係してコード化すること(イントラフレーム(フレーム内)コーディング)、または隣接するフレームのピクセルとの関係性に関してコード化すること(インターフレーム(フレーム間)コーディング)が可能である。フレーム内でコード化されるフレーム(イントラフレーム)は他のフレームを参照せずに明らかにデコードすることができ、フレーム間でコード化されるフレーム(インターフレーム)は予想で使用するフレームに関する情報を要求する。差分技術を使用してビデオ信号をさらに圧縮することもできる。差分コーディング技術では、フレーム間の差のみをコード化するので、全フレームをエンコードするのに必要なデータよりもデータ量が少ない。
種々のビデオ圧縮規格が開発されている。1例として、国際規格ISO−IEC11172、“Coding of Moving Pictures and Audio for Digital Storage Media at up to About 1.5Mbit/s(約1.5Mbit/s以下のディジタル記憶媒体のための動画およびオーディオのコーディング)”、すなわちMPEG1として知られているものがある。この規格は、ディジタル記憶媒体、例えばCD−ROM、ディジタルオーディオテープ(DAT)、テープドライバ、書込み可能な光ドライバ上にビデオおよび関係するオーディオを記憶するため、または遠隔通信チャンネル上で伝送するために開発された。MPEG1の規格にしたがって、イントラフレームはデータ流内に規則正しい間隔で含まれており、ビデオ信号へのランダムアクセスおよびその編集を可能にする。規則正しいイントラフレームはビデオ信号との対話も可能である。すなわちユーザはビデオ信号の高速前送りおよび高速巻き戻しを要求することができ、これは、標準の再生が要求されるまではビデオ信号のIフレームをユーザに示すことによって達成することができる。しかしながらこれは、イントラフレームおよびインターフレームの両方を含むビデオ信号の標準プレイバックモードと比較して、画像ごとの標準ビットレートを高める。
低データレートシステムに関する規格も発展してきた。例えば、ITU規格H.261は(ISDNネットワークでの通信において)動画のコーディングをn×64kbit/s(尚、nは1乃至30の整数)のレートで行ない、ITU規格H.263では(PSTNネットワークでの通信において)動画のコーディングを64kbit/sよりも低いデータレートで行なう。これらのコーディング方式は、イントラフレームを常に含む必要はない。ビデオ呼の途中で、エラー状態が受信機によってまたはおそらくは情景変化するときに検出されるとすると、一般にイントラフレームのみが送られる。これはMPEG1(全データの重要な部分を表すイントラフレーム用に生成されたデータ)と比較して平均データレートが低減することを意味する一方で、データへの明確なアクセスポイントはスタート以外にはないので、対話機能、例えば高速前送りまたは巻き戻し機能を準備することはできない。したがってH.261およびH.263コーディング方式は、ユーザが対話できるビデオ流(ストリーム)を準備するのに適していない。
N Farber、E Steinbach、およびB Griodによる文献“Robust H.263 Compatible Transmission for Mobile Video Server Access”(IEEE First International Workshop on Wireless Image/Video Communicationsで発表された。Loughbourough University, UK, 1996年9月4-5日開催)には、H.263でエンコードされたビデオ流へのランダムアクセスを可能にする方法として、周期的なイントラフレームのオーバーヘッドを要求しない方法が開示されている。この文献によると、2つのデータ流が記憶され、一方のデータ流(いわゆるP流)は標準プレイバックモードで送られるインターフレームから成る。第2のデータ流(いわゆるI流)はイントラフレームから成る。これは主としてエラー回復に使用されるが、ビデオ信号についてのランダムアクセスは、ユーザによって要求されるときに、送られた信号にイントラフレームを挿入することによって行われることに注意すべきである。したがって正確な用語では、周期的なイントラフレームなしにインターフレームのコード化された信号が送られ、ビデオ流へのランダムアクセスが要求されるときに、イントラフレームのみが送られる。
文献に示唆されているように、イントラフレームを挿入することにより、いわゆるP流から再構成されたフレームと対応するイントラフレームから再構成されたフレームとの間の差から“不整合”エラーが生じる。文献にはこのエラーを低減して、もとのビデオ信号からではなく、P流の再構成されたフレームからイントラフレームをコード化することを示唆している。
本発明にしたがって、動画を表すビデオ信号のコーディング方法であり:
ビデオ信号の連続するフレームを受取ること;
ビデオ信号の先行するフレームを参照してビデオ信号の各フレームをコード化し、構成されたときに、動画の第1のプレイバックモードを表す第1の組のデータを生成すること;
ビデオ信号のフレームをコーディングし、再構成されたときに、動画の第2のプレイバックモードを表す第2の組のデータを生成すること;
第1の組のデータをデコードして、第1の再構成されたビデオ信号を生成すること;
第2の組のデータをデコードして、第2の再構成されたビデオ信号を生成すること;
第2の再構成されたビデオ信号のフレームと、第2のビデオ信号のフレームに後続するフレームに対応する第1の再構成されたビデオ信号のフレームとの間の差を計算すること、および差が閾値を超えたとき、差をコーディングし、別の組のデータを生成することとを含む方法を提供する。
したがって、第2および別の組のデータから再構成されたフレームは、要求されるイントラフレームに対してフレームごとのビットレートを著しく増加せずに、P流のリンクされたフレームに密接に整合する。
好ましくは、第2の組のデータはビデオ信号の別のフレーム、すなわちコード化されたイントラフレームを参照せずに生成される。これらのIフレームを使用して、高速前送りおよび高速巻き戻し機能を準備することができる。
第2の組のデータは、第1の組のデータを生成するのに使用するものよりも粗い量子化ステップサイズを使用して生成することができ、別の組のデータは、第1の組のデータを生成するのに使用されると、第2の組のデータを生成するのに使用されるのとの中間の量子化ステップを使用して生成することができる。したがって、イントラフレームのコード化された画像は、画像ごとの最大ビットを超えずにエンコードすることができ、別の組のデータは第2の組のデータから生成された画像の品質を向上する。
好ましくは、別の組のデータは第2の再構成されたビデオ信号のフレームと結合され、この第2のビデオ信号のフレームと第1のビデオ信号のフレームとの間の差が計算され、差が閾値を超えるとコード化され、さらに別の組のデータを生成する。これらの結合、計算、およびコーディング段階は、基準が満たされるまで反復的に実行される。適切な基準では、ステップは第2の再構成されたビデオ信号の各フレームに対して、一定の回数、例えば2回、または差が閾値より低くなるまで実行される。
ここで添付の図面を引用して例示的に本発明をさらに記載することにする。
図1は、本発明にしたがってエンコードが行われたエンコードされたビデオ信号を含む対話式ビジュアルサービスシステムを示す。
図2は、本発明のビデオエンコーダのブロック図を示す。
図3は、本発明にしたがって生成された、高速前送りおよび高速巻き戻しが可能なデータを示す。
図4は、高速前送り、高速巻き戻し、および一層頻繁な一時停止の利用が可能な、本発明の別の実施形態にしたがって生成されたデータを示す。
図5は、制御リストが再生モードでどのように使用するかを示す。
図6は、図5で示された制御リストの要素例である。
図7は、制御リストを使用して、ビデオサーバによってビット流をどのように生成するかを示す例である。
図1は、対話式ビデオシステム、いわゆるビデオオンデマンドシステムを示し、ユーザが要求しているユーザによって選択されるビデオを表すビット流を提供する。システムはビデオサーバ2を含み、ビデオサーバ2は映画、ドキュメンタリ、などのような動画を表すエンコードされたビデオ信号のメモリ4と共働する。複数のユーザ端末6は、伝送リンク7、例えばPSTN、ISDN、無線衛星、などを介してビデオサーバ2に接続される。各ユーザには、ビデオサーバ2を制御するための手段(図示されていない)が備えてある。サーバへのリターンパス8はこれらの制御信号を送るために準備されている。このリターンパスは、信号をサーバ2から端末6または別の伝送媒体へ送るのに使用されるのと同じ伝送媒体を経てもよい。
使用の際に、ユーザは再生される動画を選択し、制御信号はリターンパス8を介してサーバへ送られる。サーバ2は、選択されたビデオ信号を確認し、メモリ4内のビデオ信号の場所を識別し、ビデオメモリ4から要求を出しているユーザ端末6へのパス7を設定し、選択されたビデオ信号を端末へ送る。このオペラビリティ(実行可能性)を備えているサーバはビデオオンデマンドのフィールドで知られており、本発明はサーバにとくに影響を及ぼさない限り、本明細書ではさらに記載しないことにする。
メモリ4内のビデオ信号は、適切なコーディング方式にしたがってエンコードすることができる。
多くの現在のコーディング方式、例えばH.261/263およびMPEG規格において、送られるビット数を低減する量子化として知られているプロセスがある。画像は離散的余弦変換(Discrete Cosine Transformation)(DCT)を使用して、空間領域から周波数領域へ変換される。生成されたデータは、周波数成分を増加するオーダで走査され、その後定数で量子化または除算され;閾値よりも低い除算結果は全て捨てられる。高い方の周波数成分は普通、低い方の周波数成分よりも低い値をもち、したがって定数で除算するとき、高い周波数成分の多くは捨てられる。エンコーダは量子化器によって除数として使用される数を選択し、合理的な数のフレームをチャンネルへ送ることを保証する。例えば、エンコードされるビデオシーケンス内に多くの詳細または動きがあるとき、エンコーダは量子化値を増加し、信号をエンコードするのに使用されるフレーームごとのビット数(またはマクロブロック)を低減する。粗い量子化器の使用により他の望ましくない影響が生じる;送られるピクセル内において、デコードされる計数値は大きいステップをもち、したがって信号対雑音比が低く、‘斑がある(blocky)’ように見える像を生成する。
ここで本発明の第1の実施形態を、本発明のエンコーダを示す図2を引用して記載することにする。エンコーダは入力11およびエンコーディング手段12を含み、エンコーディング手段12はDCT係数を出力するDCT計算ユニット14およびDCTユニット14の出力を量子化する量子化器16から形成されている。量子化器16の出力は可変長コーダ(VLC)18および逆量子化器21に接続される。量子化器16および逆量子化器21の量子化ステップサイズは制御ユニット22によって制御される。VLC18は制御ユニット22へ接続され、VLCの動作状態に関係する制御ユニットへ情報を送る。制御ユニットは量子化器16および逆量子化器21の量子化ステップサイズを変更し、コード化されたデータを選択されたコーディング方式により許されている画像ごとの最大ビットの制限範囲内に維持する。
したがって、コード化されるビデオ信号の全フレームを必ずしもエンコードしなくてもよい。制御ユニット22は、フレームをエンコードするのに必要なデータ量が多過ぎるときは、フレームを落とすことができる。
逆量子化器21および反転DCTユニット24はローカルデコーダ25を形成する。インターフレームコーディングにおいて、ローカルでコーダによってデコードされる画像はフレームメモリ(FS)26へ入力される。エンコードされる次のフレームが入力10でエンコーダへ送られるとき、減算器28はエンコーダへ入力されるフレームとフレームメモリ26の内容との間の差を計算する。動きの推定は通常の動作推定器31によっても行なうことができ、このとき、フレームメモリ26の内容は動作ベクトルにしたがって変更される。このような動きの推定はビデオコーディングの領域ではよく知られており、ここではさらに記載しないことにする。
インターフレームコーディングでは、加算器32においてフレームメモリ26の内容は、減算器28によって計算した差をフレームメモリ26へ加算することによって更新される。エンコーダの出力はローカルメモリ34内に記憶される。
本発明の第1の実施形態(図3を引用して記載することにする)にしたがうと、ビデオ信号のエンコーディングにはエンコーダを通るいくつかのパスが必要である:
1.要求されるコーディング方式にしたがって、正常のプレイバックモードのビット流に対応する第1の組のデータ10を生成する第1のパス。例えば、H.261またはH.263のコード化されたビデオでは、このビット流は最初のIフレームとそれに続くPフレームから成る。この第1の組のデータ10はローカルメモリ34に記憶される。
2.ビデオ信号の第2のプレイバックモードを表す第2の組のデータ20、(例えば、高速前送りまたは高速巻き戻し)を生成する第2のパス。このパスは、第1のビット流との間でリンクを定めている制御構成についての制御リスト内のエントリと一緒に、高速前送りおよび巻き戻しに適したより低いビットレートでIフレームのシーケンスI'I'I'I'を生成する。制御ユニット22は、エンコーディングループからローカルでコーダ25を切り放す(スイッチアウトする)。制御ユニットは、要求された高速前送り/高速巻き戻しモードと互換性のあるビットレートでこの第2の組のデータを生成するようにプログラムされている。例えば、標準速度の10倍の高速前送り/高速巻戻しプレイバックモードが要求されるとすると、第2の組のデータは標準プレイバックモードの平均ビットレートの1/10倍で生成される。第2の組のデータ20は関係する制御リストをもつローカルメモリ34内に記憶される。
3.追加のP',P",P'''フレーム30を生成する後続のパス。第2の組のデータ20のIフレームはP',P",P'''のシーケンスのための開始ポイントとして使用され、第2の組のデータ20のデコードされたフレームI'は制御ユニット22によってフレームメモリ26へロードされる。エンコードされた標準ビット流10(すなわち、パス#1内で生成されるビット流)内のPフレームは、Pフレームを再び結合するポイントでデコードされ、P(n)としてエンコーダの入力11へ供給される。減算器28は、フレームメモリ26内の画像I'と標準プレイバックビット流内の再構成された目標P(n)フレームとの間の差を計算する。2つのものの差が所定の閾値よりも小さいときは、エンコードプロセスは停止することになる。閾値よりも大きいときは、差はP'としてエンコードされ、第3の組のデータとしてローカルメモリ34に記憶される。次にP'はデコードされ、加算器32によってフレームメモリ26へ加算され、制御ユニットは再び計算を開始し、フレームメモリの内容とフレームP(n)の内容の差をエンコードして記憶する。これは、エンコーダP(n)への入力およびフレームメモリ26の内容とが収束して、2つの間の差が所定の閾値よりも小さくなるまで継続する。このデータP,'P",P'''は第3の組のデータとして記憶される。したがって可変数の追加のP'フレームを、第2のプレイバックモードの各フレームに対して生成することができる。
本発明のより簡単な形態では、エンコーダは定数のフレームに対して作動して、定数のP'フレームを生成することができる。実地の経験から、3つのP'フレーム、P',P",およびP'''が許容できる結果を与えることが分かる。
したがって、ビデオ信号の標準プレイバックモードを表す第1の組のデータ10は、第2のプレイバックモード(高速前送り/高速巻戻し)I'I'I'I'I'......を表す第2の組のデータ20および標準プレイバックモードビット流10を再び結合できるようにする別の組のデータ30、P',P",P"と一緒に、PPPPP......を生成する。これらの組のデータは、データの組間のリンクを記録する関係する制御リスト(下記参照)と一緒にローカルメモリ34に記憶される。
高速前送り/高速巻き戻しモード用のイントラフレームは、正常プレイバックモードビット流のビットレートと比較して低減したビットレートでエンコードされる。I'フレームとI'フレームにリンクされた正常プレイバックモードビット流のフレームとの間の差はエンコードされて、追加のP'フレームを形成する。エンコーダの制御ユニット22は、追加のP'フレーム内のマクロブロックごとに、次のやり方で量子化器ステップサイズを自由に変更する。エンコーダは、図3に示したように各I'フレームをそれぞれP',P",およびP'''としてエンコードした後で追加のPフレームを付加する。各Iフレームの後にエンコードされるPフレームの数は、素材がエンコードされるときに、プログラマブルであり、本発明に対して基数的なものでない。
したがって各I'フレームは比較的粗い量子化器ステップサイズ(例えば、H.261コーディング方式のレベル8)でエンコードされて、I'フレームを形成するために送られるビット数がコーディング方式のビット/映像制限の最大数に含まれることを保証する。このI'フレームは、デコードされて表示されると、わずかに不鮮明で斑があるように見える。次のPフレーム、P'も比較的粗い量子化器のステップサイズを使用し、像をさらに鮮明にする。H.261およびH.263の仕様では一層細かい量子化器のステップサイズのみが低ピクセル値を認めていることに注意したい。I'フレームが(間接的に)リンクされているメインビット流のフレームに収束するためには、実際はI'フレームには2以上の追加のPフレームP',およびP",P'''が続き、画像をPフレームのメインビット流によって得られる鮮明度と比較可能なレベルにまで鮮明にする。第1のフレームP'は規格(例えば、H.261コーディング方式のレベル8)において特定される全範囲のピクセル値を許容し、第2のフレームP"はさらに細かい量子化器ステップサイズ(例えば、H.261コーディング方式のレベル4)で、メインビット流と比較可能な映像品質を達成する。P'およびP"フレーム間の差の大きさが255よりも小さいことが予測されるとき、より低い範囲のピクセル値を許容できる。次のP'フレームP'''はさらに細かい量子化ステップサイズ(例えば、H.261コーディング方式のレベル1)を使用する。
この技術の長所の中には、高速前送りまたは高速巻き戻しが要求されるとき、第1のフレームI'が端末によって受取られるまで遅延が少なくなることである。継続するI'フレームが、サーバ2を要求して正常のプレイバックモードを再開する制御信号がユーザ端末6から受取られるまで送り続けられる。再生される最後のI'フレームと関係する追加のP'フレームが送られて、信号を、正常のビット流から再生されることになる次のフレームによって表わされるフレームに収束するようになる。この方法は、次第に細かくなる量子化器ステップサイズをもつI'フレームの後に、このコーディング方式によって支援される最良の画像品質に収束できるように、追加のPフレームを幾つでも含むように広げることができる。
Pフレームの正常のシーケンスをかなり時間の間送ることによって差が永続するようになるので、最後の追加のフレームP'''は、フレームP'''がリンクされるデータ10の正常にエンコードされたフレームとはほとんど違いないものになるべきである。これらの違いは、H.261およびH.263規格の一部分として特定される“組織的な更新(systematic update)”プロセスによって特定のマクロブロックに対してのみ取り除かれることになる。
したがって、粗く量子化されたI'フレームは、MPEGまたはH.261規格の標準のI−フレームよりも送るビット数は少なくてよいので、少ない遅延で送られる。次の追加のPフレームは粗の量子化から生じるアーティファクトを取り除き、粗く量子化されたIフレームとP'フレームとの間の大きな予測される差をエンコードする。最後のP'''フレームは量子化され、標準のビット流とうまく整合する。
これにより、追加のアーティファクトを、表示されることになる信号に挿入せずに高速前送りおよび高速巻き戻しが可能になり、この信号はそこでビデオ信号の正常のプレイバックモードを永続させるようにする。高速前送りおよび高速巻戻しによる高速化は、シーケンスがエンコードされる時に定められる。ハイスピードの高速前送りおよび高速巻戻しが要求されると、多数のPフレームが各Iフレーム間でエンコードされることになり、また各Iフレーム間にかなりの時間が存在することになる。例えば、記憶した素材が128kbit/sの中間ビットレートでエンコードされ、10倍のスピードアップファクタが高速前送りおよび巻戻しに要求されると、I'フレームは12.8kbit/sの平均ビットレートでエンコードされることになる。
一時停止が要求されるときは、ユーザの端末は現在デコードされたフレームを表示することができる。しかしながらデコードされたフレームがユーザのディスプレイ上で維持されるときには、映像のアーティファクトは観察者にとってより明らかになる。
したがってその代りに、第2の組のデータのI'フレームに対する次のリンクに到達するまでは、サーバ2は正常のプレイバック信号を送り続けることができる。I'フレームおよび次のP',P",P'''フレームはそこでディスプレイへ送られる。しかしながら、ビデオ信号の正常のプレイバックレートよりも著しく速いレートで高速前送りがエンコードされるとすると、次のI'フレームに到達する前にかなりの遅延があってもよい。
本発明の第2の実施形態にしたがって、図4に示したように、高速前送りおよび高速巻き戻しに対するIフレームよりも比較的に一層頻繁に、複数の一時停止のシーケンスP、P',PP",PP'''がエンコードされる。各PP'一時停止シーケンス40aは、正常のプレイバックモードの再構成されたフレームPnと元のビデオ信号の対応するフレームFnとの間の差を計算することによってエンコードされる。一時停止シーケンス40は別の組のデータとしてもメモリ34内に記憶される。
一時停止シーケンスのためのエンコーディングプロセスは、高速前送りおよび高速巻き戻しに使用されるプロセスに類似しているが、この場合は最初のIフレームは生成されない:
1.正常のプレイバックモードビット流に対応する第1の組のデータ10はデコードされ、フレームは、ローカルメモリ34からのエンコーダのフレームメモリ26はへロードされる。
2.第2のプレイバックモード、すなわち一時停止(ポーズ)を表す別の組のデータ40が生成される。この別の組のデータは、ビデオ信号の元のフレームF(n)をエンコーダ入力11に入力して、フレームP'''メインビット流10の対応するデコードされたフレームをもつフレームメモリ26にロードすることによって生成される。2つのフレーム間の差が計算され、閾値よりも大きいときには、関係する制御リストをもつローカルメモリ34内の一時停止フレームPP'としてエンコードされ、記憶される。
3.次にPP'はデコードされ、加算器32によってフレームメモリ26に加算され、制御ユニットは再びフレームメモリの内容とフレームF(n)の間の差の計算を開始する。これは、エンコーダF(n)への入力およびフレームメモリ26の内容が収束して、2つの間の差が所定の閾値よりも小さくなるまで続く。したがって可変数のPP'の一時停止フレームは一時停止モードの各フレームに対して生成することができる。
明らかに、生成された最後のPP'フレームは正常のビット流10内の対応するフレームから発散している。これは多数のやり方で処理することができる:
a)特定の一時停止ポイントの最後のPP'と関係する制御リストへのエントリは次のI'フレームにリンクされ、例えば図4では高速前送りデータ組で行われ、PP'はI'1にリンクされる(図4の参照符号42参照)か;または、
b)別のデータをエンコードして、一時停止フレームPP'によって表される映像を正常のプレイバックビット流10内で再構成されたPフレームへ収束させるようにする。こうして図4の参照符号44に示されているように、最後PP'フレームと関係するリンク内のエントリは次のPフレームへリンクされる。第1の実施形態を引用して記載したのと同じやり方で、一時停止ポイントがリンクされことになるメインビット流10についてのデコードされたフレーム(例えば、次のフレームPX+1)が、入力11を介してエンコーダに入力され、一方でデコードされた最終の一時停止フレームPP'''はフレームメモリ26にロードされる。第1の実施形態に関して、減算器への2つの入力が収束するかまたは一定の数の反復が行われるまで、入力フレームPX+1とフレームメモリ26の内容との間の差はエンコードされて、再生再開フレームおよび関係する制御リストを形成する。
インターフレームはイントラフレームよりも含んでいるビットが少ないので、一時停止モードに対してPP'フレームだけを使用することは、サーバに記憶されたビデオデータ量を著しく増加せずに、より多くの一時停止ポイントを挿入できることを意味する。
種々の源からのオーディオビジュアル素材をコード化することができ、エンコードされたビット流は、ビデオサーバ2のメモリ4に後の段階で記憶するための大容量のメモリシステム、すなわち典型的にはハードディスクドライバまたはCD−ROM上に記憶される。
したがって、本発明においてはエンコーディングプロセスは、素材が処理され、記憶媒体に記憶されるときのみ行われる。素材は伝送帯域幅および支援されることになる端末の種類を支援するのに要求されるいくつかのレートで記憶できる。一般にオーディオビジュアル素材はPSTN、ISDN、LAN、またはADSLネットワーク上で送られ、エンコーディングプロセスはそれぞれ要求レートで行なわれる。
記憶された素材は、エンコードされたビット流をデコードできるクライアント端末6および関係するオーディオコーディングアルゴリズムによってアクセスできる。制御チャンネル8は、高速前送り、高速巻き戻し、一時停止、および他のモードを行なうことができるサーバの制御を可能とするのに要求される。現在、この制御機構に対するITU規格はない。図1はこのような構成を示している。
オーディオビジュアル素材がクライアント端末によって要求されるとき、サーバによって要求される追加のデコーディング/エンコーディング/リコーディング(re-coding)プロセスなしに、素材を規格に従う端末へ直接に送り出すことができる。したがって比較的に廉価なサーバは記憶された素材への多くの同期アクセスを支援できる。
クライアントデコーダからのコマンドを使用して、サーバが送るビット流を制御する。送られたビット流の構成要素はサーバ上で保持される制御リストによって制御される。図5において、F0乃至F9はエンコードされる素材の元のフレームを表し、固定フレームレートで行われる。Pnは、デコーダによって構成されることになる標準プレイバックモードの予測されるフレームを表わし、B(n,m)はビット流を表し、このビット流を送るとき、デコーダはPnからPmへ移動できる。
制御リストはコーディング中に生成され、サーバによるメモリ4からのアクセス用記憶媒体に保持される。制御リスト50は、メモリ内に保持される異なるフレームからのリンクを含む。ビット流の各要素ごとに1つの制御リストがあり、B(0,1)乃至B(N,N+1)のラベルを付けられている。図5にはビデオ流が示されており、1つの制御リストから次の制御リストヘ‘再生’リンクが続いている。
制御リスト内の要素の例は図6に示した。各制御リストまたはブロック50は:ビット流識別子51;デコーダによってビット流を再生できるエンコードされた信号の開始に対して最も早い時間を示すタイムスタンプ52;メモリ内のフレームの圧縮されたビット流のピストンを示すファイルオフセット53;フレーム内のビット数を示すビット流サイズ54;プレイバックモードで再生される次の制御リストの識別子を示す再生リンク55;巻き戻しプレイバックモードで再生される次の制御リストの識別子を示す再生逆送りリンク56;高速前送りモードで再生される次の制御リストの識別子を示す高速前送りリンク57;高速巻き戻しモードで再生される次の制御リストの識別子を示す高速巻き戻しモード58;一時停止モードで再生される次の制御ブロックの識別子を示す一時停止リンク60;およびプレイバックモードを再開するときに再生される次の制御リストの識別子を示す再スタートリンクとを含む。
図7は、エンコードされたビデオ信号の一部分に対する制御リストを示す。制御リスト501乃至506は標準プレイバックモードのPフレームを表す。制御リスト507乃至509は、高速前送り/高速巻き戻し(rewind)に対して生成されたI'フレームと関係付けられている。制御リスト510乃至518は、高速前送り画像を標準再生ビット流の再結合ポイントへ集中させるのに生成される追加のP'フレームと関係付けられている。
図7は、一時停止シーケンスPP'を示していないが、類似の制御リストは、要求に応じてこの、および他の再生モデルに対して記憶されることが分かるであろう。

Claims (3)

  1. 動画を伝送する方法であって、該方法は、
    該動画の第1のプレイバックモードに関するエンコードされたフレームの第1のシーケンスを記憶することと、
    該動画の第2のプレイバックモードに関するエンコードされたフレームの第2のシーケンスを記憶することと、
    該第2のシーケンスのフレームの伝送中に、第1のプレイバックモードへの切換え要求を受領することと、
    前記要求に応答して、該第2のシーケンスのフレームの伝送を終了し、適切なエントリポイントで始まる該第1のシーケンスからのフレームへ切り換えることと、を含み、
    該第1のシーケンスはインターフレームコーディングを用いてエンコードされ、
    前記方法は、該第2のシーケンスのフレームの伝送を終了した後で該第1のシーケンスからのフレームへ切り換える前に、1)伝送の終了のポイントで該第2のシーケンスの局部的にデコードされたフレームと、2)該第1のシーケンスへのエントリポイントでの局部的にデコードされたフレームとの間の差を表す遷移データを送信することを含む方法
  2. 前記遷移データは、該第1のシーケンスの局部的にデコードされたフレームと該第2のシーケンスの局部的にデコードされたフレームとの間の差の量子化されたバージョンである第1の組の遷移データと、
    第1のシーケンスの局部的にデコードされたフレームと該第1の組の遷移データに加えられた該第2のシーケンスの局部的にデコードされたフレームとの間の差の量子化されたバージョンを表す別の組の遷移データと、を含む請求項1に記載の方法。
  3. 該第2のシーケンスは画像の一時停止モードに対応し、該一時停止モードのエンコードされたフレームは該第1のシーケンスのデコードされたフレームと元のビデオ信号の対応するフレームとの間の差を反復してエンコードすることによって生成される請求項1または請求項2に記載の方法。
JP52633998A 1996-12-10 1997-12-01 ビデオコーディング Expired - Lifetime JP3920356B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP96308943 1996-12-10
EP96308943.8 1996-12-10
PCT/GB1997/003296 WO1998026604A1 (en) 1996-12-10 1997-12-01 Video coding

Publications (3)

Publication Number Publication Date
JP2001509329A JP2001509329A (ja) 2001-07-10
JP2001509329A5 JP2001509329A5 (ja) 2005-08-11
JP3920356B2 true JP3920356B2 (ja) 2007-05-30

Family

ID=8225177

Family Applications (1)

Application Number Title Priority Date Filing Date
JP52633998A Expired - Lifetime JP3920356B2 (ja) 1996-12-10 1997-12-01 ビデオコーディング

Country Status (9)

Country Link
US (1) US6002440A (ja)
EP (1) EP0945023B1 (ja)
JP (1) JP3920356B2 (ja)
CN (1) CN1207921C (ja)
AU (1) AU726129B2 (ja)
CA (1) CA2274181C (ja)
DE (1) DE69715660T2 (ja)
ES (1) ES2184137T3 (ja)
WO (1) WO1998026604A1 (ja)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000013777A (ja) * 1998-06-26 2000-01-14 Matsushita Electric Ind Co Ltd 映像再生装置及び映像蓄積装置
US6499060B1 (en) 1999-03-12 2002-12-24 Microsoft Corporation Media coding for loss recovery with remotely predicted data units
US7190883B2 (en) * 1999-06-18 2007-03-13 Intel Corporation Systems and methods for fast random access and backward playback of video frames using decoded frame cache
EP1187379B1 (en) 2000-08-01 2005-03-16 Command Audio Corporation Method and signal for transmitting a broadcast program to a wireless receiver
ATE464740T1 (de) * 2000-12-15 2010-04-15 British Telecomm Übertagung von ton- und/oder bildmaterial
US6765963B2 (en) 2001-01-03 2004-07-20 Nokia Corporation Video decoder architecture and method for using same
US20020122491A1 (en) 2001-01-03 2002-09-05 Marta Karczewicz Video decoder architecture and method for using same
US7693220B2 (en) 2002-01-03 2010-04-06 Nokia Corporation Transmission of video information
US7277486B2 (en) 2002-05-03 2007-10-02 Microsoft Corporation Parameterization for fading compensation
US7609767B2 (en) 2002-05-03 2009-10-27 Microsoft Corporation Signaling for fading compensation
US7463684B2 (en) 2002-05-03 2008-12-09 Microsoft Corporation Fading estimation/compensation
EP1563689B1 (en) 2002-11-18 2008-10-01 British Telecommunications Public Limited Company Transmission of video
GB0306973D0 (en) 2003-03-26 2003-04-30 British Telecomm Transmitting video
US6784811B1 (en) * 2003-03-31 2004-08-31 Scopus Network Technologies Ltd. System and a method for an ultra-low delay MPEG-syntax video codec
US7577198B2 (en) * 2003-09-07 2009-08-18 Microsoft Corporation Number of reference fields for an interlaced forward-predicted field
US8085844B2 (en) 2003-09-07 2011-12-27 Microsoft Corporation Signaling reference frame distances
US8009739B2 (en) 2003-09-07 2011-08-30 Microsoft Corporation Intensity estimation/compensation for interlaced forward-predicted fields
US8634413B2 (en) 2004-12-30 2014-01-21 Microsoft Corporation Use of frame caching to improve packet loss recovery
KR100716998B1 (ko) * 2005-05-24 2007-05-10 삼성전자주식회사 블록화 현상을 감소시키기 위한 부호화 및 복호화 장치 및그 방법과, 이를 구현하기 위한 프로그램이 기록된 기록매체
US20080065676A1 (en) * 2006-09-13 2008-03-13 Hause Curtis B System and method for tracing data storage devices
JP4875008B2 (ja) 2007-03-07 2012-02-15 パナソニック株式会社 動画像符号化方法、動画像復号化方法、動画像符号化装置及び動画像復号化装置
US8098333B2 (en) * 2007-06-29 2012-01-17 Seiko Epson Corporation Phase shift insertion method for reducing motion artifacts on hold-type displays
JP2009111932A (ja) * 2007-10-31 2009-05-21 Panasonic Corp 動画像復号化装置
EP2101503A1 (en) 2008-03-11 2009-09-16 British Telecommunications Public Limited Company Video coding
EP2200319A1 (en) 2008-12-10 2010-06-23 BRITISH TELECOMMUNICATIONS public limited company Multiplexed video streaming
EP2219342A1 (en) 2009-02-12 2010-08-18 BRITISH TELECOMMUNICATIONS public limited company Bandwidth allocation control in multiple video streaming
EP2733903B1 (en) * 2012-11-20 2017-02-15 Alcatel Lucent Method for transmitting a video stream

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0691788A1 (en) * 1992-03-24 1996-01-10 Kabushiki Kaisha Toshiba Variable length code recording/playback apparatus
US5717816A (en) * 1993-01-13 1998-02-10 Hitachi America Ltd. Method and apparatus for the selection of data for use in VTR trick playback operation in a system using intra-coded video frames
GB9405487D0 (en) * 1994-03-21 1994-05-04 Rca Thomson Licensing Corp VSB demodulator
SG43131A1 (en) * 1994-03-23 1997-10-17 British Telecomm Video signal coding
JP3172635B2 (ja) * 1994-07-14 2001-06-04 シャープ株式会社 ディジタル記録再生装置
KR970004637B1 (ko) * 1994-07-18 1997-03-29 엘지전자 주식회사 디브이씨알(dvcr)의 변속 재생 방법
JP3277713B2 (ja) * 1994-08-31 2002-04-22 ソニー株式会社 ディジタルビデオ信号の記録装置、記録再生装置及び再生装置

Also Published As

Publication number Publication date
CA2274181A1 (en) 1998-06-18
EP0945023B1 (en) 2002-09-18
AU726129B2 (en) 2000-11-02
CN1240092A (zh) 1999-12-29
EP0945023A1 (en) 1999-09-29
JP2001509329A (ja) 2001-07-10
WO1998026604A1 (en) 1998-06-18
DE69715660D1 (de) 2002-10-24
AU5129898A (en) 1998-07-03
US6002440A (en) 1999-12-14
CA2274181C (en) 2009-10-20
DE69715660T2 (de) 2003-07-31
ES2184137T3 (es) 2003-04-01
CN1207921C (zh) 2005-06-22

Similar Documents

Publication Publication Date Title
JP3920356B2 (ja) ビデオコーディング
US6862402B2 (en) Digital recording and playback apparatus having MPEG CODEC and method therefor
JP4109113B2 (ja) ビデオ伝送におけるビットストリーム間の切換
KR100844816B1 (ko) 간결한 트랜스코딩 힌트 메타데이터를 생성하는 방법 및장치
JP4571489B2 (ja) ビデオ符号化システムにおける量子化器パラメータを表示するための方法および装置
US20050169371A1 (en) Video coding apparatus and method for inserting key frame adaptively
JPH10136386A (ja) 符号化ビデオ信号処理方式
KR20020027551A (ko) 소비자 셋톱 저장응용을 위한 트랜스코딩
JP3519673B2 (ja) 動画データ作成装置及び動画符号化装置
JP3651706B2 (ja) 動画像符号化装置
JP2011512767A (ja) ビデオ・ストリーミング
JP4114210B2 (ja) 映像データ圧縮装置およびその方法
US6456656B1 (en) Method and apparatus for coding and for decoding a picture sequence
JP2000312363A (ja) 動画像符号化方式の変換方法及びその装置
JP3703088B2 (ja) 拡張画像符号化装置及び拡張画像復号化装置
JP3469866B2 (ja) 符号化ビデオピクチャのデータストリームのビットレートを変化させる方法
KR100626419B1 (ko) 비디오 전송에서 비트 스트림들간의 교환
JP2004056616A (ja) 符号化信号復号装置、符号化信号復号方法および符号化信号復号プログラム
JP4010270B2 (ja) 画像符号化伝送装置
JP4211023B2 (ja) 動画像処理方法及び動画像処理装置
KR20060016947A (ko) Mpeg 비디오 부호화 시스템 및 부호화 방법
JP4292658B2 (ja) 画像情報変換装置及び画像情報変換方法
Ip et al. A simplified dual-bitstream MPEG video streaming system with VCR functionalities
Richardson et al. Temporal filtering of coded video
JP2002218471A (ja) 画像符号化データのレート変換方法、及び画像符号化レート変換装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041201

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060801

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061101

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070116

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070215

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100223

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110223

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110223

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120223

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130223

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130223

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140223

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term