JP2005513927A - ビデオシーケンスの動き補償された時間補間のための方法および装置 - Google Patents

ビデオシーケンスの動き補償された時間補間のための方法および装置 Download PDF

Info

Publication number
JP2005513927A
JP2005513927A JP2003555816A JP2003555816A JP2005513927A JP 2005513927 A JP2005513927 A JP 2005513927A JP 2003555816 A JP2003555816 A JP 2003555816A JP 2003555816 A JP2003555816 A JP 2003555816A JP 2005513927 A JP2005513927 A JP 2005513927A
Authority
JP
Japan
Prior art keywords
frame
frame sequence
sequence
decimated
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003555816A
Other languages
English (en)
Inventor
ハー アー ブリュルス,ウィルヘルミュス
ブリュエイン,フレデリク イェー デ
ハーン,ヘラルト デ
ブラゼロヴィッチ,ゼフデット
イェー エム フェルフォールト,ヘラルデュス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of JP2005513927A publication Critical patent/JP2005513927A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/587Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/92Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

デジタルビデオストリームを符号化する方法であって、ビデオシーケンスをフルフレームビデオシーケンスに符号化するステップと、時間的デシメイションにより前記フルフレームシーケンスから所定数のフレームを削除することによりデシメイトされたフレームシーケンスを形成するステップと、前記フルフレームシーケンスをローカルに復号するステップと、前記デシメイトされたフレームシーケンスをローカルに復号するステップと、インターポレータにより前記復号されたデシメイトされたフレームシーケンスを一時的に補間するステップと、前記フルフレームシーケンスの前記ローカルに復号さらたフレームを前記時間的補間をされたフレームシーケンスの対応するフレームと比較するステップと、少なくともフレームの前記比較に基づき前記フレームの残余情報を決定するステップと、前記デシメイトされたフレームシーケンスと前記決定された残余情報を含む出力ストリームを供給するステップとを含むことを特徴とする。

Description

発明の詳細な説明
本発明はビデオデータを符号化および復号化するための方法に関する。送信や記憶等のデジタル処理のためにビデオ信号を符号化するとき、利用可能なバンド幅と記憶容量の使用を最適化するために、ビデオデータを圧縮する。ロッシー符号化により圧縮率はよくなるが、原信号の情報は復号化の段階で完全には回復できなくなる。
ロッシー符号化により良い結果が得られるが、本発明の目的は、より良い圧縮結果が得られる符号化方法を提供することである。より良い性能とは、圧縮率とバンド幅が同等でより良い復号結果が得られること、またはより良い圧縮率または小さなバンド幅で同等の復号結果が得られることにある。この目的を達成するため、ビデオ信号を符号化する方法が請求項1により提供される。
符号化するビデオストリームから、ビデオストリームの多数のフレームを削除することにより、デシメイトされたフレームシーケンスを形成する。デシメイト(すなわちスキップ)されたフレームシーケンスのよい推定をするために、デシメイトされたフレームシーケンスを一時的に補間する。その結果、推定が適当でなく所定の基準を満たさないスキップされ推定されたフレームのエリアが検出される。エンコーダ内の利用可能なスキップされたフレームとスキップされ推定されたフレームとを比較することにより、これらのエリアを検出でき、残余情報を決定することができる。デシメイトされたフレームシーケンスと検出されたエリアの残余データだけが符号化され、符号化されたビットストリームに挿入される。好ましくは、デコーダでも利用可能なフレームに時間補間を実行するため、デシメイトされたフレームシーケンスのローカルに復号された符号化されたフレームに時間補間を施す。
符号化されたビットストリームは、メインビットストリームから残余データを抽出することにより、本発明により復号化される。その結果、メインビットストリームデータは、符号化に使用したように同様の補間プロセスを用いて補間される。残余データは、補間されたフレームシーケンスに加えられる。
本発明による符号化/復号システムを用いることにより、関係のある残余データのみが符号化信号に組み込まれるので、より良い質/バンド幅の配分が得られる。
本発明は、さらに復号方法、エンコーダ、デコーダ、オーディオビジュアル機器、データコンテナ機器、コンピュータプログラム、およびそのコンピュータプログラムが記録されたデータキャリア機器に関する。
本発明の特に有利な詳細は従属項に示されている。さらなる目的、詳細、修正、効果および発明の詳細は、図面を参照して以下の説明を読めば明らかとなる。
図1において、本発明による符号化方法の例のフロー図が示されている。ビデオシーケンスよりなるビデオ入力信号10がビデオエンコーダに入力される。この例ではMPEGエンコーダ20である。エンコーダ20は、ビデオ信号を特定のデジタルフォーマットで符号化する。この例ではMPEGフォーマットである。符号化された信号は、MPEGのIPPシーケンスなどの一連のフレームよりなる。エンコーダ20は、符号化中、時間的デシメイションを実行する。時間的デシメイションにより、所定数のフレームがスキップまたは破棄される。例として、入力ビデオ信号は50Hz信号、出力されるメインストリーム出力信号30は12.5Hz信号である。デシメイティングファクターはそれゆえ4つに1つである。これは4フレームのシーケンスから1フレームが残ることを意味する。この符号化は標準的なMPEGの動作であることに注意すべきである。さらにまた、データストリームを必要なだけ縮小するために、デシメイティングファクターは調整可能である。エンコーダ20は、時間的補間によりどのフレームも破棄することなく、フル符号化データストリームも符号化する。このデータストリームは、符号化されたデータストリームを復号するために好適なデコーダ30に送られる。この例ではMPEGデコーダである。デコードされたデータストリーム35は、50Hz信号であり、符号化プロセスでフレームはドロップされていない。データストリーム35は、IPセレクタ40に供給される。セレクタ40は、オリジナルビデオ入力にエンコーダ20が実行するのと同じ時間的削除を実行する。結果は12.5Hz信号である。この縮小された信号はモーションエスティメータ50に入力される。モーションエスティメータ50は、この例においてはナチュラルモーションエスティメータとして実施されている。エスティメータ50は、追加フレームを推定することにより12.5Hzから50Hzにアップコンバージョンを実行する。エスティメータ50は、符号化されたデータストリームを復号するとき、デコーダが実行するのと同じアップコンバージョンを実行する。本発明については、いかなる動き推定方法を使用してもよい。特に、例えばフレームレート変換方法で使用されているようなナチュラルまたはトゥルーモーションエスティメーションに基づき、動き推定でよい結果が得られる。コスト的に非常に効率のよい実施方法は、例えば、コンシューマアプリケーションに好適な3次元再帰アプローチ(3DRS)である。例えば、米国特許第5,072,293番、第5,148,269番、第5,212,548番を見よ。3DRSを用いて推定した動きベクトルは、トゥルーモーションと等しくなりがちであり、モーションベクトルフィールドは、高度な空間的および時間的整合性を抑制する。それゆえ、ベクトルの整合性は、頻繁にはスレッショルドされず、送信される残余データは非トゥルーモーション推定と比較して減少する。
アップコンバージョンされた信号55は、評価部60に送られる(マイナス符号で示した)。評価部にはフルデータストリーム35も送られる(プラス符号で示した)。評価部60は、モーションエスティメータ50により決定されたように補間されたフレームを実際のフレームと比較する。比較により、推定されたフレームが実際のフレームからどこが違うかが決定される。それぞれのフレームの相違点が評価される。相違点が閾値を満たす場合、違いのデータが残余データとして選択される。例えば、閾値は違いに気づくかどうかに関係し、そのような閾値基準そのものは関連技術分野において知られている。この例では、残余データはメタブロックの形式で説明される。メタブロックの形式の残余データストリーム120は、MPEGエンコーダ70に入れられる。残余データは、MPEG環境において設けられているプライベートデータチャンネルを用いて符号化することができる。
最後に、データと残余データストリームのメインストリームは、単一の出力データストリーム90を形成するために、マルチプレクサ80により結合される。出力ストリーム90は、(例えば(ワイヤレス)データ送信コネクションを用いて)送信してもよいし、記憶してもよいし、さもなければ使用してもよい。
図2において、本発明によるデータストリーム90を復号するための方法の例のフロー図が示されている。最初に、データストリーム90はデマルチプレクサ100でデマルチプレックスされ、メインデータストリーム30と残余データストリーム120とに分かれる。こちら側では、デマルチプレクサは到来する信号に含まれている残余データストリームを認識するようにプログラムされている。プライベートデータチャンネルが使用される場合、デマルチプレクサは、使用されるプライベートデータチャンネルから残余データを抽出する。メインデータストリーム30と残余データストリームの両方がMPEGデコーダにより復号される。それぞれステップ130と140に示されている。メインストリーム復号信号は、動き推定部に転送される。この例ではナチュラルモーションエスティメータ150として実施されている。関連技術分野において知られているモーションエスティメータ150は、前のステップで復号された12.5Hz信号から50Hz信号を作ることにより、供給されたデータを補間する。アップコンバージョンされた50Hz信号は、連続して結合部160に転送される。
デコーダ140からの復号された残余データは、アップコンバージョンされた信号とは別に結合部160に転送される。結合部160は、メインデータストリームの情報を残余データストリームと結合する。そのような動作は、それ自体関連技術分野において知られており、メインデータストリームのメタブロック等の情報を、メタブロック等のそれぞれの残余情報と置き換えることを含む。結合部160の出力信号は、50Hzフレームレートビデオデータストリームである。
データストリーム90を受信するデコーダが残余データストリームを検出するように構成されていない場合、メインストリームだけが復号される。それゆえ、残余データ信号に完全には則っていないデコーダであっても、使用可能なビデオ信号だけが復号される。
本発明は、例えば、入力信号受信手段と符号化した信号を送信する送信手段を含み、この入力信号受信手段と送信手段に接続された本発明による画像符号化デバイスが設けられているであろう、ラジオ送信機やコンピュータネットワークルータ等のデータ送信デバイスなど様々なデバイスに適用できる。さらにまた、本発明によるデコーダは、例えばDVDレコーダやPVR(HDD)レコーダに実装することができる。本発明による符号化および復号システムは、例えば、インターネットビデオストリーミングサービスや、ホーム(ワイヤレス)ネットワークに実装することができる。
2つに1つの時間的デシメイションでよい結果を得ることができる。スキップされ推定されたフレームのエリアの5−10%以下は、通常、残余情報を必要とする。4フレームにつき1つのデシメイションもよい結果となる。最高の画像品質を必要としないアプリケーションについては、本発明を用いてより多くのフレームをスキップすることができる。
本発明は、上に示した符号化および復号方法を実行するためのエンコーダおよびデコーダにも関する。図5において、本発明によるエンコーダの例が示されている。本エンコーダは、ビデオデータを受信する、エンコーダ320に接続された入力セクション310を含む。エンコーダは、マルチプレクサ330とローカルデコーダ340に接続されている。ローカルデコーダ340は、セレクタ340と評価部360に接続されている。セレクタ350はエスティメータ370を介してセレクタ350に接続されている。セレクタ350は、マルチプレクサにエンコーダ380を介して接続されている。マルチプレクサは出力セクション390を接続されている。
図6において、本発明によるデコーダの例が示されている。デコーダは、デマルチプレクサ420に接続されている入力セクション410を含む。デマルチプレクサ420は、デコーダ440と430に接続されている。両方のデコーダはコンバイナ460に接続され、デコーダ430は直接、デコーダ440はエスティメータ450を介して接続されている。エスティメータ460は出力セクション470と接続されている。
図3と4において、符号化/復号システムの第2の例が示されている。上に示した実施形態からの構成要素に対応する本発明の部分は、同じ参照数字で示され、それらの機能の説明は上記のとおりである。第2の実施形態は、第1の実施形態と、復号段階において追加のナチュラルモーションエスティメータが使用されている点で異なる。こちら側で、2つの異なるタイプのテンポラルインターポレータ、すなわち簡単なものと複雑なものが、エンコーダの符号化段階で使用されている。デコーダは、簡単な(比較的コストエフェクティブな)テンポラルインターポレータを使用しなければならない。複雑なテンポラルインターポレータは(比較的コストがかかる)エンコーダのみによって使用される。
ビデオストリームの符号化は、一般に、第1と第2の実施形態の両方と同様である。第2の実施形態(図3参照)において、セレクタ40からの情報が、デシメイトされたフレームについて非常に正確な補間をするために、ナチュラルモーションタイプの複雑なテンポラルインターポレータでアップコンバージョンされる、付加的ステップ200が入っている。この非常に正確なデータは、エバリュエータ220に送られる。
非常に正確な補間と並行して、データが最後のデコーダにより使用されるタイプの簡単なテンポラルインターポレータ210に供給される。簡単なテンポラルインターポレータ210は、上記のエバリュエータ220に供給される中程度に正確なデータストリームを生じる。エバリュエータ220は、正確性が高い補間と中くらいのものを比較し、マルチプレクサに修正したベクトルストリームを供給する。修正したベクトルストリームは、例えばプライベートデータチャンネルの残余情報に含まれる。ベクトルストリームは、ベクトルデータと簡単なテンポラルインターポレータ210の中程度に正確な補間の結果とを結合するコンバイナ230に供給される。結合された信号は、その情報を補間されたフレームを調整するために使用するナチュラルモーションエスティメータ50´に供給される。その後の残余データ決定は、第1の実施形態と同様である。
結果として得られる符号化されたデータストリームは、メインストリームデータ、残余データ、修正ベクトル情報を含む。使用されるバンド幅は、第1の実施形態よりも少し広いが、しかしより良い品質結果が得られる。
復号において、図4に示したとおり、到来するデータはメインデータストリーム、残余ストリーム(第1の例と同様)、およびベクトルデータにデマルチプレックスされる。ビデオ出力の形成は、ナチュラルモーションエスティメーション150´が中品質エスティメータ210´からの、復号されたベクトルにより230´で修正される結果を含むということを加えれば、第1の実施形態と同様の仕方でなされる。付加的な中品質のエスティメーションを用いることにより、終了結果は非常に向上し、修正ベクトルが使用されればなお一層向上する。より良い品質を得るための追加的コストは比較的小さく、非常に簡単なモーションエスティメーションデバイスとバンド幅の若干の拡大だけである。さらにまた、付加的な高品質エスティメータが符号化ステップにおいて必要とされるが、これによるエンコーダコストの上昇はほとんどない。
上に説明したデバイスと方法の例において、残余データストリームは、メインデータストリームと同様に同じタイプの符号化方法または復号方法を用いて符号化または復号を行う。異なるタイプの符号化または復号方法を用いて残余データを符号化または復号することも同様に可能である。例えば、残余データストリームの符号化または復号は、残余データに特に適合しているかもしれない。その場合、メインデータストリームと残余データストリームの両方に同じ符号化または復号方法を用いるのと比較して、符号化がより効率的になる。例えば、一般に残余データストリームの連続するフレームの間の相関は、メインデータストリームの連続するフレームの間の相関よりも小さいので、残余データおよびメインデータ間の相関により符号化の効率が上昇することがある。残余データのエンコーダは、特殊なまたは独占的な符号化スキームであってもよく、残余データストリームのビジュアルコンテントの特徴を計算に入れてもよい。例えば、残余データ中の散らばった空でないブロックは、最初により大きなグループにまとめることができるであろう。
図7と8は、残余データとメインデータが符号化においてインターリーブされる、エンコーダとデコーダのそれぞれの例のブロック図である。
図7のエンコーダは、ビデオエンコーダ520、例えばMPEGエンコーダに接続された、ビデオデータを受信するための入力セクション510を含む。ビデオエンコーダ520は、マルチプレクサ530とローカルデコーダ540に接続されている。ローカルデコーダ540は、セレクタ550と評価部560に接続されている。セレクタ550は、エスティメータ570を介して評価部560に接続されている。マルチプレクサ530は、出力セクション590に接続されているかまたはそれを有している。
ビデオエンコーダ520は、ビデオ信号を特定のデジタルフォーマット、この例ではMPEGフォーマットで符号化する。エンコーダ520は、時間的補間によりフレームを捨てることのない、全符号化データストリームを供給する。このデータストリームは、符号化されたデータストリームを復号するのに好適なデコーダ540に送られる。この例において、デコーダ540はMPEGデコータである。符号化プロセスにおいてフレームがドロップされていないので、復号されたデータストリーム535は50Hz信号である。データストリーム535は、IPセレクタ550に供給される。セレクタ540は、オリジナルビデオ入力にエンコーダ520がしたのと同じ時間的補間を行う。その結果はまた12.5Hz信号である。この縮小された信号は、この例ではナチュラルモーションエスティメータとして実施されているモーションエスティメータ570に入れられる。
エスティメータ570は、付加的フレームを推定することにより、12.5Hzから50Hzにアップコンバージョンを行う。エスティメータ570は、符号化されたデータストリームを符号化するとき、デコーダが行うのと同じアップコンバージョンを行う。アップコンバージョン信号555は、評価部560(マイナス符号で示した)に送られる。全データストリーム535は評価部560に送られる(プラス符号で示した)。評価部560は、モーションエスティメータ570により判断されたように、補間されたフレームを実際のフレームと比較する。比較によって、推定されたフレームが実際のフレームとどこが違うかを判断する。例えば、比較する内容は、推定されたフレームと実際のフレームの間の違いを所定の基準に照らしてチェックすることを含んでもよい。
それぞれのフレームの違いが評価される。違いがある閾値を満たす場合、評価部560により、エンコーダがそれぞれのフレームをどのように再構成するかを示すリフォーマット符号がビデオエンコーダ520に送信される。推定されたフレームが実際のフレームに類似しているとき、評価部560はビデオエンコーダ520にスキップ符号を送信する。ビデオエンコーダ520は、符号化時に、評価部560からのデータをメインデータにインターリーブする。それにより、同じコンポーネント、例えばMPEG-2コーダとデコーダとが残余データとメインデータを両方とも符号化または復号するために用いられても、高い符号化効率を達成することが可能である。さらにまた、実際のフレームとスキップ符号は容易に検出することができる。
図9は、ビデオエンコーダ520の実装の例を示す図である。図9において、ビデオエンコーダはエンコーダデバイス524を含む。エンコーダデバイス524は、例えばTri-Media(登録商標)デバイス等のポストプロセッサデバイスに接続されている。ポストプロセッサデバイスは、リフォーマットデバイス523を介して接続されている可変長エンコーダ521、522を含む。リフォーマットデバイス523は、リフォーマット命令を受信するために評価部560に接続されている。エンコーダ524はビデオエンコーダ520の入力にも接続されている。エンコーダ524は、フレームを破棄することなく全符号化データストリームを符号化する。すなわち、第2のエンコーダは入力を時間的デシメイションなしに符号化する。このデータストリームは、全符号化データストリームを復号できるローカルデコーダ540に送信される。
図8において、本発明によるデコーダの例が示されている。デコーダは、ビデオデコーダ630に接続された入力セクション610を含む。ビデオデコーダ630は、セレクタ640の出力に接続されている。セレクタ640は、オーバーライタ660に直接接続されている。セレクタ640は、エスティメータ650にも接続されている。エスティメータ650は、オーバーライタ660に接続されている。オーバーライタ660はアウトプットセクション670に接続されている。
ビデオデコーダ630は、符号化されたデータストリームを復号してもよく、図7のエンコーダで符号化されたデータストリームを復号するのに特に適している。結果として得られる復号されたデータストリームは、ビデオデコーダ630によりセレクタ640に送信される。セレクタは、図7のエンコーダ中のセレクタ550によるダウンコンバージョンの時間的デシメイションに対応する時間的デシメイションを実行する。デシメイトされたデータは、セレクタ640によりエスティメータ550に送信される。オーバーライタデバイスは、デコーダ630からの情報に基づいて、エスティメータ640からのデータを使うかセレクタ640によりドロップされたデータを使うかを決定する。
図7−9のエンコーダおよび/またはデコーダがMPEGに準拠しているとき、スキップ符号はMPEG規格で提供されているようにスキップマクロブロック符号であってもよい。ほとんどのビデオ符号化規格はスキップ符号を提供しているので、そのようなスキップマクロブロック符号を他のタイプのエンコーダに使用することもできる。
さらにまた、Haskell et al., “Digital video; an introduction to MPEG-2”, Kluwer, 1997のセクション8.4.5から分かるように、符号化されたブロックパターン(cbp)符号を使用してもよい。CBPは、マクロブロック中のどのブロックが空であるか、すなわちMPEGにおいては、どのブロックが全てゼロの離散コサイン変換を有するかを表す。マクロブロックまたはフレームの一部だけが実際のフレームまたは(マクロ)ブロックで置き換えられるべきとき、他の部分はCBPで示してデータ量を削減してもよい。
発明がMPEGのコンテクストで使用されるとき、ベースフレーム(すなわち、デシメイトされたデータストリーム)の符号化のための効率的な選択は、IPPフレーム符号化である。スキップされたフレームについて、Bフレーム符号化は効果的な選択であるが、しかし、他の選択をしてもかまわない。
有利な実施形態において、24Hz等の比較的低いフレームレートのビデオシーケンスを時間的に補間することによって、デシメイトされたフレームシーケンスを補間するために使用するインターポレータよりも品質または精度が高いさらなるインターポレータにより、全フレームビデオシーケンスを得ることができる。このさらなるインターポレータは、例えば、上で説明した複雑なテンポラルインターポレータまたは複雑なナチュラルモーション、または精度がより高い2−3プルダウンアルゴリズムである。このさらなるインターポレータは、好ましくはリアルタイムではなく、オフラインのインターポレータである。上の実施形態において、比較的低いフレームレートのムービーシーケンスを補間するために品質がより高いさらなるインターポレータを用いることにより、モービーテンポラルエンハンスメントレイヤーが生成される。デコーダにおいて、ムービーテンポラルエンハンスメントレイヤーは、ムービージャダー(judder)が縮小された復号されたビデオを取得するために使用される。全フレームビデオシーケンスのデシメイションは、低フレームレートビデオシーケンスをデシメイトされたビデオシーケンスとして直接取ることにより、効率的に実行可能である。ビデオ品質を高めるため、バックワードコンパチブルビットストリームが空間的および時間的エンハンスメントレイヤーと共に生成されるように、ムービーテンポラルエンハンスメントレイヤーは、空間的エンハンスメントレイヤーと組み合わせることもできる。
本発明は、開示した物理的デバイスの例の実装に限定されるものではなく、同様に他のデバイスにも適用することが可能である。特に、本発明は物理的デバイスには限定されず、より抽象的な種類の論理デバイスやそのデバイスの機能を実行するソフトウェアに適用することも可能である。さらにまた、デバイスは、論理的には単一のデバイスとみなされても、多くの装置にわたって物理的に分散していてもよい。また、論理的には分離したデバイスが、単一の物理的デバイスに統合されていてもよい。
本発明は、コンピュータシステム上で実行されるとき、本発明による方法のステップを実行する符号部分を少なくとも含む、コンピュータシステム上で実行されるコンピュータプログラムに実装されてもよい。あるいは、汎用コンピュータシステムに本発明によるコンピュータシステムの機能を実行可能とするコンピュータプログラムに実装されてもよい。そのようなコンピュータプログラムは、CD-ROMやディスケット等のデータキャリア上に提供され、コンピュータシステムのメモリにロード可能な、コンピュータプログラムを表現しているデータとともに記憶されてもよい。データキャリアは、さらに本発明によるコンピュータプログラムを表す信号を送信している電話ケーブルまたはワイヤレスコネクション等のデータコネクションであってもよい。
本発明による符号化方法のフロー図である。 図1の方法と共に使用される本発明による復号方法のフロー図である。 本発明による他の符号化方法のフロー図である。 図3の方法と共に使用される本発明による復号方法のフロー図である。 本発明によるエンコーダの例を示す図である。 本発明によるデコーダの例を示す図である。 本発明による他のエンコーダの実施形態の例のブロック図である。 本発明による他のエンコーダの実施形態の例のブロック図である。 図7の本発明によるエンコーダの例で用いられるビデオエンコーダのブロック図である。

Claims (18)

  1. デジタルビデオストリームを符号化する方法であって、
    フルフレームビデオシーケンスを供給するステップと、
    時間的デシメイションにより前記フルフレームシーケンスからフレームを削除することによりデシメイトされたフレームシーケンスを形成するステップと、
    インターポレータにより前記デシメイトされたフレームシーケンスを時間的補間をするステップと、
    前記フルフレームシーケンスのフレームを前記時間的補間をされたフレームシーケンスの対応するフレームと比較するステップと、
    少なくともフレームの前記比較に基づき前記フレームの残余情報を決定するステップと、
    前記デシメイトされたフレームシーケンスと前記決定された残余情報を含む出力ストリームを供給するステップと
    を含むことを特徴とする方法。
  2. 請求項1記載の方法であって、前記デシメイトされたフレームシーケンスは圧縮符号化されることを特徴とする方法。
  3. 請求項1記載の方法であって、前記残余情報はデータブロックの形式で符号化されていることを特徴とする方法。
  4. 請求項1ないし3いずれか一項記載の方法であって、前記残余情報はプライベートデータチャンネルで符号化されることを特徴とする方法。
  5. 請求項1ないし4いずれか一項記載の方法であって、前記時間的補間はナチュラルまたはトゥルーモーションにより実行されることを特徴とする方法。
  6. 請求項1ないし5いずれか一項記載の方法であって、フレームの所定数は2つのうち1つであることを特徴とする方法。
  7. 請求項1ないし5いずれか一項記載の方法であって、フレームの数は4つのうち1つであることを特徴とする方法。
  8. 請求項1記載の方法であって、前記時間的補間は、動きベクトル等の、前記デシメイトされたフレームシーケンス以外のデータにより援助されることを特徴とする方法。
  9. 請求項1記載の方法であって、前記フルフレームビデオシーケンスは、前記デシメイトされたフレームシーケンスを時間的補間するために用いたインターポレータよりもより高い質と精度のインターポレータにより比較的低いフレームレートのビデオシーケンスを時間的に補間することにより取得されることを特徴とする方法。
  10. 請求項9記載の方法であって、前記デシメイトされたフレームシーケンスは、前記フルフレームシーケンスからフレームを削除するよりも直接的に、前記低フレームレートビデオシーケンスにより形成されることを特徴とする方法。
  11. 請求項1ないし10いずれか一項記載の方法により符号化されたデータストリームを復号する方法であって、
    符号化されたデータストリームから前記デシメイトされたフレームシーケンスと前記決定された残余情報を分離し、
    前記デシメイトされたフレームシーケンスを復号し、
    前記復号されたデシメイトされたフレームシーケンスを前記符号化に用いたのと同様の補間プロセスにより時間的補間し、
    前記残余情報を復号し、
    出力データストリームを形成するため前記残余情報と前記補間されたフレームシーケンスを結合する
    ことを特徴とする方法。
  12. デジタルビデオデータを符号化するエンコーダであって、
    フルフレームビデオシーケンスを供給する入力セクションと、
    時間的デシメイションにより前記入力セクションから受信したフルフレームシーケンスからフレームを削除することによりデシメイトされたフレームシーケンスを形成する手段と、
    インターポレータにより前記デシメイトされたフレームシーケンスを時間的に補間するための補間手段と、
    前記フルフレームシーケンスの前記フレームを前記時間的補間されたフレームシーケンスの対応するフレームと比較し、少なくともフレームの比較に基づき前記フレームの残余情報を決定する比較手段と、
    前記デシメイトされたフレームシーケンスと前記決定された残余情報を含む出力ストリームを供給する出力セクションと
    が設けられたエンコーダ。
  13. 入力セクションと出力セクションとともにデジタルビデオデータを復号する、請求項11記載の復号を実行するように構成された復号セクションが設けられたデコーダ。
  14. データ入力手段と、オーディオビジュアル出力手段と、請求項13記載のデコーダが設けられたオーディオビジュアル機器。
  15. 請求項1ないし10いずれか一項記載の方法で取得された出力ストリームを表現するデータを含むデータ格納デバイス。
  16. 請求項1ないし11いずれか一項記載の方法のステップを実行する符合部分を含むコンピュータプログラム。
  17. 請求項16記載のコンピュータプログラムを表現するデータを含むデータ運搬デバイス。
  18. デシメイトされたフレームシーケンスと前記デシメイトされたフレームシーケンスに関する残余情報を含むビデオデータストリームであって、
    前記残余情報は、前記デシメイトされたフレームシーケンスに基づきインターポレータにより一時的に補間されたフレームのそれぞれのフレームを、前記フルフレームシーケンスの対応するそれぞれのフレームとの比較に基づくことを特徴とするビデオデータストリーム。
JP2003555816A 2001-12-21 2002-12-16 ビデオシーケンスの動き補償された時間補間のための方法および装置 Pending JP2005513927A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP01205131 2001-12-21
EP02077035 2002-05-24
PCT/IB2002/005500 WO2003055226A1 (en) 2001-12-21 2002-12-16 Method and apparatus for motion compensated temporal interpolation of video sequences

Publications (1)

Publication Number Publication Date
JP2005513927A true JP2005513927A (ja) 2005-05-12

Family

ID=26077053

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003555816A Pending JP2005513927A (ja) 2001-12-21 2002-12-16 ビデオシーケンスの動き補償された時間補間のための方法および装置

Country Status (7)

Country Link
US (1) US20050226330A1 (ja)
EP (1) EP1459553A1 (ja)
JP (1) JP2005513927A (ja)
KR (1) KR20040068973A (ja)
CN (1) CN100518316C (ja)
AU (1) AU2002351151A1 (ja)
WO (1) WO2003055226A1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080225162A1 (en) * 2004-01-22 2008-09-18 Koninklijke Philips Electronic, N.V. Method and Apparatus for Deinterlaccing of Video Usung Motion Compensated Temporal Interpolation
EP1610560A1 (en) * 2004-06-24 2005-12-28 Deutsche Thomson-Brandt Gmbh Method and apparatus for generating and for decoding coded picture data
US20110149020A1 (en) * 2009-12-17 2011-06-23 Ilya Klebanov Method and system for video post-processing based on 3d data
CN102348117A (zh) * 2010-08-03 2012-02-08 深圳Tcl新技术有限公司 低带宽传输数字高清信号的系统、方法及网络多媒体电视
CA2921884C (en) 2013-06-25 2020-04-28 Numeri Ltd. Multi-level spatial resolution increase of video
CN106492460B (zh) * 2016-12-08 2019-12-24 搜游网络科技(北京)有限公司 一种数据的压缩方法和设备
KR200486457Y1 (ko) 2017-02-28 2018-06-27 주식회사 비나제이 다양한 연출이 가능한 브래지어
CN107943849B (zh) * 2017-11-03 2020-05-08 绿湾网络科技有限公司 视频文件的检索方法及装置
CN112911306B (zh) * 2021-01-15 2023-04-07 北京奇艺世纪科技有限公司 一种视频处理方法、装置、电子设备及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU612543B2 (en) * 1989-05-11 1991-07-11 Panasonic Corporation Moving image signal encoding apparatus and decoding apparatus
KR950002658B1 (ko) * 1992-04-11 1995-03-24 주식회사금성사 영상신호의 압축 부호화 및 복호화장치
US5619281A (en) * 1994-12-30 1997-04-08 Daewoo Electronics Co., Ltd Method and apparatus for detecting motion vectors in a frame decimating video encoder
US6192080B1 (en) * 1998-12-04 2001-02-20 Mitsubishi Electric Research Laboratories, Inc. Motion compensated digital video signal processing
EP1279293A1 (en) * 2000-01-21 2003-01-29 Nokia Corporation A motion estimation method and a system for a video coder

Also Published As

Publication number Publication date
US20050226330A1 (en) 2005-10-13
CN1605211A (zh) 2005-04-06
AU2002351151A1 (en) 2003-07-09
EP1459553A1 (en) 2004-09-22
WO2003055226A1 (en) 2003-07-03
CN100518316C (zh) 2009-07-22
KR20040068973A (ko) 2004-08-02

Similar Documents

Publication Publication Date Title
US7058127B2 (en) Method and system for video transcoding
US9338453B2 (en) Method and device for encoding/decoding video signals using base layer
JP4198206B2 (ja) 動き依存予測を使用したビデオ情報の圧縮方法と装置
US20030161401A1 (en) Reducing the resolution of media data
US20060062299A1 (en) Method and device for encoding/decoding video signals using temporal and spatial correlations between macroblocks
MX2007000254A (es) Metodo y aparato para utilizar tecnicas de conversion ascendente de indice de cuadro en codificacion de video que se puede escalar.
WO2006082690A1 (ja) 画像符号化方法および画像符号化装置
JP2011505781A (ja) 高解像度デジタル静止画像をビデオと並行して符号化するためのavc規格の拡張
US20060062298A1 (en) Method for encoding and decoding video signals
KR100880640B1 (ko) 스케일러블 비디오 신호 인코딩 및 디코딩 방법
KR100883604B1 (ko) 스케일러블 비디오 신호 인코딩 및 디코딩 방법
KR100878824B1 (ko) 스케일러블 비디오 신호 인코딩 및 디코딩 방법
US20060078053A1 (en) Method for encoding and decoding video signals
US6804299B2 (en) Methods and systems for reducing requantization-originated generational error in predictive video streams using motion compensation
JP2005513927A (ja) ビデオシーケンスの動き補償された時間補間のための方法および装置
US20050013496A1 (en) Video decoder locally uses motion-compensated interpolation to reconstruct macro-block skipped by encoder
US20030123538A1 (en) Video recording and encoding in devices with limited processing capabilities
KR100878825B1 (ko) 스케일러블 비디오 신호 인코딩 및 디코딩 방법
KR20060085150A (ko) 베이스 레이어의 내부모드 블록의 예측정보를 이용하여영상신호를 엔코딩/디코딩하는 방법 및 장치
JP4264811B2 (ja) 画像復号化装置及び画像復号化方法
JP4909592B2 (ja) 動画像再生方法及び装置並びにプログラム
JP4361665B2 (ja) 動画像符号化データのトランスコーディング方法およびトランスコーディング装置
KR20060043120A (ko) 영상 신호의 인코딩 및 디코딩 방법
EP1387587A1 (en) Image encoder and decoder with error concealment of motion vector losses
AU2007237319B2 (en) Method for sub-pixel value interpolation

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090331

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090630

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100209