JP5026965B2 - ベースレイヤを含むビットストリームをプリデコーディング、デコーディングする方法及び装置 - Google Patents

ベースレイヤを含むビットストリームをプリデコーディング、デコーディングする方法及び装置 Download PDF

Info

Publication number
JP5026965B2
JP5026965B2 JP2007521390A JP2007521390A JP5026965B2 JP 5026965 B2 JP5026965 B2 JP 5026965B2 JP 2007521390 A JP2007521390 A JP 2007521390A JP 2007521390 A JP2007521390 A JP 2007521390A JP 5026965 B2 JP5026965 B2 JP 5026965B2
Authority
JP
Japan
Prior art keywords
frame
base layer
bitstream
mode
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007521390A
Other languages
English (en)
Other versions
JP2008506327A (ja
Inventor
ハン,ウ−ジン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2008506327A publication Critical patent/JP2008506327A/ja
Application granted granted Critical
Publication of JP5026965B2 publication Critical patent/JP5026965B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • H04N19/615Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding using motion compensated temporal filtering [MCTF]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/64Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明はビデオ圧縮に関し、より詳しくは、プリデコーダで特定フレームをベースレイヤフレームに置き換えることによって与えられたビット率に対してより優れた画質を有するビデオストリームを抽出する方法に関する。
インターネットを含む情報通信技術の発達により、文字、音声だけでなく画像通信が増加している。既存の文字中心の通信方式では消費者の多様な欲求を充足するには不足し、そのため文字、映像、音楽など多様な形態の情報を収容することができるマルチメディアサービスが増加している。マルチメディアデータはその量が膨大で大容量の保存媒体を必要とし、伝送時に広い帯域幅を必要とする。例えば640*480の解像度を有する24bitトゥルーカラーのイメージは1フレーム当たり640*480*24bitの容量、すなわち約7.37Mbitのデータが必要である。これを秒当たり30フレームで伝送する場合には221Mbit/secの帯域幅を必要とし、90分間上映する映画を保存するためには約1200Gbitの保存空間が必要である。したがって文字、映像、オーディオを含むマルチメディアデータを伝送するためには圧縮コーディング技法を使用するのが必須的である。
データを圧縮する基本的な原理はデータの重複(冗長)をなくす過程である。イメージで同じ色やオブジェクトが繰り返されるような同じ空間的重複、及び動画フレームで隣接フレームがほとんど変化しない場合やオーディオで同じ音が繰り返し続けるような同じ時間的重複をなくすことによって、または人間の時刻及び知覚能力が高い周波数に鈍感なことを考慮した心理時刻重複をなくすことによってデータを圧縮することができる。データ圧縮の種類はソースデータの損失有無と、それぞれのフレームに対して独立に圧縮するか否かと、圧縮と復元に必要な時間が同一であるか否かによって各々損失/無損失圧縮、フレーム内/フレーム間圧縮、対称/非対称圧縮に分けられる。この他にも圧縮復元遅延時間が50msを超えない場合にはリアルタイム圧縮に分類し、フレームの解像度が多様な場合はスケーラブル圧縮に分類する。文字データや医学用データなどの場合には無損失圧縮が使用され、マルチメディアデータの場合には主に損失圧縮が使用される。一方、空間的重複を除去するためにはフレーム内圧縮が使用され、時間的重複を除去するためにはフレーム間圧縮が使用される。
マルチメディアを伝送するための伝送媒体は媒体別にその性能が異なる。現在使用されている伝送媒体は秒当たり数十Mbitのデータを伝送することができる超高速通信網から秒当たり384kbitの伝送速度を有する移動通信網などのように多様な伝送速度を有する。MPEG−1、MPEG−2、MPEG−4、H.263、またはH.264(Advanced Video Coding)のような従来のビデオコーディングはモーション補償予測に基づいて、時間的重複はモーション補償及び時間的フィルタリングにより除去し、空間的重複は空間的変換により除去する。このような方法は優れた圧縮率を有しているが、主アルゴリズムで再帰的接近法を使用しているので優れたスケーラブルビットストリームのための柔軟性を有していない。
これにより、最近にはウェーブレット基盤のスケーラブルビデオコーディングに関する研究が活発になっている。スケーラブルビデオコーディングは空間的領域、すなわち解像度面でスケーラビリティを有するビデオコーディングを意味する。ここでスケーラビリティとは、圧縮された1つのビットストリームから部分デコーディング、すなわち多様な解像度のビデオを再生することができる特性を意味する。
このようなスケーラビリティはビデオの解像度を調節することができる性質を意味する空間的スケーラビリティと、ビデオの画質を調節することがきる性質を意味するSNR(信号対雑音比)スケーラビリティと、フレーム率を調節することができる時間的スケーラビリティと、これら各々を組合せたものを含む概念である。
前記のように空間的スケーラビリティはウェーブレット変換によって具現でき、SNRスケーラビリティは量子化によって具現できる。一方、時間的スケーラビリティを具現する方法としては最近、MCTF、UMCTFなどの方法が使用されている。
このようなスケーラビリティを支援するビデオコーディングシステムの全体構成は図1に示す通りである。まず、エンコーダ40は時間的フィルタリング、空間的変換、及び量子化過程によって入力ビデオ10を符号化してビットストリーム20を生成する。そして、プリデコーダ50はデコーダ60との通信環境またはデコーダ60端での機器性能などを考慮した条件、例えば画質、解像度またはフレーム率を抽出条件として、エンコーダ40から受信したビットストリーム20の一部を削除したり抽出することによって簡単にテクスチャデータに対するスケーラビリティを具現することができる。
デコーダ60は前記抽出したビットストリーム25でエンコーダ40で行われた過程を逆に行って出力ビデオ30を復元する。もちろん、前記抽出条件によるビットストリームの抽出は必ずしもプリデコーダ50で行うべきではなく、デコーダ60の処理能力が不足してエンコーダ40で生成されたビットストリーム20の全体映像をリアルタイムに処理し難い場合にはデコーダ60端で前記ビットストリームの抽出過程が行われ得る。もちろん、この過程はプリデコーダ50及びデコーダ60のいずれでも行われ得る。
このようなスケーラブルビデオコーディングを使用すれば、ビット率、解像度、フレーム率のいずれもプリデコーダ50で変形することができるという長所があり、高いビット率では圧縮率も非常に優れる。しかし、ビット率が十分でない場合、MPEG−4、H.264など既存コーディング方法に比べて、その性能が大きく低下するという問題を有している。
これは複合的な原因がある。1つは、低い解像度ではウェーブレット変換がDCTに比べて、その性能が低下することに一次的な原因がある。もう1つは、多様なビット率を支援しなければならないスケーラブルビデオコーディングの特性上、そのうち1つのビット率に最適化されるようにエンコーディング過程が行われるため、他のビット率ではその性能が低下することにある。
したがって、プリデコーディング過程で生じる画質、解像度、またはフレーム率の劣化を減らすためにプリデコーディング過程をより効率的に行うことができる方法を講じる必要がある。
本発明は前述した必要性を鑑みて創案したものであって、低いビット率と高いビット率で均一な性能を示すスケーラブルビデオコーディング方法を提供することを目的とする。
また、本発明はプリデコーディング過程をより効率的に行うことによって節約されるビットを他のフレームに与える方法を提供することを目的とする。
前記目的を達成するために、本発明によるプリデコーディング方法は、(a)所定の基準にしたがって、前記ベースレイヤが存在するフレームのうち省略されるフレームが決められた複数の省略モードから省略モードを決定するステップと、(b)前記決定された省略モード及び抽出条件にしたがって、省略された前記フレームを除外した前記ビットストリーム抽出するステップとを含む。
前記基準は、デコーダ段に接続されたネットワークの伝送状態による伝送可能なビット率を意味するのが好ましい。
前記(a)ステップは、前記ビット率が第一閾値より低い場合には、前記ベースレイヤが存在する位置に該当するフレーム全体を省略すると決定するステップを含む。
前記(a)ステップは、前記ビット率が第一閾値より高く、第二閾値より低い場合には、前記ベースレイヤが存在する位置に該当するフレームのうち高周波フレームを省略すると決定するステップを含む。
前記目的を達成するために、本発明によるビットストリームをデコーディングする方法は、(a)前記ビットストリームの中でベースレイヤに関する情報に所定のコーデックを適用してベースレイヤを復元するステップと、(b)前記ビットストリームの中でベースレイヤ以外の情報から、一部フレームが省略された差分フレームを生成するステップと、(c)前記省略されたフレームの位置に対応するベースレイヤを挿入するステップと、(d)前記挿入されたベースレイヤと前記差分フレームに対して逆時間的フィルタリングを行ってビデオシーケンスを復元するステップとを含む。
前記(b)ステップは、前記ビットストリームの中でベースレイヤ以外のテクスチャ情報を逆量子化して変換係数を出力するステップと、前記変換係数を空間的領域での変換係数に逆変換するステップとを含む。
前記ベースレイヤは、前記ベースレイヤの解像度を前記差分フレームの解像度でアップサンプリングした後に挿入される。
前記逆時間的フィルタリングは、前記差分フレームが差異コーディングによって生成されたフレームである場合は対応するベースレイヤとの和を求めることによって、また、時間的予測コーディングによって生成されたフレームである場合は該当参照フレーム番号及びモーションベクトルを使用して構成される予測フレームとの和を求めることによって行われる。
前記コーデックとしては、H.264を使用することができる。そして、前記アップサンプリングは、逆ウェーブレット変換によって行うことができる。
前記目的を達成するために、本発明によるベースレイヤを含むビットストリームで一部ビットストリームを抽出するプリデコーダは、所定の基準にしたがって前記ベースレイヤが存在するフレームのうち省略されるフレームが決められた複数の省略モードから省略モードを決定するモード選択モジュールと、前記決定された省略モード及び抽出条件にしたがって、省略された前記フレームを除外した前記ビットストリーム抽出するビットストリーム抽出モジュールとを含む。
前記目的を達成するために、本発明によるビデオデコーダは、前記ビットストリームの中でベースレイヤに関する情報に所定のコーデックを適用してベースレイヤを復元するベースレイヤデコーダと、前記ビットストリームの中でベースレイヤ以外の情報から、一部フレームが省略された差分フレームを生成する逆空間的変換モジュールと、前記省略されたフレームの位置に対応するベースレイヤを挿入し、前記挿入されたベースレイヤと前記差分フレームに対して逆時間的フィルタリングを行ってビデオシーケンスを復元する逆時間的フィルタリングモジュールとを含む。
本発明によれば、スケーラブルビデオコーディングにおいて、低いビット率と高いビット率で均一に高い性能を有するようにする効果がある。
また、本発明によれば、プリデコーダで一部フレームのビットを省略して他のフレームに提供することによってプリデコーディング後、デコーディングされるビデオシーケンスの画質を向上させることができる。
以下、添付する図面を参照して本発明の好ましい実施形態を詳細に説明する。
本発明の利点及び特徴、そしてそれらを達成する方法は添付する図面とともに詳細に後述する実施形態を参照すれば明確になる。本発明は以下に開示する実施形態に限定されず、相異なる多様な形態によって具現でき、単に本実施形態は本発明の開示を完全なものにし、本発明の属する技術分野における通常の知識を有する者に発明の範疇を完全に知らせるために提供するものであって、本発明は請求項の範疇によってのみ定義される。明細書全体にわたって同じ参照符号は同じ構成要素を示す。
本明細書におけるベースレイヤとは、スケーラブルビデオエンコーダで実際に生成されるビットストリームが有する最高フレーム率より低いフレーム率を、前記ビットストリームが有する最高解像度より低い解像度を有するビデオシーケンスを意味する。このように、ベースレイヤは前記最高フレーム率及び前記最高解像度より低いあるフレーム率及び解像度を有していればよく、必ずしも前記ビットストリームが有する最低フレーム率及び最低解像度を有する必要はないが、本発明の好ましい実施形態としてベースレイヤは最低フレーム率及び最低解像度を有するものとして説明する。
以下、本明細書において、このような最低フレーム率及び最低解像度、または後述する最高解像度はいずれも実際に生成されるビットストリームを基準に決定するものであって、スケーラブルビデオエンコーダ自体が支援できる最低フレーム率や最低解像度、または最高解像度とは区別される。
本発明の一実施形態によるスケーラブルビデオエンコーダ100は図2に示す通りである。スケーラブルビデオエンコーダ100はベースレイヤ生成モジュール110、時間的フィルタリングモジュール120、モーション推定モジュール130、空間的変換モジュール150、量子化モジュール160、及びビットストリーム生成モジュール170、及びアップサンプリングモジュール180を含んで構成できる。
入力されたビデオシーケンスはベースレイヤ生成モジュール110と時間的フィルタリングモジュール120に入力される。ベースレイヤ生成モジュール110は入力されたビデオシーケンスを最低フレーム率及び最低解像度を有するビデオシーケンスでダウンサンプリングすることによってベースレイヤを生成した後、これを所定のコーデックでエンコーディングしてビットストリーム生成モジュール170に提供する。そして、生成されたベースレイヤをアップサンプリングモジュール180に提供する。ここで、前記ダウンサンプリング方法としては多様な方法が使用されるが、このうち解像度側面でのダウンサンプリングはウェーブレット変換を使用したダウンサンプリング方法を使用するのが好ましい。
このように、時間的、空間的にダウンサンプリングされたビデオシーケンス、すなわちベースレイヤを直接アップサンプリングモジュール180に提供することもできるが、最終デコーダ段でベースレイヤを復元する場合との不一致が発生しないように、前記コーデックでエンコーディングされたベースレイヤをまた同じコーデックでデコーディングした結果をアップサンプリングモジュール180に提供することができる。アップサンプリングモジュール180に提供されるモジュールは時間的、空間的にダウンサンプリングされたビデオシーケンスであるか、またはこれをエンコーディングした後、デコーディングした結果のうち1つであり得るが、両者ともベースレイヤと称することにする。
ここで、前記コーデックとしては低いビット率で相対的に優れた画質を見せるコーデックを使用するのが好ましいが、このようなコーデックとしては非ウェーブレット系列であるH.264、MPEG−4などを使用することができる。ここで「優れた画質」とは、同じビット率で圧縮した後、復元したとき、元の映像との差異が小さいことを意味する。このような画質の判断基準としては主にPSNRが使われる。
アップサンプリングモジュール180はベースレイヤ生成モジュール110によって生成されたベースレイヤを時間的フィルタリングを行うフレームの解像度と同じ解像度でアップサンプリングする。ここでも、逆ウェーブレット変換を使用してアップサンプリングするのが好ましい。
一方、時間的フィルタリングモジュール120は時間軸方向にフレームを低周波フレームと高周波フレームとに分解することによって時間的重複性を減少させる。本発明で時間的フィルタリングモジュール120は時間的方向にフィルタリングを行うだけでなく、アップサンプリングされたベースレイヤと該当フレームの差を使用したフィルタリングもともに行うことができる。時間的方向に行うフィルタリングを時間的差分コーディングといい、アップサンプリングされたベースレイヤとの差を使用したフィルタリングを差異コーディングと定義する。このように、本発明での時間的フィルタリングという時間的方向の差分コーディングだけでなく、ベースレイヤを使用した差異コーディングも含む概念として理解することができる。
参照フレームを基準としてモーション推定を行う過程はモーション推定モジュール130によって行われるが、時間的フィルタリングモジュール120は必要とする度にモーション推定モジュール130にモーション推定を行わせ、その結果をリターンさせることができる。
このような時間的フィルタリング方法としては、例えばMCTF、UMCTFなどを使用することができる。図3はMCTF(5/3フィルタ)を使用した本発明の動作を説明する図面である。ここで、1つのGOPは8つのフレームで構成されるものとし、GOP境界を超えても参照できるものとする。まず、8つのフレームは時間的レベル1で、4個の低周波フレーム(L)と4個の高周波フレーム(H)とに分解される。ここで、高周波フレームは自身の左右フレームの全てを参照フレームとしたり、左右フレームのうち1個のフレームを参照フレームとすることができる。その後、低周波フレームはまた左右の高周波フレームを使用して自身を更新することができる。このような更新過程は低周波フレームを元フレームのまま使用せずに高周波フレームを反映して更新することによって、高周波フレームに偏るエラーを分散させる役割をする。しかし、このような更新過程は本発明を動作するために必須的な内容ではないので、以下では更新過程は省略して元フレームがそのまま低周波フレームになるのを例として説明する。
次いで、時間的レベル2で、時間的レベル1の4個の低周波フレームはまた2つの低周波フレームと2つの高周波フレームとに分解される。そして、最後に時間的レベル3で、時間的レベル2の2つの低周波フレームは1個の低周波フレームと1個の高周波フレームとに分解される。以後、最上位時間的レベルの低周波フレーム1個と残り高周波フレーム7つを符号化して伝送するようになる。
ところが、最上位時間的レベル、最低フレーム率を有するフレームに対応する区間に対しては単純な時間的差分コーディング方法とは異なる方法でフィルタリングを行う。したがって、現在GOP内の時間的レベル3で、低周波フレーム60及び高周波フレーム70は差異コーディングによってフィルタリングされるようにできる。この中でも高周波フレーム70は単純に差異コーディングによってフィルタリングできるが、時間的に関連性のある他のフレームを参照することができるので、時間的差分コーディングによってフィルタリングされることもある。したがって、所定のピクセルサイズのブロック別に時間的差分コーディングと差異コーディングのうち有利な方法を選択して前記ブロック別にフィルタリングする方法を使用する。
このように有利な方法を選択する基準としては、R−D最適化方法を使用することができる。時間的差分コーディングの方法も順方向、逆方向、両方向の3つが存在するので、この3つの場合と差異コーディングに適用される費用関数が最小になる方法をブロック別に選択すれば良い。
逆方向コーディング方法を選択する場合のエラーをEbに、順方向コーディング方法を選択する場合のエラーをEfに、両方向コーディング方法を使用する場合のエラーをEbiに、そして、ベースレイヤを参照フレームとして使用する場合のエラーをEiにする。そして、各々に消耗される追加ビット量をBb、Bf、Bbi、Biにすれば、それぞれの費用関数は次の(式1)のように定義される。ここで、Bb、Bf、Bbiは各方向に対してモーションベクトル、参照フレームなどを含むモーション情報を圧縮するのに必要とするビット量を意味する。ところが、差異コーディングの際にはモーションベクトルを使用しないのでBiは非常に小さくてBiは省略しても良い。
Figure 0005026965

ここで、λはラグランジュ係数であって、圧縮率にしたがって決定される常数値である。モード選択モジュール(図示せず)は前記4個の費用のうち最低のモードを選択することによって最上位時間的レベルの高周波フレームに対して好適なモードを選択することができるようになる。前記αは差異コーディングが反映されるようにする程度を示す常数であって、αが1であれば他の費用関数と同等に比較して選択されるようにする場合であり、αが大きくなるほど差異コーディング方法が選択されなくなる。そして、αが小さくなるほどB−イントラモードがさらに選択されるようになる。
図4は最上位時間的レベルに存在する高周波フレームが前記費用関数にしたがって各ブロック別に他の方式で符号化される例を示す図面である。ここで1個のフレームは16個のブロックで構成されており、MBは各ブロックを示すものとする。そして、F、B、Bi、そしてBintraは各々順方向推定モード、逆方向推定モード、両方向推定モード、そしてイントラ推定モードでフィルタリングされるものを示す。
図4において、ブロックMBはCb、Cf、Cbi、及びCiを比較した結果、Cfが最小値であるので順方向推定モードでフィルタリングされ、ブロックMB15はCiが最小値であるのでB−イントラモードでフィルタリングされる場合を示している。
再び図2を参照する。モーション推定モジュール130は時間的フィルタリングモジュール120の呼び出しを受けて、時間的フィルタリングモジュール120で決定される参照フレームを基準に現在フレームのモーション推定を行ってモーションベクトルを求める。このような動作推定のために広く使われるアルゴリズムはブロックマッチングアルゴリズムである。すなわち、与えられたブロックを参照フレームの特定探索領域内でピクセル単位で動作しながらそのエラーが最低になる場合の変位を動作ベクトルで推定するものである。モーション推定のために図4の例のように、固定されたブロックを使用することができるが、階層的可変サイズブロックマッチング法(HVSBM)による階層的な方法を使用することができる。モーション推定モジュール130はモーション推定結果、求められるブロックのサイズ、モーションベクトル、参照フレーム番号などのモーション情報をビットストリーム生成モジュール170に提供する。
空間的変換モジュール150は時間的フィルタリングモジュール120によって時間的重複性が除去されたフレームに対して、空間的スケーラビリティを支援する空間的変換法を使用して空間的重複性を除去する。このような空間的変換法としてはウェーブレット変換が主に使われている。空間的変換結果、求められる係数を変換係数という。
ウェーブレット変換を使用する例をより詳しく説明する。空間的変換モジュール150は時間的重複性が除去されたフレームに対して、ウェーブレット変換を使用して1個のフレームを分解して低周波サブバンドと高周波サブバンドとに区分し、各々に対するウェーブレット係数を求める。
図5は入力イメージまたはフレームをウェーブレット変換によってサブバンドで分解する過程の例を示す図面であって、2つのステップレベルに分割したものである。ここには3つの高周波サブバンド、すなわち水平、垂直、及び対角位置のサブバンドがある。低周波サブバンド、すなわち水平及び垂直方向の全てに対して低周波であるサブバンドは「LL」と表記する。前記高周波サブバンドは「LH」、「HL」、「HH」と表記するが、これは各々水平方向高周波、垂直方向高周波、そして水平及び垂直方向高周波サブバンドを意味する。そして、低周波サブバンドは繰り返し分解できる。括弧内の数字はウェーブレット変換レベルを示すものである。
量子化モジュール160は空間的変換モジュール150で求めた変換係数を量子化する。量子化とは、任意の実数値で表現される前記変換係数を一定区間に分けて不連続的な値で示し、これを所定のインデックスにマッチングさせる作業を意味する。特に、空間的変換方法でウェーブレット変換を使用する場合には量子化方法として埋め込み量子化方法を使用する場合が多い。このような埋め込み量子化方法としてはEZW、SPIHT、EZBCなどがある。
ビットストリーム生成モジュール170はベースレイヤ生成モジュール110から提供されるエンコーディングされたベースレイヤデータと、量子化モジュール160によって量子化された変換係数と、モーション推定モジュール130によって提供されるモーション情報を無損失符号化して出力ビットストリームを生成する。このような無損失符号化方法としては、算術符号化、可変長符号化などの多様なエントロピ符号化を使用することができる。
図6は本発明の一実施形態によるプリデコーダ200の構成を示す図面である。このようなプリデコーダ200はトランスコーダやエキストラクタと呼ぶこともある。同様に、画質、解像度またはフレーム率などの抽出条件にしたがってエンコーダ100から受信されたビットストリームの一部を抽出することによって画質、解像度、またはフレーム率を変化させる、すなわちスケーラビリティを具現することをプリデコーディング、トランスコーディング、またはエキストラクタという。
プリデコーダ200はビットストリーム受信モジュール210、モード決定モジュール220、ビットストリーム抽出モジュール230、及びビットストリーム伝送モジュール240を含んで構成できる。
ビットストリーム受信モジュール210はエンコーダ100段で生成されたビットストリームを受信する。このようにビットストリームを受信することは有線・無線ネットワークにかかわらず、具体的ネットワーク網の種類にかかわらず行うことができる。
図7はエンコーダ100側から受信されるビットストリーム300構造の一例を示す図面である。ビットストリーム40はエンコーディングされたベースレイヤに対して無損失符号化したビットストリームであるベースレイヤビットストリーム450と、時間的、空間的にスケーラビリティが支援されて量子化モジュール160から伝送された変換係数を無損失符号化したビットストリーム、すなわちスケーラブルビットストリーム500で構成できる。
図8に示す通りに、スケーラブルビットストリーム500はシーケンスヘッダフィールド510とデータフィールド520で構成でき、データフィールド520は1つ以上のGOPフィールド530,540,550で構成できる。シーケンスヘッダフィールド510にはフレームの横サイズ(2バイト)、縦サイズ(2バイト)、GOPサイズ(1バイト)、フレーム率(1バイト)など映像の特徴を記録する。そして、データフィールド520は映像を示すデータと、その他映像復元のために必要な情報(モーション情報など)が記録される。
図9は各GOPフィールド510,520,550の細部構造を示す図面である。GOPフィールド510,520,550はGOPヘッダ551と、時間的に他のフレームを参照せずにエンコーディングされるフレームに関する情報を記録するT0フィールド552と、モーション情報及びモード情報が記録されるMVフィールド553と、前記他のフレームを参照してエンコーディングされるフレームの情報を記録する「the other T」フィールド554で構成できる。モーション情報にはブロックサイズと、各ブロック別モーションベクトルと、モーションベクトルを求めるために参照する参照フレームの番号などが含まれる。このような参照フレーム番号としては時間的に関連性あるフレームうち1個の番号記録されることもでき、差異コーディングがある場合にはベースレイヤフレームを示す番号(他のフレームが使用しない番号を特定して使用することができる)が記録される。このように差異コーディングにより生成されるブロックには参照フレームは存在するが、モーションベクトルは存在しない。
MVフィールド553にはそれぞれのフレーム別に細部的な、MV(1)ないしMV(n−1)フィールドが含まれる。一方、the other Tフィールド554は各フレームの映像を示すデータが記録される細部的な、T(1)ないしT(n−1)フィールドが含まれる。ここで、nはGOPサイズを意味する。図9に示す通りに、1つのGOPで低周波フレームがGOPの開始部分に位置し、その個数が1つであると示すのは単に一例に過ぎず、エンコーダ100段での時間的推定方法にしたがって低周波フレームは2つ以上が存在することがあり、GOPの最初位置でない他の位置に存在することがある。
また図6を参照すれば、モード決定モジュール220ではエンコーダ100段で伝送されたビットストリーム400内のスケーラブルビットストリーム500の中で一部のビットストリームを抽出するとき省略するフレームを決定する。このような省略方法を「向上省略モード」と定義することができる。向上省略モードの基本発想を見れば、エンコーダはビデオ信号を時間的予測またはベースレイヤを使用した予測方法を使用してエンコーディングする。
プリデコーダ200段では、目的ビット率が低い場合には、ベースレイヤフレームに対応するフレームのテクスチャ情報とモーション情報は全体的に省略される。前記テクスチャ情報は時間的差分コーディングまたは差異コーディングによって生成されるフレームを意味し、モーション情報はモーションベクトル、参照フレーム番号、ブロックのサイズなどを含む意味である。
これをいくつかの場合に割れば、第一モードは目的ビット率が十分な場合であって、省略されるフレームなく全てのフレームが伝送されるモードである。そして、第三モードは目的ビット率が一定以上低い場合であって、対応するベースレイヤを有するフレームは省略されるモードである。そして、第二モードは、中間ビット率に該当する場合であって、対応するベースレイヤを有するフレームのうち高周波フレームだけ省略され、相対的に重要な情報を含む低周波フレームは省略できないモードである。
このように3つのモードに分ける基準はさまざまな方法があるが、デコーダ段に接続されたネットワークの伝送状態に関する情報にしたがって伝送可能なビット率、すなわち目的ビット率を基準にモードを決定することができる。図10はこのように目的ビット率にしたがってモードを分類する基準を説明する図面であって、目的ビット率に対して第一閾値(θ)と第二閾値(θ)を設定した後、現在デコーダ段に伝送状態を考慮するとき、目的ビット率が第一閾値を超えると判断されれば第一モードを適用し、目的ビット率が第二閾値より小さいと判断されれば第三モードを適用する。そして、目的ビット率が第一閾値と第二閾値との間に存在すると判断されれば第二モードを適用するようになる。
ビットストリーム抽出モジュール230はモード決定モジュール220で決定された向上省略モードと抽出条件を考慮してビットストリーム400内のスケーラブルビットストリーム500のうち一部を抽出することによってデコーダ300段に伝送するビットストリームを生成する。ここで、抽出条件は画質、解像度、またはフレーム率条件を意味し、このような抽出条件はユーザによって直接入力され、またはビットストリーム伝送モジュール240によって得ることができる伝送可能なビット率情報を使用して決定できる。本発明では単に抽出条件だけを考慮してビットストリームを抽出するのではなく、向上省略モード及び抽出条件もともに考慮してビットストリームを抽出する。それは向上省略モードにしたがって一部フレームは省略できるので、省略されたフレームを除外した残りフレームに対して抽出条件を適用する場合が存在するためである。このように省略されたフレームによって節約されるビットは他のフレームに与えることができるため、これは自然に性能向上につながることになる。
図11はビットストリーム抽出モジュール230で行われる動作の一例を説明する図面である。ここで、F0、F1、…F8はそれぞれのフレームを意味し、各数字はフレーム番号を意味し、「B」はベースレイヤを意味する。ここで、F0及びF8は低周波フレームとしてベースレイヤを使用して差異コーディングされたフレームである。
モード決定モジュール220で決定されたモードが第一モードである場合にはビットストリーム抽出モジュール230ではベースレイヤを考慮せずに本来のテクスチャ情報、またはテクスチャ情報とモーション情報をそのままビットストリーム伝送モジュールに伝送する。また、第三モードである場合には、ベースレイヤが存在するフレーム、すなわちF0、F4、F8に対するテクスチャ情報、またはテクスチャ情報とモーション情報は全て省略されてビットストリーム伝送モジュール240に伝送されない。このようにベースレイヤが存在するフレームであるか否かはビットストリーム受信モジュール210から提供される、ベースレイヤのフレーム番号情報またはフレーム率情報(この情報はベースレイヤビットストリーム450の一部位置に記録できる)によって分かる。
一方、モード決定モジュール220で決定されたモードが第二モードである場合には、ビットストリーム抽出モジュール230はベースレイヤが存在するフレームの中で高周波フレームインF4に対するテクスチャ情報及びモーション情報は省略し、低周波フレームインF0、及びF8に対するテクスチャ情報は省略せずにビットストリーム伝送モジュール240に伝送する。ここで、ベースレイヤが存在する低周波フレームと高周波フレームはあるGOP内で各々1つずつ存在することを例として挙げたが、エンコーダ100段でベースレイヤを生成する方法にしたがって他の個数及び他の位置の低周波フレーム、高周波フレームが存在できることは当業者には明らかな事項である。
図12はビットストリーム抽出モジュール230で行われる動作の他の例を説明する図面である。ここで本来のスケーラブルビットストリーム500で向上省略モード及び抽出条件を考慮して判断した結果、時間的レベル2に存在するフレームだけ抽出するようになる場合を示すものである。前記判断結果、このように時間的次元で一部フレームだけを抽出することも可能であり、あらゆるフレームを抽出対象にするもののフレームの解像度を下げたり、フレームの画質を下げることも可能である。
第二モードまたは第三モードである場合には一部フレームが省略されるのでその省略されたビット数分他のフレームに割り当てることによってフレーム率、解像度または画質を高めるのに使うことができる。
図13及び図14は図11でビットストリーム抽出モジュール230の抽出過程にしたがってスケーラブルビットストリーム500で1つのGOPフィールド550が変化される形態を示す図面である。図13は変化以前のGOPフィールド550の構造を示す図面である。第一モードである場合には本発明にしたがって省略されるフレームが存在しないが(もちろん、この場合も抽出条件のうちフレーム率条件にしたがって省略されるフレームは存在できる)、第三モードである場合にはF0に関するテクスチャ情報のT0と、F4に対するモーション情報のMV4と、F4に対するテクスチャ情報のT4は省略される。ここでは1つのGOP内のフレームだけを表示したので図13でのF8は示されない。第二モードにしたがって斜線の部分が省略されたGOPフィールド550の構造は図14に示す通りである。
一方、第二モードである場合にはベースレイヤが存在するフレームのうち高周波フレームに関する情報だけ省略されなければならないので、図13でMV4とT4だけ省略される。第二モードにしたがって高周波フレーム情報が省略されたGOPフィールド550の構造は図15に示す通りである。
以上のように、ビットストリーム抽出モジュール230はモード情報にしたがって各GOP別に一部フレームを省略し、スケーラブルビットストリーム500を再構成することによって新しくビットストリームを抽出し、これをビットストリーム伝送モジュール240に伝送する。
ビットストリーム伝送モジュール240はビットストリーム抽出モジュール230によって抽出されたビットストリームを有線・無線ネットワークによってデコーダ300段に伝送する。
図16は本発明の一実施形態によるスケーラブルビデオデコーダ300の構成を示す図面である。スケーラブルビデオデコーダ300はビットストリーム解析モジュール310、逆量子化モジュール320、逆空間的変換モジュール330、逆時間的フィルタリングモジュール340、アップサンプリングモジュール350、及びベースレイヤデコーダ360を含んで構成できる。
まず、ビットストリーム解析モジュール310はエントロピ符号化方式の逆として、入力されたビットストリームを解析してベースレイヤの情報と、以外階層の情報とを分離して抽出する。ここで、ベースレイヤの情報はベースレイヤデコーダ360に提供されている。そして、その以外階層の情報のうちテクスチャ情報は逆量子化モジュール320に提供し、モーション情報及び向上省略モード情報は逆時間的フィルタリングモジュール340に提供する。
ベースレイヤデコーダ360はビットストリーム解析モジュール310から提供されていたベースレイヤの情報を所定のコーデックでデコーディングする。前記所定のコーデックとしてはエンコーディング時に使われたコーデックに対応するコーデックが使われるが、このようなコーデックとしては低いビット率で優れた性能を示すH.264、MPEG−4などを使用するのが好ましい。
アップサンプリングモジュール350はベースレイヤデコーダ360でデコーディングされたベースレイヤのフレームを逆時間的フィルタリングを行うフレームの解像度と同じ解像度でアップサンプリングする。このようなアップサンプリング方法としては多様な方法があるが、最初エンコーダ100で解像度ダウンサンプリングを行うときに使用した方法を逆に使用するのが好ましい。例えば、エンコーダ100でウェーブレット変換によってダウンサンプリングを行えばここでも逆ウェーブレット変換によってアップサンプリングを行う。アップサンプリングモジュール350は必須構成要素ではなく、ベースレイヤの解像度と前記フィルタリングを行うフレームの解像度とが同じ場合にはアップサンプリングモジュール350は動作しなくても良い。
一方、逆量子化モジュール320はビットストリーム解析モジュール310から伝送されたテクスチャ情報を逆量子化して変換係数を出力する。逆量子化過程はエンコーダ100段で所定のインデックスで表現して伝送した値からこれとマッチングされる量子化された係数を検索する過程である。インデックスと量子化係数との間のマッチング関係を示すテーブルはエンコーダ100段から伝送することもでき、予めエンコーダとデコーダとの間の約束にしたがうこともできる。
逆空間的変換モジュール330は空間的変換を逆に行い、前記変換係数を空間的領域での変換係数で逆変換する。例えば、ウェーブレット方式で空間的変換されて場合にはウェーブレット領域での変換係数を空間的領域での変換係数に逆変換する。
逆時間的フィルタリングモジュール340は前記空間的領域での変換係数、すなわち差分フレームを逆時間的フィルタリングしてビデオシーケンスを構成するフレームを復元する。逆時間的フィルタリングのために逆時間的フィルタリングモジュール340はビットストリーム解析モジュール310から提供されるモーション情報と向上省略モード情報、そしてベースレイヤデコーダ250から提供されるベースレイヤを使用する。
逆時間的フィルタリングモジュール340は前記向上省略モードにしたがって省略されたフレームに対してはその省略されたフレームに対応するベースレイヤに交替した後、逆時間的フィルタリング過程を行う。図17は図14のようにプリデコーダ200で第三モードにしたがって一部フレームが省略されたGOPのモーション情報及びテクスチャ情報をフレーム番号別に示すものである。ここで、F0フレーム及びF4フレームが省略されて存在しない。これにより、逆時間的フィルタリングを行う以前に省略されたフレームを復元しなければならないが、これに係って図18は図17のような状況で省略されたフレームをベースレイヤを使用して復元する過程を説明する図面である。
ベースレイヤデコーダ250で復元されたベースレイヤはその自体が最低フレーム率と最低解像度を有するビデオシーケンスとして直接出力できる。そして、前記復元されたベースレイヤはベースレイヤ以外のフレームを復元するために逆時間的フィルタリングモジュール240に提供されている。
図18で省略されたフレームインF0、F4、F8はベースレイヤデコーダ250で復元されたベースレイヤを使用して復元できる。前記ベースレイヤの位置0,4,8はベースレイヤビットストリーム450に含まれるベースレイヤのフレーム番号またはベースレイヤのフレーム率を参照して理解できる。たとえ、復元されたベースレイヤと逆時間的フィルタリングを行うフレームの解像度が異なれば、アップサンプリングモジュール260によってベースレイヤをアップサンプリングした後、該当フレームの位置に挿入する。このようにベースレイヤによって復元されるフレームF0、F4、F8は差分フレームでなく、その自体で完成した低周波フレームである。したがって、残り高周波フレームインF1、F2、F3、F5、F6、F7はエンコーダ100段で時間的フィルタリングされた方式にしたがって、前記ベースレイヤによって復元された低周波フレームまたは他の高周波フレームのうちまず復元されたフレームを参照して逆時間的フィルタリングできる。このように各フレーム別に復元されればその全体が1つのビデオシーケンスを形成するようになる。
ここで、逆時間的フィルタリングはエンコーダ100段で時間的フィルタリングを行った方法の逆に行うので、エンコーダ100段で差異コーディングによってフィルタリングされた場合は対応するベースレイヤとの和を求めることによって、また、時間的予測コーディングによってフィルタリングされた場合は該当参照フレーム番号及びモーションベクトルを使用して構成される予測フレームとの和を求めることによって行われる。
図17及び図18の例では第三モードの場合を例として挙げたが、第二モードである場合も省略された高周波フレームだけをベースレイヤを使用して復元するものとし、別途の説明は省略する。そして、第一モードである場合には省略されたフレームがないので逆時間的フィルタリングモジュール240でベースレイヤを使用する必要はなくなる。
以上の説明において、「モジュール」という用語はソフトウェア構成要素またはFPGAまたはASICのようなハードウェア構成要素を意味し、モジュールはある役割をする。しかし、モジュールはソフトウェアまたはハードウェアに限定される意味ではない。モジュールはアドレシングできる保存媒体にあるように構成でき、1つまたはそれ以上のプロセッサを実行させるようにも構成できる。したがって、一例としてモジュールはソフトウェア構成要素、オブジェクト指向ソフトウェア構成要素、クラス構成要素及びタスク構成要素などのように構成要素と、プロセス、関数、属性、プロシージャ、サブルーチン、プログラムコードのセグメント、ドライバ、ファームウェア、マイクロコード、回路、データ、データベース、データ構造、テーブル、アレイ、及び変数を含む。構成要素などとモジュールの中で提供される機能はさらに小さな類似構成要素及びモジュールに接続されたり、追加的な構成要素などとモジュールにさらに分離できる。また、構成要素及びモジュールは通信システム内の1つまたはそれ以上のコンピュータを実行させるように具現できる。
図19はMibileシーケンスでビット率に対するPSNRを比較したグラフである。本発明による方法を使用した結果は高いビット率では既存のスケーラブルビデオコーディング(SVC)方法を使用した結果と類似し、低いビット率では非常に優れた結果を示す。この中でもα=1である場合(時間的差分コーディングと差異コーディングを比較選択する場合)はα=0である場合(差異コーディングだけする場合)に比べて、高いビット率では多少高い性能を示し、低いビット率では多少低い性能を示す。しかし、両者は最低ビット率(48kbps)では互いに同じ性能を示している。
そして、α=0であり、本発明で提案したモードのうち1つの第三向上省略モードを使用する場合は、低いビット率ではα=0だけを使用する場合と類似しており、高いビット率ではα=1だけを使用する場合と類似している。結果的に、向上省略モードを追加して低いビット率と高いビット率で均一に優れた性能を示すことが分かる。
以上、添付する図面を参照して本発明の実施形態を説明しましたが、本発明の属する技術分野における通常の知識を有する者は本発明がその技術的思想や必須的な特徴を変更せずに他の具体的な形態によって実施できることが理解できる。したがって前述した実施形態はあらゆる面で例示的なものであって、限定的なものではないことを理解しなければならない。
従来のスケーラブルビデオコーディングシステムの全体構成を示す図である。 本発明の一実施形態によるスケーラブルビデオエンコーダの構成を示す図である。 エンコーダ段で本発明の一実施形態による時間的フィルタリング過程を説明する図である。 最上位の時間的レベルに存在する高周波フレームが前記費用関数にしたがって各ブロック別に異なる方式でエンコードされた例を示す図である。 入力イメージをウェーブレット変換によってサブバンドに分解する過程の例を示す図である。 発明の一実施形態によるプリデコーダの構成を示す図である。 エンコーダ側から受信されるビットストリーム構造の一例を示す図である。 スケーラブルビットストリームの概略的な構成を示す図である。 GOPフィールドの細部構造を示す図である。 目的ビット率にしたがってモードを分類する基準を説明する図である。 ビットストリーム抽出モジュールで行われる動作の一例を説明する図である。 ビットストリーム抽出モジュールで行われる動作の他の例を説明する図である。 ビットストリーム抽出モジュールでの抽出過程にしたがって変化される以前のGOPフィールドの構造を示す図である。 第三モードの場合に、ビットストリーム抽出モジュールでの抽出過程にしたがって変化された以後のGOPフィールドの構造を示す図である。 第二モードの場合に、ビットストリーム抽出モジュールでの抽出過程にしたがって変化された以後のGOPフィールドの構造を示す図である。 本発明の一実施形態によるスケーラブルビデオデコーダの構成を示す図である。 図14のようにプリデコーダで第三モードにしたがって一部フレームが省略されたGOPのモーション情報及びテクスチャ情報をフレーム番号別に示す図である。 図17のような状況で省略されたフレームをベースレイヤを使用して復元する過程を説明する図である。 Mibileシーケンスでビット率に対するPSNRを示すグラフである。

Claims (18)

  1. ベースレイヤを含むビットストリームをプリデコーディングする方法において、
    所定の基準にしたがって、前記ベースレイヤが存在する時間的位置に該当するフレームのうち、スケーラブルビット部分のデータが省略されるフレームが決められた複数の省略モードから省略モードを決定するステップと、
    前記決定された省略モード及び抽出条件にしたがって、決められた前記フレームのスケーラブルビット部分のデータを除外した前記ビットストリームを抽出するステップと、を含むことを特徴とするプリデコーディング方法。
  2. 前記基準は、
    デコーダ端に接続されたネットワークの伝送状態による伝送可能なビット率を意味することを特徴とする請求項1に記載のプリデコーディング方法。
  3. 前記決定するステップは、
    前記ビット率が第一閾値より低い場合には、前記複数の省略モードのうち前記ベースレイヤが存在する時間的位置に該当するフレームのスケーラブルビット部分のデータ全体を省略する省略モード決定するステップを含むことを特徴とする請求項2に記載のプリデコーディング方法。
  4. 前記決定するステップは、
    前記ビット率が第一閾値より高く、第二閾値より低い場合には、前記複数の省略モードのうち前記ベースレイヤが存在する時間的位置に該当するフレームのうち高周波フレームのスケーラブルビット部分のデータを省略する省略モード決定するステップを含むことを特徴とする請求項2に記載のプリデコーディング方法。
  5. ベースレイヤを含み、一部フレームのスケーラブルビット部分のデータが所定の基準にしたがって決められた複数の省略モードによって省略されたビットストリームをデコーディングする方法において、
    前記ビットストリームの中でベースレイヤに関する情報に所定のコーデックを適用してベースレイヤを復元するステップと、
    前記ビットストリームの中でベースレイヤ以外の情報から、一部フレームのスケーラブルビット部分のデータが省略された差分フレームを生成するステップと、
    前記スケーラブルビット部分のデータが省略されたフレームの位置に対応するベースレイヤを挿入するステップと、
    前記挿入されたベースレイヤと前記差分フレームに対して逆時間的フィルタリングを行ってビデオシーケンスを復元するステップとを含むことを特徴とするビットストリームをデコーディングする方法。
  6. 前記生成するステップは、前記ビットストリームの中でベースレイヤ以外のテクスチャ情報を逆量子化して変換係数を出力するステップと、
    前記変換係数を空間的領域での変換係数路逆変換するステップとを含むことを特徴とする請求項5に記載のビットストリームをデコーディングする方法。
  7. 前記ベースレイヤは、前記ベースレイヤの解像度を前記差分フレームの解像度でアップサンプリングした後に挿入されることを特徴とする請求項5に記載のビットストリームをデコーディングする方法。
  8. 前記逆時間的フィルタリングは、前記差分フレームが差異コーディングによって生成されたフレームである場合は対応するベースレイヤとの和を求めることによって、また、時間的予測コーディングによって生成されたフレームである場合は該当参照フレーム番号及びモーションベクトルを使用して構成される予測フレームとの和を求めることを特徴とする請求項5に記載のビットストリームをデコーディングする方法。
  9. 前記コーデックとしては、H.264を使用することを特徴とする請求項5に記載のビットストリームをデコーディングする方法。
  10. 前記アップサンプリングは、逆ウェーブレット変換によって行われることを特徴とする請求項7に記載のビットストリームをデコーディングする方法。
  11. ベースレイヤを含むビットストリームで一部ビットストリームを抽出するプリデコーダにおいて、
    所定の基準にしたがって前記ベースレイヤが存在する時間的位置に該当するフレームのうち、スケーラブルビット部分のデータが省略されるフレームが決められた複数の省略モードから省略モードを決定するモード選択モジュールと、
    前記決定された省略モード及び抽出条件にしたがって、決められた前記フレームのスケーラブルビット部分のデータを除外した前記ビットストリームを抽出するビットストリーム抽出モジュールとを含むことを特徴とするプリデコーダ。
  12. 前記基準は、デコーダ段に接続されたネットワークの伝送状態による伝送可能なビット率を意味することを特徴とする請求項11に記載のプリデコーダ。
  13. 前記モード選択モジュールは、前記ビット率が第一閾値より低い場合には、前記複数の省略モードのうち前記ベースレイヤが存在する時間的位置に該当するフレームのスケーラブルビット部分のデータ全体を省略する省略モードに決定することを特徴とする請求項12に記載のプリデコーダ。
  14. 前記モード選択モジュールは、前記ビット率が第一閾値より高く、第二閾値より低い場合には、前記複数の省略モードのうち前記ベースレイヤが存在する時間的位置に該当するフレームのうち高周波フレームのスケーラブルビット部分のデータを省略する省略モードに決定するステップを含むことを特徴とする請求項12に記載のプリデコーダ。
  15. ベースレイヤを含み、所定の基準にしたがって決められた複数の省略モードによって一部フレームのスケーラブルビット部分のデータが省略されたビットストリームをデコーディングするビデオデコーダにおいて、
    前記ビットストリームの中でベースレイヤに関する情報に所定のコーデックを適用してベースレイヤを復元するベースレイヤデコーダと、
    前記ビットストリームの中でベースレイヤ以外の情報から、一部フレームのスケーラブルビット部分のデータが省略された差分フレームを生成する逆空間的変換モジュールと、
    前記スケーラブルビット部分のデータが省略されたフレームの位置に対応するベースレイヤを挿入するモジュールと、
    前記挿入されたベースレイヤと前記差分フレームに対して逆時間的フィルタリングを行ってビデオシーケンスを復元する逆時間的フィルタリングモジュールとを含むことを特徴とするビデオデコーダ。
  16. 前記ベースレイヤは、
    前記ベースレイヤの解像度を前記差分フレームの解像度でアップサンプリングした後に挿入されることを特徴とする請求項15に記載のビデオデコーダ。
  17. 前記逆時間的フィルタリングモジュールは、
    前記差分フレームが差異コーディングによって生成されたフレームである場合は対応するベースレイヤとの和を求めることによって、また、時間的予測コーディングによって生成されたフレームである場合は該当参照フレーム番号及びモーションベクトルを使用して構成される予測フレームとの和を求めることを特徴とする請求項15に記載のビデオデコーダ。
  18. ベースレイヤを含むビットストリームをプリデコーディングする方法を実行するためのプログラムをコンピュータによって読取可能なプログラムで記録した記録媒体において、
    所定の基準にしたがって前記ベースレイヤが存在する時間的位置に該当するフレームのうち、スケーラブルビット部分のデータが省略されるフレームが決められた複数の省略モードから省略モードを決定するステップと、
    前記決定された省略モード及び抽出条件にしたがって、決められた前記フレームのスケーラブルビット部分のデータを除外した前記ビットストリームを抽出するステップとを含むことを特徴とする記録媒体。
JP2007521390A 2004-07-15 2005-07-04 ベースレイヤを含むビットストリームをプリデコーディング、デコーディングする方法及び装置 Expired - Fee Related JP5026965B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR20040055253A KR100621581B1 (ko) 2004-07-15 2004-07-15 기초 계층을 포함하는 비트스트림을 프리디코딩,디코딩하는 방법, 및 장치
KR10-2004-0055253 2004-07-15
PCT/KR2005/002109 WO2006006777A1 (en) 2004-07-15 2005-07-04 Method and apparatus for predecoding and decoding bitstream including base layer

Publications (2)

Publication Number Publication Date
JP2008506327A JP2008506327A (ja) 2008-02-28
JP5026965B2 true JP5026965B2 (ja) 2012-09-19

Family

ID=35599374

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007521390A Expired - Fee Related JP5026965B2 (ja) 2004-07-15 2005-07-04 ベースレイヤを含むビットストリームをプリデコーディング、デコーディングする方法及び装置

Country Status (6)

Country Link
US (2) US8031776B2 (ja)
EP (1) EP1782631A4 (ja)
JP (1) JP5026965B2 (ja)
KR (1) KR100621581B1 (ja)
CN (1) CN100435585C (ja)
WO (1) WO2006006777A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8587660B2 (en) 2010-07-30 2013-11-19 General Electric Company Image recording assemblies and coupling mechanisms for stator vane inspection
US8602722B2 (en) 2010-02-26 2013-12-10 General Electric Company System and method for inspection of stator vanes

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8340177B2 (en) 2004-07-12 2012-12-25 Microsoft Corporation Embedded base layer codec for 3D sub-band coding
CA2572818C (en) * 2004-07-14 2013-08-27 Slipstream Data Inc. Method, system and computer program product for optimization of data compression
US7570827B2 (en) 2004-07-14 2009-08-04 Slipstream Data Inc. Method, system and computer program product for optimization of data compression with cost function
US9071847B2 (en) 2004-10-06 2015-06-30 Microsoft Technology Licensing, Llc Variable coding resolution in video codec
US8243820B2 (en) 2004-10-06 2012-08-14 Microsoft Corporation Decoding variable coded resolution video with native range/resolution post-processing operation
KR100679022B1 (ko) 2004-10-18 2007-02-05 삼성전자주식회사 계층간 필터링을 이용한 비디오 코딩 및 디코딩방법과,비디오 인코더 및 디코더
WO2006080655A1 (en) * 2004-10-18 2006-08-03 Samsung Electronics Co., Ltd. Apparatus and method for adjusting bitrate of coded scalable bitsteam based on multi-layer
US7956930B2 (en) * 2006-01-06 2011-06-07 Microsoft Corporation Resampling and picture resizing operations for multi-resolution video coding and decoding
EP3537719A1 (en) * 2006-01-09 2019-09-11 Matthias Narroschke Adaptive coding of the prediction error in hybrid video coding
AU2012201234B2 (en) * 2006-03-29 2014-08-21 Vidyo, Inc. System and method for transcoding between scalable and non-scalable video codecs
US8320450B2 (en) 2006-03-29 2012-11-27 Vidyo, Inc. System and method for transcoding between scalable and non-scalable video codecs
KR100781524B1 (ko) * 2006-04-04 2007-12-03 삼성전자주식회사 확장 매크로블록 스킵 모드를 이용한 인코딩/디코딩 방법및 장치
KR101322392B1 (ko) * 2006-06-16 2013-10-29 삼성전자주식회사 스케일러블 코덱의 부호화 및 복호화 방법 및 장치
WO2008004816A1 (en) * 2006-07-04 2008-01-10 Electronics And Telecommunications Research Institute Scalable video encoding/decoding method and apparatus thereof
KR101352979B1 (ko) 2006-07-04 2014-01-23 경희대학교 산학협력단 스케일러블 비디오 인코딩/디코딩 방법 및 그 장치
KR20080004340A (ko) 2006-07-04 2008-01-09 한국전자통신연구원 영상 데이터의 스케일러블 코딩 방법 및 그 장치
US8107571B2 (en) 2007-03-20 2012-01-31 Microsoft Corporation Parameterized filters and signaling techniques
BRPI0804493A2 (pt) * 2007-05-17 2011-08-30 Sony Corp aparelho e método de processamento de informação
KR101385884B1 (ko) * 2008-01-30 2014-04-16 고려대학교 산학협력단 다시점 동영상의 부호화 및 복호화 방법 및 장치
US8953673B2 (en) 2008-02-29 2015-02-10 Microsoft Corporation Scalable video coding and decoding with sample bit depth and chroma high-pass residual layers
US8711948B2 (en) 2008-03-21 2014-04-29 Microsoft Corporation Motion-compensated prediction of inter-layer residuals
US20100027663A1 (en) * 2008-07-29 2010-02-04 Qualcomm Incorporated Intellegent frame skipping in video coding based on similarity metric in compressed domain
US9571856B2 (en) 2008-08-25 2017-02-14 Microsoft Technology Licensing, Llc Conversion operations in scalable video encoding and decoding
US8213503B2 (en) 2008-09-05 2012-07-03 Microsoft Corporation Skip modes for inter-layer residual video coding and decoding
WO2010042650A2 (en) * 2008-10-07 2010-04-15 Motorola, Inc. System and method of optimized bit extraction for scalable video coding
KR101146138B1 (ko) * 2008-12-10 2012-05-16 한국전자통신연구원 시간적 스케일러블 비디오 인코더
KR101557504B1 (ko) * 2009-04-13 2015-10-07 삼성전자주식회사 채널 적응형 비디오 전송 방법, 이를 이용한 장치 및 이를 제공하는 시스템
CN102714726B (zh) 2010-01-15 2015-03-25 杜比实验室特许公司 使用元数据的用于时间缩放的边缘增强
US8374113B2 (en) * 2010-06-03 2013-02-12 Cisco Technology, Inc. Distributed gateway for reliable multicast wireless video
KR101828964B1 (ko) * 2011-10-18 2018-02-13 주식회사 케이티 영상 부호화 방법, 영상 복호화 방법, 영상 부호화기 및 영상 복호화기
KR20130049525A (ko) * 2011-11-04 2013-05-14 오수미 잔차 블록 복원을 위한 역변환 방법
US20140003494A1 (en) * 2012-01-05 2014-01-02 Yaniv Frishman Device, system and method of video encoding
CN103220550B (zh) * 2012-01-19 2016-12-07 华为技术有限公司 视频转换的方法及装置
TWI637625B (zh) * 2012-08-29 2018-10-01 Vid衡器股份有限公司 可調整視訊編碼移動向量預測的方法及裝置
US20150245066A1 (en) * 2012-09-28 2015-08-27 Sony Corporation Image processing apparatus and image processing method
WO2014052740A1 (en) * 2012-09-28 2014-04-03 Vid Scale, Inc. Adaptive upsampling for multi-layer video coding
WO2015082298A1 (en) 2013-12-02 2015-06-11 Dolby International Ab Method for bitrate signaling and bitstream format enabling such method
CN103905843B (zh) * 2014-04-23 2017-05-03 无锡天脉聚源传媒科技有限公司 一种规避连续i帧的分布式音视频处理装置和处理方法
KR20170007665A (ko) * 2015-07-10 2017-01-19 삼성전자주식회사 스킵 모드 정보를 이용한 레이트 조절 인코딩 방법 및 그에 따른 인코딩 장치
CN108076301A (zh) * 2016-11-11 2018-05-25 联芯科技有限公司 VoLTE视频多方电话的视频处理方法和系统

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2871316B2 (ja) * 1992-07-10 1999-03-17 日本ビクター株式会社 動画像符号化装置
US5594660A (en) * 1994-09-30 1997-01-14 Cirrus Logic, Inc. Programmable audio-video synchronization method and apparatus for multimedia systems
KR0185646B1 (ko) * 1996-01-06 1999-05-01 김광호 영상압축장치의 영상압축데이터량 조정회로 및 그 방법
US6057884A (en) * 1997-06-05 2000-05-02 General Instrument Corporation Temporal and spatial scaleable coding for video object planes
JP2000078573A (ja) * 1998-09-03 2000-03-14 Hitachi Ltd 階層符号化データ配信装置
US6493387B1 (en) * 2000-04-10 2002-12-10 Samsung Electronics Co., Ltd. Moving picture coding/decoding method and apparatus having spatially scalable architecture and signal-to-noise ratio scalable architecture together
JP3766259B2 (ja) * 2000-06-01 2006-04-12 株式会社日立製作所 パケット転送装置
JP2004509581A (ja) * 2000-09-22 2004-03-25 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ダブル・ループ動き補償ファイン・グラニューラ・スケーラビリティ
KR100895725B1 (ko) * 2000-11-23 2009-04-30 엔엑스피 비 브이 비디오 비트스트림 디코딩 방법 및 비디오 디코더
US6873655B2 (en) 2001-01-09 2005-03-29 Thomson Licensing A.A. Codec system and method for spatially scalable video data
KR100783396B1 (ko) 2001-04-19 2007-12-10 엘지전자 주식회사 부호기의 서브밴드 분할을 이용한 시공간 스케일러빌러티방법
KR100823244B1 (ko) * 2001-07-21 2008-04-21 삼성전자주식회사 텔레비전에서의 저장 매체를 이용한 방송신호 검색 장치및 방법
JP2005506815A (ja) 2001-10-26 2005-03-03 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 空間拡張可能圧縮のための方法及び装置
US7317759B1 (en) * 2002-02-28 2008-01-08 Carnegie Mellon University System and methods for video compression mode decisions
US7483487B2 (en) 2002-04-11 2009-01-27 Microsoft Corporation Streaming methods and systems
EP1520426A1 (en) * 2002-06-28 2005-04-06 Koninklijke Philips Electronics N.V. Spatial scalable compression
CA2536587A1 (en) * 2003-08-26 2005-03-03 Samsung Electronics Co., Ltd. Scalable video coding method and apparatus using pre-decoder
CN1871858A (zh) * 2003-10-20 2006-11-29 三星电子株式会社 规格化视觉品质的比特率控制方法与装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8602722B2 (en) 2010-02-26 2013-12-10 General Electric Company System and method for inspection of stator vanes
US8587660B2 (en) 2010-07-30 2013-11-19 General Electric Company Image recording assemblies and coupling mechanisms for stator vane inspection

Also Published As

Publication number Publication date
US20060013300A1 (en) 2006-01-19
US20110310959A1 (en) 2011-12-22
WO2006006777A1 (en) 2006-01-19
KR20060006313A (ko) 2006-01-19
CN1722831A (zh) 2006-01-18
JP2008506327A (ja) 2008-02-28
EP1782631A1 (en) 2007-05-09
KR100621581B1 (ko) 2006-09-13
EP1782631A4 (en) 2013-05-01
CN100435585C (zh) 2008-11-19
US8031776B2 (en) 2011-10-04

Similar Documents

Publication Publication Date Title
JP5026965B2 (ja) ベースレイヤを含むビットストリームをプリデコーディング、デコーディングする方法及び装置
JP5014989B2 (ja) 基礎階層を利用するフレーム圧縮方法、ビデオコーディング方法、フレーム復元方法、ビデオデコーディング方法、ビデオエンコーダ、ビデオデコーダ、および記録媒体
KR100679022B1 (ko) 계층간 필터링을 이용한 비디오 코딩 및 디코딩방법과,비디오 인코더 및 디코더
US7889793B2 (en) Method and apparatus for effectively compressing motion vectors in video coder based on multi-layer
KR100679026B1 (ko) 비디오 코딩 및 디코딩을 위한 시간적 분해 및 역 시간적분해 방법과, 비디오 인코더 및 디코더
KR100654436B1 (ko) 비디오 코딩 방법과 디코딩 방법, 및 비디오 인코더와디코더
KR100631777B1 (ko) 다 계층의 모션 벡터를 효율적으로 압축하는 방법 및 장치
JP4891234B2 (ja) グリッド動き推定/補償を用いたスケーラブルビデオ符号化
US20050226334A1 (en) Method and apparatus for implementing motion scalability
US20060159359A1 (en) Fine granularity scalable video encoding and decoding method and apparatus capable of controlling deblocking
JP4844741B2 (ja) 動画像符号化装置及び動画像復号装置と、その方法及びプログラム
JP2007520149A (ja) エンコーダ部からスケーラビリティを提供するスケーラブルビデオコーディング装置および方法
KR100679018B1 (ko) 다계층 비디오 코딩 및 디코딩 방법, 비디오 인코더 및디코더
EP1659797A2 (en) Method and apparatus for compressing motion vectors in video coder based on multi-layer
US20060013311A1 (en) Video decoding method using smoothing filter and video decoder therefor
EP1741297A1 (en) Method and apparatus for implementing motion scalability
JP2008515328A (ja) 階層間フィルタリングを利用したビデオコーディングおよびデコーディング方法と、ビデオエンコーダおよびデコーダ
JP4660550B2 (ja) 多階層ビデオコーディングおよびデコーディング方法、ビデオエンコーダおよびデコーダ

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100301

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100608

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120424

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120621

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150629

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees