JP2009531941A - ビットストリームのビット率の調節のための優先権の割当て方法、ビットストリームのビット率の調節方法、ビデオデコーディング方法およびその方法を用いた装置 - Google Patents

ビットストリームのビット率の調節のための優先権の割当て方法、ビットストリームのビット率の調節方法、ビデオデコーディング方法およびその方法を用いた装置 Download PDF

Info

Publication number
JP2009531941A
JP2009531941A JP2009502666A JP2009502666A JP2009531941A JP 2009531941 A JP2009531941 A JP 2009531941A JP 2009502666 A JP2009502666 A JP 2009502666A JP 2009502666 A JP2009502666 A JP 2009502666A JP 2009531941 A JP2009531941 A JP 2009531941A
Authority
JP
Japan
Prior art keywords
quality
layer
current picture
hierarchy
bit rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009502666A
Other languages
English (en)
Other versions
JP5063678B2 (ja
Inventor
マシュー,マニュ
リー,キョ−ヒョック
ハン,ウー−ジン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020060048979A external-priority patent/KR100772878B1/ko
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2009531941A publication Critical patent/JP2009531941A/ja
Application granted granted Critical
Publication of JP5063678B2 publication Critical patent/JP5063678B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本発明は複数の品質階層で構成されるビットストリームのビット率を調節する方法に関するものである。
ビットストリームのビット率調節のための優先権の割当て方法は、参照ピクチャに関する第1品質階層を構成する段階と、前記参照ピクチャを参照して符号化される現在ピクチャに関する第2品質階層を構成する段階と、前記第1品質階層および前記第2品質階層各々に優先権を割当てる段階と、を含み、除去されても前記現在ピクチャの画質減少に及ぼす影響が小さい品質階層に低い優先権が割当てられる。

Description

本発明は、ビデオコーディング技術に関するものであって、より詳しくは、複数の品質階層で構成されるビットストリームのビット率を調節する方法に関するものである。
インターネットを含む情報通信技術が発達するにつれて文字、音声だけでなく画像通信が増加しつつある。既存の文字中心の通信方式では消費者の多様な欲求を充足させることができず、このため、文字、映像、音楽など多様な形態の情報を収容できるマルチメディアサービスが増加しつつある。マルチメディアデータは、その量がぼう大であるため、大容量の格納媒体を必要とし、かつ伝送時に広い帯域幅を必要とする。したがって、文字、映像、オーディオを含むマルチメディアデータを伝送するためには圧縮コーディング技法を用いるのが必須的である。
データを圧縮する基本的な原理は、データの重複(redundancy)要素を除去する過程である。イメージで同じ色やオブジェクトが反復されるような空間的重複や、動画フレームで隣接フレームがほぼ変化のない場合やオーディオで同じ音が反復し続くような時間的重複、または人間の視覚および知覚能力が高い周波数に鈍感なことを考慮した知覚的重複を除去することによって、データを圧縮することができる。一般的なビデオコーディング方法において、時間的重複はモーション補償に基づく時間的フィルタリング(temporal filtering)によって除去し、空間的重複は空間的変換(spatial transform)によって除去する。
データの重複を除去した後に生成されるマルチメディアを伝送するためには、伝送媒体を必要とするが、その性能は伝送媒体別に差がある。現在使用される伝送媒体は秒当たり数十メガビットのデータを伝送できる超高速通信網から秒当たり384kbitの伝送速度を有する移動通信網などのように多様な伝送速度を有する。このような環境で、多様な速度の伝送媒体をサポートするためにまたは伝送環境に応じてそれに適する伝送率でマルチメディアを伝送できるようにする、すなわち、スケーラブルビデオコーディング(scalable video coding)方法がマルチメディア環境により適するといえる。
スケーラブルビデオコーディングとは、すでに圧縮されたビットストリーム(bit−stream)に対して伝送ビット率、伝送エラー率、システムサポートなどの周辺条件によって前記ビットストリームの一部を切り取ってビデオの解像度、フレーム率、およびSNR(Signal−to−Noise Ratio)などを調節できるようにする符号化方式、すなわち、多様なスケーラビリティ(scalability)をサポートする符号化方式を意味する。
現在、MPEG (Moving Picture Experts Group)とITU (International Telecommunication Union)の共同作業グループ(working group)であるJVT (Joint Video Team)ではH.264を基本とし、スケーラブルビデオコーディング(以下、SVCという)に関する標準化作業が進んでいる。前記SVC標準では、SNRスケーラビリティをサポートするため、FGS (Fine Granularity Scalability)技術を採択している。
図1は、多階層構造を用いたスケーラブルビデオコーディング方式の一例を示す。前記方式において、第1階層はQCIF(Quarter Common Intermediate Format)、15Hz(フレーム率)に設定し、第2階層はCIF(Common Intermediate Format)、30 Hzに設定し、第3階層はSD(Standard Definition)、60 Hzに設定する。
このような多様な解像度および/またはフレーム率を有する多階層ビデオフレームをエンコーディングするには階層間の関連性を用いることができるが、例えば、第1向上階層のビデオフレームのうちある領域12は、基礎階層のビデオフレームのうちから対応する領域13からの予測によって効率的にエンコーディングされる。同様に第2向上階層ビデオフレームのうち領域11は、前記第1向上階層の領域12からの予測によって効率的にエンコーディングされる。
図2は、スケーラブルビデオコーディングのインター予測およびイントラベース予測技法の概念を示す図である。現在階層のあるフレーム21に属するブロック24は同一な階層に存在する他のフレーム22に属するブロック25を参照して予測することができる。これをインター予測という。インター予測は、対応するブロックを示すためのモーションベクターを探すためのモーション推定過程を含む。
一方、前記ブロック24は前記フレーム21と同一な時間的位置またはピクチャ順序カウント(Picture Order Count:POC)に存在する下位階層(基礎階層)のフレーム23に属するブロック26を参照して予測することもできる。これをイントラベース(inta base)予測という。イントラベース予測では、前記モーション推定過程は必要ではない。
図3は、図2の予測によって残差ピクチャ(residual picture)にFGS技法を適用した例を示す図である。残差ピクチャ30は、SNRスケーラビリティをサポートするために複数の品質階層(Quality Layer)で表現することができる。このような品質階層はビデオの品質を多様に表現するために必要なものであって、図1の解像度および/またはフレーム率に関する階層とは区別される。
複数の品質階層は1つの離散階層(discrete layer:31)と少なくとも1つ以上のFGS階層32,33,34で構成されうる。ビデオデコーダで測定されるビデオ品質は離散階層31のみが受信された場合、離散階層31と第1 FGS階層32が受信された場合、離散階層31、第1 FGS階層32および第2 FGS階層33が受信された場合、そして、すべての階層31,32,33,34が受信された場合順に増加する。
図4は、1つのピクチャまたはスライスを1つの離散階層と2つのFGS階層で表現する過程を示す図である。
最初にオリジナルピクチャ(またはスライス)41は第1量子化パラメータ(QP)によって量子化される(S1)。前記量子化されたピクチャ42は離散階層を形成する。前記量子化されたピクチャ42は逆量子化され(S2)、逆量子化されたピクチャ43は減算器(subtractor:44)に提供される。減算器44はオリジナルピクチャから前記提供されたピクチャ43を減算する(S3)。前記減算された結果は再び第2量子化パラメータ(QP)によって量子化される(S4)。前記量子化された結果45は第1 FGS階層を形成する。
前記量子化された結果45は逆量子化され(S5)、逆量子化された結果46は加算器47に提供される。前期提供されたピクチャ46および逆量子化されたピクチャ43は加算器(adder:47)によって加算された後(S6)、減算器48に提供される。減算器48はオリジナルピクチャ41から前記加算された結果を減算する(S7)。前記減算された結果はまた第3量子化パラメータ(QP)によって量子化される(S8)。前記量子化された結果49は第2 FGS階層を形成する。
このような過程によって図3のような複数の品質階層が形成されうる。
図5および図6は、現在のSVC標準で用いられる品質階層を切り取る(truncation)方式を示す図である。図5のように、現在ピクチャ30はインター予測またはイントラベース予測などによって他の参照ピクチャ35から予測されて残差ピクチャで表示される。しかし、残差ピクチャで表示される現在ピクチャ30が複数の品質階層31,32,33,34で構成されるだけではなく、前記参照ピクチャ35も同様に複数の品質階層36,37,38,39で構成されうる。
この場合現在SVC標準によれば、ビデオエンコーディング以後の段階でビットストリーム抽出器はビットストリームのSNRを調節するために次の図6のように品質階層のうち一部を切り取る。すなわち、ビットストリーム抽出器は高い解像度および/またはフレーム率階層(以下「品質階層」と区別して単純に「階層」という)に存在する現在ピクチャ30の最上位品質階層34から順次に切り捨てる。そして、高い階層のピクチャ30の品質階層が完全に切り取られた以後に低い階層の参照ピクチャ35の品質階層を上から切り取る。
このような切り取りの方式は低い階層(例:QCIF)のピクチャ(参照ピクチャ)の復元には最適であるといえるが、高い階層(例:CIF)のピクチャ(現在ピクチャ)の復元するためには最適であるとはいえない。いくつかの低い階層ピクチャの品質階層は高い階層ピクチャの品質のために、高い階層ピクチャの品質階層に比べてあまり重要でないこともある。したがって、ビデオエンコーダ側で高い階層ピクチャを主な目的とするのか低い階層ピクチャを主な目的とするのかによって、他の方式で品質階層を切り取ることで効率的なSNRスケーラビリティを実現する必要がある。
本発明が解決しようとする課題は、高い階層に主眼点をおいたビットストリームのSNR調節方法および装置を提供することにある。
本発明が解決しようとする他の技術的課題は、高い階層ピクチャが主眼点であるのか低い階層ピクチャが主眼点であるのかによって適応的にSNRを調節する方法および装置を提供することにある。
本発明の技術的課題は以上で言及した技術的課題に制限されず、言及されていないまた他の技術的課題は次の記載から当業者に明確に理解できるであろう。
本発明の実施形態によるビットストリームのビット率を調節のための優先権の割当ての方法は、参照ピクチャに関する第1品質階層を構成する段階と、前記参照ピクチャを参照して符号化される現在ピクチャに関する第2品質階層を構成する段階、および前記第1品質階層および前記第2品質階層の各々に優先権を割当てる段階と、を含み、除去されても前記現在ピクチャの画質減少に及ぼす影響が小さい品質階層に低い優先権が割当てられる。
本発明の実施形態によるビットストリームのビット率を調節する方法は、ビデオビットストリームの入力を受ける段階と、前記ビデオビットストリームに関する目標ビット率を設定する段階と、前記ビデオビットストリームのうち現在ピクチャの参照ピクチャに関する第1品質階層と、前記現在ピクチャに関する第2品質階層を読み込む段階、および前記目標ビット率によって前記第1品質階層および前記第2品質階層のうち前記優先権が低い品質階層から切り取る段階と、を含む。
本発明の実施形態によるビデオデコーディング方法は、ビデオビットストリームの入力を受ける段階と、前記ビデオビットストリームのうち現在ピクチャの参照ピクチャに関する第1品質階層と前記現在ピクチャに関する第2品質階層と前記の依存IDを読み込む段階と、前記第1品質階層のうち前記依存IDが指示する品質階層が存在しない場合、前記依存IDは前記第1品質階層のうち最上位品質階層を指示するように設定する段階、および前記依存IDが指示する関係によって現在ピクチャを復元する段階と、を含む。
本発明の実施形態によるビットストリームのビット率を調節のための優先権の割当ての装置は、参照ピクチャに関する第1品質階層を構成する参照ピクチャエンコーディング部と、前記参照ピクチャを参照して符号化される現在ピクチャに関する第2品質階層を構成する現在ピクチャエンコーディング部、および前記第1品質階層および前記第2品質階層各々に優先権を割当てる品質レベル割当て器と、を含み、除去されても前記現在ピクチャの画質減少に及ぼす影響が小さい品質階層に低い優先権が割当てられる。
本発明の実施形態によるビットストリームのビット率を調節する装置は、ビデオビットストリームの入力を受けるビットストリーム入力部と、前記ビデオビットストリームに関する目標ビット率を設定する目標ビット率設定部と、前記ビデオビットストリームのうち現在ピクチャの参照ピクチャに関する第1品質階層と、前記現在ピクチャに関する第2品質階層を読み込むビットストリームパーサーおよび前記目標ビット率によって前記第1品質階層および前記第2品質階層のうち前記優先権が低い品質階層から切り取るビットストリーム切断部と、を含む。
本発明の実施形態によるビデオデコーダは、ビデオビットストリームの入力を受けるエントロピ復号化部と、前記ビデオビットストリームのうち、現在ピクチャの参照ピクチャに関する第1品質階層と、前記現在ピクチャの第2品質階層と、前記第2品質階層の依存IDを読み込むビットストリームパーサーと、前記第1品質階層のうち前記依存IDが指示する品質階層が存在しない場合、前記依存IDは前記第1品質階層のうち最上位品質階層を指示するように設定する依存ID設定部、および前記依存IDが指示する関係によって現在ピクチャを復元する現在ピクチャデコーディング部と、を含む。
本発明によると、ビットストリームのうち高い階層ピクチャの画質を主目的とし、適応的にビット率を調節できる効果がある。
その他実施形態の具体的な事項は詳細な説明および図に含まれている。
本発明の利点および特徴、並びにそれらを達成する方法は、添付する図面と共に後述する実施形態を参照することにより明確になる。しかし、本発明は、以下で開示される実施形態に限定されるものではなく、互いに異なる多様な形態で具現されるものである。本実施形態は、単に本発明の開示が完全なようにし、本発明が属する技術分野で通常の知識を有する者に対して発明の範疇を完全に知らせるために提供されるものであり、本発明は、請求項の範囲によってのみ定義される。なお、明細書全体にかけて、同一の参照符号は同一の構成要素を指称する。
図7は、従来のSVCシステムの構成を示す図であり、図8は、本発明の一実施形態によるSVCシステムが構成を示す図である。
図7を参照すると、ビデオエンコーダ61は多階層基盤のスケーラブルビットストリーム、例えばCIFビットストリームを生成する。そうすると、ビットストリーム抽出器62は生成されたCIFビットストリームをビデオデコーダ1(63)にそのまま伝送することもでき、このうち一部の高い階層を切り取って低い解像度を有するQCIFビットストリームを抽出し、これをビデオデコーダ2(64)に伝送することもできる。この時、この2つの場合、一部の品質階層を切り取って解像度は同一とするが、SNRのみを変更することもできる。
これに対し、図8を参照すると、ビデオエンコーダ50で生成されるCIFビットストリームは品質レベル割当て器140によって品質レベル(優先権)が割当てられる。すなわち、CIFビットストリームを構成するNAL(Network Abstraction Layer)ユニット別に優先権IDを割当てることである。この時、優先権ID割当てにおいては本発明で提案する複数階層を考慮した優先権ID割当て方式に従う。
ビットストリーム抽出器200は、ビデオデコーダ2(300b)にビットストリームを伝送する場合には、上位階層を切り取って下位階層であるQCIFに最適化されたビットストリームを伝送する。この時、仮にSNR調節が必要とされ、品質階層を切り取る場合、その方式は従来と同じである。
しかし、ビットストリーム抽出器200は、ビデオデコーダ1(300a)にビットストリームを伝送する場合には、すべての階層をそのまま含むCIFビットストリームを伝送する。この時、仮にSNR調節が必要とされ、品質階層を切り取る場合、品質レベル割当て器140で割当てられた優先権IDに応じて低い優先権IDを有する品質階層から切り取る。
図9は、本発明の一実施形態による品質階層を切り取る例を示す図である。これによると、品質レベル割当て器140は、次のような順序にしたがって優先権IDを割当てして、ビットストリーム抽出器200は、前記優先権IDが低い品質階層から切り取ることによってSNRスケーラビリティを実現する。
品質レベル割当て器140は、入力されたビットストリームでの参照関係を先に把握する。このような参照関係は、予測のために用いられ、予測技法ではインター予測、イントラベース予測などがある。この時、予測技法において参照するピクチャを現在ピクチャ30といい、参照されるピクチャを参照ピクチャ35という。図9では現在ピクチャ30の品質階層の数と参照ピクチャ35の品質階層の数が同じである例を説明するが、現在ピクチャ30と参照ピクチャ35との間に品質階層の数は互いに異なりうるのはもちろんである。
具体的に優先権IDを割当てる過程は次の通りである。現在ピクチャ30の最上位品質階層34を除去した第1候補と、参照ピクチャ35の最上位品質階層39を除去した第2候補を比較して画質の側面で有利なものを選択する。前記第1候補は現在ピクチャ30の3つの品質階層31,32,33と参照ピクチャ35の4つの品質階層36,37,38,39から現在ピクチャが属する階層のイメージを復元する場合であり、前記第2候補は現在ピクチャ30の4つの品質階層31,32,33,34と参照ピクチャ35の3つの品質階層36,37,38から現在ピクチャが属する階層のイメージを復元する場合を意味する。
ピクチャを復元する具体的過程は、参照ピクチャ35を形成する品質階層から参照ピクチャ35を先に復元した後、現在ピクチャ30を形成する品質階層から現在ピクチャ30の残差信号を復元した後、前記復元された参照ピクチャ35と前記復元された残差信号を加算する過程で行われる。
このようにして第1候補と第2候補を求めてから、この2つの候補の費用(cost)を比較する。費用を求める方法では通常レート歪み関数(Rate−Distortion function)が多く用いられる。次の式(1)はレート歪み関数によって費用を求める過程を示す。
C = E +λ×B (1)
ここで、Cは費用を、Eはオリジナル信号からわい曲された程度(例えば、MSE(Mean Square Error)で計算されうる)、Bは該当データの圧縮時、必要とするビット量を、λはラグランジュ乗数(Lagrangian multiplier)をそれぞれ示す。前記ラグランジュ乗数は、前記Eと前記Bの反映比率を調節できる係数である。したがって、前記費用Cはオリジナル信号との差異Eおよび必要とするビット量Bが小さくなるほど減るため、費用Cが低いということはより効率的な符号化が行われたことを示すものである。
このように、第1候補と第2候補のうち費用Cが低い場合を選択すれば、それに応じて優先権IDが割当てられる。例えば、第1候補が選択されたとすれば、現在ピクチャ30の品質階層34は除去されてもビデオ全体品質に最も小さい影響をおよぼすことを意味するため、品質階層34には最も低い優先権IDである0が設定される。
その次には、現在ピクチャ30のうち残り品質階層31,32,33および参照ピクチャ35のうち残り品質階層36,37,38,39に対して優先権IDを設定しなければならない。しかし、その次に過程は前記第1候補および第2候補を比較する過程と同様に行われる。すなわち、現在ピクチャ30の残余品質階層のうち最上位品質階層33を除去した第1候補と、参照ピクチャ35の最上位品質階層39を除去した第2候補を比較して費用Cが低いものを選択するのである。
このように、現在ピクチャ30で優先権IDが割当てられない残余品質階層のうち最上位品質階層を除去した候補と、参照ピクチャ35で優先権IDが割当てられない残余品質階層のうち最上位品質階層を除去した候補のうち1つを選択する過程を繰り返せば、現在ピクチャ30および参照ピクチャ35のすべての品質階層に対して優先権IDを割当てすることができる。
品質レベル割当て器140は、それぞれの品質階層に該当するNALユニットのヘッダー(NALヘッダー)に前記優先権IDを記録する。
図10は、本発明による一実施形態による優先権IDが割当てられたビットストリーム80を示す図である。現在ピクチャに関する品質階層が複数のNALユニット81,82,83,84に記録され、参照ピクチャに関する品質階層が複数のNALユニット86,87,88,89に記録されている。1つのNALユニットはNALヘッダーとNALデータフィールドで構成される。このうちNALヘッダーは、NALデータに対する付加情報を表示する部分であって優先権IDを含み、NALデータフィールドには、各品質階層に相応する符号化されたデータが記録される。
図10でNALヘッダーには品質レベル割当て器140によって設定された優先権IDが表示されている。ビットストリーム抽出器は、前記優先権IDを参照してビットストリームのSNRを調節する。ビットストリーム抽出器200は、低い優先権IDから高い優先権IDの順で(81,82,86,83,87,84,88,89順) NALユニットを切り取ることによってNALユニットの除去による画質の減少を最小化する。
もちろん、これは上位階層のビデオ品質に最適化されたもの(図8のビデオデコーダ1(300a)に伝送する場合)であるため、下位階層のビデオ品質に最適化(図8のビデオデコーダ2(300b)に伝送する場合)のためには、このような優先権IDと関係がなく従来のように、上位階層の最上位品質階層から順次に切り取る技法を用いることができる。
しかし、本発明で提案するように、現在階層(現在ピクチャが属する階層)の品質階層より基礎階層(参照ピクチャが属する階層)の品質階層が先に切り取られることもある。このようになると、現在階層のいずれかの品質階層の依存ID(dependency ID)が示す基礎階層の品質階層が存在しないこともある。前記依存IDはあるデータをデコーディングするため、先にデコーディングされて参照されなければならないデータ間の依存関係を示す。したがって、ビデオデコーディング過程において、依存IDによって参照される基礎階層の品質階層が存在しないならば、前記依存IDは残余品質階層のうち最上位品質階層を参照するものと見なす方法を用いることができる。
図11を参照すると、現在ピクチャ30が品質階層のうち最上位品質階層34と参照ピクチャ35の品質階層のうち最上位品質階層39がビットストリーム抽出器200によって切り取られたものである。しかし、本発明によると、上位階層の品質階層がすべて切り取られる前に下位階層の品質階層が先に切り取られることもあるため、現在階層の品質階層33の依存IDはなくなった品質階層39を指示することもある。この場合には、ビデオデコーダ端で品質階層33の依存IDが残余品質階層36,37,38のうち最上位品質階層38を指示するように修正しなければならない。
図12〜図14は本発明の一実施形態による装置構成ブロック図である。このうち図12は、本発明の一実施形態による優先権の割当て装置100の構成を示すブロック図である。優先権の割当て装置100はビットストリームのビット率を調節するために品質レベル別に優先権を割当てる装置である。
優先権の割当て装置100は、現在ピクチャエンコーディング部110と参照ピクチャエンコーディング部120、品質レベル割当て器140、およびエントロピ符号化部150を含み構成することができる。
参照ピクチャエンコーディング部120は、参照ピクチャに関する品質階層(第1品質階層という)を構成する。これのために、参照ピクチャエンコーディング部120は、予測部121、変換部122、量子化部123、および品質階層生成部124を含み構成することができる。
予測部121は、現在マクロブロックで所定の予測方法によって予測されたイメージを差分することによって残差信号を求める。前記予測方法では図2で示す通り、インター予測、イントラベース予測などがある。インター予測は、現在ピクチャと同一な解像度および他の時間的位置を有するピクチャと現在ピクチャとの間の相対的な動きを表現するためのモーションベクターを求めるモーションの推定過程を含む。
一方、現在ピクチャは、現在ピクチャと同一な時間的位置に存在し、現在ピクチャと解像度が相異なる下位階層(基礎階層)のピクチャを参照して予測されることもできる。これをイントラベース(inta base)予測という。もちろん、イントラベース予測では前記モーションの推定過程は必要ではない。
変換部122は、前記求めた残差信号をDCT、ウェーブレット変換など空間的変換技法を用いて変換し、変換係数を生成する。このような空間的変換方法ではDCT(Discrete Cosine Transform)、ウェーブレット変換(wavelet transform)などが用いられる。空間的変換結果、変換係数が求められるが、空間的変換方法としてDCTを用いる場合はDCT係数が、ウェーブレット変換を用いる場合はウェーブレット係数が求められる。
量子化部123は、変換部122で求めた変換係数を量子化し、量子化係数を生成する。量子化(quantization)とは、任意の実数値で表現する前記変換係数を一定の区間に分けて離散値(discrete value)で示す作業を意味する。このような量子化方法では、スカラー量子化、ベクター量子化などの方法があるが、このうち、簡単なスカラー量子化方法は変換係数を量子化パラメータで分けた後、小数点以下を四捨五入して整数とする過程である。
品質階層生成部124は、図4で説明したような過程によって複数の品質階層を生成する。前記複数の品質階層は1つの離散階層と少なくとも1つ以上のFGS階層で構成されうる。
一方、現在ピクチャエンコーディング部110も参照ピクチャエンコーディング部120のように予測部111、変換部112、量子化部113および品質階層生成部114を含み構成され、それぞれの構成要素の動作は参照ピクチャエンコーディング120でと同様である。ただし、予測部111で現在ピクチャの予測のために用いられるピクチャは前記参照ピクチャエンコーディング部120に入力される参照ピクチャを用いる。予測部111は、前記入力された参照ピクチャを用いてインター予測またはイントラベース予測を実行して残差信号を生成する。
結局、現在ピクチャエンコーディング部110は、現在ピクチャに関する(より正確には現在ピクチャの残差信号に関する)品質階層(第2品質階層という)を構成する。前記入力される参照ピクチャは現在ピクチャと解像度が相異なるか(イントラベース予測の場合)、時間的レベルが相異なることもある(インター予測の場合)。
品質レベル割当て器140は、前記第1品質階層および前記第2品質階層各々に優先権IDを割当てる。前記優先権の割当ては、前記現在ピクチャの画質減少に及ぼす影響が小さい品質階層に低い優先権が割当てられ、影響が大きい品質階層に高い優先権が割当てられる方式で行われる(図9参照)。
前記画質の減少を判断する基準としては、式(1)のような費用関数を用いることができる。前記費用関数は、オリジナルイメージとの差異と、符号化に必要とされるビット量の加重合で表現することができる。
エントロピ符号化部150は、品質レベル割当て器140で決定された優先権ID、参照ピクチャに関する第1品質階層、および現在ピクチャに関する第2品質階層をエントロピ符号化してビットストリームを生成する。エントロピ符号化は、データの統計的特性を用いた無損失符号化技法であって算術符号化、可変長符号化などを含む。
図13は、本発明の一実施形態によるビットストリームのビット率を調節する装置、すなわちビットストリーム抽出器200の構成を図示するブロック図である。
ビットストリーム抽出器200は、ビットストリーム入力部210、ビットストリームパーサー220、ビットストリーム切断部230、目標ビット率設定部240およびビットストリーム伝送部250を含み構成されうる。
ビットストリーム入力部210は、ビデオビットストリームの入力を受け、ビットストリーム伝送部250は、ビット率が変更されたビデオビットストリームを伝送する。ビットストリーム入力部210は、ネットワークインターフェースのうち受信部に該当し、ビットストリーム伝送部250は、ネットワークインターフェースのうち送信部に該当する。
目標ビット率設定部240は、前記ビデオビットストリームに関する目標ビット率を設定する。このような目標ビット率は、現在伝送されるビットストリームのビット率、ネットワーク状況、または受信端(ビデオデコーダ)の機器の性能などを総合的に考慮して決定することができる。
ビットストリームパーサー220は、前記ビデオビットストリームのうち参照ピクチャに関する第1品質階層と前記現在ピクチャに関する第2品質階層の優先権IDを読み込む。このような優先権IDは品質レベル割当て器140によって割当てられたものである。
ビットストリーム切断部230は、前記目標ビット率によって第1品質階層および前記第2品質階層のうち前記優先権が低い品質階層から切り取る(truncation)。このように切り取る過程は目標ビット率に達する時まで繰り返して実行される。
図14は、本発明の一実施形態によるビデオデコーダ300の構成を図示するブロック図である。
ビデオデコーダ300は、エントロピ復号化部310、ビットストリームパーサー320、現在ピクチャデコーディング部330、参照ピクチャデコーディング部340、および依存ID設定部350を含む。
エントロピ復号化部310は、ビデオビットストリームの入力を受け、これを無損失復号化する。前記無損失復号化は、図12のエントロピ符号化部150の無損失符号化の逆に実行される。
ビットストリームパーサー320は、前記ビデオビットストリームから参照ピクチャの符号化データ(第1品質階層)、現在ピクチャの符号化データ(第2品質階層)、参照ピクチャに関する第1品質階層の依存IDおよび前記現在ピクチャに関する第2品質階層の依存IDを読み込む。前記依存ID(dependency ID)は、現在ピクチャのいずれかの品質階層を復元するためには参照ピクチャのいずれかの品質階層を必要されるのかに関する情報、すなわち、依存関係を示す。
しかし、図11でも説明した通り、本発明によると、上位階層の品質階層がすべて切り取られる前に下位階層の品質階層が先に切り取られることもあるため、現在階層のいずれかの品質階層は依存IDがなくなった品質階層を指示することもある。
依存ID設定部350は、この場合には前記依存IDが残余品質階層のうち最上位品質階層を指示するように設定する。
参照ピクチャデコーディング部340は、前記参照ピクチャの符号化データをデコーディングする。これのために参照ピクチャデコーディング部340は、逆量子化部341、逆変換部342、および逆予測部343を含み構成されうる。
逆量子化部341は、前記参照ピクチャの符号化データを逆量子化する。
逆変換部342は、前記逆量子化結果に対して逆変換を実行する。このような逆変換は図12の変換部122で実行される変換過程の逆に実行される。
逆予測部343は、逆変換部342から提供される復元された残差信号を予測信号と加算して参照ピクチャを復元する。この時、前記予測信号はビデオエンコーダ端でと同様にインター予測またはイントラベース予測によって求められる。
現在ピクチャデコーディング部330は、前記現在ピクチャの符号化データを前記依存IDにしたがってデコーディングする。これのために現在ピクチャデコーディング部330は逆量子化部331、逆変換部332および逆予測部333を含み構成されうる。現在ピクチャデコーディング部330の各構成要素の動作は参照ピクチャデコーディング部340でと同様である。ただし、逆予測部333は、前記復元された参照ピクチャを予測信号とし、逆変換部332から提供される現在ピクチャの復元された残差信号から現在ピクチャを復元する(残差信号と予測信号を加算する)。この時、ビットストリームパーサー320によって判読された依存IDまたは修正された依存IDが使用される。前記依存IDは現在ピクチャの品質階層(第2品質階層)を復元するために必要な参照ピクチャに関する品質階層(第1品質階層)を指示している。
以上、本発明において用いられたピクチャは1つのフレームを意味するものである。しかし、本明細書においてピクチャはH.264以後に導入された概念がスライスに代替されてもよいことを当業者ならば充分に理解できるものである。
現在まで図12〜図14の各構成要素はメモリ上の所定領域で実行されるタスク、クラス、サブルーチン、プロセス、オブジェクト、実行スレッド(execution thread)、プログラムのようなソフトウェア(software)や、FPGA(field−programmable gate array)やASIC(application−specific integrated circuit)のようなハードウェア(hardware)で具現されることができ、また前記ソフトウェアおよびハードウェアの組合せで構成されることもできる。前記構成要素はコンピュータで判読可能な保存媒体に含まれることもでき、複数のコンピュータにその一部が分散して分布することもできる。
以上、添付された図面を参照し、本発明の実施形態について説明したが、本発明が属する技術分野における通常の知識を有する者は、本発明を、その技術的思想や必須の特徴を変更しない範囲で、他の具体的な形態において実施されうることを理解することができる。したがって、上記実施形態はすべての面で例示的なものであり、限定的でないものと理解しなければならない。
多階層構造を用いたスケーラブルビデオコーディング方式の一例を示す図である。 スケーラブルビデオコーディングのインター予測およびイントラベース予測技法の概念を示す図である。 図2の予測によって残差ピクチャにFGS技法を適用した例を示す図である。 1つのピクチャまたはスライスを1つの離散階層と2つのFGS階層で表現する過程を示す図である。 現在のSVC標準で用いられる品質階層を切り取る方式を示す図である。 現在のSVC標準で用いられる品質階層を切り取る方式を示す図である。 従来のSVCシステムの構成を示す図である。 本発明の一実施形態によるSVCシステムの構成を示す図である。 本発明の一実施形態による品質階層を切り取る例を示す図である。 本発明による一実施形態による優先権IDが割当てられたビットストリームを示す図である。 依存IDが指示する品質階層が参照ピクチャに存在しない場合を示す図である。 本発明の一実施形態による優先権の割当て装置の構成を示すブロック図である。 本発明の一実施形態によるビットストリーム抽出器の構成を示すブロック図である。 本発明の一実施形態によるビデオデコーダの構成を示すブロック図である。
符号の説明
100 優先権の割当て装置
110 現在ピクチャエンコーディング部
111,121 予測部
112,122 変換部
113,123 量子化部
114,124 品質階層生成部
120 参照ピクチャエンコーディング部
140 品質レベル割当て器
150 エントロピ符号化部
200 ビットストリーム抽出器
210 ビットストリーム入力部
220,320 ビットストリームパーサー
230 ビットストリーム切断部
240 目標ビット率設定部
250 ビットストリーム伝送部
300 ビデオデコーダ
310 エントロピ復号化部
330 現在ピクチャデコーディング部
331,341 逆量子化部
332,342 逆変換部
333,343 逆予測部
340 参照ピクチャデコーディング部
350 依存ID設定部

Claims (19)

  1. 参照ピクチャに関する第1品質階層を構成する段階と、
    前記参照ピクチャを参照して符号化される現在ピクチャに関する第2品質階層を構成する段階、および
    前記第1品質階層および前記第2品質階層の各々に優先権を割当てる段階と、を含み、
    除去されても前記現在ピクチャの画質減少に及ぼす影響が小さい品質階層に低い優先権が割当てられる、ビットストリームのビット率調節のための優先権の割当て方法。
  2. 前記参照ピクチャおよび現在ピクチャは、
    フレームまたはスライスである、請求項1に記載のビットストリームのビット率調節のための優先権の割当て方法。
  3. 前記参照ピクチャと現在ピクチャは互いに解像度が相異なるか、時間的レベルが相異なる、請求項1に記載のビットストリームのビット率調節のための優先権の割当て方法。
  4. 前記第1品質階層と前記第2品質階層は、
    1つの離散階層と少なくとも1つ以上のFGS階層で構成される、請求項1に記載のビットストリームのビット率調節のための優先権の割当て方法。
  5. 前記第1品質階層を構成する段階および前記第2品質階層を構成する段階は、
    前記参照ピクチャまたは前記現在ピクチャを予測して残差信号を求める段階と、
    前記残差信号を変換して変換係数を生成する段階と、
    前記変換係数を第1量子化パラメータによって量子化して離散階層を構成する段階と、
    前記残差信号で前記離散階層を逆量子化した結果を減算する段階、および
    前記減算された結果を第2量子化パラメータによって量子化して前記1つ以上のFGS階層を構成する段階と、を含む、請求項4に記載のビットストリームのビット率調節のための優先権の割当て方法。
  6. 前記画質減少に及ぼす影響が小さい品質階層は、
    符号化に必要とされる費用が異なる品質階層に比べて小さい品質階層である、請求項1に記載のビットストリームのビット率調節のための優先権の割当て方法。
  7. 前記費用は、
    オリジナルイメージとの差異と、符号化に必要とされるビット量の加重合で構成される、請求項6に記載のビットストリームのビット率調節のための優先権の割当て方法。
  8. ビデオビットストリームの入力を受ける段階と、
    前記ビデオビットストリームに関する目標ビット率を設定する段階と、
    前記ビデオビットストリームのうち現在ピクチャの参照ピクチャに関する第1品質階層と、前記現在ピクチャに関する第2品質階層を読み込む段階、および
    前記目標ビット率によって前記第1品質階層および前記第2品質階層のうち前記優先権が低い品質階層から切り取る段階と、を含む、ビットストリームのビット率を調節する方法。
  9. 前記参照ピクチャおよび現在ピクチャは、
    フレームまたはスライスである、請求項8に記載のビットストリームのビット率を調節する方法。
  10. 前記参照ピクチャと現在ピクチャは互いに解像度が相異なるか、時間的レベルが相異なる、請求項8に記載のビットストリームのビット率を調節する方法。
  11. 前記第1品質階層と前記第2品質階層は、
    1つの離散階層と少なくとも1つ以上のFGS階層で構成される、請求項8に記載のビットストリームのビット率を調節する方法。
  12. ビデオビットストリームの入力を受ける段階と、
    前記ビデオビットストリームのうち現在ピクチャの参照ピクチャに関する第1品質階層と前記現在ピクチャに関する第2品質階層と前記の依存IDを読み込む段階と、
    前記第1品質階層のうち前記依存IDが指示する品質階層が存在しない場合、前記依存IDは前記第1品質階層のうち最上位品質階層を指示するように設定する段階、および
    前記依存IDが指示する関係によって現在ピクチャを復元する段階と、を含む、ビデオデコーディング方法。
  13. 前記参照ピクチャおよび現在ピクチャは、
    フレームまたはスライスである、請求項12に記載のビデオデコーディング方法。
  14. 前記参照ピクチャと現在ピクチャは、
    互いに解像度が相異なるか、時間的レベルが相異なる、請求項12に記載のビデオデコーディング方法。
  15. 前記第1品質階層と前記第2品質階層は、
    1つの離散階層と少なくとも1つ以上のFGS階層で構成される、請求項12に記載のビデオデコーディング方法。
  16. 前記現在ピクチャを復元する段階は、
    前記依存IDが指示によって前記参照ピクチャを復元する段階と、
    前記現在ピクチャの残差信号を復元する段階、および
    前記復元された参照ピクチャと前記復元された残差信号を加算する段階と、を含む、請求項12に記載のビデオデコーディング方法。
  17. 参照ピクチャに関する第1品質階層を構成する参照ピクチャエンコーディング部と、
    前記参照ピクチャを参照して符号化される現在ピクチャに関する第2品質階層を構成する現在ピクチャエンコーディング部、および
    前記第1品質階層および前記第2品質階層各々に優先権を割当てる品質レベル割当て器と、を含み、
    除去されても前記現在ピクチャの画質減少に及ぼす影響が小さい品質階層に低い優先権が割当てられる、ビットストリームのビット率調節のための優先権の割当て装置。
  18. ビデオビットストリームの入力を受けるビットストリーム入力部と、
    前記ビデオビットストリームに関する目標ビット率を設定する目標ビット率設定部と、
    前記ビデオビットストリームのうち現在ピクチャの参照ピクチャに関する第1品質階層と、前記現在ピクチャに関する第2品質階層を読み込むビットストリームパーサー、および
    前記目標ビット率によって前記第1品質階層および前記第2品質階層のうち前記優先権が低い品質階層から切り取るビットストリーム切断部と、を含む、ビットストリームのビット率を調節する装置。
  19. ビデオビットストリームの入力を受けるエントロピ復号化部と、
    前記ビデオビットストリームのうち、現在ピクチャの参照ピクチャに関する第1品質階層と、前記現在ピクチャの第2品質階層と、前記第2品質階層の依存IDと、を読み込むビットストリームパーサーと、
    前記第1品質階層のうち前記依存IDが指示する品質階層が存在しない場合、前記依存IDは前記第1品質階層のうち最上位品質階層を指示するように設定する依存ID設定部、および
    前記依存IDが指示する関係によって現在ピクチャを復元する現在ピクチャデコーディング部と、を含む、ビデオデコーダ。
JP2009502666A 2006-03-27 2007-03-27 ビットストリームのビット率の調節のための優先権の割当て方法、ビットストリームのビット率の調節方法、ビデオデコーディング方法およびその方法を用いた装置 Expired - Fee Related JP5063678B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US78602306P 2006-03-27 2006-03-27
US60/786,023 2006-03-27
KR10-2006-0048979 2006-05-30
KR1020060048979A KR100772878B1 (ko) 2006-03-27 2006-05-30 비트스트림의 비트율 조절을 위한 우선권 할당 방법,비트스트림의 비트율 조절 방법, 비디오 디코딩 방법 및 그방법을 이용한 장치
PCT/KR2007/001473 WO2007111460A1 (en) 2006-03-27 2007-03-27 Method of assigning priority for controlling bit rate of bitstream, method of controlling bit rate of bitstream, video decoding method, and apparatus using the same

Publications (2)

Publication Number Publication Date
JP2009531941A true JP2009531941A (ja) 2009-09-03
JP5063678B2 JP5063678B2 (ja) 2012-10-31

Family

ID=40941336

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009502666A Expired - Fee Related JP5063678B2 (ja) 2006-03-27 2007-03-27 ビットストリームのビット率の調節のための優先権の割当て方法、ビットストリームのビット率の調節方法、ビデオデコーディング方法およびその方法を用いた装置

Country Status (3)

Country Link
JP (1) JP5063678B2 (ja)
CN (1) CN101411194B (ja)
MX (1) MX2008012360A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101432777B1 (ko) 2009-09-03 2014-08-22 에스케이텔레콤 주식회사 참조 이미지 기반 2차 예측을 통한 동영상 부호화 방법, 장치 및 기록 매체

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104902275B (zh) * 2015-05-29 2018-04-20 宁波菊风系统软件有限公司 一种控制视频通信质量甜点的方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2547891C (en) * 2003-12-01 2014-08-12 Samsung Electronics Co., Ltd. Method and apparatus for scalable video encoding and decoding

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101432777B1 (ko) 2009-09-03 2014-08-22 에스케이텔레콤 주식회사 참조 이미지 기반 2차 예측을 통한 동영상 부호화 방법, 장치 및 기록 매체

Also Published As

Publication number Publication date
CN101411194A (zh) 2009-04-15
JP5063678B2 (ja) 2012-10-31
MX2008012360A (es) 2008-10-09
CN101411194B (zh) 2011-06-29

Similar Documents

Publication Publication Date Title
KR100772878B1 (ko) 비트스트림의 비트율 조절을 위한 우선권 할당 방법,비트스트림의 비트율 조절 방법, 비디오 디코딩 방법 및 그방법을 이용한 장치
JP4891234B2 (ja) グリッド動き推定/補償を用いたスケーラブルビデオ符号化
KR100654436B1 (ko) 비디오 코딩 방법과 디코딩 방법, 및 비디오 인코더와디코더
JP4763548B2 (ja) スケーラブルビデオコーディング及びデコーディング方法と装置
KR100703724B1 (ko) 다 계층 기반으로 코딩된 스케일러블 비트스트림의비트율을 조절하는 장치 및 방법
KR100746007B1 (ko) 엔트로피 코딩의 컨텍스트 모델을 적응적으로 선택하는방법 및 비디오 디코더
KR100714696B1 (ko) 다계층 기반의 가중 예측을 이용한 비디오 코딩 방법 및장치
JP5014989B2 (ja) 基礎階層を利用するフレーム圧縮方法、ビデオコーディング方法、フレーム復元方法、ビデオデコーディング方法、ビデオエンコーダ、ビデオデコーダ、および記録媒体
KR100621581B1 (ko) 기초 계층을 포함하는 비트스트림을 프리디코딩,디코딩하는 방법, 및 장치
JP4922391B2 (ja) 多階層基盤のビデオエンコーディング方法および装置
KR100596706B1 (ko) 스케일러블 비디오 코딩 및 디코딩 방법, 이를 위한 장치
US8085847B2 (en) Method for compressing/decompressing motion vectors of unsynchronized picture and apparatus using the same
JP2006304307A5 (ja)
US20060280372A1 (en) Multilayer-based video encoding method, decoding method, video encoder, and video decoder using smoothing prediction
JP2009532979A (ja) 加重平均合を用いてfgs階層をエンコーディングおよびデコーディングする方法および装置
JP2006304307A (ja) エントロピーコーディングのコンテキストモデルを適応的に選択する方法及びビデオデコーダ
KR20060135992A (ko) 다계층 기반의 가중 예측을 이용한 비디오 코딩 방법 및장치
JP2008523687A (ja) ファイングラニュラースケーラビリティのためのデジタルビデオのリアルタイムトランスコーディングのシステム及び方法
US20060013311A1 (en) Video decoding method using smoothing filter and video decoder therefor
US9264736B2 (en) Encoding method, decoding method, encoding device, and decoding device
JP2009531942A (ja) エントロピ符号化効率を向上させる方法およびその方法を用いたビデオエンコーダおよびビデオデコーダ
JP5063678B2 (ja) ビットストリームのビット率の調節のための優先権の割当て方法、ビットストリームのビット率の調節方法、ビデオデコーディング方法およびその方法を用いた装置
WO2006132509A1 (en) Multilayer-based video encoding method, decoding method, video encoder, and video decoder using smoothing prediction
WO2006104357A1 (en) Method for compressing/decompressing motion vectors of unsynchronized picture and apparatus using the same

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110524

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110824

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120215

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120710

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120807

R150 Certificate of patent or registration of utility model

Ref document number: 5063678

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150817

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees