JP2011147120A - スケーラブル映像を優先度に応じて伝送する方法及びその装置 - Google Patents

スケーラブル映像を優先度に応じて伝送する方法及びその装置 Download PDF

Info

Publication number
JP2011147120A
JP2011147120A JP2010275055A JP2010275055A JP2011147120A JP 2011147120 A JP2011147120 A JP 2011147120A JP 2010275055 A JP2010275055 A JP 2010275055A JP 2010275055 A JP2010275055 A JP 2010275055A JP 2011147120 A JP2011147120 A JP 2011147120A
Authority
JP
Japan
Prior art keywords
stage
state node
state
reordering
destination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010275055A
Other languages
English (en)
Other versions
JP5706144B2 (ja
Inventor
Song Xiao
肖嵩
Ji Lu
盧冀
Ning Cai
蔡寧
Xiaoli Wang
王暁利
Yongsheng Zhang
張永生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Publication of JP2011147120A publication Critical patent/JP2011147120A/ja
Application granted granted Critical
Publication of JP5706144B2 publication Critical patent/JP5706144B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

【課題】スケーラブル映像を優先度に応じて伝送し、スケーラブル映像のビットストリームの最適化選択および伝送の課題を解決するとともに、ビットストリームから再構築された画像の品質を最終的に向上させる。
【解決手段】スケーラブル映像の各GOPのSVC符号化後の階層化ビットストリームに対して、優先度並べ替えを行い、並べ替え後のSVC階層化ビットストリームに対して、パッケージおよびRaptor符号化を行って、伝送チャネルを介して、符号化後のスケーラブル映像のビットストリームを、スケーラブル映像の受信側に送信する方法及び装置を提供する。
【選択図】図1

Description

本発明は、スケーラブル映像符号化(SVC:Scalable Video Coding)技術分野に関し、特に、スケーラブル映像を優先度に応じて伝送する方法およびその装置に関する。
SVCは、スケーラビリティ機能を有する効率よい映像符号化方法である。SVCは、映像シーケンスを、1つの基本層と、異なるスケーラビリティを有する複数の強化層とからなるビットストリームに、符号化することができる。ここで、基本層は、最低の解像度および品質を有する画像シーケンスを復元することができる一方、強化層は、より高い解像度および品質を有する画像シーケンスを復元することができる。SVCで提供される時間領域、空間領域および品質領域という3つのスケーラビリティ方式によれば、端末が、一定の目標ビットレート、フレームレートおよび空間解像度を満足するビットストリームを、受信されたSVCビットストリームから抽出して、異なるビットレート、フレームレートまたは解像度を有する映像の画像を復元できることが保証される。従って、SVCは、ネットワーク映像伝送に適するアルゴリズムであり、ますます広く応用される見込みがある。広帯域ネットワークの発展および人々から映像内容に対する要求の増加につれて、SVCに基づく映像システムにおいて、同一の映像内容に対して、異なる端末は、より速いフレームレートあるいはより高い解像度あるいはより良い品質を必要とする可能性がある。SVCのスケーラビリティによって、ソースに対して符号化を1回のみ行うだけで、異なる端末の要求を満足できる、ということが決定される。
一定のパケットロス率を有しまたは輻輳しているネットワークにおいて、異なる端末は、一定の時間内で、全てのビットストリームを受信できない可能性がある。但し、より低い解像度、フレームレートまたは品質を有する映像が、より下位層のビットストリームから再構築して得られるため、SVCにより、端末は、一部のビットストリームを受信した場合、ある程度の歪みを有する映像の画像を復元することができる。この場合、異なる端末ユーザの映像サービス品質を如何に保証するかが、映像伝送の当面する最大の挑戦である。ここで、伝送ビットストリームの順序およびビットストリームのデータパケットのフォーマットが、映像伝送方法における2つのキー課題である。
ネットワークにおいて、SVC階層化(layered)ビットストリームを伝送する場合、ソース情報は、最大の解像度およびビットレートで符号化されている。伝送過程において、帯域幅の変更により発生するパケットロスがない場合、異なるスケーラブル映像の受信側は、自身の受信能力により、異なる解像度のビットストリームを抽出することができる。しかしながら、パケットロスが発生すると、スケーラブル映像の受信側は、その解像度要求を満足する映像の画像の再構築に充分なデータパケットを受信できない可能性がある。この場合、スケーラブル映像の受信側で復元された映像シーケンスの品質は、退化することになる。つまり、スケーラブル映像の受信側で再構築された映像の画像の品質は、ネットワークにおけるチャネルのパケットロス率の影響を受ける。パケットロス率が増大すると、再構築された画像の品質は、明らかに低下する。そのため、チャネルのパケットロス率から再構築された画像の品質に対する影響を減少させるように、SVC階層化ビットストリームを処理する有効な方法が必要になる。
上記の技術的課題を解決するために、本発明では、スケーラブル映像のビットストリームから再構築された映像の画像の品質を向上させるように、スケーラブル映像を優先度に応じて伝送する方法及びその装置が提供されている。
本発明の実施例に係る、スケーラブル映像を優先度に応じて伝送する方法は、スケーラブル映像の各ピクチャグループ(GOP)のスケーラブル映像符号化(SVC)後の階層化ビットストリームに対して、優先度並べ替えを行い、並べ替え後のSVC階層化ビットストリームに対して、パッケージおよびRaptor符号化を行って、伝送チャネルを介して、符号化後のスケーラブル映像のビットストリームを、スケーラブル映像の受信側に送信する、ことを含む。
ここで、SVC階層化ビットストリームに対して、優先度並べ替えを行うことは、並べ替えパス上の全ての可能ノードを、一定の(s,t,q)特性(s、tおよびqはそれぞれ、空間領域、時間領域および品質領域の解像度特性を表す)に対応する各状態ノードとして定義し、s、tおよびqの増加ステップサイズの違いにより、同じ増加ステップサイズを有する状態ノードが同じステージにあるように、全ての状態ノードを異なるステージに区分し、各状態ノードそれぞれのビットレートおよびその対応するピーク信号対雑音比(PSNR)によって、各状態ノードの並べ替え因子を計算し、初期ステージから宛先ステージまでの状態ノードで構成可能な全てのパスの中から、各状態ノードの並べ替え因子の重み付け和が最大となる最適パスを決定し、最適パス上の初期ステージから宛先ステージまでの各状態ノードの順に従って、SVC階層化ビットストリームを出力する、ことを含む。
数式
によって、各ノードの並べ替え因子を計算する。
ここで、gjは第jのステージを表し、ti(gj)は第jのステージにおけるi番目の状態ノードを表し、t(g0)は初期ステージの初期状態ノードを表し、t(gK-1)は宛先ステージの宛先状態ノードを表し、
は状態ノードti(gj)のPSNRを表し、
は状態ノードti(gj)のビットレートを表し、
は初期状態ノードt(g0)のPSNRを表し、
は初期状態ノードt(g0)のビットレートを表し、
は宛先状態ノードt(gK-1)のPSNRを表し、
は宛先状態ノードt(gK-1)のビットレートを表し、Oi(gj)は状態ノードti(gj)の並べ替え因子を表し、Kはステージの総数を表す。
初期ステージから宛先ステージまでの状態ノードで構成可能な全てのパスの中から、最適パスを決定することは、数式
によって、初期ステージから宛先ステージまでの状態ノードで構成可能な全てのパス上の各状態ノードの並べ替え因子の重み付け和を計算し、最大となる並べ替え因子の重み付け和を有するパスを、最適パスとする、ことを含む。ここで、Sxは初期ステージから宛先ステージまでの状態ノードで構成可能な全てのパスのうち、x番目のパス上の各状態ノードの並べ替え因子の重み付け和を表し、O(gj)は該x番目のパスの第jのステージにおける状態ノードの並べ替え因子を表し、ωjは第jのステージの重み付け因子を表す(0<ωj<1、0≦j≦K-1)。
初期ステージから宛先ステージまでの状態ノードで構成可能な全てのパスの中から、最適パスを決定することは、初期ステージの初期状態ノードを開始点として選択して、ノード識別子jを1に設定し、初期ステージの並べ替え因子の重み付け和S0(t)を0に設定し、初期ノードの最適パスの状態ノード集合を初期状態ノードに初期化するステップA0と、数式
および
を採用して、第jのステージにおける各状態ノードの並べ替え因子の重み付け和Sj(ti)を計算し、初期ステージから第jのステージにおける各状態ノードまでの最適パスの状態ノード集合をそれぞれ記録するステップA1と、jがK−1と等しいかどうかを判断し、等しい場合、宛先状態ノードの最適パスの状態ノード集合における各状態ノードからなるパスを、最適パスとし、等しくない場合、「j=j+1」にして、ステップA1に戻るステップA2と、を含む。
ここで、Sj(ti)は第jのステージにおけるi番目の状態ノードtiの並べ替え因子の重み付け和を表し、Sj-1(tk)は第j−1のステージにおける状態ノードtiに繋がるk番目の状態ノードtkの並べ替え因子の重み付け和を表し、ωjは第jのステージの重み付け因子を表し、Oi(gj)は第jのステージにおけるi番目の状態ノードtiの並べ替え因子を表し、Mj(ti)は第jのステージにおけるi番目の状態ノードtiの最適パスの状態ノード集合を表し、Mj-1(tk)は第j−1のステージにおける状態ノードtiに繋がる各状態ノードのうち、並べ替え因子の重み付け和の最大値に対応する状態ノードの最適パスの状態ノード集合を表す。
初期ステージから宛先ステージまでの状態ノードで構成可能な全てのパスの中から、最適パスを決定することは、宛先ステージの宛先状態ノードを開始点として選択し、ノード識別子jをK−2に設定し、宛先ステージの並べ替え因子の重み付け和TK-1(t)を0に設定し、宛先ノードの最適パスの状態ノード集合を宛先状態ノードに初期化するステップa0と、数式
および
を採用して、第jのステージにおける各状態ノードから宛先ステージまでの並べ替え因子の重み付け和Tj(ti)を計算し、第jのステージにおける各状態ノードから宛先ステージまでの最適パスの状態ノード集合をそれぞれ記録するステップa1と、jが0と等しいかどうかを判断し、等しい場合、初期状態ノードから宛先ステージまでの最適パスの状態ノード集合における各状態ノードからなるパスを、最適パスとし、等しくない場合、「j=j―1」にして、ステップa1に戻るステップa2と、を含む。
ここで、Tj(ti)は第jのステージにおけるi番目の状態ノードtiから宛先ステージまでの並べ替え因子の重み付け和を表し、Tj+1(tk)は第j+1のステージにおける状態ノードtiに繋がるk番目の状態ノードtkの並べ替え因子の重み付け和を表し、ωjは第jのステージの重み付け因子を表し、Oi(gj)は第jのステージにおけるi番目の状態ノードtiの並べ替え因子を表し、Mj(ti)は第jのステージにおけるi番目の状態ノードtiから宛先ステージまでの最適パスの状態ノード集合を表し、Mj+1(tk)は第j+1のステージにおける状態ノードtiに繋がる各状態ノードから宛先ステージまでの並べ替え因子の重み付け和の最大値に対応する状態ノードから宛先ステージまでの最適パスの状態ノード集合を表す。
上記第jのステージの重み付け因子ωjはωj+1(0<ω<1、0≦j≦K-1)である。
最適パスが1つより多い場合、本発明の実施例に係る方法は、各ステージの重み付け因子の値を増加して、初期ステージから宛先ステージまでの状態ノードで構成可能な全てのパスの中から、最適パスを再決定する、ことをさらに含む。
上記Raptor符号化は、並べ替えおよびパッケージ後の各層のソース行列ブロックのそれぞれに対して、RS符号化およびインターリーブを行って、m個のデータパケットを得、LT符号化の次数を決定し、決定されたLT符号化の次数に従って、m個のデータパケットに対して、LT符号化を行って、n個のデータパケットを得る、ことを含む。
上記LT符号化の次数を決定することは、
の範囲内で次数dの値を選択する、ことを含む。ここで、θは次数分布関数のパラメータであり、次数分布関数がRobust−Soliton関数である場合、
である(定数c>0、δは許容可能な復号失敗率)。
あるいは、上記LT符号化の次数を決定することは、mの値の範囲と次数dの値の最適範囲との対応関係を確立し、mの値により、次数dの値の最適範囲を決定し、次数dの値の最適範囲内で、1つの整数をランダムに選択して、LT符号化の次数dとする、ことを含む。
また、本発明の実施例では、スケーラブル映像を優先度に応じて伝送する装置が開示されている。該装置は、スケーラブル映像の各ピクチャグループ(GOP)に対して、スケーラブル映像符号化(SVC)を行うSVC符号化手段と、SVC符号化後のSVC階層化ビットストリームに対して、優先度並べ替えを行う優先度並べ替え手段と、並べ替え後のSVC階層化ビットストリームに対して、パッケージを行うパッケージ手段と、パッケージ後のSVC階層化ビットストリームに対して、Raptor符号化を行って、伝送チャネルを介して、スケーラブル映像の受信側に送信するRaptor符号化手段と、を含む。
ここで、優先度並べ替え手段は、並べ替えパス上の全ての可能ノードを、一定の(s,t,q)特性(s、tおよびqはそれぞれ、空間領域、時間領域および品質領域の解像度特性を表す)に対応する各状態ノードとして定義し、s、tおよびqの増加ステップサイズの違いにより、同じ増加ステップサイズを有する状態ノードが同じステージにあるように、全ての状態ノードを異なるステージに区分するステージ区分モジュールと、各状態ノードそれぞれのビットレートおよびその対応するピーク信号対雑音比(PSNR)によって、各状態ノードの並べ替え因子を計算する並べ替え因子決定モジュールと、初期ステージから宛先ステージまでの状態ノードで構成可能な全てのパスの中から、各状態ノードの並べ替え因子の重み付け和が最大となる最適パスを決定する最適パス決定モジュールと、最適パス上の初期ステージから宛先ステージまでの各状態ノードの順に従って、SVC階層化ビットストリームを出力する並べ替え結果出力モジュールと、を含む。
Raptor符号化手段は、パッケージ後の各層のソース行列ブロックに対して、RS符号化を行って、m個のデータパケットを得るRS符号化モジュールと、LT符号化の次数を決定するLT符号化次数決定モジュールと、決定されたLT符号化の次数に従って、前記m個のデータパケットに対して、LT符号化を行って、n個のデータパケットを得るLT符号化モジュールと、を含む。
本発明に係る、スケーラブル映像を優先度に応じて伝送する方法及びその装置は、SVC階層化ビットストリームの階層化特性に従って、まず、SVC階層化ビットストリームに対して、優先度並べ替えを行い、次に、並べ替え後のSVC階層化ビットストリームに対して、パッケージおよびRaptor符号化を行う。これにより、スケーラブル映像のビットストリームの最適化選択および伝送の課題を解決するとともに、スケーラブル映像のビットストリームから再構築された画像の品質を最終的に向上させることができる。
本発明の実施例に係る、スケーラブル映像を優先度に応じて伝送する方法のフローチャートである。 本発明の実施例に係る、SVC階層化ビットストリームに対して、優先度並べ替えを行う方法のフローチャートである。 全ての状態ノードが異なるステージに区分されたことを示す図である。 初期ステージから宛先ステージまでの順に従って、全ての状態ノードを探索して、最適パスを得る方法のフローチャートである。 宛先ステージから初期ステージまでの順に従って、全ての状態ノードを探索して、最適パスを得る方法のフローチャートである。 パッケージ後のSVC階層化ビットストリームを示す図である。 本発明の実施例に係るRaptor符号化プロセスを示す図である。 本発明の実施例に係る、スケーラブル映像を優先度に応じて伝送する装置の内部構成を示す図である。 スケーラブル映像シーケンスForemanに対して、デフォルトの並べ替え方法、品質層に基づく優先度並べ替え方法、および本発明の実施例で提供される優先度並べ替え方法を採用する場合のレート歪み性能を示す図である。 スケーラブル映像シーケンスFootballに対して、デフォルトの並べ替え方法、品質層に基づく優先度並べ替え方法、および本発明の実施例で提供される優先度並べ替え方法を採用する場合のレート歪み性能を示す図である。 スケーラブル映像シーケンスCityに対して、デフォルトの並べ替え方法、品質層に基づく優先度並べ替え方法、および本発明の実施例で提供される優先度並べ替え方法を採用する場合のレート歪み性能を示す図である。 スケーラブル映像シーケンスHarbourに対して、デフォルトの並べ替え方法、品質層に基づく優先度並べ替え方法、および本発明の実施例で提供される優先度並べ替え方法を採用する場合のレート歪み性能を示す図である。 異なるパケットロス率およびソースデータパケット数Nで、標準LT符号化方式、および本発明の実施例で提供される、次数を適応選択するLT符号化方式を採用する場合のスケーラブル映像の受信側の復号成功率を示す図である。
従来のH.264/SVC映像符号化規格に直接に応用して、映像ストリームのサービス品質を向上させるために、本発明の実施例では、スケーラブル映像を優先度に応じて伝送する方法が提供されている。図1に示すように、該方法は、下記のステップを含む。
ステップ101で、スケーラブル映像の各ピクチャグループ(GOP:Group of Pictures)がSVC符号化された後のSVC階層化ビットストリームに対して、優先度並べ替えを行う。
ステップ102で、並べ替え後のSVC階層化ビットストリームに対して、パッケージおよびRaptor符号化を行って、伝送チャネルを介して、符号化後のスケーラブル映像のビットストリームを、スケーラブル映像の受信側に送信する。
スケーラブル映像の受信側は、符号化後のビットストリームを受信した後、Raptor復号およびビットストリーム複合により、SVC階層化ビットストリームを得ることができ、次に、SVC復号して、映像の画像を再構築する。
本発明の実施例では、SVC階層化ビットストリームの階層化特性に従って、まず、SVC階層化ビットストリームに対して、優先度並べ替えを行い、次に、並べ替え後のSVC階層化ビットストリームに対して、パッケージおよびRaptor符号化を行う。これにより、スケーラブル映像のビットストリームの最適化選択および伝送の課題を解決するとともに、スケーラブル映像のビットストリームから再構築された画像の品質を最終的に向上させることができる。
以下、図面を参照しながら、上記ステップ101におけるSVC階層化ビットストリームに対して優先度並べ替えを行う方法を、詳しく説明する。
本発明の実施例において、優先度並べ替えとは、GOPを単位として、SVC符号化後のSVC階層化ビットストリームに対して、その重要性に応じて、優先度の順位を並べ替えるということである。その目的は、受信側が一定数量のデータパケットを正確に受信した場合、復元された画像の品質を最良にするということである。
映像シーケンスの各GOPの大きさがNであり、各GOP画像がSVC符号化された後、ビットレートがRであるL層のSVC階層化ビットストリームが生成できると仮定する。ここで、第i層のビットストリームのビットレートはRで表し、第1層から第i層までのビットストリームに対応する再構築された画像の歪み度を反映するピーク信号対雑音比パラメータ(PSNR:Peak Signal to Noise Ratio)はPSNR(1≦i≦L)で表す。各GOPのSVC階層化ビットストリームが優先度並べ替えされた後、それぞれ得られたL層のビットストリームのビットレートRおよび対応するPSNRの値は、以下の数式1を満足する。
[数式1]
デフォルトのSVC階層化ビットストリームの並べ替え方法を採用して、SVC階層化ビットストリームに対して、優先度並べ替えを行うことができる、ということが知られている。具体的に、デフォルトのSVC階層化ビットストリームの並べ替え方法では、GOPを単位として、時間領域層に基づいて並べ替える。各時間領域層は、若干の空間領域層を含む。これらの空間領域層は、基本層である1つの品質領域(例えば、SNR)層と、強化層であるいくつかの品質領域層とを含む可能性がある。
そのほか、品質層に基づくSVC階層化ビットストリームの並べ替え方法を採用して、SVC階層化ビットストリームに対して、優先度並べ替えを行うこともできる。具体的に、品質層に基づくSVC階層化ビットストリームの並べ替え方法では、第iフレームの画像がd層(例えば、QCIF層、CIF層および4CIF層)に符号化され、各層において、画像が基本層と品質層に符号化され、ここで、品質層の解像度特性がqであると仮定し、各フレームの画像のビットレート関数R(d,i,q)と歪み関数D(d,i,q)とを計算し、レート歪みR−D曲線を作成することにより、各フレームの画像の品質層の最適な並べ替え順を得る。
また、本発明の実施例では、新しい優先度並べ替え方法が提供されている。図2は、本発明の実施例に係る、SVC階層化ビットストリームに対して、優先度並べ替えを行う方法を示す。図2に示すように、該方法は、以下のステップを含む。
ステップ201で、並べ替えパス上の全ての可能ノードを、一定の(s,t,q)特性に対応する各状態(state)ノードとして定義し、s、tおよびqの増加ステップサイズの違いにより、同じ増加ステップサイズを有する状態ノードが同じステージ(stage)にあるように、全ての状態ノードを異なるステージに区分する。
本実施例において、説明の便宜上、SVC階層化ビットストリームの特性を、トリプル(s,t,q)で表し、ここで、s、tおよびqはそれぞれ、空間領域、時間領域および品質領域の解像度特性を表す。ここで、最低解像度特性を有するビットストリームは(0,0,0)で表し、スケーラブル映像の受信側は、該ビットストリームを受信した後、最も基本的な品質の映像を復元することができる。最高解像度を有するビットストリームは(s*,t*,q*)で表し、スケーラブル映像の受信側は、該ビットストリームを受信した後、最高解像度を含む各種の解像度の品質の映像を完全に復元することができる。中間解像度を有するビットストリームは(s,t,q)で表し、スケーラブル映像の受信側は、該ビットストリームを受信した後、この中間解像度を含む各種の解像度の品質の映像を復元することができる。
本実施例に係る優先度並べ替え方法の目標は、最低解像度特性を有するビットストリームから、最高解像度特性を有するビットストリームまで、即ち、状態ノード(0,0,0)(初期状態ノードとも呼ばれる)から、状態ノード(s*,t*,q*)(宛先状態ノードとも呼ばれる)まで、最適な解像度特性の増加を有するパスを探して、受信側で復元されたビットストリームが最適なレート歪み特性を有することを確保する、ということである。
図3は、全ての状態ノードが異なるステージに区分されたことを示す図である。図3に示すように、異なる解像度特性を有する12個の状態ノード(state(0,0,0)〜state(1,2,1))は、それぞれ5つのステージ(stage0〜stage4)に区分される。この場合、最適な解像度特性の増加を有するパスの選択課題は、如何に初期状態ノードstate(0,0,0)から宛先状態ノードstate(1,2,1)まで、適当な状態ノードを選択して最適なパスを構成するかという課題に変換された。
ステップ202で、各状態ノードそれぞれのビットレートおよびその対応するPSNRによって、各状態ノードの並べ替え因子を計算する。
上記ステップ202において、下記の数式2によって、各ノードの並べ替え因子を計算することができる。
[数式2]
ここで、gjは第jのステージを表し、ti(gj)は第jのステージにおけるi番目の状態ノードを表し、t(g0)は初期ステージの初期状態ノードを表し、t(gK-1)は宛先ステージの宛先状態ノードを表し、
は状態ノードti(gj)のPSNRを表し、
は状態ノードti(gj)のビットレートを表し、
は初期状態ノードt(g0)のPSNRを表し、
は初期状態ノードt(g0)のビットレートを表し、
は宛先状態ノードt(gK-1)のPSNRを表し、
は宛先状態ノードt(gK-1)のビットレートを表し、Oi(gj)は状態ノードti(gj)の並べ替え因子を表し、Kはステージの総数を表す。
本発明の実施例において、Oi(gj)を用いて、第j−1のステージから第jのステージのi番目の状態ノードまでのパスのキャンバを記述する。該キャンバは、基準品質に対する増量と見なされてよい。
ステップ203で、初期ステージから宛先ステージまでの状態ノードで構成可能な全てのパスの中から、各状態ノードの並べ替え因子の重み付け和が最大となる最適パスを決定する。
本ステップにおいて、下記の数式3によって、初期ステージから宛先ステージまでの状態ノードで構成可能な全てのパス上の各状態ノードの並べ替え因子の重み付け和を計算することができる。そして、最大となる並べ替え因子の重み付け和を有するパスを、最適パスとする。
[数式3]
ここで、Sxは初期ステージから宛先ステージまでの状態ノードで構成可能な全てのパスのうち、x番目のパス上の各状態ノードの並べ替え因子の重み付け和を表し、O(gj)は該x番目のパスの第jのステージにおける状態ノードの並べ替え因子を表し、ωjは第jのステージの重み付け因子を表す(0<ωj<1、0≦j≦K-1)。
好ましくは、第gjのステージの重み付け因子をωj+1(0<ω<1、0≦j≦K-1)にしてもよい。実験から分かるように、一般的な映像シーケンスについて、ω=0.2の場合、比較的よい優先度並べ替え結果を得ることができる。
ステップ204で、最適パス上の初期ステージから宛先ステージまでの各状態ノードの順に従って、SVC階層化ビットストリームを出力する。
本ステップにおいて、最適パス上の各ノードにおいて同じ品質領域特性を有する状態ノードを、1層のSVC階層化ビットストリームとして出力することができる。
具体的に、本発明の実施例において、様々な方法を採用して、初期ステージから宛先ステージまでの状態ノードで構成される全ての可能パスの中から、最適パスを決定してもよい。例えば、前記最適パスを得るために、初期ステージから宛先ステージまでの順に従って全ての状態ノードを探索してもよく、あるいは、宛先ステージから初期ステージまでの順に従って全ての状態ノードを探索してもよい。
図4は、初期ステージから宛先ステージまでの順に従って、全ての状態ノードを探索して、前記最適パスを得る方法のフローチャートである。該方法は、主に、下記のステップを含む。
ステップ301で、初期ステージの初期状態ノードを開始点として選択して、反復パラメータを初期化する。この初期化は、ノード識別子jを1に設定し、初期ステージの並べ替え因子の重み付け和S0(t)を0に設定し、初期ノードの最適パスの状態ノード集合を初期状態ノードに初期化することを含む。
ステップ302で、第jのステージにおける各状態ノードの並べ替え因子の重み付け和Sj(ti)を計算し、初期ステージから第jのステージにおける各状態ノードまでの最適パスの状態ノード集合をそれぞれ記録する。
本ステップにおいて、下記の数式4によって、第jのステージにおける各状態ノードの並べ替え因子の重み付け和Sj(ti)を計算することができる。
[数式4]
ここで、Sj(ti)は第jのステージにおけるi番目の状態ノードtiの並べ替え因子の重み付け和を表し、Sj-1(tk)は第j−1のステージにおける状態ノードtiに繋がるk番目の状態ノードtkの並べ替え因子の重み付け和を表し、ωjは第jのステージの重み付け因子を表し、Oi(gj)は第jのステージにおけるi番目の状態ノードtiの並べ替え因子を表す。上記の数式4から分かるように、第jのステージにおけるi番目の状態ノードtiの並べ替え因子の重み付け和Sj(ti)は、該状態ノードの並べ替え因子の重み付け値に、1つ前のステージ(即ち、第j−1のステージ)における該状態ノードに繋がる各状態ノードの並べ替え因子の重み付け和の最大値を加えた値である。
また、第jのステージにおけるi番目の状態ノードtiの最適パスの状態ノード集合は、下記の数式5によって算出することができる。
[数式5]
ここで、Mj(ti)は第jのステージにおけるi番目の状態ノードtiの最適パスの状態ノード集合を表し、Mj-1(tk)は第j−1のステージにおける状態ノードtiに繋がる各状態ノードのうち、並べ替え因子の重み付け和の最大値に対応する状態ノードの最適パスの状態ノード集合を表す。
ステップ303で、第jのステージが宛先ステージであるかどうかを判断し、即ち、jがK−1と等しいかどうかを判断し、そうである場合、ステップ304を実行し、そうではない場合、「j=j+1」にして、ステップ302に戻る。
ステップ304で、宛先状態ノードの最適パスの状態ノード集合における各状態ノードからなるパスを、最適パスとする。
図5は、宛先ステージから初期ステージまでの順に従って、全ての状態ノードを探索して、前記最適パスを得る方法のフローチャートである。該方法は、主に、下記のステップを含む。
ステップ401で、宛先ステージの宛先状態ノードを開始点として選択して、反復パラメータを初期化する。この初期化は、ノード識別子jをK−2に設定し、宛先ステージの並べ替え因子の重み付け和TK-1(t)を0に設定し、宛先ノードの最適パスの状態ノード集合を宛先状態ノードに初期化することを含む。
ステップ402で、第jのステージにおける各状態ノードから宛先ステージまでの並べ替え因子の重み付け和Tj(ti)を計算し、第jのステージにおける各状態ノードから宛先ステージまでの最適パスの状態ノード集合をそれぞれ記録する。
本ステップにおいて、下記の数式6によって、第jのステージにおける各状態ノードの並べ替え因子の重み付け和Tj(ti)を計算することができる。
[数式6]
ここで、Tj(ti)は第jのステージにおけるi番目の状態ノードtiから宛先ステージまでの並べ替え因子の重み付け和を表し、Tj+1(tk)は第j+1のステージにおける状態ノードtiに繋がるk番目の状態ノードtkの並べ替え因子の重み付け和を表し、ωjは第jのステージの重み付け因子を表し、Oi(gj)は第jのステージにおけるi番目の状態ノードtiの並べ替え因子を表す。上記の数式6から分かるように、第jのステージにおけるi番目の状態ノードtiから宛先ステージまでの並べ替え因子の重み付け和Tj(ti)は、該状態ノードの並べ替え因子の重み付け値に、次のステージ(即ち、第j+1のステージ)における該状態ノードに繋がる各状態ノードから宛先ステージまでの並べ替え因子の重み付け和の最大値を加えた値である。
また、第jのステージにおけるi番目の状態ノードtiから宛先ステージまでの最適パスの状態ノード集合は、下記の数式7によって算出することができる。
[数式7]
ここで、Mj(ti)は第jのステージにおけるi番目の状態ノードtiから宛先ステージまでの最適パスの状態ノード集合を表し、Mj+1(tk)は第j+1のステージにおける状態ノードtiに繋がる各状態ノードから宛先ステージまでの並べ替え因子の重み付け和の最大値に対応する状態ノードから宛先ステージまでの最適パスの状態ノード集合を表す。
ステップ403で、第jのステージが初期ステージであるかどうかを判断し、即ち、jが0と等しいかどうかを判断し、そうである場合、ステップ404を実行し、そうではない場合、「j=j―1」にして、ステップ402に戻る。
ステップ404で、初期状態ノードから宛先ステージまでの最適パスの状態ノード集合における各状態ノードからなるパスを、最適パスとする。
説明すべきものとして、図4と図5に係る方法で提供されたのは、ただ、全ての状態ノードの中から最適パスを探索することを示す代表例にすぎない。本発明の実施例は、上記2つの方法の採用のみに限られない。
また、説明すべきものとして、ステップ203で決定された最適パスが1つより多い場合、各ステージの重み付け因子の値を増加して、初期ステージから宛先ステージまでの状態ノードで構成可能な全てのパスの中から、最適パスを再決定することができる。例えば、図4に示す探索プロセスのステップ302では、1つ前のステージにおいて、1つより多い状態ノードが並べ替え因子の重み付け和の最大値に対応することが分かる場合、または、図5に示す探索プロセスのステップ402では、次のステージにおいて、1つより多い状態ノードが並べ替え因子の重み付け和の最大値に対応することが分かる場合、各ステージの重み付け因子を増加して、ステップ301または401に戻って、図4または図5に示す探索プロセスを再実行することができる。
上記から分かるように、本発明の実施例に係る、SVC階層化ビットストリームに対して、優先度並べ替えを行う方法では、単一のGOP内の異なる空間領域、時間領域および品質領域の階層化ビットストリームのレート歪み性能が充分に考慮されるため、優先度並べ替え結果がより合理的になり、さらに、SVC階層化ビットストリームのレート歪み性能が向上する。
以下、図面を参照しながら、ステップ102におけるパッケージおよびRaptor符号化の方法を詳しく説明する。
図6は、パッケージ後のSVC階層化ビットストリームを示す図である。図6に示すように、パッケージプロセスでは、まず、L層のSVC階層化ビットストリームを、それぞれw×hのソース行列ブロックに変換する。ここで、wは、ソース行列ブロックの幅であり、hは、ソース行列ブロックの高さであり、かつ、下記の数式8に示す拘束条件を満たす。該拘束条件は、チャネル復号後、前のソース符号がいつも後ろのソース符号より優先的に復元され、即ち、重要性の高い情報がいつも重要性の低い情報より優先的に復元されることを保証する。次に、各ソース行列ブロックのそれぞれにおいて、Raptor符号化を行って、n個のデータパケットを得る。
[数式8]
このn個のデータパケットは、一定のパケットロス率を有するチャネルで伝送され、スケーラブル映像の受信側に到達する。スケーラブル映像の受信側でα(0≦α≦n)個のデータパケットを受信し、ビットストリーム複合により得られたコードエレメントの数がrであることを仮定すると、αとrとの間の関係は、以下の数式9に示す拘束条件を満たす。
[数式9]
また、スケーラブル映像の受信側が第i層のビットストリームを受信する確率Piは、αの関数であり、下記の数式10に示す拘束条件を満たすことを仮定すると、
[数式10]
一定の帯域幅とパケットロス率の場合、数式10から分かるように、スケーラブル映像ストリームの伝送は、下記の目標を満たすべきである。即ち、0<α≦nの場合、スケーラブル映像の受信側がr個のコードエレメントから復元した映像の画像のPSNRを最大化する。該目標は、パッケージパラメータにおけるwを最適化することにより達成することができる。即ち、最適化の目標関数は、下記の数式11に示す通りである。現在、復元された映像の画像のPSNRを最大化するために、様々な探索アルゴリズムによって、L層のSVC階層化ビットストリームのパッケージ幅wをそれぞれ決定することができる。ここで、説明を省略する。
[数式11]
そのほか、本発明の実施例において、Raptor符号化は、RS+LTという形式を採用し、その符号化プロセスが図7に示すように、主に、下記のステップを含む。
ステップ501で、並べ替えおよびパッケージがされた後の各層のソース行列ブロックのそれぞれに対して、RS符号化およびインターリーブを行って、m個のデータパケットを得る。このm個のデータパケットの長さは、Plength個の符号に固定される。
即ち、本ステップにおいて、各ソース行列ブッロクの後ろに、大きさが(m-wi)×hiであってかつ冗長情報が付けられる行列ブロック(例えば、大きさがw×hであるソース行列ブロックに対して、前方誤り訂正(FEC:forward error correction)符号化を行うことにより、大きさが(m-wi)×hiである行列ブロックを生成する)をパディングすることにより、大きさがそれぞれm×hiであるL個の行列ブロックを得る。図6に示すように、このL個の行列ブロックの高さの和がPlengthであるため、このL個の行列ブロックを組み合わせて、長さがPlength個の符号に固定されるm個のデータパケットを得ることができる。
ステップ502で、LT符号化の次数(Degree)dを決定する。
ステップ503で、決定されたLT符号化の次数dに従って、上記m個のデータパケットに対して、LT符号化を行って、n個のデータパケットを得る。このn個のデータパケットの長さもPlength個の符号に固定される。
即ち、本ステップにおいて、上記m個のデータパケットの中からβ(1≦β≦d)個のデータパケットをランダムに選択して、β個のデータパケットにおける対応する情報に対して、ビットごとの排他的論理和演算を行って、1つの新しいデータパケットを得る。長さが同様にPlength個の符号に固定されるn個のデータパケットを得るまで、このように繰り返して実行する。
上記図7に示すRaptor符号化プロセスから分かるように、LT符号化の次数dの大きさが、LT符号化の複雑度を決定するキーポイントである。また、LT符号化における次数dの大きさの選択によって、スケーラブル映像の受信側の復号成功率が決定される。一般的なLT符号化において、mの値は比較的に大きい(10〜10)。この場合、次数dの値は、d∈[1,m]を満足する。本発明に係る映像システムにおいて、ビットストリーム処理および伝送の基本単位は、いずれもGOPであり、GOPビットストリームの大きさは、直接的にmの値の範囲に影響する。端末の映像再生の品質および遅延を保証するために、端末は一定の時間内で、該GOPのビットストリームを復号して、最小歪みを有する映像の画像を復元する必要がある。しかしながら、GOPビットストリームが比較的に小さい場合(m<10)、m値の減少につれて、次数dが1であるデータパケットの数が減少する。これにより、LT符号の復号成功率は次第に低下し、端末で復元された映像はひどい歪みが発生し、ひいては、復号できない。従って、d∈[1,m]という選択範囲は、スケーラブル映像のビットストリームの伝送に適合しない。このため、本発明の実施例では、次数dの値の範囲を適応選択する方法も提供されている。
LT(n,m)アルゴリズムにおいて、次数dの分布がRobust−Soliton分布であることが知られている。その分布関数は、下記の数式12に示す通りである。
[数式12]
ここで、
、定数c>0、
、δは許容可能な復号失敗率である。
上記数式11に示す次数dの分布関数から分かるように、次数dが
である確率は95%を超えるが、次数dが
である確率は5%未満である。従って、次数dの大きさを適応選択する際に、
の範囲だけを考慮してもよい。即ち、
の範囲内で、次数dを選択してもよい。ここで、θは、Robust−Soliton分布関数のパラメータである。
また、次数dの選択範囲について、RS符号化の復号能力を考慮する必要もある。LT復号時、成功に復号できないパケットが、RS符号化の消失訂正の範囲内にあることを保証する必要がある。即ち、δ≦αを満足する必要がある。ここで、αは、m値に対応するRS符号化の冗長度である。上記の基準に従って、まず、mの値の範囲を分類し、次に、シミュレーションにより、m値が異なる次数範囲内にある場合の復号失敗率を得る。このように、異なるmの値の範囲内における次数dの値の最適範囲を決定し、即ち、表1に示すように、mの値の範囲と次数dの値の最適範囲との対応関係を確立する。
このように、上記ステップ502において、まず、mの値により、次数dの値の最適範囲を決定することができる。次に、次数dの値の最適範囲内で、1つの整数をランダムに選択して、LT符号化の次数dとする。
上記次数dの値の範囲を適応選択する方法から分かるように、本実施例のLT符号化プロセスにおいて、次数dの選択範囲を大幅に縮小させる。これにより、LT符号化の複雑度を大幅に低減させる。また、次数dの値の最適範囲内で次数の値を選択することで、スケーラブル映像の受信側の復号成功率をさらに向上させることもできる。
上記スケーラブル映像を優先度に応じて伝送する方法のほかに、本発明の実施例では、スケーラブル映像を優先度に応じて伝送する装置も提供されている。その内部構成は図8に示すように、主に、スケーラブル映像の各GOPに対して、SVC符号化を行うSVC符号化手段と、SVC符号化後のSVC階層化ビットストリームに対して、優先度並べ替えを行う優先度並べ替え手段と、並べ替え後のSVC階層化ビットストリームに対して、パッケージを行うパッケージ手段と、パッケージ後のSVC階層化ビットストリームに対して、Raptor符号化を行って、伝送チャネルを介して、スケーラブル映像の受信側に送信するRaptor符号化手段と、を含む。
本実施例において、上記優先度並べ替え手段の内部には、並べ替えパス上の全ての可能ノードを、一定の(s,t,q)特性(s、tおよびqはそれぞれ、空間領域、時間領域および品質領域の解像度特性を表す)に対応する各状態ノードとして定義し、s、tおよびqの増加ステップサイズの違いにより、同じ増加ステップサイズを有する状態ノードが同じステージにあるように、全ての状態ノードを異なるステージに区分する、ステージ区分モジュールと、各状態ノードそれぞれのビットレートおよびその対応するPSNRによって、各状態ノードの並べ替え因子を計算する並べ替え因子決定モジュールと、初期ステージから宛先ステージまでの状態ノードで構成可能な全てのパスの中から、各状態ノードの並べ替え因子の重み付け和が最大となる最適パスを決定する最適パス決定モジュールと最適パス上の初期ステージから宛先ステージまでの各状態ノードの順に従って、SVC階層化ビットストリームを出力する並べ替え結果出力モジュールと、を含む。
上記のように、上記並べ替え因子決定モジュールは、上記数式2によって、各ノードの並べ替え因子を計算することができる。
上記のように、上記最適パス決定モジュールは、図4と図5に示す方法を採用して、最適パスを決定することができる。
また、上記Raptor符号化手段の内部には、パッケージ後の各層のソース行列ブロックのそれぞれに対して、RS符号化を行って、m個のデータパケットを得るRS符号化モジュールと、LT符号化の次数dを決定するLT符号化次数決定モジュールと、決定されたLT符号化の次数dに従って、上記m個のデータパケットに対して、LT符号化を行って、n個のデータパケットを得るLT符号化モジュールと、を含む。
上記のように、本発明の実施例に係る、スケーラブル映像を優先度に応じて伝送する装置は、SVC階層化ビットストリームの階層化特性により、まず、SVC階層化ビットストリームに対して、優先度並べ替えを行って、次に、並べ替え後のSVC階層化ビットストリームに対して、パッケージおよびRaptor符号化を行う。これにより、スケーラブル映像のビットストリームの最適化選択および伝送の課題を解決するとともに、スケーラブル映像のビットストリームから再構築された画像の品質を最終的に向上させることができる。
本発明の実施例に係る、スケーラブル映像を優先度に応じて伝送する装置では、SVC階層化ビットストリームに対して、優先度並べ替えを行う際に、単一のGOP内の異なる空間領域、時間領域および品質領域の階層化ビットストリームのレート歪み性能が充分に考慮されるため、優先度並べ替え結果がより合理的になり、さらに、SVC階層化ビットストリームのレート歪み性能が向上する。また、本発明の実施例に係る、スケーラブル映像を優先度に応じて伝送する装置は、LT符号化を行う際に、LT符号化の次数の値の範囲を適応選択することができる。これにより、LT符号化の複雑度を大幅に低下させることができる一方、スケーラブル映像の受信側の復号成功率を大幅に向上させることもできる。
以下、シミュレーションにより、本発明の実施例に係る方法の技術的効果を詳しく説明する。表2は、シミュレーションモデルのパラメータを示す。
図9から図12は、Foreman、Football、CityおよびHarbourという4つのスケーラブル映像シーケンスに対して、デフォルトの並べ替え方法、品質層に基づく優先度並べ替え方法、および本発明の実施例で提供される優先度並べ替え方法を採用する場合のレート歪み性能をそれぞれ示す。ここで、四角印の曲線は、デフォルトの並べ替え方法のレート歪み性能を表し、菱形印の曲線は、品質層に基づく優先度並べ替え方法のレート歪み性能を表し、丸印の曲線は、本発明の実施例で提供された優先度並べ替え方法のレート歪み性能を表す。
図9〜図12から分かるように、ビットレートが比較的低い場合、全てのシーケンスのシミュレーション結果のうち、本発明の実施例で提供される優先度並べ替え方法のレート歪み性能が、明らかにほかの2つの方法より良い。一方、ビットレートが比較的高い場合、本発明の実施例で提供される並べ替え方法のレート歪み性能は、依然としてほかの2つのアルゴリズムより良い。
表3は、上記3つの並べ替え方法を採用して、異なる解像度とビットレートの映像シーケンスに対して、優先度並べ替えを行って得られた平均PSNRを示す。表3から分かるように、本発明の実施例で提供される優先度並べ替え方法は、異なビットレートでの性能がいずれも最も良い。ここで、ビットレートが比較的低いCIFシーケンスForemanにおいて、本発明の実施例で提供される優先度並べ替え方法の平均PSNRは、デフォルトの並べ替え方法および品質層に基づく優先度並べ替え方法に対して、全部8.21dB向上する。ビットレートが比較的高いCIFシーケンスFootballにおいて、本発明の実施例で提供される優先度並べ替え方法の平均PSNR性能は、6.41db向上する。低いビットレートの4CIFシーケンスCityにおいて、本発明の実施例で提供される優先度並べ替え方法の平均PSNRは、デフォルトの並べ替え方法および品質層に基づく優先度並べ替え方法に対して、それぞれ3.28dBおよび2.83dB向上する。高いビットレートの4CIFシーケンスHarbourにおいて、本発明の実施例で提供される優先度並べ替え方法の平均PSNRは、デフォルトの並べ替え方法および品質層に基づく優先度並べ替え方法に対して、それぞれ1.94dBおよび1.64dB向上する。
図13は、異なるパケットロス率およびソースデータパケット数Nで、標準LT符号化方式(SLTと呼ばれる)、および本発明の実施例で提供される、次数を適応選択するLT符号化方式(ALTと呼ばれる)を採用する場合のスケーラブル映像の受信側の復号成功率(SDR)を示す図である。図13において、送信データパケットの冗長は25%であり、四角印および丸印の曲線は、Nが576であって、SLTおよびALTを採用する場合のスケーラブル映像の受信側のSDRをそれぞれ表し、三角印および逆三角印の曲線は、Nが1278であって、SLTおよびALTを採用する場合のスケーラブル映像の受信側のSDRをそれぞれ表す。図13から分かるように、Nの値が異なる場合、ALTのSDR値は、明らかにSLTの結果より良い。
上記は、本発明の好ましい実施例にすぎず、本発明の保護範囲を限定するものではない。本発明の精神と原則内で行われる種々の修正、均等置換え、改善などは全て本発明の保護範囲内に含まれるべきである。

Claims (14)

  1. スケーラブル映像を優先度に応じて伝送する方法であって、
    スケーラブル映像の各ピクチャグループ(GOP)のスケーラブル映像符号化(SVC)後の階層化ビットストリームに対して、優先度並べ替えを行い、
    並べ替え後のSVC階層化ビットストリームに対して、パッケージおよびRaptor符号化を行って、伝送チャネルを介して、符号化後のスケーラブル映像のビットストリームを、スケーラブル映像の受信側に送信する、
    ことを含むことを特徴とする方法。
  2. 前記SVC階層化ビットストリームに対して、優先度並べ替えを行うことは、
    並べ替えパス上の全ての可能ノードを、一定の(s,t,q)特性(s、tおよびqはそれぞれ、空間領域、時間領域および品質領域の解像度特性を表す)に対応する各状態ノードとして定義し、
    s、tおよびqの増加ステップサイズの違いにより、同じ増加ステップサイズを有する状態ノードが同じステージにあるように、全ての状態ノードを異なるステージに区分し、
    各状態ノードそれぞれのビットレートおよびその対応するピーク信号対雑音比(PSNR)によって、各状態ノードの並べ替え因子を計算し、
    初期ステージから宛先ステージまでの状態ノードで構成可能な全てのパスの中から、各状態ノードの並べ替え因子の重み付け和が最大となる最適パスを決定し、
    最適パス上の初期ステージから宛先ステージまでの各状態ノードの順に従って、SVC階層化ビットストリームを出力する、
    ことを含むことを特徴とする請求項1に記載の方法。
  3. 数式
    によって、各ノードの並べ替え因子を計算し、
    ここで、gjは第jのステージを表し、ti(gj)は第jのステージにおけるi番目の状態ノードを表し、t(g0)は初期ステージの初期状態ノードを表し、t(gK-1)は宛先ステージの宛先状態ノードを表し、
    は状態ノードti(gj)のPSNRを表し、
    は状態ノードti(gj)のビットレートを表し、
    は初期状態ノードt(g0)のPSNRを表し、
    は初期状態ノードt(g0)のビットレートを表し、
    は宛先状態ノードt(gK-1)のPSNRを表し、
    は宛先状態ノードt(gK-1)のビットレートを表し、Oi(gj)は状態ノードti(gj)の並べ替え因子を表し、Kはステージの総数を表す、
    ことを特徴とする請求項2に記載の方法。
  4. 前記初期ステージから宛先ステージまでの状態ノードで構成可能な全てのパスの中から、最適パスを決定することは、
    数式
    によって、初期ステージから宛先ステージまでの状態ノードで構成可能な全てのパス上の各状態ノードの並べ替え因子の重み付け和を計算し、
    最大となる並べ替え因子の重み付け和を有するパスを、最適パスとする、
    ことを含み、
    ここで、Sxは初期ステージから宛先ステージまでの状態ノードで構成可能な全てのパスのうち、x番目のパス上の各状態ノードの並べ替え因子の重み付け和を表し、O(gj)は該x番目のパスの第jのステージにおける状態ノードの並べ替え因子を表し、ωjは第jのステージの重み付け因子を表す(0<ωj<1、0≦j≦K-1)、
    ことを特徴とする請求項2に記載の方法。
  5. 前記初期ステージから宛先ステージまでの状態ノードで構成可能な全てのパスの中から、最適パスを決定することは、
    初期ステージの初期状態ノードを開始点として選択して、ノード識別子jを1に設定し、初期ステージの並べ替え因子の重み付け和S0(t)を0に設定し、初期ノードの最適パスの状態ノード集合を初期状態ノードに初期化するステップA0と、
    数式
    および
    を採用して、第jのステージにおける各状態ノードの並べ替え因子の重み付け和Sj(ti)を計算し、初期ステージから第jのステージにおける各状態ノードまでの最適パスの状態ノード集合をそれぞれ記録するステップA1と、
    jがK−1と等しいかどうかを判断し、等しい場合、宛先状態ノードの最適パスの状態ノード集合における各状態ノードからなるパスを、最適パスとし、等しくない場合、「j=j+1」にして、ステップA1に戻るステップA2と、
    を含み、
    ここで、Sj(ti)は第jのステージにおけるi番目の状態ノードtiの並べ替え因子の重み付け和を表し、Sj-1(tk)は第j−1のステージにおける状態ノードtiに繋がるk番目の状態ノードtkの並べ替え因子の重み付け和を表し、ωjは第jのステージの重み付け因子を表し、Oi(gj)は第jのステージにおけるi番目の状態ノードtiの並べ替え因子を表し、Mj(ti)は第jのステージにおけるi番目の状態ノードtiの最適パスの状態ノード集合を表し、Mj-1(tk)は第j−1のステージにおける状態ノードtiに繋がる各状態ノードのうち、並べ替え因子の重み付け和の最大値に対応する状態ノードの最適パスの状態ノード集合を表す、
    ことを特徴とする請求項2に記載の方法。
  6. 前記初期ステージから宛先ステージまでの状態ノードで構成可能な全てのパスの中から、最適パスを決定することは、
    宛先ステージの宛先状態ノードを開始点として選択し、ノード識別子jをK−2に設定し、宛先ステージの並べ替え因子の重み付け和TK-1(t)を0に設定し、宛先ノードの最適パスの状態ノード集合を宛先状態ノードに初期化するステップa0と、
    数式
    および
    を採用して、第jのステージにおける各状態ノードから宛先ステージまでの並べ替え因子の重み付け和Tj(ti)を計算し、第jのステージにおける各状態ノードから宛先ステージまでの最適パスの状態ノード集合をそれぞれ記録するステップa1と、
    jが0と等しいかどうかを判断し、等しい場合、初期状態ノードから宛先ステージまでの最適パスの状態ノード集合における各状態ノードからなるパスを、最適パスとし、等しくない場合、「j=j―1」にして、ステップa1に戻るステップa2と、
    を含み、
    ここで、Tj(ti)は第jのステージにおけるi番目の状態ノードtiから宛先ステージまでの並べ替え因子の重み付け和を表し、Tj+1(tk)は第j+1のステージにおける状態ノードtiに繋がるk番目の状態ノードtkの並べ替え因子の重み付け和を表し、ωjは第jのステージの重み付け因子を表し、Oi(gj)は第jのステージにおけるi番目の状態ノードtiの並べ替え因子を表し、Mj(ti)は第jのステージにおけるi番目の状態ノードtiから宛先ステージまでの最適パスの状態ノード集合を表し、Mj+1(tk)は第j+1のステージにおける状態ノードtiに繋がる各状態ノードから宛先ステージまでの並べ替え因子の重み付け和の最大値に対応する状態ノードから宛先ステージまでの最適パスの状態ノード集合を表す、
    ことを特徴とする請求項2に記載の方法。
  7. 第jのステージの重み付け因子ωjはωj+1(0<ω<1、0≦j≦K-1)である、
    ことを特徴とする請求項4、5または6に記載の方法。
  8. 最適パスが1つより多い場合、
    各ステージの重み付け因子の値を増加して、初期ステージから宛先ステージまでの状態ノードで構成可能な全てのパスの中から、最適パスを再決定する、
    ことをさらに含むことを特徴とする請求項2に記載の方法。
  9. 前記Raptor符号化は、
    並べ替えおよびパッケージ後の各層のソース行列ブロックのそれぞれに対して、RS符号化およびインターリーブを行って、m個のデータパケットを得、
    LT符号化の次数を決定し、
    決定されたLT符号化の次数に従って、m個のデータパケットに対して、LT符号化を行って、n個のデータパケットを得る、
    ことを含むことを特徴とする請求項1に記載の方法。
  10. 前記LT符号化の次数を決定することは、
    の範囲内で次数dの値を選択する、
    ことを含み、
    ここで、θは次数分布関数のパラメータであり、次数分布関数がRobust−Soliton関数である場合、
    である(定数c>0、δは許容可能な復号失敗率)、
    ことを特徴とする請求項9に記載の方法。
  11. 前記LT符号化の次数を決定することは、
    mの値の範囲と次数dの値の最適範囲との対応関係を確立し、
    mの値により、次数dの値の最適範囲を決定し、
    次数dの値の最適範囲内で、1つの整数をランダムに選択して、LT符号化の次数dとする、
    ことを含むことを特徴とする請求項9に記載の方法。
  12. スケーラブル映像を優先度に応じて伝送する装置であって、
    スケーラブル映像の各ピクチャグループ(GOP)に対して、スケーラブル映像符号化(SVC)を行うSVC符号化手段と、
    SVC符号化後のSVC階層化ビットストリームに対して、優先度並べ替えを行う優先度並べ替え手段と、
    並べ替え後のSVC階層化ビットストリームに対して、パッケージを行うパッケージ手段と、
    パッケージ後のSVC階層化ビットストリームに対して、Raptor符号化を行って、伝送チャネルを介して、スケーラブル映像の受信側に送信するRaptor符号化手段と、
    を含むことを特徴とする装置。
  13. 前記優先度並べ替え手段は、
    並べ替えパス上の全ての可能ノードを、一定の(s,t,q)特性(s、tおよびqはそれぞれ、空間領域、時間領域および品質領域の解像度特性を表す)に対応する各状態ノードとして定義し、s、tおよびqの増加ステップサイズの違いにより、同じ増加ステップサイズを有する状態ノードが同じステージにあるように、全ての状態ノードを異なるステージに区分するステージ区分モジュールと、
    各状態ノードそれぞれのビットレートおよびその対応するピーク信号対雑音比(PSNR)によって、各状態ノードの並べ替え因子を計算する並べ替え因子決定モジュールと、
    初期ステージから宛先ステージまでの状態ノードで構成可能な全てのパスの中から、各状態ノードの並べ替え因子の重み付け和が最大となる最適パスを決定する最適パス決定モジュールと、
    最適パス上の初期ステージから宛先ステージまでの各状態ノードの順に従って、SVC階層化ビットストリームを出力する並べ替え結果出力モジュールと、
    を含むことを特徴とする請求項12に記載の装置。
  14. 前記Raptor符号化手段は、
    パッケージ後の各層のソース行列ブロックに対して、RS符号化を行って、m個のデータパケットを得るRS符号化モジュールと、
    LT符号化の次数を決定するLT符号化次数決定モジュールと、
    決定されたLT符号化の次数に従って、前記m個のデータパケットに対して、LT符号化を行って、n個のデータパケットを得るLT符号化モジュールと、
    を含むことを特徴とする請求項12に記載の装置。
JP2010275055A 2010-01-18 2010-12-09 スケーラブル映像を優先度に応じて伝送する方法及びその装置 Active JP5706144B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2010100040566A CN102131083B (zh) 2010-01-18 2010-01-18 可分级视频优先级传输方法及装置
CN201010004056.6 2010-01-18

Publications (2)

Publication Number Publication Date
JP2011147120A true JP2011147120A (ja) 2011-07-28
JP5706144B2 JP5706144B2 (ja) 2015-04-22

Family

ID=44268954

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010275055A Active JP5706144B2 (ja) 2010-01-18 2010-12-09 スケーラブル映像を優先度に応じて伝送する方法及びその装置

Country Status (2)

Country Link
JP (1) JP5706144B2 (ja)
CN (1) CN102131083B (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102547287A (zh) * 2012-01-11 2012-07-04 西安电子科技大学 基于Raptor码的图像编码方法
CN105049856A (zh) * 2015-07-14 2015-11-11 无锡天脉聚源传媒科技有限公司 一种视频文件的处理方法及装置
CN105578207A (zh) * 2015-12-18 2016-05-11 无锡天脉聚源传媒科技有限公司 一种视频帧率转换方法及装置

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103139559B (zh) * 2011-11-30 2016-01-27 中国电信股份有限公司 多媒体信号传输方法和装置
CN102694636B (zh) * 2012-06-15 2015-07-29 北京交大微联科技有限公司 采用喷泉码的harq技术的发送、接收方法及系统
CN102761906B (zh) * 2012-07-20 2014-09-03 西安交通大学 一种无线局域网中视频包的传输方法
CN106937069A (zh) * 2015-12-30 2017-07-07 惠州市伟乐科技股份有限公司 一种自动识别信号接口的方法
CN106302458A (zh) * 2016-08-16 2017-01-04 广东中星电子有限公司 视频信息传输方法及视频信息传输系统
CN106850133A (zh) * 2016-12-29 2017-06-13 东南大学 一种可重构的lt码译码系统与译码方法
CN109245850B (zh) * 2017-07-11 2021-04-02 上海交通大学 基于媒体内容的自适应系统码fec编译码方法
CN109194445B (zh) * 2018-09-13 2020-11-27 中国电子科技集团公司第二十八研究所 一种适用于短码长喷泉码的编译码优化方法
CN110475044B (zh) * 2019-08-05 2021-08-03 Oppo广东移动通信有限公司 图像传输方法和装置、电子设备、计算机可读存储介质
CN111131165B (zh) * 2019-11-27 2021-09-24 重庆邮电大学 基于多描述编码的dmb视频推送方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007019744A (ja) * 2005-07-06 2007-01-25 Canon Inc サーバ装置及びその制御方法、クライアント装置及びその制御方法、コンピュータプログラム、記憶媒体
JP2007508783A (ja) * 2003-10-14 2007-04-05 クゥアルコム・インコーポレイテッド マルチキャストブロードキャストマルチメディアサービスのためのスケーラブル符号化
US20080069242A1 (en) * 2006-09-08 2008-03-20 Qian Xu Distributed joint source-channel coding of video using raptor codes
JP2008263589A (ja) * 2007-03-16 2008-10-30 Ricoh Co Ltd 符号化装置、符号変換装置、符号伸張装置、符号化方法、符号変換方法及び符号伸張方法
JP2009517985A (ja) * 2005-11-29 2009-04-30 株式会社エヌ・ティ・ティ・ドコモ 階層レートレス符号化の方法及び装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100799592B1 (ko) * 2006-11-30 2008-01-30 한국전자통신연구원 스케일러블 비디오 비트스트림의 계층 변조 송수신을 위한장치 및 그 방법
CN101572817B (zh) * 2009-05-26 2011-01-05 北京邮电大学 一种用于空间可分级视频编码的编码模式选择方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007508783A (ja) * 2003-10-14 2007-04-05 クゥアルコム・インコーポレイテッド マルチキャストブロードキャストマルチメディアサービスのためのスケーラブル符号化
JP2007019744A (ja) * 2005-07-06 2007-01-25 Canon Inc サーバ装置及びその制御方法、クライアント装置及びその制御方法、コンピュータプログラム、記憶媒体
JP2009517985A (ja) * 2005-11-29 2009-04-30 株式会社エヌ・ティ・ティ・ドコモ 階層レートレス符号化の方法及び装置
US20080069242A1 (en) * 2006-09-08 2008-03-20 Qian Xu Distributed joint source-channel coding of video using raptor codes
JP2008263589A (ja) * 2007-03-16 2008-10-30 Ricoh Co Ltd 符号化装置、符号変換装置、符号伸張装置、符号化方法、符号変換方法及び符号伸張方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MICHAEL LUBY: "LT Codes", PROCEEDINGS OF THE 43RD ANNUAL IEEE SYMPOSIUM ON FOUNDATIONS OF COMPUTER SCIENCE(FOCS'02), JPN6014042068, 2002, pages 271 - 280, ISSN: 0002911811 *
大久保 榮, 改訂三版H.264/AVC教科書 第1版 H.264/AVC TEXTBOOK, JPN6014042070, 1 January 2009 (2009-01-01), pages 291 - 292, ISSN: 0002911810 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102547287A (zh) * 2012-01-11 2012-07-04 西安电子科技大学 基于Raptor码的图像编码方法
CN105049856A (zh) * 2015-07-14 2015-11-11 无锡天脉聚源传媒科技有限公司 一种视频文件的处理方法及装置
CN105578207A (zh) * 2015-12-18 2016-05-11 无锡天脉聚源传媒科技有限公司 一种视频帧率转换方法及装置

Also Published As

Publication number Publication date
CN102131083B (zh) 2013-08-14
CN102131083A (zh) 2011-07-20
JP5706144B2 (ja) 2015-04-22

Similar Documents

Publication Publication Date Title
JP5706144B2 (ja) スケーラブル映像を優先度に応じて伝送する方法及びその装置
US8331445B2 (en) Method, apparatus, and system for enhancing robustness of predictive video codecs using a side-channel based on distributed source coding techniques
Lee et al. Layered coded vs. multiple description coded video over error-prone networks
US20030229822A1 (en) Methods and systems for multiple substream unequal error protection and error concealment
Ji et al. Joint source-channel coding and optimization for layered video broadcasting to heterogeneous devices
JP2003318744A (ja) デジタルマルチメディアデータのエラー復元符号化、格納および送信
Parthasarathy et al. Design of a transport coding scheme for high-quality video over ATM networks
US20080025206A1 (en) Data packet processing
JP4732428B2 (ja) 多重記述トランスコーディングのためのトランスコーディング・ノード及びトランスコーディング方法
JP2010505333A (ja) 柔軟な冗長コーディング
Fiandrotti et al. Traffic prioritization of H. 264/SVC video over 802.11 e ad hoc wireless networks
Naghdinezhad et al. A novel adaptive unequal error protection method for scalable video over wireless networks
Shih et al. A new unequal error protection scheme based on FMO
US20130346831A1 (en) Method of generating forward error correction packet and server and client apparatus employing the same
Dumitrescu et al. Unequal erasure protection technique for scalable multistreams
Bajic et al. EZBC video streaming with channel coding and error concealment
Cheng et al. Grace: Loss-resilient real-time video communication using data-scalable autoencoder
Xiao et al. Priority ordering and packetization for scalable video multicast with network coding
Baccaglini et al. A comparison between ULP and MDC with many descriptions for image transmission
Ma et al. A network-aware error-resilient method using prioritized intra refresh for wireless video communications
Xiao et al. A new multiple description layered coding method over ad-hoc network
Parameswaran et al. Adapting quantization offset in multiple description coding for error resilient video transmission
Choupani et al. Unbalanced multiple description wavelet coding for scalable video transmission
Nazir et al. Rate adaptive selective segment assignment for reliable wireless video transmission
Biswas et al. An optimized Multiple Description video codec for lossy packet networks

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20131113

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140903

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141007

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141205

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150210

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150226

R150 Certificate of patent or registration of utility model

Ref document number: 5706144

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250