JP5304539B2 - メディア品質変換装置、メディア品質変換方法およびメディア品質変換プログラム - Google Patents

メディア品質変換装置、メディア品質変換方法およびメディア品質変換プログラム Download PDF

Info

Publication number
JP5304539B2
JP5304539B2 JP2009197380A JP2009197380A JP5304539B2 JP 5304539 B2 JP5304539 B2 JP 5304539B2 JP 2009197380 A JP2009197380 A JP 2009197380A JP 2009197380 A JP2009197380 A JP 2009197380A JP 5304539 B2 JP5304539 B2 JP 5304539B2
Authority
JP
Japan
Prior art keywords
media
media data
layer
discarded
quality conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009197380A
Other languages
English (en)
Other versions
JP2011049895A (ja
Inventor
喜美子 木俣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2009197380A priority Critical patent/JP5304539B2/ja
Publication of JP2011049895A publication Critical patent/JP2011049895A/ja
Application granted granted Critical
Publication of JP5304539B2 publication Critical patent/JP5304539B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

本発明は、符号化されたメディアデータの品質変換に関し、特にスケーラブルコーデックで符号化されたメディアデータからの所望のレイヤのエキストラクト(抽出)処理に関する。
メディア配信サービスにおいて、受信端末性能に応じた映像品質でのメディア配信や、変動するネットワーク帯域に動的に対応した映像品質でのメディア配信を行う場合、かつては1つのコンテンツに対して複数種類の映像品質でエンコード済のデータを用意しておく必要があった。
たとえば映像配信において、受信端末性能として解像度に着目した場合、携帯端末からハイビジョンテレビに至るまで、端末の種類に応じて様々な解像度が要求される。このような場合、かつては携帯端末向けにQVGA画質(Quarter Video Graphics Array、320×240ピクセル)、パーソナルコンピュータ向けにVGA画質(Video Graphics Array、640×480ピクセル)などというように、各々の映像品質でエンコード済のデータをそれぞれ別個に配信サーバ側で用意しておく必要があった。
また、ネットワーク帯域の変動への適応に着目すると、ネットワークの混雑や伝送経路上のノイズなどの理由で利用可能帯域が狭くなったときに、解像度やフレームレートを下げて必要なコンテンツビットレートが小さくすむ品質に落として送信したり、反対に利用可能帯域が広くなったときには上げたりする制御を行う場合、あらかじめ決めておいた映像品質でエンコード済のデータを配信サーバ側でそれぞれ用意しておく必要があった。
この問題を解決するのが、H.264/SVC(Scalable Video Coding)のようなスケーラブルコーデックである。これを利用すれば、配信サーバ側で単一のメディアデータを用意するだけで、受信端末の側で各々の端末種類や利用可能帯域幅に適した映像品質の映像データを取り出すデータ抽出(エキストラクト)処理を行うことができ、これによって携帯端末からハイビジョンテレビに至るまで多くの種類の端末に応じた映像品質に対応することができる。
ところで、スケーラブルコーデックを利用した符号化の場合、複数の階層方法でデータを階層化しているものがある。たとえばH.264/SVCでは、空間スケーラビリティ(解像度)、時間スケーラビリティ(フレームレート)、SNR(Signal to Noise ratio、S/N比)スケーラビリティの3種類の階層方法がある。本発明ではそれぞれの階層を、空間レイヤ、時間レイヤ、SNRレイヤと呼ぶ。
エキストラクト処理を行うために、あるデータがどのレイヤのどの階層に属するかをエンコードデータから読み取る必要がある。たとえば、H.264/SVCでエンコードされた符号化列はNAL(Network Abstruction Layer)ユニットに分割して格納される。H.264/SVCではNALユニットの先頭につけられるNALユニットヘッダが拡張され、拡張NALヘッダが付与される。当該データの各レイヤの値はこの拡張NALヘッダの中に格納されている。
したがって、エキストラクト処理では、エンコードデータの中からNALユニットヘッダ(拡張NALユニットヘッダを含む)を読み出し、それぞれのNALユニットヘッダ中に含まれる各スケーラビリティの値をチェックし、この値に基づいてどのデータが必要であるかを判断して必要なデータを抽出し、不要なデータを破棄する。
これに関連する先行技術として、次の各文献がある。特許文献1には、PID(Packet Identifyer)範囲を計数とするフィルタを直列接続してデジタル放送信号の伝送ブロックを抽出するという技術が記載されている。特許文献2には、遅延時間の調節を容易に行うことを可能とするというスケーラブルコーデックの方法が記載されている。特許文献3および4には、異なるネットワーク環境などで利用可能なスケーラブルコーデックについての既存の技術が記載されている。
特開2004−112316号公報 特開2006−333519号公報 特表2009−508454号公報 特表2009−510966号公報
しかしながら、データ伝送のために利用する下位システムの種類によっては、レイヤを読み出す処理に必要な計算量が過大である場合がある。たとえば、映像配信での伝送システムとして多く使用されるMPEG2(Moving Picture Experts Group phase 2) TS(Transport Stream)をH.264/SVCの下位システムとして使用する場合、NALユニットの区切りを判定するためには、データのビット列の中からスタートコード(0x000001)を検出する必要がある。即ち、NALユニットヘッダを読み出すには、すべてのビット列を検索する必要があるので、この処理にかかる計算量が大きくなる。
MPEG2 TSの仕様によれば、H.264/SVCの3つのスケーラビリティのうち、空間スケーラビリティに関しては、空間レイヤごとにMPEG2 TSのヘッダで指定されるPID(Packet Identifyer)を付与する。したがって、PIDをつかってデータを抽出すれば、空間レイヤの抽出を比較的少ない計算量で行うことができる。PIDを使ったデータの抽出に関する技術としては、たとえば特許文献1に記載の技術がある。
MPEG2 TSではすべてのデータが一列になって伝送される。データの抽出にはランダムに並んだPIDの中から抽出すべきPIDかどうかを毎回チェックする必要がある。特許文献1に記載の技術では、PIDとは別に品質階層を設定し、階層ごとに必要となるPIDをTS内にまとめて配置して、デコード側でのデータ抽出時に処理負荷が軽減されるようにデータを配列したものである。
しかしながら、この技術では、MPEG2 TSのPIDのチェックのみを実施しているため、H.264/SVCの3種類のスケーラビリティのうち空間レイヤの抽出のみにしか対応できず、時間レイヤ、SNRレイヤに対応した抽出ができない。したがって、時間レイヤ、SNRレイヤを抽出するには、そのたびごとにNALユニットヘッダを検索する必要がある。
また、この技術ではピクチャ参照構造の境界を考慮していないため、映像視聴中にネットワーク帯域幅の変動等により動的に品質を変更する場合、ピクチャ参照境界以外の場所で品質変更が行われる可能性がある。ピクチャ参照境界以外の場所で品質が変更されると、受信側でのデコード処理でエラーが発生し、映像に乱れが生じる。
ここで、ピクチャとは1画面を構成するデータをさし、ピクチャ参照構造とはあるピクチャのデコード時に別のピクチャの情報を参照することをいう。たとえばBピクチャのデコードにはIピクチャとPピクチャ(場合によってはほかのBピクチャも)が必要である。なお、ピクチャ参照境界とはその境界を越えてピクチャ参照を行わないという境界を意味する。
また、特許文献2〜4も、スケーラブルコーデックのビットストリームから必要なメディア品質に応じたレイヤを抽出する技術が記載されてはいるが、これらの技術もまたピクチャ参照構造の境界を考慮していないので、上記の問題を解決していない。
本発明の目的は、スケーラブルコーデックを利用したメディア配信サービスで利用可能な、少ない計算量で迅速にレイヤの読み出し処理を行うことを可能とするメディア品質変換装置、メディア品質変換方法およびメディア品質変換プログラムを提供することにある。
上記目的を達成するため、本発明に係るメディア品質変換装置は、ネットワークを通じて伝送される、複数の異なるメディア品質で階層化されたメディアデータ群を含むビットストリームの中から、必要な階層のメディアデータを抽出して再生装置に出力するメディア品質変換装置であって、ビットストリームの中からメディアデータ群の先頭であるメディア境界を検出するメディア境界検出部と、再生装置で再生可能なメディア品質に基づいてメディアデータ群のうちいずれの階層に属するメディアデータを抽出するかを選択する抽出選択部と、メディアデータ群のうちいずれの階層に属するメディアデータを破棄すべきかを記憶する破棄対象データベースと、メディア境界が検出された場合にのみ、ビットストリームに含まれる個々のメディアデータ群の属する各々の階層に対して当該階層に属するメディアデータを破棄すべきか否かを判定してその判定結果を破棄対象データベースに記憶し、メディア境界が検出されない場合には当該メディアデータ群がどのレイヤに属するかの判定を省略する破棄判定部と、破棄対象データベースに記憶された内容に基づいて破棄すべき階層に属するメディアデータを破棄してその他のメディアデータを再生装置に出力するデータ破棄部とを備えることを特徴とする。
上記目的を達成するため、本発明に係るメディア品質変換方法は、ネットワークを通じて伝送される、複数の異なるメディア品質で階層化されたメディアデータ群を含むビットストリームの中から、必要な階層のメディアデータを抽出して再生装置に出力するメディア品質変換方法であって、ビットストリームの中からある一定条件のメディアデータ群の先頭であるメディア境界を検出し、再生装置で再生可能なメディア品質に基づいてメディアデータ群のうちいずれの階層に属するメディアデータを抽出するかを選択し、メディア境界が検出された場合にのみ、ビットストリームに含まれる個々のメディアデータ群の属する各々の階層に対して当該階層に属するメディアデータを破棄すべきか否かを判定してその判定結果を予め備えられた破棄対象データベースに記憶すると共にメディア境界が検出されない場合には当該メディアデータ群がどのレイヤに属するかの判定を省略し、破棄対象データベースに記憶された内容に基づいて破棄すべき階層に属するメディアデータを破棄してその他のメディアデータを再生装置に出力することを特徴とする。
上記目的を達成するため、本発明に係るメディア品質変換プログラムは、ネットワークを通じて伝送される、複数の異なるメディア品質で階層化されたメディアデータ群を含むビットストリームの中から、必要な階層のメディアデータを抽出して再生装置に出力するメディア品質変換装置にあって、メディア品質変換装置が備えるコンピュータに、ビットストリームの中からある一定条件のメディアデータ群の先頭であるメディア境界を検出する処理と、再生装置で再生可能なメディア品質に基づいてメディアデータ群のうちいずれの階層に属するメディアデータを抽出するかを選択する処理と、メディア境界が検出された場合にのみ、ビットストリームに含まれる個々のメディアデータ群の属する各々の階層に対して当該階層に属するメディアデータを破棄すべきか否かを判定してその判定結果を予め備えられた破棄対象データベースに記憶すると共にメディア境界が検出されない場合には当該メディアデータ群がどのレイヤに属するかの判定を省略する処理と、破棄対象データベースに記憶された内容に基づいて破棄すべき階層に属するメディアデータを破棄してその他のメディアデータを再生装置に出力する処理とを実行させることを特徴とする。
本発明は上述したように、メディア境界が検出された場合にのみ各々の階層に対して破棄すべきか否かを判定するように構成したので、レイヤの読み出し処理にかかる計算量を大幅に削減することができる。これによって、スケーラブルコーデックを利用したメディア配信サービスで利用可能な、少ない計算量で迅速にレイヤの読み出し処理を行うことが可能であるという、優れた特徴を持つメディア品質変換装置、メディア品質変換方法およびメディア品質変換プログラムを提供することができる。
図2で示したユーザPCの構成を示す説明図である。 本発明の第1の実施形態に係る映像配信システムの構成を示す説明図である。 図1に示した品質変換手段が実行する、MPEG2 TSデータから各レイヤの構成情報を読み出す動作を示すフローチャートである。 図3のステップS101〜102で品質変換手段が映像データストリームから取得するPATおよびPMTの情報の内容について示す説明図である。 図1で示した破棄対象レイヤ情報DBの記憶内容についてさらに説明する説明図である。 図3のステップS104で示した、品質変換手段が行う時間レイヤの抽出処理の詳細について示すフローチャートである。 図6の続きである。 本発明の第2の実施形態に係るユーザPCの構成を示す説明図である。 図8に示した品質変換手段が実行する、MPEG2 TSデータから各レイヤの構成情報を読み出す動作を示すフローチャートである。 本発明の第3の実施形態に係る映像配信システムの構成を示す説明図である。
(第1の実施形態)
以下、本発明の第1の実施形態の構成について添付図1〜3に基づいて説明する。
最初に、本実施形態の基本的な内容について説明し、その後でより具体的な内容について説明する。
本実施形態に係るメディア品質変換装置(ユーザPC10の品質変換手段20)は、ネットワークを通じて伝送される、複数の異なるメディア品質で階層化されたメディアデータ群を含むビットストリームの中から、必要な階層のメディアデータを抽出して再生装置(ユーザPC10の再生手段40)に出力するメディア品質変換装置であって、ビットストリームの中からメディアデータ群の先頭であるメディア境界を検出するメディア境界検出部(ピクチャ境界検出部21)と、再生装置で再生可能なメディア品質に基づいてメディアデータ群のうちいずれの階層に属するメディアデータを抽出するかを選択する抽出選択部(レイヤ選択部28)と、メディアデータ群のうちいずれの階層に属するメディアデータを破棄すべきかを記憶する破棄対象データベース(破棄対象レイヤ情報DB31)と、メディア境界が検出された場合に、ビットストリームに含まれる個々のメディアデータ群の属する各々の階層に対して当該階層に属するメディアデータを破棄すべきか否かを判定してその判定結果を破棄対象データベースに記憶する破棄判定部24と、破棄対象データベースに記憶された内容に基づいて破棄すべき階層に属するメディアデータを破棄してその他のメディアデータを前記装置に出力するデータ破棄部25とを備える。
また、メディアデータ群に含まれる複数の前記メディアデータ間の前後間で通常存在する相互参照関係が当該部分を境として無関係となる部分を検出する参照関係リセット判定部(IDR検出部22)と、該部分で抽出選択部で選択された破棄対象となるレイヤが変更されたか否かを判定する破棄対象決定部(破棄対象レイヤ決定部26)と、破棄対象となるレイヤが変更された場合に破棄対象データベースの内容を更新する破棄対象設定変更部(破棄対象レイヤ設定変更部23)とを備える。
ここでいうメディアデータ群は、映像に関するメディアデータ群である。そして、メディア境界検出部は、同一時間に表示されるべきメディアデータ群の先頭を判定する。
この構成を備えることにより、本実施形態に係るメディア品質変換装置は、少ない計算量で迅速にレイヤの読み出し処理を行うことが可能となる。
以下、これをより詳細に説明する。
図2は、本発明の第1の実施形態に係る映像配信システム1の構成を示す説明図である。映像配信システム1は、メディア品質変換装置であり再生装置でもあるユーザPC(Personal Computer)10と映像配信サーバ50とがインターネット60を介して相互に接続されて構成される。映像配信サーバ50は映像データストリームを送出し、ユーザPC10はこの映像データストリームをインターネット60を介して受信して、品質変換手段20を通じて映像品質をユーザPC10に適したものに変換して、再生手段40で再生する。
図1は、図2で示したユーザPC10の構成を示す説明図である。ユーザPC10は通常のコンピュータ装置であり、コンピュータプログラムを実行する主体となるプロセッサ11と、コンピュータプログラムおよびデータを記憶する記憶手段12と、データの入出力を行う入出力手段13と、インターネット60を介して他のコンピュータ装置とのデータ通信を行う通信手段14とを備える。
ここでいう再生装置は、ユーザPC10でなくても、たとえば携帯電話やゲーム機などのような可搬型の小型端末でもよいし、また品質変換手段20および再生手段40がコンピュータプログラムではなくハードウェアによって実現されるようにしてもよい。さらに、再生手段40を品質変換手段20とは物理的に別個の装置としてもよい。
プロセッサ11で実行されるコンピュータプログラムである品質変換手段20は、ピクチャ境界検出部21、IDR(Instantaneous Decoding Refresh、デコーダ復号動作の瞬時リフレッシュ)検出部22、破棄対象レイヤ設定変更部23、破棄判定部24、データ破棄部25、破棄対象レイヤ決定部26、利用可能帯域計測部27、レイヤ選択部28といった各々の機能手段を備える。これらの各部の動作については後述する。
品質変換手段20から出力された映像データストリームを入出力手段13に表示して再生する、たとえばWindows Media Player(登録商標)やRealPlayer(登録商標)などのような再生手段40もまた、コンピュータプログラムとしてプロセッサ11で実行される。さらに、記憶手段12には後述する破棄対象レイヤ情報DB(データベース)31が記憶されている。
品質変換手段20には、インターネット60からMPEG2 TS方式でパケット化されたH.264/SVCストリームがTSパケットの形で入力される。なお、データストリームがユーザPC10の品質変換手段20に入力される以前に、MPEG2 TSのPID情報を用いて、不要な空間レイヤをあらかじめ破棄する手段を設けることもできるが、これは本発明の範囲ではない。
ピクチャ境界検出部21は、入力されたTSパケットのH.264/SVCデータにピクチャとピクチャの境界が存在するか否かを検出する。ここで、1ピクチャとは、画像の表示時刻情報が同一なデータを指すこととする。したがって、ここでのピクチャはH.264/SVC符号化方式でのIピクチャ、Pピクチャ、Bピクチャのどの種類のピクチャでもよい。ピクチャ境界が存在する場合はIDR検出部22へ、存在しない場合は破棄判定部24へデータを出力する。
IDR検出部22は、ピクチャ境界検出部21で検出されたピクチャ境界がIDR境界であるか否かを検出する。IDR境界である場合には、破棄対象レイヤ設定変更部23が破棄対象レイヤ決定部26を参照し、破棄対象レイヤ情報が変更されている場合は、破棄対象レイヤ情報DB31の内容を変更する。IDR境界でない場合、破棄対象レイヤ情報が変更されていない場合は破棄判定部24にデータを出力する。IDR境界の意味については後述する。
破棄判定部24は、破棄対象レイヤ情報DB31の内容を参照し、当該データの破棄を行うかどうかを判定する。判定結果とともにデータ破棄部25へデータを出力する。データ破棄部25は、破棄判定部24での判定結果をもとにデータの破棄を行う。レイヤ選択部28は、再生手段40で再生可能な画質などに応じて映像データストリームの中で利用するレイヤを決定する。
次に品質変換手段20の動作について説明する。品質変換手段20が映像品質の変換を始めるに当たって、そのシステムでの各レイヤの構成を把握する必要がある。各レイヤの構成は、ユーザがユーザPC10に入力してもよいが、ユーザPC10が受信したMPEG2 TSデータから自動的に読み出すようにしてもよい。ここでは後者の方法を説明する。
図3は、図1に示した品質変換手段20が実行する、MPEG2 TSデータから各レイヤの構成情報を読み出す動作を示すフローチャートである。品質変換手段20は、インターネット60からMPEG2 TSデータである映像データストリームを受信し、TSデータの中からPID=0であるTSパケットを取得する(ステップS101)。PID=0であるTSパケットはPAT(Program Association Table)と呼ばれ、PMT(Program Map Table)のPIDを含んでおり、TSストリーム中にどのようなプログラム(番組)があるかを示す。
品質変換手段20はさらに、ステップS101で取得したPATの情報をもとに、映像データストリームからPMTを取得する(ステップS102)。図4は、図3のステップS101〜102で品質変換手段20が映像データストリームから取得するPATおよびPMTの情報の内容について示す説明図である。
ステップS101の処理で取得されるPAT51は、TSストリーム中のPMT51aとPID51bとの間の対応を示す。ステップS102の処理で取得されるPMT52は、各々のPID52aに対応するディペンデンシーID(dependency_id)52bと、当該映像の解像度52c(pixel×pixel)、平均ビットレート52d、最高ビットレート52e、テンポラルIDの開始点52fと終了点52gの各データを含む。
前述のように、H.264/SVCでは空間レイヤごとにPIDが異なる。したがって、PIDと空間レイヤは一対一に対応する。H.264/SVCの仕様により、空間レイヤはディペンデンシーID52bによって識別可能である。また、SVC拡張ディスクリプタには、当該映像の解像度52c、平均ビットレート52d、最高ビットレート52eなどのような情報が含まれている。さらに、時間レイヤの階層数は、テンポラルIDの開始点52fと終了点52gの差によって示される。
品質変換手段20は、取得したPMTから、そのプログラム中に含まれる各エレメンタリーストリーム(音声・映像などのデータ)の種類やTSパケットのPIDを読み取る(ステップS103)。H.264/SVCの場合は、図4に示したように、PMT内のSVC拡張ディスクリプタ(SVC extension descriptor)が、SVCでのレイヤとPIDとの間の対応を示している。
上述のステップS101〜103の処理と並行して、再生手段40で再生可能な画質などに基づいて、この映像データストリームの中で再生に使用するレイヤをレイヤ選択部28が選択する(ステップS106)。
その後品質変換手段20は、エキストラクト処理を行って、ステップS106で選択されたレイヤを抽出する(ステップS104)。エキストラクト処理は、空間レイヤ、時間レイヤ、SNRレイヤの3つのレイヤでそれぞれ行うことができるが、本実施形態では時間レイヤの抽出を行う。
空間レイヤの抽出は前述のようにPID51bに基づいて可能である。また、SNRレイヤの抽出は、H.264/SVCのデータが格納されているNALユニット中のNALユニットヘッダを参照して行うことができる。ここでは、あらかじめ空間レイヤの抽出はPIDによってなされたあとであり、不要な空間レイヤは既に排除されてからデータストリームが品質変換手段20に入力されているものとする。さらに、SNRレイヤの抽出は時間レイヤの抽出後に行われるものとする。
図5は、図1で示した破棄対象レイヤ情報DB31の記憶内容についてさらに説明する説明図である。破棄対象レイヤ情報DB31には、各々のレイヤのPID31aと、該レイヤが破棄対象であるか否かを示す破棄フラグ31b、および該レイヤの中で破棄すべきテンポラルID31cとが対応づけられて記憶されている。破棄フラグ31bは1(=破棄すべき)と0(=破棄すべきでない)の2値を持つデータである。破棄すべきテンポラルID31cについては後述する。
図6〜7は、図3のステップS104で示した、品質変換手段20が行う時間レイヤの抽出処理の詳細について示すフローチャートである。紙面の錯綜を回避するため、ここでは2枚に分けてフローチャートを描いている。処理フローへのデータがピクチャ境界検出部21に、MPEG2 TSのTSパケットの形で入力される。ここで、当該パケットのPIDが読み出されていない場合は、PIDの読み出しを行う。入力されるMPEG2 TSパケットはパケットの欠落はなく、順番通りに入力されるものとする。
この入力されたTSパケット内に、PES(Packetized Elementary Stream)ヘッダが存在するかどうかをピクチャ境界検出部21が確認する(ステップS201)。TSヘッダのPayload_unit_start_indicatorが1であれば、当該TSパケットにPES先頭が入っていることを意味するので、ピクチャ境界検出部21はこれを確認する。
ここで、PESパケットとはMPEG2 TSシステムにおいて、符号化された映像データ(ES:Elementary Stream)を一定のまとまりでパケット化したものであり、PESパケットの先頭には必ずPESヘッダが付く。ESがH.264/SVCの符号化ストリームの場合、1つのピクチャは1つ以上のPESパケットに分割される。PESの先頭はピクチャの先頭でない場合もあるが、ピクチャの先頭は必ずPESパケットの先頭になる。
PESヘッダが存在する場合は、ピクチャ境界検出部21がPESの先頭を読み出し(ステップS202)、さらに当該PESがピクチャの先頭であるか否かをピクチャ境界検出部21が確認する(ステップS203)。ピクチャの先頭であるか否かはPESパケットヘッダ内のPTS(Presentation Time Stamp)またはDTS(Decoding Time Stamp)の値で判断できる。PTSやDTSが前のPESパケットのそれらと同じであれば先頭ではなく、異なっていればピクチャの先頭である。
前述のように、品質変換手段20はここでは時間レイヤを抽出する。同一ピクチャ内では必ず同一の時間レイヤであるので、ピクチャの先頭で、当該ピクチャは抽出すべきレイヤか破棄すべきレイヤかを判断すれば、次のピクチャの先頭が来るまでの間は抽出/破棄のどちらを行うかを判断する必要はない。そこで、破棄対象レイヤ情報DB31で、ピクチャ先頭での判断が抽出すべきレイヤのピクチャであれば破棄フラグ31bを0(=破棄しない)にし、破棄すべきピクチャであれば破棄フラグ31bを1(=破棄する)にする。
入力されたTSパケットがピクチャ先頭を含んだパケットである場合、IDR検出部22が破棄対象レイヤ情報DB31の当該PID31aの破棄フラグ31bを0(=破棄しない)に設定する(ステップS211)。なお、後述するステップS214での処理(抽出すべき時間レイヤか)で抽出すべき時間レイヤである場合に、破棄フラグ31bを0に設定する処理を追加するのであれば、ステップS211の処理は省略可能である。
IDR検出部22は次に、当該ピクチャがIDRピクチャであるかどうかを確認する(ステップS212)。IDRピクチャとは、H.264/SVCのI、P、Bピクチャの相互参照状態の情報がリセットされ、その前後間で無関係となるピクチャである。したがって、破棄すべきレイヤを変更する場合はIDRピクチャの境界で変更しないと、デコードの際参照しているピクチャが存在しないといった状況が発生し、映像の乱れにつながる。
ステップS212でIDRピクチャであった場合、図7に飛んで、破棄対象レイヤ決定部26が、破棄すべきレイヤの変更があるか否かをレイヤ選択部28に問い合わせる(ステップS221)。破棄すべきレイヤに変更がある場合(ステップS222:YES)には、破棄対象レイヤ設定変更部23が、その内容に基づいて破棄対象レイヤ情報DB31の破棄すべきテンポラルID31cの内容を更新する(ステップS223)。破棄すべきテンポラルID31cは、PID31aに対してどのテンポラルIDを破棄するかを示すものである。破棄すべきテンポラルID31cのデータは空欄である場合もありうるし、また複数のテンポラルIDを含む場合もありうる。
図4のPMT52で示した例では、各々のPID52aは、たとえばQQVGA(Quarter Quarter Video Graphics Array、160×120ピクセル)、QVGA(320×240ピクセル)、VGA(640×480ピクセル)などのような映像の解像度52cに対応している。これに対してテンポラルID52fおよび52gは0〜3の4レベルあり、このテンポラルID0〜3がそれぞれ3.25fps(Frame Per Second)、7.5fps、15fps、30fpsという動画の滑らかさを示す各レイヤに対応している。
このとき、PID52a=100であるQQVGAの映像のみ30fpsを抽出し、PID52a=101のQVGA、PID52a=102のVGAは15fpsまでを抽出するものとすると、図5に示されているようにPID52a=100の場合は破棄すべきテンポラルID31cは存在せず、PID52a=101もしくは102の場合は破棄すべきテンポラルID31cは3(レイヤ3)のみである。
ステップS223に示した破棄対象レイヤ情報DB31の更新後、ステップS214の処理へ進む。また、ステップS222で破棄すべきレイヤに変更がない場合は、やはりステップS214の処理へ進む。
一方、ステップS212でIDRピクチャでない場合は、そのピクチャが破棄すべき時間レイヤのピクチャかどうか判断するため、破棄対象レイヤ設定変更部23が、PESパケットの先頭に入っているNALユニットヘッダ内のSVC拡張ヘッダから当該ピクチャがどの時間レイヤに属するかを示すテンポラルIDを読み出す(ステップS213)。そしてこのテンポラルIDが、破棄すべきレイヤのデータに該当するか否かを破棄対象レイヤ設定変更部23が確認する(ステップS214)。
ステップS214で破棄すべき時間レイヤのデータだった場合は、破棄対象レイヤ設定変更部23が破棄対象レイヤ情報DB31の当該PID31aの破棄フラグ31bを1(=破棄する)に変更し(ステップS215)、ステップS205のデータ破棄の処理へ進む。
ステップS214で破棄しない時間レイヤのデータだった場合は、当該パケットは必要なデータなので、時間レイヤの抽出処理を終了し、これに続くSNRレイヤの抽出などの処理に進む(ステップS216)。本発明ではこの後の処理には特に言及しない。なお、抽出されたデータはMPEG2 TSデータとして再構成され、品質変換手段20から再生手段40に出力される。
また、ステップS201で当該TSパケット中にPESパケットの先頭が存在しない場合、およびステップS203で当該データがピクチャの先頭ではない場合には、破棄判定部24が破棄対象レイヤ情報DB31を参照して当該PID31aの破棄フラグ31bが1(=破棄する)であるかどうかを確認し(ステップS204)、その破棄フラグ31bが1であればデータ破棄部25がそのPID31aに該当するTSパケットを破棄する(ステップS205)。破棄フラグ31bが0であれば(ステップS204:NO)、このTSパケットは抽出すべきデータであるので、破棄せずに出力して次の処理へ進む(ステップS216)。
(第1の実施形態の全体的な動作)
次に、上記の実施形態の全体的な動作について説明する。本実施形態に係るメディア品質変換方法は、ネットワークを通じて伝送される、複数の異なるメディア品質で階層化されたメディアデータ群を含むビットストリームの中から、必要な階層のメディアデータを抽出するメディア品質変換方法であって、ビットストリームの中からある一定条件のメディアデータ群の先頭であるメディア境界を検出し(図6:ステップS201〜203)、再生装置で再生可能なメディア品質に基づいてメディアデータ群のうちいずれの階層に属するメディアデータを抽出するかを選択し、メディア境界が検出された場合にのみ、ビットストリームに含まれる個々のメディアデータ群の属する各々の階層に対して当該階層に属するメディアデータを破棄すべきか否かを判定してその判定結果を予め備えられた破棄対象データベースに記憶し(図6:ステップS213〜214)、破棄対象データベースに記憶された内容に基づいて破棄すべき階層に属するメディアデータを破棄してその他のメディアデータを再生装置に出力する(図6:ステップS204〜205)。
そして、メディアデータ群に含まれる複数のメディアデータの前後間で通常存在する相互参照関係が当該部分を境として無関係となる部分を検出し(図6:ステップS212)、該部分で破棄対象となるレイヤが変更されたか否かを判定し(図7:ステップS221〜222)、破棄対象となるレイヤが変更された場合に破棄対象データベースの内容を更新する(図7:ステップS223)。
ここで、上記各動作ステップについては、これをコンピュータで実行可能にプログラム化し、これらを前記各ステップを直接実行するコンピュータであるユーザPC10に実行させるようにしてもよい。
この構成および動作により、本実施形態は以下のような効果を奏する。
本実施形態に係るメディア品質変換装置は、ある一定条件のメディアデータ群(映像や音声など)の先頭でのみ当該データ群が所望のレイヤに属するデータかどうかを判定し、データ群の先頭以外のデータの処理時には当該データがどのレイヤに属するかを判定しない。このため、レイヤの読み出し処理にかかる計算量を大幅に削減し、この処理を迅速に行うことが可能である。
またこのメディア品質変換装置は、図6〜7のステップS221〜223で示したように、メディアデータの参照関係がリセットされた場合にのみ、いずれのレイヤを抽出するかという抽出条件を変更する。このため、運用中のシステムにおいて各スケーラビリティを動的に変更した場合であっても、抽出条件はピクチャ参照境界においてのみ変更されるので、デコードエラーが発生することはない。
(第1の実施形態の拡張)
上記で説明した第1の実施形態では、空間レイヤ、時間レイヤ、SNRレイヤの順にエキストラクト処理を行う例を述べたが、空間レイヤのエキストラクト処理を時間レイヤのエキストラクト処理と同時に行ってもよい。
すなわち、図6〜7に示した処理で、品質変換手段20にすべての受信MPEG2 TSパケットが入力され、図6のステップS201で各パケットのTSヘッダを確認する際に、PIDも同時に確認するようにする。このPIDが破棄対象レイヤ情報DB31の破棄すべきテンポラルID31cに該当していれば、破棄すべき空間レイヤであるので、即座にステップS205に飛んでパケットを破棄する。そうでない場合は、ステップS216に飛んで時間レイヤ抽出に必要な次の処理へ進む。
このようにすることで、前述の第1の実施形態では空間レイヤのエキストラクト処理時と時間レイヤのエキストラクト処理時にそれぞれ1度ずつ、計2回TSヘッダの読み出しを行っていたものを、1回の読み出しで済ませることができるので、さらなる処理の簡略化につなげることができる。
(第2の実施形態)
本発明の第2の実施形態では、前述の第1の実施形態に係るメディア品質変換装置に、ビットストリームの伝送に利用可能なネットワーク(インターネット60)の帯域幅を測定する利用可能帯域測定部327を追加し、抽出選択部は再生装置で再生可能なメディア品質およびこの帯域幅の測定結果に基づいてメディアデータ群のうちいずれの階層に属するメディアデータを抽出するかを選択する構成としている。
図8は、本実施形態に係るメディア品質変換装置であり再生装置でもあるユーザPC310の構成を示す説明図である。ユーザPC310は、前述の第1の実施形態に係るユーザPC10と同一のハードウェア構成を備える。そして、ユーザPC310のプロセッサ11で動作する品質変換手段320は、前述の第1の実施形態に係る品質変換手段20に、さらに利用可能帯域計測部327を追加した構成となっている。
利用可能帯域計測部327は、インターネット60で映像データストリームの伝送に利用可能な帯域幅を測定する機能を持つ。そしてレイヤ選択部28は、その利用可能な帯域幅の測定結果と、再生手段40で再生可能な画質などに応じて、映像データストリームの中で利用するレイヤを決定する。これ以外の構成および各部の機能は、前述の第1の実施形態に係るユーザPC10の構成と同一であるので、名称および参照番号を同一とする。
図9は、図8に示した品質変換手段320が実行する、MPEG2 TSデータから各レイヤの構成情報を読み出す動作を示すフローチャートである。この動作は、図3で示した品質変換手段20が行う動作のステップS101〜103と並行して、利用可能帯域計測部327が入力された映像データストリームの伝送に利用可能なインターネット60の帯域幅を測定する(ステップS405)動作を付加し、その後でステップS106の再生レイヤの選択を行うようにしている。
これによって、たとえばネットワークの混雑や伝送経路上のノイズなどの原因で利用可能帯域が狭くなった場合にも、その状態に適した画質のデータをデータストリームから抽出して再生することができる。
(第3の実施形態)
本発明の第3の実施形態では、メディア品質変換装置および再生装置を物理的に別個の装置とし、複数のネットワーク間の接続部にこのメディア品質変換装置を設置するようにしている。
図10は、本発明の第3の実施形態に係る映像配信システム501の構成を示す説明図である。映像配信システム501は、第1のネットワーク502と第2のネットワーク503が接続されて構成され、その第1のネットワーク502と第2のネットワーク503との間の接続点にメディア品質変換装置520が設置されている。第1のネットワーク502には映像配信サーバ550が接続され、第2のネットワークには再生装置540が接続されている。映像配信サーバ550が送信するビットストリームを、再生装置540が再生する。
たとえば第1のネットワーク502が一般的なインターネットで、第2のネットワーク503が携帯端末の公衆無線通信網である場合などのように、複数のネットワークの間で伝送および再生が可能なメディアデータの品質が異なる場合がある。その場合、映像配信サーバ550が送信するビットストリームのうち、第2のネットワーク503で伝送できない、もしくは第2のネットワーク503に属する再生装置540で再生できない高品質のレイヤに属するデータは必要ではない場合がある。
その場合に、メディア品質変換装置520は映像配信サーバ550から受信したビットストリームの、第2のネットワーク503で必要とされない品質のレイヤのデータをあらかじめ破棄してから、その処理済みのデータストリームを改めて第2のネットワーク503に流し、再生装置540はこれを受信して再生する。ここでメディア品質変換装置520が行う動作は、第1の実施形態で説明した品質変換手段20の動作と同一である。また、映像配信サーバ550および再生装置540の動作も、第1の実施形態で説明した映像配信サーバ50および再生手段40の動作と同一である。
さらに、映像配信サーバ550と第1のネットワーク502の間にメディア品質変換装置520を設けて、映像配信サーバ550から送信されるビットストリームを直接メディア品質変換装置520に入力して、第1のネットワーク502で必要とされない品質のレイヤのデータをあらかじめ破棄してから、処理済みのデータストリームを第1および第2のネットワーク502および503に流すようにしてもよい。これは、映像配信サーバ550が持つ映像データがネットワークでの配信に向かない高画質の映像データである場合に、これをメディア品質変換装置520によって配信可能なデータに変換してから配信するという用途で利用可能である。
これまで本発明について図面に示した特定の実施形態をもって説明してきたが、本発明は図面に示した実施形態に限定されるものではなく、本発明の効果を奏する限り、これまで知られたいかなる構成であっても採用することができる。
本発明は、スケーラブルコーデックを利用した映像や音声などのメディア配信において利用できる。
1、501 映像配信システム
10、310 ユーザPC
11 プロセッサ
12 記憶手段
13 入出力手段
14 通信手段
20、320 品質変換手段
21 ピクチャ境界検出部
22 IDR検出部
23 破棄対象レイヤ設定変更部
24 破棄判定部
25 データ破棄部
26 破棄対象レイヤ決定部
28 レイヤ選択部
31 破棄対象レイヤ情報DB
40 再生手段
50、550 映像配信サーバ
51 PAT
60 インターネット
327 利用可能帯域計測部
502 第1のネットワーク
503 第2のネットワーク
520 メディア品質変換装置
540 再生装置

Claims (9)

  1. ネットワークを通じて伝送される、複数の異なるメディア品質で階層化されたメディアデータ群を含むビットストリームの中から、必要な階層のメディアデータを抽出して再生装置に出力するメディア品質変換装置であって、
    前記ビットストリームの中から前記メディアデータ群の先頭であるメディア境界を検出するメディア境界検出部と、
    前記再生装置で再生可能なメディア品質に基づいて前記メディアデータ群のうちいずれの階層に属するメディアデータを抽出するかを選択する抽出選択部と、
    前記メディアデータ群のうちいずれの階層に属するメディアデータを破棄すべきかを記憶する破棄対象データベースと、
    前記メディア境界が検出された場合にのみ、前記ビットストリームに含まれる個々の前記メディアデータ群の属する各々の階層に対して当該階層に属するメディアデータを破棄すべきか否かを判定してその判定結果を前記破棄対象データベースに記憶し、前記メディア境界が検出されない場合には当該メディアデータ群がどのレイヤに属するかの判定を省略する破棄判定部と、
    前記破棄対象データベースに記憶された内容に基づいて前記破棄すべき階層に属するメディアデータを破棄してその他の前記メディアデータを前記再生装置に出力するデータ破棄部と
    を備えることを特徴とするメディア品質変換装置。
  2. 前記メディアデータ群に含まれる複数の前記メディアデータの前後間で通常存在する相互参照関係が当該部分を境として無関係となる部分を検出する参照関係リセット判定部と、
    該部分で前記抽出選択部で選択された破棄対象となるレイヤが変更されたか否かを判定する破棄対象決定部と、
    前記破棄対象となるレイヤが変更された場合に前記破棄対象データベースの内容を更新する破棄対象設定変更部と
    を備えることを特徴とする、請求項1に記載のメディア品質変換装置。
  3. 前記メディアデータ群が、映像に関するメディアデータ群であることを特徴とする、請求項1もしくは請求項2に記載のメディア品質変換装置。
  4. 前記メディア境界検出部が、同一時間に同時に表示されるべきメディアデータ群の先頭を検出することを特徴とする、請求項1ないし3のうちいずれか一項に記載のメディア品質変換装置。
  5. 前記ビットストリームの伝送に利用可能な前記ネットワークの帯域幅を測定する利用可能帯域測定部を有し、
    前記抽出選択部が前記再生装置で再生可能なメディア品質および前記帯域幅の測定結果に基づいて前記メディアデータ群のうちいずれの階層に属するメディアデータを抽出するかを選択することを特徴とする、請求項1ないし4のうちいずれか一項に記載のメディア品質変換装置。
  6. ネットワークを通じて伝送される、複数の異なるメディア品質で階層化されたメディアデータ群を含むビットストリームの中から、必要な階層のメディアデータを抽出して再生装置に出力するメディア品質変換方法であって、
    前記ビットストリームの中からある一定条件のメディアデータ群の先頭であるメディア境界を検出し、
    前記再生装置で再生可能なメディア品質に基づいて前記メディアデータ群のうちいずれの階層に属するメディアデータを抽出するかを選択し、
    前記メディア境界が検出された場合にのみ、前記ビットストリームに含まれる個々の前記メディアデータ群の属する各々の階層に対して当該階層に属するメディアデータを破棄すべきか否かを判定してその判定結果を予め備えられた破棄対象データベースに記憶すると共に前記メディア境界が検出されない場合には当該メディアデータ群がどのレイヤに属するかの判定を省略し、
    前記破棄対象データベースに記憶された内容に基づいて前記破棄すべき階層に属するメディアデータを破棄してその他の前記メディアデータを前記再生装置に出力することを特徴とするメディア品質変換方法。
  7. 前記メディアデータ群に含まれる複数の前記メディアデータの前後間で通常存在する相互参照関係が無関係となる部分を検出し、
    該部分で前記破棄対象となるレイヤが変更されたか否かを判定し、
    前記破棄対象となるレイヤが変更された場合に前記破棄対象データベースの内容を更新することを特徴とする、請求項6に記載のメディア品質変換方法。
  8. ネットワークを通じて伝送される、複数の異なるメディア品質で階層化されたメディアデータ群を含むビットストリームの中から、必要な階層のメディアデータを抽出して再生装置に出力するメディア品質変換装置にあって、
    前記メディア品質変換装置が備えるコンピュータに、
    前記ビットストリームの中からある一定条件のメディアデータ群の先頭であるメディア境界を検出する処理と、
    前記再生装置で再生可能なメディア品質に基づいて前記メディアデータ群のうちいずれの階層に属するメディアデータを抽出するかを選択する処理と、
    前記メディア境界が検出された場合にのみ、前記ビットストリームに含まれる個々の前記メディアデータ群の属する各々の階層に対して当該階層に属するメディアデータを破棄すべきか否かを判定してその判定結果を予め備えられた破棄対象データベースに記憶すると共に前記メディア境界が検出されない場合には当該メディアデータ群がどのレイヤに属するかの判定を省略する処理と、
    前記破棄対象データベースに記憶された内容に基づいて前記破棄すべき階層に属するメディアデータを破棄してその他の前記メディアデータを前記再生装置に出力する処理と
    を実行させることを特徴とするメディア品質変換プログラム。
  9. 前記メディア品質変換装置が備えるコンピュータに、
    前記メディアデータ群に含まれる複数の前記メディアデータの前後間で通常存在する相互参照関係が無関係となる部分を検出する処理と、
    該部分で前記破棄対象となるレイヤが変更されたか否かを判定する処理と、
    前記破棄対象となるレイヤが変更された場合に前記破棄対象データベースの内容を更新する処理とを実行させることを特徴とする、請求項8に記載のメディア品質変換プログラム。
JP2009197380A 2009-08-27 2009-08-27 メディア品質変換装置、メディア品質変換方法およびメディア品質変換プログラム Expired - Fee Related JP5304539B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009197380A JP5304539B2 (ja) 2009-08-27 2009-08-27 メディア品質変換装置、メディア品質変換方法およびメディア品質変換プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009197380A JP5304539B2 (ja) 2009-08-27 2009-08-27 メディア品質変換装置、メディア品質変換方法およびメディア品質変換プログラム

Publications (2)

Publication Number Publication Date
JP2011049895A JP2011049895A (ja) 2011-03-10
JP5304539B2 true JP5304539B2 (ja) 2013-10-02

Family

ID=43835768

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009197380A Expired - Fee Related JP5304539B2 (ja) 2009-08-27 2009-08-27 メディア品質変換装置、メディア品質変換方法およびメディア品質変換プログラム

Country Status (1)

Country Link
JP (1) JP5304539B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014003359A (ja) * 2012-06-15 2014-01-09 Samsung Electronics Co Ltd 映像データをストリーム型データ転送するために用いられるデータ転送システム及びデータ転送システムに用いられる送信装置、受信装置及びプログラム
WO2014057896A1 (ja) * 2012-10-09 2014-04-17 シャープ株式会社 コンテンツ送信装置、コンテンツ再生装置、コンテンツ配信システム、コンテンツ送信装置の制御方法、コンテンツ再生装置の制御方法、制御プログラムおよび記録媒体
JP2016178356A (ja) * 2015-03-18 2016-10-06 株式会社リコー 通信装置、通信システム、受信制御方法およびプログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001045098A (ja) * 1999-05-26 2001-02-16 Canon Inc データ通信システム、データ通信装置、データ通信方法及び記憶媒体
JP4962119B2 (ja) * 2007-04-27 2012-06-27 パナソニック株式会社 デジタル放送受信機

Also Published As

Publication number Publication date
JP2011049895A (ja) 2011-03-10

Similar Documents

Publication Publication Date Title
US7725593B2 (en) Scalable video coding (SVC) file format
CN101960844A (zh) 应用加强轨道
JP6708271B2 (ja) 情報処理装置、コンテンツ要求方法およびコンピュータプログラム
JP2008160837A (ja) プレビュー機能を有するマルチメディアデータのエンコーディング/デコーディング方法及び装置
JP2019110542A (ja) サーバ装置、クライアント装置、コンテンツ配信方法およびコンピュータプログラム
US20130291031A1 (en) Systems and Methods for Adaptive Streaming with Augmented Video Stream Transitions Using a Media Server
US20070201819A1 (en) Apparatus and method for variable speed playback of digital broadcasting stream
JP5304539B2 (ja) メディア品質変換装置、メディア品質変換方法およびメディア品質変換プログラム
US20070274675A1 (en) Method and Apparatus for Transcoding Digital Audio/Video Streams
KR101731829B1 (ko) 디지털 영상 수신기의 디지털 콘텐츠 처리 장치 및 방법
WO2017199743A1 (ja) 情報処理装置、情報記録媒体、および情報処理方法、並びにプログラム
WO2013163221A1 (en) Systems and methods for adaptive streaming with augmented video stream transitions
KR101158435B1 (ko) 이동통신 단말기와 우선순위 정보 데이터를 이용한 방송시스템 및 이를 이용한 방송 방법
US20130287092A1 (en) Systems and Methods for Adaptive Streaming with Augmented Video Stream Transitions
KR100703002B1 (ko) 선택적 인코딩이 가능한 신호처리장치 및 그의 선택적인코딩 방법
JP2019212348A (ja) 映像記録再生装置および映像記録再生方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120706

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130301

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130312

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130418

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130528

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130610

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5304539

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees