JP2015033071A - 階層化動画像伝送システム及び動画像復号装置 - Google Patents

階層化動画像伝送システム及び動画像復号装置 Download PDF

Info

Publication number
JP2015033071A
JP2015033071A JP2013163100A JP2013163100A JP2015033071A JP 2015033071 A JP2015033071 A JP 2015033071A JP 2013163100 A JP2013163100 A JP 2013163100A JP 2013163100 A JP2013163100 A JP 2013163100A JP 2015033071 A JP2015033071 A JP 2015033071A
Authority
JP
Japan
Prior art keywords
layer
information
data
moving image
information indicating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013163100A
Other languages
English (en)
Inventor
久雄 熊井
Hisao Kumai
久雄 熊井
高橋 真毅
Masatake Takahashi
真毅 高橋
徳毛 靖昭
Yasuaki Tokuge
靖昭 徳毛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2013163100A priority Critical patent/JP2015033071A/ja
Publication of JP2015033071A publication Critical patent/JP2015033071A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】レイヤごとに異なる符号化方式で符号化された動画像を伝送する階層化動画像伝送システムにおいて、第1レイヤの符号化方式と第2レイヤの符号化方式とが異なっていても、第2レイヤの符号化において、第1レイヤの特定の復号画像を利用可能にする手段を提供する。
【解決手段】ランダムアクセス時刻およびランダムアクセス時刻における第1レイヤと第2レイヤの参照関係を示す情報を取得する手段と、前記情報に基づいて、第2レイヤの復号に用いる第1レイヤの復号画像を特定する手段と、を備えている。
【選択図】図1

Description

本発明は、階層符号化された動画像の符号化データを伝送する階層化動画像伝送システム、および階層符号化された動画像の符号化データを復号する動画像復号装置に関するものである。
動画像を効率的に伝送または記録するために、動画像を符号化することによって符号化データを生成する動画像符号化装置(符号化装置)、および、当該符号化データを復号することによって復号画像を生成する動画像復号装置(復号装置)が用いられている。具体的な動画像符号化方式としては、必要なデータレートに従って、動画像を階層的に符号化する階層符号化が用いられている。階層符号化の方式としては、ISO/IECとITU−Tの標準としてH.264/AVC Annex G Scalable Video Coding(SVC)が挙げられる(非特許文献1)。
SVCでは、符号化データは、基本レイヤ(下位レイヤ:BL)と拡張レイヤ(上位レイヤ:EL)との2つのレイヤ(階層)から構成されている。これにより、例えば、復号装置において、基本レイヤのみを参照した低品質再生と、基本レイヤ及び拡張レイヤを参照した高品質再生とを可能にすることができる。
また、SVCでは空間スケーラビリティ、時間スケーラビリティ、SNRスケーラビリティをサポートしている。例えば、空間スケーラビリティの場合、原画像から所望の解像度にダウンサンプリングした画像を下位レイヤとしてH.264/AVCで符号化する。上位レイヤではレイヤ間の冗長性を除去するためにレイヤ間予測を行う。レイヤ間予測としては、動き予測に関する情報を同時刻の下位レイヤの情報から予測する動き情報予測、あるいは同時刻の下位レイヤの復号画像をアップサンプリングした画像から予測するテクスチャ予測がある。
また、H.264で規定されているサブシーケンス情報補足向上情報(SEI: supplemental enhancement information)を利用して、ビデオ・コンテンツを新規な時間的レイヤ―化された符号化構造にエンコードすることで、低コストのビデオ・プロセッサを使って早送りおよび早戻しのトリック再生を実現する技術が開示されている(特許文献1)。
一方で、トリック再生を実現するために用いられるデータ形式として、ISO/IECの標準としてMPEG Dynamic adaptive streaming over HTTP (MPEG-DASH)が挙げられる(非特許文献2)。ビデオ・コンテンツを格納するデータに含まれるインデックス情報を利用して、時間的レイヤ化された符号化構造を表すことが出来る。
また、インターネット等のネットワーク網の発達により、放送と通信、ユニキャスト通信とマルチキャスト通信など、複数の経路、特に異種ネットワークを使ってコンテンツデータをデータ配信するハイブリッド伝送(Hybrid Delivery)と呼ばれる伝送方法が用いられてきている。ハイブリッド伝送により配信されたデータを受信した受信端末は、複数の経路から受信したデータを、同期、重畳、合成等して1つのデータとして画面に表示している。そこで、スケーラブル符号化(SVC)された動画像について、基本レイヤデータを放送で、拡張レイヤデータを通信網を介してハイブリッド伝送するということも可能になる。
さらに、スケーラブル符号化された動画像について、基本レイヤデータを放送で、拡張レイヤデータを通信網で、ハイブリッド伝送することが考えられている。この場合において、基本レイヤ(フルハイビジョン:フルHD)と拡張レイヤ(4K)とで異なる符号化方式を利用した階層符号化により、既存の放送インフラを利用したハイブリッド放送等の応用も検討され始めている。
特表2009−506626号公報
ISO/IEC 14496-2:2004 (2004) ISO/IEC 23009-1:2012 (2012)
上述したように、スケーラブル符号化された動画像について、基本レイヤデータを放送で、拡張レイヤデータを通信網で、ハイブリッド伝送することが考えられている。この場合において、基本レイヤと拡張レイヤとで異なる符号化方式を利用した階層符号化によるハイブリッド伝送が期待されている。
しかしながら、上述の特許文献1や非特許文献2に示されるデータ形式を用いた場合のように、早送りや早戻し等のトリック再生(ランダムアクセス)を実現しようとした際に、各レイヤにおける画像の参照構造(Group of Picture(GOP)構造)が異なる場合や、各レイヤの映像符号化データが異なる経路で伝送される場合があるため、例えばある特定の時刻の画像が同時刻の下位レイヤの復号画像から予測されていた場合に、時刻情報からだけでは、上位レイヤの画像を復号するために、対応する下位レイヤの復号画像を特定することが出来なかった。
本発明は、上記の問題点に鑑みてなされたものであり、その目的は、スケーラブル符号化において、基本レイヤの符号化方式と拡張レイヤの符号化方式とが異なっていても、拡張レイヤの符号化処理において、基本レイヤの特定の復号画像を利用可能な動画像復号装置等を実現することにある。
上記課題を解決するために、本発明の一態様に係る動画像復号装置は、互いに符号化方式の異なる複数のレイヤから構成される符号化データを復号する動画像復号装置であって、ランダムアクセス時刻およびランダムアクセス時刻における第1レイヤと第2レイヤの参照関係である参照画像制御情報を利用して、ある特定時刻での第2レイヤの画像を復号するための第1レイヤの復号画像を特定する手段を備えることを特徴としている。
上記の構成によれば、互いに符号化方式の異なる複数のレイヤから構成される符号化データを復号する動画像復号装置において、ある特定時刻での第2レイヤの画像を復号するために、第1レイヤの画像を全て復号することなく特定の第2レイヤの画像を復号することができる。
以上のように、本発明に係る動画像復号装置は、互いに符号化方式の異なる複数のレイヤから構成される符号化データを復号する動画像復号装置であって、ランダムアクセス時刻及びランダムアクセス時刻における第1レイヤと第2レイヤの参照関係である参照画像制御情報を利用して、ある特定時刻での第2レイヤの画像を復号するための第1レイヤの復号画像を特定する手段を備えている構成である。
上記の構成によれば、互いに符号化方式の異なる複数のレイヤから構成される符号化データを復号する動画像復号装置において、ある特定時刻での第2レイヤの画像を復号するために、第1レイヤの画像を全て復号することなく早送りや早戻し等のトリック再生を実行することが可能となり、さらに第2レイヤの復号に必要な第1レイヤの復号画像を選択的に復号することも可能となるため、不必要な第1レイヤの復号処理を削減することができるという効果を奏する。
本発明の実施形態に係る動画像復号装置の要部構成を示すブロック図である。 本発明の実施形態に係るMPEG−2システムで伝送されるトランスポートストリームのデータ構造を示す図であって、(a)は、ビデオやオーディオの圧縮符号化データであるエレメンタリストリームを示しており、(b)は、エレメンタリストリームをパケット化したパケッタイズドエレメンタリストリームの構成を示しており、(c)は、パケッタイズドエレメンタリストリームを多重化したトランスポートストリームの構成を示しており、(d)は、プログラムの構成を示す番組特定情報や番組配列情報、データなどのセクション・データを示しており、(e)は、セクション・データを多重化したトランスポートストリームの構成を示している。 本発明の実施形態1に係る参照画像制御情報のデータ構造を示す図である。 本発明の概要を説明するための図である。 参照画像制御情報を利用した復号処理の流れを示すフローチャートである。 本発明の実施形態1に係るある参照時刻での処理対象となる拡張レイヤと対応する基本レイヤの対応関係を示す図である。 本発明の実施形態2に係る動画像復号装置の要部構成を示すブロック図である。 本発明の実施形態2に係る参照画像制御情報のデータ構造を示す図である。 本発明の実施形態2におけるノンインタレース化処理するためのノンインタレース化処理テーブルを示す図である。 本発明の実施形態2に係るある参照時刻での処理対象となる拡張レイヤと対応する基本レイヤの対応関係を示す図である。 本発明の実施形態3に係る動画像復号装置の要部構成を示すブロック図である。 本発明の実施形態3に係る参照画像制御情報識別子のデータ構造を示す図である。 本発明の実施形態4におけるMPEG−DASHにおけるメディアデータを構成するセグメント構成を示す図である。 本発明の実施形態4におけるMPDを示す図である。 本発明の実施形態4に係る動画像復号装置の要部構成を示すブロック図である。
〔実施形態1〕
本実施の形態に係る動画像復号装置1は、スケーラブル符号化(SVC)された符号化データを復号する際に、基本レイヤ(第2レイヤ)における符号化方式と拡張レイヤ(第2レイヤ)における符号化方式とが異なっていても、基本レイヤと拡張レイヤの参照関係を示す情報を参照することで、拡張レイヤの動画像を復号するために、対応する基本レイヤの復号画像を特定することを可能とするものである。
より具体的には、ランダムアクセス時刻及びランダムアクセス時刻における基本レイヤと拡張レイヤの参照関係を示す情報を付加することで、基本レイヤの動画像をすべて復号することなく、ある特定時刻での拡張レイヤの動画像を復号するための対応する基本レイヤの復号画像を特定することを可能とするものである。
これにより、基本レイヤと拡張レイヤとにおいて、それぞれ独自の符号化方式を採用した場合でも、ある特定時刻での拡張レイヤの動画像を復号するために対応する基本レイヤの復号画像を特定することが可能となるとともに、必要でない基本レイヤの動画像の復号処理を省略することも可能となる。また、基本レイヤと拡張レイヤの動画像の符号化データを異なる伝送網を利用して伝送した場合において、ある特定時刻での拡張レイヤの動画像を復号するのに必要な基本レイヤの動画像の符号化データのみ取得して復号処理することも可能となる。なお、本実施の形態では、超高精細映像(動画像、4k映像データ)を伝送する場合において、超高精細映像をスケーラブル符号化し、基本レイヤは、4k映像データをダウンスケーリングし、インタレース化した映像データをMPEG−2により符号化してテレビ放送網で伝送したものをHDD等の記憶媒体に蓄積した放送録画データとして読み出す場合について、拡張レイヤは、4k映像をHEVCにより符号化して(プログレッシブ)、インターネットで伝送する場合について説明するが、本発明の基本レイヤと拡張レイヤとの符号化方式はこれに限られるものではない。
本実施例に係る動画像復号装置1の詳細な説明に先立って、放送や通信の伝送路を経由して伝送され、動画像復号装置1によって復号される伝送データのデータ構造について説明を行う。伝送データには、基本レイヤと拡張レイヤとプログラムの構成を示すセクション・データとから構成される。基本レイヤと拡張レイヤは、互いに異なる伝送路を介して動画像復号装置1に供給されるものであってもよいし、同一の伝送路を介して動画像復号装置1に供給されるものであってもよいし、一部を装置内の蓄積部に予め蓄積したものから読み出して動画像復号装置1に供給されるものであってもよい。
一例として、図4に示すように、放送波によって伝送された基本レイヤを含むビットストリームを蓄積した蓄積部から読み出し、インターネット通信網によって拡張レイヤを含むビットストリームが伝送される場合を挙げることができる。
また、上述したように、基本レイヤは、例えば、MPEG−2方式によって符号化されており、拡張レイヤは、例えば、H.264/MPEG−4 AVCの後継規格であるHEVC(High Efficiency Video Coding)方式によって符号化されている。このように、以下の説明では、基本レイヤと拡張レイヤとが、互いに異なる符号化方式によって符号化されている場合を例に挙げるが、これは本実施形態を限定するものではない。
(データ構造の説明)
図2は、MPEG−2システムにおけるメディアデータをトランスポートストリーム(TS)として、伝送用に多重化する場合のデータ構造を示す図である。メディアデータは、例示的に、映像・音声の符号化されたデータや、それらを組み合わせたプログラムの構成を示す番組特定情報や番組配列情報、データなどのセクション・データを含む。なお、本実施の形態では、伝送用に多重化する場合のデータ構造としてMPEG−2 TSを用いて伝送する場合について説明するが、本発明の伝送で使用する多重化方式はこれに限られるものではない。
図2の(a)〜(e)は、それぞれTSを構成するエレメンタリストリーム(ES)、パケッタイズドエレメンタリストリーム(PES)、PESを多重化したトランスポートストリーム(TS)、セクション・データ、セクション・データを多重化したトランスポートストリーム(TS)を示す図である。MPEG−2 TSでは、放送や通信での使用を可能とするために、ESを伝送しやすい小さな固定長パケットにパケット化する。映像や音声の圧縮符号化データであるESは、ストリームの種類を示すストリームIDや、PESパケット内のESの表示時刻、デコード(再生)時刻を示すプレゼンテーションタイムスタンプ(PTS)、デコーディングタイムスタンプ(DTS)情報などが挿入されたPESヘッダ(PH)が付加され、PESにパケット化される。さらにPESは、TSパケットの種類を識別するPID、プログラム時刻の基準参照値であるPCRなどの情報が挿入されたTSヘッダ(TH)が付加され、188バイト単位のTSにパケット化される。セクション・データをTSパケット化する場合は、複数個のセクションが同一TSパケットにパケット化されることがあり、TSよりも大きなセクション・データが複数のTSパケットで分割して伝送されることもあれば、1つのTSパケットの中に複数のセクションがパケット化されることもあるため、前述したPESとは異なる方法を用いてでパケット化される。そのため、前述したTSヘッダに加えてセクションの先頭位置を示すポインタ・フィールド(P)が付加されTSにパケット化される。
本実施例では、ランダムアクセス時刻及びランダムアクセス時刻における基本レイヤ(BL)と拡張レイヤ(EL)の参照関係を示す参照画像制御情報(RPCI)をPESとしてMPEG−2 TSに多重化して伝送する場合について説明する。
(参照画像制御情報の説明)
まず、ランダムアクセス時刻及びランダムアクセス時刻における基本レイヤ(BL)と拡張レイヤ(EL)の参照関係を示す参照画像制御情報(RPCI)の例を図3に示す。RPCIには、拡張レイヤ(EL)のTSパケットを識別するEL PID、BLのTSパケットを識別するBL PID、ランダムアクセス時刻を示す参照時刻情報(RTS)の配列RTS0〜RTSn及び参照時刻の終了を示す終了コード(EORTS)が含まれる。EORTSは省略可能な情報で、参照画像制御情報(RPCI)RPCIは、そのプログラム中で1つしか含まれていなくても、複数に分割されて伝送されても構わない。動画像復号装置は、上記参照時刻と、TS中に含まれるPCRとを参照してランダムアクセス時刻を特定することが出来る。
(動画像復号装置)
次に、本実施形態に係る動画像復号装置1について、図1、図4を参照して説明する。
図1は、動画像復号装置1の構成を示すブロック図である。図1に示すように、動画像復号装置1は、BL TS処理部10、BL復号部11、参照画像制御部12、EL TS処理部13、EL復号部14から構成される。
BL TS処理部10は、蓄積データ読み込み部から読み込んだTSから所望のBL PIDに該当する基本レイヤ(BL)の符号化データをPESとして取り出し、これをBL復号部11に供給する。同様に、EL TS処理部13は、インターネット通信網経由で取得したTSから所望のEL PIDに該当する拡張レイヤ(EL)の符号化データおよび前記拡張レイヤ(EL)に対応する参照画像制御情報(RPCI)を取り出し、それぞれEL復号部14、参照画像制御部12に供給する。参照画像制御部12は参照画像制御情報(RPCI)から取得した参照時刻(RTS)の配列をBL復号部11およびEL復号部14に供給する。BL復号部11は、参照画像制御部から取得したRTSおよびBL TS処理部10から供給されたBL PESを基に該当する時刻の動画像を復号し、EL復号部14に供給する。EL復号部14は、参照画像制御部12から取得したRTS、BL TS処理部10から供給されたEL PESおよびBL復号部11から供給された復号画像をもとに動画像の復号処理を行う。
なお、本実施例では、参照画像制御情報(RPCI)はEL TSに多重化されていることとしたが、BL TSに多重化されても、参照画像制御情報(RPCI)のみ別経路で伝送されても構わない。
(復号処理フローの説明)
次に、参照画像制御情報に基づいて、ELの該当するランダムアクセス時刻における画像を復号する方法の詳細について、図5および図6を参照して説明する。
図5は、参照画像制御情報(RPCI)に基づいて拡張レイヤ(EL)の該当するランダムアクセス時刻における動画像を復号する処理のフロー図を示しており、図6は動画像復号装置において動画像を復号する際の、各フレームの表示時間順の並びを示している。
まず、参照画像制御情報を解析し、参照時刻に対応する基本レイヤ及び拡張レイヤの復号処理を行う方法、換言すれば、参照画像制御部12、BL復号部11、EL復号部14の処理について図5を参照して説明する。参照画像制御部12は、EL TS処理部13から供給された参照画像制御情報からEL PID、BL PIDの取得、および参照時刻の導出処理を行い、参照時刻リストを構築する(S101)。そして、導出された参照時刻が参照時刻の終了を示す終了コード(EORTS)でなければ(S102でNO)、参照画像制御部12は、導出された参照時刻情報をEL復号部14およびBL復号部11に供給し、BL復号部11は参照時刻に対応するBLのピクチャの復号処理を行い、BL復号画像をEL復号部14に供給する(S103)。EL復号部14は、参照画像制御部12から供給された参照時刻とBL復号部から供給されたBL復号画像とEL TS処理部13から供給された拡張レイヤのPESから該当するELピクチャの復号処理を行う。
ここで、ある参照時刻(RTS)での処理対象となる拡張レイヤのピクチャに対応する基本レイヤのピクチャを特定する方法について図6を参照して説明する。図6の基本レイヤでは、フィールド構造のピクチャを示している。例えば、フレームBI2は、破線で示すフィールドI21とI22とを合成したものである。また、基本レイヤのフレームのBI2はIピクチャ、フレームBP5、BP8はPピクチャ、フレームBB0、BB1、BB3、BB4はBピクチャとして処理される。また、1つのフレームは2つのフィールドとして扱うことができる。例えば、フレームBB0はフィールドB01およびB02として、フレームBB1はフィールドB11およびB12として扱うことができる。ここでは、基本レイヤの各フレームは、フレーム構造またはフィールド構造のいずれかの形式で適応的に復号処理されるものとする。
図6の拡張レイヤにおいて、各フレームのピクチャは基本レイヤの各フィールドのピクチャに対応している。例えば、拡張レイヤのフレームb0に対応する基本レイヤのフィールドはB01となる。また、拡張レイヤのI4はIピクチャ、P10はPピクチャ、B1、B7は参照Bピクチャ、b0、b2、b3、b6、b8、b9、b11は非参照Bピクチャとして処理される。
また、本実施の形態では、図6に「符号化順」として示した順序で、基本レイヤ、拡張レイヤは復号されるものとする。
ここで、参照時刻RTS0、RTS1に対応する拡張レイヤおよび基本レイヤのタイムスタンプ情報がそれぞれPTSEL0、PTSEL1およびPTSBL0、PTSBL1であるとする。現在の処理対象をRTS0とすると、拡張レイヤにおけるI4および対応する基本レイヤのI21が特定される。同様にして、参照時刻RTS1、RTS2において、拡張レイヤおよび基本レイヤにおける復号対象のピクチャがI10、P51およびI16、P81と特定される。
そして、導出した参照時刻リストに対してEORTSになるまで上記処理を繰り返し、参照時刻がEORTSの場合に(S102でYES)、復号処理が終了する。
〔実施の形態2〕
本発明の他の実施の形態について図7から図10に基づいて説明すれば、以下のとおりである。なお、説明の便宜上、上記の実施の形態1において示した部材と同一の機能を有する部材には、同一の符号を付し、その説明を省略する。
本実施の形態において、上記実施の形態1と異なるのは、参照画像制御情報にノンインタレース化するための処理を示した情報を含み、その情報に基づいて基本レイヤの画像をノンインタレ−ス化した画像を用いて拡張レイヤの復号処理を行う点である。
(動画像復号装置1´)
図7に、本実施の形態に係る動画像復号装置1´の構成を示す。動画像復号装置1´において、動画像復号装置1と異なるのは、参照画像制御部12の代わりに参照画像制御部12´、BL復号部11の代わりにBL復号部11´、後処理部を備えている点である。
参照画像制御部12´では、EL PID、BL PID、参照時刻情報(RTS)に加えて、ノンインタレース化のフィールドテーブルを取得する機能を備えている。BL復号部11´では、参照画像制御部12´から供給されたノンインタレース化のフィールドテーブルに基づいて該当するBLピクチャを復号し、復号画像を後処理部15に供給する。後処理部15では、参照画像制御部12´から供給されたノンインタレース化のフィールドテーブルに基づいて、BL復号部11´から供給された復号画像のノンインタレース化処理を行う。
参照画像制御部に含まれるノンインタレース化のフィールドテールブルの情報例とそれに基づいたノンインタレース化処理について、図8、図9を参照して説明する。図8は参照画像制御情報の例であり、実施例1でのEL PID、BL PID、参照時刻情報のリストに加えて、ノンインタレース化の情報が含まれる。図9は、基本レイヤの復号画像をノンインタレース化処理するためのノンインタレース化処理テーブルであり、前記テーブルの各フラグの値に基づいて基本レイヤの復号画像のノンインタレース化処理が行われる。
ノンインタレース化の処理は、lower_layer_progressive_frameに示される基本レイヤの再構成画像がインタレースかプログレッシブか、およびprogressive_frameに示される拡張レイヤの画像がインタレースかプログレッシブかに依存する。
lower_layer_progressive_frameが”1”の場合、基本レイヤの再構成画像はノンインタレース化の処理はされず、progressive_frameが”1”の場合はプログレッシブであると、またprogressive_frameが”0”の場合はインタレースであると考えられる。この場合、lower_layer_deinterlaced_field_selectは、”1”でなければならない。
lower_layer_progressive_frameが”0”かつprogressive_frameが”0”の場合、それぞれの基本レイヤの再構成画像は1枚のプログレッシブ画像を生成するためのノンインタレース処理が行われる。この場合、lower_layer_deinterlaced_filed_selectは”1”でなければならない。lower_layer_progressive_frameが”0”かつprogressive_frameが”1”の場合、それぞれの基本レイヤの再構成画像は1枚のプログレッシブ画像を生成するためにノンインタレース処理される。このうちの1枚のフィールドのみが必要とされる。lower_layer_deinterlaced_field_selectが”0”の場合、トップフィールドが用いられ、逆の場合、ボトムフィールドが用いられる。
lower_layer_field_pairが”1”かつlower_layer_progressive_frameが”0”かつprogressive_frameが”1”の場合、基本レイヤの対となるフィールドの再構成画像を1枚のプログレッシブ画像としてノンインタレース化処理される。
lower_layer_Mult_field_refが”1”かつprogressive_frameが”1”の場合、それぞれの基本レイヤ+当該再構成画像の前後の再構成画像が1枚のプログレッシブ画像を生成するためのノンインタレース化処理される。前後の再構成画像のうちの1枚のフィールドのみが必要とされ、lower_layer_deinterlaced_field_selectが”0”の場合、当該再構成画像と当該再構成画像の前の再構成画像のボトムフィールドが用いられ、逆の場合、当該再構成と当該再構成画像の次の再構成画像のボトムフィールドが用いられる。
インタレースフレームの場合に、拡張レイヤの(そして基本レイヤの)画像がフィールド画像として符号化されるならば、ノンインタレース化処理は行われない。
次に、ある参照時刻(RTS)での処理対象となる拡張レイヤのピクチャに対応する基本レイヤのピクチャを特定する方法について図10を参照して説明する。本実施例では、対象となる基本レイヤのフィールドとその前後のフィールドを用いてノンインタレース化処理する情報がノンインタレース化テーブルに記載されている場合について説明する。
ここでは、復号対象の参照時刻はRTS0であるとし、対応する拡張レイヤおよび基本レイヤのタイムスタンプ情報がそれぞれPTSEL0、PTSBL0であるとすると、拡張レイヤにおけるI4および対応する基本レイヤのI21が特定される。ノンインタレース化テーブルには、該当フィールドの前後のフィールドを用いてノンインタレース化処理することが記載されているので、BL復号部11´は、I21に加えて、I22およびB12のフィールドのピクチャも復号処理を行い、それらの復号画像を後処理部に供給する。後処理部15では、BL復号部11´から供給された3枚のフィールドの復号画像からノンインタレース化処理を行い、生成された動画像をEL復号部に供給する。EL復号部14は、参照画像制御部12´から供給された参照時刻RTS0と後処理部から供給されたノンインタレース化処理された動画像とEL TSから供給された拡張レイヤのPES中のPTSEL0に該当する符号化データからI4のピクチャの復号処理を行う。
〔実施の形態3〕
本発明の他の実施の形態について図11および図12に基づいて説明すれば、以下のとおりである。なお、説明の便宜上、上記の実施の形態1において示した部材と同一の機能を有する部材には、同一の符号を付し、その説明を省略する。
本実施の形態において、上記実施の形態1と異なるのは、参照画像制御情報をセクション・データに含まれる参照画像制御情報記述子(RPCID)として伝送する点である。換言すれば、上記実施の形態1では、参照画像制御情報をPESとしてMPEG−2 TSに多重化して伝送するが、本実施の形態では、セクション・データの番組特定情報であるプログラム・マップ・テーブル(PMT)に含めて伝送する。
(動画像復号装置1´´)
図11に、本実施の形態に係る動画像復号装置1´´の構成を示す。動画像復号装置1´´において、動画像復号装置1と異なるのは、EL TS処理部に代わってEL TS処理部13´´、参照画像制御部12に代わって参照画像制御部12´´を備えている点である。
本実施例では、参照画像制御情報識別子を含むPMTをEL TSに多重化して伝送する場合について説明する。
EL TS処理部13´´では、受信したEL TSからセクション・データを解析し、PMTから前記拡張レイヤに対応する参照画像制御情報記述子を取りだし、これに含まれる参照画像制御情報を参照画像制御部12´´に供給する。また、所望のEL PIDに該当する拡張レイヤの符号化データをPESとして取り出し、これをEL復号部14に供給する。
参照画像制御部12´´はEL TS処理部13´´から供給された参照画像制御情報記述子に基づいて、ランダムアクセスに必要な参照時刻をBL復号部11、EL復号部14に供給する。
ここで、参照画像制御情報記述子から参照時刻を算出する方法について説明する。図12に、PMTおよび参照画像制御情報記述子(RPCID)のデータ構造例を示す。例えば、PMTには、このPMTのプログラム番号を識別する番組番号(PRn)、参照画像制御情報識別子、前記プログラム番号で伝送されるESのストリーム・タイプ、およびプログラムを構成するES、本実施例では、基本レイヤおよび拡張レイヤの符号化データを格納するPES、のストリーム・タイプおよびPID値を示すエレメンタリ−PIDを含むマップテーブルが含まれる。また、参照画像制御情報識別子には、参照画像制御情報記述子の記述子であることを示す記述子タグ、ランダムアクセスの開始時刻を示す参照開始時刻、ランダムアクセスの間隔を示す参照時刻間隔、ランダムアクセスの終了時刻を示す参照終了時刻、ノンインタレース化の処理の方式を示すノンインタレース化テーブルを含む。参照画像制御部12´´は、参照開始時刻、参照時刻間隔および参照終了時刻に基づき、BL復号部およびEL復号部でのランダムアクセス時刻でのピクチャの復号に必要な参照時刻を算出する。
なお、本実施例では、参照開始時刻、参照時刻間隔および参照終了時刻からランダムアクセス時刻での復号に必要な参照時刻を参照することとしたが、参照時刻間隔の代わりに参照間隔を用いても、実施例1と同様に参照時刻を配列として参照画像制御情報識別子に含めて伝送しても構わず、参照画像制御情報識別子に含まれる情報からランダムアクセス時刻での参照時刻を算出できるものであればそのデータ構造は問わない。
また、本実施例では、PMTはEL TSに含めて伝送することとしたが、BL TSに含めて伝送しても構わない。その場合は、BL TS受信部10が、受信したBL TSからセクション・データを解析し、PMTから前記拡張レイヤに対応する参照画像制御情報記述子を取りだし、これに含まれる参照画像制御情報を参照画像制御部12´´に供給する。
〔実施の形態4〕
本発明の他の実施の形態について図13から図15に基づいて説明すれば、以下のとおりである。なお、説明の便宜上、上記の実施の形態1において示した部材と同一の機能を有する部材には、同一の符号を付し、その説明を省略する。
本実施の形態において、上記実施の形態3と異なるのは、拡張レイヤおよび基本レイヤの符号化データを伝送するデータを管理するメタデータを記載したMPEG−DASHのMedia Presentation Description(MPD)形式を使用し、前記メタデータ形式に対応したセグメントデータの一部に、参照画像制御情報記述子を含むプログラム・マップ・テーブルを含めて伝送する点である。換言すれば、上記実施の形態では、参照画像制御情報を含むプログラム・マップ・テーブルをセクション・データとしてMPEG−2 TSで多重化して伝送するが、本実施例の形態では、参照画像制御情報を含むプログラム・マップ・テーブルを格納した上記セクション・データの管理を上記MPD形式によって記述・管理し、MPDでの記載に従って、ハイパーテキスト・トランスファー・プロトコル(HTTP)を利用して伝送する。なお、本実施例では、上記MPDデータを伝送するプロトコルとしてHTTPを用いることとしたが、リアルタイム トランスポート プロトコル(RTP)や(トランスミッション コントロール プロトコル(TCP)等、インターネットプロトコルとして通常使用されるプロトコルを使用して伝送しても構わず、伝送で使用するプロトコルは問わない。
(データ構造の説明)
図13は、MPEG−DASHにおけるデータを構成するセグメント構成の一例を示すものである。本実施例では、MPEG−2TSのデータ構造に変換されたメディアデータを用いることとする。格納される動画像データは、再生端末の復号処理の初期化情報を含むInitialization Segmentと断片化した動画像データを格納したMedia Segmentの二つのデータから構成される。MPEG2−TSの場合では、TSパケットの番組特定情報(PSI)がInitialization Segmentに含まれ、図12の例で示される参照画像制御情報を含むプログラム・マップ・テーブルは、Initialization Segmentに含まれて伝送される。Media Segmentは、さらに断片化した複数の動画データをまとめたサブセグメントと呼ばれるデータ群から成る。Media Segmentは1セグメントに対して一つで構成される場合と、複数の場合があり、ランダムアクセス再生時は、例えば、前者の場合は、サブセグメント単位で実行され、後者の場合は、Media Segmentの単位で実行されることとする。本実施例では、Media Segmentが1セグメントに対して一つで構成され、一つのMedia Segmentが複数のサブセグメントで構成される場合について説明する。格納される符号化データがMPEG−2 TSの場合は、MPEG−2 TS用のセグメント・インデクスとして、セグメントのファイル形式を示すstypとTSパケットのインデクス情報を示すsidxが含まれる。
図14は、MPEG−DASHにおけるMPDファイルの一例を示すものである。MPDファイルに記述する情報は例えば、動画を格納したWebサーバのuniform resource locator(URL)や、格納してある動画像データの群の圧縮方式、画像サイズや符号加速度、音声データの圧縮方式、音声の言語情報などである。これらを、プログラム(同期を取った1組の動画や音声などのデータ)の情報を含むPeriod、言語(吹き替えや字幕)などの情報を含むAdaptationSet、動画像や音声の符号化速度、動画の画像サイズなどの情報を含むRepresentation、図13に示すような動画像や音声のセグメントを含むSegmentInfoといった複数の構造体により、XML形式で階層的に記述したものである。図14の例では、Representationの部分に、基本レイヤと拡張レイヤに対応する2種類の符号化データが用意されていることなどが記載されている。
(動画像復号装置1´´´)
図15に、本実施の形態に係る動画像復号装置1´´´の構成を示す。動画像復号装置1´´´において、動画像復号装置1´´と異なるのは、EL TS処理部13´´に代わってEL処理部16、BL TS処理部10に代わってBL処理部18、MPD処理部17を備えている点である。
MPD処理部17は、受信したMPDファイルを解析し、所望の基本レイヤおよび拡張レイヤに対応するTSファイルのURLおよびその画像サイズや符号加速度等の情報と対応するセグメントの情報を抽出し、それぞれBL処理部11、EL処理部14に供給する。また、MPDファイルに記載されたセグメントの構造体に関する情報に基づき取得したInitialization Segment情報を解析し、プログラム・マップ・テーブルの参照画像制御情報記述子の情報を参照画像制御部12´´に供給する。BL処理部16、EL処理部18は、MPD処理部から供給されたBL TS、およびEL TSのURLに基づき、インターネット通信網経由で該当するTSを取得し、前記取得したTSから符号化データをPESとして取り出し、これをそれぞれBL復号部11、EL復号部14に供給する。また、参照画像制御情報識別子から参照時刻を算出する方法については、実施の形態3で説明したものと同様の方法で求めることができる。
なお、本実施例では、基本レイヤのデータや拡張レイヤのデータはインターネット通信網経由で取得することとしたが、実施の形態1と同様に、画像表示装置2に内蔵している蓄積データから読み込んで取得したものを使用しても構わず、基本レイヤのデータおよび拡張レイヤのデータの取得先は上記に限定されるものではない。
また、本実施例では、MPEG−2 TSで符号化されたセグメントを送ることとしたが、ISOBMFFに対応したセグメントのデータ形式で、基本レイヤ、拡張レイヤおよび参照画像制御情報識別子のデータを伝送しても構わない。
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成や処理フローはこの実施形態記載の例に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も特許請求の範囲に含まれる。
本発明は、スケーラブル符号化により符号化を行う画像復号装置に好適に用いることができる。
1…動画像復号装置、10…BL TS処理部、11…BL復号部、12…参照画像制御部、13…EL TS処理部、14…EL復号部、15…後処理部、16…BL処理部、17…MPD処理部、18…EL処理部、2…画像表示装置、20…蓄積データ読込部、21…表示部、22…通信受信部

Claims (10)

  1. 互いに符号化方式の異なる複数のレイヤから構成される符号化データを復号する動画像復号装置であって、
    上記複数のレイヤのうち第1レイヤと第2レイヤのある表示時刻での対応関係を示す参照関係を示す情報を受信する手段と、
    上記複数のレイヤのうち第1レイヤと第2レイヤのある表示時刻での対応関係を示す参照関係を示す情報に基づいて、前記表示時刻での第2レイヤの画像を復号するために必要な第1レイヤの画像を特定する手段と、
    を備えていることを特徴とする動画像復号装置。
  2. 上記参照関係を示す情報は、MPEG−2システムにおけるトランスポートストリームに多重化されたエレメンタリストリームから取得することを特徴とする請求項1に記載の動画復号装置。
  3. 上記参照関係を示す情報には、ノンインタレース化するための処理を示した情報を含むことを特徴とする請求項2に記載の動画復号装置。
  4. 上記参照関係を示す情報は、MPEG−2システムにおけるセグメントデータで伝送される番組特定情報に含まれる情報から取得することを特徴とする請求項2もしくは請求項3に記載の動画復号装置。
  5. 上記参照関係を示す情報は、MPEG−DASHシステムにおける初期化情報セグメントで伝送される番組特定情報に含まれる情報から取得することを特徴とする請求項2もしくは請求項3に記載の動画復号装置。
  6. 互いに符号化方式の異なる複数のレイヤから構成される符号化データを伝送する階層化動画像伝送システムであって、
    上記複数のレイヤのうち第1レイヤと第2レイヤのある表示時刻での対応関係を示す参照関係を示す情報を伝送する手段と、
    上記多重化したメディアデータを伝送する手段と、
    を備えていることを特徴とする階層化動画像伝送システム。
  7. 上記参照関係を示す情報を符号化データに多重化する手段と、
    上記多重化したメディアデータを伝送する手段と、
    を備えていることを特徴とする請求項6に記載の階層化動画像伝送システム。
  8. 上記参照関係を示す情報は、MPEG−2システムにおけるトランスポートストリームを構成するエレメンタリストリームとして、トランスポートストリームに多重化して伝送することを特徴とする請求項6もしくは請求項7に記載の階層化動画像伝送システム。
  9. 上記参照関係を示す情報は、MPEG−2システムにおけるセグメントデータで伝送される番組特定情報に多重化して伝送することを特徴とする請求項6もしくは請求項7に記載の階層化動画像伝送システム。
  10. 上記参照関係を示す情報は、MPEG−DASHシステムにおける初期化情報セグメントで伝送する番組特定情報に多重化して伝送することを特徴とする請求項6もしくは請求項7に記載の階層化動画像伝送システム。
JP2013163100A 2013-08-06 2013-08-06 階層化動画像伝送システム及び動画像復号装置 Pending JP2015033071A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013163100A JP2015033071A (ja) 2013-08-06 2013-08-06 階層化動画像伝送システム及び動画像復号装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013163100A JP2015033071A (ja) 2013-08-06 2013-08-06 階層化動画像伝送システム及び動画像復号装置

Publications (1)

Publication Number Publication Date
JP2015033071A true JP2015033071A (ja) 2015-02-16

Family

ID=52518036

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013163100A Pending JP2015033071A (ja) 2013-08-06 2013-08-06 階層化動画像伝送システム及び動画像復号装置

Country Status (1)

Country Link
JP (1) JP2015033071A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017060004A (ja) * 2015-09-16 2017-03-23 株式会社東芝 エンコード装置、デコード装置、エンコードプログラム、デコードプログラム及びストリーミングシステム
JP2022031267A (ja) * 2019-06-05 2022-02-18 株式会社東芝 ストリーミングシステムおよびエンコードプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017060004A (ja) * 2015-09-16 2017-03-23 株式会社東芝 エンコード装置、デコード装置、エンコードプログラム、デコードプログラム及びストリーミングシステム
JP2022031267A (ja) * 2019-06-05 2022-02-18 株式会社東芝 ストリーミングシステムおよびエンコードプログラム

Similar Documents

Publication Publication Date Title
US11375291B2 (en) Virtual reality video signaling in dynamic adaptive streaming over HTTP
KR102382901B1 (ko) 미디어 콘텐츠를 위한 영역별 패킹, 콘텐츠 커버리지, 및 시그널링 프레임 패킹
US11265562B2 (en) Transmitting method and receiving method
JP6345827B2 (ja) ビデオデータをストリーミングするためのシーケンスデータセットを提供すること
US9900363B2 (en) Network streaming of coded video data
KR101242472B1 (ko) 트랙 및 트랙 서브세트의 그룹화를 위한 방법 및 장치
JP6462566B2 (ja) 送信装置、送信方法、受信装置および受信方法
JP5770345B2 (ja) ビデオデータをストリーミングするためのビデオ切替え
JP6344392B2 (ja) 符号化装置、符号化方法、送信装置、復号化装置、復号化方法および受信装置
US10194182B2 (en) Signal transmission and reception apparatus and signal transmission and reception method for providing trick play service
JP5734699B2 (ja) 配信映像の超解像化装置
JP2015033071A (ja) 階層化動画像伝送システム及び動画像復号装置
JP2024511948A (ja) Heifフォーマットされた画像をリアルタイムトランスポートプロトコル上でトランスポートすること
KR20120058373A (ko) Svc 서버를 이용한 http 스트리밍 수신 비디오 전송 및 단말 재생 시스템

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20150423