JP2008148137A - 画像符号化装置 - Google Patents
画像符号化装置 Download PDFInfo
- Publication number
- JP2008148137A JP2008148137A JP2006334801A JP2006334801A JP2008148137A JP 2008148137 A JP2008148137 A JP 2008148137A JP 2006334801 A JP2006334801 A JP 2006334801A JP 2006334801 A JP2006334801 A JP 2006334801A JP 2008148137 A JP2008148137 A JP 2008148137A
- Authority
- JP
- Japan
- Prior art keywords
- image data
- moving image
- delay time
- encoding method
- initial delay
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
【課題】変換後の動画像データの再生開始時における遅延時間の更なる削減を可能とし、当該削減に係る処理を効率よく行う符号化方式変換装置を提供すること。
【解決手段】第1の動画像データを復号化する動画像復号化部101と、第1の動画像データに含まれる、バッファ初期遅延時間を示す情報を抽出する遅延時間抽出部103と、第1の動画像データがフレーム毎に符号化されているか否かを判断する判断部105と、フレーム毎に符号化されていると判断された場合、抽出されたバッファ初期遅延時間より小さな値を、変換後のバッファ初期遅延時間として決定する遅延時間決定部104と、復号化された第1の動画像データを、フィールド毎に第2の符号化方式で符号化し、決定された変換後のバッファ初期遅延時間を設定する動画像符号化部102とを備える。
【選択図】図1
【解決手段】第1の動画像データを復号化する動画像復号化部101と、第1の動画像データに含まれる、バッファ初期遅延時間を示す情報を抽出する遅延時間抽出部103と、第1の動画像データがフレーム毎に符号化されているか否かを判断する判断部105と、フレーム毎に符号化されていると判断された場合、抽出されたバッファ初期遅延時間より小さな値を、変換後のバッファ初期遅延時間として決定する遅延時間決定部104と、復号化された第1の動画像データを、フィールド毎に第2の符号化方式で符号化し、決定された変換後のバッファ初期遅延時間を設定する動画像符号化部102とを備える。
【選択図】図1
Description
本発明は、デジタル放送などで用いられている圧縮画像データをより少ない符号量に再圧縮し長時間の記録を可能にする符号化方式変換装置に関する。
従来、動画像データの圧縮方式として、デジタル衛星放送やDVD−Videoなど高画質の動画像に適用されるMPEG−2(Moving Picture Experts Group phase 2)がある。
このMPEG−2等の動画像符号化方式では、復号化を行うデコーダ側の、圧縮画像データを蓄積するバッファにおいてオーバーフローおよびアンダーフローを発生させないように圧縮画像データを作成するよう規格で定められている。
このことについて、MPEG−2では、規格書(ISO/IEC 13818−2)のAnnex C(Video Buffer Verifier)節に記載されており、そこでの模式図を図7に示す。
図7は、MPEG−2の圧縮画像データのデコーダ側バッファにおける占有量の時間変化の一例を示す図である。
図7に示すように、デコーダに入力された圧縮画像データは、バッファへの蓄積が開始された時刻0から、所定の時間“vbv_delay”の経過後に、最初のフレームを構成するデータが、バッファから瞬時に引き抜かれる。また、その後、1/T秒ごとに、各フレームを構成するデータが、バッファから引き抜かれる。
ここで、“vbv_delay”は、圧縮画像データがバッファに蓄積され始めてから、最初にバッファから引き抜かれるまでの時間であり、「バッファ初期遅延時間」または単に「初期遅延時間」と呼ぶ。なお、バッファから引き抜かれた圧縮画像データは復号を行う処理部で復号化され、再生等される。
また、“T”は、一般にフレームレートと呼ばれる数値であり、1秒間にどれだけのフレームが更新されるか、という値である。
また、このような圧縮画像データについて、データ量を削減する符号化方式変換技術(トランスコード技術)がある(例えば、特許文献1参照)。
特許文献1記載のトランスコード技術によれば、入力されたMPEG−2トランスポートストリーム(TS)から得られるビデオTSに対し、符号量削減のためのトランスコードを行う。また、このトランスコードの前後で、PTS(Presentation Time Stamp)およびDTS(Decoding Time Stamp)は同じ値としている。
すなわち、上記従来のトランスコード技術では、バッファ初期遅延時間であるvbv_delayをトランスコードの前後で同じにすることを意味している。
これにより、トランスコードに係る処理を簡易化しつつ、入力されたデータの符号量を削減して出力することができる。
ここで、トランスコード後の圧縮画像データをネットワークなどを通じて伝送し、再生装置で再生させる場合を考える。このとき、バッファ初期遅延時間により送信側での伝送開始から再生装置側での映像の再生開始までに要する遅れ、つまり再生開始時における遅延時間がほぼ決まる。
従ってユーザの利便性を考慮すると、バッファ初期遅延時間の値は小さいほど良い値であるといえる。そこで、バッファ初期遅延時間を削減する技術も開示されている(例えば、特許文献2参照)。
図8は、バッファ初期遅延時間を削減する従来の技術を説明するための図である。
この技術によれば、トランスコード前の圧縮画像データでの発生符号量のゆらぎ(ジッタ(jitter))を考慮して、バッファ占有量がアンダーフローしない範囲で、バッファ初期遅延時間の削減可能量を算出するものである。
この技術によれば、トランスコード前の圧縮画像データでの発生符号量のゆらぎ(ジッタ(jitter))を考慮して、バッファ占有量がアンダーフローしない範囲で、バッファ初期遅延時間の削減可能量を算出するものである。
具体的には、図8に示すバッファ占有量の下限値V1を算出し、その下限値V1に対応する時間R1を求める。この場合、バッファ初期遅延時間D1を、D1−R1まで削減することが可能である。
このようにして、バッファ占有量の下限値を算出し、D1−R1以上D1未満のバッファ初期遅延時間を決定する。また、決定したバッファ初期遅延時間をトランスコード後の圧縮画像データに設定する。
このような処理を行うことにより、当該トランスコード後の圧縮画像データを再生する再生装置等では再生開始時における遅延時間が処理前よりも短くなる。
特開2001―251616号公報
特表平8―508378号公報
しかしながら、上記従来のバッファ初期遅延時間を削減する技術では、入力される圧縮画像データの時間変化を将来にわたって観察しないと、バッファ占有量の下限値を算出できない。
つまり、精度よく下限値を算出するためには、ある程度の時間が必ず必要である。
また、この技術を採用する装置では、入力され続ける圧縮画像データを当該観察の間保持しておくためのバッファが必要となる。
また、この技術を採用する装置では、入力され続ける圧縮画像データを当該観察の間保持しておくためのバッファが必要となる。
さらに、入力された圧縮画像データが、バッファ占有量の下限値がほとんどゼロとなるようなデータである場合には、再生までの遅れを小さくする術はない。
本発明は、前記従来の課題を考慮し、動画像データの符号化方式を変換する符号化方式変換装置であって、変換後の動画像データの再生開始時における遅延時間の更なる削減を可能とし、当該削減に係る処理を効率よく行う符号化方式変換装置を提供することを目的とする。
上記従来の課題を解決するために、本発明の符号化方式変換装置は、第1の符号化方式で符号化された第1の動画像データの符号化方式を第2の符号化方式に変換する符号化方式変換装置であって、前記第1の動画像データを復号化する復号化手段と、前記第1の動画像データに含まれる、バッファ初期遅延時間を示す情報を抽出する抽出手段と、前記第1の動画像データがフレーム毎に符号化されているか否かを判断する判断手段と、前記第1の動画像データがフレーム毎に符号化されていると判断された場合、抽出された前記バッファ初期遅延時間より小さな値を、変換後のバッファ初期遅延時間として決定する決定手段と、復号化された前記第1の動画像データを、フレームを構成する2枚のフィールドそれぞれ毎に前記第2の符号化方式で符号化し、第2の動画像データを得るとともに、前記第2の動画像データに、決定された前記変換後のバッファ初期遅延時間を設定する符号化手段とを備える。
このように、本発明の符号化方式変換装置は、入力される動画像データがフレーム毎に符号化されている場合、符号化方式変換処理を行う際にフィールド符号化を行うことができる。
また、このフィールド符号化により、変換後のバッファ初期遅延時間の値を変換前よりも小さくすることができる。
すなわち、入力される動画像データについての観察、および当該観察のためのバッファは不要であり、効率的に再生開始時における遅延時間を短くすることができる。
また、前記決定手段は、抽出された前記バッファ初期遅延時間から、前記第1の動画像データにおけるフィールドの周期であるフィールド期間を減算した値を前記変換後のバッファ初期遅延時間として決定するとしてもよい。
これにより、入力された動画像データにおけるフィールド期間に応じて、当該動画像データに適切なバッファ初期遅延時間を決定することができる。
また、本発明のAVデータ変換装置は、画像ストリームと音声ストリームとが多重化された圧縮AVデータの符号化方式を変換するAVデータ変換装置であって、前記圧縮AVデータから前記画像ストリームと前記音声ストリームとを分離する分離手段と、前記分離手段により得られる前記画像ストリームと前記音声ストリームのそれぞれから、画像と音声とを同期して再生させるための時刻情報を取得する時刻情報取得手段と、前記画像ストリームを前記第1の動画像データとして受け取り、前記第2の動画像データである変換後の画像ストリームを出力する請求項1記載の符号化方式変換装置と、前記符号化方式変換装置から前記変換後のバッファ初期遅延時間における遅延削減量を示す情報を受け取り、前記遅延削減量を、前記変換後の画像ストリームおよび前記音声ストリームに含まれるそれぞれの前記時刻情報に示される値から減算することでそれぞれの時刻情報を修正する修正手段と、それぞれ前記修正手段により修正された時刻情報を含む画像ストリームと音声ストリームとを多重化する多重化手段とを備える。
これにより、第2の動画像データ、すなわち、AVデータ変換装置から出力される圧縮AVデータの再生開始時における遅延時間を効率的に短くすることができる。また、音声データにおいても動画像データと同様に時刻情報が修正されることから、音声と動画との同期を正しく保つことができる。
また、さらに、前記分離手段により得られる前記音声ストリームの符号化方式を変換する音声変換手段を備え、前記修正手段は、符号化方式が変換された後の前記音声ストリームの時刻情報を修正するとしてもよい。
これにより、音声データについてもビットレートを削減しつつ、上記と同様に、音声と動画との同期を正しく保つことができる。
なお、本発明は、本発明の符号化方式変換装置は、集積回路として実現することもできる。
さらに、本発明は、本発明の符号化方式変換装置の特徴的な構成部の動作をステップとする方法として実現したり、それらステップをコンピュータに実行させるためのプログラムとして実現したり、そのプログラムが記録された記録媒体として実現することもできる。そして、そのプログラムをインターネット等の伝送媒体又はDVD等の記録媒体を介して配信することもできる。
本発明によれば、出力する動画像データをフィールド符号化することにより、バッファ占有量の下限値を上昇させることができる。これにより、少なくとも当該上昇分に対応する時間だけ削減されたバッファ初期遅延時間を決定することができる。
またこの決定のために、入力される動画像データの時間変化を将来に渡って観察することは不要であり、入力される動画像データを当該観察の間保持しておくバッファも不要である。
従って、本発明は、動画像データの再生開始時における遅延時間の削減に係る処理を効率よく行う符号化方式変換装置を提供することができる。
また、本発明の符号化方式変換装置により、バッファ初期遅延時間を従来より短くすることが可能となる。
以下、本発明の実施の形態について図面を参照しながら説明する。
(実施の形態1)
まず、本発明の実施の形態1における符号化方式変換装置の構成を図1を用いて説明する。
まず、本発明の実施の形態1における符号化方式変換装置の構成を図1を用いて説明する。
図1は、本発明の実施の形態1における符号化方式変換装置の機能的な構成を示す機能ブロック図である。
図1に示す符号化方式変換装置1は、第1の符号化方式で符号化された第1の動画像データの符号化方式を、第2の符号化方式に変換する装置である。
実施の形態1および後述する実施の形態2においては、具体的には、第1の符号化方式はMPEG−2の規格に準拠した符号化方式であり、第2の符号化方式は、MPEG−4/AVCの規格に準拠した符号化方式である。
なお、以下、「MPEG−2により符号化される」という場合、MPEG−2の規格に準拠した符号化方式により符号化されることを意味する。また、同様に「MPEG−4/AVCにより符号化される」という場合、MPEG−4/AVCの規格に準拠した符号化方式により符号化されることを意味する。
符号化方式変換装置1は、動画像復号化部101と、動画像符号化部102と、遅延時間抽出部103と、遅延時間決定部104と、判断部105とを備える。
動画像復号化部101は、符号化方式変換装置1に入力された動画像データを復号化する処理部である。本実施の形態においては、MPEG−2により符号化されている圧縮画像データの復号化を行う。なお、符号化方式変換装置1に入力される圧縮画像データは、本発明の符号化方式変換装置における第1の動画像データの一例である。
また、動画像復号化部101は、さらに、入力された圧縮画像データがフレーム符号化されたものであるかフィールド符号化されたものであるかを示す情報を抽出し、符号化情報として出力する。
ここで、フレーム符号化とは、動画像データをフレーム毎に符号化することであり、1つのフレームをフレームとして符号化することである。また、フィールド符号化とは、動画像データをフィールド毎に符号化することであり、1つのフレームを2枚のフィールドそれぞれ毎に符号化することである。
具体的には、MPEG−2の場合、圧縮画像データ中の“picture_structure”の値が抽出される。この値により当該圧縮画像データがフレーム符号化されたものであるのかフィールド符号化されたものであるのかを判断することができる。この判断は後述する判断部105が行う。
なお、2枚のフィールドとは、奇数フィールドおよび偶数フィールドのことであり、図2に示すように、1枚のフレームを構成する画素ラインのうちの奇数ラインのみの集合が奇数フィールドであり、偶数ラインのみの集合が偶数フィールドである。
遅延時間抽出部103は、動画像復号化部101に入力された圧縮画像データに含まれるバッファ初期遅延時間を示す情報を抽出する処理部である。
MPEG−2の場合、シーケンス先頭フレームのピクチャヘッダに“vbv_delay”が含まれており、この“vbv_delay”に示される値を取り出し、この値を用いてバッファ初期遅延時間を算出する。
具体的には、“vbv_delay”は1/90ミリ秒が基準単位であるため、バッファ初期遅延時間は以下の(式1)により求まる。
バッファ初期遅延時間(ミリ秒)=vbv_delay/90 (式1)
判断部105は、動画像復号化部101に入力された圧縮画像データがフレーム符号化されたものであるか否かを判断する処理部である。
具体的には、判断部105は、動画像復号化部101から受け取る符号化情報から、当該圧縮画像データがフレーム符号化されたものであるか否かを判断することができる。
遅延時間決定部104は、遅延時間抽出部103から得られるバッファ初期遅延時間より小さな値を、変換後のバッファ初期遅延時間として決定する処理部である。
具体的には、遅延時間決定部104は、判断部105による判断結果がフレーム符号化であることを示す場合に、バッファ初期遅延時間から所定の値を減算し、減算後の値をトランスコード後の圧縮画像データにおけるバッファ初期遅延時間(以下、「トランスコード後のバッファ初期遅延時間」という。)として出力する。
なお、バッファ初期遅延時間から減算する所定の値、つまり遅延削減量がどのような値であるかは、図4を用いて後述する。
動画像符号化部102は、動画像復号化部101が出力するデータをMPEG−4/AVCにより符号化する処理部である。なお、動画像符号化部102から出力される圧縮画像データは、本発明の符号化方式変換装置における第2の動画像データの一例である。
また、動画像符号化部102は、この符号化の際、遅延時間決定部104が出力するバッファ初期遅延時間を符号化後の圧縮画像データに設定する。つまり、当該バッファ初期遅延時間を示す情報をトランスコード後の圧縮画像データに含ませる処理を行う。
また、当該バッファ初期遅延時間に応じて、トランスコード後の圧縮画像データがMPEG−4/AVCの規格を遵守するデータとなるように符号化処理を行う。
具体的には、MPEG−4/AVCの規格において、バッファ初期遅延時間は、圧縮画像データの“Buffering period SEI”の、“initial_cpb_removal_delay”に格納される。
また、この格納された値を用いてデコーダ仮想バッファ(CPB)がアンダーフローしないように、各フレームの符号量制御が行われる。
なお、遅延時間決定部104は、動画像符号化部102が採用する符号化方式の標準規格に応じて自身の出力値の上限値を設けてもよい。つまり、遅延時間決定部104は、その規格で許されているバッファ初期遅延時間の最大値を超えないように、自身の出力値に対し上限を設けクリップ処理後に出力するようにしてもよい。
図3は、実施の形態1の符号化方式変換装置1の動作の流れを示すフロー図である。
動画像復号化部101は、符号化方式変換装置1に入力された、MPEG−2により符号化されている圧縮画像データを復号化する(S1)。
動画像復号化部101は、符号化方式変換装置1に入力された、MPEG−2により符号化されている圧縮画像データを復号化する(S1)。
遅延時間抽出部103は入力データからバッファ初期遅延時間を抽出する(S2)。具体的には、シーケンス先頭フレームのピクチャヘッダに含まれる“vbv_delay”に示される値を取り出し、この値を用いてバッファ初期遅延時間を算出する。
ここで、入力データにおけるバッファ初期遅延時間、つまりトランスコード前の圧縮画像データのバッファ初期遅延時間を“D1”とする。
また、動画像復号化部101は、入力された圧縮画像データから符号化情報を抽出する(S3)。具体的には、上述のように、圧縮画像データ中の“picture_structure”の値を抽出し、符号化情報として判断部105に出力する。
判断部105は、符号化情報を受け取ると、その符号化情報がフレーム符号化を示すものであるか否かを判断する。つまり、動画像復号化部101に入力された圧縮画像データが、フレーム毎に符号化されたものであるか否かを判断する(S4)。この判断結果は、遅延時間決定部104に通知される。
遅延時間決定部104は、判断部105による判断結果が“フレーム符号化”を示す場合(S4でYes)、遅延時間抽出部103から得られるバッファ初期遅延時間から、所定の値を減算した値をトランスコード後のバッファ初期遅延時間として決定する(S5)。
この決定されたバッファ初期遅延時間を“D2”とすると、D1とD2との関係は、“D1>D2”となる。
つまり、トランスコード前の圧縮画像データにおけるバッファ初期遅延時間(以下、「トランスコード前のバッファ初期遅延時間」という。)よりも小さな値を、トランスコード後のバッファ初期遅延時間として決定する。
動画像符号化部102は、遅延時間決定部104により決定されたバッファ初期遅延時間を用い、動画像復号化部101により復号化されたデータを、MPEG−4/AVCにより符号化する(S6)。
つまり、動画像符号化部102から得られる圧縮画像データにはバッファ初期遅延時間として“D2”を示す情報が含まれている。
これにより、このようにトランスコード処理が行われた後の圧縮画像データを再生する装置においては、バッファへの当該圧縮画像データの蓄積の開始後、D2が経過した後に先頭フレームを構成するデータがバッファから引き抜かれ、当該圧縮画像データの復号化および再生が開始される。
なお、判断部105による判断結果が、“フレーム符号化”を示さない場合(S4でNo)、つまり、符号化方式変換装置1に入力された圧縮符号化データがフィールド符号化されたものである場合、遅延時間抽出部103から得られるバッファ初期遅延時間をそのままトランスコード後のバッファ初期遅延時間として決定する。また、動画像符号化部102は、決定されたバッファ初期遅延時間を用いて、動画像復号化部101から出力されるデータを符号化する。
図4は、実施の形態1における、圧縮画像データが再生される際のデコーダ側バッファにおける占有量の時間変化を、従来の技術を用いた場合の時間変化と比較する図である。
図4(a)は、フレーム符号化されている圧縮画像データのデコーダ側バッファにおける占有量の時間変化の一例を示す図である。
また、この圧縮画像データはバッファ初期遅延時間として“D1”が設定されていると想定する。
従来の技術であれば、当該圧縮画像データの時間変化を観察することで、バッファ占有量の下限値V10に対応する遅延削減量R10を求めることが可能である。つまり、D1−R10までバッファ初期遅延時間を小さくすることが可能である。
これに対し、本実施の形態の符号化方式変換装置1は、フレーム符号化されている圧縮画像データを復号化し、復号化後のデータをMPEG−4/AVCにより符号化する際にフィールドごとに符号化する。これにより、バッファ初期遅延時間を更に小さくすることが可能である。
図4(b)は、符号化方式変換装置1から出力された圧縮画像データが再生される場合の、デコーダ側バッファにおける占有量の時間変化の一例を示す図である。
符号化方式変換装置1は、入力された圧縮画像データがフレーム符号化されたものである場合、MPEG−4/AVCにより符号化する際にフィールドごとに符号化する。つまり、フィールド符号化された圧縮画像データを出力する。
ここで、フィールド符号化された圧縮画像データは、図4(b)に示すように、再生される際、フレーム符号化された圧縮画像データに比べると短い時間間隔でバッファから引き抜かれて順次復号化されていく。
具体的には、復号化され再生される圧縮画像データのフレームレートTが30フレーム/秒である場合を想定すると、当該圧縮画像データがフレーム符号化されたものである場合、図4(a)に示すように、1/Tつまり(1/30)秒ごとにフレーム単位でバッファからデータが引き抜かれることになる。
これに対し、当該圧縮画像データがフィールド符号化されたものである場合、1フレームは2枚のフィールドで構成(図2参照)されていることから、図4(b)に示すように1/2T、つまり(1/60)秒ごとにフィールド単位でバッファからデータが引き抜かれることになる。
なお、動画像データにおけるフィールドの周期をフィールド期間といい、本例のようにT=30フレーム/秒である圧縮画像データのフィールド期間は(1/60)秒である。
このように、フィールド符号化された圧縮画像データは、フレーム符号化されたものより短い時間間隔でバッファから引き抜かれるため、バッファ占有量の下限値は上昇する。この上昇分は、図4(b)ではV20で表されている。
そこで、本実施の形態の符号化方式変換装置1は、この上昇分V20に対応する時間R20を、もともとの初期遅延時間D1から減算する。
ここで、このV20は、フィールド期間である1/2Tの間にバッファに蓄積される符号量であり、この符号量V20に対応する時間R20とは、すなわちフィールド期間である。
つまり、本実施の形態の符号化方式変換装置1は、入力された圧縮画像データのフレームレートからフィールド期間に相当する時間R20を算出する。なお、このフレームレートは、例えば、動画像復号化部101が復号化対象の圧縮画像データから取得または算出し、遅延時間決定部104が受け取ればよい。
符号化方式変換装置1は、このようにして得られるR20を、もともとの初期遅延時間D1から減算し、減算後の値(D1−R20)をトランスコード後のバッファ初期遅延時間として決定することができる。
なお、フィールド符号化を伴うトランスコードの前、つまり、フレーム符号化されている状態の圧縮画像データにおけるバッファ占有量の下限値V10に相当する時間R10とフィールド期間に相当する時間R20との合算値を削減してもアンダーフローを引き起こすことはない。
そのため、符号化方式変換装置1を用いることにより、トランスコード後のバッファ初期遅延時間をD1−(R10+R20)まで小さくすることが可能となる。
また、V20の大きさはV10の大きさに依存しない。例えば、仮に、符号化方式変換装置1に入力された圧縮画像データが、バッファ占有量の下限値がほとんどゼロとなる圧縮画像データである場合、つまり、図4(a)においてV10がほぼゼロとなる圧縮画像データが入力された場合、出力する圧縮画像データにおいても、図4(b)におけるV10はほぼゼロとなる。
しかし、フィールド期間に相当する時間R20は、フィールド符号化を行うことにより得られた値であり、V10の有無や大きさにかかわらず確保される。これにより、バッファ初期遅延時間を少なくともR20だけ削減することは可能である。
従って、従来の技術では再生までの遅れを小さくすることができないような圧縮画像データが符号化方式変換装置1に入力された場合であっても、バッファ初期遅延時間を削減することが可能であり、再生開始時における遅延時間を短くすることができる。
このように、本実施の形態の符号化方式変換装置1は、フレーム符号化されている圧縮画像データに対してフィールド符号化を伴うトランスコードを行うことにより、バッファ占有量の下限値を上昇させることができる。
バッファ占有量の下限値を上昇させることで、図4(b)に示すように、少なくとも上昇分(V20)に相当する時間(R20)だけバッファ初期遅延時間を短くすることが可能となる。
そこで、符号化方式変換装置1は、トランスコード前のバッファ初期遅延時間よりも小さな値を、トランスコード後のバッファ初期遅延時間として決定する。
具体的には、トランスコード前のバッファ初期遅延時間から、少なくともフィールド期間を減算した値をトランスコード後のバッファ初期遅延時間として決定する。
また、このフィールド期間は、もともとのフレームレートから容易に算出される値である。つまり、入力データの観察等のある程度時間を要する処理や、その処理のためのバッファ等も不要である。
以上のように、本発明は、動画像データの符号化方式を変換する符号化方式変換装置であって、当該動画像データの再生開始時における遅延時間の更なる削減を可能とし、当該削減に係る処理を効率よく行う符号化方式変換装置を提供することができる。
(実施の形態2)
実施の形態2として、実施の形態1の符号化方式変換装置1が組み込まれたAVデータ変換装置について説明する。
実施の形態2として、実施の形態1の符号化方式変換装置1が組み込まれたAVデータ変換装置について説明する。
まず、図5を用いて、実施の形態2のAVデータ変換装置2の構成を説明する。
図5は、実施の形態2のAVデータ変換装置2の構成を示すブロック図である。
図5は、実施の形態2のAVデータ変換装置2の構成を示すブロック図である。
図5に示すAVデータ変換装置2は、画像ストリームおよび音声ストリームが多重化された圧縮AVデータを入力データとし、入力データに対しトランスコード処理を行うことにより符号量が削減された圧縮AVデータを出力する装置である。
AVデータ変換装置2が備える各構成部について以下に説明する。
MPEG−2TS分離器301は、入力されたMPEG−2TSからビデオTSとオーディオTSとを分離し出力する構成部である。
MPEG−2TS分離器301は、入力されたMPEG−2TSからビデオTSとオーディオTSとを分離し出力する構成部である。
ビデオTS復号器302は、入力されたビデオTSを復号化し、ビデオPESを出力する構成部である。ビデオPES復号器303は、入力されたビデオPESを復号化し、PTS、DTSおよびビデオエレメンタリーストリーム(ES)を出力する構成部である。
符号化方式変換装置1は、入力されるビデオESに対し、実施の形態1で説明した処理と同様の動作を行う。
具体的には、入力されるビデオESに対し、MPEG−4/AVCによるトランスコード処理を行うことでビットレートを削減させ、トランスコード後のビデオESを出力する。また、トランスコード後のビデオESには、トランスコード前よりも小さな値のバッファ初期遅延時間が設定されている。
つまり、実施の形態2においては、符号化方式変換装置1に入力されるビデオESは、第1の動画像データであり、符号化方式変換装置1から出力されるビデオESは、第2の動画像データである。
また、トランスコード後のバッファ初期遅延時間を決定する際に算出した遅延削減量を示す情報が、符号化方式変換装置1からPTS・DTS修正器313および314に供給される。
具体的には、上述のフィールド期間に相当する時間(図4(b)に示すR20)を示す情報が遅延削減量としてPTS・DTS修正器313および314に供給される。
ビデオPES生成器305は、入力されるPTS、DTSおよびビデオESからビデオPESを生成し出力する構成部である。ビデオTS生成器306は、入力されるビデオPESからビデオTSを生成し出力する構成部である。
また、オーディオTS復号器308〜オーディオTS生成器312の各構成部は、処理の対象がオーディオTS等の音声に関連するデータであり、上述のビデオTS復号器302〜ビデオTS生成器306とはデータの種類が異なるだけで、これら各構成部と同様の処理を行う構成部である。
なお、ビデオPES復号器303およびオーディオPES復号器309により、本発明のAVデータ変換装置における時刻情報取得手段が実現される。
また、オーディオ変換装置310は、本発明のAVデータ変換装置における音声変換手段の一例であり、入力された圧縮音声データの符号化方式を変換し、符号量を削減した音声圧縮データを出力する装置である。
PTS・DTS修正器313は、ビデオPESに含まれる時刻情報であるPTSおよびDTSから遅延削減量を減算することで、PTSおよびDTSを修正する構成部である。
具体的には、符号化方式変換装置1から遅延削減量を示す情報を受け取り、ビデオPES復号器303から受け取るPTSおよびDTSからその遅延削減量を減算し、ビデオPES生成器305に出力する。これにより、ビデオPESに含まれるPTSおよびDTSが修正される。
PTS・DTS修正器314も同様に、符号化方式変換装置1から遅延削減量を示す情報を受け取り、オーディオPES復号器309から受け取るPTSおよびDTSからその遅延削減量を減算する。また、減算後のPTSおよびDTSをオーディオPES生成器311に出力する。これにより、オーディオPESに含まれるPTSおよびDTSが修正される。
MPEG−2TS多重化器307は、入力されるビデオTSとオーディオTSとを多重化し出力する構成部である。
次に、図6を用いて、実施の形態2のAVデータ変換装置2の動作の流れを、時刻情報の修正に係る処理を中心に説明する。
図6は、実施の形態2のAVデータ変換装置2の動作の流れの概要を示すフロー図である。
MPEG−2TS分離器301は、AVデータ変換装置2に入力された、MPEG−2TSからビデオTSとオーディオTSとを分離する(S10)。
その後、ビデオPES復号器303はビデオPESを復号化し、PTSおよびDTSを取得する。また、オーディオPES復号器309はオーディオPESを復号化し、PTSおよびDTSを取得する(S11)。
PTS・DTS修正器313は、ビデオPES復号器303からPTSとDTSとを受け取る。また、PTS・DTS修正器314は、オーディオPES復号器309からPTSとDTSとを受け取る。
符号化方式変換装置1の遅延時間決定部104は遅延削減量を算出する(S12)。ここで、この遅延削減量とは、例えば、図4(b)に示すバッファ占有量の時間変化のグラフにおけるR20である。
算出された遅延削減量はPTS・DTS修正器313および314に出力される。
PTS・DTS修正器313および314は、符号化方式変換装置1から受け取る遅延増加量を用い、それぞれ受け取ったPTSおよびDTSを修正する(S13)。
PTS・DTS修正器313および314は、符号化方式変換装置1から受け取る遅延増加量を用い、それぞれ受け取ったPTSおよびDTSを修正する(S13)。
それぞれPTSおよびDTSが修正されたビデオPESとオーディオPESとから、ビデオTSとオーディオTSとが生成される。生成されたビデオTSとオーディオTSとはMPEG−2TS多重化器307により多重化されMPEG−2TSとして出力される(S14)。
以上のように、実施の形態2のAVデータ変換装置2は、実施の形態1の符号化方式変換装置1を備え、符号化方式変換装置1によりビデオESの符号化方式を変換することができる。
また、符号化方式変換装置1において決定されたトランスコード後のバッファ初期遅延時間を反映するように、MPEG−2TSにおける、画像と音声とを同期して再生させるための時刻情報を修正する。
さらに、ビデオTSだけでなくオーディオTSに対しても、トランスコード後のバッファ初期遅延時間を反映するように時刻情報を修正する。
これにより、AVデータ変換装置2から出力される圧縮AVデータの再生が指示された際の再生までの遅延時間を短くすることができる。
また、この再生開始時の遅延時間の削減のための処理において、入力データであるビデオESのバッファ占有量の時間変化を観察する必要はなく、入力されるビデオESを当該観察の間保持しておくバッファも不要である。
また、オーディオTSにおいてもビデオTSと同様に時刻情報が修正されることから、音声と動画との同期を正しく保つことができる。
なお、音声以外のデータが時刻情報を有する場合には、同様に、音声以外のデータのPTSおよびDTSを修正するようにしてもよい。また、オーディオESについてトランスコードしない場合には、オーディオ変換装置310を取り外し、オーディオPES復号器309とオーディオPES生成器311とを直結してもよい。
また、実施の形態1および2において、入力されたデータの符号化方式をMPEG−2からMPEG−4/AVCに変換し出力する場合について説明した。
しかし、変換前後の符号化方式は、MPEG−2およびMPEG−4/AVCに限られるものではない。変換前の符号化方式が、フレーム符号化が可能な符号化方式であり、変換後の符号化方式が、フィールド符号化が可能な符号化方式であれば、本発明の効果である、符号化方式の変換後の動画像データの再生開始時における遅延時間の効率的な削減が実現可能である。
本発明の符号化方式変換装置は、効率的に動画像データの再生開始時における遅延時間を削減することができ、従来よりも遅延時間を短くすることも可能である。
したがって、本発明は、このような符号化方式の変換を行う、デジタルコンテンツの再生装置、録画装置、送信装置、および受信装置等に有用である。
1 符号化方式変換装置
2 AVデータ変換装置
101 動画像復号化部
102 動画像符号化部
103 遅延時間抽出部
104 遅延時間決定部
105 判断部
301 MPEG−2TS分離器
302 ビデオTS復号器
303 ビデオPES復号器
305 ビデオPES生成器
306 ビデオTS生成器
307 MPEG−2TS多重化器
308 オーディオTS復号器
309 オーディオPES復号器
310 オーディオ変換装置
311 オーディオPES生成器
312 オーディオTS生成器
313、314 PTS・DTS修正器
2 AVデータ変換装置
101 動画像復号化部
102 動画像符号化部
103 遅延時間抽出部
104 遅延時間決定部
105 判断部
301 MPEG−2TS分離器
302 ビデオTS復号器
303 ビデオPES復号器
305 ビデオPES生成器
306 ビデオTS生成器
307 MPEG−2TS多重化器
308 オーディオTS復号器
309 オーディオPES復号器
310 オーディオ変換装置
311 オーディオPES生成器
312 オーディオTS生成器
313、314 PTS・DTS修正器
Claims (7)
- 第1の符号化方式で符号化された第1の動画像データの符号化方式を第2の符号化方式に変換する符号化方式変換装置であって、
前記第1の動画像データを復号化する復号化手段と、
前記第1の動画像データに含まれる、バッファ初期遅延時間を示す情報を抽出する抽出手段と、
前記第1の動画像データがフレーム毎に符号化されているか否かを判断する判断手段と、
前記第1の動画像データがフレーム毎に符号化されていると判断された場合、抽出された前記バッファ初期遅延時間より小さな値を、変換後のバッファ初期遅延時間として決定する決定手段と、
復号化された前記第1の動画像データを、フレームを構成する2枚のフィールドそれぞれ毎に前記第2の符号化方式で符号化し、第2の動画像データを得るとともに、前記第2の動画像データに、決定された前記変換後のバッファ初期遅延時間を設定する符号化手段と
を備える符号化方式変換装置。 - 前記決定手段は、抽出された前記バッファ初期遅延時間から、前記第1の動画像データにおけるフィールドの周期であるフィールド期間を減算した値を前記変換後のバッファ初期遅延時間として決定する
請求項1記載の符号化方式変換装置。 - 画像ストリームと音声ストリームとが多重化された圧縮AVデータの符号化方式を変換するAVデータ変換装置であって、
前記圧縮AVデータから前記画像ストリームと前記音声ストリームとを分離する分離手段と、
前記分離手段により得られる前記画像ストリームと前記音声ストリームのそれぞれから、画像と音声とを同期して再生させるための時刻情報を取得する時刻情報取得手段と、
前記画像ストリームを前記第1の動画像データとして受け取り、前記第2の動画像データである変換後の画像ストリームを出力する請求項1記載の符号化方式変換装置と、
前記符号化方式変換装置から前記変換後のバッファ初期遅延時間における遅延削減量を示す情報を受け取り、前記遅延削減量を、前記変換後の画像ストリームおよび前記音声ストリームに含まれるそれぞれの前記時刻情報に示される値から減算することでそれぞれの時刻情報を修正する修正手段と、
それぞれ前記修正手段により修正された時刻情報を含む画像ストリームと音声ストリームとを多重化する多重化手段と
を備えるAVデータ変換装置。 - さらに、前記分離手段により得られる前記音声ストリームの符号化方式を変換する音声変換手段を備え、
前記修正手段は、符号化方式が変換された後の前記音声ストリームの時刻情報を修正する
請求項3記載のAVデータ変換装置。 - 第1の符号化方式で符号化された第1の動画像データの符号化方式を第2の符号化方式に変換する方法であって、
前記第1の動画像データを復号化する復号化ステップと、
前記第1の動画像データに含まれる、バッファ初期遅延時間を示す情報を抽出する抽出ステップと、
前記第1の動画像データがフレーム毎に符号化されているか否かを判断する判断ステップと、
前記第1の動画像データがフレーム毎に符号化されていると判断された場合、抽出された前記バッファ初期遅延時間より小さな値を、変換後のバッファ初期遅延時間として決定する決定ステップと、
復号化された前記第1の動画像データを、フレームを構成する2枚のフィールドそれぞれ毎に前記第2の符号化方式で符号化し、第2の動画像データを得るとともに、前記第2の動画像データに、決定された前記変換後のバッファ初期遅延時間を設定する符号化ステップと
を含む符号化方式変換方法。 - 第1の符号化方式で符号化された第1の動画像データの符号化方式を第2の符号化方式に変換するためのプログラムであって、
前記第1の動画像データを復号化する復号化ステップと、
前記第1の動画像データに含まれる、バッファ初期遅延時間を示す情報を抽出する抽出ステップと、
前記第1の動画像データがフレーム毎に符号化されているか否かを判断する判断ステップと、
前記第1の動画像データがフレーム毎に符号化されていると判断された場合、抽出された前記バッファ初期遅延時間より小さな値を、変換後のバッファ初期遅延時間として決定する決定ステップと、
復号化された前記第1の動画像データを、フレームを構成する2枚のフィールドそれぞれ毎に前記第2の符号化方式で符号化し、第2の動画像データを得るとともに、前記第2の動画像データに、決定された前記変換後のバッファ初期遅延時間を設定する符号化ステップと
をコンピュータに実行させるためのプログラム。 - 第1の符号化方式で符号化された第1の動画像データの符号化方式を第2の符号化方式に変換する集積回路であって、
前記第1の動画像データを復号化する復号化手段と、
前記第1の動画像データに含まれる、バッファ初期遅延時間を示す情報を抽出する抽出手段と、
前記第1の動画像データがフレーム毎に符号化されているか否かを判断する判断手段と、
前記第1の動画像データがフレーム毎に符号化されていると判断された場合、抽出された前記バッファ初期遅延時間より小さな値を、変換後のバッファ初期遅延時間として決定する決定手段と、
復号化された前記第1の動画像データを、フレームを構成する2枚のフィールドそれぞれ毎に前記第2の符号化方式で符号化し、第2の動画像データを得るとともに、前記第2の動画像データに、決定された前記変換後のバッファ初期遅延時間を設定する符号化手段と
を備える集積回路。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006334801A JP2008148137A (ja) | 2006-12-12 | 2006-12-12 | 画像符号化装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006334801A JP2008148137A (ja) | 2006-12-12 | 2006-12-12 | 画像符号化装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008148137A true JP2008148137A (ja) | 2008-06-26 |
Family
ID=39607795
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006334801A Pending JP2008148137A (ja) | 2006-12-12 | 2006-12-12 | 画像符号化装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008148137A (ja) |
-
2006
- 2006-12-12 JP JP2006334801A patent/JP2008148137A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7844166B2 (en) | Reproduction device, video decoding device, synchronization/reproduction method, program and recording medium | |
JP4983923B2 (ja) | デコーダ装置、およびデコード方法 | |
JP2008278492A (ja) | 複数のビデオストリームを結合するシステム及びそれに伴う使用方法 | |
US20070269192A1 (en) | Stream generating apparatus, imaging apparatus, data processing apparatus and stream generating method | |
US10764594B2 (en) | Image encoding device and method, and image processing device and method for enabling bitstream concatenation | |
JP4775208B2 (ja) | 再生方法、再生プログラムおよび再生装置 | |
JP2010212996A (ja) | 情報処理装置および多重化処理方法 | |
JP2007043417A (ja) | 画像記録装置及び方法 | |
KR20040080930A (ko) | 정보 처리 장치 및 방법 | |
JP2005346781A (ja) | デジタル情報再生装置及び方法 | |
JP2009290768A (ja) | 映像処理装置および映像処理方法 | |
JP5046907B2 (ja) | 記録装置、その制御方法、プログラム | |
JP2008148137A (ja) | 画像符号化装置 | |
JP4289055B2 (ja) | トランスコーダおよびこれを用いた記録再生装置 | |
JP4528043B2 (ja) | 映像信号変換装置、変換方法及びこれを用いた映像信号記録装置 | |
JP2008136001A (ja) | 符号化方式変換装置 | |
JP2000295626A (ja) | 多段画像符号化装置 | |
JP2009088820A (ja) | 映像・音声信号伝送方法及びその伝送装置 | |
JP3749216B2 (ja) | デジタル映像音声記録装置 | |
JP2011091592A (ja) | 画像符号化装置、符号変換装置、画像記録装置、画像再生装置、画像符号化方法及び、集積回路 | |
JP4867872B2 (ja) | 画像処理装置、この画像処理装置の制御方法、及び、プログラム | |
WO2009090728A1 (ja) | メディア再生装置 | |
JP2008010997A (ja) | 情報処理装置、情報処理方法及び半導体集積回路 | |
JP2009038587A (ja) | 信号処理装置 | |
JP2013102295A (ja) | 画像符号化方法、画像符号化装置及びプログラム、画像復号方法、画像復号装置及びプログラム |