JP2008136001A - 符号化方式変換装置 - Google Patents

符号化方式変換装置 Download PDF

Info

Publication number
JP2008136001A
JP2008136001A JP2006320918A JP2006320918A JP2008136001A JP 2008136001 A JP2008136001 A JP 2008136001A JP 2006320918 A JP2006320918 A JP 2006320918A JP 2006320918 A JP2006320918 A JP 2006320918A JP 2008136001 A JP2008136001 A JP 2008136001A
Authority
JP
Japan
Prior art keywords
image data
moving image
delay time
encoding method
initial delay
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006320918A
Other languages
English (en)
Inventor
Hiroshi Arakawa
博 荒川
Tatsuro Shigesato
達郎 重里
Kazuo Saigo
賀津雄 西郷
Hideyuki Okose
秀之 大古瀬
Koji Arimura
耕治 有村
Hiroshi Tasaka
啓 田坂
Hisaki Maruyama
悠樹 丸山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2006320918A priority Critical patent/JP2008136001A/ja
Publication of JP2008136001A publication Critical patent/JP2008136001A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】変換後の動画像データの再生時の画質を向上させ、かつ、安定的に再生されるように変換する符号化方式変換装置を提供すること。
【解決手段】第1の符号化方式で符号化された第1の動画像データの符号化方式を、第1の符号化方式よりも符号化効率の高い第2の符号化方式に変換する符号化方式変換装置であって、第1の動画像データを復号化する動画像復号化部101と、第1の動画像データに含まれる、バッファ初期遅延時間を示す情報を抽出する遅延時間抽出部103と、抽出された情報に示されるバッファ初期遅延時間が入力されると、バッファ初期遅延時間より大きな値を、変換後のバッファ初期遅延時間として決定する遅延時間決定部104と、復号化された第1の動画像データを第2の符号化方式で符号化し、第2の動画像データを得るとともに、第2の動画像データに、決定された変換後のバッファ初期遅延時間を設定する動画像符号化部102とを備える。
【選択図】図1

Description

本発明は、デジタル放送などで用いられている圧縮画像データをより少ない符号量に再圧縮する符号化方式変換装置に関する。
従来、動画像データの圧縮方式として、デジタル衛星放送やDVD−Videoなど高画質の動画像に適用されるMPEG−2(Moving Picture Experts Group phase 2)がある。
このMPEG−2等の動画像符号化方式では、復号化を行うデコーダ側の、圧縮画像データを蓄積するバッファにおいてオーバーフローおよびアンダーフローを発生させないように圧縮画像データを作成するよう規格で定められている。
このことについて、MPEG−2では、規格書(ISO/IEC 13818−2)のAnnex C(Video Buffer Verifier)節に記載されており、そこでの模式図を図8(a)に示す。
図8(a)は、MPEG−2の圧縮画像データのデコーダ側バッファにおける占有量の時間変化の一例を示す図である。
図8(a)に示すように、デコーダに入力された圧縮画像データは、バッファへの蓄積が開始された時刻0から、所定の時間“vbv_delay”の経過後に、最初のフレームを構成するデータが、バッファから瞬時に引き抜かれる。また、その後、1/T秒ごとに、各フレームを構成するデータが、バッファから引き抜かれる。
ここで、“vbv_delay”は、圧縮画像データのバッファへの蓄積の開始から、バッファに蓄積されたデータのバッファからの引き抜きの開始までの時間であり、「バッファ初期遅延時間」または単に「初期遅延時間」と呼ぶ。なお、バッファから引き抜かれた圧縮画像データは復号を行う処理部で復号化され、再生等される。
また、“T”は、一般にフレームレートと呼ばれる数値であり、1秒間にどれだけの数のフレームが更新されるか、という値である。
また、このような圧縮画像データについて、データ量を削減する符号化方式変換技術(トランスコード技術)がある(例えば、特許文献1参照)。
特許文献1記載のトランスコード技術によれば、入力されたMPEG−2トランスポートストリーム(TS)から圧縮画像データのストリームであるビデオTSと、圧縮音声データのストリームであるオーディオTSとを分離する。
さらに、上記分離により得られたビデオTSに対し、符号量削減のためのトランスコードを行う。また、このトランスコードの前後で、PTS(Presentation Time Stamp)およびDTS(DecodingTime Stamp)は同じ値とする(第20頁、段落番号[0165])。
最後に、トランスコード後のビデオTSと上記分離で得られたオーディオTSとを多重化し出力する。
ここで、PTSおよびDTSは、画像と音声とを同期して再生させるための時刻情報である。具体的には、PTSは、いつ再生を行うかを示す時刻情報であり、DTSは、いつ復号化を行うかを示す時刻情報である。また、これらは、ストリームを構成する各PES(Packetized Elementary Stream)のヘッダ部分に含まれている。
すなわち、上記従来の技術では、バッファ初期遅延時間である“vbv_delay”をトランスコードの前後で同じにすることを意味している。
これにより、トランスコードに係る処理を簡易化しつつ、入力されたデータの符号量を削減して出力することができる。
特開2001―251616号公報
ここで、上記従来の技術を用い、入力データのビットレートを半分にする場合を想定する。この場合、デコーダ側バッファにおける圧縮画像データの占有量の推移は、図8(b)に示すようになる。
図8(b)は、従来のトランスコード技術によりビットレートを半分にした場合のデコーダ側バッファにおける圧縮画像データの占有量の推移の一例を示す図である。
具体的には、入力された圧縮画像データが、ビットレートが24Mbpsである図8(a)に示す圧縮画像データであり、トランスコード後のビットレートが12Mbpsである場合を想定している。
このようにビットレートを半分にし、かつ、“vbv_delay”はトランスコード前と等しくした場合、先頭フレームの再生のためにバッファから引き抜かれる符号量は、理論上、図8(a)に示す符号量V1の半分である符号量V2になる。
このような場合でも、トランスコード後の先頭フレームを構成するデータの符号量がV2以下であれば、デコーダは先頭フレームを正常に復号化することができる。
しかし、トランスコード後の先頭フレームを構成するデータの符号量がV2を超える場合、復号化により得られる画像の画質が低下する、または、復号化自体が行えない等の不具合が発生することになる。
例えば、近年、MPEG−2よりも符号化効率の高い符号化方式であるMPEG−4/AVCが動画像の圧縮符号化に用いられている。
このMPEG−4/AVCにより圧縮符号化された動画像データにおいては、動きベクトルの精度が高く、また、16×16画素から4×4画素までの動き補償サイズを選択できるため、PフレームおよびBフレームに対する符号化効率が高い。そのため、先頭フレームであるIフレームに、より多くの符号量を割当てることが可能である。
ここで、Iフレームは、圧縮画像データの復号化の際に複数のPフレームおよびBフレームから参照されるフレームである。つまり、Iフレームの符号量が大きい場合、複数のフレームから共通して参照される画像の画質が高いことを意味する。
そのため、Iフレームの符号量を大きくすることで、当該圧縮画像データが再生された際の画質を、Iフレームの符号量大を大きくする前の画質よりも高いものとすることが可能である。
特に動きの少ないシーケンスにおいて、Iフレームにより多くの符号量を割り当てることにより、画質を改善することが可能となる。
つまり、MPEG−4/AVCに規定される符号化方式は、Iフレームの符号量が、符号化効率と比して比較的大きい、または大きくすることができるという特性を有している。そして、この特性を生かし、Iフレームの符号量を大きくし、PフレームおよびBフレームの符号量を小さくすることで全体の符号量を増加させずに再生時の画質を向上させることができるという特徴がある。
そこで、例えば、MPEG−2の圧縮画像データ(ビットレート:24Mbps)を、MPEG−4/AVC(ビットレート:12Mbps)の圧縮画像データに変換する場合を想定する。
この場合、上記従来の技術のように、バッファ初期遅延時間を、トランスコードの前後で同じにした場合、例えば、画質の向上等を目的として先頭フレームであるIフレームの符号量を大きくすると、当該符号量がV2を超える場合がある。
この場合、先頭フレームの再生に本来的に必要な符号量がバッファに蓄積されていない状態で、バッファに蓄積されたデータが引き抜かれることになる。そのため、上述のように先頭フレームを正常に復号化できないという不具合が発生することになる。
一方で、このような不具合の発生を防ぐためには、先頭フレームの符号量をV2以下に制限することも考えられるが、このように先頭フレームの符号量を制限するということは、画質を向上させることが困難となることを意味する。
また、先頭フレームであるIフレームだけでなく、先頭以降のGOP(Group Of Pictures)毎に挿入されるIフレームにおいても、おおむねバッファ初期遅延時間に相当する符号量(V2)に制限され、上述の不具合が発生することになる。
本発明は、前記従来の課題を考慮し、符号化された動画像データの符号化方式を符号化効率の高い符号化方式に変換する際に、変換後の動画像データの再生時の画質を向上させ、かつ、安定的に再生されるように変換する符号化方式変換装置を提供することを目的とする。
上記従来の課題を解決するために、本発明の符号化方式変換装置は、第1の符号化方式で符号化された第1の動画像データの符号化方式を、前記第1の符号化方式よりも符号化効率の高い第2の符号化方式に変換する符号化方式変換装置であって、前記第1の動画像データを復号化する復号化手段と、前記第1の動画像データに含まれる、バッファ初期遅延時間を示す情報を抽出する抽出手段と、抽出された前記情報に示される前記バッファ初期遅延時間が入力されると、前記バッファ初期遅延時間より大きな値を変換後のバッファ初期遅延時間として決定する決定手段と、復号化された前記第1の動画像データを前記第2の符号化方式で符号化し、第2の動画像データを得るとともに、前記第2の動画像データに、決定された前記変換後のバッファ初期遅延時間を設定する符号化手段とを備える。
このように、本発明の符号化方式変換装置は、入力される動画像データに符号化方式変換処理を行う際、変換後のバッファ初期遅延時間の値を変換前よりも大きくすることができる。
これにより、変換後の先頭フレームの符号量を増やすことができ、結果として第2の動画像データが再生された際の画質を向上させ、かつ、安定的に再生させることができる。
また、さらに、(a)前記第2の動画像データのビットレートとしてとりうる複数の値と、(b)前記複数の値それぞれに応じて予め決定された、前記第2の動画像データが再生された場合の画質を向上させるために必要なフレームあたりの符号量とが記録された算出表を備え、前記決定手段は、(c)前記符号化手段により得られる前記第2の動画像データのビットレートと、(d)前記算出表を参照することで得られる、前記ビットレートに対応する前記フレームあたりの符号量とを用いて前記変換後のバッファ初期遅延時間を決定するとしてもよい。
これにより、変換後のバッファ初期遅延時間を容易に決定することができる。また、出力する第2の動画像データのビットレートが変更になった場合でも、変更後のビットレートに適したバッファ初期遅延時間を決定することができる。つまり、第2の動画像データのビットレートが変更になった場合でも、第2の動画像データが再生された際の画質を向上させ、かつ、安定的に再生させることができる。
また、さらに、前記抽出手段により抽出された情報に示されるバッファ初期遅延時間を、外部からの指示に従って、前記決定手段および前記符号化手段のいずれか一方にのみ入力する選択手段を備え、前記符号化手段は、前記バッファ初期遅延時間が前記符号化手段に入力された場合、入力された前記バッファ初期遅延時間を前記第2の動画像データに設定し、前記バッファ初期遅延時間が前記決定手段に入力された場合、前記決定手段により決定された前記変換後のバッファ初期遅延時間を前記第2の動画像データに設定するとしてもよい。
これにより、必要に応じて、変換後のバッファ初期遅延時間を変換前より大きくするか、または変換の前後で維持するかを選択することができる。また、バッファ初期遅延時間を変換の前後で維持する場合、つまり、符号化手段に、抽出手段から得られるバッファ初期遅延時間を入力する場合、遅延時間決定手段は何ら処理を行う必要がないため、符号化方式変換装置全体としての処理負荷が軽減する。
また、本発明のAVデータ変換装置は、画像ストリームと音声ストリームとが多重化された圧縮AVデータの符号化方式を変換するAVデータ変換装置であって、前記圧縮AVデータから前記画像ストリームと前記音声ストリームとを分離する分離手段と、前記分離手段により得られる前記画像ストリームと前記音声ストリームのそれぞれから、画像と音声とを同期して再生させるための時刻情報を取得する時刻情報取得手段と、前記画像ストリームを前記第1の動画像データとして受け取り、前記第2の動画像データである変換後の画像ストリームを出力する本発明の符号化方式変換装置と、前記符号化方式変換装置から前記変換後のバッファ初期遅延時間における遅延増加量を示す情報を受け取り、前記遅延増加量を前記変換後の画像ストリームおよび前記音声ストリームに含まれるそれぞれの前記時刻情報に示される値に加算することでそれぞれの時刻情報を修正する修正手段と、それぞれ前記修正手段により修正された時刻情報を含む画像ストリームと音声ストリームとを多重化する多重化手段とを備える。
これにより、第2の動画像データ、すなわち、AVデータ変換装置から出力される圧縮AVデータに含まれる動画像データの画質を向上させ、かつ、安定して再生させることができる。また、音声データにおいても動画像データと同様に時刻情報が修正されることから、音声と動画との同期を正しく保つことができる。
また、さらに、前記分離手段により得られる前記音声ストリームの符号化方式を変換する音声変換手段を備え、前記修正手段は、符号化方式が変換された後の前記音声ストリームの時刻情報を修正するとしてもよい。
これにより、音声データについてもビットレートを削減しつつ、上記と同様に、音声と動画との同期を正しく保つことができる。
なお、本発明の符号化方式変換装置は、集積回路として実現することもできる。
さらに、本発明は、本発明の符号化方式変換装置の特徴的な構成部の動作をステップとする方法として実現したり、それらステップをコンピュータに実行させるためのプログラムとして実現したり、そのプログラムが記録された記録媒体として実現することもできる。そして、そのプログラムをインターネット等の伝送媒体又はDVD等の記録媒体を介して配信することもできる。
以上のように、本発明の符号化方式変換装置によれば、符号化方式の変換後のバッファ初期遅延時間の値を変換前よりも大きくすることができる。これにより符号化方式変換装置から出力された動画像データの画質を向上させ、かつ、当該動画像データを安定的に再生させることができる。
以下、本発明の実施の形態について図面を参照しながら説明する。
(実施の形態1)
まず、本発明の実施の形態1における符号化方式変換装置の構成を図1および図2を用いて説明する。
図1は、本発明の実施の形態1における符号化方式変換装置の機能的な構成を示す機能ブロック図である。
図1に示す符号化方式変換装置1は、第1の符号化方式で符号化された第1の動画像データの符号化方式を、第1の符号化方式よりも符号化効率の高い第2の符号化方式に変換する装置である。
実施の形態1および後述する実施の形態2においては、具体的には、第1の符号化方式はMPEG−2の規格に準拠した符号化方式であり、第2の符号化方式は、MPEG−4/AVCの規格に準拠した符号化方式である。
なお、以下、「MPEG−2により符号化される」という場合、MPEG−2の規格に準拠した符号化方式により符号化されることを意味する。また、同様に「MPEG−4/AVCにより符号化される」という場合、MPEG−4/AVCの規格に準拠した符号化方式により符号化されることを意味する。
符号化方式変換装置1は、動画像復号化部101と、動画像符号化部102と、遅延時間抽出部103と、遅延時間決定部104と、算出表105とを備える。
動画像復号化部101は、符号化方式変換装置1に入力された動画像データを復号化する処理部である。本実施の形態においては、MPEG−2により符号化されている圧縮画像データの復号化を行う。なお、符号化方式変換装置1に入力される圧縮画像データは、本発明の符号化方式変換装置における第1の動画像データの一例である。
遅延時間抽出部103は、動画像復号化部101に入力された圧縮画像データに含まれるバッファ初期遅延時間を示す情報を抽出する処理部である。
MPEG−2の場合、シーケンス先頭フレームのピクチャヘッダに“vbv_delay”が含まれており、この“vbv_delay”に示される値を取り出し、この値を用いてバッファ初期遅延時間を算出する。
具体的には、“vbv_delay”は1/90ミリ秒が基準単位であるため、バッファ初期遅延時間は以下の(式1)により求まる。
バッファ初期遅延時間(ミリ秒)=vbv_delay/90 (式1)
遅延時間決定部104は、遅延時間抽出部103により得られたバッファ初期遅延時間が入力されると、当該バッファ初期遅延時間より大きな値を、変換後のバッファ初期遅延時間として決定する処理部である。
具体的には、動画像符号化部102による符号化後の圧縮画像データのビットレートと、算出表105から得られる数値とを用いて算出した値を、遅延時間抽出部103から得られるバッファバッファ初期遅延時間に加算し、加算後の値をトランスコード後の圧縮画像データにおけるバッファ初期遅延時間(以下、「トランスコード後のバッファ初期遅延時間」という。)として出力する。算出表105については、図2を用いて後述する。
動画像符号化部102は、動画像復号化部101が出力するデータをMPEG−4/AVCにより符号化する処理部である。なお、動画像符号化部102から出力される圧縮画像データは、本発明の符号化方式変換装置における第2の動画像データの一例である。
また、動画像符号化部102は、この符号化の際、遅延時間決定部104が出力するバッファ初期遅延時間を符号化後の圧縮画像データに設定する。つまり、当該バッファ初期遅延時間を示す情報をトランスコード後の圧縮画像データに含ませる処理を行う。
また、当該バッファ初期遅延時間に応じて、トランスコード後の圧縮画像データがMPEG−4/AVCの規格を遵守するデータとなるように符号化処理を行う。
具体的には、MPEG−4/AVCの規格において、バッファ初期遅延時間は、圧縮画像データの“Buffering period SEI”の、“initial_cpb_removal_delay”に格納される。
また、この格納された値を用いてデコーダ仮想バッファ(CPB)がアンダーフローしないように、各フレームの符号量制御が行われる。
なお、遅延時間決定部104は、動画像符号化部102が採用する符号化方式の標準規格に応じて自身の出力値の上限値を設けてもよい。つまり、遅延時間決定部104は、その規格で許されているバッファ初期遅延時間の最大値を超えないように、自身の出力値に対し上限を設けクリップ処理後に出力するようにしてもよい。
図2は、実施の形態1における算出表のデータ構成例を示す図である。
算出表105は、符号化方式変換装置1が備える記憶媒体(図示せず)に保持されており、遅延時間決定部104は、算出表105に基づいてトランスコード後のバッファ初期遅延時間を決定する。
算出表105の左側の列はトランスコード後の圧縮画像データのビットレートである目標ビットレートであり、目標ビットレートとしてとりうる複数の値が記録されている。
また、右側の列は、トランスコード後の圧縮画像データの再生時の画質を向上させるために必要となるフレームあたりの符号量であり、それぞれ目標ビットレートと対応付けられている。
例えば、算出表105に示すように、目標ビットレートが8Mbpsであれば、そのビットレートの圧縮画像データが再生された際の画質の向上に必要となる符号量は4Mビットである。
つまり、当該圧縮画像データを再生するために復号化するデコーダにおいて、当該圧縮画像データがバッファに蓄積され始め4Mビット蓄積された時点以降であれば、先頭フレームを構成する全データを一括してバッファから引き抜くことができ、先頭フレームを正常に復号化できる。また、復号化後のデータが再生された際の画質もある一定のレベルに達したものになる。
なお、算出表105の右側の列の値は、例えば、実験により求められる値である。
遅延時間決定部104は、この算出表105を用いて遅延増加量を算出する。また、遅延時間抽出部103から出力されるトランスコード前の圧縮画像データにおけるバッファ初期遅延時間(以下、「トランスコード前のバッファ初期遅延時間」という。)に、当該遅延増加量を加算することでトランスコード後のバッファ初期遅延時間を決定する。
この遅延増加量は、具体的には、算出表105から得る値を用いて、以下の(式2)により算出される。
遅延増加量=(フレームあたり必要な符号量/目標ビットレート)−遅延時間抽出部103の出力するバッファ初期遅延時間 (式2)
例えば、目標ビットレートが8Mbps、抽出されたバッファ初期遅延時間が0.3秒の場合、遅延増加量は、(4/8)−0.3=0.2秒となる。
このようにして算出された値が、バッファ初期遅延時間の増加分となる。つまり、遅延時間抽出部103の出力するバッファ初期遅延時間に、算出された値が加算され、トランスコード後のバッファ初期遅延時間として動画像符号化部102へ出力される。
符号化方式変換装置1は、このような算出表105を有することにより、容易にトランスコード後のバッファ初期遅延時間を決定することができる。また、目標ビットレートが変更された場合であっても、変更後の目標ビットレートに適したバッファ初期遅延時間を決定することができる。
次に、以上のように構成された符号化方式変換装置1の動作の流れを、図3を用いて説明する。
図3は、実施の形態1の符号化方式変換装置1の動作の流れを示すフロー図である。
動画像復号化部101は、符号化方式変換装置1に入力された、MPEG−2により符号化されている圧縮画像データを復号化する(S1)。
遅延時間抽出部103は入力データからバッファ初期遅延時間を抽出する(S2)。具体的には、シーケンス先頭フレームのピクチャヘッダに含まれる“vbv_delay”に示される値を取り出し、この値を用いてバッファ初期遅延時間を算出する。
ここで、入力データにおけるバッファ初期遅延時間、つまりトランスコード前の圧縮画像データのバッファ初期遅延時間を“D1”とする。
遅延時間決定部104は、トランスコード後の圧縮画像データのビットレートと、算出表105を参照することで得られる当該ビットレートに対応するフレームあたりの符号量とを用いて、トランスコード後のバッファ初期遅延時間を決定する(S3)。
なお、トランスコード後の圧縮画像データのビットレートは、例えば、動画像符号化部102から取得することができる。
遅延時間決定部104により決定されたバッファ初期遅延時間を“D2”とすると、D1とD2との関係は、“D1<D2”となる。
つまり、トランスコード前の圧縮画像データにおけるバッファ初期遅延時間(以下、「トランスコード前のバッファ初期遅延時間」という。)よりも大きな値を、トランスコード後のバッファ初期遅延時間として決定する。
動画像符号化部102は、遅延時間決定部104により決定されたバッファ初期遅延時間を用い、動画像復号化部101により復号化されたデータを、MPEG−4/AVCにより符号化する(S4)。
つまり、動画像符号化部102から得られる圧縮画像データにはバッファ初期遅延時間として“D2”を示す情報が含まれている。
これにより、このようにトランスコード処理が行われた後の圧縮画像データを再生する装置においては、バッファへの当該圧縮画像データの蓄積の開始後、D2が経過した後に先頭フレームを構成するデータがバッファから引き抜かれることになる。
図4は、実施の形態1における、圧縮画像データが再生される際のデコーダ側バッファにおける占有量の時間変化を、従来の技術を用いた場合の時間変化と比較する図である。
図4(a)は、符号化方式変換装置1への入力データであるMPEG−2の圧縮画像データのデコーダ側バッファにおける占有量の時間変化の一例を示す図である。
つまり、トランスコード前の圧縮画像データが再生装置等で再生される場合の、当該再生装置等のバッファにおける占有量の時間変化の一例を示している。
また、この圧縮画像データはバッファ初期遅延時間として“D1”が設定されており、ビットレートは24Mbpsであると想定する。
この圧縮画像データは、バッファへ蓄積され始めてからD1が経過し、蓄積量がV10となった時点で先頭フレームを構成するデータがバッファから引き抜かれ復号化される。
図4(b)は、このような入力データに対し、トランスコード前後でバッファ初期遅延時間を維持した場合の、デコーダ側バッファにおける占有量の時間変化の一例を示す図である。
また、このトランスコード後の圧縮画像データのビットレートは12Mbpsであると想定する。
この場合、バッファ初期遅延時間は、トランスコード前と同じく“D1”であるため、バッファへ蓄積され始めてからD1が経過した時点での蓄積量V20は、おおよそV10の1/2である。
ここで、上述のように、MPEG−4/AVCにおいては、Iフレームの符号量を大きくすることで画質の向上を図ることができる。つまり、画質の向上を考慮してIフレームの符号量が符号化効率と比して比較的大きくされている場合、先頭フレームであるIフレームの符号量が1/2まで小さくなっていない場合がある。
そのため、この状態で、蓄積開始からD1経過後にバッファに蓄積されているデータが引き抜かれた場合、先頭フレームの正常な復号化に必要なデータが揃っていない状態で、先頭フレームの復号化が行われようとすることになる。
結果として、画質が劣悪な状態で再生されたり、復号化自体が行われなかったりすることになる。
図4(c)は、実施の形態1の符号化方式変換装置1によるトランスコード後の圧縮画像データの、デコーダ側バッファにおける占有量の時間変化の一例を示す図である。
図4(c)に示すように、符号化方式変換装置1では、トランスコード後のバッファ初期遅延時間“D2”を、トランスコード前のバッファ初期遅延時間“D1”よりも大きなものとする。
これにより、遅延増加量に対応し、圧縮画像データのバッファへの蓄積開始から、最初にバッファから圧縮画像データが引き抜かれるまでの間に蓄積される符号量(以下、「初期符号量」という。)が増加する。
この初期符号量における増加量は、図4(c)では“V30”で示されている。つまり、初期符号量は、“V20+V30”となる。
また、この増加量は図4(c)に示すように、遅延増加量に比例する値であり、遅延増加量は、図2の算出表105に記録されている実験等によって求められた数値を用いて遅延時間決定部104によって算出される値である。
そのため、初期符号量“V20+V30”は、MPEG−4/AVCにより符号化され、ビットレートが12Mbpsである圧縮画像データが復号化され再生される際の画質が向上される符号量であり、当該符号量を蓄積可能となるバッファ初期遅延時間が当該圧縮画像データに設定される。
従って、当該圧縮画像データを再生する装置では、先頭フレームを構成する全てのデータがバッファに蓄積された後に、バッファからこれら全データが引き抜かれ、復号化される。さらに、復号化されたデータの再生時の画質はある一定のレベルに達したものになる。
すなわち、先頭フレームの画質が不用に劣化する等の不具合が発生することなく、先頭フレームは正常に符号化され再生され、画質も一定のレベルに達したものとなる。
以上のように、実施の形態1の符号化方式変換装置1は、入力される圧縮画像データにトランスコード処理を行う際、トランスコード後のバッファ初期遅延時間の値をトランスコード前よりも大きくすることができる。
これにより、トランスコード後の先頭フレームの符号量を増やすことができ、結果として符号化画像の画質を向上させ、かつ、安定的に再生させることができる。
(実施の形態1の変形例)
実施の形態1の符号化方式変換装置1は、上述のようにトランスコード後のバッファ初期遅延時間の値をトランスコード前よりも大きくすることができる。しかし、Iフレームの符号量が大きくない、または大きくする必要がない場合など、トランスコード後のバッファ初期遅延時間の値をトランスコード前よりも大きくする必要のない場合も考えられる。
そこで、トランスコード後のバッファ初期遅延時間の値をトランスコード前よりも大きくするか、維持するかを選択可能な構成の符号化方式変換装置について実施の形態1の変形例として説明する。
図5は、バッファ初期遅延時間の増加または維持の選択が可能な符号化方式変換装置2の機能的な構成を示す機能ブロック図である。
図5に示すように、本変形例の符号化方式変換装置2は、実施の形態1の符号化方式変換装置2が備える各処理部に加え、選択部106を備えている。
選択部106は、遅延時間抽出部103から出力されるバッファ初期遅延時間を、遅延時間決定部104および動画像符号化部102のいずれか一方に入力する処理部である。
また、選択部106は、符号化方式変換装置2の外部からの指示に従って入力先の選択を行う。外部からの指示とは、例えば、符号化方式変換装置2のユーザによる指示である。
遅延時間抽出部103から出力されるバッファ初期遅延時間の入力先として遅延時間決定部104が選択された場合、実施の形態1の符号化方式変換装置1と同じ処理の流れになり、トランスコード後のバッファ初期遅延時間の値は、トランスコード前よりも大きなものになる。
また、入力先として、動画像符号化部102が選択された場合は、トランスコード前のバッファ初期遅延時間が、そのままトランスコード後のバッファ初期遅延時間として採用される。つまり、トランスコードの前後でバッファ初期遅延時間が維持される。
このように、遅延時間抽出部103から出力されるバッファ初期遅延時間の入力先を選択可能とすることで、必要に応じて、トランスコード後のバッファ初期遅延時間の値をトランスコード前よりも大きなものにするか否かを選択できる。
また、バッファ初期遅延時間の入力先として動画像符号化部102が選択された場合、遅延時間決定部104が何らかの処理を行う必要がないため、符号化方式変換装置2全体としての処理負荷が軽減する。
(実施の形態2)
実施の形態2として、実施の形態1の符号化方式変換装置1が組み込まれたAVデータ変換装置について説明する。
まず、図6を用いて、実施の形態2のAVデータ変換装置3の構成を説明する。
図6は、実施の形態2のAVデータ変換装置3の構成を示すブロック図である。
図6に示すAVデータ変換装置3は、画像ストリームおよび音声ストリームが多重化された圧縮AVデータを入力データとし、入力データに対しトランスコード処理を行うことにより符号量が削減された圧縮AVデータを出力する装置である。
AVデータ変換装置3が備える各構成部について以下に説明する。
MPEG−2TS分離器301は、入力されたMPEG−2TSからビデオTSとオーディオTSとを分離し出力する構成部である。
ビデオTS復号器302は、入力されたビデオTSを復号化し、ビデオPESを出力する構成部である。ビデオPES復号器303は、入力されたビデオPESを復号化し、PTS、DTSおよびビデオエレメンタリーストリーム(ES)を出力する構成部である。
符号化方式変換装置1は、入力されるビデオESに対し、実施の形態1で説明した処理と同様の動作を行う。
具体的には、入力されるビデオESに対し、MPEG−4/AVCによるトランスコード処理を行うことでビットレートを削減させ、トランスコード後のビデオESを出力する。
また、トランスコード後のビデオESには、トランスコード前よりも大きな値のバッファ初期遅延時間が設定されている。
つまり、実施の形態2においては、符号化方式変換装置1に入力されるビデオESは、本発明の符号化方式変換装置における第1の動画像データであり、符号化方式変換装置1から出力されるビデオESは、本発明の符号化方式変換装置における第2の動画像データである。
また、トランスコード後のバッファ初期遅延時間を決定する際に算出した遅延増加量を示す情報が、符号化方式変換装置1からPTS・DTS修正器313および314に供給される。
ビデオPES生成器305は、入力されるPTS、DTSおよびビデオESからビデオPESを生成し出力する構成部である。ビデオTS生成器306は、入力されるビデオPESからビデオTSを生成し出力する構成部である。
また、オーディオTS復号器308〜オーディオTS生成器312の各構成部は、処理の対象がオーディオTS等の音声に関連するデータであり、上述のビデオTS復号器302〜ビデオTS生成器306とはデータの種類が異なるだけで、これら各構成部と同様の処理を行う構成部である。
なお、ビデオPES復号器303およびオーディオPES復号器309により、本発明のAVデータ変換装置における時刻情報取得手段が実現される。
また、オーディオ変換装置310は、本発明のAVデータ変換装置における音声変換手段の一例であり、入力された圧縮音声データの符号化方式を変換し、符号量を削減した音声圧縮データを出力する装置である。
PTS・DTS修正器313は、ビデオPESに含まれる時刻情報であるPTSおよびDTSに遅延増加量を加算することで、PTSおよびDTSを修正する構成部である。
具体的には、符号化方式変換装置1から遅延増加量を示す情報を受け取り、その遅延増加量を、ビデオPES復号器303から受け取るPTSおよびDTSに加算し、ビデオPES生成器305に出力する。これにより、ビデオPESに含まれるPTSおよびDTSが修正される。
PTS・DTS修正器314も同様に、符号化方式変換装置1から遅延増加量を示す情報を受け取り、その遅延増加量をオーディオPES復号器309から受け取るPTSおよびDTSに加算する。また、加算後のPTSおよびDTSをオーディオPES生成器311に出力する。これにより、オーディオPESに含まれるPTSおよびDTSが修正される。
MPEG−2TS多重化器307は、MPEG−2規格の多重化方式により入力されるビデオTSとオーディオTSとを多重化しMPEG−2TSとして出力する構成部である。
次に、図7を用いて、実施の形態2のAVデータ変換装置3の動作の流れを、時刻情報の修正に係る処理を中心に説明する。
図7は、実施の形態2のAVデータ変換装置3の動作の流れの概要を示すフロー図である。
MPEG−2TS分離器301は、AVデータ変換装置3に入力された、MPEG−2TSからビデオTSとオーディオTSとを分離する(S10)。
その後、ビデオPES復号器303はビデオPESを復号化し、PTSおよびDTSを取得する。また、オーディオPES復号器309はオーディオPESを復号化し、PTSおよびDTSを取得する(S11)。
PTS・DTS修正器313は、ビデオPES復号器303からPTSとDTSとを受け取る。また、PTS・DTS修正器314は、オーディオPES復号器309からPTSとDTSとを受け取る。
符号化方式変換装置1の遅延時間決定部104は遅延増加量を算出する(S12)。算出された遅延増加量はPTS・DTS修正器313および314に出力される。
PTS・DTS修正器313および314は、符号化方式変換装置1から受け取る遅延増加量を用い、それぞれ受け取ったPTSおよびDTSを修正する(S13)。
それぞれPTSおよびDTSが修正されたビデオPESとオーディオPESとから、ビデオTSとオーディオTSとが生成される。生成されたビデオTSとオーディオTSとはMPEG−2TS多重化器307により多重化されMPEG−2TSとして出力される(S14)。
以上のように、実施の形態2のAVデータ変換装置3は、実施の形態1の符号化方式変換装置1を備え、符号化方式変換装置1によりビデオESの符号化方式を変換することで符号量を削減することができる。
また、オーディオ変換装置310によりオーディオESの符号化方式を変換することで符号量を削減することができる。
また、符号化方式変換装置1において決定されたトランスコード後のバッファ初期遅延時間を反映するように、MPEG−2TSにおける、画像と音声とを同期して再生させるための時刻情報を修正する。
具体的には、ビデオTSだけでなくオーディオTSに対しても、トランスコード後のバッファ初期遅延時間を反映するように時刻情報を修正する。
これにより、AVデータ変換装置3から出力されるMPEG−2TSが再生された際の画質を向上させ、かつ、安定して再生させることができる。
また、オーディオTSにおいてもビデオTSと同様に時刻情報が修正されることから、音声と動画との同期を正しく保つことができる。
なお、音声以外のデータが時刻情報を有する場合には、同様に、音声以外のデータのPTSおよびDTSを修正するようにしてもよい。また、オーディオESについてトランスコードしない場合には、オーディオ変換装置310を取り外し、オーディオPES復号器309とオーディオPES生成器311とを直結してもよい。
また、実施の形態1および2において、符号化効率が高くなる方向に符号化方式を変換する例として、入力されたデータの符号化方式をMPEG−2からMPEG−4/AVCに変換し出力する場合について説明した。
しかし、変換前後の符号化方式は、MPEG−2およびMPEG−4/AVCに限られるものではない。出力データの符号化方式の符号化効率が、入力データの符号化方式の符号化効率より高いものであればよい。
また、例えば、変換前後の符号化方式が同じ規格に基づく符号化方式であってもよい。例えば、変換前後の符号化方式が、ともにMPEG−4/AVCに規定される符号化方式であっても、変換後の動画像データのビットレートが変換前よりも小さいものであれば、変換前の符号化方式よりも変換後の符号化方式の方が符号化効率が高いということができる。
なお、MPEG−2からMPEG−4/AVCに変換する場合のように、先頭フレームとなるフレームの符号量が符号化効率と比して比較的大きくなる符号化方式に変換する場合に本発明の効果は最も顕著なものとなる。
また、実施の形態1およびその変形例の符号化方式変換装置1および2、並びに、実施の形態2のAVデータ変換装置3の各構成部は、CPU、RAM、ROM、不揮発性メモリ等のハードウェア資源との組み合わせにより、集積回路であるLSIとして実現される場合がある。これら各装置における各構成部は、個別に1チップ化されても良いし、一部又はすべてを含むように1チップ化されても良い。
本発明の符号化方式変換装置は、符号化された動画像データを、符号化効率の高い符号化方式に変換する際に、バッファ初期遅延時間を変更しない従来の方式に比べ、Iフレームでの符号量をより多く割当可能である。
そのため、符号化後の画質をより改善することができる。特に、時間相関をより効果的に用いる最新の動画像符号化方式であるMPEG−4/AVCに変換するにおいて効果が顕著である。
したがって、本発明は、このような符号化方式の変換を行う、デジタルコンテンツの再生装置、録画装置、送信装置、および受信装置等に有用である。
実施の形態1における符号化方式変換装置の機能的な構成を示す機能ブロック図である。 実施の形態1における算出表のデータ構成例を示す図である。 実施の形態1の符号化方式変換装置の動作の流れを示すフロー図である。 実施の形態1における、圧縮画像データが再生される際のデコーダ側バッファにおける占有量の時間変化を、従来の技術を用いた場合の時間変化と比較する図である。 バッファ初期遅延時間の増加または維持の選択が可能な符号化方式変換装置の機能的な構成を示す機能ブロック図である。 実施の形態2のAVデータ変換装置の構成を示すブロック図である。 実施の形態2のAVデータ変換装置の動作の流れの概要を示すフロー図である。 従来の技術における、デコーダ側バッファにおける圧縮画像データの占有量の推移の例を示す図である。
符号の説明
1、2 符号化方式変換装置
3 AVデータ変換装置
101 動画像復号化部
102 動画像符号化部
103 遅延時間抽出部
104 遅延時間決定部
105 算出表
106 選択部
301 MPEG−2TS分離器
302 ビデオTS復号器
303 ビデオPES復号器
305 ビデオPES生成器
306 ビデオTS生成器
307 MPEG−2TS多重化器
308 オーディオTS復号器
309 オーディオPES復号器
310 オーディオ変換装置
311 オーディオPES生成器
312 オーディオTS生成器
313、314 PTS・DTS修正器

Claims (8)

  1. 第1の符号化方式で符号化された第1の動画像データの符号化方式を、前記第1の符号化方式よりも符号化効率の高い第2の符号化方式に変換する符号化方式変換装置であって、
    前記第1の動画像データを復号化する復号化手段と、
    前記第1の動画像データに含まれる、バッファ初期遅延時間を示す情報を抽出する抽出手段と、
    抽出された前記情報に示される前記バッファ初期遅延時間が入力されると、前記バッファ初期遅延時間より大きな値を変換後のバッファ初期遅延時間として決定する決定手段と、
    復号化された前記第1の動画像データを前記第2の符号化方式で符号化し、第2の動画像データを得るとともに、前記第2の動画像データに、決定された前記変換後のバッファ初期遅延時間を設定する符号化手段と
    を備える符号化方式変換装置。
  2. さらに、(a)前記第2の動画像データのビットレートとしてとりうる複数の値と、(b)前記複数の値それぞれに応じて予め決定された、前記第2の動画像データが再生された場合の画質を向上させるために必要なフレームあたりの符号量とが記録された算出表を備え、
    前記決定手段は、(c)前記符号化手段により得られる前記第2の動画像データのビットレートと、(d)前記算出表を参照することで得られる、前記ビットレートに対応する前記フレームあたりの符号量とを用いて前記変換後のバッファ初期遅延時間を決定する
    請求項1記載の符号化方式変換装置。
  3. さらに、前記抽出手段により抽出された情報に示されるバッファ初期遅延時間を、外部からの指示に従って、前記決定手段および前記符号化手段のいずれか一方にのみ入力する選択手段を備え、
    前記符号化手段は、
    前記バッファ初期遅延時間が前記符号化手段に入力された場合、入力された前記バッファ初期遅延時間を前記第2の動画像データに設定し、
    前記バッファ初期遅延時間が前記決定手段に入力された場合、前記決定手段により決定された前記変換後のバッファ初期遅延時間を前記第2の動画像データに設定する
    請求項1記載の符号化方式変換装置。
  4. 画像ストリームと音声ストリームとが多重化された圧縮AVデータの符号化方式を変換するAVデータ変換装置であって、
    前記圧縮AVデータから前記画像ストリームと前記音声ストリームとを分離する分離手段と、
    前記分離手段により得られる前記画像ストリームと前記音声ストリームのそれぞれから、画像と音声とを同期して再生させるための時刻情報を取得する時刻情報取得手段と、
    前記画像ストリームを前記第1の動画像データとして受け取り、前記第2の動画像データである変換後の画像ストリームを出力する請求項1記載の符号化方式変換装置と、
    前記符号化方式変換装置から前記変換後のバッファ初期遅延時間における遅延増加量を示す情報を受け取り、前記遅延増加量を前記変換後の画像ストリームおよび前記音声ストリームに含まれるそれぞれの前記時刻情報に示される値に加算することでそれぞれの時刻情報を修正する修正手段と、
    それぞれ前記修正手段により修正された時刻情報を含む画像ストリームと音声ストリームとを多重化する多重化手段と
    を備えるAVデータ変換装置。
  5. さらに、前記分離手段により得られる前記音声ストリームの符号化方式を変換する音声変換手段を備え、
    前記修正手段は、符号化方式が変換された後の前記音声ストリームの時刻情報を修正する
    請求項4記載のAVデータ変換装置。
  6. 第1の符号化方式で符号化された動画像データである第1の動画像データの符号化方式を、前記第1の符号化方式よりも符号化効率の高い第2の符号化方式に変換する方法であって、
    前記第1の動画像データを復号化する復号化ステップと、
    前記第1の動画像データに含まれる、バッファ初期遅延時間を示す情報を抽出する抽出ステップと、
    前記抽出ステップにおいて抽出された前記情報に示される前記バッファ初期遅延時間より大きな値を、変換後のバッファ初期遅延時間として決定する決定ステップと、
    復号化された前記第1の動画像データを前記第2の符号化方式で符号化し、第2の動画像データを得るとともに、前記第2の動画像データに、決定された前記変換後のバッファ初期遅延時間を設定する符号化ステップと
    を含む符号化方式変換方法。
  7. 第1の符号化方式で符号化された動画像データである第1の動画像データの符号化方式を、前記第1の符号化方式よりも符号化効率の高い第2の符号化方式に変換するためのプログラムであって、
    前記第1の動画像データを復号化する復号化ステップと、
    前記第1の動画像データに含まれる、バッファ初期遅延時間を示す情報を抽出する抽出ステップと、
    前記抽出ステップにおいて抽出された前記情報に示される前記バッファ初期遅延時間より大きな値を、変換後のバッファ初期遅延時間として決定する決定ステップと、
    復号化された前記第1の動画像データを前記第2の符号化方式で符号化し、第2の動画像データを得るとともに、前記第2の動画像データに、決定された前記変換後のバッファ初期遅延時間を設定する符号化ステップと
    をコンピュータに実行させるためのプログラム。
  8. 第1の符号化方式で符号化された動画像データである第1の動画像データの符号化方式を、前記第1の符号化方式よりも符号化効率の高い第2の符号化方式に変換する集積回路であって、
    前記第1の動画像データを復号化する復号化手段と、
    前記第1の動画像データに含まれる、バッファ初期遅延時間を示す情報を抽出する抽出手段と、
    抽出された前記情報に示される前記バッファ初期遅延時間が入力されると、前記バッファ初期遅延時間より大きな値を、変換後のバッファ初期遅延時間として決定する決定手段と、
    復号化された前記第1の動画像データを前記第2の符号化方式で符号化し、第2の動画像データを得るとともに、前記第2の動画像データに、決定された前記変換後のバッファ初期遅延時間を設定する符号化手段と
    を備える集積回路。
JP2006320918A 2006-11-28 2006-11-28 符号化方式変換装置 Pending JP2008136001A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006320918A JP2008136001A (ja) 2006-11-28 2006-11-28 符号化方式変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006320918A JP2008136001A (ja) 2006-11-28 2006-11-28 符号化方式変換装置

Publications (1)

Publication Number Publication Date
JP2008136001A true JP2008136001A (ja) 2008-06-12

Family

ID=39560526

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006320918A Pending JP2008136001A (ja) 2006-11-28 2006-11-28 符号化方式変換装置

Country Status (1)

Country Link
JP (1) JP2008136001A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012070330A (ja) * 2010-09-27 2012-04-05 Renesas Electronics Corp トランスコード装置及びトランコード方法並びにプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012070330A (ja) * 2010-09-27 2012-04-05 Renesas Electronics Corp トランスコード装置及びトランコード方法並びにプログラム
CN102420981A (zh) * 2010-09-27 2012-04-18 瑞萨电子株式会社 转码装置和转码方法
CN102420981B (zh) * 2010-09-27 2014-07-23 瑞萨电子株式会社 转码装置和转码方法

Similar Documents

Publication Publication Date Title
US7844166B2 (en) Reproduction device, video decoding device, synchronization/reproduction method, program and recording medium
KR101215615B1 (ko) 동일 채널 내에서 서로 다른 코덱을 이용하여 부호화된 비디오 및 오디오 데이터 스트림의 재생을 위한 코덱 변경 방법 및 장치
JP5452495B2 (ja) オーディオ・ビデオレンダリングの早期開始システム及び方法
JP2006527975A (ja) 圧縮ビデオの高速チャンネル変更を可能にする復号化方法および装置
CN1745583A (zh) 鲁棒模式交错播送视频质量增强
JP2008278190A (ja) データ処理装置、データ処理方法、及びプログラム
JP5271544B2 (ja) デジタル放送受信装置、および、デジタル放送受信方法
US20080159636A1 (en) Encoding apparatus and encoding method
JP4492484B2 (ja) 情報処理装置および情報処理方法、記録媒体、並びに、プログラム
JP2010212996A (ja) 情報処理装置および多重化処理方法
JP4788250B2 (ja) 動画像信号の符号化装置、動画像信号の符号化方法およびコンピュータ読み取り可能な記録媒体
JP2003143554A (ja) 受信されたマルチメディアデータを保存するバッファの容量を可変できるマルチメディアデータ復元装置及び方法
JP2010252151A (ja) 再生装置、及び同期再生方法
JP5046907B2 (ja) 記録装置、その制御方法、プログラム
JP2008136001A (ja) 符号化方式変換装置
US20060257108A1 (en) Multimedia reproduction apparatus
JP4528043B2 (ja) 映像信号変換装置、変換方法及びこれを用いた映像信号記録装置
JP3184175B2 (ja) 復号化装置
JP2008148137A (ja) 画像符号化装置
JP2011091592A (ja) 画像符号化装置、符号変換装置、画像記録装置、画像再生装置、画像符号化方法及び、集積回路
JP4867872B2 (ja) 画像処理装置、この画像処理装置の制御方法、及び、プログラム
JP2004180282A (ja) ストリーム情報再生装置、ストリーム情報再生方法、プログラム及びデジタル放送受信機
JP4788251B2 (ja) 動画像信号の符号化装置
JP2008010997A (ja) 情報処理装置、情報処理方法及び半導体集積回路
JP2010041123A (ja) 画像データ処理装置、画像記録装置及び画像データ処理方法