JP4746691B2 - 動画像符号化装置および動画像符号化方法 - Google Patents

動画像符号化装置および動画像符号化方法 Download PDF

Info

Publication number
JP4746691B2
JP4746691B2 JP2009157959A JP2009157959A JP4746691B2 JP 4746691 B2 JP4746691 B2 JP 4746691B2 JP 2009157959 A JP2009157959 A JP 2009157959A JP 2009157959 A JP2009157959 A JP 2009157959A JP 4746691 B2 JP4746691 B2 JP 4746691B2
Authority
JP
Japan
Prior art keywords
encoding
complexity
code amount
module
encoding complexity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009157959A
Other languages
English (en)
Other versions
JP2011015220A (ja
Inventor
崇博 瀧本
知也 児玉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2009157959A priority Critical patent/JP4746691B2/ja
Priority to US12/816,936 priority patent/US8036268B2/en
Publication of JP2011015220A publication Critical patent/JP2011015220A/ja
Application granted granted Critical
Publication of JP4746691B2 publication Critical patent/JP4746691B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

この発明は、第1の符号化ストリーム(MPEG−2のストリームなど)を第2の符号化ストリーム(H.264/MPEG−4 AVCのストリームなど)にトランスコードする、動画像符号化装置と動画像符号化方法、およびトランスコードされたストリームの映像を扱う映像機器に関する。
デジタル動画情報を扱う分野では、情報圧縮が行われる。その圧縮技術の代表的なものに、MPEG(MPEG−1、MPEG−2、H.264/MPEG−4 AVCなど)がある。旧世代のパッケージメディア(ビデオCDなど)ではMPEG−1が用いられてきたが、デジタルTV放送や現世代のビデオパッケージメディア(DVDなど)ではMPEG−2が用いられている。また、ハイビジョン映像などの高品位デジタル動画情報をより効率良く圧縮しようとする場合には、H.264/MPEG−4 AVCなどが用いられる。
デジタルTV放送などのハイビジョン映像にはMPEG−2が使用されているが、MPEG−2では圧縮効率が十分とはいえなくなってきた。例えば4.7GB容量の片面1層DVD−Rディスクに衛星デジタル放送のハイビジョン映像(ビットレートは24Mbpsの固定レート)を録画しようとした場合、20分強しか録画できない。しかし、このハイビジョン映像をH.264/MPEG−4 AVCなどで再エンコードして新たなハイビジョン映像(ビットレートは平均4Mbps程度の可変レート)に変換(トランスコード)すれば、4.7GB容量のディスクにデジタルTV放送のハイビジョン映像を2時間程録画できるようになる。
このような状況下、第1の符号化ストリーム(MPEG−2のストリームなど)を第2の符号化ストリーム(H.264/MPEG−4 AVCのストリームなど)にトランスコードする動画像符号化技術の開発が進められている(特許文献1参照)。
特開2006−33014号公報
特許文献1では、符号化複雑度と発生符号量の遷移は同じとみなすことで適応的な符号量割り当てを行っている。すなわち、シーケンスを通じて量子化パラメータが同じ場合は、入力画像ストリームの発生符号量遷移はシーケンスを通じての符号化複雑度遷移と同じと見なすことができ、各フレームの符号化複雑度に応じて符号量を割り当てることが可能である。しなしながら、デジタルTV放送などで用いられる固定ビットレート制御では、量子化パラメータを変化させてビットレートを一定に保つために、発生符号量遷移が必ずしも符号化複雑度遷移と同じであると見なすことはできない。つまり、入力画像ストリームの内容に応じた適応的な符号量割り当てを実現することは難しい。
この発明の課題の1つは、適応的な符号量割り当てを実現することである。
この発明の一実施の形態に係る動画像符号化装置では、MPEGエンコードされた入力ストリーム(例えばMPEG−1,−2のPS(program stream)またはMPEG−2のTS(transport stream))がH.264/MPEG−4 AVCの出力ストリームにトランスコードされる。この動画像符号化装置は、情報取得モジュール(101)と、符号化複雑度算出モジュール(102)と、符号化複雑度変換モジュール(103、103a)と、トランスコードモジュール(104〜113)を具備している。ここで、情報取得モジュール(101)は、前記入力ストリームからMPEGのヘッダ情報を読み込んで各フレームの量子化スケール、発生符号量、およびピクチャタイプの情報を取得する。符号化複雑度算出モジュール(102)は、前記情報取得モジュール(101)で取得した情報を用いて、前記量子化スケールと前記発生符号量の積(発生符号量×量子化スケール)の形で表される符号化複雑度を、前記フレーム毎に算出する。
符号化複雑度変換モジュール(103、103a)は、前記ピクチャタイプ毎に用意された所定の関数(例えば図6〜図8などに例示される一次関数)を用いて、前記符号化複雑度算出モジュール(102)で算出した前記符号化複雑度(Xmpeg2)を、H.264/MPEG−4 AVCなどの符号化複雑度(Xh.264)へ変換する。そして、トランスコードモジュール(104〜113)は、前記符号化複雑度変換モジュール(103、103a)で変換した前記H.264/MPEG−4 AVCなどの符号化複雑度(Xh.264)を用いて、前記入力ストリームを前記出力ストリームに再符号化(トランスコード)する。
この発明によれば、より適応的な符号量割り当てを実現し、トランスコードに伴う画質劣化を抑制できる。
この発明の一実施の形態に係る動画像符号化装置の概念図。 この発明の一実施の形態に係る動画像符号化装置の具体的な構成を説明する図。 図2の構成における復号部109の詳細を説明する図。 図2の構成における符号化部110の詳細を説明する図。 図2の装置動作の一例を説明するフローチャート図。 図2の符号化複雑度変換部103においてIピクチャのMPEG−2/H.264変換に用いられる関数の一例を説明する図。 図2の符号化複雑度変換部103においてPピクチャのMPEG−2/H.264変換に用いられる関数の一例を説明する図。 図2の符号化複雑度変換部103においてBピクチャのMPEG−2/H.264変換に用いられる関数の一例を説明する図。 GOP単位における、H.264/MPEG−4 AVCの推定符号化複雑度とその実測符号化複雑度との間の対応関係の一例を説明する図。 ピクチャ単位で符号量割り当てを行う際に用いる符号化複雑度の推定結果の例を説明する図。 ピクチャ単位とGOP単位でのH.264符号化複雑度の実測値と推定値の相関係数を例示する図。
以下、図面を参照してこの発明の種々な実施の形態を説明する。図1は、この発明の一実施の形態に係る動画像符号化装置の概念図である。記録媒体(デジタルTV放送番組を録画したDVD−R,−RW,−RAMあるいはBD−R,−RW、もしくは大容量のメモリカードなど)から取り出されたビットストリームは、入力ストリームとして図1の動画像符号化装置に与えられる。この装置の入力ストリーム解析部10は、1パス目の解析処理として、入力ストリーム(例えばMPEG−2のPSあるいはTS)のヘッダから符号化情報(各フレームの量子化スケール、発生符号量、ピクチャタイプなどの情報)を取得し、取得した情報を解析し評価する。評価された解析結果は符号量割当部20に送られる。
符号量割当部20では、1パス目の解析結果からトランスコード時に参照する量子化テーブルが設定され、このテーブルの設定内容からGOP(あるいは、符号化対象の所定区間毎に)に割り当てる符号量が決定されて、全GOP分の割当符号量データが一旦バッファリングされる。バッファリングされたデータから、1GOP分ずつ(あるいは、例えば15フレーム分相当の所定区間毎に)割当符号量データが復号/符号化部30に送られる。
復号/符号化部30では、2パス目の処理として、1フレーム毎に入力ストリームがデコードされ、デコード結果がFIFOバッファに一旦記憶される。FIFOバッファからは、デコードされた画像ストリームが記憶順に取り出される。取り出された画像ストリームに対して、ピクチャ単位の割当符号量に基づく量子化スケールで、再符号化が行われる。ここで、ピクチャ単位の割当符号量は、符号量割当部20から送られてきた1GOP分(あるいは、例えば15フレーム相当の所定区間分)の割当符号量データから算出される(具体的な算出例については後述する)。復号/符号化部30で再符号化された画像ストリームは、出力ビットストリームとして装置外部に送出される。
図2は、この発明の一実施の形態に係る動画像符号化装置の具体的な構成を説明する図である。図2の構成において、101〜102は図1の入力ストリーム解析部10に対応し、103〜106は符号量割当部20に対応し、107〜113は復号/符号化部30に対応している。
MPEGエンコードされた入力ストリーム(MPEG−2のPS/TSなど)は、符号化情報取得部(情報取得モジュール)101に入力される。符号化情報取得部101は、入力ストリームからMPEGのヘッダ情報を読み込んで、各フレームの量子化スケール(Q)、発生符号量(Bit)、およびピクチャタイプ(Picture Type)の情報を取得する。この取得情報は符号化複雑度算出部(符号化複雑度算出モジュール)102に入力される。符号化複雑度算出部102は、入力された取得情報を用いて、量子化スケールと前記発生符号量の積(発生符号量×量子化スケール)の形で表される符号化複雑度を、シーケンス(MPEGエンコードされた動画像全体)内のフレーム毎に算出する。具体的には、符号化複雑度算出部102は、後述する式1の関係を用いて、当該フレームの符号量(S)と当該フレームの平均量子化スケール(Q)から、入力ストリームの符号化複雑度(Xmpeg2)を算出する。算出された符号化複雑度(Xmpeg2)は符号化複雑度変換部103に入力される。
符号化複雑度変換部103には、変換関数メモリ103aが接続されている。この変換関数メモリ103aには、入力ストリームに対して算出された符号化複雑度(Xmpeg2)を新たな符号化複雑度(Xh.264)に変換するための関数が、ピクチャタイプ(Iピクチャ、Pピクチャ、Bピクチャなど)毎に予め格納されている(その関数の具体例は図6〜図8を参照して後述する)。符号化複雑度変換部103は、変換関数メモリ103aに格納された関数を用いて、入力ストリームに対して算出された符号化複雑度(Xmpeg2)を新たな符号化複雑度(Xh.264)に変換する。符号化複雑度変換部103および変換関数メモリ103aは、符号化複雑度変換モジュールを構成している。
符号化複雑度変換部103による関数変換で得られた新たな符号化複雑度(Xh.264)は、入力ストリームをトランスコードした後の出力ストリームに対する符号化複雑度を予測するものであるが、この予測符号化複雑度(Xh.264)と実際の出力ストリームに対する符号化複雑度とは略1対1で対応している(この対応例は図9を参照して後述する)。
符号化複雑度変換部103による関数変換で得られた新たな符号化複雑度(Xh.264)、すなわち実際の出力ストリームに対する符号化複雑度と略1対1で対応している予測符号化複雑度(Xh.264)は、シーケンス内のフレームの予測符号化複雑度として、バッファ104に一時格納される。バッファ104から取り出された予測符号化複雑度(Xh.264)は、GOP単位割当符号量算出部105に入力される。
GOP単位割当符号量算出部105では、後述する式2の関係に基づき、所定のビットレート(Bitrate)とフレームレート(FrameRate)とシーケンス内の全フレーム数(M)から、シーケンス内の全てのフレームに与える符号量(Sall)が算出される。そして、この算出された符号量(Sall)とバッファ104から入力された予測符号化複雑度(Xh.264)を用いて、後述する式3の関係に基づき、各GOP(あるいは、例えば15フレーム相当の所定区間分)の割当符号量が算出される。
この算出された各GOPの割当符号量は、バッファ106に一時格納される。バッファ106からは、トランスコードの対象となる符号化対象GOP(あるいは符号化対象の所定区間分)の割当符号量が取り出される。この取り出された符号化対象GOPの割当符号量は、ピクチャ単位割当符号量算出部107に入力される。
ピクチャ単位割当符号量算出部107では、符号化対象GOP(あるいは符号化対象の所定区間分)内の該当フレームに対して、後述する式4の関係に基づき、ピクチャ単位の割当符号量が算出される。この算出されたピクチャ単位の割当符号量は、量子化スケール決定部108に入力される。
量子化スケール決定部108では、入力されたピクチャ単位の割当符号量と、推定符号化複雑度(符号化複雑度変換部103による関数変換で得られた新たな符号化複雑度(Xh.264)に対応)を用いて、後述する式5の関係に基づき、トランスコード対象画像に対する量子化スケールが決定される。
一方、MPEGエンコードされた入力ストリーム(MPEG−2)は復号部(MPEG−2デコーダ)109でデコードされ、デコードされた画像情報は符号化部(H.264/AVCエンコーダ)110によりH.264/MPEG−4 AVCの出力ストリームにトランスコードされる。このトランスコードにおいて、量子化スケール決定部108で決定された量子化スケールが用いられる。
符号化部110によりトランスコードされた出力ストリームは、HDMIなどのデジタルインターフェイスを介して外部の表示装置120に送られ、あるいは図示しないデジタルレコーダ(またはAV仕様のパソコン)に送られて録画される。
符号化部110によりトランスコードされた出力ストリームはさらに、符号化情報取得部111に入力される。符号化情報取得部111は、出力ストリームからH.264/MPEG−4 AVCのヘッダ情報を読み込んで、各フレームの量子化スケール(Q)、発生符号量(Bit)、およびピクチャタイプ(Picture Type)の情報を取得する。この取得情報は符号化複雑度算出部112に入力される。符号化複雑度算出部112は、入力された取得情報を用いて、前述したと同様に符号化複雑度を算出する。算出された符号化複雑度はバッファ113に一時格納され、ここに格納された符号化複雑度はその後の量子化スケール決定時に適宜利用される。
以上の構成において、104〜113は、符号化複雑度変換モジュール(103、103a)で変換した符号化複雑度(Xh.264)を用いて、入力ストリームを出力ストリームに再符号化(トランスコード)するトランスコードモジュールを構成している。
図3は、図2の構成における復号部109の詳細を説明する図である。この復号部109は、MPEG−2に準拠した復号を行うもので、可変長復号化器301、逆量子化器302、逆離散コサイン変換器303、動き補償器304、フレームメモリ305から構成されている。
図4は、図2の構成における符号化部110の詳細を説明する図である。この符号化部110は、H.264/MPEG−4 AVCに準拠した符号化を行うもので、動き検出器201、動き補償器202、減算器203、離散コサイン変換器204、量子化器205、エントロピー符号化器206、フレームメモリ207、加算器208、逆離散コサイン変換器209、逆量子化器210から構成されている。この構成では、図2を参照して説明した量子化スケール決定部108から出力される量子化スケールに応じて、量子化器205において、離散コサイン変換器204の出力である離散コサイン変換係数が量子化される。この量子化スケールに応じた量子化により、符号化された画像が所望の符号量となるような制御が行われる。
図5は、図2の装置動作の一例を説明するフローチャートである。ここでは、入力ストリームがMPEG−2ストリームであり、出力ストリームがH.264/MPEG−4 AVCである場合を例にとって説明する。まず、入力されるMPEG−2ストリームを全フレーム分読み込む(ST10)。続いて、読み込んだ各フレームのヘッダ情報を解析することで、各フレームのMPEG−2ストリームの符号化形式での発生符号量、量子化スケール、ピクチャタイプを取得する(ST11)。
なお、ここで取得する符号化情報は、入力画像ストリームであるMPEG−2ビットストリームを可変長復号(VLD:Variable Length Decode)などにより完全に解読する必要はない。例えば、MPEG−2のスライスヘッダには当該スライスで用いる量子化スケールの初期値が記述されているので、各フレーム全てのスライスヘッダを参照することで、そのフレームの平均量子化スケールを近似的に算出することができる。同様に、フレームの符号量は、ピクチャヘッダ間の符号量をカウントすれば算出することができる。
次に、取得した符号化情報を基に、符号化複雑度算出部102において、各フレームの実際の符号化複雑度を算出する(ST12)。各フレームの符号化複雑度(X)は、当該フレームの平均量子化スケール(Q)と当該フレームの符号量(S)を用いて、式1より求められる。
Figure 0004746691
ここで、gi(i=I,P,B)はピクチャタイプ(Iピクチャ、Pピクチャ、またはBピクチャ)毎に決定される固定値であり、同一のピクチャタイプであれば、画像によらずほぼ一定となることが知られている(例えば特開平10−023412号公報の段落0023〜0024参照)。
次に、ST12の処理で求めたMPEG−2形式での実測符号化複雑度を、H.264/MPEG−4 AVC形式での予測符号化複雑度に変換する(ST13)。ここでの変換関数には、ピクチャタイプ毎に予め用意しておいた線形関数を用いることができる(この変換関数は図2の変換関数メモリ103aに予め格納しておく)。
例えば、ピクチャタイプがIピクチャの場合には図6に示すような一次関数(y=ax)を変換関数として用いることができる。ピクチャタイプがPピクチャの場合には図7に示すような一次関数(y=bx)を変換関数として用いることができる。また、ピクチャタイプがBピクチャの場合には図8に示すような一次関数(y=cx)を変換関数として用いることができる。図8の例ではやや非線形の様相を呈しているが、このような場合は実情に応じて適宜非線形関数を変換関数として用いてもよい。変換関数により変換された予測符号化複雑度のデータは、シーケンス内の全フレーム分、図2のバッファ104に一時格納される。
図6〜図8の例示において、A〜Fは異なるシーケンスを表している。シーケンスが異なっても、変換前の実測符号化複雑度(Xmpeg2)と変換後の予測符号化複雑度(Xh.264)との間の関係は、略同じ線形関数で代表できる。
以下の変数を用いてさらに図5の説明を続ける。
F(t):入力画像ストリームのt番目のフレーム
x(t):F(t)に対応するMPEG−2符号化複雑度
X(t):F(t)に対応するH.264へのトランスコードによって得られた符号化複雑度
p(t):F(t)に対応するMPEG−2ピクチャタイプ;p(t)=(I,P,B)
予測符号化複雑度(Xh.264)のバッファリングが済んだあと、図2のGOP単位割当符号量算出部105において、所定のビットレート(Bitrate)で動画像を符号化するために必要なシーケンス内の各GOP(あるいは符号化対象の所定区間分)へ割り当てる符号量を、算出する(ST14)。
この符号量算出処理では、始めにシーケンス内のすべてのフレーム全体に与える符号量(Sall)を算出し、次にシーケンス内の各GOP(あるいは符号化対象の所定区間分)に割り当てる符号量(Sgop)を算出し、その後にGOP内の各ピクチャの割当符号量を算出する。まず、未トランスコードフレーム全体に割り当てる符号量を、式2で与えることとする。
Figure 0004746691
ここで、FrameRateはフレームレートを示し、Mはシーケンス内の全フレーム数を示す。
次に、式2で求めた符号量Sallを各GOP(あるいは符号化対象の所定区間分)に割り当てていく。ここでは、各GOPにおける各フレームでの符号化複雑度の総和(ΣX)を算出し、この総和を用いて比例配分することとする。つまり、N番目のGOP(あるいはN番目の符号化対象所定区間)に与える符号量(SNth_gop)は、GOP内の全フレームであるV枚のフレームの符号化複雑度の総和“〜Xgop”を用いて、式3で与えることとする(式中の記載では“〜”が“X”の頭に配置されているが、明細書の説明文中ではこれを“〜X”のように表記する)。
Figure 0004746691
式3を用いて算出した各GOP(あるいは符号化対象の所定区間分)の符号量(SNth_gop、N=1,2,….)は、図2のバッファ106に保存する(ST15)。こうして保存された符号量を利用して、トランスコードにおける符号化処理(ST16)が行われる。この符号化処理(ST16)では、バッファ106に保存されたた各GOPの割当符号量を元に、MPEG−2の入力ストリームをH.264/MPEG−4 AVCの出力ストリームにフレーム1枚ずつトランスコードしていく。この処理は、シーケンス内の最後のフレームのトランスコードが終わるまで反復実行される。
すなわち、まずシーケンス内の最初のフレームの復号(MPEG−2デコード)が行われる(ST17)。このST17で復号したフレームが符号化対象GOP(あるいは符号化対象の所定区間)内の先頭フレームであれば(ST18のyes)、符号化対象GOPの割当符号量を図2のバッファ106から読み込む(ST19)。ST17で復号したフレームが符号化対象GOP内の先頭フレームでなければ(ST18のno)、ST19の読み込み処理はスキップされる。
次に、ST17で復号したフレームにピクチャ単位の符号量を割り当てる(ST20)。今、ST17で復号したフレームがN番目のGOP(あるいはN番目の符号化対象所定区間)内にある(シーケンス内ではk番目のフレームに該当する)場合、ST20で割り当てる符号量T(k)は、ST19で読み込んだN番目のGOP(あるいはN番目の符号化対象所定区間)に割り当てられた符号量(SNth_gop)と、後述するST25で算出されたH.264/MPEG−4 AVCの実測符号化複雑度(Xh.264=Xi、Xp、Xb)を用いて、式4から求められる。
Figure 0004746691
ここで、Kp、Kbは、各ピクチャに対する符号量割当の重みを規定する定数を表している。Xi、Xp、Xbは、直前にトランスコードが終わった各ピクチャタイプにおけるH.264/MPEG−4 AVCでの符号化複雑度を表している。SNth_gop_remainは、GOP(あるいは符号化対象所定区間)内に割り当てた符号量(ST14で求めたもの)と、GOP(あるいは符号化対象所定区間)内の符号化が終了したフレームで発生した符号量との差分を示す。さらに、Np、Nbは、それぞれ、当該GOP(あるいは当該符号化対象所定区間)内で未だ符号化が終了していないPピクチャ、Bピクチャの枚数を示している。ST20の処理では、式4から求めたピクチャ単位割当符号量T(k)が図2のピクチャ単位割当符号量算出部107で一時記憶される。
ピクチャ単位の符号量割当(ST20)が済むと、量子化スケールが決定される(ST21)。この決定は、図2の量子化スケール決定部108において行われる。ST21の処理では、図2の符号化複雑度変換部103から得られる推定符号化複雑度“〜X(k)”と、図2のピクチャ単位割当符号量算出部107から得られるピクチャ単位割当符号量T(k)を用いて、式5により、トランスコード対象画像に対する量子化スケール(Q(k))を算出する。ここでは、式1を変形した式5を用いて量子化パラメータが決定される。
Figure 0004746691
量子化スケール(Q(k))が決定されたら、この量子化スケールに基づいて、H.264/MPEG−4 AVCに準拠した方式で1フレーム分の符号化を行い(ST22)、H.264/MPEG−4 AVCにトランスコードされた符号化画像のストリームを出力する。
こうしてトランスコードされたH.264/MPEG−4 AVC出力ストリームのヘッダからその符号化情報(各フレームでの量子化スケール、発生符号量、ピクチャタイプ)が取り出され(ST24)、ST12の処理と同様な方法(式1を用いる)で出力ストリームの実測符号化複雑度が算出される(ST25)。算出された実測符号化複雑度は図2のバッファ113に一時格納される。
以上の処理(ST17〜ST25の処理)は、対象GOP(あるいは符号化対象所定区間)内の複数フレームに対して繰り返し実行される(ST23のnoのループ)。その際、バッファ113に一時格納された「過去の同一ピクチャタイプに対する符号化複雑度」を、これから行う符号化(ST22)で利用する。すなわち、GOP単位(あるいは符号化対象所定区間の単位)での符号量割当(ST14)の場合と異なり、過去の同一ピクチャタイプ(例えばIピクチャ)に対するH.264/MPEG−4 AVC出力ストリームの符号化複雑度(Xh.264)を現時点における当該フレームの符号化複雑度とみなすことで、ピクチャに対する符号量割り当てを簡単に行うことができる。この「みなし符号量割り当て」により、MPEG−2とH.264/AVCのピクチャタイプが異なる場合でも素早い符号化(トランスコード)が可能となる。
全てのフレームに対してST16の処理が済めば(ST23のyes)、図5の処理は終了する。ここで、バッファ113には、トランスコード終了出力画像に対応するフレームの符号化複雑度が、少なくとも1GOP(あるいは少なくとも1つの符号化対象所定区間)に対応するフレーム分(例えば15フレーム分)格納される。このバッファ113に格納されたトランスコード後の出力ストリームの実測符号化複雑度のデータは、その後の処理で適宜参照される。
図9は、GOP単位における、H.264/AVCの推定符号化複雑度とその実測符号化複雑度との間の対応関係を例示している。この対応関係は、大筋一次関数(y=dx)で代表される。このことは、図2の符号化複雑度変換部103による変換結果あるいは図5のST13における予測符号化複雑度算出結果を「実際のトランスコードに用いる符号化複雑度」とすることが妥当であったことを、裏付けている。
図10は、ピクチャ単位で符号量割り当てを行う際に用いる符号化複雑度の推定結果の例を説明する図である。この図は、ピクチャ単位での符号量割り当ての際に用いる符号化複雑度を直前のトランスコード結果(H.264符号化結果)から推定した場合(グラフ<1>)と入力ストリームのMPEG−2から推定した場合(グラフ<2>)に分けて、実測符号化複雑度と推定符号化複雑度の絶対相対誤差の比較結果を例示している。ここで、実測符号化複雑度と推定符号化複雑度の絶対相対誤差は、「|推定値−実測値|/実測値」で表される。
図10は、直前のトランスコード結果(図2のバッファ113に格納されている)から推定する場合(グラフ<1>)は、入力ストリームのMPEG−2から推定した場合(グラフ<2>)と比べて、絶対相対誤差がずっと小さいことを示している。このことは、図2のバッファ113に格納されている「符号化複雑度算出部112による算出結果」を「GOP(あるいは符号化対象所定区間)内フレームのトランスコードに用いる符号化複雑度」とみなすことが妥当であったことを、裏付けている。
図11は、ピクチャ単位とGOP単位(あるいは符号化対象所定区間単位)での、H.264符号化複雑度の実測値と推定値の相関係数を例示している。この例示から、Iピクチャ、Pピクチャ、Bピクチャ、およびGOP(あるいは符号化対象所定区間)のいずれの場合で見ても、H.264符号化複雑度の実測値と推定値の間には、比較的高い相関性があることが分かる。
<変形例>
(01)上記例ではMPEG−2の符号化複雑度からH.264/MPEG−4 AVCの複雑度を算出する際、各ピクチャタイプ毎に線形関数を用いて算出したが、必ずしもこれに限定されるものではない。入力ビットストリームの圧縮形式と出力ビットストリームの圧縮形式の特性に応じて種々の変換関数が適用できる。
(02)上記例では入力をMPEG−2、出力をH.264/MPEG−4 AVCとしたが、必ずしもこれに限定されるものではない。例えば、デジタルビデオカメラなどで使用さるDV形式の入力ストリームをパソコンなどで使用されるVC−1の出力ストリームにトランスコードする場合に、本願の符号化複雑度変換を適用できる。
(03)上記例では、量子化スケールを式5のように算出することとしたが、各フレームのトランスコード中に「予測発生符号量と実測発生符号量のずれ(差分)」を量子化スケール決定部108にフィードバックして、このずれに応じて量子化スケールを変化させてもよい。
<実施の形態の効果>
符号量変動だけを見て符号量割り当てを行う場合と比べ、以下の効果が得られる。
(11)入力ビットストリームであるMPEG−2の符号化複雑度から、出力ビットストリームであるH.264/MPEG−4 AVCの符号化複雑度を推定することで、量子化スケール一定で符号化を行わなくても、シーケンスを通じて適応的な符号量割り当てが可能となる。そのため、出力のビットレートを入力のビットレートより小さくしても、画質劣化を防ぐことが可能となる。
(12)GOP単位(あるいは符号化対象所定区間単位)での符号量割り当てに関しては、MPEG−2の符号化複雑度から推定したH.264/MPEG−4 AVCの符号化複雑度を用い、ピクチャ単位での符号量割り当てでは、過去の符号化結果を用いることで、シーケンスを通じて適応的な符号量割り当てが可能となり、出力のビットレートを入力のビットレートより小さくしても、画質劣化を防ぐことが可能となる。
(13)GOP単位(あるいは符号化対象所定区間単位)での符号量割り当てと、ピクチャ単位での符号量割り当てに上記のような手法を用いることで、入力ストリームと出力ストリームのピクチャタイプが完全に一致する必要がなくなる。
<実施の形態のまとめ>
1.MPEG−2のヘッダ情報を読み込むことで、各フレームの量子化スケール、発生符号量、ピクチャタイプを取得し、これらを用いてMPEG−2での各フレームの符号化複雑度(符号化複雑度=発生符号量×量子化スケールg:gはピクチャタイプ毎に決定される値)を算出し、ピクチャタイプ毎に用意した線形関数を用いて、H.264の符号化複雑度を各フレーム算出する。
2.符号化する際には、まず上記の手法で算出したH.264の符号化複雑度を用いて、シーケンス内の全GOP(あるいは全ての符号化対象所定区間)に符号量を割り当てる。次に、各GOP(あるいは符号化対象所定区間)に割り当てた符号量をGOP内の各ピクチャに割り当てる。その際、GOP単位(あるいは符号化対象所定区間単位)での符号量割り当てと異なり、過去の同一ピクチャタイプの符号化複雑度を当該フレームの符号化複雑度とみなすことで符号量割り当てを行う。これにより、MPEG−2とH.264のピクチャタイプが異なる場合でも符号化が可能となる。
換言すると、入力画像ストリームの符号化複雑度からある関数を用いて出力画像ストリームの符号化複雑度を推定し、推定した符号化複雑度を用いてシーケンス内の全GOPに符号量を割り当て、各GOPに割り当てた符号量をGOP内のピクチャに割り当てる。その割り当ての際は、過去の同一ピクチャタイプの符号化結果を用いる。
なお、この発明は前述した実施の形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で種々に変形することが可能である。また、各実施形態は可能な限り適宜組み合わせて実施してもよく、その場合組み合わせた効果が得られる。更に、上記実施形態には種々の段階の発明が含まれており、開示される複数の構成要件における適当な組み合わせにより種々の発明が抽出され得る。例えば、実施形態に示される全構成要件からいくつかの構成要件が削除されても、発明が解決しようとする課題の欄で述べた課題が解決でき、発明の効果の欄で述べられている効果が得られる場合には、この構成要件が削除された構成が発明として抽出され得る。
101…符号化情報取得部、102…符号化複雑度算出部、103…符号化複雑度変換部、103a…変換関数メモリ、104…バッファ、105…GOP単位割当符号量算出部、106…バッファ、107…ピクチャ単位割当符号量算出部、108…量子化スケール決定部、109…復号部(MPEG−2デコーダ)、110…符号化部(H.264/AVCエンコーダ)、111…符号化情報取得部、112…符号化複雑度算出部、113…バッファ、120…表示装置、10…入力ストリーム解析部(1パス目)、20…符号量割当部、30…復号/符号化部(2バス目)。

Claims (5)

  1. 量子化パラメータを変化させてビットレートが一定になるように制御された固定レートのMPEG−2入力ストリームを出力ストリームにトランスコードする動画像符号化装置において、
    前記入力ストリームから各フレームの量子化スケール、発生符号量、およびピクチャタイプの情報を取得する情報取得モジュールと、
    前記フレームの平均量子化スケールをQとし、そのフレームの符号量をSとし、前記ピクチャタイプ毎に決定され同一ピクチャタイプであれば画像によらない固定値をgiとし、この固定値giに付されたiにより前記ピクチャタイプが示され、積の演算記号を×で表すときに、前記情報取得モジュールで取得した情報を用いて、S×Q gi で表される符号化複雑度を、前記フレーム毎に算出する符号化複雑度算出モジュールと、
    前記ピクチャタイプ毎に用意され、前記同一ピクチャタイプであれば画像によらない固定値giの関数である前記入力ストリームの符号化複雑度と前記出力ストリームの符号化複雑度との間の関係を表すものであって前記入力ストリームの符号化複雑度が変化し得る範囲内で線形性を示す線形関数を用いて、前記符号化複雑度算出モジュールで算出した前記符号化複雑度を、前記出力ストリームの符号化複雑度へ変換する符号化複雑度変換モジュールと、
    前記符号化複雑度変換モジュールで変換した前記出力ストリームの符号化複雑度を用いて、前記入力ストリームを前記出力ストリームに再符号化するトランスコードモジュールを具備し、
    前記トランスコードモジュールによる前記再符号化は、前記ピクチャタイプ毎に用意された前記線形関数を用いて前記フレーム毎に行われ、
    前記トランスコードモジュールが、前記入力ストリームのシーケンス内に含まれるグループオブピクチャの単位で前記再符号化において用いられる符号量を割り当てる符号量割当モジュールを含む動画像符号化装置。
  2. 前記トランスコードモジュールが、前記グループオブピクチャに割り当てられた符号量を、そのグループオブピクチャ内のI,B,およびPピクチャ各々に割り当てるピクチャ符号量割当モジュールを含む請求項1に記載の動画像符号化装置。
  3. 前記トランスコードモジュールは算出済みの前記符号化複雑度を格納するバッファを含み、このバッファに格納された前記算出済みの符号化複雑度をその後の量子化スケール決定時に利用するように構成し、前記I,B,およびPピクチャについて、過去の同一ピクチャタイプに対する前記出力ストリームの符号化複雑度を現時点における当該フレームの符号化複雑度とみなして、前記ピクチャに対する符号量割り当てを行う請求項2に記載の動画像符号化装置。
  4. 前記トランスコードモジュールは、前記入力ストリームを復号する復号モジュールと、この復号モジュールで復号されたストリームを再度符号化して前記出力ストリームに変換する符号化モジュールを含み、
    前記トランスコードモジュールが、前記ピクチャに割り当てられた符号量から前記符号化モジュールにおける量子化スケールを決定する量子化スケール決定モジュールを含む請求項3に記載の動画像符号化装置。
  5. 量子化パラメータを変化させてビットレートが一定になるように制御された固定レートのMPEG−2入力ストリームを出力ストリームにトランスコードする動画像符号化方法であって、
    情報取得モジュールが、前記入力ストリームからMPEGのヘッダ情報を読み込んで各フレームの量子化スケール、発生符号量、およびピクチャタイプの情報を取得し、
    前記フレームの平均量子化スケールをQとし、そのフレームの符号量をSとし、前記ピクチャタイプ毎に決定され同一ピクチャタイプであれば画像によらない固定値をgiとし、この固定値giに付されたiにより前記ピクチャタイプが示され、積の演算記号を×で表すときに、符号化複雑度算出モジュールが、取得した前記情報を用いて、S×Q gi で表される符号化複雑度を前記フレーム毎に算出し、
    符号化複雑度変換モジュールが、前記ピクチャタイプ毎に用意され、前記同一ピクチャタイプであれば画像によらない固定値giの関数である前記入力ストリームの符号化複雑度と前記出力ストリームの符号化複雑度との間の関係を表すものであって前記入力ストリームの符号化複雑度が変化し得る範囲内で線形性を示す線形関数を用いて、算出した前記符号化複雑度を前記出力ストリームの符号化複雑度へ変換し、
    トランスコードモジュールが前記符号化複雑度変換モジュールで変換した前記出力ストリームの符号化複雑度を用いて前記入力ストリームを前記出力ストリームに再符号化するにあたり、この再符号化は前記ピクチャタイプ毎に用意された前記線形関数を用いて前記フレーム毎に行われ、
    符号量割当モジュールが、前記入力ストリームのシーケンス内に含まれるグループオブピクチャの単位で前記再符号化において用いられる符号量を割り当てるように構成した動画像符号化方法。
JP2009157959A 2009-07-02 2009-07-02 動画像符号化装置および動画像符号化方法 Expired - Fee Related JP4746691B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2009157959A JP4746691B2 (ja) 2009-07-02 2009-07-02 動画像符号化装置および動画像符号化方法
US12/816,936 US8036268B2 (en) 2009-07-02 2010-06-16 Moving image encoding apparatus, moving image encoding method, and video device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009157959A JP4746691B2 (ja) 2009-07-02 2009-07-02 動画像符号化装置および動画像符号化方法

Publications (2)

Publication Number Publication Date
JP2011015220A JP2011015220A (ja) 2011-01-20
JP4746691B2 true JP4746691B2 (ja) 2011-08-10

Family

ID=43412652

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009157959A Expired - Fee Related JP4746691B2 (ja) 2009-07-02 2009-07-02 動画像符号化装置および動画像符号化方法

Country Status (2)

Country Link
US (1) US8036268B2 (ja)
JP (1) JP4746691B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2825937A1 (en) 2011-01-28 2012-08-02 Eye IO, LLC Encoding of video stream based on scene type
KR20140022801A (ko) 2011-01-28 2014-02-25 아이 이오, 엘엘씨 Hvs 모델에 기초한 컬러 변환
WO2012103326A2 (en) * 2011-01-28 2012-08-02 Eye IO, LLC Adaptive bit rate control based on scenes
JP6289168B2 (ja) * 2014-02-28 2018-03-07 三菱電機株式会社 画像符号化装置
US10743059B2 (en) * 2015-08-30 2020-08-11 EVA Automation, Inc. Displaying HDMI content at an arbitrary location
CN108737831B (zh) * 2017-04-19 2023-04-07 腾讯科技(深圳)有限公司 一种数据处理方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07288810A (ja) * 1994-04-14 1995-10-31 Matsushita Electric Ind Co Ltd 動画符号化方法
JP2006509444A (ja) * 2002-12-10 2006-03-16 タット・システムズ・インコーポレイテッド ピクチュアベースの先読みウィンドウによるレート制御

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4636159B2 (ja) 1995-05-02 2011-02-23 ソニー株式会社 符号化装置及び方法
JP3871840B2 (ja) * 1999-12-24 2007-01-24 日本電気株式会社 圧縮動画像再符号化装置
JP4528043B2 (ja) 2004-07-12 2010-08-18 株式会社日立製作所 映像信号変換装置、変換方法及びこれを用いた映像信号記録装置
JP2006074347A (ja) * 2004-09-01 2006-03-16 Sony Corp 画像処理装置および画像処理方法
JP4038774B2 (ja) 2004-12-28 2008-01-30 日本ビクター株式会社 符号化装置及び符号化方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07288810A (ja) * 1994-04-14 1995-10-31 Matsushita Electric Ind Co Ltd 動画符号化方法
JP2006509444A (ja) * 2002-12-10 2006-03-16 タット・システムズ・インコーポレイテッド ピクチュアベースの先読みウィンドウによるレート制御

Also Published As

Publication number Publication date
US8036268B2 (en) 2011-10-11
JP2011015220A (ja) 2011-01-20
US20110002382A1 (en) 2011-01-06

Similar Documents

Publication Publication Date Title
JP4746691B2 (ja) 動画像符号化装置および動画像符号化方法
TWI221738B (en) Apparatus and methods for transcoder-based adaptive quantization
JP5087627B2 (ja) 効果的なレート制御および拡張したビデオ符号化品質のためのρ領域フレームレベルビット割り当てのための方法
US7925108B2 (en) Encoding device and dynamic image recording system having the encoding device
US20070071097A1 (en) Recompression method and apparatus for video data
KR100978767B1 (ko) 화상 부호화 방법 및 이것을 이용한 장치와 컴퓨터프로그램
US8675979B2 (en) Transcoder, method of transcoding, and digital recorder
US8165411B2 (en) Method of and apparatus for encoding/decoding data
US7899121B2 (en) Video encoding method, video encoder, and personal video recorder
KR20060132972A (ko) 컨버터를 이용하는 비디오 인코더
KR20070029072A (ko) 동화상 신호의 부호화 장치, 동화상 신호의 부호화 방법 및컴퓨터 판독 가능한 기록 매체
JP2013258651A (ja) 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、およびプログラム
CN1973548B (zh) 用于选择性地转换输入信号的代码的设备和方法
US10536697B2 (en) Method for re-encoding image and apparatus therefor
JP2007306370A (ja) 画像符号化記録装置
JP5709492B2 (ja) 画像符号化方式変換装置および画像符号化方式変換プログラム
JPH1032829A (ja) 画像情報の再符号化方法及び装置
JP2008042660A (ja) 映像信号再符号化装置及び映像信号再符号化方法
JP2007336005A (ja) 画像符号化装置および画像符号化方法
JP4571956B2 (ja) スケーラブル動画像符号化方法,装置,そのプログラムおよびその記録媒体
JP2010187337A (ja) 動画像変換装置及び動画像変換方法
JP2008109693A (ja) 動画像再符号化装置
JP2018157291A (ja) 画像処理装置
JPH11234675A (ja) 動画像符号化装置及び方法、動画像復号装置及び方法並びに記録媒体
JP2006319638A (ja) コンテンツ符号化装置及びコンテンツ符号化プログラム、並びに、コンテンツ編集装置及びコンテンツ編集プログラム

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101012

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110111

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110314

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110419

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110513

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140520

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140520

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees