JP4231045B2 - 動画像符号化方法及び装置 - Google Patents

動画像符号化方法及び装置 Download PDF

Info

Publication number
JP4231045B2
JP4231045B2 JP2005353722A JP2005353722A JP4231045B2 JP 4231045 B2 JP4231045 B2 JP 4231045B2 JP 2005353722 A JP2005353722 A JP 2005353722A JP 2005353722 A JP2005353722 A JP 2005353722A JP 4231045 B2 JP4231045 B2 JP 4231045B2
Authority
JP
Japan
Prior art keywords
picture
code amount
encoding
moving image
picture type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005353722A
Other languages
English (en)
Other versions
JP2007158944A (ja
Inventor
淳 松村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2005353722A priority Critical patent/JP4231045B2/ja
Publication of JP2007158944A publication Critical patent/JP2007158944A/ja
Application granted granted Critical
Publication of JP4231045B2 publication Critical patent/JP4231045B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は動画像符号化方法及び装置に係り、特に再符号化時のビットレート制御に関する。
MPEGのような動き補償予測を用いた符号化フォーマットによって符号化された動画像データを異なる符号化フォーマットの動画像データに変換したり、動画像データの符号化レートを変更したりすることをトランスコードという。トランスコードは、元の動画像データのGOP(Group of Picture)構造を変えずに行う方が、効率が良いことが知られている。例えば、MPEG−2方式によりIピクチャ→Pピクチャ→Bピクチャ→Bピクチャ→Pピクチャ→Bピクチャ…という順で符号化されている動画像データをH.264方式の動画像データに変換する場合、MPEG−2方式の動画像データと同じIピクチャ→Pピクチャ→Bピクチャ→Bピクチャ→Pピクチャ→Bピクチャ・・・という順で符号化する方が良い。
一方、MPEGに代表される動画像符号化では、動画像データのビットレートを制御することが行われる。一般的にビットレート制御(例えばMPEG−2 Test Model 5。以降、TM5とする)を行うには、GOP構造が事前に既知である必要がある。そこで、特許文献1に開示されているように動画像データを先読みし、必要な情報を取得してからビットレート制御を行う方法が提案されている。
特開2001−145113公報(16頁、図4)
特許文献1の手法では、ビットレートの制御に際して動画像データの先読みを行う必要があるため、先読み分のバッファが余計に必要になるという問題があった。また、ディジタル放送のようにリアルタイムに受信される動画像データについては先読みすることができないため、高精度なビットレート制御を行うことが難しい。
本発明は、動画像データの先読みを必要とすることなくトランスコード時に高精度なビットレート制御を可能とする動画像符号化方法及び装置を提供することを目的とする。
本発明の一観点によれば、符号化された入力動画像データを再符号化して出力動画像データを得る動画像符号化装置において、前記出力動画像データ中の符号化対象ピクチャのピクチャタイプを予測するピクチャタイプ予測手段と、予測されたピクチャタイプに対する基本割り当て符号量を算出する基本符号量割り当て手段と、前記基本割り当て符号量を調整した調整割り当て符号量を算出する調整符号量算出手段と、前記基本割り当て符号量と前記調整割り当て符号量との差分符号量を累積して累積符号量を算出する差分符号量累積手段と、前記符号化対象ピクチャのピクチャタイプが前記予測されたピクチャタイプと異なる場合は前記符号化対象ピクチャに前記調整割り当て符号量を割り当て、前記符号化対象ピクチャのピクチャタイプが前記予測されたピクチャタイプと同一の場合は前記基本割り当て符号量に前記累積符号量から振り分けられた符号量を加えた割り当て符号量を前記符号化対象ピクチャに割り当てる符号量割り当て手段と、割り当てられた符号量に従って前記入力動画像データを符号化する符号化手段とを具備する動画像符号化装置を提供する。
本発明によれば、符号化対象ピクチャについて予測されたピクチャタイプと実際のピクチャタイプとの違いを符号量割り当てに逐次フィードバックすることにより、トランスコード時に動画像データの先読みを不要として、先読みによるメモリの増加や遅延を生じることなく高精度なビットレート制御を行うことが可能となる。
以下、本発明の実施形態について説明する。
図1は、本発明の一実施形態に係る動画像符号化装置の概略構成を示している。本実施形態ではMPEG−2に基づく力動画像データを再符号化してH.264に基づく出力動画像データに変換するトランスコードを例に説明するが、入力動画像データ及び出力動画像データの符号化方式やトランスコードの方式は特に制限されない。
図1において、トランスコーダ100はMPEG−2方式により符号化された入力動画像データであるMPEG−2ビットストリーム101をデコードして解析するMPEG−2デコーダ102、MPEG−2デコーダ102からのMPEG−2解析データ103を受け取り、MPEG−2ビットストリームをH.264方式により再符号化して出力動画像データであるH.264ビットストリーム105に変換するH.264エンコーダ104を有する。
トランスコーダ100には、さらにMPEG−2デコーダ102からのMPEG−2解析データ103とH.264エンコーダ104からの発生符号量情報107を受け取り、H.264エンコーダ104のビットレートを制御するビットレート制御器106が接続される。すなわち、ビットレート制御器106はH.264エンコーダ104が再符号化を行う際の各ピクチャに対する割り当て符号量を求め、割り当て符号量情報108をH.264エンコーダ104に与える。H.264エンコーダ104は、割り当て符号量情報108に基づいて例えば量子化スケールを変更することにより、再符号化時の出力動画像データ105のビットレートを制御する。
MPEG−2解析データ103は、MPEG−2デコーダ102内の図示しない可変長復号器から出力される。MPEG−2解析データ103の具体例については、後に説明する。
次に、図2を用いてビットレート制御器106について説明する。ビットレート制御器106は、図2に示されるようにGOP予測器201、基本割り当て符号量算出器202、調整割り当て符号量算出器203、差分器204、差分符号量累積器205、累積符号量割り当て器206、加算器207及び割り当て符号量選択器208を有する。
GOP予測器201は、MPEG−2解析データ103からMPEG−2ストリーム101のGOP構造を予測し、予測GOP構造を示す情報を基本割り当て符号量算出器202に与える。基本割り当て符号量算出器202は、予測GOP構造に応じて入力動画像データ101のうちこれから符号化しようとするピクチャ(符号化対象ピクチャという)のピクチャタイプタイプに対して基本的に割り当てる符号量(基本割り当て符号量)を算出する。
調整割り当て符号量算出器203は、MPEG−2ストリーム101の実際のGOP構造(以下、実GOP構造という)が予測GOP構造ではなかった場合、すなわち予測されたピクチャタイプが実際のピクチャタイプと異なる場合に、符号化対象ピクチャに対する割り当て符号量を調整するために、基本割り当て符号量を調整した調整割り当て符号量を算出する。
より具体的には、例えば後述する差分符号量が、予測GOP構造に基づき予測されたピクチャタイプが動き補償予測符号化に用いる参照画像でかつ他のピクチャタイプが非参照画像の場合は正の値を取り、予測されたピクチャタイプが非参照画像でかつ他のピクチャタイプが参照画像の場合は負の値を取るように調整割り当て符号量を算出する。
あるいは差分符号量が、予測GOP構造に基づき予測されたピクチャタイプが画面間予測符号化画像(Pピクチャ)でかつ他のピクチャタイプが双方向画面間予測符号化画像(Bピクチャ)である場合は正の値を取り、予測されたピクチャタイプが双方向画面間予測符号化画像(Bピクチャ)でかつ他のピクチャタイプが画面間予測符号化画像(Pピクチャ)である場合は負の値を取るように調整割り当て符号量を算出する。
差分器204は、基本割り当て符号量と調整割り当て符号量との差分(差分符号量)を求める。差分符号量累積器205は、差分器204により求められた差分符号量を累積する。累積符号量割り当て器206は、差分符号量累積器203により累積された差分符号量(累積符号量)から符号化対象ピクチャに割り当てる符号量を算出する。加算器207は、累積符号量割り当て器206により割り当てられた符号量に調整割り当て符号量算出器203により算出された調整割り当て符号量を加算する。
符号量選択部208は、発生符号量情報107と予測GOP構造に基づいて調整割り当て符号量及び加算符号量のいずれかを最終的な割り当て符号量として選択し、割り当て符号量情報108を出力する。具体的には、符号化対象ピクチャのピクチャタイプが予測GOP構造に基づき予測されたピクチャタイプと異なる場合は符号化対象ピクチャに調整割り当て符号量を割り当て、符号化対象ピクチャのピクチャタイプが予測されたピクチャタイプと同一の場合は基本割り当て符号量に累積符号量から振り分けられた符号量を加えた割り当て符号量を符号化対象ピクチャに割り当てる。
次に、図3に示すフローチャートを用いて図2のビットレート制御器106の処理手順について説明する。
まず、GOP予測器201はMPEG−2デコーダ102からのMPEG−2解析データ103として、符号化対象ピクチャを表示する順序を示す情報、例えば時刻基準(temporal_reference;MPEG−2ストリーム102の各ピクチャのヘッダ情報に存在する、ピクチャの表示順が示される情報)を受け取り、これに基づき符号化対象ピクチャのGOP構造を予測する(ステップS301)。GOPの先頭には必ず符号化順でIピクチャが来るため、GOP予測器201は先頭以降のピクチャタイプの並びを予測する。
表1は、Pピクチャの間隔が3の場合のGOP構造とtemporal_referenceの関係を示している。timeは時刻、coding orderは符号化順を表している。表1から明らかなように、例えば現在の時刻がk、temporal_referenceが3であった場合、Pピクチャの間隔が3でPピクチャと次のPピクチャとの間に2枚のBピクチャが存在することが時刻kにおいて判明する。この場合、GOP予測器201では次の時刻k+3のPピクチャが入力されるまで、入力動画像データ101を先読みすることなくGOP構造の予測、すなわちピクチャタイプの予測を行うことが可能となる。
Figure 0004231045
次に、基本割り当て符号量算出器202は予測GOP構造を元に、H.264エンコーダ104が符号化を行う際の各符号化対象ピクチャへの基本的な割り当て符号量(以下、基本割り当て符号量という)を算出する(ステップS302)。基本割り当て符号量の算出には、様々な方法を用いることができるが、一例としてTM5の場合を例として説明する。
TM5では、I/P/Bピクチャタイプに所定の重みを付けて符号量を算出する。例えば、表1に示したようなPピクチャの間隔が3の構造では、図4に示すような基本割り当て符号量が各符号化対象ピクチャに対して算出される。このとき基本割り当て符号量算出器202は、H.264エンコーダ104において実際に発生した符号量を示す発生符号量情報107を受け取り、次の基本割り当て符号量の算出に実際の発生符号量と基本割り当て符号量との差分符号量をフィードバックする。
次に、H.264エンコーダ104はMPEG−2デコーダ102からのMPEG−2解析データ103を受け取り、これをH.264ビットストリームに変換するために、符号化対象ピクチャ(現ピクチャ)の符号化を開始する(ステップS303)。MPEG−2解析データ103は、例えばMPEGデコーダ102がMPEG−2ストリーム101を完全にデコードしたベースバンド画像データを含んだり、符号化対象のピクチャタイプを含んだり、マクロブロックの符号化モードあるいは動きベクトルを含んだりする。MPEG−2解析データ103がマクロブロックの動きベクトルを含んでいる場合は、H.264エンコーダ104でエンコード時に必要な動き検出の演算量を減らすことができる。その際、H.264エンコーダ104の内部の構成は大きく変わる場合があるが、発明の主旨に関係ないため、ここでは詳細な説明を省略する。
MPEG−2解析データ103が符号化対象のピクチャタイプを含んでいる場合、H.264エンコーダ104は解析データ103に含まれる符号化対象のピクチャタイプと同じピクチャタイプでH.264ビットストリーム105への符号化を行う。このようにH.264エンコーダ104がMPEG−2ストリーム101中の符号化対象のピクチャタイプと同じピクチャタイプで符号化を行うことで、符号化効率の低下を抑えることができる。以下では、MPEG−2解析データ103に符号化対象のピクチャタイプが含まれるものとして説明を行う。
一方、MPEG−2解析データ103に符号化対象のピクチャタイプが含まれない場合は、H.264エンコーダ104は予測GOP構造に従ったピクチャタイプで符号化を行えばよい。
H.264エンコーダ104は、MPEG−2解析データ103から認識した符号化対象のピクチャタイプで符号化を開始するが、その際、予測GOP構造に従った符号化対象のピクチャタイプと一致するか確認する(ステップS304)。本実施形態のようにMPEG−2解析データ103がtemporal_referenceであり、temporal_referenceからGOP予測器201がGOP構造を予測している場合は、ほぼ間違いなく予測GOP構造に従った符号化対象のピクチャタイプとH.264エンコーダ104がこれから符号化しようとする符号化対象ピクチャのピクチャタイプは一致する。この場合、処理はステップS304からステップS305に移行する。
一方、予測GOP構造に従った符号化対象のピクチャタイプがH.264エンコーダ104の符号化対象ピクチャのピクチャタイプと一致しない場合、例えばMPEG−2ビットストリーム101に付加されていたtemporal_referenceが間違っていた場合や、MPEG−2デコーダ102がtemporal_referenceを解析できなかった場合には、予測GOP構造は実GOP構造と大きく異なる場合が発生する。このような場合は、ステップS304からステップS306に移行して調整割り当て符号量を求め、これを用いて符号量割り当てを行うことにより、符号化対象の予測されたピクチャタイプと実際のピクチャタイプの違いを吸収する。
以下、ステップS306について詳しく説明する。予測GOP構造はP0→B1→B2であるが、実GOP構造はP0→P1→P2であった場合に、H.264エンコーダ104がこれからP1ピクチャを符号化対象として符号化を行う状況を考える。この場合、当初の予測では符号化対象ピクチャがB1ピクチャであったため、基本割り当て符号量算出器202ではBピクチャ分の基本割り当て符号量、すなわちPピクチャ分よりも少ない基本割り当て符号量を算出している。図4中に示されるようにBピクチャ分の基本割り当て符号量をαとおき、Pピクチャ分の基本割り当て符号量をβとおく。実際に符号化するピクチャはP1ピクチャであるため、基本割り当て符号量がαのままでは符号量が足らずに画質に劣化が生じる可能性が高い。
そこで、調整割り当て符号量算出器203ではPピクチャの基本割り当て符号量を画質劣化が生じない程度に調整した符号量(これを調整割り当て符号量という)を算出する。調整割り当て符号量の算出には様々な方法を用いることができるが、例えば単純にα+(β−α)/2としてもよい。他の算出方法として、B1→P1であることから予測して次のB2ピクチャもP2ピクチャになると考えて、本来P0→P1→P2で割り当てられる基本割り当て符号量を基本割り当て符号量算出器202と同様の方法で算出し、それを調整割り当て符号量としてもよい。ここでは図5に示すように、前者の単純な計算で得られる符号量α+(β−α)/2を調整割り当て符号量γとする。
こうして得られた調整割り当て符号量γの情報が割り当て符号量選択器208によって選択され、この情報がビットレート制御部106から割り当て符号量情報108としてH.264エンコーダ104に入力されることにより、符号化が行われる。調整割り当て符号量γは、当初予定していた基本割り当て符号量(ここではα)よりも大きな値になっているため、差分器204によって両者の差分符号量α−γ(以降、δと記載する)を求め、これを差分符号量累積器205によって蓄積する。
次に、ステップS305について詳しく説明する。予測GOP構造がP0→B1→B2であり、実GOP構造もP0→B1→B2であった場合に、MPEG−4エンコーダ104がこれからB1ピクチャを符号化する状況を考える。当初の予測通りのB1ピクチャであるため、基本的には基本割り当て符号量算出器202によって算出された基本割り当て符号量が割り当て符号量選択器208によって選択され、ビットレート制御部106から割り当て符号量情報108としてH.264エンコーダ104に入力されることにより、符号化が行われる。
ここで、差分符号量累積器205において差分符号量が累積されている場合は、累積された差分符号量(累積符号量という)Σδを累積符号量割り当て器206によって基本割り当て符号量にどの程度加えるかを算出する。例えば、累積符号量Σδを現在の基本割り当て符号量αにすべて加えると、予測GOP構造と実GOP構造との割り当て符号量の差分を1ピクチャでフィードバックすることになる。累積符号量Σδの絶対値が基本割り当て符号量αに比べて非常に大きな値であった場合は、画質変動が大きくなるため、図6に示すようにN枚のピクチャに累積符号量Σδを分配したほうがよい。累積符号量Σδの絶対値が基本割り当て符号量αに比べて十分に小さな値であった場合は、画質変動は大きくないため、1枚のピクチャでフィードバックしても問題はない。従って、累積符号量割り当て器206は累積符号量Σδの絶対値の大きさを見て、割り当てる符号量の算出方法を切り替えればよい。
次に、予測GOP構造が終了したか否か確認を行う(ステップS307)。予測GOP構造がまだ終了していなければ、ステップS303に戻って次に入力されるピクチャの符号化を開始する。予測GOP構造が終了した場合は、ステップS308に移行する。ステップS308では、入力されたMPEG−2ビットストリーム101が終端か否か確認を行う。入力されたMPEG−2ビットストリーム101が終端であれば、エンコードは終了となる。入力されたMPEG−2ビットストリーム101が終端でなければ、ステップS301に戻って再びGOP構造の予測をGOP予測器201で行う。
以上の処理フローで各ピクチャに対する割り当て符号量が算出され、H.264エンコーダ104に入力される。H.264エンコーダ104では、与えられた割り当て符号量から実際のエンコード時にビットレート制御のために必要となる量子化スケールを算出する。割り当て符号量から量子化スケールを算出する方式は様々なものがあげられるが、例えばTM5に従えばよい。
このように本実施形態によれば、予測GOP構造とは異なるGOP構造に対して適応的に符号量割り当てを行うことで、トランスコーダにおいて精度の高いビットレート制御を行うことが可能となる。
上記説明ではMPEG−2ストリーム101からH.264ストリーム105へのトランスコードを示したが、例えばMPEG−4ストリームからH.264ストリームへのトランスコードを行う場合にも、基本的に上記と同様にしてビットレート制御を行うことができる。その場合、MPEG−2デコーダ102はMPEG−4デコーダに置き換わり、GOP予測器201に入力される、符号化対象ピクチャを表示する順序を示す情報はvop_time_incrementとなる。表2は、Pピクチャの間隔が2の場合のGOP構造とvop_time_incrementの関係を示している。timeは時刻、coding orderは符号化順を表している。
Figure 0004231045
例えば、MPEG−4ストリームが29.97Hzで符号化されている状況下で現在の時刻がkであったとする。そのときのvop_time_incrementが2002であった場合、Pピクチャの間隔が2でPピクチャと次のPピクチャとの間に1枚のBピクチャが存在することが時刻kで判明し、次の時刻k+2時刻でPピクチャが来るまで先読みすることなくGOP構造を予測することが可能となる。
ただし、上記のvop_time_increment =2002→Pピクチャ間隔が2という算出の流れにおいては、vop_time_incrementは正確にはfixed_vop_time_incrementがなければ得られないが、fixed_vop_time_incrementはMPEG−4ビットストリームを解析すればMPEG−4デコーダで得られる。もしfixed_vop_time_incrementが得られなかったとしても、fixed_vop_time_increment はVideo Object Layerに存在するものであって逐次変化するものでないため、数フレーム符号化すれば容易に推定される。従って、最初の数フレームにおいてはGOP予測器201によるGOP構造の予測精度は落ちるものの、その後は正確なGOP構造の予測が可能である。
また、符号化方式の変更を伴わずH.264ストリーム(但し、高ビットレート)からH.264ストリーム(但し、低ビットレート)へのトランスコードを行う場合にも、同様にビットレート制御を行うことができる。その場合、MPEG−2デコーダ102はH.264デコーダに置き換わり、GOP予測器201に入力される、符号化対象ピクチャを表示する順序を示す情報は、picture order count(POC)あるいはcpb_removal_delayとなる。
表3は、Pピクチャの間隔が3の場合のGOP構造とPOCの関係を示している。timeは時刻、coding orderは符号化順を表す。
Figure 0004231045
例えば、POCを受け取ったとき現在の時刻がkであったとし、そのときのPOCが6であった場合、Pピクチャ間隔が3で、Pピクチャと次のPピクチャとの間に2枚のBピクチャが存在することが時刻kにおいて判明し、次のPピクチャ(k+3時刻)が来るまで先読みすることなくGOP構造を予測することが可能となる。ただし、このPOC=6→Pピクチャ間隔が3という算出の流れは正確ではなく、POCの単位増加分は逐次変化する場合もある。しかし、一般的なH.264ビットストリームに付加されるPOCは固定幅で増加するものが多いため、数フレーム符号化すればPOCの単位増加分は容易に推定できる値であり、最初の数フレームにおいてはGOP予測器201のGOP構造の予測精度は落ちるものの、その後は正確なGOP構造の予測が可能である。
表4は、Pピクチャの間隔が3の場合のGOP構造とcpb_removal_delayの関係を示している。timeは時刻、coding orderは符号化順を表す。
Figure 0004231045
例えば、cpb_removal_delayを受け取っとき現在の時刻がkであったとし、そのときのcpb_removal_delayが6であった場合、Pピクチャ間隔が3でPピクチャと次のPピクチャとの間に2枚のBピクチャが存在することが時刻kにおいて判明し、次のPピクチャ(k+3時刻)が来るまで先読みすることなくGOP構造を予測することが可能となる。ただし、このcpb_removal_delay=6→Pピクチャの間隔が3という算出の流れは正確ではなく、cpb_removal_delayの単位増加分は逐次変化する場合もある。しかし、一般的なH.264ビットストリームは固定フレームレートのものが多く、付加されるcpb_removal_delayは固定幅で増加するものが多い。従って、数フレーム符号化すればcpb_removal_delayの単位増加分は容易に推定できる値であり、最初の数フレームにおいてはGOP予測器201におけるGOP構造の予測精度は落ちるものの、その後は正確なGOP構造の予測が可能である。あるいは場合によってH.264ビットストリームに付加されているtime_scale及びnum_units_in_tickを解析すれば、最初から単位増加分が判明するため、GOP予測器201はより正確なGOP構造の予測が可能となる。
なお、上述した動画像符号化装置は、例えば汎用のコンピュータ装置を基本ハードウェアとして用いることでも実現することが可能である。すなわち、上記のコンピュータ装置に搭載されたプロセッサに符号化された入力動画像データを再符号化して出力動画像データを得る動画像符号化処理をコンピュータに行わせるためのプログラム、例えば(a)出力動画像データ中の符号化対象ピクチャのピクチャタイプを予測する処理と、(b)予測されたピクチャタイプに対する基本割り当て符号量を算出する処理と、(c)前記基本割り当て符号量を調整した調整割り当て符号量を算出する処理と、(d)前記基本割り当て符号量と前記調整割り当て符号量との差分符号量を累積して累積符号量を算出する処理と、(e)前記符号化対象ピクチャのピクチャタイプが前記予測されたピクチャタイプと異なる場合は前記符号化対象ピクチャに前記調整割り当て符号量を割り当て、前記符号化対象ピクチャのピクチャタイプが前記予測されたピクチャタイプと同一の場合は前記基本割り当て符号量に前記累積符号量から振り分けられた符号量を加えた割り当て符号量を前記符号化対象ピクチャに割り当てる処理と、(e)割り当てられた符号量に従って前記入力動画像データを再符号化する処理とを含む動画像符号化処理を前記コンピュータに行わせるためのプログラムを実行させることにより実現することができる。
このとき、動画像符号化装置は上記のプログラムをコンピュータ装置にあらかじめインストールすることで実現してもよいし、上記のプログラムをCD−ROMなどの記憶媒体に記憶して、あるいはネットワークを介して配布して、コンピュータ装置に適宜インストールすることで実現してもよい。
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
本発明の一実施形態に係る動画像符号化装置の概略構成を示すブロック図 図1中のビットレート制御部の詳細を示すブロック図 同実施形態におけるビットレート制御の流れを示すフローチャート ピクチャタイプ毎の基本符号量割り当てを示す図 予測GOP構造と実GOP構造が同一でない場合の割り当て符号量の変化を示す図 予測GOP構造と実GOP構造が同一の場合の割り当て符号量の変化を示す図
符号の説明
100・・・トランスコーダ;
101・・・MPEG−2ビットストリーム(入力動画像データ);
102・・・MPEG−2デコーダ;
103・・・MPEG−2解析データ;
104・・・H.264エンコーダ;
105・・・H.264ビットストリーム;
106・・・ビットレート制御器;
107・・・発生符号量情報;
108・・・割り当て符号量情報;
201・・・GOP予測器;
202・・・基本割り当て符号量算出器;
203・・・調整割り当て符号量算出器;
204・・・差分器;
205・・・差分符号量算出器;
206・・・累積符号量割り当て器;
207・・・加算器;
208・・・割り当て符号量選択器。

Claims (13)

  1. 符号化された入力動画像データを再符号化して出力動画像データを得る動画像符号化方法において、
    前記出力動画像データ中の符号化対象ピクチャのピクチャタイプを予測するステップと、
    予測されたピクチャタイプに対する基本割り当て符号量を算出するステップと、
    前記基本割り当て符号量を調整した調整割り当て符号量を算出するステップと、
    前記基本割り当て符号量と前記調整割り当て符号量との差分符号量を累積して累積符号量を算出するステップと、
    前記符号化対象ピクチャのピクチャタイプが前記予測されたピクチャタイプと異なる場合は前記符号化対象ピクチャに前記調整割り当て符号量を割り当て、前記符号化対象ピクチャのピクチャタイプが前記予測されたピクチャタイプと同一の場合は前記基本割り当て符号量に前記累積符号量から振り分けられた符号量を加えた割り当て符号量を前記符号化対象ピクチャに割り当てるステップと、
    割り当てられた符号量に従って前記入力動画像データを再符号化するステップとを具備する動画像再符号化方法。
  2. 符号化された入力動画像データを再符号化して出力動画像データを得る動画像符号化装置において、
    前記出力動画像データ中の符号化対象ピクチャのピクチャタイプを予測するピクチャタイプ予測手段と、
    予測されたピクチャタイプに対する基本割り当て符号量を算出する基本符号量割り当て手段と、
    前記基本割り当て符号量を調整した調整割り当て符号量を算出する調整符号量算出手段と、
    前記基本割り当て符号量と前記調整割り当て符号量との差分符号量を累積して累積符号量を算出する差分符号量累積手段と、
    前記符号化対象ピクチャのピクチャタイプが前記予測されたピクチャタイプと異なる場合は前記符号化対象ピクチャに前記調整割り当て符号量を割り当て、前記符号化対象ピクチャのピクチャタイプが前記予測されたピクチャタイプと同一の場合は前記基本割り当て符号量に前記累積符号量から振り分けられた符号量を加えた割り当て符号量を前記符号化対象ピクチャに割り当てる符号量割り当て手段と、
    割り当てられた符号量に従って前記入力動画像データを再符号化する符号化手段とを具備する動画像符号化装置。
  3. 前記ピクチャタイプは、前記符号化対象ピクチャが動き補償予測符号化に用いる参照画像か非参照画像かを示す請求項2記載の動画像符号化装置。
  4. 前記ピクチャタイプは、前記符号化対象ピクチャが画面内符号化画像(Iピクチャ)、画面間予測符号化画像(Pピクチャ)、あるいは双方向画面間予測符号化画像(Bピクチャ)のいずれであるかを示す請求項2または3のいずれか1項記載の動画像符号化装置。
  5. 前記ピクチャタイプ予測手段は、前記符号化対象ピクチャを表示するタイミングを示す情報を解析することにより前記符号化対象ピクチャのピクチャタイプを予測する請求項2記載の動画像符号化装置。
  6. 前記入力動画像データはMPEG−2方式により符号化されたMPEG−2ストリームであり、前記符号化対象ピクチャを表示するタイミングを示す情報は前記MPEG−2ストリームにおけるtemporal_referenceである請求項5記載の動画像符号化装置。
  7. 前記入力動画像データはMPEG−4方式により符号化されたMPEG−4ストリームであり、前記符号化対象ピクチャを表示するタイミングを示す情報は前記MPEG−4ストリームにおけるvop_time_incrementである請求項5記載の動画像符号化装置。
  8. 前記符号化対象ピクチャを表示するタイミングを示す情報は、MPEG−4 AVC/H.264ストリームにおけるpicture order count(POC)である請求項5記載の動画像符号化装置。
  9. 前記符号化対象ピクチャを表示するタイミングを示す情報は、MPEG−4 AVC/H.264ストリームにおけるcpb_removal_delayである請求項5記載の動画像符号化装置。
  10. 前記ピクチャタイプ予測手段は、符号化順にGOP(Group of Picture)の先頭を画面内予測符号化画像(Iピクチャ)とし、その後に少なくとも1個の双方向画面間予測符号化(Bピクチャ)及び1個の画面間予測符号化(Pピクチャ)が周期的に存在するとして前記符号化対象ピクチャのピクチャタイプを予測する請求項2記載の動画像符号化装置。
  11. 前記調整割り当て符号量算出手段は、前記差分符号量が、前記予測されたピクチャタイプが動き補償予測符号化に用いる参照画像でかつ他のピクチャタイプが非参照画像の場合は正の値を取り、前記予測されたピクチャタイプが前記非参照画像でかつ他のピクチャタイプが前記参照画像の場合は負の値を取るように前記調整割り当て符号量を算出する請求項2記載の動画像符号化装置。
  12. 前記調整割り当て符号量算出手段は、前記差分符号量が、前記予測されたピクチャタイプが画面間予測符号化画像(Pピクチャ)でかつ他のピクチャタイプが双方向画面間予測符号化画像(Bピクチャ)である場合は正の値を取り、前記予測されたピクチャタイプが双方向画面間予測符号化画像(Bピクチャ)でかつ他のピクチャタイプが画面間予測符号化画像(Pピクチャ)である場合は負の値を取るように前記調整割り当て符号量を算出する請求項2記載の動画像符号化装置。
  13. 符号化された入力動画像データを再符号化して出力動画像データを得る動画像符号化処理をコンピュータに行わせるためのプログラムにおいて、
    前記出力動画像データ中の符号化対象ピクチャのピクチャタイプを予測する処理と、
    予測されたピクチャタイプに対する基本割り当て符号量を算出する処理と、
    前記基本割り当て符号量を調整した調整割り当て符号量を算出する処理と、
    前記基本割り当て符号量と前記調整割り当て符号量との差分符号量を累積して累積符号量を算出する処理と、
    前記符号化対象ピクチャのピクチャタイプが前記予測されたピクチャタイプと異なる場合は前記符号化対象ピクチャに前記調整割り当て符号量を割り当て、前記符号化対象ピクチャのピクチャタイプが前記予測されたピクチャタイプと同一の場合は前記基本割り当て符号量に前記累積符号量から振り分けられた符号量を加えた割り当て符号量を前記符号化対象ピクチャに割り当てる処理と、
    割り当てられた符号量に従って前記入力動画像データを再符号化する処理とを含む動画像符号化処理を前記コンピュータに行わせるためのプログラム。
JP2005353722A 2005-12-07 2005-12-07 動画像符号化方法及び装置 Expired - Fee Related JP4231045B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005353722A JP4231045B2 (ja) 2005-12-07 2005-12-07 動画像符号化方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005353722A JP4231045B2 (ja) 2005-12-07 2005-12-07 動画像符号化方法及び装置

Publications (2)

Publication Number Publication Date
JP2007158944A JP2007158944A (ja) 2007-06-21
JP4231045B2 true JP4231045B2 (ja) 2009-02-25

Family

ID=38242688

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005353722A Expired - Fee Related JP4231045B2 (ja) 2005-12-07 2005-12-07 動画像符号化方法及び装置

Country Status (1)

Country Link
JP (1) JP4231045B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4582141B2 (ja) 2007-11-27 2010-11-17 カシオ計算機株式会社 符号量制御装置、符号量制御方法、符号量制御プログラム、動画記録装置
JP4924746B2 (ja) * 2010-08-13 2012-04-25 カシオ計算機株式会社 符号量制御装置、符号量制御方法、符号量制御プログラム、動画記録装置

Also Published As

Publication number Publication date
JP2007158944A (ja) 2007-06-21

Similar Documents

Publication Publication Date Title
US7978920B2 (en) Method and system for processing an image, method and apparatus for decoding, method and apparatus for encoding, and program with fade period detector
JP4358215B2 (ja) 動画像符号化装置及びその方法
US8194735B2 (en) Video encoding apparatus and video encoding method
JP4007594B2 (ja) 動画像符号化装置及び方法、動画像符号化方式変換装置及び方法
JP2004040785A (ja) 双方向予測(b)ピクチャの時空間予測および複数ピクチャ参照動き補償の動きベクトル予測
JP4764136B2 (ja) 動画像符号化装置、及びフェードシーン検出装置
JP5128389B2 (ja) 動画像符号化装置及び動画像符号化方法
JPWO2005064947A1 (ja) 動画像符号化方法及び装置
JP2009296286A (ja) ビットレート変換装置及び変換方法
JP5706759B2 (ja) 画像符号化装置及び画像符号化方法
JP2011029954A (ja) 画像符号化装置と画像符号化方法
JP4231045B2 (ja) 動画像符号化方法及び装置
JP5649296B2 (ja) 画像符号化装置
KR101285654B1 (ko) 메타 데이터와 미디어 데이터가 분리되어 있는 파일 형식의 멀티미디어 컨텐츠를 프로그래시브 다운로드하기 위한 실시간 트랜스코딩 장치
JP4826533B2 (ja) 画像処理装置および画像処理方法、プログラム、並びに、記録媒体
JP4788653B2 (ja) 画像データトランスコーディング装置及びトランスコーディング方法
KR100962761B1 (ko) 화상 처리 장치, 화상 처리 방법, 및 기록 매체
JPWO2008053557A1 (ja) 動画像再符号化装置、動画像再符号化方法、動画像再符号化プログラムおよび動画像再符号化プログラムを格納した記録媒体
JP2005260576A (ja) 画像符号化方法及び装置
JP4285431B2 (ja) ビデオ情報編集装置、方法及びプログラム
KR100336497B1 (ko) 공간예측 오차 모델을 이용한 동영상 부호화기의 율제어장치 및 방법
JP2002199408A (ja) 動画像符号化方法および動画像符号化装置
KR101461292B1 (ko) 제1 mpeg 스트림으로부터 제2 mpeg 스트림으로의 트랜스코더
KR100677128B1 (ko) 동영상 부호화기의 비트율 제어장치 및 방법
JP2010062999A (ja) 動画像符号化装置、動画像符号化方法、及び、コンピュータプログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081128

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081202

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081204

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111212

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121212

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121212

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131212

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees