JP4788653B2 - 画像データトランスコーディング装置及びトランスコーディング方法 - Google Patents

画像データトランスコーディング装置及びトランスコーディング方法 Download PDF

Info

Publication number
JP4788653B2
JP4788653B2 JP2007127757A JP2007127757A JP4788653B2 JP 4788653 B2 JP4788653 B2 JP 4788653B2 JP 2007127757 A JP2007127757 A JP 2007127757A JP 2007127757 A JP2007127757 A JP 2007127757A JP 4788653 B2 JP4788653 B2 JP 4788653B2
Authority
JP
Japan
Prior art keywords
code amount
intra
frame
quantization parameter
amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007127757A
Other languages
English (en)
Other versions
JP2008283607A (ja
Inventor
龍一 神田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2007127757A priority Critical patent/JP4788653B2/ja
Publication of JP2008283607A publication Critical patent/JP2008283607A/ja
Application granted granted Critical
Publication of JP4788653B2 publication Critical patent/JP4788653B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、圧縮符号化された画像データのトランスコーディング装置及びトランスコーディング方法に関する。特にMPEG符号化方式による低ビットレート変換に適用される。
現在、携帯電話端末の処理性能が多岐にわたっており、映像コンテンツの配信においては、それぞれの機種に対する最適な符号化パラメータ(ビットレートや画像サイズなど)が異なっている。このため、コンテンツ作成に際し、このようにパラメータの異なる複数のビットストリームをトランスコードにより簡易に生成できる技術が望まれている。
従来のトランスコード技術として、特許文献1では、第1映像符号化方式から第2の映像符号化方式へのトランスコーディングの際に、第2の映像符号化方式への動きベクトル再利用や符号化モード判定を行うことのできる映像データ変換装置及び映像データ変換方法について述べられている。
また、特許文献2では、トランスコーダ内再量子化処理における削減符号量と発生歪みを考慮することにより、入力ビットストリーム中より得られる量子化パラメータの大きさに応じて削減符号量を制御し、再量子化にともない発生する歪みを最小化するトランスコーダ符号量制御方法について述べられている。
また、非特許文献1では、以下の内容が開示されている。
MPEG−2/H.264トランスコーダであり、MPEG−2既符号化情報を利用し、発生符号量を目標符号量に一致させることを目的としているMPEG−2デコーダとH.264エンコーダをカスケード接続したトランスコーダである。Iフレームに関して以下の2つの特徴が挙げられるとしている。
(1)入力MPEG−2符号化時の量子化ステップサイズと、トランスコード処理(H.264符号化)時の量子化ステップサイズを同一の値にしトランスコード処理を行うと、入出力の符号量はほぼ同等になる。
(2)トランスコード処理後の出力H.264の量子化パラメータQPと1画素あたりの発生符号量bppの関係が以下に定義するQP更新関数に近似可能になる。
以下、Kを比例係数として、QP更新関数を示す。
bpp=K×(−0.09×QP+2.55) (QP≦15)
bpp=K×(−0.06×QP+2.10) (15<QP≦25)
bpp=K×(−0.04×QP+1.60) (25<QP≦35)
bpp=K×(−0.01×QP+0.55) (35<QP≦45)
bpp=K×0.1 (45<QP)
Iフレームに関するMPEG−2/H.264トランスコーダ符号量制御手法は、以下の4つのステップをGOP毎に繰り返す。ただし、IフレームのQP以外の各種パラメータの更新は、H.264/AVC符号化リファレンスソフト(以下、JM)の手法を適応する。
ステップ1:MPEG−2既符号化情報を取得する。トランスコード処理時にMPEG−2を復号する際、MPEG−2符号化時の量子化パラメータQP、及び、Iフレームの符号量を取得する。
ステップ2:QP更新関数の比例係数Kを算出する。ステップ1で取得したMPEG−2のQP、算出した1画素当たりの符号量bpp、QP更新関数より、出力H.264の符号量を予測する際の基準となる比例係数Kを算出する。当該フレームが第2番GOP以降のフレームであれば、ステップ4で取得した誤差率を利用しKを補正する。
ステップ3:量子化パラメータQPを更新する。目標符号量より、Iフレームに割り当てる符号量TIを設定する。TIの設定は、MPEG−2のTM−5を基に修正したものを利用する。算出したTIを利用して1画素あたりの目標符号量を算出し、KをQP更新関数に代入することにより、QPを更新する。
ステップ4:Kの誤差を補正する。ステップ2で算出したKと、出力結果を利用して算出したKの誤差率を算出する。
上記手法により、Iフレームに関して入力のMPEG−2の符号量と出力のH.264符号量をほぼ一致させることができ、それにより画質(フレーム毎のSNR)も安定するとされている。なお、本方式ではIフレームのみ制御が行われ、P、Bフレームに関しては引継ぎ情報は活用されない。
特開2003−309851号公報 特開2001−145102号公報 電子情報通信学会総合大会、2006年3月、D−11−21、「MPEG−2/H.264 トランスコーダ符号量制御方式に関する検討」
しかしながら、特許文献1のトランスコード方法では、動きベクトルや符号化モードについては、入力ストリームの情報引き継ぎによる効率化が述べられているが、画質に関わる量子化制御については、量子化パラメータの再利用方法などは述べられていない。
また、特許文献2のトランスコード方法では、入力ストリームの量子化パラメータを引き継ぎ、その大小に応じた再量子化制御を行っているが、基本的に、QP値が元々大きい部分、すなわち元々画質が悪いフレームやマクロブロックは、低ビットレート変換においてはデコード後に別の大きなQP値で再エンコードが行われることにより、画質はさらに悪化することが考えられる。さらに、入力ストリームの発生符号量を継承させる方式のため、符号量、画質とも入力ストリームに影響され、入力においてその変動が大きい場合、出力についても同様になる。
また、非特許文献1の方法では、QP値の大小について入力から出力へ継承されてしまうため、QP値が元々大きい部分、すなわち元々画質が悪いフレームやマクロブロックは、低ビットレート変換においてはデコード後に別の大きなQP値で再エンコードが行われることより、画質がさらに悪化することが考えられる。さらに、
・入力ストリームの発生符号量を継承させる方式のため、符号量、画質とも入力ストリームに影響され、入力においてその変動が大きい場合、出力についても同様になる。
・入力はMPEG−2、出力はH.264に限定されている。
・Iフレーム以外は単純再エンコード方式であり、符号量の制御はエンコーダに大きく依存してしまう。
・イントラマクロブロックの集まりであるIフレームに対して特別に制御しているのだが、Pフレームのイントラマクロブロックについては考慮されていない。
という課題を有している。
そこで、本発明は、上記課題を解決した画像データトランスコーディング装置及びトランスコーディング方法を提供することを目的とする。
上記目的を実現するため本発明によるトランスコーディング装置は、画像データをトランスコードするトランスコーディング装置において、前記画像データをフレーム単位に復号するデコーダと、前記画像データのフレームから各マクロブロック単位で、量子化パラメータQP、イントラ符号量、及びインター符号量で構成される符号化情報を取得する情報抽出部と、前記符号化情報から全てのQP値を固定と仮定した場合のフレーム単位での符号化ビット量を予測し、前記フレーム単位での符号化ビット量を蓄積し、前記蓄積したフレーム単位での符号化ビット量から対象シーケンス全体の予測符号量を計算し、前記予測符号量及び対象シーケンス全体の目標符号量から初期QP値と全フレームに対するフレーム毎の目標符号量を求める制御部と、前記フレーム単位での符号化ビット量を蓄積する制御情報メモリと、前記初期QP値とフレーム毎の目標符号量で前記復号されたフレームを再エンコードするエンコーダと、を備えている。
また、前記制御部において、全てのQP値を固定と仮定した場合の符号化ビット量予測には、
(QP1)=αi×{f(QP1)}ti+βi (式3)
及び、
(QP1)=αp×{f(QP1)}tp+βp (式4)
に記載される、イントラ及びインターマクロブロックにおけるQPに対する予測符号化ビット量の変換係数導出関数で得られる値を用いることも好ましい。
また、前記制御部において、全てのQP値を固定と仮定した場合の符号化ビット量予測には、
IMB=iMB×f(QP2)/f(QP1) (式5)
及び
PMB=pMB×f(QP2)/f(QP1) (式6)
に記載される、イントラ及びインターマクロブロックにおける予測発生符号量の算出値を用いることも好ましい。
また、前記制御部において、対象シーケンス全体の予測発生符号量を目標発生符号量に合致させるために、
Figure 0004788653
を用いることも好ましい。
また、前記制御部において、各フレームの目標発生符号量を算出するために
FB(x)=f(QP3)×IFB(x)/f(QP2)
+f(QP3)×PFB(x)/f(QP2) (式11)
を用いることも好ましい。
また、前記制御部において、入出力コーデックが異なる場合には、前記式10および前記式11の固定QP値(QP3)を引数とする変換係数導出関数f(QP3)、f(QP3)に、出力側コーデックの量子化ステップf(QP)を用いることも好ましい。
また、前記制御部において、入出力コーデックが異なる場合の変換係数導出関数f(QP3)、f(QP3)内のパラメータには、
Figure 0004788653
に示す値を用いることも好ましい。
また、前記制御部において、前記表1に示す値は、入力画像データに応じて更新することも好ましい。また、前記制御部において、前記表1に示す値は、使用するコーデックに応じて更新することも好ましい。
また、前記エンコーダにおいて、CPB(Coding Picture Buffer)やVBV(Video Buffering Verifier)の制御を追加することで、CBRにも適用可能であることも好ましい。
また、前記制御部及びエンコーダにおいて、フレームスキップ処理が行えることも好ましい。
また、前記制御部及びエンコーダにおいて、画像縮小処理が行えることも好ましい。
また、前記制御部及びエンコーダにおいて、画像拡大処理が行えることも好ましい。
上記目的を実現するため本発明による方法は、画像データをトランスコードするトランスコーディングの方法において、前記画像データをフレーム単位に復号するステップと、 前記画像データのフレームから各マクロブロック単位で、量子化パラメータQP、イントラ符号量、及びインター符号量で構成される符号化情報を取得するステップと、前記符号化情報から全てのQP値を固定と仮定した場合のフレーム単位での符号化ビット量を予測するステップと、前記フレーム単位での符号化ビット量を制御情報メモリに蓄積するステップと、前記蓄積したフレーム単位での符号化ビット量から、対象シーケンス全体の予測符号量を計算するステップと、前記予測符号量及び対象シーケンス全体の目標符号量から初期QP値と全フレームに対するフレーム毎の目標符号量を求めるステップと、前記初期QP値とフレーム毎の目標符号量で前記復号されたフレームを再エンコードするステップとを含む。
本発明は、図1のように動画像のトランスコードを行う為のデコーダ、エンコーダの組み合わせに、デコーダから各マクロブロック単位でのQP値とイントラ、インター別の符号量を抽出する情報抽出部、抽出した結果からフレーム単位での制御情報を計算し、エンコーダへフレーム単位のQP値と目標符号量を引き渡す制御部、及び制御情報を蓄積する制御情報メモリを設けたものである。
本発明は、入力のストリームからマクロブロック単位でQP値と発生符号量を抽出し、特定の固定QP値(QP2)に対応したフレーム符号量を予測計算してバッファに記憶する。これをシーケンス内の全フレームについて行う。これをフェーズ1とする(図2)。
フェーズ1が完了したならば、シーケンス全体の予測発生符号量が、シーケンス全体の目標符号量に合致するように、固定QP値(QP3)を繰り返し演算により求める。続いて、求められた固定QP値(QP3)とQP2の時の各フレームの予測符号量からスケーリングによりQP3の時の各フレームの予測符号量を全て求め、これを各フレームの目標符号量とする。これをフェーズ2とする。
その結果(固定QP値(QP3)および各フレームの目標発生符号量)を制御情報としてフレーム毎にデコード画像とともにエンコーダへ引渡し出力ストリームを生成する。これをフェーズ3とする(図3)。図4に全体の処理フローを示す。
このように、3つのフェーズによる処理により、所望の低ビットレートに変換した場合においても、QP値の変動を抑えられることにより、シーケンス全体を通して画質が安定する。
本発明は、入力ストリームのQP値を継承せず、QP値を固定化させる方式のため、低ビットレート変換において、入力が低画質であるフレームやマクロブロックについてさらに画質を悪化させることがない。また、入力ストリームの符号量割当てに依存しない安定した画質で出力が得られるという効果を有している。さらに、入力ストリームから抽出した情報は長時間を対象とするため、対象となる全フレームの発生符号量のスケーリングが計画でき、発生符号量、QP値の制御が簡素化されるという効果も有する。また、入力ストリームから抽出した情報は長時間を対象とするため、対象となる全フレームの目標発生符号量をスケーリングにより調整ができるため、発生符号量の総和は目標値と一致させることが可能である。
また、1パスエンコードでありながら2パスエンコード方式と同等の画質安定化効果を得ることが可能であり、MPEG−1、MPEG−2、H.263、MPEG−4、H.264等、多種のコーデック間でのトランスコードが可能である。
本発明を実施するための最良の実施形態について、以下では図面を用いて詳細に説明する。なお、本発明は、入力ストリームからのコンテンツが動画に限らず、動画、静止画の両方について実施することができるが、以下では、入力ストリームからのコンテンツが動画である場合を前提に説明を進める。
本発明は、画質の向上を目的としているため、本実施形態では変換元コンテンツのマクロブロック(以下、MB)ごとの潜在的な情報量に比例するよう各MBの消費ビット量を予測することで変換後のQP変動を抑え、画質の安定化をはかり、目標のビットレートの動画を出力する。図1は、本発明の実施形態での全体構成のブロック図を示す。本実施形態は、デコーダ1、情報抽出部2、制御部3、制御情報メモリ4、エンコーダ5の構成要素から構成されており、各構成要素間でQP値、符号量、発生符号量、動画データがやり取りされる。
本発明の第1の実施形態は、入出力のコーデックが同じ場合である。本実施形態ではコーデックとしてH.264、MPEG−1、MPEG−2、H.263、MPEG−4を用いた場合を説明する。
本実施形態は、大きく3つのフェーズに分けることができ、各フェーズの処理の詳細を以下に示す。
[フェーズ1]
図2は、フェーズ1に関係する構成要素のブロック図を示す。情報抽出部2は、対象とする元画像の各フレームからQP値と、イントラ及びインター別の符号化ビット量をMB単位で抽出して、制御部3に渡す。制御部3は、イントラ・インター別に特定の固定QPへの変換を仮想的に行うための、符号化ビット量の予測計算を行って、イントラ符号量、インター符号量と、イントラもしくはインターMB個数をフレーム毎に記録していく。この予測計算には次の式を適用して行う。
1.量子化パラメータ(QP)を量子化ステップ(f(QP))で置き換える。
・コーデックがH.264 の場合
(QP)=2((QP−4)/6) (式1)
・コーデックがMPEG−1、MPEG−2、H.263、MPEG−4の場合
(QP)=QP×2 (式2)
2.イントラMB、インターMB別に、QPに対する予測符号化ビット量の変換係数導出関数f、fを求める式を以下のように定義する。
・イントラMBにおけるQPに対する予測符号化ビット量の変換係数導出関数
(QP1)=αi×{f(QP1)}ti+βi (式3)
・インターMBにおけるQPに対する予測符号化ビット量の変換係数導出関数
(QP1)=αp×{f(QP1)}tp+βp (式4)
ここで、αi、ti、βiは、イントラMBにおける予測符号化ビット量の変換係数算出におけるパラメータであり、αp、tp、βpはインターMBにおける予測符号化ビット量の変換係数算出におけるパラメータである。
各コーデックに対応した、変換係数導出関数の中で用いられるパラメータの設定例を表1に示す。本パラメータは、入力画像にある程度依存する値であるため、変換係数導出関数f、fは、入力画像ごとに更新しても良い。
Figure 0004788653
3.上記の式を用いて特定のQP値(QP2)への変換と符号化ビット量の予測を次の式により行う。
IMB=iMB×f(QP2)/f(QP1) (式5)
PMB=pMB×f(QP2)/f(QP1) (式6)
ここで、iMBは、入力イントラMBビット量であり、pMBは入力インターMBビット量であり、QP1は、元画像から抽出したMB毎のQP値であり、QP2は特定の固定QP値(最初にマニュアルで設定)である。
IMBは、固定QPへ変換した時のイントラMBの予測符号量であり、PMBは、固定QPへ変換した時のインターMBの予測符号量になる。
尚、f(QP2)/f(QP1)は、符号量比率を近似する値である。具体的な処理としては、1フレーム分の予測符号化ビット量をイントラMB、インターMB別に制御情報メモリ4に記憶した後、これを対象シーケンス内の全てのフレームに対して実行する。ここまでがフェーズ1である。
1フレーム分の予測符号化ビット量の合計IFB、PFBは、以下の式により求まる。
Figure 0004788653
Figure 0004788653
ここで、miは、x番目のフレーム内のイントラMB数であり、mpはx番目のフレーム内のインターMB数である。
IFB(fn=x)は、QP2の時のx番目のフレーム内のイントラMBの予測符号量の和であり、PFB(fn=x)は、QP2の時のx番目のフレーム内のインターMBの予測符号量の和である。
また、QP2の時の対象シーケンス全体の予測符号量SBQP2は、
Figure 0004788653
より求まる。ここで、FNはシーケンス内のフレーム数である。
[フェーズ2]
4.次のフェーズ2では、先ずフェーズ1で記録したQP2の時のシーケンス全体の予測符号量の総和SBQP2を元に以下の式10を用いて新たな固定QP値(QP3)に変更することで、予測符合量の総和SBQP3が対象シーケンス全体の目標符号量(低レートへのトランスコード時に与えられたシーケンス全体の符号量)と一致するように繰り返し演算によりQP3を求める。
Figure 0004788653
式10により、QP3を求める際、インターMBとイントラMBに使用する式が異なるので単純な逆算はできない。そのため、目標符号量SBQP3が求まるまでQP3をループで調整する。QP3=0〜51(H.264)、1〜31(MPEG−1、MPEG−2、H.263、MPEG−4)の範囲で最も近いビット量を求める。目標ビット量との誤差が1%未満になるようにさらにQP3を0.5、0.25、0.125… の値で加減し調整する。この値はフェーズ3の初期QP3として使用する。
5.求めたQP3を用いて各フレームの目標符号量をスケーリングにより求める。このスケーリングは、イントラ符号量とインター符号量とを別々に行う。
FB(x)=f(QP3)×IFB(x)/f(QP2)
+f(QP3)×PFB(x)/f(QP2) (式11)
FB(x)は、QP3(既知)の時のx番目のフレームの目標符号量である。
[フェーズ3]
図3は、フェーズ3に関係する構成要素のブロック図を示す。デコーダ1は、動画データをエンコーダ5に渡し、圧縮符号化処理を行う。この時、フェーズ2で求めた各フレームの目標符号量(FB(x))とシーケンスを通して固定のQP値(QP3)もエンコーダ5へ引き渡す。順次フレームをエンコードしていくが、エンコーダ5への設定ビット量と実際の出力ビット量との誤差から、次のフレームへのQP値とビット量の再設定を順次行う。尚、本方式はVBR符号化を基本とするが、フェーズ3において、CPB(Coding Picture Buffer)やVBV(Video Buffering Verifier)の制御を追加することで、CBRにも適用可能である。
本発明の第2の実施形態では、入出力で別々のコーデックを使用する場合である。実施形態1は、入出力が同様のコーデックの場合であり、H.264同士もしくは、MPEG−1、MPEG−2、H.263、MPEG−4の何れか同士である。本実施形態のコーデックが異なる場合においては、式10、式11の固定QP値(QP3)を引数とする変換係数導出関数f(QP3)、f(QP3)には、出力側コーデックに対応した量子化ステップf(QP)、及び変換係数導出関数中のパラメータ(表1にパラメータ例を記載する)を用いる。
本発明の第3の実施形態では、フレームスキップにより、フレームレートを下げ、全体的に画質を向上させることもできる。その場合は、フェーズ1において、スキップされたフレームビット量は計算に含めない。しかしそれでは、ビット量が実際より少なく見積もられることが考えられるため、スキップされたフレーム(連続する複数フレームである場合がある)とその後に続くスキップされないフレームの内、最も大きいビット量のフレーム情報を使用することが考えられる。
例えば、15fpsから10fpsに変換する場合は次のようにフレームをスキップする。
15fps:I P P P P P P P P P P P P P …
10fps:I X P P X P P X P P X P P X …
ここで、Iは、Iフレームを、PはPフレームを、Xはスキップフレームを表す。
予測に使用するフレームを、上記のように最も大きいビット量のフレームを使用する場合、例えば、
15fps: I
10fps: I X P
であったとき、
のビット量≧Pのビット量ならば、PとしてPを用いて、
のビット量<Pのビット量ならば、PとしてPを用いる。
本発明の第4の実施形態では、デコード画像の拡大や縮小を行い、それをエンコーダへ入力する。この場合は、フェーズ1にて元画像との面積比によりフレームビット量を調整する。
また、図5は、本発明のシミュレーションによるフレーム対PSNRの推移を示す。全体的に平均PSNRが向上し、かつ画質変動が抑制されていることが確認できる。ここで、Originalは、デコーダとエンコーダ(低レート)をタンデムに接続した場合であり、Proposalは本発明の方式(入力ストリームからフレーム毎の目標ビット量とQP値を算出して後段のエンコーダ(低レート)に渡してエンコードする方式)による場合である。
また、以上述べた実施形態は全て本発明を例示的に示すものであって限定的に示すものではなく、本発明は他の種々の変形態様及び変更態様で実施することができる。従って本発明の範囲は特許請求の範囲及びその均等範囲によってのみ規定されるものである。
本発明の実施形態での全体構成のブロック図を示す。 本発明の実施形態のフェーズ1に関係する構成要素のブロック図を示す。 本発明の実施形態のフェーズ3に関係する構成要素のブロック図を示す。 本発明の全体の処理フローを示す。 本発明のシミュレーションによるフレーム対PSNRの推移を示す。
符号の説明
1 デコーダ
2 情報抽出部
3 制御部
4 制御情報メモリ
5 エンコーダ

Claims (13)

  1. 画像データをトランスコードするトランスコーディング装置において、
    前記画像データをフレーム単位に復号するデコーダと、
    前記画像データのフレームから各マクロブロック単位で、量子化パラメータQP1、イントラ符号量iMB、及びインター符号量pMBで構成される符号化情報を取得する情報抽出部と、
    前記符号化情報から全ての量子化パラメータ値をQP2と固定と仮定した場合のフレーム単位での符号化ビット量を、
    イントラ及びインターマクロブロックにおける量子化パラメータQPに対する予測符号化ビット量の変換係数導出関数f (QP)及びf (QP)を求め、
    前記変換係数導出関数の量子化パラメータQP2での値f (QP2)及びf (QP2)を、前記変換係数導出関数の量子化パラメータQP1での値f (QP1)及びf (QP1)で割った値に、イントラ符号量iMB及びインター符号量pMBを掛けることからイントラ及びインターマクロブロックにおける予測発生符号量IMB及びPMBを求め
    該イントラ及びインターマクロブロックにおける予測発生符号量をフレーム内のイントラ及びインターマクロブロック数分加算することで、予測し、
    前記フレーム単位での符号化ビット量を蓄積し、前記蓄積したフレーム単位での符号化ビット量から対象シーケンス全体の予測符号量SB QP2 を計算し、前記予測符号量SB QP2 及び対象シーケンス全体の目標符号量から初期QP値と全フレームに対するフレーム毎の目標符号量を
    前記変換係数導出関数の新たな固定量子化パラメータQP3での値f (QP3)及びf (QP3)を、前記変換係数導出関数の量子化パラメータQP2での値f (QP2)及びf (QP2)で割った値に、対象シーケンスのイントラ及びインターマクロブロックにおける予測発生符号量を掛け、イントラ及びインターマクロブロックでの値を加算することから、新たな固定量子化パラメータQP3での予測符合量の総和SB QP3 を求め、該総和SB QP3 が前記予測符号量SB QP2 に一致するような新たな固定量子化パラメータQP3を初期QP値とすることで求め、
    前記変換係数導出関数の量子化パラメータQP3での値f (QP3)及びf (QP3)を、前記変換係数導出関数の量子化パラメータQP2での値f (QP2)及びf (QP2)で割った値に、イントラ及びインターマクロブロックにおける予測発生符号量を掛け、イントラ及びインターマクロブロックでの値を加算することから、スケーリングによりフレーム毎の目標符号量を
    求める制御部と、
    前記フレーム単位での符号化ビット量を蓄積する制御情報メモリと、
    前記初期QP値とフレーム毎の目標符号量で前記復号されたフレームを再エンコードするエンコーダと、
    を備えていることを特徴とするトランスコーディング装置。
  2. 前記制御部において、 (QP)を量子化パラメータQPを量子化ステップに置き換える関数、αi、ti、βiをイントラマクロブロックにおけるパラメータ、αp、tp、βpをインターマクロブロックにおけるパラメータとし、
    前記変換係数導出関数f (QP)及びf (QP)は、
    (QP)=αi×{f(QP))}ti+βi (式3)
    及び、
    (QP)=αp×{f(QP))}tp+βp (式4)
    で表されることを特徴とする請求項1に記載のトランスコーディング装置。
  3. 前記制御部において、イントラ及びインターマクロブロックにおける予測発生符号量IMB及びPMBは、
    IMB=iMB×f(QP2)/f(QP1) (式5)
    及び
    PMB=pMB×f(QP2)/f(QP1) (式6)
    で表されることを特徴とする請求項1に記載のトランスコーディング装置。
  4. 前記制御部において、miをx番目のフレーム内のイントラマクロブロック数、mpをx番目のフレーム内のインターマクロブロック数、FNをシーケンス内のフレーム数とし、前記新たな固定量子化パラメータQP3での予測符合量の総和SB QP3 は、
    Figure 0004788653
    で表されることを特徴とする請求項1に記載のトランスコーディング装置。
  5. 前記制御部において、x番目のフレームでのイントラ及びインターマクロブロックにおける予測発生符号量をIFB(x)及びPFB(x)とし、フレーム毎の目標符号量FB(x)は、
    FB(x)=f(QP3)×IFB(x)/f(QP2)
    +f(QP3)×PFB(x)/f(QP2) (式11)
    で表されることを特徴とする請求項1に記載のトランスコーディング装置。
  6. 前記制御部において、入出力コーデックが異なる場合には、前記式10および前記式11の固定QP値(QP3)を引数とする変換係数導出関数f(QP3)、f(QP3)に、出力側コーデックの量子化ステップf(QP)を用いることを特徴とする請求項1から5のいずれか1項に記載のトランスコーディング装置。
  7. 前記制御部において、入出力コーデックが異なる場合の変換係数導出関数f(QP3)、f(QP3)内のパラメータには、
    Figure 0004788653
    に示す値を用いることを特徴とする請求項6に記載のトランスコーディング装置。
  8. 前記制御部において、前記表1に示す値は、入力画像データに応じて更新することを特徴とする請求項7に記載のトランスコーディング装置。
  9. 前記エンコーダにおいて、CPB(Coding Picture Buffer)やVBV(Video Buffering Verifier)の制御を追加することで、CBRにも適用可能であることを特徴とする請求項1から8のいずれか1項に記載のトランスコーディング装置。
  10. 前記制御部及びエンコーダにおいて、フレームスキップ処理が行えることを特徴とする請求項1から9のいずれか1項に記載のトランスコーディング装置。
  11. 前記制御部及びエンコーダにおいて、画像縮小処理が行えることを特徴とする請求項1から10のいずれか1項に記載のトランスコーディング装置。
  12. 前記制御部及びエンコーダにおいて、画像拡大処理が行えることを特徴とする請求項1から11のいずれか1項に記載のトランスコーディング装置。
  13. 画像データをトランスコードするトランスコーディングの方法において、
    前記画像データをフレーム単位に復号するステップと、
    前記画像データのフレームから各マクロブロック単位で、量子化パラメータQP1、イントラ符号量iMB、及びインター符号量pMBで構成される符号化情報を取得するステップと、
    前記符号化情報から全ての量子化パラメータ値をQP2と固定と仮定した場合のフレーム単位での符号化ビット量を、
    イントラ及びインターマクロブロックにおける量子化パラメータQPに対する予測符号化ビット量の変換係数導出関数f (QP)及びf (QP)を求め、
    前記変換係数導出関数の量子化パラメータQP2での値f (QP2)及びf (QP2)を、前記変換係数導出関数の量子化パラメータQP1での値f (QP1)及びf (QP1)で割った値に、イントラ符号量iMB及びインター符号量pMBを掛けることからイントラ及びインターマクロブロックにおける予測発生符号量IMB及びPMBを求め
    該イントラ及びインターマクロブロックにおける予測発生符号量をフレーム内のイントラ及びインターマクロブロック数分加算することで、予測するステップと、
    前記フレーム単位での符号化ビット量を制御情報メモリに蓄積するステップと、
    前記蓄積したフレーム単位での符号化ビット量から、対象シーケンス全体の予測符号量SB QP2 を計算するステップと、
    前記予測符号量SB QP2 及び対象シーケンス全体の目標符号量から初期QP値と全フレームに対するフレーム毎の目標符号量を
    前記変換係数導出関数の新たな固定量子化パラメータQP3での値f (QP3)及びf (QP3)を、前記変換係数導出関数の量子化パラメータQP2での値f (QP2)及びf (QP2)で割った値に、対象シーケンスのイントラ及びインターマクロブロックにおける予測発生符号量を掛け、イントラ及びインターマクロブロックでの値を加算することから、新たな固定量子化パラメータQP3での予測符合量の総和SB QP3 を求め、該総和SB QP3 が前記予測符号量SB QP2 に一致するような新たな固定量子化パラメータQP3を初期QP値とすることで求め、前記変換係数導出関数の量子化パラメータQP3での値f (QP3)及びf (QP3)を、前記変換係数導出関数の量子化パラメータQP2での値f (QP2)及びf (QP2)で割った値に、イントラ及びインターマクロブロックにおける予測発生符号量を掛け、イントラ及びインターマクロブロックでの値を加算することから、スケーリングによりフレーム毎の目標符号量を求めるステップと、
    前記初期QP値とフレーム毎の目標符号量で前記復号されたフレームを再エンコードするステップと
    を含むことを特徴とするトランスコーディングの方法。
JP2007127757A 2007-05-14 2007-05-14 画像データトランスコーディング装置及びトランスコーディング方法 Active JP4788653B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007127757A JP4788653B2 (ja) 2007-05-14 2007-05-14 画像データトランスコーディング装置及びトランスコーディング方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007127757A JP4788653B2 (ja) 2007-05-14 2007-05-14 画像データトランスコーディング装置及びトランスコーディング方法

Publications (2)

Publication Number Publication Date
JP2008283607A JP2008283607A (ja) 2008-11-20
JP4788653B2 true JP4788653B2 (ja) 2011-10-05

Family

ID=40144028

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007127757A Active JP4788653B2 (ja) 2007-05-14 2007-05-14 画像データトランスコーディング装置及びトランスコーディング方法

Country Status (1)

Country Link
JP (1) JP4788653B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2011114817A1 (ja) * 2010-03-18 2013-06-27 日本電気株式会社 発熱が小さい、テレビ電話機能を持つ携帯電話機
JP2014200074A (ja) * 2013-03-15 2014-10-23 株式会社リコー 配信制御システム、配信制御方法、及びプログラム
CN105898316A (zh) * 2015-12-14 2016-08-24 乐视云计算有限公司 一种编码信息继承的实时转码方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0998427A (ja) * 1995-09-29 1997-04-08 Toshiba Corp 動画像符号化装置
JP4517475B2 (ja) * 2000-07-26 2010-08-04 ソニー株式会社 画像情報変換装置及び方法並びに符号化装置及び方法
JP2002209215A (ja) * 2001-01-09 2002-07-26 Sony Corp 符号量制御装置及び方法、並びに画像情報変換装置及び方法

Also Published As

Publication number Publication date
JP2008283607A (ja) 2008-11-20

Similar Documents

Publication Publication Date Title
JP4528694B2 (ja) 動画像符号化装置
Wang et al. Rate-distortion optimization of rate control for H. 264 with adaptive initial quantization parameter determination
US7792193B2 (en) Image encoding/decoding method and apparatus therefor
US9071840B2 (en) Encoder with adaptive rate control for H.264
KR101017770B1 (ko) 슬라이딩 윈도 채널 제약에 부합하는 멀티패스 비디오레이트 제어
KR20110105875A (ko) 동화상 부호화 장치, 동화상 부호화 방법 및 동화상 부호화용 컴퓨터 프로그램
JP4795223B2 (ja) 画像処理装置
JP4788653B2 (ja) 画像データトランスコーディング装置及びトランスコーディング方法
US7428339B2 (en) Pseudo-frames for MPEG-2 encoding
JP5649296B2 (ja) 画像符号化装置
US20010053182A1 (en) Picture encoding format converting apparatus
KR100713400B1 (ko) 평균 히스토그램 오차 방식을 이용한 h.263/mpeg비디오 인코더 및 그 제어 방법
KR20040007818A (ko) 동영상 부호화를 위한 dct연산량 조절 방법 및 그 장치
KR20070034869A (ko) 동영상 부호화기의 비트율 제어 장치 및 방법
JP5760950B2 (ja) 動画像再符号化装置、動画像再符号化方法及び動画像再符号化用コンピュータプログラム
JP2008206211A (ja) 動画像符号化/復号化の方法及び装置
JP4231045B2 (ja) 動画像符号化方法及び装置
JP4844595B2 (ja) 階層符号化装置、非階層符号化変換装置、階層符号化プログラム、および非階層符号化変換プログラム
KR101197094B1 (ko) H.264/avc를 위한 통계 모델 기반의 비트율 제어 방법 및 장치
US9544594B2 (en) Moving image reencoding device and moving image reencoding method
KR100778473B1 (ko) 비트율 제어 방법
JP4186544B2 (ja) 符号化装置および符号化方法、プログラム、並びに記録媒体
JP4023451B2 (ja) 圧縮動画像再符号化装置及び圧縮動画像再符号化方法
JP4465529B2 (ja) 画像符号化装置及び方法
JP2004349855A (ja) 符号化装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100125

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100823

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100730

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110208

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110330

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110621

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110704

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140729

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4788653

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150