JP2010187337A - 動画像変換装置及び動画像変換方法 - Google Patents

動画像変換装置及び動画像変換方法 Download PDF

Info

Publication number
JP2010187337A
JP2010187337A JP2009031749A JP2009031749A JP2010187337A JP 2010187337 A JP2010187337 A JP 2010187337A JP 2009031749 A JP2009031749 A JP 2009031749A JP 2009031749 A JP2009031749 A JP 2009031749A JP 2010187337 A JP2010187337 A JP 2010187337A
Authority
JP
Japan
Prior art keywords
frame
encoding
image data
complexity
encoding complexity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009031749A
Other languages
English (en)
Inventor
Takahiro Takimoto
崇博 瀧本
Tomoya Kodama
知也 児玉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2009031749A priority Critical patent/JP2010187337A/ja
Publication of JP2010187337A publication Critical patent/JP2010187337A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】トランスコード済みのフレームの、入力画像ストリームの符号化複雑度群及び出力画像ストリームの符号化複雑度群から、これから符号化するフレームの符号化複雑度の予測精度を向上させ、適応的に符号量を割り当てる動画像変換装置及び動画像変換方法を提供すること。
【解決手段】符号化された入力画像データの一のフレームの符号化複雑度を独立変数とし、出力画像データにおける一のフレームの符号化複雑度を従属変数とする、一次関数の傾きと切片とを算出し、一次関数に基づく変換関数を算出する、符号化複雑度変換関数算出部と、変換関数により、出力画像データにおけるフレームの符号化複雑度を算出する、推定符号化複雑度算出部と、算出された符号化複雑度に基づいて、目標符号量を割り当てる割当符号量算出部と、入力画像データにおける一のフレームが復号化された復号化画像の符号化を行う符号化部と、を有することを特徴とする動画像変換装置。
【選択図】図1

Description

本発明は、動画像変換装置及び方法、特に、符号化複雑度を用いて適応的な符号量割り当てを提供する動画像変換装置及び方法に関する。
従来から、可変ビットレート制御により、動画像を符号化する技術、又は、入力画像ストリームを別の形式に再圧縮(以下、「トランスコード」という。)する技術がある。このような技術では、適応的な符号量割り当てを実現するために、これから符号化する画像シーケンスのフレーム毎の符号化の難しさ(以下、「符号化複雑度」という。)を長い区間精度良く推定することが重要となってくる。
シーケンスを通じて、量子化パラメータが同じ場合は、入力画像ストリームの発生符号量遷移は、シーケンスを通じての符号化複雑度遷移と同じと見なすことができ、各フレームの符号化複雑度に応じて符号量を割り当てることができる。
例えば、特開2006−33014号公報(特許文献1)では、トランスコードする際、入力画像ストリームの符号量の時間軸上の変化を前もって取得し、取得したトランスコード前の符号量遷移に基づき、出力画像ストリームの符号量を割り当て制御する映像信号変換装置等の発明が開示されている。特許文献1では、符号化複雑度と発生符号量の遷移は同じとみなすことで適応的な符号量割り当てを行う。
また例えば、米国登録特許7099389公報では、トランスコードする際、トランスコード終了後の入力画像ストリームの符号化複雑度と出力画像ストリームの符号化複雑度との比率を用いて、出力画像ストリームにおいて未だトランスコードされないフレームの符号化複雑度を推定する発明が開示されている。
特開2006−33014号公報 米国登録特許7099389公報 特開平10−023412号公報
しかしながら、放送などで用いられる固定ビットレート制御では、量子化パラメータを変化させてビットレートを一定に保つため、発生符号量遷移と符号化複雑度遷移とが同じではなく、上記特許文献1に記載の発明では符号化複雑度を推定することができない。
また、例えば同じ画像をMPEG−2とH.264とで符号化した場合、双方の符号化複雑度の関係は必ずしも比例になるとは限らない。そこで、上記特許文献2に示される符号化複雑度推定法では、これからトランスコードするフレームの入力画像ストリームに関する符号化複雑度が、すでにトランスコードが終了したフレームに対する符号化複雑度と離れるほど、推定の信頼度が低下する。
特許文献1及び特許文献2の手法を用いると、符号化複雑度の推定精度が低い場合には、適切な符号量割り当てが行えず、画質劣化を招く。
本発明は、上記の点に鑑みて、これらの問題を解消するために発明されたものであり、トランスコード済みのフレームの、入力画像ストリームの符号化複雑度群及び出力画像ストリームの符号化複雑度群から、これから符号化するフレームの符号化複雑度の予測精度を向上させ、適応的に符号量を割り当てる動画像変換装置及び動画像変換方法を提供することを目的とする。
上記目的を達成するために、本発明の動画像変換装置は次の如き構成を採用した。
本発明の動画像変換装置は、符号化された入力画像データのフレーム毎の符号化複雑度と、前記入力画像データを変換処理して得られる出力画像データにおける前記フレーム毎の符号化複雑度と、に基づいて、前記入力画像データの一のフレームの符号化複雑度を独立変数とし、前記出力画像データにおける前記一のフレームの符号化複雑度を従属変数とする、一次関数の傾きと切片とを算出し、さらに、前記一次関数に基づく変換関数を算出する、符号化複雑度変換関数算出部と、前記変換関数により、前記出力画像データにおける前記一のフレームの符号化複雑度を算出する、推定符号化複雑度算出部と、算出された前記出力画像データにおける前記一のフレームの符号化複雑度に基づいて、前記一のフレームに対する目標符号量を割り当てる割当符号量算出部と、割り当てられた前記目標符号量により前記入力画像データにおける前記一のフレームが復号化された復号化画像の符号化を行う符号化部と、を有する構成とすることができる。
また、上記目的を達成するために、本発明の動画像変換方法は、符号化された入力画像データのフレーム毎の符号化複雑度と、前記入力画像データを変換処理して得られる出力画像データにおける前記フレーム毎の符号化複雑度と、に基づいて、前記入力画像データの一のフレームの符号化複雑度を独立変数とし、前記出力画像データにおける前記一のフレームの符号化複雑度を従属変数とする、一次関数の傾きと切片とを算出し、さらに、前記一次関数に基づく変換関数を算出する、符号化複雑度変換関数算出ステップと、前記変換関数により、前記出力画像データにおける前記一のフレームの符号化複雑度を算出する、推定符号化複雑度算出ステップと、算出された前記出力画像データにおける前記一のフレームの符号化複雑度に基づいて、前記一のフレームに対する目標符号量を割り当てる割当符号量算出ステップと、割り当てられた前記目標符号量により前記入力画像データにおける前記一のフレームが復号化された復号化画像の符号化を行う符号化ステップと、
を有する構成とすることができる。
本発明の動画像変換装置及び動画像変換方法によれば、トランスコード済みのフレームの、入力画像ストリームの符号化複雑度群及び出力画像ストリームの符号化複雑度群から、これから符号化するフレームの符号化複雑度の予測精度を向上させ、適応的に符号量を割り当てる動画像変換装置及び動画像変換方法を提供することが可能になる。
図1は、本発明の第一の実施形態に係わる映像変換装置の構成を示すブロック図である。 図2は、符号化部107の構成図である。 図3は、復号化部106の構成図である。 図4は、本発明の第一の実施形態の動作を示すフローチャートである。 図5は、GOP内のピクチャ構造を表した概念図である。 図6は、MPEG−2とH.264/AVCの符号化複雑度の関係を表した概念図である。 図7は、符号化複雑度推定方法の概念図である。 復号化の処理と符号化の処理との間に、バッファを設ける構成を示す図である。
以下、本実施の形態を図面に基づき説明する。
〔本実施の形態〕
図1は、第1の実施形態に係る動画像変換装置の機能構成を示すブロック図である。本実施形態に係る動画像符号化装置は、符号化情報取得部101、バッファ102、符号化情報取得部103、バッファ104、バッファ105、復号化部106、符号化部107、符号化複雑度変換関数算出部108、推定符号化複雑度算出部109、割当符号量算出部110、及び、量子化スケール決定部111を有する。
符号化情報取得部101は、入力画像ストリームの符号化情報を算出する。符号化情報取得部101は、例えば、入力画像ストリームから、フレーム毎の符号化複雑度を算出する。より詳細には、入力画像ストリームから、量子化スケール及びフレーム毎の符号量を取得し、これらの値から、符号化複雑度を算出する。バッファ102は、符号化情報取得部101が算出した符号化情報、例えば、符号化複雑度を格納する。
符号化情報取得部103は、符号化部107により符号化されて生成する出力画像ストリームにおける、フレーム毎の量子化スケール及び発生符号量を取得し、フレーム毎の符号化複雑度を出力する。バッファ104は、符号化情報取得部103により取得された符号化複雑度を格納する。
バッファ105は、入力画像ストリームを格納する。復号化部106は、入力画像ストリームを復号して、復号画像を生成し、符号化部107に対して出力する。符号化部107は、復号化部106から出力される復号画像を符号化して再び画像ストリームにする。これにより、トランスコードが実現できる。
符号化複雑度変換関数算出部108は、これから符号化するフレームの符号化複雑度を算出する変換関数を算出する。符号化複雑度変換関数算出部108は、トランスコード済みのフレームの、入力画像ストリームにおける符号化複雑度と出力画像ストリームにおける符号化複雑度との比から、変換関数を算出する。より詳細には、入力画像ストリームにおける一のフレームの符号化複雑度と、同一のフレームの出力画像ストリームにおける符号化複雑度との比を算出し、複数のフレームの符号化複雑度の比から、変換関数を算出する。
推定符号化複雑度算出部109は、符号化複雑度変換関数算出部108が算出する関数により、これから符号化するフレームの符号化複雑度を算出する。これにより、これから符号化するフレームの符号化複雑度を推定することができる。
割当符号量算出部110は、推定符号化複雑度算出部109により算出された符号化複雑度に基づいて、フレーム毎に割り当てる符号量を算出する。この符号量を目標値、すなわち目標符号量として、量子化スケール決定部111及び符号化部107が符号化の処理を行う。量子化スケール決定部111は、算出される符号化複雑度と割り当てられた符号量とから、フレーム毎の量子化スケールを決定する。
図2は、符号化部107の機能構成の例を説明する図である。符号化部107は、例えば、H.264/MPEG−4 AVCに準拠した符号化を行う。符号化部107は、動き検出部201、動き補償部202、減算部203、離散コサイン変換部204、量子化部205、エントロピー符号化部206、フレームメモリ207、加算部208、逆離散コサイン変換部209、及び、逆量子化部210を有する。なお、図中「離散コサイン変換」を「DCT」と表記する。
動き検出部201は、符号化するフレームと参照するフレームとの間の動き検出を行い、動きベクトルを生成する。動き補償部202は、動きベクトルにより、参照するフレームに対する動き補償を行う。減算部203は、符号化するフレームと参照するフレームとの間の差分を取ることによりフレーム間の予測データを生成する。なお、参照するフレームに対して動き補償が行われた場合には、動き補償されたフレームと符号化するフレームとの間の差分データを生成する。
DCT部204は、予測データ又は符号化するフレームのデータに対し、直交変換による周波数分解を行う。DCT部204は、例えば、DCTを行う。量子化部205は、DCT部204から出力される変換係数を量子化する。量子化部205は、量子化スケール決定部111により決定された量子化スケールに基づいて量子化を行う。これにより、符号化部107が出力する画像ストリームが、割り当てられた符号量になるように制御される。
エントロピー符号化部206は、量子化された変換係数に対し、エントロピー符号化処理を行う。エントロピー符号化部206は、例えば、ハフマン符号化処理又は算術符号化処理を行う。
逆量子化部210は、量子化部205から出力される量子化された変換係数を逆量子化する。逆DCT部209は、逆量子化された変換係数に対し、逆直交変換処理を行う。逆DCT部209は、例えば、逆DCT処理を行う。
加算部208は、動き補償された参照するフレームと逆直交変換処理されて出力される予測データとを加算することにより、復号画像を生成する。フレームメモリ207は、復号画像を蓄積する。フレームメモリ207に格納される復号画像は、次以降に符号化されるフレームが参照するフレームとなる。
図3は、復号化部106の機能構成の例を説明する図である。復号化部106は、例えば、MPEG−2に準拠した復号化を行う。復号化部106は、また例えば、H.264/MPEG−4 AVCに準拠した復号化を行ってよい。復号化部106は、可変長復号化部301、逆量子化部302、逆離散コサイン変換部303、動き補償部304、及び、フレームメモリ305を有する。
可変長復号化部301は、入力される画像ストリームを可変長復号する。これにより、例えば、量子化された変換係数を出力する。逆量子化部302は、逆量子化処理を行って、変換係数を取得する。逆離散コサイン変換部303は、逆DCT処理により、変換係数から画素データを取得する。逆離散コサイン変換部303が出力する画素データは、動き補償された画素データでもよい。なお、逆離散コサイン変換部303は、逆DCT処理の他に、DCTの他の直行変換の逆変換処理を行ってよい。
動き補償部304は、逆直行変換処理された画素データに対し、動き補償を行う。これにより、復号化された画像が生成される。フレームメモリ305は、復号化された画像を格納する。フレームメモリ305に格納される画像は、次以降に復号される画像に対する動き補償処理、又は、予測処理の補償に用いられる。
本実施形態では、入力画像ストリームと出力画像ストリームとの予測構造は、同一のものとして変換する。すなわち、入力画像ストリームがMPEG−2であり、出力画像ストリームがH.264の場合いは、MPEG−1のIピクチャは、H.264のIスライスに、MPEG−2のPピクチャは、H.264のPスライスに、MPEG−2のBピクチャは、H.264のBスライスに変換される。
図4は、本実施形態に係る動画像符号化装置の動作を示すフローチャートである。図4を用いて、本実施形態に係る動画像符号化装置の動作について説明する。
(ステップS0)
図4のステップS0では、未符号化の入力画像ストリームがGOP(Group Of Pictures)毎に読み込まれ、符号化情報取得部101が、フレーム毎の符号化複雑度を算出する。
図5は、GOPを説明する図である。1つのGOPは、フレーム内符号化がされるIピクチャ、過去のフレームのみを用いて前方向の動き補償予測を行うPピクチャ、及び、過去・未来両方のフレームを用いて双方向の動き補償予測を行うBピクチャのうち、1つ以上のピクチャから構成される。各GOPにおいて最初に符号化されるピクチャは必ずIピクチャとなる。図5の例では1つのGOPは1枚のIピクチャ、4枚のPピクチャ、及び、10枚のBピクチャ、合計15枚のピクチャから1つのGOPが構成されている。
図4に戻り、各フレームの符号化複雑度(X)は、当該フレームの平均量子化スケール(Q)と当該フレームの符号量(S)を用いて、式(1)より求められる。
Figure 2010187337
ここで、g(i=I、P、B)はピクチャタイプ毎に決定される固定値である。なお、特許文献3には、同一のピクチャタイプであれば、画像によらずほぼ一定となることが記載されている。
なお、ここで求める符号化複雑度は、入力画像ストリームであるMPEG−2ビットストリームを可変長復号化(VLD: Variable Length Decode)等により完全に解読する必要はない。例えば、MPEG−2のスライスヘッダには当該スライスで用いる量子化スケールの初期値が記述されているので、各フレーム全てのスライスヘッダを参照することで、そのフレームの平均量子化スケールを近似的に算出してよい。また、例えば、フレーム毎の符号量は、ピクチャヘッダ間の符号量をカウントすれば算出してよい。
バッファ102は、算出した各フレームの符号化複雑度を格納する。バッファ102には、例えば、1GOP内にあるフレーム分の符号化複雑度を格納する。
(ステップS1)
以降の説明では、以下の変数を用いて説明する。
F(t):入力画像ストリームのt番目のフレーム
x(t):F(t)に対応するMPEG−2符号化複雑度
X(t):F(t)に対応するH.264へのトランスコードによって得られた符号化複雑度
p(t):F(t)に対応するMPEG−2ピクチャタイプであり、p(t)=(I,P,B)である。
ステップS1では、符号化複雑度変換関数算出部108が、トランスコード済みの複数のフレームの入力画像の符号化複雑度と出力画像の符号化複雑度とを用いて、入力画像ストリームの符号化複雑度と出力画像ストリームの符号化複雑度の関係を表す関数を算出する。
ここで、t番目のフレームをトランスコードする場合について考える。バッファ102には、L枚のトランスコード済みのフレームのMPEG−2の符号化複雑度:x(t−L),x(t−L+1),...,x(t−1)と、M枚のトランスコード前のフレームのMPEG−2の符号化複雑度:x(t),x(t+1),...,x(t+M−1)が保存されているものとする。
また、バッファ104には、後述するステップS7で生成されるL枚のH.264の符号化複雑度:X(t−L),X(t−L+1),...,X(t−1)が保存されているものとする。すでにトランスコードが終了したフレームに関しては、MPEG−2の符号化複雑度とH.264の符号化複雑度との組:(x(t−k),X(t−k)),k=1,2,…,Lを形成することができる。
そこで、ピクチャタイプ毎に入力画像ストリームと出力画像ストリームのトランスコード済みフレームの符号化複雑度の組(x(t−k),X(t−k))を複数個用いて、ピクチャタイプ毎に入力画像ストリームと出力画像ストリームの符号化複雑度の関係を表す関数を算出する。
あるフレームにおける発生符号量は、サイド情報部分の発生符号量とDCT係数の発生符号量の総和で求めることができる。MPEG−2からH.264へのトランスコードの場合には、H.264はMPEG−2より画素の予測効率が高い。そこで、符号化複雑度が小さい画像に関しては、H.264はMPEG−2と比較して、DCT係数が0になりやすい。したがって、MPEG−2とH.264の符号化複雑度の関係は、図6に示す折れ線状に変化すると考えることができる。
本実施形態では、入力画像ストリームの符号化複雑度「x」と出力画像ストリームの符号化複雑度「X」の関係を、図7に示す、最小二乗法によって線形近似される直線と所定の定数による直線とからなる折れ線で近似する。図7に示す折れ線により表される関数の入力値、すなわち、独立変数が、入力画像ストリームの符号化複雑度となる。図7に示す折れ線により表される関数の出力値、すなわち、従属変数が、出力画像ストリームの符号化複雑度となる。
線形近似によって得られた1次係数をa,a,a、0次係数をb,b,bとすると、図7に示す関数は、式(2)に示すピクチャタイプ毎の式により求めることができる。
Figure 2010187337
なお、C,C,Cは、H.264で符号化したときの最小の割当符号量に対応する0以上の所定の定数であり、MAX(A、B)はAとBの大きい方を出力する関数である。
(ステップS2)
ステップS2では、ステップS1で算出した関数と、トランスコード前のMPEG−2画像ストリームの符号化複雑度を用いて、トランスコード前のH.264符号化複雑度を推定する。
まず、推定符号化複雑度算出部109が、未トランスコードフレーム(F(t),F(t+1),・・・,F(t+M))をH。264で符号化した際の符号化複雑度の推定値である推定符号化複雑度(X〜(t),X〜(t+1),...,X〜(t+M))を算出する。この明細書中で、「X〜」は「X・チルダ(x-tilde)」、すなわち「X」の上に「〜(チルダ)」が配置された文字の代替表記として使われている。ステップS0において、MPEG−2の符号化複雑度は既知であるので、X〜(t+j),(但し、j=0,1,・・・,M)は、式(3)を用いて表すことができる。
Figure 2010187337
(ステップS3)
ステップS3では、割当符号量算出部110が、所定のビットレート:(Bitrate)により、動画像を符号化するために必要なトランスコード対象画像へ割り当てる符号量を算出する。ここでは、まずステップS0で読み込まれている入力画像ストリームのうち、バッファ105に保持されているM枚のトランスコード前のフレーム全体に与える符号量(Sall)を算出する。次に最初のGOPに割り当てる符号量(Sgop)を算出し、その後にGOP内の各ピクチャの割当符号量を算出する。
まず、未トランスコードフレーム全体に割り当てる符号量を式(4)とする。
Figure 2010187337
ここで、FrameRateはフレームレートを表し、Sdiffはひとつ前のGOPを符号化する際に与えた符号量と、実際に発生した符号量との差である。
次に、N枚のトランスコード前のフレームのうち、最初のGOPに符号量を割り当てる。例えば、各GOPにおけるフレーム毎の複雑度の総和を算出し、この総和を比例配分する。式(5)は、GOP内にN枚のフレームが存在している場合、GOP全体に割り当てる符号量(Sgop)を、GOP内のN枚のフレームの符号化複雑度の総和(X〜gop)を用いて表す式である。
Figure 2010187337
次に各GOP内にある各ピクチャに符号量を割り当てる。GOP内にある各フレームに割り当てる符号量をS(t+k),(但し、k=0,1,・・・,N−1)とした場合、S(t+k)は、ステップS2で推定したGOP内の各ピクチャにおける符号化複雑度と式(5)により算出したSgopから、式(6)で求められる。
Figure 2010187337
ここで、K,K,Kは各ピクチャに対する符号量割当の重みを規定する定数を表している。
また、トランスコード開始直後のMフレームに関しては、X〜(t)を推定するのに十分な実績データがないため、式(6)において、推定符号化複雑度(X〜(t))と入力画像ストリームの符号化複雑度(x(t))とは等しいものと仮定してS(t)を算出する。
(ステップS4)
ステップS4では、ステップS0で読み込まれた入力画像ストリームのうち、バッファ105に格納されている1GOP分の入力画像ストリームを、1フレームずつ復号化部106で復号化する。
(ステップS5)
次に、ステップ5では量子化スケール決定部111において、推定符号化複雑度算出部109から出力される推定符号化複雑度(X〜(t+k))と、割当符号量算出部110から得た割当符号量(S(t+k))とから、トランスコード対象画像に対する量子化スケール(Q(t+k))を算出する。ここでは、式(2)から導出される式(7)を用いて量子化パラメータを決定する。
Figure 2010187337
(ステップS6)
ステップS6では、符号化部107が、ステップS5で求めた量子化スケールQ(t)に基づいて、H.264/MPEG−4 AVCに準拠した方式で符号化を行い、符号化画像ストリームを出力する。
(ステップS7)
ステップS7では、符号化情報取得部103が、符号化が終了した出力画像ストリームが読み込まれた後に、読み込んだ出力画像ストリームのフレーム毎の量子化スケール、及び、発生符号量を取得する。符号化情報取得部103は、さらに、フレーム毎の符号化複雑度を式(1)により算出する。バッファ104は、算出されたフレーム毎の符号化複雑度を格納する。ここで、バッファ104には、例えば、少なくとも1GOPに対応するフレーム分の、トランスコードが終了した出力画像に対応するフレームの符号化複雑度を格納するとよい。
(ステップS8)
次にステップS8では、1GOPに含まれる全てのフレームの符号化が終了したかどうかの判定を行う。1GOP分のフレームの符号化が終わっていない場合は、ステップS4まで戻り、ステップS4からステップS7を実行する。1GOP分のフレームの符号化が終了した場合は、ステップS9に進む。
(ステップS9)
ステップS9では、シーケンスに含まれる全てのフレームの符号化が終了したかどうかの判定を行う。シーケンス内の全フレームの符号化が終了した場合は、全ての処理を終了する。シーケンス内の全フレームの符号化が終わっていない場合は、ステップS0からステップS8を実行する。
以上説明したように本実施形態では、トランスコード後の複数の入力画像ストリームと出力画像ストリームの符号化複雑度群から、一次近似した直線と所定の定数とにより表される折れ線の関数を用いて、入力画像ストリームおよび出力画像ストリームの符号化複雑度の関係を算出する。算出した近似直線にトランスコード前の入力画像ストリームの符号化複雑度を代入することで、トランスコード前の出力画像ストリームの符号化複雑度を推定する。これにより、入力画像ストリームと出力画像ストリームの符号化複雑度の関係が実際の符号化特性の違いに適合させることができるため、符号化複雑度の精度を向上させ適応的な符号量割り当てが可能となる。
なお、本発明は上記実施形態に係わらず、その主旨を逸脱しない限り、種々に変更することが可能である。
(変更例1)
上記実施形態では、入力画像ストリーム(x(t))と出力画像ストリームの複雑度(X(t))の関係式を、線形近似を用いることで求めたが、必ずしもこれに限定されるものではない。入力画像ストリームの圧縮形式と出力画像ストリームの圧縮形式の特性に応じて種々の近似方式が適用できる。
(変更例2)
上記実施形態では、量子化スケールを式(7)により求めることとしたが、各フレームのトランスコード中に、予測発生符号量と実測発生符号量とのずれに応じて、量子化スケールをフィードバック的に変化させても良い。
(変更例3)
上記実施例では、入力画像ストリームをバッファに保存し、保存していたストリームを1フレーム毎に復号化することとした。これにより、符号化部107の処理は、復号化部106の処理と、パイプライン的に接続されるため、バッファ105の容量を小さくすることができる。
図8は、復号化の処理と符号化の処理との間に、バッファを設ける構成を示す図である。図8において、図1と同一の機能及び構成を有する各部は、図1と同一の符号を付し、ここでは説明を省略する。図8の復号化部406は、入力画像ストリームを復号する。バッファ405は、復号化部406が復号して得る復号画像を格納する。
図8の構成により、入力画像ストリームを先に1GOP分復号化し、その復号化したフレームをバッファに保存することができる。これにより、符号化部107の処理と復号化部406の処理とを同期させる必要がなくなる。
なお、本発明の実施の形態に係る動画像変換装置は、例えばパーソナルコンピュータ(PC)等で実現されてもよい。また、本発明の実施形態に係る動画像変換方法は、例えば、CPUがROMやハードディスク装置等に記憶されたプログラムに従い、RAM等のメインメモリをワークエリアとして使用し、実行される。
本実施の形態によれば、入力画像ストリームと出力画像ストリームの符号化複雑度の関係が比例関係にない場合でも、適切な符号化複雑度の推定が行われる。これにより、実際の符号化複雑度に適合した符号量割当が実現でき、安定した画質を得ることができる動画像変換装置を提供できる。
以上、発明を実施するための最良の形態について説明を行ったが、本発明は、この最良の形態で述べた実施の形態に限定されるものではない。本発明の主旨をそこなわない範囲で変更することが可能である。
以上のように、本発明にかかる動画像変換装置及び動画像変換方法は、符号化複雑度が異なる圧縮フォーマット間のトランスコードに有用である。
101 符号化情報取得部
102 バッファ
103 符号化情報取得部
104 バッファ
105 バッファ
106 復号化部
107 符号化部
108 符号化複雑度変換関数算出部
109 推定符号化複雑度算出部
110 割当符号量算出部
111 量子化スケール決定部
201 動き検出部
202、304 動き補償部
203 減算部
204 離散コサイン変換部
205 量子化部
206 エントロピー符号化部
207、305 フレームメモリ
208 加算部
209、303 逆離散コサイン変換部
210、302 逆量子化部
301 可変長復号化部
405 バッファ
406 復号化部

Claims (9)

  1. 符号化された入力画像データのフレーム毎の符号化複雑度と、前記入力画像データを変換処理して得られる出力画像データにおける前記フレーム毎の符号化複雑度と、に基づいて、前記入力画像データの一のフレームの符号化複雑度を独立変数とし、前記出力画像データにおける前記一のフレームの符号化複雑度を従属変数とする、一次関数の傾きと切片とを算出し、さらに、前記一次関数に基づく変換関数を算出する、符号化複雑度変換関数算出部と、
    前記変換関数に従って、前記出力画像データにおける前記一のフレームの符号化複雑度の推定値である推定符号化複雑度を算出する、推定符号化複雑度算出部と、
    前記推定符号化複雑度に基づいて、前記一のフレームに対する目標符号量を割り当てる割当符号量算出部と、
    割り当てられた前記目標符号量により前記入力画像データにおける前記一のフレームが復号化された復号化画像の符号化を行う符号化部と、
    を有することを特徴とする動画像変換装置。
  2. 前記変換関数は、前記一次関数と、前記出力画像データにおける前記一のフレームの符号化複雑度を0以上の所定の定数とする直線と、のうち、前記出力画像データにおける前記一のフレームの符号化複雑度が大きい値を、出力値とすることを特徴とする請求項1記載の動画像変換装置。
  3. 前記一次関数、及び、前記変換関数は、前記入力画像データ又は前記出力画像データのピクチャタイプ毎に算出されることを特徴とする請求項1又は2記載の動画像変換装置。
  4. 前記入力画像データにおける先頭から所定数のフレームに対応する前記復号化画像の符号化処理が未だ行われない場合に、
    前記推定符号化複雑度算出部は、前記推定符号化複雑度として、前記入力画像データにおける先頭から所定数のフレームの符号化複雑度を出力することを特徴とする請求項1ないし3何れか一項に記載の動画像変換装置。
  5. 前記入力画像データのフレーム毎の符号化複雑度を、前記入力画像データに含まれる量子化に係る情報及び前記フレーム毎の符号量に基づいて取得する符号化情報取得部を有することを特徴とする請求項1ないし4何れか一項に記載の動画像変換装置。
  6. 前記出力画像データのフレーム毎の符号化複雑度を、前記出力画像データを符号化する際の量子化に係る情報及び前記フレーム毎の符号量に基づいて取得する符号化情報取得部を有することを特徴とする請求項1ないし4何れか一項に記載の動画像変換装置。
  7. 前記入力画像データを復号化して復号化画像を出力する復号化部と、
    前記復号化画像を格納する記憶部と、
    を有し、
    前記符号化部は、前記記憶部に格納される復号化画像を符号化する請求項1ないし6何れか一項に記載の動画像変換装置。
  8. 前記入力画像データを格納する記憶部と、
    前記入力画像データを復号化して復号化画像を出力する復号化部と、
    を有し、
    前記符号化部は、前記復号化部から出力される復号化画像を符号化する請求項1ないし6何れか一項に記載の動画像変換装置。
  9. 符号化された入力画像データのフレーム毎の符号化複雑度と、前記入力画像データを変換処理して得られる出力画像データにおける前記フレーム毎の符号化複雑度と、に基づいて、前記入力画像データの一のフレームの符号化複雑度を独立変数とし、前記出力画像データにおける前記一のフレームの符号化複雑度を従属変数とする、一次関数の傾きと切片とを算出し、さらに、前記一次関数に基づく変換関数を算出する、符号化複雑度変換関数算出ステップと、
    前記変換関数により、前記出力画像データにおける前記一のフレームの符号化複雑度を算出する、推定符号化複雑度算出ステップと、
    算出された前記出力画像データにおける前記一のフレームの符号化複雑度に基づいて、前記一のフレームに対する目標符号量を割り当てる割当符号量算出ステップと、
    割り当てられた前記目標符号量により前記入力画像データにおける前記一のフレームが復号化された復号化画像の符号化を行う符号化ステップと、
    を有することを特徴とする動画像変換方法。
JP2009031749A 2009-02-13 2009-02-13 動画像変換装置及び動画像変換方法 Pending JP2010187337A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009031749A JP2010187337A (ja) 2009-02-13 2009-02-13 動画像変換装置及び動画像変換方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009031749A JP2010187337A (ja) 2009-02-13 2009-02-13 動画像変換装置及び動画像変換方法

Publications (1)

Publication Number Publication Date
JP2010187337A true JP2010187337A (ja) 2010-08-26

Family

ID=42767691

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009031749A Pending JP2010187337A (ja) 2009-02-13 2009-02-13 動画像変換装置及び動画像変換方法

Country Status (1)

Country Link
JP (1) JP2010187337A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10362315B2 (en) 2014-09-17 2019-07-23 Samsung Electronics Co., Ltd Codec and devices including the same

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002051345A (ja) * 2000-05-25 2002-02-15 Sony Corp 画像情報変換装置及び方法
JP2006509444A (ja) * 2002-12-10 2006-03-16 タット・システムズ・インコーポレイテッド ピクチュアベースの先読みウィンドウによるレート制御
JP2006203682A (ja) * 2005-01-21 2006-08-03 Nec Corp 動画像圧縮符号化ビットストリームシンタックス変換装置及び動画像通信システム
JP2007184913A (ja) * 2005-12-30 2007-07-19 Sharp Corp 無線ビデオ送信システム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002051345A (ja) * 2000-05-25 2002-02-15 Sony Corp 画像情報変換装置及び方法
JP2006509444A (ja) * 2002-12-10 2006-03-16 タット・システムズ・インコーポレイテッド ピクチュアベースの先読みウィンドウによるレート制御
JP2006203682A (ja) * 2005-01-21 2006-08-03 Nec Corp 動画像圧縮符号化ビットストリームシンタックス変換装置及び動画像通信システム
JP2007184913A (ja) * 2005-12-30 2007-07-19 Sharp Corp 無線ビデオ送信システム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNJ200910057024; 瀧本崇博(外2名): '原画像先読み情報に基づく可変ビットレート動画像符号化アルゴリズム' 2008年画像符号化シンポジウム第23回シンポジウム資料 PCSJ2008, 20081029, p.51-52, 社団法人電子情報通信学会 *
JPN6012036532; 瀧本崇博(外2名): '原画像先読み情報に基づく可変ビットレート動画像符号化アルゴリズム' 2008年画像符号化シンポジウム第23回シンポジウム資料 PCSJ2008, 20081029, p.51-52, 社団法人電子情報通信学会 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10362315B2 (en) 2014-09-17 2019-07-23 Samsung Electronics Co., Ltd Codec and devices including the same

Similar Documents

Publication Publication Date Title
KR100978767B1 (ko) 화상 부호화 방법 및 이것을 이용한 장치와 컴퓨터프로그램
TWI569632B (zh) An image decoding apparatus, an image decoding method, and an image decoding program
JP5242919B2 (ja) スケーラブルな画像トランスコーディング方法及び装置
JP5133290B2 (ja) 動画像符号化装置および復号装置
JP2007281949A (ja) 画像符号化装置、画像符号化復号システム、画像符号化方法、および画像符号化復号方法
JP7343817B2 (ja) 符号化装置、符号化方法、及び符号化プログラム
JP4746691B2 (ja) 動画像符号化装置および動画像符号化方法
JP2008005337A (ja) 画像符号化装置及び画像符号化方法
TWI536846B (zh) 訊框速率控制方法、訊框速率控制裝置及訊框速率控制程式
JP6626319B2 (ja) 符号化装置、撮像装置、符号化方法、及びプログラム
JP2011082629A (ja) 画像符号化方法、画像復号化方法、画像符号化装置、及び画像復号化装置、並びにプログラム
JP2004040811A (ja) 動映像符号化のためのdct演算量調節方法及びその装置
JP2010187337A (ja) 動画像変換装置及び動画像変換方法
JPWO2008053557A1 (ja) 動画像再符号化装置、動画像再符号化方法、動画像再符号化プログラムおよび動画像再符号化プログラムを格納した記録媒体
JP2008252225A (ja) 動画像符号化装置及び方法
JP4586340B2 (ja) 符号化装置、および、符号化方法、並びに、プログラム
JP2008182408A (ja) 動画像符号化装置及び方法
JP6256572B2 (ja) 画像復号装置、画像復号方法、及び画像復号プログラム
JP4243286B2 (ja) 符号化方法
JP2008311824A (ja) 画像符号化装置および画像符号化プログラム
GB2577056A (en) Bitstream decoder
JP6985899B2 (ja) 画像符号化装置及びその制御方法並びにプログラム
JP5876933B2 (ja) 動画像符号化方法、動画像復号方法、動画像符号化装置、動画像復号装置、動画像符号化プログラム、動画像復号プログラム及び記録媒体
JP4582710B2 (ja) 動画像符号化装置
JP4239734B2 (ja) 符号化装置、および、符号化方法、並びに、プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110916

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120618

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120717

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20121113