JP4755239B2 - 映像符号量制御方法,映像符号化装置,映像符号量制御プログラムおよびその記録媒体 - Google Patents

映像符号量制御方法,映像符号化装置,映像符号量制御プログラムおよびその記録媒体 Download PDF

Info

Publication number
JP4755239B2
JP4755239B2 JP2008309277A JP2008309277A JP4755239B2 JP 4755239 B2 JP4755239 B2 JP 4755239B2 JP 2008309277 A JP2008309277 A JP 2008309277A JP 2008309277 A JP2008309277 A JP 2008309277A JP 4755239 B2 JP4755239 B2 JP 4755239B2
Authority
JP
Japan
Prior art keywords
code amount
video
control unit
encoding control
encoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008309277A
Other languages
English (en)
Other versions
JP2010136037A (ja
Inventor
健 中村
淳 清水
隆一 谷田
登 原田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2008309277A priority Critical patent/JP4755239B2/ja
Publication of JP2010136037A publication Critical patent/JP2010136037A/ja
Application granted granted Critical
Publication of JP4755239B2 publication Critical patent/JP4755239B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は,音声ストリームのビットレートと映像ストリームのビットレートとの和が所定のビットレートの範囲内になるように,音声の発生符号量に応じて映像の符号量を制御する映像符号量制御方法,映像符号化装置,映像符号量制御プログラムおよびその記録媒体に関するものである。
一般に,映像ストリームと,音声やデータなどの他のストリームとを多重化して送るような伝送システムでは,映像は,他のストリームとは独立にビットレート制御を行っていた(非特許文献1,2参照)。
一般に映像・音声符号化では,複雑で変化の多い入力信号に対しては符号量が多くなり,単調で変化の少ない入力信号に対しては符号量が少なくなる。
ロッシー符号化ストリームは,固定ビットレート(CBR:Constant Bit Rate )で伝送するために,信号の劣化の程度を変化させることにより,発生符号量を所定の範囲内に収めるように制御する。一方,ロスレス符号化ストリームでは,発生符号量の変化を制御することができないため,一般に可変ビットレート(VBR:Variable Bit Rate )で伝送される。
ISO/IEC 13818-2 Annex C, ITU-T Recomendation H.264 Annex C 映像情報メディア学会編,"総合マルチメディア選書MPEG",社団法人映像情報メディア学会,(株)オーム社発行,1996.4.20
MPEG−4 ALSのようなロスレス音声符号化ストリームと映像符号化ストリーム(以下,符号化ストリームを単に「ストリーム」ともいう)とを多重化する場合,音声伝送ビットレートの変動が映像伝送ビットレートに比べて無視できないほど大きいことが多い。
したがって,映像と音声の多重化ストリームにおいて,固定で割り当てられていた音声のビットレートのうち,音声符号化データの発生符号量が小さい余剰符号量分を映像符号化に利用することができれば,ビットレートに無駄が生じることがなく,画質の向上に寄与すると考えられる。
しかし,このように音声符号化データの発生符号量の変動分を,映像符号化に有効に利用することを考えた場合,映像の全体としての画質は向上するものの,音声符号化データの発生符号量が多い場面では画質の劣化が大きく,音声符号化データの発生符号量が少ない場面では画質が鮮明になり過ぎることがあり,そのため音声符号化データの変動に応じて画質の変動が目立ってしまうことがあるという,新たな問題が生じる。
図9は,本発明の課題を説明する図である。従来,符号化ビットレートが固定の音声符号化ストリームと映像符号化ストリームを多重化する場合,図9(A)に示すように,映像は,音声のストリームとは独立にビットレート制御が行われていた。なお,GOP(Group Of Pictures )は,一般に十数フレームから数十フレームのピクチャ群からなる映像符号化データの単位であり,ここで,GOP(n)はn番目のGOPを表している。
ロスレス音声符号化ストリームの場合,音声の発生符号量は変動し,音声符号化データのデータ量が,与えられた音声ビットレートで送信可能なデータ量よりもかなり少なくなることがある。このビットレートの余裕分の符号量を,ここでは余剰符号量という。図9(B)に斜線を付して示している部分が余剰符号量である。
図9(C)は,図9(B)に示した音声の余剰符号量を映像符号化データの伝送に利用することを考えた場合の音声ビットレートと映像ビットレートとの関係を示している。音声の余剰符号量を映像符号化データの伝送に利用することにより,映像符号化時におけるGOP単位の目標符号量を,元の映像ビットレートによる目標符号量よりも大きくすることができる。
図9(C)に示すように,音声の余剰符号量分を映像符号化データの伝送に利用したとすると,映像の発生符号量を増加させることができるので,映像の画質が向上すると考えられるが,音声ビットレートの変動に応じて映像ビットレートが変動することになり,画質の変動が目につく可能性があるという,新たな問題が発生する。
本発明は,上記課題の解決を図り,音声の余剰符号量分を映像符号化に有効に利用し,画質を向上させるとともに,全体として画質の変動を目立たせなくすることを目的とする。
本発明は,上記課題を解決するため,ロスレス音声符号化ストリームやデータストリーム等の符号化ビットレートを制御できないストリームと,ロッシー映像符号化ストリームとをCBRに多重化する場合に,次のように音声の発生符号量に応じて映像の符号量を制御する。
(1)映像符号化時の目標符号量と発生符号量の差,量子化ステップサイズ,アクティビティなどのパラメータが,所定の条件に合致した場合にのみ,音声の余剰符号量を映像符号化に利用する。
(2)映像符号化に利用可能な音声の余剰符号量は,その時点で符号化済みの音声符号化データの余剰符号量や伝送タイミングから求める。また,余剰符号量の利用判断,利用量を決めるタイミングは,GOPの先頭またはフレーム単位とする。
(3)映像のGOP符号化開始時に,GOP期間分音声を先行して符号化した場合には,同一GOP期間の,そうでない場合には直前のGOP期間の音声の余剰符号量分を求める。余剰符号量の利用が決定された場合,その余剰符号量を上限とする。画質改善のために必要な符号量は,量子化ステップサイズ,アクティビティから計算する。
以上の点を踏まえて,本発明は,次のように映像の符号量を制御する。まず,符号化済みの音声発生符号量から映像符号化制御単位(例えばGOPまたはフレーム)の期間における音声の余剰符号量を算出する。その余剰符号量を映像符号化制御単位における目標符号量に加えるかどうかの,あらかじめ定められた映像の発生符号量に影響する映像の特徴または符号化の条件を判定する。条件が満たされる場合には,余剰符号量の一部または全部を映像符号化制御単位における目標符号量に加え,条件が満たされない場合には,余剰符号量を映像符号化制御単位における目標符号量に加えないで,次に符号化する映像符号化制御単位における目標符号量を決定する。決定された目標符号量に従って,映像符号化制御単位における映像信号を符号化する。
前記条件として,本発明は,以下のような条件のいずれかを用いる。
・過去の所定数の映像フレームの平均量子化パラメータが所定の閾値以上であるという条件,
・過去の所定数の映像フレームの平均量子化ステップが所定の閾値以上であるという条件,
・これから符号化する映像符号化制御単位のアクティビティ平均値が所定の閾値以上であるという条件,
・これから符号化する映像符号化制御単位にシーンチェンジがあるという条件,
・過去の所定数の映像フレームの目標符号量と発生符号量との差の総和が所定の閾値以上であるという条件。
映像符号化に利用する音声の余剰符号量の算出方法としては,次のような方法を用いることができる。
・音声の余剰符号量を,映像符号化制御単位と同一表示期間の音声符号化制御単位群における,各音声符号化制御単位の所定の最大発生符号量と実際の発生符号量との差の総和から算出する方法,
・音声の余剰符号量を,映像符号化制御単位より所定の映像フレーム数だけ前の映像符号化制御単位と同じ長さの期間の映像フレーム群と同一表示期間の音声符号化制御単位群における,各音声符号化制御単位の所定の最大発生符号量と実際の発生符号量との差の総和から算出する方法。
本発明は,映像符号化データと,映像符号化データ以外の符号化データとを多重化して伝送する場合に,前述した音声符号化データの余剰符号量と同様に,映像符号化データ以外の符号化データの余剰符号量をもとに,追加目標符号量を決定し,映像符号化の符号量を制御することもできる。
本発明によれば,映像と音声とを多重化した符号化ストリームが所定のビットレートの範囲内になるように映像を符号化する場合に,映像の符号化が困難なシーンでは画質を向上させ,全体としては画質の変動を目立たせなくすることで,主観的な画質を向上させることができるようになる。
以下,本発明の実施の形態を図面を用いながら詳細に説明する。
図1は,本発明の実施例に係る装置の構成例を示す図である。映像符号化装置10は,映像・音声重畳信号のうち映像信号を入力し,映像信号を符号化して映像ストリームを出力する。音声符号化装置20は,映像・音声重畳信号のうち音声信号を入力し,音声ストリームを出力する。多重化部30は,音声ストリームと映像ストリームとを所定のビットレートとなるように多重化して出力する。
本実施例において,音声符号化装置20は,フレーム毎もしくは逐次,音声発生符号量を映像符号化装置10に伝達する機能を持つほかは従来技術と同様に構成できるので,その内部構成についての詳しい説明は省略する。
映像符号化装置10は,映像信号を入力する映像入力部11,入力した映像信号を蓄積する映像入力バッファ12,GOP毎の映像の目標符号量を決定する映像GOP目標符号化量決定部13,映像フレーム毎の目標符号量を決定する映像フレーム目標符号量決定部14,映像信号をフレーム目標符号量に従って符号化する映像フレーム符号化処理部15,映像ストリームを出力する映像ストリーム出力部16,映像ストリームを一時的に蓄積する映像ストリーム出力バッファ17を備える。
映像GOP目標符号量決定部13は,GOP毎に音声発生符号量から映像符号化に利用することができる余剰符号量を算出する余剰符号量算出部131と,算出した余剰符号量を映像符号化に利用するかどうかを判定する条件判定部132と,条件の判定結果に従ってGOP目標符号量を算出するGOP目標符号量算出部133とを備える。
アクティビティ・シーンチェンジ解析部18は,入力映像信号のうち符号化に先立って解析される先行解析対象映像データについて,アクティビティ値の算出もしくはシーンチェンジの有無を検出するものであり,後述する実施例3,4で用いられる。他の実施例では省略することができる。
〔実施例1〕
図2は,本発明の実施例1の映像符号化処理のフローチャートである。実施例1では,過去のいくつかの数の映像フレームの平均量子化パラメータQPave (n)が,ある閾値THqp以上の場合に,音声の余剰符号量を映像符号化に利用する。これは,映像符号化に利用できる符号量の不足により平均量子化パラメータQPave (n)がある値以上になると,画質の粗くなる程度が大きくなり,画質向上の必要性が増すとともに,音声の余剰符号量の追加による画質の変動が目立ちにくくなるからである。
n番目のGOP(Group Of Pictures) を,GOP(n)とする。映像と音声の符号化は並行して行われる。ただし,本実施例では,GOP(n)の映像フレーム符号化開始より前に,GOP(n)の映像フレームと同一表示期間の音声フレームの符号化が完了しているものとする。
まず,映像GOP目標符号量決定部13は,以下のステップS101〜S105の処理を実行する。音声符号化装置20から音声発生符号量の情報を受け取り,GOP(n)の映像フレームと同一表示期間の音声フレームj〜j+M−1について,GOP(n)期間の余剰符号量Gr (n)を,次式によって求める(ステップS101)。
r (n)=Σx=j j+M-1 {Samax−Sa (x)}
ここで,Mは,GOP(n)期間の音声フレーム数,Samaxは,各音声フレームの最大発生符号量,Sa (x)は,x番目の音声フレームの発生符号量である。Samaxとしては,あらかじめ定めた値を用いてよい。
次に,過去の数映像フレームの平均量子化パラメータQPave (n)が,ある閾値THqp以上かどうかを判定する(ステップS102)。平均をとる映像フレーム数は任意の数でよく,あらかじめ定められる。平均量子化パラメータQPave (n)が,ある閾値THqp以上の場合には,余剰符号量Gr (n)を超えない範囲で,平均量子化パラメータQPave (n)の閾値THqp超過分に比例して,追加GOP目標符号量Gd (n)を決定する(ステップS103)。この場合のGd (n)は,次式によって求められる。
d (n)=min(Gr (n),a・(QPave (n)−THqp))
min()は,最小値を返す関数であり,aは予め定められた定数である。
一方,平均量子化パラメータQPave (n)が,ある閾値THqp以上でない場合には,追加GOP目標符号量Gd (n)を0とする(ステップS104)。
次に,GOP目標符号量G(n)を,GOP内フレーム数N×基準映像ビットレートR/映像フレームレートPと,追加GOP目標符号量Gd (n)と,前のGOPからの繰越符号量の和で求める(ステップS105)。GOP目標符号量G(n)は,次のようになる。
G(n)=N・R/P+Gd (n)+前のGOPからの繰越符号量
なお,基準映像ビットレートRとは,音声フレームの発生符号量が常に最大の場合に確保できる映像ビットレートを指す。
次に,映像フレーム目標符号量決定部14および映像フレーム符号化処理部15は,以下に説明するステップS106〜S109の処理を,GOP(n)内のフレームの符号化が終了するまで繰り返す(ステップS110)。
映像フレーム目標符号量決定部14は,GOP(n)の目標符号量をGOP内の各フレームに対して配分し,次フレームの目標符号量T(i)を求める(ステップS106)。GOP(n)の目標符号量から,次フレームの目標符号量T(i)を算出する方法としては,例えば次の参考文献1に開示されている方法などがあり,周知技術であるため,ここでの詳細な説明は省略する。
[参考文献1]International Organisation for Standardisation, Test Model Editing Committee, 1993, Test Model 5, April, ISO-IEC/JTC1/SC29/WG11/N0400
次に,映像フレーム目標符号量決定部14は,伝送先の映像復号装置におけるデコーダ受信バッファのバッファサイズや転送済みのデータ量から算出したバッファ占有量をもとに,デコーダ受信バッファが破綻しない限界の符号量を求め,目標符号量がその値を超えないようにクリッピングする(ステップS107)。なお,デコーダ受信バッファのバッファサイズが十分大きい場合や,デコードまでの遅延時間を大きくしてもよい場合には,このクリッピングの処理を省略する実施も可能である。
映像フレーム符号化処理部15は,映像フレーム目標符号量決定部14が算出した目標符号量に従って,フレームiを符号化する(ステップS108)。なお,インターレースの指定があればフィールド単位で符号化するが,説明を簡単にするため,フィールド単位の符号化の場合も単にフレームの符号化として説明する。
フレームの符号化が終了すると,映像フレーム目標符号量決定部14は,GOP(n)の目標符号量から発生符号量S(i)を減算する(ステップS109)。その後,GOP(n)内の全フレームについて符号化が終了したかどうかを判定し,終了していなければ,ステップS106に戻って,全フレームについて符号化が終了まで同様に処理を繰り返す(ステップS110)。
映像GOP目標符号量決定部13は,GOP開始時のGOP目標符号量G(n)と,GOP発生符号量との差から,次のGOPへの繰越符号量を決定する(ステップS111)。以下,ステップS101に戻って,次のGOPについて同様に符号化処理を行う。
〔実施例2〕
図3は,本発明の実施例2の映像符号化処理のフローチャートである。実施例2では,過去のいくつかの数の映像フレームの平均量子化ステップQave (n)が,ある閾値THq 以上の場合に,音声の余剰符号量を映像符号化に利用する。これは,映像符号化に利用できる符号量の不足により平均量子化ステップQave (n)がある値以上になると,画質の粗くなる程度が大きくなり,画質向上の必要性が増すとともに,音声の余剰符号量の追加による画質の変動が目立ちにくくなるからである。
前述した実施例1と実施例2との違いは,音声の余剰符号量を映像符号化に利用するか否かの条件の判定を,平均量子化パラメータQPave (n)で行うか平均量子化ステップQave (n)で行うかという点である。量子化パラメータと量子化ステップの換算式は,符号化規格によって異なるが,一般に「(符号量)=a/(量子化ステップ)+b」(a,bは定数)で近似できるため,実施例1より実施例2のほうが追加目標符号量の計算精度がよい。
実施例2では,図2に示すフローチャートのうち,ステップS102〜S104が,図3のステップS202〜S204に置き換わり,他の部分については同様であるので,以下では,ステップS202〜S204の部分についてだけ説明する。
図2に示すステップS101を実行した後,映像GOP目標符号量決定部13の条件判定部132は,過去の数映像フレームの平均量子化ステップQave (n)が,ある閾値THq 以上かどうかを判定する(ステップS202)。GOP目標符号量算出部133は,平均量子化パラメータQave (n)が閾値THq 以上の場合には,余剰符号量Gr (n)を超えない範囲で,平均量子化パラメータQave (n)の閾値THq 超過分に応じて,追加GOP目標符号量Gd (n)を決定する(ステップS203)。この場合のGd (n)は,次式によって求められる。
d (n)=min(Gr (n),a・(1/THq −1/Qave (n))
min()は,最小値を返す関数であり,aは予め定められた定数である。
一方,平均量子化パラメータQave (n)が閾値THq 以上でない場合には,追加GOP目標符号量Gd (n)を0とする(ステップS204)。
以降の処理は,実施例1における図2のステップS105〜S111と同様である。
〔実施例3〕
図4は,本発明の実施例3の映像符号化処理のフローチャートである。実施例3では,これから符号化するGOPのアクティビティ平均値act(n)が,ある閾値THact 以上の場合に,音声の余剰符号量を映像符号化に利用する。これは,アクティビティ平均値act(n)が大きいと発生符号量が増え,画質が粗くなり,画質向上の必要性が増すとともに,音声の余剰符号量の追加による画質の変動が目立ちにくくなるからである。
実施例3では,図1に示す映像符号化装置10において,アクティビティ・シーンチェンジ解析部18が設けられ,アクティビティ・シーンチェンジ解析部18は,映像符号化より1GOP分先行して,映像のアクティビティ解析を行い,アクティビティ平均値act(n)を事前に算出する。ここで,アクティビティとは,符号化対象領域の画素値分布の特徴を示すものであり,画素値の変動具合を表す値である。例えばアクティビティは,マクロブロックをさらに分割した小ブロックの分散値の最小値などで定義される。小ブロックの分散値とは,小ブロック内の輝度値の平均値とその小ブロック内の各画素の輝度値との差分の絶対値の総和を取ったものである。
実施例3では,図2に示すフローチャートのうち,ステップS102〜S104が,図4のステップS302〜S304に置き換わり,他の部分については同様であるので,以下では,ステップS302〜S304の部分についてだけ説明する。
図2に示すステップS101を実行した後,映像GOP目標符号量決定部13の条件判定部132は,これから符号化するGOPのアクティビティ平均値act(n)が,ある閾値THact 以上かどうかを判定する(ステップS302)。GOP目標符号量算出部133は,アクティビティ平均値act(n)が閾値THact 以上の場合には,余剰符号量Gr (n)を超えない範囲で,アクティビティ平均値act(n)の閾値THact 超過分に比例して,追加GOP目標符号量Gd (n)を決定する(ステップS303)。この場合のGd (n)は,次式によって求められる。
d (n)=min(Gr (n),a・(act(n)−THact ))
min()は,最小値を返す関数であり,aは予め定められた定数である。
一方,アクティビティ平均値act(n)が閾値THact 以上でない場合には,追加GOP目標符号量Gd (n)を0とする(ステップS304)。
以降の処理は,実施例1における図2のステップS105〜S111と同様である。
〔実施例4〕
図5は,本発明の実施例4の映像符号化処理のフローチャートである。実施例4では,これから符号化するGOPにシーンチェンジがあった場合に,音声の余剰符号量を映像符号化に利用する。これは,これから符号化するGOPにシーンチェンジがあると,シーンチェンジ直後のフレームにおいて動き補償が当たらず,同じ画質を保つためには,通常より多くの符号量を必要とするためである。
実施例4では,図1に示す映像符号化装置10において,アクティビティ・シーンチェンジ解析部18が設けられ,アクティビティ・シーンチェンジ解析部18は,映像符号化より1GOP分先行して,映像のアクティビティ解析およびシーンチェンジ解析を行い,シーンチェンジの有無と,シーンチェンジがある場合のシーンチェンジフレームのアクティビティactscを事前に求める。
シーンチェンジの検出方法は,例えば次の参考文献2に記載されているような方法など,従来から種々の方法が知られているので,ここでの詳しい説明は省略する。
[参考文献2]大辻,外村,“映像カット自動検出方式の検討”,社団法人映像情報メディア学会,テレビジョン学会技術報告ITEJ Technical Report, Vol.16, No.43(19920710), pp.7-12
実施例4では,図2に示すフローチャートのうち,ステップS102〜S104が,図5のステップS402〜S404に置き換わり,他の部分については同様であるので,以下では,ステップS402〜S404の部分についてだけ説明する。
図2に示すステップS101を実行した後,映像GOP目標符号量決定部13の条件判定部132は,アクティビティ・シーンチェンジ解析部18による解析結果から,これから符号化するGOPにシーンチェンジがあるかどうかを判定する(ステップS402)。GOP目標符号量算出部133は,シーンチェンジがある場合には,余剰符号量Gr (n)を超えない範囲で,シーンチェンジフレームのアクティビティactscに比例して,追加GOP目標符号量Gd (n)を決定する(ステップS403)。この場合のGd (n)は,次式によって求められる。
d (n)=min(Gr (n),a・actsc+b))
min()は,最小値を返す関数であり,a,bは予め定められた定数である。
一方,これから符号化するGOPにシーンチェンジがない場合には,追加GOP目標符号量Gd (n)を0とする(ステップS404)。
以降の処理は,実施例1における図2のステップS105〜S111と同様である。
〔実施例5〕
図6は,本発明の実施例5の映像符号化処理のフローチャートである。実施例5では,過去のいくつかの数の映像フレームの目標符号量と発生符号量との差の総和ΔBが,ある閾値THB 以上の場合に,音声の余剰符号量を映像符号化に利用する。これは,目標符号量と発生符号量との差が大きい状態が続く場合には,符号量が不足していると考えられるためである。
実施例5では,図2に示すフローチャートのうち,ステップS102〜S104が,図6のステップS502〜S504に置き換わり,他の部分については同様であるので,以下では,ステップS502〜S504の部分についてだけ説明する。
図2に示すステップS101を実行した後,映像GOP目標符号量決定部13の条件判定部132は,過去の数映像フレームの目標符号量と実際の発生符号量との差の総和ΔBが,ある閾値THB 以上かどうかを判定する(ステップS502)。GOP目標符号量算出部133は,差の総和ΔBが閾値THq 以上の場合には,余剰符号量Gr (n)を超えない範囲で,閾値THB 超過分に比例して,追加GOP目標符号量Gd (n)を決定する(ステップS503)。この場合のGd (n)は,次式によって求められる。
d (n)=min(Gr (n),a・(ΔB−THB ))
min()は,最小値を返す関数であり,aは予め定められた定数である。
一方,差の総和ΔBが閾値THB 以上でない場合には,追加GOP目標符号量Gd (n)を0とする(ステップS504)。
以降の処理は,実施例1における図2のステップS105〜S111と同様である。
〔実施例6〕
図7は,本発明の実施例6の映像符号化処理のフローチャートである。実施例6と,前述した実施例1〜5との違いは,余剰符号量算出部131におけるGOP(n)期間の余剰符号量Gr (n)の算出方法である。
実施例6においても,映像と音声の符号化は並行して行われる。ただし,実施例1〜5では,GOP(n)の映像フレームと同一表示期間の音声フレームの発生符号量をもとにGOP(n)期間の余剰符号量Gr (n)を算出するのに対し,実施例6では,GOP(n)の最後の映像フレームよりA個の映像フレーム分だけ前の期間と,同じ長さの同一表示期間の音声フレームの発生符号量をもとに,GOP(n)期間の余剰符号量Gr (n)を算出する。ここで,Aは予め定められた非負の整数である。
したがって,本実施例では,GOP(n)の映像フレーム符号化開始より前に,音声符号化装置20により,このGOP(n)の最後の映像フレームのA映像フレーム前の期間(長さはGOP(n)期間と同じ)と同一表示期間の音声フレームの符号化が完了しているものとする。
実施例6は,GOP(n)の映像符号化期間と音声発生符号量算出期間との時間的なずれにより,前述した実施例と比べて余剰符号量Gr (n)の算出精度が多少悪くなる場合があるが,音声を先行して符号化する期間を短くすることが可能になるため,符号化の遅延時間を前述した実施例に比べて短縮することができるようになる。
実施例6では,図2に示すフローチャートのうち,ステップS101が,図7のステップS601に置き換わる。
ステップS601では,映像GOP目標符号量決定部13の余剰符号量算出部131が,音声符号化装置20から通知された音声発生符号量の情報をもとに,GOP(n)の映像フレーム期間よりA映像フレーム前の同一長期間と同じ表示期間の音声フレームj〜j+M−1(Mは前記表示期間の音声フレーム数)について,GOP(n)期間の余剰符号量Gr (n)を,次式によって求める。
r (n)=Σx=j j+M-1 {Samax−Sa (x)}
ここで,Samaxは,各音声フレームの最大発生符号量,Sa (x)は,x番目の音声フレームの発生符号量である。
以降の処理は,実施例1における図2のステップS102〜S111と同様であるが,余剰符号量利用条件の判定を,前述した実施例2〜5の方法を用いて実施してもよい。この場合,図2のステップS102〜S104が,実施例2の場合には図3のステップS202〜S204に,実施例3の場合には図4のステップS302〜S304に,実施例4の場合には図5のステップS402〜S404に,実施例5の場合には図6のステップS502〜S504に,さらに置き換わることになる。
〔実施例7〕
図8は,本発明の実施例7の映像符号化処理のフローチャートである。実施例7と,前述した実施例1〜6との違いは,前述した実施例1〜6では,音声の余剰符号量を映像符号化に利用していたのに対し,実施例7では,符号化ストリームに重畳する映像ストリーム以外のデータストリームの余剰符号量を,余剰符号量算出部131におけるGOP(n)期間の余剰符号量Gr (n)として算出している点である。
本実施例では,GOP(n)の映像フレーム符号化開始より前に,GOP(n)の映像フレームと同一デコード時刻の符号化ストリーム中に多重化するデータのデータビット量が判明しているものとする。この場合の基準映像ビットレートは,データフレームのビット量が常に最大の場合に確保できる映像ビットレートを指す。
実施例7では,図2に示すフローチャートのうち,ステップS101が,図8のステップS701に置き換わる。
ステップS701では,映像GOP目標符号量決定部13の余剰符号量算出部131が,GOP(n)の映像フレームのデコード時刻と同一時刻に受信側で必要とされるデータフレームj〜j+M−1(MはGOP(n)と同一期間のデータフレーム数)について,GOP(n)期間の余剰符号量Gr (n)を,次式によって求める。
r (n)=Σx=j j+M-1 {Sdmax−Sd (x)}
ここで,Sdmaxは,各データフレームの最大発生符号量,Sd (x)は,x番目のデータフレームの発生符号量である。
以降の処理は,実施例1における図2のステップS102〜S111と同様であるが,実施例6の場合と同じように,余剰符号量利用条件の判定を,実施例2〜5の方法を用いて行ってもよい。
以上の映像符号化の処理は,コンピュータとソフトウェアプログラムとによって実現することができ,そのプログラムをコンピュータ読み取り可能な記録媒体に記録することも,ネットワークを通して提供することも可能である。
本発明の実施例に係る装置の構成例を示す図である。 本発明の実施例1の映像符号化処理のフローチャートである。 本発明の実施例2の映像符号化処理のフローチャートである。 本発明の実施例3の映像符号化処理のフローチャートである。 本発明の実施例4の映像符号化処理のフローチャートである。 本発明の実施例5の映像符号化処理のフローチャートである。 本発明の実施例6の映像符号化処理のフローチャートである。 本発明の実施例7の映像符号化処理のフローチャートである。 本発明の課題を説明する図である。
符号の説明
10 映像符号化装置
11 映像入力部
12 映像入力バッファ
13 映像GOP目標符号化量決定部
131 余剰符号量算出部
132 条件判定部
133 GOP目標符号量算出部
14 映像フレーム目標符号量決定部
15 映像フレーム符号化処理部
16 映像ストリーム出力部
17 映像ストリーム出力バッファ
18 アクティビティ・シーンチェンジ解析部
20 音声符号化装置
30 多重化部

Claims (7)

  1. 映像符号化データと音声符号化データとを多重化した符号化ストリームが所定のビットレートの範囲内になるように,映像の符号量を制御する映像符号量制御方法であって,
    符号化済みの音声発生符号量から映像符号化制御単位の期間における音声の余剰符号量を算出する過程と,
    前記余剰符号量を映像符号化制御単位における目標符号量に加えるかどうかの,あらかじめ定められた映像の発生符号量に影響する映像の特徴または符号化の条件を判定する過程と,
    前記条件が満たされると判定された場合に,前記余剰符号量の一部または全部を映像符号化制御単位における目標符号量に加え,前記条件が満たされないと判定された場合に,前記余剰符号量を映像符号化制御単位における目標符号量に加えないで,次に符号化する映像符号化制御単位における目標符号量を決定する過程と,
    前記決定された目標符号量に従って,映像符号化制御単位における映像信号を符号化する過程とを有し,
    前記条件は,過去の所定数の映像フレームの平均量子化パラメータが所定の閾値以上であるという条件,または過去の所定数の映像フレームの平均量子化ステップが所定の閾値以上であるという条件,またはこれから符号化する映像符号化制御単位のアクティビティ平均値が所定の閾値以上であるという条件,またはこれから符号化する映像符号化制御単位にシーンチェンジがあるという条件,または過去の所定数の映像フレームの目標符号量と発生符号量との差の総和が所定の閾値以上であるという条件である
    ことを特徴とする映像符号量制御方法。
  2. 請求項1に記載の映像符号量制御方法において,
    前記音声の余剰符号量を,前記映像符号化制御単位と同一表示期間の音声符号化制御単位群における,各音声符号化制御単位の所定の最大発生符号量と実際の発生符号量との差の総和から算出する
    ことを特徴とする映像符号量制御方法。
  3. 請求項1に記載の映像符号量制御方法において,
    前記音声の余剰符号量を,前記映像符号化制御単位より所定の映像フレーム数だけ前の前記映像符号化制御単位と同じ長さの期間の映像フレーム群と同一表示期間の音声符号化制御単位群における,各音声符号化制御単位の所定の最大発生符号量と実際の発生符号量との差の総和から算出する
    ことを特徴とする映像符号量制御方法。
  4. 映像符号化データと他の符号化データとを多重化した符号化ストリームが所定のビットレートの範囲内になるように,映像の符号量を制御する映像符号量制御方法であって,
    符号化済みの前記他の符号化データの発生符号量から映像符号化制御単位の期間における前記他の符号化データの余剰符号量を算出する過程と,
    前記余剰符号量を映像符号化制御単位における目標符号量に加えるかどうかの,あらかじめ定められた映像の発生符号量に影響する映像の特徴または符号化の条件を判定する過程と,
    前記条件が満たされると判定された場合に,前記余剰符号量の一部または全部を映像符号化制御単位における目標符号量に加え,前記条件が満たされないと判定された場合に,前記余剰符号量を映像符号化制御単位における目標符号量に加えないで,次に符号化する映像符号化制御単位における目標符号量を決定する過程と,
    前記決定された目標符号量に従って,映像符号化制御単位における映像信号を符号化する過程とを有し,
    前記条件は,過去の所定数の映像フレームの平均量子化パラメータが所定の閾値以上であるという条件,または過去の所定数の映像フレームの平均量子化ステップが所定の閾値以上であるという条件,またはこれから符号化する映像符号化制御単位のアクティビティ平均値が所定の閾値以上であるという条件,またはこれから符号化する映像符号化制御単位にシーンチェンジがあるという条件,または過去の所定数の映像フレームの目標符号量と発生符号量との差の総和が所定の閾値以上であるという条件である
    ことを特徴とする映像符号量制御方法。
  5. 映像符号化データと音声符号化データとを多重化した符号化ストリームが所定のビットレートの範囲内になるように,映像の符号量を制御し,映像信号を符号化する映像符号化装置であって,
    符号化済みの音声発生符号量を取得し,映像符号化制御単位の期間における音声の余剰符号量を算出する手段と,
    前記余剰符号量を映像符号化制御単位における目標符号量に加えるかどうかの,あらかじめ定められた映像の発生符号量に影響する映像の特徴または符号化の条件を判定する手段と,
    前記条件が満たされると判定された場合に,前記余剰符号量の一部または全部を映像符号化制御単位における目標符号量に加え,前記条件が満たされないと判定された場合に,前記余剰符号量を映像符号化制御単位における目標符号量に加えないで,次に符号化する映像符号化制御単位における目標符号量を決定する手段と,
    前記決定された目標符号量に従って,映像符号化制御単位における映像信号を符号化する手段とを備え,
    前記条件は,過去の所定数の映像フレームの平均量子化パラメータが所定の閾値以上であるという条件,または過去の所定数の映像フレームの平均量子化ステップが所定の閾値以上であるという条件,またはこれから符号化する映像符号化制御単位のアクティビティ平均値が所定の閾値以上であるという条件,またはこれから符号化する映像符号化制御単位にシーンチェンジがあるという条件,または過去の所定数の映像フレームの目標符号量と発生符号量との差の総和が所定の閾値以上であるという条件である
    ことを特徴とする映像符号化装置。
  6. 請求項1から請求項までのいずれか1項に記載の映像符号量制御方法を,コンピュータに実行させるための映像符号量制御プログラム。
  7. 請求項1から請求項までのいずれか1項に記載の映像符号量制御方法を,コンピュータに実行させるための映像符号量制御プログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2008309277A 2008-12-04 2008-12-04 映像符号量制御方法,映像符号化装置,映像符号量制御プログラムおよびその記録媒体 Active JP4755239B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008309277A JP4755239B2 (ja) 2008-12-04 2008-12-04 映像符号量制御方法,映像符号化装置,映像符号量制御プログラムおよびその記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008309277A JP4755239B2 (ja) 2008-12-04 2008-12-04 映像符号量制御方法,映像符号化装置,映像符号量制御プログラムおよびその記録媒体

Publications (2)

Publication Number Publication Date
JP2010136037A JP2010136037A (ja) 2010-06-17
JP4755239B2 true JP4755239B2 (ja) 2011-08-24

Family

ID=42346884

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008309277A Active JP4755239B2 (ja) 2008-12-04 2008-12-04 映像符号量制御方法,映像符号化装置,映像符号量制御プログラムおよびその記録媒体

Country Status (1)

Country Link
JP (1) JP4755239B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5592913B2 (ja) * 2012-02-01 2014-09-17 日本電信電話株式会社 映像符号化装置、映像符号化方法及び映像符号化プログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07202820A (ja) * 1993-12-28 1995-08-04 Matsushita Electric Ind Co Ltd ビットレート制御システム
JPH1118090A (ja) * 1997-06-19 1999-01-22 Victor Co Of Japan Ltd 可変レート符号化装置
JP4831351B2 (ja) * 2007-02-01 2011-12-07 日本電気株式会社 映像音声帯域制御システム及び映像音声帯域制御方法

Also Published As

Publication number Publication date
JP2010136037A (ja) 2010-06-17

Similar Documents

Publication Publication Date Title
US8588296B2 (en) Bitrate control algorithm for video transcoding systems
KR100329892B1 (ko) 다수의 비디오 프레임 스트림 처리 방법 및 그 장치
US6522693B1 (en) System and method for reencoding segments of buffer constrained video streams
US6678322B1 (en) Video data coding device, video data coding method, video data transmitting device, and video data recording medium
US8194735B2 (en) Video encoding apparatus and video encoding method
US6480539B1 (en) Video encoding method and apparatus
US5719632A (en) Motion video compression system with buffer empty/fill look-ahead bit allocation
US5677969A (en) Method, rate controller, and system for preventing overflow and underflow of a decoder buffer in a video compression system
US20150016513A1 (en) Picture-level rate control for video encoding
US7082163B2 (en) Picture coding method, picture coding apparatus and image relaying apparatus
US9516328B2 (en) Method and apparatus for rate control accuracy in video encoding
US7095784B2 (en) Method and apparatus for moving picture compression rate control using bit allocation with initial quantization step size estimation at picture level
JPH11346362A (ja) リアルタイム単一パス可変ビット・レ―ト制御方法及び符号器
US9014268B2 (en) Video encoder and its decoder
US6714592B1 (en) Picture information conversion method and apparatus
US7373004B2 (en) Apparatus for constant quality rate control in video compression and target bit allocator thereof
US9071846B2 (en) Moving picture encoding method and apparatus for performing a multi-frame motion prediction with reference to a plurality of picture frames
US6879632B1 (en) Apparatus for and method of variable bit rate video coding
EP1978745B1 (en) Statistical adaptive video rate control
US8081679B2 (en) Image processing apparatus
US7965768B2 (en) Video signal encoding apparatus and computer readable medium with quantization control
US6226326B1 (en) Coding device and coding method
US20120069896A1 (en) Efficient coding complexity estimation for video transcoding systems
JP4755239B2 (ja) 映像符号量制御方法,映像符号化装置,映像符号量制御プログラムおよびその記録媒体
US20090213929A1 (en) Transcoder

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100331

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110308

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110418

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110524

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110526

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140603

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4755239

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350