JP3854472B2 - Repetitive image signal encoding method and apparatus, repetitive image signal encoding program, and recording medium recording the program - Google Patents

Repetitive image signal encoding method and apparatus, repetitive image signal encoding program, and recording medium recording the program Download PDF

Info

Publication number
JP3854472B2
JP3854472B2 JP2001125147A JP2001125147A JP3854472B2 JP 3854472 B2 JP3854472 B2 JP 3854472B2 JP 2001125147 A JP2001125147 A JP 2001125147A JP 2001125147 A JP2001125147 A JP 2001125147A JP 3854472 B2 JP3854472 B2 JP 3854472B2
Authority
JP
Japan
Prior art keywords
undetermined multiplier
encoding
local
image signal
undetermined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001125147A
Other languages
Japanese (ja)
Other versions
JP2002320230A (en
Inventor
誠之 高村
小林  直樹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2001125147A priority Critical patent/JP3854472B2/en
Publication of JP2002320230A publication Critical patent/JP2002320230A/en
Application granted granted Critical
Publication of JP3854472B2 publication Critical patent/JP3854472B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、処理時間を短縮した高能率繰り返し画像信号符号化方法および装置に関する。
【0002】
【従来の技術】
符号量対雑音量の意味で符号化能率を向上させるために同一画像シーケンスについて複数回の符号化試行を許すビデオ符号化方法において、符号化能率の評価には、18世紀に確立された「ラグランジュの未定乗数法」が応用されている。
【0003】
この方法は、外部から与えられた未定乗数λに対し、シーケンス符号化時の全符号量Rと全誤差D(この測度は状況により誤差の二乗和であったり誤差の絶対値和であったりしてよい)から大域評価基準
J=R+λD …(1)
を符号化の度に求め、このJが最小となるよう、符号化を繰り返しつつ最適化探索(パラメータ調整)を行う。
【0004】
なお、このパラメータ調整においては、フレームあるいはより小さな符号化単位毎に局所未定乗数をそれぞれ定め、局所的な未定乗数、符号量および誤差をそれぞれλ′,R′およびD′としたとき、局所評価規準
J′=R′+λ′D′ …(2)
を最小化するよう処理を局所化し、大域評価規準Jを最小化する方法がとられている。
【0005】
【発明が解決しようとする課題】
しかしながら、上記従来の技術においては、与えられた大域未定乗数に対応する最適化を行う際、この局所未定乗数を変化させ、乗数調整・符号化・J評価の最適化サイクルを繰り返し、最適化を行うが、この局所未定乗数を定める際、大域未定乗数との値のかかわりが不明確であり、結果として最適にならないはずの局所未定乗数を用いて符号化を試行してしまったりする、無駄な処理を行なっていた。
【0006】
また、「最適化を伴う符号化の結果、符号量がトータルで何バイト以内に収まるようにする」といった制約があるような場合に符号量制御が必要となる。ラグランジュの大域評価規準Jが最小になった場合に必ずしも所望の符号量になっている保証はないため、再度大域未定乗数λを調整して最適化サイクルを繰り返すことになるが、従来の技術においてはその際、前回の最適化サイクルで求まった局所未定乗数を利用することなく、新たに最適化を行っていたため、処理時間がさらに伸びていた。
【0007】
本発明の第一の課題は、高能率繰り返し画像信号符号化方法および装置において、符号化単位間の参照関係に基づき局所未定乗数の値を決定することで無駄な符号化試行をせず最適化サイクルにかかる計算量を削減することにある。
【0008】
本発明の第二の課題は、高能率繰り返し画像信号符号化方法および装置において、符号量と未定乗数の間の既知の統計的関係を用いて、一度求まった局所未定乗数を利用し効率良く符号量を目的値に近づけることにある。
【0009】
【課題を解決するための手段】
上記第一の課題を解決するための第一の発明による繰り返し画像信号符号化方法は、フレーム間動き補償により符号化を行い、ラグランジュの未定乗数法による未定乗数に対する評価に基づき符号量対雑音量の関係を最適化するために同一画像シーケンスを複数回符号化することで画像シーケンス全体の最適化を行う画像信号符号化方法において、符号化単位の各々に対応する局所未定乗数を初期化する第一の手順と、該符号化単位毎に量子化ステップを変化させ、取得した局所未定乗数に対する評価に基づき符号量対雑音量の関係が最適化されるように量子化ステップを決定して画像シーケンス全体を符号化する第二の手順と、該画像シーケンス全体の符号化の度に画像シーケンス全体に対応する大域未定乗数に対する評価を行い、符号量対雑音量の関係が最適化されるまで該局所未定乗数を修正して該第二の手順を繰り返し行う第三の手順とを有し、該第一の手順では該初期化の際に、該第三の手順では該修正の際に、他符号化単位から動き補償のために参照される符号化単位の局所未定乗数を大域未定乗数より小さくし、他符号化単位から動き補償のために参照されない符号化単位の局所未定乗数を大域未定乗数に等しくするように、大域未定乗数および局所未定乗数を決定することを特徴とする。
【0010】
また、第一の発明による繰り返し画像信号符号化装置は、フレーム間動き補償により符号化を行い、ラグランジュの未定乗数法による未定乗数に対する評価に基づき符号量対雑音量の関係を最適化するために同一画像シーケンスを複数回符号化することで画像シーケンス全体の最適化を行う画像信号符号化装置において、符号化単位の各々に対応する局所未定乗数を初期化する第一の手段と、該符号化単位毎に量子化ステップを変化させ、取得した局所未定乗数に対する評価に基づき符号量対雑音量の関係が最適化されるように量子化ステップを決定して画像シーケンス全体を符号化する第二の手段と、該画像シーケンス全体の符号化の度に画像シーケンス全体に対応する大域未定乗数に対する評価を行い、符号量対雑音量の関係が最適化されるまで該局所未定乗数を修正して該第二の手段による符号化を繰り返し行う第三の手段とを備え、該第一の手段は、該初期化に際して、該第三の手段は、該修正に際して、他符号化単位から動き補償のために参照される符号化単位の局所未定乗数を大域未定乗数より小さくし、他符号化単位から動き補償のために参照されない符号化単位の局所未定乗数を大域未定乗数に等しくするように、大域未定乗数および局所未定乗数を決定する手段を備えることを特徴とする。
【0011】
上記第二の課題を解決するための第二の発明による繰り返し画像信号符号化方法は、上記の第一の発明の繰り返し画像信号符号化方法により符号化を行う第四の手順と、該第四の手順の符号化による発生符号量と目標符号量とを比較して十分近ければ符号化を終了し、そうでなければ次の手順で符号化を行う第五の手順と、符号量と未定乗数の既知の統計的関係を用いて、画像シーケンス全体に対応する大域未定乗数および符号化単位各々に対応する局所未定乗数を変更して上記第一の発明の繰り返し画像信号符号化方法における第二の手順により符号化を行った後、該第五の手順に戻る第六の手順とを有することを特徴とする。
【0012】
また、第二の発明による繰り返し画像信号符号化装置は、上記の第一の発明の繰り返し画像信号符号化装置により符号化を行う第四の手段と、該第四の手段の符号化による発生符号量と目標符号量とを比較して十分近ければ符号化を終了し、そうでなければ第六の手段で符号化を行う第五の手段と、符号量と未定乗数の既知の統計的関係を用いて、画像シーケンス全体に対応する大域未定乗数および符号化単位各々に対応する局所未定乗数を変更して請求項1に記載の繰り返し画像信号符号化装置における第二の手段により符号化を行った後、該第五の手段の処理に戻る該第六の手段とを備えることを特徴とする。
【0013】
上記の第一、第二の繰り返し画像信号符号化方法における処理の手順は、コンピュータに実行させるための繰り返し画像信号符号化プログラムとすることが可能であり、また、この繰り返し画像信号符号化プログラムは、コンピュータが読み取り可能な記録媒体に記録することが可能である。
【0014】
本発明による第一の発明では、最適化を行う際に変化させる局所未定乗数の、大域未定乗数との大小関係を考慮しつつ、局所未定乗数調整・符号化・大域評価規準評価という最適化サイクルを行うことにより、結果として最適にならないはずの局所未定乗数を用いて符号化を試行してしまったりする、無駄な処理を避ける。
【0015】
また、本発明による第二の発明では、最適化サイクルと符号量制御を両立させる場合、得られた符号量と一回求めた局所未定乗数を元に、目的とする符号量において最適となる局所未定乗数を生成することにより、新たに最適化サイクルを繰り返す必要をなくす。
【0016】
【発明の実施の形態】
以下、本発明の原理および実施の形態について図を用いて詳細に説明する。
【0017】
〈第一の発明の原理〉
現在広く用いられているMPEG−1(ISO/IEC11172−2),MPEG−2(ISO/IEC13818−2),MPEG−4(ISO/IEC14496−2)等のフレーム間動き補償を用いる高能率ビデオ符号化技術においては、他から参照されない独立符号化フレーム(Iフレーム)、他を参照して符号化するフレーム(Pフレーム)、I,Pフレームを参照するが自身はどこからも参照されないフレーム(Bフレーム)が存在する。
【0018】
ここでI,B,Pフレームの3フレームが順に並ぶ最も単純な画像シーケンスの符号化について考察する。IフレームはP,Bフレームに参照されるため、この画品質がそれらの符号量に影響を及ぼすこと、PフレームはBフレームに参照されるため、その符号量に影響を及ぼすことを考慮すると、総符号量Rは
R=RI+RP(RI)+RB(RP(RI),RI) …(3)
と書かれる。ここでRI、RB,RPはそれぞれIフレーム、Bフレーム、Pフレームの符号量である。同様の理由から、総誤差Dは
D=DI(RI)+DP(RP,RI)+DB(RB,RP,RI) …(4)
の様に書ける。ここでDI,DB,DPはそれぞれIフレーム、Bフレーム、Pフレームの誤差である。ラグランジュの未定乗数をλとすると、評価規準は
J=D+λ(R−Rtot) …(5)
と書かれる。ここでRtotは目標とする総符号量である。ラグランジュ法では、この最小化は
【0019】
【数1】

Figure 0003854472
【0020】
という連立方程式に帰着される。最初の3式は
【0021】
【数2】
Figure 0003854472
【0022】
となる。ここで
【0023】
【数3】
Figure 0003854472
【0024】
とおくと、Bフレームについて、式(7)より
B=λ …(11)
が成り立つ。
【0025】
またPフレームについて、RPが増加するとPフレームの画品質が上がり、結果としてPフレームを参照するBフレームは符号化が楽になりDBとRBは減少することから、
【0026】
【数4】
Figure 0003854472
【0027】
が成り立つ。これらを式(8)に代入し
【0028】
【数5】
Figure 0003854472
【0029】
となる。
【0030】
同様にIフレームについて、RIが増加するとIフレームの画品質が上がり、結果としてIフレームを参照するP,Bフレームは符号化が楽になりDP,RP,DB,RBが減少することから、
【0031】
【数6】
Figure 0003854472
【0032】
が成り立ち、これらを式(9)に代入し
【0033】
【数7】
Figure 0003854472
【0034】
を得る。
【0035】
各フレームにおいて、D(R)のグラフは一般に下に凸であるので、−∂D/∂Rが局所未定乗数Tに等しくなる点は、局所評価規準D+TRが最小になる点と一致する。従って、TI,TB,TPを局所未定乗数、λを大域未定乗数とすると、
I<λ、TP<λおよびTB=λ …(16)
を保ちながらJ=D+λRを最小化するよう(TI,TP,TB)を探索すればよい。この方法により、(TI,TP、TB)について何の先験的知識もなく最適化サイクルを繰り返すよりも、高速で効率的な最適化が可能になる。
【0036】
上記は3フレームの最も単純な場合を考えたが、一般の長さを持つビデオクリップをフレーム単位でMPEG方式にて最適化する場合へ、この考え方を応用すると、手順は以下のようになる。
【0037】
1.フレーム数と同じ長さの局所未定乗数表(TI1,TP1,TB1,TB2,TP2,…)を初期化する。この表においては、最適化サイクルの途中、TIx<λ、TPx<λ、TBx=λが常に保たれていなければならない。
【0038】
2.ビデオクリップをフレーム毎に最適化する。最小符号化単位(MPEGの場合マクロブロックと呼ぶ)の各々について、離散的に様々な値を取りうる(MPEGの場合31通り)量子化ステップの全てあるいは一部の値で符号化を試行し、最小の局所評価規準D+TRを与える量子化ステップを採用する。D,Rはそれぞれ、該マクロブロックを該量子化ステップで符号化した際の符号量および復号誤差であり、Tは該フレームの局所未定乗数である。
【0039】
3.全フレームの符号化が終了後、大域評価規準J=D+λRを最小化すべく局所未定乗数表を更新する。これは例えば、一般に用いられる多次元最適化アルゴリズムに基づき行う。もし収束したと判定されたら終了し、さもなくば2から繰り返す。
【0040】
局所未定乗数に関する拘束条件(式(16))の正当性を確かめるために、ある画像について、0.0003〜0.0012の範囲内の大域未定乗数λを数種類用い、拘束条件を用いずに最適化を行った結果を図1に示す。ここで第1フレームがIフレーム、第2,3,5,6,8,9,11,12フレームがBフレーム、第4,7,10,13フレームがPフレームである。式(16)の通り、Bピクチャに対する局所未定乗数が大域未定乗数に等しく、かつI,Pピクチャに対する局所未定乗数が大域未定乗数より小さくなっていることが確認できる。
【0041】
なお、ビデオクリップが長大となると、変化しうる局所未定乗数の数も増え、最適化サイクルにおける探索空間が指数的に増大するが、MPEGにおいてはGOP(Group of Picture)構造、すなわちビデオクリップを1枚のIフレームおよび後続の複数のB,Pフレームから成るグループ構造を単位とする構造毎の符号化を行う。従って、GOP末尾のBフレーム群(もし、あれば)を除き、GOP間は独立であるため、最適化もGOP単位に独立に行ってよい。
【0042】
〈第二の発明の原理〉
図1の各グラフを、対応する大域未定乗数で除することにより正規化したグラフを図2に示す。この図においてグラフは互いにほぼ重なりあっている。つまり、最適な局所未定乗数の値は、大域未定乗数と比例関係にあることがわかる。
【0043】
また、DとRの間には反比例の関係D∝R-1があることが実験的、統計的に示されている(S.Takamura, H.Watanabe and N.Kobayashi:“One−pass VBR algorithm foran MPEG−2 encoder chip SuperENC,”Picture Coding Symposium Japan,PP.39−40,Sep.1999.)。従って、∂D/∂R∝R-2となり、これに∂D/∂R=−λを代入すると、以下のような逆二乗関係が成り立つことが予想される。
【0044】
λ∝R-2 …(17)
これを確かめるために、数種の画像について、0.0003〜0.0012の範囲内の大域未定乗数λを数種類用い、最適化サイクルを行った後のビット量Rとλとの関係を図3の点群としてプロットした。また、これらの点群を曲線λ=kR-2により最小二乗あてはめしたものを、同図の曲線として示す。点群に曲線がよくあてはまっていることから、実際にλ−Rの逆二乗関係が成り立つことが確認できる。
【0045】
以上の事実を用いれば、あるλについてひとたび最適な局所未定乗数表が得られれば、任意のλに対しても、この未定乗数表を定数倍することで、最適化サイクルを行うことなしに、最適な局所未定乗数表を得ることができる。具体的に、発生符号量を目標量(Rtgt)に近づける手順を記述すると、以下のようになる。
【0046】
1.ある与えられたλに基づき、ビデオクリップを上記第一の発明の最適化方法で符号化する。
【0047】
2.得られた符号量をRとする。もしRがRtgtに十分近ければ終了する。さもなければ次へ進む。
【0048】
3.式(17)に基づき、局所未定乗数表の各未定乗数をR2/Rtgt 2倍し、その表を用いて再度符号化を行う。その際、最適化のための繰り返しは不要である。符号化の後は2へ戻る。
【0049】
実際のビデオクリップについて、第二の発明を用いた最適符号化・符号量制御を行った結果を以下に示す。目標ビットレートは4Mbit/sと設定している。ここの例では1%以内の精度を達成するのには2回の試行で十分であることがわかる。
【0050】
画像A
1回目=5.80Mbit/s→4.04Mbit/s(終了)
画像B
1回目=5.11Mbit/s→3.86Mbit/s
2回目=3.86Mbit/s→4.01Mbit/s(終了)
〈第一の発明の実施の形態〉
本発明による第一の発明の実施の形態について図4を参照して説明する。図4は、本実施形態例における処理の流れとともに処理部構成すなわち装置構成を示している。各処理部は、本発明の手段を構成する全部もしくは一部である。
【0051】
始めに、処理開始後、局所未定乗数表初期化部101において局所未定乗数表記憶部102の局所未定乗数表(以下、局所未定乗数表を102と呼ぶ)を初期化する。この局所未定乗数表102においては、最適化サイクルの途中、TIx<λ,TPx<λ,TBx=λが常に保たれていなければならない。したがって、局所未定乗数表初期化部101は、TIx<λ,TPx<λ,TBx=λとなるように局所未定乗数表102の初期化を行う。
【0052】
続いて、フレーム符号化部120にて符号化を行う。まず、局所未定乗数取得部103において符号化フレームを順に選択後、未定乗数表102より該当フレームの局所未定乗数Tを取得し、マクロブロック選択部104において該当フレームのマクロブロックを順に選択する。次に、量子化ステップ選択部105において、取り得る量子化ステップを順に全て発生させる。次に、符号化誤差・符号量取得部106において符号化を行った結果生じる誤差D′および符号量R′を取得し、局所価値基準算出部107において局所評価基準D′+TR′を算出する。次に、最小判定部108においてこの局所評価規準が該マクロブロックにおいて最小であるかどうかを判断し、最小であれば量子化ステップ記憶部109において該量子化ステップを変数Qに記憶する。次に、全量子化判定部110にて取り得る量子化ステップを全て試行したと判断されなければ、量子化ステップ選択部105へ戻り再度別の量子化ステップを試行する。量子化ステップを全て試行したと判断されれば、マクロブロック符号化部111にて、記憶した量子化ステップQで符号化を行う。次いで全マクロブロック判定部112にて該フレームの全マクロブロックについて符号化が完了したかどうかを判定し、未だであればマクロブロック選択部104へ戻り、次マクロブロックの処理を行う。完了していれば、全フレーム判定部113にて、全フレームの処理が完了したかを判定し、未だであれば局所未定乗数取得部103へ戻り次フレームの処理を行う。
【0053】
全フレームの符号化処理が終了すると、総符号化誤差・総符号量取得部114ではビデオシーケンス全体での総符号誤差D、総符号量Rを取得し、大域評価基準算出部115にて大域評価基準D+λRを算出する。次に、収束判定部116では、この大域評価規準が収束したかどうかを判定し、まだ判定していないと判断すれば117の未定乗数表修正部へ進む。ここでは大域未定乗数による大域評価基準を最小化するよう、パラメータ(この場合102の局所未定乗数表)を調整するものである。ここで、未定乗数表修正部117は、TIx<λ,TPx<λ,TBx=λとなるように局所未定乗数表102の調整(修正)を行う。その後、局所未定乗数取得部103から再度ビデオシーケンス全体での符号化を繰り返す。収束判定部116で収束したと判定されれば、処理を終了する。
【0054】
〈第二の発明の実施の形態〉
本発明による第二の発明の実施の形態について図5を参照して説明する。図5は、本実施形態例における処理の流れとともに処理部構成すなわち装置構成を示している。各処理部は、本発明の手段を構成する全部もしくは一部である。
【0055】
始めに、開始後、ビデオシーケンス全体をビデオクリップ最適化部201にて一度最適化を行う。これは、第一の発明の実施の形態におけるビデオクリップ最適化と同じ処理である。その結果得られた局所未定乗数表を局所未定乗数表記憶部202(以下、局所未定乗数表を202と呼ぶ)に保存する。
【0056】
続いて、符号量取得部203にてビデオシーケンス全体の符号量Rを取得する。次に、R・Rtgt比較部204においてRとRtgtを比較し、差が十分に小さいと判定されたら終了する。さもなくば、局所未定乗数表更新部205において、局所未定乗数表202の各値を全てR2/Rtgt 2倍する。
【0057】
次いで、206のフレーム符号化部(これは第一の発明の実施形態例において示した、フレーム符号化部120と同一である)において、符号化を行う。ここで最適化のための繰り返しは不要である(但しマクロブロック単位の、量子化ステップ選択のための繰り返しは行う)。その後、符号量取得部203の処理より繰り返す。
【0058】
なお、図4、図5で示した装置の各処理部の一部もしくは全部での処理、あるいはその処理の流れにおける処理手順をコンピュータのプログラムで構成し、そのプログラムをコンピュータを用いて実行して本発明を実現することができることは言うまでもなく、コンピュータでその処理部を実現するためのプログラム、あるいはコンピュータにその処理手順を実行させるためのプログラムを、そのコンピュータが読み取り可能な記録媒体、例えば、FD(フロッピーディスク(登録商標))や、MO、ROM、メモリカード、CD、DVD、リムーバブルディスクなどに記録して、保存したり、提供したりすることが可能であり、また、そのプログラムをインターネットや電子メール等によりネットワークを通して配布することが可能である。
【0059】
【発明の効果】
以上説明したように、本発明によれば、最適化を行う際に変化させる局所未定乗数の、大域未定乗数との大小関係を考慮しつつ局所未定乗数調整・符号化・大域評価規準評価という最適化サイクルが行えるようになり、結果として最適にならないはずの局所未定乗数を用いて符号化を試行してしまったりする、無駄な処理を避けられるようになる。
【0060】
また、最適化サイクルと符号量制御を両立させる場合、得られた符号量と一回求めた局所未定乗数を元に、目的とする符号量において最適となる局所未定乗数を一撃で生成することができるため、新たに最適化サイクルを繰り返す必要がなくなる。
【図面の簡単な説明】
【図1】様々な大域未定乗数λに対する、最適化後の局所未定乗数表(λ)のグラフ。
【図2】図1のデータを正規化したグラフ。
【図3】大域未定乗数λおよび最適化後のRをプロットし、かつ逆二乗曲線で最小二乗あてはめを行ったグラフ。
【図4】第一の発明の実施の形態によるビデオクリップ最適化符号化の処理の流れと装置構成を示した図。
【図5】第二の発明の実施の形態による最適化時の符号化レート制御の処理の流れと装置構成を示した図。
【符号の説明】
101…局所未定乗数表初期化部
102…局所未定乗数表記憶部(局所未定乗数表)
103…局所未定乗数取得部
104…マクロブロック選択部
105…量子化ステップ選択部
106…符号化誤差・符号量取得部
107…局所価値基準算出部
108…最小判定部
109…量子化ステップ記憶部
110…全量子化判定部
111…マクロブロック符号化部
112…全マクロブロック判定部
113…全フレーム判定部
114…総符号化誤差・総符号量取得部
115…大域評価基準算出部
116…収束判定部
117…未定乗数表修正部
120…フレーム符号化部
201…ビデオクリップ最適化部
202…局所未定乗数表記憶部(局所未定乗数表)
203…符号量取得部
204…R・Rtgt比較部
205…局所未定乗数表更新部
206…フレーム符号化部[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a high-efficiency repetitive image signal encoding method and apparatus with reduced processing time.
[0002]
[Prior art]
In a video coding method that allows a plurality of coding trials for the same image sequence to improve coding efficiency in terms of code amount versus noise amount, the evaluation of coding efficiency is based on “Lagrange” established in the 18th century. The undetermined multiplier method is applied.
[0003]
In this method, the total code amount R and the total error D at the time of sequence encoding with respect to an undetermined multiplier λ given from outside (this measure may be the sum of squares of errors or the sum of absolute values of errors depending on the situation). From global evaluation criteria J = R + λD (1)
Is obtained every time encoding is performed, and optimization search (parameter adjustment) is performed while repeating the encoding so that J is minimized.
[0004]
In this parameter adjustment, local undetermined multipliers are determined for each frame or smaller coding unit, and local undetermined multipliers, code amounts, and errors are set to λ ′, R ′, and D ′, respectively. Standard J ′ = R ′ + λ′D ′ (2)
The method of localizing the processing to minimize the global evaluation criterion J and minimizing the global evaluation criterion J is used.
[0005]
[Problems to be solved by the invention]
However, in the above conventional technique, when performing optimization corresponding to a given global undetermined multiplier, the local undetermined multiplier is changed, and the optimization cycle of multiplier adjustment / encoding / J evaluation is repeated to perform optimization. However, when determining this local undetermined multiplier, it is unclear how the value is related to the global undetermined multiplier, and as a result, encoding is attempted using a local undetermined multiplier that should not be optimal. We were processing.
[0006]
In addition, code amount control is required when there is a restriction such that “the total amount of code is within a few bytes as a result of encoding with optimization”. When the Lagrange global evaluation criterion J is minimized, there is no guarantee that the desired code amount is obtained. Therefore, the global undetermined multiplier λ is adjusted again and the optimization cycle is repeated. At that time, the processing time was further increased because new optimization was performed without using the local undetermined multiplier obtained in the previous optimization cycle.
[0007]
A first object of the present invention is to optimize a highly efficient repetitive image signal encoding method and apparatus without making useless encoding trials by determining a value of a local undetermined multiplier based on a reference relationship between encoding units. The purpose is to reduce the amount of calculation for the cycle.
[0008]
A second problem of the present invention is to provide a highly efficient repetitive image signal encoding method and apparatus that uses a known statistical relationship between a code amount and an undetermined multiplier to efficiently code using a local undetermined multiplier obtained once. The amount is close to the target value.
[0009]
[Means for Solving the Problems]
The repetitive image signal encoding method according to the first invention for solving the first problem includes encoding by inter-frame motion compensation, and based on an evaluation of an undetermined multiplier by Lagrange's undetermined multiplier method. In the image signal encoding method for optimizing the entire image sequence by encoding the same image sequence a plurality of times in order to optimize the relationship, a local undetermined multiplier corresponding to each encoding unit is initialized. The image sequence is determined by changing the quantization step for each procedure and the coding unit, and determining the quantization step based on the evaluation of the obtained local undetermined multiplier so that the relationship between the code amount and the noise amount is optimized. The second procedure for encoding the entire image and the global undetermined multiplier corresponding to the entire image sequence are evaluated each time the entire image sequence is encoded. A third procedure that repeats the second procedure by correcting the local undetermined multiplier until the relationship of the noise amount is optimized. In the first procedure, the first procedure is performed during the initialization. In the third procedure, at the time of the correction, the local undetermined multiplier of the coding unit referred to for motion compensation from other coding units is made smaller than the global undetermined multiplier, and is not referenced for motion compensation from other coding units. The global undetermined multiplier and the local undetermined multiplier are determined so that the local undetermined multiplier of the encoding unit is equal to the global undetermined multiplier.
[0010]
In addition, the iterative image signal encoding apparatus according to the first invention performs encoding by inter-frame motion compensation, and optimizes the relationship between the amount of code and the amount of noise based on the evaluation of the undetermined multiplier according to the Lagrange undetermined multiplier method In an image signal encoding apparatus for optimizing an entire image sequence by encoding the same image sequence a plurality of times, first means for initializing a local undetermined multiplier corresponding to each encoding unit, and the encoding A second step of encoding the entire image sequence by changing the quantization step for each unit and determining the quantization step based on the evaluation of the obtained local undetermined multiplier so that the relationship between the code amount and the noise amount is optimized. Each time the entire image sequence is encoded, the global undetermined multiplier corresponding to the entire image sequence is evaluated, and the relationship between the code amount and the noise amount is optimized. And a third means for repeatedly performing the encoding by the second means until the local undetermined multiplier is corrected, and the first means at the time of initialization, the third means At this time, the local undetermined multiplier of the coding unit referred to for motion compensation from the other coding unit is made smaller than the global undetermined multiplier, and the local undetermined multiplier of the coding unit not referenced for motion compensation from the other coding unit is changed. A means for determining a global undetermined multiplier and a local undetermined multiplier so as to be equal to the global undetermined multiplier is provided.
[0011]
The repetitive image signal encoding method according to the second invention for solving the second problem includes a fourth procedure for performing encoding by the repetitive image signal encoding method of the first invention, and the fourth procedure. Compare the generated code amount and the target code amount by the encoding of the procedure of step 5 and terminate the encoding if it is sufficiently close, otherwise encode the procedure of the next procedure, the code amount and the undetermined multiplier The global undetermined multiplier corresponding to the entire image sequence and the local undetermined multiplier corresponding to each coding unit are changed using the known statistical relationship of the second image signal encoding method according to the first invention. And a sixth procedure for returning to the fifth procedure after encoding by the procedure.
[0012]
The repetitive image signal encoding device according to the second invention is a fourth means for encoding by the repetitive image signal encoding device according to the first invention, and a generated code generated by the encoding of the fourth means. If the amount is close enough to the target code amount, the encoding is terminated, and if not, the fifth means for encoding by the sixth means, and the known statistical relationship between the code amount and the undetermined multiplier The global undetermined multiplier corresponding to the entire image sequence and the local undetermined multiplier corresponding to each encoding unit are changed, and encoding is performed by the second means in the repetitive image signal encoding device according to claim 1. And a sixth means for returning to the processing of the fifth means.
[0013]
The processing procedure in the first and second repetitive image signal encoding methods can be a repetitive image signal encoding program to be executed by a computer. It is possible to record on a computer-readable recording medium.
[0014]
In the first invention according to the present invention, an optimization cycle of local undetermined multiplier adjustment, encoding, and global evaluation criterion evaluation is performed while considering the magnitude relationship between the local undetermined multiplier to be changed when performing optimization and the global undetermined multiplier. As a result, it is possible to avoid useless processing such as trying to encode using a local undetermined multiplier that should not be optimal as a result.
[0015]
In the second invention according to the present invention, when both the optimization cycle and the code amount control are made compatible, based on the obtained code amount and the local undetermined multiplier obtained once, the optimum local code amount is obtained. Generating an undetermined multiplier eliminates the need for a new optimization cycle.
[0016]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, the principle and embodiments of the present invention will be described in detail with reference to the drawings.
[0017]
<Principle of the first invention>
High-efficiency video codes using inter-frame motion compensation such as MPEG-1 (ISO / IEC11172-2), MPEG-2 (ISO / IEC13818-2), MPEG-4 (ISO / IEC14496-2), etc. that are currently widely used In the coding technology, an independent coding frame (I frame) that is not referred to by others, a frame that is coded with reference to others (P frame), a frame that refers to I and P frames but is not referenced from anywhere (B frame) ) Exists.
[0018]
Here, the encoding of the simplest image sequence in which three frames of I, B, and P frames are arranged in order will be considered. Since I frame is referenced to P and B frames, considering that this picture quality affects their code amount, and because P frame is referenced to B frame, it affects its code amount. The total code amount R is R = R I + R P (R I ) + R B (R P (R I ), R I ) (3)
It is written. Here, R I , R B , and R P are the code amounts of the I frame, the B frame, and the P frame, respectively. For the same reason, the total error D is D = D I (R I ) + D P (R P , R I ) + D B (R B , R P , R I ) (4)
It can be written as Here, D I , D B , and D P are errors of the I frame, the B frame, and the P frame, respectively. When Lagrange's undetermined multiplier is λ, the evaluation criterion is J = D + λ (R−R tot ) (5)
It is written. Here, R tot is a target total code amount. In the Lagrange method, this minimization is
[Expression 1]
Figure 0003854472
[0020]
It is reduced to the simultaneous equations. The first three formulas are [0021]
[Expression 2]
Figure 0003854472
[0022]
It becomes. Where [0023]
[Equation 3]
Figure 0003854472
[0024]
Then, for the B frame, T B = λ (11) from Equation (7).
Holds.
[0025]
As for P frame, when R P increases, the image quality of P frame increases, and as a result, B frame referring to P frame becomes easier to encode and D B and R B decrease.
[0026]
[Expression 4]
Figure 0003854472
[0027]
Holds. Substituting these into equation (8)
[Equation 5]
Figure 0003854472
[0029]
It becomes.
[0030]
Similarly, with respect to the I frame, when R I increases, the image quality of the I frame increases, and as a result, the P and B frames that refer to the I frame become easier to encode and D P , R P , D B , and R B decrease. From that
[0031]
[Formula 6]
Figure 0003854472
[0032]
Substituting these into equation (9)
[Expression 7]
Figure 0003854472
[0034]
Get.
[0035]
Since the graph of D (R) is generally convex downward in each frame, the point where −∂D / ∂R is equal to the local undetermined multiplier T coincides with the point where the local evaluation criterion D + TR is minimized. Therefore, if T I , T B and T P are local undetermined multipliers and λ is a global undetermined multiplier,
T I <λ, T P <λ and T B = λ (16)
(T I , T P , T B ) may be searched so as to minimize J = D + λR while maintaining. This method allows faster and more efficient optimization than repeating the optimization cycle without any prior knowledge of (T I , T P , T B ).
[0036]
The above has considered the simplest case of 3 frames. However, when this idea is applied to the case where a video clip having a general length is optimized by the MPEG method in units of frames, the procedure is as follows.
[0037]
1. A local undetermined multiplier table (T I1 , T P1 , T B1 , T B2 , T P2 ,...) Having the same length as the number of frames is initialized. In this table, T Ix <λ, T Px <λ, and T Bx = λ must always be maintained during the optimization cycle.
[0038]
2. Optimize video clips frame by frame. For each minimum coding unit (referred to as a macroblock in the case of MPEG), the coding is attempted with all or some of the quantization steps that can take various values discretely (31 in the case of MPEG), A quantization step that gives the smallest local criterion D + TR is adopted. D and R are a code amount and a decoding error when the macroblock is encoded in the quantization step, and T is a local undetermined multiplier of the frame.
[0039]
3. After all the frames are encoded, the local undetermined multiplier table is updated to minimize the global evaluation criterion J = D + λR. This is done, for example, based on a commonly used multidimensional optimization algorithm. If it is determined that it has converged, the process ends. Otherwise, the process is repeated from 2.
[0040]
In order to confirm the validity of the constraint condition regarding the local undetermined multiplier (equation (16)), several types of global undetermined multipliers λ within the range of 0.0003 to 0.0012 are used for a certain image, and it is optimal without using the constraint condition. The result of the conversion is shown in FIG. Here, the first frame is an I frame, the second, third, fifth, sixth, eighth, ninth, eleventh and twelfth frames are B frames, and the fourth, seventh, tenth and thirteenth frames are P frames. As shown in equation (16), it can be confirmed that the local undetermined multiplier for the B picture is equal to the global undetermined multiplier, and that the local undetermined multiplier for the I and P pictures is smaller than the global undetermined multiplier.
[0041]
When the video clip becomes long, the number of local undetermined multipliers that can be changed increases, and the search space in the optimization cycle increases exponentially. In MPEG, a GOP (Group of Picture) structure, that is, a video clip is 1 Coding for each structure is performed with a group structure consisting of one I frame and a plurality of subsequent B and P frames as a unit. Accordingly, since the GOPs are independent except for the B frame group at the end of the GOP (if any), the optimization may be performed independently for each GOP.
[0042]
<Principle of the second invention>
FIG. 2 shows a graph normalized by dividing each graph of FIG. 1 by the corresponding global undetermined multiplier. In this figure, the graphs almost overlap each other. That is, it can be seen that the optimal local undetermined multiplier value is proportional to the global undetermined multiplier.
[0043]
It has also been experimentally and statistically shown that there is an inversely proportional relationship D∝R −1 between D and R (S. Takamura, H. Watanabe and N. Kobayashi: “One-pass VBR algorithm”. foran MPEG-2 encoder chip SuperENC, “Picture Coding Symposium Japan, PP. 39-40, Sep. 1999.). Accordingly, ∂D / ∂R∝R -2 is obtained , and if ∂D / ∂R = −λ is substituted for this, it is expected that the following inverse square relationship is established.
[0044]
λ∝R -2 (17)
In order to confirm this, for several types of images, several types of global undetermined multipliers λ within the range of 0.0003 to 0.0012 are used, and the relationship between the bit amount R and λ after performing the optimization cycle is shown in FIG. It was plotted as a point cloud. In addition, the least squares fitted to these point groups by a curve λ = kR −2 is shown as a curve in FIG. Since the curve is well fitted to the point group, it can be confirmed that the inverse square relation of λ-R is actually established.
[0045]
Using the above facts, once an optimal local undetermined multiplier table is obtained for a certain λ, by multiplying this undetermined multiplier table by a constant for any λ without performing an optimization cycle, An optimal local undetermined multiplier table can be obtained. Specifically, the procedure for bringing the generated code amount close to the target amount (R tgt ) is described as follows.
[0046]
1. Based on a given λ, the video clip is encoded by the optimization method of the first invention.
[0047]
2. Let R be the obtained code amount. If R is close enough to R tgt , end. Otherwise proceed to the next.
[0048]
3. Based on Equation (17), each undetermined multiplier in the local undetermined multiplier table is multiplied by R 2 / R tgt 2 and encoding is performed again using that table. At this time, iterative optimization is not necessary. Return to 2 after encoding.
[0049]
The results of performing optimum encoding / code amount control using the second invention for an actual video clip are shown below. The target bit rate is set to 4 Mbit / s. In this example, it can be seen that two trials are sufficient to achieve an accuracy within 1%.
[0050]
Image A
1st time = 5.80 Mbit / s → 4.04 Mbit / s (end)
Image B
1st time = 5.11 Mbit / s → 3.86 Mbit / s
Second time = 3.86 Mbit / s → 4.01 Mbit / s (end)
<Embodiment of the first invention>
An embodiment of the first invention according to the present invention will be described with reference to FIG. FIG. 4 shows a processing unit configuration, that is, a device configuration, along with a processing flow in this embodiment. Each processing unit is all or part of the means of the present invention.
[0051]
First, after the processing starts, the local undetermined multiplier table initialization unit 101 initializes a local undetermined multiplier table in the local undetermined multiplier table storage unit 102 (hereinafter, the local undetermined multiplier table is referred to as 102). In the local undetermined multiplier table 102, T Ix <λ, T Px <λ, and T Bx = λ must always be maintained during the optimization cycle. Therefore, the local undetermined multiplier table initialization unit 101 initializes the local undetermined multiplier table 102 so that T Ix <λ, T Px <λ, and T Bx = λ.
[0052]
Subsequently, the frame encoding unit 120 performs encoding. First, the local undetermined multiplier acquisition unit 103 sequentially selects the encoded frames, then acquires the local undetermined multiplier T of the corresponding frame from the undetermined multiplier table 102, and the macroblock selection unit 104 selects the macroblock of the corresponding frame in order. Next, the quantization step selection unit 105 sequentially generates all possible quantization steps. Next, an error D ′ and a code amount R ′ generated as a result of encoding in the encoding error / code amount acquisition unit 106 are acquired, and a local evaluation criterion D ′ + TR ′ is calculated in the local value criterion calculation unit 107. Next, the minimum determination unit 108 determines whether or not the local evaluation criterion is the minimum in the macroblock. If it is the minimum, the quantization step storage unit 109 stores the quantization step in the variable Q. Next, if it is not determined that all the quantization steps that can be taken by the all quantization determination unit 110 have been tried, the process returns to the quantization step selection unit 105 and tries another quantization step again. If it is determined that all quantization steps have been tried, the macroblock encoding unit 111 performs encoding using the stored quantization step Q. Next, the entire macroblock determining unit 112 determines whether or not the encoding has been completed for all the macroblocks of the frame. If not, the process returns to the macroblock selecting unit 104 to process the next macroblock. If completed, the all-frame determining unit 113 determines whether all the frames have been processed. If not, the process returns to the local undetermined multiplier acquiring unit 103 to process the next frame.
[0053]
When the encoding process for all frames is completed, the total coding error / total code amount acquisition unit 114 acquires the total code error D and the total code amount R in the entire video sequence, and the global evaluation criterion calculation unit 115 performs global evaluation. A reference D + λR is calculated. Next, the convergence determination unit 116 determines whether or not the global evaluation criterion has converged. If it is determined that the global evaluation criterion has not yet been determined, the convergence determination unit 116 proceeds to the undetermined multiplier table correction unit 117. Here, the parameter (in this case, the local undetermined multiplier table of 102) is adjusted so as to minimize the global evaluation criterion based on the global undetermined multiplier. Here, the undetermined multiplier table correction unit 117 adjusts (corrects) the local undetermined multiplier table 102 so that T Ix <λ, T Px <λ, and T Bx = λ. Thereafter, the encoding of the entire video sequence is repeated again from the local undetermined multiplier acquisition unit 103. If the convergence determination unit 116 determines that the convergence has been completed, the process ends.
[0054]
<Embodiment of the second invention>
A second embodiment of the present invention will be described with reference to FIG. FIG. 5 shows a processing unit configuration, that is, a device configuration, along with a processing flow in the present embodiment. Each processing unit is all or part of the means of the present invention.
[0055]
First, after the start, the entire video sequence is optimized once by the video clip optimizing unit 201. This is the same processing as the video clip optimization in the embodiment of the first invention. The local undetermined multiplier table obtained as a result is stored in the local undetermined multiplier table storage unit 202 (hereinafter, the local undetermined multiplier table is referred to as 202).
[0056]
Subsequently, the code amount acquisition unit 203 acquires the code amount R of the entire video sequence. Next, R and R tgt comparison section 204 compares R and R tgt and ends if it is determined that the difference is sufficiently small. Otherwise, the local undetermined multiplier table updating unit 205 multiplies each value of the local undetermined multiplier table 202 by R 2 / R tgt 2 .
[0057]
Next, encoding is performed in 206 frame encoding units (this is the same as the frame encoding unit 120 shown in the first embodiment). Here, the iteration for optimization is not necessary (however, the iteration for selecting the quantization step is performed in units of macroblocks). Thereafter, the processing is repeated from the code amount acquisition unit 203.
[0058]
In addition, the processing procedure in part or all of the processing units of the apparatus shown in FIGS. 4 and 5 or the processing procedure in the processing flow is configured by a computer program, and the program is executed using the computer. Needless to say, the present invention can be realized by a computer-readable recording medium, such as an FD, for realizing a program for realizing the processing unit by a computer or a program for causing a computer to execute the processing procedure. (Floppy disk (registered trademark)), MO, ROM, memory card, CD, DVD, removable disk, etc., and can be stored and provided. It can be distributed over the network by e-mail etc.
[0059]
【The invention's effect】
As described above, according to the present invention, the local undetermined multiplier that is changed when performing the optimization, the local undetermined multiplier adjustment, coding, and global evaluation criterion evaluation while considering the magnitude relationship with the global undetermined multiplier. As a result, it is possible to avoid useless processing such as trying to encode using a local undetermined multiplier that should not be optimal.
[0060]
Also, when making the optimization cycle and code amount control compatible, it is possible to generate a local undetermined multiplier that is optimal for the target code amount in one blow based on the obtained code amount and the local undetermined multiplier obtained once. This eliminates the need for a new optimization cycle.
[Brief description of the drawings]
FIG. 1 is a graph of a local undetermined multiplier table (λ) after optimization for various global undetermined multipliers λ.
FIG. 2 is a graph obtained by normalizing the data of FIG.
FIG. 3 is a graph in which a global undetermined multiplier λ and R after optimization are plotted and a least-squares fit is performed using an inverse square curve.
FIG. 4 is a diagram showing a processing flow and apparatus configuration of video clip optimization encoding according to the embodiment of the first invention.
FIG. 5 is a diagram showing a processing flow and apparatus configuration of coding rate control at the time of optimization according to the embodiment of the second invention.
[Explanation of symbols]
101 ... Local undetermined multiplier table initialization unit 102 ... Local undetermined multiplier table storage unit (local undetermined multiplier table)
103 ... Local undetermined multiplier acquisition unit 104 ... Macro block selection unit 105 ... Quantization step selection unit 106 ... Encoding error / code amount acquisition unit 107 ... Local value criterion calculation unit 108 ... Minimum determination unit 109 ... Quantization step storage unit 110 ... all quantization determination unit 111 ... macroblock encoding unit 112 ... all macroblock determination unit 113 ... all frame determination unit 114 ... total coding error / total code amount acquisition unit 115 ... global evaluation criterion calculation unit 116 ... convergence determination unit 117: Undetermined multiplier table correction unit 120 ... Frame encoding unit 201 ... Video clip optimization unit 202 ... Local undetermined multiplier table storage unit (local undetermined multiplier table)
203 ... Code amount acquisition unit 204 ... R / R tgt comparison unit 205 ... Local undetermined multiplier table update unit 206 ... Frame encoding unit

Claims (6)

フレーム間動き補償により符号化を行い、ラグランジュの未定乗数法による未定乗数に対する評価に基づき符号量対雑音量の関係を最適化するために同一画像シーケンスを複数回符号化することで画像シーケンス全体の最適化を行う画像信号符号化方法において、
符号化単位の各々に対応する局所未定乗数を初期化する第一の手順と、
該符号化単位毎に量子化ステップを変化させ、取得した局所未定乗数に対する評価に基づき符号量対雑音量の関係が最適化されるように量子化ステップを決定して画像シーケンス全体を符号化する第二の手順と、
該画像シーケンス全体の符号化の度に画像シーケンス全体に対応する大域未定乗数に対する評価を行い、符号量対雑音量の関係が最適化されるまで該局所未定乗数を修正して該第二の手順を繰り返し行う第三の手順とを有し、
該第一の手順では該初期化の際に、該第三の手順では該修正の際に、他符号化単位から動き補償のために参照される符号化単位の局所未定乗数を大域未定乗数より小さくし、他符号化単位から動き補償のために参照されない符号化単位の局所未定乗数を大域未定乗数に等しくするように、大域未定乗数および局所未定乗数を決定する
ことを特徴とする繰り返し画像信号符号化方法。
Encoding is performed by inter-frame motion compensation, and the same image sequence is encoded multiple times in order to optimize the relationship between code amount and noise amount based on the evaluation of the undetermined multiplier by Lagrange's undetermined multiplier method. In an image signal encoding method for performing optimization,
A first procedure for initializing a local undetermined multiplier corresponding to each of the coding units;
The quantization step is changed for each encoding unit, and the entire image sequence is encoded by determining the quantization step so that the relationship between the code amount and the noise amount is optimized based on the evaluation of the acquired local undetermined multiplier. The second step,
The global undetermined multiplier corresponding to the entire image sequence is evaluated each time the entire image sequence is encoded, and the local undetermined multiplier is corrected until the relationship between the code amount and the noise amount is optimized, and the second procedure is performed. A third step of repeatedly performing
In the first procedure, at the time of initialization, and in the third procedure, at the time of the correction, the local undetermined multiplier of the coding unit referred to for motion compensation from other coding units is determined from the global undetermined multiplier. A repetitive image signal characterized by determining a global undetermined multiplier and a local undetermined multiplier so that the local undetermined multiplier of a coding unit that is not referenced from other coding units for motion compensation is equal to the global undetermined multiplier. Encoding method.
請求項1に記載の繰り返し画像信号符号化方法により符号化を行う第四の手順と、
該第四の手順の符号化による発生符号量と目標符号量とを比較して十分近ければ符号化を終了し、そうでなければ次の手順で符号化を行う第五の手順と、
符号量と未定乗数の既知の統計的関係を用いて、画像シーケンス全体に対応する大域未定乗数および符号化単位各々に対応する局所未定乗数を変更して請求項1に記載の繰り返し画像信号符号化方法における第二の手順により符号化を行った後、該第五の手順に戻る第六の手順とを有する
ことを特徴とする繰り返し画像信号符号化方法。
A fourth procedure for performing encoding by the iterative image signal encoding method according to claim 1;
A fifth procedure for comparing the generated code amount by the encoding of the fourth procedure with the target code amount and ending the encoding if it is sufficiently close, otherwise encoding by the next procedure;
2. The iterative image signal encoding according to claim 1, wherein a global undetermined multiplier corresponding to the entire image sequence and a local undetermined multiplier corresponding to each coding unit are changed using a known statistical relationship between a code amount and an undetermined multiplier. And a sixth procedure for returning to the fifth procedure after encoding by the second procedure in the method.
フレーム間動き補償により符号化を行い、ラグランジュの未定乗数法による未定乗数に対する評価に基づき符号量対雑音量の関係を最適化するために同一画像シーケンスを複数回符号化することで画像シーケンス全体の最適化を行う画像信号符号化装置において、
符号化単位の各々に対応する局所未定乗数を初期化する第一の手段と、
該符号化単位毎に量子化ステップを変化させ、取得した局所未定乗数に対する評価に基づき符号量対雑音量の関係が最適化されるように量子化ステップを決定して画像シーケンス全体を符号化する第二の手段と、
該画像シーケンス全体の符号化の度に画像シーケンス全体に対応する大域未定乗数に対する評価を行い、符号量対雑音量の関係が最適化されるまで該局所未定乗数を修正して該第二の手段による符号化を繰り返し行う第三の手段とを備え、該第一の手段は、該初期化に際して、該第三の手段は、該修正に際して、他符号化単位から動き補償のために参照される符号化単位の局所未定乗数を大域未定乗数より小さくし、他符号化単位から動き補償のために参照されない符号化単位の局所未定乗数を大域未定乗数に等しくするように、大域未定乗数および局所未定乗数を決定する手段を備える
ことを特徴とする繰り返し画像信号符号化装置。
Encoding is performed by inter-frame motion compensation, and the same image sequence is encoded multiple times in order to optimize the relationship between code amount and noise amount based on the evaluation of the undetermined multiplier by Lagrange's undetermined multiplier method. In an image signal encoding device that performs optimization,
A first means for initializing a local undetermined multiplier corresponding to each of the coding units;
The quantization step is changed for each encoding unit, and the entire image sequence is encoded by determining the quantization step so that the relationship between the code amount and the noise amount is optimized based on the evaluation of the acquired local undetermined multiplier. A second means,
Each time the entire image sequence is encoded, the global undetermined multiplier corresponding to the entire image sequence is evaluated, and the local undetermined multiplier is corrected until the relationship between the code amount and the noise amount is optimized, and the second means And the third means is referred to for motion compensation from other coding units during the initialization, the third means during the initialization, and the third means. The global undetermined multiplier and local undetermined multiplier are set so that the local undetermined multiplier of the coding unit is smaller than the global undetermined multiplier, and the local undetermined multiplier of the coding unit that is not referenced for motion compensation from other coding units is equal to the global undetermined multiplier. An iterative image signal encoding device comprising means for determining a multiplier.
請求項1に記載の繰り返し画像信号符号化装置により符号化を行う第四の手段と、
該第四の手段の符号化による発生符号量と目標符号量とを比較して十分近ければ符号化を終了し、そうでなければ第六の手段で符号化を行う第五の手段と、
符号量と未定乗数の既知の統計的関係を用いて、画像シーケンス全体に対応する大域未定乗数および符号化単位各々に対応する局所未定乗数を変更して請求項1に記載の繰り返し画像信号符号化装置における第二の手段により符号化を行った後、該第五の手段の処理に戻る該第六の手段とを備える
ことを特徴とする繰り返し画像信号符号化装置。
A fourth means for performing encoding by the repetitive image signal encoding device according to claim 1;
Comparing the generated code amount by the encoding of the fourth means with the target code amount, and if it is sufficiently close, terminate the encoding; otherwise, the fifth means for encoding by the sixth means;
2. The iterative image signal encoding according to claim 1, wherein a global undetermined multiplier corresponding to the entire image sequence and a local undetermined multiplier corresponding to each coding unit are changed using a known statistical relationship between a code amount and an undetermined multiplier. And a sixth means for returning to the processing of the fifth means after encoding by the second means in the apparatus.
請求項1または2に記載の繰り返し画像信号符号化方法における処理の手順をコンピュータに実行させるためのプログラムとした
ことを特徴とする繰り返し画像信号符号化プログラム。
A repetitive image signal encoding program characterized in that a program for causing a computer to execute the processing procedure in the repetitive image signal encoding method according to claim 1 or 2 is provided.
請求項5に記載の繰り返し画像信号符号化プログラムを、コンピュータが読み取り可能な記録媒体に記録した
ことを特徴とする繰り返し画像信号符号化プログラムの記録媒体。
6. A recording medium for a repetitive image signal encoding program, wherein the repetitive image signal encoding program according to claim 5 is recorded on a computer-readable recording medium.
JP2001125147A 2001-04-24 2001-04-24 Repetitive image signal encoding method and apparatus, repetitive image signal encoding program, and recording medium recording the program Expired - Fee Related JP3854472B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001125147A JP3854472B2 (en) 2001-04-24 2001-04-24 Repetitive image signal encoding method and apparatus, repetitive image signal encoding program, and recording medium recording the program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001125147A JP3854472B2 (en) 2001-04-24 2001-04-24 Repetitive image signal encoding method and apparatus, repetitive image signal encoding program, and recording medium recording the program

Publications (2)

Publication Number Publication Date
JP2002320230A JP2002320230A (en) 2002-10-31
JP3854472B2 true JP3854472B2 (en) 2006-12-06

Family

ID=18974419

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001125147A Expired - Fee Related JP3854472B2 (en) 2001-04-24 2001-04-24 Repetitive image signal encoding method and apparatus, repetitive image signal encoding program, and recording medium recording the program

Country Status (1)

Country Link
JP (1) JP3854472B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100708118B1 (en) 2005-01-07 2007-04-16 삼성전자주식회사 Apparatus for encoding and decoding video based on a plurality of modified multiplication factor table and method thereof, and recording medium storing a program for implementing the method

Also Published As

Publication number Publication date
JP2002320230A (en) 2002-10-31

Similar Documents

Publication Publication Date Title
US8031777B2 (en) Multipass video encoding and rate control using subsampling of frames
KR100974025B1 (en) Two pass rate control techniques for video coding using rate-distortion characteristics
US7158570B2 (en) Motion picture encoding apparatus
US8411742B2 (en) Soft decision and iterative video coding for MPEG and H.264
US8559501B2 (en) Method and apparatus for adaptively determining a bit budget for encoding video pictures
US20100208801A1 (en) Moving picture encoder, decoder, and coding system
US20080232468A1 (en) Method and apparatus for adaptive gop structure determination
US7817723B2 (en) Apparatus and method of optimizing motion estimation parameters for encoding a video signal
KR100960249B1 (en) Two pass rate control techniques for video coding using a min-max approach
US8189682B2 (en) Decoding system and method for error correction with side information and correlation updater
US20100238997A1 (en) Method and system for optimized video coding
US10003799B2 (en) Quality driven video re-encoding
JP2009535983A (en) Robust and efficient compression / decompression providing an adjustable distribution of computational complexity between encoding / compression and decoding / decompression
CN101300850B (en) Determination of coding parameters for a hybrid coding scheme
JPH08322052A (en) Method and apparatus for predicting and coding video information
JP2002010259A (en) Image encoding apparatus and its method and recording medium recording image encoding program
JP2011512047A (en) Method and apparatus for performing lower complexity multi-bitrate video encoding using metadata
US8559519B2 (en) Method and device for video encoding using predicted residuals
US8831089B1 (en) Method and apparatus for selecting optimal video encoding parameter configurations
US8275048B2 (en) Video encoding method and apparatus, video decoding method and apparatus, programs therefor, and storage media for storing the programs
JP3854472B2 (en) Repetitive image signal encoding method and apparatus, repetitive image signal encoding program, and recording medium recording the program
KR101391397B1 (en) code amount control method and apparatus
JP3712344B2 (en) Repetitive video signal encoding method and recording medium recording program of this method
JP2008311824A (en) Image encoding device, and image encoding program
JP2007110672A (en) Encoding method

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060828

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060905

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060908

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090915

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100915

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100915

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110915

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120915

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130915

Year of fee payment: 7

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees