JP2002232882A - 事前解析を用いた動画像符号化装置、動画像符号化方法、及びそのプログラム。 - Google Patents

事前解析を用いた動画像符号化装置、動画像符号化方法、及びそのプログラム。

Info

Publication number
JP2002232882A
JP2002232882A JP2001024322A JP2001024322A JP2002232882A JP 2002232882 A JP2002232882 A JP 2002232882A JP 2001024322 A JP2001024322 A JP 2001024322A JP 2001024322 A JP2001024322 A JP 2001024322A JP 2002232882 A JP2002232882 A JP 2002232882A
Authority
JP
Japan
Prior art keywords
image
encoding
complexity
code amount
amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001024322A
Other languages
English (en)
Other versions
JP4203707B2 (ja
Inventor
Yutaka Yokoyama
裕 横山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2001024322A priority Critical patent/JP4203707B2/ja
Priority to US10/058,298 priority patent/US6963610B2/en
Publication of JP2002232882A publication Critical patent/JP2002232882A/ja
Application granted granted Critical
Publication of JP4203707B2 publication Critical patent/JP4203707B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • H04N19/194Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive involving only two passes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • H04N19/197Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters including determination of the initial value of an encoding parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Algebra (AREA)
  • Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 2パスエンコード又は事前解析により画像の
符号化を行う方法において、符号化用のバッファに適切
な符号量を与えるように制御する。 【解決手段】 入力された画像の符号化を行う前に一定
区間にある画像を予め解析して画像ごとの特徴量を観測
する手段と、前記観測した特徴量に基づいて、画像の複
雑度を推定する手段と、前記推定した複雑度に基づい
て、未符号化の画像を先頭とする一定区間の画像に対し
て符号量の配分を行い、当該区間の全ての画像に対して
画像ごとの目標符号量を算出する手段と、前記画像ごと
の目標符号量を割当てた際の前記区間内での符号化用の
バッファにおけるバッファ占有量の推移を計算し、符号
化用のバッファでオーバーフロー又はアンダーフローを
起こさないよう目標符号量を調整する手段と、前記調整
した目標符号量に応じて未符号化の画像を圧縮符号化す
る手段とを有する。

Description

【発明の詳細な説明】
【0001】
【発明が属する技術分野】本発明は、入力された画像を
符号化する前に、入力された画像を解析し、この解析結
果に基づいて符号化制御を行う動画像符号化装置、動画
像符号化方法、及びそのプログラムに関し、特に固定ビ
ットレートのもとで、符号化用のバッファにより変動す
る発生符号量を平滑化し、一定のレートで符号化データ
を出力する動画像符号化装置、動画像符号化方法、及び
そのプログラムに関する。
【0002】
【従来技術】事前解析を用いた動画像の符号化方法とし
て、特開平10−66067に記載の方法が知られてい
る。
【0003】前記方法は、画像の符号化を行う以前に、
あらかじめ入力された画像の解析を行い、画像ごとの複
雑さの指標を算出した後、全体の複雑さの指標に対する
前記画像の複雑さの比に応じて、目標符号量を計算して
いる。
【0004】動画像符号化装置の構成について説明す
る。
【0005】図25は事前解析を用いた動画像符号化装
置の構成を示す図である。
【0006】図25に示すが如く、動画像符号化装置
は、事前解析手段901、目標符号量設定手段101
0、量子化制御手段1001、動画像符号化手段100
2、及び遅延手段902から構成されている。
【0007】事前解析手段901は、仮符号化あるいは
統計量の抽出により、画像ごとの複雑さの指標が計測さ
れるものである。
【0008】目標符号量設定手段1010は、事前解析
手段901で解析されたある一定区間の全体の複雑さを
示す指標に対する当該画像の複雑さの比に応じて、ある
一定区間の全画像に対して割当て可能な符号量の一定比
率を当該画像に割当てることで、画像の目標符号量を計
算するものである。
【0009】遅延手段902は、入力画像を当該画像の
目標符号量が決まるまで、前記入力画像の本符号化手段
1000への供給を遅延させるものである。
【0010】量子化制御手段1001は、割当てられた
符号量から量子化スケールを算出するものである。
【0011】動画像符号化手段1002は、遅延手段9
02により遅延された画像の符号化した結果生じる符号
量が目標符号量設定手段1010で計算された目標符号
量になるように画像を符号化するものである。
【0012】次に、上記構成の動作について説明する。
【0013】図26は事前解析を用いた動画像符号化装
置の動作を示す図である。
【0014】図26に示すが如く、画像jを符号化する
際、事前解析手段901によりL枚の画像をあらかじめ
解析し、この解析結果に基づいて画像ごとの複雑度を算
出する。そして、目標符号量設定手段1010は、事前
解析手段901で算出された複雑度に基づいて、画像j
だけの目標符号量を計算する。動画像符号化手段100
2は、目標符号量設定手段1010により計算された目
標符号量になるように画像jを符号化する。このよう
に、画像の符号化を行う以前に、画像の解析を行いこの
解析結果により得られた複雑さの指標に応じて画像に符
号量を配分することで、一般的に符号量をあまり必要と
しない画像から符号量を必要とする画像に符号量を割当
てる技術が知られている。
【0015】
【発明が解決しようとする課題】しかしながら、符号量
の割当てによるバッファ占有量の推移についてなんら考
慮されていないため実際の符号化処理の際に、バッファ
でオーバーフローやアンダーフローなどのバッファの破
綻を引き起こす欠点があった。仮に、実際の符号化処理
の際に、バッファの破綻を回避する処理が組み込まれて
いたとしても、画像を符号化する際に発生する符号量が
割当てられた目標符号量から外れたものになり、発生後
の符号量制御が正確にできなくなる。
【0016】更に、バッファの破綻を回避する処理を行
った場合、本来、割当てるべき符号量と異なった符号量
を画像に割当ててしまい、符号化における画質の劣化を
引き起こす欠点があった。
【0017】本発明は上記課題に鑑みて発明されたもの
であって、本発明が解決しようとする課題は、入力画像
を符号化する前に画像の解析を行い、画像ごとの複雑度
を算出し、この複雑度に応じた符号量を一定区間内の画
像に一括して割当て、符号量がバッファに占める占有量
の推移を見積ることでバッファの破綻を回避し、与えら
れたビットレートとバッファサイズとに基づいて適切な
符号配分を行うことにより符号化した画像の画質を向上
させることのできる技術を提供することにある。
【0018】
【課題を解決するための手段】前記の課題は、動画像の
圧縮符号化を行う動画像符号化装置において、一定区間
にある画像を解析して画像ごとの特徴量を観測する手段
と、前記観測された特徴量に基づいて、前記画像の複雑
度を推定する手段と、あらかじめ前記一定区間に対して
符号量を分配し、前記推定された複雑度に基づいて、前
記分配された符号量を前記一定区間内の全ての画像に対
して画像ごとに割当てる目標符号量を算出する手段と、
画像を符号化した結果生じる符号を蓄積するバッファ
と、前記算出された目標符号量を前記画像ごとに割当て
る際、前記バッファにおける前記符号の占有量の推移を
計算し、前記バッファがオーバーフロー又はアンダーフ
ローを起こさないように目標符号量を調整する手段と、
前記調整した目標符号量に応じて前記画像を圧縮符号化
する手段とを有することを特徴とする画像符号化装置に
よって解決される。
【0019】この構成により、推定された複雑度に応じ
た符号量を配分でき、その為符号量をあまり必要としな
い画像から符号量を必要とする画像へ符号量を多く割当
てることができるので、符号が十分に割当てられなかっ
たことによる画質の劣化を軽減できる。又、本符号化の
バッファ破綻処理(オーバーフロー又はアンダーフロー
の回避をするための処理)による発生符号量と目標符号
量との差を少なくでき、符号量の制御が適切にできるよ
うになる。
【0020】前記の課題は、動画像の圧縮符号化を行う
動画像符号化装置において、第1の一定区間にある画像
を解析して画像ごとの特徴量を観測する手段と、前記観
測された特徴量に基づいて、前記画像の複雑度を推定す
る手段と、前記第1の一定区間に続く第2の一定区間内
にある画像の複雑度を予測する手段と、前記第1の一定
区間と前記第2の一定区間と合わせた合成区間に符号量
を分配し、前記推定した複雑度と前記予測した複雑度と
に基づいて、前記分配された符号量を前記合成区間内に
おける全ての画像に対して画像ごとに割当てる目標符号
量を算出する手段と、画像を符号化した結果生じる符号
を蓄積するバッファと、前記算出された目標符号量を前
記画像ごとに割当てる際、前記バッファにおける前記符
号の占有量の推移を計算し、前記バッファがオーバーフ
ロー又はアンダーフローを起こさないように目標符号量
を調整する手段と、前記調整した目標符号量に応じて前
記画像を圧縮符号化する手段とを有することを特徴とす
る画像符号化装置によって解決される。
【0021】この構成により、解析できる期間が、利用
できる符号量が一定と考えられる期間(例えばMPEG
におけるGOP)に満たない場合でも、利用できる符号
量が一定と考えられる期間に対して符号量の割当てを実
行することができ、画像ごとの符号方法の違い(ピクチ
ャタイプの違い)による発生符号量の変動に影響されな
い符号量配分が実現できる。
【0022】特に、前記画像の複雑度を推定する手段
は、解析した画像の統計量に基づいて、画像の複雑度を
推定するよう構成されていることを特徴とする。
【0023】又、前記画像の複雑度を予測する手段は、
解析済みの画像の複雑度に基づいて、画像の複雑度を予
測するよう構成されていることを特徴とする。
【0024】又、前記特徴量を観測する手段は、入力さ
れた画像を所定の符号化方法で符号化する際、画像の符
号化により発生する符号量又は前記発生した符号量と、
使用した量子化スケールの値とを観測するよう構成され
ていることを特徴とする。
【0025】この構成により、画像の特徴量から複雑度
を推定する際の精度を向上させることができ、画像の特
徴に応じた符号量配分が適切にできる。
【0026】又、前記特徴量を観測する手段は、入力さ
れた画像をフレーム内符号化する場合、前記画像のフレ
ーム内の隣接画素間相関を観測し、入力された画像をフ
レーム間予測符号化する場合、前記入力された画像のフ
レーム間予測誤差量を観測するように構成されているこ
とを特徴とする。
【0027】この構成により、事前解析において完全な
符号化処理を実行する必要がなくなる。又、フレーム内
符号化をした画像の複雑度とフレーム内の隣接画素間相
関には相関があることが知られており、フレーム内の隣
接画素間相関を用いて複雑度を推定することが可能であ
る。更に、フレーム間予測符号化をした画像の複雑度と
フレーム間予測誤差には相関があることが知られてお
り、フレーム間予測誤差を用いて複雑度を推定すること
が可能である。そのためこれらの特徴量を利用して複雑
度を推定することで、少ない演算量で複雑度を用いる場
合と同等な性能を得ることができる。
【0028】又、前記動画像符号化装置は、入力された
画像を縮小する手段を有し、前記複雑度を観測する手段
は、入力された画像をフレーム内符号化する場合、前記
入力された画像のフレーム内の隣接画素間相関を観測
し、入力された画像をフレーム間予測符号化する場合、
前記縮小された画像のフレーム間予測誤差量を観測する
ように構成されていることを特徴とする。
【0029】又、前記動画像符号化装置は、入力された
画像を縮小する手段を有し、前記複雑度を観測する手段
は、入力された画像をフレーム内符号化する場合、前記
縮小画像のフレーム内の隣接画素間相関を観測し、入力
された画像をフレーム間予測符号化する場合、前記入力
された画像のフレーム間予測誤差量を観測するように構
成されていることを特徴とする。
【0030】又、前記動画像符号化装置は、入力された
画像を縮小する手段を有し、前記複雑度を観測する手段
は、入力された画像をフレーム内符号化する場合、前記
縮小された画像のフレーム内の隣接画素間相関を観測
し、入力された画像をフレーム間予測符号化する場合、
前記縮小された画像のフレーム間予測誤差量を観測する
ように構成されていることを特徴とする。
【0031】この構成により、扱う画素数が減少し、演
算コスト(演算器の数量、計算量)を削減することがで
きる。
【0032】又、前記複雑度を予測する手段は、ピクチ
ャタイプ別に複雑度の予測を行うように構成されている
ことを特徴とする。
【0033】この構成により、ピクチャタイプ別の発生
符号量の違いを考慮した割当てを行うことができる。
【0034】又、前記一定区間は、MPEG1又はMP
EG2における画像符号化方式を用いて入力された画像
を符号化する際、GOPの区間長を固定にし、GOPの
区間長の整数倍であることを特徴とする。
【0035】又、前記合成区間は、MPEG1又はMP
EG2における画像符号化方式を用いて入力された画像
を符号化する際、GOPの区間長を固定にし、GOPの
区間長の整数倍であることを特徴とする。この構成によ
り、常に一定の符号量を割当てに使うことができる。
【0036】前記の課題は、符号化用のバッファを有す
る装置を用いて、動画像の圧縮符号化を行う動画像符号
化方法において、一定区間にある画像を解析して画像ご
との特徴量を観測するステップと、前記観測された特徴
量に基づいて、前記画像の複雑度を推定するステップ
と、あらかじめ前記一定区間に対して符号量を分配し、
前記推定された複雑度に基づいて、前記分配された符号
量を前記一定区間内の全ての画像に対して画像ごとに割
当てる目標符号量を算出するステップと、前記算出され
た目標符号量を前記画像ごとに割当てる際、前記バッフ
ァにおける符号の占有量の推移を計算し、前記バッファ
がオーバーフロー又はアンダーフローを起こさないよう
に目標符号量を調整するステップと、前記調整した目標
符号量に応じて前記画像を圧縮符号化するステップとを
有することを特徴とする画像符号化方法によって解決さ
れる。
【0037】前記の課題は、符号化用のバッファを有す
る装置を用いて、動画像の圧縮符号化を行う動画像符号
化方法において、第1の所定の区間にある画像を解析し
て画像ごとの特徴量を観測するステップと、前記観測さ
れた特徴量に基づいて、前記画像の複雑度を推定するス
テップと、前記第1の一定区間に続く第2の一定区間に
ある画像の複雑度を予測するステップと、前記第1の一
定区間と前記第2の一定区間とを合わせた合成区間に符
号量を分配し、前記推定した複雑度と前記予測した複雑
度とに基づいて、前記分配された符号量を前記合成区間
内における全ての画像に対して画像ごとに割当てる目標
符号量を算出するステップと、前記算出された目標符号
量を前記画像ごとに割当てる際、前記バッファにおける
符号の占有量の推移を計算し、前記バッファがオーバー
フロー又はアンダーフローを起こさないように目標符号
量を調整するステップと、前記調整した目標符号量に応
じて前記画像を圧縮符号化するステップとを有すること
を特徴とする画像符号化方法によって解決される。
【0038】特に、前記画像の複雑度を推定するステッ
プは、解析した画像の統計量に基づいて、画像の複雑度
を推定することを特徴とする。
【0039】又、前記画像の複雑度を予測するステップ
は、解析済みの画像の複雑度に基づいて、画像の複雑度
を予測することを特徴とする。
【0040】又、前記特徴量を観測するステップは、入
力された画像を所定の符号化方法で符号化する際、符号
化により発生する符号量又は前記発生した符号量と、使
用した量子化スケールの値とを観測することを特徴とす
る。
【0041】又、前記特徴量を観測するステップは、入
力された画像をフレーム内符号化する場合、前記画像の
フレーム内の隣接画素間相関を観測し、入力された画像
をフレーム間予測符号化する場合、前記入力された画像
のフレーム間予測誤差量を観測することを特徴とする。
【0042】又、前記動画像符号化方法は、入力された
画像を縮小するステップを更に有し、前記複雑度を観測
するステップは、入力された画像をフレーム内符号化す
る場合、前記入力された画像のフレーム内の隣接画素間
相関を観測し、入力された画像をフレーム間予測符号化
する場合、前記縮小された画像のフレーム間予測誤差量
を観測することを特徴とする。
【0043】又、前記動画像符号化方法は、入力された
画像を縮小するステップを更に有し、前記複雑度を観測
するステップは、入力された画像をフレーム内符号化す
る場合、前記縮小画像のフレーム内の隣接画素間相関を
観測し、入力された画像をフレーム間予測符号化する場
合、前記入力された画像のフレーム間予測誤差量を観測
することを特徴とする。
【0044】又、前記動画像符号化方法は、入力された
画像を縮小するステップを更に有し、前記複雑度を観測
するステップは、入力された画像をフレーム内符号化す
る場合、前記縮小された画像のフレーム内の隣接画素間
相関を観測し、入力された画像をフレーム間予測符号化
する場合、前記縮小された画像のフレーム間予測誤差量
を観測することを特徴とする。
【0045】又、前記複雑度を予測するステップは、ピ
クチャタイプ別に複雑度の予測を行うことを特徴とす
る。
【0046】又、前記一定区間は、MPEG1又はMP
EG2における画像符号化方式を用いて入力された画像
を符号化する際、GOPの区間長を固定にし、GOPの
区間長の整数倍であることを特徴とする。
【0047】又、前記合成区間は、MPEG1又はMP
EG2における画像符号化方式を用いて入力された画像
を符号化する際、GOPの区間長を固定にし、GOPの
区間長の整数倍であることを特徴とする。
【0048】前記の課題は、動画像の圧縮符号化を行う
画像符号化装置を構成する情報処理装置に、一定区間に
ある画像を解析して画像ごとの特徴量を観測する処理
と、前記観測された特徴量に基づいて、前記画像の複雑
度を推定する処理と、あらかじめ前記一定区間に対して
符号量を分配し、前記推定された複雑度に基づいて、前
記分配された符号量を前記一定区間内の全ての画像に対
して画像ごとに割当てる目標符号量を算出する処理と、
前記算出された目標符号量を前記画像ごとに割当てる
際、バッファにおける符号の占有量の推移を計算し、前
記バッファがオーバーフロー又はアンダーフローを起こ
さないように目標符号量を調整する処理と、前記調整し
た目標符号量に応じて前記画像を圧縮符号化する処理と
を実行させるためのプログラムによって解決される。
【0049】前記の課題は、動画像の圧縮符号化を行う
画像符号化装置を構成する情報処理装置に、第1の一定
区間にある画像を解析して画像ごとの特徴量を観測する
処理と、前記観測された特徴量に基づいて、前記画像の
複雑度を推定する処理と、前記第1の一定区間に続く第
2の一定区間にある画像の複雑度を予測する処理と、前
記第1の一定区間と前記第2の一定区間とを合わせた合
成区間に符号量を分配し、前記推定された複雑度と前記
予測した複雑度とに基づいて、前記分配された符号量を
前記合成区間内における全ての画像に対して画像ごとに
割当てる目標符号量を算出する処理と、前記算出された
目標符号量を前記画像ごとに割当てる際、バッファにお
ける符号の占有量の推移を計算し、前記バッファがオー
バーフロー又はアンダーフローを起こさないように目標
符号量を調整する処理と、前記調整した目標符号量に応
じて前記画像を圧縮符号化する処理とを実行させるため
のプログラムによって解決される。
【0050】
【発明の実施の形態】本発明の第1の実施の形態につい
て説明する。
【0051】尚、本実施の形態では、画像の符号化方式
としてMPEG(Motion Picture Ex
perts Group)1又はMPEG2を想定し、
符号量の割当てを行う区間長はGOP(Group O
f Pictures)単位で行うことを中心として説
明するが、必ずしもGOPを単位としなくとも良い。
【0052】図1は動画像符号化装置のブロック図であ
る。図2、図3は事前解析手段のブロック図である。図
4はオーバーフロー回避処理を説明する為の図である。
図5はアンダーフロー回避処理を説明する為の図であ
る。
【0053】動画像符号化装置は、図1に示すが如く、
事前解析手段10、符号割当て手段20、本符号化手段
30、及び遅延手段40から構成されている。
【0054】事前解析手段10は、動画像特徴量観測手
段101と複雑度計算手段102とから構成され、入力
された画像の模様、動きの状態あるいは符号化したとき
の発生符号量等を解析して画像ごとの特徴量を観測し、
この特徴量から複雑度を算出するものである。
【0055】以下、事前解析手段10の各要素について
説明する。
【0056】動画像特徴量観測手段101は、特徴量と
しての画像の発生符号量と平均量子化スケールとを観測
するものである。例えば、動画像特徴量観測手段101
は、図2に示すが如く、動画像符号化手段103により
構成される。そして、動画像符号化手段103には符号
量制御機能が含まれており、指定のビットレートRに基
づいて、実際にフレームを符号化してフレームjの発生
符号量S[j]と平均量子化スケールQ[j]とを観測す
る。
【0057】複雑度計算手段102では、動画像符号化
手段103で観測された発生符号量と平均量子化スケー
ルとに基づいて複雑度を計算するものである。例えば、
発生符号量をS[j]、平均量子化スケールをQ[j]、複
雑度X[j]とした場合、複雑度X[j]は、 と計算される。
【0058】尚、図3に示すが如く、動画像特徴量観測
手段101を動画像符号化手段104で構成し、固定の
量子化スケールqで画像の符号化を行い、この符号化に
より発生する発生符号量Sq[j]を観測し、複雑度X
[j]を としても良い。
【0059】符号割当て手段20は、初期配分手段20
1、バッファ制約調整手段202から構成され、事前解
析手段10で解析された解析データに基づいて、次に符
号化する画像がある一定区間の画像に対して符号量の割
当てを行うものである。
【0060】以下、符号割当て手段20の各要素につい
て説明する。
【0061】初期配分手段201は、符号量の割当て区
間で使用できる総符号量を画像ごとの複雑度に応じて配
分するものである。例えば、符号量の割当て区間をLフ
レームとし、第jフレームから第j+L−1フレームま
でのフレームに割当てることができる総符号量をRa
[j]とした場合、Ra[j]を複雑度X[j]で比例配分し
た各フレームの目標符号量T[j] は、 と計算される。
【0062】尚、Xsum は割当て区間の複雑度の総
和を示すものである。ここで、目標符号量T[j]は、第
jフレームから第j+L−1フレームまでの各々につい
て計算する。又、総符号量Ra[j]は、フレームLとG
OPとの関係が、(a)符号量の割当て単位がGOP単
位である場合(フレームLがGOPの整数倍である場
合)と(b)符号量の割当て単位がGOP単位でない場
合(フレームLがGOPの整数倍でない場合)とで異な
り、(a)符号量の割当て単位がGOP単位である場合
(フレームLがGOPの整数倍である場合)、Ra[j]
は、 と計算される。尚、Rは本符号化で使用するビットレー
トである。又、バッファ占有量BOC[j]を考慮して、
総符号量を調整することも可能である。例えば、Ra
[j]は、 と計算される。
【0063】(b)符号量の割当て単位がGOP単位で
ない場合(フレームLがGOPの整数倍でない場合)、
Ra[j]は、 と計算さる。ここでSsum は 1GOP内のフレーム
の枚数をNとした場合、直前に符号化したN−L枚のフ
レームにおける発生符号量の総和である。
【0064】そして、Ra[j]はフレームごとに更新す
る。
【0065】バッファ制約調整手段202は、符号量の
初期配分で割当てられた符号量が割当て区間においてバ
ッファの制約に違反しているか否かを判断し、制約に違
反している場合、符号量の割当てを調整するものであ
る。すなわち、バッファ制約調整手段202は、バッフ
ァでオーバーフロー又はアンダーフローが発生しないよ
う符号量の割当てを行うものである。
【0066】以下、具体的に説明する。
【0067】まず、バッファ制約調整手段202は、初
期配分により割当てられた符号量からピクチャごとのバ
ッファ占有量 を計算する。
【0068】ここで Rframeは、本符号化で使う
ビットレートRから計算されるフレームあたりの符号量
である。
【0069】 ここで、バッファ占有量の初期値は0(BOC[0]=
0)とする。
【0070】例えば、符号化バッファの上限をBとした
場合、符号量を割当てる区間の全ての画像で、BOC
[j]がB−Rframe より小さいか否かを判断す
る。そして、BOC[j]がB−Rframeを超えてい
る場合、符号化バッファで符号量の割当てがオーバーフ
ローを引き起こす割当てとなっている為、BOC[j]の
最大jから以前のフレームに対する符号量の割当てを減
少させてオーバーフローが起きないような割当てを行
う。更に、減少らした分の符号量は、それ以降のフレー
ムに加えて再配分する。
【0071】オーバーフロー回避処理について説明す
る。
【0072】図4はオーバーフロー回避処理を説明する
為の図である。
【0073】まず、初期の割当てによるBOCの推移を
計算し、図4(a)に示すが如く、符号の割当てが符号
化バッファでオーバーフローを引き起こす割当てとなっ
ている場合、符号化バッファにおける符号の占有量が最
大となるフレームjoを検出し、フレームjからjoま
での割当て符号量を、図4(b)に示すが如く、joで
符号量が符号化バッファでオーバーフローしなくなるよ
うに割当てを減少させる。そして、減少させた分の符号
量は、jo+1からj+L−1のフレームに割当てる。
更に、BOC[j]が0より大きいか否かを判断し、BO
C[j]が0より小さい場合、符号の割当てが符号化バッ
ファでアンダーフローを引き起こす割当てとなっている
為、BOC[j]の最小jから以前のフレームに対する符
号量の割当てを増加させ、符号化バッファがアンダーフ
ローを起こさないように符号量の割当てを行う。そし
て、増加させた分の符号量は、それ以降のフレームから
差し引いて再配分する。
【0074】アンダーフロー回避処理について説明す
る。
【0075】図5はアンダーフロー回避処理を説明する
為の図である。
【0076】初期の割当てによるBOCの推移を計算
し、図5(a)に示すが如く、符号の割当てが符号化バ
ッファでアンダーフローを引き起こす割当となっている
場合、符号化バッファで符号の占有量が最小となるフレ
ームjuを検出し、フレームjからjuまでに割当てた
符号量を、図5(b)に示すが如く、juで符号化バッ
ファがアンダーフローを起こさなくなるように符号量の
割当てを増加させる。そして、増加させた分の符号量
は、ju+1からj+L−1のフレームに割当てた符号
量から減少させる。
【0077】以後、同様の処理を符号量の割当て区間の
区間内で、符号化バッファがオーバーフロー又はアンダ
ーフローを起きなくなるまで、繰り返し実行する。
【0078】尚、バッファの上限下限の制限については
マージンを用いて調整することも可能である。
【0079】このようにバッファの制約を満たす符号量
の割当てを行い、ピクチャ毎の割当て符号量を調整し、
調整した符号量を新たな割当て符号量T[j]とする。そ
して、この割当て符号量T[j]を目標符号量として本符
号化での符号量制御を行う。
【0080】尚、符号量を制御する情報は割当て符号量
T[j]の他、複雑度X[j]や割当て符号量によるバッフ
ァ占有量BOC[j]なども追加して良い。
【0081】遅延手段40は、入力された画像に対して
計算された目標符号量と当該入力画像とが本符号化手段
30に同時に入力されるようタイミングを計るため、解
析期間長と事前解析手段10と符号割当て手段20の処
理遅延とに応じて入力される画像を遅延させるものであ
る。例えば、事前解析手段10において、符号化する画
像をLフレーム分、予め解析する場合、L枚のフレーム
分以上の遅延が必要となる。
【0082】本符号化手段30は、符号量制御手段30
1と動画像符号化手段302と符号化バッファ303と
から構成され、符号割当て手段29からの情報に基づい
て、遅延手段40で遅延された入力画像を符号化し、符
号化データとして出力するものである。
【0083】以下、各構成要素を説明する。
【0084】符号量制御手段301は、符号割当て手段
20から与えられた情報に基づいて量子化スケールを計
算し、この計算結果を動画像符号化手段302に送信す
る。そして、画像を符号化した後の発生符号量を計測し
て発生符号量と割当てた符号量とに差があるか否かを判
断し、差がある場合、符号量が所定のビットレートに近
づくようにフィードバック制御をかけて符号量を制御す
る。例えば、1フレームを更に細分化した処理単位にし
て目標符号量を分配し、細分化した処理単位ごとの目標
符号量と発生符号量との差分を累算し、符号量の差分の
累積が割当てた符号量を超過しているか否かを判断す
る。そして、符号量の差分の累積が割当てた符号量を超
過している場合、以降の符号化では量子化スケールを大
きくして符号の発生を抑制する。一方、符号量の差分の
累積が割当てた符号量を下回っている場合、以降の符号
化では量子化スケールを小さくして符号の発生を多くす
る。更に、符号量制御手段301は、符号化バッファ3
03のバッファ占有量を監視し、符号化した際に発生す
る符号量が符号化バッファ303でオーバーフロー又は
アンダーフローを起こさないように監視して量子化スケ
ールの調整やスタッフィングなどの制御を行う。例え
ば、符号化バッファ303のオーバーフローを回避する
場合には、量子化スケールを大きくして符号の発生を抑
制し、又は符号化すべき情報をカットして発生符号量を
抑制する。一方、符号化バッファ303のアンダーフロ
ーを回避する場合には、量子化スケールを小さくして符
号の発生量を多くし、又はスタッフィングを行って発生
符号量を増加させる。
【0085】動画像符号化手段302は、入力された画
像を与えられたパラメタに従って符号化処理を行い、圧
縮データを生成するとともに、発生符号量を計測して符
号量制御手段301に通知する。尚、ここで、画像の符
号化処理の方法として、MPEG1ビデオ(ISO/I
EC−11172−2) やMPEG2ビデオ(ISO
/IEC−13818−2)が知られており、これらを
画像の符号化処理の方法として用いることも可能であ
る。
【0086】符号化バッファ303は、動画像符号化手
段302で符号化されたデータを蓄積し、固定のビット
レートで出力するものである。この符号化バッファ30
3により、画像ごとの発生符号量の変動を吸収する。
【0087】上記構成における動作について説明する。
【0088】図6、図7、図8、図9、図10はピクチ
ャ枚数とGOP内に含まれているピクチャ枚数との関係
を説明するための図である。図11、図12、図13は
複雑度の予測について説明するための図である。図14
は本実施の形態の動作を説明するためのフローチャート
である。図15は本実施の形態の動作を説明するための
図である。
【0089】まず、本実施の形態の動作の概略を説明す
る。
【0090】画像を符号化する際の動作として、 (A)事前解析区間のピクチャ枚数Lが1GOP内に含
まれるピクチャ枚数Nと同じ場合 (B)事前解析区間のピクチャ枚数Lが1GOP内に含
まれるピクチャ枚数Nより大きい場合であって整数倍で
ある場合 (C)事前解析区間のピクチャ枚数Lが1GOP内に含
まれるピクチャ枚数Nより小さい場合 (D)事前解析区間のピクチャ枚数Lが1GOP内に含
まれるピクチャ枚数N以上であって整数倍でない場合 とがある。以下、各場合について説明する。
【0091】(A)事前解析区間のピクチャ枚数Lが1
GOP内に含まれるピクチャ枚数Nと同じ場合について
説明する。
【0092】図6に示すが如く、1GOPの画像を符号
化する前に、この1GOPの画像の解析を行い、1GO
P内の画像ごとの複雑度を計算する。そして、計算され
た複雑度から1GOPの目標符号量を計算し、目標符号
量に応じてGOPの画像の符号化を行う。
【0093】(B)事前解析区間のピクチャ枚数Lが1
GOP内に含まれるピクチャ枚数Nより大きい場合であ
って整数倍である場合について説明する。
【0094】例えば、図7はL=2Nの例である。尚、
LはNの整数倍とする。
【0095】2GOPの画像を符号化する前に、2GO
Pの画像の解析を行い、これら2GOP内の画像ごとの
複雑度を計算する。そして、計算した複雑度から2GO
Pに割当てる目標符号量を計算し、この目標符号量に応
じて2GOPの画像の符号化を行う。尚、符号化する区
間は割当て区間より短くてもよい。例えば、図8に示す
が如く、2GOP分の画像を解析し、2GOPの目標符
号量を計算した後、このうち先頭の1GOPであるGO
P[j]のみを符号化する。そして、次のGOPに処理が
進むとGOP[j+2]まで画像の解析が進み、GOP
[j+1]とGOP[j+2]の2GOP分の解析データに
基づいてGOP[j+1]とGOP[j+2]の2GOPの
符号量の割当てを行い、GOP[j+1]の符号化を行
う。
【0096】尚、符号化の区間は割当て区間より短い任
意のフレーム数でもよい。例えば、図9に示すが如く、
1ピクチャ毎に符号化をしてもよく、GOP内のピクチ
ャ枚数をNとし、第jフレームからの符号化処理をする
場合、第j+N−1フレームまでの解析が行われ、この
解析された情報により 第jフレームから第j+N−1
フレームまでの符号の割当てが行われる。そして、第j
フレームに割当てられた目標符号量に応じて符号化す
る。
【0097】(C)事前解析区間のピクチャ枚数Lが1
GOP内に含まれるピクチャ枚数Nより小さい場合につ
いて説明する。
【0098】図10は、事前解析区間のピクチャ枚数L
が1GOP内に含まれるピクチャ枚数Nより小さい場合
である。
【0099】符号の割当てはピクチャタイプ間の変動を
吸収するためGOP単位が望ましいが、GOPサイズに
満たない部分の複雑さの指標は、解析済みの画像から予
測する。例えば、図10に示すが如く、Lピクチャ先の
フレームj+L−1まで解析が済んでおり、第jフレー
ムからの符号化処理をする場合、Nに満たないフレーム
j+Lからフレームj+N−1 までの複雑度を予測す
る。例えば、MPEG1又はMPEG2で使用されてい
るIピクチャ、Pピクチャ及びBピクチャの3種類のピ
クチャを用い、図12中の上側の記号をピクチャタイプ
とフレーム番号を表し、下側の記号をピクチャの複雑度
を表すものとし、図11に示すが如く、GOPのサイズ
Nが15であり、これを割当て区間長Lbとし、、解析
区間長さLが8であり、これがLaとなり、GOPの先
頭がIピクチャで、I又はPピクチャが3ピクチャ毎に
配置され、それ以外のピクチャをBピクチャとし、B0
からB11までが既に解析済である場合、複雑度が計算
されていないB12からP18までの7ピクチャ対応す
る複雑度X'は、ピクチャタイプ別の平均値又は最近の
値を使用して計算され、 X’15 = Xi = X0 X’12 = X’18 = Xp = (X6+X
9)/2 X’13 = X’14 = X’16 = X’17 = Xb = (X4+X5+X7+X8+X10+X
11)/6 となる。
【0100】尚、画像を解析した期間に同じピクチャタ
イプが存在しない場合、最近解析された同じピクチャタ
イプの複雑さをこの場合の指標とする。又、符号化する
区間は、図6に示すが如く、GOPごとでもよく、図1
2に示すが如く、1ピクチャごとでもよく、割当て区間
より短い任意のフレーム数でもよい。
【0101】そして、予測した複雑度に基づいて、GO
Pに割当てる目標符号量を計算し、この目標符号量に応
じてGOPの画像の符号化を行う。
【0102】(D)事前解析区間のピクチャ枚数Lが1
GOP内に含まれるピクチャ枚数N以上であって整数倍
でない場合について説明する。
【0103】図13に示すが如く、kをL/N以上の最
小の整数とし、kNに満たないkN−Lの区間の複雑度
を、既に解析ずみの複雑度から予測し、kNの区間の割
当てを行う。そして、予測した複雑度に基づいて、GO
Pに割当てる目標符号量を計算し、この目標符号量に応
じてGOPの画像の符号化を行う。
【0104】続いて、図14のフローチャートを用いて
説明する。
【0105】尚、動作の説明を容易にする為に、図15
に示すが如く、フレームjの符号化までに入力された画
像(動画像)の解析ができるフレーム数をLaとし、符
号量の割当てを行う区間(以下、割当区間という)にあ
るフレーム数をLbとする。
【0106】動画像特徴量観測手段101は、入力され
た画像のフレーム番号jを−La+1と初期化し(St
epA0)、画像を符号化した場合の発生符号量と平均
量子化スケールとを観測する(StepA1)。
【0107】複雑度計算手段102は、動画像特徴量観
測手段101で観測された画像の発生符号量と量子化ス
ケールとに基づいて複雑度を計算する。例えば、フレー
ムj+La−1の発生符号量をS[j+La−1]、平均
量子化スケールQ[j+La−1]として場合、複雑度X
[j+La−1]は、 と計算される(StepA2) 複雑度計算手段102は、画像の解析できるフレーム数
Laと符号量の割当区間にあるフレーム数Lbとを比較
する(StepA3)。
【0108】フレーム数Lbが画像の解析できるフレー
ム数Laより多い場合(Lb>La)、既に解析されて
いる画像の複雑度から割当区間に満たない部分の複雑度
を計算する。例えば、MPEG1又はMPEG2で使用
されているIピクチャ、Pピクチャ及びBピクチャの3
種類のピクチャを用い、図12中の上側の記号をピクチ
ャタイプとフレーム番号を表し、下側の記号をピクチャ
の複雑度を表すものとし、図12に示すが如く、GOP
のサイズNが15であり、これを割当て区間長Lbと
し、解析区間長さLが8であり、これがLaとなり、G
OPGOPの先頭がIピクチャで、I又はPピクチャが
3ピクチャ毎に配置され、それ以外のピクチャをBピク
チャとし、B0からB11までが既に解析済である場
合、複雑度が計算されていないB12からP18までの
7ピクチャ対応する複雑度X'は、ピクチャタイプ別の
平均値又は最近の値を使用して計算され、 X’15 = Xi = X0 X’12 = X’18 = Xp = (X6+X
9)/2 X’13 = X’14 = X’16 = X’17 = Xb = (X4+X5+X7+X8+X10+X
11)/6 となる。
【0109】尚、画像を解析した期間に同じピクチャタ
イプが存在しない場合、最近解析された同じピクチャタ
イプの複雑さをこの場合の指標とする(StepA
4)。
【0110】一方、符号量の割当区間にあるフレーム数
Lbが画像の解析できるフレーム数La以下である場合
(Lb≦La)、複雑度の予測は不要であるので、次に
進む。
【0111】複雑度計算手段102は、入力されたフレ
ームjがフレーム数Laを満たすか否かを判断する(S
tepA5) 入力された画像のフレーム枚数がフレーム数La未満で
ある場合(すなわち−La+1に初期化された画像のフ
レーム番号jがj<0の場合)、複雑度計算手段102
は、jの値を増やし、次の画像の複雑度を計算する(S
tepA1、A2、A3、A4)。
【0112】一方、入力された画像のフレーム枚数がフ
レーム数Laと同じになった場合(j=0)、複雑度計
算手段102は、フレームjが符号化処理を行う単位区
間Cの倍数であるか否かを判断する(StepA6)。
【0113】フレームjが符号処理を行う単位区間Cの
倍数でない場合、複雑度計算手段102はフレームjの
値を増やし、次の画像の複雑度の計算を行う(Step
A1、A2、A3、A4)。
【0114】一方、フレームjが符号化処理を行う単位
区間Cの整数倍である場合、符号割当て手段20は、符
号量の割当てを割当て区間に行う。
【0115】まず、割当て区間内の総符号量を計算す
る。例えば、符号量の割当て区間をLフレームとし、第
jフレームから第j+L−1フレームまでのフレームに
割当てることができる総符号量をRa[j]とした場合、
総符号量Ra[j]は、フレームLとGOPとの関係が、
(a)符号量の割当て単位がGOP単位である場合(フ
レームLがGOPの整数倍である場合)と(b)符号量
の割当て単位がGOP単位でない場合(フレームLがG
OPの整数倍でない場合)とで異なり、(a)符号量の
割当て単位がGOP単位である場合(フレームLがGO
Pの整数倍である場合)、Ra[j]は、 と計算される。尚、Rは本符号化で使用するビットレー
トである。又、バッファ占有量BOC[j]を考慮して、
総符号量を調整することも可能である。例えば、Ra
[j]は、 と計算される。(b)符号量の割当て単位がGOP単位
でない場合(フレームLがGOPの整数倍でない場合)
と、Ra[j]は、 と計算さる。ここでSsum は 1GOP内のフレーム
の枚数をNとした場合、直前に符号化したN−L枚のフ
レームにおける発生符号量の総和である(StapA
7)。
【0116】次に、符号量割当て手段20は、各フレー
ムの目標符号量を計算する。各フレームの目標符号量T
[j] は、符号量の割当て区間に割当てることができる
総符号量Ra[j]を複雑度X[j]で比例配分し と計算される。尚、Xsum は割当て区間の複雑度の
総和を示すものである。ここで、目標符号量T[j]は、
フレームjからフレームj+L−1までの各々について
計算する(StapA8)。バッファ制約調整手段20
2は、割当てられた目標符号量の符号化バッファにおけ
るバッファ占有量を計算する。例えば、バッファ占有量
をBOCとし場合、バッファ占有量BOCは、 と計算される。ここでRframeは、本符号化で使う
ビットレートRから計算されたフレームあたりの符号量
である。
【0117】 ここで、バッファ占有量の初期値は0(BOC[0]=
0)とする(StepA9)。
【0118】バッファ制約調整手段202は、計算した
バッファ占有量に基づいて、符号化バッファがオーバー
フロー又はアンダーフローを起こすか否かを判断する。
例えば、符号化バッファの上限をBとした場合、バッフ
ァ占有量BOC[j]が B−Rframeより小さいか
否かを判断する(StepA10)。
【0119】符号化バッファがオーバーフローを起こし
て場合、バッファ制約調整手段202は、符号化バッフ
ァがオーバーフローを起こさないように符号量を調節す
る。例えば、図4(a)に示すが如く、符号の割当てが
符号化バッファでオーバーフローを引き起こす割当てと
なっている場合、符号化バッファの符号量の占有量が最
大となるフレームjoを検出し、フレームjからjoま
でに割当てた符号量を、図4(b)に示すが如く、jo
で符号化バッファがオーバーフローを起こさないよう符
号量の割当てを減少させる。そして、減少させた分の符
号量は、jo+1からj+L−1のフレームに割当てる
(StepA11)。
【0120】一方、符号化バッファがアンダーフローを
起こしている場合、バッファ制約調整手段202は、符
号化バッファがアンダーフローを起こさないように符号
量を調節する。例えば、図5(a)に示すが如く、符号
量の割当が符号化バッファでアンダーフローを起こす割
当となっている場合、符号化バッファの符号の占有量が
最小となるフレームjuを検出し、フレームjからju
までに割当てた符号を、図5(b)に示すが如く、ju
で符号化バッファがアンダーフローを起こさないように
割当てを増加させる。そして、増加させた分の符号量
は、ju+1からj+L−1のフレームに割当てた符号
量から減少させる(StepA12)。
【0121】更に、符号化バッファでオーバーフロー又
はアンダーフローのいずれも起こさない割当てとなった
場合、本符号化手段30は、遅延手段40で遅延された
フレームj〜j+c−1の符号化を行う(StepA1
3)。
【0122】尚、符号化処理を行う単位区間Cが1の場
合には、StepA6を省略することができる。La、
Lbが固定値の場合はStepA3を省略し、常にSt
epA4を実行する、あるいは常にStepA4を実行
しない(StepA3、StepA4の両方を省略す
る)こともできる。又、解析区間のフレーム数La、割
当区間にあるフレーム数Lb、符号化区間Cは必ずしも
同じである必要はなく、ここに記載した組み合わせに限
定されるものではない。
【0123】第2の実施の形態について説明する。
【0124】図16は動画像符号化装置のブロック図で
ある。図17は本実施の形態について説明するための図
である。
【0125】第1の実施の形態では、リアルタイムに動
画像を符号化する装置について説明したが、第2の実施
の形態では、図17に示すが如く、シーケンス全体の画
像に対して符号量の分配を行い、更に適切な符号量の割
当てを行う。
【0126】まず、動画像符号化装置の構成について説
明する。尚、第1の実施の形態の動画像符号化装置と同
様な構成については同じ符号を付し、詳細な説明は省略
する。
【0127】図16に示すが如く、動画像符号化装置
は、事前解析手段10、解析データ蓄積手段50、符号
割当て手段20、制御情報蓄積手段60、及び本符号化
手段30から構成されている。
【0128】解析データ蓄積手段50は、事前解析手段
10で解析された画像の解析情報を記憶するものであ
る。
【0129】制御情報蓄積手段60は、符号割当手段2
0からの制御データを記録するものである。
【0130】続いて、上記構成における動作について説
明する。
【0131】尚、本実施の形態では、入力された画像の
シーケンス全体が予め既知であり、フレーム数も有限
で、その数もわかっているものとする。
【0132】事前解析手段10は、図17に示すが如
く、入力された画像全体を一度に解析し、この解析した
情報を解析データとして解析データ蓄積手段50に送信
し、解析データ蓄積手段50は、事前解析手段10から
の解析データを記憶する。そして、符号割当手段20
は、解析データ蓄積手段50に記憶されている解析デー
タと指定されたビットレートと符号化バッファ303の
バッファサイズとに基づいて、符号量の割当てを行い、
入力された画像全体における画像ごとの目標符号量を計
算してこれに基づく制御データを制御情報蓄積手段60
に送信し、制御情報蓄積手段60は、解析データ蓄積手
段50からの制御データを記憶する。更に、本符号化手
段20は、入力された画像と制御情報蓄積手段60に記
憶されている制御データとに基づいて、画像の符号化処
理により圧縮データを生成する。
【0133】第3の実施の形態について説明する。
【0134】図18は事前解析手段10のブロック図で
ある。
【0135】第1の実施の形態及び第2の実施の形態で
は、画像の特徴量として発生符号量を計測したが、本実
施の形態では、フレームの特徴量として仮符号化による
発生符号量を計測する他に、フレームの統計量を計測し
て複雑度に相関のある統計量を利用する。
【0136】動画像符号化装置の構成について説明す
る。尚、第1の実施の形態の動画像符号化装置と同様な
構成については同じ符号を付し、詳細な説明は省略す
る。
【0137】図18に示すが如く、事前解析手段10
は、画素間相関観測手段105、遅延手段41、フレー
ム間予測誤差観測手段106及び複雑度計算手段107
から構成される。
【0138】画素間相関観測手段105は、入力された
画像のフレーム内の 隣接画素間相関値を計算するもの
である。例えば、隣接画素間差分絶対値和Aを計算する
ものである。
【0139】 ここで、I(x,y)は画像の(x,y)位置での画素
値、H,Vは水平,垂直のフレームサイズを表す。
【0140】フレーム間予測誤差観測手段106は、遅
延手段41で遅延させた入力画像を参照画像とし、入力
画像を符号化する際に用いられるフレーム間予測方法に
より予測画像を生成し、入力画像と予測画像との差分を
計算するものである。例えば、次式に示す入力画像と予
測画像との予測誤差の絶対値和Eを計算するものであ
る。
【0141】 ここで、P(x,y)は予測画像の(x,y)位置での
画素値を表す。
【0142】又は、次式に示す予測誤差の2乗和を計算
するものである。
【0143】 尚、遅延手段41は本符号化のための遅延手段40と共
通に使用してもよい。
【0144】複雑度計算手段107は、観測した画像の
特徴量から複雑度を計算するものである。例えば、Iピ
クチャの複雑度をXi、Pピクチャの複雑度をXp、B
ピクチャの複雑度Xbとして場合、計算した特徴量と複
雑度とに相関があることが知られていることから、X
i,Xp,Xbは、 と推定することができる。ここで、a,b,c は複雑
度を推定するためのパラメタであり、これらの値は予め
既知のデータを符号化した結果に基づいて計算して設定
し、上記の式を用いて、フレームjの複雑度X[j]は、
フレームjの特徴量A[j]、E[j]からIピクチャのと
き、 Pピクチャのとき、 Bピクチャのとき、 と計算される。
【0145】続いて、上記構成の動作について説明す
る。
【0146】尚、本実施の形態では、事前解析手段10
の構成のみ異なり、それ以外の構成については第1の実
施の形態と同様であることから事前解析手段10の動作
のみ説明し、他の動作については省略する。
【0147】動画像符号化装置に入力された画像は、画
素間相関観測手段105、遅延手段41及びフレーム間
予測誤差観測手段106に同時に入力され、画素間相関
観測手段105では、入力された画像のフレーム内の
隣接画素間相関を計算する。例えば、次式の示す隣接画
素間差分絶対値和Aを計算する。
【0148】 ここで、I(x,y)は画像の(x,y)位置での画素
値、H,Vは水平,垂直のフレームサイズを表す。
【0149】又、フレーム間予測誤差観測手段106で
は、入力された画像から予測画像を生成し、遅延手段4
1で遅延させた画像を参照画像として入力画像と予測画
像との差分を計算する。例えば、次式に示す入力画像と
予測画像との予測誤差の絶対値和Eを計算する。
【0150】 ここで、P(x,y)は予測画像の(x,y)位置での
画素値を表す。
【0151】又は、次式に示す予測誤差の2乗和を計算
する。
【0152】
【0153】そして、複雑度計算手段107は、画素間
相関観測手段105で計算された隣接画素間差分絶対値
和Aとフレーム間予測誤差観測手段106で計算された
予測誤差の絶対値和Eとに基づいて、複雑度を計算す
る。例えば、Iピクチャの複雑度をXi、Pピクチャの
複雑度をXp、Bピクチャの複雑度Xbとして場合、計
算した特徴量と複雑度とに相関があることが知られてい
ることから、Xi,Xp,Xbは、 と推定することができる。ここで、a,b,c は複雑
度を推定するためのパラメタであり、これらの値は予め
既知のデータを符号化した結果から計算して設定しで
き、上記の式を用いて、フレームjの複雑度X[j]は、
フレームjの特徴量A[j]、E[j]よりIピクチャのと
き、 Pピクチャのとき、 Bピクチャのとき、 と計算される。以後第1の実施の形態と同様の動作によ
って画像の符号化を行う。
【0154】第4の実施の形態について説明する。
【0155】上記の実施の形態では、入力される画像に
対して、特別な処理を施さなかったが、本実施の形態で
は、演算量削減の為に、入力された画像のサイズを縮小
して画素数を削減した上で、第3の実施の形態と同様の
処理を行う。
【0156】まず、動画像符号化装置の構成について説
明する。
【0157】尚、第1の実施の形態及び第3の実施の形
態の動画像符号化装置と同様な構成については同じ符号
を付し、詳細な説明は省略する。
【0158】図19は事前解析手段10のブロック図で
ある。
【0159】図19に示すが如く、事前解析手段10
は、画素間相関観測手段105、遅延手段41、フレー
ム間予測誤差観測手段106、複雑度計算手段107及
び縮小画像生成手段108、109から構成される。
【0160】縮小画像生成手段108、109は、入力
された画像にローパスフィルタをかけ、画素を間引きし
て入力された画像よりサイズの小さい画像を生成するも
のである。
【0161】尚、画素間相関と予測誤差計算で同じサイ
ズの小さい画像を使用する場合には、縮小画像生成手段
108、109をひとつにまとめた構成をとることも可
能である。更に、画像縮小は一方の特徴量だけに適応し
てもよい。例えば、縮小画像生成手段108のみを使
い、縮小画像生成手段109を省き、縮小画像を画素間
相関の計算だけに適用してもよいし、又は縮小画像生成
手段109のみを使い、縮小画像生成手段108を省
き、縮小画像を予測誤差の計算だけに適用してもよい。
【0162】続いて、上記構成の動作について説明す
る。
【0163】尚、本実施の形態は、第3の実施の形態に
おける事前解析手段10に縮小画像生成手段108、1
09のみを加えたものであり、それ以外の構成について
は第1の実施の形態と第3の実施の形態と同様であるこ
とから縮小画像生成手段108、109の動作のみ説明
し、他の動作については省略する。
【0164】縮小画像生成手段108、109は、動画
像符号化装置に入力された画像をローパスフィルタにか
け、画素を間引きして入力された画像よりサイズの小さ
い画像を生成する。そして、縮小画像生成手段108は
生成した縮小画像を画素間相関観測手段105に送信
し、縮小画像生成手段109は生成した縮小画像をフレ
ーム間予測誤差観測手段106に送信する。以後第1の
実施の形態及び第2の実施の形態と同様の動作によって
画像の符号化を行う。
【0165】尚、本実施の形態では、縮小画像生成手段
108からの縮小画像を画素間相関観測手段105に、
縮小画像生成手段109からの縮小画像をフレーム間予
測誤差観測手段106に送信したが、縮小画像生成手段
108(あるいは109)で生成された縮小画像を画素
間相関観測手段105及びフレーム間予測誤差観測手段
106の両方に送信することも可能である。あるいは縮
小画像生成手段108または109で生成された縮小画
像を画素間相関観測手段105又はフレーム間予測誤差
観測手段106のいずれかにのみ送信することも可能で
ある。例えば、縮小画像生成手段108からの縮小画像
を画素間相関観測手段105に送信し、フレーム間予測
誤差観測手段106には通常の画像を送信してもよい。
又は、縮小画像生成手段109からの縮小画像をフレー
ム間予測誤差観測手段106に送信し、画素間相関観測
手段105には通常の画像を送信してもよい。
【0166】第5の実施の形態について説明する。
【0167】第3の実施の形態では、複雑度の推定パラ
メタa,b,cを予め符号化したデータから計算し設定
したが、本実施の形態では、推定パラメタa,b,c
を実際に画像を符号化した結果から推定する。
【0168】まず、動画像符号化装置の構成について説
明する。
【0169】本実施の形態は、例えば図15に示すが如
く、第j−1フレームまでは符号化がすでに終了してお
り、第j−1フレームまでの解析された結果及び符号化
された結果を利用して、解析結果から隣接画素間差分絶
対値和A及び予測誤差の絶対値和 E を観測し、符号化
結果から発生符号量と使用された量子化スケールの平均
値とを得る。又、発生符号量と量子化スケールの平均値
とから符号化した画像の複雑度が計算でき、この複雑度
と予め観測した特徴量との関係から複雑度の推定パラメ
タa,b,c が推定できる。このようにして得られた
推定パラメタ a,b,cをピクチャタイプ毎の符号化
を行う毎に更新する。
【0170】図20は動画像符号化装置のブロック図で
ある。
【0171】尚、第1の実施の形態及び第3の実施の形
態の動画像符号化装置と同様な構成については同じ符号
を付し、詳細な説明は省略する。
【0172】図20に示すが如く、本実施の形態は、図
1で示した第1の実施の形態の構成に加えて、複雑度推
定パラメタ計算手段401を備える。
【0173】複雑度推定パラメタ計算手段401は、画
像特徴量観測手段101で観測された画像ごとの特徴量
と本符号化手段30で計算された発生符号量とから算出
された量子化スケールの平均値から複雑度を計算し、画
像の特徴量と対応する画像の複雑度とから複雑度推定パ
ラメタを計算するものである。そして、計算された複雑
度推定パラメタは複雑度計算手段107に送信する。
【0174】続いて、上記構成の動作について説明す
る。
【0175】図21は本実施の形態の動作を説明するた
めのフローチャートである。
【0176】尚、隣接画素間差分絶対値、予測誤差の絶
対値和を計算する動作については第3の実施の形態で説
明済であり、本符号化手段30で発生符号量を計測する
動作については第1の実施の形態で説明済であることか
ら本実施の形態では詳細な説明を省略する。又、説明を
容易にする為に、例えば図15に示すが如く、第j−1
フレームまでは符号化がすでに終了しており、第j−1
フレームまでの解析された結果及び符号化された結果を
利用できるものとし、フレームjの符号化までに入力さ
れた画像(動画像)の解析ができるフレーム数をLaと
し、符号量の割当区間にあるフレーム数をLbとする。
【0177】動画像特徴量観測手段101は、入力され
た画像のフレーム内における 隣接画素間相関を計算し
(StepB1)、更に入力画像と予測画像との差分を
計算する(StepB2)。
【0178】複雑度計算手段107は、動画像特徴量観
測手段101で計算された隣接画素間差分絶対値和と予
測誤差の絶対値和と複雑度推定パラメタ計算手段401
から送信された複雑度推定パラメタとに基づいて複雑度
を計算する(StepB3)。
【0179】符号割当て手段20は、符号量の割当てを
割当区間に対して行う(StepB4)。
【0180】バッファ制約調整手段202は、割当てら
れた符号量の符号化バッファにおけるバッファ占有量を
計算する(StepB5)。
【0181】バッファ制約調整手段202は、計算した
バッファ占有量に基づいて、符号化バッファがオーバー
フロー又はアンダーフローを起こすか否かを判断する
(StepB6)。
【0182】符号化バッファがオーバーフローを起こす
場合、バッファ制約調整手段202は、符号化バッファ
がオーバーフローを起こさないように符号量を調節する
(StepB7)。
【0183】一方、符号化バッファがアンダーフローを
起こす場合、バッファ制約調整手段202は、符号化バ
ッファがアンダーフローを起こさないように符号量を調
節する(StepB8)。
【0184】符号化バッファでオーバーフロー又はアン
ダーフローのいずれも起こさない割当てとなった場合、
本符号化手段30は、遅延手段40で遅延された画像の
符号化を行う(StepB9)。
【0185】複雑度推定パラメタ計算手段401は、動
画符号化手段302でフレームを符号化した際に発生し
た発生符号量及び量子化スケールと動画像特徴量観測手
段101で計算された隣接間差分絶対値和と予測誤差の
絶対値和とに基づいて、複雑度推定パラメタを算出す
る。例えば、動画符号化手段302で画像を符号化した
際に発生した発生符号量をS[j]及び量子化スケールを
Q[j]とし、動画像特徴量観測手段101で計算された
隣接間差分絶対値和をA[j]、予測誤差の絶対値和をE
[j]とし、Iピクチャ、Pピクチャ、及びBピクチャの
複雑度推定パラメタを夫々a,b,cとした場合、発生
符号量をS[j]と量子化スケールをQ[j]とからさ算出
される複雑度X[j]は、 と計算され、Iピクチャ、Pピクチャ、及びBピクチャ
の複雑度Xi[j],Xp[j],Xb[j]は、 と計算される。そして、発生符号量と量子化スケールと
で算出した複雑度と隣接間差分絶対値和及び予測誤差の
絶対値和から算出した複雑度とは近似の関係があること
から複雑度推定パラメタa,b,cは、 と計算される。そして、算出した複雑度推定パラメタを
複雑度計算手段107に送信する(StepB10)。
【0186】複雑度計算手段107は、最初に使用した
複雑度推定パラメタを複雑度推定パラメタ計算手段40
1から送信された複雑度推定パラメタに更新し、以降、
画像の複雑度の計算に使用する(StepB11)。
【0187】第6の実施の形態について説明する。
【0188】上記した第1の実施の形態の動画像符号化
装置は、ディジタル信号処理プロセッサ等のコンピュー
タ制御で実現するようにしても良い。
【0189】図22は動画像符号化装置をコンピュータ
で実現する場合の装置構成を模式的に示す図である。
【0190】ます、本実施の形態を実現するたの構成を
説明する。
【0191】704はバッファである。バッファ704
は、符号化されたデータを蓄積し、固定のビットレート
で出力するものである。このバッファ704により、画
像ごとの発生符号量の変動を吸収する。
【0192】70はコンピュータである。コンピュータ
70は、記録媒体801からプログラムを記録媒体読出
装置80、記録媒体読出装置インターフェース703を
介してメモリ702に読み出し、CPU(Centra
l ProcessingUnit)で実行するもので
ある。
【0193】801は記録媒体である。記録媒体801
には、(1)入力画像から発生符号量と平均量子化スケ
ールとを観測する処理と、(2)観測された発生符号量
と平均量子化スケールとに基づいて複雑度を計算する処
理と、(3)画像が符号化処理を行う単位区間の倍数で
あるか否かを判断する処理と、(4)割当て区間の総符
号量を計算する処理と、(5)目標符号量を計算する処
理と、(6)割当てられた符号量がバッファの制約に違
反しないよう調整する処理と、(7)画像を符号化する
処理と、の前記(1)から(7)の処理を実行させるた
めのプログラムが記録されている。
【0194】上記プログラムは、マスクROM等、フラ
ッシュ等の不揮発性メモリに格納してもよく、記録媒体
は不揮発性メモリを含むほか、CD−ROM、FD、D
VD(Digital Versatile Dis
k)、MT(磁気テープ)、可搬型HDD等の媒体のほ
か、例えばサーバ装置からコンピュータで該プログラム
を通信媒体伝送する場合等、プログラムを担持する有
線、無線で通信される通信媒体等も含む。
【0195】次に、上述した処理の動作について説明す
る。
【0196】図23は本実施の形態の動作を説明するた
めのフローチャートである。
【0197】尚、動作の説明を容易にする為に、フレー
ムjの符号化までに入力された画像の解析ができるフレ
ーム数をLaとし、符号量の割当てを行う区間(以下、
割当区間という)にあるフレーム数をLbとする。
【0198】入力されたフレームの番号jを−La+1
と初期化し(StepC0)、フレームを符号化した場
合の発生符号量と平均量子化スケールとを観測する(S
tepC1)。
【0199】画像の発生符号量と量子化スケールとに基
づいて複雑度を計算する。例えば、フレームj+La−
1の発生符号量をS[j+La−1]、平均量子化スケー
ルQ[j+La−1]として場合、複雑度X[j+La−
1]は、 と計算される(StepC2) 画像の解析できるフレーム数Laと符号量の割当区間に
あるフレーム数Lbとを比較する(StepC3)。
【0200】フレーム数Lbが画像の解析できるフレー
ム数Laより多い場合(Lb>La)、既に解析されて
いる画像の複雑度から割当区間に満たない部分の複雑度
を計算する。例えば、MPEG1又はMPEG2で使用
されているIピクチャ、Pピクチャ及びBピクチャの3
種類のピクチャを用い、図12中の上側の記号をピクチ
ャタイプとフレーム番号を表し、下側の記号をピクチャ
の複雑度を表すものとし、図12に示すが如く、GOP
のサイズNが15であり、これを割当て区間長Lbと
し、解析区間長さLが8であり、これがLaとなり、G
OPの先頭がIピクチャで、I又はPピクチャが3ピク
チャ毎に配置され、それ以外のピクチャをBピクチャと
し、B0からB11までが既に解析済である場合、複雑
度が計算されていないB12からP18までの7ピクチ
ャ対応する複雑度X'は、ピクチャタイプ別の平均値又
は最近の値を使用して計算され、 X’15 = Xi = X0 X’12 = X’18 = Xp = (X6+X
9)/2 X’13 = X’14 = X’16 = X’17 = Xb = (X4+X5+X7+X8+X10+X
11)/6 となる。
【0201】尚、画像を解析した期間に同じピクチャタ
イプが存在しない場合、最近解析された同じピクチャタ
イプの複雑さをこの場合の指標とする(StepC
4)。
【0202】一方、符号量の割当区間にあるフレーム数
Lbが画像の解析できるフレーム数La以下である場合
(Lb≦La)、複雑度の予測は不要であるので、次に
進む。
【0203】入力されたフレームjがフレーム数Laを
満たすか否かを判断する(StepC5) 入力された画像のフレーム枚数がフレーム数La未満で
ある場合(すなわち−La+1に初期化された画像のフ
レーム番号jがj<0の場合)jの値を増やし、次の画
像の複雑度を計算する(StepC1、C2、C3、C
4)。
【0204】一方、入力された画像のフレーム枚数がフ
レーム数Laと同じになった場合(j=0)、フレーム
jが符号化処理を行う単位区間Cの倍数であるか否かを
判断する(StepC6)。
【0205】フレームjが符号処理を行う単位区間Cの
倍数でない場合、フレームjの値を増やし、次の画像の
複雑度の計算を行う(StepC1、C2、C3、C
4)。
【0206】一方、フレームjが符号化処理を行う単位
区間Cの整数倍である場合、符号量の割当てを割当て区
間に行う。
【0207】まず、割当て区間内の総符号量を計算す
る。例えば、符号量の割当て区間をLフレームとし、第
jフレームから第j+L−1フレームまでのフレームに
割当てることができる総符号量をRa[j]とした場合、
総符号量Ra[j]は、フレームLとGOPとの関係が、
(a)符号量の割当て単位がGOP単位である場合(フ
レームLがGOPの整数倍である場合)と(b)符号量
の割当て単位がGOP単位でない場合(フレームLがG
OPの整数倍でない場合)とで異なり、(a)符号量の
割当て単位がGOP単位である場合(フレームLがGO
Pの整数倍である場合)、Ra[j]は、 と計算される。尚、Rは本符号化で使用するビットレー
トである。又、バッファ占有量BOC[j]を考慮して、
総符号量を調整することも可能である。例えば、Ra
[j]は、 と計算される。(b)符号量の割当て単位がGOP単位
でない場合(フレームLがGOPの整数倍でない場合)
と、Ra[j]は、 と計算さる。ここでSsum は 1GOP内のフレーム
の枚数をNとした場合、直前に符号化したN−L枚のフ
レームにおける発生符号量の総和である(StapC
7)。
【0208】次に、各フレームの目標符号量を計算す
る。各フレームの目標符号量T[j] は、符号量の割当
て区間に割当てることができる総符号量Ra[j]を複雑
度X[j]で比例配分し と計算される。尚、Xsum は割当て区間の複雑度の
総和を示すものである。ここで、目標符号量T[j]は、
フレームjからフレームj+L−1までの各々について
計算する(StapC8)。バッファ占有量を計算す
る。例えば、バッファ占有量をBOCとし場合、バッフ
ァ占有量BOCは、 と計算される。ここでRframeは、本符号化で使う
ビットレートRから計算されたフレームあたりの符号量
である。
【0209】 ここで、バッファ占有量の初期値は0(BOC[0]=
0)とする(StepC9)。
【0210】計算したバッファ占有量に基づいて、バッ
ファがオーバーフロー又はアンダーフローを起こすか否
かを判断する。例えば、バッファの上限をBとした場
合、バッファ占有量BOC[j]が B−Rframeよ
り小さいか否かを判断する(StepC10)。
【0211】バッファがオーバーフローを起こして場
合、バッファがオーバーフローを起こさないように符号
量を調節する。例えば、図4(a)に示すが如く、符号
の割当てがバッファでオーバーフローを引き起こす割当
てとなっている場合、バッファの符号量の占有量が最大
となるフレームjoを検出し、フレームjからjoまで
に割当てた符号量を、図4(b)に示すが如く、joで
バッファがオーバーフローを起こさないよう符号量の割
当てを減少させる。そして、減少させた分の符号量は、
jo+1からj+L−1のフレームに割当てる(Ste
pC11)。
【0212】一方、バッファがアンダーフローを起こし
ている場合、バッファがアンダーフローを起こさないよ
うに符号量を調節する。例えば、図5(a)に示すが如
く、符号量の割当がバッファでアンダーフローを起こす
割当となっている場合、バッファの符号の占有量が最小
となるフレームjuを検出し、フレームjからjuまで
に割当てた符号を、図5(b)に示すが如く、juでバ
ッファがアンダーフローを起こさないように割当てを増
加させる。そして、増加させた分の符号量は、ju+1
からj+L−1のフレームに割当てた符号量から減少さ
せる(StepC12)。
【0213】更に、バッファでオーバーフロー又はアン
ダーフローのいずれも起こさない割当てとなった場合、
フレームj〜j+c−1の符号化を行う(StepC1
3)。
【0214】尚、符号化処理を行う単位区間Cが1の場
合には、StepC6を省略することができる。La、
Lbが固定値の場合はStepC3を省略し、常にSt
epC4を実行する、あるいは常にStepC4を実行
しない(StepC3、StepC4の両方を省略す
る)こともできる。又、解析区間のフレーム数La、割
当区間にあるフレーム数Lb、符号化区間Cは必ずしも
同じである必要はなく、ここに記載した組み合わせに限
定されるものではない。
【0215】第7の実施の形態について説明する。
【0216】上記した第2の実施の形態の動画像符号化
装置は、ディジタル信号処理プロセッサ等のコンピュー
タ制御で実現するようにしても良い。尚、第6の実施の
形態と同様な構成については同じ符号を付し、詳細な説
明は省略する。
【0217】記録媒体801から読み出されたプログラ
ムを実行するコンピュータ70において、入力された画
像をバッファサイズに合うように符号量を調整する符号
化処理を実行するにあたり、記憶媒体801には、
(1)入力された画像から発生符号量と平均量子化スケ
ールとを観測する処理と、(2)観測された画像の観測
情報を記録媒体804に記憶する処理と、(3)目標符
号量を計算する処理と、(4)割当てられた符号量がバ
ッファの制約に違反しないよう調整する処理と、(5)
前記判断したデータを記録媒体801に記憶する処理
と、(6)前記データに基づいて画像を符号化する処理
との前記(1)から(6)の処理を実行させるためのプ
ログラムが記録されている。
【0218】記録媒体801から該プログラムを記録媒
体読出装置80、記録媒体読出装置インターフェース7
03を介してメモリ702に読み出され、CPU701
が実行する。
【0219】続いて、上記構成における動作について説
明する。
【0220】尚、本実施の形態では、入力された画像の
シーケンス全体が予め既知であり、フレーム数も有限
で、その数もわかっているものとする。
【0221】コンピュータ70は、図17に示すが如
く、入力された画像全体を一度に解析し、記録媒体80
1に解析データを記憶する。そして、コンピュータ50
は、記録媒体801に記憶されている解析データと指定
されたビットレートとバッファ704のバッファサイズ
とに基づいて、符号量の割当てを行い、入力された画像
全体におけるフレームごとの目標符号量を計算し、これ
に基づく制御データを記録媒体801に記憶する。更
に、コンピュータ70は、入力された画像と記録媒体8
01に記憶されている制御データとに基づいて、画像の
符号化処理により圧縮データを生成する。
【0222】第8の実施の形態について説明する。
【0223】上記した第3の実施の形態の動画像符号化
装置は、ディジタル信号処理プロセッサ等のコンピュー
タ制御で実現するようにしても良い。尚、本実施の形態
では、第6の実施の形態の(1)から(3)の処理のみ
が異なり、それ以外の処理については第6の実施の形態
と同様であることから他の処理の説明については省略す
る。又、第6の実施の形態と同様な構成については同じ
符号を付し、詳細な説明は省略する。
【0224】記録媒体801から読み出されたプログラ
ムを実行するコンピュータ70において、入力された画
像をバッファサイズに合うように符号量を調整する符号
化処理を実行するにあたり、記憶媒体801には、
(1)入力画像のフレーム内の 隣接画素間相関値和を
計算する処理と、(2)入力画像と予測画像とから予測
誤差の絶対値和を計算する処理と、(3)隣接画素間相
関値和と予測誤差の絶対値和とから複雑度を計算する処
理と、の前記(1)から(3)の処理を実行させるため
のプログラムが記録されている。
【0225】記録媒体801から該プログラムを記録媒
体読出装置80、記録媒体読出装置インターフェース7
03を介してメモリ702に読み出され、CPU701
が実行する。
【0226】続いて、上記構成の動作について説明す
る。
【0227】尚、本実施の形態では、第6の実施の形態
における事前解析の動作のみが異なり、それ以外の動作
については第6の実施の形態と同様であることから事前
解析の動作のみ説明し、他の動作については省略する。
【0228】コンピュータ70は、入力された画像のフ
レーム内の 隣接画素間相関を計算する。例えば、次式
の示す隣接画素間差分絶対値和Aを計算する。
【0229】 ここで、I(x,y)は画像の(x,y)位置での画素
値、H,Vは水平,垂直のフレームサイズを表す。
【0230】そして、コンピュータ70は、入力された
画像から予測画像を生成し、入力画像と予測画像との差
分を計算する。例えば、次式に示す入力画像と予測画像
との予測誤差の絶対値和Eを計算する。
【0231】 ここで、P(x,y)は予測画像の(x,y)位置での
画素値を表す。
【0232】又は、次式に示す予測誤差の2乗和を計算
する。
【0233】
【0234】更に、コンピュータ70は、隣接画素間差
分絶対値和Aと予測誤差の絶対値和Eとに基づいて、複
雑度を計算する。例えば、Iピクチャの複雑度をXi、P
ピクチャの複雑度をXp、Bピクチャの複雑度Xbとし
て場合、計算した特徴量と複雑度とに相関があることが
知られていることから、Xi,Xp,Xbは、 と推定することができる。ここで、a,b,c は複雑
度を推定するためのパラメタであり、これらの値は予め
既知のデータを符号化した結果から計算して設定しで
き、上記の式を用いて、フレームjの複雑度X[j]は、
フレームjの特徴量A[j]、E[j]よりIピクチャのと
き、 Pピクチャのとき、 Bピクチャのとき、 と計算される。以後第1の実施の形態と同様の動作によ
って画像の符号化を行う。
【0235】第9の実施の形態について説明する。
【0236】上記した第4の実施の形態の動画像符号化
装置は、ディジタル信号処理プロセッサ等のコンピュー
タ制御で実現するようにしても良い。尚、本実施の形態
では、第8の実施の形態に(1)の処理を加えたもので
あり、それ以外の処理については第6の実施の形態及び
第8の実施形態と同様であることから他の処理について
の説明は省略する。又、第6の実施の形態と同様な構成
については同じ符号を付し、詳細な説明は省略する。
【0237】記録媒体801から読み出されたプログラ
ムを実行するコンピュータ70において、入力された画
像をバッファサイズに合うように符号量を調整する符号
化処理を実行するにあたり、記憶媒体801には、
(1)入力された画像の画素を間引きして元のサイズよ
り小さいサイズの画像を生成する処理を実行させるため
のプログラムが記録されている。
【0238】記録媒体801から該プログラムを記録媒
体読出装置80、記録媒体読出装置インターフェース7
03を介してメモリ702に読み出され、CPU701
が実行する。
【0239】続いて、上記処理の動作について説明す
る。
【0240】尚、本実施の形態では、第8の実施の形態
の事前解析において画像を縮小する動作のみを加えたも
のであり、それ以外の動作については第6の実施の形態
及び第8の実施形態と同様であることから他の動作につ
いての説明は省略する。
【0241】コンピュータ70に入力された画像の画素
を間引きして入力された画像のサイズより小さいサイズ
の画像を生成する。
【0242】以後第6の実施の形態及び第8の実施の形
態と同様の動作によって画像の符号化を行う。
【0243】尚、本実施の形態では、縮小された画像か
ら隣接画素間差分絶対値和と予測誤差の絶対値和とを算
出する処理について説明したが、縮小された画像から隣
接画素間差分絶対値和又は予測誤差の絶対値和のいずれ
か一方を算出し、他方を通常の画像から算出してもよ
い。例えば、縮小された画像から隣接画素間差分絶対値
和を算出した場合、予測誤差の絶対値和を通常の画像か
ら算出してもよいし、又は縮小された画像から予測誤差
の絶対値和を算出した場合、隣接画素間差分絶対値和を
通常の画像から算出してもよい。
【0244】第10の実施の形態について説明する。
【0245】上記した第5の実施の形態の動画像符号化
装置は、ディジタル信号処理プロセッサ等のコンピュー
タ制御で実現するようにしても良い。尚、第6の実施の
形態と同様な構成については同じ符号を付し、詳細な説
明は省略する。
【0246】本実施の形態では、第6の実施の形態及び
第8の実施の形態に複雑度推定パラメタを推定する処理
を加えたものである。
【0247】記録媒体801から読み出されたプログラ
ムを実行するコンピュータ70において、入力画像をバ
ッファサイズに合うように符号量を調整する符号化処理
を実行するにあたり、記憶媒体801には、(1)入力
画像のフレーム内の 隣接画素間相関値和を計算する処
理と、(2)入力画像と予測画像とから予測誤差の絶対
値和を計算する処理と、(3)隣接画素間相関値と予測
誤差の絶対値和と複雑度推定パラメタとに基づいて複雑
度を計算する処理と、(4)目標符号量を計算する処理
と、(5)割当てられた符号量がバッファの制約に違反
しないように調整する処理と、(6)画像を符号化する
処理と、(7)特徴量と発生符号量と量子化スケールの
平均値とから複雑度推定パラメタを計算する処理と、
(8)複雑度の計算で使用した複雑度推定パラメタを処
理(6)で計算した複雑度推定パラメタに更新する処理
と、の前記(1)から(8)の処理を実行させるための
プログラムが記録されている。
【0248】記録媒体801から該プログラムを記録媒
体読出装置80、記録媒体読出装置インターフェース7
03を介してメモリ702に読み出され、CPU701
が実行する。
【0249】続いて、上記構成の動作について説明す
る。
【0250】図24は本実施の形態の動作を説明するた
めのフローチャートである。
【0251】尚、隣接画素間差分絶対値、予測誤差の絶
対値和を計算する動作については第8の実施の形態で説
明済であり、発生符号量を計測する動作については第6
の実施の形態で説明済であることから本実施の形態では
詳細な説明を省略する。又、説明を容易にする為に、例
えば図15に示すが如く、第j−1フレームまでは符号
化がすでに終了しており、第j−1フレームまでの解析
された結果及び符号化された結果を利用できるものと
し、フレームjの符号化までに入力された画像の解析が
できるフレーム数をLaとし、符号量の割当区間にある
フレーム数をLbとする。
【0252】コンピュータ70は、入力された画像のフ
レーム内における 隣接画素間相関を計算し(Step
D1)、入力画像と予測画像との差分を計算する(St
epD2)。そして、隣接画素間差分絶対値和と予測誤
差の絶対値和と複雑度推定パラメタとに基づいて複雑度
を計算する(StepD3)。
【0253】コンピュータ70は、符号量の割当てを割
当区間に対して行い(StepD4)、割当てられた符
号量の符号化バッファにおけるバッファ占有量を計算し
(StepB5)、計算したバッファ占有量に基づい
て、符号化バッファがオーバーフロー又はアンダーフロ
ーを起こすか否かを判断する(StepD6)。
【0254】そして、コンピュータ70は、符号化バッ
ファがオーバーフローを起こす場合、符号化バッファが
オーバーフローを起こさないように符号量を調節し(S
tepD7)、符号化バッファがアンダーフローを起こ
す場合、符号化バッファがアンダーフローを起こさない
ように符号量を調節する(StepD8)。
【0255】更に、コンピュータ70は、符号化バッフ
ァでオーバーフロー又はアンダーフローのいずれも起こ
さない割当てとなった場合、画像の符号化を行う(St
epD9)。
【0256】コンピュータ70は、画像を符号化した際
に発生した発生符号量及び量子化スケールと隣接間差分
絶対値和と予測誤差の絶対値和とに基づいて、複雑度推
定パラメタを算出する。例えば、発生符号量をS[j]及
び量子化スケールをQ[j]とし、隣接間差分絶対値和を
A[j]、予測誤差の絶対値和をE[j]とし、Iピクチ
ャ、Pピクチャ、及びBピクチャの複雑度推定パラメタ
を夫々a,b,cとした場合、発生符号量をS[j]と量
子化スケールをQ[j]とからさ算出される複雑度X[j]
は、 と計算され、Iピクチャ、Pピクチャ、及びBピクチャ
の複雑度Xi[j],Xp[j],Xb[j]は、 と計算される。そして、発生符号量と量子化スケールと
で算出した複雑度と隣接間差分絶対値和及び予測誤差の
絶対値和から算出した複雑度とは近似の関係があること
から複雑度推定パラメタa,b,cは、 と計算される(StepD10)。
【0257】そして、コンピュータ70は、最初に使用
した複雑度推定パラメタを新たに計算された複雑度推定
パラメタに更新し、以降、画像の複雑度の計算に使用す
る(StepD11)。
【0258】
【発明の効果】本発明の効果は、バッファに対して適切
な符号量配分を行うことが、同じビットレートのもとで
画質の改善を行うことできる。
【0259】その理由は、画像の事前解析の情報に基づ
いた符号量の割当てを複数の画像に対して同時に行い、
これに基づいてバッファの推移を予測してバッファ制約
違反を起こさないように調整し、予めバッファ制約を遵
守した符号量の割当が可能となからである。又、実際の
符号化した際に発生する符号量を目標符号量に近づくよ
う制御でき、画像の複雑さに応じた符号量の配分が実現
できるからである。
【図面の簡単な説明】
【図1】動画像符号化装置のブロック図である。
【図2】事前解析手段10のブロック図である。
【図3】事前解析手段10のブロック図である。
【図4】オーバーフロー回避処理を説明するための図で
ある。
【図5】アンダーフロー回避処理を説明する為の図であ
る。
【図6】ピクチャ枚数とGOP内に含まれているピクチ
ャ枚数との関係を説明するための図である。
【図7】ピクチャ枚数とGOP内に含まれているピクチ
ャ枚数との関係を説明するための図である。
【図8】ピクチャ枚数とGOP内に含まれているピクチ
ャ枚数との関係を説明するための図である。
【図9】ピクチャ枚数とGOP内に含まれているピクチ
ャ枚数との関係を説明するための図である。
【図10】ピクチャ枚数とGOP内に含まれているピク
チャ枚数との関係を説明するための図である。
【図11】複雑度の予想について説明するための図であ
る。
【図12】複雑度の予想について説明するための図であ
る。
【図13】複雑度の予測について説明するための図であ
る。
【図14】本実施の形態の動作を説明するためのフロー
チャートである。
【図15】本実施の形態の動作を説明するための図であ
る。
【図16】動画像符号化装置のブロック図である。
【図17】本実施の形態について説明するための図であ
る。
【図18】事前解析手段10のブロック図である。
【図19】事前解析手段10のブロック図である。
【図20】動画像符号化装置のブロック図である。
【図21】本実施の形態の動作を説明するためのフロー
チャートである。
【図22】動画像符号化装置をコンピュータで実現する
場合の装置構成を模式的に示す図である。
【図23】本実施の形態の動作を説明するためのフロー
チャートである。
【図24】本実施の形態の動作を説明するためのフロー
チャートである。
【図25】動画像符号化装置の構成を説明するための図
である。
【図26】動画像符号化装置の動作を説明するための図
である。
【符号の説明】
10 事前解析手段 108 縮小画像生成
手段 20 符号量割当て手段 109 縮小画像生成
手段 30 本符号化手段 201 初期符号量配
分手段 40 遅延手段 202 バッファ制約
調整手段 41 遅延手段 301 符号量制御手
段 101 動画像特徴量観測手段 302 動画像符号化
手段 102 複雑度計算手段 303 符号化バッフ
ァ 103 動画像符号化手段 401 複雑度推定パ
ラメタ計算手段 104 動画像符号化手段 50 解析データ蓄
積手段 105 画素間相関観測手段 60 制御情報蓄積
手段 106 予測誤差観測手段 70 コンピュータ 107 複雑度計算手段 80 記録媒体読出
装置
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5C059 KK22 KK35 MA00 MA23 MC11 PP05 PP06 PP07 TA46 TB03 TB04 TC02 TC03 TC10 TC12 TC18 TC27 TC38 TD03 TD05 TD11 UA02 UA34 UA39 5J064 BA01 BB03 BB12 BC01 BC16 BC25 BC26 BD01

Claims (26)

    【特許請求の範囲】
  1. 【請求項1】 動画像の圧縮符号化を行う動画像符号化
    装置において、 一定区間にある画像を解析して画像ごとの特徴量を観測
    する手段と、 前記観測された特徴量に基づいて、前記画像の複雑度を
    推定する手段と、 あらかじめ前記一定区間に対して符号量を分配し、前記
    推定された複雑度に基づいて、前記分配された符号量を
    前記一定区間内の全ての画像に対して画像ごとに割当て
    る目標符号量を算出する手段と、 画像を符号化した結果生じる符号を蓄積するバッファ
    と、 前記算出された目標符号量を前記画像ごとに割当てる
    際、前記バッファにおける前記符号の占有量の推移を計
    算し、前記バッファがオーバーフロー又はアンダーフロ
    ーを起こさないように目標符号量を調整する手段と、 前記調整した目標符号量に応じて前記画像を圧縮符号化
    する手段とを有することを特徴とする画像符号化装置。
  2. 【請求項2】 動画像の圧縮符号化を行う動画像符号化
    装置において、 第1の一定区間にある画像を解析して画像ごとの特徴量
    を観測する手段と、 前記観測された特徴量に基づいて、前記画像の複雑度を
    推定する手段と、 前記第1の一定区間に続く第2の一定区間内にある画像
    の複雑度を予測する手段と、 前記第1の一定区間と前記第2の一定区間と合わせた合
    成区間に符号量を分配し、前記推定した複雑度と前記予
    測した複雑度とに基づいて、前記分配された符号量を前
    記合成区間内における全ての画像に対して画像ごとに割
    当てる目標符号量を算出する手段と、 画像を符号化した結果生じる符号を蓄積するバッファ
    と、 前記算出された目標符号量を前記画像ごとに割当てる
    際、前記バッファにおける前記符号の占有量の推移を計
    算し、前記バッファがオーバーフロー又はアンダーフロ
    ーを起こさないように目標符号量を調整する手段と、 前記調整した目標符号量に応じて前記画像を圧縮符号化
    する手段とを有することを特徴とする画像符号化装置。
  3. 【請求項3】 前記画像の複雑度を推定する手段は、 解析した画像の統計量に基づいて、画像の複雑度を推定
    するよう構成されていることを特徴とする請求項1又は
    請求項2に記載の画像符号化装置。
  4. 【請求項4】 前記画像の複雑度を予測する手段は、 解析済みの画像の複雑度に基づいて、画像の複雑度を予
    測するよう構成されていることを特徴とする請求項2に
    記載の画像符号化装置。
  5. 【請求項5】 前記特徴量を観測する手段は、 入力された画像を所定の符号化方法で符号化する際、画
    像の符号化により発生する符号量又は前記発生した符号
    量と、使用した量子化スケールの値とを観測するよう構
    成されていることを特徴とする請求項1又は請求項2に
    記載の画像符号化装置。
  6. 【請求項6】 前記特徴量を観測する手段は、 入力された画像をフレーム内符号化する場合、前記画像
    のフレーム内の隣接画素間相関を観測し、 入力された画像をフレーム間予測符号化する場合、前記
    入力された画像のフレーム間予測誤差量を観測するよう
    に構成されていることを特徴とする請求項1から請求項
    5のいずれかに記載の画像符号化装置。
  7. 【請求項7】 前記動画像符号化装置は、 入力された画像を縮小する手段を有し、 前記複雑度を観測する手段は、 入力された画像をフレーム内符号化する場合、前記入力
    された画像のフレーム内の隣接画素間相関を観測し、 入力された画像をフレーム間予測符号化する場合、前記
    縮小された画像のフレーム間予測誤差量を観測するよう
    に構成されていることを特徴とする請求項1から請求項
    5のいずれかに記載の画像符号化装置。
  8. 【請求項8】 前記動画像符号化装置は、 入力された画像を縮小する手段を有し、 前記複雑度を観測する手段は、 入力された画像をフレーム内符号化する場合、前記縮小
    された画像のフレーム内の隣接画素間相関を観測し、 入力された画像をフレーム間予測符号化する場合、前記
    入力された画像のフレーム間予測誤差量を観測するよう
    に構成されていることを特徴とする請求項1から請求項
    5のいずれかに記載の画像符号化装置。
  9. 【請求項9】 前記動画像符号化装置は、 入力された画像を縮小する手段を有し、 前記複雑度を観測する手段は、 入力された画像をフレーム内符号化する場合、前記縮小
    された画像のフレーム内の隣接画素間相関を観測し、 入力された画像をフレーム間予測符号化する場合、前記
    縮小された画像のフレーム間予測誤差量を観測するよう
    に構成されていることを特徴とする請求項1から請求項
    5のいずれかに記載の画像符号化装置。
  10. 【請求項10】 前記複雑度を予測する手段は、 ピクチャタイプ別に複雑度の予測を行うように構成され
    ていることを特徴とする請求項2に記載の画像符号化装
    置。
  11. 【請求項11】 前記一定区間は、 MPEG1又はMPEG2における画像符号化方式を用
    いて入力された画像を符号化する際、GOPの区間長を
    固定にし、GOPの区間長の整数倍であることを特徴と
    する請求項1に記載の画像符号化装置。
  12. 【請求項12】 前記合成区間は、 MPEG1又はMPEG2における画像符号化方式を用
    いて入力された画像を符号化する際、GOPの区間長を
    固定にし、GOPの区間長の整数倍であることを特徴と
    する請求項2に記載の画像符号化装置。
  13. 【請求項13】 符号化用のバッファを有する装置を用
    いて、動画像の圧縮符号化を行う動画像符号化方法にお
    いて、 一定区間にある画像を解析して画像ごとの特徴量を観測
    するステップと、 前記観測された特徴量に基づいて、前記画像の複雑度を
    推定するステップと、 あらかじめ前記一定区間に対して符号量を分配し、前記
    推定された複雑度に基づいて、前記分配された符号量を
    前記一定区間内の全ての画像に対して画像ごとに割当て
    る目標符号量を算出するステップと、 前記算出された目標符号量を前記画像ごとに割当てる
    際、前記バッファにおける符号の占有量の推移を計算
    し、前記バッファがオーバーフロー又はアンダーフロー
    を起こさないように目標符号量を調整するステップと、 前記調整した目標符号量に応じて前記画像を圧縮符号化
    するステップとを有することを特徴とする画像符号化方
    法。
  14. 【請求項14】 符号化用のバッファを有する装置を用
    いて、動画像の圧縮符号化を行う動画像符号化方法にお
    いて、 第1の所定の区間にある画像を解析して画像ごとの特徴
    量を観測するステップと、 前記観測された特徴量に基づいて、前記画像の複雑度を
    推定するステップと、 前記第1の一定区間に続く第2の一定区間にある画像の
    複雑度を予測するステップと、 前記第1の一定区間と前記第2の一定区間とを合わせた
    合成区間に符号量を分配し、前記推定した複雑度と前記
    予測した複雑度とに基づいて、前記分配された符号量を
    前記合成区間内における全ての画像に対して画像ごとに
    割当てる目標符号量を算出するステップと、 前記算出された目標符号量を前記画像ごとに割当てる
    際、前記バッファにおける符号の占有量の推移を計算
    し、前記バッファがオーバーフロー又はアンダーフロー
    を起こさないように目標符号量を調整するステップと、 前記調整した目標符号量に応じて前記画像を圧縮符号化
    するステップとを有することを特徴とする画像符号化方
    法。
  15. 【請求項15】 前記画像の複雑度を推定するステップ
    は、 解析した画像の統計量に基づいて、画像の複雑度を推定
    することを特徴とする請求項13又は請求項14に記載
    の画像符号化方法。
  16. 【請求項16】 前記画像の複雑度を予測するステップ
    は、 解析済みの画像の複雑度に基づいて、画像の複雑度を予
    測することを特徴とする請求項14に記載の画像符号化
    方法。
  17. 【請求項17】 前記特徴量を観測するステップは、 入力された画像を所定の符号化方法で符号化する際、符
    号化により発生する符号量又は前記発生した符号量と、
    使用した量子化スケールの値とを観測することを特徴と
    する請求項13又は請求項14に記載の画像符号化方
    法。
  18. 【請求項18】 前記特徴量を観測するステップは、 入力された画像をフレーム内符号化する場合、前記画像
    のフレーム内の隣接画素間相関を観測し、 入力された画像をフレーム間予測符号化する場合、前記
    入力された画像のフレーム間予測誤差量を観測すること
    を特徴とする請求項13から請求項17のいずれかに記
    載の画像符号化方法。
  19. 【請求項19】 前記動画像符号化方法は、 入力された画像を縮小するステップを更に有し、 前記複雑度を観測するステップは、 入力された画像をフレーム内符号化する場合、前記入力
    された画像のフレーム内の隣接画素間相関を観測し、 入力された画像をフレーム間予測符号化する場合、前記
    縮小された画像のフレーム間予測誤差量を観測すること
    を特徴とする請求項13から請求項17のいずれかに記
    載の画像符号化方法。
  20. 【請求項20】 前記動画像符号化方法は、 入力された画像を縮小するステップを更に有し、 前記複雑度を観測するステップは、 入力された画像をフレーム内符号化する場合、前記縮小
    画像のフレーム内の隣接画素間相関を観測し、 入力された画像をフレーム間予測符号化する場合、前記
    入力された画像のフレーム間予測誤差量を観測すること
    を特徴とする請求項13から請求項17のいずれかに記
    載の画像符号化方法。
  21. 【請求項21】 前記動画像符号化方法は、 入力された画像を縮小するステップを更に有し、 前記複雑度を観測するステップは、 入力された画像をフレーム内符号化する場合、前記縮小
    された画像のフレーム内の隣接画素間相関を観測し、 入力された画像をフレーム間予測符号化する場合、前記
    縮小された画像のフレーム間予測誤差量を観測すること
    を特徴とする請求項13から請求項17のいずれかに記
    載の画像符号化方法。
  22. 【請求項22】 前記複雑度を予測するステップは、 ピクチャタイプ別に複雑度の予測を行うことを特徴とす
    る請求項14に記載の画像符号化方法。
  23. 【請求項23】 前記一定区間は、 MPEG1又はMPEG2における画像符号化方式を用
    いて入力された画像を符号化する際、GOPの区間長を
    固定にし、GOPの区間長の整数倍であることを特徴と
    する請求項13に記載の画像符号化方法。
  24. 【請求項24】 前記合成区間は、 MPEG1又はMPEG2における画像符号化方式を用
    いて入力された画像を符号化する際、GOPの区間長を
    固定にし、GOPの区間長の整数倍であることを特徴と
    する請求項14に記載の画像符号化方法。
  25. 【請求項25】 動画像の圧縮符号化を行う画像符号化
    装置を構成する情報処理装置に、 一定区間にある画像を解析して画像ごとの特徴量を観測
    する処理と、 前記観測された特徴量に基づいて、前記画像の複雑度を
    推定する処理と、 あらかじめ前記一定区間に対して符号量を分配し、前記
    推定された複雑度に基づいて、前記分配された符号量を
    前記一定区間内の全ての画像に対して画像ごとに割当て
    る目標符号量を算出する処理と、 前記算出された目標符号量を前記画像ごとに割当てる
    際、バッファにおける符号の占有量の推移を計算し、前
    記バッファがオーバーフロー又はアンダーフローを起こ
    さないように目標符号量を調整する処理と、 前記調整した目標符号量に応じて前記画像を圧縮符号化
    する処理とを実行させるためのプログラム。
  26. 【請求項26】 動画像の圧縮符号化を行う画像符号化
    装置を構成する情報処理装置に、 第1の一定区間にある画像を解析して画像ごとの特徴量
    を観測する処理と、 前記観測された特徴量に基づいて、前記画像の複雑度を
    推定する処理と、 前記第1の一定区間に続く第2の一定区間にある画像の
    複雑度を予測する処理と、 前記第1の一定区間と前記第2の一定区間とを合わせた
    合成区間に符号量を分配し、前記推定された複雑度と前
    記予測した複雑度とに基づいて、前記分配された符号量
    を前記合成区間内における全ての画像に対して画像ごと
    に割当てる目標符号量を算出する処理と、 前記算出された目標符号量を前記画像ごとに割当てる
    際、バッファにおける符号の占有量の推移を計算し、前
    記バッファがオーバーフロー又はアンダーフローを起こ
    さないように目標符号量を調整する処理と、 前記調整した目標符号量に応じて前記画像を圧縮符号化
    する処理とを実行させるためのプログラム。
JP2001024322A 2001-01-31 2001-01-31 事前解析を用いた動画像符号化装置、動画像符号化方法、及びそのプログラム。 Expired - Fee Related JP4203707B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2001024322A JP4203707B2 (ja) 2001-01-31 2001-01-31 事前解析を用いた動画像符号化装置、動画像符号化方法、及びそのプログラム。
US10/058,298 US6963610B2 (en) 2001-01-31 2002-01-30 Moving image coding device, moving image coding method and program thereof employing pre-analysis

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001024322A JP4203707B2 (ja) 2001-01-31 2001-01-31 事前解析を用いた動画像符号化装置、動画像符号化方法、及びそのプログラム。

Publications (2)

Publication Number Publication Date
JP2002232882A true JP2002232882A (ja) 2002-08-16
JP4203707B2 JP4203707B2 (ja) 2009-01-07

Family

ID=18889478

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001024322A Expired - Fee Related JP4203707B2 (ja) 2001-01-31 2001-01-31 事前解析を用いた動画像符号化装置、動画像符号化方法、及びそのプログラム。

Country Status (2)

Country Link
US (1) US6963610B2 (ja)
JP (1) JP4203707B2 (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005252752A (ja) * 2004-03-05 2005-09-15 Nippon Telegr & Teleph Corp <Ntt> 動画像符号化装置,動画像符号化方法,動画像符号化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2008503919A (ja) * 2004-06-18 2008-02-07 トムソン ライセンシング ビデオ符号化を最適化する方法および装置
JP2008523720A (ja) * 2004-12-10 2008-07-03 タット・システムズ・インコーポレイテッド マルチプロセッサアーキテクチュア並びにピクチュアベースの先読みウィンドウを具備したデジタルビデオエンコーダのためのパラレルレートコントロール
JP2008236523A (ja) * 2007-03-22 2008-10-02 Nec Corp 映像圧縮符号化装置、その方法及びそのプログラム
JP2009231905A (ja) * 2008-03-19 2009-10-08 Mega Chips Corp トランスコーダ
JP2010507983A (ja) * 2006-10-25 2010-03-11 トムソン ライセンシング マルチパスエンコーダにおける効率的な1パスのエンコーディングの方法および装置
JP2010166278A (ja) * 2009-01-15 2010-07-29 Canon Inc 画像符号化装置
JP2010166275A (ja) * 2009-01-15 2010-07-29 Canon Inc 画像符号化装置
JP2010252394A (ja) * 2010-07-23 2010-11-04 Renesas Electronics Corp 画像符号化装置、画像符号化方法及び画像編集装置
KR20200116499A (ko) * 2018-11-26 2020-10-12 구글 엘엘씨 안전 및 크로스 디바이스에 일관된 비디오 압축
US10958905B2 (en) 2019-02-04 2021-03-23 Fujitsu Limited Information processing apparatus, moving image encoding method, and computer-readable recording medium recording moving image encoding program

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1499131A1 (en) * 2003-07-14 2005-01-19 Deutsche Thomson-Brandt Gmbh Method and apparatus for decoding a data stream in audio video streaming systems
US7260276B2 (en) * 2004-06-30 2007-08-21 Sharp Laboratories Of America, Inc. Methods and systems for complexity estimation and complexity-based selection
JP4788250B2 (ja) * 2005-09-08 2011-10-05 ソニー株式会社 動画像信号の符号化装置、動画像信号の符号化方法およびコンピュータ読み取り可能な記録媒体
KR100790150B1 (ko) * 2006-07-28 2008-01-02 삼성전자주식회사 비디오 부호화기 및 비디오 데이터 프레임 부호화 방법
KR100763308B1 (ko) * 2006-08-01 2007-10-04 삼성전자주식회사 휴대용 단말기의 동영상 촬영 장치 및 방법
JP4358215B2 (ja) * 2006-09-27 2009-11-04 株式会社東芝 動画像符号化装置及びその方法
JP2009010874A (ja) * 2007-06-29 2009-01-15 Toshiba Corp 符号化装置および符号化方法
FR2919779B1 (fr) * 2007-08-02 2010-02-26 Canon Kk Procede et dispositif de codage avec perte d'un signal numerique
US8396114B2 (en) * 2009-01-29 2013-03-12 Microsoft Corporation Multiple bit rate video encoding using variable bit rate and dynamic resolution for adaptive video streaming
US8311115B2 (en) * 2009-01-29 2012-11-13 Microsoft Corporation Video encoding using previously calculated motion information
US8270473B2 (en) * 2009-06-12 2012-09-18 Microsoft Corporation Motion based dynamic resolution multiple bit rate video encoding
US8681858B2 (en) * 2009-12-23 2014-03-25 General Instrument Corporation Rate control for two-pass encoder
US8705616B2 (en) * 2010-06-11 2014-04-22 Microsoft Corporation Parallel multiple bitrate video encoding to reduce latency and dependences between groups of pictures
US9591318B2 (en) 2011-09-16 2017-03-07 Microsoft Technology Licensing, Llc Multi-layer encoding and decoding
US9398300B2 (en) * 2011-10-07 2016-07-19 Texas Instruments Incorporated Method, system and apparatus for intra-prediction in video signal processing using combinable blocks
US11089343B2 (en) 2012-01-11 2021-08-10 Microsoft Technology Licensing, Llc Capability advertisement, configuration and control for video coding and decoding
KR102437109B1 (ko) 2015-11-11 2022-08-26 삼성전자주식회사 비디오 복호화 방법 및 그 장치 및 비디오 부호화 방법 및 그 장치

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08107502A (ja) * 1994-10-05 1996-04-23 Kawasaki Steel Corp 量子化テーブル選定方法
JPH08149413A (ja) * 1994-09-22 1996-06-07 Matsushita Electric Ind Co Ltd 可変ビットレート符号化装置および記録装置および記録媒体
JPH0918873A (ja) * 1995-04-28 1997-01-17 Sony Corp 画像符号化方法、画像符号化装置及び画像記録媒体
JPH0918872A (ja) * 1995-04-28 1997-01-17 Sony Corp 画像符号化方法、画像符号化装置及び画像記録媒体
JPH09261633A (ja) * 1996-03-19 1997-10-03 Sony Corp 映像データ圧縮装置およびその方法
JPH1075443A (ja) * 1996-08-30 1998-03-17 Sony Corp 映像データ圧縮装置およびその方法
JPH1075444A (ja) * 1996-08-30 1998-03-17 Sony Corp 映像データ圧縮装置およびその方法
JPH10336663A (ja) * 1997-05-27 1998-12-18 Thomson Broadcast Mpeg2符号化用の前処理装置
JPH11243539A (ja) * 1997-12-08 1999-09-07 Sony Corp 符号化装置および符号化方法
JPH11298904A (ja) * 1998-04-13 1999-10-29 Nippon Telegr & Teleph Corp <Ntt> 映像符号化方法、映像符号化装置、および映像符号化プログラムを記録した記録媒体
JP2000041240A (ja) * 1998-07-22 2000-02-08 Nec Corp 可変ビットレート符号化装置および方法
JP2001008215A (ja) * 1999-06-24 2001-01-12 Victor Co Of Japan Ltd 動画像符号化装置及びその方法
JP2001008207A (ja) * 1999-06-22 2001-01-12 Victor Co Of Japan Ltd 動画像符号化装置及びその方法
JP2001025015A (ja) * 1999-07-05 2001-01-26 Victor Co Of Japan Ltd 動画像符号化装置及びその方法
JP2001359096A (ja) * 1999-06-08 2001-12-26 Matsushita Electric Ind Co Ltd 画像符号化装置
JP2003517743A (ja) * 1998-08-27 2003-05-27 ジェネラル・インスツルメント・コーポレイション 圧縮デジタルビデオ信号および圧縮されていないデジタルビデオ信号の統計的な多重化のための動的ビット配分

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6151360A (en) * 1995-04-28 2000-11-21 Sony Corporation Method for encoding video signal using statistical information
JP3765129B2 (ja) 1996-08-14 2006-04-12 ソニー株式会社 符号化装置および符号化方法
FR2753330B1 (fr) * 1996-09-06 1998-11-27 Thomson Multimedia Sa Procede de quantification pour codage video
US6192075B1 (en) * 1997-08-21 2001-02-20 Stream Machine Company Single-pass variable bit-rate control for digital video coding
GB2336269B (en) * 1997-12-08 2002-01-16 Sony Corp Encoder and encoding method
US6625322B1 (en) * 1999-06-08 2003-09-23 Matsushita Electric Industrial Co., Ltd. Image coding apparatus
EP1063851B1 (en) * 1999-06-22 2007-08-01 Victor Company Of Japan, Ltd. Apparatus and method of encoding moving picture signal
US6522693B1 (en) * 2000-02-23 2003-02-18 International Business Machines Corporation System and method for reencoding segments of buffer constrained video streams

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08149413A (ja) * 1994-09-22 1996-06-07 Matsushita Electric Ind Co Ltd 可変ビットレート符号化装置および記録装置および記録媒体
JPH08107502A (ja) * 1994-10-05 1996-04-23 Kawasaki Steel Corp 量子化テーブル選定方法
JPH0918873A (ja) * 1995-04-28 1997-01-17 Sony Corp 画像符号化方法、画像符号化装置及び画像記録媒体
JPH0918872A (ja) * 1995-04-28 1997-01-17 Sony Corp 画像符号化方法、画像符号化装置及び画像記録媒体
JPH09261633A (ja) * 1996-03-19 1997-10-03 Sony Corp 映像データ圧縮装置およびその方法
JPH1075443A (ja) * 1996-08-30 1998-03-17 Sony Corp 映像データ圧縮装置およびその方法
JPH1075444A (ja) * 1996-08-30 1998-03-17 Sony Corp 映像データ圧縮装置およびその方法
JPH10336663A (ja) * 1997-05-27 1998-12-18 Thomson Broadcast Mpeg2符号化用の前処理装置
JPH11243539A (ja) * 1997-12-08 1999-09-07 Sony Corp 符号化装置および符号化方法
JPH11298904A (ja) * 1998-04-13 1999-10-29 Nippon Telegr & Teleph Corp <Ntt> 映像符号化方法、映像符号化装置、および映像符号化プログラムを記録した記録媒体
JP2000041240A (ja) * 1998-07-22 2000-02-08 Nec Corp 可変ビットレート符号化装置および方法
JP2003517743A (ja) * 1998-08-27 2003-05-27 ジェネラル・インスツルメント・コーポレイション 圧縮デジタルビデオ信号および圧縮されていないデジタルビデオ信号の統計的な多重化のための動的ビット配分
JP2001359096A (ja) * 1999-06-08 2001-12-26 Matsushita Electric Ind Co Ltd 画像符号化装置
JP2001008207A (ja) * 1999-06-22 2001-01-12 Victor Co Of Japan Ltd 動画像符号化装置及びその方法
JP2001008215A (ja) * 1999-06-24 2001-01-12 Victor Co Of Japan Ltd 動画像符号化装置及びその方法
JP2001025015A (ja) * 1999-07-05 2001-01-26 Victor Co Of Japan Ltd 動画像符号化装置及びその方法

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9374615B2 (en) 2002-12-10 2016-06-21 Arris Enterprises, Inc. Parallel rate control for digital video encoder with multi-processor architecture and picture-based look-ahead window
JP2005252752A (ja) * 2004-03-05 2005-09-15 Nippon Telegr & Teleph Corp <Ntt> 動画像符号化装置,動画像符号化方法,動画像符号化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2008503919A (ja) * 2004-06-18 2008-02-07 トムソン ライセンシング ビデオ符号化を最適化する方法および装置
JP2012182816A (ja) * 2004-12-10 2012-09-20 Tut Systems Inc マルチプロセッサアーキテクチュア並びにピクチュアベースの先読みウィンドウを具備したデジタルビデオエンコーダのためのパラレルレートコントロール
JP2008523720A (ja) * 2004-12-10 2008-07-03 タット・システムズ・インコーポレイテッド マルチプロセッサアーキテクチュア並びにピクチュアベースの先読みウィンドウを具備したデジタルビデオエンコーダのためのパラレルレートコントロール
JP2014014148A (ja) * 2004-12-10 2014-01-23 Tut Systems Inc 量子化パラメータの値を決定する方法
JP2010507983A (ja) * 2006-10-25 2010-03-11 トムソン ライセンシング マルチパスエンコーダにおける効率的な1パスのエンコーディングの方法および装置
JP2008236523A (ja) * 2007-03-22 2008-10-02 Nec Corp 映像圧縮符号化装置、その方法及びそのプログラム
JP2009231905A (ja) * 2008-03-19 2009-10-08 Mega Chips Corp トランスコーダ
US8548046B2 (en) 2008-03-19 2013-10-01 Megachips Corporation Transcoder
JP2010166275A (ja) * 2009-01-15 2010-07-29 Canon Inc 画像符号化装置
JP2010166278A (ja) * 2009-01-15 2010-07-29 Canon Inc 画像符号化装置
JP2010252394A (ja) * 2010-07-23 2010-11-04 Renesas Electronics Corp 画像符号化装置、画像符号化方法及び画像編集装置
KR20200116499A (ko) * 2018-11-26 2020-10-12 구글 엘엘씨 안전 및 크로스 디바이스에 일관된 비디오 압축
KR102411644B1 (ko) 2018-11-26 2022-06-22 구글 엘엘씨 안전 및 크로스 디바이스에 일관된 비디오 압축
US11394977B2 (en) 2018-11-26 2022-07-19 Google Llc Safe and cross device consistent video compression
US10958905B2 (en) 2019-02-04 2021-03-23 Fujitsu Limited Information processing apparatus, moving image encoding method, and computer-readable recording medium recording moving image encoding program

Also Published As

Publication number Publication date
US20020131492A1 (en) 2002-09-19
US6963610B2 (en) 2005-11-08
JP4203707B2 (ja) 2009-01-07

Similar Documents

Publication Publication Date Title
JP2002232882A (ja) 事前解析を用いた動画像符号化装置、動画像符号化方法、及びそのプログラム。
JP5236947B2 (ja) マルチプロセッサアーキテクチュア並びにピクチュアベースの先読みウィンドウを具備したデジタルビデオエンコーダのためのパラレルレートコントロール
JP4358215B2 (ja) 動画像符号化装置及びその方法
JP4366571B2 (ja) 動画像符号化装置及び方法
US20110299588A1 (en) Rate control in video communication via virtual transmission buffer
US7302000B2 (en) Method and system for two-pass video encoding using sliding windows
JP2003018603A (ja) 動画像符号化方法及び装置
US8780986B2 (en) Refresh pixel group selection and coding adjustment
KR100790986B1 (ko) 가변 비트율 비디오 코딩에서 비트율을 제어하는 장치 및방법
JP2019536385A (ja) イントラフレームビットレートの割り当て方法、コンピュータ機器、及び記憶媒体
JPWO2008111454A1 (ja) 量子化制御方法及び装置、そのプログラム並びにプログラムを記録した記録媒体
US20100104010A1 (en) Real-time rate-control method for video encoder chip
TWI536846B (zh) 訊框速率控制方法、訊框速率控制裝置及訊框速率控制程式
JP2008252562A (ja) 動画像符号化制御方法および動画像符号化装置
JP3815665B2 (ja) 可変ビットレート動画像符号化装置および記録媒体
JP4534106B2 (ja) 動画像符号化システム及び方法
US20090185620A1 (en) Video encoding apparatus and method for the same
JP3889552B2 (ja) 符号量割り当て装置および方法
CN102202220B (zh) 编码设备及其控制方法
KR100911098B1 (ko) H.263 영상 부호화에 의한 왜곡량 예측 장치 및 그 방법
JPH114444A (ja) 画像符号化装置および方法
JP7356549B1 (ja) 画像符号化装置及び画像符号化方法
JP2008098980A (ja) 動画像符号化装置
JP2002125235A (ja) 動画像符号化装置
JP5576728B2 (ja) 動画像符号化装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050517

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070821

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070829

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071029

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080917

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080930

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111024

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121024

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131024

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees