JP3889552B2 - 符号量割り当て装置および方法 - Google Patents

符号量割り当て装置および方法 Download PDF

Info

Publication number
JP3889552B2
JP3889552B2 JP2000174064A JP2000174064A JP3889552B2 JP 3889552 B2 JP3889552 B2 JP 3889552B2 JP 2000174064 A JP2000174064 A JP 2000174064A JP 2000174064 A JP2000174064 A JP 2000174064A JP 3889552 B2 JP3889552 B2 JP 3889552B2
Authority
JP
Japan
Prior art keywords
frame
buffer occupancy
code amount
image group
limit value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000174064A
Other languages
English (en)
Other versions
JP2001359097A (ja
Inventor
毅 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pioneer Corp
Original Assignee
Pioneer Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pioneer Corp filed Critical Pioneer Corp
Priority to JP2000174064A priority Critical patent/JP3889552B2/ja
Priority to US09/877,077 priority patent/US6940902B2/en
Publication of JP2001359097A publication Critical patent/JP2001359097A/ja
Application granted granted Critical
Publication of JP3889552B2 publication Critical patent/JP3889552B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • H04N19/197Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters including determination of the initial value of an encoding parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Description

【0001】
【発明の属する技術分野】
本発明は、ビデオ信号を符号化して記録媒体に記録する圧縮符号化データ記録における符号量割り当て装置および方法に関する。
【0002】
【従来の技術】
通常、画像をディジタル化して、DVD−ROM、CD−ROMやハードディスクなどの記録媒体に記録する場合、そのデータ量は膨大なものとなるため、通常は圧縮符号化して記録される。この圧縮符号化方法には、各種の圧縮符号化方式があり、特に、画像の空間周波数が低周波に集中する性質を利用して圧縮を行うDCT(Discrete Cosine Transform)をベースとした符号化方式が、比較的多く使用されている。DCTはJPEG(Joint Photographic Coding Experts Group)や、MPEG(Moving Picture Coding Experts Group)1、MPEG2、またはMPEG4などの国際標準の符号化方式の中で使用されている。
【0003】
従来より、MPEG方式により圧縮符号化を行う装置では、固定ビットレート符号化方式や、可変ビットレート符号化方式により、符号化制御を行うことが知られている。
【0004】
固定ビットレート符号化方式では、ビデオ・シーケンスを構成する各フレームの目標符号量は、その画像の複雑さに関係なく一定値であり、符号化の時点においてデコーダ・バッファの占有率を勘案し、オーバーフローや、アンダーフローを発生させないように符号化制御を行っている。
【0005】
一方、可変ビットレート符号化方式では、前もって得られた画像複雑さ指標に基づいて、事前にビデオ・シーケンス内の各フレームの最適な符号量割り当てを行っているため、各フレームに必要とされる符号量の割り当てが可能であり、フレームの間の画質の差を抑えることができる。
【0006】
【発明が解決しようとする課題】
ところで、各フレームの符号発生量は、そのフレームの画像複雑さ指標と相関関係があるので、画像複雑さ指標を無視した各フレームの符号量割り当てでは、各フレームの画質にムラが生じることとなる。また、符号化の時点でのデコーダ・バッファの占有率を勘案した符号量割り当てでは、より多くの符号量が欲しい場合に、バッファの余地が少ないために大きな符号量を割り当てられず画質劣化が生じ、少ない符号量で十分の画質が得られる場合でも、バッファの余地が大きいために多くの符号量を割り当ててしまう。
【0007】
一方、単純に、画像複雑さ指標に基づいて、各フレームの符号量割り当てを行うと、デコーダ・バッファが、オーバーフローや、アンダーフローを起こしてしまう結果となる。
【0008】
本発明は、以上の点に鑑みてなされたものであり、ビデオ・シーケンスを構成する各フレームの画像複雑さ指標に基づいて、各フレームに最適な符号量を割り当てる装置および方法を提供することを目的とする。
【0009】
【課題を解決するための手段】
上記課題を解決するため、請求項1に記載の発明は、ビデオ信号を符号化して記録媒体に記録する圧縮符号化データ記録における符号量割り当て装置であって、ビデオ信号に含まれる複数の所定数の画像フレームを有する画像群の目標符号発生量を、それぞれの画像群の画像複雑さ指標に基づいて求め、それぞれの画像群のバッファ占有率であってフレームのデータ発生前のバッファ占有率を算出する画像群バッファ占有率算出手段と、前記算出された画像群のバッファ占有率が、予め設定されたバッファ占有率の上限値と下限値との間の範囲内に収まるように、前記画像群のバッファ占有率を補正し、当該画像群単位で符号量を割り当てる画像群符号量割当手段と、前記符号量が割り当てられた画像群内における最初のフレームの目標符号発生量を、それぞれの最初のフレームの画像複雑さ指標に基づいて求め、それぞれの最初のフレームのデータ発生後のバッファ占有率を算出する第1フレームバッファ占有率算出手段と、前記算出された最初のフレームのバッファ占有率が、予め設定されたバッファ占有率の上限値を超えないように、前記最初のフレームのバッファ占有率を補正し、当該最初のフレームに符号量を割り当てる第1フレーム符号量割当手段と、前記符号量が割り当てられた画像群内における最初のフレーム以外のフレームの目標符号発生量を、それぞれのフレームの画像複雑さ指標に基づいて求め、それぞれのフレームのデータ発生後のバッファ占有率を算出する第2フレームバッファ占有率算出手段と、前記算出された最初のフレーム以外のフレームのバッファ占有率が、予め設定されたバッファ占有率の上限値と下限値との間の範囲内に収まるように、前記最初のフレーム以外のフレームのバッファ占有率を補正し、当該フレームに符号量を割り当てる第2フレーム符号量割当手段と、を備え、 前記画像群符号量割当手段は、前記算出されたそれぞれの画像群のバッファ占有率が、予め設定されたバッファ占有率の上限値より大きいか否か、および予め設定されたバッファ占有率の下限値より小さいか否かを判断し、前記上限値より大きい画像群については、当該画像群のバッファ占有率と予め設定されたバッファ占有率の上限値との比を上限画像群補正比率として算出し、前記下限値より小さい画像群については、当該画像群のバッファ占有率と予め設定されたバッファ占有率の下限値との比を下限画像群補正比率として算出し、前記算出された上限画像群補正比率のうち最も大きい上限画像群補正比率を、基準となる初期バッファ占有率より大きい前記画像群のバッファ占有率に乗算して補正し、前記算出された下限画像群補正比率のうち最も大きい下限画像群補正比率を、基準となる初期バッファ占有率より小さい前記画像群のバッファ占有率に乗算して補正し、当該画像群単位で符号量を割り当てるように構成する。
【0010】
このように構成された発明によれば、ビデオ信号に含まれる複数の所定数の画像フレームを有する画像群の目標符号発生量が、それぞれの画像群の画像複雑さ指標に基づいて求められ、それぞれの画像群のバッファ占有率であってフレームのデータ発生前のバッファ占有率が算出される。次に、前記算出された画像群のバッファ占有率が、予め設定されたバッファ占有率の上限値と下限値との間の範囲内に収まるように、前記画像群のバッファ占有率が補正され、当該画像群単位で符号量が割り当てられる(第1の段階)。次に、前記符号量が割り当てられた画像群内における最初のフレームの目標符号発生量が、それぞれの最初のフレームの画像複雑さ指標に基づいて求められ、それぞれの最初のフレームのデータ発生後のバッファ占有率が算出される。次に、前記算出された最初のフレームのバッファ占有率が、予め設定されたバッファ占有率の上限値を超えないように、前記最初のフレームのバッファ占有率が補正され、当該最初のフレームに符号量が割り当てられる(第2の段階)。次に、前記符号量が割り当てられた画像群内における最初のフレーム以外のフレームの目標符号発生量が、それぞれのフレームの画像複雑さ指標に基づいて求められ、それぞれのフレームのデータ発生後のバッファ占有率が算出される。前記算出された最初のフレーム以外のフレームのバッファ占有率が、予め設定されたバッファ占有率の上限値と下限値との間の範囲内に収まるように、前記最初のフレーム以外のフレームのバッファ占有率が補正され、当該フレームに符号量が割り当てられる(第3の段階)。
【0011】
従って、画像複雑さ指標に基づいて求められた符号発生量が、3段階で補正(画像群単位のバッファ占有率の補正、最初のフレームのバッファ占有率の補正、最初のフレーム以外のフレームのバッファ占有率の補正)されることより、デコーダ・バッファにおいてオーバーフローや、アンダーフローの無い最適な符号量を各フレームに割り当てることができ、より高画質を実現することができる。また、第2段階において、第3段階に先立ち、最初のフレームの符号量の割り当てを行うことで、極力、最初のフレームの発生符号量を維持することができるので、より綺麗な画像を再生することができる。
【0012】
請求項2に記載の発明は、請求項1に記載の符号量割り当て装置において、前記第1フレーム符号量割当手段は、前記算出された最初のフレームのバッファ占有率が、予め設定されたバッファ占有率の上限値より大きいか否か判断し、当該上限値より大きい場合には、前記最初のフレームバッファ占有率が、前記予め設定されたバッファ占有率の上限値と等しくなるように補正し、前記最初のフレームに符号量を割り当てるように構成する。
【0013】
請求項3に記載の発明は、請求項1に記載の符号量割り当て装置において、前記第1フレーム符号量割当手段は、前記算出された最初のフレームのバッファ占有率が、予め設定されたバッファ占有率の下限値より小さいか否か判断し、当該下限値より小さい場合には、前記最初のフレームバッファ占有率が、前記予め設定されたバッファ占有率の下限値と等しくなるように補正し、前記最初のフレームに符号量を割り当てるように構成する。
【0014】
請求項5に記載の発明は、ビデオ信号を符号化して記録媒体に記録する圧縮符号化データ記録における符号量割り当て装置であって、ビデオ信号に含まれる複数の所定数の画像フレームを有する画像群の目標符号発生量を、それぞれの画像群の画像複雑さ指標に基づいて求め、それぞれの画像群のバッファ占有率であってフレームのデータ発生前のバッファ占有率を算出する画像群バッファ占有率算出手段と、前記算出された画像群のバッファ占有率が、予め設定されたバッファ占有率の上限値と下限値との間の範囲内に収まるように、前記画像群のバッファ占有率を補正し、当該画像群単位で符号量を割り当てる画像群符号量割当手段と、前記符号量が割り当てられた画像群内における最初のフレームの目標符号発生量を、それぞれの最初のフレームの画像複雑さ指標に基づいて求め、それぞれの最初のフレームのデータ発生後のバッファ占有率を算出する第1フレームバッファ占有率算出手段と、前記算出された最初のフレームのバッファ占有率が、予め設定されたバッファ占有率の上限値を超えないように、前記最初のフレームのバッファ占有率を補正し、当該最初のフレームに符号量を割り当てる第1フレーム符号量割当手段と、前記符号量が割り当てられた画像群内における最初のフレーム以外のフレームの目標符号発生量を、それぞれのフレームの画像複雑さ指標に基づいて求め、それぞれのフレームのデータ発生後のバッファ占有率を算出する第2フレームバッファ占有率算出手段と、前記算出された最初のフレーム以外のフレームのバッファ占有率が、予め設定されたバッファ占有率の上限値と下限値との間の範囲内に収まるように、前記最初のフレーム以外のフレームのバッファ占有率を補正し、当該フレームに符号量を割り当てる第2フレーム符号量割当手段と、を備え、前記第2フレーム符号量割当手段は、前記算出された最初のフレーム以外のフレームのバッファ占有率が、予め設定されたバッファ占有率の上限値より大きいか否か、および、予め設定されたバッファ占有率の下限より小さいか否かを判断し、前記上限値より大きい前記フレームのバッファ占有率または前記下限値より小さい前記フレームのバッファ占有率と、予め求められたラインであって前記第1フレーム符号量割当手段により符号量が割り当てられた最初のフレームのバッファ占有率と、当該最初のフレームを有する画像群内における最後のフレームのバッファ占有率との間にひかれた理想ライン上のバッファ占有率との第1の差分を算出するとともに、前記バッファ占有率の上限値または下限値と、前記予め求められた理想ライン上のバッファ占有率との第2の差分を算出し、前記第1の差分と前記第2の差分との比をフレーム補正比率として算出し、当該算出されたフレーム補正比率のうち最も大きいフレーム補正比率を、前記上限値または前記下限値のそれぞれについて求め、当該フレーム補正比率を最初のフレーム以外のフレームのバッファ占有率に乗算して補正し、当該フレームに符号量を割り当てるように構成する。
【0015】
請求項6に記載の発明は、ビデオ信号を符号化して記録媒体に記録する圧縮符号化データ記録における符号量割り当て方法であって、ビデオ信号に含まれる複数の所定数の画像フレームを有する画像群の目標符号発生量を、それぞれの画像群の画像複雑さ指標に基づいて求め、それぞれの画像群のバッファ占有率であってフレームのデータ発生前のバッファ占有率を算出する画像群バッファ占有率算出工程と、前記算出された画像群のバッファ占有率が、予め設定されたバッファ占有率の上限値と下限値との間の範囲内に収まるように、前記画像群のバッファ占有率を補正し、当該画像群単位で符号量を割り当てる画像群符号量割当工程と、前記符号量が割り当てられた画像群内における最初のフレームの目標符号発生量を、それぞれの最初のフレームの画像複雑さ指標に基づいて求め、それぞれの最初のフレームのデータ発生後のバッファ占有率を算出する第1フレームバッファ占有率算出工程と、前記算出された最初のフレームのバッファ占有率が、予め設定されたバッファ占有率の上限値を超えないように、前記最初のフレームのバッファ占有率を補正し、当該最初のフレームに符号量を割り当てる第1フレーム符号量割当工程と、前記符号量が割り当てられた画像群内における最初のフレーム以外のフレームの目標符号発生量を、それぞれのフレームの画像複雑さ指標に基づいて求め、それぞれのフレームのデータ発生後のバッファ占有率を算出する第2フレームバッファ占有率算出工程と、前記算出された最初のフレーム以外のフレームのバッファ占有率が、予め設定されたバッファ占有率の上限値と下限値との間の範囲内に収まるように、前記最初のフレーム以外のフレームのバッファ占有率を補正し、当該フレームに符号量を割り当てる第2フレーム符号量割当工程と、を備え、前記画像群符号量割当工程は、前記算出されたそれぞれの画像群のバッファ占有率が、予め設定されたバッファ占有率の上限値より大きいか否か、および予め設定されたバッファ占有率の下限値より小さいか否かを判断し、前記上限値より大きい画像群については、当該画像群のバッファ占有率と予め設定されたバッファ占有率の上限値との比を上限画像群補正比率として算出し、前記下限値より小さい画像群については、当該画像群のバッファ占有率と予め設定されたバッファ占有率の下限値との比を下限画像群補正比率として算出し、前記算出された上限画像群補正比率のうち最も大きい上限画像群補正比率を、基準となる初期バッファ占有率より大きい前記画像群のバッファ占有率に乗算して補正し、前記算出された下限画像群補正比率のうち最も大きい下限画像群補正比率を、基準となる初期バッファ占有率より小さい前記画像群のバッファ占有率に乗算して補正し、当該画像群単位で符号量を割り当てるように構成する。
【0016】
請求項7に記載の発明は、請求項6に記載の符号量割り当て方法において、前記第1フレーム符号量割当工程は、前記算出された最初のフレームのバッファ占有率が、予め設定されたバッファ占有率の上限値より大きいか否か判断し、当該上限値より大きい場合には、前記最初のフレームバッファ占有率が、前記予め設定されたバッファ占有率の上限値と等しくなるように補正し、前記最初のフレームに符号量を割り当てるように構成する。
【0017】
請求項8に記載の発明は、請求項6に記載の符号量割り当て方法において、前記第1フレーム符号量割当工程は、前記算出された最初のフレームのバッファ占有率が、予め設定されたバッファ占有率の下限値より小さいか否か判断し、当該下限値より小さい場合には、前記最初のフレームバッファ占有率が、前記予め設定されたバッファ占有率の下限値と等しくなるように補正し、前記最初のフレームに符号量を割り当てるように構成する。
【0018】
請求項10に記載の発明は、ビデオ信号を符号化して記録媒体に記録する圧縮符号化データ記録における符号量割り当て方法であって、ビデオ信号に含まれる複数の所定数の画像フレームを有する画像群の目標符号発生量を、それぞれの画像群の画像複雑さ指標に基づいて求め、それぞれの画像群のバッファ占有率であってフレームのデータ発生前のバッファ占有率を算出する画像群バッファ占有率算出工程と、前記算出された画像群のバッファ占有率が、予め設定されたバッファ占有率の上限値と下限値との間の範囲内に収まるように、前記画像群のバッファ占有率を補正し、当該画像群単位で符号量を割り当てる画像群符号量割当工程と、前記符号量が割り当てられた画像群内における最初のフレームの目標符号発生量を、それぞれの最初のフレームの画像複雑さ指標に基づいて求め、それぞれの最初のフレームのデータ発生後のバッファ占有率を算出する第1フレームバッファ占有率算出工程と、前記算出された最初のフレームのバッファ占有率が、予め設定されたバッファ占有率の上限値を超えないように、前記最初のフレームのバッファ占有率を補正し、当該最初のフレームに符号量を割り当てる第1フレーム符号量割当工程と、前記符号量が割り当てられた画像群内における最初のフレーム以外のフレームの目標符号発生量を、それぞれのフレームの画像複雑さ指標に基づいて求め、それぞれのフレームのデータ発生後のバッファ占有率を算出する第2フレームバッファ占有率算出工程と、前記算出された最初のフレーム以外のフレームのバッファ占有率が、予め設定されたバッファ占有率の上限値と下限値との間の範囲内に収まるように、前記最初のフレーム以外のフレームのバッファ占有率を補正し、当該フレームに符号量を割り当てる第2フレーム符号量割当工程と、を備え、前記第2フレーム符号量割当工程は、前記算出された最初のフレーム以外のフレームのバッファ占有率が、予め設定されたバッファ占有率の上限値より大きいか否か、および、予め設定されたバッファ占有率の下限より小さいか否かを判断し、前記上限値より大きい前記フレームのバッファ占有率または前記下限値より小さい前記フレームのバッファ占有率と、予め求められたラインであって前記第1フレーム符号量割当工程により符号量が割り当てられた最初のフレームのバッファ占有率と、当該最初のフレームを有する画像群内における最後のフレームのバッファ占有率との間にひかれた理想ライン上のバッファ占有率との第1の差分を算出するとともに、前記バッファ占有率の上限値または下限値と、前記予め求められた理想ライン上のバッファ占有率との第2の差分を算出し、前記第1の差分と前記第2の差分との比をフレーム補正比率として算出し、当該算出されたフレーム補正比率のうち最も大きいフレーム補正比率を、前記上限値または前記下限値のそれぞれについて求め、当該フレーム補正比率を最初のフレーム以外のフレームのバッファ占有率に乗算して補正し、当該フレームに符号量を割り当てるように構成する
【0043】
【発明の実施の形態】
以下、図面を参照して本発明の好適な実施の形態について説明する。
【0044】
以下に説明する実施の形態は、ビデオ信号をMPEG方式により符号化して記録媒体に記録する圧縮符号化データ記録における符号量割り当て装置(以下「MPEGエンコーダ」と称す。)において、各フレームへの最適な符号量の割り当てに関して本発明を適用した場合の実施形態である。なお、記録媒体には、DVD−ROM、DVD−RAM、DVD−RW、CD−ROM、ハードディスクなどが含まれる。
【0045】
本発明の実施形態を具体的に説明する前に、MPEGエンコーダにより作成され、記録媒体に記録されたビデオ・シーケンス(以下「ビット・ストリーム(符号化されたデータ列)」と称す)が、MPEG方式による復号を行う復号装置(以下「MPEGデコーダ」と称す。)でデコードされる際の流れを図1および図2を参照して説明する。図1は、MPEGデコーダの理想(仮想)モデル(STD:System Target Decoder)を示す図である。この理想モデルは、VBV(Video Buffer Verifier)バッファ10と、MPEGデコータ20と、整列用バッファ30を備える。図2は、VBVバッファ10のデータ占有率(%)の推移状況を示す図である。なお、ここでは、流れを簡単に説明するため、固定ビットレート、固定フレームレートとするが、可変であっても同じ事がいえる。
【0046】
図1に示すように、MPEGエンコーダにより作成されたビット・ストリームは、ビットレートRでVBVバッファ10に入力され、蓄積されていく。こうして、図2の符号50部に示すように、徐々に、VBVバッファ10のデータ占有量(bits)が増していくこととなる。ここで、ビットレートRとは、フレーム間にVBVバッファ10に入力されるデータ量(bits)をいい、ビットレートR=ビットレート/フレームレートを示すものである。また、ビット・ストリームは、VSH(Video Sequence Header)などの各種ヘッダ情報と、所定数の画像フレームを有する画像群であるGOP(Group Of Picture)から構成される。GOPは1個以上のピクチャから構成され、1つのピクチャが1フレームを示している。このピクチャには、フレーム内符号のみから構成(予測符号化なし)されるIピクチャ(Intra-Picture)と、前方向のみのフレーム間予測符号から構成(フレーム間順方向予測符号化)されるPピクチャ(Predictive-Picture)と、前後の双方向のフレーム間予測符号から構成(双方向予測符号化)されるBピクチャ(Bidirectionally predictive-Picture)の3種類がある。通常、GOPのフレーム構造は、最初にIピクチャ、その後、Pピクチャ、Bピクチャが続いている。それぞれピクチャの平均的な符号発生量は、Iピクチャ>Pピクチャ>Bピクチャの順となる。ピクチャは任意の領域に分割された複数のスライスから構成される。スライスは左から右へ、または上から下への順序で並んだ複数のマクロブロックから構成される。
【0047】
次に、VBVバッファ10に入力されたビット・ストリームが、ビットストリーム中に指定された図2に示す初期バッファ占有量(B'0)分のデータ量に達すると、1フレーム分のデータが、VBVバッファ10からMPEGデコーダ20に瞬時に転送される。これにより、図2に示すように、転送された符号量(d0)分、VBVバッファ10のデータ占有量(bits)が減少する。また、引き続きビットストリームが、VBVバッファ10に蓄積されていく。次のフレームのデータについても、次のフレームのデコードすべき時間に達すると、VBVバッファ10からMPEGデコーダ20に瞬時に転送される。以降も、VBVバッファ10に入力されたビット・ストリームは、各フレームのデコードすべき時間に達する毎に転送される。ここで、図2に示す「B」は、VBVバッファサイズ(bits)を、「B'N」は、第Nフレームのデータを取り除く(転送)前のVBVバッファ占有量(bits)を、「BN」は、第Nフレームのデータを取り除いた後のVBVバッファ占有量(bits)を、「dN」は、第Nフレームの符号量(bits)を、それぞれ示している。また、図2の例では、最初のフレームがIピクチャのため、そのバッファ占有量(B'0)が、これ以降のフレームのバッファ占有量(例えば、B'N)より大きくなっている。
【0048】
次に、MPEGデコーダ20に転送された1フレームのデータは、瞬時にデコード(復号)され、画像データとして出力される。この時、フレームの順番の入れ替えが必要な場合、例えば、そのフレームがBピクチャの場合には、整列バッファ30にて、フレームの順番を入れ替えられ出力される。
【0049】
このように、入力されたビット・ストリームは、MPEGデコーダ20にてデコード(復号)されるが、この時、VBVバッファ10が、図3に示すように、オーバーフローや、アンダーフローを起こさないように、MPEGエンコーダでは、BN≧0、かつ、B’N≦Bの条件を保証しなければならない。つまり、MPEGエンコーダは、かかる条件を満足するように、各フレームに最適な符号量の割り当てを行い、ビット・ストリームを作成する必要がある。
【0050】
以下に、MPEGエンコーダにおける各フレームへの最適な符号量の割り当てに関して本発明の実施形態を図4乃至図14を参照して具体的に説明する。
【0051】
図4は、本発明の実施形態にかかるMPEGエンコーダ100の概略構成図である。図1に示すように、MPEGエンコーダ100は、取得部50と、動き検出部51と、符号化部52と、最適符号量計算部53と、発生符号量計算部54と、量子化制御部55と、マルチプレクサ56と、バッファメモリ57と、を備えている。
【0052】
先ず、MPEGエンコーダ100の動作を簡単に説明する。
【0053】
取得部50は、入力ディジタルビデオ信号から画像データを1フレーム毎に取得してフィールド間引きなどの所定の処理を行う。また、取得したフレームのピクチャ種別を判別し、フレームの順番の変更が必要な場合、例えば、Bピクチャである場合には、フレームの順番の変更も行う。動き検出部51は、16×16画素のマクロブロック単位で、入力画像の動きベクトルを算出し、フレーム信号Svとして出力する。
【0054】
符号化部52は、加算部52aと、離散コサイン変換部(DCT:Discrete Cosine Transform)52bと、量子化部(Q:Quantization)52cと、可変長符号化部(VLC:Variable Length Coding)52dと、逆量子化部(Q-1)52eと、逆離散コサイン変換部(DCT-1)52fと、フレーム蓄積および動き補償予測部52gと、を備えている。
【0055】
加算部52aは、動き補償予測部52gからの補償信号Seを、動き検出部51からのフレーム信号Svから減算し、減算信号Saとして離散コサイン変換部52bへ出力する。離散コサイン変換部52bは、減算信号Saを8×8画素のブロックで2次元離散コサイン変換し、変換信号Sdとして量子化部52cへ出力する。量子化部52cは、変換信号Sdを後述する量子化制御部55からのレート信号Srに基づいて決定される量子化スケールで量子化し、量子化信号Sqとして可変長符号化部52dおよび逆量子化部52eへ出力する。
【0056】
逆量子化部52eは、量子化信号Sqに対して逆量子化処理を施し、逆量子化信号Sigとして逆離散コサイン変換部(DCT-1)52fへ出力する。逆離散コサイン変換部52fは、逆量子化信号Sigを逆離散コサイン変換し、逆変換信号Sidとして動き補償予測部52gへ出力する。動き補償予測部52gは、逆変換信号Sidと、動き検出部51からのフレーム信号Svに含まれる動きベクトルに基づいて、MPEG方式におけるいわゆるフレーム間予測を用いた動き補償処理を行い、上記補償信号Seを生成して加算部52aに出力する。
【0057】
一方、可変長符号化部52dは、上記量子化信号Sqに対して可変長符号化処理を施し、可変長符号Soutとしてマルチプレクサ56を介してバッファメモリ57へ出力する。こうして、バッファメモリ57から、可変長符号Soutがビット・ストリームとして出力され、記録媒体に記録されることとなる。このとき、発生符号量計算部54は、バッファメモリ57の可変長符号Soutに基づき、実際の発生符号量を計算し、目標値を超える場合には、補正信号Shを量子化制御部55へ出力する。これにより、量子化制御部55は、補正信号Shと、レート信号Srに基づいて量子化スケールを決定する。
【0058】
次に、本発明の特徴部分である各フレームへの最適な符号発生量の割り当て処理について説明する。かかる処理は、最適符号量計算部53にて行われる。最適符号量計算部53は、画像複雑さ指標計算部53aと、画像複雑さ指標蓄積部53bと、セレクタ53cと、符号量割り当て計算部53dと、を備えている。
【0059】
画像複雑さ指標計算部53aは、符号化部52の加算部52aから出力された減算信号Saに基づいて、各フレームの画像複雑さ指標を算出する。画像複雑さ指標は、分散、或いは、平均絶対値誤差で現され、各フレームの符号発生量と比例関係(或いは、何らかの関数、例えば、指数関数)にある。例えば、画像複雑さ指標として、Iピクチャでは分散を、Pピクチャ、Bピクチャでは差分画像の分散を、それぞれ使用する。画像複雑さ指標蓄積部53bは、画像複雑さ指標計算部53aで算出された画像複雑さ指標を蓄積する。そして、全てのフレームの画像複雑さ指標が算出された後、かかる画像複雑さ指標のデータが、画像複雑さ指標蓄積部53bからセレクタ53cを介して、符号割り当て計算部53dへ出力される。但し、第1回目のGOP内の各フレームの画像複雑さ指標は、画像複雑さ指標計算部53aにて計算できないため、予め、ある比率で設定した画像複雑さ指標を、シーケンス情報として、セレクタ53cから取り込み、符号割り当て計算部53dへ出力する。そして、符号割り当て計算部53dは、各フレームの画像複雑さ指標に基づいて、各フレームに最適な符号量を割り当てるための計算を行う。かかる計算は、図5に示すように、大きく3段階に分けることができる。第1の段階はGOP単位での符号発生量の補正、第2の段階は最初のフレームの符号発生量の補正、第3の段階はフレーム単位での符号発生量の補正である。
【0060】
(1)GOP単位での符号発生量の補正
以下に、第1の段階のGOP単位での符号発生量の補正について、図6および図7を参照して説明する。図6は、符号割り当て計算部53dによるGOP単位での符号発生量の補正の処理を示すフローチャートを、図7は、GOP単位での符号発生量の補正におけるバッファ占有率(%)を示す図である。
【0061】
先ず、各フレームの画像複雑さ指標に基づいて、各GOPの目標符号発生量(bits)が算出される(S1)。例えば、目標総符号発生量(目標ビットレート(bps)×秒数(s))をT、総画像複雑さ指標をS、第i番目GOPの画像複雑さ指標をSGiとした場合、第i番目のGOPの目標符号発生量(TGi)は、式(数1)によって算出される。
【0062】
TGi=T・SGi/S (数1)
ここで、以降の説明に度々使用する画像複雑さ指標、目標符号発生量について、フレーム単位、GOP単位、総GOPで表した時の相互関係を図15に示しておく。
【0063】
次に、求められた各GOPの目標符号発生量(bits)に基づいて、各GOPの開始時点でのVBVバッファ占有率(%)(フレームデータ発生前)が算出される(S2)。例えば、VBVバッファサイズ(bits)をB、第i番目GOPのフレーム数をNGi、各フレーム毎のバッファの減少量(bits)をRとした場合、第i+1番目のGOPの開始時点でのVBVバッファ占有率(BLi+1,0)は、式(数2)によって算出される。
【0064】
BLi+1,0=BLi,0+(TGi−R・NGi)/B (数2)
但し、第1番目のGOPの開始時点でのVBVバッファ占有率(BLi,0)は、初期バッファ占有率(B0)に一致する。即ち、BLi,0=B0となる。
【0065】
こうして、全てのGOPの開始時点のVBVバッファ占有率(%)が算出されると、後述するオーバーフロー側のGOP補正比率(RGmax)が「1」に、アンダーフロー側のGOP補正比率(RGmin)が「1」に設定される(S3)。このRGmax、RGminは、GOP単位での符号発生量の補正にあたり使用されるパラメータであり、初期段階では「1」(即ち、補正無しを示す)に設定される。
【0066】
次に、GOPの開始時点のVBVバッファ占有率(%)が、予め設定されたVBVバッファ占有率(%)のGOP上限値(LUG)より大きいGOPがあるか否か(オーバーフローのGOPがあるか否か)が判断される(S4)。例えば、図7に示すように、第N−2番目のGOPの開始時点でのVBVバッファ占有率(BLN-2,0)が、VBVバッファ占有率(%)のGOP上限値(LUG)を超えた場合には、オーバーフローと判断される。そして、オーバーフローと判断されたGOPの全てについて(図7では、BLN-2,0のみであるが実際には、複数存在する)GOP補正比率(RGmax)が算出され、そのうち、最大のGOP補正比率(RGmax)が新たなGOP補正比率(RGmax)として設定される(S5)。初期バッファ占有率(%)をB0とすると、最大のGOP補正比率(RGmax)は、式(数3)によって算出される。
【0067】
RGmax=max((BLi,0−B0)/(LUG−B0)) (数3)
次に、上記GOPの開始時点のVBVバッファ占有率(%)が、予め設定されたVBVバッファ占有率(%)のGOP下限値(LLG)より小さいGOPがあるか否か(アンダーフローのGOPがあるか否か)が判断される(S6)。例えば、図7に示すように、第3番目のGOPの開始時点でのVBVバッファ占有率(BL3,0)が、VBVバッファ占有率(%)のGOP下限値(LLG)を下回った場合には、アンダーフローと判断される。そして、アンダーフローと判断されたGOPの全てについて、GOP補正比率(RGmin)が算出され、そのうち、最大のGOP補正比率(RGmin)が新たなGOP補正比率(RGmin)として設定される(S7)。最大のGOP補正比率(RGmin)は、式(数4)によって算出される。
【0068】
RGmin=max((BLi,0−B0)/(LLG−B0)) (数4)
ここで、GOP上限値(LUG)およびGOP下限値(LLG)は、実際の符号発生量とのズレを見込んで任意に設定することができる。
【0069】
次に、各GOPの開始時点のVBVバッファ占有率(%)について、初期バッファ占有率(B0)より大きいか否かが判断される(S8)。初期バッファ占有率(B0)より大きいと判断されたGOPについては、そのGOPの開始時点のVBVバッファ占有率(%)が、ステップS5で算出された補正比率(RGmax)に基づいて補正される(S9)。即ち、図7に示すように、当該GOP内の全てのフレームのバッファ占有率(%)が、補正比率(RGmax)に基づいて、一律に低下(図7の例では、実線のバッファ占有率(%)から破線のバッファ占有率(%)に補正)されることとなる。例えば、ステップS9による補正後の第i番目のVBVバッファ占有率(BL’i,0)は、式(数5)によって算出される。
【0070】
BL’i,0=B0+(BLi,0−B0)/RGmax (数5)
次に、各GOPの開始時点のVBVバッファ占有率(%)について、初期バッファ占有率(B0)より小さいか否かが判断される(S10)。初期バッファ占有率(B0)より小さいと判断されたGOPについては、そのGOPの開始時点のVBVバッファ占有率(%)が、ステップS7で算出された補正比率(RGmin)に基づいて補正される(S11)。かかる補正では、当該GOP内の全てのフレームのバッファ占有率(%)が、補正比率(RGmin)に基づいて、一律に上昇されることとなる。例えば、ステップS11による補正後の第i番目のVBVバッファ占有率(BL’i,0)は、式(数6)によって算出される。
【0071】
BL’i,0=B0+(BLi,0−B0)/RGmin (数6)
こうして、各GOPの開始時点のVBVバッファ占有率(%)の補正が行われると、これらの補正結果による各GOPの割り当て符号量が算出される(S12)。例えば、第i番目GOPのフレーム数をNGi、各フレーム毎のVBVバッファの減少量(bits)をRとした場合、第i番目のGOPの割り当て符号量(TG’i)は、式(数7)によって算出される。
【0072】
TG’i=R・NGi+(BLi+1,0−BLi,0)・B (数7)
ここで、BLi+1,0、BLi,0には、ステップS7、若しくはステップS9にて補正されたものは補正後のBL’i+1,0、BL’i,0を、補正されていないものはステップS3で算出されたBLi+1,0、BLi,0を使用する。
【0073】
このように、第1の段階では、GOP単位での符号発生量の補正を行い、各GOPに符号量が割り当てられる。これにより、先ず、GOP単位で、オーバーフロー、アンダーフローの発生を極力抑えることができる。
【0074】
なお、符号化するシーケンスがGOP構造を持たず、かつ、シーケンスが短い場合には、全体を1つのGOPとみなし、上記処理をスキップするように構成する。また、符号化するシーケンスがGOP構造を持たず、かつ、シーケンスが長い場合には、全体を複数のシーケンスに分割し、それぞれをGOPとみなして上記処理を行うように構成する。
【0075】
(2)最初のフレームの符号発生量の補正
上記第1の段階の補正では、GOP内の各フレーム毎のVBVバッファ占有率(%)は考慮せず、GOP単位でVBVバッファ占有率(%)を考慮して割り当てる符号量を決定したため、GOP内のフレームのバッファ占有率(%)が、予め設定されたVBVバッファ占有率(%)のフレーム上限値(LUF)より大きくなったり、或いは、VBVバッファ占有率(%)のフレーム下限値(LLF)より小さくなったりする場合がある。かかる場合に、この第2の段階では、最初のフレームの符号発生量を補正し、最初のフレームに最適な符号量を割り当てるものである。そして、最初のフレーム以外のフレームの符号発生量の補正は、第3の段階で行う。
【0076】
以下に、第2の段階の最初のフレームの符号発生量の補正について、図8および図9を参照して説明する。図8は、符号割り当て計算部53dによる最初のフレームの符号発生量の補正の処理を示すフローチャートを、図9は、最初のフレームの符号発生量の補正におけるバッファ占有率(%)を示す図である。
【0077】
先ず、GOPの目標符号発生量(bits)と、最初のフレームの画像複雑さ指標とGOPの画像複雑さ指標との比より、GOPの最初のフレームの目標符号発生量(bits)が算出される(S21)。例えば、第i番目GOPの最初のフレームの画像複雑さ指標をSFi,0、第i番目GOPの画像複雑さ指標をSGiとした場合、第i番目のGOPの最初のフレームの目標符号発生量(bits)(TFi,0)は、式(数8)によって算出される。
【0078】
TFi,0=TGi・SFi,0/SGi (数8)
次に、求められたGOPの開始時点のVBVバッファ占有率(%)に基づいて、その最初のフレームのVBVバッファ占有率(%)(例えば、i番目GOPの最初のフレームのVBVバッファ占有率BUi,0)が式(数9)によって算出される(S22)。
【0079】
BUi,0=BLi,0+TFi,0/B (数9)
次に、かかる最初のフレームのVBVバッファ占有率(%)が、予め設定されたVBVバッファ占有率(%)のフレーム上限値(LUF)より大きいか否か(オーバーフローしているか否か)が判断される(S23)。フレーム上限値(LUF)より大きいと判断された場合、最初のフレームのVBVバッファ占有率(%)が補正される(S24)。例えば、補正後の第i番目のGOPの最初のフレームのバッファ占有率(BU’i,0)は、式(数10)によって算出される。
【0080】
BU’i,0=LUF (数10)
図9の例では、最初のフレームのVBVバッファ占有率(BUi,0)から、フレーム上限値(LUF)を超えた分(X)が差し引かれ、新たなVBVバッファ占有率(BU’i,0)として設定されることを示している。この差し引かれた「X」分の符号量、即ち、本来、最初のフレームに割り当てるべき符号量は、後述する第3の段階の補正にて、後のフレーム(同じGOP内の最初のフレーム以外のフレーム)に補填(比例配分)することとなる。
【0081】
次に、GOPの最初のフレームのVBVバッファ占有率(%)が、予め設定されたVBVバッファ占有率(%)のフレーム下限値(LLF)より小さいか否か(アンダーフローしているか否か)が判断される(S25)。フレーム下限値(LLF)より小さいと判断された場合、最初のフレームのVBVバッファ占有率(%)が補正される(S26)。例えば、補正後の第i番目のGOPの最初のフレームのバッファ占有率(BU’i,0)は、式(数11)によって算出される。
【0082】
BU’i,0=LLF (数11)
ここで、フレーム上限値(LUF)およびフレーム下限値(LLF)は、実際の符号発生量とのズレを見込んで任意に設定することができる。
【0083】
こうして、GOPの最初のフレームのVBVバッファ占有率(%)の補正が行われると、これらの補正結果によるGOPの最初のフレームの割り当て符号量が算出される(S27)。例えば、第i番目のGOPの最初のフレームの割り当て符号量(TF’i,0)は、式(数12)によって算出される。
【0084】
TF’i,0=(BUi,0−BLi,0)・B (数12)
ここで、BUi,0には、ステップS24、若しくはステップS26にて補正されたものは補正後のBU’i,0を、補正されていないものはステップS22で算出されたBUi,0を使用する。
【0085】
なお、最初のフレームの符号発生量の補正は、符号化するシーケンス内の全てのGOPが対象となる。
【0086】
このように、第2の段階では、GOP内の最初のフレームの符号発生量の補正を行い、最初のフレームに最適な符号量が割り当てられる。これにより、最初のフレームの符号量が確定し、これを基準に第3の段階にて、最初のフレーム以外のフレームの符号発生量の補正を行うことができる。このように、最初のフレームの発生符号量を、先ず始めに補正することとしたのは、上述した通り、GOPは、通常、Iピクチャの後に、Pピクチャ、Bピクチャがくるような構造となっており、Pピクチャ、Bピクチャは、Iピクチャのフレームを参照して予測していくものであるため、綺麗な画像を得るには、なるべく、最初のフレームであるIピクチャの符号発生量を維持する必要があるからである。即ち、第2の段階で、最初のフレームのVBVバッファ占有率がオーバーフローにならない場合には、最初のフレームたるIピクチャの符号発生量はそのまま維持され、その後の第3の段階にて補正されない。また、第2の段階で、最初のフレームのVBVバッファ占有率がオーバーフローになる場合にも、最初のフレームであるIピクチャの符号発生量は最小限の補正にとどまり、その後の第3の段階にて補正されないので、綺麗な画像を確保できるのである。
【0087】
(3)フレーム単位での符号発生量の補正
第2の段階の補正では、GOPの最初のフレームの符号発生量を補正し、最適な符号量の割り当てを行なったが、この第3の段階の補正では、最初のフレーム以外のフレームの符号発生量を補正し、最適な符号量の割り当てを行うものである。
【0088】
以下に、第3の段階のフレーム単位での符号発生量の補正について、図10および図11を参照して説明する。図10は、符号割り当て計算部53dによるフレーム単位での符号発生量の補正の処理を示すフローチャートを、図11は、フレーム単位での符号発生量の補正におけるバッファ占有率(%)を示す図である。
【0089】
先ず、GOP内の最初のフレーム以外の各フレームの目標符号発生量(bits)が、各フレームの画像複雑さ指標に基づいて算出される(S31)。各フレームの目標符号発生量(bits)は、GOPに割り当てられた符号量から最初のフレームの符号量を差し引いたものを、画像複雑さ指標で比例配分して算出される。例えば、t=TGi−TFi,0とし、s=SGi−SFi,0とすると、第i番目GOPの第j番目フレームの目標符号発生量(bits)(TFi,j)は、式(数13)によって算出される。
【0090】
TFi,j=t・SFi,j/s (数13)
次に、求められたGOPのフレームの目標符号発生量(bits)に基づいて、フレームデータ発生前と、発生後のVBVバッファ占有率(%)が算出される(S32)。例えば、VBVバッファサイズ(bits)をBとした場合、第i番目GOPの第j番目フレームのデータ発生後のVBVバッファ占有率(BUi,j)は、式(数14)によって算出される。
【0091】
BUi,j=BLi,j+TFi,j/B (数14)
また、式(数13)の「BLi,j」は、第i番目GOPの第j番目フレームのデータ発生前のVBVバッファ占有率(%)を示しており、例えば、式(数15)によって算出される。
【0092】
BLi,j+1=BUi,j−R/B (数15)
こうして、図11に示すBUi,j、BLi,jが算出されると、オーバーフロー側のフレーム補正比率(RFmax)が「1」に、アンダーフロー側のフレーム補正比率(RFmin)が「1」に設定される(S33)。このRFmax、RFminは、フレーム単位での符号発生量の補正にあたり使用されるパラメータであり、初期段階では、「1」(即ち、補正無しを示す)に設定される。
【0093】
次に、図11(A)に示すように、一つのGOP内の最初のフレームのバッファ占有率(%)と、最後のフレームバッファ占有率(%)の間の目標(理想)ラインの値が、算出される(S34)。例えば、第i番目GOPの最初のフレームのVBVバッファ占有率をBUi,0と、第i番目GOPの最後のフレーム(第i番目GOPのフレーム総数(NGi)−1)のVBVバッファ占有率をBUi,NGi-1、とすると、第i番目GOPの第j番目のフレームの目標ラインの値(Kj)は、式(数16)によって算出される。
【0094】
j=BUi,0+(BUi,NGi-1−BUi,0)・j/(NGi−1) (数16)
次に、ステップS32で算出されたフレームのデータ発生後のVBVバッファ占有率(%)が、予め設定されたVBVバッファ占有率(%)のフレーム上限値(LUF)より大きいフレームがあるか否か(オーバーフローのフレームがあるか否か)が判断される(S35)。オーバーフローと判断されたフレームの全てについて、フレーム補正比率(RFmax)が算出され、そのうち、最大のフレーム補正比率(RFmax)が新たなフレーム補正比率(RFmax)として設定される(S36)。最大のフレーム補正比率(RFmax)は、式(数17)によって算出される。
【0095】
RFmax=max((BUi,j−Kj)/(LUF−Kj)) (数17)
次に、ステップS32で算出されたフレームのデータ発生前のVBVバッファ占有率(%)が、予め設定されたVBVバッファ占有率(%)のフレーム下限値(LLF)より小さいフレームがあるか否か(アンダーフローのフレームがあるか否か)が判断される(S37)。アンダーフローと判断されたフレームの全てについて、フレーム補正比率(RFmin)が算出され、そのうち、最大のフレーム補正比率(RFmin)が新たなフレーム補正比率(RFmin)として設定される(S38)。最大のフレーム補正比率(RFmin)は、式(数18)によって算出される。
【0096】
RFmin=max((Kj−BLi,j)/(Kj−LLF)) (数18)
図11(A)では、第i番目GOPの第j番目フレームがアンダーフローを起こしているが、式(数17)の「(Kj−BLi,j)/(Kj−LLF)」は、図11(B)の「a/b」に相当する。同じGOP内のフレームの「a/b」(アンダーフローを起こしているフレームに限る。)のうち、最も大きい値がRFminとして設定される。
【0097】
次に、一つのフレームのデータ発生後のVBVバッファ占有率(%)が目標ラインの値(Kj)より大きく、かつ、そのフレームの次のフレームのデータ発生前のVBVバッファ占有率(%)も目標ラインの値(Kj)より大きいという条件を満たすその一つのフレームがあるか否かが判断される(S39)。例えば、BUi,j>Kj、かつ、BLi,j+1>Kj+1の条件を満たす第j番目のフレームがあるか否か判断される。そのようなフレームがあると判断された場合には、そのフレームのデータ発生後のVBVバッファ占有率(%)が、ステップS36で算出されたフレーム補正比率(RFmax)に基づいて補正される(S40)。例えば、そのようなフレームが第j番目フレームであるとすると、補正後の第j番目フレームのデータ発生後のVBVバッファ占有率(BU’i,j)は、式(数19)によって算出される。
【0098】
BU’i,j=Kj+(BUi,j−Kj)/RFmax (数19)
このような補正は、上記条件を満たす全てのフレームについて行われる。
【0099】
次に、一つのフレームのデータ発生後のVBVバッファ占有率(%)が目標ラインの値(Kj)より小さく、かつ、そのフレームの次のフレームのデータ発生前のVBVバッファ占有率(%)も目標ラインの値(Kj)より小さいという条件を満たすその一つのフレームがあるか否かが判断される(S41)。例えば、BUi,j<Kj、かつ、BLi,j+1<Kj+1の条件を満たす第j番目のフレームがあるか否か判断される。そのようなフレームがあると判断された場合には、そのフレームの次のフレームのデータ発生前のVBVバッファ占有率(%)が、ステップS38で算出されたフレーム補正比率(RFmin)に基づいて補正される(S42)。例えば、そのようなフレームが第j番目フレームであるとすると、補正後の第j+1番目フレームのデータ発生前のVBVバッファ占有率(BL’i,j+1)は、式(数20)によって算出される。
【0100】
BL’i,j+1=Kj+1−(Kj+1−BLi,j+1)/RFmin (数20)
即ち、図11(C)に示すように、最初のフレーム以外のフレームのVBVバッファ占有率(%)がRFmin=b/aで比例補正される。
【0101】
また、BU’i,jとBL’i,j+1との関係は、式(数21)で表される。
【0102】
BU’i,j=BL’i,j+1+R/B (数21)
なお、図10に示す処理は、シーケンス内の全てのGOPについて行われるが、ステップ35にてオーバーフローのフレームもなく、ステップS37にてアンダーフローのフレームもないと判断されたGOPについては、上記補正は行われないこととなる。
【0103】
こうして、GOPの最初のフレーム以外のフレームのVBVバッファ占有率(%)の補正が行われると、これらの補正結果によるGOPの最初のフレーム以外のフレームの割り当て符号量が算出される(S43)。例えば、第i番目GOPのj番目フレームの割り当て符号量(TF’i,j)は、式(数22)によって算出される。
【0104】
TF’i,j=R+(BLi,j+1−BLi,j)・B=R+(BUi,j−BUi,j-1)・B (数22)
ここで、BLi,j+1、BLi,jには、ステップS42にて補正されたものは補正後のBL’i,j+1、BL’i,jを、補正されていないものはステップS32で算出されたBLi,j+1、BLi,jを使用する。また、BUi,j、BUi,j-1には、ステップS40にて補正されたものは補正後のBU’i,j、BU’i,j-1を、補正されていないものはステップS32で算出されたBUi,j、BUi,j-1を使用する。
【0105】
このように、第3の段階では、フレーム単位での符号発生量の補正を行い、各フレーム(最初のフレームを除く)に最適な符号量が割り当てられる。これにより、各フレーム単位のオーバーフロー、アンダーフローを完全に無くすことができる。
【0106】
以上の説明したように、符号割り当て計算部53dは、上記3段階の補正を行い、最適な符号量の割り当てを行なった後、かかる符号量をレート信号Srとして、量子化制御部55へ出力する。そして、上述した通り、符号化部52は、変換信号Sdを量子化制御部55からのレート信号Srに基づいて決定される量子化スケールで量子化して、ビデオ・ストリームを作成して出力する。
【0107】
このように作成されたビデオ・ストリームにより、MPEGデコーダでデコードされる際、オーバーフロー、アンダーフローを発生させずに、かつ、高画質の画像を再生させることができる。
【0108】
図12乃至図14は、上記補正のシミュレーション結果を示すものである。図12は、補正前と後のVBVバッファ占有率(%)および割り当て符号量(bits)をGOP単位で示したものである。図12に示すように、補正前のバッファ占有率55は、バッファ占有率のGOP上限値(LUG=75%)とバッファ占有率のGOP下限値(LLG=15%)の範囲内に無いGOPが存在し、オーバーフロー、アンダーフローを起こしているが、補正後のバッファ占有率56は、かかる範囲内に収まっていることがわかる。また、図13は、補正前と後のVBVバッファ占有率(%)および割り当て符号量(bits)をフレーム単位で示したものであり、オーバーフロー側の補正に関するものである。図14は、補正前と後のVBVバッファ占有率(%)および割り当て符号量(bits)をフレーム単位で示したものであり、アンダーフロー側の補正に関するものである。図13および図14を合わせて見ると、補正前のバッファ占有率60は、図13に示すバッファ占有率のフレーム上限値(LUF=85%)と、図14に示すバッファ占有率のフレーム下限値(LLG=15%)の範囲内に無いフレームが存在し、オーバーフロー、アンダーフローを起こしているが、補正後のバッファ占有率61は、かかる範囲内に収まっていることがわかる。また、かかる補正は、上述した通り、理想ライン62を中心に補正されていることがわかる。
【0109】
なお、上記実施形態においては、上記3段階の補正を行い、最適な符号量を割り当てることとしたが、これに限定されず、例えば、上記第1の段階の補正(GOP単位での符号発生量の補正)のみを行って、最適な符号量を割り当てるようにしてもよく、或いは、上記第2の段階の補正(最初のフレームの符号発生量の補正)および上記第3の段階の補正(フレーム単位での符号発生量の補正)のみを行って、最適な符号量を割り当てるようにしてもよい。
【0110】
また、上記実施形態において、Iピクチャ、Pピクチャ、Bピクチャ、GOPの名称は、MPEG−1、MPEG−2における呼び名であるが、MPEG−4の場合には、IピクチャをI−VOP(Video Object Plane)、PピクチャをP−VOP、BピクチャをB−VOP、GOPをGOV(Group Of VOP)と読み替えることで、同様の機能を実現できる。所定数の画像フレームを有する画像群には、GOVも含まれる。
【0111】
【発明の効果】
以上説明したように、本発明によれば、ビデオ・シーケンスを構成する、各画像群、各フレームの画像複雑さ指標に基づいて算出された符号発生量に対して3段階の補正を行うことにより、オーバーフロー、アンダーフローが発生しない最適な符号量を割り当てることができる。また、最初のフレームの発生符号量の補正は最小限にとどめ、出来る限り最初のフレームの符号発生量を維持することができるので、より綺麗な画像を確保できる。
【図面の簡単な説明】
【図1】本発明の実施形態にかかるMPEGデコーダの理想(仮想)モデルを示す図である。
【図2】本発明の実施形態にかかるVBVバッファのデータ占有量(bits)の推移状況を示す図である。
【図3】図2において、オーバーフロー、アンダーフローがある場合のVBVバッファのデータ占有量(bits)の推移状況を示す図である。
【図4】本発明の実施形態にかかるMPEGエンコーダ100の概略構成図である。
【図5】本発明の実施形態にかかる符号発生量の補正処理を示すフローチャートである。
【図6】本発明の実施形態にかかる符号割り当て計算部によるGOP単位での符号発生量の補正の処理を示すフローチャートである。
【図7】GOP単位での符号発生量の補正におけるバッファ占有率(%)を示す図である。
【図8】本発明の実施形態にかかる符号割り当て計算部による最初のフレームの符号発生量の補正の処理を示すフローチャートである。
【図9】最初のフレームの符号発生量の補正におけるバッファ占有率(%)を示す図である。
【図10】本発明の実施形態にかかる符号割り当て計算部によるフレーム単位での符号発生量の補正の処理を示すフローチャートである。
【図11】フレーム単位での符号発生量の補正におけるバッファ占有率(%)を示す図である。
【図12】補正前と後のVBVバッファ占有率(%)および割り当て符号量(bits)をGOP単位で示した図である。
【図13】補正前と後のVBVバッファ占有率(%)および割り当て符号量(bits)をフレーム単位で示したものであり、オーバーフロー側の補正に関する図である。
【図14】補正前と後のVBVバッファ占有率(%)および割り当て符号量(bits)をフレーム単位で示したものであり、アンダーフロー側の補正に関する図である。
【図15】画像複雑さ指標、目標符号発生量について、フレーム単位、GOP単位、総GOPで表した時の相互関係を示す図である。
【符号の説明】
10…VBVバッファ
20…MPEGデコーダ
30…整列用バッファ
50…取得部
51…動き検出部
52…符号化部
52a…加算部
52b…離散コサイン変換部
52c…量子化部
52d…可変長符号化部
52e…逆量子化部
52f…逆離散コサイン変換部
52g…フレーム蓄積および補償予測部
53…最適符号量計算部
53a…画像複雑さ指標計算部
53b…画像複雑さ指標蓄積部
53c…セレクタ
53d…符号量割り当て計算部
54…発生符号量計算部
55…量子化計算部
56…マルチプレクサ
57…バッファメモリ

Claims (10)

  1. ビデオ信号を符号化して記録媒体に記録する圧縮符号化データ記録における符号量割り当て装置であって、
    ビデオ信号に含まれる複数の所定数の画像フレームを有する画像群の目標符号発生量を、それぞれの画像群の画像複雑さ指標に基づいて求め、それぞれの画像群のバッファ占有率であってフレームのデータ発生前のバッファ占有率を算出する画像群バッファ占有率算出手段と、
    前記算出された画像群のバッファ占有率が、予め設定されたバッファ占有率の上限値と下限値との間の範囲内に収まるように、前記画像群のバッファ占有率を補正し、当該画像群単位で符号量を割り当てる画像群符号量割当手段と、
    前記符号量が割り当てられた画像群内における最初のフレームの目標符号発生量を、それぞれの最初のフレームの画像複雑さ指標に基づいて求め、それぞれの最初のフレームのデータ発生後のバッファ占有率を算出する第1フレームバッファ占有率算出手段と、
    前記算出された最初のフレームのバッファ占有率が、予め設定されたバッファ占有率の上限値を超えないように、前記最初のフレームのバッファ占有率を補正し、当該最初のフレームに符号量を割り当てる第1フレーム符号量割当手段と、
    前記符号量が割り当てられた画像群内における最初のフレーム以外のフレームの目標符号発生量を、それぞれのフレームの画像複雑さ指標に基づいて求め、それぞれのフレームのデータ発生後のバッファ占有率を算出する第2フレームバッファ占有率算出手段と、
    前記算出された最初のフレーム以外のフレームのバッファ占有率が、予め設定されたバッファ占有率の上限値と下限値との間の範囲内に収まるように、前記最初のフレーム以外のフレームのバッファ占有率を補正し、当該フレームに符号量を割り当てる第2フレーム符号量割当手段と、
    を備え、
    前記画像群符号量割当手段は、前記算出されたそれぞれの画像群のバッファ占有率が
    、予め設定されたバッファ占有率の上限値より大きいか否か、および予め設定されたバッファ占有率の下限値より小さいか否かを判断し、前記上限値より大きい画像群については、当該画像群のバッファ占有率と予め設定されたバッファ占有率の上限値との比を上限画像群補正比率として算出し、前記下限値より小さい画像群については、当該画像群のバッファ占有率と予め設定されたバッファ占有率の下限値との比を下限画像群補正比率として算出し、前記算出された上限画像群補正比率のうち最も大きい上限画像群補正比率を、基準となる初期バッファ占有率より大きい前記画像群のバッファ占有率に乗算して補正し、前記算出された下限画像群補正比率のうち最も大きい下限画像群補正比率を、基準となる初期バッファ占有率より小さい前記画像群のバッファ占有率に乗算して補正し、当該画像群単位で符号量を割り当てることを特徴とする符号量割り当て装置。
  2. 請求項1に記載の符号量割り当て装置において、
    前記第1フレーム符号量割当手段は、前記算出された最初のフレームのバッファ占有率が、予め設定されたバッファ占有率の上限値より大きいか否か判断し、当該上限値より大きい場合には、前記最初のフレームバッファ占有率が、前記予め設定されたバッファ占有率の上限値と等しくなるように補正し、前記最初のフレームに符号量を割り当てることを特徴とする符号量割り当て装置。
  3. 請求項1に記載の符号量割り当て装置において、
    前記第1フレーム符号量割当手段は、前記算出された最初のフレームのバッファ占有率が、予め設定されたバッファ占有率の下限値より小さいか否か判断し、当該下限値より小さい場合には、前記最初のフレームバッファ占有率が、前記予め設定されたバッファ占有率の下限値と等しくなるように補正し、前記最初のフレームに符号量を割り当てることを特徴とする符号量割り当て装置。
  4. 請求項1乃至3の何れか一項に記載の符号量割り当て装置において、
    前記第2フレーム符号量割当手段は、前記算出された最初のフレーム以外のフレームのバッファ占有率が、予め設定されたバッファ占有率の上限値より大きいか否か、および、予め設定されたバッファ占有率の下限より小さいか否かを判断し、前記上限値より大きい前記フレームのバッファ占有率または前記下限値より小さい前記フレームのバッファ占有率と、予め求められたラインであって前記第1フレーム符号量割当手段により符号量が割り当てられた最初のフレームのバッファ占有率と、当該最初のフレームを有する画像群内における最後のフレームのバッファ占有率との間にひかれた理想ライン上のバッファ占有率との第1の差分を算出するとともに、前記バッファ占有率の上限値または下限値と、前記予め求められた理想ライン上のバッファ占有率との第2の差分を算出し、前記第1の差分と前記第2の差分との比をフレーム補正比率として算出し、当該算出されたフレーム補正比率のうち最も大きいフレーム補正比率を、前記上限値または前記下限値のそれぞれについて求め、当該フレーム補正比率を最初のフレーム以外のフレームのバッファ占有率に乗算して補正し、当該フレームに符号量を割り当てることを特徴とする符号量割り当て装置。
  5. ビデオ信号を符号化して記録媒体に記録する圧縮符号化データ記録における符号量割り当て装置であって、
    ビデオ信号に含まれる複数の所定数の画像フレームを有する画像群の目標符号発生量を、それぞれの画像群の画像複雑さ指標に基づいて求め、それぞれの画像群のバッファ占有率であってフレームのデータ発生前のバッファ占有率を算出する画像群バッファ占有率算出手段と、
    前記算出された画像群のバッファ占有率が、予め設定されたバッファ占有率の上限値と下限値との間の範囲内に収まるように、前記画像群のバッファ占有率を補正し、当該画像群単位で符号量を割り当てる画像群符号量割当手段と、
    前記符号量が割り当てられた画像群内における最初のフレームの目標符号発生量を、それぞれの最初のフレームの画像複雑さ指標に基づいて求め、それぞれの最初のフレームのデータ発生後のバッファ占有率を算出する第1フレームバッファ占有率算出手段と、
    前記算出された最初のフレームのバッファ占有率が、予め設定されたバッファ占有率の上限値を超えないように、前記最初のフレームのバッファ占有率を補正し、当該最初のフレームに符号量を割り当てる第1フレーム符号量割当手段と、
    前記符号量が割り当てられた画像群内における最初のフレーム以外のフレームの目標符号発生量を、それぞれのフレームの画像複雑さ指標に基づいて求め、それぞれのフレームのデータ発生後のバッファ占有率を算出する第2フレームバッファ占有率算出手段と、
    前記算出された最初のフレーム以外のフレームのバッファ占有率が、予め設定されたバッファ占有率の上限値と下限値との間の範囲内に収まるように、前記最初のフレーム以外のフレームのバッファ占有率を補正し、当該フレームに符号量を割り当てる第2フレーム符号量割当手段と、
    を備え、
    前記第2フレーム符号量割当手段は、前記算出された最初のフレーム以外のフレームのバッファ占有率が、予め設定されたバッファ占有率の上限値より大きいか否か、および、予め設定されたバッファ占有率の下限より小さいか否かを判断し、前記上限値より大きい前記フレームのバッファ占有率または前記下限値より小さい前記フレームのバッファ占有率と、予め求められたラインであって前記第1フレーム符号量割当手段により符号量が割り当てられた最初のフレームのバッファ占有率と、当該最初のフレームを有する画像群内における最後のフレームのバッファ占有率との間にひかれた理想ライン上のバッファ占有率との第1の差分を算出するとともに、前記バッファ占有率の上限値または下限値と、前記予め求められた理想ライン上のバッファ占有率との第2の差分を算出し、前記第1の差分と前記第2の差分との比をフレーム補正比率として算出し、当該算出されたフレーム補正比率のうち最も大きいフレーム補正比率を、前記上限値または前記下限値のそれぞれについて求め、当該フレーム補正比率を最初のフレーム以外のフレームのバッファ占有率に乗算して補正し、当該フレームに符号量を割り当てることを特徴とする符号量割り当て装置。
  6. ビデオ信号を符号化して記録媒体に記録する圧縮符号化データ記録における符号量割り当て方法であって、
    ビデオ信号に含まれる複数の所定数の画像フレームを有する画像群の目標符号発生量を、それぞれの画像群の画像複雑さ指標に基づいて求め、それぞれの画像群のバッファ占有率であってフレームのデータ発生前のバッファ占有率を算出する画像群バッファ占有率算出工程と、
    前記算出された画像群のバッファ占有率が、予め設定されたバッファ占有率の上限値と下限値との間の範囲内に収まるように、前記画像群のバッファ占有率を補正し、当該画像群単位で符号量を割り当てる画像群符号量割当工程と、
    前記符号量が割り当てられた画像群内における最初のフレームの目標符号発生量を、それぞれの最初のフレームの画像複雑さ指標に基づいて求め、それぞれの最初のフレームのデータ発生後のバッファ占有率を算出する第1フレームバッファ占有率算出工程と、
    前記算出された最初のフレームのバッファ占有率が、予め設定されたバッファ占有率の上限値を超えないように、前記最初のフレームのバッファ占有率を補正し、当該最初のフレームに符号量を割り当てる第1フレーム符号量割当工程と、
    前記符号量が割り当てられた画像群内における最初のフレーム以外のフレームの目標符号発生量を、それぞれのフレームの画像複雑さ指標に基づいて求め、それぞれのフレームのデータ発生後のバッファ占有率を算出する第2フレームバッファ占有率算出工程と、
    前記算出された最初のフレーム以外のフレームのバッファ占有率が、予め設定されたバッファ占有率の上限値と下限値との間の範囲内に収まるように、前記最初のフレーム以外のフレームのバッファ占有率を補正し、当該フレームに符号量を割り当てる第2フレーム符号量割当工程と、
    を備え、
    前記画像群符号量割当工程は、前記算出されたそれぞれの画像群のバッファ占有率が、予め設定されたバッファ占有率の上限値より大きいか否か、および予め設定されたバッファ占有率の下限値より小さいか否かを判断し、前記上限値より大きい画像群については、当該画像群のバッファ占有率と予め設定されたバッファ占有率の上限値との比を上限画像群補正比率として算出し、前記下限値より小さい画像群については、当該画像群のバッファ占有率と予め設定されたバッファ占有率の下限値との比を下限画像群補正比率として算出し、前記算出された上限画像群補正比率のうち最も大きい上限画像群補正比率を、基準となる初期バッファ占有率より大きい前記画像群のバッファ占有率に乗算して補正し、前記算出された下限画像群補正比率のうち最も大きい下限画像群補正比率を、基準となる初期バッファ占有率より小さい前記画像群のバッファ占有率に乗算して補正し、当該画像群単位で符号量を割り当てることを特徴とする符号量割り当て方法。
  7. 請求項6に記載の符号量割り当て方法において、
    前記第1フレーム符号量割当工程は、前記算出された最初のフレームのバッファ占有率が、予め設定されたバッファ占有率の上限値より大きいか否か判断し、当該上限値より大きい場合には、前記最初のフレームバッファ占有率が、前記予め設定されたバッファ占有率の上限値と等しくなるように補正し、前記最初のフレームに符号量を割り当てることを特徴とする符号量割り当て方法。
  8. 請求項6に記載の符号量割り当て方法において、
    前記第1フレーム符号量割当工程は、前記算出された最初のフレームのバッファ占有率が、予め設定されたバッファ占有率の下限値より小さいか否か判断し、当該下限値より小さい場合には、前記最初のフレームバッファ占有率が、前記予め設定されたバッファ占有率の下限値と等しくなるように補正し、前記最初のフレームに符号量を割り当てることを特徴とする符号量割り当て方法。
  9. 請求項6乃至8の何れか一項に記載の符号量割り当て方法において、
    前記第2フレーム符号量割当工程は、前記算出された最初のフレーム以外のフレームのバッファ占有率が、予め設定されたバッファ占有率の上限値より大きいか否か、および、予め設定されたバッファ占有率の下限より小さいか否かを判断し、前記上限値より大きい前記フレームのバッファ占有率または前記下限値より小さい前記フレームのバッファ占有率と、予め求められたラインであって前記第1フレーム符号量割当工程により符号量が割り当てられた最初のフレームのバッファ占有率と、当該最初のフレームを有する画像群内における最後のフレームのバッファ占有率との間にひかれた理想ライン上のバッファ占有率との第1の差分を算出するとともに、前記バッファ占有率の上限値または下限値と、前記予め求められた理想ライン上のバッファ占有率との第2の差分を算出し、前記第1の差分と前記第2の差分との比をフレーム補正比率として算出し、当該算出されたフレーム補正比率のうち最も大きいフレーム補正比率を、前記上限値または前記下限値のそれぞれについて求め、当該フレーム補正比率を最初のフレーム以外のフレームのバッファ占有率に乗算して補正し、当該フレームに符号量を割り当てることを特徴とする符号量割り当て方法。
  10. ビデオ信号を符号化して記録媒体に記録する圧縮符号化データ記録における符号量割り当て方法であって、
    ビデオ信号に含まれる複数の所定数の画像フレームを有する画像群の目標符号発生量を、それぞれの画像群の画像複雑さ指標に基づいて求め、それぞれの画像群のバッファ占有率であってフレームのデータ発生前のバッファ占有率を算出する画像群バッファ占有率算出工程と、
    前記算出された画像群のバッファ占有率が、予め設定されたバッファ占有率の上限値と下限値との間の範囲内に収まるように、前記画像群のバッファ占有率を補正し、当該画像群単位で符号量を割り当てる画像群符号量割当工程と、
    前記符号量が割り当てられた画像群内における最初のフレームの目標符号発生量を、それぞれの最初のフレームの画像複雑さ指標に基づいて求め、それぞれの最初のフレームのデータ発生後のバッファ占有率を算出する第1フレームバッファ占有率算出工程と、
    前記算出された最初のフレームのバッファ占有率が、予め設定されたバッファ占有率の上限値を超えないように、前記最初のフレームのバッファ占有率を補正し、当該最初のフレームに符号量を割り当てる第1フレーム符号量割当工程と、
    前記符号量が割り当てられた画像群内における最初のフレーム以外のフレームの目標符号発生量を、それぞれのフレームの画像複雑さ指標に基づいて求め、それぞれのフレームのデータ発生後のバッファ占有率を算出する第2フレームバッファ占有率算出工程と、
    前記算出された最初のフレーム以外のフレームのバッファ占有率が、予め設定されたバッファ占有率の上限値と下限値との間の範囲内に収まるように、前記最初のフレーム以外のフレームのバッファ占有率を補正し、当該フレームに符号量を割り当てる第2フレーム符号量割当工程と、
    を備え、
    前記第2フレーム符号量割当工程は、前記算出された最初のフレーム以外のフレームのバッファ占有率が、予め設定されたバッファ占有率の上限値より大きいか否か、および、予め設定されたバッファ占有率の下限より小さいか否かを判断し、前記上限値より大きい前記フレームのバッファ占有率または前記下限値より小さい前記フレームのバッファ占有率と、予め求められたラインであって前記第1フレーム符号量割当工程により符号量が割り当てられた最初のフレームのバッファ占有率と、当該最初のフレームを有する画像群内における最後のフレームのバッファ占有率との間にひかれた理想ライン上のバッファ占有率との第1の差分を算出するとともに、前記バッファ占有率の上限値または下限値と、前記予め求められた理想ライン上のバッファ占有率との第2の差分を算出し、前記第1の差分と前記第2の差分との比をフレーム補正比率として算出し、当該算出されたフレーム補正比率のうち最も大きいフレーム補正比率を、前記上限値または前記下限値のそれぞれについて求め、当該フレーム補正比率を最初のフレーム以外のフレームのバッファ占有率に乗算して補正し、当該フレームに符号量を割り当てることを特徴とする符号量割り当て方法。
JP2000174064A 2000-06-09 2000-06-09 符号量割り当て装置および方法 Expired - Fee Related JP3889552B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2000174064A JP3889552B2 (ja) 2000-06-09 2000-06-09 符号量割り当て装置および方法
US09/877,077 US6940902B2 (en) 2000-06-09 2001-06-11 Code quantity assignment device and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000174064A JP3889552B2 (ja) 2000-06-09 2000-06-09 符号量割り当て装置および方法

Publications (2)

Publication Number Publication Date
JP2001359097A JP2001359097A (ja) 2001-12-26
JP3889552B2 true JP3889552B2 (ja) 2007-03-07

Family

ID=18676177

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000174064A Expired - Fee Related JP3889552B2 (ja) 2000-06-09 2000-06-09 符号量割り当て装置および方法

Country Status (2)

Country Link
US (1) US6940902B2 (ja)
JP (1) JP3889552B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030185299A1 (en) * 2001-11-30 2003-10-02 Taro Takita Program, recording medium, and image encoding apparatus and method
JP4179917B2 (ja) * 2003-04-22 2008-11-12 株式会社東芝 動画像符号化装置及び方法
JP3675464B2 (ja) * 2003-10-29 2005-07-27 ソニー株式会社 動画像符号化装置および動画像符号化制御方法
BR112012027960A2 (ja) * 2010-05-06 2018-05-08 Nippon Telegraph And Telephone Corporation The image coding control method and a device
CN102986212B (zh) 2010-05-07 2015-11-25 日本电信电话株式会社 活动图像编码控制方法、活动图像编码装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3085465B2 (ja) * 1989-10-31 2000-09-11 オリンパス光学工業株式会社 画像データの符号化装置および符号化方法
JP3614448B2 (ja) * 1993-07-22 2005-01-26 日本放送協会 画像信号符号化多重方法及びその装置
US5563549A (en) * 1995-03-17 1996-10-08 Maxim Integrated Products, Inc. Low power trim circuit and method
US5650860A (en) * 1995-12-26 1997-07-22 C-Cube Microsystems, Inc. Adaptive quantization
TW369747B (en) * 1997-01-16 1999-09-11 Matsushita Electric Ind Co Ltd Image encoding device and the method
US5949490A (en) * 1997-07-08 1999-09-07 Tektronix, Inc. Distributing video buffer rate control over a parallel compression architecture
US6563549B1 (en) * 1998-04-03 2003-05-13 Sarnoff Corporation Method and apparatus for adaptively encoding an information stream
US6434196B1 (en) * 1998-04-03 2002-08-13 Sarnoff Corporation Method and apparatus for encoding video information
JP3395892B2 (ja) * 1999-05-06 2003-04-14 日本電気株式会社 動画像符号化装置

Also Published As

Publication number Publication date
US6940902B2 (en) 2005-09-06
US20020009138A1 (en) 2002-01-24
JP2001359097A (ja) 2001-12-26

Similar Documents

Publication Publication Date Title
JP4256574B2 (ja) 画像信号符号化方法および画像信号符号化装置
JP5180294B2 (ja) ビデオ符号化において、フレームの複雑さ、バッファレベル、およびイントラフレームの位置を利用するバッファベースのレート制御
EP1445958A1 (en) Quantization method and system, for instance for video MPEG applications, and computer program product therefor
US6229849B1 (en) Coding device and method
EP0755610A1 (en) Method and device for transcoding video signals
JP2001169281A (ja) 動画像符号化装置、および動画像符号化方法
JP3259702B2 (ja) 動画像可変ビットレート符号化装置および方法
JP2004274236A (ja) 符号化装置および符号化方法、プログラム、並びに記録媒体
JP3508916B2 (ja) 動画像可変ビットレート符号化方法および装置
JP3889552B2 (ja) 符号量割り当て装置および方法
KR20000070810A (ko) 부호화 장치 및 부호화 방법
JP2001028753A (ja) 動画像符号化装置及びその方法
JP2002199392A (ja) 映像符号化方法および装置
JP4826533B2 (ja) 画像処理装置および画像処理方法、プログラム、並びに、記録媒体
JP4120934B2 (ja) 画像処理装置および画像処理方法、記録媒体、並びに、プログラム
JP4193080B2 (ja) 符号化装置及び方法
JP2001078193A (ja) 動画像圧縮符号化信号変換方法および装置
JP2005033599A (ja) 符号化装置、および、符号化方法、並びに、プログラム
JPH10126792A (ja) 画像符号化方法および装置
JP3918208B2 (ja) 映像データ圧縮装置およびその方法
JPH11205803A (ja) 符号化装置及び符号化方法
JP4035747B2 (ja) 符号化装置および符号化方法
JP4239734B2 (ja) 符号化装置、および、符号化方法、並びに、プログラム
JP4539028B2 (ja) 画像処理装置および画像処理方法、記録媒体、並びに、プログラム
JP4604757B2 (ja) 画像符号化装置および画像符号化方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060502

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060627

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060905

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061102

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061128

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061130

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101208

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101208

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111208

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121208

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees