JP5272940B2 - Image encoding device - Google Patents
Image encoding device Download PDFInfo
- Publication number
- JP5272940B2 JP5272940B2 JP2009168783A JP2009168783A JP5272940B2 JP 5272940 B2 JP5272940 B2 JP 5272940B2 JP 2009168783 A JP2009168783 A JP 2009168783A JP 2009168783 A JP2009168783 A JP 2009168783A JP 5272940 B2 JP5272940 B2 JP 5272940B2
- Authority
- JP
- Japan
- Prior art keywords
- encoding
- coding
- information
- statistical information
- quantization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
本発明は、入力画像の性質や符号化過程に於ける統計情報を基に符号化パラメータをピクチャ単位に切替えて高能率符号化を行う画像符号化装置に関する。 The present invention relates to an image coding apparatus that performs high-efficiency coding by switching coding parameters in units of pictures based on characteristics of an input image and statistical information in the coding process.
動画像の符号化方式の一つとして、MPEG−2(Moving Picture Experts Group−2)が国際標準化されており、DVD(Digital Video Disc /Digital Versatile Disc)映像コンテンツやディジタル放送等の分野に適用されている。このMPEG−2が国際標準化される以前、CD−ROM(Video CD)等の記録媒体用途や、1.5Mbps程度までの回線使用をターゲットとした符号化方式としてMPEG−1が標準化されていた。 MPEG-2 (Moving Picture Experts Group-2) has been internationally standardized as one of the moving image encoding systems, and is applied to the fields of DVD (Digital Video Disc / Digital Versatile Disc) video content and digital broadcasting. ing. Prior to the international standardization of MPEG-2, MPEG-1 was standardized as an encoding method targeting recording media such as CD-ROM (Video CD) and line use up to about 1.5 Mbps.
前述のMPEG−2は、それ以前のMPEG−1に比較して高画質化対策が組み込まれている。代表的な例としては、より高解像度の画像の符号化や、インタレース画像符号化の対策として、フィールドを意識した動き予測による符号化を行うことができる。又符号化も一層汎用的になっている。これらの機能は、付加機能(extension)としてストリーム(データ列)に多重化される。基本的には、MPEG−2は、MPEG−1の上位互換性を有し、MPEG−2の各付加機能レイヤで指定可能な方式のうち、一つはMPEG−1と同じものである。 The above-mentioned MPEG-2 incorporates countermeasures for improving image quality as compared with the previous MPEG-1. As a typical example, field-aware motion prediction can be performed as a countermeasure for higher resolution image encoding and interlaced image encoding. Encoding is also becoming more versatile. These functions are multiplexed into a stream (data string) as an additional function (extension). Basically, MPEG-2 has upward compatibility with MPEG-1, and one of the methods that can be specified in each additional function layer of MPEG-2 is the same as MPEG-1.
このMPEG−2に於ける付加機能レイヤの一つのpicture_coding_extensionについて、その一例を図9に示すものであり、その中の一部について説明すると、
f_code:表現可能な動きベクトルの範囲、
intra_dc_precision:フレーム内符号化ブロックのDCT直流分の精度、
pictuer_structure:符号化構造、
top_field_first:1フレーム内のフィールドの入力順序、
frame_pred_frame_dct:フレーム予測フレームDCTの制限フラグ、
q_scale_type:量子化スケールタイプ、
intra_vlc_format:DCT係数の可変長符号テーブル選択、
alternate_scan:DCT係数の可変長符号化部への入力順序、
progressive_frame:入力信号がプログレッシブか否かの選択、
を示している。
An example of one picture_coding_extension of the additional function layer in MPEG-2 is shown in FIG. 9, and a part of it will be described.
f_code: range of motion vector that can be expressed,
intra_dc_precise: accuracy of DCT DC component of intra-frame coding block,
picture_structure: coding structure,
top_field_first: input order of fields in a frame,
frame_pred_frame_dct: limit flag of frame prediction frame DCT,
q_scale_type: quantization scale type,
intra_vlc_format: DCT coefficient variable length code table selection,
alternate_scan: input order of DCT coefficients to variable-length coding unit,
progressive_frame: selection of whether the input signal is progressive,
Is shown.
又MPEG規格で量子化係数が5ビットで、量子化係数の変化幅が1であると、量子化レベルは1〜31の範囲の整数値となる。そこで、変化幅を例えば標準値の1と、この標準値の1/4の0.25と、標準値の4倍の4とし、量子化レベルを0.25〜7.75と、1〜31と、4〜124との何れかの範囲に選択可能とする手段が提案されている(例えば、特許文献1参照)。
If the quantization coefficient is 5 bits and the change width of the quantization coefficient is 1 according to the MPEG standard, the quantization level is an integer value in the range of 1 to 31. Therefore, for example, the change width is set to 1 of the standard value, 0.25 of 1/4 of the standard value, and 4
前述のMPEG−2に追加されている付加機能(extension)レイヤで選択可能なパラメータは、基本的には、MPEG−1に於いて不得意であった動画像符号化に於ける効率の向上を図るものである。しかし、入力画像の性質や符号化レートによっては、MPEG−1に於ける符号化パラメータを適応的に用いた方が効率の良い符号化が可能な場合も存在する。従来の画像符号化装置に於いては、このような付加機能レイヤのパラメータは、予め設定した固定値とすることにより、入力画像の予測符号化を行うものであった。又前述の特許文献1により提案された画像符号化手段は、固定ビット数による量子化係数の変化幅を選択して量子化を行うものであるが、入力画像の性質に応じて最適な符号化を行うには、不充分なものであった。
The parameters that can be selected in the extension layer added to the above-mentioned MPEG-2 basically improve the efficiency in moving picture coding, which was not good in MPEG-1. It is intended. However, depending on the nature of the input image and the coding rate, there are cases where more efficient coding can be achieved by adaptively using coding parameters in MPEG-1. In the conventional image encoding apparatus, such an additional function layer parameter is set to a preset fixed value to perform predictive encoding of an input image. Also, the image encoding means proposed by the above-mentioned
本発明は、ピクチャ単位で入力画像の性質に従って符号化パラメータを変更可能とし、同一符号化レートによっても高画質の再生画像が可能となる符号化手段を提供することを目的とする。 An object of the present invention is to provide an encoding means that can change an encoding parameter in accordance with the nature of an input image on a picture-by-picture basis and can produce a high-quality reproduced image even at the same encoding rate.
本発明の画像符号化装置は、入力画像の予測符号化を行う符号化手段を有する画像符号化装置であって、入力画像の性質を示す第1の統計情報と、予測符号化の過程に於ける相関情報を基にした第2の統計情報と、符号化パラメータを基にした符号化結果又は符号化過程に於ける第3の統計情報との少なくとも何れか一つの統計情報を取得する取得手段と、この取得手段により取得した統計情報を基にシーン判定を行って、フレーム若しくはフィールド単位で前記符号化手段に於ける符号化パラメータを適応制御する符号化制御手段とを備え、取得手段は、第3の統計情報としてピクチャ内の1マクロブロック当たりの量子化後の有効係数の平均値を取得する構成を有し、符号化制御手段は、有効係数の平均値と予め設定した係数とを比較するシーン判定結果を基に前記符号化手段に於ける可変長符号テーブルを切替えて可変長符号化を行わせる制御構成を有するものである。 An image encoding apparatus according to the present invention is an image encoding apparatus having an encoding unit that performs predictive encoding of an input image. In the process of predictive encoding, first statistical information indicating the nature of an input image is provided. Acquisition means for acquiring at least one statistical information of the second statistical information based on the correlation information and the third statistical information in the encoding result or the encoding process based on the encoding parameter And coding control means for performing scene determination based on statistical information obtained by the obtaining means and adaptively controlling coding parameters in the coding means in units of frames or fields, the obtaining means includes: The third statistical information has a configuration for obtaining an average value of effective coefficients after quantization per macroblock in a picture, and the encoding control means compares the average value of effective coefficients with a preset coefficient. You And it has a control structure to perform variable length coding by switching in the variable length code table in the encoding means based on the scene determination result.
又前記取得手段は、前記第2の統計情報として動きベクトルの水平成分の平均値、水平成分の分散値、垂直成分の平均値、垂直成分の分散を取得する構成を有し、前記符号化手段は、前記第2の統計情報と予め設定した係数とを比較するシーン判定結果を基に前記符号化手段に於ける可変長符号化の為の入力スキャン順序を切替える制御構成を備えることができる。 Further, the acquisition means has a configuration for acquiring, as the second statistical information, an average value of a horizontal component of a motion vector, a variance value of a horizontal component, an average value of a vertical component, and a variance of a vertical component, and the encoding means Can comprise a control configuration for switching the input scan order for variable length encoding in the encoding means based on a scene determination result comparing the second statistical information with a preset coefficient.
又前記取得手段は、前記第3の統計情報として平均量子化値を取得する構成を有し、前記符号化制御手段は、前記平均量子化値と予め設定した係数とを比較するシーン判定結果を基に前記符号化手段に於ける量子化テーブルを切替えて量子化を行わせる制御構成を備えることができる。 The acquisition means has a configuration for acquiring an average quantized value as the third statistical information, and the encoding control means obtains a scene determination result for comparing the average quantized value with a preset coefficient. Based on this, it is possible to provide a control configuration for performing quantization by switching the quantization table in the encoding means.
本発明は、入力画像の性質を示すアクティビティ等の第1の統計情報と、予測符号化の過程に於ける相関情報の動きベクトル等の第2の統計情報と、符号化パラメータを基にした符号化結果の符号化情報量や符号化過程の量子化平均値等の第3の統計情報との少なくとも何れか一つ或いは複数の統計情報を用いて、フレーム若しくはフィールド単位で符号化手段に於ける符号化パラメータを適用制御して、符号化情報量を増大することなく、入力画像に最適な符号化を行わせることができる利点がある。 The present invention provides first statistical information such as an activity indicating the nature of an input image, second statistical information such as a motion vector of correlation information in the process of predictive coding, and a code based on a coding parameter. In the encoding means on a frame or field basis, using at least one or a plurality of statistical information of the third statistical information such as the amount of encoded information of the encoding result and the quantization average value of the encoding process There is an advantage that optimal encoding can be performed on an input image without increasing the amount of encoded information by controlling the application of encoding parameters.
本発明の画像符号化装置は、図1を参照して説明すると、入力画像の予測符号化を行う符号化手段を有する画像符号化装置であって、入力画像の性質を示す第1の統計情報と、予測符号化の過程に於ける相関情報を基にした第2の統計情報と、符号化パラメータを基にした符号化結果又は符号化過程に於ける第3の統計情報との少なくとも何れか一つの統計情報を取得する取得手段、例えば、入力画像情報統計取得器14と動き情報統計取得器15と符号化情報統計取得器16等を含む取得手段と、この取得手段により取得した統計情報を基にシーン判定を行って、フレーム若しくはフィールド単位で前記符号化手段に於ける符号化パラメータを適応制御する符号化制御手段とを備え、取得手段は、第3の統計情報としてピクチャ内の1マクロブロック当たりの量子化後の有効係数の平均値を取得する構成を有し、符号化制御手段は、有効係数の平均値と予め設定した係数とを比較するシーン判定結果を基に前記符号化手段に於ける可変長符号テーブルを切替えて可変長符号化を行わせる制御構成を有するものである。
Referring to FIG. 1, the image coding apparatus of the present invention is an image coding apparatus having coding means for performing predictive coding of an input image, and includes first statistical information indicating the nature of the input image. And / or second statistical information based on the correlation information in the predictive encoding process and encoding result based on the encoding parameter or third statistical information in the encoding process Acquisition means for acquiring one piece of statistical information, for example, acquisition means including an input image information
図1は本発明の実施例1の説明図であり、1はフレームメモリ、2は原画MB(マクロブロック)読出部、3は参照ブロック読出部、4は動きベクトル探索器、5は予測判定器、6は符号化器、7は局所復号化器、8,9は切替部、10は加算器、11は減算器、12は符号化制御部、13はヘッダ情報生成部、14は入力画像情報統計取得器、15は動き情報統計取得器、16は符号化情報統計取得器、17はシーン判定器を示す。
FIG. 1 is an explanatory diagram of
フレームメモリ1は、入力画像情報を蓄積する領域と、参照画像情報を蓄積する領域とを含み、入力画像領域からマクロブロック単位で原画MB読出部2によって読出し、又参照画像領域の探索範囲内のマクロブロック単位で参照ブロック読出部3により読出し、動きベクトル探索器4により動きベクトルを求めて予測判定器5に入力する。又符号化器6は、DCT(Discrete Cosine Transform)による直交変換と、量子化と、可変長符号化との機能を含むものである。なお、MPEG−2方式に於けるマクロブロック(MB)サイズは16×16画素であり、又DCTを行うブロックは、マクロブロックを4分割した8×8画素とするものである。
The
又切替部8,9は、フレーム内とフレーム間の符号化時は、加算器10及び減算器11側に切替え、フィールド内とフィールド間の符号化時は、加算器10及び減算器11側と反対側に切替えるものである。又局所復号化器7は、逆量子化と、逆DCTとの機能を含み、符号化器6の可変符号化前の段階の量子化出力を用いて復号化処理を行い、参照画像の再構成を行ってフレームメモリ1の参照画像情報の領域に格納する。
The
符号化器6に於けるDCTは、二次元DCTであり、前述のように、MPEG−2に於いては、8×8画素のブロックについて行う。このブロックをf(x,y)、DCT結果の係数をF(u,v)とすると、次の(1)式に示すものとなる。
このDCT演算によって、ブロック単位の画像情報を周波数成分に変換し、有効成分は低周波成分側に集まることにより、符号化情報の削減を図るものであり、ブロック単位のDCT係数をRec〔x〕、量子化スケールをQs、量子化マトリクス値をQm〔x〕、量子化結果をLevel〔x〕、処理過程の値をLevel’〔x〕とすると、イントラ符号化に於ける量子化結果の直流成分(Intra DC)と、交流成分(Intra AC)と、ノンイントラ符号化に於ける量子化結果(Non Intra)とを求める演算処理は、次の(2)式で表すことができる。なお、式中のp及びqは、p=3,q=4が一般には用いられている。又“//”は除算結果の端数を四捨五入する演算を示し、“/”は除算結果の端数を切り捨てる演算を示す。
又フレーム間符号化を行う為にフレーム間差分情報を得る必要があり、その為に、符号化データを局所復号化器7に於いて逆量子化と逆DCTとの処理により復号し、画像の再構成を行って参照画像としてフレームメモリ1に格納する。この局所復号化器7は、前述のように、逆量子化と、逆DCTとの処理機能を含むもので、逆量子化は(3)式に示す処理により行うことができ、又逆DCTは(4)式に示す処理により行うことができる。
実際に入力画像の符号化処理を行う場合、最初のピクチャ(フレーム又はフィールド)は、参照するピクチャが存在しないので、ピクチャ内符号化を行い、次のピクチャからはピクチャ間符号化を行うことになる。なお、ピクチャ内符号化は、周期的リフレッシュの意味もあって、所定の間隔毎に行われる場合が一般的である。又ピクチャ間符号化に於いて、動きベクトル探索器4により動き予測を行うものであり、例えば、図2に示すように、原画像21のマクロブロック22と、参照画像23の探索範囲24内のマクロブロックとの各画素について差分絶対値の累算値が最小となる位置を探索して動きベクトルを求め、符号化情報に多重化するものである。
When the input image is actually encoded, the first picture (frame or field) has no picture to be referred to, so intra-picture encoding is performed, and inter-picture encoding is performed from the next picture. Become. Note that intra-picture encoding is generally performed at predetermined intervals in the sense of periodic refresh. In the inter-picture coding, the motion
前述の図1に於ける符号1〜11の機能部分により符号化手段を構成し、又符号化器6に於ける符号化パラメータを制御する符号化制御部12により、符号化制御手段を構成し、ヘッダ情報生成部13により符号化パラメータを含むヘッダ情報を生成し、符号化器6からのピクチャ単位の符号化データにヘッダ情報を付加して送出する。
Coding means is constituted by the functional parts denoted by
又入力画像情報統計取得器14は、入力画像の性質を示す第1の統計情報を取得する手段であり、例えば、フレームメモリ1に蓄積された符号化対象ピクチャの特徴情報として輝度信号についての統計情報(アクティビティ)を求める。この場合、入力フレーム内の各画素の輝度値を累積し、累積した画素数で除算することにより、フレーム輝度平均を求めて、第1の統計情報とすることができる。即ち、フレーム内の画素集合をU、輝度をPixel_i、画素数をNum_i、フレーム輝度平均をAveY、フレーム輝度分散をVarYとすると、次の(5)式及び(6)式で表される。なお、(6)式の中のAは、フレーム輝度平均AveYを示す。
又動き情報統計取得器15は、フレーム間又はフィールド間の相関情報を示す第2の統計情報を取得する手段であり、例えば、動きベクトル探索器4に於けるマクロブロックで求めた動きベクトルを累算し、マクロブロック数で除算することにより、動きベクトルの平均値を得ることができる。或いは、動きベクトルとその平均値との差の自乗和を求めてマクロブロック数で除算することにより動きベクトルの分散を得ることができる。
The motion information
即ち、フレーム内のマクロブロックの集合をV、各動きベクトルの水平成分及び垂直成分をVecH_i,VecV_iとし、水平成分平均をAveHV、水平成分分散をVerHV、垂直成分平均値をAveVV、垂直成分分散をVerVVとすると、(7)〜(10)式で表される。
又符号化情報統計取得器16は、符号化過程に於ける第3の統計情報を取得する手段であり、例えば、各マクロブロックを符号化した結果の情報を累積し、発生情報量や量子化値の平均値等を求める。その場合に、フレーム内のマクロブロックの集合をV、各マクロブロックの発生情報量をBit_i、ピクチャの発生情報量をSumB、各マクロブロックの量子化スケール値をQs_i、平均量子化値をAveQとすると、ピクチャの発生情報量SumB及び平均量子化値AveQは、(11)式及び(12)式で表される。
又量子化後の各マクロブロックの有効係数をCoef_i、ピクチャ内の1マクロブロック当たりの有効係数の平均値をAveCとすると、この有効係数平均値AveCは、(13)式で表される。
又シーン判定器17は、前述の第1,第2,第3の統計情報の少なくとも何れか一つを基にシーン判定を行うものであり、第1の統計情報を取得する手段としての入力画像情報統計取得器14からのフレーム輝度平均AveYや分散VarYと、第2の統計情報を取得する手段としての動き情報統計取得器15からの水平成分平均AveHV、水平成分分散VerHV、垂直成分平均AveVV、垂直成分分散AerVVと、第3の統計情報を取得する手段としての符号化情報統計取得器16からのピクチャ発生情報量SumB、平均量子化値AveQ、有効係数平均値AveC等の一つ或いは複数を用いて、例えば、動きの激しいシーンや平坦な輝度のシーン等についての判定を行い、符号化制御部12により符号化パラメータを適応制御して、符号化器6に於ける入力画像の符号化を行わせるものである。
The
図3は、本発明の実施の形態の判定処理のフローチャートであり、フレームメモリ1から入力画像の読込みを行い(a1)、ヘッダ情報生成部13によりピクチャ単位でヘッダを生成し(a2)、動きベクトル探索器4に於いて動き探索を行い(a3)、符号化器6に於いてMB(マクロブロック)符号化を行い(a4)、ピクチャEnd、即ち、1ピクチャ分について終了か否かを判定し(a5)、終了していない場合は、ステップ(a3)に移行し、終了した場合は、必要情報取得を行う(a10)。
FIG. 3 is a flowchart of the determination process according to the embodiment of the present invention. The input image is read from the frame memory 1 (a1), the header
又入力画像情報統計取得器14に於いて第1の統計情報の取得を行い(a6)、又動き情報統計取得器15に於いて第2の統計情報としての動きベクトル探索結果を基にした統計情報の取得を行い(a7)、又符号化器6による符号化結果又は符号化過程に於ける第3の統計情報を符号化情報統計取得器16に於いて取得し(a8)、それぞれ平均値を求める場合は平均化処理を行う(a9)。この平均化処理結果をシーン判定器17に於いて必要情報取得(a10)として取得し、所定の条件を満たすか否かを判定し(a11)、判定結果により符号化パラメータ1(a12)の選択又は符号化パラメータ2(a13)の選択を行い、符号化Endか否かを判定し(a14)、終了していない場合はステップ(a1)に移行する。なお、判定のステップ(a11)に於いて、複数種類の判定条件に従って、更に多数の符号化パラメータの選択切替えの制御を行うことも可能である。
In addition, the input image information
例えば、図9に示す付加機能(picture_coding_extension)のパラメータとして、intra_vlc_format(DCT係数の可変長符号テーブルの選択)の適応制御を行う場合、intra_vlc_format=0と、intra_vlc_format=1とにより、図4のtable=0と、図5のtable=1との選択を行うことができる。なお、図4及び図5は、可変長符号(Variable length code)とラン(Run)とレベル(lebel)とを含む可変長符号テーブルの一部を示し、又最終ビットのsはレベルの正負の符号で、0は正、1は負を示す。又1sはブロックの最初のDCT係数、11sは次のDCT係数を示す。 For example, when adaptive control of intra_vlc_format (selection of DCT coefficient variable length code table) is performed as a parameter of the additional function (picture_coding_extension) shown in FIG. Selection can be made between 0 and table = 1 in FIG. 4 and 5 show a part of a variable length code table including a variable length code, a run, and a level, and s in the final bit indicates whether the level is positive or negative. In the sign, 0 indicates positive and 1 indicates negative. 1s indicates the first DCT coefficient of the block, and 11s indicates the next DCT coefficient.
又図4のtable=0に比較して図5のtable=1の方が或る程度短いビットを均等にして可変長符号を割当てることができるものであり、従って、ブロック内に有効係数が多く存在する場合は、図5のtable=1を選択して可変長符号化を行った方が効果的である。又実際には、平均量子化値が大きくなると有効係数の数は少なくなり、又平面的な画面でアクティビティが小さいと有効係数の数は少なくなる。又平均量子化値が大きい場合でも、アクティビティが小さいと有効係数の数は少なく、反対にアクティビティが大きいと有効係数の数が多くなる。 In addition, when table = 1 in FIG. 5 is equal to table = 0 in FIG. 4, it is possible to assign a variable length code by equalizing a bit shorter to some extent. Therefore, there are more effective coefficients in the block. If it exists, it is more effective to select table = 1 in FIG. 5 and perform variable length coding. In practice, the number of effective coefficients decreases when the average quantization value increases, and the number of effective coefficients decreases when the activity is small on a flat screen. Even when the average quantization value is large, the number of effective coefficients is small when the activity is small, and conversely, when the activity is large, the number of effective coefficients is large.
図6は可変長符号テーブルの選択説明図であり、intra_vlc_format=0の時に、イントラブロック及びノンイントラブロックについてはtable=0、intra_vlc_format=1の時に、イントラブロックについてはtable=1、ノンイントラブロックについてはtable=0の選択が行われて、可変長符号化が行われる。 FIG. 6 is an explanatory diagram of selection of the variable-length code table. When intra_vlc_format = 0, table = 0 for intra blocks and non-intra blocks, table = 1 for intra blocks, and table = 1 for intra blocks when intra_vlc_format = 1. Table = 0 is selected and variable length coding is performed.
前述の(12)式により求めた平均量子化値AveQと、(6)式で求めた入力画像のアクティビティとしてのVarYとを用いて、
AveQ>VarY*α1+β1 …(14)
の条件が成立すれば、有効係数の数が少ないので、table=0を選択し、成立しない場合は、table=1を選択するように適応的に切替制御する。なお、α1,β1は重み付けの係数を示す。
Using the average quantization value AveQ obtained by the above equation (12) and VarY as the activity of the input image obtained by the equation (6),
AveQ> VarY * α 1 + β 1 (14)
If this condition is satisfied, the number of effective coefficients is small, so that table = 0 is selected, and if not, table-1 is adaptively controlled to select table = 1. Α 1 and β 1 indicate weighting coefficients.
又更に単純化する為に、(13)式により求めた有効係数の平均値AveCを用いて、
AveC<α2 …(15)
の条件が成立するか否かを判定し、成立すれば、table=0を選択し、成立しない場合は、table=1を選択するように適応的に切替制御して、可変長符号化を行うことができる。なお、α2は係数を示す。即ち、予め設定した係数α2より、マクロブロック当たりの有効係数の平均値AveCが小さいことは、入力画像のアクティビティが小さい場合に相当し、table=0を選択するように切替えて可変長符号化を行った方が符号化効率が良くなる。
For further simplification, the average value AveC of the effective coefficients obtained from the equation (13) is used.
AveC <α 2 (15)
If this condition is satisfied, table = 0 is selected, and if not satisfied, variable-length encoding is performed by adaptively switching control so that table = 1 is selected. be able to. Α2 represents a coefficient. That is, the fact that the average value AveC of the effective coefficient per macroblock is smaller than the preset coefficient α2 corresponds to the case where the activity of the input image is small, and variable length coding is performed by switching to select table = 0. The encoding efficiency is better when this is done.
又altenate_scan(DCT係数の可変長符号化の入力順序)のパラメータとして、altenate_scan=0の場合は、DCT係数をスキャンする順序を、図7の(A)に示すジクザグスキャン(スキャンタイプ0)とし、altenate_scan=1の場合は、図7の(B)に示すオルタネートスキャン(スキャンタイプ1)とすることができる。この場合、(A)のスキャンタイプ0に比較して、(B)のスキャンタイプ1の方が、周波数成分に於ける垂直成分の係数を優先的に符号化することになる。このような垂直成分に有効係数が多数発生する要因としては、例えば、インターレース画像の符号化に於ける奇偶フィールド画像が大きく異なる場合、即ち、パニングやチルト等のような動きのある場合等がある。
Further, as a parameter of alternate_scan (input order of variable length coding of DCT coefficients), when alternate_scan = 0, the DCT coefficient scanning order is a zigzag scan (scan type 0) shown in FIG. If alternate_scan = 1, the alternate scan (scan type 1) shown in FIG. 7B can be performed. In this case, compared with the
MPEG−2は、フィールドを考慮したフィールド間の動き予測や、DCTへの入力として、マクロブロックからブロックを切り出す時に、1ラインおきに切り出すフィールドDCTを行うことが可能であり、又動き予測を行う動きベクトル探索範囲は、図2に示すように、0ベクトルを中心とした所定の範囲24とする場合が一般的であるから、フィールド予測を行う場合、探索範囲が不足するような大きな動きをしている場合等に於いて、有効係数の分布については、周波数垂直成分方向がより多くなる。
MPEG-2 can perform motion prediction between fields in consideration of fields, and can perform field DCT that cuts out every other line when cutting out a block from a macroblock as an input to DCT. As shown in FIG. 2, the motion vector search range is generally set to a
そこで、(7)式の水平成分平均値AveHVと、(8)式の水平成分分散VerHVとを用いて、
AveHV>α3 …(16)
VerHV<β3 …(17)
の条件が成立するか否かを判定する。この条件が成立するような水平方向に或る程度揃った大きな動きの場合は、垂直方向の成分が多くなるので、altenate scan=1、そうでない場合は、altenate_scan=0を選択するように適応制御を行って可変長符号化を行う。なお、α3,β3は定数を示し、動き探索範囲が装置対応に異なる場合が一般的であるから、その動き探索範囲を基に予め設定することができる。
Therefore, using the horizontal component average value AveHV in the equation (7) and the horizontal component variance VerHV in the equation (8),
AveHV> α 3 (16)
VerHV <β 3 (17)
It is determined whether or not the above condition is satisfied. In the case of large movements that are aligned to some extent in the horizontal direction so that this condition is satisfied, the vertical component increases, and therefore, adaptive scan = 1 is selected, and otherwise, adaptive_scan = 0 is selected. To perform variable length coding. Note that α 3 and β 3 are constants, and the motion search range is generally different depending on the device, and can be set in advance based on the motion search range.
又符号化情報統計取得器16に於いて取得した第3の統計情報として、平均量子化値AveQを用いて量子化スケールタイプq_scale_typeの選択を行うことができる。即ち、図8に示す量子化テーブルについて、q_scale_type=0の場合は、量子化スケール値の変化は線形で、量子化スケール値(puantiser_scale_code)は2〜62の変化となる。これに対して、q_scale_type=1の場合は、広範囲の量子化スケール値をカバーする為に、非線形な変化となり、量子化の細かい部分はより細かく、量子化の粗い部分はより粗く量子化するもので、1〜112まで変化する。
Further, as the third statistical information acquired by the encoded information
量子化スケール値が極端に小さくなるか又は極端に大きくなることがない場合は、量子化テーブルの何れを選択しても大きな相違はないが、符号化レートが高いような場合に於いて、平均量子化値が大きい場合には、q_scale_type=1を選択するように制御する。例えば、(12)式による平均量子化値AveQについて、
AveQ<α4 …(18)
AveQ>β4 …(19)
の条件が成立するか否かを判定し、この条件が成立する場合、即ち、平均量子化値が極端に小さい場合、又は極端に大きい場合には、量子化スケール値が非線形な変化となるq_scale_type=1を選択し、それ以外の場合は、q_scale_type=0を選択するように適応制御する。
If the quantization scale value does not become extremely small or extremely large, there is no significant difference in selecting any of the quantization tables, but the average is used when the coding rate is high. When the quantization value is large, control is performed so as to select q_scale_type = 1. For example, for the average quantization value AveQ according to equation (12),
AveQ <α 4 (18)
AveQ> β 4 (19)
If this condition is satisfied, that is, if the average quantization value is extremely small or extremely large, the quantization scale value becomes a non-linear change q_scale_type. = 1 is selected, and otherwise, adaptive control is performed so that q_scale_type = 0 is selected.
本発明は、前述の各実施の形態のみに限定されるものではなく、種々付加変更することが可能であり、前述の量子化テーブルの切替えや可変長符号テーブルの切替えによる符号化パラメータの適応的な切替制御以外に、他の符号化パラメータの切替制御を行うことも可能であり、又符号化するピクチャの統計情報を、そのピクチャの符号化前に取得して、フィードフォワード制御による符号化を行うことも可能である。又蓄積メディアに適用する場合は、複数種類の符号化パラメータを用いてピクチャの仮符号化を行い、この仮符号化結果により最終判定して、最適な符号化パラメータを含むヘッダ情報を、符号化データに付加して、蓄積することもできる。 The present invention is not limited only to the above-described embodiments, and various additions and modifications can be made. Adaptive encoding parameters can be changed by switching the quantization table or variable-length code table. In addition to switching control, it is also possible to perform switching control of other encoding parameters, and obtain statistical information of a picture to be encoded before encoding the picture, and perform encoding by feedforward control. It is also possible to do this. When applying to storage media, provisional encoding of pictures is performed using multiple types of encoding parameters, and final determination is made based on the provisional encoding results, and header information including optimal encoding parameters is encoded. It can also be added to data and stored.
1 フレームメモリ
2 原画MB読出部
3 参照ブロック読出部
4 動きベクトル探索器
5 予測判定器
6 符号化器
7 局所復号化器
8,9 切替部
10 加算器
11 減算器
12 符号化制御部
13 ヘッダ情報生成部
14 入力画像情報統計取得器
15 動き情報統計取得器
16 符号化情報統計取得器
17 シーン判定器
DESCRIPTION OF
Claims (2)
前記入力動画像の性質を示す第1の統計情報と、前記予測符号化の過程に於ける相関情報を基にした第2の統計情報と、符号化パラメータを基にした符号化結果又は符号化過程に於ける第3の統計情報との少なくとも何れか一つの統計情報を取得する取得手段と、
該取得手段により取得した統計情報を基にシーン判定を行って、フレーム若しくはフィールド単位で前記符号化手段に於ける符号化パラメータを適応制御する符号化制御手段とを備え、
前記取得手段は、前記第2の統計情報として動きベクトルの水平成分の平均値、水平成分の分散値、垂直成分の平均値、垂直成分の分散値を取得する構成と、前記第3の統計情報としてピクチャ内の1マクロブロック当たりの量子化後の有効係数の平均値を取得する構成とを有し、
前記符号化制御手段は、前記有効係数の平均値と予め設定した係数とを比較するシーン判定結果を基に前記符号化手段に於ける可変長符号テーブルを切替えて可変長符号化を行わせる制御構成と、前記第2の統計情報と予め設定した係数とを比較するシーン判定結果を基に前記符号化手段に於ける可変長符号化の為の入力スキャン順序を切替える制御構成とを有する
ことを特徴とする画像符号化装置。 In an image coding apparatus having coding means for performing predictive coding of an input moving image,
First statistical information indicating the nature of the input video, second statistical information based on correlation information in the process of predictive encoding, and an encoding result or encoding based on an encoding parameter An acquisition means for acquiring at least one statistical information of the third statistical information in the process;
Coding determination means for performing scene determination based on statistical information acquired by the acquisition means, and adaptively controlling encoding parameters in the encoding means in units of frames or fields;
The acquisition means acquires, as the second statistical information, a horizontal component average value, a horizontal component variance value, a vertical component average value, and a vertical component variance value of the motion vector, and the third statistical information. It has a structure and to obtain the average value of the effective coefficient after quantization of one macro block per the picture as,
The encoding control means controls the variable length encoding by switching the variable length code table in the encoding means based on a scene determination result comparing the average value of the effective coefficients with a preset coefficient. configuration and that a control arrangement for switching the input scan order for the in variable-length coding on the coding unit based on the scene determination result of comparing the coefficient set in advance as the second statistical information An image encoding device.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009168783A JP5272940B2 (en) | 2009-07-17 | 2009-07-17 | Image encoding device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009168783A JP5272940B2 (en) | 2009-07-17 | 2009-07-17 | Image encoding device |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000338528A Division JP4429516B2 (en) | 2000-11-07 | 2000-11-07 | Image encoding device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009239969A JP2009239969A (en) | 2009-10-15 |
JP5272940B2 true JP5272940B2 (en) | 2013-08-28 |
Family
ID=41253268
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009168783A Expired - Fee Related JP5272940B2 (en) | 2009-07-17 | 2009-07-17 | Image encoding device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5272940B2 (en) |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05316359A (en) * | 1992-05-14 | 1993-11-26 | Fujitsu Ltd | Picture data coder |
JPH06105301A (en) * | 1992-09-24 | 1994-04-15 | Hitachi Ltd | System and device for encoding moving image |
JPH07131789A (en) * | 1993-10-29 | 1995-05-19 | Sanyo Electric Co Ltd | Picture coding system |
DE69828950T2 (en) * | 1997-11-07 | 2006-01-12 | Koninklijke Philips Electronics N.V. | CODING OF A PICTURE |
JP3738939B2 (en) * | 1998-03-05 | 2006-01-25 | Kddi株式会社 | Moving image cut point detection device |
JP4207098B2 (en) * | 1998-03-24 | 2009-01-14 | ソニー株式会社 | Encoding control apparatus, encoding control method, encoding apparatus, and encoding method |
JP3508013B2 (en) * | 1999-05-25 | 2004-03-22 | 日本電信電話株式会社 | MPEG video search device based on camera work information and recording medium storing MPEG video search program |
-
2009
- 2009-07-17 JP JP2009168783A patent/JP5272940B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009239969A (en) | 2009-10-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6335365B2 (en) | Decoding device | |
US7469011B2 (en) | Escape mode code resizing for fields and slices | |
US8325799B2 (en) | Moving picture encoding method, device using the same, and computer program | |
JP5216071B2 (en) | Decoding device and decoding method | |
TWI650995B (en) | Video decoding device, video encoding method and non-transitory computer readable recording medium | |
KR20170021337A (en) | Encoder decisions based on results of hash-based block matching | |
KR20010043395A (en) | Method and apparatus for reducing breathing artifacts in compressed video | |
JP7343817B2 (en) | Encoding device, encoding method, and encoding program | |
JP4383240B2 (en) | Intra-screen predictive coding apparatus, method thereof and program thereof | |
JP5649296B2 (en) | Image encoding device | |
JP5032936B2 (en) | Video encoding apparatus and control method thereof | |
JP2008004984A (en) | Image processor and method, program, and recording medium | |
JP2010258576A (en) | Scene change detector, and video recorder | |
JP4775132B2 (en) | Image processing apparatus and method, program, and recording medium | |
JP2009049969A (en) | Device and method of coding moving image and device and method of decoding moving image | |
JP2006295503A (en) | Reencoding apparatus and method, and program for reencoding | |
JP5272940B2 (en) | Image encoding device | |
JP4429516B2 (en) | Image encoding device | |
An et al. | Low-complexity motion estimation for H. 264/AVC through perceptual video coding. | |
JPWO2013125171A1 (en) | Intra prediction mode determination device, intra prediction mode determination method, and intra prediction mode determination program | |
JP2014049875A (en) | Image encoder, image decoder, image encoding program, and image decoding program | |
JP2008153802A (en) | Moving picture encoding device and moving picture encoding program | |
JP4561701B2 (en) | Video encoding device | |
KR100728032B1 (en) | Method for intra prediction based on warping | |
JP4406887B2 (en) | Moving picture coding apparatus and moving picture coding method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090717 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20110915 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120327 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120524 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130122 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130325 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130416 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130429 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |